From c9388c7446d8f05f0bfe6ab3ad2d7f4815223244 Mon Sep 17 00:00:00 2001
From: Isotr0py <mozf@mail2.sysu.edu.cn>
Date: Mon, 29 Sep 2025 14:09:18 +0800
Subject: [PATCH 001/193] [V0 Deprecation][Models] Remove all V0 condition for
 mm embeddings merge (#25331)

Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn>
Signed-off-by: isotr0py <2037008807@qq.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/aya_vision.py      | 11 ---
 vllm/model_executor/models/blip2.py           | 11 ---
 vllm/model_executor/models/chameleon.py       | 12 ---
 vllm/model_executor/models/cohere2_vision.py  | 11 ---
 vllm/model_executor/models/deepseek_vl2.py    | 11 ---
 vllm/model_executor/models/fuyu.py            | 11 ---
 vllm/model_executor/models/gemma3_mm.py       | 19 ----
 vllm/model_executor/models/glm4_1v.py         | 50 +---------
 vllm/model_executor/models/glm4v.py           | 17 +---
 vllm/model_executor/models/granite_speech.py  | 11 ---
 .../models/hyperclovax_vision.py              | 15 +--
 vllm/model_executor/models/idefics3.py        | 11 ---
 vllm/model_executor/models/interns1.py        | 18 +---
 vllm/model_executor/models/internvl.py        | 18 +---
 vllm/model_executor/models/kimi_vl.py         | 16 ----
 vllm/model_executor/models/llava.py           | 11 ---
 vllm/model_executor/models/llava_next.py      | 11 ---
 .../model_executor/models/llava_next_video.py | 11 ---
 vllm/model_executor/models/llava_onevision.py | 46 +--------
 vllm/model_executor/models/minicpmv.py        | 15 +--
 vllm/model_executor/models/mistral3.py        | 11 ---
 vllm/model_executor/models/mllama4.py         | 11 ---
 vllm/model_executor/models/molmo.py           | 11 ---
 .../model_executor/models/nano_nemotron_vl.py | 18 +---
 vllm/model_executor/models/nemotron_vl.py     | 11 ---
 vllm/model_executor/models/ovis.py            | 11 ---
 vllm/model_executor/models/ovis2_5.py         | 12 ---
 vllm/model_executor/models/paligemma.py       | 11 ---
 vllm/model_executor/models/phi3v.py           | 11 ---
 vllm/model_executor/models/phi4_multimodal.py | 16 ----
 vllm/model_executor/models/phi4mm.py          | 48 +---------
 vllm/model_executor/models/pixtral.py         | 11 ---
 .../models/qwen2_5_omni_thinker.py            | 31 +------
 vllm/model_executor/models/qwen2_5_vl.py      | 58 +-----------
 vllm/model_executor/models/qwen2_audio.py     | 11 ---
 vllm/model_executor/models/qwen2_vl.py        | 50 +---------
 vllm/model_executor/models/qwen3_vl.py        | 93 +------------------
 vllm/model_executor/models/qwen_vl.py         | 12 ---
 vllm/model_executor/models/skyworkr1v.py      | 11 ---
 vllm/model_executor/models/transformers.py    | 13 ---
 vllm/model_executor/models/ultravox.py        | 12 ---
 vllm/model_executor/models/voxtral.py         | 13 ---
 42 files changed, 13 insertions(+), 809 deletions(-)

diff --git a/vllm/model_executor/models/aya_vision.py b/vllm/model_executor/models/aya_vision.py
index eab996e9ba22..f6dfa435ddd4 100644
--- a/vllm/model_executor/models/aya_vision.py
+++ b/vllm/model_executor/models/aya_vision.py
@@ -427,17 +427,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.config.image_token_index,
-            )
-            input_ids = None
-
         hidden_states = self.language_model.model(
             input_ids=input_ids,
             positions=positions,
diff --git a/vllm/model_executor/models/blip2.py b/vllm/model_executor/models/blip2.py
index 4d1850d07b28..334743a7358c 100644
--- a/vllm/model_executor/models/blip2.py
+++ b/vllm/model_executor/models/blip2.py
@@ -672,17 +672,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == _IMAGE_TOKEN_ID,
-            )
-            input_ids = None
-
         hidden_states = self.language_model.model(input_ids,
                                                   positions,
                                                   intermediate_tensors,
diff --git a/vllm/model_executor/models/chameleon.py b/vllm/model_executor/models/chameleon.py
index f9740adb151b..86dbf63fa5df 100644
--- a/vllm/model_executor/models/chameleon.py
+++ b/vllm/model_executor/models/chameleon.py
@@ -1014,18 +1014,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            image_token_id = self.model.vocabulary_mapping.image_token_id
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == image_token_id,
-            )
-            input_ids = None
-
         hidden_states = self.model(input_ids,
                                    positions,
                                    intermediate_tensors,
diff --git a/vllm/model_executor/models/cohere2_vision.py b/vllm/model_executor/models/cohere2_vision.py
index 99edcba4d874..7162571c08d9 100644
--- a/vllm/model_executor/models/cohere2_vision.py
+++ b/vllm/model_executor/models/cohere2_vision.py
@@ -440,17 +440,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.config.image_token_id,
-            )
-            input_ids = None
-
         hidden_states = self.language_model.model(
             input_ids=input_ids,
             positions=positions,
diff --git a/vllm/model_executor/models/deepseek_vl2.py b/vllm/model_executor/models/deepseek_vl2.py
index b98008c83bdc..0f87fb34bf32 100644
--- a/vllm/model_executor/models/deepseek_vl2.py
+++ b/vllm/model_executor/models/deepseek_vl2.py
@@ -614,17 +614,6 @@ def forward(self,
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.image_token_id,
-            )
-            input_ids = None
-
         hidden_states = self.language_model(input_ids,
                                             positions,
                                             intermediate_tensors,
diff --git a/vllm/model_executor/models/fuyu.py b/vllm/model_executor/models/fuyu.py
index b99fe33a1dcc..9e491c0b50d2 100644
--- a/vllm/model_executor/models/fuyu.py
+++ b/vllm/model_executor/models/fuyu.py
@@ -352,17 +352,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == _IMAGE_TOKEN_ID,
-            )
-            input_ids = None
-
         hidden_states = self.language_model(
             input_ids=input_ids,
             positions=positions,
diff --git a/vllm/model_executor/models/gemma3_mm.py b/vllm/model_executor/models/gemma3_mm.py
index be75e36fe23b..36f8651371ba 100644
--- a/vllm/model_executor/models/gemma3_mm.py
+++ b/vllm/model_executor/models/gemma3_mm.py
@@ -596,25 +596,6 @@ def forward(self,
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.config.image_token_index,
-            )
-            if (vision_embeddings is not None) and len(vision_embeddings) != 0:
-                kwargs = self.prepare_attn_masks(
-                    input_ids,
-                    positions,
-                    mask_dtype=self.dtype,
-                    **kwargs,
-                )
-            input_ids = None
-
         hidden_states = self.language_model.model(input_ids,
                                                   positions,
                                                   intermediate_tensors,
diff --git a/vllm/model_executor/models/glm4_1v.py b/vllm/model_executor/models/glm4_1v.py
index dbb5431ae491..722f1e428be7 100644
--- a/vllm/model_executor/models/glm4_1v.py
+++ b/vllm/model_executor/models/glm4_1v.py
@@ -71,7 +71,6 @@
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.platforms import _Backend
 from vllm.sequence import IntermediateTensors
-from vllm.transformers_utils.config import uses_mrope
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from ..layers.activation import SiluAndMul
@@ -80,8 +79,7 @@
 from .qwen2_vl import (_create_qwen2vl_field_factory,
                        apply_rotary_pos_emb_vision)
 from .utils import (AutoWeightsLoader, WeightsMapper,
-                    init_vllm_registered_model, maybe_prefix,
-                    merge_multimodal_embeddings)
+                    init_vllm_registered_model, maybe_prefix)
 from .vision import get_vit_attn_backend, run_dp_sharded_mrope_vision_model
 
 logger = init_logger(__name__)
@@ -1552,32 +1550,6 @@ def get_multimodal_embeddings(
                 multimodal_embeddings += video_embeddings
         return multimodal_embeddings
 
-    def get_input_embeddings_v0(
-        self,
-        input_ids: torch.Tensor,
-        image_input: Optional[Glm4vImageInputs] = None,
-        video_input: Optional[Glm4vVideoInputs] = None,
-    ) -> torch.Tensor:
-        inputs_embeds = self.get_input_embeddings(input_ids)
-        if image_input is not None:
-            image_embeds = self._process_image_input(image_input)
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                image_embeds,
-                placeholder_token_id=self.config.image_token_id,
-            )
-
-        if video_input is not None:
-            video_embeds = self._process_video_input(video_input)
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                video_embeds,
-                placeholder_token_id=self.config.video_token_id,
-            )
-        return inputs_embeds
-
     def forward(
         self,
         input_ids: torch.Tensor,
@@ -1604,26 +1576,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner from
-        # `get_multimodal_embeddings` and `get_input_embeddings`, this
-        # condition is only for v0 compatibility.
-        elif inputs_embeds is None:
-            image_input = self._parse_and_validate_image_input(**kwargs)
-            video_input = self._parse_and_validate_video_input(**kwargs)
-
-            if image_input is None and video_input is None:
-                inputs_embeds = None
-            else:
-                if uses_mrope(self.config):
-                    assert positions.ndim == 2 and positions.size(0) == 3, (
-                        "multimodal section rotary embedding requires "
-                        f"(3, seq_len) positions, but got {positions.size()}")
-                inputs_embeds = self.get_input_embeddings_v0(
-                    input_ids,
-                    image_input=image_input,
-                    video_input=video_input)
-                input_ids = None
-
         hidden_states = self.language_model.model(
             input_ids=input_ids,
             positions=positions,
diff --git a/vllm/model_executor/models/glm4v.py b/vllm/model_executor/models/glm4v.py
index ace9c05daf15..22ddb1d75160 100644
--- a/vllm/model_executor/models/glm4v.py
+++ b/vllm/model_executor/models/glm4v.py
@@ -43,7 +43,7 @@
 from .chatglm import ChatGLMBaseModel, ChatGLMModel
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
                          SupportsMultiModal, SupportsPP)
-from .utils import flatten_bn, isin_list
+from .utils import flatten_bn
 
 
 class GLMVImagePixelInputs(TensorSchema):
@@ -618,21 +618,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=isin_list(input_ids, [
-                    self.config.boi_token_id,
-                    self.config.pad_token_id,
-                    self.config.eoi_token_id,
-                ]),
-            )
-            input_ids = None
-
         hidden_states = self.transformer(input_ids, positions,
                                          intermediate_tensors, inputs_embeds)
 
diff --git a/vllm/model_executor/models/granite_speech.py b/vllm/model_executor/models/granite_speech.py
index 8a02da58ea0b..0ec451356f5e 100644
--- a/vllm/model_executor/models/granite_speech.py
+++ b/vllm/model_executor/models/granite_speech.py
@@ -765,17 +765,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            audio_embeds = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                audio_embeds,
-                is_multimodal=input_ids == self.config.audio_token_index,
-            )
-            input_ids = None
-
         model_output = self.language_model(input_ids, positions,
                                            intermediate_tensors, inputs_embeds)
         return model_output
diff --git a/vllm/model_executor/models/hyperclovax_vision.py b/vllm/model_executor/models/hyperclovax_vision.py
index f851688bf7ba..b0f9d5e2657e 100644
--- a/vllm/model_executor/models/hyperclovax_vision.py
+++ b/vllm/model_executor/models/hyperclovax_vision.py
@@ -45,8 +45,7 @@
 from .clip import CLIPVisionModel
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
 from .siglip import SiglipVisionModel
-from .utils import (AutoWeightsLoader, init_vllm_registered_model, isin_list,
-                    maybe_prefix)
+from .utils import AutoWeightsLoader, init_vllm_registered_model, maybe_prefix
 from .vision import get_vision_encoder_info
 
 EOT = "<|endofturn|>"
@@ -747,18 +746,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            multimodal_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                multimodal_embeddings,
-                is_multimodal=isin_list(
-                    input_ids,
-                    [self.config.image_token_id, self.config.video_token_id]),
-            )
-            input_ids = None
         hidden_states = self.language_model.model(input_ids,
                                                   positions,
                                                   intermediate_tensors,
diff --git a/vllm/model_executor/models/idefics3.py b/vllm/model_executor/models/idefics3.py
index 3334ee224253..dddf1c6fb626 100644
--- a/vllm/model_executor/models/idefics3.py
+++ b/vllm/model_executor/models/idefics3.py
@@ -702,17 +702,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.config.image_token_id,
-            )
-            input_ids = None
-
         hidden_states = self.model.text_model(input_ids,
                                               positions,
                                               intermediate_tensors,
diff --git a/vllm/model_executor/models/interns1.py b/vllm/model_executor/models/interns1.py
index 545dad1a96f5..0292845f819c 100644
--- a/vllm/model_executor/models/interns1.py
+++ b/vllm/model_executor/models/interns1.py
@@ -40,7 +40,7 @@
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
                          SupportsMultiModal, SupportsPP)
 from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
-                    init_vllm_registered_model, isin_list, maybe_prefix)
+                    init_vllm_registered_model, maybe_prefix)
 
 
 class InternS1MultiModalProjector(nn.Module):
@@ -798,22 +798,6 @@ def forward(
             input_ids = None
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            context_token_ids = [
-                token_id for token_id in (self.img_context_token_id,
-                                          self.video_context_token_id)
-                if token_id is not None
-            ]
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=isin_list(input_ids, context_token_ids),
-            )
-            input_ids = None
-
         forward_kwargs = {
             "input_ids": input_ids,
             "positions": positions,
diff --git a/vllm/model_executor/models/internvl.py b/vllm/model_executor/models/internvl.py
index 78aac8541434..0c95c49f90b1 100644
--- a/vllm/model_executor/models/internvl.py
+++ b/vllm/model_executor/models/internvl.py
@@ -43,7 +43,7 @@
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
                          SupportsMultiModal, SupportsPP)
 from .utils import (AutoWeightsLoader, flatten_bn, init_vllm_registered_model,
-                    isin_list, maybe_prefix)
+                    maybe_prefix)
 
 IMG_START = '<img>'
 IMG_END = '</img>'
@@ -1371,22 +1371,6 @@ def forward(
             input_ids = None
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            context_token_ids = [
-                token_id for token_id in (self.img_context_token_id,
-                                          self.video_context_token_id)
-                if token_id is not None
-            ]
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=isin_list(input_ids, context_token_ids),
-            )
-            input_ids = None
-
         forward_kwargs = {
             "input_ids": input_ids,
             "positions": positions,
diff --git a/vllm/model_executor/models/kimi_vl.py b/vllm/model_executor/models/kimi_vl.py
index db032736f914..30ec9029f74f 100644
--- a/vllm/model_executor/models/kimi_vl.py
+++ b/vllm/model_executor/models/kimi_vl.py
@@ -433,22 +433,6 @@ def forward(
     ) -> IntermediateTensors:
         if intermediate_tensors is not None:
             inputs_embeds = None
-        # NOTE: In v1, inputs_embeds is always generated at model runner from
-        # `get_multimodal_embeddings` and `get_input_embeddings`, this
-        # condition is only for v0 compatibility.
-        elif inputs_embeds is None:
-            image_input = self._parse_and_validate_image_input(**kwargs)
-            if image_input is None:
-                inputs_embeds = None
-            else:
-                image_embeds = self._process_image_input(image_input)
-                inputs_embeds = self.get_input_embeddings(
-                    input_ids,
-                    image_embeds,
-                    is_multimodal=input_ids ==
-                    self.config.media_placeholder_token_id,
-                )
-                input_ids = None
 
         hidden_states = self.language_model(
             input_ids=input_ids,
diff --git a/vllm/model_executor/models/llava.py b/vllm/model_executor/models/llava.py
index 6f3cfd88aee2..46cf93be191e 100644
--- a/vllm/model_executor/models/llava.py
+++ b/vllm/model_executor/models/llava.py
@@ -723,17 +723,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.config.image_token_index,
-            )
-            input_ids = None
-
         hidden_states = self.language_model.model(input_ids,
                                                   positions,
                                                   intermediate_tensors,
diff --git a/vllm/model_executor/models/llava_next.py b/vllm/model_executor/models/llava_next.py
index e132389c4f06..c4f1daaab9bf 100644
--- a/vllm/model_executor/models/llava_next.py
+++ b/vllm/model_executor/models/llava_next.py
@@ -547,17 +547,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.config.image_token_index,
-            )
-            input_ids = None
-
         hidden_states = self.language_model.model(input_ids,
                                                   positions,
                                                   intermediate_tensors,
diff --git a/vllm/model_executor/models/llava_next_video.py b/vllm/model_executor/models/llava_next_video.py
index 2642d8c77cf3..aebc661d53f8 100644
--- a/vllm/model_executor/models/llava_next_video.py
+++ b/vllm/model_executor/models/llava_next_video.py
@@ -431,17 +431,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.config.video_token_index,
-            )
-            input_ids = None
-
         hidden_states = self.language_model.model(input_ids,
                                                   positions,
                                                   intermediate_tensors,
diff --git a/vllm/model_executor/models/llava_onevision.py b/vllm/model_executor/models/llava_onevision.py
index 906858f4e2f4..6088195c91d5 100644
--- a/vllm/model_executor/models/llava_onevision.py
+++ b/vllm/model_executor/models/llava_onevision.py
@@ -30,8 +30,7 @@
                          LlavaNextProcessingInfo)
 from .siglip import SiglipVisionModel
 from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
-                    init_vllm_registered_model, maybe_prefix,
-                    merge_multimodal_embeddings)
+                    init_vllm_registered_model, maybe_prefix)
 
 # For profile run
 _MAX_FRAMES_PER_VIDEO = 16
@@ -850,33 +849,6 @@ def get_multimodal_embeddings(self,
 
         return multimodal_embeddings
 
-    def get_input_embeddings_v0(
-        self,
-        input_ids: torch.Tensor,
-        image_input: Optional[LlavaOnevisionImagePixelInputs] = None,
-        video_input: Optional[LlavaOnevisionVideoPixelInputs] = None,
-    ) -> torch.Tensor:
-        inputs_embeds = self.get_input_embeddings(input_ids)
-        if image_input is not None:
-            image_embeds = self._process_image_input(image_input)
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                image_embeds,
-                placeholder_token_id=self.config.image_token_index,
-            )
-
-        if video_input is not None:
-            video_embeds = self._process_video_pixels(video_input)
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                video_embeds,
-                placeholder_token_id=self.config.video_token_index,
-            )
-
-        return inputs_embeds
-
     def forward(
         self,
         input_ids: torch.Tensor,
@@ -894,22 +866,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner from
-        # `get_multimodal_embeddings` and `get_input_embeddings`, this
-        # condition is only for v0 compatibility.
-        elif inputs_embeds is None:
-            image_input = self._parse_and_validate_image_input(**kwargs)
-            video_input = self._parse_and_validate_video_input(**kwargs)
-
-            if image_input is None and video_input is None:
-                inputs_embeds = None
-            else:
-                inputs_embeds = self.get_input_embeddings_v0(
-                    input_ids,
-                    image_input=image_input,
-                    video_input=video_input)
-                input_ids = None
-
         hidden_states = self.language_model.model(input_ids,
                                                   positions,
                                                   intermediate_tensors,
diff --git a/vllm/model_executor/models/minicpmv.py b/vllm/model_executor/models/minicpmv.py
index bffc9a0c125e..eaa3839af37b 100644
--- a/vllm/model_executor/models/minicpmv.py
+++ b/vllm/model_executor/models/minicpmv.py
@@ -71,7 +71,7 @@
 from .idefics2_vision_model import Idefics2VisionTransformer
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
                          SupportsMultiModal, SupportsPP)
-from .utils import AutoWeightsLoader, flatten_bn, isin_list, maybe_prefix
+from .utils import AutoWeightsLoader, flatten_bn, maybe_prefix
 
 # For profile run
 _MAX_FRAMES_PER_VIDEO = 16
@@ -1154,19 +1154,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner from
-        # `get_multimodal_embeddings` and `get_input_embeddings`, this
-        # condition is only for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=isin_list(input_ids, list(self.mm_token_ids)),
-            )
-            input_ids = None
-
         hidden_states = self.llm.model(
             input_ids=input_ids,
             positions=positions,
diff --git a/vllm/model_executor/models/mistral3.py b/vllm/model_executor/models/mistral3.py
index 31571ce962d1..e932f7f007f5 100644
--- a/vllm/model_executor/models/mistral3.py
+++ b/vllm/model_executor/models/mistral3.py
@@ -571,17 +571,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.config.image_token_index,
-            )
-            input_ids = None
-
         hidden_states = self.language_model.model(input_ids,
                                                   positions,
                                                   intermediate_tensors,
diff --git a/vllm/model_executor/models/mllama4.py b/vllm/model_executor/models/mllama4.py
index 3af5267928cd..db5a9fbc6a33 100644
--- a/vllm/model_executor/models/mllama4.py
+++ b/vllm/model_executor/models/mllama4.py
@@ -823,17 +823,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner,
-        # this condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.config.image_token_index,
-            )
-            input_ids = None
-
         return self.language_model(input_ids, positions, intermediate_tensors,
                                    inputs_embeds)
 
diff --git a/vllm/model_executor/models/molmo.py b/vllm/model_executor/models/molmo.py
index 054caee9e8a4..0227a83a1f55 100644
--- a/vllm/model_executor/models/molmo.py
+++ b/vllm/model_executor/models/molmo.py
@@ -1490,17 +1490,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.img_patch_id,
-            )
-            input_ids = None
-
         hidden_states = self.model(input_ids,
                                    positions,
                                    intermediate_tensors,
diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index 505806a15c89..2d0ebdc90277 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -35,7 +35,7 @@
 from vllm.model_executor.models.radio import RadioModel
 from vllm.model_executor.models.utils import (flatten_bn,
                                               init_vllm_registered_model,
-                                              isin_list, maybe_prefix)
+                                              maybe_prefix)
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
                                     MultiModalKwargs, MultiModalKwargsItems,
@@ -1135,22 +1135,6 @@ def forward(
             input_ids = None
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            context_token_ids = [
-                token_id for token_id in (self.img_context_token_id,
-                                          self.video_context_token_id)
-                if token_id is not None
-            ]
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=isin_list(input_ids, context_token_ids),
-            )
-            input_ids = None
-
         hidden_states = self.language_model(
             input_ids=input_ids,
             positions=positions,
diff --git a/vllm/model_executor/models/nemotron_vl.py b/vllm/model_executor/models/nemotron_vl.py
index 2627a262e958..0e7ec8e458cf 100644
--- a/vllm/model_executor/models/nemotron_vl.py
+++ b/vllm/model_executor/models/nemotron_vl.py
@@ -608,17 +608,6 @@ def forward(
             input_ids = None
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.img_context_token_id,
-            )
-            input_ids = None
-
         forward_kwargs = {
             "input_ids": input_ids,
             "positions": positions,
diff --git a/vllm/model_executor/models/ovis.py b/vllm/model_executor/models/ovis.py
index 8503d3f71d1c..2f9c6ddfc661 100644
--- a/vllm/model_executor/models/ovis.py
+++ b/vllm/model_executor/models/ovis.py
@@ -511,17 +511,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.image_pad_token_id,
-            )
-            input_ids = None
-
         # up until here we have an inputs_embeds 100% numerical identity
         # between the OG HF Transformers implementation and ours
         hidden_states = self.llm(
diff --git a/vllm/model_executor/models/ovis2_5.py b/vllm/model_executor/models/ovis2_5.py
index 2ecc7bff07e0..86ce7e9eab27 100644
--- a/vllm/model_executor/models/ovis2_5.py
+++ b/vllm/model_executor/models/ovis2_5.py
@@ -596,18 +596,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.image_pad_token_id,
-            )
-            input_ids = None
-
         # up until here we have a inputs_embeds 100% numerical identity
         # between the OG HF Transformers implementation and ours
         hidden_states = self.llm(
diff --git a/vllm/model_executor/models/paligemma.py b/vllm/model_executor/models/paligemma.py
index f07f444819f4..d118e6c89ab5 100644
--- a/vllm/model_executor/models/paligemma.py
+++ b/vllm/model_executor/models/paligemma.py
@@ -370,17 +370,6 @@ def forward(self,
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.config.image_token_index,
-            )
-            input_ids = None
-
         hidden_states = self.language_model.model(input_ids,
                                                   positions,
                                                   intermediate_tensors,
diff --git a/vllm/model_executor/models/phi3v.py b/vllm/model_executor/models/phi3v.py
index ea34c8d92f13..59977796e2af 100644
--- a/vllm/model_executor/models/phi3v.py
+++ b/vllm/model_executor/models/phi3v.py
@@ -679,17 +679,6 @@ def forward(self,
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=self.image_token_id,
-            )
-            input_ids = None
-
         hidden_states = self.language_model.model(input_ids,
                                                   positions,
                                                   intermediate_tensors,
diff --git a/vllm/model_executor/models/phi4_multimodal.py b/vllm/model_executor/models/phi4_multimodal.py
index e8b79717d75d..3dbb67d28065 100644
--- a/vllm/model_executor/models/phi4_multimodal.py
+++ b/vllm/model_executor/models/phi4_multimodal.py
@@ -1411,22 +1411,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner from
-        # `get_multimodal_embeddings` and `get_input_embeddings`, this
-        # condition is only for v0 compatibility.
-        elif inputs_embeds is None:
-            image_input = self._parse_and_validate_image_input(**kwargs)
-            audio_input = self._parse_and_validate_audio_input(**kwargs)
-
-            if image_input is None and audio_input is None:
-                inputs_embeds = None
-            else:
-                inputs_embeds = self.get_input_embeddings_v0(
-                    input_ids,
-                    image_input=image_input,
-                    audio_input=audio_input)
-                input_ids = None
-
         hidden_states = self.language_model(
             input_ids,
             positions,
diff --git a/vllm/model_executor/models/phi4mm.py b/vllm/model_executor/models/phi4mm.py
index 15b09c7ae2bc..8ccc7129ddb2 100644
--- a/vllm/model_executor/models/phi4mm.py
+++ b/vllm/model_executor/models/phi4mm.py
@@ -35,8 +35,7 @@
 from .idefics2_vision_model import Idefics2VisionTransformer
 from .interfaces import MultiModalEmbeddings, SupportsLoRA, SupportsMultiModal
 from .phi4mm_audio import AudioEmbedding
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn, maybe_prefix,
-                    merge_multimodal_embeddings)
+from .utils import AutoWeightsLoader, WeightsMapper, flatten_bn, maybe_prefix
 
 # <|endoftext10|> (see vocab.json in hf model)
 _IMAGE_PLACEHOLDER_TOKEN_ID = 200010
@@ -1174,35 +1173,6 @@ def get_multimodal_embeddings(self,
 
         return multimodal_embeddings
 
-    def get_input_embeddings_v0(
-        self,
-        input_ids: torch.Tensor,
-        image_input: Optional[Phi4MMImagePixelInputs] = None,
-        audio_input: Optional[Phi4MMAudioFeatureInputs] = None,
-    ) -> torch.Tensor:
-        audio_projection_mode = 'speech'
-        inputs_embeds = self.get_input_embeddings(input_ids)
-        if image_input is not None:
-            image_embeds = self._process_image_input(image_input)
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                image_embeds,
-                placeholder_token_id=_IMAGE_PLACEHOLDER_TOKEN_ID,
-            )
-            audio_projection_mode = 'vision'
-
-        if audio_input is not None:
-            audio_embeds = self._process_audio_input(
-                audio_input, audio_projection_mode=audio_projection_mode)
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                audio_embeds,
-                placeholder_token_id=_AUDIO_PLACEHOLDER_TOKEN_ID,
-            )
-        return inputs_embeds
-
     def forward(
         self,
         input_ids: torch.Tensor,
@@ -1214,22 +1184,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner from
-        # `get_multimodal_embeddings` and `get_input_embeddings`, this
-        # condition is only for v0 compatibility.
-        elif inputs_embeds is None:
-            image_input = self._parse_and_validate_image_input(**kwargs)
-            audio_input = self._parse_and_validate_audio_input(**kwargs)
-
-            if image_input is None and audio_input is None:
-                inputs_embeds = None
-            else:
-                inputs_embeds = self.get_input_embeddings_v0(
-                    input_ids,
-                    image_input=image_input,
-                    audio_input=audio_input)
-                input_ids = None
-
         hidden_states = self.model(
             input_ids,
             positions,
diff --git a/vllm/model_executor/models/pixtral.py b/vllm/model_executor/models/pixtral.py
index 2c04b6f0f4f9..6344fc394833 100644
--- a/vllm/model_executor/models/pixtral.py
+++ b/vllm/model_executor/models/pixtral.py
@@ -444,17 +444,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.vision_args.image_token_id,
-            )
-            input_ids = None
-
         hidden_states = self.language_model.model(input_ids,
                                                   positions,
                                                   intermediate_tensors,
diff --git a/vllm/model_executor/models/qwen2_5_omni_thinker.py b/vllm/model_executor/models/qwen2_5_omni_thinker.py
index bfa398ee43b5..8f069710b0f9 100644
--- a/vllm/model_executor/models/qwen2_5_omni_thinker.py
+++ b/vllm/model_executor/models/qwen2_5_omni_thinker.py
@@ -69,8 +69,7 @@
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
                          SupportsMultiModal, SupportsPP)
 from .utils import (AutoWeightsLoader, WeightsMapper,
-                    init_vllm_registered_model, maybe_prefix,
-                    merge_multimodal_embeddings)
+                    init_vllm_registered_model, maybe_prefix)
 
 try:
     import flash_attn
@@ -908,26 +907,6 @@ def get_multimodal_embeddings_v0(
             multimodal_embeddings.append((video_embeds, "video"))
         return multimodal_embeddings
 
-    def get_input_embeddings_v0(
-        self,
-        input_ids: torch.Tensor,
-        multimodal_embeddings: Optional[NestedTensors] = None,
-    ) -> torch.Tensor:
-        inputs_embeds = self.language_model.get_input_embeddings(input_ids)
-        if multimodal_embeddings is None or len(multimodal_embeddings) == 0:
-            return inputs_embeds
-
-        for embeddings, modality in multimodal_embeddings:
-            if modality == "audio":
-                placeholder_token_id = self.config.audio_token_index
-            if modality == "image":
-                placeholder_token_id = self.config.image_token_index
-            if modality == "video":
-                placeholder_token_id = self.config.video_token_index
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids, inputs_embeds, embeddings, placeholder_token_id)
-        return inputs_embeds
-
     def forward(
         self,
         input_ids: torch.Tensor,
@@ -939,14 +918,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            multimodal_embeddings = self.get_multimodal_embeddings_v0(**kwargs)
-            inputs_embeds = self.get_input_embeddings_v0(
-                input_ids, multimodal_embeddings)
-            input_ids = None
-
         hidden_states = self.language_model.model(input_ids,
                                                   positions,
                                                   intermediate_tensors,
diff --git a/vllm/model_executor/models/qwen2_5_vl.py b/vllm/model_executor/models/qwen2_5_vl.py
index 5b092b42205f..da3889d31a7d 100644
--- a/vllm/model_executor/models/qwen2_5_vl.py
+++ b/vllm/model_executor/models/qwen2_5_vl.py
@@ -64,7 +64,6 @@
 from vllm.multimodal.processing import PromptReplacement, PromptUpdate
 from vllm.platforms import _Backend
 from vllm.sequence import IntermediateTensors
-from vllm.transformers_utils.config import uses_mrope
 from vllm.utils import is_pin_memory_available
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
@@ -75,8 +74,7 @@
 from .qwen2_vl import (Qwen2VLMultiModalProcessor, Qwen2VLProcessingInfo,
                        apply_rotary_pos_emb_vision)
 from .utils import (AutoWeightsLoader, WeightsMapper, cast_overflow_tensors,
-                    init_vllm_registered_model, maybe_prefix,
-                    merge_multimodal_embeddings)
+                    init_vllm_registered_model, maybe_prefix)
 from .vision import get_vit_attn_backend, run_dp_sharded_mrope_vision_model
 
 logger = init_logger(__name__)
@@ -1365,40 +1363,6 @@ def get_multimodal_embeddings(self,
                 multimodal_embeddings += video_embeddings
         return multimodal_embeddings
 
-    def get_input_embeddings_v0(
-        self,
-        input_ids: torch.Tensor,
-        image_input: Optional[Qwen2_5_VLImageInputs] = None,
-        video_input: Optional[Qwen2_5_VLVideoInputs] = None,
-    ) -> torch.Tensor:
-        inputs_embeds = self.get_input_embeddings(input_ids)
-        if image_input is not None:
-            image_embeds = self._process_image_input(image_input)
-            if self.is_multimodal_pruning_enabled:
-                image_embeds = self._postprocess_image_embeds_evs(
-                    image_embeds, image_input
-                )
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                image_embeds,
-                placeholder_token_id=self.config.image_token_id,
-            )
-
-        if video_input is not None:
-            video_embeds = self._process_video_input(video_input)
-            if self.is_multimodal_pruning_enabled:
-                video_embeds = self._postprocess_video_embeds_evs(
-                    video_embeds, video_input
-                )
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                video_embeds,
-                placeholder_token_id=self.config.video_token_id,
-            )
-        return inputs_embeds
-
     def forward(
         self,
         input_ids: torch.Tensor,
@@ -1421,26 +1385,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner from
-        # `get_multimodal_embeddings` and `get_input_embeddings`, this
-        # condition is only for v0 compatibility.
-        elif inputs_embeds is None:
-            image_input = self._parse_and_validate_image_input(**kwargs)
-            video_input = self._parse_and_validate_video_input(**kwargs)
-
-            if image_input is None and video_input is None:
-                inputs_embeds = None
-            else:
-                if uses_mrope(self.config):
-                    assert positions.ndim == 2 and positions.size(0) == 3, (
-                        "multimodal section rotary embedding requires "
-                        f"(3, seq_len) positions, but got {positions.size()}")
-                inputs_embeds = self.get_input_embeddings_v0(
-                    input_ids,
-                    image_input=image_input,
-                    video_input=video_input)
-                input_ids = None
-
         hidden_states = self.language_model.model(
             input_ids=input_ids,
             positions=positions,
diff --git a/vllm/model_executor/models/qwen2_audio.py b/vllm/model_executor/models/qwen2_audio.py
index 9dfa29eef5ce..f9136863b8d6 100644
--- a/vllm/model_executor/models/qwen2_audio.py
+++ b/vllm/model_executor/models/qwen2_audio.py
@@ -449,17 +449,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            multimodal_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                multimodal_embeddings,
-                is_multimodal=input_ids == self.config.audio_token_index,
-            )
-            input_ids = None
-
         hidden_states = self.language_model.model(input_ids,
                                                   positions,
                                                   intermediate_tensors,
diff --git a/vllm/model_executor/models/qwen2_vl.py b/vllm/model_executor/models/qwen2_vl.py
index 6ef01f333554..f83a411459cc 100644
--- a/vllm/model_executor/models/qwen2_vl.py
+++ b/vllm/model_executor/models/qwen2_vl.py
@@ -65,15 +65,13 @@
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.platforms import _Backend, current_platform
 from vllm.sequence import IntermediateTensors
-from vllm.transformers_utils.config import uses_mrope
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA, SupportsMRoPE,
                          SupportsMultiModal, SupportsPP)
 from .utils import (AutoWeightsLoader, WeightsMapper,
-                    init_vllm_registered_model, maybe_prefix,
-                    merge_multimodal_embeddings)
+                    init_vllm_registered_model, maybe_prefix)
 from .vision import get_vit_attn_backend, run_dp_sharded_mrope_vision_model
 
 logger = init_logger(__name__)
@@ -1464,32 +1462,6 @@ def get_multimodal_embeddings(self,
 
         return multimodal_embeddings
 
-    def get_input_embeddings_v0(
-        self,
-        input_ids: torch.Tensor,
-        image_input: Optional[Qwen2VLImagePixelInputs] = None,
-        video_input: Optional[Qwen2VLVideoPixelInputs] = None,
-    ) -> torch.Tensor:
-        inputs_embeds = self.get_input_embeddings(input_ids)
-        if image_input is not None:
-            image_embeds = self._process_image_input(image_input)
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                image_embeds,
-                placeholder_token_id=self.config.image_token_id,
-            )
-
-        if video_input is not None:
-            video_embeds = self._process_video_input(video_input)
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                video_embeds,
-                placeholder_token_id=self.config.video_token_id,
-            )
-        return inputs_embeds
-
     def forward(
         self,
         input_ids: torch.Tensor,
@@ -1515,26 +1487,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner from
-        # `get_multimodal_embeddings` and `get_input_embeddings`, this
-        # condition is only for v0 compatibility.
-        elif inputs_embeds is None:
-            image_input = self._parse_and_validate_image_input(**kwargs)
-            video_input = self._parse_and_validate_video_input(**kwargs)
-
-            if image_input is None and video_input is None:
-                inputs_embeds = None
-            else:
-                if uses_mrope(self.config):
-                    assert positions.ndim == 2 and positions.size(0) == 3, (
-                        "multimodal section rotary embedding requires "
-                        f"(3, seq_len) positions, but got {positions.size()}")
-                inputs_embeds = self.get_input_embeddings_v0(
-                    input_ids,
-                    image_input=image_input,
-                    video_input=video_input)
-                input_ids = None
-
         hidden_states = self.language_model.model(
             input_ids=input_ids,
             positions=positions,
diff --git a/vllm/model_executor/models/qwen3_vl.py b/vllm/model_executor/models/qwen3_vl.py
index 6d2a6019ef6f..ce92557d6424 100644
--- a/vllm/model_executor/models/qwen3_vl.py
+++ b/vllm/model_executor/models/qwen3_vl.py
@@ -68,7 +68,6 @@
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.platforms import _Backend
 from vllm.sequence import IntermediateTensors
-from vllm.transformers_utils.config import uses_mrope
 from vllm.utils import is_list_of
 
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
@@ -82,8 +81,7 @@
 from .qwen2_vl import Qwen2VLProcessingInfo
 from .qwen3 import Qwen3ForCausalLM, Qwen3Model
 from .utils import (AutoWeightsLoader, PPMissingLayer, WeightsMapper,
-                    _merge_multimodal_embeddings, maybe_prefix,
-                    merge_multimodal_embeddings)
+                    _merge_multimodal_embeddings, maybe_prefix)
 from .vision import get_vit_attn_backend, run_dp_sharded_mrope_vision_model
 
 logger = init_logger(__name__)
@@ -1464,75 +1462,6 @@ def get_input_embeddings(
 
         return inputs_embeds
 
-    def get_input_embeddings_v0(
-        self,
-        input_ids: torch.Tensor,
-        image_input: Optional[Qwen2_5_VLImageInputs] = None,
-        video_input: Optional[Qwen2_5_VLVideoInputs] = None,
-    ) -> torch.Tensor:
-        inputs_embeds = self.get_input_embeddings(input_ids)
-
-        if self.use_deepstack:
-            visual_dim = inputs_embeds.shape[-1]
-            deepstack_input_embeds = None
-            if image_input is not None or video_input is not None:
-                deepstack_input_embeds = torch.zeros_like(
-                    inputs_embeds).unsqueeze(1).repeat(
-                        1, self.deepstack_num_level, 1).flatten(1)
-
-        if image_input is not None:
-            image_embeds = self._process_image_input(image_input)
-            if self.use_deepstack:
-                image_embeds = torch.cat(image_embeds)
-
-                image_embeds, image_embeds_multiscale = image_embeds.split(
-                    [visual_dim, visual_dim * self.deepstack_num_level],
-                    dim=-1)
-
-                deepstack_input_embeds = merge_multimodal_embeddings(
-                    input_ids,
-                    deepstack_input_embeds,
-                    image_embeds_multiscale,
-                    placeholder_token_id=self.config.image_token_id,
-                )
-
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                image_embeds,
-                placeholder_token_id=self.config.image_token_id,
-            )
-
-        if video_input is not None:
-            video_embeds = self._process_video_input(video_input)
-            if self.use_deepstack:
-                video_embeds = torch.cat(video_embeds)
-
-                video_embeds, video_embeds_multiscale = video_embeds.split(
-                    [visual_dim, visual_dim * self.deepstack_num_level],
-                    dim=-1)
-
-                deepstack_input_embeds = merge_multimodal_embeddings(
-                    input_ids,
-                    deepstack_input_embeds,
-                    video_embeds_multiscale,
-                    placeholder_token_id=self.config.video_token_id,
-                )
-
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                video_embeds,
-                placeholder_token_id=self.config.video_token_id,
-            )
-
-        if self.use_deepstack and deepstack_input_embeds is not None:
-            deepstack_input_embeds = deepstack_input_embeds.view(
-                inputs_embeds.shape[0], self.deepstack_num_level,
-                visual_dim).permute(1, 0, 2).contiguous()
-            self._set_deepstack_input_embeds(deepstack_input_embeds)
-        return inputs_embeds
-
     def forward(
         self,
         input_ids: torch.Tensor,
@@ -1568,26 +1497,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner from
-        # `get_multimodal_embeddings` and `get_input_embeddings`, this
-        # condition is only for v0 compatibility.
-        elif inputs_embeds is None:
-            image_input = self._parse_and_validate_image_input(**kwargs)
-            video_input = self._parse_and_validate_video_input(**kwargs)
-
-            if image_input is None and video_input is None:
-                inputs_embeds = None
-            else:
-                if uses_mrope(self.config):
-                    assert positions.ndim == 2 and positions.size(0) == 3, (
-                        "multimodal section rotary embedding requires "
-                        f"(3, seq_len) positions, but got {positions.size()}")
-                inputs_embeds = self.get_input_embeddings_v0(
-                    input_ids,
-                    image_input=image_input,
-                    video_input=video_input)
-                input_ids = None
-
         if self.use_deepstack and inputs_embeds is not None and get_pp_group(
         ).is_first_rank:
             deepstack_input_embeds = self._get_deepstack_input_embeds(
diff --git a/vllm/model_executor/models/qwen_vl.py b/vllm/model_executor/models/qwen_vl.py
index dc11b60604a9..924119ed63ab 100644
--- a/vllm/model_executor/models/qwen_vl.py
+++ b/vllm/model_executor/models/qwen_vl.py
@@ -767,18 +767,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids ==
-                self.transformer.visual.image_pad_id,
-            )
-            input_ids = None
-
         hidden_states = self.transformer(input_ids, positions,
                                          intermediate_tensors, inputs_embeds)
         return hidden_states
diff --git a/vllm/model_executor/models/skyworkr1v.py b/vllm/model_executor/models/skyworkr1v.py
index f9a107c06085..f03022aa719c 100644
--- a/vllm/model_executor/models/skyworkr1v.py
+++ b/vllm/model_executor/models/skyworkr1v.py
@@ -874,17 +874,6 @@ def forward(
             input_ids = None
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            vision_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                vision_embeddings,
-                is_multimodal=input_ids == self.img_context_token_id,
-            )
-            input_ids = None
-
         forward_kwargs = {
             "input_ids": input_ids,
             "positions": positions,
diff --git a/vllm/model_executor/models/transformers.py b/vllm/model_executor/models/transformers.py
index 7cfb639f675d..00d87f560e70 100644
--- a/vllm/model_executor/models/transformers.py
+++ b/vllm/model_executor/models/transformers.py
@@ -881,19 +881,6 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs: object,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        # NOTE: In v1, inputs_embeds is always generated at model runner from
-        # `get_multimodal_embeddings` and `get_input_embeddings`, this
-        # condition is only for v0 compatibility.
-        if inputs_embeds is None:
-            multimodal_embeds = self.get_multimodal_embeddings(**kwargs)
-            if multimodal_embeds is not None:
-                inputs_embeds = self.get_input_embeddings(
-                    input_ids,
-                    multimodal_embeds,
-                    is_multimodal=input_ids == self.config.image_token_id,
-                )
-                input_ids = None
-
         model_output = super().forward(input_ids, positions,
                                        intermediate_tensors, inputs_embeds)
         return model_output
diff --git a/vllm/model_executor/models/ultravox.py b/vllm/model_executor/models/ultravox.py
index 77e886c22e63..70aabf6dfe78 100644
--- a/vllm/model_executor/models/ultravox.py
+++ b/vllm/model_executor/models/ultravox.py
@@ -597,18 +597,6 @@ def forward(self,
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            multimodal_embeddings = self.get_multimodal_embeddings(**kwargs)
-
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                multimodal_embeddings,
-                is_multimodal=input_ids == self.config.audio_token_index,
-            )
-            input_ids = None
-
         language_model = self.language_model
         if hasattr(language_model, "language_model"):
             language_model = language_model.language_model
diff --git a/vllm/model_executor/models/voxtral.py b/vllm/model_executor/models/voxtral.py
index f93e7ccfd06f..1edeaeb0f319 100644
--- a/vllm/model_executor/models/voxtral.py
+++ b/vllm/model_executor/models/voxtral.py
@@ -371,19 +371,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        # NOTE: In v1, inputs_embeds is always generated at model runner, this
-        # condition is for v0 compatibility.
-        elif inputs_embeds is None:
-            audio_encoder = self.tokenizer.instruct.audio_encoder
-            audio_tok_id = audio_encoder.audio_token
-            audio_embeddings = self.get_multimodal_embeddings(**kwargs)
-            inputs_embeds = self.get_input_embeddings(
-                input_ids,
-                audio_embeddings,
-                is_multimodal=input_ids == audio_tok_id,
-            )
-            input_ids = None
-
         hidden_states = self.language_model.model(input_ids,
                                                   positions,
                                                   intermediate_tensors,

From 86502dcf502e0f2fa0d1fb7406b1de253e2861e6 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Mon, 29 Sep 2025 16:03:37 +0800
Subject: [PATCH 002/193] [Misc] Remove more `get_input_embeddings_v0` (#25857)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/gemma3n_mm.py      |  3 +-
 vllm/model_executor/models/keye.py            | 46 +------------------
 vllm/model_executor/models/phi4_multimodal.py | 37 +--------------
 vllm/model_executor/models/utils.py           |  4 ++
 4 files changed, 7 insertions(+), 83 deletions(-)

diff --git a/vllm/model_executor/models/gemma3n_mm.py b/vllm/model_executor/models/gemma3n_mm.py
index b23437a08e5a..101e083ac123 100644
--- a/vllm/model_executor/models/gemma3n_mm.py
+++ b/vllm/model_executor/models/gemma3n_mm.py
@@ -45,8 +45,7 @@
 from .interfaces import (MultiModalEmbeddings, SupportsMultiModal,
                          SupportsTranscription)
 from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
-                    init_vllm_registered_model, maybe_prefix,
-                    merge_multimodal_embeddings)
+                    init_vllm_registered_model, maybe_prefix)
 
 logger = init_logger(__name__)
 
diff --git a/vllm/model_executor/models/keye.py b/vllm/model_executor/models/keye.py
index 62a71b7b1fa8..10b5c45169f4 100644
--- a/vllm/model_executor/models/keye.py
+++ b/vllm/model_executor/models/keye.py
@@ -41,7 +41,6 @@
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.platforms import _Backend
 from vllm.sequence import IntermediateTensors
-from vllm.transformers_utils.config import uses_mrope
 from vllm.utils import is_list_of
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
@@ -50,7 +49,7 @@
 from .siglip import SiglipMLP
 from .utils import (AutoWeightsLoader, WeightsMapper,
                     init_vllm_registered_model, is_pp_missing_parameter,
-                    maybe_prefix, merge_multimodal_embeddings)
+                    maybe_prefix)
 from .vision import get_vit_attn_backend
 
 logger = init_logger(__name__)
@@ -1450,32 +1449,6 @@ def get_multimodal_embeddings(
                 multimodal_embeddings += video_embeddings
         return multimodal_embeddings
 
-    def get_input_embeddings_v0(
-        self,
-        input_ids: torch.Tensor,
-        image_input: Optional[Any] = None,
-        video_input: Optional[Any] = None,
-    ) -> torch.Tensor:
-        inputs_embeds = self.get_input_embeddings(input_ids)
-        if image_input is not None:
-            image_embeds = self._process_image_input(image_input)
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                image_embeds,
-                placeholder_token_id=self.config.image_token_id,
-            )
-
-        if video_input is not None:
-            video_embeds = self._process_video_input(video_input)
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                video_embeds,
-                placeholder_token_id=self.config.video_token_id,
-            )
-        return inputs_embeds
-
     def forward(
         self,
         input_ids: torch.Tensor,
@@ -1500,23 +1473,6 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        elif inputs_embeds is None:
-            image_input = self._parse_and_validate_image_input(**kwargs)
-            video_input = self._parse_and_validate_video_input(**kwargs)
-            if image_input is None and video_input is None:
-                inputs_embeds = None
-            else:
-                if uses_mrope(self.config):
-                    assert positions.ndim == 2 and positions.size(0) == 3, (
-                        "multimodal section rotary embedding requires "
-                        f"(3, seq_len) positions, but got {positions.size()}")
-                inputs_embeds = self.get_input_embeddings_v0(
-                    input_ids,
-                    image_input=image_input,
-                    video_input=video_input,
-                )
-                input_ids = None
-
         hidden_states = self.language_model.model(
             input_ids=input_ids,
             positions=positions,
diff --git a/vllm/model_executor/models/phi4_multimodal.py b/vllm/model_executor/models/phi4_multimodal.py
index 3dbb67d28065..a4f9f96cb951 100644
--- a/vllm/model_executor/models/phi4_multimodal.py
+++ b/vllm/model_executor/models/phi4_multimodal.py
@@ -44,13 +44,7 @@
 from .idefics2_vision_model import Idefics2VisionTransformer
 from .interfaces import MultiModalEmbeddings, SupportsLoRA, SupportsMultiModal
 from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
-                    init_vllm_registered_model, maybe_prefix,
-                    merge_multimodal_embeddings)
-
-# <|endoftext10|> (see vocab.json in hf model)
-_IMAGE_PLACEHOLDER_TOKEN_ID = 200010
-# <|endoftext11|>
-_AUDIO_PLACEHOLDER_TOKEN_ID = 200011
+                    init_vllm_registered_model, maybe_prefix)
 
 _AUDIO_MAX_SOUNDFILE_SIZE = 241_000
 
@@ -1371,35 +1365,6 @@ def get_multimodal_embeddings(self,
 
         return multimodal_embeddings
 
-    def get_input_embeddings_v0(
-        self,
-        input_ids: torch.Tensor,
-        image_input: Optional[Phi4MMImagePixelInputs] = None,
-        audio_input: Optional[Phi4MMAudioFeatureInputs] = None,
-    ) -> torch.Tensor:
-        audio_projection_mode = 'speech'
-        inputs_embeds = self.get_input_embeddings(input_ids)
-        if image_input is not None:
-            image_embeds = self._process_image_input(image_input)
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                image_embeds,
-                placeholder_token_id=_IMAGE_PLACEHOLDER_TOKEN_ID,
-            )
-            audio_projection_mode = 'vision'
-
-        if audio_input is not None:
-            audio_embeds = self._process_audio_input(
-                audio_input, audio_projection_mode=audio_projection_mode)
-            inputs_embeds = merge_multimodal_embeddings(
-                input_ids,
-                inputs_embeds,
-                audio_embeds,
-                placeholder_token_id=_AUDIO_PLACEHOLDER_TOKEN_ID,
-            )
-        return inputs_embeds
-
     def forward(
         self,
         input_ids: torch.Tensor,
diff --git a/vllm/model_executor/models/utils.py b/vllm/model_executor/models/utils.py
index 4bf151fbf62d..d6fa88f06e56 100644
--- a/vllm/model_executor/models/utils.py
+++ b/vllm/model_executor/models/utils.py
@@ -10,6 +10,7 @@
 import torch.nn as nn
 from torch.func import functional_call
 from transformers import PretrainedConfig
+from typing_extensions import deprecated
 
 import vllm.envs as envs
 from vllm.config import VllmConfig
@@ -439,6 +440,9 @@ def _merge_multimodal_embeddings(
     return inputs_embeds
 
 
+@deprecated("`merge_multimodal_embeddings` has been replaced with "
+            "`SupportsMultiModal.get_input_embeddings` and will be "
+            "removed in v0.12.")
 def merge_multimodal_embeddings(
     input_ids: torch.Tensor,
     inputs_embeds: torch.Tensor,

From 219bc0b4e0afc5ebe2583a2022b57c6ec5efa29f Mon Sep 17 00:00:00 2001
From: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
Date: Mon, 29 Sep 2025 20:13:26 +0300
Subject: [PATCH 003/193] refactor - pass tokens_per_frame and num_frames to
 compute_retained_tokens_count so code can be reused in nano_nemotrron_vl
 which doesn't have thw

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/qwen2_5_vl.py |  7 +++++--
 vllm/multimodal/evs.py                   | 14 +++++++-------
 2 files changed, 12 insertions(+), 9 deletions(-)

diff --git a/vllm/model_executor/models/qwen2_5_vl.py b/vllm/model_executor/models/qwen2_5_vl.py
index da3889d31a7d..d6e0d5f00b1e 100644
--- a/vllm/model_executor/models/qwen2_5_vl.py
+++ b/vllm/model_executor/models/qwen2_5_vl.py
@@ -939,9 +939,12 @@ def get_replacement_qwen2vl(item_idx: int, modality: str):
             ).video_pruning_rate
             if (modality == "video" and video_pruning_rate is not None
                     and video_pruning_rate > 0.0):
+                T, H, W = map(int, grid_thw)
+                tokens_per_frame = (H // image_processor.merge_size) * (
+                    W // image_processor.merge_size)
                 num_tokens = compute_retained_tokens_count(
-                    grid_thw,
-                    image_processor.merge_size,
+                    tokens_per_frame,
+                    T,
                     video_pruning_rate,
                 )
             # End of EVS-specific code
diff --git a/vllm/multimodal/evs.py b/vllm/multimodal/evs.py
index 056f3d905968..79f1f4f88aea 100644
--- a/vllm/multimodal/evs.py
+++ b/vllm/multimodal/evs.py
@@ -13,24 +13,24 @@
 import torch
 
 
-def compute_retained_tokens_count(video_size_thw: torch.LongTensor,
-                                  spatial_merge_size: int, q: float) -> int:
+def compute_retained_tokens_count(tokens_per_frame: int, num_frames: int,
+                                  q: float) -> int:
     """
     Compute the number of retained tokens for a given video.
     Method ensures that we retain all the tokens from the first frame
     regardless of the pruning rate.
 
     Args:
-        video_size_thw: The size of the video in the format of (T, H, W).
-        spatial_merge_size: The size of the spatial merge.
+        tokens_per_frame: The number of tokens per frame.
+        num_frames: The total number of frames.
         q: The pruning rate.
 
     Returns:
         The number of retained tokens.
     """
-    T, H, W = map(int, video_size_thw)
-    min_num_tokens = (H // spatial_merge_size) * (W // spatial_merge_size)
-    evs_num_tokens = int(T * min_num_tokens * (1 - q))
+    total_tokens = tokens_per_frame * num_frames
+    evs_num_tokens = int(total_tokens * (1 - q))
+    min_num_tokens = tokens_per_frame
     return max(min_num_tokens, evs_num_tokens)
 
 
From 23a205fd436a11e0305e954f7c6ed2f64745e0ca Mon Sep 17 00:00:00 2001
From: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
Date: Tue, 30 Sep 2025 23:30:53 +0300
Subject: [PATCH 004/193] WIP - commit with all commented code

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../model_executor/models/nano_nemotron_vl.py | 55 ++++++++++++++++---
 1 file changed, 48 insertions(+), 7 deletions(-)

diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index 2d0ebdc90277..94fa5346a223 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -44,11 +44,11 @@
                                    ImageSize, MultiModalDataItems)
 from vllm.multimodal.processing import (BaseMultiModalProcessor,
                                         BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails)
+                                        PromptUpdate, PromptUpdateDetails, _seq2tokens)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs.radio import RadioConfig
-from vllm.transformers_utils.tokenizer import AnyTokenizer
+from vllm.transformers_utils.tokenizer import AnyTokenizer, cached_tokenizer_from_config, encode_tokens
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 # Configure PIL to handle large images without warnings
@@ -483,20 +483,26 @@ def get_image_repl(
 
         return PromptUpdateDetails.select_text(repl_full, IMG_CONTEXT)
 
+    @classmethod
     def get_video_repl(
-        self,
+        cls,
         feature_size: int,
         num_patches: Optional[int] = None,
+        # feature_size_per_patch: list[int],
+        # num_patches: int,
         video_context_token: str = IMG_CONTEXT,
     ) -> PromptUpdateDetails[str]:
-        repl_features = video_context_token * self.num_image_token
+        repl_features = video_context_token * feature_size
         repl_features_with_sep = IMG_START + repl_features + IMG_END
+        # repl_features_with_sep = lambda x: IMG_START + video_context_token * feature_size_per_patch[x] + IMG_END
         # num_patches is equal to num_frames
         repl_full = ''.join([
             f'Frame{i+1}: {repl_features_with_sep}' for i in range(num_patches)
+            # f'Frame{i+1}: {repl_features_with_sep(i)}' for i in range(num_patches)
         ])
 
-        return PromptUpdateDetails.select_text(repl_full, video_context_token)
+        # return PromptUpdateDetails.select_text(repl_full, video_context_token)
+        return PromptUpdateDetails.select_text(repl_full, repl_full)
 
 
 class BaseNanoNemotronVLProcessingInfo(BaseProcessingInfo):
@@ -784,9 +790,22 @@ def get_video_replacement_internvl(item_idx: int):
             if num_patches is not None:
                 assert isinstance(num_patches, int)
 
+            # # EVS-specific code
+            # video_pruning_rate = self.info.ctx.get_mm_config().video_pruning_rate
+            # if video_pruning_rate is not None and video_pruning_rate > 0.0:
+            #     T, H, W = map(int, grid_thw)
+            #     tokens_per_frame = (H // image_processor.merge_size) * (
+            #         W // image_processor.merge_size)
+            #     num_tokens = compute_retained_tokens_count(
+            #         tokens_per_frame,
+            #         T,
+            #         video_pruning_rate,
+            #     )
+            # # End of EVS-specific code
+
             return hf_processor.get_video_repl(
-                feature_size,
-                num_patches,
+                feature_size,       # number of tokens per frame
+                num_patches,        # number of frames
                 video_context_token=hf_processor.video_token)
 
         if self.info.supports_video:
@@ -901,6 +920,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.vision_model = self.get_vit_model_from_radio_config(config).to(
             self.language_model.config.torch_dtype)
 
+        self.tokenizer = cached_tokenizer_from_config(vllm_config.model_config)
+
         # Construct the vision projection.
         vit_hidden_size = config.vit_hidden_size
         vision_projection_hidden_size = config.projector_hidden_size
@@ -1116,6 +1137,26 @@ def get_multimodal_embeddings(self,
             if modality == "videos":
                 video_input = modalities["videos"]
                 video_embeddings = self._process_image_input(video_input)
+                # num_patches = video_input["num_patches"]
+                # feature_size = int(video_embeddings[0].shape[0] / num_patches)
+                # construct video_repl + mask with repl = PromptUpdateDetails.select_text(repl_full, video_context_token)
+                # create larger zeros tensor with shape (len(repl.is_embed),hidden_size). Called X for now
+                # X[repl.is_embed] = video_embeddings
+                # X[~repl.is_embed] = self.llm.get_input_embeddings(repl tokens where repl.is_embed is False)
+                # video_embeddings = X
+                num_patches = video_input["num_patches"][0].item()
+                assert video_embeddings[0].shape[0] % num_patches == 0
+                feature_size = video_embeddings[0].shape[0] // num_patches
+                device = video_embeddings[0].device
+                video_repl_text = NanoNemotronVLProcessor.get_video_repl(feature_size, num_patches, IMG_CONTEXT).full
+                repl_token_ids = torch.tensor(_seq2tokens(self.tokenizer, video_repl_text), device=device)
+                embed_token_ids = torch.tensor(encode_tokens(self.tokenizer, IMG_CONTEXT), device=device)   # TODO: Can just use ID. this also adds BOS but that doesn't exist in repl_token_ids since _seq2tokens uses add_special_tokens=False
+                is_video_embed = torch.isin(repl_token_ids, embed_token_ids)
+                video_repl_embeddings = torch.empty(repl_token_ids.shape[0], video_embeddings[0].shape[1], dtype=video_embeddings[0].dtype, device=device)
+                video_repl_embeddings[is_video_embed] = video_embeddings[0]
+                video_repl_embeddings[~is_video_embed] = self.language_model.get_input_embeddings(repl_token_ids[~is_video_embed])
+                video_embeddings = (video_repl_embeddings,)
+
                 multimodal_embeddings += video_embeddings
 
         return multimodal_embeddings

From e8fd68a5c174dcb724fcbe9eaca315a379aca19b Mon Sep 17 00:00:00 2001
From: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
Date: Tue, 30 Sep 2025 23:33:32 +0300
Subject: [PATCH 005/193] Revert "WIP - commit with all commented code"

This reverts commit c5dad7e180778bed9759bf3044e8ed298e04b195.

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../model_executor/models/nano_nemotron_vl.py | 55 +++----------------
 1 file changed, 7 insertions(+), 48 deletions(-)

diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index 94fa5346a223..2d0ebdc90277 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -44,11 +44,11 @@
                                    ImageSize, MultiModalDataItems)
 from vllm.multimodal.processing import (BaseMultiModalProcessor,
                                         BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails, _seq2tokens)
+                                        PromptUpdate, PromptUpdateDetails)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs.radio import RadioConfig
-from vllm.transformers_utils.tokenizer import AnyTokenizer, cached_tokenizer_from_config, encode_tokens
+from vllm.transformers_utils.tokenizer import AnyTokenizer
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 # Configure PIL to handle large images without warnings
@@ -483,26 +483,20 @@ def get_image_repl(
 
         return PromptUpdateDetails.select_text(repl_full, IMG_CONTEXT)
 
-    @classmethod
     def get_video_repl(
-        cls,
+        self,
         feature_size: int,
         num_patches: Optional[int] = None,
-        # feature_size_per_patch: list[int],
-        # num_patches: int,
         video_context_token: str = IMG_CONTEXT,
     ) -> PromptUpdateDetails[str]:
-        repl_features = video_context_token * feature_size
+        repl_features = video_context_token * self.num_image_token
         repl_features_with_sep = IMG_START + repl_features + IMG_END
-        # repl_features_with_sep = lambda x: IMG_START + video_context_token * feature_size_per_patch[x] + IMG_END
         # num_patches is equal to num_frames
         repl_full = ''.join([
             f'Frame{i+1}: {repl_features_with_sep}' for i in range(num_patches)
-            # f'Frame{i+1}: {repl_features_with_sep(i)}' for i in range(num_patches)
         ])
 
-        # return PromptUpdateDetails.select_text(repl_full, video_context_token)
-        return PromptUpdateDetails.select_text(repl_full, repl_full)
+        return PromptUpdateDetails.select_text(repl_full, video_context_token)
 
 
 class BaseNanoNemotronVLProcessingInfo(BaseProcessingInfo):
@@ -790,22 +784,9 @@ def get_video_replacement_internvl(item_idx: int):
             if num_patches is not None:
                 assert isinstance(num_patches, int)
 
-            # # EVS-specific code
-            # video_pruning_rate = self.info.ctx.get_mm_config().video_pruning_rate
-            # if video_pruning_rate is not None and video_pruning_rate > 0.0:
-            #     T, H, W = map(int, grid_thw)
-            #     tokens_per_frame = (H // image_processor.merge_size) * (
-            #         W // image_processor.merge_size)
-            #     num_tokens = compute_retained_tokens_count(
-            #         tokens_per_frame,
-            #         T,
-            #         video_pruning_rate,
-            #     )
-            # # End of EVS-specific code
-
             return hf_processor.get_video_repl(
-                feature_size,       # number of tokens per frame
-                num_patches,        # number of frames
+                feature_size,
+                num_patches,
                 video_context_token=hf_processor.video_token)
 
         if self.info.supports_video:
@@ -920,8 +901,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.vision_model = self.get_vit_model_from_radio_config(config).to(
             self.language_model.config.torch_dtype)
 
-        self.tokenizer = cached_tokenizer_from_config(vllm_config.model_config)
-
         # Construct the vision projection.
         vit_hidden_size = config.vit_hidden_size
         vision_projection_hidden_size = config.projector_hidden_size
@@ -1137,26 +1116,6 @@ def get_multimodal_embeddings(self,
             if modality == "videos":
                 video_input = modalities["videos"]
                 video_embeddings = self._process_image_input(video_input)
-                # num_patches = video_input["num_patches"]
-                # feature_size = int(video_embeddings[0].shape[0] / num_patches)
-                # construct video_repl + mask with repl = PromptUpdateDetails.select_text(repl_full, video_context_token)
-                # create larger zeros tensor with shape (len(repl.is_embed),hidden_size). Called X for now
-                # X[repl.is_embed] = video_embeddings
-                # X[~repl.is_embed] = self.llm.get_input_embeddings(repl tokens where repl.is_embed is False)
-                # video_embeddings = X
-                num_patches = video_input["num_patches"][0].item()
-                assert video_embeddings[0].shape[0] % num_patches == 0
-                feature_size = video_embeddings[0].shape[0] // num_patches
-                device = video_embeddings[0].device
-                video_repl_text = NanoNemotronVLProcessor.get_video_repl(feature_size, num_patches, IMG_CONTEXT).full
-                repl_token_ids = torch.tensor(_seq2tokens(self.tokenizer, video_repl_text), device=device)
-                embed_token_ids = torch.tensor(encode_tokens(self.tokenizer, IMG_CONTEXT), device=device)   # TODO: Can just use ID. this also adds BOS but that doesn't exist in repl_token_ids since _seq2tokens uses add_special_tokens=False
-                is_video_embed = torch.isin(repl_token_ids, embed_token_ids)
-                video_repl_embeddings = torch.empty(repl_token_ids.shape[0], video_embeddings[0].shape[1], dtype=video_embeddings[0].dtype, device=device)
-                video_repl_embeddings[is_video_embed] = video_embeddings[0]
-                video_repl_embeddings[~is_video_embed] = self.language_model.get_input_embeddings(repl_token_ids[~is_video_embed])
-                video_embeddings = (video_repl_embeddings,)
-
                 multimodal_embeddings += video_embeddings
 
         return multimodal_embeddings

From 859e9f1cede57337aea079c98faba0115d43908f Mon Sep 17 00:00:00 2001
From: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
Date: Wed, 1 Oct 2025 00:16:07 +0300
Subject: [PATCH 006/193] Manually deal with video prompt replacement instead
 of relying on vLLM mechanism:

1. get_video_repl now doesn't mask the indicator tokens - it signals
   vLLM to replace all placeholder embeddings with the video embeddings
   returned by get_multimodal_embeddings
2. get_multimodal_embeddings handles interleaving video embeddings with
   text embeddings for indicator tokens
3. This is done by creating the video replacement text again in
   get_multimodal_embeddings, tokenizing it, and masking the indicator
   tokens. Indicator tokens embeddings are calculated by calling
   self.language_model.get_input_embeddings() directly
4. The tokenizer was added to NemotronH_Nano_VL_V2, to allow for
   tokenizing in get_multimodal_embeddings()

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../model_executor/models/nano_nemotron_vl.py | 104 ++++++++++++++++--
 1 file changed, 95 insertions(+), 9 deletions(-)

diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index 2d0ebdc90277..3d93adc6ac54 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -44,11 +44,14 @@
                                    ImageSize, MultiModalDataItems)
 from vllm.multimodal.processing import (BaseMultiModalProcessor,
                                         BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails)
+                                        PromptUpdate, PromptUpdateDetails,
+                                        _seq2tokens)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs.radio import RadioConfig
-from vllm.transformers_utils.tokenizer import AnyTokenizer
+from vllm.transformers_utils.tokenizer import (AnyTokenizer,
+                                               cached_tokenizer_from_config,
+                                               encode_tokens)
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 # Configure PIL to handle large images without warnings
@@ -483,20 +486,21 @@ def get_image_repl(
 
         return PromptUpdateDetails.select_text(repl_full, IMG_CONTEXT)
 
+    @classmethod
     def get_video_repl(
-        self,
+        cls,
         feature_size: int,
-        num_patches: Optional[int] = None,
+        num_patches: int,
         video_context_token: str = IMG_CONTEXT,
     ) -> PromptUpdateDetails[str]:
-        repl_features = video_context_token * self.num_image_token
+        repl_features = video_context_token * feature_size
         repl_features_with_sep = IMG_START + repl_features + IMG_END
         # num_patches is equal to num_frames
         repl_full = ''.join([
             f'Frame{i+1}: {repl_features_with_sep}' for i in range(num_patches)
         ])
 
-        return PromptUpdateDetails.select_text(repl_full, video_context_token)
+        return PromptUpdateDetails.select_text(repl_full, repl_full)
 
 
 class BaseNanoNemotronVLProcessingInfo(BaseProcessingInfo):
@@ -784,9 +788,20 @@ def get_video_replacement_internvl(item_idx: int):
             if num_patches is not None:
                 assert isinstance(num_patches, int)
 
+            # # EVS-specific code
+            # video_pruning_rate = \
+            #   self.info.ctx.get_mm_config().video_pruning_rate
+            # if video_pruning_rate is not None and video_pruning_rate > 0.0:
+            #     num_tokens = compute_retained_tokens_count(
+            #         feature_size,
+            #         num_patches,
+            #         video_pruning_rate,
+            #     )
+            # # End of EVS-specific code
+
             return hf_processor.get_video_repl(
-                feature_size,
-                num_patches,
+                feature_size,  # number of tokens per frame
+                num_patches,  # number of frames
                 video_context_token=hf_processor.video_token)
 
         if self.info.supports_video:
@@ -901,6 +916,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.vision_model = self.get_vit_model_from_radio_config(config).to(
             self.language_model.config.torch_dtype)
 
+        self.tokenizer = cached_tokenizer_from_config(vllm_config.model_config)
+
         # Construct the vision projection.
         vit_hidden_size = config.vit_hidden_size
         vision_projection_hidden_size = config.projector_hidden_size
@@ -1035,6 +1052,75 @@ def _process_image_input(
         ]
         return image_embeds.split(image_feature_sizes)
 
+    def _process_video_input(
+        self, video_input: NanoNemotronVLVideoPixelInputs
+    ) -> tuple[torch.Tensor, ...]:
+        """Process video input and create final embeddings with video content
+        and indicator tokens."""
+        # Get video embeddings using the same processing as images
+        video_embeddings = self._process_image_input(video_input)
+
+        # Calculate video feature dimensions (number of frames and
+        #  their feature size (AKA tokens per frame))
+        num_patches = video_input["num_patches"][0].item()
+        assert video_embeddings[0].shape[0] % num_patches == 0
+        feature_size = video_embeddings[0].shape[0] // num_patches
+
+        # Create final embeddings that will replace placeholder embeddings
+        #  with video content and indicator tokens
+        final_video_embeddings = self._create_final_video_embeddings(
+            video_embeddings[0], feature_size, num_patches)
+
+        return (final_video_embeddings, )
+
+    def _create_final_video_embeddings(self, video_embeddings: torch.Tensor,
+                                       feature_size: int,
+                                       num_patches: int) -> torch.Tensor:
+        """Create final embeddings that combine video embeddings with
+        text embeddings of indicator tokens.
+        
+        These final embeddings contain:
+        - Actual video embeddings in positions corresponding to video content
+        - Text embeddings for indicator tokens (<img>, </img>, and 
+          frame separation text) in their respective positions
+        
+        These embeddings will replace the placeholder embeddings to create 
+        input_embeds for the LLM.
+        """
+        device = video_embeddings.device
+
+        # Generate video replacement text and convert to token IDs
+        video_repl_text = NanoNemotronVLProcessor.get_video_repl(
+            feature_size, num_patches, IMG_CONTEXT).full
+        repl_token_ids = torch.tensor(_seq2tokens(self.tokenizer,
+                                                  video_repl_text),
+                                      device=device)
+
+        # Get embedding token IDs for image context
+        embed_token_ids = torch.tensor(encode_tokens(self.tokenizer,
+                                                     IMG_CONTEXT),
+                                       device=device)
+
+        # Create mask for video embedding positions
+        is_video_embed = torch.isin(repl_token_ids, embed_token_ids)
+
+        # Initialize final embeddings tensor
+        final_video_embeddings = torch.empty(repl_token_ids.shape[0],
+                                             video_embeddings.shape[1],
+                                             dtype=video_embeddings.dtype,
+                                             device=device)
+
+        # Replace video embedding positions with actual video embeddings
+        final_video_embeddings[is_video_embed] = video_embeddings
+
+        # Replace non-video positions with language model embeddings.
+        # These are the indicator tokens
+        text_embeddings = self.language_model.get_input_embeddings(
+            repl_token_ids[~is_video_embed])
+        final_video_embeddings[~is_video_embed] = text_embeddings
+
+        return final_video_embeddings
+
     def _parse_and_validate_video_input(
             self,
             **kwargs: object) -> Optional[NanoNemotronVLVideoPixelInputs]:
@@ -1115,7 +1201,7 @@ def get_multimodal_embeddings(self,
                 multimodal_embeddings += vision_embeddings
             if modality == "videos":
                 video_input = modalities["videos"]
-                video_embeddings = self._process_image_input(video_input)
+                video_embeddings = self._process_video_input(video_input)
                 multimodal_embeddings += video_embeddings
 
         return multimodal_embeddings

From 69ea5b88dce0363ef3334979a72f4a5c4ca90f62 Mon Sep 17 00:00:00 2001
From: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
Date: Wed, 1 Oct 2025 00:43:40 +0300
Subject: [PATCH 007/193] support multiple videos in a batch (and better
 typehints)

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../model_executor/models/nano_nemotron_vl.py | 27 +++++++++++--------
 1 file changed, 16 insertions(+), 11 deletions(-)

diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index 3d93adc6ac54..28b39b8e7f82 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -1028,7 +1028,8 @@ def _parse_and_validate_image_input(
         raise AssertionError("This line should be unreachable.")
 
     def _process_image_input(
-            self, image_input: NanoNemotronVLImageInputs) -> torch.Tensor:
+            self, image_input: NanoNemotronVLImageInputs
+    ) -> tuple[torch.Tensor, ...]:
         if image_input["type"] == "image_embeds":
             return image_input["data"]
 
@@ -1060,18 +1061,22 @@ def _process_video_input(
         # Get video embeddings using the same processing as images
         video_embeddings = self._process_image_input(video_input)
 
-        # Calculate video feature dimensions (number of frames and
-        #  their feature size (AKA tokens per frame))
-        num_patches = video_input["num_patches"][0].item()
-        assert video_embeddings[0].shape[0] % num_patches == 0
-        feature_size = video_embeddings[0].shape[0] // num_patches
+        final_video_embeddings: tuple[torch.Tensor, ...] = ()
 
-        # Create final embeddings that will replace placeholder embeddings
-        #  with video content and indicator tokens
-        final_video_embeddings = self._create_final_video_embeddings(
-            video_embeddings[0], feature_size, num_patches)
+        # Calculate video feature dimensions (number of frames and
+        # their feature size (AKA tokens per frame))
+        # TODO: Maybe this can be optimized to avoid the loop?
+        for i, single_video_embeddings in enumerate(video_embeddings):
+            num_patches = video_input["num_patches"][i].item()
+            assert single_video_embeddings.shape[0] % num_patches == 0
+            feature_size = single_video_embeddings.shape[0] // num_patches
+
+            # Create final embeddings that will replace placeholder embeddings
+            # with video content and indicator tokens
+            final_video_embeddings += (self._create_final_video_embeddings(
+                single_video_embeddings, feature_size, num_patches), )
 
-        return (final_video_embeddings, )
+        return final_video_embeddings
 
     def _create_final_video_embeddings(self, video_embeddings: torch.Tensor,
                                        feature_size: int,

From 0adec4b430dfaade86656575a834b45e46c692a5 Mon Sep 17 00:00:00 2001
From: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
Date: Wed, 1 Oct 2025 00:50:33 +0300
Subject: [PATCH 008/193] Add EVS TODOs

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/nano_nemotron_vl.py | 10 +++++++++-
 1 file changed, 9 insertions(+), 1 deletion(-)

diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index 28b39b8e7f82..329b880f5c49 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -486,6 +486,7 @@ def get_image_repl(
 
         return PromptUpdateDetails.select_text(repl_full, IMG_CONTEXT)
 
+    # TODO (EVS): this method should get the number of tokens (AKA feature size) per frame, ant not assume it is equal across frames
     @classmethod
     def get_video_repl(
         cls,
@@ -788,7 +789,7 @@ def get_video_replacement_internvl(item_idx: int):
             if num_patches is not None:
                 assert isinstance(num_patches, int)
 
-            # # EVS-specific code
+            # # TODO: EVS-specific code here. This is basically copied from Qwen2-VL. Need to validate it.
             # video_pruning_rate = \
             #   self.info.ctx.get_mm_config().video_pruning_rate
             # if video_pruning_rate is not None and video_pruning_rate > 0.0:
@@ -1067,6 +1068,13 @@ def _process_video_input(
         # their feature size (AKA tokens per frame))
         # TODO: Maybe this can be optimized to avoid the loop?
         for i, single_video_embeddings in enumerate(video_embeddings):
+
+            # TODO (EVS): Add EVS code here. This is only a suggestion and maybe there's a better way to do it.
+            # Compute retention mask and prune the video embeddings.
+            # Then, pass number of retained tokens per frame to the _create_final_video_embeddings function,
+            # which will use it to create the video_repl_text with correct number of tokens per frame.
+            # EVS compute_retention_mask will need to change a bit, since we don't have here any THW data (although maybe it can be computed from num_patches and feature_size... I'm not sure)
+
             num_patches = video_input["num_patches"][i].item()
             assert single_video_embeddings.shape[0] % num_patches == 0
             feature_size = single_video_embeddings.shape[0] // num_patches

From d1a4d414f1ea3efbe667e52b9f24a786b2033c53 Mon Sep 17 00:00:00 2001
From: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
Date: Wed, 1 Oct 2025 01:24:36 +0300
Subject: [PATCH 009/193] access tokenizer only when needed instead of saving
 it as attribute of NemotronH_Nano_VL_V2

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/nano_nemotron_vl.py | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index 329b880f5c49..8d8c1f6dd73a 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -917,8 +917,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.vision_model = self.get_vit_model_from_radio_config(config).to(
             self.language_model.config.torch_dtype)
 
-        self.tokenizer = cached_tokenizer_from_config(vllm_config.model_config)
-
         # Construct the vision projection.
         vit_hidden_size = config.vit_hidden_size
         vision_projection_hidden_size = config.projector_hidden_size
@@ -943,6 +941,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.img_context_token_id = None
         self.video_context_token_id = None
         self.config = config
+        self.model_config = vllm_config.model_config
 
     def pixel_shuffle(self, x, scale_factor=0.5):
         n, w, h, c = x.size()
@@ -1105,7 +1104,8 @@ def _create_final_video_embeddings(self, video_embeddings: torch.Tensor,
         # Generate video replacement text and convert to token IDs
         video_repl_text = NanoNemotronVLProcessor.get_video_repl(
             feature_size, num_patches, IMG_CONTEXT).full
-        repl_token_ids = torch.tensor(_seq2tokens(self.tokenizer,
+        tokenizer = cached_tokenizer_from_config(self.model_config)
+        repl_token_ids = torch.tensor(_seq2tokens(tokenizer,
                                                   video_repl_text),
                                       device=device)
 

From a7417d05fdd81f375a9102a09849547e8e9d6607 Mon Sep 17 00:00:00 2001
From: Eugene Khvedchenia <ekhvedchenia@nvidia.com>
Date: Fri, 3 Oct 2025 17:35:18 +0300
Subject: [PATCH 010/193] Fix issue with using top-left tile instead of
 thumbnail tile

Signed-off-by: Eugene Khvedchenia <ekhvedchenia@nvidia.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../model_executor/models/nano_nemotron_vl.py | 87 ++++++++++++++-----
 1 file changed, 66 insertions(+), 21 deletions(-)

diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index 8d8c1f6dd73a..7a0065d71151 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -37,6 +37,7 @@
                                               init_vllm_registered_model,
                                               maybe_prefix)
 from vllm.multimodal import MULTIMODAL_REGISTRY
+from vllm.multimodal.evs import compute_retained_tokens_count
 from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
                                     MultiModalKwargs, MultiModalKwargsItems,
                                     NestedTensors)
@@ -203,6 +204,8 @@ def video_to_pixel_values(
     # with image path
     frames_tensors: list[torch.Tensor] = []
     for frame in video:
+        # (ekvhedchenia) TODO: we probably should not use tiling at all for videos as we take
+        # thumbnail tile of fixed size anyway
         pil_frame = dynamic_preprocess(
             Image.fromarray(frame, mode="RGB"),
             image_size=input_size,
@@ -212,7 +215,9 @@ def video_to_pixel_values(
         )
         # dynamic_preprocess returns tensors already; take the single tile
         assert len(pil_frame) >= 1
-        frames_tensors.append(pil_frame[0])
+        # frames_tensors.append(pil_frame[0])
+        # (ekvhedchenia) I think what we meant is take thumbnail tile (Which happen to be last one)
+        frames_tensors.append(pil_frame[-1])
 
     return torch.stack(frames_tensors)
 
@@ -435,6 +440,7 @@ def _preprocess_video(
 
                 video_repl = self.get_video_repl(self.num_image_token,
                                                  num_patches, self.video_token)
+
                 text = [t.replace('<video>', video_repl.full, 1) for t in text]
         return text, video_inputs
 
@@ -497,12 +503,48 @@ def get_video_repl(
         repl_features = video_context_token * feature_size
         repl_features_with_sep = IMG_START + repl_features + IMG_END
         # num_patches is equal to num_frames
+
+        # (ekhvedchenia) TODO: Not sure whether we should support this or not, but there is more complex prefix
+        # when video metadata is avaialble
+        #  https://gitlab-master.nvidia.com/charlwang/vlm-hf-code/-/blob/main/nano_vl_v2/processing.py?ref_type=heads#L171
         repl_full = ''.join([
             f'Frame{i+1}: {repl_features_with_sep}' for i in range(num_patches)
         ])
 
         return PromptUpdateDetails.select_text(repl_full, repl_full)
 
+    @classmethod
+    def get_video_repl_for_evs(
+        cls,
+        num_frames: int,
+        num_video_tokens: int,
+        video_context_token: str = IMG_CONTEXT,
+    ) -> PromptUpdateDetails[str]:
+        """
+        Build dummy prompt replacement for a video with EVS
+        Args:
+            num_frames (int): number of frames in video
+            num_video_tokens (int): total number of video tokens after pruning
+        """
+
+        # (ekhvedchenia) TODO: Not sure whether we should support this or not, but there is more complex prefix
+        # when video metadata is avaialble
+        #  https://gitlab-master.nvidia.com/charlwang/vlm-hf-code/-/blob/main/nano_vl_v2/processing.py?ref_type=heads#L171
+
+        # As we don't know actual pruning mask in this stage, we build dummy prompt replacement which has same
+        # total tokens length, but rearranged order of tokens.
+        # It starts with all the prefixes, then empty {IMG_START}{IMG_END},
+        # followed by video_context_token repeated num_video_tokens times.
+        prefixes = [
+            f'Frame{i + 1}: {IMG_START}{IMG_END}' for i in range(num_frames)
+        ]
+        placeholder_tokens = [video_context_token] * num_video_tokens
+        repl_full = ''.join(prefixes + placeholder_tokens)
+
+        # In the video postprocessing logic we will build a correct prompt replacement and ensure
+        # video embeddings has correct interleaving of prefix / video embeddings
+        return PromptUpdateDetails.select_text(repl_full, repl_full)
+
 
 class BaseNanoNemotronVLProcessingInfo(BaseProcessingInfo):
     """Basic image-only ProcessingInfo for InternVL-style models."""
@@ -789,21 +831,25 @@ def get_video_replacement_internvl(item_idx: int):
             if num_patches is not None:
                 assert isinstance(num_patches, int)
 
-            # # TODO: EVS-specific code here. This is basically copied from Qwen2-VL. Need to validate it.
-            # video_pruning_rate = \
-            #   self.info.ctx.get_mm_config().video_pruning_rate
-            # if video_pruning_rate is not None and video_pruning_rate > 0.0:
-            #     num_tokens = compute_retained_tokens_count(
-            #         feature_size,
-            #         num_patches,
-            #         video_pruning_rate,
-            #     )
-            # # End of EVS-specific code
-
-            return hf_processor.get_video_repl(
-                feature_size,  # number of tokens per frame
-                num_patches,  # number of frames
-                video_context_token=hf_processor.video_token)
+            video_pruning_rate = self.info.ctx.get_mm_config(
+            ).video_pruning_rate
+            if video_pruning_rate is not None and video_pruning_rate > 0.0:
+                # Start of EVS-specific code
+                num_tokens = compute_retained_tokens_count(
+                    tokens_per_frame=feature_size,
+                    num_frames=num_patches,
+                    q=video_pruning_rate,
+                )
+                return hf_processor.get_video_repl_for_evs(
+                    num_frames=num_patches,  # number of frames
+                    num_video_tokens=num_tokens,
+                    video_context_token=hf_processor.video_token)
+                # End of EVS-specific code
+            else:
+                return hf_processor.get_video_repl(
+                    feature_size,  # number of tokens per frame
+                    num_patches,  # number of frames
+                    video_context_token=hf_processor.video_token)
 
         if self.info.supports_video:
             prompt_repl = [
@@ -1072,7 +1118,8 @@ def _process_video_input(
             # Compute retention mask and prune the video embeddings.
             # Then, pass number of retained tokens per frame to the _create_final_video_embeddings function,
             # which will use it to create the video_repl_text with correct number of tokens per frame.
-            # EVS compute_retention_mask will need to change a bit, since we don't have here any THW data (although maybe it can be computed from num_patches and feature_size... I'm not sure)
+            # EVS compute_retention_mask will need to change a bit, since we don't have here any THW data
+            # (although maybe it can be computed from num_patches and feature_size... I'm not sure)
 
             num_patches = video_input["num_patches"][i].item()
             assert single_video_embeddings.shape[0] % num_patches == 0
@@ -1105,13 +1152,11 @@ def _create_final_video_embeddings(self, video_embeddings: torch.Tensor,
         video_repl_text = NanoNemotronVLProcessor.get_video_repl(
             feature_size, num_patches, IMG_CONTEXT).full
         tokenizer = cached_tokenizer_from_config(self.model_config)
-        repl_token_ids = torch.tensor(_seq2tokens(tokenizer,
-                                                  video_repl_text),
+        repl_token_ids = torch.tensor(_seq2tokens(tokenizer, video_repl_text),
                                       device=device)
 
         # Get embedding token IDs for image context
-        embed_token_ids = torch.tensor(encode_tokens(self.tokenizer,
-                                                     IMG_CONTEXT),
+        embed_token_ids = torch.tensor(encode_tokens(tokenizer, IMG_CONTEXT),
                                        device=device)
 
         # Create mask for video embedding positions

From 20fbfd735b10735e32caf532f41be4f08117c4bb Mon Sep 17 00:00:00 2001
From: Eugene Khvedchenia <ekhvedchenia@nvidia.com>
Date: Sat, 4 Oct 2025 00:18:23 +0300
Subject: [PATCH 011/193] Seemingly working version of Nano 2 with EVS

Signed-off-by: Eugene Khvedchenia <ekhvedchenia@nvidia.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../model_executor/models/nano_nemotron_vl.py | 112 ++++++----
 vllm/multimodal/evs.py                        |  11 +-
 vllm_run_nano.py                              | 204 ++++++++++++++++++
 3 files changed, 281 insertions(+), 46 deletions(-)
 create mode 100644 vllm_run_nano.py

diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index 7a0065d71151..649eba063cfe 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -37,7 +37,8 @@
                                               init_vllm_registered_model,
                                               maybe_prefix)
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.evs import compute_retained_tokens_count
+from vllm.multimodal.evs import (compute_retained_tokens_count,
+                                 compute_retention_mask)
 from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
                                     MultiModalKwargs, MultiModalKwargsItems,
                                     NestedTensors)
@@ -435,11 +436,31 @@ def _preprocess_video(
                 torch.tensor([len(item) for item in pixel_values_lst_video]),
             }
 
-            for pixel_values in pixel_values_lst_video:
-                num_patches = pixel_values.shape[0]
+            image_size: int = self.config.force_image_size
+            patch_size: int = self.config.patch_size
+            downsample_ratio = self.config.downsample_ratio
+            tokens_per_frame = int((image_size * image_size // patch_size**2) *
+                                   (downsample_ratio**2))
+            video_pruning_rate = 0.75  # TODO
 
-                video_repl = self.get_video_repl(self.num_image_token,
-                                                 num_patches, self.video_token)
+            for pixel_values in pixel_values_lst_video:
+                num_frames = pixel_values.shape[0]
+
+                if video_pruning_rate is not None and video_pruning_rate > 0.0:
+                    # Start of EVS-specific code
+                    num_tokens = compute_retained_tokens_count(
+                        tokens_per_frame=tokens_per_frame,
+                        num_frames=num_frames,
+                        q=video_pruning_rate,
+                    )
+                    video_repl = self.get_dummy_video_repl_for_evs(
+                        num_frames=num_frames,  # number of frames
+                        num_video_tokens=num_tokens,
+                        #video_context_token=self.hf_processor.video_token
+                    )
+                    # End of EVS-specific code
+                else:
+                    raise NotImplementedError("TODO")
 
                 text = [t.replace('<video>', video_repl.full, 1) for t in text]
         return text, video_inputs
@@ -492,29 +513,30 @@ def get_image_repl(
 
         return PromptUpdateDetails.select_text(repl_full, IMG_CONTEXT)
 
-    # TODO (EVS): this method should get the number of tokens (AKA feature size) per frame, ant not assume it is equal across frames
     @classmethod
-    def get_video_repl(
+    def get_real_video_repl_for_evs(
         cls,
-        feature_size: int,
-        num_patches: int,
+        num_video_tokens_per_frame: torch.Tensor,
         video_context_token: str = IMG_CONTEXT,
     ) -> PromptUpdateDetails[str]:
-        repl_features = video_context_token * feature_size
-        repl_features_with_sep = IMG_START + repl_features + IMG_END
-        # num_patches is equal to num_frames
-
-        # (ekhvedchenia) TODO: Not sure whether we should support this or not, but there is more complex prefix
-        # when video metadata is avaialble
-        #  https://gitlab-master.nvidia.com/charlwang/vlm-hf-code/-/blob/main/nano_vl_v2/processing.py?ref_type=heads#L171
-        repl_full = ''.join([
-            f'Frame{i+1}: {repl_features_with_sep}' for i in range(num_patches)
-        ])
+        """
+        Build a real prompt replacement for a video with EVS, after we ran EVS and know the
+        number of vision tokens to retain in each frame
+        Args:
+            num_video_tokens_per_frame (T): total number of video tokens per frame each frame
+        """
+        repl_full = [
+            f'Frame{i + 1}: {IMG_START}{video_context_token * num_tokens}{IMG_END}'
+            for i, num_tokens in enumerate(num_video_tokens_per_frame.tolist())
+        ]
+        repl_full = ''.join(repl_full)
 
+        # In the video postprocessing logic we will build a correct prompt replacement and ensure
+        # video embeddings has correct interleaving of prefix / video embeddings
         return PromptUpdateDetails.select_text(repl_full, repl_full)
 
     @classmethod
-    def get_video_repl_for_evs(
+    def get_dummy_video_repl_for_evs(
         cls,
         num_frames: int,
         num_video_tokens: int,
@@ -840,16 +862,14 @@ def get_video_replacement_internvl(item_idx: int):
                     num_frames=num_patches,
                     q=video_pruning_rate,
                 )
-                return hf_processor.get_video_repl_for_evs(
+                return hf_processor.get_dummy_video_repl_for_evs(
                     num_frames=num_patches,  # number of frames
                     num_video_tokens=num_tokens,
                     video_context_token=hf_processor.video_token)
                 # End of EVS-specific code
             else:
-                return hf_processor.get_video_repl(
-                    feature_size,  # number of tokens per frame
-                    num_patches,  # number of frames
-                    video_context_token=hf_processor.video_token)
+                raise NotImplementedError(
+                    "Implement default prompt replacement without EVS")
 
         if self.info.supports_video:
             prompt_repl = [
@@ -944,7 +964,7 @@ def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
-
+        multimodal_config = vllm_config.model_config.multimodal_config
         image_size = config.force_image_size
         patch_size = config.patch_size
         self.patch_size = patch_size
@@ -954,7 +974,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.downsample_ratio = config.downsample_ratio
         self.ps_version = config.ps_version
         self.image_tag_type = config.image_tag_type
-
+        self.video_pruning_rate = multimodal_config.video_pruning_rate
         self.language_model = init_vllm_registered_model(
             vllm_config=vllm_config,
             hf_config=config.text_config,
@@ -1109,32 +1129,42 @@ def _process_video_input(
 
         final_video_embeddings: tuple[torch.Tensor, ...] = ()
 
+        image_rows = image_cols = self.config.force_image_size
+        downsample_ratio = self.config.downsample_ratio
+        patch_size = self.config.patch_size
+        rows = int(image_rows * downsample_ratio // patch_size)
+        cols = int(image_cols * downsample_ratio // patch_size)
+        video_pruning_rate = self.video_pruning_rate
+
         # Calculate video feature dimensions (number of frames and
         # their feature size (AKA tokens per frame))
         # TODO: Maybe this can be optimized to avoid the loop?
         for i, single_video_embeddings in enumerate(video_embeddings):
 
-            # TODO (EVS): Add EVS code here. This is only a suggestion and maybe there's a better way to do it.
-            # Compute retention mask and prune the video embeddings.
-            # Then, pass number of retained tokens per frame to the _create_final_video_embeddings function,
-            # which will use it to create the video_repl_text with correct number of tokens per frame.
-            # EVS compute_retention_mask will need to change a bit, since we don't have here any THW data
-            # (although maybe it can be computed from num_patches and feature_size... I'm not sure)
+            num_frames = video_input["num_patches"][i].item()
+            assert single_video_embeddings.shape[0] % num_frames == 0
+
+            retention_mask = compute_retention_mask(
+                single_video_embeddings,
+                video_size_thw=torch.tensor([num_frames, rows, cols]),
+                spatial_merge_size=1,
+                q=video_pruning_rate)
 
-            num_patches = video_input["num_patches"][i].item()
-            assert single_video_embeddings.shape[0] % num_patches == 0
-            feature_size = single_video_embeddings.shape[0] // num_patches
+            retention_mask_thw = retention_mask.reshape(num_frames, rows, cols)
+            # [T] where each value is number of retained tokens in a given frame
+            num_tokens_per_frame = retention_mask_thw.sum(dim=(1, 2)).long()
 
             # Create final embeddings that will replace placeholder embeddings
             # with video content and indicator tokens
             final_video_embeddings += (self._create_final_video_embeddings(
-                single_video_embeddings, feature_size, num_patches), )
+                single_video_embeddings[retention_mask], num_tokens_per_frame,
+                num_frames), )
 
         return final_video_embeddings
 
     def _create_final_video_embeddings(self, video_embeddings: torch.Tensor,
-                                       feature_size: int,
-                                       num_patches: int) -> torch.Tensor:
+                                       num_tokens_per_frame: torch.Tensor,
+                                       num_frames: int) -> torch.Tensor:
         """Create final embeddings that combine video embeddings with
         text embeddings of indicator tokens.
         
@@ -1149,8 +1179,8 @@ def _create_final_video_embeddings(self, video_embeddings: torch.Tensor,
         device = video_embeddings.device
 
         # Generate video replacement text and convert to token IDs
-        video_repl_text = NanoNemotronVLProcessor.get_video_repl(
-            feature_size, num_patches, IMG_CONTEXT).full
+        video_repl_text = NanoNemotronVLProcessor.get_real_video_repl_for_evs(
+            num_tokens_per_frame, IMG_CONTEXT).full
         tokenizer = cached_tokenizer_from_config(self.model_config)
         repl_token_ids = torch.tensor(_seq2tokens(tokenizer, video_repl_text),
                                       device=device)
diff --git a/vllm/multimodal/evs.py b/vllm/multimodal/evs.py
index 79f1f4f88aea..6f5a1b49d2d8 100644
--- a/vllm/multimodal/evs.py
+++ b/vllm/multimodal/evs.py
@@ -9,6 +9,7 @@
 # license agreement from NVIDIA CORPORATION is strictly prohibited.
 
 import typing
+from typing import Tuple, Union
 
 import torch
 
@@ -36,7 +37,7 @@ def compute_retained_tokens_count(tokens_per_frame: int, num_frames: int,
 
 def compute_retention_mask(
     video_embeds: torch.Tensor,
-    video_size_thw: torch.LongTensor,
+    video_size_thw: Union[torch.LongTensor, Tuple[int, int, int]],
     spatial_merge_size: int,
     q: float,
 ) -> torch.Tensor:
@@ -55,7 +56,7 @@ def compute_retention_mask(
         `torch.Tensor`: The retention mask for the video embeddings of
             `(T * H * W // spatial_merge_size ^ 2)` shape.
     """
-    T, H, W = video_size_thw
+    T, H, W = map(int, video_size_thw)
 
     # Use reshape instead of einops to avoid graph breaks
     video_embeds = video_embeds.reshape(
@@ -64,7 +65,7 @@ def compute_retention_mask(
         W // spatial_merge_size,
         video_embeds.size(-1),
     )
-
+    tokens_per_frame = (H // spatial_merge_size) * (W // spatial_merge_size)
     # Core EVS
     similarity = torch.nn.functional.cosine_similarity(video_embeds[1:, ...],
                                                        video_embeds[:-1, ...],
@@ -81,8 +82,8 @@ def compute_retention_mask(
                           dim=-1,
                           descending=True,
                           stable=True)
-    retain_num_tokens = compute_retained_tokens_count(video_size_thw,
-                                                      spatial_merge_size, q)
+    retain_num_tokens = compute_retained_tokens_count(
+        tokens_per_frame=tokens_per_frame, num_frames=T, q=q)
     topk_indices = order[:retain_num_tokens]
 
     retention_mask = torch.zeros_like(dissimilarity_flat, dtype=torch.bool)
diff --git a/vllm_run_nano.py b/vllm_run_nano.py
new file mode 100644
index 000000000000..90ea50b1d9da
--- /dev/null
+++ b/vllm_run_nano.py
@@ -0,0 +1,204 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import base64
+import io
+
+import decord
+import numpy as np
+from PIL import Image
+from transformers import AutoProcessor, AutoTokenizer
+from transformers.video_utils import VideoMetadata
+
+from vllm import LLM, SamplingParams
+
+
+def main():
+    model_path = "/home/ekhvedchenia/vlm-hf-code/nano_vl_v2"
+
+    tokenizer = AutoTokenizer.from_pretrained(model_path)
+    processor = AutoProcessor.from_pretrained(model_path,
+                                              trust_remote_code=True)
+
+    sampling_params = SamplingParams(temperature=0, max_tokens=1024)
+
+    video_path = "AdobeStock_726045803.mov"
+    video_fps = 1
+    video_nframe = 32
+    video_nframe_max = -1
+
+    # Get frames and metadata
+    image_urls, metadata = sample_video_frames_to_data_urls(
+        video_path,
+        fps=max(0, int(video_fps)),
+        nframe=max(0, int(video_nframe)),
+        nframe_max=int(video_nframe_max),
+    )
+    frames = [pil_image_from_base64(image_url) for image_url in image_urls]
+
+    print(f"Metadata: {metadata}")
+
+    messages = [{
+        "role": "system",
+        "content": "/no_think"
+    }, {
+        "role":
+        "user",
+        "content": [
+            {
+                "type": "video",
+                "video": f"file://{video_path}",
+            },
+            {
+                "type": "text",
+                "text": "\nDescribe what you see.",
+            },
+        ],
+    }]
+    prompt = tokenizer.apply_chat_template(messages,
+                                           tokenize=False,
+                                           add_generation_prompt=True)
+
+    # Process with FPS metadata
+    if metadata:
+        inputs = processor(
+            text=[prompt],
+            videos=frames,
+            videos_kwargs={'video_metadata': metadata},
+            return_tensors="pt",
+        )
+    else:
+        inputs = processor(
+            text=[prompt],
+            videos=frames,
+            return_tensors="pt",
+        )
+
+    #video_pixels = inputs.data["pixel_values_video"]
+
+    video_pixels = np.random.randint(0,
+                                     255, (20, 640, 1024, 3),
+                                     dtype=np.uint8)
+    metadata = None
+
+    llm = LLM(
+        model_path,
+        trust_remote_code=True,
+        enforce_eager=True,
+        video_pruning_rate=0.75,
+    )
+
+    llm_inputs = {
+        "prompt": prompt,
+        "multi_modal_data": {
+            "video": (video_pixels, metadata)
+        },
+    }
+
+    outputs = llm.generate([llm_inputs], sampling_params=sampling_params)
+    generated_text = outputs[0].outputs[0].text
+    print(generated_text)
+
+
+def sample_video_frames_to_data_urls(video_path_local,
+                                     fps=1,
+                                     nframe=0,
+                                     nframe_max=-1):
+    """
+    Sample frames from a video and return base64-encoded data URLs along with metadata.
+
+    Args:
+        video_path_local: Path to the video file
+        fps: Target frames per second for sampling (if > 0, uses fps-based sampling)
+        nframe: Number of frames to sample (used if fps <= 0)
+        nframe_max: Maximum number of frames to sample
+
+    Returns:
+        tuple: (frame_data_urls, metadata)
+        - frame_data_urls: List of base64-encoded frame images
+        - metadata: VideoMetadata dataclass containing info about the sampled frames:
+            - total_num_frames: Number of sampled frames
+            - fps: Effective frame rate of the sampled frames
+            - duration: Duration covered by the sampled frames (in seconds)
+            - video_backend: Backend used for video processing ('decord')
+    """
+    import numpy as np
+    from PIL import Image
+
+    vid = decord.VideoReader(video_path_local)
+    total_frames = len(vid)
+    video_fps = vid.get_avg_fps()
+    total_duration = total_frames / max(1e-6, video_fps)
+
+    if fps > 0:
+        required_frames = int(total_duration * fps)
+        desired_frames = max(1, required_frames)
+        if nframe_max > 0 and desired_frames > nframe_max:
+            desired_frames = nframe_max
+        if desired_frames >= total_frames:
+            indices = list(range(total_frames))
+        elif desired_frames == 1:
+            indices = [0]  # Always use first frame for single frame sampling
+        else:
+            # Generate evenly spaced indices and ensure uniqueness
+            raw_indices = np.linspace(0, total_frames - 1, desired_frames)
+            indices = list(np.unique(np.round(raw_indices).astype(int)))
+    else:
+        desired_frames = max(1, int(nframe) if nframe and nframe > 0 else 8)
+        if nframe_max > 0 and desired_frames > nframe_max:
+            desired_frames = nframe_max
+        if desired_frames >= total_frames:
+            indices = list(range(total_frames))
+        elif desired_frames == 1:
+            indices = [0]  # Always use first frame for single frame sampling
+        else:
+            # Generate evenly spaced indices and ensure uniqueness
+            raw_indices = np.linspace(0, total_frames - 1, desired_frames)
+            indices = list(np.unique(np.round(raw_indices).astype(int)))
+
+    images = [Image.fromarray(vid[i].asnumpy()) for i in indices]
+    frame_urls = [encode_pil_to_jpeg_data_url(im) for im in images]
+
+    # Calculate timestamps for each sampled frame
+    timestamps = [float(idx) / video_fps for idx in indices]
+
+    # Calculate metadata for the sampled frames
+    sampled_num_frames = len(indices)
+
+    # Duration is the time span from first to last frame
+    if len(timestamps) > 1:
+        sampled_duration = timestamps[-1] - timestamps[0]
+        sampled_fps = (sampled_num_frames -
+                       1) / sampled_duration if sampled_duration > 0 else 1.0
+    else:
+        # Single frame case
+        sampled_duration = None
+        sampled_fps = None
+
+    metadata = VideoMetadata(
+        total_num_frames=sampled_num_frames,
+        fps=sampled_fps,
+        duration=sampled_duration,
+        video_backend=None,
+    )
+
+    return frame_urls, metadata
+
+
+def encode_pil_to_jpeg_data_url(pil_image):
+    from io import BytesIO
+    buf = BytesIO()
+    pil_image.save(buf, format="JPEG")
+    b64 = base64.b64encode(buf.getvalue()).decode("utf-8")
+    return f"data:image/jpeg;base64,{b64}"
+
+
+def pil_image_from_base64(b64_str: str) -> Image.Image:
+    # Handle data URLs like "data:image/png;base64,...."
+    if b64_str.startswith('data:'):
+        b64_str = b64_str.split(',', 1)[1]
+    img_bytes = base64.b64decode(b64_str)
+    return Image.open(io.BytesIO(img_bytes))
+
+
+if __name__ == "__main__":
+    main()

From 46a284718556fbac193c7ad190e666416292ab38 Mon Sep 17 00:00:00 2001
From: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
Date: Sun, 5 Oct 2025 23:23:24 +0300
Subject: [PATCH 012/193] remove debug script

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm_run_nano.py | 204 -----------------------------------------------
 1 file changed, 204 deletions(-)
 delete mode 100644 vllm_run_nano.py

diff --git a/vllm_run_nano.py b/vllm_run_nano.py
deleted file mode 100644
index 90ea50b1d9da..000000000000
--- a/vllm_run_nano.py
+++ /dev/null
@@ -1,204 +0,0 @@
-# SPDX-License-Identifier: Apache-2.0
-# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-import base64
-import io
-
-import decord
-import numpy as np
-from PIL import Image
-from transformers import AutoProcessor, AutoTokenizer
-from transformers.video_utils import VideoMetadata
-
-from vllm import LLM, SamplingParams
-
-
-def main():
-    model_path = "/home/ekhvedchenia/vlm-hf-code/nano_vl_v2"
-
-    tokenizer = AutoTokenizer.from_pretrained(model_path)
-    processor = AutoProcessor.from_pretrained(model_path,
-                                              trust_remote_code=True)
-
-    sampling_params = SamplingParams(temperature=0, max_tokens=1024)
-
-    video_path = "AdobeStock_726045803.mov"
-    video_fps = 1
-    video_nframe = 32
-    video_nframe_max = -1
-
-    # Get frames and metadata
-    image_urls, metadata = sample_video_frames_to_data_urls(
-        video_path,
-        fps=max(0, int(video_fps)),
-        nframe=max(0, int(video_nframe)),
-        nframe_max=int(video_nframe_max),
-    )
-    frames = [pil_image_from_base64(image_url) for image_url in image_urls]
-
-    print(f"Metadata: {metadata}")
-
-    messages = [{
-        "role": "system",
-        "content": "/no_think"
-    }, {
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "video",
-                "video": f"file://{video_path}",
-            },
-            {
-                "type": "text",
-                "text": "\nDescribe what you see.",
-            },
-        ],
-    }]
-    prompt = tokenizer.apply_chat_template(messages,
-                                           tokenize=False,
-                                           add_generation_prompt=True)
-
-    # Process with FPS metadata
-    if metadata:
-        inputs = processor(
-            text=[prompt],
-            videos=frames,
-            videos_kwargs={'video_metadata': metadata},
-            return_tensors="pt",
-        )
-    else:
-        inputs = processor(
-            text=[prompt],
-            videos=frames,
-            return_tensors="pt",
-        )
-
-    #video_pixels = inputs.data["pixel_values_video"]
-
-    video_pixels = np.random.randint(0,
-                                     255, (20, 640, 1024, 3),
-                                     dtype=np.uint8)
-    metadata = None
-
-    llm = LLM(
-        model_path,
-        trust_remote_code=True,
-        enforce_eager=True,
-        video_pruning_rate=0.75,
-    )
-
-    llm_inputs = {
-        "prompt": prompt,
-        "multi_modal_data": {
-            "video": (video_pixels, metadata)
-        },
-    }
-
-    outputs = llm.generate([llm_inputs], sampling_params=sampling_params)
-    generated_text = outputs[0].outputs[0].text
-    print(generated_text)
-
-
-def sample_video_frames_to_data_urls(video_path_local,
-                                     fps=1,
-                                     nframe=0,
-                                     nframe_max=-1):
-    """
-    Sample frames from a video and return base64-encoded data URLs along with metadata.
-
-    Args:
-        video_path_local: Path to the video file
-        fps: Target frames per second for sampling (if > 0, uses fps-based sampling)
-        nframe: Number of frames to sample (used if fps <= 0)
-        nframe_max: Maximum number of frames to sample
-
-    Returns:
-        tuple: (frame_data_urls, metadata)
-        - frame_data_urls: List of base64-encoded frame images
-        - metadata: VideoMetadata dataclass containing info about the sampled frames:
-            - total_num_frames: Number of sampled frames
-            - fps: Effective frame rate of the sampled frames
-            - duration: Duration covered by the sampled frames (in seconds)
-            - video_backend: Backend used for video processing ('decord')
-    """
-    import numpy as np
-    from PIL import Image
-
-    vid = decord.VideoReader(video_path_local)
-    total_frames = len(vid)
-    video_fps = vid.get_avg_fps()
-    total_duration = total_frames / max(1e-6, video_fps)
-
-    if fps > 0:
-        required_frames = int(total_duration * fps)
-        desired_frames = max(1, required_frames)
-        if nframe_max > 0 and desired_frames > nframe_max:
-            desired_frames = nframe_max
-        if desired_frames >= total_frames:
-            indices = list(range(total_frames))
-        elif desired_frames == 1:
-            indices = [0]  # Always use first frame for single frame sampling
-        else:
-            # Generate evenly spaced indices and ensure uniqueness
-            raw_indices = np.linspace(0, total_frames - 1, desired_frames)
-            indices = list(np.unique(np.round(raw_indices).astype(int)))
-    else:
-        desired_frames = max(1, int(nframe) if nframe and nframe > 0 else 8)
-        if nframe_max > 0 and desired_frames > nframe_max:
-            desired_frames = nframe_max
-        if desired_frames >= total_frames:
-            indices = list(range(total_frames))
-        elif desired_frames == 1:
-            indices = [0]  # Always use first frame for single frame sampling
-        else:
-            # Generate evenly spaced indices and ensure uniqueness
-            raw_indices = np.linspace(0, total_frames - 1, desired_frames)
-            indices = list(np.unique(np.round(raw_indices).astype(int)))
-
-    images = [Image.fromarray(vid[i].asnumpy()) for i in indices]
-    frame_urls = [encode_pil_to_jpeg_data_url(im) for im in images]
-
-    # Calculate timestamps for each sampled frame
-    timestamps = [float(idx) / video_fps for idx in indices]
-
-    # Calculate metadata for the sampled frames
-    sampled_num_frames = len(indices)
-
-    # Duration is the time span from first to last frame
-    if len(timestamps) > 1:
-        sampled_duration = timestamps[-1] - timestamps[0]
-        sampled_fps = (sampled_num_frames -
-                       1) / sampled_duration if sampled_duration > 0 else 1.0
-    else:
-        # Single frame case
-        sampled_duration = None
-        sampled_fps = None
-
-    metadata = VideoMetadata(
-        total_num_frames=sampled_num_frames,
-        fps=sampled_fps,
-        duration=sampled_duration,
-        video_backend=None,
-    )
-
-    return frame_urls, metadata
-
-
-def encode_pil_to_jpeg_data_url(pil_image):
-    from io import BytesIO
-    buf = BytesIO()
-    pil_image.save(buf, format="JPEG")
-    b64 = base64.b64encode(buf.getvalue()).decode("utf-8")
-    return f"data:image/jpeg;base64,{b64}"
-
-
-def pil_image_from_base64(b64_str: str) -> Image.Image:
-    # Handle data URLs like "data:image/png;base64,...."
-    if b64_str.startswith('data:'):
-        b64_str = b64_str.split(',', 1)[1]
-    img_bytes = base64.b64decode(b64_str)
-    return Image.open(io.BytesIO(img_bytes))
-
-
-if __name__ == "__main__":
-    main()

From f9bf392829a02e6668b254b41d692bf3c55246a9 Mon Sep 17 00:00:00 2001
From: youkaichao <youkaichao@gmail.com>
Date: Mon, 29 Sep 2025 17:51:43 +0800
Subject: [PATCH 013/193] update to latest deepgemm for dsv3.2 (#25871)

Signed-off-by: youkaichao <youkaichao@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docker/Dockerfile         | 2 +-
 tools/install_deepgemm.sh | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/docker/Dockerfile b/docker/Dockerfile
index 62be0a12e988..a6b24f69f64e 100644
--- a/docker/Dockerfile
+++ b/docker/Dockerfile
@@ -456,7 +456,7 @@ RUN --mount=type=cache,target=/root/.cache/uv \
 ARG DEEPGEMM_GIT_REF
 COPY tools/install_deepgemm.sh /tmp/install_deepgemm.sh
 RUN --mount=type=cache,target=/root/.cache/uv \
-    VLLM_DOCKER_BUILD_CONTEXT=1 /tmp/install_deepgemm.sh --cuda-version "${CUDA_VERSION}" ${DEEPGEMM_GIT_REF:+--ref "$DEEPGEMM_GIT_REF"} 
+    VLLM_DOCKER_BUILD_CONTEXT=1 TORCH_CUDA_ARCH_LIST="9.0a 10.0a" /tmp/install_deepgemm.sh --cuda-version "${CUDA_VERSION}" ${DEEPGEMM_GIT_REF:+--ref "$DEEPGEMM_GIT_REF"}
 
 COPY tools/install_gdrcopy.sh install_gdrcopy.sh
 RUN set -eux; \
diff --git a/tools/install_deepgemm.sh b/tools/install_deepgemm.sh
index 98427f1835ec..4f2cd302c3ef 100755
--- a/tools/install_deepgemm.sh
+++ b/tools/install_deepgemm.sh
@@ -6,7 +6,7 @@ set -e
 
 # Default values
 DEEPGEMM_GIT_REPO="https://github.com/deepseek-ai/DeepGEMM.git"
-DEEPGEMM_GIT_REF="ea9c5d9270226c5dd7a577c212e9ea385f6ef048"
+DEEPGEMM_GIT_REF="594953acce41793ae00a1233eb516044d604bcb6"
 
 # Parse command line arguments
 while [[ $# -gt 0 ]]; do

From 800382849d5363ee0cf7d20ecde81dc8a3c9085d Mon Sep 17 00:00:00 2001
From: Yingjun Mou <renzomou@gmail.com>
Date: Mon, 29 Sep 2025 03:49:35 -0700
Subject: [PATCH 014/193] [Bugfix] Fix requirements paths in install
 instructions (#25827)

Signed-off-by: yingjun-mou <renzomou@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/getting_started/installation/cpu/s390x.inc.md | 12 ++++++------
 1 file changed, 6 insertions(+), 6 deletions(-)

diff --git a/docs/getting_started/installation/cpu/s390x.inc.md b/docs/getting_started/installation/cpu/s390x.inc.md
index f9c4ccb942fa..442c2b4ec64e 100644
--- a/docs/getting_started/installation/cpu/s390x.inc.md
+++ b/docs/getting_started/installation/cpu/s390x.inc.md
@@ -46,22 +46,22 @@ Execute the following commands to build and install vLLM from source.
     Please build the following dependencies, `torchvision`, `pyarrow` from source before building vLLM.
 
 ```bash
-    sed -i '/^torch/d' requirements-build.txt    # remove torch from requirements-build.txt since we use nightly builds
+    sed -i '/^torch/d' requirements/build.txt    # remove torch from requirements/build.txt since we use nightly builds
     uv pip install -v \
         --torch-backend auto \
-        -r requirements-build.txt \
-        -r requirements-cpu.txt \
+        -r requirements/build.txt \
+        -r requirements/cpu.txt \
     VLLM_TARGET_DEVICE=cpu python setup.py bdist_wheel && \
         uv pip install dist/*.whl
 ```
 
 ??? console "pip"
     ```bash
-        sed -i '/^torch/d' requirements-build.txt    # remove torch from requirements-build.txt since we use nightly builds
+        sed -i '/^torch/d' requirements/build.txt    # remove torch from requirements/build.txt since we use nightly builds
         pip install -v \
             --extra-index-url https://download.pytorch.org/whl/nightly/cpu \
-            -r requirements-build.txt \
-            -r requirements-cpu.txt \
+            -r requirements/build.txt \
+            -r requirements/cpu.txt \
         VLLM_TARGET_DEVICE=cpu python setup.py bdist_wheel && \
             pip install dist/*.whl
     ```

From d4dc907780d2daa6c466b6da4ad6eb1612bfcdcd Mon Sep 17 00:00:00 2001
From: Zhou Jiahao <me@zhoukz.com>
Date: Mon, 29 Sep 2025 18:59:04 +0800
Subject: [PATCH 015/193] [Model][Bugfix] Fix issues in MiDashengLM
 implementation for quantized models (#25854)

Signed-off-by: zhoukz <me@zhoukz.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/midashenglm.py | 193 ++++++++++++++--------
 1 file changed, 122 insertions(+), 71 deletions(-)

diff --git a/vllm/model_executor/models/midashenglm.py b/vllm/model_executor/models/midashenglm.py
index 0bf04e0e7e2f..0b62fbd40b07 100644
--- a/vllm/model_executor/models/midashenglm.py
+++ b/vllm/model_executor/models/midashenglm.py
@@ -22,6 +22,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only MiDashengLM model compatible with HuggingFace weights."""
+
 import collections
 import collections.abc
 from collections.abc import Iterable, Mapping, Sequence
@@ -30,10 +31,10 @@
 import numpy as np
 import torch
 import torch.nn as nn
-import torchaudio.transforms as audio_transforms
+import torchaudio.functional as F
+from torch.nn.functional import scaled_dot_product_attention
 from transformers import BatchFeature
 
-from vllm.attention.layer import MultiHeadAttention
 from vllm.config import VllmConfig
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
@@ -41,7 +42,6 @@
                                                QKVParallelLinear,
                                                RowParallelLinear)
 from vllm.model_executor.layers.quantization import QuantizationConfig
-from vllm.model_executor.model_loader.utils import set_default_torch_dtype
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
                                     MultiModalKwargsItems)
@@ -147,15 +147,19 @@ def __init__(
         super().__init__()
         out_features = out_features or in_features
         hidden_features = hidden_features or in_features
-        self.fc1 = ColumnParallelLinear(input_size=in_features,
-                                        output_size=hidden_features,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.fc1")
+        self.fc1 = ColumnParallelLinear(
+            input_size=in_features,
+            output_size=hidden_features,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc1",
+        )
         self.act = get_act_fn("gelu")
-        self.fc2 = RowParallelLinear(input_size=hidden_features,
-                                     output_size=out_features,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.fc2")
+        self.fc2 = RowParallelLinear(
+            input_size=hidden_features,
+            output_size=out_features,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc2",
+        )
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         x, _ = self.fc1(x)
@@ -171,7 +175,6 @@ def __init__(
         dim: int,
         num_heads: int = 8,
         qkv_bias: bool = False,
-        causal: bool = False,
         quant_config: Optional[QuantizationConfig] = None,
         prefix: str = "",
     ):
@@ -205,33 +208,30 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.qkv",
         )
-        self.attn = MultiHeadAttention(
-            self.num_heads,
-            self.head_dim,
-            self.scale,
-            num_kv_heads=self.num_kv_heads,
-        )
         self.proj = RowParallelLinear(
             input_size=dim,
             output_size=dim,
             quant_config=quant_config,
             prefix=f"{prefix}.proj",
         )
-        self.causal = causal
 
     def forward(self, x: torch.Tensor, mask: Optional[torch.Tensor] = None):
         B, N, C = x.shape
 
-        qkv_out, _ = self.qkv(x)
-        q, k, v = qkv_out.split([self.q_size, self.kv_size, self.kv_size],
-                                dim=-1)
+        qkv, _ = self.qkv(x)
+        qkv = qkv.reshape(B, N, 3, self.num_heads, C // self.num_heads)
+        qkv = qkv.permute(2, 0, 3, 1, 4)
+        q, k, v = qkv.unbind(0)
 
-        attn_out = self.attn(q, k, v)
-        C_local = attn_out.numel() // (B * N)  # C_local for parallel
-        attn_out = attn_out.view(B, N, C_local)
-
-        x, _ = self.proj(attn_out)
+        x = scaled_dot_product_attention(
+            q,
+            k,
+            v,
+            attn_mask=mask[:, None, None, :] if mask is not None else None,
+        )
 
+        x = x.transpose(1, 2).reshape(B, N, C)
+        x, _ = self.proj(x)
         return x
 
 
@@ -280,6 +280,63 @@ def forward(
         return x
 
 
+class DashengFrontend(nn.Module):
+
+    def __init__(self, config: DashengConfig):
+        super().__init__()
+        self.config = config
+
+        spectrogram_window = torch.hann_window(self.config.win_length)
+        self.register_buffer(
+            "spectrogram_window",
+            spectrogram_window,
+            persistent=False,
+        )
+        self.spectrogram_window: torch.Tensor
+
+        melscale_fbanks = F.melscale_fbanks(
+            n_freqs=self.config.n_fft // 2 + 1,
+            f_min=self.config.f_min,
+            f_max=self.config.f_max,
+            n_mels=self.config.n_mels,
+            sample_rate=self.config.sample_rate,
+        )
+        self.register_buffer("melscale_fbanks",
+                             melscale_fbanks,
+                             persistent=False)
+        self.melscale_fbanks: torch.Tensor
+
+    def forward(self, waveform: torch.Tensor) -> torch.Tensor:
+        spectrogram = F.spectrogram(
+            waveform=waveform.to(torch.float32),
+            pad=0,
+            window=self.spectrogram_window,
+            n_fft=self.config.n_fft,
+            hop_length=self.config.hop_length,
+            win_length=self.config.win_length,
+            power=2,
+            normalized=False,
+            center=self.config.center,
+        )
+        mel_spectrogram = (
+            spectrogram.mT @ self.melscale_fbanks.to(torch.float32)).mT
+        # x has shape [batch, freq, time].
+        # F.amplitude_to_DB accepts inputs shaped as:
+        #   - [freq, time]
+        #   - [channel, freq, time]
+        #   - [..., channel, freq, time]
+        # Here we insert a channel dimension of size 1 before calling it,
+        # then remove that extra dimension afterward.
+        log_mel_spectrogram = F.amplitude_to_DB(
+            mel_spectrogram.unsqueeze(1),
+            multiplier=10,
+            amin=1e-10,
+            db_multiplier=0,
+            top_db=120,
+        ).squeeze(1)
+        return log_mel_spectrogram.to(waveform.dtype)
+
+
 class DashengAudioTransformer(nn.Module):
 
     def __init__(
@@ -293,7 +350,7 @@ def __init__(
         self.target_length = config.target_length
         self.hop_length = config.hop_length
 
-        self._init_front_end(config)
+        self.front_end = DashengFrontend(config)
 
         self.init_bn = nn.BatchNorm2d(config.n_mels, momentum=0.01)
 
@@ -318,34 +375,10 @@ def __init__(
                 qkv_bias=config.qkv_bias,
                 init_values=config.init_values,
                 quant_config=quant_config,
-                prefix=f"{prefix}.block{i}",
+                prefix=f"{prefix}.blocks.{i}",
             ) for i in range(config.depth))
         self.norm = nn.LayerNorm(config.embed_dim, eps=1e-6)
 
-    def _init_front_end(self, config):
-        with set_default_torch_dtype(torch.float32):
-            self.front_end = nn.Sequential(
-                audio_transforms.MelSpectrogram(
-                    f_min=config.f_min,
-                    f_max=config.f_max,
-                    center=config.center,
-                    win_length=config.win_length,
-                    hop_length=config.hop_length,
-                    sample_rate=config.sample_rate,
-                    n_fft=config.n_fft,
-                    n_mels=config.n_mels,
-                ),
-                audio_transforms.AmplitudeToDB(top_db=120),
-            )
-
-            mel_spectrogram = self.front_end[0]
-            fb = mel_spectrogram.mel_scale.fb
-            win = mel_spectrogram.spectrogram.window
-            mel_spectrogram.mel_scale.fb = fb.to(torch.bfloat16).to(
-                torch.float32)
-            mel_spectrogram.spectrogram.window = win.to(torch.bfloat16).to(
-                torch.float32)
-
     def forward_features(
         self,
         x: torch.Tensor,
@@ -430,14 +463,16 @@ def __init__(
                 quant_config=quant_config,
                 prefix=f"{prefix}.net.0",
                 return_bias=False,
-            ), get_act_fn("gelu"),
+            ),
+            get_act_fn("gelu"),
             RowParallelLinear(
                 input_size=out_dim,
                 output_size=out_dim,
                 quant_config=quant_config,
                 prefix=f"{prefix}.net.2",
                 return_bias=False,
-            ))
+            ),
+        )
 
     def forward(self, x, mask=None):
         batch_size, seq_len, dim = x.shape
@@ -534,9 +569,12 @@ def _call_hf_processor(
         # + Padding
         min_audio_len = self.info.get_min_audio_len()
         processed_audios = [
-            np.pad(audio, (0, min_audio_len - audio.shape[-1]),
-                   mode='constant',
-                   constant_values=0) if isinstance(audio, np.ndarray)
+            np.pad(
+                audio,
+                (0, min_audio_len - audio.shape[-1]),
+                mode="constant",
+                constant_values=0,
+            ) if isinstance(audio, np.ndarray)
             and audio.shape[-1] < min_audio_len else audio for audio in audios
         ]
 
@@ -585,8 +623,8 @@ def _get_prompt_updates(
         if audio_length is None:
             audio_output_lengths = []
         else:
-            audio_length_np = audio_length.cpu().numpy() if isinstance(
-                audio_length, torch.Tensor) else audio_length
+            audio_length_np = (audio_length.cpu().numpy() if isinstance(
+                audio_length, torch.Tensor) else audio_length)
             audio_output_lengths = [
                 max(1, calculate_mel_frames_dasheng(
                     int(length)))  # at least one frame
@@ -617,6 +655,17 @@ def get_replacement_midashenglm(item_idx: int):
     dummy_inputs=MiDashengLMDummyInputsBuilder,
 )
 class MiDashengLMModel(nn.Module, SupportsMultiModal, SupportsPP):
+    packed_modules_mapping = {
+        "qkv_proj": [
+            "q_proj",
+            "k_proj",
+            "v_proj",
+        ],
+        "gate_up_proj": [
+            "gate_proj",
+            "up_proj",
+        ],
+    }
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -660,8 +709,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
     def _validate_and_reshape_mm_tensor(self, mm_input: object,
                                         name: str) -> torch.Tensor:
         if not isinstance(mm_input, (torch.Tensor, list)):
-            raise ValueError(f"Incorrect type of {name}. "
-                             f"Got type: {type(mm_input)}")
+            raise ValueError(
+                f"Incorrect type of {name}. Got type: {type(mm_input)}")
         if isinstance(mm_input, torch.Tensor):
             return mm_input.reshape(-1, *mm_input.shape[2:])
 
@@ -710,8 +759,8 @@ def _process_audio_input(
             audio_input["input_values"].dtype)
         batch_size, max_audio_tokens, embed_dim = audio_embeddings.shape
 
-        audio_length_np = audio_length.cpu().numpy() if isinstance(
-            audio_length, torch.Tensor) else audio_length
+        audio_length_np = (audio_length.cpu().numpy() if isinstance(
+            audio_length, torch.Tensor) else audio_length)
         audio_output_lengths = [
             max(1, calculate_mel_frames_dasheng(
                 int(length)))  # at least one frame
@@ -720,11 +769,11 @@ def _process_audio_input(
         audio_output_lengths = torch.tensor(audio_output_lengths).to(
             audio_embeddings.device)
 
-        audio_feature_mask = (torch.arange(
+        audio_feature_mask = torch.arange(
             max_audio_tokens,
             device=audio_embeddings.device).unsqueeze(0).expand(
-                batch_size, max_audio_tokens)
-                              < audio_output_lengths.unsqueeze(1))
+                batch_size,
+                max_audio_tokens) < audio_output_lengths.unsqueeze(1)
 
         masked_audio_features = audio_embeddings[audio_feature_mask].view(
             -1, embed_dim)
@@ -762,10 +811,12 @@ def forward(
             )
             input_ids = None
 
-        return self.decoder.model(input_ids,
-                                  positions,
-                                  intermediate_tensors,
-                                  inputs_embeds=inputs_embeds)
+        return self.decoder.model(
+            input_ids,
+            positions,
+            intermediate_tensors,
+            inputs_embeds=inputs_embeds,
+        )
 
     def compute_logits(
         self,

From 0261d115a7f3bfd891d0f32d6c345314aec765eb Mon Sep 17 00:00:00 2001
From: Jiangyun Zhu <riverclouds.zhu@qq.com>
Date: Mon, 29 Sep 2025 21:54:52 +0800
Subject: [PATCH 016/193] [torch.compile] serialize cudagraph_mode as its enum
 name instead of value (#25868)

Signed-off-by: zjy0516 <riverclouds.zhu@qq.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/config/compilation.py | 12 ++++++++----
 1 file changed, 8 insertions(+), 4 deletions(-)

diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index 825de7d26191..df08fa20e0cf 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -73,6 +73,9 @@ def valid_runtime_modes(self) -> bool:
             CUDAGraphMode.NONE, CUDAGraphMode.PIECEWISE, CUDAGraphMode.FULL
         ]
 
+    def __str__(self) -> str:
+        return self.name
+
 
 @config
 @dataclass
@@ -417,10 +420,11 @@ def __repr__(self) -> str:
         if pass_config_exclude:
             exclude["pass_config"] = pass_config_exclude
 
-        return TypeAdapter(CompilationConfig).dump_json(
-            self,
-            exclude=exclude,  # type: ignore[arg-type]
-            exclude_unset=True).decode()
+        config = TypeAdapter(CompilationConfig).dump_python(self,
+                                                            exclude=exclude,
+                                                            exclude_unset=True)
+
+        return str(config)
 
     __str__ = __repr__
 

From 55327c7d11af020900465b9f714a3e0e1d40ea3a Mon Sep 17 00:00:00 2001
From: Chenxi Yang <cxyang@cs.utexas.edu>
Date: Mon, 29 Sep 2025 07:31:51 -0700
Subject: [PATCH 017/193] [Nixl][P/D] Add cuda2cpu support (HD->DH transfer)
 (#24690)

Signed-off-by: Chenxi Yang <cxyang@fb.com>
Co-authored-by: Chenxi Yang <cxyang@fb.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../nixl_integration/run_accuracy_test.sh     | 31 ++++++++++++++--
 .../nixl_integration/run_edge_case_test.sh    | 37 ++++++++++++++++---
 vllm/config/kv_transfer.py                    |  4 +-
 .../kv_connector/v1/nixl_connector.py         |  8 +++-
 vllm/platforms/cuda.py                        | 24 ++++++++++++
 vllm/v1/worker/gpu_model_runner.py            |  7 ++--
 6 files changed, 96 insertions(+), 15 deletions(-)
 mode change 100644 => 100755 tests/v1/kv_connector/nixl_integration/run_edge_case_test.sh

diff --git a/tests/v1/kv_connector/nixl_integration/run_accuracy_test.sh b/tests/v1/kv_connector/nixl_integration/run_accuracy_test.sh
index bc8837079109..3b0f2d102c1f 100755
--- a/tests/v1/kv_connector/nixl_integration/run_accuracy_test.sh
+++ b/tests/v1/kv_connector/nixl_integration/run_accuracy_test.sh
@@ -1,6 +1,31 @@
 #!/bin/bash
 set -xe
 
+# Parse command line arguments
+KV_BUFFER_DEVICE="cuda"  # Default to cuda
+while [[ $# -gt 0 ]]; do
+  case $1 in
+    --kv_buffer_device)
+      KV_BUFFER_DEVICE="$2"
+      shift 2
+      ;;
+    *)
+      echo "Unknown option $1"
+      echo "Usage: $0 [--kv_buffer_device <cuda|cpu>]"
+      exit 1
+      ;;
+  esac
+done
+
+echo "Running accuracy tests with kv_buffer_device=$KV_BUFFER_DEVICE"
+
+# Build the kv-transfer-config once
+if [[ "$KV_BUFFER_DEVICE" == "cuda" ]]; then
+  KV_CONFIG='{"kv_connector":"NixlConnector","kv_role":"kv_both"}'
+else
+  KV_CONFIG="{\"kv_connector\":\"NixlConnector\",\"kv_role\":\"kv_both\",\"kv_buffer_device\":\"$KV_BUFFER_DEVICE\"}"
+fi
+
 # Models to run
 MODELS=(
     "Qwen/Qwen3-0.6B"
@@ -79,7 +104,7 @@ run_tests_for_model() {
 
     # Calculate port number (base port + instance number)
     PORT=$((8100 + i))
-    # Calculate side channel port. Avoid clash with with TP workers. 
+    # Calculate side channel port. Avoid clash with with TP workers.
     SIDE_CHANNEL_PORT=$((5559 + i))
 
     echo "Starting prefill instance $i on GPU $GPU_ID, port $PORT"
@@ -93,7 +118,7 @@ run_tests_for_model() {
     --enforce-eager \
     --gpu-memory-utilization 0.2 \
     --tensor-parallel-size $PREFILLER_TP_SIZE \
-    --kv-transfer-config '{\"kv_connector\":\"NixlConnector\",\"kv_role\":\"kv_both\"}'"
+    --kv-transfer-config '$KV_CONFIG'"
 
     if [ -n "$model_args" ]; then
     FULL_CMD="$BASE_CMD $model_args"
@@ -128,7 +153,7 @@ run_tests_for_model() {
     --enforce-eager \
     --gpu-memory-utilization 0.2 \
     --tensor-parallel-size $DECODER_TP_SIZE \
-    --kv-transfer-config '{\"kv_connector\":\"NixlConnector\",\"kv_role\":\"kv_both\"}'"
+    --kv-transfer-config '$KV_CONFIG'"
 
     if [ -n "$model_args" ]; then
     FULL_CMD="$BASE_CMD $model_args"
diff --git a/tests/v1/kv_connector/nixl_integration/run_edge_case_test.sh b/tests/v1/kv_connector/nixl_integration/run_edge_case_test.sh
old mode 100644
new mode 100755
index b64461292910..c48b452e24cd
--- a/tests/v1/kv_connector/nixl_integration/run_edge_case_test.sh
+++ b/tests/v1/kv_connector/nixl_integration/run_edge_case_test.sh
@@ -1,6 +1,33 @@
 #!/bin/bash
 set -xe
 
+# Parse command line arguments
+KV_BUFFER_DEVICE="cuda"  # Default to cuda
+PREFILL_GPU_ID=4         # Default GPU IDs
+DECODE_GPU_ID=5
+while [[ $# -gt 0 ]]; do
+  case $1 in
+    --kv_buffer_device)
+      KV_BUFFER_DEVICE="$2"
+      shift 2
+      ;;
+    *)
+      echo "Unknown option $1"
+      echo "Usage: $0 [--kv_buffer_device <cuda|cpu>]"
+      exit 1
+      ;;
+  esac
+done
+
+echo "Running edge case tests with kv_buffer_device=$KV_BUFFER_DEVICE (GPUs: $PREFILL_GPU_ID, $DECODE_GPU_ID)"
+
+# Build the kv-transfer-config once
+if [[ "$KV_BUFFER_DEVICE" == "cuda" ]]; then
+  KV_CONFIG='{"kv_connector":"NixlConnector","kv_role":"kv_both"}'
+else
+  KV_CONFIG="{\"kv_connector\":\"NixlConnector\",\"kv_role\":\"kv_both\",\"kv_buffer_device\":\"$KV_BUFFER_DEVICE\"}"
+fi
+
 # Models to run
 MODELS=(
     "Qwen/Qwen3-0.6B"
@@ -50,15 +77,15 @@ run_tests_for_model() {
 
   # Get model-specific arguments
   local model_args=$(get_model_args "$model_name")
-  
+
   # Start prefill instance
   PREFILL_PORT=8001
 
-  BASE_CMD="CUDA_VISIBLE_DEVICES=0 VLLM_NIXL_SIDE_CHANNEL_PORT=5559 vllm serve $model_name \
+  BASE_CMD="CUDA_VISIBLE_DEVICES=$PREFILL_GPU_ID VLLM_NIXL_SIDE_CHANNEL_PORT=5559 vllm serve $model_name \
   --port $PREFILL_PORT \
   --enforce-eager \
   --gpu-memory-utilization 0.2 \
-  --kv-transfer-config '{\"kv_connector\":\"NixlConnector\",\"kv_role\":\"kv_both\"}'"
+  --kv-transfer-config '$KV_CONFIG'"
 
   if [ -n "$model_args" ]; then
   FULL_CMD="$BASE_CMD $model_args"
@@ -72,11 +99,11 @@ run_tests_for_model() {
   DECODE_PORT=8002
 
   # Build the command with or without model-specific args
-  BASE_CMD="CUDA_VISIBLE_DEVICES=1 VLLM_NIXL_SIDE_CHANNEL_PORT=6000 vllm serve $model_name \
+  BASE_CMD="CUDA_VISIBLE_DEVICES=$DECODE_GPU_ID VLLM_NIXL_SIDE_CHANNEL_PORT=6000 vllm serve $model_name \
   --port $DECODE_PORT \
   --enforce-eager \
   --gpu-memory-utilization 0.2 \
-  --kv-transfer-config '{\"kv_connector\":\"NixlConnector\",\"kv_role\":\"kv_both\"}'"
+  --kv-transfer-config '$KV_CONFIG'"
 
   if [ -n "$model_args" ]; then
   FULL_CMD="$BASE_CMD $model_args"
diff --git a/vllm/config/kv_transfer.py b/vllm/config/kv_transfer.py
index 9abf4acacfe8..c3d9a3309eb3 100644
--- a/vllm/config/kv_transfer.py
+++ b/vllm/config/kv_transfer.py
@@ -28,8 +28,8 @@ class KVTransferConfig:
     """The engine id for KV transfers."""
 
     kv_buffer_device: Optional[str] = "cuda"
-    """The device used by kv connector to buffer the KV cache.
-    Currently only support 'cuda'."""
+    """The device used by kv connector to buffer the KV cache. Choices are 
+    'cuda' and 'cpu'."""
 
     kv_buffer_size: float = 1e9
     """The buffer size for TorchDistributedConnector. Measured in number of
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
index c11189d7ec10..1c7569515dec 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
@@ -67,7 +67,10 @@
 # Supported platforms and types of kv transfer buffer.
 # {device: tuple of supported kv buffer types}
 _NIXL_SUPPORTED_DEVICE = {
-    "cuda": ("cuda", ),
+    "cuda": (
+        "cuda",
+        "cpu",
+    ),
     "tpu": ("cpu", ),
     "xpu": ("cpu", ),
 }
@@ -701,6 +704,9 @@ def initialize_host_xfer_buffer(
 
     def set_host_xfer_buffer_ops(self, copy_operation: CopyBlocksOp):
         """Assign copy (d2h, h2d) operations when host buffer is used."""
+        # Set a no-op if the host buffer is not cpu.
+        if self.kv_buffer_device != "cpu":
+            return
         assert self.use_host_buffer
         self.copy_blocks = copy_operation
 
diff --git a/vllm/platforms/cuda.py b/vllm/platforms/cuda.py
index 8b9f9f569206..6738d3dec286 100644
--- a/vllm/platforms/cuda.py
+++ b/vllm/platforms/cuda.py
@@ -500,6 +500,30 @@ def check_if_supports_dtype(cls, torch_dtype: torch.dtype):
                     "You can use float16 instead by explicitly setting the "
                     "`dtype` flag in CLI, for example: --dtype=half.")
 
+    @classmethod
+    def insert_blocks_to_device(
+        cls,
+        src_cache: torch.Tensor,
+        dst_cache: torch.Tensor,
+        src_block_indices: torch.Tensor,
+        dst_block_indices: torch.Tensor,
+    ) -> None:
+        """Copy blocks from src_cache to dst_cache on GPU."""
+        _src_cache = src_cache[:, src_block_indices]
+        dst_cache[:, dst_block_indices] = _src_cache.to(dst_cache.device)
+
+    @classmethod
+    def swap_out_blocks_to_host(
+        cls,
+        src_cache: torch.Tensor,
+        dst_cache: torch.Tensor,
+        src_block_indices: torch.Tensor,
+        dst_block_indices: torch.Tensor,
+    ) -> None:
+        """Copy blocks from GPU to host (CPU)."""
+        _src_cache = src_cache[:, src_block_indices]
+        dst_cache[:, dst_block_indices] = _src_cache.cpu()
+
     @classmethod
     def support_hybrid_kv_cache(cls) -> bool:
         return True
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 0960fe3a25fb..f8b0b9cba1bc 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -4059,10 +4059,9 @@ def initialize_kv_cache(self, kv_cache_config: KVCacheConfig) -> None:
             self.drafter.validate_same_kv_cache_group(kv_cache_config)
 
         if has_kv_transfer_group():
-            get_kv_transfer_group().register_kv_caches(kv_caches)
-            if self.device.type == 'xpu':
-                get_kv_transfer_group().set_host_xfer_buffer_ops(
-                    copy_kv_blocks)
+            kv_transfer_group = get_kv_transfer_group()
+            kv_transfer_group.register_kv_caches(kv_caches)
+            kv_transfer_group.set_host_xfer_buffer_ops(copy_kv_blocks)
 
         if self.dcp_world_size > 1:
             layer_names = self.attn_groups[0][0].layer_names

From c693625f71e934c5f3e56aa1761628ab3f420016 Mon Sep 17 00:00:00 2001
From: Rahul Tuli <rtuli@redhat.com>
Date: Mon, 29 Sep 2025 21:07:20 +0530
Subject: [PATCH 018/193] [Bugfix][Speculative Decoding] Fix Eagle3
 quantization config issue (#25883)

Signed-off-by: Rahul Tuli <rtuli@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../speculators/test_eagle3.py                     |  3 +++
 vllm/model_executor/models/llama.py                |  7 ++++++-
 vllm/model_executor/models/llama_eagle3.py         | 14 +++++++++++++-
 3 files changed, 22 insertions(+), 2 deletions(-)

diff --git a/tests/speculative_decoding/speculators/test_eagle3.py b/tests/speculative_decoding/speculators/test_eagle3.py
index 368238b3a720..87d799a5fed7 100644
--- a/tests/speculative_decoding/speculators/test_eagle3.py
+++ b/tests/speculative_decoding/speculators/test_eagle3.py
@@ -14,6 +14,9 @@
     pytest.param(
         "nm-testing/Speculator-Qwen3-8B-Eagle3-converted-071-quantized",
         id="qwen3-eagle3-speculator"),
+    pytest.param(
+        "nm-testing/Speculator-Qwen3-8B-Eagle3-converted-071-quantized-w4a16",
+        id="qwen3-eagle3-speculator-w4a16-verifier"),
 ])
 def test_eagle3_speculators_model(vllm_runner, example_prompts, model_path,
                                   monkeypatch):
diff --git a/vllm/model_executor/models/llama.py b/vllm/model_executor/models/llama.py
index c7dd134ea47e..a6081d331511 100644
--- a/vllm/model_executor/models/llama.py
+++ b/vllm/model_executor/models/llama.py
@@ -248,7 +248,7 @@ def __init__(self,
 
         config = config or vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
-        quant_config = vllm_config.quant_config
+        quant_config = self.get_quant_config(vllm_config)
 
         self.hidden_size = config.hidden_size
         rope_theta = getattr(config, "rope_theta", 10000)
@@ -328,6 +328,11 @@ def forward(
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
+    def get_quant_config(
+            self, vllm_config: VllmConfig) -> Optional[QuantizationConfig]:
+        """Get quantization config for this layer. Override in subclasses."""
+        return vllm_config.quant_config
+
 
 @support_torch_compile
 class LlamaModel(nn.Module):
diff --git a/vllm/model_executor/models/llama_eagle3.py b/vllm/model_executor/models/llama_eagle3.py
index 7192a76c8749..3fb6f2f8d5ec 100644
--- a/vllm/model_executor/models/llama_eagle3.py
+++ b/vllm/model_executor/models/llama_eagle3.py
@@ -13,6 +13,8 @@
 from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.layers.linear import QKVParallelLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
+from vllm.model_executor.layers.quantization.base_config import (
+    QuantizationConfig)
 from vllm.model_executor.layers.vocab_parallel_embedding import (
     DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
@@ -33,7 +35,7 @@ def __init__(self,
         super().__init__(vllm_config, prefix=prefix, config=config)
 
         config = config or vllm_config.model_config.hf_config
-        quant_config = vllm_config.quant_config
+        quant_config = self.get_quant_config(vllm_config)
 
         # override qkv
         self.self_attn.qkv_proj = QKVParallelLinear(
@@ -53,6 +55,16 @@ def __init__(self,
         else:
             self._residual_norm = self._norm_after_residual
 
+    def get_quant_config(
+            self, vllm_config: VllmConfig) -> Optional[QuantizationConfig]:
+        """Use drafter's quantization config instead of verifier's."""
+        draft_model_config = vllm_config.speculative_config.draft_model_config
+        draft_load_config = vllm_config.load_config
+
+        return VllmConfig.get_quantization_config(
+            draft_model_config,
+            draft_load_config) if draft_model_config else None
+
     def _norm_before_residual(
             self,
             hidden_states: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:

From daaf453ae83b5e99e8e10e5684892d57c1c6589c Mon Sep 17 00:00:00 2001
From: Isotr0py <mozf@mail2.sysu.edu.cn>
Date: Tue, 30 Sep 2025 00:33:39 +0800
Subject: [PATCH 019/193] [CI/Build] Include Transformers backend test in
 nightly transformers test (#25885)

Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .buildkite/test-pipeline.yaml | 1 +
 1 file changed, 1 insertion(+)

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index e603c1582e1f..460f0afb6f67 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -752,6 +752,7 @@ steps:
   commands:
     - pip install --upgrade git+https://github.com/huggingface/transformers
     - pytest -v -s tests/models/test_initialization.py
+    - pytest -v -s tests/models/test_transformers.py
     - pytest -v -s tests/models/multimodal/processing/
     - pytest -v -s tests/models/multimodal/test_mapping.py
     - python3 examples/offline_inference/basic/chat.py

From 671b93c7c159af112cb744663968a672f1acb9a0 Mon Sep 17 00:00:00 2001
From: Jee Jee Li <pandaleefree@gmail.com>
Date: Tue, 30 Sep 2025 00:36:30 +0800
Subject: [PATCH 020/193] [Model] Remove MotifForCausalLM (#25866)

Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/models/supported_models.md        |   2 -
 tests/models/registry.py               |   3 -
 tests/models/test_initialization.py    |   4 -
 vllm/model_executor/models/motif.py    | 345 -------------------------
 vllm/model_executor/models/registry.py |   2 +-
 5 files changed, 1 insertion(+), 355 deletions(-)
 delete mode 100644 vllm/model_executor/models/motif.py

diff --git a/docs/models/supported_models.md b/docs/models/supported_models.md
index 3ee5a7d0ffc5..8e87a98e3d51 100644
--- a/docs/models/supported_models.md
+++ b/docs/models/supported_models.md
@@ -396,7 +396,6 @@ th {
 | `MiniCPM3ForCausalLM` | MiniCPM3 | `openbmb/MiniCPM3-4B`, etc. | ✅︎ | ✅︎ | ✅︎ |
 | `MistralForCausalLM` | Mistral, Mistral-Instruct | `mistralai/Mistral-7B-v0.1`, `mistralai/Mistral-7B-Instruct-v0.1`, etc. | ✅︎ | ✅︎ | ✅︎ |
 | `MixtralForCausalLM` | Mixtral-8x7B, Mixtral-8x7B-Instruct | `mistralai/Mixtral-8x7B-v0.1`, `mistralai/Mixtral-8x7B-Instruct-v0.1`, `mistral-community/Mixtral-8x22B-v0.1`, etc. | ✅︎ | ✅︎ | ✅︎ |
-| `MotifForCausalLM` | Motif-1-Tiny | `Motif-Technologies/Motif-2.6B`, `Motif-Technologies/Motif-2.6b-v1.1-LC`, etc. | ✅︎ | ✅︎ | |
 | `MPTForCausalLM` | MPT, MPT-Instruct, MPT-Chat, MPT-StoryWriter | `mosaicml/mpt-7b`, `mosaicml/mpt-7b-storywriter`, `mosaicml/mpt-30b`, etc. | | ✅︎ | ✅︎ |
 | `NemotronForCausalLM` | Nemotron-3, Nemotron-4, Minitron | `nvidia/Minitron-8B-Base`, `mgoin/Nemotron-4-340B-Base-hf-FP8`, etc. | ✅︎ | ✅︎ | ✅︎ |
 | `NemotronHForCausalLM` | Nemotron-H | `nvidia/Nemotron-H-8B-Base-8K`, `nvidia/Nemotron-H-47B-Base-8K`, `nvidia/Nemotron-H-56B-Base-8K`, etc. | ✅︎ | ✅︎ | ✅︎ |
@@ -409,7 +408,6 @@ th {
 | `PhiForCausalLM` | Phi | `microsoft/phi-1_5`, `microsoft/phi-2`, etc. | ✅︎ | ✅︎ | ✅︎ |
 | `Phi3ForCausalLM` | Phi-4, Phi-3 | `microsoft/Phi-4-mini-instruct`, `microsoft/Phi-4`, `microsoft/Phi-3-mini-4k-instruct`, `microsoft/Phi-3-mini-128k-instruct`, `microsoft/Phi-3-medium-128k-instruct`, etc. | ✅︎ | ✅︎ | ✅︎ |
 | `PhiMoEForCausalLM` | Phi-3.5-MoE | `microsoft/Phi-3.5-MoE-instruct`, etc. | ✅︎ | ✅︎ | ✅︎ |
-| `Phi4FlashForCausalLM` | Phi-4-mini-flash-reasoning | `microsoft/microsoft/Phi-4-mini-instruct`, etc. | | | |
 | `PersimmonForCausalLM` | Persimmon | `adept/persimmon-8b-base`, `adept/persimmon-8b-chat`, etc. | | ✅︎ | ✅︎ |
 | `Plamo2ForCausalLM` | PLaMo2 | `pfnet/plamo-2-1b`, `pfnet/plamo-2-8b`, etc. | | ✅︎ | ✅︎ |
 | `QWenLMHeadModel` | Qwen | `Qwen/Qwen-7B`, `Qwen/Qwen-7B-Chat`, etc. | ✅︎ | ✅︎ | ✅︎ |
diff --git a/tests/models/registry.py b/tests/models/registry.py
index 124a97ed0c89..37ee474d3ecb 100644
--- a/tests/models/registry.py
+++ b/tests/models/registry.py
@@ -298,9 +298,6 @@ def check_available_online(
     "MistralForCausalLM": _HfExamplesInfo("mistralai/Mistral-7B-Instruct-v0.1"),
     "MixtralForCausalLM": _HfExamplesInfo("mistralai/Mixtral-8x7B-Instruct-v0.1",  # noqa: E501
                                           {"tiny": "TitanML/tiny-mixtral"}),  # noqa: E501
-    "MotifForCausalLM": _HfExamplesInfo("Motif-Technologies/Motif-2.6B",
-                                        trust_remote_code=True,
-                                        v0_only=True),
     "MptForCausalLM": _HfExamplesInfo("mpt", is_available_online=False),
     "MPTForCausalLM": _HfExamplesInfo("mosaicml/mpt-7b"),
     "NemotronForCausalLM": _HfExamplesInfo("nvidia/Minitron-8B-Base"),
diff --git a/tests/models/test_initialization.py b/tests/models/test_initialization.py
index 42d69367042d..e818b908e8a8 100644
--- a/tests/models/test_initialization.py
+++ b/tests/models/test_initialization.py
@@ -76,10 +76,6 @@ def _initialize_kv_caches_v1(self, vllm_config):
         if model_info.v0_only:
             # NOTE(woosuk): skip the test for V0-only models
             return
-
-        if model_arch in ("Phi4FlashForCausalLM", "MotifForCausalLM"):
-            pytest.skip(
-                "Differential Flash Attention backend has been removed.")
         if model_arch == "GptOssForCausalLM":
             # FIXME: A hack to bypass FA3 assertion because our CI's L4 GPU
             # has cc==8.9 which hasn't supported FA3 yet. Remove this hack when
diff --git a/vllm/model_executor/models/motif.py b/vllm/model_executor/models/motif.py
deleted file mode 100644
index 153f36dcf1f5..000000000000
--- a/vllm/model_executor/models/motif.py
+++ /dev/null
@@ -1,345 +0,0 @@
-# SPDX-License-Identifier: Apache-2.0
-# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-
-# Adapted from
-# https://huggingface.co/Motif-Technologies/Motif-2.6B/blob/main/modeling_motif.py
-# Copyright (c) Alibaba Cloud.
-# LICENSE: https://huggingface.co/Motif-Technologies/Motif-2.6B/blob/main/LICENSE
-"""Inference-only Motif model compatible with HuggingFace weights."""
-import math
-from typing import Any, Optional
-
-import torch
-from torch import nn
-from transformers import PretrainedConfig
-
-from vllm.attention import Attention, AttentionType
-from vllm.attention.selector import _Backend
-from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import get_tensor_model_parallel_world_size
-from vllm.model_executor.layers.layernorm import PolyNorm, RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
-from vllm.model_executor.layers.quantization import QuantizationConfig
-from vllm.model_executor.layers.rotary_embedding import get_rope
-from vllm.model_executor.models.llama import LlamaForCausalLM
-
-from .adapters import as_seq_cls_model
-from .interfaces import SupportsV0Only
-from .utils import extract_layer_index
-
-
-class MotifMLP(nn.Module):
-    """MLP for the language component of the Motif model, which contains a
-    MergedColumnParallelLinear merging 2 outputs via PolyNorm activation."""
-
-    def __init__(
-        self,
-        hidden_size: int,
-        intermediate_size: int,
-        hidden_act: str = "poly_norm",
-        quant_config: Optional[QuantizationConfig] = None,
-        bias: bool = False,
-        prefix: str = "",
-        reduce_results: bool = True,
-    ):
-        super().__init__()
-        self.gate_up_proj = MergedColumnParallelLinear(
-            input_size=hidden_size,
-            output_sizes=[intermediate_size] * 2,
-            bias=bias,
-            quant_config=quant_config,
-            prefix=f"{prefix}.gate_up_proj",
-        )
-        self.down_proj = RowParallelLinear(
-            input_size=intermediate_size,
-            output_size=hidden_size,
-            bias=bias,
-            quant_config=quant_config,
-            reduce_results=reduce_results,
-            prefix=f"{prefix}.down_proj",
-        )
-        if hidden_act != "poly_norm":
-            raise NotImplementedError(f"Unsupported activation: {hidden_act}. "
-                                      "Only poly_norm is supported for now.")
-        self.act_fn = PolyNorm()
-        self.intermediate_size = intermediate_size
-        tp_size = get_tensor_model_parallel_world_size()
-        if hidden_act == "poly_norm" and tp_size > 1:
-            raise NotImplementedError(
-                "Tensor parallelism for poly_norm is not supported yet. "
-                "Support will be added in the future.")
-
-    def forward(self, x):
-        x, _ = self.gate_up_proj(x)
-        x = self.act_fn(
-            x[..., :self.intermediate_size]) * x[..., self.intermediate_size:]
-        x, _ = self.down_proj(x)
-        return x
-
-
-class MotifAttention(nn.Module):
-
-    def __init__(
-        self,
-        config: PretrainedConfig,
-        hidden_size: int,
-        num_heads: int,
-        num_kv_heads: int,
-        rope_theta: float = 10000,
-        rope_scaling: Optional[dict[str, Any]] = None,
-        max_position_embeddings: int = 8192,
-        quant_config: Optional[QuantizationConfig] = None,
-        bias: bool = False,
-        bias_o_proj: bool = False,
-        cache_config: Optional[CacheConfig] = None,
-        prefix: str = "",
-        attn_type: str = AttentionType.DECODER,
-    ) -> None:
-        super().__init__()
-        layer_idx = extract_layer_index(prefix)
-        self.hidden_size = hidden_size
-        tp_size = get_tensor_model_parallel_world_size()
-        self.total_num_heads = num_heads
-        assert self.total_num_heads % tp_size == 0
-        self.num_heads = self.total_num_heads // tp_size
-        self.total_num_kv_heads = num_kv_heads
-        if self.total_num_kv_heads >= tp_size:
-            # Number of KV heads is greater than TP size, so we partition
-            # the KV heads across multiple tensor parallel GPUs.
-            assert self.total_num_kv_heads % tp_size == 0
-        else:
-            # Number of KV heads is less than TP size, so we replicate
-            # the KV heads across multiple tensor parallel GPUs.
-            assert tp_size % self.total_num_kv_heads == 0
-        self.num_kv_heads = max(1, self.total_num_kv_heads // tp_size)
-        # MistralConfig has an optional head_dim introduced by Mistral-Nemo
-        head_dim = getattr(config, "head_dim", None)
-        if head_dim is None:
-            head_dim = self.hidden_size // self.total_num_heads
-        self.head_dim = head_dim
-        # Phi models introduced a partial_rotary_factor parameter in the config
-        self.partial_rotary_factor = getattr(config, "partial_rotary_factor",
-                                             1)
-        self.q_size = self.num_heads * self.head_dim
-        self.kv_size = self.num_kv_heads * self.head_dim
-        self.scaling = self.head_dim**-0.5
-        self.rope_theta = rope_theta
-        self.max_position_embeddings = max_position_embeddings
-
-        assert self.num_heads % 2 == 0, 'num_heads should be even'
-        assert self.num_kv_heads % 2 == 0, 'num_heads should be even'
-
-        self.qkv_proj = QKVParallelLinear(
-            hidden_size=hidden_size,
-            head_size=self.head_dim,
-            total_num_heads=self.total_num_heads,
-            total_num_kv_heads=self.total_num_kv_heads,
-            bias=bias,
-            quant_config=quant_config,
-            prefix=f"{prefix}.qkv_proj",
-        )
-
-        self.o_proj = RowParallelLinear(
-            input_size=self.total_num_heads * self.head_dim,
-            output_size=hidden_size,
-            bias=bias_o_proj,
-            quant_config=quant_config,
-            prefix=f"{prefix}.o_proj",
-        )
-
-        self._init_rotary_emb(config,
-                              rope_scaling=rope_scaling,
-                              quant_config=quant_config)
-        sliding_window = None
-
-        self.lambda_init = self.lambda_init_fn(layer_idx)
-        self.lambda_q1 = nn.Parameter(
-            torch.zeros(self.head_dim, dtype=torch.float32).normal_(mean=0,
-                                                                    std=0.1))
-        self.lambda_k1 = nn.Parameter(
-            torch.zeros(self.head_dim, dtype=torch.float32).normal_(mean=0,
-                                                                    std=0.1))
-        self.lambda_q2 = nn.Parameter(
-            torch.zeros(self.head_dim, dtype=torch.float32).normal_(mean=0,
-                                                                    std=0.1))
-        self.lambda_k2 = nn.Parameter(
-            torch.zeros(self.head_dim, dtype=torch.float32).normal_(mean=0,
-                                                                    std=0.1))
-        self.subln = RMSNorm(2 * self.head_dim, eps=config.attn_rms_norm_eps)
-
-        params = {
-            'differential_flash_attention_config': {
-                'lambda_init': self.lambda_init,
-                'lambda_q1': self.lambda_q1,
-                'lambda_k1': self.lambda_k1,
-                'lambda_q2': self.lambda_q2,
-                'lambda_k2': self.lambda_k2,
-                "subln": self.subln,
-            }
-        }
-
-        diff_attn_err_msg = (
-            'Set VLLM_ATTENTION_BACKEND="DIFFERENTIAL_FLASH_ATTN" '
-            'to enable Differential Flash Attention.')
-        try:
-            self.attn = Attention(
-                self.num_heads,
-                self.head_dim,
-                self.scaling,
-                num_kv_heads=self.num_kv_heads,
-                cache_config=cache_config,
-                quant_config=quant_config,
-                per_layer_sliding_window=sliding_window,
-                attn_type=attn_type,
-                prefix=f"{prefix}.attn",
-                **params,
-            )
-        except TypeError as e:
-            raise ValueError(diff_attn_err_msg) from e
-        assert (self.attn.backend == _Backend.DIFFERENTIAL_FLASH_ATTN
-                ), diff_attn_err_msg
-
-    def lambda_init_fn(self, depth):
-        return 0.8 - 0.6 * math.exp(-0.3 * (depth - 1))
-
-    def forward(
-        self,
-        positions: torch.Tensor,
-        hidden_states: torch.Tensor,
-    ) -> torch.Tensor:
-        qkv, _ = self.qkv_proj(hidden_states)
-        q, k, v = qkv.split([self.q_size, self.kv_size, self.kv_size], dim=-1)
-        q, k = self.rotary_emb(positions, q, k)
-        attn_output = self.attn(q, k, v)
-        output, _ = self.o_proj(attn_output)
-        return output
-
-    def _init_rotary_emb(self, config: PretrainedConfig,
-                         rope_scaling: Optional[dict[str, Any]],
-                         quant_config: Optional[QuantizationConfig]) -> None:
-        is_neox_style = True
-        is_gguf = quant_config and quant_config.get_name() == "gguf"
-        if is_gguf and config.model_type == "llama":
-            is_neox_style = False
-
-        self.rotary_emb = get_rope(
-            self.head_dim,
-            rotary_dim=self.head_dim,
-            max_position=self.max_position_embeddings,
-            base=self.rope_theta,
-            rope_scaling=rope_scaling,
-            is_neox_style=is_neox_style,
-            partial_rotary_factor=self.partial_rotary_factor,
-        )
-
-
-class MotifDecoderLayer(nn.Module):
-
-    def __init__(
-        self,
-        config: PretrainedConfig,
-        cache_config: Optional[CacheConfig] = None,
-        quant_config: Optional[QuantizationConfig] = None,
-        prefix: str = "",
-    ) -> None:
-        super().__init__()
-        self.hidden_size = config.hidden_size
-        rope_theta = getattr(config, "rope_theta", 10000)
-        rope_scaling = getattr(config, "rope_scaling", None)
-        if rope_scaling is not None and getattr(
-                config, "original_max_position_embeddings", None):
-            rope_scaling["original_max_position_embeddings"] = (
-                config.original_max_position_embeddings)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
-        attention_bias = getattr(config, "attention_bias", False) or getattr(
-            config, "use_bias", False)
-        bias_o_proj = attention_bias
-        if hasattr(config, 'qkv_bias'):
-            attention_bias = config.qkv_bias
-
-        # By default, Motif uses causal attention as it is a decoder-only model.
-        # You can override the HF config with `is_causal=False` to enable
-        # bidirectional attention, which is used in some embedding models
-        # (e.g. parasail-ai/GritLM-7B-vllm)
-        if getattr(config, "is_causal", True):
-            attn_type = AttentionType.DECODER
-        else:
-            attn_type = AttentionType.ENCODER_ONLY
-
-        self.self_attn = MotifAttention(
-            config=config,
-            hidden_size=self.hidden_size,
-            num_heads=config.num_attention_heads,
-            num_kv_heads=getattr(config, "num_key_value_heads",
-                                 config.num_attention_heads),
-            rope_theta=rope_theta,
-            rope_scaling=rope_scaling,
-            max_position_embeddings=max_position_embeddings,
-            quant_config=quant_config,
-            bias=attention_bias,
-            bias_o_proj=bias_o_proj,
-            cache_config=cache_config,
-            prefix=f"{prefix}.self_attn",
-            attn_type=attn_type,
-        )
-        self.mlp = MotifMLP(
-            hidden_size=self.hidden_size,
-            intermediate_size=config.intermediate_size,
-            hidden_act=config.hidden_act,
-            quant_config=quant_config,
-            bias=getattr(config, "use_bias", False),
-            prefix=f"{prefix}.mlp",
-        )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
-
-    def forward(
-        self,
-        positions: torch.Tensor,
-        hidden_states: torch.Tensor,
-        residual: Optional[torch.Tensor],
-    ) -> tuple[torch.Tensor, torch.Tensor]:
-        # Self Attention
-        if residual is None:
-            residual = hidden_states
-            hidden_states = self.input_layernorm(hidden_states)
-        else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
-        hidden_states = self.self_attn(positions=positions,
-                                       hidden_states=hidden_states)
-
-        # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
-        hidden_states = self.mlp(hidden_states)
-        return hidden_states, residual
-
-
-# Motif model uses differential attention
-# Only supported in v0 (no chunked prefill support)
-class MotifForCausalLM(LlamaForCausalLM, SupportsV0Only):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 layer_type: type[nn.Module] = MotifDecoderLayer):
-
-        # Prefix caching and chunked prefill is not supported for this model.
-        assert not vllm_config.cache_config.enable_prefix_caching, \
-            "Motif currently does not support prefix caching"
-        assert not vllm_config.scheduler_config.chunked_prefill_enabled, \
-            "Motif currently does not support chunked prefill"
-
-        super().__init__(vllm_config=vllm_config,
-                         prefix=prefix,
-                         layer_type=layer_type)
-
-
-MotifForSequenceClassification = as_seq_cls_model(MotifForCausalLM)
diff --git a/vllm/model_executor/models/registry.py b/vllm/model_executor/models/registry.py
index a68012d8a8c9..62aa5af9fb14 100644
--- a/vllm/model_executor/models/registry.py
+++ b/vllm/model_executor/models/registry.py
@@ -119,7 +119,6 @@
     "MiniCPM3ForCausalLM": ("minicpm3", "MiniCPM3ForCausalLM"),
     "MistralForCausalLM": ("llama", "LlamaForCausalLM"),
     "MixtralForCausalLM": ("mixtral", "MixtralForCausalLM"),
-    "MotifForCausalLM": ("motif", "MotifForCausalLM"),
     # transformers's mpt class has lower case
     "MptForCausalLM": ("mpt", "MPTForCausalLM"),
     "MPTForCausalLM": ("mpt", "MPTForCausalLM"),
@@ -332,6 +331,7 @@
 ]
 
 _PREVIOUSLY_SUPPORTED_MODELS = {
+    "MotifForCausalLM": "0.10.2",
     "Phi3SmallForCausalLM": "0.9.2",
     "Phi4FlashForCausalLM": "0.10.2",
     # encoder-decoder models except whisper

From 577110cc8737a64ee2bd5871adf9acb5d2f99db9 Mon Sep 17 00:00:00 2001
From: Lee Nau <lee.nau@gmail.com>
Date: Mon, 29 Sep 2025 12:07:29 -0700
Subject: [PATCH 021/193] [Bugfix] Use correct key "ignore" for config.json
 non-quantized layers (#25706)

Signed-off-by: Lee Nau <lnau@nvidia.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/layers/quantization/modelopt.py | 8 ++++++--
 1 file changed, 6 insertions(+), 2 deletions(-)

diff --git a/vllm/model_executor/layers/quantization/modelopt.py b/vllm/model_executor/layers/quantization/modelopt.py
index 0be43da00b53..20704439eaa9 100644
--- a/vllm/model_executor/layers/quantization/modelopt.py
+++ b/vllm/model_executor/layers/quantization/modelopt.py
@@ -138,13 +138,15 @@ def from_config(cls, config: dict[str, Any]) -> "ModelOptFp8Config":
             if not quant_method:
                 raise ValueError("Missing 'quant_algo' in quantization config")
             kv_cache_quant_method = quant_config.get("kv_cache_quant_algo")
+            # "exclude_modules" is the key in the legacy hf_quant_config.json
             exclude_modules = quant_config.get("exclude_modules")
         else:
             # Compressed-tensors style format:
             # {"quant_algo": "...", "quant_method": "modelopt"}
             quant_method = config.get("quant_algo", "")
             kv_cache_quant_method = config.get("kv_cache_quant_algo")
-            exclude_modules = config.get("exclude_modules")
+            # "ignore" is the key in config.json
+            exclude_modules = config.get("ignore")
 
         if quant_method not in QUANT_ALGOS:
             raise ValueError(
@@ -723,6 +725,7 @@ def from_config(cls, config: dict[str, Any]) -> "ModelOptNvFp4Config":
                     raise ValueError(f"group_size must be an integer, got "
                                      f"{type(group_size_raw)}") from None
 
+            # "exclude_modules" is the key in the legacy hf_quant_config.json
             exclude_modules = quant_config.get("exclude_modules", [])
             if not isinstance(exclude_modules, list):
                 raise ValueError(f"exclude_modules must be a list, got "
@@ -756,7 +759,8 @@ def from_config(cls, config: dict[str, Any]) -> "ModelOptNvFp4Config":
                     raise ValueError(f"group_size must be an integer, got "
                                      f"{type(group_size_raw)}") from None
 
-            exclude_modules = config.get("exclude_modules", [])
+            # "ignore" is the key in config.json
+            exclude_modules = config.get("ignore", [])
             if not isinstance(exclude_modules, list):
                 raise ValueError(f"exclude_modules must be a list, got "
                                  f"{type(exclude_modules)}")

From 21face040e37380c0ab490a7fb8aa0051d1de6b4 Mon Sep 17 00:00:00 2001
From: Adrian Abeyta <aabeyta@redhat.com>
Date: Mon, 29 Sep 2025 14:52:04 -0500
Subject: [PATCH 022/193] [BugFix][torch.compile] KV scale calculation issues
 with FP8 quantization (#25513)

Signed-off-by: adabeyta <aabeyta@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/compile/test_full_graph.py   | 15 +++++++++++
 vllm/attention/layer.py            | 43 +++++++++++++++++++++++++++---
 vllm/v1/worker/gpu_model_runner.py |  9 +++++++
 3 files changed, 64 insertions(+), 3 deletions(-)

diff --git a/tests/compile/test_full_graph.py b/tests/compile/test_full_graph.py
index 870aa553ca62..f9f146810924 100644
--- a/tests/compile/test_full_graph.py
+++ b/tests/compile/test_full_graph.py
@@ -139,6 +139,21 @@ def test_custom_compile_config(
     run_model(compilation_config, model, model_kwargs)
 
 
+@pytest.mark.parametrize(
+    "optimization_level",
+    [CompilationLevel.NO_COMPILATION, CompilationLevel.PIECEWISE],
+)
+def test_fp8_kv_scale_compile(optimization_level: int):
+    model = "Qwen/Qwen2-0.5B"
+    model_kwargs = {
+        "quantization": "fp8",
+        "kv_cache_dtype": "fp8_e4m3",
+        "calculate_kv_scales": True,
+        "max_model_len": 512,
+    }
+    run_model(optimization_level, model, model_kwargs)
+
+
 def test_inductor_graph_partition_attn_fusion(caplog_vllm):
     if not is_torch_equal_or_newer("2.9.0.dev"):
         pytest.skip("inductor graph partition is only available "
diff --git a/vllm/attention/layer.py b/vllm/attention/layer.py
index 326fe6dd048a..d97c87d96e99 100644
--- a/vllm/attention/layer.py
+++ b/vllm/attention/layer.py
@@ -277,9 +277,8 @@ def forward(
         `vllm.forward_context.get_forward_context().attn_metadata`.
         """
         if self.calculate_kv_scales:
-            attn_metadata = get_forward_context().attn_metadata
-            if attn_metadata.enable_kv_scales_calculation:
-                self.calc_kv_scales(query, key, value)
+            torch.ops.vllm.maybe_calc_kv_scales(query, key, value,
+                                                self.layer_name)
 
         output_dtype = query.dtype
         if self.query_quant is not None:
@@ -554,6 +553,44 @@ def maybe_save_kv_layer_to_connector(
                             attn_metadata[layer_name])
 
 
+def maybe_calc_kv_scales(
+    query: torch.Tensor,
+    key: torch.Tensor,
+    value: torch.Tensor,
+    layer_name: str,
+) -> None:
+
+    forward_context: ForwardContext = get_forward_context()
+    attn_metadata = forward_context.attn_metadata
+
+    if isinstance(attn_metadata, dict):
+        attn_metadata = attn_metadata[layer_name]
+
+    if attn_metadata is None or not getattr(
+            attn_metadata, 'enable_kv_scales_calculation', False):
+        return
+
+    self = forward_context.no_compile_layers[layer_name]
+    self.calc_kv_scales(query, key, value)
+
+
+def maybe_calc_kv_scales_fake(
+    query: torch.Tensor,
+    key: torch.Tensor,
+    value: torch.Tensor,
+    layer_name: str,
+) -> None:
+    return
+
+
+direct_register_custom_op(
+    op_name="maybe_calc_kv_scales",
+    op_func=maybe_calc_kv_scales,
+    mutates_args=["query", "key", "value"],
+    fake_impl=maybe_calc_kv_scales_fake,
+)
+
+
 def unified_attention(
     query: torch.Tensor,
     key: torch.Tensor,
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index f8b0b9cba1bc..9e7d6eb0387b 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -2351,6 +2351,15 @@ def execute_model(
                 self.cudagraph_dispatcher.dispatch(batch_descriptor,
                                                    use_cascade_attn)
 
+        # Set cudagraph mode to none if calc_kv_scales is true.
+        if attn_metadata is not None:
+            metadata_list = (attn_metadata.values() if isinstance(
+                attn_metadata, dict) else [attn_metadata])
+            if any(
+                    getattr(m, 'enable_kv_scales_calculation', False)
+                    for m in metadata_list):
+                cudagraph_runtime_mode = CUDAGraphMode.NONE
+
         # This is currently to get around the assert in the DPMetadata
         # where it wants `num_tokens_across_dp` to align with `num_tokens`
         if ubatch_slices is not None:

From 2e38ecfa4f95b4e6c98e9d0b1f7c202bbc808ac2 Mon Sep 17 00:00:00 2001
From: Naman Lalit <nl2688@nyu.edu>
Date: Mon, 29 Sep 2025 13:49:49 -0700
Subject: [PATCH 023/193] [Doc] Add documentation for vLLM continuous
 benchmarking and profiling (#25819)

Signed-off-by: Naman Lalit <nl2688@nyu.edu>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/contributing/benchmarks.md | 24 ++++++++++++++++++++++++
 docs/contributing/profiling.md  | 16 ++++++++++++++++
 2 files changed, 40 insertions(+)

diff --git a/docs/contributing/benchmarks.md b/docs/contributing/benchmarks.md
index a97d1fa6a3a5..cf14770c01a6 100644
--- a/docs/contributing/benchmarks.md
+++ b/docs/contributing/benchmarks.md
@@ -823,6 +823,30 @@ The latest performance results are hosted on the public [vLLM Performance Dashbo
 
 More information on the performance benchmarks and their parameters can be found in [Benchmark README](https://github.com/intel-ai-tce/vllm/blob/more_cpu_models/.buildkite/nightly-benchmarks/README.md) and [performance benchmark description](gh-file:.buildkite/nightly-benchmarks/performance-benchmarks-descriptions.md).
 
+### Continuous Benchmarking
+
+The continuous benchmarking provides automated performance monitoring for vLLM across different models and GPU devices. This helps track vLLM's performance characteristics over time and identify any performance regressions or improvements.
+
+#### How It Works
+
+The continuous benchmarking is triggered via a [GitHub workflow CI](https://github.com/pytorch/pytorch-integration-testing/actions/workflows/vllm-benchmark.yml) in the PyTorch infrastructure repository, which runs automatically every 4 hours. The workflow executes three types of performance tests:
+
+- **Serving tests**: Measure request handling and API performance
+- **Throughput tests**: Evaluate token generation rates
+- **Latency tests**: Assess response time characteristics
+
+#### Benchmark Configuration
+
+The benchmarking currently runs on a predefined set of models configured in the [vllm-benchmarks directory](https://github.com/pytorch/pytorch-integration-testing/tree/main/vllm-benchmarks/benchmarks). To add new models for benchmarking:
+
+1. Navigate to the appropriate GPU directory in the benchmarks configuration
+2. Add your model specifications to the corresponding configuration files
+3. The new models will be included in the next scheduled benchmark run
+
+#### Viewing Results
+
+All continuous benchmarking results are automatically published to the public [vLLM Performance Dashboard](https://hud.pytorch.org/benchmark/llms?repoName=vllm-project%2Fvllm).
+
 [](){ #nightly-benchmarks }
 
 ## Nightly Benchmarks
diff --git a/docs/contributing/profiling.md b/docs/contributing/profiling.md
index a1b7927a95d1..b62560a58748 100644
--- a/docs/contributing/profiling.md
+++ b/docs/contributing/profiling.md
@@ -160,6 +160,22 @@ GUI example:
 
 <img width="1799" alt="Screenshot 2025-03-05 at 11 48 42 AM" src="https://github.com/user-attachments/assets/c7cff1ae-6d6f-477d-a342-bd13c4fc424c" />
 
+## Continuous Profiling
+
+There is a [GitHub CI workflow](https://github.com/pytorch/pytorch-integration-testing/actions/workflows/vllm-profiling.yml) in the PyTorch infrastructure repository that provides continuous profiling for different models on vLLM. This automated profiling helps track performance characteristics over time and across different model configurations.
+
+### How It Works
+
+The workflow currently runs weekly profiling sessions for selected models, generating detailed performance traces that can be analyzed using different tools to identify performance regressions or optimization opportunities. But, it can be triggered manually as well, using the Github Action tool.
+
+### Adding New Models
+
+To extend the continuous profiling to additional models, you can modify the [profiling-tests.json](https://github.com/pytorch/pytorch-integration-testing/blob/main/vllm-profiling/cuda/profiling-tests.json) configuration file in the PyTorch integration testing repository. Simply add your model specifications to this file to include them in the automated profiling runs.
+
+### Viewing Profiling Results
+
+The profiling traces generated by the continuous profiling workflow are publicly available on the [vLLM Performance Dashboard](https://hud.pytorch.org/benchmark/llms?repoName=vllm-project%2Fvllm). Look for the **Profiling traces** table to access and download the traces for different models and runs.
+
 ## Profiling vLLM Python Code
 
 The Python standard library includes

From 776946ac9768fb16efaf39960182718d3ee7d686 Mon Sep 17 00:00:00 2001
From: Gregory Shtrasberg <156009573+gshtras@users.noreply.github.com>
Date: Mon, 29 Sep 2025 17:01:50 -0400
Subject: [PATCH 024/193] [Bugfix][ROCm] Fixing trying to import non-existent
 symbols from libnccl.so (#25605)

Signed-off-by: Gregory Shtrasberg <Gregory.Shtrasberg@amd.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../device_communicators/pynccl_wrapper.py    | 27 ++++++++++++++++---
 1 file changed, 23 insertions(+), 4 deletions(-)

diff --git a/vllm/distributed/device_communicators/pynccl_wrapper.py b/vllm/distributed/device_communicators/pynccl_wrapper.py
index c3e99e177e2d..2e9a4e024de4 100644
--- a/vllm/distributed/device_communicators/pynccl_wrapper.py
+++ b/vllm/distributed/device_communicators/pynccl_wrapper.py
@@ -30,7 +30,9 @@
 import torch
 from torch.distributed import ReduceOp
 
+from vllm import envs
 from vllm.logger import init_logger
+from vllm.platforms import current_platform
 from vllm.utils import find_nccl_library
 
 logger = init_logger(__name__)
@@ -275,10 +277,27 @@ def __init__(self, so_file: Optional[str] = None):
         if so_file not in NCCLLibrary.path_to_dict_mapping:
             _funcs: dict[str, Any] = {}
             for func in NCCLLibrary.exported_functions:
-                f = getattr(self.lib, func.name)
-                f.restype = func.restype
-                f.argtypes = func.argtypes
-                _funcs[func.name] = f
+                try:
+                    f = getattr(self.lib, func.name)
+                    f.restype = func.restype
+                    f.argtypes = func.argtypes
+                    _funcs[func.name] = f
+                except AttributeError:
+                    if func.name in [
+                            "ncclCommWindowRegister",
+                            "ncclCommWindowDeregister"
+                    ]:
+                        if envs.VLLM_USE_NCCL_SYMM_MEM:
+                            logger.warning_once(
+                                "The symbol %s is not found in the NCCL "
+                                "library %s. To enable VLLM_USE_NCCL_SYMM_MEM "
+                                " please update your NCCL version to >= "
+                                "2.27.03.", func.name, so_file)
+                        if current_platform.is_rocm():
+                            # Having an exception here on ROCm platform is
+                            # not allowed during graph capturing
+                            continue
+                    raise
             NCCLLibrary.path_to_dict_mapping[so_file] = _funcs
         self._funcs = NCCLLibrary.path_to_dict_mapping[so_file]
 

From 1476b1cb8280ed778becf44742521572da74ffad Mon Sep 17 00:00:00 2001
From: Thomas Parnell <tpa@zurich.ibm.com>
Date: Mon, 29 Sep 2025 23:18:25 +0200
Subject: [PATCH 025/193] [Kernel] Chunk-aligned mamba2 (#24683)

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../layers/mamba/mamba_mixer2.py              |   8 +-
 .../layers/mamba/ops/ssd_bmm.py               |  42 ++--
 .../layers/mamba/ops/ssd_chunk_scan.py        | 236 ++++++------------
 .../layers/mamba/ops/ssd_chunk_state.py       |  48 ++--
 .../layers/mamba/ops/ssd_combined.py          |  56 ++---
 .../layers/mamba/ops/ssd_state_passing.py     |  97 ++-----
 vllm/model_executor/models/plamo2.py          |   8 +-
 vllm/v1/attention/backends/mamba2_attn.py     | 189 ++++++--------
 8 files changed, 250 insertions(+), 434 deletions(-)

diff --git a/vllm/model_executor/layers/mamba/mamba_mixer2.py b/vllm/model_executor/layers/mamba/mamba_mixer2.py
index 6dd09fad7a90..bfb0666d361f 100644
--- a/vllm/model_executor/layers/mamba/mamba_mixer2.py
+++ b/vllm/model_executor/layers/mamba/mamba_mixer2.py
@@ -502,9 +502,9 @@ def forward_cuda(
             prep_initial_states = attn_metadata.prep_initial_states
             chunk_size = attn_metadata.chunk_size
             seq_idx_p = attn_metadata.seq_idx_p
-            chunk_indices_p = attn_metadata.chunk_indices_p
-            chunk_offsets_p = attn_metadata.chunk_offsets_p
             query_start_loc_p = attn_metadata.query_start_loc_p
+            cu_chunk_seqlen_p = attn_metadata.cu_chunk_seqlen_p
+            last_chunk_indices_p = attn_metadata.last_chunk_indices_p
 
         # 1. Gated MLP's linear projection
         projected_states, _ = self.in_proj(hidden_states)
@@ -634,9 +634,9 @@ def forward_cuda(
                 z=None,
                 dt_bias=self.dt_bias,
                 seq_idx=seq_idx_p,
-                chunk_indices=chunk_indices_p,
-                chunk_offsets=chunk_offsets_p,
                 cu_seqlens=query_start_loc_p,
+                cu_chunk_seqlens=cu_chunk_seqlen_p,
+                last_chunk_indices=last_chunk_indices_p,
                 initial_states=initial_states,
                 dt_softplus=True,
                 dt_limit=(0.0, float("inf")),
diff --git a/vllm/model_executor/layers/mamba/ops/ssd_bmm.py b/vllm/model_executor/layers/mamba/ops/ssd_bmm.py
index 601b71ab2a51..15a72fc61261 100644
--- a/vllm/model_executor/layers/mamba/ops/ssd_bmm.py
+++ b/vllm/model_executor/layers/mamba/ops/ssd_bmm.py
@@ -6,8 +6,6 @@
 
 # ruff: noqa: E501,SIM102
 
-import math
-
 import torch
 
 from vllm.triton_utils import tl, triton
@@ -96,7 +94,7 @@ def _bmm_chunk_fwd_kernel(
     a_ptr,
     b_ptr,
     out_ptr,
-    seq_idx_ptr,
+    cu_chunk_seqlens_ptr,
     # Matrix dimensions
     seqlen,
     chunk_size: tl.constexpr,
@@ -112,7 +110,6 @@ def _bmm_chunk_fwd_kernel(
     stride_out_head: tl.int64,
     stride_outm: tl.int64,
     stride_outn: tl.constexpr,
-    stride_seq_idx_seqlen: tl.constexpr,
     # Meta-parameters
     IS_CAUSAL: tl.constexpr,
     dot_dtype: tl.constexpr,
@@ -129,10 +126,12 @@ def _bmm_chunk_fwd_kernel(
     if IS_CAUSAL:
         if pid_n * BLOCK_SIZE_N >= (pid_m + 1) * BLOCK_SIZE_M:
             return
-    a_ptr += pid_c * chunk_size * stride_a_seqlen + pid_h * stride_a_head
-    b_ptr += pid_c * chunk_size * stride_b_seqlen + pid_h * stride_b_head
 
-    seq_idx_ptr += pid_c * chunk_size * stride_seq_idx_seqlen
+    chunk_seqlen_start = tl.load(cu_chunk_seqlens_ptr + pid_c)
+    chunk_seqlen_end = tl.load(cu_chunk_seqlens_ptr + pid_c + 1)
+
+    a_ptr += chunk_seqlen_start * stride_a_seqlen + pid_h * stride_a_head
+    b_ptr += chunk_seqlen_start * stride_b_seqlen + pid_h * stride_b_head
 
     offs_m = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M)
     offs_n = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
@@ -141,7 +140,7 @@ def _bmm_chunk_fwd_kernel(
                       offs_k[None, :] * stride_ak)
     b_ptrs = b_ptr + (offs_k[:, None] * stride_bk +
                       offs_n[None, :] * stride_b_seqlen)
-    chunk_size_limit = min(chunk_size, seqlen - pid_c * chunk_size)
+    chunk_size_limit = chunk_seqlen_end - chunk_seqlen_start
 
     acc = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N), dtype=tl.float32)
 
@@ -162,16 +161,6 @@ def _bmm_chunk_fwd_kernel(
     offs_m = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M)
     offs_n = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
 
-    # Zero out the results that are not from the same request
-    # in the varlen batch
-    seq_idx_m = tl.load(seq_idx_ptr + offs_m * stride_seq_idx_seqlen,
-                        mask=offs_m < chunk_size_limit,
-                        other=-1)
-    seq_idx_n = tl.load(seq_idx_ptr + offs_n * stride_seq_idx_seqlen,
-                        mask=offs_n < chunk_size_limit,
-                        other=-2)
-    acc = tl.where(seq_idx_m[:, None] == seq_idx_n[None, :], acc, 0.0)
-
     out = acc.to(out_ptr.dtype.element_ty)
     out_ptr += pid_c * stride_out_chunk + pid_h * stride_out_head
     out_ptrs = out_ptr + (stride_outm * offs_m[:, None] +
@@ -182,12 +171,18 @@ def _bmm_chunk_fwd_kernel(
              (offs_n[None, :] < chunk_size))
 
 
-def _bmm_chunk_fwd(a, b, chunk_size, seq_idx, causal=False, output_dtype=None):
+def _bmm_chunk_fwd(a,
+                   b,
+                   chunk_size,
+                   cu_chunk_seqlens,
+                   causal=False,
+                   output_dtype=None):
     """
     Argument:
         a: (seqlen, ngroups, k)
         b: (seqlen, ngroups, k)
-        seq_idx: (seqlen,). out[i, j] for seq_idx[i] != seq_idx[j] will be zeroed out.
+        chunk_size: int
+        cu_chunk_seq_lens: (nchunks+1,)
         causal: if True, then out[i, j] for i > j will be arbitrary, only out[i, j] for i <= j are
             guaranteed to be correct.
     Return:
@@ -195,14 +190,12 @@ def _bmm_chunk_fwd(a, b, chunk_size, seq_idx, causal=False, output_dtype=None):
     """
     seqlen, ngroups, k = a.shape
     assert b.shape == a.shape
-    assert seq_idx is not None
-    assert seq_idx.shape == (seqlen, )
     if a.stride(-1) != 1 and a.stride(0) != 1:
         a = a.contiguous()
     if b.stride(-1) != 1 and b.stride(0) != 1:
         b = b.contiguous()
 
-    nchunks = math.ceil(seqlen / chunk_size)
+    nchunks = len(cu_chunk_seqlens) - 1
     # Allocates output.
     out_dtype = a.dtype if output_dtype is None else output_dtype
     out = torch.empty((nchunks, ngroups, chunk_size, chunk_size),
@@ -220,7 +213,7 @@ def _bmm_chunk_fwd(a, b, chunk_size, seq_idx, causal=False, output_dtype=None):
             a_ptr=a,
             b_ptr=b,
             out_ptr=out,
-            seq_idx_ptr=seq_idx,
+            cu_chunk_seqlens_ptr=cu_chunk_seqlens,
             seqlen=seqlen,
             chunk_size=chunk_size,
             K=k,
@@ -235,7 +228,6 @@ def _bmm_chunk_fwd(a, b, chunk_size, seq_idx, causal=False, output_dtype=None):
             stride_out_head=out.stride(1),
             stride_outm=out.stride(-2),
             stride_outn=out.stride(-1),
-            stride_seq_idx_seqlen=seq_idx.stride(0),
             IS_CAUSAL=causal,
             dot_dtype=dot_dtype,
         )
diff --git a/vllm/model_executor/layers/mamba/ops/ssd_chunk_scan.py b/vllm/model_executor/layers/mamba/ops/ssd_chunk_scan.py
index add72617fcea..e1e77e14f69d 100644
--- a/vllm/model_executor/layers/mamba/ops/ssd_chunk_scan.py
+++ b/vllm/model_executor/layers/mamba/ops/ssd_chunk_scan.py
@@ -120,9 +120,7 @@ def _chunk_scan_fwd_kernel(
     states_ptr,
     D_ptr,
     initstates_ptr,
-    chunk_indices_ptr,
-    chunk_offsets_ptr,
-    chunk_meta_num,
+    cu_chunk_seqlens_ptr,
     # Matrix dimensions
     chunk_size: tl.constexpr,
     hdim: tl.constexpr,
@@ -149,7 +147,7 @@ def _chunk_scan_fwd_kernel(
     stride_dA_cs_chunk: tl.int64,
     stride_dA_cs_head: tl.int64,
     stride_dA_cs_csize: tl.constexpr,
-    stride_seq_idx_seqlen: tl.constexpr,
+    stride_seq_idx_chunk: tl.constexpr,
     stride_C_seqlen: tl.int64,
     stride_C_head: tl.int64,
     stride_C_dstate: tl.constexpr,
@@ -175,170 +173,107 @@ def _chunk_scan_fwd_kernel(
     HAS_INITSTATES: tl.constexpr,
 ):
     pid_c = tl.program_id(axis=1).to(tl.int64)
-    if not HAS_INITSTATES:
-        c_idx = pid_c
-        c_off = 0
-    else:
-        c_idx = tl.load(chunk_indices_ptr + pid_c, mask=pid_c > -1, other=0)
-        c_off = tl.load(chunk_offsets_ptr + pid_c, mask=pid_c > -1, other=0)
-
     pid_h = tl.program_id(axis=2)
     num_pid_n = tl.cdiv(hdim, BLOCK_SIZE_N)
     pid_m = tl.program_id(axis=0) // num_pid_n
     pid_n = tl.program_id(axis=0) % num_pid_n
-    cb_ptr += c_idx * stride_cb_chunk + (pid_h //
+    cb_ptr += pid_c * stride_cb_chunk + (pid_h //
                                          nheads_ngroups_ratio) * stride_cb_head
-    x_ptr += c_idx * chunk_size * stride_x_seqlen + pid_h * stride_x_head
-    dt_ptr += c_idx * stride_dt_chunk + pid_h * stride_dt_head
-    dA_cumsum_ptr += c_idx * stride_dA_cs_chunk + pid_h * stride_dA_cs_head
-    C_ptr += c_idx * chunk_size * stride_C_seqlen + (
+    chunk_seqlen_start = tl.load(cu_chunk_seqlens_ptr + pid_c)
+    chunk_seqlen_end = tl.load(cu_chunk_seqlens_ptr + pid_c + 1)
+    x_ptr += chunk_seqlen_start * stride_x_seqlen + pid_h * stride_x_head
+    dt_ptr += pid_c * stride_dt_chunk + pid_h * stride_dt_head
+    dA_cumsum_ptr += pid_c * stride_dA_cs_chunk + pid_h * stride_dA_cs_head
+    C_ptr += chunk_seqlen_start * stride_C_seqlen + (
         pid_h // nheads_ngroups_ratio) * stride_C_head
 
     # M-block offsets and prev states
     #  - logic in next block may override these if there is an active offset
-    offs_m = pid_m * BLOCK_SIZE_M + c_off + tl.arange(0, BLOCK_SIZE_M)
-    prev_states_ptr = states_ptr + c_idx * stride_states_chunk + pid_h * stride_states_head
-    prev_states_hdim = stride_states_hdim
-    prev_states_dstate = stride_states_dstate
-
-    chunk_size_limit = min(chunk_size, seqlen - c_idx * chunk_size)
-
-    seq_idx_ptr += c_idx * chunk_size * stride_seq_idx_seqlen
-    # - we only need seq_idx_prev to be aligned to chunk boundary
-    seq_idx_prev = tl.load(seq_idx_ptr - stride_seq_idx_seqlen,
-                           mask=c_idx >= 1,
-                           other=0)
-
-    if HAS_INITSTATES:
-        # if there are init states, we only need seq_idx_m to point
-        # what is the current seq_idx
-
-        # get current seq idx
-        if (pid_m * BLOCK_SIZE_M + c_off) < chunk_size_limit:
-            seq_idx_m = tl.load(
-                seq_idx_ptr +
-                (pid_m * BLOCK_SIZE_M + c_off) * stride_seq_idx_seqlen, )
-
-            # - recall that in ssd_state_passing, for the case c_off == 0
-            # i.e., the very first sequence, we made states_ptr hold its initial state
-            # so this edge case is taken care of
-            if ((c_off == 0) and (seq_idx_prev != seq_idx_m
-                                  )  # if a seq is changed exactly on boundary
-                    or (c_off > 0)  # implies a new example (pseudo chunk)
-                ):
+    offs_m = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M)
+
+    seq_idx_ptr += pid_c * stride_seq_idx_chunk
+    seq_idx = tl.load(seq_idx_ptr)
+    seq_idx_prev = tl.load(seq_idx_ptr - stride_seq_idx_chunk,
+                           mask=pid_c >= 1,
+                           other=-1)
+
+    if HAS_INITSTATES and (seq_idx != seq_idx_prev):
+        prev_states_ptr = initstates_ptr + seq_idx * stride_init_states_batch + pid_h * stride_init_states_head
+        prev_states_hdim = stride_init_states_hdim
+        prev_states_dstate = stride_init_states_dstate
+    else:
+        prev_states_ptr = states_ptr + (
+            pid_c - 1) * stride_states_chunk + pid_h * stride_states_head
+        prev_states_hdim = stride_states_hdim
+        prev_states_dstate = stride_states_dstate
 
-                # - replace prev_states_ptr with init_states
-                prev_states_ptr = initstates_ptr + seq_idx_m * stride_init_states_batch + pid_h * stride_init_states_head
-                prev_states_hdim = stride_init_states_hdim  # override strides
-                prev_states_dstate = stride_init_states_dstate
+    chunk_size_limit = chunk_seqlen_end - chunk_seqlen_start
 
     offs_n = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
     dA_cs_m = tl.load(dA_cumsum_ptr + offs_m * stride_dA_cs_csize,
                       mask=offs_m < chunk_size,
                       other=0.0).to(tl.float32)
 
-    # - handle chunk state limit
-    if HAS_INITSTATES:
-        # have to split this if otherwise compilation will have problems
-        dA_cs_m_boundary = 0.0
-
-        # get the c_idx for the next (logica) chunk
-        c_idx_n = tl.load(
-            chunk_indices_ptr + (pid_c + 1),
-            mask=pid_c > -1 and (pid_c + 1) < chunk_meta_num,
-            other=-1  # to trigger different chunk
-        )
-
-        # - there are things to consider
-        # A. if c_off > 0 then we need to move the dA_cs boundary to ensure correct
-        #    contribution of past states
-        # B. if c_off_n < chunk_size_limit, then we need to adjust this so as not to
-        #    encroach into the next sequence, where c_off_n is the offset of the next
-        #    (logical) chunk.
-        # An equivalent check for B is c_idx == c_idx_n, where there is repetition in
-        # (logical) chunk indices.
-
-        if (c_idx == c_idx_n) or c_off > 0:
-
-            # get the next offset
-            c_off_n = tl.load(chunk_offsets_ptr + (pid_c + 1),
-                              mask=pid_c > -1 and (pid_c + 1) < chunk_meta_num,
-                              other=chunk_size)
-
-            # in this case, adjust down the chunk_size_limit
-            if c_idx == c_idx_n:
-                chunk_size_limit = min(c_off_n, chunk_size_limit)
-
-            # get the cs at the offset boundary
-            # - c_off == 0 is a passthrough
-            # - We need dA_cs at the boundary, defined by c_off - no need
-            #   to increase pointer by pid_m (it is a constant offset,
-            #   i.e. the same for all blocks)
-            dA_cs_m_boundary = tl.load(
-                dA_cumsum_ptr + (c_off - 1) * stride_dA_cs_csize,
-                mask=(((c_off - 1) > -1) and ((c_off) < chunk_size)),
-                other=0.0).to(tl.float32)
-    else:
-        # - handle seq idx when HAS_INITSTATES==False
-        seq_idx_m = tl.load(seq_idx_ptr + offs_m * stride_seq_idx_seqlen,
-                            mask=offs_m < chunk_size_limit,
-                            other=-1)
-
     acc = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N), dtype=tl.float32)
 
-    # Without the if (pid_c > -1), with Triton 2.1.0, I get
-    # Assertion `!(srcMmaLayout && dstMmaLayout) && "Unexpected mma -> mm a layout conversion"' failed.
-    # With Triton 2.2.0, this works
-    if IS_TRITON_22 or c_idx > -1:
-        # Faster to just do 1 iteration with larger BLOCK_SIZE_K, up to block size 128
-        offs_k_dstate = tl.arange(
-            0, BLOCK_SIZE_DSTATE if BLOCK_SIZE_DSTATE <= 128 else BLOCK_SIZE_K)
-        C_ptrs = C_ptr + (offs_m[:, None] * stride_C_seqlen +
-                          offs_k_dstate[None, :] * stride_C_dstate)
+    offs_out_m = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M)
+    offs_out_n = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
 
-        prev_states_ptrs = prev_states_ptr + (
-            offs_n[None, :] * prev_states_hdim +
-            offs_k_dstate[:, None] * prev_states_dstate)
+    # Faster to just do 1 iteration with larger BLOCK_SIZE_K, up to block size 128
+    offs_k_dstate = tl.arange(
+        0, BLOCK_SIZE_DSTATE if BLOCK_SIZE_DSTATE <= 128 else BLOCK_SIZE_K)
+    C_ptrs = C_ptr + (offs_m[:, None] * stride_C_seqlen +
+                      offs_k_dstate[None, :] * stride_C_dstate)
+
+    scale_m = tl.exp(dA_cs_m)
+    if BLOCK_SIZE_DSTATE <= 128:
+        C = tl.load(C_ptrs,
+                    mask=(offs_m[:, None] < chunk_size_limit) &
+                    (offs_k_dstate[None, :] < dstate),
+                    other=0.0)
 
-        if not HAS_INITSTATES:
-            # - this is for continuous batching where there is no init states
-            scale_m = tl.where(seq_idx_m == seq_idx_prev, tl.exp(dA_cs_m), 0.0)
+        if not HAS_INITSTATES and (seq_idx != seq_idx_prev):
+            # if no init states AND starting a new sequence, we need zeros
+            prev_states = tl.zeros((BLOCK_SIZE_DSTATE, BLOCK_SIZE_N),
+                                   dtype=C_ptr.dtype.element_ty)
         else:
-            # - if there is initstates, we will rely on prev_states, no zeroing
-            #   required.
-            scale_m = tl.exp(dA_cs_m - dA_cs_m_boundary)
-
-        if BLOCK_SIZE_DSTATE <= 128:
-            C = tl.load(C_ptrs,
-                        mask=(offs_m[:, None] < chunk_size_limit) &
-                        (offs_k_dstate[None, :] < dstate),
-                        other=0.0)
-
+            # otherwise read the previous state
+            prev_states_ptrs = prev_states_ptr \
+                    + offs_n[None, :] * prev_states_hdim \
+                    + offs_k_dstate[:, None] * prev_states_dstate
             prev_states = tl.load(prev_states_ptrs,
                                   mask=(offs_k_dstate[:, None] < dstate) &
                                   (offs_n[None, :] < hdim),
                                   other=0.0)
             prev_states = prev_states.to(C_ptr.dtype.element_ty)
-            acc = tl.dot(C, prev_states) * scale_m[:, None]
-        else:
-            for k in range(0, dstate, BLOCK_SIZE_K):
-                C = tl.load(C_ptrs,
-                            mask=(offs_m[:, None] < chunk_size_limit) &
-                            (offs_k_dstate[None, :] < dstate - k),
-                            other=0.0)
-                # C = (C * scale_m[:, None]).to(C_ptr.dtype.element_ty)
+
+        acc = tl.dot(C, prev_states) * scale_m[:, None]
+
+    else:
+        prev_states_ptrs = prev_states_ptr \
+                        + offs_n[None, :] * prev_states_hdim \
+                        + offs_k_dstate[:, None] * prev_states_dstate
+        for k in range(0, dstate, BLOCK_SIZE_K):
+            C = tl.load(C_ptrs,
+                        mask=(offs_m[:, None] < chunk_size_limit) &
+                        (offs_k_dstate[None, :] < dstate - k),
+                        other=0.0)
+            if not HAS_INITSTATES and (seq_idx != seq_idx_prev):
+                prev_states = tl.zeros((BLOCK_SIZE_DSTATE, BLOCK_SIZE_K),
+                                       dtype=C_ptr.dtype.element_ty)
+            else:
                 prev_states = tl.load(
                     prev_states_ptrs,
                     mask=(offs_k_dstate[:, None] < dstate - k) &
                     (offs_n[None, :] < hdim),
                     other=0.0)
                 prev_states = prev_states.to(C_ptr.dtype.element_ty)
-                acc += tl.dot(C, prev_states)
-                C_ptrs += BLOCK_SIZE_K
-                prev_states_ptrs += BLOCK_SIZE_K
-            acc *= scale_m[:, None]
+            acc += tl.dot(C, prev_states)
+            C_ptrs += BLOCK_SIZE_K
+            prev_states_ptrs += BLOCK_SIZE_K
+        acc *= scale_m[:, None]
 
-    offs_k = tl.arange(0, BLOCK_SIZE_K) + c_off
+    offs_k = tl.arange(0, BLOCK_SIZE_K)
     cb_ptrs = cb_ptr + (offs_m[:, None] * stride_cb_csize_m +
                         offs_k[None, :] * stride_cb_csize_k)
     x_ptrs = x_ptr + (offs_k[:, None] * stride_x_seqlen +
@@ -375,7 +310,7 @@ def _chunk_scan_fwd_kernel(
         dt_ptrs += BLOCK_SIZE_K * stride_dt_csize
         dA_cumsum_ptrs += BLOCK_SIZE_K * stride_dA_cs_csize
 
-    offs_out_m = pid_m * BLOCK_SIZE_M + c_off + tl.arange(0, BLOCK_SIZE_M)
+    offs_out_m = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M)
     offs_out_n = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
 
     if HAS_D:
@@ -393,7 +328,7 @@ def _chunk_scan_fwd_kernel(
         acc += x_residual * D
 
     if HAS_Z:
-        z_ptr += c_idx * chunk_size * stride_z_seqlen + pid_h * stride_z_head
+        z_ptr += chunk_seqlen_start * stride_z_seqlen + pid_h * stride_z_head
         z_ptrs = z_ptr + (stride_z_seqlen * offs_out_m[:, None] +
                           stride_z_hdim * offs_out_n[None, :])
         z = tl.load(z_ptrs,
@@ -402,7 +337,7 @@ def _chunk_scan_fwd_kernel(
                     other=0.0).to(tl.float32)
         acc *= z * tl.sigmoid(z)
 
-    out_ptr += c_idx * chunk_size * stride_out_seqlen + pid_h * stride_out_head
+    out_ptr += chunk_seqlen_start * stride_out_seqlen + pid_h * stride_out_head
     out_ptrs = out_ptr + (stride_out_seqlen * offs_out_m[:, None] +
                           offs_out_n[None, :] * stride_out_hdim)
     tl.store(out_ptrs,
@@ -418,12 +353,11 @@ def _chunk_scan_fwd(
     dA_cumsum,
     C,
     states,
+    cu_chunk_seqlens,
     out,
     seq_idx,
     D=None,
     z=None,
-    chunk_indices=None,
-    chunk_offsets=None,
     initial_states=None,
 ):
     assert seq_idx is not None, "this implementation requires seq_idx"
@@ -441,20 +375,10 @@ def _chunk_scan_fwd(
     assert dt.shape == (nheads, nchunks, chunk_size)
     assert dA_cumsum.shape == (nheads, nchunks, chunk_size)
     assert states.shape == (nchunks, nheads, headdim, dstate)
-    assert seq_idx.shape == (seqlen, )
-
-    if initial_states is not None:
-        # with initial states, we need to take care of how
-        # seq_idx crosses the boundaries
-        assert chunk_indices is not None and chunk_offsets is not None, \
-            "chunk_indices and chunk_offsets should have been set"
-    else:
-        chunk_indices, chunk_offsets = None, None
+    assert seq_idx.shape == (nchunks, )
 
-    grid = lambda META: (
-        triton.cdiv(chunk_size, META['BLOCK_SIZE_M']) * triton.cdiv(
-            headdim, META['BLOCK_SIZE_N']), nchunks
-        if chunk_offsets is None else len(chunk_offsets), nheads)
+    grid = lambda META: (triton.cdiv(chunk_size, META['BLOCK_SIZE_M']) * triton
+                         .cdiv(headdim, META['BLOCK_SIZE_N']), nchunks, nheads)
 
     z_strides = ((z.stride(0), z.stride(1), z.stride(2)) if z is not None else
                  (0, 0, 0))
@@ -476,9 +400,7 @@ def _chunk_scan_fwd(
         states_ptr=states,
         D_ptr=D,
         initstates_ptr=initial_states,
-        chunk_indices_ptr=chunk_indices,
-        chunk_offsets_ptr=chunk_offsets,
-        chunk_meta_num=len(chunk_indices) if chunk_indices is not None else 0,
+        cu_chunk_seqlens_ptr=cu_chunk_seqlens,
         chunk_size=chunk_size,
         hdim=headdim,
         dstate=dstate,
@@ -503,7 +425,7 @@ def _chunk_scan_fwd(
         stride_dA_cs_chunk=dA_cumsum.stride(1),
         stride_dA_cs_head=dA_cumsum.stride(0),
         stride_dA_cs_csize=dA_cumsum.stride(2),
-        stride_seq_idx_seqlen=seq_idx.stride(0),
+        stride_seq_idx_chunk=seq_idx.stride(0),
         stride_C_seqlen=C.stride(0),
         stride_C_head=C.stride(1),
         stride_C_dstate=C.stride(2),
diff --git a/vllm/model_executor/layers/mamba/ops/ssd_chunk_state.py b/vllm/model_executor/layers/mamba/ops/ssd_chunk_state.py
index 8ee41f2cbc1b..3a3e0f293459 100644
--- a/vllm/model_executor/layers/mamba/ops/ssd_chunk_state.py
+++ b/vllm/model_executor/layers/mamba/ops/ssd_chunk_state.py
@@ -6,8 +6,6 @@
 
 # ruff: noqa: E501
 
-import math
-
 import torch
 
 from vllm.triton_utils import tl, triton
@@ -34,6 +32,7 @@ def _chunk_cumsum_fwd_kernel(
     dt_bias_ptr,
     dt_out_ptr,
     dA_cumsum_ptr,
+    cu_chunk_seqlens_ptr,
     # Matrix dimension
     seqlen,
     nheads: tl.constexpr,
@@ -61,7 +60,11 @@ def _chunk_cumsum_fwd_kernel(
     # https://github.com/triton-lang/triton/issues/1058
     pid_c = tl.program_id(axis=0).to(tl.int64)
     pid_h = tl.program_id(axis=1)
-    dt_ptr += pid_c * chunk_size * stride_dt_seqlen
+
+    chunk_seqlen_start = tl.load(cu_chunk_seqlens_ptr + pid_c)
+    chunk_seqlen_end = tl.load(cu_chunk_seqlens_ptr + pid_c + 1)
+
+    dt_ptr += chunk_seqlen_start * stride_dt_seqlen
     dt_out_ptr += pid_c * stride_dt_out_chunk
     dA_cumsum_ptr += pid_c * stride_dA_cs_chunk
 
@@ -74,7 +77,7 @@ def _chunk_cumsum_fwd_kernel(
                                 offs_c[None, :] * stride_dt_out_csize)
     dA_cs_ptrs = dA_cumsum_ptr + (offs_h[:, None] * stride_dA_cs_head +
                                   offs_c[None, :] * stride_dA_cs_csize)
-    chunk_size_limit = min(chunk_size, seqlen - pid_c * chunk_size)
+    chunk_size_limit = chunk_seqlen_end - chunk_seqlen_start
 
     dt = tl.load(dt_ptrs,
                  mask=(offs_h[:, None] < nheads) &
@@ -188,7 +191,7 @@ def _chunk_state_fwd_kernel(
     states_ptr,
     dt_ptr,
     dA_cumsum_ptr,
-    seq_idx_ptr,
+    cu_chunk_seqlens_ptr,
     # Matrix dimensions
     hdim: tl.constexpr,
     dstate: tl.constexpr,
@@ -212,7 +215,6 @@ def _chunk_state_fwd_kernel(
     stride_dA_cs_head: tl.int64,
     stride_dA_cs_chunk: tl.int64,
     stride_dA_cs_csize: tl.constexpr,
-    stride_seq_idx_seqlen: tl.constexpr,
     # Meta-parameters
     BLOCK_SIZE_M: tl.constexpr,
     BLOCK_SIZE_N: tl.constexpr,
@@ -223,14 +225,14 @@ def _chunk_state_fwd_kernel(
     num_pid_n = tl.cdiv(dstate, BLOCK_SIZE_N)
     pid_m = tl.program_id(axis=0) // num_pid_n
     pid_n = tl.program_id(axis=0) % num_pid_n
-    b_ptr += pid_c * chunk_size * stride_b_seqlen + (
+    chunk_seqlen_start = tl.load(cu_chunk_seqlens_ptr + pid_c)
+    chunk_seqlen_end = tl.load(cu_chunk_seqlens_ptr + pid_c + 1)
+    b_ptr += chunk_seqlen_start * stride_b_seqlen + (
         pid_h // nheads_ngroups_ratio) * stride_b_head
-    x_ptr += pid_c * chunk_size * stride_x_seqlen + pid_h * stride_x_head
+    x_ptr += chunk_seqlen_start * stride_x_seqlen + pid_h * stride_x_head
     dt_ptr += pid_c * stride_dt_chunk + pid_h * stride_dt_head
     dA_cumsum_ptr += pid_c * stride_dA_cs_chunk + pid_h * stride_dA_cs_head
 
-    seq_idx_ptr += pid_c * chunk_size * stride_seq_idx_seqlen
-
     offs_m = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M)
     offs_n = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
     offs_k = tl.arange(0, BLOCK_SIZE_K)
@@ -243,10 +245,7 @@ def _chunk_state_fwd_kernel(
                          (chunk_size - 1) * stride_dA_cs_csize).to(tl.float32)
     dA_cumsum_ptrs = dA_cumsum_ptr + offs_k * stride_dA_cs_csize
 
-    seq_idx_ptrs = seq_idx_ptr + offs_k * stride_seq_idx_seqlen
-    chunk_size_limit = min(chunk_size, seqlen - pid_c * chunk_size)
-    seq_idx_last = tl.load(seq_idx_ptr +
-                           (chunk_size_limit - 1) * stride_seq_idx_seqlen)
+    chunk_size_limit = chunk_seqlen_end - chunk_seqlen_start
 
     acc = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N), dtype=tl.float32)
     for k in range(0, chunk_size_limit, BLOCK_SIZE_K):
@@ -261,15 +260,9 @@ def _chunk_state_fwd_kernel(
         dA_cs_k = tl.load(dA_cumsum_ptrs,
                           mask=offs_k < chunk_size_limit - k,
                           other=0.0).to(tl.float32)
-
-        seq_idx_k = tl.load(seq_idx_ptrs,
-                            mask=offs_k < chunk_size_limit - k,
-                            other=-1)
         dt_k = tl.load(dt_ptrs, mask=offs_k < chunk_size_limit - k,
                        other=0.0).to(tl.float32)
-
-        scale = tl.where(seq_idx_k == seq_idx_last,
-                         tl.exp(dA_cs_last - dA_cs_k) * dt_k, 0.0)
+        scale = tl.exp(dA_cs_last - dA_cs_k) * dt_k
         b *= scale[:, None]
         b = b.to(x_ptr.dtype.element_ty)
         acc += tl.dot(x, b)
@@ -278,7 +271,6 @@ def _chunk_state_fwd_kernel(
         b_ptrs += BLOCK_SIZE_K * stride_b_seqlen
         dt_ptrs += BLOCK_SIZE_K * stride_dt_csize
         dA_cumsum_ptrs += BLOCK_SIZE_K * stride_dA_cs_csize
-        seq_idx_ptrs += BLOCK_SIZE_K * stride_seq_idx_seqlen
 
     states = acc.to(states_ptr.dtype.element_ty)
 
@@ -534,6 +526,7 @@ def _chunk_state_varlen_kernel(
 def _chunk_cumsum_fwd(dt,
                       A,
                       chunk_size,
+                      cu_chunk_seqlens,
                       dt_bias=None,
                       dt_softplus=False,
                       dt_limit=(0.0, float("inf"))):
@@ -541,7 +534,7 @@ def _chunk_cumsum_fwd(dt,
     assert A.shape == (nheads, )
     if dt_bias is not None:
         assert dt_bias.shape == (nheads, )
-    nchunks = math.ceil(seqlen / chunk_size)
+    nchunks = cu_chunk_seqlens.shape[0] - 1
     dt_out = torch.empty(nheads,
                          nchunks,
                          chunk_size,
@@ -561,6 +554,7 @@ def _chunk_cumsum_fwd(dt,
             dt_bias_ptr=dt_bias,
             dt_out_ptr=dt_out,
             dA_cumsum_ptr=dA_cumsum,
+            cu_chunk_seqlens_ptr=cu_chunk_seqlens,
             seqlen=seqlen,
             nheads=nheads,
             chunk_size=chunk_size,
@@ -588,7 +582,7 @@ def _chunk_state_fwd(B,
                      x,
                      dt,
                      dA_cumsum,
-                     seq_idx=None,
+                     cu_chunk_seqlens,
                      states=None,
                      states_in_fp32=True):
     seqlen, nheads, headdim = x.shape
@@ -599,9 +593,6 @@ def _chunk_state_fwd(B,
     assert dt.shape == (nheads, nchunks, chunk_size)
     assert dA_cumsum.shape == dt.shape
 
-    assert seq_idx is not None
-    assert seq_idx.shape == (seqlen, )
-
     if states is not None:
         assert states.shape == (nchunks, nheads, headdim, dstate)
     else:
@@ -619,7 +610,7 @@ def _chunk_state_fwd(B,
             states_ptr=states,
             dt_ptr=dt,
             dA_cumsum_ptr=dA_cumsum,
-            seq_idx_ptr=seq_idx,
+            cu_chunk_seqlens_ptr=cu_chunk_seqlens,
             hdim=headdim,
             dstate=dstate,
             chunk_size=chunk_size,
@@ -641,7 +632,6 @@ def _chunk_state_fwd(B,
             stride_dA_cs_head=dA_cumsum.stride(0),
             stride_dA_cs_chunk=dA_cumsum.stride(1),
             stride_dA_cs_csize=dA_cumsum.stride(2),
-            stride_seq_idx_seqlen=seq_idx.stride(0),
         )
     return states
 
diff --git a/vllm/model_executor/layers/mamba/ops/ssd_combined.py b/vllm/model_executor/layers/mamba/ops/ssd_combined.py
index 37d6c2870812..f3eb61d5840e 100644
--- a/vllm/model_executor/layers/mamba/ops/ssd_combined.py
+++ b/vllm/model_executor/layers/mamba/ops/ssd_combined.py
@@ -14,8 +14,7 @@
 
 from .ssd_bmm import _bmm_chunk_fwd
 from .ssd_chunk_scan import _chunk_scan_fwd
-from .ssd_chunk_state import (_chunk_cumsum_fwd, _chunk_state_fwd,
-                              chunk_state_varlen)
+from .ssd_chunk_state import _chunk_cumsum_fwd, _chunk_state_fwd
 from .ssd_state_passing import _state_passing_fwd
 
 TRITON_22 = version.parse(triton.__version__) >= version.parse('2.2.0')
@@ -37,9 +36,9 @@ def _mamba_chunk_scan_combined_fwd(x,
                                    dt_bias=None,
                                    initial_states=None,
                                    seq_idx=None,
-                                   chunk_indices=None,
-                                   chunk_offsets=None,
                                    cu_seqlens=None,
+                                   cu_chunk_seqlens=None,
+                                   last_chunk_indices=None,
                                    dt_softplus=False,
                                    dt_limit=(0.0, float("inf")),
                                    state_dtype=None):
@@ -56,7 +55,7 @@ def _mamba_chunk_scan_combined_fwd(x,
     if D is not None:
         assert D.shape == (nheads, headdim) or D.shape == (nheads, )
     if seq_idx is not None:
-        assert seq_idx.shape == (seqlen, )
+        assert seq_idx.shape == (cu_chunk_seqlens.shape[0] - 1, )
     if B.stride(-1) != 1:
         B = B.contiguous()
     if C.stride(-1) != 1:
@@ -89,6 +88,7 @@ def _mamba_chunk_scan_combined_fwd(x,
     dA_cumsum, dt = _chunk_cumsum_fwd(dt,
                                       A,
                                       chunk_size,
+                                      cu_chunk_seqlens,
                                       dt_bias=dt_bias,
                                       dt_softplus=dt_softplus,
                                       dt_limit=dt_limit)
@@ -99,36 +99,31 @@ def _mamba_chunk_scan_combined_fwd(x,
                               x,
                               dt,
                               dA_cumsum,
-                              seq_idx=seq_idx,
+                              cu_chunk_seqlens,
                               states_in_fp32=True)
 
     # 3. Compute the inter-chunk SSM recurrence; produces correct SSM states at chunk boundaries
     # (middle term of factorization of off-diag blocks; A terms)
-    # - for handling chunked prefill, this requires i) initial_states
-    #   ii) seq_idx iii) is_cont_batched and (iv) chunk_offsets to be all specified.
+    # - for handling chunked prefill, this requires i) initial_states and
+    #   ii) seq_idx to be all specified.
     # - When a new seq_idx is detected, we will stop passing the prev_state
     #   and switch accordingly to the init_state corresponding to the new seq_idx.
-    # - We will also make sure that the dA_cumsum is taken only from the start of the
-    #   sequence (hence we need the full dA_cumsum tensor and not just the values at chunk boundaries)
-    # - this will ensure that states will be updated with the rightmost flushed seq_idx
-    #   of the previous chunk. This implies that the first chunk of states is either 0
-    #   or equal to init_states of the first example.
     states = _state_passing_fwd(
         rearrange(states, "... p n -> ... (p n)"),
         dA_cumsum,  # (nheads, nchunks, chunk_size)
+        cu_chunk_seqlens,
         initial_states=rearrange(initial_states, "... p n -> ... (p n)")
         if initial_states is not None else
         None,  # (batch, nheads, headdim*dstate)
         seq_idx=seq_idx,
-        out_dtype=state_dtype if state_dtype is not None else C.dtype,
-        chunk_offsets=chunk_offsets)
+        out_dtype=state_dtype if state_dtype is not None else C.dtype)
     states = rearrange(states, "... (p n) -> ... p n", n=dstate)
 
     # 4. Compute batched matrix multiply for C_j^T B_i terms
     CB = _bmm_chunk_fwd(C,
                         B,
                         chunk_size,
-                        seq_idx=seq_idx,
+                        cu_chunk_seqlens,
                         output_dtype=torch.float32)
 
     # 5. Scan and compute the diagonal blocks, taking into
@@ -148,26 +143,15 @@ def _mamba_chunk_scan_combined_fwd(x,
         dA_cumsum,
         C,
         states,
+        cu_chunk_seqlens,
         out,  # in-place update
         seq_idx,
         D=D,
         z=z,
-        chunk_indices=chunk_indices,
-        chunk_offsets=chunk_offsets,
         initial_states=initial_states,
     )
 
-    varlen_states = chunk_state_varlen(
-        B,
-        x,
-        dt,
-        dA_cumsum,
-        cu_seqlens,
-        states,
-        initial_states=initial_states,
-    )
-
-    return varlen_states
+    return states[last_chunk_indices]
 
 
 def mamba_chunk_scan_combined_varlen(
@@ -178,14 +162,14 @@ def mamba_chunk_scan_combined_varlen(
         C,
         chunk_size,
         cu_seqlens,
+        cu_chunk_seqlens,
+        last_chunk_indices,
         seq_idx,
         out,
         D=None,
         z=None,
         dt_bias=None,
         initial_states=None,
-        chunk_indices=None,
-        chunk_offsets=None,
         dt_softplus=False,
         dt_limit=(0.0, float("inf")),
         state_dtype=None,
@@ -198,8 +182,10 @@ def mamba_chunk_scan_combined_varlen(
         B: (seqlen, ngroups, dstate)
         C: (seqlen, ngroups, dstate)
         chunk_size: int
-        seq_idx: (seqlen)
-        cu_seqlens: (batch + 1)
+        cu_seqlens: (batch + 1,)
+        cu_chunk_seqlens: (nchunks + 1,)
+        last_chunk_indices: (batch,)
+        seq_idx: (nchunks,)
         out: (seqlen, nheads, headdim) preallocated output tensor
         D: (nheads, headdim) or (nheads,)
         z: (seqlen, nheads, headdim)
@@ -228,9 +214,9 @@ def mamba_chunk_scan_combined_varlen(
         dt_bias=dt_bias,
         initial_states=initial_states,
         seq_idx=seq_idx,
-        chunk_indices=chunk_indices,
-        chunk_offsets=chunk_offsets,
         cu_seqlens=cu_seqlens,
+        cu_chunk_seqlens=cu_chunk_seqlens,
+        last_chunk_indices=last_chunk_indices,
         dt_softplus=dt_softplus,
         dt_limit=dt_limit,
         state_dtype=state_dtype)
diff --git a/vllm/model_executor/layers/mamba/ops/ssd_state_passing.py b/vllm/model_executor/layers/mamba/ops/ssd_state_passing.py
index 71a8a4b0a1c8..f09af262cfc2 100644
--- a/vllm/model_executor/layers/mamba/ops/ssd_state_passing.py
+++ b/vllm/model_executor/layers/mamba/ops/ssd_state_passing.py
@@ -30,8 +30,7 @@ def _state_passing_fwd_kernel(
     dA_cs_ptr,
     initstates_ptr,
     seq_idx_ptr,
-    chunk_offsets_ptr,
-    chunk_meta_num,
+    cu_chunk_seqlens_ptr,
     # Matrix dimensions
     dim: tl.constexpr,
     nchunks,
@@ -50,94 +49,52 @@ def _state_passing_fwd_kernel(
     stride_initstates_batch: tl.int64,
     stride_initstates_head: tl.int64,
     stride_initstates_dim: tl.constexpr,
-    stride_seq_idx_seqlen: tl.constexpr,
+    stride_seq_idx_chunk: tl.constexpr,
     # Meta-parameters
     HAS_INITSTATES: tl.constexpr,
     BLOCK_SIZE: tl.constexpr,
 ):
     pid_h = tl.program_id(axis=1)
     pid_m = tl.program_id(axis=0)
+
     states_ptr += pid_h * stride_states_head
     dA_cs_ptr += pid_h * stride_dA_cs_head + (chunk_size -
                                               1) * stride_dA_cs_csize
     out_ptr += pid_h * stride_out_head
-    if HAS_INITSTATES:
-        initstates_ptr += pid_h * stride_initstates_head
 
     offs_m = pid_m * BLOCK_SIZE + tl.arange(0, BLOCK_SIZE)
     states_ptrs = states_ptr + offs_m * stride_states_dim
     out_ptrs = out_ptr + offs_m * stride_out_dim
 
-    # - states will be the past state of the sequence that continues on the current check
-    if not HAS_INITSTATES:
-        states = tl.zeros((BLOCK_SIZE, ), dtype=tl.float32)
-    else:
-        initstates_ptr += offs_m * stride_initstates_dim
-        initstates_ptrs = initstates_ptr
-        # - for cont batches, for the first chunk mean it will be the first batch's
-        #   init state
+    if HAS_INITSTATES:
+        initstates_ptrs = initstates_ptr \
+            + pid_h * stride_initstates_head \
+            + offs_m * stride_initstates_dim
+
         states = tl.load(initstates_ptrs, mask=offs_m < dim,
                          other=0.0).to(tl.float32)
+    else:
+        states = tl.zeros((BLOCK_SIZE, ), dtype=tl.float32)
 
-    tl.store(out_ptrs, states, mask=offs_m < dim)
-    out_ptrs += stride_out_chunk
-    prev_seq_idx_chunk_end = 0
-    logical_chunk_idx = 0
-    for c in range(nchunks - 1):
+    prev_seq_idx = 0
+    for c in range(nchunks):
         new_states = tl.load(states_ptrs, mask=offs_m < dim,
                              other=0.0).to(tl.float32)
         dA_cs = tl.load(dA_cs_ptr).to(tl.float32)
-        scale_mask = True
-        # - the seq to pass forward is the one that is flushed to the right
-        #   boundary.
-        # - that is given by seq_idx_chunk_end below: the sequence index at the end of the chunk.
-        seq_idx_chunk_end = tl.load(seq_idx_ptr +
-                                    (min((c + 1) * chunk_size, seqlen) - 1) *
-                                    stride_seq_idx_seqlen)
-
-        if HAS_INITSTATES:
-            if prev_seq_idx_chunk_end != seq_idx_chunk_end:
-                # this means in the current chunk the rightmost flushed seq
-                # has changed.
-                # - so we do not propagate the state from previous chunk
-                # - but rather we load that sequence's init state
-                initstates_ptrs = initstates_ptr + seq_idx_chunk_end * stride_initstates_batch
-
-                # - update state with seq_idx_new's init state
+        seq_idx = tl.load(seq_idx_ptr + c * stride_seq_idx_chunk)
+        # we have started a new sequence
+        if prev_seq_idx != seq_idx:
+            if HAS_INITSTATES:
+                initstates_ptrs = initstates_ptr + seq_idx * stride_initstates_batch \
+                    + pid_h * stride_initstates_head \
+                    + offs_m * stride_initstates_dim
                 states = tl.load(initstates_ptrs, mask=offs_m < dim,
                                  other=0.0).to(tl.float32)
+            else:
+                states = tl.zeros((BLOCK_SIZE, ), dtype=tl.float32)
 
-                # - we need to consider the cumsum only of the last sequence in the chunk
-                # - find its starting position (given by c_off of the logical chunk index)
-                # - and subtract the cumsum just before that position from the total cumsum
-                # - first, update the logical chunk index (add the number of sequences in the current physical chunk):
-                # sequence index at the start of the current chunk
-                seq_idx_chunk_start = tl.load(seq_idx_ptr +
-                                              min(c * chunk_size, seqlen) *
-                                              stride_seq_idx_seqlen)
-                logical_chunk_idx += seq_idx_chunk_end - seq_idx_chunk_start
-                # - load the chunk offset:
-                c_off = tl.load(chunk_offsets_ptr + logical_chunk_idx,
-                                mask=logical_chunk_idx < chunk_meta_num,
-                                other=0)
-                # - if offset is 0, then the sequence starts at the beginning of the chunk, and we don't need to subtract anything
-                if c_off > 0:
-                    # - dA_cs_ptr currently points to the cumsum at the end of the chunk - subtract the chunk size and add the offset
-                    dA_cs_boundary = tl.load(
-                        dA_cs_ptr - (chunk_size - 1) * stride_dA_cs_csize +
-                        (c_off - 1) * stride_dA_cs_csize,
-                        mask=(c_off - 1) > -1 and c_off < chunk_size,
-                        other=0.0)
-                    dA_cs -= dA_cs_boundary
-
-            # - increment logical chunk index for every physical chunk
-            logical_chunk_idx += 1
-        else:
-            scale_mask = seq_idx_chunk_end == prev_seq_idx_chunk_end
-        prev_seq_idx_chunk_end = seq_idx_chunk_end
-
-        scale = tl.where(scale_mask, tl.exp(dA_cs), 0.0)
-        states = scale * states + new_states
+        prev_seq_idx = seq_idx
+        states = tl.exp(dA_cs) * states + new_states
         tl.store(out_ptrs, states, mask=offs_m < dim)
 
         states_ptrs += stride_states_chunk
@@ -148,8 +105,8 @@ def _state_passing_fwd_kernel(
 def _state_passing_fwd(
     states,
     dA_cumsum,
+    cu_chunk_seqlens,
     seq_idx,
-    chunk_offsets,
     initial_states=None,
     out_dtype=None,
 ):
@@ -175,9 +132,7 @@ def _state_passing_fwd(
             dA_cs_ptr=dA_cumsum,
             initstates_ptr=initial_states,
             seq_idx_ptr=seq_idx,
-            chunk_offsets_ptr=chunk_offsets,
-            chunk_meta_num=len(chunk_offsets)
-            if chunk_offsets is not None else 0,
+            cu_chunk_seqlens_ptr=cu_chunk_seqlens,
             dim=dim,
             nchunks=nchunks,
             seqlen=seqlen if seq_idx is not None else 0,
@@ -194,7 +149,7 @@ def _state_passing_fwd(
             stride_initstates_batch=initial_states_strides[0],
             stride_initstates_head=initial_states_strides[1],
             stride_initstates_dim=initial_states_strides[2],
-            stride_seq_idx_seqlen=seq_idx.stride(0),
+            stride_seq_idx_chunk=seq_idx.stride(0),
             HAS_INITSTATES=initial_states is not None,
         )
     return out
diff --git a/vllm/model_executor/models/plamo2.py b/vllm/model_executor/models/plamo2.py
index 03265b13de50..8234d40e94ab 100644
--- a/vllm/model_executor/models/plamo2.py
+++ b/vllm/model_executor/models/plamo2.py
@@ -260,9 +260,9 @@ def forward_cuda(
             prep_initial_states = attn_metadata.prep_initial_states
             chunk_size = attn_metadata.chunk_size
             seq_idx_p = attn_metadata.seq_idx_p
-            chunk_indices_p = attn_metadata.chunk_indices_p
-            chunk_offsets_p = attn_metadata.chunk_offsets_p
             query_start_loc_p = attn_metadata.query_start_loc_p
+            cu_chunk_seqlen_p = attn_metadata.cu_chunk_seqlen_p
+            last_chunk_indices_p = attn_metadata.last_chunk_indices_p
 
         # 1. Gated MLP's linear projection
         projected_states = self.in_proj(hidden_states)
@@ -368,9 +368,9 @@ def forward_cuda(
                               self.num_heads // self.tp_size, self.head_dim),
                 dt_bias=self.dt_bias,
                 seq_idx=seq_idx_p,
-                chunk_indices=chunk_indices_p,
-                chunk_offsets=chunk_offsets_p,
                 cu_seqlens=query_start_loc_p,
+                cu_chunk_seqlens=cu_chunk_seqlen_p,
+                last_chunk_indices=last_chunk_indices_p,
                 initial_states=initial_states,
                 dt_softplus=True,
                 dt_limit=(0.0, float("inf")),
diff --git a/vllm/v1/attention/backends/mamba2_attn.py b/vllm/v1/attention/backends/mamba2_attn.py
index 6f16fda962ae..e4f16f37a430 100644
--- a/vllm/v1/attention/backends/mamba2_attn.py
+++ b/vllm/v1/attention/backends/mamba2_attn.py
@@ -1,6 +1,5 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-import math
 from dataclasses import dataclass
 from typing import Optional
 
@@ -8,6 +7,7 @@
 
 from vllm.attention.backends.abstract import AttentionBackend
 from vllm.config import VllmConfig
+from vllm.utils import cdiv
 from vllm.v1.attention.backends.mamba_attn import (
     BaseMambaAttentionMetadataBuilder)
 from vllm.v1.attention.backends.utils import (PAD_SLOT_ID,
@@ -17,91 +17,6 @@
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 
-def _query_start_loc_to_chunk_indices_offsets(
-        query_start_loc: torch.Tensor, chunk_size: int,
-        total_seqlens: int) -> tuple[torch.Tensor, torch.Tensor]:
-    """
-    Args:
-        query_start_loc (torch.Tensor): 1D tensor of cumulative sequence 
-            lengths, shape (num_seqs + 1,).
-            The first element should be 0. Each entry represents the starting
-            index of a sequence in the flattened token array.
-        chunk_size (int): The size of each physical mamba chunk
-            (number of tokens per chunk).
-        total_seqlens (int): The total number of tokens in the batch.
-
-    Returns:
-        Tuple[torch.Tensor, torch.Tensor]: A tuple containing:
-            - chunk_indices (torch.Tensor): 1D tensor of indices 
-                indicating the physical chunk for each logical chunk.
-            - chunk_offsets (torch.Tensor): 1D tensor of offsets
-                indicating the starting index of each logical chunk within
-                its physical chunk.
-
-    This function computes the chunk indices and offsets for the given
-    query_start_loc and chunk_size. Both are tensors of integers with length N,
-    where N is the number of logical (pseudo) chunks.
-    A logical chunk is a sequence of tokens that are all part of the same
-    sequence and are all in the same physical mamba chunk.
-    In other words, a logical chunk changes every time we cross a sequence
-    boundary or a physical mamba chunk boundary.
-    Logical chunks are needed to handle batched requests with initial states
-    (see _state_passing_fwd and _chunk_scan_fwd).
-    The chunk_indices tensor contains the index of the physical chunk for each
-    logical chunk.
-    The chunk_offsets tensor contains the offset (AKA starting index) of the
-    logical chunk in the physical chunk.
-
-    Example:
-    query_start_loc = [0, 5, 10]
-    chunk_size = 8
-    total_seqlens = 10
-    -> chunk_indices = [0, 0, 1]
-    -> chunk_offsets = [0, 5, 0]
-
-    In this example, we have 2 sequences, each with 5 tokens. The physical
-    chunk size is 8 tokens.
-    We have three logical chunks:
-    - the first logical chunk starts at token 0 in the first physical chunk
-        and contains all 5 tokens from the first sequence
-    - the second logical chunk starts at token 5 in the first physical chunk
-        and contains first 3 tokens from the second sequence
-    - the third logical chunk starts at token 0 in the second physical chunk
-        and contains the remaining 2 tokens from the second sequence
-    """
-
-    cu_seqlens = query_start_loc[1:]  # remove prepended 0
-
-    # outputs will have length expansion of chunks that do not divide
-    # chunk_size
-    N = math.ceil(total_seqlens / chunk_size) + (cu_seqlens[:-1] % chunk_size
-                                                 > 0).sum()
-    chunk_indices = torch.arange(N,
-                                 dtype=torch.int,
-                                 device=query_start_loc.device)
-    chunk_offsets = torch.zeros((N, ),
-                                dtype=torch.int,
-                                device=query_start_loc.device)
-
-    p = 0  # num of insertions
-    for s, e in zip(cu_seqlens[:-1], cu_seqlens[1:]):
-
-        # if does not divide chunk_size, then there is one chunk insertion
-        p += (s % chunk_size > 0)
-
-        # get the dimensions
-        # - the + 1 for _e is to shift the boundary by one chunk
-        # - this shifting is not needed if chunk_size divides e
-        _s, _e = s // chunk_size + p, e // chunk_size + p + (e % chunk_size
-                                                             > 0)
-
-        # adjust indices and offsets
-        chunk_indices[_s:_e] -= p
-        chunk_offsets[_s] = s % chunk_size
-
-    return chunk_indices, chunk_offsets
-
-
 class Mamba2AttentionBackend(AttentionBackend):
 
     @staticmethod
@@ -125,8 +40,16 @@ class Mamba2AttentionMetadata:
     # the batch has no prefill request.
     has_initial_states_p: Optional[torch.Tensor]
     seq_idx_p: Optional[torch.Tensor]
-    chunk_indices_p: Optional[torch.Tensor]
-    chunk_offsets_p: Optional[torch.Tensor]
+
+    # cu_chunk_seqlen_p is a tensor of shape (nchunks+1,) that contains, for
+    # each chunk, its offests into the varlen sequence dimension. It is defined
+    # such that the i-th chunk contains tokens from cu_chunk_seqlen_p[i] to
+    # cu_chunk_seqlen_p[i+1].
+    cu_chunk_seqlen_p: Optional[torch.Tensor]
+
+    # last_chunk_indices_p is a tensor of shape (batch,) that contains the
+    # index of the last chunk for every sequence in the (prefill) batch.
+    last_chunk_indices_p: Optional[torch.Tensor]
 
     state_indices_tensor: torch.Tensor  # shape: [batch,]
 
@@ -151,13 +74,14 @@ def build(self,
               common_attn_metadata: CommonAttentionMetadata,
               fast_build: bool = False) -> Mamba2AttentionMetadata:
         num_reqs = common_attn_metadata.num_reqs
-        query_start_loc_p = None
         seq_lens = common_attn_metadata.seq_lens
 
+        query_start_loc_p = None
         seq_idx_p = None
-        chunk_indices_p, chunk_offsets_p = None, None
+        cu_chunk_seqlen_p = None
+        last_chunk_indices_p = None
+
         # Need flags to indicate if there are initial states
-        # currently we really only support the FlashAttention backend
         has_initial_states_p = None
         prep_initial_states = False
 
@@ -171,7 +95,7 @@ def build(self,
                 common_attn_metadata,
                 decode_threshold=self.reorder_batch_threshold))
 
-        # Compute seq_idx, chunk_indices and chunk_offsets for prefill only
+        # Compute seq_idx for prefill only
         if num_prefills > 0:
             #[batch,]
             has_initial_states_cpu = (
@@ -184,21 +108,68 @@ def build(self,
             query_start_loc_p = common_attn_metadata.query_start_loc[
                 -num_prefills - 1:] - num_decode_tokens
 
-            seq_idx_p = torch.repeat_interleave(torch.arange(
-                num_prefills,
-                dtype=torch.int32,
-                device=query_start_loc_p.device),
-                                                query_start_loc_p.diff(),
-                                                output_size=num_prefill_tokens)
-
-            # We compute metadata for chunked prefill once at the top level
-            # model forward and reuse them in mamba layers. If not needed,
-            # they will be ignored inside mamba kernels.
-            if prep_initial_states:
-                chunk_indices_p, chunk_offsets_p = (
-                    _query_start_loc_to_chunk_indices_offsets(
-                        query_start_loc_p, self.chunk_size,
-                        num_prefill_tokens))
+            num_computed_tokens_p = \
+                common_attn_metadata.num_computed_tokens_cpu[
+                    num_reqs - num_prefills:num_reqs]
+            query_start_loc_p_cpu = common_attn_metadata.query_start_loc_cpu[
+                -num_prefills - 1:] - num_decode_tokens
+
+            # The code below carefully constructs the chunks such that:
+            # 1. Chunks contain tokens from a *single* sequence only.
+            # 2. For every sequence, we are guaranteed that we can
+            #    retrieve the mamba state *every* chunk_size tokens.
+            # Constraint (1) dramatically simplifies the mamba2 kernels.
+            # Constraint (2) dramatically simplifies the implementation
+            # of prefix caching for mamba2 (wip). We need to take care
+            # of the interaction with chunked prefill in order to
+            # satisfy constraint (2).
+            # TODO (tdoublep): This code could probably be optimized.
+            cu_chunk_seqlen = []
+            seq_idx = []
+            last_chunk_indices = []
+            seqlen_pos = 0
+            for req_idx in range(num_prefills):
+                this_num_computed = num_computed_tokens_p[req_idx].item()
+                this_new_tokens = query_start_loc_p_cpu[req_idx + 1].item(
+                ) - query_start_loc_p_cpu[req_idx].item()
+
+                # if computed tokens are not chunk-aligned, use the first
+                # chunk to finish it off
+                if this_num_computed % self.chunk_size != 0:
+                    seq_idx.append(req_idx)
+                    cu_chunk_seqlen.append(seqlen_pos)
+                    # how many tokens to finish the chunk?
+                    chunk_len = cdiv(this_num_computed, self.chunk_size
+                                     ) * self.chunk_size - this_num_computed
+                    # we can only use at most this_new_tokens
+                    chunk_len = min(chunk_len, this_new_tokens)
+                    seqlen_pos += chunk_len
+                    this_new_tokens -= chunk_len
+
+                n_chunks = cdiv(this_new_tokens, self.chunk_size)
+                for chunk in range(n_chunks):
+                    seq_idx.append(req_idx)
+                    cu_chunk_seqlen.append(seqlen_pos)
+                    chunk_len = min(self.chunk_size, this_new_tokens)
+                    seqlen_pos += chunk_len
+                    this_new_tokens -= chunk_len
+
+                assert this_new_tokens == 0
+                last_chunk_indices.append(len(cu_chunk_seqlen) - 1)
+
+            cu_chunk_seqlen.append(seqlen_pos)
+
+            seq_idx_p = torch.as_tensor(seq_idx,
+                                        device=query_start_loc_p.device,
+                                        dtype=torch.int32)
+            cu_chunk_seqlen_p = torch.as_tensor(
+                cu_chunk_seqlen,
+                device=query_start_loc_p.device,
+                dtype=torch.int32)
+            last_chunk_indices_p = torch.as_tensor(
+                last_chunk_indices,
+                device=query_start_loc_p.device,
+                dtype=torch.int32)
 
             nums_dict, batch_ptr, token_chunk_offset_ptr = \
                 compute_causal_conv1d_metadata(query_start_loc_p)
@@ -222,9 +193,9 @@ def build(self,
             chunk_size=self.chunk_size,
             has_initial_states_p=has_initial_states_p,
             seq_idx_p=seq_idx_p,
-            chunk_indices_p=chunk_indices_p,
-            chunk_offsets_p=chunk_offsets_p,
             state_indices_tensor=state_indices_tensor,
+            cu_chunk_seqlen_p=cu_chunk_seqlen_p,
+            last_chunk_indices_p=last_chunk_indices_p,
             nums_dict=nums_dict,
             batch_ptr=batch_ptr,
             token_chunk_offset_ptr=token_chunk_offset_ptr,

From 7d6007801e884b8fcfa240cf40284882a472c138 Mon Sep 17 00:00:00 2001
From: Zhuohan Li <zhuohan123@gmail.com>
Date: Mon, 29 Sep 2025 14:31:34 -0700
Subject: [PATCH 026/193] [Doc] Polish example for torchrun dp (#25899)

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../offline_inference/torchrun_dp_example.py     | 16 ++++++++++------
 1 file changed, 10 insertions(+), 6 deletions(-)

diff --git a/examples/offline_inference/torchrun_dp_example.py b/examples/offline_inference/torchrun_dp_example.py
index 8e888a100254..295d1637528c 100644
--- a/examples/offline_inference/torchrun_dp_example.py
+++ b/examples/offline_inference/torchrun_dp_example.py
@@ -4,6 +4,11 @@
 experimental support for data-parallel inference with torchrun
 Note the data load balancing and distribution is done out of the vllm engine,
 no internal lb supported in external_launcher mode.
+
+To run this example:
+```bash
+$ torchrun --nproc-per-node=2 examples/offline_inference/torchrun_dp_example.py
+```
 """
 
 from vllm import LLM, SamplingParams
@@ -14,7 +19,7 @@
     "The president of the United States is",
     "The capital of France is",
     "The future of AI is",
-] * 50
+]
 
 # Create sampling parameters, the same across all ranks
 sampling_params = SamplingParams(temperature=0.8, top_p=0.95)
@@ -45,14 +50,13 @@
 
 outputs = llm.generate(prompts, sampling_params)
 
-
-# all ranks will have the same outputs
-print("-" * 50)
 for output in outputs:
     prompt = output.prompt
     generated_text = output.outputs[0].text
-    print(f"Prompt: {prompt!r}\nGenerated text: {generated_text!r}\n")
-    print("-" * 50)
+    print(
+        f"DP Rank: {dp_rank} Prompt: {prompt!r}\nGenerated text: {generated_text!r}\n"
+    )
+
 """
 Further tips:
 

From 7baeed53b7e97ec2b74d8e3aad476c918c064398 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Nicol=C3=B2=20Lucchesi?= <nlucches@redhat.com>
Date: Mon, 29 Sep 2025 23:35:14 +0200
Subject: [PATCH 027/193] [NIXL] Increase default KV block eviction timeout on
 P (#25897)

Signed-off-by: NickLucche <nlucches@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/features/nixl_connector_usage.md | 2 +-
 vllm/envs.py                          | 4 ++--
 2 files changed, 3 insertions(+), 3 deletions(-)

diff --git a/docs/features/nixl_connector_usage.md b/docs/features/nixl_connector_usage.md
index afecbc82947b..5e273af05dc5 100644
--- a/docs/features/nixl_connector_usage.md
+++ b/docs/features/nixl_connector_usage.md
@@ -84,7 +84,7 @@ python tests/v1/kv_connector/nixl_integration/toy_proxy_server.py \
     - Connection info is passed via KVTransferParams from prefiller to decoder for handshake
 
 - `VLLM_NIXL_ABORT_REQUEST_TIMEOUT`: Timeout (in seconds) for automatically releasing the prefiller’s KV cache for a particular request. (Optional)
-    - Default: 120
+    - Default: 480
     - If a request is aborted and the decoder has not yet read the KV-cache blocks through the nixl channel, the prefill instance will release its KV-cache blocks after this timeout to avoid holding them indefinitely.
 
 ## Multi-Instance Setup
diff --git a/vllm/envs.py b/vllm/envs.py
index f06c860b8297..ffa7ed5c3aa5 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -174,7 +174,7 @@
                                                  "NONE"] = "NONE"
     VLLM_ROCM_QUICK_REDUCE_CAST_BF16_TO_FP16: bool = True
     VLLM_ROCM_QUICK_REDUCE_MAX_SIZE_BYTES_MB: Optional[int] = None
-    VLLM_NIXL_ABORT_REQUEST_TIMEOUT: int = 120
+    VLLM_NIXL_ABORT_REQUEST_TIMEOUT: int = 480
     VLLM_USE_CUDNN_PREFILL: bool = False
     VLLM_ENABLE_CUDAGRAPH_GC: bool = False
     VLLM_LOOPBACK_IP: str = ""
@@ -1330,7 +1330,7 @@ def get_vllm_port() -> Optional[int]:
     # consumer. This is only applicable when using NixlConnector in a
     # disaggregated decode-prefill setup.
     "VLLM_NIXL_ABORT_REQUEST_TIMEOUT":
-    lambda: int(os.getenv("VLLM_NIXL_ABORT_REQUEST_TIMEOUT", "120")),
+    lambda: int(os.getenv("VLLM_NIXL_ABORT_REQUEST_TIMEOUT", "480")),
 
     # Controls whether or not to use cudnn prefill
     "VLLM_USE_CUDNN_PREFILL":

From 40217986d0a443ee98d7e55af00f9a1c2414149d Mon Sep 17 00:00:00 2001
From: Aaron Pham <contact@aarnphm.xyz>
Date: Mon, 29 Sep 2025 19:26:11 -0400
Subject: [PATCH 028/193] [V0 Deprecation] Remove `vllm.worker` and update
 according imports (#25901)

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../tensorizer_loader/conftest.py             |   2 +-
 tools/pre_commit/check_pickle_imports.py      |   1 -
 vllm/executor/executor_base.py                |  10 +-
 vllm/executor/ray_utils.py                    |   2 +-
 vllm/executor/uniproc_executor.py             |  10 +-
 vllm/platforms/cuda.py                        |  12 +-
 vllm/platforms/rocm.py                        |  12 +-
 vllm/v1/executor/multiproc_executor.py        |   4 +-
 vllm/v1/worker/worker_base.py                 | 271 ++++++++++++++++-
 vllm/worker/__init__.py                       |   0
 vllm/worker/worker_base.py                    | 279 ------------------
 11 files changed, 276 insertions(+), 327 deletions(-)
 delete mode 100644 vllm/worker/__init__.py
 delete mode 100644 vllm/worker/worker_base.py

diff --git a/tests/model_executor/model_loader/tensorizer_loader/conftest.py b/tests/model_executor/model_loader/tensorizer_loader/conftest.py
index 571dc2e0eb50..cc02d7ecf20b 100644
--- a/tests/model_executor/model_loader/tensorizer_loader/conftest.py
+++ b/tests/model_executor/model_loader/tensorizer_loader/conftest.py
@@ -10,7 +10,7 @@
 from vllm.model_executor.model_loader.tensorizer import TensorizerConfig
 from vllm.utils import get_distributed_init_method, get_ip, get_open_port
 from vllm.v1.executor.abstract import UniProcExecutor
-from vllm.worker.worker_base import WorkerWrapperBase
+from vllm.v1.worker.worker_base import WorkerWrapperBase
 
 MODEL_REF = "facebook/opt-125m"
 
diff --git a/tools/pre_commit/check_pickle_imports.py b/tools/pre_commit/check_pickle_imports.py
index acbbc1f181d6..c97a5b0b6c71 100644
--- a/tools/pre_commit/check_pickle_imports.py
+++ b/tools/pre_commit/check_pickle_imports.py
@@ -36,7 +36,6 @@
     'benchmarks/cutlass_benchmarks/w8a8_benchmarks.py',
     'benchmarks/cutlass_benchmarks/sparse_benchmarks.py',
     # cloudpickle
-    'vllm/worker/worker_base.py',
     'vllm/executor/mp_distributed_executor.py',
     'vllm/executor/ray_distributed_executor.py',
     'vllm/entrypoints/llm.py',
diff --git a/vllm/executor/executor_base.py b/vllm/executor/executor_base.py
index e3063ec2b8ab..fe80be61410c 100644
--- a/vllm/executor/executor_base.py
+++ b/vllm/executor/executor_base.py
@@ -19,7 +19,7 @@
 from vllm.tasks import SupportedTask
 from vllm.utils import make_async
 from vllm.v1.outputs import PoolerOutput, SamplerOutput
-from vllm.worker.worker_base import WorkerBase
+from vllm.v1.worker.worker_base import WorkerBase
 
 logger = init_logger(__name__)
 
@@ -30,7 +30,7 @@ class ExecutorBase(ABC):
     """Base class for all executors.
 
     An executor is responsible for executing the model on one device,
-    or it can be a distributed executor 
+    or it can be a distributed executor
     that can execute the model on multiple devices.
     """
 
@@ -83,7 +83,7 @@ def collective_rpc(self,
 
         Returns:
             A list containing the results from each worker.
-        
+
         Note:
             It is recommended to use this API to only pass control messages,
             and set up data-plane communication to pass data.
@@ -100,7 +100,7 @@ def determine_num_available_blocks(self) -> tuple[int, int]:
 
         Returns a tuple `(num_gpu_blocks, num_cpu_blocks)`, where
         `num_gpu_blocks` are blocks that are "active" on the device and can be
-        appended to. 
+        appended to.
         `num_cpu_blocks` refers to "swapped" blocks in CPU memory and cannot be
         appended to.
         """
@@ -327,7 +327,7 @@ def _run_workers(
                 run only in the remote TP workers, not the driver worker.
                 It will also be run asynchronously and return a list of futures
                 rather than blocking on the results.
-        
+
         # TODO: simplify and merge with collective_rpc
         """
         raise NotImplementedError
diff --git a/vllm/executor/ray_utils.py b/vllm/executor/ray_utils.py
index 0bdeb2856989..d8eb7977dbde 100644
--- a/vllm/executor/ray_utils.py
+++ b/vllm/executor/ray_utils.py
@@ -16,7 +16,7 @@
 from vllm.platforms import current_platform
 from vllm.sequence import ExecuteModelRequest, IntermediateTensors
 from vllm.utils import get_ip
-from vllm.worker.worker_base import WorkerWrapperBase
+from vllm.v1.worker.worker_base import WorkerWrapperBase
 
 if TYPE_CHECKING:
     from vllm.v1.core.sched.output import SchedulerOutput
diff --git a/vllm/executor/uniproc_executor.py b/vllm/executor/uniproc_executor.py
index 7a753d608a43..d669592e75f1 100644
--- a/vllm/executor/uniproc_executor.py
+++ b/vllm/executor/uniproc_executor.py
@@ -19,7 +19,7 @@
 from vllm.v1.engine import ReconfigureDistributedRequest, ReconfigureRankType
 from vllm.v1.executor.utils import get_and_update_mm_cache
 from vllm.v1.outputs import AsyncModelRunnerOutput
-from vllm.worker.worker_base import WorkerWrapperBase
+from vllm.v1.worker.worker_base import WorkerWrapperBase
 
 logger = init_logger(__name__)
 
@@ -160,10 +160,10 @@ def determine_num_available_blocks(self) -> Tuple[int, int]:
         """
         Determine the number of available KV blocks.
         Add an additional all_reduce to get the min across all ranks.
-        Note that even if we have the same `gpu_memory_utilization` and 
-        `swap_space`, the available memory in every rank might still 
-        differ because NCCL can take different amounts of memory in 
-        different ranks. Therefore, it is necessary to test if all ranks 
+        Note that even if we have the same `gpu_memory_utilization` and
+        `swap_space`, the available memory in every rank might still
+        differ because NCCL can take different amounts of memory in
+        different ranks. Therefore, it is necessary to test if all ranks
         agree on the same KV cache configuration.
         """
         a, b = super().determine_num_available_blocks()
diff --git a/vllm/platforms/cuda.py b/vllm/platforms/cuda.py
index 6738d3dec286..1463fe34fc75 100644
--- a/vllm/platforms/cuda.py
+++ b/vllm/platforms/cuda.py
@@ -110,17 +110,7 @@ def check_and_update_config(cls, vllm_config: "VllmConfig") -> None:
         model_config = vllm_config.model_config
 
         if parallel_config.worker_cls == "auto":
-            if vllm_config.speculative_config:
-                if not envs.VLLM_USE_V1:
-                    raise NotImplementedError(
-                        "Speculative decoding is not supported on vLLM V0.")
-                parallel_config.worker_cls = "vllm.v1.worker.gpu_worker.Worker"
-            else:
-                if envs.VLLM_USE_V1:
-                    parallel_config.worker_cls = \
-                        "vllm.v1.worker.gpu_worker.Worker"
-                else:
-                    parallel_config.worker_cls = "vllm.worker.worker.Worker"
+            parallel_config.worker_cls = "vllm.v1.worker.gpu_worker.Worker"
 
         cache_config = vllm_config.cache_config
         if cache_config and cache_config.block_size is None:
diff --git a/vllm/platforms/rocm.py b/vllm/platforms/rocm.py
index 1dacd026b667..f67568bf07c1 100644
--- a/vllm/platforms/rocm.py
+++ b/vllm/platforms/rocm.py
@@ -327,17 +327,7 @@ def check_and_update_config(cls, vllm_config: "VllmConfig") -> None:
             cache_config.block_size = 16
 
         if parallel_config.worker_cls == "auto":
-            if vllm_config.speculative_config:
-                if not use_v1:
-                    raise NotImplementedError(
-                        "Speculative decoding is not supported on vLLM V0.")
-                parallel_config.worker_cls = "vllm.v1.worker.gpu_worker.Worker"
-            else:
-                if use_v1:
-                    parallel_config.worker_cls = \
-                        "vllm.v1.worker.gpu_worker.Worker"
-                else:
-                    parallel_config.worker_cls = "vllm.worker.worker.Worker"
+            parallel_config.worker_cls = "vllm.v1.worker.gpu_worker.Worker"
         #  Aiter rms norm perform best when CUDA Graph capture is enabled.
         if (use_v1 and use_aiter_rms_norm and not is_eager_execution
                 and "-rms_norm" not in compilation_config.custom_ops):
diff --git a/vllm/v1/executor/multiproc_executor.py b/vllm/v1/executor/multiproc_executor.py
index ef90af263664..eecdf8def6de 100644
--- a/vllm/v1/executor/multiproc_executor.py
+++ b/vllm/v1/executor/multiproc_executor.py
@@ -41,7 +41,7 @@
 from vllm.v1.executor.utils import get_and_update_mm_cache
 from vllm.v1.outputs import (AsyncModelRunnerOutput, DraftTokenIds,
                              ModelRunnerOutput)
-from vllm.worker.worker_base import WorkerWrapperBase
+from vllm.v1.worker.worker_base import WorkerWrapperBase
 
 logger = init_logger(__name__)
 
@@ -702,7 +702,7 @@ def setup_proc_title_and_log_prefix(enable_ep: bool) -> None:
 
 def set_multiprocessing_worker_envs():
     """ Set up environment variables that should be used when there are workers
-    in a multiprocessing environment. This should be called by the parent 
+    in a multiprocessing environment. This should be called by the parent
     process before worker processes are created"""
 
     _maybe_force_spawn()
diff --git a/vllm/v1/worker/worker_base.py b/vllm/v1/worker/worker_base.py
index 038ce4b54f96..5b393ee6bf3e 100644
--- a/vllm/v1/worker/worker_base.py
+++ b/vllm/v1/worker/worker_base.py
@@ -1,23 +1,35 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from typing import Optional
+from __future__ import annotations
+
+import os
+from typing import Any, Callable, Optional, TypeVar, Union
 
 import torch
 import torch.nn as nn
 
-from vllm.config import VllmConfig
+from vllm.config import VllmConfig, set_current_vllm_config
 from vllm.logger import init_logger
+from vllm.lora.request import LoRARequest
+from vllm.sequence import ExecuteModelRequest
+from vllm.utils import (enable_trace_function_call_for_thread,
+                        resolve_obj_by_qualname, run_method,
+                        update_environment_variables,
+                        warn_for_unimplemented_methods)
 from vllm.v1.kv_cache_interface import KVCacheSpec
-from vllm.worker.worker_base import WorkerBase as WorkerBaseV0
+from vllm.v1.outputs import SamplerOutput
 
 logger = init_logger(__name__)
 
+_R = TypeVar("_R")
 
-class WorkerBase(WorkerBaseV0):
-    """
-    Abstract class for v1 worker, mainly define some methods for v1.
-    For methods shared by v0 and v1, define them in v0 WorkerBase
+
+@warn_for_unimplemented_methods
+class WorkerBase:
+    """Worker interface that allows vLLM to cleanly separate implementations for
+    different hardware. Also abstracts control plane communication, e.g., to
+    communicate request metadata to other workers.
     """
 
     def __init__(
@@ -27,10 +39,10 @@ def __init__(
         rank: int,
         distributed_init_method: str,
         is_driver_worker: bool = False,
-    ):
+    ) -> None:
         """
         Initialize common worker components.
-        
+
         Args:
             vllm_config: Complete vLLM configuration
             local_rank: Local device index
@@ -39,8 +51,21 @@ def __init__(
             is_driver_worker: Whether this worker handles driver
                 responsibilities
         """
-        # Configuration storage
-        super().__init__(vllm_config=vllm_config)
+        self.vllm_config = vllm_config
+        self.model_config = vllm_config.model_config
+        self.cache_config = vllm_config.cache_config
+        self.lora_config = vllm_config.lora_config
+        self.load_config = vllm_config.load_config
+        self.parallel_config = vllm_config.parallel_config
+        self.scheduler_config = vllm_config.scheduler_config
+        self.device_config = vllm_config.device_config
+        self.speculative_config = vllm_config.speculative_config
+        self.observability_config = vllm_config.observability_config
+        self.kv_transfer_config = vllm_config.kv_transfer_config
+        self.compilation_config = vllm_config.compilation_config
+
+        from vllm.platforms import current_platform
+        self.current_platform = current_platform
 
         self.parallel_config.rank = rank
         self.local_rank = local_rank
@@ -63,3 +88,227 @@ def compile_or_warm_up_model(self) -> None:
     def check_health(self) -> None:
         """Basic health check (override for device-specific checks)."""
         return
+
+    def init_device(self) -> None:
+        """Initialize device state, such as loading the model or other on-device
+        memory allocations.
+        """
+        raise NotImplementedError
+
+    def initialize_cache(self, num_gpu_blocks: int,
+                         num_cpu_blocks: int) -> None:
+        """Initialize the KV cache with the given size in blocks.
+        """
+        raise NotImplementedError
+
+    def get_model(self) -> nn.Module:
+        raise NotImplementedError
+
+    def apply_model(self, fn: Callable[[nn.Module], _R]) -> _R:
+        """Apply a function on the model inside this worker."""
+        return fn(self.get_model())
+
+    def load_model(self) -> None:
+        """Load model onto target device."""
+        raise NotImplementedError
+
+    def execute_model(
+        self,
+        execute_model_req: Optional[ExecuteModelRequest] = None
+    ) -> Optional[list[SamplerOutput]]:
+        raise NotImplementedError
+
+    def start_worker_execution_loop(self) -> None:
+        """Execute model loop in parallel worker.
+
+        You can stop the loop by executing a driver worker with an empty output.
+        See `stop_remote_worker_execution_loop` for more details.
+        """
+        with self.current_platform.inference_mode():
+            while True:
+                output = self.execute_model(execute_model_req=None)
+                if output is None:
+                    return None
+
+    def determine_num_available_blocks(self) -> tuple[int, int]:
+        """Determine the number of available blocks for the GPU KV cache and
+        swappable CPU KV cache.
+
+        The implementation may run profiling or other heuristics to determine
+        the size of caches.
+
+        Returns a tuple[num_gpu_blocks, num_cpu_blocks], where num_gpu_blocks
+        are blocks that are "active" on the device and can be appended to.
+        num_cpu_blocks refers to "swapped" blocks in CPU memory and cannot be
+        appended to.
+        """
+        raise NotImplementedError
+
+    def get_cache_block_size_bytes(self) -> int:
+        """Return the size of a single cache block, in bytes. Used in
+        speculative decoding.
+        """
+        raise NotImplementedError
+
+    def add_lora(self, lora_request: LoRARequest) -> bool:
+        raise NotImplementedError
+
+    def remove_lora(self, lora_id: int) -> bool:
+        raise NotImplementedError
+
+    def pin_lora(self, lora_id: int) -> bool:
+        raise NotImplementedError
+
+    def list_loras(self) -> set[int]:
+        raise NotImplementedError
+
+    @property
+    def vocab_size(self) -> int:
+        """Get vocabulary size from model configuration."""
+        return self.model_config.get_vocab_size()
+
+    def shutdown(self) -> None:
+        """Clean up resources held by the worker."""
+        return
+
+
+class WorkerWrapperBase:
+    """
+    This class represents one process in an executor/engine. It is responsible
+    for lazily initializing the worker and handling the worker's lifecycle.
+    We first instantiate the WorkerWrapper, which remembers the worker module
+    and class name. Then, when we call `update_environment_variables`, and the
+    real initialization happens in `init_worker`.
+    """
+
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        rpc_rank: int = 0,
+    ) -> None:
+        """
+        Initialize the worker wrapper with the given vllm_config and rpc_rank.
+        Note: rpc_rank is the rank of the worker in the executor. In most cases,
+        it is also the rank of the worker in the distributed group. However,
+        when multiple executors work together, they can be different.
+        e.g. in the case of SPMD-style offline inference with TP=2,
+        users can launch 2 engines/executors, each with only 1 worker.
+        All workers have rpc_rank=0, but they have different ranks in the TP
+        group.
+        """
+        self.rpc_rank = rpc_rank
+        self.worker: Optional[WorkerBase] = None
+        self.vllm_config: Optional[VllmConfig] = None
+        # do not store this `vllm_config`, `init_worker` will set the final
+        # one. TODO: investigate if we can remove this field in
+        # `WorkerWrapperBase`, `init_cached_hf_modules` should be
+        # unnecessary now.
+        if vllm_config.model_config is not None:
+            # it can be None in tests
+            trust_remote_code = vllm_config.model_config.trust_remote_code
+            if trust_remote_code:
+                # note: lazy import to avoid importing torch before initializing
+                from vllm.utils import init_cached_hf_modules
+                init_cached_hf_modules()
+
+    def shutdown(self) -> None:
+        if self.worker is not None:
+            self.worker.shutdown()
+
+    def adjust_rank(self, rank_mapping: dict[int, int]) -> None:
+        """
+        Adjust the rpc_rank based on the given mapping.
+        It is only used during the initialization of the executor,
+        to adjust the rpc_rank of workers after we create all workers.
+        """
+        if self.rpc_rank in rank_mapping:
+            self.rpc_rank = rank_mapping[self.rpc_rank]
+
+    def update_environment_variables(
+        self,
+        envs_list: list[dict[str, str]],
+    ) -> None:
+        envs = envs_list[self.rpc_rank]
+        key = 'CUDA_VISIBLE_DEVICES'
+        if key in envs and key in os.environ:
+            # overwriting CUDA_VISIBLE_DEVICES is desired behavior
+            # suppress the warning in `update_environment_variables`
+            del os.environ[key]
+        update_environment_variables(envs)
+
+    def init_worker(self, all_kwargs: list[dict[str, Any]]) -> None:
+        """
+        Here we inject some common logic before initializing the worker.
+        Arguments are passed to the worker class constructor.
+        """
+        kwargs = all_kwargs[self.rpc_rank]
+        self.vllm_config = kwargs.get("vllm_config")
+        assert self.vllm_config is not None, (
+            "vllm_config is required to initialize the worker")
+        enable_trace_function_call_for_thread(self.vllm_config)
+
+        from vllm.plugins import load_general_plugins
+        load_general_plugins()
+
+        if isinstance(self.vllm_config.parallel_config.worker_cls, str):
+            worker_class = resolve_obj_by_qualname(
+                self.vllm_config.parallel_config.worker_cls)
+        else:
+            raise ValueError(
+                "passing worker_cls is no longer supported. Please pass keep the class in a separate module and pass the qualified name of the class as a string."  # noqa: E501
+            )
+        if self.vllm_config.parallel_config.worker_extension_cls:
+            worker_extension_cls = resolve_obj_by_qualname(
+                self.vllm_config.parallel_config.worker_extension_cls)
+            extended_calls = []
+            if worker_extension_cls not in worker_class.__bases__:
+                # check any conflicts between worker and worker_extension_cls
+                for attr in dir(worker_extension_cls):
+                    if attr.startswith("__"):
+                        continue
+                    assert not hasattr(worker_class, attr), (
+                        f"Worker class {worker_class} already has an attribute"
+                        f" {attr}, which conflicts with the worker"
+                        f" extension class {worker_extension_cls}.")
+                    if callable(getattr(worker_extension_cls, attr)):
+                        extended_calls.append(attr)
+                # dynamically inherit the worker extension class
+                worker_class.__bases__ = worker_class.__bases__ + (
+                    worker_extension_cls, )
+                logger.info(
+                    "Injected %s into %s for extended collective_rpc calls %s",
+                    worker_extension_cls, worker_class, extended_calls)
+        with set_current_vllm_config(self.vllm_config):
+            # To make vLLM config available during worker initialization
+            self.worker = worker_class(**kwargs)
+            assert self.worker is not None
+
+    def initialize_from_config(self, kv_cache_configs: list[Any]) -> None:
+        kv_cache_config = kv_cache_configs[self.rpc_rank]
+        with set_current_vllm_config(self.vllm_config):
+            self.worker.initialize_from_config(kv_cache_config)  # type: ignore
+
+    def init_device(self):
+        with set_current_vllm_config(self.vllm_config):
+            # To make vLLM config available during device initialization
+            self.worker.init_device()  # type: ignore
+
+    def execute_method(self, method: Union[str, bytes], *args, **kwargs):
+        try:
+            # method resolution order:
+            # if a method is defined in this class, it will be called directly.
+            # otherwise, since we define `__getattr__` and redirect attribute
+            # query to `self.worker`, the method will be called on the worker.
+            return run_method(self, method, args, kwargs)
+        except Exception as e:
+            # if the driver worker also execute methods,
+            # exceptions in the rest worker may cause deadlock in rpc like ray
+            # see https://github.com/vllm-project/vllm/issues/3455
+            # print the error and inform the user to solve the error
+            msg = (f"Error executing method {method!r}. "
+                   "This might cause deadlock in distributed execution.")
+            logger.exception(msg)
+            raise e
+
+    def __getattr__(self, attr):
+        return getattr(self.worker, attr)
diff --git a/vllm/worker/__init__.py b/vllm/worker/__init__.py
deleted file mode 100644
index e69de29bb2d1..000000000000
diff --git a/vllm/worker/worker_base.py b/vllm/worker/worker_base.py
deleted file mode 100644
index 20fabef4f19b..000000000000
--- a/vllm/worker/worker_base.py
+++ /dev/null
@@ -1,279 +0,0 @@
-# SPDX-License-Identifier: Apache-2.0
-# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-
-import os
-from typing import (Any, Callable, Dict, List, Optional, Set, Tuple, TypeVar,
-                    Union)
-
-import cloudpickle
-import torch.nn as nn
-
-from vllm.config import VllmConfig, set_current_vllm_config
-from vllm.logger import init_logger
-from vllm.lora.request import LoRARequest
-from vllm.sequence import ExecuteModelRequest
-from vllm.utils import (enable_trace_function_call_for_thread,
-                        resolve_obj_by_qualname, run_method,
-                        update_environment_variables,
-                        warn_for_unimplemented_methods)
-from vllm.v1.outputs import SamplerOutput
-
-logger = init_logger(__name__)
-
-_R = TypeVar("_R")
-
-
-@warn_for_unimplemented_methods
-class WorkerBase:
-    """Worker interface that allows vLLM to cleanly separate implementations for
-    different hardware. Also abstracts control plane communication, e.g., to
-    communicate request metadata to other workers.
-    """
-
-    def __init__(
-        self,
-        vllm_config: VllmConfig,
-    ) -> None:
-        self.vllm_config = vllm_config
-        self.model_config = vllm_config.model_config
-        self.cache_config = vllm_config.cache_config
-        self.lora_config = vllm_config.lora_config
-        self.load_config = vllm_config.load_config
-        self.parallel_config = vllm_config.parallel_config
-        self.scheduler_config = vllm_config.scheduler_config
-        self.device_config = vllm_config.device_config
-        self.speculative_config = vllm_config.speculative_config
-        self.observability_config = vllm_config.observability_config
-        self.kv_transfer_config = vllm_config.kv_transfer_config
-        self.compilation_config = vllm_config.compilation_config
-        from vllm.platforms import current_platform
-        self.current_platform = current_platform
-
-    def init_device(self) -> None:
-        """Initialize device state, such as loading the model or other on-device
-        memory allocations.
-        """
-        raise NotImplementedError
-
-    def initialize_cache(self, num_gpu_blocks: int,
-                         num_cpu_blocks: int) -> None:
-        """Initialize the KV cache with the given size in blocks.
-        """
-        raise NotImplementedError
-
-    def get_model(self) -> nn.Module:
-        raise NotImplementedError
-
-    def apply_model(self, fn: Callable[[nn.Module], _R]) -> _R:
-        """Apply a function on the model inside this worker."""
-        return fn(self.get_model())
-
-    def load_model(self) -> None:
-        """Load model onto target device."""
-        raise NotImplementedError
-
-    def execute_model(
-        self,
-        execute_model_req: Optional[ExecuteModelRequest] = None
-    ) -> Optional[List[SamplerOutput]]:
-        raise NotImplementedError
-
-    def start_worker_execution_loop(self) -> None:
-        """Execute model loop in parallel worker.
-
-        You can stop the loop by executing a driver worker with an empty output.
-        See `stop_remote_worker_execution_loop` for more details.
-        """
-        with self.current_platform.inference_mode():
-            while True:
-                output = self.execute_model(execute_model_req=None)
-                if output is None:
-                    return None
-
-    def determine_num_available_blocks(self) -> Tuple[int, int]:
-        """Determine the number of available blocks for the GPU KV cache and
-        swappable CPU KV cache.
-
-        The implementation may run profiling or other heuristics to determine
-        the size of caches.
-
-        Returns a Tuple[num_gpu_blocks, num_cpu_blocks], where num_gpu_blocks
-        are blocks that are "active" on the device and can be appended to.
-        num_cpu_blocks refers to "swapped" blocks in CPU memory and cannot be
-        appended to.
-        """
-        raise NotImplementedError
-
-    def get_cache_block_size_bytes(self) -> int:
-        """Return the size of a single cache block, in bytes. Used in
-        speculative decoding.
-        """
-        raise NotImplementedError
-
-    def add_lora(self, lora_request: LoRARequest) -> bool:
-        raise NotImplementedError
-
-    def remove_lora(self, lora_id: int) -> bool:
-        raise NotImplementedError
-
-    def pin_lora(self, lora_id: int) -> bool:
-        raise NotImplementedError
-
-    def list_loras(self) -> Set[int]:
-        raise NotImplementedError
-
-    @property
-    def vocab_size(self) -> int:
-        """Get vocabulary size from model configuration."""
-        return self.model_config.get_vocab_size()
-
-    def shutdown(self) -> None:
-        """Clean up resources held by the worker."""
-        return
-
-
-class WorkerWrapperBase:
-    """
-    This class represents one process in an executor/engine. It is responsible
-    for lazily initializing the worker and handling the worker's lifecycle.
-    We first instantiate the WorkerWrapper, which remembers the worker module
-    and class name. Then, when we call `update_environment_variables`, and the
-    real initialization happens in `init_worker`.
-    """
-
-    def __init__(
-        self,
-        vllm_config: VllmConfig,
-        rpc_rank: int = 0,
-    ) -> None:
-        """
-        Initialize the worker wrapper with the given vllm_config and rpc_rank.
-        Note: rpc_rank is the rank of the worker in the executor. In most cases,
-        it is also the rank of the worker in the distributed group. However,
-        when multiple executors work together, they can be different.
-        e.g. in the case of SPMD-style offline inference with TP=2,
-        users can launch 2 engines/executors, each with only 1 worker.
-        All workers have rpc_rank=0, but they have different ranks in the TP
-        group.
-        """
-        self.rpc_rank = rpc_rank
-        self.worker: Optional[WorkerBase] = None
-        self.vllm_config: Optional[VllmConfig] = None
-        # do not store this `vllm_config`, `init_worker` will set the final
-        # one. TODO: investigate if we can remove this field in
-        # `WorkerWrapperBase`, `init_cached_hf_modules` should be
-        # unnecessary now.
-        if vllm_config.model_config is not None:
-            # it can be None in tests
-            trust_remote_code = vllm_config.model_config.trust_remote_code
-            if trust_remote_code:
-                # note: lazy import to avoid importing torch before initializing
-                from vllm.utils import init_cached_hf_modules
-                init_cached_hf_modules()
-
-    def shutdown(self) -> None:
-        if self.worker is not None:
-            self.worker.shutdown()
-
-    def adjust_rank(self, rank_mapping: Dict[int, int]) -> None:
-        """
-        Adjust the rpc_rank based on the given mapping.
-        It is only used during the initialization of the executor,
-        to adjust the rpc_rank of workers after we create all workers.
-        """
-        if self.rpc_rank in rank_mapping:
-            self.rpc_rank = rank_mapping[self.rpc_rank]
-
-    def update_environment_variables(self, envs_list: List[Dict[str,
-                                                                str]]) -> None:
-        envs = envs_list[self.rpc_rank]
-        key = 'CUDA_VISIBLE_DEVICES'
-        if key in envs and key in os.environ:
-            # overwriting CUDA_VISIBLE_DEVICES is desired behavior
-            # suppress the warning in `update_environment_variables`
-            del os.environ[key]
-        update_environment_variables(envs)
-
-    def init_worker(self, all_kwargs: List[Dict[str, Any]]) -> None:
-        """
-        Here we inject some common logic before initializing the worker.
-        Arguments are passed to the worker class constructor.
-        """
-        kwargs = all_kwargs[self.rpc_rank]
-        self.vllm_config = kwargs.get("vllm_config")
-        assert self.vllm_config is not None, (
-            "vllm_config is required to initialize the worker")
-        enable_trace_function_call_for_thread(self.vllm_config)
-
-        from vllm.plugins import load_general_plugins
-        load_general_plugins()
-
-        if isinstance(self.vllm_config.parallel_config.worker_cls, str):
-            worker_class = resolve_obj_by_qualname(
-                self.vllm_config.parallel_config.worker_cls)
-        else:
-            logger.warning(
-                "passing worker_cls as a class object is strongly deprecated,"
-                " as the serialization of class objects can be tricky and"
-                " error-prone. To be safe, please keep the class in a separate"
-                " module and pass the qualified name of the class as a string."
-            )
-            assert isinstance(self.vllm_config.parallel_config.worker_cls,
-                              bytes)
-            worker_class = cloudpickle.loads(
-                self.vllm_config.parallel_config.worker_cls)
-        if self.vllm_config.parallel_config.worker_extension_cls:
-            worker_extension_cls = resolve_obj_by_qualname(
-                self.vllm_config.parallel_config.worker_extension_cls)
-            extended_calls = []
-            if worker_extension_cls not in worker_class.__bases__:
-                # check any conflicts between worker and worker_extension_cls
-                for attr in dir(worker_extension_cls):
-                    if attr.startswith("__"):
-                        continue
-                    assert not hasattr(worker_class, attr), (
-                        f"Worker class {worker_class} already has an attribute"
-                        f" {attr}, which conflicts with the worker"
-                        f" extension class {worker_extension_cls}.")
-                    if callable(getattr(worker_extension_cls, attr)):
-                        extended_calls.append(attr)
-                # dynamically inherit the worker extension class
-                worker_class.__bases__ = worker_class.__bases__ + (
-                    worker_extension_cls, )
-                logger.info(
-                    "Injected %s into %s for extended collective_rpc calls %s",
-                    worker_extension_cls, worker_class, extended_calls)
-        with set_current_vllm_config(self.vllm_config):
-            # To make vLLM config available during worker initialization
-            self.worker = worker_class(**kwargs)
-            assert self.worker is not None
-
-    def initialize_from_config(self, kv_cache_configs: List[Any]) -> None:
-        kv_cache_config = kv_cache_configs[self.rpc_rank]
-        with set_current_vllm_config(self.vllm_config):
-            self.worker.initialize_from_config(kv_cache_config)  # type: ignore
-
-    def init_device(self):
-        with set_current_vllm_config(self.vllm_config):
-            # To make vLLM config available during device initialization
-            self.worker.init_device()  # type: ignore
-
-    def execute_method(self, method: Union[str, bytes], *args, **kwargs):
-        try:
-            # method resolution order:
-            # if a method is defined in this class, it will be called directly.
-            # otherwise, since we define `__getattr__` and redirect attribute
-            # query to `self.worker`, the method will be called on the worker.
-            return run_method(self, method, args, kwargs)
-        except Exception as e:
-            # if the driver worker also execute methods,
-            # exceptions in the rest worker may cause deadlock in rpc like ray
-            # see https://github.com/vllm-project/vllm/issues/3455
-            # print the error and inform the user to solve the error
-            msg = (f"Error executing method {method!r}. "
-                   "This might cause deadlock in distributed execution.")
-            logger.exception(msg)
-            raise e
-
-    def __getattr__(self, attr):
-        return getattr(self.worker, attr)

From 15729260f4c3930b2fec946c391cbf9f92a07894 Mon Sep 17 00:00:00 2001
From: Andrew Sansom <andrew@protopia.ai>
Date: Mon, 29 Sep 2025 19:10:58 -0500
Subject: [PATCH 029/193] Test Prompt Embeds/LoRA compatibility and Enable LoRA
 Support for OPT Models  (#25717)

Signed-off-by: Andrew Sansom <andrew@protopia.ai>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/features/README.md                       |  2 +-
 docs/models/supported_models.md               |  2 +-
 tests/entrypoints/conftest.py                 |  8 +++++
 .../test_completion_with_prompt_embeds.py     | 34 +++++++++++++++----
 vllm/model_executor/models/opt.py             |  5 ++-
 5 files changed, 40 insertions(+), 11 deletions(-)

diff --git a/docs/features/README.md b/docs/features/README.md
index 10cc448cc2ee..05ce0b57a9fc 100644
--- a/docs/features/README.md
+++ b/docs/features/README.md
@@ -52,7 +52,7 @@ th:not(:first-child) {
 | [mm](multimodal_inputs.md) | ✅ | ✅ | [🟠](gh-pr:4194)<sup>^</sup> | ❔ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ❔ | ✅ | | | |
 | best-of | ✅ | ✅ | ✅ | [❌](gh-issue:6137) | ✅ | ❌ | ✅ | ✅ | ✅ | ❔ | [❌](gh-issue:7968) | ✅ | ✅ | | |
 | beam-search | ✅ | ✅ | ✅ | [❌](gh-issue:6137) | ✅ | ❌ | ✅ | ✅ | ✅ | ❔ | [❌](gh-issue:7968) | ❔ | ✅ | ✅ | |
-| [prompt-embeds](prompt_embeds.md) | ✅ | [❌](gh-issue:25096) | ? | ❌ | ✅ | ❌ | ❌ | ✅ | ❌ | ? | ? | ❌ | ? | ? | ✅ |
+| [prompt-embeds](prompt_embeds.md) | ✅ | [❌](gh-issue:25096) | ✅ | ❌ | ✅ | ❌ | ❌ | ✅ | ❌ | ❔ | ❔ | ❌ | ❔ | ❔ | ✅ |
 
 \* Chunked prefill and prefix caching are only applicable to last-token pooling.  
 <sup>^</sup> LoRA is only applicable to the language backbone of multimodal models.
diff --git a/docs/models/supported_models.md b/docs/models/supported_models.md
index 8e87a98e3d51..d720fa2458e1 100644
--- a/docs/models/supported_models.md
+++ b/docs/models/supported_models.md
@@ -403,7 +403,7 @@ th {
 | `OLMo2ForCausalLM` | OLMo2 | `allenai/OLMo-2-0425-1B`, etc. | ✅︎ | ✅︎ | ✅︎ |
 | `OLMo3ForCausalLM` | OLMo3 | TBA | ✅︎ | ✅︎ | ✅︎ |
 | `OLMoEForCausalLM` | OLMoE | `allenai/OLMoE-1B-7B-0924`, `allenai/OLMoE-1B-7B-0924-Instruct`, etc. | | ✅︎ | ✅︎ |
-| `OPTForCausalLM` | OPT, OPT-IML | `facebook/opt-66b`, `facebook/opt-iml-max-30b`, etc. | | ✅︎ | ✅︎ |
+| `OPTForCausalLM` | OPT, OPT-IML | `facebook/opt-66b`, `facebook/opt-iml-max-30b`, etc. | ✅︎ | ✅︎ | ✅︎ |
 | `OrionForCausalLM` | Orion | `OrionStarAI/Orion-14B-Base`, `OrionStarAI/Orion-14B-Chat`, etc. | | ✅︎ | ✅︎ |
 | `PhiForCausalLM` | Phi | `microsoft/phi-1_5`, `microsoft/phi-2`, etc. | ✅︎ | ✅︎ | ✅︎ |
 | `Phi3ForCausalLM` | Phi-4, Phi-3 | `microsoft/Phi-4-mini-instruct`, `microsoft/Phi-4`, `microsoft/Phi-3-mini-4k-instruct`, `microsoft/Phi-3-mini-128k-instruct`, `microsoft/Phi-3-medium-128k-instruct`, etc. | ✅︎ | ✅︎ | ✅︎ |
diff --git a/tests/entrypoints/conftest.py b/tests/entrypoints/conftest.py
index da75806ccf4d..7daf62595b1b 100644
--- a/tests/entrypoints/conftest.py
+++ b/tests/entrypoints/conftest.py
@@ -208,3 +208,11 @@ def zephyr_lora_files():
     """Download zephyr LoRA files once per test session."""
     from huggingface_hub import snapshot_download
     return snapshot_download(repo_id="typeof/zephyr-7b-beta-lora")
+
+
+@pytest.fixture(scope="session")
+def opt125_lora_files() -> str:
+    """Download opt-125m LoRA files once per test session."""
+    from huggingface_hub import snapshot_download
+    return snapshot_download(
+        repo_id="peft-internal-testing/opt-125m-dummy-lora")
diff --git a/tests/entrypoints/openai/test_completion_with_prompt_embeds.py b/tests/entrypoints/openai/test_completion_with_prompt_embeds.py
index ae51025455b1..cad914282306 100644
--- a/tests/entrypoints/openai/test_completion_with_prompt_embeds.py
+++ b/tests/entrypoints/openai/test_completion_with_prompt_embeds.py
@@ -3,6 +3,7 @@
 
 import base64
 import io
+import json
 
 import openai  # use the official client for correctness check
 import pytest
@@ -16,13 +17,15 @@
 
 # any model with a chat template should work here
 MODEL_NAME = "facebook/opt-125m"
+LORA_SERVING_MODEL_NAME = "opt125m-lora"
 
 CONFIG = AutoConfig.from_pretrained(MODEL_NAME)
 
 
-@pytest.fixture(scope="module")
-def default_server_args() -> list[str]:
-    return [
+@pytest.fixture(scope="module", params=["use-lora"])
+def default_server_args(request: pytest.FixtureRequest,
+                        opt125_lora_files: str) -> list[str]:
+    args = [
         # use half precision for speed and memory savings in CI environment
         "--dtype",
         "bfloat16",
@@ -35,6 +38,25 @@ def default_server_args() -> list[str]:
         "--enable-prompt-embeds",
     ]
 
+    if request.param == "use-lora":
+        lora_module_1 = {
+            "name": LORA_SERVING_MODEL_NAME,
+            "path": opt125_lora_files,
+            "base_model_name": MODEL_NAME
+        }
+
+        args.extend([
+            "--enable-lora",
+            "--lora-module",
+            json.dumps(lora_module_1),
+            "--max-lora-rank",
+            "64",
+            "--max-cpu-loras",
+            "2",
+        ])
+
+    return args
+
 
 EXAMPLE_PROMPTS = [
     "Hello, my name is",
@@ -74,7 +96,7 @@ async def client_with_prompt_embeds(server_with_prompt_embeds):
 
 
 @pytest.mark.asyncio
-@pytest.mark.parametrize("model_name", [MODEL_NAME])
+@pytest.mark.parametrize("model_name", [MODEL_NAME, LORA_SERVING_MODEL_NAME])
 async def test_completions_with_prompt_embeds(
     example_prompt_embeds,
     client_with_prompt_embeds: openai.AsyncOpenAI,
@@ -179,7 +201,7 @@ async def test_completions_with_prompt_embeds(
 
 
 @pytest.mark.asyncio
-@pytest.mark.parametrize("model_name", [MODEL_NAME])
+@pytest.mark.parametrize("model_name", [MODEL_NAME, LORA_SERVING_MODEL_NAME])
 async def test_completions_errors_with_prompt_embeds(
         client_with_prompt_embeds: openai.AsyncOpenAI, model_name: str):
     # Test error case: invalid prompt_embeds
@@ -194,7 +216,7 @@ async def test_completions_errors_with_prompt_embeds(
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("logprobs_arg", [1, 0])
-@pytest.mark.parametrize("model_name", [MODEL_NAME])
+@pytest.mark.parametrize("model_name", [MODEL_NAME, LORA_SERVING_MODEL_NAME])
 async def test_completions_with_logprobs_and_prompt_embeds(
     example_prompt_embeds,
     client_with_prompt_embeds: openai.AsyncOpenAI,
diff --git a/vllm/model_executor/models/opt.py b/vllm/model_executor/models/opt.py
index 4c3ce9f61efb..c4746166471c 100644
--- a/vllm/model_executor/models/opt.py
+++ b/vllm/model_executor/models/opt.py
@@ -43,7 +43,7 @@
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
-from .interfaces import SupportsPP
+from .interfaces import SupportsLoRA, SupportsPP
 from .utils import (AutoWeightsLoader, WeightsMapper, is_pp_missing_parameter,
                     make_empty_intermediate_tensors_factory, make_layers,
                     maybe_prefix)
@@ -352,10 +352,9 @@ def load_weights(self, weights: Iterable[tuple[str,
         return loaded_params
 
 
-class OPTForCausalLM(nn.Module, SupportsPP):
+class OPTForCausalLM(nn.Module, SupportsPP, SupportsLoRA):
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
-        "gate_up_proj": ["gate_proj", "up_proj"]
     }
 
     hf_to_vllm_mapper = WeightsMapper(orig_to_new_prefix={

From 4256477823158c892adbf7580148337028e1ea37 Mon Sep 17 00:00:00 2001
From: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Date: Mon, 29 Sep 2025 21:15:19 -0400
Subject: [PATCH 030/193] [Bug] Fix Weight Loading for Block FP8 Cutlass SM90
 (#25909)

Signed-off-by: yewentao256 <zhyanwentao@126.com>
Signed-off-by: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../model_executor/layers/quantization/utils/fp8_utils.py | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/vllm/model_executor/layers/quantization/utils/fp8_utils.py b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
index b2548e66827d..828111dc299e 100644
--- a/vllm/model_executor/layers/quantization/utils/fp8_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
@@ -911,15 +911,15 @@ def maybe_post_process_fp8_weight_block(layer: torch.nn.Module,
     # On Blackwell or Hopper, if E8M0 for DeepGemm is used, we need to
     # requantize the weight and input to the specific scale
     # at the same time.
-    if is_deep_gemm_e8m0_used():
+    should_use_deepgemm = should_use_deepgemm_for_fp8_linear(
+        layer.orig_dtype, layer.weight)
+    if is_deep_gemm_e8m0_used() and should_use_deepgemm:
         block_sz = tuple(layer.weight_block_size)
         requant_weight_ue8m0_inplace(layer.weight.data,
                                      layer.weight_scale.data, block_sz)
     # SM90 Block FP8 CUTLASS requires row-major weight scales
     elif (current_platform.is_device_capability(90)
-          and cutlass_block_fp8_supported
-          and not should_use_deepgemm_for_fp8_linear(torch.bfloat16,
-                                                     layer.weight)):
+          and cutlass_block_fp8_supported and not should_use_deepgemm):
         layer.weight_scale = torch.nn.Parameter(
             layer.weight_scale.data.T.contiguous(), requires_grad=False)
 

From ba97f4f50d950f52b25df1df0a0e2303741aecf5 Mon Sep 17 00:00:00 2001
From: Zhuohan Li <zhuohan123@gmail.com>
Date: Mon, 29 Sep 2025 18:43:57 -0700
Subject: [PATCH 031/193] [Benchmark] Support benchmark throughput for external
 launcher DP (#25913)

Signed-off-by: Zhuohan Li <zhuohan123@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/benchmarks/throughput.py | 33 +++++++++++++++++++++++++++------
 1 file changed, 27 insertions(+), 6 deletions(-)

diff --git a/vllm/benchmarks/throughput.py b/vllm/benchmarks/throughput.py
index 96e39fd92eba..9e38e63a0883 100644
--- a/vllm/benchmarks/throughput.py
+++ b/vllm/benchmarks/throughput.py
@@ -358,7 +358,23 @@ def get_requests(args, tokenizer):
         raise ValueError(f"Unknown dataset name: {args.dataset_name}")
     # Remove None values
     sample_kwargs = {k: v for k, v in sample_kwargs.items() if v is not None}
-    return dataset_cls(**common_kwargs).sample(**sample_kwargs)
+    requests = dataset_cls(**common_kwargs).sample(**sample_kwargs)
+    requests = filter_requests_for_dp(requests, args.data_parallel_size)
+    return requests
+
+
+def filter_requests_for_dp(requests, data_parallel_size):
+    # Note(zhuohan): The way we get data_parallel_rank is hacky and only
+    # works for external launcher mode. Should be cleaned up and deprecated
+    # in the future with a better vLLM distributed process design.
+    if data_parallel_size == 1:
+        return requests
+
+    global_rank = int(os.environ["RANK"])
+    world_size = int(os.environ["WORLD_SIZE"])
+    data_parallel_rank = global_rank // (world_size // data_parallel_size)
+    return [r for i, r in enumerate(requests)
+            if i % data_parallel_size == data_parallel_rank]
 
 
 def validate_args(args):
@@ -453,12 +469,17 @@ def validate_args(args):
     if args.backend == "mii" and args.tokenizer != args.model:
         raise ValueError(
             "Tokenizer must be the same as the model for MII backend.")
-    
-    # --data-parallel is not supported currently.
-    # https://github.com/vllm-project/vllm/issues/16222
-    if args.data_parallel_size > 1:
+
+    if args.data_parallel_size > 1 and (
+        args.distributed_executor_backend != "external_launcher"
+        or args.async_engine):
+        # --data-parallel is not supported fully.
+        # Old issue: https://github.com/vllm-project/vllm/issues/16222
+        # Currently we only support data parallel with external launcher
+        # mode (i.e., launch with toruchrun).
         raise ValueError(
-            "Data parallel is not supported in offline benchmark, "
+            "Data parallel is only supported with external launcher mode "
+            "with synchronous engine in offline benchmark, "
             "please use benchmark serving instead"
         )
 

From bff1764763abad20a6d19aac9ee534405606f35b Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Tue, 30 Sep 2025 03:49:49 +0100
Subject: [PATCH 032/193] Move`VllmConfig` from `config/__init__.py` to
 `config/vllm.py` (#25271)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/attention/layer.py                       |   3 +-
 .../layers/chunked_local_attention.py         |   3 +-
 vllm/config/__init__.py                       | 905 ++----------------
 vllm/config/utils.py                          |  42 +-
 vllm/config/vllm.py                           | 789 +++++++++++++++
 .../layers/mamba/linear_attn.py               |   3 +-
 .../layers/quantization/auto_round.py         |   5 +-
 .../layers/quantization/bitblas.py            |   5 +-
 .../layers/quantization/bitsandbytes.py       |   5 +-
 .../layers/quantization/deepspeedfp.py        |   5 +-
 .../layers/quantization/gptq.py               |   8 +-
 .../layers/quantization/gptq_bitblas.py       |   5 +-
 .../layers/quantization/gptq_marlin.py        |   2 +-
 .../layers/quantization/gptq_marlin_24.py     |   5 +-
 .../layers/quantization/ipex_quant.py         |   5 +-
 .../kernels/mixed_precision/bitblas.py        |   3 +-
 .../layers/quantization/tpu_int8.py           |   5 +-
 .../layers/quantization/utils/gptq_utils.py   |  18 +-
 vllm/model_executor/models/aimv2.py           |   3 +-
 vllm/model_executor/models/aria.py            |   3 +-
 vllm/model_executor/models/bailing_moe.py     |   3 +-
 vllm/model_executor/models/granite.py         |   3 +-
 vllm/model_executor/models/granitemoe.py      |   3 +-
 .../model_executor/models/granitemoeshared.py |   3 +-
 vllm/model_executor/models/hunyuan_v1.py      |   3 +-
 vllm/model_executor/models/interfaces.py      |   3 +-
 vllm/model_executor/models/llama4_eagle.py    |   3 +-
 vllm/model_executor/models/mamba.py           |   3 +-
 vllm/model_executor/models/mamba2.py          |   3 +-
 vllm/model_executor/models/minimax_text_01.py |   3 +-
 vllm/model_executor/models/ovis.py            |   3 +-
 vllm/model_executor/models/ovis2_5.py         |   3 +-
 vllm/model_executor/models/phimoe.py          |   3 +-
 vllm/model_executor/models/siglip2navit.py    |   2 +-
 vllm/model_executor/models/step3_text.py      |   3 +-
 vllm/model_executor/models/whisper.py         |   3 +-
 36 files changed, 964 insertions(+), 905 deletions(-)
 create mode 100644 vllm/config/vllm.py

diff --git a/vllm/attention/layer.py b/vllm/attention/layer.py
index d97c87d96e99..8cab8330a6cd 100644
--- a/vllm/attention/layer.py
+++ b/vllm/attention/layer.py
@@ -20,8 +20,7 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.attention_layer_base import AttentionLayerBase
 from vllm.model_executor.layers.linear import UnquantizedLinearMethod
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.input_quant_fp8 import QuantFP8
 from vllm.model_executor.layers.quantization.kv_cache import BaseKVCacheMethod
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
diff --git a/vllm/attention/layers/chunked_local_attention.py b/vllm/attention/layers/chunked_local_attention.py
index 087c5004bde0..3964eca7d36b 100644
--- a/vllm/attention/layers/chunked_local_attention.py
+++ b/vllm/attention/layers/chunked_local_attention.py
@@ -9,7 +9,8 @@
 from vllm.attention.backends.abstract import (AttentionBackend,
                                               AttentionMetadata)
 from vllm.attention.selector import get_attn_backend
-from vllm.config import CacheConfig, QuantizationConfig
+from vllm.config import CacheConfig
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.v1.attention.backends.utils import (
     CommonAttentionMetadata, make_local_attention_virtual_batches,
     subclass_attention_backend)
diff --git a/vllm/config/__init__.py b/vllm/config/__init__.py
index ccb91999d370..c909265c071d 100644
--- a/vllm/config/__init__.py
+++ b/vllm/config/__init__.py
@@ -1,29 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-# ruff: noqa: F401
-import ast
-import copy
-import hashlib
-import inspect
-import json
-import os
-import textwrap
-from contextlib import contextmanager
-from dataclasses import field, fields, is_dataclass, replace
-from functools import cached_property, lru_cache
-from pathlib import Path
-from typing import (TYPE_CHECKING, Any, Literal, Optional, Protocol, TypeVar,
-                    Union, cast)
-
-import regex as re
-import torch
-from pydantic import ConfigDict, SkipValidation
-from pydantic.dataclasses import dataclass
-from typing_extensions import runtime_checkable
-
-import vllm.envs as envs
-from vllm import version
 from vllm.config.cache import (BlockSize, CacheConfig, CacheDType, MambaDType,
                                PrefixCachingHashAlgo)
 from vllm.config.compilation import (CompilationConfig, CompilationLevel,
@@ -48,806 +25,82 @@
 from vllm.config.speculative import SpeculativeConfig
 from vllm.config.speech_to_text import SpeechToTextConfig
 from vllm.config.structured_outputs import StructuredOutputsConfig
-from vllm.config.utils import ConfigType, config, get_attr_docs, is_init_field
-from vllm.logger import init_logger
-from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.transformers_utils.runai_utils import is_runai_obj_uri
-from vllm.utils import random_uuid
-
-if TYPE_CHECKING:
-    from _typeshed import DataclassInstance
-    from transformers.configuration_utils import PretrainedConfig
-
-    from vllm.model_executor.layers.quantization.base_config import (
-        QuantizationConfig)
-else:
-    DataclassInstance = Any
-    PretrainedConfig = Any
-    QuantizationConfig = Any
-    QuantizationMethods = Any
-    BaseModelLoader = Any
-    LogitsProcessor = Any
-
-logger = init_logger(__name__)
-DataclassInstanceT = TypeVar("DataclassInstanceT", bound=DataclassInstance)
-
-
-@runtime_checkable
-class SupportsHash(Protocol):
-
-    def compute_hash(self) -> str:
-        ...
-
-
-class SupportsMetricsInfo(Protocol):
-
-    def metrics_info(self) -> dict[str, str]:
-        ...
-
-
-@config
-@dataclass(config=ConfigDict(arbitrary_types_allowed=True))
-class VllmConfig:
-    """Dataclass which contains all vllm-related configuration. This
-    simplifies passing around the distinct configurations in the codebase.
-    """
-
-    # TODO: use default_factory once default constructing ModelConfig doesn't
-    # try to download a model
-    model_config: ModelConfig = None  # type: ignore
-    """Model configuration."""
-    cache_config: CacheConfig = field(default_factory=CacheConfig)
-    """Cache configuration."""
-    parallel_config: ParallelConfig = field(default_factory=ParallelConfig)
-    """Parallel configuration."""
-    scheduler_config: SchedulerConfig = field(default_factory=SchedulerConfig)
-    """Scheduler configuration."""
-    device_config: DeviceConfig = field(default_factory=DeviceConfig)
-    """Device configuration."""
-    load_config: LoadConfig = field(default_factory=LoadConfig)
-    """Load configuration."""
-    lora_config: Optional[LoRAConfig] = None
-    """LoRA configuration."""
-    speculative_config: Optional[SpeculativeConfig] = None
-    """Speculative decoding configuration."""
-    structured_outputs_config: StructuredOutputsConfig = field(
-        default_factory=StructuredOutputsConfig)
-    """Structured outputs configuration."""
-    observability_config: Optional[ObservabilityConfig] = None
-    """Observability configuration."""
-    quant_config: Optional[QuantizationConfig] = None
-    """Quantization configuration."""
-    compilation_config: CompilationConfig = field(
-        default_factory=CompilationConfig)
-    """`torch.compile` and cudagraph capture configuration for the model.
-
-    As a shorthand, `-O<n>` can be used to directly specify the compilation
-    level `n`: `-O3` is equivalent to `-O.level=3` (same as `-O='{"level":3}'`).
-    Currently, -O <n> and -O=<n> are supported as well but this will likely be
-    removed in favor of clearer -O<n> syntax in the future.
-
-    NOTE: level 0 is the default level without any optimization. level 1 and 2
-    are for internal testing only. level 3 is the recommended level for
-    production, also default in V1.
-
-    You can specify the full compilation config like so:
-    `{"level": 3, "cudagraph_capture_sizes": [1, 2, 4, 8]}`
-    """
-    kv_transfer_config: Optional[KVTransferConfig] = None
-    """The configurations for distributed KV cache transfer."""
-    kv_events_config: Optional[KVEventsConfig] = None
-    """The configurations for event publishing."""
-    # some opaque config, only used to provide additional information
-    # for the hash computation, mainly used for testing, debugging or out of
-    # tree config registration.
-    additional_config: Union[dict, SupportsHash] = field(default_factory=dict)
-    """Additional config for specified platform. Different platforms may
-    support different configs. Make sure the configs are valid for the platform
-    you are using. Contents must be hashable."""
-    instance_id: str = ""
-    """The ID of the vLLM instance."""
-
-    def compute_hash(self) -> str:
-        """
-        WARNING: Whenever a new field is added to this config,
-        ensure that it is included in the factors list if
-        it affects the computation graph.
-
-        Provide a hash that uniquely identifies all the configs
-        that affect the structure of the computation
-        graph from input ids/embeddings to the final hidden states,
-        excluding anything before input ids/embeddings and after
-        the final hidden states.
-        """
-        factors: list[Any] = []
-
-        # summarize vllm config
-        vllm_factors: list[Any] = []
-        from vllm import __version__
-        vllm_factors.append(__version__)
-        vllm_factors.append(envs.VLLM_USE_V1)
-        if self.model_config:
-            vllm_factors.append(self.model_config.compute_hash())
-        else:
-            vllm_factors.append("None")
-        if self.cache_config:
-            vllm_factors.append(self.cache_config.compute_hash())
-        else:
-            vllm_factors.append("None")
-        if self.parallel_config:
-            vllm_factors.append(self.parallel_config.compute_hash())
-        else:
-            vllm_factors.append("None")
-        if self.scheduler_config:
-            vllm_factors.append(self.scheduler_config.compute_hash())
-        else:
-            vllm_factors.append("None")
-        if self.device_config:
-            vllm_factors.append(self.device_config.compute_hash())
-        else:
-            vllm_factors.append("None")
-        if self.load_config:
-            vllm_factors.append(self.load_config.compute_hash())
-        else:
-            vllm_factors.append("None")
-        if self.lora_config:
-            vllm_factors.append(self.lora_config.compute_hash())
-            # LoRA creates static buffers based on max_num_batched_tokens.
-            # The tensor sizes and strides get captured in the torch.compile
-            # graph explicitly.
-            vllm_factors.append(
-                str(self.scheduler_config.max_num_batched_tokens))
-        else:
-            vllm_factors.append("None")
-        if self.speculative_config:
-            vllm_factors.append(self.speculative_config.compute_hash())
-        else:
-            vllm_factors.append("None")
-        if self.structured_outputs_config:
-            vllm_factors.append(self.structured_outputs_config.compute_hash())
-        else:
-            vllm_factors.append("None")
-        if self.observability_config:
-            vllm_factors.append(self.observability_config.compute_hash())
-        else:
-            vllm_factors.append("None")
-        if self.quant_config:
-            pass  # should be captured by model_config.quantization
-        if self.compilation_config:
-            vllm_factors.append(self.compilation_config.compute_hash())
-        else:
-            vllm_factors.append("None")
-        if self.kv_transfer_config:
-            vllm_factors.append(self.kv_transfer_config.compute_hash())
-        else:
-            vllm_factors.append("None")
-        if self.additional_config:
-            if isinstance(additional_config := self.additional_config, dict):
-                additional_config_hash = hashlib.md5(
-                    json.dumps(additional_config, sort_keys=True).encode(),
-                    usedforsecurity=False,
-                ).hexdigest()
-            else:
-                additional_config_hash = additional_config.compute_hash()
-            vllm_factors.append(additional_config_hash)
-        else:
-            vllm_factors.append("None")
-        factors.append(vllm_factors)
-
-        hash_str = hashlib.md5(str(factors).encode(),
-                               usedforsecurity=False).hexdigest()[:10]
-        return hash_str
-
-    def pad_for_cudagraph(self, batch_size: int) -> int:
-        # if batch_size > self.compilation_config.max_capture_size,
-        # it should raise an IndexError.
-        # the caller should make sure the batch_size is within the range,
-        # i.e., batch_size <= self.compilation_config.max_capture_size
-        return self.compilation_config.bs_to_padded_graph_size[batch_size]
-
-    @staticmethod
-    def _get_quantization_config(
-            model_config: ModelConfig,
-            load_config: LoadConfig) -> Optional[QuantizationConfig]:
-        """Get the quantization config."""
-        from vllm.platforms import current_platform
-        if model_config.quantization is not None:
-            from vllm.model_executor.model_loader.weight_utils import (
-                get_quant_config)
-            quant_config = get_quant_config(model_config, load_config)
-            capability_tuple = current_platform.get_device_capability()
-
-            if capability_tuple is not None:
-                capability = capability_tuple.to_int()
-                if capability < quant_config.get_min_capability():
-                    raise ValueError(
-                        f"The quantization method {model_config.quantization} "
-                        "is not supported for the current GPU. Minimum "
-                        f"capability: {quant_config.get_min_capability()}. "
-                        f"Current capability: {capability}.")
-            supported_dtypes = quant_config.get_supported_act_dtypes()
-            if model_config.dtype not in supported_dtypes:
-                raise ValueError(
-                    f"{model_config.dtype} is not supported for quantization "
-                    f"method {model_config.quantization}. Supported dtypes: "
-                    f"{supported_dtypes}")
-            quant_config.maybe_update_config(model_config.model)
-            return quant_config
-        return None
-
-    @staticmethod
-    def get_quantization_config(
-            model_config: ModelConfig,
-            load_config: LoadConfig) -> Optional[QuantizationConfig]:
-        import copy
-
-        # For some reason, the _ version of this modifies the model_config
-        # object, so using deepcopy to avoid this problem.
-        return VllmConfig._get_quantization_config(copy.deepcopy(model_config),
-                                                   load_config)
-
-    def with_hf_config(
-        self,
-        hf_config: PretrainedConfig,
-        architectures: Optional[list[str]] = None,
-    ) -> "VllmConfig":
-        if architectures is not None:
-            hf_config = copy.deepcopy(hf_config)
-            hf_config.architectures = architectures
-
-        model_config = copy.deepcopy(self.model_config)
-        model_config.hf_config = hf_config
-
-        return replace(self, model_config=model_config)
-
-    def __post_init__(self):
-        """Verify configs are valid & consistent with each other.
-        """
-
-        self.try_verify_and_update_config()
-
-        if self.model_config is not None:
-            self.model_config.verify_with_parallel_config(self.parallel_config)
-            self.model_config.verify_dual_chunk_attention_config(
-                self.load_config)
-
-        self.cache_config.verify_with_parallel_config(self.parallel_config)
-
-        if self.lora_config is not None:
-            self.lora_config.verify_with_cache_config(self.cache_config)
-            self.lora_config.verify_with_model_config(self.model_config)
-
-        if self.quant_config is None and self.model_config is not None:
-            self.quant_config = VllmConfig._get_quantization_config(
-                self.model_config, self.load_config)
-
-        from vllm.platforms import current_platform
-        if self.model_config is not None and \
-            self.scheduler_config.chunked_prefill_enabled and \
-            self.model_config.dtype == torch.float32 and \
-            current_platform.get_device_capability() == (7, 5):
-            logger.warning_once(
-                "Turing devices tensor cores do not support float32 matmul. "
-                "To workaround this limitation, vLLM will set 'ieee' input "
-                "precision for chunked prefill triton kernels.")
-
-        # If the user does not explicitly set a compilation level, then
-        # we use the default level. The default level depends on other
-        # settings (see the below code).
-        if self.compilation_config.level is None:
-            if envs.VLLM_USE_V1:
-                if (self.model_config is not None
-                        and not self.model_config.enforce_eager):
-                    self.compilation_config.level = CompilationLevel.PIECEWISE
-                else:
-                    self.compilation_config.level = \
-                            CompilationLevel.NO_COMPILATION
-
-            else:
-                # NB: Passing both --enforce-eager and a compilation level
-                # in V0 means the compilation level wins out.
-                self.compilation_config.level = CompilationLevel.NO_COMPILATION
-
-        # async tp is built on top of sequence parallelism
-        # and requires it to be enabled.
-        if self.compilation_config.pass_config.enable_async_tp:
-            self.compilation_config.pass_config.enable_sequence_parallelism = \
-                True
-        if self.compilation_config.pass_config.enable_sequence_parallelism:
-            self.compilation_config.custom_ops.append("+rms_norm")
-
-        if current_platform.support_static_graph_mode():
-            # if cudagraph_mode is not explicitly set by users, set default
-            # value
-            if self.compilation_config.cudagraph_mode is None:
-                if envs.VLLM_USE_V1 and self.compilation_config.level \
-                    == CompilationLevel.PIECEWISE:
-                    # default to full and piecewise for most models
-                    self.compilation_config.cudagraph_mode = \
-                        CUDAGraphMode.FULL_AND_PIECEWISE
-
-                    # pooling models and encoder-decoder models
-                    # do not support full cudagraphs
-                    if self.model_config is not None and \
-                        (self.model_config.pooler_config is not None
-                         or self.model_config.is_encoder_decoder):
-                        self.compilation_config.cudagraph_mode = \
-                            CUDAGraphMode.PIECEWISE
-                else:
-                    self.compilation_config.cudagraph_mode = CUDAGraphMode.NONE
-
-            # disable cudagraph when enforce eager execution
-            if self.model_config is not None and \
-                    self.model_config.enforce_eager:
-                logger.info("Cudagraph is disabled under eager mode")
-                self.compilation_config.cudagraph_mode = CUDAGraphMode.NONE
-            elif envs.VLLM_USE_V1:
-                self.compilation_config.cudagraph_num_of_warmups = 1
-
-            self._set_cudagraph_sizes()
-        else:
-            self.compilation_config.cudagraph_mode = CUDAGraphMode.NONE
-
-        if self.cache_config.kv_sharing_fast_prefill:
-
-            if self.speculative_config is not None and \
-                self.speculative_config.use_eagle():
-                raise NotImplementedError(
-                    "Fast prefill optimization for KV sharing is not "
-                    "compatible with EAGLE as EAGLE requires correct logits "
-                    "for all tokens while fast prefill gives incorrect logits "
-                    "for prompt tokens.")
-
-            logger.warning_once(
-                "--kv-sharing-fast-prefill requires changes on model side for "
-                "correctness and to realize prefill savings. ")
-
-        disable_chunked_prefill_reasons: list[str] = []
-
-        if self.model_config:
-            if self.model_config.pooler_config:
-                pooling_type = self.model_config.pooler_config.pooling_type
-                if pooling_type is None or pooling_type.lower() != "last":
-                    disable_chunked_prefill_reasons.append(
-                        "Only \"last\" pooling supports chunked "
-                        "prefill and prefix caching; disabling both.")
-                if not getattr(self.model_config.hf_config, "is_causal", True):
-                    disable_chunked_prefill_reasons.append(
-                        "Only models using causal attention supports chunked "
-                        "prefill and prefix caching; disabling both.")
-            elif self.model_config.is_encoder_decoder:
-                self.scheduler_config.max_num_encoder_input_tokens = \
-                    MULTIMODAL_REGISTRY.get_encdec_max_encoder_len(self.model_config)
-                logger.debug(
-                    "Encoder-decoder model detected: setting "
-                    "`max_num_encoder_input_tokens` to encoder length (%s)",
-                    self.scheduler_config.max_num_encoder_input_tokens)
-                self.scheduler_config.disable_chunked_mm_input = True
-                disable_chunked_prefill_reasons.append(
-                    "Encoder-decoder models do not support chunked prefill nor"
-                    " prefix caching; disabling both.")
-                if (self.model_config.architecture
-                        == "WhisperForConditionalGeneration"
-                        and os.environ.get("VLLM_WORKER_MULTIPROC_METHOD")
-                        != "spawn"):
-                    logger.warning(
-                        "Whisper is known to have issues with "
-                        "forked workers. If startup is hanging, "
-                        "try setting 'VLLM_WORKER_MULTIPROC_METHOD' "
-                        "to 'spawn'.")
-
-        if disable_chunked_prefill_reasons:
-            for reason in disable_chunked_prefill_reasons:
-                logger.info(reason)
-            self.scheduler_config.chunked_prefill_enabled = False
-            self.scheduler_config.long_prefill_token_threshold = 0
-
-            if self.cache_config is not None:
-                self.cache_config.enable_prefix_caching = False
-
-        if (self.kv_events_config is not None
-                and self.kv_events_config.enable_kv_cache_events
-                and not self.cache_config.enable_prefix_caching):
-            logger.warning(
-                "KV cache events are on, but prefix caching is not enabled."
-                "Use --enable-prefix-caching to enable.")
-        if (self.kv_events_config is not None
-                and self.kv_events_config.publisher != "null"
-                and not self.kv_events_config.enable_kv_cache_events):
-            logger.warning("KV cache events are disabled,"
-                           "but the scheduler is configured to publish them."
-                           "Modify KVEventsConfig.enable_kv_cache_events"
-                           "to True to enable.")
-        current_platform.check_and_update_config(self)
-
-        # Do this after all the updates to compilation_config.level
-        if envs.VLLM_USE_V1 and \
-            self.compilation_config.level == CompilationLevel.PIECEWISE:
-            self.compilation_config.set_splitting_ops_for_v1()
-
-        # final check of cudagraph mode after all possible updates
-        if envs.VLLM_USE_V1 and current_platform.is_cuda_alike():
-            if self.compilation_config.cudagraph_mode.has_full_cudagraphs()\
-                and self.model_config is not None and \
-                not self.model_config.disable_cascade_attn and\
-                not self.compilation_config.cudagraph_mode.\
-                has_piecewise_cudagraphs():
-                logger.warning_once(
-                    "No piecewise cudagraph for executing cascade attention."
-                    " Will fall back to eager execution if a batch runs "
-                    "into cascade attentions")
-
-            if self.compilation_config.cudagraph_mode\
-                .requires_piecewise_compilation():
-                assert self.compilation_config.level == \
-                    CompilationLevel.PIECEWISE, \
-                    "Compilation level should be CompilationLevel.PIECEWISE "\
-                    "when cudagraph_mode piecewise cudagraphs is used, "\
-                    f"cudagraph_mode={self.compilation_config.cudagraph_mode}"
-
-            # final migrate the deprecated flags
-            self.compilation_config.use_cudagraph = self.compilation_config.\
-                cudagraph_mode!= CUDAGraphMode.NONE
-            self.compilation_config.full_cuda_graph = self.compilation_config.\
-                cudagraph_mode.has_full_cudagraphs()
-
-        if self.parallel_config.enable_dbo:
-            a2a_backend = envs.VLLM_ALL2ALL_BACKEND
-            assert a2a_backend in \
-                ["deepep_low_latency", "deepep_high_throughput"], \
-            "Microbatching currently only supports the deepep_low_latency and "\
-            f"deepep_high_throughput all2all backend. {a2a_backend} is not "\
-            "supported. To fix set the VLLM_ALL2ALL_BACKEND environment "\
-            "variable to deepep_low_latency or deepep_high_throughput and "\
-            "install the DeepEP kernels."
-
-            if not self.model_config.disable_cascade_attn:
-                self.model_config.disable_cascade_attn = True
-                logger.warning_once(
-                    "Disabling cascade attention when DBO is enabled.")
-
-        if not self.instance_id:
-            self.instance_id = random_uuid()[:5]
-
-        if (envs.VLLM_USE_V1
-                and not self.scheduler_config.disable_hybrid_kv_cache_manager):
-            # logger should only print warning message for hybrid models. As we
-            # can't know whether the model is hybrid or not now, so we don't log
-            # warning message here and will log it later.
-            if not current_platform.support_hybrid_kv_cache():
-                # Hybrid KV cache manager is not supported on non-GPU platforms.
-                self.scheduler_config.disable_hybrid_kv_cache_manager = True
-            if self.kv_transfer_config is not None:
-                # Hybrid KV cache manager is not compatible with KV transfer.
-                self.scheduler_config.disable_hybrid_kv_cache_manager = True
-            if self.kv_events_config is not None:
-                # Hybrid KV cache manager is not compatible with KV events.
-                self.scheduler_config.disable_hybrid_kv_cache_manager = True
-            if self.model_config is not None and \
-                self.model_config.attention_chunk_size is not None:
-                if self.speculative_config is not None and \
-                    self.speculative_config.use_eagle():
-                    # Hybrid KV cache manager is not yet supported with chunked
-                    # local attention + eagle.
-                    self.scheduler_config.disable_hybrid_kv_cache_manager = True
-                elif \
-                    not envs.VLLM_ALLOW_CHUNKED_LOCAL_ATTN_WITH_HYBRID_KV_CACHE:
-                    logger.warning(
-                        "There is a latency regression when using chunked local"
-                        " attention with the hybrid KV cache manager. Disabling"
-                        " it, by default. To enable it, set the environment "
-                        "VLLM_ALLOW_CHUNKED_LOCAL_ATTN_WITH_HYBRID_KV_CACHE=1."
-                    )
-                    # Hybrid KV cache manager is not yet supported with chunked
-                    # local attention.
-                    self.scheduler_config.disable_hybrid_kv_cache_manager = True
-
-        if self.compilation_config.debug_dump_path:
-            self.compilation_config.debug_dump_path = \
-                self.compilation_config.debug_dump_path.absolute().expanduser()
-        if envs.VLLM_DEBUG_DUMP_PATH is not None:
-            env_path = Path(envs.VLLM_DEBUG_DUMP_PATH).absolute().expanduser()
-            if self.compilation_config.debug_dump_path:
-                logger.warning(
-                    "Config-specified debug dump path is overridden"
-                    " by VLLM_DEBUG_DUMP_PATH to %s", env_path)
-            self.compilation_config.debug_dump_path = env_path
-
-    def update_sizes_for_sequence_parallelism(self,
-                                              possible_sizes: list) -> list:
-        # remove the sizes that not multiple of tp_size when
-        # enable sequence parallelism
-        removed_sizes = [
-            size for size in possible_sizes
-            if size % self.parallel_config.tensor_parallel_size != 0
-        ]
-        if removed_sizes:
-            logger.warning(
-                "Batch sizes %s are removed because they are not "
-                "multiple of tp_size %d when "
-                "sequence parallelism is enabled", removed_sizes,
-                self.parallel_config.tensor_parallel_size)
-
-        return [
-            size for size in possible_sizes
-            if size % self.parallel_config.tensor_parallel_size == 0
-        ]
-
-    def _set_cudagraph_sizes(self):
-        """
-        vLLM defines the default candidate list of batch sizes for CUDA graph
-        capture as:
-
-        ```python
-        max_graph_size = min(max_num_seqs * 2, 512)
-        # 1, 2, 4, then multiples of 8 up to max_graph_size
-        cuda_graph_sizes = [1, 2, 4, 8, 16, 24, 32, 40, ..., max_graph_size]
-
-        In the end, `vllm_config.compilation_config.cudagraph_capture_sizes`
-        will be the final sizes to capture cudagraph (in descending order).
-
-        These sizes are used to capture and reuse CUDA graphs for
-        performance-critical paths (e.g., decoding). Capturing enables
-        significantly faster kernel dispatch by avoiding Python overhead. The
-        list is then filtered based on `max_num_batched_tokens` (e.g., 8192 on
-        most GPUs), which controls the total allowed number of tokens in a
-        batch. Since each sequence may have a variable number of tokens, the
-        maximum usable batch size will depend on actual sequence lengths.
-
-        Example:
-            With `max_num_batched_tokens = 8192`, and typical sequences
-            averaging ~32 tokens, most practical batch sizes fall below 256.
-            However, the system will still allow capture sizes up to 512 if
-            shape and memory permit.
-
-        Note:
-            If users explicitly specify cudagraph capture sizes in the
-            compilation config, those will override this default logic.
-            At runtime:
-
-            - If batch size <= one of the `cudagraph_capture_sizes`, the closest
-            padded CUDA graph will be used.
-            - If batch size > largest `cudagraph_capture_sizes`, cudagraph will
-            not be used.
-        """
-
-        # calculate the default `batch_size_capture_list`
-        batch_size_capture_list = []
-        if self.model_config is not None and \
-            not self.model_config.enforce_eager:
-            cuda_graph_sizes = self.scheduler_config.cuda_graph_sizes
-            if len(cuda_graph_sizes) == 1:
-                batch_size_capture_list = [1, 2, 4] + [
-                    i for i in range(8, cuda_graph_sizes[0] + 1, 8)
-                ]
-            elif len(cuda_graph_sizes) > 1:
-                batch_size_capture_list = sorted(cuda_graph_sizes)
-            else:
-                raise TypeError(f"Invalid value for {cuda_graph_sizes=}.")
-            if self.parallel_config.tensor_parallel_size > 1 and \
-                self.compilation_config.pass_config.enable_sequence_parallelism:
-                batch_size_capture_list = \
-                    self.update_sizes_for_sequence_parallelism(batch_size_capture_list)
-            max_num_tokens = self.scheduler_config.max_num_batched_tokens
-            batch_size_capture_list = [
-                size for size in batch_size_capture_list
-                if size <= max_num_tokens
-            ]
-
-        self.compilation_config.init_with_cudagraph_sizes(
-            batch_size_capture_list)
-
-    def recalculate_max_model_len(self, max_model_len: int):
-        # Can only be called in try_verify_and_update_config
-        model_config = self.model_config
-        max_model_len = model_config.get_and_verify_max_len(max_model_len)
-        self.model_config.max_model_len = max_model_len
-        self.scheduler_config.max_model_len = max_model_len
-
-    def try_verify_and_update_config(self):
-        if self.model_config is None:
-            return
-
-        # Avoid running try_verify_and_update_config multiple times
-        if getattr(self.model_config, "config_updated", False):
-            return
-        self.model_config.config_updated = True
-
-        architecture = self.model_config.architecture
-        if architecture is None:
-            return
-
-        from vllm.model_executor.models.config import (
-            MODELS_CONFIG_MAP, HybridAttentionMambaModelConfig)
-        cls = MODELS_CONFIG_MAP.get(architecture, None)
-        if cls is not None:
-            cls.verify_and_update_config(self)
-
-        if self.model_config.is_hybrid:
-            HybridAttentionMambaModelConfig.verify_and_update_config(self)
-
-        if self.model_config.convert_type == "classify":
-            # Maybe convert ForCausalLM into ForSequenceClassification model.
-            from vllm.model_executor.models.adapters import (
-                SequenceClassificationConfig)
-            SequenceClassificationConfig.verify_and_update_config(self)
-
-        if hasattr(self.model_config, "model_weights") and is_runai_obj_uri(
-                self.model_config.model_weights):
-            if self.load_config.load_format == "auto":
-                logger.info("Detected Run:ai model config. "
-                            "Overriding `load_format` to 'runai_streamer'")
-                self.load_config.load_format = "runai_streamer"
-            elif self.load_config.load_format != "runai_streamer":
-                raise ValueError(f"To load a model from S3, 'load_format' "
-                                 f"must be 'runai_streamer', "
-                                 f"but got '{self.load_config.load_format}'. "
-                                 f"Model: {self.model_config.model}")
-
-    def compile_debug_dump_path(self) -> Optional[Path]:
-        """Returns a rank-aware path for dumping 
-        torch.compile debug information.
-        """
-        if self.compilation_config.debug_dump_path is None:
-            return None
-        tp_rank = self.parallel_config.rank
-        dp_rank = self.parallel_config.data_parallel_rank
-        data_parallel_size = self.parallel_config.data_parallel_size
-        append_path = f"rank_{tp_rank}" if data_parallel_size == 1 \
-            else f"rank_{tp_rank}_dp_{dp_rank}"
-        path = self.compilation_config.debug_dump_path / append_path
-        return path
-
-    def __str__(self):
-        return (
-            f"model={self.model_config.model!r}, "
-            f"speculative_config={self.speculative_config!r}, "
-            f"tokenizer={self.model_config.tokenizer!r}, "
-            f"skip_tokenizer_init={self.model_config.skip_tokenizer_init}, "
-            f"tokenizer_mode={self.model_config.tokenizer_mode}, "
-            f"revision={self.model_config.revision}, "
-            f"tokenizer_revision={self.model_config.tokenizer_revision}, "
-            f"trust_remote_code={self.model_config.trust_remote_code}, "
-            f"dtype={self.model_config.dtype}, "
-            f"max_seq_len={self.model_config.max_model_len}, "
-            f"download_dir={self.load_config.download_dir!r}, "
-            f"load_format={self.load_config.load_format}, "
-            f"tensor_parallel_size={self.parallel_config.tensor_parallel_size}, "  # noqa
-            f"pipeline_parallel_size={self.parallel_config.pipeline_parallel_size}, "  # noqa
-            f"data_parallel_size={self.parallel_config.data_parallel_size}, "  # noqa
-            f"disable_custom_all_reduce={self.parallel_config.disable_custom_all_reduce}, "  # noqa
-            f"quantization={self.model_config.quantization}, "
-            f"enforce_eager={self.model_config.enforce_eager}, "
-            f"kv_cache_dtype={self.cache_config.cache_dtype}, "
-            f"device_config={self.device_config.device}, "
-            f"structured_outputs_config={self.structured_outputs_config!r}, "
-            f"observability_config={self.observability_config!r}, "
-            f"seed={self.model_config.seed}, "
-            f"served_model_name={self.model_config.served_model_name}, "
-            f"enable_prefix_caching={self.cache_config.enable_prefix_caching}, "
-            f"chunked_prefill_enabled={self.scheduler_config.chunked_prefill_enabled}, "  # noqa
-            f"pooler_config={self.model_config.pooler_config!r}, "
-            f"compilation_config={self.compilation_config!r}")
-
-
-_current_vllm_config: Optional[VllmConfig] = None
-_current_prefix: Optional[str] = None
-
-
-@contextmanager
-def set_current_vllm_config(vllm_config: VllmConfig,
-                            check_compile=False,
-                            prefix: Optional[str] = None):
-    """
-    Temporarily set the current vLLM config.
-    Used during model initialization.
-    We save the current vLLM config in a global variable,
-    so that all modules can access it, e.g. custom ops
-    can access the vLLM config to determine how to dispatch.
-    """
-    global _current_vllm_config, _current_prefix
-    old_vllm_config = _current_vllm_config
-    old_prefix = _current_prefix
-    from vllm.compilation.counter import compilation_counter
-    num_models_seen = compilation_counter.num_models_seen
-    try:
-        _current_vllm_config = vllm_config
-        _current_prefix = prefix
-        yield
-    except Exception:
-        raise
-    else:
-        if check_compile:
-            vllm_config.compilation_config.custom_op_log_check()
-
-        if check_compile and \
-            vllm_config.compilation_config.level == CompilationLevel.PIECEWISE \
-            and compilation_counter.num_models_seen == num_models_seen:
-            # If the model supports compilation,
-            # compilation_counter.num_models_seen should be increased
-            # by at least 1.
-            # If it is not increased, it means the model does not support
-            # compilation (does not have @support_torch_compile decorator).
-            logger.warning(
-                "`torch.compile` is turned on, but the model %s"
-                " does not support it. Please open an issue on GitHub"
-                " if you want it to be supported.",
-                vllm_config.model_config.model)
-    finally:
-        _current_vllm_config = old_vllm_config
-        _current_prefix = old_prefix
-        # Clear the compilation config cache when context changes
-        get_cached_compilation_config.cache_clear()
-
-
-@lru_cache(maxsize=1)
-def get_cached_compilation_config():
-    """Cache config to avoid repeated calls to get_current_vllm_config()"""
-    return get_current_vllm_config().compilation_config
-
-
-def get_current_vllm_config() -> VllmConfig:
-    if _current_vllm_config is None:
-        # in ci, usually when we test custom ops/modules directly,
-        # we don't set the vllm config. In that case, we set a default
-        # config.
-        logger.warning("Current vLLM config is not set.")
-        from vllm.config import VllmConfig
-        return VllmConfig()
-    return _current_vllm_config
-
-
-def get_current_model_prefix() -> str:
-    """
-    Get the prefix of the model that's currently being initialized.
-    """
-    assert _current_prefix is not None, \
-        "Current model prefix is not set. "
-    return _current_prefix
-
-
-T = TypeVar("T")
-
-
-def get_layers_from_vllm_config(
-        vllm_config: VllmConfig,
-        layer_type: type[T],
-        layer_names: Optional[list[str]] = None) -> dict[str, T]:
-    """
-    Get layers from the vLLM config.
-
-    Args:
-        vllm_config: The vLLM config.
-        layer_type: The type of the layer to get.
-        layer_names: The names of the layers to get. If None, return all layers.
-    """
-
-    if layer_names is None:
-        layer_names = list(
-            vllm_config.compilation_config.static_forward_context.keys())
-
-    forward_context = vllm_config.compilation_config.static_forward_context
-
-    return {
-        layer_name: forward_context[layer_name]
-        for layer_name in layer_names
-        if isinstance(forward_context[layer_name], layer_type)
-    }
-
-
-def update_config(config: DataclassInstanceT,
-                  overrides: dict[str, Any]) -> DataclassInstanceT:
-    processed_overrides = {}
-    for field_name, value in overrides.items():
-        assert hasattr(
-            config, field_name), f"{type(config)} has no field `{field_name}`"
-        current_value = getattr(config, field_name)
-        if is_dataclass(current_value) and not is_dataclass(value):
-            assert isinstance(value, dict), (
-                f"Overrides to {type(config)}.{field_name} must be a dict"
-                f"  or {type(current_value)}, but got {type(value)}")
-            value = update_config(
-                current_value,  # type: ignore[type-var]
-                value)
-        processed_overrides[field_name] = value
-    return replace(config, **processed_overrides)
+from vllm.config.utils import (ConfigType, SupportsMetricsInfo, config,
+                               get_attr_docs, is_init_field, update_config)
+from vllm.config.vllm import (VllmConfig, get_cached_compilation_config,
+                              get_current_vllm_config,
+                              get_layers_from_vllm_config,
+                              set_current_vllm_config)
+
+__all__ = [
+    # From vllm.config.cache
+    "BlockSize",
+    "CacheConfig",
+    "CacheDType",
+    "MambaDType",
+    "PrefixCachingHashAlgo",
+    # From vllm.config.compilation
+    "CompilationConfig",
+    "CompilationLevel",
+    "CUDAGraphMode",
+    "PassConfig",
+    # From vllm.config.device
+    "Device",
+    "DeviceConfig",
+    # From vllm.config.kv_events
+    "KVEventsConfig",
+    # From vllm.config.kv_transfer
+    "KVTransferConfig",
+    # From vllm.config.load
+    "LoadConfig",
+    # From vllm.config.lora
+    "LoRAConfig",
+    # From vllm.config.model
+    "ConvertOption",
+    "HfOverrides",
+    "LogprobsMode",
+    "ModelConfig",
+    "ModelDType",
+    "ModelImpl",
+    "RunnerOption",
+    "TaskOption",
+    "TokenizerMode",
+    "iter_architecture_defaults",
+    "try_match_architecture_defaults",
+    # From vllm.config.multimodal
+    "MMCacheType",
+    "MMEncoderTPMode",
+    "MultiModalConfig",
+    # From vllm.config.observability
+    "DetailedTraceModules",
+    "ObservabilityConfig",
+    # From vllm.config.parallel
+    "DistributedExecutorBackend",
+    "EPLBConfig",
+    "ParallelConfig",
+    # From vllm.config.pooler
+    "PoolerConfig",
+    # From vllm.config.scheduler
+    "RunnerType",
+    "SchedulerConfig",
+    "SchedulerPolicy",
+    # From vllm.config.speculative
+    "SpeculativeConfig",
+    # From vllm.config.speech_to_text
+    "SpeechToTextConfig",
+    # From vllm.config.structured_outputs
+    "StructuredOutputsConfig",
+    # From vllm.config.utils
+    "ConfigType",
+    "SupportsMetricsInfo",
+    "config",
+    "get_attr_docs",
+    "is_init_field",
+    "update_config",
+    # From vllm.config.vllm
+    "VllmConfig",
+    "get_cached_compilation_config",
+    "get_current_vllm_config",
+    "set_current_vllm_config",
+    "get_layers_from_vllm_config",
+]
diff --git a/vllm/config/utils.py b/vllm/config/utils.py
index 91e61b330273..2da30cbf149c 100644
--- a/vllm/config/utils.py
+++ b/vllm/config/utils.py
@@ -1,21 +1,21 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-
+"""Utility functions for vLLM config dataclasses."""
 import ast
 import inspect
 import textwrap
-from dataclasses import MISSING, Field, field, fields, is_dataclass
-from typing import TYPE_CHECKING, Any, TypeVar
+from dataclasses import MISSING, Field, field, fields, is_dataclass, replace
+from typing import TYPE_CHECKING, Any, Protocol, TypeVar
 
 import regex as re
+from typing_extensions import runtime_checkable
 
 if TYPE_CHECKING:
     from _typeshed import DataclassInstance
-
-    ConfigType = type[DataclassInstance]
 else:
-    ConfigType = type
+    DataclassInstance = Any
 
+ConfigType = type[DataclassInstance]
 ConfigT = TypeVar("ConfigT", bound=ConfigType)
 
 
@@ -143,3 +143,33 @@ def pairwise(iterable):
 
 def is_init_field(cls: ConfigType, name: str) -> bool:
     return next(f for f in fields(cls) if f.name == name).init
+
+
+@runtime_checkable
+class SupportsHash(Protocol):
+
+    def compute_hash(self) -> str:
+        ...
+
+
+class SupportsMetricsInfo(Protocol):
+
+    def metrics_info(self) -> dict[str, str]:
+        ...
+
+
+def update_config(config: ConfigT, overrides: dict[str, Any]) -> ConfigT:
+    processed_overrides = {}
+    for field_name, value in overrides.items():
+        assert hasattr(
+            config, field_name), f"{type(config)} has no field `{field_name}`"
+        current_value = getattr(config, field_name)
+        if is_dataclass(current_value) and not is_dataclass(value):
+            assert isinstance(value, dict), (
+                f"Overrides to {type(config)}.{field_name} must be a dict"
+                f"  or {type(current_value)}, but got {type(value)}")
+            value = update_config(
+                current_value,  # type: ignore[type-var]
+                value)
+        processed_overrides[field_name] = value
+    return replace(config, **processed_overrides)
diff --git a/vllm/config/vllm.py b/vllm/config/vllm.py
new file mode 100644
index 000000000000..7336f5756527
--- /dev/null
+++ b/vllm/config/vllm.py
@@ -0,0 +1,789 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+import copy
+import hashlib
+import json
+import os
+from contextlib import contextmanager
+from dataclasses import field, replace
+from functools import lru_cache
+from pathlib import Path
+from typing import TYPE_CHECKING, Any, Optional, TypeVar, Union
+
+import torch
+from pydantic import ConfigDict
+from pydantic.dataclasses import dataclass
+
+import vllm.envs as envs
+from vllm.logger import init_logger
+from vllm.transformers_utils.runai_utils import is_runai_obj_uri
+from vllm.utils import random_uuid
+
+from .cache import CacheConfig
+from .compilation import CompilationConfig, CompilationLevel, CUDAGraphMode
+from .device import DeviceConfig
+from .kv_events import KVEventsConfig
+from .kv_transfer import KVTransferConfig
+from .load import LoadConfig
+from .lora import LoRAConfig
+from .model import ModelConfig
+from .observability import ObservabilityConfig
+from .parallel import ParallelConfig
+from .scheduler import SchedulerConfig
+from .speculative import SpeculativeConfig
+from .structured_outputs import StructuredOutputsConfig
+from .utils import SupportsHash, config
+
+if TYPE_CHECKING:
+    from transformers import PretrainedConfig
+
+    from vllm.model_executor.layers.quantization.base_config import (
+        QuantizationConfig)
+else:
+    PretrainedConfig = Any
+
+    QuantizationConfig = Any
+
+logger = init_logger(__name__)
+
+
+@config
+@dataclass(config=ConfigDict(arbitrary_types_allowed=True))
+class VllmConfig:
+    """Dataclass which contains all vllm-related configuration. This
+    simplifies passing around the distinct configurations in the codebase.
+    """
+
+    # TODO: use default_factory once default constructing ModelConfig doesn't
+    # try to download a model
+    model_config: ModelConfig = None  # type: ignore
+    """Model configuration."""
+    cache_config: CacheConfig = field(default_factory=CacheConfig)
+    """Cache configuration."""
+    parallel_config: ParallelConfig = field(default_factory=ParallelConfig)
+    """Parallel configuration."""
+    scheduler_config: SchedulerConfig = field(default_factory=SchedulerConfig)
+    """Scheduler configuration."""
+    device_config: DeviceConfig = field(default_factory=DeviceConfig)
+    """Device configuration."""
+    load_config: LoadConfig = field(default_factory=LoadConfig)
+    """Load configuration."""
+    lora_config: Optional[LoRAConfig] = None
+    """LoRA configuration."""
+    speculative_config: Optional[SpeculativeConfig] = None
+    """Speculative decoding configuration."""
+    structured_outputs_config: StructuredOutputsConfig = field(
+        default_factory=StructuredOutputsConfig)
+    """Structured outputs configuration."""
+    observability_config: Optional[ObservabilityConfig] = None
+    """Observability configuration."""
+    quant_config: Optional[QuantizationConfig] = None
+    """Quantization configuration."""
+    compilation_config: CompilationConfig = field(
+        default_factory=CompilationConfig)
+    """`torch.compile` and cudagraph capture configuration for the model.
+
+    As a shorthand, `-O<n>` can be used to directly specify the compilation
+    level `n`: `-O3` is equivalent to `-O.level=3` (same as `-O='{"level":3}'`).
+    Currently, -O <n> and -O=<n> are supported as well but this will likely be
+    removed in favor of clearer -O<n> syntax in the future.
+
+    NOTE: level 0 is the default level without any optimization. level 1 and 2
+    are for internal testing only. level 3 is the recommended level for
+    production, also default in V1.
+
+    You can specify the full compilation config like so:
+    `{"level": 3, "cudagraph_capture_sizes": [1, 2, 4, 8]}`
+    """
+    kv_transfer_config: Optional[KVTransferConfig] = None
+    """The configurations for distributed KV cache transfer."""
+    kv_events_config: Optional[KVEventsConfig] = None
+    """The configurations for event publishing."""
+    # some opaque config, only used to provide additional information
+    # for the hash computation, mainly used for testing, debugging or out of
+    # tree config registration.
+    additional_config: Union[dict, SupportsHash] = field(default_factory=dict)
+    """Additional config for specified platform. Different platforms may
+    support different configs. Make sure the configs are valid for the platform
+    you are using. Contents must be hashable."""
+    instance_id: str = ""
+    """The ID of the vLLM instance."""
+
+    def compute_hash(self) -> str:
+        """
+        WARNING: Whenever a new field is added to this config,
+        ensure that it is included in the factors list if
+        it affects the computation graph.
+
+        Provide a hash that uniquely identifies all the configs
+        that affect the structure of the computation
+        graph from input ids/embeddings to the final hidden states,
+        excluding anything before input ids/embeddings and after
+        the final hidden states.
+        """
+        factors: list[Any] = []
+
+        # summarize vllm config
+        vllm_factors: list[Any] = []
+        from vllm import __version__
+        vllm_factors.append(__version__)
+        vllm_factors.append(envs.VLLM_USE_V1)
+        if self.model_config:
+            vllm_factors.append(self.model_config.compute_hash())
+        else:
+            vllm_factors.append("None")
+        if self.cache_config:
+            vllm_factors.append(self.cache_config.compute_hash())
+        else:
+            vllm_factors.append("None")
+        if self.parallel_config:
+            vllm_factors.append(self.parallel_config.compute_hash())
+        else:
+            vllm_factors.append("None")
+        if self.scheduler_config:
+            vllm_factors.append(self.scheduler_config.compute_hash())
+        else:
+            vllm_factors.append("None")
+        if self.device_config:
+            vllm_factors.append(self.device_config.compute_hash())
+        else:
+            vllm_factors.append("None")
+        if self.load_config:
+            vllm_factors.append(self.load_config.compute_hash())
+        else:
+            vllm_factors.append("None")
+        if self.lora_config:
+            vllm_factors.append(self.lora_config.compute_hash())
+            # LoRA creates static buffers based on max_num_batched_tokens.
+            # The tensor sizes and strides get captured in the torch.compile
+            # graph explicitly.
+            vllm_factors.append(
+                str(self.scheduler_config.max_num_batched_tokens))
+        else:
+            vllm_factors.append("None")
+        if self.speculative_config:
+            vllm_factors.append(self.speculative_config.compute_hash())
+        else:
+            vllm_factors.append("None")
+        if self.structured_outputs_config:
+            vllm_factors.append(self.structured_outputs_config.compute_hash())
+        else:
+            vllm_factors.append("None")
+        if self.observability_config:
+            vllm_factors.append(self.observability_config.compute_hash())
+        else:
+            vllm_factors.append("None")
+        if self.quant_config:
+            pass  # should be captured by model_config.quantization
+        if self.compilation_config:
+            vllm_factors.append(self.compilation_config.compute_hash())
+        else:
+            vllm_factors.append("None")
+        if self.kv_transfer_config:
+            vllm_factors.append(self.kv_transfer_config.compute_hash())
+        else:
+            vllm_factors.append("None")
+        if self.additional_config:
+            if isinstance(additional_config := self.additional_config, dict):
+                additional_config_hash = hashlib.md5(
+                    json.dumps(additional_config, sort_keys=True).encode(),
+                    usedforsecurity=False,
+                ).hexdigest()
+            else:
+                additional_config_hash = additional_config.compute_hash()
+            vllm_factors.append(additional_config_hash)
+        else:
+            vllm_factors.append("None")
+        factors.append(vllm_factors)
+
+        hash_str = hashlib.md5(str(factors).encode(),
+                               usedforsecurity=False).hexdigest()[:10]
+        return hash_str
+
+    def pad_for_cudagraph(self, batch_size: int) -> int:
+        # if batch_size > self.compilation_config.max_capture_size,
+        # it should raise an IndexError.
+        # the caller should make sure the batch_size is within the range,
+        # i.e., batch_size <= self.compilation_config.max_capture_size
+        return self.compilation_config.bs_to_padded_graph_size[batch_size]
+
+    @staticmethod
+    def _get_quantization_config(
+            model_config: ModelConfig,
+            load_config: LoadConfig) -> Optional[QuantizationConfig]:
+        """Get the quantization config."""
+        from vllm.platforms import current_platform
+        if model_config.quantization is not None:
+            from vllm.model_executor.model_loader.weight_utils import (
+                get_quant_config)
+            quant_config = get_quant_config(model_config, load_config)
+            capability_tuple = current_platform.get_device_capability()
+
+            if capability_tuple is not None:
+                capability = capability_tuple.to_int()
+                if capability < quant_config.get_min_capability():
+                    raise ValueError(
+                        f"The quantization method {model_config.quantization} "
+                        "is not supported for the current GPU. Minimum "
+                        f"capability: {quant_config.get_min_capability()}. "
+                        f"Current capability: {capability}.")
+            supported_dtypes = quant_config.get_supported_act_dtypes()
+            if model_config.dtype not in supported_dtypes:
+                raise ValueError(
+                    f"{model_config.dtype} is not supported for quantization "
+                    f"method {model_config.quantization}. Supported dtypes: "
+                    f"{supported_dtypes}")
+            quant_config.maybe_update_config(model_config.model)
+            return quant_config
+        return None
+
+    @staticmethod
+    def get_quantization_config(
+            model_config: ModelConfig,
+            load_config: LoadConfig) -> Optional[QuantizationConfig]:
+        import copy
+
+        # For some reason, the _ version of this modifies the model_config
+        # object, so using deepcopy to avoid this problem.
+        return VllmConfig._get_quantization_config(copy.deepcopy(model_config),
+                                                   load_config)
+
+    def with_hf_config(
+        self,
+        hf_config: PretrainedConfig,
+        architectures: Optional[list[str]] = None,
+    ) -> "VllmConfig":
+        if architectures is not None:
+            hf_config = copy.deepcopy(hf_config)
+            hf_config.architectures = architectures
+
+        model_config = copy.deepcopy(self.model_config)
+        model_config.hf_config = hf_config
+
+        return replace(self, model_config=model_config)
+
+    def __post_init__(self):
+        """Verify configs are valid & consistent with each other.
+        """
+
+        self.try_verify_and_update_config()
+
+        if self.model_config is not None:
+            self.model_config.verify_with_parallel_config(self.parallel_config)
+            self.model_config.verify_dual_chunk_attention_config(
+                self.load_config)
+
+        self.cache_config.verify_with_parallel_config(self.parallel_config)
+
+        if self.lora_config is not None:
+            self.lora_config.verify_with_cache_config(self.cache_config)
+            self.lora_config.verify_with_model_config(self.model_config)
+
+        if self.quant_config is None and self.model_config is not None:
+            self.quant_config = VllmConfig._get_quantization_config(
+                self.model_config, self.load_config)
+
+        from vllm.platforms import current_platform
+        if self.model_config is not None and \
+            self.scheduler_config.chunked_prefill_enabled and \
+            self.model_config.dtype == torch.float32 and \
+            current_platform.get_device_capability() == (7, 5):
+            logger.warning_once(
+                "Turing devices tensor cores do not support float32 matmul. "
+                "To workaround this limitation, vLLM will set 'ieee' input "
+                "precision for chunked prefill triton kernels.")
+
+        # If the user does not explicitly set a compilation level, then
+        # we use the default level. The default level depends on other
+        # settings (see the below code).
+        if self.compilation_config.level is None:
+            if envs.VLLM_USE_V1:
+                if (self.model_config is not None
+                        and not self.model_config.enforce_eager):
+                    self.compilation_config.level = CompilationLevel.PIECEWISE
+                else:
+                    self.compilation_config.level = \
+                            CompilationLevel.NO_COMPILATION
+
+            else:
+                # NB: Passing both --enforce-eager and a compilation level
+                # in V0 means the compilation level wins out.
+                self.compilation_config.level = CompilationLevel.NO_COMPILATION
+
+        # async tp is built on top of sequence parallelism
+        # and requires it to be enabled.
+        if self.compilation_config.pass_config.enable_async_tp:
+            self.compilation_config.pass_config.enable_sequence_parallelism = \
+                True
+        if self.compilation_config.pass_config.enable_sequence_parallelism:
+            self.compilation_config.custom_ops.append("+rms_norm")
+
+        if current_platform.support_static_graph_mode():
+            # if cudagraph_mode is not explicitly set by users, set default
+            # value
+            if self.compilation_config.cudagraph_mode is None:
+                if envs.VLLM_USE_V1 and self.compilation_config.level \
+                    == CompilationLevel.PIECEWISE:
+                    # default to full and piecewise for most models
+                    self.compilation_config.cudagraph_mode = \
+                        CUDAGraphMode.FULL_AND_PIECEWISE
+
+                    # pooling models and encoder-decoder models
+                    # do not support full cudagraphs
+                    if self.model_config is not None and \
+                        (self.model_config.pooler_config is not None
+                         or self.model_config.is_encoder_decoder):
+                        self.compilation_config.cudagraph_mode = \
+                            CUDAGraphMode.PIECEWISE
+                else:
+                    self.compilation_config.cudagraph_mode = CUDAGraphMode.NONE
+
+            # disable cudagraph when enforce eager execution
+            if self.model_config is not None and \
+                    self.model_config.enforce_eager:
+                logger.info("Cudagraph is disabled under eager mode")
+                self.compilation_config.cudagraph_mode = CUDAGraphMode.NONE
+            elif envs.VLLM_USE_V1:
+                self.compilation_config.cudagraph_num_of_warmups = 1
+
+            self._set_cudagraph_sizes()
+        else:
+            self.compilation_config.cudagraph_mode = CUDAGraphMode.NONE
+
+        if self.cache_config.kv_sharing_fast_prefill:
+
+            if self.speculative_config is not None and \
+                self.speculative_config.use_eagle():
+                raise NotImplementedError(
+                    "Fast prefill optimization for KV sharing is not "
+                    "compatible with EAGLE as EAGLE requires correct logits "
+                    "for all tokens while fast prefill gives incorrect logits "
+                    "for prompt tokens.")
+
+            logger.warning_once(
+                "--kv-sharing-fast-prefill requires changes on model side for "
+                "correctness and to realize prefill savings. ")
+
+        disable_chunked_prefill_reasons: list[str] = []
+
+        if self.model_config:
+            if self.model_config.pooler_config:
+                pooling_type = self.model_config.pooler_config.pooling_type
+                if pooling_type is None or pooling_type.lower() != "last":
+                    disable_chunked_prefill_reasons.append(
+                        "Only \"last\" pooling supports chunked "
+                        "prefill and prefix caching; disabling both.")
+                if not getattr(self.model_config.hf_config, "is_causal", True):
+                    disable_chunked_prefill_reasons.append(
+                        "Only models using causal attention supports chunked "
+                        "prefill and prefix caching; disabling both.")
+            elif self.model_config.is_encoder_decoder:
+                from vllm.multimodal import MULTIMODAL_REGISTRY
+                self.scheduler_config.max_num_encoder_input_tokens = \
+                    MULTIMODAL_REGISTRY.get_encdec_max_encoder_len(self.model_config)
+                logger.debug(
+                    "Encoder-decoder model detected: setting "
+                    "`max_num_encoder_input_tokens` to encoder length (%s)",
+                    self.scheduler_config.max_num_encoder_input_tokens)
+                self.scheduler_config.disable_chunked_mm_input = True
+                disable_chunked_prefill_reasons.append(
+                    "Encoder-decoder models do not support chunked prefill nor"
+                    " prefix caching; disabling both.")
+                if (self.model_config.architecture
+                        == "WhisperForConditionalGeneration"
+                        and os.environ.get("VLLM_WORKER_MULTIPROC_METHOD")
+                        != "spawn"):
+                    logger.warning(
+                        "Whisper is known to have issues with "
+                        "forked workers. If startup is hanging, "
+                        "try setting 'VLLM_WORKER_MULTIPROC_METHOD' "
+                        "to 'spawn'.")
+
+        if disable_chunked_prefill_reasons:
+            for reason in disable_chunked_prefill_reasons:
+                logger.info(reason)
+            self.scheduler_config.chunked_prefill_enabled = False
+            self.scheduler_config.long_prefill_token_threshold = 0
+
+            if self.cache_config is not None:
+                self.cache_config.enable_prefix_caching = False
+
+        if (self.kv_events_config is not None
+                and self.kv_events_config.enable_kv_cache_events
+                and not self.cache_config.enable_prefix_caching):
+            logger.warning(
+                "KV cache events are on, but prefix caching is not enabled."
+                "Use --enable-prefix-caching to enable.")
+        if (self.kv_events_config is not None
+                and self.kv_events_config.publisher != "null"
+                and not self.kv_events_config.enable_kv_cache_events):
+            logger.warning("KV cache events are disabled,"
+                           "but the scheduler is configured to publish them."
+                           "Modify KVEventsConfig.enable_kv_cache_events"
+                           "to True to enable.")
+        current_platform.check_and_update_config(self)
+
+        # Do this after all the updates to compilation_config.level
+        if envs.VLLM_USE_V1 and \
+            self.compilation_config.level == CompilationLevel.PIECEWISE:
+            self.compilation_config.set_splitting_ops_for_v1()
+
+        # final check of cudagraph mode after all possible updates
+        if envs.VLLM_USE_V1 and current_platform.is_cuda_alike():
+            if self.compilation_config.cudagraph_mode.has_full_cudagraphs()\
+                and self.model_config is not None and \
+                not self.model_config.disable_cascade_attn and\
+                not self.compilation_config.cudagraph_mode.\
+                has_piecewise_cudagraphs():
+                logger.warning_once(
+                    "No piecewise cudagraph for executing cascade attention."
+                    " Will fall back to eager execution if a batch runs "
+                    "into cascade attentions")
+
+            if self.compilation_config.cudagraph_mode\
+                .requires_piecewise_compilation():
+                assert self.compilation_config.level == \
+                    CompilationLevel.PIECEWISE, \
+                    "Compilation level should be CompilationLevel.PIECEWISE "\
+                    "when cudagraph_mode piecewise cudagraphs is used, "\
+                    f"cudagraph_mode={self.compilation_config.cudagraph_mode}"
+
+            # final migrate the deprecated flags
+            self.compilation_config.use_cudagraph = self.compilation_config.\
+                cudagraph_mode!= CUDAGraphMode.NONE
+            self.compilation_config.full_cuda_graph = self.compilation_config.\
+                cudagraph_mode.has_full_cudagraphs()
+
+        if self.parallel_config.enable_dbo:
+            a2a_backend = envs.VLLM_ALL2ALL_BACKEND
+            assert a2a_backend in \
+                ["deepep_low_latency", "deepep_high_throughput"], \
+            "Microbatching currently only supports the deepep_low_latency and "\
+            f"deepep_high_throughput all2all backend. {a2a_backend} is not "\
+            "supported. To fix set the VLLM_ALL2ALL_BACKEND environment "\
+            "variable to deepep_low_latency or deepep_high_throughput and "\
+            "install the DeepEP kernels."
+
+            if not self.model_config.disable_cascade_attn:
+                self.model_config.disable_cascade_attn = True
+                logger.warning_once(
+                    "Disabling cascade attention when DBO is enabled.")
+
+        if not self.instance_id:
+            self.instance_id = random_uuid()[:5]
+
+        if (envs.VLLM_USE_V1
+                and not self.scheduler_config.disable_hybrid_kv_cache_manager):
+            # logger should only print warning message for hybrid models. As we
+            # can't know whether the model is hybrid or not now, so we don't log
+            # warning message here and will log it later.
+            if not current_platform.support_hybrid_kv_cache():
+                # Hybrid KV cache manager is not supported on non-GPU platforms.
+                self.scheduler_config.disable_hybrid_kv_cache_manager = True
+            if self.kv_transfer_config is not None:
+                # Hybrid KV cache manager is not compatible with KV transfer.
+                self.scheduler_config.disable_hybrid_kv_cache_manager = True
+            if self.kv_events_config is not None:
+                # Hybrid KV cache manager is not compatible with KV events.
+                self.scheduler_config.disable_hybrid_kv_cache_manager = True
+            if self.model_config is not None and \
+                self.model_config.attention_chunk_size is not None:
+                if self.speculative_config is not None and \
+                    self.speculative_config.use_eagle():
+                    # Hybrid KV cache manager is not yet supported with chunked
+                    # local attention + eagle.
+                    self.scheduler_config.disable_hybrid_kv_cache_manager = True
+                elif \
+                    not envs.VLLM_ALLOW_CHUNKED_LOCAL_ATTN_WITH_HYBRID_KV_CACHE:
+                    logger.warning(
+                        "There is a latency regression when using chunked local"
+                        " attention with the hybrid KV cache manager. Disabling"
+                        " it, by default. To enable it, set the environment "
+                        "VLLM_ALLOW_CHUNKED_LOCAL_ATTN_WITH_HYBRID_KV_CACHE=1."
+                    )
+                    # Hybrid KV cache manager is not yet supported with chunked
+                    # local attention.
+                    self.scheduler_config.disable_hybrid_kv_cache_manager = True
+
+        if self.compilation_config.debug_dump_path:
+            self.compilation_config.debug_dump_path = \
+                self.compilation_config.debug_dump_path.absolute().expanduser()
+        if envs.VLLM_DEBUG_DUMP_PATH is not None:
+            env_path = Path(envs.VLLM_DEBUG_DUMP_PATH).absolute().expanduser()
+            if self.compilation_config.debug_dump_path:
+                logger.warning(
+                    "Config-specified debug dump path is overridden"
+                    " by VLLM_DEBUG_DUMP_PATH to %s", env_path)
+            self.compilation_config.debug_dump_path = env_path
+
+    def update_sizes_for_sequence_parallelism(self,
+                                              possible_sizes: list) -> list:
+        # remove the sizes that not multiple of tp_size when
+        # enable sequence parallelism
+        removed_sizes = [
+            size for size in possible_sizes
+            if size % self.parallel_config.tensor_parallel_size != 0
+        ]
+        if removed_sizes:
+            logger.warning(
+                "Batch sizes %s are removed because they are not "
+                "multiple of tp_size %d when "
+                "sequence parallelism is enabled", removed_sizes,
+                self.parallel_config.tensor_parallel_size)
+
+        return [
+            size for size in possible_sizes
+            if size % self.parallel_config.tensor_parallel_size == 0
+        ]
+
+    def _set_cudagraph_sizes(self):
+        """
+        vLLM defines the default candidate list of batch sizes for CUDA graph
+        capture as:
+
+        ```python
+        max_graph_size = min(max_num_seqs * 2, 512)
+        # 1, 2, 4, then multiples of 8 up to max_graph_size
+        cuda_graph_sizes = [1, 2, 4, 8, 16, 24, 32, 40, ..., max_graph_size]
+
+        In the end, `vllm_config.compilation_config.cudagraph_capture_sizes`
+        will be the final sizes to capture cudagraph (in descending order).
+
+        These sizes are used to capture and reuse CUDA graphs for
+        performance-critical paths (e.g., decoding). Capturing enables
+        significantly faster kernel dispatch by avoiding Python overhead. The
+        list is then filtered based on `max_num_batched_tokens` (e.g., 8192 on
+        most GPUs), which controls the total allowed number of tokens in a
+        batch. Since each sequence may have a variable number of tokens, the
+        maximum usable batch size will depend on actual sequence lengths.
+
+        Example:
+            With `max_num_batched_tokens = 8192`, and typical sequences
+            averaging ~32 tokens, most practical batch sizes fall below 256.
+            However, the system will still allow capture sizes up to 512 if
+            shape and memory permit.
+
+        Note:
+            If users explicitly specify cudagraph capture sizes in the
+            compilation config, those will override this default logic.
+            At runtime:
+
+            - If batch size <= one of the `cudagraph_capture_sizes`, the closest
+            padded CUDA graph will be used.
+            - If batch size > largest `cudagraph_capture_sizes`, cudagraph will
+            not be used.
+        """
+
+        # calculate the default `batch_size_capture_list`
+        batch_size_capture_list = []
+        if self.model_config is not None and \
+            not self.model_config.enforce_eager:
+            cuda_graph_sizes = self.scheduler_config.cuda_graph_sizes
+            if len(cuda_graph_sizes) == 1:
+                batch_size_capture_list = [1, 2, 4] + [
+                    i for i in range(8, cuda_graph_sizes[0] + 1, 8)
+                ]
+            elif len(cuda_graph_sizes) > 1:
+                batch_size_capture_list = sorted(cuda_graph_sizes)
+            else:
+                raise TypeError(f"Invalid value for {cuda_graph_sizes=}.")
+            if self.parallel_config.tensor_parallel_size > 1 and \
+                self.compilation_config.pass_config.enable_sequence_parallelism:
+                batch_size_capture_list = \
+                    self.update_sizes_for_sequence_parallelism(batch_size_capture_list)
+            max_num_tokens = self.scheduler_config.max_num_batched_tokens
+            batch_size_capture_list = [
+                size for size in batch_size_capture_list
+                if size <= max_num_tokens
+            ]
+
+        self.compilation_config.init_with_cudagraph_sizes(
+            batch_size_capture_list)
+
+    def recalculate_max_model_len(self, max_model_len: int):
+        # Can only be called in try_verify_and_update_config
+        model_config = self.model_config
+        max_model_len = model_config.get_and_verify_max_len(max_model_len)
+        self.model_config.max_model_len = max_model_len
+        self.scheduler_config.max_model_len = max_model_len
+
+    def try_verify_and_update_config(self):
+        if self.model_config is None:
+            return
+
+        # Avoid running try_verify_and_update_config multiple times
+        if getattr(self.model_config, "config_updated", False):
+            return
+        self.model_config.config_updated = True
+
+        architecture = self.model_config.architecture
+        if architecture is None:
+            return
+
+        from vllm.model_executor.models.config import (
+            MODELS_CONFIG_MAP, HybridAttentionMambaModelConfig)
+        cls = MODELS_CONFIG_MAP.get(architecture, None)
+        if cls is not None:
+            cls.verify_and_update_config(self)
+
+        if self.model_config.is_hybrid:
+            HybridAttentionMambaModelConfig.verify_and_update_config(self)
+
+        if self.model_config.convert_type == "classify":
+            # Maybe convert ForCausalLM into ForSequenceClassification model.
+            from vllm.model_executor.models.adapters import (
+                SequenceClassificationConfig)
+            SequenceClassificationConfig.verify_and_update_config(self)
+
+        if hasattr(self.model_config, "model_weights") and is_runai_obj_uri(
+                self.model_config.model_weights):
+            if self.load_config.load_format == "auto":
+                logger.info("Detected Run:ai model config. "
+                            "Overriding `load_format` to 'runai_streamer'")
+                self.load_config.load_format = "runai_streamer"
+            elif self.load_config.load_format != "runai_streamer":
+                raise ValueError(f"To load a model from S3, 'load_format' "
+                                 f"must be 'runai_streamer', "
+                                 f"but got '{self.load_config.load_format}'. "
+                                 f"Model: {self.model_config.model}")
+
+    def compile_debug_dump_path(self) -> Optional[Path]:
+        """Returns a rank-aware path for dumping 
+        torch.compile debug information.
+        """
+        if self.compilation_config.debug_dump_path is None:
+            return None
+        tp_rank = self.parallel_config.rank
+        dp_rank = self.parallel_config.data_parallel_rank
+        data_parallel_size = self.parallel_config.data_parallel_size
+        append_path = f"rank_{tp_rank}" if data_parallel_size == 1 \
+            else f"rank_{tp_rank}_dp_{dp_rank}"
+        path = self.compilation_config.debug_dump_path / append_path
+        return path
+
+    def __str__(self):
+        return (
+            f"model={self.model_config.model!r}, "
+            f"speculative_config={self.speculative_config!r}, "
+            f"tokenizer={self.model_config.tokenizer!r}, "
+            f"skip_tokenizer_init={self.model_config.skip_tokenizer_init}, "
+            f"tokenizer_mode={self.model_config.tokenizer_mode}, "
+            f"revision={self.model_config.revision}, "
+            f"tokenizer_revision={self.model_config.tokenizer_revision}, "
+            f"trust_remote_code={self.model_config.trust_remote_code}, "
+            f"dtype={self.model_config.dtype}, "
+            f"max_seq_len={self.model_config.max_model_len}, "
+            f"download_dir={self.load_config.download_dir!r}, "
+            f"load_format={self.load_config.load_format}, "
+            f"tensor_parallel_size={self.parallel_config.tensor_parallel_size}, "  # noqa
+            f"pipeline_parallel_size={self.parallel_config.pipeline_parallel_size}, "  # noqa
+            f"data_parallel_size={self.parallel_config.data_parallel_size}, "  # noqa
+            f"disable_custom_all_reduce={self.parallel_config.disable_custom_all_reduce}, "  # noqa
+            f"quantization={self.model_config.quantization}, "
+            f"enforce_eager={self.model_config.enforce_eager}, "
+            f"kv_cache_dtype={self.cache_config.cache_dtype}, "
+            f"device_config={self.device_config.device}, "
+            f"structured_outputs_config={self.structured_outputs_config!r}, "
+            f"observability_config={self.observability_config!r}, "
+            f"seed={self.model_config.seed}, "
+            f"served_model_name={self.model_config.served_model_name}, "
+            f"enable_prefix_caching={self.cache_config.enable_prefix_caching}, "
+            f"chunked_prefill_enabled={self.scheduler_config.chunked_prefill_enabled}, "  # noqa
+            f"pooler_config={self.model_config.pooler_config!r}, "
+            f"compilation_config={self.compilation_config!r}")
+
+
+_current_vllm_config: Optional[VllmConfig] = None
+_current_prefix: Optional[str] = None
+
+
+@contextmanager
+def set_current_vllm_config(vllm_config: VllmConfig,
+                            check_compile=False,
+                            prefix: Optional[str] = None):
+    """
+    Temporarily set the current vLLM config.
+    Used during model initialization.
+    We save the current vLLM config in a global variable,
+    so that all modules can access it, e.g. custom ops
+    can access the vLLM config to determine how to dispatch.
+    """
+    global _current_vllm_config, _current_prefix
+    old_vllm_config = _current_vllm_config
+    old_prefix = _current_prefix
+    from vllm.compilation.counter import compilation_counter
+    num_models_seen = compilation_counter.num_models_seen
+    try:
+        _current_vllm_config = vllm_config
+        _current_prefix = prefix
+        yield
+    except Exception:
+        raise
+    else:
+        if check_compile:
+            vllm_config.compilation_config.custom_op_log_check()
+
+        if check_compile and \
+            vllm_config.compilation_config.level == CompilationLevel.PIECEWISE \
+            and compilation_counter.num_models_seen == num_models_seen:
+            # If the model supports compilation,
+            # compilation_counter.num_models_seen should be increased
+            # by at least 1.
+            # If it is not increased, it means the model does not support
+            # compilation (does not have @support_torch_compile decorator).
+            logger.warning(
+                "`torch.compile` is turned on, but the model %s"
+                " does not support it. Please open an issue on GitHub"
+                " if you want it to be supported.",
+                vllm_config.model_config.model)
+    finally:
+        _current_vllm_config = old_vllm_config
+        _current_prefix = old_prefix
+        # Clear the compilation config cache when context changes
+        get_cached_compilation_config.cache_clear()
+
+
+@lru_cache(maxsize=1)
+def get_cached_compilation_config():
+    """Cache config to avoid repeated calls to get_current_vllm_config()"""
+    return get_current_vllm_config().compilation_config
+
+
+def get_current_vllm_config() -> VllmConfig:
+    if _current_vllm_config is None:
+        # in ci, usually when we test custom ops/modules directly,
+        # we don't set the vllm config. In that case, we set a default
+        # config.
+        logger.warning("Current vLLM config is not set.")
+        return VllmConfig()
+    return _current_vllm_config
+
+
+T = TypeVar("T")
+
+
+def get_layers_from_vllm_config(
+        vllm_config: VllmConfig,
+        layer_type: type[T],
+        layer_names: Optional[list[str]] = None) -> dict[str, T]:
+    """
+    Get layers from the vLLM config.
+
+    Args:
+        vllm_config: The vLLM config.
+        layer_type: The type of the layer to get.
+        layer_names: The names of the layers to get. If None, return all layers.
+    """
+
+    if layer_names is None:
+        layer_names = list(
+            vllm_config.compilation_config.static_forward_context.keys())
+
+    forward_context = vllm_config.compilation_config.static_forward_context
+
+    return {
+        layer_name: forward_context[layer_name]
+        for layer_name in layer_names
+        if isinstance(forward_context[layer_name], layer_type)
+    }
diff --git a/vllm/model_executor/layers/mamba/linear_attn.py b/vllm/model_executor/layers/mamba/linear_attn.py
index 410cbef4f6bc..319133777992 100644
--- a/vllm/model_executor/layers/mamba/linear_attn.py
+++ b/vllm/model_executor/layers/mamba/linear_attn.py
@@ -29,8 +29,7 @@
 from vllm.model_executor.layers.mamba.abstract import MambaBase
 from vllm.model_executor.layers.mamba.mamba_utils import (
     MambaStateDtypeCalculator, MambaStateShapeCalculator)
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.utils import direct_register_custom_op
 from vllm.v1.attention.backends.linear_attn import LinearAttentionMetadata
 
diff --git a/vllm/model_executor/layers/quantization/auto_round.py b/vllm/model_executor/layers/quantization/auto_round.py
index bf5141fa4894..eb7600af3371 100644
--- a/vllm/model_executor/layers/quantization/auto_round.py
+++ b/vllm/model_executor/layers/quantization/auto_round.py
@@ -9,9 +9,8 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.linear import (LinearBase,
                                                UnquantizedLinearMethod)
-from vllm.model_executor.layers.quantization import QuantizationMethods
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import (QuantizationConfig,
+                                                     QuantizationMethods)
 from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
 from vllm.platforms import current_platform
 from vllm.scalar_type import scalar_types
diff --git a/vllm/model_executor/layers/quantization/bitblas.py b/vllm/model_executor/layers/quantization/bitblas.py
index d05c0c0d5473..81e51f4a4358 100644
--- a/vllm/model_executor/layers/quantization/bitblas.py
+++ b/vllm/model_executor/layers/quantization/bitblas.py
@@ -7,9 +7,8 @@
 
 from vllm.logger import init_logger
 from vllm.model_executor.layers.linear import LinearBase, LinearMethodBase
-from vllm.model_executor.layers.quantization import QuantizationMethods
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import (QuantizationConfig,
+                                                     QuantizationMethods)
 from vllm.model_executor.layers.quantization.utils.bitblas_utils import (
     BITBLAS_OPTIMIZE_FEATURES, BITBLAS_SUPPORTED_NUM_BITS,
     BITBLAS_SUPPORTED_SYM, MINIMUM_BITBLAS_VERSION)
diff --git a/vllm/model_executor/layers/quantization/bitsandbytes.py b/vllm/model_executor/layers/quantization/bitsandbytes.py
index 29584188630f..7b7011cb06d3 100644
--- a/vllm/model_executor/layers/quantization/bitsandbytes.py
+++ b/vllm/model_executor/layers/quantization/bitsandbytes.py
@@ -13,9 +13,8 @@
 from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
                                                UnquantizedLinearMethod,
                                                set_weight_attrs)
-from vllm.model_executor.layers.quantization import QuantizationMethods
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import (QuantizationConfig,
+                                                     QuantizationMethods)
 from vllm.platforms import current_platform
 from vllm.utils import direct_register_custom_op
 
diff --git a/vllm/model_executor/layers/quantization/deepspeedfp.py b/vllm/model_executor/layers/quantization/deepspeedfp.py
index 2922aef32939..4a189ab4a171 100644
--- a/vllm/model_executor/layers/quantization/deepspeedfp.py
+++ b/vllm/model_executor/layers/quantization/deepspeedfp.py
@@ -9,9 +9,8 @@
 from packaging import version
 
 from vllm.model_executor.layers.linear import LinearBase, LinearMethodBase
-from vllm.model_executor.layers.quantization import QuantizationMethods
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import (QuantizationConfig,
+                                                     QuantizationMethods)
 from vllm.model_executor.utils import set_weight_attrs
 
 
diff --git a/vllm/model_executor/layers/quantization/gptq.py b/vllm/model_executor/layers/quantization/gptq.py
index 0335b9c46b4d..842ce92333c9 100644
--- a/vllm/model_executor/layers/quantization/gptq.py
+++ b/vllm/model_executor/layers/quantization/gptq.py
@@ -4,7 +4,7 @@
 import enum
 from enum import Enum
 from fractions import Fraction
-from typing import Any, Optional, Union
+from typing import TYPE_CHECKING, Any, Optional, Union
 
 import torch
 from safetensors.torch import _TYPES as _SAFETENSORS_TO_TORCH_DTYPE
@@ -13,7 +13,6 @@
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.fused_moe.layer import FusedMoE
 from vllm.model_executor.layers.linear import LinearMethodBase
-from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (
     QuantizationConfig, QuantizeMethodBase)
 from vllm.model_executor.layers.quantization.utils.gptq_utils import (
@@ -26,6 +25,11 @@
 from vllm.transformers_utils.config import get_safetensors_params_metadata
 from vllm.utils import is_list_of
 
+if TYPE_CHECKING:
+    from vllm.model_executor.layers.quantization import QuantizationMethods
+else:
+    QuantizationMethods = str
+
 
 class GPTQConfig(QuantizationConfig):
     """Config class for GPTQ.
diff --git a/vllm/model_executor/layers/quantization/gptq_bitblas.py b/vllm/model_executor/layers/quantization/gptq_bitblas.py
index 646229258648..c193dd85e32f 100644
--- a/vllm/model_executor/layers/quantization/gptq_bitblas.py
+++ b/vllm/model_executor/layers/quantization/gptq_bitblas.py
@@ -9,9 +9,8 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
                                                set_weight_attrs)
-from vllm.model_executor.layers.quantization import QuantizationMethods
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import (QuantizationConfig,
+                                                     QuantizationMethods)
 from vllm.model_executor.layers.quantization.kernels.mixed_precision import (
     BitBLASLinearKernel, MPLinearLayerConfig)
 from vllm.model_executor.layers.quantization.utils.bitblas_utils import (
diff --git a/vllm/model_executor/layers/quantization/gptq_marlin.py b/vllm/model_executor/layers/quantization/gptq_marlin.py
index 967e46c24378..253675e25f34 100644
--- a/vllm/model_executor/layers/quantization/gptq_marlin.py
+++ b/vllm/model_executor/layers/quantization/gptq_marlin.py
@@ -43,7 +43,7 @@
 
 
 def get_moe_quant_method(
-    config: QuantizationConfig,
+    config: "GPTQMarlinConfig",
     layer: torch.nn.Module,
     prefix: str,
     moe_method_cls: type,
diff --git a/vllm/model_executor/layers/quantization/gptq_marlin_24.py b/vllm/model_executor/layers/quantization/gptq_marlin_24.py
index eba917d85411..6b9e3effc29d 100644
--- a/vllm/model_executor/layers/quantization/gptq_marlin_24.py
+++ b/vllm/model_executor/layers/quantization/gptq_marlin_24.py
@@ -9,9 +9,8 @@
 from vllm import _custom_ops as ops
 from vllm.logger import init_logger
 from vllm.model_executor.layers.linear import LinearBase, LinearMethodBase
-from vllm.model_executor.layers.quantization import QuantizationMethods
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import (QuantizationConfig,
+                                                     QuantizationMethods)
 from vllm.model_executor.parameter import (BasevLLMParameter,
                                            ChannelQuantScaleParameter,
                                            GroupQuantScaleParameter,
diff --git a/vllm/model_executor/layers/quantization/ipex_quant.py b/vllm/model_executor/layers/quantization/ipex_quant.py
index c83b0b47a4b7..353942cdd591 100644
--- a/vllm/model_executor/layers/quantization/ipex_quant.py
+++ b/vllm/model_executor/layers/quantization/ipex_quant.py
@@ -14,11 +14,10 @@
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
                                                UnquantizedLinearMethod)
-from vllm.model_executor.layers.quantization import QuantizationMethods
+from vllm.model_executor.layers.quantization import (QuantizationConfig,
+                                                     QuantizationMethods)
 from vllm.model_executor.layers.quantization.awq import (AWQLinearMethod,
                                                          is_layer_skipped_awq)
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
 from vllm.model_executor.layers.quantization.fp8 import (Fp8Config,
                                                          Fp8LinearMethod)
 from vllm.model_executor.layers.quantization.gptq import GPTQLinearMethod
diff --git a/vllm/model_executor/layers/quantization/kernels/mixed_precision/bitblas.py b/vllm/model_executor/layers/quantization/kernels/mixed_precision/bitblas.py
index 0eca3b4c024e..fe72910659e2 100644
--- a/vllm/model_executor/layers/quantization/kernels/mixed_precision/bitblas.py
+++ b/vllm/model_executor/layers/quantization/kernels/mixed_precision/bitblas.py
@@ -7,8 +7,7 @@
 from packaging import version
 
 from vllm.logger import init_logger
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.utils import replace_parameter
 from vllm.model_executor.layers.quantization.utils.bitblas_utils import (
     BITBLAS_OPTIMIZE_FEATURES, BITBLAS_SUPPORTED_GROUP_SIZES,
diff --git a/vllm/model_executor/layers/quantization/tpu_int8.py b/vllm/model_executor/layers/quantization/tpu_int8.py
index 38de4b54fb19..7f738d170db4 100644
--- a/vllm/model_executor/layers/quantization/tpu_int8.py
+++ b/vllm/model_executor/layers/quantization/tpu_int8.py
@@ -8,9 +8,8 @@
 from torch.nn.parameter import Parameter
 
 from vllm.model_executor.layers.linear import LinearBase, LinearMethodBase
-from vllm.model_executor.layers.quantization import QuantizationMethods
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import (QuantizationConfig,
+                                                     QuantizationMethods)
 from vllm.model_executor.parameter import ModelWeightParameter
 
 ACTIVATION_SCHEMES = ["none", "dynamic"]
diff --git a/vllm/model_executor/layers/quantization/utils/gptq_utils.py b/vllm/model_executor/layers/quantization/utils/gptq_utils.py
index 41b833725b30..fd76af230620 100644
--- a/vllm/model_executor/layers/quantization/utils/gptq_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/gptq_utils.py
@@ -4,21 +4,27 @@
 from copy import deepcopy
 from fractions import Fraction
 from types import MappingProxyType
-from typing import Optional, Union
+from typing import TYPE_CHECKING, Optional, Union
 
 import regex as re
 import torch
 
-from vllm.config import QuantizationConfig
 from vllm.model_executor.layers.linear import (LinearBase,
                                                UnquantizedLinearMethod)
 from vllm.model_executor.layers.vocab_parallel_embedding import (
     ParallelLMHead, UnquantizedEmbeddingMethod)
 
+if TYPE_CHECKING:
+    from ..gptq import GPTQConfig
+    from ..gptq_marlin import GPTQMarlinConfig
+else:
+    GPTQConfig = object
+    GPTQMarlinConfig = object
+
 
 # Match dynamic rules with module name (prefix) and override quantize
 # config if module (prefix) matches a rule
-def override_config(config: QuantizationConfig, prefix: str):
+def override_config(config: Union[GPTQConfig, GPTQMarlinConfig], prefix: str):
     weight_bits = get_dynamic_override(config, prefix, "bits",
                                        config.weight_bits)
     if isinstance(weight_bits, int):
@@ -34,6 +40,7 @@ def override_config(config: QuantizationConfig, prefix: str):
 
     config.pack_factor = Fraction(32, config.weight_bits)  # packed into int32
     if config.get_name() == "gptq_marlin":
+        assert isinstance(config, GPTQMarlinConfig)
         is_sym = get_dynamic_override(config, prefix, "sym", config.is_sym)
         if isinstance(is_sym, bool):
             config.is_sym = is_sym
@@ -45,6 +52,7 @@ def override_config(config: QuantizationConfig, prefix: str):
         config.quant_type = config.TYPE_MAP[(config.weight_bits,
                                              config.is_sym)]
     elif config.get_name() == "gptq":
+        assert isinstance(config, GPTQConfig)
         if config.weight_bits not in [2, 3, 4, 8]:
             raise ValueError(
                 "Currently, only 2/3/4/8-bit weight quantization is "
@@ -52,7 +60,7 @@ def override_config(config: QuantizationConfig, prefix: str):
 
 
 def get_dynamic_override(
-    config: QuantizationConfig,
+    config: Union[GPTQConfig, GPTQMarlinConfig],
     layer_name: str,
     key: Optional[str] = None,
     default_value: Union[int, bool,
@@ -116,7 +124,7 @@ def is_layer_gptq_quantized(
 
 
 def get_linear_quant_method(
-    config: QuantizationConfig,
+    config: Union[GPTQConfig, GPTQMarlinConfig],
     layer: torch.nn.Module,
     prefix: str,
     linear_method_cls: type,
diff --git a/vllm/model_executor/models/aimv2.py b/vllm/model_executor/models/aimv2.py
index b13d863ebb74..419f8a5ae2c7 100644
--- a/vllm/model_executor/models/aimv2.py
+++ b/vllm/model_executor/models/aimv2.py
@@ -17,8 +17,7 @@
 from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
                                                QKVParallelLinear,
                                                RowParallelLinear)
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.transformers_utils.configs.ovis import AIMv2Config
 
diff --git a/vllm/model_executor/models/aria.py b/vllm/model_executor/models/aria.py
index e0d7af0b1c3e..82f35d889605 100644
--- a/vllm/model_executor/models/aria.py
+++ b/vllm/model_executor/models/aria.py
@@ -9,13 +9,14 @@
 from transformers.models.aria.modeling_aria import AriaCrossAttention
 from transformers.models.aria.processing_aria import AriaProcessor
 
-from vllm.config import QuantizationConfig, VllmConfig
+from vllm.config import VllmConfig
 from vllm.distributed import get_tensor_model_parallel_rank
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
                                                RowParallelLinear)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
 from vllm.model_executor.model_loader.weight_utils import (
     default_weight_loader, maybe_remap_kv_scale_name)
diff --git a/vllm/model_executor/models/bailing_moe.py b/vllm/model_executor/models/bailing_moe.py
index 82cd4a26a1ba..6e470378cb60 100644
--- a/vllm/model_executor/models/bailing_moe.py
+++ b/vllm/model_executor/models/bailing_moe.py
@@ -45,8 +45,7 @@
                                                QKVParallelLinear,
                                                RowParallelLinear)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
     ParallelLMHead, VocabParallelEmbedding)
diff --git a/vllm/model_executor/models/granite.py b/vllm/model_executor/models/granite.py
index 2c619396e6c0..893cc8a41455 100644
--- a/vllm/model_executor/models/granite.py
+++ b/vllm/model_executor/models/granite.py
@@ -41,8 +41,7 @@
                                                QKVParallelLinear,
                                                RowParallelLinear)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
     DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
diff --git a/vllm/model_executor/models/granitemoe.py b/vllm/model_executor/models/granitemoe.py
index 76a5745a4f51..489c0bb3d3af 100644
--- a/vllm/model_executor/models/granitemoe.py
+++ b/vllm/model_executor/models/granitemoe.py
@@ -42,8 +42,7 @@
                                                ReplicatedLinear,
                                                RowParallelLinear)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
     DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
diff --git a/vllm/model_executor/models/granitemoeshared.py b/vllm/model_executor/models/granitemoeshared.py
index b434822bff0a..c864856db654 100644
--- a/vllm/model_executor/models/granitemoeshared.py
+++ b/vllm/model_executor/models/granitemoeshared.py
@@ -21,8 +21,7 @@
 from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
                                                RowParallelLinear)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
     DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
 from vllm.sequence import IntermediateTensors
diff --git a/vllm/model_executor/models/hunyuan_v1.py b/vllm/model_executor/models/hunyuan_v1.py
index d28c97116790..085e740ce226 100644
--- a/vllm/model_executor/models/hunyuan_v1.py
+++ b/vllm/model_executor/models/hunyuan_v1.py
@@ -47,8 +47,7 @@
                                                ReplicatedLinear,
                                                RowParallelLinear)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
     DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
diff --git a/vllm/model_executor/models/interfaces.py b/vllm/model_executor/models/interfaces.py
index d40df9b43dd4..c95c63cd8534 100644
--- a/vllm/model_executor/models/interfaces.py
+++ b/vllm/model_executor/models/interfaces.py
@@ -16,8 +16,7 @@
 from vllm.inputs import TokensPrompt
 from vllm.inputs.data import PromptType
 from vllm.logger import init_logger
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.utils import supports_kw
 
 from .interfaces_base import VllmModel, is_pooling_model
diff --git a/vllm/model_executor/models/llama4_eagle.py b/vllm/model_executor/models/llama4_eagle.py
index 0768edd08315..572eca344e0a 100644
--- a/vllm/model_executor/models/llama4_eagle.py
+++ b/vllm/model_executor/models/llama4_eagle.py
@@ -28,8 +28,7 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.torchao import TorchAOConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
     VocabParallelEmbedding)
diff --git a/vllm/model_executor/models/mamba.py b/vllm/model_executor/models/mamba.py
index 5bd268291c7d..d810701c50b4 100644
--- a/vllm/model_executor/models/mamba.py
+++ b/vllm/model_executor/models/mamba.py
@@ -16,8 +16,7 @@
 from vllm.model_executor.layers.mamba.mamba_mixer import MambaMixer
 from vllm.model_executor.layers.mamba.mamba_utils import (
     MambaStateDtypeCalculator, MambaStateShapeCalculator)
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
     DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
diff --git a/vllm/model_executor/models/mamba2.py b/vllm/model_executor/models/mamba2.py
index 97e9c5785e72..f8a5a8f6081b 100644
--- a/vllm/model_executor/models/mamba2.py
+++ b/vllm/model_executor/models/mamba2.py
@@ -16,8 +16,7 @@
 from vllm.model_executor.layers.mamba.mamba_mixer2 import MambaMixer2
 from vllm.model_executor.layers.mamba.mamba_utils import (
     MambaStateDtypeCalculator, MambaStateShapeCalculator)
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
     DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
diff --git a/vllm/model_executor/models/minimax_text_01.py b/vllm/model_executor/models/minimax_text_01.py
index a92890c9f7b5..45228aa0bb93 100644
--- a/vllm/model_executor/models/minimax_text_01.py
+++ b/vllm/model_executor/models/minimax_text_01.py
@@ -33,8 +33,7 @@
     MiniMaxText01LinearAttention)
 from vllm.model_executor.layers.mamba.mamba_utils import (
     MambaStateDtypeCalculator, MambaStateShapeCalculator)
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
     DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
diff --git a/vllm/model_executor/models/ovis.py b/vllm/model_executor/models/ovis.py
index 2f9c6ddfc661..2e8e4a44102f 100644
--- a/vllm/model_executor/models/ovis.py
+++ b/vllm/model_executor/models/ovis.py
@@ -29,8 +29,7 @@
 
 from vllm.config import VllmConfig
 from vllm.model_executor.layers.linear import ReplicatedLinear
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.models.aimv2 import AIMv2Model
 from vllm.model_executor.models.siglip import SiglipVisionModel
 from vllm.model_executor.models.utils import (AutoWeightsLoader, flatten_bn,
diff --git a/vllm/model_executor/models/ovis2_5.py b/vllm/model_executor/models/ovis2_5.py
index 86ce7e9eab27..9c8adb617310 100644
--- a/vllm/model_executor/models/ovis2_5.py
+++ b/vllm/model_executor/models/ovis2_5.py
@@ -11,8 +11,7 @@
 
 from vllm.config import VllmConfig
 from vllm.model_executor.layers.linear import ReplicatedLinear
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.models.ovis import (OvisImagePatchInputs,
                                              VisualEmbedding)
 from vllm.model_executor.models.siglip2navit import Siglip2NavitModel
diff --git a/vllm/model_executor/models/phimoe.py b/vllm/model_executor/models/phimoe.py
index 3ce67ce37a7a..7308fef092b5 100644
--- a/vllm/model_executor/models/phimoe.py
+++ b/vllm/model_executor/models/phimoe.py
@@ -40,8 +40,7 @@
                                                ReplicatedLinear,
                                                RowParallelLinear)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
     DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
diff --git a/vllm/model_executor/models/siglip2navit.py b/vllm/model_executor/models/siglip2navit.py
index 7d90d3a7ef12..18de4b576c49 100644
--- a/vllm/model_executor/models/siglip2navit.py
+++ b/vllm/model_executor/models/siglip2navit.py
@@ -14,13 +14,13 @@
 from transformers.configuration_utils import PretrainedConfig
 
 from vllm.attention.layer import check_upstream_fa_availability
-from vllm.config import QuantizationConfig
 from vllm.distributed import divide, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
                                                LinearBase, QKVParallelLinear,
                                                ReplicatedLinear,
                                                RowParallelLinear)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.platforms import _Backend
 
diff --git a/vllm/model_executor/models/step3_text.py b/vllm/model_executor/models/step3_text.py
index 0fe723d59483..960813822139 100644
--- a/vllm/model_executor/models/step3_text.py
+++ b/vllm/model_executor/models/step3_text.py
@@ -23,8 +23,7 @@
                                                ReplicatedLinear,
                                                RowParallelLinear)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
     DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
diff --git a/vllm/model_executor/models/whisper.py b/vllm/model_executor/models/whisper.py
index 7beeeddf988f..1eecac7ed76b 100644
--- a/vllm/model_executor/models/whisper.py
+++ b/vllm/model_executor/models/whisper.py
@@ -26,8 +26,7 @@
                                                QKVParallelLinear,
                                                RowParallelLinear)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
 from vllm.model_executor.model_loader.utils import set_default_torch_dtype
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader

From 2a2c0b5035e30f3139ef879d7652be29e7c1c3e4 Mon Sep 17 00:00:00 2001
From: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Date: Tue, 30 Sep 2025 00:18:59 -0400
Subject: [PATCH 033/193] [BugFix] Fix DP/EP hang  (#25906)

Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/v1/worker/gpu_model_runner.py | 18 +++++++++++++++---
 1 file changed, 15 insertions(+), 3 deletions(-)

diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 9e7d6eb0387b..98e00f6d98a9 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -3075,13 +3075,19 @@ def _dummy_run(
         # We currently only microbatch if the number of tokens is
         # over a certain threshold.
         if self.parallel_config.enable_dbo and allow_microbatching:
-            ubatch_slices, num_tokens_after_padding = ubatch_split(
+            ubatch_slices, ubatch_num_tokens_after_padding = ubatch_split(
                 num_scheduled_tokens,
                 total_num_scheduled_tokens,
                 total_num_scheduled_tokens,
                 uniform_decode=uniform_decode,
                 vllm_config=self.vllm_config,
             )
+            # Currently when DBO is enabled `ubatch_split` returns
+            # the num_tokens_after_padding for a single ubatch, but we have 2
+            # TODO(sage,lucas): this is cruft that should be addressed in the
+            # padding refactor.
+            if ubatch_num_tokens_after_padding is not None:
+                num_tokens_after_padding = ubatch_num_tokens_after_padding * 2
 
         # If we failed to microbatch, currently need to resynchronize
         # TODO(lucas,sage): we should be able to avoid this second sync by
@@ -3198,7 +3204,7 @@ def _dummy_run(
 
             # filter out the valid batch descriptor
             _cg_mode, batch_descriptor = self.cudagraph_dispatcher.dispatch(
-                BatchDescriptor(num_tokens=num_tokens,
+                BatchDescriptor(num_tokens=num_tokens_after_padding,
                                 uniform_decode=uniform_decode)) \
                 if not is_profile else (CUDAGraphMode.NONE, None)
             if cudagraph_runtime_mode is not None:
@@ -3212,7 +3218,13 @@ def _dummy_run(
                 cudagraph_runtime_mode = _cg_mode
 
             if ubatch_slices is not None:
-                num_tokens = num_tokens // 2
+                # Adjust values to reflect a single ubatch.
+                # TODO(sage,lucas): this is cruft that should be addressed in
+                #  the padding refactor.
+                num_tokens_after_padding = ubatch_slices[0].num_tokens
+                if num_tokens_across_dp is not None:
+                    num_tokens_across_dp[:] = num_tokens_after_padding
+
             with self.maybe_randomize_inputs(input_ids), set_forward_context(
                     attn_metadata,
                     self.vllm_config,

From 65944e59ecba8910239caaf1c0edc40e9d1061ea Mon Sep 17 00:00:00 2001
From: acisseJZhong <40467976+acisseJZhong@users.noreply.github.com>
Date: Mon, 29 Sep 2025 22:09:50 -0700
Subject: [PATCH 034/193] [BugFix] Pass config_format via
 try_get_generation_config (#25912)

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/config/model.py              | 2 ++
 vllm/transformers_utils/config.py | 2 ++
 2 files changed, 4 insertions(+)

diff --git a/vllm/config/model.py b/vllm/config/model.py
index 3fb448ebbf36..28af82de7722 100644
--- a/vllm/config/model.py
+++ b/vllm/config/model.py
@@ -1334,11 +1334,13 @@ def try_get_generation_config(self) -> dict[str, Any]:
                 self.hf_config_path or self.model,
                 trust_remote_code=self.trust_remote_code,
                 revision=self.revision,
+                config_format=self.config_format,
             )
         else:
             config = try_get_generation_config(
                 self.generation_config,
                 trust_remote_code=self.trust_remote_code,
+                config_format=self.config_format,
             )
 
         if config is None:
diff --git a/vllm/transformers_utils/config.py b/vllm/transformers_utils/config.py
index b0816cfb0702..4f5e5c01e5cb 100644
--- a/vllm/transformers_utils/config.py
+++ b/vllm/transformers_utils/config.py
@@ -949,6 +949,7 @@ def try_get_generation_config(
     model: str,
     trust_remote_code: bool,
     revision: Optional[str] = None,
+    config_format: Union[str, ConfigFormat] = "auto",
 ) -> Optional[GenerationConfig]:
     try:
         return GenerationConfig.from_pretrained(
@@ -961,6 +962,7 @@ def try_get_generation_config(
                 model,
                 trust_remote_code=trust_remote_code,
                 revision=revision,
+                config_format=config_format,
             )
             return GenerationConfig.from_model_config(config)
         except OSError:  # Not found

From eae25d9c5fe845ec431870acb6cb627b34b01886 Mon Sep 17 00:00:00 2001
From: Zhou Jiahao <me@zhoukz.com>
Date: Tue, 30 Sep 2025 16:15:23 +0800
Subject: [PATCH 035/193] [Model][Bugfix] Fix MiDashengLM audio encoder mask by
 removing incorrect `logical_not` (#25925)

Signed-off-by: zhoukz <me@zhoukz.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/midashenglm.py | 3 +--
 1 file changed, 1 insertion(+), 2 deletions(-)

diff --git a/vllm/model_executor/models/midashenglm.py b/vllm/model_executor/models/midashenglm.py
index 0b62fbd40b07..33bd64df5b53 100644
--- a/vllm/model_executor/models/midashenglm.py
+++ b/vllm/model_executor/models/midashenglm.py
@@ -426,8 +426,7 @@ def forward(
             assert x_length.ndim == 1, "Lengths are of size (B,)"
             scaled_lengths = (x_length / (self.hop_length * 4)).long()
             mask = self._to_mask(max_length=t, lengths=scaled_lengths)
-            split_masks = mask.logical_not().split(target_length_in_patches,
-                                                   dim=-1)
+            split_masks = mask.split(target_length_in_patches, dim=-1)
         else:
             mask = None
             split_masks = [None] * len(input_splits)

From 1fdef633cfe11e5cca3e87166d25ac995ba99c11 Mon Sep 17 00:00:00 2001
From: Simon Danielsson <70206058+simondanielsson@users.noreply.github.com>
Date: Tue, 30 Sep 2025 10:17:49 +0200
Subject: [PATCH 036/193] [Bugfix]: Clean up chunked prefill logging when using
 whisper (#25075)

Signed-off-by: simondanielsson <simon.danielsson99@hotmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/v1/core/test_scheduler.py | 52 ++++++++++++++++++++++++++++++++-
 vllm/config/scheduler.py        | 21 +++++++++++--
 vllm/config/vllm.py             |  9 +++---
 vllm/engine/arg_utils.py        |  1 +
 4 files changed, 75 insertions(+), 8 deletions(-)

diff --git a/tests/v1/core/test_scheduler.py b/tests/v1/core/test_scheduler.py
index f6fc1e6d37d1..5e2bdaa75d3f 100644
--- a/tests/v1/core/test_scheduler.py
+++ b/tests/v1/core/test_scheduler.py
@@ -1,5 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import dataclasses
 from typing import Optional
 from unittest.mock import Mock
 
@@ -1899,4 +1900,53 @@ def test_priority_scheduling_preemption_when_out_of_kv():
     assert output.scheduled_cached_reqs.num_reqs == 1
     assert output.scheduled_cached_reqs.req_ids[0] == request_high.request_id
     assert len(scheduler.waiting) == 1
-    assert len(scheduler.running) == 1
\ No newline at end of file
+    assert len(scheduler.running) == 1
+
+
+@pytest.mark.parametrize(
+    ("enable_chunked_prefill", "is_encoder_decoder", "expect_enabled"),
+    [
+        (True, False, True),
+        (False, False, False),
+        # Encoder-decoder models should always have it disabled
+        (False, True, False),
+        (True, True, False),
+    ])
+def test_chunked_prefill_disabled_for_encoder_decoder(
+        enable_chunked_prefill: bool, is_encoder_decoder: bool,
+        expect_enabled: bool) -> None:
+    """Validate that chunked prefill is appropriately disabled for 
+    encoder-decoder models."""
+    scheduler_config = SchedulerConfig(
+        enable_chunked_prefill=enable_chunked_prefill,
+        is_encoder_decoder=is_encoder_decoder,
+    )
+
+    # `is_encoder_decoder` should only be used during construction
+    # of the config, and otherwise stored in the model config.
+    assert "is_encoder_decoder" not in vars(scheduler_config)
+    assert "is_encoder_decoder" not in [
+        f.name for f in dataclasses.fields(scheduler_config)
+    ]
+    _validate_chunked_prefill_settings_for_encoder_decoder(
+        scheduler_config, is_encoder_decoder, expect_enabled)
+
+    # Ensure it is retained in VllmConfig, even after its post-init.
+    vllm_config = VllmConfig(scheduler_config=scheduler_config)
+    _validate_chunked_prefill_settings_for_encoder_decoder(
+        vllm_config.scheduler_config, is_encoder_decoder, expect_enabled)
+
+
+def _validate_chunked_prefill_settings_for_encoder_decoder(
+        scheduler_config: SchedulerConfig, is_encoder_decoder: bool,
+        expect_enabled: bool) -> None:
+    """Validate chunked prefill settings in the scheduler config for 
+    encoder-decoder models."""
+    assert scheduler_config.chunked_prefill_enabled is expect_enabled
+    assert scheduler_config.enable_chunked_prefill is expect_enabled
+    if is_encoder_decoder:
+        # Encoder-decoder models should automatically disable chunked multimodal
+        # inputs as well
+        assert scheduler_config.disable_chunked_mm_input is not expect_enabled
+    if is_encoder_decoder and not expect_enabled:
+        assert scheduler_config.long_prefill_token_threshold == 0
diff --git a/vllm/config/scheduler.py b/vllm/config/scheduler.py
index daf094d2df5c..1b0a10d3a069 100644
--- a/vllm/config/scheduler.py
+++ b/vllm/config/scheduler.py
@@ -2,7 +2,7 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 import hashlib
-from dataclasses import field
+from dataclasses import InitVar, field
 from typing import Any, Literal, Union
 
 from pydantic import SkipValidation, model_validator
@@ -84,6 +84,13 @@ class SchedulerConfig:
     is_multimodal_model: bool = False
     """True if the model is multimodal."""
 
+    is_encoder_decoder: InitVar[bool] = False
+    """True if the model is an encoder-decoder model.
+
+    Note: This is stored in the ModelConfig, and is used only here to
+    disable chunked prefill and prefix caching for encoder-decoder models.
+    """
+
     # TODO (ywang96): Make this configurable.
     max_num_encoder_input_tokens: int = field(init=False)
     """Multimodal encoder compute budget, only used in V1.
@@ -161,13 +168,23 @@ def compute_hash(self) -> str:
                                usedforsecurity=False).hexdigest()
         return hash_str
 
-    def __post_init__(self) -> None:
+    def __post_init__(self, is_encoder_decoder: bool) -> None:
         if self.max_model_len is None:
             self.max_model_len = 8192
 
         if self.max_num_seqs is None:
             self.max_num_seqs = 128
 
+        if is_encoder_decoder:
+            # Chunked prefill should be disabled for encoder-decoder models.
+            self.disable_chunked_mm_input = True
+            self.chunked_prefill_enabled = False
+            self.enable_chunked_prefill = False
+            self.long_prefill_token_threshold = 0
+            logger.info(
+                "Encoder-decoder models do not support chunked prefill nor"
+                " prefix caching; disabling both.")
+
         if self.max_num_batched_tokens is None:
             if self.enable_chunked_prefill:
                 self.max_num_batched_tokens = DEFAULT_MAX_NUM_BATCHED_TOKENS
diff --git a/vllm/config/vllm.py b/vllm/config/vllm.py
index 7336f5756527..585d3997cc3a 100644
--- a/vllm/config/vllm.py
+++ b/vllm/config/vllm.py
@@ -386,10 +386,6 @@ def __post_init__(self):
                     "Encoder-decoder model detected: setting "
                     "`max_num_encoder_input_tokens` to encoder length (%s)",
                     self.scheduler_config.max_num_encoder_input_tokens)
-                self.scheduler_config.disable_chunked_mm_input = True
-                disable_chunked_prefill_reasons.append(
-                    "Encoder-decoder models do not support chunked prefill nor"
-                    " prefix caching; disabling both.")
                 if (self.model_config.architecture
                         == "WhisperForConditionalGeneration"
                         and os.environ.get("VLLM_WORKER_MULTIPROC_METHOD")
@@ -400,7 +396,10 @@ def __post_init__(self):
                         "try setting 'VLLM_WORKER_MULTIPROC_METHOD' "
                         "to 'spawn'.")
 
-        if disable_chunked_prefill_reasons:
+        # Disable prefix caching only if chunked prefill is explicitly disabled
+        # (and not merely unset)
+        if (self.scheduler_config.chunked_prefill_enabled is False
+                or disable_chunked_prefill_reasons):
             for reason in disable_chunked_prefill_reasons:
                 logger.info(reason)
             self.scheduler_config.chunked_prefill_enabled = False
diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index 6bb794177db8..ce0f1708235f 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -1367,6 +1367,7 @@ def create_engine_config(
             enable_chunked_prefill=self.enable_chunked_prefill,
             disable_chunked_mm_input=self.disable_chunked_mm_input,
             is_multimodal_model=model_config.is_multimodal_model,
+            is_encoder_decoder=model_config.is_encoder_decoder,
             send_delta_data=(envs.VLLM_USE_RAY_SPMD_WORKER
                              and parallel_config.use_ray),
             policy=self.scheduling_policy,

From d2195abee7d24e10e78925878764f47eb2e14197 Mon Sep 17 00:00:00 2001
From: Yongye Zhu <zyy1102000@gmail.com>
Date: Tue, 30 Sep 2025 05:14:41 -0400
Subject: [PATCH 037/193] [New Model] DeepSeek-V3.2 (Rebased to Main) (#25896)

Signed-off-by: Chen Zhang <zhangch99@outlook.com>
Signed-off-by: youkaichao <youkaichao@gmail.com>
Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
Signed-off-by: mgoin <mgoin64@gmail.com>
Signed-off-by: NickLucche <nlucches@redhat.com>
Signed-off-by: Yongye Zhu <zyy1102000@gmail.com>
Signed-off-by: Barry Kang <43644113+Barry-Delaney@users.noreply.github.com>
Signed-off-by: Lucia Fang <fanglu@meta.com>
Co-authored-by: Chen Zhang <zhangch99@outlook.com>
Co-authored-by: youkaichao <youkaichao@gmail.com>
Co-authored-by: Lucas Wilkinson <lwilkins@redhat.com>
Co-authored-by: Robert Shaw <114415538+robertgshaw2-redhat@users.noreply.github.com>
Co-authored-by: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Co-authored-by: yewentao256 <zhyanwentao@126.com>
Co-authored-by: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Co-authored-by: mgoin <mgoin64@gmail.com>
Co-authored-by: Lucia Fang <116399278+luccafong@users.noreply.github.com>
Co-authored-by: Lucia Fang <fanglu@meta.com>
Co-authored-by: NickLucche <nlucches@redhat.com>
Co-authored-by: Siyuan Fu <siyuanf@nvidia.com>
Co-authored-by: Matthew Bonanni <mbonanni@redhat.com>
Co-authored-by: Xiaozhu Meng <mxz297@gmail.com>
Co-authored-by: Barry Kang <43644113+Barry-Delaney@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 cmake/external_projects/flashmla.cmake        |  87 ++-
 csrc/cache.h                                  |   8 +
 csrc/cache_kernels.cu                         | 258 ++++++++-
 csrc/quantization/fp8/nvidia/quant_utils.cuh  |  11 +
 csrc/torch_bindings.cpp                       |   7 +
 setup.py                                      |   4 +
 tests/compile/test_fusion_attn.py             |   1 -
 tests/kernels/attention/test_cache.py         | 113 ++++
 .../attention/test_deepgemm_attention.py      | 279 +++++++++
 tests/kernels/attention/test_flashmla.py      |  22 +-
 .../kernels/attention/test_flashmla_sparse.py | 119 ++++
 .../attention/test_pack_unpack_triton.py      | 245 ++++++++
 tests/models/registry.py                      |   1 +
 tests/models/test_initialization.py           |   9 +-
 .../vllm_add_dummy_platform/dummy_platform.py |   2 +-
 tests/v1/attention/test_mla_backends.py       |  69 ++-
 .../v1/attention/test_sparse_mla_backends.py  | 426 ++++++++++++++
 tests/v1/attention/utils.py                   |   1 -
 tests/v1/core/test_kv_cache_utils.py          |  56 +-
 tests/v1/core/test_prefix_caching.py          |   7 +-
 .../core/test_single_type_kv_cache_manager.py |   6 -
 tests/v1/engine/test_engine_core_client.py    |   3 +-
 tests/v1/worker/test_gpu_model_runner.py      |   1 -
 vllm/_custom_ops.py                           |   9 +
 vllm/attention/backends/abstract.py           |   1 +
 vllm/attention/layer.py                       |   5 +-
 vllm/attention/ops/common.py                  | 205 +++++++
 vllm/attention/ops/flashmla.py                | 165 ++++--
 vllm/attention/ops/paged_attn.py              |   1 +
 vllm/attention/selector.py                    |   5 +-
 vllm/config/cache.py                          |  20 +-
 vllm/config/compilation.py                    |   1 +
 vllm/config/model.py                          |   4 +-
 vllm/config/speculative.py                    |   2 +-
 vllm/model_executor/layers/layernorm.py       |  18 +
 vllm/model_executor/layers/mla.py             |  16 +
 vllm/model_executor/models/config.py          |  29 +-
 vllm/model_executor/models/deepseek_mtp.py    |  14 +-
 vllm/model_executor/models/deepseek_v2.py     | 449 ++++++++++++++-
 vllm/model_executor/models/longcat_flash.py   |   3 +
 vllm/model_executor/models/registry.py        |   1 +
 vllm/platforms/cpu.py                         |   5 +-
 vllm/platforms/cuda.py                        |  15 +-
 vllm/platforms/interface.py                   |   2 +-
 vllm/platforms/rocm.py                        |   5 +-
 vllm/platforms/tpu.py                         |   5 +-
 vllm/platforms/xpu.py                         |   5 +-
 vllm/transformers_utils/config.py             |   2 +
 vllm/transformers_utils/configs/__init__.py   |   2 +
 .../transformers_utils/configs/deepseek_v3.py | 101 ++++
 vllm/utils/__init__.py                        |   7 +
 vllm/utils/deep_gemm.py                       | 124 +++-
 vllm/v1/attention/backends/cpu_attn.py        |   1 +
 vllm/v1/attention/backends/flash_attn.py      |   1 +
 vllm/v1/attention/backends/flashinfer.py      |   1 +
 vllm/v1/attention/backends/flex_attention.py  |   1 +
 vllm/v1/attention/backends/mla/common.py      | 170 +++++-
 vllm/v1/attention/backends/mla/flashmla.py    |   1 +
 .../attention/backends/mla/flashmla_sparse.py | 544 ++++++++++++++++++
 vllm/v1/attention/backends/mla/indexer.py     | 293 ++++++++++
 vllm/v1/attention/backends/pallas.py          |   1 +
 vllm/v1/attention/backends/rocm_aiter_fa.py   |   1 +
 vllm/v1/attention/backends/tree_attn.py       |   1 +
 vllm/v1/attention/backends/triton_attn.py     |   1 +
 vllm/v1/attention/backends/xformers.py        |   1 +
 vllm/v1/core/kv_cache_utils.py                |   9 +-
 vllm/v1/core/single_type_kv_cache_manager.py  |   3 +-
 vllm/v1/kv_cache_interface.py                 |  51 +-
 vllm/v1/spec_decode/eagle.py                  |  56 +-
 vllm/v1/worker/gpu_model_runner.py            |  45 +-
 vllm/v1/worker/tpu_model_runner.py            |   2 -
 71 files changed, 3918 insertions(+), 221 deletions(-)
 create mode 100644 tests/kernels/attention/test_deepgemm_attention.py
 create mode 100644 tests/kernels/attention/test_flashmla_sparse.py
 create mode 100644 tests/kernels/attention/test_pack_unpack_triton.py
 create mode 100644 tests/v1/attention/test_sparse_mla_backends.py
 create mode 100644 vllm/transformers_utils/configs/deepseek_v3.py
 create mode 100644 vllm/v1/attention/backends/mla/flashmla_sparse.py
 create mode 100644 vllm/v1/attention/backends/mla/indexer.py

diff --git a/cmake/external_projects/flashmla.cmake b/cmake/external_projects/flashmla.cmake
index 02224cfe3ee8..c9e7aec880b9 100644
--- a/cmake/external_projects/flashmla.cmake
+++ b/cmake/external_projects/flashmla.cmake
@@ -18,8 +18,8 @@ if(FLASH_MLA_SRC_DIR)
 else()
   FetchContent_Declare(
         flashmla
-        GIT_REPOSITORY https://github.com/vllm-project/FlashMLA.git
-        GIT_TAG a757314c04eedd166e329e846c820eb1bdd702de
+        GIT_REPOSITORY https://github.com/vllm-project/FlashMLA
+        GIT_TAG 5f65b85703c7ed75fda01e06495077caad207c3f
         GIT_PROGRESS TRUE
         CONFIGURE_COMMAND ""
         BUILD_COMMAND ""
@@ -33,23 +33,64 @@ message(STATUS "FlashMLA is available at ${flashmla_SOURCE_DIR}")
 # The FlashMLA kernels only work on hopper and require CUDA 12.3 or later.
 # Only build FlashMLA kernels if we are building for something compatible with 
 # sm90a
-cuda_archs_loose_intersection(FLASH_MLA_ARCHS "9.0a" "${CUDA_ARCHS}")
-if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER 12.3 AND FLASH_MLA_ARCHS)
+
+set(SUPPORT_ARCHS)
+if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER 12.3)
+    list(APPEND SUPPORT_ARCHS 9.0a)
+endif()
+if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER 12.8)
+    list(APPEND SUPPORT_ARCHS 10.0a)
+endif()
+
+
+cuda_archs_loose_intersection(FLASH_MLA_ARCHS "${SUPPORT_ARCHS}" "${CUDA_ARCHS}")
+if(FLASH_MLA_ARCHS)
+    set(VLLM_FLASHMLA_GPU_FLAGS ${VLLM_GPU_FLAGS})
+    list(APPEND VLLM_FLASHMLA_GPU_FLAGS "--expt-relaxed-constexpr" "--expt-extended-lambda" "--use_fast_math")
+
     set(FlashMLA_SOURCES
-        ${flashmla_SOURCE_DIR}/csrc/flash_api.cpp
-        ${flashmla_SOURCE_DIR}/csrc/kernels/get_mla_metadata.cu
-        ${flashmla_SOURCE_DIR}/csrc/kernels/mla_combine.cu
-        ${flashmla_SOURCE_DIR}/csrc/kernels/splitkv_mla.cu
-        ${flashmla_SOURCE_DIR}/csrc/kernels_fp8/flash_fwd_mla_fp8_sm90.cu)
+        ${flashmla_SOURCE_DIR}/csrc/torch_api.cpp
+        ${flashmla_SOURCE_DIR}/csrc/pybind.cpp
+        ${flashmla_SOURCE_DIR}/csrc/smxx/get_mla_metadata.cu
+        ${flashmla_SOURCE_DIR}/csrc/smxx/mla_combine.cu
+        ${flashmla_SOURCE_DIR}/csrc/sm90/decode/dense/splitkv_mla.cu
+        ${flashmla_SOURCE_DIR}/csrc/sm90/decode/sparse_fp8/splitkv_mla.cu
+        ${flashmla_SOURCE_DIR}/csrc/sm90/prefill/sparse/fwd.cu
+        ${flashmla_SOURCE_DIR}/csrc/sm100/decode/sparse_fp8/splitkv_mla.cu
+        ${flashmla_SOURCE_DIR}/csrc/sm100/prefill/dense/fmha_cutlass_fwd_sm100.cu
+        ${flashmla_SOURCE_DIR}/csrc/sm100/prefill/dense/fmha_cutlass_bwd_sm100.cu
+        ${flashmla_SOURCE_DIR}/csrc/sm100/prefill/sparse/fwd.cu
+    )
+
+    set(FlashMLA_Extension_SOURCES
+        ${flashmla_SOURCE_DIR}/csrc/extension/torch_api.cpp
+        ${flashmla_SOURCE_DIR}/csrc/extension/sm90/dense_fp8/pybind.cpp
+        ${flashmla_SOURCE_DIR}/csrc/extension/sm90/dense_fp8/flash_fwd_mla_fp8_sm90.cu
+    )
 
     set(FlashMLA_INCLUDES
+        ${flashmla_SOURCE_DIR}/csrc
+        ${flashmla_SOURCE_DIR}/csrc/sm90
+        ${flashmla_SOURCE_DIR}/csrc/cutlass/include
+        ${flashmla_SOURCE_DIR}/csrc/cutlass/tools/util/include
+    )
+
+    set(FlashMLA_Extension_INCLUDES
+        ${flashmla_SOURCE_DIR}/csrc
+        ${flashmla_SOURCE_DIR}/csrc/sm90
+        ${flashmla_SOURCE_DIR}/csrc/extension/sm90/dense_fp8/
         ${flashmla_SOURCE_DIR}/csrc/cutlass/include
-        ${flashmla_SOURCE_DIR}/csrc)
+        ${flashmla_SOURCE_DIR}/csrc/cutlass/tools/util/include
+    )
 
     set_gencode_flags_for_srcs(
         SRCS "${FlashMLA_SOURCES}"
         CUDA_ARCHS "${FLASH_MLA_ARCHS}")
 
+    set_gencode_flags_for_srcs(
+        SRCS "${FlashMLA_Extension_SOURCES}"
+        CUDA_ARCHS "${FLASH_MLA_ARCHS}")
+
     define_gpu_extension_target(
         _flashmla_C
         DESTINATION vllm
@@ -60,8 +101,32 @@ if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER 12.3 AND FLASH_MLA_ARCHS)
         INCLUDE_DIRECTORIES ${FlashMLA_INCLUDES}
         USE_SABI 3
         WITH_SOABI)
+
+    # Keep Stable ABI for the module, but *not* for CUDA/C++ files.
+    # This prevents Py_LIMITED_API from affecting nvcc and C++ compiles.
+    target_compile_options(_flashmla_C PRIVATE
+        $<$<COMPILE_LANGUAGE:CUDA>:-UPy_LIMITED_API>
+        $<$<COMPILE_LANGUAGE:CXX>:-UPy_LIMITED_API>)
+
+    define_gpu_extension_target(
+        _flashmla_extension_C
+        DESTINATION vllm
+        LANGUAGE ${VLLM_GPU_LANG}
+        SOURCES ${FlashMLA_Extension_SOURCES}
+        COMPILE_FLAGS ${VLLM_FLASHMLA_GPU_FLAGS}
+        ARCHITECTURES ${VLLM_GPU_ARCHES}
+        INCLUDE_DIRECTORIES ${FlashMLA_Extension_INCLUDES}
+        USE_SABI 3
+        WITH_SOABI)
+
+    # Keep Stable ABI for the module, but *not* for CUDA/C++ files.
+    # This prevents Py_LIMITED_API from affecting nvcc and C++ compiles.
+    target_compile_options(_flashmla_extension_C PRIVATE
+        $<$<COMPILE_LANGUAGE:CUDA>:-UPy_LIMITED_API>
+        $<$<COMPILE_LANGUAGE:CXX>:-UPy_LIMITED_API>)
 else()
-    # Create an empty target for setup.py when not targeting sm90a systems
+    # Create empty targets for setup.py when not targeting sm90a systems
     add_custom_target(_flashmla_C)
+    add_custom_target(_flashmla_extension_C)
 endif()
 
diff --git a/csrc/cache.h b/csrc/cache.h
index fd230bec27fc..427bd0d54fac 100644
--- a/csrc/cache.h
+++ b/csrc/cache.h
@@ -56,3 +56,11 @@ void cp_gather_cache(
     torch::Tensor const& block_table,  // [BATCH, BLOCK_INDICES]
     torch::Tensor const& cu_seq_lens,  // [BATCH+1]
     int64_t batch_size, std::optional<torch::Tensor> seq_starts = std::nullopt);
+
+// Indexer K quantization and cache function
+void indexer_k_quant_and_cache(
+    torch::Tensor& k,             // [num_tokens, head_dim]
+    torch::Tensor& kv_cache,      // [num_blocks, block_size, cache_stride]
+    torch::Tensor& slot_mapping,  // [num_tokens]
+    int64_t quant_block_size,     // quantization block size
+    const std::string& scale_fmt);
diff --git a/csrc/cache_kernels.cu b/csrc/cache_kernels.cu
index 80b4c47c5547..b1c43163c6a5 100644
--- a/csrc/cache_kernels.cu
+++ b/csrc/cache_kernels.cu
@@ -16,6 +16,7 @@
 
 #include <algorithm>
 #include <cassert>
+#include <cfloat>  // FLT_MIN
 #include <map>
 #include <vector>
 
@@ -396,6 +397,176 @@ __global__ void concat_and_cache_mla_kernel(
   copy(k_pe, kv_cache, k_pe_stride, block_stride, pe_dim, kv_lora_rank);
 }
 
+template <typename scalar_t, typename cache_t, Fp8KVCacheDataType kv_dt>
+__global__ void concat_and_cache_ds_mla_kernel(
+    const scalar_t* __restrict__ kv_c,  // [num_tokens, kv_lora_rank]
+    const scalar_t* __restrict__ k_pe,  // [num_tokens, pe_dim]
+    cache_t* __restrict__ kv_cache,  // [num_blocks, block_size, (kv_lora_rank
+                                     // + pe_dim)]
+    const int64_t* __restrict__ slot_mapping,  // [num_tokens]
+    const int block_stride,                    //
+    const int entry_stride,                    //
+    const int kv_c_stride,                     //
+    const int k_pe_stride,                     //
+    const int kv_lora_rank,                    //
+    const int pe_dim,                          //
+    const int block_size,                      //
+    const float* scale                         //
+) {
+  const int64_t token_idx = blockIdx.x;
+  const int64_t slot_idx = slot_mapping[token_idx];
+  // NOTE: slot_idx can be -1 if the token is padded
+  if (slot_idx < 0) {
+    return;
+  }
+  const int64_t block_idx = slot_idx / block_size;
+  const int64_t block_offset = slot_idx % block_size;
+  const int64_t dst_idx_start =
+      block_idx * block_stride + block_offset * entry_stride;
+
+  // Create 4 tile scales in shared memory
+  __shared__ float smem[20];
+  float* shard_abs_max = smem;
+  float* tile_scales = smem + 16;
+
+  // For the NoPE part, each tile of 128 elements is handled by 4 warps
+  // (128 threads). There are 4 total tiles, so 16 warps (512 threads).
+  // The first thread of the first warp in each tile writes the scale
+  // value for the tile. The RoPE part (last 64 elements) is handled
+  // by another 2 warps (64 threads).
+  // So in total, we use 18 warps (576 threads) per block.
+
+  // Cast kv_cache to 16_bit for RoPE values
+  scalar_t* kv_cache_16bit =
+      reinterpret_cast<scalar_t*>(&kv_cache[dst_idx_start]);
+
+  // The last 64 threads handle the RoPE part
+  if (threadIdx.x >= kv_lora_rank) {
+    const int8_t pe_idx = threadIdx.x - kv_lora_rank;
+    const int64_t src_idx = token_idx * k_pe_stride + pe_idx;
+    // RoPE values start after the packed 8-bit NoPE values and the
+    // 32-bit scales
+    const int64_t dst_idx = kv_lora_rank / 2 + 8 + pe_idx;
+    kv_cache_16bit[dst_idx] = k_pe[src_idx];
+    return;
+  }
+
+  // Determine the scale for each chunk of NoPE
+  const int16_t tile_idx = threadIdx.x >> 7;
+  const int16_t warp_idx = (threadIdx.x & 127) >> 5;
+  const int16_t lane_idx = threadIdx.x & 31;
+
+  // Load the NoPE element for this thread into registers
+  const int64_t src_idx = token_idx * kv_c_stride + threadIdx.x;
+  const scalar_t src_val = kv_c[src_idx];
+
+  // Warp-level reduction to find the max absolute value in the warp
+  float max_abs = fabsf(src_val);
+#pragma unroll
+  for (int offset = 16; offset > 0; offset /= 2) {
+#ifdef USE_ROCM
+    max_abs = fmaxf(max_abs, __shfl_down_sync(UINT64_MAX, max_abs, offset));
+#else
+    max_abs = fmaxf(max_abs, __shfl_down_sync(0xFFFFFFFF, max_abs, offset));
+#endif
+  }
+
+  // The first lane of each warp in each tile writes the max_abs of this part
+  // of the tile to shared memory
+  if (lane_idx == 0) {
+    shard_abs_max[tile_idx * 4 + warp_idx] = max_abs;
+  }
+  __syncthreads();
+
+  // The first lane of the first warp in each tile computes the scale for the
+  // tile and writes it to shared memory and to kv_cache
+  if (warp_idx == 0 && lane_idx == 0) {
+    float4 shard_abs_max_vec =
+        reinterpret_cast<float4*>(shard_abs_max)[tile_idx];
+    float tile_scale = fmaxf(fmaxf(shard_abs_max_vec.x, shard_abs_max_vec.y),
+                             fmaxf(shard_abs_max_vec.z, shard_abs_max_vec.w)) /
+                       448.f;
+
+    // Avoid division by zero in `scaled_convert`
+    tile_scales[tile_idx] = fmaxf(tile_scale, FLT_MIN);
+    float* kv_cache_32bit = reinterpret_cast<float*>(&kv_cache[dst_idx_start]);
+    const uint64_t dst_idx = kv_lora_rank / 4 + tile_idx;
+    kv_cache_32bit[dst_idx] = tile_scales[tile_idx];
+  }
+
+  __syncthreads();
+
+  // Now all threads in the block scale and write their element
+  const float scale_val = tile_scales[tile_idx];
+  const int64_t dst_idx = dst_idx_start + threadIdx.x;
+  kv_cache[dst_idx] =
+      fp8::scaled_convert<uint8_t, scalar_t, Fp8KVCacheDataType::kFp8E4M3>(
+          src_val, scale_val);
+}
+
+template <typename scalar_t, typename cache_t, Fp8KVCacheDataType kv_dt>
+__global__ void indexer_k_quant_and_cache_kernel(
+    const scalar_t* __restrict__ k,  // [num_tokens, head_dim]
+    cache_t* __restrict__ kv_cache,  // [num_blocks, block_size, cache_stride]
+    const int64_t* __restrict__ slot_mapping,  // [num_tokens]
+    const int head_dim,                        // dimension of each head
+    const int quant_block_size,                // quantization block size
+    const int cache_block_size,                // cache block size
+    const int cache_stride,  // stride for each token in kv_cache
+    const bool use_ue8m0     // use ue8m0 scale format
+) {
+  constexpr int VEC_SIZE = 4;
+  const int64_t token_idx = blockIdx.x;
+  const int64_t head_dim_idx = (blockIdx.y * blockDim.y * blockDim.x +
+                                threadIdx.y * blockDim.x + threadIdx.x) *
+                               VEC_SIZE;
+  const int64_t slot_idx = slot_mapping[token_idx];
+  const int64_t block_idx = slot_idx / cache_block_size;
+  const int64_t block_offset = slot_idx % cache_block_size;
+
+  // NOTE: slot_idx can be -1 if the token is padded
+  if (slot_idx < 0 || (head_dim_idx >= head_dim)) {
+    return;
+  }
+
+  float2 k_val = (reinterpret_cast<const float2*>(
+      k))[(token_idx * head_dim + head_dim_idx) / VEC_SIZE];
+  scalar_t* k_val_ptr = reinterpret_cast<scalar_t*>(&k_val);
+  float amax = 0.0f;
+  for (int i = 0; i < VEC_SIZE; i++) {
+    amax = fmaxf(amax, fabsf(float(k_val_ptr[i])));
+  }
+  __syncwarp();
+
+  // Reduced amax
+  for (int mask = 16; mask > 0; mask /= 2) {
+#ifdef USE_ROCM
+    amax = fmaxf(amax, __shfl_xor_sync(uint64_t(-1), amax, mask));
+#else
+    amax = fmaxf(amax, __shfl_xor_sync(unsigned(-1), amax, mask));
+#endif
+  }
+  __syncwarp();
+  float scale = fmaxf(amax, 1e-4) / 448.0f;
+  if (use_ue8m0) {
+    scale = exp2f(ceilf(log2f(scale)));
+  }
+
+  const int64_t dst_offset = block_idx * cache_block_size * cache_stride +
+                             block_offset * head_dim + head_dim_idx;
+  for (int i = 0; i < VEC_SIZE; i++) {
+    kv_cache[dst_offset + i] =
+        fp8::scaled_convert<cache_t, scalar_t, kv_dt>(k_val_ptr[i], scale);
+  }
+  if (threadIdx.x == 0) {
+    const int64_t dst_scale_idx =
+        block_idx * cache_block_size * cache_stride +
+        cache_block_size * head_dim +
+        (block_offset * head_dim + head_dim_idx) * 4 / quant_block_size;
+    reinterpret_cast<float*>(kv_cache)[dst_scale_idx / 4] = scale;
+  }
+}
+
 }  // namespace vllm
 
 // KV_T is the data type of key and value tensors.
@@ -438,7 +609,7 @@ void reshape_and_cache(
   const cudaStream_t stream = at::cuda::getCurrentCUDAStream();
 
   DISPATCH_BY_KV_CACHE_DTYPE(key.dtype(), kv_cache_dtype,
-                             CALL_RESHAPE_AND_CACHE)
+                             CALL_RESHAPE_AND_CACHE);
 }
 
 // KV_T is the data type of key and value tensors.
@@ -509,6 +680,18 @@ void reshape_and_cache_flash(
           kv_c_stride, k_pe_stride, kv_lora_rank, pe_dim, block_size,   \
           reinterpret_cast<const float*>(scale.data_ptr()));
 
+// KV_T is the data type of key and value tensors.
+// CACHE_T is the stored data type of kv-cache.
+#define CALL_CONCAT_AND_CACHE_DS_MLA(KV_T, CACHE_T, KV_DTYPE)           \
+  vllm::concat_and_cache_ds_mla_kernel<KV_T, CACHE_T, KV_DTYPE>         \
+      <<<grid, block, 0, stream>>>(                                     \
+          reinterpret_cast<KV_T*>(kv_c.data_ptr()),                     \
+          reinterpret_cast<KV_T*>(k_pe.data_ptr()),                     \
+          reinterpret_cast<CACHE_T*>(kv_cache.data_ptr()),              \
+          slot_mapping.data_ptr<int64_t>(), block_stride, entry_stride, \
+          kv_c_stride, k_pe_stride, kv_lora_rank, pe_dim, block_size,   \
+          reinterpret_cast<const float*>(scale.data_ptr()));
+
 void concat_and_cache_mla(
     torch::Tensor& kv_c,          // [num_tokens, kv_lora_rank]
     torch::Tensor& k_pe,          // [num_tokens, pe_dim]
@@ -531,20 +714,44 @@ void concat_and_cache_mla(
   int pe_dim = k_pe.size(1);
   int block_size = kv_cache.size(1);
 
-  TORCH_CHECK(kv_cache.size(2) == kv_lora_rank + pe_dim);
+  if (kv_cache_dtype == "fp8_ds_mla") {
+    TORCH_CHECK(kv_lora_rank == 512, "kv_lora_rank must be 512 for fp8_ds_mla");
+    TORCH_CHECK(pe_dim == 64, "pe_dim must be 64 for fp8_ds_mla");
+    TORCH_CHECK(kv_cache.size(2) == 656 / kv_cache.itemsize(),
+                "kv_cache.size(2) must be 656 bytes for fp8_ds_mla");
+    TORCH_CHECK(kv_c.itemsize() == 2,
+                "kv_c.itemsize() must be 2 for fp8_ds_mla");
+    TORCH_CHECK(k_pe.itemsize() == 2,
+                "k_pe.itemsize() must be 2 for fp8_ds_mla");
+  } else {
+    TORCH_CHECK(kv_cache.size(2) == kv_lora_rank + pe_dim);
+  }
 
   int kv_c_stride = kv_c.stride(0);
   int k_pe_stride = k_pe.stride(0);
   int block_stride = kv_cache.stride(0);
   int entry_stride = kv_cache.stride(1);
 
-  dim3 grid(num_tokens);
-  dim3 block(std::min(kv_lora_rank, 512));
   const at::cuda::OptionalCUDAGuard device_guard(device_of(kv_c));
   const cudaStream_t stream = at::cuda::getCurrentCUDAStream();
 
-  DISPATCH_BY_KV_CACHE_DTYPE(kv_c.dtype(), kv_cache_dtype,
-                             CALL_CONCAT_AND_CACHE_MLA);
+  if (kv_cache_dtype == "fp8_ds_mla") {
+    dim3 grid(num_tokens);
+    // For the NoPE part, each tile of 128 elements is handled by 4 warps
+    // (128 threads). There are 4 total tiles, so 16 warps (512 threads).
+    // The first thread of the first warp in each tile writes the scale
+    // value for the tile. The RoPE part (last 64 elements) is handled
+    // by another 2 warps (64 threads).
+    // So in total, we use 18 warps (576 threads) per block.
+    dim3 block(576);
+    DISPATCH_BY_KV_CACHE_DTYPE(kv_c.dtype(), kv_cache_dtype,
+                               CALL_CONCAT_AND_CACHE_DS_MLA);
+  } else {
+    dim3 grid(num_tokens);
+    dim3 block(std::min(kv_lora_rank, 512));
+    DISPATCH_BY_KV_CACHE_DTYPE(kv_c.dtype(), kv_cache_dtype,
+                               CALL_CONCAT_AND_CACHE_MLA);
+  }
 }
 
 namespace vllm {
@@ -922,3 +1129,42 @@ void cp_gather_cache(
     TORCH_CHECK(false, "Unsupported data type width: ", dtype_bits);
   }
 }
+
+// Macro to dispatch the kernel based on the data type.
+#define CALL_INDEXER_K_QUANT_AND_CACHE(KV_T, CACHE_T, KV_DTYPE)         \
+  vllm::indexer_k_quant_and_cache_kernel<KV_T, CACHE_T, KV_DTYPE>       \
+      <<<grid, block, 0, stream>>>(                                     \
+          reinterpret_cast<KV_T*>(k.data_ptr()),                        \
+          reinterpret_cast<CACHE_T*>(kv_cache.data_ptr()),              \
+          slot_mapping.data_ptr<int64_t>(), head_dim, quant_block_size, \
+          cache_block_size, cache_stride, use_ue8m0);
+
+void indexer_k_quant_and_cache(
+    torch::Tensor& k,             // [num_tokens, head_dim]
+    torch::Tensor& kv_cache,      // [num_blocks, block_size, cache_stride]
+    torch::Tensor& slot_mapping,  // [num_tokens]
+    int64_t quant_block_size,     // quantization block size
+    const std::string& scale_fmt) {
+  int num_tokens = k.size(0);
+  int head_dim = k.size(1);
+  int cache_block_size = kv_cache.size(1);
+  int cache_stride = kv_cache.size(2);
+  bool use_ue8m0 = scale_fmt == "ue8m0";
+
+  TORCH_CHECK(k.device() == kv_cache.device(),
+              "k and kv_cache must be on the same device");
+  TORCH_CHECK(k.device() == slot_mapping.device(),
+              "k and slot_mapping must be on the same device");
+  TORCH_CHECK(head_dim % quant_block_size == 0,
+              "head_dim must be divisible by quant_block_size");
+
+  constexpr int vec_size = 4;
+  dim3 grid(num_tokens, (head_dim + quant_block_size * vec_size - 1) /
+                            (quant_block_size * vec_size));
+  dim3 block(32, vec_size);
+  const at::cuda::OptionalCUDAGuard device_guard(device_of(k));
+  const cudaStream_t stream = at::cuda::getCurrentCUDAStream();
+
+  DISPATCH_BY_KV_CACHE_DTYPE(k.dtype(), "fp8_e4m3",
+                             CALL_INDEXER_K_QUANT_AND_CACHE);
+}
\ No newline at end of file
diff --git a/csrc/quantization/fp8/nvidia/quant_utils.cuh b/csrc/quantization/fp8/nvidia/quant_utils.cuh
index 5b9c2df8468c..5361a8b1a598 100644
--- a/csrc/quantization/fp8/nvidia/quant_utils.cuh
+++ b/csrc/quantization/fp8/nvidia/quant_utils.cuh
@@ -576,6 +576,17 @@ __inline__ __device__ Tout scaled_convert(const Tin& x, const float scale) {
           TORCH_CHECK(false,                                                   \
                       "Unsupported input type of kv cache: ", SRC_DTYPE);      \
         }                                                                      \
+      } else if (KV_DTYPE == "fp8_ds_mla") {                                   \
+        if (SRC_DTYPE == at::ScalarType::Float) {                              \
+          FN(float, uint8_t, vllm::Fp8KVCacheDataType::kFp8E4M3);              \
+        } else if (SRC_DTYPE == at::ScalarType::Half) {                        \
+          FN(uint16_t, uint8_t, vllm::Fp8KVCacheDataType::kFp8E4M3);           \
+        } else if (SRC_DTYPE == at::ScalarType::BFloat16) {                    \
+          FN(__nv_bfloat16, uint8_t, vllm::Fp8KVCacheDataType::kFp8E4M3);      \
+        } else {                                                               \
+          TORCH_CHECK(false,                                                   \
+                      "Unsupported input type of kv cache: ", SRC_DTYPE);      \
+        }                                                                      \
       } else {                                                                 \
         TORCH_CHECK(false, "Unsupported data type of kv cache: ", KV_DTYPE);   \
       }                                                                        \
diff --git a/csrc/torch_bindings.cpp b/csrc/torch_bindings.cpp
index bc096406c51a..ebd28e735088 100644
--- a/csrc/torch_bindings.cpp
+++ b/csrc/torch_bindings.cpp
@@ -713,6 +713,13 @@ TORCH_LIBRARY_EXPAND(CONCAT(TORCH_EXTENSION_NAME, _cache_ops), cache_ops) {
       "cp_gather_cache(Tensor src_cache, Tensor! dst, Tensor block_table, "
       "Tensor cu_seq_lens, int batch_size, Tensor? seq_starts) -> ()");
   cache_ops.impl("cp_gather_cache", torch::kCUDA, &cp_gather_cache);
+
+  cache_ops.def(
+      "indexer_k_quant_and_cache(Tensor k, Tensor! kv_cache, Tensor "
+      "slot_mapping, "
+      "int quant_block_size, str kv_cache_dtype) -> ()");
+  cache_ops.impl("indexer_k_quant_and_cache", torch::kCUDA,
+                 &indexer_k_quant_and_cache);
 }
 
 TORCH_LIBRARY_EXPAND(CONCAT(TORCH_EXTENSION_NAME, _cuda_utils), cuda_utils) {
diff --git a/setup.py b/setup.py
index a8fec8a028d0..5491046991ca 100644
--- a/setup.py
+++ b/setup.py
@@ -322,6 +322,8 @@ def extract_precompiled_and_patch_package(wheel_url_or_path: str) -> dict:
                     "vllm/_C.abi3.so",
                     "vllm/_moe_C.abi3.so",
                     "vllm/_flashmla_C.abi3.so",
+                    "vllm/_flashmla_extension_C.abi3.so",
+                    "vllm/_sparse_flashmla_C.abi3.so",
                     "vllm/vllm_flash_attn/_vllm_fa2_C.abi3.so",
                     "vllm/vllm_flash_attn/_vllm_fa3_C.abi3.so",
                     "vllm/cumem_allocator.abi3.so",
@@ -589,6 +591,8 @@ def _read_requirements(filename: str) -> list[str]:
         # not targeting a hopper system
         ext_modules.append(
             CMakeExtension(name="vllm._flashmla_C", optional=True))
+        ext_modules.append(
+            CMakeExtension(name="vllm._flashmla_extension_C", optional=True))
     ext_modules.append(CMakeExtension(name="vllm.cumem_allocator"))
 
 if _build_custom_ops():
diff --git a/tests/compile/test_fusion_attn.py b/tests/compile/test_fusion_attn.py
index 6c2679ccfc81..eb8c49135428 100644
--- a/tests/compile/test_fusion_attn.py
+++ b/tests/compile/test_fusion_attn.py
@@ -191,7 +191,6 @@ def __init__(self, num_qo_heads: int, num_kv_heads: int, head_size: int,
                 num_kv_heads=self.num_kv_heads,
                 head_size=self.head_size,
                 dtype=self.kv_cache_dtype,
-                use_mla=False,
             ),
             layer_names=[self.attn.layer_name],
             vllm_config=self.vllm_config,
diff --git a/tests/kernels/attention/test_cache.py b/tests/kernels/attention/test_cache.py
index 1325e6883132..6e096a4c3999 100644
--- a/tests/kernels/attention/test_cache.py
+++ b/tests/kernels/attention/test_cache.py
@@ -593,6 +593,119 @@ def test_concat_and_cache_mla(
         torch.testing.assert_close(kv_cache, ref_kv_cache)
 
 
+@pytest.mark.parametrize("kv_lora_rank", KV_LORA_RANKS)
+@pytest.mark.parametrize("qk_rope_head_dim", QK_ROPE_HEAD_DIMS)
+@pytest.mark.parametrize("num_tokens", NUM_TOKENS_MLA)
+@pytest.mark.parametrize("block_size", BLOCK_SIZES_MLA)
+@pytest.mark.parametrize("num_blocks", NUM_BLOCKS_MLA)
+@pytest.mark.parametrize("dtype", DTYPES)
+@pytest.mark.parametrize("seed", SEEDS)
+@pytest.mark.parametrize("device", CUDA_DEVICES)
+@torch.inference_mode()
+def test_concat_and_cache_ds_mla(
+    kv_lora_rank: int,
+    qk_rope_head_dim: int,
+    num_tokens: int,
+    block_size: int,
+    num_blocks: int,
+    dtype: torch.dtype,
+    seed: int,
+    device: str,
+) -> None:
+    if dtype.itemsize != 2:
+        pytest.skip("ds_mla only supports 16-bit input")
+    kv_cache_dtype = "fp8_ds_mla"
+    current_platform.seed_everything(seed)
+    torch.set_default_device(device)
+
+    total_slots = num_blocks * block_size
+    slot_mapping_lst = random.sample(range(total_slots), num_tokens)
+    slot_mapping = torch.tensor(slot_mapping_lst,
+                                dtype=torch.long,
+                                device=device)
+
+    kv_c = torch.randn(num_tokens, kv_lora_rank, dtype=dtype, device=device)
+    k_pe = torch.randn(num_tokens,
+                       qk_rope_head_dim,
+                       dtype=dtype,
+                       device=device)
+    entry_size = kv_lora_rank + (4 * 4) + (2 * qk_rope_head_dim)
+
+    scale = torch.tensor(1.0, dtype=torch.float32, device=device)
+    kv_cache = _create_mla_cache(num_blocks,
+                                 block_size,
+                                 entry_size,
+                                 dtype=torch.uint8,
+                                 kv_cache_dtype=kv_cache_dtype,
+                                 device=device)
+
+    ref_cache = torch.zeros_like(kv_cache, dtype=kv_cache.dtype)
+    tile_data = torch.zeros(128, dtype=dtype, device=device)
+
+    for i in range(num_tokens):
+        slot = slot_mapping[i].item()
+        block_idx = slot // block_size
+        block_offset = slot % block_size
+
+        ref_cache_slice = ref_cache[block_idx, block_offset]
+        ref_cache_16bit = ref_cache_slice.view(dtype)
+        ref_cache_32bit = ref_cache_slice.view(torch.float32)
+
+        kv_c_data = kv_c[i]
+        for tile_idx in range(4):
+            tile_start = tile_idx * 128
+            tile_end = (tile_idx + 1) * 128
+            tile_data[:] = kv_c_data[tile_start:tile_end]
+
+            # tile_scale = tile_data.amax().to(torch.float32) / 448.
+            # NOTE: Using torch's amax() gives different results,
+            # so this must be manually computed.
+            tile_data_float = tile_data.to(torch.float32)
+            manual_max = abs(tile_data_float[0])
+            for j in range(1, 128):
+                manual_max = max(manual_max, abs(tile_data_float[j]))
+            tile_scale = manual_max / 448.
+
+            ref_cache_32bit[kv_lora_rank // 4 + tile_idx] = tile_scale
+
+            ops.convert_fp8(ref_cache_slice[tile_start:tile_end],
+                            tile_data,
+                            tile_scale.item(),
+                            kv_dtype="fp8")
+
+        for j in range(qk_rope_head_dim):
+            ref_cache_16bit[kv_lora_rank // 2 + 8 + j] = k_pe[i, j]
+
+    opcheck(
+        torch.ops._C_cache_ops.concat_and_cache_mla,
+        (kv_c, k_pe, kv_cache, slot_mapping, kv_cache_dtype, scale),
+        test_utils=DEFAULT_OPCHECK_TEST_UTILS,
+    )
+
+    ops.concat_and_cache_mla(kv_c, k_pe, kv_cache, slot_mapping,
+                             kv_cache_dtype, scale)
+
+    for i in range(num_tokens):
+        slot = slot_mapping[i].item()
+        block_idx = slot // block_size
+        block_offset = slot % block_size
+        kv_cache_slice = kv_cache[block_idx, block_offset]
+        ref_cache_slice = ref_cache[block_idx, block_offset]
+
+        kv_nope = kv_cache_slice[:kv_lora_rank]
+        ref_nope = ref_cache_slice[:kv_lora_rank]
+        kv_scales = kv_cache_slice.view(torch.float32)[kv_lora_rank //
+                                                       4:kv_lora_rank // 4 + 4]
+        ref_scales = ref_cache_slice.view(
+            torch.float32)[kv_lora_rank // 4:kv_lora_rank // 4 + 4]
+        kv_rope = kv_cache_slice.view(dtype)[kv_lora_rank // 2 + 8:]
+        ref_rope = ref_cache_slice.view(dtype)[kv_lora_rank // 2 + 8:]
+
+        torch.testing.assert_close(kv_nope, ref_nope, atol=0.001, rtol=0.1)
+        torch.testing.assert_close(kv_scales, ref_scales, atol=0.001, rtol=0.1)
+        torch.testing.assert_close(kv_rope, ref_rope, atol=0.001, rtol=0.1)
+
+
 @pytest.mark.parametrize("kv_lora_rank", KV_LORA_RANKS)
 @pytest.mark.parametrize("qk_rope_head_dim", QK_ROPE_HEAD_DIMS)
 @pytest.mark.parametrize("block_size", BLOCK_SIZES_MLA)
diff --git a/tests/kernels/attention/test_deepgemm_attention.py b/tests/kernels/attention/test_deepgemm_attention.py
new file mode 100644
index 000000000000..2d901e408b27
--- /dev/null
+++ b/tests/kernels/attention/test_deepgemm_attention.py
@@ -0,0 +1,279 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import random
+
+import pytest
+import torch
+
+from vllm.platforms import current_platform
+from vllm.utils import cdiv, has_deep_gemm
+from vllm.utils.deep_gemm import (_ceil_to_ue8m0, calc_diff, fp8_mqa_logits,
+                                  fp8_paged_mqa_logits, get_num_sms,
+                                  get_paged_mqa_logits_metadata)
+
+
+def kv_cache_cast_to_fp8(x: torch.Tensor) -> torch.Tensor:
+    # x: (num_blocks, block_size, 1, head_dim)
+    num_blocks, block_size, num_heads, head_dim = x.shape
+    assert num_heads == 1
+    x_amax = x.abs().float().amax(dim=3, keepdim=True).clamp(1e-4)
+    sf = x_amax / 448.0
+    x_scaled = (x * (1.0 / sf)).to(torch.float8_e4m3fn)
+    x_fp8 = torch.empty(
+        (num_blocks, block_size * (head_dim + 4)),
+        device=x.device,
+        dtype=torch.uint8,
+    )
+    x_fp8[:, :block_size * head_dim] = x_scaled.view(
+        num_blocks, block_size * head_dim).view(dtype=torch.uint8)
+    x_fp8[:,
+          block_size * head_dim:] = sf.view(num_blocks,
+                                            block_size).view(dtype=torch.uint8)
+    return x_fp8.view(num_blocks, block_size, num_heads, head_dim + 4)
+
+
+def per_custom_dims_cast_to_fp8(
+        x: torch.Tensor, dims: tuple,
+        use_ue8m0: bool) -> tuple[torch.Tensor, torch.Tensor]:
+    excluded_dims = tuple([i for i in range(x.dim()) if i not in set(dims)])
+    x_amax = x.abs().float().amax(dim=excluded_dims, keepdim=True).clamp(1e-4)
+    sf = x_amax / 448.0
+    sf = _ceil_to_ue8m0(sf) if use_ue8m0 else sf
+    x_scaled = (x * (1.0 / sf)).to(torch.float8_e4m3fn)
+    return x_scaled, sf.squeeze()
+
+
+def _generate_cp_test_data(seq_len: int, seq_len_kv: int):
+    assert seq_len_kv % seq_len == 0 and seq_len % 2 == 0
+    chunk_size = seq_len // 2
+    cp_size = seq_len_kv // seq_len
+    cp_id = cp_size // 3
+    ks = torch.zeros(seq_len, dtype=torch.int, device="cuda")
+    ke = torch.zeros(seq_len, dtype=torch.int, device="cuda")
+    for i in range(chunk_size):
+        ke[i] = cp_id * chunk_size + i
+        ke[i + chunk_size] = (cp_size * 2 - 1 - cp_id) * chunk_size + i
+    return ks, ke
+
+
+def _ref_fp8_mqa_logits(
+    q: torch.Tensor,
+    kv: torch.Tensor,
+    weights: torch.Tensor,
+    cu_seqlen_ks: torch.Tensor,
+    cu_seqlen_ke: torch.Tensor,
+):
+    seq_len_kv = kv.shape[0]
+
+    k = kv
+    q = q.float()
+    k = k.float()
+
+    mask_lo = (torch.arange(0, seq_len_kv, device="cuda")[None, :]
+               >= cu_seqlen_ks[:, None])
+    mask_hi = (torch.arange(0, seq_len_kv, device="cuda")[None, :]
+               < cu_seqlen_ke[:, None])
+    mask = mask_lo & mask_hi
+
+    score = torch.einsum("mhd,and->hmn", q, k)
+    logits = (score.relu() * weights.unsqueeze(-1).transpose(0, 1)).sum(dim=0)
+    logits = logits.masked_fill(~mask, float("-inf"))
+
+    return logits
+
+
+@pytest.mark.skipif(not current_platform.is_cuda(), reason="CUDA only")
+@pytest.mark.skipif(not has_deep_gemm(), reason="DeepGEMM not available")
+@pytest.mark.skipif(not current_platform.has_device_capability(90),
+                    reason="SM90 and SM100 only")
+def test_deepgemm_fp8_mqa_logits():
+    torch.manual_seed(0)
+    random.seed(0)
+    num_heads, head_dim = 32, 128
+    for seq_len in (512, ):
+        for seq_len_kv in (1024, ):
+            for disable_cp in (False, True):
+                q = torch.randn(
+                    seq_len,
+                    num_heads,
+                    head_dim,
+                    device="cuda",
+                    dtype=torch.bfloat16,
+                )
+                kv = torch.randn(seq_len_kv,
+                                 head_dim,
+                                 device="cuda",
+                                 dtype=torch.bfloat16)
+                weights = torch.randn(seq_len,
+                                      num_heads,
+                                      device="cuda",
+                                      dtype=torch.float32)
+
+                if disable_cp:
+                    ks = torch.zeros(seq_len, dtype=torch.int, device="cuda")
+                    ke = torch.arange(seq_len, dtype=torch.int,
+                                      device="cuda") + (seq_len_kv - seq_len)
+                else:
+                    ks, ke = _generate_cp_test_data(seq_len, seq_len_kv)
+
+                q_fp8 = q.to(torch.float8_e4m3fn)
+                kv_fp8 = per_custom_dims_cast_to_fp8(kv, (0, ), False)
+                logits = fp8_mqa_logits(q_fp8, kv_fp8, weights, ks, ke)
+
+                ref_logits = _ref_fp8_mqa_logits(
+                    q=q,
+                    kv=kv,
+                    weights=weights,
+                    cu_seqlen_ks=ks,
+                    cu_seqlen_ke=ke,
+                )
+
+                ref_neginf_mask = ref_logits == float("-inf")
+                neginf_mask = logits == float("-inf")
+                assert torch.equal(neginf_mask, ref_neginf_mask)
+
+                ref_logits = ref_logits.masked_fill(ref_neginf_mask, 0)
+                logits = logits.masked_fill(neginf_mask, 0)
+                diff = calc_diff(logits, ref_logits)
+                assert diff < 1e-3, f"{diff=}"
+
+
+def _ref_fp8_paged_mqa_logits(
+    q: torch.Tensor,
+    kv_cache: torch.Tensor,
+    weights: torch.Tensor,
+    context_lens: torch.Tensor,
+    block_tables: torch.Tensor,
+    max_model_len: int,
+):
+    batch_size, next_n, _, _ = q.size()
+    _, block_size, _, _ = kv_cache.size()
+    logits = torch.full(
+        [batch_size * next_n, max_model_len],
+        float("-inf"),
+        device=q.device,
+        dtype=torch.float32,
+    )
+    context_lens_list = context_lens.tolist()
+    for i in range(batch_size):
+        context_len = context_lens_list[i]
+        q_offsets = torch.arange(context_len - next_n,
+                                 context_len,
+                                 device="cuda")
+        weight_slice = (weights[i * next_n:(i + 1) * next_n, :].transpose(
+            0, 1).contiguous())
+        for block_rk in range(cdiv(context_len, block_size)):
+            block_idx = block_tables[i][block_rk]
+            qx, kx = q[i], kv_cache[block_idx]
+            k_offsets = torch.arange(
+                block_rk * block_size,
+                (block_rk + 1) * block_size,
+                device="cuda",
+            )
+            mask = (k_offsets[None, :] < context_len) & (k_offsets[None, :]
+                                                         <= q_offsets[:, None])
+            s = torch.where(
+                mask[None, :, :],
+                (qx.transpose(0, 1) @ kx.transpose(0, 1).transpose(1, 2)).to(
+                    logits.dtype),
+                float("-inf"),
+            )
+            s = torch.relu(s) * weight_slice[..., None]
+            s = s.sum(dim=0)
+            logits[
+                i * next_n:(i + 1) * next_n,
+                block_rk * block_size:(block_rk + 1) * block_size,
+            ] = torch.where(k_offsets[None, :] <= q_offsets[:, None], s,
+                            float("-inf"))
+    return logits
+
+
+@pytest.mark.skipif(not current_platform.is_cuda(), reason="CUDA only")
+@pytest.mark.skipif(not has_deep_gemm(), reason="DeepGEMM not available")
+@pytest.mark.skipif(not current_platform.has_device_capability(90),
+                    reason="SM90 and SM100 only")
+def test_deepgemm_fp8_paged_mqa_logits():
+    torch.manual_seed(0)
+    random.seed(0)
+
+    max_model_len = 4096
+    for batch_size, next_n in [(4, 1), (2, 2)]:
+        for heads, index_dim in [(32, 128)]:
+            for avg_kv in (2048, ):
+                num_blocks, blocksize = max_model_len * 2, 64
+
+                q = torch.randn(
+                    (batch_size, next_n, heads, index_dim),
+                    device="cuda",
+                    dtype=torch.bfloat16,
+                )
+                kv_cache = torch.randn(
+                    (num_blocks, blocksize, 1, index_dim),
+                    device="cuda",
+                    dtype=torch.bfloat16,
+                )
+                weights = torch.randn(
+                    (batch_size * next_n, heads),
+                    device="cuda",
+                    dtype=torch.float32,
+                )
+
+                context_lens = (torch.randint(int(0.8 * avg_kv),
+                                              int(1.2 * avg_kv),
+                                              (batch_size, )).cuda().to(
+                                                  torch.int32))
+                max_block_len = ((context_lens.max().item() + blocksize - 1) //
+                                 blocksize * blocksize)
+                block_tables = torch.zeros(
+                    (batch_size, max_block_len),
+                    device="cuda",
+                    dtype=torch.int32,
+                )
+
+                counter = 0
+                block_idx_pool = list(range(num_blocks))
+                random.shuffle(block_idx_pool)
+                for i in range(batch_size):
+                    ctx_len = int(context_lens[i].item())
+                    for j in range((ctx_len + blocksize - 1) // blocksize):
+                        block_tables[i][j] = block_idx_pool[counter]
+                        counter += 1
+
+                q_fp8 = q.to(torch.float8_e4m3fn)
+                kv_cache_fp8 = kv_cache_cast_to_fp8(kv_cache)
+
+                schedule_metadata = get_paged_mqa_logits_metadata(
+                    context_lens, blocksize, get_num_sms())
+                logits = fp8_paged_mqa_logits(
+                    q_fp8,
+                    kv_cache_fp8,
+                    weights,
+                    context_lens,
+                    block_tables,
+                    schedule_metadata,
+                    max_model_len,
+                )
+
+                ref_logits = _ref_fp8_paged_mqa_logits(
+                    q,
+                    kv_cache,
+                    weights,
+                    context_lens,
+                    block_tables,
+                    max_model_len,
+                )
+
+                positions = (torch.arange(max_model_len,
+                                          device="cuda").unsqueeze(0).expand(
+                                              batch_size * next_n, -1))
+                row_indices = (
+                    torch.arange(batch_size * next_n, device="cuda") // next_n)
+                next_n_offset = (
+                    torch.arange(batch_size * next_n, device="cuda") % next_n)
+                mask = positions <= (context_lens[row_indices] - next_n +
+                                     next_n_offset).unsqueeze(1)
+
+                logits = logits.masked_fill(~mask, 0)
+                ref_logits = ref_logits.masked_fill(~mask, 0)
+                diff = calc_diff(logits, ref_logits)
+                assert diff < 1e-3, f"{diff=}"
diff --git a/tests/kernels/attention/test_flashmla.py b/tests/kernels/attention/test_flashmla.py
index abcfe828d5ac..bddd7e5c50ed 100644
--- a/tests/kernels/attention/test_flashmla.py
+++ b/tests/kernels/attention/test_flashmla.py
@@ -97,18 +97,16 @@ def test_flash_mla(b, s_q, mean_sk, h_q, h_kv, d, dv, block_size, causal,
         descale_k = None
 
     def flash_mla():
-        return flash_mla_with_kvcache(
-            q,
-            blocked_k,
-            block_table,
-            cache_seqlens,
-            dv,
-            tile_scheduler_metadata,
-            num_splits,
-            causal=causal,
-            descale_q=descale_q,
-            descale_k=descale_k,
-        )
+        return flash_mla_with_kvcache(q,
+                                      blocked_k,
+                                      block_table,
+                                      cache_seqlens,
+                                      dv,
+                                      tile_scheduler_metadata,
+                                      num_splits,
+                                      causal=causal,
+                                      descale_q=descale_q,
+                                      descale_k=descale_k)
 
     def scaled_dot_product_attention(query, key, value, is_causal=False):
         query = query.float()
diff --git a/tests/kernels/attention/test_flashmla_sparse.py b/tests/kernels/attention/test_flashmla_sparse.py
new file mode 100644
index 000000000000..9036e4e7800b
--- /dev/null
+++ b/tests/kernels/attention/test_flashmla_sparse.py
@@ -0,0 +1,119 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import pytest
+import torch
+
+
+def _cuda_sm90_available() -> bool:
+    if not torch.cuda.is_available():
+        return False
+    major, _ = torch.cuda.get_device_capability()
+    return major == 9
+
+
+def test_sparse_flashmla_metadata_smoke():
+    import vllm.attention.ops.flashmla as fm
+    ok, reason = fm.is_flashmla_supported()
+    if not ok or not _cuda_sm90_available():
+        pytest.skip(reason or "SM90 not available")
+
+    device = torch.device("cuda")
+    batch_size = 1
+    seqlen_q = 1
+    num_heads_q = 128
+    num_heads_k = 1
+    q_seq_per_hk = seqlen_q * num_heads_q // num_heads_k
+    topk = 128
+
+    cache_seqlens = torch.zeros(batch_size, dtype=torch.int32, device=device)
+
+    tile_md, num_splits = fm.get_mla_metadata(cache_seqlens,
+                                              q_seq_per_hk,
+                                              num_heads_k,
+                                              num_heads_q=num_heads_q,
+                                              topk=topk,
+                                              is_fp8_kvcache=True)
+    assert tile_md.dtype == torch.int32
+    assert num_splits.dtype == torch.int32
+
+
+def test_sparse_flashmla_decode_smoke():
+    import vllm.attention.ops.flashmla as fm
+    ok, reason = fm.is_flashmla_supported()
+    if not ok or not _cuda_sm90_available():
+        pytest.skip(reason or "SM90 not available")
+
+    device = torch.device("cuda")
+    batch_size = 1
+    seqlen_q = 1
+    num_heads_q = 1
+    head_dim_k = 576
+    head_dim_v = 512
+    num_heads_k = 1
+    page_block_size = 64
+    bytes_per_token = 656
+    topk = 128
+
+    # Metadata
+    q_seq_per_hk = seqlen_q * num_heads_q // num_heads_k
+    # q_heads_per_hk = num_heads_q // num_heads_k
+    cache_seqlens = torch.zeros(batch_size, dtype=torch.int32, device=device)
+    tile_md, num_splits = fm.get_mla_metadata(cache_seqlens,
+                                              q_seq_per_hk,
+                                              num_heads_k,
+                                              num_heads_q=num_heads_q,
+                                              topk=topk,
+                                              is_fp8_kvcache=True)
+
+    # Inputs
+    q = torch.zeros((batch_size, seqlen_q, num_heads_q, head_dim_k),
+                    dtype=torch.bfloat16,
+                    device=device)
+    k_cache = torch.zeros((1, page_block_size, num_heads_k, bytes_per_token),
+                          dtype=torch.uint8,
+                          device=device)
+    indices = torch.zeros((batch_size, seqlen_q, topk),
+                          dtype=torch.int32,
+                          device=device)
+
+    block_table = torch.zeros((batch_size, 128),
+                              dtype=torch.int32,
+                              device=device)
+    out, lse = fm.flash_mla_with_kvcache(q,
+                                         k_cache,
+                                         block_table,
+                                         cache_seqlens,
+                                         head_dim_v,
+                                         tile_md,
+                                         num_splits,
+                                         indices=indices,
+                                         is_fp8_kvcache=True)
+    assert out.shape[0] == batch_size
+    assert out.shape[-1] == head_dim_v
+    assert lse.shape[0] == batch_size
+
+
+def test_sparse_flashmla_prefill_smoke():
+    import vllm.attention.ops.flashmla as fm
+    ok, reason = fm.is_flashmla_supported()
+    if not ok or not _cuda_sm90_available():
+        pytest.skip(reason or "SM90 not available")
+
+    device = torch.device("cuda")
+    s_q = 1
+    s_kv = 1
+    h_q = 64  # kernel expects multiple of 64
+    h_kv = 1
+    d_qk = 576
+    d_v = 512
+    topk = 128
+
+    q = torch.zeros((s_q, h_q, d_qk), dtype=torch.bfloat16, device=device)
+    kv = torch.zeros((s_kv, h_kv, d_qk), dtype=torch.bfloat16, device=device)
+    indices = torch.zeros((s_q, h_kv, topk), dtype=torch.int32, device=device)
+
+    out, max_logits, lse = fm.flash_mla_sparse_prefill(q, kv, indices, 1.0,
+                                                       d_v)
+    assert out.shape == (s_q, h_q, d_v)
+    assert max_logits.shape == (s_q, h_q)
+    assert lse.shape == (s_q, h_q)
diff --git a/tests/kernels/attention/test_pack_unpack_triton.py b/tests/kernels/attention/test_pack_unpack_triton.py
new file mode 100644
index 000000000000..20c0b262b479
--- /dev/null
+++ b/tests/kernels/attention/test_pack_unpack_triton.py
@@ -0,0 +1,245 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+import torch
+from torch.testing import assert_close
+
+from vllm.attention.ops.common import pack_seq_triton, unpack_seq_triton
+
+
+def test_pack_seq_basic_fp8():
+    """Test basic functionality of pack_seq_triton with fp8 and 3D tensors."""
+    device = "cuda"
+    dtype = torch.float8_e4m3fn
+
+    # Test cases with 3D tensors (N, H, D)
+    test_cases = [
+        (6, 8, 4, 2, [3, 3]),  # (6, 8, 4) -> (2, 3, 8, 4)
+        (10, 4, 8, 3, [2, 4, 4]),  # (10, 4, 8) -> (3, 4, 4, 8)
+        (20, 16, 32, 4, [5, 5, 5, 5]),  # (20, 16, 32) -> (4, 5, 16, 32)
+    ]
+
+    for N, H, D, B, lengths_list in test_cases:
+        # Create input tensor with small values for fp8
+        x = torch.randn(N, H, D, dtype=torch.float32, device=device) * 0.1
+        x = x.to(dtype=dtype)
+        lengths = torch.tensor(lengths_list, device=device)
+
+        # Pack the data
+        packed = pack_seq_triton(x, lengths)
+
+        # Check output shape and properties
+        expected_shape = (B, max(lengths_list), H, D)
+        assert packed.shape == expected_shape
+        assert packed.dtype == dtype
+        assert packed.device == x.device
+
+        # Check that valid data is preserved (within fp8 precision)
+        for b in range(B):
+            start_idx = sum(lengths_list[:b])
+            seq_len = lengths_list[b]
+
+            expected_data = x[start_idx:start_idx + seq_len].to(torch.float32)
+            actual_data = packed[b, :seq_len].to(torch.float32)
+
+            assert_close(actual_data, expected_data, rtol=1e-1, atol=1e-2)
+
+
+def test_pack_seq_custom_padding_fp8():
+    """Test pack_seq_triton with custom padding values for fp8."""
+    device = "cuda"
+    dtype = torch.float8_e4m3fn
+    N, H, D, B = 20, 8, 16, 2
+    lengths = torch.tensor([10, 10], device=device)
+
+    x = torch.randn(N, H, D, dtype=torch.float32, device=device) * 0.1
+    x = x.to(dtype=dtype)
+
+    # Test with different padding values
+    for pad_value in [-100.0, -10.0, 0.0, 10.0, 100.0]:
+        result = pack_seq_triton(x, lengths, pad_value=pad_value)
+
+        # Check valid data
+        for b in range(B):
+            start_idx = b * 10
+            expected_data = x[start_idx:start_idx + 10].to(torch.float32)
+            actual_data = result[b, :10].to(torch.float32)
+            assert_close(actual_data, expected_data, rtol=1e-1, atol=1e-2)
+
+        # Check padding (fp8 has limited range, so check for large values)
+        padded_data = result[:, 10:].to(torch.float32)
+        if pad_value < 0:
+            assert torch.all(padded_data < -50)  # Large negative values
+        elif pad_value > 0:
+            assert torch.all(padded_data > 50)  # Large positive values
+        else:
+            assert torch.allclose(padded_data,
+                                  torch.zeros_like(padded_data),
+                                  atol=1e-2)
+
+
+def test_pack_seq_default_negative_inf_padding_fp8():
+    """Test that pack_seq_triton uses -inf padding by default for fp8."""
+    device = "cuda"
+    dtype = torch.float8_e4m3fn
+    # B = 2
+    N, H, D = 20, 8, 16
+    lengths = torch.tensor([10, 10], device=device)
+
+    x = torch.randn(N, H, D, dtype=torch.float32, device=device) * 0.1
+    x = x.to(dtype=dtype)
+    result = pack_seq_triton(x, lengths)
+
+    # Check that padding is large negative values (fp8 representation of -inf)
+    padded_data = result[:, 10:].to(torch.float32)
+    assert torch.all(
+        padded_data < -100)  # fp8 -inf is represented as large negative number
+
+
+def test_pack_seq_edge_cases_fp8():
+    """Test pack_seq_triton with edge cases for fp8."""
+    device = "cuda"
+    dtype = torch.float8_e4m3fn
+
+    # Test with single batch element
+    x = torch.randn(10, 8, 16, dtype=torch.float32, device=device) * 0.1
+    x = x.to(dtype=dtype)
+    lengths = torch.tensor([10], device=device)
+    result = pack_seq_triton(x, lengths)
+    assert result.shape == (1, 10, 8, 16)
+
+    # Test with very short sequences
+    x = torch.randn(20, 4, 8, dtype=torch.float32, device=device) * 0.1
+    x = x.to(dtype=dtype)
+    lengths = torch.tensor([1, 1, 1], device=device)
+    result = pack_seq_triton(x, lengths)
+    assert result.shape == (3, 1, 4, 8)
+
+    # Test with different sequence lengths
+    x = torch.randn(15, 8, 16, dtype=torch.float32, device=device) * 0.1
+    x = x.to(dtype=dtype)
+    lengths = torch.tensor([5, 7, 3], device=device)
+    result = pack_seq_triton(x, lengths)
+    assert result.shape == (3, 7, 8, 16)
+
+
+def test_pack_seq_different_block_sizes_fp8():
+    """Test pack_seq_triton with different block sizes for fp8."""
+    device = "cuda"
+    dtype = torch.float8_e4m3fn
+    N, H, D, B = 100, 16, 32, 4
+    lengths = torch.tensor([25, 25, 25, 25], device=device)
+
+    x = torch.randn(N, H, D, dtype=torch.float32, device=device) * 0.1
+    x = x.to(dtype=dtype)
+
+    # Test different block sizes
+    for block_t, block_d in [(32, 32), (64, 64), (128, 128)]:
+        result = pack_seq_triton(x, lengths, block_t=block_t, block_d=block_d)
+
+        assert result.shape == (B, 25, H, D)
+
+        # Check that valid data is preserved (within fp8 precision)
+        for b in range(B):
+            start_idx = b * 25
+            expected_data = x[start_idx:start_idx + 25].to(torch.float32)
+            actual_data = result[b, :25].to(torch.float32)
+            assert_close(actual_data, expected_data, rtol=1e-1, atol=1e-2)
+
+
+def test_pack_seq_shape_consistency():
+    """Test that pack_seq_triton maintains shape consistency."""
+    device = "cuda"
+    dtype = torch.float8_e4m3fn
+    N, H, D, B = 20, 8, 16, 2
+    lengths = torch.tensor([10, 10], device=device)
+
+    x = torch.randn(N, H, D, dtype=torch.float32, device=device) * 0.1
+    x = x.to(dtype=dtype)
+
+    result = pack_seq_triton(x, lengths)
+
+    # Check shape consistency
+    assert result.shape[0] == B  # Batch dimension
+    assert result.shape[1] == lengths.max().item()  # Max sequence length
+    assert result.shape[2:] == x.shape[1:]  # Feature dimensions preserved
+
+
+def test_pack_unpack_roundtrip_fp8():
+    """Test that pack -> unpack gives us back the original data for fp8."""
+    device = "cuda"
+    dtype = torch.float8_e4m3fn
+
+    # Test cases with 3D tensors
+    test_cases = [
+        (6, 8, 4, 2, [3, 3]),
+        (10, 4, 8, 3, [2, 4, 4]),
+        (20, 16, 32, 4, [5, 5, 5, 5]),
+        (15, 8, 16, 3, [7, 5, 3]),
+    ]
+
+    for N, H, D, B, lengths_list in test_cases:
+        # Create input tensor with small values for fp8
+        x = torch.randn(N, H, D, dtype=torch.float32, device=device) * 0.1
+        x = x.to(dtype=dtype)
+        lengths = torch.tensor(lengths_list, device=device)
+
+        # Pack the data
+        packed = pack_seq_triton(x, lengths)
+
+        # Unpack the data
+        unpacked = unpack_seq_triton(packed, lengths)
+
+        # Check that we get back the original data (within fp8 precision)
+        assert unpacked.shape == x.shape
+        x_f32 = x.to(torch.float32)
+        unpacked_f32 = unpacked.to(torch.float32)
+        assert_close(x_f32, unpacked_f32, rtol=1e-3, atol=1e-3)
+
+        # Unpack without explicit start locations (computed in kernel)
+        unpacked_with_loc = unpack_seq_triton(packed, lengths)
+        assert_close(x_f32,
+                     unpacked_with_loc.to(torch.float32),
+                     rtol=1e-3,
+                     atol=1e-2)
+
+
+def test_unpack_seq_triton_edge_cases_fp8():
+    """Test unpack function with edge cases for fp8."""
+    device = "cuda"
+    dtype = torch.float8_e4m3fn
+
+    # Test with single batch element
+    x = torch.randn(10, 8, 16, dtype=torch.float32, device=device) * 0.1
+    x = x.to(dtype=dtype)
+    lengths = torch.tensor([10], device=device)
+    packed = pack_seq_triton(x, lengths)
+    unpacked = unpack_seq_triton(packed, lengths)
+    assert unpacked.shape == x.shape
+    assert_close(x.to(torch.float32),
+                 unpacked.to(torch.float32),
+                 rtol=1e-1,
+                 atol=1e-2)
+
+    # Test with very short sequences
+    x = torch.randn(20, 4, 8, dtype=torch.float32, device=device) * 0.1
+    x = x.to(dtype=dtype)
+    lengths = torch.tensor([1, 1, 1], device=device)
+    packed = pack_seq_triton(x, lengths)
+    unpacked = unpack_seq_triton(packed, lengths)
+    # Only compare the first 3 elements that were actually packed
+    assert_close(x[:3].to(torch.float32),
+                 unpacked.to(torch.float32),
+                 rtol=1e-1,
+                 atol=1e-2)
+
+    x = torch.randn(15, 8, 16, dtype=torch.float32, device=device) * 0.1
+    x = x.to(dtype=dtype)
+    lengths = torch.tensor([5, 7, 3], device=device)
+    packed = pack_seq_triton(x, lengths)
+    unpacked = unpack_seq_triton(packed, lengths)
+    assert unpacked.shape == x.shape
+    assert_close(x.to(torch.float32),
+                 unpacked.to(torch.float32),
+                 rtol=1e-1,
+                 atol=1e-2)
diff --git a/tests/models/registry.py b/tests/models/registry.py
index 37ee474d3ecb..b7a2514d8bc0 100644
--- a/tests/models/registry.py
+++ b/tests/models/registry.py
@@ -207,6 +207,7 @@ def check_available_online(
                                          trust_remote_code=True),
     "DeepseekV3ForCausalLM": _HfExamplesInfo("deepseek-ai/DeepSeek-V3",  # noqa: E501
                                          trust_remote_code=True),
+    "DeepseekV32ForCausalLM": _HfExamplesInfo("deepseek-ai/DeepSeek-V3.2-Exp"),
     "Ernie4_5ForCausalLM": _HfExamplesInfo("baidu/ERNIE-4.5-0.3B-PT",
                                             min_transformers_version="4.54"),
     "Ernie4_5_MoeForCausalLM": _HfExamplesInfo("baidu/ERNIE-4.5-21B-A3B-PT",
diff --git a/tests/models/test_initialization.py b/tests/models/test_initialization.py
index e818b908e8a8..1db0dc3da922 100644
--- a/tests/models/test_initialization.py
+++ b/tests/models/test_initialization.py
@@ -8,7 +8,8 @@
 
 from vllm import LLM
 from vllm.utils import GiB_bytes
-from vllm.v1.core.kv_cache_utils import get_kv_cache_configs
+from vllm.v1.core.kv_cache_utils import (generate_scheduler_kv_cache_config,
+                                         get_kv_cache_configs)
 from vllm.v1.engine.core import EngineCore as V1EngineCore
 
 from ..utils import create_new_process_for_each_test
@@ -62,11 +63,13 @@ def can_initialize(model_arch: str, monkeypatch: pytest.MonkeyPatch,
     # Avoid calling model.forward()
     def _initialize_kv_caches_v1(self, vllm_config):
         kv_cache_specs = self.model_executor.get_kv_cache_specs()
-        scheduler_kv_cache_config = get_kv_cache_configs(
+        kv_cache_configs = get_kv_cache_configs(
             vllm_config,
             kv_cache_specs,
             [10 * GiB_bytes],
-        )[0]
+        )
+        scheduler_kv_cache_config = generate_scheduler_kv_cache_config(
+            kv_cache_configs)
 
         # gpu_blocks (> 0), cpu_blocks, scheduler_kv_cache_config
         return 1, 0, scheduler_kv_cache_config
diff --git a/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_platform.py b/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_platform.py
index 8d0687b49bb4..30d721304b5c 100644
--- a/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_platform.py
+++ b/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_platform.py
@@ -26,5 +26,5 @@ def check_and_update_config(cls, vllm_config: VllmConfig) -> None:
 
     def get_attn_backend_cls(self, backend_name, head_size, dtype,
                              kv_cache_dtype, block_size, use_v1, use_mla,
-                             has_sink):
+                             has_sink, use_sparse):
         return "vllm_add_dummy_platform.dummy_attention_backend.DummyAttentionBackend"  # noqa E501
diff --git a/tests/v1/attention/test_mla_backends.py b/tests/v1/attention/test_mla_backends.py
index d4829c64b5c6..228551573ba8 100644
--- a/tests/v1/attention/test_mla_backends.py
+++ b/tests/v1/attention/test_mla_backends.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Tests for v1 MLA backends without GPUModelRunner dependency."""
+from typing import Optional, Union
 
 import pytest
 import torch
@@ -10,6 +11,7 @@
                                       create_standard_kv_cache_spec,
                                       create_vllm_config,
                                       get_attention_backend)
+from vllm import _custom_ops as ops
 from vllm.utils import STR_DTYPE_TO_TORCH_DTYPE, cdiv
 from vllm.v1.attention.backends.utils import CommonAttentionMetadata
 from vllm.v1.kv_cache_interface import FullAttentionSpec
@@ -78,7 +80,9 @@ def create_and_prepopulate_kv_cache(
         device: torch.device,
         num_blocks: int,
         common_attn_metadata: CommonAttentionMetadata,
-        randomize_blocks: bool = True) -> torch.Tensor:
+        randomize_blocks: bool = True,
+        kv_cache_dtype: Optional[str] = None,
+        scale: Union[float, torch.Tensor] = 1.0) -> torch.Tensor:
     """Create and prepopulate an MLA KV cache with context data.
     
     Args:
@@ -93,6 +97,11 @@ def create_and_prepopulate_kv_cache(
         common_attn_metadata: Common attention metadata
         randomize_blocks: Whether to randomly permute blocks 
                           or use sequential order
+        kv_cache_dtype: Optional kv cache dtype string. When set to
+                        "fp8_ds_mla" the cache is populated using the
+                        fp8 DeepSeek MLA layout via concat_and_cache_mla.
+        scale: Scaling factor forwarded to concat_and_cache_mla when the
+               fp8 cache layout is requested.
         
     Returns:
         MLA KV cache tensor
@@ -105,23 +114,61 @@ def create_and_prepopulate_kv_cache(
     block_table = common_attn_metadata.block_table_tensor
     slot_mapping = common_attn_metadata.slot_mapping
 
-    # Create MLA KV cache: (num_blocks, block_size, head_size)
-    kv_cache = torch.empty(num_blocks,
-                           block_size,
-                           head_size,
-                           dtype=dtype,
-                           device=device)
-    kv_cache_flat = kv_cache.view(-1, head_size)
+    use_fp8_ds_mla = kv_cache_dtype == "fp8_ds_mla"
+
+    if use_fp8_ds_mla:
+        if not kv_c_contexts:
+            raise ValueError("kv_c_contexts cannot be empty when using"
+                             " fp8_ds_mla cache dtype")
+        kv_lora_rank = kv_c_contexts[0].shape[-1]
+        rope_dim = k_pe_contexts[0].shape[-1]
+        entry_size = kv_lora_rank + 4 * 4 + 2 * rope_dim
+        kv_cache = torch.zeros(num_blocks,
+                               block_size,
+                               entry_size,
+                               dtype=torch.uint8,
+                               device=device)
+        scale_tensor = (scale
+                        if isinstance(scale, torch.Tensor) else torch.tensor(
+                            scale, dtype=torch.float32, device=device))
+        scale_tensor = scale_tensor.to(device=device, dtype=torch.float32)
+    else:
+        # Create MLA KV cache: (num_blocks, block_size, head_size)
+        kv_cache = torch.empty(num_blocks,
+                               block_size,
+                               head_size,
+                               dtype=dtype,
+                               device=device)
+        kv_cache_flat = kv_cache.view(-1, head_size)
 
     # Populate the cache with the context tokens
     # Start from block_id=1 since block_id=0 is considered the null block
     start_block_idx = 1
     for i in range(batch_size):
         kv_c_context, k_pe_context = kv_c_contexts[i], k_pe_contexts[i]
-        kv_context = torch.cat([kv_c_context, k_pe_context.squeeze(1)], dim=-1)
+        context_len = kv_c_context.shape[0]
+        if context_len == 0:
+            start_block_idx += cdiv(int(seq_lens[i]), block_size)
+            continue
+
         start = start_block_idx * block_size
-        end = start + kv_context.shape[0]
-        kv_cache_flat[start:end, ...] = kv_context
+
+        if use_fp8_ds_mla:
+            slots = torch.arange(context_len, device=device,
+                                 dtype=torch.long) + start
+            ops.concat_and_cache_mla(
+                kv_c_context,
+                k_pe_context.squeeze(1),
+                kv_cache,
+                slots,
+                kv_cache_dtype="fp8_ds_mla",
+                scale=scale_tensor,
+            )
+        else:
+            kv_context = torch.cat(
+                [kv_c_context, k_pe_context.squeeze(1)], dim=-1)
+            end = start + kv_context.shape[0]
+            kv_cache_flat[start:end, ...] = kv_context
 
         # Stay block aligned and allocate enough blocks for the new tokens
         start_block_idx += cdiv(int(seq_lens[i]), block_size)
diff --git a/tests/v1/attention/test_sparse_mla_backends.py b/tests/v1/attention/test_sparse_mla_backends.py
new file mode 100644
index 000000000000..74eea6f716fe
--- /dev/null
+++ b/tests/v1/attention/test_sparse_mla_backends.py
@@ -0,0 +1,426 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+"""Unit tests for the FlashMLA sparse backend utilities."""
+
+import math
+from types import MethodType, SimpleNamespace
+
+import numpy as np
+import pytest
+import torch
+
+from tests.v1.attention.test_mla_backends import (
+    BATCH_SPECS, BatchSpec, MockAttentionLayer,
+    create_and_prepopulate_kv_cache)
+from tests.v1.attention.utils import (create_common_attn_metadata,
+                                      create_standard_kv_cache_spec,
+                                      create_vllm_config)
+from vllm import _custom_ops as ops
+from vllm.attention.ops import flashmla
+from vllm.model_executor.layers.linear import ColumnParallelLinear
+from vllm.utils import cdiv
+from vllm.v1.attention.backends.mla.flashmla_sparse import (
+    FlashMLASparseBackend, FlashMLASparseDecodeAndContextMetadata,
+    FlashMLASparseImpl, FlashMLASparseMetadata)
+
+SPARSE_BACKEND_BATCH_SPECS = {
+    name: BATCH_SPECS[name]
+    for name in [
+        "mixed_small",
+        "mixed_medium",
+        "small_prefill",
+        "medium_prefill",
+        "single_prefill",
+    ]
+}
+
+SPARSE_BACKEND_BATCH_SPECS["large_q_prefill"] = BatchSpec(seq_lens=[1024] * 2,
+                                                          query_lens=[256] * 2)
+SPARSE_BACKEND_BATCH_SPECS["large_q_pure_prefill"] = BatchSpec(
+    seq_lens=[256] * 2, query_lens=[256] * 2)
+
+
+def _dequantize_fp8_ds_mla_entry(
+        cache_slice: torch.Tensor, kv_lora_rank: int, rope_dim: int,
+        dtype: torch.dtype) -> tuple[torch.Tensor, torch.Tensor]:
+    """Dequantize a single fp8_ds_mla cache entry back to latent + rope."""
+
+    # The first kv_lora_rank bytes store FP8 latent values with one scale per
+    # 128 element tile written as float32 right after the latent payload.
+    scales = cache_slice.view(torch.float32)[kv_lora_rank //
+                                             4:kv_lora_rank // 4 + 4]
+    latent = torch.empty(kv_lora_rank,
+                         dtype=torch.float16,
+                         device=cache_slice.device)
+    for tile_idx in range(4):
+        tile_start = tile_idx * 128
+        tile_end = tile_start + 128
+        ops.convert_fp8(latent[tile_start:tile_end],
+                        cache_slice[tile_start:tile_end],
+                        float(scales[tile_idx].item()),
+                        kv_dtype="fp8")
+    latent = latent.to(dtype)
+
+    rope_offset = kv_lora_rank // 2 + 8
+    rope_vals = cache_slice.view(dtype)[rope_offset:rope_offset + rope_dim]
+    return latent, rope_vals.clone()
+
+
+def _quantize_dequantize_fp8_ds_mla(
+        kv_c: torch.Tensor, k_pe: torch.Tensor, block_size: int,
+        scale: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+    """Round-trip kv_c/k_pe though the fp8_ds_mla cache layout."""
+
+    if kv_c.numel() == 0:
+        return kv_c.clone(), k_pe.clone()
+
+    kv_lora_rank = kv_c.shape[-1]
+    rope_dim = k_pe.shape[-1]
+    num_tokens = kv_c.shape[0]
+    num_blocks = max(1, math.ceil(num_tokens / block_size))
+    entry_size = kv_lora_rank + 4 * 4 + 2 * rope_dim
+
+    tmp_cache = torch.zeros(num_blocks,
+                            block_size,
+                            entry_size,
+                            dtype=torch.uint8,
+                            device=kv_c.device)
+    slot_mapping = torch.arange(num_tokens,
+                                dtype=torch.long,
+                                device=kv_c.device)
+
+    ops.concat_and_cache_mla(kv_c,
+                             k_pe,
+                             tmp_cache,
+                             slot_mapping,
+                             kv_cache_dtype="fp8_ds_mla",
+                             scale=scale)
+
+    dequant_kv_c = torch.empty_like(kv_c)
+    dequant_k_pe = torch.empty_like(k_pe)
+
+    for token_idx in range(num_tokens):
+        slot = slot_mapping[token_idx].item()
+        block_idx = slot // block_size
+        block_offset = slot % block_size
+        cache_slice = tmp_cache[block_idx, block_offset]
+        latent, rope_vals = _dequantize_fp8_ds_mla_entry(
+            cache_slice, kv_lora_rank, rope_dim, kv_c.dtype)
+        dequant_kv_c[token_idx] = latent
+        dequant_k_pe[token_idx] = rope_vals
+
+    return dequant_kv_c, dequant_k_pe
+
+
+def test_sparse_backend_metadata_registration():
+    backend = FlashMLASparseBackend
+
+    assert backend.get_name() == "FLASHMLA_SPARSE_VLLM_V1"
+    assert backend.get_metadata_cls() is FlashMLASparseMetadata
+    assert backend.get_impl_cls() is FlashMLASparseImpl
+
+    dtype_list = backend.get_supported_dtypes()
+    assert torch.bfloat16 in dtype_list
+
+    shape = backend.get_kv_cache_shape(num_blocks=2,
+                                       block_size=64,
+                                       num_kv_heads=1,
+                                       head_size=576)
+    assert shape == (2, 64, 576)
+
+
+def test_sparse_decode_metadata_filters_prefill_indices():
+    prefill_context_lengths = torch.tensor([4, 2], dtype=torch.int32)
+    metadata = FlashMLASparseDecodeAndContextMetadata(
+        scheduler_metadata=torch.tensor([[0]], dtype=torch.int32),
+        num_splits=torch.tensor([1, 1], dtype=torch.int32),
+        cache_lens=torch.tensor([10, 12], dtype=torch.int32),
+        prefill_context_lengths=prefill_context_lengths,
+    )
+
+    indices = torch.tensor([[0, 3, 5], [1, 2, 4]], dtype=torch.int32)
+
+    context_indices, new_token_indices = metadata.filter_prefill_indices(
+        indices)
+
+    expected_context = torch.tensor([[-1, -1, 5], [-1, -1, 4]],
+                                    dtype=torch.int32)
+    expected_new_tokens = torch.tensor([[-1, -1, 1], [-1, 0, 2]],
+                                       dtype=torch.int32)
+
+    assert torch.equal(context_indices, expected_context)
+    assert torch.equal(new_token_indices, expected_new_tokens)
+
+
+def test_sparse_impl_zero_fills_when_metadata_missing():
+    impl = FlashMLASparseImpl.__new__(FlashMLASparseImpl)
+    dummy_layer = object()
+    q = torch.zeros((2, 1, 3))
+    k_c = torch.zeros((2, 3))
+    k_pe = torch.zeros((2, 1, 1))
+    kv_cache = torch.zeros((1, 1, 1))
+    output = torch.ones((2, 4))
+
+    result = FlashMLASparseImpl.forward(impl,
+                                        dummy_layer,
+                                        q,
+                                        k_c,
+                                        k_pe,
+                                        kv_cache,
+                                        attn_metadata=None,
+                                        output=output)
+
+    assert result is output
+    assert torch.all(result == 0)
+
+
+@pytest.mark.parametrize("batch_name", list(SPARSE_BACKEND_BATCH_SPECS.keys()))
+@pytest.mark.parametrize("kv_cache_dtype", ["fp8_ds_mla", "auto"])
+def test_sparse_backend_decode_correctness(dist_init, batch_name,
+                                           kv_cache_dtype):
+    if not torch.cuda.is_available():
+        pytest.skip("CUDA is required for sparse MLA decode test")
+
+    device = torch.device("cuda")
+    dtype = torch.bfloat16
+
+    batch_spec = SPARSE_BACKEND_BATCH_SPECS[batch_name]
+
+    # Model hyper-parameters (kept intentionally small for the unit test)
+    num_heads = 128
+    kv_lora_rank = 512
+    qk_nope_head_dim = 128
+    qk_rope_head_dim = 64
+    v_head_dim = 128
+    head_size = kv_lora_rank + qk_rope_head_dim
+    topk_tokens = 2048
+
+    max_seqlen = max(batch_spec.seq_lens)
+    total_cache_tokens = sum(batch_spec.seq_lens)
+    block_size = 64
+
+    vllm_config = create_vllm_config(
+        model_name="deepseek-ai/DeepSeek-V2-Lite-Chat",
+        max_model_len=max_seqlen,
+        num_gpu_blocks=max(2048,
+                           cdiv(total_cache_tokens, block_size) + 1),
+        block_size=block_size)
+    model_config = vllm_config.model_config
+    model_config.hf_config = SimpleNamespace(
+        attn_module_list_cfg=[{
+            "topk_tokens": topk_tokens
+        }])
+    model_config.hf_text_config = SimpleNamespace(
+        q_lora_rank=None,
+        kv_lora_rank=kv_lora_rank,
+        qk_nope_head_dim=qk_nope_head_dim,
+        qk_rope_head_dim=qk_rope_head_dim,
+        v_head_dim=v_head_dim,
+        model_type="deepseek_v2",
+    )
+    model_config.dtype = dtype
+    model_config.get_num_attention_heads = MethodType(
+        lambda self, parallel_config: num_heads, model_config)
+    model_config.get_num_kv_heads = MethodType(lambda self, parallel_config: 1,
+                                               model_config)
+    model_config.get_head_size = MethodType(lambda self: head_size,
+                                            model_config)
+    model_config.get_sliding_window = MethodType(lambda self: None,
+                                                 model_config)
+
+    kv_cache_spec = create_standard_kv_cache_spec(vllm_config)
+
+    torch.manual_seed(0)
+
+    scale = 1.0 / math.sqrt(head_size)
+
+    # Shared MLA projection weights to keep reference and backend in sync
+    W_UK = torch.randn(kv_lora_rank,
+                       num_heads,
+                       qk_nope_head_dim,
+                       dtype=dtype,
+                       device=device)
+    W_UV = torch.randn(kv_lora_rank,
+                       num_heads,
+                       v_head_dim,
+                       dtype=dtype,
+                       device=device)
+
+    # Build synthetic decode-only workload
+    seq_lens = batch_spec.seq_lens
+    query_lens = batch_spec.query_lens
+
+    all_q_vllm, all_kv_c_vllm, all_k_pe_vllm = [], [], []
+    kv_c_contexts, k_pe_contexts = [], []
+    reference_outputs = []
+
+    kv_cache_scale = torch.tensor(1.0, dtype=torch.float32, device=device)
+
+    for i in range(batch_spec.batch_size):
+        s_len = seq_lens[i]
+        q_len = query_lens[i]
+        ctx_len = s_len - q_len
+
+        q_c = torch.rand(q_len,
+                         num_heads,
+                         qk_nope_head_dim + qk_rope_head_dim,
+                         dtype=dtype,
+                         device=device)
+        kv_c_full = torch.rand(s_len, kv_lora_rank, dtype=dtype, device=device)
+        k_pe_full = torch.rand(s_len,
+                               1,
+                               qk_rope_head_dim,
+                               dtype=dtype,
+                               device=device)
+
+        kv_c_full, k_pe_full = _quantize_dequantize_fp8_ds_mla(
+            kv_c_full,
+            k_pe_full.squeeze(1),
+            block_size=vllm_config.cache_config.block_size,
+            scale=kv_cache_scale,
+        )
+
+        q_nope, q_pe = q_c.split([qk_nope_head_dim, qk_rope_head_dim], dim=-1)
+        ql_nope = torch.einsum("qnh,lnh->qnl", q_nope, W_UK)
+        q_mqa = torch.cat([ql_nope, q_pe], dim=-1)
+
+        k_mqa = torch.cat([kv_c_full, k_pe_full], dim=-1)
+        k_mqa = k_mqa.unsqueeze(1).expand(-1, num_heads, -1)
+        v_mqa = kv_c_full.unsqueeze(1).expand(-1, num_heads, -1)
+
+        attn_mask = torch.ones(q_len, s_len, dtype=torch.bool, device=device)
+        causal_mask = torch.tril(torch.ones(q_len, q_len, device=device))
+        attn_mask[:, ctx_len:] = causal_mask
+
+        q_sdpa_in = q_mqa.unsqueeze(0).transpose(1, 2)
+        k_sdpa_in = k_mqa.unsqueeze(0).transpose(1, 2)
+        v_sdpa_in = v_mqa.unsqueeze(0).transpose(1, 2)
+
+        sdpa_out = torch.nn.functional.scaled_dot_product_attention(
+            q_sdpa_in, k_sdpa_in, v_sdpa_in, attn_mask=attn_mask, scale=scale)
+        sdpa_out = sdpa_out.transpose(1, 2).squeeze(0)
+
+        sdpa_out = torch.einsum("qnl,lnv->qnv", sdpa_out, W_UV)
+        reference_outputs.append(sdpa_out.flatten(start_dim=-2))
+
+        all_q_vllm.append(q_c)
+        all_kv_c_vllm.append(kv_c_full[ctx_len:])
+        all_k_pe_vllm.append(k_pe_full[ctx_len:])
+        kv_c_contexts.append(kv_c_full[:ctx_len + 1])
+        k_pe_contexts.append(k_pe_full[:ctx_len + 1])
+
+    query_vllm = torch.cat(all_q_vllm, dim=0)
+    kv_c_vllm = torch.cat(all_kv_c_vllm, dim=0)
+    k_pe_vllm = torch.cat(all_k_pe_vllm, dim=0)
+    sdpa_reference = torch.cat(reference_outputs, dim=0)
+
+    vllm_config.cache_config.cache_dtype = kv_cache_dtype
+
+    common_attn_metadata = create_common_attn_metadata(
+        batch_spec,
+        vllm_config.cache_config.block_size,
+        device,
+        arange_block_indices=True)
+
+    kv_cache = create_and_prepopulate_kv_cache(
+        kv_c_contexts=kv_c_contexts,
+        k_pe_contexts=k_pe_contexts,
+        block_size=vllm_config.cache_config.block_size,
+        head_size=head_size,
+        dtype=dtype,
+        device=device,
+        num_blocks=vllm_config.cache_config.num_gpu_blocks,
+        common_attn_metadata=common_attn_metadata,
+        randomize_blocks=False,
+        kv_cache_dtype=vllm_config.cache_config.cache_dtype,
+        scale=kv_cache_scale,
+    )
+
+    builder_cls = FlashMLASparseBackend.get_builder_cls()
+    builder = builder_cls(kv_cache_spec, ["placeholder"], vllm_config, device)
+    metadata = builder.build(common_prefix_len=0,
+                             common_attn_metadata=common_attn_metadata)
+
+    starts = np.asarray(common_attn_metadata.query_start_loc_cpu,
+                        dtype=np.int32)
+    seg_lengths = np.diff(starts)
+    positions = np.arange(starts[-1], dtype=np.int32) - np.repeat(
+        starts[:-1], seg_lengths)
+    seq_lengths = np.asarray(common_attn_metadata.seq_lens_cpu, dtype=np.int32)
+    prefix_lengths = seq_lengths - seg_lengths
+    positions += np.repeat(prefix_lengths, seg_lengths)
+
+    pos_gpu = torch.as_tensor(positions, device=device, dtype=torch.int32)
+    topk = metadata.topk_tokens
+    debug_indices = torch.arange(topk, device=device,
+                                 dtype=torch.int32).unsqueeze(0)
+    token_positions = pos_gpu.unsqueeze(1)
+    causal_mask = (debug_indices <= token_positions)
+    debug_indices = torch.where(causal_mask, debug_indices,
+                                torch.full_like(debug_indices, -1))
+
+    # FlashMLASparseImpl now reads top-k indices from the indexer-provided
+    # buffer, so emulate that contract with a simple namespace mock.
+    debug_indices = debug_indices.expand(metadata.num_actual_tokens,
+                                         -1).clone()
+    mock_indexer = SimpleNamespace(topk_indices_buffer=debug_indices)
+
+    ok, reason = flashmla.is_flashmla_supported()
+    if not ok:
+        pytest.skip(reason)
+
+    kv_b_proj_weight = torch.cat([W_UK, W_UV], dim=-1)
+    kv_b_proj_weight = kv_b_proj_weight.view(
+        kv_lora_rank, num_heads * (qk_nope_head_dim + v_head_dim))
+
+    mock_kv_b_proj = ColumnParallelLinear(input_size=kv_lora_rank,
+                                          output_size=num_heads *
+                                          (qk_nope_head_dim + v_head_dim),
+                                          bias=False).to(device=device,
+                                                         dtype=dtype)
+    mock_kv_b_proj.weight = torch.nn.Parameter(kv_b_proj_weight.T.contiguous())
+
+    impl_cls = FlashMLASparseBackend.get_impl_cls()
+    impl = impl_cls(num_heads=num_heads,
+                    head_size=head_size,
+                    scale=scale,
+                    num_kv_heads=1,
+                    alibi_slopes=None,
+                    sliding_window=None,
+                    kv_cache_dtype=vllm_config.cache_config.cache_dtype,
+                    logits_soft_cap=None,
+                    attn_type="decoder",
+                    kv_sharing_target_layer_name=None,
+                    q_lora_rank=None,
+                    kv_lora_rank=kv_lora_rank,
+                    qk_nope_head_dim=qk_nope_head_dim,
+                    qk_rope_head_dim=qk_rope_head_dim,
+                    qk_head_dim=qk_nope_head_dim + qk_rope_head_dim,
+                    v_head_dim=v_head_dim,
+                    kv_b_proj=mock_kv_b_proj,
+                    indexer=mock_indexer)
+
+    impl.process_weights_after_loading(dtype)
+
+    layer = MockAttentionLayer(device)
+    out_buffer = torch.empty(metadata.num_actual_tokens,
+                             num_heads * v_head_dim,
+                             dtype=dtype,
+                             device=device)
+
+    backend_output = impl.forward(layer,
+                                  query_vllm,
+                                  kv_c_vllm,
+                                  k_pe_vllm,
+                                  kv_cache,
+                                  metadata,
+                                  output=out_buffer)
+
+    assert backend_output.shape == sdpa_reference.shape
+    assert backend_output.dtype == sdpa_reference.dtype
+    assert torch.isfinite(backend_output).all()
+
+    torch.testing.assert_close(backend_output,
+                               sdpa_reference,
+                               rtol=0.5,
+                               atol=0.5)
diff --git a/tests/v1/attention/utils.py b/tests/v1/attention/utils.py
index 01b5de83a59a..adfe2b2db040 100644
--- a/tests/v1/attention/utils.py
+++ b/tests/v1/attention/utils.py
@@ -168,7 +168,6 @@ def create_standard_kv_cache_spec(
             vllm_config.parallel_config),
         head_size=vllm_config.model_config.get_head_size(),
         dtype=vllm_config.model_config.dtype,
-        use_mla=vllm_config.model_config.use_mla,
         sliding_window=vllm_config.model_config.get_sliding_window(),
     )
 
diff --git a/tests/v1/core/test_kv_cache_utils.py b/tests/v1/core/test_kv_cache_utils.py
index 4cb7ed6ce382..452b16ef4a91 100644
--- a/tests/v1/core/test_kv_cache_utils.py
+++ b/tests/v1/core/test_kv_cache_utils.py
@@ -24,7 +24,8 @@
     make_block_hash_with_group_id)
 from vllm.v1.kv_cache_interface import (FullAttentionSpec, KVCacheConfig,
                                         KVCacheGroupSpec, KVCacheSpec,
-                                        KVCacheTensor, SlidingWindowSpec,
+                                        KVCacheTensor, MLAAttentionSpec,
+                                        SlidingWindowSpec,
                                         UniformTypeKVCacheSpecs)
 from vllm.v1.metrics.stats import PrefixCacheStats
 from vllm.v1.request import Request
@@ -77,13 +78,11 @@ def new_kv_cache_spec(block_size=16,
                       num_kv_heads=2,
                       head_size=64,
                       dtype=torch.float32,
-                      use_mla=False,
                       sliding_window=None):
     return FullAttentionSpec(block_size=block_size,
                              num_kv_heads=num_kv_heads,
                              head_size=head_size,
                              dtype=dtype,
-                             use_mla=use_mla,
                              sliding_window=sliding_window)
 
 
@@ -91,13 +90,11 @@ def new_sliding_window_spec(block_size=16,
                             num_kv_heads=2,
                             head_size=64,
                             dtype=torch.float32,
-                            use_mla=False,
                             sliding_window=1):
     return SlidingWindowSpec(block_size=block_size,
                              num_kv_heads=num_kv_heads,
                              head_size=head_size,
                              dtype=dtype,
-                             use_mla=use_mla,
                              sliding_window=sliding_window)
 
 
@@ -894,7 +891,6 @@ def test_merge_kv_cache_spec():
             num_kv_heads=full_spec.num_kv_heads,
             head_size=full_spec.head_size,
             dtype=full_spec.dtype,
-            use_mla=full_spec.use_mla,
             sliding_window=1,
         ),
     ]
@@ -991,7 +987,6 @@ def test_estimate_max_model_len(model_id, max_model_len,
             num_kv_heads=32,
             head_size=128,
             dtype=torch.float16,
-            use_mla=False,
         )
     # Estimate the maximum model length, 16384 model_len need 8GB
     estimated_max_len = estimate_max_model_len(vllm_config, kv_cache_spec,
@@ -1022,7 +1017,6 @@ def test_get_max_concurrency_for_kv_cache_config():
         num_kv_heads=32,
         head_size=128,
         dtype=torch.float16,
-        use_mla=False,
     )
 
     sliding_window_spec = SlidingWindowSpec(
@@ -1030,7 +1024,6 @@ def test_get_max_concurrency_for_kv_cache_config():
         num_kv_heads=32,
         head_size=128,
         dtype=torch.float16,
-        use_mla=False,
         sliding_window=1024,
     )
 
@@ -1412,3 +1405,48 @@ def test_generate_scheduler_kv_cache_config():
             KVCacheGroupSpec(['layer_1', 'layer_2'], new_kv_cache_spec())
         ],
     )
+
+
+def new_mla_spec(cache_dtype_str=None):
+    return MLAAttentionSpec(block_size=16,
+                            num_kv_heads=16,
+                            head_size=64,
+                            dtype=torch.float32,
+                            cache_dtype_str=cache_dtype_str)
+
+
+def test_merge_mla_spec():
+    kv_cache_specs = [
+        new_mla_spec(),
+        new_mla_spec(),
+    ]
+    mla_spec = kv_cache_specs[0].merge(kv_cache_specs)
+    assert mla_spec == new_mla_spec()
+
+    kv_cache_specs = [
+        new_mla_spec(cache_dtype_str="fp8_ds_mla"),
+        new_mla_spec(cache_dtype_str="fp8_ds_mla"),
+    ]
+    mla_spec = kv_cache_specs[0].merge(kv_cache_specs)
+    assert mla_spec == new_mla_spec(cache_dtype_str="fp8_ds_mla")
+
+    kv_cache_specs = [
+        new_mla_spec(cache_dtype_str="fp8_ds_mla"),
+        new_mla_spec(cache_dtype_str=None),
+    ]
+    with pytest.raises(AssertionError):
+        kv_cache_specs[0].merge(kv_cache_specs)
+
+    kv_cache_specs = [
+        new_kv_cache_spec(),
+        new_mla_spec(),
+    ]
+    with pytest.raises(AssertionError):
+        kv_cache_specs[0].merge(kv_cache_specs)
+
+    kv_cache_specs = [
+        new_mla_spec(cache_dtype_str="fp8_ds_mla"),
+        new_kv_cache_spec(),
+    ]
+    with pytest.raises(AssertionError):
+        kv_cache_specs[0].merge(kv_cache_specs)
diff --git a/tests/v1/core/test_prefix_caching.py b/tests/v1/core/test_prefix_caching.py
index 37b4f9a08e40..5769099e0af1 100644
--- a/tests/v1/core/test_prefix_caching.py
+++ b/tests/v1/core/test_prefix_caching.py
@@ -76,7 +76,7 @@ def make_kv_cache_config(block_size: int, num_blocks: int) -> KVCacheConfig:
         kv_cache_groups=[
             KVCacheGroupSpec(
                 ["layer"],
-                FullAttentionSpec(block_size, 1, 1, torch.float32, False),
+                FullAttentionSpec(block_size, 1, 1, torch.float32),
             )
         ],
     )
@@ -90,7 +90,7 @@ def make_kv_cache_config_hybrid_model(block_size: int,
         kv_cache_groups=[
             KVCacheGroupSpec(
                 ["layer1"],
-                FullAttentionSpec(block_size, 1, 1, torch.float32, False),
+                FullAttentionSpec(block_size, 1, 1, torch.float32),
             ),
             KVCacheGroupSpec(
                 ["layer2"],
@@ -98,7 +98,6 @@ def make_kv_cache_config_hybrid_model(block_size: int,
                                   1,
                                   1,
                                   torch.float32,
-                                  False,
                                   sliding_window=2 * block_size),
             ),
             KVCacheGroupSpec(
@@ -107,7 +106,6 @@ def make_kv_cache_config_hybrid_model(block_size: int,
                                   1,
                                   1,
                                   torch.float32,
-                                  False,
                                   sliding_window=2 * block_size),
             ),
         ],
@@ -1338,7 +1336,6 @@ def test_eagle_with_sliding_window():
         head_size=1,
         dtype=torch.float32,
         sliding_window=block_size,
-        use_mla=False,
     )
     manager = KVCacheManager(
         KVCacheConfig(
diff --git a/tests/v1/core/test_single_type_kv_cache_manager.py b/tests/v1/core/test_single_type_kv_cache_manager.py
index 01b54ae56e90..1f6825b6d24e 100644
--- a/tests/v1/core/test_single_type_kv_cache_manager.py
+++ b/tests/v1/core/test_single_type_kv_cache_manager.py
@@ -35,7 +35,6 @@ def test_chunked_local_attention_possible_cached_prefix():
         head_size=1,
         dtype=torch.float32,
         attention_chunk_size=4,
-        use_mla=False,
     )
 
     block_pool = BlockPool(num_gpu_blocks=100, enable_caching=True)
@@ -100,7 +99,6 @@ def test_sliding_window_possible_cached_prefix():
         head_size=1,
         dtype=torch.float32,
         sliding_window=4,
-        use_mla=False,
     )
 
     block_pool = BlockPool(num_gpu_blocks=100, enable_caching=True)
@@ -165,7 +163,6 @@ def test_chunked_local_attention_remove_skipped_blocks():
         head_size=1,
         dtype=torch.float32,
         attention_chunk_size=4,
-        use_mla=False,
     )
 
     block_pool = BlockPool(num_gpu_blocks=2000, enable_caching=True)
@@ -217,7 +214,6 @@ def test_sliding_window_remove_skipped_blocks():
         head_size=1,
         dtype=torch.float32,
         sliding_window=4,
-        use_mla=False,
     )
 
     block_pool = BlockPool(num_gpu_blocks=2000, enable_caching=True)
@@ -285,7 +281,6 @@ def test_get_num_blocks_to_allocate():
         head_size=1,
         dtype=torch.float32,
         sliding_window=4,  # Placeholder value, not related to test result
-        use_mla=False,
     )
 
     block_pool = BlockPool(num_gpu_blocks=100, enable_caching=True)
@@ -308,7 +303,6 @@ def test_chunked_local_attention_get_num_blocks_to_allocate():
         head_size=1,
         dtype=torch.float32,
         attention_chunk_size=4,  # Placeholder value, not related to test result
-        use_mla=False,
     )
 
     block_pool = BlockPool(num_gpu_blocks=100, enable_caching=True)
diff --git a/tests/v1/engine/test_engine_core_client.py b/tests/v1/engine/test_engine_core_client.py
index 992c4e01386e..10adac9bab5f 100644
--- a/tests/v1/engine/test_engine_core_client.py
+++ b/tests/v1/engine/test_engine_core_client.py
@@ -836,8 +836,7 @@ def create_mock_executor(vllm_config):
         mock_spec = FullAttentionSpec(block_size=16,
                                       num_kv_heads=1,
                                       head_size=64,
-                                      dtype=torch.float16,
-                                      use_mla=False)
+                                      dtype=torch.float16)
 
         mock_executor.get_kv_cache_specs.return_value = [{
             "default": mock_spec
diff --git a/tests/v1/worker/test_gpu_model_runner.py b/tests/v1/worker/test_gpu_model_runner.py
index 8b571f95c5ec..49a7a61e1889 100644
--- a/tests/v1/worker/test_gpu_model_runner.py
+++ b/tests/v1/worker/test_gpu_model_runner.py
@@ -39,7 +39,6 @@ def initialize_kv_cache(runner: GPUModelRunner):
             runner.parallel_config),
         head_size=runner.model_config.get_head_size(),
         dtype=runner.kv_cache_dtype,
-        use_mla=False,
     )
     tensor_size = attn_spec.page_size_bytes * NUM_BLOCKS
     kv_cache_config = KVCacheConfig(
diff --git a/vllm/_custom_ops.py b/vllm/_custom_ops.py
index a108542e1436..f07fa1e4e7be 100644
--- a/vllm/_custom_ops.py
+++ b/vllm/_custom_ops.py
@@ -1678,6 +1678,15 @@ def cp_gather_cache(src_cache: torch.Tensor,
                                            cu_seq_lens, batch_size, seq_starts)
 
 
+def indexer_k_quant_and_cache(k: torch.Tensor, kv_cache: torch.Tensor,
+                              slot_mapping: torch.Tensor,
+                              quant_block_size: int,
+                              kv_cache_dtype: str) -> None:
+    torch.ops._C_cache_ops.indexer_k_quant_and_cache(k, kv_cache, slot_mapping,
+                                                     quant_block_size,
+                                                     kv_cache_dtype)
+
+
 def get_device_attribute(attribute: int, device: int) -> int:
     return torch.ops._C_cuda_utils.get_device_attribute(attribute, device)
 
diff --git a/vllm/attention/backends/abstract.py b/vllm/attention/backends/abstract.py
index 629e42a8b902..b49e1c007c57 100644
--- a/vllm/attention/backends/abstract.py
+++ b/vllm/attention/backends/abstract.py
@@ -70,6 +70,7 @@ def get_kv_cache_shape(
         block_size: int,
         num_kv_heads: int,
         head_size: int,
+        cache_dtype_str: str = "auto",
     ) -> Tuple[int, ...]:
         raise NotImplementedError
 
diff --git a/vllm/attention/layer.py b/vllm/attention/layer.py
index 8cab8330a6cd..4ce6a864d7ad 100644
--- a/vllm/attention/layer.py
+++ b/vllm/attention/layer.py
@@ -94,6 +94,7 @@ def __init__(
         logits_soft_cap: Optional[float] = None,
         per_layer_sliding_window: Optional[int] = None,
         use_mla: bool = False,
+        use_sparse: bool = False,
         prefix: str = "",
         attn_type: str = AttentionType.DECODER,
         kv_sharing_target_layer_name: Optional[str] = None,
@@ -154,6 +155,7 @@ def __init__(
         self._o_scale_float: Optional[float] = None
 
         self.use_mla = use_mla
+        self.use_sparse = use_sparse
         self.num_heads = num_heads
         self.head_size = head_size
         self.num_kv_heads = num_kv_heads
@@ -186,7 +188,8 @@ def __init__(
                                                  kv_cache_dtype,
                                                  block_size,
                                                  use_mla=use_mla,
-                                                 has_sink=self.has_sink)
+                                                 has_sink=self.has_sink,
+                                                 use_sparse=use_sparse)
         else:
             self.attn_backend = attn_backend
 
diff --git a/vllm/attention/ops/common.py b/vllm/attention/ops/common.py
index c8efa6e63a2e..e659f1f3eae9 100644
--- a/vllm/attention/ops/common.py
+++ b/vllm/attention/ops/common.py
@@ -138,3 +138,208 @@ def cp_lse_ag_out_rs(cp_attn_out: torch.Tensor,
     out, _ = correct_attn_out(cp_attn_out, lses, cp_group.rank_in_group, ctx)
     out = cp_group.reduce_scatter(out, dim=1)
     return out
+
+
+@triton.jit
+def _pack_seq_kernel(
+        x_ptr,  # [N, D]
+        out_ptr,  # [B, Lmax, D]
+        lengths_ptr,  # *i32, [B]
+        N: tl.constexpr,
+        D: tl.constexpr,
+        Lmax: tl.constexpr,
+        PAD_VALUE: tl.constexpr,
+        BLOCK_T: tl.constexpr,  # timesteps per program
+        BLOCK_D: tl.constexpr  # features per program
+):
+    pid_b = tl.program_id(0)  # batch id
+    pid_t = tl.program_id(1)  # block over time dimension
+    pid_d = tl.program_id(2)  # block over feature dimension
+    off_t = pid_t * BLOCK_T + tl.arange(0, BLOCK_T)  # [BLOCK_T]
+    off_d = pid_d * BLOCK_D + tl.arange(0, BLOCK_D)  # [BLOCK_D]
+
+    # Compute start index and sequence length from cumulative lengths
+    in_start = 0
+    for i in range(pid_b):
+        in_start += tl.load(lengths_ptr + i)
+    seq_len = tl.load(lengths_ptr + pid_b)
+
+    # valid time positions for this block
+    t_mask = off_t < Lmax
+
+    # compute input row indices for valid (b, t)
+    in_row = in_start + off_t
+    valid_row = (off_t < seq_len) & t_mask
+
+    # Pointers
+    # x_ptr: row-major [N, D]
+    x_row_ptr = x_ptr + in_row[:, None] * D + off_d[None, :]
+
+    # out_ptr: row-major [B, Lmax, D]
+    out_row_ptr = out_ptr + (pid_b * Lmax + off_t)[:,
+                                                   None] * D + off_d[None, :]
+
+    # Initialize with PAD (cast will occur as needed based on out_ptr dtype)
+    d_mask = off_d[None, :] < D
+    pad_vals = tl.full([BLOCK_T, BLOCK_D], PAD_VALUE, tl.float32)
+    tl.store(out_row_ptr, pad_vals, mask=t_mask[:, None] & d_mask)
+
+    # Load & write only where within seq_len
+    x_vals = tl.load(x_row_ptr, mask=valid_row[:, None] & d_mask)
+    tl.store(out_row_ptr, x_vals, mask=valid_row[:, None] & d_mask)
+
+
+def pack_seq_triton(x: torch.Tensor,
+                    lengths: torch.Tensor,
+                    pad_value: float = -float('inf'),
+                    block_t: int = 64,
+                    block_d: int = 64) -> torch.Tensor:
+    """
+    Pack sequences of different lengths into a batched tensor.
+    
+    Args:
+        x: [N, ...] - input tensor where N is total number of tokens
+        lengths: [B] - sequence lengths for each batch
+        pad_value: value to use for padding
+        block_t: block size for time dimension
+        block_d: block size for feature dimension
+        
+    Returns:
+        packed: [B, Lmax, ...] - packed tensor
+    """
+
+    # Handle multi-dimensional input by reshaping to (N, -1)
+    original_shape = x.shape
+    if len(original_shape) > 2:
+        N = original_shape[0]
+        x_reshaped = x.reshape(N, -1)
+        D = x_reshaped.shape[1]
+    else:
+        N, D = x.shape
+        x_reshaped = x
+
+    B = lengths.numel()
+    Lmax = int(lengths.max().item())
+
+    # Starts are computed inside the kernel from lengths
+
+    out = torch.empty((B, Lmax, D), device=x.device, dtype=x.dtype)
+
+    grid = (B, triton.cdiv(Lmax, block_t), triton.cdiv(D, block_d))
+    _pack_seq_kernel[grid](x_reshaped,
+                           out,
+                           lengths.int(),
+                           N,
+                           D,
+                           Lmax,
+                           PAD_VALUE=float(pad_value),
+                           BLOCK_T=block_t,
+                           BLOCK_D=block_d,
+                           num_warps=4,
+                           num_stages=2)
+
+    # Reshape output back to original dimensions (except first dimension)
+    if len(original_shape) > 2:
+        output_shape = (B, Lmax) + original_shape[1:]
+        out = out.reshape(output_shape)
+
+    return out
+
+
+@triton.jit
+def _unpack_seq_triton_kernel(
+        packed_ptr,  # [B, Lmax, D]
+        out_ptr,  # [N, D]
+        lengths_ptr,  # *i32, [B]
+        B: tl.constexpr,
+        Lmax: tl.constexpr,
+        D: tl.constexpr,
+        BLOCK_T: tl.constexpr,  # timesteps per program
+        BLOCK_D: tl.constexpr  # features per program
+):
+    pid_b = tl.program_id(0)  # batch id
+    pid_t = tl.program_id(1)  # block over time dimension
+    pid_d = tl.program_id(2)  # block over feature dimension
+    off_t = pid_t * BLOCK_T + tl.arange(0, BLOCK_T)  # [BLOCK_T]
+    off_d = pid_d * BLOCK_D + tl.arange(0, BLOCK_D)  # [BLOCK_D]
+
+    # bounds: compute start from cumulative lengths
+    in_start = 0
+    for i in range(pid_b):
+        in_start += tl.load(lengths_ptr + i)
+    seq_len = tl.load(lengths_ptr + pid_b)
+
+    # valid time positions for this block
+    t_mask = off_t < Lmax
+    valid_row = (off_t < seq_len) & t_mask
+
+    # compute output row indices for valid (b, t)
+    out_row = in_start + off_t
+
+    # Pointers
+    # packed_ptr: row-major [B, Lmax, D]
+    packed_row_ptr = packed_ptr + (pid_b * Lmax +
+                                   off_t)[:, None] * D + off_d[None, :]
+
+    # out_ptr: row-major [N, D]
+    out_row_ptr = out_ptr + out_row[:, None] * D + off_d[None, :]
+
+    # Load from packed tensor and store to output
+    d_mask = off_d[None, :] < D
+    packed_vals = tl.load(packed_row_ptr, mask=valid_row[:, None] & d_mask)
+    tl.store(out_row_ptr, packed_vals, mask=valid_row[:, None] & d_mask)
+
+
+def unpack_seq_triton(packed_tensor: torch.Tensor,
+                      lengths: torch.Tensor,
+                      block_t: int = 64,
+                      block_d: int = 64) -> torch.Tensor:
+    """
+    Unpack a packed decode query tensor back to the original format.
+    Efficient Triton implementation.
+    
+    Args:
+        packed_tensor: [B, Lmax, ...] - packed tensor from pack_seq_triton
+        lengths: [B] - sequence lengths for each batch
+        block_t: block size for time dimension
+        block_d: block size for feature dimension
+        
+    Returns:
+        unpacked_tensor: [N, ...] where N = sum(lengths)
+    """
+
+    # Handle multi-dimensional input by reshaping to (B, Lmax, -1)
+    original_shape = packed_tensor.shape
+    if len(original_shape) > 3:
+        B, Lmax = original_shape[:2]
+        packed_reshaped = packed_tensor.reshape(B, Lmax, -1)
+        D = packed_reshaped.shape[2]
+    else:
+        B, Lmax, D = packed_tensor.shape
+        packed_reshaped = packed_tensor
+
+    # Calculate total number of elements
+    N = int(lengths.sum().item())
+
+    out = torch.empty((N, D),
+                      device=packed_tensor.device,
+                      dtype=packed_tensor.dtype)
+
+    grid = (B, triton.cdiv(Lmax, block_t), triton.cdiv(D, block_d))
+    _unpack_seq_triton_kernel[grid](packed_reshaped,
+                                    out,
+                                    lengths.int(),
+                                    B,
+                                    Lmax,
+                                    D,
+                                    BLOCK_T=block_t,
+                                    BLOCK_D=block_d,
+                                    num_warps=4,
+                                    num_stages=2)
+
+    # Reshape output back to original dimensions (except first dimension)
+    if len(original_shape) > 3:
+        output_shape = (N, ) + original_shape[2:]
+        out = out.reshape(output_shape)
+
+    return out
diff --git a/vllm/attention/ops/flashmla.py b/vllm/attention/ops/flashmla.py
index 2c3e8c42400c..3cc0e4adfa0a 100644
--- a/vllm/attention/ops/flashmla.py
+++ b/vllm/attention/ops/flashmla.py
@@ -19,6 +19,15 @@
 else:
     _flashmla_C_AVAILABLE = False
 
+if current_platform.is_cuda():
+    try:
+        import vllm._flashmla_extension_C  # noqa: F401
+        _flashmla_extension_C_AVAILABLE = True
+    except ImportError:
+        _flashmla_extension_C_AVAILABLE = False
+else:
+    _flashmla_extension_C_AVAILABLE = False
+
 
 def is_flashmla_supported() -> Tuple[bool, Optional[str]]:
     """
@@ -37,24 +46,34 @@ def is_flashmla_supported() -> Tuple[bool, Optional[str]]:
 
 
 def get_mla_metadata(
-    cache_seqlens: torch.Tensor,
-    num_heads_per_head_k: int,
-    num_heads_k: int,
-) -> Tuple[torch.Tensor, torch.Tensor]:
+        cache_seqlens: torch.Tensor,
+        num_q_tokens_per_head_k: int,
+        num_heads_k: int,
+        num_heads_q: Optional[int] = None,
+        is_fp8_kvcache: bool = False,
+        topk: Optional[int] = None) -> Tuple[torch.Tensor, torch.Tensor]:
     """
     Arguments:
-        cache_seqlens: (batch_size), dtype torch.int32.
-        num_heads_per_head_k: Equals to seq_len_q * num_heads_q // num_heads_k.
-        num_heads_k: num_heads_k.
-
-    Return:
-        tile_scheduler_metadata: (num_sm_parts, TileSchedulerMetaDataSize), 
-                                 dtype torch.int32.
-        num_splits: (batch_size + 1), dtype torch.int32.
+    - cache_seqlens: (batch_size), dtype torch.int32.
+    - num_q_tokens_per_head_k: 
+            Equals to num_q_tokens_per_q_seq * num_heads_q // num_heads_k.
+    - num_heads_k: The number of k heads.
+    - num_heads_q: 
+            The number of q heads. 
+            This argument is optional when sparse attention is not enabled
+    - is_fp8_kvcache: Whether the k_cache and v_cache are in fp8 format.
+    - topk: If not None, sparse attention will be enabled, 
+            and only tokens in the `indices` array 
+            passed to `flash_mla_with_kvcache_sm90` will be attended to.
+
+    Returns:
+    - tile_scheduler_metadata: 
+            (num_sm_parts, TileSchedulerMetaDataSize), dtype torch.int32.
+    - num_splits: (batch_size + 1), dtype torch.int32.
     """
-    return torch.ops._flashmla_C.get_mla_metadata(cache_seqlens,
-                                                  num_heads_per_head_k,
-                                                  num_heads_k)
+    return torch.ops._flashmla_C.get_mla_decoding_metadata(
+        cache_seqlens, num_q_tokens_per_head_k, num_heads_k, num_heads_q,
+        is_fp8_kvcache, topk)
 
 
 def flash_mla_with_kvcache(
@@ -69,45 +88,95 @@ def flash_mla_with_kvcache(
     causal: bool = False,
     descale_q: Optional[torch.Tensor] = None,
     descale_k: Optional[torch.Tensor] = None,
+    is_fp8_kvcache: bool = False,
+    indices: Optional[torch.Tensor] = None,
 ) -> Tuple[torch.Tensor, torch.Tensor]:
     """
     Arguments:
-        q: (batch_size, seq_len_q, num_heads_q, head_dim).
-        k_cache: (num_blocks, page_block_size, num_heads_k, head_dim).
-        block_table: (batch_size, max_num_blocks_per_seq), torch.int32.
-        cache_seqlens: (batch_size), torch.int32.
-        head_dim_v: Head_dim of v.
-        tile_scheduler_metadata: (num_sm_parts, TileSchedulerMetaDataSize), 
-                                 torch.int32, return by get_mla_metadata.
-        num_splits: (batch_size + 1), torch.int32, return by get_mla_metadata.
-        softmax_scale: float. The scaling of QK^T before applying softmax. 
-                       Default to 1 / sqrt(head_dim).
-        causal: bool. Whether to apply causal attention mask.
-        descale_q: (batch_size), torch.float32. Descaling factors for Q.
-        descale_k: (batch_size), torch.float32. Descaling factors for K.
-
-    Return:
-        out: (batch_size, seq_len_q, num_heads_q, head_dim_v).
-        softmax_lse: (batch_size, num_heads_q, seq_len_q), torch.float32.
+    - q: (batch_size, seq_len_q, num_heads_q, head_dim).
+    - k_cache: (num_blocks, page_block_size, num_heads_k, head_dim).
+    - block_table: (batch_size, max_num_blocks_per_seq), torch.int32.
+    - cache_seqlens: (batch_size), torch.int32.
+    - head_dim_v: Head dimension of v.
+    - tile_scheduler_metadata: 
+        (num_sm_parts, TileSchedulerMetaDataSize), torch.int32, 
+        returned by get_mla_metadata.
+    - num_splits: 
+        (batch_size + 1), torch.int32, returned by get_mla_metadata.
+    - softmax_scale: float. 
+        The scale of QK^T before applying softmax. 
+        Default to 1 / sqrt(head_dim).
+    - causal: bool. Whether to apply causal attention mask.
+    - descale_q: (batch_size), 
+        torch.float32. Descaling factors for Q, used for fp8 quantization.
+    - descale_k: (batch_size), 
+        torch.float32. Descaling factors for K, used for fp8 quantization.
+    - is_fp8_kvcache: bool. 
+        Whether the k_cache and v_cache are in fp8 format. 
+        For the format of FP8 KV cache, please refer to README.md
+    - indices: (batch_size, seq_len_q, topk), torch.int32. 
+        If not None, sparse attention will be enabled, 
+        and only tokens in the `indices` array will be attended to. 
+        Invalid indices should be set to -1 or numbers >= total_seq_len_kv. 
+        For details about how to set up `indices`, please refer to README.md.
+
+    Returns:
+    - out: (batch_size, seq_len_q, num_heads_q, head_dim_v).
+    - softmax_lse: (batch_size, num_heads_q, seq_len_q), torch.float32.
     """
     if softmax_scale is None:
         softmax_scale = q.shape[-1]**(-0.5)
-    out, softmax_lse = torch.ops._flashmla_C.fwd_kvcache_mla(
-        q,
-        k_cache,
-        head_dim_v,
-        cache_seqlens,
-        block_table,
-        softmax_scale,
-        causal,
-        tile_scheduler_metadata,
-        num_splits,
-        descale_q,
-        descale_k,
-    )
-
-    # Note(hc): need revisit when we support DCP with decode query_len > 1.
-    return out.squeeze(1), softmax_lse.squeeze(-1)
+    if indices is not None:
+        # NOTE (zyongye): sparse attention is also causal
+        # since it only attend to the tokens before
+        # but here `causal` should not be specified
+        assert not causal, \
+            "causal must be `false` if sparse attention is enabled."
+    assert (descale_q is None) == (
+        descale_k is None
+    ), "descale_q and descale_k should be both None or both not None"
+
+    if (descale_q is not None) and (descale_k is not None):
+        out, softmax_lse = torch.ops._flashmla_extension_C.fwd_kvcache_mla_fp8(
+            q, k_cache, head_dim_v, cache_seqlens, block_table, softmax_scale,
+            causal, tile_scheduler_metadata, num_splits, descale_q, descale_k)
+    else:
+        out, softmax_lse = torch.ops._flashmla_C.fwd_kvcache_mla(
+            q, k_cache, head_dim_v, cache_seqlens, block_table, softmax_scale,
+            causal, tile_scheduler_metadata, num_splits, is_fp8_kvcache,
+            indices)
+    return out, softmax_lse
+
+
+def flash_mla_sparse_prefill(
+    q: torch.Tensor,
+    kv: torch.Tensor,
+    indices: torch.Tensor,
+    sm_scale: float,
+    d_v: int = 512,
+) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
+    """
+    Sparse attention prefill kernel
+
+    Args:
+    - q: [s_q, h_q, d_qk], bfloat16
+    - kv: [s_kv, h_kv, d_qk], bfloat16
+    - indices: [s_q, h_kv, topk], int32. 
+        Invalid indices should be set to -1 or numbers >= s_kv
+    - sm_scale: float
+    - d_v: The dimension of value vectors. Can only be 512
+
+    Returns:
+    - (output, max_logits, lse)
+        About the definition of output, 
+        max_logits and lse, please refer to README.md
+    - output: [s_q, h_q, d_v], bfloat16
+    - max_logits:  [s_q, h_q], float
+    - lse: [s_q, h_q], float, 2-based log-sum-exp
+    """
+    results = torch.ops._flashmla_C.sparse_prefill_fwd(q, kv, indices,
+                                                       sm_scale, d_v)
+    return results
 
 
 #
diff --git a/vllm/attention/ops/paged_attn.py b/vllm/attention/ops/paged_attn.py
index 4d870a45e580..539b57e41de7 100644
--- a/vllm/attention/ops/paged_attn.py
+++ b/vllm/attention/ops/paged_attn.py
@@ -50,6 +50,7 @@ def get_kv_cache_shape(
         block_size: int,
         num_kv_heads: int,
         head_size: int,
+        cache_dtype_str: str = "auto",
     ) -> Tuple[int, ...]:
         return (2, num_blocks, block_size * num_kv_heads * head_size)
 
diff --git a/vllm/attention/selector.py b/vllm/attention/selector.py
index bd83473db6f3..6f048e589f7f 100644
--- a/vllm/attention/selector.py
+++ b/vllm/attention/selector.py
@@ -144,6 +144,7 @@ def get_attn_backend(
     block_size: int,
     use_mla: bool = False,
     has_sink: bool = False,
+    use_sparse: bool = False,
 ) -> type[AttentionBackend]:
     """Selects which attention backend to use and lazily imports it."""
     # Accessing envs.* behind an @lru_cache decorator can cause the wrong
@@ -158,6 +159,7 @@ def get_attn_backend(
         use_v1=envs.VLLM_USE_V1,
         use_mla=use_mla,
         has_sink=has_sink,
+        use_sparse=use_sparse,
     )
 
 
@@ -170,6 +172,7 @@ def _cached_get_attn_backend(
     use_v1: bool = False,
     use_mla: bool = False,
     has_sink: bool = False,
+    use_sparse: bool = False,
 ) -> type[AttentionBackend]:
 
     # Check whether a particular choice of backend was
@@ -203,7 +206,7 @@ def _cached_get_attn_backend(
     # get device-specific attn_backend
     attention_cls = current_platform.get_attn_backend_cls(
         selected_backend, head_size, dtype, kv_cache_dtype, block_size, use_v1,
-        use_mla, has_sink)
+        use_mla, has_sink, use_sparse)
     if not attention_cls:
         raise ValueError(
             f"Invalid attention backend for {current_platform.device_name}")
diff --git a/vllm/config/cache.py b/vllm/config/cache.py
index 4c4e39c37ee5..58770649a8af 100644
--- a/vllm/config/cache.py
+++ b/vllm/config/cache.py
@@ -22,7 +22,8 @@
 logger = init_logger(__name__)
 
 BlockSize = Literal[1, 8, 16, 32, 64, 128]
-CacheDType = Literal["auto", "fp8", "fp8_e4m3", "fp8_e5m2", "fp8_inc"]
+CacheDType = Literal["auto", "bfloat16", "fp8", "fp8_e4m3", "fp8_e5m2",
+                     "fp8_inc"]
 MambaDType = Literal["auto", "float32"]
 PrefixCachingHashAlgo = Literal["sha256", "sha256_cbor"]
 
@@ -52,7 +53,11 @@ class CacheConfig:
     cache_dtype: CacheDType = "auto"
     """Data type for kv cache storage. If "auto", will use model data type.
     CUDA 11.8+ supports fp8 (=fp8_e4m3) and fp8_e5m2. ROCm (AMD GPU) supports
-    fp8 (=fp8_e4m3). Intel Gaudi (HPU) supports fp8 (using fp8_inc)."""
+    fp8 (=fp8_e4m3). Intel Gaudi (HPU) supports fp8 (using fp8_inc).
+    Some models (namely DeepSeekV3.2) default to fp8, set to bfloat16 to use
+    bfloat16 instead, this is an invalid option for models that do not default
+    to fp8.
+    """
     is_attention_free: bool = False
     """Whether the model is attention-free. This is primarily set in
     `ModelConfig` and that value should be manually duplicated here."""
@@ -171,11 +176,12 @@ def _verify_cache_dtype(self) -> None:
         if self.cache_dtype == "auto":
             pass
         elif self.cache_dtype in get_args(CacheDType):
-            logger.info(
-                "Using fp8 data type to store kv cache. It reduces the GPU "
-                "memory footprint and boosts the performance. "
-                "Meanwhile, it may cause accuracy drop without a proper "
-                "scaling factor.")
+            if self.cache_dtype.startswith("fp8"):
+                logger.info(
+                    "Using fp8 data type to store kv cache. It reduces the GPU "
+                    "memory footprint and boosts the performance. "
+                    "Meanwhile, it may cause accuracy drop without a proper "
+                    "scaling factor.")
         else:
             raise ValueError(f"Unknown kv cache dtype: {self.cache_dtype}")
 
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index df08fa20e0cf..ce173edb4b94 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -374,6 +374,7 @@ class CompilationConfig:
         "vllm.linear_attention",
         "vllm.plamo2_mamba_mixer",
         "vllm.gdn_attention",
+        "vllm.sparse_attn_indexer",
     ]
 
     def compute_hash(self) -> str:
diff --git a/vllm/config/model.py b/vllm/config/model.py
index 28af82de7722..c1392318dd8e 100644
--- a/vllm/config/model.py
+++ b/vllm/config/model.py
@@ -1082,14 +1082,14 @@ def is_deepseek_mla(self) -> bool:
         if not hasattr(self.hf_text_config, "model_type"):
             return False
         elif self.hf_text_config.model_type in \
-            ('deepseek_v2', 'deepseek_v3', 'deepseek_mtp',
+            ('deepseek_v2', 'deepseek_v3', 'deepseek_v32', 'deepseek_mtp',
               'kimi_k2', 'longcat_flash'):
             return self.hf_text_config.kv_lora_rank is not None
         elif self.hf_text_config.model_type == 'eagle':
             # if the model is an EAGLE module, check for the
             # underlying architecture
             return self.hf_text_config.model.model_type in \
-                    ('deepseek_v2', 'deepseek_v3') \
+                    ('deepseek_v2', 'deepseek_v3', 'deepseek_v32') \
                 and self.hf_text_config.kv_lora_rank is not None
         return False
 
diff --git a/vllm/config/speculative.py b/vllm/config/speculative.py
index cb4f0ae2cee0..f684e4e4ccd4 100644
--- a/vllm/config/speculative.py
+++ b/vllm/config/speculative.py
@@ -145,7 +145,7 @@ def compute_hash(self) -> str:
 
     @staticmethod
     def hf_config_override(hf_config: PretrainedConfig) -> PretrainedConfig:
-        if hf_config.model_type == "deepseek_v3":
+        if hf_config.model_type in ("deepseek_v3", "deepseek_v32"):
             hf_config.model_type = "deepseek_mtp"
         if hf_config.model_type == "deepseek_mtp":
             n_predict = getattr(hf_config, "num_nextn_predict_layers", None)
diff --git a/vllm/model_executor/layers/layernorm.py b/vllm/model_executor/layers/layernorm.py
index 8123259d037b..363245daa89d 100644
--- a/vllm/model_executor/layers/layernorm.py
+++ b/vllm/model_executor/layers/layernorm.py
@@ -5,6 +5,7 @@
 
 import torch
 import torch.nn as nn
+import torch.nn.functional as F
 
 import vllm.envs as envs
 from vllm.model_executor.custom_op import CustomOp
@@ -375,3 +376,20 @@ def forward_cuda(
         x: torch.Tensor,
     ) -> torch.Tensor:
         return poly_norm(x, self.weight, self.bias, self.variance_epsilon)
+
+
+class LayerNorm(nn.Module):
+    """
+    Layer Normalization.
+    """
+
+    def __init__(self, dim: int, eps: float = 1e-6):
+        super().__init__()
+        self.dim = dim
+        self.eps = eps
+        self.weight = nn.Parameter(torch.ones(dim, dtype=torch.float32))
+        self.bias = nn.Parameter(torch.zeros(dim, dtype=torch.float32))
+
+    def forward(self, x: torch.Tensor):
+        return F.layer_norm(x.float(), (self.dim, ), self.weight, self.bias,
+                            self.eps).type_as(x)
diff --git a/vllm/model_executor/layers/mla.py b/vllm/model_executor/layers/mla.py
index 9782b37c321f..66bf3823e191 100644
--- a/vllm/model_executor/layers/mla.py
+++ b/vllm/model_executor/layers/mla.py
@@ -24,6 +24,9 @@ class MLAModules:
     q_a_layernorm: Optional[torch.nn.Module]
     q_b_proj: Optional[torch.nn.Module]
     q_proj: Optional[torch.nn.Module]
+    indexer: Optional[torch.nn.Module]
+    is_sparse: bool
+    topk_indices_buffer: Optional[torch.Tensor]
 
 
 @CustomOp.register("multi_head_latent_attention")
@@ -76,6 +79,13 @@ def __init__(
         self.kv_b_proj = mla_modules.kv_b_proj
         self.rotary_emb = mla_modules.rotary_emb
         self.o_proj = mla_modules.o_proj
+        self.indexer = mla_modules.indexer
+        self.is_sparse = mla_modules.is_sparse
+
+        if self.indexer is not None:
+            assert hasattr(self.indexer, "topk_tokens")
+            self.topk_tokens = self.indexer.topk_tokens
+            self.topk_indices_buffer = mla_modules.topk_indices_buffer
 
         # In the MLA backend, kv_cache includes both k_c and
         # pe (i.e. decoupled position embeddings). In particular,
@@ -92,6 +102,7 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.attn",
             use_mla=True,
+            use_sparse=mla_modules.is_sparse,
             # MLA Args
             q_lora_rank=self.q_lora_rank,
             kv_lora_rank=self.kv_lora_rank,
@@ -100,6 +111,7 @@ def __init__(
             qk_head_dim=self.qk_head_dim,
             v_head_dim=self.v_head_dim,
             kv_b_proj=self.kv_b_proj,
+            indexer=self.indexer,
         )
 
         self.prefix = prefix
@@ -145,6 +157,10 @@ def forward_native(
         q[..., self.qk_nope_head_dim:], k_pe = self.rotary_emb(
             positions, q[..., self.qk_nope_head_dim:], k_pe)
 
+        if self.indexer and self.is_sparse:
+            _topk_indices = self.indexer(hidden_states, q_c, positions,
+                                         self.rotary_emb)
+
         attn_out = self.mla_attn(
             q,
             kv_c_normed,
diff --git a/vllm/model_executor/models/config.py b/vllm/model_executor/models/config.py
index cab85ea347f4..589ca0069034 100644
--- a/vllm/model_executor/models/config.py
+++ b/vllm/model_executor/models/config.py
@@ -346,8 +346,7 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
             block_size=1,
             num_kv_heads=model_config.get_num_kv_heads(parallel_config),
             head_size=model_config.get_head_size(),
-            dtype=kv_cache_dtype,
-            use_mla=model_config.use_mla).page_size_bytes
+            dtype=kv_cache_dtype).page_size_bytes
 
         model_cls, _ = ModelRegistry.resolve_model_cls(
             model_config.architecture,
@@ -401,6 +400,31 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
                 "exactly equal.", mamba_padding_pct)
 
 
+class DeepseekV3ForCausalLM(VerifyAndUpdateConfig):
+
+    @classmethod
+    def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
+        """
+        Updated fp8 cache to custom "fp8_ds_mla" format for DeepSeekV32
+        """
+        hf_config = vllm_config.model_config.hf_config
+
+        is_v32 = hasattr(hf_config, "index_topk")
+
+        if is_v32:
+            # For DeepSeekV3.2, we use a custom fp8 format as default (i.e.
+            #   "auto")
+            cache_config = vllm_config.cache_config
+            if cache_config.cache_dtype == "auto" or \
+                cache_config.cache_dtype.startswith("fp8"):
+                cache_config.cache_dtype = "fp8_ds_mla"
+                logger.info(
+                    "Using custom fp8 kv-cache format for DeepSeekV3.2")
+            if cache_config.cache_dtype == "bfloat16":
+                cache_config.cache_dtype = "auto"
+                logger.info("Using bfloat16 kv-cache for DeepSeekV3.2")
+
+
 MODELS_CONFIG_MAP: dict[str, type[VerifyAndUpdateConfig]] = {
     "GteModel": SnowflakeGteNewModelConfig,
     "GteNewModel": GteNewModelConfig,
@@ -417,4 +441,5 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
     "MambaForCausalLM": MambaModelConfig,
     "Mamba2ForCausalLM": MambaModelConfig,
     "FalconMambaForCausalLM": MambaModelConfig,
+    "DeepseekV3ForCausalLM": DeepseekV3ForCausalLM,
 }
diff --git a/vllm/model_executor/models/deepseek_mtp.py b/vllm/model_executor/models/deepseek_mtp.py
index a4623ff13cec..788e561ac394 100644
--- a/vllm/model_executor/models/deepseek_mtp.py
+++ b/vllm/model_executor/models/deepseek_mtp.py
@@ -53,8 +53,20 @@ def __init__(self, vllm_config: VllmConfig, prefix: str) -> None:
         self.eh_proj = nn.Linear(config.hidden_size * 2,
                                  config.hidden_size,
                                  bias=False)
+
+        self.is_v32 = hasattr(config, "index_topk")
+        if self.is_v32:
+            topk_tokens = config.index_topk
+            topk_indices_buffer = torch.empty(
+                vllm_config.scheduler_config.max_num_batched_tokens,
+                topk_tokens,
+                dtype=torch.int32,
+                device="cuda")
+        else:
+            topk_indices_buffer = None
         self.shared_head = SharedHead(config=config, quant_config=quant_config)
-        self.mtp_block = DeepseekV2DecoderLayer(vllm_config, prefix)
+        self.mtp_block = DeepseekV2DecoderLayer(vllm_config, prefix,
+                                                topk_indices_buffer)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/deepseek_v2.py b/vllm/model_executor/models/deepseek_v2.py
index 2e0bcbe5d2e5..03c43654d68f 100644
--- a/vllm/model_executor/models/deepseek_v2.py
+++ b/vllm/model_executor/models/deepseek_v2.py
@@ -33,15 +33,21 @@
 from transformers import DeepseekV2Config, DeepseekV3Config
 
 from vllm.attention import Attention
+from vllm.attention.backends.abstract import AttentionBackend
+from vllm.attention.ops.common import pack_seq_triton, unpack_seq_triton
 from vllm.compilation.decorators import support_torch_compile
-from vllm.config import CacheConfig, ParallelConfig, VllmConfig
+from vllm.config import (CacheConfig, ParallelConfig, VllmConfig,
+                         get_current_vllm_config)
 from vllm.distributed import (get_ep_group, get_pp_group,
                               get_tensor_model_parallel_rank,
                               get_tensor_model_parallel_world_size,
                               tensor_model_parallel_all_gather)
+from vllm.forward_context import get_forward_context
+from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import SiluAndMul
+from vllm.model_executor.layers.attention_layer_base import AttentionLayerBase
 from vllm.model_executor.layers.fused_moe import FusedMoE
-from vllm.model_executor.layers.layernorm import RMSNorm
+from vllm.model_executor.layers.layernorm import LayerNorm, RMSNorm
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
                                                MergedColumnParallelLinear,
                                                ReplicatedLinear,
@@ -49,6 +55,8 @@
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.mla import MLAModules, MultiHeadLatentAttention
 from vllm.model_executor.layers.quantization import QuantizationConfig
+from vllm.model_executor.layers.quantization.utils.fp8_utils import (
+    per_token_group_quant_fp8)
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.shared_fused_moe import SharedFusedMoE
 from vllm.model_executor.layers.vocab_parallel_embedding import (
@@ -56,13 +64,26 @@
 from vllm.model_executor.model_loader.weight_utils import (
     default_weight_loader, maybe_remap_kv_scale_name)
 from vllm.model_executor.models.utils import sequence_parallel_chunk
+from vllm.platforms import current_platform
 from vllm.sequence import IntermediateTensors
+from vllm.utils import cdiv, direct_register_custom_op
+from vllm.utils.deep_gemm import fp8_mqa_logits, fp8_paged_mqa_logits
+from vllm.v1.attention.backends.mla.indexer import (DeepseekV32IndexerBackend,
+                                                    DeepseekV32IndexerMetadata)
+from vllm.v1.kv_cache_interface import KVCacheSpec, MLAAttentionSpec
 
 from .interfaces import MixtureOfExperts, SupportsLoRA, SupportsPP
 from .utils import (PPMissingLayer, is_pp_missing_parameter,
                     make_empty_intermediate_tensors_factory, make_layers,
                     maybe_prefix)
 
+if current_platform.is_cuda_alike():
+    from vllm import _custom_ops as ops
+elif current_platform.is_xpu():
+    from vllm._ipex_ops import ipex_ops as ops
+
+logger = init_logger(__name__)
+
 
 class DeepseekV2MLP(nn.Module):
 
@@ -276,6 +297,7 @@ class DeepseekV2Attention(nn.Module):
 
     def __init__(
         self,
+        vllm_config: VllmConfig,
         config: Union[DeepseekV2Config, DeepseekV3Config],
         hidden_size: int,
         num_heads: int,
@@ -289,6 +311,7 @@ def __init__(
         max_position_embeddings: int = 8192,
         cache_config: Optional[CacheConfig] = None,
         quant_config: Optional[QuantizationConfig] = None,
+        topk_indices_buffer: Optional[torch.Tensor] = None,
         prefix: str = "",
     ) -> None:
         super().__init__()
@@ -306,6 +329,8 @@ def __init__(
         self.scaling = self.qk_head_dim**-0.5
         self.rope_theta = rope_theta
         self.max_position_embeddings = max_position_embeddings
+        assert topk_indices_buffer is None, "topk_indices_buffer is not \
+        supported for DeepseekV2Attention"
 
         if self.q_lora_rank is not None:
             self.q_a_proj = ReplicatedLinear(self.hidden_size,
@@ -418,6 +443,391 @@ def forward(
         return output
 
 
+class DeepseekV32IndexerCache(torch.nn.Module, AttentionLayerBase):
+
+    def __init__(self, head_dim: int, dtype: torch.dtype, prefix: str,
+                 cache_config: CacheConfig):
+        super().__init__()
+        self.kv_cache = [torch.tensor([])]
+        self.head_dim = head_dim
+        self.prefix = prefix
+        self.cache_config = cache_config
+        self.dtype = dtype
+        compilation_config = get_current_vllm_config().compilation_config
+        if prefix in compilation_config.static_forward_context:
+            raise ValueError(f"Duplicate layer name: {prefix}")
+        compilation_config.static_forward_context[prefix] = self
+
+    def get_kv_cache_spec(self) -> KVCacheSpec:
+        return MLAAttentionSpec(  # Only has one vector instead of K + V
+            block_size=self.cache_config.block_size,
+            num_kv_heads=1,
+            head_size=self.head_dim,
+            dtype=self.dtype,
+        )
+
+    def forward(self):
+        ...
+
+    def get_attn_backend(self) -> AttentionBackend:
+        return DeepseekV32IndexerBackend
+
+
+@torch.inference_mode()
+def cp_gather_indexer_k_quant_cache(
+    kv_cache,  # [num_blocks, block_size, head_dim + 1]
+    dst_value,  # [cu_seq_lens[-1], head_dim]
+    dst_scale,  # [cu_seq_lens[-1], 4]
+    block_table,  # [batch_size, num_blocks]
+    cu_seq_lens,  # [batch_size + 1, ]
+    batch_size,
+):
+    num_blocks, block_size, _ = kv_cache.shape
+    head_dim = dst_value.shape[-1]
+    kv_cache = kv_cache.view(num_blocks, -1)
+
+    expected_value = []
+    expected_scale = []
+    for b in range(batch_size):
+        s = cu_seq_lens[b + 1] - cu_seq_lens[b]
+        if s == 0:
+            continue
+        tot = cdiv(s, block_size)
+        blocks = block_table[b, :tot]
+
+        value = []
+        scale = []
+        full_block = torch.arange(tot - 1,
+                                  device=kv_cache.device,
+                                  dtype=torch.int32)
+        non_remaining_value = kv_cache[blocks[full_block], :block_size *
+                                       head_dim].view(-1, head_dim)
+        non_remaining_scale = kv_cache[blocks[full_block],
+                                       block_size * head_dim:].view(-1, 4)
+
+        remaining = s - (tot - 1) * block_size
+
+        value = torch.cat([
+            non_remaining_value,
+            kv_cache[blocks[-1], :remaining * head_dim].view(-1, head_dim)
+        ],
+                          dim=0)
+        scale = torch.cat([
+            non_remaining_scale,
+            kv_cache[blocks[-1], block_size * head_dim:block_size * head_dim +
+                     remaining * 4].view(-1, 4)
+        ],
+                          dim=0)
+
+        expected_value.append(value)
+        expected_scale.append(scale)
+
+    gather_value = torch.cat(expected_value, dim=0).view(-1, head_dim)
+    gather_scale = torch.cat(expected_scale, dim=0).view(-1, 4)
+    gather_value = gather_value.view(torch.float8_e4m3fn)
+    gather_scale = gather_scale.view(torch.float32)
+    dst_value.copy_(gather_value)
+    dst_scale.copy_(gather_scale)
+
+
+def sparse_attn_indexer(
+    hidden_states: torch.Tensor,
+    k_cache_prefix: str,
+    kv_cache: torch.Tensor,
+    q_fp8: torch.Tensor,
+    k: torch.Tensor,
+    weights: torch.Tensor,
+    quant_block_size: int,
+    scale_fmt: Optional[str],
+    topk_tokens: int,
+    head_dim: int,
+    max_model_len: int,
+    total_seq_lens: int,
+    topk_indices_buffer: Optional[torch.Tensor],
+) -> torch.Tensor:
+
+    # careful! this will be None in dummy run
+    attn_metadata = get_forward_context().attn_metadata
+    # assert isinstance(attn_metadata, dict)
+    if not isinstance(attn_metadata, dict):
+        return sparse_attn_indexer_fake(
+            hidden_states,
+            k_cache_prefix,
+            kv_cache,
+            q_fp8,
+            k,
+            weights,
+            quant_block_size,
+            scale_fmt,
+            topk_tokens,
+            head_dim,
+            max_model_len,
+            total_seq_lens,
+            topk_indices_buffer,
+        )
+    attn_metadata = attn_metadata[k_cache_prefix]
+    assert isinstance(attn_metadata, DeepseekV32IndexerMetadata)
+    slot_mapping = attn_metadata.slot_mapping
+    has_decode = attn_metadata.num_decodes > 0
+    has_prefill = attn_metadata.num_prefills > 0
+    num_decode_tokens = attn_metadata.num_decode_tokens
+
+    ops.indexer_k_quant_and_cache(
+        k,
+        kv_cache,
+        slot_mapping,
+        quant_block_size,
+        scale_fmt,
+    )
+
+    topk_indices_buffer[:hidden_states.shape[0]] = -1
+    if has_prefill:
+        prefill_metadata = attn_metadata.prefill
+        num_prefills = attn_metadata.num_prefills
+        k_fp8 = torch.empty([prefill_metadata.total_seq_lens, head_dim],
+                            device=k.device,
+                            dtype=torch.float8_e4m3fn)
+        k_scale = torch.empty([prefill_metadata.total_seq_lens, 1],
+                              device=k.device,
+                              dtype=torch.float32)
+        cp_gather_indexer_k_quant_cache(
+            kv_cache,
+            k_fp8,
+            k_scale,
+            prefill_metadata.block_table,
+            prefill_metadata.cu_seq_lens,
+            num_prefills,
+        )
+        cu_seqlen_ks = prefill_metadata.cu_seqlen_ks
+        cu_seqlen_ke = prefill_metadata.cu_seqlen_ke
+        num_tokens = attn_metadata.num_actual_tokens
+        logits = fp8_mqa_logits(
+            q_fp8[num_decode_tokens:num_tokens],
+            (k_fp8, k_scale),
+            weights[num_decode_tokens:num_tokens],
+            cu_seqlen_ks,
+            cu_seqlen_ke,
+        )
+        topk_indices = logits.topk(min(topk_tokens, logits.shape[-1]),
+                                   dim=-1)[1]
+        topk_indices -= cu_seqlen_ks[:, None]
+        mask_lo = topk_indices >= 0
+        mask_hi = topk_indices - (cu_seqlen_ke - cu_seqlen_ks)[:, None] < 0
+        mask = torch.full_like(topk_indices,
+                               False,
+                               dtype=torch.bool,
+                               device=topk_indices.device)
+        mask = mask_lo & mask_hi
+        topk_indices = topk_indices.masked_fill(~mask, -1)
+        topk_indices_buffer[num_decode_tokens:num_tokens, :topk_indices.
+                            shape[-1]] = topk_indices.to(dtype=torch.int32)
+
+    if has_decode:
+        decode_metadata = attn_metadata.decode
+        # kv_cache size requirement [num_block, block_size, n_head, head_dim],
+        # we only have [num_block, block_size, head_dim],
+        kv_cache = kv_cache.unsqueeze(-2)
+        decode_lens = decode_metadata.decode_lens
+        if decode_metadata.requires_padding:
+            # pad in edge case where we have short chunked prefill length <
+            # decode_threshold since we unstrictly split
+            # prefill and decode by decode_threshold
+            # (currently set to 1 + speculative tokens)
+            padded_q_fp8_decode_tokens = pack_seq_triton(
+                q_fp8[:num_decode_tokens], decode_lens)
+        else:
+            padded_q_fp8_decode_tokens = q_fp8[:num_decode_tokens].reshape(
+                decode_lens.shape[0], -1, *q_fp8.shape[1:])
+        # TODO: move and optimize below logic with triton kernels
+        batch_size = padded_q_fp8_decode_tokens.shape[0]
+        next_n = padded_q_fp8_decode_tokens.shape[1]
+        assert batch_size == decode_metadata.seq_lens.shape[0]
+        num_padded_tokens = batch_size * next_n
+        logits = fp8_paged_mqa_logits(
+            padded_q_fp8_decode_tokens,
+            kv_cache,
+            weights[:num_padded_tokens],
+            decode_metadata.seq_lens,
+            decode_metadata.block_table,
+            decode_metadata.schedule_metadata,
+            max_model_len=max_model_len,
+        )
+        # padded query len
+        current_device = padded_q_fp8_decode_tokens.device
+        padded_num_tokens = batch_size * next_n
+        positions = torch.arange(max_model_len,
+                                 device=current_device).unsqueeze(0).expand(
+                                     batch_size * next_n, -1)
+        row_indices = torch.arange(padded_num_tokens,
+                                   device=current_device) // next_n
+        next_n_offset = torch.arange(
+            padded_num_tokens,
+            device=padded_q_fp8_decode_tokens.device) % next_n
+        index_end_pos = (decode_metadata.seq_lens[row_indices] - next_n +
+                         next_n_offset).unsqueeze(1)
+        # index_end_pos: [B * N, 1]
+        mask = positions <= index_end_pos
+        # mask: [B * N, L]
+        logits = logits.masked_fill(~mask, float('-inf'))
+        topk_indices = logits.topk(topk_tokens,
+                                   dim=-1)[1].to(torch.int32)  # [B * N, K]
+        # ensure we don't set indices for the top k
+        # that is out of range(masked already)
+        # this will happen if context length is shorter than K
+        topk_indices[topk_indices > index_end_pos] = -1
+        if decode_metadata.requires_padding:
+            # if padded, we need to unpack
+            # the topk indices removing padded tokens
+            topk_indices = unpack_seq_triton(
+                topk_indices.reshape(batch_size, -1, topk_indices.shape[-1]),
+                decode_lens)
+        topk_indices_buffer[:num_decode_tokens, :topk_indices.
+                            shape[-1]] = topk_indices.to(dtype=torch.int32)
+
+    return topk_indices_buffer
+
+
+def sparse_attn_indexer_fake(
+    hidden_states: torch.Tensor,
+    k_cache_prefix: str,
+    kv_cache: torch.Tensor,
+    q_fp8: torch.Tensor,
+    k: torch.Tensor,
+    weights: torch.Tensor,
+    quant_block_size: int,
+    scale_fmt: Optional[str],
+    topk_tokens: int,
+    head_dim: int,
+    max_model_len: int,
+    total_seq_lens: int,
+    topk_indices_buffer: Optional[torch.Tensor],
+) -> torch.Tensor:
+    # profile run
+    # NOTE(Chen): create the max possible flattened_kv. So that
+    # profile_run can get correct memory usage.
+    _flattened_kv = torch.empty([total_seq_lens, head_dim + 4],
+                                device=k.device,
+                                dtype=torch.uint8)
+    _k_fp8 = _flattened_kv[..., :head_dim].view(
+        torch.float8_e4m3fn).contiguous()
+    _k_scale = _flattened_kv[..., head_dim:].view(torch.float32).contiguous()
+    return topk_indices_buffer
+
+
+direct_register_custom_op(
+    op_name="sparse_attn_indexer",
+    op_func=sparse_attn_indexer,
+    mutates_args=["topk_indices_buffer"],
+    fake_impl=sparse_attn_indexer_fake,
+    dispatch_key=current_platform.dispatch_key,
+)
+
+
+class Indexer(nn.Module):
+
+    def __init__(self,
+                 vllm_config: VllmConfig,
+                 config: Union[DeepseekV2Config, DeepseekV3Config],
+                 hidden_size: int,
+                 q_lora_rank: int,
+                 quant_config: Optional[QuantizationConfig],
+                 cache_config: Optional[CacheConfig],
+                 topk_indices_buffer: Optional[torch.Tensor],
+                 prefix: str = ""):
+        super().__init__()
+        self.vllm_config = vllm_config
+        self.config = config
+        # self.indexer_cfg = config.attn_module_list_cfg[0]["attn_index"]
+        self.topk_tokens = config.index_topk
+        self.n_head = config.index_n_heads  # 64
+        self.head_dim = config.index_head_dim  # 128
+        self.rope_dim = config.qk_rope_head_dim  # 64
+        self.q_lora_rank = q_lora_rank  # 1536
+        # no tensor parallel, just replicated
+        self.wq_b = ReplicatedLinear(self.q_lora_rank,
+                                     self.head_dim * self.n_head,
+                                     bias=False,
+                                     quant_config=quant_config,
+                                     prefix=f"{prefix}.wq_b")
+        self.wk = ReplicatedLinear(hidden_size,
+                                   self.head_dim,
+                                   bias=False,
+                                   quant_config=quant_config,
+                                   prefix=f"{prefix}.wk")
+        self.k_norm = LayerNorm(self.head_dim, eps=1e-6)
+        self.weights_proj = ReplicatedLinear(hidden_size,
+                                             self.n_head,
+                                             quant_config=None,
+                                             prefix=f"{prefix}.weights_proj")
+        self.softmax_scale = self.head_dim**-0.5
+
+        self.scale_fmt = "ue8m0"
+        self.quant_block_size = 128  # TODO: get from config
+        self.topk_indices_buffer = topk_indices_buffer
+
+        # NOTE: (zyongye) we use fp8 naive cache,
+        #       where we store value in fp8 and scale in fp32
+        #       per self.quant_block_size element
+        self.k_cache = DeepseekV32IndexerCache(
+            head_dim=self.head_dim +
+            self.head_dim // self.quant_block_size * 4,
+            dtype=torch.uint8,
+            prefix=f"{prefix}.k_cache",
+            cache_config=cache_config)
+        self.max_model_len = vllm_config.model_config.max_model_len
+        self.prefix = prefix
+        from vllm.v1.attention.backends.mla.indexer import (
+            get_max_prefill_buffer_size)
+        self.max_total_seq_len = get_max_prefill_buffer_size(vllm_config)
+
+    def forward(self, hidden_states: torch.Tensor, qr: torch.Tensor, positions,
+                rotary_emb) -> torch.Tensor:
+        q, _ = self.wq_b(qr)
+        q = q.view(-1, self.n_head, self.head_dim)
+        q_pe, q_nope = torch.split(
+            q, [self.rope_dim, self.head_dim - self.rope_dim], dim=-1)
+
+        k, _ = self.wk(hidden_states)
+        k = self.k_norm(k)
+        k_pe, k_nope = torch.split(
+            k, [self.rope_dim, self.head_dim - self.rope_dim], dim=-1)
+
+        q_pe, k_pe = rotary_emb(positions, q_pe, k_pe.unsqueeze(1))
+        q = torch.cat([q_pe, q_nope], dim=-1)
+        k = torch.cat([k_pe.squeeze(1), k_nope], dim=-1)
+
+        # we only quant q here since k quant is fused with cache insertion
+        q = q.view(-1, self.head_dim)
+        q_fp8, q_scale = per_token_group_quant_fp8(q,
+                                                   self.quant_block_size,
+                                                   column_major_scales=False,
+                                                   use_ue8m0=self.scale_fmt
+                                                   is not None)
+        q_fp8 = q_fp8.view(-1, self.n_head, self.head_dim)
+        q_scale = q_scale.view(-1, self.n_head, 1)
+
+        weights, _ = self.weights_proj(hidden_states)
+        weights = weights.unsqueeze(
+            -1) * q_scale * self.softmax_scale * self.n_head**-0.5
+        weights = weights.squeeze(-1)
+
+        return torch.ops.vllm.sparse_attn_indexer(
+            hidden_states,
+            self.k_cache.prefix,
+            self.k_cache.kv_cache[0],
+            q_fp8,
+            k,
+            weights,
+            self.quant_block_size,
+            self.scale_fmt,
+            self.topk_tokens,
+            self.head_dim,
+            self.max_model_len,
+            self.max_total_seq_len,
+            self.topk_indices_buffer,
+        )
+
+
 class DeepseekV2MLAAttention(nn.Module):
     """
     Main reference: DeepseekV2 paper, and FlashInfer Implementation
@@ -429,6 +839,7 @@ class DeepseekV2MLAAttention(nn.Module):
 
     def __init__(
         self,
+        vllm_config: VllmConfig,
         config: Union[DeepseekV2Config, DeepseekV3Config],
         hidden_size: int,
         num_heads: int,
@@ -443,6 +854,7 @@ def __init__(
         cache_config: Optional[CacheConfig] = None,
         quant_config: Optional[QuantizationConfig] = None,
         prefix: str = "",
+        topk_indices_buffer: Optional[torch.Tensor] = None,
     ) -> None:
         super().__init__()
         self.hidden_size = hidden_size
@@ -523,6 +935,15 @@ def __init__(
             mscale = yarn_get_mscale(scaling_factor, float(mscale_all_dim))
             self.scaling = self.scaling * mscale * mscale
 
+        self.is_v32 = hasattr(config, "index_topk")
+
+        if self.is_v32:
+            self.indexer = Indexer(vllm_config, config, hidden_size,
+                                   q_lora_rank, quant_config, cache_config,
+                                   topk_indices_buffer, f"{prefix}.indexer")
+        else:
+            self.indexer = None
+
         mla_modules = MLAModules(
             kv_a_layernorm=self.kv_a_layernorm,
             kv_b_proj=self.kv_b_proj,
@@ -536,7 +957,11 @@ def __init__(
             if self.q_lora_rank is not None else None,
             q_b_proj=self.q_b_proj if self.q_lora_rank is not None else None,
             q_proj=self.q_proj if self.q_lora_rank is None else None,
+            indexer=self.indexer,
+            is_sparse=self.is_v32,
+            topk_indices_buffer=topk_indices_buffer,
         )
+
         self.mla_attn = MultiHeadLatentAttention(
             self.hidden_size,
             self.num_local_heads,
@@ -562,7 +987,10 @@ def forward(
 
 class DeepseekV2DecoderLayer(nn.Module):
 
-    def __init__(self, vllm_config: VllmConfig, prefix: str) -> None:
+    def __init__(self,
+                 vllm_config: VllmConfig,
+                 prefix: str,
+                 topk_indices_buffer: Optional[torch.Tensor] = None) -> None:
         super().__init__()
 
         config = vllm_config.model_config.hf_config
@@ -585,6 +1013,7 @@ def __init__(self, vllm_config: VllmConfig, prefix: str) -> None:
         else:
             attn_cls = DeepseekV2Attention
         self.self_attn = attn_cls(
+            vllm_config=vllm_config,
             config=config,
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
@@ -600,6 +1029,7 @@ def __init__(self, vllm_config: VllmConfig, prefix: str) -> None:
             cache_config=cache_config,
             quant_config=quant_config,
             prefix=f"{prefix}.self_attn",
+            topk_indices_buffer=topk_indices_buffer,
         )
 
         if (config.n_routed_experts is not None
@@ -683,6 +1113,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.config = config
 
         self.vocab_size = config.vocab_size
+        self.is_v32 = hasattr(config, "index_topk")
+        if self.is_v32:
+            topk_tokens = config.index_topk
+            topk_indices_buffer = torch.empty(
+                vllm_config.scheduler_config.max_num_batched_tokens,
+                topk_tokens,
+                dtype=torch.int32,
+                device="cuda")
+        else:
+            topk_indices_buffer = None
 
         if get_pp_group().is_first_rank:
             self.embed_tokens = VocabParallelEmbedding(
@@ -695,7 +1135,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: DeepseekV2DecoderLayer(vllm_config, prefix),
+            lambda prefix: DeepseekV2DecoderLayer(vllm_config, prefix,
+                                                  topk_indices_buffer),
             prefix=f"{prefix}.layers")
 
         if get_pp_group().is_last_rank:
diff --git a/vllm/model_executor/models/longcat_flash.py b/vllm/model_executor/models/longcat_flash.py
index 1a7a64bfd1a4..78e6e3d4b535 100644
--- a/vllm/model_executor/models/longcat_flash.py
+++ b/vllm/model_executor/models/longcat_flash.py
@@ -308,6 +308,7 @@ class FlashDecoderLayer(nn.Module):
 
     def __init__(
         self,
+        vllm_config: VllmConfig,
         config: FlashConfig,
         cache_config: Optional[CacheConfig] = None,
         quant_config: Optional[QuantizationConfig] = None,
@@ -329,6 +330,7 @@ def __init__(
         # Dual attention structure
         self.self_attn = nn.ModuleList([
             DeepseekV2MLAAttention(
+                vllm_config=vllm_config,
                 config=config,
                 hidden_size=self.hidden_size,
                 num_heads=config.num_attention_heads,
@@ -454,6 +456,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: FlashDecoderLayer(
+                vllm_config,
                 config,
                 cache_config=cache_config,
                 quant_config=quant_config,
diff --git a/vllm/model_executor/models/registry.py b/vllm/model_executor/models/registry.py
index 62aa5af9fb14..732181265a97 100644
--- a/vllm/model_executor/models/registry.py
+++ b/vllm/model_executor/models/registry.py
@@ -70,6 +70,7 @@
     "DeepseekForCausalLM": ("deepseek", "DeepseekForCausalLM"),
     "DeepseekV2ForCausalLM": ("deepseek_v2", "DeepseekV2ForCausalLM"),
     "DeepseekV3ForCausalLM": ("deepseek_v2", "DeepseekV3ForCausalLM"),
+    "DeepseekV32ForCausalLM": ("deepseek_v2", "DeepseekV3ForCausalLM"),
     "Dots1ForCausalLM": ("dots1", "Dots1ForCausalLM"),
     "Ernie4_5ForCausalLM": ("ernie45", "Ernie4_5ForCausalLM"),
     "Ernie4_5_MoeForCausalLM": ("ernie45_moe", "Ernie4_5_MoeForCausalLM"),
diff --git a/vllm/platforms/cpu.py b/vllm/platforms/cpu.py
index 1e15dc6a91aa..0b26446a87d8 100644
--- a/vllm/platforms/cpu.py
+++ b/vllm/platforms/cpu.py
@@ -93,11 +93,14 @@ def get_device_name(cls, device_id: int = 0) -> str:
     def get_attn_backend_cls(cls, selected_backend: _Backend, head_size: int,
                              dtype: torch.dtype, kv_cache_dtype: Optional[str],
                              block_size: int, use_v1: bool, use_mla: bool,
-                             has_sink: bool) -> str:
+                             has_sink: bool, use_sparse: bool) -> str:
         if selected_backend and selected_backend != _Backend.TORCH_SDPA:
             logger.info("Cannot use %s backend on CPU.", selected_backend)
         if use_mla:
             raise NotImplementedError("MLA is not supported on CPU.")
+        if use_sparse:
+            raise NotImplementedError(
+                "Sparse Attention is not supported on CPU.")
         logger.info("Using Torch SDPA backend.")
         if not use_v1:
             raise ValueError("CPU backend only supports V1.")
diff --git a/vllm/platforms/cuda.py b/vllm/platforms/cuda.py
index 1463fe34fc75..a9a8d9ea2625 100644
--- a/vllm/platforms/cuda.py
+++ b/vllm/platforms/cuda.py
@@ -119,6 +119,8 @@ def check_and_update_config(cls, vllm_config: "VllmConfig") -> None:
         # TODO(lucas): handle this more gracefully
         # Note: model_config may be None during testing
         if model_config is not None and model_config.use_mla:
+            use_sparse = hasattr(vllm_config.model_config.hf_config,
+                                 "index_topk")
             # If `VLLM_ATTENTION_BACKEND` is not set and we are using MLA,
             # then we default to FlashMLA backend for non-blackwell GPUs,
             # else we default to CutlassMLA. For each case, we force the
@@ -165,6 +167,12 @@ def check_and_update_config(cls, vllm_config: "VllmConfig") -> None:
                     "Forcing kv cache block size to 64 for FlashInferMLA "
                     "backend.")
 
+            # TODO(Chen): remove this hacky code
+            if use_sparse and cache_config.block_size != 64:
+                cache_config.block_size = 64
+                logger.info(
+                    "Forcing kv cache block size to 64 for FlashMLASparse "
+                    "backend.")
         # lazy import to avoid circular import
         from vllm.config import CUDAGraphMode
 
@@ -221,7 +229,7 @@ def get_vit_attn_backend(cls, head_size: int,
     @classmethod
     def get_attn_backend_cls(cls, selected_backend, head_size, dtype,
                              kv_cache_dtype, block_size, use_v1, use_mla,
-                             has_sink) -> str:
+                             has_sink, use_sparse) -> str:
         if use_mla:
             if not use_v1:
                 raise RuntimeError(
@@ -231,6 +239,11 @@ def get_attn_backend_cls(cls, selected_backend, head_size, dtype,
             from vllm.attention.ops.flashmla import is_flashmla_supported
             from vllm.attention.utils.fa_utils import flash_attn_supports_mla
 
+            if use_sparse:
+                logger.info_once("Using Sparse MLA backend on V1 engine.")
+                return ("vllm.v1.attention.backends.mla.flashmla_sparse."
+                        "FlashMLASparseBackend")
+
             use_cutlassmla = selected_backend == _Backend.CUTLASS_MLA or (
                 selected_backend is None and cls.is_device_capability(100)
                 and block_size == 128)
diff --git a/vllm/platforms/interface.py b/vllm/platforms/interface.py
index de23a665d2ea..1691ad62650b 100644
--- a/vllm/platforms/interface.py
+++ b/vllm/platforms/interface.py
@@ -194,7 +194,7 @@ def get_vit_attn_backend(cls, head_size: int,
     def get_attn_backend_cls(cls, selected_backend: _Backend, head_size: int,
                              dtype: torch.dtype, kv_cache_dtype: Optional[str],
                              block_size: int, use_v1: bool, use_mla: bool,
-                             has_sink: bool) -> str:
+                             has_sink: bool, use_sparse: bool) -> str:
         """Get the attention backend class of a device."""
         return ""
 
diff --git a/vllm/platforms/rocm.py b/vllm/platforms/rocm.py
index f67568bf07c1..14762f1b7094 100644
--- a/vllm/platforms/rocm.py
+++ b/vllm/platforms/rocm.py
@@ -195,7 +195,10 @@ def get_vit_attn_backend(cls, head_size: int,
     @classmethod
     def get_attn_backend_cls(cls, selected_backend, head_size, dtype,
                              kv_cache_dtype, block_size, use_v1, use_mla,
-                             has_sink) -> str:
+                             has_sink, use_sparse) -> str:
+        if use_sparse:
+            raise NotImplementedError(
+                "Sparse Attention is not supported on ROCm.")
         if use_mla:
             if not use_v1:
                 raise RuntimeError(
diff --git a/vllm/platforms/tpu.py b/vllm/platforms/tpu.py
index c2ba37224d61..4a4931f7f009 100644
--- a/vllm/platforms/tpu.py
+++ b/vllm/platforms/tpu.py
@@ -49,7 +49,10 @@ class TpuPlatform(Platform):
     def get_attn_backend_cls(cls, selected_backend: _Backend, head_size: int,
                              dtype: torch.dtype, kv_cache_dtype: Optional[str],
                              block_size: int, use_v1: bool, use_mla: bool,
-                             has_sink) -> str:
+                             has_sink, use_sparse) -> str:
+        if use_sparse:
+            raise NotImplementedError(
+                "Sparse Attention is not supported on TPU.")
         if selected_backend != _Backend.PALLAS:
             logger.info("Cannot use %s backend on TPU.", selected_backend)
 
diff --git a/vllm/platforms/xpu.py b/vllm/platforms/xpu.py
index cf408cc5df04..12d6a2a2d1ba 100644
--- a/vllm/platforms/xpu.py
+++ b/vllm/platforms/xpu.py
@@ -36,7 +36,10 @@ class XPUPlatform(Platform):
     def get_attn_backend_cls(cls, selected_backend: _Backend, head_size: int,
                              dtype: torch.dtype, kv_cache_dtype: Optional[str],
                              block_size: int, use_v1: bool, use_mla: bool,
-                             has_sink: bool) -> str:
+                             has_sink: bool, use_sparse) -> str:
+        if use_sparse:
+            raise NotImplementedError(
+                "Sparse Attention is not supported on XPU.")
         use_v1 = envs.VLLM_USE_V1
         if not use_v1:
             raise ValueError("XPU backend only supports V1.")
diff --git a/vllm/transformers_utils/config.py b/vllm/transformers_utils/config.py
index 4f5e5c01e5cb..86345287f988 100644
--- a/vllm/transformers_utils/config.py
+++ b/vllm/transformers_utils/config.py
@@ -66,6 +66,8 @@ def __getitem__(self, key):
 _CONFIG_REGISTRY: dict[str, type[PretrainedConfig]] = LazyConfigDict(
     chatglm="ChatGLMConfig",
     deepseek_vl_v2="DeepseekVLV2Config",
+    deepseek_v3="DeepseekV3Config",
+    deepseek_v32="DeepseekV3Config",
     kimi_vl="KimiVLConfig",
     Llama_Nemotron_Nano_VL="Nemotron_Nano_VL_Config",
     RefinedWeb="RWConfig",  # For tiiuae/falcon-40b(-instruct)
diff --git a/vllm/transformers_utils/configs/__init__.py b/vllm/transformers_utils/configs/__init__.py
index 52fa49ad302b..1b33b5e70e0b 100644
--- a/vllm/transformers_utils/configs/__init__.py
+++ b/vllm/transformers_utils/configs/__init__.py
@@ -8,6 +8,7 @@
 """
 
 from vllm.transformers_utils.configs.chatglm import ChatGLMConfig
+from vllm.transformers_utils.configs.deepseek_v3 import DeepseekV3Config
 from vllm.transformers_utils.configs.deepseek_vl2 import DeepseekVLV2Config
 from vllm.transformers_utils.configs.dotsocr import DotsOCRConfig
 from vllm.transformers_utils.configs.eagle import EAGLEConfig
@@ -37,6 +38,7 @@
 __all__ = [
     "ChatGLMConfig",
     "DeepseekVLV2Config",
+    "DeepseekV3Config",
     "DotsOCRConfig",
     "EAGLEConfig",
     "RWConfig",
diff --git a/vllm/transformers_utils/configs/deepseek_v3.py b/vllm/transformers_utils/configs/deepseek_v3.py
new file mode 100644
index 000000000000..4b26cdfd94b5
--- /dev/null
+++ b/vllm/transformers_utils/configs/deepseek_v3.py
@@ -0,0 +1,101 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+from transformers.configuration_utils import PretrainedConfig
+from transformers.utils import logging
+
+logger = logging.get_logger(__name__)
+
+
+class DeepseekV3Config(PretrainedConfig):
+
+    model_type = "deepseek_v3"
+    keys_to_ignore_at_inference = ["past_key_values"]
+
+    def __init__(
+        self,
+        vocab_size=129280,
+        hidden_size=7168,
+        intermediate_size=18432,
+        moe_intermediate_size=2048,
+        num_hidden_layers=61,
+        num_nextn_predict_layers=1,
+        num_attention_heads=128,
+        num_key_value_heads=128,
+        n_shared_experts=1,
+        n_routed_experts=256,
+        ep_size=1,
+        routed_scaling_factor=2.5,
+        kv_lora_rank=512,
+        q_lora_rank=1536,
+        qk_rope_head_dim=64,
+        v_head_dim=128,
+        qk_nope_head_dim=128,
+        topk_method='noaux_tc',
+        n_group=8,
+        topk_group=4,
+        num_experts_per_tok=8,
+        moe_layer_freq=1,
+        first_k_dense_replace=3,
+        norm_topk_prob=True,
+        scoring_func='sigmoid',
+        hidden_act="silu",
+        max_position_embeddings=4096,
+        initializer_range=0.02,
+        rms_norm_eps=1e-6,
+        use_cache=True,
+        pad_token_id=None,
+        bos_token_id=0,
+        eos_token_id=1,
+        tie_word_embeddings=False,
+        rope_theta=10000.0,
+        rope_scaling=None,
+        attention_bias=False,
+        attention_dropout=0.0,
+        **kwargs,
+    ):
+        self.vocab_size = vocab_size
+        self.max_position_embeddings = max_position_embeddings
+        self.hidden_size = hidden_size
+        self.intermediate_size = intermediate_size
+        self.moe_intermediate_size = moe_intermediate_size
+        self.num_hidden_layers = num_hidden_layers
+        self.num_nextn_predict_layers = num_nextn_predict_layers
+        self.num_attention_heads = num_attention_heads
+        self.n_shared_experts = n_shared_experts
+        self.n_routed_experts = n_routed_experts
+        self.ep_size = ep_size
+        self.routed_scaling_factor = routed_scaling_factor
+        self.kv_lora_rank = kv_lora_rank
+        self.q_lora_rank = q_lora_rank
+        self.qk_rope_head_dim = qk_rope_head_dim
+        self.v_head_dim = v_head_dim
+        self.qk_nope_head_dim = qk_nope_head_dim
+        self.topk_method = topk_method
+        self.n_group = n_group
+        self.topk_group = topk_group
+        self.num_experts_per_tok = num_experts_per_tok
+        self.moe_layer_freq = moe_layer_freq
+        self.first_k_dense_replace = first_k_dense_replace
+        self.norm_topk_prob = norm_topk_prob
+        self.scoring_func = scoring_func
+        # for backward compatibility
+        if num_key_value_heads is None:
+            num_key_value_heads = num_attention_heads
+
+        self.num_key_value_heads = num_key_value_heads
+        self.hidden_act = hidden_act
+        self.initializer_range = initializer_range
+        self.rms_norm_eps = rms_norm_eps
+        self.use_cache = use_cache
+        self.rope_theta = rope_theta
+        self.rope_scaling = rope_scaling
+        self.attention_bias = attention_bias
+        self.attention_dropout = attention_dropout
+
+        super().__init__(
+            pad_token_id=pad_token_id,
+            bos_token_id=bos_token_id,
+            eos_token_id=eos_token_id,
+            tie_word_embeddings=tie_word_embeddings,
+            **kwargs,
+        )
diff --git a/vllm/utils/__init__.py b/vllm/utils/__init__.py
index ba280d6dbe4a..11d6686009b2 100644
--- a/vllm/utils/__init__.py
+++ b/vllm/utils/__init__.py
@@ -130,6 +130,7 @@
     "fp8_e5m2": torch.uint8,
     "int8": torch.int8,
     "fp8_inc": torch.float8_e4m3fn,
+    "fp8_ds_mla": torch.uint8,
 }
 
 TORCH_DTYPE_TO_NUMPY_DTYPE = {
@@ -3433,6 +3434,12 @@ def has_triton_kernels() -> bool:
     return _has_module("triton_kernels")
 
 
+def has_tilelang() -> bool:
+    """Whether the optional `tilelang` package is available."""
+
+    return _has_module("tilelang")
+
+
 def set_process_title(name: str,
                       suffix: str = "",
                       prefix: str = envs.VLLM_PROCESS_NAME_PREFIX) -> None:
diff --git a/vllm/utils/deep_gemm.py b/vllm/utils/deep_gemm.py
index f955beb92b36..0e3bdaec829e 100644
--- a/vllm/utils/deep_gemm.py
+++ b/vllm/utils/deep_gemm.py
@@ -70,17 +70,25 @@ def _missing(*_: Any, **__: Any) -> NoReturn:
 _fp8_gemm_nt_impl: Callable[..., Any] | None = None
 _grouped_impl: Callable[..., Any] | None = None
 _grouped_masked_impl: Callable[..., Any] | None = None
+_fp8_mqa_logits_impl: Callable[..., Any] | None = None
+_fp8_paged_mqa_logits_impl: Callable[..., Any] | None = None
+_get_paged_mqa_logits_metadata_impl: Callable[..., Any] | None = None
 _get_mn_major_tma_aligned_tensor_impl: Callable[..., Any] | None = None
 
 
 def _lazy_init() -> None:
     """Import deep_gemm and resolve symbols on first use."""
-    global _fp8_gemm_nt_impl, _grouped_impl, _grouped_masked_impl,\
-         _get_mn_major_tma_aligned_tensor_impl
+    global _fp8_gemm_nt_impl, _grouped_impl, _grouped_masked_impl
+    global _fp8_mqa_logits_impl, _fp8_paged_mqa_logits_impl
+    global _get_paged_mqa_logits_metadata_impl
+    global _get_mn_major_tma_aligned_tensor_impl
 
     # fast path
     if (_fp8_gemm_nt_impl is not None or _grouped_impl is not None
-            or _grouped_masked_impl is not None):
+            or _grouped_masked_impl is not None
+            or _fp8_mqa_logits_impl is not None
+            or _fp8_paged_mqa_logits_impl is not None
+            or _get_paged_mqa_logits_metadata_impl is not None):
         return
 
     if not has_deep_gemm():
@@ -97,10 +105,20 @@ def _lazy_init() -> None:
     _fp8_gemm_nt_impl = getattr(_dg, "fp8_gemm_nt", None)
     _grouped_impl = getattr(_dg, "m_grouped_fp8_gemm_nt_contiguous", None)
     _grouped_masked_impl = getattr(_dg, "fp8_m_grouped_gemm_nt_masked", None)
+    _fp8_mqa_logits_impl = getattr(_dg, "fp8_mqa_logits", None)
+    _fp8_paged_mqa_logits_impl = getattr(_dg, "fp8_paged_mqa_logits", None)
+    _get_paged_mqa_logits_metadata_impl = getattr(
+        _dg, "get_paged_mqa_logits_metadata", None)
     _get_mn_major_tma_aligned_tensor_impl = getattr(
         _dg, "get_mn_major_tma_aligned_tensor", None)
 
 
+def get_num_sms() -> int:
+    _lazy_init()
+    _dg = importlib.import_module("deep_gemm")
+    return int(_dg.get_num_sms())
+
+
 def get_col_major_tma_aligned_tensor(x: torch.Tensor) -> torch.Tensor:
     """Wrapper for DeepGEMM's get_mn_major_tma_aligned_tensor"""
     _lazy_init()
@@ -135,6 +153,100 @@ def fp8_m_grouped_gemm_nt_masked(*args, **kwargs):
         *args, disable_ue8m0_cast=not is_deep_gemm_e8m0_used(), **kwargs)
 
 
+def fp8_mqa_logits(
+    q: torch.Tensor,
+    kv: tuple[torch.Tensor, torch.Tensor],
+    weights: torch.Tensor,
+    cu_seqlen_ks: torch.Tensor,
+    cu_seqlen_ke: torch.Tensor,
+) -> torch.Tensor:
+    """Compute FP8 MQA logits for a single sequence without KV paging.
+
+    Args:
+        q: Query tensor of shape [M, H, D]. Casted to
+            `torch.float8_e4m3fn` by caller.
+        kv: Tuple `(k_fp8, k_scales)` where `k_fp8` has shape [N, D] with
+            dtype `torch.float8_e4m3fn` and `k_scales` has shape [N] (or
+            [N, 1]) with dtype `torch.float32`.
+        weights: weights of shape [M, H], dtype `torch.float32`.
+        cu_seqlen_ks: Start indices (inclusive) for valid K per query position,
+            shape [M], dtype int32.
+        cu_seqlen_ke: End indices (exclusive) for valid K per query position,
+            shape [M], dtype int32.
+
+    Returns:
+        Logits tensor of shape [M, N], dtype `torch.float32`.
+    """
+    _lazy_init()
+    if _fp8_mqa_logits_impl is None:
+        return _missing()
+    return _fp8_mqa_logits_impl(q, kv, weights, cu_seqlen_ks, cu_seqlen_ke)
+
+
+def get_paged_mqa_logits_metadata(context_lens: torch.Tensor, block_size: int,
+                                  num_sms: int) -> torch.Tensor:
+    """Build scheduling metadata for paged MQA logits.
+
+    Args:
+        context_lens: Tensor of shape [B], dtype int32; effective context length
+            per batch element.
+        block_size: KV-cache block size in tokens (e.g., 64).
+        num_sms: Number of SMs available. 132 for Hopper
+
+    Returns:
+        Backend-specific tensor consumed by `fp8_paged_mqa_logits` to
+        schedule work across SMs.
+    """
+    _lazy_init()
+    if _get_paged_mqa_logits_metadata_impl is None:
+        return _missing()
+    return _get_paged_mqa_logits_metadata_impl(context_lens, block_size,
+                                               num_sms)
+
+
+def fp8_paged_mqa_logits(
+    q_fp8: torch.Tensor,
+    kv_cache_fp8: torch.Tensor,
+    weights: torch.Tensor,
+    context_lens: torch.Tensor,
+    block_tables: torch.Tensor,
+    schedule_metadata: torch.Tensor,
+    max_model_len: int,
+) -> torch.Tensor:
+    """Compute FP8 MQA logits using paged KV-cache.
+
+    Args:
+        q_fp8: Query tensor of shape [B, next_n, H, D]. Casted to
+            `torch.float8_e4m3fn` by caller.
+        kv_cache_fp8: Paged KV-cache in packed FP8+scale layout with shape
+            [num_blocks, block_size, 1, D+4], dtype `torch.uint8`. The last
+            4 bytes per (block,pos) store the `float` dequant scale.
+        weights: Tensor of shape [B * next_n, H], dtype `torch.float32`.
+        context_lens: Tensor of shape [B], dtype int32; effective context length
+            for each batch element.
+        block_tables: Tensor of shape [B, max_blocks], dtype int32; maps logical
+            block indices to physical blocks in the paged cache.
+        schedule_metadata: Returned by `get_paged_mqa_logits_metadata`;
+            used to distribute work across SMs.
+        max_model_len: Maximum sequence length used to size the logits output.
+
+    Returns:
+        Logits tensor of shape [B * next_n, max_model_len], dtype
+        `torch.float32`.
+    """
+    _lazy_init()
+    if _fp8_paged_mqa_logits_impl is None:
+        return _missing()
+    return _fp8_paged_mqa_logits_impl(q_fp8,
+                                      kv_cache_fp8,
+                                      weights,
+                                      context_lens,
+                                      block_tables,
+                                      schedule_metadata,
+                                      max_model_len,
+                                      clean_logits=True)
+
+
 def _ceil_to_ue8m0(x: torch.Tensor):
     return torch.pow(2.0, torch.ceil(torch.log2(x.abs())))
 
@@ -195,9 +307,13 @@ def should_use_deepgemm_for_fp8_linear(output_dtype: torch.dtype,
     "fp8_gemm_nt",
     "m_grouped_fp8_gemm_nt_contiguous",
     "fp8_m_grouped_gemm_nt_masked",
+    "fp8_mqa_logits",
+    "fp8_paged_mqa_logits",
+    "get_paged_mqa_logits_metadata",
     "per_block_cast_to_fp8",
     "is_deep_gemm_e8m0_used",
     "is_deep_gemm_supported",
+    "get_num_sms",
     "should_use_deepgemm_for_fp8_linear",
     "get_col_major_tma_aligned_tensor",
-]
\ No newline at end of file
+]
diff --git a/vllm/v1/attention/backends/cpu_attn.py b/vllm/v1/attention/backends/cpu_attn.py
index ab09ab9f8e0e..6ca0c63f6b59 100644
--- a/vllm/v1/attention/backends/cpu_attn.py
+++ b/vllm/v1/attention/backends/cpu_attn.py
@@ -74,6 +74,7 @@ def get_kv_cache_shape(
         block_size: int,
         num_kv_heads: int,
         head_size: int,
+        cache_dtype_str: str = "auto",
     ) -> tuple[int, ...]:
         return _get_paged_attn_impl().get_kv_cache_shape(
             num_blocks, block_size, num_kv_heads, head_size)
diff --git a/vllm/v1/attention/backends/flash_attn.py b/vllm/v1/attention/backends/flash_attn.py
index f284847dd9e9..f0770f744146 100755
--- a/vllm/v1/attention/backends/flash_attn.py
+++ b/vllm/v1/attention/backends/flash_attn.py
@@ -80,6 +80,7 @@ def get_kv_cache_shape(
         block_size: int,
         num_kv_heads: int,
         head_size: int,
+        cache_dtype_str: str = "auto",
     ) -> tuple[int, ...]:
         if block_size % 16 != 0:
             raise ValueError("Block size must be a multiple of 16.")
diff --git a/vllm/v1/attention/backends/flashinfer.py b/vllm/v1/attention/backends/flashinfer.py
index a4bf3635bbca..688e681f0591 100755
--- a/vllm/v1/attention/backends/flashinfer.py
+++ b/vllm/v1/attention/backends/flashinfer.py
@@ -187,6 +187,7 @@ def get_kv_cache_shape(
         block_size: int,
         num_kv_heads: int,
         head_size: int,
+        cache_dtype_str: str = "auto",
     ) -> tuple[int, ...]:
         return (num_blocks, 2, block_size, num_kv_heads, head_size)
 
diff --git a/vllm/v1/attention/backends/flex_attention.py b/vllm/v1/attention/backends/flex_attention.py
index 807b8d987a2d..e548b51060d8 100644
--- a/vllm/v1/attention/backends/flex_attention.py
+++ b/vllm/v1/attention/backends/flex_attention.py
@@ -90,6 +90,7 @@ def get_kv_cache_shape(
         block_size: int,
         num_kv_heads: int,
         head_size: int,
+        cache_dtype_str: str = "auto",
     ) -> tuple[int, ...]:
         return (2, num_blocks, block_size, num_kv_heads, head_size)
 
diff --git a/vllm/v1/attention/backends/mla/common.py b/vllm/v1/attention/backends/mla/common.py
index 1053fde09910..561793b6a377 100755
--- a/vllm/v1/attention/backends/mla/common.py
+++ b/vllm/v1/attention/backends/mla/common.py
@@ -286,6 +286,7 @@ def get_kv_cache_shape(
         block_size: int,
         num_kv_heads: int,  # assumed to be 1 for MLA
         head_size: int,
+        cache_dtype_str: str = "auto",
     ) -> tuple[int, ...]:
         return (num_blocks, block_size, head_size)
 
@@ -407,6 +408,7 @@ def __post_init__(self):
 
 
 M = TypeVar("M", bound=MLACommonMetadata)
+A = TypeVar("A")
 
 
 def use_flashinfer_prefill() -> bool:
@@ -930,7 +932,9 @@ def reorg_kvcache(
     return reorganized_kv_c_normed, reorganized_k_pe
 
 
-class MLACommonImpl(MLAAttentionImpl[M], Generic[M]):
+# TODO(Lucas): rename MLACommonBaseImpl -> MLACommonImpl,
+# and MLACommonImpl -> MLACommonDenseImpl or somthing like that
+class MLACommonBaseImpl(MLAAttentionImpl[A], Generic[A]):
     """
     NOTE: Please read the comment at the top of the file before trying to
     understand this class
@@ -956,6 +960,7 @@ def __init__(
         qk_head_dim: int,
         v_head_dim: int,
         kv_b_proj: ColumnParallelLinear,
+        indexer=None,
         q_pad_num_heads: Optional[int] = None,
     ) -> None:
         if kv_sharing_target_layer_name is not None:
@@ -974,8 +979,140 @@ def __init__(
         self.qk_head_dim = qk_head_dim
         self.v_head_dim = v_head_dim
         self.kv_b_proj = kv_b_proj
+        self.indexer = indexer
         self.q_pad_num_heads = q_pad_num_heads
 
+    def process_weights_after_loading(self, act_dtype: torch.dtype):
+
+        def get_layer_weight(layer):
+            WEIGHT_NAMES = ("weight", "qweight", "weight_packed")
+            for attr in WEIGHT_NAMES:
+                if hasattr(layer, attr):
+                    return getattr(layer, attr)
+            raise AttributeError(
+                f"Layer '{layer}' has no recognized weight attribute:"
+                f" {WEIGHT_NAMES}.")
+
+        def get_and_maybe_dequant_weights(layer: LinearBase):
+            if not isinstance(layer.quant_method, UnquantizedLinearMethod):
+                # NOTE: This should only be used offline, since it's O(N^3)
+                eye = torch.eye(layer.input_size_per_partition,
+                                dtype=act_dtype,
+                                device=get_layer_weight(layer).device)
+                dequant_weights = layer.quant_method.apply(layer,
+                                                           eye,
+                                                           bias=None)
+                del eye
+                # standardize to (output, input)
+                return dequant_weights.T
+            return layer.weight
+
+        # we currently do not have quantized bmm's which are needed for
+        # `W_UV` and `W_UK_T`, we just store fp16/bf16 copies and perform
+        # the bmm's in 16-bit, the extra memory overhead of this is fairly low
+        kv_b_proj_weight = get_and_maybe_dequant_weights(self.kv_b_proj).T
+        assert kv_b_proj_weight.shape == (
+            self.kv_lora_rank,
+            self.num_heads * (self.qk_nope_head_dim + self.v_head_dim)), (
+                f"{kv_b_proj_weight.shape=}, "
+                f"{self.kv_lora_rank=}, "
+                f"{self.num_heads=}, "
+                f"{self.qk_nope_head_dim=}, "
+                f"{self.v_head_dim=}")
+        kv_b_proj_weight = kv_b_proj_weight.view(
+            self.kv_lora_rank,
+            self.num_heads,
+            self.qk_nope_head_dim + self.v_head_dim,
+        )
+
+        W_UK, W_UV = kv_b_proj_weight.split(
+            [self.qk_nope_head_dim, self.v_head_dim], dim=-1)
+
+        if is_rocm_aiter_fp8bmm_enabled():
+            W_K = W_UK.transpose(0, 1)  # 16 512 128
+            W_V = W_UV.permute(1, 2, 0)  # 16 128 512
+            self.W_K, self.W_K_scale = dynamic_per_batched_tensor_quant(
+                W_K, dtype=current_platform.fp8_dtype())
+            self.W_V, self.W_V_scale = dynamic_per_batched_tensor_quant(
+                W_V, dtype=current_platform.fp8_dtype())
+
+            # The kernel operates on non-padded inputs. Hence, pre-compiling
+            # triton kernel to avoid runtime compilation for unseen batch sizes
+            # Pre-compile for batch sizes 1 to 1024 to cover most use-cases.
+            # On DS-R1, this step adds roughly 50s to the model loading time.
+            max_batch_size = 1024  # [ToDo] Find the optimal upper limit
+            pre_compilation_list = list(range(1, max_batch_size + 1))
+            if is_global_first_rank():
+                pre_compilation_list = tqdm(
+                    pre_compilation_list,
+                    desc="[Aiter Triton] Pre-compiling fp8 BMM kernel",
+                    total=max_batch_size,
+                )
+
+            for m in pre_compilation_list:
+                x = torch.empty((self.W_K.shape[0], m, self.W_K.shape[2]),
+                                dtype=torch.bfloat16,
+                                device=self.W_K.device)
+                aiter_triton_fp8_bmm(x,
+                                     self.W_K,
+                                     self.W_K_scale,
+                                     group_size=128,
+                                     transpose_bm=True)
+
+                x = torch.empty((self.W_V.shape[0], m, self.W_V.shape[2]),
+                                dtype=torch.bfloat16,
+                                device=self.W_V.device)
+                aiter_triton_fp8_bmm(x,
+                                     self.W_V,
+                                     self.W_V_scale,
+                                     group_size=128,
+                                     transpose_bm=True)
+        else:
+            # Convert from (L, N, V) to (N, L, V)
+            self.W_UV = W_UV.transpose(0, 1)
+            # Convert from (L, N, P) to (N, P, L)
+            self.W_UK_T = W_UK.permute(1, 2, 0)
+
+    def _v_up_proj(self, x: torch.Tensor, out: torch.Tensor):
+        # Convert from (B, N, L) to (N, B, L)
+        x = x.view(-1, self.num_heads, self.kv_lora_rank).transpose(0, 1)
+        if is_rocm_aiter_fp8bmm_enabled():
+            # Multiply + Transpose (N, B, L) x (N, L, V)->(N, B, V)->(B, N, V)
+            x = aiter_triton_fp8_bmm(x,
+                                     self.W_V,
+                                     self.W_V_scale,
+                                     group_size=128,
+                                     transpose_bm=True)
+            # Convert from (B, N, V) to (B, N * V)
+            x = x.reshape(-1, self.num_heads * self.v_head_dim)
+            # Copy result
+            out.copy_(x)
+        else:
+            # Convert from (B, N * V) to (N, B, V)
+            out = out.view(-1, self.num_heads, self.v_head_dim).transpose(0, 1)
+
+            # Multiply (N, B, L) x (N, L, V) -> (N, B, V)
+            torch.bmm(x, self.W_UV, out=out)  # Reuse "out" to make it "hot"
+
+            # Convert from (N, B, V) to (B, N * V)
+            out_new = out.transpose(0, 1).reshape(
+                -1, self.num_heads * self.v_head_dim)
+
+            # Adjust output buffer shape back to the original (B, N * V)
+            N, B, V = out.shape
+            out.resize_((B, N * V))
+            out.copy_(out_new)  # Copy result
+
+
+class MLACommonImpl(MLACommonBaseImpl[M], Generic[M]):
+    """
+    NOTE: Please read the comment at the top of the file before trying to
+    understand this class
+    """
+
+    def __init__(self, *args, **kwargs) -> None:
+        super().__init__(*args, **kwargs)
+
         if use_flashinfer_prefill():
             logger.debug_once("Using FlashInfer prefill for MLA")
             self._run_prefill_context_chunk = self._run_prefill_context_chunk_fi
@@ -1154,36 +1291,6 @@ def _run_prefill_context_chunk_cudnn(self,
             True,  #Indicates actual_seq_lens are on GPU or CPU.
         )
 
-    def _v_up_proj(self, x: torch.Tensor, out: torch.Tensor):
-        # Convert from (B, N, L) to (N, B, L)
-        x = x.view(-1, self.num_heads, self.kv_lora_rank).transpose(0, 1)
-        if is_rocm_aiter_fp8bmm_enabled():
-            # Multiply + Transpose (N, B, L) x (N, L, V)->(N, B, V)->(B, N, V)
-            x = aiter_triton_fp8_bmm(x,
-                                     self.W_V,
-                                     self.W_V_scale,
-                                     group_size=128,
-                                     transpose_bm=True)
-            # Convert from (B, N, V) to (B, N * V)
-            x = x.reshape(-1, self.num_heads * self.v_head_dim)
-            # Copy result
-            out.copy_(x)
-        else:
-            # Convert from (B, N * V) to (N, B, V)
-            out = out.view(-1, self.num_heads, self.v_head_dim).transpose(0, 1)
-
-            # Multiply (N, B, L) x (N, L, V) -> (N, B, V)
-            torch.bmm(x, self.W_UV, out=out)  # Reuse "out" to make it "hot"
-
-            # Convert from (N, B, V) to (B, N * V)
-            out_new = out.transpose(0, 1).reshape(
-                -1, self.num_heads * self.v_head_dim)
-
-            # Adjust output buffer shape back to the original (B, N * V)
-            N, B, V = out.shape
-            out.resize_((B, N * V))
-            out.copy_(out_new)  # Copy result
-
     def process_weights_after_loading(self, act_dtype: torch.dtype):
 
         def get_layer_weight(layer):
@@ -1455,6 +1562,7 @@ def _forward_prefill(
         attn_metadata: MLACommonMetadata,
         k_scale: torch.Tensor,
     ) -> torch.Tensor:
+        # TODO (zyongye): Prefill function here
         assert attn_metadata.prefill is not None
         assert self.dcp_world_size is not None
 
diff --git a/vllm/v1/attention/backends/mla/flashmla.py b/vllm/v1/attention/backends/mla/flashmla.py
index ac0524ba088b..67c21f83cf5d 100644
--- a/vllm/v1/attention/backends/mla/flashmla.py
+++ b/vllm/v1/attention/backends/mla/flashmla.py
@@ -177,6 +177,7 @@ def _forward_decode(
         attn_metadata: FlashMLAMetadata,
         layer: AttentionLayer,
     ) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
+        # TODO: (zyongye) decode function for mla here
         assert kv_c_and_k_pe_cache.numel() > 0
         assert attn_metadata.decode is not None
 
diff --git a/vllm/v1/attention/backends/mla/flashmla_sparse.py b/vllm/v1/attention/backends/mla/flashmla_sparse.py
new file mode 100644
index 000000000000..36c3c188042c
--- /dev/null
+++ b/vllm/v1/attention/backends/mla/flashmla_sparse.py
@@ -0,0 +1,544 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import math
+from dataclasses import dataclass
+from typing import TYPE_CHECKING, ClassVar, Optional
+
+import numpy as np
+import torch
+
+from vllm import _custom_ops as ops
+from vllm.attention.backends.abstract import (AttentionBackend, AttentionLayer,
+                                              AttentionMetadata)
+from vllm.attention.backends.utils import get_mla_dims
+from vllm.attention.ops.flashmla import (flash_mla_sparse_prefill,
+                                         flash_mla_with_kvcache,
+                                         get_mla_metadata)
+from vllm.config import VllmConfig
+from vllm.logger import init_logger
+from vllm.platforms import current_platform
+from vllm.triton_utils import tl, triton
+from vllm.utils import cdiv
+from vllm.v1.attention.backends.mla.common import MLACommonBaseImpl
+from vllm.v1.attention.backends.utils import (AttentionCGSupport,
+                                              AttentionMetadataBuilder,
+                                              CommonAttentionMetadata)
+from vllm.v1.kv_cache_interface import AttentionSpec
+
+if TYPE_CHECKING:
+    from vllm.model_executor.models.deepseek_v2 import Indexer
+
+logger = init_logger(__name__)
+"""
+NOTE: FlashMLA Sparse uses an fp8 cache with the following format
+
+In the "FP8 with scale" format, each token's KV cache is 656 Bytes, 
+structured as:
+-   **First 512 bytes:** The "quantized NoPE" part, containing 512 
+    `float8_e4m3` values.
+-   **Next 16 bytes:** Scale factors, containing 4 `float32` values. 
+    The first `float32` is the scale for the first 128 `float8_e4m3` values, 
+    the second for the next 128, and so on.
+-   **Last 128 bytes:** The "RoPE" part, containing 64 `bfloat16` values. This 
+    part is not quantized for accuracy.
+"""
+
+
+def _lse2_to_lse(lse_base2: torch.Tensor) -> torch.Tensor:
+    # Convert base-2 LSE to natural-log LSE
+    # Keep FP32 for numerical stability during the merge.
+    return (lse_base2.to(torch.float32) * math.log(2.0))
+
+
+class FlashMLASparseBackend(AttentionBackend):
+
+    accept_output_buffer: bool = True
+
+    @staticmethod
+    def get_name() -> str:
+        return "FLASHMLA_SPARSE_VLLM_V1"
+
+    @staticmethod
+    def get_metadata_cls() -> type[AttentionMetadata]:
+        return FlashMLASparseMetadata
+
+    @staticmethod
+    def get_builder_cls() -> type["FlashMLASparseMetadataBuilder"]:
+        return FlashMLASparseMetadataBuilder
+
+    @staticmethod
+    def get_impl_cls() -> type["FlashMLASparseImpl"]:
+        return FlashMLASparseImpl
+
+    @staticmethod
+    def get_kv_cache_shape(
+        num_blocks: int,
+        block_size: int,
+        num_kv_heads: int,  # assumed to be 1 for MLA
+        head_size: int,
+        cache_dtype_str: str = "auto",
+    ) -> tuple[int, ...]:
+        if cache_dtype_str == "fp8_ds_mla":
+            # custom storage fromat is 656 bytes
+            #  see FlashMLA readme.md for details
+            return (num_blocks, block_size, 656)
+        else:
+            return (num_blocks, block_size, head_size)
+
+    @classmethod
+    def get_supported_dtypes(cls) -> list[torch.dtype]:
+        return [torch.bfloat16]
+
+    @classmethod
+    def get_supported_head_sizes(cls) -> list[int]:
+        return [576]
+
+
+@dataclass
+class MLASparsePrefillMetadata:
+    # NOTE(Chen): not call it "FlashMLASparsePrefillMetadata" because
+    # the kernel is not from flashmla
+    block_table: torch.Tensor
+    has_context: bool = False
+    context_lens: Optional[torch.Tensor] = None
+
+
+@dataclass
+class FlashMLASparseDecodeAndContextMetadata:
+    scheduler_metadata: torch.Tensor = None
+    num_splits: torch.Tensor = None
+    cache_lens: torch.Tensor = None
+    prefill_context_lengths: Optional[torch.Tensor] = None
+    prefill_new_k_start_locs: Optional[torch.Tensor] = None
+    dummy_block_table: torch.Tensor = None
+
+    def filter_prefill_indices(
+            self, indices: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+        assert self.prefill_context_lengths is not None
+        prefill_context_lengths = self.prefill_context_lengths.unsqueeze(-1)
+        context_indices = torch.where(indices < prefill_context_lengths,
+                                      indices, -1)
+        new_token_indices = torch.where(indices >= prefill_context_lengths,
+                                        indices - prefill_context_lengths, -1)
+        return context_indices, new_token_indices
+
+
+@dataclass
+class FlashMLASparseMetadata:
+    num_reqs: int
+    max_query_len: int
+    max_seq_len: int
+
+    num_actual_tokens: int  # Number of tokens excluding padding.
+    query_start_loc: torch.Tensor
+    slot_mapping: torch.Tensor
+
+    block_table: torch.Tensor
+    req_id_per_token: torch.Tensor
+    block_size: int = 64
+    topk_tokens: int = 2048
+
+    @dataclass
+    class FP8KernelMetadata:
+        scheduler_metadata: Optional[torch.Tensor]
+        num_splits: torch.Tensor
+        dummy_block_table: torch.Tensor
+        cache_lens: torch.Tensor
+
+    fp8_extra_metadata: Optional[FP8KernelMetadata] = None
+
+
+@triton.jit
+def _convert_req_index_to_global_index_kernel(
+    req_id_ptr,  # int32 [num_tokens]
+    block_table_ptr,  # int32 [num_requests, max_num_blocks_per_req]
+    token_indices_ptr,  # int32 [num_tokens, NUM_TOPK_TOKENS]
+    out_ptr,  # int32 [num_tokens, NUM_TOPK_TOKENS]
+    # shapes (compile-time where possible)
+    max_num_blocks_per_req: tl.constexpr,
+    BLOCK_SIZE: tl.constexpr,
+    BLOCK_N: tl.constexpr,  # tile width along columns
+    # strides (in elements)
+    bt_stride0,
+    bt_stride1,
+    ti_stride0,
+    ti_stride1,
+    out_stride0,
+    out_stride1,
+):
+    # program_id(0) -> token_id (row)
+    # program_id(1) -> tile index along columns
+    token_id = tl.program_id(0)
+    tile_id = tl.program_id(1)
+
+    # Each program covers BLOCK_N consecutive columns
+    indice_id = tile_id * BLOCK_N + tl.arange(0, BLOCK_N)
+
+    # Load request id for this token (no mask: grid is exact)
+    req = tl.load(req_id_ptr + token_id)
+
+    # Load token indices for this tile
+    ti_ptr = token_indices_ptr + token_id * ti_stride0 + indice_id * ti_stride1
+    tok = tl.load(ti_ptr)  # int32
+
+    # Only token == -1 should propagate as -1
+    is_invalid_tok = tok < 0
+
+    # Compute block id and in-block offset
+    block_id = tok // BLOCK_SIZE
+    inblock_off = tok % BLOCK_SIZE
+
+    # Guard block_table access
+    valid_block = block_id < max_num_blocks_per_req
+    bt_ptr = block_table_ptr + req * bt_stride0 + block_id * bt_stride1
+    base = tl.load(bt_ptr, mask=valid_block, other=0)
+
+    # If token == -1 OR block_id OOB, output -1; else base * BLOCK_SIZE + offset
+    out_val = tl.where(is_invalid_tok | (~valid_block), -1,
+                       base * BLOCK_SIZE + inblock_off)
+
+    # Store results
+    out_ptr_ij = out_ptr + token_id * out_stride0 + indice_id * out_stride1
+    tl.store(out_ptr_ij, out_val)
+
+
+def triton_convert_req_index_to_global_index(
+        req_id: torch.Tensor,  # int32 [num_tokens]
+        block_table: torch.
+    Tensor,  # int32 [num_requests, max_num_blocks_per_req]
+        token_indices: torch.Tensor,  # int32 [num_tokens, NUM_TOPK_TOKENS]
+        BLOCK_SIZE: int = 64,
+        NUM_TOPK_TOKENS: int = 2048,
+        BLOCK_N: int = 128,  # tile width along columns
+):
+    """
+    out[token_id, indice_id] =
+        block_table[req_id[token_id], 
+            token_indices[token_id, indice_id] // BLOCK_SIZE] * BLOCK_SIZE
+        + token_indices[token_id, indice_id] % BLOCK_SIZE
+
+    Only when token_indices[token_id, indice_id] == -1 do we output -1.
+    For safety, we also output -1 if the derived block_id would be 
+        out-of-bounds.
+    """
+    assert req_id.dtype == torch.int32
+    assert block_table.dtype == torch.int32
+    assert token_indices.dtype == torch.int32
+    assert token_indices.shape[1] == NUM_TOPK_TOKENS
+    assert NUM_TOPK_TOKENS % BLOCK_N == 0, \
+        f"NUM_TOPK_TOKENS ({NUM_TOPK_TOKENS}) must be divisible by" \
+        f"BLOCK_N ({BLOCK_N})"
+
+    num_tokens = req_id.shape[0]
+    num_requests, max_num_blocks_per_req = block_table.shape
+    tiles_per_row = NUM_TOPK_TOKENS // BLOCK_N
+
+    # Ensure contiguous tensors on the same device
+    req_id_c = req_id.contiguous()
+    block_table_c = block_table.contiguous()
+    token_indices_c = token_indices.contiguous()
+    out = torch.empty_like(token_indices_c)
+
+    # Strides in elements
+    bt_stride0, bt_stride1 = block_table_c.stride()
+    ti_stride0, ti_stride1 = token_indices_c.stride()
+    out_stride0, out_stride1 = out.stride()
+
+    # Exact 2D grid: tokens × column tiles
+    grid = (num_tokens, tiles_per_row)
+
+    _convert_req_index_to_global_index_kernel[grid](
+        req_id_c,
+        block_table_c,
+        token_indices_c,
+        out,
+        # shapes / constexprs
+        max_num_blocks_per_req,
+        BLOCK_SIZE,
+        BLOCK_N,
+        # strides
+        bt_stride0,
+        bt_stride1,
+        ti_stride0,
+        ti_stride1,
+        out_stride0,
+        out_stride1,
+    )
+    return out
+
+
+@dataclass
+class FlashMLASparseMetadataBuilder(
+        AttentionMetadataBuilder[FlashMLASparseMetadata]):
+    cudagraph_support: ClassVar[AttentionCGSupport] = \
+        AttentionCGSupport.UNIFORM_BATCH
+
+    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
+                 vllm_config: VllmConfig, device: torch.device):
+
+        cache_config = vllm_config.cache_config
+        self.kv_cache_spec = kv_cache_spec
+        self.model_config = vllm_config.model_config
+        parallel_config = vllm_config.parallel_config
+        self.device = device
+
+        props = torch.cuda.get_device_properties(device)
+        sm_count = props.multi_processor_count
+
+        self.num_heads = self.model_config.get_num_attention_heads(
+            parallel_config)
+        self.mla_dims = get_mla_dims(self.model_config)
+        self.topk_tokens = vllm_config.model_config.hf_config.index_topk
+        self.use_fp8_kv_cache = cache_config.cache_dtype == "fp8_ds_mla"
+        self.topk_tokens_tensor = torch.tensor([self.topk_tokens],
+                                               device=device,
+                                               dtype=torch.int32)
+        self.max_model_len_tensor = torch.tensor(
+            [self.model_config.max_model_len],
+            device=device,
+            dtype=torch.int32)
+        # this is ignored by `flash_mla_with_kvcache` if indices not None
+        self.dummy_block_table = torch.empty((1, 1),
+                                             dtype=torch.int32,
+                                             device=self.device)
+
+        # Equation taken from FlashMLA/csrc/pybind.cpp
+        h_q, h_k = self.num_heads, 1
+        s_q = 1  # inversely proportional to s_q, so s_q = 1 is the largest
+        max_num_sm_parts = int(
+            max((sm_count // 2) / h_k // (cdiv(h_q // h_k, 2 * 64) * s_q), 1))
+        if current_platform.is_device_capability(100):
+            max_num_sm_parts *= 2
+        self.tile_scheduler_metadata_buffer = torch.empty(
+            # TileSchedulerMetaDataSize = 8
+            # see: FlashMLA/csrc/params.h
+            (max_num_sm_parts, 8),
+            dtype=torch.int32,
+            device=device)
+        self.num_splits_buffer = torch.empty(
+            # We pack all the tokens into one batch for sparse attention.
+            # Otherwise, we can exceed the sm of `get_mla_metadata`.
+            (
+                2, ),
+            dtype=torch.int32,
+            device=device)
+        self.req_id_per_token_buffer = torch.empty(
+            (vllm_config.scheduler_config.max_num_batched_tokens, ),
+            dtype=torch.int32,
+            device=device)
+
+    def build(self,
+              common_prefix_len: int,
+              common_attn_metadata: CommonAttentionMetadata,
+              fast_build: bool = False) -> FlashMLASparseMetadata:
+
+        num_tokens = common_attn_metadata.num_actual_tokens
+        starts = np.asarray(common_attn_metadata.query_start_loc_cpu,
+                            dtype=np.int32)
+        seg_lengths = np.diff(starts)
+        req_id_per_token = np.repeat(
+            np.arange(seg_lengths.shape[0], dtype=np.int32), seg_lengths)
+        # Zero-fill for cudagraphs
+        self.req_id_per_token_buffer.fill_(0)
+        self.req_id_per_token_buffer[:req_id_per_token.shape[0]]\
+            .copy_(torch.from_numpy(req_id_per_token), non_blocking=True)
+        req_id_per_token = self.req_id_per_token_buffer[:num_tokens]
+
+        fp8_extra_metadata = None
+        if self.use_fp8_kv_cache:
+            tile_scheduler_metadata, num_splits = get_mla_metadata(
+                cache_seqlens=self.topk_tokens_tensor,
+                num_q_tokens_per_head_k=num_tokens * self.num_heads,
+                topk=self.topk_tokens,
+                num_heads_q=self.num_heads,
+                num_heads_k=1,
+                is_fp8_kvcache=True,
+            )
+
+            num_sm_parts = tile_scheduler_metadata.size(0)
+            # Copy to persistent buffer for full-CG support
+            tile_scheduler_metadata_buffer = \
+                self.tile_scheduler_metadata_buffer[:num_sm_parts]
+            tile_scheduler_metadata_buffer.copy_(tile_scheduler_metadata)
+            self.num_splits_buffer.copy_(num_splits)
+
+            fp8_extra_metadata = FlashMLASparseMetadata.FP8KernelMetadata(
+                scheduler_metadata=tile_scheduler_metadata_buffer,
+                num_splits=self.num_splits_buffer,
+                # cache_lens and block_table are basically unused in sparse case
+                # but the decode kernel will treat -1 and indices >= cache_lens
+                # as invalid so we make sure cache_lens is large enough to not
+                # accidentally mark indices invalid, we will use -1 exclusively
+                # to mark invalid indices
+                cache_lens=self.max_model_len_tensor,
+                dummy_block_table=self.dummy_block_table)
+
+        metadata = FlashMLASparseMetadata(
+            num_reqs=common_attn_metadata.num_reqs,
+            max_query_len=common_attn_metadata.max_query_len,
+            max_seq_len=common_attn_metadata.max_seq_len,
+            num_actual_tokens=common_attn_metadata.num_actual_tokens,
+            query_start_loc=common_attn_metadata.query_start_loc,
+            slot_mapping=common_attn_metadata.slot_mapping,
+            block_table=common_attn_metadata.block_table_tensor,
+            req_id_per_token=req_id_per_token,
+            block_size=self.kv_cache_spec.block_size,
+            topk_tokens=self.topk_tokens,
+            fp8_extra_metadata=fp8_extra_metadata,
+        )
+        return metadata
+
+
+class FlashMLASparseImpl(MLACommonBaseImpl[FlashMLASparseMetadata]):
+
+    def __init__(
+            self,
+            num_heads: int,
+            head_size: int,
+            scale: float,
+            num_kv_heads: int,
+            alibi_slopes: Optional[list[float]],
+            sliding_window: Optional[int],
+            kv_cache_dtype: str,
+            logits_soft_cap: Optional[float],
+            attn_type: str,
+            kv_sharing_target_layer_name: Optional[str],
+            # MLA Specific Arguments
+            topk_indice_buffer: Optional[torch.Tensor] = None,
+            indexer: Optional["Indexer"] = None,
+            **mla_args) -> None:
+        super().__init__(num_heads, head_size, scale, num_kv_heads,
+                         alibi_slopes, sliding_window, kv_cache_dtype,
+                         logits_soft_cap, attn_type,
+                         kv_sharing_target_layer_name, **mla_args)
+        self.softmax_scale = scale
+        assert indexer is not None
+        self.topk_indices_buffer = indexer.topk_indices_buffer
+        self.padding = 128 if current_platform.is_device_capability(
+            100) else 64
+
+    def _forward_bf16_kv(
+            self, q: torch.Tensor, kv_c_and_k_pe_cache: torch.Tensor,
+            topk_indices: torch.Tensor,
+            attn_metadata: FlashMLASparseMetadata) -> torch.Tensor:
+        num_tokens = q.shape[0]
+        kv_c_and_k_pe_cache = kv_c_and_k_pe_cache.view(
+            -1, 1, kv_c_and_k_pe_cache.shape[-1])
+
+        # NOTE(Chen): kernel requires num_local_head to be a multiple of
+        # 64 on hopper and 128 on blackwell
+        if self.num_heads % self.padding != 0:
+            assert self.padding % self.num_heads == 0
+            logger.warning_once(f"padding num_heads to {self.padding} \
+                    due to sparse attn kernel requirement")
+            q_padded = q.new_empty((q.shape[0], self.padding, q.shape[2]))
+            q_padded[:, :self.num_heads, :] = q
+            q = q_padded
+
+        topk_indices = topk_indices.view(num_tokens, 1, -1)
+        output = flash_mla_sparse_prefill(q, kv_c_and_k_pe_cache, topk_indices,
+                                          self.softmax_scale)[0]
+        output = output[:, :self.num_heads, :]
+        return output
+
+    def _forward_fp8_kv(self, q: torch.Tensor,
+                        kv_c_and_k_pe_cache: torch.Tensor,
+                        topk_indices: torch.Tensor,
+                        attn_metadata: FlashMLASparseMetadata) -> torch.Tensor:
+
+        assert attn_metadata.fp8_extra_metadata is not None
+        extra_metadata = attn_metadata.fp8_extra_metadata
+
+        _attn_out, _ = flash_mla_with_kvcache(
+            q=q.unsqueeze(0),  # unsqueeze to add batch_dim
+            k_cache=kv_c_and_k_pe_cache.view(torch.uint8).unsqueeze(-2),
+            block_table=extra_metadata.dummy_block_table,
+            head_dim_v=512,
+            cache_seqlens=extra_metadata.cache_lens,
+            tile_scheduler_metadata=extra_metadata.scheduler_metadata,
+            num_splits=extra_metadata.num_splits,
+            is_fp8_kvcache=True,
+            indices=topk_indices.unsqueeze(0),  # unsqueeze to add batch_dim
+            softmax_scale=self.softmax_scale,
+        )
+
+        return _attn_out
+
+    def forward(
+        self,
+        layer: AttentionLayer,
+        q: torch.Tensor,
+        k_c_normed: torch.Tensor,  # key in unified attn
+        k_pe: torch.Tensor,  # value in unified attn
+        kv_cache: torch.Tensor,
+        attn_metadata: FlashMLASparseMetadata,
+        output: Optional[torch.Tensor] = None,
+        output_scale: Optional[torch.Tensor] = None,
+        output_block_scale: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
+        # NOTE(lucas): for the sparse FlashMLA kernels the kernels want to use
+        # MQA 576/512 approach for both prefill and decode
+
+        assert output is not None, "Output tensor must be provided."
+
+        if output_scale is not None or output_block_scale is not None:
+            raise NotImplementedError(
+                "fused output quantization is not yet supported"
+                " for MLACommonImpl")
+
+        if attn_metadata is None:
+            # The zero fill is required when used with DP + EP
+            # to ensure all ranks within a DP group compute the
+            # same expert outputs.
+            return output.fill_(0)
+
+        num_actual_toks = attn_metadata.num_actual_tokens
+
+        # Inputs and outputs may be padded for CUDA graphs
+
+        q = q[:num_actual_toks, ...]
+        k_c_normed = k_c_normed[:num_actual_toks, ...]
+        k_pe = k_pe[:num_actual_toks, ...]
+
+        q_nope, q_pe = q.split([self.qk_nope_head_dim, self.qk_rope_head_dim],
+                               dim=-1)
+        # Convert from (B, N, P) to (N, B, P)
+        q_nope = q_nope.transpose(0, 1)
+        # Multiply (N, B, P) x (N, P, L) -> (N, B, L)
+        ql_nope = torch.bmm(q_nope, self.W_UK_T)
+        # Convert from (N, B, L) to (B, N, L)
+        ql_nope = ql_nope.transpose(0, 1)
+
+        topk_indices = self.topk_indices_buffer[:num_actual_toks]
+
+        # TODO: handle index / kv_cache correctly
+        topk_indices_global = triton_convert_req_index_to_global_index(
+            attn_metadata.req_id_per_token,
+            attn_metadata.block_table,
+            topk_indices,
+            BLOCK_SIZE=attn_metadata.block_size,
+            NUM_TOPK_TOKENS=attn_metadata.topk_tokens,
+        )
+
+        q = torch.cat([ql_nope, q_pe], dim=-1)
+
+        # write the latent and rope to kv cache
+        if kv_cache.numel() > 0:
+            ops.concat_and_cache_mla(
+                k_c_normed,
+                k_pe.squeeze(1),
+                kv_cache,
+                attn_metadata.slot_mapping.flatten(),
+                kv_cache_dtype=self.kv_cache_dtype,
+                scale=layer._k_scale,
+            )
+
+        if self.kv_cache_dtype != "fp8_ds_mla":
+            attn_out = self._forward_bf16_kv(q, kv_cache, topk_indices_global,
+                                             attn_metadata)
+        else:
+            attn_out = self._forward_fp8_kv(q, kv_cache, topk_indices_global,
+                                            attn_metadata)
+
+        self._v_up_proj(attn_out, out=output[:num_actual_toks])
+        return output
diff --git a/vllm/v1/attention/backends/mla/indexer.py b/vllm/v1/attention/backends/mla/indexer.py
new file mode 100644
index 000000000000..4e6b974ad74d
--- /dev/null
+++ b/vllm/v1/attention/backends/mla/indexer.py
@@ -0,0 +1,293 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+from dataclasses import dataclass
+from typing import ClassVar, Optional
+
+import torch
+
+from vllm.attention.backends.abstract import (AttentionBackend,
+                                              AttentionMetadata)
+from vllm.config import VllmConfig
+from vllm.logger import init_logger
+from vllm.utils.deep_gemm import get_paged_mqa_logits_metadata
+from vllm.v1.attention.backends.utils import (AttentionCGSupport,
+                                              AttentionMetadataBuilder,
+                                              CommonAttentionMetadata,
+                                              split_decodes_and_prefills)
+
+logger = init_logger(__name__)
+
+
+class DeepseekV32IndexerBackend(AttentionBackend):
+
+    @staticmethod
+    def get_metadata_cls() -> type["AttentionMetadata"]:
+        return DeepseekV32IndexerMetadata
+
+    @classmethod
+    def get_supported_head_sizes(cls) -> list[int]:
+        return [32, 64, 128]
+
+    @staticmethod
+    def get_builder_cls() -> type["DeepseekV32IndexerMetadataBuilder"]:
+        return DeepseekV32IndexerMetadataBuilder
+
+    @staticmethod
+    def get_kv_cache_shape(
+        num_blocks: int,
+        block_size: int,
+        num_kv_heads: int,
+        head_size: int,
+        cache_dtype_str: str = "auto",
+    ) -> tuple[int, ...]:
+        assert num_kv_heads == 1
+        return (num_blocks, block_size, head_size)
+
+    @staticmethod
+    def get_kv_cache_stride_order() -> tuple[int, ...]:
+        return (0, 1, 2)
+
+
+@dataclass
+class DeepseekV32IndexerPrefillMetadata:
+    block_table: torch.Tensor
+    query_start_loc: torch.Tensor
+    max_query_len: int
+    cu_seqlen_ks: torch.Tensor
+    cu_seqlen_ke: torch.Tensor
+    cu_seq_lens: torch.Tensor
+    total_seq_lens: int
+
+
+@dataclass
+class DeepSeekV32IndexerDecodeMetadata:
+    block_table: torch.Tensor
+    seq_lens: torch.Tensor
+    decode_lens: torch.Tensor
+    requires_padding: bool
+    schedule_metadata: torch.Tensor
+
+
+@dataclass
+class DeepseekV32IndexerMetadata:
+
+    # FIXME (zyongye)
+    # hacky way to access the data now, need to be in chunked meta
+    seq_lens: torch.Tensor
+
+    num_reqs: int
+    max_query_len: int
+    max_seq_len: int
+
+    num_actual_tokens: int  # Number of tokens excluding padding.
+    query_start_loc: torch.Tensor
+    slot_mapping: torch.Tensor
+    # The dimension of the attention heads
+    head_dim: int
+
+    # New for MLA (compared to FlashAttention)
+    # For handling prefill decode split
+    num_decodes: int
+    num_decode_tokens: int
+    num_prefills: int
+    num_prefill_tokens: int
+
+    decode: Optional[DeepSeekV32IndexerDecodeMetadata] = None
+    prefill: Optional[DeepseekV32IndexerPrefillMetadata] = None
+
+
+# TODO (zyongye) optimize this, this is now vibe coded
+def kv_spans_from_batches(
+        start_seq_loc: torch.Tensor,
+        seq_len_per_batch: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+    """
+    Args:
+      start_seq_loc: 1D long tensor [B+1], cumulative counts of 
+                     selected tokens per batch.
+            Example: [0, 2, 4, 7] -> 
+                     batch sizes (selected) [2, 2, 3], N=7 tokens total.
+      seq_len_per_batch: 1D long tensor [B], 
+                         full sequence length (KV length) of each batch.
+                         Example: [5, 9, 4].
+
+    Returns:
+      start_tensor: 1D long tensor [N], start offset in the 
+                    concatenated KV cache for each token's batch.
+      end_location: 1D long tensor [N], 
+                    **exclusive** end = start + token's local position.
+                    (So the attended KV slice is kv[start:end].)
+
+    Assumes each batch contributes its full `seq_len_per_batch[i]` 
+    keys to the KV cache, andthe selected tokens within a batch 
+    are the **last** `counts[i]` positions of that sequence.
+    """
+    q = start_seq_loc.to(dtype=torch.long)
+    L = seq_len_per_batch.to(dtype=torch.long, device=q.device)
+    assert q.dim() == 1 and L.dim() == 1
+    assert q.numel() == L.numel() + 1, "start_seq_loc must have length B+1"
+
+    # Selected tokens per batch and totals
+    counts = q[1:] - q[:-1]  # [B]
+    N = int(q[-1].item())  # total selected tokens
+    B = L.numel()
+    device = L.device
+
+    if N == 0:
+        return (torch.empty(0, dtype=torch.long, device=device),
+                torch.empty(0, dtype=torch.long, device=device))
+
+    # KV start offsets per batch in the concatenated KV cache
+    kv_starts_per_batch = torch.cumsum(L, dim=0) - L  # [B]
+
+    # For each selected token, which batch does it belong to?
+    batch_id = torch.repeat_interleave(torch.arange(B, device=device),
+                                       counts)  # [N]
+
+    # Map batch KV start to each token
+    start_tensor = kv_starts_per_batch[batch_id]  # [N]
+
+    # End-align local positions inside each batch:
+    # local_pos = L[b] - counts[b] + (1..counts[b])  for each batch b
+    L_expand = torch.repeat_interleave(L, counts)  # [N]
+    m_expand = torch.repeat_interleave(counts, counts)  # [N]
+    # position within the selected block: 1..counts[b]
+    pos_within = (torch.arange(N, device=device, dtype=torch.long) -
+                  torch.repeat_interleave(q[:-1], counts) + 1)
+
+    local_pos = L_expand - m_expand + pos_within  # [N], 1-based
+    end_location = start_tensor + local_pos  # exclusive end
+
+    return start_tensor.int(), end_location.int()
+
+
+def get_max_prefill_buffer_size(vllm_config: VllmConfig):
+    max_model_len = vllm_config.model_config.max_model_len
+    # max_num_batched_tokens = \
+    #     vllm_config.scheduler_config.max_num_batched_tokens
+    max_num_seq = vllm_config.scheduler_config.max_num_seqs
+    # NOTE(Chen): an estimated max size of flattened_kv. Need to double check.
+    return max_model_len * max_num_seq
+
+
+class DeepseekV32IndexerMetadataBuilder(AttentionMetadataBuilder):
+    cudagraph_support: ClassVar[AttentionCGSupport] = \
+        AttentionCGSupport.UNIFORM_BATCH
+
+    reorder_batch_threshold: int = 1
+
+    def __init__(self, *args, **kwargs):
+        super().__init__(*args, **kwargs)
+        scheduler_config = self.vllm_config.scheduler_config
+        #NOTE(Chen):an estimated max size of flattened_kv. Need to double check.
+        self.max_prefill_buffer_size = get_max_prefill_buffer_size(
+            self.vllm_config)
+        self.num_speculative_tokens = (
+            self.vllm_config.speculative_config.num_speculative_tokens
+            if self.vllm_config.speculative_config else 0)
+        # Now deepgemm fp8_paged_mqa_logits does not support next_n > 2
+        self.reorder_batch_threshold += min(self.num_speculative_tokens, 1)
+
+        props = torch.cuda.get_device_properties(self.device)
+        sm_count = props.multi_processor_count
+        self.num_sms = sm_count
+
+        self.decode_lens_buffer = torch.empty(
+            (scheduler_config.max_num_seqs, ),
+            dtype=torch.int32,
+            device=self.device)
+
+        # See: DeepGMM/csrc/apis/attention.hpp
+        self.scheduler_metadata_buffer = torch.empty((self.num_sms + 1, 2),
+                                                     dtype=torch.int32,
+                                                     device=self.device)
+
+    def build(self,
+              common_prefix_len: int,
+              common_attn_metadata: CommonAttentionMetadata,
+              fast_build: bool = False) -> DeepseekV32IndexerMetadata:
+
+        num_reqs = common_attn_metadata.num_reqs
+        num_tokens = common_attn_metadata.num_actual_tokens
+
+        device = self.device
+        block_table_tensor = common_attn_metadata.block_table_tensor
+
+        query_start_loc = common_attn_metadata.query_start_loc
+
+        num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = \
+            split_decodes_and_prefills(
+                common_attn_metadata,
+                decode_threshold=self.reorder_batch_threshold)
+
+        assert num_decodes + num_prefills == num_reqs
+        assert num_decode_tokens + num_prefill_tokens == num_tokens
+
+        prefill_metadata = None
+        if num_prefills > 0:
+            reqs_start = num_decodes
+            prefill_query_start_loc = query_start_loc[
+                reqs_start:] - query_start_loc[reqs_start]
+            cu_seqlen_ks, cu_seqlen_ke = kv_spans_from_batches(
+                prefill_query_start_loc,
+                common_attn_metadata.seq_lens[reqs_start:])
+            total_seq_lens = common_attn_metadata.seq_lens[reqs_start:].sum()
+            assert total_seq_lens < self.max_prefill_buffer_size
+            cu_seq_lens = torch.cat([
+                torch.zeros(1, dtype=torch.int32, device=device),
+                common_attn_metadata.seq_lens[reqs_start:].cumsum(dim=0)
+            ]).to(torch.int32).cuda()
+            prefill_metadata = DeepseekV32IndexerPrefillMetadata(
+                block_table=block_table_tensor[reqs_start:, ...],
+                query_start_loc=prefill_query_start_loc,
+                max_query_len=common_attn_metadata.max_query_len,
+                cu_seqlen_ks=cu_seqlen_ks,
+                cu_seqlen_ke=cu_seqlen_ke,
+                cu_seq_lens=cu_seq_lens,
+                total_seq_lens=total_seq_lens,
+            )
+
+        decode_metadata = None
+        if num_decodes > 0:
+            torch.diff(common_attn_metadata.query_start_loc[:num_decodes + 1],
+                       out=self.decode_lens_buffer[:num_decodes])
+            decode_lens = self.decode_lens_buffer[:num_decodes]
+            decode_lens_cpu = torch.diff(
+                common_attn_metadata.query_start_loc_cpu[:num_decodes + 1])
+
+            # Use CPU to avoid GPU sync; breaking async scheduling
+            requires_padding = (decode_lens_cpu.max()
+                                > decode_lens_cpu.min()).item()
+
+            seq_lens = common_attn_metadata.seq_lens[:num_decodes]
+
+            self.scheduler_metadata_buffer[:] = get_paged_mqa_logits_metadata(
+                seq_lens, self.kv_cache_spec.block_size, self.num_sms)
+            decode_metadata = DeepSeekV32IndexerDecodeMetadata(
+                block_table=common_attn_metadata.
+                block_table_tensor[:num_decodes, ...],
+                seq_lens=common_attn_metadata.seq_lens[:num_decodes],
+                decode_lens=decode_lens,
+                requires_padding=requires_padding,
+                schedule_metadata=self.scheduler_metadata_buffer,
+            )
+
+        attn_metadata = DeepseekV32IndexerMetadata(
+            seq_lens=common_attn_metadata.seq_lens,
+            num_reqs=common_attn_metadata.num_reqs,
+            max_query_len=common_attn_metadata.max_query_len,
+            max_seq_len=common_attn_metadata.max_seq_len,
+            num_actual_tokens=common_attn_metadata.num_actual_tokens,
+            query_start_loc=common_attn_metadata.query_start_loc,
+            slot_mapping=common_attn_metadata.slot_mapping,
+            head_dim=128,
+            num_decodes=num_decodes,
+            num_decode_tokens=num_decode_tokens,
+            num_prefills=num_prefills,
+            num_prefill_tokens=num_prefill_tokens,
+            prefill=prefill_metadata,
+            decode=decode_metadata,
+        )
+
+        # if get_tensor_model_parallel_rank() == 0:
+        #     logger.info(f"attn_metadata: {attn_metadata}")
+        return attn_metadata
diff --git a/vllm/v1/attention/backends/pallas.py b/vllm/v1/attention/backends/pallas.py
index 4cb4b85956bc..7ac1a063f565 100644
--- a/vllm/v1/attention/backends/pallas.py
+++ b/vllm/v1/attention/backends/pallas.py
@@ -102,6 +102,7 @@ def get_kv_cache_shape(
         block_size: int,
         num_kv_heads: int,
         head_size: int,
+        cache_dtype_str: str = "auto",
     ) -> tuple[int, ...]:
         padded_head_size = cdiv(
             head_size, TPU_HEAD_SIZE_ALIGNMENT) * TPU_HEAD_SIZE_ALIGNMENT
diff --git a/vllm/v1/attention/backends/rocm_aiter_fa.py b/vllm/v1/attention/backends/rocm_aiter_fa.py
index 96f8e92a2039..ed63c7b1bda6 100644
--- a/vllm/v1/attention/backends/rocm_aiter_fa.py
+++ b/vllm/v1/attention/backends/rocm_aiter_fa.py
@@ -360,6 +360,7 @@ def get_kv_cache_shape(
         block_size: int,
         num_kv_heads: int,
         head_size: int,
+        cache_dtype_str: str = "auto",
     ) -> tuple[int, ...]:
         if block_size % 16 != 0:
             raise ValueError("Block size must be a multiple of 16.")
diff --git a/vllm/v1/attention/backends/tree_attn.py b/vllm/v1/attention/backends/tree_attn.py
index 1d4ab4c96728..583756129a29 100644
--- a/vllm/v1/attention/backends/tree_attn.py
+++ b/vllm/v1/attention/backends/tree_attn.py
@@ -68,6 +68,7 @@ def get_kv_cache_shape(
         block_size: int,
         num_kv_heads: int,
         head_size: int,
+        cache_dtype_str: str = "auto",
     ) -> tuple[int, ...]:
         if block_size % 16 != 0:
             raise ValueError("Block size must be a multiple of 16.")
diff --git a/vllm/v1/attention/backends/triton_attn.py b/vllm/v1/attention/backends/triton_attn.py
index fc5ecf6ed3b6..3983c5edc76f 100644
--- a/vllm/v1/attention/backends/triton_attn.py
+++ b/vllm/v1/attention/backends/triton_attn.py
@@ -171,6 +171,7 @@ def get_kv_cache_shape(
         block_size: int,
         num_kv_heads: int,
         head_size: int,
+        cache_dtype_str: str = "auto",
     ) -> tuple[int, ...]:
         if block_size % 16 != 0:
             raise ValueError("Block size must be a multiple of 16.")
diff --git a/vllm/v1/attention/backends/xformers.py b/vllm/v1/attention/backends/xformers.py
index f739e6832274..9d667ee04f75 100644
--- a/vllm/v1/attention/backends/xformers.py
+++ b/vllm/v1/attention/backends/xformers.py
@@ -106,6 +106,7 @@ def get_kv_cache_shape(
         block_size: int,
         num_kv_heads: int,
         head_size: int,
+        cache_dtype_str: str = "auto",
     ) -> tuple[int, ...]:
         if block_size % 16 != 0:
             raise ValueError("Block size must be a multiple of 16.")
diff --git a/vllm/v1/core/kv_cache_utils.py b/vllm/v1/core/kv_cache_utils.py
index 47a41322c423..2ff1bb681d80 100644
--- a/vllm/v1/core/kv_cache_utils.py
+++ b/vllm/v1/core/kv_cache_utils.py
@@ -1103,7 +1103,9 @@ def unify_hybrid_kv_cache_specs(kv_cache_spec: dict[str, KVCacheSpec]):
         kv_cache_spec: The kv cache spec of each attention layer in the model
     """
 
-    if is_kv_cache_spec_uniform(kv_cache_spec):
+    if is_kv_cache_spec_uniform(
+            kv_cache_spec) or UniformTypeKVCacheSpecs.is_uniform_type(
+                kv_cache_spec):
         return
 
     logger.warning(
@@ -1128,7 +1130,6 @@ def unify_hybrid_kv_cache_specs(kv_cache_spec: dict[str, KVCacheSpec]):
                     num_kv_heads=spec.num_kv_heads,
                     head_size=spec.head_size,
                     dtype=spec.dtype,
-                    use_mla=spec.use_mla,
                     sliding_window=spec.sliding_window,
                 )
             elif isinstance(spec, ChunkedLocalAttentionSpec):
@@ -1137,11 +1138,11 @@ def unify_hybrid_kv_cache_specs(kv_cache_spec: dict[str, KVCacheSpec]):
                     num_kv_heads=spec.num_kv_heads,
                     head_size=spec.head_size,
                     dtype=spec.dtype,
-                    use_mla=spec.use_mla,
                     attention_chunk_size=spec.attention_chunk_size,
                 )
 
-    if not is_kv_cache_spec_uniform(kv_cache_spec):
+    if not (is_kv_cache_spec_uniform(kv_cache_spec)
+            or UniformTypeKVCacheSpecs.is_uniform_type(kv_cache_spec)):
         raise ValueError("Hybrid KV cache manager is disabled but failed to "
                          "convert the KV cache specs to one unified type.")
 
diff --git a/vllm/v1/core/single_type_kv_cache_manager.py b/vllm/v1/core/single_type_kv_cache_manager.py
index d27239164b0d..e889f7804e84 100644
--- a/vllm/v1/core/single_type_kv_cache_manager.py
+++ b/vllm/v1/core/single_type_kv_cache_manager.py
@@ -10,7 +10,7 @@
 from vllm.v1.kv_cache_interface import (ChunkedLocalAttentionSpec,
                                         CrossAttentionSpec, FullAttentionSpec,
                                         KVCacheSpec, MambaSpec,
-                                        SlidingWindowSpec)
+                                        MLAAttentionSpec, SlidingWindowSpec)
 from vllm.v1.request import Request
 
 
@@ -656,6 +656,7 @@ def remove_skipped_blocks(self, request_id: str,
 
 spec_manager_map: dict[type[KVCacheSpec], type[SingleTypeKVCacheManager]] = {
     FullAttentionSpec: FullAttentionManager,
+    MLAAttentionSpec: FullAttentionManager,
     SlidingWindowSpec: SlidingWindowManager,
     ChunkedLocalAttentionSpec: ChunkedLocalAttentionManager,
     MambaSpec: MambaManager,
diff --git a/vllm/v1/kv_cache_interface.py b/vllm/v1/kv_cache_interface.py
index f72cc8f93a6c..281816653540 100644
--- a/vllm/v1/kv_cache_interface.py
+++ b/vllm/v1/kv_cache_interface.py
@@ -59,13 +59,10 @@ class AttentionSpec(KVCacheSpec):
     num_kv_heads: int
     head_size: int
     dtype: torch.dtype
-    use_mla: bool
 
     @property
     def page_size_bytes(self) -> int:
-        # For MLA we only store a single latent vector
-        coef = 1 if self.use_mla else 2
-        return coef * self.block_size * self.num_kv_heads * self.head_size \
+        return 2 * self.block_size * self.num_kv_heads * self.head_size \
                 * get_dtype_size(self.dtype)
 
 
@@ -118,12 +115,13 @@ def merge(cls, specs: list[Self]) -> Self:
                              if spec.sliding_window is not None)
         attention_chunk_size = set(spec.attention_chunk_size for spec in specs
                                    if spec.attention_chunk_size is not None)
+        assert not any(isinstance(spec, MLAAttentionSpec) for spec in specs), (
+            "MLAAttentionSpec should be merged in MLAAttentionSpec.merge")
         merged_spec = cls(
             block_size=specs[0].block_size,
             num_kv_heads=specs[0].num_kv_heads,
             head_size=specs[0].head_size,
             dtype=specs[0].dtype,
-            use_mla=specs[0].use_mla,
             sliding_window=cls.merge_window_sizes(sliding_window),
             attention_chunk_size=cls.merge_window_sizes(attention_chunk_size),
         )
@@ -140,6 +138,38 @@ def merge(cls, specs: list[Self]) -> Self:
         return merged_spec
 
 
+@dataclass(frozen=True)
+class MLAAttentionSpec(FullAttentionSpec):
+    # TODO(Lucas/Chen): less hacky way to do this
+    cache_dtype_str: Optional[str] = None
+
+    @property
+    def page_size_bytes(self) -> int:
+        if self.cache_dtype_str == "fp8_ds_mla":
+            # See `vllm/v1/attention/backends/mla/flashmla_sparse.py`
+            #  for details.
+            return self.block_size * 656
+        return self.block_size * self.num_kv_heads * self.head_size \
+                * get_dtype_size(self.dtype)
+
+    @classmethod
+    def merge(cls, specs: list[Self]) -> Self:
+        assert all(isinstance(spec, MLAAttentionSpec) for spec in specs), (
+            "All attention layers in the same KV cache group must be "
+            "MLAAttentionSpec.")
+        cache_dtype_str_set = set(spec.cache_dtype_str for spec in specs)
+        assert len(cache_dtype_str_set) == 1, (
+            "All attention layers in the same KV cache group must use the same "
+            "quantization method.")
+        return cls(
+            block_size=specs[0].block_size,
+            num_kv_heads=specs[0].num_kv_heads,
+            head_size=specs[0].head_size,
+            dtype=specs[0].dtype,
+            cache_dtype_str=cache_dtype_str_set.pop(),
+        )
+
+
 @dataclass(frozen=True)
 class ChunkedLocalAttentionSpec(AttentionSpec):
     attention_chunk_size: int
@@ -163,9 +193,6 @@ def max_memory_usage_bytes(self, vllm_config: VllmConfig) -> int:
 class SlidingWindowSpec(AttentionSpec):
     sliding_window: int
 
-    def __post_init__(self):
-        assert not self.use_mla, "MLA is not supported for sliding window"
-
     def max_memory_usage_bytes(self, vllm_config: VllmConfig) -> int:
         assert vllm_config.parallel_config.decode_context_parallel_size == 1, \
             "DCP not support sliding window."
@@ -266,9 +293,13 @@ def is_uniform_type(cls, kv_cache_specs: dict[str, KVCacheSpec]) -> bool:
             # Different block sizes, not uniform.
             return False
         one_spec = next(iter(kv_cache_specs.values()))
-        if isinstance(one_spec, (FullAttentionSpec, CrossAttentionSpec)):
+        if isinstance(one_spec, FullAttentionSpec):
+            return all(
+                isinstance(spec, FullAttentionSpec)
+                for spec in kv_cache_specs.values())
+        elif isinstance(one_spec, CrossAttentionSpec):
             return all(
-                isinstance(spec, type(one_spec))
+                isinstance(spec, CrossAttentionSpec)
                 for spec in kv_cache_specs.values())
         elif isinstance(one_spec, SlidingWindowSpec):
             return all(
diff --git a/vllm/v1/spec_decode/eagle.py b/vllm/v1/spec_decode/eagle.py
index a2f7dbe5703f..bb11a543fd8b 100644
--- a/vllm/v1/spec_decode/eagle.py
+++ b/vllm/v1/spec_decode/eagle.py
@@ -17,6 +17,7 @@
 from vllm.logger import init_logger
 from vllm.model_executor.model_loader import get_model
 from vllm.model_executor.models import supports_multimodal
+from vllm.model_executor.models.deepseek_v2 import DeepseekV32IndexerCache
 from vllm.model_executor.models.llama_eagle3 import Eagle3LlamaForCausalLM
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.platforms import current_platform
@@ -32,6 +33,7 @@
 from vllm.v1.spec_decode.metadata import SpecDecodeMetadata
 from vllm.v1.utils import CpuGpuBuffer
 from vllm.v1.worker.gpu_input_batch import CachedRequestState, InputBatch
+from vllm.v1.worker.ubatching import dbo_current_ubatch_id
 
 logger = init_logger(__name__)
 
@@ -52,6 +54,7 @@ def __init__(
         self.method = self.speculative_config.method
 
         self.runner = runner
+        self.device = device
         self.dtype = vllm_config.model_config.dtype
         self.max_model_len = vllm_config.model_config.max_model_len
         self.block_size = vllm_config.cache_config.block_size
@@ -202,20 +205,30 @@ def propose(
 
         assert self.runner is not None
 
-        # Select the correct attention metadata builders for EAGLE layers.
-        # Get the attention metadata builders once and reuse for later.
-        builder = (self._get_attention_metadata_builder()
-                   if self.attn_metadata_builder is None else
-                   self.attn_metadata_builder)
-        attn_metadata = builder.build_for_drafting(  # type: ignore
-            common_attn_metadata=common_attn_metadata,
-            draft_index=0)
-
+        # FIXME: need to consider multiple kv_cache_groups
+        ubatch_id = dbo_current_ubatch_id()
+        attn_metadata_builder = \
+            self.runner.attn_groups[0][0].metadata_builders[ubatch_id]
+        attn_metadata = attn_metadata_builder.build_for_drafting(
+            common_attn_metadata=common_attn_metadata, draft_index=0)
+        # FIXME: support hybrid kv for draft model (remove separate indexer)
+        if self.draft_indexer_metadata_builder:
+            draft_indexer_metadata = (
+                self.draft_indexer_metadata_builder.build_for_drafting(
+                    common_attn_metadata=common_attn_metadata,
+                    draft_index=0,
+                ))
+        else:
+            draft_indexer_metadata = None
         # At this moment, we assume all eagle layers belong to the same KV
         # cache group, thus using the same attention metadata.
         per_layer_attn_metadata = {}
         for layer_name in self.attn_layer_names:
             per_layer_attn_metadata[layer_name] = attn_metadata
+        for layer_name in self.indexer_layer_names:
+            assert draft_indexer_metadata is not None
+            per_layer_attn_metadata[layer_name] = draft_indexer_metadata
+
         if self.use_cuda_graph and \
                 num_tokens <= self.cudagraph_batch_sizes[-1]:
             num_input_tokens = self.vllm_config.pad_for_cudagraph(num_tokens)
@@ -370,7 +383,7 @@ def propose(
                 exceeds_max_model_len, PADDING_SLOT_ID)
 
             # Rebuild attention metadata
-            attn_metadata = builder.build_for_drafting(  # type: ignore
+            attn_metadata = attn_metadata_builder.build_for_drafting(  # type: ignore
                 common_attn_metadata=common_attn_metadata,
                 draft_index=token_index + 1)
             for layer_name in self.attn_layer_names:
@@ -846,6 +859,10 @@ def load_model(self, target_model: nn.Module) -> None:
             self.vllm_config.speculative_config.draft_model_config
         target_attn_layer_names = set(
             get_layers_from_vllm_config(self.vllm_config, Attention).keys())
+        # FIXME: support hybrid kv for draft model
+        target_indexer_layer_names = set(
+            get_layers_from_vllm_config(self.vllm_config,
+                                        DeepseekV32IndexerCache).keys())
 
         from vllm.compilation.backends import set_model_tag
         with set_model_tag("eagle_head"):
@@ -855,8 +872,25 @@ def load_model(self, target_model: nn.Module) -> None:
         draft_attn_layer_names = (
             get_layers_from_vllm_config(self.vllm_config, Attention).keys() -
             target_attn_layer_names)
-
+        indexer_layers = get_layers_from_vllm_config(self.vllm_config,
+                                                     DeepseekV32IndexerCache)
+        draft_indexer_layer_names = (indexer_layers.keys() -
+                                     target_indexer_layer_names)
         self.attn_layer_names = list(draft_attn_layer_names)
+        self.indexer_layer_names = list(draft_indexer_layer_names)
+
+        if self.indexer_layer_names:
+            first_layer = self.indexer_layer_names[0]
+            self.draft_indexer_metadata_builder = (
+                indexer_layers[first_layer].get_attn_backend().get_builder_cls(
+                )(
+                    indexer_layers[first_layer].get_kv_cache_spec(),
+                    self.indexer_layer_names,
+                    self.vllm_config,
+                    self.device,
+                ))
+        else:
+            self.draft_indexer_metadata_builder = None
 
         if self.supports_mm_inputs:
             # Even if the target model is multimodal, we can also use
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 98e00f6d98a9..bb5c3ea74293 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -40,6 +40,7 @@
 from vllm.model_executor.layers.mamba.abstract import MambaBase
 from vllm.model_executor.layers.rotary_embedding import MRotaryEmbedding
 from vllm.model_executor.model_loader import TensorizerLoader, get_model_loader
+from vllm.model_executor.models.deepseek_v2 import DeepseekV32IndexerCache
 # yapf conflicts with isort for this block
 # yapf: disable
 from vllm.model_executor.models.interfaces import (SupportsMultiModal,
@@ -80,7 +81,8 @@
                                         EncoderOnlyAttentionSpec,
                                         FullAttentionSpec, KVCacheConfig,
                                         KVCacheGroupSpec, KVCacheSpec,
-                                        MambaSpec, SlidingWindowSpec,
+                                        MambaSpec, MLAAttentionSpec,
+                                        SlidingWindowSpec,
                                         UniformTypeKVCacheSpecs)
 # yapf: enable
 from vllm.v1.outputs import (EMPTY_MODEL_RUNNER_OUTPUT, AsyncModelRunnerOutput,
@@ -3154,7 +3156,7 @@ def _dummy_run(
                             attn_metadata_i = (attn_group\
                                                .get_metadata_builder(ubatch_id=ubid)\
                                                .build_for_cudagraph_capture(common_attn_metadata))
-                            for layer_name in kv_cache_group_spec.layer_names:
+                            for layer_name in attn_group.layer_names:
                                 assert type(attn_metadata) is list
                                 attn_metadata[ubid][
                                     layer_name] = attn_metadata_i
@@ -3162,7 +3164,7 @@ def _dummy_run(
                         assert type(attn_metadata) is dict
                         attn_metadata_i = attn_group.get_metadata_builder()\
                             .build_for_cudagraph_capture(common_attn_metadata)
-                        for layer_name in kv_cache_group_spec.layer_names:
+                        for layer_name in attn_group.layer_names:
                             attn_metadata[layer_name] = attn_metadata_i
 
         with self.maybe_dummy_run_with_lora(self.lora_config,
@@ -3915,8 +3917,11 @@ def _reshape_kv_cache_tensors(
                 if isinstance(kv_cache_spec, AttentionSpec):
                     has_attn = True
                     kv_cache_shape = attn_backend.get_kv_cache_shape(
-                        num_blocks, kv_cache_spec.block_size,
-                        kv_cache_spec.num_kv_heads, kv_cache_spec.head_size)
+                        num_blocks,
+                        kv_cache_spec.block_size,
+                        kv_cache_spec.num_kv_heads,
+                        kv_cache_spec.head_size,
+                        cache_dtype_str=self.cache_config.cache_dtype)
                     dtype = kv_cache_spec.dtype
                     try:
                         kv_cache_stride_order = \
@@ -4101,7 +4106,6 @@ def may_add_encoder_only_layers_to_kv_cache_config(self) -> None:
         Add encoder-only layers to the KV cache config.
         """
         block_size = self.vllm_config.cache_config.block_size
-        use_mla = self.vllm_config.model_config.use_mla
         encoder_only_attn_specs: dict[AttentionSpec,
                                       list[str]] = defaultdict(list)
         attn_layers = get_layers_from_vllm_config(self.vllm_config, Attention)
@@ -4111,8 +4115,7 @@ def may_add_encoder_only_layers_to_kv_cache_config(self) -> None:
                     block_size=block_size,
                     num_kv_heads=attn_module.num_kv_heads,
                     head_size=attn_module.head_size,
-                    dtype=self.kv_cache_dtype,
-                    use_mla=use_mla)
+                    dtype=self.kv_cache_dtype)
                 encoder_only_attn_specs[attn_spec].append(layer_name)
                 self.runner_only_attn_layers.add(layer_name)
         if len(encoder_only_attn_specs) > 0:
@@ -4134,6 +4137,7 @@ def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
 
         block_size = self.vllm_config.cache_config.block_size
         use_mla = self.vllm_config.model_config.use_mla
+        cache_dtype_str = self.vllm_config.cache_config.cache_dtype
         kv_cache_spec: dict[str, KVCacheSpec] = {}
         attn_layers = get_layers_from_vllm_config(self.vllm_config, Attention)
         for layer_name, attn_module in attn_layers.items():
@@ -4153,13 +4157,21 @@ def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
             # the attention backends
             if attn_module.attn_type == AttentionType.DECODER:
                 if attn_module.sliding_window is not None:
+                    assert not use_mla, "MLA is not supported for sliding" \
+                        "window"
                     kv_cache_spec[layer_name] = SlidingWindowSpec(
                         block_size=block_size,
                         num_kv_heads=attn_module.num_kv_heads,
                         head_size=attn_module.head_size,
                         dtype=self.kv_cache_dtype,
-                        sliding_window=attn_module.sliding_window,
-                        use_mla=use_mla)
+                        sliding_window=attn_module.sliding_window)
+                elif use_mla:
+                    kv_cache_spec[layer_name] = MLAAttentionSpec(
+                        block_size=block_size,
+                        num_kv_heads=attn_module.num_kv_heads,
+                        head_size=attn_module.head_size,
+                        dtype=self.kv_cache_dtype,
+                        cache_dtype_str=cache_dtype_str)
                 elif self.attention_chunk_size is not None \
                         and isinstance(attn_module, ChunkedLocalAttention):
                     kv_cache_spec[layer_name] = ChunkedLocalAttentionSpec(
@@ -4167,22 +4179,19 @@ def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
                         num_kv_heads=attn_module.num_kv_heads,
                         head_size=attn_module.head_size,
                         dtype=self.kv_cache_dtype,
-                        attention_chunk_size=self.attention_chunk_size,
-                        use_mla=use_mla)
+                        attention_chunk_size=self.attention_chunk_size)
                 else:
                     kv_cache_spec[layer_name] = FullAttentionSpec(
                         block_size=block_size,
                         num_kv_heads=attn_module.num_kv_heads,
                         head_size=attn_module.head_size,
-                        dtype=self.kv_cache_dtype,
-                        use_mla=use_mla)
+                        dtype=self.kv_cache_dtype)
             elif attn_module.attn_type == AttentionType.ENCODER_DECODER:
                 kv_cache_spec[layer_name] = CrossAttentionSpec(
                     block_size=block_size,
                     num_kv_heads=attn_module.num_kv_heads,
                     head_size=attn_module.head_size,
-                    dtype=self.kv_cache_dtype,
-                    use_mla=use_mla)
+                    dtype=self.kv_cache_dtype)
             elif attn_module.attn_type in (AttentionType.ENCODER,
                                            AttentionType.ENCODER_ONLY):
                 # encoder-only attention does not need KV cache.
@@ -4219,6 +4228,10 @@ def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
                         self.speculative_config.num_speculative_tokens
                         if self.speculative_config else 0),
                 )
+        ds_indexer_layers = get_layers_from_vllm_config(
+            self.vllm_config, DeepseekV32IndexerCache)
+        for layer_name, ds_indexer_module in ds_indexer_layers.items():
+            kv_cache_spec[layer_name] = ds_indexer_module.get_kv_cache_spec()
 
         return kv_cache_spec
 
diff --git a/vllm/v1/worker/tpu_model_runner.py b/vllm/v1/worker/tpu_model_runner.py
index 2405f978ca73..0b1c3d7c0e88 100644
--- a/vllm/v1/worker/tpu_model_runner.py
+++ b/vllm/v1/worker/tpu_model_runner.py
@@ -537,7 +537,6 @@ def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
                         head_size=attn_module.head_size,
                         dtype=self.kv_cache_dtype,
                         sliding_window=attn_module.sliding_window,
-                        use_mla=False,
                     )
                 else:
                     kv_cache_spec[layer_name] = FullAttentionSpec(
@@ -545,7 +544,6 @@ def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
                         num_kv_heads=attn_module.num_kv_heads,
                         head_size=attn_module.head_size,
                         dtype=self.kv_cache_dtype,
-                        use_mla=False,
                     )
             elif attn_module.attn_type in (AttentionType.ENCODER,
                                            AttentionType.ENCODER_ONLY):

From 733e515b60061e1774f32f0561b84d8ffd482fd2 Mon Sep 17 00:00:00 2001
From: a120092009 <33205509+a120092009@users.noreply.github.com>
Date: Tue, 30 Sep 2025 17:59:47 +0800
Subject: [PATCH 038/193] [Doc] Add Cambricon MLU support (#25942)

Signed-off-by: a120092009 <zhaoty0121@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/getting_started/installation/README.md | 1 +
 1 file changed, 1 insertion(+)

diff --git a/docs/getting_started/installation/README.md b/docs/getting_started/installation/README.md
index 5e57d23f4a1d..a4e63e426b9b 100644
--- a/docs/getting_started/installation/README.md
+++ b/docs/getting_started/installation/README.md
@@ -25,3 +25,4 @@ The backends below live **outside** the main `vllm` repository and follow the
 | MetaX MACA GPU | N/A, install from source | <https://github.com/MetaX-MACA/vLLM-metax> |
 | Rebellions ATOM / REBEL NPU | `vllm-rbln` | <https://github.com/rebellions-sw/vllm-rbln> |
 | IBM Spyre AIU | `vllm-spyre` | <https://github.com/vllm-project/vllm-spyre> |
+| Cambricon MLU | `vllm-mlu` | <https://github.com/Cambricon/vllm-mlu> |

From 893c7f8c1728b5d8e3a994fc5df0595fd2211ab0 Mon Sep 17 00:00:00 2001
From: Sergio Paniego Blanco <sergiopaniegoblanco@gmail.com>
Date: Tue, 30 Sep 2025 12:10:55 +0200
Subject: [PATCH 039/193] Updated TRL integration docs (#25684)

Signed-off-by: sergiopaniego <sergiopaniegoblanco@gmail.com>
Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Sergio Paniego Blanco <sergiopaniegoblanco@gmail.com>
Co-authored-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/training/trl.md | 52 +++++++++++++++++++++++++++++++++++++++-----
 mkdocs.yaml          |  1 -
 2 files changed, 47 insertions(+), 6 deletions(-)

diff --git a/docs/training/trl.md b/docs/training/trl.md
index c7c1a5a3bbd1..acf48cc4ecb3 100644
--- a/docs/training/trl.md
+++ b/docs/training/trl.md
@@ -1,12 +1,54 @@
 # Transformers Reinforcement Learning
 
-Transformers Reinforcement Learning (TRL) is a full stack library that provides a set of tools to train transformer language models with methods like Supervised Fine-Tuning (SFT), Group Relative Policy Optimization (GRPO), Direct Preference Optimization (DPO), Reward Modeling, and more. The library is integrated with 🤗 transformers.
+[Transformers Reinforcement Learning](https://huggingface.co/docs/trl) (TRL) is a full stack library that provides a set of tools to train transformer language models with methods like Supervised Fine-Tuning (SFT), Group Relative Policy Optimization (GRPO), Direct Preference Optimization (DPO), Reward Modeling, and more. The library is integrated with 🤗 transformers.
 
 Online methods such as GRPO or Online DPO require the model to generate completions. vLLM can be used to generate these completions!
 
-See the guide [vLLM for fast generation in online methods](https://huggingface.co/docs/trl/main/en/speeding_up_training#vllm-for-fast-generation-in-online-methods) in the TRL documentation for more information.
+See the [vLLM integration guide](https://huggingface.co/docs/trl/main/en/vllm_integration) in the TRL documentation for more information.
+
+TRL currently supports the following online trainers with vLLM:
+
+- [GRPO](https://huggingface.co/docs/trl/main/en/grpo_trainer)
+- [Online DPO](https://huggingface.co/docs/trl/main/en/online_dpo_trainer)
+- [RLOO](https://huggingface.co/docs/trl/main/en/rloo_trainer)
+- [Nash-MD](https://huggingface.co/docs/trl/main/en/nash_md_trainer)
+- [XPO](https://huggingface.co/docs/trl/main/en/xpo_trainer)
+
+To enable vLLM in TRL, set the `use_vllm` flag in the trainer configuration to `True`.
+
+## Modes of Using vLLM During Training
+
+TRL supports **two modes** for integrating vLLM during training: **server mode** and **colocate mode**. You can control how vLLM operates during training with the `vllm_mode` parameter.
+
+### Server mode
+
+In **server mode**, vLLM runs as an independent process on dedicated GPUs and communicates with the trainer through HTTP requests. This configuration is ideal when you have separate GPUs for inference, as it isolates generation workloads from training, ensuring stable performance and easier scaling.
+
+```python
+from trl import GRPOConfig
+
+training_args = GRPOConfig(
+    ...,
+    use_vllm=True,
+    vllm_mode="server",  # default value, can be omitted
+)
+```
+
+### Colocate mode
+
+In **colocate mode**, vLLM runs inside the trainer process and shares GPU memory with the training model. This avoids launching a separate server and can improve GPU utilization, but may lead to memory contention on the training GPUs.
+
+```python
+from trl import GRPOConfig
+
+training_args = GRPOConfig(
+    ...,
+    use_vllm=True,
+    vllm_mode="colocate",
+)
+```
+
+Some trainers also support **vLLM sleep mode**, which offloads parameters and caches to GPU RAM during training, helping reduce memory usage. Learn more in the [memory optimization docs](https://huggingface.co/docs/trl/main/en/reducing_memory_usage#vllm-sleep-mode).
 
 !!! info
-    For more information on the `use_vllm` flag you can provide to the configs of these online methods, see:
-    - [`trl.GRPOConfig.use_vllm`](https://huggingface.co/docs/trl/main/en/grpo_trainer#trl.GRPOConfig.use_vllm)
-    - [`trl.OnlineDPOConfig.use_vllm`](https://huggingface.co/docs/trl/main/en/online_dpo_trainer#trl.OnlineDPOConfig.use_vllm)
+    For detailed configuration options and flags, refer to the documentation of the specific trainer you are using.
diff --git a/mkdocs.yaml b/mkdocs.yaml
index 1535fcc622cd..6f2be65a18af 100644
--- a/mkdocs.yaml
+++ b/mkdocs.yaml
@@ -102,7 +102,6 @@ plugins:
           - https://numpy.org/doc/stable/objects.inv
           - https://pytorch.org/docs/stable/objects.inv
           - https://psutil.readthedocs.io/en/stable/objects.inv
-          - https://huggingface.co/docs/transformers/main/en/objects.inv
 
 markdown_extensions:
   - attr_list

From 1bdb00128fa5c6aec4bf1129dadc1bcc66b3e2af Mon Sep 17 00:00:00 2001
From: CSWYF3634076 <wangyafeng@baidu.com>
Date: Tue, 30 Sep 2025 19:11:21 +0800
Subject: [PATCH 040/193] [Bugfix][Model]fix ernie45 moe gate&bias dtype to
 float32 (#25936)

Signed-off-by: wangyafeng <wangyafeng@baidu.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/ernie45_moe.py    |  5 +++--
 vllm/model_executor/models/ernie45_vl_moe.py | 15 ++++++++++-----
 2 files changed, 13 insertions(+), 7 deletions(-)

diff --git a/vllm/model_executor/models/ernie45_moe.py b/vllm/model_executor/models/ernie45_moe.py
index d262e9e9da50..38c5249380c3 100644
--- a/vllm/model_executor/models/ernie45_moe.py
+++ b/vllm/model_executor/models/ernie45_moe.py
@@ -120,11 +120,12 @@ def __init__(
         self.gate = ReplicatedLinear(config.hidden_size,
                                      config.moe_num_experts,
                                      bias=False,
+                                     params_dtype=torch.float32,
                                      quant_config=None,
                                      prefix=f"{prefix}.gate")
 
         self.gate.e_score_correction_bias = nn.Parameter(
-            torch.empty(config.moe_num_experts))
+            torch.empty(config.moe_num_experts, dtype=torch.float32))
 
         self.experts = FusedMoE(
             num_experts=config.moe_num_experts,
@@ -157,7 +158,7 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         if self.has_shared_experts:
             shared_output = self.shared_experts(hidden_states)
 
-        router_logits, _ = self.gate(hidden_states)
+        router_logits, _ = self.gate(hidden_states.to(dtype=torch.float32))
 
         final_hidden_states = self.experts(hidden_states=hidden_states,
                                            router_logits=router_logits)
diff --git a/vllm/model_executor/models/ernie45_vl_moe.py b/vllm/model_executor/models/ernie45_vl_moe.py
index f55016f7ccb3..21772f766b40 100644
--- a/vllm/model_executor/models/ernie45_vl_moe.py
+++ b/vllm/model_executor/models/ernie45_vl_moe.py
@@ -199,7 +199,7 @@ def __init__(
 
         assert config.moe_num_experts[0] == config.moe_num_experts[1]
         self.e_score_correction_bias = nn.Parameter(
-            torch.empty(2, config.moe_num_experts[0]))
+            torch.empty(2, config.moe_num_experts[0], dtype=torch.float32))
 
         assert text_moe_layer_start_index <= text_moe_layer_end_index
 
@@ -209,6 +209,7 @@ def __init__(
                 config.hidden_size,
                 config.moe_num_experts[0],
                 bias=False,
+                params_dtype=torch.float32,
                 quant_config=quant_config,
                 prefix=f"{prefix}.text_experts_gate")
 
@@ -238,6 +239,7 @@ def __init__(
                 config.hidden_size,
                 config.moe_num_experts[1],
                 bias=False,
+                params_dtype=torch.float32,
                 quant_config=quant_config,
                 prefix=f"{prefix}.vision_experts_gate")
 
@@ -288,7 +290,8 @@ def forward(
 
         if visual_token_mask is not None and visual_token_mask.all():
             # only vision modal input
-            router_logits, _ = self.vision_experts_gate(hidden_states)
+            router_logits, _ = self.vision_experts_gate(
+                hidden_states.to(dtype=torch.float32))
             final_hidden_states = self.vision_experts(
                 hidden_states=hidden_states, router_logits=router_logits)
         elif visual_token_mask is not None and visual_token_mask.any():
@@ -303,19 +306,21 @@ def forward(
             vision_hidden_states = hidden_states[visual_token_mask].reshape(
                 -1, self.hidden_size)
 
-            text_router_logits, _ = self.text_experts_gate(text_hidden_states)
+            text_router_logits, _ = self.text_experts_gate(
+                text_hidden_states.to(dtype=torch.float32))
             final_hidden_states[text_token_mask] = self.text_experts(
                 hidden_states=text_hidden_states,
                 router_logits=text_router_logits).flatten()
 
             vision_router_logits, _ = self.vision_experts_gate(
-                vision_hidden_states)
+                vision_hidden_states.to(dtype=torch.float32))
             final_hidden_states[visual_token_mask] = self.vision_experts(
                 hidden_states=vision_hidden_states,
                 router_logits=vision_router_logits).flatten()
         else:
             # only text modal input
-            text_router_logits, _ = self.text_experts_gate(hidden_states)
+            text_router_logits, _ = self.text_experts_gate(
+                hidden_states.to(dtype=torch.float32))
 
             final_hidden_states = self.text_experts(
                 hidden_states=hidden_states, router_logits=text_router_logits)

From 0d643697370440e8e7f1f8a861e2d2b798cafbb1 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Tue, 30 Sep 2025 19:24:57 +0800
Subject: [PATCH 041/193] [Model] Move `vision_feature_select_strategy` into
 `resolve_visual_encoder_outputs` (#25938)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/models/test_vision.py                   | 11 +--
 vllm/model_executor/models/aya_vision.py      | 27 ++-----
 vllm/model_executor/models/clip.py            | 31 +++++---
 vllm/model_executor/models/llava.py           | 25 ++-----
 vllm/model_executor/models/llava_next.py      | 25 ++-----
 .../model_executor/models/llava_next_video.py | 17 +----
 vllm/model_executor/models/llava_onevision.py | 25 ++-----
 vllm/model_executor/models/minimax_vl_01.py   | 24 ++-----
 vllm/model_executor/models/pixtral.py         | 22 ++++--
 vllm/model_executor/models/siglip.py          | 34 +++++----
 vllm/model_executor/models/tarsier.py         | 23 ++----
 vllm/model_executor/models/vision.py          | 70 ++++++++++++++++---
 12 files changed, 155 insertions(+), 179 deletions(-)

diff --git a/tests/models/test_vision.py b/tests/models/test_vision.py
index 8744bcbd3a2a..a30a856a81cf 100644
--- a/tests/models/test_vision.py
+++ b/tests/models/test_vision.py
@@ -18,7 +18,7 @@
 
 
 @pytest.mark.parametrize(
-    ("feature_sample_layers", "num_layers_loaded", "max_possible_layers",
+    ("select_layers", "num_layers_loaded", "max_possible_layers",
      "expected_features"),
     [
         # All layers loaded
@@ -28,8 +28,8 @@
         ([1, 10], 10, 20, [1, 10]),
         ([-20, -11], 10, 20, [1, 10]),
     ])
-def test_resolve_visual_encoder_outputs(feature_sample_layers,
-                                        num_layers_loaded, max_possible_layers,
+def test_resolve_visual_encoder_outputs(select_layers, num_layers_loaded,
+                                        max_possible_layers,
                                         expected_features):
     """
     Test that offsets are correctly handled for vision feature layers.
@@ -39,9 +39,10 @@ def test_resolve_visual_encoder_outputs(feature_sample_layers,
     ]
     output_tensor = resolve_visual_encoder_outputs(
         encoder_outputs=encoder_outputs,
-        feature_sample_layers=feature_sample_layers,
         post_layer_norm=None,
-        max_possible_layers=max_possible_layers)
+        select_layers=select_layers,
+        max_possible_layers=max_possible_layers,
+    )
     assert torch.equal(torch.tensor(expected_features), output_tensor)
 
 
diff --git a/vllm/model_executor/models/aya_vision.py b/vllm/model_executor/models/aya_vision.py
index f6dfa435ddd4..81bab5b34bc6 100644
--- a/vllm/model_executor/models/aya_vision.py
+++ b/vllm/model_executor/models/aya_vision.py
@@ -27,7 +27,6 @@
                                         PromptUpdateDetails)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
-from vllm.utils.jsontree import json_map_leaves
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
@@ -350,29 +349,11 @@ def _image_pixels_to_features(
         self,
         vision_tower: SiglipVisionModel,
         pixel_values: torch.Tensor,
-        **kwargs,
     ) -> Union[torch.Tensor, tuple[torch.Tensor, ...]]:
-        target_dtype: torch.dtype = \
-            vision_tower.get_input_embeddings().weight.dtype
-        image_features: Union[torch.Tensor, tuple[torch.Tensor, ...]] = \
-            vision_tower(pixel_values.to(dtype=target_dtype), **kwargs)
-
-        def select_features(leaf: torch.Tensor):
-            return self._select_image_features(
-                leaf,
-                strategy=self.config.vision_feature_select_strategy,
-            )
-
-        return json_map_leaves(select_features, image_features)
-
-    def _select_image_features(self, image_features: torch.Tensor, *,
-                               strategy: str) -> torch.Tensor:
-        if strategy == "default":
-            return image_features[:, 1:]
-        elif strategy == "full":
-            return image_features
-
-        raise ValueError(f"Unexpected select feature strategy: {strategy}")
+        return vision_tower(
+            pixel_values.to(dtype=vision_tower.dtype),
+            feature_select_strategy=self.config.vision_feature_select_strategy,
+        )
 
     def _process_image_input(self, image_input: AyaVisionImagePixelInputs,
                              **kwargs) -> list[torch.Tensor]:
diff --git a/vllm/model_executor/models/clip.py b/vllm/model_executor/models/clip.py
index dcab00822870..451da2120048 100644
--- a/vllm/model_executor/models/clip.py
+++ b/vllm/model_executor/models/clip.py
@@ -19,7 +19,8 @@
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.interfaces import SupportsQuant
 
-from .vision import VisionEncoderInfo, resolve_visual_encoder_outputs
+from .vision import (VisionEncoderInfo, VisionFeatureSelectStrategy,
+                     resolve_visual_encoder_outputs)
 
 
 class CLIPEncoderInfo(VisionEncoderInfo[CLIPVisionConfig]):
@@ -308,24 +309,29 @@ def __init__(
     def forward(
         self,
         pixel_values: torch.Tensor,
-        feature_sample_layers: Optional[list[int]] = None,
+        *,
+        select_layers: Optional[list[int]] = None,
+        feature_select_strategy: Optional[VisionFeatureSelectStrategy] = None,
     ) -> torch.Tensor:
 
         hidden_states = self.embeddings(pixel_values)
         hidden_states = self.pre_layrnorm(hidden_states)
 
-        return_all_hidden_states = feature_sample_layers is not None
-
         # Produces either the last layer output or all of the hidden states,
-        # depending on if we have feature_sample_layers or not
+        # depending on if we have select_layers or not
         encoder_outputs = self.encoder(
             inputs_embeds=hidden_states,
-            return_all_hidden_states=return_all_hidden_states)
+            return_all_hidden_states=select_layers is not None,
+        )
 
         # Handle post-norm (if applicable) and stacks feature layers if needed
         encoder_outputs = resolve_visual_encoder_outputs(
-            encoder_outputs, feature_sample_layers, self.post_layernorm,
-            self.config.num_hidden_layers)
+            encoder_outputs,
+            self.post_layernorm,
+            select_layers=select_layers,
+            max_possible_layers=self.config.num_hidden_layers,
+            feature_select_strategy=feature_select_strategy,
+        )
 
         return encoder_outputs
 
@@ -355,9 +361,14 @@ def __init__(
     def forward(
         self,
         pixel_values: torch.Tensor,
-        feature_sample_layers: Optional[list[int]] = None,
+        select_layers: Optional[list[int]] = None,
+        feature_select_strategy: Optional[VisionFeatureSelectStrategy] = None,
     ) -> torch.Tensor:
-        return self.vision_model(pixel_values, feature_sample_layers)
+        return self.vision_model(
+            pixel_values,
+            select_layers=select_layers,
+            feature_select_strategy=feature_select_strategy,
+        )
 
     @property
     def device(self):
diff --git a/vllm/model_executor/models/llava.py b/vllm/model_executor/models/llava.py
index 46cf93be191e..d823e5cb58d2 100644
--- a/vllm/model_executor/models/llava.py
+++ b/vllm/model_executor/models/llava.py
@@ -33,7 +33,6 @@
                                         PromptUpdateDetails)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
-from vllm.utils.jsontree import json_map_leaves
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .clip import CLIPVisionModel
@@ -604,16 +603,6 @@ def _parse_and_validate_image_input(
 
         raise AssertionError("This line should be unreachable.")
 
-    def _select_image_features(self, image_features: torch.Tensor, *,
-                               strategy: str) -> torch.Tensor:
-        # Copied from https://github.com/huggingface/transformers/blob/39c3c0a72af6fbda5614dde02ff236069bb79827/src/transformers/models/llava/modeling_llava.py#L421  # noqa
-        if strategy == "default":
-            return image_features[:, 1:]
-        elif strategy == "full":
-            return image_features
-
-        raise ValueError(f"Unexpected select feature strategy: {strategy}")
-
     def _image_pixels_to_features(
         self,
         vision_tower: Union[CLIPVisionModel, SiglipVisionModel,
@@ -622,16 +611,10 @@ def _image_pixels_to_features(
     ) -> Union[torch.Tensor, tuple[torch.Tensor, ...]]:
         # NOTE: we skip the step to select the vision feature layer since
         # this is already done inside the vision tower
-        image_features: Union[torch.Tensor, tuple[torch.Tensor, ...]] = \
-            vision_tower(pixel_values)
-
-        def select_features(leaf: torch.Tensor):
-            return self._select_image_features(
-                leaf,
-                strategy=self.config.vision_feature_select_strategy,
-            )
-
-        return json_map_leaves(select_features, image_features)
+        return vision_tower(
+            pixel_values,
+            feature_select_strategy=self.config.vision_feature_select_strategy,
+        )
 
     def _process_image_pixels(
         self,
diff --git a/vllm/model_executor/models/llava_next.py b/vllm/model_executor/models/llava_next.py
index c4f1daaab9bf..3f7e39c02061 100644
--- a/vllm/model_executor/models/llava_next.py
+++ b/vllm/model_executor/models/llava_next.py
@@ -235,12 +235,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         # Determine the layer up to which we will initialize the vision tower
         if isinstance(vision_feature_layer, int):
             vision_hidden_size = config.vision_config.hidden_size
-            self.feature_sample_layers = None
+            self.select_layers = None
         # Used for multimodal granite models to control encoder outputs
         elif isinstance(vision_feature_layer, (list, tuple)):
             vision_hidden_size = config.vision_config.hidden_size * len(
                 vision_feature_layer)
-            self.feature_sample_layers = vision_feature_layer
+            self.select_layers = vision_feature_layer
         else:
             raise TypeError(
                 f"vision_layer_feature type: {type(vision_feature_layer)}"
@@ -312,30 +312,17 @@ def _parse_and_validate_image_input(
 
         raise AssertionError("This line should be unreachable.")
 
-    def _select_image_features(self, image_features: torch.Tensor, *,
-                               strategy: str) -> torch.Tensor:
-        # Copied from https://github.com/huggingface/transformers/blob/39c3c0a72af6fbda5614dde02ff236069bb79827/src/transformers/models/llava/modeling_llava.py#L421  # noqa
-        if strategy == "default":
-            return image_features[:, 1:]
-        elif strategy == "full":
-            return image_features
-
-        raise ValueError(f"Unexpected select feature strategy: {strategy}")
-
     def _image_pixels_to_features(
         self,
         vision_tower: Union[CLIPVisionModel, SiglipVisionModel],
         pixel_values: torch.Tensor,
     ) -> torch.Tensor:
-
         # NOTE: we skip the step to select the vision feature layer since
         # this is already done inside the vision tower
-        image_features = vision_tower(
-            pixel_values, feature_sample_layers=self.feature_sample_layers)
-
-        return self._select_image_features(
-            image_features,
-            strategy=self.config.vision_feature_select_strategy,
+        return vision_tower(
+            pixel_values,
+            select_layers=self.select_layers,
+            feature_select_strategy=self.config.vision_feature_select_strategy,
         )
 
     # Based on: https://github.com/haotian-liu/LLaVA/blob/main/llava/model/llava_arch.py
diff --git a/vllm/model_executor/models/llava_next_video.py b/vllm/model_executor/models/llava_next_video.py
index aebc661d53f8..697b8e819707 100644
--- a/vllm/model_executor/models/llava_next_video.py
+++ b/vllm/model_executor/models/llava_next_video.py
@@ -349,27 +349,16 @@ def _parse_and_validate_video_input(
                                              "w": expected_w,
                                          })
 
-    def _select_image_features(self, image_features: torch.Tensor, *,
-                               strategy: str) -> torch.Tensor:
-        if strategy == "default":
-            return image_features[:, 1:]
-        elif strategy == "full":
-            return image_features
-
-        raise ValueError(f"Unexpected select feature strategy: {strategy}")
-
     def _video_pixels_to_features(
         self,
         vision_tower: Union[CLIPVisionModel, SiglipVisionModel],
         pixel_values: torch.Tensor,
     ) -> torch.Tensor:
-
         # NOTE: we skip the step to select the vision feature layer since
         # this is already done inside the vision tower
-        image_features = vision_tower(pixel_values)
-        image_features = self._select_image_features(
-            image_features,
-            strategy=self.config.vision_feature_select_strategy,
+        image_features = vision_tower(
+            pixel_values,
+            feature_select_strategy=self.config.vision_feature_select_strategy,
         )
         image_features = self.vision_resampler(image_features)
         image_features = self.multi_modal_projector(image_features)
diff --git a/vllm/model_executor/models/llava_onevision.py b/vllm/model_executor/models/llava_onevision.py
index 6088195c91d5..924f8ba3585f 100644
--- a/vllm/model_executor/models/llava_onevision.py
+++ b/vllm/model_executor/models/llava_onevision.py
@@ -577,27 +577,16 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
 
         return mm_input_by_modality
 
-    def _select_image_features(self, image_features: torch.Tensor, *,
-                               strategy: str) -> torch.Tensor:
-        if strategy == "default":
-            return image_features[:, 1:]
-        elif strategy == "full":
-            return image_features
-
-        raise ValueError(f"Unexpected select feature strategy: {strategy}")
-
     def _image_pixels_to_features(
         self,
         vision_tower: Union[CLIPVisionModel, SiglipVisionModel],
         pixel_values: torch.Tensor,
     ) -> torch.Tensor:
-
         # NOTE: we skip the step to select the vision feature layer since
         # this is already done inside the vision tower
-        image_features = vision_tower(pixel_values)
-        return self._select_image_features(
-            image_features,
-            strategy=self.config.vision_feature_select_strategy,
+        return vision_tower(
+            pixel_values,
+            feature_select_strategy=self.config.vision_feature_select_strategy,
         )
 
     # Based on: https://github.com/haotian-liu/LLaVA/blob/main/llava/model/llava_arch.py
@@ -750,13 +739,11 @@ def _video_pixels_to_features(
         vision_tower: Union[CLIPVisionModel, SiglipVisionModel],
         pixel_values: torch.Tensor,
     ) -> torch.Tensor:
-
         # NOTE: we skip the step to select the vision feature layer since
         # this is already done inside the vision tower
-        video_features = vision_tower(pixel_values)
-        video_features = self._select_image_features(
-            video_features,
-            strategy=self.config.vision_feature_select_strategy,
+        video_features = vision_tower(
+            pixel_values,
+            feature_select_strategy=self.config.vision_feature_select_strategy,
         )
         video_features = self.multi_modal_projector(video_features)
         video_features = self.apply_pooling(video_features)
diff --git a/vllm/model_executor/models/minimax_vl_01.py b/vllm/model_executor/models/minimax_vl_01.py
index d41b9d3f14fe..938c9a689fcf 100644
--- a/vllm/model_executor/models/minimax_vl_01.py
+++ b/vllm/model_executor/models/minimax_vl_01.py
@@ -17,7 +17,6 @@
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import MultiModalFieldConfig
 from vllm.sequence import IntermediateTensors
-from vllm.utils.jsontree import json_map_leaves
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .clip import CLIPVisionModel
@@ -221,15 +220,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def _select_image_features(self, image_features: torch.Tensor, *,
-                               strategy: str) -> torch.Tensor:
-        if strategy == "default":
-            return image_features[:, 1:]
-        elif strategy == "full":
-            return image_features
-
-        raise ValueError(f"Unexpected select feature strategy: {strategy}")
-
     def _image_pixels_to_features(
         self,
         vision_tower: Union[CLIPVisionModel, SiglipVisionModel,
@@ -238,16 +228,10 @@ def _image_pixels_to_features(
     ) -> Union[torch.Tensor, tuple[torch.Tensor, ...]]:
         # NOTE: we skip the step to select the vision feature layer since
         # this is already done inside the vision tower
-        image_features: tuple[torch.Tensor, ...] = \
-            tuple(vision_tower(p) for p in pixel_values)
-
-        def select_features(leaf: torch.Tensor):
-            return self._select_image_features(
-                leaf,
-                strategy=self.config.vision_feature_select_strategy,
-            )
-
-        return json_map_leaves(select_features, image_features)
+        feature_select_strategy = self.config.vision_feature_select_strategy
+        return tuple(
+            vision_tower(p, feature_select_strategy=feature_select_strategy)
+            for p in pixel_values)
 
     # adapted from https://huggingface.co/MiniMaxAI/MiniMax-VL-01/blob/main/modeling_minimax_vl_01.py#L616-L631
     def pack_image_features(self, image_features: list[torch.Tensor],
diff --git a/vllm/model_executor/models/pixtral.py b/vllm/model_executor/models/pixtral.py
index 6344fc394833..bf451c5005b7 100644
--- a/vllm/model_executor/models/pixtral.py
+++ b/vllm/model_executor/models/pixtral.py
@@ -51,7 +51,8 @@
 
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
 from .utils import flatten_bn, init_vllm_registered_model, maybe_prefix
-from .vision import VisionEncoderInfo, resolve_visual_encoder_outputs
+from .vision import (VisionEncoderInfo, VisionFeatureSelectStrategy,
+                     resolve_visual_encoder_outputs)
 
 try:
     from xformers import ops as xops
@@ -1218,7 +1219,9 @@ def __init__(
     def forward(
         self,
         pixel_values: list[torch.Tensor],
-        feature_sample_layers: Optional[list[int]] = None,
+        *,
+        select_layers: Optional[list[int]] = None,
+        feature_select_strategy: Optional[VisionFeatureSelectStrategy] = None,
     ) -> tuple[torch.Tensor, ...]:
         """
         Args:
@@ -1226,7 +1229,7 @@ def forward(
                 in pixel_values. This means it will be a list of tensors
                 because multiple requests batched can have multiple images,
                 each with their own shape potentially
-            feature_sample_layers: Layer indices whose features should be
+            select_layers: Layer indices whose features should be
                 concatenated and used as the visual encoder output. If none
                 are provided, the last layer is used.
 
@@ -1267,15 +1270,20 @@ def forward(
                 [p.shape[-2] * p.shape[-1] for p in patch_embeds_list],
                 patch_embeds)
 
-        return_all_hidden_states = feature_sample_layers is not None
         out = self.transformer(
             patch_embeds,
             attention_mask,
             position_embedding,
-            return_all_hidden_states=return_all_hidden_states)
+            return_all_hidden_states=select_layers is not None,
+        )
 
-        out = resolve_visual_encoder_outputs(out, feature_sample_layers, None,
-                                             self.config.num_hidden_layers)
+        out = resolve_visual_encoder_outputs(
+            out,
+            None,
+            select_layers=select_layers,
+            max_possible_layers=self.config.num_hidden_layers,
+            feature_select_strategy=feature_select_strategy,
+        )
 
         # squeeze dim 0 and split into separate tensors for each image
         return torch.split(out.squeeze(0), embed_sizes)
diff --git a/vllm/model_executor/models/siglip.py b/vllm/model_executor/models/siglip.py
index eb49d6d2c335..4c60d96c77d7 100644
--- a/vllm/model_executor/models/siglip.py
+++ b/vllm/model_executor/models/siglip.py
@@ -23,7 +23,8 @@
 from vllm.model_executor.model_loader.weight_utils import (
     default_weight_loader, maybe_remap_kv_scale_name)
 
-from .vision import VisionEncoderInfo, resolve_visual_encoder_outputs
+from .vision import (VisionEncoderInfo, VisionFeatureSelectStrategy,
+                     resolve_visual_encoder_outputs)
 
 
 class SiglipEncoderInfo(VisionEncoderInfo[SiglipVisionConfig]):
@@ -415,28 +416,31 @@ def __init__(
     def forward(
         self,
         pixel_values: torch.Tensor,
-        interpolate_pos_encoding: bool = True,
-        feature_sample_layers: Optional[list[int]] = None,
+        *,
+        interpolate_pos_encoding: bool = False,
+        select_layers: Optional[list[int]] = None,
+        feature_select_strategy: Optional[VisionFeatureSelectStrategy] = None,
     ) -> torch.Tensor:
-
         hidden_states = self.embeddings(
             pixel_values,
             interpolate_pos_encoding=interpolate_pos_encoding,
         )
 
-        return_all_hidden_states = feature_sample_layers is not None
-
         # Produces either the last layer output or all of the hidden states,
-        # depending on if we have feature_sample_layers or not
+        # depending on if we have select_layers or not
         encoder_outputs = self.encoder(
             inputs_embeds=hidden_states,
-            return_all_hidden_states=return_all_hidden_states,
+            return_all_hidden_states=select_layers is not None,
         )
 
         # Handle post-norm (if applicable) and stacks feature layers if needed
         encoder_outputs = resolve_visual_encoder_outputs(
-            encoder_outputs, feature_sample_layers, self.post_layernorm,
-            self.config.num_hidden_layers)
+            encoder_outputs,
+            self.post_layernorm,
+            select_layers=select_layers,
+            max_possible_layers=self.config.num_hidden_layers,
+            feature_select_strategy=feature_select_strategy,
+        )
 
         # TODO: add this back when pooled_output is used in inference.
         # if self.use_head:
@@ -471,16 +475,22 @@ def __init__(
     def get_input_embeddings(self) -> nn.Module:
         return self.vision_model.embeddings.patch_embedding
 
+    @property
+    def dtype(self):
+        return self.get_input_embeddings().weight.dtype
+
     def forward(
         self,
         pixel_values: torch.Tensor,
         interpolate_pos_encoding: bool = False,
-        feature_sample_layers: Optional[list[int]] = None,
+        select_layers: Optional[list[int]] = None,
+        feature_select_strategy: Optional[VisionFeatureSelectStrategy] = None,
     ) -> torch.Tensor:
         return self.vision_model(
             pixel_values=pixel_values,
             interpolate_pos_encoding=interpolate_pos_encoding,
-            feature_sample_layers=feature_sample_layers,
+            select_layers=select_layers,
+            feature_select_strategy=feature_select_strategy,
         )
 
     def load_weights(self, weights: Iterable[tuple[str,
diff --git a/vllm/model_executor/models/tarsier.py b/vllm/model_executor/models/tarsier.py
index 1145bea41480..ed02fe2c389f 100644
--- a/vllm/model_executor/models/tarsier.py
+++ b/vllm/model_executor/models/tarsier.py
@@ -33,7 +33,6 @@
                                         PromptReplacement, PromptUpdate)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
-from vllm.utils.jsontree import json_map_leaves
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .clip import CLIPVisionModel
@@ -476,30 +475,16 @@ def _parse_and_validate_image_input(
 
         raise AssertionError("This line should be unreachable.")
 
-    def _select_image_features(self, image_features: torch.Tensor, *,
-                               strategy: str) -> torch.Tensor:
-        if strategy == "default":
-            return image_features[:, 1:]
-        elif strategy == "full":
-            return image_features
-        raise ValueError(f"Unexpected select feature strategy: {strategy}")
-
     def _image_pixels_to_features(
         self,
         vision_tower: Union[CLIPVisionModel, SiglipVisionModel],
         pixel_values: Union[torch.Tensor, list[torch.Tensor]],
     ) -> Union[torch.Tensor, tuple[torch.Tensor, ...]]:
         # From vLLM LLaVA, vision tower output handling
-        image_hidden_states: Union[torch.Tensor, tuple[torch.Tensor, ...]] = \
-            vision_tower(pixel_values)
-
-        def select_features_fn(leaf: torch.Tensor):
-            return self._select_image_features(
-                leaf,
-                strategy=self.config.vision_feature_select_strategy,
-            )
-
-        return json_map_leaves(select_features_fn, image_hidden_states)
+        return vision_tower(
+            pixel_values,
+            feature_select_strategy=self.config.vision_feature_select_strategy,
+        )
 
     def _add_tarsier_split_tokens(
             self, projected_image_features: torch.Tensor) -> torch.Tensor:
diff --git a/vllm/model_executor/models/vision.py b/vllm/model_executor/models/vision.py
index 08ad8fbeb424..e077691fcec2 100644
--- a/vllm/model_executor/models/vision.py
+++ b/vllm/model_executor/models/vision.py
@@ -4,10 +4,12 @@
 import itertools
 import math
 from abc import ABC, abstractmethod
-from typing import Final, Generic, Literal, Optional, Protocol, TypeVar, Union
+from typing import (Callable, Final, Generic, Literal, Optional, Protocol,
+                    TypeVar, Union)
 
 import torch
 from transformers import PretrainedConfig
+from typing_extensions import assert_never
 
 from vllm.distributed import (get_tensor_model_parallel_rank,
                               get_tensor_model_parallel_world_size,
@@ -86,11 +88,39 @@ def get_vit_attn_backend(head_size: int, dtype: torch.dtype) -> _Backend:
     return current_platform.get_vit_attn_backend(head_size, dtype)
 
 
+VisionFeatureSelectStrategy = Union[
+    Literal["class", "default", "full"],
+    Callable[[torch.Tensor], torch.Tensor],
+]
+
+
+def _get_vision_feature_selector(
+    strategy: VisionFeatureSelectStrategy,
+) -> Callable[[torch.Tensor], torch.Tensor]:
+    if callable(strategy):
+        return strategy
+
+    # https://github.com/huggingface/transformers/blob/cd74917ffc3e8f84e4a886052c5ab32b7ac623cc/src/transformers/models/clip/modeling_clip.py#L762
+    if strategy == "class":
+        return lambda feats: feats[:, 0, :]
+
+    # https://github.com/huggingface/transformers/blob/4a02bc7004285bdb12cc033e87ad2578ce2fa900/src/transformers/models/llava/modeling_llava.py#L196
+    if strategy == "default":
+        return lambda feats: feats[:, 1:, :]
+
+    if strategy == "full":
+        return lambda feats: feats
+
+    assert_never(strategy)
+
+
 def resolve_visual_encoder_outputs(
     encoder_outputs: Union[torch.Tensor, list[torch.Tensor]],
-    feature_sample_layers: Optional[list[int]],
     post_layer_norm: Optional[torch.nn.LayerNorm],
-    max_possible_layers: int,
+    *,
+    select_layers: Optional[list[int]] = None,
+    max_possible_layers: Optional[int] = None,
+    feature_select_strategy: Optional[VisionFeatureSelectStrategy] = None,
 ) -> torch.Tensor:
     """Given the outputs a visual encoder module that may correspond to the
     output of the last layer, or a list of hidden states to be stacked,
@@ -98,17 +128,32 @@ def resolve_visual_encoder_outputs(
 
     Args:
         encoder_outputs: Output of encoder's last layer or all hidden states.
-        feature_sample_layers: Optional layer indices to grab from the encoder
-            outputs; if provided, encoder outputs must be a list.
         post_layer_norm: Post norm to apply to the output of the encoder.
+        select_layers: Optional layer indices to grab from the encoder
+            outputs; if provided, encoder outputs must be a list.
         max_possible_layers: Total layers in the fully loaded visual encoder.
-
+        feature_select_strategy: Defines how to select the hidden states
+            from each layer.
     """
-    if feature_sample_layers is None:
+    if select_layers is None:
+        if not isinstance(encoder_outputs, torch.Tensor):
+            raise ValueError("Expected only a single encoder output when "
+                             "`select_layers` is not provided")
+
+        if feature_select_strategy is not None:
+            select_features = _get_vision_feature_selector(
+                feature_select_strategy)
+            encoder_outputs = select_features(encoder_outputs)
+
         if post_layer_norm is not None:
             return post_layer_norm(encoder_outputs)
+
         return encoder_outputs
 
+    if max_possible_layers is None:
+        raise ValueError("`max_possible_layers` must be provided "
+                         "alongside `select_layers`")
+
     # Get the hidden states corresponding to the layer indices.
     # Negative values are relative to the full visual encoder,
     # so offset them depending on how many layers were loaded.
@@ -120,13 +165,18 @@ def resolve_visual_encoder_outputs(
     hs_pool = [
         encoder_outputs[layer_idx]
         if layer_idx >= 0 else encoder_outputs[layer_idx + offset]
-        for layer_idx in feature_sample_layers
+        for layer_idx in select_layers
     ]
 
+    if feature_select_strategy is not None:
+        select_features = _get_vision_feature_selector(feature_select_strategy)
+        hs_pool = [select_features(hs) for hs in hs_pool]
+
     # Apply post-norm on the final hidden state if we are using it
-    uses_last_layer = feature_sample_layers[-1] in (len(hs_pool) - 1, -1)
+    uses_last_layer = select_layers[-1] in (max_possible_layers - 1, -1)
     if post_layer_norm is not None and uses_last_layer:
-        hs_pool[-1] = post_layer_norm(encoder_outputs)
+        hs_pool[-1] = post_layer_norm(hs_pool[-1])
+
     return torch.cat(hs_pool, dim=-1)
 
 
From fd3f60f843c2c861c63bf92507d397811d1d4bce Mon Sep 17 00:00:00 2001
From: Lehua Ding <lehuading@tencent.com>
Date: Tue, 30 Sep 2025 19:51:16 +0800
Subject: [PATCH 042/193] [perf] Use CPU tensor to reduce GPU->CPU sync
 (#25884)

Signed-off-by: Lehua Ding <lehuading@tencent.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/v1/worker/gpu_model_runner.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index bb5c3ea74293..f4c28dc24d70 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -2478,7 +2478,7 @@ def propose_draft_token_ids(sampled_token_ids):
             effective_drafter_max_model_len = (
                 self.speculative_config.draft_model_config.max_model_len)
         input_fits_in_drafter = spec_decode_common_attn_metadata and (
-            spec_decode_common_attn_metadata.seq_lens.max() +
+            spec_decode_common_attn_metadata.max_seq_len +
             self.speculative_config.num_speculative_tokens
             <= effective_drafter_max_model_len)
         if use_padded_batch_for_eagle and input_fits_in_drafter:

From 6767f8c398b72f0c20bea5f92f7c7d260e703700 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Nicol=C3=B2=20Lucchesi?= <nlucches@redhat.com>
Date: Tue, 30 Sep 2025 14:18:29 +0200
Subject: [PATCH 043/193] [NIXL] Add support for MLA caches with different
 latent dim (#25902)

Signed-off-by: NickLucche <nlucches@redhat.com>
Signed-off-by: Chen Zhang <zhangch99@outlook.com>
Co-authored-by: Chen Zhang <zhangch99@outlook.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../kv_connector/unit/test_nixl_connector.py  | 13 +--
 .../kv_connector/v1/nixl_connector.py         | 95 ++++++++++++-------
 2 files changed, 66 insertions(+), 42 deletions(-)

diff --git a/tests/v1/kv_connector/unit/test_nixl_connector.py b/tests/v1/kv_connector/unit/test_nixl_connector.py
index 6b4bd29f18a5..578bf02eb519 100644
--- a/tests/v1/kv_connector/unit/test_nixl_connector.py
+++ b/tests/v1/kv_connector/unit/test_nixl_connector.py
@@ -255,8 +255,9 @@ def _nixl_handshake(self, host: str, port: int, remote_tp_size: int,
         time.sleep(self._hand_shake_latency)
         # These should've been done in register_kv_caches(), called by
         # gpu_model_runner. Here we just hardcode some dummy values.
-        self.slot_size_bytes = 4096
-        self.block_len = self.slot_size_bytes * self.block_size
+        slot_size_bytes = 4096
+        self.slot_size_per_layer = [slot_size_bytes]
+        self.block_len_per_layer = [slot_size_bytes * self.block_size]
         self.num_blocks = 1
         self.dst_num_blocks[self.engine_id] = self.num_blocks
 
@@ -268,7 +269,7 @@ def _nixl_handshake(self, host: str, port: int, remote_tp_size: int,
                 agent_metadata=FakeNixlWrapper.AGENT_METADATA,
                 kv_caches_base_addr=[0],
                 num_blocks=1,
-                block_len=self.block_len,
+                block_lens=self.block_len_per_layer,
                 attn_backend_name=self.backend_name,
                 # `self.kv_cache_layout` is only forced to HND when vllm engine
                 # is started. We mock HND here.
@@ -485,8 +486,8 @@ def test_handshake_fails_on_kv_cache_layout_mismatch(self, dist_init):
             worker = connector.connector_worker
 
             # Minimal local registration params used by add_remote_agent
-            worker.slot_size_bytes = 4096
-            worker.block_len = worker.slot_size_bytes * worker.block_size
+            worker.slot_size_per_layer = [4096]
+            worker.block_len_per_layer = [4096 * worker.block_size]
             worker.num_blocks = 1
             worker.dst_num_blocks[worker.engine_id] = worker.num_blocks
 
@@ -498,7 +499,7 @@ def test_handshake_fails_on_kv_cache_layout_mismatch(self, dist_init):
                 agent_metadata=FakeNixlWrapper.AGENT_METADATA,
                 kv_caches_base_addr=[0],
                 num_blocks=1,
-                block_len=worker.block_len,
+                block_lens=worker.block_len_per_layer,
                 attn_backend_name=worker.backend_name,
                 kv_cache_layout=mismatched_layout,
             )
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
index 1c7569515dec..55d87ea994b5 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
@@ -87,7 +87,7 @@ class NixlAgentMetadata(
     agent_metadata: bytes
     kv_caches_base_addr: list[int]
     num_blocks: int
-    block_len: int
+    block_lens: list[int]
     attn_backend_name: str
     kv_cache_layout: str
 
@@ -772,6 +772,9 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
         split_k_and_v = not (self.use_mla or self._use_pallas
                              or self._use_flashinfer)
         tensor_size_bytes = None
+        # Enable different block lengths for different layers when MLA is used.
+        self.block_len_per_layer = list[int]()
+        self.slot_size_per_layer = list[int]()  # HD bytes in kv terms
         for layer_name, cache_or_caches in xfer_buffers.items():
             cache_list = cache_or_caches if split_k_and_v else [
                 cache_or_caches
@@ -789,10 +792,25 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
                     tensor_size_bytes = curr_tensor_size_bytes
                     self.num_blocks = cache.shape[0]
 
-                assert tensor_size_bytes == curr_tensor_size_bytes, \
-                    "All kv cache tensors must have the same size"
+                assert cache.shape[0] == self.num_blocks, \
+                    "All kv cache tensors must have the same number of blocks"
+
+                self.block_len_per_layer.append(curr_tensor_size_bytes //
+                                                self.num_blocks)
+                self.slot_size_per_layer.append(self.block_len_per_layer[-1] //
+                                                self.block_size)
+
+                if not self.use_mla:
+                    # Different kv cache shape is not supported by HeteroTP
+                    assert tensor_size_bytes == curr_tensor_size_bytes, \
+                        "All kv cache tensors must have the same size"
                 caches_data.append(
-                    (base_addr, tensor_size_bytes, self.tp_rank, ""))
+                    (base_addr, curr_tensor_size_bytes, self.tp_rank, ""))
+
+        logger.debug("Different block lengths collected: %s",
+                     set(self.block_len_per_layer))
+        assert len(self.block_len_per_layer) == len(seen_base_addresses)
+        assert self.num_blocks != 0
 
         self.kv_caches_base_addr[self.engine_id] = seen_base_addresses
         self.num_regions = len(caches_data)
@@ -805,16 +823,12 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
         logger.debug("Done registering descs")
         self._registered_descs.append(descs)
 
-        assert tensor_size_bytes is not None
-        assert self.num_blocks != 0
-        assert tensor_size_bytes % self.num_blocks == 0
-        self.block_len = tensor_size_bytes // self.num_blocks
-        self.slot_size_bytes = self.block_len // self.block_size
         self.device_kv_caches = kv_caches
         self.dst_num_blocks[self.engine_id] = self.num_blocks
         if self._use_flashinfer:
-            assert self.slot_size_bytes % 2 == 0
-            self.slot_size_bytes /= 2
+            for i in range(len(self.slot_size_per_layer)):
+                assert self.slot_size_per_layer[i] % 2 == 0
+                self.slot_size_per_layer[i] //= 2
 
             # NOTE (NickLucche) When FlashInfer is used, memory is registered
             # with joint KV for each block. This minimizes the overhead in
@@ -824,17 +838,17 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
             # of 'virtual' regions here and halve `block_len` below.
             self.num_regions *= 2
 
-        kv_block_len = self.get_backend_aware_kv_block_len()
         # Register local/src descr for NIXL xfer.
         blocks_data = []
-        for base_addr in seen_base_addresses:
+        for i, base_addr in enumerate(seen_base_addresses):
+            kv_block_len = self.get_backend_aware_kv_block_len(layer_idx=i)
             # NOTE With heter-TP, more blocks are prepared than what are
             # needed as self.num_blocks >= nixl_agent_meta.num_blocks. We
             # could create fewer, but then _get_block_descs_ids needs to
             # select agent_meta.num_blocks instead of self.num_blocks for
             # local descr, and that makes handling regular flow less clean.
             for block_id in range(self.num_blocks):
-                block_offset = block_id * self.block_len
+                block_offset = block_id * self.block_len_per_layer[i]
                 addr = base_addr + block_offset
                 # (addr, len, device id)
                 blocks_data.append((addr, kv_block_len, self.tp_rank))
@@ -844,7 +858,7 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
                 # descs ordering. This is needed for selecting contiguous heads
                 # when split across TP ranks.
                 for block_id in range(self.num_blocks):
-                    block_offset = block_id * self.block_len
+                    block_offset = block_id * self.block_len_per_layer[i]
                     addr = base_addr + block_offset
                     # Register addresses for V cache (K registered first).
                     v_addr = addr + kv_block_len
@@ -884,7 +898,7 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
             agent_metadata=self.nixl_wrapper.get_agent_metadata(),
             kv_caches_base_addr=self.kv_caches_base_addr[self.engine_id],
             num_blocks=self.num_blocks,
-            block_len=self.block_len,
+            block_lens=self.block_len_per_layer,
             attn_backend_name=self.backend_name,
             kv_cache_layout=self.kv_cache_layout)
         ready_event = threading.Event()
@@ -909,7 +923,7 @@ def add_remote_agent(self,
         The latter, assuming D.world_size > P.world_size, requires that two or 
         more local TP worker share the xfer from a single TP worker.
 
-        Here's an example:
+        Here's an example (non-MLA case):
 
         rank_offset     p_remote_tp_rank
         (kv split no)    
@@ -965,14 +979,20 @@ def add_remote_agent(self,
         total_num_kv_heads = self.model_config.get_total_num_kv_heads()
         is_kv_replicated = self._tp_size[engine_id] // total_num_kv_heads >= 1
 
+        remote_block_len = nixl_agent_meta.block_lens[0]
         if self.use_mla or is_kv_replicated:
-            # With MLA the only difference is in the number of blocks.
-            remote_block_size = nixl_agent_meta.block_len // (
-                self.slot_size_bytes)
-            assert self.block_len == nixl_agent_meta.block_len
+            # With replicated KV cache, only the number of blocks can differ.
+            assert self.block_len_per_layer == nixl_agent_meta.block_lens, \
+                "KV cache sizes must match between P and D when replicated"
+            remote_block_size = remote_block_len // (
+                self.slot_size_per_layer[0])
         else:
-            remote_block_size = nixl_agent_meta.block_len // (
-                self.slot_size_bytes * tp_ratio)
+            # When MLA is not used, this is a list of the same block length
+            for block_len in nixl_agent_meta.block_lens:
+                assert block_len == remote_block_len, \
+                    "All remote layers must have the same block size"
+            remote_block_size = remote_block_len // (
+                self.slot_size_per_layer[0] * tp_ratio)
             if self._use_flashinfer:
                 # With flashinfer, KV are sent in the same message.
                 remote_block_size //= 2
@@ -983,14 +1003,14 @@ def add_remote_agent(self,
                     raise ValueError(
                         "Heterogeneous TP is not supported on XPU")
 
-            assert nixl_agent_meta.block_len == self.block_len * tp_ratio, (
+            assert remote_block_len == self.block_len_per_layer[0] * tp_ratio, (
                 "Remote P worker KV layer cache must be of shape [2, N, "
                 "local_kv_heads*tp_ratio, block_size, head_dim] and same dtype."
             )
 
         assert self.block_size == remote_block_size, (
-            "Remote P worker with different block size is not supported "
-            f"{self.block_size=} {remote_block_size=}")
+            "Remote P worker with different page/block size is not supported "
+            f"{self.block_size=}, {remote_block_size=}")
 
         # Create dst descs and xfer side handles. TP workers have same #blocks.
         if engine_id in self.dst_num_blocks:
@@ -1005,13 +1025,16 @@ def add_remote_agent(self,
         # Eg. PTP1 DTP2 => P0 KV:[block0-KV_0 | block0-KV_1..].
         self.kv_caches_base_addr[
             engine_id] = nixl_agent_meta.kv_caches_base_addr
-        kv_block_len = self.get_backend_aware_kv_block_len()
-        rank_offset = self.tp_rank % tp_ratio * kv_block_len \
-            if not (self.use_mla or is_kv_replicated) else 0
+
+        assert len(nixl_agent_meta.kv_caches_base_addr) == len(
+            self.block_len_per_layer)
         # Register all remote blocks, but only the corresponding kv heads.
-        for base_addr in nixl_agent_meta.kv_caches_base_addr:
+        for i, base_addr in enumerate(nixl_agent_meta.kv_caches_base_addr):
+            kv_block_len = self.get_backend_aware_kv_block_len(layer_idx=i)
+            rank_offset = self.tp_rank % tp_ratio * kv_block_len \
+                if not (self.use_mla or is_kv_replicated) else 0
             for block_id in range(nixl_agent_meta.num_blocks):
-                block_offset = block_id * nixl_agent_meta.block_len
+                block_offset = block_id * nixl_agent_meta.block_lens[i]
                 # For each block, grab the heads chunk belonging to rank_i
                 # of size remote_nheads // tp_ratio, which correspond to
                 # self.block_len == remote_block_len//tp_ratio bytes.
@@ -1022,9 +1045,9 @@ def add_remote_agent(self,
             if self._use_flashinfer:
                 # With FlashInfer index V separately to allow head splitting.
                 for block_id in range(nixl_agent_meta.num_blocks):
-                    block_offset = block_id * nixl_agent_meta.block_len
+                    block_offset = block_id * nixl_agent_meta.block_lens[i]
                     addr = base_addr + block_offset + rank_offset
-                    v_addr = addr + nixl_agent_meta.block_len // 2
+                    v_addr = addr + nixl_agent_meta.block_lens[i] // 2
                     blocks_data.append((v_addr, kv_block_len, remote_tp_rank))
 
         logger.debug(
@@ -1351,7 +1374,7 @@ def _get_block_descs_ids(self,
         descs_ids = region_ids * num_blocks + block_ids
         return descs_ids.flatten()
 
-    def get_backend_aware_kv_block_len(self):
+    def get_backend_aware_kv_block_len(self, layer_idx: int):
         """
         Get the block length for one K/V element (K and V have the same size).
 
@@ -1362,9 +1385,9 @@ def get_backend_aware_kv_block_len(self):
         """
         if self._use_flashinfer:
             # For indexing only half (either just the K or V part).
-            block_len = self.block_len // 2
+            block_len = self.block_len_per_layer[layer_idx] // 2
         else:
-            block_len = self.block_len
+            block_len = self.block_len_per_layer[layer_idx]
         return block_len
 
     def get_kv_connector_stats(self) -> Optional[KVConnectorStats]:

From f540576161e50855b0e7a2d1faf58c80c4a90cc5 Mon Sep 17 00:00:00 2001
From: Reza Barazesh <3146276+rzabarazesh@users.noreply.github.com>
Date: Tue, 30 Sep 2025 09:45:20 -0400
Subject: [PATCH 044/193] [CI] Move applicable tests to CPU (#24080)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Co-authored-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .buildkite/test-pipeline.yaml                 | 65 ++++++++++++++-----
 .github/mergify.yml                           |  1 -
 docker/Dockerfile.cpu                         | 17 ++---
 pyproject.toml                                |  1 +
 tests/models/test_utils.py                    |  3 +
 tests/models/test_vision.py                   |  2 +
 tests/multimodal/test_cache.py                |  2 +
 tests/multimodal/test_hasher.py               |  2 +
 tests/multimodal/test_image.py                |  2 +
 tests/multimodal/test_inputs.py               |  3 +
 tests/multimodal/test_processing.py           |  2 +
 tests/multimodal/test_registry.py             |  2 +
 tests/multimodal/test_video.py                |  2 +
 tests/test_inputs.py                          |  2 +
 tests/test_outputs.py                         |  4 ++
 .../mistral}/__init__.py                      |  0
 .../mistral}/conftest.py                      |  4 +-
 .../mistral}/test_mistral_tool_calls.py       |  0
 .../mistral}/utils.py                         |  0
 tests/tool_use/test_glm4_moe_tool_parser.py   |  2 +
 tests/tool_use/test_jamba_tool_parser.py      |  2 +
 tests/tool_use/test_kimi_k2_tool_parser.py    |  2 +
 tests/tool_use/test_minimax_tool_parser.py    |  2 +
 tests/tool_use/test_qwen3coder_tool_parser.py |  2 +
 tests/tool_use/test_seed_oss_tool_parser.py   |  2 +
 tests/tool_use/test_tool_choice_required.py   |  2 +
 tests/tool_use/test_xlam_tool_parser.py       |  2 +
 tests/v1/core/test_async_scheduler.py         |  2 +
 tests/v1/core/test_encoder_cache_manager.py   |  3 +
 tests/v1/core/test_kv_cache_utils.py          |  2 +
 tests/v1/core/test_prefix_caching.py          |  4 +-
 tests/v1/core/test_scheduler.py               |  2 +
 .../core/test_single_type_kv_cache_manager.py |  3 +
 .../unit/test_output_aggreagator.py           |  4 ++
 .../unit/test_remote_decode_lifecycle.py      |  4 ++
 .../unit/test_remote_prefill_lifecycle.py     |  4 ++
 tests/v1/metrics/test_metrics_reader.py       |  2 +
 tests/v1/structured_output/test_utils.py      |  2 +
 tests/v1/test_serial_utils.py                 |  2 +
 39 files changed, 136 insertions(+), 28 deletions(-)
 rename tests/{mistral_tool_use => tool_use/mistral}/__init__.py (100%)
 rename tests/{mistral_tool_use => tool_use/mistral}/conftest.py (93%)
 rename tests/{mistral_tool_use => tool_use/mistral}/test_mistral_tool_calls.py (100%)
 rename tests/{mistral_tool_use => tool_use/mistral}/utils.py (100%)

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index 460f0afb6f67..b3d10f75ab50 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -50,19 +50,28 @@ steps:
   mirror_hardwares: [amdexperimental]
   source_file_dependencies:
   - vllm/
+  - tests/multimodal
+  - tests/utils_
+  commands:
+  - pytest -v -s -m 'not cpu_test' multimodal
+  - pytest -v -s utils_
+
+- label: Async Engine, Inputs, Utils, Worker Test (CPU) # 4 mins
+  timeout_in_minutes: 10
+  source_file_dependencies:
+  - vllm/
   - tests/test_inputs.py
   - tests/test_outputs.py
   - tests/multimodal
-  - tests/utils_
   - tests/standalone_tests/lazy_imports.py
   - tests/transformers_utils
+  no_gpu: true
   commands:
   - python3 standalone_tests/lazy_imports.py
   - pytest -v -s test_inputs.py
   - pytest -v -s test_outputs.py
-  - pytest -v -s multimodal
-  - pytest -v -s utils_ # Utils
-  - pytest -v -s transformers_utils # transformers_utils
+  - pytest -v -s -m 'cpu_test' multimodal
+  - pytest -v -s transformers_utils
 
 - label: Python-only Installation Test # 10min
   timeout_in_minutes: 20
@@ -287,23 +296,34 @@ steps:
     - tests/v1
   commands:
     # split the test to avoid interference
-    - pytest -v -s v1/core
     - pytest -v -s v1/executor
     - pytest -v -s v1/kv_offload
     - pytest -v -s v1/sample
     - pytest -v -s v1/logits_processors
     - pytest -v -s v1/worker
-    - pytest -v -s v1/structured_output
     - pytest -v -s v1/spec_decode
-    - pytest -v -s v1/kv_connector/unit
-    - pytest -v -s v1/metrics
+    - pytest -v -s -m 'not cpu_test' v1/kv_connector/unit
+    - pytest -v -s -m 'not cpu_test' v1/metrics
     - pytest -v -s v1/test_oracle.py
     - pytest -v -s v1/test_request.py
-    - pytest -v -s v1/test_serial_utils.py
     # Integration test for streaming correctness (requires special branch).
     - pip install -U git+https://github.com/robertgshaw2-redhat/lm-evaluation-harness.git@streaming-api
     - pytest -v -s entrypoints/openai/correctness/test_lmeval.py::test_lm_eval_accuracy_v1_engine
 
+- label: V1 Test others (CPU) # 5 mins
+  source_file_dependencies:
+    - vllm/
+    - tests/v1
+  no_gpu: true
+  commands:
+    # split the test to avoid interference
+    - pytest -v -s v1/core
+    - pytest -v -s v1/structured_output
+    - pytest -v -s v1/test_serial_utils.py
+    - pytest -v -s -m 'cpu_test' v1/kv_connector/unit
+    - pytest -v -s -m 'cpu_test' v1/metrics
+
+
 - label: Examples Test # 30min
   timeout_in_minutes: 45
   mirror_hardwares: [amdexperimental]
@@ -533,10 +553,17 @@ steps:
   source_file_dependencies:
     - vllm/
     - tests/tool_use
-    - tests/mistral_tool_use
   commands:
-    - pytest -v -s tool_use
-    - pytest -v -s mistral_tool_use
+    - pytest -v -s -m 'not cpu_test' tool_use
+
+- label: OpenAI-Compatible Tool Use (CPU) # 5 mins
+  timeout_in_minutes: 10
+  source_file_dependencies:
+    - vllm/
+    - tests/tool_use
+  no_gpu: true
+  commands:
+    - pytest -v -s -m 'cpu_test' tool_use
 
 #####  models test  #####
 
@@ -576,13 +603,19 @@ steps:
   - vllm/
   - tests/models/test_transformers.py
   - tests/models/test_registry.py
+  commands:
+    - pytest -v -s models/test_transformers.py models/test_registry.py
+
+- label: Basic Models Test (Other CPU) # 5min
+  timeout_in_minutes: 10
+  torch_nightly: true
+  source_file_dependencies:
+  - vllm/
   - tests/models/test_utils.py
   - tests/models/test_vision.py
+  no_gpu: true
   commands:
-    - pytest -v -s models/test_transformers.py \
-                   models/test_registry.py \
-                   models/test_utils.py \
-                   models/test_vision.py
+    - pytest -v -s models/test_utils.py models/test_vision.py
 
 - label: Language Models Tests (Standard)
   timeout_in_minutes: 25
diff --git a/.github/mergify.yml b/.github/mergify.yml
index 923f708ea10c..04ad6a5be8df 100644
--- a/.github/mergify.yml
+++ b/.github/mergify.yml
@@ -239,7 +239,6 @@ pull_request_rules:
   conditions:
     - or:
       - files~=^tests/tool_use/
-      - files~=^tests/mistral_tool_use/
       - files~=^tests/entrypoints/openai/tool_parsers/
       - files=tests/entrypoints/openai/test_chat_with_tool_reasoning.py
       - files~=^vllm/entrypoints/openai/tool_parsers/
diff --git a/docker/Dockerfile.cpu b/docker/Dockerfile.cpu
index b80157d2fd75..388596efd21c 100644
--- a/docker/Dockerfile.cpu
+++ b/docker/Dockerfile.cpu
@@ -47,7 +47,7 @@ ENV PATH="$VIRTUAL_ENV/bin:$PATH"
 
 ENV UV_HTTP_TIMEOUT=500
 
-# Install Python dependencies 
+# Install Python dependencies
 ENV PIP_EXTRA_INDEX_URL=${PIP_EXTRA_INDEX_URL}
 ENV UV_EXTRA_INDEX_URL=${PIP_EXTRA_INDEX_URL}
 ENV UV_INDEX_STRATEGY="unsafe-best-match"
@@ -104,7 +104,7 @@ RUN --mount=type=cache,target=/root/.cache/uv \
     --mount=type=cache,target=/root/.cache/ccache \
     --mount=type=cache,target=/workspace/vllm/.deps,sharing=locked \
     --mount=type=bind,source=.git,target=.git \
-    VLLM_TARGET_DEVICE=cpu python3 setup.py bdist_wheel 
+    VLLM_TARGET_DEVICE=cpu python3 setup.py bdist_wheel
 
 ######################### TEST DEPS #########################
 FROM base AS vllm-test-deps
@@ -117,7 +117,7 @@ RUN --mount=type=bind,src=requirements/test.in,target=requirements/test.in \
     uv pip compile requirements/cpu-test.in -o requirements/cpu-test.txt --index-strategy unsafe-best-match --torch-backend cpu
 
 RUN --mount=type=cache,target=/root/.cache/uv \
-    uv pip install -r requirements/cpu-test.txt 
+    uv pip install -r requirements/cpu-test.txt
 
 ######################### DEV IMAGE #########################
 FROM vllm-build AS vllm-dev
@@ -130,12 +130,12 @@ RUN --mount=type=cache,target=/var/cache/apt,sharing=locked \
 
 # install development dependencies (for testing)
 RUN --mount=type=cache,target=/root/.cache/uv \
-    uv pip install -e tests/vllm_test_utils 
+    uv pip install -e tests/vllm_test_utils
 
 RUN --mount=type=cache,target=/root/.cache/uv \
     --mount=type=cache,target=/root/.cache/ccache \
     --mount=type=bind,source=.git,target=.git \
-    VLLM_TARGET_DEVICE=cpu python3 setup.py develop 
+    VLLM_TARGET_DEVICE=cpu python3 setup.py develop
 
 COPY --from=vllm-test-deps /workspace/vllm/requirements/cpu-test.txt requirements/test.txt
 
@@ -160,11 +160,12 @@ ADD ./benchmarks/ ./benchmarks/
 ADD ./vllm/collect_env.py .
 ADD ./.buildkite/ ./.buildkite/
 
+# Create symlink for vllm-workspace to maintain CI compatibility
+RUN ln -sf /workspace /vllm-workspace
+
 # install development dependencies (for testing)
 RUN --mount=type=cache,target=/root/.cache/uv \
-    uv pip install -e tests/vllm_test_utils 
-
-ENTRYPOINT ["bash"]
+    uv pip install -e tests/vllm_test_utils
 
 ######################### RELEASE IMAGE #########################
 FROM base AS vllm-openai
diff --git a/pyproject.toml b/pyproject.toml
index 88c5c4067f5a..034a21f1c12b 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -126,6 +126,7 @@ markers = [
     "core_model: enable this model test in each PR instead of only nightly",
     "hybrid_model: models that contain mamba layers (including pure SSM and hybrid architectures)",
     "cpu_model: enable this model test in CPU tests",
+    "cpu_test: mark test as CPU-only test",
     "split: run this test as part of a split",
     "distributed: run this test only in distributed GPU tests",
     "skip_v1: do not run this test with v1",
diff --git a/tests/models/test_utils.py b/tests/models/test_utils.py
index b52327a1844f..9b87b1a9d46c 100644
--- a/tests/models/test_utils.py
+++ b/tests/models/test_utils.py
@@ -1,10 +1,13 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
+import pytest
 import torch
 
 from vllm.model_executor.models.utils import AutoWeightsLoader
 
+pytestmark = pytest.mark.cpu_test
+
 
 class ModuleWithBatchNorm(torch.nn.Module):
 
diff --git a/tests/models/test_vision.py b/tests/models/test_vision.py
index a30a856a81cf..60ea2447e984 100644
--- a/tests/models/test_vision.py
+++ b/tests/models/test_vision.py
@@ -16,6 +16,8 @@
 from vllm.platforms import current_platform
 from vllm.utils import get_open_port, update_environment_variables
 
+pytestmark = pytest.mark.cpu_test
+
 
 @pytest.mark.parametrize(
     ("select_layers", "num_layers_loaded", "max_possible_layers",
diff --git a/tests/multimodal/test_cache.py b/tests/multimodal/test_cache.py
index 3c737acfbfe2..48e88e7c0175 100644
--- a/tests/multimodal/test_cache.py
+++ b/tests/multimodal/test_cache.py
@@ -19,6 +19,8 @@
                                     MultiModalSharedField)
 from vllm.multimodal.processing import PromptInsertion
 
+pytestmark = pytest.mark.cpu_test
+
 
 def _dummy_elem(
     modality: str,
diff --git a/tests/multimodal/test_hasher.py b/tests/multimodal/test_hasher.py
index 2751e38760e1..46aba1b75f77 100644
--- a/tests/multimodal/test_hasher.py
+++ b/tests/multimodal/test_hasher.py
@@ -10,6 +10,8 @@
 
 from vllm.multimodal.hasher import MultiModalHasher
 
+pytestmark = pytest.mark.cpu_test
+
 ASSETS_DIR = Path(__file__).parent / "assets"
 assert ASSETS_DIR.exists()
 
diff --git a/tests/multimodal/test_image.py b/tests/multimodal/test_image.py
index 271a85f1195e..2f21ad969e74 100644
--- a/tests/multimodal/test_image.py
+++ b/tests/multimodal/test_image.py
@@ -8,6 +8,8 @@
 
 from vllm.multimodal.image import ImageMediaIO, convert_image_mode
 
+pytestmark = pytest.mark.cpu_test
+
 ASSETS_DIR = Path(__file__).parent / "assets"
 assert ASSETS_DIR.exists()
 
diff --git a/tests/multimodal/test_inputs.py b/tests/multimodal/test_inputs.py
index ffb3a6fe86b4..f35935d14ff2 100644
--- a/tests/multimodal/test_inputs.py
+++ b/tests/multimodal/test_inputs.py
@@ -1,10 +1,13 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
+import pytest
 import torch
 
 from vllm.multimodal.inputs import MultiModalKwargs, NestedTensors
 
+pytestmark = pytest.mark.cpu_test
+
 
 def assert_nested_tensors_equal(expected: NestedTensors,
                                 actual: NestedTensors):
diff --git a/tests/multimodal/test_processing.py b/tests/multimodal/test_processing.py
index 352b5b5b4fd4..7aa51acff350 100644
--- a/tests/multimodal/test_processing.py
+++ b/tests/multimodal/test_processing.py
@@ -25,6 +25,8 @@
 
 from .utils import random_image
 
+pytestmark = pytest.mark.cpu_test
+
 
 # yapf: disable
 @pytest.mark.parametrize(
diff --git a/tests/multimodal/test_registry.py b/tests/multimodal/test_registry.py
index d31e75bc279f..01fbe9a52b77 100644
--- a/tests/multimodal/test_registry.py
+++ b/tests/multimodal/test_registry.py
@@ -11,6 +11,8 @@
 
 from ..models.utils import build_model_context
 
+pytestmark = pytest.mark.cpu_test
+
 
 @pytest.mark.parametrize(
     "model_id,limit_mm_per_prompt,expected",
diff --git a/tests/multimodal/test_video.py b/tests/multimodal/test_video.py
index 05b7b84be7f3..1bdbb5a10a6d 100644
--- a/tests/multimodal/test_video.py
+++ b/tests/multimodal/test_video.py
@@ -17,6 +17,8 @@
 
 from .utils import cosine_similarity, create_video_from_image, normalize_image
 
+pytestmark = pytest.mark.cpu_test
+
 NUM_FRAMES = 10
 FAKE_OUTPUT_1 = np.random.rand(NUM_FRAMES, 1280, 720, 3)
 FAKE_OUTPUT_2 = np.random.rand(NUM_FRAMES, 1280, 720, 3)
diff --git a/tests/test_inputs.py b/tests/test_inputs.py
index e549834faf6f..b61b95bc4333 100644
--- a/tests/test_inputs.py
+++ b/tests/test_inputs.py
@@ -6,6 +6,8 @@
 from vllm.inputs import zip_enc_dec_prompts
 from vllm.inputs.parse import parse_and_batch_prompt
 
+pytestmark = pytest.mark.cpu_test
+
 STRING_INPUTS = [
     '',
     'foo',
diff --git a/tests/test_outputs.py b/tests/test_outputs.py
index 4bb1c20f77f1..46da83a428e5 100644
--- a/tests/test_outputs.py
+++ b/tests/test_outputs.py
@@ -1,8 +1,12 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
+import pytest
+
 from vllm.outputs import RequestOutput
 
+pytestmark = pytest.mark.cpu_test
+
 
 def test_request_output_forward_compatible():
     output = RequestOutput(request_id="test_request_id",
diff --git a/tests/mistral_tool_use/__init__.py b/tests/tool_use/mistral/__init__.py
similarity index 100%
rename from tests/mistral_tool_use/__init__.py
rename to tests/tool_use/mistral/__init__.py
diff --git a/tests/mistral_tool_use/conftest.py b/tests/tool_use/mistral/conftest.py
similarity index 93%
rename from tests/mistral_tool_use/conftest.py
rename to tests/tool_use/mistral/conftest.py
index e89e60c5a02e..e9dddccdc8c0 100644
--- a/tests/mistral_tool_use/conftest.py
+++ b/tests/tool_use/mistral/conftest.py
@@ -12,7 +12,7 @@
 
 
 # for each server config, download the model and return the config
-@pytest.fixture(scope="session", params=CONFIGS.keys())
+@pytest.fixture(scope="package", params=CONFIGS.keys())
 def server_config(request):
     config = CONFIGS[request.param]
 
@@ -26,7 +26,7 @@ def server_config(request):
 
 
 # run this for each server config
-@pytest.fixture(scope="session")
+@pytest.fixture(scope="package")
 def server(request, server_config: ServerConfig):
     model = server_config["model"]
     args_for_model = server_config["arguments"]
diff --git a/tests/mistral_tool_use/test_mistral_tool_calls.py b/tests/tool_use/mistral/test_mistral_tool_calls.py
similarity index 100%
rename from tests/mistral_tool_use/test_mistral_tool_calls.py
rename to tests/tool_use/mistral/test_mistral_tool_calls.py
diff --git a/tests/mistral_tool_use/utils.py b/tests/tool_use/mistral/utils.py
similarity index 100%
rename from tests/mistral_tool_use/utils.py
rename to tests/tool_use/mistral/utils.py
diff --git a/tests/tool_use/test_glm4_moe_tool_parser.py b/tests/tool_use/test_glm4_moe_tool_parser.py
index 91913c933184..bb8c36fb13ad 100644
--- a/tests/tool_use/test_glm4_moe_tool_parser.py
+++ b/tests/tool_use/test_glm4_moe_tool_parser.py
@@ -10,6 +10,8 @@
 from vllm.entrypoints.openai.tool_parsers import Glm4MoeModelToolParser
 from vllm.transformers_utils.tokenizer import get_tokenizer
 
+pytestmark = pytest.mark.cpu_test
+
 pytest.skip("skip glm4_moe parser test", allow_module_level=True)
 # Use a common model that is likely to be available
 MODEL = "zai-org/GLM-4.5"
diff --git a/tests/tool_use/test_jamba_tool_parser.py b/tests/tool_use/test_jamba_tool_parser.py
index 57ace1fa22ac..8f819301e264 100644
--- a/tests/tool_use/test_jamba_tool_parser.py
+++ b/tests/tool_use/test_jamba_tool_parser.py
@@ -15,6 +15,8 @@
 from vllm.transformers_utils.detokenizer_utils import detokenize_incrementally
 from vllm.transformers_utils.tokenizer import AnyTokenizer, get_tokenizer
 
+pytestmark = pytest.mark.cpu_test
+
 MODEL = "ai21labs/Jamba-tiny-dev"
 
 
diff --git a/tests/tool_use/test_kimi_k2_tool_parser.py b/tests/tool_use/test_kimi_k2_tool_parser.py
index bd030632f167..ad9af6361802 100644
--- a/tests/tool_use/test_kimi_k2_tool_parser.py
+++ b/tests/tool_use/test_kimi_k2_tool_parser.py
@@ -10,6 +10,8 @@
 from vllm.entrypoints.openai.tool_parsers import KimiK2ToolParser
 from vllm.transformers_utils.tokenizer import get_tokenizer
 
+pytestmark = pytest.mark.cpu_test
+
 # Use a common model that is likely to be available
 MODEL = "moonshotai/Kimi-K2-Instruct"
 
diff --git a/tests/tool_use/test_minimax_tool_parser.py b/tests/tool_use/test_minimax_tool_parser.py
index ddf26007121e..7aa19c9a51c9 100644
--- a/tests/tool_use/test_minimax_tool_parser.py
+++ b/tests/tool_use/test_minimax_tool_parser.py
@@ -12,6 +12,8 @@
 from vllm.entrypoints.openai.tool_parsers import MinimaxToolParser
 from vllm.transformers_utils.tokenizer import get_tokenizer
 
+pytestmark = pytest.mark.cpu_test
+
 # Use a common model that is likely to be available
 MODEL = "MiniMaxAi/MiniMax-M1-40k"
 
diff --git a/tests/tool_use/test_qwen3coder_tool_parser.py b/tests/tool_use/test_qwen3coder_tool_parser.py
index 57eaf84d36f2..ade089e8246e 100644
--- a/tests/tool_use/test_qwen3coder_tool_parser.py
+++ b/tests/tool_use/test_qwen3coder_tool_parser.py
@@ -18,6 +18,8 @@
 from vllm.transformers_utils.detokenizer_utils import detokenize_incrementally
 from vllm.transformers_utils.tokenizer import AnyTokenizer, get_tokenizer
 
+pytestmark = pytest.mark.cpu_test
+
 MODEL = "Qwen/Qwen3-Coder-30B-A3B-Instruct-FP8"
 
 
diff --git a/tests/tool_use/test_seed_oss_tool_parser.py b/tests/tool_use/test_seed_oss_tool_parser.py
index 118c7534622e..5100b5ac120b 100644
--- a/tests/tool_use/test_seed_oss_tool_parser.py
+++ b/tests/tool_use/test_seed_oss_tool_parser.py
@@ -16,6 +16,8 @@
 from vllm.transformers_utils.detokenizer_utils import detokenize_incrementally
 from vllm.transformers_utils.tokenizer import AnyTokenizer, get_tokenizer
 
+pytestmark = pytest.mark.cpu_test
+
 # Use a common model that is likely to be available
 MODEL = "ByteDance-Seed/Seed-OSS-36B-Instruct"
 
diff --git a/tests/tool_use/test_tool_choice_required.py b/tests/tool_use/test_tool_choice_required.py
index 130e9547bdcc..7c63816cd6f5 100644
--- a/tests/tool_use/test_tool_choice_required.py
+++ b/tests/tool_use/test_tool_choice_required.py
@@ -12,6 +12,8 @@
                                               ChatCompletionToolsParam)
 from vllm.entrypoints.openai.serving_chat import OpenAIServingChat
 
+pytestmark = pytest.mark.cpu_test
+
 EXAMPLE_TOOLS = [
     {
         "type": "function",
diff --git a/tests/tool_use/test_xlam_tool_parser.py b/tests/tool_use/test_xlam_tool_parser.py
index c07ca0f56d6b..94e2a37cbf63 100644
--- a/tests/tool_use/test_xlam_tool_parser.py
+++ b/tests/tool_use/test_xlam_tool_parser.py
@@ -14,6 +14,8 @@
 from vllm.transformers_utils.detokenizer_utils import detokenize_incrementally
 from vllm.transformers_utils.tokenizer import AnyTokenizer, get_tokenizer
 
+pytestmark = pytest.mark.cpu_test
+
 # Use a common model that is likely to be available
 MODEL = "Salesforce/Llama-xLAM-2-8B-fc-r"
 
diff --git a/tests/v1/core/test_async_scheduler.py b/tests/v1/core/test_async_scheduler.py
index c153e38fe3df..8ffe2e57b532 100644
--- a/tests/v1/core/test_async_scheduler.py
+++ b/tests/v1/core/test_async_scheduler.py
@@ -11,6 +11,8 @@
 
 from .utils import create_requests, create_scheduler
 
+pytestmark = pytest.mark.cpu_test
+
 
 def _make_model_runner_output(
     scheduler_output: SchedulerOutput, ) -> ModelRunnerOutput:
diff --git a/tests/v1/core/test_encoder_cache_manager.py b/tests/v1/core/test_encoder_cache_manager.py
index 4e3cace86be6..6ef15b337ef0 100644
--- a/tests/v1/core/test_encoder_cache_manager.py
+++ b/tests/v1/core/test_encoder_cache_manager.py
@@ -1,9 +1,12 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import pytest
 
 from vllm.multimodal.inputs import MultiModalFeatureSpec, PlaceholderRange
 from vllm.v1.core.encoder_cache_manager import EncoderCacheManager
 
+pytestmark = pytest.mark.cpu_test
+
 
 # ------------------ Mock Classes ------------------ #
 class MockRequest:
diff --git a/tests/v1/core/test_kv_cache_utils.py b/tests/v1/core/test_kv_cache_utils.py
index 452b16ef4a91..09f43a793db2 100644
--- a/tests/v1/core/test_kv_cache_utils.py
+++ b/tests/v1/core/test_kv_cache_utils.py
@@ -32,6 +32,8 @@
 
 # yapf: enable
 
+pytestmark = pytest.mark.cpu_test
+
 
 @pytest.fixture(autouse=True)
 def _auto_init_hash_fn(request):
diff --git a/tests/v1/core/test_prefix_caching.py b/tests/v1/core/test_prefix_caching.py
index 5769099e0af1..93ad4d8080e6 100644
--- a/tests/v1/core/test_prefix_caching.py
+++ b/tests/v1/core/test_prefix_caching.py
@@ -25,6 +25,8 @@
 from vllm.v1.kv_cache_interface import (FullAttentionSpec, KVCacheConfig,
                                         KVCacheGroupSpec, SlidingWindowSpec)
 
+pytestmark = pytest.mark.cpu_test
+
 
 @pytest.fixture(autouse=True)
 def _auto_init_hash_fn(request):
@@ -1267,7 +1269,7 @@ def test_kv_cache_events(blocks_to_cache: int):
 
 
 def test_eagle_enabled_removes_last_block():
-    """Verify Eagle does NOT remove blocks when request 
+    """Verify Eagle does NOT remove blocks when request
     length is divisible by block size."""
     block_size = 16
     manager = KVCacheManager(
diff --git a/tests/v1/core/test_scheduler.py b/tests/v1/core/test_scheduler.py
index 5e2bdaa75d3f..3de6dffc3395 100644
--- a/tests/v1/core/test_scheduler.py
+++ b/tests/v1/core/test_scheduler.py
@@ -23,6 +23,8 @@
 
 from .utils import EOS_TOKEN_ID, create_requests, create_scheduler
 
+pytestmark = pytest.mark.cpu_test
+
 
 def test_add_requests():
     scheduler = create_scheduler()
diff --git a/tests/v1/core/test_single_type_kv_cache_manager.py b/tests/v1/core/test_single_type_kv_cache_manager.py
index 1f6825b6d24e..166be8bda05e 100644
--- a/tests/v1/core/test_single_type_kv_cache_manager.py
+++ b/tests/v1/core/test_single_type_kv_cache_manager.py
@@ -3,6 +3,7 @@
 
 import random
 
+import pytest
 import torch
 
 from vllm.v1.core.block_pool import BlockPool
@@ -13,6 +14,8 @@
 from vllm.v1.kv_cache_interface import (ChunkedLocalAttentionSpec,
                                         SlidingWindowSpec)
 
+pytestmark = pytest.mark.cpu_test
+
 
 def get_sliding_window_manager(sliding_window_spec, block_pool):
     return SlidingWindowManager(sliding_window_spec,
diff --git a/tests/v1/kv_connector/unit/test_output_aggreagator.py b/tests/v1/kv_connector/unit/test_output_aggreagator.py
index 5d2b27a9eb4d..607da6425a31 100644
--- a/tests/v1/kv_connector/unit/test_output_aggreagator.py
+++ b/tests/v1/kv_connector/unit/test_output_aggreagator.py
@@ -3,9 +3,13 @@
 from concurrent.futures import Future
 from typing import Optional
 
+import pytest
+
 from vllm.distributed.kv_transfer.kv_connector.utils import KVOutputAggregator
 from vllm.v1.outputs import KVConnectorOutput, ModelRunnerOutput
 
+pytestmark = pytest.mark.cpu_test
+
 
 class DummyModelRunnerOutput(ModelRunnerOutput):
 
diff --git a/tests/v1/kv_connector/unit/test_remote_decode_lifecycle.py b/tests/v1/kv_connector/unit/test_remote_decode_lifecycle.py
index 380e72a15633..79b26cf57acd 100644
--- a/tests/v1/kv_connector/unit/test_remote_decode_lifecycle.py
+++ b/tests/v1/kv_connector/unit/test_remote_decode_lifecycle.py
@@ -2,12 +2,16 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 import copy
 
+import pytest
+
 from vllm.v1.outputs import EMPTY_MODEL_RUNNER_OUTPUT, KVConnectorOutput
 from vllm.v1.request import FinishReason, RequestStatus
 
 from .utils import (assert_scheduler_empty, create_model_runner_output,
                     create_request, create_scheduler, create_vllm_config)
 
+pytestmark = pytest.mark.cpu_test
+
 
 def test_basic_lifecycle():
     """Test lifecycle of a Remote Decode request."""
diff --git a/tests/v1/kv_connector/unit/test_remote_prefill_lifecycle.py b/tests/v1/kv_connector/unit/test_remote_prefill_lifecycle.py
index 21fec5344255..207cf64f4e3e 100644
--- a/tests/v1/kv_connector/unit/test_remote_prefill_lifecycle.py
+++ b/tests/v1/kv_connector/unit/test_remote_prefill_lifecycle.py
@@ -2,12 +2,16 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 import copy
 
+import pytest
+
 from vllm.v1.outputs import EMPTY_MODEL_RUNNER_OUTPUT, KVConnectorOutput
 from vllm.v1.request import FinishReason, RequestStatus
 
 from .utils import (assert_scheduler_empty, create_model_runner_output,
                     create_request, create_scheduler, create_vllm_config)
 
+pytestmark = pytest.mark.cpu_test
+
 
 def test_basic_lifecycle():
     """Test lifecycle of a remote prefill."""
diff --git a/tests/v1/metrics/test_metrics_reader.py b/tests/v1/metrics/test_metrics_reader.py
index c05de5e4cb64..16bca359fc2f 100644
--- a/tests/v1/metrics/test_metrics_reader.py
+++ b/tests/v1/metrics/test_metrics_reader.py
@@ -7,6 +7,8 @@
 from vllm.v1.metrics.reader import (Counter, Gauge, Histogram, Vector,
                                     get_metrics_snapshot)
 
+pytestmark = pytest.mark.cpu_test
+
 
 @pytest.fixture(autouse=True)
 def test_registry(monkeypatch):
diff --git a/tests/v1/structured_output/test_utils.py b/tests/v1/structured_output/test_utils.py
index 4e7c4b33e8c4..0e2658304d12 100644
--- a/tests/v1/structured_output/test_utils.py
+++ b/tests/v1/structured_output/test_utils.py
@@ -6,6 +6,8 @@
 from vllm.v1.structured_output.backend_xgrammar import (
     has_xgrammar_unsupported_json_features)
 
+pytestmark = pytest.mark.cpu_test
+
 
 @pytest.fixture
 def unsupported_string_schemas():
diff --git a/tests/v1/test_serial_utils.py b/tests/v1/test_serial_utils.py
index 118b40d0ef41..5d467687c308 100644
--- a/tests/v1/test_serial_utils.py
+++ b/tests/v1/test_serial_utils.py
@@ -16,6 +16,8 @@
                                     MultiModalSharedField, NestedTensors)
 from vllm.v1.serial_utils import MsgpackDecoder, MsgpackEncoder
 
+pytestmark = pytest.mark.cpu_test
+
 
 class UnrecognizedType(UserDict):
 

From 62b35359da8f62d64b6861fc61ebf456f36afaae Mon Sep 17 00:00:00 2001
From: ihb2032 <40718643+ihb2032@users.noreply.github.com>
Date: Tue, 30 Sep 2025 21:48:07 +0800
Subject: [PATCH 045/193] [Fix] Improve CPU backend compatibility for RISC-V
 (#25816)

Signed-off-by: lyd1992 <liuyudong@iscas.ac.cn>
Signed-off-by: ihb2032 <1355790728@qq.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/engine/arg_utils.py | 9 +++++----
 1 file changed, 5 insertions(+), 4 deletions(-)

diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index ce0f1708235f..ec61fc4b9b06 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -1160,11 +1160,12 @@ def create_engine_config(
 
         # Set default arguments for V1 Engine.
         self._set_default_args(usage_context, model_config)
-        # Disable chunked prefill for POWER (ppc64le)/ARM/s390x CPUs in V1
+        # Disable chunked prefill for POWER (ppc64le)/ARM/s390x/RISCV CPUs in V1
         if current_platform.is_cpu() and current_platform.get_cpu_architecture(
-        ) in (CpuArchEnum.POWERPC, CpuArchEnum.S390X, CpuArchEnum.ARM):
-            logger.info("Chunked prefill is not supported for ARM and POWER "
-                        "and S390X CPUs; "
+        ) in (CpuArchEnum.POWERPC, CpuArchEnum.S390X, CpuArchEnum.ARM,
+              CpuArchEnum.RISCV):
+            logger.info("Chunked prefill is not supported for ARM and POWER, "
+                        "S390X and RISC-V CPUs; "
                         "disabling it for V1 backend.")
             self.enable_chunked_prefill = False
         assert self.enable_chunked_prefill is not None

From 23fcf23f84a235f3885322d1ac364dd1f6e9e095 Mon Sep 17 00:00:00 2001
From: Asaf Joseph Gardin <39553475+Josephasafg@users.noreply.github.com>
Date: Tue, 30 Sep 2025 17:30:44 +0300
Subject: [PATCH 046/193] [Kernel][Moe Configs] Add more tuned triton configs
 for ExpertsInt8 and FP8 (#25858)

Signed-off-by: asafg <39553475+Josephasafg@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 ...VIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json | 146 +++++++++++++
 ...VIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json | 198 ++++++------------
 ...072,device_name=NVIDIA_H100_80GB_HBM3.json |  92 ++++----
 ...ice_name=NVIDIA_H200,dtype=int8_w8a16.json | 146 +++++++++++++
 ...VIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json | 146 +++++++++++++
 ...VIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json | 146 +++++++++++++
 ...VIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json | 146 +++++++++++++
 ...VIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json | 146 +++++++++++++
 ...792,device_name=NVIDIA_H100_80GB_HBM3.json | 146 +++++++++++++
 ...me=NVIDIA_H100_80GB_HBM3,dtype=float8.json | 146 +++++++++++++
 ...VIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json | 104 ++++-----
 ...ice_name=NVIDIA_H200,dtype=int8_w8a16.json | 146 +++++++++++++
 ...VIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json | 146 +++++++++++++
 ...me=NVIDIA_H100_80GB_HBM3,dtype=float8.json | 146 +++++++++++++
 ...VIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json |  82 ++++----
 15 files changed, 1808 insertions(+), 274 deletions(-)
 create mode 100644 vllm/model_executor/layers/fused_moe/configs/E=1,N=1792,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
 create mode 100644 vllm/model_executor/layers/fused_moe/configs/E=1,N=3072,device_name=NVIDIA_H200,dtype=int8_w8a16.json
 create mode 100644 vllm/model_executor/layers/fused_moe/configs/E=1,N=3584,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
 create mode 100644 vllm/model_executor/layers/fused_moe/configs/E=1,N=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
 create mode 100644 vllm/model_executor/layers/fused_moe/configs/E=16,N=14336,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
 create mode 100644 vllm/model_executor/layers/fused_moe/configs/E=16,N=1792,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
 create mode 100644 vllm/model_executor/layers/fused_moe/configs/E=16,N=1792,device_name=NVIDIA_H100_80GB_HBM3.json
 create mode 100644 vllm/model_executor/layers/fused_moe/configs/E=16,N=3072,device_name=NVIDIA_H100_80GB_HBM3,dtype=float8.json
 create mode 100644 vllm/model_executor/layers/fused_moe/configs/E=16,N=3072,device_name=NVIDIA_H200,dtype=int8_w8a16.json
 create mode 100644 vllm/model_executor/layers/fused_moe/configs/E=16,N=3584,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
 create mode 100644 vllm/model_executor/layers/fused_moe/configs/E=16,N=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=float8.json

diff --git a/vllm/model_executor/layers/fused_moe/configs/E=1,N=1792,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json b/vllm/model_executor/layers/fused_moe/configs/E=1,N=1792,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
new file mode 100644
index 000000000000..99501df6f176
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/configs/E=1,N=1792,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
@@ -0,0 +1,146 @@
+{
+    "1": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "2": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "4": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "8": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "16": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "24": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "32": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "48": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 4
+    },
+    "64": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "96": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "128": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "256": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "512": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "1024": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "1536": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "2048": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "3072": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "4096": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    }
+  }
\ No newline at end of file
diff --git a/vllm/model_executor/layers/fused_moe/configs/E=1,N=3072,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json b/vllm/model_executor/layers/fused_moe/configs/E=1,N=3072,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
index 2c78bfaba789..2e0dd7a4b950 100644
--- a/vllm/model_executor/layers/fused_moe/configs/E=1,N=3072,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
+++ b/vllm/model_executor/layers/fused_moe/configs/E=1,N=3072,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
@@ -1,218 +1,146 @@
 {
   "1": {
     "BLOCK_SIZE_M": 16,
-    "BLOCK_SIZE_N": 32,
+    "BLOCK_SIZE_N": 64,
     "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 32,
+    "GROUP_SIZE_M": 1,
     "num_warps": 4,
-    "num_stages": 3
+    "num_stages": 5
   },
   "2": {
     "BLOCK_SIZE_M": 16,
     "BLOCK_SIZE_N": 64,
-    "BLOCK_SIZE_K": 128,
+    "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 1,
-    "num_warps": 8,
+    "num_warps": 4,
     "num_stages": 5
   },
   "4": {
     "BLOCK_SIZE_M": 16,
     "BLOCK_SIZE_N": 64,
-    "BLOCK_SIZE_K": 128,
+    "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 1,
-    "num_warps": 8,
+    "num_warps": 4,
     "num_stages": 5
   },
   "8": {
     "BLOCK_SIZE_M": 16,
     "BLOCK_SIZE_N": 64,
-    "BLOCK_SIZE_K": 128,
+    "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 1,
-    "num_warps": 8,
-    "num_stages": 4
+    "num_warps": 4,
+    "num_stages": 5
   },
   "16": {
     "BLOCK_SIZE_M": 16,
     "BLOCK_SIZE_N": 64,
-    "BLOCK_SIZE_K": 128,
+    "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 1,
-    "num_warps": 8,
-    "num_stages": 5
+    "num_warps": 4,
+    "num_stages": 3
   },
   "24": {
-    "BLOCK_SIZE_M": 32,
+    "BLOCK_SIZE_M": 64,
     "BLOCK_SIZE_N": 64,
     "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
     "num_stages": 3
   },
   "32": {
-    "BLOCK_SIZE_M": 16,
-    "BLOCK_SIZE_N": 32,
+    "BLOCK_SIZE_M": 64,
+    "BLOCK_SIZE_N": 64,
     "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 1,
-    "num_warps": 4,
-    "num_stages": 5
+    "num_warps": 8,
+    "num_stages": 3
   },
   "48": {
-    "BLOCK_SIZE_M": 64,
-    "BLOCK_SIZE_N": 32,
-    "BLOCK_SIZE_K": 256,
+    "BLOCK_SIZE_M": 128,
+    "BLOCK_SIZE_N": 64,
+    "BLOCK_SIZE_K": 128,
     "GROUP_SIZE_M": 1,
     "num_warps": 4,
-    "num_stages": 3
+    "num_stages": 4
   },
   "64": {
-    "BLOCK_SIZE_M": 64,
-    "BLOCK_SIZE_N": 32,
-    "BLOCK_SIZE_K": 256,
+    "BLOCK_SIZE_M": 128,
+    "BLOCK_SIZE_N": 64,
+    "BLOCK_SIZE_K": 128,
     "GROUP_SIZE_M": 1,
     "num_warps": 4,
-    "num_stages": 3
+    "num_stages": 4
   },
   "96": {
     "BLOCK_SIZE_M": 64,
     "BLOCK_SIZE_N": 64,
-    "BLOCK_SIZE_K": 256,
+    "BLOCK_SIZE_K": 64,
     "GROUP_SIZE_M": 1,
     "num_warps": 4,
-    "num_stages": 2
+    "num_stages": 5
   },
   "128": {
-    "BLOCK_SIZE_M": 64,
+    "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 64,
-    "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 1,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 16,
     "num_warps": 4,
-    "num_stages": 2
+    "num_stages": 4
   },
   "256": {
-    "BLOCK_SIZE_M": 256,
-    "BLOCK_SIZE_N": 64,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 64,
-    "num_warps": 8,
+    "BLOCK_SIZE_M": 128,
+    "BLOCK_SIZE_N": 128,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 4,
     "num_stages": 3
   },
   "512": {
-    "BLOCK_SIZE_M": 256,
+    "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
+    "BLOCK_SIZE_K": 64,
     "GROUP_SIZE_M": 1,
-    "num_warps": 8,
-    "num_stages": 3
+    "num_warps": 4,
+    "num_stages": 4
   },
   "1024": {
-    "BLOCK_SIZE_M": 256,
+    "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 64,
+    "num_warps": 4,
     "num_stages": 3
   },
   "1536": {
-    "BLOCK_SIZE_M": 256,
+    "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 32,
+    "num_warps": 4,
     "num_stages": 3
   },
   "2048": {
-    "BLOCK_SIZE_M": 256,
+    "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
     "num_stages": 3
   },
   "3072": {
-    "BLOCK_SIZE_M": 256,
+    "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
     "num_stages": 3
   },
   "4096": {
-    "BLOCK_SIZE_M": 256,
-    "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
-    "num_stages": 3
-  },
-  "5120": {
-    "BLOCK_SIZE_M": 256,
-    "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
-    "num_stages": 3
-  },
-  "9216": {
-    "BLOCK_SIZE_M": 256,
-    "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
-    "num_stages": 3
-  },
-  "13312": {
-    "BLOCK_SIZE_M": 256,
+    "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
-    "num_stages": 3
-  },
-  "17408": {
-    "BLOCK_SIZE_M": 256,
-    "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
-    "num_stages": 3
-  },
-  "25600": {
-    "BLOCK_SIZE_M": 256,
-    "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
-    "num_stages": 3
-  },
-  "33792": {
-    "BLOCK_SIZE_M": 256,
-    "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
-    "num_stages": 3
-  },
-  "41984": {
-    "BLOCK_SIZE_M": 256,
-    "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
-    "num_stages": 3
-  },
-  "50176": {
-    "BLOCK_SIZE_M": 256,
-    "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
-    "num_stages": 3
-  },
-  "58368": {
-    "BLOCK_SIZE_M": 256,
-    "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
     "num_stages": 3
   }
 }
\ No newline at end of file
diff --git a/vllm/model_executor/layers/fused_moe/configs/E=1,N=3072,device_name=NVIDIA_H100_80GB_HBM3.json b/vllm/model_executor/layers/fused_moe/configs/E=1,N=3072,device_name=NVIDIA_H100_80GB_HBM3.json
index 4da841e74a79..4ea86340c324 100644
--- a/vllm/model_executor/layers/fused_moe/configs/E=1,N=3072,device_name=NVIDIA_H100_80GB_HBM3.json
+++ b/vllm/model_executor/layers/fused_moe/configs/E=1,N=3072,device_name=NVIDIA_H100_80GB_HBM3.json
@@ -5,7 +5,7 @@
     "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 1,
     "num_warps": 4,
-    "num_stages": 4
+    "num_stages": 5
   },
   "2": {
     "BLOCK_SIZE_M": 16,
@@ -13,7 +13,7 @@
     "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 1,
     "num_warps": 4,
-    "num_stages": 3
+    "num_stages": 5
   },
   "4": {
     "BLOCK_SIZE_M": 16,
@@ -21,7 +21,7 @@
     "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 1,
     "num_warps": 4,
-    "num_stages": 3
+    "num_stages": 5
   },
   "8": {
     "BLOCK_SIZE_M": 16,
@@ -29,7 +29,7 @@
     "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 1,
     "num_warps": 4,
-    "num_stages": 3
+    "num_stages": 5
   },
   "16": {
     "BLOCK_SIZE_M": 16,
@@ -37,52 +37,52 @@
     "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 1,
     "num_warps": 4,
-    "num_stages": 5
+    "num_stages": 3
   },
   "24": {
-    "BLOCK_SIZE_M": 32,
+    "BLOCK_SIZE_M": 64,
     "BLOCK_SIZE_N": 64,
     "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
-    "num_stages": 4
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
+    "num_stages": 3
   },
   "32": {
     "BLOCK_SIZE_M": 64,
     "BLOCK_SIZE_N": 64,
-    "BLOCK_SIZE_K": 128,
+    "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 1,
-    "num_warps": 4,
-    "num_stages": 5
+    "num_warps": 8,
+    "num_stages": 3
   },
   "48": {
-    "BLOCK_SIZE_M": 64,
+    "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 64,
     "BLOCK_SIZE_K": 128,
     "GROUP_SIZE_M": 1,
     "num_warps": 4,
-    "num_stages": 5
+    "num_stages": 4
   },
   "64": {
-    "BLOCK_SIZE_M": 64,
+    "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 64,
     "BLOCK_SIZE_K": 128,
     "GROUP_SIZE_M": 1,
     "num_warps": 4,
-    "num_stages": 5
+    "num_stages": 4
   },
   "96": {
     "BLOCK_SIZE_M": 64,
-    "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 16,
+    "BLOCK_SIZE_N": 64,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 1,
     "num_warps": 4,
-    "num_stages": 4
+    "num_stages": 5
   },
   "128": {
-    "BLOCK_SIZE_M": 64,
-    "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
+    "BLOCK_SIZE_M": 128,
+    "BLOCK_SIZE_N": 64,
+    "BLOCK_SIZE_K": 64,
     "GROUP_SIZE_M": 16,
     "num_warps": 4,
     "num_stages": 4
@@ -91,57 +91,57 @@
     "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 64,
-    "GROUP_SIZE_M": 64,
-    "num_warps": 8,
-    "num_stages": 5
+    "GROUP_SIZE_M": 1,
+    "num_warps": 4,
+    "num_stages": 3
   },
   "512": {
     "BLOCK_SIZE_M": 128,
-    "BLOCK_SIZE_N": 256,
+    "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 64,
-    "GROUP_SIZE_M": 16,
-    "num_warps": 8,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 4,
     "num_stages": 4
   },
   "1024": {
     "BLOCK_SIZE_M": 128,
-    "BLOCK_SIZE_N": 256,
+    "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 64,
-    "GROUP_SIZE_M": 32,
-    "num_warps": 8,
-    "num_stages": 4
+    "GROUP_SIZE_M": 64,
+    "num_warps": 4,
+    "num_stages": 3
   },
   "1536": {
     "BLOCK_SIZE_M": 128,
-    "BLOCK_SIZE_N": 256,
+    "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 64,
     "GROUP_SIZE_M": 32,
-    "num_warps": 8,
-    "num_stages": 4
+    "num_warps": 4,
+    "num_stages": 3
   },
   "2048": {
     "BLOCK_SIZE_M": 128,
-    "BLOCK_SIZE_N": 256,
+    "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 64,
     "GROUP_SIZE_M": 16,
-    "num_warps": 8,
+    "num_warps": 4,
     "num_stages": 3
   },
   "3072": {
     "BLOCK_SIZE_M": 128,
-    "BLOCK_SIZE_N": 256,
+    "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 64,
-    "GROUP_SIZE_M": 64,
-    "num_warps": 8,
-    "num_stages": 4
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
+    "num_stages": 3
   },
   "4096": {
     "BLOCK_SIZE_M": 128,
-    "BLOCK_SIZE_N": 256,
+    "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 64,
-    "GROUP_SIZE_M": 32,
-    "num_warps": 8,
-    "num_stages": 4
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
+    "num_stages": 3
   },
   "5120": {
     "BLOCK_SIZE_M": 128,
diff --git a/vllm/model_executor/layers/fused_moe/configs/E=1,N=3072,device_name=NVIDIA_H200,dtype=int8_w8a16.json b/vllm/model_executor/layers/fused_moe/configs/E=1,N=3072,device_name=NVIDIA_H200,dtype=int8_w8a16.json
new file mode 100644
index 000000000000..f3f1a562710b
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/configs/E=1,N=3072,device_name=NVIDIA_H200,dtype=int8_w8a16.json
@@ -0,0 +1,146 @@
+{
+    "1": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "2": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "4": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "8": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "16": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "24": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "32": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "48": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "64": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "96": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "128": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "256": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "512": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "1024": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "1536": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "2048": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "3072": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "4096": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    }
+}
\ No newline at end of file
diff --git a/vllm/model_executor/layers/fused_moe/configs/E=1,N=3584,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json b/vllm/model_executor/layers/fused_moe/configs/E=1,N=3584,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
new file mode 100644
index 000000000000..19046fcf1d6a
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/configs/E=1,N=3584,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
@@ -0,0 +1,146 @@
+{
+    "1": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "2": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "4": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "8": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "16": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "24": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "32": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "48": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "64": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "96": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "128": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "256": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "512": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "1024": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "1536": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "2048": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "3072": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "4096": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    }
+}
\ No newline at end of file
diff --git a/vllm/model_executor/layers/fused_moe/configs/E=1,N=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json b/vllm/model_executor/layers/fused_moe/configs/E=1,N=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
new file mode 100644
index 000000000000..5f9422fe6f7c
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/configs/E=1,N=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
@@ -0,0 +1,146 @@
+{
+    "1": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "2": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "4": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "8": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "16": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "24": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "32": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "48": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "64": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "96": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "128": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "256": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "512": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "1024": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "1536": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "2048": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "3072": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "4096": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    }
+}
\ No newline at end of file
diff --git a/vllm/model_executor/layers/fused_moe/configs/E=16,N=14336,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json b/vllm/model_executor/layers/fused_moe/configs/E=16,N=14336,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
new file mode 100644
index 000000000000..6d0cdfd27429
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/configs/E=16,N=14336,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
@@ -0,0 +1,146 @@
+{
+  "1": {
+    "BLOCK_SIZE_M": 16,
+    "BLOCK_SIZE_N": 32,
+    "BLOCK_SIZE_K": 256,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 4,
+    "num_stages": 5
+  },
+  "2": {
+    "BLOCK_SIZE_M": 16,
+    "BLOCK_SIZE_N": 64,
+    "BLOCK_SIZE_K": 256,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 8,
+    "num_stages": 5
+  },
+  "4": {
+    "BLOCK_SIZE_M": 16,
+    "BLOCK_SIZE_N": 32,
+    "BLOCK_SIZE_K": 256,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 4,
+    "num_stages": 2
+  },
+  "8": {
+    "BLOCK_SIZE_M": 16,
+    "BLOCK_SIZE_N": 128,
+    "BLOCK_SIZE_K": 256,
+    "GROUP_SIZE_M": 32,
+    "num_warps": 4,
+    "num_stages": 2
+  },
+  "16": {
+    "BLOCK_SIZE_M": 16,
+    "BLOCK_SIZE_N": 128,
+    "BLOCK_SIZE_K": 256,
+    "GROUP_SIZE_M": 64,
+    "num_warps": 4,
+    "num_stages": 3
+  },
+  "24": {
+    "BLOCK_SIZE_M": 16,
+    "BLOCK_SIZE_N": 64,
+    "BLOCK_SIZE_K": 256,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 8,
+    "num_stages": 5
+  },
+  "32": {
+    "BLOCK_SIZE_M": 16,
+    "BLOCK_SIZE_N": 128,
+    "BLOCK_SIZE_K": 256,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 8,
+    "num_stages": 4
+  },
+  "48": {
+    "BLOCK_SIZE_M": 16,
+    "BLOCK_SIZE_N": 256,
+    "BLOCK_SIZE_K": 256,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 8,
+    "num_stages": 3
+  },
+  "64": {
+    "BLOCK_SIZE_M": 16,
+    "BLOCK_SIZE_N": 128,
+    "BLOCK_SIZE_K": 256,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 8,
+    "num_stages": 3
+  },
+  "96": {
+    "BLOCK_SIZE_M": 16,
+    "BLOCK_SIZE_N": 64,
+    "BLOCK_SIZE_K": 256,
+    "GROUP_SIZE_M": 32,
+    "num_warps": 4,
+    "num_stages": 5
+  },
+  "128": {
+    "BLOCK_SIZE_M": 32,
+    "BLOCK_SIZE_N": 256,
+    "BLOCK_SIZE_K": 128,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 4,
+    "num_stages": 3
+  },
+  "256": {
+    "BLOCK_SIZE_M": 64,
+    "BLOCK_SIZE_N": 128,
+    "BLOCK_SIZE_K": 128,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 4,
+    "num_stages": 3
+  },
+  "512": {
+    "BLOCK_SIZE_M": 128,
+    "BLOCK_SIZE_N": 128,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 4,
+    "num_stages": 4
+  },
+  "1024": {
+    "BLOCK_SIZE_M": 128,
+    "BLOCK_SIZE_N": 128,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 64,
+    "num_warps": 4,
+    "num_stages": 4
+  },
+  "1536": {
+    "BLOCK_SIZE_M": 256,
+    "BLOCK_SIZE_N": 128,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 8,
+    "num_stages": 4
+  },
+  "2048": {
+    "BLOCK_SIZE_M": 128,
+    "BLOCK_SIZE_N": 128,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
+    "num_stages": 3
+  },
+  "3072": {
+    "BLOCK_SIZE_M": 128,
+    "BLOCK_SIZE_N": 128,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
+    "num_stages": 3
+  },
+  "4096": {
+    "BLOCK_SIZE_M": 128,
+    "BLOCK_SIZE_N": 128,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
+    "num_stages": 3
+  }
+}
diff --git a/vllm/model_executor/layers/fused_moe/configs/E=16,N=1792,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json b/vllm/model_executor/layers/fused_moe/configs/E=16,N=1792,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
new file mode 100644
index 000000000000..de8eec366eca
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/configs/E=16,N=1792,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
@@ -0,0 +1,146 @@
+{
+    "1": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "2": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "4": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "8": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "16": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "24": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "32": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "48": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "64": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "96": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "128": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "256": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "512": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "1024": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "1536": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "2048": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "3072": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "4096": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    }
+  }
\ No newline at end of file
diff --git a/vllm/model_executor/layers/fused_moe/configs/E=16,N=1792,device_name=NVIDIA_H100_80GB_HBM3.json b/vllm/model_executor/layers/fused_moe/configs/E=16,N=1792,device_name=NVIDIA_H100_80GB_HBM3.json
new file mode 100644
index 000000000000..80fce79fb64c
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/configs/E=16,N=1792,device_name=NVIDIA_H100_80GB_HBM3.json
@@ -0,0 +1,146 @@
+{
+    "1": {
+      "BLOCK_SIZE_M": 16,
+      "BLOCK_SIZE_N": 64,
+      "BLOCK_SIZE_K": 128,
+      "GROUP_SIZE_M": 32,
+      "num_warps": 4,
+      "num_stages": 5
+    },
+    "2": {
+      "BLOCK_SIZE_M": 16,
+      "BLOCK_SIZE_N": 128,
+      "BLOCK_SIZE_K": 128,
+      "GROUP_SIZE_M": 64,
+      "num_warps": 4,
+      "num_stages": 5
+    },
+    "4": {
+      "BLOCK_SIZE_M": 16,
+      "BLOCK_SIZE_N": 256,
+      "BLOCK_SIZE_K": 128,
+      "GROUP_SIZE_M": 64,
+      "num_warps": 8,
+      "num_stages": 3
+    },
+    "8": {
+      "BLOCK_SIZE_M": 16,
+      "BLOCK_SIZE_N": 32,
+      "BLOCK_SIZE_K": 256,
+      "GROUP_SIZE_M": 1,
+      "num_warps": 4,
+      "num_stages": 5
+    },
+    "16": {
+      "BLOCK_SIZE_M": 16,
+      "BLOCK_SIZE_N": 128,
+      "BLOCK_SIZE_K": 128,
+      "GROUP_SIZE_M": 1,
+      "num_warps": 4,
+      "num_stages": 2
+    },
+    "24": {
+      "BLOCK_SIZE_M": 16,
+      "BLOCK_SIZE_N": 64,
+      "BLOCK_SIZE_K": 256,
+      "GROUP_SIZE_M": 16,
+      "num_warps": 4,
+      "num_stages": 2
+    },
+    "32": {
+      "BLOCK_SIZE_M": 16,
+      "BLOCK_SIZE_N": 256,
+      "BLOCK_SIZE_K": 128,
+      "GROUP_SIZE_M": 32,
+      "num_warps": 8,
+      "num_stages": 2
+    },
+    "48": {
+      "BLOCK_SIZE_M": 16,
+      "BLOCK_SIZE_N": 128,
+      "BLOCK_SIZE_K": 128,
+      "GROUP_SIZE_M": 1,
+      "num_warps": 4,
+      "num_stages": 4
+    },
+    "64": {
+      "BLOCK_SIZE_M": 16,
+      "BLOCK_SIZE_N": 256,
+      "BLOCK_SIZE_K": 128,
+      "GROUP_SIZE_M": 1,
+      "num_warps": 4,
+      "num_stages": 2
+    },
+    "96": {
+      "BLOCK_SIZE_M": 32,
+      "BLOCK_SIZE_N": 128,
+      "BLOCK_SIZE_K": 128,
+      "GROUP_SIZE_M": 1,
+      "num_warps": 4,
+      "num_stages": 3
+    },
+    "128": {
+      "BLOCK_SIZE_M": 32,
+      "BLOCK_SIZE_N": 128,
+      "BLOCK_SIZE_K": 128,
+      "GROUP_SIZE_M": 1,
+      "num_warps": 4,
+      "num_stages": 4
+    },
+    "256": {
+      "BLOCK_SIZE_M": 64,
+      "BLOCK_SIZE_N": 64,
+      "BLOCK_SIZE_K": 64,
+      "GROUP_SIZE_M": 1,
+      "num_warps": 4,
+      "num_stages": 3
+    },
+    "512": {
+      "BLOCK_SIZE_M": 128,
+      "BLOCK_SIZE_N": 128,
+      "BLOCK_SIZE_K": 64,
+      "GROUP_SIZE_M": 1,
+      "num_warps": 8,
+      "num_stages": 3
+    },
+    "1024": {
+      "BLOCK_SIZE_M": 128,
+      "BLOCK_SIZE_N": 256,
+      "BLOCK_SIZE_K": 64,
+      "GROUP_SIZE_M": 1,
+      "num_warps": 8,
+      "num_stages": 4
+    },
+    "1536": {
+      "BLOCK_SIZE_M": 128,
+      "BLOCK_SIZE_N": 256,
+      "BLOCK_SIZE_K": 64,
+      "GROUP_SIZE_M": 16,
+      "num_warps": 8,
+      "num_stages": 4
+    },
+    "2048": {
+      "BLOCK_SIZE_M": 128,
+      "BLOCK_SIZE_N": 256,
+      "BLOCK_SIZE_K": 64,
+      "GROUP_SIZE_M": 1,
+      "num_warps": 8,
+      "num_stages": 4
+    },
+    "3072": {
+      "BLOCK_SIZE_M": 128,
+      "BLOCK_SIZE_N": 256,
+      "BLOCK_SIZE_K": 64,
+      "GROUP_SIZE_M": 16,
+      "num_warps": 8,
+      "num_stages": 4
+    },
+    "4096": {
+      "BLOCK_SIZE_M": 128,
+      "BLOCK_SIZE_N": 256,
+      "BLOCK_SIZE_K": 64,
+      "GROUP_SIZE_M": 1,
+      "num_warps": 8,
+      "num_stages": 4
+    }
+  }
\ No newline at end of file
diff --git a/vllm/model_executor/layers/fused_moe/configs/E=16,N=3072,device_name=NVIDIA_H100_80GB_HBM3,dtype=float8.json b/vllm/model_executor/layers/fused_moe/configs/E=16,N=3072,device_name=NVIDIA_H100_80GB_HBM3,dtype=float8.json
new file mode 100644
index 000000000000..54d3bf190ebe
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/configs/E=16,N=3072,device_name=NVIDIA_H100_80GB_HBM3,dtype=float8.json
@@ -0,0 +1,146 @@
+{
+    "1": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "2": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "4": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "8": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "16": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "24": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "32": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "48": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "64": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "96": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "128": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "256": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "512": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "1024": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "1536": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "2048": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "3072": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "4096": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 2
+    }
+}
\ No newline at end of file
diff --git a/vllm/model_executor/layers/fused_moe/configs/E=16,N=3072,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json b/vllm/model_executor/layers/fused_moe/configs/E=16,N=3072,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
index 26f9abd6b789..6a4018195603 100644
--- a/vllm/model_executor/layers/fused_moe/configs/E=16,N=3072,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
+++ b/vllm/model_executor/layers/fused_moe/configs/E=16,N=3072,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
@@ -2,73 +2,73 @@
   "1": {
     "BLOCK_SIZE_M": 16,
     "BLOCK_SIZE_N": 32,
-    "BLOCK_SIZE_K": 256,
+    "BLOCK_SIZE_K": 128,
     "GROUP_SIZE_M": 1,
     "num_warps": 4,
     "num_stages": 5
   },
   "2": {
     "BLOCK_SIZE_M": 16,
-    "BLOCK_SIZE_N": 32,
+    "BLOCK_SIZE_N": 64,
     "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 1,
+    "GROUP_SIZE_M": 16,
     "num_warps": 4,
-    "num_stages": 4
+    "num_stages": 3
   },
   "4": {
     "BLOCK_SIZE_M": 16,
-    "BLOCK_SIZE_N": 64,
-    "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 1,
+    "BLOCK_SIZE_N": 128,
+    "BLOCK_SIZE_K": 128,
+    "GROUP_SIZE_M": 64,
     "num_warps": 8,
-    "num_stages": 4
+    "num_stages": 3
   },
   "8": {
     "BLOCK_SIZE_M": 16,
     "BLOCK_SIZE_N": 32,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
+    "BLOCK_SIZE_K": 256,
+    "GROUP_SIZE_M": 32,
     "num_warps": 4,
     "num_stages": 5
   },
   "16": {
     "BLOCK_SIZE_M": 16,
-    "BLOCK_SIZE_N": 64,
+    "BLOCK_SIZE_N": 32,
     "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 64,
+    "GROUP_SIZE_M": 32,
     "num_warps": 4,
-    "num_stages": 4
+    "num_stages": 3
   },
   "24": {
     "BLOCK_SIZE_M": 16,
-    "BLOCK_SIZE_N": 64,
+    "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 32,
-    "num_warps": 4,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 8,
     "num_stages": 3
   },
   "32": {
     "BLOCK_SIZE_M": 16,
-    "BLOCK_SIZE_N": 64,
+    "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 32,
+    "GROUP_SIZE_M": 16,
     "num_warps": 4,
-    "num_stages": 4
+    "num_stages": 3
   },
   "48": {
     "BLOCK_SIZE_M": 16,
-    "BLOCK_SIZE_N": 64,
+    "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 64,
-    "num_warps": 4,
-    "num_stages": 4
+    "GROUP_SIZE_M": 1,
+    "num_warps": 8,
+    "num_stages": 3
   },
   "64": {
     "BLOCK_SIZE_M": 16,
-    "BLOCK_SIZE_N": 64,
+    "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 32,
-    "num_warps": 4,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 8,
     "num_stages": 3
   },
   "96": {
@@ -77,22 +77,22 @@
     "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 32,
     "num_warps": 4,
-    "num_stages": 4
+    "num_stages": 3
   },
   "128": {
     "BLOCK_SIZE_M": 32,
-    "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
+    "BLOCK_SIZE_N": 256,
+    "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 1,
-    "num_warps": 4,
-    "num_stages": 4
+    "num_warps": 8,
+    "num_stages": 3
   },
   "256": {
-    "BLOCK_SIZE_M": 32,
-    "BLOCK_SIZE_N": 128,
+    "BLOCK_SIZE_M": 64,
+    "BLOCK_SIZE_N": 256,
     "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 16,
-    "num_warps": 4,
+    "GROUP_SIZE_M": 32,
+    "num_warps": 8,
     "num_stages": 4
   },
   "512": {
@@ -100,47 +100,47 @@
     "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 64,
     "GROUP_SIZE_M": 1,
-    "num_warps": 8,
+    "num_warps": 4,
     "num_stages": 4
   },
   "1024": {
     "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 64,
-    "GROUP_SIZE_M": 64,
-    "num_warps": 8,
-    "num_stages": 5
+    "GROUP_SIZE_M": 1,
+    "num_warps": 4,
+    "num_stages": 3
   },
   "1536": {
     "BLOCK_SIZE_M": 256,
     "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 16,
     "num_warps": 8,
-    "num_stages": 3
+    "num_stages": 4
   },
   "2048": {
     "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 64,
-    "GROUP_SIZE_M": 64,
-    "num_warps": 8,
-    "num_stages": 5
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
+    "num_stages": 3
   },
   "3072": {
     "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 64,
-    "GROUP_SIZE_M": 64,
-    "num_warps": 8,
-    "num_stages": 5
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
+    "num_stages": 4
   },
   "4096": {
-    "BLOCK_SIZE_M": 256,
+    "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
     "num_stages": 3
   }
 }
\ No newline at end of file
diff --git a/vllm/model_executor/layers/fused_moe/configs/E=16,N=3072,device_name=NVIDIA_H200,dtype=int8_w8a16.json b/vllm/model_executor/layers/fused_moe/configs/E=16,N=3072,device_name=NVIDIA_H200,dtype=int8_w8a16.json
new file mode 100644
index 000000000000..4f500d487c56
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/configs/E=16,N=3072,device_name=NVIDIA_H200,dtype=int8_w8a16.json
@@ -0,0 +1,146 @@
+{
+    "1": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "2": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "4": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "8": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "16": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "24": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "32": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "48": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "64": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "96": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "128": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "256": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "512": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "1024": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "1536": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "2048": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "3072": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "4096": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 5
+    }
+}
\ No newline at end of file
diff --git a/vllm/model_executor/layers/fused_moe/configs/E=16,N=3584,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json b/vllm/model_executor/layers/fused_moe/configs/E=16,N=3584,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
new file mode 100644
index 000000000000..ed8afa6b6db8
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/configs/E=16,N=3584,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
@@ -0,0 +1,146 @@
+{
+    "1": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "2": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "4": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "8": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "16": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "24": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 5
+    },
+    "32": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "48": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "64": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 2
+    },
+    "96": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "128": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "256": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "512": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "1024": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "1536": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "2048": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "3072": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "4096": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    }
+}
\ No newline at end of file
diff --git a/vllm/model_executor/layers/fused_moe/configs/E=16,N=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=float8.json b/vllm/model_executor/layers/fused_moe/configs/E=16,N=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=float8.json
new file mode 100644
index 000000000000..5fea55a8000f
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/configs/E=16,N=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=float8.json
@@ -0,0 +1,146 @@
+{
+    "1": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "2": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "4": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "8": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "16": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "24": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "32": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "48": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "64": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "96": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "128": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "256": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "512": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "1024": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "1536": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "2048": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "3072": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "4096": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 2
+    }
+}
\ No newline at end of file
diff --git a/vllm/model_executor/layers/fused_moe/configs/E=16,N=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json b/vllm/model_executor/layers/fused_moe/configs/E=16,N=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
index bbb2386046b1..1e3f46e0ba84 100644
--- a/vllm/model_executor/layers/fused_moe/configs/E=16,N=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
+++ b/vllm/model_executor/layers/fused_moe/configs/E=16,N=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json
@@ -2,7 +2,7 @@
   "1": {
     "BLOCK_SIZE_M": 16,
     "BLOCK_SIZE_N": 32,
-    "BLOCK_SIZE_K": 256,
+    "BLOCK_SIZE_K": 128,
     "GROUP_SIZE_M": 1,
     "num_warps": 4,
     "num_stages": 4
@@ -20,78 +20,78 @@
     "BLOCK_SIZE_N": 64,
     "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 1,
-    "num_warps": 4,
-    "num_stages": 4
+    "num_warps": 8,
+    "num_stages": 3
   },
   "8": {
     "BLOCK_SIZE_M": 16,
-    "BLOCK_SIZE_N": 32,
+    "BLOCK_SIZE_N": 64,
     "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 1,
+    "GROUP_SIZE_M": 16,
     "num_warps": 4,
-    "num_stages": 3
+    "num_stages": 5
   },
   "16": {
     "BLOCK_SIZE_M": 16,
     "BLOCK_SIZE_N": 64,
     "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 32,
+    "GROUP_SIZE_M": 64,
     "num_warps": 4,
-    "num_stages": 3
+    "num_stages": 5
   },
   "24": {
     "BLOCK_SIZE_M": 16,
-    "BLOCK_SIZE_N": 32,
+    "BLOCK_SIZE_N": 256,
     "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 64,
-    "num_warps": 4,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 8,
     "num_stages": 3
   },
   "32": {
     "BLOCK_SIZE_M": 16,
-    "BLOCK_SIZE_N": 64,
+    "BLOCK_SIZE_N": 256,
     "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 64,
-    "num_warps": 4,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 8,
     "num_stages": 3
   },
   "48": {
     "BLOCK_SIZE_M": 16,
-    "BLOCK_SIZE_N": 64,
+    "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 1,
-    "num_warps": 4,
+    "num_warps": 8,
     "num_stages": 3
   },
   "64": {
     "BLOCK_SIZE_M": 16,
-    "BLOCK_SIZE_N": 64,
+    "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 16,
-    "num_warps": 4,
+    "GROUP_SIZE_M": 1,
+    "num_warps": 8,
     "num_stages": 3
   },
   "96": {
     "BLOCK_SIZE_M": 16,
     "BLOCK_SIZE_N": 64,
     "BLOCK_SIZE_K": 256,
-    "GROUP_SIZE_M": 32,
+    "GROUP_SIZE_M": 64,
     "num_warps": 4,
     "num_stages": 4
   },
   "128": {
     "BLOCK_SIZE_M": 32,
     "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
+    "BLOCK_SIZE_K": 256,
     "GROUP_SIZE_M": 1,
-    "num_warps": 4,
+    "num_warps": 8,
     "num_stages": 3
   },
   "256": {
-    "BLOCK_SIZE_M": 32,
+    "BLOCK_SIZE_M": 64,
     "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 64,
+    "GROUP_SIZE_M": 1,
     "num_warps": 4,
     "num_stages": 3
   },
@@ -100,47 +100,47 @@
     "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 64,
     "GROUP_SIZE_M": 1,
-    "num_warps": 8,
-    "num_stages": 3
+    "num_warps": 4,
+    "num_stages": 4
   },
   "1024": {
     "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 64,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
-    "num_stages": 5
+    "GROUP_SIZE_M": 64,
+    "num_warps": 4,
+    "num_stages": 3
   },
   "1536": {
     "BLOCK_SIZE_M": 256,
     "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
+    "BLOCK_SIZE_K": 64,
     "GROUP_SIZE_M": 1,
     "num_warps": 8,
-    "num_stages": 3
+    "num_stages": 4
   },
   "2048": {
     "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 64,
-    "GROUP_SIZE_M": 64,
-    "num_warps": 8,
-    "num_stages": 3
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
+    "num_stages": 4
   },
   "3072": {
     "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 128,
     "BLOCK_SIZE_K": 64,
-    "GROUP_SIZE_M": 32,
-    "num_warps": 8,
-    "num_stages": 4
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
+    "num_stages": 3
   },
   "4096": {
-    "BLOCK_SIZE_M": 256,
+    "BLOCK_SIZE_M": 128,
     "BLOCK_SIZE_N": 128,
-    "BLOCK_SIZE_K": 128,
-    "GROUP_SIZE_M": 1,
-    "num_warps": 8,
+    "BLOCK_SIZE_K": 64,
+    "GROUP_SIZE_M": 16,
+    "num_warps": 4,
     "num_stages": 3
   }
 }
\ No newline at end of file

From 74f323bce6cc51a6e8e07930cf73a276efb393f8 Mon Sep 17 00:00:00 2001
From: Sergio Paniego Blanco <sergiopaniegoblanco@gmail.com>
Date: Tue, 30 Sep 2025 16:35:06 +0200
Subject: [PATCH 047/193] Add Hugging Face Inference Endpoints guide to
 Deployment docs (#25886)

Signed-off-by: sergiopaniego <sergiopaniegoblanco@gmail.com>
Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Co-authored-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../hf-inference-endpoints-catalog.png        | Bin 0 -> 641771 bytes
 .../hf-inference-endpoints-choose-infra.png   | Bin 0 -> 358264 bytes
 ...nference-endpoints-click-deploy-button.png | Bin 0 -> 833513 bytes
 ...nference-endpoints-configure-container.png | Bin 0 -> 273739 bytes
 ...hf-inference-endpoints-create-endpoint.png | Bin 0 -> 362703 bytes
 ...ference-endpoints-locate-deploy-button.png | Bin 0 -> 799424 bytes
 .../hf-inference-endpoints-new-endpoint.png   | Bin 0 -> 52361 bytes
 ...hf-inference-endpoints-select-hardware.png | Bin 0 -> 367803 bytes
 .../hf-inference-endpoints-select-model.png   | Bin 0 -> 83638 bytes
 .../frameworks/hf_inference_endpoints.md      | 170 ++++++++++++++++++
 10 files changed, 170 insertions(+)
 create mode 100644 docs/assets/deployment/hf-inference-endpoints-catalog.png
 create mode 100644 docs/assets/deployment/hf-inference-endpoints-choose-infra.png
 create mode 100644 docs/assets/deployment/hf-inference-endpoints-click-deploy-button.png
 create mode 100644 docs/assets/deployment/hf-inference-endpoints-configure-container.png
 create mode 100644 docs/assets/deployment/hf-inference-endpoints-create-endpoint.png
 create mode 100644 docs/assets/deployment/hf-inference-endpoints-locate-deploy-button.png
 create mode 100644 docs/assets/deployment/hf-inference-endpoints-new-endpoint.png
 create mode 100644 docs/assets/deployment/hf-inference-endpoints-select-hardware.png
 create mode 100644 docs/assets/deployment/hf-inference-endpoints-select-model.png
 create mode 100644 docs/deployment/frameworks/hf_inference_endpoints.md

diff --git a/docs/assets/deployment/hf-inference-endpoints-catalog.png b/docs/assets/deployment/hf-inference-endpoints-catalog.png
new file mode 100644
index 0000000000000000000000000000000000000000..a26681eec7b33bcdfddb335d31e92910062b82c1
GIT binary patch
literal 641771
zcmbrlcR&+O*Eb9zqH+nMfFex+rAig)AOg~RuL0>b(rZ8j1*It+Y0`V|H3HH@FQJ1#
zXrTuPAtd>t-uF|!_x<C(t~a}zojFr?_RP#VzjOAZhMN4Xn-6Xh5D?r_RFKsoARvVh
z5L~0Yehp6vZZ{t$AoxqgUPeYkQAXyWh8xhv-pQJPK;dJ8K8Z=3JT2JU>gDy@;cp`=
zlOFOD^<B3h{w#4-^M>ME-q$MEIb3oLI-2FK%FC5J{8Vy9%cM}3Q?5fIf`}@Q+R>GB
z`8|QrMbxr4YH?8t=f58`f@noX6TMyPPEvB$R3$iOK~>LuCYWAdr=%_-`5Y|y@Ovf^
z;9-(mb`CQER~Ke^5bj8zd6q;UZ-k@6Rmdr`#gY=d$bO`DZ-ChMHtssX64U2_W5S0@
zkARY#fZ`wUhtprANgkDJuBuSEXs&utwLi1F%Q*P{oPxm0QxcGP<LxWPbwlEJDups(
zV^>%|YH$V5Fuq=HZKZh`eoxwo$a&?fN1mh@hBF-kw$G2TJ4U528&D0JKO*@A8#lqG
z;RNV$E$c9j575dFx)RFN4@x3wHuf}!Bi}sM3p+1kk>J1i+L=JZgp00L|Fumb(=%!7
zn7QlgCdmTdLw&Nvg`$Oi^xi}T|GZ86GVM`+ROJ0?_JP|ZoX+Oh(VMQ4JPfZT!X0Ig
zzcoHey<1IF)de>j{Ol?sbE)0#G)j_(wUtx5BA*vyZ~M_l<|5hBLNDOX51nu#(jOnc
z+;)6H$3F6rl(AazDP;8(*?b>m)qnxl!^Dp)j|e$HrQ$NwbYfOuF?C5gF)t=%NCaJH
zI?C`UtJuUM=IW(1&VtJzQ=wDw{xn5DtNdTROq9geieC5jGbz4I`_y}yiz2KlZfZ<_
zCgj)0Kz<wcfz4MSd<{nI+T~7q{BuKRd+qV~<(5xErjPY=DJ~-zc{`&l0r&N*T;JXb
z(nAPlUo0%m&yeDZUcDn^?0fO#HeuK!8=qI>E8$n`UBBJFB>Qr`Pkw{=ujo%N2-l^e
zUMHmaglgB3J+!n_DT*axkVzxyl;*yyxUUl%>GSzIgY>IQ@|g3=o92HtRdV#=B%~mL
z7Q&xD-hWNm#aX@8mH6Y~>xX>t_f=}UZ@mF5(8jzilPVn+rbW_4uSH1w<jV><eETM0
zRIX9P)P#i=24fi|J`D*wj>CEezTqs~{y?%KsX@=Nrm{dFyi)##o@}2)-z$X6yANos
zXOL5iqwdhxx9f{um6c|<WW!RXjtL0vK3jOD6W@dtmEr(Q$R7{U)6ld@B1?8jEf^)|
z?x3l~Lesm|UT;=Wmr_(#t{L2&{y?w0`h^~8_onw&1-00gI@u&mn{B&^q4g7(nx~qC
z8l$cyDti_+korYTMpXXEFl4~ib%j>u$ExDh=rx03wP6<mwq>c}-uaT`4&=>FCv@ji
z)GdO{H6kJ+DbUZ(XredYi6rkt2mExJIh@MA_PvSu%KOq6-9HCD5M<JM_#n55EX~QB
z%*BVl)B6ww-M-rSf-;<>-~7ReB<a38O)~LDaQC;X@xi+05`|ZdJG?ZA&fbN5qo{ow
zw_^K-(Bz7KhjXKUbBFsViCGBw^>?3dKj?gMLUH%Uohtb>is!2lS07O*aK%REK1vC{
zs`(J{`LO~`^|d0|`bTwrgzMMc?uf*AJQVtZRv<rSJ!a_E@YEp@d|5Vn#6}DI_R~&W
zlxj%UHv7FDU-Ol+7bRm7c0_)6+TNPUwTy1sNnPU=jQp7Ln(RL9+G|aNn~A~wmBa?@
zdeOR;rv?J8!%0=#rT6^9?z&zZ?xbHKBkR8VhEVb@;4M!t=h1^!La8V~&%qk#-1bV8
zxk4qY4~0)?f2c|)*UKAOX_awrlHXigQeF&&$})XXtbOA5-JdTdSv5`BL~TK3L0(*X
z_n{=qS)2k3C|06Bj8bkj?pX10Zd9&B?pm&zmeBT7!zibhUQbBkwEOP3Q8cBsrUpbV
zC<ea7z8K3j&}wDVq<myeX8qWjBrnD7%eX4)#Z<PDHmLAu(rM?l194r3-v__23nf+6
zA(bKRr>|5?>lMmgI)mp#>d+1clXX*jlTABCJ2y|Mc3LLY3zv0*<Z{MJ?Xb0!Mv~6N
zWr<#&ykgGuLb84qc1+xM;F>HPw;SD>^pP$YeY#C|@yzd0TUuav;FqNm#j)D)b%$fY
zdv<#E3}db3vlZQ=U%yf1B^1<|I5tfCmKDsgICJhjbk6dsI`i7oo+GEZ-<8&3ef_@j
zeX;wt_ZLNF=^g1a)aunzhRxEw(j`ruP4yRL7iXJwo8>)QlJ8G^>bKnB*XJkaui#sb
z;d{_U!~CGeNd=QU%m+N_*+IcSo+zE3ZJSQ{SB#94kB^K2%9aa*paepd0^xkg)|K5W
zk<teS=~YXX#Fomv40Qg3w*_kjA_dbN8y72wDwq3a*nTKD)Q)Y%YgX`0%q$Df`=lT7
ztufsF@Ui0Kj8%HSYn&~YDRo%FV6l0+&1uSmuOGg0s5GS1rv~!YJXhxB<e#_of~GkP
zKOf-**e*FN*;>5j>wldgm)`wU`P1Wh{z118nBkz1-n5>go^siPvJ4}*A)=JD3|@LL
zGwO8dWHYBTZ&LMmuG-n%Nod}zT4rxyw|cjDmwPVfZ2#;vdgzRP?fRN{uVRmGOw0ba
z{qL@9ZwlQT5BfYJ-*CA(c?9q+y$%>SpIRG<#_g_e#KUX5w$HBa-LSa(>B%$o^NHDE
z!xa-)K==ENJG<4RdHt}wlD3jQ&j|P}p%3#c4S6nQE}07w3)cIm`w|S)4E7AE;^j4-
zGh@53UH6QuBLpMwGoEG~v@WzAw~_f_e(tTLueHsiw`JiUvp<SGkv!o;{6sq;wvVk*
z`KZ8yd6?}^FS6v!e+9VDbF#dR3$+~V-`M@xdi~AK&%|_OK3%7)!<!k`e_WBdqD(X&
zQX6vT9Y@GMaVoLxH7GIiedBw`EfET(>$k{F>HX4ef80HE@C8{gSRlI8!b-w=-|K&n
z3a^a#EcZ<PCF^@tBe89@T<ctxYQCGYN7>V_7NhE;GiWf{fAKvL&F9!~-3^`bt+HLa
z?>e#O)!P<L9uA-h66<&({bls4g1U-oscJwRWpeG4BFE$NegrE(;kg1et5Du&tvlLY
z`6uc(zE%e+c^4ZyDDKo1O>5h#OGpiw8|~NTOl(h}Cdl(B#$(653P9`fM<poCcI%1i
zHt0&ZdB{rBD4<bohWVJHj6$OSu-_o==-C9TyR(gYB0$equOgYVoDvKn8(R8`dBVzJ
zt3Uk0MQguZ+|A5riQ;2Di@clPhoi_@0nyyE@jLcVm5LO&?OA`PwHPcsptzMCKoYps
z!0tr3%(j2;oLYyfH9bKXKI&998$0XlzPrJdipb?{JPd0(H|bcI_RU97kF-c-3Ixqx
zv68-cH~oHtG~%8Y&rL&}n&f6-+oK9OH95ymSfkk5+@_gAAI+mK;LG+R&M~$x2_}G@
zHV=5idBZAjKB<XozH!&RsPZI<zo7cKI%be~FbL(+=}onKtF+HxtbH5=OVs_L8><V|
zLzk5s=G5iC8S1Kwn|@wuS;lFKgkEgJN0M3+fr~E|zs-#5QfQ9Vj=f$hj$-7j;i%9f
z*4dl4YP6rt7fOAfD%NlgELwJ`t#g8-54x9^XQ->ovgV4L1H@eYJI;E=?s%tRf-y3C
zY9Z;?Vp4mtyF0}n%S24!n#L{jZ;%6`wQ8Es8dlGdytZKf)E)YrhCR!D&Ux}P&NC^o
z&t5BY9fu)hVKZSnLA95z6Ba!`$FJpDsL22<^(^(Z-L!kZR5F(hEe(YQxn0`pN7yS*
zX)fk)#%RV+G13Z~`LyCfPh=1JA#vo!1r1A*f~d)a3BH2)k<d&Lr2FAW!LZvfgVd&b
zIjj|mVg^?R*|)9)W@QbP?HyLQfEir8fxyNs*Q)K<&Ag51kMzBw7*TaIveruk)lvef
zK68baiE^XYn%~Z8Ic+DcI&fntz_(;&I&3~-|Mq_T(p0N);K-rbDX<>A2X{LV^^-ab
zoDXRvX<)p`AQ{9GbW+uF&bQ}^x*Nw@r=Ff!e{vOR;`bb8h;-jZkheVsJ7U_m-w#DF
z;tp{+Wk5FoQh9bTSSkrT9#jYCfr5?DIp~A7VSmg|)oo);gW$o;!En2}A8x&?G$uEO
zD$_|yFo+BnVEYhg{$e2Mh(wB*_nY{f6~W;qH-TM00q;uF7g0G+Njk3Z9Tl<g??Ii#
z0_*0kB;ObUCwfmhD^lSEyUT=csU`~wuH057dbo7=8#gzz=Q)><&%O>dlQ?aF)Ty?g
zndrHYoaYnFz`>Y=Msf4IF$|c1#w3JhHNGE#S1&$U8z|bSsuFPE!`BI}5<Vax#)k;;
zmn0$We}!KWvJnvdre7f-2(u@+`ma1{`1`NlXZ-c6%%3|^><0o8eC!VX^7(e<-?>R4
z--!MlzD9{pBaqgXQB=g=wJqJOtzF#hfF2OB;#NH2#v27gcLD<H$G<K@MJ<*?eEl=_
zItCsFsw$$EKxb|XE8uHuZXf42zv>|n_YuVhovl4A9{M;txwwn^NHG1*A&L+GBJ(gk
z{GG+aQG&@pRpX%y(9Qbcb8cR4UM9(#4<9}hceAn))slVnuj2Ta1e2YI#~V=|9&c}N
zZf^l@pqniZpNNPE4=+CtKmSvFj;HRvE*=&>PhH%Z|5WntdStELE#2(jc-RA79{#G=
z;x*9ILxPFvS402x`_oTrAN&7q$;JI&kA;6go?j_EeB8V||5Z1>sQ53csD{0dwUeQ&
zy)%By@NG!)2?{<J|6Sn!Nc!(4|3^`S|1K)P%g_5ii~f(K|9??kcWXBppfkQv56S<2
zVgD-pKNJ5|P@L!2v;U8=_%qPIsrZqWyeZD}UvEwF=GXoZ6a0&$vzJxZ!Qb(0_UlLV
zODAUgbH|6ThO#RUhsY2RydY4NmDceg+)XD*rtGGE#Urvw$5Ir2U;2e?|1}+*tB}IC
zY|?y$PmbSZGkv-f5GyOk_l>Dv;gu|J&fCIu$h*del}>)T62=mX5(0yjklo?cBBZps
zx4!;4db()U7w%R5EFm=X3ftRXr-)84y%^HyX@yCV3E3Xu&?`d97ysxCPrTCfCOIat
zHa_Ba)t{+uuJC43acGm={6_Fk&UF>yH_0O@2T^)Czsu)xzU>mv|J~_7UH^Okx0ML#
zHe}elJbyo5FkKb_8A4=La7^JJK5rj2v0Gk#em-m<L3w<9Jd|0~oFtM+n1ICX0ZC+6
zK;9?ol-}eK!;#925TZ8(WZwz#Nh<_&Z~s>09!WTF=2J9fAtkW}0kOtIt(*75Py-1A
za>WV*(*Ni+;a{$>9Oc7KaWOU%F*Y|NEBiTR*#M^1yA;d9kh>NP4Bv@-zBm8V{tB<a
z2q-qxzoe6U5dG>gwglf{UnU4n|LNPnKd<p`Gs6oz;?nB~rY4=}XY$;`V?_Rk<kx$M
z)`E|253X5kmbd94JVJdp1bm1qR&==#H_<;NtJHG{5LDuCNo<}~2EHdbB)~sZ4go%X
z_&xI4^q;toIVC<$z>qxl{o+@;4*_}PmESo99vCqGj;{o3J`7-(q1dQHZS|_G(n(a3
z2s{XwAocqerb!^#L(SMmvEeIKbsFfy*h;>kF5q98@w>`@+Su=In7<-||LP2X7m<3X
zuW2aX<7mmamn0tMCf|vLZx7O4XRyd{9c;8-=s9le#y{z9obSzlz+4YYgkOZBPE>`i
ziP?~oZA$)?6{b$OOXxp35vw>O<1|Y|v0(`Z@k;tI9*#q(v9Q*r&U5nsUP*|ZdBDF1
z=YREgg;1RL=I<1I77zhBKK_>E6(RmfR)T46mHvqzerNlg!khEx@>JR{)E5_W`SK4N
z2dCwJA2vPGbLZ6MN{#!fYOIOp_kVO&zaWJ1W+o;oI}0i(Yx}E}GH#RnVw=kP3|`3<
zqJYRfREKPGg-%r(@PQ@v_3wj!=H0*8;`>E74jh65hn*6@38#rlNesv<8O$ZV`@Q{7
z2{_a#eh$=_>tE6R!|Sr@giH{5bz`M}vbF|mYX<+weTLeOv8;BP;G3<)Bs<NgGx?L}
zDs*P)j3E`WsMtR9BvJBwH6BQSFza%ze=*WMR!)C_f^`ZYBHHgo^ix=v392`YEot_O
z_?eSOhMh!Nf5jXUO7?7B-o9_a;BVc^AH;`03~6&xz=q(;KuZjD4qS--d&uccIMp;~
zslGu)q5Vw;e#S~O%eEfBrxKly;4;&_r7?z#HIg<U$VGAx<NtM#J`2KwW#qMB5ef2E
z+vH)^-4*h>dASOlqvs3n#%lvDnzAh(v751YLoSiG@k4Z>s?G3wr+AUbf#*)Hgw%n5
z!U7NF*(+V#V*?rwzd;QBgyrkR3WVyNCpyQotoe$xB>?r_j~6W@CE}xIvpY50?#qX>
zp1dI6m7XO?drMl?-<{raW)x?SU%#ugd)N_F2&%uiX8(JgrzUysqMlfUz<%M;qto2X
z-PKwd=y{)q5bVyiNw_S&F}oI~5Q^IMLr?zMFmF>3hx0O0(6C?qCycK~L;Pe|<uiND
zU9}W!+D-axKU3GH2Gb*_?VEUJv@dw+wfFhk((Y`^yZtS-Q0x{c>+N+!Bu|h2NzXmR
zy|sv=?(=s<e{-L5yF(JV9H5dB1P2<{92wLL+i2VO+?*^+0Wh@G)TZf5R17401`H*{
ze*J2rThQaqeabxK|7_^UOlWff*~Xm{h76b7%5i#VZbBp0Az4YjyO!G<_K_D*_0kY2
z-gEvsfUjN6FMuzoN^)bFM0(m4!t>|YSax4x4tPtB=V6~F^WmRFzrr1d-~B^>k-n4g
z+=GbxNxskE6Z4yNz5;tE680y#i|Bwt@_QKWKBFXhqw<I9QiY%DCr{#QOWH=|_FBS&
z=jjX<lGD~%pnnM%w@nDwcmYMPXIE$%KmAK=`g^j+8zs)ejRF$b6b&wI93(y^3azoc
z(FEUlZ8%=`{W_x9NdJfL@R-c(TY3v>|L+WyBt0RsA0IG_^O7N`61v0@_gZb*m14pf
znAhTv9q3A?Ny`|BdMTr!RL{)C7t}}mp@?Y-My34gm__Ej^tn#{^O1OH*r7&Ha60Pk
z|2jVZ_focge)@fV_69#H?yBHdMG@8Dawt`j|2$R9g&)fkW(bd2s{!>>BbJN%Y7R@S
zO@A?n3#XN?|B*a|yD9PglTDWDHsf0SC&EbZ8rusi)Y|oUA{Se^T$Bkrdy#$n)7MHA
zoX>z~^u~2Ak0TOt0&KJq)K7EYyJaxurf*I~XYTHkpO$!k_y0~-lfoI<r5!}KKSu>r
zrKRGGw{GQIO7>3n{z>o;rtJ5iP@>F0cY_bAOF&f2k^ZorxjA&)?KJOwP7hG5v-PJX
zTT`|#Kt7g{-(yQrWKe9r?aj}ZW15@k>|ghwryA|RKv#$T%P2fYZ!T-xK!2B1>yeDU
zXTgB(Y**`PuVmaMLEjMcufe|m&4pnaH@}md6EMDvBAfohmgjg06;D`^DIDv#_{GM*
zQrYnYqJZmyq6SjG2`e&e#CU=*73vVZ!Lm))AQnICE<wV<>#0F3QsO76Kgir&k&G7_
zS=C+iH`UH$<-Y=WgMwq;ykd{u%K8{XZ%#7P!7fA=&Ra3_!8Fs&YbfBosX)15LkHo%
z*RB6_5qS8Fr1{n|v*U9HZ5oAwPggu0H<A=FgYw;s-1E#3a@{Ym(@ceeju4UvtYz#`
z-1E&PW+dngHr1V$Lw;cwwD5b3swX7Fd1Elv1(*)0U2-&Oo#^3#<&A`pqpov{%g_h(
zk&M5F1U~|K1ixnVqsc9E%x}V5@+`{VD*!%I>8~8WQsb}un(Sd3IU%Qi2=(W@t~T#f
zQqpfXYcBLx-SlWHZ(Nu!Z(PJG9O=s?t7}?sXE}X>G_S38E9dH#BzhGvVVEC37Bs#{
zF!j>{p3U$z=lFXa-fcn5FP1MJO`m91y`=Fx0c^HeEe1sI&(N<$9bNm|Vtw$;>i5;|
z2(BQGWzAe)#KtuK8gi@6oa)(Abn9JNEGEy@)(vh5)BF5Y_qcdpF1n;iOG|sAbQK~j
z*lpY4YhvP&J?Kbex77Nc%b@WE?xa6~7*oYDKzN#$mp{<?p458itKjkcTwQE@GFt+t
z{ujiEl=_?rsE(4;NN0R>&{kMv1!My~kE(5}K!ehM^!CoL)%iv3xXsxY%x-=u=Xn65
zmkcmyH*7Z<7CQ)F2S|gcucG^7k+w__{ZfPH$~z%3+aIDpmcW5)_wfRS9i%`>x98p(
zY5U;;A66nCmsK!cbbKJOLAu0x2J!h|dx`!SB$cne3ppqS#^2&)xKCahlW;3Hm2mBm
z>Gc!yK#k|$eayvqrPyc{got`%ns0A)Tz+$UdxWRr(>}XgiwyI4)H!O|zuL`j)u+Ly
zc5KvTZhyGaF>MWk*k6!kG^)27xUv{DG<tnvdt<%!l7D@PpTd;f$}tor?t2^>AUHH|
zmXyCUax^{xzezHb?cK>`P^qyfka3OfH0bMmjcvn%ySh+{5YR<q(Pkv$Db&RMX|sjU
zz_n6be2TR^4|zrq)^~fNKs|9Ps2T%0XhW`_%>(uKPV-nZ1C&0HGv=#R>-FMZgJhF!
z1JOKl5^&mGh8Ekv_kVXw{fmT}$BaoPj7&57I3kMFct(EjnUvkAd4km0sY!!~VKW(X
zbHEIb5Q%LXe`V`rQHIoOuM}sBjWDuX^rn&~wy3-#^}#!*tOlQ8*AX?gLt4>r|6LpX
z5<S)O##JT8hDlw=2SN)USA4&|n|&NbJ6Nn+vfJDy<yGR9z-j!vckljyy;vI4;*udl
z>Tx?%WAk(eniMgasnEbG0E6|%%}=QeTC@X~3!_L%%ylhUdQvYm!Y0f7>q`OPrKvCp
zf27hZzxC^v%L->g0tZ50Pw!etE`DaV8ev5TZjNN~j6~kIh<YzgM50t<Gn69<mYZl-
z(<9G_d5T^K9ZIgee{ZXN?YD0C-DmWs?CP@2;nj@qcYUs?udpLNUW|lmp5qWdIRoBT
z98$G+>TleWdns{yoP6sG_f@|`oGlwIo{1P%a;k$p1kA;ANrM?6<i9u+w|BI1+B=1<
z2?_g4FFU+eqoW}GEQ@)R$Ea3;x@hgS=d*sdulmu5D(u0SZT^0eh%$Mqjl1}Js>XVI
z3!2fU+QC5e9!UubJbYlQOR<yR9Jq>HTV0)WNz9TSj127xNZ`<2Z$%8peWK!2YV$kA
zuOxZ{S#>U>7yJ`}-qNhoIQ$;kH=d`w$23>x$jTUao&{n!U;8mYetOyJi&$@lmy@=p
z2j;cArIGEcFs59{=%w92yC%t@jcV=otJxbQvqmyNXNKF*1HJ@l+`V)ScE=NmK)mqi
z3@Drvl+x1H&W&`7R98@VV{P2#SGPJWvSV~|ve@Vv$7NVOQ{G_F^?_m9dI()Zd;5_2
z;<SYs;!k@UbHRKRDC9KrkXFbgzRb8m33Uw1lMcBy%~!I?TH%*c6m)rhG~VJ3EGa}T
z2LVJqwr(4gf*#wpGPX1kO4$Xm>`J}RLtnYb2A*t;Kn{nVtHMdnK7w9n?(_W=x5Vp;
z_Zf#Neqx7y>x~PRoxVN4Lut&NnAD>Ve7LbU6cPD5BrG3_7Fr9zhu_59*rfRrioT8n
z_K@JiKN;>03*bY{UcK@qdS$vgD7nOr=la7(b4R9(81`C>gOpi%Bu_=4OUFB6tb7?D
zD-&rAX-1Qf7Yyi<@1NB2h!)6^ZYHko#Ha-^Dt%#=7pM;2s(lojm&pA^{^rKSfsz#z
zYXw8x?;p?6pWdv{Nqqetv`1#9e129yx1noi6(>a+<LlOvqbMde4p#GNk;*XBpFz#I
z1_{}Z%Vq=x=9-MJ-(dvTRDy?jbbZoOL1YL<6viuivb-GWksy?>=DB^+Ny^h_>b?9_
ztp4Eh56h3^E7{jHf%0B6soFU0s=zi<NYjn3(^vuFD!L6uZ8F4Hm}Yg$o55QTEZWtV
zoq+m{dqJ!HtXAuYk$DHl-cu^h_9#Czt9k|ta?v}}^dOnfGFQI>onr=UY_^hXH*Hxh
z!|Io6Jnub4=fp_HkLAb@LIFX}U>QV?*WO&>n(s(P8;ib+;0xwwYH@L~Q&;xG*Zb4u
zZ{E{H*o6)V!Xg=khSzwP`Fh)uN-K?X?#Wvp&5GkRz<wkY8w4;5Xe4LP-_eU6UeMW1
zRVVCm0p-FOp9yOR-go6VuiJZ8apfgXaz)yP<!I*GnjCJRuK}yq`ARBkOIOe6Ih&R4
z$&!B9dY*T6{*v9P)3CB`uG5XoWv`^h#cHpKDmz`OF*o$0u9AzB9t+dieWuRVDvyc%
zz6^P>=2m;p!nM&XSAO#sLA`r@XCpWp6{`K?7)Fbwbes?Dy+7En#)i8<WiPVHYtLw^
zZ)?)lPaQP|g|^)2ssQzX-^nM(1p0$AeDj^#FFIp*GbQ!}%5GVYgpo5+W2nL&D<=+!
zY)&Se?aeDUxxpqa$D9u;ExN4wK0oq81dt)xb`f?^Mp77lrpfCcD4YuM@o73cZ9UeO
zNKK~W8OF|5S<0vITD*&A(|l<vhQhWT_2_KR)s^UCJ3_*8-&ibn4(tEyPm&63g<34p
zSYX!&$$Q9+ORsOqpyu4?SeEXcy_HBFyL|)uT7Bm3nH8mZVDN8nYvZ2JAAsd=KrtPq
z<Y|G8lC~)6ZNtko>!a1~9V2eoUsAHQ%f)ITwc2fUIo+bVL8#*}?TmvPK`28Ic5BPW
z@W?US-bW`!7$UE`R7na9aFO;s`pF-CnbH7u`pCOnTsJpWZTBUI2%Gs|d+*0rNytPf
zenp|d91pg;0#63BbD&KkC3vZ#SV!}0ch*wb6-Pwg$H@bJ?bFK_u>{^5q3O72rPvru
z;^FBEBX3ytEMz?0nM%62H#L&zx-#{sKt36H##%Dmg52Vcd!kkg;G@_`p!5ULbsSM`
zACFIlna(ZFsBJ(poWTunV54;NqI=9_p`o_d!QA8J07TRl&s!E276adQvv!jQfCXVD
zjGyZy+cvZ!Q+Gc&2>a!=T!dV%NzPq795#=I_^<Z)f3jA4ojJpLR^;@s2P#k-<2oR0
zoz_YCA4ty+(ZVZ{*BLpg15DDS99kWUI1NYs(u+o9;JCNBygNGIkGC2k!Y`<N;bLD9
zKh~ew&sw&WFpi0LSV(@|$uO8D1(Y!nA9IGih-u5%@-1JFkFPB~<AkKLs`o9ORk#bU
zOSoIwUrtoZVnk+7AOa(OmN8NpumzVQuN^Ma=1G@!ujI_5pJA*E(d)S^vkgJuczw-M
zci1p!VN*GY!&(fmGvKMSLr6rzfE2N0RP2p5JjDwIddKTSv}f)cz6X5LA`T3?nu(t1
z$NJ@e4NhPty|hi_49*hcQV>D9&kmV))M=)YAmYHDbg$<Lwa?f!tJiNNAsTkHU8V|R
zi`Da6Aq=UUsYV-BMdS&p*7dEC857O+m|A+PcphfcHRN7gw%jL$;CIB%i>)R;SkxwL
zOcJz<rb*azlD}MP(`r_s>Cfp2Mff$2zym%GOrN6JOPsVDIBQ^58%=ko8usd-1GbqU
z8-%PF1gZ07uxk(Kp!8`sDyCtnpuYD_W<*{<i`PNT1t9BX3f&mCUpv1Kgj{k2*WlXD
zzAns{8NW?;UaVK$-<?!+X~B4H2QGsMkph;0i?&-2o+)Gm&IyGv2)}vpiJFsIbFn9i
zk%zok)n2p>heeOK%Y=m|X3hp8OdywNVt)-wBL5!@mi7$Y3{~>G6x?0^340KbeGg9S
z4i+C6Q7(`k*alS|6CbyO<?!qR*DEU(zo^(4N;Uo^>Crm?j4RE9pJ_we)&Nok%oA|i
zjS}%C^sHyQgKD<;<?Gf(tR3#Vh2-4LFaTCLCNUubPJO-7y<(B^VBwy{Qn8SZ-b7*F
z!iXJIsc{SjUYJnV+h??W;HA}j0LGbdw^n9wF!N(bxq6?C0NSy&@1YiEVnSkHTD%V!
zd{+oFyRx{md=WO|B~VOkS{jRXd=0FmqMZYLc^tuR^7Xkh2f5T`rQN2#t%z~GQ{vGY
zAmRMH?f3#-F^@Wp!RtMP3HoN%rX|KmCmL~|@QXcQ0k`eua5}&5F^lh7l#o@|hg*7P
z82vJ%y7lsw{aF9~?I(C8hRjDT39%AF-oL-tQf51l_>_6ACrZB^R-|V*XE+gGkduWw
z>>}4HiUp@lPEw{w1+_=gi>W1Y89Iqwz@H1*yA_@6W8Rv0>e9k&D~?Lyz>CU>T)Li7
zy3hcm-`TE3hood+CI>LGH9t*TH5X*+o%8D6U^vBy!eaAg;{e|X9Pc$1Mvmjm3^@L%
zk}j&NS8ih8pbQ`TCe7T0+K6^ri`v_}oX(jB*vA%UD~)90bi*YDH9<RN7aj>a+WX%|
z#Fk6!W7wtE^+{E(g-Pzasa(qpG;+jbsGubGjEv55mb)D*Fg)R2%<*2fCARNW-(!!#
z=zV`0kz-%fY6Oqd;tsTer_30@tuBcQoh;Js<u;bequ)TEY^R#NtpMG9(whIw<Xbsv
z7!YtIH;9$I*pf*Rbgbt<yO;ds%o;@tV0vm?|5={FSLYZuSd!7-2m<5U%{)*7HjvNG
z1DdnBc-d5$6;`{@<bJP6OK!ffhAxg%RYI(z+Rz=Wne&QpFDAadIZecUV;~SViTfEQ
z;3VPcI4p$=7;`?WlgV|M;^0@3qZHa3mmf;{!VLJVE|t#eI9)mxW4Jx8%#-lp7A=QZ
zyCL`V7-Vmq5isnwJ8v<U<O{^+u>V{iSgxCIxLsUGw_#ZY!eaCLf9-=-{de-$sAcLF
zo93NQcxNF^$gP%&re;sL9twk8&QnRLcHl~X{GRk4A9+a*T129}u5HI-<?Sb4KxyFx
ztkyAZc_16Br2W@SffG!qKV2*)4dg{%!r%@y#-1Ooab;|y=PcSo+>*(413%4GR#|ib
zs;vj9`%9j`o+{MTF4nI|%m5^Pi?ffxx7*?fRWroP)|6}-FNQ@nO{VI{cRuXLC@yV6
zM3A7H_a$28Pox>k-a@${B4@!MbH+&WKR6=^9>8cd;oba&Opu(L`>aTG{vxe}B#~~=
z{Xu#DB5#%d19Kd@b)<FuN&Xp(yw14NRn#5U*eJ{wec<KcI})_)eX-4L@QtaP6Q{if
zo+#FJgxv-!m^wb1vtM##jJU`1MX$`rC<!$3Tp!%FHjq{zl|hVLPV-j4BEQ^xlP1Tm
zMTSTi+(;mG*i8DAhv-jS>|IAM--W$+=`hpAX37*(+gkXUvM<Rv5W}e%h!Wu2wN0nl
zY}Jt)NE~f1VlrLz8k|$@O=}3j4wso!a*Ke!O%}!j0u8)%egVPpv`&cy413Cbrcg@l
z(+4dA@)MNq`x4Cuw!Wb#z3mot6@j!~wJFJ@o%gAtJj58xNpq)kg%}U@Kn}f?Ty!pr
z7!S#1yPlkFhM=R~+eounCSL}%P}I<XZ>8SQS1*73a>5R5N9DsBOS}(4mGH{sqZp~P
z<i*SiFxKd+;6&x1uzj!V9^Jw2X4-7c1pT3mR0)0DCM1PfH9n{80d4uFqfW)XoA`9}
z7xj`tY>1AIKXClZ27=vI(G(X9#_0|Br<b|4q0%<zECBL0+@GbuB}?7~>J1+JzG1g$
z^9h!eT$*6i`u-4*`{hnaMeh6Y*?DsJb|sO%W!GN%`W&$Du)ouMeOaVF?StaNsH?9=
zFvaSoox5>fTO$P*Ry(&g?-yN19I)+q$U4TY#(Vko&K%XEwd|ov_O=&r@ty0JT~pUS
zKDxNe{YY!7SeIx?wemV*vBf({G49E1o?W_a(XGFRufxxVP8gE_flXV13GAk#cIa^}
zZR;O3BiHJbfrb-HfyOQ^r_<kHCx^AFz-tCg4he9HS4zvanf_`QQm63^zS1Lgh|8~a
zj(c7K<=JD)Uh~e}tY~xcB@l8kdpT%|L-*a85M7JMob)rqW-h+FU}VNZIa3c@M}0ON
z%O8qRCS}c@DA+NL)&)=+v<LWpM^7FAAv0B4c)=BoF<oe^a++<Ot>f!P?YAMm1HqUl
zJgtZC>Uh0en8rr7qNomv+wF$^m)(UaHU#fIDXtRNa*pInEl@FjP*{CB3@xc>>ZzYM
zZ;qrFQZr+a5MA-rjuvrfchbY0)yKIbMjl3Y?2@9tb61ign;9fViMTuE{sZ9)zq=9&
z-=?LzpSaJPsd@E0l4+Dj6I(Essa0SFo1ockdmsfc4f86Fd4DA3F&>C|-A%D}hw^l-
zUlan+DR}$WmeDJYgj3M1@3SjX^(_5smTT7X0d}~JR309VHqrR_cf=>O1Hux|94Z3P
z^J9MrSg-RgXG=fwt=Bh%qaMYb^{d10!1Ck=l%ocGbqVZ(s(NF`bCIO}uuUoc&DsN=
z?H_@rV~wBx+M`~;2_$1aR6`$9Y^cgWn7>Gj#Pv4Fbj0t7<AuB#-v=kij`j58fy@Gu
zwgMhAlj7<ViJYouJlcx`H9pJKG^d+44Udp#pGWNEMfWr|Q^!^6w@v^_4B`(OKk^=w
z0OUVZ7}n(5M|w^UM?T?ihJV<!n#do*Lx1hqbGnTf@Qsd5wx&Vu?NexhLW9fVE@BNc
z`Xy>acuhsV{u$NdnLS>qz)K&h$KWL9n1h1oXt3QFlV_|l7R4$pcMZq_hgOjH-P`R1
zAx|~N&M*{Xo*CN{%dR4ju#!|SF6>@|Ajdm5^H8L^WD5J<JiPDdXC5F3qbp}o?r1%1
zl6i8Ek}kKZfKD4cFBvjFDgUHKv>6d58WZW&Y!n0{y7pHk)4AA#yVE1)6dQOg`)-%t
zQi`IyDU@P==;im>c5c(=!XY-GaE<LbS_D?Q)KC!}a1bc9*n-p;zQoqshoN*!+Ld_*
z3*>W8K>JO$u%f$fk^v=j8=n5S^EGnL3!e}49t&y0uGt=Yelg9fL7DCIRi67Xya%bZ
zmQ8K+qP0mW0=7o{J3K7nC!<}gr3caU^RWC>msl!Jy>m19aPa9pqLXO#<?P2v@f^DR
z->a6;c1oX?+LE7mFE1MAtNIW6&wG{&sgxPk=z-{SvzzxB$+MUtXa*_2lknFk>BmRC
zYOk6;)vI0m>wa=O?X)xSf|LbwA@L+f9&9D$AwG=0u&!<yjIj1Us!Ki--HSlJmoO&}
zT;j)Ls*!lJk>TQZqQ9>K2A@g~!-9`GPUVxJz^P?M`p->xFnqe?3=Ihl0!S4ykJ1+S
zt*OT^UT&S8nBi@G=bB?>(ef)5ajwbW9937}m5n=OF~#4nJuV18p`l+G!(`1X^*ifR
z)-fJ~CD5_(UJckfcKbLIQz77%3|y@IEWS9g>EGbsoIP1$`r`Q71<Kg7Sh#3>2kY#%
zUg)Abo!cyk=+DJc(Ixm&-8c}}cXLzvda9>_Wn)Ba+$eutQ;o?hx^Qo;WeIHLiVAvS
zSAXp>XMbx?!?iZ=y-!H1sbG5P169!4t!)o^)@7e)H=JOSQLU4O9M$tEduVw&Bsq(2
z<1`@643{{>(HT(o^@;MRB^!zK-ZybPzFZ<sPlfqF>r$CPzTs3cI9l}b{iowKbt$7$
z+y&gB>97;;jy(+a(AlXOE@sA~XP<@QZH6cFRcTWMyvr8@7h@g>E|4LHFNc?7#E-)x
z=}_;cmWDYvj%)2F(i-H%s^OA$wwq1voBcae;KqF(<9Zd5S-@+!5XRIy-b3HUGdo?}
zQ%OOgGI|&+iMu4V2l+bcO9cXOEos`&&C7jANf5L|e|awL8@+y1dxdK9L!=$++6i*D
z3E_J2O#O5_=^?0D_LN=4-)YQbcCtFp3vq%@7PnUF+a#rCV|%QWc)d{yL!Y;p?!XnQ
zK;wXXKduHU?>;eROtL+EPlTBY4Iv?Cmp{{$cJx=1%h*TQG3xs+vF#6&c+Ni%bYKCq
zJsoO!v-C@s9N+)oRet<LHH}5W&%@iMCeSgpM7tmw_L;7<6fc)4X=7m5deLJr;hbgo
z*3S~X;`Y4xU`hOLbhOqpc=)qxeQPX7dT%DuaWO?;SX?`it-#(C_ZEwR8B(b(r<AuI
zE7g50$fFZJYzRQX^pDqKqzoDalO)g0Kdg^0>$;vy%w`%iwfiF_ONOWhl3cgxIrrS_
zyZXC%+RwF&>hxL!)istaKlZLKxQ|pZl|Xf!cE)lFUY`+b)!JzqW;0DoU5?6}aZYP)
zRWx4SR8I0P0GD{Zf1<oFn&qYAg-IYAB0`vnZ68(4O_a?`@O$p)L?q!~Y2mZ>+^RIa
z(`TrC^uapKY4`P-qV0ax%y>M`IzIw;s|DeE2rRjE(1vUGuv_l%1OqcA2WCOFi?4=o
zcmZty4?(WqJ?#$1-{+9;hDMqh(?u68U?S?yAI3Iqr$m(RU`5zK7vfBK!KT?$9e6Q5
zcIjS3PqcL8a51Q<==ttUJ}@t(+TG&?$?jX%zvowGI27C+L9Oh#2h1H0phC6z)@(>)
z?yr96QAAJ=g)GI;Qrn`)xB267Z$>w}%2+wk%jL`5v;HsYgd((T=r=~Ba^AL{>G+b8
zHy8Z^Sj95wW9w4yz_Oc(6PN?|=4m9@MO5d`W*_0`CZ*Lt+i6B9>tljU_eL+c?_O7s
z)y~4zQx$HS((F=ztE&a)+L)z1ze^7x9GQI()3*c`n0{gs<_qAI^+0jzG1f6bg~VIF
z)oQ7oK4}B5d~Oxq1G+yrwQP#@wb~%%D1<9sh~NdP0SmLXug^}wCN#Ij?;z_YY)bT=
zhJ3nP-gQ~~RDW=zD<UNE=uB>J{gazu$P)g8mRC&}bc*!Bsphc%oQTjIMhMnmH}*1-
zqu^B>SC}sh;<yh-QgC&)4g>HNjcI14KC@>+A?|&~o9PBTp{BN<s-uSz5GU`55mP|0
zd{SUgo^pbl2$YP5U-lXqogK`*eR(j!9fmi=?ef<#ALB(ec07Wh0}Y@?4hapyst37i
z5L=8vSX9zvsi6$!cnTiHTj63*q?%gt)OKLHj3>#m_fEnDFgu>ZRLPmiz(#Ia2z62=
zAH%@!Fd3os&74p<^T&@IH>jz1$*pUQGqa-J`%H09)T{U5XR4W!i&Pd%R+FbYeG8ju
z?&Z08dByGITEkt;5NG(-gw^MZJw`*Q*}R@4dRJRtlD^6W=q8LgG1~FtR@A}xn8`6L
z*E^@Sp3PlFqw<uK3MK2_NR*@-%SZW1-=v--P>hp>UHai$E<U!ILE#(biepu;+J_&f
zAM|eFMc97ll&<{UcP}qT4^9rif?OcXGnhZ~x76M`BCPv}L`7{$N$uUd#kT~#js+4a
zZmEKf92cA<!yd2%eM0~tn_+dlF3zS-1P^9sD6Ng8&HlJ&VI~3*yI5{RgSZPkFmLw<
zjUD2;>!2o%^5YERKA+v#^wnCU*CWo$(-EMvqV!Yc9aW-?6TEqDu&iMxN=V7unpJe5
z4yslgcZ^?ei^T&mepjRLk`Ry4#g4+F+$T!cQ*%f%-!{PQO-#^G5?)R1BbPd-TRoMb
z7xRioF8MFl^DHhS6GCdd;seop-nq38lGHG&L2dFAQU{*y40~woFBX)<U_@ia%B2>L
z>)P>*GBs{&51%g6YI3784$4VF-Y*SkyX!HS_;ldWC0T!2`@(9PR2s$7fktY_k_JHI
z&60QYAQ1`nOLq6C=6(1@gY!H$u<bOzI*%mR=i}>gwAAHcTlHfJ#`B(KEEwmt=sjJr
zR|E<pJHuoKnLRy)1MDP9a7NWuMbDaQKY{?@h9Yf1lK*~F?=T`}Zb7Fue2H(H7HHby
zRVCzHW?azj;<iC^hVY}P*fRm9jUix+L6<4)Aj`2p6<k}d`I$7D2(>vil$HZHf#TG#
z_ZNpKFk_79L&QKNsk_y0<Iew^f?J(Qp2Y+X6O&9IK{HJ{0{U05A4R`csgY81#oG*}
z&SFK>!11N)G9?*eEPRS+a%<Ir(yq%=&4j!F_DnDT_`B$*81LrnDt-1O{e1EYHWb3%
z{|;&cnseM2;lHOQ5vXt9RP}y@^)Lr-RzLvv8xFP^fwzj-Z1o0hO<QcwT~N+4KAK4N
z9~Ob|eXDJ8r-sXtG>od>8Mb<Sl__)LawEN84-9FuV<crOqi#2n(_KR_A{e^ra9nui
zSx8x>D%7qU$@BY}zcfg=Spjt55Q`3Ed?V5D>0t}JIE<)Vj7R4ppf=YI2vFadEQ)g*
z^=F<DKHGWl1p#@LjK|6bpR!K#TPJ82uC?I>V9x>9z>LKbyg7CtUp1BJA}1Y?t~phQ
z=ecWoEH#5@Ws$Z_Pd(=rF3eg^iU91Qet>=Xi#ilHDnmZd=(@JsYB>emd**a3!pxqk
zBDCa_qY{KPt(%t<iSio|pomgkx;F60y~r&ek_5QrA|KS?GS4CCILSN96}H{xzxFr=
zdo6U}9)8JNqC7eg7-`&*$WDtY(J9{@mz8Ikrbto+(F!@m3nU2S3v6#K!l5_|k(93i
zS<#E}69rz9&lQ292E|Mrn}a16>sz?#r^V`mj>%5#lHDbeFg=jlI;n1qP-m;D#x<!}
zZLQtFuWli7FB)q7jqH=u+iFgbZ`Lcv%av~LVGC-Nfd?B;Q(+#k${m%t;8W;wpmya5
za8m$<*g<Y8{FF_G9<0s-!Md8*65{v*?{WKr*S6yaWr<7c-!8J!!w<ISrhJVvd~HI-
z&(1Bqq*Q}|Z7^!+hijNoJm{q>i;mdy6QH$_thsPljAjri&i>RwzX2E{LrD0~?(tvj
zShkVEo7zW5D*#e7S<J&?JxKyVYE2p1Opt@+2EafPkL_&Q(pFUvc+NUW(u~R1W7^$y
zt>^f(y2AAInd6+wY(;baIF<-MXUFh!_Gc^dL)3$TnC(=aU+U2(J291poJb}J5)Rcj
z^V@!0f)^ja0JA_C6<P$*Drx37n|EAx;TEO_Y!g()L(tDTGtCz4T;M!XTTz_gQZxF)
zOAWz>TeQz1eqNj9rds8t<Kj0(#pab!O8a!f6mu0zkJhe=+0Y4)tq}a@9#DKkg!Cek
z+%AQ%dv_r?o_JhHpqkjA7-l;f*?P1|`^=~EFRhM`HS-lK<NgiCnBihDKi(a#&CSdg
z=<~ScqiMnf>T6Um*`BwVsmVUL|K6@X2@2@7tfx3-sh$^;S;3Vsa1p=`40I@PnoZbk
z`GQ5#JAYC>NCl0krMqk3fhn@IfJ@5quGVOsp!83E2dcw;NF1F~LJ0$84taFS0^<#e
z4Hy`|j_6ulwc65HHb4DDgWuX4!8-%NxvEROFe|!^5V@684%&UPs|W5I3#is;;f$1D
z?hhl0j^$0SP8ZwwKayrUYH7u;PY+LTQ)k1;SvxPc#&|w@tq3ZLEyJ&`44<W5;4x@U
zypgo6pMzX{)YvT0w^kHc$72xcOCQ{(l{df<Gw-IYr5%6QQ}Wj|j1pQ>h@oU`3@I{e
zBQ3k$xe;7eyfCm0yB5I<))&c4;?^~?_J+bEYfA^mzf5ipPo<Ivpge*YKqs1@K{foQ
zNlj0<bfV1|vK?1^JyBgOMJ%>L-Mg4`-)n0V4lUW-iHkloDT=*_lnp;lKh3lY^<B)3
zr))#_Ldhnuc<py>4XN0#^;nm4!3$byD4>7hL*Eg!zaXOL@7WahL^T!<lf#R5*C)y&
zM9Fu9mQLvHpZr2xK$>e{?L6ZBl>m5I!}xL>yXJwHc4n6SQfDy^?}yOPKDq+tOuXxo
z!f#!MRs-pmU+Qr;t>3ZL^F8h_(4q9-i--H;QlfY>4MCo5tPd=(A6XgjXs>+p#nE9`
zOdp1Pfv3)4XXw^G^7U}YHhhw`<zO@ZIs%P6h;xJCEu$BYSy)+1Dwx*E9Kfu_z~ToZ
zj?nTinSmFI&s`SS{AA+Q{IvU{)5T2Jp#5zc6dNH^72ts5MepUJijSA}&WYpV(Cr36
z$J}8<&q<z4j1{E?_Lt{{AO~2jB%#J157uAZ!?ieAPSJZWSimM)1py1ACQr5VYwN}o
zgSOXt8G~;61SVfN#c$)L%N&M_O!}vSCe+*^F6cb$i$IbZDMULS$(4~hxVVZws({|d
z<G4LxLE^kYjZoAd2zLdR{l7g)f8n+N3Br4ufw8ux^{C_425xgoHxut$DQi^cV2}E_
z1+K*{taOApNr_^XXG6AuOc1!j2@%Py0WVyta*K6Yh?foBhQ9|FdwPXthqCTm9gp1H
zDXE7z6zRrE$(8cv>rH~P5m`U+7WqJ<Ogl_Q8PjBva*RgMnx&YvZR@-Rc4IJNAg3Xz
z`dAHp`7IK}Q%!~la#4*{3-LCDiQzbOG~|340aMK$DsmUV>BUX44anW0<w4f%=0)7%
zL>fuWvN@Ky{W@aIDKE#VO-xQ6M3&g;nVeal7v&_`%3?rq>=Htor#t&V`rv8gGD|}M
z(sk4yuPE8Qy=y-jNzq(LzmZhLw)UhB52DLeU`Nx8dhxahg)$>SQ>e`lKN+HYkRJ~!
z`5tyGl}E_OJW*O|b+O(1OtC?)ezuJ$bn^?Eb(LG+NCkSOr^ey&&=xN`&#h7ECI17E
zyD{E8?0>TL$g(%O=0GfHtJ>p-o2|q6x>k{qZqTboyr8pL+w#7{ImHva5?I6U5QY*v
z*j@KikpIS`J3w+{Gb+_(hmA34w;=*=UmLtck?wMV&}U!9a!#KR1kDv>%O<h?oX=VV
zKRD-%1>NLY1a&)VUzB5+qziMMEr-*Z2pgD-7DuzNY$N$hdwq^_Awu`)<ZGCRO#Jqn
zHceB7PEOyl?Vs-a^0b05m#>XT;aKjOdVGO@#m0tWvqRN9;TdJ^l$A^E%hlG(sN=zk
zUH1d>gY%}n`uWm6=o5gjb3|@?^HPp{h-`9@oLurj9utH_5pTQFi^yF0%LR`%<Lz4C
zJf)H@UdyW~wIFwEz8Yt>UR=ETtKiw``@5S@zJjrH5B)4PZQ{HdGldSc@iRLX?-ul<
zTUI-tzJJL?L%wacJDL{^kW1z<gSbL5?o-7H{1%;8>u7As>#}};px$R8pPu2>m3uP{
zY3{KZcTX0~W8LZK^#H|vnE;S8lfuPOFJo@j#Xz{4zL{^{lzQAyzjIqwi4qk~JWFtz
z4vHx;ZK-z~1~@XTh5u~_Y7ryC0&<sXGF66GZju6apFdGoq%C(T_GGG~wH<=ecGb%K
z_CCwP3e$Dj1;`Lx{_zQev{cn!8}Z=M2}2XBm3unHa%M_1z~(6mI)JX_$no@}(cUb&
zek`y+c2pr@D9tTAvFYyF`_1$iTA%ybQy3@=hu>*1o_0BwZ~uc;X_Gvlz5(N{I4DbY
z`zooR<@WVi8xNdrgLHlHF=<Z=CZg;^+6tg)(w1tx)-iV?GTYPTR_pEIuT!K#ad>-&
zm<!@wFL|8x5%aqZN0VZ_zo~GeJMtE%)MwxsNs#m}C4a#eYU-6TwgWEumWMY;QClo6
zKu>|wWC%gWugcS|diZZ;fM`6<Qb_mFzwwws^+XJkdfCAQA-^xIv3Gd{#zhZQxo$vG
z%Bwpi#>NgjX;pm%<CzOTz9=2s!aFlW`kWb}+u8Lup=1YUn>OxJX=`|SC~vI$p0VMw
zE*YYSeNMcD8A2Q8J0S@=@PeIOV$p%DLASi<-!DXxR4~k;@X8#n{s7LO1``<xiq^<{
znNR^AS6l{`3t4cTI(42O%Anh~WBM6)7TmVfyxAHU^n$uM_mo7R(<Yx?op5O%A6@`A
z7z>SA4yM$aZfFl*bnGBsB?s;MW_Go*t0zs!$dy9Bz*UR&!R-Nfr>l^J1`yh-$gJ#Z
zzXSc+hg)%2bqQ-2a=IYLKwS$!{${#>k$>}a@*aU6?l{79$yzmaAX_eC7u_+JpN<+r
zTy!YxlnmC;ZA4IxN$owef!yETev^#XnFOL}#q=2bwjPOrk@Abpp4O2Amee9ko0dlb
z(0z|E)J<y>KX`k$k$<{Lniw#nwrQvM+nM8%a^aa{eZ5wy_;aTj^J=59bv)|F<!91*
zvKo;{)Q0DbWb0V&iXyLM+=U~2JQyzk+VO$AT8j>5sw}A)(-FbkC3p*}TL<yIzIX3Q
zVe&Axia30!^6lJA#sVSN(|zZ3$M$-4?_{VoHTSyl?XO-b7p0Kx5%|$A9eC65%X(04
z_0}a&HT6mQLHoQYbok_#okuB&`)N^85&vq6?IhVu$8=j5W1zvSs0Rt`pt38IfULP*
zQ0A2_ypMpr+$fR6yE6F|;#Rzy^cPex{^)>wI3!^BjTZl3K79L~^6ziaR{r&E*X>Uv
zYK$g(B?X|?Xj>j-oo|kJt#qX(UP|084sZ@>Zj}=i_G+%EI4f}4c#|w;1{!N#E<eCy
zM-N+7uh?*<L-_FX(~^;s=hhBoWpR4TZslL8s|ZKZ>1gj&4yCeURH?DH4QpR$46Z6r
zsMJ`a=j5p^Mom#Su)*?d;5akJX!DPVSrmGTmd$D1v<gGHJx26F?r|7lBx%sUM8xJg
z8|cR=w_d<cQ3#{T5_iR=Z~mGhawOkcEv|Q@QTD<A$KHEK!`-!e;~^1gNE6YMh%N{c
zK^TdM-g|_RXh9G}?<w3$5WTnPWpskkB6^G74N*oLgE1Jx_-#q<-+RvUKIb{fS!b>H
zpJ!cbS!S58y|=xueYMZ$Vn;eBXcB7l67hELxh5-`5_)YSRR%1i%KtjpdVCx*dJ1zX
zqS37<k---y|2W!ueEUgn?>K+hnkISRQJjMj`#8FSZb9n41;UZAyFE^6yObU!%#-j9
zZNK6X#ov9e(PiOLsuRM)HMtSa{{^lU{L7<jG}pa}e+@s=Sd={*k%E>|t?o`hN1C-4
z4aV?|4K5frwmptUl$wPV`}HRbg2<>+$0eov*QcZr!fHK<qQ;%kMX>$uOO{D{39$po
z4<vMozIZY$ox-$~C`<-j`oL>F25Z>`g?``t3$52;X21G{rO8EcF9>7=3o(CzU)hM%
zwTh(Z7c4nZvhnKORJCKllhwN=2xv<X{k%6RgYvl=`OaaYbDp<awhlaeo%IMCH##%Z
z(zKyVym5Y|`8%j_El`Oe%&uHtkzBo_f9Ml^3FMOKkPWr(p6?xY@Id6;=XVRj2v3?p
z{f(8Cjub2OH6zxC6J=ywOOrBwU)OS)L#w;O>9uI*=|6@7&nc4x9(MUX@(}DXnyW*G
zGjVe(e*f<CB<hQMGtN!G1A*^k&?&hMf3f^A3j%gnPZk?0U%k{JL37_hoq?fD&`8ZB
zIEQOqcD`s0va^8L+(?yhm?F}Xl^f3>h*$XrXRz1tetbwW0OeRBqj<}@8V2xM<=u@q
zPF9i5;rtjS7BLO6cq@}=Ryn55mB>XsR+lKb!h!5Dq-xEpeuIjq!}|N5a_D46(Nzng
z>@fw&_DkZS)~4@wYK7`@Ku$o=am~iDlg?VI%WonWRAo1$zBzLLpDo!<IU_3_xPZ%U
zQN!=gTc;u-n6&0#HKg*LR^X-61idm1kzSQU1PCMQ7TgI1rtnfqLO5mtgIevST;6+I
z<Js{{L^_EkM~tMy`p%S!{_vLAdk#bl<O)DvsHh}@Qbns+Gy0>tDph8=lc+ku?|87w
zhA)(s85Z&@B=R-+%jaWv#!Sb{EsYmglis-{MR00_in{J6Nf+I%VrwzQc-YFmbMDut
z|DY?<U6<OtqXl)J4{swJ1o&rpf+C0$?ogI6b{>%)JJokMYDTwf6;m#`%uzw{u)2^C
zDR=vZv{zdL-77pbTcOxiaco3LgM?3Xi>0f;w&jh=xN}wevy#zCqNYKm)iWnoF3>j|
zGzN=>K3w`ZqkxZpc@9JjxC_@tO~(~c7Q^{rW2TAJ1GQTjZ*;A;-ETLK1*SK{6srhn
zb4E+ATj===o6oJp?i7p<L`mo$AP&=B^rn_GumqbykYXg?n0EI+fRc<SL`PM`@mOKF
z7u7nkJ|C19Nc8CWpIQ*WegCP}J4W#z5v|@~M~Sk*-g*14yJ5F@MlixRYPK=-X>P|z
zDQGSa)Um1_oYwR#+~6|;No3om3u=}F!7(<`XnQr8BfyvDcsW|(BY80T)M&TyC8aR9
zn5Xj+Zh`@~vGYg-z0P1fzxi0K#TEa2Z>iTN_-`(NU?xAa&5>v)oiY|f#0#{Y(C9OQ
zfAf1I>54whs4rzy{hp>CQtzBCpYKJ=^a@!|3YRvzeO6h>w6eNB9-JpYCYn8)qk)hC
zrRnO_y-NjkHiXT$QpbmbJUtF7UXF5=nGbG4U>*Q8q6@2Bh~2UvY=Zh%EyYRa1I5WI
z5Z#W7eE04|b?5c=HrskHZ`dY?k+J}cLJ^2!O9jzIxZz4AGV9!D7BxOSCL0COW4%ZK
zn5sJvZUlA5T*${FC3_qD7$%L&t5W?ul^9cX&vmvX*K~Dugx3b;A}7!5%hm{Yq#}EN
zxp7CN3@GawG;4NQTx^pJ*mJ}!A`jfp)In-p_`4CQl6Ji)KKAuo5^9L`);X9SybqSf
zF*b<+At62a6XtpacZhnRAye-JoDZ<ssh^ZZ`UMegOdw*S8bv%FHasJcmt-S_*q*1L
zZxStpAC;z&GOnWX^cT7lShe)*BQ!h%uH1?+kwf9<JEEe1kCJ2a$#PO}3S@cHfv@JE
zfAGl>J=JdJ{CclUV5#?$uY9aPTen()zPnC(e2ROUmi|rbAeu@09S#KjCD-ceqH=}~
zYWakr)eaxZQkwAgelJEr>Ml%_B9IsD;mNA&aWe_>dNHIpz5nHvU{J3%s<;z^UO{*s
zMgWw6e(YVWHQ~ijUN#rBc7iV-_$6|F7n_bJ3hrYiqlalb_qV6xeGm6BJiWb(2|L&|
z<u0)VU<7hnjxFAv_0(Un0YH_U+k~nJR^BiB_wH;nl&;n6OyT=dBwX=0F?R;an$vQb
zM@ECb)3fkB%H7&06;_tkuzu`>Gg5Def3JW-%n4em23PbvD0|?3`-X-G$ifMsN;zzS
z>dN$NYo64%#tTU?c6jC05u+#o=B<$8)3Mp(;6U-yyvf%Bkj~?H-ZQ*VU}gYg0z-2D
z2SENR39u-Bp!3E4Ibi;+^t!l6vBe={!oJD^lVEN9JOzz__DObMoc8o^ToQq^z<n!t
z5S_Qn3G}^be56taS^f*bg8pf}P2^C0)~=wQzWUyTetUaVXby4mRE386zAoorb|N%`
z9A<Fff$4v{>F0kRQT6PZP<%88G+&sD^kN_XUa{|iqoPAJdaCww&4q^Hna<Jbo@e@Y
zt@jz{XTM7l8faD(umyJeN+*ERtDa%mOYX)R^?GZCHPNY0kV3K&q3Et#`to{5<Q~1f
zCDNqDb)?uiz&5&IX?Z$twEY>ue4ZEGn%R+X&n$IIy}PPAEujo!&gv*t2kbaw5wm4@
zc_aK290%>vB5%?X4hY=<MU^{~u2AusDF>&XvP&k)zRpta-P?LcaYB?orNg94W4$Bd
z;98Sh7QJAQhttYNqLQa$)kJn`zexX7P5Y8A7NOgXYG2~3U(!WY@!@LszsptbE#K`<
zo!ji-(fU{kp^yufi^~#oUs>v>$WfBiNP4&!60>qEmNU-wo@d-5GJ|o3A+zpNX?6dn
zABU~4yMHPqj;s%J3johx@b71$9Do%ac2q%|Utp${T0DG1@=W#SlM4%ssM#FBYyQ;^
zvWJR7>8`6xLhL%-_hw&59V~rGaNvFUd5n(F=&#&v3bE+xg5`C$li{CJJV>8o>Rr*C
zQq$Y?tJ@^^FvD7wy4hn3-)@EOE!(OMzKns?*%=1@Mft&X^RiZrzWc)jS5#{;wkIOr
zb?ZYJD3#jLDM){a<BM5#)Z8)68I$h=dE4f2qvZj?v@ixohJ-`a?p1p0Wwu<6v_qj~
zIW|j}Dwis{W~1o?C9Qkh?OIK!>Syf)S`j&o?pdB77nLr{VBL8<-NKRY;|6SRT@al&
zne@abII7>=(S5o@N`Cbk)8oLxH3)vfuCGD~I(*PWd1zIQ(sUKWEoCOnJ;lDi&`$vA
z?(sN{DR;E!(n!jugZ*F#A^C2XKq<b~c3w6cdUyk0YlUz{*RncJ*i<K&9ukhjoa;-W
zJr`CEcN<~D13fA-nXey_zOE;~O8UF_%pVm`$4C_w$eliQnr<b|`ZW1%d-k{47HTy(
zH+Ch($6w_4VB;KSX=mbT);(zTKZ@%XjL*N8N2H{7B7_Yx>E!x?p4F<?sxvqr#>lD`
zdO56L&`IALbe&^BC}15AyVK{ZOeFI#)jn&X*tp~LYp71v^~O;cw@tM%D#LKQKcDtW
zXr^mqS$EmnI)^QaNKJX6uB!O(_>B1d3X+bC5f(h6Pc&%;Z-t~x`tT!!00lsL!h^H+
zk1Mbyi|Q!5Z2iyKJGS+>{*{UDG9v0AyA-Vg{mphx!=Nxu;fl9X(TCqOMk8-Mpj*(p
zuy8O6-q0e)B>pvdoqpj!QpVP{nDW4>hvD$pKt&Xn&JBfdOobrxO}bJ#K`iS%ID1+n
zT+nc@GU&$Y2WbxsNX#0|@9SnMPa~N@ik|%lHp!up^I7&BebaaaQ%j6cTEC-9hO)~!
zW%Bgnq~xIhS2)sSIR)22Wzf9PgUkl<=dFBP4%3tQi*aT|{VyrKC=eGS9N^R4aJH~b
zY+GiM2aDD{x+O={81tSe50p^GSpaTHbmTC*p2%^fXkHaz2X*qwC3a?J$-Qk9lVS7c
zmWrC&%%X_q547{0{O;(s`?_W38ajmrDJv`FAOLiwz<tHVaczQ`<P6)XOjhgh2@u|m
zxshFvUEzS@HwI<Y3+iV2`sLP$>y@@R7InPOUJ6s|io<g2uHaPG-IGqL)eeGLe|@)G
z&0Q-vITB^KCS~vr7j2Q6`@qc1OmhGWATp!FWkY&Zpn`cYw+(FlJf6pH>kXvkYJ1pW
zC=a9iR#61P%mUn#r4BYjF!xBe!-E}jeOH~@y=Bhor{mA2YE$c`*5kL(hvD{;Qbvq<
zVhICTDom7Z1kx2w7BoAnV~Ne<ao{*efROcEFl0!VHV{k~$)=Ep1eL|a__59y{=w)~
zg9ONCE0ek1kaF4e=8C`isTf@rAJ{~ubXbp-W@FPoj+P*^7Po6js=7sNzTZrjqdMpZ
z%mKk5H(S+M?|nSoa=e_Q-9u)40m~A4ky%z|<GZ=x#nXSxv!HmJ<c*X!#Z=qpdw^nO
zEqFHgs^_Nj+o<z3xqj_SaE$``-rRb%;{InIrf&ZGm7<0%*cRw0XLdUeAyt^fXu@zF
z)wj(kACX;h_z|lcI+t2<Ru*XyAX5t$Lx|Nd&g|8S7#%{ErCgSKi_%`#HY0Z~7r>Mf
zBd(1*u*%u`_blmGO0|pGyPLWdYa}_ZIkm*E^41x+8MBA*d}G{na^IfniHHw{r4Fe^
zAw^?Z;lo|dENeWP<XJAha)s(OulSeLQ6)znOJp<TmfS#6XWD~yp;sZc4&{3mXLt`b
z7(Ts%q+VFiz;pTHK<u3!MX}6V5Koprx484p?^2ppPvU|M-U;Ep(*`ng$?*f6Z9()R
z#_6`&j0b&kkrGG{+~h*WyTUp=9twAgpgO~0%aASf^=xQCVh2tOF{JViRL`?#gUbJo
z>#9<h6Ss$SBh|7TN<B>XUTf8S4CF0XVT9;Q%B@Z69==ZR2!EUDFfgEqrHyFZoNEiq
z#~(!(JL7h;jiJ8e#@{kC)swmv(fuxinPx#^+0tm%=Sfqo(^c0&nAxFBaKx{h9}}kZ
z^56zNk^4wtJ=<Cp{aB=Vf=AU$4O)p(wL-_YKHY{OpxQ5WSUQdbS>0-O+fieM`B;mB
zk7<T7oAX-Gs@iFT&5<}Uy6s_9qO1CAbT&(X{Q&tFP!&+1o~5lq(5@4!-_SRu5!xhi
zp6iv`?_tN=3*TO$#lC)r)2L;e_R0M?q&3{XcCsR@x;BF;Xk~j&lUA6V;Xa#a)lLXX
zq`bq~Jdow)%|)(M)E3Jf4{rE0v5dTYI8W_<-;~S?V`WdWqpFe@kMHeH$Fj;dzpQ2C
z`{EW@$`kD&(<ZZ7f3Pz?!K*;#;5O||I*0qn#OztSe}&3JujUCieEo}oPQJyMPuan8
z>lUyr8rK}N$S4PM60U4HqXaznmQ1B<T&PYKj^Ml;2B4o`rP#|r>}rdd`g=sHceF9@
z+7Kxcq`goh-W`fVS8b~r?3JcAXHY2j$)TJP_vP#nCg^}URE~#iqJI8Xnzz4^CrBxQ
zC{ENIPjV?{EZe!>bu!)#k?Gaj==z9ptM`l(>Px&K;|S??!!Garb%tNO9UUZg<c!nD
z-MlD#NdJu1V@_G@9#e~M(E8g5rI+XN<?$;Kbujw-gELY_olpo>>HV+<U6@eMcYJW|
zWgY|}@`d?_<=!P;Mny@5D$9rgb!a!YrJVH6b`!rFm*l*=+e<hXe(5hxXnL`;adSz;
zO(m=0d9O<c`>|v#Mswr%M*oLNYV->{VijKS-4K5dbm_SK7!;N^H&^;JCk@me<q31^
zz#qL1$0=ufCN!p4jSdSk>T~p$KQ&JB#eAx@HK4y^9`0{6&LxLm87wmnh~#itSFLUn
z-o%pfn|$6vz>Q1dVRTIiW|989p4dBD)tgH@cV#4}QKKck{JC^OF6yX<ZOCQQn7(vN
zQ=J4Ik;ZMUk9{>LH42^XKt_+nAQyB_y<IAOi)r`%R}E+v%^f4)+dFi79PG96Gd(^r
zfXq9rM%RTkQ$b%sE_DY}wmWa8o+MkfMI;bl^z@_m>rB!5?0Pw+x$ad{;QS}dURSWh
z_kOGhMoyS5_er6?dSVm=b+HG@sbWyKH|~3nvDwew`VgV)%R91l&thZ3f&V5HcYX+6
zvNEKhSeA<d)wzVA343G$%yeh%LsV$G`j!b6VtU{>;ZaR#Ic79;X;}+{tlmV8*C}<Y
z_ild(D{rIiR*{PKEbaLO+pOYbU2h9xd5`(b+4Gh{^d_*#dIvowlio>?rWg6=)#wW~
z`^Ev6l?JCR`K>!lBsdqIXx`s`Q)(Pgg4JYy&DKo=?wH|ro={({dv!<`NS$urw`HW}
zOIHJ5Fl-XFe6U{`YNIxdUs}#AfhfARcCWB}al>t<>$$YZ;`z*5GR^I}<alach$M;3
zRb0uQteWJkm~yZX2X&dNb{1;y!ix6v5ZTRWgQo4%1qvZV$M^8H_X;K4ZNv|HMuQ4!
z_m2Pr3tmM+dK)FP3iQSY=#_jPk0Wnx^rl5vNRV=!(x^Is!sofx9c;(N+iTKm;poRI
zDp2_uu^j~ExHs|G%pA&b5Jk>=u`@-+A1fzulH%hw{TOMf?#?Wt@vz-EN}nZH>+rj|
zZdO?J8n92ZcmTue&T>QLxEKifUggo*LEmVm1w0kaPQOn?cddl(o5$y|>-wyKe&E%&
z`eef07EY*C^6<w+`!frqPH<$&GC@j?5TRmCUpPjMs`Gix$z&OOnY@}Nvk~r*)kZ=x
zpWU6F{?hM0k@3s1k6gjQ2+p{{+uAOUPR!XVLe_=4M8lz>{c}DZB6=#z$N93)@=Iw(
z`Ww4hF8xTo2%DH%{3sJv6H3qBLJr+r5^w^r7TjzcdnP;nVz2$(njSRmYUiaTggcsx
z9TiL29j@n!;?n{FRK_JuhRpj&ajXgIKNyjvw=9h?Gt5N8*!MR8%#dmRly0^vbEUXs
zt!27H>kHB$ZRuN2N>9CtPP*NQim#QFoPufOX5?0m0r1<3OBkrBo8|S~dXYNUwZg#r
z0EF0-dq2HR1EACn2?|j*ki&5asrHUK;>+j_ig<s9ve?=ukk=Y{ieTusN9-MRX4O9R
zT%xWzZRQij)CI!p`8*F~LPBS@{eU7OT{gm2ub&l^B-c=1x=5arwK!?yGdA)Hp7u$k
zZlgKQwuw?}L`SJy$>G6u4<}2GN9A4}_7R55Jnhe>(q6o%c-|z~o>J}ZgI2T15G-}u
zjyYVp2#`&|e!NLj;?|cP`_}@45`^tTPhVn@CG2y2c^#5QA7ri7eb^D@Nk0d}_gPj<
zvJ}+rLD-*^X5oE=G35%F<{;jrL=l?3j4bOs0jmjZkNpi_ue&j4>j-;s{sKwKTdTC1
z5Ukyp%^s+J=ac-p)qAf~iw(+>F&?8bD}cUhJ!RxxBO&Dp*_puHgx0!Ii{6kLY|a8#
zb8F-+-FzO|c>5upP!Y$qb4fN+1M!Em!PsK6ev@9zTL+h6!`?LYviS`PtYk3wdvfjJ
z?3P_ADa{|9o9VDog0*<7h}DToIYp8D906rouQ$vI)?KlPNBmEQ0ch~fU{J{$<1*ON
zJ_zWfmwg+CGUDdKbZl3(Q`6sfC!-HHT9Q&@@F1ByHlI}%bP&h*XIxHzfbvxi+w@k`
zpdv;Xly$P@t(lp+0%Uvq8j5Y}nP>tw<|27!`yd6XbI)HXwHZ*jw7oAoE8TX(*=Wbx
z2=}Z@WwZ=Z%F~~#6dC1WdZo~u4nu$xn;~zrt8^k46Lp<)lWd-NWa~23#e4c77;X0h
zJ?FZdPqX&6kGOC3M{&w*e3`+2H6929FzW)xN4K89rMW@K@5Oiyl@&`u4vyaRt%)iX
zzdxV#NtmOrI9EJ0Gqp&B{%x5AdPOa>%0YZ}tVS+JGyD7U9tZ~)=rq!Ah^oJHMh2Ay
zn|g2=wgeV=FPeu4oAssn-QV~c*0->HH&jH+O6vsTY&Qfd^bl6Wc$)PK+!-R`uoiN=
z0DhyOX8Vcw2_wDaptOk^S4Zb$N9%0WO8?v`op$fyxBl|0@~oGhO)aKyd^EFG3bQe6
z(FscK-t0oxa`+R}l(wUuHw9EpWv&f#&)?hI<mAb1?McDEPFn7NTf-PG8^K9(-+JuA
z>PR`Nj604GB{Ws!?cZ7Vys4txgC7!OCV9hA%#rWHLKl9b*036&c;nnQny9){^AYsw
zbC_P9IxfySy(JfG!-#I-RCr0<)F}*bSHcMgq|!b5q8cYG9K&~yax`j6qUotd2vhf<
zMx7wDC?OUO-|?d&^$wn32Y1Q_fpYyCm(8OJ7nI|~nt8CZJ|iBB;`}5Pd^cFTy9qqC
zw{PcLo$nk$zh(|qfhb>bBt-8lW!lbDYRQ^E$#L77k=pbxmav|C6;`JZcXu<-|C+~|
z5OU06X4Ukuu!)w~EN{{!rp}hs#8E6mW47aHUwUdwjbcX~?lH}smzRMR9QA;^Dy!E2
zA$t6L8vQ~ed(uurkmc&TR<b_~2uzDB&U*1bgm35e5=y$_DndZHrOa9T*W0FT-<gMS
zyp$?a_u5xX6<HqEl<dC<PP$;t5K<{evBHvMn{8Ayu{qiyRyV^8VTfpHUL_lC5hT?L
z9~*Qh(m@v7zj1I##mHx^SYrd|_BIFf(w}a-@@>xt@D@1GXI+%YWSi`X6I@q2o^j!C
zP5{*`Hca!gDHkzWRK@r<Bb#TgzX9B4_9P{<TLCcnr4%7Gk@3zZme5Bywr$Am+r9o`
zaCbbpknP-G;hb8EgRU9sHdZWuJwHfUJ@P)(RT3&%kDPAhnTM)Uk|r?V!mclNCvKB$
zWy6>IsT0LUo6|j<5*??`42o$bUUkv0YlM30SxSC|sb{C!zOcMTawca|`PpU*ZPUT`
z0NRdWVLrHvM}LNbIa8x!Xk?^`d%_Hex2{Vrig^=OUZB9WojWKtITXq)C;K7xPTtOJ
z-+;3%@w^CQiKo;$Zg<xSKvnHE)zMEYZL@h^s)wKDhAaDD=6<ea>ai$20V*lEJ*`Hr
zwG2?P1H5SlVc?bI)r!r>h3*+v!?%g&(Ni@&9DFa{;ZB7!!rZI&j1{vWs~eU#?dV1K
zKvY}ahn)VoaZxQ@>Wx`n7f3gc^*az(W=CjLh|PFNyWh(HM(X}0zV3MQ6~N6@Pq9k`
zd6W7Pr}2|i>_0MSbte6+ZTfF0$mY(AePt(gLf!LBmBEjhn>xFni+!GVxN?`ZO|)_6
zgr&J+ol^&;<ow6+a7egpm??AX*O<e1t9>Ia?Q(C0Yo)h-=65BKWIED;i0J#tfWau`
zF3F?6dNcu<&2mW)sH{!7*yga<fFIn)edG!)2K<l3I^GPTF0FGiVXK;pt!PfI{Nf(m
z214DSC-FeD#r~ahUv_>yfYzkRA-gqM@mU4Jfmd%o+*&wqDl03i8gO{eS#z>~shQR~
zd<U{yAM+mZ=lWijBbljXCGEhJPj;-uVLJIi3jI94%e^=>S;7`Trl3B)w33|5t()#7
z-W&^?&woQfuNV=BM~5C9rkzk9C^3|&#K%4#vZsV<!#s?t>7=E}TBE{vp4!-4r=IAl
zaK5H`ur3)LtZv4t9pnI5@2dt+i&1)Phg>jj<arYhhI>2BOYn;uNZ%M!l4EXf`4nfe
zSML~|e<tP{`zT*U)d1viZ9%n>^uvd5G$cSgc790LI?Q}9$B*#vE2wHR0vBkp<@ntd
zk1&>~_N}G<Nhq_Q>Nwk#KMsIAmm#|JZH!Lgva?-adU>L>?h(bMqJ%?IE0Yil`pt$$
z`l|=fV=DC8?vojYAQpd9C^Vc!qhmheY=l~kJJi@|yX#=H?YpO){NWc%K*2)^s4(F(
zCKQ~|a*&z4HBhY+R1wCUm*~VtrYZv6TBEvnCb>TQ6W~)-N^qoZO9WF6HE;INu^7(#
zNKP-(&bTscI-*@uzPK}D7%FIOM5Rcr*{<;CjLzO!oV-h6Ct`$=$^$EH%Vz+^GL!YW
zY_{}(`R>AHJ-q510lCw<UDHOr(BUU2QgMr8(u$2?Bg51J<VWKGhf{RY1(Az-V$W4o
z&!71kNc<=|I7aJ&8rk(PZt^ujTxRmIdy&8r;Ryqvs5U?vGY5iFswodigaATgFsaIR
zd(=Mt^-`Zs-xZGk0h3~@3(1<hNpRk1bU2pM^uY(Rl`G-8Fg6xSIpoJ1?``D(cJAfG
zN3PsM`EU)3p!TY+mf~be9jN4FEY9e=+WaR~8(3P}oIr0c-hP$vQkYx6So_GLcurrM
z+Cib-J71Cw8HlUden-fJ5stzZZDFjVd07CVk@vKWLl^hH#<;F#6p*yAlbU_*acXVG
zp4*N(xZm21<w7Uz1Rt=|8Zej~30*zW?;>?WB<Zy4gk-A75xE4zJ4@;+2JQ8>s`yej
zm6;bmJ?{3B>s>Q5AN7!p-+g4BPJENEs{mU)fWZIa+jR6|u(RQ4Ix7}$qQ4dVVT1m(
ztJ_kO%I1)6|79jO{^d$!qG3V{aovqx$Ry7y_A6@eQ8W*<R$#BG)vepffZ%Pq9*<l7
zisT>SCmgn%z&Cgtp(}^N@>q40iW80ggbg^4^otIK8=*^u`mV8O#zBxXufyf5-^#+D
zy35RD;XGR&y>p&NWTM8_6@177N~Vr@0UJFo9oKk-TeuZl-M$goQK@SR_-T=!8yO0H
z<IO1^MQfF>#7GI5-bW5>$X8SMte^GxWAaAUFWzQJ455ea;mMDf=G94DUbAs0z&L0$
zAfKcCd97XA$sahJDwg<G_x9Zp3EzFA`wW0nvPf)%Vz03Fd5ir$5txp3;gmt`-*W9a
z)t}QPi!16;$S2xM>nDBacT;>FjkeWOsYLEw%vtKC_XOppLMqqC0)N#D%6f~sx+e{=
zLtz3ge@r3%gFk+slrnmo`s0G#m<765Uoz7A(~S<(2gNr!;}V_`_S{6$_lLVG+n#mT
zNUh;7uP;CE?j?0EC2nSbOMxV2y%-<A7+@$ejZwsHjy;<afpu2)RDHJIT4(5O$@J2q
zvI_#lpOn1Y)1uFRM!5bjDu<&8mp*s2-A|^6KMH`|zq7kODkx>Vdl`C6v!5xbD7)SZ
zmY&wd{9a>ri%MU9b1Yp5g2O+G7NoI#^n*{k_2U_!E2V1h(tP;if=h7WT+lK&h`dQH
zg!0Op48Ocl%)UNHd9V7h*wS!z+5jvPJ$F{b`{Mlz3m;g;q!2+Q0Ebv(M<P;BUiem<
zfpkVP+LVqzh`Ocdeh?rizl1kR{9|h28*Sb)N&8G{NIGGnDD&dSy58NE0df_z{w4uX
zE1027o0-9t&Nrjd&#$<CNi59Fi`SBWhXc8^k{Zcd%vU`F>+<M4M`*WwY8v!@SLOT-
zqr9dmRA}Z}49AT=z-^8*^=^}7?w`B-`TO^Wwx)5<RdZ#hUSg~}BGTv<Hh8}_@{V(b
z#DvE1X`0H8MHp&sx^AylWQ=XLKTE^~0+Am*w%>kx|BHT+Rx>B&3Z2)V5JGw{+8Inn
z-o!ce*6}%xKGUFP&%Jy^NmyB=b0J%e30jWFoCnZH`~CLfN%9#{ht_-Qck2lsJ2#?F
zVPg8pTqOjDAg`#7h!6gr+pnD9^s#?Ekm<Uw-fw-?j0uiX#-qVfbK{7MCGFPx5RIND
z<mHf#Wy(-ZvNN)NUn&ioc|uQN4%0t&cQ$wW)RcS?B@q&T=j<?1IO{_%c)O(7B+)og
zlmw{*NT#`t<X`{Y|2VwN8>AP5)7yGH>BA6$ENwpYGR2mT#a|hvBi?zcG2fOE@eX;&
zu6zy34G6?5!f!?B=0x^zmgUTamE<79&USb5kZf`w{jP2$72fE?3tw(;Y<V4pZ$Mnz
zGl2Z81G+jhBcZwe3_W$Ac?UFcP?bWuiXY~EV<a?q?tJEV;U!%4d_rVMF~#(Y&gHjQ
zrAdDi3lI{vI~~AlJw+|`%UEfBc4k$^5!^zs*W?yLU6TLP<_>?A6F&edjiXEPRJZ$?
zWM7^)T!1U?1<BC`M&CA>wpvE&`OX<Qn>DCsZpje0zv#ty8K{E;rJ6tK<byJeV-%n^
z<4>6Uy|F}~mIIWM{;29`#ofR51y0>V_mjTgHVv3UJs%4`JpP|He~4sDzR}5=ozK{g
zfpj^plLR@$>vp}0*QJ%DLr!R&xwj?G$m}a|RA&Mj6AZKU@Ho7~6{k;A>|=uk7Z{J^
z(8<8PeZPKxnvtUOhY&XE!OQ=}H*Vj7u=(QV1m>q+;@Wi4&BOP*KU`f*$+QCv6$&Zq
z0X2h*o`ovc$Xmc|4p^g{()H!@Y8b~19|!F1oJW)5x8ja({~*9+cu5k?s9jg6U+jAv
z!vy4$=e;Ag+#_a({9`MULjieIsG0ixRv?Rv<lyb2J{Sg^^)4T=H&!HF@9{$Tfb97m
zy?yk=ku!z*TLn~ry7Ys<@(alm3lprApa;Nm(p48^*qsOiijm{n=jCP_f_R~dprT05
zV}Zwsq#&jsx?tuyh6r>0|J>=j5Z4`|tCD4RUhRjRynb1w>UrZ7tr+cy%4NwDO(!{?
zqf>7zOOViJ84z{&-tZscG>}kv;GQ*7<V{BT@kYXVRoq%-Sha}A=;TZ3yKO9o&cX6^
zc1XbzN7Dp;)6WdkE?z4{Fw+0QH{N|KM0}mDUEY>gx{^^(wFPFKvW_9&n(<8f5>a%M
z+K~^GW4zB{W+>QD8YmHn#W?c)-nz35aVZrL(zX72tQd;uhj?E~7Cn+zNhe_xFMdh<
zv7bM~3%qg{cl{~TCw~5PBGY^2_}DLDJ^EP)2kODwH*daRQ%)&6F7)km8_>P_ro@LN
z0`efAKnGwK6Z)P2^TXGPah}JtBO`i<P{;mP#H)b5ka}S<jA847_%Wgr=cVs>1Cq*7
zjtcWKn;eaVy&GP~h)-Sn?Jwe?B(1zXmu}vF@ZI&zqkD`;qPo`hkgqe2lcak*T*Mkz
zI|HA$v*;#*Rllgi5x(1ri~P?;nGAJ|dLeB85pfgK(HL)Pd7Z<wVbfoqIR9fdzxhQ~
zC;5TLgPA?^Q=P2dX+m<Z79OxMygM42G8R=I>KQeTo&nM4Z{0Mf$Ec4)jI{Ll|Ax#s
z)Eh<f2qc}BDAsosqiNolc01*pxamBNsYj*^c`$sTUeJve-gIx?5gO)y+G8V1TQz{(
zd%r>jgPNnTXA#40P>g%m&K<;X2L1F7?V)JoiUv%pQh(lMFx}(lwmkYey%&uj-52{8
zr$u@b3l_4bgRDiKk)me*`~7Jk(kVSe)C*l$+cWe9eT7%Y0AXIYu2{wY#>5Bv$U~k@
zxequ!^kWToddR*%*n#x!kvQYd(8{aiqsdpg#}Jczka3`xvK@DBycBUHDN+$&zu*JV
zJRZRq1QLFDS<zMc|Cg+alQ^+yycha-EyeEN-&Fn=8p4~Sjsa|Yh3wZq_jX!Zecd5<
z1=eb`SW<Q<N%qHP`h#7+d4lHh<;$>&n1j_z>?RT{z0XD`wz)r%U^Zs<r!f~^lD=Ss
z2SOfD2?i+@yFa8}xMMK&N~*knmvua8^Nz&pb-3MZyk|UPJfoY~Q`hsW{bJvK$cb?h
zK}Edy51Af&Yml_<{X?#gaDTQLBmF7E3@7lV6hEcGq2a^dAO5_3Z6wn@`G=e;KWi2L
z>%$FYqzxX+r4(cY{lby>wqGmo`;+}!9}L_gB3@V-+Ay;IqqFvZep!};CQp!_=5OsH
zu5p%Y*VOM;v3s?qhMvIu_1{)HM<WUeIYxvzeY@!VFKwl+?&XE^_b<BtN7_r{?0H`3
zU~0JUuSsfpc{wYd_!DK~9ed@PL2X9xv2m#*bt;}5bOt<9ih`^9{of1s8%v#bG#mEU
zg;^Xwho5~@yxxt2{?@YpA3S70;piW<U}IeHbIr4Cz-x>B^U6o#`Z2iQ_>w$zv?ORH
zqGLZlBOL@r)@GBg{s+%E=KYoARJ78BKl9H!Mm(9A_(Z4Hu>i?muYY44;8#L#fJIQ%
zX21Mv{HLOkbiX~1qd$>lcC-L{rwZMF4t_Zc%*B4IzF7C~J@^}|D}LtmdETUlqyafU
zuf`BrFqh1}-c;D1JY@1R*d<mBTH9xSOvamr3cPNnAfo(}2`$%v@nZ>~Yvj*|%$))w
zqtlX={Jr)3^$&dt4$9Yj?Tf!wmE#&%Ws*YezgPLUw#qejun4U0BOd<xhk|3%{p)$Z
z_4#A}J~sd4JpKFF{KI(^|M#)^&)ekR$L2q;$4@=@@7v}-8$JI%Hve!J{rlMb``G;F
zBk~Uy&5xJ=?~hG#6^ZOnLDarINii&0+5b#e-S_7@(Bj&v+=lHRc9p7n@`ESG+oYAE
z0z2i+!XwzpXpLo_ygfNsE(i>4+B>ulf0%;F9>8XW)&&W=2K=*${^$3UcTSuM@HbLe
z6K>Ou)7o(e68-UzEEVt7=Fz^JnIDZzjBeI20DCVXn(U`9qYMG|eL+%7Le1m<-t^3(
zCC=4Ew#VMFkPrzQ<drM#s_V=<C!-`6wY63H4UT0w?tUDaVelgsV%og`A|W6!aGaf;
zy~vuCo!6Q}Cko0&f+I;mhp;Hn$dzOWrED0T1BUN8jrK>s{`z%;#IXN<AmYco2QIPk
z>C8tJXy1DOUb1{sNN6<Fu=tp%QCj9yx3b~UA@P2~uB@)kRk?s-uB@D*mFMH<PiuOt
z(B-ILTikVt7s{!0oa3iwC%z0krKG)<5YgYT;j^H`u{g)2&4}V!qna1%&r22*(w>=Q
zd_Fh2Lgu^Bb@%kV!ei%tiVv>TX^pd;Exs70eGn8%p&n{vIP&yowyz`H(0NbFn#Ixv
zujPBc>`SdQGB(!4Mez_}G!$jMfB7QGz$~|8_zj2iT8J=ltd2)pALU)`T0l8bY!i@?
zt>$e0!`}?)BkqVShy*pyekZ#s#*993^av=`yU8Xos5AV$amP4;(|{7aJ8<qFH0?io
z>7D!|q;{^3h70lh6N^cC7c(^WjBq$@tW6vZ4Fy2<G2WHBmqgkq?y9VTYS^T-c=-)p
zJCml-aiyUkTlNE3b#^h$UpviPn;3iDfRJR&yg6?zxjFmhhK_-cR{kBT`aRdy*L$w@
zh$h;d1!qXw7Nz=36uEQ3oWG_beDk$)1@5FtmRY$p{zJd<c)3~e_!a8D44v3IX`kP4
zN|!6^a|SDmO}d`QJPvs-nrXcA<3k+RrWvNp`_hU8EMnEX@67VZ*1NeeF8qq2)}K5x
zFz@9|7M`@_T<gYH!F%~Cns`7j&1KYU`-S&<(edx})ts!Q4of~0TkEzd%$;ekD$@h1
zn_jx_jB!W=O)&-3<3i3H|8Lz)@dHXWE)Gyx7OCr{aCcO?xR|dkTE6*(omhDD^%q{m
z3{J1aqV2>lnQb~tJGd$<E3?T(!3q&Fpm9b>XW%)Jr=t*{JTybFzZT+Jj<_CK^x-uA
zq4W0xxN<Ul9M{^p{*ijY@>|uxB_X}xTeQ1t5idIW8RH#@sE(oaXD(ZdYJKXny&)wr
z-oL3d1(72k8QS+H7yc)=&OdArZx_x&w|N?%d04?=1dVONTvqCXeuU!&$h{+Shor5n
z5{(4ABd>JjF1Y%6;l^xUW|REX<@Son+$TE$?1_iRJ=8il0`g6?$jeEOgKn3Br(R!B
zxpGs&X4|A*a~KQ10L4x2w1+Y|cAZf${S8f#OgI%D{mAMp6~V$$n;&PAmN}f1V5;<E
zfy~pzRcve)yI28OEL_0z+Th8dXfGVuJHtD_ru!F<@-Xqjos#|Coy}E6d_lvF;|M)*
zw~^*sD|=Roa2soVBd;1NoW9@Yq>lnbTP$Y5{oc9%KJJc{zQ)4?jV#b+*3r=^Ze!`X
zL-BM8wbUn=TAk=BA&l85npuFeJ^Gsq;N05R_2=h@>^#CBuH%ZR>D`fUo3mbdyo2!U
zM)yd+LALazbEYRJi$8feAYWWUtGO2!<AsyGr26;e@aR&O91-ShWJK$9=1}xxAbsK5
zxu@6QE2NpeEj3=deb7FZza|;4p(8gvl-{>|nN1IH&5a{zx9Wj<IMpg*9j$6sT<=ES
z?dsbvx%xY|#4K@#7VIOu%(*X5CumNf8#e3OvGyY-nC34I!&yBk<IpPZa#RagP~gzB
zBwpZDkS6+dG|np|bCYyJ_8k&C<JDd`_LD?cyF1Ln(2|AK^)5Rv-0vCa4WH$q6{3qr
zGCC4rBe<bwvGy=-SL+1!17R(KnLM=jH`f2ufUP(4A$Qc5FE_&UJeb0a#rVyAa0ZW!
zn!6rgjisB9Q*`@|P!HhT)^Q`>dZZpaNCDlH9v<BvK#@fd?lK$H_Px9OcaXF9#IkHX
z+$5^b>dUh7NhclyQIF*6vk$eX4qwfEhJ1pbEu@fZ*5@hiEbhSZcldVPDtYRp<{*uv
z5KAd4wN#A69V7en-)n{h%3agmx}!U%)T+iWE%QA>he447i4vaWesYY0a@q~#A1bcI
zQ@AmNVw~A-BNPIz@I;(ksLs}li`1Xh^{WGlfjC&>Z^ck9u6H^*X<w%n&dU!mnXWz{
zI=?qdJTRGFNJ}A7S#Lk=X!retE9Ny549>xZupGJHKA!BYrN2|dH{YsP^3d+;@7$E*
z#A{O?)#WsSi<40q!4mgQ2-79iJ2xB&GNo$V+w%&+qVC;zg@wiv&#W*#FVsMvQq71!
zc_qd}#qTl|m7kc6a&hff{Dfv~F!2wo$voey^09(N2#eXm>5{Fjb8W5CVV&pt1q)uZ
z@f|LP@=SZEYc-L`ZCcQ}o^`AZ=R_Rp7$s`H?ub5S=dL;SxTyM=gJ8jHTPK0bFA5-W
zFSUe~?~03U`f9u-V?*diYGt{h`Gzzs@!LzbHp4FkWf}iL$NiI+$w6m7yW%Ys>fPq_
zR+h;Fj9hmw1u5LS3sQXIMk0kFUbscA>rG8f#oTq`L;0NH`)}OdeE-CMoAT&c^-pyK
zI?dTW&=|{p^3h>Q7NZZldFnIcU^WA<XWPhNv3Wk>=0;Vq_nMXB+&<VoJZ4=awLy^%
z4u!8LAbO@PG!;bHmABsbwM;cQc0#kJwt%LOtJ-^FjFr`vsQEYIcguNR)fGxU&W?2n
zV%IxpWE!07fhg08ks3u)JoU)y(q*+6UXXk6;KA4Uz`)mGD)$;sJanP<!EOyE^Ya*5
zd`%7fVWJE?@W!%4YtQ;&FKQxqRi8e6K6NkEnw~vqWIQjA%WUFvia@v3<=Y7#+fV<T
z9>Q^;{nTG47xGD5G%L@oPf?se(=^s4L%!(^7Y2W~=m~lkbuL&cGHzm1Ze_*;@jjPz
zCu#8JQz4(<nN%s56rx-~4qaPb9SpK!Jb^@{bmkHh0?22gq7+ozd&3^2T9W%Z$1lle
zK`q&b&B})77Gz*JEmhU;gNXR^WD4I5O-!oN;ta|k9iP3V$2}jC#S3mK<(?B44`lo2
z{S}V6KYLc>%;e`hlCu@Zd+U}0fS#xO;aVIe=9L(BK2>pWYjZ&3$aqrFSsD)WC(S+@
zzdJrzvqacvooVG9ny#FWw0EzFaGIUEU+}a5zV4YlGQBA$C|?g3A<pgv)FJtRE{I2k
zGnXQ0t+ZcJ1<CCCTwgzNe;?DMBKQfp2&kE8>=`au)YXGRRHH$T0=;uX<$&qA58xW6
zjhcTQ^8ey?G%xzGJeG1%q}@Y9lkXigOeX?{n;I`2>5y+(l*2Y+uf%SyxMl5tY?rbJ
zHukBG^&9%Kj?PYA@68yNI5(r4y1WLR?)UWS;5aLxy&t+On^{?Z+U=Exii+Rqcpd?w
zElCHdJ8zx(S%mJs5-Zz=I}8pTWGQ03aQu&5Kt=6|!YGs2VY#W3djs$F>WvdA7z6lL
zBJ{5}$F2=+!PF*{&S=3_s?%i!X&K0j3wiPt7yaR@+i)+}3a_|BknVJkE%RIl?2Zvq
zjP3&FlDZXEw*ZZczcA0}r2^1Gpc0^U4Xs#4$XlL<P?yP0117u3uDj!0CJB#&8E#QQ
z-E2B>o&Q>cWw`_8B?fY+MH`666bP89Ft?F55(Dze5-9PSF5Wusx_Tr2r%aNPP226)
zJB-4tM|c}e!W^S660SKNzAD98(fr6&cvo?rzs1%M>4N0xATgMLH1U$|IBq5;J>W&%
z_&{SasF!?mEe5ZWut$Ue?bzwEV8fo@T_5+5#EP_Q&(17OQ5qSE!z*FsB(CXSX@)8Z
z&R`R5K6RhuiEPF08}Is--6vkqxNct+rYJ0<50Effl(050TuG0ZZgVgrW0}5iFJim-
zY1SE&%U7<n@8dA@05nm0__`W3UJ+GpIW7w-$(cn&s?U_GdisB>pnh46D!=Ur%%Et2
zf4xFL6<1fF`8unsJ7H*!wdS|(3$DaRc~S~7j_Gb+gCxvbAWQ`0Cw-G>s2TCRoq~xo
zijS|Kxmu+Wn4%C~v7tg3GAVQRXC4zPaqVjK5@Yb)Ja3Hi%4T}jH&<~^R#x5ExO(R*
z{~v0Dkr!<o?dZx#&dWpQ#?vLhNL|Q4oeW#?84eK5>#(dd^Vxnl*>kw)yhuDP5ysTs
zpY0dPsMGVR(&`}gTr{JY+vh-9L2h`M_jR&?1U_R~1M~gf(GpWRfVr6E7682-MxO`V
z`p&JUYkH9vy4|`cp>#y6d)u(Nm6Xv<*}=Py9S|mkiMj7dBWm5#?U3EKqYNKwgCtBL
ziNwFU!Nv71yxQ3wFCYE78tTXxFGgM@q5bwcA`s&|gZYAFc1G2Ik(5IXTWWkwy2I=J
z=1KpPamp){ZT^(G>4k-@L$@<+nA!x0Fk_X+b`1~^o_l$JFPU2XVFZ=sh=Se0!%MtL
z)eZ?w?VX(=AMToS#87{1=)|h=71cOEa&o`FVJ^DGVw%nW*xbh%jr`!5?9I~wPbe5Z
ztnDUA9&by5aEpt&r7Xe>%f|)u6h|^sPDk&+?4GKGnZ`^bcs7}czuPBrLhi2~9P^_*
zk8ZbHsq}c|qHwa4g6^L3;~=`FoXceeMC;Y7#c~7Ay)62k2Uyz{ddEj`l(E~O6M4to
z@t2oql+r;CuTd(ub>HeUey!RV&_WbDZG2x3JmKR4*j$eQ_Ah~AJk6B=m$dpkb23K6
z(JF=v)W}P6*KGCi_2;@06JZ8#b^nZ?{1^9t_uP-`c)WCL@~YsteMOlbWsc2Lv`4k;
zk`-pm(L3la>=Vt3;Y$6sc^9r>gYAHKMEf#eYE04!B5h%cK~Nnz3Q9#ee?f8wi7+ej
z4hUmT`H)y#ac|z{hZ0)ZSidz}sLwoBqwSVq)AM~9qnN9?eAGvGdGeLhpT&2aG&Xr=
zeP*$8op#0+7+HX}I@|R@(46H%r>^2+JJqWn|BUqgd}eFEe)I-kXUiF0M_qE#Z*dls
zHBLpGpN~0Ls4vZ}XX)ihW%~3PB6g7xRQC!fUM=!40FCH-Hc&&!I)8n;gByA4_TFm7
z%$FQzwvS#oT5Grppy-NJ?(z=^NC&J@^Cy+SjyP}n{)#YuwZs_ob-q1pgR<%*;kaiw
z^X0wm-cn|VE4oIj;SLiO;CV$#GCs`8h5?wGN{?38o5Q&<r6KjQhvUo!VvidB_9Omj
zFhbe%#6-<OY&UPgPT`%P0;id%p}U9U8|6^=I_J2Ob#<muwC9*H%AtHwREkHVFu*7i
z{r&W^t>?ksMV(DFUz=I{Eg>PHg_qNxhv#RzHs<$XRMZQ@v4ORmny_-{E1Kw$tY?qe
zb|*<b<MCG7T7TVnc{X6PrOqvURQ^YBOZtNMBVyizjuXC<PNjsZ{Tsccm8IiZ&T3{a
zr<@*ALF*5)U?N1Aln}d;S#IUYYF;wZjum_9G`T#Rgj#p}IqHEDo3CfW#5hBS#di4G
z8Lj!c84>K9&k1uqXN`*6?xCwj=Hti~J?RV2J_5WBAIhc{OX5DK=GG)h*Smps55}Ma
zb!Z|(j34BQai&rdw=bQobg9mT{!`Jx(^;V(m(N8f3E5@Dzxr}o<#?B%ktu`o+yx;t
z9CO!bP&U8BYErnZyF2K~Ng|AjPPBFxu}e@bpu5=wEb($lV(w{x;&|}s@w<N)HT*Lr
z({>){77M;ccr!X8THKi|)RAb@Oo2cBLH{`!i%@oEi!&0{`tWN#<bo5Q>ZtBnH@}Sc
z4dAqw<Fg_@PUmwY#?!=YBh+(#tU)6EbK0Yz`*|f>BA<dQlyB`ksd`;GVLLv_ckn4D
zG_HDRsIt)nHDBZ_)i$JSd0`A<ZQ6-=QVSXAq5H&!G)-->o`OTt6~>1`C$j`R0%rBt
zd&b<vhH&RFl@=JI`Sv^86Fs+y{9;(D;b+Z<J@TIIJhQ>rPe4`|`hOH$WYrOKU)3i`
zC0h{?6utLUTN{M#ytz@ag4WNIG|QOw{WySipXpY=KgrSvN8b?DOs<r85t4D1^-3~f
zm$_@goX^yw2rkSCT_C7kj?Fk;CCc+kEZ&;{ld+gbdir-wtW$czT}GFq)+AQv;V!{T
z&}#n9+%~Y(Ny^vuC8_joQiyJaz%EuW8HjQBob1YjdEpQqc!li=J0+d6c6daNe^m>E
ztNh*$8Y-F2tS=8=MS)Q2T5D+ArK>`=X^U?a#w^Q6P58h%ykpRp)&IcuLoxgpW?0U{
z`pI$Yev?bC788^2VX)ff9m;M79vn3I5?QE{b(H1t`B{|i2E_T|x%lB@uh6gx#{dX5
z7HW3!7->hBc{KY6g>P1`TrBAiZMu7GpB8vTRv^r3=Ie$j<g0XzgXL^gKGKcW1n=MR
zd=S(BeMKo#CM>?0eHI#nxzY1=aDnQ|=<HyrSx{PLdebDjY@y-Jo7CrR($?1$Vg<6X
zEkeDRxlM1uc3NvCe(S3*xOyOWG|LeVE1${zBI7#ehvun99_9Nn9D+b@+-#)&$_{7m
zL3XDtFv7}`@IZT77`!1W<1Wj<m`3)rwMBLY3eaxBpn=@GqWAJ595HVity=amlL9}D
zN37JfvEc;ISlaEKw~fO3+Um~})v<}1Ed6f#m=<t;{m(}3>dLN7^rLSRVahSwA8IVl
zTsm(}Fy&c%UA(lfvw(71dM%=c#5ddTzEdPiZ}Eg*+np)Mix4^sKeju4CqTErx9zUy
zQ?qiMkSA4#s2ZF#!!QC(xa5^<J@;9c^C?e7!dT)neG4&z`eW204lkWpQ_q>P%-yvd
zyLnj}xOSK8WfgORyl`*c5DP6Pzcm`l(}~Elbix9n2=%qPL&Ewyb2`ulH<r%k>jjkx
zpcvGzuspu-&2Bfh06rZ0IELQ7uNJ??NplXW588QVcJwPj=%1_tLoA$}Uie+J{gHus
z#Zs-T-<DP|$SuG>p@H#V1l+PTfN5IW#S87a(~lp0U&2_?u(^aPu`G0x%$X)e>XqX{
zL+5-RT9tHosN@cpD_D#^tF|<X3)1Z%;MbT*9fhtf+m<~`rQ$^lYf2tp@O|oOZ<(bz
zAq?lkDO8%Q-*TWP3$1-sAJYfu$pM<SEPik&{PW6CdJGck@Il@cEm1AUSc{J>wHRkv
zSeuVKhDz93dyZVG6q=vUe9j#w%RiLY79qMVa$kL(lSdTF4VW{&Ia$&>ZDu2l785>Q
zgiYC9YHpu$U5j1cw0CZJA3!Lp)}q`nE#olon5=TsDWB*d&u-Y%VJU$->@_VCa4nOC
zbp?%M&JE9|cs+kQH>b{gHgFQ0{D8+dJQLJUj#-d<yC7)QD^GLhj48okzL(18=S|BZ
zs?>iD1FW3L>e@IB6SzP>{AAAfH<xO!j{7`(1XZ5ueT$@p@y^W#+xBqNH>(FR3q9^m
zWjf6J=Q12om$)I?`mf-n!cRoUD^ckWeVp@OSy@?4h<5@&TnC^)N28t!d8!E+5Ws~Q
zNu}>}eVL)$YVygITTd?A>ld?XO4aWtKX_~O^{)%_YyQHE<0l=)%vjmExWbhn2kM~x
zrXFs_m+{7sD4@EU2kj+70s{m8S{l5=XEkx}2q>6p1vXt4mpo`)2^g+$>k?>4s3h1;
zsz+@aD;e!GtiQ)u*Rr?J*##!pt`@Zb)Tf%8T}=Z>1GH&q=^0C@R$AUFF_izWU7cj|
zBYSBu;h8?#rn+-8X8aDPV6I!9#Ppj5TE`ltzVS8YwoZXM6gR#l=keDq!yw@aBda>u
zCzi!UXjrYItC(9<ok_FW?Z$lt3Ez(Xo;vdnzKFYzT(FCpD^GK0KkL65ElcsjQ3L2d
z3LK<76zq=7Nyl-dvPA|FCJdTr&?xczR+4PLYm%^dZOlQ<WJM+eBNN_!j59;Ra<qUo
z(M8`!<C+0s^z<Ps9(W~Vs)w<8QVE^B&=>k~MRSPxyK9_B=5hNbvBuM6_{xe716{eP
z$I@#-x?Dh4{v+x*z(_<j$6y_N(DC^hiq!X@|I8Wxn~o@9{7O2A=Pi6-yK~8a+Pco%
zB@wTpr$xK~*uAFiNbZJy(=#05{7_oxF^YvdH+bRJZJ)e3>*hGWf(<?!-BV2BM1+~z
zS|55IELC7_gnQB*O;Ffx(pXssNY6{{ws{dp?EoIVZ8EgqAZ~lRqArl7R>ENsIS)LJ
zart&nz^+m0&=m?u{}sz8Y~_UJLL@*7EPb2fdvERkx=R54FZ@obSQu281P)oQRv<k3
zvej6ZCMru-fxfW?ga;jODa5W?+GoG0-v<c;qc87HZ#GduM-F27O@rJy>VV~ta<DvE
zU6C&}K(@!iB4VJwQr<`|vRi)D{nbd}vs9#pgM&j1Nuu)tb>;M%v#YwN%BNf`;<7zJ
zpA+tqr=_P|y4|*VrH*KJae(>__4f2xD(-OLF}4G)Ll$7_2fPGO_`Wg=Ek6yDkGO+R
zqo1R=^*B1Bc%neZ>6;6U6u?>H#AuR`tq%J>{7$l~B`JD<2h`DZt>xoZD@m7c-*?%1
z;i~vpK9Ii{bdq)kbIP9wijcwOuLr>`z-3@^T`lsB2PdWvrdNG0{cBR03)UR(_3or&
zu5auixVN`=S3xI`^17xgy3$q733_>oC0Q%TTa;CR{%F+qVSDZh=xi+!F!8!y!4}Z{
z`8Lmzae>y0nt9sST>xYMlc8@Z5~w`?^8DU*Lz;h)RlW%YS9L-6IgHEUIAC6uHo+zP
zLtcpGcO|k+F@1hC7+8G{6Fa|8sJ1G5Pbhg&w7)lgA2*X(xw(|bBSG6|+zhd;Tdi#2
zPBANcc8!w1GwIGWA8s+MhYL|%0O8TKDsr|=&f6ANzuD-Pcsd$kpCs{;enr*Cc{0Tw
zhua(+E-~(RurvlUD8XxwAMWyZ?ueFEtd{IB+|G?Rp=oU-U*aO8b=i1un<|f$f7!^#
znJkiri>p}2rG(aaOd{J`ufbE8>2gR0BEHr}<U4*g5~J|^{Et|sxAHZ&kS~na3NZV#
z+}cxEdylEA|BtV4k7xSv_y0ub;!;UMs1%i4a?N$=rgG~hxy&usTvl!~%#u)vCAluQ
zF3A0U+ZZWga~<Zo5#}-s!^~{^z59I6@4xds|MZ7=csyqB*IuvZ^=e=37Z*3T*Zf_C
z8wdUej9diUM>G3z!YZfG(EZNPVKd+gmmx-(PKJ8s!e|X=PGoa_x&q%~Wg5*S8scjA
zthwS|3%;P0TU^r#cc8`b^UACPP=Q}0(O@bh_}fnV6CvsckxasX<(E;G*#1<|O5L<e
z|JU31sQE4J<u8Hm=Jy_V=YT|A&&WHPp>S9R|7DTms#l@~B~Evtv{fK$ubFg8SE6Dm
z=Dt0AF!ZXSb1r1&$3YbhVt3qibzNiX5usG#Kh8qQaNsTcMNIUP8EydH|8BX(zZ>gV
z!Aq$YmK2mNl>&uhKEWtyYsU^(4^{lVIi)U3L!5lL<PfS-{dBzEk?zT2d!)fuY5)Kc
znD&JjE(2k@uDMn&FPp$uWSv)`mS79Sh^3fnDa5dDHraM2Cq`ynT-Ja4Yod8YyRGci
zTUEC19Nu2wrxbyPP4j@HI$RRtQEZ(eu_BEeMvsFZH!A!FvG0v>sZ#p>wwrs%;<JyJ
zrFV+je>rde{?Qy;`GAW{t62Mzc0PRe6$BD0TKLS4_o}92lgFC+2U3amx}t;95t)nW
zXdB6yrPCu|TFQqHM^JUO1q}BwaN`*hX)P}mS|jtmL@AK}BF|fjwoX=7e-mj|Yu2vh
z+KID(b)X7*dyX|l%(6A++;vK<K(^Phgb<YJHt+JYb4k_O$w#q51~TxSOa+H<&9R}S
zm{PaY%hI9_4G}C_kct=)I|&@gOsKu)oA%LHK?-#s7)-u3EbrQK7|MzBZNF<b5%}?%
z-jI0*iBbi)1jTql^I?N5{7k!C3k{{4;uJnxp!orXQjkbn=+|gx@eKU)X%fWFuJ_!!
zW~I9l4F=h-#@j|4{^yaEe0Y3mmk=-<hjv0Z5Wzl8*tZ8_&$fplG$D`t)9NEx_oUh;
zkc$sRQbA_C6u7u2DKHwn4o#bc$9_~EJE^pOZaZ=yF#cdFqH8Z6tE)&h?GppTTyexe
z%nRmkLAov&?a1Ujht%z^SAP=d`Cd=2JH3Z)W7Rc3ksC)7$TruQNVG7t_RX%U{mQ7t
zWSg_cy&OyVUp}fLT*ONbV2JjiXR8YM??I_UX2(?QKlQG!9lLYJk<%&ys@g*on;-$+
zbT9R>_D<hS{0mqYzG)#B)u!37(Qh)#VbPH7iL3e(nKG@mKt<TcJqA-rCgKClY#_q<
z^67K+7kDU}W&(McAq5k6Di#;W#DaaPz}?sY*SmhBN2fRj0U$94gnP0;4#J?_XKU{F
zM3f)&J@0x*{(8Hs8Yxx`DVnV|AZR}f+g)o9N&uF<4xl4a)NAd41p_<r1yeKVP$#1f
z$GvE}eNCMU$**oYKMl;?T1d$2&B>33XTHw)nVZMM9kYQ-G)}>F=||e|-fPtSEKPW?
zW1<<}jQ9WGjTc}1g`so1<S8Z9PzP(81M2mgukWaAuN1JM7wxz96@)?F^~_Ip=g^QW
zd3PE2m!EmT7$((9{PxtiWq%zN{@I#hf=7@`7uh30z@5Kqt8zmL@vGCapZ!zaC8tBb
zbV5nnUM?@IU$JD)fzC|;b+JF(6smMZ`_z8SHA`;;8wQ8nxif?tcR(b5<0`9DAwC}r
zYu?p!kp7gLd+{RWd+6oJ+LazzpdxaXa_WVaj}0yv1$jzZow)4ARQ}L-p(iU5zK0GP
zeZeg9t1Y$ujYww|&Xicojd?dFRrwMs@N1ntD(_*4-Se^HY(+DaW|ESw_tOt_AD4I=
zZ=?sy-CQ$`PFIoVAKLq!R?)bBUd0ys`GYgiF{>lrmfx&@tFP}2$?JZu;cP~!xE%#}
zhcYZZA*2^F#fCQAYU;X6EnIl;!Cmj>U7Y9zOym0Ebe6;8haM|E9C=)_N}`s0xt%e+
z>{dv6)9hF*;tkaBsF)b)$!07}opqqnS8=*B$;^B~1w`6;bE1@In!{%Jf6K4CTcZil
zvlzhsULu~TbTH`(uhwLJ6KVOH#xC%HX9h3oNCf4j2(FRP(H-Rz@%gK3cRTsG7eA82
zxvih_lw7FAHSd>hrU$5((*v0mV(W9{gD#r|gA^qp>94JBsN~QvPCB<1xJn~jG`-J_
zp=!Q)CVqNVYh~FEnfm<A4RzY`Fk+~Ae0xy6qOBn?x6ir;j~gGwSjX$62_`Zhz1y--
zTzEMJCR^%XUdjCraB$`1;fP6Mjue9tczN3b5m028<fUD{*4EX96t|C=#sCk0L7n4s
z*P-iVoGK*KP+WzFB>TE#^Ep5)FFtnDKYFD!<rQ`I4X&|hTDdh0zqx@mPBjlT&}FLQ
zODhNyvNW6DtehOs<?-NE$?v9(VYAdx5usagg7gORleTx|Y26tSR3PNn5{O8b*0%A*
z0y98J*y0Q;1S8bQq@etO&!BeO>$}!j)5@un_;nsi7O->yq3VPq7mJsi*(^rw2m#l9
z__kZ~?!fm4v-w}*-_}^`nN_m9?s^qDj-)EKr9KDB7k&e^kIs0rf4k9?cJ98W7U((}
zT5kqy4u-q(QWSSoV-aJ%kIB)`2xi*#eQI#{d&*>_NJ+mVY~mKc_7Y=+%|Yw{YHs{u
z8W1fQO1lm8j4b~d4XV@LyUU!*+G;@ox&NIIEc@66b5JbD_s`EauA~}O*UqC7x&iqf
zlTBE{ivT4oP&2~m2nvp4BGY$z-v#}xp0xAt()_%f7OqeyuqS{7^oyMP8?FB-_|F^N
z3z8p8MF@Mzq~|~t&aigi&&~><QoD4_@1=;NH-MIWhV1lezjSf8GNVY@-sAkQ7~{W8
z``xa;Y;vG$Dl!>tA2}hV(e+-zv}{-O!GYrD--VJLGV;$zWN;v~DU9v^{AXBgiTS(V
zY7X8j^c0dvtzzBSLeS6Mkr!)!*O28#U8d5%m#&G9PTVX(0&?eC;^p66(9N{XS)$tR
zO5b|d5)EAJ?ZEqq)-)|oPhRr*K`^1B+Y!Rr5hGr%tC}gD``ZJ7_(k|#QW(oXuS;os
zXm1TUgm6-)4!6hmz6V0IOO*>$&vn3`$Ru?@OodYJ=>||F6mVz71p$EmK)ZMtYXaF%
z{m2P=6Dcz4AOrVsNn;1HKs!0lbC=44My#@ARrF{sBn|1=U^^Ds3E0E&ciT9QHw-^*
zrO!7RvX^jvgkosgtJ`t20JzhUSK0KjuoQiEqxXlreBE~90_4@=m+&VtGAb4z?)_J&
zWW>xAc&5{&C&fq4SK5Z;t38RBu1>)%$Y0~azsM$u+h-oV*Y0a9E#Dd~SYtE-gTd6+
zImRyQ)CY3O3j}H~Y66=RtNylv+YK-+7u4}0GJYt`_WDuV4MEW`vU#Eyzo81!BKW4S
z?9|zU(503H3Mqrp{JIdST)Jocny<tu0w~>6p`GPFS0?q%s^>}L4LnC#l@X-vGND*1
zbNT@(q+N!#Kx>lkLZ$z7{}#^ipDMH<C6VXY=jCq3C3w={$M027Hv}e)Mca!v^@y)J
zlr<0dc<^me_f|UW0da#})$kTsYoIjMwHwS`Dx~vMse#4iHp7pJ6TO&w`fXcSHpdvY
zI@Rtv%1Yqhfk`|YTJYn%X!?-mBy)GY7)13aXibQI@o6AbnT@5_bkt(#BBuoO71gok
zuBi?fm$Z&viYui{4IoAH6-Pl)0ec)uXwM?2eRcoGlXT(q<jd&^UEguC2tS@09MPc)
zA%Fakpj>Qw1Nduo79imOG3>h+A4-I6g_LZ(EcKqO?|x<#HuWM9Ovv&f70>;p15%;5
zdVk|mXvk9H*>+l?Ma)~lV2^6lEI6{Q$jalA-Xu_LY_T)`HRDhTEpqM^qW5M=+HUz<
zw^SNXIU5Ev-yIes;9DerK2A`!Z{C$d>YtW0wH`6&HP$>Cj#H|AXY<g>DW_|F7f7tT
znSnheI?abiFeacC)DpDst@6WEQ<RpOu-;PHYfs$|z&avi4(zU>IB$Yk-PWj=>-OrD
zZ&g2A#BlqHu)#*}os=(gFZe~#MFW=7s#!%LJ5Y=opkge?mMH&a&VUWNJMQL2;h#Mz
zuX#+27q2$&0tB_om``mr#C;ezBd?F4qUA-ee4YT78&~p+99))P=XtGL;FxNm!Szn+
zhM7=fD5EA;Ok5oIH+>w4-G7Z9<rUFCnPTU6`=?sSMLX3d!#YC0%dIz7@k5a1(Q3b$
z1mm_a^(g*9EU-Ww9_vdef70Fwo6E3rYe2jVpYveZTZ$}f<J^w_d;k1z|3obQMbyF3
zuoRt<%?bE3ZJ8yjfF}6?Fx$obHY7`FVY%X$YqW(|`gzegjSmphWaeYwJ&|p%Cscr-
zCA8h&wa7fG@;ec~oIdg*RH@L#(m2tT6MkO#d>?w#&68#rUPki8oTiI*sFuz?UH|n3
zNtMH*vi+AynHxpkK;&|bp)WcMv041dSuL-f+GZGBdt!9<O69G~ksDg*C3ma7>>aFW
zjfW5?eo#nC?UuO#^VRE398R@#leLYgocW_z8fzOA(>02FB7*!-TsuCV4Cs!p$1lo|
z=0tLvPNRU=o|3c)TAH`l@~Y-v3g`6M9+nu%KyLM1W;sjk%6M@NHCp<YM{APzTVT)C
zj)x<`OW)?&Zeuwq*9X|CUxZUwEA@jrg(LOi;Ir6WU6n`WK|8G?f+=#s2E&5JLu4jn
z-j{R&LJHTX6MDWRe~FmlRYBkFZhV#<#wC2p$89XYG2=mWM|G93Fg8n89|61+v>{}Y
z6RAtqL*`ttPbaFz{(%BW!Pci5_LKP?XRx#VK;9$d9oTIt5}M{;UYYjvkI5Y>i{691
zP4-uQ6MX0j(zD2aeaA~Vv9d>humm(W=kU#eZ)i~9dbbWe0I2Iz#+sATv?hkA2%3df
zxlQra&5-qlIoJ7RijxpwB7_j=H?0I6o$^4$gDB@DbpE)hEB0g6ShI{ZS?qOnJd5an
z*>>oI3mM)O9ZzZ88n?`ZuOGgx-g29>8OZ8sT77%zwJhlQtvOzorE84g>CaRIa}e5}
zN2_n?y8aGLKef%==Zn2SA*Kn^z5D>l25{dv@ywzqF2+J1p)IQ|O^ayH!^STU{|ENH
zaDI|!ruw+{5{>$7mHd>R@yLZ|4k%7PZH9+RW*FXR_^I|aq<Qze97cPp?utLud!mkm
z(Xxum={AFkcD_T&a`n8^m5Ge*@>t9|kTt(!-6USS@<<KN4e^yqcWN^BY~DRn+3l6Z
zA`-s+h@g=IKQLO&VmDL7PXO@N#%QXOJ@2K+G<bE%D0_ooLHQm+uY!4M19%O}2)MI2
zKq<Nckn8?NDsCQ_SlmCcD&B`efBr~1-uDlpEBsTM_10hn09m2OpS21looiewDCeR0
z`}?~BxuI`8ZEC&_KiC-FU2PTlkXcfC{~)wOFcq}$HE{;OuLL0%RW|@kw9`mH`e>?6
zeIHP28|#)<;tky#w8DX*6Rxq}-~Qv*bu4`GdtP)w(z}r81KPY&lB!rB3MjOjS&3xf
ziszpd3EZW0q1-vwx*t7{B?vg`rdyrpPQ7$Z-Xik^)S8QLIHU^l=*_<C$ec!kl-)A|
zlL1~pIvzOWecrmgQ8{<+b#Uqp9N9w-?)r_mxjaV96wuAh;)U1!3be9&9@S-7>hs2}
zLRQN=73Dg1L1+V-0dgdn5jdw}PB_bceO&H*<L8cKZ^_7PH6iF;<up|%8=}AJUPBak
z6GVc!qd#%1YrL)J_lQdq9T7eVEpnKDnn7sIysg{@`nGKUHkQi*fnN##Z`0}DuSI-3
z3XCY9Xy)Q@<XH#Y==T(pA=1>VSCZQ$8T`FgUkU%fz}ipHxj~xZVSxQU=6;a`rLayh
z(aF%9c`aHf#XS=-sC+315B9s2vTA_W@kb;Wvb#n2j*<PQHT||vWt>$qFv~?;exSjs
z4N8}Q?+jR(9r=1uuLNNyJ^so^*Y`ZzT+cd)9Oy3E-1s;%WXCm)vu3Jo>lVJ+P&IzW
z+XsNCR@~<pdeyaEelj-0f_UvcvlF44LW4eBI3wA=Th~mBR+fg>H0oxIGw#kC{WGzJ
z>oHUwi8BrIA{gkb!6bs_&gq49iHQTVJ9w;I^bQx#p4HZ=nOg{2sxmY%3tCz=kmLI4
z?oPF5{qCPtoC!~i<CFqbuHIeuGkuTPxVgFf?gNV?Zd7TAs&ZcnHntx85ajAHVQ%m}
z&wI3~xZZv6>Xw$#uk_z5ADiZ4-NuK^D+wZ!!EctTT7%Yme%x4pwZA5u8;JxTCPfMZ
zbf+XSA{(3h99ZEbxL}tdaR*$!fXti6_QqApd5i_u3O}d@gf~@QG*d{yuRj~1B$v?5
zk56&ipS2d>aezGJ5{2xWEw)ua2kH)V55_3UV>M1WcN7YU2=U>^1ax^=-w%$xU?zOq
zLyz!(JSRKU6}oB^qnXXd6IjE;5f+B5t0i?5Y|fRP=aiPW7wOSaU0Oa6q_HcpasI85
zykmIuF*#Xm-X6NravA4Mkn)Le4|ko#*VnpuPx#Chf2VaM_Pm-FA|a?}ZA<U&amxlK
zn@T%qiR=AN^3uZws9rxvZ?P=1)L0tv)_}2jLU(ya)HP2UTK3#?=NKQunvgVDM~@)2
zYLt}yMU31tp!HHoyo@occ+Ig1e@4b^50-+ey{PXCI%r|I^J0mc1z++@@<d&gD)<v|
zBQ|C9Na1NtQN;dj!mWa*w1CQkUGYWQ77sMNlI0|F%Zbe;lc3_%gYTelZq?J$%ToWE
zLGs0UIHksaM_?J(A%U3#6rq%KoFQEqts$M+n6OkSb6)xi;PqnS7cXhuQ%VGK8D#IS
z$POKN#oHGcui`jS<k~v8e88<<<5I-Bgx?>8WT&un|FuBq9=a~1`{ijp1G`+b@H!8<
z7LuhL8KNazthZ3f!(7NZorcaHwi1EVU<EV&$TFhks9wpcCdH-Id+4@lCx?NtHa4b1
zCIh^SwQs{hZtq86L9*32q%$leqyHFyG2<s)^kftro7{Uc*B1*(i00P~pVRWKOGNZn
zuh5wet|^0)Yrz?Aszau29P>z1+cbsD>UY2w{D`J=k{5SY(6pNq7Tg_RVgh|&PW7ul
z4zgo!3VJ<T_?;j(`+`^aeIUiS%2&}onT<5u`7OD9@bB3Ou!~ZMXBNpN!c=6NAYInD
zpdvOo!68HANp+^bt#^6UMUB!}!pX_UB2W*wMz3vTdo^M5IlS;C^-qRZ$i>azy?R|W
zWZ?YkopBjZe^@6m-1~wF2%kQ799dDZirG9R%+_B(oa@sT_vj74nDZ7H$E|aoplnMp
z+E?f6!?vel(7$}{ZoWTt?dmjVk3rLp_4A2)#?qFvb4iM5-5tpR(%0Lf=<^05T;`mt
z=lJDa_=j84&V0b<>YzaCxckXRV+A6*%fO45Gq~|sfcz&La(Eu-S_9wY9ak{_blk?!
zrg>MrNB>DB2_3cZm^w!wO9SM<`ch?2^ofnl6hPvFgwGqNpaBf_C&CZ|tg3!L_NPC;
z;gXjTbc7wo<f2~H08#z`PN%b5a1*V8`0x1YEu}qBh=V%b%A~f=yE)9#hscN5UJ1$4
z@Thb@ciY)ANfxgvTRL7oE&uy<g2?C%PUu8ZKkZ%Oa#_<GM)Nh~K|WFJ&TjAsEbrNe
z%V3XDmio*~6M>Og%~Vd+gCC4kuylYM`9Wxhru^g>UlFzH^XJp`lOMcXcZ}_OcfW}X
zy~io*8oQ4G(}S_jGs4Pvq~*w|h|o^W_NCc_YrhC5hOS_APM;rtE2j9Zv}2N!xPOPZ
z@>KLVg7Z%)W>&rqPVSyq+9<A>Kl#7`K@w(h^|ukzt^;iQyUYhjWCAx}6bC%)&twzd
zaB-z>V=z#drrc*k-9G-?DQ<xFvuh>1y;th=%JTe1o@w@mQY|cPUh^79-9rDO&uCS@
zbq(Rk7l{ssFxXpZ;y=@CNRpK<k;-Imo{EYwM!pU{>9jrZWwvi^D%3Vc#xHvuN-TTL
zy3K1k#9WZ&^c)N38q~hgRp<wh6|X~Kk3PD<OFr@VlgFjyq*S?n0MDlj0C_HS{#TFp
z(3=G5oESsSu7A^saQy8c|HWbvwQclwTKGwEhfBlel7Ut(FM?f%26<E(#>G`3>UaSj
z3ViN|nYQ3Zb$sM0PB$&MRtFmz0J@-ot_VCRcJw&FK(Dr***V#<hdZKI_DVZFDd~L1
z)`+@>g{&c<u6Neq41ZZ_J(VNj){G!AE^m3%hX!8`k{|9q5&qa+!k?CL*ww@K5(}N>
z(qj-*{)?aZ-D7N~)Yej1#pWUK%dJYSy<Wooe6CzKpT2lo-C}1ua#jovz|t}E*xSpw
zeg6|HQov{T0+URQ2EWIkC~YSALX02r*zi(;8H#d?ATM_CYT;r7F?xL*x%g2eRkmq7
z_N=(*nldHHN0PZh-Hn*n9f?CX*>3z~OLe?qX$O2+Cpi3CU(ch?<Y8mK<?a7Ws|Py2
zlPt_A!HEX;fXvf<7^df)tPE|!4Dk<SIRf~{MS6*9mlkN@AVgZb3vIv7vn<EM<P|&k
zuCsMcEAYm{P>0AE&AWQTp3mmsj0pwFSJF#=xxs&Fz?sJ_m~=jN1x`6uqD)FDpZ-_6
zAe0(M^bB%BG*|L}eHu*z&cl<Gr$8!kA^;A_IX8j!X*x$ku1B&<(JKwTM}7POWvYs#
zs<dLS;iKkVVB#qQIvbz-i`*ABo^7t045(yt*w4ep+X_+9n@)SX-qUCwBvi?{W>VIe
z;Bth2j+22KfNNWMU@iz~#BKm3xKDZAA(*wBC{Nwvsih*vJyyetc0A!4tU!Py!aX$0
z`=y(lo@QI=q|kr1GPB(9Ns0YVbWE&D({Nn$PI|Q-33yW+dc&{AA~#L;M9W<Gt$j#o
zUXP?JxxL$|Sh{`Z5G!LM=UPmDy9wx^KL!8hv0;+&ZVQ=c=Wlk75O!m$gZwDt@8SAb
zzb+i01~@f_+r5ccefaU~<l{LRT%%OSW=xY(HXs<~ST2`gmEAL8x$IqjP$efuhhOmc
zNr0;rO8NqMc9|WZg1%ivSExGqe|W{d)&an|gR}%?({O9&mqSvAs_dCCXTO|JFgv$r
z6=48s-jrs0A~4goZZg)@nU`X#aLO^9$X<5S7~W~rcJM>J8%3~-p+3nz88C{cLPuO=
zX$8(Rd*ekc=BJH#2HBwmGc&G6^}5)3uYI#TZ5#<SyWEVgJ6rV*_so~KKkuW^Eh3*L
zf$8ZEyFKs{_Y0?r4H)qop-n!yI+kv@DdtHo@$ncJ@}Mv{;&z_KgU+K;Dx;4rGA4WM
zIDdY&yD%n#{0c`n&*eiK`Te}Mc9G<)BZr%%%CjL~EkMBIpK^(ZVgk&EnxJANzl?xh
ztxtw8@1R-qj-z`d2OVt0)upj(?X@I+k3}8x=h$!=<ZzuoPJH0`LP%3$V$W*)g0CL!
zT#v;GTT0w=scFcAl18U|C3>`%N=oHU=8+2^(hE>)7-se*{X>Eir(WElQbc^dMy3H#
zcjCE6%ImHj_3^C0o3iyzy<$1cBx|dKw>4UK57E=8UWTD9zMWFE-${|t!yS<&4UhRh
z!EbsbbPg#!yzAJU<z%R;==`w90ZzSgdg5(T;WvU2c=_|rYFn%YNYbW@+&%9e(0|Y(
z{im}|4zrJcm+F0M>}WB*AoY=g8eT=?9#?XnFz%9KflL6C_}b7-f0!|aJc<891-@38
z<e3eW&|Z2u6A6cB5bq?q+RO5I*@7+X+Y7^ldi+5J4-6eiE~yNta<d)1e5@p(*-XT&
zMs&!;Li8LNCw{J!?!Y<YV6PdmHoD+EhFV%DGM;+3ZzB1-XdbzqfObOTHK*FTA>Q{{
z<EP&52`8|SWRwp}&feBmek^Px<VMk-gR6{AxW|>{gQ-MGAlBak&@JG8cc#R{0cyHp
z%ojb99nz&My#z$mKUM!G5ZN%{*T+KvN{M9-XRjm&vLCl3;*ymT&9vTR!KN5w1adfK
z{Ut7xv7)4cS$#PcaGeX#rXK)x{w3#hsW-<|OIudca||9a0O%){f54b3tUG^_xjl`<
z;rsEE4q<CR1<CqWM|Iv|#j~oPjVjY4^dAuckpvUi3Y@!21_HWHmWoKuNAiw#w=b3e
zts<!q_1?g$cfb)@jb8*v+bn#D@2%!tpl|MrTRZe0;CK=_uHk(=Jo|T7Y+!diQ&isc
zy?XaPZhLHSR*X|?^c%zZLrd`>PH>t&%<ox+G*MxGTAG@#IN1M&y|XF0*{^JaO1V{C
zc)^i`D4~`UwY{%X0g$Vv_Y%Dp#d!fUK#bc;y>#`^D;7E6A&$R7O9m=h3g*Xns|Zai
zU#Q0}K0b-^ZTK#g1PF79hKG&_Hi#%S{~zMp^A{#pmWj!N^k3LyU^yJJ?lPz`OPQ#(
zNQ9VXV}cyGb{F;XwBHNJ;A^H^KmfBr2$#L{X1^}Em-V5=Z=w#T?8{3bzm-+xcDjfj
zH5fklcId^p5pUzq2em?2t2T?^?qd>4k(FaZNme2W=OK-9k^$^~|LJj;=Yg-2TEOB1
zY?41#?u<6H7z|li;zs>Zo_0+|xQ_~=8f~o>!#5Jt7JW-OHHXNuO59c7#@WB;*#LtS
zW~3W1j29krWUDti!dcnPo1{n{T{;rP{U8^=rnW3{nHnGwuz5BpW1Ry?B6bf|HhLKK
zZ#lhCCbj;f^_Uwu+_G~mS{OKD8Kj$_Kk=vf>2=Tkfx|d-F2`8dVDUQIL;z}dMFu{f
zsfK2(aSanIyV2w3pjw1O{Z>J2=S5MUmmu|>7J+4zxC$KUNg!1$Ei{8bqJMaBR<0ET
zLNmE>^(Mjw+b3&1$9ez)54>eKEKEfmiXML!=n)QV99NHYse(cVmi-12VxnuP{Dv8u
z-#$IBVZfFU6i>D7bd!mq*G0=>6Qy@g-Q(YtpnSm#n^o+g6PyL`;;2-r10q8Kw5wr7
zLG_T~PcW|>L(CCsa-T43TZb7P(-wwaxW@V2%2@!bKj<Sjbj5Wn_wnqbppZ`YR0mXT
zx630tAGLjMse+i1noC1hwkJVR>jJ-7F^aLj|D&edcjm$*ch78ewd^u^Q4=PA@M(f~
z)x8IvpC-=rnGJNz0*eK}h11mScqw2v82j)FUuU{W%Iog9v5qE~s6e#(ZSJ;Jf>1Ko
zGd#iCO58?8s2>yF!__$8nua_#{BC^h!~R!XW8#`_t&+4}&Vy^Bmuc*M=}#&K$(rYh
zO0GM(VdyeyO1GK;LPB>ijtHD1HXxx?EO5xoc4?Cb`d+U9-Si2ku0`J}nzZTiHgNvA
z50zlx{Hs5~qveZ1=+;Loht2SRjBVWkHQQfN+fCG2fFer)$Q1oW{fzuQD?ls4fi8x-
zk+9i@kjFoD{4b5EfB5zp15-(GGR0n!Q$DBipt6z+09Tybhg&7Ri}rkJQMPG*TERnM
zM^v<g%-0!S&Jnr$&|MqB36uH?oFrMX{2u`^)7T~TUtW#Q8G4+Pe;nD0ADj&9N~B8P
z{+$wG7=Lr>F_p1;w?QI)vRoJL|EdZ8Bk(Wt-t~~y#)cEkxAPWOFSVZ#tp@kOI7JlQ
z%mQ$Dc#}tHHbgbwl(Gvj^Tf%mIIYoh*Cl9O`+=Tj`}~P;pgnW;{WaloDswEtV;QNq
z3kaGHy1qjKNK}?BvFT}YNY^78ZKL?q-?}M}4^4yDd-T|*zL>SPoCU%EPL{pz{7aTm
zhon&GVR>E*$vu7^jUH=R@WnXOT|0<ctzjXoXT6~z=+!bCdw??&ibqmH+!*-3?8e<D
z7qgsU&f?WR0RBI|we`h$Gq#pHwjA=J_(N9#C%2=(H{){(g4>Gh;C&)fjT4dfEB@ry
zzdwkH<0qYjn8SO_$+^?X@*~fp(@LNWu#P>q6e~Xbg7N87+xn&g;cELY*URLmv0W~U
zAH~C{_0v<EXq4%Szo|TQ`7eNUdw1xEFSlI>gj;K5jV!RumjNChR2IOZy8cmD=}@W-
z-9xgn^UJjJ=J9FWe0!1m5?2DyLkJffY^#Ht2!OM{{)2cMt{g>4J5V_b?`ps1bZnKB
zOlJn$tYAW`z;nOcO}CifptsiH+m~N|`h!#DvQr3W71eRcbGum~JA4v0=}w%8gj!sm
z{H;-J(+)?20q9^-YRTM%sua`X+M`3-qa3r;?U#aR|BuCUgI0Fu=CTMX5A9(bT$fZk
zV|j^h*sFPWSb(;l+0ZknP2N4Jka4Lw86umjYTezs85gicr2WA0OZcno3*XU`XCcOF
z+zg<k>m{{8;LIh`f+|`_C^c)NKk*xjss!Dfw4JFwZ?E>fR>45=UsOD-xaSGd;^UND
z`>>k#YH&*A)y<92r~FK+09dA+W2_EJs_a4kDA98pkoKE7ED%HK$zT=EGrwox3~6L8
zx9gKwNVa2@H6ve6c)yQT3VQo3^}6gz@5&d3yb0=&(lxq|YWPCE>gcC~;I8^fc+(F<
zGFR0&WJ_nPM0PxUgxzr3nO(sOy!A7T8(v3$P|Kb9IfvJo{bf6E%O|X}{o+3I_jF2T
zrZ35(*RTo{5@up*yTy5joMomcbhuYG9WdDU1e(2JQI@e<tDYG-q#n)+XEsa8jphmx
zw4!=ctSl0kO*IRO1T8+eT<!GGL6%hj=g%*bW&20}`ZkyHSPzRQuqIY_jEo{Qd`2Iu
zsrUPwOmSQB2b4Jy+%hS0?;TF%vo~P|EMxS}k0|bF_*jjS*%o;yD7a@LXt?*Y*JcQ=
zOHur7EM~Idm=qvXe2TOIGq22UXn-5MqcTRbjnZLfO)hV%mYw^uZ$L7FCy@^dp!PL}
zLS|ayxn}-P%_j11{o>noNYPztn<#72yb*IS_O0vYVzm~pAI@wMYCHQMFY+(s<H6!7
zK0LMhcAcr-V_g8FI&1f$!G1l%Lk-8!Z9eFRU1nB0^Uh9$cuuWjHZg0WrmLYnY)qgA
zVfRd;HOc;5u4eE5&jJ7^+dJ>zpnKK~w)(PRD%7p7)_iIU^xfAxz*lYKhO>Iji&91<
zRk?tEv;)x3olifjGYlvV%s)pY`E(&$9OroQr}>(JVF{E^H!g3zoUMN@bR{ln!LHKM
zYiRND#DCbeBjNW+dbxcm@#2C7UJo@K!+W!hwx%NHZO2x>8zEiz@LocS)74X<$L%YB
z+c{XIYjhai%`w7AzP3;B#iw5K>$~BqzV~5ZbC}v<{i!{4Kmt`f9!LaVdXo!SWPo<z
zH@b+0{%?T59G6cIa9%YNS*u|E)kgv6;_mgv5-i}0`Rm2=jt-S(K>K7auk~1bb3z>3
ztnAiRT;VlX+bRT<PjmP*IlZO3Yh-fzc~W)Z8-R74TLKh#73iaij`moqszxF(_A!}q
zJMa6xAVav9#*`oL7~`;0(NbRlixj6r@V|$}zW4h(Kv6>!v(XURWt&$nVrIlwex4M!
zO#o~M`q)a(6no}=O#KHclnHHF(bW&NyjK5oMz_BB`F7h5^w(*SFX_rn`-!`6xgCjr
z_+Ue$NmDxuK8%lTU|Q{^6X~u^7Z~k)CS!thNYhawbyO<4L$MUb$ZO-0;eL}G*66Io
z0yH9Q&GpaiX77_rd4#L1d-AQYchj>yotzb^9^5f$-Qi{KM&kYx0HB$-namZIIX;T)
z6G0wyEoxe(P-kaI?NK#S0T|dYSZ%F7W%*LD%f>#PrOECbzg;7o$OOnP{xW`CL}PO)
z@D75x#ghGH_-r*AHhD!<uq_{p2$2OYF%gIE_okvRXjz~s2~kx9>z1v!kg#C^HRmvW
z6T_JysC=dAkl;Hq?J`PGGVDQqQw!Z*)}!~uljR+Ty2S6&MvcD%Q8Bsnqj?6hhB_)p
zmv=OL%psD)RTMH-fY0k%ku#IeT4ssS6>UAibC#aO5;Oefy6JuDgsy}DVMLIwl2&_9
zN}x8QuvF?P4~1MsCui;gB<bw2!}P#<<95*5R@xd5r9J)PdW^?0W`D>rag?^viO~D=
zO1zxu-F64Wh$D=_{}KR0=yA4H`;r{IWeP5@r#3glr2GFIpdmr{hB=4B7Z`*EH!!^{
zW~^jOrNQ~`IY-VDQB`t7b$y<ljS76Y#X#Rl9WU!77{)5b!5PyQ{q&j2<t6~Ir<yt<
z#Fng{>2aPTqM7%gLe-FGt3A*$ku7m$yNh`lflj}#DHe~+FoxmcBLJd~zm$GFysQma
z7RJ(u4r%Acd@2JaVkWmNbZ}K>4iC$G0Q$VeuOKAs-UR_X)oWQ?$=)r&CUptD!<TQQ
z(t-$a1gpNIQmftuIKWwnVLq8{x4(`(VPu>c<eA&NzP*;`@XfU_&b58H=7Q)U?tuS;
zuf6)I+2Gm|FrJsEJkspQrGgIE4KZm85a?IoOC5)9!!Pb;k79h}-oJ1D<Ur}*x`lhD
z_>ex=e;Q`5z8ZRxGpaZ#@_}g6;0QxFAiR~dA@}+YrfN|Zyx{AlO+hQhfdvBitgt!1
z(0yG*B$0>>dW=YI@6qRy6a8J<yVS3%<H%cAOTc9I^Vz626T}>?%rn=Hj4sazW0};e
zL5<37e{SK5tZYh+4E$VJUHvyI@yK8$qMh-LqDLWM%aACD`CZyh=VmL;(9fQ*dP`G8
z=wHj}M)*&DZFYx3)@%MYuYX`wfD4CRDk!B@gumG33kRg+Cd3l(YzCBcUfn_A`oUDB
zIL6NYWHIQ;^D3bo^{1uQm2LWW#m4N^Wxb-AkHLTqX4-W!zB=xDuFB)G=H25EaT|@a
zJ#=ZkAVAs1QmQJRY(7B$*(8H4SXp0RcLAhPe+{lbC&FQ4(txkn;}EPY7TRqID7e+A
ze<$8-hJT+SA{-Tr<ztL`sn8?YvAut04T?U~HJ{W`eVdqWeRz7GZkJn$$n}A!ZrRHm
zK&mxb8|eKz-0}v17Og#*%YX{|*sGHi`s1Xu&4mH>0PPXTk4HCjebRYwGfwjC-=i7j
z!rFmnLxlPqL;nw{<$cS)`t^80x`cf64?bL>6(xwoCjY1}1k#zz30HzM>?<yty+vGl
za}c4}*HMG3@7;R`RRW+#t}mA~O&ZOKB~vo&vyGc8{n?wDpP!!yVPU)}?kQ`-zd{?<
z96|b^K0!Lni`cOzCQ!unW#(4f!Ty}q+*}!<nX95pEML!{rKwus1g)IZrd4)W?Tuw^
z@8MfpBmTs@Y;bQlOoGDD+diI{JroN~-RyhlFH-$xA{-+~w=iHkpBoOIoE87g$J;%y
zDqd-CjWsE0Fein(H>Am}<3&Yqq|jwIoRzzfB)K*=#kJ9v*gC@r^-V+^Q~IE6{K+u|
zyYYFC-$E4IBn4?7z8!3777gQu%hr*b*0+a&gaA<g)Ya)LK=eyA%)pRix)$OH9fKKn
zc&B>G>|+kexU>D+0kINee|vPd1JsV4HXc|H?rN|Wsyr<tUr#6s{cNor%sH#x8uo`3
z7&%h9atS2s3!0c~&vFVMc%9?tT`T9DiBRTc`6W8;d<>r(tJTc!yJRe_?EY!gWNXAr
zgq71bt1H`g?U=I7#TEeW4s!c5EpjIhzIATGerc<Vrn@`DO|SW$<XcnaA9`d(`)R5V
z>0-H8+Vu1yZ4<{06F@?qu|IYL)^9C~M<sSoB-f)q5H6eSrp;;||G{^?uIVW&Mj8QQ
zYm?JXalF?<mm0o+zk$bAjRszXEZf~}bju*l?&5~|K5V!TF4{4td-(PPOIxPAo;S7{
z{yV#@>{e!oZ^cco(M{->kMT$-6e0_b*o)WOzq4=P9gtwGIh~0wZg>Hkh?d#{Y_(->
z={;cElj%Oz2yY<w$J{OHY2e6zW(1?&{~L7kQ2|)%&;)7<+`JHIvQW1`&IcYbyXIXR
zb-A#qc`!M6nlgJn$2X=+ZDz+_*)hBru%VNVO&?oLq2+oadiMiF=L2z7tky%34EMsB
z!W47=48@)};?N7GCn2}PDMng;md_c@e#Qn$*V1FRwJK;$tj;3q%JG@k;i`^SAZ(nZ
z=G(_@pd*6)n>~an5NG?^Ukqz<rgs~tggzxIpPE-|rVSzKk320bzDj?|YY?&l(A1HH
ziC|ztXeKfM+4cOR(h6V|js0d>xEdG)YwxJek-8rNh`Gm`?wuTJAS1Yq@Ve7OyFzIt
zB6~fe*CALTZW;N#UqFTnKVAWyDFtK;kaTLjN7OuXM)o=fNSo%yKDOSCggEvV?d-tb
zR%3jfn_ukF@?tNIRL%m}7qZ+kVG?!HSvi$QeT$4h^u@$i5jY4AJxiz{&~h)HMV8EN
zhcMS?x3K#ke!Z%BSe3TONa={qX<_Y@MPUg7mVe-o?G)GlL-8~!4<JbjdaW4wA*D|S
z_Ul*~@dH6tvG11CN8hcbJK4v?Qqs>veIqPinMC50v#J?wK?WJcE$ca(H6zAv!<lxH
z%ZS>q)qp$mETsuUQUUTZ$dk{-i|heQNIBBt{b4!TDovs*8ODa)wou<MZf4-Cnbw;X
zJZjRfzGakHjjrq%1xM^8rA*l|{LOqzmg>oegIGK60IHN`mKvAJZO5sC0!Ib>*2E&0
zLkt?A>ej<CKLe;COC32^?BORJ>B6WROEI8U&YU{=(*700_bu0aD_yZ`i`PeLriTvW
z+Vu=A6P&_3K78|Q&awAX>gr`<8F{zT-?YE0nQ(%R%UPty2viYbB+d0(_Ht7)L9@)f
zJHV`1gUvGAT~nmHY(MkPIRQgyaSb@;Iy&4xd1bsrY+$f`F1`#btl5EM<&aXja<XzI
zN8Z!&V~>v-Kp+NTKMz_lLa(Xe$<G<QYAbK@l$L*qZ=@(HUmDtj?2cgpe3b+xh7?k3
z8oYHDz0!M%*!f){ZSP>jwA2agrm(}<(cmx5+)AkIs^uV5wjJ?)FVCr0LKQ~WwLYs|
zzj61_p}k_?{}kBR7Jso}4UCT36j#^4b&D;t8fpViU$~Hc?((xKN4ZeQty@>MdbkWM
zGwT!j18T-?U8m`{HMf#9H;$5`F?P-8g9`mI=2od>v`TCAK2%=rt^4<13blGUUfjqE
z-D7#?B6s*f>F}>7Ld`72KB}5%ds@5R!)vvp53@M=bvpq?D3t#5swyACouH*rIY?t=
zv#lv@6{QhgrCq{XzL%oyJ^pm%vm&6mN8J&CYur#;&R2CXvA`d0u!S+16|U5v&<!7(
z+7FcPU8nCHN=5#@Kc}#BEi=anrk$DPa4zJ*N79L*2FsbJ!+|oVqj{ep9uha3F;-3_
z>B{gI8em?OA5m|F*Aq&AE}u_$j)-ECvF}~yjGxXqltEG^572Ec*`xcD31(x>n9?5@
z@Hr11AJ>(m)ruDu1Pl+S6k%)lDS!PwX{t^yF<cHy%?*DX8vJdmM`!K?3=kdppjsjY
zjD_@K_$itJsE;3y22R*4*k2pzYpA&T%gP@1O&>6C20a(rU@2C{l=uTl3!hI7dVpcP
z^lz4<$eOsvxiQf<3e{8*%-Iy2sD=LFz*^3F3ih>O@k#p$pcrylNc>w=8LqOp-~isL
zJv=$k2d$vHZP3|388=hnxbC)ww8oO&AN~$_*(yC=jF3G~+VTELTG0627)X8OIdpN|
z9n)EamQUW4a!cdt6d+iZUlk#a;hT$te)vo6dwuSJ6stY@uBxf2Ed?|_cLGL>kx!@O
z_l{=Fm^NH#o_3niv<h^X4=beAG5@DY=6|z`=9}=Wpy6FvmachGfg-fs&WEYkKHw#p
zDVc&I?%L;h=84T!cZNj{{LBXXIWb?w1F4vmXU3E@E|*dXv%vrKH{-tb9yNRiAc{_g
z{UJoi@R>Pq@HZ<kCnA)4#@%DJwhqN0@zig%*)9)z=EZ-ES>eW_#2%2BBOj$A=HkRp
zE7N~Z_x#S{>_GG&yLE&a2L!s^tJZH&GR=?U8noLlF^7YM2UcoBQaa9L`n4T}?6yMP
zZ=?66{Q!8Siz)W7Mjv7hTn~omR&=`Yp=o>FtA2jn%LfG_1Ii9{NK<hUnL59s7V36#
z?~+gcyNH9PNz0{8HqN$6w!22d3?}F8DtBj0)@8S@?=UfVNJqRQy;^Ds(@Xzz>{ie3
zkA3c$(-~M;rNh2)!Mo$x7rDFwrh)7SX3eC4zHS<ke3AZ=Vg-KwX57!e`FpVFy-*OR
zLuq|wS7dotgwpi%z_nWB=+<5HctM$vh75!^&3=6cXTe`RD5WbCzT~O5%w1tszSHR%
zubZN7gf`lS2c}@QZk{a77NZy=59l8r)zo|Phgku`Y1J=%rq3dLo6M7y9L`#&rR6q*
zW&2FQo?zGH#;si2#ypL%?aca{W63l2PwI~)UvxN6P_FA=A<d@Poy6|^iZepnq`?o`
zBtT}qyW77<bGAkFep#k6y5cX-V^^>m+8JN9O!j-_S@=8?qhM_`dQjY<PmGziEcR$T
zHT2gKF*9*5{S~smp|eRlsb-}UKUVFP1=g2gR`OGR422386pz(BscppNxW+!D%a5Ea
z`hi(_eXs)^4h!mzA}byVgIX>qR(Qj<`l^df9qoy0OR<$_iI{Rv?VW*~{x6~8dQ0Iy
zkEBAi#jBo9+|SJvv)#rQV|7`3DTNPEK1pZGU{v8W2C2Pfq<Ie<{{*>n!|qjc*!AR)
zOMUFc4MyN&u4fdiQ4hx5<KOPjn-JfmfEtL6RB1P=0~JiKMSMGfiVG#sfbStBi9N1`
z+CSABdyII+PvI4#G&VPQdO~)q4yMjZ@+bFYS&)Y99{HaC7;3-&)ly(Og4NR6@UnG1
z_IvIRjCd;1hfkL{w0SKrCZ4#}90usF0UP1O!SfAl<N#v1nh2EiHp|jy_v5Jzoeu_e
z1IBDxz=cnZsa0xg5CqFs&z7vcfe^ew<rk7X1DFNPsz&aUfTKKomDg5UXYqids$5lP
zZOP{gymZ9wwCrpOR`8+b>nb#$f==9|60I&DJ<-q&$hyr}u%Nr_QvsP$G{6p=zr0`J
zlVjmGFOZFuWdtA~?0LJFf@`2uJ>>$vWjVj3Kzir*yvz#+k6qkn`$)0fB2!<-JETaI
z(w(6Q@YHeDuwvhoCmeh4{xhqfWVyyixJo)O<Tpnh0B#<<4D2k+i4s?9*S^TIZ^?wr
zpVF%@%JX=oTsU2QO0|@gLz{(?V0pr$jE&v`dJsS8zw2=Fd4Yk$4qCPuqoJ=IINo0T
z{uytg*u}@|bu*>#&H|6)q$o<@Oa94NHF~3G)R=Ho6ouY2J{PsDdAu}3`AY`2Gpx_3
zGE?~4*M&639V4fE<MD-z<||Y3#hL6CTa}n%#;g^2wIH8rC?p$#(chfMMvl%>W^t?c
zL@`&kWW%8-QxMee`rNgVn6I}9@<urH1;+XFX0uEMnU7D92J#*pU8!O04_hvlyJoCI
ze@DP<mOkDD-*)8u@LWfYaTGk5Uf$<Ib5@#6Gc=4i!Hm+geS3W-0uy|B`mF3XMVUb(
z2gWG5RKyt~7#^ifu2xhdM_F8E@z_RjUQG+&Qet_@p=9TmgCLDl&xy*(oTwD`tz)4P
zOuqi#N1N#?jH>U$T)hX<wt7N%i{skz9^oe~PaWB(#GR-iOmftbBo!sIYM3^+tYdfF
zb%-AD+;!#FTo0hl9=btEl{&V|%At-xc<G``T09X<YzP%P#%$Y5$#d{a^7#_MbU2>a
zyLnwwWG{txjuKg~ZYKX7J}_J1;~4&K;-;)<YS!lZ10&YjSD|MD7rQ}_iruO1F$`1w
zpR<T<I%sw+kL#5}l$A`CRbM;`36;|F0hE*Hc}MwpCZ{p86VGo_A!@kzO(i|ppUaTO
zgm}FG1LDNS!8DfdWau9eawvEd)r_%SIZv*BmQ{bOTZ4FYejR7($QeIaQpPHYV2+t;
zhSr9;#w!K@zzY^yWIu<Jf{as_qVi;uPermqS>LsJ47O$}NpY8U!dEvxLmQbRl>H--
zF&Vzddx-Ji36a^52j582dDI>h_6q+dP0?qpIw_1!(!euF0Z14m-Hn9WZJ$cUsnN{N
zQyM$stXvVqlE$see-c22L(O6K;Ss<)-QkF+=$T^JTcI{D4`5f)Gno~_qsuVLh+p64
z>IXj-(yr1)+cKW6G<({XxZ=i!Wm6%aK3$ZHk+q^+(3KwS9zT^dUp?07o>lBSQTJR9
zk}h>lQ8f$F-A?G~sp#5|*VEkD_fcteVl-}js@-8U8hB8*3Xn>6ckPi~e6!bB3li4%
zfec_km!%;)U_z>;elf0k;)i(HKFw=V<@2z8V}Y?$i&_)t-fYcgU!M;Nx_V9Bjnlhz
zmW=Q>db>eQKc}cA_8WXkjKZc?7FJSwbFSoZE1OBK9$GG6HiPz9Nsy{9?C<xAVj4=O
zY8$aYjmct1%ZNi$V~W;T-*!GG*FTW{A<2sV{t+K{jLd`h8SOi2nMz!cyn9hGHNT~I
z0u43!ax<dm7VyG&O@bq7eY(Yl6M!S*b*1LMf{0#^3E*z>ZXNUu=W^JtzzO54kzd+g
z4yD=CnL6vNTfh>vNa4velDZ(%_qKPIEm$(RjSi$9t7<3^#FyIEn#UXN%x5o0#p|y&
z^ZIpZ5?`4sGwL28hfoTi14F_y!*@K>G(0~*rz7p9Y?%5sR${=!8~u0Ug)}w+jO11u
z@|L~gqaxKofz#yF{AHE;nIkYjS^neLV8JF3_ETi_OTWnI<NlD!Uw}|t=F*I`Yl01E
zgd5T)rT3`V#&QZCe^wO%<UDi&DuQLLa5mN9uSi|2rtxpU$IW-gr_6{9Ho)qiUural
zT>Ts1_}4>YZ!4W&(u^_eyIxBEd&qs(R*4F7|MWZ>1DI`s)`3`=GlX2TgFZhl|Myga
zz^l#hT8BX~im2(S@@xK(kFC}wXUm}l#mchhkJ5S%JVITK$|cl{)-SHx+%v2qtYW%}
zy%_#A@Yn$ESUT`=<Uv1xL@)l4G-ofDB79Ht#JHlFzE1}it1Eu){arm;L#-;HM>5zq
zLIP-u@-R3e>UqXx_~?jVAK%<<q%YWK(&pN-NZKM97PCGx%QgH17ys@vVK`qFB)L8K
zcCpKJbKxxRQO5*g2Q8jVY-Wgxkfo}2NpRNeSAzVAtANOo`^#R$r5i0a!_V2}ef&8p
zt8JPa>`0vZt-LR~zehKvW_l2;TB~nh<l3Nkrs^*|58o$D)LQ`_qpd6F#=1gj#o}Fz
z?-}DBrf|f!WndpAer}v|2uRX#@LCGmY>ROq`F+_~8En<x3_<F%$8l<`3}_=fWI8GD
zE8|iN*-Ve?A;zKJiDJ4cKI*6^qkrfPNtK{GkNU`XcCX!p`ES`V9jDq!`qKM~Rk7|g
zLkS(-yFX0<qyMHm(In4Yy3xB(9=zd(OjhduaRFuJW<8NoP^9WG0w=Iz2Q0t-*oCa@
ze%WPwyV3;xStdHOBkOS9AT%KH8>Nx*CeQvO@)(@rbBCO`D@F-yJE+q0!GXMHT-r5o
zd)jq}`QYn=_Af5Wqk-$|_>s>^^X-|J?yP8Q4|!OnG2|iFp3CG{icu;n{b#Q17~MAa
z^<Gi-@Wvhz5yG)}bvaXy1;N!D)BKFYQ;|DAD{ehTE$8xZ#{9+a1U^h-2vAU(7D)>a
z+M|{&T;)HCr4rj?Fzcfy(EEAlNeONva%PSl6@%-){(Rdi+mDy^bO$}d03Yy`75--x
z6s&B%eoF@len8$j$1o0@5W(l6kZU*OpWB~!Elwa7!JdoDTo=Lj%1frwY)_<e*|BE_
z|5V?Y^f&J?NM7+rDiiZePM&D=^NR4yD>iBHn66E4#uTg4_$Yx!wVcUj3__aYG|`DD
z5#H^I{-E@Te77iqS#cHJ&@S1u%Oaa_R+S-+93UDsMIkfz^kR!wGd&N)_Wa3I$O!mw
z(WdI$AN`DN;F$TH=AOCG1p*Rut`|-jQ{B4K&$?&9gMN+xa|i^SYkq^4RyXWY%m>)Q
zLU}iR>^k28^MvZw{!T(p(k*Vt^F5ri%k%?0@y1@xd9<-wixMDIbfn%tPpGNk&baR>
z#Fb$)I)e=4_virr7<S^<3q17cwzxzcf1a$dNUcZu_rWadAuj-ZS`jS{pwTp5ln}2~
znV0%Bw#fxznO%?>29^u|Y8_<r^-2xtoH~$yn6I64-6oB{L#1K<G%J0`E6*@cHf%Lw
zv-in;aX9#472Uxd$QR1dXN>zh6*d6*i8p#;gPwlZJ_H<kCdn7AowLqN+9%eI`^E0k
zxSZ13-JfqnmjnC17>jgtbtU~Z_5wO}ubyc@MsabcX|Z8(AD%W^jaw<*szw8H=^MQ3
zlApMM6murY%KmU8vm-F%$%Dd2Q(S*iS03`eijc1O9D7DywhD}b!PkR0AKHIhz<UjY
zudU={nD;njoKikXD^-^LUR-i5rCe+-mS?0zetJc$_~#OLYaAYHpU_mOD%-&BeJ)ha
z-Dvar`u+T8DIdKo_*#-(*stoG*yuPAr?=5>{dEp0#4d_n7JW)oLy$8d$JL6O)O{t*
zwVuPTUZv$EeGf#4r<QG45;+%L;#$5)kJcs{%kH9?%K7fYI~mZ1?=^-S1N%uY+eIYK
z^?;aJ`O6c2IqYEIlWNm<9CM>&yD!d2TRT{9UaF2!3dQ|Yw_uD<zydgdjXy9lJq*ON
z#;|qkY>y&Z@3N!U0~l8vgf{Z6Uxo(hSN*^!(@KM78!%G;kFxiGYHIDahL0eiAfO_m
zAfSSvbg5D#V4(`ANbl0S(px~JDN2!Eq&KOdmjDTh^w3M_L4i;L1PCOAK=?Q3oconK
z{&T+f4#!{^He`oqKV_{o=b96Vaoi29+HJ*V@P{1k@5mi%iN0}uOoDD0*i3ywR3G<O
zZ$ZEH(&7>y3VCOQ;`v`%1nzq~TJQQMhgSP6`bAII+B>`c@o`T^7t(yP7n99P<wHlJ
z-ZKo`Au8V~HxTm=go$7^SUL{o#YbACns6_5j%AF1KCNj3g9yajGmV0`c~AUT;=<c!
zK@Vw6^##ORmt_^dP@8xXdqV+ixwN!5K!XN7*MG)u7Dzc93*fCJ1{J?fMfb(W+V;qL
zok<ggf$CbAZWq!sKQ*0dx>hnq^4{`S%$y0(-lk;kSvbd>{1sC!BgSv!l_uLV>(_F<
z&Rn5X-E|83_%cG9S*F%;aZZuBuVT&89=|o`8fBO-A$8{S)sf08c_S0W6Nl57+2RoJ
zkH`7-&Ck*=xXZunXEQU>zGMW-@0_+yS9aRCk9-24`Ar;#>SDOQ5*eruYocus3mEo9
zx9n&@=(3|Z>}j94wD<1yd7Em+<rLXx-q*2L{Ew5nj2=${Ee4+70GkWJjlA%d#AM5C
zIY_%(8UBOa`Xd|}Rw@d?#y9y=#igbS0x>*-q+P@HgM07h9Ot+vNQCp72sV1Km04<N
zp#`L3cH^5AV`Pm+-CXUL9yfAN)aHRY=SnX>=gK5wWH4v21ayB*KWpHl=w^QBNW%kw
zJjdH4imNdeE6S&6A=X;4><N22bv+?2*S7g%0d28fN3&JY-~p6oQNm{$`4Z~D6X-rN
zs;z~i>t4~<+nnINFAPc>FhK7)yV3)QcObCClCMCHbO~9`1USnB$`QgzwY9a`lB~Zc
zM7(P?Df11Fr#TT53&$YxPK@2B$=FkoqxKR+5J1ArP23g}6}>G~I$kYtZVTH>>rTKR
z2X!YPPTSg#S5Jj(f<_hFrO`XCQEW7(Y>Hy9Zw#0GPB!r}NG+EbD`AFkc>-uxc}5X)
zW8G+5t?nm65YPA@2lP_27wzB53W7kOjh0o<Vx(=YkYN~c#HDt~y~!76gZ+3u2UAgT
zyr;*{I7h>dd_!_>n7b<ONWyQv$m(2RU2nSf;7vAL9l%>%#Y|8oh1gt;c>?{uxB@z9
zI$9PEI`3HV-MQSMLI>lSacJm-g0+GT6%Dk21k`{%EgQL4kZkHe(08pIjwCa0zCMpg
z_JSQti7qcMPZcR7;N^eewNYAoHk?QuJ#$l6@=))NwWr?&zj$W$e~F%SfanQwy|Uz)
zyrej)cm+XMA%dzjc=@xk#SqH3Lv9ObALEAn4*1p(zFg-H1X(lvu}UEoBECG@7V_Ks
zJ_V%5nyeTdSAr`%D9f^dP^H{=U)ej^0?4f+xAz2#U0Kq;?nebx9XJv(t&F|NpWyqD
z0fwwMM>m_uY5W@cf%-#%&9p1f{w(rRgxd-y`RY}2rq>oXk*I-8Ycc5iK-&2^dXm_D
za-`*&PPfv^vpG{oKRqyA$F>AH@q3PLZEka1p|%OY-XQkWfy7e_x-kU*lZ_<VrTqqq
zj_-l~GlNUN=@8ofeZKO*{-$9nv1x4<cvCeh?tL_7ZN)SWHOJ(Wb_^%uX^h^Y)NM#D
zb6%s2Hoag1NI*-Di99#;EnX`w-L=K=aDR>cEhq!7XCZHOY{0{xkNoImm~nDT`#Z`R
zxeq6Mr3PT*IHx6%sqO)J#apJ+Wax6BU*F~~dIq=Q#)<INiIyn=az}<#<EaIUqM7<b
z?qHTI-v>@0hWw(wli5RAgY9A7`V3MIbC)Z8--a|tEVe9~?uj{B$r9bo&rzI7KOT^4
zT3cyo?&#f^i9Bw7))DAVwuM_KNpvwe5<2?|r-NK;%64G*q6R<Yas+lD&Wk5`?I<%)
za>?+TtjtEEUi$ia{9x-(7eiMU;<&KOUJ`Qu6}oXYFchB^WKlR9h|JoQJRz^3dbr)W
z-pN7=_V>|=W+<ZVRF!+Oa>1_y_rc7&QuA-><W7E+?jnQaZ?a~dEQLsgM7Ng{Hk)wE
zs1rg8!HTNkw#i^jMaz@GH^h$MjU22eu_M{KMasl^K3yq|P#BAW^L2V}&f9uRpBBS-
zW{aAQ1?T3$*Xs?94RKf4ZcK=%t%4f3$k~zUx`v?4U|$w)$T}Y`ksfhESZ>fT$H!Wy
zij&3Jj0tQ{OGQq|?+2|$Co*2@+sShSx+kjd2dGno(gKr$Jaf+sJ<ST@DuvIOU!{XN
zrKK$#r544A$Jm~SbRUp^3|bv`mV23?;C3bXMYg>&*g$US4pN0!I3v4LU{8uv?cEHJ
z2n5+_&5~t_Up8_tn&G)8&@F7xix}NL4y`IW8#Y?E8L8vw+&sbKBfngB|4v`%1?$vp
z!Y4?Jvsp6$vc-LZv-q6VP!V$#M}|Jk1b=UtN~zErtZ-ZJX0jSjqu<?cDCL&r?{h4o
zbnd6=+kv`%{N??0{ivlSfVk0jr`o=cp+`codZ@xNIa<_atnz~eUIHW8`y+;B=4t0w
z(N|Cp>E0tz(vM8cZ6+)44Eg?rgkN1fFW9H2RoM_t1_wQQFJrS-(k27pu&(ZHrjQVI
zMS8>sn65l|gRMt}kzsvJdfig~Z1gpmyB=TEV)Qy!JM>mmY<8rt%c8m0Uc1~pw@KS?
znUWdcl9Vyq7VsQ?^t(+MoRQsUn~r;#ALFnKrw#zBOc}D>lf%KZDSqq$N2&{70nHz^
zfy_5)O)kmZQ2O*cgRchmyuqYBzEQ^+yh(MpG3OcyNDihgzycH97G25#^bR3DEe!3F
zexX|1aK`mFtMH>E3io#PBrwQ%j_;^-M`gkNuXJ9+PXn%O=I+<!d-I$t=y}>bSTbzx
z;Ynj)xW}f8aD^x&UR)f4GbKJjEmCHQ&)H_;o;^1`dAe?DVD)HQ@`0JCUPF;0(LF*+
zQjv7lwKMT#qH82E;I=2mn|?MB8o0U#eQse&XsRt4XFW8ncS@BNpAmL7H*Nn4SmQ*o
zDj^dy19p3MfyjGis2oOPcV}hf$1e19_+p(*D}3}13>8a)+{gfEkX|c8W}I5-RF9u^
zWTF=heO3$9Ls;&KKt_w6rQQZetWe;z+iL{q8i7Wt(zV|KJ;5bFFDCZnXa$51rz*d}
zUQ8N?1l|F{TrD6zPSb7Tc<ARbMzrqlMj#SkU{WvO=HBbTw~`eEqp!>|CwIL{mvpuQ
zvgOleK&629ZS3B&x8TQ{uC1QyO(VRVPcSwEU+?+37#E#6wjV{DEZi&jbTtKj@cYwd
z;8P><m)GX%%7K%MCULI*82qs43tvhyp8KqcX*&jB=w_};kGKGVz1xI=ZKB~FQ+_Z;
zgDb}b&^f$q$^ymqBcgJY4Oif)zX3&?<RBpVXXe>PUCh^__W>k-xGL0V)-bpCj_pq|
zp&b99BAxY<gDz0yy!fSQ`{kf=T@auil+C8ikP7G8$7*fnwhpef0DYxX{v#h;luLg{
zc=791)MD?*JRBjfRm}n-7P-emnnB2;eMnH^c_y`z+|YW98~@xS4!yYmn?Y`TBylwJ
z9pYuzP0ZBsH<&afOdfUd#JzdNBzxnqT_+i+*2EzzR?T7T6V|yp`N;KMpqQ%qDB{+L
z&(QKn_VLAZ-_pp%ogiVeseRWO*yt7OIiBl0-E#$_F97jJ7W=p|Vz5F*8_HW}%b$JD
z#AYyHpjKMIs9{q)6^4EGtKX*Zz(|TIbKKn^j%`~QTL`(I^NXIXAq8s^XT5s<ab%6x
zuNj~Q7DFVve6q5&O~vjTs>E=ZI9nJsWL6(a%?6aVh!H4jK({$z1gKyqt9?+fp_UF}
zaA4qz1ZJWy_?RZYYG(`J{}IWkPzYC}UI*T>&&z9LR?u;xEZz$DBvg^d7?Rpk9gRG>
z^4{oV#qYZR;azESw;V}5+ard2Y_bljJl;0be~QlE3_MO)wnf{7Qqi%b@?M)QOAbAo
z^sv8nP^52N!hiAt=ZESI39mpMs1CZZ!~yQ+j<YUr(rnnAyk|%cQzp3ZfJz|a+ek<I
z73al5L3Hcu=ALipp5cd3^_78)$QrF-WKI8-?$P(d*U==rP=*X}C}^TvRZ$J<K|vo^
zj!c^Ishb~vas}y@2m5LqV%UuY4aMVshK5#Fw$OPr!5;Qr3u-Lc)-(1q{jC1PRacJ!
zH%zg!)t%cPwAoLv$|}}0F+>iXg~CCWk;o_f27_tGup7Mt_`)#y6fKE7E$QKwo6TqY
z(+FhV!rN#sS?ArK!@Co+G4CI5*$j;JSQhAnR<;^_0rvh;)^w>Am0&ldd{2wL<6RhF
zCznwh6cmmKu*^&sWO<fu7dWL%ZmT<(Vde>_`B6X4_&&Zf2A}jvd;ujz|5HlrSJXcG
z@uOOy@v{?ySu#RS_#!ib#AU;}*|S?}m|Q_DqphPpIPZRp7wq!oc&pC6kA-T7GQ{1|
zf)`TAl}S^#kxIo&E5Ziki~x%tGX<W8I^Ys%#^vHn)9FJ#$2|ZMYQ>=UhPm?7o6g*-
ztqCUDn&EgzC~c0Q!|}@Wr!C<flw>yNqm}$7Up0jn7GH`VWL}4UkP0l5cIAqo$9Eo6
zeuA6WSM)8DRe!akB_6CVF(HI&D=cuocVsRY-D7IO+!7anEK;F6BPnS_HQM-ZZG;zc
zg$*3PV2@!Gkg)e6bK+<E0TyjD*d4cTnScDu&^Q=ohE#GRg$1LOE6PhHA&cN<o?arX
zWLL(y15II2RUjgu0QpW#Eqot9iTjRA9!;a7TGmU$L(+Up8<J<a3ox|P!m^4%3C|cm
zulX!cZa+qfd&ifwLcT8zi8Rf8Y?$}sznhTavgP42oEw(TK8AGIl$yVGkR{-v1SAg7
zSwPZ9$a~H++34vQEF4@%M<1bNXnsnwg$JEv8ytpS&8YX=U(a4kWdC@Td%UtG9No9h
zqmjn_ID(-r_!WI2M&lf$Rd-jmy4GQwwGp|FDEPC#q1+2-emtOeDiB;jgLiv)MctNE
zq*xosr~TNa{TSMP=;(r%{TxtlC;;~TYV+^!UsBGyun$w<s*GJ(RZgWnoo)sUe3jnK
zAZD5RWtO^w_KRr?OfamsC)Q8k2OYw*xB5<fY-Ss`2jQk6zk_#Mk~jjk6`Ky%OG9+4
zZ2DQH(J7Yi3!5&{t7GW-4?WJ!MW5h`VJCM|;96_Hd9zRApQ5mPU=7H1Pvjo~webD@
z*|n(4Kx0`Qq(~lo82a!#SD?QhSz?V;%h9*H+^10xowqT{82yt?q*u7>^8cTz{-59T
zRQ$WdDq%Jyl9MAYj_O|mlTxm19H`OugEqzGurl<0jt@*9V?UzJ?2<|Qc@~>>QASE3
zyXV=Xr4)(nFFhLXW;XRJT+Kdo%e~Z~ryGWIKvXHsf==*y;0C3EOs~|3VTN@_<e;Of
z`3%OBog^{1aiN*BDasnusCX5Ox6Y0v9~VXjCLlXn2v>XSq^M!C9H1?6BGL@|rLSUF
zkS&J-F1zK6O}7qu*|MQuvw^~Xgl5>y2xIqpZzRvS9-{AXF8h7!-UDg{fn5Ww_-H|T
zB@8<Q>&qcw#9T5u2Tanuz8KS$>DN)e7hz;+EdIL22O>P8#Ajq7Z+LUwnSc6-xfIz`
z*gs=M$fS&OeScxvUI7-;sxDGlJ1^)l-NQ?*gcxKo1uIvJekv_UclSaJ&*i&!;d95w
zlgo|y*JwnYX2Q>ZbnBste^0?n&aM~`9_hswj*9r<#$HL=QT(*c@J-9Ox)}jV*m8|e
zOX4$;p?;)mgvf9stF0Ig`}h7FHgz{LX?ajK3vqSTeh7XiH3-`N?dX0-Y%x1Sym$7G
zi}wOHTsfUlm*ZJgSMsLQ-UM+O)C7LIlIBoZk?w=OyJn76a@R)W$)N>eGh_*q=UMHr
zL$JhJ*BK=@K#Qln&{=VOz3Z#YGpIM#xVrNCZbZ$o*odKcay0vNPsN<S#vgYs9*z;A
z^m-YfTlZ9<UJk+loZ)tS*l&7H-z+{kjg9va<r63f2hv}1<|#0Uys$dcHy>K*jx=RD
zGP9iD+cVMH;0o8gHj8vLN)7I1)sYlA8P4q}d<3oslHD0Ghu1E#cJ?k5ZYI3AZ|P@_
zDHO}?R-W*`_FA7Dm{+iJt+-nsiEi~e<}uj*#p1$*-=EHNRCbrLqw_bFO2g%xaYn91
z-E;2W$6|r)YY!6h>)ktdKnzhot2-yiXH!fHvx<c>Y#MQXvD%7RKV(XAwHwGIT27z+
z#b$?+3;R(j=c>IMJnA$r6Cxue?`&25HOOr-+n4n-cIM7-df}pQP#iCR!_v&4@=El%
zT7q6C(!2$p+agq^=&Khz?>x9a*GrjIGt2w3h6FpV4e3~9G>KooT8t0$rNBYmS$n~!
zfC^r_G}|$I7^TB40+Euo@4)y_P1UU*0&NPLC_&c)pa-i#C!zKH+iM@LrXUIT$~8|_
zg>?P+If13|)#K$t4<9+vzLNaaePBl`@`3S`8t#MyKj8-op6Wk6^=xvR!zUnSt|2g>
zVRy9}*n14WL(6!tgjV#;sl3bp@IY@nyT)2g*YF{>b4PQ_$z~i?C2+V#SvxeaTqWz;
z?idff5k~tg-}IWJ66FaXG*-FtdSkLm@%v$9Me_1Lqtt-S?6d$7W<l0zapbcFHuuCI
zm^E5fUD@LEEvXD&t#i-uj%vSAf4=WsHr)&+#j!N!Fw`r=nUcPDW;R@?$b#sXV(iI`
z_V>UDU|VufMCc8LO^n%2d-_t|)2u0X9IA*j?pBBdM3028kvHYlSu6AHROF4WU)iTg
zHWPp!OzpoI#PDVX-a<*8@!hOw+_+6#(+adpVz=y~>@&3um#DlPXcDlymJG8NPB0@M
zb$-~)6*QY)OO&oKBOBA-=A;?rUwLWEk8qu-nlVL|8x>5owNN+Ag52vusa8A<%S>7*
zw{}d;@)yt1BBUI7Mhl~(#sozA_1A<0f>;DEVy6=%f_g-?Zw0)~e&ka+A?SSPO+y*{
zq(iUIx@RQO>t#sz`FfMSSch$F3n|BGroOL!4Fzeq0GxA8R5C%&^@>)dL5@fE%O#CB
zSk;in*TCz~an}+SXn%1A95j`Q1-l|MEcuYlV3R6`jHc2xN7>RBi=A#e1fC`vQxE`1
zWcu%D$X1Yir=Du}UFZqjN*9uQ(^lp7JC;1}hkK?^Zc3hyyRDu2ygBn>Gxc0-_Nb^>
z&GNX^e7xdu%ojz<AEm-%Ah+(%bFQu{&QI;#T+xtkXK3ck`Q<csvSX?BB~PZ-Q)6k4
zz%rG7r{%m&cC+uZ&Xmz`|9E`La{x76@n0;;@XOuXm>*|D(r#!yJPE%c#8*4&m$E>%
zV_G11*XN$3W7Ci%i+ElQ5vdo?>UHXmo%uwK4f1-a(R1>o5E3QL-u)G5Ryy-ojE81z
zH5fT?=ay#cmtXx2pzS0!F^5JE>_iXSpcE1zHVEIM`W>Gx{-rp+6VQt2F=g8ioGWXe
z`y)roywT3@jl?XFPPWpEE}TCI*_C<GH3y<cVCRxuKsb-RR)*HFn0IFY*d~J!fpT_{
z+&!jcAbM_44Yu-hP|`<I?z2`R2LxH}J%He_ez(+h0cggtXtZ{8$6c8_LMI*R%inON
zn?DQPQ&RpVc~o+G%48SMFVcT3FqJ9!K!EY2(FK6uj$>Zc9RitH5}+mA)Q&r32G}h>
zST8V?pTm~d-k{7=j!9~AUkRrQnB&_clu~;xG7lj4mFN%{x$=whR^1m38eB4>bsJ@g
zOYzo#PZ3&15Y`rntPMH|w72HO=^d7E`YfDjLbHOM3_E066;(qfzqow;Hp%)F(Bk1C
z<x@W7F@c8{fliKakrhHtO?JV)&OW{Oin;-xxGVL~YR{jtPr#QSd2SWC;G$)>KGdsw
zL3Q6Cixdu;0i(j}l1}=m7XBxqU&1}-4xt-k#Y?z2c!mp?>54jkE@<Z`6P|V3HN@gy
z%sCXY<<B=_0kbb>oz1se{q0Ry)?+hihv%@N06mt2tFqe}4WCA#yyqk8g{#*N6<Xv+
z++2vzdF;cx+gG->ctk)e`z*JAehz6Z!TF4iidnUH3Kl+aeC)eEm28E^)NHC-pMr@W
zBTkri0(4i%<13h4D7$i$tTK@CSkuDl6IL<<o<lu1FM9<d%Vz+gMBj`at<>45H5=G=
z<KE_|ktUr%eY1h2#|bjUT6kZORANvMH;}9~Y3bs3H#Rnt<lyjPe>GuE*aG7ZKPsQ9
zHsRMKv;{Lr%hQFPX~$2C;2TFLvzm=&?_K1Q$VTog-O=p+RzDiGLnwY!39uDMQKMx&
z?6{b^q9Vm*g+`A608e+a%(vtjkOq7+FbF=VMt8BM1dW7xnt1NnF(Ydjm%D?^Xpi2H
zM$WKkrY~$d+C3+H9_Cd=3f&2|fLPq4%*olK8vya&71=P``)F(HtFz(nfqfmaFJl(+
z1W?9GW0A`g2MDNi#XmNs*6jG+#ef#CoRn}eL~I$^wap6FZpRB-_oqd9)wUK(n&|3)
z8@^&(#kHt>2G7pdjjnGe_dl5FuLcJ_Fybd>iTQrcPsMbi3T&+a>5u*$o_&n}=i*w>
z5Surpa4H{(=2Phgr?)Zax@cug`kg+#@<c5V-RxBHFXxBIFQzp(mH-F&Kb-6O!ou5H
z6FYpf1@h7WWKnvUm!pyG!BNCk(EIj}U5v58$Nv5`$rbusSwTDHQu3Q$chEf-?#(x{
zO}1D^Akt5&*y#O*KX+k<jHD?u-<{}vqw6J+{PEO3-tQcQZ93O7&^Mw;p2r7+Cyy6G
z{BIt(kZ%(7k_deLH19Xbql+ht#-O7qt<a8EoTer|twJQno4&UhWI%~6Mu&6ZvX0GN
zStQ*xw#Z+9-C<tWa}lgn^liw^-eeZe!_6MPM`Dvkh`|;}h&nS`!m5IK;MfE(9LaY?
z#<8`|wnS2+J&Drp=<dC>QRnX2a)=z5KJip-6J2AyQ2byxX*|1@x^Qtk5je=50i$y@
z0FZ4_qe%f27#v@qhPJ}lTw($IQrN?7=-^b<^W+c-e_yC$we+2aGl3JRkT4sF+ohTT
z-*!WqcvEQ@0mL%!h{DiMwa*DxQ-VmF4c0*W&3%Z;%s?jl!39$j5`aOVKR~L6GUlP4
zr5+pC0^Bjvb&l3R|2Q)Yy_Yt@_BxzVxM@nvquH;2t&RnvNqOj}-3=JC{H{}*2>C~F
z6Sy$OcZM(*D9e-*<3I8O9uw`IyMNBi3>zHW7Lfhph_0^J8;x-VWL1xaRu3nR1JEC7
z3ZkwWFZzAcSt%7=S)3<vej#!A{FFtmXg*Y@X58SlFYdQSk-@vmdg@kq*}?^vx85s|
zAR#fK2S|>SR>m~z{@se2J_eD#!c=QQnl+rk054@TwPrKr&=|<)ZaiKUr2Lz-CPabT
zDtI{(V{1+>b=B(yxTVR9)alvV*>Tx#dM190y<(xj$$D=}xEga#Qbu1H!K>R*?SFk7
z;q-K;PdIbEf0xEHJzc8KUR$j=A1lZ#ckzmv)JGV=OLu+u0?H_V_~VuOoYhLbWFoHU
zt3;>c8spmtU0tLSq(xq9gwbjeUqwx_oRbO)BiW!oQj88h9G!twQ`6GYS_5Uy!beBE
zrlb5q4+q&M&IFmuzoha*PCk67*fl67Wf2;_?g>5l%I;k9D@KO+B*Up$59OoBu)!Gm
zE`pI=;P~*yrVZ6T&>wUg#}a5$6c)Y}!rE!ief4w|C3|V2TL@pA=Aff$d-8?NU*&%L
zXmtc>c!}ur@}{M~&-El1U9?N|Ykl$Elk9FdjLb1&Ilg>`0(a-?m+)Bt>3b*w(%?s=
zYl6IIDty|g5Uo8xvRPk|Az9hZv*SX64{mEU>P74d+NML7bDw#uOWJ*-r#RtlQ^IUU
zJ{yv^3cHmzkI&UOT@@Km1&({qqCJn<B%NZfi`jJNJ`GMszMd+qClUvPguGGU2JSm|
zI%>NCwR~aiBF(6KUm=R~0QPPS)KOJarQK~N5Bq2l7>dI^R(clD;cA{mU$TS+;DE8)
zXGVUx7yeEqBRo$z`o_IxugysD8O_mN5^iNMMg}e?20Qp6*SkqVL7rc021Mp0XE_DS
z$jR`dj?6xN{K~W=Br)q~iFc$(YYEP!2Ar&ifI?GX(-su-dMaU6B76MEggFWzK>>O#
z8su#t>w?DkneHEjdoj170bM57($)r7l)Oix#bVWL*`@mD_n2h7w*>t1{`eO(4Y0=L
zq?+|68CuMH-a#ofyB1J_(KKfrMph<Y@*$9W#HK|;P|}L&UE-GC#`U}<yczi!fEPQC
z(o3`kIe`L^5c%O>t^{({(aINIcE_LOs#gCV6xpL_PX?;o6Hv2ZW@(Iv*i6ma7-)1g
zR`8hxrBU%?-!>f=M<0(mH*SXEF&I3?C5*`4yy-eHQ9knQ8&@N=h0ePPChJ>;Z%Frq
zKlHXRF8P6cVh&SmKdXHm?m5=(Je3=ELDoWH=%|{nJ6Qr{rqP;sK1pkzs&6h_7u;Yf
zZ@QPrK2AGDNpoY-CTu?$qR&tC_4PU|5Gz!B{rWvSp2jmzN1V~fpgUCm@fuX$j%x4v
zO7g3<Svcsi4eb74g-Jg=X!we-eoAtd@L-C=;q;nZ&?-vv^Dfr}c&5@m9dUB=Vl`d)
z4^HTM*~a5)n@yf6D7a{2DtSxifY8vq^y3~+K=P_aq=X1y`cl{%_#($d$k3de_w<wX
zzBijw`q09@_8|Ng6)_k$TdF6es%pQ!84|Rx@Ld4gN!6<TX78H?c`A{k;=>DPdW5iu
zly8|JtS8SlM#ydY-s6XyaKaE1P0u@6Ym09VB{}`+BeT&RANFvUn4Nd;==w?geV8{d
zhAnU^x7^)75<NzSXE)w(djT1wA5#iaD-AZFlZNcY(YL7K4pkm7eJ0dJU42GKyTTaS
zFnaw?Lud1#N`2E*DCS49yE_F~3bj9{ywY|!d)Pnr``G88>$?{3c~hhD=sEYnhr6X_
z$9%t)=Kt!#c=Xe^>Y0F`2;6-|bNG#~feDOQmi>J%g2PV*AR!w$;2bNOlq#U>CA2y`
zs4B|{Pai-eB-iEf<9$O_qmY*2+1lH9DO3QHCp-DNAJ;o->}kk&vh<<d(D`J-$Te{>
zM!4xa|LezMFG@dW`ENDt0=cKM(`EH<px^Ib@T`*{@}3J{lsUeP9L@d)62Vw?p{6IN
z{2%+*nP0UHi?se|+^FtDtfYHhO5fj_o6+q9;Sg;aUsyMyJ!;;~e|^)ztoOt?BK_O1
z6FQ;Bo9p$)vh;_J*2LOcaVgajN6-l_>!f>J&ur6K$|JjM@l*zP(|06YUJWxKPjYHz
z2OsltpC!ZYmV?W@3d*@gS_F;iRf;q-Zuh?iJc?q)4K@Bt3*evSKb{wzuEtj>QbqR<
z91jhpVQ&|0(z#W{Q5l|Fv%{SH-*%24Cb+A>#8PY8(Qq=@Up?1m##kUYFe)pnq!C8I
z%H9OhHCP#{vL^rpQ@*UxS?f;_8fn(kS{pBo@YtMHy)3TG`s)Y_GEd5IOq#PxnzK)m
zK&lg5Y^E#`)erltP5P^Ox(t{}?Dj!NGsTFvM5OkFSBe>)<dOlf=`2@FnQjWim7GIh
ziWu~y{ofY@mU&d|AB6-U7`pO>^3mT@<)$@?@`qMcCe}6RV$r!*Bq1$5-J7s7BEUrh
znYBDi5;D@soU3+*OF8G}i_?cj|GqR9C6Q3UhHCUpZy^NUOyRh9K>l6o&MhW3y0v0o
z#E_VYrZ;R}=12AxWzjsco`ZTNjB2r26eaJUF2`EmX1!bThUS5T^T*YzpIog76<}*;
zT|OXG{XJ#y@|C_hl2cIRWXBfOT>>DV=|gQtmRfL!z~D94%E{(v_L-goG0l(Q;FpHF
zo!@|#B9_420-*D7n8Q;`d-z1$>}e33FgdEMmaNI1yB<*EktjfRNX^J{dK3h#JfLjz
z8TyMWK*=E3xBPG>2fW9YyDpYR%7YHjpo0K@iYsU+jmgG+8Lzys(UjdJo9r@6y>hI0
zNS)>;EP6s=?~N1+kQTcWzTXT#XIwzEJ999!k7*2=AzNe+y6gJul=Z^j>3%h<dL8C8
z+c+Fp@xUsxdK9qkTAL_Ozi?fY`)-?YXG!kBKzDcLI8q9*JuEIRuK(c)09{Lfj84N$
zB-H$ljg_@^kDeLWx}o6AFG=U=51OM6Ypmyx?_i}i92gr~Iy!4W21~L9BE`FUxaYSy
zS(R6=fC2>E_4RZryl5CX#81S~vcro*>kIep-NOg0dC7XLnh(ZvX!%0r+}&4u6Zx&D
zs;#TRBrpH17@76E{<t=vSK)c4PRE!RkWW<u?qB}p_St4#p8kG$-+^w0JX4zSx~#Re
zwQ8%L%OqiG=_#28=b4GEneAWgmVVVg0Jv}o1A$*{9oRRPaG9Ni1@7&O0~U||{T-p!
ztY9FL%$4eTvJU8#@j>B+zf8f#ENg|-QiCW!T@Y!#yVOHg{TGP{z?EYEl!J?^cUE_o
zg9(?mM-SXFZMV6iWiB6R3>r3Nzw>d&PSEFg`|#I3)7tn8pvvMn0?*EVZdm_J!aI(8
zGW&D5HNe)IRG8!+u}FT{A2#=Q=EUb8d`{4KmE8FK*s42Q{*vKO*Ow;e5J86>mknUQ
zWwF_8JV~#_2|P;I8to1Z;$F>4awyK7o<aPM6V3@?oM3x`8i7C(D?GdTD{>rTHC$vi
zV}E!zr-w;t=9fXuN}nl{KC(hi%H${1)tU-WC2uYRBnvkhgg<8j1=xogo?fjXHQ<?v
z-922*26-)J`eF)_?J|X;hHJxZhCNZ8Q7w-9+`n6PpOuxpFkwW*$Szu~%~pY5iJoYP
zL}}P*m_<~40+N^VPl1&RwQT{x=Ra(rf`;Us+vmgBTP82vN0Yx*;DU+GpD1x1w*6EH
ziHok8fYosG+4tMQ?^^6%9TCUt+<9j}F6oV4(`|%QscnO9po3+S<g_I5wvSkXn9=c}
zr!exEsflmpbOHaucsK8C*GT{rmCBW)Q}tjzo@^;WyN=_bE&PmYGLV0Wc~nbPXg%@)
zlxmlOynnkejA8YN^Jsx4C;s|hx}5)D)4JaBj^twI{_1ett*4<U7*c(`D;V=0Nrk0s
zVH_JHDP;UvVY$`R)HHItJhfOdWtD1q5g^rSak}=K+?4g&xUa+2$C>8cr>m@QN~jY$
zi%w4GTg*yxSe!0M<2zVMuAzkqvBYG%l;wEL&9j&ZCf`xlTh9*Fotm&eObFr40{1VC
z^v^V^GMT!4pNfkedY&mVDqfZuo5Bqwu14vdV;xY}0xGn-n;RgmV?%@Qani|pATs}o
z$u%?WaxLRlI75cMb}*4QE69WvhuaKHWL{vHCaOjMZ13hw;k3-WIW#Aydb4(vuh9?O
zC^Qn!V>4)QQ?}pIyq4`jcFflY`B{z}V`kQww|Cy|XmgJk7WVkY51vcIDyfx<U<n-Z
z9+i6-_gW)?GWfQoc5&dQl5A_()O-_cvt!ZoTD>BVez09I5ui0l$7b5|FW0+xTIp_h
z{n^8Llo+IyOlc5?4xo`gY)U72AiO##g|fFa@T^y)+&4YO7+7dFEz9LNt-<s7mOomX
zuD>{837@;g66;+a$(#I{I*l3o5?4sSgw?y4Lf8@c@CSwG6NSgv;mm8<TA@Qlpo9tL
zD_0T>F9iW?UQvK!JEHqt?q5qcnzTUaMnXjEFTZ64=gZ#!XmRiJvz}fVU`N!r)ATlv
z4=8ATbo=hj9)0Hs2JUhp`t{JV)grC=F4rTMduPT=+5$?iih7Q$SwvJilZ1S2=OcpG
zczg)Qp9<C5!%c4smx1%o@0?rj1gf2zgMJwBRI_c?Tq4lt)RVuHw^@18MWU0B-)C!>
zRBaDuh)dwnup+<L+B_J3*xU<Hvi78eJs(Vf`2|I=@T+kE(dPP!miR4lXyxWac-xVB
z4Z8RHUWga!5HGEybb<X^eU{GsTO3M*@S}PF2(E9IdVTPAq``Zz(nK)GoUG53g5|8|
z$ha5-{3_%+_VYXMWFh6A$zk57vq_qJ4Vw<rnZF#_VvrVN^qjxMa!+R&ZfW7W6A)?M
zw(n18|DpzjgHVnX_+siaq8B*u=3<5I2o<WGV&jlh)qUh>mzDy9@3ugkYt36FtGt(#
zOyI~L^?Q1`4e6rVb)V|VZL@L2Uz@BdsDbmlAni10;b{kIungDsh`MkOP+#EM!qyDR
z^NZOaK0FxIXaNY-OF;SHO`gT^=1fC6oJlrR!<OQoS$;rXg8VBIV*Gh#gMdfpk92W8
zC;$j2Ey80zNw0y$Yiqlb;?PWUM_St8W%?aG19MYQXlOXvb2?TLTx%;!-{Z)_nt-%t
zE`JW`ODe+AysOJS*mKi$4LXFossx&5&Mo~EQ&x?@JHMASoA?td%hiI{_t~kC;^=s2
z1hGn)K3+*zn6FL_Tly1XzqCg*8r<Js{4-X8d7D8IemE0XxKgG^%Z-`RW~nV|Ja#ZP
z)fG{bXGoMSH_#qdX!f$rl2Dqib+M1IBwoV6fU*if?;3Wvyyi29gn-j1Ab0iA*2Ztt
zvE;{*l)7%uZ%Fdg@lYi?Y$eOubTq2<IMP$$ac6~^yFlO1cDsoUVzoCmu(=6nVKY=>
zV7pPjHpn6zU(l!PJIbY#l7*XBuJ*)e&J?PzFo=2~R3NQEH#vfR;SCieip9BF)#@NI
zFQ15FpOd8G0IbX$@0=7eam7=AqN#Wzph0WD0Em%-M8uTc+}se_Ixh?CN4MQ|&7$G8
zi+{CkAARCPch}%*S_x&p<@^_fZ&8|ewSKgjl`4~WnN2sA8@f5syX$r5kZY)E|0%oc
zH?}v}s;xYSp1>!D16y&#xAWVbqQsxO@S<kVk<)G4L2Uuh6in!e=Q??qNAkdwH}r<F
znBEPcrr(_(#34{GPd!Udfui_RS<&?hGmqh?yFeZNNygxXf87a$=$xcd<J+G`6aei;
zg|Q{X-;;s;Wni&vGafOHgCFdS6*Q)dEu7nd`sLV&r)cld`Bs`|{Ug+FuT<orx8dGw
zDcM<>KOEL}cj>GKGmqm^Qf>+w<xgk7r?!~`H83roABI}r-iIH06$Bjj@2b@NC?xU^
zH&=pn^wJ;$ZAYPRi+TYz8#Oy2$ywHVtC`bxROoQt%HE0ZB*KfFT|K}C;3R9qt?G7S
zJ$-%20F^t`xkyfNt}^ke);ZdObo<trH6dPlS)p&!V0_LE-_3qvocn65i5etN-S*i>
z{bCcgmV@;hJqX0!^tyV^-;m0beHHoKv{X$$zmT-l?_A(i0g>E_1&m<RLP)+xbwTt8
zaBIHfm9*`0j02wtWQCZ@GJh`MuB7bfkJ&dO_D6T^6B3rZ`Y{+L+Ua`xJF2Q5=WCDN
zQ}`}!GA^}|Jyb>do?Y{=t`&3cUH@&dH&64)YO&DSOB=eWj%dPz?*AGUPU_xeMp135
z<+mMmWr4X$b<68E)tYU7UrJ%z*Od5$DQ4<An`&dtDJu1@h1a*K$tw#0eR~R6sA)Q1
z`?9Y`Jpsx_LQOUg@tyQILxOi=2G&dud>wy6J8p3TKc-;-<l=H_?MFvi<kd_m_m?Lv
zrK1lor=Y5fR04Mu{1zBN?hC_|m|$9*&^c7wtF#87X`v6`-BtLEA4VjuIYE3Tqy5`u
zo?i}?%F1pz5w@6FLkE}?&)_DCyO{JLF2t?t_uO8U#xfHpdTs*S(sLs!0F@L5L@mqW
z=4NW`<2}|clL=ahPM;HR|7mLW4`0RwDrc66yBZacr=QS@z6lQV^pby{NwM$9E;4U!
zwv$~P97TN+H%lZ$AhOLG{LSef0s%b$p6=Npx<1n5UGlG9j%*>wci&9_7+BVcX<$Oc
zEK=j?>3lFP>*xCQJk0|qjIe$44@nz2UYO|@nsR`cf|j#Q*S>N^@wbDr;+Fuq!GZDm
zm>w-H&U&Tdm?xIw8_Yys|L*Bw!qPd8XMc78D>~m_lrLVzoY0WsFoThDsVhyp^zyA-
zQg+2mgxzuWbHBG-^l}7wXnHI0b=LU=h-veS$Y<APJh_xFe6fsK`=!)=NTwyZ*koDy
zr!I0VDOs-5Y^I-Q*9Ac0TQ2nO&4BUmgxhCn$yP`05IkGmA-KC$Py&dqz!&NqQ)2HP
zlkjo%c+Ju9YODgZ%(zvtx~6)`&izK7Qsx4K2JFD0Nx*>BM`Qh`zU#A(5noOUsQ~Ti
zcpjiE#bE<t?6GmD=j<Jr=utEQ=36+u5nv}L1~D1TG+AEdFyUS_FQk7)zyi*EpOno_
z^=fBBaUh9XVB{Lpt;3X}hxuu|Ty}T;$GzEFiWKb9PqD&i<vRC%XHXI{2TlPO@)%gE
z0u=7tT^|C|u>2bb{S!I_%hju?Y#%7jV4`nH@sH=V3*(-ztDBoL?zuv&dVW|RzDka3
z^Se2{)%hu8Yr65lXHy6BIn)3f!`ThWVE>G3tGVU8(;lu(ztwQi$C8GwEO)2OASOHH
z=+z8vy{xI98il8=I%Cqo_p}SUfy{>kd3<W;3^?oV&OK*CvYT7~Bi9AEpukMGp*1L;
zn)-MIvGhDm{Js`9V@b9X?D+&DE)eBJvawCU;@${V#4sWwny6clpPGe?voImRzdSie
z%;UljUN$!M;`Y-|3=0#jvZ7vxK^+)R;YW*7mLdsPo03#s-(cT4f0hLAV_NnXH&{y6
zhXQnH&@4eUk6=WvFy7o-8>)+1xK7W73~x|^^NbgjhCA2jVEWDemub_(Kp5sbcXk`6
z(G4qe*<J{AJIa<ft<irEHC?<*Nq+7J0L|$83Sln{sd*gV5o_bM1nM+iy!awV+;Eg!
z*kIL^wQXrCzS$AgIYz*y!&3M!ry%KD52lTK5D%_-rnAOP3}yg@H23H6z-R0M*wg&{
zx)mRxaF_5*$Z5@7X*s>1)M`hsujMWMOwdX0y?Gyd%0!6~PY_|mXkPo=ZRb)m)O@u)
z#tUow1gPw~X~~~Jub@{V%5UGguPT)OwmyRc($-ReFdLV5%7dM6k6=g&1V`gF&R^)<
zl?lLiOet#JzxFrUYouqr;?G~AOerLS1uURkTwtpt8%x|+<V3lei_ACW2#(R5u_8bO
z#o9Dx_K1BEllYlMixDwCC=vWeONttfKEM0fU51~I%f4nt>6YGfsW3J|TH~fK6Gaqd
zR`SNlM-e8q_uKWUE+vib7=FhiMiz-YXv^bVVD@;vGzUbw-KOn}dZ3;dzSa{UflmTt
zPM#hTux4wXRTTevY)aDIkV$Z)l}w|BMO`j<I{hX6?YI7w58%hZSsnc(m~!npPmQs8
zq=OXW?2wLXC@?>4Q=5lJ`c3S6dZIK$nu_Urn%@Q3!Q;BFCU=yIio;#nZGbM!6)(`=
zO^b<+S;yZ|HG`~NfMm=CL-|GXq!v-fOco(mtM}<FLBfqPx$@QK_^(veuBhN_Yfmdg
zaeKZ$VPJkQK)dxgPYV_Ya8J*MAxuJeG}3!3nGR=qaV}|il-YJ_u{^v(lhuiDk`vSj
z3G#Z@4$T5&^7`sGt@)BT{hxXJ5<&)lydPxMm4B-O{}B93g>9r{%dp8<cJ73(NaMp;
z*_b^UJnDF`t3D7lId3*6H&S2SKPQ5lH(Pqh+*baCa#@+MdfNSMTRP-AU)?@HOOJq<
zz*VmX9E4>cp&I<DqHk-Bo<2u$?#T}tyW69u={Dv6K7Tdkr)L91_<H+k*rZ(J2VwdS
zTfciQn1pEr;6*Gj7Q75`g&J|K#B~XGe1LFlh1eLPmE0PBiJH$bzZB8alZZqaT&x9W
zR6t^wqA|Ao4RGQBO|>H+%Xwkg<=v!fro(o)K}>V7BGN+Eo!&U$yOq6F=DUj+X@E(e
zTy4{@)a+v~<!@(AdWxQXQWBa46bXthaNY(Q?e5KgSuhoVw0EGX(_ImOy78Lh+6Wyl
zO-6F>0ONe#;e9k?FXqx(Bf0NEiZi56+}+kFvZ;MjWpiEI+;s5QY=^JgN%~=65%Y|*
zR#1`^>J#NA+1D#@$74o+#(xtaB?zft=_Zq5Un_o=ms^2dB8`HwznmXo(Mw}&8HBzA
zZ@VRDWeVhxq})og|J?fwg7@}3ngG|;<zZ#c@}c{C8&leWxO7za=j&n{QLfB}=jm?!
z!>Rih=T9ZOd+CPP#-t^oQKwJbJ|+9<uSmL{QN}AjJI~O#({Do;z~2j8R`rfCIo~Q(
z@S9pv5V<c5?9(dkaS90;x?ecQIZ^=k^@NOOyg|8SxuMEqrr#rfB$JA0E~&q%zfEH_
zY+WKM4tU8$dP>vNxJr&!ySwe?hc)%(suwX_Vi|vPjL&EWS_htLYS_OPs;tKshO0!?
ziISo-{GZ(vSKkX*rzwzhHdK50`gJ~9M@EBk%&2}V_Wk=u{wyEE!}{Eh5g8{{PWKqH
z8E*`Ag>RO6L|Ez*$$KHywu7cUgTe^|8Pn-(>U<}6KVFkGD(0c-ud4(S0_l`QL5*}C
z^%=?XzOpea-&k_dkCvGppKI1P5aQUU{snEu?Q>9%3$**qn+fAc^F0pt*=BqSL40(r
zY2D6L_Wb$t)`Et`MAivZa}a!$9o7#B-bU?cO2l+TDi?LtoG3tBckYb5edQG>hp&<>
zZ|6+$wjk!-b~jnoP(jDPAbFLS9Ql3I;K(7pL{Z@U0)zuoxCZ+{S021#2_S?aJ;O->
z6K${JKu&yp&1yIqmuAtV8q9X!S$T76nx&AFv+i(0%iJ3bK_|7L6vsN*x{b#jU5c{a
zeU8(Acq)yU&2b*!b3HZ<Bw7RBYpG6?m5M+EKXcV?06@)N{>h}3aB38Js(eC8eL*A$
z=pqcB;9_B*`bT;_aNz@YCF)AsLo3=}JiNT>CHLO5tr~NW34Zt4kvcfgKT|<dK@)T_
z3=@pG1w*!f4~clTCEa!9hs$k2jp1n@4`7}kGv;fgOaMX2d|%uZRhQXr>aWKDV`cG&
znT#<T6nY~KLLXT7mh+Ud)RBs{Q?+aMXVJ{!)<DEFu9lc8gmetHY!~_(D`nP7YAL0>
z&Wu%vP%vS7W8pjJ3iR9uYPw`vSy`#(DMcaTK_lza79E~J7)x{0V6@PHL?XHd5gRxp
z#yso%Xdb-ny$Fl>-jPLP5^IXgF{yn!GfO`AD%(5Q{~p7vvPp%HY;c{jK0NtkjFxB<
z)E`;#Af$J9;1giMJ{EMQbxKOsD2pPV%ii7|@9lXEa)`e8Z{v2?=q5Z{!3#U@%2sdp
z#euGf`m#>2^*+X~Q~k!yg5Sb^8|M4@?ZAsC1j^$KkA*fx_1Svoqex$*in%FZS@j)&
zR?|uriY4vP6uUWK?-%3YuyAw?+oWE!D0BYWI;?F&n$D`II00gkJiu<Xk@Cg!BzwK>
zl2v;13sit@j+KqgbZZ7c3?1gB9J=)!dDhr`9)<jMj3yWb1_t|<C_98@8b3$gP@6#=
zvZf#{=YjOVR6m7_Q>cGGZpYNL)#s+%B*(cn$L-eOVmV=eI<><ZO1N4tjlZeez(F`O
z!$uIyqkF=zg~_txxrq&1ro@2OCb?5zm-Ko&EvH|q)lvF4LgC*d7tI~~ImCcxFkbNE
z$MYlA1y|2q2tXOXZfguYF&+68OoOC^(D1gA6y;Eic&t`3umRXllog9>X}s-D+&Ud8
zf*-*5efjE@6(x@KD>62jv=ZGLwlense3p+ZTR1!XJkK>dit;RQ(<|LF<Hd59X=&Ru
z7To}jnT7I%V3A-%nUk+Q+F087mEFp|d||{_xz{TCvOG7R&rlhwm=d%j0CHI`(31-o
zW1y8{C+dzxN&-&S-OcBJIZtWd%_>7ATeHzxjcz@Xj@5a!yYhAi^|XG4#MVPKKPNNW
zi2Nz2cjKFIO?68}x6$N<!|+W3vCO2A=Q0g0caNdmy&qfS&h^R${OxG)&qx=rm1nkX
zJtR4QX;X?~>yXG_b$<8v0IFRYN^jV8!#OG9>zxggMyii$90WvyhGwI@hHmIv;`$^2
z=@ynGLd4Q>`!Yy8N#UkGpuq}C_QXihXo*{f&=3+AY4+*U2SN|%u3Wv^t3B9XO~}Gy
z{Xd_A#z#^=STB8}J}qwUeHQ4EfLChwXE+z585+1+WiM0Uln<rR2S73F-`2tD)%6$!
zpy_#I-oNciyPN=P8qzqcn9HsPoR&C5;qrMgr%Cg_Dh=1LD4Mj^(aM03aQb{_%vJP9
z-j8pOsf;XxeZlRsRgRG3<>}m~CE_j#RzX$k!%cvrOV|DfgQ-jW+edw_eK{K&*^5})
zM>FkOH?E0CeJNp{1Te2!(HQ5EE^A;J=uw?6gTem3WXeKl3;D;^P(>Y~xvYZ2QVyTq
z79e-Ufac!{ZU1$qj`POa?lSrlie`+>0Fb=@;HPY@K3KUu>CY+e(EM(`EYUu)lI6;k
z=?xRdcwuKN(dC^j;K4v>;!-_T0GYZw_wT(hOa-J$mgYd-*`er+v&X%(0r=&YQ%#OB
z;!bx*>fDvr=F7#Hv-v;u?w-35Od-S#iKuAbLdi2F33m&}0?wbRH3>Y*+0PDcF{Lm{
zS<wC`AH2>)q5Ts{gW)!6>1M6Ere+e42CMq(N00AQtvGjT;VxS+7xv4c7xPlJDi}>U
zTR@?&vR97pZx9|UDt-ZiUVdq5X(eUu9;+UsGyz|oxqO|xVBd#rCe4JYW{Q{E>1qI7
z6Q5kHNuXIiZkLJq%iA+J?cxw4uEM>2dQd)ri-yrA-E89gNQE;$a_Iw>DFyUf_{<;w
z!B(+esnGddz-S-I{yzLVn}iFuDi7zE*w~8+JMPY_e`%awR8?^I3JVL1bLHz<Sw{Ox
zS=-M5vKVT(u>_S*9nOYPG-!8(B6cR(h4GtCDH@$@pG){OMzw4La#8M&{OdD(d-o2+
z4f%xefi;!-p<ox9>vhXVxTlURR9G(F6d6qXuPN}aIp*BeA>$`Dy3sd!<zF>0hPM6*
zzI^kf&`6W~Vso!YQr2`_R&Vii=>D#|e?&9XP6(#YSWd*YfbL>BD;%y&{3S@C@a-L4
zAI5{-Ytf%zs}k&c)<8{-N!4*)z@v)G?`zx9CGerN&%dQBe=W{nKknyN)t8&3edFSj
zUEMCDvx+YVG_JmRDD&vA<3F2^idEd{=124z_eWLLxY@g^th`cj;XM4NCMM+og#CSM
zz6O<qbR7{lNJ}3%1Vk?mr#nGqiynUs#H)yRbX}PG*-E^aXiY!+m~?K;4ab>6YtId}
zjA`m%qKqeW(%}F7G5^;_l5I*m25@ubp-&&<Uc1OR+EC!`@jSp%>{dW*+d#&`gXd_%
zPC0GQOV1iBn0oipJA(SoE{kcHn<6w^Sd+BWo|Wm4OxV1_+X9>)&}~ruCyV3nNBYK!
z?)27~;a|TRPc?wrGrx?DU9q3euVRV)b6zXs*A`d*-1JIbwoxs4vbpG!rXt*y0Y*ym
znyz5Fx|`c#$!wHNvkL{z6F*k9_-|9?^l$h-rj$bKrEfaHzB>Jq%>In|oV9JCXiUFn
zXYlFIcxs;Bt!wU$oj&ZTVTrhe){~r10t)8x)pXkb!5;j-msp8b_5>Arf2gLKQPt0{
zP{$59Qu9+pa!dKJhccreCpH}ApU)xq!MVnFEfs%`?d(`$YN~TXY|;ecDA3_@MEN*M
z=VA&3zLLasn)d$hH~;tltw$=9UqJ9@!bbv_fEEpx_qfxE#31c4tMRu0i-PZ2;|KGC
zi=A~@7Vmc>0BuBBzCPKU5kUD+onRsKe-GDx8@>PbQem8KY#Pv@@YB?+*pQ92=p{vR
z^W0H0bcp0mg?Z)NA`ZQs`M~+t`2W1S@MEW<iS5)1X)na!rTO8ALcY!?bllh3Nr^nO
z$UlOKFW;p6IpzM3$MxTC_<z5AE=W-)BLblyQc<}9;oWdsuGcBNR$$L0TL!vKwale~
zyK4UT>U@2MC6W+wP-Jb*85crRv+2}oQTp`LD^;}%vyIDU;lH{m&Z4=RMVSBdkp_~1
z!?O-x^Z6I~wpMDo6Srhb#?ji^X=;m|s$O!23i8t)4Vr&N9?FI9Kv%FVZ${nSam(hq
zUfCrr_OWpzPe#(Da8lL}r~!82{hPyQ|3~*$qgn?Z9W&5+#NB>&g^re15V&#FvpS-c
z{n)p?g%-2ei>+oM7N<E2nXd6-fW7ki^wRROx~^CBQW{EX`VJ3|iaS$+mL%MDwO3fd
z9Cl<Q5d43S@4r8Xi)O(x%qiXxnf84BoCri5fO2f+b8Eka*^lz@45e@jUBn)`T>m@t
zIyjB?NYaJ50bcl9K>k>%ak>{4_rJ_fEf&zydkc&JbAzSoe>}~BMG$;&ZVZs0<$zM(
zka&<~O=f0hrV?lUaK2wEX=zDmq&svKU{$W(yOd41d+jttidH$p5{nE$qS$<SZe+#B
z+y2;XLMN-edlKZDpAy?by-aL<LF@xGK9}hY{wKTHJB8)5>rQ}K+a$0@J+odg2A~w2
zR?^R(XH^{%xK#_YQew?1_vkgo&FK{{hhE5iefpfgc~h{)B7>fy?YUWFh3^U^98ute
zh0SQ6p->VIW8HGa`Bmc1aT{5PH+QJcA@nZCcKnYvAU?t8!W1~ooT1QL?rs`&3tt0z
z`uU5mZJ<a0VkxxIrtrpzyX0$etBPvz*mIvp7xF<5=m6Pd_&vuzeUty+A?IKF(A_MB
zR$2tWsspqPucQPKsS3@WbBBdd1*^43e0stVQE&5SYk9Wm`IP4Y?bP)Bqfc2=6asR6
z*Hs?leqI{YQcF-mbDE3;_lEdc*8lsI`)^mDLls&X5Xph7h^K$A@{%hzMa&YRWo-YG
zrF8QuF#D?R4paaAOTB`?YM8YW_-}Xn_m>xKfj4<eZSDE@X>;*Ej%EJWntMJ9>_Lu)
z7b?MjEra!9U{Cb(do3;SKUfyo4CjH7e9ZgF<gYQw7CL>cZu<%R_Za<0BePxv-1^Yh
zRGROvTRRxPYYT|VqVW1_od2WuxcC6DQ$uj>B>(aMQTEnxQMOI{xT1i9f{Iv37)VMZ
z(kKE-DjibNAs{I&Dk5MI(j`)oi!>~-7<6}oO0$Hpgv9RtW(B{W-+RCBb3gi@E3nsf
zo!6W*bIu%d9D8=wMD-<nX~qMS?A;~$_XYj^(+>oz91aNI{iE9yu+9@z?^ymSPK6zS
zML4Fe9<aOE`zK3D{ymQV<ENI|umB1Pdy95+Mp0@oG$kc=zrP7sUFYE5ou-XHWbQmn
z7bD^GjP(b^U#y4(mSE%Jt!y$omzH=**g8upRTTgKH0S>r)$e8e#}#DC;ayz79ozGJ
z;~a%A<<H6btN6#@4EO&*r~TOPjdKn*&RI>qzp=C<?+Ms?wNDMQyAJMAl}PV@yZis~
zFcJ!c1(@NjTHE=C_i3<=&@=uMx&L^F|Mt;G=px)ZMI5{H&I<UH5k7OoU0(Z}6?vaP
zxb&3k#QU9Vy(h#qelN1VKie=nKKJYMlMGzmU-XIg?7Yz1{P3ljHDQJS+UxxvO9Jcn
zg#+?dXEyEKKavpKf1oL1UtsD#fA3$7M(sQ-f~=<2@6C23a_Y>V28Lh1_uhiA0G=d$
zP~jt7X;l@rk*Mg0vnT#y``-40d+$vQt<KqbnA;JA&nfxUm4CA$t1575tO(*P_0FaF
zVSy@Zl=ce$haK{NF4Wm2co(mK%I(>+;}<ie;Y+(q^3?yrL+|nF1HV{nBPF-{N6db(
z7wrw&kN=I8yp@GT&^XA(_ItAtVebBm+VlVMn)wM~F12;f;7&^LHl7T&Q5sYD=j(sr
z<Y$B6-h~|V`qXwFW;O&qmpK;oY5c{Cy!9enI$<g-Y3I^!YhZzTf3g^m{@a%Q$7=ap
z(0c@jb?<|Fc3!ANH^Jwh(dhZ@^Z(Bm`p<Paf`t3;%QpAlbwLvl#`P)KqyNUz4ygLW
zm#`X|r0iZ&!XV!2FV++?_Ef?GteiI3+WCeq6(7KtxYXWJQlk31h@<TTXoBpO%A=78
zzH@B5d)MbC5r;V)FpvcI=<9Y4Jy7jk>!bLK4f#kyf`M*>7c5R;_X%$^?tY_M-jl4q
zv*Qth_g+tn+_#f<zBMIm?ia#3zwP=@><E`ovGoY?PIl`m?qZ_G%+1460en)oZy&vu
zp?mz~og3`s0VcXmy2zaKUk7?Vv0gcjeBN-LftH2nU6!iFxfQygHp!5!7KiVLcthQ7
zZO&MrFdJ2IZj((e3uUL56U>fWWsxwzB@?UcK5WnvZ~_iTLUaDYI`{6+gMcC?XFd0H
z*RoDSUe<c^`ReYM{+Smlg*_`)>^npM%lLiHv%(gBuJ=&!Z}Qzb8Mu8+d$j@c&ZUoE
z0w3)=V`<Ov7q=quk&uOOA!w4Me_1xeD7?nj^@!(t|7NH7!j|<&M16^6*s(s>3-EZh
zLxQY-V~ka|;QpB|NA9{UpR;gh2~Q#&|0XkI2qL6nTK9~YcFnEsCfu3y^{gG=_=lUf
z?mm1;>1BER?!w-Ik5Vh290vYoVa1NY?Z4(Ak-YZns&Bc#PB`T?LLGKK|JkjOrGf`~
z>^gjke`h5(2n$__x^d`V8*2Xu?aV7+DCAhi$^AQtRUHjHkLy^=oxeJYDuQnpxA=H`
z_mz&ng*!X@C7JC{_Vw=#=EF|dEXQbscYE#<(r{<I$L@*#jh#r?5KQ#G;pT3<dk#0o
z`R-(V=Z*#c*}^Ud!|i)Ga-Z652Ke5Bg*7aTjwSz#Te-~z?)_vFy5{}v!mbl`B$n~s
zqrWkfL`W0$r#ZQq0I&{!Coux?u9e2+)nCOsJ7ox(x5!g>SDJwo?re(TlJ38P8~%Bh
z#)L%(@9R6b8<KelCLDYO{a1EkuLECVL*6OAvyf7ROz~*NkJu}Jv9Lj}A$UwB1%AA}
z^E}M*1Pku$9>4qBlKzo2{9hk^9)r8DG|&@}ez~)-m9WqWi=0PyBh;T63Rwjh%5`sl
z!D~B)zD&pzM@k%2|H|$|;r^AhxqiDcL1yreq}(%P|JQy0r~hM+gD=VdQlq&0+JXos
z{NkzR&PjGR8vXN?{xdHM8iX%#(22zDyi?|P@G)@OcdFno-m#AdAq3Lv9(wk8XJHM&
zPV^&lE=}!x{<B*-F7I<5aJ>78@?hAZzrwvZ)@yU-7!3_ubpSP6q{fRoJDsZA5?~4^
zgUGA7{^ky^v)_Kd4?`nh^9GncR0*tR{{H?gCRw)=AI}XG%E^YYPOuxjn?5KXd-V<=
z*%o6<yf}-j`@c8w{wkdYiGqjh#~9iE)k~fuk6o@RS9kY@sUpz}^jrpy3T%c4^4XER
zXMz@C{0+ztSamhrvVeU(Rj1`~?9oVGvsdzwT<7HC4%3Tmzfr@}i+h#d^<3?ae=xfq
z`i!uSLA-?bRTHfD7lscx3P%u=&&Kq$dFyi-kOqB1O1Z|~xX=XbN|*64kp9>iQ;fnY
z=($dWy+vzAdiub8tjYoq!m~R$ZvTA1a_8NR@U`YSMexmRHERT)Gzl-ktR*n}FW$l4
z{q}lq+ejvL3e3NybLdyNIk|4mq$!-*BGAD&v<Nay@z1n_tD6e^l`_4B=iH$Cr@8)X
zHZ@)-k$9+yUeNvquz;dJc;YsuCO*{CVc3l>xe)xvE4B(k5<{#2JN6p#-iwp}X=nW(
zo`BhdXoH6f1tsuXH*azcz$*)fK61<q2u0U}md8c>)+qksl`HBkqU(1p1`5)rGN!#6
zBRF9~vg~2F)pI0hBVD?=ILgGxC^gv>WyIP6VoMscUFjFh;+)j$SXThb9s<7;g@b>v
z0%t#OC&-Qj)rT@QE{)Yr1hC}<!ARx9nq1I@+<<{(6Bu}Ww>5K>qw?oH7WJ%1GvT=U
zS3anG2?mBh5H}5D(`e`cvL<NZ0>oI(Vz4Oty=`uI)Q8RW(L$>TL7DYsPSmzC4wynq
zPo55pj67wg6~$wc46HmY<wDt@oYIq}bz#5^8V}8Gv@Rt@?&~&MC3cBf`lyk+f$+_N
zxOAQ39J6A$xkkdUvR114LTWD`3roFL^4O}rh8ZK(FV8~<`-YCf^skI{S%N_yl;eW3
zeD2?;W>pOWk=?o{lw!=bD6F&4yWk5l4MFE5V<+z1xzpm9>kmWJ67VLbvb2E*WCh);
zbj7;wD|<dune#j=C@{pm;nW||yLje3LOna0*Sk|ep#J@xr188)j?n&mGvP)*N_vjh
zBFoRCM)S>H3)X;4OWf+(jnB^xOFbDpW8hLecdBG7O5D40$OF@StyPKs(9c$HoY5!j
znwZw<%nI8QCD9fFM_K<k@Egw1ow%u>5C-7t=aok#YU#3OJ|D2HSPk#W(H+d!ruR5?
z#X3@CwM!*_V(o?AR<FMIun6<pMjo=J*Qa@<Nhr>mFWQI^9@2Gv*hRE4@>gDXfKcu!
zA(#8BjiwkUQF*AT*u4Fds(bNizP{|RcF970Z*2F$Yi5_YP%sUv;xER{&8^y-O0-e(
zVC<rh(13N4&+=?{rtqN4blXSOWIRyT#+e8uhE2M!&N6CKqkt~)T`gJn%C=*L@bd)P
zeOp(7w<0WF)O{fTnz)m7SzJ-pD}M9ZO5b3T$;FZ}3RmFA^>9y15XCg{ngGjWd=)n7
zwHPZ*%-=+Pu&oE0-X?x>5J6j11qurh_t|~N-E`&NFn`l(IrJ;*u>;HbsH^#RNzd$l
zvKt0s7bp&Ep)f7NrujGbVPG2_$-YX*!EQ^x-fxx=#+2aE(X_b_vvviiblAkoY1?MF
z%wPRO>wAk+?lmt?x0vFp%Ja{Ec{(T|umQuNDM|@q=ZX|{vc_}@EyL2gawxQDt@@s9
zm-2K}ZN~~aBs)yC1Us@2v^Wl(;j6RGG{m#2Wh4(OwYGb{EF`KRK^OXxH7$-*=(K=f
zWUJ&Eg=oHDV)7F=CmO;!X`c}P+9e+$IU{v3{9TRvBd1rDPQ}ax<KWB$TCDz}`!R>;
z#fC0)72Vfq5BNGziO0FC6mh@!%>_UZCoz9CG)xCv2Pz7c@XQ^l3N)q54QwW#o*rzu
zq&=Z4xehaPC$mp@1FMc8`pgw;<_8ZRn2Oys(AzhAMrgFs6G;#kfxkcycH{I)5|y?n
zb~Y0czJZx)9L22(^yeBr$sft_$RU4BJb8itrmXBSQKiFP$U%b4_C8XIHw6E-G_wSr
z$3Fj-bIq)n^!pijLuIH<^GNK7`(hX{H`K%ilFZm5=dUQOgYH07=}4K~=E_WJ2+Dn5
z;r+I^K3{5U8&#A<839mg>b`Y<??*TyD#miDZJ4#h&N!wdx_j=E06=4`iTtlsG$wTU
zjV=`Z;{^2YAM12|h>k`scBO~P$BSq|EV1I_yNR8Qu@&MuV=iX*^${=X!I(7F8|M?6
zRKP6FYv`<7WK>I$u9g|@Ug!Zq4H#9u&9o4D6(Hfq(y|R4h3BZ*)Zg6paXsvazB=4Y
z@3yYt<NeL|<TwyXJa8sxP^|z}MAO!K^NVY_3?*XLTtK2arHMO;U*h3a_tyV7$qS?!
zq!dIxkJ3F5o-+j;NPsX`(;D|?ECP)&x1SDRR$Y&L^0fAxHk@utJeT>2)S<)gfS%{7
znu`DrC>CR`5Vc<4@xwfXbM(2RG=F4fzjL?oJPDrzO`u+kjX#o45?y$&9BJ`>z~(gZ
zB>&Jzse_rj1ExPwl9WZSyd+=#N#6q5JZy|Ga?Wxta|2wWA6*Cx*tPd-Fcm1f`X6Hy
zY0S_-a45uFaS8`HLb;wCU33$Hlx?}s=yjB<_ajkW5^%wxK!`Imqro(1iH`U6ZZUSr
z`nb8m2|{mr>k9Jne3abg5?&BOO-Dx4TGCQeWmQ$*9PIAR(&}_*o&$pKRrL+DKAsh#
zS<%U;Rs$c`R+63<>La~JL=O`JKLZ9b3|`wBy8o6U|BswQknJ|ZJ`8y2BJ)){7lP<q
zAZKL|jZMkN3ioH73EsF;h(Vm@23|uY4}fEbUWpz^Z^K|z!Y$l{FKH_Iqy2qYv(Kl^
z`8R;Dx6$FMu;zl+&nbE5+A~>7_`Ih5llt!S`~;1$>(9oAJ+1msnjh|&23Puig^^b$
z#G3pl@O&@V(AZublz|bI0KE1_!cJo73Jx<$z=-m%Qq)*#<`AC^;9b|=T$_(!xpmlR
zeYTtJd)4+UTH#~>Kt~DH5WKcFt)7lE5eDK?!og=q$_0vWWCYsLxpsDuv(F>hXCp%2
zORL}>3RP%3I>Jr}#Aadm@)I0)%~?O8&2m$_C&6$$^I1cx%58qmq$S9LoZAzpS{}l!
z`f$N(`202ZuZ})n-yAqzU$y<1n0y>0)7JM`-QF5<XkBG@XocxL>4peS`UeJLK(Le!
z^2<r*JP+slS%T!HOGbwo6PNhCF9+IxR3I(d%5{;>3sNnF=Wsl3dOoCTyFE!JMLvor
zUJs~VIlzsCfVO7jTOfiMUC>&jY#L-UYmPR_n0rkt+@m+{K_~1iFB{Iz0uhf*^*sZ+
z7ZG9EogwJSwR2|pKsb)Q>?8V%EK`EPg*d?2fFO6LTxxIf+8T&mjDZ?C-b5%gHg@h{
z<zj!n3~Zf+ew$tUYUPP51)(|<7-4U*Kde_<U45%NLk%MLH}Pj2jfw_@4bqWsrZit;
zA%q{r<1}R7FdK$jT=j(gHF>p+LD<NN;@Gce&rr*ZUFy@#zFVr?B7%|UrJ1|7$Hl-4
zC^uj_)x4#8L?2-RSonD@%toh@_^sMkv`<JTWB4r26C`1@5T5<_K|7eBj_e+;^y|eQ
zfSg<A(U(hqwZBSPZ(rPpVRZwwnnu|Eb052JZxr_Gv4K|CE9-%RdR0E9n>UXf)|8Qw
zin<R@kzUlTV8{)f9dBg*b1OB*CIm(T8xke`#(^k5SV?T-2KW{>Kwj7tH7i0S`&nq!
z8xFFA!q}M`eiXFhg!t9frAkOvj3G!Lqo=o}qpNGt6eT^#O?At_t2vs#BTI`{iE=iL
z^1?JfA%ioEYv}_=UYy{$)<1b}&nhiw*YMd4X#)9>RZgM1jPO%>kgRq4Qd84lg{Zi+
zKI)Bf7l7nCU}d`fbN-9dzt*M=j9zju_ct=(kMiTMT?dZ$S8cb%2~UK`aU9LIjK4!8
z?3{HMIK55t!Ex}H<b0fO729G@lB|QX8yi7QAzv4^Er_Lv<Cwt#f9TYI?+@I1txrGa
z^Y+~KL`D#N2={SLy`c)7XPwRlUTtr$Er0W)H!bmu6LK=fOg2yMeQw~hA;Dm<3GqCH
z;1Nhq&nY^M!iLrbMiw*9?^M5>=?gG+uB%zs_xN})1wG_r*qkyC!5tNhKNd8u`ho6B
zvy0^AwtWGwPOz9_Sx!?iresIxhjAQbq?S#?va~VPeEp;RmSL0(R-jxj7&dN{?BZ$P
z$-*<+Fu2ns)dWGorR_+G`mJ@1e1W(PTnFpSL}P@2Ts}=?uOb|SOj=r9PPJP5l2IGO
z(dp9u`0fvGLWc<NSkJ|CHxeIgm)oocM1R1>ro`u`2dO%2zv}RqwVa)SOhD@l2NcB#
zY)l<U7h5GtN|7Ir%0ZPW-lXYQ9NiDKB>Ev==nMsU?_WE6sIKx!dR{A81J#SxLG-(8
zn+@uAmG&Fv>FQ$h^Lnnr=U=`09a;Z14EsvGl^_8DXS(~>rxyYZG)Q_)2t^EVOC=hO
zATgQ(Q5Kv-(%y%M&AoqoB%SHux9)4pqJdh&8&<W3tX6Ayz7B@XT*J@C<8{G#aE@zz
zz?Yk&HnLbcMVEdj=~+HU5){NqoMp}&@dlzSV{jyE=ciOM2gHG6RXJOm-%LxrW_IqZ
z>G=-8WZ_Gv;zL0zuctGHq_^-jfg}#}GiI_n=Z)^&YbqCG_yK%Cji5M1I7O{544Zs;
zezXH}Qukm&D#cN;qHLzeG&Fi44h4y1C-IU7LJ#JOu5@?v{Ua7E%QLWO8E?_2=dp3C
zg{UY}B&jYjvskH#^tK+Wz9Flbz^(p#koBoz<F&n+cBo`cwXIOa{WlQR+-OX$TD!jZ
zyn55-Ql+%7dAgH!LFtJ#d$B*VusuFm2cT%<p-$q;x+duHGxtk%wZFP+@17!(cc8Wr
zo8;GHx4yZGHUVdGDKa||2Sk!`s;UcVb_D_DVmIG*_YuzTn_Lq0A&ipo`g*U_NW+4H
z46+={v$YF(sDDUO^b}vuY(Z${*OXs-tDGVW1+JK}-VT?WroZm*F%&>3AAdT(|41FL
zk1E^i3c+(~Mf1fS1KveEjPJ(zGBaE^c+_u-&7YQcr%p)IWT<z0`0Z=(qisXAE%6XX
z9ua+{azR(-vCHkH-i?j{t&yMqsNh?b4i!7^jAX&xZlRPsp-7AT8p}bnp=r?i@sagV
z%stj<G#CFx{dDU$Z`h>BgvIrWBx{NC@OIh{^=i|o@kW_7Hw%~VBDNn^oTB=Z+U|xf
zT*M1?{RQQ(2<byaXnH-;yZY><#5t<xgJG<~RGk?O5p1VTuJ`VrAg__?`C2YEXE*&&
zyLuy<`d!MMm(!2AA4>o3=>B_{*&vi@D@%_b+5uzwd}4%)+36~^koY{lWH)z1qG#b|
z*c0z(*;Z;V!dX?BIn5*5UkH38Yqk{+T5FSZMJM`QN|TXG|E?Ot8FVuA+D<X@f24;0
z>jr{I!OLUz#7XY7&TbzkR4#opn*`4Xi4zy_Y%B^ZUu4me&n<JFU}ll567tr|Iw0fp
z#cj{M!OBO|PmVAK`16U2N<UPQc>2)#SCaSd*Lx&!l+Zf(g4z?i3(F{lrxYtTo`Fi&
zr-SC2UK4A_Zzzs)K;tLh(qDj?YJ0vi`vndrO@l`>;{Sxxo58`@px`ScAq==S|d
zpO%4=&{jAn=C{*odCLWz7|te*2nR_9Z!+`Mr3sx**2V;NA=z1NLs#u@RDJh+C-GOK
z)h#O3;!a^s_<V8+k3IS)wsK(n4Fs6jkYsv-p8$LL0UKrAjtkgX(<BV~Cyxt06ft0J
z>_y0G;*JMR^`E;kuaL>7UupcNAjd2$Chd=Q!5*S>@P_;z8FKI5lCcsP&DwS!bYXdz
zjuf-0IbTWzW~RfLGIH{&lWS(^$BaS8j`ZgWtF2@c@w45KOFARMa3?p1A?Z&R?`sz{
zzr>w-&hE5Ve9jY0@}{nh;t3xS>OKc91}m4;NN#hxGWiD`%dT$M6x%<()--hWynS6K
zG@4sETcj6zyxrl{?t=X5k(P|GdPGj8r`UI%j93O9>|?3=i{n0z*@G<A&fuMl@-8w4
zc4eHptad=*<alG$%m*e-N;zxsAXYHLSSlU)clAwX13|QZlBzJzf#H*HQBQ8~{C3?1
zIGeccZ#6v1e2<7`J++|-o35N={D$xS3EeL(@ttZuKSk5+ryojKY6OJ$Wq6SORR7ng
z_<N^4(s)!=-upywcM0kUFg(HiQA%aEZruuwjEwZ)i7uy+wzSN+AwyNyjAZ*Nnx`J7
zf7TXjQb?kHyX-DYL!i5FK+RC1(O&;zy4bd!%4^&z_bbg~1<n4eSMj}L04emb1N)Oz
z)0LH>hUMWJ05!5OD0D=APy_8}Rw&DI*4Dp0k_&re@R-ML|6Jk~v?p8dwA@8!LGa@-
zX*iyShfGBdrt0HdD?Yk@^&uSxE$MIyTA@1NzGNCMb8_fOXz+&vS;Hq^@;J$w+FChl
z>nz@c7%IYX^AN3&YLU$_tH8*^q;gP1QO+~IH5KGA*%S<kqA&)#wH^WW>8>cV^Dg`6
zW|z~#UWJsYJq$YM@`hX*p>s@m;&qa06z3_8z&rn~!7p*u=l%Q8>hBbEBFs>|A}@B0
z&vGZE44_y&*+)1neSAVXRe$v=Gf^-+<7?G``CVgSP$BXa<w6+Fmy}$6eG4LFvh>R{
z@g^IdsZxO_@+`Yq%_8L@IKrT=EQ}#gYC?~uE6TPb**{CKLVHNStfk>@{Ov(P+Ah=1
zltII1{<X<3MiZ#u;Y7ePbZMrCaPAb@>p9(a4)ewN-o1DE%|JxR2(@{qNz}$9O(`hY
z#%-W;kcu_0Xwgl)!NNp=S1!uglXXux$P^o_T53dbnpPYb16?4pp0A%@sE;muFlnU7
zmx9()vT_QUVG&1p=Gxpa6Oa&dGo7N*sdaewt;h9>@qf$T6CUBjY~Tcz_i*W6``J3E
zmL@~#?NVSHa4TB$=ET{)R^dgr7|#tBw{D6Wrl>f4l|P%pMKT#08fvmO*Z=CV9x0Zt
z1mTz85q;Hu{P{K{S1s?zs9EbE4I?}UiqO_Tpg)@LEHpFU&N|OP>ObI6LEsX0UF$a!
zZCu`xmxeJwqMuN!UX6W5QU}(C)^cVw&7+D$O}`5?UKlEkIy3oBDzNEgQ_V}7PGU@g
z>*Q%dgC-7l{%})kg7_#I%7%MO4WTzYq$wE370luzO1dx4*(~4<%TdOc87jJBDi3`f
z$4Z9N?Ju%0C|DAb0VXz%@u^OQLcOF@^BEN1=&ingl;l}Jrkg(a{A@KDL+py7w8uS&
zo87pjGF6wO>)vcgdU$$F(4)jD{&3WPfkjj?zO{|^{_f9oBXHH%5>6{25qfSjZ~Wd4
z@4ZiiNz74f;q1-zfc}dJtvA#y2$IgO;r+au!!Sh=EXqbW4K+pcH^RQ~CSVZsd!MxL
z_?+A3`^g*(aKI6HP2Z&(5@$!XDa;meGc!=CojwJLH5@oDDJilcU<^IaO>*2TKr?d=
zI5E2(Jm=#Y1wrMgEBB-Om29)7nxe*5KHiwz-(#&5T;aD*IrCnDYJH;J%5ZBkR<bTd
zS246vNP|N7Z8~PX@u$UB^A&GYQqh+l4i<8p%WbjKs9JXS?HnQHOlkjI&px(V52W0Q
z%cATivNDZ<_~(Tu{jfvG#it@zw}H<m%f7Xd&fZEP`^J`u;&F@la$m@1vmy&^VLv1F
zt(ALdPk5FHyPP`hn<BIDh@#6p>w6TO*A5G$?nj>sm?u?EvFvBI&}O?dl<Hc<vGmn&
zW7V6@c<_~|{r4{ikFs&;zcap-u9qFcXL(!WOij<~i|kyI$<=E<2SZJ7$y#Ozj<%dE
zh+qw4b88tErQ$eFZxe^4O#LtE_H7?kw2P`XgDq4mk3KQK^flTl$N%BhoXt((d3>xj
zIGPaLuE$57d^-4hbzmC$O_hgGh(`q>hpQAhv^yR7nC*7tJ`AD!urf22ZD*yQ4sAJE
zbWiqtzXv|*j)9(%0i54?jA{-!P}$WpM(nRRc$JzdI>KiIbS4^-Z-w4S80u+r2Ub$i
zw6hildXj5ay*d0_$0FB{n7Wx>yPLO4dHTG9((B-3f^S}m;W-<duAb>;W28s*U7U-w
zaksA6rgQmX%{w!E!d~0=)amuldakZ3&iQkNwKTF@JrkeS3=!K~<TNI@kQ=<h_`seX
z^w1oCqPW1~RSxWe{+RWT-Wa6_)Lr%FsCA`_b4uZC3wI~j7raf>N~dbHTRcpeMre>K
zVn5xA`{$d}&Pbh&?#<m6ZLNvI+EnC}4UH6=no`o*ZzUf`qck9s9B}(4Q7iq8p6)>Z
zEsh+`l82?+m2SFy7rN3_R5)gaJ_?bdFJ`H0?!zq66xYp_2GRyftFLYceo}3vJQ+Y)
z+#<MVr)Bp$xc=|+={5_Obsv{2=$_M39=?J00R3J@Xn8^_$8^L1Kb`biXmI+eIz=zp
z_q2CMBgLs3W?mnK!Cjq~X9bm?9XcIiLrR31xw*VbM1<McT;{sE6Sm26Bn&B<tio2I
zT61x_dSgl)&!Qx{s@mqX@xbsRa6|Ge#2#wG!+!^3T0vnrJ?=rxY2{S;sNBImwhM=w
zkhYcwn+DyY@bV&Of+loSlHs5zm?W*8dlgfWJUSMAF4IKgdWaVHM#Tx`4<0`*;)0XX
zJLbcwO_7%l%QpI5XyNK~JspX#RV%@7hlSdT{zw>R8gps%78{&lZ?Q2Lq4nrhyl}AD
z%!J;o>ZoECoJ(pI_a{UCntog8F%#waIRRvhLPCWEzy-cJs$@7?q^lsy-Z1MauU(o8
z18Ogw>dAek*r?{#Ak07^Pp2<Gm$>V|-TqSE`TK|5-f^q*Ka1JYHEa>=)BkpT>01vm
zI`CgvnD!7!X-JThT(RnD+6#N<i3d2hcdq-r2{H(Gy*4KD++DQKaUbqMXnwdZtAj!}
z&QG?SFgHXIAP#Hic!%-8?04z2AEm$+=&;I?P}0TDh%FCNB*L5)^jcri2&5t@;M6im
zeMp>+2=mQTGjP`sw2m`pLBEM_f#MFK4UoEAqRU@?EA&$8d3WZbFJEp5KKTArD_i{b
zAi{b8da3N%1vh~v<s8sczag})UyUs;)&*a9XVji5V6+zLSUOUG#ceHilsqsJL}%qE
zL**1V9Jg_k2m`I1mNiD%H$fo9CXD%b2`JKR<4bxR((jh$@tL<t5L)bM_v~{$hZ@5<
z^=)i;x@BwAPPjEek)6==j#F5zk=%NftP5OzlLzhG2caJuDZ8}hA)R1jJ6v?HIzTzA
zub!-j(7HH)1UBJxm9$q5?+JZm;J06FLc3f;QGL`lRe&Ho0W89)Y_w^wGzOujXbhcu
zbvu_pNcg1SVv`$Q)2_3JD+d-vQKQ?E*C4ME8H{|j{1cJArEH>dJwug+hOv-!;;w<$
zxS8;H=aR*_ky^j5V1m<kOYJ<leNGAMp0DMysK7t*j4dN(rW~X|_S964$XoU@8`gZs
zqc^vD>Uwl*<Er~XP)sK3V3nDvj#-daWM8GY+A#{!WUnyubQQs=N*b+G0r`z(B?>%?
zY5H*+YxCN2jgv3qT;r~~&6UW<^2mgQs*G=1xn0Fqu)lyjpn5_kK?^^hk3(vfE?e}(
z2;;a;M6AxTcW0_CmGtrcvcvu@%zw#&ACaxh4{B6`Y{!#C6smVmMO^WLOUWC)gfuQw
z&l~Ghx<29_w_!)M>5hXMPn1BPRo{qLV}W}Dh{oRX@F=gRpMEg+VS4c=KX2k?=na^%
z6wo(2nzy{WTUs~rY=N#3@<|0fi3kh&#AWg|v4yH_VCuc#GW5VtE5(&KyTco>DWTr=
z%trUtBk08>i6@<`H*5BK3i}{U7`YIX29P}tc&ropclM_@kNA1c4`T;A6Z52_X`-Q{
zU%Cds0>0j6Y_9JDLNExLbnW|bnHmV2%GPM6Wm_})Mr^tkG&VM*;DMODx0n0~fTWIc
zSBF+friFP7w!rE7ud3Cr`e!Y1(fv`{HgVr<Pds*Ao2YNYh&W}Ry7@>{uaml_=(L5-
zM~7BtkaNFNRd(xu=0}TGdn7(B!AmG8B;;5DCtA&*MGR;u$uz}pliHL{oG^<T_Vdzv
zP))s;O@y`}0mKwL^IJPo<U|LxKH9f#LN42qKLVVVkR^8JSBO%eCpo$95Adx|&ZKsK
za`V(`!{PzlLA-5LXd}|GdeqWKt$DZ;5wBqyJ*d-KzX%2Et4esAG_Y#7p8iWXCE6sE
zNq1Knx6>;N(JzK&ablisRb`1z;pipttvTL&MU)vqCZeiLa5<~E_Wj!Ca4YBi`B&pr
z<%LW{OGp(W(pSloeF^&N^al${z6)T?est1YUvnSDEVVdW3DCO~ZGDXyZdslor;3|6
z{qoLh6Z-YnpM&FCmrIgb#Ig~3mZ>u3sLRvbPwsDRBXyqG#I$Q-(Po#$re8?5UYp9#
zd+D8!)q-}pj-uJ5t*5-q$j{HU8M;VB|KhY6t|>a7c`i50TVy#)Jm_Itzsp*Ab-WYq
zG<I}pLG+-{PlZ7uDD|%)C<GJUIG)cn8EmNn3Z;FxF~6bu!h5wXqCUXF@N65;)|+Z-
zkA0@lA~@fVY>kTNpEARzwrqc45f>U1B*(`dC~iSr#{B2-NJt;0G^)sG-M#2-Dx$>B
zAHrf$SfoSddCxM>c=rWC4Dun?vs_Jr+d%ESQiNx2MxXmyK2g(5QM-}3&DY{lFLF&o
zuc=6NgOPlMyD9YL_j<=)+iD+OLUTXnXFIj{VjYz3d1A_;_1m&EhkY`S)-xrpi}RFz
zO-Gwcra%IX@-g=OW=D45!?jyHLr~9&<2FydHvEadIpjUU^h}oDp;(2J9CuGWoQyIf
z633t2ba~lQb5tG@VYcC)^O&~QpFbZeaYElee%>ke;{fzhh#)E(*U3MNkBJ-ovAEcJ
zX2v;s?-|H~r}~7%Rzce2MW?R~y48Q$*)49x{YZ`$W%&M;fs)qI_#RA?yeZSr1H}m;
z)+QZ|px*^7LC)KnY)zxkv$=<TyZA^;yem3jVe<?Ja)v5p(>NV9Q^ar8<9Gs1^<}fb
zq9j#GKu5gFEh7rOw$SjShq5@8d~4>r0ai<ZfyZf9HC-23WLAiz*EJ+A5LJ>fQxzOu
zum&P0dthiE%s(fN#SYSF3($fRv4;DVcS?oAYSfeYW5%LC8K6;O{cOs3_-6y4IAZ7X
zj5Y}nI2?A-TiA0(Wl@`DWE8p`Ch@pJo39hV`?QQu6d*t&{8wL-%!DV*5;tB+tNS>%
z*Wxz6c0*V|L;L6TGS9G!bn@Ymk<3xpTXO#XYiqWm5|?#tw9nnDPghQpzO^yCn%c62
z$@t{qm*3F%X_P`XC7{~)yRezi*axP$hK)20wsZb|%Hu!UkJtN?VVv>bGHU&F%oY<u
z6Z~EgU-Yugc*A*`F&kYyZrrOiYX#b0%VR^;rlWZi4YH$|?l)GFD?M{>vNg5p{}k6M
z_DWJK(8X7r&z6#^y}4C%IoTHxU6CXD@JBBDwn_S2UlapNy@jplhJyh5<*~37jbid_
zfw!?9fzNVu3WXF;VDsefWfiLr4K0#s<yjZ9>zAr4XOkTr&@QyTG~c3#$MUl2dMiY4
zCe00m8LX<@wW<6D+)tkz1%JrA<6Ru+iaMkrB{n3Kw(ruvmy80+AE_Ns%KCwP&=y+_
zRgO>Ut3@9RJ{3{R7Mm$_{{%@|K@5ljYx{3yWab>h>Xsw5u37oNe90e35Cl2RWBlCR
zsc*)BdNTW-_Pg4`0Lo{>>n{aHf<U^XHvgr1NU_5ub)TDp05dfCTICae-{$`zthRX<
zFg@}C_*m@V>z!Q4`UF}hz4hwYAtqj4i;jyk!^mRqle`G$XheHzf_ABXW|EGfYkS75
zGkKWIhhCZG83Y$XY+=rqTKObf(1K%1X&4kX1TpGCclq$&ZKBV)L9RR;cwG?%E!t)1
z9l7^x<x8vIQP3(dzoWTW9eA=4U}M#8kyV`$?lr8HEO;=#;lQQ>T+0R^L+XDZQ+ho<
zJ|=E)VbPV@u-gj=^@n#(9ownl`CfZVs1$^RBx@I1wpbxnp4GX@c9YS?mq)c(r6KA&
z=)Yi_@se5Ip6@pRa>Jv0YMA~jMIpkybi@ua@{Wo+s`6fH9L;k`x#Ysxg8_nB+lgqI
zrmWo@;B*Pn*SAO&2>sPL9R=_Z9~^M=<MMf$ZWw}Q(7t^=D&3PW@~vhmo6uH;D}{PE
zQ_+<BId^hNDYKZynh%F>ZO&Mgag<G;_ZCR=@Ot2pN3D6%!p-f)o4RlED{M){^}XU3
zBOTl@>CzoVQd+GWm-St4;1>N?P5a+kWj50GCU_jU1Sjm*!)h|mDhj(_SadnOOi>Hv
ziRae8@-S>pJc#`XURiPk?^dkoTj#(B^g!e%Ui40^i_oOerxIfddMCQflmqIbX<3v%
zHMkYqem(3l)y2)z**b3FU^3MrY8v5uU*}fl2{U6;7xcH6J7tN4XNS?ZrpO0U2E8X=
zlbdu-&d-Dol5cNa*4jj}>#iXygr?1A046zFSRsNAN8DvXv1{3cJ6&C5*D9G7Xx)rg
zudD2t=@xC==G~-pF%m1rwO4P-g!j1>rpQfU#=RRg8f{T2*e8Yvy14O`Gu_+BTP3%l
z+A$+^Z|}cW!6kyJ+kX5I$8RV(;M9HZx9{;xR@gV-jPXMbe|+Hb?F-~Zo%_qP12Br}
zlH|06oM55h=}Sb#nl>Qs0<A~N`;V)xkhVS{p49hPl2Xdmeln~*&3);TG&Jv6wE0?X
z)F)i16pN>ZPoH!Ne+%iEeKUVAWa~2W9B(x^7Z=IrvGYpnu7iy$+pCFB3F01f8uS!)
zX4ES_kD*)?)2#10LG23t$7V->E=&MEpb)v_Q3++YcT;H!h{O|@yC%ge^#*T}5l6>K
zZck7)5%77-)hG2&skom!oK$QTvF1JqhNx}OPM1F{Q_>2wqHtnSi&e;r=C>C*!27{|
zLN;{%f$gz59}3T^>liWIV(PO66n0GqQ{k|F)Y8p!NIFWy#QA;qwTSfv*AIL)$7vjO
zO-~++Y|T0~xZACfxIyI0%_Z)+={Pe|fpoxaN@lM%T;%;-w8>XYFn1D{%3!;WJ(8(p
zI@?*c`FR3*nJM}xulOG&BtNn>Y+N&rk-`R`e5c*7XDgx(?Mp&FYW`zjn6GLfhi7q-
zDIXH-yaJQP@Ob)w)k&GmAoOSAP1PT5iISq?+vroP2epwiS4Z6!McsQmW~o}d0Xdvv
zKhZE*-$&@oI~*Ej7WQ$iSn7~?n5$m?@WIq%ja~vRlP9ZZYrN<(tgOGfd2!4L^X$tf
z!z<^Au%T3`fLQc=K{&tI0B+9VbCN*HX51b33KHkew4zmd64?lj`!&m-Da9k1TAXOG
zIg@@x3>^KNHd>S>U9XO29`SfpG+~u3u^npR^Aqi+7EDUgy|#j{VH%vk9CUBaYt^%0
z{ZJ?;gvPLP;cG$<oAeFpnAFB!EZzPtyWFSi6vv%?*Zao8Ly>upN}B$=IhDefnd3sK
zC+DARNMhFPu_DxluA;A2*&k&Mgr9G3KTk_D;c0-wAeb6IB*{3LcOYw}l=G$4cxh+!
z;Ye1Pw>{vrl#1+RO}L~h9LGk@_9hg&MP)LZMQlI*!!Ungwh?(NMb^UhLVtk?vMILW
zb^(zmCiP{qUfdbwQe~<By!(Dl`UPF-r$#5<VJ;To>K9SMT(+-K>e;g$S+^wH{cNFx
zRXB9{C)a)5p-WNgoe0xF8{L+OGAGN1Zx>`HG9QFC^N7aN^^Sh>{r)){v;JA+-?wHv
zb=zn!7~&ual<w(*;KU$!?@+TLyG~J)wYb}gdFe#BPOK;P<Nd>l=)s9XySGR<cgWB7
zA{O`8ISDtLcV)Te-5dlUwF%VG6?661*GVV&DGBF{G^@jPR$oVk3+zkO%X%j%laK&g
z71Qp%>u~l=$?JlRRviag?Q<1y9929SbLIZA%XIHIDDE#@e~mlz5-&2Z$Wi{|Isv;J
z<wRPJC1$`<^7L()O?HB;2lu_Fu@E08&(3)bsf}Ma*hDYnSU2v+m-GODFwy8lK?bJ|
zt29da67tiPpxoH<WWSp{Dpd4UBL}j{Sdc;oMdh{HtwDRiy~4|~O_x5WttpTMKk9)|
zShsWq)P3_4(zWXqdLKS~Sj*bzvVLPK#V40EM#x)Dwtp_QTnS}T3V%VDV|S(K(j}$1
z%c0(p^Loea%UlqF*`xXTXYD;rL9ye1?c2plSLOYl)xkJ}ECuhMT{Nu74ev+Y6Cb^v
zcL#Zb0Oj0pQySj?p6;~Qb+sw%UK>wk_0L-iY0*^2jwM^F*<Mw7^8HL|Q4A`f396Tu
z5P+O;c6q0C7R?p`n5b{;od-P+hgVX_#fUk+oqDg3AkU%Gqw`TGA+Lu?eYjbFSijeV
ziED9TP&`{8#Vvd2GE#9M0$=7l+f_ew5&1f)v!B0P41lkzH7d4VL!(EB)onG0uRZiM
zi4n{CYP0!OQu><a`dX=|sJCvO;Ehb7;L$7@p-bq~M`o_r`JNSxXH{dRjyPzWu<b`O
zKQ`d59%JB^>*Puu={-Y#_@WKwjw>1yr*5)p9wnCQdwdIX>+#8vVb-y<#n9Bla*d>)
zTY|_pQ?M5lZT3%gGijRRRDCB_e-4D(7B)2L%s=K`7URMPt0{=`3(jx3Ip8ySRw?D(
zD83P4+}9RD7nxdnnv<_rliAOQjo>*2ADq_`!`eS~{UP;aUX-)6%{tRNTNicb%$FW0
z#+FO()(@MV&zSb!Mh=65D|xH9OpCeds2*+m)VhjkWBl+|leZtq$iqU+=!LD1kIk(_
z_Su&3=<ZawQqa$LV9)>YC?%!-6=2414pLo;#CQWixqRPM<wM!!IOtwPHS@PE;AoNJ
zS9AKGV_M|&FUr2oHp(3=cg5TY93i$^7)5VA8P^We&8Ht2qVC0Frw7Lh&6BQNexx?n
zI(is@-`eI%``Q+aHn+&GEQ&4Kjr{}!p~B6fg|YW)c1;xBqYuYkre;*;YysJ$F~FhL
zOeY-xF_ii<xy8KhF7IXM&a?iePNq$fhW5<Sp}DQ?BbV|Mzyqsi^@_Y2RNm^cN~gwR
z_d2*lj(A!(x0^p`gbcRyWQ;|#eF-lQ9P*Im;OASMKjukmzgG^_7!ag5oTrhc+1@Y1
zM8MreU48J5X^%HZRRoCrFcfIMW^qj(X_4Uk?Y3?z<u!9(Z<kK8pV|_gHk)sKUor7s
z4r%jH^qX+<04%FRSl@|XP>Q|#&!1qn_SrCI`|%zjl9w>smBzK2`o*hEU0*mk(Gm&m
zGCeQch8aYlP4DO3Viaeue(jew<BQEwqPF6Hh<pk7#`2<u_*Uks`?hHURP<gy6Gg4!
z)ji=<6}RzXb4ffnvwO^m-Fb@uuwB4aZZFG~;x^Iq-7RTi5(a*`!&BKx(a?@bX>k^U
zPTGm7XSEgAGZ9GrZZ#-C_w%dqdK>7C>b<oUW!73Y=64)axBbLlzG$=gdY_w-cDgd-
z`gafBxEP@Mt2ea0AG~O`C@>|wwrZ-3lpff};C@W8PEFEFpb>#82pAIoVZ3@@H&VlA
z<0Sp7Fw?`0b<{37JVx%{5;bSKDj%m8dDSbhU1Skdqocd4lQXR?C3G}WKss#}(Vn1b
z8=M>e=>YZqR`av47xE|BLte%dMR9E2?f$G9zP>Kt*`t(af>vZPso?(p4DGh1krty=
zShE@Ys^5}2I|Jj%f%?*4LmP?EF3h{zzID$`_aYT&m+{oNJ(3W$?8#!SK<bar6@8sb
z$#YYPjauxVzn<>o=42M9_>{cbPiJc8=`S?k?mPS6$0VQgm)oGB)c)?-Ktabg9y^Mc
znoATsAk6lS(hvD$3@7iqwP#^l8nF2jnTSezKnEi~qrnzQlIG_EOqqwinYb`%i*EZf
z#d8II9~+DNS|HA~$eA_0aABxmt9*A7jH0X*74#kInaK~vYD{%pBy{QN+O{7fEl}Ey
zcVg6Ky{8lXhB6&I21M!Rx1nMykm%8jFQI>IPUz2Se)weUHH3re@kf#}P~mPbCiYma
zXNqqtQy=g3+cS5<qNh&RUw^%OF~X~LNa6GHndsse^>jRZ4**Hkp8_0H2otT-@fL-e
z`Al@CrZ>FZr5}Y5rRU&Fpn<%B!^c%8;TN0~7OC!z&nHl~!Qak8^xBI%r9X5+_pCl0
z60jLEf4q3bI$8Y7?Ak(FsFR*P@nnuc!ksqV_4X?Oq;FMe-!#sxbZfLZy&8JQU<50f
zyG8)3w;Lc)Go5)0xybuTN+6RJU2q)>ozvOT;ii*eRUXa?)Q$9!y{yZdWQ7LJc&_K}
zG@c<^`Uhb&ig*3HNP^yx2y0Qzd!k2mg{5)q$?-`>n<g9QN^Pe}I;TVhdfwnPQhi;9
zeSW$m*s@<f6R~u*w*t4@8WKTEHg98nU-Ee0dZ#5yXbpvKB^HU4dSG6Sbu8leO?^lv
zIj^QYKIC<;B1_Zd28X#-h59`GhrEaV=Qhw7iz#mG=WyjbRmU8X$tP+N#WEfl8BJ-L
zwg)r|FIT&TjJV}XU9eqsbZ1Xn#(Y+)m1E$~{*HaS*OSL{+RkU=!>A&)r)PqfVVTp+
zse(n2Jk+#py2;heU{g91?KpUmF)rxxpmSZ%eWbC=C;A>8@mE6BOLE$XJ#(Y$<NFjA
zsywC?=Ti)=haIuLI=QA;=?#mI$MXGALY|*0_bre5Ti~ZvP<oeV21=i#W!feFv_p%;
z5s*6n(cc3ZWim0zp;HE*>H`c&6E6@yFk|EMOGL>P>m<YZ=B?n+;*Y{n7@xS@@DP*-
z`u)PWjcTrT;{2m{&4h?g04SUB%w*3bMH7;oE;=mgCtC-mhXeFfE<l@`w*p!Fj+l{f
zsBeGlKTvSQfWUWMfOCR|;PZIDD=yQc>~+4V?S2NALYMV*8A@!6@Zxh0w)@na`8p+4
z9#yRDYk<dSfH5fo68n{31p=FHxXo|Xk+-Ley(24F-0V0z*P?f$k8mtvET64s(5Q4a
zBXjOnYg%P+m5p}Q9daYn6k_t`DRoV~S{VZ|HVuEz-?#|LUk0s#Ro_$bz)oQ6pq_g_
z;Fehk`oN+zOOzkVp5Vjea54Pr&5<_rv;L!;l|QfBlzbx@{=(-u(E<3|c`X%c{mik!
z=20bR@Z+z}dGTy+16;l7aByXrY(iy`PDxs}0}mGh5i|=&9#73yGk}MufFO3f2@cbg
z73zEis%SI)`DvX9b*J7K25$^~BTB5R{C)-+sK)V!ktj+m#dP10Ex(;@Qm>Tl+Ok~r
zM)gv?dbeY6YFh10|5NKX9ZZE7`57V(X<D%6Cs_D?AI<-?G{AQQVYr!>Vq`qv$27`p
zNY9VhhY6jW3r)OGtZiHQJS3gIAShyFkTrA)_ig_)zkIw7^(5BN6*6ArRR7f&8AT~`
zvHFHoM1Syk#;h!lEfQDyNc>8se~9CD33titvW;?S$U0u&Z0r##aNYFYOBELrZjya4
z+pJ!w!hMvK8Bddv`?Bp_xJpU?Q5)W4L|{v3-{uV4!Tso3y|vN$d`81XF<u&#@{%vp
zDu;7Sg{5kbhx%X<j@gNy%1NL67st$gP~_*=Cxl_BNYCMG-(Cm_+h8jZZ`7<CKx*Bd
zV6;bT2y=ky<&@pmq0w|RF6^<(8N15mhJw+L6H*2^nC1wB>CTu=?9Z{+698PdSJXxL
z>(ShYx@4AlykyJ?lLGQ9B$;BiR~o*dwxRJ>g9E1-lVomK2k76cGF@*U-n|?9hFz;e
z>ja1`Q64m3sP!_h>OWUUm|j#st!2Py)j~1DbR}*voukw0ZSN<W1w8HCFj8QAkZf*V
z($lg}EVG$5y0tmC{MBoKydsWm{ib2i^!ao=QVBp*P+D?jP4*Mr5ZBn;*B*>Jl8GcF
zNXsxuC+OEsLsY??8zZhdPiZ$e2#|Ak`&wF;zWh`o7<w+&k;WPyk8}|ywq8G7pC+c8
zAwapH@o2^?jg>2*y*UkkHV>VQ1<t_MoOC)iI5ZEN!F0i-0tsiuN=Qqp)#h;w2)s4N
z9Ph{$sU{D<uNeHKc3;O^%Yrv-)Yk;p*k3HxYY5c8@Fi`E?-aLWsScF6)w`GNVzq3X
zzSjdr*SVas8MkIMjC2^KcZ~IfnZ8gOQIXMm=#D&yMXlKF6U4_Zhv@ih7#MC8U2Zs&
zV2AG5J6ZJ@5Us~h0%{ErFG6}&?Y~(B$iG?|Tr{hr-|DQCnQ}2_Q)qqOtV#(Mm+&&~
zV(n{MUThf0nCGAmo}oIRy3R=>Mf9R$U&eWHn{CHix5NyubpCJ~1FVaBv!!yr8}-KW
zAWLe4ha$<O(nY35CVlxM{y*qt%bY~@XM1vHVx>!1m%sH0((Vk9{710o?Q!Cfhhv9J
zLGJE_q$z8r)n1|ILw)nmO$vEMt5msHh|Ooim;7V{ObVH~L@n^D8jOgaz>0cZoQJ`^
zBZuRx8Uw4!k!85P4@L@CzR(p5pF$Wu$mT&z;Q{*J0J`^0ri8K8A^7_>j?%T$fP5$Q
zTxpjffVo?ioL*3hZ|8<Gk)4Pn42h=Lj#jpatv%Iy4c&Qta7j!6H!G;nB-4hg>P_9?
z;Z96+y<g#e*ILX04cwKbjB==*Kyds4!O9ZgfI3aNsAZx30YG#GtmRP$p{0Lfr37cW
zdYZUo{)6SJbM|+eVlmIn$X?-o%&!oRTW;ix@TX!L7>;5c-;~XIp$&*Q*RW0)?!2dW
z$HaCNqWc5V&H0JVD5ykW8~{_2Y8e(*RlbmR`P{jW<<AzNH{zn_9$qBfG`MF-z;bO_
z1zT!k7BDAvDrf*a$Ao<;Rb&G4>K)uthqQy`1-chuJSj;EzOK4IHmMG$=w{lR#%&?W
zDVorlb8o%<@3miIM<noy*%+!}UNu1OaM9=I&7udwre<!ViI1$eE~sThybj^DoP^59
zZWXYiI*Cw{z=Skmy>FFNZAXmC2Vd}`L~orkX;bLE(KJahkl^4fXEEHd_1c`?6E}L6
zvI$@5{Dl4PO3Z1a`2qf9%dm!-8uy<+j%v{t*RvyZ)*WY@m+HNZ4-w!T9K+W%|Dyr@
z`oV2u;%!5R>{EIuFYF=Fg1*EPqFt%i+_7<PAMP=YI@4MhR01gPosaeX=<1Tm=r+_C
zIW?#qXk=@5uOu4vqr6e|dXdCOabYKYTwO+tAU3`uW*%<VRqgO%xaL{8wIH0|PnaSz
zZ4M<a9@?55ca-+o07zaGD+ah1CUei6=q;w4c9Dw_=Ryq5#1PNTJH=$?l*#Hn{6<We
zpl^xx9Hun>xo<ky^ktrop<d<}85#G{V>#8r{B86()Wu{4GlD0cN*h!%+-0oUrApa*
zoLL^qZ)aAZvgnxeN!MkVvBGWDesY*f(vKnx>g~dTP@pI9A6&tJGebfgbQCZNy`&H_
zQsFL)H9hXwdssz9g%BSJEEHxa89LV+&nW2^n#{Tg0oI#q3uYOYH3dn@xVddd${hu+
zZ?4!CT6TBLf2;KA2m@l;ALR?I!xTBhCv_czo8p9fwL)NhvRmN$wSCQK>!Qr!SzwUB
zvBp@*xL0*+X`LGqR6-NO^Z9eJ)k1qfzP#CnQ<Z&@?QmJ)^x->t#s33M;A-1vZ)tst
ziO9absvuxll;b_KN#mEg;?6aH;YSPN>Rtz$@Oj%oRCB#cx}6ny+t@WB)Axe9hGM+e
zel}U7U7DM=*Rbg!c2^lzGjGVnHI!n8>zW?Eq7&xOe<8YY`%W5p%ZH3oKb%Z46;nud
z@#)y@+CoSfXY##5F6+2Ne{-xTdD4Z@Vf&m&E9fR)x$PFx&!PHAT!08O#?<o0a|_2+
zTambE(j$H*?2u3or8q68PuFq(fLFmfHsuZdm+mtENlWNR?tZ>xYcpn`pwMf-ZvRbN
zRyJUIv3_1+h1O-rknCXDx<4P6_u&0ve|5Ls)N0Dl)R_d^yp6F)i<{h^8^Nj10k9KC
zN~X^<DzuTW0|P^$NG&|pA^$?$V4fm_0AIP(t6b)2k*@?r)d@d(FT1tY=7Z~3SFXZP
zW@b4YPvRvlao?e7yTqPv1{DqhI^gN_{3>BY+LNIQTjh(t_Np9oyiQ?Hzk@o(^An!z
z>@R^as5B&YR|jE3{%!95$yL)Ny$ZK?Vc+LZEIj*+CF2~{+t&e;^ZZCCMU>r6z-8a<
z*Rjypw+7BUr(Xu&k@nb0-;=f521l=)28ufX|IOEkQSx4O)_vbSSQr5H7VI|6r4z=t
z-3whaHU_K^PLl}af>3*}QNM!Z^ciWFV!#D!t@v%<99Wwlj3e7#TXR!+FW|S3`pk`L
z+-5_N%NvS!jZlg})8!D#lt!6st7TBi9)@W#g+jt8*{X2Pr~qxgH@jc<Y&R~=ca?ts
zwi30w;@9I%7wHbyEoZYRXOyT(l}j)9zN0@y$4Txj%$y=8t%KhR49Aj&q%^uxPi&Ar
zCXL5P8jO_1b{MtE3VQHW-}P_jj6J7d)QLNHj%go83ji%92~A#cJ@c|*Mm?V?vS+{C
z^zA6ctoby(vgmmY`j3<MEs$E>UlA1<NLA(p9LqLiqgMo|k;+Yx58nFRSHSe+Gx22c
zV&7$z)K*^X2{yg!o9pwJxw*e(&MppBXk1c?GFm%$B676MGeSOQBlP*I6srZ+TM=Iw
zA(V#nm=M}9ski6dsT6w+464K)zAis4xhKJ6Nk3m5@7}Q<O?R&7codIOy!B}1U>532
z2A6(o1|Q<`FFVfX_5Lq&1wYariO*%B5}^OrX6xTW<beNKD}EMb;QAbrGi|lIfoCl{
zN1JV7t}%4q2TFUuFSF=ZmWx_Zrw%Yd_X8YP)Uj-J8x2F3D|H6nRY@lcnI{HqQTL@&
zw2tww2sB?df3N4jV2L5b?UaaAY|b)F>xRG)q8}B=i>SWn!20>fEdwzY7V(qzPk(a(
z)E`H5eb^+p-6?MKHU_hN&_Qniy!1p9`l;BBL`s#u%bfclnB&VumcCG}-A-1FgF@wZ
z98Qpp{Of+0BY4<;if89AM|_Q7<AvJW1UzyOnsQRuW#RaGXL*aP)jc3FnItt@=Mg?m
z3m`zlp8(IT7rB!mz-U{!k@|v8bf5yc-#w$B-m#Z<<<cCd_eLNjv&t(httjY%#(NdK
z+W_7l5u;uj6c7vu56&zRs4+VIIGWynDjzAB?rd1=>?(U5-`U8CVke;70ZRXTgq{6v
z$!+Nurwm!AP^&#UWl^0gHIs0BbDng%?!9NR7m;8d<{)~~`;lI8y^_xc;1?d!X|}~Y
zW0VVz)JW_frLOSLR!#|^7`AX3aZM{N&C&eu&fLV)Gg_2Mo-l$>qf&9L8=We!1(G?I
zIGD@h7sw`z0`iV*D;w&O7C>XgE%340-mfdCSdNNan0q0fPo*+BAK_j3p*nvsmvpwi
zdMa*G%e1v*AEtLLi`^_PO6>T3TX*$Nd*u{mZr-i+lUEwH8U0N+`?t_qc$&guS-k5~
zDK+CIA=xWCxKX1k50}1amVS*TYpKEG%ws(GS*~TMv2cvxJBPI5Lwz>ZYZl&6Rw|NT
zL2amBuo!%o<q&H}wa~Vm-K!QcxYcv0*fq6>QLFVpR(~R;<8wzS&&Q-w*jtQ^k00M?
z%9xF}|Nd0)F-{=SHNU2#iY(S@;?caY^R2tvC(?-A9p$-C_u*yp=O3U^2??GX6;U~Q
z6#;j9^7GB!beeGnUDk1qG^v(*6BH<17%`BhA%Kq)e>nY|U8_tMbVk{F*JoJTdmboV
z)cLmB+W85+DTVGyN$N^hlXM(RVN-A1T#bpvIk0k}ES+N6wPV*z13(qx7Baup@zuA4
z=YgZ_4wKk>Cwc+VTIM1+D&HDear=sGzfJ0vCgoYxEW2g;1B8xE>woLmoVZ!!rSClA
zIu$iKHF%8BjQ}6rpFgQm>^@)EI}Rb<K714o;iggfUt9fQtAb8@kanSBCBOET`$U+A
zh}4HGHbcy39``=>aK?Z{<z?-0mN)M`&DETRV+<D4uGu%2Pj8gzKrz11E{OycBOt!9
zWg(jS>@$Duy<)H|nF3kw+%*_J4v14~Yb&9>xt@TkK*alriTr@fCDJ3{1X<S$S!eBw
zKCbhl2`L|5&rmjzvQY>Ek%NQ6iZ+^tqJS$6Ibi~NS9oY7U1sP@zD3m@`}#y@*Qjmg
z7R(%TLc+t}A5S1A5Z(3=RWK0K*QX=d6^Z>w&CE`aeD~<s4l>jCKPUO@x!8lVIWw6_
zL)0_;d%PPjgI?=*ek)Usvl)A_5H3Y^sW)K^*v_cKX;V85vO2dbgb`D7MmHDaOlnN*
z9wgq+!`s(&nDhVR?mgq0+P3{~3ksqLqNsF41*J<BkR~9#Nbf-r5Rl#pA;tm<3P|rD
zy#<ioK|txfL|PE(0*TT)&s>W4oOAV_z4zz;?s@0lK(f{>V~#QA7~h}Hlv9NmZO!rb
zqe}Iwxaee1%OhK0);<y~#Ty$B>he1z=o7lgDo0n2-;P%$9auT8Hg+h1y&@I#&}-)y
zP_C>#dY=>RuMp2P5WTz8_3xGQ*Xfz=#l3z{Cm6*tYNI>8LU#7-RVebiif&nZA0^C1
z|ELN+c#`ykeA=4DC0AEtY?V@;g@_kr))1n!w$dNoxp!7A$LZDC7EHARNQk^&znXPg
zewe3Kh9<0}lUaCs2tlx|c=KZ5zv|(`;}VHnJ`;t}iaKa~REfC?!o8CfMOwZ!g)+<;
zYGsK9qiHaukSp`!mjI_oE6^%;VLH3_gsY~D`Eya{x4G0C1+l|9MTHNspV|=n^^X8=
zD87niH0}7Bx_XdfcHK_NSZAQv8a-EI87|65t=eD~ncO3w^Qv3ChR<b}unHw$WG#xx
zDWPN0&1;~vD#@8q7#*_MM^f3u799QSTJ40I00?1ng(;PSulED!m<|O#X!I8css{r!
zA3)nGEe|^fXsw~?zVEho9#p@tJKAO~dnl5GSbZ01Cx7@}c)ipq+8Fg6ct<)$plZO-
zI%+K`v<-CM7!#khydh0uVkKH1Ptp9kwo>FY3C@Z``e}b}nu>sg6+G6AafQa&FfVnG
zoE<k~gV<Vm19Hn{7X*9vzAi#dOV`_G9|b;#c9tH|-5N>Ukx-ADNMkQhP!2k&9@yfF
zeWJrr?zHvW_!?Vc>!AsI<W|8IJw*rL4M~iJe8zItD4vbz<kWs*f6%khL_n-yTzxm`
zPKSDy$IHT@&8cu0-J0btsDb1Ypj*2Gv1HuKxpkhq!=sJk^}g%J^RJ36W(}M1bLFb^
zSWdYisR3#&;~LH=Cv=ui77dl7+N?u&=FvCzUq|OG3!v}ga=mgVdYO^+Ma9;`9&t+@
zD&U@;QV0|;-%@d(FPnWGjjbJ2vL&i;#oKhIZue<tg|dTOx3Dm@xK}A`w~im(H8Ss8
zF;iikyTEC5D@jSEc}qm=rpIE(x$EkT@>H57^1d@_72A;{OEqJpk=RaaL!-T2x2J(J
zEr2r;DnljfQ_!3F03e*iwu80Q>WCM7PPX|_B}}Jr&W3BfH0~<upYosQSwEzb?zP;y
z^zW@W1|BaMg=aEDr;(duEV>08Sc0BWgtY$tHH`uf(>ag3g!4!fERsPFD)a({E@v5Q
zrc$j&Dx&7-XZ9JXvsqSgft5L3-zttzb=r*fWhmP3xCK$<$8(-Iu`RM2lB;7>?jocT
zmaAvAyN{iA0s&#l2B;}nFV{M@@k%dqHD!A?*tXql&v*6h8m*W`*uu8sBasTjYem_<
zn?lpJOl^TC1JRs?MK+@b9Tve_v5X_-s*T2i|1D$uSiJju*B95V3b^Zy231C?RLp`@
zUS1_`;`Dn^%*FC(?H;H^VbZ^0JyfXbbC%>1ur7nm^aLl{n00M42Ly(!4mZ9ULYH7I
zZ+ES^l$`;2{z)9+sRfh4_;N2m?E!t+R-D9JbDUc@T^4k@>-^sjLFG5@pl~uq6O_+~
zgUGNUva>}h8JKAJc-`|kUoFU^k446mw~hAQ8GC4~-Pbt}43G7vyn9O^$yeb+>7Ymd
zq!g5bN#=BFvu4|o{@~C+-K<UaDC=QY!W9(>8&G_y7l&DHBz|V@CJ!RhrG+E}jhNT1
zJjWU3PKWvC*2m70WO-hnR@pF%=s@RM4`QClciE~H=JX<|&cV~Vsk=ItmLF5}oF421
z36diNN*d+6+0m>80Tdf+*#$OIx7R4>>FEnOhr2wib!t8MbeeY280BL{55X<cXTT&Q
z(HZyZ)X9#19*Ee~*12cfSv{cSj||RR_QFG)!eOIMrQ8fe_0}c;uA~fic<^b~dR(k4
zh^^`b<@zGS=KXyhmczX@t6BsqHJ}F9Uq`?u4zX}!P6zEnb413U<~u%YX8Gg<U<sl{
z&U`B7ylVGZmIdjXhw>s^sYn=mxr5Etra!*6C`|SuV2u0|S&g9Gtlh``VR?C>GdeZ*
z)Qv$^)+LqBEt!zoHQI`Hm+#TV$FeimE|v6CAZcVzJsPQG&$DP<dyLa38|pBGAGN|X
z5`tdJ7?3s}NEwd!tD9$|TH-{)Y?j42uTI<joRLfx`VGJ*JQ9^fgvk~!T&`FP5Z$^q
zl4=&awhlx=Z*G5T1P;8u=9i<OYvC{}5iT2J?`<h0N}D$7v)xO4pAaC$f^BxTDv)sD
z_L~oi$~yIVZh#D@S{K_hGc{1Cb+-E+Z-sGyk{Bty@;+Rm;`01k!p`Ez=D<&g4KZ-B
zF*UagMWMD|A|dD19G;bsYF^dxaL)|%e#9-VjI4NwZOtYz`Q3QXL}p%Pq~f}4{@SU=
zcri@h#(t}7uLg94Iz_j~2=*2z<$WI#)|J?(rO-AQAH*W8dBg8hSQH9ylErI8l;kk{
zT8x0wn5PlZDMty;^LZZ~LBP8bd`8g`4*IOxZ@n1-mtV^bcBLlUtZi1(Zs=3Fx#{_J
zQ$ayNjC!;+?#qS5mE&7I&VYp@ppvC0K&_T*B+_k(1F$~I#q&;8T5_-gv)7M?i`%n7
z)RQrLHt&rV6UMPiJ3(4TMgbJDv}H9up}R)U(Z~GGd0~Jg+kFb+!?gvE?Y;fli}h$<
z%~%Dr!ezZ1i0AsCwrw{$YI7m#_#$u9ZG@#REIeh5dDjaxjEwDE*UZ!iL@#@Ff2_*L
zw?<~hKwaos%~dSR?#R?v43|;tCo+~AyC3)EoMV5dxykWh@`J};wNlHT?HUW7A0C8m
z9KA5G3K#2TxWjInr41vw{yKi9XsNuqzdB;o>}xh}yXUOnLoEqpXKq=rD#iDL9%S<N
zLtqidkl~tHT5_N-P02q6^t`;mahzpV4go>T$Rjbk&*Gb)O0*uA)xUm$O~;s}%1U!@
zXT&Kx>O&r}Gb95g&DuIMz0R7(#yg)pmJ6~G3MulTldpI>xXKcraJkeRM!DAz{i;z9
zybRi~dwIN1wxx{;?T{mlv6*fhRHdnxR6_`Yf~3zk>LYd0D2gBsZ5At1_j6YZ>fCam
zI%BMd+im^r;~$cx2KGoYxO(h<5oZ7IgrYc#EKfc}0m2mlfQVV87M~NC9R<`y;iqgD
zp=R)p&i6wO(!MtjgElZuN+68M#3sQ|al|Eb)8T4TvIHNCpE;(00Y_iMta+L?t=v<h
z(&ZK9|9Lt7>j$c+-0Cg)y`}J)i?2YwqZI_Mr%oLa1TYCv8Ns<z2fy|Rd}(n*v&v7R
zI71qN+EK<D8^!Zzei+o2d0i!RGbW#%X!i<0x2zq_NX^_4eD~o>R4a^(gWBY;gp*K=
z9Dz|$ETHQg>b{N?ffqv{N+4istx*lNA5TYF`IeHU#X~wkj(Q<`2iJeKfMKArFAZpH
z*k@OXCZE;PvGP`dj@r4*yRRQ!SC8p)QZAid7xj-Jk{!v>;AvyxGfAc*RhV2?__*<V
zvB0nK_yq#E%mtza2wkI*t|~!(_AG5E$Q&3#>Cf)&%6nLedyFzr_b}1r*q=Vs<Hs=2
zO%Ia-LRlVX!x#e9k5I*6BO_Q+vhzIazjl*Lnu(@8Ts9TEJ`jD3e?d9aMC)O-+4G0p
zgjXN_my6wBOXirQF(_|?_-^jUg^g<uQ37sLLqmgG7|&C2WiSq%C#1Iyo*d-_E!#J;
z4i5R*24y|EZ&m7xE&E#{JKGunpmJ*C`$Pu^L{S9mOL$q4LG|3RgWDmsw;CaRx$=+8
zxsZf_{}9?>a`-xoTV4+{L9al(Tr@ob1`V}uju-u$bZuG8f1lw}AOX4TY}NYG1?e*<
z&*xoAh;!g4qrRU@q(yd4I1W%6RXZIXR~<6fRwW1!K0H^2VL+|aA-z;$?zt2++XRtR
zM0-xJ2E{J5wejF}adpA?o&VYpp6+%8B9eLn959fzJ3QB$77*j{HKPZ#S@^oXHMsi;
zg1<!TOUV43+;kl<4y*&ala^#J2o9t9s~;%DJ(%(B^G7qb2c2k_sY9?@&<o((!^L<`
z%PAJhmZaXDMjyE<a(wYGdT)P@bHWn%y4+jqQ3pyRpCN9#SmH<w*fM+MHy>)!?wjbx
zO-{ee;2rBDZkN$Sr7;ps(vlC}e?C=|?^&p+QLQj>EyJQp>G3Z<_+Ko_Ys#R1*Iww+
zf$Skl4Wfnc(F!v@7N<PM%Uk0Kmq^*9>d%x7PG%uDM{rB$h?lRfJw{*mks4!62%Qq<
zV`QT*a}AFBJMa~|2LQW3uWQ@!v+qPa1rkECu;IJlE3QNQFwdiZ%~LSYH1ujo>c^Lw
zSIf@7-OQ`h^%5#tue~%_EH+k{safS)Xse;QB0<FTSLedd0c9WqHU{-CxiNXbo~&+o
zumHBe6hoeidG&%UJCQ!7ux?;AyUVkk>KVEfB{b{PCva?`xNeDX-(&Xez1x}=y$P0G
zo%M(R-W=WsLzw$%Jv{5@m@+&7OGffe=gTwVwF=^r80xi2ITxGv-b3#+la+71cjrva
z)9p*xsV<aUGQabF`0)KiX}y8h+@!+Kl$hs;{;RwFt9(Q1m3YJP>1FgngLix6@p1rf
z=*hQmCUrs%i%@ANKEFJkZw|{zrn@G4`6?!Z>19!(Je%j0E!{85&*x6tWTnrt^d!EU
z8GFvP$Uh2TVe$-MjL1hGaGXIAk$1&M@-McBqqm7O+pRDY_cLF3&scrXd=nA0-$W&$
zO}}T@-f>ni(1<KZrIUjQ(AA>*GFaM!vwT78@ZX%H1dStSs3XJz!<ZXk`F#dX8X6Rv
zyGb~@Lwm(=-W=nTtQhkqLKr@j!}`l)Oz^xcfVx<#$kdsROty17D*FmfE!I=D^k3l5
zQ=$Jh^Jdn(Hul7_w@p@rrKV{&;b>iDqZ5D`vG@VnN{d5UnKA*Rf_PS&?KTh0C3RXM
zhoYxA4O-uxuU>drN-tlW=gG``v8qCn%0N7+tGjV)KJxiOjAZH;Wa?^U7<*#;+Bs{H
z$}WbtnY=lM{UaygBJqF2(t=+Rw;-rv<cc>>VG`ZzAlBIreKU*YFd8b#zPqqmDp@DP
z$hE(?qcP~p(72LuclT>gnoRrs?F*T&DI+&~hCKqsm7J+~5<xeyjYyjC-bjqMX~fGu
z0G<;O<X*4INU2_;TbxL-_WM#(k|OGML%1A&9kqEs;S&%*kpXgYJ7<_@o`H&<+o(~(
z({e2+Pr2rsS2lf4c7}hu#!Kogt~o#c>`K-UQVpG{mU~|1IzfGi$-xQqYmNQ+KgChv
zIt0^5od^~IWgYxTut`OKhyb0%1lx9$z0b2&VJ;+>h>8cyK(*ayJMr!0^WF;IIDwH=
z3N7c&leUIaPV+0+mrDy(?6Iau8|8Y?$zo}2MDJT_`eht{Pws>b?T~6tRr+NAih>6n
zehmkgH^%Dwm=cf?rGVK~{px5#Kz1!dJd+{{v(KHsD)xqL{&1fGtCUJ$b#l;$5{$8D
z;VR5|eoXD1mh}Fo2$mq@V^gbQe|K5lf+h?(GeP~JqjHxHBe1`lqsGJ0ViF5~PfN~$
zuiYVpEr!19w6%{nViN0;-&&LZrgMSg<jgCbOVKV5B5{?x#YHhrPV8w`Kj$kW8?`y?
z!xxgpd4&t+oqM_h*w|xdfdzbTb1nS8mty@ov41W#sRZ$+qswJlQy-H!4H(@A(%>Gm
zVW~?cUd=d7y5+qmV_@UZv~|{XRbZNs+R5&PLd(yj+&!EW0-VS5?V1t|Dz2+j^`V)H
zzKGBZ5v3~J#ZYH}Yhc2q2Pv9w$1qOqyH>IN0V4x#`9&@FJd{R<8|4g0vJ9rr#Eq<n
z5HHJIjPJelSo|F@YkpJrF8?hHb+CGB&yW$h8}AKoW;nDqtWK->z*JRI5v9Xz>kH(Z
zwjx8tvPWEHOK-8Z;Y)7!F&h;3tt8=ZoLH&}oy*@B&zTk6=P8Jm(vN?`yXkoHV-Z*^
z)umQ=p;=e+WlXMXnD=U?VC&mB`!RKp)U2kC0m3~a;2}q;+WyYr^gm<#>^8$BYEz%t
zCeU^oFMtu9=~w1{)J8Q}CeX;Xzhk2<mp-R^Y4nZ*Sl>Kc`?-Vg2X%h>?G}xreHvaR
zEbYjZRndZ-kt+0LA@+nzc*~-?<aX<TsceX5Wu-~hCq|_sbKq_k*4We{dWAK+WgeM2
zE$<Wd&a3_lXr`vs<_*c(8>pqx8e`0Jb1t9#US9Z;U1JxE!1b&+;`a=6ORg$#b1$Ws
z%u}g}U3YuC)^mJX!P1<1R{w~LE|Qf0QD@LdjAT#ulDzV(Vga~kIl2YV6Y)dd*1Gxl
zP6Lb4N^f3Ujnbg%#%5jUi1dYy;8Ulg|H4f;a03tgS^pQ}AWb-^MOKOlyqYNSwOp$d
z<kDlO-dxw8tm<5k@<V?6$izL_RxWyJ<kI-ksWzAc#!@$*Wprg+KMUE4F>88#mYC&B
zJXZK_TvbVm%)Zek=Cu3wT|=|cW*O$D<#o7?s{po`RllRkD`j$uK8R`c{$%TQ+SvA!
z`?A5>Y50&217)PCQ-br(chF4wjf*|}9VS&(-%9kgo1>H>&FrUn7E=scsn(dj&zK2}
z<X_e|^0ckk*?~tb$X$1P{2rT%H9^B2C2AhPLmShCxx|3@cTa^rJLUeD^P9P=c__Gi
z{*liUww6q3G};?)pNem1G;W(HmEYRi;@5o;S;kBf5U>MBP~J#p$iri`dNzXyrd#i)
z?MCfRh(>;E;a_Gt>MAy2sS$dzQ$8q~)B4K0fl84wv@da6Zb3Ea1^uxpwt0Mva_1|X
zx$k+6-1G3=&&$!K&sUAT;XQD~m%Bxi)o+xN?Gbg$Hq_I=ZKyc}%Kq*Y{^un8#f)8p
zp#qOj*X+61jI4b+?)W_Xlx)~`jup$kZWxocj^?!U*8x#wEIczda(%BJ*t6VPPhZWu
zyOXW^TxmAgyz&!;6_R@%*fBGwV9RdJ7#w;i@cM<3{2pB+uBzyVU4xjFudia47KVk}
zQui8}TX@zBLzIRKrf|#xEo!U;I9rd!asHkPc>C@4Em)C3F}|69-h3yi%E^*;zVQ1@
zDn&QFr&qA&_xkt_QR(&(JNu($<2~Nb`9V7km9NS>mYNF!qoUbw4G?e5(?<b1asu&f
z)rfL?<UG84X2xE`vYB;4Pp;6pMqc<Bc?4)LrKVp9k+VJT$?W?z%PZbY-_}G`KXyc`
z`p7b2@A72Kyw=Ti3HnJl`$w!Z-)eFd!&~p5UBdjLBDvqbUYWbQv8|;6AAqa`5V-h9
z+MYzu^cVnanYuAIoZd@;?|3hrHEW~O%L`eb%4r<O$(uWx1?G_+X<2<46q-%VKgM}S
z7`6~5gO(o?G89M#A_nf4dBpB72yJfG5Vq}zeJl*|LXfvt?)nJliGD9O<DM<N0uOGS
zsioFx*<wEy`WZ$wtfwqg9`<M??CQ}wId(&|!{}6+{_Dz70y!Kf!|6gek)QCN3N4Hz
zMcv;%?H!1-kFNm<QS=(}>o-&7QoXER`d&WlGaSaIgImI*;!9=u{))>5VAR}^BPjO@
z6~2k2<o)j_dQuEyGQ9T3Yt{uZZ>?8^Ry-D($9DT&mM_qUSm9t+c*fY_hUUEY&05Fy
zF6x$ZE5#vQ)7;@G{)@ld6l*#2BPZIz`<3b0Zn{5wf0SydCT?KNM<Q+D&GhTc)*elZ
zr7a)0V*h5Zze30i&T7u!$#9D>S1vN%d#vJPM)g>tob%?l!P9CY)8Fck;_wPd<u@GO
zXnv?R50A>XQSerb551q+F|SWj?OA5>h7@@-_8t`K*#UHv>piYth?KwOosp5F0*_7e
z6f8}Z`h`b{7kGOjqX(5T_d>^MS0|50uJ(Ezb-+8np6WUL{AmX+(9ZqXw9iPjUKpA^
zePyrPkyfgHLI|;B?K`p_&~8=@jx6rY_x1hd&Ql@C#lRWtphdBj^D>6HkbfB`R=n5}
z#*?FKqZK(H->sRscZ}<MKYPA~zW<1D;!BD!e|tRB@_E|8`HyJF0e8YL&QFC8Emn=j
zN8|R}Ik(Y!_&|8}GF&@v%<6gh>c-kplIqNQIN@}s==HlyBRvL|8e#?(FxENJGLujm
z#nxW+7Rmuh!r*Kl(uHQ2SW(aZ%W(G4m9{5@tlp<{SY2WLQkgUzsA$XGqqaKts!jAl
zchitAt3<xTGsKfTfq*WX#^w@_h-X|^WZ5vXSlyt<e*I!E;?dqav+$;7RUu3VqknQl
z3ya!pgpIM-BJ&#!5~)0Go@3|r$6et=p+T3^bV+4D_13`Vue_dzd(D{b7pe#qz6#cA
z&m3;wfRZ>z0OpjQ?Ck5muxI~i{95iZJV0#@is6DQ;)Wh@EM}iQJC#wPFBHBBoai#s
zFCGQin)PX7y&Z$#T3@nm>P*B~0jIWdSz^MF>wWaY$aUol+kHVETq;`z<$Y}PWfyj`
zqGib7GjTM6yP5TuCXe-2P-M34{xWelIBxOCeH{JNCRkk)dD2$jG}FsU7)G(sN)@s0
zx@V3ZV#@6tv5q2{)z_!1DR|z<0gm#kGfb_B%TXSWN-ps3h<Gh&!S8xScekJD->#^E
z>5MORBcHbxaqr4>y4ul|+MRybev8}GuX26UsKB!289(s<mDZ;p&m1Lb+ZHyqcfofK
zT_&y3_}rZ&Sy{RKKp*MDGd!vVz9w93A-E!*V?#KV1iUXcvyOh=UJ+q89y3o&H`0Y)
zLS_?cC!$p#r<VcB`aONybmN~5H6vMm?T&1g{FXtMUb%AT=&-!<eC%ff8LhQTf@^pM
zMN>P&&H7=(D}$M(i*e9-Pt;bkI>+JurD$<F1S!U>OLuXOa?3?K9%-rJC^(-igu}gr
zSLCX0|1@clX7R3ZkC;V-8r&CPeRa4H1Ipz#rp?v$BNg-eMlhSo>^CyYz=z1%784s~
z4<2JpPZ&cZVk*}|z~JC&D|3lgT+EAvcHT*beezpsJ_$A>UTCwTMq4be<A&RczZv(p
zkSjAcag?sod)s&T-zaos%wuW3d2$_D-diZfcf8rtruXW)jbCi?qxSWx@rxeO0?_Rb
zTc^st4QO`QR97dheLTytExAVD#OJs5@!5$IzTjkn&Kg@6eTZL-3IZt`&X?z{|5kDU
zx>$l%a*HIx71ZV_)@!4!6d`+^Z8$oLq1D^D?sl<l`!I=Xo-0MKO=oL8=rH)xC&Fcn
z_iVL3xusAD4Oo0_;P1)GGB;hapkEA1OFd8URppkDgc03vOA?Z2uS$l_<86Z826RBq
zpVbo{F8N_>uBU&EeIP>gEooK!aqe8#r8lr}nh<wCHPi7gyt+24%$%Kib5R_0fo$ur
z8Omu=Gr(B?sJLnK-b=TXS81>0mJ;tIE-p$Sn**jiH*0hiG{QKise5w<i(D5p+ixZ<
z463dori=OJid3m_h+G)a&l@YcFc4neTzwQf>@w99O;4dwU*lw)KLSUmg~~Mg>0VPZ
zuI6>Y5waHwgX88wx@O9LkmLMIFKtgH8&;Awq)1V)CZE@HnnF68u8hvRMGsmeeQJ={
zMz=Ne;?mbP!w$>cZQgHvLk?5!tFeR^V_yFNeqV+3V~_kp{n!vcanR!)kBnzDVX}7N
zkd>^)s=IWI8@u>uy<2);uqYA*?8kcmLnG5aI=GhH7?Al@cWQW4%(}$RL*OOaenY5-
zdui%smVC7cdtPzlZqaT(rSQ~XiED(Cwvnm|jt2Y5#!Pe>t+*o`j}HUBYf#AUvCtY3
zs?zf<tX%sOwuF;qNSkm9uwAL_VtY)AL6itA%v4Oh;bH99?xOwPm)oSIZcc5Db+zi2
ztx2wh-`;)L&-~$WhDU~SCdG|Bpi}#X>!(DJoA&i9CEu;GqyuYs%QXY7nSvY~a!Pyc
zg{<)`OX9U4o5)^{b8p{L-kZq9C&TqI#r6)E{?}6x9N%&MKZ2yg;P51U@$$~!IyHYq
zOjFm$fKEd{X?8FS$(c?^KU;(lMi=y{2+^E#@p<-?HX?p&oWtEiPhxdLe0zO^w*5iv
zbve3r8PP(c={@HD>}WTA9!e*@_iHGD?2uJ`?)I%t*uph%Pw%?cTEx->bMMsK#QXA^
z#~xqooQKKyFRCdB6~7FnbX;qi=Q){~3T=?Gl9JXC$~cO~?N#N#VDwjftbSuN9cu$}
z@u-#3K8S(D%o~UY3op0QSnaSYO+E2y1`;K^&V<wbX;A?_95l5xW*j2Sa*(xI|N1x#
znBDOH4qV&L2g0eTb=MYK1=69cwzT74;%jnKV!8^#3b58w*(*_knI@H$yHfhOMR9)A
z#SfaT=y4$dHQ1T5_j=`1OWxe~WuM-j*M+nv&M||m+D+Qxzo<_9HKso&faV11GF^m9
zXIr?54^2*`=;z5HX``8ueY%icLSmNeF=x}ulwMwlG_>#)nuXe(&(T^fLrTX`YZD%Q
zLFF&+cDRr7WM%Vb37jjO-$fQp7JWyLMo%3?-)4sKNtVqaK6<S=AvA*4ZW5~=uzQa9
z+SSWiU0$EBJ11vm)$JD8T8C?!pC=dsvj}^5tT4B-gyB>!ZO!D!gEEAUNt#e~j$_Gp
zXOamf+ptJSwZe=dTgkGmy2PggBKyTs3zoaNudEgc-tUf%sk7CKgrz9sZ*?nsIKARo
zo?4Y*K)ILrttIigV0XtrjE3ED3Wv_W0HvDtSth>B3zglq)}{iPl=N5eVuQ*YrOu%f
z+v%&SjpDgJLJMm+6%j1qK9-fUx<q{ipCwYYW=B0YT9sPW#0*jrpCJq}jFIZkX{-Mu
zsTERCdxo?PdEm%R=L?m*44&&OWL+X34aE-g=3a`g?0Ro8fBFO=4_6Js)qka?oS`eH
z(ePWYjhaZRucOg=Tgxitk^pPqBbAe>uFFJWGrIj>;3T@1M_N6ypAW2&Ru8cTR95yc
zI1G1rJG4v3-CN?x)#cE4HH}^j&^<ikh#-i8k_ugZ(WW04p5$#GZ23IS&P^x6`d0D?
zn7N1@SChxh_i<(_b61q8KSoF+*Ij2vtzuYqO7#3O9)d%Srv}U!Ko`v?ihda4@kCIC
zmhj;<<SUEoyIWVz=l4)-8Afj^!Ywd8Tf!4t+o}C?H3itdK%Lh0qYT&?WswMG(0ce(
zr<i~AQTc546-u}y58jLoijAZp5!WDZl7D0zWMn_TAe{Em?{7sGWJb(S8uDScqe^gX
zVLZ8pxa_^H)sCJ#Bff$KPSr)*3P;u4NNw|l5c4tYy@4Uk@v0~{wm7>%dSwbv^l`C`
z!Ycubq_;}sM7KQRb=RR33tGih7_*P2Fv^M7uoD?#*bkIle_tcK&AF9O(V)RfGl2Z^
z8oe~o2v@8y){dZe*tTS55ZOd&^^|Bo>7|F8VH1x!jFvi^y#uv(zcN0J78(L~sy&i|
z5yanJ_p$LsGIU-UpWh!Pd4k+GGnY%J)FB%YlsjPtf*Zp6oKg;votE?N`+iU4mvP&;
z;-1}K0UF>J+Uj3r9WafU;!%+eNs}pYD&CB?uetgjQ?*tiHhe}r!2!A|7+H_c`X|!I
zbrPRn9G|XwT7^60dH3ROt{%tm`Z)~)SM3L`^sEsS(}V^!xA|?_xktZKJYL7mNCu;Q
z7aWOM^67hvQWc{=eN1Y`v-V8oS7=8&Gt<Q~IPM2qPWxr%j7{u(NDQ5G-kL2toho0d
zo40rK0ou!YdR)9F$CWT`(Z!~Ka{nP`tX|_#^v?0_++r5r{jKf8y<UC&uP1%quf`&r
zr$Gl98A-YM%w+Ux_3ge1w%|x)ByR@&<xVU{O{iFCgmCmO>tX=H%TLgI&%Tj@WGb_U
zHm4Ym-%B-}RESpy7t(56O~2ZyKl3u{ZogovNWlZm@>yzPPwRr=jqOt)ZK_p4e?GNE
zUA?4LYW}^S&Ef>HvqhffYZz<${N$cZIeKLrB~9<N{K*wKFoO8$`p_L%Y}Xxs{N3Kd
z!7^qU@7KDQ1q_A~y6WkMYIp5E4l-YD2~N_B+TAz`95W&*a2LiPU-%c4<6l19PcQnK
z3hFXdMEoYciW~R*Nnl}aLQ(EXgvStn<kq-NL55~8)zY9JZHyVPhYcretR8O^PLQW)
z?ToWb>=g?WZdsZ6X?E|iX-jXzu=8K-Z{gR<Zy~=+luhpyb);_MT|+@0eLI0#nQqG`
zd7;yJXtwRC0RNjy<^!ubX(w@(pTT9$l&?gyg9b(~-_ttEbE!Q(-vJ?!Vh3*w0&ZH(
z7Xv0;tnJPenw0UBpm4JTn!RG(tQAv}+)`3=UgKFwCw^YE{OGbv#bIVln9-<}e9<h+
z(r#|XQa`6pK+@YSPT1Tv57BiE1F@pfZ2I-)^fZ3KioQbJE=hP__-XW)E18xQASWrA
z+9`jdzdyG;A#UVG<-6YEWF8ch6Dwi8+PH;7+f{d(ugHZ|H!{hF^V{c}se6OWj~DPT
z?-kIG;TYv!c29Hf0MJbLW%c4Fc>D#8G|X;wK6W6%ma_{Vy&K!(bMtttk-q=ei=2dL
zLUJgG6y33mUskPCPl{^QW$wRzofh1%CXhq>sX-uK;UDcMDQG`&QWxFvf<>BfASMI1
z9D1i-?{Krh!Y^IWeQN}dTDD}i=wbNChW*y%vH3mMcd`8bf|Al?BF|}`u3hVr01IUG
z&faPF@zGebcUHqU-H~d-aP>Fwo0~q9*H}w!wVxwrr$K^#ubFOfRKgPeG}pMwM!$3=
z!N46qeyDmByE~Vo0gD0`u^iVk%6jlEQ_6P32qSnkaD69d_Rnj)T?eX+UHf}S<48|_
zYV1}S-NOZ2r$|qH#r2z2mwFAoPE#Da-nr}OQ>8PRrWFq38ZB7zc=H<ZhzRVN^TH%;
zW2=*QbXR2FkCD<F+G&j<lrB^9&)QAxi-WR{$W4c#(AG&~y*R;+uJ_KSeVR%S>J$d3
z$;~cQUV1Nx3W)55Gq?06>B|;kBuPZ0@*!C;J5Z+}eD0^t&fh&_pMj&``1I)82^FJR
z2J0vc(QG~(-1wc?!a5q7lsys`DHvNnsWz4BgAr~lZOZf(UE4D2$gf#cuCFm0=^vGW
z4eNNHX1f{SDvY1{X{;}3?Bn2yPZYiKLS=$q59dFqZKCK9B8gFPPcJH15Luog-JaZ=
zDLzMxwt9h#p=h!-;JgDx{0q~pTw>q6L-V~9QU~`2C;fXeBh4?4#`}pT+s&9zoA&y%
z1?2E$Qk!U6*j_V_H;_5VVV;MfHecr2ym1v{O*gBaeTqvYWvsN(M3>OB<dJ4xS|H4^
zWpSQAry*a08IIrEvMABdn@muQDmM(vkt@*_jMppL3p(5kyuzb$^4}12Y4$gGaClt6
zeqm<C1^ev$q1`+#&A9xW57kH<hlT0JcCHnRc}&Et5j&;U#cGgiH;dI8jJK_#e2+<{
zn8151*-7u&rn-b3Z|;9EnyTnN*>AlRy_)B}F499tvgf6oKcegXb*Fl(PKbakodyK|
ztc{3imVXeaqU_G!Ohj!iJ^lpzv%Qi!;;m`F9a!VW?a-E8Yt8`CV-pdPx|{i)2=DBI
zCwMA(eD@`z`<a?2KE7?gu~Vk=eA#r>`;>0M4axgfQmr=(C$7FV)5z$|4c*{Vtgb6h
z-IBY}li~d6jfDHU+|Fw6s7oV`Mz=z+mtb?gKZ9ve|D$}8NB@YDf0HNIg2VFZ=C7|K
z!*t7ev$YM&OZ<RkOj#$LtRvN3_v~F`+ca@5Up35P85L@X6h|;@_dvP8Z$Q2S8%{j`
zj}jjK$>I%!(*ak`&)oiL>QS|zY=O{5TH){2931@75_Gd7nnOeJBjiWPa{~Xr2YKw!
ze<rg2`;*;<lx8PO9v`HnRd0X?(Qeyr(flV-#2ZKnJP3Cl@lybW;R)EfGF|P7S^vO~
z6F)`)-bTWfE&QiEx_CNx5}&Qpc3%HvOh7G$C*i>xCm4Xo2tUb6_;+Mk{^!WOh5{GA
z<i_3Sehex|9zqgdr4;P{U`>PM3#7ENS?X{g56=Rr$II_i9QvPc`5RM2R0jSiaO{ZC
z&wx$*0}$|p-N3VI|B{dYJA*3~1U^KzTz}<YjSxYpPzeFQoWGL&`1kmQLIb?bv8s0l
z=YQVBzC8~<<g0M)=06$}qPAt)gV#nmKr5Fco95Rb|MxZeYd#5peNlKUt$wf|h(Ota
z=Vz_LzpB$an8=@>a*ZA=k*SH6yFZ^jeFd^vyV{2i{exA;FbV!h((B~x!5~qng9rIg
znQK7t4{oZ-<iLkqp0nxJ{`t*}vfx7qM%l{$iT1IEDtH@;m5&a(KNrI@J@6sv_(L=Q
z#5(~wtxnfpE3-u!d_q~CgX%vRk3%SOC_{PpywbsfV1Q(tQTpBF|1tD`vE~yzq3s&L
zD)V!@CiFm_)(Y(Kp}(~_4oqSo_#@Iy_JpH9$3sIA8lUBA2hG2;Sq{7m@hc!j6_8vZ
z4g2{zFBrgwoN+3cW%&owt11B*(k|*&)1QWv%o2Ra+v=lG$-v)#p~tni#(w?&wF}@A
zrs`TG{?V@cQEEk?!+T%@|9^PU&{ylayKe@?#$Fy26buRuW_EWk3yMd|g7SZ-(ld^K
zn)ox9Ra4|CGW3dkrKF`5iY)JvtD~bD8Z-*RvhK9;J<Cse75-c;-tiAL9q%s?t$*hR
z+^d=ynllG8!-i_1i|Fj^41e{CO|G-4@b*%fC-a}?m<1(XWZ6xAL0|H|NtQm!qiz|e
z-{BUi|J42WC6VAj^sLnlluNgKM@$?zR5!mI3FYI;?SFSVHAO*B&)XzNMfGDtgDmK|
zP1bV?k(xsea4I^B{7HsSeDcI>^wH()Cnwy?+=EPZ!$VE047r4dCtg4K{{5XAk7!Ph
zcC2|N+fwz|%EezR?q3@glt7gRgrAAvoTE(<IoJgRS5zsFE)$ZbDttxpHl_jI9XY+W
zp=Dn>F5Bc!1+fWVh##1l$?187Q6zLaaB#oXs_e_AoMF>WrTo~+(mOh>_xr*|)g2k<
zHUhMVZ&mk5etoY*0{5|LM+b+g&Rs$&F=yY`S(o@G?n}e2H-K8S-=<r2lfWrv*4V@Q
zL9%(2AI3g$=w%U0yW5!w(@?x{C&eG;_``{39+j^^sO0KneeiLrmZ%oMlx=DXLLgJA
z(q?C`$tk8^@6T!s8G23o`(uM*K!0&9t>Oh0k!xjT?$e21`;-Geee&JqzYSisV?CVp
z4+(%L>|~igmR5Bz%};H_!vwFyO^MplQcNRYZeNczHa14(-75LB0kJ(y(mt;fq^xHr
z(HO+?rNK>Cx-!e)4@-f}6Lnbx45{eGdf?>)FW~W2)oy?dg6&<^shP~yl|VK(hySSr
zpW)^aLUgTXCPfS;gVB4MlJjK8`m>}z1ZSbrpJn~QddX!QW6Aj;6?+JEnN9T#_!5jf
zGt)rOMk$qyPB<v?`hCWv62<jAQWwUMwN6#aiv%xUqv>9T-%am)6;8o;@7V7X{8$`R
zAX-8bc1YkUQ>Y9B50AR&*6d~78n3DyK-LZi;9`w9zZrQjPbh|y8hy2%%E~zl*n-Z7
zcXdUZU{t4n_Q(FmlV}_{>^hb0;XE%3cI+8M|EqB6mBplAEf)Xw)Z$IY{2SZ`&ycj?
zKfROm0_1PCdeGpbJ_O`XzwXxCHv+A*X3$j33<<cBQ1i<I{S}}=#N+@ptXc$TVoWs8
zza(k2(f%X~ireLImCMSG2q2rmw|<3%C9}?m^8!@J9Fit34YWXXjF2ZT($iZR#Tv$W
z(*SwG-;7McePU?MSy)g4GR@mf*|>|Gev=h4W8l^E&3FZVu>k(pU!uN|UBiFR2T7)V
zAa|b(xW_4Bh`E$-NINzKTf-&{)XOvhDZ=_R5bkJ{H!v{JJ<SY5?iRhG7EqpUkJg^F
zCnqPL1el>~!Mbk<b01Lm^!Azpg86jjaFLZco%}axyFt_N<_diEJkV~l2<8PcHo9g%
zj0A%n%J*V~m>ZX&8fmhelM^WA4?lPF_@CYFZ{(kfgryxEm#_RV9=gS2!tS(NFW9+_
zTpH2^{~#%;I)1Fhv63zE$Z~GwlJBdFHyE!7>;M?c8(~~&eT@Fo<rK6N67Uz?0lm-^
zC^a93H6A6s#Xu^u5(xOZS3e^j&R+ip8Ytv)jjGyOfMiSy5C{{Y-YEiaz@|P3yFhsA
zA_LUg+Ub)0!wvn$soD)h58XHO9Wh3Z<IQp})v7#RAqn*Uut`9*?6V(MLTS*pm_I$9
z?e1MozlW4@SzupvZr{%RZFUc#WGSw7{+Ot-65DtP!#IPO1^omCUO=M;($p~@jGF^$
z=8>!w!;LI+GXV7jp?A$n@&VlAq6Zs16IN3_f><Br1_TK8W>28zoj8sI9SN;K-Au7y
zZ+E*D$RYsU!iOmveZG5N)79+(p(_q_c_H^U(+X`y^)5vIcq;kp&}*()A@5IE%EmV6
zrD)s}_<c13pX~I>g<+&PcMs21QBf`OvzByNvcryGGu0|3`u%3AAB#Ub5rX-#nJ$>)
za^kA3hxvhS+g<zifQ@2m+seC8L$V_l)FT2li))Q^@a*1oNFwFg7pwjy+HyGHluBoP
z1#B06(3lpp8*#ntvFPJ(>oxnM3$vVDu%)DeACQ*EoG9OOKMrhK;ggxIm@IvnOijNv
z=jQB#7KQ)Z9tl!M1O?0T;hmxdD)q;k)ru@1XhfP<W=oYse*FCv4jnm64BkN(#P_{m
z6D$rD<y&DmEP7L47e4GxG+=p0O3B@jv0*d>7-cf_?0)Cjxl1Y`Nk~_m0RSYO_{OU0
zSuiqUFqn7mDcCD=g_Z~)W0K7UEBfNfa(^BWZA?Ks^v43-0<)`2Bl)I&*{~X{fi_UQ
z1IVQyZAqwckIk^WZ$&xaO<<sEdYZ1T?zHu>t$`y|T1ZkINW2<S$%vjH;NgmojI<a5
z2xS)V#XXstta8fA9DQTr+Oy7c)W^X=ehKL75f4&R99iUqG#yc22w2pNMcLUU3-4<I
zpW~`v#<zV=ikVveKTf^x*-z0yEFgc6=E@D7zI^X~B^x=89Px)}jZr<}*2h*xey$oI
zRP7FsV^d&@elLxt%Ao_w>$mncCg|=>TrhHzz*XQydy4_Wc?rNh&J%}NZ5TaWpxPRk
zgY9pHLukHySG>_#1_4&ISmn_XeC4t~#JgTIi;stde4G}C`Ug|rJ|yW1ckW5pQQ)k)
z0x`|pAJ!snp^e3WCZ`3qvJ74niCF{kC&`i83M5`)D_xRH-y7-S23g*CbAZifj&)Ld
zYf`H134qt!UOR5xEL%7^bP*C@74pHKin)DD;I-&!Xv<oTb;VwXAQRCx<;@mZ+gY*7
z(E_$%$ejuLC4eDo1p;@m{6b0VQmjibxAEt6^MoW+R{$d_1aQJ-fp}>_JA!m|@i1r;
z<Q=XCz<a^{o#pl&AO&N&g<F`6>L%pvQ$dV2_A?zlehN~(kWs!lPJp5FF(1W1T12hs
zcaz%m2_ONQNI+v4_Z}GG!x&tK_%0{9;E#+CgGK)05VR36EU>MW`)aWS^T^;Vna84r
zf0!Y%7w1rIZESLb;g(p-bX$Q}&t87dmn~IT`Q-!uo2`1Gh*|>2P7{D5(*qTuf>`5<
z+~L70xa%gsx5bLP=;=i{Eqv-8oS93D4}<Km2?lKCHiB4ZQ_#CDExD#wH8RF)^6}Me
z32Qt8EO_%HbLD#>>dJ2bEUBYH?q#^Tn%d+SKh7}F0hrl@;Jdg7xP%nM*?_KJHH|tt
zY7d}f4$JKVt(lrxzPJ33j|T`&N8BD>URsh0SOx97=Z2<@-oCYUB{M3qxauxk>IINe
z&39#JuWB3EKZgsPy@=W7GHbhdHf;UVtcir=j0gK#AHd_?CMEwgyr5#8yFJGXUwgDX
z+T&h?0N`||0h68*f>U(2K5cTiKXPJM1m`%UHiC(IqPy;F#bA`R5kM<ktSSuu0ML5O
zKn&{5&kJO-8%HRva>a*-a|*jI^4S_#^yS$!Z1mp!!)`(~o%vL45<ny5Bumw&5|*Bx
zd2iJIV{6^kT9@GOzn*ZLhyY&6_5}zlEE;C{TRpdp9V)Tq)JxG913j$Q0&Xq6P)B%z
z#ym(%XXYc2BG^BVF1Jwujkw(RObrJnEJ}ysw6b+BL5_%KZ$UwUNZpXf2%tv{E17~0
z<ema^74tz%8>M;7IKgn0<Y@KKwtm{vR3L&I0$8PWy#1fcymJDCaW~b!8|3Og-4OyU
z{(37OU_Q*kR!IS*!ziP%OMa6%&Momorxl+oyvK50Pi_p}!!i#+Pz&^);yqrar(f%~
zTs+I9Xjg2(Py<L79r?mHb3zvu;hAB2Q--X2R;F8CyIXPrbRrK1^G(fQhzN<S64$vN
zX-J;|=vGxbcCJztl2_3-U<Al!5neztFLq*nuRK>|?%hJm${rY=45RJ)>zbWOq(>gc
zueK9dPUht2qTnRh3g&g^3e5bCLPjq&wV+C%XwkuEL5<GO9fSWUa|<G1kvA5-d|6>_
zH<G14OFMir`I&6_v4bqzf1V!<w+R+7ikOU8hIjAAcfBQnrJGcc7Wh4CKoOlMS_3Bs
z0EcGp0Y@xKKOJRHqR{x^gJ6k<<N%d&ynt<-?hGw2WECrc^nls0^aaB!5Pf4A0+^|r
z?z|_YcglP}OgJFF>~hS7#G=G{cmR8@D-FI6#=~f9ZIQamOPVhVNR=A6PlcKl9N%8`
z09Faty#w&K=g<y0y?`ifnOQVUQh9V4h;i_1wgI@^LxCHl)CSJ|njH?x%KlO^GQzD?
zbr5BwAp7v9x{64@?m#4@HmqTSamRO6<$f;p#xpC&JUp^q9v}kI!&4de091pmksetI
zwAnnwq`m`$YSW7|mv0R{q;N-T<OYi>CX8K%1=rM8dYJ=t5(}69z<q%+&&y!ioll3p
zd2=swa+s9$VS*PpP}NFs<Gu}m)eiK2>~LvxiZzXT_G5b;8O<W=BNH(`5X6;%9GW37
z<W~tfh1NW}kD1r`CQL4);za+H_mqmLm9W~m-cRM@Tk<iU9BrR&2OQ^<GZm6!|7O>I
z<t}|Mku7}Be?i<<kyUF&rd!{D%lx*+z6Z{x$--V`9zU$aM69rDl;uiBMuu61HwHNV
zj|S$5N#b)sTkGX#x$~o_^&W!hERBprpBuqi@~(vKi>oy|OMa6xGsAv#@p^`p0KL^A
zgm$O~`oRU+7<kL|w41{Vks%>K#$B1;Pfyd3bzwLdG!?jgGwzn3efKWzQf+oNTeoVd
zbqYmaG_S>d`r9L@9ROd6Bwp{hgL$R(avvDmHY(RyEZ9P%;t;I+OR)oO>L*>-6gb);
zH*{)L9aJj<;{9@|7viG$_JWATrz!we@gMf%tiA>S5mmiy+vR@cNQhMUii)pg!L^=5
zplPx>IM(C`<XP&8xb%rO{9pxa#hM4Wy;`B05wZzs0e|w4&M*arhO)!e*Ax^LU-c;|
zpPI+=7@Z#|@#*+OJV<ey;nRfa86b%OL7D*fj!&RR``S=-eOXzV8d{I9zzvAjM11|a
z#=qM~yz27Yo+Pov3e!PQ<UBkRkK_QSW0!6~1}MI$th^P_vOu+har996aO^`-P}wfo
z<BI%>HCWc{1-@9I@|PGowkq+sJz7Ax9n`7AC<Yh3amIT<etRmy#Q&Xu9FUkkON{ZM
z1pUY}j~qL1Ej3+s07q@KCg2`~13lCzcl_rKu+cbxX0<Dxs;iPt2A|>m#kq&@km%lq
zNdV&MnF#GPpsy1(k+~goRRL1Jq?>tnfeyZKBaLxKjyd*<*xp7`mD~shP3pA(^d$$U
z<GS&Qv`rWll35;TaNb-|y?bOCoEM>$m7epL@~^z~_w`NI7e7c<{wrex{fkkG0kdTY
z8jY_HP`hQxKixX^A+WA!9wfKsW8cDlpBeEFXCMP4b!-|S&e&CMeScOKeZjyE6$98+
z(%8X!_1=-zdhUj-ZWU>OGbINIqKbhdRaot=A*@jtDCDlE<-i=;2C8Y6^h2Acc)7$t
zkOV?p$2Kpte#v<>&Zut%s4n;&A9ZeNYb#`#&=Ob%g`S;4^K5|V?LR1!)e!IY<)xXC
zBo+YT`IomE^=+%B+TfkDtIE;*?b$Bc>ZH6kafnLb&oqH0$u73PQ&3i-w}};rwW~V;
zdC==DXH${m&o8u<gIG<7RMCw$|GZge9J_fuqF5L4{lkUmmTed6^>sV|WxN6Za{#L`
z>xiv%_Yc*Y!w67+Qcu93ZE2v8YOsBq<nY?NANAvPx(SH{5O47ER)J)ax3j|P`4GEm
znU!DcjDI&047UiJcH|o0uDD7Iou=qGJ7GHR={igOd)h+v2Eh{%qw{xBn?Q}R1yE)>
z$w%eTIys@ORm|wqIK%c4L!k7G&;=<I`9<kt#e590K|x<)JeDS#6UW_RM<}L21n%73
zvUxQYAP3l;=g*(YKMslz*GC+uz@Ftw>me)m?snEIb4Y>Qt+w#V0N~Y10gChkmlM1<
zZRqy_;wccA<dGZiFmPm;HX!8h0^1QZ;<deqO>+qY;?`H#^$P96K&maK<P?F&XwBYM
z)(UQPnC5A1rDXG|BScbx(5BZ8nSYUxd)n|1*K8~);>oWhrRBv~r@~+O-T8IN@UH=5
z2^8mQe9Oqfg#=*sCIEiIkF)@sgYdF+`wGyrN|G-fwE+<<H=yyryFEGdixq{OzfQjE
zFuG<1l$*cABi14XM<Q;ROoCvlh}3X$20CXTG~XcZbel>fXeI}YO!FFXn!<OYH&v7F
zkQBhch+6gos15o0ICOyAUPm2oT)hI}i$|O>h8>$Al>s%L+mg)=6=f|97Bpte8X2M7
z*Vk28*T<ZCm6VZ{=EWdr0?v`Mmbs~^957<Kr&r2Pv<Z8HY6bCU#01NPVXEXBA@f8j
zmuCL((q!K_$*xbRzUfif|MJI{D<X50vA?9WhVkByV|f7$4n_xifxPsuvs8rxEYpCi
z^4x{f3ecgnjo$pQCzhY|kM@Io!RAD_?hDc#RFx%Jh4EnDE`fn5b3OU68WjD416`>9
z>#7GBU}k_LA(<U<N$MeJbRGjIMKg#Ou5fU4h=!EbPfbxoxFYup%PV&corK1tAT=Qx
z5J8!}-uhvb^rGfd>niITf35&7r16O<Q?LmBpWoICtZijYydOuoY^qAU(U)x}keU%(
zEbN^G3qxSLBZ^M}h+eY$UEt(z_3#IfySH8Tqo_@YtO95;#6{O_K7dzC0dJ!m3}Nn)
z?w1$5=Tp}(HrgHnf*QSQ^`EGW0{s157Uz(l2-@8_8|X+Tr=~^)v+L$JXn3q6r|a2|
zkoa4LB8s{)(i1%7fQvY_2Yi)VBWExpU@c4mDiFUFNA<@2fReMNHAsLN4g$c4(zTTs
z=aNOB8wkQ{PUWZKxx)x0f@xY&GvJ9lA$YQRRN)$DMWTVsH4;IA-%Y{e$4HbcrH^lj
z*Vcu!KV~>@o+NOjVFB|Bys<zaP${@>2H;Z;Z8sWkwxZe~i6w5&4ZB_^Aa%F|PWl$0
zi!%u#9VZveGDthr0sjmTLiNtG>pd7i07#m0`cTrF_~(EC*aRhhSV=&GR<BAASRah*
zEC4HiZxyi4T7Wo6TXm<%dd!IDa=SELBgQ))5X~Yk-+2`XxS{<tUf({yhhpPxA<Z}Q
zVA$e86bgyEMNB~I)DFOFIVUs?gw&>zgO$1G5t<P-KmtdaUaiZbE#k%!5Do|DrI_!@
zHaK!0;-xHqd%k`nKR-Vi!Z3rJNx|H&0MX+7tn=9j*QN-GLntB&qG?jLw^!1yVa~`)
zcD(+NtnJSv+h-Vq+Q+wyDe-$BETFpR|DAdx>p1eB#>Y3kwi0{J)vX+)6PRR2^G#cC
zuUi4-2s6XpRHayJD&v8cZ!VfE;6RpKxhQ1u;XBCTM7pE7a^AYFJAvR|81)UTN*I%3
z#Ahr`*AAc~O0o72&tPH!V3M{B$Y-5gj1LOB|6~`kQG?U89bR8E(jI_pR)?3^&bOyA
zzz6Hd7YPmvV*=g-r^c?xMZix>(C-ug3Y2Aw#ly)!2ybn!-Q3HodbXYf5cXplx5S@L
zKu9}CO2`Zb>mLVuQl?wr^ryqlplS#tNZz}r*H(O~s8Ig^D&1nYw=vZSICQjvl?uEi
z2cRz00*;1R8khM2G@b1QqLuQ|YK;ijn~~7KlK&Xk$^~Bs+PA!uBfkwB@ILmAF`Ck_
zsBO)`V$T2R=i_W-ZT9IePPPHclN?w+(`ST`AkVFMQCL*e2rMZkDvyEMeAjQIw7wW)
zD0Me6Vvgskat+)Cx|e52TIQ4c$BXjIwcKI(4_?kel;&6y3W2219zLhVxWX3Ccu_<$
zNPGcWptbJ1`_CU<^>oeK1L@gNC<qy3XJ&3Bn4Ia1$7fdn^|i_Df{q|?+%*Bv?Ih4=
zv(L-~?C!ypVH=uPz*%WEEHe!6H;7$TI;3ZT0NA2Lif`fU`b>~h0U5iYHbv-Q*z*U>
z+J&SwJ#-bwi!(7mK22K7F3g7l209+6@m>kytZnf?n?CWL3rX4h(KAAu;PppJyDKSb
zs|8l)F#;6xe7AB*1)+d#sb3p5Xm|rr0nk7(rm-iWLj#`o4vg%XYh-QoI=9_7DW-&O
zTQrsZ9vvPg*f}ZHa#JIDrMKoL`@c@mfBmaYmmy+8^$e)vqvip=5G6o$$|O{#Qx^lK
zxdp(A|Jap4NF~yYs(c`G9&n53DlB9Xkp5gWh++MXCpr&RBPwJ<?FyE1#VYI9an{w-
ze3POe%1C1@&*jHCL)jw(<nAgt1;vz+bsd&!W#H@LUMdJa6}(T=e&s!>Wh^QztbfO!
z<~o2~JNp~<wP|V_Ud^r9D=!f2`doUvTNq><vcrv{z5AV)0K0ot#A7880NUrX8<TA*
zyGlrACpo!ttqY^}LBeInYv0%7tV9Av$=Ij}<eeFUj{UHtv@9*o&w2v?bUjP7ap6UX
zeY)&i8q)rcDfedukiSvK%~j)y$KJl@f~QUleGi1L?zscASS1i?N@70d*eQ}qT$y9%
zlTsv9>Dq5=?Ffz`^)iF3viV8cXMhrpSLzzg;jp37MaBR!Ak#x@PQs-!^G>?6+?cQP
z`o)i~7b*Z7q9nZnNtx9m-yTPzo7&n!fKtPdhCPO56RQpqT~mOS9}JeJ$0I7hpnL_i
zx3YT)k9m_&Prn;A>ayI>qku6ZR3++Xt5bo*h6)rT#G{<h)j8we6*$VI5|ff*M|rrp
zp);Fp{^<#TV0J2Y?|k@t>&)dlO~C%&;s+_(Rs$bVap=+}%7+m2hFdvrK!TCr9GJ8}
zg?N0M{zX^ytVl8Ird7(00M@NO30;-YNF`tsqX_(Mqbbkw?a6GXcHsFDOdCFI1274x
zpT5nJ|7YLkIcU!+{H%wDZ!S$SInhy5vx3|DK=5GaGCvv(O~CPK6#XEl&61^s4r*wS
zI%|dzcLQkb%IM>TG2!9NAZNk9Kd8A-^rg&o6^<lqZEvR_37vljjt{BrK5+GxaW~1k
z#_(x50wC8C?>Qi5CGe8qw&S%rmvT^iyzNNQQVkZ;S^QLWC78|xWYqH?G?N$T17>Yo
z{W+kO!`gf=rdV&+s0O)pNCxB_+SesUe_nk^{aAw{tpBfTkWrM2zC*yb`e(?i8hNm`
z|F6##pFP&o!=uRjW#Yc%7^TN&^@B4`^o{Pz-_N+6tF>;r8%T;Lf~Td8MR)K5B0rP5
z42(a&=J5Zug~T5oTM0+b^FQK?eK?x`k}QgJarfHSg*V)%DX#CbwM4G|!R$|%zWGi|
zG=1|NYO|?yX60wm59-C)pXbTO|8<^_>7lN+4&0=D5s-BWt<Ucq7I}jHzzy>5j7?$w
z?VHGKj)2g0nD+Z<Jn)XsM66r4=^Z3LuO*2CH}txRc1s~#y3C*ZQXbE5=e|^SEg(ah
zV&V{VyUe`!_h<M|{(P-d(bNhD@U4G~pBb_VKn^Ht`0gX~AEQ{UW66JzJQBC~F^U%3
zWUqF?KoZnH`5k2={@}#M)>J&=*y{Yio8zm&i_)U?;s<kf&rV_P$Zya0Eb`EV={*<8
z9VcdB#tEi(jSGI=!OJs4r-MA^>E{K_yE&I{Qqdgy&m1EZ?90{eT3Wz%ZNRiOG=A6`
zYA6To20soA9)glU_1_X-;t?mgjLuIBG-bhoJH*I^f8NS?@K6LY3=v{^1ZgrU!t!7^
zdkjV30LS7^e2S7=N-M`;E+!GkzbpY1s9@{=s?Rn(b1g?N3^4-k_j}4s)!}bC$qr5}
zo`#a(-pi^M1l9X{@G?MY7s&x$;#eq$VYyqj33MItufZoO0z(0crLKx0fwcxzVI%P(
z2R~*wgfiZ%C9j=pLCb+hb2$2?7Tlv+qUc0CnxHF{UBc5e*W$glG78#2c=B(qpX&L;
z$o~8V6W95Xfw(E2h9d`)|9x?Cg-C-61<p1DCxccIcAY$NP|Gr9^x;2w;$#koKepcX
zIw?N_#b%%s=7yN?!N-d;9C^Qkx*E6~s{Q}5_LgB$?pxfjg@}qM2#Ns)p>%^FV1N=1
zC`iK~(%m32ASx&+(kY4v(o)hbN;eEOba!{W>jw8Zn|;pve0a|DjeT7>d${j^to5rE
z3afo+sMPe#G3O#U%QfJ5tBuW2lvx<A2_Nd$YHVzLbYlx<F!%z>ByMH(BV8XW0Ua$B
z)OX6R^r};!As_>86KYaUOyg;!;HhRl0@a$5vK%DzrQA07J2~UTcI=20W0ipYR*q%V
z-7O8|X&?Xd%HL%ANMAP*IugL3@cdUcl3ULEz&|XE0oWyu0c9jPzpbt9<;I85Q2N51
z?c7b6>B9!efv#?DJ|vR2pV+QUGXjbkFgiMV?Y;1`0+9<`e|wfM@0=%qwex`c%MlfV
z-HlIN)by8@^UyhD<2yxgt}?=5w(4`sV$?e=2ddfH+w5OSL?k5xkp_kjct=HtwV`v`
z!NI8n0DV@$NMuzTz-}}^AwYp2%4->Sl2V{cJv`YNi?%~0!BlJ2Q0TI{%-lUF1<?>~
z7;Y(CgUl*mvt1mG<f`(!DecBj>9lrjtnF|5j01->&mK!x4ERVRkmQnX)Sm94t+Dd#
z&&EjOSa~y-+W3t$pJ+f+xYJLw3ZC>3GGz#%56VkN+oHTs2r?-ABZXV1cN-Eny`kG|
zkH0Now>)_hrfNHL7_`+xFbs&m1A6y_E`L^XiNeddRFeWe;T6W+?d)!)b>h#0^t+2}
zFTc+hHM=t+mERJ6E?g8xp*V{NU@$>Bl*x};K0^;&{*;1FwB_nXkUiNkAbHV?=bkJ_
zE$CyDGS00rd@X_;#3AVINw>;E9jq}ZU^9T}HAAQ@NEMybU%3atSD=2`@r7Ytq#e=p
z9C?Cz%{PJp;HjIM_D2*B2w^%cQ+wOV=IyI}gU^no-Vt>;_$_9-HQUhJuBcD!`W{?S
zcW36{fToj}f8ON*O==(=-ja>-0L!X@O;Xto37O)hu)<klN!yp-3vPQiN$}Oo%vt13
z0;4d0ekYv>lC}P?AJM&0=ACpg@1q#bH(i;=s<BF$NeK#RzmAM9k><WWN=Te|<18g5
z^FvBZy2VU4qCva*^wY|YOrsoW{Ad0%L7CK*%WE(`rRuv{sT;qDsnZ(2-Ew)6(_u}B
zEiI!cwHrWj<EW78c11636VfVonFRCDWdA?1k;r<QLkrF#^84D!yQf9O>%1*5{;<6y
z8eh&00uB(vxf@A}*Dbbn=V+3|H`*us<|XsW`-6cU&VKC?h!^>Eoy#N8zq=Ou5k_KY
z-7!{J?6!sigu?h&dZxaqn^sK-sX|nVk+vfQ+Ny$fi3)1-Ou1mlFr~P}uzwRChfV0h
zO<lx<XMV}8$o}Oh$6q0fJ_HB|<r97@D-kv!^7KOTj=ojO(9?WXR8dh8Ewx-5&Nl?j
zx*v?A6Nl3YB`-ir`w&5fkh1}w;ziMBKS+@1va(1gb=b9Q&n7k-OCA|EbWOzsaPAWI
z3s+um_&2WSx1Qcc#v8S_x6eaqTm{pYWWIetMlc$qO^oaHmeyB(s+7gU2q-qAE}jLq
ziCgBwK{i{$QT$`pYEYtro<hdXe~pS|rnq?DrFca2*+^1;s(ziohz?w$tZFve&YWpR
zrDX5x^Pm}l^ndJ}>lELLNDgU7GMO|=k;Cxm;ODf|RLu=9oR1o2cxXuc=~J0la!OiM
zD2F$lz%p-8z*Ro$nGe;~2KxG>u8C)^6JBig&uY6Mp!jwq?hgW!TjdeBMnbn?^{cAV
zXjI^pS07AW^Q?_~^XABcY}vuXM@3+@YgYJBYqjT^`~*Ip4$&E;Meq+`ZmS?O6w1p#
zTo?ZRRu$&p-ZM669vGeLA^{un(S72v(_V-Ac+k<tKd=s$A4vu#Bq&Rlv(eCqUEofb
zN&8-Q%FvD_QKUPHH-kD>;#C@s;%yTq)!Yn)zI#H8LswZf^7@S(l4{c%hZbtF{~B6&
zEE*|-2(${tY!lo}F0bD=F)~WZgW&N<nRkol&U;?u{^8IbrX6PlbhK=1k_tT#Y-zw-
z%P*c|yl}kLQqfa@iAiF6t<Eu|-abnvL^5-`55YL9B8A-(9M50kz*-{mFDWUh&q|js
zUuLu%Z#Hd>iHbUZ*iIOLut|mXT<hc%g}fIjHbr;hr!oOBdEDFHefK`L?)HKQ08PKp
z)QYB}j-o>!n`P;jL4>if1_Ni@T~gsL&;yz>QuxFz5PMLwva<G;#yc%PQGK8IyWv@;
zOBUyWB=j~7PHy8<4=Lu;y&jSJL?!MfO2>_(IlH$h9GpBgOP<G&k;Q2V>}4`R*s1mJ
z<v>M@=c(PL|7rIY_<}7<B$78hn_X9a2hMow0Lx*RUP!+vUQ9|aD*`H;Fst>W_?9M;
z&;|IU)$&&5SISRVSASfz>_A9+g=T??j0yderCcoV-wWhMj`&jr3;T-izU#f0T~=iH
zyL00LWIq|>QgyRcglr!~8+7NC+UnfG-g<kqm(N;fiXm4!-Eo53D5E=I1g*qEdHFIm
zF!b|n-nLgzTt?l~DH7-6<SW)?8L!3II_v@HCoor)>CZFM7d^|XUi!MK&(-z2>LX@Z
zfy50-)Yj>9f&FZ!EcD=k3wdWJ$b!<)okoCmD72CjYC(}v>oL`SF)3%9u7Q<p#o{k9
zUIH*#feiBBi{RG)LE70I5!AXZ{(6PiA%0`@mgVH!&i2es6kOL7zjp;A|E|!$lWKC2
zx#`{+{Z?bv9f^5M9N{>%C}u)%CEa%FK}B_?Y4UtfvUF|$hhbNdLT062#LyQE^i@%Y
z6T?zCI;}GV(z})2!;;H?afFaLxC<o@$-S9?cA2BlJ8Pkq4`ulY;YXmB8icp$12>C&
z`k@c9*y*;EFR^rm&~?*ZDli>*a0`?s!j7zFfLDTKvv2Nj+R?n^tp4L`03wPlF0}!$
zfn3#-11dN>XauA6vSfAVEtLt2^kou!C3q`t#ccPF0L^C_uvIh49LSVCNbFeS)|FKF
ztnt})lceC(lfJHepgg;tbsvAG8e<pA9}y6s<@Lpw=!Rb7>?*_)e|_?$q-7f^X%<+V
z3uHU7QBE6hBRyrx>OG_yT9s}DwV<=Z8Bn4n(>5Pi2VhjQ-219PT{4mP=xefdIz79_
zna!WBBvZl*u|yg$(WqV_#>tkj)lTw)!_J_uWLV4k$|&6J76F#OHu%1^WFvFZvZr$<
zeg-Bw;4jT22%In8FMvKv-Me+7$SAyX-5^J!{em{e27h>E5@#$E&@&Y#sSVI8vuZ}S
z?W$m1x^CmQPq1dAcg%M{pBL3Z5PczlNoRKLJ*hq_3;n)5!F4-#$J?MIwRHXKz*Xt+
zc>NeItwNKX>w8FR8P51u)u{;<wCuApq63<W%8`;00*#<^E#+?H9Emr}^RmglKfbfQ
zQdrY@P9@jX`pGd|w6j=x&^x=vlwxEGU%WlY9;gICSc7ClH`Vfgk(uP&q$D93K-cUq
z#2+&q>f=C1FJ0Z1FZku5sry3Zcec+sm6)wofI(+Lm527tS7aXbC1;k?pD!JqFnpHX
zTKFaMYqZR2BSg{3i}w$x*NhW}{-|(zJ*I_zy#icys^iXGc7Yf?x;Ta3Q=>B8B^xjL
zQZMZuuYG26V}B;Qkv>AIwl_XBjmh^N&+LM!=Tz<0N@mxqJfMjwhhbRs>*80ohFoQT
zwd!@Q$Ds*Z^i7oS7hQ<<^7Q0v8KQj@^ej##mp=XNc!5rk%ErtoF8q#jgdLd%?Ts8O
zr|9*I6iUmtX{>paYQ%`qt>c66@hOGUt6fP>#yG58P><c){#PxEgoOY^9=!bU{lw*Y
ztk@Xvt6nQNF-#EvxYKYX`7gcZ^ygxsEMLnno$XGJZ!Kg8T4<5SPc|2j%?19}u~#mm
zZxNIU9j}uOC!-@i|AljDv#m<Tt^%ti`xnqE@$5F<r{v=c-N~OJjx_HmcF9ne*RcD?
z{l=y=x0BT)3OiPcKc0u{c7D6d9~)}Fiqg|>HT3bQHdt^kK4qvB!Ufl@ze?^(@S4|@
zq9W18!_c*a$x8|uT3>>(_4ynA&03o0x6kZyVRey4tOJ@K**pSWmzLejDVP`XzFaFP
zndOa+#*>~D{q2CDbaoAAztwYJUJnW3)TfztTT*-{{QJXH1#p+$vRyG`G;6)DiGFSk
z*Y$U#?I&k%B;LvL44mrDm0XUV4E&K8V)LedMWO844+ESoQ<~aqjo3it-`Rtj^jJ|e
zx`3dN+ep4nVMhOfyZGpfu$7>myYxbZ-N&0In)7t;i$0pI7F^|({f6BuyS~lP{PA0T
zdi96<6P~w>iirtTRn{r81+rsUCSMh^<WEqp@2zlu#JbD$El4z<qV1+Q7moKJH_c|h
zQ2g03j^{s*k+4t-*k=*otS4F-{W43R9<!Evk;&JTV_8fOssQ>`=bZfRjkGM)1Gbrr
zM(x{pO&<W(Ye^%K;3<A;L6@Z3-Dxl5+!!~f{@ZKGNO5o;dQJM6kG65`1;#xB3z%bz
zYR(|@4UHRLx1D*08X^xeuK(opaL56(P~s~oFlK=Pu&WUOG;IZKkWs1VgeR>mEjxjr
zK^$sS%d}vzi$U0Mm<Fne4plLs+Wvbxil}{G>>R4!IH#^VMxJU^+FHsdZ{BTqo9n2J
zT4{8mtaH4_wZjYRV&gLU+`(x-jMeiga@PCCORegARKmNHl4QQva_VBEogW&zcMdnO
zJR<wUHcb3rL(9rL&#|!@D|igfvCZVhm60t@g-z?ubmtFGxh?0=C+A5;qe8WqLzbsC
zwO?}%Y|)efFQ7t$3K`_MY4{9H^l6}0@zb0Ak>$uGM#*fhy3tq|SEnDOa(`-B<85#L
z>&0cO4QY2-2GxvWhV|oR$@2N#aZe+(Wnz=BCMt4eSfA*u+l2s#Iy)cz-oqu{8SKIm
zVy+?ur!Z5AvWFZ;!mX?6&6Lu0)Z$KnoIwJ_SM)n|-I$jOD6RLDf-EQVPqA2>&w1*v
zb=QwB^4dE*OJN1a@t!38PD?}mnRtEc7U7g<ckxa<JNV%mop5ZU-Q}YnxYEg2NAm99
zGYYkvdE{cpZohE53e}w_+HG&99WhZ+fk-kELTfb#k-{DkA;rxrilS9(;;Y{CFYijm
zTIoaSg7g+)xL1BUsH;B&-skwdGm%_)>ilaaKuyM?QS@UIuMbR%8uwa^H&<{Fo@Xfv
zd(R{!Cfhnbsi>e#Kc_GAb>yR6Z9X5nV;QMjIZPeYja$~Irb)a+(Ipulr!Tm&7+APj
zM(&==-;q~9-McmtK{OUUVg=3!cYzz9i1@SU`E^I2(Wrt!&xg^53C3sZHT3No7cd}7
zLftE%vCx0D2|_M)*@>0nk60I&ydrXxh{C{FPXL-RF=^3!P)D)B1S=bGC{znr6s})R
zP}!JuEW$I8FLI6)3sQv%pCX6W5jX)E$sYDW0%QQMDBId#cJ0zn>(RppLFVKOT14K?
zaSws8$R2t-x@zmkIHW+dle6EClX=~lCA?$jOj9<IPH*=fH)u~IU6OaIvf!Y6g{`N>
zgD<wVJaP%j^n8hPFn;twh!zLS)PjSmR({F)CmGZDxaK6w)vKB+*;ZRL?dv06?<&@6
zy?ix(F`M2f^kDDOq(%qC+{;UNQC9V;aH6<k_CidvyuV%Ji#Rg5lo+ITfZLtPj<t6I
z`uJQ|$_`INjpItvQME>0t$#8HWaGm-F-ub)fo#d(HW$bcaaK89rmL~veKq^|O8bE3
zv~&i^@RFhHdaICKYUf4HZ`b|lWxj{r7r>RVy>fq|GvY7nymndk>lzFsjFNHxb+waL
z>2;v#4dP+nsc|-nJ#@~^^<|)-Jh5m$cA@@a88^<tS3^@X_&7hcnBQqs5O&ZE6(l(1
zC;dos(!=AVv<(`&Ga|V20hCUapm=6RX5)%R@4$~k&gal9Ekmj{L!{Zzp9pWzJa3e{
zuK%jg&K8!5uyI>f40ND(wqcIfEtHj6Zj*@)jdJQda6*rW%|JiggaM4m4Au)@)p9kw
z$taK}Ek76eN}XTvh1>2ppJ7+l6Ap45{}_r1!*eJ33qR<OYH#y=e^z`bx5D1*(k&^_
zRorH$WO7v^nKRCt`}NY0%b@KF0vjru*Ko>8-E~W2S{)AZy3WqdKA3}yt)!}q0F6=Y
z4|L60nUc*6ESetF$9hF9*ko18XUWFs`oe>D$F0*E&@n_$vZm6v!0W=!eQZj=dFvF+
zN>p6*Z+rB2H1g$3rDxNxzD}0~4f`^xIc)u^8O~_teUW&n=exsYXwdzK;^*lGxGTPC
z%ak!|*VYKA<~x1kCdM^I*C<h$FUZmdTy6Xz(|fVBYs*Kodv86h<`6S)1m53UP+=$Z
zYep{~e&t(doIONlv)rzY!&NJZ;Dk9jmg7^3OnhmYU@8T!mJUM_O&0Jy#)M$u0=FF;
zT7zNcwJEs@q$gKGOD<B{&pI_lvvYTuymq~d&yl(hSUdLO#<Sn=``d>;cm%c&GzwXv
zbg(yhSi1%AF$<By*X4EZMvDk#r)oZ$eAH>#xcZhXsQxC;7`iinL6sWdv&{L|Vj`jH
zA$rnMlIUNbMS>*9#cO)^j?>xX-Gvt03k!|1NKv=|*t+>T$8BjdbMwQ*!<H(*3k|}s
zw}4d51-j}f5b01!=u6GI(tgy5I|^dsj?H?|%y+_XID9~W-SO7MP;c=_ndVR~!p)SV
zmZqukx#dr<;$Q0fTP9MF-NvJ(*B_dN3ghbJ;e#QMll)h4$W-xbA<v8@i<4=V>D17w
z#`XZNwZCPJDE9A}@`o8+Y*-w+RWh-k1H|G@XQw~Eo=D2A4O3zux_5i2S=tPqWsbFR
zT+77$^AGjt+}_x1Ib4FP|6t4~gz03@qTM=`Mafi8w+^yvGi!n%BCZy!8sZKalWv>&
zB+zU!ojt<4@eeEIyQhrwWWm=hNlb>uEoDjLaZln4I$M%n{YLXAx-}=NG;vJS6tA5K
z3|;eZvHU7kHh&Pe)0U&sYFN%;IHl;zLitkq9bUiY&#J|V`*{pA?{ARzYfcMlGcJFc
zQ(1{JZfNF7wma^nG#2`RId_uH`kXfUM4XN(*{*R2LEO-Ouu#^?ssL{1!Az24?rWJG
zJa#$M>%%{8*5d~Se^yN{ptCfbm%f`CiLmAJ5ui8pOpl?0GHFo(#@$h$qoM=YP#2h+
zvVv*KxQ#m=i^W8T<X!cw(wynmUccmtM<WuHS;+d=dHgcwkVC#HnaA#ms0yhL|M1}|
zqENiW7><m5t?_&hb(Hu~uwx;^b`!7+LtD>kD=N<97canMS;=&<dT6ascvnzu-OwEe
zW3g)w;yBJ4j4Y+fKE{T!PV2(RuErGght|F}iOIS1woyNqdNqcSQVIXiAuB5#HP9xR
zfr8^`f-St4L6B!#b-2-~Z6ku9mcj7D3hauO1<)x^(`cjl0mFm*Z4b0kZbx<jn?ihT
zE^U6dZIgH*NwLf(ZVSv>*T>0j<4k{FHiMbW;%QpK5%#^7C7Uo3CJL05G;=)y%!w~K
zt*5(QavvMz#e8wvXlX9y#-Ey+s-u&MD~H>2O4tVUupYj+-X-h$ZsvU>B1|lf8&syp
z#cCTeHdj!(My<&c593^?ZPjOroJy?^#LLFsARKSu8j0P>-`ME)*XmZW?0(ReWB4{f
zC2-{vJHf&au|7f9!0_uotAySK4s9_~-_NVwj&}h4h|oahwCI2p;*ZI#phC5!+_Q5g
z^Qu2Y+(*Nh6KPDH5!0K=<RTt~?Wc$O;|Djv>Lfr6I`{JJ8il-isT@{pA#MC`GC-$S
z$5yG)(IY?fYL2!Ss0ZGvaaqzA_pc;9EMYUXj*`_}&8K0KjeevHz+W^&MaO(hFtZX@
zi&%)U#&D)#&&_zOk;M<|-`K^%e2y3q!OkDY85GA1yoK2JPL#+KRgd>hlp7L<(A&>M
zque9v?i+jGhE`}-sx&wbS{g`tn!VrPHgSTCfyF-w=~9&>gQ71y$52m0=Wj@N8nZE#
z8O>JTv%Spi8<u!^F(Wr8y!(J?bIpleZ`0IG9$l5r*Q#f_02m?%Hb38Wfm|}xEUWTi
zaWb11r<#EB5~KFxw^~5?^EF(2$eW?t^ec-JYUtQJ1BLF1v`MZN?X0bd(xc0v2RRhb
zzQd&`+q5bP2kiJ*vG4Z7Cf47VNW7J&r@ypJE`2_E*)D5F#N<%6osu1*wy5-{*JgIH
zw+)8L&gP(E2*uvdB|=(>?9oW~E|iwQYP9-nO>r;bD?%6prAZ<7eZyw!a{5XY5@PtT
z1N{=_5V~tKt)+zeW9LNPsz(4zM84g72BnnNOLX~KoUt-#Iio0n#Iq5hc17vAzQa@4
zC)i{;@i>{-vn)SrS`Qz&n21l1u;JKBSQP14&ez+ECqFBGsgil%q%{Goq1e;RBsV4I
z*z)80x<7q0?FG+dyG`l04dZ+6rW#tq`A+vcdtM9>t`+WV2*Rl&kmcrJBE0$nN*2#R
z1cOg=3~$KfadCfm)Z+PmuJGOcBFVW_Mn{9drHc#O7g0T*z8On-fbO-@Hgq5fca>l^
z#6Ed0JuFN)jXv?7YKvRAf*M=Jy1G(xrr<Bz&B*By%}Z`?)*=fOC-<DyPG6oDRZ%jy
zQY|jnjG~UB`i<ICzviv>yVJ0uNfJ5dwxHzw0NN$#ZSc*AeHF9e_O+gDySg*8vn8ki
zx~1600^23MTVqka)irKV`-F^lKr`llQ#$$$%0++}D@sqUD}3Fq@r@>GdZzKKyKV?j
zU0Lx}`U8mdbp89C*|U<V^B?)`?)hZF-L?4=d+~P&3uRJ?-E132v8u81_}MTGiZPey
z{P(?dqa6a~!;hqeanmGWtA?4mg5Y8S)n`m@MfHRyN21UUEMVt^w2SG_b7_Xb{L^N{
z7EwGx{C&Q@WEz)S+Wj+a0~U@W*qACoIcqS}VSfrZUKb)tih3>P(H<0xheYrw(Urbv
zK=7TPPDFrrBn(vA64uFuuWP+PIreYn*6EAHCzj-ZQ@`lO=@uG@hXWZ@HD#(gjJGoT
z`r_nyA8aKj57D>ECwq45yL16TVy<r7JtJO2|4lz8MzrRFu2%R~-MVL}rn}|g$MHHD
zw}waKf;2ClEu)=d>(^Y*zlOG2O{Q;{OZBIht0bTeJMDcS`AZY`4PeZcXYZ((UyuwJ
zz~nSVI?JV>ewZaX5WlmIEew-U<WPqeyw)s_U?GPY7XuI85jCs*CwS@4m(L@f70;_y
zxqZ*KLrH;^8Kw8$(oD|RxIN*6A5*v-M^k>j$`f>_EK=#Gt%!^@OEsq2xa2BH)!LE2
zy{0B`lbQAP-Uk-#>>V>MaLhQ)j@P(VG37pz;G5!T(3=Z65CLrKmxu2I5UF05P{YNm
ziUb>={C*EbFQrtW1IG8{ltd6#u7BJ?51VATjwe?uAcYk%-q!J%gCqa&srC$gxwHg=
zg=tZeahN`>@oUNmyY|Azf2r><zx4`-#pq*lum&|*L=g|?TF)>cU7mSYZ!p;F9wD&)
zQH~uT!G`T|o*}c_fRwli966(#)9*$<2=%P5)K@V)iw3$`MVzYd`0He6+><E~d{4YQ
zGN&OH<OuiF5STAA-s%f1<t8ULB*9&GCpZ7}G-)R&o<5|f7ri+-mE6<Pi+?md5sV|t
z)3<j{@$&7Ny#HDwUc3i$D|6&%(S9<+U#P3=HZZ|9j25<p@j3RkOE0Ctq*lnFm{XbF
z67S2T+d^0MO1KI&1OwqKMF$=%9a?8rO6d^$-lI)=<_7ieOPbsV4qv&AzJd-2WRcAC
zcoDoIN&jRn6*0oJje-;aSITNk;pulE`Enf;`)eR@4L3x5c@1LoeKd);cc3h&Qvg$w
zT<|>xtNXAzF2uC9McOImSj3KY3h#-1{)i3^985m4d78O1O*@$(<G7GcxIj&*ZbQOn
z|8k0u*^d#fd}`<c)eHDl#vz3!!IyYU9>>WfQUPaGnXE6Bu)uaoxWrycS?cH>dw6G#
zWOg23{F>#a1I5Bf-8s~EXb^G?y7LrjZ;f2C8T|0@(W~U{pABLHzz;@?o-Tm0@)0E}
z8cR2CRkDeQ3IJH0#};nOfH#sB;2QBkYSxN=tEHvQqm4kJNRQoU^bB}GJPdP0se$f4
z$rEPF57R;=lwjp3ezh-iBX#VeF8eDBpw_BSD}CJ&Sk&scUQ<1(6@b=C47EB+@*Cxo
z)l5nX^ADpAVdbvqAF|03_3Z|o{Gv&`P~m-$0kd%TS_l^V%1UG7#+MhtdxntLlV#r{
zY!5T>-0i_NxF28mKsTu`lL#$)HqkkjLICQ)m?3ee6L5ST3LyfWbg~keFW5?b%}PJh
zoTI9phy@*NJJSi)b#FFKjlVv#zEZsplYE$2lr)J;wIAY@JVPAJBIwv>HW7_G7^{#E
z&9=<--n<06w`|76QcYU4)ye4GyFUzjNPoEHsbC6h6-i^2a<z&Id`ye?8m2~08Z;Np
z^XF!2>ZCub2H*XvN?#QP$%W9sgXytGab|x2&pOw4%6z7WU#`Ka-~MxP@&P73@|Qy?
zO7TtE)(_Fd(~e*O;!_!b#utninuxr2nfHsaV4{4=^E($${Oy7TXTV)NWD(_BM=&T9
ztUpf86KVQI7^U1^x^`sRyeEadvyxMUF!WKOSqpD_ioSJQTaX<kZ{g7UsZ<B`XkDXL
zs`<HBnc{<~yInbn4fQRqy$ifde)qo8nBTC`F-xK0D+JmkvZ5g5QnJk3#ppM(Q^7o@
zk+C#UEsddon$`(yB*Zdk&{jir+5U9HW_>KC#v$F-2G|J_E79ed9%eY5)XE7-S6)Jj
zgRt?ej(?<yf8kWYT-O16fLsP$E*gF3=8Wiwt{7WB8^%J(n1btO>WC2-M26TOv1ocr
zKKaIW<v8kw4)8r9!Z$JTcO1COEhyLTl!4xd5fOvh1)3ql=4XWOs0ZQYvqqD40;hWM
zyKMZz1m~O{ok7Vaw9oYST}~2^*CGHW2-8pLT62F>H(@K>Hte$MG@ORS^HrG^y-#G*
zvEO@&q0hS&C01a!vu_SlQNz{8XSolQ%2=<6u`4>S`Nw13yN{&1>4`4T5GIB?eXaSt
zgtCpd2#5P71~B1}N~Mhi`Qk`w8<~;#r!X6LVuXLxpogKkATd!+VS+x<7c;+G(|B0q
zy9PQJ+^qXSXOQsfMKELVih|!<DxeG@=f9D?G?Bb;uI1Iqui_(Hjxl!OcIY0iI8#Bp
z#!O+o$vA`dR4d=LW+5w;k&hhYsyz?%B<HBA_3sj34y$Wvp<lU7-(R6jEO)^$Ald(a
zyIkdu`0xW`{6snLk?&B(?Kkqqs04aa`ZslD4Q<%|`^L%%((%zcYRBw4!j|3|RBx6t
z$lg$u4bf=kUbvv7l<VND!I3aQ)u&Ir&N;yqa%3x2Q#vtA>AD@a=+@Y72^3Y(eDc)Z
z|8VE{i?!F(AC5Z+66JsXOqw>6HE^mSY8Bo?h+e<#{V1?l(8MZ}BygU20bwUJH<f*>
zVdgNs!ViOBq{pQhvj=ZLWW_uw-BXdlA@5!dZH(b}n&@Q33^6EIX>Fw?1J#3{=O6qg
zx(=}?1foY&vrImx0}pb`Pqr6ZIW#Tm`+K70g#G0_I}F2u;ubDED7jN8j)5X6E}LfF
z5zvg<&t_(3)k{`#yw<Xc?1&Eo#I`&r#aPFNNa5Of=%lVW5JgLb)5V0Dxi!gYgC<#*
zqVkvy!_Rwa#KRdEwy6V^iOm*4TFY!;C-N}<>Z*SOyuSc29|Tho<`xQM)#urmE5P6v
z996M@riHLt;cM{#23DdR9{k-QF#mctUSdv>SqDcgoo#X(?V?UZC5N>hc@dtT6Hwr$
zs7jb9tq^Y;kkpf}9ih<b7`NAYSp`f{*%_AGJ=^@0mamFtPE=pnT~|+=Oh`a9L}z2@
z>?w1a`9ubz+lyeDs)>tqIGLWMa*)Wf;7LIPc$U}uQ-I|}tMkt%f@^~$<QzJW@6`3a
zNJs*Eogj<`E+x1CYib8jLlR7BlwD)i5(r<qQ2RE=fkV#3BFit@H=V1(+GHGP6${af
zv5%7yT>XcJDNJ$#==`5|*X#VQOMfin9_^WM=;h7mI=GJ$^Stx6b0o~qpBfqt6<e$c
z<vOX9*nR5`am|a}QplBw;r?Dt_=$&LcM&ncB0?><4z7Y}L}u}qGtJz16t_^EY@!}<
z#FBr$BDIol)RJXBf+l7wM2h|lN!WrvBlPE*2tn(^`E_NJVmz9IodUzKa8Sb6>~4Lm
z>%I6=u|gy<o!3XjQ-zWx3sBxi&JHUDOT$go!R$B`vGNmTIXz8BPR8n}WLdafZOfU`
zrJjQ5I@}7Shdn-4Oxpe1gZ%o|`jYuN&UPa4xoT(c#b+I&B;897KJsT6_jKQW^toz0
z(I^K8K@&_FdM&BB!F7m*+ID%8ygs^R4o=a@mp@7v&T^=slbv(t{rO$AKiWKKrfR*}
zHKz*1PBx6-4p%|c7sE5<y5F^06BJ0yNK#pP?qW7dnF}}j1&-_!gqZjpr`jOAlh0s&
zj=|H`vLnN2c(EddVp7$Jx@HC!IFLT(K~sxOK+EWTeY<U)%BS1i{Y}qbO!hgZ*D<$a
z!e_4O-*+0BD9vJ@L%*htY{gmTCiy<_>0d4OAIj)``)g4TE3nD(WRN~QbC}t2%{>p~
z>=N9#w`4N0@+pzJO+W2D33CQK*U2P2G1<GIU}m#}BC7l2Vq&y*xMhGrPXP{TA?B)H
z`tK7X9XNz{8kUm+Lkb)Jl&xhWHBdy-t`03Bgpnhfv=yBUiUyIo14ku3y8qC}+Zc*(
zt=QgjO37f;6cZhAS)%65@XNPpbhO=FLu1U`hxdr3qKLh6`ejeuebt_HwbG-~D&YBF
zng>2SByKchGbuTHYjxngaQu3@Zqow_o53^YhpDKk%cxd9n%CZn?x=&xRzLs8ZR$_2
ztRj<;tbj-UR2!?9^~Dcxp(~6x$ExQ?=6m1_hL>E>pcTLF#mA%2-Ysu@Xe{1+X*gEa
zK=u1Gr~Jyb=E`NDJ(56NVrwpH%!VhacvaN5e5v?I;z!V%clI(p3C!TlrWwSSRAf}4
zFG3t3mjqX}q~T)ol#7+J*-2ps52G}uvirT4xNrN?!2??YI%XS?YNM9Sg&6f>5Gf<1
zqeJ07P1O`X1J=Hqv|%Q%ICSdo0JTLE!UJ~j{+Cn07C-NnI$eK$pai<ZOS5`9I0irg
z08=7KeGAgf2HmE(8KiPdOYq-WB0SJX!*7kjv-lp4lfx_?JiKyN*;y4E+XNj4Gw(3M
z<ls~m@4iRo+kZlxyN1EHe6&7W3ciGEpec9|)%{Fkf2Z{HN@1u$UtHP4T-{L#v}F1$
zoV1z|OFdDf^nSk0_jfQCbst^8Z_lRhOh|glnqpkx&hcxrV~hChd=<}i1rp}#Xf9JA
zJI6on^lM(w=G$6qLWQxeZX~Agq5`nvGk^;dpbZ0PQ6U=rPnIh|oK}VSiJ3zrJ>zx5
z#3>&)zA!aOFrMzpzB*R}P~@`2+mqza-9&U)2@+)~Z|gpi{H><?zISPNn!vxSFFev4
zNpoz8my%QReOeteWfJ5CR4Eb}k}>89hI9d$&-Dew{4yo0t9Z@=_(k^@nARJMpwPE3
z%ZKsNpBnj~FQeHMwT8Hcsiwwjd_jO&1)>{a-_Z=VWds_c%~tkJ&Zyjkx1|ADQqgW%
z-B(0iZc6pPh)QVzEgxbVls<zCf1J2=otpk(M<9;k=9&UYHm9keRDXsMa$I-HcW$^X
zN&B`e^&Q9$J~t7CwE=fBO|VL)tEPS5aw5^mbeM_lvGt?V=meJfc_>Zn#9?y0a0FK}
z@18S?`1sMNpfE=z>iAa5G`ljjHHN1bc8ZtoIor$Wwz6Q7ytjUCk?$M#g}2b*rwU&9
zSAPTiPVXpbn_sptTiOqo18>9wGWmqXLL`%)FdE=l+wlpwOBC%LFopEONV5edHZtZW
zp=IEf=?asr3MLA+*Y$l(W~R?>K9F3=>9xU-i~t4K)2p?hCA|{La-VmwiN$f-zJUs}
ze>!TB{=t4tv^$NK;~r#J%{lmO@5P<9JIL(#or*X<E9|XoZKGZbhzfl{=@k@umz<n@
z9ztI#km7JX2L~Bs;<B;<vEGTIC5YC{M$;&js%m284*eP3$kYwaq7(-~j$(Nd&#Ble
z6_pSPz~bLk6-cz>H;tqlfb-=G=ACz)(_#Dz3*Mxx96ETb^hsIw(sMBBqVcuwA?<)F
zCwD{7c}>YEn>vckFZaD2I(~TKFg{2j@)RgAiw)l6W7FHyHi<q-EuXI`WN$nOS-GZ$
z{+&p$h!<W$T|H5d?vp3GSUGc$fPWgKLigj0+SLiRPmNzZ+?8DXV<TG-wz9o1gKCoU
zEo=6D_rl9NBK|gf3Jz<P88inAUdafH(W3mY7hN(M<3opr=&`|)8xb0DOvdlWbk-L4
ziqqx%t7saUUw87V1?SipZHYIvN_Be7SJq*>D1N(7(zitDxrVwR-TcB7RE+m?@Z^H9
zFG7B?y^e3fH|9|*Inu!G#<o9*L74iqvgXGZ3Qt7O;T-Zk?tfrWwZOXa?`0>NJUy{{
z&wG~*-M&T+sFEC51a#>tm=)8@pNe3krXd*tU^4$}h5_HL5^a-P+z@l`C)QDY_ol|i
z>L0}wmA2-OeM>X?9ZZ1!71$Y|++nGhZ9o&<1`xC1=ZJ}P)Zl~(rZi*BvkMN&-(6uL
z?Aj6{=Pr)`m1rE-_Atj`V`U}~F)(c!!##U-quvD}13td!Cjbp1s(jt~#JNfYT!T;{
zf>4Ge(iYAXv~l`a=*i>ksBm5xiCaT{S=OIVt*bQXB9Un7bfbPfoK45K5rO1rO@41I
zC~oFUPB4qWr@fZDRb^{r>%}{Ee#yT*<XN)+S}6v929l`|bs=*1wBxh?`{aS2UNZJ3
zoj2~;OrzJ8`BRarOmXG<*k?^mV&-i$@HTf(#}l?o?*cD--8#d}x5+5x@*?<`3k3`Z
zFMaK1&ZJzDH{B0<Wv#*s>?gfMbw87OK1Aq)Gw-8QQlP%MHIebH9M~?SeyzT4fmpn&
z6!x>l-p?s(Pl0Fl-#x^^Be#i<om)v&SN~ac`yNw2ZntJDc*jhZyB8STt3$erO%S?Q
z+5CL|t)h*WT3Xm<C2NVaA|x*l=+hVgm{qyBEv%-yZt^;8scLCOkH*_)m^sWwRg{CM
znxm!|;HmMMsz7FL|J9|XE?a4l4OjqNFRaf5F8vw@JXFZHYRScy=DvP^y6oJFUL*b`
zi?9%lM0Ne<Zyyjlgp{<jy1-AsKRrg=Na=;@WO{f%?KHhvkdKCn*Og{kzwFxuPQ4&Q
zutLj^3a!a|g+Ib9+D??>uOB_K#0UD(ft*u)wZfDdPn7Z><VbFv3b-jvqb%3)_p|PR
z(}9EeXLRIziL4Jlrmvl;?7nVQl9!)i$Cv9_cb&dBkjGE;*H~H0b$}cVU4K@2dBN+*
zgkS{jg^?y;i9mpE^m*HlBRbxc9rY7?kLLF!a}S+O@BJ(okI$j$taFgpcT;s$-3BRb
z3TCmd`Tuf_oJWqgH|<+z^y!#JOn(-+&E8Q=+=vb}GV_`R^q~UM2u2w2>ox(oGHVp2
z#p58l$n^+(mU<npNQN`awg4xgsE@$=yKx3-N;Vmu$u*eCRi}~+Pth$p2o&~nSrz{L
zyvbJEzr1zKTHt3@No+lmD*12lAFv4xIE6nL`j~p|asG41+5a5VZce*YY{e7h+Up-&
z(3dw}onZ2Y%mLoqP&Q3BBvVb{)W?SLu8^}cA3<(I1u`La6jgPuX3#$}sBa`4g4&id
zCYoTL&ss}dt5r6wE6Fmg-?p-VpLzESO7u9K=|9gim&)^f^q(o%MOWbqZm-epuGnrt
zZ1{&gp++zL?j<q*6ILu$V|~0j(IuY8kP<L8X;lB|?tHi1j3|Udg>%_y0UBX89IRdW
z3h%@uji{vLIgF)+^KsHg7YP<l5$@ly2Mz(I;!u;makfeSsjuQ#3l3FH>-18!|FHwP
zHnDQ!HOfPCsn=+S5A1t}@UI@fd=c!(6u0{fx6E<mH}{@$0rBpxlFZ8rdw7j7pLZEa
zsesngxM-S#zyV3r0>|M^h194?K=U9&^q~z{qYkf+l|b4gA`+G0gYSs<AKy{=8Qcn~
zpi8+`b$qBw%-3VRY|~@Q#@500{+edk_9od+ZoPiZIh%(6hzeDL@5%U~D*~=uFP)N2
zBvlYVMZDIj`p>U9^ncOcJ8?3o&gIsvTS%Hf2n8qz{ebZuYzqC8qb+m}`GXd}kgB}z
zH=_`ywHRE^vz(CC?J3BIOa-o_*Kh?WpkMUiWlyG79r|%yP2lD0e=Jm|=S-jc)2uXS
zXcPoolhgh@TUEU}mj`*(>|$2?P`_hWOwJxZ%`Cp{KCO9a{2fg-D5%ijQBrx<Cx^BX
zPJ*NNkg;kIAvRHo7U|M+M}b)JV^%FF%3Uy1#iJ0acL9T}ADEDCCE^oNSPcK+Ek0dA
z`iq<8bNL<7P-VzbxOTta*0KSfcM#xA58WGzPqyI+kR=LH-X1&r3c~m-LNbzNKmUV1
z*gaZ^ukIZi!SD2g-l-Eai@)Lhy<Z*&zvguPYOm&{N;!gs<ox9jWz15`!xEms^9U%{
z1&wI53dslnxZPD4=acC#38|{jo%X8P{q$?Qh)n-ouOc^i;tyYrzoU3QROvrlBTO%w
z;H_B|P%%GLMa{`6gP31HZx#TeW>JKAh?Pt3K6CjT{(s4~JWjXwjTP!Ada+aQ0@s!*
zSz+G&zmSc+pWacyH%6ZMg#JOu-8{dXCn2z=5rctnSgA}S6^I<YwcMtDLZ%(pEqPY}
znq-F<A6+$);ruSSyS3C^TvXL>r9bbgF+Z{FKJ99r<GF^Wx89fVe*Y^=df!phaD0{e
z)KH))*;LE(nSboC-TxG3{PT@Q@TDV#2(*{hmnOa<nOSCR)rdWP9@PDzpU-ls!E?0H
zykC+h=QD|q+=4}9ux#D)>xAsd0vANyT>j7Z1Hbi7<xiz+Wn;Tv47T@OsJ^^}{oO-b
zt*xzH1+fuSkT(p8YIG3nOKd%#FLw@ler7)axZ5U^z7s6q;jqvj3aQ3q*(_+qLf{Az
z51Hn+;Vc@2ovV%zR7Ilsbai#rDs~rdAd~-bQaTZ^{0&^N2LA?xyxs#LreTsXNc*Fr
zqTcXJWc>;YyQBbZDI&h&J_oQFThdJVhjlOKi+o66^~(snyv<@Ck+-l=Tsa2Y{@WvL
z_)~Ozac@HAQvKtV-?<Wum*;VRjY|#fn@$PNb3{LMI7tQ;+)!#2lP?7KUAuB~15p_Q
zP}{lK@@5JmjYakJ^oo9joX2IGYb)ehCF<_XmJ;pS+!>XAl*952FR(qivIs|V1=Q|S
zM#qD(8Z!V`72er^g3jv}mPlaribf$;+1wLCGIv;92d~l(=)4PHNuHQ!iPv6!0owlZ
z%hp|2kpz-Jw5=$>d*hd4!4bDB#zxd(p^AuEhYgHwG4E?fvz9viq4fBKL$_t<2j&4H
z16Dzu;M+E-xJi5X8u`N=esnUGx+gvc^V|JE(tjXlsO_apF;-Fz{Prose0|gBXRNF9
z8TU%^Yr6^pZCJWO7t9R)^Qj$h8a=dk_BND_?X!ygc?I6phv3Au2igLxmSfoD2;Vk}
z>F2r`3#{tDctpEHUSg0$m(JS@)$BAWo%vG$J{b`wWF&%^K2mg9(erjkl>Z1Pxj><4
zd}F3g!?i*tEtS~<ByeQmz#WH+dWW)T0zfInUud+J<Q~9MsQ&v@3P}xOgFyW7x7P-J
z&#c6b#1mcl_C<Dwh+9``3q(%DspC*b2O@IWAI3ctskJy3lioXPAZ+PE)o#8aAc+E<
zVXav@IX`z|udyWFnpb=0{I2cAo3?j|C_pF#*-TMafB(0nqjyYuM+~`27{z~EhZPLS
zacB*l$&?EH&rZ>{kT*%BbxY=OSwp(o`**S$SY5au*$moPMid<&)Uy%nf7%N11>8FI
zMGO<$kf1h{pakG?Gc?#x^xkcUVC36C#nkfRjNwDVhalu;*V{8>!XEOSa;AVrBJ2jF
zPMBE5jC`vY2ODl+w)sdU;+f>pp+!kS0}<RL_%RsxGu%cC)fPfXfmq=tVwg-5o0=5c
z8XFrkgRm;37tlm9G%@QIF%dM;V0ZcjHkw3{WFq>}DC~MQdz~M=KQxD~D&<KNIS(v1
zp2b9K&0@xm0x*oMsewDonS~YLJJjgr`P2#W@Rnsd>8}MK9g1$;0`Nz-<HW*cbE`it
zX43z^q4B5Rz6|6(Fu-E~abaw=S&|-v|FM~&CiD?2s^amRAs*&b*qX}h;W{Tok|DU-
zd)W7wq3YE{JrMrJR5iy+qnb9?7Ep~D`P;C|NfJAfn()pkUqQ@I!G(}9Gz3~+?gc1K
zB5uzX9oFjJen?-#jLvIgAfsVbu|8c@09?RzI0ns#`w@GrA_lU8YbbnlN(yB=5ExB&
z0ur?z1+$eYP}V)VOFaD0<NQ@b6lxxXB)dNKv%ZiJjHuz2zd+$1GK`4MV<f`ESmV=d
zb7LTGE0}7n(<rxQvQVSKr*`}`K2eA{5Y)-2Pzu%GeIFO^z5*e0H;0PdRK{@ep%vSy
zWP(jz957Auu$FV=Lh%`oFI+y+Mvky@MNb%Z*Dl-tymsL#pQf7yNdgzaB$5Ovya6sq
zVUlV~TO`OB;>S|uTxrzxzXE}u8OoK|kA^$5DVk7`90NqfLDAI?3UQy@Wp_<CP1Okd
zdDk#V+OC}j8?yGVF^)?ikbtU^V__PSk>dd9P1umUc0VeJNUmMw{g6N=ELvqa?+9<o
z#62xyLEDZ|XZN{Wd=x5c36~)DaO*>*RVZEtk@zKC`k{P*vwa_rp1Pz%*PySIb$q!4
z4KpwnE+6aecAp8Fj@WHo?tEjZ3*6T*{<WH%c#h=d9X$VAZD4vl(DWDPxxv4rLw~!x
zy`SzLaQ-aG6<9eHOaJWieRQuo<!*wt6xzC)=UHzI5-F1W$1NM*i~(rFN6@P3u=X|9
z%}6$9+m!YdrR(tpU>`rn-blWmH5MH@h=?QfIh@k8!%SV;NU=L02(H*#>7i`9>hcwK
z=#rYVVdoELTs)rwf7YS={9+_B6m%*uMf(<*P3>fw>wvPVG%nntL9%9><UolRgG2&B
zlr5?WzQ9*dL?Hw2U~x(K+pR34F~9Gf5;+W2JJg%IsD?eD8pOKgDf_s%KR0INiM>MQ
z!MT_}9-)0l+#R+P(5=jaT)1av+Zu_OugL(a##_hCDryWi7<+sUh%^*UyZLorfo(Zo
zv*ZoIv=$QE0|A?KpK8!>^$8kwa3JRej=whzm_su->qP;zLD{8abYmcMsuDz*k9Lp<
zxT%_ZL5@gD%o=E}bz600Rv?zAs`@uOO)~K?qE(K0ZXfk#4e&FOk=pQ@^SPE2G>VA=
zjeh?A)PQ1)L~f<Oa+viC4`+m1-aG_HbP>rit4*0aHH}aA>itZMb+rH)f{Ye5>}?(1
z{})>aINlEs`OBT8--KjU@!MIIb3yn4DUhQ`05RZvAgB~j^x1&RnHCX(H3`1Z0s=rP
zM&feQB}3JYSg7e!F&kD*j_ZqKjj__S?3B}#s7Hl^KH}AJ03uWZ+*V_MTYa8Rts7G<
z0^-#xF9lA2k~S&H(M{h*2ulQamzdATQB1S*sBI%k82zN|UlxQbr+<P(#2Crqs$Pez
zMEU804I}MLw8QVPaJJXbKVSNal(V8#YX5UV;LqX+*_2iIl=i*Kp%8+@v+zNS*JAWa
zNY>@s{NU0@QbzGPm?4=0G4q2mOGw-dd&B_s(~E<YMhyx7j~qFp3mT928o;}1W$+#3
z|Hw)$U4qyNQ5lXKP6zo}F<)NN6e4-R%3q)q<GTbn4S*P&MCTb)3%VAOba7$&-+?!!
z9|!=WXw&P2A7;2zOn{5ww^_TKwo-wJ1x?cT_Jqs-gFTVQcW@J20NzN7-yN(joP|i5
z-5UcK7$LXT_m&cXG-?f%^fznXg!8)ZG*ywbe<1gMPa<O)%s?q4)HML9U(^V5q5%2w
zNci_V%=JW(fHyWM9|-!&hG8=ypY?n;;gn<m<cRRRtt&Bg*ii2q8x>aARkxrT3KuA5
zhm$)1$v=ej)wAC#<7ecHBovTx*h^{`Sn&D2+q3_rwb;MGEe`GhE2I63|E!>qLsUfT
zAoIZE0#HwZZX%3o4ar_gPqoc!Dt?XsRlDwEq)fHt1wN~USOFv2m<d)Ssxqy1>pfou
zX0E@CCblzQ;NzP7vL)z^E0HvJqZx36Ao2LuDN1lFknH~9Ersok=RG3yKGbU4h$<0i
zn-DdC<`fX(8{&trmew+>Il$4<7%#`1W@u}hGwM(PJbl`GB;!MZf9dJkgzC<P<<A7n
z1?pE{e?^p)JYsv@L&^W#J<zE+z)^yXr5NdW6d|C3BzH3WW?Mjl80tUYM`8bneT<0X
zC2tL#)i&ps`0~ILa?!@X+glyNS(WZd&i(*;yK~<KK03=UFCp;)s@wDDv@`c4XB^Ob
zB7G20e;`bUo1~2D9UmcUEtPo5Cg>g+5u+XX5(4}}&7xXPJ~%jdgsK5wF36e|w*#zU
zv|FB$FG%u0d_>S5ky{M+pq=9`N&YZx7xWsF-vzz?>!_70Ie+jV3sc*_-GKkP6{+AO
zOmC<H_%Dojlf(7;KwiML04Lg2tUjo=q7#A0tj(#eek4uqu(3Q9Z3tNuksI}*^j?Ud
zT?_5o$9c1x-{wgfu3MF118%Iq=0qjA$&^zUI7E<=|E6j|UjD_3%1UC?Iuh^vNC_<L
z8gLfWuD{SiRs^J*ddDZ_RG!2DgarAJvoD+EGxYpzyzkK0b;1FdCp+i}%EOxRSGVsx
z4w?z#r`c1S2<>){b^r7GXHs*3d<Tdh=A-?f%-jt2!d*i1>9@ysA=-j@;FqT_=yuwl
zI$6^e<ofpi<x>ftxD@ti2k8<)qS2q=2!gmlSnRA-$W8?tzY600L;`XK8Z=-;vHZ#s
z^r7XDGdwVfjD|1+S-coLUro@t%|j8s+juUeY1ain1;$r3SB<O=STTb@j9IxPjqpLU
z0|k^H#P(Mxvu|8Ilnak$6Z8^;ZuChk@k>s}@>|z?g&-hs3RV3Ye|*$I-6<b<d{#Tk
zJ#T{d-=^pNRW0on2u?3{OQt&0fvE{7ne5Pu|3E}{&kPZ!-9rK-^Wv;9g5uUhLfRpp
z;p-}qfayR}jY6_d1K}bIF$$SYA{YUr;9zJzcw5*&?HN-Ccsdn7KaRn;?R)W4d!n}9
z`g<nxm@I+mA1{`dU`9eEEP~PQ+moAcfM^uGJg9~(YYbu_fU#W^XA_GAAvxz=X)8WH
z*lIL^If<5pKOMk8;f*$9@^@L+^_^*&ksJ#%h$jk)vd=ZXTcE!DWAD!%+*5Z%|F3s}
zSmm2Fzz5z?rQxf3!#Q1nV53OAGE0}1K>7<g^Q7_67rpqG<&h{$g_xE;#0SVev;ELF
z!wzDKU_t;(O|k1NGATn8q#d=ene^j2a#u(V1wLYQ=a-SWL_H20hUG@chz+EX6Wu(e
zK>n~4o@$hGwplHiUf)N^P&SN9)ejXA`mWnVv!bWH4UT9_x|R3mS?@9Bj9$|Y=T9@~
zyQkX{=dW;5dj)cn%b}5CQiLr!_L>N*VjYg8q?#c@YNTtI#iy;-XWN36$w2A2nPRtK
zKeF`s4IuUcpCt2oQeJxQ-Z7_7BLt^U+W&gRi2AaqKAr`wXF0%cMscqCCDy=|LLk8d
z7=$BLuQHsAgR4OUsN__Ll#iAA>K2Rc0jcQCCy_!0oz6<+Gl+GCT9H+do?aZJ$Beeh
zTMS7}u+cQ&VvZ!3gOB!uP^>bGxb^RE!VLt?21OQFijlq;;<i}8Fd%T7732*Fw31c_
z0W$bcgEQqWjm-pMly}dR!aa(R?0;P>^OzEQHq{%ytOoG_VZI5GCS3RqP^%0A1Mbdq
z4CS2+1CEf3UjR^G({7Q|reBWHFHhr;Bi{9UfEHjjy`yJ$!Faq~!oXYozYKso2JrSC
zmC7VR^xt3}4YFCbQ<g#`!zZMi`Gc8{sEeO+f_9YmFyhG>4AD<wtx~*;q(zyu;?=>e
zgG}htgk`Da?;soZw4(a=h6+DaotofcEPne8NqOUm+q-qk|JPIZ14~4;Tu4e8Rj)+Q
z&R+##E)t;u1;R~g@qm-<?~Tln=_n_d^PaUXO?Aq_h96nHuGane8Dbp0@g2GPj^92;
z#Kpig(svLq_fGG(Gi~2Z(+sM+h!@r<dbWdtHX8pq_{B-&5A^jRO!wgdr&YXnfn~<O
z{+SZ%d=4HQsG<9k@$E#uzvKhwBh>QAXnt*>kYh;GDh^$4)blboz*Wf*Q0_JeL=c3f
ziJ6~Y1%Yl76*J6$PxwE6+4IY_F{a@Ys&7xa#S4c2vvWH}`v;P$4T8Z%H-Zk#rM}8e
z`N!ziJAFq00KMGsX00TgOX>RQ&?1<nH3Zj*N9+RdutU%$kf1`CtJ7iN5I8#?saX~O
zfZFg*%AU5{)D2;yU~%=*I;oB@`1NQpd+UhKS``j>88SW%T4^HHO4wgY&i?_uX=ePj
zG>)x`7kRxt!@PjCR8Qakd#0!No}lUK1Cvu%4~YX_4CdDggeZbbuXY_&a^g@23}y{@
z`NG(?icfc+9=0^uWr1(+qTj#oyX#xSKJ4e!jj$9jnf>I)@T5fhi^Ozal5)1JR*lLH
zT^ahSSQS2`&-Aq`qVTLOSUbl^AkgYSLFkVAN2zm(`p;{BSb?RP)Foy<Q6=^5LBHnO
zInOI-*>B0`F8*VG3H|y0M>Im*-`|08BFK;{u|Ot9PQ7MtVyb4+2=}UBc#u+iCkE|!
z;KFy~wx9YfU)A|yRWoJtLaEbtruprLxZ{tny2(svL@Wgaz7AoDkP-tUFhfR@zQ_hw
z%~!BhZAt~XFD`FHR5^8BN^|#>9KXUCs(Dt+x}d$)A;ZF<C6ySnU|h{DSpG48<Ew1V
zc;nK~0rgZ|HoH>68hEZURVK6=^K>6P>fGYMBqj7@RV*4lPWG~xuBYjl;xg!BXo{}0
zT0c47(;2M2-*A2BuhMYWx6-gP{(R<c9)sB#FtL0neE75KTIcuu|KOc4pmU%+N_p3`
zOH)Aa(2u+;@h<!olf#8!zb9?nHCmGw1_TyP{m%HH-kITHm;1`#`}3g-YnrWxL>X1Y
zj)vpnujG1XF9eo*D3~wcWPL~MKDG*9XpRpzF8pGt$$;&{5f%DvZ7h>VLYRaP4LPAZ
zzZ?Vi@}vNeMcxh=3Dmm^r5VqF*Z5{%mDlFY8f>(Ga=3u4%D1lYg7G?+ZsTK#wC)S1
zs}{@JT)}bjb}Wu49K9Xrv?gG`Uh^h4)kp>XD&NSj=QV!Hr3it2i?*nNW^c=h=1tD3
zo}NoBCF>i07w9Z~CPiIsE#I?Y8oa1^SLae^nbP+&E-A<NRHd?(>wgp}ca)K)+jXLd
z!g{&NCP5+d2^oX(1+!(XO<6pv@bOj@kwQ<7CcEzAopP!G$p}u>;Tlyc*<Xp9OO59D
ze-S6DHNI!pY)_Su$n=wnZT#-Qi0B>-I)9+p(zgBhbFD`bGrdg5gtw?Op5BZRWVbn#
zqWrc-)@Ko<uhfZpq`KNNlg!h;vbGmirZg&Mh9hvaAGmiGd8xo5{2rs2S=(AlLTJII
z!3$&9PCE984GS*raCbPpSvyU$Pi%F-$^H)m;~IE|xoU-|HpAyd@QH!?gv%$cqsepz
zm{>mRzYD~J>vkVg{{o@Dz)PH*d}`w_M(_GAlIgR)b=$>p)_HKchdD&qp}lO2MD(U_
zbS-d$a_4S9D;8%tzZDe`J_iEArxMd<326p(4Dwlz96qu>%=!2tFI^`<jeB8?_(rv*
z$yBs_jn|fyk3m-uDQj_O!QF4P;iFWuLNwJeF)<YinB2Gd%i@8_J{8j1M-#-;Ws083
z@9%%@ulzY<$9zbb-KoqMe~>Vr$Y1_hbq|$J&7%fVq8GG^`w!-1<iP#FGSecXCirLd
zoW6qmWiKyN_Td#qJiKdkzzFxFG_I}SKAl|L4e$rq(QHqx2v&AvTpR$~lv|4}1wLrP
z<w4YWQ+sim%v2dd&!GS!HqB3}hXD!OtI|L>e+X%b7jr&7v@k_!q!}&ajOi)Zl8V=|
z6h(O^`e4)yR;F>Z7unOIv^+U(swNqfd#9#ZR}Cj5%9d>%AI|ar9yj?m^tkQik}2`d
zA2V$?m3F#};?`nh;;%uy?%K@xJeSv~EnNYG-c&Mla&B$OH)PwAJ!_L86!rD2hX5{0
zVk$(K)gx#n*c%+-Ou9oaFy^JtCTa-P3T9NjLT`j}@2IT@6||CnV4+;l{Ca(#Oyk*+
zJ*m)jOd@Qbz^iC7$1b)!s<~7VCgB!|yo7HW?acfBf%glfxuB}1-L_>rv{%Wvecf$s
z2?kdd-i;jX?f*(Y6hm%~61M%_CFWhD^B9|__yh3uXq$1#Lbv6Xu`G3^in%E-)`exk
zD!HT&l+o2J?w%K#Kjd#Liw+M94&5<Am*gsZCdhgljaYY+r)k^WuSQId&udos`xd`m
zcjFK6u4UyIT@92UzzW&h(LG@k=C#(jZV01$Lc{8;1vjOZm1NfWE@2hDbQ{{9=3w;(
zr>7=bQGwm9w}ix+-?y|1e8W_G!NEu4IZ>6_Bk3!cX~Z7SdB$P%>qyAj(nU7S^#mK)
zlJ!%!UR=R;ciB^@%k&9W$T+L|7O3Z+>Uk7IH_@scvbDKXpK{2`h;j7R7MuCU$;_l=
zySV4nH7lbX3USUhZ6ywe?}&-rT=;bu_q)2sArQ_2zTA5KhWHJF#!qO&n8X{}F8K?w
zOZ-NRzcYz8DLQ|r`wlHksIPbqHQheIR$_bLXAXM((=X?dWy0L{T9x+sIc?QY%XRDK
zg>;e{`)fuAWK$_L+SK@kzDSQqOno)1?*R$)t@-J<szFifak?@?k`roY!$pF)Pi`XU
z;=eE2pA3IC69Md-ZztzcM@_~1HQyF;|E$_Rjr>4V{SUd`&D}#{EizAPa!>l<^yQC7
zXmP{lr|n^r5B^!31L+E9Vyoo7J)>U!`2Vr@=HXDV?f<ZnB-uk{uOwNch_O_%w4lfy
zV+qN=?}m_ykgVA%A?pyvGWKmOgHqNpc4J@1HkR?bM%~Z%cYlxPxsUfap5uN0djCm>
z?mN?UUFUgz&hz}7pVN*xUYG~DwGcz69Nv2WOld4-YF}5DM}BMVvhTW<5o1ZoQvEH<
zmbi&acQ^A58Mg9TalYQkjE?(#6PYbL3auEF-re~+svQQ&Q$?orbn>l0_MjoR)%tn&
zmrqH(C7QK6rOG~b*_ced*R{ZGqK1<8kIXLyhrQhRg0kZ45AC#+L2N2*UQN7a#|^}%
zW2?M3`*YA8@%XOU3sB$vz^4{=j)M&yWnI$^>NVj6=`eytl+9qYx!YOcS<kU?X0gR-
zXah%gaZEAec-P`cyVw0&!Txg2(<1NA7U4c1!jv}daJ_tWjYjU^!L&DXmbwXMac*s_
z^U;<qoX$N7)K*k#<T76xFqbSAiJ%~KH<Kg_>|ecKGTzB0h}jd*7r{BP6)H+fzT&CC
zYIEjbpwj%U$t&kJuQhS+h%Z`q0fsxMe(aZU74<mI-dy(U>TZ3yh1NwKK%D)%mpgX!
zkJ~4Ar4s>6Kbud^jqRqP28<%@yTkM%iI??4OrJKkA3dlE;{99Z@$vF+{|G&;^UC*6
zkn}(7P$c=uN9fv-RS1;D-4ha$Ra+F?nD32})i&LWwh}k*(4Tj0>;*J;h*e)jd4fCR
z)4X(0L~cpQoaUwNN+{K}AWC<wTlFE*U8Jku+VqzV4EAvnR^z0;*)JOv<$ITQ;xrGk
z9?7a+q2Seq2;?Qu$(`jx78R*#jtpn2V5Mi5daiaQwr$_njwk9<ATwivo}@b|4pg`z
zeay5RO5g8LreGl-r7Myv?YLB!UY69mfkEGIPY0e0NO{~HzA}F#;6CM6+^=66ZaVMj
zi6B6AIOQS+rMBa<((m7&H~VmJaeYqX^HZuUFx>P2k>Amsp7Z6wz_;#dTk4<MhzHq%
zhSf?I`x5f@r+VXs%SQzP7<YNn$5X@R->#h-dpBg5+gSFNiQxpIyZA17Yv-^~(X?<>
zkM$a-iVA<sm1&w8A?CKYcDB$BIK*W5nm(rVSuBrg?$ebaa>}ROzY;ndjtG6QROw@a
z+`xFrnvD#FYD*dImS?_A6jK}#rMHD_Nz~y(bC<^=dJ}0~o@2AilfGveI<OMH?+jZS
zjCkjj!3ez5@gZ8pn&&~kDj<Otg^1>t$H_i+{<IMpwp-!1MsWY;i*W;Ekr^?2&_^tK
zbdP85)K{8}a{cZ8xh?+GnpIXB+iBbBMM7omNN{TFrN;o*ZPIT7{=NzF<7E<s12A=?
zb>8^?Vd|d#4XVSyi+LtVMyJa>7E*Ii&Mp&a&FCy5SCe`--z_nMeLrsj#8?dt&8csp
zJCK|OH`^OkIy!etqsm8iR|JYgRL6ULtrWeyceab{pMqXe#>ow+h-{x-_|B{vXU#&?
z5mL-`O&q07%*&RCh9^J!AfS^aIGy|x^06Iwyx#sAQ7wF+z%Vjmr2pQ+k{$0LGE*dX
z|G5@V^3H~A&%Nhx6CAbKyqrb(+SJsG0N>l4-Y~WBT;1~Ci%E&(6~u%a1lA(8L^VWI
zr-6R!^ycYy*H<p&EB-OR<o5P|c-pfTxSd%#^75{xWy`mzoQ^S2(6G`nS+?Mk<~FH*
znx)}nk*WzQd2S)OLIzWzS4R??vU{>y$}P9P>39;Q7LwI@hp(&_UK&tlvjGI0Q>DXC
zjBni=aGFAoyzx#<Mt+-`P)8+Xyrh{^0l`ixhv}Ut+>Bl3E8Ka}p!B&3FQN3hS=(?G
zs?zZ`t4orAHvIimNWMH3zSI1FYq{M0Lo{NPUi~HmgjmjY>I8Y{aZ;>`O$#tMHiuIH
z?4;6o@^9~;R`Yj6_x7^tKl>+2^phZQ;a0*cbpVr!+5DHDk0nd%GEZVAwIbaOMD)LP
zXTMC=(Hl%IsCLEBp4}jnX5?IIk<5h}#0nZ(#WwJ2pqwUJeV=&y^&?Xg8ckITs`tj7
z7cB5uuTjgs*Dirp<cz02t0q4*uA~jA-Q8#P-T$Ymxo6Sn&NOlvcCBYUkSTs~a%0rZ
z`{w|jr8O6dzf$2oKltdwb*rb^%+0-W8A~$@epvFTw#5nDR(V_Ynw-hFdd7VR3cPN<
z0_aNewrlHYHG?4CTX1DztF)O#rkqRe`^oh<y*{*GOP!&K(TLdh8)>&zaBGMSG8D+@
zG^Gxrs5?*TEh`2lZ|76tQ6<*Q1?|$>QLwVs;S5o*&~SI(YwxsPjoi;`$&v+dt%Rx<
zMP7gTbDx(RwE^A_UaQ3S)!0|DjOfEISm#Nq^|wpco~;oEX%x%7*3<LLKeK}l8lq>v
z`81sqcVooSkRSX{R3`oI>R%1u7kozA?ceDEbGuo7-2A-TLa2w{mxJjR>rz0%-9EGW
zZLdl<^lw4^wD#|uFSzQQO~ju+F(K7}7&pn3zy4UBW>`Ev`dEO$uP}xl{$Be$;4<bW
zxE~ZrS?8cr@JOpUm<3(dqpA-@JDIc2lUu>}lfgcj{O@+~u&L(v*uH%$z7y6ZJD+aF
z%!2i8Q^^czSZuPVySeLDq4(B}CwZ7zn+|jdV>DRuW|}>Yj4<PaTc>Y@c0wAeUMD~+
zd}1D?e2BX<oUZ8&#)%TFM8fhw^YrdcU0^@RkG0`g?s-X@s9bqOdkPkrd}ZbA+qt_D
zn(7V`js|zK*SYvj{Mw53Iu#fU)#vCD6;+%wIdE7c8ZCs2Us?_W)AFb<X4EOe2OePy
z*dk?(dwTZQ%F19X&(&i~^tHe6Kk4z@efdeJb<Jy`$6BIg`}I$>=nJmr+bi!Kqmq+3
zdTWW^uhxA}xf>Y}`!A)!t`Fz_g)_?Rcx>w=$@=m}E{=qyKHo`p))vW1(N>fzXs*DV
zvwq)9Gg+)D4P=l$A2#{_)vV#BNB-&NT=WEX__CSf!g(W>{f_v?b~T#q_vekkdb}4N
zdbNEo{?1~pb^c?GexCh2f2{HAA-?9H1NhpFd?k@e6D;gjy~?!pEvkd97e28r4{9!z
z_&Qc6ZazME$Gzt@+k4{afWxQ8<=yPdB&_inad>?Xtug7W$rrM+(uZ>L?rb%EbB7ME
z0-=$y$5HNl=o)-oTvQPZTI)s-Dibinw9da{jE;jpxgh@_#m;S7EnXzdw%BaYtdC7h
zzAH%pLmaY`4EC|OR?LV~$6qoTHe}vMS7+YMTc5j@xp?X?EdU<W&wshiioYNa7wDI~
zdS|9u4|{Y84W!uy!chBN_Rg@lw`@fhZ}3-Nwj&OpN^)kATw(p?0tRwKm!#S5T&oMS
zZcfTbB;mnRAed*o{YvDbq-D)af4Dp%MqC>bka7}#Brf#tr^zk+SB%?kY!^F4Lz4Yi
zs$m#6rw|bR^s=#iXyoGG)q{@M|Bi9XizO!Ze-N{S%HcHposC`3JIEt5YW}@n4D-fQ
zMt-60#rI`*Z$_7UhWcDzqV#^0%h5tHy%_`KCAjP$*L1!I5xT0`MPPPVi_PxREq;ws
zHLsTH#h3C3ySN`vKT8%YVETOVR`uz!zoK<Tv6JgNYL-#RQ&ywi$HXR$LzA-9Vo`~(
zw9A$37z=-R>w~2A#S-g`y9r|ENpHp#V?;;b%UK$bs+Z0_Tj)uE%x1f_GO_@^>b{W{
zkf09Q)?2!Zp2)e%T@xyZo*b|NZ)ClXTGC!9De^6hR|fc|JEfl#o9H8mxeuTJDKWY*
z9HpJ-RLjGdENWk4&dqyWOTX0S`CHdd{qT>y0a2n{4(0zVEguImCnQatupsqH!3N;3
z@N%SF{7X$mKjw8@lbxda-(t<^v){$Ky&o%Y$Jl=ZSrz}o=Pl|p9r+tY@Ettkl@Mva
zZzGqcE}5l?%y3>RMECd9UjIS-sAX%ESzMegHkzBllgN6_#19c8Bh!BGd~cT0+iSBU
zaAX4AmO60%bn^T9-`p3)sP<PMm-d<6xo;E^Eebt@d4{^C)gr&EFX)1gY?!U8I4+}7
z;ENI_JdG|H{!sZK-aS>bG@m0~@4XW4Ox-~l^pS6@YgKpNe1_(?OK8mNRgi_c89d@`
z&q3jG<tN(<nOwC85mx-kkYa}2<;LV7J8AYEz8_S0kdj2IE5odn%nq=n)))<Gj*;eK
zP>ZP6|6e21t5km&Kizyru_n)6#d*F5+9QJ9Q2n~W*Ky3~w|Rf>0FGbzor#U_2#r<#
z{v%NKCTS>oUip1|tU`MH^2BTH^pe(tDiz5?S1pzjKm?M~cC|{r=IJ%?=K423-wZuB
z9d}8ZUU@Eqy9h|$Q-i$QT<YCBpnqlFh=L9v-w`c0BhU5ZNVP8|0E&zLYeRu=^S_FA
zUw41KWw>QQ=v4ln6W#M&bt248kD$xcXMA#t<ua^lr6v<axf)y@_$rYC`2a4|?^N$S
z57)|6Q<X|{FZG|8yA5#Aj6f9~XUp|@;i_%+yFyxRXg=$D9|u=Yu;Hf6p6~vnOYLm*
z^Ql{MJNGshu>#Cjv?Bw011~N6ZU^i2WVlk#b{FPhI|vV4fH#<IP;b5qmY;}cgbLrd
z-xece7JE0|UH5;DDuEK{@5kzL<W-#cnRDaj`9Z)r^T32b8A;_q1FQCGs9??sC5J-l
zar3dNXMbNmdQ#x`$=4gvApW#n0}4nuiOSpm!mpV_=lt+}Vo1dH(BmsQ-A639VvC>0
zq|H?bB*g*iJx(_#fXr*$q*Dra%ua#Y@csZ(M1uoyzT&soIuY67eKL<-hh`(Y(2cD>
z&70b;XDGKuYdCpzy|349=o<W{Rec6uH9M^~2(97KtR~vMu@Z^V*B37Tm<lM|lg^C|
zIiGpq%J<?$zUFaC4PJ$%Tvcb;tL{G~1_r%$O<s<k#DlUUxXHTd(@SH)sg~%HW<+C{
zkgTj~=Ntx$o|kWp7q!=kD$Qxfw5~}TZ8aRNcyjtZCdU_JmK5?(nBC<i=(5XAMz%(Z
z%6sQ;^oESA4evZm*JnQK;wEC5bP)|Xjs827ar_I)RFM7lz26$B@T5dkA5<Z|%HkH5
z?>W@VtcsN~{^mmeRiE&8Co%q1;<uJ63i$qb4+m0fxTyqlL2mx{Ip1OxHsbl|*O_z9
zs6LxGobK#x_2Zhty_kEXDpJD6hZ&#V+01(-3a#s@26tx-awlDqck~uZtb0W9Mbmn(
zi)(Pa-N$vNi6(QWfFeW5Y+Q<wq1xi0UR$h?5ZHwr`&{cv!luf>v(K9#P?^_U=k$J_
z^awiFdpAzMxB8kM4EwSJ_)OExZ{+}cloIU5uYoOsfdeunE>^R{c}2g95Pi<Wh2jPl
z9Y)-25*Dq&+H0`8IUOm#FR5>l+B65FD35ziFj+gb_&odU#$u0FcBa-lbcewmrh<~T
zcd`_GXp|GjdBFCNV-?f~O9aI*3r33-DZg%=lgt*`&9xS{-dz6nboO468kfx(4>$EJ
zjq=Yx5F+ZTiCmd}Y?Y5vs+|c}n}b?&T7n@+G1Amg6bpH#Q}>+e{N;|=ZoWtsg?@he
zCh6CdE>dbzlS{kxS^U<e;D6QUAAj4#=DXq}iEaud*)hCT79aG&T*x0Dz{d9JYOeXJ
zNsoC*Whk0?JM;Y2I{Tl3?JI*nc}O<}5K|fhVWB;Z+X&~wiw@)9Dhj>Z-+rhANa3fW
z`}bM!H~POZtfFs8zx;3XqkK3r&3Kn&U{l9G?sOUy+{x%lV!N5w`kgd*Gx(=Cd+AU4
z_`_y}>(6w1xMq@^^n~BO4FHjmpjw080c4r>uOc<nGda{#?QwB+)5#3ooI?eudv6Yg
zyrvfOlaViUf(3QH>fY*<sY-l&D*OBX#x_6jl@`V@)o}M@%Q#SDQ_ZnZOPy(*x6Ym1
zn9YE#AO_Dw<oN<si=ou_7cR(g3Y1IjE~*}tyPmK!T1Sqn1aoy}<+MOtcRpZ<PU#r?
z_V*Wl?mMXiKQFE#`}hoizbnZt98rsU+pEB&JcmoQ#TV`mE-TO^OBctu+3NS_kjpIw
z5&WA)sh6(kECmrn4aq;8)4RJVs}A{5tXOg6s{qg}<k{Vt*0ulg^*m_Cx@_L6uT-e}
z`=%=T(mz=A3-!%P!IigehsV!BwB|8#>#t9_U}SNB<!@^zPOy9ahM`=9c@)F%IDO;F
zu|pb<XiX{#sm=T>uMLd7ig5V2RYy~^2)_qe&I#3eL{w^t#s-!4d6N3iQ-IOdc61j5
zyXN_(+GA+??PIk(iPSkqtJL_jvYZAK_mekFnDX*KA+_5%S&q;FgsyJ-6=k=GZ2MZ>
zEb;VC)W}LtR|Q?OPy1KhG+Q#W&Xky{-i)er>wYuy;WEr;Hx?8I#%(N9?Ey7s>V>nq
z``}`NR!(1g5SO1==opZ7Rm??f$^j^~Yp$;~S(7ZP3POps{Uz;kpDat+#_#*l!fOMp
z6TA=zroxR>ISheb%}Y)*q}+O|fsFb!7C70_QNsBxegm`Y#4X8Z93w~eW8zn*cFfw`
zk;RISwDRg*Icg(FRBQJ~zr{#7F29|Ur^|!9{OP&NolPM%5FQTMX9YQCvr?C?=ozVB
z*#7jU=G2l%`u)t8vJJXSxb|29KGxKcu7wLJL7u+O3R`xDXgBa!LO7CoZkP`WP79I0
ztA@Noq;nk7fByRA#^9fl-v!@PP_=KP2O0<#Fo9Qb1B@X+Ws?J8{6}=>kN3RM{oA9;
zck4t<{4VS|M4vb;^*tr^ZLbd5@R}|UCfG`3#cC^NKh8hhg?qHSgsFi74P(I_z0P|G
zxMq&h%@<z3IN0Y3%uvDu6}HHQBF+<EpJ_$I^{VvIyR97^G3XAM3ZO>xN~GsbE)_>M
z9_XSN)aBu}Kr<q-2%%4f8_?+VivOhT^(@Nk%c`d%$NF}ng#A0i-qn(9pN-<|6d3gU
z+nR#KrRREVlI9=U)=(UnK`-O;YYi;HvX?ObtMAJlnfm8d`}MBo<E1m0e0)U4uT`jz
zo9kZ)^w3+`66iG_H!r;RgYK_``|Y7dRj3YofJ7C;>*2o(<F$`29k#r>ng0x)aG#}E
zc(b<IuM%6zd$_Uv|3YCZ(SLsK=llyO#aj5$#`Zn0sWX3H!~D?aPqECWhA-()S%vEN
zD75;Qzt}mgmp?KWEo33I5^6vbXY>4DG7<mEA}`+g<4Ac}-vyo@H3Ji?a@8KE{{9>;
zXZ*fikqjuK8uj77HQ>(gy4<wJe@iz6YTbl;;(*pbIy;{~BMztk%kdnbj`_5@JM7Ow
z1+L$p_0)e$<pHvZ3Gi!Xznhq~C=xWgdr{%PrBVYGX`Dbu|L^->DLjPQtq=eIWBo5j
z*8X2P)~`Vq(SWaIl<^?JGz@Ujg}^L_s)hYXxGfljh>D5P`nXEsqXSLnhaYVRE<ZK~
zj8QSG?l0e&uOh%^_*;OU#$sk)L2{9;JckY;<<Wopei)-f4>}}ARDka3+rmrcK>OoL
zLX|HBp{XXN2uRiXA6Iq2WHT7()c$BojeG=>7}Au4g(PW?3=rg)pT|8ffF1Z{Y2|=)
zq9^;|?v<J52~<QJSaHMZ;_NvUqeG&H@vm$K4>*8H`NOTVp<sKA3JAc|MG%A{SwPzF
z0>)DT;pulO3gQ25!#Vw5BdQfQ{@RO4;+y{q(nab024<~3>C{pZHJ8v`@mCe3-Ir`S
z{rU?`0CV*F?Yq&JAJyByfSg0Sfqj+MS6^nAiTX?En$1CLk|s6l`bzNN5*X8r0e{-F
zpujYp<pRB|CZRO?_4h3M*k25%e|f+E$tV6F(dPgQObj}EJKPp%`FsPs-N-5*Kt}$2
z_q+7Q!hj~H-}YFf93Z=P114DH=7k?CKs%76&4~VVGEo%XGbix)tMO(`OArA7#kTrj
z>V~ysuu)xY7c5^(2fQb+THP5eE4!5YZ5PZ7iGaz{k7rK;xgh2-u%ywHfkdtmL<wZe
z0WbEZEoA@itdrlljmL%GZP(cjEfbNy(w+aihWncFHx=u1zUk43U6Nu0X+4yZ!^B(3
zHZazjTKgl2b0;lAE(*~76Pbfm<DsQ?$zV=#WI^B^75<Z@XIWFeKU@f`e~$yycy^<N
zW6pryTvZ8Pl*L8Rv#+BtIdNk9_iK<@{BMbY1VG0Id;Y|L1`laW{~7Z-*a2`?#IWMm
zV-|bx6raSDI|CLlfM(x-e6bY}<9Pb?smi^3_sSZAY=6GN0WH{^8NYLqc7inLuARV$
zXiNZEkEcLe;hXoC9f=kT7Tze&>5p#K1FJSf_HIWD8|njs;{~u>O>pJLdE4!|1IuNZ
zT0g1motnE#s#Q1r{pmj4ol!k~;;2RtWk;Y((Dz4zXKXGTdM$HbrsJ+sVW7WF^I0SC
z^?8}++^2a?GhBpyk380GPqehyDuReZAdn(tjqk`7Zh@Szl;G64<ztDc#$$HpbaWy-
z8ZX#v3{l{rd*iG*Y$Myvy*jNg2w<^y=}vEHwN^s8OG5jT=J2U0pn=BIR@9a$953nI
zfsO%F1638c>u{^-oOx>&{!Dx!iqjwg7E^0eVLZ&B<gRr@%lL5suf48Pplv~2brkA2
zuSQ?C|CNs?zaIU!U#Kq^XbvkZo=%}Y^}6CA#p5GdH<|zKm;T!nu|9MqLagXi-_3!Z
z7`TtQ!0P+dy~(-42w$6xaQDhIG3qM$-GMGd_d&PFzQ)E^W!dbCt*T|)cC@J-zG)rM
zj;n3W+`=JCWpiBzdtEtz_uMal+HO_%(@0Pp1nN?|IbA+D@zbT-(U~&oUUQnM`hYT+
zBSh_fN*<rS3HbQ~ITh>aB8vmf+Y|D{i8;M4uUH+wHvY`Vr2j8xt8!Y_s9aC<U_Dd5
z%JAlrmfE!p!T5vkA#zU%zDv%j_|G4>E>_NI!L#k$k(iRHjE>|b7d~sY4t43-FLPhh
z!k^C%c+MzrJ-;rwiBCP)n+sx6`&zxz1J^#l%O7YagI(&^a-Pt1^mV504oxFm6(CCO
zHH5^PEOgSDHFK8kR3JN@LS3}Irzqm}XyZd)W%In{Iqa0Mdlqq_i<m2hw`=V%oJ_$7
zd*ajHP0KEOx~U;$!qk+0vQ~~#3`g8CT79GQSlz4py^W^0Q7UmgGY3qVA`JzKwuyi!
zi||S~nU<V@$5FCpCcEildO4^yw-KdPc@^`9%Y(i1;fI%;fAs!vL789Q@QBWuu7Tv+
z%>Q)p;59tVs8#c%E7A0b&4TBFm-8QP{vib-@#y{Pkil4LT$l8GuG_nH`~6;fEoFAc
zI~(<^)ea8qXdQURixDUx23iQkgkQfFI(M*Xe}K^080@P?c%jWWe;TlJNPz2E)~j0f
zU8WArvn`V)u0}-kHl5_!8>Q5-_nkMuT)}VH;hC3zZPrrC6?owjN0Octr_L?+#t6ns
zLfc^DOsVm|Mz)FVHGA!IbO$SR7*RTpTJmi7YJ75UH3qw+?K?`&^=uv;P8e&jwR2`O
zuwXGsR2;ClTB=u&GKi)-kEUa4mMC%<>bcQNl<q4JH~grMWvyNbp5xpqQ${{ZTBC>V
zbjNAKb~0h-Skw{sS<s0hxDi69yPDIrgPnS1xwUtj%6vFVo<8L8#-N;tXY2h1I@Krj
zI7(_9ip)YB^-k|83_EYsXUm9{bl#HNDpxO7qdq)Y-L;qI0zE@IYyJ0Vt|R`lJ!aRI
z9feHE{!$y0$}dCwTTA@&&Hm1lf&|Xz7?F5)%JDcDAr8Eg9YE<`ss8R4lk+6q@RUt;
ziyccG6#t<wcX%zf^zjnwj}Frbw&9hR`S*7fy^3!1+gQ|X!uJQ^S~V-wH4hUMcX6S3
zT+Xx&u6?MqYSH$p&<AjQjuMG_{;)0N2v&F$Mrel`RV|o{q_r(^In*ABP1IYrk-%?k
z7>w-n+Opx9@geeiV?E6I4#9K4LglkjvP+JOrbNlAS=Ao<y=MDj+svhC(tR38viB1w
z)rpOMkA@~!S0i9UY$0&pMeCjtxUVf{9Z1(#8-D5N!@iAGVl6WCS#8o*CYF$`i5;A*
zC0+R3qCLzT=`buf?1n=7U}Y@>Hc3Buj*B?PwNUSa^Vj3HZ;tCgGqb!-gb$8PUXrw$
z_@KClqa-7Jl*J)2s0J!x)}E*s0Dcm&>_c!lHLjy?7|X>R?}M(XHD1At5ZyMCre#o_
zXBBXgFuY`rWcBJ>A$WxEf>{sPckpviX*$PfBfD2ZUSm5Um5_i~5`Yr!nTPY^V~8NS
zjwCiTFM~P3VT5ms0;lQq=hQCBhn`iL<eu3}bC#C`JadJUjz9hfr+Zn$II}WjkY6UW
zv9I~x`tLvA#Ha=Ejwmd~Q{cyrniriJ6wGjwEb1Tf>GA1Gkwt8Sl{r~<e)vQk(x$bN
z)YUM{$LhXwnpoi;I=>Zi<g1+@5q`ynWK}?HvvkA4q*Sk;=nmU*N1z2GC1i#ctGBA`
zH&V7LQ7pmis$&;8S6|Kb!2L?{V9VYk2H?GKecQ#!TU`C7*MERr_Unt4o!9HiPFerL
zr?qtSc@h1f&($G88OhN28n7@)hmynP;k;R!+R_WpB8MHIfbYjvFBn<Vz_Ijw&;sQn
zHS7}u)Gk9#T9`;-NN;tn6t-KMXH^E<$bsh3%C0}$O^2~mB~q;5LQdo_;RM$9UV$xW
z5~0PJcFSIU$n0J45fDg1VSru|7iP%u8ujeKD%U|_#gDgkza*|Zx2{V<A4?|cJv?}8
z@6$k>r?gFb4O#La{Zn%CUD5><WzTY;Ys8Et@C^*&eQ#52a8SMN9_YT-?u8?oo9QCH
zt-=MF!~1j9t$okT5G0qdsI%L#Y7)-mE)M-5DgRP5k<iDU@0w>_-ctc5dEeTPB%gfh
zxZWpIXsa1T*0rF2GXGN)Zf)LQlk1(EA3oFh&o23KfbGZHsO3*?jV}oOaoCO<Wz?P>
zrntVUCD$IHcv;Eg#2RwYxxA-lUQGu5MuMI_d3LS>m?j@AM)0-;5@^8WkY*L#t|Ikr
z?gKTG_-vLAoke?}2{r?aPcqg=F?lhNYtMMMX9F_48s0N<us`BWjk2<25tZMcRWHSX
zRYtlAia2Kp9j2li`y#|~k<Ux$h!aM@feuPD9ayP*>lb4eL7<%zPbGxqAxB?O4_@s@
zy4#x*waDhstnFN24-Q6g8^p2?w)WMZBjj#Cz3VFVzW7ZEKoeFrmB}n_d6gwl%vxN9
zKs#XIn^rJ-282L~GYc9C4FG6J(Ad4^q&iyNXPhY};l718i0~M{TO<8A6c5gNedS=1
zPhO7$$kijzzmW3JMI{owlV)FdK7IrYE`XgPw$h~ab!nEw?mf=LZsq;#e-Doi%}X%t
zPn;AMzcQ!z@8Qv*Q#Q^yt-B`s3jr0CFQ&)7f^~Th7kL4VNqZE}rmMT=DnLrP(ztjt
z8@52M{Tby&zfKs~^Hn)FLR=ilHUK`_)*0X9i68~Tp6mIJG}a&BwFkR32M{fx3hLwz
z))o2nPjn@&bY9;BvrB9C7klM^njA)?q?G0ZN73kz;5|tU$q&!f(fK)Oiqkl;qM<mk
zI4f42L>b_a1@4f`O-prUrR+`eVJhr_JLu^Gzyz^~)|rC4SIw6o2tR7ujW)%s<u?l>
z@{G3YSrM)axmCtQIB^c1JrNG+d?_ja<_1`x_F4XkC`}4j$6Ffu-QF968H7(XcwfN*
zzb=2AfF0R4WIMk%7R=VS_sR^=l@XUW$r<p$Ue*2fPF0&Fa4e^Sh200Kb9NQRa*yxW
zf=Aw>W!%aZI~1SztQ0<3NM-vg^Pfz_>EuH6)<a0}w9|#Ol>dxa0dBc{=oM!u@N}^4
z28>8EolyKiA8fyGj)bQst|4j(AZUCtG=>5Bx`E*DxcTWZi)t~y7M_rPQ#{26IE-(L
zpPjbm=hk<pVZ>>-I^XS>%|z^iMGt@t6qt1q&|423%UDB>?AvWL^2z-`h(i-$0J%Qj
z8riDe(gI?v2rS)!b4iY2Ud8^RJr|1s#ImlEpid-)hD}(z!EpCd2!vz{Ii$dZ==T{L
z^3fW`rtB|R>Zp6RX%2m!d!tinx&f3Wsw#e^3s1$cnb`n4iMFpUmM_L`<hz$ln9hxW
zuUa5P@7rkN;q<jX7p<$ky6X2yAs8&CUW-Ha3==H@IG>X!Eq^N{E)@?)B<2OZUmV@z
z10Sb-b$F|~bieS`L_Nlr1b}VDX)R=iI`&2<)Z8mH&70BKCC3Qw$2euSLRD5Y>hTXT
z(xp8jU0RYy;`1VKY5cyw;Qw@KVt-wlSlVZ!f4sDNe_a~bwNnGF0(kw~glMtxu%L=0
z_0JB8Vq+pmn3OhNuvUIF^s#57+d~<O+J9gNdPqH_YrqWpNbSFi@cGh*UvjVU-T=n%
zJ=S;UXDWjI*{EM#^0%vdKjrs-&H-1RW$V^qZB!(^Sp4&|VZL+n{A1kwQlXG#ozJ%U
zc6_RC0%5$SbpVTw+vylz0~>XUge0g3K%m$~Adun+V`B2MkL89xrA+PO_+sK}S(opU
zS-TSpT7Hs;E{nJWKNv(v4xW1(f>`#MhV+1lxq<k=bvN4KIYbg7MU68IH#y+(o`K4W
zLcdG8F0l~X$?TGa<K26{`-0QGe0aK1W%o<50LkmKZu}FHFUb7^8p{`EzDoX6)F@#l
zc_?1Lx;;L5LTj6kA;u7GTRm#qX6KT|rUjOEY~(1=$rf`=IMjh<+XsX>oMersfqnIP
z`<+C^ap2JK+2CDQA(lY8lnn;-f6aXiq<xO5pvJ+SVsbnj2bJo=3Gc{4*X*6%Cq6EO
zk0uIBmetW@i}=pozqLGw))Tca13_KVW;c;y`%i$6^P7#U%ut$u42{tmC0K10gvg==
z8qOGq9t6<&)P~b7D)@jOtho<Pv_hy8{0%H4i4@BgyZ=fA7X23FL3}zeOei!JpYQ?m
zmfE~YGt|Hzxl4WUlbUe+nK)c5CV!Et)KU(g(DO58^BTNAtTbW%|Et$*_?Z=*sJPZw
zy;+h2Qh025y57ZuHl6Bk(m+J2s?e47S_m~xwP6}$3_b5t)-S>%tmEOHu=O;qJQ5};
zZ;C;VVg)NDsgwHp!2>&(QI^jRzcGH|{&aU-waW(VU<=j*#0Q`cmWQ0XN<94*t)cjx
zbEzP{$9d}~Dw$E^WR)){b-o}d%kTUEcm*r6jd}vqe13xh19PWs0KnO;wIAa;;UGWr
zuJSZZDrZNrY-GNm+iyRDQ>IPb`IVVXPJ82HpCK!H>*9~2BnR-A<N(l-Y*q;102my9
zW&M)_F#XE`n3AW3|DyxALvjG5BZDoNapi<d;m$x_fn}pE8v|W_h`}mvcl(D}ijJ`t
z1QJ?t`-If<v1h5|a%$n}jc|0DhKvmO*<yW|iQnR?Y`WltlhV+Su$~+vEuhTiSS68o
zxkc|#%|r)Crg-d5?Ssl`lb>TvbeDL_YFL|(>xj*95G=T~;T}x_xxOIN&-4P0)piSe
zP)3c@gnoA4J++9W#&NAhhCH_SY&Y;yHIzlmY?CrDBes)6h|<a_p&TG?_&U3FrW5{&
z0&h383*2i=YmSS!nHLH&Tqp+Jlf;1iP!CBdu>C>IQKklTkApLKB3yFuTnRH7B-D5_
zoP-)D8!?X)eR(5PXVd)tDMOEa^e0h>JIlQB`5$ur0xeS3IL8R0dXtEs<3>M9t~WeQ
zuYdnnrd)|+21(qg^p)HbQTu8^`)cs31aW^ERwKRsT_Fc-ZRzsM@&<zOvM{?kkRNT%
z-J<h~6sj0!hU@Nw_?Wpdff#74Ms5!ZsvU&ZY==IJKg<TLp}YD9metiHF$ZM~4RZxl
zT#}H$#Y&QrBH^63Zame5x>^8TMY@_MKrTK9;_5pg?|P<`hoDN*g`c}0Mhf6PhRa?$
z81rXW_e!fbgxaZU4z?o>p0UQ71zJ3TyOrdW9GtJaZ?qOQ_b9^abkF;%z>l}AI;ZYF
zaRs%6%FDRKkv-fTDV4KLMFMErLn*g%WOpJQGlY}K<6@eg)2Z>YPE7t+csJMtQKXSb
z-)Q~u<>A97KPl+hAVzN*GY)P<tFfE=pE9!d%>DcTo}cV$CI7_nPgjQsCKXpI?uf*b
zN(VaoOUuN3j$i$KC;;&6F%*lqcDxOE>jp#PEHQeO3&Qc4i)V-c+h&E!thKnUZj*Cu
z-$dTT3RcjSlFs8RDfJkjAeb0tB_oZAsRx8q0X(xSBCdKpy(e|AHTCh*QG3l&FczFs
zM?&r0#V2bl>{y0L$wGJ@40y`NvI{13MY|R}`(RJ<)SOcs@(HHTCtz4`QW7%+FG~y_
zwy2X#B*c*kyJp=tK|EvWNo?A%Kz6$3YwnY<-$s%AZc(qq!BzPrkI4&MdR1#NaGQ1_
zz_FNcsDY>>s>gYT8sA*fzIt4;EMRKh>EfPy&8{KR8&oZV&m&t#e9jI}+9OC2BWBe^
zLY&3o0osD7b*$*}FcwXBZo9DYu<S@G{u$)$9^S#JD+QA@?Z%PJS2km0v?K2+{D*4i
z;eU*N_{UZ(PX)Va{X_QMfBavz0wl_^?Eow<RoHo@Ec3a7RLM#ZX@CJ(kx$&~I;b=>
zevk%2rUKW__qjZK-<-VacEcr5)?5ZvvY`F?O8z0(!F~=9pzepeB{q$X;rxzZe{s0}
zdeoztvKBp8(N~o}wF)pEc1M0Jh$)*?5sV@1><kIH*Hylr@LR<8TihzqGq$Z}w688B
zneGq2PsCrE>UqT3RAN>INbbx(Xf5@jVN26~`8yzV+vBggj+uJl(}Mddao022>{1D6
z%WP03bBo`k#@FoR)aWNr%vp?iZ7c2|OrA~y3A#;|mP9V4y*jSFTdqLBs9$lyV#EfA
zVtC0%-PWO-0LLUY;YsO;HEMMEfVhk~u|!8USpOOVN+&h=<mJbt0*OKRr6FqQc75C4
z!?A(}+8ng$ZiL@@n%g5-*$US1w7uWDF-`&l)L@LtLuW@e5v2p35B8l?@JVfg(cn>;
zylTbnc}zrWsulX!dHqc6e*EY#-%=+PO=M64Y?Fmfx-|a;g&e4~Mq307O$;pam)j8=
zE0?AIGaTBKqKNf?y1h06kisspsgG2GrsPBYQ06i;borqeL(nK6sHebNm;g(J?bZ?P
znmCp{P;*;;%UjuI5wg8P`Je!#qea50%P~!-@J%ZR0HeIoVvYeNORyOcp97Mne6I<%
zksIeGO8w?bvq=D}3ZB6B)(&J%Ui&qq;__iJ@mmCJZ=#1|$swe-x>eOqBLO}al1R8x
zL6G)p-2~yjLJW$Eu$AAgqr2kQvXZ6ln_U449ZNzg5gU3t0`uSsXySloQlXeU+SmjZ
z#$^tA3X%(SqH?RR)gJ@OW{0510f2I|zCT8yk@60rwnR|UF6x;gRli2#)*G6(n&a#a
z&Eq2(?1sVkONvy3fXPDU!s{9T6x4au0~U#Lsv~iRYq&2Kx&JZn)M{TTXx#lKL;`P@
z4%S2tzV$4Timt98BzQ}IfWx?ek~}CkSxAI_FvFyAZhYOmKLE}el1=)6RTfY}n@%>6
zg4#js#hZl}LPy=$65t{7xT_JfLMJ4lUXr2xT!a?oL6K^JS-VQH;MM@riO42-%^s`F
zWL$;nQVlq;d{89V^{@p3!IN|4UA}gQ*@1xMOTAi~8z11Gpi541^F47aAkufRPIko2
zqa@PcKe!REus*?9!Sk?Ma!%u#^9LYkBD_{Zp*DseM3xdoVo`{H;YtH$;UGz<PYvjM
zV2KX{h)UE&{)vQJo+mqe#N;23LXSFNUWO7>hcZDGr6+NC{ZeTHR#HAi)TiUc2CpPA
z_5^h^Gn?w-g9S@@q!%c8aip90m91F9HZ3;=Rx$#1Cjvi-OeAte49%*!XQSy@(JaD2
zhoz1Lv+Ga3azQe3$@e1;uk7>hi!>LY;EiaYm9I}LOx0zD@b+JI`H+V|rqaLr>8*7=
zsKD$QljCc6ZInY$eK?Qp8&O=#4|2oLXQ-l`SgoqP9z~>{j$f6Wz_N{8<zO*UA00fa
z9kNT67s^3^V3v=Z^|BaTyc4%60iBKD=Iq_T`JspC^olFbyJ;E;&%}>TZ0x?)C^4FN
zMkpcBO(kE3Q_Qc|s~KOFx15yxY#CW2S$*E!5F6%hEZ#6k=w@z7NeHnC!}wr4nhZj4
z+oBWLl;*0LJ8w;gJ}qB%345!65_VMHx?YG<KUvu@ROtO8itohg_Y9w-o7=DHhC*)C
z`PSUOdy{9BLwLNyEt4Ht=T{JO@93wO&3yu_&+R1R&(m#QnPCjLdDNEk$iW@wL_W{&
zwB8ru-_r$L2%1r2T44NQ&%SyZzNkj8VNba0?ah7BX89ER&X#R{-yKwjmZfvbvYEoE
z+j3q^hKwzR^LKpZhZ*W`#+a$ejrqQagVMs5@AUA`67()}9iV?;-5(iEhw^UJ*QDuS
zS~~VA-7t}@KeQkE6U!wQYYXJ32=Uk1$2&QKeU=4^U0(Bq1pe52;gf{J;P<5OI9!Y<
zV3SB=9E|R&f491FN#ppDp*kw$vDw66-f;14%O;z1$&S5ri^FcPREhQKuqW?$gNw13
zZ~Jri)3{ALO4YQMA>Hg##?2H@%^-B>G&`GJnl|YvPn)XW^0^W3q)>EG{+#Uz%<Acb
z*bsV)q_ZR6Gb%&g-}wBn(%C(=aU*7zZg6X{!dxe{nBk*sIGM&M72}{QWXUp@&8mBq
zS7h5&A|W?GICZ5udOO;HO*X^W{<dgQNMU@cdl21jvJcn7R0pARsH=CYP;O`A0gnqd
z3G10}$=r2+HWz91x=QNjwQ)qF;g{X!P_Ml&{&>SzX+OQmZM^p`Hh<5BUi1N%$jC0-
zn&!;lr<ru@MexLPTNm@aLbfDEw?eri2X$26i!X4EPrGCaHAGaMxJ_o+&;P|Xh#vdw
zh2e|!4h0#>ysHM$9Nye2Ra0z*wiG{R;w_zhmo7|ucOGzPFe%cKU1D@Q`CeIq@SwrZ
z$dFTEi*nL@Ub9l_R-Jq?{|I+4!EtzLi4s#8EMHu)OP#N<;j63+m%4S;b@1fLdh$!f
zR+QmAKkd%EOJ(W58{O=N2$~&zD&Y9^oHG7=>X9ecIkuTjLxPK4w>6{ZSUOX_H=_if
z#FH(J29Z8pJtK;mx@_{$8>aHEw7o^gVLEiWI$mraLQl|HoqBZKVzq$aRH1jrj%72|
zp`NPe2qpW&WYBm;zzJ!sqzrs66uS4>@LK2R9SG=9^^gkDUtvXO_JEVDFg$JN^Py=*
znbY%W@uK$Wb9NSw%Juqvfj7bW@e;-2%F#++7qG}aBK;UC(h}ibJvoC-BVe;r%IU7K
z;Ijhac1k}}cgs_Y<dt4YiOYZ4UW==FlF&2@Ql_$fjolJ}F?D|m2|$1rm>_D|ZwuMO
z6T+@xxK+_tVrGgPy(EE$)5MqWfmTkQn3<j5V^dsadEF0HQYa6IKe{(&gFFZjX~qg&
zh>#6Qgq=i=(iV6#PEv_-@pgVEFXCTD@W>T^^z%ek*97xLtd`iO-6dz?rfa{nm#fyD
z=B9hW#q#4kE%VKxml9K<#&5{1=(txU+akEh<3Fp%U95>Fm!>sQ@{isPTe>!ICW96h
zPHA-0xb%d;dYuuyWIpr?nJ3MsNh{=i--UI0H-m?<HacmucLVEIX_!vf>OKrN^iSJs
z>^rqJ@j&UsmvB0dlAX8829-@G_E+1rUI$8;+-+DlOJm2>F>Zm)WUBoB!{jYK>ks#6
zu9Z$@IfVAzI)(zTF^{|Ba=jXlZ9+tUsPPqtGor=fCnn2KLh)k=>u;-MhF|-KlU5|4
z?4#`9p(I~ClZ+Qt3|!%q<|re2@Hu5x3w5P^d#C-q&eMDN-O=U{nU|5(7>3pmCOSmO
z?V&ktDvZ;@@zQG|$1gMO?lnwLTRh>-@){nG7i2{+R7jH1M|zAkj@N!<H;9xEa^|g5
z<4IVnCiiBHQm2yM8%qw&s%+tFd}_3^^cL0B69prCDq(xHXe2HePYGetGd7vdoME0@
z7~EgI=p3F&->~BZk?||EHWH&=AfRE;<^uPYRlZegO2?q#Q$q#2a^god0%iTPtO7#w
z8jlSAFe#FmC9_)Ke-&{owoJ8bKv(OzkCf00>?)7T15*JTwm$g9o0BeD-M$p%UOY;K
z!;{C;EE*NBy?Ep|9#t?kEbbLXufoYSKD?O1V7q$B&d23k{j(KD%1;wt6>16^t41{Q
zZc)@bp0EkGq-)aqjxKuL<Y8ieO!E#m{bz-z_qKu{D10N9KZx;@gYuzQXNkR`)FO!T
ze9J<YIw2Y{cs}oAp!mWqmn-13S<ivfMiE%JT}~_}yFaa->|e*ms=T1VO*WVuwX-rh
z0$XmRyG6OU!;qlcfc03KCWgfNB0G^e(8kWQ{+qQ9jMicw)`%^>aFd<)vlr20T>*5L
z)~MhMlgd(VRG0AgR-kLX3BvKIj=iE#K^UpNDhqlRsn2RYa5<A!IcQ5(j?vg^&E*gZ
ztMw0)e-dG1;SR-i!$5VBG4a&`=BHM(K-mG#Pl8fsjP)4R%q4qdV7_BfqsjIY6WQ^P
zZV^2^)MRDYWt$qx^_lXs5TA$Rbj?@~YI#rp0{N%+WmHxuag%{6n-A!Mr;bRxy(~?Q
zY;1bFa=DOKKF2amXPZniRL99;YvWA>dAcLV;;EvaZ!6QkG+Mm*%;pAJI$c|8-&e%p
zw~|+AZP;ff@`l}xJpKdi%1pX?)5#k*F|-%P6gK!v<DG7zcp4ct`e`$UehU6bzQoor
zxh>H+xEg%<L=K43M~2G$vdAW{2SueW3U6pDFC4#{y3~)M<+<S>RudA{c+=USI$bK`
zm0~jncRfnI|Lxvol+iJ2LIjmu6NhI&(OMgi=moMR#{l3(-<rNo`)Yinc2@?8>>Bsu
zsf3-dS*~S%A+>pa3p%Oy($H^`;p58k5@vqab;*DqW#>qZr|OCx!&A7OOpubPF%~E9
zEkdenaN_Ug2AHHc`_ZJ?Hgb;2Myq>NC;yc7s<^D`L>myMt2y+ZHJ%~ET8!7Y4^mz_
z$wl@)z(RX%*gj$}G_2eSed_EoCoQ*IVAgcViWn1J!9cga-P#p;^B3e-3NyLo*iUs$
z`<5DPROecB8>zE(_FrYMg14l!mWx*-MMkAxrCepNyqWHCwJt%bKjD?yrre$JMi0jt
z@z-3Hm(Kf)?>y4SBlapQ%{BV1&QF-PD=)YWi&vjMh1n2XnA=5#m{7>?+0suOqtC9w
zu0MS~Il!G`)5pJ~r=~%BCW8lkBGM`Khwp@{>BJziv!exOca(qsw*Gt5m}9Sw3C_yB
z9yyoXlJmN0+xcwW=EK2mp_kU*Il~w(oTfdUoIV7upzERgkl-7sJ?ax<wBf*~37HfW
z(W9<41GmO^tWij~;C^KFBSFWfgr7WfswW$E#1ePOy=X8U`)4Wh@8r+k?J8tCXxxQw
zHk&9N2&V?@-fs=reHiJZpSV5wx{4-p%TxwxyxX4?7gQs}I-D<zMW3XLXSPv`kDR&m
znS<z7aeeAqX~uWF&Ga(|?5G#B3;BhSGt!L~ZtgOwL&0R&LQNISsYV)A@YUdHV`qKz
z#CMZt5yx~7t&NKTqU8%1cG{%yWXputA~euKYzhdZWKBmN5PIzA!A`-MIVf=odK~jS
z_^&LdK;&{QSLbFj1s+F@?`)<SI(=G_7n}4oXEA*3{qZq!&0Rm^1tpIF!O;+bg)`k2
zkHRRN)@V~l3WZKGl<t166ia4E#r0qP@;0RKr5e%bg^5)7Wt1EJ)@c(|q=fbPiMuKN
zR~I-~=~XAy-)Fs2TSxr{-LHI_BX1TnL8iiS2CrrPG(>mzrYGekOF88o%RcVPRXx6W
z6f(oX3Se!Vm%(uVKKFb~^cOR|7#9bZg4gd^ruwM_sp1^cw0KVjO#oj!Ol^8rv@5o(
z(2m!|qVz4pnM7T+?^0N*i86taU^3bN>*O$Z3F+)1v<iu};-Y*qCbvX}Y$#Joo8CV1
z>aMLK#!tksG34v?3)PEVIT17eQK2+LS&pKN_9y!C#b4Lxmf;1m(Fm7N6N|}?YoQFL
z!~S<zNVZFdy;)&@%z0bk*aLcgcjbu9f>V|58?K7R;*Vy6Rg2<nBQDMw<3E|qf6O|u
zSiu3Cu~0J2j6~N{e2fmXOd=?-xgcxQC#ptL+S_);(%_kvW*SMM!Pwk~0tX?pBcB)g
zXL)68KJ?p?UlDT%cyg~^m_FPJQ+|%8c0=OLc+=vrl%ajsTX_jvApz-|4BjWl)5tVU
zP7Vq7UE@B@Vad=Ny(K);Uf8mEI<2m3;$ks>glQX3_)F1oQE>WY4Mt4f0Ft%~O|T6{
z19`JX07{j<>OAZE{O+U*H)Yj?!cio4?3VMw^&eB@bo87l$#XXwcp6QPWYmwnbm)I0
z&U}KRiSy<%QROz>HGG?;nBaVh!sVoAYC%$1$9Zu6$qL*T22XEIQe0}F_gCuYRT-gD
zIa6U8$L%W=>w;!%!OLOJr1Q}%xZXXl=at4`p{f7th>K&}zVgZP6(`w@WyDR!=aDiu
zOiaBmHwN0JR6RGM=eg{5X|PghZA|ni6*DPicraZ4qRUZdI)w7uxx$3Yw$4^uoGYJf
z=^_z<3-K*Bjnswt(^Y508Ii{l#oyg{ddK?7q0v~%@Qrfq|KQRh6~Aq|NO7sBfpfFq
zYaFTjMQUAVlUR7Y@}Mf4ld=-TcL($Q)4wbSPO==tF4uPR`lX15$xywljv7O1`w<_=
zlx3mxiR-kUqwRIE<Xh#obvU<=iGg~84tLBJ*uO-)hp9<sN^xp8aLV(qa9%F-rU^dZ
zcuO}#Vv0$WFPAHvQ=zVYr`F>0PmV;3fDTq_o5J-%>N9t4cCmbVu;tb8=$R%hfaAh%
z1;4i3f_$7r1zvQc72_GCe5Pb^#@S<)dnnbR!EayO@)l&xW^K8-ln@p8YZvM@vk*IC
zObnZ)Pc85p%2!Smv5j;cYBp#u67r8YtsC-5m2hI*-okw-H=rs_`J~$>!9L^pi5F}O
zM<yK#FZ<evpM`bVwK<kMJ|$j1!x`Ssd6FOVgmI<0hJWP7^kaW+F0~?sGZXTnK1oxW
zKc@Sb*GfHkKZhf!yI{#h`jj#cjh>Y<Deoxr$q<i8-Lz>CP5GJ6L3MEd7H^+&{`=!>
zrj9lQ$lj<_5N*xU&Q(TB&}Uo?On&RU{eI+`Tv*TdcTBx>7+0gG?c36bNphhjNog;}
z5u5-qZ|JRRnXUgR%7(Yex1Xg6Zz5`q_1}lYrP8~G1j@X0=&3wPTv7Y1;9%j7`q_w;
zI(EkY&I}E5SviHNVA-~~k!EY6$gTGUL29|3{^eew<QsJ9aU|Zuc`(+glZyvYseO_C
z`=YS;?c?W++eJz=$LUerejLa~4s2f|xV{r8W+dNb&lmJ`wrzaI5vkj?zONj&JYMy=
zZN;eiLdK|qxE&LB6A_6Ezm_#e2e4c{45Lh@O!88J4PmIos9oFk_&cKkvJ{lc*%O9n
zI-|tfYc_lC6YXWRX3Mo_xr4Rn|Iz~JNWH2Y;e<?49K)LoHABS3pNk7+6(d%PDpYtj
zq;!XY%Qg|A;V+nmm>4TlAp0VZQ$67hjVhoHnr~*cym0JALzCyyyoKHkq+`|9Q%7I+
ziP+EupTe4!UCoyYHw#K~G^y6t(Fm9A?r4_`X`Ynez0)GVkUPX7>!ANk{L$c2_Xvbb
z$;SJ0G_3^JcyPb;mrshrY*#N7YPJNlZ=8m_nbdrt$VU|IDo$<-^^pmZ6h8wAE+U9)
zj~(MEo!>jtvE)~v9lZM*R~F-GzQpyZeV_6Nzx|@$EuE5XqkC@obUe3(9!IQcy_>!J
zaN&4sSE5~aulD_;oem{ww~V;+b?W@(D?{js4gw2y*lu@*AhON^QaF52Zc=$0?Eo3N
z$j4np6()Ox%CcgP6~}j??6vSA!xnUKQ}X5y>yo47T)KxPXh0asCebi^GUYb1=0KOt
z%@r(M!MNe(*8stn@314hm<jo--BDZpm5jP$D~1B^O)CkFpN<tI_tY4FbQD6#8}9os
z7UH!#`U=Y}<1yN7M4RwV!E@~i8|;>?cPowPL1X-eh5f7aW}FBwKayso7`4Q+=f(Ur
zC3t_BIy#7ste@smW<Zepl%Bt8VW_{I2I{Lb`@`4Cf$L{Ehc9wf1e6&tVOC>4#)eFG
zP`{#|KYq<c*G@Db$t0dRh3rdUa$q+~g6Zh+?29!rs=`a*89X$VtYT>#LB5wgp0QrM
z!TTg&cQu3lBd=TF;wq1uhfJizRGBUlc||K;HJX+7Yh&lF9qwa@z_L##ATNs_ojQGD
zqsguy8I~_3oXdaP*@qH4*w7yhuSkE@cuDD|gT)ph>o%D>sq}C>V<@au!B;6h|E}6i
zef5(!r_WI-^Shn2Vxvi&QwgDWEIS(B{r>pye#0}$kZYb&iq^}UGg0bC%O5)W8YVi6
zaZ+7>d!y#kBN7N}^+?ROd3~Q70zDHyNSg{PM9MIBb&c1{jP!+5EJ!@nq<y)_PggJ{
zGW8(->eCmBky{MB{U`W>q()ED6K8^wZ;wavxgC#U6=#G5Pd3$4F3_G8Xoa*H%$a+{
z?vZmdNCs4HCGJ&+Ir86PxV%v<$j;SlFa7z6gUnUBEVl(OZN6}K$exBho`n)Yj+%O<
zDubg#Fx3dHxs8r=G=H!h+<YQv9(GJkjdE<Xt>kn%qx^;Ss-pY9M8Nr_yx4XqXngzA
zwgl_u!}~co=63unyD20up_<3ef1`Qh0@+ZZcwvwFV2D$Y1W#|{k87vwd7cjr*cJyC
zpJZyVdlG%~ZW&|EfGy8W%7x=qtJkIPdU`xDo-kECHRCl6c}WqrR(~X>Uz47THnz;M
zV%F~7k>f68QYn<#X(9GkhQ?ia8{==%zLvsXSYq!=Ksujz8Wca_r{U*()MAoJf`@$y
zL|bSmF9#phq$1n(j|vJ4HfXC?cw2wj3XRALwGVjB<=Z7RYtQ(P?G4U*Ylbg=a&beB
zSqIN5U8XeYK5c@y3~}@SGR(NXI5iwsawPHQ!&B|bHtNrKlFYU)ow-m)r_vTl1=*9!
z!Y_9PsSq9z&4>+K!cuOJ{9<du(m5oW(-3h!&<tQR9zYBUbdPc@WhTz*Ri$ngXKIm{
z-`RliZCTQ%^e<CW)ApB7S`?thHHcU!+R0-mW3-xSjvi~U6W#cz!nzb!*w^TvzomPG
zjuToS+ju0nUrHtQj(>Dw*i!c~x?<X^xgtdb3b`tMq(J1f6rNJ|HJjW+-76Y(<dklZ
zKn4rxwVSL8oW&mg^}@F=-H<k${y3SiLk^L#SPksE6E=ICD>RBv<h0;OQe^{qbxDJx
zMZU&x>AY2pE*ZDs=zV(^4g~Upmq^(1FL5}3y`3n3$a-N%W0h4Yv%yVCsr#Sz9B%Tu
z(RTAG3^Tfy8Il9jHI|^^X>*}1bk`3wJ`elwpotx85zI$+tkC)4PQS(N+PPP<{z3h2
zul#Ammck?vAyGk?w@HyS-pnqqZ*m7n(1qxlxF?qW^d(?}se~5nWJY4hJE?TknPg6V
z=~eT|D&_c6<z5@IA6J5$hb^)~*bIm(owbuO(R;DC)<(l#U_XPLusw12`j47w5qKdd
z9Uq*T&{vrNQQ%9-Pnmx0rP~rXZ#R_TE`9{^f7pA=s3_a_@0YFth90^RkQzd|K|)ed
z5NVK7T9~0br9<gb1VtnS0j0ZJr8}jWkr=7x8olq|{rkt>``LRvYrok0dBK`juvq6c
z=XoB-_w)T8SM^XT`wDnEZKO5X%KnRcNM&ufmRFcgZyqAv`uW3fvY}<PoM(okg{6+5
zTZQ%n7}iT+cK6~RYh7VN-J0I^`L)O)ghc3lrbb00Yo>YdLVN<3#KM_6UP4yqY0By-
zN26-H_-T0YfsPobfO)np&9B6`O_2GA$jE+q$B&&Cbl1Pag=9=I_;Gh@l_sETknfw*
zuMhkl7k#eKut>%OUcn&_X%tTDeRpbmh{b(`v=gHgU{OC#y+AIe_hmey;|kQ4h-}Q`
z`S5LBhy3F6x$&<6<IVhNdFf+q5WS@Yt=2P#M@#6fb;Dlk_wo0iw=cD_x0`>axJo_d
zcZSJC47Z-)PD2Gp1y0a9@Q4W7@S?gG`O-N<(KToSP=lUe%*Z;(r1Xr6xqT68k!h8=
z3B{r0_n2G8)2?TzcqFxy<2L4>x%K$@JYEWu-;x&gPVn<+=K#s$+pzhHhM<qRw)Ac-
z(6~8cH^AU);fQ2s!A~{1hnOZlK~UzM$mcdzG3~C`MO^HN+Q=Ekg~b{l3=}myFxtp;
z9O=H~hi#^(Y{eDdb1PeLl&+Bx*^MlRn~Bw)(f`=^297W<Vq}->02)^=@@$q`%hFl>
z1>I9r1H+9<tJB<Io@C0T+6X|C6)}Ta@C25j(C*eIz^z=d0C+bH?el!>X4ih(@X)q~
zZ#pg>soQ|H)x;~-WbW0638udhqosw>U)%Lk$gXc|TITWo8KaDU>&b4h*{tcWY~NkX
z8j{*Gg(iF~bfN1@5)MU#YY3*<jI`cAqjQOBph%*b!rqd5c!y=Sj4tpohWqCmq@xM)
z7$)YP!9Y<vUc$P}SckiB31wpY>V4R46kW6{zV$r3Fgr}3<tu4|18@cYbVrQ**bwXK
zcrvxhjhl1LFSKi}Qb^!V_8ll_aRvz+EbBLLHprL&N&+4q5{D?)GBzmn>^x}zj&WoG
z*KK@S>rK`GB0SC>=MWiMo?<G+QOvK9?s-Q`hrr@BfpP}gs0GwFXCt!CJ@GWXhvrMo
z4Wy&I+^o(J#r9<)K+NQFb&7qLU==lb!YE*)i0?WT#zVc}<ycwhZ5pD`_^e9qT2UxP
zPe>uhwZp%CwSGwGMf%z*>Fmp5d~yv-Z~^?9cCGC&j;&BU6ua>m?k0G}ZKuJ84I|2E
zvHYnrIP+u)C*{iUq19Iz#cnE=a_&V6P9#se1&+e%Aj?cq-TArL!Z}H^5YpvrEdPk0
z>RnytKv0IFRds8ESc$`}-60BIx5x=nxI-N(nVVqeFL;zV8sMNuFyW<%%b66mV8v_h
z1b-*7?j+V@PHFI?wPQ6M=<!TB6|oGKx6~we<JrTrSQpNSlGEmO2dN2FB=D;}JILd!
zN(#<+eyH{S=2N>UU5zQL&iz|ON>~t$BF<f`<u8~W(*z-3k6NuTRy=eV3lE0$24YE*
z(6^?BWz1|i!-t!9g9)XAmoF3G@=20aF5&jFRYq;JY|+7l>_GE~ePiy0k#j~X<Eb%f
zm{7mmu%ajJa1Ga2w?y(MBmYxH{0j6^FMIXLjP*#b_%pC>=D)P#%r_654L)U!5GQwJ
zqbx_SwwPDLvW&FFyE&>as;o(h<&e?7AG#)U)<U6Vt#mN)aWZ^)*g<lAz-|l6`=Ezo
z-zNRe2rm<-_R#AN1sX}R@33ukJq(`39zg{Jy}HO=p#I8PM9bhI*J3*0u-=$ZKAXtD
zs*zre6D<W^Zc{0}63sz_D0TVU^c9j@0-(v+{h%cVgO{?A%}~9d&DtS9R^fG%D);;W
zU@H^Xg+hG`Nnpf|2I0c$vO;lIocjG{MX2rDfHblst8kc;92Hv`b$5^Wy-IUN7q-9s
zxg4v?h;~En*7!m~-A{Eg@XoJ&(Bs3mK}QDxM~aM@__t^)Vq{r23f8}ED5Sw(<xpZt
zTX939AmHBjTQqA2@vi60iroe?$#$2w2}GNR)No<h3b;8M8?#5oT_Bw6O0Gu~tE2(y
zqhRu$v{<v1g#D-102+n*v(<KJ1hOgTc<j;v`>olHWhD-3HklHv+$v+*8M~(|1q(Av
zdU1+X*zO)bqdc~UXS3F3j%&tFrcp4&y_E0Zg5(6x0NV941e+TGupH3<E1n~7<<mT&
z^0t72qboQ(+?ioT=;y&KVD@!M)OkO=A-mWUNgM7Tr|YfB`M})s#zDpnA2IcZXbOoH
z=<M^n4jxKjKE*KDqwvi0G$L&hW$oS)eesDzZeO8N=4$ZGAqMZKBkaga-jSZNWit3a
zKR}d}wbE%lBx#3)dV3t3<wh!0aMTe54OXHzfm4H@kq+$2ZcEn6l!KQ1j32H@h6Nc8
z7LTP^4Bm_}nSpHu&;=&_10X$oVyymRkFa#=DC~)EyxTB$MZy!R&Zsb62{A3i>#@j6
zCZi))9|Eg#{5V$!gM|)F#=ATVpBwa6e)V7C@14WuKfc$SAs7``$KXB0Ap}&SQ_=6h
zP_DBS$c1#a_IJf}J#ULU{{0`~nGGr>*fOR&9uAJkv`1ZfD44~WFU*-E1Nl{3@_56`
zv#VuBj>}ejcypa6`Kl!Bv()BZ*2j7-dZXF4TQkVr)7LfFIWfPJHtRSxT!@fIHME1v
z$5XJ~^?9mdrJL!8`0_XfSeQY(;CJpN1xd^-*qX{k&VG&USrtTyV2Kzw^5V%}G3cO|
z#wU8S_?BJlM;kECyE=c4+7GPsOh~8lk$^S-5mbxHlUKc%t*Y(1R*2pk`HoW~?+0wQ
zu7Vq#0-j57^PB;C2ScZ{!tm_;rDb;AVbn{wf@4W?O&zMwv<e~4%~Py9kR5s$Oz1ol
zVsl)>pte?m3!`}BF2<DO#Fe1E>R`Sm8vMQ(J17*;(rQVAp5L2qpQfBS%ZLC`{`2I#
ztuWCgC}^Wv&4l6Izfup1@6cGz!WeoGB+R#}3*fjkZcaxF>j92$e-Sz6|3u`%V3;?>
ze0gvUAwSwks<WAExC?d!iDPB@s~}xenB&Zf-cD&ON_f!Q`GT5(y!f7s?Qs~qr*!j<
zABDA<_LtA4cWJC5<flL@-N#zEtQBl&vd-{#iMh<}E};IDy(eOFj;)R@Op{4xNhF}{
zDv(=R{#n*?U``+U1jVc{Y&mj>t)nee2>g80ee?#uV@9A;nvKlEm4zS04ZOIcei)gF
z%+FgwHfm+5U5=!qmw@iOhPsIEHd@9;lKYWs<C0=W!tg>EPwR0-=U_VG%mpCo*=)*%
zjacj)8(;xbab7=TE_NVWP$|KlWI0gX|5~^1b6<R%NLtc$MCM-WSyB(#I9!Gu<+cK-
z=g}rioK_|Y^Gh!`x-e|5^MlSV=HlLSJ{U1!OkHmmS3bqVz@iY!dB{kcW&=V*xs`KH
z@p2k0z%BKZ5xh!Kz`ZE^0)h(97z8ae9VH3b<$g+SfsQnKL30$QGJCN=G77gV^zA42
z6Yafar5bnr33dkd4$r#Eefsz-H$|@l=sFhIdRTf^F_c~LzF(|VKZ~4QF2^atJ;5k0
z#ucokz;{p|5q!zb#2PP$dz9QtQAa4j@cvG`P|58|8Ts%8O{WOw)n5P?$SJ?`rGnK+
zsFO#*5h~ei)m%6qYiJJb*E6N4o%2&mB**GoRhes;7kwqL&>5eot3pd+zQXFs=(PoT
zS%2zRdh4yCBx%Ud(Qct6D9cB@idJYh-tsvCj<RR8_K!TbP4B#VnFxJ$s{KEt9$?`F
znd_1jV=K$g7&q>k6j6J+Mao6%;sPtKyb7$i<RVr$X<-vGVKALByLpyEv$8G6UsAhO
zV2E$&Aoq-ItH4Zwo$_ft!^q{__2@^}Ngw!e?35JtC^N0DwT_y>0?X%vTiQV)x#3b5
zQipA-^2;xB0jwn0_Sl^8N~>9D0vBoG`+aojUkz9D`_|^VznGiat^bG24Z8l?74M_H
z2hUvn{Hi01w@>9dxN|iy1$-wmNH<Rfe1Ciq;q;S;Wr_CagUZKKudtF_E7+I9u(Y%(
z?YlqQTsCoW;|vzd?E(GI#AY(<sQ9r`8R1z-VJts3L9F?&`(?qrzrwkhoWKU8Taw|D
zuYNZVSzKQx9@}I{Uu1Ugoheg=KX5Q;#&9uhxsQRMSMD1Dz`=VCSXhxBeAhXOj8U<B
zQAN|b;IqKuIHN%)`>HdNzK?rXEilbSC^X`t2Pc0ep|RE2XPqpA9OJaURZ!`dT2<%W
z`%uQEfV`ngkhz-kZ`=k8u%m3}tYL<s+$^a61>9_Y12+V%v`XX%WQzCk#-VBOd_0&d
zZlc)fB6N_us)2BNjJ_fP)^UDQvQ_2|e;QnJuWX+jzRo+cra<HN+z)}(W9@xxfaOaX
z8P9c%A<1YPNOEv_!r0t(Fwl<K3ADc#Waf4o@9*ui6=XLOsWz<!-vNj-7{3GQv$$v2
zB=kPBW^y7@6h^Fmz?Wj*8MqM!q3Y2qvFI>T^WM5*>&b^Ni@0Yj4KnU(t8(wCU$jX?
zrk=GuWp58_ta@5hv*C>L@fj$p{P=nzdVbhX_Ye);-olQLjIsVkZn=Va+VQdsk6-Lb
z-&PpV?8od73#Y@pw=ep|wNcZ_)Nk@L9cn~}^^Jwb(|ctp7|Fq0^V~-!uPJ?QRnZ0s
zYE3cUG5ONvMlus7Y#rVn@~S#*7Eti%wiB{%3r7WEvdy)Tql;-`7|lvXH*jk0g$LJn
z;lc>VC7yF7@CQk&HfdTtw6KGphM5+B27~sBbFhurCx3D-OvMDPTtbL9EYn$haCuN}
zEJP`KPdoButLiWj=5d=KCzfnv%3<Al`|P(j*~ZJ5)uBU#loZ;Fc(Xq?W(Iu=)lUmd
z{O)HU9@J5huMv;2Nme(kI<5%fY$fC>&)BiLI6MbF*%@Fo#b|Ei#|gv`2Rz#@qNg5x
z_{aY@LA3<7KmQKdU=pYg$qrp9F3P6#`ZRwxaGcfO5|I~vkCdht>$DziIiu-%$hwKi
z>L1us%cDBCAB*VsRP)cW0dN^}H@!5<k1%pw@)hH((wsp!lgdn4OdPk5bx$SSR8cHh
zL8q8qdW;1S>v-EUI1qFySYx`oX);-^TqkFmZM(?))a$u9-;2)W(EanD_b>@}3*e^F
z60>I8&OSD$VP!`5QW9(*jJJ)o-OzoMX2V^{Y1$rd_=1Nl0ephtD-><pDr>UR{pH1I
z=DfI?rIWRk(xxYO+-kW$1nXxf&`XMvNr-g;pWN%|9*ok&&R8R@Ifvo6O>Wgp-U~Dm
zYCklwPk-4Y7`dp{n_JZp47_E%Umiv}pT&%#T9VcleVwE~A=}u}{)fG0CQD54t3~@@
zQy4pCPin|}V*h9+A6y2LLzRjE)p@2v<Z$8JBz4G;Y9T~?$huZ8r6_DDD)K{EF?-Dp
z?4mH6E+$u5#HNiK7HyyNxuY2xG|l&wa%O_k3{=%9g<V50atT<X4!pZv7zl0^Ptpn|
z-PWAKZTFf$i{bSPYIptX=Ye+f%TaaYUrh;5>-`KYiGf=r1h;#P!*8uOty)XbOy^mP
z(ZX}W#n<m@OLdNssWBGMjWNQfewV{;pKbkBvJuQK!QMbUMQ}{CXDkLR`&t3qU&FFa
zM%E#r>BblTCCv7YY6B(*;N;?Oy)QXOMrz_-j8#|wbiVT}np+`u<|yq*+xce%5tKtQ
z&=MIJCips9%Tvu>$!lzVOp7&202tw9FbP$R0LNZMS4x60md}Dc!|R_#Ax(msoLa6m
z9Zq**rGo`^KVNIGLCnj0e$LZqD3he%b87=4zxU`+wb2lW9j9wp6}{4oYOICI*$Cr|
zJ{hA!sr~JXLq$UlamqK&f_oj<@-=&y<FF(q%FK9gw(rM{5F0h?bjxQqD5ByV;{RMA
zaV4+*W?%(G{H3kUKr{@BvNn8zbe(LUl~~k88JCeN$Ez@(c~q{q2Dq41erDR*u%rPo
zj?v2C|5#nipBQpXi27EEwl(74`H$`TPSooj{mM%D%FHd#o?>H5WEYkRf50vl9{FhX
zZJvpy1vjdhv@oC^)Zzf$^cW@OK^?IIg1L6|31(I@T{ok-EWs)FT&2bJpz&yeZ1zRN
zk#qAJ>+w}Ovvk9{M23QmbSHq=>UPF9K@5+X>W;o6oIpz)xZkZD4CDbv+BB2IQ_F*`
z<j~xJtL%65p-Xsv7*eMEfIgw!y;z;?Vd}z|8AK8p#R1ro`o+_68joE2C5EM_S$m@<
zcFDTWz{D)}sQW)rUJ)10<}q(q_uG*cn`PfI!D*10z0TyTF~URzB~r3kXxwJaQ}y=i
zd-{FH$vZ`Dkq;S7u1FQUNeeqF8Uo`w>6S3{E-dX=8L!qPvcNXCJlDdHJ7BqxX_4jx
z0hD6wd3-`%XC3N!5Fgxz(uIMwqs`5xgly(*Y?A;q<NMn3I=AZlGHW86>8%O?oTP4%
z<xI~XiMhi`G4WW*eLMEglQ(g8{TKw?J1)=4az9xH4xfvJvjqXIKJr7`zU)Fy?VB8=
zdbB_VH6gxd!$4e82;LMzYcEZ*Q#jh<A6II-d)GeUojle~U>6Vq{h+)Xi}jowGtkWi
z*cvSAdSkI^%xzp1@7<6&KBw}AovM4`oP|$y>J2YJSKS-d0%t{Tkb7I|wY4R0dqa?6
zlf_B04A=8#BIO-ZGHz-}`@yl-bLIAT&-`iYj)n*0X0)|#eh|1Q6TGJpK>AXGd;7_h
zmI@IdJ<v|wZTllV^uGEnJsfob(!-LQd*1mMW13+XQ&-}!;N@e`tO}b-9j!~;(}Y!8
zHha^IitjJdY!W?@h@nE^&pL$Uh&woZaCLAF&5U+hZNtyg;VAOiJf1he!Q;(VOX}#5
ze5y96u}kH#<RRCUz>Z3@9E(vH6m>2^u(N=dhlsm%mz}QS9!M(n>`5!ARX4DdJy;HW
zCFNpko_Vgm<#Da#*>BQdG5X*`O?pc1j!LvX=-X@m2akOzs2Y?I$l~mpPv264MNRh{
zk|5DL51>on1GaF5Iid!WIzV@23l`m_8W+blaG|Xr6P+WK=p)o{#j?>;Y|kwJ6@ene
zdII@dms6yEXcQ9Q+;)-Iu^wxz0$-@|$V>B1YaLcPvS&$KPgszbw3Z+MGuKz8t85U}
z6|nt5Rwe`gJ+f;2-^l8JBdh=aAuIIcgukW)h1{kF>N|DwK7O&q&kR1{7K6{{0&BrH
z-#-RnhFVEv`05vdP6vRZKylKqEEqpgXo`6ySQ+qo=&>vI>!`sUL-8L)(SA>#zQD>i
z|1eM8i_Ae`mvxe`@bFW=TMEH$$ZaDKW%4PAWdlEwRkVVzQ8MNNhzOy58N$R|jjq$X
zJ;M@j_oYIJUb^ZoEMqRtEK7<S@gB?`*WBU9ND@4JBk_fF)=Z}f(hc9voTLK&r!*CS
zFs&@q%sv+=$j;%q8z@;o0bIYSY_2gfbLAm>XLq34kz}^gQByJ>l%VL^(mKJVx}6du
zbV>?s_h7U1>SR__c9KzT#iN6FGt8=Jw(qIw_C_`l{nk;lqg2W&8-`|oG+*quhtt3$
z@(%hjH^bkT5HjQ4d&=GXb(VB|L1wArYG7vmxaA}^H(nsf+ujm!=T6`NtB;#no6FrZ
z`04u4W!9F(V*2F6#HiHC=NC^G26GE3^^8W4s&f2mZC(;C6AhWcxzih(<VR6X{q{?}
zm7??YiVscN-+XDi@mLR~CVZP;IeNpb9cbAEL%BjYP;u@VtMYtvIT$u;VZVT8iniYT
z>sr7xGYUc%FYB~Lr!wP271k=N;6~q`U^NhX<O2FWOSq*nYfTfIh7I(NSo(>3mi<i=
zWtNac&rEyx<nqts{<xrk_H-sejF(uj*#bve1ZW4jJ9a83GCpTiRH1==WKEe3TA;nN
z_VrxEJ0$hYM>H$uW#a2!npdcUfyde(;wTh~8C1;m(!OsaiV3dfF8ME;%aD4iEV;hL
zxFnSfac`u=1l+1_;CZH2bM=Gp@Ba=iJY4DiQ9I)z(@ZfoOvEND*{q$-HixkjzoU*(
zZ)0!$KEH+~CBg%EMB$cUDys)Cv?!D$M$B)iN0U+cVK_6_F!k9u&`ZvzFETALQPYMJ
z(n#&Q0jheu(FaC1-Fk;+ZBLOd7wo<Sxx+UhUW&InYvpr(u{Z2b&MQn0i;&b?(5mh8
z*DJ&>RMhw+Cx-R$@uHmY{7{5?e)+l!Q=}(|S>>za%qnKS?zXP7Q`_<RQa<Ehjs0pM
zO#@O((^JiWSJLo6jA@364yH2MAV_cGAMc6Wj#3u7M@pV!1!ztw(L-Pp=r?B`*OK##
zc@oO0%5z=Cv|d7uS>-<lEg>q4?DzkOc6tAZc3NV9D|_xp3U(H}H?7l9`}wED@f5ZL
zgVRxvFBs?ElAQiedIGC8!empPp1hEEhropi=VBG8#2@vmOp~uQ7QN{GO(hDL0x)VD
zw=gu(n^mb@$^|snW+|=w_Gl@-f=qMTdGt5$FbRCe#5jicpQ~5NYh&}NrbuP-71lCz
z1(ZPvYjYbS9AuLQ<Z$MqY-ho6CqNKSnEVD)-}2j3(t1t`MVl_Dh&2*svEWdBZQkGl
z?6*R34HK=S7utO$rV>!nCgl6sa@OcsXP*4Z#?}BhQ-Oi5;*4N$cn39Lu+UnVqA_6V
zAT8XJdej|Ex=@LK_h#eHxTVTbJywwSrnTQyh&h^pNG?XA!h77aEp7_+^)S^6=z!Ui
zTG2K=;oh)iIu&JS9DMIhqG6WK<?rwwWen1aX0yp~W|6%%Le9$%mF;ig!EwCurh3g>
z8XI@RTL=QXGZktyT~ALP8&4VhEjH#4Un{JVTN}8Fre8xt+U-J^9CgQ@Ol5Q3TOuw2
zMjN>xIrRPzxZNX4mcsMVJhI}Ql;4KJj(d$$`}bV?r_tR}@pwp7kI=V}$j=(VIK}N_
z@orNLw+U`3H6Bs3^ETvW@KHp%klOu-<e<0FQ#!gk9-s8P@tQ*BCRKJs&p*`&!x2o<
z_}$oHM^=+#y;}|G!024hl2l&I&VLDEVvYHi{`cs?D-22xjE-}r1AkU`>v@6^Z|jOs
zVP!H*N>z_9s{pj+tC)d?NbOf6aw!W;KbR--F86_c=IFX_Nj>}?Oln>QEOq-%3j9@~
zS0_qbaaciMNJGBqq89T&iO89KT=|A6dbJ(5VI6SK=6j!ce<OTTp@P(j+}ips^WO!W
zQxO}f|Ly{Z`}tImg5h=LtM?VBhm^lqs%FvaZaFS5%UZVgH8BrEzc~@`bl*yNJabvl
zc?1f|T>jI14RYW9w<_;G=9OFR{B^6uOEDkf0IR&KVdv~qMeF`L>s9&mbK_lF7hJ2K
z$_#*Ux0t{t!P}g+L!%(AK?C^>9Ybmb_`DPc7-9u}jZV4w3&-N04WIZaM&@P0WX9e!
zF}eN;xy?g*m+oG#ES|4~NQ!`;K+P$A6bF?C-VX)w9H>fh<9GrIH&P+yB%?8b-bIGR
z6S?5Hk{XVoU$JC%{@L+FyW&AalF5U0tJTjT1XosCHJsf{zY+>q*b{gm|MJmUo+&#;
zC0{6qORi6e0*#^nvV13<)t7QE%!pukeKce?7s!7!u<{+?Do3o+e~NfDOVZsN_V-Ps
z*Qzi!x1q^g)3HFXv8J*_!1iSV2k4m@)MdM#Hc*CtH3=MFU?w1(74NjzTC8i>F`H-3
zHq0IJX-*^&CP2~V9;RrNHg0Jz2<spm5-M~2+s^?<41&t_0EerwQX(TUXk%+1#9M*v
zS_vdaJ!SBn3$lb?WNIyA-g~l&Pke5WmuTF<wm)Z_au5*lQc!r!4Vq<<lsMt<muC@0
zkg!G$>#)0zZn-5zm={$0S%YOHtpNXPb!DeJ-gQ}q&TFogj0Y5THG8AyA{VS$M2-!2
z!!eX98P*UK9SgEuJ<n+Y3nCvWe(`&QuX`)O6u*@}0~d#vYwE8_tYpep77=9areNCt
zrKz^{z%R5-jh~w~E+0k*${7%tN!Y{lc8t4__oQdbjjUaV#p3G)+#x@jk6r;r$R&Ts
z%GS>Xj9F%d7-6v;2%!aqel$*$7GldZe36Pf#B#a*5rY|B&@Ns{xLKKAYmgh3*j{hc
znbf@Fz#*W)qERehA7fLM$g%{M21z!e^K_8LwuhMjh$gBznJ9@#Z%mu!pZB8jkU>#j
zRg<xUW5RRW*OGPQCo1!e(tAcPF@2_gQMu~s9|B%XiD<9DoVtedHgVTwu)sm!xGsmI
zD>C)7^}4gJzIN_Q3EX8&%9$GMo^3~oxL!TbF6W(92WiRaJB*p#V~xG`7)CnyS2$>~
zi|LB$&6kL3?wTWE5ah-`PwuE4OAytp4H>kLuNA-dPo;S8cZ}tu<-)bKVRx?ODJPGf
z#&~n*OZC!1d^>{$XBAlorAq`XAPA(#y!v!jEfsGM>%PNJeWEhK@h}EE2{{Kn#Yr<-
z8aSX#Kj+0Nk_$eZ;!y}CwtOycmU3|qEr9<~U4M(;a~-E%fLom?pc2v<zmra+Xs*KJ
zGqZn>MMf@so+gcJ_M3z6c<@A^OgY;T8w1T(8^{um!qKgcOUYF9VTo=2A#in!##LB3
z=)&W{N`cP9ap>g~VBiNrM-w`51EPXc3=tMNsvztkXCJiTjI2!<cuag6qR#>QrO5`z
z33~<+BOdV{F_zT6JIJnnFUv_*5puIug1d1Df-l*FRtpK$Hf6QPSR12s@yit!V&>kt
z4j|t;q0z@e9=s^{h%J$==m4gQSndqlD<rFv)@TPT8f^kYv6%gx^4Eu`&vZtbrFnId
zHwGe{!}m!ra5&8+t0bX3Jv3|JWm8SyA1Q7;Xw3@;9H^w|EAXZef>1aU(&)F!W-%!J
zlsm{O&u7O{GN@8C8J7kY_}sj3xO|>v<j~v0dm2UdJ$-ihDAo*_Vr)5Le|0Vr*`$)7
zkkEq(WWCBzUG|&Absc7e8lYWFZ5@!Q6Bl4l$ur~ElUAe$eD)k6TrQL@;)XBiEp%fo
z;r;|nsZ&I=-N$@{WKw1?JS~*U&7%Pc*wW3v!(XKV@}bc(Ex(@A>GNqEGY3vePgFg;
z!Cuv*F@}L9Hxf$U*r~K7xjibx?|yK4|EYe68zWZs>a>bGjTq9&S{MM_ZB*n0;ag;x
z<8sTxN3!m4qC!=kxiR!Xhfc|oiwwA%zwYYTlpK6rtHHOmMC?bFO9ZTVL^rVF?#;La
zOv-+nOqoJb;sJGBDVAYUD7TDYlPsgwMVTX&QKg1J)f?a4B=XKbUl-agmLvDKAyv=t
z3gn<Uomp|kjS3!%PcyC_OA|gjd$tr7<KNCFgSwkw7TVWHaq)++*8MCiZ2NokM@Rsm
zK)AMDkWbf@ypMb0c0F|IM8A&N@pCp5Xh$0NhF=-2K>f=rG2QglJGPT>G3NH+wTsxb
zKj-3@<av(pS6vz-@?{k>5MvV9)1p#TE_3@wHQ+|ssqfLRs-fH?h4?r7{(?$&M|XyI
z-7mNCRhcPCMlK_q-{ubr%glG?e=8gX5?x@Jj1W(-D;h5~qVdv~@*Z<4sX098ExDyJ
zt^DWIZo#!ohV4<?1}?(u!3iqS9NSe)+Mi2|U&-i*NA?{#M}Jxc-6b;wi~(5n?w9v4
zd!G_;DFC8+(}cQ#?k~@t1;87I`S?OEjT0|x79lVMG$bMm;uXpM?Jhth?u7keZ;<vO
z?|v^R=Y<hz2py(dA_$$lrqW`(joX2_usJ;+Kzs^XzErXF!!IWrtlAOHCc9C1Tse>^
zi$!%cAK(|zVxAw|;IT_n$C_9u`uNO0Bv;vvbOd*5{!G7J(z(A|sMnt&+mUH02g!F=
z{5j@gp=_f^)M(EBvV)Wh5-!2-mY$y(5Z1BVM_D_dXIG60_+l;Z>PE!-9Mo+d3Itko
zE4H&Vw0%XYz%zw6Z5hjAG3VDV;zc_C@}5R+BAaJF_*xi>E=z-KcWDzAj5tTgE(f0t
zi{%EASkNsOo<}hT%^%k+ci`A>SlY8of5TUFW8u(VR=6CL){#JP20Bb04DfvLd2|Vc
zy9}oeJt8XCImA=n=HgSiMf{lcf|&)#nw*UVh0$^c>+kIqa~p7s;2GOC=#Gteq<FMK
zN&d>WGPqJOOzuk?vEc3fB=wq-Y=F^w)ZSU)lzxXvgd}k$d^jFJ(Q->V*@!as$bPQs
zcUWhcz6Rf>lOO{7wmom1PyCwbS0;&AYtm~h<@zuVbVW_O%ik#+kIo1YV!Frv{cMb{
zJfnS6+bf#~fn>DQwc8@~jE>ZwoL6HNWzbkA$<@IBJ>=9@SvT>4x8(D!h&+24^{^eh
z$@c{ew5aY;wwIIham+m>6FxC!jH@63gAFOpecf%ShO7&B3W!+STMe=$C^ANfuVer5
z>?yE*r1_^UYL)$c<s3)&s8hNu6&KX={@75}+0Vi+e^dK6fT98b6l;v1DLR!EYt5g8
z#2}Mzu`!`ycR9W7V=K)eKU8I-!2q@)$-QX8>F{8@o3O{a&x^)Y-&MO)WvgtaWCU5W
zdh>7CIG8hbiF>{x{r@(E8fBwsPUQI=<??LIo-c1MCvdt!)KuyCeF`>KvaT25N#MNG
z@$Pi@OOAqP2k^)q(+Fa`VU%4RWIBmJ4VV|^jT&nF%!!Ve-yMB?!JU&&XNH#z{TGpn
z<}03{B~=@$;33RDxHXm%EY`-XSYCIRip533v^>V;qHOsUHYYk!Nd%=XZXNQ_!B!q~
zr?JxUIjDb_5OF4f*<D9V(w)0dsN+LrK<X|QP9DVz7wcg<$wIpzO#}Z7IACC1SmhR0
zZc_H6i3bvOQd>+c6jOVo;4GVp7(o{A;KRe+`}p*vY@{G4HK{~+hhfe;MIOM{>U*kA
z;aiYtB%f+!e9EZ2ton?7@JE74j~Qy85sPlDxSm@GN*9SChSpqk728Ltfh*`~Rguk0
z#k|w$ZXP*D%L*-uzHx><X!iIk(t=oneT93y5$QX^0d=@3`eAErgp`01&+LiZeSi!l
zP^uCgLx<?1$Ti*q{zT%`17Z=MO(OXovs@PD-Y1=QuWE+g1bDZ`G6h)JofD%<7|XB^
z&Ex1|%tEhng@HWdW79));MiW7=by2rt*?l7pMo~PsX}&d#9dmSLDx%ahFd~f>c1?t
zgGytC8sE+|oW9y#X@U@CW%o86%Q?P#=8T?SYf=%MbN^)4_4>*6<@&kt`9Ue^l$YYC
zbBwn6hSJM7Ir!R0j~@BKEN;XJiQY4{_F<*Gty%o7eI?H=%on&UQoYy+wPe|B33LBs
zc6<}_Fq9})q$lA{&z^7ESv%g%9_PkSva?uc8X;b^GiiyeS9Y+TA^NF7gk4R;kHwb*
z!%J?!kdI}wPqS9GNXRA1E%ZDP@;h+OC`j`r(fJ0BTmx^<dbcnc52FG=_tN%m5KaNj
z(H{zB@5J5-Kqw2D1A}FIbOsB>75YDs!IGN1UA`(P-pRUUGqAXfKf>mD7M~xp;xh)$
z1Fk)u;bpzR*C?o=in{JY1*b_=lECWDR0_DJeq?J)(?7f7tnQ<@_;M|#2xCrqr2&ES
z*RBN`T5Su&A%gPNz8hd1DhH|zmIX~ug5lkL@BT%vMfHr!*fplk2#D!JGf($RUF(A`
zzjf$T=qb5K!3kZztoj~Y(W~_eaScRu%n*zZ@@;k)Q$aV4XukeiUMs_SEwKsb3vz-H
z)pTmR!C6I(d=|6zH431UQxmAtgMs=gj8w?hui;l~J_Vmul9Sit>M_^4KYg}Zzq*A#
z3*nnaiE8!%gy{isK6q7pLFSUjedSq)`ioC*7Pi?VzHVCjJbP6h*(6rfN}3O?EVVqP
zA7>2#J-$l;3vru2TX70kbgP#f37F@9W(P5sh*fGmbn86PryUcB%;u6^kyGoXgKWG%
zW?!G;m~Zq~ryYDR$fj%_6TQB_6*8fm9WxF~zgj>+t!F9UcvhmwggU>okq97~qtRrW
z)U>>0>MmzK1;6xBluz;Aee<<dw#Ll1Dc+o+{3;^ut$MS~9*37rLaWVTTh8<yxXwe5
zWO%1P%ZC%x>C5#S-7e-<s$$?&aQ&ibVj@5|1z52=k8jc*MxBziv$&|tpWf+kX%s9M
zY}8nAG~+p_c^n^aY+r4AP{Z0xm=->NYI{C#{?RPk+XC-Y*YeKu<Rek0V-T_n;fVil
z@`K5LflT$^y8l3?q4+N~V3x8Wtg~35@_}`irY}nu$kN!yg%`IWc`YZ<r?SA`0ba5I
z+mo-H2^bCeri9PT6Z_+|PJ6JrB%msDsSD{ydSi~*XgP!Cj~?xVRa>I9i^<uUC7Bf|
zc4*!k2O~S#r)<%@Q3ImLp(t;?^fn+ErD$kdvqfhshR%M+XgsJBt^dwCadxu+1_t0x
zqr%2j4ya<N>8ar0>8bwk(qn{XQVISPpIqW;H-Y3u5AZdWSCAlBB1B)st!de8nQmHg
zFq#dV&aom4&+=rqG_>V#?C@QJCjogB-x6@*EzK*$!Q3=b(+z4)ToMIQoJk<6$;nSr
z+^fm@6Vb@06mJCPtux~4e)PYr$N7ki2zlpREjcOMGpmEqF!0)ExTN9nqwA1H_eneR
zhOIP$y<waAXJyTfi-;&V-uIZ=xE=4|a{_nw1>DU(<u&Ab;&YkRfX;I4HM%F0A>Tp}
z{I*vb4xZu%X4^xgWkczw&^T-u5uGNDyd``pT=<JxkIMG#2|x?i=+t37xV+IKwA%R~
zlu=^CJ2mj~2&ynTdTN_Z>w5f-XqOZBr0>*r+13QFsNsqGr)@XBZoV${t;y3LH^9B|
zu%yUZ8=RxN!CcEka~l#swz`sm{|n>qxjQdM6c}6SfVQZkjY8u0s1T^<#jW)dnBlKP
zG32(vGED^^TQ`n}#^4WT_f7BNIdn3(lkqeakxdEZ$gd<^28?P-zaH`bkkn)qnt6-K
zL~m_xqpOnRioHAbBD8A9?(eh`;gN4J<&D~?@#($D3hH8pLdI}SgYan}D2<uot2J7e
z?q~5G&k0LOm>=#uHb%hLIf&0ZEOULqbgUaoED`eNVBpt*jrYiOj~#pT_Rx8jul1Ds
zp?$43t<2Gze$rG|A)v8ufwsgL7s>zK&tN_%Sox0xXa$oqGJC+#MQ&)Q(CNged^6X?
zj58<)RyU9M_9N^u=AIym=o6|1m6C-L@jAt~toyVN)NHLVqgL7a>>%Fui&vM*s7a2&
z>k%0}=B4$4_<h)t68-~x7XQjiu6iGGD`qLaYK%_#hX_T-;fF(NpHH860gc=&=|_Xf
z>}wdfU3LS3u{-<ICC^EwdUNsJ$A)82Y~|OPTOs8{z$S<l`C*$)=QB7=;{=S}dm17s
z!>At%#3lNY>N=TRCR>5PT855Fv`DUsQ;BhgtAmh+ta_dCG9iZjE+Zh2XOdM)TZ38I
zYMIzA!{TIC<M#?Vmth>-k30T$b9b;APR(!Zd0GU*t&~9x3?uOM;AidMCUC&m?><pl
zY&+vS9xxqRUE4bEgC$ogtE<+*2gKUuntiTxoQZ80;VovZnXSIEIgN&E7D&5&;#}`9
zzUTP-j)ve^luAmUkn?{5Ka)N&*TuP?WKylcR+Jx0{9j9^=y|u7Nd0zc-|8o~lpcU3
z`+M!kqL!~vkQ@_;*!AVc_4`uSyk?7I3x&CgUqK4xrPp$PE!*7VYyQ_`T|3o;tBR<k
z3oCr1Z|f(fre@0`54^r{2$q+--$n%;`aU_`4_oi)!GF-OW`X$lB_rh1vs>+@s`Z(a
zkNXrb)I^NSqEBu8)+`=76-OTH{1P_h_a3<`p>P~vtj8#zk9(qtyU`*<X}lYAXV`L{
zgj7O0!Oj$ehrV_PX?}4@+w|qU&ppTs<U1~}T9QX8q=V)_eV6*tzeAdP^EPF&{jrh%
z9SUMh;DgNvN0R?X7_|A8UKxNv!~~)XnrZ(br_}g=ol`pdZ*xjQjaN1$m25YDZl4N|
zoxczlLbyYHxVZ9%EQN%Ye_Srn&9<2bn)J5Fi_V1DDSKxi1LJ)9{Mv^ZK#>h8-m=>&
zozEVcTP70wc|M9cPj)d6z|2MzlNEBqh$3?P2DE`uov1aL57*oWHN$D}NA`U(0>+Wm
zCo%%#GdMG+w)lPLAGOdwz+J>ww3yDsdN43(r<;B()n{2*DANVl1fALbsBn<y6+{2*
zRaQN;FkZo*aoUo>ML)GkzW?*za!Hf$jJ_UuM;8b;tys`m!_wTd#s~y{pYpT{sZ^!(
zLz;f%3&#mV^jzsFI5m2PzgIbbj>2XR(iSt|v?Fu=<I-x93iuslSnJn@EpdgO2UJV=
zkGF|3PoBgGrO>6Kfu7o?MYIdzII{+-hE}EMRMr#X-)SV5f+bnyR&zW+*p?!8KC+#2
z>JkTNMfyt?CRX$Y<)uyfop~zAxQC&H@3!b~HAlcsnSf-VAn8q#wU~gD&p|_g0K1@5
zG&;rwVqJEN033=QS8cT!+q5tO=aDfHJkLYGR(x;SEFF*Gc@OnjhYVyE3I55B`iba3
zi4StiCfA_eAX5D2tY*i5vSJYe8UG7u{k`=rw+M~5@s^<(D4RM|z7LE0K5DZ+5#A7i
zu=rJRSsEng+_D|JxKJV8z_&oq^;!3{m;D!m+2zXihPs*Q{9);hW#8GRouzF{p9JZp
z;Q4!&S4kE@KFu=Z;T(6bLmI9!ML--q!s`{y7?bY9lE|o+Q@}j8ZoihcQ(Gx8#$ID8
z(?njpN7eZ@d=qnGj^7YEGz6CV8IXBbRpP-?%7@m30E=!PaGI5N?zID+OV``eGtCfq
zOW6EV9w#>Wa1iJH-<4VLGEkX$FYZsTbnGPz+!~8l5YtZk9Vr768R}SCb2sK39>ib~
zpJB|bF4EEdg@g1Yb{|012-qz{HFV)~!G!Sj2MjmRF~{a-SZVLS?Fe(p`h?_7@RG{m
z573Xc@tv^ViGVZFJMl2T#v*fknuOHTk^ypFEguTAAfI$pvtk#V1K%|ky_=0!G!Zcs
zBq!iZ+QH3v_GN;mZc13}fOybu(Xp?GXZ4`w1is+d#=0?-w&!<zeEzY?<f=LD)M-9O
zO)Udk(euwVC6+Dh^dEoE0?1l?RQ`|mv>NR_oxKG6+h_t|M99XE5fUF_M^W6*F^hZ>
zVH@BeNM4Zcj@?L}3Xp6Uwn&pN5cnP8t6$@_Y?i*BcsBfDSpK}k839~98eY9tQ8RF(
z4V`o;iQ@(D2-oPip|EBo#<pC>y#rQorPS0f_^(8iP&pW}0wTS|u7bP`@~OBhQL$&(
zDjsyF9l|;=ov@v7lfV9`I!fpNAVVaL)k7IppQ>=%02pn^2%w&K!i|A{p&pLksHaKt
zDSe3ka=n`K@+K@y5MfynieACd4a!43u{xg={JlzvP$?9dq;mAWSQ}6^bd&2H&Ftf_
z9ly-4sl!)pFRyqN-!a<aip1r5WiwG)Ej4ml#fHbm@|x0|Lh}VAw@;>6lX-~zWvZTc
zP_Ttb-pXEXK{(_D4|z1gI3N13f5*RSTgYE2_MBuZ0@jm1P0q~vMm+GJF^0KZs0Aa3
z9~3I2_^(m8D9NF^O_W#kk_NMtgp(Rq4ew?^c-u3eOxw&|lymjJ&^mvRFYk4|jeo7a
zlN+J%Y`XNzJjsb6ys<D-@)$N664ejc1i$QfKqXwlgqr--NSLUv68$=}ehpG>cTW?>
z;%lK+!j?JbF{7)rQPM1w{VMO|F0LRQk<(g$aa#miBN*l^2%XcjaiwZtFk&bc-#N9~
z$mzd)8b22}xjrAa92uMP#`yyAwG~MLV+1A=%AI22?3u>>8^DQP0H4wmebP@SsT?8%
z#oumE$4P5#TW+^8r-Cd?bP;0RqGhr;diwq!gwrB%5bB$qPbvF00ahaQe=?XbcjNQh
zyfgAyL$de;AMwc+d5^r!i$%6uch@j1Z&;Q<eN|I?WOp~etuHTt>-T#3&I9N!q^zte
zf^WGBLgvq_#aYIf9?f6kP8R+Oc%)waU*{5Lir2L2z7nggzM+lJZ4$#VA(aI|5igbg
zXw5H};uUMuvHq9|$J^|a`S5HW{>Z{<!7<k=+xxohgV7f4x$h-4xT176`_xvV^jP%W
zK`h$d-6;Cb%jln1pS(2qC+F(Um(#khnZ(`dpQe5jsn~eB(nKRve;B$Q`fRxT#N0EP
zsQ?(gR5Zf@vI0xC`X6imc|pMwT){66u3jg4fsZcNxR1e4Nt0M67;EhlFWz?h^WHVD
z%S5Iqp{_@#2gKdBt74(lmORjPie4CGHczbzzcPAKIbMAt6|d2fo+`^<C7fe@3RkjU
z&wt2GVfb;lA_Bp);0$M*(w;o>1_3#t115#BQ7%$i0y1E(%V*0Nzmn{IAliC>x#oTH
zzi@P4T%N`sl;i$CfpUVb6y-hTdW4Myoj5#QF*wa1hnn$Uzk2bm{_qv3G(Yd0^8DDP
zV^`E-x<YyxbZ&GFudRYz!KURNcx`6ye{k`WdkyD0For#dV)T6YNo#b?Vlh>X1|vE_
z1;oU|LhooIFUgGPDyxPeARC!=q#o_1+*w5<n0ZnBm2dG?7SpF=O0Vw%6B*gjQ;;`u
zzU@wzMPtP89UI2+KAZxK1uG7Zh8^=~lbuXilkWyngt?ounl5$`gsiRKZTvicJ}hCe
z(yd;?7Wa|YolH7G`X@+h?p*F0{e4!(sMZbG_y5;G&AE!s@5y|N?U!JIb676iDA8F=
zEIXjYOLsT-r3z15cyzjI<8EH;YoJ>46Gbiz<jBMc?tyI|C!Si_WPBBM$Kd}>F0+p&
ze$S}<V{)T0vRpKQ2C1IxAt<b8ESmaBmT@=pEpmfgF4G;5T&Mxlje7{bVc(-23isa{
z%dQ_$4*UxDTVjyEp>1=KZEc6(rxNMI>uNX?hA)-vxsKrH0j_i{Wg<3DEY6=6WH{u}
zSoiLeB_#x3y&@n84fdq?aht4&&rDHixrAUmjs14%&jml$A~Rqpal^oMbM^V|@Nk`s
z%=up6qM0ScW29NsHGf)MMrLtI&794hRiU+%d&&)mm!QQ%vCYpCSLNXW3CB{K#IJ`8
z9)8CKpsqA`V&cOtwu@Gz_?GXhp@1`TI|eTL87f66VIkge!L6Ei_}RA^`EPa9!$@W(
z;DbeBAj!s3D~wws`9l~hca#$>VxBeib2zZ<Br#|7Mrj_Q)*Y@1KHkoLC?Dl<XO=P6
z(Uschj%+cltg6(OGW7LzDI0&}`@2!~!8FG|9te^aJ=I(b_JsxyhbF~$@jthw#KRrU
zOC-e~bZ@a-P@wf(YqiBUb2u36CgmvjWkt)f0!_N?QPnGeW04Lh;ZNbabLO&Djq}U^
z8Tzqjht@crQ}R4YGT)v@nzR0*oY?w~w;|Qien)5QP=Yr><MW0-jl1JB<B<1Hl^|Yc
ztK<jBJBT2^$E-~k%{B87*X+ix$}?7B=8v8m<)u4oq+SzuN$9kRrWvhY4yEW<H|+RY
zpTzoO(!Or4WRE-l6vy8)K&18L-P=LM%#bX*R>wyE`lNR1oI^gxgP+XbS3Oy7A6$`*
z-|Bk1e0VY-RF_cl^{cSNy7+0X*c4SkX3A(=uufB$_mHvE-uwM$=aLxNKGnvhcMNH;
zh4HGRjn*yX!pYKI2b|!e<d4mxyR78qbZf{rlcx2_HayUas=1<X!1LuSzm4r}SYm-Q
zfq4ezUbsH7-KaQ@D>Ysr%}qsnrQU99n%n(B1f5S-m8<0$m=d^`J>rizQ%?rmmp<B#
z$knF9Rt`Fj-azF$ZCQK5+(lSd2p!H6C6!LGJL@w78V41Gs;-~sUw%hYobV%q-(km7
z-pElrJr>?_k&ZVX*;kq)10@jgR_xeGeylVS8G7H3WXu*C$S@Q@nx!6zNIJpbY222{
ztG4UmsBq5oE?c~Q;xsxQQGL6DLB(d`rLJkn(+D2{?)s4Tc*Z&(Ga57O@B(MHau${5
za~JgT21*eek9>Yqd+`1KjbIx*yAel_VK$41Cl86Ui(!}pVwMWzlcYAR^1!)|8)`U6
z?|cj;kXMIAALAN^ci?UW-+eOosPQIV>M;4kh@i6fipMYVrit4tBWXwO_s*nAPVRWV
zN&fZXF`>H8i`$9=Dr><ipH(u92c_Qf8Jmh&)`GWi;)uzfh23_jg>Y}Is9DLnlNNdL
z4|y}YXN-NdU5vm^!f{qPlxF=JOkG3LX7a#aysKC_HFBA8%bM9Pg#6iOYSkKQ-J&l&
z#J`T!6O88SmV9xg6}{=Q$?kv0zXg{&CDX$zODst+Bug4`S+EF6U_~nPlQIcRMhXnG
z{bXR}7yYnuCkEeIF?tf`#r4IVWXQ{ONGx)Fvs7l2*WhF6#V4@8RN%5pU3|y4jVLkF
zRa{WyTL=mpPb2heDwWOID+alH9+BYNDP-J?U&F-RzvtX`ia_19X(IhFtbJ2XLkm{(
zJbl$RC-2W12NOT06Y5x>@8cJo`eqr2nN445j{qy<T15nz2A_-1Rc4Cy^Hs9ud)}hH
za(|O4l=^*L^k9~_Jt@-rDq1$b^6uR*lHG!xm|C|b^-hIs4BAvOBGG~&#;>i6TNKai
zTD5t$aCYG%GInQ#f%x3d>wR_9O+S6GAW{%N1T-0><dS72{c$wN;TATwB~~sjn+a|^
zv8odAMZP)6zLi!GeKMz7>NiOCnfVRT8tk1ut{dcz`?ZydSKIBmR|N{r1ik8=AxO$C
zf{)jc55vo!db{DMDapKg&d0^fsHQkV#jtd3iy4hFlP&IQdC8M4QT%PGDlO>!aH|W$
zDNf7qR($%cBOeu-?bJw;9%5nnNM=H5P}b_>f>=f&KJG!IdFnfDBG~_YiCbTW2+f3}
ztQxIfI(LwK2F?8JHR|@@Xi>Z|0QchgZkWfj*iN}I@Bw{7h+rFwj*3@=Z5(#`OlL)k
zPmHn+E!;ugBl8jM0M{tn5ZsQ}a1iUaA)^G|wKB@`8Xw&FncN-4Vg4|=9T)qWVl}<9
z?*=x8JL>L>M*-4%j%_#$4)G<00yT*gXB{>79L9O{+Bm&<t+Q@9yk#(~!GgTqumPu8
z6!6iu6|gl5LRlfzxLGRr%A9PuO9Z5l2>v%yQ-uV3=}~u{Hb#Y?IWQ*_aP$iD!bn-i
zuL6DI<!awctZ2#xY#p&PtJlaRRg1sAz9}Eu=jpY961u<PW#gdeqb9v2$<H#oT$o6X
zA8jqR=jflu{subG>N@T<0VgI^6F#&+f&*_9ZsZ3QRStV!PxO-mZzhqkVZJ7}cp}S~
zH`B;$kf~QKpLw#PT$922evA=3*B+p@mFJ_3aLm}jkKRy(V>qkS$M1&jLmWJxc9O>=
zGCgpzLl(@ne(AP71Gjv5E0tkj>X>pwfZ`USk-1Dfb@lgToxd!rIZL;n^&g6;x%_pp
zj^U~kuhOK6^mhZ(@-Rh#+%YoVa+aRIexEA`AIpN~+cy$VD_<0>Rx%334%{&|L?2F{
z=z3+%BN;#i$DvDRtSS4atNnWrT4bmJS3HB!wQ}US5ro*TU8X1TrSQn%ehuUe%AZ!R
z<57lsn!`zw_<i22od@RiWXFOTxlD#Tk<?ahAy4E_6m4-maXD!DA1YEA57Jl)I$7{&
zxwlH1)@(LcraLx)9zBhXR6@GpFe#l7Si3(oi883^kt+HG`t^RieZ2t4<Q^4!Csjzt
zazqbU3pYq>C_1XqGjWmGqk2)$NJH*BH2O!ac`+f%(3_q0<i4B^3@fc&UX-5v?0Nhd
zKRR8z9ZQ_u+42b5U4L4RiVyB7%=GUT{HTGjJQAJtrrVdXlq2By%=-4-WP-q6y?h42
z;^1y!V|nyG;p>6`RsZDu?#9wAZ2jW`O0v?O(8%k<S=BQB#Ws-QmdzvhQO3&}koa3Z
zM<Hxu#4@mSYcy_(TURgm205y@UjBXLqqo7OIJQL%AyR<Dr;8ssJgc^<NvP*rAW&af
zm%jF5Hx#wk__0yKIB>0Zx$)-Dq`=wXH#X=U_w$;#20mC~T)lBqor7-(i6Q`JX+C`5
zxq%IJfIJR+9?x{IL~E4r;fo-th<hEDc*H!s2Jf&2Bk+P<Z^V1xmv!faJ%ZCnVi1nX
zKN1X6q7TKC*?P-CzrS*mIkw703G=2>1M6e{J@73{T&Acc-m%``Op8%@yi2_j;|O-C
zG0A3<s>*BnjVHP@j4?a3?G?^aUAJ@|?6+e^ht;xqGmRGC5RiKdhf;p5r^SIkz+>HI
z8!V&(t^|gs3pWTbDGMt}Gq#yURrgu$;fj@zryJfsm?wghC*rz?v>$(3kT=<5W6dYr
zG~yEx>RcIp0;H}&R-H7CA!2dr1CJM$s2L~2NLQotm)=bJJtrr4qD{ZvTH~89beQkx
zNlRiYt1P*R>^Vm^G+KOV*uDz+*~>?<o9;SmIj%hOj8Z!*{l!MM18YSNmorP|RI4%e
z-X{yLcmy=IG|a6kX0R<@e+|?+YIo#Ed-~qDv5Y-Xl!eVKA)R_L@J%=Ryo;uJcO(KN
zz({)S`#R5yn;k5&6+9Bjb552`OBJgy?S%0mpxcrdZwdm45gnfW&J1E-sY&3~rwTm5
zlLhaUwnm|`^g3m8pKKMG>Iaj8OY?6S^*o;*q&81qf|uEBDP~dnblQA%%wmG0Zvghh
zU!^MpHlu9Jskj^Zq|zW|Lo1rLQVOc7mv>s3prJ4|h#JoU{=;QKNRgQYpWyvV)`V7E
z4p!4s_dqNrC7SPD1@B4cNs7h7xdX|2F?`f-kxla9zxH%rwGC17I^gs@w$S?7UDIws
z6lX`4$tV2OTs-5eN!XFd2d4Wyo6WDY(g$vR={@@B5#h6!BnTh)r(($rSrG|_*i*ht
zirI+WkCYswuCAG_?ZtkcW>np$(+KQ_`EPxc8%_DqH@OFlQv2=|qfh>N;w>S}Y?DV0
z|AV);42r93!!?lr!65{9NPyr3cL?s1;10n(NYHL9I5dIaPOzXs65KVoySrQCG%%aI
z@Au6)b4F@vs^$+rsOm0Qd+kT=>weafHTzyO)+k`TYsn>RmX#fQS<8XjNqM}&na!*A
zN?t<1XGJ>f2j!-ig75+olNDttqB-;T8SSQ%i!O^=Jr0M0>7H8@<PQPv;=O#iyb%J0
zr6|aU{oNmk4hl)w!rD5~t6x7fa@20HBzhA0ea|w8F@H%ah(la1S?A9_dW?g5j(Z5X
zL?#!<dPgXsC`-CipLO({>}OWEgbVZc+HgHQHc*Xm2%2Uhg=0GA7RR<5o|Wu#mYr+;
z@@Gk+pITGTy2iA{(PhZ2EHPjq%UD)Tu{6!5IL@!Sdmha4N?x7MNkkM!KX`+_AHPcX
zX!p86h?s4(0Gy>7KJFxAAQX&0RLU>gKrf=s$dbkmb{uNO7*YmjJ6EE1h5Ky7d3sFA
z5CnY?$V0|@-%^bJ%8C%!@@`SSFwbCyr0vE5mCbL}??MuPz}8HIJ=G|#^~PV>;0z8l
z`U6iZ2_B@RceQ44Kx6^*=n3oQI+Yq{PZ1}E8}ZM&`6q%nOf6+d<>-<p8^{MkxBc#q
zt1ku0t2W0RO$Z*Fw%8p}WC45BUDm6haIc(I2d66{EsA|YA~n={k{~S1s>0FEz2BtO
zY<eG>0?3u^j9gP+mH1C{4^v{aejbS?+JM}|jRky4+WGt(#aGehQI;RYBvfjrzWce1
z@k>{PBEHtt7c%O+Bb^b;N+*ImZB8R=Uw}skuRD>aH92cc;Zkv$^PN_G#GiUej)d(!
zS{o6=3i*%LE#2eO<Z18-PiJko*D(Q*>c~gDUVnM~)fQem1LjulMuA)7=o!2PHDU;(
zhW<t-&*{I`ZXLW=ysr3hJsC#Dd^*%A$JOUQf>DpAXni?z)NP^ONpqp$vB`=c<AVz9
z)LD&a>pFT4O3MQe;wv})GFo!@#mP>_K|+2*P35HWN?iGh|Ebi;fN$ix%TY{%lqGdl
z6q5=bMw7X2NXP8cR<jX?dSC3dg=dP?d)5Caw*M_}XKRc83&U3PZZq?r?|AtY{(d_@
z1VSVph=QrUUFh$VF*anen}1@At~|o}oOm!RBB>h-)2##Tu~rO|r~;*rZ3I8kcm&6g
zkSHc%7GcmNjo@pLYXI%u+g>b5))2bEImt%0-_L5yLgM1VIDS=G1~_ktNjjzMk=;(R
zB=wMEMxN<UAV&t``MeV<qPSVX3W1V_+nLJU<5hk!jv_CtxOMU)`s2j$d<g+(D+>*X
z(-D_Qr6Y7!Xi2V;Y8=lN{CP&gdhx&RtJBchmIMO14nGizy$}&rKqJC%9CDhp4H%E~
z^vNJgcD^JOWd3+SQrw;n+LP6{V#PBllKlo$B-0)1xGvkC>$tok0x?HhnI){eG{7q8
z1xIHE`(yf0RFrc;2v_KW=?SXLle^(tg-xc?hCl4x-Fc97-@oYT*QbCBKn(aCM44)2
z7@bH>{ZAV0$2gBTtz7Zx{d!x_kyI?TcK?nA8kgJ9F3K9ZaO_uR{4vU+kuLosmxL!l
z74ZaJRXY`*7=4!KGDWsd2rF{@h2&!MtPou(EC4R;nE~dz5TvTYUxjaqD?hf{c?3>5
zSZbg|r(w@Tx0P8X$#@5pp?C8?lkp>v(eKPgwo*%MD(c4CP&<C<NP#$8r9rJ0<=Kf8
z$xte7A}L-0teWOOtELL9TBH&j^9AM_46l|PPesbdcfBZek_yLS+Xv-zcFk1N03-M|
zx6V~&#Sh83$#0l-Z6$uA7Xe4ONhp7FxZ<?C`lI<xE+#?W?KMX2rX`fy+xqUJ$;g7)
zrV(S^YBfw+5Uw`lpS=okysxbOr^NoJH1ACY_UisI+x1wxB$*u3fW*?LOzZ^hZ;9Z_
zKZ7uz=C4LG^Aa5%Ik4v$>_!g%mh%FLRom60jh^HaBO_v^v@%}DD;~MBLncelkRHXg
zhm_t1yd*XaD>#MQ4`98e!EVR8WV(*}TD~KXZ>Vjvh6JTn91(9;!zGXnKwykSl-hy|
z5G2pkaFMDkbkmON^7w*pt-ji-MD^0fmB0<BoL=*~2gynV?|lOv+4P!>+Ar-@N~QoW
zyy9QDU;9mC$V16kOJu{olT|}-1utGjN+utYC{%&#i58^1#HNwlo>ommDEN`U9iM&;
zj&dg@OF@X8Y#pbw4FO1(JQUe)nt6o8otn-dH<SLx*_>&Q6#*|w0)w@vqo6*oZ=>6?
z8M@s)usSs<yxXybE9WA}<g7+;4AwY~v5i&Y=V8%lStH6_*W|(yL8nQZq1c-gn2ew<
zw_MUI%B(;<Rsk7Re}wB*`9N%|zV8d<=_!GeyQM2-O;~C5X0jo{6{p0fRtNV`SjvX6
zJXt=GRisQW|3`;AGH&aKwnUVXU)VE-%v0GccgbOkJV$v^bZi@zh2mUxvbI0leY)hK
zNH+!>;W|ilFN^7{8!-lUECEG>EC&pPcIVkQ{eKk%0mPwo^RI%`^TcImB1SE2-Q@9}
zEn#OV#v2cFV2m|yxP=;N4qeJEQeJ(AHz~n}Lfll4taXlWl?St_OokQ28Tld+0!k$g
z4L}<!esJ%EMB5Nr>(6~M*JYQzRYml%qkHv*P*c~BAL3pMA85oyx_`5!#F1-VWcj*s
zexPOTcnk+wPIQ1h%s%vl2NE74*W&~ssv^$?uS7XNH#LR_I@kT+kpq`NjF``8WNhdv
z%o)P^kBqnlW@(QSl1j{LaAGPzXS4s6{8a$CbYPvCxxNY6?Y-X+iXiZRouJb*kGP2q
zJ60Dl_nLS1c!ub$-hTm8tf5_$5az~x&P@-%#AlHG-iE?;qjnU%!xIB%FJ+<G)Qy26
zfBWKny^EcGC_Vf>2^K6wEi)m0Gp_-C&rEmvBq`xMAb0SC<yrj2(roVlx|OhK#F>W<
zzX=74uIW>0{@>2l3i)L1AmXiwNWCe60}>072<jRtJAsshqazzj5+KePkaJn7B1Vxm
zXlL82G5)L0Wccr9f|M5*g(tXjlY_BH<ty78BMo;EpYt{Bej2*Vd5%^|6T#@5@V-E8
z1hu!zZCSm;3>kynd<Zc|d`Zl*^~0mK7S_dXMlPRmlTfAm>!TWQeZ?BT`oa|qdLQ{K
zLkgY*;rSP!m|tcs8dt?*`fN`uEB7jT`+22EYSN(os+-fZaPfJZ#z<ocTr1K5!bNgd
zYAa4V5-w{L6#WSamJxCLUUe75>>ssFLR%V*s&JctYPMAL0@;MOx(*(SJMqlvJ}j;G
z*KO9qV0?;G8#x2^kf6Tbr8t?~^Vx^cP!xI!K#J?ppx`ssz?$n3i9*NR2#tSON2*-T
zAXCh3q2UmZVGjyO<9dN9s2CybSury@E1qs}c>bW66X#&%*Y@HU23eCCHVb!np|cYw
zH!r3}6mN`HN_i4d>+2*qliyB3(bm`l4B8WP0|n8Et3h8VumzCvp7y;iJ@el>w9pgT
zZr!{V4YBwWo!2TvpTNmeS&}D7s*&;W6I$MF560Fe8;9X5lB987T$KxmCmNU5u5&oz
zRDaGYIPYvOF}IfTk7Eh1&dV%nzY4VPUvws9UMnziAohY0);yxAm=uh)Hh+G(L@>as
z=0`wLoFMxly^y0kuD|KPjisX~POkl=DGHbnbjjw%neyhh4>mBkx|HIu)*_l`;i(n3
zUeJG{ncfTh#BhulB*;$Af9wQy&ZeGc!-c=yd4Y|EXPgPN?T$@2g_rHMa%1<&I@pLS
zS5`MC?;hL+9Je`2vA~KEU>)H>|H=%Ppo}<5$WlcE&$>AW%DaCwL=j=zZ{7cULEcKp
zi)hq{3N=e}%rwx`a9A_XD=~c7g${YTe4E)BrTy{4`Dbx>Z23RQA(?Yz_LrZ<KvLdD
zFodX$at}k@g%kNC2;zi}Le*Fqb4igo2#<bzN^+LOhfuGo=n3k9Ga_rp7P1U1qn}#{
zp)~oemXoan|11v2MipCEBGv1sPG_4sXQb_PmauP+qCl-*M==SqDik)0K~?r@<2s&i
zx>zXSvI1+@Kg=iTWu{T|C4@?^I&9O0p`d!OBI#1oIj_?!yiMX;AnP;E+j5e2(^?WY
zK>bq7G~8Sht51-`DnvotVSYZVJ&?n|W1<Rocw@DIEvCRo&hIoUPFUXx54uZ6Kt<<>
zM7feeu6$gT*VPv9k3io{q9Qe>>^AFW8!ld>|3@8fN9`~PD`+v~I)KAP88-=uY@}3Q
zWT_L-#F*O;Kn3*(1UnS*TZH#(2UXkiKH9mZic&Za9U|^-UP;w13;?bq8*1`uZjeoV
zyr{sIWugDrIKNTvXOa|oyd4@NIJzW;T%vUl3vK^t<+~TUjBlO<+hNWax5fd%!*#S&
zSN@YD?EM$|eQvT1r5%R`er~61U7>^bFV)KD^5F)*1z{oE?U8rd4w>2-xn<7xz|Rb%
z4ytQZRuYAB{N3Jr)IqgAdKL|V{|Kb}tL`~bd?5qD0qlvzwd!kfFG5n@jdnd^V2P9a
zJSnp67*_N_rtD9>c`^I*U#jp=d6A%sLH$93N|Tf@<zjZnNeJ}{n@HuYbqg5^tKQ{;
znYT4PXd6X?OWT>KJERt4!-Jg_SyBid^AVSR2joXY*b((|hv9bn^`%jK)v}jid&ZZ>
z@3~l9%1P{DNBd?Yi>@i2_<#PZiC@t1$Ag81dMq6H^ELKe^)9ry4UwZPKFfF_5d5vN
zRb)Tu=s#&q{|UVt{cwh9z7?8D)1LxJYi(jCd(FPW)V~R7xDMEUUpi7I;VDU$uKsN$
z-M9Epte&7ly#BG<7Nx}H;}JoU7CW9y@=cyoXV4RymVTskl*i5ZSfS(uf<ED=Duv`7
zRvU}spGDz{RbBU0!oIR_kZNrVXFVBBr})LTSGqEf=3NT&DuZL?b1P3(e_FC{fxnFj
zTnM<$H4-qA4iN?5CvW^NiftTzK9Bl@SXCRB%G>6+e<RPCB13ks^*+&;5KHU@P)G0k
zsUm7VF$j&**_WwkN+iK9SrMK|NYVqFnmD7Hd|v?-WM`U^->?Zi&ZumZ0Xr>HNmf-a
zF&*u%6dv)tOd62F9setZ8z@Z&vHg|8G5#xsZ_9XAFo-bcdXn2$8;jEmU!TF%CxCy~
zFT`^CWu{OF6^5mRV64kQVVui|xvPgvgCUeL9xT>lZDGBlrvoX_<WD&*kOGs1a`Or8
za*6d|Lh|1v8@<5R-4M~9`pYNoFp_}Q5n5Ol{RuDmw}#77$Gt?PL#n_}y{9++X-%D$
zgGqVfq&<<QTKmx+XMzDOd}uRxkP5@PFhe0J8qmTKbC5}A#HaD>S6d;WU><mOI_j4e
zVyXOv{`@1aw+8%@RYy<@qrp7Ms^oeZ;~jQuI%E<d<IEel5VZnp_l3cAzrZk?30l^y
zNem1>R9Au^JN)OII7mQkQOq8Z^*(?Gkam6?aY$@<ePfK7&wGd8YQWHSAA)(`<H+Wq
zHj>HnY=d^KH4M-7*(_Ls`Q0?P5Ff(#EONCj^QaK~)5l62NkNFU8<LssCL0~i=0!J9
zi)90~SguV^Kf5yW`B5m7pyEGa*Xt^F%<w<E^c(SY>_<4Zq1!w3=ISjmvJQ_f=K0`l
zJ;Im5XQsLi8=L*ptdITET|H6x!NF%pzgULN4W2&R^)aiUAW<Y)MB>f+;sIW+6ST0m
zs}kYY5R$J>{NIV0Bu*HRD6G~;L_V%tu<eTTGxU(sgFDfg)N74bj7(v@;LX5#%jFW4
zf~LZ+ypp&o5_&6^s&L?1u{T`S-wLSCH(!RNco|ETuOdwP*y(?PuMfb*AZa&Y0ln0S
zV6{N!3c-3=pSlKzMd%_X^sb6W?R^a<>glKunYc_$`ul?etK9qhv-%qf%iho)mzP*t
zrfH9F28k?x)mBD66kjt>jZY?Tx2Ps3qWnkrE`M3+liMLd*(aWQsY)T`o0nC)pQYgI
zLDf_3v(mC<v>_J#=BhkIv&ou#ygcOb0k<d5icMx<U35(`3dJ5jP82^xCsWb;lv=ms
zS>Au7Z;E-X(@M~!k`Kw&Eqo5Y(4)`iRd<AT`?Bbdc$>cAqa77%?mT7uI5ID$xG6fo
z)e-pIC{>{fpFRrZr1sEm{qk;c|2**vldDSUz4pja5J%uniEl8IJ*27LZ|GJJGxFtz
zZAyw-V{_Y|h6{$@CQ79f>`7Y5iH{z6H;pJkOQ5Q4R$aU;Xk;SwcBs+Lr$!8&Hx*9-
zs<~He%_Er)Z|R!DpHu6tg(rp6XyP4+;^B_Bq!#Sfw$k0#=&v|{sEd8`N7?(z(ql;M
z{FJLY#8WcNf|A##P@QYKxY3Dv&wyP}uw)98seL72=57^D+8x(gp&cQo*Yr1>i^<(P
zop3~;@aBgNR*RVr;s*OlY^^>Q2pB-G;47&c=0SAEvOWxWDEi>Uzw@#}wvh)~w_nK@
zP|GY`RUG*2n?>%Z8iI2IBn{il$}Q(3JU;e8G7-bG@9!chvt<H)Q)B7ttBCi|to;c{
zR)$%mxz7<0u7y#-q_L6hI~E?kmkwa1D0`n~b5}(rt~Mi11+vGY2c&o%&WuIx2Zo&t
z4p8*%hwo&tqs_^567D(-6c_QsX<!S$XV<e@-3~LU_kkA|VG&_O<MqKk)mxrRe&o%Y
zc{Ph!$?oZIC4bzliwf)<6>Jwf=zV)=e7Hcl=?Xsem_3^FNWL}q7U{?5Go-s=)k=~n
zX95<SobzPK`&dm&E3vZnd`#iJnVA`RsU;`3%a-CT3_2V?@<M@GTp|Q(Fu!&C;iLom
z$M^3NYD^_R5teEDH=7pzfvhVD@QPfIfMnxH{D;Y6^-mkpX>Jg`@Ccf>P6yoH;coWO
z&EZ79QS<L=jJ&B;A6^}x6}Cz9#}>T}l4j!xPf00iNaSBX5IvcmL$~6)nnk>tZ)l%y
zyk&ZsfW+P3npOubEG<nxwoSFN>SwoEL4{WSfM*hy(m3rQ!$mj@Xg0u@SrHdSEk0qb
zk+mTj@PmJC&aB~AheOrKY5h&mn0t$CqQ0sXUe@oD;}ib|A1zlu15XPX<6c;BLv47E
zX^D}lpZt?Jq;MyJsV&|^?IF+g)_9As8p8LuQrmf2Qp7)so1#Iw7S6*wl@RGdRVK0H
zlOp5goI<q6eF|%Ef=dwtx&bV!_kkXYLAu`p-QN)gs(y%vfA0O<g#ihu5xP@qP~Wvm
zGL#_Z1AKO`zP*`&_x=B>&R73msPoUs75AOq{?Rh@D2{@6C6a+XV{2M^A1S74HpYOG
zKY8cl|M=h`>4@z%aJ*vKaC1IPh&+OcJ-M}hznMrR*>Y!H{ORm|*vtA6YT33b_2Tow
z&&1|my0tb5LV}nZ;8^n(vqBIRo1=J0VN&B+mT(d_%1<x_;~5ea^ArNdk=BKW4loIB
z3={gcZvM-vSiL|G`7GKpe%;)`)9_{O?WRXEs4ixlj()7guG7?LV|EL2Mp)p@m&n)}
zDd+!A26@1g6(Ay-e~C!9A;F;gm33huJ;_n`r68BqKZ`#}<!Y5A6-B3cH22mISxL-I
zu>TBovSO3R<;%3WGX}Y=3k}30Qb4I{-GKsyOmRcaNW;eyL!i^FvX!jwUuvtZ5kNDg
zj#`T-Ju<Y@{(SQuj%i^tpnBh;>q`-3CvL6rv!GS@G(I2-e{tj3DU$dc_y%(|%;?!$
zu_ZOk&WpY_hIGfqNEtmojwT`NX0r#OU-gZ=`LB!nQLtK_sB5pb2CEmRn^2*jg_h(9
z7g;%>UvFM~y&~s5_`_kCzp3Wt!$qHH>-v<((4cAS0OekZ^}m?XgHV8B&Rw_d=xifJ
z#btXmQ}jaHnP3rer&jpB%ZeTfg_fH^$D%W{5OVh{QpZNMKTEz>i`BChsZ!^PnIh?B
zEe~EKokl2!)#J+5Go}$zdkQ&Eagy!xzn$}vK8HeseR1u*vaP2ZZMnmi_m8SUZyh0r
z15+Q7(t8!D!3@qsi=h++m-(&HlkCCj&LHQBjT2mLM@L6HZNz)j-xcwIsD>iS@JC@Y
zSLxHM$DigEh{+GZ_GvD5EJFPJ_K4u|7`g}4VsYyO<%?}YC#0r_+j*{-mL1{i*36O0
ze&*d*1)TS1Bi4K3)&6(;vjvpJT57nrv}oj^H&DSzt&Mg8yBSpwvdWQG`}inFCU`bG
z#DzUZl+i9BhwX4`aZzGi^g^VPjKk*Dc92%`Hq4X1vlU?sZ*1v?&9_~J-9+}s^G)F>
zI!r+TSSYs|BOQKsg};E2g*-tEUwJM6%l6UF<JNqyr}$oGy{JZi*G=7|Ga+s-%x-1G
zlizME6E`P#ieMim>WIPW*>6sPyutv0JmRiytU{pxWidce4}EqUdMV=#l>8{!5!7_K
zn63t@pPylAt9E7cC#dOnm4*?v=>3#HDpr8h3?W04p!KL+uYw3%eaf^D1}OPglx|F|
zld1L$9)+8-(m75jL4sN1`1sCS5}p2>XghGT;5ta`cGCYsF4(a2EpZdmgR7U}CEkYO
zN&U=}{4Ru&&&69$%8C<i;ljh=Vde!nOUW6mAPND--o*O*&OSjWI)<<Rs=e<Wt+G@s
z0;;rOIZ8=JJ}*Zn$eT2(bc4@0C*U69SwYR3+alG7Kl?rq+#vjvCrs;PKbmfD>1DV_
zCvAsFoV?0T`<x5uyH?{jB*=XI=PRs3GddA?t9Q`p03pCadSUm0+c22PBlb~OSh*2c
zbu;#i_UbfgJFX8Cc$l998+vNbv|Cz3<wySe_5w*rcs6Gb|G-IIP|wlh^$3aG|Hv<#
zKfI<^JQw65Q~v*iFVs*(I2n)%L$l+tN=5Jv|ClVuhMiIVB^W}sMR$+AVQ3F}0K||I
zdV&~yk2YzMv@$|lwK`o<a+J5n>BOVDJ0{ff-a&(3*$wmObn26rLCpgAEdsbnw{ceA
z5LZ!l7}@h?13RRS4ejWpnAMHGXera|c_z{KU$GwK@jsBI{+Na)X<|-W%y>hyIq<g9
z7w*+LSVUrb`rUP1yZdi_+I{qZo5}Cb$8BiNfLjZH(3SOeZam&(KB_$iV_$*FpbC=_
z&5~_E>TTjO>&Dm)oz}HwN#U}N<ph6?jMxjh>A)6EQx-g|E>h1{NoqO#J--87wXG~U
z%rkE%QM2S#%s3BxboZ>E4Kk4^`Bd~89sM;qnYa76b}>85=b~6a;RWA$f7)wH$m9|5
z<gPgyayQ&<2-AXHYU&qDmFxV>N`1InU^*Wwc2vhM$8d1K3`7|ZIyJM3!<^1*gT<|F
zU0w+u7wnGXl}(dnUM~yyFhr4!%I}voc^&j^9)qt@7k!T<{P*$_NK{h6(0zFOqXpO%
z_^doHNQGDQcJ-1jf^%_pR;s-DlCJ4I9Oj)q=c)1NY}PYYsi2g_!n2&DC9jg%cw{%w
z?y*AsK5*{wesrjMilq2ibshAK$#DdU(5N)LX3@fB&b2R?PQju+9n8HI`n|(DK#4~u
z(|yLhf50o2Zh$aPv{=G211jTnm3|dJ<19ldYbH$(Zk?X|<%cD__Nr@Mz?3N617@P>
zk~w&tM&Y#~w|Af~rr?sfxMFLocax_M`nvP=QAnx0@e;W9>#~8%^!mB3`I)5dHdwR3
zJR!q4ewfx)!|q4g=?z(Qd0g;G53)oES8*FDachOcmIsCvVUTHL3Hu>Ueuad@;!gmN
zs3J-q_@ALaIWV|_rjd|0On-~Hm;_QMyhNEW2PAiWETt5;u$1N*^##be$|mKr6=vW|
z6oZkS)l$XDg&0N?;9qgU-$4Q83>`!(4fMEdpZU_3RX^e>>}AHVJhMFzi<%5^d=Y~|
z7`Va$XM$DqRDW0*jiA{F<on6Vyu_DiCAUIM57o!5V}1R$vReSadIlVPkF8Bf9*k>&
zXCNY#4JDF0!cNPGi1pFbQk9NCS|<cogf&=-DtQ?CpgE1=rufCDuj#u7Ddn2$UaL*;
zu1n;<bPPcK<yhIrWz&)hkP8Bo7&4*LTZH<}uQ%rhdhup>I_owhLVmvuKR@^Njc==l
zc{nngX?n9Q-hUumJb`;m$$Zs-JP)sTF=nH{mP@VF0f>`vDO_yZ7>(D;?I)e4znRDR
z;A-ig`sTCxzkM^CbK}4!JQW|6N61YcxG(4iY12c;beQE+qav^R;B^RVrezBmTYp^B
z$JtMf%>2Bp+-{U?=tCg~>H2g&>=AKRDml$yrZS7#v<lKbl_%2o(-=PcBZr<}-N{>Q
z^EX&YSBJPMZaZtLIw})~^cRBPm|Cdd=*6`HM@-t7ZCGsjikOMT0_n5d1&alK=IDSC
z8W=-7tLXuxJ;;F)@`S3it@OFwsUThj9#A3%s;`qtGWxBdq>~Jh3=9c=f+J`GxOFt2
z$mKtNjH*EO%WD=-10&R!t^Eischq;QB6-$+kaqk8_y&q1+Eg>S5}!ypRT<&QEFJ5g
z7@(_4N~oiH%_a6d%;7>Q5M^wL6g!(`$~rf}0@cq7H2u!&<Ob=yCS-eDhO_a{YX0TV
z*NnD}u^;c&rMXAM=P@+w-sZdAVnVGPLh1_5D;uAeHBL~?*^ZwhA!hnEq&|EChit2F
zlpD0LG$a1r`vb)L)9Mq+4$mF{5;g+P1d()h@UZYzjACy(r={|%3jyapuM<a9KxcR&
z{NCv*<@?xohlhvfGiH!CTAI4nuXR8DIVg6$4B@-&L-Bo4AA#+C_>0iMxeK4Q<O_7C
znN^-?VER)#EEJbEVEywKe9bK0C6DhXjfrSaQmeKrC*XOwzeh6C4aSujLxaZDENll#
zQPcHb^$z;n>FdsnE78he6=V-CsqjlBp;KA-h@?8S?2GRij>H$0nv57{bT*5yaDeQB
zuJY%P@^m;YW%^=6{V@YQ*6szW7b-`+b841AkR$JryF7xgN~!GNj=|6GNy~#FrE{oI
zN?)OL5O@`Tf~SVOh=zfw^!V3y^m#nD?PEX3Eqd!#0=4T~l_>`+cFHxOs|@c4^V<${
zu%@IM-j>wt1l}-kT6$w1BKY_4QS}@nlP5AKOeuxk=-UHE8N(Da8{Fo4SVy#w&Y#yx
zNss4M#OE+*`3RJ)Nxr=4(tTx!vA9H5blDQ(7d?-AZ~6G}_V%O$vR<@X@Yujq+N=xf
z$@Kha7R68S8ybFBb*)8Da;=3CT=Tm~yaK*bKBu?Xl3j?1o|eMcfZZoXd5X{zCmQ2)
zW~e$v#B2kdiO*x_%j@kmJ^@+16S(LXJ8T)zkUk@8i4_0G<f&CD<~;-)S1E>PqT@i(
z)R+PALBgyXMT{3=*NQ>w3@GV{OfWM8RYy}S&TK1!zyq-jCleNVvQ5B(6E)#EEc<P?
ztb(hdFrv*Y7v;ZYli9VSiIy`B7T~o+t?xwa;J^|mW6r9g`nZmpvS!<X_iUQ!G0BMh
zIe{+6yUZV=@@7bRG4n#1fy&a$9DFakX0V3+XZkqP|KLJMX_lBnuP1y12akJE!|&k@
z0Gw)xl~McWF)Wke%1ZT=N!FhnfQ1r|qk>sAx+I^(-c$B1j{e}+PG1sS_%-eS{xinz
z2s@7mEk#rlIKwE8Ofd}6^ix?Y8Weh6P~6bau+w*kGWNavxs3DtNItyl9z@rAwrf4}
zbJrM3=EYbxI8Es=eavaLrdu3wryWsdBx&_D?tXrYEf;YpQ-X6o*3j6Z1~u%0o+Y=5
zXE#qAGiqWWZmXibk?cy!E@BQ1y5&Lq$q!^Hae@YvRfar!+=g^hXOUpwlzwOp;P#}0
z<R^S;92k)05pZr)Oy9G&{CyJK$)g-B$Or}DZE}k*s4#UNaxWjhC6A8tkDdydmGJqO
zG_KU4x(WrWCkWR7wPK7^dRK9Zh6aFpE3P{5BM)Ar;A<nY84M8Eh(w6<*pacWni=?x
zttU9Y>g}1i{L*3t9ucW0F2YS*1xvMX?rHd>FiE?W@Xd_Eve3o(;LM+x6;TKkGQo%r
zPNl>1K@ncS;?&b(=z$`JQOanH8Q{QG296IMXCHc`&Y>f4hRdS&`<;E!D=jo>@<bWs
zu24ezJsU9|)`O7hv39yb`la|l1f7FVkkJ>pOk&AbW+xvU@NOEFQPr4&oeopPSXcNu
z7IzVuEUUD4pr|HkRZPyvRGv3F3jOqzu|db_ed3+Q1;jEI#Z33=G-;}MYzw&cx+8Wc
zL*ZW1@Z0JJC1$}^ccFv9`2Dcks1EP%T`8MoDRAr*`X!~DLNsbmU35cHRE8&$Ko7mr
zqq~t~eiN@sCc9{rJ@w)Jd|zg&;<#h65!jr9Ew$1rGVx+I=q7@#Iq7oo^Ky7Jo)%TH
zu94SnUiI}_M32Um^(>x>kobOCL)n?Q=5&I_@BTqy#M@V{gg-vDH!38A4v9Yc0ArVk
zFI`yZ2UOAp;`5bK^AFNMx4W)0CYKtzi;Zk`PwL5a&PO=B!4?L*t?z(zqB#<<8b_4@
zhaVmUtFDH9_^_?-h;(rp0nu!!eD6B1^5}|ue?NpGbQj$h!o@pYCOX5|o^IYQ^vqoS
zq~5k1Iri4H9fmHndV`&4*mILmf~WG_A!}08APo7m)A+~!!3hQX$1zxi40&%c4C+`s
z?KEx#7oL1<ccEms3X0Q?_?5!W#+1}@dpl3IFZ;l5s$X(g{cb+!hUUCrmUlk_1n+U0
zH$8&R)@YHE4OlBb>1Vp$BAxHLI&!z>Z%ON#P5$A!uNn@-Katu6iQZ8wWpHuih(hcn
z)$oI69<K3@313M^lKl`_Q^ga$CQCSP&9ISv#!}E@+{hFSk<#GkFCGVM+Z${3j?NA;
z?dJb7TmN?>#O#xzQ}GhM_4IGBUg=YOKRo;ovW2)VYw!QXjH-Y$*>WJq@Gq|wYsSOr
zae1a=1SIU5WTr-}XfX}|)h6QFF(3efOpa&(>ofacr9isF6~73tLL`AgOdT5sDlYt*
z#Gb}*LbNP0fH3H3v{M}f^Y9vr1f;-~iT<Eh=hd=lNBW#C#CPljKL-qjP=CCmrJ+dk
z5R-`^*YaHP)8MzFyyIf!ilGJ0Ss>hyn|5K4{)RMu5M!m^YleG<;g?w^a!`b9lZu_%
zwNiH%{Zlz11YalFcKbb}(NMMs>J4tj&~{=dp0qa`ZiA;XOySsVTov@SZs8i)=46@0
z{p2HTQ6*DOc*|5@E}Xpo=I*nAnTjI~sDA|44x&|KnTdQB($n?~-u3*IWRHxnRkxIV
zyU(5nv9dNFd?1hNZNd2<5NjSHBBfZ^sTZ5(PO*C=x{^!D*j$t~=(>Rt>U}+9(%@;O
zf8)*{F@DEW(FeUnx`5h7ODTdu8pHI!n_TsKGi3dvx7*a2w(<g#qFe8(UK*FFO967K
zxmv0f(XGb&M@Hf3Zvg+@&BPVQ(RoRwO697}9^n;{QYk+Scb4hLmqFWmhI&v$wl`{+
zWgEZ)SWLoFXeUGU0AFVDLTNX3#G67ybO1)`&=2Ggg}JI9bbqMzB>dt~h7YWL7KSU0
z4Swx|r1FNYuPWB2ub&f2KJ7O75gRMl$Gg`wVw47JZ6*i@<Fy!%rGyBRhP&%#OChgo
zA1^STQO;huLz5C}M%GQVFxNOrBe8P%W_l%rrYShWk?G6fadYqTJ~!-!_M3los+PQ{
zr7gE;>EZp3w+LxSp&w{@1Jzl$==*qc*gS-&^=AHjwyApf_!XpUv)sHFj)HApGr<Lt
z*hThSDmwAvPmrf?Y~4redHb5Y@6iI`nnu2EzjQCEhD8(}uX{vy4yuMV<?J@&u`)ro
z*0J~{ck^_`8;;F4TYaUU+I=pkM(GEP+-J?XJkLHB$8wl;$CPX=6Q&;7*0uZ0AW-_8
zz>8L6XQATJ1%284mzVJU2T&8*lZ!cQnM>6;WYjhqgGezcghIQc-+*%5d0RM|kIFxP
zC}D1y*-_)N?%KST=;WyO^SxeKSJ}NGG}Q9>B(i+zojO{G+d)g6gtygFH|oV@Q-KS>
zFWy1h<1CeYurgcACBX%=Hcnqf+2ZG0R&E|FO><uk6GQN6&Aq$c7~S%9O1(vx#M_Fy
zHHC6aO&lY$D7orkh&$$ed0WN}f-2o!rW35(>iQ%B%@&9^Mka;f2tbHooY*9IbBnZs
z$-5*Dl$<$d#SJy|*KPqom>CwjdST#oWAtr7RwOuDWDU;7#zy_z7h6Q0cj+AamnbN#
zYqziiRCakv4`FuQXj2hQ{Sm!w(h&mXm@kaRBYp*?Xw4?Z9`Im>P>wvWYw{ZTV%k^h
zcTE8$D>dY5!=CuR$L`g?%a653nw?%gF9+PvNXCOuOHRMq*qHVAYx?D9&*x-<u$@Ql
zu~v-{a_(t+#b5m_J`;%=-O^U{egeiET{r-_Aq*hCS5ffb-oqhe*V1Rj+F*yf_%A9B
zS0Z{T<}D(S#+TyyXuO~ziKXv8@@43xy%j_!_HKbA65E-m_aTJI+60M(jrE&1{l_6r
zRwrK~NHV3TJHF^BR+fEe#(L9C>_Z@?XDK0|lXbRn)&KG@YIqIUpT)fmMoxIAsB?)6
z`SW!H13#?e!VW|nAN0NU-#>V6r;;tf*?5h)x4f<Rntz1r+np}#NG&|fhTHQCD;GcE
zIeoS0<sO2-Zv9E(=9ueuPy?ptuad#W#87*3bZfAo9B4|&5#bJ)fD`z<Jhif2dF+!D
z$9jDy6iN^r;y5kQ4~0Mh1Io5@dYjM28Tf77@|1G)6foVkV^zt>^Y3(9OskYRP$*~$
zKEU7P0K*YXjB#qhK&Qt=IjL&BZoafhKo43tP64jy(KHjS!YF%0EnJ*hy<}}2_-#WK
zv+}!M(EY9Ddp`^LcPNNF7g%fDmKDFs>xU25;q0~sEq*ZS=wNgb4bT|IgD-I2={K`f
zEdnaACpAIHg_Gc@bee>Pgm_ZFhW?w=S78!L**j}s<d7^Z5rE`)m>^f<z2iuFa{Fiy
z1?d*T0Z^1QLg(e1M{1nnDD=TwJ0`A4h5wud;L4W~bcY;CpImJejhM*deN@p@jn~qH
z8dh%#j1<0&S#PT)!a04$1(Qk3x`Q{>$KX}Z`o5EyI0M!g0_}UQBA@d9JNu^p@9f)P
zWBA7_Du+-c8Q?BW(>S5N7NkX?{7J)94wln9!e!g+!6}Expp(@|L$CF92VDn!L>6Hl
zGMR>x<HK_Z{aN`t4u=nj24@ktd+Z~aA$VIC>UR%q^S?&EaSJ~V*LhOhLtE0_{R3>%
zyZepD4~`gAT4{RvZ$Gxf9`24+2=$%((Nr`cEjL@Klk&k9jS!JrhWi6c(eKL-mo-ls
zb@JqWK=Z@xzV&wcXU*nscw1GxVIrsoBDva@>28%wKjMOpZ23)^mF3t5pJ?|_SxbQD
zHfu8t*eU_W1B_Z#O##aX3PTRtHW=34?p{_xLiU7!Pf~tu(jp3lSHO}7bTPD&ds_d?
zl#Xq@Y%<Q<x`zj_s4|nXesF?8{TU*IOFQgyO-g$lj4)znca87}d^4Z^74??Xz80&r
zw!JdEoQ-ba>im2}V;UAUWnjq?i+?<5Ka^JIIxw+Zw3e_cvAba%lFIyL%mbd!<^$7U
z+8ZNMywdylNvmVZBW;rcQ2=V$rpi3^hFinOxvvxT0|-dD-`(g;1bJF#VvD9IXZni7
zbvuJeTCQhiECa$fh>)aO;3g&&U<D^dr<Hk1Nuv9W{X6!LNrJc2cTkx(Lf-G@hZ=U|
zy)GteKK%I_a!jbRDhesF$k|)uciC3c(-Y*zw9e0#NDVY<RK?3(tG3`fmXem0#7d1!
zx~^6tpSgR%1Y1XNX)UBt?zE&q5a-_^1A4Z7MpfTDOP)aX66$VF{7RnJLl*)D*14e9
zI_+wP=C~tgeh+1?Sqszy%m59GXJ#d4pGR>;kVX!zYop<skHB+r{?4AkhcYIRU?BwI
z8?f4|JZ^`VeR>7Raco-A0K;J^qe!ah`)s)mCoESE?5ft#x&<_vIW&6pMKk34TiTxD
z&n9R6+$5X+aTTbjHv5(DS1H#1__;YxOg=|AyBWM=`e(c}yLdO{q>DcYgcxL!|Mbp@
zVLU&zQ8i@jqhs0{I!;r0GP3<cux|P*w7zpmTeKWweP@|E6(LL5s}bGJ29BW6e0brt
z@e^6#3wTOb6D+!cZBjQ;=RkirDPPRiqX0VPxlpk`KPO!(?-2*_KkOd3fToIM0r~0<
zPeew;q;@^H>AZB3Kz)40!p6o<Gj7v-tnmtbF6D6zA2uCJN1hf6!y7K)Un)<yxH{!}
z3Q}v9Mw2bCM3zQOIF0!YFKZJ89~vgqFZ4`A*!u)^x<y^<Xf6R;hZO<v!&&@YGl0s(
z&o9T{%sAb_*Jo%ur)(oE)T{;%=BgR`b2~M*i~cs*>d$qlGvRzLLDC(aSn>athhxk`
zXANrLP#*r??>Y<jijqfCzm`Jcw-FV>8Lsn6C#pceK`k{w_C5(AnZMddbm7|DwXdm)
zxJJEZy5wz1Q?2bi)t#H@*hILnoa_-^;RQLZg+<l|8$I9IHrD}%j-BWpprQ6||1_Z$
zSU;F-k8b@TB8?#wu+Gf|#AEeA=FRv@IY&u31<%5HyiU{Y&ami8n3p_s9P>}#M#jO%
zWdwzjvF*p9LYHA%yt~bJNAFP^kLvfW5)Ird=*IIZo0`&>Jk~K&M0^F5()hk67`W?*
zWP6kMN*Qi@0x@W3kazimSAwCJb#X=nYker_!Nu`QFEiej<v>z4>~Lpi<qvQ1NUifK
zoZpecTr-A~=pzhjV-6bS^g7?+`YPL0g7xsk!!0f8ODnob0N^(I#}U^ebLZ$Nzh)Vf
z3a~kY&8u9wxCur^=SFMu+gIl~KxGI-!1F)!nIl>)x0A+hDvOk!a#TVudSVq=<(SH9
zX)sAP(z#qk4)&Xyf#$JjF<1F^>Ai}u)S1HbG33e|#e~EAtK|Yf)>kOqs++SZKJEOo
zgC@jd0Nozey5Cuch(@2^{o9Eez4p3Z4H>sCNVj<35qD|9C~R+U|4Jm1d|&Bg4*2a(
zFsXxTWzC{H=^qqUDLc>G(sR*2kCvIf`I^5HAGW<p6q+}#6Ve*0J#i}%1o|+1lK-o@
zky1zhGhYfV#q{35GIH3tF(L%t%+3Etb=wt<_*g}*^?CDG4a0q*9%wets;_(Be;|kz
zkib?uAi@&mjc3wX-cghE<6141MLBn-?LI4^=G)hJLuhp6nZDf>Htm=FWF1e+es0Q5
z&6En?7LHr`)TGeu%(&}erlY1*S@HNf(#o7|c^SxmbsZw2b{0Ybd#~Gltx9d(-YCKk
zBfLA5Vk)g|JktCrYUw~q?gC2=H+1-7z7vB8D!Bv$`kjr2ug>B_u64-hPZJ45;)7nv
z8{3C7@Oe9WdA6*{dl%Zn-_WaF-Ln0Iot$8COxMfZ9%+xUbGDWJYhP@kci6(Pm%c-I
zn}hcKEIiqz&B9$bbF61x%F%+iVkDdbH=y5DRS{T%XCKXfyLGY)oL+Y*5(2j%qOZ@w
zPP-}|dI%#}c*653TvR0?IFFt%;`*)n)DJh(%i0k41(5BpOc~8L3@a+$Jw7Siwyc;W
z3$iRQ_+dYI#7XT@KmWI$biU6Jv467e<N(g3nK~h&)w7}Ae+F|md`dIu2d}?6RgqQe
zWGZ_bnts8QB>u;plr^h`rj$Y~Ea4v1oCb{RW0yRSK>q-(aK=a8L6c^;dLHuYTI~Z%
zeG<!v{!FtIUl%+XE1HgUMU@2Z99u|V3hj%v@1A@C(NuzYGyHzCcXylISF;waq4bB<
zB->zl&bgB9^8THc@L^MKgLKaa^mtECKjd$gxq;CgXBFfWw?xi<4ASEn-395!7x4l5
zWf9J>W-}-DaR0{?@Chd>_alt<i(B_yrY07+4P}lPdJVZ&Ul-SVP0nxO`}VNwixmgF
z=68OI+AnvJBf`JS*QDxw|M4Y_kOOGLfwm#*4vA!u#94C9Oa?!7R)~T3XPGncLx&@i
z4OV^_fJMjXkp#DDpyB%IuABFWyQ5mU+!6E2vkmc@20UbDEo&KA^}E^8YZyQCMJf5i
zQ%F&8z;`NwX+)yL4-3G}>Xi}R#UOH*O?|JULsKK1GEr;l!(Vc2Eh<)P8e1V}*~5>g
zsNxSARlA40-bXpyCL+UtsHYK~$U*{4T>}GrjTk)#iJuxvzV!5aq$v)a8TFmMUC@Rv
z<z=}2g`>rHPVrf{I%t^KL;h_hp)kqZy<k%e25f^y#YDTn>QZKL#P(vP%EbM0#3B8X
zabf$(S7!7J;pxd~|MVlOOk!!(e|J~4^-Sg@EyQcYc`*;?QU4oJ2;}c0+yA0XR-aT#
ztdb_7>z&oYc&CpgAjSN`anOgbONUHcpCF|2e>5$*o)GDh<1lBf`3vJAelh+K3gv%+
zG8fDz#?g!{K!B@4&<SsdSl#u-gXVe5Xoc83d(E;HQ&nL8xS@~LAm9mayVi-lp<-p9
zptQG!=wmx2^_r|WT3o6cYIU0YpU&?dB%Sl$j2J%H9-s77AFXqgYUMq8S|VM?CUz&`
zogX^iDyH<eH~`lhg5HC+m4e3{-Z$308@IeF`a(aYH=Fv|YeB>Qe7UB6LT%ONG4jzq
zFFx_Cd-GDjjAzj9_|GfH+r)UozoMNw%p<w8rMH~@aq$?G`0#MmQv6$JH#csl@O$*T
z28(VL(fe=8{F^TY?hdMGE8lv00&V68ye}bGrD@My*TU$>h%M8yKT3uu=BD%5liV*q
z-e;yTW1GMIdS4E{XR@yzm1a<{9psrm3HqreOUF2zyk3gKh;K@mT9OMs`?C~8_D%R|
z!R0)48793enVdC~EZ}Cteq&f3ch6F@5KG~?fg20K?ChB~^j6xf+f2}-x#V4Nl8A-i
ze9Qrl(Z!uVoEM0W9)qp~xkvT3^-R9t?*REEKE+O0RVfD5);#Cz3!$NGtl$m1`10==
zQ}p_cSOu$O^Muie_g5EkJClk@kK3Y;a)9EHUP<e_XKQqq(s%P~+OVI=qnTu8*?r!A
zHwaHzl@dvIRRUXB5{1IUSPJ%b6jmU5Z%tKjywfcIu=yQ0f_*g4art(tW@k)+Ef4rB
zmD$Q>5>a<(9<SF|jSJaJ>-UNnhXJFC^A`-XkERXh07$5MB=_3MwxPLs0z+L6sqAcc
z7hNGh=0hmLmlutZyZpT1jA8)D8AZ$v?TsL^d*IP%^`w;*_JZyPIEP2R%25398MEK%
zA?thM;9e{KC}Oc>>udXU+Zm+aOk{4$CjNxrZ~h&ZuOM!fgt7r7FyZSN2d)DuIgW~=
z$4@ieX0OezK@S>lND6z)&zg|#NMgAtV$t97wm)i??_(a^9=}tQ&M(>b9G{?kj55&)
z7M@0hstDh`6^0H(_;3A*)6B)3(tAG|(H?ZOobIXrv+{Q{$#plWZxra~qNce1Cl%L?
z(}H5Tb@l6giL1QV^pV(maqjFUpm+_sv8_}G$?c5KUrf_mD`kFS`6>V^YTTeBtVIxi
zzka_=N_1he0ej5c{L$!2RFQYlCy{Z<tN%^)W=%oi{qn<uy4QB;)x<;fI(D`iZM(PD
zn}a=Fv4V$7n%jeM;_#kJdSKC%S{k+QJL17xMp{2rKFm0ExLI$LFNluqV*@>1Vt1<j
zE#};oV5&y0vgV#BtnmGZo3}9d{%jP_D;v*`OpzaSs9JDNXDzF&j3p2;x3`m#J+W4x
z-D3O@jjCkYcfbhm;Ts;2!SI{vDtqpu&3HLX2^hhn34?|oF)qVLK=r`Vj^ao8b;Rrh
z_ae*p!y)612??SLd}X95bU!;M!>Tr-*n_$I773~F*<nCTMYSk!N{K63K!GGJq6J9&
zF7zRE{Y6hz(Uzo)m8N|t)7(#Oy|+XDwOH9uYl_`2YtzE%PAJfCSUqX80$ECcIEQPa
zhBb$3fbmZ4|J{hY+yBFeds0K=i6$xH4tw-9s-ag?!OVMHi}qZJFb`1G(sy9I{qm!b
z=@N`*Zx#D`xY3;IF}M1db6}$rvBo-EspUnqa3jo+_x`r><X%qsLLRoY-UP`NtS1;_
zE%*QmWl<EJH6`+O^mWX;YslQofjZbTwYz4StzCa{-Qj71jowp{%yBK~nHY))ZMmAR
z1um;;OMhaX?a3E-PMF$zF`&7DE~Z_AWV%qkclws)0nlT8WG0rilGu9sfrP@JS*x5h
z%()dW^SjW+u!V$eeLv8Bu6l{>k46C-kN)8c+(co%#NJ+vPqWpN5;DluKR5@?RriO`
zP^jSNdSvfX4(&%&)l|3^2A70X;R>E0ceV)ucZznMZNHzVF;TUbkg4bQ8Tt9AdHF65
zSE|7<p*4;@uEFRAPckR=uQI+Gr<)u*IFLUGE&vz&>kc>8Kn>Scc)fx}Brf<Jo%Y)m
zVu@2C`dC>iK4B3EM`k4e7biH?2?6Q<W?G(m-8>fkYh0J-w%fpDcl81RsA^doIhrYi
zO~mP06y<BLro%pO!JTgKuq92O*0ZMTLUGqqHeHSS&N()=WChWs#^fn|P|Vw-Qg*hM
zqR<589_SUNxI)w^Y}q{}G8zB4W-v2s-Mg5GZG26goYKLiP8t~JoT6tM$n@Mw258KZ
zO|$~bub21xMvv;n-o;ZxCo-Cv%QnTO6E>rArnY5ubc>+7LmO`EbQ!wceo61yqeiIm
zZ5JB|H`%xp+SjaTGetka3Y7NvaotM9qd!ze;^XVhyBy|!&pR}X#%mesRE+V{+4f6r
zxeW1#xG(!&^-5YB6eu<)hK)E=qV;a<HC@grDAiA!5BTcH>C?%Y-2v9yNjCTezzN7u
zB$iz3vtL>hYoAl|Ca5;IF$ER+Bq4vG#JPbE2|^s2Z!F}`)aY_VZ#Lo>FAY8~YDk*$
zj?z*JCZ!(je|z&jz(|h$CMZEa)RENgr?}KFSX$0`%eabYQ;srQ4C)RFnUkMk?&YQy
z{6-+A&g7E$Q}n{S2fC5{PS8i-N_h5iN*QNLQYuT&yHX#birxIw6xP>cv5&J=mc?G;
zrxK5TG|H+XB78epfony5l}`gBMFUUsC2Dj7sZ18uHTL*5$#QSr^PW8n`fLk{sGL5m
ztxH4Er%v((<#-fsXd%K1Y%OPARBuh%`Q`%XPc<9rl#^PZOW^Sk%3#V#-za+5askhr
zxAT<r1N+5M{qko8_gkS<Qk<5<+1B)FgV=^=IO47wt9PR>)|-r;-S#YAjUIkpDCnzF
zJn9a*3Byaw3%q>9O?P?NgrTz?GYA8^9HOt=A@@WxOfH38)X`9o+_U5}HZ|VVu)rY^
zC^UA7Xi-@hO5+d#(O8`@!`d>!CCR?D$D0EzC=tUz{?<DUe<&}#!hf;|twR(9cf$%Y
z@(LbFK{#LC+F>D$IS)T9^$T6un$BaZj|7UxKlL+9r3=X!X&!*jer$h8hw(el0YcZp
zq1NZyj-VTv2k1+Kt3<tTj}1qSnD!^Xeg$furw3w-`g?g0cdC8YwVta8DJ&AItUnUE
z6Bced|8q`k6DzYH`gN}ZcUQA=%%^tMp9Ipjiw6oom5`TXINs&j9Z|Od%#t|phu__@
zB7p-MQX%}VSrz$KwYKD2p>EI6R8i-UsLkYBB1j_mm?tm-FU`^Wu-&zz5<898km`fs
zCxpQ4ei(u7;t6VYWG#KPJI{i`Kp|G5l%o$;jw84mRIVJILDl|c=zGzv@aRQ+Ts?2Y
zi)*=0*FK}W7aF_mo=!a-I$+4_9~?9i5IuY$?{`Cs()h-RnWY%!F%4E>`#&7-uo8(N
zAa+T~Wd1sPnnG9K?R*(Z>Px@di8obDs6DX7jShw@TdNw6xfC>(MRv}4ehFChwp+hh
z$b9ZVdN*n}M2GCCc&ujlzM7w49cN}0Pc!LwH8H}T++_mgUdCWvj58u#M%gHNM)v(x
zs7Sx?qdV{Y)*PT3i8c1M++QShS+TQGIO>^zIwn(gPAD<ncV~dAQu7Uk>03;cIvB7{
zHx@krPo)LP)IuL6DfFY~!)snQtVnBYB`&v`UP8Yg-JjTv7s|hYzp6Rv1W|^_ZS|d2
zN?Er1@Ec0+5fTDT!mexIE@7dBSG<O1Zsu{7%)x59<p2}Ju7p$L<s}3-_9WZ^IcIXc
z6P*A!4QBm~;<^X}>fhW-x**&g-*by3{UM+XIa{KG*@mm4{t!5kgFvI)I0SE=aFGtx
zcExQFih_7TUQLU9WA>0+okd1>OWrO{88;`YJ|s?Lid$dC(T+=ml<vofb&}utbpn$M
zcvN_>XeD;CYLC?%EE_)pw_Oc4o}?aqyT+ZJ(3h^pp`T;B`@g+oM@I9IVf<M)<?Tbn
zi<Wl^Vj<=zqZv**Yy7~G@si)UYeKI)_oRg<)C2M3<0Kz3C0u9^8E<iDIrjb4P^1;h
z`A-~!?j8gO2l~nX$!D2O?1~SZ&{44%HJBSJwO4%7$4JBf4gA&w<j^3R?}iDn9;^!2
z(6DBGMlJ8)V<lqXsp741Yxj=u(ezc6(SSE0xSuxNb=Ls8)7hkJ9kn@t3guxLt?vhO
zhZEQmi^29Xqg%XK?b++TcAucYIr>gWJbLCuEWru|8CBW2!$a1Tmzo|Se_35}b%}~d
z;-AvDVIYX`W!Bb~ML~WNhgq<07%5XaplbBF4si6utOy=AN>qLV2)9VF>tWN?lIzW8
zqRjaop064;sCVyb`MR6;f8*<|qoNGkwqGTrq(lTs6$Jz(m4+b%L}EY%Bu504?yjMv
zyL$+g1_`AZx*LY>7&?a>U}oR=ywA7aZ>_zy|LHPd?&Woz_i_G?;}~1jPL>Q+W-W)<
z_rHFG2szzvyyWVBhdeMq^$X@AG<04rMkD5-2Y$@#+8Tja^aPw~tlQr~tJ`B|vaAQ3
zJQfz;V*JNCd91`b$)zZ<yYtSBHC(*7yobYV1YRT-sjT6?0LVF#9C5LM2iqP;Qnww%
z0M685D?gV*-?RL0m*>9w0*M#3<dMVGVP_#?w*6aovB%v<sY+p9z*lSfd*xk?o31Nc
zA1A>TNOZ57rTd4|#gNodurg~u{5)H5Sn*5ZDJ5i$hIlCAsJR)SOy$GFm);3IDZM22
z9O)SO#;TMg83Sq<e9N_}NqC3!NW~~BI)3SAL)rCFBK)HWor^3unU;%l$uL%7p0l{}
z-doJOf<S>Oqu8#3Q}fb>zvv``<Bj102F?~4b}QhpWcJEKlcLiO-odVb*8(sjBV$4F
zn#?`VUVa1piP%32H|vFH1_qCV=B)|filVrXl*Y<>uSAHdFn*8;xcj*1cPaDs$loK%
zmanOnaz~Uw9%GM~-*&NHJB|EMs4ZOcx}jr*Z&WTw91&`mx<W{J%M~y34xOdMXLA6t
zh%4G0@8#@u9!USmSKoHdyY-m&TP@4-+3Xo1q*sEtM<coZNin>nYQ$YN$)MA?<to)0
zE`J81ZCs=}S(rhmzWRF1Zk!JSZmdff`ABiqT;WwLjb7b;dGT~7vuFJ2&x91oK<1+l
zF+|()%+P?8w;-3U&mtG+t!bKjo&K)LFT5t3FW+bwnweSsh|OhG@w>hZ_(6nPo~fbH
zl`4f}{@S6uuTQh%HFfoOR|eB+EFJm|zj4@I-3uL63%q7fHv%v=^7WMmAm%4F2R@)*
zYl%9nQSpqPj=4pEEQguDWXdL5p<x4}ZJfqk6NhK48w*3=@P6cR@pJl=7iE<a291D@
zrO%iS@O>8I9y|TXyW-*``@uk`cE4l$i))q;7-qku5^Z*PcE3|eRAy?zK2d%g>7F1`
zvw+=L860!9Tz#9&vyeHU$oHALE*}Nczy)rWuNe|GVxdA~V*oz3jH9Bp!41e6r)0J`
zOTQIz>WLkAbuw#sY|c}by=(85<4&&)^}<%e{|jQKVv;J4NN{X!VE#KHQaVF7aVrlL
zjn$)Wz*xlLASsp91C`H_FUc(sUkD;31#evVwmx4ggP)y%mBp}D|AJR|e7gKYr4Al=
z^AM=t#8y^vn|v3L`q1=)B_!nWB3Y%6%A1lP-NbtjwG0`7prI1lH0MQqB{AwlDOXTf
zr&u!{5FfJaa{P6B^k9)N?G|uyO0+^>g>trhe9eA#bp-BUL7p=oFgs}BI#OR{D4{d!
z)97C-WfKd!syR=@raMgO?OJ?@`FQQL`IyDD&u0JovZ-KSP9S6_jGbP%$Y%hQ8Lu7S
zB2j;6K+bqXU~L;uXh@bF9e6c(VH+u;dDoh$J9dqrKmld9*F<7N)k+n5ZtQTM;g+t1
zIT<MRaD1V2lxHtdNFQjPSj>I=$)J&eI|tL)Qh$SZ6ahQb&fe?^Az`kufYCaI95Ise
zh_IdC+JZNZ(kEx4Kw96F><Zr}DH;md2Nn29B=mQC-ZSv*&#=7O9%|1j&&Zo`Hsc~}
zQn-Qp0enLnz&AJ)@4OfBy&++3Ry~@WmfH-Nc8O}aXxAwiZfi5xQU=mx%IcjK(1}LL
zH+-mfy=ye6@%_zfBqa?`b|u|+O8oYFHU!#IY)>@bl*j~!74Zt({yiobgaR)*-F)aL
z;e|lXresn&itz?Z)^g;f-HJtyF#6y=Xgk4?=nPi8XY@GeyVzGAQQA?uI3A#?d&nfa
z!7IOv)M2mj$b3hw=5NGzhkj4g=4q!$wKUGV=^ga&`#Oser8<>|*>Os+ImOGX0s1Nt
z+tMXqEW{6ZT!%4-ipK<8tQZ7jJ~8&#8{1wVHWYJ}@T%Aj#2%Kv3HN)TA+8@_`wxk|
z$<6tP#3u7_D~xI;%irToR%fl{Dr>vP9wD2I$IV&R%NkpQy;=v!YkUOEHM!Q%%bDi3
zWg2}KDdpdRe4h7;<BEY*fy1b>;PCn3N^>@=@68}jwt-Lb;G>dPg8C}&k_Kx;C<Hl<
zK*&<Dsod3QNhBHumXDPw{y6%{tK3x8#yAy9><J1j%F4=lB}qjM!0l3i*ggr~bW<@p
z!T`fRbyshM5(9QP((8U4qiq{yGsh*n2XOUl0veXNk#rRoTVr?6YVQlGbg`2{$aTno
z$o7k$Kra2c43E}Bw^&sepyppC>e_Wb)rd(lHimkRY9=MxZOQ=37I|@*T(xweQua7o
z7Rka`{s)B~UZRa~!TF%89-pf%AEoLE!8y(6aKJ~Xu+RM7X}{sDpnI~Mdj^6zO6)2n
z?)qVI(R4diDGG}egcH4A0#q^S8LMsONq*2+l=|#5@<|o3!#9XTNs=Cd=k9wo-wq5U
zXZ>9-e&TwpKH{@I)OVh9?0LY7py4%WO!0DW#;3vK#N2$|Y*{DDS8-z9tjx?^o#bd%
z=CVbWU_hdZ2428K8&Wdd_k?4}ZTe0lc;f$gCDe`o>ndKP_{SNq&;04~3sUiu*H`H^
zvpPC4Pn_*TX@p+QdR)RcP!IVH5*iyZnkFOfdI>6bbiGc(DYe=DPVUg}OjKufrSX7F
z*Vas36iFOWGTpPnmdD-S`136XX1yU!0aawV%ocU7s^bf+eZ6gGhQF>gicepvY;ktA
znwpkUfkgp}*Iq->yn89*g<-YeX0$x);|uq_LtK4oFUQ}xPgwi5V<$`NFyoR74;JQ=
z8Y|YS;+OzhhRx;KX(8rVu)T__bQ#;Kmop)7-M)4@W2x{#KpS+>FJJ)Rb_3bT{0-`7
ze=qiaRZdk25U(DmLzqOAJ$W+0Xt@SukW0(~@Zz#wjVUOAH#TdUCNjcP+vuK8u=UAv
zybpT9)`z_anAup8&rp4^BJs+blkIRz2j;PJP29RaAf{5hnj!zdEmSgXTU$Otl?q94
zv=Oa@ek)P2<Rk2ge^+dB3s_<tJxX)=O1i6gK+gghj^{{91rOPIxUZ>+bQ#~U$djBI
z<E1pe?-kWIBahuaRb_KgaD;KZ;|TmRMt`c7=6{o4<lp<>{33bpO#9D3xGu?-a-RX~
z{r>-nFOvNiUz8Osvi~rcZ{~HvR~koNm#|~+|Gt{I+{M1!;ZSM2Eiv?3D$(V$P{-pS
zKl~e;yO{I`4@(!{MYlC(R3UCN;8ko=zE-1KxBf&xS`www==Hw?jA~;1Gd}IUiFowN
z=vi%B&H@1;Xs5s~bs?JSey>l7f!HuVLFujb|AQr$`27b<)=HoLzqw?+$q-<p*^)0B
z;9x>a52K9iC|UMjU?<R{QaS|1oYMx5v^CI#Hkc`87thg0o?krcW~N^cR%0!Icr3m(
zGkqYRGlP?1$W>@Jht9i7b99`!y+ALQTDsdHy19B5(1|tWYB(-A!?8se6O7u{{Z+O9
zU~=gPxIf{j23eAV3R-T*C9p8<d;n?mH}(vkLF_@}WBrz52Q?joc?NEoxQ$;xqyk_G
z<B}|6SNb323D8PiJL-?RmS^ANX@n(qmj>rSjFjq*SQqv+=ONPrahpyy(DaaM*eMJu
zc5lUyb@_CLliZ#Ns`~yFX+zK*S3JhZtT<zCaEjsBS2Y?IeN;A(zxL?VtJ*hOPo@IL
ze6cumO1l3WZ&yHg>obp{La^H`Uj*I-?M&kV%`W-0yr9hMWxlJ@4QIKA5U_oFUIaCP
zXbQ8#V?u(=y8x(34+K&*-2_sNlV(k=-+B0G|9paE|5i|zI)0JVP<V%n;<IJ3NE9?E
zFIbl0)&^0grHObsCD`%PLrvO1I&wph@*CX(ph64it6l&$^fE=X%={|`*rf*@K-h}I
zAV?}}8;_cuhnzO{4l_?NlSg;Zu^(<Fb+XpU1AYefO+}^6jxr$c6tBo!Xa{~QoD9j)
zNIF}ed>U^0c=jo?-j=3L0FCmjd-Yc5uZ(2WgOOyx%3;)g64jKr3eB}*m|1417w;1x
z6)&%O3-pG)b=dRrmMdWC(Wf&UylaX+EDSr)>F7VF44|=m6CAj{Fs<S&t}ZN)_-o-O
zCR_G%ebFFmpCWotc%9*O^XuuSOwVHB#?mOj90pN)$?0RbTv_DARcPZko@{*YpsI0A
zSwsYoiZ;7gBJUQQ5TW>lwOHp;3TK?1oC=60lXz~>A5EnVr(_-|AUll!j<Xz#P>}P2
zXBC|oY1*Ol4am%DM{=<b#ikma*jb>BEcqWC0LL&^jSBlc0nu-Kue!1L&$xDT!DV?$
zb<x1f!jxRgTHV<;v*<)bt?_sJsb$vf!jL48n=UURI{U^ATkZ@0xJ8A0hP>Q|Lp*IV
zNxTl438MLu9ZE{yk?AMD4M&`nHloc=LJ9Jy#yrDQH-KLp^Bk6?dH#M{hjrL+6!aoW
z;j;WaboTFI2mPoYxkO&UG5PD`zft6}ZIFjSf>o$N5U_OST0{D~UY|$1X&qvQWXR*^
zLM#E_?W1HPE}eNI6yj7z>qH-2U}5Vi*&`oDn<XI-4WWpNG(5K4{Fz85p#kWH-^K!;
zyLr|?ZsJsS`MjG~wUr1<(<kCnDCGg;-7K*-kH-;-+!N#WA||h`jWx*K{7wH0I5xJl
zf2ntowDFWWr7w2&<mI5hs~&h3Gi1=Z;jUxV$IKr9XBY$S2pIG*UhLxf<r;=HwFoR~
zQD>~ne%u_$JZk#QZNf46(L4+MVqk`^mrFK~={WXN@{g8kBGm3xFPA*Z>>%6u5vZ5}
zy3_p1><#A>YajQ<-mlgOq321JUgM^n2e{Or&GVW3o&CU_DvR7S8zEA9fw9u8HfrP=
zt}md%i7)c6`4Z1R2LN`DPw3M+=ApWMPs!2-%mYBja>k0d9uZeAfX~MIS@*W7kid*U
zL^u0ND7q>Ul<Ea|@6<h`sgR|Od#o7aoNsaSkZU_;ZKvdChMq#ZRWzdn%r0<@&G=?#
zUZgFmtAj4ToMOF}((Joy#>QhRiAt|{g<=Q!-c4TG{g4$yHTAxutyjb%w`;2Rbkb&`
zZIW-}DkY=5O)@DQ?kJr^I<Be0_7p;Jc@sMyK@K>(Ahmy5fcUN(7JNnPKHlvL*67v%
zyCJ%-YNf&Pb${<ZS|AF-&`OObHkI^PB8f}=SXA!<M3XTdeaMY-ZX*(KJfs?oW-5pZ
zEoL*B`H-2(B&5(2D!1>h@s=)s$6+S`_7WQLJcM;w{iI2enXKO1;MF%J2!b`Mk}-dh
zJxN!a`6Zl6^5wVEU8nMI#DosLfmM3RQPb^0yCI2FQ(cos@<qqY+-=vVtDm1-QwJ0I
z`aizEnu8#o--#>Y0ST_HJ$Zp_ZoZmc^0w45>7g5j*nS`Qwy^cfu=Ge`QZAXZC$w=p
zf>u_B?wQ~Gc+Ka>rI^>==Vf}9Bra<n^>>TfiBVthsE|4V2SD{QZaqZQFp=l5*<y(>
zJR;JGpuaj#ISI_j-AY6v&Quw&<}wAWu=UYUVSQGuAgh0zrS#fER1b^JrozcHT5j{T
z!}2>9JO!nly+Uyt*D_*yo^1%lU+DI`)w4@S>tTpG>bJkpooUE9jYqm|Dj~Sj#=Kor
zNBD4W+3Hwz`H;(KuZM-Ap*VQNVd}Im`?4iCwB83ll*CZ+Y`}Dxk0BZfz;iGl*~PDA
zHL=GdOUe^|A6_k+{;Q^E&Wxcv$yem}O;3Yk%Zrfcw`}cJO5anR)i#jYk9BPbdL-Gh
zHGEbC|F85fcg&KPA!nck{0-hl&P%dNn*Wvm<@Ao38P%a~1M3}Kn+i}$NG$UcM%4@R
z%=^0<Wx6nk+C5^dF(gq=qX3njhSZ5}{0cN~aqYn4fxqD6^@<amKxym$!Em4T7Mx^c
z^iU&>Tk73C7PLx(Pp2)|8=6QI(>x7D`%M#TUgDZ;+LFF<j7(Uhp|6QL#q2VqOtFH*
zH%pkkrhi8rmM7t6{l`$p-JRIomz&{c_WNC3+-9nh9k$=vi%M(iIud%t(rva{-d@a3
zdSR8J<WD_mjBwMsU`UlPkTAvhbFf7f#|(rCptm&P#MH!ktbM@rzvr;~XM)2kc`*#p
z$`X<kMKr>vrY&IK@>fD@M)xIz=z!UCq&BXbgM6|tz8~<fJWCOC<tw04OAJj7D<ZL~
z-Td{Gs@s?veKzk7E`2vUvGUI7h;x}$5%?eOJY`ICvLutn<asaooK+$vwFu1}TWcIE
zaRF>fL|U>hQ^xK*dBk}DU7=r4EiYfbW`lX$+h}gHdL9+LZP*z>x^<i$t0EE{A&jI|
zKOWby9=7X!nd{~F`DeTa@uZRQF+wvEf*2Pt(8splx>z(CFVc!uaPql*a{_t1AF#OA
z@EB&RhoU!gUw!SPos<1jTKc5)%spT1pb2;L432GBj)lZTowF&Y{Ma}G-^e_F`fuHd
zg$q$3JB1eZSd9g&+KZlbL@J1pvu!GH!Y?7@s7~p5f72yB<D-yDOs%<Go7rmvuPI~J
zp}26k2Ji6cuCqiYRQv$e6i7tXG5jFaZK5|*b*2XMOVm_<rap639yBX4Iap^u(Lg?A
zd8OuKk<<A?u9L}Da)-d=H>xUie>L)m>304>5(`vnrNfPxM2_Rd8{i$r0KVTWzuA$B
z$$C1WYtMIWw6C|Zra7NU!quo9Z&}xmtlW${ka_pK{;FVma}(Q`w?#f_&8_X)zJ|cu
zNIrMLO^KH6)QLGjG>Xpd3V4M003A92SZ+jCe&jrQ@8b%&)gzCC^*Xn8TLoc%K7@Jd
zXF-TrRdf@`rm^y6j$gAR3^3I><Ue?GX!x~oYX2cjBXtX$fEly6YC+L?0hL)^u`uZM
zHkM8KuEmz<r*?=$#Q9uuXW{>>9qg>oH)0RU=4R{QLc!cXU6J{a{K~~5;{QeJ?cI4k
zw|O8@udXD8|9@LvWXvzo5%{|#@;(PWz`S*9Tns9J8^lQ@ECFDv9Faf>{5b`|+&%>v
z>!WFqFT)$a#Irw2YZ=jAS#{H}@Zs)Z7K6j%q+x8Ozh(}Z?QQ#ZAjOUhSCyRl#$#y6
z8=5`oFLk?eJ*SoWPs|>3*ky2+PcK>R5I*@v>j#><D>4lK$*`LbIi4pHdO^T=lVO+f
ze2qyhJRiM#YdT;<c*%e1ciSk0o6gC51FV#zL!Z~8R1!h$cUqgdWL+d9RN|9j7)^~7
zb@}c(?mT2nN(77-M95jaFAlhj^}9SNm6c_2)Y}bbn_MDi34aS-yb!mdV64(138z=9
zN$PWloeuqUcFLpi$-deYtTWw0Ae0Bdb|ulR!t0$^BhmKaMcojC3}~qi+H2V$?MELw
z_Yr<(R;}v2|3u&MCAOWO9r8_3x1N0JJ>(Oozo1EC@9ah9wZD1r^N?@fE|kP!WOJbo
z6n2_Gr&f(&%XAd`DaQp^bO2bsNMy6@xg`IyEWg{SZUl!Z6_e8w@N{rJc}b1EMN<L@
zD2F*>3-zJ((`qX`DrJ%m>a8;VE4o2=6Bz%S$%<_{$iB;hozT7pcorE?ZS$Vr*Si{A
zq!??Kzj3Pfc{@q7-{A)oxhi5mRg(Wcktb^)yf1%jv$SC0WSy}#UdMYhna_&O{-+)W
zsU&*%O#~H?u%yORbO1wrw|(-R0Sp+I{tqd?lJLJtc_Q}&*QPO_4k9WQ+J0sSK{&$>
zz{x+Ubb7U6mRZXl$8d+UueX%7yv&bljrXN>dTVxH+m@F57na?sepR{|ZDEYVG%0Fh
ziAL0LEr!@Rl`qa|-YBTR3kIdMg|5(0vT*i6`Z@dH5A_Tr6iO9cS2Axq?3T*olPJwz
z7_sTu=m;@)%F5G$4RIqAudRDr9>yijF|HAPT6NKafs^FJ_$W`yd%1Ed21FE<pUTx_
zDn-BnTF3WEa+e2sbDlWqM$_*m9#fdfaChVUppwk@-N@0wqJ#=rHEX9>3#@hHlax$4
z-<WLJCiB1niDn4EMSs3Adc9wbIQaQq<2Mc5C>DV<{_bhP75irmFRN5wzO`_|w-J!V
zO@N_2KqMxTNLM3qV$BHOS&LfSG*+Se2so_(pfvXv>;5;j*z=#dk%|_@HD4Y0U|gKB
zg9M}@WJPr<NfT^(Yyh$j5K@~_GGuD3D;m%VPvw-Wmo5BX`+}6V<hX$DLS+_Ld>ji+
zJx6LMPE`r9sNlJB19dE**vJ>pml9t@HXe!fc>e`rnhF{`{GZHd=vc}E@T_PX$8RPo
zq~)~+!~Y>w8^up24J(1yVY#a@P}r17PWXlo0aMV}HZxD=7l2}Axp;O9<s#=9d=nUZ
zKlUaWd|4?;P{OW-RQHbVWL=bI(wP_6yJDWfi9H|(4rzYW^d)A`+;w9(cLOmoPv+2}
ztb$!^J@6|bmq5qqyBs3Cp`rbaQd9}FG(&=OPTc(|-Q>&|f$B2e>P}j|AJIS_RSa7s
zx7<o+L>91kZGO-U{xz66vtJKlj}6|Mv3UI~vp?Ou1S{%zSbE(h@Y{f5_s@&~tD^cb
z|6s$LM12g+GfpbsNHGtnm0wR}nZp_wbooTjtNlc3*pBmsOd!L-inr4ouyy7pcliJo
zO8wfOQTVZ&cx`TuWFrk#qUtc~f1wF+j~%Ex;82I})tV2JJI|@?E_6~|TCWme%6H3V
zPAlg%bIvprsF08~#N1%r;=5;wf8D$?0G|~6fLPCN)3JvP^Q!7@mT_W=WUG$$#vxmV
zdV45PA47n-W=3y^JF_o9t1rob&9wQWdO{|r<L<GkVcD0hfg|0cWSWkyMl3z{6yo(q
zjSM-s=Se1(Cv5Ir1zLO*)K$hp`}ivXw9kDc!vE&ux<kGIWj&d9{5d!#72D$d3Gq%c
z?KAts8O&k<y`D1hU-gkTkWISnP+m4YaZ`O13sfKZ5i=|S_DcMUq>BGZ17`-}2?q#@
zAnG^uM{)E??dh}iL|!_BnkmC#%Ny{N+8rQcE9OSRC-A5Hed9?e3>o}2`O##ACk<Dx
zuk{7b7p^Mbpua7_AJ3Ac;Fzw%kTZ*FeIGIk{SH>V_!Fsqy+QG|*xTDH`8m{hs}-qd
znm`3jJw>RDeD5EFP<z7bJA}PTH)bs#T8d>vCdRI;*f2sneml>c-sM@oS*3BJmg7|O
zE61~?AJ|8<pn#!MHjfOwWY)6zA9C8}7tLlrizYxDzv?pfeneh;D-yhZN5xp(&(rR@
zV6RtSpi$-%VfI+WwTek1_wFhYs<@1^Po5ReM4V==nTTCz$>pWEIT^ICPY22jZmov&
zvNLhVk`*r>-2TA=IL6NuV+)H*J9-O}c_0yqSqL$p4J`YDf@3gAlWFQ5xPWsL=)dY$
z*Tt?-SP1p|mH>g@?fBK!t;U1@pI(FI3zj2~7P25Zi_Zjl;L7i~peL9qyrv|7)uh{&
z$jm!P$;2dn+^^D7Y@Zuo&KOt&_wC9bc>^U?{phbr29vV4fgjYfk}Xd{d^6dJe5<{A
z*(s?>GanH@dGv@7ikI{B31u*ys;#`?t4Be!Rn?EX8oL_rR=}@8>kiO4b;rWOLhG~L
zv#)spt`Jy3h31KdURAA~1HRWcHe$_&uWjnP+lhUVq#l`dEh1!iv^#R*%Q$ZRO}COH
zHKn?oe0XrxhSVv_ebw>&?irbsD#z8z-|aZb`<VGxF`UD@PBr9`oOzj-VZyL$fbfmv
z^Cx6!FiHBi5jtP)%$e!lR5TG}w;8v$3MNx+5~F%6c#E6IJ1T|ZCg2tkZkJy6l<|uV
zkxB(;UIH)~!;d0C&q(f!{bbJMeJVjdbh=Tl@TVii8a@@{g)WcR!Y+;wIgTf$KAb>z
z;;t87L*hJ0kGRjkc~sn%PCmg#^%nIbE)P4py)DBM`;&-J3Ln_0ie0mLz#)*oFRbHw
zx$2Y{9mmvKPRFYn)o&s)D2Svpg0AZpuDMo7f!K{9DT4fcV43^Gxs_BfPyCce^XzUi
zPiZMfhOlZm%7@%T(o5{t-=Xel^p6J_9{6Yg*Ho|Xk+3dNX#Z`P!}V?AVk0}g$?~Ci
z3FLZ9GX$!uYD|*O0|yex3V}8DhmSPMNpQf8KwZUV?a10UL)BC!4UB^Gbd?2gq0H+G
z;H&zne^xuutx0fzOQHY#dL1OFS&MiRXWeooI)6xZVG9H(aGZWivkl-f+o|F;$RN#z
z9W~BdCnLEf8SMLb>p3Cc7E51k&||xh=PQwk+5CfI9}W|7cEZ{EQIX~@>QK)W6b=gY
z<Epy-Zrj~gFyL@c-Q+&+c_Pn%GHrjc03>}fs|@wmd)!Gc88$3T?8V%nfAPK|Ai$%5
zb7Ib^Q@qmmtdw6^VvxypQtG?YUiG%Vn-8Fs!7W;@q+Shs%A_3V8|##PiLd3*lTBYk
z_N5ojA3GD=FR0!LDIBFKIezGvl8JqA1mAPIOm{8>=f)0cO)Ob^6uV7XVca8!hj~wi
z`9VK5N*BRqYcmA%XJ=-GFJbXCcsta}N#BNbuy(oVzV#TQ12Kc^Awh;ri4$y0DN7A&
zAL_b;=+%XrMSl`qru6{CW>0?A&22B2D~nr5oSl=;^N5OBqvC6_XQ4^U6)w3%(SY!N
z#l7}`V_Y14N4UxMDgL6R^K3B}x)1)%%sF><zhPa`<X%(9`%@qjq@ZHpI&7!Zk_rjM
zcIu3+!w=LCuSrYY<J~SKxO<n|$f~AnJ7HX_z%D#nMdWb}JfDSR&e7JvLJ7EO-=l5c
zfs~OD$?I>DjrW>i$*1IHPrr$YH3fVQYRo2BT0FAw=RAot834gZdU;Th=L$`fpmM!e
z<%Sc9qrucgzkS%}UR4@<eZ@ZrBz}{noKp`>9>0XfDt#D>-{6mU80og$nrjB2fTiCL
zKq0m56cwaE5m?XMOWRw4p^p@ZM1_rpOkGPVJKf*D4LMyRoR+jxn0$UK=X&&r$$dxD
zy4^7Bqv&+!8r-j6b;UXJtEDWqoj0=E&hhkuTQgzxHl3<|^neIicc^rXporLU7DJ^a
z`5NmMC;oR`8ojH0Lz|(tK4?E^Mbas5g;W)n5IV{dkwU*q9png%kw0xSi$fw9>Kc<&
zmSrkG5xvWK{?BhPD_+ih7~{3c`kd6B|JE==Ff_l;rta2~fO;tH#zP<EQqm9Rh$k6i
z`$cn-G@lD?wJ<q)^?AadSW8NI;BH3Wm)o5NuukyWmB%XYMQ0AuBpfe-Ln~;Y7AN8`
zy<dCoM)kG?DiR(()0TCsuIGGcrBgv`-MPH*V!^C$M-$3D6{E9St>t;Qxb=TT+H3OW
zRV{qzohTtfId=3$<p}8~csNF(co|oWEvmNsFNE|vwD_xp^uHqg@<j~w9gRc*fuW6-
zoBkKz+0Q+6d1%GpGf#j2dLBnps8UKOeYRss7#FNyMK?W4zn|83^&|U@fj---3l_lu
zAZx?pQ@VK7%!q#A<;O)gv898GS6Qw-zkO&6k}R8ar7mNUIPwSe-flxBdm};6$3R5p
z^HNVCUx6r>$H*3n3h@<NpfZdAT{xL*H}vd_T)j9dom$ft&(@WppoHw6s&=%Te0Q6|
z{Kg`gHW}f)D3{NJ9ZHXB@p--c+k8$Rlc|Q4`ZzsV&i55+a`$emrik=8pl2khBsaed
z|649<BAnh9I9?>6pAZhCP99vwk-6MZtg{twGH3~us-2pWaV-pLy(cG?8+0DFCs+So
z`Sx4!4IKY1jVOi{2|<NIE~Sx{xWe%yLv2Fx#^acI$5gGYN<s40IJ(^LW8}gpqRl_-
z$5YVx1evWc78>u@w3?Ah`K^Pl@6SEa$yr61__{u|{h!n*SNDx>g_8j=H|Z(NxaSy@
z+R>}B)9mtaMxRYHX}#%q7uYVUmAWAc#~_%PA}4@@4=ms;Rnj>17)_o3(TGMENfY;q
ztqTth%cft}?bQ~ddo+&_FLKRWu8^tLCCGk7k&Myd$^*c%P$jZgy~6jv^Gl7jqrIo3
z2F#_8^BBIZw|~zQXaoOU&c^sHpomc~qEOnd-{We<U)UabP~tqgqOHl=SE}DIZL$I|
z{gRe|q_YM5)fxcYW0(**q<fS|a~?<sL60QfXYFHlS@hWg?ij0Iz4JurJcAH1p(TGR
zi^H%CA}S=z<4EBoo2G&NvblBPdTybc-0Ym>4g`Rd*39qPoC8Z@znjTjlCF#M3RQr)
zawNv2_%$9zDo9*!f(vV2x$;}_;_~A58v}_Z6Y)f-)==Q>coyf*ql~13&+@Op3G0d8
zvBzJ4lkwf_*SsnaX01$Q|4aB+4bz8>1n0|%aM`_bSohyu0i6Q)l&5CYoxi*W^J}9^
zflPVGfn>|`mNw5b&=1Td)T*y%BA0rHT*77{Z13xOhC8-^>*{!YGf+!G<<xyGW9v_;
zt89Kjp$Xz(+w{a{-f7NQ{v>q)qi{-7TqT))8hu9KStgIS5oz5bhSI&N;T~z&*K5Ia
z$dJF+)Q{KQ)}uluE1d0K?|arwJH!H6YbwI>tIqSTqK?Ni3r{c6uxujKRW`~$cHo{y
zhBtJH4O9^N@N%y4)>YT$dcHBZ_`cr0%ca5Ah3Nk04ZT#hz6CJo{rS`DPd-(aRdeqf
z&X^-(Jg)~CkNrqJUN5>1&gfsass$=KGHU5T)34PFC-QzOCKfhlNxinl@F;)I3T8Sk
zg$)|cS)2w@Y*0LPZ;=ZuNRyMI`7F4Hh<{G%N6VA>^zS?Tpir=KUts?)H74)5BobBn
z0UUt*7LnCuN`K4OlJFPwu`)OTNW2vt-lPG7G93t|J4P`#8R}ek;5VGOPF_;E?46|v
zstkkgmDlbl7reC1dKudAOpnY2lPLV@L%o;9P15ZpMg8rK4<F)K^JK+09^K_7l+}Ca
zZR5)m_<l$NuXMB?Oo1aHZ9wvAi;0)^jQl4~%4m=xr<r?It6tlRly0Vtp5@H9QgOUE
zzNM=z+2!v^Bn_u-ddb2n0YBiG2KThRlAcqurgtu700nfH)`a#0V?JY)I8z~8v33`S
z675YZl;(01d1Z%`C+*v4gmRS~&#vV<+)(__F7ntD>2P^Pu9?3-YlM+xbaXrjA?MN{
zL9&)LT+Ff|LSCl@BLB|)O?@xFC$0c#OD{&=9f+q!UIcb}yZ~VQDV18!FFk0g_?25<
zor5io@ITvAI-9jrLneTxuUR07j;Yn$zW(k@9Y?^3$V%PW8}p*$kni{x!*-Y}BD!BZ
zuS)PPbl~lOvjB2BdXIbYA#&`M$K^|HZqd$cyD0f9W4JI`9yj%)j%>-S92^Z^O({zu
zP6lthjr)Ikvo8gF&TTGlQCnuOl~gQb)uegdv;{ifVEWVmrayaPe2Y{Y$WI|DNDnL>
z)Ln5@XOJNnNy}r|Q_VFcn=M|E^bQu;stYNNX!droc#tF`yum@J)y(0m_pIx;#=lBC
zvJMJ4cG&I7B`)eXJwZ{fkNl4!`tUh3chDILegaYcKr*gbR$X&kz`@g(ILVK9-{Pt@
z2$_t~f_f*Pmm4uWGj<+IBgrst!H$O&0i$!v11~=$>p>4Ww?JdYIcrK+qnW>bwERb-
zZ>_R^TRT;w*(7N&9Lx#w<atWL<Cze|2Qwp&cjD4iGvL}V8b<B}&XI44%zw{x9or<j
zXMfZ&r>J)7wQ#OZOpu7ySqe_IyCi>wh)C2t-TYw}Ze>?*(E&jIFEcPpL`T5hE=iT%
zvNHO{5Niz6j76&dbgkRS4jpr!|4@(fi$@q!DQtkb7=$*WulJ$c`d0vJsUhYH-}(i9
zvH!K@stSH>sg<6(D{)pcs9wZkbUEPM$WoZfzYnO}ZjL92%4u`IRHlhqJ_F3@jCF4C
z`<bs=bUD<b1Ox;Kz>`}dF!@L;-DRoedkC8^s(?Rh#&JR~_jKwTvjMlc%!0qGz8Yri
z1DIMI*ppr&0PEJLjTWUOp22}bGc>om*800*n>186gnkl${M9}Nt*oqU1%j@!Zp>-a
zrDBo0Y4!ur!RMJQ9l&rrHVE+a#hg^g-G4oR5i?WSJBPTpO1A`rffm4tJOwu?aWOIQ
zOWi0B*7~<4sYlGi{-{gS<(kGrlA`tf%5?pwmzGLN-()nQ`)p>LREqqUBoDY$p_jFq
zBm7j~_@~B)oO3a#E#~)DN7P6s&)XNuR84hr7<7}&mWOt+r!N$#IHL$D4|PK=5hNBE
z*4PhX(+(`_yXCgx$QyM4%>g>(IcE9(fygFPKo4sl2tB#76$aLQx<fLN3RC9dPT?uN
ztXf~Fe`9%A)Q_NsU;?_}+Z!xn5uy&5yh@W6F%r*3zi&puZWF`StQS{aa&f<)wXU~?
z`1lG`#4f0^eV`Txhodp2ts8C=NFo$NXCV0Uhjy7qyuSlRIM<<Q4~h_M1cMsSA^9Nm
zKDnmoer3ZB3MNvX978ACn^5}kiaJQEVm+@0h3w)8_V{#qvUyhEGSq2ke{t&$xy`B$
z7c6edVL(eel8WbzWG?#(&yV@wrz{qx;{VRfc>}`Se<9(I2_J&dGGi`n23g;d{%~qh
zfVvDGa@&4h!mkayef%F{o=hr+QXm9!L|A*v;7iBjX>Qp{&@_Fe&wYQcfTSpaq2il1
z#DmPXEMW~b-R1GN)CJ4QtN=uO=S+FC2r|YBhZH}{m=U%m>wO-MJD*^k&_S#%v@A(r
zhy-1cN$$trKYZ;Ml*1!&1hDed2A!nuLNRPW7vlYNmm~CQuh`RP{gPDL&m=&ko0Ygo
zqX%pupW#7ruB0zaog4&pANjM|O8~LL?vY0s*@L`+GM@v%Vh@_bg{4*~b8>Rbj4b}3
zyJ6@tb<pVkMf05aK<ZrXfX9sViS;W=%-~ssBYW+Yf4f=3#g0vRI)<5Z%-V_>e~NJL
zx_)X4HXjvMAy)I{9pgzp8~t!0r?5k$!k_(!4`vUP6JWBC_U-+g?xX7~yf<aS(=v%K
zXRLuUHn~{jg!YX77dM|Bv^C&BkC2Ie#bxR^EOB#J6<D@OFaZbc5pd9!i_xI<(|Jop
z%4^Bz_6EZa`7T4O<a7SR%Rm3R^8C$;L>^&QwsPfcKUZ#vT`uJFn`awV6e6#RvgN4E
zEd|XX<?Ic<3_umGL+X<qp9%5*6f629two-P-V`e)*%A_bcwq+3N%Q^PcDEKmyF?h~
z%Ox3%TmQ`Vz9X)3{ly#(Je?@OkBM7)Op0_Ur=-5X*w3*~ctuuT{zoRiOy!4H`mDsw
zNzXGGOPU^N!w%L~6oSP}n3tR1v)=oLY2Ckdtgo;Hwf@b*bp+|?-nb<xc3M4k9GRHK
zc6)d{)Bf&5=HBXj7%xa57@~sbs$j>;m90kR|8+?3vqFVv9ewh1O8%|7gC5Qn;W%4d
zy3u7}0={1-@^quMWmCK_oxZHU3>c&2h7}Gp*!|S5<w(}SS$FB%=45+$=ef(lCYaVi
zZ@G_!rXanF;r{DfFVpYnx%4H&uZj;wlr9y1GC>T`#g`7v!`u1Af{I^P7aX>eL@o<^
zPqwBn0~^CSdYw`(R*d=GTCM<WFWYJIF~l{7t(I(Pec-se3EhKI*Dj`^Lb^UX0FKpN
zMyrk32+-x!V1Z$T@GrmIB1zb%`F?-bjJ&}@2gBBa^~}&HHZ;l~I`8tH4~#~3FDP5O
z>2CJ`hi3Z~z@^097YF{Z24EWv+(C7_4`<7oP4Qt6k?$K3L*JXx_7i%}&&LD9ffTAm
z%*Q~lFb@Ey{|JnMTy0_TTL7sDJ{g5!UKLh2A2;@LPNRBG(Hc$+o4Yg0aAO@77M3mQ
zQkU;aR_n|I_2=!}8Vi^6XKmqgPBY5DDplWZ))MY1v8i-cW&(q{o*qU*#dNYV91q+6
zN2f>xbP63{;s&fuY8k8lA<03X&5!RFTS+KHl6a7%&@!s6uoR9_6mQfo-9d&sQWZB*
z4Z_hU%tHmINYcZYXQ7C39q|vA)k|oz)1t>G2P}~QiFx|<wKUavSpzyAnj<jdz!J5!
zwU7Dq(lZ9CmtsM{_?!HqUZU%B{Y8T47`NAjs2>z}q@vYHC%@ex+yh|r5c{TlXgaiZ
zXk)`+)HUMjVhyq}Z2TMB<VRkJ;<}o!cyb;wIH%EoVwCUl6L!(<n%LzZybg0aj$Zw+
zQSW<MQ8g_self=9h<-@(p5AVT({Usi`?h9!@@IBVkp*x-d+ctRkAX|E-yiF|GRR0)
z5naJSQ_l0fc6N!FK1xn41Ys|n+Bw^xA*>d4UP<ezJXmJzh2=>o<Vw!M`uEbklPsuP
zVv4xC2C^5g_zm#6dn#Wq>|<XTm&9*`9@|5&76S(#)Oe-5vDwpNqp#IeONBUH#BYu3
z?BB}(bSY^@XNz@DM`YMvdkhGwKj#iUI!XEfc7;uUR<K<dW7|VT-Ww3xeWUzg-721@
z19Y{&J$BZJ1!WuUH#loT-46=+zekE={6#|1R9F*3lYuCa{l3`n(|nfHhxuiw4MT82
zS()wY#E6Qiim##8VxQWvX{l-0O1h!PguIu>3Tx_ZS-(hk4nm2Inu5X<X){G{>dqO)
zfl9?H+An{l>|JG=m+ld)^1UT9No>9P&bWDlQ7ez_vVdjTy`*lb_>xI=HQh2H56COd
z958&YVf;{1nnX1MYDSBzQ0+aZl`*x|PR8J41x(T0%Q(s#RGeF|6qoBcCeb0o6IYz*
zU<$uQ%YRwVzyuCtJ^M;X=`{T!mF=gnA()n=d7@4`@l#rEWYQOVAbP(7MK){SHcH7H
zH`wH|L#6Zp#?2KXZ~fPllsuw|Xb7ME5Rfsnq$z*ZHeanRKb^ab%tx?rj_E~moOBnW
z5c74z=Dlg2W6~$HFJsOK;PsYDp4%O-w<6EN^1~mH=E>*_$nRparvl!V-=kqGo_0Fe
zv){zuj6*k<9+ll4|GgP=+i{q8`#GIi^zQP0(R&a&ygPPm?DDc%P${oi;N$VtD;R74
zV9d>J;Ad#2RDY|A7gQ#s%|LML<ltv-jBQY|L`HxuyydVwiopBWC7Sz@YHZtKc|GLR
zt^P$-+|Kt1DDYE24H0Lpg!5ScyB93#_Qtndl0C7K1EM7lIy|HFA%f#ptB#k;64bN+
z@h(c+ox)hE?7R~7>;u3BOfwSsMcvW!KJ~1ViY3##%P|A=mClI?y!`jD_U>f0`l*k(
zjkOhUJp4^RpZ#Y>YqP22!h7e_j&!ToG?fGAh8<zVE%6BdAeo!Hz)d}pF)v4geO}~F
z!M8%0Y<d(>ug1PBmz9;Ng|jEgxgq_7ctzx6*IT-DAO?C9h=Jy-Vmx$c6BI8A(CWu|
z?9}6Y^N_wE+CQ6UrzisL11=O3B<DN#)}J0oQ;0e7q=cKEP=}dH;l7&wqzjU46~P`h
z%bIa1hru#~*C(#*-dryV=4>^}cbFELziqgVw@27lma=l?QZFtXb$gU`wY@LHM4|a3
zbw4X73DV?zD*p|65Ikw&ciZt~a6HdC7h?HilV<CPispI77&hM;cxacgFWjy1;QJ(B
z3s=Yn)@ReM_BqG;Uw!>%b#jGWr0=L>;%*hv_R7x6w7I29ZVgQ5+N^!>vxa?j#Y8T3
z7!YTGSZ;5pYAdPT;yCFLY*d?;g}Hc~%{dnq|DEPAFTKISJB$vBS}HyW4AW#2FgmCT
z2%p^q*tqYM5ftFL@*M%0K5Un4=?*bP+Lk;NhilwWtp=bjBjHQNfjba%(7kG(Iw(Jp
z?$Sq<25^e}C&1kilw2O)zC=RqWm(ZLur(mMANRzH-wOUqK)l4!phavwSrdxwg<zgM
zzkwhTY!cB$zk2ZZJ=R4L@aq}4!dx=}b5SGkZ}fO|F?&Tf7a~5_0WvuPXzCytk<1|U
z0u&I1WO0Le{o-pZW*=M5EW7cpdKdVvAdbNG@$S$82zV~VqPb7DG})*Itm+Ttv}7}&
zVy!h9;xiu2*_X`aa5Dr)inlPx(AaHnw&o$D^Orkc?rhyK>0i+#jpgi=^20#(^%;<T
z{e5peCe_vJb{Doo;~6M>+Gyoj$Lf?)CURizOd=DrUYp8czKQU6by@|%4`u$Ct@V6{
zWmN1Ym_^Pxks>D^y5eAJU}#+dt&DAb_aRPyCa`Ae#Dy!i3HS7;l#hhtE*M(Uc-YVU
z?j%Cgs&M`!VpTta#LHuMaIC8Fnk9e6CWmxPUc#ZM>#ff^xC^+yhdf8*2VZ-fDkn`q
z7@8}s@vpOqc3;$4To9i`j}8RV{lTC^5$5C`_{x%yqP@#)zb&>2jIQ|U#)_6FAPBv1
zxC$K1=H?6wzT)C`DVcVLiI0hC_g@WG&6YIU_eUbSwytPKMqe9bK+fl!F7>p+z%O;O
zyp9(pNE-aTW)F`V^ivR)(hx?M0f7tt?jveW#PeL%LHxesg6q@wbq%ZdTf_1&RmjDl
zb^cHAGx(6#8Yf1sVXsN^tD8%1L{U~AiSM8+xp-RTw(rS!j=dW5bq<13K@;XdN<`k#
z9z-xn@hZ^5<J-U&_YS{uUc9)i3c1F<c#gLzljk03aj6ao(gidf_1^q3YOW0IzHo%8
z^MjFif%k=foj%!S>liFc+^2qgKYPABa`}nBOX?&g7j@=^g@YrFsRkZirzPE*-seE*
z58N%w9cj<px72>C-nP|I0+jMV%amyNpO0Uj^;l`LDVJ=1Ik>-hdye?VSxf#-ECI{p
z6ij97P3{2ZdCElVB!p-C+q(n+<XB$Sn4_rh5TVdEZUW!H5*th>@w?w-boy(r22klq
zB6k9n9GqN;+cd4xHtfLlPGKyBq*K9<4=2wEesiu#z{9ETPv>i4`}t*UJr)(0@z?Zi
z88<tw2{v~8LkFVOGjE;Bm>%4=bd3u%RJD&1X`pWTQ`Pj3Ti*y943Rg4C9h9BAy8cY
zT;}oJ75xy@aH3Pj`Y=-H@aXom^)FBT>fINPTa>NMJs6j>YLT_jVCH7&wrcX?M_3;R
z{0mT2gt^!2C$PeK>%^(8nnAjcSH7`T1Wd4xSeLTvWxo7ERH9dD$$+~~xlr@07Rjdk
z_H|{82Z#~r@O8yrv)|GZAl8|<WzL<P9fudgSB!Tf5^d+}7_mVs#vBoeYFJn8$i(69
z7Z*<qyTb|Q6eiD_MZ!fnX2E`Y&*{!47zng-=%3D3rI?Jbc%)wj-doLjPUm(o<}K#y
zWXQEPWv>^s==D%!Ohav*V&7FQ5IQn%qDd7_e?`_jU%kcmVeD?Wi)#BL;V+C_Q=_Sh
z$}AYioVIsKXRd(^iEiaNp^k=sc^}SEYJMqpJ14)?_(MrE<}>k2O`l}xR-E@K5UWQf
zb@xSP;Ul9~ij)slQ4dEV7zjUdV?<2yy<Zas3|C_uznBf!GRlTi{Y%z9%{l{;wdV}J
z=~ib@vn&%car<F~41BC^$DZ3rWF7L>HL&m7aKhnl2W37spE1{@jx{F@2wdKJp2Oel
z(21<t?lpCwxA8rF!mDUq*6I_p*%o896Gn1)|8wC|6n3`LXx4juGR)ji8}ftqrMbRP
z%gdu-P3Y`)0HU#O6~!0oka<M{(k*UujIE*g0S5KPBj^D}MuoF)A$}0{`68A~C(~)c
zE6CZ{eRK+3pq}$#Yp4NPP&L$ZKDp=aAbpJ)usuP6B74Yhk-2nR{MjC_nbjj#$veZE
zH-2Va?YTlB$VcxFpdxfdJ9@QYJW$NVdLb29NyBaya4#Wlg4H4vHf9L{j-)Qm(D#gp
zEiFn}Y2D59i6~eVNu7Jc&6M!{y}`##{{FO9R!&-1=uMK;uarJ{mvX-&7ExAyPASju
zIQG|ie=qdU?FAQE=Zs9NiA}2BI=%eM<593C^W|jc=XaiKoDj7@W-k{x6d9OSVkL}!
zjDG&$PP>5X=uFrqkoT>kaf0;pToH1mK2CR<R^UF}+qNxMrb1pQ;-n>>Oh7=Pk!&{h
z3ylXYBo*Z#%weQiC!=%U2IOj)CghUnF9}z*<Y6Suj*mk|bsGrJbyE?gp!FgLE9nRI
zI9y@IR<kS=p@4m9AW`%%uwV!!gjy~N!WA^4)|h=fE@u`5zASm!91qL)Mv7;e)B?-K
zNU{L{{I^|!V$Yz)-(Al?2F$Wv<)qRy9()fOe2gY1`*e!lE*(T4*=L{_v=OJ{eDP%x
zUmtzVl)l3=?4g&;V_lN;T}O%>3HI&wV*=eeQWjfNjXLerD2<|Cq<N_gNc2AiOT;Ic
zTn;Eta<DZD$|_+5rodw;MkqomD|mh2`P9g%+g@2myZeyBj?TVR_eA@8I*ioizUBGy
zGABpf;xcz$-F|&l-n5q2k}I=1r)J6fT(2u%3+jte@Fm+Hmxk{TK@dfd*QxB*VP_23
z;)1pEn{*`=pFze2^b`fj$JTGvCFg-br7qCvO&X*6dOyTLcuU*?u!c?8HgUWx9pyNa
zr3e3FN)dk=J5#8VgeAHjT1?#}C)Gu}`buE)5;XT=z)B5rJ?)GL7sT|e>B~={GO8NT
zfjNEdn>tnvGS|J&AX|&F&19k$GN4AGmZ{wBE@`M>wb=<>&!yc(%*54_fmDs)PkRjz
zth08ChY3L%BTkt!TKK<Y_)uD&rnqnq7cQEMrcC6+^FP@`bMLWl)ksg)tm1?o?S`EG
ziLMNF(bl&ra*eommfmmdqV}(9T2>(3u7zXkby@Xx@2w*}K;b2Q>WRPeevf~`g^|JM
z%grmn<4IM#>A*!<DBc_)`tHmfOOYlYiW60myQ--b$Fq`FJ%2Pi>)S~1Rmp(gwaZ~Z
zK_&yE=du2Ws&59r>Wj~?Y1U&O91#6@(=#ngIF<aLp6NR=D=`GbpL(Qng^F#nd~nJ}
zq4l)fwHY$J*%k>%Tf%Xn*RqiM93qstoJQecu-boRck)8`A%_ODgcyXVH#b^y$!+jk
zLjF(A{?g?OBh@qV(u`95x>V@n_*@N@d?2&;V_EvIs{d;5vB%$r-<{fTEM&eaXlU_J
zQ&bcdX<YICG{f4L_^*zdipPX>#YL-b#n?m1fge+5F?A%QuVEt{ykhM7WgKx>j`8s^
zN(&p%8x_%)%NN*lCfTT$ou1)5AvtsY8MexA<>yW6uhwpXixg3h6Ux+kP+==O%k_w~
zNoB2p`?>AHMxu&!0lQ?TWUh3@?+~{SeDA*lcsdEsHtZwp1oB>^iR)iE^&HhPP)=<z
z#;_?jo1-#1yJjUw=Bjj4P7S~)cMPc8-x@_N^Ze@Q4`jb<UrhP0oSFnEr#>{lDfcd7
z=*hjkM5ZJ<2pY5YSc^)J4!ZT>xE*LKGr&n3uYQ4TpusWCJvuB~4g6KTzt(*;+jtb%
zQQm<_8Gdc%q02lf&APReka{;ivfi|DI!eQqd&a89TGw-fr2dnBJ6_y@a|zF&z1dMU
zm+OL?S!{a^H23P#4qeVNh?{NucY>_&+UX_i0J`l-wI!1%E-T!B0!$h?E5;GHS>1=_
z<7|D<tq-u6;6k^~WyH!Epj#)u?W59l%|5s}I>NrQ)hz%{)vbqvE^-?Gteol2^TMhA
z1JtmqRW@T^-cs7@CS3A7=Bq`5EeK`}GIpDQA+r&Cz5lJeeiTT@^=x^$Ee?p;h(i4n
zj*|&ECZ24-HrZuhO)Lw>c44@Z1VRr-768pwDx@Rc99YRkMF={k7MWsxA8dsT9!B4&
z^iC~eVBdM;M7?svpcWPgWLqc%k}@GLwaVWd`kyFr)x6P&U1xrL;BThioT@3X0OSk&
zAYB{<^c;!k8JCrC#7*~>3&O6b5(=d5;Fo5WcK!imq5@zE_kcC6E4EFzbFw<T#?y7B
z8%QX;HSrgqW4;xxRzOe5*+0o)4{@=-Z*f-2!1g#3U+Pw?PH(ynx@W9<!=E0sGP80H
z+ch+lizXia0=s=nxn3ta*RlK)PxtVlnpk&+=Fv@PvT2J(dA11Z5Fj_m3zY??o<82-
zzHEv;c9j-lrqYCX{#nB1ue};Vb%=>+rOm{lfbAki<Aw$L0^9x#)Dd6YP(tYEm(ABP
z(9cb~xnQq#<|G?^p+Iy;;U&zj=lT1#av(6S4pCCKS1_J~_)t@Pv&}H>^y38AmQ*wI
zQ}C;b<8IIUUy#1Df}m!)vMsv9#ne>}+Fa3sDuSq3Ll(ORy>c&!$8~QTXO3Q*%Z*t>
zp`o?A5$>jIM@HYR^)#_fnc7ORr)RU*-;YmVDxj1!o<XP1jt&H=AVz!6egU_;HGJ>x
zF8N*3d`8nRha@n#pZbSzF)R#Jy4S#VacGqH6euuT=3Mv)$MiG5Sw)mi>o8Vhdqvy!
zpDh5uBIIWpBqZH^yn8GHLlAWav#C|OvtTp|>|DWDon-0kzu8uqj{>d{67EP)H7@f(
zEX`G6Efz!IpQfldmwtH|tBUY3rb22h{uSNRz@oo%({nc3UsU{^)MY$LkQswwSLGa8
zl(%5w&Iuy>MdbGCe=m;hbr&u$kq9XEJRl6_{AsZFY+7#@zA(R)2G+}Fayu~ibA39f
zvG27$bGPxya`qrb)U$chDqrFx?rb>Z{DPd$@}Yh+wk;O)xLr&NYsf4-@Hzje#RX6$
zvpufT9}nVzJ>biQ3#z>tJ@6k*o<@l@J3r>#+UV0_*Rp;@ym0u~-U<7}dX`y%?9;GE
z_EBTeqw#C808mc}0QE1N$xT*g6~s5>%2qGL>3N<=T)NVEWimLVZrC$>txm}W2T0&k
zypYb55;r0B+-gQr5-1K1%{1m4YF)Od0rm2xaf06BgRsF{%N)`n;I@4IBSI0`n}~XT
zAfo<u_BH8`N5qpqJ+uvvg^?!K!G%wmbpG-5ET4w4<^Ik$JiU24^|B=CKb{^KP}4uj
zM)Mm0o$x0c9^dn`FA282T7+!6n<=#24HiKols5KBoq<9xo?=n)mA`#8?$Pw1lK&sx
z-ZCo6|84iCo1wcw83ZJxyGt6Bk`5UVkQR{cMgakl7%4$Iln}|Gq`MIqy1V1KMt}Ex
z|L?v3d#`8jwVr3qTD*cc*KmEm=XoB-@j21$8b>J;GNqaVQW<m#084$uhDcA$<2|XV
zcjw<BQ^*CEVKks*o+!GXl4zfQlHs{@$E&)<0tJsfeZpc-PcFY8&y$9yx0_9p9)|*#
zF@oxO+a{)VcMPTynvM;U<qZo(Yqd3P<5c&RYLc(#4Qcd_s@4be_Hzf72QzJ`7d>xQ
z9j&%*%1gCatTJlWYR_qTiadSSlG6qFHStdgitgOQyft{v{Zwj-f1;S!0XhV<r)-L6
zPpFYCK9wm57`G<Oylc{!+?|;4qPm{!zv!YUzwn{uj)B|c&tGryn|A6mHZiDa+$emx
zU%9K`cTwkg03s6^ahWYjDCf6mDg$L-%QX1m45=wlnzwwBlx|$-^m$uQyHA&(Yxw5d
z@sQg-&X4@#??oJMeDSTjUX5B;M0@GqeFJvS>%7>&guEHTAm)Y{PleBh2^xc@@zE{V
zQ|q2CKLVD|EAqnbasDiy-$g8+-(W;6p9lJhAAgq5H{i%lL_H^sx+iqD&z1erM4g!c
zUb;z|<Ca!6%}#;0JnW5n3p4awE_Z*~`?x(<bZSXz6&EfaObWEWfsx?cC8=dJ2~<M3
zW!+G)Ag=`X`+FS?fK1=>HpQ={Mj9T94K7(5Y<OV=@?`3f2$_h-Fu{K&6qX^k;N_2h
zPm{}AD!}rSYSdCJVpl?w?qGS^{?ONnz>VgM2SZttOI*V;xVSGmoXslik{g(Dyg3TJ
z^c7oqz4n#G?0w0D=5)OjsSIE#eXU8BgzC@r)8jD=T+yy8MM(OPdTs1i+@?xd3OffW
zuSPub-M#oD6bArw0R&iSM-gm;j^dJgU_SH+i<f(?r}X#bz#HqZvqt{uA4}mhV}Pj~
zqLyCkE&bc2i!K^mWcA9vO?><9-EnrgmyOq3ICg`0J>9IW)V1Nq3fu-P?<YK(TN6Tl
zRi3rL(efL(E?7y<dtC>UTD)~m3qCoqI~@=pd5wGD@ybnm0#u#i+NRS|8wZ{8F0u#G
zYQjWMnk5f^^kW~3yD*qZIbYra%Co7SZMK+@h{~ooAhT_yS;cFM6E!-(8TgHXokAG1
z041&nB(}qo+s6u$yf8m4eeI_j9m5)YEdSQ@;qTgApzqmIlDc|dp$6Ov5%fOFdLOzb
znSJk$c+XR68x{QJTcqTdj1MUoeH}ZlOo3hlSg12A@E>*@?tzI?vbAqFix_3hN9}~o
zg=-XJaDEqGU;O){XGL*>#@YVzLQtxWey;KZK(y{1$1zgK)c^L|8jcT1ED5mrzTlPU
zOMHizt@P>-#W*y`WozDX=6#r(e4{qA|A9dJwF^d8&WHBB`)#=z`-Q+6d)4DE`wpE|
zfyUr_GX^i^$1j?6PPjftZEr7ka+J@z?VF7s9EgAGs1`ieNUnvKv%K0q8it=dyT_sn
zX~gF?V3b+`3L<gFj(eQi=yeIJ8=R-SuCg_nbW>kQ#BOp?s0g<T8M%q{iI@q2<sCti
zLiUA^$xo@|jj1igb>G!Q3y*KRS5_`eKEqaOEMkVP%AhC-vtjPGvagBTTR#7QH?@n}
zfE0&pY0neF`h%;IeQ#{dLquz$l0Vl2W}&F7??(ZWCaxi9r3pm%V<gdD>mOc{&f+*y
zhrcq9^iD&kUbE-msS(gX_>ZqnBNFuIA{TwoMdiFU)v(xSW%}n~5-?rl*+c#z9F(Wi
zy8!$C&-+XXsTXqKiWqtwSfN$}drnLM3nbhp_cqSFKkV(m_8~W@fBCWSYU(-amc{X{
zQ7tQ;h-4Yaw};l_<gO>xlfgu=XyJ5F^_6<E5FTNrvuXB>W5l%m?UKL8x*UA#{LQec
zu8+l3v7?ob@9os*p05{fw%mE^tNuO{xs|lhAM}BtT_6n!N=;VG(GFU2rgLJ7X~Pb$
zOF%)w7mK;qUWef-5h=pm9_~}olz`}J+6xbNY2+O2Qkw;iy;GySfi!)(X?D|XxXrO$
zV{G$-5n!eGTH!uFj^Lbspwpl4rM`KX-NEPwZTe&ky>MCmum$-Vb$|9CBc5I4IsyDL
zl-5dMss+@beggQ;@$P+5%sFM*N&+R_v{2okEE9c!nOcB0(Ixefv(PhT@}wf&i>zyC
zi67SkMh9RhgMN6>V(|>e`M}Um(u0tBf`A#=E{X+44q}ReUW|qDuzSe#6Prf@W$d<g
zk+fqf^>d^*pGnUdBw=nGWnJ$wi6R4a<Y|Rn01G2+Ekfe0TLdItkbG1x5rGu=xW9l?
zO~uNHBNkZYT9N*Ht$$A+Oe<>k)A`j^6{DljoOr>&kFP>W{l#AQ8U2{!ZrK8bP3JKJ
z_MB8XTZF%zhXW5B>I%(Djrj8Y57&85FOE>wK$~0WG~8KRK8<*AYw2SdrhQ@c_*C`Y
zP;U*6a?b&d#N(AMz>Pin(Jt#*pLlzF`+yJEO4OWfmUlr3>8|B6b{CMTteOGbys=wA
zJQO~Svy2!djL$BtnYJeChpmq<dBd@<fO&bu=ZGjo0*B7Eo2iQVhiOl7fYileNVI-)
zXD7$%@z+V9zI|(TN1`DtLkIl2{q1T0b2d|80$&Ui&3f`XJ@*atewMfdzT5m4Sw35j
zJSGfnd+d*TQyzva7g{lR*?5>bW`Jq8X8~+EX#i88zSJ9a>9wBm#&jS#x?dXOeSTWk
z7;BU-X_4jDCh7%$K6A=V0%7h<ppMo{LqJ-}<0Y>kL}Ke1ZetOWCrl<`Qx<O<nZ?Un
z21o`R-)2bN@pc||G5mfnB}YZnNG&<*ayu2Q?|a{^B$=~tQXnL9T7h@Z)|#@44KF$V
zQ0{9pu^-LaS1qML@(VG0H+0Fq-sdnq#BrGyuxQ#59+|D3_3t&yTogC<7=OO3)Xk9f
zVDL6sXb+x2au*yTv6(d+lQ2K%yT)hOBzvNil@^p1RDsx_s}|6zPmaHwrpfX0Qc(PN
z3e)fIV|)pJWHF6q|I8dsrNg|LFx<6kHCO}UPtt-E`C6om3;>roHEnwS+6aN(%JE1I
zwPZObw;Zmxjx}CUo!x);S0AQkM_o`cqw(EGnkiz5Eh~|%5Ns5fdHRWDdPR{5Li^R_
zUaZ;bAq5mllg{w}QYE~ykCs!XnHuIOl1@+fcgo|2bp4Nqphah*2ahbk5qP4H2S1#7
z5n!tfOVY~FD05+pp_|tP7%f;O+-{Y6iE41@{p`I@e0efk{^Hf8{#x_cTZfe5>cN2e
zss{u^fk)Bq6E4aN(@UQd2r-pipR3{9pGKju5ud0h<JD_a`EI4r@ZAgCFWM4`-l!!|
zR%u%fepT{)he{U<n5=#C548-c$mm2o{dhBBVUSAVWJO(ZXWVnD`nT3*%MWi8*OJ5Q
zsRAJ&em)38o1-<wNvw3S7z>C+()HPE5KKF?wA1F2p!sK^2qp7?AF<S8cG}|eH6_UN
zGNRKYsneoj|B3pe<btN{`BFi;XZQP=J*hi;0S-EJ*B|puw$rhLBldWU&gNaBJ9li0
zKL<_Q2WDjg9#qM$9}69!S0(@It!9X4xa9+iJq{u(Kz=FUKpi-I(y+M=S74ob)P#Iu
z3Qf8ix(-;w9bWg-z&Zf`a8ch~x)VT4x;8o*ZE9t&>5W>(*RKoxDhoEO%q9SQ@o!IA
z`pwDHZ<1(y*ya7O^lT%>Cn{L**x#+O5ad0Ve!~;o8iFtXXDV@Y7FI=!3BcU_k!QwD
zpjGP-I*q@6cpOWvo%%sZRIZ2`PniHRvS*+M`M$_W+a^yFG9|*)E{KQ6yTFlXe$l6_
z8b^wlZ-!i@-vz=@-wM9OX=RIaVL4GAl7t1tY(Ij4nX}j<Q5!KgVsH;B0hD`)%yq?g
z0OkH8BxO_uK)Kt)ZR+*|PdQ_kgG&lZ>C9&0wvj<3l6WKi1N6UMDA1<x;D{=~Y~6*H
zKiK0)Z^=+FKC2Brc$@f^KJL}9*Tl-$13v*?s?n=MhU>9Or@pQlLN4E8RfccB#ZSXi
z`-wazZ}uavb_6)`X9e?{%L4cm?uJr_y{0uby$q$|QirQ`li)TP```S-yxpl8%Y6n&
z3>o}Rv;_k0d<|E<zhrvmsL*5<yUBHSuJ)!P%msrv5vvHE)3*-t7lp`1MAdO|n1^1=
z_Y8Ljn7rqGwvxK6b_DqNBK^nmD?q%`gmvur>x8(B51<0N9i4rB7f=(Jakz2;Ofd{4
zwhaf_1%xCe%MkEfL-YV^YkA*wh6jBglQI~el9kBe-LRnCS+=1Ph%?^CU6<aWM!nOj
zXE;dUq6gyl!<DyZv&F!qfLs2V#377i>rL}Dow~cxXRmK}01Qi5dEjLOa3<#OA5|WY
zq&7W^m-}Sf0J$5+)q~&9Og0r<C?Ny-=!d9+9g_WH0?e}dHENIB(@9&W__#Qao2f-W
zX-pC}3~$b9G0QAGW@h0d|057)Ai(Dy0Dtg+*@zcc6T}n=W)<Je=l@+ZqM~-VF9hCH
zk|A+7$)q&w$+w5cr40R4^_SxgJJjrxMtlgKw2)ZS`>(hR_YIn(p3Jool#8>?46btk
z=_N4}$G^tnkTylIs)%DSS4-JV@uO$d7`*1vDrz5a2=%8U716VQ0CrVB5e`};@CIqV
z$#9ckVr)hJs@5>8(cUuqp8S7W<bFs&GYIX0d1csQ6vU=wfO~^<asnB?BW~FN=bY3b
zZgV>4R&TuHq77t4)K*AWV^c0c;YObn>nY^$WM%X*7&93AK9d6V*Eat?NoZi4))Yz#
zBI$K2R}{F$zdRB>v#{$-ap*-zfnjVmdp7-w06AYxxY_4DkW7#*|7oiKGCqlElN*v2
zn!*5i8m6-DQU~_hJdLtM3#R_0C{j@(xyo|yozU#r)eR?tpS(U*u6i;N(JT(l+G%Ar
z+#U(N?5HUl1;;Dv!P6yPHBke`NI%q@8`z+>@7>ZNZ4KXyl2Q#BukCHrmJ8CC_0Ozk
zNNtwfgm8b8gj5?B@a3Xf$6=Le&9gBo#02IcDxYVgTC?$iT~hE<ZW@geVmIAJ$pF~z
z759W64+D@Suqwu+o}%>$ejt$}pp|CYAT8~+^nWXTdgh4w$9_2AzuwP4+F~~}&*%;@
zP>5qCf8z&ir6z}-s3vj)mC|*efT{jpV7KTp$RmBNWgZC6r4{Bj6<=&o;zf473=&BW
z0jedk66UGr!FaFo(dLj@Hq7xXLXW5d>GpJFrah|RvI3~f-NqFtZ65SsjUkN03N8$j
z$L>ODBZOIb3XFVtbasqiDKOQk;kHy_3Mn^%XtfcU{F4>NM+vNbqbrw(hrHCIPuHe=
zFM31x3qHIGEnqz;yj@!Zl1d^ulIMQkqxzIqvg*C+5;}W3^X1%yObY-Em}F7n+CSFb
z8NIYr&JHO=f`At_3l9Om1{mDmiQ@rQwMnMWR#DiTxQsu5vKwsjZ;^skHgjsT(Q+WP
zbDzY2JXy1UaMPWrIH{?QzI@r`Pc*rUCWqLMlSocN^6Tw?hIN=tJQ}6hMx6MT7_xi^
zV^w5;Xg+Rl?i}cUAd;<@`o+xWoM4C&17Gz(TG8`mh$0@pIVIGsrA+{eY?s}Xq4c|V
zcQe0=;2c=qr?4+g)q_P-l*;otSD|L^6jUrcAB^%0Ve~=EtBn>dbVRK_duT<BA;J!S
z2<mI71l%V=8(zu__8%jVFYrXsR1~MWk$YHx*h&;tgtB=wB%nqJg8B%{1do@=5&A-A
zo=A96CQ8n&B&QBm8YR>`TOo&E%#l!wa2-CJN2A7(?G=?Ak3l-5!EAi|o3nq^<<cKX
ziFU)h55QR>7fy%Fn=&m2`VUbh-WxnB#!5OHTDBj)hrK?@Y|JD~FyZE|h<t2E?pxWV
zDfe~;+3iUTi9&^$d~PE~&RYt`1{y9x*`#_DPq?rBTeJ3FXYFh&P(%v|6?&>^pgA0R
zDFDwsNpz7n2~f?xI@0`fk9^-a?Pq^a0mj|EIjzJ#jd`KCG-4E?v?EY-Hb-A<)1PSj
zD2wxVm)YjBWV|PmCzVAKH_{JxCS^RhfBT7o;-1+QVH0kvZm3IR2^(LfI6|W;#an^f
zgj7k-04~WT9MfdvQhKmyMX&}hjV2TIxr_o9!Yl98W%IoJ%@sPvvtYosBiGIj@R27x
zfkz)R!qL6dcBWAKsEyuh{`jU9$rqC@((o>_ne8!K1n|tAc{*~=gnm83QtgAjh$D(`
zVcS4S7H)Y#tfVb81Q>H4AIyF<7v4BzmZuv-lGyrHY$RyVmBDA~?k<lb$|o<T0Jq5@
zjQxl*vxMXD`4pR>GtSkn(Tqb;-2B(u+P;7by1)gFM>qTU%nNuu0aV~zRHVZx_{&i#
z)9@@b`By;$ypYCN*ux)VgJ}$(VB7-UDs6`HxwKeP(r<zu_V4XDSr^Fn74EkcGZGD~
zlB%byldXa6ocg;r3VlT?^{tF{#`HeneKq;6Lf(7VEY>-eNx(|d9zyG%&Ql7=;Vx}A
zqj_$fJXRPJop=Dy@gZXBKs4!%ehJLbn|bi=j#?8Rs*Y9J^oB;bv<9Px-BdCop7}Xd
zOH4Iz(KOaulCNrJDIGwd!)K`9Wx&2i=JG-(BsEnuzlStqSBv|&4Xc#<vsUk9)%RaK
zHj1Q*r1BEAHn(<<ZE~u4CYvc&+&f55ou@*NT2&=ZpmQj-|1zN~5G2F)T{HWcsRFJ2
zObe*FP#Pn)yDk*DA%qBzy3OLTKdDCy(@PruR3TDYE*EJoghxW8#%`p;zQBqDq1-Gp
zpe=H45QeISVPI>&kf9Tg+~`FjHVWkPZZT*J{vAmKTpOx%pmibAOIY+3*qWyGkAv>=
z6WRk77^4@BbXo{ILQtEbsDWw@kyqHsY4f4Y1qlv?DU)@26uo=T|9ufKT6gT+pq|qL
z1})50J|23wI`w60$9hc6^6)1|qxKLMXB2nj<r^a{M_AZe6;Z(!w9)v1E#>8EPRWyI
zRzst^?B?I)PW9QPo&5tXXP-2S;HG?!I^163_fFPhU|_5ozc1y{1jjqbBJD0I2=ho)
zPCZuT2O%ZC0Q&JtzEK3(RbSYY{0QkC9bt{!%?NjWz%N|qD|Rbd?&=?wd5H7NCoRa1
zj=Ogtg4EpSk*D!voP7$Pv=rHKy1OM;MPg#m21t>|t76FBOM$F<$w(rD2a9|N9rC-D
z20+7iKoQQw+4<3e4sHbF6}VTtDx!@N(hZ(JMD=WcQR6AbL1zFNd0k1x-<K;PQyVPV
zg+hx15MIr5T~4QhM7KhgORb<m@}5@oF39*o4cZVkNJ^mC5KaSOQCl5|>`9`cEsD9F
z58--tpQDmE-JyCyv4vi>bY$jHCgL#~0Cd;%ls|M=dIa6|8YV*3NQl;1bFm%80mQO{
z+|_WYp~Ia9*|goBrqcSonoocvWL)K**GIP-JcLV-wX1hI)Vt;l4AF#9r3P`7H|o%N
zPFXBZYAey@0|-PNqstn%e3m9kdca1!l@r57ynt{KY+*`Ww8qAOMM?P%+<SpoMgIwf
zugz|-Fwmw(G_FfBa8e(|i3ivL3xB_G7bz)@jll}3^TxA;W}N-vg!T|=3?QuhDM*Rl
zFIew=hE|AN^;m{TwVjQ8I*%sn6(%Iin_lPhbK+_uN~_2Yzk+sD2ds2CK_|b<$QP-n
z6WyuxI_P%bZ@%|w2s@FTqza$a_i0qL{^30~-qy}O#kKg?U8O_M(9Ru0O_NDX6zE{H
zFwlJ=QopU0-J5W@(GA-cx!4Vhg4S!RT0y*ec8nfmxHFRibG+-&BWll?2PN{;yIXlZ
zQYLtN%o6{3hjbnNZs&4g1|0<LVTZ#|+d&bGAaX>K-YJyzjiY}s)aNkaVpaNJs13{S
zyMI!rd{4%#WOfKw=NPZBbxw7=E@RWtQ(IRUNqA%}4zpza>w`<j3}`pQkOTlqc3UAa
z)6Rlnvwxhzu61rkK6em3XZYDJDgAY12(@Nan?7EqUuNrMfvD^!y2d<jo}8Smubw#d
zb)R@MxrhOA#3RM1oO|#_*Y%S}A5FR9)nki>D+RXhz#l}nzXp+0zuM(<`SqE^{<z~Q
zKK_7q2&$YtG{N6lyxaDPsYMn|VD((z_wS`VuM<+4a9=jJPyd!bSW~t&+R8=@uaxIv
zfMW^5jVc4T>CAk0ueMGDZl@#L%au7NJ*Ls;O?r1?EGu>?Oa+<q2fHue)Gf)XjPjo>
z`vk4C4mtJZi@&{FbLIHnK02na{Uz$#_t_-|GU5FQz)PwC!v|6Xz)>Y&*1<^i9Yi6%
zCQ^yHiLD!jmcQX(#t)uhaF4bK_kr15{vO^h@reSsm0vxhL+JVm8i+zswJ-pk-a{CT
z_m7neUk;*CFY{6vz>#VFyx4~3qf9VTD#EWOqlD?;H`y%q8Ih<+638_KnM(Z2g%O!9
zt1hJT42)%qhfgjNNXR$Hd7=nXV|;HoV?G^$YLBk*j3W}S<LCNM(89`+o<mzC%^j$H
zTdI5x$XFWig{9xVPs^X2T9WQ@w^VuK*%{`AQ!(zm*i4yks`!fPAUIjPK!8`l%E)Rh
zEv0qOnSTOoOQU2zf~Q|>_5$(RUFOge_WtRbC4d&`Ake3iFYEnfE6EbT&Nui5&})j9
zmMn~@PF+rcq^U+G;N{s$ZNAArK&;T(0(Sd77u%_jW2N}h))atI(;!V{0MtdludTEO
z^B626j!fO1c!Q$#&Q$9-?)GBq1B|a|Z7{od;)Srd1U^M6;vFm*rE2+-f2kCC4Ds;3
zt2sd`<r>V@zdcF7Eca@kE-kh;7ynB0AcR>F)NM!Vj_kQ=rv7=PA`-v|8Zy5hdJ_72
z5!D1)^_Im%U@Y~m&T?Q4hsdJ*2-mWmUw!48$kVyO@K+xP>z``}h9k)WLH7*6C7{l^
zcl9LDmx3|g7FERz`A0IM?8a1rQX(!KEJ0Er)9f|OAR`nk+5TPT6UdoSUSbRdb!?4O
zLg?Km*WGbm?n7DR<Udl)Q_9fxp>>QtnnLWw23;R!e7AhCu`|Ulz_v{W^&?awlJ#U|
zUT%%TtO;7FTM0r*0bXv6SH=*i^bSA~?2aj0*8&*g1@9rhc=k0m;Y2mfFC9LlLo1_9
z{X41OmpVpjsuG+4#lYI;Wl=&_Zbg;2l^}2684q$!VSc{xD}s=Mqi?`s_|1P7!*faR
zU0!)jlg1^*0e#E2-HNEYPP`HiDmEH!xD4K{WOXr;2YOv!1T$3$^TLM!fv~5yEEv~E
zsdE?am#W0aPU1RLZ%5}KEyiD>i7|1wVg?R}|1ny0mydp8$Jx1Cd<G%c(|-L_@hcCi
zr<egh;t_uAcsW!Nc82nQ>#{iQ5`O>c)KDZ@6Sa*lO>jVL%uE*2J)kTf_$V9}(vAlB
zSq$%J!2ZI8pKr91MD;2u0Sw?h#z1IF&(SlO&qZ%k<F6ZPBQ#4(OJkbR5j-DGz@4~v
zG(LLxq$_9$AUOeG=Th4^$e%)#6BXdL#rgEVGS%&5Jq7fp?QviiaE{lA?;N6)D3JQA
zvIoEZ(q5I_2yEd>`|@FJ6a5r+QI}3@@^Bf~uI+|LJtN`8-)>x&%AnHqo6&cNu)<G#
zud}GBsT0f34_3VCNt5&g8d+XQB3X>~SXE1yzsCdTwYfK`ZOI5lKOEepTy$f)X>k+W
z5FB2Yys4;8aFxkM!6IiO{S0s&B~Q(dBSZ3SH|!@%By_tRM1KUf7t>=59p7ByF_tms
zT_|L1JxqY=IxtD_XcNRNtM(4xVI(SK8%RXhKfR`PtEmMfiG;@(1lphmqLPhf{?IOG
zAz)$oP;OHrJ1ofcaTu)@0S4mM&?w32{>Z}?c;>^uhY8J376ci)@`Mg7%rQaFcoHzr
z7046sFP|D2$Z$mAuJ&Mmd=iQ~$KPp{{it$;Z3Z~ShTV>^+r3qCnjinctI4m^J^9I_
zW9a=&7jNc8E0D5^U*Z{}<?Fa4nRuq+=N=3m&>RZ2_URFR@>FX1%Px)3X)(iX)(4nl
z^SXMGoM-N8FXWTJtELi8sdpMF``enVnxd~u`a(a=H$Ny<Z$jeaeO^orG#N3=UWTRe
zic5%+!EP{+*HkdOvlpYivp2E#vBpKGW0<G+-qJ-{rik%9E@AB_uA1lSm?n$g=jbpm
z;lOrr_BJF`$y4NI30s$M#ka!w9%|L?XLDks#@c+)Mud=y)}f$`Q5^YZ)r>|qlKWfO
znbHp+Q;VP_2+ncUEV*_&v0>@f0}omAz3>=+G}E2FGuGB33xpw<;-xeu6KMz)aFoo3
z$rOg+{PUERZz2M9X~<?y$2WY%vDX=5!PD+Wz-n<$@ZS5MRU`rVd^9(&F^(??Q^Woz
z1^4c->ZDQr4p-{3bp7GJ;TiHMN*oDmMn$^Bwv(O6RM>-aJR>n`cLA+=nmn~c-hpD@
zOs5R;{5(Lzbx|u8+T<ECdew+0`X5Rwr$!pLvMXmiaGj=!P}Ko5uyMecQ^3`H<LYsL
zdu|(#aLDWe>+ZJDxxIpB+y*7anIdQt$2&3+k9+e^g7pQk_}jY!-&jc5-XIp-drWtW
zb_*Y$zfd?`nPR(r!4gjX$8VUKOBMIy?;K#>#(aEBz<zUNm0A4N8LhypGfpGJEIozf
zo+JL@5Ddo)v!RK8ZvvKwJkViD5A$q|or46Ni<8Hjvb3KgrCSIZFg!1m8mOQB-uwut
zP_MeZWt*xjXWqMx3~Uv+6%)r_7%DL0rad^7)}|-)B6CCDVpdhg*f~Qs2^?uwDSxIL
zLdE~<F`i2<Zx%{(HAz^pDc{~#uI*GpOoojzLXb4#?EinQ5sFCV8s}<fiEOGV>&^bs
zh<Ka+yYqBHcOg3Wvm&9^uY_y#KeVDoLN|-T&8&lZTG?jgHlAT(eHC#+RM|%C6^fXP
z)Su=V)L&GNdlD|Vn*p-Vjo$a0lX=hIPEUV2?z>mr3>l|$O34puo!FEi-^r#X0`c}K
zE7^d<IEL7%ND|O5nb|t`X{*GOzxkS_4jNWEBaMti(0x!eXt(W|czmh~MPvZtNHgk|
zp7x^pEq+8n6(Tt4{dnaLD*aQF?k31*$k8$);920c;9SKt|1Yr$%=kAKN`gDS)9#Oj
zd@(GP<=}Ujc-zYds5?*~Q^Rn99Lj*POM+xYBx`|w@-c)u4VA9)CB{xDFlOBJUw9Pv
zy=8w#e(CFEa>G}@+r-PtAOd%NgRUT?koiI-W9f1#N+c2>$3D$P_>vI^@HgmHM4M{`
z<L!Qn(m9WmDO0spnd2ZU+||j&S>#GyzH5)DJ6QI?o2ClFVpD(x9g{#%dtCnX_qd4u
zUOKt%*D_Oq17LTa9Fir3C!M9~Nr^{JIb#41afH`Y(G3I%!j}Agp&Hx6@@(o4!D%hi
zWx*vKaDR}j(d?0Gn;_2c*L*x0#oSUi2kkXEgPh-5F=&QVQeICllLHe!9ui>POeM!l
z*8gAu*z(<?n;GsAcKI6d_SP<43Zi*P9Bu126s-ds3G7ErpR=JV$GRlBZRFto?dj-i
z#Q*-hwRFIx5I?_ae-_^-)?cGmw)cUJC);q9;}V0t;t@>E*cwVX_B}pYdULrUDQozI
z*@?NaK~|je!>bBr1+15MWSt4*K!vU@wR7bvdPvOSApPl6`1iiS5~Mq=AhsI2<W$C!
zangu%!HV2Ttss5|s#G3?NFgI9T+)${<HQSd2w58na($yp+p@&0tkb3eqH;IN;@CZ;
zCr-@y!+|j-_QYv{+}AXA(O-|hI84seGr3FU&;9K`KNEeY>P!D=b!+F?tc<e<l^@#3
zoasTE_{P&~g9V11X#7w&#K<oPDH=_VRV~GYTel1EryYT&n6Ri1qv%cF$p;VRV){cF
zdUu|emy<^^;uK6bN)j8gYM<Ea7S;wgA8^UXAp6G^crB9e@wrw*7)HSJtofh)F&NWP
z`|)NXoIm9d@ec8!l(v(&P#)&{+wNjCAiap|J!0^GtL;`n<KowLLmH=~cHo8f)0|d4
z0Cw-5#b2(O!a$uN2kcxSE9V>>)Huqu5}oo6^Un3FIV)@^{#We?3?oSAjZfX2j{Ngg
z{p^+opqq0BNO8DGd$DSqKlUfL`*EX-x~_c*7nN8OXrL$IWas5fY5k!D@eGe&W-qmG
zKEORY{`@KYn|K1-@D5XHA#wWFL+)phSA-=4pyE;sCCX=v{Yv!8djCc@Drr}EyVv{n
z<HQf>w^|5rXD9*FS|#ArcumJOyyvR?isD3nSaubv3XAnp6))5`=^%owRvMVlJ%H9Q
z$HgZ`B{jN8x(~VLJV1`ZJagzH4b~=vD{j1p`bDBrOsWoP$csO(7>W7~3|_C7WyLYt
zUZ0o`NtWzN&HUPfuDTO57*)@BQSFJDOW@|#F&5js>Pq!AW^f37?RloPz@GEAjctRJ
zD0_H5Qvd5Cq#{g{K&^QkqdQyw(Jv&IQduwL0>&Sd@=FyY*qNx}%G`uq+qzB!mcK7c
zO_<N(%a5M}8ye?0H^veWE>H_Io}5K<^nvZ-0{)I{5eJhc#!Kgatm{&Zk$Qc<oQhmt
zt;vW#TGAk_2`dT87QguJ>S`(LkIx~jk+inS@EVr_RJ?TQW+QbM1>9bdRE3Gix78yd
zo7Uc@hFM@Ao+HLW@$UtY?D4Ntzr1!a&4-wjpN7WKz8`(Kfzs#jy-xS95HiP3#>n*m
zppEhWLam^2L$+@>Tts>x{RLuzG0&YbauyLSIP6NH?*bOR{bvm9HN#-vg7dF3$Ok|M
zX|(JBuNply9xuDgJGNUsee;>}Kd~yL;ISNfcfxSW(3~<nX<?Z(xko^GFln~{#zLm~
zT!GGsa5r2>=pgso!Sczz{hVFmT0Ugt(yD9vzFR#>kMi`Rv;Qgcp=@86>D!-WeY9Y?
z5wjs4?Ea*;qhha$F#iFofTM}9>>a3ATdJ;-xsS6qYTBLgf7d;+6t}eW4Q>if)l9$d
zRKML)YF-b_mi%;QxVf_W`<+@mL*9o~??mzP<PJkr%N)5G-aLi}h8<Dpk+j6S5CYmk
zpwtTOFlFq#Z2*#iQN>8ZQh<q@+lYHB7I^3e+nv2fy|v!Ws_Ie2vGJqBZ4G{s5pRZ`
zF{VlhPqs>vX~-yvxIb%QUt=%Cw+%ymhm>jAx=L8<h#{-+2~s~h-L!(2KKPehBZNgq
zt*4zE)nQ_WF$6`Agx5nww+VcHBA6%*OGBU>5p5;fHGYrrH`~I5=B4phWy{4@JdE_8
z(ATs;|6C#Z*iTA602_&7p&`7XM89m2JnK}^Z6^EUamVo@S=?H2u-Z}oSVjI<OceFF
z)WbFchd`G^*1_XRlB6)k&Z;oRBi_f>>^aj(UsrSAz-`hQI`J_+ymAM$PM0w6-FNZ-
zlr?{g8vv99IJ1CU+*!2YjN_-nz_!)rLjF99pMGLrbzL8cxL*nEJkU(n)KAaW1TY`D
zQO7QbX+|U!R)33buU_E?4t-oP*4|_L$e!p({@50h_07C-B@)RaOlwG2w<0(*<Ng=;
z#+oEtUZGObfM<AZ(%uC{k!XYTC#nqqx5&%7EU>Dc+oh}>-OjuVLjC}iBYc9qSqkg|
zoNX!b>q!fhi9fR8=a}4R!>s||HSmV6l%{x72IfNL-dTs@U!s@<^6<h5vDJun6V5Ok
z8PPw-FtO(0yK@wZp<s%$xj^EdlcoY2A=lo}cotfCtR8-MsEDu6`y?$V12OFS;zPvf
zFCt@K^GteSLO)>*JE!MVY8X|NlJ9=$4H9b*b4wQUatjr@d-#f!-Y@pHcwD_dpo`rY
z4RP<EjV;XI^9(Q0NxRm+FlBnSWb`e|6YWq8vy}&J44_Buh2w?}S(gRQ3un(POddQj
z9$QaqXR2sNg3ugdzhZ1QPEL)T$-CTsy{T(<w>b*eo%kzLWL4*pYNqUe`LKF<X%{F3
zmT0jRzDj7G=<uWV=9YcX%q)0`QjxRybmuR!f|W`Y7BkYi`W!&A=?Pf9mjdSJj1T@e
z33@iy85G|KTQ|lIocO|%=BcFl%JMSZ+vZQaJ~|S31{q1rDUfZD9$yR34U)0^rHu5J
zjB>L{|2t|$=WSV>VXfkMWhJKRIe-~K`YnTLnIg4ZJ8Cfsd<R3WV@_|t>M{lh&Sflu
zb4dY(p)Mo}M>hnqF5EZ;{T@JTmr0;t+Ja(iXzQDfBS<3|hdJ#mIzu0sX5OP_Q_3T=
z)7ESZZE*}o(RRkkC*J`XHG1L8Y2B=tSQ4_EbLjcgXfK}-Iv4Fbn~YdyB>-LVQE)NY
zxTRqDex)yRLYAPH*V>m8Uf`K@raG>2<H}rd3Va=yvV0p{6?xOu?F##*{~>2M6A8CT
zzOUBZe0m(4baN_iWM^uIwY<q+K$ZpD%E*V?j7?tFt=&H*_`S8JkOPDjge{tS6(cSG
zzBPY;-XY970GnsQm^a2Ub)9H8p0-B3!u}K^GsSj%GYMl@+y_A8P+h*vdcAe2AfTC+
zO-o||5)c-K0wDSzK-E>=xBw%*u9qzzg5CqHM}+NBxD?bgTVhx}KD1+4l_M@yauiBH
z@4K~rOmdqvN^!`G;Yf(Y2WStmeph)%?8{oCKzE^l?%Oc%OU4#`g>1Q+2$W0fj*rJX
z3#}J-zA#=!dc)U4!P0{zwyO+eJOLg6r;F5UTVZr$K<g%83Xu;ygK8qAr9Y-b#?R<!
zr?y`QuY@+a&EKTxyL@@VO&i1rod2n!v;(i%j-tp;HM<3aB|M>BTgUN1)}fSWuTinw
zw9pa3pzC1r6YLojK}R<Ga9|RT0ZihV#hiMi_VzoY78K+z@mc^y<4@!qv-t&tAPq;6
z<F}!2Q=M`>7siWGVtU#j5-2X=`ed*@3m43aMNJ@X4ObDEX%7JFOnf>D6&3ZP>aVk(
zZEZ{K>(|Z=nwGwuMF<<s^L{#xO~O%*6GO)1<rte((O|73g1E~Lv%3&@JT}r;@Qw8<
z$9a~sGt#^8{9bwz@XISN>dsr7uHKbU`OnHq1zE3$*f0xDiA8Q(gWCAdl?DiI0l%TL
z)}P6~(-WTDu3qN_R2?9wADFPm%HUxmdh;2jKI6S5HmW-&3#GWhq)1}9<#%MadKoqj
zmzJj2LXh5oLI)DnIiVwt|2fRxa#@75dNE1eDa`PWE|s!R4)6b`C_gPT$W*V_%HT=a
z!|oXA2W}3mUru;SB^}jp$)OzxrDH?I^yu)(0B*m?#uCtXj31HUf8zlmZ7l(o!43c*
zd)?XmuWtap?SCZ3EB-4no=<xDQnI;7(`f_jJ#w>xRw}5Ow6;2`^YqaExczv&2-(Mu
zrWVnVry*Mh23S{Hu6}iR?rlmG1MVdN4S$W~r+&cEOY-Zf;R9Hj1jL>oqZ2EZ7q%=p
zx`Zr<*3U#!D+!koZt=%#7C5pgdnPk?<eOOrkr_M}jWd4f-GeJ^MfIU8i1{tj!wgSb
zWD=*o4fFmOr?3L%I$IXf+>8zOEye{_pd&}$7!XYH1PhlTI*rP9DIK&^LC;t1?}{zo
z(ei*ObRH}N3&wLSzNoi7O`b2)NWU5FSmYW(Z6F&1_5so-dvV@N>=1*Okr+0z%$3D?
zcAT-6&5=#enYI-nu9ItEtgjS+yAFg#V6t?R5S94vBGIOsYFTf$PFW<{WS1-V384DF
z{QPOaY&E(9_kDcGqSnI9k{c=ztv#~I_fB&Gfdd+K8?=V#IE(sh_>$1a2}jO&_8^@v
zwX$_*<iZ|Z??CvOhlYoc9lqlmqZM-%+V7N*8l2Hf1GH23yNpwy%g7rv9Ayim&Zhj#
zZ~~U<T>VgAcB$U%<BFa)>13?Na3p3v>HGZh?haW%nCHc*`fzGJq|YXBK*3MkBI};x
zg<;d@XZ-b+dU9MM<D_w^K~%SW5sQ!8fomt_vjHOKv)C&QWV--~V;^tQJDdBw`N3eM
z82hz9$*P15{7%#lFXx}I^ZI26KE>1Yg3lD1_}wfJp*5YXpW?gYquW|96f)%+*A?jQ
zw1bZQ>q6ce1Dm<tE;>d|EB5R2Du<W0D~Q>@P|-B#d=Dkf+>Ke2zYfvh?bAvCqHJPU
zna{Zo?aB<sHC!rkFM%PrGtw^vDi9EwF#ZTl7Fhj{gu3zUlt5@-DFWzfp0!Y;wL^^W
zMTyqEGw$8w|EHL<H|^DJ;6OxO-opByy<7#_3vy~VotHz0?Jh?QPOIk>b)bBXGPp1j
zOM}Lm5KfB$Ae}>wbH!=j`zr_j$vHC}_X*{G|IeKBVQT;-dMVR+k8i%Wo7$^B`q3+a
zIJ?r&Dvi*Yf%LqUO`T>h$+*;?&hvDLRzJqai!<R*xrHdXfUe=gf02Kd^rk|*T8bk}
z-s|@*e_=1l=x7eizqbpk6}SPvN?ls=wqKYNsXFr2qx>UsWO-68ept~jHO<v4QPvAs
zLBj*}Kh^v2#f?xic96A~WY@@$-j?sdAV6*mrA*ku=n0H`kLr4bW)diK$KUsinw-}>
z5F1|Iie>hSU%Dv3Iyc<M%OLh4$csBB?>TJrj9YNzM>_F2p!2S|IXx$ZG6iZuM%ln6
zIi@5rKbnB`M?i@@Ej^+S<QgU2;wD>(*f4<b2yrmJ0@M%7^h9YW4mw!jI8=a2i=|EQ
ztp(|ui0UBzN`diPk3Q8#Eu>Z8w-(BXF_w5v>XDBz>{06OlCzZCjW@9==E9D48s*R-
z41jm@U1n6Im-8~RBclkHH#9Jx);)TZnu3~*Q0%q~_b6vugp}o1xZQ(>T;y)knbxW0
zWVJ-ici?`_VRJO((jkE|MQ=6cdH<s?lBc7euE*PJj&5e^9Mw2__D|;!7%^IpDnS4H
z{CpL2Wm*N$|9BV&A2e2puNP+Xe571VBa{|6gGJ<|q#U)KLCLC9%7Oh2xxeirN%TgB
z*?egiEh4eWOMs^RbFCtx9l`3628!|-L-m1|OlM+VD?Y0E^X3YbpxMWy$>I5#XD(vI
zvG^BeTMX0EVnXI+x(ZRK3%x9Mqa9)&&YR?G6U50rBcu(74vnyv7G$Rd)_FL5=CvUT
zaL);8otJ=a?(q4i^f{UzfN-D@P--ALFC686Q$HIgN3W}e`R9$0F;L(orpgnJEpj<#
z!f7{tg;*p-wIMsk?tIJ3#c$-N2U;BsbjB=*I|iMm5>i+35fhn5GaWASAOl)Z%6(@P
z1IWHxDpIpkv+w$oahyp4^})J3@f+Fg;yyPJ*xNVe?$DA@eDbBc8pG(;7vQR)9vz|O
zaJ#Y7X+B(jM9uvv=kQ5-d9u@$7gfS0-gjQpHDSWPQ?B8LKc?8f-L@qLb$?5PkcEH9
z;_RYN)C$GO4e>jo`$V%g9Chv@Ft{_4$#6c-u|G@VMSrH4YX3(GRnwh`YKDA7%RUi~
zcMx)y{$Bf=&uJkw)n{(4yjdiPyd&$&R+;p<R+81t*5`nD45m4NH#>+Er#S8*hnI+o
zp{}74mm%XHSTSP*IXLT^;C5GWrQSxo3&iv>XVCA$q88&9x*rasL8w-!&k*(1SV%t$
zC?)H2t)FgJ)md1sw3p2&+iRq^SyI`^u;-zq*^#<GSBTuBu^5)2wzO@nDDu}d$}*%C
zs+TpL8*Y8W3y3M}cgke|nW<Qjb8myauSmCyG7-%I3!=t=(z7EHzoM1V%(iV%q?zsE
zI)=a$otZx&IMKIm5rH%9;`EK(mG5r4<TcG*Q3iTtY=z?vr)-~k2j!c1$y^gkfa^6^
zQo6!D?P9{|7_Uf%y(3_8rRJH(93>~DxHnwUU6Q}UqmK3Wg_YJO_Y1tfd9%Ymtb+?W
z$1g4*<XhQ$+q%sS)ta}5S(4wF1J2XN2lFzQM4s-}bR_!>SAQ9cA6$`6a&!*t)Vadg
z<jMQ6QZz_#@bu_}^WmU|Jh;1YE@AXB=jWFJAr9Dx76$gL)IRnapF4f+@X6k%8+bf$
zkrYehI`_3SBnHjEZCt-j4xCSikyEvyBh?ZC@pN<70Iba{<{$WPXba~jJmy}WkCjWW
zN}h*2yC4-lvY7M4q&z4hAlw&;DfipdQ90*Zk=3U6*`te(;Mw^_XXdNmlAD32N3{Q|
zSunK5Ybs-Y4~lOsd8JP(wf*sX|2idYxSPDHv3x}2G*DHu>A5^;VJZv(76D-`Af1}`
z6GdyIAY$!pjAOFs2&O4mPy4~0TuV_L&hC}HyJS`<oB*yOnE6k@&ANOCX69v`8{`w=
z?Hk!E8;uEsFJMW-2MjL3S;&ztycrOgPia}H-2sol&8Lkk61cm8iR6$B9t+}mp^lOt
zoBW43Dtj_>#J%x2T(3QPX_xSl0{AN)-eZr@esa0<WWI&>9GCHyib2%27d}cAjQ3{z
z@|v!OG&*djboLU)&d+O`2L3JD&{g6){<Ua3eF7{Z-~NSjj7$ESjR46|&lz<RKQZwM
zuV5#ER^uVQuVhe`)8?ka;sf=x>~zZfPj|k{;>RF-{1LP(>ncvoG&<;D)cJ9*DHV}T
z{2y?Bi8|HdamxdVG0maM0S>FfW}<X9DZ!Kg$6z?sBHYheFW9|tn?xJ~QiYkVZVW6s
z{}59}l2%TS!5b*!jwJ>wK>g1^)jlB*s6zU`4^*xCN?+xtQ};o&oh-=S*dLQ$>`Iu~
zDQ-vR-rH||-ETuy4hA%GR6@i|3;`*S%(i^-Ssj=?;qekwOSc<4qKAL){4>>WzB@RK
zrXeyem$t>?&cv3n5i6|!R2SjJZZ4LEVI(8{=!ahb`iwLJAB_6=JiLFE@Cu(WB`O8T
zNFr8vNXYaDG#aeL3yQRslWj_6y;Ccv1XEsLP}vyA#jQ)t*<|neB;QGleA#<jqA78e
ztfN`7q03=Md|P<AF+y_gkzbARAzd>GKFN@!LsRx;j87;{=Y^yEz2I2=MzL{7wVi@@
z7TciN((?L4Q|+wm{Kz$wr-4Jh!4*FAwjuV_z|KDycEoBLK~22z@k-UVS7Dddjd+K`
z?Ny`tYM7D7tt4H&Y}&vq$1B|yT6*|ocSkSl@TN-3H!DPzhHl1hs|6$g{cHO<cdYCC
z_acjU09K-f39Wx1o%^T4YgDPggLbIjzYSCg!?WJ(9N^vzXpolqs7DmfOmcr@pt+EK
z6NboBP5s~Gslq7!w<|V)WE+TuQH?iFM8LSy&EcY6=I$``(*4QLw`#@QbfY@_1>-`F
zRz{Ke6c8W{HSG2AX;*KZ%h6*R?p)Nc0!q@@)I;wO_Uf#ZZYyKFRcJBP+cv{Jqu`JC
zr12-*^sk8i_h$%|!8vQ+>vttJdhb}~-bI)PMaM7ipfftH@Tsx(_x4NttjNj$<du`E
z^p}HgHX_jxuj958#uZ?M43ZI$zQ4kNJd`&idQWeR2@#OL<IeX!5^t_VVP!Ep35<Hr
zNOx$idZR-y6Owj76znCv_lP;m9To$wKe&8?#@CDkR|<GaKg4&(DTPSz7z-t03)Slh
z;XBrwBughkw1F~=yOr7Fp=G)N1cEPC_T$f3Kho?kKCsb=2Z~sd(A)K%P&Eow*cf36
z?qLei=>1%^9vPYkVTgy~Kll=wiNZ4@^>`l<4AB#x-pql{tp=#@U6o9ha~zD)M0DBL
zi(cQPa;P35;j@)1+tNj>WYW=JVYvii<vMD@RY{}T*ioAmCi?+57sPU{d5z(QQ?|eP
zM42hm>Av?D5yJ&Qm!-QWGP4sW&2mssiZ?M+1G_NISO>o<BRi*f#@+vZsQxYN5m}zu
zNahHS5GrAR&>j%!cBb)0l3*Fynuu(VOrRbAgz7?Sfmo2x{+in!G(kGa|L_N8!aEnt
zr!T|3TD!4X*Dso*dU(^7e;<`xfD+nqE~bl`Uq^zTJ9%8Gu9Iic{svT+&@@KwQy9w0
zcT`cWG+Yg?8iwqxi6-phdBEO970KXEl@qY6;58v-XRPKw*Xk!2pZX!6ccKfgq?&4@
z2iSkW8Hh}Q(G-3#&4xBAMru!zLG(6o;?})em@3=sBlpjx{>m{;cW#(=rUq9z5DH72
z<F8r2l#6=#yU7$+{gjyDFjo?-xVruG-{{Vs>c5v@hIWU!rGGTwK0BlRw%7N4XOswn
z`Z3{-EUee3!0}i_5tQ2;9YAfu{1P@hI`vgJ7~??r*}v*9!>x2RClCH>CxVNFd;;38
z+=;QVl8hM9;j`8@7F7HRiL3uEzu>rpBceO%bNdkf%gk({en4~zXfYyJbdk{;orve&
z^)}x0jvnc{nc8v4X?zZ|z|Mv0%KIw5VKFVzfFr0c<E7A5sT(d?yM!9;3)7S?{JQtn
zH;i<nmelv9>Q+WS``!Req%$cUmODk{+PYQw-`QJCXC(8#USg|M1^@t6>SD;seNa4q
z;za<e4|bmme4q^N5QgRts3)}>N6<c@gPKEpvHQX81^}*sqUE&H!^E|0)=qpB>V21A
zk~65{;%AhWQyBe6Z3ZmLL*A$)LRYKBMEu%WddcfgOa-zA6?M2t#34CKzXm@aHN{tH
z23#a-yOJmQtd%#)@S@2?FarL2k?yk8OKcKHOFPOPp=*LK00*BaNVfBTq~P1>4-gC|
zg6V)aY{aJ!LZT}~BDJWA{J+*}hPhpgm%UQ#pVr7E*{d2udM#h8q@tFAJ|ElBZ+6&N
z7EZ#pfjbR?0<=;XP)+>hN+Nr0kSG=qVbT6SiLh`Q>;G>fENiw0D+6<R$HH?YjVD*~
zyeKkp>bbNAdf7)dcO-Ej-C)kP$2oA)P8RDOnc?-4D3v=+{}%3~<RXXY&WDLTeLZ#P
zjSlFKxb8GrTSw)+vV>K7m))Y$H2n?4KTPO~ZcxSO27Rcc^rj789cKCX5?@knhI<_~
zlO+dil~EgiGn$ayvqGZEko#5g+a_zx*d*S9eL|`S%q*Frly>)>`%^oDtE9M8b)EZ_
zIacK#E{zTt=g<wKK50}c=rLAj%fuysYOa#m%&lh0M#-F#_T(r&xMcBPb_ez6qrj%j
z1E2S`b|?~oq#tdN78{fQAvk-SiSeiY_gOfikA=$MYB|}eG(l$!5ojb6ARHXT58jFt
z8?#GC{Ui0{{C^|${DZ%5L_hzQ>8^uH;i{rsx8;2k-RrTEp`otc{jQHR?v?t80TIjf
zBe=;5ZUXqgKbRS*{gu=aFgi|+OYNykO;&bz-r4I5w^DhVLw9^8TR-jO?KeYc^o>7u
zNId~D;CmJDCY}gkFaG=K>&7bqknaHV!^P;4qt0WaD)~6|0~5cho?D6C210T59JN4j
z*aaEqeDfFXyA99ey}e7RuPe>IO56oWn2*@u*S>3Aw*_OY{HdB<Yrj6NX2Ene=t*0=
z0irF{EaNY1Kl_$7qDlV1Sw#bBZ-I0(jE4ltWAP67{A0q9O(bJ(nq6hg;SElBWXW3?
zY67lqLXXiA6s>`H1m?WAZ>SmsY8~Th7G5VqTf!vt2Sm|XX|dPhk0hf6?aV(OFu5G8
zc>O|=c<73+_YSlFgK<_SQX16@*I>q{y;g0Ru269jXr_GDJ+sszdk$0PtPJ)8nc0mZ
zP1<gB=`Y<D%#9!*&B}7>BkF4N^LO=}`c04-x#-WJe;cov86JR`!LUO^1mlh{cpkj|
z*4K{Yi%u5|Xk06SK-Y)d28)$@zyomDHEf{({=}UZ7FrYJgzllV7>M~0)L$9BOk9i5
zN!mdIC1v6ZDfkn-sqQ2YHmt|n7tgp+V6SNpzWY`KUN>i05UBG%f*s4RFo={ad{+Ye
z&9WBCb?;W2Bs%gWYU+$mqz-BPzHGpfCc*wm$#pTpH~e{{ptK~z47T7~X6jV|KoA+8
zcMc*<@4JL8#_dY{dK)d-MGFd|lLRvDA34Dh-yL>>l&8PA`j;iT;QTUf!yt{Si4EIi
zxWQA<BdVj?GL&-caU%;5P47R(ZAHVpXjHyGB3spU;<BwL4QpX&M<NR!dRH2F8=|`v
z1!nkC9(h_ECuF1}Q{^{7C1u*_r_+f~yuvCMkqrNt(3{WkphM*t93_AKJzH<zf_Meg
zg?wMkj3*63cnYasgqc7>l_f-*LE!$~+$8b$5}SnSw|OC2$i%IY_;(%=XI=>jg1eYA
zxKtEycw2|kVYC!F+{PW2w?2;c<7jZU{nYmd{M+&K*Nw3bkyKT^>wYz2gz8zRsH81}
z8ls2P-cQGEz4`2v*S+OcD*c_)3J<}cm2s%9dsvjSW8a6GTHE^V-Nzc`P^1sgA2J(5
z717k{CEw-&g)-*^$92j{f9QWJjgju|D&Vvc^KIx^g|hJAG$1|XI!J+OkKywJ$|UZM
zCo3h$rx8mVQ$RYQ;pi*kyI%)ZQ!u;_9>5!pr@eqN;%F^F6(aP^qBK^V86M`GVAc@0
ztTUcVeFR9$NI&&;V52lUkuf)^*RIjDhb!lsJzlz9w^RIA*%?&BMjI9)7;&j8Vs1jJ
zaMkf8e{$fTwZq*sX{VLoM<a^K$j-o?;uhf4xWZX@W*f%x4w(7%)FEAJ2K5B=bzR>i
zWchh9VVMeA1pg}fW_=}-Xv402x4#j`Gmljz1)0z)F`v>Jys}fhvS^3fL~T{Xqb%S|
zoglocW=xmw1^x(J2$2i;h@%34^~)~$fTwZs@n02UD2fk@ke^C>f*%Qu($(AsIu3mo
zp3iahGjf=#(4m4@yp!@h&eHNF8GKP?`J#&3#@B6-OnO1{X{2Ff*`51b_A!cM4}lYj
zU*iGwHi3*6lK+rEMZ45Uhqv;J;_x*TZAy6oAWh{Y4WgQFEqJ@hedB;b1U?A@(s9p#
zJ?`Jg##%%6h(P(&#`{#bzopvj1KS-~H(^!aMDaT2j!=bboot?mjVBaqzqHVP-5DIl
zB-li26U<ZNdoW=g3RbprvoGp8>w!c$821UY<D6+%p#Yj=8l!(TsC}In^X1iLIqbGE
zbJxpJRG!G1onJX}24`zgM&1nL-4IGLJe#@`F%RA2JpWj30+_h503%;aoixc6kQw^I
zY8p`61v)YC%aXQc{y)kLHU3Lx=o&5Qe@qPB1)L3_?j+_sy%$*eWbx8mF&K&x9n2ir
zfKqmcZqi|cU&r<mb`xp&@_ApH0^tXN;7CdeUu*qm&(sov+oEF@%W#+twOqRKlHm6l
zTmHZ<#UI7R`@3(OPZmtP_lumjGR&Tz@6PJhN_{dTlqz`moOevQhG`F_?v0cz?&<x*
zqUD89-`2_fi=&Yr#Any<8Yi2RQ|DQ`G1$V3oY?w6;@fRLo7SqFXV>pvC@;%`u;^$o
z?`Wt0AI{zaD$1|j8y<4#lFmV-q>+vRL_j(WkRA}Eo1q36x}=nnZd9aG8ir5_34x&-
zL>i=|z8n9~dA@Vbch0-s^{q8)7B!2Rd*6Fs*RS>tE&nwB{5XfJLU-jN`Nv~Na@(vj
z$z_(NCv`*d44m<PyR)&tMn2L5!8n8iBr^hIHYMAo#{utTSyj)dOZIuExFXh%zfhm)
z&gCk(Z|3^1KKu05!e8s#mGItmT5I6?RP5>ZYRc#f`^t!6v|YFnsdzN*BpONk<w-Md
zH$PwetTLGmiJzK%-(^8bM(86;RNjTbIcqLrU+c7=jEfTg$9odXDXW_*J{J;wM_)6K
z8s_{na@-#zqbE6#8!aqz$otngUfk2v(_FuJTvdavB;Iy9&{y&hk3jNev1hH&%;7v7
zL_>y{Tv<2R24AUJ0=ya-Oa81_z7YEmOUOiaZ(D&9dUv|Vv75NGiOj|j<Ri(Ca-}no
zV)-KBIVU8ue&@uXmLGzR8H@d9l*uWV+-t5>nXyA~_w6B*HFCH1zAP>svyXzh7TDFm
zZMY)HWswSApr*9x{=O>D`x6c_kweAx+7&jr`sAy#+e1x;arV1|VGaEPDXAjI&9Ge6
zcl>f>*krm0Q^<PKt_@*BWyZ5T(wB9OuW}79Or32$r?#ZtEM!6xe*d_h&bxj#tKGE}
zdZ9iDpECQ|-jgD;bIK-C^YOHQH5Ljp-P*Ylj*`3xw5<>qtYx7*f1kqmZ2PX<>UjAV
z#?wi2qw%P>SdDuZR<nX;?a&u$nD^xWJ_PRty{m>@ms9Z!etc#>Fj_Q|rs+;2b-$7E
z5yrNZQpR;{<NL`N^yNaKI?eGEja=)!WPLc(2hC&O>ip!b>1#~K-`H9<pk}R+;<po$
zdbHeYqF6mm<0346x@!w2?B)*W@&RXt2-AFU)d1b6hsWa6e{k^4N(q{0u{v|D@^`4E
za1*ZU!1B*4%qWl5tDZ6F$7ZFnExUdUP!Ku%-Mqb3>L8IQ@ctWV`uNsi%FSE&S+J2`
z$E4f-S)`d?ZZ6Yy<gdmlME#aQ<LC45hxdU!Dyw?V5n!?BX+{D{3cXg?^`TD`^*4-s
zrl(wfg~zvk@G^i?N`(`*XV3L8HN`*SIZ(w&aehy7?~srxsDSZ=%rHtD(dqwQk?4uX
zj&Lrvj+AkC%ubve`ZION>vI#({me;2qldqnSuGZWWT}s_6hP#4=hz1-=`%8k;OS20
zsN&U-AbZS*ULrwrN+S)XOCQ?mB@`aF#%fQ`V6j@vgzwY*5tuoX;Wdoda7PcOgTs;E
z44W6(6AgS)Y^Jm~@j4%Q>aWfyCFWdZ#`Ks-DZsKj{A8kAT$H~$7&Mw<Uk~6q83%U2
zIgNQq^n)<>wd+Pm=ucF9nm9Bg8jm(h{8$v#<pdY^YsK0jEEVTJWZK1W&~H@G#A4R$
zwYsJiZuhwCeU@0LuTIM~=%=jD@(|I66~{N7zw@c#8pq#7U%fKgEZU&tdG}|p=41Y>
z*lS7LN*%|(rRy4>A*mXRo;mBUZ<MU3M$01H#g^waPx}QOB1?vpXRd1va+-92dyozt
zm~RaKGdNi?;6BzDYeKUm^;2N@rMBlR8Fgl;*tfDS3<4Nw{{E8f0CBp~iedrzhnY&g
z>mA$2m?V3tVerk6A#Imj+NIn!cUL)_oQlSZ;FD+4_Ah>@IP$to8ZTF|MCzGy7JnW3
z<|=DB_c-;g>1x;+fwb3a4CRmX+GAJ3G!bGWH(Of)FIF%+)dYTQ6un|vP)2Y?$m;d@
ze&G~(z|QZpvK#a5&liVGmIp>0!hx*qx>Nh5N5vu?#PC+?*1LP*FN#H-nj1?up@;cu
z2t9Ms8+u2R3AV_3ik#O$<5YG6C@(r4OgxfQge*zbwXf=37YgLZEHjs$7SxdFzJ%$6
z$aYtZ)t&u=Fvydp0={AvxIi>$kqE9aQqKYLP`raSq4Xc4%s!eB%=(sbd30AAWanTM
zG%_qS$Un3v@m<k1vy-1vv@RM8M2HX9C{PhQq|?Ya;yFC1Agq-=tX`{XbPaxZnHPIV
zZkNI`G}CjO+i$e2V$kD>3yrAWio4r#i5*t7a$kpxSuigaK3wlxYyW&vg%GWq+zY2h
zc`UvZt}`$-ux2kCBs>@SX)va6NlOX5xrrD#p8MI53eqBvQl<G)=~jd4`!{vQhu1F_
zvae^>u4%=PkHT?rMS_@~%nQ6#ly3uBxf8oRrGQ}k>+v(FLt{#?-Fi^Uy)TPrpeu}U
z@VR<Qy5@=5j74hNd6DOVCfNdL>=}O-O5j_YiH0`3DmxJ8tp(a9(d0Mk{&XI;k4Hnz
zmb<^+EaP6M!8^xReB7)2yg>TNfSL~RxHsR<Jdg2S;qei(1t1ulP}{omF@LZuAljDw
zSStmR+pc!Jh;H&&fprj5h6oIqb`iR3BP<*{<ec4bm2Z-Ymyek<JCUJwT{?I&6TY_<
zP8{wY;fNOh8b^!_N`H!5Iak!S`<o1|9$m7bT(+qi(tA#P2hXuP+6~QAD+)aj4ZS#d
zY={}j#1h$mV9!!^O3k-48IYY6{Bya3otL?m#gr>z$Cl>QRJ<*g9JGhq<IDTu%-+VS
z-x76f8X><(3tZyol!H3h(#1A0$9T;&vBZodwA1()g^dwLHo-IbU%!C4!aw?n5A2JX
zNg&<PLP|41$UOJ--mZ>)_G78VqY{t1r@u^m47u2B!(0|;v%CsHM<Full>R08cUdyM
z%~PLZHZb0U8Ied&styv~NqRqib|5R4qpez8Yl_j!9u=e`SV%lf3l^J|G9sw#AcNVc
zf4<^;w3BfWQWkwdWB9DvJ+Pel8a&eEP5!FfeY+h*eZKhB0KziORq;fQw0oi0GoYjN
zFihd_owRe@i#qGD7Y$BXQzy*ogZWB5iVT$m#cwzk1W+yJ*)Y!gVg_i>&9Vxq>$r+?
znP#X0Q9ZS_is@#aYm<Sa&j@t9_e!WXVrMt?tINqX?PV(Ir3~YzCp4y}%xFAkyfP*z
zi#1-upotK~u)}E>U5$+S`Xjuus!82$<q;U0*pDnMJ`(QA;QFBYBl<GD#M8?lJmM9Z
z$;?$%CG@AMu*y(HKj;g?{Y3btshWd^vOQuHbY%R_Y;~$oc6FE@n8!<gwB^6@*^xgF
zSm!TypKTNf9Q1)pILcy+V?u^q%TR7Gn$xxHT6+A@BQmr^w)*{{U~6^;OIVwE{3FXC
z2vVn29(R-3b;E~we+Po06do-7cf}W1ZI;0Oa<9)e)|Um^12eQ~t$irrg4?XyN`Sad
zg4(qB>XU4|&BX&NrVdG0o9a3I&UzD#?XLM19D(nlcSNu(kab3$TXGVSUR{~qywpZf
z9ynZW_sWOn*ks$H*<)g1>Kxl)iZ>(J1sVE_gh-%Dra)nrCG1o@VN*W65*hy4Ec|jm
zinKXK`RHR*AmwR)BP>AgJ3V72_G9Gj!<zrL-UqzhPB05Na&(iG>2qj6kyy{+w$8?w
z_Qt-_3)ymR)mq@anWizVn4DU{uar?Eb6T~3^x3Rnyay%$o8V@A$<}e7vOThIEdZA4
z2YL9LF_tMnw@Z$e=7{IuD-GU7yu7H{JvG7tPn?L3(H*tS6GDMDv^7D#qHSVhW8zs8
z`b~T6gAJ;HAcp(pKfh_MMINcYV_2@`8Q>TH@I3%C+Y1D?O`LpXjLD!*IcwhR8HCww
zR97<|cSh!1thDus8D0^MDpRoR$8dc*s?tMS%jzKQNDD2DcPkYF|3nwMg!-bhduIz?
z6iTPR)+jj20I#pp1U)2wW>e4tW|C}2gT9oivdhhw{NhtVf4=MQ5h1%qi6O?d-d_0T
zk)pd1^n+wCX6ZZU41IMdOnf!M4c%(fcQ%70T_*8Si1^0Cj%39}`T^(q0QLQOv&2Un
zT<|_LGj@x{+qO;}T#lV)aq4#U?2$oRbyO<N`C=27PE>oN)A#a8*EwJ<(c%=!+1H>8
zXh$+V`NW72K$^HHsWyTx>V-%sw^X;oZJE|Dqji-(61$48-N|;2*km5kGRbb@&#!=C
zMoJCce=@gK6^?kQNn335Mk;rq{HMu<lf@FF`<7$F^xlc|PGjpk&Oi#k`|ZU8SHc?i
z%sYpkRrtO7eI>j)lMuKPtRiQ&gc{pN?23O+Iej@N(0|u8r^IKVa;x^Z>8|g?GVA%X
zpyhM!v$cb7p&}-7g=aia?IZ7f9J)Ki(z=~rO(Pz^jBL;XN0Yh|zmLT7K@CwBy_gki
zliADLP5pe13PRrT86UFFdtYJ39!Ywo^8OeDl+--?$%vWl_5CSN-phNOLg2Jw4ozCf
zIyCR%OU92u`!mmPe0vF~F9q)Xf}0M4Iucd*1V_Y<bd~C-LCXv(oU6(4Vds4<DE<$%
zN)1v>D(G0tA2^g+lv3)S2TR#=ig#VcN{hP}SRsvyuPZI1>uGV}Z@Pr&QE}YUB!ZCH
zE}U)t=(f7)p2S!dCc9Qun8Csze>vFoy3^CZW@Aml#cGvThOT0#dtq}R{On=`=$WbB
zuZC>ta2>jeEvsZ#mLQkgXxq#>`0WEs-<&yq?%r|de*WCM<8@~*{v8GEvE39S)427C
zq<yt|FOf5+MPJ@uq(lhEUpU2cq96F3T6R(GJstbE%YH_#OGt60;<zOldRVMhmw9~H
zHH#P=h4p$lfKGhClH&cpnsRx}R*E!khIOiMd=2w3F$c6w{T%$=RHc<dFFuV+$b0Xf
zqkIgN@i)JyY^O^_p|)fJFtuxrMCymNRLhENXwPV|R=YX*d7QwrE2jEq_}zQ+_Qp{|
zg3xqS`IB01TN6cr8@*tdBx4?9eThr_-P;$eJnaq=f=zNy6BRa@<9f4_c!Zgh*o>)e
zF~XoTlvsILXdy2f=sTc0CJ2Y#_?(kw7_mcL(FGTF-c=Yvl_hl>avx5=M~o}<>W{KB
zF+58pVFou3CsKcdsnqtnkc)r%^$?QDf+jX>QsBMwyxMBE$;qUPuF25^<Ve`h;E}dV
z+v`4g#fK@ceOvdi!x%)un4Z)!akZzd48v?J7g<HDyom_;h{bC|-Zad|PV5&3-JBQn
z@$f&|_raOr&i{lH{O#a9jT1HV;b!hil!z<ky(DqciVC18PUjnCam2}_TYF-_=H!K{
z(P9-Th+*RBUAB>=Gjco;ipS$w*H}Id*TX2Ll%UgmXepipFQs%e$-Uzx43=pddo04s
z&&lC}Iyv0ec?@)&aoobFaBcMP=OeMSnZ3q-4UGZu(^;4ikxWtYY5$>BaldA2)+K2U
z=SL^H<Wy~UAJUq+zfhDSq9z4|fbI%D3m6sX#!g-Nk+L7-qpb6jY?^B?e}6>5a#y;M
z?!{PQ&nwc(C6rba>6Wl<ZJMHl-Do<7#qKcUuK7QJCC;947-;{Z;~@KL2w~+fJhc%7
zY+?}H!&(n$Qqa|IB-S7-{>ha$8JN;FY1;rS;-Dw7om;iEh>PkhCQ*f86ErLA90(|i
zJ)KM;rGqu>nqZ=WkCbVP{bHrRyD!hcFdx%ekez-Zq-Vm#$|b*@KUiGh3i`K=YZ-hq
z4g3A7zfFOtjIB-+v-6Ii$KzHh`9_!Mt@yO%5SpC6pVI7<_-oNJF3X`NdiXLwpI7&#
z(_nVyR^Az3AAbYL$6VnAj!C3NVovAU7MJxVFFW|1x)8z)%z}?&V#6$GT7L({I(dps
zPqPjSGLo(he_}rE0TIDz_{`|G%wBHa{GBY&5C3_xs4}eUml;~_8di<+8aEE}PFXY5
zI9XCr@f$p;o%X|K$GhhhD}dnsmCtRq(6p@EqR_~lE&^rD6WXR!ViCAWax!)Irp<W1
z{5E)$Mh%@DPH`7A;_k0u<#SNFu!E1pZyS2vPoxgK9v%^~)<LnH)M$%MOL0NGjyHU{
zwSFhT1;fgcwPnmZ%hAMC+;*Il=TnhkyxWvL!5uU&(d3#@gl3_ogd`6Z3hsWFxv>a1
z;*@;sf38XzwzF(Mz~Vkl>1?pz^s1&}OFc(0Xa;mF*78}x1jDyW0jO9?OU_?*T^^8>
zG0N%*wtf#()Wafc44TW8F#e>*GNZBH{&Hi@MbfS3Prs-PBP{i4aP=U2(CFpH8e6=i
zn0!LKSMCZ@z}DoFcq}z%%_8JfXHqC2!|Wv*?zMDY;gaHt1Sfgb&UGbT*AX&bKXOH)
z!<W2GrN!^~GOJvM*xM?E6884&^+ZTy{D`SIyL=ztUdDW$$F%*Di6dZjGM#k&<K`Fq
zt&AOBftNAo#|~e?uqEFDJni0w^XR}B=?0-$N*xVw3f*?vU5DW?S#}YFi7y37IoQ9n
z!G|`ZRqIsU@r?z)a3o%OeIG+QN8p3*kkR>e@0PNWJ}@6Qvj2LCZ@Fvg*>KxuzNq)G
zuX*`3e**d>ue0*BKLN`H#r(mdb<Hrd?`W((Y2}jqV~qW44Db>)%L59cE@ac0g>#cc
zs3q5>FPz5fCseDfn-gcLrK=pIl&yo!Jk7--&vOt(+DKYAFDvt7l6o@Pr`2em7Ek_{
zqwzwc(;-K5POwDGR)GU{_Z>TEfCo+lUBgV)o(d~@H-;aXW9EmuyF&-8<+|L516MRh
zF+PqH--5={<<=Qxnr5c%cb(q<wC>9=UnOks$gBR;&}g~FxRC6ad%9IpnJMG>Xac5R
z+grTtPaWkVk3u3(5|mP5Ku4NpCSi{ckuYxA^Y6J&s4s3DuMvWQ`YwQGPc|Pe(^8?f
zk6vj)w)k}V)|D4B!qpq}+PGmvv&HI=FFe8qUS2;jN|+pZDJM<-qz*-h*30Uufip;Z
z3CATLDV8=mhf?877fZMt_z*NdPt>N_@mMB3dOcIslAx_hF8*9_JB@@%ZvDP-?hZVK
z#k!`EdEot`?_D`3E0fJ*wyvIIu(HbMno=C4@wEA#%9SJ5r=irNisuGY{dYpThN#Yy
zQ!;An#@`^tO`OCMXei73@)a&4n^no>EVj^dO-c)<lo%brjgapc+&gRD_E6JhX7-+y
z{O{h5O7O7moWM%>IR;0F$v<r>@H~w_P)K}~A?_>|Xcmy6=?nJxHaQ)8v?^P^Pfxj!
zG)w}I{#Mj@mCvjH`y_^K+xUQr(yS47T9UR<%wzh}EHGsHgo5|%j^#u~&plDGz(xDY
zxqTnm?da*m`$dMsf;@F=btK_@k3joa(vv@h<u4sKQKxt!cnv8=5B%>f;)q3}zJNj+
zkMilxjl|o9-)Jgg_7X?x)Zp6u45R+KU@tm6lX!#zMFMZ*b{-xIWbx}TbA{8E)EBc7
ztBJoflz#ks2@wI0zy{Nmhg_T#<AL~K8^7X6t57Q#wgrs*y&n`BpPXERIjX!z!s*F6
z9x4iL8_)eYa<sMA{A7eCCYZDwfdqI#qmuoCdeTM91S&4}oykEmK>eBKuo=)a3V5%5
z+XM<j3`s>mQm>+ybO?YR!$=zOiA^e$Ai{DOD3S`BfAZ==XhaSVqkFIFDfkbgxS;R%
z&!u+L3RYP2TF8egbd&3UJ}((LP&V1bOby!h?d*ODKf9uVC#tMo)HDw7oxZaqzp$&;
zB_W<EkkO%OPqOT+<)$`>T@H9eGuWxxA+adMwG8G&3-w5RxdRWrEAZ(tP{B>nXP{=C
zf#g-DZrMPKg3rhG(hebhJGHIvq`mm*wQZSx1<<V*#eBQ$+f5BS3OQ#m4w93|t|Zaj
znVR|-$G8XoQ#8NMN8$ixOyv{nMg0ldiQS7<b0!O{qOXxyfqzvpQ||8=S%V0jHU1&^
z5R;R#ul_34u-yfzh7RFEcu)7lPC7a`&s~0tgg;a3Fc`{fvWi_}_=T6xEGb8XM8h~g
zu5j)sGUmmy_I@a{wV9=OUtd!(K{9$@g9yHxALBt+9<#7oj|XBh-!M!!Tf4Wm<ch)Y
zcgTv4n2K=>8E6=DDNY~+EZK0^70;C!S_}=FkY#VD_vNyPTf9HXF31ZJh=eswHXg}v
zwlQ%aLs`RJ<#Ym2L}>}yXlzs-Bb-LbtkeY9%<;X5VQG-dFd4kMSS0j_J2%;-2y!C%
zVWZ?5c%1SJDvYdq1G;eJ1}p(X0pe%$C^wW&_T4uvc*ReAEIA+lazt7+w_jK}bs!+2
zv?&c}_F)Q_Xp<M_Y514O!VHT}u?6k>m#O*>HO~_c8qP`gnhVichcyTN#?!VLmdc*(
zuNl@|TXa<aqC;TX`LYYX6&v88^#=}Umb4#PE*n_x`IF?+dWl*ydEtjMwMsPE4(w87
zza4Y8Y0;PNL_!p=;ddRTD^g(l%`LT8!u977ZscdxpZuDO7-fpYTg_8vI8a~7X0C)i
z_dleS!cNy=`G*1&XI(Hwcj6HkR}W2-R1XawA}DxHwW_0&4jxUAfR?Ldi_2S9G{&-H
z67RNrcGyjf!{Dqozl5>pz=)^Q3~4#9n4YqWasXAf*7*L$owRO#|8+j>!28&soGUoX
zo-*Qh)nIpPea35jGAEDZAH87k`_QcXpKp;3G184p5l!dGfKWiemE!(BnbZ!O_A84f
z?l`5BB5^zh8DyI>8Cw4i+g!5CNry;ijS}SE(_+~Ml-4)<&8(c}A^$=9`gjL<ZaaAv
zX1M*wUI0fYO{X{Y8%SUHWcFSfn9;h?;a!KKqMg%{dg~5kM;(knx0^9c@<=S3bC$-i
zxN_S3eoJ|NT=1npNDjb={NF1kLj&O^*|uUVrlyv!<zg7@OE$Zo{8+hoB*yneu?4-q
z<@kGu#vIlpqZ@jV;gCd{$2S(Y7EX$1-|tf86v^?Ld5vw{z+4m~Ptqdz7N64W2)k%P
z9fgQiptg-LTpRoVi%!NGx4}8<!C!SJUl0F;o^Sq6uLj!IsGd`BX1Mv}hn2W<IL?Y+
z$gx3*s_qZZM^MLTjA4@c5}{Mm8WQIva+C0ynD0wx8_7d~@UB$xGf*XK2b}mY9EO1T
zr_cGet5Dl{x02tyB<L+OLZ5ZmKcSO^w-dQ4NcV(cxjc4U<2)}}5O^zDclNS#(iN4|
z%!5T43VsZGRWovWRox|bm#b7iehrCR>0YK@WBa0`2e`q+n+)w%g0Y@<F+T#pD*&mS
zEd93D^_6Q&A7VOXn(=0EFe&_C+las*liq&hd0FUxhdRkJlDh;?aI*MZAX%M4q2Z0}
z1S2^fZrEI|7-_BJ*8*EQ@41V>88R<Eb8OnEyFE;^@@%`)rM)tXf~fKJn6NkvSaZ;7
ztn7YKkS8*le&)~qFX^cl?aP0@!c(k}TVd9NSa0{Mw=$-;s8VST4@CZ`MkAC9k}vOR
z`DMkm!2ArqI#aBCA9_7y3}Z%UHkonE@tM4MHO(ww{Jo3+GQSY6RG?Q|Hg7-uyWVPA
zbar$je|ovJ$mm0x?N8Hh<an94tGwD>F*$U8m6N8A-&{nX^fE|!yA6a#!Ht#g7!!AR
z+XXjtyb{Gv0R4S*m}6T{ho5U^h-IvaztVmO9OGtXUGTzO%(0g$N3dFdz#_t|QXM`&
zBnrs(PCDG#zxCG$70$x)N97;lX6qype}j?cRV_sTWtj>qA7>kv&%Y`OTK@ui)d33Y
zcePVQ*O?(5jejB`w{zU%u|$s}*elZ9MM?g1#OS3OL}-RssuxM_6n)!wE#f(v1Apax
zUgB|-jzXbpDRL+m!=qyf;YE3&ksW!FQnk8JWHHgqipx3v0AVdVa`XT)=irY2B?UD!
zek4`jz_*k-6e7muAs<@#gwkJ1<8ky1$u1d&s4_^NAxZpo%$WSxpVvz}#*>1i$w#FN
z<tRu%LouT3kYqRJJBEiE9hsw_4iQ-YmJs;DP(N<aSE*=|%6M!EVe|$zAJNnOV{GTZ
z#oR|Gx2*Nd>srBE^!({z$Pss%wl`z*rG<|w^tx8l&KD0`0iYj8k1Z3x#U+~mXs%Be
z&%mzT&pjhzK@u$=;m_~*KCWe;N%-Ah&Yu4bV^q22GxIrI_vLOW^l`w@?D2a2%wBcW
zZtcp6^?b|bfrrn4#>!RoD308jCG_Fo))FNlmjg9gbWm4Btn3p7cZXZ|!5x5b<;p)f
zR2j(y05@aUuA<*?l|%cja5^>$<0f(N`Y`F%GRz1pz9}TjzzVvB4F3>~ahINfWKNKA
zJMli|H!$~L1vW*^To<Ed2cEdn+s00EdKB}c9+gxlTDQzw7_T-d4Jf7TY6I?XPZA#g
z(|rowcAs#WP=iIc%xQ`MTmR|CVGM=aX~&jtGOIjW`H?Wl1%?avZhdmAkt(>`TY3+0
zZdciu$m3zt<KHWizMV!*`mqv7*evIo^Z;ni_L(n{u*_j_N+!v2<!Y`O)=~%0wsLax
zzWWD{{E98SjVJQA8tKHXMoQ2<M;omE$nZ<B`+3jdn_{5cm77$&XH5PB5U!ESN0>{6
z9x6tSVRJEeK@uTZpKS2JR(!i`ONUjyfxH(mCEc9XkeuPbm>p_hG&&0Xz2yyNN}Xjf
zkcek7mkIjKcgL2&?Cz@q0&1Ihd#SD{nTb2e|Kdd-=jvlVa749qz4+`__rmq`{)514
znHpdxq<6_%zcEGpo(X_s1UPISX!UsVm%oBd+HNu=aR`Ugc*D4E>65J5A@VkXTH8T+
zAurLvKGUbb1>V0Z5pKs?U65sclyn^Wj4L}WY^AWWUsh1qmt)!~Pu(x0;x{<qjrDQQ
zoiAi6CowmpcSySv19TO;SDqpiG;|qK``fwq9!pXaNp!~9s2QIH%TPNhTo;`uA16HP
zM|@)_d?!o(a6>#W53|0X1xF$wykSe9$_cV4rcg}F_wksdKaMQmy~}I2s^&(;Q&&57
zD0j#2uwTXG=V8$ux+H#h03K>vg#KU+=Wc=nf)*DO|8fspMRMCXMxpnTA4D}|U&hD!
zXO2v0zk@mE?+{EQg3s6n9kah+?Ep0Rlf%vqpwvjGckJf>G^*HtYG#xPDV*=++}Q~t
zt8!F4BfLu8Sw7;oCuJxjVAweSxE{osTRp+=t$OeI{HBKKBl=i2xh}m!{E9n^lPP`6
z{8_p8_|a?wC5UydazfqgHA2G4n2ww&Jkm*)%9yjNlrF5oQewH`O1W=iqP9}qS?y}0
zt?_w9EVM4(h8boF@skL<Y_kkZhp%kgxC}KE0K!u<S}&+gpuj{*cVjol<U7BCyJnIF
zj-?s#Wm`J6?!aqYS2$`sGT5!R%4ozzvqslEPy3PV#g?iB80LcL&&w-CT0C2n(BAh7
zjXizQG*~I6`cGTJu#!6dR-!Zpk(k~HWi~zWisgk~R*aP+&=CVLcYn$Y1?%{4EKA`7
z`sKC!#mB5V-d_b`pvH9&1cx1xmsN*4ehnO57VVu#v&`f0Qkdj;1;0XF2>Pvzm^sA8
zO2OPp+<xOsO~t#$%vjrNLT|pYrT3~zr~laC;i8mO^L}R8eS}%`E2H1hEezK0CK`8^
z%Zo3*#M}qO>>;nbdj37~M@CWFy*7r&twak}^7!{8jPq4q2^<hF-vdz(mDY7q9g#{;
zDunNpX_E!6V1AilWqF-5%H$|?Rq3aT4SIFEY62t6@ONZ0iuW@c!Z)AJqp=izIkt$_
zmvz|uOtW4&`utI1Vdc_{%g&Ap45FskPE(F|SbdQ8{OJCnO%qh!v>r+g#5*J9fTjN7
z;33MVxsln!NBt77)I-)bHL<qg{HtM=_t727l(-lMoF$Aq(>7qoQk7<FoPb&+(=%J+
z43bQZ;(FedX#k*x#ECL>$1A}4C>>kRbSbx}%d>~W<MV1aK#L?ooxuH<QE0+QisAC(
zR`Gz^)=x$Ldt&nhy=#P-(#^VUF<GO+V^6-n6fmu>dr@PmZeLCm;~cEVcWmNtF!?*|
zMSqO`U}N3!&!7|3%+xX8a`)ufK>d7C&<rvf#&aJhCFXYrPE8JT7o)tt*HWd+tukQ8
z3o4w;jkGL0fF<C@hQ;%boLP_zSE=3sdSLCJaU5)8=%u(Z94*4ith@L3gXRk2GR+)7
ztK)@lN_O~<Jxd}gjp7a7nA8<>64P&pYd~tralXO4h9}OtC&_ka*ldC27y;q$tMIR#
zH>wR?xON@y2~sy09S-omC2vh;{pQZZltC>Flv`DW%N2Q_`QnKu{g^O=ECCQ^q${FG
z4ghYx3ASxh5iu7Da~n?Vgk@%@Jbb4Z4mOrt+K;<)f~Xn95@_i5!h$iwhivHyu~4Z$
zwvgX*Mx$m+z1D2=UKdhz1-X08Ct?ne9@^;r&WeskxGV<&)ZVOHLZ~CKUT}&EXz1iW
zUm<Om+c>(fYPCfjmuU4}OkSS@gz?3DsjDj}$PJx;7U6<;(*dxjJy#@XEbhb2eACNF
z>1UQctT{RbKB}{X_34(+%S>&b14JGN$9jg}ZY3W_Akg_;Rl8huXgzhPtlWC?-1N&-
zL+KHIl0^1H09(u~9S};#s6P*q%}L%%T@vJ_?8|wbBl%uGR6H~e?Jp`!6iJUJrZ=K?
z5qdXG2H&Zjk{H2I01Dy13fk*W_r=<mHd`d1_ZT%Dh$<3~wuI#eH$SSM3N3yl8lle-
z>5$Q17atI><tgwKu!+?+wm|RB-|?-*CX<DBw=T%SYUeY~RzjY<ogkU-QTW+70sCAT
zbK$0K7>nKIgXh5bot^5HLd~1lDnYYKmHaAsGWqwWkPwe}02Y#-!4r^o6+4;!nPtHJ
zi}mu&O09A$Y0k1BU#+PjE29L^s+i(H1JzhWOj~&(j#PC*L-N!&m|h5Qi~Z43RSNzL
z*iBH_QXhP94pOx)@rIu?2R@>H?k<kl>pLbje7?iGm)}MsZG|}-w8WnBO61EG+f7^e
ziAph+t=gr;eqJJ?OB;TxaG8jtr*_N5-P(iXKD;6((fXG^=s{|S#++b9#@aCp#&Mm;
z=7e=;my-1$ZmUb5RbCnWRp2GYS`*!54Y$;v#gA;*ODW!AsaNCkqU<J&6C@z;J7<G1
z3oOuj9Z>ej7<}V;N!q!VSYF4Rr<|=4hNd*k)6t&9JTDAn*Lt_PPe>6-QpD{e=FgfG
z>5wT|k=RXRva}RT<cQGhCJw5erm{}W_+7(TSQrz_P5`Z(Ysm+>KHG7q1NOAYupN;q
zjhHL7#z+DyH+GEXMi#t*-tWz=+82@;4Kf)`!}0(q@Q1Pv+LpT`yrWE-%EeVEmVWf0
z0A|?TkHgA7q*87HRTv5SZ`A_on}4KgvG_=is(7KFXpx(TSX`^$R}~RySbLjp$y=Fz
zUhh-4dIzo;z!fnU1ApC4d<NM~pz(O$qK8Rq0cwmOyk*Jl>tYHF&0RoysHq-LYG^%b
zE24v+sgc4wTK0!0%^`yZ(2uC(QUtorWt&vI;#|yUtRGVy;FNh1z93-UN67<TAT+nc
zdHtPV`P)29HfmgO4wY$!8d0_o@19H2_HJV;_S@Oaw||4eP7s`c>?YEPz|!)+La?Y?
z2fMo@t>^xTTK7aJ*FP2S-zq-eyiBjXuv)_I8WKIZV!cdzM|7>wIHDaieYOZnt_16z
z?Tg6d=+7;;kxJ$Dyx(zPL<}{JyzI(=mKav><a0h<9oHlb@M#f7X-<;HvglMbR(4dm
znFAC`$&M9cw^0dJPedawpdW4Fq2J|;#LV>Se>2jnw*87f1JDr$kK)7$T)HZz>FV;K
zHRLpu2YEMmbx;uYGQYTbnw!l3t_!ZYJ4IebXhM1gi0pH#nuv5Bn5XVy^@zu5ec@pt
zJc=Kq-+rTJ<WV~28agMTY$Ct(D6b}Irp55k_7{nGtDV{<6K1e<H{Pw?0%p$1%~&7=
ztc5!utS&y|zYR;N3FFk+NZv#SW%%*j_OdS-%UB}`;Z6%9xcqfy80Sh|))~0v`XR8D
zK_bf`!PCP|PcF)H35EkUZS)iQ1Ai=Fq*6uY1XM5Ujh9b8Q}Xc0nD?5mghoLs5$>M-
zgAG-`*kwFOn?4sj?C<*%jf0t)=ZiryHFqSkXoQX2y)Ci$1mZTgoE@P<<y(<;2@l$7
z;f}^#pfN>^I#iSY2e6X|I#W+ni<?1>b=K#VAu8&x)mAfUQ8-5L>KJ-7K7)P`%K0q)
z5m2gOUb%9%Hy(vtcKu+#fz>D=_OWh#dHQ7xUovj?FQgqxDIynICmSiUU<i>2K;C;Y
z+7xbjU4)HtlXxiUpuNPbRJldz*!v+(dlkP~i>D6<Gj=teBjmnBp4_b$P|I)w@4S{9
z_n~x^<?b*-xDEhyME=)Dhb&?ZYKY}ZmDBNk3oHwBZS}q|@0z)y`IHT~XTm|Uhiael
zcu`1SCr4bZ4vBQWNq9^n>=_N_(&a6-BDQ!}`G#+0!gGsaXxMQJ)5gePJ{RTDCz##5
z3-F!3UAKHE*K98L?dZv$_b^6~C^BG?=5eDe4Qy;1^O%xaj-6`5If*a7v&fpdvIc+W
zL2Hp)@sT}^Q)zXn*-y|0Giet_6+rS@e7yZ}nhQs%=YEN}u8xS565?&)Mkn^%PUsLP
z9S@eM;_i6)+(h}NW<^pj16;sf^yzM8mCi7sSo-+X$>TR9Vk{yaB!|(%L(@wvO;vY+
zqWO-`00Q9cPoiFPo(-ODJF+S1N-@+Hxwd6BhXL<C<%}K>G4!d@?7&X?WEfLC$$iv8
zXDwyV4wk(HGUN8L<e)<Yn!stE;846<OA84-LvcvPbviD__)raK{O}vtH&FMU-$z2M
zBVtZK@iUB-3@zX&bES2USa$*Y{l#(nt}*Atj!F6+*g^WsZ-pM3=E**#1vJ@&lA;ww
z+>>TD5|Id5tz#e~rqiukZOJrTsk&4d(i<MaKm^W^x)(&o1wefhmaoIagKBGv%IGpb
zHTk87w`!pDtnY49`z?1lg6kUJk~;zu1kvC2TGB`hT8}V*Uz)T_jZ;Oc%}0nCqTb@3
zxT`8xFV(?mr3y`%AjT3s$0`~JoiX1ne`irdhq@^-OTfDLKVUO^@Jv|_5(b&;prh=L
z>;UHrIi+Hl*tdw$?#3rUq$~XWq|6D=03~oaUHxJoN$Ti_Y$Q2UR_P^N2}>VeX`_99
zZ<~^7<4V{mtq-C1Ux-Wb0UoZaw^Lqg+L&XUg95X5i7#4B16gDH+pTw~Jl;OQelxj3
zXcjG%+BoEiQ{Wfk@<fE2K;oe#nmZb5dd)r8vc4}Ub}JJV2_)Tu<44#eN<V<>jv-=&
zK6LpxB4S{`f;Ra1lZ0UqlR=xevS+jp`aunp;($>!S3|=He26^9V;h>u!#lMiaffg5
z5Hng_hc)DcFMxl5v(zSUX`MdK(!N9J?Aa-LG1!JA)rprmx{Ns=%vpsTuW`y!*2h!`
z1rFFgF^2g!XAMHvsa{OZ?5{6-;6$nrd_n<*DyC~8VQ$Hq(NNO2(A+oYCcF?A;)2zz
z;M!<#%UTWuejVyxa$Ai)PPO-zxV_p|8S0ot=imEPnB5(a5SC2qj9UKd@J-YUsMw!<
zPo|XyA0=f+FPiKdf>(54Z+Rb;89v5Mv*yJmZAx&YBW>J9o%@54%k$Zj^PiI&L989s
zO=qoVWUt=(9#G}593M1{vuV`=P#o1Ae`$EsX)MYl3G=VXS_^X!YR~37hwvIZQ!afy
z6Eiz-cHIyQ&%lh{>^R4RYmkfm?8>H~=e1we{icn1T!Q5zvS|R=pHyabk1-jmn>TDb
z8c^6s{752Mi_`JM2)fE&gULU0l1-b-y{j*UKj+lG{CZbk?#{di;CMm=F`PW6+TxpB
zmdVbkFJjz?*D*1+B$B{uI7>@3C&T^GL*qBr!^)_*G+Fa+ER4571;^n!486O5EA!sk
zemnf%AMY;ZwbeJ44{Xf^_sN6woLBzzdcGB(x}xlUVa#I12FcbrIw;_g7-*c^MaU6E
zK}gUcHY*xbu3mAZuCZ!~uXfwh%m(aho|9xwTncS0j?4``*FC$coDcW<G+@ZkPmw&4
za>h%;{m4HW?i{DvSDY+T*pa<=4^x`wU$*s^BY(XD>okCE9gl=&&(EytTh}=8B-@yI
z$Nmu^T$P;`D0zuJ>C27$5NFd$(=s0Jh`G_SBxf~RtcFbryu)asi8&_U4qFul!XD4m
z>!KrAtfO|)Xy<y!!9!1yk>UHh3@{~NRV6V-WOtQ6TOCu9&N@TMtiX8%R-fo~$5IhV
z7c2I~e<q-@Y0g@UnBpx5Ke*qR{UzS$g}(1qq>JlS(1`Btww;2mXt9^j_89_?DlhD}
z4)l4?VRvq&yHY^W8i%7}-MvN4)C}TPoUpAb8-QhV((8^#OTinQ08&~B<bwOx4kIL<
zR-toeR!m%#j;vKka62;Y;+ED_;Rt#5Z*@Q9PTD5Jdh+X=c;p|_Oe5#kx);rzX_^^p
zYUB$^`_C}{HyQ90kO2`DW$g-%eqV6}ue;NZtpy@GmDDWi8KBOj&H0fPdKkY{4R_`g
zRnKrh@bVEW2<pPyH?p`U1~SXlXSi`ICIRch;21+JcrMpPT+8!_CuCaUp7SgcPt+b6
zZkoiV0kNVFr)S23Frm5c`#U_q?{Ev9%cZr*oK6oH;hIaZ-GPimbSO3}28R$$cKZ80
z!A7Q3x_kCTpqCDiwYnrUD?cE!KhKNB_$B1oZ><PO<PP_2E*?B9pI8(^b{LjbY82SU
z$Nz~t*A)Stn}vN^v-I!5{9r_@fK-IDK%ZfQwEs2|^zLKf;A4CgrKTS4qpcuZ`3(&r
zMzvc|XCD#o`6xnX$%SZ|K3jy#M6MRTAFOO@I?}lCyh{m6-UFtBn)NZcd&mHWnXYru
zkAKUf)ckuMlSSbK6M?j}0h0EcF8;$vL?AWIpDU<4uZ5W=u+YK$lEA-~Q{8ye#CkAG
zb!X#$=1WT8(}In`N|%d(+ldzJ)1{@e8g{EWe<5UGF)tm;YVP4Rkm#Fjbt`I3Evyl{
zBi?T*$}tBxMm==j-Jk)S7a$lI!Xr!&$N5R|sUN)lBU@jyNaY4Nqd}sQ$;G%HO-s7P
zTrb|nbH7#L^7^AgiJsd?>WCX!B{igbapf0JA%B2j*Z1ZAl~2cnfZ`(?*%bj`Wbe7&
zlZnBK*Eae^*ss?ZKN?LKwB^M?e*M*Nnc(?S0i)1v^67tut(PyzPWr-b2U6D6ZN9<Z
z^f+~?=}glp1~iNTFE2WOrlrTsOjEgJkx3tFB((rD%&l|n#JK;Dqn$?lulctlRE#Tb
zBmCDiN?go%&l51$U>*klS91;RDb||!022Q^R8x=<0Q|bY>!yoV<dJFxb@X^(Vi>2r
znxaGwrXjvQfkn<+-++$@9nByaV>|`K?vboOgo)nfwpU1n5U)7V8u#6=G3HXq;_%?Y
zd0d0~i)OQR+yU^zNSIHI2__##2|5`k{9Om><0fuuhq<f5!vUHV5y15mSg?S=2|qQ_
z+cpSz`#-6G41fwKc=KKJdyd@q>yVOn4f5A5^`?mU{je<<5r*_6nnuZ^^H><LU6VO&
z+T$#DOwyp)!>}m3v~+(*5s|sS9X3htz%q=WpYW<VAVmCjgX=;THda||WSar`4~_xh
zpVT1$S-afoe_?_DN&Zs{s0uV!VN|?D6+fh$BKtnBMlleG%_p^>uz<r$Wh^ywTkKwy
zvR7ktl;?k9Ztbj_;<u~zS~@e8P2q_)-=Obd1*W2F#SX^`RVafAd)>k900C;my~Ukn
z5~sdArvNL#jBxDeHAcHNk8lv%dBNA*^e)HuOF|$_KqVaQ6MGBd1tJsCti_p_=H+Q#
z1L6SEpa>9O#dfId%MXCyLGr~&1uEm_9Oq3>uNO`jb-wRTA2A&vQADYHcf4&L5Aq>C
zG%ywVZz4%APVHBGaa0($UwR&}?PA9Uyt&&RK<Oj0&UrvHxpsb>zTemTc-#Rh!(@5+
zV%9)flQTP?d4aRKGBLutYH4!jXO=)mmxoV2-ir7X7t2GVVy3a6|4Y4(6*tX5u+L$>
zdj2}OE0#fg>S=vzpI(j4NLPJrvFBCcf<Qkf^#Y3veXvOhiNyL0)$2Xt3Ck=FCEZE#
z+df}j`qoG5Hz?H-rs6?2#1D;F$<dd(nZh@lU&QJN2hE6nVF*76JGO;yT`|9SzjUm8
z`Ieiu!3nm4RiSCMioO!=#@V5yA?aYPOU_x%324_?|FQfQ$E=U|$!<9j5Kn-FWeqAX
zoc0skMCN`1Mh}a=W2laQu-FRYpM}v5NNJJi-~*j8sdjVYK~wBbS%w+iNI3z1qiaBw
zL%IjHZhR&SuKYIOEIW96qG_NL2MpQW4&#jV_NV-+*mG(p2JVj_K)NAhT4uPOJ-*m#
z(R1&{QE|2oNp5~Gn$pV!E4I<Tg8p{o^fLsgrG&$FaNmfZbfn@=VBEKJ*g}==y?k{Q
zy~R26A_b$ICS8<NqpQE%*{(w0*z`-^*iTOGL%P`Khi@fzJf#l9cWl|)RbR_VKd^QW
z^Vt{O40z|!;9-?DbrJMg8qodxmT1`Pc<7V!9gj`NiW~UGOq)M->jNGh|FPlLBsMaM
z5Ww<Ch4@GG%VqjF>3`P1Mq=K*ONfLd3Y*Wvh5w2c9IyYK-Wui!nyQAG<~gD(M`nE{
z=bn$7)_U{QygayDGc_Q-b-eHpMX1PKO*3)Ui_xr5<UMM(M1$dlMV|PK{;^V;xWjLJ
zz=sDI1Hmqn^Eg=f?Ay4WErrasmVdJN+G;Oew$OLM&6=-#8CVF&06Uu!%RK<SaXU#j
z#=K542tyvO16qVUP)}j6G1z7)Jr8>3JIJRyfcbxLsJ*!^8WB-tdn-B+Q!&tNt104>
z2Pu+!+7uu_nsoJjOCL{HfM6aI>6;u!evBy~U`3K}J#1pwC6EQ)G5?87{HrpiB~Ugn
z&9Y+Jy#^u0-d|j%_%^ilm?<7jAENgaCt1lPf`Lnxj1zIh5N$D+KEe6tB>(RfiwVP^
zz12xcqn8#5fZzr75#fy8CrdPIt$N%aAu^JdPN%0IT>8qoOSW188LDOpLGWJs2C|)w
zxPQ*ND>MKOSDQfoP3lRUHp4!ts*(ml@PHNJ$X?NtTVVCh{c!rIV(joBa#{!7%Mgj^
zkGqxRpa_%kA-jj9QScSaH`ijOQSaS=aodeXSV{@yF_?*`KeL}m6D^&be)N~!<elk#
zKNPP2=c*bJ0Ky@Byp7)eA)+$!S1L7^T<#zNFde0?-+6(J4uDAF9-ijO{xqmJbC4%m
zwcV_w1Oq&ky`(7+pUk9J2fHRM$9T%4p7wyqV~Hc2Xi0#67-KCYX<Z*PYRU-~CuAO)
zk*_+th!+b~s^tQ8aU#jTcDSM~rdzio`}${9zsH6Bm9j+o8nl^p*ksbo4|!cAwH)!=
zYoY&$zCdP+e1zYL&B<UqOukVNOS)yAJB##XX71;@|KCZ;v(HbZMkYOPT`v+hje_=v
zA6CV2mYs+?+3)hb?EHMI!#-(eKunhFKaEqn0?5-x2R=bAdO)aZwrf|39F*Cq^;{%0
zq?-CP(dFErRW9YKGXMSe`A%&h9|<RX{Kv?A6e<Jxv@_n24U%vBs1)#}^y8DIzy48K
z-T#anGsFh4X1^tu4n{ZYcZv|w@QcLI2#6f53y3g?ISOTnHGfQO@BDw2Khw#$rLg{2
zL^%J-J$9XjiIvfDt(O;{qyMTfZ8uNXy^xp9oS~7`*_8z2u~@gU$3;RQ_Q+Q7AF)S}
z-sq<`Z%n#nvSfG>Co|fcyw96ToAI%(`j54RB(Fk7LflMq6%lrRghKD@_@^P4>PK6<
zSgS`2Xaks2D<#gM)&`RR<73p!aVfqy+2I9^@M}3K<+5?#2rCslxu+73e4zXTVoJBt
zp9y!zA+c!n>waXS4QbTV<vTepEOw-*qQM$*mra*MkVA`}b3bfjS{)H0aj-lNLiv={
zSuwUVg!dr+ueCp3$cKgl)r-;KiYoP2i^G9a{LsDX16aW`*outVxQrmS!NfF<Kveg)
znn(QsYASdfADfF;@0fBz<cyeOnmvNMS}5-=y-JF{{O?)E8?r<`VrQrh==y`$v;yjy
zOM9|#lg#UyxA6a*c7!I?52)C(vSWk1BJlyc)xy1<Wpqs7u8bvc<d~(Hli@2sZg@3O
zX0#D*)HFy@b374~C7Us?@#{+1Ie^z4{aMU^*2c#wORKAJJS=D}%H<)$+Vdq)*gur%
zI__ZpLEcE@kHLzw2G_?OXEGg^;bPx-q;y_Go-TZD)ar6W`E%D+Ouy*QhuUEw?MXm-
zI+zsGFMv{DAU;|cN#n!X)}_p`q9ey_+@K&7@D(>+p|%=QS)Ebmj_3(v<0v%aTjM*j
zEulN@d&oDb4ml@0kNXyGX1um?L9y-2=c_bNT%%z>3wPBY^Iug;KHElEn)XjOwWyFe
zvP0>xN_l>mhVKCxRx(EZk%F4kGh9~+WY@+E)&GzBH`UV82_zLI|Bp#U20sW8V{PcI
zr=lfh8goEE^+j2<s2`n4MyDJ0boD(9W*YmM7>mFivojq>q#xG&Z!yK9E!F1Ng{_0y
z6VW{xIk}Y{#<N^_q-n#-(l$o2)1o~41vuO9)mEne<`k{yCfCCd^d6r!Apu0UROuG5
ztFS?X%W<d}f~ZIq{GUe_OJe+A+-VItK9TlfFN3ql)?`IP9DL4Gzs9^XcqwZX>y}j2
zfMM3SqFS{2IHsuD-Nx-|?8fQErT<vze7^u@zTnaNpt#ZcP;%2}>!bDUQp=MbopRcP
z*ur&X<W0|%WG~H4bUseG!37XiG(vRt?L-aK7fgBlCah{peDg^$S5H?z-X&sqdg)Mb
zks8*y`^*vpvV*I{$QDZ)B4Wdf@QCWAaYx2!rVGjs_yaj%x_8v#!O^H`>6RT=vgut3
zg{O;H%_{%SDQN>ar7bN|SOas_y=FU2ZF-R*=QMd6Hi9J7F0jE|R0Zp7gUTp{{Pvl=
zah%zOO>2V<e*16N=hEIZV1C#^;nn^vwcFfy+H~Of8ssg`HDRd=R8V&#W`^=pDQwKX
zTl|=B6MpwrF#MzfWStxqT{?!f@E|?1vk&jgQfn$h<%OQkHN(Oi&bu%&|Hf*tiL%B-
zsBy!ABbYIA<cjWm*5CU!_K;4MClqUAw}lNSjb(MD@TW8t)%jvKR&yam;~E5i1}O1b
zcBW~$kIH&k0s@CNp1t`t!N<tfpY4b&*8pKA9CU?+VPUORDjkq6o!tXcrZ1x}7%IVf
z0721uM(*`7+{ad~bwTJ=oZB7yevTT~BjqVb`}{Qn@`iIVmG{NVdedryUGQdW?$pIE
z51`ld>`!rE!vSK5#~)@}kM+d`){e2~|FdlPB)@8lEoR2|JAD$$W6Qws$Hc}OkUeCo
zy0CjmOD0;$Kv|L@74|oHXkRke8%2Uge{1<9-&q!0wto4{^XOMf;J#33JWmN*%tsd)
zw*V8|_mU=_o2D;C+q}vSRIvscGA0GTb2LYY7_Ph(5=4-qo|*ik9A+%E{zCj_zdl?1
zQCK(P;Yub|?rFfkz1%kY_BmUS3o|A|pSx<$i{Vc%EqMoMwi9i5fsFz_(tLr;vF*xy
z$7%!4d-<Z{62Vc~%=L%EmZlH%ZdIa8cMnw}p+Q)d`Wz2DWG?<uKL`+U!Lh*DEFmZ;
zm&|{T`lw8(N5{53(MvQh=RRK)3<3s3;j-wC9OmyI&`PcUT{)zjFQM&L{;#rOh#Ojm
zPhdAybu(q~$zMB~_OBNqA*Tw98*(?FC2uZ|20Otl4kQwbNT@N%>dJbCv)IDry7(Ht
z@X?@q&V_N!9DFAE@^VG)y5RHKa*X2?aOjxz$-Lj5-jzgbo&98b&3EXGF+i-Z`+WDy
zo&pXH?~|12yNf}Q#*S^h74D<4w?3FLm@c|C@JrM__8Q-=?ce6{|MrD7G$<<S-1;ED
zY#?8WaM1W-IP_hPyIpvTS&CZp&VT#ke|>AdPL_86w4cKtb@?rsXV5wD!l*g%?2S5q
zl{l%V<$>HKN)CPFSTiX0;MK%CRW^((oDtDUW6Rs)X^*zdZl;Yr$DdhOw4MlG>@?&|
zc`f+wggae?PIrVj$xj{!r=HAM#><+=JtLL<t>Zo<xq%ik`!kxFF5thZUUX108h);g
zSiZA9=p0ZJ>zrx=7n(E+Y?WD3zBc7GyQRj4*@C9pVDl;;v_}lv143T3!$KUg7w&22
zEu_hsm<BF=rTGu}=pT3Bzn?p5*>Z2Jg}indFD9`$Io99d+_`f|gUe}sHMaVM^UZ0$
zo@y1-|NL4FQp_h;0aJxeX*ZkNfp*!)pI*JA;(0DIwEm$a+s^bLS|8naEH0Mb9X(#E
zpK)`Zb5lhwvmZn%BE8pgbWiz#Y{c{Mrq0VxHA8k9i@6~r!X-HYO`jL8cJ=L!!UPbV
zEr-b!9#*e1UBe}Tv$wKjhs66+_}uN!F-X0UR~SgS>!;I#f!*XPv{qr0#NxB&x9fV^
za{=I#x&rONoP><ax96+ZdO9M&02WhWIHl!0AL}vycbE4+kMe)mp8v~l&6O$AYKf0>
zZZ0<lfg^{Lv5ylJNrcQUmuUvIq<4~j1Z2hr9Azw|sXz}C;g9|E8=WrKd9pgpZvN=I
zqhS$K?SjJ-_M4+c>#J|I#RR-N35~}xoSMGMoOP1cGmHag7OS}TQ0b>RHq1?o#~%$|
z%%4J!u20(+NX|#%1AZ{N4+s@4-QEJgL3@)j#~-xo4mJ;tTlf4cC`;+RE!x~n+7LcP
z**Jgi17#$``V3xG_J7!2{>KmWzx~ks2R4Tls-^v_@g2mUu^gxQ^C7Qv|C6acC&cyK
zUcjq>GZahuTP>-t>lF+|ffq9i^!|3I{|{$h9TwHrzO4uXDxnCdw16nBD1(52A|eta
zAf2L=bTg!cpi<HxF$$7Occ&mQfOMC1$B+Xvd~193yze=ee%J5yy3QYihuQ4C)_U&e
ze(opsBj<U=4Kk5kT^cGF$^l7d+T0s2*xtzCUamzpWL6YcveC@ZniQ%1Oip<HZX#T$
zudhRrVY&AO*PFvnI#r{Z&dUV`;BB(J=-GD3^$)4IBVvc2>RnfCkj=Y_#&zY#9e}~a
zfFqN)UM#p)eXR8bwYE|5<H~E{oM6(xeU@qx^s9IM{(ttoPod{MFwxmpN0+p_wp~hs
z7vb6*DxUx#QIXmJZ<4;2<<#>L)hLRyLbo3tw1;ET9<Bi+>=Ir@wCBCItaB+k-_bf<
zwv_9)Xj?--9d(RUpnAYD&!F`}BHW^CDYpeRV2Cukbm`K=8yU9gW>FSiMf)pdLkt(e
zS81;Fh8`iletO(z@6t6+wx44Y{+^%kfBA5Z+Cyr9_t2Y7xF*(N6v5xf*Dl;8e7M)n
zAUFnDok?a%!>|jw^&Si}y6U!*2glIYuY-eZSSGKET>`Iglow5jwSJA*`lw^(I}awm
z6b_l^tuGj?RcsHoh<tW_qYASaHN~y@iuSXiKO&cl#wtT;M)KVz17L6M7JH+8MK<5x
zLoSVO4;EV`mf$dpt&k;7j)J2~I9Tt7+nbF6i??nsfL%N)=sxM9<+{~lu(vU70Nx`B
z1MKS4sS5oTszkHv?Q!7t=h*rkMtG}?yDr&`*!2yp+ud3P_fsIs39^J|jYvzAdwi|q
zg&fSkCX8wpnnr7>fax{uzDeNVFXMwF5qDbSNAdID@b-WE;2%-_!8FQ!uq)o6@({Z^
zgc3QJAd7LRM8_R7M6_@fMFqJ`G0%Jmm1EyiEwxQUto!Mh$_Y&1=Q*x_Q;563fcff+
zdc_uR)Y8*9SYXn+KX&MbUbb)_GLMiX9N|1b0_>Z~33BCp{fXXb?)?nh9TU0-e#sn0
znW)hCSsMAleb}n8CLaU-ZPaD_7(=!Q_5__IG9j>a$1SeXeIpcU>IQb`JT}Lp!Ldh4
zMNJf-q=WS2BE{gABvENc)qE07O%-k{E5`kB#~l`_?PQ!5ZJr8&l4+peLTYovvysd0
z8%=B)_Lw^S!>tc&x0+&|7Sd)acPg@UXk8B>2PKT@2(mW=)mBPEDw(%iW56q?23wcZ
z?XsLlTH0QXEg6dLN8en^t}_kJERnpmAa5_%CNO!*W;$G@G#NZmS1Wkk`tAM1qg>@{
zwI^F?M%R2!Aluz>=$Y^=m!!qns`b9^6j7{k8SVfRMuKh@bN7DlZZ`qFEqZLEQgplj
zNvrcHnjX~I9z2K>t;8{kyPsO`jI8X&3P=de4R&a{azoI$RQ{~un!=%AmHS?cPX3q5
z1G@}@NFBG5xH8~+`kkf=+C}#JckB*33Id*N0>ggWG3m>5hS4J$4uH`RN6RPvp8+NR
z7X$n2ccK=)14X0A_Emt!jjH^R#qaI4yPG3NM<^pi)Ua3JhzG_`EaoO3lQ~E2)sVT3
z^D8B4!{!(7IlE%#Bt@@5FA|ofN$ntYTK`Nv#1>pPYMc_cl&sfpmo6d-K)obAuT8K;
zc&DV@&VGbur2GI{wp^wQF&TE^`)s0nQZ~TVh4DA<SK6X0M54=AeDO+a_E>okuSNux
zcZkOrtiLeLIFIeeb5w#d<z*eb-6pu(x8_<{X&NThrtNBw^YCPCy1H|n4~apICqbqh
z?Ac<&!cCi*;@m<Qpd&>!2If6wE2SU1r+q~a-fJ<d??$(~G??GDXnwp}vBMv!Y5hvy
zW_Q9j@?h5o)4?F_&EqcHWA>?$_E}X6cNuEV5x00!XV(+aqA}VjkY%**Zzx<B3!DdU
z9A<KnjNSH0xw+|%PAT`M)RqV}_9PjG`K0T-j+7(V#}$V(*TbSJY%5Mz9JaH#2yCZJ
zD87~ybBqMbM8H43*tJr2kbQAeG6w&?E`}Tc<~*N@f7qX3z5zP~m{~C)J7ezdjgMf0
zi<dCem1{2yIuax@g}3h^-(}DQu75xi-kQ5T1AJbQd=E(pW(ortT<;4JeGM4iK99T2
z)#e+dt{AKbA-xf-eUYMny)$6xaGl}sXqO1rz7LH#FXn@Fz2#aBVT`Zv6jNq^$TD`I
z-L0@-Ykn;VfqJ4DXMVqrEqn|ezmsoOxs_pIN0U@_FwHY0yPTO*z7Eq!)O0spLm7&6
zEfw@>+jmuo+@j@i9o!F=q$lo5H`nalb`!$hKI(F?T~u`ga<yh3;rHD~7PV(F*u^T`
z$Ni5-n&%;g;Hq9`UaeAyd2+;c-Ur8#SzIe4BcocjELys!flLlm+5O-U1~ZN%L01ON
z3eVo0Sr2kA?_jud*`nN5_Hk%QZpU7i=H~odlp*$ZZ2)Xkb#N&Qi@kB<iw^?p@xr{J
zFS231J4K{N_}l3q-nWU@1b2pQ%;Ipf)K$9@(^>SplZ(QTe=n@S6&xwZs=_&;!7B7d
z+%SvkE9vUDsMu28S0OTeveynMK|qo6R@T)y9o4UPX*~J~@cb<2jSBbjMV)6~`}ZK0
zPX{pG%^t;<$MOfR(&LJ(7{5Hcd9j`XK73L4!C|Ouk%kChqo%<rDn$(}a482@eZHLt
zrH{(tm{cyBUM(6#f<qdPZq?EEW0wFuuwjdm`Q(@fW^$s~O$8dnMW-}vl7UAngI^lf
zA5>6%(kL?bGc|Wu76Gize4rd*la^s>FnW=u!;HqP%zk-L0n5y=cfU_(GF<knMsJpm
z&a+9r;MV;l!5h~_kR`&D<()HcO)>|pYl+#ynz3#dVh$MJKgw!|8Qr`zs}Ucjoo2!Q
zMz&YuDPPf|-|iG4fyPwRp$5O%V0U*<M2nAWpUU0~o`I(;3q3`dSNE7C(gt!G={24u
zE>B7AB;72<EPRwUo65Qv=8`&*b!EU-J8fr{S2JjEch&uHKLUhO4t@u`i6KRqk!-i-
zrMQnH*j+wXiHcZ<ldOf?tB>2Hp;_Tx4o|M+B}X2lRu_b_?ey`7R?&_Rc3Y(_*WUpE
zd;a!#mU|h(4;KXB_764)Y%nKYD3};MfHKiR9!#-uz%%c~iBM|u555I{5qH@-9gcx8
z^HT;~s0wh(xaA8?Gy~nHq=Ivd8n(cJo*#I)l#WfYT2yRp7e=F+yO#A6%UrDsMI^Lz
za$of?m809*d@I+HC%9=^0vhNlL6k*nGxy$iP%l7|pDL!rX4a?GU!*{T|Jl&SN$%q6
zIf{k#4J0qaj3+<jTLVlFijqa-HTkO&n-}UBaF#pWuCBEeA_Xp^<%lGHJD)Ll^g`%B
zT^}Gx=7nQ!&KjTKgNMMNX!(uvx0+^s8Qh9X<`Vqa%{F<C&uPx<Fr@kwv{1~1H|@<L
zEjF7DaMDQsmB^l3blO7<_Wh4n<_~oC2m4HADj5LK?yb!}<VOvqeA&kijdCClcMfq#
zvt;-?6$V@jgHB5UHj#eoa@8y6u}yEp^|k1^uE|Iqoxt>vc>6))6`u3ua}qq)bg&C5
z(p%4#N@nA?&-LsqNMhF|@K|_-h}MYFc~9b_S$`ep{r@?Yj6Pmy>0|AhxrX7%Akk5m
z89rp%^oN+?=`^$f?qDx-bnJukW`|@96gKqiS@4?=8v#0O+QFf{eu5b;;?RSe`BvK6
zYBXm-RRyB{R^0w-5c@|k?IcLx8<9=JdBgtgG2C`hfce)fXY58~)pf{`nJN`C3F+q*
zR2gf<eaYe-=H2*UmDi{3d~-j@{U8ys=EbnIlnisLDwQ2{t6~#be>DTKmk}3;w_=ns
zR&VqkVzLget-7u{w@yduXdCmuufYUYH^R0Rv;Y`xu-NU_y$tahj^Z;6<mm0kl5D0r
z_LYt5Z#JI5bl%u6EUF+;QXcAk)Jz*e>*RxToP>DS2-(H_W~5F5b{&abGK>N4T-wh>
z#}!~5Lnx<4Au7PCPs`yv_Vh{Z(lmFZ>vm2u?*1h3*!1bppqISoM_{OSPbq`fP#pKa
z{>S^7SO(*RSSy*1&_K<nAkD!u!_T>TmLCdkd|_?{0r|pf+r$k?QH;EaC_1|Rdb?u-
zpQhIC%x50A9InokgvG9o^$i$xBR@)XuL;gC3do=-Y~-ukxCdeFiylDOAlag1vs2n^
zp8_tNvu(Vqo(9kEE8a|k$Mmr+O@`+VsKXxa!!yV7jYIR=Z|!KJfn%Ut@yA8ITY0sd
zc^lWTngTa!q*$x7e+Jkhk{^?Z=bE8a)(Z{js9fD(Xq^BC%7^JA+$7$`NyGHOiXIjr
zzKGL*d%Zu%TeX;3rjA=E1`#2ScT(2EDU?p*=G=_iVNYSQ!VEdi9P%Y$IOvGa0Ppi+
zzvT#c9dd<}-F()?{D9S+Ws|ycj0+Uz$laViyNGMi!Q~>Fq_w~KU_fwVIttvohS0(3
zmnQWvu=sot&}Q_f>FfQ^I{|i%*NjLengq?5Op{^Pm0|w6FGXc?D~ZRoseChur(niU
zd-EcCE6bfuNh%$F`LOD6U$l?k&St$Ue)~EayXro+T{iA{5_Oc2cHCty1}r@W-&`~@
z#OwIv7;brNDTwf4T<O4|y8;G8sU%B0ZtH&ckhxh|fSl&oQ}DYqcCS*KQ1{N0F#-_r
z%`OhbLSY5YNDSE=6e+TY#Vlqy#9*N%1(9fsNmfNKX;=PZ?ZXqEZAF#$3LfKt8@kFC
zYk6lri>d#p364*RAGH|7V(YrVaq#%{A@zk7uuq*`b0!LUpeDKc6f=mx`AqLbll~EU
zh~p`m*9o7)0WQsdxWRL%ms!5?Kw~p@R=CjxgfIE4WTFR_=l~0sW3sJY^qY)3mGiBY
z`zt1G!e|+lTWT~jc6B@7KKp6W%35fn-}XhpD%S%to%+F|dE-<n7L<C&x{x^ANsBuU
zUft#E`^I)BOw3Y5<@%p}%-CH1nib@_^kgRLNuZS*6yp}BpxVKZ3CvU1IGV#oN(}Yc
zd{bbkR{@1lF<zDlCqWBd#p%cwuaqvL%*&PyGAl99(A9(@U)y5b4@zH6(LjFid!TV}
zmhbkTxWT9m{NyDc1ZxV-6mqA0R_&$GN^zoErAvwH;S8*5;Fc>EJWf6WFg?STvIE0d
zni*`0sg89M>pj@2gDXkdV_ex7Hgm)=V{)ZpXLKgFg<JZ>1VsOR>77!|{^sOTSd96U
z=+V(blVf~9@G%eRYn_ITx#UTt#7v2T5F~nkcvgfpY}fCox<EKT3JILZ%opaM{G0`f
zjWJAb(c5;n?Yx!#gWjS_eNv&NYz1yeWit?gRJJ`E)TuvG+0rSZI%#IIioc!Me`F>$
z3<QN}n1!}6^U6DTCjDohy)L-uNcoaJk9e^h5@?O*M|eMFg~CM!XzjY?Gr6}~v%z6V
z!~y@Y>I0-HoWTk}ccHTRR-k(bCDP!aeia29ph!jUp=V(?7}WMoOVU1uV%Wt)K+Rqv
zz?aO&+JU_R!6K+NG=7sMrVHY1HWM$X-@bbF>O^}QaCEQ(9)RTyehg3NbY4O+mR?J3
zD>l4d6*7EgV#~S%|5)Wqz^{tol^Z=i{&N<<|B54BufIzY*hL)+U~h8hG`MTCY1wjN
zKy{noA}1PbPhYR-_)#+6K24hdS9k1IUkt>OGRHns>u3(1T4BFvff?k@f_I9n*HbLt
zFMXu}v+?B_naiN5+)9EsS1qJ}T$({=YoX}v>kg7-W0ty_*YVMbK_Y{(ww+QrOlBhy
zTpB2P=cUJ)72E12i?Q<uTkDufhC`#xv@PUrJsXP2m$q|G;fZ^H9lZfJ5M77vA?V$9
zC$_O*=;t9&J5Z2t$)B=Qb%>q0wTghh@WtuYkKJW3zXR9mTG)kxOhmI{yk4Ut4vn+`
z_KfOuECOBX18)1vTG4|!Pn2jXF+ExQkUq6+^Icpc6aHG+#}GUhB()0#1g=m(u-$r-
z@6sReO^>vDx=X-(0&2d;@(r-c$53kGMC8Y;%E5>yUOO728&pMCwP-|_jp2M?X?M&-
zT@wl_$AC=xY58!L$9>Q5h8^c2$P4x}NWzZ#=C}dsV@30Y0fY)MkRQVFZe!DxJ}w#9
zxt=Jh)L!$Xj^c5dIBBr{?Q`$;VIthNk7VKT2y|*sjl9GHDW;tyCFX-&UjAXHY(K-n
zIAQB!UpnwgKi55*<ZXx}((e>E&JT4;qst)x64_r;WY6M@;L$O6pL)L6L2}SY=Mbxw
zZzP{qVjckrD$=5Ni$TbOs#vk(88R<5kLp9X&51KCSl?RC??QoC(s-G=VoqY_qYgIx
zV;2l)HOS>4?#(8&V}NyCdEkU-D-IBb;10HiM(wJ-RttX-IvpL%G3tXa7n3YdJd2R9
z&I6fzrA_0PKQj4b@^kw>dw{b|-h)-`^NeWj?>35#&iUAkFlNC0caZlpVn%pM=Pu@<
z+l0!@VZ)YQBbNTMbL#7mFfP0xA9PJRg7Ye*L@z1kL%=n_W_&nKC~E1tC96X-18GDN
z{6UKpGay3)$?=JB{Jwx$OeYDpbdR2=RSo933dk_TQ}4Mmt`%gtw#GWIl+1Wj$nj#P
zoDO>$eGntM*q4&RwVH_O@U|_$8m!S%Y@!1qvYIeqXu*nT;(!DP6t^_BV$1gf*^j+i
z<!6s%!OAB{3dcZp;OR>7B<a5RQDNglkbpLI^{g~MBD(oiJiwfGM~9Hk_6?o%q33h+
z<ilo_N`==u;tZHK2*5O_OJ!1kNQRNt!Gr{0p-6s&G3Z8yXuc!r3H{_oXG+0h*N&YT
zNI_I(yOUJwEDl<B)6772`4%Fd{K+7s>zm8@C_433)lTuye#mV0+vgY{47F#{^h-x_
z-zXY&GMR7MO-&3rLX2|31ATtz*{Jj2hyOp@|Hc2Ue#FMRO@cl#1?9rvYCAA<m`7(o
z>1?b`pz9sy{(Hz>w=Yb-QI^bB{c_8Y9t~bJVFy^TiaVM6ZXE|rRe>ffPRD*gAJbbY
zC$jexc=7V%28jz~__kdohYL>tZ!3e)ssYQtP3GKRw?sw?A^Q;TCgG9NJso${*X_=f
z#6_Ql!oE_wMSt_>eTPZqVPhasqx4KL4pgm1MwU;pa=VS3%@Upa+6Q2bb8OXRRwz@%
z1!(kr3}JI*=QnRGkf5E0=YuXRXhZ&OIOz5P24Yq-lv$21IGi9D76BsN%@_;F&rw5%
zUJKo7`bUSJ{Y(^aGAHi9_7^Cc>?qcO!lTi04<>06lTkEUTBv=}j=9LZSY$d(@!8Ov
zV#U~cphMKH?f%3^haO}u)pLpvfM0b78nkA*?|b-*zLdH}Y1kZtW%bci5F<;w0~ng;
zzm|9hnd#ak3j?nfNt8i$x`6<BfZ^!7Q|ZfF^ZQw@%O)J~RkvD-c-=OkRpFuQ!v{gQ
zbekEJ)eK;j(){cIVYtx~WbXYUvLXjSc7CV1NxXrvwK*)XUsm4_vl=<#if)DND{W(;
zq%IPNgCB0f!%J0bp!5tfJ&PuPQ5%y;95<OFJbfh`BxHL9Dt~YpL|VW#MSG0XK#R6A
zriH*w{7{k%^MnA~ac5T$0MnA<M8U!CWDv~4d1&Z?>|k#guICu`BoSuH1?Yv3zNQpR
z+JRtXXs=OmPCnB;K+N4}9iVpyP6>}rLubNguW)?=ek0t^e6DZnT;;+>AAe~)*z}pV
zi#oajAb}Lu3NidVKZxOH?im#RubvtDeO^jpnL!@}19)kQChYW>bqg1mgAO>D$STND
zLsFt!-kh^*=PtwHuH>TR{xSfW8MmD>Bt&TPb#%f@Z)(ACz@=0baf5ue%Kp?I;1`2T
zw#?Wb6&*8Jw@D?L(^s!&$ON6Cl9W3mmLvwHH*xRDTvJOx$U3y(I@u5~v(ds+1h45!
zsW(}|czI_O4yG4aeDW|ato-(xV=38TgeXfBm_2O2O0{bKQHrSY*Obl0ncWeGv5_U<
zX2aL)>TpQhCR-Vk_995V%sz;*q5@}xjz6Bpytu}+3cEc6RBX#9GDRcyF$2I8nK}x(
zm$uEe#R;`p-lPJ||LjG;{1uI^ojdWrg9ZQ{1w2K)x&u!A_IxSbhSLJTUoGn#`&vJ`
zQ@K-8^^JG(jQ$<4)Kb95ix5-L1pfgt9U=CA19mxxoLeij+VrC3Pm;tvJ>3#HRCQ+j
z#I6qzlzX8JoEmIeChAWF<z!k246GGvpF`5LYK2pQTDfCR2@vy8Kn}lS(;-1UFdig=
zF|z5DVv|MQJ$D5x-F+g!6Ypntg3o{OTw;U(ug8v3#Q?ZIi{G26WkSWJ{xpJH>zVQ=
z)d}|P5eFSK2ot&?zL@F%9kJM;n~X!Zefl%Rf>tQ)I*tDe{N&RfkTxc~ofE_*QNA<k
z90Oc)`!Eo)Im5ev?iUsJU8QXk%KI}?b{C{+QaVj}sm?^*!-wK4n}xKLx8Kv{Q%q!6
zA&=RS(gK<g+%M?YKx4}8Nr7)jN<~)w$&)?DR{%TVa)Pyx=_iGplL6NgVtzvSC*d2T
zM?8oCT-wFv1Am?+MkqekB>oeW5yK0W1vkUyd|W`}$3a0ogj}^aTZHkS7)14T$Yi^W
za?i2<xSk9fbiFtOznnjE{U|8?&S#??P5JYBg3v+RyrO&LPac?e5sIHa>EPl2)V~s$
zz#mAQc#!ocmlMOAhtMOAQseK3vt<O=qtng#GsF9Z-NH~dB!6PVpzM$zTB@b<<GVke
zjaM9c`crYL$={>L|MiKxUIMIxCpPK*92?CW2ceAZTdsz`8w7qX>;L82e4&tsL?QH*
zf8HOonr@vb&yW7e16O}y152OhMoj(_@%()taQ5M-_<MK$r|W*80H9>6Y%29rE&b{N
zu1B2>aw4X^S!24r7X7+lR`yfyvk||=s9vGzfWq}}LccL<4`XrNw%D5nE5kRzT&_I>
zJ-v7}-m8zPIHSm&SMr-4UpqF9&29S7p7U#%dFKw*LV;ez9nsm%`#<l95#IoWH?1+S
z7{Gs`drW$pFYN_rQv7c9^PX4N*Sq97b|?c1@gnzqe9SEN3TSLb9v=gRBEMLi>Lo^A
zC8)^tU`f>i74ide8su~fL9CbZBtx@c@RNE$11J`I$gP@P&8aEy_|i-}A9~Y$gDhFS
z?YA{yo6PUrZ(4>5^FHoskTvi+uow~CTl8G)i^L_2hp_sgdZnq_F)3|mw}DNKG5_DV
z&C)Yb3()kP%0>U&TR-n!?2N|%I7HLUJqDjgKGGszoTPrs>PP)HqfmXW8S=)zEKSm#
zIip%;AE#E}6leNQXEsFhzsj@M+y+eFn$7&?h%4bKPD9(GGV8<o_p;w2kCLUCfq^;d
zE9HykiRoDqenr<bc(k8x!cRaMkzZN~?>^C-YeM+PzVAI7Q(Gb(w<65=OjfAZ-3FF4
z(5T<6f*$^*?>(%I2EKNGU-%eB6c^1*-zPQ0m13J0)7PQdVy0l2%0w-}F`FlnzdNGQ
z;<_WHTQkthnHmCOOcjPkpQM3!-{A1Zol%~cn~Rarzc?e{;E0XkUt0WrIB$h+O8$I4
zU1F3E3HqaQM$X}Q8ZnPr?icfj+09=cH0UDt#bB+A6)djv$EY{8J7rwJbIZgk&D{NY
zy??G6mg3wF)RMpIPC6g_b6drTP@5!ZoG6Yf+<j^oBu<#wsQG>#jenhRF;RTwW}iLE
zTq|uIJ}Xdg6}gosH}~S_rT%$N3{HAjjY1=X2XfP+*nV8mKe}3Gly~(|ZC<~n@TxSG
z#SMc}+Q0qsKQC}!SMZE#fm22aNHdtt{aDxuTbaZ&e5;X4Z?gaO+kgMa=<#DhNA1&W
z;-60<<^WCTIPf8%X@v&%d#p8WjPwyW|9W$(P1(jpZ!X3QnVNt;Ah-!jxek9uN>I(O
zH=_Cj#kodkU6Gr{20wi)FCQ_gn*?2|rhRzY61<OT8*bQ+8hG*(xBs~@;1DLVSoXaR
zH|R;fVV_rS{ubHB1CCEyUSt2Su}$|G`MIs{fAazwb@_*d0?Hos3QSqg)HG8bu4qPq
zuFxgN_GN?N*sDyxJHP9vi}xaiptFnWG>eGJDAE?L^l+wqwbSC{Ev53eb^PN4Zws;i
z_hRDqjnAJq4@I44kE%-KIIO#0Fy8#?92!VaGfMfX9rLQ6oRadSy?pm<ozF#fs<Sk$
z+SwQN5bX9xKYMnX%y}F+dZu#~X6RVfwlXqQD{E~bfY$CGi5|F8HB#?v*cSVP{&_TC
zeAtDL*4LlTy~?IC+5AiuuApe5L?sv@{p(}Sl1)v1nVmgim<v&wA{+BmN<l$SbL;J-
zzSUN7zv{0S;w1tv{HFH38W)tP8~>Xh2l`v6m@EZKV+i-b@Pm|>lifG;`|O^7ti*q9
z<5dY=lTp$ErH7ZJqvsW}%$K8{X{0t-mUEtEO8)h^IYNB*!MogsmdjB=n^L@@f1gxU
z{AVG$mF4A{{HDXp++)S^$E2jBNd1oT{gz&e@#3+vCgmEVmE)4sx;Uj|{K+B_fsq8x
z=`zeeIrP8s|EZTfnlJDq>Q*Mey?6e;Fh1+UP<-^>UKxI%T3T9KNKdx;S2w=DvEpwN
z`}yG_)0;B=va^(w#=Z!F)<*GhM>Sz#*23R>0j#IKf22Gw19BBlL-xn!U4_59L_9OG
z@uJ6%gr++@KfgQ5u>JV&=tn)7M{VuJfn2+?(H`<Lnuh=7FVcD81J1#TKp?=RX&P8W
zsolI7tyj=1S)f~|-od*e!K<UJ%uQos&C0}d`z_4m(F=UFpB(z%I8i-%M;GhU`VGDJ
z!8nvt>cIp5d2^d`&SVBMn!myPzYYgDG&elO@*BZkXPwR>5ITJlAIcygK&6ANVzNy1
zMX%!|uT#}--n_Z7J!BzmZJm4S9Iw~~e$#UuSd<L3QaShDB@@j!EVGAX3>8X0dzSw6
z#*|*Fs&jik{jX1SDlz^ivt*j?EROm4oQgW8#+GNbG>szvevrQqUd)u@<+h_*!O0ni
zmEkKuXNW;X^GUj4w^XELWWu~i1@CWz(k!fEid<a3+eOn6`qR5W>R^Sz`ttlSTZ_`Z
zq;wz5h6<n2be?S&&N*9>;t6Gjv_K9cx$L^*nr`%UV+BsTAT!9MJzf%bpRI8j-Hr=E
zR!J|@Drh`2OqN7>z<zyekej=VC)BgsWq*S-Jgot_kY<&tN=nP)H=R;f`1i^E$Ct%g
z8OfK|bDvS74ne9T9MtYhk{mH7+qKnpoFF)V?deMv78ZPzVjM960l_urZPO8NP!lJq
zUTCTo*ZQigG)Dl>kM+(ApsKWJIgC)|m^i0eCq`F-hjQ9l7^pg_dO6#4AlHaLNFVz1
zV&N32S3LJxOArd0nxBTJ7q3L_sVlVwQ~vG@ce~(8NPG?{V}(EKNoNhnUHEM4dsCaL
zE66wC*VgKB;Wp#oq<+t(D0fi2t3UVk{o`9<itt-Xmt>+C!7yPG4tFI345*p-U@=x%
z`ar<5?tCnh3*N+unT#`pq_meo<&FP!)BdloUq?^IpO}#hq`d+}f~=Kx<{;sVKuXd;
zZ3d8h-<sFt(4z$0EKvZKAp7=u*wlv)uiuT|`W@)8kcWvGt3^*unFfFOaMyT{g~Moc
zL2k-X%}(@aFZ|c=d;<v?Lb?R6#cS017bw@~(O+!X9zXbazg_e&3@(a&)DTGb5ot71
zYBvp3F^XdIM)l{?ZdGnr+dP1k2lG*$d!V*m3~WZy$tzc`1cN1zvbQfR2c^!}Trsv~
zYoHoJzKX&Au7B)OnlAka;Hep-vhTsrr>mVD{9X{cv&%u|)MwGpDT0IpTR)p8H2Ub^
z%DUXIjfv4imGSvHo4@$uMty(r&(;9vI7R6S1AfhXo*nlv3W`+n)5Q&%WQ7|dU6n;o
z7dN_tI?d**bz?bOvq<-dkC~+pKql|%%?WP`y$xchKGYg0e)EL@9`~595ujD?TY)+c
zC#q|Rji*qJ$8vtvAx@*zVbxrxu~zCjK04<sS)m7X0|^q)vzR;(P1w>@`(4IgY?}OK
zq*bb;vEj5ZYs7DuIm<&O{DhmNN?e|Mpz}r9pe;5HQL)}YbIo$R`j&yp!-tHZ+e2|k
zY36=oAYBqLcuIQ@t%7IaoH~`7kzGLPe>W`*stv8TdQ=v-B`-#`x3=~yj}(|h+Aj8j
z(`2l`bbNYxdIR*y7#q5Ug@#iO@W)wR*8%z*<U$;F06X(Bl{7X^`=nW-P*#;VqE%`e
z92OS#W(T29q{18I+*+=hYPnJ}>qMD0xv{Zvotm@$c{Y97*+(qTPkJ918yjP8>OXyo
z&zW3`k9OW59an2Zit0e1Z&}co=j}}Ly|?hLm)LdD?7NA#D7g}oHxm=Ev#!58-%8?)
z+70i&CB-SByH!vA^w9ri#rmgT&ImjzAew;-EnkloaV?!ek9(1w@NS?aiQzX30crmG
z;6yK8#>1Px?RC6qt|RfY^wdH1F|sdFSD$R&x}2Du{ScG}Xzzh<<*SaepYmKwQ%q@w
zl7SNQlb~{l+mDJXgoK9QD5o^s=tSPc2hnHUmpP;uW?N&}K$#$tyGusw7PDkv{^uQo
z3vF=0d6qr!Eqp(cuMMoy5p&iem^o%iEL7~Kdm7Ih=Ydyv#S!e$G^me%14`@!bM5B7
z-Zn3praCWZo62(Ol3*ueCcUUz`Exp|OHmV`Ix~z~+wt~bzVVZLzQQnxwHn$P`LC2J
znoK+un<3n2P{|bXxX$NhGxC;mp+5~w4y2q38~N@+2`?3G=j9vo19>Tv^qNb<C5ixK
z(<WCd_svU|3x}qFlc4Or`lR8MB#uek=L`5TgJ3fd-|lpvuG{X~#Kr--eNhAIW7z|r
zmi15$XY9tYH^i@xd5Ge6#qar_o9GioV+$5WEvm3nLl#v9+z6-;)gznuF8Y{sf4K6U
zhPRzT55(#&{+dPu<GKH1hvi+abH4tyJ>P$Kf#|LcZMr%>8i>ZJRIFZFAViy5%&Llz
zixZUaKhw6rhIGmOq?UJSyn_4zRMcO{IM{6TI!1JViI1yN8;H;0OAfK1aBXwGt1-}G
zFh31xG%R;8MvOl~uB9;n`YeKv9y_iY8Q%zmTrr3cG&MB^+DfaE-rfi06j#9VzZbu3
zVc@gt_W3ns{7HgBi!pAf`kQJbW~aCverxN|9!SqD&v9uK&cz+6-2HY^sLd5GXDi>h
zYbrG{(3*{)yb$x^)O&oiVLT$)1wc{hCs3lV#$CCq=Nd?NwEBXb?+LJ`iL{^@BG6RG
zekq%7j_GBio)>7a5)BldAsAc-RU9$$m|>TcwNoRW4*BPoGS&c+JyUUC94u!@z;I-h
zcRuKp^y`VQJf`Ei6;A7ZupXG}r8Qnsn}hrgR2NyvTgf<sd+AyaZX_{)@s+v1mKMOS
zz<=yYhx;AQ->}L1@7Rfd>`E05^HJP|^fve1O=>OM;14M&zMrqbU@8z=`t=GqtZ-Tq
zHlD_NCeSDT#-H~uJ`$3ssTga@`i{=BO7z=HX8dmmfozSVckBhiG>!&t4-5=!fTFA+
zv$?)3<mOyQUGqgt=kH}<t|Sh-b)-TlIWI;!&$)&Gnnn9s1g)OEcT*^vkay3^y!uXo
zB0MS@sLZ}ILj&e9$IymWem*2bJJ5Q>5HSTqKfdju)Bq0bB~V6{T}ePX3rY~<L>gTW
zF@04_T1TsiJ*@>kB)01MeLg}&Zo{Kl{7^wbVbd<v9py$qfvRh&0=Z)T#MP=pZM4K5
zhe~GH_VUn>5(%xqL(KLv2SDX;wLF7)0-^|J9LOE9>A3AB#Zj{*>yFCIjg%GXvUvcQ
zeP-yq=z1p}aw%2r25#s$>ytARZe-fZ)q42l#|(H^$u32~R$pz>LA^CgAc1Co8a84Z
zstJl(oU90_n4>OYK~i3_3JEaR^9BAX2tdiNco@0qzRF)Qn#sC?eR+u@;&-|YxhvlK
zHBw5RWq%xn-mBk&uM}hY<iiK2w74FlqOOV%w5}({c0gs(NDDv>n1(*YmM%MoM-4?H
zk*mdoeGjtDXXWt>B{45gGcR4wp9KAY>lvV#E!gl|{i{G>R#w(PTg}VzC2^9(jo8l9
z@{b-(Db^YYjbV4jRylZh9Hx{KERbgs7KOiPsH)E0SHZK~cguGGWUKPqH$6%E&{t<x
zg*q)gwxdz2pnRZ87`Q@o0R64O(-xz?g=qxD;ObCUm;C@w<!*wG(>tO(od>+D(Ii`R
zh^b)vJtOhkw>_9a*T(3g;z?$g@j22l*PS?59?Ys6b=cfkaG<c`wn6p&2dXFid-nn^
z=wDj2LB}b0B7|I*2Ma{Xhp3zj1nTAZ;Hdp@u#=s$mpH<df*r=A4dZi$tN@tr_q?Zi
z-aii;bxhO|WQGij@eH0x-}LSp#p?UyP3BSLv7z5FvN*AFz-pw0OfdVkxZhA}SvK-k
ztJG&!Q7U>mbnz}5Qt}C!i=9^99Ky7jva^;P$A)WxvrFfhuqTB%E)F((O#(O1WqDTe
zA)cYU=Tp}}cNy3!Uz>pVsN*DwsDm@BEj6ocp;jwU+?WAs<+oHfWk0Ta3QEib<%nAf
zVk(%uN~8GA-rBQE3J;<|1=W2$y#%3{%N<4jv^NzRV@MZX^2YU#xOTu&-N%zNy$>;G
z<W?UXn6u7Lf?_4ZvX#0K+Q4rhat;*Mrk-)tbpky?yZS@9`hHLK_2(T0mLV<;M&@2b
zxz!X@YL(dw#;BiSd^X_?WRo%btfH01JWoFtmWeP$x#07B26Gyq>G{^p#ZP%lLnEYU
z56nv~a!_u_?>YuLikTm{m`8e0pyP6BXVyvS0Pt<pk%`WggQnnUnJC^GE2Q1yQHJKn
zl?kiWV8haoLJJ4Ld(aA9R9#M0$%=QI&G9-GyLlekwRZ{l38l4J2>~x_T>(nUi`88G
z9ZIqX|JXN<b@?2l-!WHq#_t<PiSi1!9*Y1Zpr0zPZ146|rsgc`&6@*qPV-5TQ?EHP
zzxI(22hj=jf;09&S{j&(ge1xNYj?xYC2_P5Vomk0fBpt)5rRcrF{)CSbAh_J+LJtI
zr-w7p?x3Xx&!bZ1q1>Exx4h*12Ni9E1UIM<5{kLP>HG4$o`D0e#NvHL4#_1>&|Vm3
zK2kc+can<pO{P}aV4sH^YX1&#D$}XMg^yWxZ&tS~^n5%<IsX#2KMgXn>i~ORTi+vl
zvp`n?S`aIE>zt0mh1b1@E$c|^4HS8U2+o0c-u^9OW4)2VZ?IKNa$*<stwcA)d+tFF
z$!#@Ex>B1n`0d+;;`UOaExEU!*f&Vu#e<0=C#l>RpGzm+3)n2#g9p*y+Pp(hAHDh}
z+IRLln2|zYMx0XF+^ndGkymq3<^CQ0vn8r;5qMOd&nF0fk@Sx^^uLJWBWe$$Kyjrq
z-BC}X^_BWp6w}~_sRh2o9R0Qnyn9VxDTn~30p;uH0|7%}^$nqi=dK&Qk@MsbjIGNc
z2OBUgH2)!V3P5pJBzZoARsCt@5D_2dC{a*8p}#U*B6tYMr0~dEFcA~q;EN+g2!SOH
zCfc0q^{vS^u4-!0z;D?Vf6_SWM_g+a30w6tshECl5&nc8>4q_`Nx<{2t-V9catgM3
zbzi@stUbpFZ}m24nH`o2G~wL^g>KV;UG-$HjJco#D#V|MpO)J;5UmCA^=22`8k988
z>y>M6wmO_3MT3x<)avjxC5I`Y>qoAcj&jkkIv2(omu!b4b|mL`tL>K{mbke*)Mx4$
z<tM|qMksk4I=VoR0t=pIM3Z2pBRem7T{ZjE?@n|xGda)X!}ZR#W@iP?=-+WRc8IgF
z8{ng<1c)-&;PIT~pFwy$@;X8)^itD!jn~!|02R)xN=$kjRa+CNU*-UI>l=3?Okkkd
zanLxW32?QoY0#3!0}<!&4?z<|GmAYRXXpG9pC6%yyrH(RE^AEfhM1o5l<fWc+2+9;
z8`k?ywcf;dk*?nNy}!=5+Sfde#kb~h7<;yTl62*k^LDoyNPjW<(ptZa!va?j3iTIO
z+9Tg(ffo5(-P^SXd+3p-z{S@mW(-^3>K9!J)1_a%Y){Nvw>D9y4|s?{*raf`ka2GM
z7oq3PjP(qFuV+#V(djlG<I}AHuc94JNThchKMG0asHgFe?kIK_KVi><HQ{w)Yzc4!
z&8n)jzdFcbBy4ZMyN7mo`IswwcCOo(QvbEY{fJ!CzeV)_I?r#!WErd1bJN{lchLI2
zzFAZL!lox(sk6%69V)d5gqqH#LDNm|ETD*$<$E(R%F6S@C3&v&a~~X5M>jy-U4PU2
z`X=QDqmwfl1<zQ|pFgj>el!TGoc(UwnE2O86JOmyW9|G#xp$|%L?#7Vgyluug}rP6
zCN3_Ll-phdS%BI|j5k=kIL&<T3jo|tJT)Y%cbrNOtA#Z?+Cd4GN9yQ_FJzKVFIUPO
zRx^>e@E3`cn4*dXCq#f$kmc#n!Qt)1CaX+Ii2{s539~uR+!D#tC%X%k|5peQlpQSx
z<@ip9$3B{Yfirp3ysB2hkf<ZZ@_k7|oD$=Tz>*GXs?z^*Nn2T;H&sn@^evFu8}%t%
zew+2yknXQlO-DTY^vkq~t_8HJ3y5ZDRn=;QzusXaW4eAP^pfmTP+x?hCGEGYz2}IT
zPniaN;$5@B2NVDq!YN5=4uI2R11>Fv`&yLlV0zbLaf;qNh*s`1hDknuPV2d7SqsGi
zz+C&(fF2}+0L|WYC0t9w235nJd*$WA#$Cw)%WVu_)(=3FS}2&|+LLLs(4FR4c!`yD
zzzT|chC%5Prj(rk4Z@8u5G4+-UasG;Ooz+K6%HB1{ane!On@j-pa7lsqk7d7NW%e9
zUAQ>et!|!x)8CPm_&ZJfFlscL0cavWb;K_f(}y<1sF<qm6-|SCZ*7hGnk#3drceKr
zFm7Fm_^yinn>uC}od(j(mhd{j+RypAZWFaHAPydLEw-M?(`_c&(DZ2Tys(AgsYw=K
z=Ij^G)Eq!i+$qgdU|tXel}9eSiMSm&LUC{$)k+gMgiPJOdBv2#U$B9kaS``1dZta^
zafYLJ7KVp4;W-Y~cz0N$uz)>VEqW7EJpJ;9$^J?|;>blOKCyl*x?OZJ6|nrTRJ$>V
zba7r$(|%qLV9{K$=nM%8@?C(Ytp?~#M5;sQQziKt7kT+$C~Epn9waWi?r(?Bccm<1
zCK}u!zv@tI(wFJB`~)95Y<C|pzGYCom?89b4^n=byuWLa|81b(KX-#Sv;#rg5Ungp
zc;&6bcxt|%<9XlLk@m`iUV1hEUcT>&wKL_>z(}RB$-uuf4JMY+LbDhu3YgJXM#d&k
zl_q)o)VX(ELbh{|7}PcUGXU9Xjpl1)I$lKK8S8z9O{2)?42q0FM6<#Fd}7`hh(k8M
zij%1o4K@N+sKs5rcE^<@<p78iM(ZVUO#Y#_D5WFA!=-@E!NSHS*=G-W!kYVYo{0A@
z0fimN&bcmo)^XH$mcms=1bI5zo`|CU1J9G(Z$N)pYbMB*3{S9--FD1SFIci&eA=BV
zZw+Fq`IdCcDABEM#c3}xk!)(}Vy%&yE*Ia9?1!r#n$i<I_ki4}2@Sw#odE5+-P{|x
z{yWS!ZYVXP86eN|lIr_8RgPg-kOK}$0@LRFOCq+-ji(*zPUUea;KKc`OKQEWLE&OQ
zqSx@Xm#Qqkf`)4Cd(VNOyI-9M)V66)MAv*7XmZ^E<9C`Td>K|GZNX#`!O=60V@``1
zg}ijpvP{l9D<cKc_MmI^pc#aB0fFLL21KlKg&S|TT!1ONnbE<_W4Rc8#bMqZD{qj<
ztj`NWMHYQh<gQQ$Ur2E9L|eMn7p8{}DH7tGt{@C){u0c*EI0<p_;~@#cdh}Uo}PFm
zhq(P|F#F|9_bXiyK23K}O*;6BcGf^lROOQ@6L4SG6TRYNup4JklQW=mSUpf^MWBq<
z0lT%(L*cg!T7LAQ7CQ8uH85DHy#*?pY*c!o>((50<r+9WWpc5aR-Y+1fVIsR164y!
zWN(T>(&@+HKLBCd6nOaFt+x1E8sog}-w$KB1a!>VKL$*M(PUv&a|hWhT$C>6%|uGs
z2lB*b`k=a!r95eeZ%MU@a!YI*$B|zX<@+TCtEWC{V`7{Y;Q)~M8eeBc$T@0)A3^A;
zo#3-)!<r;lXPakQSwr60m&(bUk$NEa5G^}z-5qQfW<}9hQ>)+P@(Xi$*hOSn{>cex
zbiMI?x+d>o|C1o%`c;GH&IeZ;X_?7m>*g;6u2Znd<>!el;Q$;+1DjbcURpAp@A(+X
z6?U%{lHds$T(X}U7&HR`6;i~$E5_^><qFwPutpuOl&#W!vl2k<td8k`vO*5a6`wWQ
z$G}&qPg#Wfi5!9s6HsMXYD8_#N$v;+KRg8%cg<<j$it@Md;(L1&pF)lW2EFSn=>rI
z?4~9uwm23wH8s2%!TM=S(Z-A3K>mByw;mF5W<*l>7zY&JV=6(~rWpX<)}5m*#_nKm
z9}CUJU{A0_Nyd#6HQIYasveXY8mhp8;HYExO>c>fVabFK&1T>+FfgX?<TcO+!N)T2
z9*D3YB<wWDMiev1?WqbsevwX&g1@~kwT3#q=AYAb1dN+iapUYY>irarJXYBwM-QoV
zjGA~I2i0fH<HCb^==azAhgh#6?n&v7XSdM0Sic^=#`w8%=GTnGg@R}%LVt^sk6BhQ
z-{!(uHDlqGn;w7Roe%nM*lLK&H8VfcAqCE=163A@q^6KJoFSSV@(VriFb<#INM$ZX
zR*$!PmX_DZeqprTm+@$MKH?hBgD{w#8g-1JzK#4uOzpCmDzHtiu4LIR(&ZIlOBV=n
z=n@bP^ovddx%zm)rIdGGg=V+_>Fo>1X6zdqIxf;L65YNQTb;oRTn$u}`l;o)BvBNT
zAk6CuXI5&NK(j{f(^ph0zItTxf>gBEEk-qA$4(w$RBzPtc{l;`JQ038l>(3W<IJ}?
zqIBs`o{*V!B-+mcO?p}lK!n`X^V6jyr59Gc1dsoe_b5`AJ{%s!d)w#K`Gg_)B6F=8
z=YdptW>>m}xa(?4n{@r4Kf*q|$X@#^CE+gN>Z$~_77J8gTp_?DrhE^gkk8p5BwYXW
z?)AmV42B|qo``nCNM+(U93gAV6P3R7kWy7COFS^gFLE~CS&oOQezq7&Z-8km-s7;V
z1@}%@*FJS2ExH4;mb#Mf(@(e%etdm>@$c$RC^PK=IDIo$OL~dQj$H4RAo)u_82-Z`
zLcP6$kA73jD%MZe!e#Zh;X~724kznVy4PPdD~XgShineR)VM2zr4<y;TzN}I5H^1!
zL`+*dzD}4l&ikfzu}#g5Gbe=pr9@@-kwZK|bODOV{B-GwfNCLW{Zeq;Xob>;lrA0J
zovAg%q1Jf&3l_-qMjmfeE)^RGox6HR$T?;nQlP{H0(kYC&z=V%TC^$BmpMuYq(LCb
zZ!mbIQa(<MoMeKCwk+dF<hFd`y?Kcv%CUBL-A?gBgBLopAB%ISGl20*s?j%Xl0_W+
z4qN?+eLhPd5G5DN(M9Fe)eXR5rH)K-71?||m48%ooDmuOiSxSuLsiww<lltB`3eaQ
zeez*RWEqH)!*+dI)}WbtKZ)Qq?>?mrZ_qx_7VRtij<j{O0gh4@z~Fw6qv^Ic?Y0aA
zMqCozevZ)X3a2g0k1J!q2W;KM4S);{)*s|&F4DlvK^GE*VpLEiG$+U)H)^#TP(jvX
z$4^;)n8Xvh49UaWwZ~p|<nZBnBC7hJPz1bd1Or^D3t~3T!8UH<fDf=7EYK-igdxDx
zJ@aygkScFDT_h;Q?a_<8@)*&$nUTBcvloyIIe8)H3(bZM+;LYY5!!sj<2KWv+ihVk
zmW=OE>Fh44@@XSw@qc6y!|yWE7IA)D_>Z%dXZic6B!5D&tyUDuW9YTv>P7JIggZ!K
zr$Z;T(2PnrM~#bK$o<#WZ>w}I>29u74~}{wZjks!7uVmllacv4`+h-Rkhq@0<GX;~
z+{*u?au*tgm+1KOHCum!|Bb*SjV*eU!S_H$U=SaD=|ORP-MSO7|B&eDE96`|O9P6X
zU0toFx7!_-`k8>v@pXE<5+L;bp+Ym(D^dXlO1Ga2(A6Fy&@=Oc>P6-makGjF3c@D7
zZ|F1U1rn;_gdDbQJ9f%%J_uIL*S+c`P^pro-3c)HO;Th;L^FsG3r@NLrfBXAvhgfj
zTwGHX;n7Du-SSWBS#M4Puz#aoFy~})tr0H-M7r~-AeD4NbBZasZr|@YTJ-Qh(Et_2
z1Zj_fb)rD!+5Uzv6v75Q9l0lz7xPX{R|uU<VvttepIUOZS7P@Qdr{?}Q@YeO=pL;7
z?!Z4t<S6GUTORLI`OkSU1uELF$XzD+`0Z0`<s^5PK#oXpzCR~Xo80enaIlLZQA(1k
z@J)vmO|3CV@m4MOi%TCYvf#n)?__niFGW2+0P<@ApD@P1J$F~TtH4BsxTkM{3f0%`
zz#Hq}gZKyIdUuJOsE_NUYb)x0DCx3#kGFZFCc`&<T6XQh^GiqfyYs)~e%`x=&f~J~
z2<KwC!6o0^t=R<AnQGEd+#rztN)Zxnq>YeHGQ9L)+3D4SrWS|3ONij5E4N)k-g-Vz
z7QIq%=4n-Y!PHCfYf6HRUp%dX8uP(sEUaJf@6m;cq9pZ9Pdt(Mo<%EaY$obRr#4XM
z)!zrQ75+Wj7??$`&0G}oQb(dM)MR-(243UxP*~<)b5T-j@CCG~Xvko1Cm&vAiV7n6
zWJ*BXZHfn2bhnqo+%(VxI6&wOuO<~|97|W?7|LPrQ_sHa`B(mg>3ja9n`XIuy)$S(
z`D}|2pLF5~HoIA9C+ca*>=|x_lP8r~^##!=zG)B-+lB>xj*cp~AzXTgzg|MgNZM#F
zoI?dA=W6t-KKoG<nqHua$3X-Ff@`yYm5PTq##=MJ0X?Z9RZ$f<$2n}<C2I{@80RFi
zYBnU^^4l-<ziZRnHQgSzX>WoC7^vCWot$At5Z)4cND{0n=HFz-q5HTV<nW(r_0CO#
z_T|a`(<W=<HBN?^7e<Wj|GUzU@v_JLOGo4%X06cjke<l*eDzmK;MDfH4Tp%PV#(fS
zgx3YBnC<yN*~$+eG_{?r5?yx26xOdyIO{#|WV!sfoT`n35b<(~=^gx0ovzeER9Nig
zCU$tpg^(|wn6E80bLyXpm|DKe@ad|IpA_CXSas&`3LSPh;Byp_eX!3}wd;4TFMbvv
zw6FKE(t7t?t02cl{~bc?#LThaC&K^q|6;OiAS&;7tOZedg02XE{1uJcc;Ry6Ko{$~
z$omMNsUPsFv)OV>7vF@3>kIYN<`l}&-56~7PGL`z0|1O5N)K@Ab)0WZD_RX%qIJ|!
zay9B=xt$zD>TdWh-Qsa;RtFb%)mE>DK1g-M(>2Q7pJ6%g{q3b+_;ab6veilrMn*E2
zrcLXO4HRFycg#pI8TU4zm0=)jD)7xqYjb5pW3?ePIQTTDhN|)Iuw5MqZ0=Q)rFk{?
zZ78bM=>;|=xj~A#QTg^FXh?bQK$e~Et4m*|v`jJ)uA&_b^3nrZpY?**CmV<Qg#X($
z_m>e(Q7?r68ADKzgnBPoHuvdl8{Tavx7+WTE5yqpnvLV193{OhU;HCBe<!J+JQF%*
zupG8T`NDeeW&jJT68_{dlRQ8D&6fco$SlooJ;!_1Imv3u&(yPhOTCLGW+#?IOFg)p
z6(pb{+SIIHDLs4lyudq;4@v3%r>tbh_gAYTrMXM)uDYC)lU(S{_&73~qc|S#ZPdH}
z&5x%U-2QocoAGx+S9u)X>5j^J_x%mke|>O11_Ij8ZHgeEJxhSjL2C}2Ig|Pb58zQD
zG@q}ORN%fG;71m83z=uVYRS!RVK=)3=b@}OILF;_0pG7j9`YR=KYcpGS1&E<q^17w
z)!94Lw=6p2Px^}Y)zZEv;#AER^BV&p`f@a-1}_^M$I0u=^>1}?K+_Ed;^~OdW5<+G
zHh3>Z^u#odjXJgvYSMSVSSwsNn+AaTMYND5|Iz`U_0)aI<1)GQuA3d6#8N~Zt<Up8
zLG}Y6K(!jBnb(x}L_J)67tTW!sOt=dkM+wA#NeZ$M56z>tF<da1Ze&f@&5^cs<owb
zpU7oSnT|f&sgO!MuFh#8nHmcAQs6FH8-Y6L5NveZ!UV)5iM`rZe3o>7NV#qG&We+D
z(Nxn6mqt>4z6@JZa`JuUy5pViv|Y~C{v~u%@OU`AcskUp&@`l+5VrD?{0bL$q=WY8
zMQpnfqgJWm{ZjRPc}-RBpdeJl^hsS-GOP0DmroSF9pa-OaAs-F78q&kd#H-Y-$a=-
zBJAQmWh!=2OqCzC``}!3suZ<2R=s;bXh3?-!6W(+%X^#Iwhgd+QW7Lo2}(RT^IA<j
zA<BDapoXdn4*d-Ewz#`jqJq3HqW@KH)qNH(M_Ak7DmV9);H93$E&b)e=uVkvov8Pz
zsj2~cX7ZEI9C*5#f6fAUp^)HzaE5|{^;SVdzIhJ{4$~W@Hktj);Cth_hs5#1?}Acq
zyUtvF=`vfQ2{1NRy+VTJu3bq<$p+95<}z4kQPGL$8^)b?LE+35@T+;NlivdsZ)qrq
zt<A{0w((h76qEq^r|6)YHLKhz^1+KfI&xGgP}J1aCq+`m`H1jDf^_#yh+-x>2?*D~
zgiS?}gEjFubF2;M18f2rdt<G8wg;f7jf+fp?YS%2f;hqzvl*PBQM5pOk8cF1yQ-Jd
z(wcoTJ>TDT^)TyB4Ss@0^?ejU5~$E9?FQ0;)FBQ_hsc)Q2J!iF>J4Rlbl|<uy9C1+
zXh2L^xO1p3B#stQf5AIKfZjH#rudHx-_Jo@{CQ1#W!+qbOW-RArPDhdDVNy8dQ4#V
zt*p|tBty<{JFIrr07aWqBbbYz?Da?orqn!6#&}4uxPKJgz#i!Ty$FeoUdJj29`9~l
zk#82sXgs)D!#15HqE=L@DQKU?7FU)eo%rc#Qwvv^j(h(l{psdA^hXI<z2VQ3$}t`f
z-HIv>R<0vo%XvQ6PGU_@WC`Qws7TM^ybT6I`IJpQQuf(pIl`O<jiE3X_NTzD9^&An
zpoRogX@)?G=-S92SNb8Svz&&;XRP{dvRv4@!z-#=eWa$?my&U&3iR1dL6PkfIU}~=
zSsQEXPn?)tknQ>cN?s;jChCrQcv1fwV~9OeX?biCb@FYKZrMi!2eZ=+6%^)~whl3w
z^qS{qwNjk2W3+H``dmP2fCzV`Z?(F7VuoYiILGD8OC~%%1JqZq#}n7*0l0?&!Cc#~
zySAzQJAEF%1o`}x+>aZA+L)Z86EhR#-UK?pD3pfkSG)DrKyBt1Dw>$p6R|xs*Nt=~
zALkMVE-D)h7w6cqLvnC6!Ua%MKp$ziRLw!09Tyl1vJ`3{TCv}c7j>`vkd!3Vm#MWC
zRC2%7s_T&3v!?=qHrRtm&7JMAu(MF<j`sNR3CDMksH99F<ZzyM-)sM?%4X9oW8dWn
zjRK71)SFDxo`vpp`%y13+RS0{3@?)U9jFcga1fUu@5vRn_e<iWH}8&{ZUOB_N;$%Y
z_4?f{LR!n`&&w#s%So+-lqDoDtZ}x3;a^bppd9$Yw<Tq#h`LAGG(8H_?Z;^5F3<|u
zElk~S5PIRzb_()*Ej(4jfg5LFgcPXN{v2@--%w+ZMG(?EzSAb3w?CD~ky<S!u*w*(
z0b)TdCj*1z<x-!fVWc}w4U8kP7yy$@@-4=+t9De2=SL}PxT^)Ou(OAZxgTm-gp>NH
zzI?tzSS706W^U91WXNeCbY)A|toD~9&`Tz<;}x~5{CBdqCwIt@1z@as!Vr+!bSk8e
ztkmtB9zUSlSWrw;?+J3~Kb0yPD{+4OxP$w_h*&>xIC!`bF^#KMActyO#?DE54rq3+
z0TksN<VSh`1KLN3L51iFakchH+?XOK9(cn=fm~890XoJ89hO&)&a>sMIbfeoE^w8s
zG}lpAe{CI>#j)F#cZHf;U83`y8=Y}aLfQyU_13GuOf4QwjWiEWvoMXslF39csc;b9
zC|JYeM$`0B0&+Yn)jn#Mq_n86Af#CG+4q9NLyBgi1$&{n%f-Es;VosWQ}=h`?Rs`P
zWP~aN<<>?ZsOz4jJ;zq#aMwk$kZLw&QsI74gBGs{o((Hs)YwR?<Br4AJX$`6wpNT~
zfIU8@^3}S>K%QYsf`s2wASRWX0kG=5W9QOGc6NCA>X25)RbNm&r2wk>=qu{R!D!xP
zl`R^Jawcj`OAluHGMIQ&B^%R)t=bPq&Ag20lgS0%P9_*JH1s%a&P^CCykQcb0(m^!
z`iVWY)tBMATNI{|+*;|4wz~h1wYLt7a_!px1wl$lDG6zimXa0~q`SKWq&tQV5fB9F
z2Bnd1kZx(|ZWttnP6>b4sCz&A{XYBs{q-IPa*V-v&wXF9uC>ndv*rTNtUzY;Y?gTV
zOT>TqcY+BK%Xsxn%V$5jgw4I$Au>mY%C3gS#JsAyG!n|!7ErE+TC1N~jdp^3v}Da7
zY=Fx6R1nBfwnCYKh_FRZR3yaBvp04;_l-T#Xq8V4QMW5xU|`d5@NyBvYxRUUhUy@j
z#TeQ$<IE>~)!`8w?|n>~vd8J;uKT6Ereu|VXwq_DZn24Ru_^vDwf7jLq*cI4aJREA
z_H6@0W-k9qZoKo531fP=>xBCF5Crgfg=w#<e+ro1JYkutbI_<s{!C{_dd4KqkdAxw
zBSt%hntWY0O>nwNKE&P2!Z1;vyh4wga$PxE@>FOS&vo8{V<flZdsDJ)6Q4nyDaqXW
zJjgA3pCv-}7a<j1t%I>dvkj{0nbx4-+03TEC-r*A<LaQ>%fe`UZ{gj`JY?)=wkKN^
zNeLM4@};7*wWrJU3UGPG!*&ot(JP#mu8gl$=_gtk1}rv8Y3zLsa$O{w6WlKxTfs<o
z5OJKd6bAa05nY+UlKGQNa#uUf4k6T~Z;c+VLoOL5Bs^AjgeLj{@eXTemsXai%CdJa
z$5!rmMQHIZX+|V23W`sw+12=T1mo~;g4D?VvTI8N)+FldbmEAk;Y{&uuCu37`+M<c
z;Pm8Z=BU$rI%C<i(CBeFZ#Et>bS5QHvZv^O?t4*q1yu~$BXd6R|3}UEBk-|R8&&NM
zHOEgq6*$7U;;%PcH5DL(*vp%|EiZRCAuH1O$*db$w0+~T%rV3mIb`v(cc;o5a(Lu=
z(b;Js`dd0PS;BTY@6xWdm`(WVvbf=OtnI>{!0{PZddZx+k`B~k?_|7*?dkk-pPuH<
zY*j(Odhvolme{FsPM;3DPte}9*~A5U=vDKi`uOGB1Cpvxy_P-ibMjC@=s70zUExQ9
z_RIN#xvrvD-S$`K2i}m!#ZdgY#YB49q_tRCpJpsBVc)$1so>rA^Hg;^AG3(Agxgz+
zbVz#Ro4jGyiHn)`!d6qIz8BPz!7m#vaQx(n6~CL2=h>X`=5gHG?|Wx2?fNt}Zvh3m
zTlbPFonvypNO$|^*;I+$%YQCQ@Yf<?xWSzV92l{D1UYwEk86p#hWbm5)*mc7L>$!P
z7fj5ozRo6}L8=JT;EMq9HW_sMiR&HQDQ&ctPF&11yBR;upam@_+rU<DkXaN>6;V+?
z7i)B0CM06JW+#J|VH_Kx>_nN~D^uq3EcT32SD-7Hq?H<yv+HXk4GLE)UZwJ3k^Ycf
zpuCoMTRL0u+9CA~EZ6MnLsm71d>nsO-}?94p|p*0a#8mzSic9=5i8v^8(|CBMlFoG
zyS|mWIRjHOdQ?tez_xGI?z3*0QDCLzq?}n`JweJ^(Jj|40L_)DAJ?{@z%jRbtsXiE
zms?b11duP!V0K%v)j(Y5rR<o19`z%zN6^1c#G{k>X6<B#4rL8*h`f42F1H0p$A!Ac
zbDx%8-ZQ&UK$ul-5A5v|5*TZY%+YsS4$SE251(C1Q`K~C-&|;<Jpq#q%m=df!Appk
zI+r^Y5v$=KLPK+rWWT+D!HHRHYT=ieDAurmz>PqDcqYmc7X!qyJCC1~{1_*EElvUi
zo5ocv*UdY;$1l*noDe`=vbxc{<Co@a_!^Tn_XRFM%`H(8VaWE&CfzmbLy)^eII6{4
zB6woABtizWdAe}sef<M%LCm$qMi%G^n-)UaU`e?h7!DvkRA)O}Z_*Mta94_*%`DY9
zjyQX0nE(#D4$-Pyj)&s=Rk!om0FAC*Pnx~m;cbs!B91>MBflj17Ffc%OT-i1eC7wc
zf@+>7q_L=aE<1DCr1^N+9`Tsos)f4g)Y{cH>Wf}t?oKeGVON9Zw$FT2zvb4p&2?f;
z36X5sox+kTFZ6`mX?vX8lk>^0UG{Qfn=?fhe3a|j_9jKNnBp(KoZ!+vtLxuh<~pnQ
zrR3qv+eY$)sdhV5sr_J49ek9_9raf8(Wlg{0f!7HOhUVzv?oBu^pSSOV<Cy#a!0VX
z>+C5L99QOF_Jqj^=%DwwUh8U$hvC;XM;mQa!4a9g84<n5&-q<;z6ZCnx=mdVqT2;^
zpTEIf)>cG_uo$lO1cKj@%6!Le)HB!9*I|4}RvkZa30QUVT=zMT48z*y1_ot9Cm>wg
zjX;(GuTHv*vd6vJ#SBJb3xZs}rJ%R?^k(5b)==25EYCkvUMufKm?Pp@w91v<NlT5B
z`b3Q>VIG38daQUmf22%z`$NKjeUpoI5|fa^$!-*3c`M@!P>5nkzzX6$`g`Vz%KR!7
z7Yn|70*<aSt%5FbyEER&xXtk)Nzj0SiX8@-n1R`-EZGX&XZ+A}3O9L$pG=RWKb+J(
zQW7XqvDPf!RouiLDVbK0R(oY8HF`&^T)tk{qR+xPB1vbiTu2kjR>EYFYc8M?Ye0@@
zvd(KgX_;zph=~ww*ZQ2j)f3=JPC(bYGo}rDmcb@qWoV4L-K7gEP5#y~^Q|liuDK{*
zUOpvc)7z=Bc4jDZ5JNudb(XP(ShF&tj`1*&8+iopGI4^<=%KrZSw%QJlJx$uNzch>
zv5~;=#(->Rz}LFB2-ZJvZa4Ip5(o&5gYvFHTZcH1eo|(CW{$kRz*aNo5bB&y&k@T6
z54cKPTOujH20FOl1vj73xQ#!QVt**<1()FHcph|yYf~V?(I;f~t*mfa{^nwHv#2!t
z9szNJvoXTmj;pCb;TeAjvwNVz(-_n?3oN=kxDX%sxIO`OR~z*|a!0-az8;9*q~0))
zQ#OD6_O3jlj3%Lm4vlk6>Ss7?cFH=eJNkEdD*Wn<U$gPEOt179g+~4Z6y*TJ7jMTS
z10o7b2o3VyAHF)RnSHets$F%i8<CjrgKNO^>CO=DlGLZJ_QG@|?$>d7#oJFF#gA!O
zsIZ_V;vVyADJn+k_&7S!cBvmQeqp@b<YVjyiiV@q#S<(EKEPRmgwZ(g(Z$;lb?iX5
z2Bd$&5ALo7Da<wIk(r`EpF4)R8VGiB3D$zGlni>$bY5?x7k^&9aF3whW1f&<(6XOW
zL63>NALZTy8n}cCKRZI-^B^$At_>}`_O+g9y<S3)fzDTS3w4>skBeWr$};>RbD?J#
zt7Xummx8}+7=MpX@S=m?PlJq2xn86<XU_V8e)nlnOoE`e3qC;*O9C4+V;pT?IqZ^i
z#5Lk)=iw1BTfp-;S6S0Me~zZX#_*D%QYz6(_QM<laz{w&EWTt=+<LFc0=>3taG^#r
zL)|Q1)(gw@cW093A-M4cwO^cjvmk2zg|lnX&Lnu*CY+Jb_r0`=ny=QaBtOXeNJPHy
zh?fW=5N0V~{E*DRG(ppwp;{G#eVjhs{28~uJ-ZjSA8r|JfW!V6^$fz<qWVQXU6_9>
zjC1fqfB!twtALORN_HVosX=a23GM=AKWndrOmQr2u6qYSypvuWI18HROstICuXZJ>
zZXbb+>$=j!49>$s8`S1yD6&0I%Eo-F<qAuT261#O+!hE#jTbD8EmXd63);8{5xhLJ
zZCUEE5<<VjmC}N5vGz4`q{+)eXgRP)fmdA{0WbY~g=S7{b*^}=g)tRwbj|k&;)dFU
zO?<u}W4IM0kKO}J%xwm$57M>N%0z^Ec*7bEkAc~UWk;{hA$!S7Q9FD#+j^lvv%I_<
z9D3XuZ>!xw9l!#@p2iC7ltWp1zO~l+hS$RxLP-tBpP%Bk3NDabc^e@hq?KJ>xU&Q+
z%%+51x?<W~oO}3+QQ1L*?8q?8DcFNX$$0(w=+5T%cxHS<j5rOH7JppgSR9f$8+6~|
zZCt+g_3$=9h2E~)GJcG6L)U78Rj;ifAO@5&Pkz{<6EtZ=FYPuJu<XH_Gu3_$2MK9n
z8^yN&bIytE;3;T75uf|2f!qJH(Jt}F4lMem<_T@VGa+vCT2(&F{J@`5(>nDoZ@Fx;
zs+U5e|J0B4eR|?UhODEnJZY2E{VzmMMk^t8bDpjk&V|_>yTXsAG#QO;w5j```O@4I
zs+hCquTI(+9t+Mv$0-tVy9#)n)AClds--`S4h=<(jlJSlgDU@2_J^F@3?$d+@;gZ>
z3Ji~{o8JE!mZ;iUaMsII^7^2<z8D;lb?OI=<Cj5|ZrC<gc+C|9TGqY<Fqq2>7ND9E
ze!#=r`?hq3jNSAYNQU_{<`?IS$fgTrh+Lng5bs};LJ@#YXxs<}8ue(E-cBYi-20-Y
zQ@Xc<PwZIQd&2LJGqYiX=hmM36n7Q9<nVT<SiN4Dhmq$HDg75fv|R(BGe<5;P(|KD
zn7eu$hn|UdX7hmob#DWdf!7$K|KB_Z4fZyYk$pp9ZLKH)i*EKXcb>kuR@G}p>3B17
zngsnumjJ82+5Eom(=5U+7Gb|9>P>R@=^s(KND90f7`G*g4Z=O-qb1~4k25(j2di|N
z3uDQA&$Cc1{Ld>7CfK6<=s&Y0qT{`q>E|#X&5#M7s)=LP-&0;WN1D!cPE4`0!-XPd
zD}-!4y{;3zaTa}-MBQ=Upw9D1JMpTDS63b>X(*c!>Bw$XPF9w?AQlXF4I5At6(`ln
zqWoTsh*Sz9w^CM^F~u;y&a$G7yZe{aNq#?ypP=M7VKn7;8|4RD*z%9}9s~Om+O}xb
z`8)yY^9dTyFXDI!FXp|T&4G?C)Ih3uPY#A1u0fo*>=MCJ40fTK$9!9upoSV_IxvQg
zPHlkG3Ub#ab0bPSQ}99(EO(%X+p6bYP04E{nUn?4;KBWHkR_wKxBJK$BekefA_80e
z1<m`L1TT(0gcr=uC8TGM#wQX|I$mXYkT{M7g-igE5Z{a;EB52rwG&JcBq8T5mG09e
zP<fwxZd0S(H0fax_i$^j;KmO5C_&I?r>uMD41I{W&CxOP7G2G}w!iVEizDT2q_bTy
zI*on*P84`x*M1M{y7i6V0vnUTa!a{MU!iof@y8z5t6i#lco)0a)~$jB(guot0!y~!
zNV_4uuy5!Fw-1CD*j(-87mU?Wr49B5`z-&HBc$+4lBM{dt;X9}%s6}nPD<s*8>}$Y
zg+^(V<{VAD1ZR#>6Y(3?W+yB8`D|tF?hTV>na8*|zjcu-D-MvYGSbAK>SZwm1qU3o
z3GzyaXBC4(AEJkBC?tDA+|9a7d|)x+w(|_gkX~VOf5<w=o^r+ok~5k(<YCN_6j!?D
zEdAtM8f}q)3BTyU`HgmIrf8Q?)wAOIvO2B+qGt5lcgbZqZ>tD7eOK`NHs^HuHi2Xj
zXW#&{#$dtn>fWj@P=uFzZ~<jTbJ-)1SR_fWx7Ikv6o)X?c7NR`BN4zzGFDm&E#nTe
z*FZ2vgKHt3^PA(_O%}-*`Jqd!8}Q7b>1{uk8bLsLT?e^|W6lA)c)U$#lZi_pdp&<o
zY@ma@%4CX4lh9qe4h+WYQ<_+-ac~n5q`rj+aTRa33{{*?@1Of4{I$qkoZ#^T4$FA4
zFlXoOIX%2kQFi@|N;HNSUITIcVJe&72F<UCUPQDE#{gA>BKw|5AI4vg#qTw+D5Au@
zuF9uc2QlEBKjgT|GDz1!BSQ4TBU|2dK>4{Nt-q~8iNv5F<1-SI*o!fq5wvxG-TbE)
z3-rk~6H#*3y=z~u`%Kg$<wr)Mvqbpp#wF!HG_-N#$H&n;9XRW`GTC(J7+%xF_lL+x
zIPXji7pe(JBqKV~v<;xj^{MU8ND-OuqVaXK!cb?~)twMGKr;IPZy=mpNb4=u!|)Z@
zQZdPMT^X%vkP;sZzza^Ex8IeNTEh@84D*acg+9)I*LmAi#G@Zgn(1D2YJzWN8%X^e
z(|mGnr0+I}E_JKMW~?W>I?HMjVKrAvbZe$~6=CZ8`UY^Zj~wY7CzrX+&DRgyQ4Wv5
zl(HmNBe)DE!&68nE=4uinJP0?5#7)`0Wyvt>MH<z+)^i85NZf8_4RE620xekbnllR
z*dp^z52WyoMs`ab@xPR2$J#j6YjlUG;y4FE&h{QKI@cdTcslSmZ%D*j8!)ih{$n^a
zV52Mr<O&BK+xg4|wZPZHI<12I{zG3*w#U`#`%Lo0Y6N1wHHn;+$ibY<Cv(=xPpTMg
z!v7@irnh#eAjhqw(_cDsL0pXUd~2K~e))`B)#jjn09Pue^k$r%=WG8NdL*+j^Gi9k
zg@Ycu#6=iadS1tgcxnn2q0Y2hjfe)?wwDQG1wR#*X)<B|P`oPByR|IkiWnmOPSt1U
zU|+dvihhn1fxK)N=ZdoPJScU(aEYKFWZ&XjRTt2SP+HxB@drV9K)WFvc^B&MI{JP=
z`t`lX4eN3dfeRXUZSQyvbz?^FE)8zm)J#&H2@yNmO-7{NAMj4vWNX;>H(>6+)}8HF
z9zN>*Oz6e8<a?V`K+&iSkw7`&CGqQ;Nym=1Yq-zQd%jIW0c4|LWc)>U*`XpAzkFrC
zs;GbR?eOi#xxuQvYrsOi)B3@pFxjkx*4FOc6&NCfteTXxv?g1Z1tWN{(ZRB>!g1-+
zzm7u@>+}PEp#nrm@qTSV9bgOEC+H{aH57`DHE2>Xy+$)TMWRh$i{T8Hi_+>PE2w0C
zCcA%;r6IfPb*P)TW+NLLZY{n3{aTcugej6oR+;97SJxmDL%b|xeWX~jy#GhN3^)mq
zw_bsMQ`afqfYwsJu&yQ?bL|0)plDSHW38Hehind@_&<^X-(5Yk?iUq0xs>l;fnTbY
zDX~@e327<ZsLL7ZwVP%|BIs5slf=~{*Dc9wWU>b4x)1Oqn0I^31^L2a!TEfCp0L<w
zKJ-4oFVKUmb{&&?Cu;y2RFP_`HI+1cZ5R~@&JxBtsZdLLX5URjxRQil0r7|9H>w7m
zjv|saFO&~H;7)r#cV}~TDcG?KUmn}zh5(7DRkIjf-q5zLE|8!(ZH@KVV3H2Ys`Jwr
zw2>luGJE&*_Ld*Hr;5H{e`xXPStS{CJ_Gp}gVi6DyN<SuT6oVE@j(SW!wB&|r=T$n
z#NmXiiY1`pR;p9F*c&m;-rIbv)9RUl%i_8_r4}L-4P%UF)~5}$zz~u_I^8)PIztn9
z5tjO=+89w&I7a`lp<XP<=L6fiMYkC0EM9M)$<N!$ufD?uXjF+sgG+SOSQ%r6Ckvxf
zFG93#?I{l<wl?s$83?}!*|GJhO{|2)6u+Fp&5{V&S@bb3O0kpT?6Ju3-1e$pUGQ{{
zCS5G?tF&01qb)1f;|{JW`Le|*exO&6r$yX`)9+FDhVcIV@AE_lLhy4^wHv81{&^Xq
zi)jb%J;biJOAR*2!P_-9^A>xj``<GowjQ%^lCA7y(X_bUNw`-VI2T-T_|l`lRkL2}
z6^<x77Uel``{obO^rtS)nW(IN0r-dWm6%7$q_T)Fc33wtfwo!DSkSU$ADF>=0T~n~
zarmI!`PCBge{SgSouT6v{LI9}$Qs!xt#1DOWXn{lg6_SQ7L$5OY(|EXq<jIbwHCKJ
z#(DHu7sP_19be6~q~blT7LP3z0IfK$2haEY+9w{?4<)kv0Z;hV{wg<(qfzPoSSILi
zpZYAmq3bZ`*K>F|!f|0E_u1uZ@8@P|RzX@ZbadRc>k_e<N`|;hOo^!VZBbLtc&gOc
z_A9iYxW2tmuc+p}+&L(oiK0v0&QvxX?wMrV9`wiBP^Wn>_w<Fz=Qcxf?l!}PxgY0n
z8#)|tI!t7R^B(3~WcPQib4I-8H5uOX1R`|$mTU|o-8KCNH~VkeOJ9)1Z8>YVG3gS5
zJigSa^3d@t``f;?>*)QuNBbPJQlh2NglD(ABS+m%z{+`VK^I=~0nVOVWQlWfCZ=Sg
zx$={8tH3y>MYL0l0U2fuzK{p4<BlfKQ%eAOz?Lc89rRpVH?So*2N|>;GS@l7m&mDt
zRUBG){SzlZ6_7>N1}_UTG@`aRIaJ_{p%JheJg)#9g-o5MLg@;V=bELVoE|_AcdWLd
zrdL9()6tK1V7JgJL06&=S;vRV1~V<J7U#322?a2RK7$DUwCWORcF1_+_VEA{m|PKJ
zm~d6F`T;*HNHv`8(bBCij}VxDG!RxY>i>t0lRKg%&58w<qd3ia1SY%>i^k`gD4P^j
z{Uq*dvo>s4|8%7o&*z74$aMv#p6im~1pNFxsYcy9NG1sT0$kU>hFkYOB{$ZhU5|={
zMw7hci5nE+Jn=`b?f2p17T5FO(ATABh=&BPkKfWRm&o`*%uXZwBYj>pN*Q<jQjIl~
z@P036#M;+Z@$4Q*JXhQrjm%5>uWf-B9L6&Qb<iJiQAt}*pIKKu((3luYn(i|CS5lw
zT!wpd3#mw38{#b+t5(TfG}~+A@Jo$XfVR~pA|g>h$Y|~stOBtgksWFf2tcEf?A2y(
zMU3UYu9D+%==Nm_K@F<WHh?M-JHZrmc^cd;5WwmpUhq7UJ(*L6(S%7G)YKX*1Im2~
z+)t6F$*5IgX81ESh27BKrQ^vFlD5P{00y}`2vmy|ZjA*inr5l%!K?p0#U8+?m^K`7
zw^-&u*s0L3q#PalNmM|*I%UAZliBR-Tm#ncWWLCA>T1X(0DP99sw-PA_;=sP;0M1v
z1X`Jl3JML!?f3g%FfUeFhg90CGRi*q@oF|4Nwbdi8ILXD=9pHNHD`KE?8U3~8PWVy
zP1b>O+*e-3@)PS>65BZ@BbA2vS5?f41SOJD(O4|eB^&Q5tx_n21kRBJ1dBA3r3nh9
zT!NtmQtVhy%u&aSd?hP^4f#2|4-?tCOT0J@9Z2nOkZ%)Q5`_S;3L2iVU06E5^Jjeg
zL!uJ@3j<8GPyF*h#tqPQk%QH_{*Ve*tL?B(bhwvU5Ok|CjUpJJE>fh<<!y`1M<m29
zH|8LeGu#cCPUJM}1-S|9_y?Grwe`8#*_$4vc^?7J<@B1j_44lWQv!|_-G^<SuKQXB
zfa);Myb(+tj(ydnfzT|i5#x*9JN^*DzG-dKNG5k3DWhlX;U=?^43dK44@i4Ur#f})
z3>E?$YX`vAb>v<AV;H+1#o=qs3^<iET#^ZZ3xoR-t3G2~O0;@T<t6+B6=1>a2RVv=
zS!El$$pP|v%?1bPk62iuXNb*5nsk}Oo2&P}#;X=gZr2v4&Pqy^D+zbo{Z=sLp5*n7
z^G-!9TE~a1R!c%ca0d!>3B@|A_EIQnA}k)66PHHHe`venAa)*L)U3+WA(jVPG~9kL
zOD<e=MR!SOwMICWJ$IwqbWIMYyewZ$Kd(wQR?C<>-g`Mx4h+p{Y^p|A^1?IBELyqJ
z=>c0BvU!!%Zw7(<A|>-m1d96gez?H`j4I+1?wxUUa@;$uHtxoRH}WK_r__3W3P-cB
zyBHx?jykn>Cuq_bTdDC);H;bgNceVNFOg&Emi@z{qa$Q0*RUr>2!6!7%|E?^>fL$0
z-VCGMefm65V(XsDL>MtAT;pI*V@zrb+@nCdx*1%<N`>E_`P4=^)S#YR<7EGDX69cJ
z*tjf(T6f<>(NLuItgHLVBc{u47>6VabVx!v*5xgQx1&v3;bN`iqP8@wcM6j3VsS;)
z^!#@OR$?|Z@kgN}GWSanx3%N+Yf8}5{>XBy7woZ6sP@3vbV%P(Nl&fWDWolWKv+=p
zZk+TZE_r-GQ3f8ar;<_<14&Jm)JyjeuDr}$#q@A>+dNv!CpnVcJoT>*-l>?6mut-M
zu#SXVYgg0vWyGFzp3kwU(k29Da=qELS>_<^#gRc^FQ!C%YgZ5IEVWK=B#@7QVk<T?
zoWFP3&K7?PNG?;WfeWVZHkRPh>%|3zgr}et4M2U26Wn1GRc5z6=&}bmftl9+Fvrl^
zfl47E{Za$Jbmh8P;zbtI)6b*#`_n<Mjzdt!o}Mm6z18N(Y0!pSth1YXx9I{(ay_UC
zX~!wlhS=YQs*uZrV;HS~fHr8+VaRgaU8Vkgwx$Hm<~SAQKO94X5AoxzdUaCdBRv(O
zf0*Pvu>7w4b;~{1XYyQX`H_#NEqNr;lDInDUPcs?jUS|&Keenk?>O0+c>LL`IIQir
zLe^Y}n)@ytZKp6~ZNa(R$~*sDDt4!Fj9$`0$Eqcpcw}#<%cAd4)SCUEJ#2tuvz5$!
zu0Nh3N`>heYh7bCDdhPJNu}LG_D|;)KTIKxMoqoZc{<<mvS$&5`Of^AS-x}=L_i?f
zhts*UCg-WKds9%Jc#-ro74`^@(rpqKp9=qVOk4C8mM0J*5_sPRH8mJrc;^kkH@T3?
z8IT(6BAUgme<gy7NlJ#${Itc9Q3doWs9~8%y0F((mleB>X71o_C+_kwJaD8r(Si)D
zrtmphjpA?$#}JET`CkB{l{~zATm^cfAf#LewBHHm{qHk0Gfr^L0Y~Wk$oh17L8(S!
zceYfwOYgH$R8WeFuadHg_>hu9qsw2VT+epHX=D28{pRTJAZaur=`T8$-}x_&$+#q?
z-VZ}`=)uM5x7+C1$k5HP4syD!YS{iGoCbM!7Zp56@QW<m{`dm4HV6~$D@~Vj(&=24
z2a`;bc>Ne^bYB~2tFoHDEL5{7x;rt(6~j~^TZ8wsJrCRGxP<J3qp&|qu}6HN=)mlD
zM%$H0_dE=7+W9U-NuK}9c^?CObY!xnF8~$m6{w3N`qgq%E`o5PTU4_F9XjuCf$B&p
zfkn?{GdH!6R{!y1%j4E9XCL4rr5UkKT>h+D?_w=(uQ#|Ie%Hgz4;gRDV(zYqiOH69
z_D%N4tc^A+%#{3ybT$So^Ez{bx_X#fwXT4s?|(LZ*QUE1%$kWyi&(U0d~^~xrC;Ip
zxymTP2n|vPfC88`Umnw+j-IrOYo`&K+if7-fa87;o-o0kC_bEUwgq>)@C_*EAQqdp
z&{SO1FW)qBx!z&l!*Jg9zG<!2!%`&}{m=2)7ilFz#6;#6kNKEL5|83-oLKDVeEoz>
z!#f$Y1x^ErKrq_=QwJ(7CG9Ne!XypC-c<g|{5KO~HD7<%R<z`EbrOrL7gVUQ!lx)^
z$7|zU64inFzm|4Do9=6{xVGec;e0*TeZsh&=$ewKi}QDY;#Pkm`+-EfDoV>-;;bi}
z#f0O>Aa{l*z9>6tt~YKhL`*43J|cf}n<mouhsoC#3=(blB2KUfGX1ddL&~tXA7+`}
ztO75Fp7(`GPz$jsjz+0ov$xkQ!wSd&#grL$_v-sx(*hetc|kqs2U8jC2|xGpdiu-*
zx22HxTcovLseM7-)<KWuH#F<0h$tRRDyInnsu7pLsVwuWCONm@{?d5RVz<`TQK$W&
z(b+OLuQjrDl}e>?SDPK`YtK@HhUT)yNhnae*X|6a2q-qd85^Wxt?U^-KX3kj=7%mt
z>(xX9S-C0fW$Hbu3)WsuVdC8+dm;b_6KnM(ZMtQ}@#i?waT^}t<PY9-{VFZe?HS~l
zl6=m;c-pb-)2pnPN^So{H9d)Ftf$_1TuACX`D1menvwgJ#xvdNb;{<%w}SBH*>TJl
z;r1HbrI`eEeRKW;Xm7{xYyj};Sh|La3a7svUyz!*{fp{D%4#nVR9n$AF+E;DIs#_x
zc)-5V9;k`PO?63<Nf(}Px-$uWEbnY7{j5!{FbD69^GzP90J@4=EwG@Uh?Z&!yO4vD
zMIbT$M4bl*U(Egm@b`?(8fyn)kqb_h%|m$oowxO@2r*quOH)?*Yb6HT^P4}@m4t?d
zu7kSGgm!1Lmv1Q9+zvcHVtn|J)zj}e4Xmcum%Up{!LSn!%)q!TvfKuI4D#sjQ^NCi
zYq5&GBazPb4ou>8=|I{!I13d@`wu85s9nWAMj)~dx@aa~9<QH6ZVMZ#%rO?M&KXoK
z)<jJ}l2I(y?4<3L)VXK0WVr(p9#R%8xwFn6%L_P#e^<*VDwr7=<8!+U<C~#zA$dRB
zb@j#~<kLe_Tnx)o93>qki(_fld!KnvFV?ReXirFHB#Ae{LI_5xrN5A4Jz{wjAF(jS
zFuK4H$+0e%{&D1l9c^OR__5c>E@83asA!#usImD%M%?%tDS^K*b$q=(fEse;vR=XQ
zhUu603Fs&WzsNoWi46}vfK%G31=(%&LE%fQN9s(t4}dZ;v<z;O17e|EgThvHxVWnU
z)D|bQg+b0E(^~-6%JmWWe8WALbwm$S;Vn1t?bu&X;N9kon7j~w=tX0eV*i#JZ3yYk
zgIHp!e8MhNHyfKW!8bRcue#539!{lJ!MSzATLyQ+#1cap`?-Fx4}Mvo|Kw3cn6ZO{
z4mjB4^!zU}GK@4Em}i;l^>s>iBYjZLn6jd%e~)e2r_2O@ov%EYevNIpw+ACwxdu%f
z!TD%UrA^p+<D}W~&gJtMTN^x{V??uI*BRlm2?^<j`r4Dp*@YGb)J1!M@_`<l19qv3
zEbbBftq5Bh^Jwbk9BwpE%89UTJc-kLvlOgCsAr?lN~be_w%5a5jn{32A~U0@ZCT&f
zUOkDOn7j=1sWCt`I1#3_f||Y%dkfPfH_iRCvC(92FiY0~Yinu)aF?l7F5(QDaGDJ|
zbr2E|NCA@_HERlnOoz+%#6ToBpkSTN;#@R`f<~ZvO+U7n1kB};j&`lb6~AXmMkAT1
zalw~mfqS*7KZ=9}&zAxa)ghdP`ptSk9Fdc`U+=q!#tA%yF9EmB{N?mUq)gN7lYG3|
zj!!yF1~qqr@Amt4icEDPhT8Qnxg@|pF*2sNDe7rWU%y$}6VM5FxlMmMRJQ*M<exq&
zg=?f0LqxlUt8B_=b@a!8bIY7uW95hni;lw0elZ&t6-RJ!R{h~#-kZC>O(B)!!)z6Y
z>leAz5<RT=nMem(>=DLw<#7sa7h#nSbqAliMj(qbN=nS-_QoL%7i%xg6&C3OY;E%c
zkL^-44kzUxS81fvsvin@Y*bc_vHJ^<AJnHpRi~wd(o?pg9oY)0>C+}!J~t^v0Om;)
zP#AP5q7bMW+gAyQOnHMIA$&S>0W9RM5%z{<Cjb}#Gb$U^28#R>?ylw>xm1f>xSHW`
zOj&+<QqNclh;#9YkP?<NLRr!4ls_dd@<*%*)O&d1nA9R4!40yZm`g3>R*_%gM+IEE
zJ8WX`(T0nke9-U)tSJuftMk$%q7Vb}mjuv3#JrXV_0A;dZ&dmI3;rvDkMnCh-|tg<
zCEZ$V^w?E*uB<`?BzcZ{cL_Jh^^f|nZ{z&duiqhONd7B^=Z=IM8C2-g-8RM7F`xlY
z13^8zo_<lSSmzPY?A}|by_FA=sf~2|0Ix?0FNR15Nsp?k>(bgbUF47jMT4^H3%h&E
zRm6yOy0&w*!vqA$7tL3P(tMz+RzHJRT68qEhG;2$hUI;v1Ae4=RO}XG47-|4V$qQV
z5$8RwCGP1Bm)@WNqTb3je`E}#!Bted;UEKIZIxsMyxvUlh>6|Trk(&O`wF;cO;x5g
z^y&#jTCC*+wF4oIKG*^6MFZ%1{>}}Vph-{s3xyj12tp^IseQp-)+A6eS*3ohQE2e?
zwY;9TjRls_@rQ-3`9?bgIrD^Co`7lj5=rX@AGewYux3Bm>%Ke&`L#qvcSDo~+c&`e
z-Z;?sh`E%b9{C9S$^-V=cOGj$JPAW)DJKF3JHR9bjtsTPAE;(^553P@ae`P@=9?|U
z?>79=JpEeI^AwT%(MB5QR$j<H=;~d2&=j=OznD!{!pS+hYE!WJJ04kyuhxMTpU<of
z9FFHA1K-Q3f=cmWPl$<wNIH%AH}+?Iz44(*%(1MOre6_)%p`9xBX@Ri6OY#EE+$*L
zM)Dw^t3NQXJc=eHpJu2qjT50Q@g8$scolh{_CpX}<7u3PT#TG<^m>;-l5~-ll!QJq
z0>;H-p11bIoWQju<iFQBfoXic8}gXs>^aQ99}>J!7LcrN$JX%n{0C?=deHlMb<W?3
zDbvFf^WfauqmQLVLJ7C!2JhXwcSyUiDK8c#rtNejXM!HrQw4uWDZmVrh%|)n1AYAK
z+vrCEPgWYcrm@pgQ;P_PRt2N5VeWt>WQ=QLb|F%4ddH#wtTsar1;!HvFbxP_3X%{-
zBrF4UHFnti|4=~xDtHy*<>jxMlnn~0T>f618D?buPOao&|5}_CZf7_tHyj(=;`G;(
zHC=*aIJ_gBO9e+~Id9OV8-S+3LY|#5EvJ3JfR5bt11Y+yd9kmc#=|J&e*7)`(C#~r
zZdOr0(B*U^2Ec;}*@}oIH@LV0O{g{v3s9JI@BPMD7;jX_mA>bhJ6TS7-@{&;s99{7
z@bOKwhgjQ4wlo}k0Q8UkE~wY_PMaCC=ipXf$eu3e07OmavdmlShR1#zm<gg?^@=(=
z%y8+u5Q4>efZYu|)QQeaxc}z$w9s@=1DtK;{j>0rN~lfo>SR*ibq@Zc`R~ur@v`AA
zfef>=jv9|p2ewvz^q2bkf}9*2Yrs|RSo>8If0fUe!(HBA{W|s$sKmQh9q&w!dSmUU
z9O#ideS6l+#~~}PwVKLBA6Q0v1?UYHu6R2Kcjpig5t-3jp9caxz0PESAXwm&O)yD#
zWcH>Ex|T_ONcO{W<<ocN%1h?`Av7XL5w1gIOKw3S=2x)xy*0Rwq{8>!g8q^18t`G|
zyQ;AFwRpixnV@taDX_G9#!O4w+27{)S0NH^^?o4w$CI=*NzGQ)5c}xE>n7k$8mSCX
zZm^hdH-3fm`^1X&L!(dVEI##c4sSNL-80`ILH>i6$K~4R<YZ}!B;^mfpOH=g#=Ex-
zB9P^sBmaYRTqG(6m3;RQ!+VxBVzE&Y9Rrt^Qj%}9;Cok*SaEH3NY-on2HdX&KPL;Y
zD81j&d_Mk+j_uUm(MndTKw@mJ;rV_qc()9B4X_Wpg|O8<kUf34I*$PjV67v(42_7>
z4Y_1*<}1pirzd?--!(8UBdtFLR?9C~L;-GVk>aGCkXTMoKoP25{hG)691Ti&b>^Vo
zJ+%xPb>*a4XXv5sop_P2^4kQUxL*4eXKJ!_J!P*p3=h>fF-p0I!Q!$zmmi_l;M}nr
zs=;jVp4tr!TGT*vyRxgaG@<o6+^`S<<HteT<3I7t-?5EIAs+CuTM2*qeNasvN+<$A
z^IxX=TEOhXVjf4M*85?<1*@kK5Fc1jeev6PC|44d)JU2cpc>XggxU&pt5(ghd}^Hj
zOia}3Wm0_eVA@u}8KASv?E~B(M3;6Q-doT3QZk_ZiFoYI0tnGIcBKyWHg!i3U1KKO
z;QIN&Nj=ECy-l}ImV6?ISbc8Yk@xAe85{@&(r);{iIjK4xeP{dNGU~2Ui%6NRewL#
zdW};k!<+d+#r6(c>z73G@1(332~G>q-XE<>elRJsKim>J-C|onu{=Y}dQli&wAx4)
zQFIA(GWIMA-Oe=8dlT2Zcku2dTr><eA{|Yo-fBZA5hK+zp}>^0v2&_G^v*4-rO*&b
z18xhXzBaCZ4nbb}C6|Hnj>A6n;$g(|{;>JQ6UvzGH=k(V={GqPWp0$Mu<pH9NzwZ&
zS$+@QHMZ{@6k5}pV<aqCA}wtPqS6{U??wkA!Q<x!m`S;jW<GO5DpPLir04@KxnciH
zGHt1~)@`-Ex7;Bs0rs8_{$on*2rpFlydnyVQoiA6dLayMYh00To+E0J0@uFo3`N>0
zIy^G8uJv`=8Jzt1?Do*!6ddv@17!ULL}Wp_qW~jJ!amQ`+9<6>vpD?%aPw2b$%v`%
z8C)#>yiq3+7IkMk6t7qS$twjC1eGkZS~CD@u7*ee6=vRHSu~Z4%Bz2FSHA{{8ztP^
z>Y?;IR5(pz)BdY{2td~V3Kc#8->R4LyY<w>UfO~OZFSu=eM0eh(_M_HcCl}xmBr|8
zfmP0=4sd2*YA+cRu-3e72=nCFAK%$HA=LLA4iD#U6->#ctiE@D>FP}gyXCB93cR;u
zwYKxe%R)C$+vh{2bPz)n-GO@#=D@+haB(*+tIFoht!9(HxQT49HvwwEz~l8E_VqE&
z0~uaxGc|hbjZ80m&HDy%0Y?D;-P7WCyIn8r0H~_I!i7t$UGk;jfmp2sFF)SmjewIL
z-M3wu5vjxSEWkOTM}eO7yd6zl->XUxh_1agyWf-K63U*_Ua=v{xx<CfP48YE&g+sB
z_}A7nx^7$mG3hHf3#;c96PT2dcg%!&w}L8yQJO~?jzA;lvUlU%0OZD$w@o$$Cp?6E
zxIOy^wLqZ)H6i>UPGiAgr1zI|-9-RV+deM3VbY5`ROaM_?$0SM`c2<eI4s-Y?EQ9@
za=ZgEM`4x2&`meuf_gE5DwE=M&b>~K%VgL{g?jlhZ{8;wMoLf3eEBBtCxEfcFW=ic
zCS(^ce<0bd7vgYqyC};=H&?n*)lBsvA&XX)EG_|?9;xDZE7B1IYG_eo*nRewK^_CX
zkJ&v-oKb?;DU-17vlASH!!YVy#5T0^G>kKk1Z)k;sJ$IfR${;l9UD%!gBS^78%OvN
z5NW{fI)|w>+Ia;@dy2haZxuW@K0{;+@~RNtLG&#n`KJ{8*Gd#jkEpk*H!(#7xbGX1
zFP%xH>TdqAj){z+73#*Xw#zpJfswYd<Dfs(dNF<&@TGtexE5L`fw@X!Q~kR*pYgP;
z(A9oBnF+%|ek#FtQNG+u_cOIim-;PrJh3KV8XC?;niQ^DFQeA2W4OR4l$^IX99B%j
zy}pdiO*tcjd`mMxuvQsd3HK-zUe>FkXtl3*Ks(Bpe436s<FOFnaiFu{b*7u1wB|IY
zJsb-5$eCQxMTBkTS;*zsAc8RW1z{!nx)PM(1=_sO5u1L~TrR<#^KU+(fe=wokcjiN
zcs_A-BNW2?=+VJ4afZBUDzq*s_!!uU<q-<(n{R`|alJgt;r_C41?e`aPXA(%FLF@g
zQt{$8*%fG~a6N<j{USdQ!5c!zs`GvFL6x?zeBJfsdex770_5|tthz-n(+;53Am8_H
zm{beSx}Ff4z!^HvNwzsGMDbDH7YO-C5XyV_(Z>(5S4F$ya*PVUTS#ruzGIQL>U(De
z>fBS$^L^hlMsfF{OQOF!bb)h$!V&6DKU=9l6)?Umru(oRuxOXfgtzmpd@#LpB+Qw%
zflvQiBMEHUF>!I1IkE#M?;kcUJXxQ9-_*0pb58fPYT?Pn!AX;3MDbZ8mqqH{roiNn
z8?T<96|O#?WOeOtb^Ayb4QMg<f2sT)lh2~{3E$Jsk&46vTa5@WJD`;r=X50<Et&mP
z2?^(=V$iqEw6~cWcUD3@h?9*=senk;3ijI2xpl0qaxB|Kc0zNs{-~bXd}M59Y<6z$
zyiud!47%Vkc#$$2b=lXmcV#pG)3J9%BlyDX+IdfZ`})b-!T<qVO%}FmLo(0l4y@C+
zMXmbAYE+SW{+HW$czAIaQP&MakRP6wcbc@pg4yS$yDEplQdCq#+`V0q(-i~NX4R?v
z;9N*<YdV#@w_oU`tE=l$NPk_&<E6Xpescxsqj~<7|4F>rX=fK{WeRY4YdIP_ZaOPX
zR#)?MuNcm-)A#B!yp7lUDPEL}aP-KyNdAXCU7c^;8D3l>a0>Azb@9pg2aH`5Quy9N
zME(1l-hGJ(4;(hf8kE$q7m<bwg3A?u{?7LZG2FX-=wgfI$2&cX?mDK?!_LXkP@7~t
zl(%|pv3Rzz{Py|Xder0*p%>VU)B;haVH1zi2T-1vzO(APAtock9}xDs{&7-hnS?de
zakqG2CcO`Hz@3|m>(%57&M<&O93LEm9n}e3yRce+Gaf+E#tjjDWoP$oP_2l#v>(NH
zWNNC`0P2)_sO8hu)wPq~S7SA8B!8)^X9K0ue=Ej0XGvD2pPQ4D_4%{Zg9i^BdJRf6
zhuq!Wcc#(E<1h4bAMfq$)yQ%ss{u5rb-DfO%Y#d^iXoO4$}r)_`n}i#Vd)LI1qB5#
z4=WI{OS39nN>#LOau0m;oCP+talmw?Ov?kpK*UeYmtXXhm5t2?CyDPwRnRi4*uq?|
z8+if_Va<<BTbiwafO%_ci-4bHV=`knPgfjfToiA5F?o3*Nmz8Yzh4>_5g|>1jh(vr
zY;U@=a{g{!>1>ha(eYlwg5}A{3Ey?Nkoh&=Lj)vjkz4R@AMKE$G%H6qO#^KsB$$Ow
zI0j3i-yNEv=a!3U;FWZIYET+F))uYkPe$0MbBSr1EX=jG%(+;2*p<E4jmCF8eCM)d
z=xMmbnL4LYVrhhJpuCin*Ws3*Z^Mz^`<MjSbDe&|ESSc-E+VdlOwASUw2V;69g3s_
zp}N=1603B9m9Otgqz|9))qp-ZX+jFC@;03uT+qC-M_zGHdIUv{4XUcDTpCQ*d)Jel
zM~fUB>j=5-WR?-7E{m*YJ=plRbISam(FI<KJVwI?!|MqcUXKkH=9{vdet*t)YAroa
zm~E&aMP&5C9u$kGg8dlN3#m+NbIa?O3a@RbXJ%*D&kt7f=jkkCN%<UTs)StELH)5D
z6w|`yfdMm0fgz?W;@)3(?boe?e@nps{;<}>_WP}io}SvUa4{I{t#wreN?A2CqF%@g
zNOoGCOB7~Kx;HyDnYHU$?302HsbJ5;R^5>ImmP=ND{Kdn>q)p5`=bvun;#i8Ii*;l
z?LM?MWsL!;;9N$f;M-8;SYzbBAJ*^x)(;VfLJz7Z&PyC*)Y9N_Ez$G)9^9|;jkeX8
zdvj<ca2WYB<xKI`t=nXhqR&*!h0_z)qpug|=9mF`N7kknbPIX~_<Q-VIwmhKuW}&Q
z2%9&xFaxeu`7U9eKO^Js&nRM`wzTm5dW_;?ZDA?NESvw_=k3;-@Qtfp3zI!V$(Z9K
zp{xMt-kaRD<iYyGnv3GEY`SQ}_6KxN8VebYBu77~IxNk9q(|v1K)DT#cTl&({Kt|2
zF1=-xRivT6QJ|%V_x^3@{I<B%%U}QZ$2{Z|&-N9%81>o5PTf&#&FOLJcW^lblXz;5
z@eFK0v*u1~+QU=JY^56EpN}fRVV54%9HgrZ01#kgdis%{2t^fJ9hm1?`T3G}?%av0
zry;s4#Y-9oPX1%UYX9{yDYPj(Jw%NT9$f~$JM^`3U%uE0m|Cs%RbNri%imBEU^w^|
zwO2eBzv!J7lSth7Zt<%BtK+ts)X}m<zJ_Y~m~_22`E97~9wOuaSoBaSmJ|_IOm>}8
zqU{;(^w*CD#k~8qD2fbY@Ls&_lr1ze4@!P37Yo1#=H}Mc1GOob{#b#}mGt%5yqoon
z$`YJhUCm@zQUyO{X0{Jz#Lhu|{%ah%Rr;C^zU%yHSbCKiLh94`>%oj3U^4n+a2Pb9
z@<-DBy$JsvEVXnZ4a`4}<+?r*v8VsM$rSzlmTBk+^oymnXll$byU}m?<(b2ITs%Cz
zU%yJo#TOP9#+;tI078DxrXc3;XY`*z0$v?HT8ib3QQt}&YC4kAyqj<)C9f#|Uze(Y
zK)<SRH(?{~`R^b0Gr_Styw_K*Vi!rs66eBPUWe>6wYHW8%AqfTTD2<g%T|yt5MbaB
zhz|Mxb2s@j>dSvWAT!FdDs5*0_v1XB2DitmSK(v=Sv56Jss_;i=V*h!gMtJi_~19U
zZ{7O&Gd7Ks`Y&k4PAW>ueX-N-hlV}R958W_kz#4yQG7(DqR2pXcgp~|>Rj;4-Dk)x
zhck^>NKEk=J6?xx6b_Oihr}Q;4NKznB$J!0v;2_Lklfzs@nOMGchNU|J+FcsVoUF9
ze*HM~H@6Te{`x||(`Ysf-7T|-MMpSGsh?kug{-kwr98A=?~UcMUlG+RGeQRRuCO>Z
zeK|lAR%!BteAcPsNCn-WoWKD<xyoYPVSy;@uebaAeSg0|0Ek3B6_uU429n>9QGIXy
z+m}c%lD}Y3FG{OtFjL5<XSa|<z!wD;9_k^6bV9;muVCA&;Icn|{QEEe@x1{}be)uu
z(ZwB4{2ul#gn#?;bE3mu<GYV^wAnCHdhge}-$J62q4>(iY-seA=?FENvg^*j{v-nS
zJ{@+fV_x3WrYtEp{IdS-Ya~(R!-fKOf9{b~JI|jB2xj-AXfAydLRr#JE%TO$<llc%
zq$OEIW$;smQSKA_v46jK1Z)X2#Aj(Qp0TG7GToc~a{&}>Nd8xCxO8tDI3n1IjjaCd
zW5Yj@Eutb{(7Si33muBL|CdXkNJT?}U?R7A@|SQ~-S#7;vOE5+2p)Riu8_~ol@n-5
z4gDtZod8K>=@qz*gmLVA&{)Wu9&F=)e|?y@P~Gr;Kk{R`@CX0TX!!fLo8ay{GN3|7
zA=%Uhvp3h5o1o@8xw75lb*Tg-uha(IGINa{PhuHWr2>}RfT7AaN*s+@t1=j9+T}pY
zqfco<9!f7?zN|Lmx0&NjVmCx|-knRF0X1Hj_qY8u%3l|n4~Fvp$%W=sV)s83_S6V1
zt|%|(0^t#V=oUZ(4qD!t4ab8gH8=Nse%24FmguE|biX7r`u(rm!XVY20Vtp&!2b9g
z2qSaB98v(ajeKzQb^^p?CGgoC2I3g*#f<txZe)BwQm0traJ^3)6rRVh)K!YKVyD`L
zo)2PA)!05%E!If{Db{QhHvmc81l_L&CJaE@@*|*$YFh(R22iPvR~$<C`jWs$UF}J_
zwh6?9ysi^t_1|aQE!0;LzXzV#sTxAjzm96~ha-XTfo)Ei@bIa(Al!SfGFzhm^Z|f4
z#}4&~nwrwVk6`Yo1e@vwYAp0Yp)!l!byv$+J|6)-OXEnZ(VcrdPqDps<CPKUt}_Op
z1X`sA&*lu_mLYdg(#qE;GqT@K2_tmSVsADZB4^Yr&tj{zo~ir<(i@TRBB%a|V$V}Q
zz-dwf3Fo3az<A2p2=rQNdbq$9O6h%`rIalNe81F>syji3hhQFH)zpZ6cHu%}rU)d|
zS{$&1glhk+Q;k!HMrt>(WB%Ln1BS84DeCW4#MBo58~Xn?QFKwkM2RKvznHbDf3FAh
zrX>0V$8ijbZEA6Ni9oQY1iBYFO@fw#8KCLVS_gaN_9$CCFqSI-74z{GYuy^|18xhI
z;{I6VCc$F2K{>A1;NMo}HG>9fA)ixKCPyUM*_PmWxGz9-lW)-Kuk?oZ79uFjlOJpZ
zwgU`y9*B@0H<nNOVD5OOHGZoP1U30@=DDdkPaUt``hvGnOyn?``<!tXi5c;kw_zFo
zJ<3RRC=Me3U9|tK_kYhp_=^unet9V`#5xCQzGX80Z#U-wF6tpEqf_hEa(hs|PMyQ!
zwhiz~87PPxNPhy1OFpQ~xs!r6T}yIr`#|`!3Gz+3{LWh`-ziX(cdnbHVi_mW46$Z_
zz?Ul(w6}?gjC=;X;-3H-eHd^lEygdvFv<t`dcN1Hm0t#}Td#m!idp3H6qX6t;CLQS
z9|DrH9$Vcxs00o_y*a?@p~CbPQBxy$>~l)K2R%uDDi5f8lhm}h{f>bFC|Dz48s!5M
ziCZb9ZxtW$mtXrx!~fMjqVnAzqMQIXLXQB(V#%~VU@sp7)y>8^e<^!2Xoc|SR+zEo
zSnq7QFEl_@K0Ob_>v|{;04?G0ZeSME<+MVeB>Z?%9_l|w&|mR-mc{M@R3&U7+-$0!
z@583b0uDEZ_SDEs_(Xi4(vKIYPYQXUK^+a;oD#dykS+pgWmLfYHst7-`X5j8AA9fu
zQicO2KE6O>NamgY?YZ)U9Txsv1u>G~yy^iDa3mZ9u{S7D#|`ey)kSNFBuD#oo09O-
zP$w)l`#deusf*IE()!|L&JQfORk>F?GhduGm4KZxn!pt#S9o(s2nZZg!S%wUf~eDd
z&!rXwEg*d*pavbN6+B)?5O*+qWhKlEt(7#bHXV3il$^w4Ed^G@_u7-NHXy(>MO%Wv
z;H}MSET&nFv1a<GvFJA_c8Zc4Ar&Ym0OYI$SmX@)O`d}m_DA{EW_vI&=Q2*VC%3ta
z^_!at==VkaA$sxf$rwo`mIuoCDuo(lwWnS6rC@<cesbjI53#YGX@e|01fIY3S27Z@
zSk1%!XXGWe!x>^HH>*=jNC%LOGD2nz5$zhA@uSu2*!~4}>$MvGet^$DYriZ6^AftA
zHFDL0=7Y(H#FDTGIKNHuhiOKN-r)XKSZ@Pz%1QfUKolRjj9QfO|8VnbtA<(~{htIf
z-}z#2%ij{j1anBEtxTUdse#IRB^jJlH|RJGtXnHHr(ia1SI^ym!cmC!9$Xr+^~f(@
zwM0CET=U)ouF|fJgY&1m@;Ay0yG1{u6f#Z=0lh;YhpeV?ElRo^z>S$zjaNXnc45n7
zBui2g1&h3Y<)WO7L%7@O2n550r*mdtAG3C@T>#nPB7Pe*TJ%BCHKCqMyTV8Ah%^@E
zXM$;u!{ZGnU@h)Grbm|AN#X{*!6qSN`O5U$K!GyA@30oEB2NS_@(_fAcA)fyBzqa=
zXW-yl5fjX}UE*_X8F#2*doqy13n!j;Z+9`OBVH5&Y}@FB8n0tBP`p%aeW6vdE)l)a
ztXXik>_4}<y+=>GQgg3Bv|CL#jXDSv)nD!z+8E!s0%YT>N0d!Pjp{E$maM(p#?_51
z3T^;cmsD9uRamMeJ)68TSW`dE42-050Pze;cw9#jJ5=uk_ivf%0&u~^)tjO@v;JD$
zdY2LAzPU`#=B1%-P}eJj#R}7?VZGOYrGx+wt;QMI$+s})3jikUu>iP){>J{wTu}N~
z^U_nU>pCkGH3VLA%{jH5=!CNeB`-3D0;c*d<Jy4`C2qXg=O>XsoljFYW!4iv=j|tE
z2R@2eV2Ug1qfBA_``QfwkQaF9Xr{NwmhkZ3=lGg4Jakk{DAoAL^jwM{+!6G$d8<n2
zFZqN-*6`Zr=ICJ!<Cnr0L6~Yjy_VIgLyy7;1p3dbXKgCB9Q^|ua!Mx)Ept}U3cJII
zji=kFd<Z;}Vf|bfnwnXH0O?WdT-!9;j@V1$G6Ad{k)^3&a1PltG=Z7WQ4S=*Do$vL
zPjY+<;eNiEb}Z6!G=NO2IO*h}A(5#E&k)9#Mevdo==DxCL9paNW(ow;X_x*FQ59_!
zzDAxh%b8MEn3rfLJ-qwD038aEe|r4w1={S<4_dq^oc;>zxyty?pQaMAY@r>gSlJ1y
zk~5Hpk|#%ljt0Z^$9wcp=NN-sMS>0wueTa9dj#ixw}?G%t}fJKEsN{A7~{7Gr|x$p
zdvsNfZYj{7bFOSGw5Ow-yv3}@k0tQ9c=n*Aap0^#bj71UndUh)Je>SS_vy~y|J7mP
z!YxCJhFI!+H2p?&ui+@1{1W)gsc2(p)<aT0tK>iL&8%cyZ1NI_eWXm+CA?0S81q^$
zp6L_QJWv`ucCP(s+#R0vrtL=(Zoe|<?cnqykWi0eJvAYQ(8H3M)*zQoHtGBJl{kbw
zhpD*s`Nk8QISIJVOI021r6dHCe*Gdf20IB(KvXjFDJa7I5{>&o8zSd<eKMIPC_CHB
z3*yy>N^RcrH$ccyRm?Oj$O0go8?h}av!LU_GpqW2MSn%D3e$V|j4EF(T+jCntqUsG
zAqP5cHqvp-p8yOnI0nT-H+`cO#s~cX9}R-~X*I-d9*>^!dmVHVsy!YG>;tioDA2cH
zz-bQPgIrnUsCDw9(e`G8-8&k0UyB>g2vH(m$ah%pRnyFPV_q|6d<V3^qOG!BOp7tI
ze<18xYb_fa<f%kuoL{^OCK^sjbYT!K(I_a>iIA3PRlOqzu~g^@&_KTa_VJltH3(Sv
ztIS8cCg@9EfDDbK5bvkSq_bw+&S>{`#8?(>wMkWf7t4Wxu7-4v)1Cb7YY^2}SZ(l2
zSru(qOhm-1k<aJ9>WP|I7p+MIN>kiDMYM({WDJ6_X_bq^>wu><SH!U`#s{RJkDzRC
zg<y|axMsD@yp}q~%25;8CO?A>>Tbc=258?S2jbyOa4?9n0R*A#8KBUV0JriZmDsxv
zhu=&3=1&>)709RlKla`-tjccf8b$;WK@m_80}utILAntErIGFq>5fGUDk&fmix#9)
zx)xp1-3`*sf<?nSm*PIY*L&~deSYlY`}O=&LE^gRJY$?=jB^DroyhhDZthe`^I^C$
z%s_T|>#=z#%h{t$Ilv|YUEp#hk)I2%-WbY>8H_!Vw;bz%*miFl3G-gp8~oA;N-MF|
zS*+Go`zkO7VKrSu+PbO^AM({2@E9>e5n`NMTIELR7&&GKUqEI31?jPt;m^@|9qm{w
z_VyAenQ_Skv2XtS=tDZ=ec8F<{7gsv51$j#jE2hVqg&^C?_E_IO>YXqszcLjw7m$8
zoO*D<<YqzGYZZTU>rCRs6lQYg(q>s*L#iOZaI2}z7DU0YDKpsJU`RDvso=9zV$e=d
zC>F886us1Z_H4Eyr>o|CpCJn;x8Y((eb5_Ck(a!&c#sI#{@F|70THK$BJl7o02DH6
zVKDe#Q;d1F56lNtho8<y25?fc<G?%Q7wdL_*pu?5@(w6A3*y1HE}AV$CV+RS)jV(R
zWS@T6Fp$IFZ(-4HNhX6MGm^PWyioe^_4NAw^hBEa5op1Ra}Sn#pEQrNy3{D*&?wtW
z;7n(f@H=gP?JVTo;!GR1C{e=nFAP(jVq@=DE9;Qvh3RHBloa|{mm|q3Be|4qhx?4(
zmRKPtD8cg+FJJ5~oYx$$X5A|s#ez9=)GHD<E+Off#Uqn8?Q|vQoZpCt@^cH79E_|s
z-&AWodsm)w-=#Zpf7WUDXKTq?EN<|I>ty-G;W1z$XY)ZFVcMHSn#@KsyoO^oplNJz
z)jZTR$Yrk?ttFChDd#_zfNQdQmop4py}d}D+#e_qB7OLQv-rOSCkX3E+JVL_qHGtL
zOrq*^Epat9fp(z8G_+N+?i3Vqv@RpLV84_vQ3({iIrZKiFw7{_U`PLM545qe@ssAm
zoZona#+z;M3vH`F0#VtY^0;uL7o&dGJ)r2qo^Js-QVYUk_kD(CAvMx%T|(h1%N=C8
zqcnycI9T7)`7{}az1FDn7IPKCBc0SP071WCm5O0+h*i^ZA$+33kRpuGHY=WrOS+hM
z>!od%-=gVQgR$Ichg%u1UEO{>WRb`;5IFRQ2e_iAX~&bqhFpM#FPwH?1m!Hm%a}jy
zXciMQV|R9+@#Nq{MnopT5v~&eoabAM%<?A~4t21N7!RIJGdM9+pr5O^@~E6{VyB|;
zQli5by`@ge*-3Vp%$<R7jMfEmF2w{h&O3rIoy=g+>34Npd+heB!tYS|Z^10-J!tS$
zA8mpkF**Q|W}D@75pw)Eai^mOY@m+d=<jSVGad(~uEvAr!?|&g)<vDE718nRXM!?8
zlS2FI2MHIaX{=pfExG~QfkdG)avyrhSmF0!BCp#WV2Ntaeeb3Eqpw%_lWXTLoa&E&
zKcEp<56Wk#EEgF2maa?(Of9k@$c0~uT1Xa#!X~2UoxDC%b@s|l_6gD^m5dVPvCnbm
zjFSM?CA6wRgd#x?jX%{9@10#s)7D%hVK96UJJl<<pjWbVh6@bPV&!BK4!|};we?ub
zm=LBTcQT1&3Edi(Fy3-;5>VH{SW0!}JmbH3L2xe$>5u{s)@tTDm+tI#oG@rzyJl{s
z`8b<t7Z0)EF=%W7#8}wz-%9I=&u%g^Gn?zaBKX1m5<Ki2uJx!fA{#lz?y2v>A#Ivr
z_~-;@Vj2W1(RFz!LwClS@jD6`6`OSk{OUu=#S1h+DU=P$6N>hAwXst0Q>H?0dmRBE
zsJ4R7EjRiqVg1@uFV~H0z(Ffvf~eE$ea<C1%|$OouBFT7BZ2(H&3a&~^_|fJIKx|C
z;150Gvb&xQxR(z2Vro~*pPt@W1YyynvkLU<^t|PSM|V34t)ls-PiMTDliLo!s=h)q
zX_0lypqRF$D(M8ip+o+&y)U-T$2r#u7-DgTtqj0JCV_r-2YGb|YTe-$D(7_stX(Gy
z-kFbr?HhrQ46kgF=Z``>4hkYqz|Ns$-j-KE51A@oaecau>{>gF|7(bx3>qA{fLC(;
zN4?FGN9w&$URUmy7C<GsQys|&0W0%L%JUtqG2MR!l>B2~N+>&TV+(#qFbO~38pwks
z$IqjpS7L#c5i-d)JK&>XMUv_f^cBd|00rC72+uIUa7I4vR1!@1@{VBTAxRLcEfa(`
zlQf2vPm{-{_WF1M^0+djw64U+Z$8Fix|wl(Q3>F5<QHINaL?)&$c|AnU2<EC8Oav&
z9IFL&f@8m2)wtTjc$ZDifCiwU-MS}ty4ef%MmMi60jaj{N{hHBu#;rW;;lJ)qWQYW
zh=5L2f4|Ojb)ge!pi{ES56sg_9#^f0w}CB&raZ>p90$Kb#X$}~ldfh|iyzTr^#7EJ
zgD&xae(O&<`2W6H@bvURb_*ZKpvVhJm!C}KED<&Zdizf@;K2e4sL^P<;J%O!=yE}e
z)eRDA_9}S3FRm{FlBP<`BidZUyd7}eL<s`aB&82I$)W5YdM&(kuq19hJ*2y)q;CD8
z$#col-{dS8J;rd8)$m!}1R-n)w4~do!Q-!A7gte16Ts#cyEPiAr|xXr*Tonu5v^0T
zl5be1aV7*aT{{p++3fi3Tm!>OdA==R4&42mza2(m)B*j>YSa~*4K~967>j{9E_TH|
z&<mL6jlSgtL8x0!)#y>oKVzKMo^^%RO+2t5-btac<pKLFhH=v{e!=vd-~L;PFMQ4G
zsLJJF?0vZ7g!L;$*oCquZPIImqQy12##4Y9MMs*g+<L^N>{jOIFFCvT^@X>YIk_!h
zcB;5dfJHB|>-R6f!f{0n0+yIxA!5|9r2$4|W9Z)DUmjDJ{RKE*!6i|_;FQg$JG=-!
z`vL5FQ=UK8z_O^-EHxmBj<4->n<dXKxyFW<QNmue>;agDBHdH1AheoIf(D!}wZj1j
zEty2p+I;x43M^cMcOG<D%N@bsPF)axUOYIj*IF5RjSI^oG&lf2ik0CLC1#^@Y~)!T
zuJ9(15e>p^!G@X#K|hRs4Il#liw_Qhu%g%P1uF@jJ~kqd6`KT8x6xI;^TYX}Vt^X9
zICORZ9LfXWp&hA;#{k{PZ`NfpO41%O2P+nHGPSOlWqKU}qw3lM_V^igqB>U|dY*D2
z+c}Io`ez(KBv$q5m4&_p!}_{{mLOSW%B>dAbQVA`NuKNb+K;NQ0Xn1df;&C{mGaK&
z*{8T#3dzmtc*a3%?$Pc}aKUT}Vx&)18y3mtbRMCN?F2Z1CkI>Ib3SiIK7zHZhC63c
z>$5Hmz$-VV*lJeLwymUSn)iOP_BkMb=Z|U|;%yKa(%8;J&4UR6MjC10PG19*t7;0@
z7tJ}y5-^d8i180bNos;NWH}PcYKjn?z7RHd|4#T1Oq!JUa`2V9MBPAr+n3@>Y^1R5
zq&Dl{mm8SD0ucY`-bXx+Mb)z1HkuV6Ss9wI0()`oK*QJa$OQ~s<g1+R*DCPT<-k<J
z?i~CM-$3|Vw#(D3S_Xre(p6DG%#szb7?6~FZ$LN}U}YcFhw|}qLh)i(_dpr_s!gqG
zgUbjx{6H#c6wU!M3VJv-i0DHOD^HW5Y*FMM7hxd9en@3GXcJX^erzfmA8uc*RpZVA
z45QYfqtew%>FKnp)d{I^;B41qrTv^&K<U`8vhX6F*m?PJxzJ>#V;a(w__WM={xvU)
zw#JwDc)@Z2X0ucDbM}K9ZZ~{bqm1tV{Nz=-$zUb{&cZ^Brqe9CEz~R}>cIj0{A5e6
z;p5GD#OwrrmQr3SXg`;a{npvIf9B^_ADd*o1#5)lOUzW_95(~NUTPVzP%fuJ(@%c9
z29z##llH?Z4UOY8is(;(-pWEY$v~ri2Ow9UvM57AvrI|8IfM?Z$Wj5AgJ^6*%K(Ni
zGC<dvbKjzrNHbWq*hIx1>7q~pO0FE&Ojod3P7HvSrN@9K*}YuQPG7jYgV$wUcmgp}
z)TprQZFt78YX?-fJpgC-<0k|IkRW!L!lq*|*Z^0UOnkp@Bi?BavjPaJbND!VE9_0@
zs#<jbxRE@C_}ahgvvt?Cd**B7DgXlcTglbdi;a+drYsKU3Y*2jot3~fD~(&Q12*$9
zAz}YJpWEXRVok0`yP~0C+6f&n`zwAunAy|cg~w%z#Xj_yi#B<JJ1&3kE8X>2Gqh_}
z7b>!H)tk{%qJyst{>|9Y>dEE6wE3O^0H;Tvc)|<TtzXjo<5S-aTt{=h6&@pv110vq
zi>gK3B5B!R3ETN-unDNDM)0@UjrBvUQqL0eIs=%3TZp^kkSp3sj;)>Fv#&)@B?4Ri
zkYe4Y8}I@|klR{LsjAzKlh}9jtodO*JJ3>w*Nzu7baJ19u}M*jY02jcJ%*94naF_Q
z*f8jH!G{)ERJ$b^6@Wr@%Hq&0vj&teKhtK|(PeL0O~g{_o`nq`=Ag-zA}g(UiOSKF
z1Arx)4RbPsl}isO7gw<tt7Qa#LfszkLp-<+o@t4vRN-x@!RH~nu3*?h{Ze%YsK5#~
zfk2n08xvmmW2$-{9WIFm{7~~$CCc%X#?1mUtYEbhBxV@ht=Jjcv+e^gA4fcbbrl+Q
zvsDfolZSLyfX#meC6?0`8q6)7n@e#AMeF?Jf~CiZ7{-Hi=UNJjLV4Z}Bs>}sXU4E~
zvvj7|sH3X>47tXPX>wZ`)>YqB&QSgi(yfGg0p&{;IG!2V8o!!MH#Y&`EPVHJBm4E&
z0Ab8$eu;S<3=Xd#XfL{Eq$lY|+meY}uK%04!tFn^BGMr=H!xS!UnymrgJE-D`Dbjx
zMivqanLbCzIT66I!mB?&`;4KhF?*N*aIWYPI5!3&tc$px6SVjymT<Ag4EVa=c^w8x
za$q2~tgiEY5R>WIFUlZLC0$*U>FO$lPrMykcD=%lQ>~*9iky-)i%ssbnhtgBD&{qo
zj?t5+l9Lw=PIW=lG1rAv{H(~c^lFH|$?Y><fbPZTd?(mrnQ7FU*`>S&=xK`69Lej8
zVFCfx7N!6X7>;#{>*89YJqEapKF68jJFq@ow%lgHcUXU>_TAVwK9}lvR#Qd6t#SU-
zZEsC{701o6r61r`19Ksf;C+AusF*g{0|t54G+V9lt<=dDF<<(sJ=sb2@g|4u2dMfF
ziS_Ed(7`~LH6vFK5eh0Qxh!JB=NG^OJI0@oLF!ZyjW}RqwiL^Ce^BXNi4ntz$LTyt
z4&RY&ttEzb3|MUal^+XC3j2nSn5~hEn~Ne#tyUN*c{||uR&_9CaeN!yuwG=k0zR_P
zr~9m-E6dR7AGK=@@l$CMQG!SpS<M<?Pag%k3wsSp-)?T(NcOkeQ;Y1h+sAhRfLD+P
z=CJbRHU{GlXn!V^zrwHjOs0SX?<&25T#U3AS#$aUB&;;vKHF&T1m1@D%~4`ZGcc{I
z+K(N)`fLxN_2Tp^_DVR6GJbgE+0Uh%AdQi2sjnbTP(tbzLX6}0TE6}5pu@t|3Bqxc
zuVSRC*;({^NV5I(p7ugpF({nLs9nUUOr}f77rGNJo<doB8Egr9^9l)jqKsHl3!~!*
z9J}1tnl?}f|IM7b_QNF%g*Epj_4<-Q9Rq7uyOk!vX|7=KKhLn{FQSP;9Zx_vSl^1p
zTLYGY#BajjQhDVjpKSn0knIeZcEv*NV2dD>pjD0VksoNSqyh|71Ul*@8M_w%ih2z!
z<n{SdQcI?^Fgrpm7eAT-NI`7YMfSa~dBD#2#u85NU!@3yV7u_O6PT1p;b-#%=&G1?
z{`v~;WrtDypxH|Yp@*%P=U@x_Q~>orDMjq=61kc?7;`tyEdpe)PjNFsCz1OA0<ype
zeT>66ePio(!)@9&N36CrUaH`q04N`)S1Xag`q1evYkmPFt+xYetLka;U`Zc()VqTZ
zqt+IRwBuW>{LfXC-9QxxCx0ZnzzlH1s*B_rCu;zP`jV`E4p{|}C1W>2%C&p<hHD=1
zWaiJGfq@xUMMe25TUo|#?=t{{QdUz|egJv^Tz=A@M%~Dqjsy$Wrsjr7B6nWm!RXWC
z2xx@fYx5Bozm32^&L>gdMERU*f1%A9qKlT@&kPSWConm4JHhG66B~i)4svm&Z}P5U
zDz<5T{pxI$dq*KxIX;>-LmK3xTZ7H%IOkI#xORI#ba+46b{k9GTpJ8J4s#u4$csQ`
z9_uw9x`>O_am=EN+Q*sli4Tj-Z57qIJF#34`hBJIsjEq;pVr=-RTOu&Tle=HcBB9~
z)5;oarb41(r}U{ul-jqO4@!H2nGMw<oe!)o&dn4AQ2!CbYDGw?mt@}L<1ZO-FciAg
z%681au$K&AAFMPZ<}ffj|K=l+ivEsy+EaViJIGdno$yg~1r;d?j}v45NX%82yM{Uy
za<m<q)0Q$*lSt==`)p>=1%;TVEm{ftYY2)?&5+ToG9qQOPR)u@tRl4B_W3GMdC2NF
z(FVCKC;AjQjZw4U&9?-n0Y=#>9s#@t-o@QKh%YLaUJWLx8{x-|gL)aDtMpKXwv~e_
ztZnxh!~V#FV@dYOWZt*pL@lYG$Rs{dLJu06wqk)MN;H`NybM9XpgG<|zt}N>BxQ)x
z(hkox(FUFXkF=sC1enj4E9&8%U@^c1K(!KFZsGqKLRUubg5u~OGfKk)H(>Hes<nK2
z2=*pPA~UxsD}u!x>;`F>1hZM>CZPSpQ$rM^<%x3UGw?aZ5LKhC*@8S3?9QaOr6C%1
zr-1mA0c-;lBVn35s2)M%MaD0YYCMJ5dV6|_@NTgAcm<ds*}K8frWurJyIg9CWRGBl
z7%qtA3ovo#uKW~Jvr#g>oD!+oH+<$^0^{j`^ZK03%^+&8MZ(<=;RzS()OHCR)?~mH
zT55Qw(5Q^RntykktAkzKiWB2JHb3nMpufa4R;T-V4D3u7yzhJ<7>z7#*M5N&!Un{J
zOLVC!HL*@T-3*0`Mr?`9(QJEayeZB!in)mihIC&81<^Ac53mXbhbNB2-!5jCV~!U%
zRrep|WQY{EVXnnx6P{%^U^IyICVFGACc(#xlevmb7a{8I@3&>sY!-Iyte5aDGuk9M
zz*Y)!gGaoA!h;vz_9|gnd5NXw)1psAJo46tGUUE=DOuj!#uo`9k_JuLu)@*wl<7rJ
zJHqmNVX&nKG^x5Y?ocyox$dfw+RwiaCJLJGZz_Pbro)`v2Y3NK?Sw1`*r_zPWgf`E
z&;W@#*?d9uch`XS5)ib~)$ev-FrSTp4Fe;IyuF2GRbW&v4@&M4F=BGsGWBX#&U{DH
zTdXDnJ;XymGO4asKzIO(Rg=eCRB5qEyc8#HD7D2651;+y%-0Slk<tbWE`F-S#!I}8
z2vC}iii(PUfYm?x#Q}^3Gk~=(nlf!F@W>|5e`QIqE1xOv2d>ELh4#o`(;zCSQTNoG
zxd)h=AnlrEcjlV>J`A*Ok|XLnPrQ~|I!1#)k^SZ!D*D`*uIB4vUfUT?v(bVNQoQ@}
z8yS;#a%1#_nc}Du00jdtU}-o{OB&2udT<0A@hxIp3*e9?pQqPu-cPPXN|N>(xR8nx
z_Z}ZC&Q8mcd(4K|Q8-)=x$J%%ct1(~^ddP5YrGMs7$kHBxF{n2vBUODyi=7KpIeB{
z$*ir6(~=N8a<SKU8!4~+rU24V!<7pyp3o^5v0Mu;xj6I|2h@YW@~JW%-pn_=j_((k
z4Lj2ya6-5ogPq1jyRO*|HI!rDXn(t#I!pDP7m<9SGr61PtPh;c@+=OK<>P55qqny;
z?EQS;;3gXP75=sF!hXqww3<=|(o~X?;VtJd;t}TK;c3Yv=5F5$6XOj0ROR^L$Fy}k
z!EWxAimS7J_hSPwPcLqI`#fW++4=eu4bB9W`TuZ7e&<ch%l;CScuNMD{8r7vv5`cK
zL6i%$;O`D>sot2?UhwDKBtQSo%A{|9MMBIv*B;Mattm<{y9MCUD==m5Jo(a$ZTks@
zzpNIA)(WZZTn05?AU7M<PtcM{A$vsoP{@hMgp~Caw7&NOAzI4yv9be8Oo!h-+X+pY
zDyyHjWI4b03#E{X5^ayj>x$5JU&yp)v6!=KKmT}ht*<<%`}=OF^7pqyk_ntXV<nsc
z_Xo1*ntX4fW@LN!O2&%?9a$tfAKK6~;XAeCyysbQvbVu{4fQ(mzuVqNuEA9%Wxukk
zz+&9iU1F+JSU}{B{r9~P^1Ph7!^m48Dm>3AEjhc|b%%+U4Duz)8mXWykSK1-Ft5L;
zkpeQv!oy3OFJ0jU|7S9kI@ja~8k^=@4>>|Cs*eoK*<C`mfV=4g=R-bMXj?c<T2+ND
zIbu_@K)<zYA3TdBp<iUxF78$Mk1iZfZimg(xYZh2a&ei_=dD$76uqi$>=v2MSnbWp
z=<xOY=p}3UNoG#@4B2-Tnj`d^G603$ajnF1X_zWGa~z8)PoNIt7Ov7rRh~GX(-_Hy
zeFtgEms;W3D<YzEp3$^=MD088B5Sx}rc5>MT^iM=&Dk9tZbb%bw-&5x$~4*C;X!IY
zHo407n+z%)wh|xJZ1qi@wntD&g7h7v#A?B5JMrBZD^9lJX*hj&<;ATw({K2Y_E3`R
zl@1oK6sVPaxq~OlZu@J;AK<wJEwQujDOg%qjc$FbCeE9(Dbg73wZDsfebH9$l{WVO
z-8R013H{E>%u`df;7Jq3Mv{A2tVrQ48SIq(ln1ZE#-H{W{Vy)>yX{Mc>){$EmLMs3
z`qz7;lOFp3Dk;+Aotc<X8wCl6gz<Zv-$SKEIUAoo7XdX`LG=)DewwTDLqUZACL}nF
z`gr@0r|_#Ymf}i%MNziJubczQ@qP^DzEP-ARopa?OFa`*k8A*CYf@o!d}{x$(NP;K
zi_We@T#mxG8;>}gLf9;i;(~}dDV&B0l|5Z}2C_Ay=$Ea6^!0T6D_uV)31?Vt(dQlv
zLO)vH7&#|zbFan`{}EY(QfxByKAI(yQdse{?)#fYOEhD5Lp`pXx{R@YUY95A<4QTI
zpXudopUHgn9PE-fG@vop?;rr_iYrYqZL9h0b<NgD21DU(cY%v`JLj{Hoh*7oJmkvL
zk}9u)U)w%PNQG@D=sC?A^_EWCA0m9HiY(6ZOB2)`U1`+-xMX|0vIMbvos&l-M$_xs
zQj(J%*xo>}d(9IS{l+Rgu@wpbMMVf=Yuw1b&eZyaPa!h(DXK_O0H`2ptmV^6wjsie
zR?i<SrhJsKMmdDziLHR+nZ7@V!I}%p4lpg`bzxqa@2=?`KC~TJIc4K|)QsavKIn~I
zIrx(0p=z<2NE$aECBW)ZaXx+;NII5lix;fP@_EA{z?jE0gY)+VJ-j4r6XEcHi`hB@
z>o}PJ$Ac1av#Y%XzpGtp9V7W45sUKjfJo)uIhImG1yt^hzMq&4Lm*FpQ9|Kjz2ITZ
z=>o$5Xx$d}OVI$=;FDo@yd+R}({@6cUJhp|=aYRR;g1KPl78_^RJ0_iU-z}Z_n7DO
z9HmSdGcxU*gNA-pw<&-|XG^%P&W>-a^aADP$<Hi3FYE9vm!qbL7F&X=9vrTFOt{4r
z4hCDfEURmNVdajN6V)naQwv`3In9g3lh&g1GN%&>a#hD0d-H5|<=YMKjf+h7og-;l
z{DG2Ibg9(bxbl3e2Y0N}O@$n7s@#;}5vS`92aV^&ri$N!mJ;YxXrw;ou!J(L#j1J_
znU4r!AhsgKk6WNL&JL-)(-L37Rt1#>3rt(S2ELQ#11{J74I#kq%i8Rd+=DHb-rbwu
z)0+4=U~m*pdR{<Gm|lA4PAM>*@WAYhWmSqC%vJbwsN?IDxOI0j+wE?iROZ5*#*}%`
zM5(&tgUfmcVG+sG&PTFewU5%cP*u@rHFwLfBU&1);~R3bHye&N8P3h^PrSYuK71kg
z;rZJb=PW_d@anm~t}%imW{+9fW8=k#8yeN0on`c9lTwald2;)1G5viCJUuVjQE73T
zeh<N0|2}i4tNk=iZ4S0RQe6ibbsBR%4Frh{;eu)Ncb^!7e;KVQ6|cLc@?HTnb$359
z%NanP0w|?L^<r<962pBCE7JV8#6WF=_bbh}lCQ$I;a9(|)KzJVJYF5CzN?U@>W84w
zIsHlEk;-a1xaO<yb~K5K)m&XGjqY7`n?k01e1(Rc1P71Nl;s|r0d5zUn#P_SVZ@pU
z+LQEZME^j-Vo%*wjJ;y8lzRnw5yqetA;$H7a7Z}(aJfIvSj#Y#e${3cB3~?q*o+)w
zJ`cTHL4xp_6!i-ckEDLV?XaF?8IIwIyMM6ip4iD<;XB+!L4aN8vvFggy)V=tE1bir
zHD7%7%DZzn7a0+e7a5u8v-1>E!;l)Y@&enAK*0~`JI3}IHcd8R3?6)$vKgq7vZjT0
zE7a8L$=6xAtKQMm$Z~i`&}+RcbdU4sxMt8l=tiGd{{f4<_?DkLih7AIt0d3)wJZB*
zA5`c2Gc4lnheeeK8+L0*WDP%bAx#vh!>%~(!^&{VPiirH;~`lGqnF=!Fpwo_A9nBb
zNAEWl>$dKphATH$hf_<;qt(p4rG5mvXvWW%#}lzxj7gk+yprc&_`t|Hf6Pa2Fy<Bq
zi-mkbm&NFS%7>2`ZV4F(UYCg)#A^Jp&fVNQAHfVCYV0oZGMZ<9<Rz<8rjLGy{h3{(
z@>sDgp+bi23%?8T9^HKbbd2kZtk+Jj{FOnjOka-A=HInIMlqjrFu*-5{6Hyva&5_A
z91|H{uFC%77=8J3jFfJ;fma?*qtpj*n2Zfm!2jLfoa8n)|De-L{vA+*fRWejo5VcO
zp<E49$z+hX2Vf9e<ht<;z&RZ8ARv0Wd;j+-qX4Ju_{w(r?sa~rAJ^NsoQ1G#^D5?a
z>2lekJa!ixi(G~+s6#%#@K_&isCc@dZq<u!KIqNAu-u^Y&0dRkZn1jgN!9yc{)-62
z`slYR8Li=q=TwM5$(=)zyy~zUcb?6RHmm3a>>e|lbU10KXWCI!z?MFgP=olZSQ0#-
z36CS*>fDi5sNcLL_SW*_=S(dGb>r+D{YH3t6-+9ve&}K0+kD-DG^HgdgoMi#s+g^w
zg}&r0FyDPB%D-Z&ZkLM}$1Xo-i|Ib}cnZh!Rd~AFb_hdom4<-*G6JQck&4-Pba&9X
z3=~1n7}huR-^OV3dDM9g<iH`vbyqXK+mGM6e>BJu$D1NyT#<c(ZbP;0)N_*Xra*J<
z%zwQqkk{tt^_z;8^fIIwuX~e@3w29I3)#Q$ov)i}$QO#-t@zr&Ikdot1~=22p3=xJ
zwwy?Rhj)~aYu+|ds#Rm{#ca0ZKe+Z5Xs&&<r&QUV{+%gm2`~BbPCcNV3dHVeH&IhV
zTQX>o0f}Y|&l=x`AP`<q=4<s2P!yH?w+87Q{Y|c`$m8XR>Jy%B4O$=h*O2S<TGcQ~
zfz>J06w=#nNbWx77m<Ob*?kaC=wJr63ooi$nQ(R~;7#I+)RrSHJmN84`;WLC`w5>^
z_baH7Y85&gs213zbX8(zoSkm#2hps&AaTw8&_w&a8j%?<o2^Gc?7?wLqZXyl6*sNw
z(ze9o0x<&CF3wucfM}V=+?<d<pK4-xEOn*OcQ|gL&kg}=Vp)sSBc2>DHh;0dI?xv>
zt3#t_^J<b|QyV|Lz07Y;p{@M{XFhF(S_)?oyv%rQ_tpaNZ-?C#)4OdA?l=Z9%upPX
z?-<AYnXF%Y9!lWAPb1#RnGRdAr5y}hefTQ);ZQt0Z*zXjoQ^5Z>5lJq96H>H&0IfA
zL)h<h(yK_csSq~0#Xc>ay1&N0melTI|0aGkKrPbfGFcquuD-k4p9<dP>Cs~Gp_H4*
zP$s+7>-d|oNA0N5+?Kct3}5*Y+VIccw=%yy@@E}$_<vt*74lEuLQ_s1`oN!)ah}ve
zRAAgK`8K#6?ML^z+VSA^3jcRK3dC9Am)ft2`)~h6)SVGSrvKclKV@}(y~LS2<nJ#e
zG3PkHQ|<yO%yQ9@QTxy%7MCtTje&1!uc)<h1MMMWft*EFy|Q3lkmlo1zP#i^nPJ*Y
zcH7W$|LVi|6&w;i!7ZG#zHEyW$?ny~5kd!^*_`prY&_d=0Z4zU`EeqJ?L*wW!n6bT
zNJrL~<-NXzthaq(dStspbTMzfi0s=zsLc#IoXFhLaFH<CYVm`&XCEbt>`&;&YAh2L
z(5oGCOa}7LMiueD2=ho^?4ZHFc*Gj;-swfeF6K^cK)zlU2P;gSym~hlM=44=i9WiX
z-hDJulW^mXyd_InrVreP6oQDj%TNZ1izLDJ#%qU<WDT2r-D<f=@3i6@U|jFdqXL#)
z;qP3D=QduILd?gjzla2$Yiec6rBTF9m!zl_L!U3<c&-guCRx@bB(3ekexgz<m9V%a
zn@y&f<=C3s<hp<<-tK6T5xVks%0Hz1J$NDt28ExADa#@eZdW^OIuL|uL`g8n{z05j
z&@-5;kzW0qB=HU@gt*~#R2zx$=wGedZvmeu%kO|YPLkSFVISlAq*}nQ(^N4}caT3i
zTzJcaB{V3L-FW${(1wym?<fB|RAz&p-yc0u=SeIXVAaEwu~oTn=cRh`?JGnDbJFA6
zRgB<IfWB_g{sl$_^|<)<#_q7^g<7Q$Q9pBu@9;ckSY)31OMHsXp2;Y$Bl!{MPgEsv
zoag->@#5Sb)8xWT)*I1cj2`ZcUXXqo=TiD5xfK5e-R5~OKRLs`f`zR8;-C#xxs9<w
z`>|kc_hm}Gq8WZbI(xuo(Tjk3xW`q7uvtuqNxgBEIz6PE_h)y5*ZKY~zpIB7RtIy0
zH@eIp586LW)sDY;kH_vQs2zPrN(#H)>W@;RIy*s2=?I_yBhB6U6B4(rH5Jvq)j^25
z+B>?hceNKRX?qdP!8#^HU;nKY6!?Cb8%K&?SpMrPUTRy?-z4}9<9Mc`L<?80H}Sq%
z&PIc;E2!2l(v82}8^(Vso_TfER)vuI4Q#}(U_N90#v(t-KJQtzUfO0#`-i1BgVcBR
zjw8G_xE*>UzcsIBQ$g8<4`^Mb@7y4u6;M(i8_k>}*9@kFN`J^1hMG-87e6pwFUyFC
zYw{;dJKi^Wvv9*8!)mrZ;?)k|2Wd^D@B(yt>i)EZ#PN<15Wj@eulD5LjZ>}sD3unV
zJyoR8HwT8h%7Tr%7Me>b8q_-=)Ajm?o7xjb9;^zch!Lbk)pP*gCW5sB@k*`N2JK-5
zH*rg}HK(4-kUsIg&z_xSrXjR@!-VaQ7i8S#@jp(dDDH1PWgrI0l0h-+{n$u!27oiD
zz@+0YY+@sij6OvF>j_@|!Rq<#-zWNuPK$QX<v-p={Z&F}SF`H>j!MZH0E=ITelIs&
za*$84K{wrW$D6wu`vIZSHqPTyU?80+&aiT)pQqC6XjF`cN8HbsGmJqi!dZRdMcO1F
zv3B5`tUqX*s8qr_{<34yt>@$iPVl0f&KhefLh$^EJ^AaJ&qMl(uQ?kpyfi8g`qH%0
z*Qn9J+gKXNHOI<SN{b+FIBIbf-X}MyqRzCR56K0Tz2=yyg%sMf#@!CR_Mr_HP=!eK
ztw`RN&03Uv%}1GfT|<fEoYJiBv`eFMrI4Yff9S_j^~%c4j0F`*J0djrqRHcbFqT{Y
zJiu4~dVo)UKR{JPo3&;Huf^Mc@TMS_aeZk}!wd56H=HBz<F}GWK8X(}j|7E~K}A$9
zt+UT}?f1o*eQ?lSL;IDpt&#<UK$<}<|Km{JbT&NI(NW{;xofsiiA&f>L{$&v6V>S&
z(EFV^71_Pyt*}qtU1(E=Fyl%ycE^v5KH>I}dNd}Jb6=s;5VK!%Zr|y594Ox|U0^Xk
z&Kuh-REvA@Njl3k=A~dAEZCkAeJizPAJhfuXS)H!Sz_Tg2KMV6N~}3;fBwLoQ*t(X
z#G912Uz15`aECU%e}x+A=p4DEB;#>5`Ls<mA9gM2+?B(X<q?mSr+?%#sj2~Q3X)q7
zG8kBmCp=Y4IW#g=tVg^cZ2BW<T5`ZE%0RA$FH)wL?1Md65rzf!VEqLfhOqnz23TP3
zKXxB9-Pm==Mx2kHgCXEW5|#+{5}{f+K6Y9mR%~QBT<{;jb27-CNM*2`#?2y(KV`TT
zD4qxjhOgLUF#Zb1Ax)j$K0!V4ZA2?6lMKlP24avtR^C`b8qL^a#HQd$*!Qz<($xj9
zc&!wnA^=Di9EXzNmwm0=<<guj8@A38^lCg5Wq#Y###$kAj*7mLB(+rL+%R2Xj`8W#
zBsSN`A2Dn>A~78pm)(wKcqb|AL|p=idS5fn`HBC2CF=zXpR1Z<`D}^lln-Or`Xm`G
z`8sCy7`Kcb&0#La+1j``=^S^Ix0R5Om0V(r%Pbe7V1<=aDB;#FS%i^Grw=+u0)E}k
z!S%iVY#*82^~rEB4JKgL=epkddGFRAFMvg(ZUsxX!~GF860t}s$*M{%?NQ7+*auY1
zf0QE8f1pY9T8N7IuSy0D4u)4As#cnYOFE1Cc^v5A@61&Hydrf#DT~a2GehXSm!}=&
z`aR@v*R_jTYfbNNSi=ywR`DAE(9>*yQ*CYKsIh*#W^XD7hTF@vb>7EZSaA&H>Ac~b
z^r<9?LM!889B~aznJ}A_T`pdic)Y%I8;RFzdtJObZ4#>0uEn`Z`MR87>U;Mtm8>sf
zee#uoSmeOM&iQv47m&D?LkeEiXB212fnc5yx*E`QyvAmh2+Z#ad17LKhL73dG`PsH
z^V%fOH<`!Cc&s3|0qLqd(C^D0#d_P&oMV@Qcd?{ofCp<_1GUTqAGcX~+yOMpxIQ^b
zUBQKU)#im7va&FrD)^-A*{K=y6g-<>Wo-P3`gbQH$qVC>&G^w`-ZaiQ)hw<@@}|sy
zjD@VRtDAAy_Ex9-#3HE^;ir_3(BV>+Dxq6r<#B5-iH7u1#nvZdL>u@|#)j1VWXUtS
zQ{v1GLUHR{t54CFV~31hTT67{WDVp()+KL@muw~DeybU_7t5@UVap|v)4I_XE9+0K
z_$;e%#~tP8NqvaUH#^|8z!xB8YL&@Cd3}-Y&g;J=-2#1ono~LyWIyuOO49)wy{kQ&
zE)m~`kD}}8(_m1|#zu}F-1sNd(SMnT)0D8zE|YYv=&$lshb$1FSEndHT$kvS1)1IB
zO<#8EE@x-cW@TRnnIgL*>S&e)BMrdD5MH&ZgD5_dg61V`jGUWgYGg%MSL?OVAL|Y%
zt7&xIp-~Jx)|_HZolyC%<u~^#U1@4_vTzteMWF=~vR-v~!%aQA-E-D?@WuG-xD#<q
z8^pdiT4BI!(w82u(4q#b7V#T4T0ZV7QHNry5e=Ajy!658?+I?{`P|@>>_=zFWUn~%
zhL<5td#ao3DP9L$V9^`5<Xy0l)7IYdkZ8bR=h_Mdh<xq$;gdpR>BP}La!4-Tced<~
zZOx<8#Uw~c#;}C6mnfsbO9UeWR~FjtbX3Y0-yM`CJCRx{?KMEYi~w%OjZ`qi$YPfb
zOFcb;tGNj<S|<K;avb^xfV8{<uARrXM_ui{;El}ndm%?}Pd~t)KYn))?XSktCgFD*
zv2=c{BXoJOIjDY-rX{rBB(z|(VX?Rv7zMAMoj6GQ+SDZ(u)rhH^U2J}-3_G&jc6W2
z@^yucw|hRftfuc)M`}ql`4i;tS1Lf_NiukPY@hu>1U9LQ6wlN_&z~ig)CkygD@qH(
z?sfGkY?ko8RDfHV^pz2_S~^7EX=)tP8}Mgk`^=-H8@x;##-F9~k{SswOD(D;31P0<
zjtVQ5KUK`pl;)R!rWRUwL8@mWbM{tPDTc?hVLv<$8iMV%Yp)oKv}y1u$l);AapbYO
z@$I^_b#%y^Dt+RL_n5oeuRdz}sDnhT>C1rMi=dRnOdndqvx*RakDFCC;t1H8O^ZRO
z7>sC^ux+7y^H9fQEbe%5)=Z_K4CeJh%V)M*nqd9UMqHNEdK}dM${k-v+IT%>T}b>#
zc%nc5-o}d$Hw?<Udh)cZ0TN(0c$aXE59kKrF%P(kOmoJ8SiJIn+6~GJj&|pE0az7&
z9$nktqthAvKRtyd|169)0<`;9niQ3&O9p~-LZHvbrwu{<lcFx&JKjxPdX1D<Ip4#%
ze9cmLzgl{H70swu&#_CNJw{CNMpcML6{KX?WrVh}9Avv}_dFi^u7hQ*F7LOIB~NXM
zpYGyd1*_kjbTMw}(y)`^y)7dM3Coko4cu}MddMjVe7(~;+)m_Uyu>Cn*hCJuhJ*B1
z(K{oiQNDvQ4LM_Xa?+~KN3pwl!mB&$Sh|m#P9@b!dNo=3T*4WY5Mi|k;yfpEbnI0I
z<`YFKE)o3jz~<F=eup?}$y^j;e^={BhXk@qClNnoN*B6i=0{71FJk+x5;z$2NQl5R
zd6S_A0%}q656*v=1SqKG!oO3xt?A&u92jEte;b%o{NWG3euX;sM$^n&S@SjNKh0RK
z2VCYh<uzaH7o?eJfZ{V4?mhYUHw$sRMDnL5DWOD{E#mv%@l5LJA1{`^&nPY(p)x9v
z#XQ+^FMZs9_xnD(45}|xgs^X*;!=Qe<~jqh#J@_CKku98vR;8NQ`8k*-fB{_U+>$N
z{=X&C2btMU(|F|CW#fwb+lYnf=YPrH<hK!v&V$S6B?SF7>}m`F3P6gNf&ZwdFCY4h
z<nLKre+-Ao-#O{e{4<&P9cgzWDO7qX{G<8h|GTa8`!>7;w*iXH#CG{z|Nau5?7vG%
zDa*O^D}Q(FmtQKR>oR@CDcvvmQ>DNE?T~=|zYqU^AO8Q$g6Mxw{@<5R;FmYZ|Aw8v
z^ULpc_y5nZ;~<N7kKN*-B$V+Tm*b`c7(Me+5oz~<9}MFCD@;EP{cnY7LEMf!t(th?
z0J0uqJzM`F15i}uzY1KLHkV=IKt($C0E?lc&F{d^XCPODdwT!P4%$1UR$^@^C&vp2
zkz~N$rEH#GpulbN-zjkFzZHe4@6??FM}Bc2j}Y~@uDI?4gqC1)kb7SVU~?s8Dr7|r
z@FXc8U7T-SECV&&wz)IliU9_rWc6B0R+)Ak>KF{dY@o0I6H|H(=;jkaCI2QxEF5VO
zliTkO^aIPl@V6irY#Mr>dubm9E`^ZaZxWK@e=%3JhR1W-QUHS-vC?02zk7_Nt;9)6
zytH+$-SND}z$D~O7z)4H?$Pc-KLyhFdT+CGt0KBkr{NmcMp6G;U|rxmwLV%S5%oOR
z{>^n{YFzovH|S#hQ{nv8UR?h5f9^K-fgWl(UP8wUMv(EaZXUP<wQ5niQB`a%qr<xL
z>O^@V@uL2n4&+v@0dQpALr0&u0>KRa(2ng6*bM#z(H2h#<}!v}fWf(DO!=2DlRR(%
z<4>2tKvu_np}!xn_J8XE-_T%0?ojIcWg!MLF9BO704B7N)h;DccN)M@{o3PXeA-OH
zhFY%FLWAyMH<s6t{o2qQV4%iI%~0nmwIfu6y!0XC$oe#Nyd-8GXjY-Ng7^P!+5Xge
zXP4Gtsna(a$o|G;{#1$jNb9h>kY5&B#=uyy$a&vn!w;s@@UfA&>+IuIj9WcP!U1oA
zNphokmV8F&_Z1*GeNj4L6OfA^p?%(y__7FS%Eo{r2<zJ(&rHRfRTDTMj2VM7E}t#~
z+O}lOa9~7M9IrHcaW;L?i!aTSn6;1!tXx<6zzV5cGZ&~<g&h?zPx1%iC}AM7PXsM&
zi$wT`b)Z;!5YC{bSxBp1W+f3PgburAI+UFVn3A%<!v*j%qjLwBI%8e|`uE_l*PRX$
zP8*>ux2cQuPw_2zZ@zuZy6Ju+n3z}0jK<b-ARQM>xx1v92YyY^m5?#O`Vnd54d8ub
zgGu=DA9MA~=k<f)5;ioWzZ(57{OPZxl#Ge2CCO-@Mv13@11fcKeo$i!`1K_zD}5<g
zRbUaBbyGX7mEr6G@FX+tisdXR0T(<81dW*7vbh^-5ajIw#L*()icCil5umPBuXVml
zD6V{t6p0|cLfrhC7F|2(_ErZ2nt^pa127u&17=u;SwqF9O2>e4oB>v8?Hw&8^aHD+
z6={#-F9;a@UC24$l7`R%>4iVB+uoaKq{U9NANT^Mh8yFhrQt3H1vJnar0@<*|9dBq
zem8qyt4kwx)9HAzX<EBV5pvm%s%e{-2PTCP5OuqNAA8SW>MFQ*fl}Zaeo{u`*RDnB
z6eG;!KP9;89&-h&9w@WroVThDd?AI56WB0f*g2r)vIgk&O(4pb;*s7WeGZ>CewIJK
z09u1pr;+bEjkZiJ&zBkmk6XV`uDOHh|4Tq^>R$na_BCFk2QyA02>z{kz_uOF+$OF7
z%<~nbZZSNDXjJJDx5I#01g%Pv`6DLX_nlo}Lq{Jtk#cymG4o`gJFv1r`s|5AfBum#
z{yURQa9#e#R-N)s0gG|45{Ltln}nJ)C<&ehKjaLRu;y_2QUkd2Map~@4fBMW&MV{<
zfd8FsLfhqV1D+Gmg0G%1ZvBf_3e@LA#suBdz%Peu<FvucfS}G6iVVANdj-=Lq(R0i
z-i~Y9q=gYMEZBgwwK~?oximU{$bWGpJ-37RAyUgd>il@Ph9Xn9GC~6gMrOM?=CQN#
zKt|~WOGwQZIP2=oaR-r-Y*pGWFWbED?q|+x<|sT%lnJh~>^igTSo6R{Onc3XccYNd
z!JXR^9-Wia#@G+cjVt{Zfsdr`hAW`;$99@QHob?x44(nXWT}R&;UV3XQ^spPK<)U&
zcZGAR+%~O{%N#J74|UK+*_rMJ5$<hGYw>f)7QO9-QWxZnz|TD{PPC32NY1tK+hT4~
zD`uxp%gbadGZo%5M&7RNr%33$yUymjAPBLy$OMP~eNBS`kc{7RrvJB9tADI^JbF7=
z^z#)d$RyW(!xRvy;@e3K!?<~02pAaVS2yd<Angc6L_T&EDp?R%1!z|Q(}70fq8Juq
zLE55ou+W`07(T(^l0>-k+~t)~-9E4`qn+g`T`IvVW7v@(K}uJ&aoJp`jjk}eL@{W>
zIP!guy12InD85JTgN@fp9f{nVW!@EzTT%d-{|Z(|y}+tkAai*O(owZOe)H(v4%@T~
z@B)ikoTS(-r(#p36QqDw&re#nla10w%d0cBrmP<4uBw1<4)ppVz^F%z#C7{!b+d;P
zy`gq>0UMZsp5O+r0cV`T&Bzm^Hfz6HJCPH^aHP`F(j4FR6evnpz|Q&nkJ@?rJeEe<
z*5$@n2Mulok*)*_@R*xUuA3*oRwEGzu*7OwwcEm|B3e8MemH{lajVfMWk9=WKPArC
zjU%iMbZySODOcTVJxO33cFQ5|m9<6*ZWNJwS5fn-5Yge0@4;%rZl*1Ul1fmm96!E>
zXk&P{WIz9jU5wxt^X-rf`Hr=&F3O|;IOSozx5eK`)}I@RN_IIU?<x5D;6Ej+kYCBF
zLOZ@`E46mGl?B-CsczFPfQv`30k(s2wWDegkPT<6$kDGI0`~-NUZ6tcIvY~6>;;Y<
z+8QL>4%rBiF0W<a5Zpq&)Cj_bFK>AOC4|6Y8W?nzaIFg?z3F-lXuC)lwLLc~^lbzg
zyWJd@d)|T7XfHq=8J1|*fphJ9j|wV~3kaECvuK$b=2UmvAKU}iIy!PbRT6j>PQ*=g
zd<0pZDgU0DAQ(*{{29m)>{CwO=ch~jrk01aUyT^{9v+%sA=GqAWcdb?yzv!w!tY;Q
zK}|TsYE*xxL;TDSpHdcxg3T2cbg<mZyhxrudz18jgUcmjshZ>ay$j%DNjc?#7aOSZ
zwEHAOCQ(pU*u~ca7+9?UZA%(hPo=id;DeI}Olwz9fq#uSEO^o@Qu`b@Ii>-n{GdtO
z8DgcsrOkE@8Ipm?-Z-`11BS90R3yg(5Yp&pN}v2_AXoP}K!6k7B0A^u^6&}<8uGQg
z{)jA#LW$UyD?kDL!uEy7f4a4Gc$c@<!M^7Yfb&=4^c1kTbb5pl@(?)1#OIE_g!yJ8
zx3i%C?BW9&Qz=lA^f$HMaFb-%SQm}uZI5{@0UmM7C^L+zkzl;T2MxJPdBa{SH_95=
zavB3)zzSd9(123M!XRez8;fznu@KzGm<8G?!a6prUKJjGlYwVzI^OPQ$Gsp^bW%`Z
zE~ZJwq)u~aul2n82!YNy609)WVp8b2E9-&PM}YB0ULMPMOAHtyv4pTcov<I)P<^<?
zW_4K*ALG^R3rtmz+5_((P}=A~$|Bbu!pBhnGxb}*i0uUs@pQERA{ls6B8S{gw<5gn
z>JxKvpjG@6OT4Vft^^2x*;2M07X?ss1!bYeTo!bHuF9YKZVT`F9E?^LFfJO{UAz+b
zJ=`Y-4c@U~6|0QEKyg&I-+=`tKD;J{&*Hu1vbzny>S8TmU|F#cp*9i-ttC4K6uuQ3
zM2J?R*NM(5(B4bo@N9eLmICQ=CiswqR+pDNI(&kp=B@xNv(RTB7{)5cpCTRPk<{ax
zF&a2<i#aQ`7VGDL#h(atSpDEMiJReI5Hyy)?X5S_dG1hMUYmJ`68AkI)SrN!$l}vX
zvn2g)3?Yb@Jgt4ekq7Ctt2lM1!?xxWVsi~%hhN=He2k0y4M~YmcN<i0U!Jw+!Cy~=
z|Km|3oe?3O?C!VHTr4qp_KU;zZz9MKD%2OTk)VGtdchqKJCBY?cLNTL%k8uUo4}?_
zs<6crkxa}01CC@Ydd=8w5a5y{UuHE6%>=G#DZo{&513T=RSgEns8WN#5rMR$RC(k>
z1r4S&1Idsw&ZdnjA`Y0mmh^R@@e7gG?>iA6$C-oE%8c|gic`qu8P~Z{xKIzQkuxkN
zD<aah+O$BOuyzHVYMuiy8Gvm`ACSc9J1j)=S<QGBBi608V4E@F5KCVpSND5$d+XgU
zS)i6O+<(793it%)mOWpu(1HB32?c_IRG?2@I|e0HI`E`YoC*ecaQ6tlR64f(65VjB
z!V?V%W;Q-1<&Q<*`9R)vyIhtQ{>)nJNS%m*@>*+TFo`Q!n-neLwM(lHQP#?B{^kYB
zA&0icrnjvpekqc8D0rjflM9Asl5#gQ%ZW~22&neMQ6G5D`W<rk;AoeP&_BGU?21ia
z-$0}m=a;DXqKo|D;uyk>^c%%}fkop+HqADaLI^41>8KxPwN7d$J(c5zDpyEA=mEa?
z13eV}&cM~amv8g4)9#TTtvB|)3Y*toq&twNiSWZHt1Yii&=-gb_&ML`=OjvKLt?*}
zG9gWC-cJ^>zfZJwMAhJ?IJ|FT7q9D!O?D)dKVa{d5~UvM`aHj=Q*qshbVV7F|FaOc
z-KtN1*H1TNjmtIZV_z+ixKH_Qm*_NVj;*V^IN!s>r~GZ}ENWi<ID54!&KIRTmMXkn
zuH7c4$DcBNwsQCp59&@JxLVQZ^^#r``C&sE1apWT?HbvUS>y9qmT=c3<<*K?3F(O}
zR?U4n^o{Y088>W5LX{CU%nS?V+9g|$-KVP*h9wW+EU}S~)MU#wjx=W;W-p&AQ?!{f
zXX7+le|x$`83B2ErM91Vg*j5!G}?s6P3z4y)qYO*Z`O<R?)f;ii$bok2URE^12*b)
zJeyi($arG&2czzp-2JIuuaj%fy|gPJm~=%yUc_uZ1)DJjLsvR94m$t9aBMx)W;i$H
zYWXt=e|{0uwe9|nbb8+R1ntiLS3<j`Xx)T3r3|N-4n(7zJh5WePDHPTmA~ebiuH}O
zdwlT5NVDy%v5$>TS4Ar!KR)64gps`l!>c8#k3UF5rSFJqL@GzOlDAUgi;tT%xnBzn
zG9VG>dytP!DM_C2ETST}fzssJ&DeZ9C{}(NB-0DdM|y!GUj8$OgK!<e{eHqDx%%f9
zzZ7%T#(1pMY!-yv@nk}f<+FDyMvs$o#c4TyhW`3+i7x+D(Ut=G&~6dh22r_IO8=DH
zwQaxqVpol5A1w;58^>po9z6ClxZsA%#$y?t5R?6Y7xbXREi@<QKRbcSif+dh#$~af
zR$`X8yCCg5K_LMZ0KU&f2%Akst+pgGsL|{maIB^<JPATBH(ebqOfzzmW4r*COnuYm
z2=;C^i@WD1(-(cfQB+4mH*XObBBX+Srm6;^Kd9<>YJ_J%`$dTu>W)9eN0(#V(vOXb
z5(TBE<iLaj-Ss+H`Gw2g@{1=Tf!{yPc5Gk00T!4HH^G*GSCFN`&J*ZT+tFc=6VF3l
z=Yfbwn?__(y&dd%Y8A1`zui=*)n-5pT$~oL3>|dypR_Suxad}A2<=+r@3)7Y;v`5+
zL`CkR=q_E9LLn=f=NK<{MVtB(SwdZ7IcE9ZxIsIU+hYR_c!*wt|1ltXuafmnt!BO*
z?Y=zU8%J4Q_IV-1+d>6&PODxA2%Ai?es$MKOJnHD)GNn#3i<1J#Prq^5G;)RX7EkS
z8Y46^bL?oW*(%@`WLL!`TS<cPCvlQRZ%q*!_&y9UaDVRkvk+gLWaSQbM889gO)>ME
ztE0Z|dXZPa7fgY$_&;?03IEKf$ZX3}xL|8P=ZEcA>iO|q2214Tr_E4l|0{j6$Xgoo
ziQ`S_a}p!khS%jkHT3wezJ96oNX)<^ADf|=e2W{Q@#a&=RYbs~yB?F$s#<~?leEJ2
z@xhC+)CM38diofjhgc0R&cZM_)Y}menQKcfrSH2=Vq|tNLd<q$Xqo;f86`3Td3Yzy
z8aes2_^<j-zC#J?3Tk=|3lp1iT(3;J{}^MPu=1=~H+P`4<P$WF8V%xcV;4gppOaEI
zHZny@p{psGvbC}a5bh6SseElJXE@ls0x9)Gr|2TMF!f45+FafBPtnUr+x4sXvRY0=
zS@0?*hkE%W>)yhsfI`?2m)^>g7qJotm=&0(p$3uLR(|tcY8<`_U9d2tCnf8$<|%4^
zg}rf(_(U=$V&_h=%hMXhWEYy^d}8?>(q<8^4!SE(;&fYV#x|959VkplAM{$TKNomD
zS;-PC^4UAsl@G7k#4yOP#5Grn=kwzof*wZ3@WsBWUX5K*CIMA3zBjb?g}9Wfii`7s
z2KT^1L(_F56yxQrml^8}5wj^JKiyiYX)<wbYTfh4Eom3U+}3PqKt$8L;Cnr82Msm|
zc&hK!qG#&vx0o`<6+OD!XP?{XhyD3%KJaFPtTFxM{YmnKJ2U@!mn}<cMkx8*w>|qt
z^OZkF%C?>axhcs%`RRG4TRN@W5q>;Wf(w`bK)NOUB0f@Bj1g%o)(5~3qgjb{gK=r?
zHx9rw+iq|v-X#cWU6Q4eA)B%s>~Z?U9@OSi{AYH$(#ybpDZZNcZrv%kl)k(>;@j;D
zpb2^$|4r#SsN%`WfoW4OKu2<BK_d&m8QZ(@OQ0^9Caoo&_c+;LZ~q8vXJkOqUkPOH
zA|=>{Yu@8^E~*9wV{w6!y$ORVUP8CMAhs94;4gp=^c84N@L0`8dZM%7=0KK3DdZCX
z?(7xZ5RxuZD9-h_UKX(Gw-gohlWl~`t!Z+!(+Bg-CSIqO%v!^bd*2%*;fX&0aaCik
z%ptvEm;V}GB@0gVYizD5+oYA2d(S?KJ%rg0UF7*i8PYbObHO-0?aUhe4wVPxz19{)
zZrd8rf}<x(sY81+B@|q@EIvHeFOO}QrSyZd6FQ0cZzd-)M+7CS?}~sECQ_&_-sT>8
zg*+in`PkPcwga}{9@WT?L-nn7=j`cK-;~f`d@P1?+}D~dnK*?}c2Q<#JG|$dUtH^z
zZ<3LS2fe(h>wE9<5l4P}<bVPSIZ0ZDd3?QE^wR6tz{h;pZBmYXIgO&7%-mNgSOw<V
zGO)L}wD=!Uuu;9ra|Y>kWb=W@RjSg-*N4vc(aUjKG2ZNA>KW89by^uc`RIEWeDC(N
z*GftcWOuDI#}`*BJPanj&b^;$(tZ`Iy{^AV4!3Q_tO%|Oi@T!d(&`{e-Ovs*_dZ$a
z86tIL{*z-jUx8b*w219>dWDg4Bf_>u{-MOrWVeaZY$FgZB`x?vrPGx860G%Dtz#qO
zl=Fp7YWGRl@Ynq;P{pGrxwq7w`-X}0rEv6m(jN#vU|{`j;SSRjb2u~u2jBibJ?J&Q
z-F|`lTzXMZP&@d3S($npVJbR0{ru~%@b@O@OH}CugDrfz<>9pSb6~Xw%9na^3$)PT
z{M80C3Jr<}YOcW^T~8Aj6}^A7gwD%&-y;(NIX8QW-2SdWYfFYjOxkwDA}1cDo-dAf
zL4O>Gxw7z%E>F>$A!Rny4V7KP(msBYZM|8@r%-b8u~(qYoE@(^UgX8*%iR}Y;O&iC
zN-$51`aahE0KT^kf8XHX$1vB})e=a>rWO%<I>%!trV(7qd)!fw*3(#PuT4D$1Ebmz
z%>s?kw(aMZ<1_ADMXWz21CdF4!sltk$!BCG!|6@h-A+ah1z>CP|6%VfqvC3}E>Ya2
zumC{|CkY<hoj`(wgoNObAi*I>;qDqpaE(BM2ZFmpa0u>@!mSD`w0DvBea|`HIo<d6
zz2E7t?;Sn%81M%+?5Cb*t-0o$YwceobFs#gH5|w}Q@2#q+<_708^9339H5in0ZEEW
z0BN5z(6;^t7<;R0mK+XDhj_sRLk_?P21ED#SXG{^2L?(02$YgWDK+aN>dlgFD$07o
ze?2&#=GXr=(WTMx`0{YWZu}M|okBJyb*VC_3{ycybF9XY@+BEI9c3}ciV#x_TCDiy
zX|~ilj=R>Ol#{FpIr%G!j)H;G$sxk9?EaB+z>2$2W8eO)>4ND4(?V2OZ{Jrjc2f0g
zc(hm2^|{i^Cr_Vv>B`$A`~EC2e3f|+Wzjc$TE=kB2VbUaaxeCdB7|%Bz!K8>_g%}c
ztc}iJRB6o<?{1yaKzA4(&mI-K**=jz`l69iw{W=|J?qBb9s=>bkUni8cGXzhi$IR`
z9#1$gsoSj`F9Cgwy1O+a)f4nV$|O_uNg+i(g-Q{MQMv&h4HOdiJmAZb{wv8$FHGfC
z@^*7L8FYM0eN?Iym%-TdIXRIs6*If3^=ue%e-y|p_m=bpBgL=ymFyqj9Ye{mPc_OG
zs_84tg!hs~=)0XGoZd;)l`_Vs^J4CnKYFpE2OC?h@c>1iF%pNpXu!giM@a{}85c;I
zu8f(xv~`Gq5zW*!7zbslD#ER}q9N++uKovep%}8ny0Tof=G42qx;!i`L{Y`;Y9Vx+
z#TjUtMypyNCK2TUSsP5}KBXReQ?$U)Hn5=LIB1R}uC!W7y^~xqJ(i!*Av0u1QQYGi
zPopVAc)WhsxQ<jsj&6Mo)webWzbA65`vYUWV@!JBBpx(5`mIsLBIyI`lhd_KqD&ql
za6lormYLDSF*-epGeU&nmCT|9VNPVFkWF>gcZ5|p56aSgtZ%z{w#n=Zq_lzXF)3Y2
zW^N}u)6qWpM{Vxxv+8{JA|jZh;>pSc?b<`lmBRS6A_pZ<lpw1j%_L#+8l7}Wab{ry
zi6UL{w`VVKa92eYwHODv+m*4PK|Kz7h10he-sZ6l{tV0?!-mL=Z3?PTp)C^Bpz9rx
z(Bugf&~T6A_FxZmvxdb!m8&ID@8)|WR)!z7C&hx}(T(?diT8&?XpaXN*VXv&vhd|(
z&h9iP%8?>HCOE)(m9|}nx63B+f{l&WU4-_r_DjNHI#k?9>(!SJwb~IJ=xA$JI0h9T
zPD=I<XCP+%TSS$2{aMERedzb|Xlmo?t79baT4~n0MZ=1WW2QI|iul~|6|S+qyBmv$
zWe`*M?Obs*(pwYVJ;}LYa4js1fl*McrFC1#xo%okh(3>A0U><Pd(ShCaKP29dXA&f
zc};zDI+Dk|1-~!S@Q^9*q<&3u@M47LawPrHKnUbK=-5JXOV?S-rcKQdMrtOUI@4y?
zdtH-tF6u^qWf4XQKgK0NPE!S5<KVKpaME~EllLpMO!b$da37LZgEpQtl&n~s@ATXI
zIByYCUI9Yryu@J+vF$L8N81HZS@!{&XDZeB_0wktKfBZ4*d|vA9$(`u9hLZc!@FoE
zU$5II`%aH$nr}0J+GCLKT9~{&)wT@a@ZtO^BUSfqdHRuVSF&q>x|{00dXR736_VvU
z$Gi8eAaeq53@_>_YNJRUxlmv1)3(P={WQHP=&Pjne(`>$+uPF~I^cMa?zYWB+FODD
zc^^j_<PQCiCA6W&(j|{0ydhJFZ_?$mim6#Jfo50t2saE1Mv!(E_RydfL}_L!qd{k+
zDB*;r(xlCxtbiuwJRNWGyxl^UnTt-pDuf41Ux8cJ%RPCeQ$TN;^HMJ$4(cOo$j)Lf
z!rbLx_loqxILZe{s&p@jBaEn@!B=?%#?LT^@-n+`FXMZ3tF`dTt`fb0;10+97<PrF
zvMi9BQU^Vrji(GdXG)haPW#omMCr(@f;xi;B0aQJ-c_gp4UlcpP;XfV6G6dt4_^}I
zNXxo`zS3+^-H#J@I9g)|(-Y-uvOSxQXP(r;suhnQ5#D%|fNi6#Cvw3=#8wT?Rvz!p
z;Gm>pTf8%<A@75#65S~?epx{XH)}U&w-~(^VDDzF#)&PnskwYS<OnPqrP5oRSJRl<
z?hXqc<_Q_Vsww=nYCZp!RojieuT+Gpw8ATbaNoqGD!{+gpl&Y4%hr&L7i_0Ij7thI
z3FxL<hmq#eC4Jag6@1Xh+0KvishXJwbfPE%X%_ks+{UwP9EVm3$7Nj~j+qU20;jW&
z3G<H+<I(lW&n9=@mh%nRWqcw$!e`0owzxT{Atynrne(u?f?2ur1Hl_Na%Q`cG&bVN
z&y^0RinI?M<Yi(D<HfbOc^@`E&HVFpxsHCDbH5yp^%*<bDY@D#N!>ed-20H_IlMq{
z`ONp|8T4-B@?EISJYv8tRatUVt61_l2*Gfc!@w_n4VT_4p2_Q+$?NKhdDaMf2Td9D
z`dl}5bl>Y-0nsIOT-L92GQ!?B!#D^TaPIqIbmc_3$Eg8{fXr<ft__5q4(1|L6Gi<p
zMTx_cZ3fOsX`ND+a*d>_(7Ai|*P1QYE1>`b{QW!iY%icB)r=Bfn_UhOHzCrRHeQo#
zp8DdLoX;KmZl8WFIlBX2^SxTzeR~}QnK3>eJuZ;kCY!%LV7M;(9zJidemY3AaH?e1
zl_gnR1HBE;JgH~@`o%VxxU1<hIEb=wKUhmz!+TS^fA4aBug2O4E@)(SbsBqJ{pp!-
zUsbPG@C*MJ{_%I3DJ_zgLm=~-?-}P>uph0ubSAP}OihRu2%ix4VT8jGEFpnGv7);d
zFG;<4Nzew;iSKm_&;}XBCeWT~Jrh}Ea>8Af=k1u)&f0#m@=L`MueaI(Hv#jn82o@w
zsH(=@!7-Q-ZV)#7j!HVm^p;*o^#@GRkadEHGMP7F#@al?X$6B(I6Hx`)NX1736Usf
znQq60Col`%RVn^uoEnG$@3kF8`BClaoOI<-|7r4f<|<8og1#59$N1SKALJzi@<)S!
zG)5F4>d%ZgbmVZ<pwf)iB9(Eep6sv@qf&XE#Pcmg^Why(@5&<WBdc{!@5zU6)a+@^
zgAD_Nl0%an;`BIj(8}NIcfX_(h<^U^B3s=7$P%s~8;Tb=dEM0h&ahm4@Yf|(w0t7U
zy5vXL=(t-jrEyRMIUWR8L|OZGNP1St1)4)2taLZ2+@!HYecHuo$yL$NqHycgh^Mn~
zVufQC_T+7be8+3>pr-L5bM}Pd%y;FUMZZWOgAuooJ8O7<(~eGJ&fz?aCi^DySL)~N
zH1~?crhJCOzYsj>xj<e%$^TKRg0TyfA<K6wjEKZ$lhwodD1{`)ThowClv%nJoX03s
zknF2bW!Im?@s<Gj>B#mMnN}Jm)t`6Ws-<QqcU`@u8se|3X80QQzUiBMWspm1oHJ-f
zmY3auB}<Bkbr%=?E8jmnDF7@Y9$?BrXwyG%5_*>q*UKvWC$3$xTP?4J&uym$n<AmU
znZ}D?qf^Y2cGt5bTYJwm1dQj}sT~U#&TV&v$hxjM`sm_I=D5AFZx6UN`h|T~gi{B-
zpaKILHf<Lrm(wMJX@?9~`=M!WP3Lou9$vTGRr<`X&`;d=UM9=pJ*k~&xIJZ;TsZ-`
zQ{Pb94PZt2>Z4b}pM9@Se47X)Je6(eXlQ7ldsn-AeMw$DNj8GV>0IATu8Qov3(7Qx
zt3vy)Lul-H0r!(2FfW}Sc%Qusyo>l4_u}}$#nqCt?`Ycm%Wd=H$#~#*0vRr{A<gLY
zi+x<Nv0kgp=D_=GqwC1n)sxo%DH%H9dpVI->Cjd`_wqWqOX72lo$!_3{FRb#-PB-A
z5g@Er6CQJ1w@F_FLMGejL)Opce3!*3fo!0|PJ3++`JwkBy>I~ekEZ5HUv3<a(fPvI
zeMfA@^NQ?}^GGSIF<)bL79!DY1P!#Su;6I!DCFBmZ<}KI)3r-)f(+jW_0DbH3)rGK
zxuJ!|QC+jxC}mY1+O&t_WpQScFZlLx-=e5vDHH+c1B@~dC(f%wS?k-*-)u)DZV5w_
z20M3_h0unw5JX5@aDOWxbHeUyjh*}aY0dNl3dt&IduTwaUSB<I<UaM+l?<O<85JjA
z#uBo((&_QqpfvM&o7<h@!=2j0BCX&=03bePKgdZTVWJ6ar?S7J3bJ4eDx}B00J6zy
zLKwFOI5mIwu-iJ(3oHi$kXkgOxxO3#eIt2UK{41I97_)2z|j}$<D>QSz3Un<q^3ds
z0<NNvnf9D?S^cwIK)K&$J<E~(+@Jt;vD!MloIM!9VtSY1;H{}rsTS-LIt~)(lCUsv
zgVz`<6_ZJEy3olJ9jX<8KS2kjB5H1;5SLy5#Ew@WAx((DG?uH0c>4V0#}uy-?Y-gB
z5+mng_7MHAx2v8J(D6N}E>5y_i66gq=6RFMmjl54G9Q}zw5W?wv;Hr<v3_A@(Qjvq
zo*WNvveJnXJ)lZN8PI?EjD3~p;j%#K+xMCH!Dx>0zoQ)=yjN}XWqyp?Sq(b4XGU|?
zMGh7!a09Q?knnoi{myM=ksy92rpiqgsrv$QFU{hpRvszhF82k+{ao>5fIW`$A|3w4
zsX+EKgB}w7mPg_DgSJPh0l?Lk<TFO=0SYE7EqA;#NH0`01byGWLmlL?5iVy<AKvXu
zrY1Mr^F+nrmS#rM$E%`q2wR&A?wtHO7fY6c%`axd$9*_Ls*P_@Wa9)CgacOFSb=a^
ziKC6S<n9+hN|c1e#%;81sHat?>^KdF3MTK?^1u^6#_ifJ0Gq=c76O^@tZL6{2EB_R
ztz?<TyFMp%X~5eP`)y6vIQLyYoB{J;Gm7VCFMt!!wmVyS*-U)lhv+T2P_2@^(zrg<
zNMo;95veq}qT6#<whnCc{#G;BeQAGvY!98SafWU+U2SF5%=vi_dd`<mf$W8?uG=*(
zf~LM(CwT^lYFx9u?@$!#)APLEIMML|LWAY@=$!P4v-Cu|l=pN!Fe_2`_{#<GSFT@P
zot0cqODvPbmcDKXZ8EunOYOmPHJ~RMll{v)J_nJ}bD%3lqeDgL*;a{LlF|9}gwRnL
z;S$!Hx|I2=0F+Sgvn!*kUq)iXQo&c0z6X^3z+^*%YpES84FTlb`?~kvOy*-~d;@{O
zuGjAHC<}?U*)^#XKG%Dfo%R<>Z3(AKA&{A?Z42oc+c4!WsiOI_GMAd&+O0l@t0e}Z
z^h+<GtcPy;XZ*UBT!2eLS9=nm=nSWR;#Cu8Ks1%uuCDMsY(DrPefGglpmDDH+QRqP
zf}66~d#lQ)0CH4d6g_D?$Gec2n>mJr>d%o-ol3axq(N(}SldY|4>+|jjC&%?NsLmR
z?fY;nCxS@#cG@GK<v5jbJFKYCAscP8>1*i6m1Gl?M?m2m(jG7Q(D6gEXJ)5p#tJ*(
zp~Z-5_?|IJM5Fj78qs3o0w#ue>a>?iMstnFk@AmmKSMlo@mT6Zj9jUEeoW%zz61JV
zL%mz>am2GXp~7pZRBm##K@VTeVOJ2OXg3Kui1&X{O(0B}^jdSm+^c^&UXOzU2Y><}
zF-OAQxKt~HoKt~4NqN$(sKOW(FQ`z3B3QLb#$;lt9Am1ALXbe4s~^JoCVPo@COc~4
zxlYmf6H?XqrPeJFOx1XZVYMwNa8?dXpZtCG0emE^0xPpr?ij~Zo$Oo4y3(v8CmrX#
zTR?%Q=l8<!e{fTvVdn~$guC*x@`JFr<IjoF=O=LCzEH@o?lHeJa0%HrZY&ERN_Hi8
zdn*&HQspKD^C^EhslsrA=I(WpzzE9S2|lJL#Ndac9ssLAvl+Z?5<$~33%@_GK`U)#
zxoaQxX&Hrl?KDiImH3Y})rB)Fv|L$E-5yeFv038_%#;}mJ&EovLda~I{Bn`##@_Ab
z4144(J$$pCE)6!pXJ2z#FZkQcy)gNAh&n`gt$U*PIMwen8K94>1dBcbo-)#Nm5Bw^
zdGoxfdNAC0UI2#kv7&@LAkyM)BNrQTNVe7Nv<61Gdf&nQ)a|h3f&*dYT_=W_w94A$
zfQXTw3dBm`1-iy_uqOsz9<HwZ8|K~W#2E5h_&_A*lHua{@89&U?IiDY5Dw*x)T+nS
zG*FWUm!^&GbiVN&<;BE1cv|A|t}HEK#}V-7*5*aQF%X&)y*d+8IWzQSgz(BaJ2c-t
z&jo7@y)NK1$W$RxI<u}evRu<v<K-*TrgpRkca+>b@70=I^`!_v>l(M}`t~jc_JVSt
ztH>B4+;ln9BsoEEy)WF?RopebO}4kg0KQn&xcXRUllA!;D%=E7|2e)$QQ{tKU6nSt
zLpEAvzp(rA{N*7Mgk+SL5ne&h6A9tt&`&(xU(T6vJ?X`FU90M9q?z0=w~Y3<yMV(P
zz2{0+`|C5^F){!Aeu!`~vJ{D)CcauEu4TU#CY<j9GP{-8$_eo7Y{#)Ojk{ZbFqAiL
z9eNoUK2Z-9>}QBNt#xUuH;VQ!ysLSaR|oTS+2&`{;?|EWi3=W-a~qu<kJC<mWj4zB
zW+omoJqCiHFgEc_76L2apt5~HY4F+?B@wbxl{gVq#Sz-*lX@QPWc{mI!xCknv958@
z1wAOujRa)5x$-mEBWO}2(0!D5{((%D;5>HtS4>6?V!b0$v_=G@7k|d-fn+L|VTH26
z3V>%h!=fn}JNmS{+D788f=~biYL>yrzE=Zz+m5}x*waOZ+Jjkx{@r6K0CGRkN<-G>
z8QR8z!W#tcfr3k(@as$v7zcUSKmvcu$WdmiXe_j!fsIH*SVC<IVj^O1HuT5^4WQSf
zjK<6^V$^HP^Im7i0zjY`<JdL1^ssYuvtOeeRgq6y3~dhQG11@db%^hTN=k&}e4;}p
z2>5VFLdlGIB(;p`(WtL;9-d=VB*+sW+6z~+F(ZIeQf~S18IUDsS?ak2r!ej9!l)@$
z$%DL=P(2Wf&P+BViSBlWBms}a%EQ?b#TO=tn{^8`MD_?lcJqod*<WIxQErl$t`OuR
zQ#R_HxmeXsAngkj*kS2Y9`IrsaVz_1IK#q+sbxjaF+rm0u=IdQchtvy5-t+=2sbov
z7=frePVEfKOk;oG)l8J>B|#FWA1AI^K*^n~ET3{r-tNj8clAgiDGQ|W#LeRa6qh7`
z(K^fygKve@iO5thh|}MpPeh4Zrqv_@06D|^sbDPdvIE*S0B4pYn(=vex(U^r#RW0o
z#AiUp-cdES55-lpmnfRQxKE==F7SzYD4Oxt;$QcA*u+T5xWtR(87<xWL4hDg5!B-m
zGE68q?tr1ULPJJev^{R?mD&{Vb!AmU5kwWCoe3j{1E`x@6hf|%A@(a%#4anDeg?%}
z*m5R%e!|d`i;ZY!^k)`4eJ$CoVauTC*cx~TWBq<G&wUM#kpzOY@H(Ns>mN-Qk%$oc
z(~ug%AFc_9?9zw_C**Ioyv)qnCLh6VZnH05?z&0C=@t&?pol@=Mns_WDLR~M0mila
z)_bIS?#&)Utk2<xe!Yb=or%NvSg&@;p4ldPaik&I8!jLX7Z`qYDRdlreHvSrd>p>Y
zsl3p6og6FNu<@u<sw1OKYVK;YphU@LA7}({(s(EBahPun7jB&iNov@B)jv8x!z@~c
zIIu>QKGK%{bv9t=`|GZeRp!-U-uc&l1YiP*zWjxHuHbrIdU<TSaBN##vaNKD<Rx5_
z%mA_gbEf1t{O~yZgyC{s+56e<?A359k_UAD_3l|^@l;-q@0y#B1st3Ds-vpua>vfO
z;pa^)l8as9_~$HuIT?H5kuIWhd@Skna%pQHM3Qd}f&%?;yM%hO?5JVkyrENSN80sc
z%-!=<GNQC9o>9XxoowV)fac|>BiuLGbg)Wjf#>?uEn^z;_Evhl*`$|12ewp{T*@&j
z@5Su$kLopaET>z`Am&w~Ctbm(`~420Y^1SN-Fynl9m!zKU3uCM?BAe7N1R$KE0&RH
z_}nqiO8hP3?Za@xe^qNZ2q&wyMS3Wd3fOO=q-lO`K%p@-jnpe`HfX{{9ahN95n?dr
zUp`a`8;-lc@zW1Dea=cyTP|p%2ziY~(EcO}quY^z&nWhDw$v=c9aVFne9gS?7_IUQ
z+XI7=ud88=`<fi>ITNt=QD58juq(6<#n5&nqENAkDu@!|#tJ#{v)xq<A~|gnr^t!)
zabA$qAU`u?C^ZQ7y3L&)w@8q7QBmJ61f;;~ObkJ$s4S4AX=L)sxO0-PYD<{{u;0;W
zB^MG=_US+RiOeXpjz*+M^+b@GU|j91E3W4*5YViLx5mLo<BU*RAp|ey?BlT?9{zk(
zC#9sWeg4uQs=AvGAOa*$Qpn>sT9?VO55j_J<=;GsqUJ|E0>=!K={kp=CFUPERw%ag
zm&9!XKnF%h!hi>@el|<s^JPg<l4&wU*v0QD$EcwnAx~Kc*Ym~Vg&;pmra|6cNB$Gm
z`h{d~8PbuZLqU+NTP3uBL!;l%KRF^EMRb=Lx;0Eb7J4qP*mDnfzy!8pl8sH7*hMC2
z^~vn7EIAaln^fG-g$PoinvVaFOp4OR63USWUK$33gqMopylB4ec}#DH?RWLo!{rvX
z&?^h#G}?m6NYhOcvfd|6VwrPMPb6e31s#y(D%+4a&wA{_G&n`x-@t|sYiXn?^MT|b
zi!>GY7x4*vx>`(8%?$Hja10L9Owc8@sGM#}e@+@G=NQO+cUII)xMe2K4j4i|JxRE9
z(y-^<57^Yi=VqdtCX9R=YJhiN^Z~ZYSu9AMmDpOT)VBEs@`nbt%YmIgm$2rxGcC9V
z1zr&2OuJ)##&fmIBXj~(8PGSKmZ$rn(l*=BD?PiKj@k416Cq&o_+|gAB%n(=U(0*?
z%zIs)fuG^}v}=y-O<I?Q_qYW`S4Go(2jCSiDaf~cNvz8f^Be7B8ZipzXFPxriDO9t
zLX((bS1f~@FUYvdaDjnovig`3Z<_&E-{t31XbZ8A!y)HBr_DA)%%pTh>7`9q=8na=
zGNm`|W3Oi!NCNJKzv5khf^%uR$bGk6wdeWai$RyTy>a|ATu9SG_}fLy2iXw82~sw#
zI0Yc!<G8{=22xahB=Ds)#{2NXPtwYu+{OLv)IsZ^!+3|lkQ4O9N%<nF=+yM*4V*;l
zr1${KmLCRI?Pldb7KsnTZ!?^gbg*}zw1FHI#J`1#?n;*Ts8jD@AgS^~0qAPKSIPmb
z)WJ%LK?B2&(+T@A4;$Lc(B(GawpZLjM;UV#-9UkErxvLu$%uxFB*=5_Vk+!v+W&gc
zz{h~;9L55=;~1*Pdw1}ypDyZ~Uy7~D@JEjM+P9Bh13A{RpC%J^rzpJL&?qMm5=KL!
ztGKlHsb<!O5wP<Ty_9m=<Y$Z*AJc;<b@4cc%6;Dl5ov~JBv2xP^Q*I(o{&1st2zE)
zTI#8zkmxY^Vf-Q|DU*Yj*uPI1$lHn31PIK<<a*r`y_anl$rpw8XXO}6ori(-s@<1U
z;cwjycxE>FY-tsYCNEm;YN)sS+!zM*FmmW1;4w5MXopS%OQ}HC23I@tFjZ|na~Ft?
zf=>ar2BQNhT>&wTj82&oiz-CLw1U|)d1YQ8Z9DPckqi>Vi<zm<_a$jJO2tTJ;>fTw
zxiKD@GRe4dNO=k9Lrt|8ro2N6b1{}GE2_uPnc`%2Ws)dsAIq!~9qD9_(ZIEMLsign
zNZqP2%VGC$lPP4L8M1iYUmy<^`=nI@B-h~a`X%b2`BatdBMPzP&}x$Sr{q_LsXzL$
zm`Z_rL7DTo(MfCM8{S#Gxgd4pc!E#7gz|1u6cTR~7IBVHV?|wSAg{Vdnpv;cqD@;#
z@R<TA@zLO*ZZC2mVW+eJ>Ds!<#HY7);`w*9zg-&?i;?AOCT$Y-AT{2G+=7Chgc4&U
zJhAa<tzh8lls-ivYs+01X{8b+(OXgSvNR8(BKv;2g#CphmKNK9$m(QM_FliFnD#O)
zgOzbh`+-cRc4EQmR4``vY7nPGmhH%&>YnBQOLgy!q%QxqrrQp=-x*VE0H{S206uq<
z&4g5a$jGQ9Xo<dX0$?)6FQ`M%iT^XlvR5LiKm2|W_w?}jGxxKd`ZA~s_RKpO(oGp@
z;?q$=0~JGkWqQn|=)Z}CxtK{RFY3CaPu}c%IpUB2!SY{dh2KruE(`mSstryaU!04y
zZJPw*{UTL*-f>SYmE%n%OaB@my_Q@fOthZRnnb0C6*)2^k7QK%3oj@tZ!dEfYK#o6
z2mfw$5Re)^w~Nw`EJBr47za5c&>*g0DSlq|haoejKgUnsO9(=W=@mXnb))C%l*qP%
zP%OIXCcnl`ihS3db0||+k#bN%o@UaKXa~8NoY8OtW3Lmi?2x>UCVr@Hi1@>C{0F7z
zANDL*+lX8y)KT+!U>rCk>C6EA6(DN<VO5yVzol&{E)~e8yErP(^_khtBA5o0sX-zd
z^6R;D4Zgv73j;LPhHj+>xGXtDhj2gXxuM|I4i`X`p8uOF&GW(`{Ns1e3ug`NLCR2&
z?7tMJ^=O1<2d6LYuX^at@oJRZi1PV>Fps>bDgbEW%4w6#P~m_sVm+@p-~~=vM0tbd
z)^dJM{-#BZbd64YTRz3Lg`9o~8*R|*aFoqEeAOLiiH$DI1-xAyQ;+ic=tZ+_6({Pj
zOs0u8L;M$DXt(J@g7q&e1!2nSC>w5@D`6@!7V6?Kg2>Z*mLER_ZjJAE{O06|ooC(6
z)x<yfs)0skdAhfP0DQDcHBj`>bnLeAeWJjG*t|@?vf82RMAYrCC}(42y7FGK#1Kv@
zwy;@$ZXWQoqv*7{VZv&f+`T}}2yqyiqfrnb_m%4-<vuJ<WAQA_0Qw!I;@1k1^JX@q
zD;jE%Xpasr1Rt`m6Un(S(*<HVVHaOru(Y?KQuMB>iaTM5_sX~_^DVPASi$^kU*m@w
zwYOjhV;pwht|9w{)`p?~>qeOWGECK7n^kGz6IC5~YIEib#i+rcT;hArRb_-HM#LHp
zZ&e}9d01zRN4%>yX!8xZYU_Wl+P#{8%c?cRcjgN=Thd~&GiXSnnz`g$bD~c^MLqn&
z{w?G*fFAak_aUeT-M~<;V#TQ<qn@otIQThM4!PSZ=5iwrJMpA>4N~qSc--tNm4hKU
zja2-C;6Z0fonkL;G6}Hw>l#CJL7PfqScI!Y`j?0YVWH@E5_{gcuHv{R`tQb=wm<S1
zT}7Q4yG7I#7Km$yvmP(##NLY;f?M4S0Jp7IE^QJYKAINE{B<>F-vmKNAP91(#i=g_
zvcbg6dK1cLH59t=gk+b!q{5dNm&{_srBg5%9tQadtfAw>2(XtXR#-xP#wdVt4uG+s
zhkPev?BYM&MM+Zw___64U;5L33wR;Y$3JWGII7>4n_gcZ-0eka`i8YrBR{$0J$Tnr
zHU=yfXnGGs$22*nb_m@RV3s@2u4i*n@(Gexm$lL1yUqms>ls=s)PFGT9X1Wzkds)h
zHv&@TJKbD~1nA}O>&MV6+t)Q?88`1EiS0mR^+gpaZ(7w^GOQ<Ni5Qx6+^&3SL|CNb
zzak64<Oz5|FcGAX1)yRfvbhnOP~DsfMlcl2MhmD#`OSr_l>F4451DUKOXri(iei`1
zVdw?lYUOlNT1>C!coz1$`Yp=WwhnId(H5E3+WL6GAf{kBL$rb6#1JsR{5GM`mP-_#
z|FTKmD@bt7(62U#pP=6INI9IJC1kaoT|=$x#C|>N+buv&b&0d?GVHpe#s4p)MemiM
zdw&aK5oOd1%Pk!g0ex=3*c{=GdzA!Vh`E4z#6mL)GglrX%_DqX-`iZlk|A+IVW2zK
z0bnNj??4wui}c{E5iEhgr=zLqT##He!Mb-<7HrqqRY+G8{MN*H{B6<;lxQltO%jC+
zwi_9+50|zlFIGO>v(@i))Zag;7x1K}kNq|2vDYkB<pFGL4;uc@TRSXh26tZyQq?Y?
zfhO_Fyzc%D8IfPra&DrdT{1(RZyliCR>bzZ;9S=?#pb|y!rknu_s$uyWe?*hq7IVJ
zQ5cVP>>~nw*l#%z=-tJVk|k~K@yq{d9mk8&Obtjkn{p?y&#@-^O|TzHF;qGXh>XXr
z#0AM7to13ny2$M|KR+#-sW{ZPA!iKuy=ajs&kR%9<X!4V2kCGg>=OU~L7iwqdC2js
z3~$Rvlm;3Z$a?$u$a>(YJx=ZE%5g*vGaK&2(YGS*ku%@jU?KrF@>Nv6ar?j!W|Z`J
zfR7o>u3sDtq`SX1FZH6~BXbuRH;}YBC31T+Xx9IM7naV*h;xo6BlmAHmdo4_VwFnp
z^FUqNjgbXH6H%|Oa^;`|oa|IcxfRu(0*!{^3Qnk|l6t#N#*K5zhJe(p{tJg}dJ5>9
z2kpMRA>LaJrdo+$%iP*g<`OMfFwSooCfN}eIGS9oi83Pe+1WvDtN<3;;_Y%kxhk5(
zmAe7p%p?#y(+6SVDR{U8XkX!P$C_NE2VYim=Xl~Y1OswgkypD~1a*s2PZAO14GkCP
zRgIL^Z<(kv(h_TGwl0wZf5Ii%Oa$dxXBz{Fzzbo2<nJtA<FBfJg-;-m`T&IFw&^VI
z!ikbrojNNbJ)mB_o2+y(3fM(dWNm{q-F)|!Nu0;d!{wQD>!^9@<;ovLTV1Cm#F&Mk
z-bXUuq{_#<9nq${klSl-VzTZJWj(md+8Bt+akiU}FXDIZLkUW@dJPA=psj8GWZ=?6
z_ux$4kuV=33p*=CiP+Y>5Ov;=xm&U#E9Ib!T;BuPHaruJ6FaVZEj1G|<TWPpfZgo%
z6925e{#RLpv;#qFWxJdwjL0(imJ0L8&n0@<J}bF#kijf7CD@-AQ2gi6#%AAYgazf$
ziAHdu@;-D5bE5t{<R8*z6Uc99ru%(Y`vHey2!4rt_g#Nk-#B72A}9P{cOay&_p33F
z+;(rpn_>>TA=hafyFR`7So$1E*rC3L#Q*niYSk8kU{|P~Jf4Y}-)?_uq+vEUxWLN*
zeaEbgz8MNEX)V=F?Qh0(LdOSq>eO#_(tes>Ani_xY@|`{7U)~%i*r&J<7UBXN3KFX
z<+o5yJ96j2QIS07i;p=qP2l$t=$e3kQ3_Z3k2N*#j|E|#e|Tjr!-H9#(M8~aro}KX
z%v1$M{}TFc;((E%ni=pJ^j|96tmpXAH;T=I5Ipz~g0usQ?h0}86(C~>H|B{9hrJ<G
ziKT?z2U~}6@5V>Q$xt!>E0U&$Kzm)L&7@M6x}>b|#mN_zM5eaj3GnK>=4|QiP+aVq
zU^xlorvm*%Vnrxn61+{)p3a7(aI04yi#>jR4^VunP`=l9{{!>$4>zqaX}cg}(ziMP
zo$B8eJqIZBKQCU(KdE!I)c-@B{~zl7zl=I}Y4dWLD)@U8Dx(f;%|g56EZ>zLngQ~@
zFNm+3Fcz*;a91h9Jc8JZDwux<-T1VoBgt_Pn_%@`J6NfkE<XnUU@2|M=^+a}G9bi6
z@X6!NhKeX@yzHmj)Xwef8oq^jOP{vH5Pg_w0Ypan!!c{oj`v*%<x!Zi#rznmP|ib7
zRH6FzTUEyXbv|Thx#1G>wo=V6+c)AtAHWC_lpDJ;)f)@z#t7IL0ae%+D%`jgDbq&!
zN3!14(oYim05g?@)$;B5VxmJFZqpdgL4zw!jM5t>^`8RhZBlw$z<R5bh{L=e>UKwt
z@)Ft@oXK(6AZ1*Khq$jV0&bxeLRdk<ZGkxID2e-8fl3<e(SD1ss|etI69deEnyD63
z#G{cDbx~3U)v+=>D33yvI)Q?<73X3pBVtIgiCSogEciDP4T1yJ(E<~3@_Ip<t9MlT
z=ieo|+4G4X9=igZOryaaoJ7kcH_RE8z)Q5ve<Zd8(u}}Atr;U$X_%zQ`y5NEsV^S?
zMQj)RGqG*byM<mdQT?2qMfyfX*TD_kwdsGRm6?i)&PTzF>NKm|H}QcppZFv+;;k++
zQ9RNIGLJufi(;SSUd<2bV3glX>VFhq)#Y110N(7sr=e%7fTwJnz_xh?&I-Y2XAx;*
zljh<nBkX&@U(7BWjkCh85IYI*zDEG>``F>$jX176D9nmdkIl(AAQZn}!NhL%Emwic
zU%FnKq;_4n4a*~!clEFG{3+5i|L1j6o&(AO@r&{N@<!oQy$POsE9c)i*3y;c_uO(>
z+-2weXSQ}HRi8`ooz#<cVM)Hk6o-TnG7!jg^gAR0^kx2U`qH8Bw#HB-ST!&t7L&;@
zTPI7&_A_=9A4zQ*U!`D{z10a{I5rjsb5i!{P#+E->uay|rdwI$=mhfZBs<;o0E^wn
zCjP3P420a11IY=(@K>Eb+FCzRdrOd@eD0=GX-LM2ql+M3AV{j29CLHc0vB+|R&#N2
zANk?1#EB363N9uGAqh10qfRgKKJZ(a{B}CKmO=?NG;_?Mca*pc{lXnN>Q-X~fR80d
z(B2)ZqKb{w)BDEetMHN{xG4$hRPK*+FHSrT(f#Fz-who~P1n>;hxfBpUPOk~Ro!rv
zGI!bM>hXhS2u}ys#*(n~Gd*u2n38Mqa_KAHPmEjWq(t*t<baR{3e^1U-AjNp6F!_T
zJO|8YJ`a7yg)gUK0Ws3<GHSr&N>PW`qiM<~&UeZCOEvW_slNsNcSl}j2eejT6&3xk
zU~*LW3MjHgQfaSUFI}|l!SvysLyC0&%mmlg{EwO7nkWS0D}9P1^cX&+U75`e1;1@g
zuT%5tzK+k0<>v&tiny(|R*qk=6&U@IjK`Z#e%*ANMG{|xp&yKi;xXh{cOCG}f9aC)
z-t{Z4S2?w8<Ro%Y{b0BQsE<XEHi7I0!T8CoyKi`j9hsR5I4&CQC#4Z87z6j}Q&u;?
zVsQ%fxI4Ih%DStWe~Z2q^-h^HjHwAkaRN_LMH}$sw0l5oH1R{n1SuZ?@sX#|_N&R?
zfloi3KV0W<tTK%6x1k0z7fw8b=2W(sUcti14v$`Y{Z?YT#@YQI(H2yp?(oUm!prgk
z%<akf9mLWi$To#_CzZNq#HLoe!zrX|rz+_9Y%$od^jv+`L2d%lGVWQ`7el*|q9$H-
zWdnMDG<nEG{C}*;V^&UAU=kFpg{QLkh~-|<@1BJ|ukFhUT@2cLF+&{*$cB%NP^Hf2
z4nWU`WL03+@1~C?QrZ{?10J;^)+%iRZSRUh2L)!pjMf=_b4uA>AEaP6Be`G^G{^Ox
zYCw-B7^Wt(^+mw9Xo;;H;LI#>YvhXl5_KR3>SQvuHruk-)?R9vsS?kKb00ITqG}aP
zFq+`_39J&?{8Y9{pDwgRhERq-Lg<E)2)Ju#qn(?#@jQ-k9eg)Gxb0pW9otqg%cTGC
zN%>oo&|2#}lrc&Oc@WM3(&5%ZTdoC5OKx6Va!`2$1U@$mmV3p39HmII_JIH=JrDe5
zIA*@7b<}<>TChYMa1p%K#6E*GXW6aG!Is4Ug4F(R1Sus~wZh1><W)^x;98`77-Lmw
zanclQ^1SC-!s3%6ac>lZ?WBXW^`ER#!{a}s)*HdqcnEL5W9n0>iO*2$D^Y9TjVi~h
zdQsoq^r^|xYoXO2`_3?k;(Wxk?-4T4K2O7&lopz*^sbv~^bVaWGYg$+bPk<raL$`*
zG-J;q>pvbLE-p-FG2KG{`eZ1jCvh3*fvAo`v$kr^JMyPR=Vk&d1QLCYD=Az%iC0{*
zD&@`oK)E^ZpcJz-+spEAF!QGhbMF(9tljnd!_J>p0r)uI5VXW2dm!?<{ZeU+%U@ct
zpZo__uCn#V6!dy-$KA)wxqq>6v2%L?b4qb<oN$_Z+|ViOOJ$G6S6dk5^>NMXwd0Ik
z_&d7mO2*^)XrI!ui6r+M>Bp)R*^R^?(70PyoV0QD<(V~R@7=``-5P|;1W~!#c%f@|
zDn+QbRc8OU`&?1=3#u)-#+)%0B@D;kzeCQKoaXu}Aqyfu=#QAB@NZjfEY@}q|MU6@
z(8o>S0zj;rFWr+lTFcsRScE`bD$@fEAW^Qhu}TZj*0nWW5*}bmu6{C3W^}@?tq-#7
z`ei8&dGyvEuZ%#BbGIA6-J3+6zO>(IX+Khg>Z9L|mmID~1+!bOKF(Trt)bEpn~Ye9
zW;b2+8C?6NOg~|%?zf5rPk{UdWrSkaGyvTX>K=FN(`~Psij#Vzg47(5@y~vN=IPhJ
zk~6@b=l{VEt-+OXAN$;Djq^Ti>XUNYEfjS-E)?}WuCR%#ij6E#24ZG&#|!@*SdPm?
z@tpbK?wtABuEC?!;~%}nftXQLrfq1bu;j_UNYeHW3R8e<`+Apuj?-c|kDChof5(Py
zH}DNNTZJEKbH@~{ikR{+fbBBqEtq@tA+3AVfO-u1f;kj6oI@`=W`#8NVz;C>$9tWL
zBv!K%<acu5W{c@>n+nkpuoV8F)RpI8qrmy)=n(VyK7bE-OLB#Y%H>LA<@)3wiU7=~
zCSVNUe#sw|qI8enN0VIyAV9=%D)G32v{$2=MIl<npq~zssN6PTt$j-ng#6j4#XxfT
z+CcRq*w+QM#oW1B;EgAC<$6-jcH#&RX{RmjylJk1%{ZM9FrT4IdUfoZ&hu(qv8ogS
z1g1Bj==%t6LW-IzD2)4GR~eK~3pSZkG!7uXnQaR9J*vpfF<^hX9Y;YsnL*0A^H_i<
zqE=1*#>ej=Po>7f_3>-4ULvvuE*r?#*LXrlqzyG^ePKgV93|oD@eE6GfK~cwUsImm
zobB%EhkshZ_5YL=+?T>@a7?D~AS5-VH$}Skg7ErYIDr#P`tF;?9|VfE0Ks!cw)Ckb
zIGxD?W1uI}DL6l53s-aEM{R-Im!hPfgz!1D9K$bvxAUH7qb0#Y5SYE6Q(+xhmolEv
zF{>#K-(H(^>4{03BxUs(9#+@Ac`Mi61aH@AcI~>nCo{36zr$S;o=rCv<@sHbwbf_L
z13e{5>7r)WQ-s{d30KfE`Q3vC&y!S1&*Kr6NK>bh(7V{8-`t%xNjtfa4V7f>tz=wu
z%IKIPU?Av`kIkBPo)N$jyU{FhTN93WksM{njf1+dLWpoB!*b<|CG8TZ7s&iy6Oc(O
zK3di^N|=H*On^*ICl=kOTTK@BKp`m)^a$`)tqQ6({tIK;zqX1OL0FguAKk-sWY-3_
z=*qYlzCEkjT}vUDV0}ZJQw8|4%ihJhKj34Y<Uov|Vjz_<oVUbDallG5J;V)Ki3<2;
zZv1F4UDQ^+C$$A)-@kZjWoCD}Dg@^drg2{3n(6CzyY1X{U<+N<WzG`BslMX)!Dybf
z{j+|%8PhpQzEj`j7pC)G9TgmLQg2MOJ=HrXMF=@5Zh%=EdZr?Jiwh=AzV{(EfX&?W
z^wMOI>ipOxuQ-WNZ)USdhp|v*GxevPZuvA#v2O4Hc}h|f`IA{2164=zwCkb_+5!FI
zx|6DII?JOxsft5dN^-`KKR99PUrL#z=Tdo=6H9*>)&p;r+e^ms|H|$^dp@PBdHTwk
zYQzs|T7MuFjxz_)n!^8UXiW?9L_u`x7ZX1=JyPhf0YhbxoaAeuf8x&ztE9Q3-lTCa
zu+TL_4latR+qVDcVoIC+mlbR+Bm9!zZK1Kjd|_Vlo0iYkhGc4!M-h<ejV13oK>Ku^
zA74F(u0BARrA$E~=NKj4=O;fp5&anquHMbXm1XLSD=fNX4!0hr5vO3c)V%vdf+Np^
ziH*AeFqlIo-9*8D0!f%m|BAu%YC|%Zb+<77&JPU))&Fuobmim=0TIv6bO~>{t7;$T
z{${(k*E7WS0@vqRRViEc72`?Aj!gyJ$)R4mm~e*Oy6=#ADMjmr-OJsH`h4{Pvb8c)
zKuiayx=N&b8b(RzRCvZC^ljH|KkP!VbsGoX8-E~s87F8H?TuiLuQmMqw7{@{f~pEF
z!&>M3IBo8md54$r#5X<r=k6w>4k(+<b$b>#{wZunDlPxfan4<Dui(mYm0nYy^9?3O
zzl!dL^u?|nk*0kq%>!DGvNswH(M{%$uxc4Ox%B<(BHLK<?FAZ<65Es7j?_mU7#HGQ
zktJ&+A5)NA<SPmA|3i}aMD%}(B%U(0?q~dFcucR$b8h6)(D!cpu^v((x)lF(({PJ)
z@*^(-WC^5q#B+K^%0_&R-z=2|E`cju)!W2LJ3nqbe4nLN)isbI-q(VD4s<2xX(Z9}
z+Z{axNYT=13K7TUL{Zm^APIjTXXZZOm0JD4c&t96DH;3NRYLkgMiwS~b0S+>L>F2}
zwD{3dSEw?jQq9th`<D<^QJoJyc2Ii%qcr%&%4gBnQ%8Mj5*h+S!%P88te^paqWXzX
zS(p~WzrzXmP8l!L!nmcunLwkDQa>5f?~rKP`Bzg(vSXCKUr-x4;2;06Bq&cH*S>@?
z2{ih&Li{M@rsHYS{oG#TKp75^$?9G6JQ3OZdG{9$2rHp%4s%uIY#Q0#mcQN0M|MD=
z&fK_dO8Tp`<7SYkxSl}ufveforuR(0cu6_xCP_halH_6l<S<aE@2Rp-$?j~~%=S#V
zk<S+%xWLms1e)y;F5If4VC$8Y%hwm*(SGF1Or*Z^UJsOfJ5fjutM}^E<Wp-RcP^}N
zgkMeM^lM$^WYWJ8c_b|*QOkRq0$X1JVBv8%oFY>4VnRQGFL6=-v=Q|;6N}$Zq~z#c
zT?zMd0E+G+!|KHqb&k=@0H7opX$oJ5ku8UBs@soA{EKEN>aK1~6_JNPbt8P+P@tVr
zfmYoQ;4HxD*zVwubTuuw?s*}`SF#L%fMbBWy~As=5uNulEz2A|!u0bSj9QY9w0~=?
z+Mry02mqWEO!yd2@X@zglliTEj~9Ot=78H=A9K>u5HODV@<P!a8EStq0fuOutL3A^
zaI<3PZEbfVIx$P4v1nKu;rQkk9pmV`4*Eg^3y`%kXgD03i0-XX+T>27SA~(xx6HTz
z?e{rL%<KkR;thA9Aaj3A2&#>HIPq)%e)WzJE932MfiXjN-W(sK3j_P6bK;K4P)5-?
zU$3@+G2>@b7MYmyFoef_%%i0%O)Y+WWaB}&wL-1f5OZ}H;Bj+9<bj$=f!%|z>8vIN
zCJk|2<@k)z%-aL*wNi1f_z$+k^IIOdLnmi`J9kz`9hQPHEGAd;ez8^p(6aN0C7;CP
zB50jNubs9kv+hD0FNPKH7u{N1M+~6p#~EdOyB7BZAhyr4de@kg)|JLp(+<>@q4ZsW
zvMOeA!&v|#m1mw8TgbQK2koS%3jO2K0>nc_-{k^op^?STJPra;X#-Un==tWj%UplV
z2#HHWl$LIpj<Mif-YRn!2j~7?_0*YP4DbT^6wSE{)jRd59I{><$tyaJ0;iuslG5*&
z2)ArKtaFgdd8!gix?`xlVb!LF`)pJEwXzI1(_rb=QA?$>rZf@@0m&I~=D*`zAAqi;
zO?cbZrlPJ$P|RdzB>vYEx#cJ>4TagxOl*{Jq%nwLV}JU|-|f9pcg)QY1nf2}v5*kK
zYwD|hHk*<#FeNp`;+tag-c8y-Z@2NqI1mB#Us6oQMf1CLe?}yHgUr)=9`7a?Wlio0
zxldy9R@r90OQ0n;O0C5gI`F+Ob+4j=;}exJ6;q5QpgMLnSO`sV;(z*^GZOFaR)F@Z
z<e57YN)O}zb|%03T!qxnC0wA1qAq7ab;r9~RVmVEX*<wUXjgzzQ|95bMZXL81z)ez
z5J>x_jRjCn&z<*Y8hG{#K`j00_T?oAYqB~%cYdlck^0WI&Ud`!K~3@H`Q6epim)Qx
z9kYJbb+`VK`rWr+fXLAzkxz_M(?q)dl1T-n>Itn59`H5uD$owcY?}aFKj0~X!n^MQ
zt>NlQ9_=!s5V)*g)f)52YyDWHMN(mv=%e97jBcWiQ2US{`Zk;5b%SwF6B%dU-%9e3
z!5~FW5RiL@7dD$S-<#lJCWQwDJz#vYOjKp8lgWx&j<((#859dmTh`3Gzxfkr0~tyc
zmO!7@BMWb6l*5LDgqglYv@WPQ*G$P^-0G(5_F5f#CBx*FUj>VbF<K@He!T>y%_bFR
z=YipCIZFF}VOgwC`W!46SZg?*_;M*B64-in$wuy$Pq6>yhy0FKhNll4OazKvfXU8<
zFf31lR(NfocV%f+#AymVg>rXcas0y#!IS*~?U=p9zR3*U^S16}n-80)mtnHI{pAFW
zjPFuzTYq-HD13QVmGt3rURiq3r3VO$mW2S-A!OFS$Rj*jn@q0Kn~oUfFMe}6<LrXS
zoCq@1x6#mxiE#t|vJQPSR0*J?GSGNWAU<Xwj+xyEjB-(M_-mBQLOTW)aj5)jWY@<(
z&v0=)yrRhT5jWz6)dm8&7uO{_3;SXtgqww@m^n6Jzw>Vv%HaStmZG_pEYDh%#;eqp
zaBcQJ>M36P*k?^<b&xfeO0lEoAJL92^0LnI3D-=kY?2qMERI9FM@GJXNw{Ju{yi&Z
z!*rTgqmflb68Y-!BmS=d9cJu(XXr)wG?%pwOp~f^(_}4l8(Wh6WB++5`8~iK`c{Bv
zph1i2#VMM?IZFOdE0mMUQQ-xY<(ug*q%?VKh?(QxEp7ky=`VEu6aLV6uS?`EdasA@
zxs0?$?xMXt_*bpJ3tXC-{%TfjUb2u}w)*%gjb1V5<z#^Si;{TcQ&+PLYXf@34Ybmx
ze@oMg&ldYq%Aw;kF{#nfgym|Dei9sM(5cC#IEn;?mn}V9*$)^k*zVpcrh|k?#eNz1
zet)qUEi!@cW+X#f8?A8W)QI}V0%_3wEz^ImeKCM%QS9$1KhJ-h;1Q21DBNt`Gorpr
zvdw`$N7oUScKA6S4XAMsPQR=`3oraHwGgtk3qC(woiC$ZS;o!6@MibE;zOrm=XgU;
zsLQR_=%?=cW?!bf4r7dnjkId3e``L@+UaA!^W%=*(_)I}HF!bRI>)laMS^#O`Sz+F
zYdVg4b9R)SoXyu?CO2G&InOt$kS`dx4ILB%oodrDlv-A9{QqJ+j57vI3=C<b77cN>
z|H${6koR_IOHY@!M)Pxnb>ChT*QY4nn}F8Xm>pVAPC%vrIJuKRJJqzd>?IFikHGI`
zIXdVd{?$CKJ?NFX+_XL<*n#Aw85$h2v97D?iTFzr!yX?%0__MqMj%MBeG3`N%ofM_
z89he%KX5Fnpy~?bZ@t<u(8`7I-Ow$p%-Pd_B7EfcL!HIP^Spy=u@V(oplya#LtY6^
z>#mp`Xz$&a<P34Q!|}R1zkgoSADFbBrf1hMmoD98a>3p|vvnM)GR{0i{A#+Z+1!wP
zjT_*SUAPJb6~I)>C>U*+;;U3d$X2#{aY+`yln(r@Ac5(4fd3>O_?wr`Nb}#uO$9T1
ztnl7Fyv@=s(T;4(#ian+a^=|ClC9dAR<K<Hke1~@<ANbM5yb(V^aRRZc#cxDn98HY
z)afFe8t<h&duN^cl9Mi{T%A{n#%t;2br!$g<xbx7X$`4)Oz*cXZ8hJ|!#`DVrY4pS
z$;0PctnECyVfY}HdmNr=<463qvt!oZ(Y79=`u6ww4h3dV&en~OW7JKJd7zWmsl)0~
znD0_Klck1!Tee$L>#yg?1l*jHN5?ER^!TN@Qq?m5;N)x-YYBAy1A5_^mPa5?-V}J&
zt^V7%y;U!Iy3p^-f+}H<Fr<ZMnH#Xss8$^C{9eAW-@ed)Tt0mRp0tu4cP`2wNZ=(s
zPxU1eIZER9#l3;2-%A5k6Px!ru*gbuIUal9yxaHS<Rzj`Usw1?(%83~ok?ZZ<X4Y)
zKQosAJ=vbKIA)mSu{MP@?YR2O-ytvNeV$@ovwLe2kX|=6yxT1kVpams0H58>kQYAd
zgAa~O+j<;7i{;~gb9TQ;q*<Q-y{8`NXaXhWb%vO8Z@QRwtEBGLv-#)3KeRvd4f)`n
z`bt{CAHY3b_k=xNciurBNoh~@*tV|#Tg~WkWv!vk<L|GvkwrJoMB(vHl3;<c&#y}b
zJhoS9%lTVJx@aQKHM{c*Om4=cS^n<;A0`KRSmfVxZU)jLSt&Rg^C3)sjo5&q%K^>0
z;X;`aog_p#$Zi9%aOCK^DJqsucWtcz5drYaBauZQjsf!=-azn%f!14P!w;+Y|J*<-
zAtQ?$ss`9#$4z3EP%iY!$bxP#mogJ<w*4*0jh})v9rMW=>lfcGpUfTy1Gy8B2YwGb
zi5?;>iCiE6m^?uz^LuUw!r?D_VkSjJagtWt#=hxuBy*7m41Ik3mw4OE`qV!X(&n{*
zt-B)@=r_oz1C2(Gjp$1ugN2ERZkr>3cVN`O&$52IVc+6SX4O`vL3d1ip&r0kcxNM-
z_oq*711K15rC!owtm(WTlX*p%lN9iZ1g!ws7LTb3bTsv*{6LHUJ1g61wn;F+`c&O&
zT$%;!9R~OTr`<AK`XOnNYJz{VK8bi3fLbwvW(8E1vwzt5{#W$K9}HhPHW&ztc<x4t
zO6du>Z_rex0aV(HBdT(=<F(IOC#!^%rVI0d<|hMl4Ow4)Tirze@Cz2~LY}2QBh@_-
zcVFcuY~n4UrDh)+>;)>zuRyy+_30f@vF?<S%C^@~8_LFcNx{<AKFaR7fsFCz6hUcq
z87dFX$t;@yB@M>SHeg(1=<<Aunn7WG3^t;f4w%z)V8mmkN3p#zUu#%-hwc{~2b%H+
z33&|E%g1xEK0v$S?KpbQ|7AYPSimV!nB9$@Qh0t7!iHq>?fwj4$nVogSO3%NfRcU>
zLnb6G1}TEwI{%e*IqAB40dYQ?q#GEH|3Q>;d4BR<yy*S!8lW66UBt0>)~72&y>`2s
zq#T%+DSDC_v0ieIrBI>N7&-)*e&L=PoKEhvt{nac4dy~7`p;eP<9G!-?lGw1?yv&|
z87J8rhR1mBKcNpEH1a>+2k%!%ZDV7TEFNQf#kXCsP&QW&7qfmI%Xw%26>+t3=2?FK
zBY5aBgJToU<k>?(-te;^M1KH3P#R7(qZif|P(07UJGIscHM7>iduAwQmY@8|C_+@n
zZ~=0?rI~vQ-H;6(JzTk4K{sgmgw}xs*e&4FZcg(|G5Yr*hwK>0kiQir3K`_`i#zqB
zlR&sLG1f4;W$W<h?>n;phsgj(0Ir_t;SBCzU!kf&!3{-rbt$!3hfoEDwc(ZmF61CM
z3Qtf4v#<#2-WaG)dL4-k?)o>-vE6GpsPKS~+Q?}2CC11I2P6jmH2{b2GJuxR8q1~O
z9!Fo$vRDaH%_1X8y#4ieAqRY2eEb!Krhh90fgtYe$2Qf4mStIQe;evCQ||9XIGbnL
zBsS>_0sgI<Uog(cn`NVcYV>v@GU{B@+CpFX#6RdR7Vs<7AfVvsAl{<w3+3B3;A0>1
z!@XbME^H^;N*ICB&Iuzhb1{)5NC2Eaba5Ap5kPE5c0Z3AxkZouHrIv!mz(RJG^QC{
z^@xBnk9%OpxbVG3pESr%y(-GmuWXS|7B~JIb#EONW!t`us+35HD5x}us5D5&C@D&c
z(kUr5(mg03AyQI9mxO|J*U&XXNp}yOLk$cw`{sGx_j!KtuJwI;@87rAyVt$=lZ(Z5
z-`91X=W!h8aT=AFFgU<SEOI4GAh=Zj()W<0I>st^+jlZn<gbUWEgu_Wgb*5OH@CMe
zH?2zw;{~&F0mB*nm^*u81>_83W?S{v5qA9jm9wY3zB$Iy*{`SfJX8OWB*rH@H#8oO
z5(wcv9N4=xS4}`H{OH!r+%5r9BVq4*RG0eazZ%{MXC}P8%eDt){!KtZH8h}%_FIfF
zD=ob2FT%XQ%dGwN7gJh2%%KK2?L=HTx0uDg8Lkn??VZr*oS`XntJ{nvKmV04|7S$h
zB@hzghW1Z8hnBd{&p$8os=^>Dy!Y2Cd&@F!$v80DSUhKy>dvP6rxyU%S+VZ@v`0mk
z61f1eza?@RF&{78Qe8Td>vc@b4L*FSR{)xPneP3Yp)u+1B{qb|bC>acU!xPTKLpr8
zP`GxXy@MzD?Fq=cBCcSoz+zzXEk27P0C3=<U9IXiv%r!0T;elz)>;5F{X}ERhJd^A
z@^U&Sr+eyk+?5!M__agvt=_qH%*5z;xK@?#8Q$N$y{%J`|4mV7Cl!HUVTqqN`>sG5
z6D`b$@9rhV@~h)$Z7Jl6EKvIWTgl<R#Mc@M0W%6J3N|le9;|>;W9btA{PWRYzEcex
zKh#wrqV4#rnz(vQ!PyT}Hz<i;e0TH;MHdxv^G}e1*O?$3PKDf!WbXw7(SWXTD|n*B
z2lXSy)OK&LW)%_Y#Gxqit{LCs87YmUw?`zeNE^^TRJp+>q@sLKwf(1S(;p@T&aBCi
zrfbgcXztGWytoOpAq}^f#4V6VA4%WZYFhIw{eNM|i}s5eqX#@=6!Y*dB<59xotZrx
z=mDLV@ZUPGP-=aa_uCA(>7f{JJKKEAu^Zv3#jqD{v-N-suy;zzm_seX{LTDiJ`WTO
zSq_v~HVzW4-YuTrQp7n%pEYEX(e7B<L298wh-ff5aD>gj?%XfaG_JW!&?~{w=(i6?
z`vAOZpaSLGvsna6qX|$H>Q10p4W{}W5J~j6X&&J6QsQ9!4Q6N5>F+%s{>Q!kopu3e
z@Xe*FYdYPL@k<XXNT((*BXxro(0nr{lAr5;`TyMG+2CB_OIkMbC7!2%s(oxGKD>!3
zw^EQNVIa-RVYS#MX&XK(shJ6g9s#H;lG~ofLoR=GmJu=Fj~M)weFJhJ3j*$JG8CIn
z-%x2^s+4(OiWD<wv!Qi*yHG2p`lryJDUsrxQ-pF=;w7ZuLqrY*lo_==4Cj!=L>Ka^
zj}O(S{Q?SPt6i7xJ&d}m9YXN!?yWBb)a+SZa+f`eL8A5&W!WjeVQkmmkHY^_ROvai
z|Ic@c;u|%&u=HtNNeHUu1G@E&@n@dr*?%`3c(&6tl9tATXKfF-ooA;^{|8rIJpASN
zI=L(B2kgL)@T@&T6}J%XOrDTvbdr6J5H_kq6JcOSInhWSY=%^alx7PJCT+F%t-|tS
zRNV^j)8WyBX$OFG&DKVsyc^ZZ@NCeWUo5y{qv^GsIKrS)_HE1!$4v2u1now)$g$yE
zQWfK<3b|$96wUIz$xRJLU9k_$^z5ch|82LV6fS)fg#mvSkrVm*{|79LQ#Q@0E>-ya
z6b`092l#I6i=gmNxBqBFzI{*42@e?exV_BK9L_&5qyDv85qzJ?7*K)ooWvw<RvH3w
za8*$;>w^E#rkHmr2J(>db<Qv#EM=?~;vUb1GseO`N`k|?hE`6-a^XhOZe0hj8}_5q
zgtQDDYA|j4J1n<AxZm+f0+#)WGDIgytB@0cRd3D>-#!z&y9L+SfqkxmYarda7}w~e
zymeNoD2Yh!It(L19eaO;c74$qYteOP3%nx~ibq%7dgoGkdfW6<JwaBEVJ6KeF+({k
zu!VqK%3t~_&+4TJmhMZpB|tUw#9|YeIpAxXk+jcu*$!rQ7XY2Ish_dR2YKSF=U$eu
z^!QHK6b{yx)D}~D)9+_J__*<*By_@=H?o-92=IM|zF~^#Y!*%Y4UmXUG~sJutpx)%
zkvCB{FPp*G-T)eZk_1xI9LmtIjKjp2m_51QFKLp6+oG%=R19O_on&x@a59ftObL}+
zB5Jii;U8$brcLrvLc|of5&KG57=c@#OA&(YgCZiRta=+D6L{RvTq*0;t?`nftvRo*
z3&;5FLSV?~kJd+)z)dEM5CFMlq#W5w0?B*g+#{QpzJo^vK+UGzc@AXo<lTv}80k!(
zrJ<8_B4OCA$wu#ojc?A1>Y$$pc6b2~TEp8E;XyaIJiUHjYS+GB_9@%H|Eo{=!DXNF
zzd*M(N4G=&5AADl!dl#{2;v4{r_V>hx4=}TCQV?$RTJ6GYjMA%>-2fb{H384)A*C}
zn<`NP*H)M1YP<nH`(Ashw#&>Y9H0+Fh+dFs{e{hc`0?fvMx7h$l;GL~rWhj&ywP?r
z?S{^o-QSi%T}R^Kv+wQeE>xUWOO}uWSRZ7n)=cl##0<<~5~9v1o|wiIVL&>mE44gy
z?s`t#xHMnnUz1Ell=QaM^tDqsFqQ1XWXRg?L|y0BWKEd{&uU9i<JKJ{Fq;!f>(uYH
z;|BHe?Xz5giqGu&Vtu2-XlbT%Hsi6=B)Z2kr(jW~o51iCE>&gF>Qf53aUK$xnWZPq
zGs{mb`;rA2abvy$xU&$|M0k<NJ1K>;<pVf*M8}dwTI0mgTr*IG=x;k3NeF=)xYTD_
z{0p?J351r(>B7D*jvL)2rqN8kcjNRK;1}^Iucn<ewM!#&Q{ha2YN6ZnE&zt30Wh4P
z<h`bDQsBNy`Tm=y;UBJ>FU#7FC|;6(T^&q(9Z6qqwIvWU=XYKOEoU>KA7sKcf*<}A
zmpr)7W)yrA|I+d=_}<^*wyQT@is-Wd#TmI1Dbf7gmlUSMOOq3cTT!bI;{vLqe?-o6
zri<|?Ug({mlma(z)dmgdy^snS?@_4#4yCk>@m|03r^i`$(4TeOF@7ymTGf{2qEo3l
zc042t35exVaXtH~++e3XTI7(|0ZppIEZw*%qEYf#U_|BQo^w}!1`R3@-S`Bcqkcrz
zy8}S4&-dXY{st+1gU%!V(E@ThF;3WGNq!BZr=gIdj>2quOuD<Pg>+j3Om62{N|%UM
zMY+E0?duW$gyAl}NU$CIs0<diMptG0L#1%LEeHK^;OSSl%&^={hX9#JzyyhWmCGIj
zSs}s@zS%c1Onpk%btK78nRy5Rz|0_3`l<TNdeqn>v~&Q|rPtka#Q&=Iwj3E1EFoO-
zpe;q|Grr~35f8<Ux!N>Ke*O3X$$(ku1I0E?sYSN-uf|!+uZaG9884*%RCyG$s~PZc
z{M;~;-z@**;uhkxPX7-VcmB0M_K2c%(&c=x8zL|225C)}bZJQjc}>!Z6!+`9p3Yn0
zEpJUYA$=QmWstR-peOr%eeDy>M$hzJ03$UUMvpMSa1~;DOgncdgi7e2=C@qE|6l^p
zZ$evxj^P>y6iGG=XP*bz<8hl|X+pl(I5$D59hV|6Xs6`aD_T(rj|*Dd?`h9`3=*^D
zK04I+Y3TDFQqNv+*Yjj9X(+cpv7eee;`Cb(_cBlCX$@#EI_#`0?MN9J%5eBmo?KPx
zG$R5)|B<`3$XxI3C4?z#F)HI_rS~FW?a7KevZSrEDe|dCN2q#8v*xA(V-Fa6e4kJp
zLKd_jaBqweb|eI}Z<J=U<G6B1|4B=P&lVL@(ibOX>D9gxgwT>gs;5AJS<<Gn7gabb
zDd$!Ngo4zugHwXU)y=CXI5(sT1sYHbrun?hO=;Nsp*m+~h!yuWwm(DkI(Y&FJ-^X$
zunj^Z^)OaX^;6o=6PxO#H9jZIsbZNPWOfq!>C=Vj?Yb9Bnrl7!mB0P~GfBs6keYFm
zsYFrf@qQZk-~V(>y%wHZZ=vn+Cue-)U8~4*L$)n?h0OU=nc9Cdh2TN5qepG!;V;bK
zS@%#bVqJi}*T}~>3Ek?}9qp<ha=bNZ(YOvjN$3RGMu=ATYYss*EV-d>^|%6b7EJ2B
zlm{H$oXH?s+$yoTe~vI9w-aXXGvwvLHi*+4Uwl59HBZItH6R<cwt2PartSNZ>x}Jd
zeOl|WVAUkpX^;lVd4%X`hk`w{Q{U&gkkgKUm)q_PMrq|`l@90+v(XoHQ;?~_-u_^%
z8C2oZq6e3%!>&<0rj~j~Gx4m6$&sVdm4bM_F2_;XVx8MSB+b0@b&AKSfwM0UHeysZ
z2?ojoAd;r&&iI~f3zBW-Y#wQq(Qe(xw;(S=c1E5Wf3Ku_&O=aDKrOOKEbHSw7rdp`
zBIfiX^lu!xe(o9Y`qmA{z~P|pUSzU-^%RkRDLkJXC7TE|UQ2L2<KeY&8T$X+@s?)E
zb7G01cFeo`!Y$!^)+txC-Zx2asP<@$07Zj4FZb9MSEYXQ0sbAZ!5(381+u};pRcF>
zBlt>P2w0N;I-~LS3HcU;BQQ=2b4|%L*OBnSke{%f8Wc*rbKQ;0MSlG-?YK#g1e_e{
zk<$|b4YO`tLph8mYe7j~vso9}Te$PUD(DorE^BP|iEVru8|*lWLg1vv?Yw&h$C(s4
zcNPw_@jkSJ;(QHpt4OE>S(<4S8A^D@JJbVr4l<kdojF1V(n<xsLVYBf9>c8S4(-Au
zjze$+^Ns#qy{`;Ujg~E^msE+p=gvV^hFFl{(j&48lUcFzZkmfP80HqczFjwLZf;^e
z;~siPVijaSi~JSAj9L9qQVUo>SqV46=H*~!DhyN8+9jr|<Wy2}jF4Q_G(Mh-U0mz5
z`%<oz^@3CC1s9T}2<xXw>v!QFJm-$aZKocp=#dsxFFK-<Eq%*sHd5Up47jb!RLfzP
zbXrb$Ydrn?RNk~hs<G17&3*|oCQW{!?dEh4Zy)Ate|qxjuYg0>P3`5|0;=>BuVl`s
zuKg46(c>tnToNVx&-SY>Luxsa1b`OsyD!z?3VR#i6h52h@h@VJKzI~M<Ok@bz2eh)
zi{R(MBFR_00H<&fiaqHU;*S1Qdn#nj7=J0C+oJB)_>@V@Z(7xSVNfsO?RKU0>&~n%
zME{OsLp%Z#g?ILLRe%Jyqr(IBTi8~3Y|iRVkffAqW29HN07ZgNU7ZhX`@#~zb1_)5
z*rdfUYm(~R%YZ8GpEKWaI{DQPs|<zh<l1u`+mNLlG9D+cN;vrDM$lrn>pigG>|f^2
zVj=p~b8l%7sMLDqv>&ceJTD5k{v+6g;5m(YzkThSG+v-}P$;M;X48CO9-%`;Y)2CX
z9A}o1%}Rq&PaWYbEC)7mgt^Wl8&L$vIg3HB{p1lP2WNffMgRdKtQss-{e{seW7}Qc
z|4+wTvQPg)^Xg@PHQ>Km-bRQ6t<^VxZF+%wm<d-6X8#HJicG7hJm!@8AC+&$Cm?ha
z+Fguz>Ncb3k#edavmFPIlUBa)lv?A))v@rzsfbljS7u>6UvO;+AXF(-Zg~AyG7Kny
zpZ%%stODHyk1MoyAB6jCoZmwqc%2{HAsO7}JnxTPV@ngb01yDEaO3*+t-cN=@#CE-
z%f=O)`@2`7maP(ju33A66b<(WIh|TDVC->zFOk#-nbyzI=JwDky41rqg``f<j_z9d
zhXP=N5xjpBgyC~qxudX5!MZd0CE<w`Eiz~?tp~3Ga1Zi6vM~gfki-Ss3{{vwWKxe$
z7t_3SP|l~4=dMXal6zRBfbiU;#P+NhdS}-=u?9zjsq09SETP@T!6O>Kzb{K##9hcR
zSQSF%SL@hezDlWaxMLV30&}fhCl@u|De+rkr8~mrFi2#9y^zAdHDRJc1M*f{bG<yx
zn~}w0&EJKb`nu_O-MerNYVAmxroi~qCa&s_Q}!CyGCxVQY8z-%v_6P=Z$$I}RDIcU
zciH8AIA*Z)R1lBw-4l71<?0A%k%ERA;||3gwlcsRLp8Bl{(C;2q#s~2It$p0-njZ_
zJNAF|Do+j!P@w(Kz3esM4E7tq6pryiX(=)ql@}iZl_9!@?`WYFX8Njr_bEG6gBePI
z=J8FSc|3dmPg7LxZ$%fFMrK@J8pv`-0y0bovO}PZYAOcnKdKCyo%GouPaw;VWgN{%
zE{q^c$g*3w{KcUlc9or;SM_vJ(#g8=Fcg^4wgsCrO+Bw5x({Q-w23;UVCu#U+@LmQ
zPFP@SoJZ5E*Kf{oTeA%&ZoBf@Eno1vpAf!zMsQW`xtvdCUb<A76yG^-Iui>EQ}C{&
zk_7I_UG>|Dp4Kabyi8BNJRrUmS5K0(Gm8Pe6_{(Bk(?16k(6{=-T5`!KWmisGrBIv
z0_m(Q*h%4%i|)rc<C&RvndT7DaE|W2M%mhRD&=^f-k6P>KI_jRK<#^f_SCV9QCju$
zm`i-|G?havga<18M5du2u}wvxq2NaUl3>0^Enn!wd^09gYK||WcA%9q-u=vHTE@Vf
zGs?*G+X)}r{wLmBYBV3{z`vhvv+=@}K5x)UwlGN!xO|2Aen$md-yRSk4xvcPfHR5J
z5^KZ@>>u<U4zV>oJ8UP#lN+`S?*E$e2IB4`qR#p%gl#RHaL4h%?zIj&TRFNTK9_b?
zhbxL!G%b4946H-g!=M@TVpKk)Ol#RUEkJD&(*v_>y?NA=^B~AM%T5bpgS~_5y~G9(
z(-hghY~u&%k1k&qo!YZYAD7^VZG@-8ftP;YG`xZ(d=gr_nEQb4&z1E;+?;;I+m+QT
zNTK4`epBgj;06K}b+T36r{8t!PrSrAO;@=}8{)c&m>YP9;q|{Cm^9ZLrC!tOdiM9z
zOd3Fd(jm^5H1yP`nF=SPfRA^{-@CgOzXGSW<f|GM0@#VU(__{9u5m_<?fery@$}|4
z2H!zHLvwfQ&!y1kg1B;Ti?LK1iQStzm1gQKuAa@9W}+=tcpOhjC|1~(?wi++0oT}!
zd+67QQR-7&laZr?cshpdWKaqTlBar){Q$5%Zmku}sYCrTsv1mHJ@NBEnTABGVpMg?
zt$3rrGUYbS-u@Z4$O;KiY{M0tuSdw5XmK8)$rlNzTi9hTC~kAEFqX%AJt@xZN28(C
zDYojRudf|tS2hfrqVGPaYBwiTD}W)IMIi(F^0A&_$zHPrm3F|V9aDwv%rA$U_uSX$
z?8sn7ZwPaL%g8YCIOi*}UrSr$bgT62)txARuT4nJIUs6fyg@mZqbvV8d*^ks5)FTk
z4p_Nog#ydQd3v1*Dt~*BoW7N1!}J}!c(&S?=WG1I;R#>m7IRu&8WdAGRQX7ld^ApX
ziuC5=d8YS<-huB8b^9aO(b&Cms*&qFul$ER=dY_gTTKrmF;r%9Cih}dIS6ytD-LF5
zAdgiK(k)g?HYcU#pSQ4Y_qM2)x-r9DQBn27t0xjF{O(#g`@>s9b8>(<mPgi#{U@%3
zH&^&RT{FoVotaeWmKalp(>RrbMYz$H=I6e)r4KjgD?{7lyx%+LfwvBX@&xf>Q}3ol
zQu@4{9@ry9!+$v~C*zW8bw=~*_2E;gphrOxjXcct8=r`4)>HW=)M-*c`Zy==V+Gok
zT&>a67P%yz#=|CpgUnoV*{zGCiY?@~%2H!2VvHxsfKd~*@9PV6P8|k4#v%I9Y2K#4
z`Z9mSu&UVGv7dLL$GekK1(_qJ9A2NDQ@@<6mpaGi5vUrGVs5|tD!C6h>Kg0BNBoX_
z1|-PPVcETkCrUg}ilb6%esTJv(kBuTV+CjD6&8YSg%?Wise4x&QamSC!ssm4`18c{
z-$B<N)MA*y#J=A6H<ehwSOtZfP#*D>gr~^QDQr+@z>PbT?Xxmi98l8BOCGc{U*254
zq${BVqAwbu*VDOvhF9Nx68bJ??rf8EGQ>I{KD+t7<Oh8Abf<w1f})2v#eyU$+0pX#
zT-t4v6hS?CGF;k^`uGV+?tKubdM71d$oSblesXeZSkn9jf|l><Bo$T2`fes*j7!4;
zymOp3bcmKLe4fCWoS#w0l|FJnbSp$epp(ZnU)plfLF6;}l-wdq<5RI=VOI~@>G}<G
zOPEK9E$nT?bc2QT?8#@B5QF6*lG(YFb{EH)?GizeFde1x08bqj`Wjhn-n68|0ZRUx
ze?0>)2`z^FJQ|yXWKb?2Ub{il)aYib)gN{Qn(r@u=C9_(Q7)PnH5Wm=vZtL<cEtOg
z5*Df+Ev6?*<@Z`R3t?NrzA*-_vxctjr#*q#LqBwDnonfGxTA+3Se6FvixQ_{r(R>+
z8)om~ju>w~P+s*zS7*7+_!K4o6!%Xut))ir3^Bea7$krr$Itg8zG=Y@UU)I!hR8^e
zV?}dJ4~;BLj#?Qie_@MFLtILJ5}=lrmP$7Yy;iUzHf9|3s#CTN(w?3<)aGrd1+k(<
z!t{xw3z^(xHknP~iIl7H;1d0vG4`jxWdPdLFpAOJEGnXC+~qpMi@8Hg13IcfEdzs{
zO6)otPM~e}SfjH8f`e6<zUjH)Nn(7D>4~+s^23;lPueh(tOA3&=Vyl<OVTO6`VrOk
zBi>~me6w?EiY+1pRBJc*47x&wVxiBOd(xeFQz=?<W<P&P2x#-~A27d3KNFxY@9ozo
z4UZn7G_YFvaAb-Pu_Dqe=rj2dTGypTesK0OJute}ekvpmBV9${fWI;zcT=aG<(*wf
zQ7icyd-BiAw<kaERbJ%_wYCBun#g+S5#sk;+;m$|ska}2aVC1ip3s}sT_b)(RJORl
zzs&3~NHIg*29A-Td2V(mG`NDT5fPBjrsajeW#)S9C#I}~Df=e{2AR2=MSJh|h#m~(
z|1{#oO;mBm#_B1pH>@2fJMOSmFvcgjGc?E)(fJ;xW0oUY9cTM<CPO<Ck+_|pIE7F=
zT^(Lr%2GUB;^Iu?sl;O*aXaP7uimGzp)30l1G(?l_s?*U7du|Xr>q6EF&+2Gr@W*M
z_u3TKH|YoDP^fLHx>LiI`$B`>Zy38M>4zFbxuEQg7FHIY)OhmA{MNO3jmjV1qAiR~
zE;W`KhFh;EcLOJzP`2Kp;+e3gagc}qAW`70z*Ee;Kie=3^?M<nj`OT)^p#H)PnEq0
z)_ODuHgY!@A35C{7Fj|w+0KI1`JyA;_wLn_W@aTt!b4OCbgVo|#WG2L(G^0zHc@Oh
zeHjtuba9|T_dGW=A|C$WIBq9C_|0gok|{i$uJ$@hzP4-u*S^d6r=H%7$Ykldo3lbp
z7V2c%VNzcof#DyY)i5q{Plt^CI*XSRC^~5Lx7A|0x?-#;p&uymfcq?C%I`GHag8Oo
z;2mX2Wm|m0hl*wE2(;1RQ=Zx0UxuS|;tHu%b059W$7B*7pB?JO^|<PdTDz_qRVp?*
z{O~p49)|O4Ob*<oMhJg@@HBw*@8?a_r-^doSz)8-vz2D=^t9yU0Rq&f`D@0KMtwJH
z#x>QQ4P<_QyW8v-tf=mHm>j40c5w>bVYv@WZC6OYpGVg20SNQ95Qfcpaby@VE0cP9
zs-WxnkP8Y^F+D|y8kIo$8R;UUBYdlNV$$m6Vdt%BE1Rpn{RdkWV><_dV{~`gQ`}m}
zni@_Z<=nSnsymIF3~<k_y4golxsbfbDr2ce5sY1D{Y%#w^IRn-o3UT<OR5q>$J?jD
z+bc6*pI?%IgZpYvnDDGM&F3`7-(Fkq*2}MzsbOvAFopU~y<s7RShSDh;VYbSW1&y0
z3~NGYchWi|J#F+WUzg9A<AZ#&3ho$H#vppnbcu5vq6vcO^+pM?)MyHyz3tL$ZdV@9
zHb!x*w@*(?T4AmHPCcp+ahFlIPDSN(kG&vd1s>lW6ydAjUo(f>FFFvMVV<QU+JZ&U
zd9*pPq&mSIKj|N>PWqu&rB;na4<qri8dXwke=}Y$FuaKD5LP9m;rhAFn}!PB%rmxl
z!sR*c7plo=EAC9M?3+um8F9Z?+B>7^-TS-i0o?v;!6uY~d?oM2SI**|C+BbzN=8Rk
z@81(6p?wm4osIBr*objwrv{b3j>p1TG$Ah!-d?n-6-_3|NqR29&{b(52Y5x_yWVHZ
zUKrlCxuktH$a|QQCiv|2xP!kUkDk!n7r&RcpkLXQ7Z|n&YVzpUJy=j=Vue>$3;<J(
zdfp6!;3@iQI%to=!3`p3a#tMYdw4F<o5Y8jlNkcM>}2{oN(i;3xi`Plf7~11AfzgF
zu*&)x7SUzNlggomgMTfxjzC4|Jw%=795x<&6)bhla;R@mxI=>MWfS&9@IB2WL8{te
z?9m;TJTa>~8eTWXgJ89WSnr`1*`FjWf)qVa8B}LkyHYv>U`T+iD=_0UBFu@4Aqj{+
zb8iAXCm6HdD0lvmxaY-x_Dsk(q$XRWR$Ua#|Lm_@Rw|C@F99hX_;_)x_$4&@kUdIE
z*y&w;eC|<2evFEJAC$T=TGq!<_+bwp#1(cW<?`C)<IH^cP{=M<e~v$R=qu40a36>D
z59mO}=c({WmH)^0dKlhiNEAup|9FjV3yXei`b?0t*t58t%8L;Bo!N<@aCznJ?|Iw2
z_;#NDdqsMjb#_`)_${_(`!$T<V7JxOq*n|Z<~8ez&Oq87;*8H?#`M>d{*x4eBtUuN
zUSvJSecdESSu|sE$ZA_p+X8GWq}}8MrZV5UPkT;1L9dv@l78of)A=krWy6+Ryypl|
zS_VETn4=<G@YYVrIrqV`4}<A?0&ri5(9JPp-V<$c@IV&IvZ_0r2TvT>A=BLVg~N8m
zk3q{O991D_C>3p9*lMacTp-QiBc?yMucCnC?eWD=RtOMLg+qIJFgxvWM~bSR1@#Ac
zG#%}kC?iAH8vVltT-l)$x%dn6A-Of=Y1@QRr0<Mlog`?z%?)14R?#^;MR*~=&;KOX
zXVJ;k&1Ld{*XG0}9^zzrgj!AE$x51zAoJSLNPEEJGw6gu2$fgW8e;=#!EvfS$8gPE
z>e`_T;$7eT<V;oO>fPCM0UAUn_$K4Q*NYW&zvTC3_A(Bf7wE%JyE#MO0>>?JL&p6!
zU)w?P0ghb>q~O8c_WiW2o5bY{Z4z%6XU{dKlEOpdIR|HIk@Dg!mCgFn=1+O7^M8e|
z#h=u-z{*%mp9tKcTfau(Os#2Ls4f?mq22tbC;lKC6~I54VR`Eoqm;}!6aUOz-)MNx
z#o=U_i&KNBH@@i-tGc#A5T3yX{X2ntj@UFS@8PKosyxb^wp)kg51Ur*(mX{nZ9RPs
z#AuFYmOz2U_ehz0N6@P&LOpjsJhA;%RxEx!PluMLoWx;}<2i2?5$*JFpv5i)B6P2!
zv+SF$#??y(^clOFa(3G-XGPVYlun{?d=TSK5ob!-%3Degbm@;XNbYjqqFLwf3fEcE
z<<N#Xq{NYStSp23W8da0gDW~k!A4J}IFlw#u=Qya-JfCIvlBmG!ryX2g|Xh}{_yN7
z*Il()hd$k!qn#gQcuF|-xoTO461!icj?0g2%*+t_u^ZvBaQ2k|8r3zopA0$!RWD%T
ziTWFUDi_R-qaU8|gY5c9kO^r+Ru*+YSP$!0;eqn#QV}1O5+$lUD623Weae?gx}P|b
z+5XDRJ_5_sjS1c5O@m~~32zUOe}&;#2wCEC-h+wcQJGJwTt}J<PN-VrPoF{MwC0(t
z)d^BQ@4fk=6IjjkMZGbGCxso8PVf1Ud4EBmoPuR2Y+tyh;CSiV5u?1{C*bz|kpAkI
zjID)ByCLY|;NWRql?=NYs}fM6zgPYU=i|0QJRg7W$L-gp=_f~O**1g-;@{xI6SIrq
zn}0K|YiZ(kQ>{$M(28a;Q_IiTo<gYl2U+hdqxC11{r}sqLxgt2eE(^OjbYkZvwY3+
zPvw34RS$ikVfcZ@9cskt>chjo!+QW}dE}>wdSfXbyDg|-hA=EhSi%fuW?Oa?cN}P)
zs+4fdf&EaS?{)!V9gO9u`X=LI0-k7fYsR#LaA5_yE?_eYBZGm9E=kwQLnS?47&4>6
z@ppIHFu@IEeo~jiuB3eBj0J}mcIXv%EF*6DwU?opgD?rwZPtUxqf^h26?d`D)2%Fg
z0pCEMXw|<+tv)e4p2l<oE19&)i|zzO=t()@?Gy|}j7bNhe?lcx#8FP3TsxIvj8a&G
zV@1Ni4_sElOGDGAPsIn4TG!^>(mLT(3@4BHNScc3H>}Ypqa4Uh^+Uq>Co}4}aseqD
z7Z7HFBAQ)tVX$=Rc&fXY`?qjt7tVQP&NdB=8jKE)Z4V`6opkx#<A**q?F=I;L@B69
zPGPN>I662WzOmj*Npn@)^hdu};n62E;zJE?4JT&z#y+njqZZjy_I83hx3IX3Xer7t
zt|5me?0HW{zeJNb@`X+}l|bQc<0?dtUa!=7eV8027H4}^I;erG_y^?Gs<9%9D@5>!
zh_K*U{BviKfoy8N8_xz(+AKc5)&fCZQ~0MUzVJRJ-S+R2jUCO)@L@09e`8ITaWg(c
zk}ryVWZ_n;tcemqhr3he{gQVZkqb*rptbkU7x!gpbHz5g?a{&cT>FdH<<kwWg9%yW
zX)cfO?X$bm4g|#QbWbuunM$ccuWQcxwp0=g{!uux-g9nkTQsRM<;2$(UQ3RDiVGQY
zO6eGTUo8Pmm0sL$la=_{u0U#P7ZOkMkrDu$l0LP`{JAXhZsJo=@t7~w5>=`Fl8jj4
z!<BKAr&;TV#~dmdRUlur)cw=t=wWWm_CwKKOWG92U#^-J##jRd(w^sDBN)b!iUY>8
z4KZ{l%o@~ZSW>Rg=P`9_P%zFBS4-?MqeD@-;p&f(o~g$ow8Ex#mq^YxNyJ=!!_OeI
zOw->@oD6x>Xgu@cmHWw2=GH73hSVG8Cvzvykc3noMZ1~Xz-6$=_R58OtXqF|tmX`~
zx;@m7auu3P+W<Ku-lNs2#&{4IRt23*(gYT0F+CwKlK_jQwaMzMS>YE$Rtesn~}
zB|^uTmf>?VVU6IPVEJyFVCu^-*4vBx03vem{SpFr^z}#6U9id<R!t>(es8){B1x_n
z5~)^8ZxkdaxELKO*bM2Kua}c7^ge4_ySx<Qq#0!%6*6T&W!QjsGy0CQ`36RH{Fo`R
zHkUNS<AJ|DR9j-p_3P&=n}jK-Z%EL-XW`JP7+E~gkOr_WG+3eHG}r{F9~`gpUfY&-
z7l?HKbJ-R;nX(K+ivvLsUIi7e?ROrhUnU7}=FGYbzt1;!o(3gl7$W2Ii;ZV_R6lY2
zl@TzRr5h6ptrDPm8@rH4Nkz&QZfJ)Fbi?}wZs?flN+rh)i%QY+e(nZod)P%`utUG3
zYt%*Ro2hk4Yt9dgWyV;f9ylHjk#zCz&-0yiA_rzfXj^dgmJ^^l)=#;&r`E~mcYRK1
z+c~vy^C6bw?R^$*dl4z847(}kI=o=&P}r&gII?c1QA=ec1<^YQf~iWm{`PVSs-L9x
z@E}2w?c%(V`sh^<STOfs)YOozZo4#Eay3FH(gzb_sq2_zR~1K5zuN08N`t^{(ZJ$%
zaeJ$jyLGcz-HG>|+pLqxZEjlqx=K5`k>F)t$U4}3MMy97UiA7>fvS(XeFIu(3Ip!<
z&5^iB&&|={U)Q8Y_^!~>bOS@2wDM2TK_D4&kF%@C(-p>2SpN{=#+^qVhgq)uhnuI-
zeUTLuc3t%$?yVqjl&TN1p0EZ$G$=%u=P%3^W?~y>h@8rSf6-nl(EypRJxzJ%VB_j?
zZ;;M5S!}k@gHL`j6q@fELzoYq%>qCWo~AyDY+z~#(f+(R5OHJ-C~A|6yH`@4crQ6?
zTs22LzMh$Ry%uq2uuNw^=YTe>$Wz?;n&4Fcy`34vRMU0W&GQja<`M(7eI`Tg?RVEr
z{v|MsbX;2^x7X(6RO>5pRb(^Fy&p*t##2x6+>IcokZ7OxG6$eny@Z-ORvaJj?G1CR
zLH&b=@Gn2J;lY)N2h_xWtczOwxeXO$HnnK3M@Ka<fYH8^XBTAwQ4d+BenHuBD8|t3
z%mb0lvkXP_WVXz~66kc-@J>9~)o{emqwFqrOPD7%$nFRG(Na;>*KQi_*+=X!$0$x6
zEBQbv%AL^7<=UwkRnh!Vnrmec)KF2;ObMO7G4*QFu13Y~n?k_bCtCh%(y^e;QD?7b
zd6r>7%9F@lpedv3>u~ncL3Xb#a1T^Gb#)9v^9xcgnP1ibI-1J7iPxWqm_SN^DuWz#
zXSm?BKJxRO>S=v~z|G`FRMx^P?<N6f+Hg(*k2I|(d~<C~=mjU%aygf#FZupLpjeS%
z9kw?Aw^od@f&H`tGXcun;JkR3q4t*eVG^nPMn|q|_&;r5az4+hWnFW80Djg%CzJdT
z*sM^`wb#MS0U5w;OzixFE%oWUK-V>;L%xsc@zPLuMud2^NlEcDQP?C~tb2;}GpVPI
zds6r_cc8TlZLI-#DbHLa*y7T~@5jTV+L|<q(oM-(RH!a56E%f+&^PS|m$y7IBGksI
zFkaF!?dpUzfXbV%NKBv>P_ici<(+$L-;*7&gy_v)*3bO+Hq0UGH%O2d2e+%G3IBd>
zSbS`8t(u#+p{90d178t}?%os@w@6UPPohUEYzV`qqSAIRPUB0@J_$zAs!r_gm!21j
z%ax0we`|3o4LB?g$Q+N+mQ~CQD|-RR{7&8WgHS>ub0tO!nEkeA%_>%~6tZ1geM6_*
zJ*xhcp#STn#iE~wQ-hS}S?)@smyK|~5l{!LoNa>RI3OqNv|}*XVtXwICM)Z1Qc5vU
z^ao$i&YeB~zB^zkshsLHKJ@GUm>-(Mh5eYv_eeZ$SFtt}#}VOa(&CKiSfS*RP$CyI
zhULvwq+hf}_kR<#8P%OVUEF_B4LRsDRV@Vp=FOtW-)W=KIY8F1dw;CT4yBQbk@c8}
z3d#j;fKn1<5p2N%eYo0a>r$v+6IQ<qn)}}FsUdaK0l@xnevCaUTKezNrI0tq;)nf@
z&rE~84izYor$qvw@2cORx?Lud_BBUB=pNxlOSe*CXACcBKxBh02;O>U%7wRzt8kaM
zpS3W{k2E&s_G{j<yuS9jsg?X!;Aw~<^XFqF$w%o_lSEM=_x315OR`KRBR50vE@P9x
zz0kIlyy8TXe)R={om2M~rV;?l=P=4kw@=J@fASna?P?l<u%polgdHQjr8dg1&j4hJ
zRQ4-3fEC$3KI98{*TLsZ+(wr<z#SkwRR8Mcr>B|4c;lBzKtG;0Z#unL3;F4`jUSo_
za`_ut#zQ1Ih8-OmC%vjiSLOJ9xbf@ny%765h9PSo*||*=j*%kBQAl?bZge+B=jS9S
zV*0r+KK7?vLTK-(Ei^`eN1MmDXm`>ucI78Eg4P#lz0-(oH0OuSJt)~1*<F=!TmT2&
z7k^@n-lDYuTJ}w5y;qmS%{d-g0Oe_hp(d?hiY~8F<->RNq(`Nb79{IqXxpOrY}DWl
z<zDNk9bPbUv;ZAj)z4|$?)o4pdwd_;w`vsn^8q)*`qsSSbYrXCre%)apPSlT{9EcB
zpX*a4T1QETD*%3H`p`70n)U`0zTtn~)A>!6#GDzTsO=leXP%j1s`Mvj04I=1Gr?Z6
zW=1Cy{|v!=<MLAMt;45$!Fogdqw<VK;GsklE%WvOrE3$|hzbGPyTnZEt|b}r9`OsM
z)`B5FDIR@WcVeFJefInLUuhZNnB01AjiKuTF`QPYtQv(S_E;6A=<b3lYVWfS!xL9I
zIicXxtfv2nw5ze;-L9M}VX6-h&z1|$iX}h|(in4XLQ@tIg*vTv(<WFi(Ann#L&>AA
zefHgR_X!!An$8Fyv~?btrSNE1tEIY)51BRlq18{6^m)O_FsG3j$FqdAG6yKZ;*x0v
z?c&rX`Fv;N(viBi6uS-yQka}<J^aX0x54RX3Le5<|0<44hZEq+vP?}6Qcu!uap{6K
z50|KfS5!58wSLSYMUIwFdRjh{u$&xFmnWs5BE%P#D2;TvHwL1gfUksq{o3`bYUXj(
z3?z3tuddL@Yg>7An88azI^1Ik*4c|pjR)c;gE$1E&=<3iLD{e_q@W_Qvt258@&0;8
zBtX@96IJ58S82_Hwi)Brr`FR%6n5&%j=u+$NkQrn`5;NAUd$NGfCE%>TDq3lex7!O
z$n9R}FT4n5nKf(|bxHz0vaR8_Q<Q^m7{#2_R*fNumYh3I`q@p_X0FLYevl9Qapm>W
zv@_8SxFC8+j(BAO{#M{>2!+vKOs%0?uj@aUT9SVYrWW2|V}C_u1BkC5s%OLzRHI+A
zB^{@u{7X?iTc6RZhWrm`3=C&7QNS7G8IU{3ZS*YJs#dO?d)T;Z#K&oL3L^{9eVjNa
zQ`TCq!#gKXRM}dOh9n3Uuq-j)c?xksEe(as4D#Yf<Q3Ve5mm3LOgMu)?<GK6CJcF!
zdSo{(hYNsPz`{SM21(3dF%q;(TM$H|)G4)=QOF<H#Yk1y0hhSfnd8w!dqD8t_W0{6
zYYMxpRnVV>j{)J}pfa>Jd2md4DAl7H|88(2)FeIljC4O?Fs6s1h=SeP?2o*s$sl~$
zpb6^#D>zFkr||SKITJB(CSRq$;@baCDNrtBnHg~vzu|VvRuD9Zc9OQ?-iS0UrW0(`
zW^kG{#<lZUrtE~std2Rgi$>*oak#p7Vf7m!AlRzUP&$jYoGO|kN;KQlX*IMkF#)W9
ztZY2tF1+fgGwSCNJvp)oU==(?(c(L_95L%^Jg8S%+Pu5*xlMQeBE)X;tMLK{wbc*(
zqb-2~H5jf#>%tDsuA1<CRcGw>CI6`G6~v=v+CjmtxqPs4m7%T+qUxz6?NCRJ*e$+z
zDZ2Lld?Sn$C1|%%ePra;0|dMCJd>54U&{lQTa1J2(O?7T5?gJMi|M&wkpxTc>o1M3
z+%Qsa-LOKPsa`uQU`Q)R;s(0!ggXw-UB}YwhH(H#|I)OLva*pk128xKc<h;*<ANNh
zVll!4!EkV<1yd@l!#+e`BK3AW?pT49dqk2Wsi@UgM%XwEng>_BtQX-CyHyESIriSJ
zJ#wt)ZW8X~uG@M91|dg|lR-efz9cMmzIxJqFW37@6rt@AVLCdh3CxYl(%(Oab>W>9
z*$;s4yZ!?Zh@ObI=L9MUxKW*2A!cYqb0jpvJzT;L=X1*%U}JsvmeSyCp!13q5K_4)
zM$&aol$oSC{KBHS%{Rq^rMJfYoIZcKlLq&?um;(IuNvn|9C)j(t?m1?Pya>bmrD2U
zTV6|iPC*_c%FS#fub}oi58x5bpV&;=6qtTpxi9xV(Y5`5hfE*H_;=!I?<WuUuT!1j
zofBVVT%2W8c+&r~=FaN*sdqe^ts3qzdrhZA1Z~D?x_U?=)U|@k>j(jkJ+9xEGm5^l
zkSh+hwae;w>^25}m0I~MwaN&F*cH&qcg5_Ssf!+AmZ|pFYzSzMLzB@z9a2`2U4D)2
z6$B|JLFnI)$&O0<M&Y_YLfUv70sOga@Qjd3pusQ>A@A|TuuQjH+eY(<9;y6Gba#6g
zejmKdD--|x55$6faD~F-)#(!JN8|hIvf|F9p?MJ@E?ZB}q+VBDHy{*8I@6Nf2}z=1
zVeFq;)BIk$y+n+s9nkmupk4Ngow`d~yPD4JEX=5p<p5A<*K?AoY<^-DxtiiH#O*Hl
z=?`AJTX@l~nI+s^<c&PNb+fcX9G`aA$E2D&sD%BqN6vM_qq8}{k$*QEOgxYZeWBz_
zLl00HH#1W5u$?W*vsNGQc>w7Ix~p{aV?dvYYFmORq(twI7*#~;W9M-I`P|PQ%xElu
z56vU>c?62i*+@K>DW{IRun}9)xuC-SKFWtWx(qR<QWufa4YidSrl!|u^`sjL_}F#0
zOq#tlHKq0b7Q}QtgWrQHlOWO8rbv6onyoqu$UIv$!2#fkcQrc_26f$2j=wi=K+fy(
z0ZthlHf+wN0)%KubzF+u4Eq>nDKJ>-F!I8DrBYAsP!5Etk*Ll&7I7aMpBl3SYeG?<
zK1ofyL%*i&6ym6iF^5wpAp@6Ey%-1Do8slR^=xbOQ*m4VEMh(f72t~(@_{zO%d5wT
zXf65+%+ptoYY~2EkkJJN`ghITm#u#?Yj(2dsQ^x&HZX$+@&=mPnuDx`_j?OhOii;6
z=F-H*e)j3|`nHA%!*iw1&8KkR*(Eg%J%&lP(b=`dIBA1<aJUwoPrw$cZJC1YfEqEE
zURUS4A+V}bV^OzS1t>Xo$Mkt{=bypa;+O=G2$Q&N)oW@p!1k=Dfa@I?Ao^*+wQu{d
zhc!?d6zk_hhog}(Ipsr;Ymq{CbZT)t2B=Zu!A7T4Q@EaZSXZSSq9ppnd(YIB=)75u
zWZ9IxL3ngY%D`nz^592*3j5}mUHR7ryoQ622%iD2H^pvBX)zymee!|!)4_KJ)9Ns^
z6}8tJpQlMQOBZCZ50W#CuNg2W2CJuayhIpZF&_}U+pn-3ky^g+dtO~H%ANPx9}%m|
zyp4U0vs^-le(<v<xfV!%KFHO$eS<EpwmQ^%#n?hpr?uOpYFqXd1R!ul{Qf3z$4rQx
z2nR_!UM7@NAE9!B<-%vYne|+F*H$3GbssDnAtU|n;;1LP;$5x;x75fxmYRIIWf*SJ
zTnyMf$H<EUAd+TDu(sYJT&Y^uv7!^h<C#da8!%}ageH^OJo@o&$?>3Swdd!^!;L;V
z+;I&0Aknf<^={qvtb@mtWv=zLkUl?IfP6E8>|HaU0~vGW(zGR!1<#%QmMfjxX^674
z#2IH{wtgy88nk!!tke#Tg|Z*ky@}u+V2oiX!*ld$uD2QA^K|W1O&TIcwE>?r=S`ph
zkDA!=)X5i&I^AR+hA&Q7*)?O3YCNwjvLxhsdnCvl1~bnnzWo+Q#H;nM5;1aSG#0=3
zLkF?<oY=-Y{bS)x1CO6=q=agODgOK3H-&bq@}P<@Bu+{HH#VE8s0iO0uz9IWvFhe=
z*1M^oMs9!~^_G)mH11Sv>)8rY?S;x^K~8(KEHCg_o>4xg%KTaSG=&4rPTQvD1w1oB
z%VX|&B}e2(M_vww|Mgx2R9sZPUEE36k0KpTI8pDNJC9#SlN|Avj?)3bA1Qi+jv4Ro
zhmD^%i5hX9!`^5*nm3C{9Zs5q$MZye!b%z4G4vLmJ>;2bK3AnI(!uvSd_@u8IQxUP
zLp?Wj+8J(Fd;PR0@5clnjd961zhSUvxU3C>Wa+ET$<1_;A<}ph8cru_o-`hggjyR_
z#<X${_<lY!YFBq|#&mV%CGQQYb`6{@_a3=5TvU_}g-_8qJ_a|}t2<th0S6ZtD02l&
zUBHNLv3$Oy75Psu0605#6Q$`3<UDml>D*lmGf#g;Kz5_bR6w&kwr*$aeNp1O^{>Fg
z{ZSFVTX?_6;_Hz>8qmwKJ=AwvP*L?RpKB%H1U8atdGWZ;SjtD^xcgl4Ik|)}<Ap=V
z=qN(+WSTuU8T;OAwhs_pGTt$3j~{cr#L}Y_B=icg=Pn1hM)yW@uLV>Z8xiAS3?ZeH
z&+L90`@}K8P(+<Do->k36b6RT1}$H7rZJQxyJN%w9T=RYb|hN4m9^CKNTxQ=G?i2T
zDHPUPulX?3PiNc9<5#$Ro!Gm?$HwIwTKCY^KA0<m@#&Q5R6s$<8Ynm1)|Rs!v#Ceu
zkXU>7P)T~R!*Y%DE1~DRXFtpm<#h<g_xFd}j5Q6bvEQ#ENEjgpgxk{23k-+l#$wOb
z=*k^_WQoosY`2X>x%<#@%tuCuEnZVMx*=}QyKW9g>Zz+KUW?xU{&+fzUW}%KRZ{hV
z)FU(E%zBbYK(+M{VCd@b;_)=lFCYsa`<i#s(uVgBKfWAldnxV=kiVbcDIxc)F-b4)
zKb>PmQ2gx0Wh^ioJd<EaYj7{rzu*z*5p&yWut`gHKQuN|^96J8oLL<YHM2bIkA4CG
zn@Fx#D<*oQt}VVp6BFWg4V%HwMXic-f34)aT{_t5*D9M&<7F&s{a%kAAihu;VaG!u
zgXocpN{W}2w+4~&*`xuFO~u0&Hu58We!kCT4TeIoA)|c&u})B1LzpB{?Fv<eZO0va
zq;O8X>x0RI$?5S)HRj<t2xep6t3R>_@qo(pG_D)d{I`wXrM$%1Y11;wiWmH!N{3vP
zHx>L(`wYJV<Rz1z*IFdk-Zwjc1f-HnuN9nX1*SssS@+LGG@F<iUD^mT8*jT#8~=vK
z^;Tu3f5U&cq^MD?Anwd<t>BsZ!dtEDmaGR2V4cUK1aNPzMBGF<2T_<7Ad8p*fqpEl
zUyaQPiFI8gMJVFMi&F^<p9;r5{exe7uv2MJl)PUnSK0lw+xI-!NEy)3Eb2I?1reZj
zFafiXpZ<Qn-GlZ5ksTW)uYtWcMmuNGSskS;!_Ozg5=z4p)BKs_rG=;-Vp<=xyE&)f
zgw#{m9(Must~mBxvV<lTPH6wZy19as7LsDk38B%s?KaH?I$v2)-*lX5#uD`Vc*<5e
zz6Q=SL2dMDk&A+Z)7HhQLibzW#*S1TgVGl&64(?^r)k{!6`(qo|1t3vb16zYGjd#B
zIQT^ZvFb0QMkIw-gLl2BY|N(YD&tOk_MUQ-jTzR#X$_rXBqMMD9S62|W;n-caOUfL
z#C1oc-K2Sy9N%!&9iwR3H5nwNZBPU>xU7_TZ6^#&{UAX34iW6e>x&6C-clJ3nX+#%
zp!qRu2ttNjLyoT!M+}Y)P_2+(Ja6ed3L-|1yNuDV*nuGxz#pnvN9tv<<3s5;jBp$A
z?R5=({in;TE5}p2<@I3qZMa#H!tMgwYHK;9RbHpg)gOB|+X&Few$lUnhSatyK&%IK
ze~`6V;WRLY7qqFF2xvEd5_|L9l3615T^w`L-HOaLgz60Cf#we*`q%Q_Q2*oSX0?3S
zhw&q$t-o-*w@97u$pW0Z^&g!2@flx8c!xp*z1XMwCIE`7YI99L+~K(?d5a3wC4qK}
z^PLE5s)baHdc?hf_gP=B=C+KAk<|HrOsv=k^jkCyxA2|3ikp?~td6lwWD2K~OFD|b
zetd)mK|iEZ<>kD7M_l`zeI&Ss4t^I@Y<j5y(<6R(>lgX?00AjYNT~C@rvTo{KA4bF
z8Ke+sZsz<?F`ad2D@pYL|7Mj`vHqDU3?{WvE?DX?E;~A@-tLDcQPt+I&8V{-fBIM<
zt?}VdhF#TKRDXj@$oAAz{>MC$f=N6Y<5~N~4eZMVs>v~p9(cdSi;U9ftO}zh%poes
zKUj4YaYU|0HzrwLVCu8y#PDW*%2BDN4U7JeyYdr2ET@yOeZ=1(pMSSVr+17@3qd7;
z{O$%E^TBs9u2w`HbH0>#l&^-$tMIZs)MNGP!Xwy2C<1goz4;fU`UM|3=$}PCz-~I5
zVwAb_FRINhf})Jm0SP?a+Uw1mNje54V-bqZPo*}t2Z)ESYrG@&)TNqt{7Q1)>85L9
zI>2AX8dJ93+kcA6`09!Hs6uN_DsrcCRA-zXf4CrwX7Y3OS}YTE%Ad^M8Yu9CSmqR_
zmMUayo-kdGq6R?v+8Av=S8W^LczDUzeLV5-KUEX5nIk5QwI3H)9HO}W0U9k%g|&ib
z2s>HE@QrA6-JV*R+ziO(6*J4l|0Nt(=F#kJSi4nZbQJnoM?y+Wf|DvshCiL8Bc4Yu
znf-O`#VvymkRWb}2u38~s3~KESABP?+q>p^KIg#*2s1??gtruCwa?-)h@u$eIY8#C
zY>xw)@J5fp_A^sIzC^R#&L4BNSL(lHb@`#iwPv_-)6k+euA6q1-zXYS?uxFG7)9F@
z)(lokq9XB@J^DQYtMqz-G}{e_=XlWBS9wOwqjQ&wyI+r&@nrYo#R*Ub&Z#t>9g+OP
zB+Y&(m$2@ix$g}JPX67wquFTlX<Pcd&ZOBr$Jn`%)LdLl%~g>C@kH2ab%f4aWG5k`
z=ssx3I$MJTNlR+^6fj3FTfv?)6xW?tUbxTWu|xDni>9pD`X#pg$;8n{9~L5xf~b9q
zFV@?4d~uy*j&nXI@Ma>R9VJFL0!F2&x;d=aghOXgXPusyQG>-V=$J09$$O^3zG;US
zq(I{e9n0i;X4T$8JwE)ho+*mktbAEkaUloW^brCG;K_+<hgsxj)5SxM#T+F`SpLDE
zWBz}`pAR!`C;C#=8bi#SWre~3H?V0jg+4TFg9fo%VOm7zGvF<H;YW5bAGoYsMR4J?
zOuMTpwXi|Jj^4Hy;beTv4P_iDZ4OoKK7Iw8?UG~sDR~d<?)=*Dpv0O60bAFhI;f^+
zKT;qd`L5-bkY+>UJld!s2!CFN?Y;bBw=xWcE{;l1D>4|OsxqYO8SZSDYb1~ymHyB#
zccd=TIiet4qxgO(sRnve>k2(7?Ieof&m$~=Hu_HWR}F}+t*Evu6&4pfzFSNJq~#0G
z;&t0jMet`7ZI30}M<UX^Nk9LsWiYy#8F-vh-J$WrAwXI`@VHGj^-a(#QmW5<ckV9r
zhFG_K`5_Y+frkSWiXoj;cF7xg>~$-wg_Uigtam@TGS}Y=zH0!8nI~SanO<+d^We5q
zUI0L*>vFPaf5H(@G01A1#4z(km<^Cog$B)pm)ta-Np~{*jbS(Jce!tryKrFac>`FN
zYCn&fk?$)&%5z`&QzCJT;?HHFrdCe*@scZ17mn=}tsy6y?v03tlotEqol&_3QBi!+
zbSD5}uEyiE+I<)Z(B)3IMgC^cqzPY|83THRxvfxJLl}Cp%`~U;FnVJ==g9S>#IAC-
zR5oyi#e#1OJ%|2buM%Is-_TACH(O0%;O5X=vv=@maO`iO=!*5l29bg%Z$Fm!FXg?(
z#{NnW=$uKXWMw$$Fu0_<8&p`Q2*Gv29#&Vrk@VVWjONs<eY4ZJDpjLPlLfwi|K(o&
za&W7eiCo>@IX6^zY&|R2S9hoG1hN@A(R@KEzRhIApv%FYg6Xz8**}4;_Wobgy>(QT
zZQC~}EnU*!MnOQjq)S3jX_Sx#>6Y&97LYD!l<rQ+O?OLeIyaqjZN2OJo@c(9_gypJ
zJhS8vZ<n6;T4x@|udbwTMfi6RT;SFqtFzKR!M~g+G2@@jq6Hd+E#afJijU#U9%-=F
zT*!^T?rhd`R$?)ISYqCA>hNUw1M7X2m4~*+{q?u+Jzp5Aqt2VIWk#2lhzf{7pm=EW
zvBhQo#MEr{cd|U^s{tps0~Fb+Plnx1V{*K}XT!6!pe*i}>Yr{;YgE%x9T#6N9(|b-
zuhyhBx;wv*nY*(OG`Ji_Sz=bVRB$uTJ>_oTbvqhjjsXFTr1EYnLOLUhOIv1i$Tdin
zDQ|O{O;~7?VpuZQ{iJsD!_7`L|2qEtsdK-XL$PPaH*NY*WTIE)DL2b~-?Bi$32yE;
z`rTV!Zwk!dwAC7~)2{c3A8S-fIf|wj-ByII53EgWM;BiFN!lyB_eOOKg1|T|i{qU*
z&KVETEEI~=Y>K>zU1%P6`W_4m1!33=Zd$g}#5)!qhL6c0#g2?OmR}4jJg6AYX!c4P
z2#rG=XCu{qp5zdk<PE$-`^G*R0ET_|C&{jWt%=6w#|rSfOy0~@oiVS#!&s@oLdZBL
ziVtmhPi#=Q83_sLHdGq2@k*31djh+N76UUH;FYF)oqiP>5qW@qPjdAW?`LACZ2~*+
z%T5y?*wNYEJeI@@Mf^3cv(1D9xNxshkd2LIha324Q^(Wpw2k|Z93V$<cuh%@V<LFU
z|EQiz+vB)fcj1SJs%49#^y50Ql150>W%--~^y&MZ0Gf3IP>Eq%-GR>~6XAJJgLbXF
zvgHgF(XB&_+r6Wby$?&HYk_%P{+auEa?32W_PxPgH#oY(<@jJom6B!Fvz1HJy+0x4
zaJ}ki|I5&j+e9tnF44ep26*SSN8Tq)GDte-N|cFqMYVFEYTX`MQUhMWH70Xvp~+ta
z|Cl;UC^ox_4E1=wXcM@qP27z<PB71~Y8W6QZa$1)e}?h<2JTGMfy?z#2RFtSc%Va!
zg#fC4>BWt>H(+iyDUXZ!hZYJHr7PPR19H!>?3GcEbO-?Ebs36m$E_RF4=C#v?8*+G
zo%%#}slX~j`eeMf!}<FU>&bh`qS(4|{x`}kW>dBe0uT5pt$576_knL0A6$Cwta(@U
zRteBpbc33t(kjjN$|5_mz9x%ETM*)I8+<jh{ZJC`57^nXGG0>uQ|;r7Tx+BJ1LX^3
za<=;=`4O3yK~ZAz8wkQ}wve8?#=)CNtfDC^bNu>NN0Sb$2?LAHb;~A;xSQkhr60+S
zgL73ni^TU3f1>^_OtQusR_TVl`YZwamZql5u`omLoACR_XQm#;0PVkK)KYyySP#g4
z^7hD1EwUPV4glidOY@0}N{|0i({!5fwn9T+vex-=(7{IhopST}?OVns7+!F3-Xsy)
z2r<jMJ_L9`2R+Yw)I3T4CbDp#r#bSUQ~f3U>(@Sm??HqBia_Z<d;lCP+Rbi>0ta<N
z!$)<}mMu``%O5!^)0$JdbmcmWJvSRDve6?lS4FasfNMDV_{2Aj9-R=Qr)ug}$>T64
zz5j4HXph6Qk2%4!FD9MN7kxw0Wt0{`X5#X8&;9Id5%%hN%@d}ImMB3t!z9u36=|28
zGgj%{TZ2d6*2$J`(gZGs`Q{vZIL_iXgwLab4nAw&eDKH+7FlKuU3Q#cYyK9|uvg=n
zFyT6peoq6SxUW<JB8P%*NO1ROkmc#ek00Odd;WZxm?fM~Os?_KN?@=^cy@N5MGom1
z%JT%ZcSbAbMOVtNge-+iqC{PDJsu6C0!4Hu#zoMN=@C|op3_daKMjGh?^Fl;H}VhR
z9o+<Uqf`MmSscqdd2X4p%4^DUO>Yftxyqx0)wJC&B}F#>Mk&a)N?ebqhou0M`k5>~
z3lbq!n1(aoPGisBfD<Af#-h+gxjB2$c7q@cYmFF6w~&-r^j8b6A$eC`PZNcR;1@Bd
zDePc%_1nzICy#73W4T`Vept{EO|R#ALMF+ziLKea9wVH>!2O*)Y=ZpYqUNRZmHw?~
z)b)>hvd;&aY*ji7Q=vKNu4@J;lY~W7&|TUsdgzrd;kNDfCC=yCw?D?)&sVjorOxJ>
z9BhXV$?a!JXL!u<7(Q*{Bd;ZN5KY@cH)^IL`iz=ew8A2^ZY|o#u+-@Sg>3o;yIY!G
zdbke67D<(^^;$B}u4@L$ZDL2dW_vD*-r^o>q+$=;mv*@I#!hy-1NxqFEl9m`agtPi
zd@$g9yTd2ZT<yza0hkVBQ{@j0?DrKAl|`Y7;cjK6G{zqh=Z-@6AKtCo9OYKew&K(r
zSkGN0nmk6b69q)w#LBahj9n1{CSt|3STNxy_#-2pqZpiDD??)|1xSvVnsAfcZXKP#
zZQ=F*yiR}$;^gTyHDPL){w7`!uQ&|5%yo{Z1Y)FhQA%MJ%`_Azs_g%Uexr$Zq93Nl
zD7S7!q;<d#CEF*C5uWFv_iS>0_qbXjvhl<OYS6%x$0c#Id=R(}6;A!2j=yaHn0zS&
zmgWA*XgC^r`9pNuZpMl9mG0Og!;<7V(IMRdfhRN<LHlV!+FuwSoA>)`*iSWm>SY14
z7VM^s;#|pHcbhAAuREJ|2Ods;o7G+1<UpTnxnF$?h=*8~c3B&iK_1iIsM<-r+1Eq&
zXV~k<{Uy@eMx%f6m6OGqw4kdVwGrlH+SCh6z#VKut=}A*m>h^buMN<mW-nc-vuT9@
z9pSxINv&eDa~n35LcB-C>TNJ>D#1|_zC(u`=OpTsk8{VT#C^+qiiLHd16K4#*K60k
zl{3JH;+ZMTd0}}Qh^%%sfZ2@#avO#;?fP5-k-*g!CngU-!+G$W{2JVW(M|hT$!kEy
z98x*l`MfRBZRU>=%++(4(_kpw)nf$(9<%*4U_<B{aQ-BsK<wj9xl7tG$pV0~{Cj$f
z&dZgNNg?4IIs;CzAU+hNc1H6LY?3TUgqwt{$8YU32+dzwG}9q3dll;|Yvl(%`J8K#
zjtYo`(SCv909SrgZ&sbm42S%c#ZZ;*tB{zRA!p8U$4*BusTzQ0IC5IYQ#li{LUb5b
z@*@ivJVFqpV6HQ~O~tnYCY>02!-<>v4_>nPvtB=eECYzR)vKyu<olyJA{(N+P5V&S
zzTw?lxEaeJ+GBrw`0x6U(ixcJWP+a=zjH*?j9~Q`CAR%eU^Ct|P9Xej`S-}GTv|{~
zr33g`(5#%abkE^tX;_%~XKf7*N#={a@quzY=4av#^M+~Up5qzcRp&J}>}w)>ubWjZ
z9nXk_?3)`uIDR|l1<RgGrU+E&PyS&pI6m;*D2{2l|8|C8o^_Ce!W@-_{f4=Vn-9Ey
zd9-@1g3(WOXSLm>*I2T9`8JL335xI=qK$JbDNnhUTekAcVsjcLU$qYU@^!WhkOsG{
zV?yN0iGc2JVS{}&aMZ<}Uqs8Z0R2y6*)pk|#8tl9z|LL_(pBZi1v0iRSYYQGc}F*P
zYZ^sx{CyYRrGEQ_QzGr^G$*!`SaXJYYY)qW_lHuXs>`p$ehBpuM{fVl<9~H!ILm<@
z{{Ufxhy&x1Li!USjwHp)<<n*HaK>L!zuNxjMs#A^QeZ~Aff@Y)NB!@`gSR+PYcba>
z?yL{SzV{b<p|$9qC-pxB4FCwr%bdFt|FRtwZjvozh#<ZXFp6*%^7}AL5(}Gz@lJ;D
znCfqbq<^;lJu)NN0puNvIv~FWWW!%KdxMKP?^a5vj+d4uFnRPP0sSNrv}_qiR_q^=
z!FnbHfYzKOU~4c))DGSL?0hTC#YewNMYe}IVNspt;%EQmBZEaU7iNEYNwchF;}+LK
zo!d4t2j9l_szp4LCN+w{C2G0(%y_%?)i*$cWET+;(F+I#Vs3WM-X~#0Cjg!8$yr~P
zUD*--;|8PhEX4O8+in(Jg+FNBh7k2TYu`rPY!$YsnK?JOF6B0-U-sTt2|xlaw(`hn
zZ*TW0t`?nlUpuflRY=TjAzex~9<uUodfk4?y1!7nXK<V^>pO#45yym&?=%(-(IMeK
z!?_pe@2`K9a5HW$dIauq3QP73dDzrx6o+2@A!wk~?ax{2JoN?LYj~VNm#9C6rTM0x
zedLuU3P?W-wq4tA*pC)GbMhmHc6rJjuHzbco@vw_b*V$^@%IKkVOJbric}ciecRBc
zGXo`k@Y3z-SOuLMJFkzhn5!~IdO(wI79%}qUZsJwhK<&0W(>`E*S6&1X!o0l2I8JX
zR;RUCXPyl1qyo3(J7wvrFtpH|n2+^Q3W-WckA5t?y+%lt-}s-{^;ps8$S}o{Av<Ak
zG8%(@n{4O8*^wWdk2j21Z~TuU*5@)NG2Xd|s(2(LLG`aX&NG)W%U^O!3ZDrq@HMS;
zF!FKpH?yc4e|`H{|4Mu_lzAz3`c$xYB!#|Q$K%~z(?u2lM@3G1HaBjQRQ)&;ql!5$
zSDNA^p0^tEaGrw__WZngbsuQQeZ{glcoDBrRq(QSB7j5t1v9!m!nJp^|0su%)*gS{
z0^E$T<w;I{6X1jOpyvkU^q)q0U1r|xlMNmJ;V^L4&$4+GXO?OBBICt3p(3@!JgP~D
z1n!D&ca*Oua+e~Tj5HB#FzYcO7v7#gJiwJ-^kKK8m)B^})7eaYRdILe@A`Qo=h5{N
zo9xqUd2`13QuB>CmrjeXYMxG50Chm?Q#-8BEHu={p@me;0exSI*K6+hd>y`$E*qFw
zf50YhLxqt{ZQoFT$rN5U<65Bus@;xE_HB7|!jOuvHc{kxa8bfg*py`ETu${Fm%SVb
z9`u#87l63vT{Ud#JYMmCxF>!pOb9u7<xAxR&>vvQFPbRSutbPK@KNYO;c%i8xol>K
zLv(ErOE}hPxaJ}<cZo})b5YAJlJ9Y)<auvn*rz3$B477)BC+F+CGN>e(I%Kq(d~)<
zm%piyDDUFlR`U<6Lqw{elwk_Uz*IY16Pyq)?~^RCoxPRIoVSF%K1jU_BeOPa1G0kH
zf|at9R?~Fo5bPked|_7B)BIzHY48|truNEygH_dc^%kvwKuLqls|r=ePugi^#=>%v
z##Y+Mk4IC_4r-y6w_hiz`1fj4Pqre~-jkEr?Jm@9TdFl!`c5?X?=uRIVOR9ewpcbO
zA)^rWV9i;@H^>Vy3?3cX)ZIojtO>d6we?xljNYr8m4Rc43Wd2W=c%!`cRY(N8+fMI
zMke2@ohK3%Y;eB&Z0+NNYUgjv9)88CtcQ$1=R4RY-u$ksyg=WA6whgbi~2DJtiZFw
z|3q?x%7@M*r!496bA5z36Ey41Y#T%%AJ_vHg$KWcq$8U8!B}d<sQ;EX+}1bx|Grtj
z*eP5FsyTDhvv@P@VeFJ8lxZp5e6~|}oNOj@G66!r+UO~h#OlL$*stpIght}>uKKKD
zDNm?d6x-D7xvWRe4FQOYhZNZ7s<C62{(d_3`r}j_bnQz+_Zka#cwbLK@2Au5J6GAh
ze(Z#(#|ut6I%)eJ-@EpFWK)eV9&h~R&bPI<{lF^cCPWM%jlPuQ{kfk;!i_SuCeyy*
zm8dak)Eb-mqAaMk->llE{=j1%&s*?IYCK=X+eQz)0EafFbGpg5lfsFp1Qolz|L5GB
z+~m6d24MiH^gmJ(+Ab^uh`q7@pPhK9chG-j;<=|>X0-Uv`p(o(d&=ADKJ^Q(9_Nus
zb}}Y7Qe<jXx5qs$Y38jT%i{0XGKE+AXHnfF!j4d3(&ongiQ7QPWhQwEnYPQo+)13K
zi>p`Q_Ht91;Y)+RnAPupf=*Ja;+esot1fYNIy439JK1W#dkn}~8jcdqjsNzPd-zuF
z4cl|xrV7zLFnH1|uT#buW+w{l*Ur+Qq=f0p)KBjHl(I@hFdN$Z1xBhrX54E(JcO_=
z)6&(|g5b9Ajn=oX5fb9zE_!Jz(MSAUhsS)j9%KTEB{>lgJELlR70H!To9|v?Lfb*;
z;_lCPYumEpnUbv}UOq#W?uyB^j&#`67>_s+Xv3`4_*Xs_9pSg5JeDnk6j@bJbv9TK
z!FIHDeXtYb#hnZjF_4FKmz>nrGo6636SJi(NC${p*sD{I&-;2Ww~d&ih=g*^sP58l
zY*dBLR}1otd6A6NHc(ke;^W>*I0|V|Hq{$@6yLSZGsbRs5^PPU5Q2$%ff9$HSNSI<
z$@C374uE<qRfG(bxGf&HDb5@zkh^+D3V9Io3V!DSX=m&hU-7%wwzm<rmvO@X>$E`y
z;Q`mE%_@f-A(va!D>}AT<L}7)LTO3FfR1=7ozu&i#4FtmsJ%670h?F?77ibZg~qnA
ztfL{njXkv%s2h!EEi0l{WIVn-f=t?Fru<U*(Yw#B9|cU%&W!^HCHAC-@ayc$u`VK)
zntKE~(P5PMeu#A~D-Y5y7TW+LKLAb{`-_9#P-_aObsYzrSh%MWI&wkW%<Rkj_{)t(
zu@sIXEkZ)Dqp=Pm$KRrq3MK@A!xC5$E+28j$7$$jv?R$3RXJ@D(pyMj8PS9gIq1Y+
z&TtWmHNyVQQ!+b8XQ&-&#r1M~+smy2;mKKn*;(@4fa!e=3FueSa(mpOgmr>Rb_TY0
z(-_Lu8CdU!)gH>_BpA>svxXe!xNQk6qx>0u1z77W!&-U`s!pwUgu@UK{$LUUr@`AH
zO&-!;vyK$30%bE^B>?E#Ski-deU0G+-_kKeK+;o$7)m@Cl$VHYFs_emH%q7AT2NXw
z*uGDhVQA4f%-ktag4j0y*xXu)3`oAR?!aw6b5d6Pn+hxdAXw(D*Dv&#yV<+2cZmak
zS$2cPzjX-N!F2%HIGRev9v@i%v1RbAr#s(56o90MZVcV;Y1HkKcBtLr0udTRTi%gL
zvGG8x?cHJR(k`>GRq+XUgaUHfa{1u}uL<Fx5q92F=okcMyA`f-fc627We63UwI7DL
z2Z_|wcSw@+`}Ci>!(i;QvE6YpgH;r2#db2*N(2VwjncI#f`Q0B%Z?sr;j&B0L4gyF
zt+l7ZtbdT)nW~L2uk!y-Xw~B9fQkgZV4rSB`a7(nprCl#rux@q*SZUo3NZeJzQT-<
zyR}==KK^n<#>Lk@VxPUm|A!%;sOPW0>t%%u&e}U@I)Kys$no4A0h-ey=NP}yrGGOr
zSvXAixKd9S-5g-1%v#<w7qm<1zXZ>E!)5*D?S#j%qb*a*90$m$@s5nY9QO)2FHDV>
zg3SctNG0hy4UFZa*IwJ#cCsoED|xdmrsTi+p1}9<g69z1<wKN{z(`j?giE=)(2D8X
zMjoHvj@Y0PBw#->`3nWeYrGU?3w#61XZi8ehu|W;bnhkSuNq7Wd4aXeX?l+s9c~hn
zZ{yj3=gO%@-jO{iGj?tsFfJQzr0EfE2cYCzhu1*_tbB%)N5j8|mBEnN-Z-0$P^&jy
zyc_nA26Z<oaAAa|Tns#(DJ_V7pEoQ!HyG1>FmL93_h~GD-fb!&#<SX<d3@kp&SeV#
z*QXZNU5PeDFP*DEPj=1==^f*_oflGwz}#d&kvqvKmMQ#E2ih<4)i6g+e0PUiPJA3h
zov8hEE3mijs-<@>S6lJIOA&d(hd@bkcSC)X{KPi@1G9?iBpybBKl3j`Jd>V=%BHMd
z#liDpkDE1pI+${*!wB%p(YWZo!rbGx3C~kpedu3{u@@XHP=FOrOoOIR&)SuYKM_Qr
z6o>&rxqB&xju%Ng%QK-M=g=>yVG&Fu`P<=&!&VRD{d0!9aY7iR=pgc_z+6|UikHIQ
z<5vp?{nGV5?#&>hA;fN=(0|fe|8k=-`%<nkZHKd2wqw2R<Pk6~&58n(kRGww+eVEC
zznxLkkADwa8k{N5!Vou6jW#guqNd8aG^vXl8~9f)4tNp69EcuBc8|6{O~%!=e2{eT
z9MZ)d3hCyu7?*)`8#M2;wn#fBVN3qr&F@K6fu|gM3kxbJC|ItuEb6*CGVf;Izkgg1
z5@{wRJ!M8p|MvYe%3PFlH&z<uyGp<VDhBsx_UnhLl`9Y3%|s_0>}FUFL>T`6z$LMj
zPzFW7Z?db13_yM)^;vN?|58X`WWzWg{52pN(5IVR{C}J2(C&x9N}_xNayM{NU*7_J
zBp5pqa|eI>)mjJ{q$i%GNbp&q-xj4JJHoxku%Cc)&FjReG1?}<+Y!CX?|<4j=h^qn
zCKs)G<K~Jp>KLNymwt{iQQeQ)5M+jbmS+i7B#{+GHk3gIaF`c>$m~N!q1B<zuv=+j
z7Mb8X8)7EsgO>N3R)q*C+hP8Y?#fk}Z~~)NK@elHpx9SnRy#Ic0bSH!Nb-@ctl`g>
z0<~BGVt(k1@XJ~YNZBpxRWCj#8GSu^4|`z#MoEs5KZ4nQQ)l^s%>Klp#K2+v0<haF
zuc-`yXILDB@X+PCUmf{XtuGlNI(jVho2Fv$Q~~mu*ed#g*s!K|!OlwoX`W%!cin(~
zr9R81j{G%-z$qFZgmQ)RCCrs)Z+A%*ECK&(TonzPG++Zpk8_2Be{VpDH}3d9HsB<N
z_3HOItHT!!LY=rRaMRLVc`dqA-^*+giDz^q;<tS+k?O65{t%fK8R}#)$9l>Wfs^&`
z+Fxq^9KmNwsNsK-L>4(fk5lG>W=Qy+7KzAr%%*d%dtUlN!Zp|Pe_=UXIIMqih{j^w
z-HneNjKqhcc`1ryKgKE3fc<oipy%{doGhJhA4naTC8dq{<I>Xm8~f*o$b3r)!SM%3
z$V7;y&%<n7e~MPvd3AaG6EneK^CADwni5n9=mM5Ypy@5clHfu@Cbz&XJc074_oNO7
zxB|B_&|z{ZG<S^5gdKRz?%8%-_xVa@K#Pt9H9Wc*?s1vBuF@WgThcH?>=+5g*lpR!
zZoKhAH7oR7)TxA)se#o__m8`J%olYRJ3-q9H0a9@NfIbXf~LMBmzyd>#0&=8=8Om-
zL66J^6?dIHH=rdFRgZ{R3~NdEYuy9qCWoX$|AXCwNc9nbTIo#>=Vy*OSY0Q#+KQU{
zH&Vy7fl)dv0JP>edgjeI$=w5_<YQz@^#&<nk%^kCuMG4m&&*E&%RarkdsTO))!-_1
zCm~>98g9l23k&PJ#TGEeJi!LXYo#iIsfsqnK^7L<ct?`zHA6A42F7{ma13?FLU>J|
zmx|PQMQax#ROz6bLM7N9qS#SX9E%EKM03hqON*>@sKBTx%l7g0uqn-o1v^w$9Cx-3
zQQT9K6^^XuaUd;_?064MB$wsg0C?HG*ih7QCEcYpkCezo@c!-Do55zo=C0&+;VAUy
zf)&F-4Tq8?>hnslSeqUPF@b276dWCjtP2gBg1=nZen&A~3HpFrj0@%#LzVnBax4AH
z3+@L4ZAx3aUoU%YW;h#1sy&YbZPx?d)9^1F8zDQW^FBY|Yiw3+w(<tY&0<Hng7uuC
z3w@;NN?SLafRfv2U<Y_Y2XQIv0x|65kO4L9;@u^ne)wivFjy{tt3a!os+lL0mxMZX
zjyXvM4w-OPJ<$)o8I5U-d@cj^dj4+=abTBwO6{O*lUXBpJWw;NIkUshWi~oF9jG*V
z{2S&c{?CB<B^m*8>gkaMPU6;Sd8tk_rti~y43dX`{lY;7Ud~8(hk<fq$8fUvqY>Oh
za!?unmqZ}94|2+>@~4PKk%V|GPdVYov7xt&l~v2h(81V`qx#wo#$DEXJEO~7?#IBT
z70)Q0xce}1U9!IQv-SU<U0iW&`5&Z<yzZ+~f%3slPx{qK;F(#V_}#Unt-*xpsv6I1
zv^OjaiDD=<>IYQ9Wdl=cD8;!xs^Tv74Q;u@F0<7N%s&JzR?m-LH=wBu#4vvhyU-ws
zNfTa^fB?eOBj{ba_RLT3ps|Av8`8(LPaojhk-Vc|W|OwV)4V%mqh5}TeBfguj=MJu
zgqsP`OqPvpUP~=JwIkV07_;DfM{U{s@bIWH+)|=&PAHAlOJb9pT3Z@%nDD)%21c9&
zTc6dfJ@TITi}wD}pOue!eDGn4Y#$Z;hp8QDK{0Mri-e3TL4jfh<C%nvkBmrs{V{42
z)!EWXN+LyT-dgNg0BkZfBs}2(Pz-jSIF7Udy)5o*@U|x-cq<%P@(`X6B{7n*0ZVF=
z{7gJ0ah0gyeI~~dPl{;Z-cuV~ZBmMDvW7n5cTD4b=6e~<T{M8%Y;3Oh%K(r81GrPo
z>=2v&(b@{YFcbl8olw2K9o;>#Cg(<%ll;?Ynfk4pganHIYSqVt14GC0iVuZ9W>_PG
z!@E(Gh4bZ#5{5ww;ISXaP<;OWWYd)AItj^9dqN@LP?#qu3+4&RMd!7t$K#+AC$Yn#
zInH7KBC~qXn$zC#CfZ5<H#PUSDJbl~FbMY|gJP3CP!-NT2+T;`N)G-`Yxds*022YF
zDaYa<=Bq`=s69054DzsU@B9CYc*t??Mbs**l@~p-PzcA}bZ3581Xe%7j)V|&tkk&K
z_|E-eV4y`GD>;e@c|h;dLz7Y4^+Wt696LH+_+w~l$WE}<RO#~RZc;i|9ul-u{gGLP
zk29+5oBVjTa`=EhHlR!8FIc>;zM?Tzn_vJL+fWZFkp*A%DS?~EVH*s^dz46&#hnzu
zP5#0R-n3)6Pw5$i)r)<TTzc)T0b?==E#xCIprzV@b!`8H@tmyw1;%Rw4^@!rVl`OM
z!mSb2GX+u6!TNW4LR_=AZWIm~pKR%<^MIs-8q6TIcK}a@P1QHYPAR`1Sc~om*-^O-
ztAW;q{0ZZ&+WZube}Wwx>H&mwdSv|_(rG}W!BjV^e@7&E8qPi5A7WU|cQ=p&+hr=;
zG(Nfi1iMvX@wb<%)BbV;1Hw>yBe(WlawEclop5Ua^cE_d`ymrHM^@G!&-A6ad9l6T
z7nYFSy4&yNoPE0e!feln)OFQH#7bbcTP>LaXJ7?OiG2img(-!m?=02Ud#2v2N`Y7(
zfkq(=gY5?Yzk}_f&o7^vO8$$F;(v|X5s+pZ>X;%`8?tJtiwJPBJ<Zama>%=6xp6C=
zFYOEKw0;*22UXpg63nWuxM_5DAEh$fSgpIF`Un-IKTGWkYvLjY(j70AM?0p090uib
z;*Vm;^$Z9=!jnctoA2az7od_Ofik4mxRt&e7YfloI2h@Uyi)fj*jNqa!%<P`ODFVS
zIn%dPTCA8gsX>IFhBdAKLxv{A74c86kNE{<xV)a%h$^Ooo4^aUggByNVUq_?_6Ne3
zehyFStpOB(l>!LRo~<1pN!bTGtZYj)3PliD_efIMc;~bDQ*bAolp8>c=<=z(d!0rf
z?T=ukhR#N((c*y~l_M%FBK?8f)h>AVdl$G-w^)m8=$sG9Z9BP$<e2E?Q1JZ&@r2DB
zV5hs=vWl~{ErbClMG*m%pnsUmqY`1EZfOUg<{lqsU&ARLTYNV+X)B){{YeSOB<}9f
zXQ4pWgEv?su<O@$g^TeHC*$t*#V)Go&EFe+q2sv49?A#Clu{CBi>%}_Mte^_PMa|o
zJkki@9-8*lC8b}~f-~C*u``eY6#~&V8U6AU!R(z#3Ss{zKwhfLZJQM9ADD}M(7^ZN
z>78zBK2i`YB*)Yb@a_v1p<45HA%*ik<d=bIdf$`=Er&TJUCO@_G!)4TXGcy!Q{Q3S
z#ez4T>_XoY)i`;B1Kw*x=B~<|xfWv@e*Ry^@l3*!Ik@32t;~=il4rABve1BYvz9c5
zmbyt}R7nPsY0sh8&X;ib%0I>jk556Mo&Dpp=bC&Zi3jgT>?dRBH}YU|=?a0I>j6e%
zKp_htS<0^*qA*Dk?l3sVzat~t?SB`n>JX~yxS{L4fzJQ*9&#r{jSME4_1-#P;0cG_
z__1BacS@L(#eA{nM<2H_r4m;oR5n>nQ6KW5FBd$jz`#w{i)C4VyMg*I9*Ldtev<ze
za|bUPA85M@FciEX`1OH7JNSurfMz8AB%72iUY}$Y#UTt9WWvz)4~s-GXV-uN0|&t2
z9D(0?HrGw`xBFafcS{Wu|6^Zf{BlC|V?4NisU-~V79O7KE{=@o$=)Y7ins&>@4a8!
zuCPW7z9S~Ww&egD0%Qt`U8K$;R<E;24t2S<i!T-`@_q&~Svcv+>YHu%1=4VrG5Aob
z>Q*J|S@H6UI5>Zj{9)q3&3XXH&a)qUKt76b`NOmagPsa2|FfYd7^1a<Dzk*hDVNLf
z!uP0`jf73OdTJF0p*VVQt8k4=aU!1dw2CgI|CG3v>4|aVAd<|kQSo#W;FW{?0-DX1
zz5xx%oohbhKshgvi5U|MU<ol*l=$q!f-ry?c#<ckO62x~SiTG;XkQ8}`)Z9`(e=4{
zDg&8g*L%OfyyHAQ8WpF>M;O2EMIhahNiUnMK4yB?HRKye_>ve6h!?&%B!R^eHB*ZJ
zM}v94XB6|49dGpUyv7b7RdaLgdOJ+|*T!Vs;V1>>$?8mEa$>0Urz=|J<r{<9THKyN
zHT<jE)8I0NTVZpxjcsQBP`i<v_R_hVciZi1J*|v`t;m|xEwV)Y$z)NG%^gtGVzXAm
zs;-NXvl4%49FOlFpCSQh%B@G>A=kSvvp=c!FLj<ll8K)RKN0~FB!J0gDatfjc`0xK
zL!rc1eFK>P5Q+~0Lh=7Na8E+Ogi~d%R{w4qGzGQeQ{ouT8^??^uS_!^9&N)ePGN}G
z)aUf;phZ9tGF41F??hFb)?VE|(9Gx<7s%;njFMyd!Y!~rUmt)8l_NbGt1MA-ZF#0*
z+28{y7T@-Og|*$h?SAj~3iZ<0a5oT;SiFKwvUIOVz2U?hcZNMfk=m93pJe*1F5y5j
z#rmEwf7Ld~cZ<6Z4SrBDG!bo_Tg4l}eoz!j72z{bL;!)oe%}S&X24)SC$H-KtM9dt
zj$w`?%ExYjfb)-ZiDfI%!~B!8Sd;k`i$WF(n8iM<OC=<C;j8IuAn@)Lm4&$t?`LjG
z{e8+`0c#S1cF#L;+F=DGV*NOt94VU^za7mLvB>b-C*bwrZi@L*Rn?3X?Y+-$8f9Nl
zf=IQUKtB6u(wf*Sy6xVw8GLB~T}2Vzzb>Wsvp{9|&vZV+{H%V^Yeu}^<E}hS<4pQy
zF%NJ;c&JuS%Xz0@7by*qFaRa|o!c7Q|A2e2{uWugVl#-!1EDlgdd9;RIz$eE)HLB5
zTY2paSS|2cDh|<h*(dWz*n*R%sC?0hdVET)7a>$Ps3Zv%B&?C;TELeF!otJnhBwYm
zrhgm@+MWhv-Es4Sd?54W8P6_aiWxaG0i7`?->EPX#ybbR)w3fiY>rz|xKx<00XgpM
zU*pIqFmFzfWX71NvsYJ9eF3i6x7aPyr{3g$j?Suavk1rkH&{MN_wX|u+aQ<}Q5wqp
z5^*%B9ZLu1;}OI@d?m$i=SOikH-!krzJb*U#jUwS(oJFEdHc!f+Xx{auQVP4*_U>I
z5F`Na0=D;dpnQSgt1uwq$-{5BjX2B2#YV5cT17iv<RZTo@0kpH?};BuDkFnev#}S=
zM3tF~PR~wGwk(gEMjQ+3_!0*ukW!B{*Ew3044zwMGVQW1B?xqR<j22&&{X<i*y+On
z!>0N+-vXt?`nbfmO{U5bKb@|@qJasXDqr-vuldtGnF`}-Yg<OPc~;LTEY*cMioSZu
z0xuDA$D8Ya6>3}3dEq$u6V<||uM__F^p)@f!89O1R~@yp6U-%KKOZ9q^c`9s(>uS$
z*kEYFvjx%tK8^v-13YocaJt<GFn!M`^nsOMrI_S2T#LI5>wPOWz>n;qnY*-&_fI=*
zH(wSAWk}@?`Fn9Ayhi!kM5RGwjH1Z#@RVKhGn(B%0F3(3))7IR{6|v*cOSUMT>fVk
zz+X@zm}rHOvq3!h%%(xTvJSNvef@O)C-AUy3kl`sbGHr<Jrx8;K%pDhJvZJSTVt9z
z9kBSa(n~`fK;<3)hysU)bB!gPEAXcT+*3{)7Z(dCaCZ2g%#ua%WhTtDGoBeM2X20Z
z<lBB6@Evz;q@XE9gAck<)XYa>kYCD&_dOAr8c9sAmyTtz15;89X#@b({3eaG=AhHU
zi#eI!+DgX%2yLagQR5j+2I(-p_g(4Y%|ue0DrR?;AuF$u=&SBmC)c8TfmMdxm%=x;
z5jX2!ct3T}#|+H4?^b_OeB3aWz1z_Lu`=sszD|%`j;MbqkyBV`QX<7c<#Kla*ulF|
zR*1%y@k?YtxXIW(Zqd{;tF(~veYOlEpiydcGpGu5QR570f88UZVn|tHIKfe(T#=Lq
z{bosPWu}5GliDYpWcZ;npVmR>8Q+)!1apF3{Iw9FLV8KgRay^=V6UsENfOcgQ_o>0
zowfLF5vFOMSvLiYb~w%M@8_t;{!&SR;D+*OnE|N4B)N6BKfTgkl6HkG<LOXd=>>Q{
z-R9^tdZk1!+$fZi9}SBYmqc*n{p<**k5&CN;tKYSDIPECUxuWA8lCQhU9BExzkR=S
zpYCe3pW2|k-;NdXl-XFM#D}aW7alEyl!`R|LXxqHUO7=X>~&vZY{8pnp4oT|aV2bV
zo#{3&eHq}9HALhU<niSdsK1wYtbaPUFx)>#;TZas*O0ysP1)btcTP(@&x&{SluaKx
z+xBpQZ1Ily>c11A>3+VI7*0_%f^QK(xShAJnxg@sJy7qfz(;m>Z*?TTdTpxfi|m?o
zLbTm~1(|2(%H$uBe*&al$q;Z6IkxAvzh6S+Nt=FRV2No_p}oNJ%|=9#dEa9Oeebq>
zjHvgPohd<%!p$PY>tWEZA5KXTbjVJ{T8)nLC&Cs?*B&90v@(+h>&5B3?wRx`+TeL?
zhj<ok%lq&-+Tl6Rv*59P6G2N27F-<fktaV1;ic#D#ARh=W@vllk`Pelg=;o{EWAl@
zW-2?_J32D($ZWiRqJM11eC=@#d>prqOy{mUa-O%~E7yBtzAC$dOqbe`&jqwyaNUh~
zK{mUw%Bbm|cFbeQa;Q6tvpR_liblB|RqI%$C6<cP<)|}AcJcg)h~UjjxL(bMN4<Zs
zJm;FOi!wp8Y_VmhrTs`0clz1(wO%n&kS4p}7;U4CmBhD4cnb2V)_xKUr)spiIf%=>
zwy(9Pt)yG6Ul;9D08YQCI?HTw;vo&G`MW1BHWVx2K@{)QJqrge_X0%o;Ty#39$#*q
z`E@cUrfpRm-aNBXB1M#I<HcMn9woY6e}U8Nsgmk<tMD0jpM?4xjS*C{cgII@jxjIl
za^C5D{`S0ae&v!Mq@}m-+MW<t&CDjZ%V~JM|IDzYscQII-$9zfqzV)VeseA0efkYM
zalkB`*Kq6!^kkqb#qMPHsq@s&=~0{OA=ygw^#zuv4X{P%yOxvJ=cp!gq!kEVS4Ytw
z16sbvl-HzZDDu`zC7~@n4;=?@*93rM<9co6Cj}2H<tWe6CR7j7;##x~S}xxTD=dcF
zXi7lip!V@LyH5>d<!wIVIZ#xwiCSiFDvF&RT1e%l5u=bp-%xgyDSde6)>l+9um+W4
zp>m+u`@Ttt|9&eO8{W-zQBUpl=Hw79UKDPF`0@|`2Xo)TqaCO|zL&W;TQr(}S@qgU
zoiBBY$X_1OA^55}!3<6>UV7*R)oNaSgx+8L(K}jl-H|u$ldn~uzjQj*7$rI*!)Mh{
z{N{@C#fbJ}G1+sJE)F8R8qXjtjX)<VJ(P*bbW>Z8hD@BoR%V4_NsoHLCuMJQjjk94
zJbUM2k=vB4WfAJWok(~(WBMH|y{FanjQ!~6id?V#g|gRt(_@Aa3rLPK$YjFBf&2C2
zjf{HeTcLXox0LZ^OMfq5;7&|_#7(Gma^$O1*rnC>9ty>|TH8JA@Es!mWoCxwcBA?`
zvvg8!i*&w&ad*1Ww}|38ZFtt9FXqRv7qBV1yY^T*r$e!XKiX}3zU(S&z{^e_fA7$e
zi7x-XIMm(oGhGyNDcSf<cuM7h6e&C&MuRv<<M+sP!)wRYtc$N8({9*?r&(uJ#CM3k
z;+5d%X+e4ZIw6o^Se|d5-mk-;G8Xx5<)KIUUg^hr5Xu9$GIa&CCp-=WKc-9xYLu^b
zYQ4I~aB*^BCm;RI2T^@VGqAW%%_mVD0omvAGyVtK>P9XpAl74hl%-60Qu+})(D;xp
zozj(_umi)J1;p;+uNNPRRwmzg`nOu-4m%az6(-A^_G3Sw5V;R?b{%SsoS_|<D@vpt
zW=X8GVl_A*I~>0(JY~+lyo1JS(zSGk&3IO%=iL}FG)OH9YNq{2cAF#}7w(R6&KwIk
zx1Bld&E=k}jsy~X7Fbq$-b(1$;2)mn%y+1F8Sblv*P*A~cHb7Tc|7UWJDyT;jSSr}
zShqqn&46475*Oh%m!oTA>s3Z#&m3!e5nG9frI0>cYFLg7dGyBk8f;x|>EU7}Kw$8Z
zYb(&FY=@35;5Bc`xSwXWhwKQ};K9o`co1C_&RDD(v}J1&rkpms^{W(xIo)16VXOxi
zdNp4kiCXW{hm=gvTNa&6*}#S8QBg{liS^AB##Z`uMNB3HBU-KdQ97k4GFNaMsH<y7
zYo0mB5<?3)-+h(1wI=S1^_Y%a2vOv2EBi**to*IEYE=7)b@Fr0w8EBcL#5ko54HEl
z4w~NTo~1$i@qm!>)K>iQQ%d;XKe&jh#zNcZ5Rk_j>OI27DH%7}b!qjWw#P{0KoVnY
z4M^mIX6gRY{@lCML*sabXk2bin97o9_`J)=!A`3h54g#}{$5Q}KMAcaK#a56=UOYm
z*|SI#XMv&n0fA(W!cHIIB(;okFA{Ix*Dj+ul3%<WkY3rv&OX+?im4LDGY#Aw-?AW|
z4%U<mjvl4gRkVaw_Z}5xJ=$xY=ebvK8{w|fCo);OM$QAHcIj};US4ui>f#bb2on#p
z!-E599i)OKoTs5*FOkdMj-MN#GtFr7$ZDsakSVG9`{=cg5WTthFzeiI9%m~n9RDEv
z0r)JYhAz@(SFwu!cnTHxnrQ(-bf8!r)=^g{*7G<=YaXfh#ny(%4#8OWr@e$}!kNch
zP3#ex8PAA$=KVk5(0Jr`_|0=j?c-1T?(Bo6?-QQqouywdf$ueSEnC!8g(n(@SSxyj
zn(Iaqc%dXFhDQzR<OhW9$zmMonQka&jYs#kEwQ`RigK}ztNZJEcDLoATX2k=;Ib{q
zJ=UG^4yVPg#XJZ*;tjqx7wW~^tR}_!o&2V1=2Oq*ai-YxCZjmdR<Wz*IEJFZ)3}2g
zy-MY4Ht&V_k;TTfIcy^i^Yd$)-L(2!%@)x;dGtLeG86~BDFwak$~OtIbBz|C+;-?B
z8mu}}?&+F0lV{69$K3(P(bsdP@i4MgL=$;_;dEqb#+CLX6od}}-j|2KoRraFyJ~SR
zQNnIf^UP-r=-pf2Vm$QGzRAl=^IVCdYQN=|ODOs@xV3?of$KHnaZI?*7NJ?_AbH0Z
zU1v$ii|6(*b_d5wdN)eZ0VUA)-8!1Kp-%kfp?13Y@+CgK)fmI-G|~qj?+&1_)m;hX
zlg__3_z~zoWTQoN1S=O<goHWi|JbZgSta4o4ccz9A}y*s+udf#t4(4OQ$B(AkXtTp
z6eNQOQDlsun1XYRX&Wd@mc{9-X?(&QCa+xY?N_=Nnw_2MtZFsg*|uH!+=h2Dw1i5D
zOsKX(;TsSX+0%Hf5|9aZ(>|EozE?EVz4ZT4+hUx4XMn%Um-GflNyXH~C^@s<4L1|D
z0NP%(VU5m5ZhTKASz{s>k%(RD0GfNA^O`#_e(sI`0690L6x1MNpL1EmYp+XWY_g0=
zhyilxVpfE37D@zf4w<(14>B|eurC^GQXpjskLq^Q33W{0dv$Ct1vY!ojAA%YJbNV~
zri);iRmE_6XOj^F&Ek$o1+I)iCjB7>FL_<^;dkEBMh_c8R_20~Uuz5xWsq+B(PEN<
z6=+|w{+xGEW=26to;(kwP<#^x-?`>cSt8BPy19d}w8>hM+GqM|;6<l>5IUB_D~rMu
z^{!&I*Bq9a?P!Cb+!*p-V;YLg`RMPW1%Eq1DsDs`TgR)_&fT~<?_a%bf@@gsF1iwy
zno^gtLKs@qxAr!iJtuo{AHzUvn+CZ)=ECCA?lNqYDhT%is-a>8j*>)7Au8TfwH}l6
z*&oMuo(^Eo!6f@*F5Kf;l{5<L;>@w2)s99t>D{s;F~gneqAtPU%N{B&Hi6i}YXe(h
z#{I^zTlW6w^V0|Gx2pu)i=NYhRijsCB6W$?Xrar^#Qd-u_j}iPT#}aa*pKtqhIcU<
zEJj4VL()I%lkzDXrsTL;JSprSEBJ3vl(|2+PH!A=@($o(YZB$rFg5$+G51iYgsF6Q
z=glZB5~Rw3pd#W>7qLMqaV($k*_+eE!*b|xO1`hnu7cuKmf<e(4<q7hkhQ9-3c(y4
zz6o+e1RhmJW+`0F$ZVX;Jx_D*<p^2#VE!KK#+R}U0+D=HEaO6vTn;}?i6aZ~Z`912
zM)H{U?J>xhko*`*Vrxr&hIn6JnVst&SkIrmg46rNKdX{UL40!Ry+aS3E%<IYt|6uo
zSo>4QXgs&C&R{nwj&qfe{`=1xUA|t}Z69uoT*<`KRUB3OM*C-<8LK9<_kR58*rzG)
z#3^vVbt6PemI#<Wp!DEHKhgfH_6R^_j75UVnJ-vkk@M(a&6T!EKQ52FO6n#O9(P!(
zk*x!{%|&|d+lEXnV)x_~)!&Yt$(3HC<j?r`z5P-TiXHMebiBTF<A~f7&vRJH-4I%$
zuEt)u^DEhzD|8J>yUuj1R7CQahQpkQDdE7$Ez=~IgV!T6fsYWi>6;6S^!X%`PtYJ9
zT6^e`fQ_-0?psgj=6<$MunzSV&*Qi@BD7trDZ`h9f2Tm!DOW>jxV<?OwlTiGdqrT{
zJ=Kng)&bNi4~^*<Eul7A(fm%$wkdC8i5rDWC0}o)CzS!t%(ePNjLI5ZzI4-6NyO}r
zyHW$z<*))X|9f2*&ytU6j1#wdRC0IdRq2Mr7OkRtdi8M6md9iFs!<mIC`A5jFq8cJ
zv_G(BMLBH259c4qkK*D12V<uyL?7YQ=#wNdLVpE5`&2Z1!$CV<bWO!`&gr+rjm&Cy
ziRZRMxs%R30@-QruY$*=g}L5@k@bGqiboK^+l^wc5!njVoPPgk=>us@P%DAgr=ixm
zdJFUWPUr5v@VTL8kN(;H^CTmoNb>E1bVa8|qqCDcG9_XAti%U<#LRJkWt+Q!a!fN!
zBVE=AqB<v}u=qr68+e5jid6>B^7F~;?<g9-L;&3o*op%%?Q<t{7adUQ-#)6>R!-Mc
zN=r$T*tV^Os-5@a%{LB(Rvxqm5>4>~J6jgRw2OJ<Df7O|X4irlgm1gr1;O%L4M&m0
z++wK6V31Q>?9BPzs`(29A7#`YAgkH<U~#q0IuR>BJ8mKK%uSRgisFxxP}_#x@D?-m
zAm!ZPP3ms<<7YXZrd>d;^yeKz_Tj}>n{I{nk8z_umr=dw=<Rw~7yY#yLb~dPUMRD&
zVE)qbG0S#G8c|NV)T#TdC{^CI^U1`UmPew$=gvl-2&gw}zI0JPwMGzmEhz=7nx^O@
zFvrt-DReOyhh%#+B++)8(cg+M4(1N)u;?Dvf4nqW91=|au(5m?<)RF%HOK8V9h)V!
zS&lZ=gV&`%l?9&za?n*#a5FQJehRPhpzoG#1GsqVwIPEDObL#UPVj!$>u|WnDXpSv
ztS#={%oVQZS{0THA2^!q+HFZsUUF4}hTUY_ioXJNduqu&T<u(`_kt1X{TnNeNw0d4
zTeewiaTaDQ2dnrU6we_V3qzSRlTIFt!na|h?cwc{dN6gVe?Go<aP>ZiLYoZhQ3#;f
zYDMSIVbg`*FOb?ZKbtT@`Fzgp|HHIc+@ohRU}n(FC4H&-{`uRDvzj}2DHerImxr{K
zC5MC|IgP{?)VE&Zhs(%x)hg;<jx{LbGrtRb*djoEy`PN21v;K}algQ}E5#>sLkJvI
z82vg%zO;6;9j<T0X|0-~o>!uAo3ruOMXOLGfTSJkxh-#csoC>j>n`B8X27|-U5n!k
z(<d^Oh9}R0XRk}^iWMW#V&EVD_Km3od_B(fNM8wEJFqlR)VAB#!zo?gXq+(3wtqVH
zjDVinc4elpR0(Ni5XV6(Q5`2j^9W5<0JaXKq}!n$$8Six%0fBs5t$tIF8GmT<EQUW
z?%)&dH9+{Kbg%u(`fdk{*ACous(THU&*IG#1Se_Lo*rDC(57E6&XNUR2{x5|Wqsc*
znuj@+-uPMHrPrfEzgxD#<@8O3#{y|UprU=t_xsXX+qdWaiW;@e;|gT2&ife=nKPb$
zH&<>8k&Ef88vpT;zi7PMmvVHfDVybrEF1HYtf0iK$VJ-|srlqY2;1h)D^N+>4E<0>
zBXJRVV~?)L(~CoQs%jOop@unV*Wa_vV^tdX8iicTbKdRtk>GHfEMtQ#PL@x===+Bi
zrMZv`nhg~za{jC@BEYlmh(`BLY6eb@Ac$WK=%JXG%l_LF{_C~)uTA*7^M03ib}iDt
z*Pj<DN%8;O@d^Ci{(!UeVDZ*)PKh7f+3BZN=2GNdemy_KNz^9D#!N6kI&*Az28FAM
zz)KwxoQ4+oddQ|N9_(b>guo6x{ezzfYSDPbZ)IjHU*Dq0sH=|39>f?e4$kvRagT~D
zZ&~{aU2sJe3yT+f`N@T#3mhjQW*vUaxWrV6Z{YvTJax+nHz)jXMBNrF(<(J^cuX+3
z=#-@YtZJUBpP5$TLAgFqIu$^lbTPe1eF)7ZmqP;%+ArM3amoI37nwk7DuCN$6Yb(*
z9z8{z0$LiUuoeDCeMjN%meQF7KGmmBnWq1n>xFfL%>nZnMKP?K)xC<M!g7A5gThxT
z!2iUP;wKqFR~i0Z#{Tpp4bOx~;E|v}qi||9k1K$hTolVS;iDz6q4?Axp<(@ft=MXm
zn$c}p|Bxl@ougn5zm~W*=i|49+}93nntOqr@o#*-gbx?K0R9JUnt}6XhHw>grT4o|
zSE$DxAuT#}iO~BGruX^F`%U}<cemFA0UeWxaSTR}XIby#2vjnz4LCGvH3*cp9XQ>E
z&4&+CFZw>SOgHhB>Bmk2D{!Th?YE;C!)2l9safX#Z104b)4Ab<Z(3woLc_)2B*%hM
z(=$i|4mJHzykFoc<Z2sI7q88@#NcH3y++^AarJ&6uHRtMjH*`@6%9)|AbwT%o~<a_
zg&z6!MqUIv6NbzK2R&dJs4E@9)J^$tAu_yakGz0xj;-%Q&cRye5NNnj5QXyBLKyy9
z2=ObI?XJ>qbY%geyv@<u*LLo6p3jJ{yVUn$M5TNv6d{Ckmb>i$ATT+aAdU!mpfe>u
zx*P)g^IUA+l_(W>hYZ;JdprdvYy8(z1pXJ7V)B;VG4)f+p;hk*4@>p6flIr<0b0Qy
zsAP~x79wGv&*k$5(YulE>MJV%cUd$)qp(}zRdzjstBvR~>SIcabToH|fVt-@=1YOM
zbdYl52o9&=<vLV3`g6b#`gB}uE01ox@u5H&+o+|Vxl*qr)-Sv(lpIb#3KcA176>?j
z-(pUz_E+QAF0bs6Zt57FUfC-d?N{>Jcl}iHKlJr|!9!KhZ+Un&$lxANf0{jr60mKm
z7>_BUT4@Q+0HG%OEsPDHJ|L>qjr=?cdZ7<=dKfVfEF*}^dsU+zZ+tdobi8+{+CPOz
z#dw7pg?&u<`+*`-mJFLf(cys-(%_HO!vgCG?&lBWV8uy5K>Mhi*6R))hs-YORyKOd
znAO-5Fn~a826Ks_pDH<iS7e69oHMP@p!zlo{p82ErLHP{=_@F6g??(_Zfi-BJe+Er
zk29Fwn2VMi%CD=mTxbPP{(I=^MJs9eZP^E0jzeB2*{#3FR1}_p<nHs~-Rc&`hkWWy
zN#Sae3bvsAqM3Jyd0Jtv7woLJgMS7cd1AYUn+%>#P`?vsWLaQIzAgjm{%F{w`*O&p
zcuix{TeUoWCUbY&<`j#U&^!I?!`a>O>MxMig8s6{TQeJsY8p-Dh4S1x(P&SeCzrdx
zx40zJ#cjsHM>zGlX@+mAREsmvbA9u}_A_x)Q6v&TtE{x*k$=Bv*cd=#ucqDp^+h|T
z!;>c*Wv-<4kAIG?tVcg8dVU-I0H}KO6F41tIHta}^NC@l1eJY=%6M}De?CIoceH$q
z`)*DRcDv6y<wunxB+y$k@B7L5e`|gX=cE@HTla$V(U;$E9{LL!xCjNfMDo0BBQA%^
zS8|mkAM(@d_2WJzrZ-wWACd)n0=OmJP1*u~OwwJGQSE$|on+um_1hO0^S8cRd+~l+
zV;(gbO~oDm=kK8_Pd)VU<Q?JV&-=;o94Qj(HhIHcy_08pP4rO&wD>cFca+G^`zv+Q
zvS<kYyzq@<VI|H%hQM7Xm+j%t?3q&CCSE6FwXBq+hg_Rv12eZAONT?V6*HH}4h|ok
zsxKN93#*@;BN*JfH!|=qP=?1nw<rhkXXMzcf`o`OyjchKzGi53%3r%9DbmeqynjvI
z$Dl~_BB_}U7xjC<1@)K<G`~b9XFid<LN3Zkph&^~XY0pZK2v?ad8v_{fbHcAgY96O
zR<;sEJ#zk>_w9M}d~<7Vv`>Hrxr@#$uDMQ2`Qn(>i1QaZulS#e&YMPd<_!sZdz|gK
z(>P1FhKa=oGzsgBtw*YK0Vf|TlV{DM3y37xx_Aj)tKKu5DYvn`fM9B7r`Tcvo1LSb
z7pW&@ic2xwLe3cYZwc^qgA|Guk6{OA^@L-i`Nv{y>fX7qsZsfMpB=q`7@5s|)uZ)V
z<+~8s*ibTuXm;9s9(L4*h*{z%+=?*D18pel7rw3^rk_{&<|0<zC^=>6Z^DD9@Ur%C
zXNpQy1cJ9s7qfzs&6CzMQ~m6PhidQfo14x_9ONzV7Qe`DoJu@-<gNL&nFaCzX!XZ9
z+}p{{l`G#o!9|)tl~k=%Ot;5VeuI-H5P#x-+l7b`Kfb-_4O|_GJFoh@kHG$&d!VmG
zQ%@Fy0IdErZ#HGglFpC5^lj`;bh@RS)b8i4L?QGc?PIQ-mxqs1#zgk%-AA;w5SFhU
zCtgp3a?YgOT!6_K`ePF}pUu6B_zTl~0*`J2e1dJkb>NJm;aAzx<dDkCy4CES=6-~!
zN0A!NUau~28G=;`^oq=$E1&OweyNUeDKy7<00Mf&6mG6pJ>icmOzAxDeD!rH-owWt
zeH8fNtC4vK-cr2YE<>1SJ+jw1m#K8!s*pD0RD32Aei*08zEQKs@$vs)?>(TR+?I7w
zKoAfC1r<pmDj+I3g9JrEP(TDFCy|^a=Ojr4L?q`N6bX`%3<3g8keoA3YG|NIP1A5^
zW7vDG&D!Veea?OF-uKQJYpj7y^M{&MHLJe*s^-r6Woj3Iw4ce7=ziy+J;)F<rR%z1
zbcye7;QMaUpDx<!;s?Tt2k5vI+PDd?uxpS862t4X=I86DI8~*+7*riZhwPL&$AV8_
zRS)J|_c?<BWlW0SsNF={s*BAm5)de0+%+BpOY-Mb9{nqIY6A2GmomfJVD&qBIb6aW
zeElwCb@tc8e5JX^@VBf1LR|e%5aJm$*}J=#2>cklSv->%KEJ<Z<T6B7XuU&H=zi#i
z38XOrbv<!0K$dscUTOuZ4061Yv!azgIXp7CqL@}(Kt^BydoYKd?mNoxWQgbH1wAhG
z%QIkkKE}x~t^Z7f!B^6^`@jsft&l7ED8^yJO_hwVSxHa36$#XwjiLJ`uD&plOD}v#
z?YyX_`yNn{oxxNrTtLO5e@5apz+#g1VS>_uI!{Qh^5{@}NK`2DLO8#B@9hXchxCRV
zfbB>;G|In6RFhat8}Vpo2FrsD)EVgiuFgP9(d8hBQ-2O*`(}5f9vZ?7gQ6d-J(DGP
z)yzD{S+RyTS$-6Z2;$MQU!y&ho=hgQa|cc1%bCu$ty`MXEAuzVUWs5-|5Q-sQr?##
zhZ@|pGk>u*T}BNk0e4s9Ww+=H5NpM>-`W~Pru={inwgo|el^&9%Y}C&(`6-=#w6@%
zPu+Wq>&~8^mkoQ0dCmsI;kv!^***LdpA}w?>yH{gqD7M8GVk>Bg>IWMYWcD78~N3@
zhAj;S3*!^7$A}MFDUorWsK_LwGigYFMEE@e+Deq5RlJn-zV?#+?(SXFyYLQvJ2{g+
zF3HTtLf##5)%^M7m?R$f*|brpS?G+KBy-FT(e`y_R|PJ+knOSPuguo3I0ggl+(d{U
zD1Y^tAw5|Xh=rK)r+xBV{?c}(Vf7st*_P|j-G_D*Z+n!O&`sx_B_~C_-1H%<j<8E$
zSDTCL>0}VQidBf7Wogx=sZd;byKj4CHz<&Z`yN}acqPYYacLwi4at-6oA|zzgA9WE
z159cT2i~nCo2~qIo)OxUFDZ=gMC~Sbkn2B;wcaboU6>@k<7g8E;AZ?xLP67k%=I}1
zsDI9g%R@=p@|If~U&6M1Rc&ib%ScEqYA$YtBYd+`i#jNzVPQ?ZbtvAs{vrMDlJ<q=
zd_1O=$I8)97*L<*ljt?A3Dj1l@9Jysa8K!)m4z|W5BI7&*0nk02!6bl-%Kk4n#j5;
zxZaNSsBS^NGxw4tb7iuTz%VuA2S(xS%%zSav%CHBZ=mQ`!qU<cy@48Ot`iSt!UXCr
zno9gV#4h3SUxnDu?n^Y`Q5`wbs6qPleG(G<53S)R8cxH=Xb+Y{S#G=EoilUNqp1*k
z$o{g7sQB`u{m1i!h3V}AXmuQ$HQ%J$Uz%8-R(SQ`(v~bMs2v3ah4+5r?OoSBeZb-N
zo|bY^_Hy9da$_HrVyB!T_byixmHlbzRzc}|B8Ja{3z}{Vv>o~{T+ycG?wAj~Vs_0{
zezIGRv7D5#1Pk7Q4}f*vClel*pSH4{z7Ns`5T_~!S<1=4O}P{!*{*QYztr6IU3~R7
z<25$f;4MAtqN#RyprZ1^xW5#iV#OO3$$E}gAeJ*y3?Q=<`@~oYs}vEbx_i;0DEIBF
z?{te8Z>|G#uhofn72*of&j+|L4%I2@m()2LA9jLI#K+N9S;7K`NkF9PtcmS?YQ`hu
z)C)mz3?3&@Bt8Ag?PT9$rrSnc+HVC3Ut!Oe6j}-J4;EExfy%}6bC(%QQ(g6jJ@07I
z=~KnW56J5Aq(Z5t1;66q3#IZt1wr1xr!>ma$2xfPq&-q^kMLfuB(pjWJD;yl_i&Un
zy%v|Q5uA)0>1dss)b81<2D<L=QJ;Xna<hj7GPhS`iX<yEfy)-!cZwXoaNO}m$~!H(
zsi0HSQF;*?6V$D5*F`#wpsr2aKN0YoN}4J|Zk72LagNNk!8p+QZ$%2P4lqsolAW0N
z;>+waB$2~0aTC0+I!%afp|)R4qB8!7a!-3G%Qy@<I?DFe@dIl|%X8TUPICpKN%=n&
z4m|wdT93HQ`R~*t`lQaB<}Zy8Z>y`z*mBkN3nRn!5hleT=aXL)GLn}SVljH`c1iY3
z`neyWt!JZ{b}~T0V`6xNMR*ZmNEzyZSgAtDV6vlQxU0B|fr}<pR#X@q9?<Jo5ERK;
zMz?wAttzJcog%m=f~D-vmlr_M9IrljKc-yw9qYT31l>u#4m|IDad8_kz$wka1&+rW
zi4kEf^9_O90u;oGgby0Bg679^Rs=u}D8E<Ie0K#o`Y7oPX4mrYt)GslZ+mP&b$ddf
zgF!mv|32)R7>j|H9#etP%;x8P?9OQK%>mF09pzlPhbwgK>IIugLwmD!6GI`Arkvn>
ztaTel5}(z`J1Nd{D^Js^shm@m-G*S6gjH}<b=OoA9$v*A7D4l%jH}o@x{-#j<x*|s
zJF!@p3*jS@d~8c#P5^N#ucv)!$-K8liu@M$ZRXwtxklU#j3dG2K6jz?oTjf}&m^+L
zl2!iA?8swGu_hB!tYIoQXFRcD=G~F0I)4_MnNsKpSDb0!J8I?|Cb=9PrAfor#@jE<
zLf2D7V2<*8{)!WsEZhJUlGMuCd`N$-4&a?c=lK4H<M3gH*?4~i$b?hQ^q?3zdh~2l
z?FP&nVw+aGT9JQmcE$7*@iy7XyoV9)Q1ocw2ir>|q#q2z-LCNT1P77LNEAHVo5T89
zVA#|7kI?Lk5z7iA7)=(L_NMG(4i>KNqv7W_>d(<II}GYqkdg>5U%GIl-%$+tT^Aq~
z9d;|jx^}Qpv!>=|NQMk`d%_7neUXJB3q$clq3#LgyRVUhscE;d17a{Wv*F(Td1Ba=
zoTrlVNuG)Pri}9g<Q;yMBalGzLp1<IQ<8-F10cGK-%eV$9(PnBWOxXc-AVHDcIs+a
z+6nH*&jo4JyH3`VlH9?rie6l%Q*SK_9+)%@H+ZZW_>4qzmi_Wsmon@(D}7Cf)om<6
z=W|+{;wvChB%LSPW?%GZ5OUV_Pr(-)^sm%GNC%#xl2)RJ)W^ik#KdV~{In{LKxyC@
zbJAmaJ^b5GFRz}~0SU8rb8h;zdP)$p<s>KPZ-y#$v%l5I;vjq(c<S4%6O{sqo<k1o
zab9joB_~{A<Z+-3iwkZ2rBm&+q<d4ZyyE569FDSarL1=le}n9L*`IK$`5k_{#+%yf
zwMPJV7TaFSO{0s=ti4gV{1SLCtb~J@{WvS1*<~pysc8Z}$ujAe=Y3>|ul-Ezv$J7`
z0v$0t*~2%o`^vs(@p?s~p4T>kNWf6RaU$dd2y_*s0&p6uYs{{|&F4`&M0RpF`@VP0
z-dNcU<9|mdB(d&E@h1VhLR=cU`M&pyPZ^$I@a^V4<Mxu^)I$60vRGhA-Bm62xkkhB
z(g@+pXVrJB&yHlvER3xnr(l38L0XK#Lt9Y(M<Bn_PMhz7GDG^ysud$Ew>i_MD%E*V
z?Uj9Q|M~2VG?@3JKA-;=u;yPthq|0@Yx3#5aN4E5z6hm-qNzQv64x5jIyMk!$dw_X
zvF$tq>bkN*E8N!Oj`PuTZIPw6rhYe8=c{ef1so<lREmwm9Y@qyFMb@pAkER!(*q5W
zOk7(j6Al03WQ!y=v+r>}JV0~hjM(okJ-tbB>f{zZhD6|ldjTA~J+Lq%XUc`Y!j_h!
zS=IeXwW<kL902u0H}XZ;hK=u@yx=UtgQ%;$Kvv)y&n^2MliuKAomi&Vmy9VgLLfWk
zOKQ{N$MLf(<IAnznP+*%^h}*}%{BQAq*6G{@(@Z)wTL-Wms@eoJ6}~1CtTo4r_?O*
zD005KrFi;%N8$}G1&SG;WWrimjGqd>{QoG1O~gJk=x_Jf-t<&1=t=?(jl>5WM^@6>
zi{y40$Q&ocgG8OE8^yuHuK+l0bul;NSx*7hL7p(1G7N0xvnc+Se>U8Mb^&-l++6YN
z^X>pB^D00+xux~_D{Q>54K`jia7&HXoMfUB%u~2d3<z-hbUFJYoG(zup?vr9>|htu
zHF5_Av1yg%YD<GOq+)r?YH|m0LhYO=Vk$NEf?QAF`R>l<ITNQXlZM>9JQX^P6I{ty
zcb%Kk(Bi6+xs`zZOi<<B|9=S8#`4H64riG}jYM|qNEu%qE(9NZbJ^=jl!f_Jf&)3i
z?dtZ^RoN$6ldIteevqB&LtQ%5W@Oy+gu_aMaA-NSLX@3Ucykcq=A7;b7n)EMR1&%;
z1{j3&XOy#upkvP+cf`eZR1Mr!jFDfZ3*kwq?ZW*=z9`$G+e-_uDJfM&kixXcW$f1a
zDS(y6Zg)4A8u6Y#ang=~;j-)?1J!Lg)4(EX`VqyABbP_sdqon9^a&1E=Wz1NM{q#v
z+$~taH80!!a#C<mWixi*b<;=hV1j|curyYObB0C}FOy<GZH8E8si4~XzKJ(A?CxFt
z=R4ds!nNs*ZC9C9751)TV?aN4qt%!Cxk^5^zBK%2b&D_G317ooP2~uiX+T}gDk%i+
zZMA3}vtzJ7odkGjBEUmKaWE{VW9pUyvQnL<AnQ*s<SKeBYTJBcj#Jce;z>e0hAC6s
z&?WbTh?;w_C#~kORzDx0a}bXC`<|NGZ!!6pUtUJedp>uMv3C8(rI*o7*OFExu*gg$
zq&lzv3BHZv4KrX;tP){~RerurH)vu98=PzS(zs#%eg8TjdwtsbK2v=$VemevI-eLf
zxNs$sC{v^In<VScVnI0;@t+0h?wX$ENn&>e4Gq7DokJ#aCSzSgN@MMMS9kT4*i*;Y
zb*h+NJy*hjegeKhA8*LlRilMvR#um)CQywRHO6dC7a7}WJ0M#h^E=+1V0!-P!nG{2
z>RMNBUn>^}cicX^2u!t>_Y&A8urf}?1qe-Hp!_FTKX~25KIx#g>T3zR8zklN-%J^=
znux;f9U~BX)qZ`Evhh!qhaO)LYkeHZ%w3JNt=1kFUPoW0LlS)A{9?2C#JZl4DJoP}
zuqDo6+8=5p=Nv;xP2C3hU>xVP^Z{BjV%}D^GF;pya^B8X-!z$Wq-2F%$z|DzOPI%~
zsVOp=NE0D#{S_KiJTh8pQR6t7ED7mnvX8n-I$`)$82U}tVsf<@xwEn&953AEg9=U8
z<BJ$snA)SZ;Mf^O32A+&tDLK!RG7)D-bO*cOO|#hTI3O^veWUu8)m?{l7E@tRxdat
zZxU9l6<PxL(sY?y%L6fbZAz!rxhJ4^Xg7oO4MlC&iEnMQGf%)HKbm#91}|=-l(KZF
z?ym!E7jVdE?O5qfcj4?n{jO(G2=uyXd7gX2tEI8w7{u8l{Y9cDll%;SI=x5>cf}Oc
zc0EPiN{0e~HE*tl<}YUjowd4pKa%RB-%R8`a@`T}-h;Mb7gIky-Ge%*Otm${eJ^qo
z3GtBr{P3KnIzfKb@I@oOyU+T(E#R)cw2HCbrRhD6uJQ!;wIj3O0p%Ai+qG;yN?dEI
zI-m38!M!`S^=B{S^cuu_hm(0Tbuzf>)No)oFcg2W*LJkK3;hyerG49)-V)`v&}jRb
z?+SpD(I0r{OQ}yKpMsIiIn8E{kdsxsaLVYcM?_Z27@fI|H_!d9LRxDxazJeNK*N@7
zTk?Z2XXNH)ywoLf_L;66OxEGKe5Q5lx&_zx3;b0-cYKmnu8~ssrVbxXNyjI3f$uNg
zI0k?udMsrgt@3f(yB}RJq+1U#bfTL4^tujTBh#C-BJN{X2xkVZe`DydF=qr+Q8JBd
zj*}LIaO8?K(cT)8W|++3OYdW0pLzMf6K@^UIet^rWjZX#Fxg08!L!BKWrm3a`|tM4
z^W=nvC;v}nrw?DXmXe!@p5?&iA{nE?6jVVeLOpnccSgppYYtuD2ns<Lnwl$1OoyI}
z?38y#&kMsHIeLiZT_#V^u^(=*9lnPNt(MJTPA}DMYL-M9(MpMz2MIgxL}%w!eTR*5
zSQqkCIhzh~A~t&5I^%4n2^Xg(L8n;}vcJ@VJy>}A#Y82!oXZ!-zMGn(eB({ErFp0j
z$4O7glfG_^Z6#6jaW;4LHDiTcrZ%$M4_r}@-GVu&Mx<s~ODrGAiRA8;5WKFv%as3)
z0#cznfAC^^dpxvuG!)A8407A3dTIW>&&x||vp1dU01-i7MCVKJg_W9JECm2hlOMs;
zCw!Htug*%m;pGVvJ-qWV|LqOzRvgZR={vcP9iTQJT(<_X&7*b&G3ay^K&N@AKD^J6
z*llHvMvQDz7N8v75sM5G8^2b%YV<&i9Y)r^_F2SDHJF-SLTb_PD8T|W@W6jY183Q<
zZvQ_9=WqY|hCv^GFvQfBSGp7WEKk#a`PE}kVG#}-rO?F%X^K>?I3}L0jDJ(~>>18f
zAnk{i0a2mE9hK<!DKbH~M%+>I%97z&ND0DkWyOTeN84BAu#z9`+JNMn+SOP?rY?hM
zveZ}4q!j2)S3dlf;`#rw6y5s&Yf^mw-&ZY>830L_Q{C-a5oC*8%udZAIx2j#LkP}I
zcd+Ky{!~dr50lX#)`Q(g)nC@(g+C8$ojrk18q>yl7~%fWB?~$)GOq%i%S<GTncks|
zi{sX+SrRPF)?OFxXr{6D7C5ZrVpr?Q&MmKg`Q1%K$F0sKR=A9*U&{{pwAwq9);&-F
z4vU;?YZ+8!PpqRC2NB-cGs+7f!lQq5c%}>OVcj0Xb0CFK=s`GpAUz(O$GHB6G#7We
z)aq5iAOx*Y(7ahwPE&8lq1Zbs3s)|q3H=S*!B?Sn*FQb_@D@F2-E}5Uz?;RMfu1Yh
zIcDuMuX=0P88hSD%1PwY?6)@vVU~WuY+o5SR|9o-ik=Bu+ng#EUw|wIoH%0XK2c?O
z)M_@)D^P74mf~2W4M+=oJQ#L=yi^<~(?zd#!}<9h5AXZx{0G`%Z3OIeAmCuQFsIWQ
z0HyxQDnAj)QuM-pir>|?+v1VV`BQHQCAF?knHT{)`)LOT&*sKqACVhRx!v^nVc+UE
zEv8o!-^#?qHvvdXO)iucHc>Zq`DwY8b`+>uHn_VM_{_^?Rm$W6CYvGQNfP_y3*P>8
zOSg4OiUcwfA9|3Cp9zy37)&>|e;Jdcp_LdhESgq1Dx%_+iC%7A)qL;F^0je;hJ1|8
z>t1Q=2%ChfUM2m~^_+DdGC<t3U8|NUw=Ib-GUM74G_8{oI`=F?vBeE0VEB4~raq$L
z{X5D*VVPZJYF0hz*StJRnrobz{{{K+b@S`VvY(9o-qD$fO&C!2a=*?a;;gpFZ2&Ug
zY6XnScD~n`O0Ak<%WA#l-cs5`RQ-)}=g8kyKdv9>2Gx}8I7~Ig5Lde-vGTrSpl;;H
zv5*>B+?o(ePv4`hn$hk7bB$NSosU*?wd^M<?)e?=y&&pLeC!yjN!iTWMRuBI^)3qm
zxo9tFwJ<trwV<t}zaE^6S&2z7?Xg;<eE?k$qRb8_nawF3H<lI9Tf1UG;-tAVl<ASD
z{P~J#WfE-JqOx(+8V=WYE-*kqWvC%_AD9c#A85JkxnbjjcnDGCB3t`P&4C%2#n8qa
zbm1yrH2x*G(MKbVo0T0R2yR3m`P*jG`!##*aL8s?z-mIR{HEXltE&63r6g0uFl_3r
z5S&MJZ@tqsS1Ep-%zBzDA!3$gxa$@2$_)(bP5B${g@#v-_WRxL=1wjyki*)ZKo&j}
z>7^yq$xsV!@m7I4d>NR0e-x7eQuM3_ZiZJA(&b57P#W7Q^}UvBJ9S?#OpYOIUyb!h
zEK#3HlScX^6M*zyQ2KN>$Lfd0cr)Lnjr-n=xE(|j>>BK(LP^OsWlstG9-7IFLyzG3
zS*OT>dLfQQUt=YX<p=x{`2k@9LB{e|NM84ON5&5{XDSiQ1oijHv+rG{{ToJaVer2Z
zqi=YWTKI1<(c^LJJgi4l%4uj!RVVm>`kZ|{h)BYeP`Zxl$y}}r9)~x5LPHg*r-}V?
zxNa)RLd3Vm(tFVbb)Rf&Ae>9i;zJzc^8)Raol#9F(u&Mys_t{GH*byvQ(O=~rii4|
z<#?CkZ>97nYN3b`i8V(vPrZqR(=HRexzGF0iUewdxR|Oh<sQwMY(h36woZS+ix`qJ
zNQ*$2;QRRy+s}5}spVcw9mtXZ$K15mtjI2XT$IGd%5AghGncUt1Td%^@y^@`JP~u_
z-QsBsb(s454S%9NN=5PbwX{240)MFUxMAu%@*Yv6Z@0sZ@Ie#pB=tRLv4To_R=IB(
ziDg|~N0v-DNVj-y8a1&fD%T+!Y~Jf0UGub|+RH!<ddu+Y+VBDGFMp^>S%8|<m8AUn
zJE+#86YBPFY((IZ#NaUG!=1x}MC6R<fi9v;oHRPtqIyW(vhh5$FcEDE?Q&fZr{hfA
z{mQgI7%C@Xv|6<@{-Q?hfvAXxx!q8vwYqgX50s*2*GB*vr3-PMKxr0Q&v!sZ!*43Z
zV1hq?3#SH_-n|w%x94tK*;>H%9BOH7d*z{cY!0471$qHhjzfnA9GS4Yo7CoIb)#;m
z6{tT`0(&#9eVpSIk(Qz6{xn5qgIx*Qr!9{cwZe9CH&VD~+;Oo{KYDIjvtkFvGqJZ#
z3i(o;4Ke9-O{b&YOzc#*yI;WWR#oMRf(B@<XsAy_f@3nFlb$EWW#QE43Re%<T<2=q
z6NH^BQ9X%vfdV_9)_O);dh|&LTz2rc<6I$`PV?y&?BF!?d`5fC9<UV#b%{F7$L^oo
zN!vrwISkU=<~IT`)%SxDZMKW6($Bzg$M%ViyCKbxw;IlnR)4}mqZuc-8uatTrR+r`
zd!uU)>Rf-#0^rnN>}JrfKiCl8n|r&69h*4t^{Z83k&>6Q7HmY+`jf`fo6jJl-|YEz
z-~}~FQ%j-;gQ@LJ#LF)uj~bwv@|6K<uRq4K|6xU_O3-=k<9Yq9kKy{mfw3n-xdycO
z#(Uc|QglTUzd}qtX7J9ep<P4vDoeh1<L!8f$@3%fPpB$NPT*rL!$HnB%^wPA6<qeG
zyYafQ?oj=WfTH@<r(xpC$&brD?>Woe!@rBnr+D7LHo926URhBr%mgE2k)GIA&Js?H
zB|P^E@HWqOJysrl;y}6d$ZKAxx%?jUdmu<q76c@K!0AwRzEIC?-n;V(If&ODVIT^m
zls#h0g!2qsoL2+XAh<q}6~aNDZoBe2`rb!)&jl)hvCh=IXM5>q-fIK!5bq83-#|rb
zENQ{J&w;vEJ+m}TI(W27pnH@k3O>=^(NMm!VaMxp(wWd}fT2wk;kG)|D@f|+*IOtp
z8WOYEEa7i?Rplny3hO6l6rE25crt1ab;-__VJD?sy@qK{H96mWa;bCnE&EB()@x(w
zY9+eM^^mcBwaU4DT$oF=)KXNO-xNLUDf;lWq4l+l1vixnKmSstkUhxuJ+NU7>7H?#
z*l|s62qHRV=cQ^hN+lzSgXxtxlPIyAl7OxHM1P_**j%$WTUv}t!VCv)Zq`XyaW8er
z$l(c)=o`Y>#vgv<mN|3fY1@oCMEs0;%DI-(WKf9NlxsgC&Wt?*#2JEkx#EtiI8Qk3
z()9U<FkCIges$eA3(&}18O!pmedfL^=yKd7|4=QbW;kmj8e9#!N{*q+nqysGB=862
z=PlL7&z^f+<yQlLu&y3>j@j$@e;XM(M+IXztr>ai5P~W<P*}cAbLmOv4fH+Z3_5Ct
zrl1!&n{C*a2{GjSq|F9a&|+c15+rqR@}$T6x9>oyTq_TpDw8D|DpY?Fw6AwHZW&!%
zJ#syAu1g9~SGcp5)xs!ooOP%0fVw++t7XuKLens}de7M6a53@V1JciZ*YCxIg&Tr;
z=0L-$g`p*CgkPJ2@Ng&*t)jo$!juT3_-eqYI^!q0pX|6(F=4h^jauDjtvNH!vQ)D>
z9T4hTI%*YAzS;edXue{&=3px?w%BBV5m7O?yE$JS;j&ZFBBF9YoF|lNH(UX)ns7O6
zN@P5kuh~0o4f!s4Z9C5m?GA+|jz<hyxXqXtBxJ<~a#yUEvuQ-%>H-~4vfON<=w464
z;ngWoHdID*%x%MGIjVZ&+Yv-3`$IL^YivwM)otojpd$lgFTk;O`&Y2A`#-7ZvR1Es
zdZ8mYBRf{VZK1Vu6_M}S>VCkZbNH&h+#ufkt>ANOw@73P+ULYZnIqg`d70DN%@Gw3
zjYvdap{!Ud&f}D%6(Bc2z14tbPn7k;b(0TC&G*X75xJ=Mh?Rv@Qa*~xJ;+xrY7A{?
zlHgVb9)f0FW1Auxl>35=7-4KYIVAz}k#E^b-Ph;dxuz%=m_SdYpd=h{wLrbE`!DK!
zp|jRE?c~M|a<!fguNO~=C1c8SmH7%(<cyOEZ+biQwOs8yW+-hluhAxXlJ!hYzT*8^
zjH21B6RfKFbG;93ec~MG!=E2p!M5239j1Q6N8MQHueE1>7W`uVZ!7pwYp%*kvC*nM
zhtJUElX46jY{MrK(^N|Bid72rpFU^HAO=aYMp*~W_MPEIWF6`);0UzFNvoc_zKu2`
zceEFpa35=0HA)wxicwFeO(etLz|`p0>Sc`{MR_>icp?<*x;2Dd{Yk%CXED}rIr(Lg
zCz-er6@e%}F5ag82HNodqcuO@f&4Kx>Q+1i$v!Z39YpZqZg307OSzDmt$wwt_=z1Q
z_bsI+^uroV!hBe?w?CSKhZxXw&Jj4=NA#?^j^sJEn*_$rYl<EsJKF{3<3Qni@H<~H
zcB#YRO)cab*O;9rzN!P8<j}}Lu9bL;if<y06XVG_>wDkZOJe|VWzy8+_SD4!ZnWTS
zCC7i*9ckd^Sr-(){)PpbMlPpqKeHFjHkdgk*M1w@wJjjQLe{m;`Xtn_&~Nj~MreZV
zD}k9gwIi1RXTq-@88l7gc3<}~FnBI2Cl?C_(+Y#cWdqT{qUbV)G>E=RG7+_IW?WZE
z<g~=x$yGYOz5K|9uVk)wx@PoU^mR<4E`L@z5JV@~34o(gVF%}^u!qaMEv*m%7CqK*
zh)0TgsIX0qi^A?hORYweer)*~!MpojL6X`3sP874^km7qcPoEuyt$}M$|2O9CKKD~
z{<Z**ab;6Pd2R&~?`0!S+#5&2w_vStVsTG=_SA#jw6fZ(c~b1B<iIZUEj(6Wg1UuD
zS}c*deXRg5ZH)Ru=JR(p2a3_rUoNu!>h<`5%VGXu@m>_)oWm2WUu0}lZYcNoB=+jQ
z%N6=6ZNTE7pf7t1HEYs62PQtewMg4LFr5nNL03LQr5zIq2n2sVYLUTEE_(cEEWh2v
z7V5(6T*zfCEf30O*&?qmx(YARIwD|Ox4&*PiCy?Kqa$;wLS#$!x^@!{0q7dx|69){
z#Ii0oIj!M5rkC>(oz++RJY1L<X0*pk+PeaW2;Q0Swi0xOGS?x=Q0HKezLirq>pRg&
zy4l$a;t16$r*xG<r*KN@<yC|GvzHkA&;{GU5(j3K1+F|T)G12Tc7fd_112yJl21&N
zBTcz!GSs75N~WGtLRCaE<E-eWYEK+-7pJ*vi_{MW=&mS<)iX8XU2>FpC2xr7fy^D9
zwOVbWcJv|ZGLYt~G{rXBky!e0@mjp-Q~eCqCL(cik9bUAaO2K#4K;VeMUxzzNyG$2
z6CXTi2er59`vkeEpy+cEh$U=>`a`v-nga+B^7=%Wy{}<9m^`POe(&Sj9l9_oX+d?&
ze2Mx^dP$lM=~@ySOw4s4SWBV(yPf7=?QHsoWmETi+;IqMdUFM4hphdOnyD%+-XbEX
z7HW7P#=;#nLbx*kHg9O_&Ad%Jx3eys%*E@Tq%O5(nf3GYPzs3qiis8%h!SEI640^B
z{W)Bv6K)j(+k?98Z0^X1h*qU)&NAf$0=mQ9=JsZhZ4OBPR>i>K;OJq6-}~D$Z4t3b
ziHIlGn<0Kox}T|6nW3b&*Ip-9cZ=LXcfVrFIs}7+wnuk`8(E{=ECYx#dgMAqr(Xwc
zLpP$TkS<*`c7uY}pIpBn*PAb`P|#<fObY$f+%5f($isuyOy_pTJnm*%>lcEyQ+5-t
zkmH}yXJ+)Bte}zD-EZC3phOU3=c{8?87mZ37V56?j!P|>@0nL4uke~H8&K%2@}PFw
z_ob9ddstd4zp<7~m>#xb<uOt~$a_9GKRHNVWJajAT}D$7bXym(fZCA*;jMnK*IVuc
z$U5(=@~uWfMiZ0z!SokUzWvAlw5Q0GOH4;Usg~DcN*{~j;S!#oRwIMz<(~xoCLI6a
zhpt<mI^|ltHo)~HX4%L^94<(T#?T*x1iO6QADckO)3vd^GMMH{L_R{S+SiP*a%!4k
zDgqq<^`Cr&Jb_OVH4`j4ejBWe_uAgUPR&FmNEJCyuq(4Q2g^0v9IRg!uGGMZEgZa%
zP`;XIh$yCHfcX{G&OH=Z%eE$#-ubzu^5xudg<(old3)HXUiEf6oI&n6Q(se%Uvy;6
zrVo?=)w?k`zy}M3B*IuaL`)l;5E%g-%hu@5wrZmcM$)}?0}+G~^pjF`nuV;wiNph#
zl2`KR^!h;6HUtvdHv*eFRpH>e+;4WE^!#9flx;nr*9&hr9*KuAPu@q)SJl(le$_vm
zjW(%9HAF{Mi5Vn1#yB<+Hajo#)l@Z)ZiXI8Jt@<A?to~VAIdz>hS233sv%gTKDgpR
zt773EGTBa1BN#og`3kAG&D=6yy=24kUXH*7xb>vhwa>NK6ZNMPQb2FZ9qY--I~5LY
zts*{d-H%3^+YkW;i{-;VNL)V$1O4j70sp+{hO;`w^DvV2GwCiRUt2^Fput2Sowozf
zMjM|cWp~=1OBp5nYFYa=QR~NCt-zC>IyG9n=fJYoZ=?o`48umtdq(X>%zPxbF?e*R
zQ-9%pHP})uTxO`-=OVStEu=ecU1ogXX1+&=nAmONgD^y@*DL1H?N8#jiyk6G4Vu_5
zx$Wv$LpYkXozVO9q88)pZ|$$?QmDW5EQiLJkfA<gCU7o;DXXv&z7mo0F?HJ&V*OUu
zZ*4ViMOUv|_fux7Nz5QMT(|YK4kCt1?epkF_t%1;DMTHsu?XbhmsXnmn#oB`Nm|>o
z@--fV?RKN*wJfar`xFN5QpwyIRRXSVOH%V@+qFGgZEn#?Sxx(|kfk+STl$S}{9i1g
zYn%sNcJ^Y)oPTZBmFV!B)w*`36Cp6?D&b3#gEQ~l(u4h|-2rQeJNsGArUI1)yM+KM
zb7JRtrb!p5CV3E~5gOLH#Q2un|3}mMPkaLPs(pMbimrDTC?n<JtOIn8qOM{coR^(%
z!BIio*$GZ|IgG7AQX?YWk&))A8(&bX742LJ>w#ZoEk<895JNu|c1V*(M^?e~qVMn7
zk6KDX{kQnW9a05m0=YOv%&1r8R1an|Yq)EWIj&#O$>PyA*#n<=EgT!NSIFg>IA<JZ
z9%=zD(@@n2sYQugM$K-0AwmIiM42*7?1pPLUvf@!Tq)0k#WvK+9nRY!dbd}iC|$oZ
zGsVhKH`FM;L|LqImhSH>K^IbaqggT&OnC>HvMRJl%BC_BqvJ>H8P~gsc4AjOuaS!G
zl_B9K7MoCJHiult^#ECYrN>-E(3KR#PBlU%8i}c}Yt?KBwG6g&3bj;jGStkkbh=Ev
znPtN-%dDtDm~pwUUye5Ab8~4kgAUXnYhEmj7HaAz927-str=R??Q_ZUcf`3u7o{$l
zVN_a-5*y5dxtePEYly|)*~vdz&YwT=%q2Lz^$I!jR;Z&av({p$fT7`P5rGKTcdF#_
zRill>{aGe1R`bv0s6wp!d2DX$0nil-cjxc9-Jjc7D<JAli|Og8k<rf<6K;sq#QorM
zz_Q^ql6Bbo42@H&;^vCr%iV`Bw*ybO=r=IZxM)$m+lOR^azzf^9}Nw4+aF?z*VaT9
zz$~SO_6G)XL2TE4t5z<!!b~Y3`$LC`v2m-*!A5o{(^7B{8yDOS)hMFaBm8(mhHpaO
z&AJ&<zsXm5Q0W<fUZ)1M=J}2>Xq#3ddKq^S4}tM?gu1P70me42>$W*_C<To_c&`9K
zB=RAYC}Y&w5BEb8&1BuziQeBH#z@7J6GxR@OG0Ai54*sxX;A;+hZ<)uz5z~CXaBn-
z-Aba9TelQbG)48A4>U|cmV?c8@nQRLu?b4q`$FA3lONO#12`UT${mJT3OKAKQPR<M
z2I{yV+q8HsT$j~2Qa9Bm_9DtBUlFB1OL!Jno!t$p54{o@<zm^K?>Y(|+D;t$m+u_l
zqq{cz2@!toYkQmKHSwBX(bE)FwQ(D-40hUeE*EJZj25nhb_FLok_jTR7l6T-u9kyw
zRdb}{E}kk?PT@vh@X6E<icQ*cH7X$8pDhsy_LZJfp2OR(kQ4jcm#jn4c!ZjniTV@}
zQ6(bi6g_B%TuAT$r$ctCQ~rC7pa9qRdEI`d$QCoAdZ&s_O{Mk}%d5@`ALzl##6b=c
z0sLuT8%ycvbIpzSkuRFq&A%)%BHk!f;`A&}9HJ*;d*nogxgvOFg|~X^?;kD-Xqalb
zt`GxeN#cViRfulBD805f?i{r;0E>0kF+bdjZ`t43pJD)LWV(Nq*$4?@>t;>ppg}y?
z#Gr)DOm=R%I|)_#R#rDeVJpQZO0nq-a$9UR--yR|Qxl^PE0(KYgk@Iqjd?wsOfWo5
z)Y|p!1h8&wyHB3u)A#mWP3jjQnTb%*YSVJZfpm(k^om6&=+%b9rJFj1P;*eDX1bLX
zkZ1+$yZ?eT)~kL%8s$SHBla*(Ep$_Hi-@p}$em<jpn}-AK#j33ul&`%_h;+<qp2Il
z*QRK)yRQ@v#2`9FMNbS3DXClfs8qX@(@j*^=apleDkAaFrO<4Ix6pE?39`@CdAkSW
zU!yq;9?8l^h<vEFuo6EZWVgzTPbwP&S^;+M@2_t0MWftzUUD9El#bvb805O`LoYeI
zWS1}1)FeVgXU?lZq?i)k4MsOE*nLI`!N?bwoFMO|h|OT5#m%ET6@Cz+1U^L3rpq9k
z>lRg^!OrT7-7&aB>Y)jq+2+eU*Y{{!5Oc0>b@#~fFp2Jby#`MTD!&zVIQ(>iOHLT6
z_<s7;K%CKAk)^e-cGQQ+MvE9`6a|@s#$NwGZ1_#aN@SmfTeGRVaWjO~xpExU!N<|Q
zTs(nFc3i8I4CMe*H6I&dvPcq)Xi3&)e|PZwr!5;}`dtK`_p7wWS&T(7k+yEIaD*qa
zAhHUg4uCp+C#T{4ks5TY<Fr2$hV(H*(N=>RgYzb$VFp}?u`8(3$~hKjBb(dja(Fcg
zQgeu^iOo?fjiEy?Nb0xHfax<*oVENm3-2t6ns-)*bY*X^FGA<+IQZn=O?>VVrr#fF
zYPZZw*PVe1!yOttUN^Zc-aIth9&}hOhOqj&kHoUAaoDen>sId<o4j}URSrMdlr1z>
zW12fwVHX<|%Nu3gaeM4jp<J4Mp3z9>5rlSg%LWvul|}>&+zC?_FXh%u>05WYlJ4$X
zpwI)+Pj4#iu0$O|z*MpLl4iO=rbUFR2#3zN&AOx1!Ls=-a6r}gLuQ?Q4G?NAck}1-
z6kkQ*<(-_FW{%au&7{%P?wbnM6KGNf>oH$&4A#qUKzXyIz)(|@SD~@T$7Vkww7>kn
zm@e*xtyhkc>!^vtY5^3i5FZEK<tOq&WZhpbO7fE9*EsueN9gv51>J%*axO9!<1y&?
z^ZW^qHtxupFIUNppEsVW$wJp2prhA+VHKRZ_nTJiNA=vS5IKbvu<1h{yE}WpBkDK9
z`j^@GM`$b^wp&oqgx2ils5y)F&V%{LXo80;q3cR{sz!G3ag&TpMlMu`W8cGeLOD@h
zN|P^sZ0c^sLp2tOmPGxBT_R6wT1{Aqpc)B){!@2*Z-Km!d1YO>+$w#@ebOVkq-MXa
z4Sn}314X<^f1X;yJ7nXEeGJ&XDEwFWM%k=4-Tbdqh=b#tZodfdAn3iCgooHFYx%1@
z=br~-Ndh<lZgrL7j$^h1(bk>uu2lAC$8DGUqd_Rv^+~0$iB;9Dx09~OaJ+FJBsFU1
za@Rj&N<r%GGji>{vvu0A^LCzFaIFohLI|s1u%jy+CA#Xo=P(TKRgmLVlXWzA%KE<2
z(!y*#79`36Qp*SYxf=Vf9h8~T<g)y^7Mcpeu(8q!m-UTomwoaCyH5i1pCY&CP7y<F
z>nc%1*h(5GSH!NaTttRSfeoZ`-F7~Tn7UsN`bb75x>M8c{)Q4Zr%;aNY)C9u!1|Uq
z@;3btuufY75S!8(Z=C(3JN)O)^7n5I--8`($8a1IX0jbjvq4DRcN;{i-8Y!rpNnjN
z4vuah6}>&QvpW+U8|=233Kcz=5q;0Wn}CEE?77071}Y$@P+>c{n&y^BnbQ3{U=@Dt
zvvntiitO$n37hG3I|LEjg*J=buxjl7V3-0Fr1%wF0Xbs|5V?^J7wZjcIhx5a$SMYs
z-`_70g5=UxaN1rRiF95<Q?j{-2<&AI&4hLi-y^N5o-s$v#2ya#iHumefE;YT2Y2No
z5!4-y*U7`?_`M}Ms>km8J~7|;^VRahy6Vh^JdM)+IBV#leoxaDC0$^1f<w2<@`&iS
z+d<<j`R?0NOi@a4ZXc1IY;HY|XycGR0RgPHM`)@Yp?N1wOCdFTK_-N{3GN$(?Tc(~
zcb;RiHZj~*jIb#wgMcpnrJ?@yuWaroA@C3yJkR)oo!{((GAl5i%ywvdY>?W%2nUBe
zmHE!<7&NzHl~c$L#;&WY3l->ed^=QTsh@25K>=UL4&&ym8twO|7YHj154%g%A3G+y
zR703b%(=jRx=Hk5AV(u~Vl28!cb*jt4WQM3j^sRiv6*i7-34aCDy)teql@yp<OGVJ
z10xfLpdILW53dM(ayHFzf1Rm40aU-r&~rZRv3!GCG|D{e!Oqg?ex}5YX3HuK?Hb1(
zUr&*kqm9EBlMiWFZTuby^jn|)Gd~!<0XoNb--=+yW%Z#_j28e4!n2=&q+48h`a$?+
zbX)FPjYqyyyD<XaLeM?USm`rn6Jn>s>|r8VH#7eo(Z3dp0XNMwx|P53%RPZ-c&T1G
z#5C-VZiVkY=ycrXg51>HOF5Zx!y9vpTc#i+uE`J1`||I+rl<U6;Hy$!h8g!efDE5Y
zfJd(>f|ZAyyv;-+B=+hWLe1UGylQ3OQWIXDKo5;;?-b6}qj8q(9^gSqvC_u=!=U@v
zFXWH|-b(-3n{{_Dzl5VnK{ejx>n)Xnuaz5mPG9!#@@FjF0q}z>c(n-;UA_Oza{c3X
z2r&0xr(5|wAmqQivlVGqbA+9`_G_N!J4PToBdWhdK>qQO{{E9FQt)=7biLsUKe4b2
z*dR&N!o^o%`8{C#U$EZVcbM0u7Ztl9_w#xZ;b4h^mqHZ&tu@Mj37p7&y+Fj$y`R_f
z#TW!>-_&D{W0&+l_%Q!Eu*UtA+c0C*pVu2^0^(cYdUo>PON!Znv`7)(HGloJXAH2s
zYDWHY|G#!^|3seL5+LlM7XKjj`#p@n`Xpu~oBg`MzqE6CA~A-AxT7KPGYJD+MzB8j
zU%u;0`FA|SX#w!MbQ>qqHhu!9+KL!?W?d5K13>G)6ek~jnaB?;CR?2D2iafO%fhVp
zV_K5)KMed|ykr1ohh}SS$j$iqzW-yq|3umT{Hy;l-v2S)f5D3X$9OS2Zy|R^Mn=2m
z3H)|XFZ}j8F9m&L<L*atbew)9v@!8%zYi<;li&6Xq0fKOLI%QpGA>?T^9UAdFm09v
zGjX<XyE|l2M}!DeOp$4MqsM#IuG^T}1YoeV(^=pDIiLaiY(DM<)GOrTqEVqe+^x_6
zE>iKp?aBO6fc9rw2fI`4mCO02LuD$(Rz51_R`sk|1JlS&dcfG?CN?`hX0M&T%zo==
zE`(*A#nO|XJE$Pw;DP>;Ox=~?s%Fr&%BQpH=4FN4nA3m$JX(cUM89cN6m>#@FE{cp
zww&69voGBRUbc#`>lj<L(i9zT!%N*Y)@nT=TIbY%6q5T=!08R32se(*d2>9Tm~`W(
zM4kp`L4QB~y(30|{g0mh__gS$DE4e6nW*zO8Q*gpVdBT_(zn!cP}?hffJ|9Rw6Mb@
zldD!S3{u`3pDB8LS0h<6Qgbx_;u#Wa^GDghu{j62sb_y}*q$eks74r=EVBg8Ejwm{
z;V8C$3~xe9(N`T)fILdfFVJDzCmId_$Pu34TJ30`xRAePLeY-CGRCInGG8fpJnrXt
z#uHhMQH$i%RM+2{Q%ra(0uO;HeU2myPYDDC2S;x$gEJBQ=Zec)<bST>pC3ef>daux
zp~q0QZe(;^+=h%9ziB*B6P-hzyWkP{=ko-QPoh0D2q6QQaoHAo4{rRevc{Bu@d5-6
zTABeNoTn1ZzN%5y^wau_dyC<2;Etv^+OxG(jh>(wtxEIR?M4^)I4Jgo9<M^&a!Jc5
zJrJhvb12^XC3x(I+R1EDa))ac@o4(_7`#1k*?7orq5SEG_A`Te6cBhm(fpVRJ!=fG
z0{ss1`+xC@jdzpUFt@8w?zpkV{L^L9k}H2Bg7&ySb3*SG0}kqW+McI^zn|rgKX}St
z%XjV+DRf22YVG|PMam@cIjA}Y%+@9KKl$gi_yyHmA+WK<Oqjh&;+yf?pcR?&A5%c+
z00sAw`}0`*6s9&MQMTEmPW?Z<Blu@Pyx3lgil4=}Ht;xfM%Tc!g>FB&#^3hx`>L29
zYAeYXrZJ<oI#D{$uzy}GpPdlXiD~{B91AqL)OQn|*r6FEDW~yQ@otfnHelrG@2pn2
zeXdmF7HtL7C#mOBGl!2iA#HwwB3H~i`pxiXpZX~^<(HU|14xaE?I>Cy``Gn$4(qQ|
z)D)u}3gZ9xia$OXJL>=gX*!rK@r!3>?@tX$L+KIMD_;NOV*K*V%Coq`m0G;L;2@82
zyKnp3Q$~ocesTSQ>gYo4_EWlVhl;-5MlGa67l<ETKz>Nx{_z4a*OKytWV*TalYh;|
zDd`g*F0!nOj#3`K#eV;<@?m8~+-<n1Hm1tE<8m~cbFe#PNo%J~V(H}v<>R05q7#nU
zI2-jBjQFR+MdLXqs%%?FjVRjuG?|9(Bj)1;^;w--qAqm$i5VqgEM@-?7LQ+fuCK4Q
zbLRUw+z`fytU>wI?}M+Z&Z^xD^rteq@<u}D+M7gwJTGF!l&0~Au(83%XPuj`U%xST
z-ia-EXL1X<N*QOXZ)Z2L>RhN7aftp5fy6s^3h%hXA*(_=5K4k;*J^iU?{c$<$QzO%
zI!xSo2lK0J7Axfgke9J=&Uj$qUdF;E5c|WAH=pH16q|fZ7xyDhv(9`Qg7d2C){_RG
zg5$n@nGBaxkFAZ`5BZTQq=K=xWd`2IXCfvmR8}0gFd!jVWb(}R#vRP%Yn>!K;PDVr
z2YLYrA1`lf{r%;XHhXyg{ox{`ct?+-e|U_e+dW>xU0PbwYw133C(5@n^i;L@jYOCu
zOb<_#XYuke&wl0`q35HawvBq7gDN9p&h2tRm7;Frv!e;r6fF!)#UWm(bEOYR!s#)0
zOUfr)s|t-@XSoKR{$p{<*+Nj+W76PT45RfZ!uhjQjvgmp^Neyy<y~WAV;BK~%1GoC
zp|i?42}0VV>-|B9XFSBX318G}Mp*kHnMAT8skJ^4+1_Janvjqce)lae`R@IT;PE|i
z=)v-ApDcJs1LbLr6sancij?iH7S1bd8NZdn@TZ0OA(36&kJ%<KkZ(?*a(wsf8m?c1
z>B(PYu<<@_DZgKP2cA%t7RohMv~Ze57C}N-a&(o+Gn3BE^da$P$@~yLZtm8U#<sMq
ztOrhJ!z@B;hIq$nhIZAJeC??xpKm>M+FrQP*qF2N1wPoe;pFg`<hbvj!}ZKx(G#$a
za<@?R3aqT*P4(h*Q&tlwle3f<5#v8vyn9|)6GB6DnRhLtv?@v@o_+fC4ovuw8jumx
zqr1j(_fHc2@rLJaW6$&SXz;FHqc(jvVZr}Z^VwQY2+46@_KYJZ7}1O%Khn<7=BI5b
z;m;&Iw@1q!BvAHg3eJ{laHO6-Lvpm#S6tw;`WMc<Y1sexM*71?)tm8xwqb8+dA|`q
zQuR4bwr8#z;)FLHDC)o-(*~kH6n++;vj*$knd)VJB;r3QbP_v(w;5ZTf5W~E+W^K)
z4D{|{%w&JX-mIYeLeP;7in)<ZIy3RjJh@JSco>=Uet1}wT%)?spL2qjkKO3}abgxr
zN+Rs-?QJcX%T6;JDe2BJnXg>Exm{3s=~9^2anFr+=d!7@N<S@>;#2-?S$1}z;Ke-k
zeoZG^=2qia?vqEtK;8kiIvOMnw1Z8x@(~pkRk~!bOq#8w<*G+F=W%xDAy!A0WnuWP
zF(C4xrRB}Vp;Qyi9dc(CO;Xa<Bm4i;qj<i$e5R!8)-nlTQ#@s}uab}KtGl>9!pph;
ztzX3~wCTt#T^1z(7FuC>{hS{Xk0|nuo=Ue#kNFeDuO}SJW95rZA7`VdB0Yu^dr8u_
znTr2Y3-YC5pP8@!TOeML3T@DebMbp7Hsi=XUZc}T!rs6rXgReXP*Aoow^?(>uD^Ku
z8@MUY{ocGu_`sfd`gr*qkP-Bdgg*sua`TqJ>e5o&JJ-2_?e1(Mc^zw<L<x)wnSBlJ
zCV+FOP^fdD-J&OVDxI$U#e<RK)CmhmhWzy#+8Z~VcxB?qj{gSo(d9=%iqB}F6S4i5
zufp@%2}jl&hFj}g-&l9^1|1oUm^ntm)T^@D;Et9rpwHE=qrc$^4Ik@G&OC@0Q-nR1
z|ITH*5qA7HzDeTf3?~;XvAgf;W$Voi_Y3HJSwFee{aHpsb~r=+$f12B_H6yaD}Wx4
zcG!|AUvx+)qJok}sM~#bychD&w}|+-RlVHB?U^;0oRVVD^OYI<*l)b+#H}w9*Xz?c
z=yLxQ@n&h1A7XE;#TGw2&7RmvPCbUvC~ujhloA=)8hb_!uZGIEi~3bx{Dg~C!YQDn
zd7o~`>K-r0kSk}-3n?mY2KG*--a3A9X*}7%*lkGj6vK%ly*cHBMS>`&ZDDuMpDkeW
z=?+%sOfx&qonwKB{9Yr;`SZfDjIxBsf5V0GOa|?ZY!ZZ@R*CAf+;$mnWDs9g<Xf}X
ze|WQk+@m+sl<{_?Rk#B26D|zFKUPwYU*p!RV?nMZW-UZZo&4teC)51#H{Wh!UP;CF
zxBEtT<EUN~{ggv9n#n(TTIEPokF#)h$6Hpu`69g-B88cOg}kRX6F=5%bIV-5VV9M)
zFvM*s{l|FYm(XXqe%?_lzyAG9Zf*zRh!U#_Th*6yb7^K&M?Tnd6zp3}e53Kt8usg^
zzd;&HfX)!v6%ii$p6>*I>dewC^Iv=;_@~Zj>Lgg{20@g&qMqiC>=-l1Y4);an{{LM
zXkeE3*wyw{d?Xm7)L^^!-(r=(|H56fHCLTdS+iXv_e+9Kix${E8%g8%VItrFNcgNd
zP5pk|`wGoT_QZ$V$JvFL4S`~gipk9pod)8RRGS1Ns`JjOikpzasr$6Ys8T-{&S0CW
z$Rx%>SJ`W{eHfZGG{&q>89e|bX5fh)%2V-NKXoKZpSwpJz>6qRWvc-q8mM(kLdh{f
z&g+xd8v8eyV-0SOI4`&3Wg?+LYKkx;`R|2}sbVb0Ji_HJE6g)=JZA7V@@xIlP-!=r
z5xG3OzO!V@H?vserPem#Ho!Qu()B|pXW1~4=i<dkUWT;4SQU6D2JzuzG!_JNkK%c`
z`s+xjOCrbBEY1q)Guh(Ee-^)gzq7YRf$X@g)B7QovkL$1h9dE~uR7HqC1z(W`w9%x
z&y$4UK5;Tvzt$OO%tkxRa9xb|NDV$wV3fU`-47@`pRn?Paq{NX$kRsD|9EN7dWL+%
zbxxH^8=p)s{&we=X)ZrJ$Ro<zc*ls*L+mwfexwgR7jW0IG|=;n&OKBwX3@n{@`UfW
zf5uF;lm$n7qPFW*OvosC8$x$$Xy9P}0#Q1h=+0~5<Ai;N#51W;RMINgTqDgOIJbj-
z<Q%~dXQLn{d-mABxPcAROP&q`rVk=FrE797kJ<RDl_^-`6Vo($Yl7mOw3h?FNnAe?
z$h}ZZ^hR3>oZJf~YYP*fZqiI8lYZ`RZEUwf(;qIUWtAzbMjH?Xs8O^4HpgXr+Om*y
z6chsYhmH-_(r`!fB1mow0!>P9@TJC$zryD6bHBl|)V{D?Aa?7;F@M-~8fa7uHj7j^
z=Amt)21NAh9nTsduNC?!U|dVTHL#@@7C7Eu*_>6IOBJu9yAo6)zL^|qu-=RuXpN*B
zcp&3y!pzx8QDQzKEod<+?HfF(TryZ0e{PD4PW0?IPb^$AGKZZp`#C`84w&BuEJ)T0
zSU~`jg{$B<p3pB}1j~2Eo#y~yFr3$H_*>E)uNQ;)I?#g-VmH?qzs<jeZ7*WP3Jg_b
zM`(FX*{Vv%>jhqn;Qn+`<Yg;8gKbZe?@<znUDm)UFCk9Pw%~1*3~KrKG<!D5i)16I
zd?6*^#bm8#LZuDK0iezd^HzWktrkE^zA>NRoNHRp!npYQK?O{PZ|qv|?TrVYG&>W7
z=i2!u0%<b~3$^QT00q5b7BnD+X&r1tT5S&*w4Ift33*G<`dg}=ub4clZtc^PfJnvK
z&#@6PUUZTYr5=Av)u^&e^&Q42BI9}`NLF?4roTT@M=TsdOay`T=-Uu5QbLvDqOa$r
zMQzqC#^b0Q_r5oB&VEYRKr)@*n6@_g%GnW`^GFfdZx*08pj8r)-0+2JzV#V@dnV7r
z>!&@pVry^aRbFYPbFaj&pHFmWb%s}!{*-ZMqMPc$ZnLP<JGmHcDH4I%Gjf;ke{CF?
z?ZlAKGb2S$pum2)Fut&@gz%^7Grk<DW5|!>x$lnv8JRV~>@aUHO+1$dlkuYnHZ4|-
z3cD?B`FTXhRY|9fC&E#}&LyVBea{l6Qze5Vz{7NhQf${XQfS=*9A(`{rooqlUwluw
z|9Qs7?f~$^+i2}ar#=)|%}FngmKQPwpZIN2`6A@Cnimch{D6}q@^iee`1GpPfVZII
ze$}4-S)rB5e$Esv>cy^HmA((SNB(x15;!_e(MgP>t1R(XyB_Ao&8@t#uN&|JULCL3
zW;QG(Q_R5kR^_s_0kxdd448y>+hVZkUW};OH;IA)O<FHnsEqdWAeqsR;X@@i3U<gt
zXC9p+RDAZVbwJCVC6r0-f~`YtZf=BG>DaT9A${t_k<vU`9>zE58!zJLA<<X0T(`nq
z0NH8-=*t7Z-O!tlw~r9s9uy}59QLrQZw3YiMz%yzFfQamYH(UvnKB9gB-W5c4LVIO
zQKb7zu_NvMSLccwb8*MkUYK}q!)p%5p?g4b-zpsuFg%v33*1gm6ilrF<P$0vVUXzB
z-@_E7Y>Qecb>86rdlW*<nlO!wr7dJERgGeCsA2gfG){M!;fMF!><$vG*Syf_9p?Z{
zemZ*AnPj^F68N}xMQ`y5;fRhVZF}F;XuQ+TDhrjFNGS6oKS$fZysWIXEEJ$MwSWmV
z_<yf8+O7;h*}1OLf#Ax521=_)^h|l9HIkTfJ@#bu=cMl~B%|gN+2J(R&Yx*^mY*;7
z`6#vF-@QV9<nP~O5;f+83-PBB_zwfl8R^X3UGUR$d(s}G$pDvCX3b12jxI8pkfx%d
zo~tT-)}lbF<Zl@rnbO~6G``zl-jy6~0~>9H#p=#bYMGWaHYHb=<wRZITvF7!RskP=
zMlzV^CC~}ayC9oa`Jr0Bol59^kWlxdcUEZBPNe$*BC%k^yaF$tvGe}q-f~`~J9=5`
zGmY!h6)=t9qLBGw2S76BAY7ecz?g0)Uk_q*8!;<w0Z!|Eeqh3NHn#u8+IL4ay>;83
zW5WiBs1!js(nJxY_ofsT2+})92}rL2=>iHO0@4XpdMDC5sFct<p@T>#6d?piXm7`Q
z?zrE5W8CrHU*I4@^4n{#z1CcF&K;8$BJ?;@G5Ln34FHQGH4Hq}_$HkOK4PkzNk~<5
z;qYizTI2&#QO3?2?ATvk0E9m>d(C^|W>ld51wgdV7Zxs0wqz!#l_vvY@0)@ov>rCo
z7*JEPWg|W?tS|)|$>_C5(z4*~{3Es{V?kt12%22@U8-$`NaXevt8V^0vBO+ETV-GU
z=%U(MDBZQVgc4N1I)6?kf*;k;xohniXI{S0te@%m2zhk5ys`F74i1a(F0g3oH_u9B
z26kJTs{-W0hC-ca{6{&Cx;Z7sg-*D0FRdc;pG@&o^!u8hB&_)c&BA2sV4!`qeOz)w
zXL$Px%uJ}9Vl>|}Z1rivynVRKfDzsIwbp(NilOMs+bB{DQILj%bLjaLI<+Wbhw)0+
zEu`e+9L2cRQ`rbao@FF*U5}BjR*xgv-otjNMd~eo$Y%L$Z6G}Yvb7>H-7e5Z5pQje
zR_`B+WVJEAR?UA|@HoG)KjneF9V32~gsh<K-NyhruUmdZq|xEw;gO86mBF?Uu?E2E
z&s6pDyvt)Xau4{25gAQtAa_(0MR}bk!V{Z=C^}yJeRB2Tx183#qM_C$$>o}j`iMpn
zVR=>4;`F|dDL3@pz5?<2F~JFhqGKrblTS&Hm=3di?7QOEQe=@1T_$beOwJ}*F4LaF
z>v9cVhpVrFPm;5Im2K6n*fumX#o?o@F2LnhUg%D|o|lSPMu}Yh-37I3oLFZ2%Yx1s
zU7}a-%!Jr}^Svo$zOK6pZCkP<an~|kkYGMuN9sqzIqxvK!!JMnv3li*Pi%lJCpK9&
zy^_N>JLxh#Db_vcO<2D8M?C_wZ#BO}1+iB@w5go&2hL2ozjNy)K@b#N+$Nxk-5N6#
z<KBDsqhtm7o$oB+kiU*+wqRH}?A4Gv-Y9tt*VDd>OdJIFv*}QfnNF>0Q@JnS%*o|a
z`WgfpC0O)usQqi(44qjX0~3gOI?ibJmaQ#p+Cw}37Djlz_b~+b0N6KmUtyGvej(Go
zGL)y$|8Pt)aojL~cFy~FKiLYrJ;|&#?o(d-<I`?5h(@Pa@ul~EbAF^^-|W<7cL+!A
zj!|=|`GCkGiO4qzIFEU_>!lXm)xvZ{&ye)ZV@oGJX^|RHx9v-?uhzre6AyJ+hr4Ik
z)wE09fe@(`jc7<Jzv#L29;DeMH{53_1IfbK`ccz(*X@pBKY4wA+?d%=UP_9jb_Jhe
zR@G$^3_IoOuk-w!%c)#cepGm|>y0{|Hy%AV^fHPaf|qc)yyDW5_#D-Z0)GCm1^#b?
zGxSM6E3Kq&)ikTnz}9yNP?17yZkTLscmc5vRmJ_{m<&trwwIu7?tgRj&gvJY(en?<
zGaGBUJL->*+{X(OHa-c`fV(k%b$>oqmp<x83$}xGvWxAR5cr4cN1^;dpZqMyne37>
zIdsuX#SYSS`Py1$B9p|tj=Bcpw|Yd1bwh+wf>uY&9*lm>R~T03Z{O=H$(VCjX>|_a
zKW!a=Qx_NPyl&=74x4h0<Ch-Ps*ei1XDge)k1Xi2uOWUj7wSFo5WiackJ5sppyY#R
z`@#HE?|?!~h}pdL-9KBPa?;<KbTJt3+X1Su=nL$X^xZl5!`*2LSQGPU^4`;-%L7?R
zi2wY(;~@=$HhuTCs}Xs^G5T&f2Y__{R&YXWyY~T?)6x?~IIBu#t4+<?LR$^kp>sXn
zM<pzZNVlffWXc*EEP%tDH31veOTysaJoQxjAUq%BSgDh>u$t$$HRZlR8&p1BVQUco
z%7%Z^Nd>oB(qpB6M0A;8B!NSUAI+E-KZ$)V6!pqaUXNevNu9I;o8|}l^^`L-3py_&
z+kcflCb1s@bZfHNf3-;6%?WKJ+=1lkgghG64IS`!Lgj*6SRalLAnj<c>)sDE!A`kd
zFduqM%#4fwk!FSZ0e<UJzgS{Q*ik}oJR!}Rw#a2%3$J6-+n39vS>Wc^{uItVbB}J~
za@DUtD)ID?`JLhpml-1goBx!`RP1aWJUGNpS)&<NYCWJ0P-IbMpSu8!nYp*oN%8}6
zCZI2m=|R(yayvTn!!2xDIV!xyR*PQ8T90vU?c;Pb4@!s28<J)<o>j8?0docbnU-2*
z`P$6hrOMRQ3TIsvsyWfk($vaR9)n6=de3pNMYagNe3I>jgrgVHsWP)pwlo{p-^}gJ
z@@vJIy;-<v&J!I9>}Z_jQPQ@ao;fn3Qzj7#R<ObBf-qyAWgH-ekL?Es2NwhXM)zqP
z;z0n357~gFr6qJIR}I1$nxMI$D7?PIBZvJai*;VnG;Q7iVvHC%?*k>C^Q9}9ef2|1
zbvhL`kfO>01G<W-+Zdo}xf=Yu?pfbWusyA<Se6rArUVz{X<2$rCLB8MIy7I^Xa#BE
z*2yy$U*FkkB3En@d~^(=F&fh?%u#5SOO=c6&yX{2=B;*!Vb?Q4a+`L3*ynOt*NsO4
zBCSQJt&q}MUS6KG0lBax3J@Vp0@vPE52@<}3Q6pzrCT;0Z4QXgUf3V&J*knKpU>m1
zSr|MofVXVe*3E(>8ZA04f^-`VZdXKZIq3^vIHTd8y8$Jd4gbV1f@iEj$Zmge6tpgL
zppAjO37j@GK=`axOzS^>{MZP(4XfUr_V!-YbUE725+8*n%EN9AyP_eI-7}!Hj0ReX
z0q5G|g?QUlp|MQ;H22k_0ISkI85^>cbxUD<^%9-e-Y3(6dQbOJa8$4MfEOl}7AT70
zq=5c;x^<~9&6?%8_uxi<zjEKRqxJMz{O1cCl_iYB@&~);)F22BZ|?)gdN3j{@>;^;
zfVy+!LYnnhDOueaY{~`C0g2m>kP;iVZimaFs%W$<Lh_h*Xada)Kf=Fz9g?NL->}!r
zF_)bdQVhuP8^L%yUXz07GU^PTM@yo=dOdw!IWQq(_pdq%bZRksi$yYQ3N5l7>f<Gw
zlXOJ%Zku|{DCn+Hm*qIT*2ajq=;ZJEMVbDKi$Cd`8ylgy8DvXChN7#gIyx-k-E4}F
zR=b6*jJ-l#r)#5>o7t}YI1^WT4LKV1{p&j2$q8TNtpm~Vb@_rj6lKD=wF;Z~%CWjZ
zNL=pWm@Vn>odN4{m%_o^+}ryK6y2LG*KOG>;s;b!RE)>bgPApMSd0CF7z<m>_?^V+
zY6YaB{;>RD`AT}Z_4wn(?!?3gm=+_1joW8y#X;i+z5Yq$!c?eQp>R}GR9lRJm-+aO
zs8F%DX*36X4h6Fdi_xFNexK)O<0ZsKJ4$T{(}!0<F(W>weDPyx`^^0V9;xr{mpy>f
zWib9ZiiLb!F%&xZK({x_;!_@;RWQ_hE_8^_f_7OMR^9kP+K}e-v%9f%D7USdSEve=
zVa+=lC><<}*`SAMpC=BpFz^MxRD@C*RTSZy#xKOTClDjFMvB-Q4jjm-4Q7{+-ttY>
zavhXe^CPaa&nX9nDV>dRkV8;oBD-r`<RjNAi(7C5dW_|^G>=4~!6)5T6Woyk96Fx(
z?afHoc5i{bRK@Mvw<pw$_Ky!YyhX7Dt@eI`s~vrc{OoJ<ySkP4m>HfSDM$Q@*F;JL
zzL=}PM1c7Qd9>pEOU`<ClQ<&URSQ#}PeMQ}B)Uk$*FMa4pNCZ+>D3v_nY8I*vZOx$
zmQH*sY1YP&x!6m$re%3TuW5?EZ}{$P_Bv}Gm)}awIBX+c`mI1!jtRjmD9JfW?Fm;1
zHp!vo?+F#F&o9p<VRGZ`@9jqRot!PbuF);9>(-82OmF9cY@tSqjAvJbF3MkV?_m4(
ze6Do+qrfel7FSWj__6Z95Zh%BNOZW~1#QK}+yT<b72R)Hy4>e1#Fxf4ccl?>bzU+d
zG|S6rH4O{IXO7n0LW0w3p*L0@Y8q^G2=RBGWO1$o4rzjhS}rx!8x1xGc(kX=Mvvrh
zYT9m??2Tpfo?64kw1)kU(?<r!c#YlVO3zt(+eF81!5cU)Dz}Y3_t(t3E|Coh$C?PL
ze^rANCrTbKYO2)7lkGG1cj(EWO>R;V30SVzN}m%CArY77=#s*ubiDmuBd+{q$gw|a
z<6pOGb`8%@vBSkdx(bbcRmZkDtR1-q?J8^7TN`$pzV}Int;_)A-A$jJWRo2<y({6s
zq;V?Sty#Nou{f~(@gyl@Dbuo>uf1w$L<W_YYp(GVF55V4X`av$wf_;yA>1H3dXuF=
zk1HR0!FtjEy3NDZk6oR02xrK@-uW3HkK!0}?}mNDXzQBz9pk{V=WPy_U2ztc>j%=P
zL38o(?TH3#@u%!6YXDuoIX*qETaf(+U)Mbau-dPe<FS+3+s2=Kwb5T2I!pYM_{N3M
z+YXj1!+G9ZCVbkkGGY`aw5N!<zGy5?Pu()%%5^KGONRxI$N-LKgsUOBe5`tQ2d56}
z>hbTlB6&+4O)5C|PGGiR{A}+23jId6qi|<lef6ycu??3dC;XMUP8?|egtLrw$fZXa
z6ru6ASc)*!X(XQ&1XYBD;7b!e5Ww~-2|Q~%>4q+_w-$CtDA<{{e}cUg_4yOX=yWW{
z)#yUG6w|Lak4~S^tGw5jufp{_zP0b%>7IE09xk%E*=?9WWyQ)MTA(mjf*j6Ln8Z%M
zNB6Fm=*EPD)3nsPios1(a`KWupNHH?Q8Hxd0i_MRU4b^?@DYX1#5^dD_!Pqk3S&oo
z3h~QK$7N2l!TfG-@Qdj+lP3Fa#O(SLTSR$-ISmF4UP(ucmKytM7j(K5j->gl$CDkp
z7_$#mX%-ATHl;girQbh_t`?w-ly}OCEHtF0t2?v(=}ojQzgGYb(Qq`@?{3z+hZa--
z|2*6o=g7X}oMZsu3UGz4Ctp9pcNcM?=4i5thc-z5wdNEjj!u7U&*inxy{lWwv+x7~
zLBkzlLoG+5icFT<V@Y_=CA8``V~qH}Pc8!MI?<O3yxsSXTZWBYKI<=JhI!Dr!};Hz
z-Qik=+U(1K#5v){TeeY72wZIqKl^l}<8#FZL~U}-hWaP7881L)w#@;6=fi)uA;SG#
zW34M%A|dhd{xa!@uQ3_c`w`RZR4w>dg_h}`KN`+VCAluZy{-!W0lTUGd1t%BRrabY
zspjL(SqGQrN1vHE-ACKi0{w1Rqvzbj0epPGF`~O0vhxdMzIFBl0a9Xmm%Tlk!xF7!
zMiOUDESNDNG)p><QZQbiUbG^I0zd+7hRxMRht(`<8+d6$@5X7E6%<%~$Q|a<<ZW>k
zTUW8(nxLDdG_VY@>?(ItsKb6ci78+TvJA#}?8wTbO|ZNXTj%pVv$jw17w?Ixh6M5R
zHDXHFP5wG2Xe2AU31Z6|uG&3oZwsyhUkzPFD)0Rx<KXaBMG%|~km6Z_=#QhY%^2#1
zU(P}<AEI<@dA0bpeBPh-HL0%YNwjaF@<|=CTX%U68@@0`=!Zp$eN$6Isd;a!%OF*0
zJtvDx6}oH#XKnL+n4NuZ)}zO-9VmM5r_p%s%>>+NJ38(E$&bjryM`1ZFmp=Lo1^yI
z{ay1sCP!uLGxIHRsV_I;rS^f(gJek@&@#D;vZ>Z@?f%H8R|9ZTwFfvi;=$qJ{hGx7
zM)?pny@YsiZ?B-j>&Mu2Z;anSv`r#EwaI5g{f&V2^0={voiR&mXJC4n?7}h9;=}S|
zBuIcuP2exQ|L)zmh#=X9n7EjsIU>xXu(qQ)1Eync*%&WX<?rKFFgCAktli(ZIEmC}
z2Dta0t8bkZE%_=m$J2eGrmoX_TF!a3yy2yF14($yn??^V&%;I2?gT3SXI?BW4UM(+
z!2`A%>Q&?{5G&>AXiOG;O}ask6f$rf8MwOcHU9LSF3rLrLlft(Lmz(g(rI`2j_2Cg
zO6;T!uKkVt%vm*?Sm*4UL!Ae9jK9bCK2Oed8hmJquFyiPr?hvKe*md&dmaOYxcc#+
z;K|O|o6^D239d&n#T!1?2`m6kbki1Y|IYlVyT-#XR-@wd)&q^fcA6`2?}AS6X8(1?
z<W%*7^r+G4O4+nhOC6JTi<Fz@&o1TUutr~y*$L;fmalK?Hg((XlZE!am$X-id;Qe`
z=<y$oms`&R5dIo@->t&8T7N|fIxaMAiQ|_T1i!pEX@smcep}@*VUKLy%7i4|Zdsxh
zc6OFOWy~4U(VbE!3J&;Ysm+ji?8dZ#{_~kvBbxv$VvJjawB+cwgwk;^kA0wQEIl9;
z<^Y7A(vt$sny4V?>5W_wwOel}&6Y-r+-2vf7EPC@>S_QCd`w1OH}0t|&j`f<a8ty!
zjU+N`WpVhCtM|80M5YJv;(wPm0H9f6q}KJ`ePB?+&*|@q`x?aYwY@;MN?FKdeYK50
zWWoW{#qYl5lrIx{<L<asNpNIz^c&X^N%^J(O)4m#`_5`C+w2}Yp|Z|;do796*x#yR
z(wWdjybff%l7|rPrW6HA+SE>9CMe8FQkulYoEyGci|H<^W!I~2y{e&0CJZrK{MJZH
zK^{D<B8}ABuLnM4<Cr~{hJC%&+K?Fg*ic$@w~{RFd|#iyw>Pf5HCb;R?b?`PS}W~m
z6CQBd>b(OfypVH(6(p|tqLL@J2SQ#qu|S@;HxS|~>=!Fd<?Y;#Y_ZpI9)(iC#XPI^
zWTEEAFd85LyanXag^OcOr_hzQRrAr^hW!Pu`!5L1v624%bqyPUsT*C36TwxPULLHs
zkFD6?wUGvBlnW;rVnVCPv(8|tPPS@g1Q*f0$q*uNGunD;o!%`O#zGE%!d|~;w6D!~
z!Fg-Kv1gQ~tTX*lL{sfuDQ$;I#sLGQ)CPl)c&84fkt0fcH)4|Fa94obP#<_IdRNul
zTChI7bC3t{;W@NV^zjhFiwQW<L;(P9#I#`77l5Ke9{dzRt||eZ$$W^~Yl+6|JWfl!
zBc6{iyQ5}wg4jWoN$HV*-_vtJh9}B=8o4M{WZAS~<Bqd_s$*Tn&XN9G@=HcCxP;Tn
zMb(eBE7+qGT}GIt+Td5OekT<)5n2I+<|=fg<3miKwY!eN_tNM4<~E~QfX=msCDBn>
z$Z^~5ZO;i3S?r1sylaIN{3cu%6Cuu4mM7d>2@Y{1MeBR>IbHH=@Ho|wv8W;SdC2aB
zW9UUXv57?J#y-?Mb9(YtEBo?Ui|#{#XSB#u)ZxHKpr<^MRf9aTxjayKZ3%TspqLb<
z_w@L1*CqKU_W3<)y_C4J3LV?rs%kM+SAuenl=V2Tut)B)stQL6bw>Q00|ESP<kV-6
z&m2~h{b3YQULH8<4A}aID%4YQL$5Cz9R;5bI|`H*BegFq4#i%=jLpjAS-=W--J}9}
zKiCHHK08)MZ%;>RX3?351w?C~B;`+L=*X9BxLbCHR>gu?u)Y(I#Lc73=rptq6bsAi
z;kBqK$dOS2w)bRE{_eDa%}wob-+@n~UyDKY-xnY%noPzZ(<JTS4L(i0M{}vn^_>nb
zlExdfym8?TZyoc=3@6$U@%BkB$ss`=g<-na*fhVerjdQ)$*mpmw+Uvb&yr6)dsn*<
zg?-~{yd4r0VtcXwhL$7|bwM-bl&DZ8wr_ZuT6Xq*uKE0F>A^nd?V;)QhsV@alXPU-
z9iCt_C+(Dm=qOGOSCCc0pS=RWA+jsjEXlQnK`yOmA4<hyk16+Wsk9#){)Qg_O&OKO
zw7}SY5bwTbngh$5^tI44h_J8i?d@O3wubpHu-QWs-dYw`wG7bBzSu}8u8?$8UW{{n
z*rWnMeg)1Xo2|;-U}BS$rRzx2dH-!!lZYz0i}({)y!zSWSTPW(kK(yVwKd)JEDa7|
zSWN`E_nepP(?a;EvSf>wu66wI0M&%T5gq7^nH^y!(_RaXFnj31aE^L!1>>nA+iqCI
ztv8YNl23uX{*A+glgEcm0-eHHU(1igt`qH5a!ESMArOS2kBWMOW9NgrN&E3C5|~44
zI8klFfYq;R<b}i(nO$m2R!NuXOIOd6F=^weOj8Y$7?MoIl<({wmYrguo{Nq8rdovE
zusl6I(t(<!_O+sx<h#Bb%-FtD?6k&VIF9g}%OE#AN(s2(K>7-LBDZNY!goqDp6&Ai
zG)C_l3q$MCJkM%O#&CrA=~1RKUB_XL!s?aVp&=G|yq}yzy4baf8N2;0eM_IW+kr#*
zCmV%J;bW0>MoCw6oqSq5hgNxioRad55_nWsQj9rcN*n0_$<^Zvd_26|EUj==xMhkR
zQzLtA(JSb4HnqzljkD)E7D`^~VMb365hg<K4y@*-Gw67EiBZJE>>vD-c1ju#s1D6^
zjy)}M)C`87&MKQtQ>om}FA0q^B%T-+=-%M(5a_v%#Q6o692jPxzA%8VO7p1qX&w2F
z5caZ6FD=81p~ULa(#ESL7HWQFPi@Mup-NDcFRq13Jg7~|eV0-uv6&cl|KekirmM4R
z*<bEO1P-pV&bpj(7DntRnht$Kr_&o(j4P?qN~sy_E@FobTyovZkBYtO{4RDguawF9
zJHD5B<`Q3Rn@TU7b+Y2fs~R2O%2ht_{An`}w_hwV<-L#RsTE<*T+k`|US1VbZkD=K
z$0yH)ykQP+$g=9S)WS+$^p2N=G|tb@hm4Gr3x+flwX?2g4|o(4T~~FXl_RGTf0Ei@
z%Z!IT73|tBQGh~Ld=;K3vpn@4Ux`dwPAB<t<ctiVjW5;O#cm+nTd2%5)zs9^p^5ae
zMolgcdfg_$2xZBq?^Sv&dtkV~i9a=&(kIhssa<1$sHeVN(B+pT!MJS<Z`4Q;hJWN$
zVm6!*!DUa8#K?7DYoTJ+Kf|Zb%wN3gN{toepz#IL60mR$&rC>s5xc*{$R(~@96#%Q
zHm_nMjuNXZh2!bUkq)*C?r>MpR9yVj;V1oT-lT!W-$Bw5LQ9$>)EQr~(n9Lrwn-$-
zX<Hn8XVJxB_$gJKuhlyB3z?H6jE}vv-0JpJ-su%Hp(z&bzD+_a4?FpWPcLM-z5A0v
z%g@f0)LG4>W^gvhBfTn~FK=0;oXbcA%!bW|rw^1kOYSH5bXeVa#Y*cu6MToQ(Ksjk
z3)KxpO}=EN)wmw^Y*Rqk@trff!}0hqR!`qr&knV!`4abuB~pjtB3s!)^brlT0wsVF
zzvrC9`^;dL%~mYSG97m^7;}))qIL9*3yeWbiACMYv0n-<<j1YJ&05)NVX?vLdcn9s
zzLEWv7vk9X^XMpwm{?3;;^oF0X<*beZcM3WoG<>lsHRKx+F!iqYu(ADb`!IksKdI~
zMAluR`4EqTdHD@Lp9-ZZ$igP3pD}b1cB`+ipAuXf&6OO}Q{SD0f&i2Z`EZ-(85w=p
z$+EPUH9cOUgRzBNlb((%88r$pABp)hg8gE9U;L7ohhjHS8i^a^8Kh!+A63+Ymyb%p
z{a8JFHBjMwaA=n`#Cg)B+s2YDl#%H%_HEiZJt`&ErtICs#PB1siC2S6S6~b52*;+x
zet3lT#)n1{OsmRh8%@Hbbw)|U^GzeUv?K%fwX$fT%9{Q6`(UbRqio-H?XR+WnHGaG
z3$^!eb-5pvc{Vh<rh+@Q)02~3hl;W`+&0cvdoSrw^1LxrF`h_3w;&o;MpR9lkH2ck
z-Rwly4filD6_DR}@;8y>?n)+}jNYH^SK^_6XMaNSf>ns<-63nfgoUggwvx5345%Y_
zH{<G=pFq9XNJnkS6?du~u8p^QxU+<B%IvTF4nWoUjIWXFx>ZLN!9v~Nx?Lyn^X7!<
zMAK*~PxhmmI#~=o9CC|q#WO5o2Hhl$zZx|33NDv7m?!&z0E~gqhtj*w{VDTR&&}1;
zS+(^?eGfwZHRNSW81(BGyPO?Soq2%jHy`_UsdH%ehH%^6y;L-%{z~up1JaIfnz@Y6
z{gLF+U1sNM7D_JUQUO*cJ#Mr;NEuw3aX88nqy0dUwc<?t($>m7@wq)^^g^Fw!AhC9
zpcy}(X2!IJ76VD5VPbu#ecUvnNvIBiJGcV%>LtrSz5cr-zkgW`op3!^+ye&l!#4Sq
zfbP>m!Gv%2l+Ddu_3LK%fOVaxU7Qg7=wq({7;m_R)T|V1)aj4!v#|hsPPwbh&{RWQ
zRQ+r&WF$2t4pP0<en%8K)Q3vk=FPOxsz!ul1d1IM<Ex*sWEk6d&4tN+9Xp%}prcXp
z83!=gsL<TI2O^$W^gx5RH#bqOF`~Qi$l+)fSau4dOmi=s(oRWFXN2s4Arf6ghOkBN
zZbi)PX(_U9I?wGs0XXD3HFVOo@^jj2!H39A{?<<;=8dEHaRO;b)Gdb{?|dq&*4rIi
z2ihcfXFqXm158D|`HhgXEy0-99n51hNNz6x-jEE6SXj^I!ae)QL_x>Q4APQHgqk?%
zqUNGoaeBzk%0vSQ)s|&+Yp?TTIl0-UxwuEUYx}g_5rUm)5l4K%I8Z^hV1<_ou0d!M
z`SB}Dz*W3uXyC0=;dR*;2Hu`_nK^R?B9?%l9>h_<WSHuSosN&|m+c|CO9B|Q=LOq;
zu{Pf+oG@fN5-hK1&rPOVC9NUFzt0>9skacaVEvvqb7n&U#(niEM+w_1^b_Bs#SPHu
zRvZg(pK~7-x;)a6YQ`Zq3?}%8LTau#0vW=?Y2ptbg3Rs~OjK9J1NR&;=eRnlTqc*>
zsk)9-6vaj&k1{>;^Yfili!1JE6u!MMm-4sB!{5Uw`T;<_=1?J_PPfOkpGS{xn6+4$
zUCm3I;Q>Sb^8q+{gR8F0)0|fp;o4!UMA0)O*Z=crT|jqXVOVpKIMJ9`Oo?`(YcZA!
zo$z-Cid5zHP|qZU8hV69UZV`a!NsNF{A3HHx601kP_`iEBf%iVsy>D=BVJt(_B$k<
zR?}J}WiLB&Y-p=UOGS`xAMQq>_Uucn1MskL?)~G}WDFwyO1!Jgj<@8YfA`W!>qCVQ
zL|EA&{W`a@dGEul*||KDg>Iv8n~iETJL%iZn`$-aGiyD`;^NF4w0@4gC)8C)Fh%~I
zA=F7j{|s(K<_d*SakuCVKF$aQ9sk>*M<7|=$$n6r95l_!dzHnq;o_oZVv=9DkoF#J
zN1{-V__4>6tHK<#$Z6GWXJJaq23lIDJV+-vvWuL_gB$lYXGQTVXxB*xn>ws|kL#|_
zv0)U!U(<68M52ZC@k!>~0I~O9)1BbYM1z@=vp3egs(0fZVqLcT3S<<Avybo}UhDX;
z=c&|*ySWv@)5q$M$82&MYaPzJ(SPoeN92IIp(A*BN^!B;{&rScg9-~cs*iVH?qI;Y
z%s%e1Ydkos+kIKj{;tgKGxmmS$O-fDo5i=?!gNF<-rU6x#Z6}^$$jT{Dw-V>#RxJI
zj%TPLM})w*|Ne%v89?SVM>@RfT~4h@cj-qL9x_?&!*aKj?H{|e%mQl6wr&qNw1tPO
z-1D4G8yKnwLP`{*D^%CQZ*xcOZ%$M>ih8OhVkQ4(c^`Tve$%_coC=o8@+U{i1NMDg
zXP4w~Sr$ZRk>_~!t@3V8?IfrYUp0D6kvN)OalF_M53Bcj^a@%zOWgDA`R8IBo8hpB
zvm`IzE?;I8*Kt)s%RcZ-!+uJSLiI+p=YMM8Ci#YpTeFob=%a`PwBD}!MYzp8b8BcF
z4EJ6O_1@Dg-!bku*gj4?d$8K$d5&i{yUEu!gr16--l2B}s`m(rYBek=5QJLFuM1HT
zux7a)_Tu`zd?UThi^m(@*i33sot1lt+m?|g6^5FLHoR4dwnMBc0|c)#);!2S^}R2J
zi2Z5L-9)`9T+dzLVi;v?-T27xdID`#TRCW0eaLEfryu2Pa~jYtV0{AKr-vW{TNc3>
zog~+2F=KWwKE(0)lk|l56>K7#P2~1uu+l_uuQAf;#=WO6vTUnI!fxRht`dWmRD~x|
zFz2e@ROS1ynZ!sE@`AJ=W=W+mr&Xtv#nJ&t3C{{JY!xEGgxFX}e4FMjrQMxC6<3*t
zTkJ0jBxGGSoSI2Th@c)i1s2kE4e#d&XE;s@VEg-~a{wdZ0MPQthGma+?Zy<!6<j{?
z!P&b1wQyv1tEPt5+*hGqU@8G<MC=FBoYLPJ_=$oq>N@`ki)*Zn-Z@?i0&@xf?i)MB
z&ynt{(C*dNI_tCUqt&=&5~*+yO=?6gwAlVDC+gF0b6m}GGRu6md=Ifx4RYrQ8Exf{
zP#Ti}X-(T^Fk8u<PoPZAf<EH?3x4Xq{C{x%2pOzclAcW%&cLFw!zCUB&nU6phs(r=
z-akJ;qLxm}C+@`%^)_Vy<x(LwF8z4J<H<Ep^_}?dRo}wFX}Q(aE;ksd5G}km8~ea}
zbZAJMYdsgoWvN}KiEU}uvVCM9#^g;|okAn{zUE4W4HGeOw8u7H+4Wo8Q2(>5fkThe
zE3LyW)~Bb@Ja1xFo-oyeyXfoPRup>zZ7&T^{i<G!L9hwpN(*mFOUry{%~iv4%><vP
z!tQo)i)FUVsIgbgT~-tZNd2n={BXk#Kq^cP6#-A}SRlaYVzv>@sxh)V#C0v};ti1z
z!O{+JpN$S5;8b#6FmSH7{}x5ymTiG?b32$AT)X2w^NON<)GYa~@LH(~TaUo}8+$9h
z*B8^0!=t&+xGwfi#hvX)nw27IZf<s1N(pFzG=THmC{+R(0$T(_dJ1yRiHIzsG4J^=
z5a!RdtCh1M>-mv82+#v^`kN|(k(X^fE;IJk-#xC!pE!{;3_3Pd8Hv^j6&aQq+%dY#
znejH^fDu~lfLe<N6H~r%tJyaGFjTXE19Iy-xW#9!y;^BIU2l(Xf#991T{hT38C=6s
zk(nv;mb*|sS!^<5gNE`!t!E*)UI?OYCG5I2SLte=FftEX^}r~5=OmA<M~<`w4kRZl
z8vThQPz5?c_FrNM24(6pFwIK46thA>7CMh_lB9H9-Wzqh1Ojkz&;j5dlaVuZu(BWG
zu@Qih%HX^@H3|TZc|bh~hAxX#g2!NtT<&~S-~=oT-?%zT=GU*s@(Vl!J=I#RQ|z->
z;)lzMMl_{s)!p7LtlI2#+sd4z51RItYF$FJ>|<j<=Qx%Vz6Izp(^%aI?LKiA$1cX9
z9oUp2oQnzNQdbe%yhcDj5qc#f)E)iqK~v)7Oc*;K`Ph4s@>iT)u|pasgO=<1tNi<`
zY-kLZmo^3kSF+QZJdcOmv!*(H!}rAs7ZW#5WUXG{sHI<+At$Wmutt!6$#Obagy!hA
z!nA1(e4VuKZ&VE@@!q0Ko0T=5BKJ1nOzR3+RZ3=ascD+yL~`=AEsy+f13>ND5iOOQ
zG1Vo??~t04|5<nVgZoy(WQ4(tc+cx5_mPfM?pj}$$y}Jv|H2SdqRbLd^I)>ReGf9%
zZ+s&D^;l{``i>DsT^GEoGi{FNm$dy$&U~GNzrO|;w(f!fN!IV!8f<dLnAGfYK@X?!
z$pHYo9kO(ubA2pJUsm!E(G6hC%o%U@glg+gOGkNXYf``5Wc2)~$t)!Gi1~=eQymTz
zdvfu71<<Uuik;-{n%O67Pgd^HmCcDLk@41HBn?Jh@t^;2F*M_`ui0}E!%>gu50+vz
z@8b-`W+;A~90B$(E3VzmFJq?^8mD%+U&Xr=%VpWCl!1EB@Hk)YOpNxOn88uW1%-De
zd0<|{yK|t0`r_G@Wg7@PG>}tBa;)#uE-UTE?`u(KOnHRxhphzHrV!>sN!k{~;$0pP
zj*{*hx~8I=$<10+Az4Xo?UhUJ3=~wxcAv`+5i^6Y86?{TjFD}J08kcn1su`@y&+0d
zQKejfIVz&T*2P8+JwqKiH4^hbZ+|9k+8H~;5#4Xke6uvY{~N&DuM88-S|vOl`pA_d
zGuYRjBeg`Zz8A%tn@|OxnVN7q#16a9;TDr_Bm)|i&sV>j(Cf&rAB&ewrU2@BBQae1
zA?a7kgeBuH9K&t%ZJ0|FQ`UPKIm|AhXm^H;k2@`-m!}xdM(0@b^Dp0VnJji{@IF4;
ziKjc@!m52;FK*kzp{qmvM(~UG+2PrRIpxWam(Fzo)j0FgPpSihIVuGwNkw{944`l#
z7NeVSj+5zW4FkOdOW;0+J{P}emtBor?AqD&bld0OV)`oh)8h|@)7sfsSs!U!oc{xN
zwVZwCbO&j34do14daAx%Bs`<MusYc22O&hr@h=dkH?e0ipinW5wjy<h53A>S_u#D=
zNg5UoCN~BZ%A57CDH6GBiI8_a0yVSANghe=6R)z28X#)=x0NPnnY1q(dM)*)pbl^t
zQ8cX^F*+__Kez&-Q~k4;;TSrLVZJ1vK-_H`p;DLZx<GYR?$74Z`sZEGPBFNrd31-9
zTmYr5rbIQXWP6d(aS`DzoHn-SBz~S%UN}-JrO}I))-PW?c{cOh$3k<Noah(O+;rtT
zL_LE78OrCQbDo@MKUwpXy{n5DfM1TVvuXN+cqP5br<3<g3wigN94x<Wcsa+?J%649
z!+**^MeKGKtyrvB^WcS6mZw#<7(!wV6US}+)$pEbou4WT%RjlT&)`t+rlWOEhVnsn
zkyHV$<K|OViV4=lM|EM|TUKb>#jdi2p1gA>VG&&NFVO;N*+Oz>m|#}?WSOG#5rWb?
z>yzUuC@J<`n!K5jNBHv=6`VW17udhi5D9L^x3(p5X&cbu<0C%v33vl#2MS!}W=245
z9}RITHP7PjnfIrs!@>d2$wva3Ui{_ThWD{Bq~U$h!^{Xr_H0qub2=`Qhq~86j`mTx
zTRs%<&xE7YF8SSSEw?j1ID(ArHn(z9B2`sSZ;driNCYqji@xHuO&dbG{r)MsZ_4tl
z@3Yit7m7!tf;xBL{3n~r@^s_lou=^nn`4%U({C^ai(ro3-u}2lD!pQRCc)&<VqJqm
zo!A6xBAUmFIafA!Eo;^;=?$n}T2~JFZ^0|hHrWsCXGQ#s)R5z&LSyr(tuF~7)_&`(
zUIDIk-P=B-#~$~{(8dnRqkREd2V8M+0XeN1f7GgHgCv-*{l$%av%KLI3*|Vwl9!Pd
z`vZUIrunE}9&&1@7)Il3MY|CEw%e(wVx&VvVD%(Ou-xb39snZY^nb0gO^qEv7d0+Z
z07T3>oj`YR%`AqCY(0@#WL(urZiqd{*RPQ2_)xQ>YAw7vT1j8urtS!jj&{w<gHGM2
zp*$;t4*Qctna>e$F&H!|qkAiaF2RO29v-o~wp)@vR$VQB^Spv{tn)3Jg$LK8pPhAJ
z_TVY)vb}3awZ8X}TO{d&m6+TJZ?fK#E}&C7)z+g9LUXe@D+&eAq6%<^S-8+F>_=&z
z4CR4rfVl%hND}n$8|>8@rGd)ivo3Z-QA==w_2hofRxCpu)Ym~Vxp<7aZ(1rzyj@^2
z9`6^zskAU;KGjMyG41j8z%VOP$M(R*wcP(RpBtV*CC_h$FnM#_)_~^b=CZ+FVuk6L
z9b?78405(z7|VOROn4G7<j-|jB+~m8qIQLyEk=usk=j@+`o>eciWErf%KJJebC0IF
zd&J%Cxqt&)bOh#HqCS1b%#Z}iJF|9uYpbJOE)owxoK~H>+nN(mBut<+J&_#}y#?18
z(5`-XIg&8*4rPOtqOye~Aqzs{2VtXrsRB7~qory!M5kRBX+!me&Ky14fOsGDm6hgC
zR~bzEf4QMJq?8z!XrfQPs`a+FSTf{T(s2uzr&jP#CkmVIOLjL0(o9Uk$k&KO-#RR3
z#JIi5<KAY?O8B~*x6{0FZ^Jnq<yEaEa015Jvhf^Ie8c;|KI?T|7ZbS}efA+ei_I~h
z@!wT);E*>@J|tTJ4)OV5@;<%-WGPqxOd|u&RWHE8x*l~^*?_X%oMmZ-4wGxTSn8>W
zl9pUcJDzok9ey0Q$dQ%rWK$i%em~?oe|LXC;lZx&d-r_y=fA{BU?^38sde$RggAp4
z=Lf4Dk>i|)G_pUceMuyNj0e9^ZQU+O?mp^gqg&*;3PnG83Rp?bOY$MvBOU!^4W~wn
z&;RqecFb&&^m+E=c%96bkt)-!xcQ6rR`EdE<NfhU@LR<{85Ji%KfMNpwU9zhAGs#X
z*5X?flGUQ`oz)imfJFlt@A&{%@yQe7EmS<UfBXMmW(PTR#KgfUhFy+w|Ac&{FTrUw
z_BP^a-htSSypDq73C?l1xoIdWts+`GxuK?2;25O?v}`&m_4<~R-UC*ao3&+Vnmy|4
z!LuHTu$n++@m8q}I;WRmY27=_?FS!@GEm<lIu}haf@Krb?n5GZnJv$U%{V7LcPH&b
z0xdp@e*1XR8i@l$I~_>~R+}0A9TcLxrGduLzRZ$`hkwW~PrP+n@I$Ug@axpD#vv*^
zZZWw6Oj&X@>A*<#tAM?vgD;I?nUTtc7mEpwkf#QN<~x9DR6>gfLXDA+T-6Uz;a7Hi
z{Z>+IBXf?^LT1{(f}*qRhWjdK$D#TQ4Sm<<0b<deVHa6bI&M?>2^>L<#qfaipu73D
zN+KFN)Bs?FJkf6ZsJPZA0dw?KW43x9?Go@X65Re5fy0{k=V0zP+rIqu^^OMZrkX)R
zLXJvSwe-loq+@?h7G!AUW1+38-PVLo;&Gt<=Jnwx68<u;Tsj<gV4E^@uPYC>I!?mP
z1uGhBWf&Y*sw-9w3b>pmCP=XBTyB$SqiW&#@W2(aL9brVo3sIr#}gRgPC!O!Z+y~&
z_PYzXYDJ>gjw-xvJvhcL+CJ!DtRVz3RWhNxPRrts4xn|8J$x$N`+yb#rw_mZsfUEC
zwk#FF!F@**dHDX-ROkfjQVM+mqVvY{FMrD=9s~+(Ft_|>X;#sH8R_yZm+bo*ug%jb
zO_$nh`kgqUf~0XDy?PCR#6zKVR*7pD-QgpWWCzZyt56msd+hxZ0)_wFxL0Cst!hGl
zqND}nCGI`%+xPqy7FXQ7djo#tWzT0TUina8rvd&4UVuFlJ(k;WxTCYrZ9T>#{4sPI
zlE?Kg@J;2E@2UwzA5fnxEYbPE{5GC<tqguYOsVPz?|<pZe6ro5Z>M-yY8Dw=BQ5v;
z1QEYQ)L`cq^MJP9wY>4*%XC+{4Yi()n))DtG?&yf#v81zWnO@7>FCH;WMMB`K~tmt
z;pNIy(1#|vZp)*${p9j}0&)gCa<COC0JNJ{*DA?Ga3+_b@~JEfGUP0}QjN=HjP!)5
zT}4|{`t42S%ZJ<o!(|*4Rfjjyvk?f$+!Jtv!xt%q5gdj7bHmThm&*|T9xmqxzIXsY
zB%>g7C5Me%y59vIXC*##`b1R9#RHE6Fk?s{pBXdY8!ZxgEquY)LVmZ01BQZiTVAJD
zm|ELgX+;sSPCQB@7F@h+J?StBi&!HP+-3>i=uW<8c>ld-u=5&wjFkb!h@WzAf;=<Q
z6JlUL)t?^HZ3E9)uc2KS$`S5s<Wp!HAhJ1N9hUbU>q&1s0P4Bu9m=J$d4rFScdN}q
z8f(2md0g`SXcl0rSmKikUF5s2ha`RO?}eBB9<Os99h&qVPdfaIr~tqD!LF}gvzHv{
zpE*tt2nR?(Ft>xQ$p292=R{sFieWm`ISJs}Mf-|GfUAx4WzyDM1x%zbH0uqcMKPx_
zZL;ogFP3!UKjBoy5%<|4RzpkDc4?c)^Wk?aZOjw^Aoy!fc6npk>(Bh%Pk#k3bM{{Z
zJVu~4hNthBtbzfTK<9BMtZu~d;wW0$jC<mdrvC-Xq?yf^P>j~+Lfopa1;J$Cp;!4<
zDk`+hk~)8LxVyyv;;oWyv5d~Rt$B-*d)fMHrm)^4&GOlU{){pdMREbB(&D0K2gUHn
zB9C@!ZU!$ZTg6n{kK|tW7ExRe2$K)Sas`UaYMNN=ZHC=P6d!zV8t_AJDU|<}T{i~Q
zrzeRKKtmRYcDl)8?83NJ`Iz|uMH~;ct4g)d;!ut<Lw2Rg$Qd)w409ooP%->7OQ55&
ziHa*rUOC}&UUA4!zav-o_)aQqlB5nSHd)-eUcGEu`3nc8UyfsRapJfR@D%NhvoT1m
zhl9o7x}G<V^}8LQ1VT(2sZ1q{xH?1>CzcO#YId+Z&c(d@=fPL}?4V2e%B_6Tpi@l8
z398p}I$1sQ?o*n#yroiDK@2yrKNULcD*!r3tY+<V`-mXZbv*vdOMP)k5IP5Ic~fww
z*x>**fUuOmBqgt^TCSfO2hyE=0jFhs{x192VVR9u45UZ*8#)V#&-5p7@>JNv8f)9P
zV~E3-=ayYwPvuQ41E>L8Iv)uuZ-4s-#&Q6&^F%=%q?VWZGEL}g?SinYBm`5nE-O|+
z_oF3mp?25$@F4G~&IeH0u7kYVef<aJrJ%+Ss7>VEBi|fmfSKUB2biaRA7|CuIDH0>
zP1M~v!TRx<k`Pfs<eTr!HzB69*W)Y;0|&Z_;7sG|Rf|ce_NY5*r_TMB;+wpEVa(!K
z4%CCPv_R??PJ)?XkiPkg@Mid3fizN`!N6g0*qg1Dr;Y-kJ!^$c6@hY}&)+wD-8i|L
zdiF{~@l+hHks7^OL!qrArf<P}Fn1O)Kjr2S$eX?)Z~4WmMXMeW$nO0x5H^H^qE^(<
zZ=04sbeL$tazzfe2Tlg3ujKCo6|5$Ko3ZEt4nx57sLHCP)*kwY@75$}I_#lk2f)41
z_YHD>InR^mBITu959YHA`KLWf)U>pyG+e$m1=?e`VQG@AYJMf<X(0z=HaAa}H~@iO
zzN_8MgsS(}`0;8m`SGm|i*Bqv-x~miZ7`6qgDe}(RrWEUT5QIXmp<*Qu$`_P?iM;v
zLL+bwQhscGsyg;Pq7XK=ZEN6#gUafT=|s_{`_&K!pPv)C_%8o%*h@N5H>WRqXx@7^
z6O|@IcR|D<&4Ujd!BGCxj$Yy`@~+WzVkW_y3!~M4eO+%@N2i7e32LaSj*ya6_K?yF
z@jz0$X+7P2x=CHMcI(A1+JSXq4t^48$$Ye<c1*t@gq-vo7%pOYe6;V^E$-c40n_!^
zZ1%A=v>O9MTaHp3H2r(q-H-^hrkw*Wvf`etQVcDYZlJpofdVZnR|92FQ9Y;RViZG1
zgBsB>VXmNp^n6cRajNdq{rNBVHkh0L9GN%2ID5HVJ5G404S3XyEIomYbgDh99VodU
zNpHEgS)X}lx(X0Zy3YQL%;X)eMd1|I{SGh<SW5-86P2heXYC3FR=C2gsIwR^SBr7^
zNFdD-QXJ1kX2j@I-&v2jny!=U{OD@j${{#9=|ToNx^9ggWh<o_;Y<D~N4O;ETi54D
zT7c)n0}(*l4a+t0lK5B2ntf`4L(`~ZJYQq?$-JqK=9PUz4}*Cug+}XyR$1|kOhMDB
zXo^0?x*{9CH#~#d#i+g897!5X-gQS5{TXIDeq|5U*>j>e&AOvAg5IQOtA%MU3}mLY
zHuG;s(mGE*(JpJ}JIoyC?kj4RV!bxYc4x907U8)wDqHQmW}(3Y2{O7_k9<jKrpVd%
z)fkEUU`+F%SqgcLypG`2#sIEduOdLIz-}OZPD=D}K*BXnnn4SImIN(i@uc&38@SPw
z(RzGEBvAkM-Md#0DP{FpZ{IG)StOU*jy}F{jqM$%kor(*#>kNVJPi&Ufq6$O<n*lQ
zyd^3>jG)v=wO+!$$2=QQ;Ey6`&`S%PBJ>%Ux9aq)5p_G^U3}wgdSppkxzk|W&t#g?
zmNYCB1Fp0(c;5aJ_VmWW2L#J3B|Es8rF^kK>#t&DouGAOOw71(=5P*komg;V2|=6G
zMMjYqp}<@u<M^QjTqXh+g5`RO_f>r-MJB7_pj*}UcB&d0LESOM#ax_9TWeK>OJBw?
zNY(+sp`VmuDQ$4vu1}j57uu}>w?d=~VEzhPniz23OqC8=-QX)gI4Umk{z*u4Cw+2x
zEeXCBBe`tAQtKLro?*zi+(tpg2h8L4g~vm27R!AFLEEcE>$Xm!Glgapa}5GNObitH
zpArIc0`pHI=ueh=AJ<uZ7u4=x1VF0-f8|cP9~3X+wQ)Vmjf&^l6Ztl9t&O_8#5K;p
z?X27@lb+N}Z7&bZcW^Y6Rup|UMV^{?M=E~MoA_sMTxvc0cg5rdcdg3TzzYRv{nkh5
ziGQY2pXBeF+L$M4Bcz@*{ZidrwwJfU9BK1r59W5&+and#+j@_67Hi#(Ve?y?9l=Id
zsdjNFY2}H`ha`eIbqQWanaWlnY0>iA#yB95Bv%opqg^m=|CfyFSCjvm{%^gDYyjt7
zx;G6hK#W7MWUJZ`)sXL6k!m6`P>oQ7r%>YS`JFh?YIXwuG2qNYE?d&FAs$=*(vt>O
zA3jwR@gG*lR|K?gc<l-k;ArEl(vUM5^nd0*R+oV@1N++df+Ikf@8K_xv@a|_nDT@7
zmjjYh*e|1o_}Uqa7h6BEI9<(?G&yK}rCg@W(4o_xTlr83b|+e?!uqz(j*ab2o_(gd
zW6ldNaN;u0{>&_YeyTo}d$2M28uAr-1Ffo-5CH^L4R(|rpV;9*`U6>6CZPj>bfD6W
zAJ6-p;0cvX`7qE5iJ~Nc6nhS6S6|Z-ttCAF8n^{G!z~b6=Mh6L`>#zSoWg%b;5r2R
z7+E2C;Va;v3%>9>mDrI1scn#)70Ly;#7KT|BC~@$DwBV1m6EUj&lYx{IMr*DnXj(Y
zMuQP~aq=NVs6>`AalWiUppz(A$o2QH|EcI5ly9*9<puDUkKH)|1l(C}?R(Jn4J9^v
zo&RZp#!4T02UtduoTK{j8+;Nj?E!Gy1Z>@{Qc?4MMj&Z<AmZxwzHc6|fv-^sI;1a7
zfU)yD5dCe>+5chW6-xqtp68K2VsfgI{`YR8@BvUxWs|9A1+afQtNWmi$yU5hzWy+^
zpYlqX>K%-E<a&HXR7B4*D=pt`h$`;}#y+-Z|DXGkzbQ9A|H!RNCzzm)85Rm<lkq=o
z2$bkWJ8bxWEKV1#=qj{}N%p6?j>Pj*0L4iMY0Lfuq23b&Ox$#pEQk@DWwO1aV;&@Y
zAltvJI11KClIO8!jq{oaj^-C_;x8X7G7x$s%RfSooB1K|mH8efA7u%;Sg}4WQMO1g
zldIZEJpPRyNf%F9{Qj>$N8umcBqbQk)C#nMN<1#e2><ZY@=dulk~`9I-uc<`cS}iM
zMmvJp1L((-ou>)VPZg*$p#a)ctYN?UYqPzOhy@{2mSFlFH`5Wj@$i=k2R-<axaNr_
zv%7iV;qpFp9qdg$J}|2SnhPW9HBf4CfnnCagYTE#8@xyQ<e&CJ7;`I(G{q_u$8~w>
zhg)0D<vm~=G6xXYcZhm?Zrg33cz-9nQLA$1B4w|M*7<*ZR4G4+@9!#&bK%)f+pgEZ
zUyb0ThWTGRsijK12jX~w1p*v!<|88`N5-KY(T|1;^)i5-w0Nz2ydBU;Zv*OlDA4FL
zpVzxD`zJ_zuABo}ug`{J(o0u<<q3LGLY{bpn75Oocr5-o!<XmJ>whyAfV1a^pSEs|
zH|YLQtN!%@AO?x~@i|L`olAe%E?&~K{gG{Z|9^Olfn0zS>0kQ!t6$&y{s=EW_#a)X
zz?*w-{?j)nGf?Hk?_&C2YXg?}=Oam$rT%WI2YyJ#e2HM-X9P@Z{@?xI1UeTn57Vyy
z*ctSn39`Cyxr_hnb^jgcggxf--9Zm<fjn-QJN;ZpsaQgsI|Qcu|8O0g0Y-cb!9RUJ
zea`+cIN-eUSlprQ-GA~;1Dh?5`G={ERh$6Re|fXNV`K~dBR(*$>3u(s<4cA=4k`cp
z%d+fL{Xcxk{=Gbe%_u=2L=n6w709zr{c3ssOEQ-bBL`lTSE&MUfCJVJ+(7OC>URC%
zs6}1@NX;Z+;EpdzFzAl)xPf@P#AiDt;=0*PF%J%<D6n@Q18O*jAed;(1Mx{DFq<lE
zw(f>=%MuV?rS+Qi>bwJROR{ZIr^mH#pqcFeo7~v@O;C_^H0UVPY3!TGx|D&OWpoSZ
zHhHvMKs6r?3YPLVhgbSfJ>zW+Ls>9)1^a*sLle;0BCY}bZa5egKM{hhT+s;GNETpZ
zH6yru%*${;`2g1LZ=Tox*^2UP*iTD~rWDC5|M@YHoFzy(Up5}Z@miXEeDODz;pdkU
z6M#h(3EWfIzUlr0R8@il&Pz$cE;hQm1Ye;DW`%HrgRd0!i*fD1M~4E615&j%KoO+6
zBWBWi3EWjkWQ=@O?nu!3$8s8<sDXi79NP)K!E<)4g>l=4yDN6ns{KS_+n)lkoCOHX
zU2@|t4><@7pp`L-;)gu0|2R5t&9xPSj?S%p^KkZ4*p4KK(|#L~rt@GETneK<|DX5e
z$)Af(MR`-|w+F}XSRzE2Nf?Ny>{^#t1Oib(8_FAA%?vxM!7>YuELQ;FuZkQhGW5_r
z|Kd|Ldw;U;VLx@0$L7~&XA0o9e+S=pButW`V^#EuU=r0|V%Af7@8WenwtKhT{t@mp
zfDNf}xotm-kC2IWzPXGZzX(=s^#EK=*#?^5glioD`223))v|I*x&Rdc?s82aT&P{-
zfF9_^3rutI)^}FSnGo&+{w^H4)mN6yBEI+KBn~hhsK{G(6)#GcxPVO1Z^d*!Tl3c8
z*}qTU{Lh<)>*0@n4*n_SKF@z%^=pJxZ+8#CfhJo8k42jq54AR|P)?;hAllyp;^#0R
z6&&BE?$YVF=7tAW9RE;bbqBz~cL&ft-Sazah~^fgWHc5xK`TERt)ZuPcOX-tWcR|5
zq1R|Jw7)=yzb14=Y9GwN34M?Woi`9v5ZszZ_wfc$DAa1InJZ$IFvKA^u#GcqOZo%U
zo&V7?7Bh(Fo8}U12am!@*k#>H{4dAVA|$v!zBat}1Db7GoSm|3f-qm@Ry&)a4bu1(
z%Co;ph<_cz;M-QppRRH(XU>26FFXHd#qrk(t$zrfq8qdeibBhbu1B~<>krgwUh&rD
zn-WI@$w!R9I-@d?-*G{H6e!k27cVToFE3XIOcxtrFN^d;(7!2ZSJ=>^Q<J8FwZ+;J
zh8kL*pDz!#x$)w_s8TeD^g6waCx9hp=m+dAde+m#JUH#XNRXxiSWTl_2+bzE0nXhw
zq6ssskzc-hSOHeRpxAXDTXIz$+mhh`Ty)zfXgyQr_{a!l4QUckfI5IZ!ot2P+_)P`
z`jDFhu;}{VE<DIn2H`+_*7tu1hx<RnAx!fA57WZ`mMu}=!@)8DCmnRH4N!k9{3d~|
z8Bp?x1^OL;lC+gzu5{3sCfgCEp--ie`GkuHzkiM;;i=1FaR++@r*TUYYz@3F5;Vr6
z-N^#>sWhNOw}&dXY0}Ze5@c*}F6f(JV{qjLu=k)KrQSV2gDIB>zz32rZ6pNZ6cxWs
zf}RO>WvCwv|4f>P_Z`uV9vyS^+|!o_^oopL5v={3eF)?d2fz|$WM37Utv|vY+50?l
z<Oh|bIUlXXCO8qYpIrKR*#9c#eul-RUq+})CtphZ=W-?gyF2kP35GDyrg7?(<eLER
zr5zv_UnMkvi=51LYm>!1ZXDpZQ4*fPV4n)@Jg?`$CbAenh)9@1;#{b}*R#T45M>($
zI9TF^^0%p8t$)-tFyH`I9YsnsfC{}u7;YO8M4EGeQCi%i6@68c`Ih6}w;2Zl#;(Wl
z5QTrIv4puhVBG2<C$BkOI#Ua0Omx3FEglHZbYupfb-DDq^C<YNBf9VYi0}Ws_Ltay
z#(rg*-~UjWSrJaZDDYW(L@;j;W=Oq1;8u>nfPY^CCF;HtNifs`n$Nq*-bb!a;rClr
z7k9z-?OJaK9E%JMgueYGI4+_I@=NC<klAkoZjiMuT$Stmq>mQPx*oT{cYZ!Mq*T%z
z@G`b~ACQh_foy0*YIZ6LwwMU|xShu9b?&>-=g65yFb<!5PZxv3rWJUnQCW`bnR!le
zY~!Mri$Lfz9{|U+RxlAWq<9X_6=+EpA9<oJ0oFh?1C&Jpc)U@ty!b!teR(+4ZTq*j
zTbrd+DqA}eDkAH&p-7VyAtc$dhY`k1l4NfoWSLM@ma&g@hOF5|wwW>Z-B^YhW6aEZ
zxufUzbU)AW{`3C#{*I%A?@?dmy3XZue$MmyT&o$ev2ImSDQC~tFSkHgI41b=zk~(e
zwWWFSVq4aK2@6M7!vb1p1h@c90r0_gX$KXU;EcqMD<$B#V12l_?njL<;cV;H#Imz~
zug1?;Ju>acFqW9cW5Omoz$D2>Ac+HG0k-;z(3P0CU`e{CuPA}kPzXlTHl1ODOUK{N
z4c6dC!9>t5ul<KJGbJcsi6U0D$07!acQlrP(9$&+(M^9QU~%Dd%cxPZe+2zqRHli4
zov1+(P{6!Gdhi2CV%|N2MLrNS%;f{fbD#K+Z*?F!?tAb-@jr+B7i(Z#M)}^$e;wHT
zpG!~+;PLcLkLlA$kl*To@RR*utg=V85ZC#a)1a=C0!tC<{S}Kf0U^#eP)*fwEn&Bl
z{Vfc9n5`^~O<T2UC)yO^0Td24)}M<o7~^hOoih{@(LQKwlGMQY37p?kU*#<s?W-bh
z-V7?&$$gO+ppH-rN{<KhgLh17)J3M8ZUMQTp}bBLErVoTG%v<am2_6cvH?^1e6c)y
zRlaBYnD3p{_&T=f^s?n{Q7*yrH_13QtBd(|M#TSmeLg5pY@$y{rW%Vetq*K@^q=LJ
zffVU4DetyHKlpzR2@UHZf!`FKMR+n8BG(9ds3(G}z1M`v93oS{e0dEtXDnfxA0HzI
zd_;$KfIi0d_De$Jabn*&g`a#V0l~p%_<h|eSI!a8(^U(Fu$~B1fI)BZqw2w1ubg!t
zoG%=Dqc!ES3al=3D;&#=g;2mC0ACz#S??(hOgv`yzYyqA+b4C;T4@yMPv&Hu1arvQ
zt?B|*p`A5xmr#z;!nz|y5556yo4*y7K$5nFJk4uXWmIm5P#R<&k3?Gqn)tp4O%gt@
z3om9+`;+%g0|5C+EigCpal%59-~P|PZUFe7=CB$-Uzx2HLpyo+2Y%0V{m!7Pub=%}
zVckTjfdpE&XCJkT38W|@Qa3%hd5g1F8oPAqjlvtwpFxK4jPj>ICDsP;toQi!&?fdS
zEqtOVc=l?KU^P*QxpG>Dw4--1&W#)GWX**kH$R|*^XF2X#_n<6H-sF{y>ZuitNxy3
zi!Oc8IwImZcKCqu6DO@I^&&(<Gv*#QH$cqZ-cQtKBHqg`udEV~-dLpFPDz$Dh?tUk
z$y+vpdQ$Sjg**RwqfhbvQj)hctF`_wRiE#wPWEtK#R`bqCw>3o%GSYx7J1goK14o<
zjp?ASzKT-y9s*;q6qHodpjpL>?_hxLKFtbT*!}|)83owYiQoL5M-obGG?JORGHJ>V
zlz6MDo}hF(^4E;5dD4Es1QA@@w0-V2DU1rPs?|=p1o2D1BNK}`-)YIWsbCfpUV*HX
zERp!3j(-_mzj*%)=}lPKJ0k~iFld{%L(&v`ugG=$h=V1ZeQY#x$_^msH+gTzT|jWS
z?sDmOGvMEL`a=C0X<;OHu>D_R8~^j2+H-5cfemDg>j6Zxp{zE}hJ$6AUYe7-y2QXB
zG7Pa!*GcG#9az1vJs2FzAU6T7^^g*|!2Dh(c6mZV$+IxN0QC5V-)Kn%to{CIgB*25
z*RlIa`_DUlP@b<n>T`FQHX|)vy70z3V^!HN@6q17QpARJy{xXEZ}LzXgwO9*GsUE{
z8TPn{4~a#^fa+y)aSPyjEdb)=$0FazXf3X;z%6?jzF}Yh(f56?|7Qc3U0Z<)fdl_i
zd-%87Vd&Z4wF4|lKV=qpZ?`49PCTWS530PYh5;bKE6_ctX%ac};Q8vQbZ3k0#|ME9
z!CNptf+wzCS3jJV(-b(_vr6(gA{jApY%oYv4}^;k>Ys=R27;7@VEb<A=o|)jZtM;@
zIj#JpfA&jydfw4G+vwg>uX@lRi`A9v1q+zEs_W4GSgN3JBM=fWGCU<yx3L3Y#riq0
z3@JE}iUU;bKH98iRWQcAodo$F{mD}fc)^$a=zzzoW{`RD#OCc0WzYPy9`+Adh`Z0|
z;|Suz*?az3L>^m{{l8ur4I<<rZy-DQ!%Cg&&n2{0SThdv=e6PR_uBT;J$XNX+!;@K
zYDSSJkaVygwYky<=DP_l*jL=`uU$Yc&nXTUd(YayDR>B+5_@f|9#^*7M>w^4(svWZ
zkKaUWwFTHX3S=(cfn#N)iV3jn0gWl38aON0tn9auTQA-4xSE<;{!v7kjgpqgqZWSw
zS)k#nefIItRWGDB)6qN1G5Vm<h|%M0aJDBK2*n*gHH1Y!I!uc>w#2&jQgRp^p}v2u
zuyyC2Roan*>&W4onVW^-3-sJ&IoH0Yxplhx|50l4UipQm4^&1e1G>lqkcj8P1oHkT
z09&P2KUn-7FG~MDi*a~Wuh#y7d3Err63{7iM^IGH1OGSNCv9?SwWJJ>h^SKA7PeRF
zRUAOw2JzlhgJSvhgwT<*TBfzXHfd`~xIFB`Df}{yfuuH_8+()3KoKW4G7+2`1g_lV
zy}7yl;^xg)Zk9+W+MbswRyre)WlC+UuB;?iBch_ZLb_gtFmpv<@|JpW&ijRox1e7h
z;os|{w?Sv<WUZR@(2tgT?;WULlt=X=(|~%O%LJj9CGw1g5|yBQAEjI9#VOK9j2x*W
zNG6&+jHTwG3s<ifC!4Y-k;V%94k}grHL?m4<6u2Ds*Az+JNm}M9ca^;X>cVAxJjH=
zN(Rt(5mr42lqX7&DCS%HTTOC!Hc$_7@8%m=J(GpB14H^`FdE<nun>mvBN97w1HxP=
z;c|2+8b3h`buZb}1}Rkadd6&8={YchKUJ+yk-V`8W~y8OSCGM=v00>I9BUE>6Ogm}
zEc;|QLZ1K*=8&=T5v|F!NV+up69d8?We>S6(BCFSEj7N9KgGv+=0Zi@n;H(Wp-Y=#
z+c!drr#s1`xPmq}`)4V=MmLnck8h(WRkh!I^XuBKe|<ddvN1KAJMW}(6TGb5XY16l
z&38H5JiBk4?bBSps`$$Ky=d=Vmc5$1sf9CR0qt>Da6`RQC>zJbut!ws-=Rf}863$1
zx|Nh`^A<u~UCzarBa}ef1#RjcCeVMawZee5TM>>?jHAS$b5iQqsmMh%0dQ86VSdo-
zI1mH~(N^)%x`jZ^L?WgT&`BnddHsuB=3&Fi00h|4_>pt`f{%d^GJM)*ieA3gOBZp3
zjbe?XmSc0YYuUrN6@HqZG`!r(1!$cVI08k&hz1q|$)2I>_UAa)B5ce7(sv;(cVJdt
zc${R%ASsRnh0)l-)gqP#S~5kelWEMKrp&$mL>$AN-DH7<<%3Q;>4mUWBj$W7rgYk#
zZgquPFCoHSsxgMC;0v6S7>$mILDnF0C5$Wzp$E9XiK|&Xnn48m%~47}N1>q)2IMdI
zW?mPp<lySm6yEgVt|7mYiTBUx2S}nCx__(kY}pJU8IPRiCLm2|<eX+FAV^>D)D+pp
z2U(fy*^DxD4A8w}{jUvMzp7X3>is(%33|tyjtdSH`h8r??$@y`J;iF-njXmo86EoP
zeS>9%hdUGAAu8Z<eewh+Uy>_9ZmC;+l+DDkY44Fm%5-)Zdk(UqZaZ}|NA$Zt^c5SA
zV;V)Os6^}Mx3ZwDA?Rr$av917*V)WMJuG6%fDNvo#P396n~sJl51_bF_VM<fah?-j
zR!2I%to%^do5?{j(-^=vQ1apsA64@hm44jhVkD9tNp@t7I1+4O-?$J;lkmy+d~XFi
z;kGGMa0-FpG6$MW4(Nv(*|?i;m}hT!<S273&^HBqcdZq8_x;HJ<ey)M%6aUTExkMN
zH=H$uJnoV#ccinw1xXj8@VaF)?CA>faHPp&w57mEXSzG5U?y5=rNx){MHE*)jb%9O
z2yy<Y1O%;S-7w}13DppY=jb@Oa!@|QQ}fy!CFPSjwBB%mhmEBZMT+=Mdq%jGh7P$?
zm3rTYce*s&yOEgXW0B@ih4Ck}7o8~~qfiGdQDwes##=-KN8Rc^GA^pY@LI?cC4@P$
z)J#T`B8{VPodW;3Y0k%C&G8<UUZ1oeS{ZwCrAK<_?tRx$Z`gW1Ju)w+_4nPD>sRMp
zJ$!mdv0c+Hs`<min0@SN;Cy5N+v*QkKsPtZ`B*{YOfe3|CRmx0?{aB>Zx8cr<9B)d
zLbSbSGs5Q(+yZ(5GL_kCSrBYQeLge)mcg*QZ(<8oYnE%YYWSv|w^}<JQ-l8U7kqs6
zWt%sxnB=xvGe|eb-;HZ*o(DjV{FvPjS>dDsKCkfJ6v+x&#G*jhE|JWE@}}jU=ur^P
z?ora?CaBYRru5Q7<oAAnA5w2OWcYP^#CpFFbZIyfVQz651+h5D?B(&O_<<fZvqftP
z;|d0)FymIZskoJKM}_V<nC4vPUQea5);<=e@M8$kH3gqJ=}Bwlx!00pp|eOe?VWb$
zcJ<O}nU%sTv*TTwAA{AOeUWrh^MJqfJ?98Kb-rG>qi{5~KNR1Eh`T3oMHi8&5eG7N
zm+|A)V*WSFBqp<ykgAkltU@KUc~6+nXa)9vhbRL=Cd3v_1YNS~I9ueoL&I*vm<+cV
zd3L#eBjP&+%Bu2D!cEbMGo&$L#FN}|Rogv`D&KI{9gRP4*@Vgc-r=<KzPToPnbw{u
zi`gemHf8PG$FL1<Z}l{gxttz(&PC_TpZ9Hk+`a#?&?5^upznxZ@&+&v&v%8#DFtMu
z8yFp7ZtMIx6$YEj@rkbzU|+=@+9i$hmqLg$o}I-6RmN1?T`MaoLXlf49t2~JSN4xc
zZE}aJOn}V7hhhNYh=2o~1WAo_cM(9h$K7qC@{YYztK9(FJ4{KHMU3m>ZXW~Q7T}QY
zRlF4$TDw7$^z-UjK7iSTMnNm``B*ZpB}Nr_=?IYu(hsq;F{AqH&|FJJSfLWq8_M-O
zjMU^a<u>%%zatdoIxt5bOB%_^S{c#Cxw@~+OIeAc7&*=GkNdRr%iSPFKgnK*7=0rQ
z!dGeJa|HoVHq$^d?*MISB!w6R3uQzu&P79wN91zh>Z3Pc-{i#yXP?`@!BR391RuuC
z=#4B<Dtb|$`Z2}P)Vnl@IUA-Jw9;=X#~svj8nx(6R<P=kh6=`&rkBE|y82aVJo(W`
zc<J|())jEBx7&Ybx3z~un!n=ejr2&H(o>$_BDf!wrfoJ~d6#!OJ@QU>xX9_(LSW+}
z!cP6^()-`9rbh{k8NxbhUUdD2=hFfkLHutx@l6(;8ecQYn$yI1<K-glrPxy`(pp-c
z>UkN(bNk$9ym@Zqnz4LHs#6FjqPE9F(fB1#nub-}JA6qYrIS_^<51Wb#|*_3@r9DE
zX60VF|K3@w&_LG_=eFoZ&Z?2aILwZ4J~#Lg)Vmp5%SG`Q_Wa<*t{OcT%2c5-JB*Qo
z=@I5ZmUp(PzxdPE(l~tX82B4Tfb-V(CN1nA!g?R4NB*oanY3^_VQ{U$3_LW(-afhh
z3#})h%e#PyY6^__AKXj-eSzy|-u?40J`Fr+s{T59<~t7u%F{APCCfVq?~W=Z`f%=~
zMe1a*%EJg?s^jhq7p0poHAfi+#MnfbKo6|4bmp6jq187KJCxYlb*QpaqU_mRFT`XJ
z`IRpfgWJr<u0N|Cr{VxL1LTf9IrB32V*xo?c3yNQQP$4XbKHW~H5fxY%qcQPC79D%
z^6*8ATWFOdDN_LqFS@f=h>8Vn{M`6?S#TgHo;V-tH8F0*Y+C{4Ed&GHBJYm9Wb=8|
zWriq$#h4zX;@z>xZ2=GgAuq#ykV9~i+GxR1Zpg=TVIG2a!9`hiQWntAX4d11VQQqn
z!4bwC61GESu2KXp1XO{nD^`>(pD**SNA6z_ceOU_SqMG4Ghi1ZU?^>SB55(3HTkab
zSe{8owT0fWp>)h%1Nz>7{~BJOD!yL}%@2tWT!&&E$9xVu-rcv&`X^<KvZ;(jpgd)K
zm&7nce~dQR`%YCSg)JZrVUfnLxhi?qkd;(wOlj}qo*04=)FTPm456vazGC!qVV+Rj
zG(`GMJn0s+B|d1e5MD!|m+51-iM-_2pyOY>qsdFuQo9}+N%9U;Aq<O@cJ0zie|+iU
zJ~nY5GJhAU(-vkh+N8{U=sq74nj+Tuci^>zjzgG|qJ{GDPHD&=-c;H7#|!`v+KsIh
z(u^=tj{1nVb?@XB==qq~sZb@VnEN6RVk#anaR7N9zm=VWqQ6A4Ym>r?W8{fu0v(tF
zeRsQ*!cO@f-6fKN=XPZNxRRS7mcbMtR)i^&nJe7|=s*{l>{x{7q>w{Qh$B4@W&a++
zo{}MM;KJFJn{wR6IFz!3IHSXikSqz>zz*plsqCzRz7kAvlBw4d6S;bMB!iCbQda$5
zy4XIUoD7w#ubH?huf~*q3U5VhsH~P?sD(fgLj%>8%__K`-s7nxz?D<RR7SBCIMYfV
z4qBG!!>$LoD{o7ilm~CqM*5Vy^QZUH{3J3KVkT%1CnPPGc~+D9<Aq1qMfShl{0lDs
zy>NEj`O0id({88(C@}fXP+DRnq@$kI2a-kuXX&4J+xi%+W(VMURtmS~CD;5?>CE32
z5#aoja+SHE&p6+it^w(75A<v<rDlhe&g5}k$5ofk4rq}BrI9YVW`wDF2<#fGl42(_
zOJcXltH*qv?h=J8tGfThpk0hmNbFDd{O*;39lbw2SCl#leZmJEdl5nQhCK3P7&*K1
zvrG|IC6ijNaWFJEFjR@W-<{lTbvu+zl130AMAilT)|G~w=Hh9zU8-PB*OLZYB7GDq
zB-5#CXLAKrBjlCqwbUv~(2~a19%ffWg&}8;&_ZTbT2xp|Z#_KPVjipN!-ti=56(8u
zn2aLWjK*Gzw&YP$_6UMD7=!3&|0IpClB+}xW$&0m@0q&u#f2d~1H;%A5hLy4L|bEO
zJ+D2w9)hq@MfXfxH)?7dj(OYwcPaUTT1Nme+-~o@7r)xhn?7CY@|VtVt`j7bj7O3~
zO?!vE<B&}T4ujQ6D-1uoC`<|qD0uuu`^dcG=RL)&fw;a7^Ft!&sa^!AV__r2n59h(
zI*40dRAJo|(C@kS&l{J&uDN~M56M&Mk$X>NyBkVt8DZKzyRCbzOQ#Gm9wq9@i`f%-
zSKj>@oEx64CY7Gkkf2>}puaPY{18|D5$6m~VQ~n@DM-0D^Mx^yKBL+u<ThkRR>SW{
zR)jga@i3cMf?1_aPw?X8@VC8vq)~x~jfzv5zQj*6LiU2#=}=OE5fbK)cBzYjx>}Vi
zKBSGAL!;3A#4v<sj2Hb=<VqH$NukY_+FZ^lG)CPfr#H$u-3Vb(z>J|0W;roP8Xl=M
z|MGIZ|63A6bdcnYL!(r-FjVrldEmThFrfI7#>h}9kJARGQsx(tl9b~S7n;pg(ao37
zqp)<romR@zGtyVA;XlQ{S=EJZ;ZX5n@%Ey?HzY`ay*Dgk?r<{*nUfjhkMh`FA;j24
z^10%YY9Z&Y!(>l^7%wtC9dAz~62CaAmPbxw@qf8Dd-D`(L)gP&e+7+)LFNz`P{>mc
z`gieg%#^Y(x)YbAw{|(+?Anj(E@c%Y5j)bQ3rq=!NUzz1R_SADM!0hCsmuIDr670g
z31S-co}Sr}&fHex=vvclIXkTcE0}aBImaG;%GaCO3NmpUCI2$6-`~p^WPynY(=aB>
zIg;t;lK~r+>t__(3A1WhKQ2-g$F&`u93g|@nSsUMMwogrv~E5cdngPthBP>yn)?#u
zK<S29L{9+ug-8hE%g9@**4bfa<|rE3tiou>A-_Dzoz=+pDlVSlKbajV*Wk5t`5!>@
z&9<~U#daW`_ZLXjTMnd0enJ}o&=MtYD9!L~^E5akvT);1aB6w&eyy9BeH3c=>UYeV
z(M?rueo<m(aIE@HbJ8T|Q>CeZSro$`T?`^HO~3`hoYPtvnK(<4MovG%40lU95MOYS
zb5KR6AXhx}W_x!u!TftH$vE7AK(9WKp`=8pypHdT#4a0yqvXx>l$-2sE7eQRDevUN
zkkl~95YS5K>^_k;`&?yl^sA%sWDt$$XiCfCF}eFC+a52mj}gK8Lht9Bsb`AV3KTcz
zgiwb&BSz%CzTTu34Gp;Clc~N;hE3Ny2En{pg(#{D*O8pDN0$tck$vunio%)9h333Y
zcDqP@Agfj`4rLwF?C~l1GM<OSy(^j8%&h2CM;ez2$}u-qxXJepkV|JSl8B%|^Z;rG
z@z0PD7;!hi^%{G&7OzMP-!!AVg%(QS=$jnL$T9@^s7S%n%f6E&1WO`gMt4A0zT16E
zu{Q%oQ()9@`Rm6twnmtBPaNX`Oq8r;O3#;892q-G*fLrw11SMJZV()aTo`~)K|R~H
z<$q^4swSsPmyEFou2?>F?q&B?kg;=1wiR$yJI|wkg05@p0Kzw8F?$!-YWs$immT%$
zV!0;opaC87X<I-R+54LN&ooo^Ve^Z7{y$#OFZ!!D{f4}UP7iVIP~}fZjo0Yp;i!l1
zfDF2NJzM#nBw8D3KyssP0uZeA?WcNyj#V7TK$_xu^c&@BMO@nZ$z(6#Sy-F;M7W4@
z1Y?*<LiDF1%$@Vgm!Yc6i-Dz<0%2?x3Tq%<@ua!XiY_{A1*3-3rmih_PbP_YqLJAp
z@|tY;3@2nB+QuV)I>$rhRLZzCxuD*DxqB>tJQ~ZCb6;^rQ~Z<7v{2DWJog@(Sm-J+
zs~0ff+sv3U_)L$(pLx`s&$W-jF?vZoy48-02%db=DO1ZVKlHq`$V2D{c3Q{*+|W(L
zH#k-QuTbI>*DeCnl(8jL2yZ$EZDJ2X?-?qoUfCc(%Hg6oDhzAyjnwEm!A|D4Pxi=$
zch9(I6qc*Z*A8OG%tf$W@eNpg#L{{N<A`fU^nVa+J0jO$HR>+6Pam%^ufz!A>oRzX
zS(&=w&Je=Eiqmo^ZSl|96#@=08j<}f%vfMV<uB$x_VoMuo^C=fW>+X51Q`N32c5KN
z%A$T+%+8mn`5endNectjNRyVvpULIE;l|4umu)Ima+4CMzgeP?RY$g&x_`s(*Va1b
zhRou!xaPVgymr$;hnh@^WP3cI=#u#{%sPH!*f^cs=gVEo!yX#J6VM26sDqW`H_=>|
z)5Dz5c1a0==Q$}q**3Eem-S7$$*SxsbVTatOg&Ujn&#b4uWBoz)KN!Z_zys988VIv
zG$s2tPIkZTg)C;#B4U<kGy=`Yof(p(J!BQ<{8fprUBj5S>H1-XKfyfxax@-4A-qCN
zBEQx^&d9O*4gQ8`P#@A#QD+f_#H5y7i&n$GW#Q!-NV9|5bZNC%W>cF0$^qrJunrio
z&GWJ1j#14I>K^PcWzT+cEQ&ONx2798B3t{~BK`b1vvN`_@=D*wD>n1&^zS)^T4eTJ
z4lA<FU}o_gUHSAvf<?zWOm?J)>^v{hGh(i50%i3dpe;Jy8{`2JL}$o=rL_L4C$R&`
zu{3)W=T0geQ8%6Ooxzm}x%MH*B9a~ar#c2hReItW88UfhSalsR)b#J3`|8FTTPHVf
zD2*R$4exxJYtq4tJd<ZaCD)0AeQw=!0-(L<eP@4r=i0-4r?nmKt2pZa`}-dF8|__l
z1^9n?L!UbindG(9PZB+fEt87@{<+J8DTKyOsItTKi-bU@;be~XG>WzK$pJ_t)KAVP
zuUsz359wLm+Rr)J&F~4|)!aK=k>ARcCx436U^;eZA4k4{dsM89vgc0H>hdEcrh)eH
z_bxjVNBjpkX%kPOhzT;sUBCA<gbSac8lb}PY0$>>lH)y=4FVq(&F#mZMv_kpjMPKb
za0>%2L^FTk+mq4~1>|ZYLMcsUEbLzpE1ZjBx-t()S+;>g6cR9JaOGhn0>MBN%){(q
z{mDxPE3;t;kM{^V|Iv6aL@MKlK6W})kiFbl=)xMazfCIw^{xR2iZKx3z>vV-+lM!T
zdg%&F2#hU0r`I`s|Dy=w^)Xp@IA7p!A;JJ@gOyj+$TgAc-gM&Z3xK|xkCpQOS%#Ty
z+gZr{iHlMZ8d4Gfko(_%g17DTsK~zhc`bqpe8|x*?$#xkql4@!;MChTCIE+gWK?62
zFUK2v7?m1QFt3?BD;+t6{P+tx+QcoyYx#>+N#r_`vc-xoRp>Ssp^X<+9N)<|M9LGb
z1W4xS#mUaXFyvTbiDu`>Vm=q8EpvK8W(PTeq%wk~`HBoXlM6dd$XqqJCLu(vj|1Sj
z>rrB=sa%xEdn*p^O9`B#%t+Eb_Mj0_g|^bcALrf_P3{WOV9@Hb&9H(JGaeIgdgSr0
zQ>2A<j~?x$P7}7SJ9`t3BBe_04<ce2Q^OAQZfWAQJ7Kt9b-`x`DCMV&#vil_jL;=E
zP0HChiN-B?1}%1mLN3N_`N~C!=znwg-yPu4#?r0pD8+QrLO=zCIWF8Pw_p#b&%%!S
z9|m8N{{+8NJJ+&SoLRM)#v1y)%kj7A^CEhOzmB#pZYrBZJ`{)nh}I6VR-zwkRvG4k
zZfch6!99Y;G@Eb=7vLBz43e&`Dp+;Xu91H2{DAXbLSR6OoUPSFnTcW90CTO<#}4MJ
zvP(!Uq|tGzfrxQTCkQ&wiu_b4d(S)?QFFkRt;Ic4+Ba1vy<53>*n`&0ZVtuU0_z)&
zZBk&^la~ffMj2b#;_QG48vcpUqrrEj@7yYs1qMM0onogKGb|$vwPX1fPZ)JtIuc``
zs;zMz%ilvOA4|3o_4l)L#<;*FQ*o8|Ft|R$`uq&kgAzav#>7w6=bB-a4Lzm*TvF!x
zlB)k+(wtvQ+VgOgO$d%L{B5agh@i~yIN*@O<r>gG4H8S%LrnSK!0+M7UuHa0#MnSf
zLfOr~3<Gjr1O?<m{zC$W1=3oKim{@XMNA67(}!ubN5i~|S6tmq@3Z0G<+@d^V(fEL
zT4>$5EYM6TltzpT6gWp3dt#NAK5Tkiypn7WJmMI2DqyO6Qf0KXqLe&#w7xNMrdSS*
z0XX!9y*>)J+~`dfm1h!am{b|4i)iWGVuWC#zzAP;LP>w=O66iP8A}?eZ-$#{2s*#?
zBKeKpUTzEqBTK~qOW}&liy_o#D6+-=F0L16+QCKXZyU~mTx3qCqTO={r)GS*AV@Zp
z<Rpz-c!Rf{DJA$%^J}wMffCGww@}6MxW#;VUCB;0kVrNb4xn(;`3}VQH49&$C8X&r
zhC^@13%X!X@1Mx(g5w&?o6q&Mqh8Ka7K9J`s7_CVX;(lKas@~i{18TDbqhb+r8;#9
zFli<KWYXH!%J~!_uDsu2$NCrmXIkc*E+_9TDi<L*qU;@51b!SDbvynrvxQU2l~Xv=
zQIt5(*F+=OO1slFq+#HW3Mz7CUY?Q?kL;0a1+9S$unkeK_QK2J6%n;dUj{w=YGZ8C
zxNai5>@v1mYO<r4h8>LyfmV=KhIGkwj;yjy3CAAfP-_j*9qaBZZHhC~r`4beD#5Ut
z)DLs#&$bj#{0sWEZc7#SMUOT~_W~v4qJYT5wionyX_@EHDChxy5T49#XyZzp+9WYX
zcJ7QWZk2@#G*(bEWhMvt&bdMv`eqcUA-`)LkYs0HuxuW<GvYQ8LyBVWu3M!aFrf9{
zQFQMG7X?>9WKC2wYakcRaGR(uBFwTa9<hMZO=|f^H)TwFExqP%Xz}b;4+Atx)e8^6
z*Ea71A3VY(M>PNDF)cLz=|mOlJf;A@$L{r@FScuy#~gx@9rabhGDJ8mFCdvQ3}Tq$
zL6vhW=co&`oF?U;akI-I4$NgYkTFfEH8~+oGsu}@;)cP-1yhXnIJ9SEVahEa0^CAS
z&SFZFGedGA0`?!dP)*DV0Y_&Vk@f-YK9;~)=#KJE#(UF@i7w5!KJG3@5z}5OG+&1i
zWXgJnx15_*gbnJDYmaif`A4Jea#$5%s{IbQL3#Sy#(IH~963@kwT28va2Ffpr;1XQ
zW@2TCw&~vQDDOt|i?l%tSY^4(l6DQhf(we6o9HR&%{NoEg>1v88M~u+ia-+A()$T%
z92)@T8@SdR<+TzZYMj48$*XP`+NlEmH^6R&_j+`el9N%aZ^g}BaR7c1v(QR)rFP~y
z<NUbC?j*`nFx&8;!XGj#j3HsYyp$ML2jm<4q4nQZL$WOEmU?`{1;=<K$lWPuc=3S!
zj5p00wbY^(adxL%1I{wijT~ncr|ztsW2)Evq+v{2T$%1~Md-vihoE!9=&HjX<=ZE8
zoyu5@qRTuAEiv{Gj)sgKY^SO_*d`?sOOIB~7y79X7@?rw|II%~tU;Q;l(3i$*IbfM
z3!6K=%`QDs0kmZ%?!7+#XMD{$@hes~d*%+Au2s;mTdREjsoniwM_<oxDhr+watEy_
z>>_phgq_SnDjNGfQpmaTFxi_wevn)^gCQ>qI4%x@6BD0{m!7!~yJgD{Lm*zPViH*n
zOU`30f!kjvS)@Cp)b_?;Am7<$%*vwutgCp&Z?C)3ISuVq1)3!N3GYigd%X&^NM50M
zr6-qY>!r!h<?fNCTk-3#dep5*9u0XI)9FZEtjISo6Ule&`8k@eZ{lpa@&iMlf=2Gg
z#BR$8eN$pTWxISsO7LX>Q#y12usSIe7Gg)f2OIZVIl-Erv%sGgQI(uD(l;Fy&M|!-
z)yc!YPdUz-q80Q7w~?l9D9|@^>jU5x@$IjqmGIR07xWijBN9P9&!ELJxJ^5#o64s8
zWSSkE@%g0>kgp#=R;MF}RCCQ#H4@~1gV?o)mYA}yX_wPAW9>J602^VN+vXYV0>Wq$
zaNfPAo}?_Ey?XT@bq{L|8qmW~o_l_|txp^v%j8c5ZO)(YfS1Q_j8lnF@k(5_l44)j
zGaQG*b`s}vlqO>`?I|wQj}sWY`aD?h3U6|de(1zq`mjiG<#b^Uc`q(z`a4Cxhi@#W
zvxrN8U<GkAK$JKq<<aS&XLStC=apk#!%cJX3S5c96{XDQdi11`GE<f49|wu!DcIME
z@0Uf@iR_yeZ{d34UPnChby(>s@neAQh{PNvt!g8A4;-CotoNYcIYpdF?0#rTH&_>?
zS9SYP#@?2T!kCm=QzlcSIMUQJz_Lj=a>m3KSLxJS-1OMAbp9a5ZBkF57?eiMlB`Ns
zy+T{TI*8ctwOeYUN$wcDw1M3+9Zd+GM&IVPz;QUUikov&!bNV2HwOn-Xv>Gi-$3@$
zkwc-X6SIbK64-em%p!f1ShOhTu4>#6XIQmi`x8aIcY}#?^;R~|akuBBrEm??MUyY8
zck0SF%m7}4+$MsnWQ^sQsWR%hM&n%GIr8IAllI5%?OiR-Ob=McDB0WJk^0k<l$6$K
z?vb}0^%D<sO_CSSTKaX=AJX~UQNMkk=kI>mdf`M__dTzLcGNmSb?g^Gm7VuSL*xat
zOMPk-g`bEKbm~Jm0LF2=tt5wB59V}$lH)gvB7ggQ$UvsAgh0EJP_Tqu_k4-hM6?yL
zp1Na$7oKmJM`7&gLkJ$@=ngPCCuY%)KdsRdPw>8PKZtxJ=sm&JD96~r0kuQa$wfK3
zd38z42*Rwr-+CIsF9%=lV9%hQ{7`XZT0tWqV`WTEl(hXE)W`&3*kO)C5+DXF$&|Q<
zxYMny`h9KGFaN5{|7H8UM>9`O-b~$X73@Ybzl<J#&g99u@s{51X+RC$nI7p!k@(r+
zX>d~f=b!ZdhFwwoK46w3*9>8jl#E!%aH2;6V5mRRnjWFN@B2;fpt7^O`vT@GlN;w>
zy$W2fSAL_HQ-Nzf7j#f#QDS4N=7mX%RK>@EMt>589a3vQYr2Wg;>6m%?f@VX{472L
z36E265|;P*SR8w$awe#=pZbsmdSsh*|IsZ3zxR&AzkcD-OMmIa1(t2+1F3pDPyD6d
zkY}w>^Es#ai<>k}dV9rY4ZxNq{#|L+-s{j54tn?*`)52@Z;TbKbD`Sz&iz?QufOvy
z`WL5;YdD(TwZ43Qzbd(%w#UQN&fX^dYoFE)^4H%G*J{V96B!5p+dK8w*Z%(_ul4NK
zUdsIT%XD9WDXk+1zB>M<^8fwe_f!asPoL}G|7jhX@cLM+xrQ|5s)XEnRb=)nEmatP
zH-EkJ=Q^ePd%xEnF37L>VR1m}KN`Vn@06WgYdA)FeB2we=6Y$Tf3=s)(ucCHzL@xj
znXE12hxJfSth{siPg7c7>gcsfx?cH5p!V8JdQpFe?#fKP`Mbw1FRpjB{#@dgb)e@k
z@bw=R=K4}MtfdAEVVkOTi<JO-BJfV_!QC~B{k@w1{xEi8%_-%bfBwlEtiO5Ja*dEV
z8<zWE%{hJcf;|BqaVBle`~Kl@zZTb(?{0+K=Q{y8F$ItQ+?(|;IVH2^anTxvS?lJ%
zoeuy~i`V=AUz>k;RM?$$Er9j?`CnI9CnEmW6+nLa|HT#l*ZlvCNdIg8|7-q#X5e)=
z^#3~$@=@M*z;}7yIw<%9EOdEn74)b)tQD8mQUA{K$)4EtjIy5Of4N$k!p6&Kk)V6`
zK4zch)io&e&X)snUSI%Z`vb3Qj+o#4uUJ%x$H&4H3a0g&WcVZgF+%$5C!E^ka~SkD
z%n%3EZ=G55@3Mo(%6OVy6o6L0@O+mSd+NIhx`&NE;P>`>Di_suileG~E>K8LL_~yt
zv~eT8!4C&7+NYLb@ZMnQ$~%$FXZcseQnamgReh?9P-VvMe2O1Wz=D=-Ud?3>eiVup
zei9dx|J*njqjrg)Dt3_fFf8y#^1!QamfFtv3S$>hZ_RDigygf>eODWrilfcTp2sA5
zz_aAfCvva87>?A;x#gzZplv&6u%Qzo!VgPN^t;+8rsFR+%xA5M*#y&v^YYqia70kb
zdzL2l-5mBjFI6+FoOg7k&aI_JZPT;L8#+A;`(N$Bs1SDf$f|REkbI9s;OF3o7~H#w
zkl`$HimLjd^WQ?n-R!?Pdnbu?q}d~Wz<A@FIb>j_*LU9k=z5j7A)M^wC!{-Z7TaZF
z&Q<YOg0Zt~@Wt~_Dje=8y+UF3naYtQ_?J%zjB0(LFZyQ+%zqiyAh_)3DbnnC>K<=;
zO4`N5LEUu6wXh3YHx{cEV)F$vhSXFOe*C;Hd;GNGiPLs%`qQ}1CB8?u@4Cw?nuK>w
zw{8p2eRQHHov*fs@ubmodh_AeEKRJptY`UQ#Ng6GPK@`DdTe}0p~;Ac|4P<np|G%K
z0!y3=Y3F+ItFEkkdX?3dPyGuO!aW{{p@7|PtGm-NAS05%Xo>$2lXxxdvf@db;apj1
zY@twdorjK)SNuUO|MMs3st(>fb7%ZeViwt2-MvfZ&c=i8w+@)@IA%G@=MuVs&mr)H
zbH%QREKwawYsvxRCS9;CKDb^3Uc~+^+r3|STQ}?;Z=2>I?%nhvCzRvC=%$nnf%P7b
zG?pUh<AaGCE<S)JF1@rC!R(S(Z1?Bj%T}vk#MLd9E!#X&rv-~r@8yag+IaD(&qvuB
zu7l2<?3Un7QPtkJux+j_D82NmW5l=ohR%us6@k8HT;IwiV5vPmvo2pACpbQONjZKq
z1L6_IMQ@)sdRAa`xt1^Mpj`j_$^#FBpO0nW@=f~OO`7#Syce#}OAf_`kF-}wQV(fz
zoUgc{cXHsv*DA%`n6SmgEIV&5X#=K?_R2yoWt%MQEq)~B@q_SCcN307rkzJ1^Ambk
zgXd4+vUa1L_dhPZE-(@ey|rGK`CQyK>ziZ2-e9W#V<@YW#i{@GF+<}p?CmY9_&TN}
zEvHNSJ;}<2t>Ay5|B8N>wq~43&(O=2qTGa}sNxqBF4A9DcWs6T-h8#~Vxnl`Ynil5
zIntip{Kv3m{II+&<u_$on?x0b?s`4F?drO6PLF*@f;KVuD6?kxiZXO~$AiG-g83Ev
zd}z2)JR-4dn^K~<^V}8>DZ;ZAi9y@(5bm%VrOaqEI$V6a`aR40GR3KN8!s*9HWr7K
zeo_3Yc(s(J;~0C+GP3&H`=42cMS5imT<6Y)XvA)Pb0sUK#SlKSgO+fkRl7A8>c8*8
zu<IFVtio`Yxujw=rI_RP`HYZ!zq=0Vm3`&$LGLyle)@75{%q;!Pw)7liz-vm)|#rW
z1YX|8FVBb?Hu$tBk5mos9hxc#Yo1{69e%(FT-w3ZpB|t%+!l#3^lNm(W(<~X{rokA
zuXlGqL?pT3tJPndWDApr_<BWOp`^pAj0-QExv}NiO2e)1JPt<%f*5MEVRlX~Y@aw&
zr)W+3hVA?PZ^w9Acg4@UY9Hiw(HHh}opJeWz`axOxP60kZOUzL1vJ`z18iuQT!rQB
zOEL3ba?O=b@`)ejAnf9UiF~quLv@bjMczUUYC;_i(n0IU^FZOV<H_xDUv_iE-4Dx~
z9y}p|Zq$W0=)`=x@3~vuT9>?+bI+=Ii`g`A{Y;$Gu~B~?hNjb;@0P)ZPh%6bJ+wsw
zcU@`>31S>ejv+$3kOrx(sSaU}_SGcGam-I}WIo&eszvzcAfmcB>!e!AkQ&@i`vj%s
zu`&UZuwa_ie<q;g#AcadW3QS>l1S4_tK*IWP)LIuX-XR_^+>d`HbdBId$}77*6(q}
zXGUwTn3Z^Eh$wqkfIxNbY=Muc<t?Q>oizR&*XH$CYsWy2YEM)0#iE(Ege|*crCM`b
zUM-z)-p#S2<|p3CVkN6a@fyZAZ`*)l9LJ#N&}FuG<CpqbbDqS_Pi3Z}Zeb1|datvk
zIP8a<_MCD?NOWrHoai$l+MHY$i=(vlbmIu6Fyr1#A&bB6wfgYp`$x=bWIZk4Ha|3M
zPOVLvW<4!gnY&B4_u(ZZR~(fPIzL!sOyC*uFj{$jhhR0UAX_ve_D#U_LzE)e$8UTm
za=-Y)gi=h3pP>$R>EzWR@}H0QJ$&7BCPaX81hp^DR<RPA(skyOgE%7aLF2b>zMiEh
zO-^nO_sZwM)M7q*3-auAs$D#59|b*Vf9H2cXH4s9$cU{)1$=QEWt;o6D*21p4auqA
zpB^#3#YXU>^Ur@SpX;A)WlB2FpF=!k^rmgxF`Wi&|2aU3P1_>hFubtUYolbb@5aF5
zmSi|@$d(H|lA3IpkgywuvinrE6X&V~TQarz6kirXt#3p`+e|HtD&OC*QAt1X84vZT
zq6;F6yEau@5=tV3${P!Rv)uIH8ti9u{2gl{(rKTT6Wi;uysWL@BevUV#MiEyd6gh9
zB}O}m_`Y+B-)2|^6N87KT|a7j<`M;qKY9})-;dh|bCei`)9>m~I&TppYl;L`_WShh
zS4wU__vxS-SRE<KE-&5?H$m9`o^2aG7Su?-@5}#umckvF@xE8Pt+bh+^L!0RfubAL
z2W3P2F4Fc&p6jEeJU%Qf)Lh?oDf*h^w{i~zF>7PBzj9A_e*Nd63O~-`#C-*$_qQ<~
zPi0BTO8+IMGdbr^Le&gDx)w4b8T$S4eSwy|4Tm@;rDN~L?hiMQnfG;4y_RXNnVjZ+
zANp~qO+#yr&;4ul{1Md6B#&M0_R3QM1`_#ZSeMdMv5>BSy1#ZnAR+p-g?61aGRmm)
z=$6?hNF`-tmWFfpsoBn)3C{x+CSs!^qvk=od-o^?qCH?Y`twW0g>G#sRx@wg$RE`H
zE>i$4rF!EauPpUgVAxBlvw*Wq&gHDR;p~_DM*aQX9+&g)Y@jcWKds;Mh)%On<-C_C
zr8t<gJ$+Cs-rjIB9eEM#!5cEe3u@iE>%zjyY1;6}wo)#WPXtIT&_1E4a$l+m;ZF7Q
zCg>a0Jvz=CdilPKs(yRymY*l(yw8|)$+X@*w3+vj_^WI0H3$*P&?VTLr$>zYLr->j
zhv#4GsX24#tzgQXgC&eT{x%6*w}PCUUJ$>2+5~6aR<+iwp*)V2zOW4pA9f1GNQ=wa
zN8Y;TlqODhdjDZZqr^+x<9^YyH_ObUa#=kwbEPPT$fJ&Fo!+Xsi&NnnYN5fm9t;Mb
zFo2vy+diEB?s`N!0L3Q~GQ@|-ek(HE<t_VO{}}6V=PD9R(C2bnC+KY>%X+}*gVX%<
z_&xP=1z@~dPHl9zY0EWUhlPA4>mEC*^L_++R@nLU<FGqo0vrWI>8VFMz9kLYP0a@F
zhMbnF#t-C3^BQ=J)?Jvt&Ry<?&pXfLH^FwzZyIobv`T9ltcZK$dnaU5Rh!PBXLkr5
z#hyRTI4M7{AkzSqKY#a{NR0S)ktw*z&9d`9r(5krRR@G@bYkX`A6^jJa&tP$sr*Oc
z6&)?qCYP4GORiAGuDu}&AIxF~UJiC04=GGB{HSopGC8XaWfL1F?UQ(AZ%;VS2bod+
z$)_bf?emnz>4MRhDtbRs6sSMMH{^>An(AmJekzhSwGPcHJ6Me${rMW&6}%!=BYefH
znzRMJ+kMFIMufg5hpy{WuY31tIz4iaL^MLmoSxFg?Z~FHKWy}G+}m-wO4zvj)cxJ>
zQTymlrh7hDnG!HzWH6xfNl>YC%TO!KZzs<5eoc6E1#RQh1Gt!3tfj>uzlCbF@%7px
zY2=EK##vQ<`+(vznY@l(J=Yoq2#ZjUx}{>p*h&?T1Y_^pq0k>@RTqoT4DoQ_y`ouL
zClOwF(}&lq&UmA_guiX56t<mWTwXfU*5^H<cCnxp>QjB+sqEs^wLK!oxzM9-m>@%G
z0kt>C_)zm|haXLhz@g|^#laxPMpdW2?vLprH?s<&`WghMuK2yh@nj+14-6oz07|pH
zbUfY?5gs}~ox3xif2}_yAS6<HCX?dPymYI@A<WXuxdefDsIyCiW%;>r1II}mG41}r
z!DzGF-!shnMHK=R?nm{=Ciq4%o{z|&f5>L!H5ZD{qvU+{<4&gqEKjsuyzKA&9=eC5
zeDHN=fpj%0Y}Ztvq4E23<I3M0rjx`!IDN3T8&*Y!!h7BiTHe$Sz-e44II0e^PozWU
z+dVb6t5?I-7%!%vjGUBf->w=8Uy-$5u=MMnL&(uMb01-9XjZWW9TYKT+itgh)GSK^
z=Ny&j{Tf=&{4`wQEvBhjsLdV<DBWCFw4WrMnW~7DGFZV92BciXE%ly!YbYOic8#~{
z%0dMSig8x>S!&aNXX;1yO_=Xwp>?78tecH^rg%)Gvi8zD4(m`*8=Mex_#6m6Kij2r
z%{=t7e*&?!{MDpI&uP*IBmdv+i4#XbsnyZJH==c_z$fNPqc+O&lgTJGUq&^R7hzV{
z$ywy^oU``Xl9M0tWBY;IF^VULg%HRZ>LZ`<7@mXri89M6iU3fiBx>)~qU-P8S?_#B
z0d~z9y6YFpeDX#V_O_#G$HtH$XvDR>H*#wnZcQxwIH57r_Q~~%N{%`CGxq9gaiD9;
z)}%vYj3iZE&VOKdKFQ)9FZdWi`Bp+7fe|9ZraeU|660?}!@fd&cXOi7+vtP}wW<=;
z2xB)zHuf*w$5>nVbp4g~zzC<^xcpqkjhM_)bVBb-o6Y++?eE5H%;pPPV5j6SI$yp6
zKD#HbJXl>3?HXNcO`2<vUQtZX#VUNCy44fCgcbVRI5gqqtcPEmgpS<C{yuo_9<rG7
z{CEN-KsJki_d$K08FZ$^BR89lj{z#p$%eWY8U(`Q8>t>{LziX3M`T*Vm$q#V+5Cef
zBst%9cGg5tL};tsiS6l`UpgK#WWFC<f`5)u+Ap$oT1N%Z(imJBDjw}8a6w!Hg@EPE
zxOR88-KF6fPcN(U6@7CF=1Kd~lXD<R25PZ9`pEI*s0_@cJaO_hJGXFQ9M*${dnr~P
zfCbHa;6INf5q3sW+8?uxD@N8!o3Vr}2hV~78IO2x4xSh2N-Kex?BrL=PDwt!-#zxZ
z+;GT2mzPO$_D=g<G~5Vg&8yYZ1`$lKqqVL{+kwp{LCwosJ^ZM*%_<c?CcV*X;+ZTU
z#Gd~gssfd)xhyE=e0%Edrjz;N++NmcN`w}nd{@nlhi^{pODBjJbV~j_IjpPRh4#<{
z#f8M;X>Aw6JHjGTNt<I^srEp8NsG0->xJV}s+#z1;SSb;02)o^K`V}3*gK;u5Z7<8
zg<beig+8k&a9!xf2kx!>DFkF?IFE^Hm`(8>%}eITd8DGc_U4uOTJH7A@YuCA?t$pn
z=G3DiH;#s9tfFVxGvwQSZ3P0u{+!tpnbBe%ZmA;ivkBACS0z5B-#tgvkO`roIa1ZZ
zmE@#BiPs7buV^R^c}B}M$i)Ab@+nf~j0E*-Z-yVn@s84nRi^o7Sy(MUc2A>upQ^lc
z6j9)tcI!tmrz;jydp>E4v%@VvO+1N;0l@ZI9lz$3q1ukuWjcx6_I08y;SQ<9*2MIj
z*(dj9T5UqL^U6j7wqUz@mbiBQmH9y6a~gfjFR3M2a9Z(3X+d_v5jE!1HzKCTvUJ0@
zy+-<2KI}PnTnf9jQ}kXjX(A#=LuFoY)HHZz=^8hzWcj22x28ecM${SmAW`LB`!IEs
zsQoLqoDht1Q_0gOX=O?~?dz2GAa&(x8kKWl)Vt-6OxejF|KcUw$B3l_>Dvybb}#8q
zIV(t6Wi;TjUZfm_sY!~N5_f+NW*5Lm&eSMwo$o)3Pu8Bp>=e<b-<@d_nLL1NmiS?d
zDV|-{KQG{1wrN;p8a{BBQN1k;qI-ka^vo3cwzNpV#M@`faMgK*=<)NJmW_kbRT{DO
zhJom%m9epu<J<$4Jh1E=d=R?ZNX6Z}IEDT>m{&M|_gU<5{QTilWck3^G$aZXF9kJn
zL`k2sf;;75*S852b!jD(=bi}DMC`NnIA5EjJ^Egs7vijux2G?>Q7irg92ncq3m+#B
z6r*X%+Wu~iamR<r@!i>m0wXB~(wlbD&6{sWJDN*o3=Y=kN4PMzo(r=L-N4zuPef+l
zPO}fItdF<g!2T-7@8rSI5lXuuT#q+Y0>&lgk+@m7Cmi}AZ>fQkeAylr=0B1IrXrV~
zsP>O<J=7>illPGEk}-rHZW>@&w{Mzzu1JO``c?!NPpi`Kst<M_=AOEi>-I6Qz^g{%
zUe2v~L56g7q_cfzPe5BV#GE^fMYZ1NN8*XGFOiWEuuneDS!zG$A*EM4w`bZk&SW$>
zPd2U0bmr7X$jPp}z}qj!I1E5AcuEeOt1{5wC?CJI+^gS^?F1Y2v^?m#AAvB_Z-16x
z@V4nx$DSJP4H4CT^a*1F1(-&TCRW_+`n?qBp`pFwX*earzTA|?E8k;`7<G%8<y3x6
z+dfJH?xu_X?S;CcT{63sl4A?t@ekxr(id7y_*ti$3xw)};3qW+4fm&_ZU{ll_ugo6
z@Cp}6G9d7Tes+SKQFXL8v7m)LuV-?W>c-<2pAEFc_Eu$5=)5Nr{1(Jesb^Kj_jsiZ
z=|?;0b&BL~)~tvK`^zJtAU^0XfW%{VL$Vg_$V5PX9p{KOs|hdKcF?8bi65vGN;Nh8
zbCb=dwuO_klRdw!Z07iRWxbnwAG^8B8mlMQFjI<CIg>iwRQx5@Q4=0fc0-3UiW9>N
zm9hr_=o;wTAy0LxyVt)@_BOUtPWmRJ2ezpJwV%?v!j&a7M>o0#=s%IpnhbI0pWGKz
zu1%(MifzMj+z&ga$d$%88^0lOeEP^%`MRuD1@7}N;}UaiM0%~2WiLC+LmO*46&IcF
z_MW=%T=DCLs$1bQ*AH3jPo9Y9zRIbjmL7t(+;CfpKb%vOpVHnWn|8_KVseg;n#e|;
zY2j@*ei-x6h<CO<ecxr?*vyktLGj5Iuc=Z#w^iP=)FyZbr{F4o$g#2bV?n~!;%i@y
za&3JM&#HOfjLWu{DzW*Xfb+Ga+r&mRFYev((dNPC4L7>s%eS|2Kvyf$XVnDP{{API
z<kcd=xxc9BaLNjc6LnTWf*ef5_Nwnq=kuJ?JDX45CW|Nvgg-lhzSUYn>iBjX^>Y4V
z)#zl2c_>xm(xB!&)1<$%Un|Sf`!o+hah~GmbD+DQW;%5wtd?fw^4c3Gq98YimWz2T
zn+Emx;IX3D^nCo*iMzhp!mS!LeW&i<C=k|MaRMAC^OY#<*&F^<+Zw8>=A628K%&0*
zjDwOxg$zKK<Iel)ib$1{7QtE~=PqO|W;?<6<G$~GTu!f49&-9F+&EE7C;O8^86}NA
zj%6O*W^E!A&f<2Y$!(9zD^+%aRR=H<QZLRbDu&+R3`z*L{rqZqX?!d0v7608&?fF*
z<cNs;CrcNvm@xF>nAN8(4X)hhP#xDvH?4RV8|bYYvdl#vH8oH8pT86%HS#6S=ApCE
z2Ll!Mgx&qTZ<U!fQp;CS<mDyp3@r}XGGSW_xXcYb;duV8f~b_g`t>s0ckbxf&kxK)
zC14;4)WzX{*TtK_^{>s6{sK_aU3XuRNxuDjpZ8SC0+=14EQ*ag@$|V=vNJ>n(dHWU
z3VPR%ELH>X<YG@s|COgFOWh7WzpOU(Q2Ptu7h4Pq^mrMu4H?ipp0CGikMbOTDb0q9
zM4IcjAB>FYx8-gN$<Wk1Hh84r-gJlv&<5L-)>DxlIV=>abfhw~q$1;K{!`tlp3UaR
zmbSb>)IGO1g`Ql|x4Lwh9zN$z=jk-QHDyAlFWH}BW}Xo~>IEnZ6|;DX+V9bs(_$MC
zPWiym{Gknx3YZPJ&pWqgHy+sFB<PivB^@Z+k2nBW+~-Dg!;6A&@A3>WZn0I{y#hFh
zYt{~TW-m<NtQch4AvU4(3XS)4(F&(HGdmoY{J!}=;9UCV6W4sd?0N<~!S)u`dTz`1
z;>fe*{lRgG@2sXcrz+3ffmfbOkaIpNjD9D&W4mf^cu57HDyG8OGUJvBMx*Uy_J*?e
zywd6YJr4XD>NDS1S~by~d(6Vl1y=MdJsMF>#k|z#b#Q$rTkQ`FAw|r7_bk=fAMatU
zitUJoR&2CT^fxR{+jajK^6T}l;)GS--O9V>yH7&9BsKZ9QaA)92AiIM)qW!;e^fNn
ztXb`EI@eqHQ<<k6%_H(X4;$9^^e<Rv+)S)eY;tj{Z24uaNAya}AlBz6I(F8KVFnmR
z<Pg7-0c9yb>0%P<<B)vt8&3T_Q}-lU16Vj5XSt$58$K!&q9Kk}sD=c_6t=<o#X~9H
z4`fdbm5(~)Xiv^<KGmQM4IINYCd0Q+?}sG|i17C2lOHs`JP{l}AN}Z5=8LDFZ(Luk
z?|rRNp#t;cfo2D3*NEC}7xib$=MEz|_7@1ZKO{OjGJ=8+2%F5>-I{2)?HfvGm05uJ
zLMhlkQ*s~S_-u9?-uBj>Gn_*|lU>W4r`}W(BEK#^3DS6f-HIPoG1r`Gx1zxh_p0E0
z%CkWUeL7=*HNP-4N2$}x?qebPCGtq#LZ@sNy=?N<q(Z)l`n|C$b9XFd`6P{%=mxCu
zNej7T;iN@UWyoO>?Qp`$`Q(>Ng^UB9rD?O!usf1MR)#k>c%^CE<ZJJ^*P!d`l$7)7
zjFg}guh;G>jcbeo@pCbFJRF{`0g*V>*D+_&lRLgMF<t?pc<BGIch*5wwQs)%HYwe?
zNoh&x*mSp`gf!9}B1m_GAdRpI36Yc(kcLf4N`tUz1f)C8!smH@zxTYSX3or+^Upi$
z4`!Uv!L`<XU)T5h`Cj+(+?5@^)V~#Yl04A^DD3z;#~b$bRN2uo^AUapq&)3il2dQZ
z28M)sTTMI2&3tMjB_g5e<7lEcjZzHzO}N8fyKI~6hti_di)OqP&U&F2FFHh*B}4Z7
zlH<?6DC|XFGyj|^LOjRZ8^}gEw~jk!_cmVB9^YbSy&RIaztsP52gz=!RxucK4mwPz
zh%Kl#ry9ttHMSZSH_Ecs_cLA?F(>tBwf!(g#kVJ7Tsn7FZ!uHj!VZneaBLOHd>-HM
zT3k^$Xc-Hz&FW-*{b!1*tsH^(O5@(M7jbCD4-t<5FqayNalRTCVIPaHd~W)O;z?5c
zy)<>9>6TbGVBR;rjG{NeM%A#>qn#;;X#8S+YiIENCqKF>pgoN?K*1yv%S*yspV77{
zyJlUe7c7*q12oloOkv&OkKQg^R3boG0OnO2!gZsK<hvPG<t%E9;>Nv|cyuORBnqFB
z*h&<Fnq&1%GVYZk8)}nX?D&!ppeC}eL&wW>z_{)cK=0IkIsywb`fNi-Af!B*r*?^)
zIldRT7{_H=C@G3m@&R{hNVg%-SNKd%<w1b{;bmxYAo~B2mzAQd!g)spBrLpqXza-&
z=1%JjD;1d6tsE~y*Tok|p&&lx?RQNemc^Avz@1}scBrflHwzi95TfX%rD`#2C<T}J
za@M`zOK^{bHfr;?-QgL_K<aK>T0<{GH(ej_*kG}k1E$(vbd3ExL5dnnBMpFKwTytO
zxRLxYv$H>g-oE|3K|w(pH_G!D@|QE}GC3Vlsiw#V8s?u6<&8My8`PU^Yr*S}X@25y
zuiK_hzYJhY+>j?|!eD+IXSjqcWh67$KUg!frmUiflfx%)-`H$kCNlqZV+>+Od_(tT
ze1ZYI1qk7ik0}%5Ef*V}V(go8uXnxeo`B&c-K6%CJvxOUk-bd?<cnq_Ismm)vh?M6
zm!7RLB#f%s$eP)Wt)SDJBRi}Bwek?wcu?7QZ>^;+%(^R{f0UL*Q~apW0P@hqBKt0a
z6q$|t0hNVw^AmVQccVBV1{FC9s96m8ehcz{B(`cF3HI+dY}24$#h=I*pXSWCj}--?
z11dLZoJ!E9+vr~ADUK<yuUx86NCg<wk-YcNFt+L0evHG86V8v0Ryk8{ht@e#I1twQ
ziSB!v<k!13Gl4bjL1zrO6E>Yjx7|$W;Bm~l<@3SegGC_|VIg)7G-(9<_2XcdXPMfh
z4KpDuh`=(?{}dTgO7cr_0WviWlW)`0qN4fMrLoo4^_}@$-FbVNzn8REvq#G@62fH@
z$z`H$Lz3+wCL?28xARlqKaRUK<lm<spfUo^N9rw_uaVMwg?YjaTazZo&%Sj11Ehy=
zNZPgjE|ZaL`#~`FgS(L?APm2jP80ATa-Y`p+kapexhJ<lzsYSy6i;ON+`^x;XbizI
zea&=V;$d+R?)m1w^pjYcqNXJVgSm1f<*5pOUQ~)5wo_S}Oh$U;43Kscow}}HHmrkL
zH-izFcO#3sdq~&5x?mnv#yYp+n6BEMD!QM@MmqSyxNuB2FSXmlUcGJheo-B$Dekz<
zQ96wCIUZd?hf3SYljaQ{v>1??Na0+QzGVGeI!MJ-K97Kh-ReTKL$pYwcI{z<sH0AL
z4A0Vz7oW<1FWiPH8MZoS^D=VXN*0TH_p6OC9#Uk<2y>*wv&Bs%>dCI0sG>C)7&hYA
zhd;jXaC9*sZ%{hpuP@44CGhF%D<j)R1AcHqe#@U$e|kP+xcN&2CpNHjPH2TAQO~=Q
z-5cMQFaD4`HA%w@8faod9n<U<^rf-NI$h&*Kx={Y8DxO;FF@A0dIxHbgnlK;q4jgT
z$u;vCnBcb+8Zz=u{pbUg8Fn*WX0f&Kmx2`T40`)HVpcIERFMl55CGDv5WK3Dp@@OF
z9G_lw&EojJHeogN;{6qsF2zxlzTef}%Ld19SQ4gDtgo$0ktLaDEY?>GmF$m+fYDRh
z1-L~a5on@LN2jF+k#Xid3q+a1U8c^)S0^)ZW7Y1?kBWpFiuRWY5@jB$>AnhwM2+a~
zOO%*2DDcOuYEdG1zedoLLQ%9y*m0FuUDQjVH$I|o?PPlIZ6lm>(3*V5dM+TwG&UD%
zYSm!>`-08dtJ!3~*vFpH*{M>W2D9$%2Ug_i+1aqou`>AeGqL$UWNf0g!;$6<_OP|F
zPRz)o#-*@1;cwP>jvSC*1&&j=<9<*aj(5u*Q90Qm-GWi?5%h#AmcrRr6U3*Kn!sgh
zcmcnV$)*`-t~6}bjlyYs{*g?;Q;hxd6m6q7T^%1fK?!^Sb2fCGp>4&5+X_HOUa!9$
zIc?L7=VN0=AjA+Y8he`M%QW%USdQB99Bpkq0S4bdlDh%+YpmDFG}C)<f9{caICI&+
z?MJBmi=Ug;?mesE2RP=vKorWXYNL(&;9Gd2Nbpw`*riZTboA5LSx^XW$U!(nradB|
z>eUv?i_dO|dNRXmm}?JtQgEmc_9HPK;GNR75H;EIACD5sH&^=jpOF4&8W1>n2^@Lw
zSz}1Kk?=_?#+=~e&p%=Hl{$_l=`~02A0%k}LXZ~mrZz_P*4_k%pIOiQ1ak@G)ymu5
zt4S8P(<T^pF=}@?cS+tPTi}*fBPce@MOhRbjw!|Tb`~q~wWfn8>TRXbc+N3~Kk+_|
z%idpk3-+v#MWNY6e7$jF4t}SbWsn0z6P%mGLWfbilXgp=ihpjml%SdBJ`l)a5sF`w
z5nX+1qTTpA{v$)+%%zl}aNGV8YULQd|2gbA4Vrgns{B+u>G}-g-fHWls<Q?1@?!oF
zEIJd2e6)&9EiS{*kzs&Bt6=@X@{s(<NSFz+DO;`T8dXQ9?GbkxLvD~u$#|pb@#DlP
zbKkF3s9o4o^^+(*H$}1S6Rf66n@@;Pi4;ulZ7<^-k^xmae4Ovczv79xA!}nrwMO!c
zG@N1&Zkafm%1oL?!s|S59?2+!1c{qFF=|~EJ3ePu)l|@YU<Eb;qF%sCH@rKSYCf4J
z^jIkvtj%lr4dg@52!$9#KNQPU(#uea;h0AIRWpsDxi146>DEiBeE$<XrtEroiAVk0
zIbxIRjD<4`C_OKXxGZKc*KbyR9ke>Lq!kYNN522N*KjacHcy-*@Lc`T15*M819j^V
ze+=Tp;AG{=BG76`G6uh?a{1D|agZt81_ARKR$TExK@|q1*@yaJQ-|2c*n0-fx0oWU
zPt!c+fBHzr#3STyMttQG)Yx)7U|YXinJkLSK6k|vaq`gP*j;U%d-j4o$b||i>-cN_
z#*>m4)!Q+LojFmxNOXakDnY8_V(^MJ@6Lwz$VA(Z-sp4y5=?Cz5|5a%CR9GYyjU!x
zis|^yAT;FZ?h6hu049&5v_*2#R(%nbg*=SD?$7utRogZvD+gPs^+!w~8`&63-K1bj
zAf`_Krm2qlu@w9JcHv&L#wp>5GalEx7)#RMJeh#fny>##%iD;-UZaT6R{7?`h0SB=
z!TW50|Lhlxwa_2p{^|2DzuA?z|C6e3MxI&%K3DtRS!0v8wBuIryoOaI?IKt`*rlLh
zQEI}fCZX%VC+s{jB+;i#dKRI54={sX;!$&0TSS;7Uj(`GERjI{g8BwTby1V7-OwxM
zD|)uu4vu<KY4F}$NBL_Fz%}}7_ApcG&RyfZ!%UXR4trQ<b-&^lL(Tk~Iy#iEW>mE<
zOgE2%k$OJ?3`X=2|F>eyT&y4?Xon@x4i<`;O2Qaza7C3K0xUG2@s0|cAw=wXA_XcK
zr|ppV5Bk5B+nwsFuP+7>V<~{H5weBb^d4kJD%9BtCa$nsodg-KPE*IIk|V#5HXz{m
z;dd$R9*Z)?z4QQMI<3|egwJT_p5AdTzi(vV@+fV2hLoNUT3AH_wiIAWQOFKC9Mqx#
z#9V^Y)SKPl27#<+TLV^z??-QH`y#IMB_E`gpGVtwzbET6UpZ+L>e*ji+#-n<4N<j{
znv$-{V65`7Q?{`j_wSlZlbF4xadHSh|7xSM5Em5YH9w(lx3pXlFreN0^T*2L{eH~7
zodP%CB%tk?ivzUP%+lbA0$}I++@n;cg@Gc)r)JJ04lJzRvfYX!ugFWFP<&er4Ed`B
z8ISyOBCRtPh<<!828P8he#|~69%DBbKc2!(PJ#yi6f&k<slSdO3P{1ND5GH#dWt5h
zwX$}bE&+EO2U@iXj1-|hN}rGa24vM;pSr$pij#Uhn%f&IA%SICV;rtHhtE+V<Q{E5
z>)`8s+EtQd1nbmrBXDo$uKRocvo<cYHMEDiYp+Q-BJuc}=@Fj(C=Ln7x#okiw0iT=
zSGt<SO3<hP+es6j{kV7N;+%rE<cj3j%z&RU__CHCHk_MD5Ree)q7eIl`4>%@S>r#&
z0v40{D4mmQ&_mj$#E<Io!gh3P_z|H0cj5l;5^VRoq<sv(N7;)fbk^K8ao!Lv1>kq^
z8LTN72N^&XBJ$VX&v$F&%&6p+#T?!uHJ7gbO6vJN$g$6xW^NV6JVfQdnU36X0=9=N
z4hYmNbryJ!K9OMma`d&;JSgz#<g-9+0WR;%0}jMdDnJpaX)b6I13ytHJ(GH=B5-7y
z3qt;&=T=ZXPRu_ENLBejnh)jW%tL8<E+E0E%q+;T^0)7Mj@G^}=x#c7E}4kjxg|*&
zVZ;xlOVe?u<OGHG<}QBk2NJ6w4PS+<^@+yoU8X{Hxh%HSqsqr*sjHE0yGigIdf*Sg
zi=`Ys*4Sk#&n88t=!desXZv82006e_Lbdq5VwLU4w^pzPEx$xS2s|oky-NW&Wdo3R
za*;egJunB4yDG77hIv2WV=kKcQ}qqqab_^hb0{h!4#aglpGq{}uPLT+EDwU*dD!7J
zHh@%(t=CiUpOtxvVZGC&hUlSI_N;h<uQ)5I`OX<5F!hf$2oEm>e(uX&_B`AX;JCce
z<o#`uau30}km!bvxbFvL(wE1~q9$MQfzeDLHsXNX*>P#Zx}fE?HX*Y~Xlu^(n6H9*
z$pkQ)cgD+<2z_$Y>WTu>1zE(i_KtV@BCJ@3t@BwA3DGGqJ_1(rTCwHwHz9}!-i#`d
zfthxB|Cx0X|G}ju&l_$C-dw@ko7^n&D4_aSbTNCDXh<}hYotpozZ(m!I0&`Z09<gy
z%q-qp_d3CpV{*|-(>$JUO&)<yt~^8~-}Ib3xZu7^0;QKMf)B~dg@AFFu|QfNBj|fF
zswXJEfThciUgG)z+u?<=C|7t4{j9b&S*)l!z>VbNguAt}1cYM07KrRuZGL*lC?&k?
z6|7~g+{Qwx?6LL>ZISjV<p!RC7Vr!rUK={8Q|Z8Ric?qVaFT`CJj)P?=ZPZ3`KG{5
zTR1O87=!RwJY!z$CzSn4wM#i-W!Rk-W6X8QPkEbOB<!TJf7SNj_boBG0&1z2QY4oE
zh<fcID+}`V{N?$X5#&ane|ot2!S{w=a(unAv5RnQHPJ$2wD%><2hg~nuv()>jCs{b
zXr!tDu3na^i58!3K@U~0Cj0@U2XKq=m34vEO(&D=4cme3LflaoNdNVWYH~}{4_u9l
z(KBYnrS_#);>Y=InhG#|QVV(W^RdH}J}TaP2JoLaA-TrCg1f*OO;dB>m*0R?OttQ*
zCr69l=Q$pU5HLe-wM^?lp$#?Y{Hu4z?h+oLTIGTm*en2BP5H8zkNr8UYoV3|O03hW
zX+F(n5Q!ZBR{*rg<K<pFiDPyc43rh6?(R^EBB1f)pl7Pr*_1nwcwW+SSb>WwOkmw+
z+I6QV1)G?42QB&Lf<7ucUp4XulaFBn@a7NY8X+rlw=XI`i0>qB3f-Ig!Zh5fR(~*y
z6M0gb*x$w4z7$(Ibn@Z55;F@a1BlAH>jp}<1<I0{jrLOBMb;N#r;WV28rY*3*H?m!
z{DI4;&2qv<Ee4b(!@X_h34^Y}?v{6P{9@p0b~~xdom5H78`%2O1mP*EcerV@0*=vb
zmKTi!u(!}Vy^#w)<3!`;#jxqN&e=#1HOp_?O+wh5pt{#hhFkDOv{^vm+e<|qDADBR
zapFk7DlCZKo;rXP0(Y2r=G(KWpdi8FipT6<_5O9{MStZ}n%>gAA&i8E`GS_d)I*Nh
zR9rLHHmy+W+iTz9Hkf$*wi8D3ifJRzPS1??7(c=;;`i1$s*xP*lA?ALnQjRNEXC47
zgklHdBfgb+TO?BidZUpUzi*qiB4s|mp0K_-A4>fJoZC12mfW<D#;0h&m(t!9Ok+}C
z{^6HGiMOFUmJoWwMS8U<I%s$`=G*ov9*o6b<zI3$*u}8gUb3H%@c^jVNPyggxX{?u
z_=xe*aO|_gV8<953JA9KU)%b#X0yiLK5`{FS16#4WS(@rA0wx-T5vr7`tuC`J-Vx@
zMt(WN^X^4a2s|?-X>%rkr#05Tc}o4m_ZxC|uagFa8kQUX8Hd&Ej9Htf9Ku_UF(dBP
z((%PM_d6#dg5`x~51t18g;vL3o<?8(A5SBe3-C11)zik$Tg_9$YAC0lPULnS9Ag3r
zF|6TC53A}TA*V+re4InNzXt}YMKhltsbN^aMf{NHDiy777srr_#T}WHmlo!9D<ZJ#
z+cXV8P~6+FOwo_|x>IrKi8DOw-Rs9h&077%31>|Q5#GIfdVuk#1-C-AfO+g(kbiaw
z_M9)cAsdGKyU2!JM;&_GAG0+FJT}~y*vdXys30YZ*f`+~&mM`;#Nha-aA}ybtyDZ?
z!Pqw7QPXr+#i&V9;mg;D*>h^h2Ut||$rn-O*6zPk>;JMrfC@I6PT9*oiQKUF{F%r{
zez1i`u16aG55f&*gc7EIO+*|sR!#jE2Kz4z_Fow6|2YN&g4?t5$3OfM6)w8V!skbB
zVg?MqFd~R_0a>^hdbLKA-kb*_*!ltw&BUaNJsR`~h;s-e;+Q)TWWFR8(-fUN@RG>-
z*<SqIi4^6`kMkO_?3B_!?;vjmvDL+N^C=nkdv=qp%w#SD-=NO@LRA+bi{g@X@@qs<
zS5;yfSG5wgg-F=v_5R@C1VP5%2caW-E*~;JKg?~^Mmr!>F?FlhH`dShB#t##-H*F&
z@XO6u#KEfsS~I_n>~O$|Ln*Tv;|^B<DFQhA$Sr;gE1uLqTKx6KM3rR5_q-`idt|bQ
zHr4J?!>6WV5E9_Y15puugd7IXm~nutAixG1pDqEK;PJq4ABF?q4!Z$4Q!S_hYgNv$
z-%{a5R~uL;H)!$orsyV4@wOA6+QDd&0pxJ6(b@Ero!NKBU$6P%hUT(IeM-z9u0Hxe
zP_PTuI*3t3bz|CqF8608`TdyRrJ};B)_{HdVFKK0zt+erdes+7hK=cc@O9o{;;k4W
z=F^e)^jFR`tWasu@a*kgw9tm~X1%BR7zM??MHHB2bhM>}4{7>6+PUJ@aNj2LhhdI4
zz%U1~uZwRV4FYNf8oxf*{QMogMR)|MSXQ#g(;vAOtr9NeolfIooV}u4=|8h*eLK%G
ziR6Y5z3W)PE<oOy=e*EPd<mY&G%?$=>2h<-MtMJm@^k3`aapGQJ9{j9_+c1qV)y$g
zHKpx7I~=OWam%mf06A!yd>db$hEFP@<(oo2EUPlD?w=ZP^)@5!6U^pT(AA<(fsnBw
zx`mbAf8Rgcn2Y^p!s0nVF-dd)(5#*52;_;60WWjQ;jd5tV3%l(L!6X{H_ilTOn!}x
zJi=^z?VBOsC=ya){XGFE5-h6a?*F0<8*|;G+Cw?e!jbY``70wn-{%?k;Y7(TqGmZi
z>dC#n0!NBu09@8H?#s6$lSR?@fSpDooA+hh_gymgDUL1k-?MryB?9^S*5?N}LZhZW
zG=;0*cD0(}cm0C(w(Yml&2H8mxB9EM$~mN$$$VEz%8;5d1Amg@HVtOy-K43bm!>xb
z?5j3qWD#GO%G31SHKsT8UqDHLVU#cvWeRIPG_~gVw9@)-dt_%%76vxWt+FcPtx{GU
zjc}i-(+YI~<`@S)l&0RcO#dbDUQM+9H5Y{tDytkZx%Ww?0+?3w)wn4ACqPX9?vIR1
z!9M=MY()+Vh!_H!^y9Rd0wJewElqVJ@fHmwl~v0Db|&a$xkq97FFKG=HA>c`h0lm6
ze)&IY*i+knM=`@;aA|Jq=v#Mq5Q5kPND9W?UaocsCk5W)hnX;iPF5$MMuy=2l)zqU
zwpII}?%kG&zYq+J)F*^t$MipU!Y;SRu4eyzD=cdIW))M9bu=D<Z8L=b_y-5A31HVJ
zO@IBi2P782CsJd9=ns2_IO^jbN8C5Ev~l<dHZgV`jg45f!y{x%OE81pJWoH4>0e_?
zU-e%?%)D{Wdo~f`fc{_~LHSMNgRR(4Id5NPHbYy>9v{wwj^_M8W!Ru9<;26QRB+~f
zo#9G}(CK#?91<V6%pfb?A2vw`2ai~B=cOkY@PgX`C3$P{4y_AFZt@d4Mu`#&N#HTp
zH;D=$xx59k(TSrn`HLb!W#7>3@qehl<Am?Q`Wq6GybB205Cg7ehaua*FrdX^<?C-{
zZe6$my$q9wuF$WyUC56<qj<`^j@~G$(>MP!BnJLp42ek~_rCw<EP($S82eugjE!-<
zAc86UJ|MgTve6i?_Qbh?<Rjh^C-`>@f@Eujod4R7@>d2o(n|eYhx1r8|J#|dv9nO`
zxiqJFHWS4!M{+HVBkTSo%}S*B+%2Xdf4dbIt)qq5;GPA39jK2M2ZWu)FJRe6J`;yP
z96#=Z8SwyN%>|Ol%nuS|nL$}m=+=v$2@Q2<igF6D80L5Qur0wmb`3FZg;`R5`kdk;
z6dpN0L+?9BZ-s%cwEt;dEUOYU<7FT|P9=^{Px<pO1~lV+N9016vE-EV{0Xg&#>=-c
zb~Rn444t^du;i>o7<l+E`M!e5Pa}VXnbOV*%aOJ}%-~vx5Rns<n}C1~5K<<30IZs9
zkx;kw>icgb&6P%hITG`)<oF?IKAZ+Pp$POl#~APgopbLbw9_iUzPKE9m67Bte)KSr
zRRjNYY2zAHwF-fJ{;d%jxyKIYIx(q>8EMw?bFd>8n7(X^2QlQ93aERjJbtnCOW9bK
zBF@4WIJFHJ8e5)DgTX5dbDwbTl5c2#b0azrOHMfIf&1g%Fk~Gx-nVnYtvSP(6-_85
z{yj97!??Y)saZosCZs%<Zt_m!)0LaC$vo0-AA>{qa0w9S)wYFs=`cN$MrdSUdPvqj
z-dh!-yZZ=%rG)#MzkvE*PdUEi>cZ7CS6<9uLmb68)4TMt9iJ2Hfl=`TVo#5?r`>~t
znAq7>660Y$1qgX)a!}BuSbe-~%nYE3KpEOZT&0{#p7zKmqnli4Y}9}sr(EOiOz&w8
z!@VX^C5^!dFEkMe0Q+WP#7po+VPslMWMx(VD{6yy<`%BPfPrt=2}-pBbm_BubE2&S
z<V*W$*V{`5{aN$&Q!wfBe+`WBeZFWV8mYG-_7)uGb99-98Oa=Hkp2K5XT_U5PxasA
zvM+&XvQ5@$h{w-j8O+B*M)}s8w1;Z&#|R|xpBq*NE&#}p<b-BV*!@!kvG=qu;!ZnL
zJ8cD+qrgD0ez3cMr&#dkDQ3dG4Jn`M`mAaoi|(&FR^1}LEilU*-gGzmy5xS#mCO(~
zfYC178E<<s#02fH&CyL%n7>8zzFe(t{3?kb0L-z<fY)KKn;U6{j_WTlKD$Y57bpHW
zznnEZ^n#JH6sc1SqO4#L&P~cR$7@#_b!cGkmKdz}dboU1+)M9`^G?)=`OXi97i$Bt
z^adgcxoWGGT?|KG)j|+(z`1$n-`oKWRp?JTnK`bW?e7y;0?|(%0QS^C_~i~^4Z%Kg
zjC1fAcK^<K^&b24dD4xt7O%P<DeQQQ-&KNYd&1OH&J7CZ4c-0I7m0h{^uv5XY)*D|
zC^>^dPvQx`1Jg<gjiu4^h|OJ=d4KSjEAPa`)<-#um5Ij`CJ&zd-=h;c85!!tCZ6iA
zxGrMLr0%oXT9Xz3@UhH*e@4exSFntV|K?+`2R>#h{NMAjEm)rS`7np1de}ZrMEMy0
z9ZRe0hdA+b*LKNVAt0a(yLD?+Q5ilFkk17@-gK86HYw9DYwk$EM~?^G4kPVStx&*E
z=3T5t8`FcCMdW4UNk;oD<YPF+us!{qyH&cq$hUay>l*0(5cQ`w<x`)~Bl9pBdj^68
zu#p~(AGU~bBxg+0Q+?Q+2D6*`0>NS1=2&Hjp%;+q5AwlDt>S`F|B^m74<x9g4!F4W
z7OO~|v{{0uKS8TUG@?X6s=Dip>WPy2it9*3DuKTF9$B>L)xcY{Gg)N_|L~C+5{fc}
z(B=u(5e9!Isq1uaS5A7JWeSvgq=kcZ74glktYt{g7ADfBRt+x=CiY12GeZb<yhf`r
zNlx2L!DYKgSw$MpZkT~#j)FkI-aWUfLua<M^=>OQIoJ*PKMayZ4F6|NW>b3crJrYY
zTIaB^d#V`p-DmRV+%|{c`{?V38L}0a$*<G+mNCTOz1Wc}va05{-C)G-ih%C0sqB%~
zk3in$#v!&S0Yo5234Vcj-B?+l{6iVxj$`1`P|JM^7~-2CT@4c_j6;z|$V)}a_~_kj
z)PEf6%#6V@PP||8Fh=_@+X&+AcQq*NXx4B|Cz+$ILr1foDK`*l-_%%_HvT^mvN2pF
z31eTVb8{PZ!UW>!y@bzCL{lZLaz9V2H`Z2f1dvn=@>vLwQ4WI?b%>DhF-8s~JBn}U
zqw@m;X=w?N<&@ad@j$4-^ctG@jEV#(vQoS%;fx%V)}G8a#iiH3DoQIVDq0sCtgSwU
z&sJ*u=zngsXw=}e2oRHsj5FK7wNA~Kv_}Ogmj%y`m3lBXWcy_)`)0qSG6eWXUbw)}
zj8MmtUU;mveZTxtW$G`h5N9g(iuUizv}d?Iy1~?cJs&pmu{H5U&+(gB_@$>!qzSFV
zNZXC?=Tt#B)U4Y@@R%ZRiZb8x8S#OSKg`{y4EGT|fll;=yjb@$gS0@OcMiCYtt=~`
z)mozh=e3xl&Wxas#i?qBJORBLPPWG=806)l5Z8@wn$-&98Wm~Y$Y8)U`XJsc6fhP;
zXN=23ms{XqF}tV-9Rkc)UcM%lBT(jQ#BB)+H2y6R0BbAq(1Dgz9zS-I6vTRym`W8&
znQ@>shS0PS;T;MxkV!*A-=HJPqpl6+JT-NX3@LQnYPuPVdw&*IAn9c}&QggupCgfm
z*qstV1tr>i>v$14h!5$ON)QPR5so~YeizbbmbT77Q837(;xpLz2+q@kM>8Nb9n5&k
zrR>GNgGX8gyzDqS+z6+dh)r11Q_+@0`h=(`qsDRSP>}1q0F(yHpxI?sil!-bldD@F
zXW{}cB4{_@YJpn3QUT;*fFsg@9}A;mo#2vmH@@gaoD16$_ToZ_qaLNoHi-T{3QZrd
z-C$e&Y+KIZ5&zTsFnzT=p|Np82hwc@=G5GdDK%$#B5krbwE5ZiWL>O=ap;m#2Yk$@
zxrr8-!}QX;tHtE^34RWjObGp>QJ(0{CE~ZOSce<k(D@a*VtNl2oA^yOpUH1Lzd>{^
zwOR4I%aANR_l3$wQ1%uDg40g<7Eje<QsCUdr1P86@pgKV#>ODvv${U!NfI3+IUOdH
z^=mXYcK9o3a1fYInW4=R-C#ixb5kLebkq<G?z83rTXL)?*j%8*-h|ZG=Px1(C5buN
z*+x%Hyl4|kX<j&gw(=~{YCr}T#Cb{$ceJjq`|R6l2@Cq#WjOy$r73UPW;98(0(HRt
zO>#{KFP!6YI`kbu0=G3VD2a_ibHCohbrL(X;)aFOC0t}_sCpfl0oT-KPj&6?qALkW
z$TdPY#yvGv!;jWNnhRTY?4X^LM%m&;*Jn@FdVCuZ_?(h7^K^ad#2as#CZ|hPgcBAv
zn96WIV?5Rl^|34nnv1aYjU1GWM;pnL?0!FbK;s%rjS}h2gH@aRIu^!wW|CU-)6RH2
zC(Kh)3B-r0nl5`D$FuFkHr$f*>YUaol2JE|#recVIM^ezL}-hFGx)_N(cw<9CYIWt
z-z=1(Dp)|vFhr5iOO0Y(osW3lhK0p8_s?Raj>F^r*HWZ?l{<yC98yDUAK}d?=M`v=
zqOV5I(_^=x)AFhi#tnSB`9nA=>P1((6a`5@m&}m{q^CG`<q7cjP5G<?(IQ<}MM?@}
zZeBmz3{}q@70&6^NT+2^Ty9Di`T{01(L|dIUuF#xkgF#(rli3Ng4$AMJ;RQ|?}`mD
zG*u_Feac9V=(&j1_mN$8)1o5ys;p#?7XA$HID<ex3s^BJ-zjV>KB@|hf96F}rhc`I
zj=7!-*6aNsqgKN99<jzxax+&zY6!b%%wd}8MQ`>%ivU`*NUC{lw9pXC&H%I%Q8Cz)
z&PyE6uKm%&Gh&6LnQP}Mb-AFN@Zi=+4jWpcWY*6`NuQ@neY@||{UoHhP|1tSbTFQY
zry~%Oae=3S;n1tC!H&*iB?zsQwC`)dtH~=~KdYLhl5Run<elKH2=<~y4fV=SA7ZV#
z?^+GFeYZ)Ndi;}igc%F_a3T1EHeL#SJCEA|3dd54NVn*Z#>2_kS*6v>N_Vj~4QzJ-
zOX(i86R?&f5BNE)JYR{D!umxnr8q$?rbU+n<SLh{HtLu(wi>))T}E(@o2UqR1$o(>
zWZr4Glz8IUkGC;+bVM{DgW9Wu>gD^1*TkxKhoYk0ehFLCNiI#AWk4oII!&ZX2E4_@
zvr0p{{1qG5fhq0?tG?qfHo&24C{0P%t;-TGoT&RcLRO$Gx(l}|#EIZ}z%m-1zfG+Q
zLaaA>7~`lVj-4rvM|(6mH{l}@G=;%yb*D*Te`Zivxv`ejXU|iWjs%cz?#oU#94|5l
zIdM3W$Z$JCx@4MEUwt4qNNdy*?+d{o`ddcD3F8bFj|B4CYppy<%QU;^2ygO;Mrb&@
z<4Dgf`r?5v_wmr<#A@X7zk*@&#5wVC3LzEbifi>g$HV1hpjFM_8+h6AN<HY-fB1V^
ze|O%>JGoIN`O|b#nFM4b)KliwN%ibwOS2BKxu>RmlK;NS$@RuahBP+7HHK)^?S7+$
zu*!HE)}9(V8W|ZGzA9hxfD#Up0j`)wU2SwAIuN@9D)0s?5;CcOj3Q*#WacU&<w^&O
z6%c;o>}Am8?XnnUc|%vE$vuHI7o>Nv65=K0#7^Jp)r%?m?7|eT>vXeau#MSt2X~qx
zozP-8i@>(2nHWvI$RKK`;e7W9Sc)j<e#AX_MHsO@!W)7GQATGHtefu_He^3Y3OS6k
zI3p5D=#khRSD~Eh<CDo^Z&7ux(<fR!rW7q1a~0O92gf02?4cRRcq&J`B7C9ph;=-l
zwQP?pE@7Ct8L@5s2yGtHtzh47iybkm)yo#XD;&rdlLQT@j4Q#+yzL_*Ao7N^Nn^Fe
z2aFtfzlqk|O={JMVDTMNV8VOi`(<ltwmaek*|SDkv;g2&4b$rh=+-5}on!kw!1L>P
zn}u37=IpsmJet#rFvIJFy+JSiHdTAot_2oJKD1uOQO?l$KF%$zAo+7SDg)o$k~ykK
z23*Rx!2=q9Q7zZ14;S2Ap$VZqXn})X>Sn^g5@|u*AnJXi{_$}2(l7ew=kC|+@#y)-
zEbKSVUqj_@qFgQse=K~)giQrsvK?FY5y8<GMUMKw=X=~HQ*TK^UiG!>4N1;#4jz~y
zo-}GDd(+tL^}atxey<&mHhmF9JW>fsS1t2`B^bYoKe+QC3cK{TDK_I6W>6;bQN%2L
zJbcQ_Wf=LE=E(@o=QuMaEY5esFzUXt!0+6_9YOrETD=a~8{=nTUy#sZ2j#qftN3J$
zH|N%UvmxW-QW&N9qJURp<^$#&b#hm<B|Xvo6gDVD8fkk-;-y*M6w44fXja`Kq9|#r
zL;+^RxAt}vs~vUAeT7JlyPJ{Df?OawM4G1nY)+hp3mQ@{@eh+bo`KrPi?cj?!o2uG
ze{OZ;8tKgj)TYcz#cZ=cYOTIr@`}A_2Tm&SmwGla8O6TWD3Ol-b7(iOMN9TPRBM!n
z9#Y=SQ(3lw@Jf7(Ds)F4s3`uMbT<*s>)l<x`W(lWivHN7$a5McSfWD=)rc~v(*L^T
z9Z_G@q8xvl@P?JOFgw2#UP?YFLYqU=hx%%5Fu%Qoqi2TCgl+Y^N$y_NmnER4o!a}E
zc7`5K{$PY4Y=9>(G@g{~ZJ9cDIte}eqrI}I-TB0a?+?v&VL?G#m2FVc>L)a#H_(|M
zYKx0TZkyg(bd_!i_Tb;ekP`9}#$2+STtDu38Fd?O3FFXXJf_U<PVUg3yH(5Y74i_=
z>Dqx4L<<%`FL^ferl2S|l1Lu0-{)xu6$KI{TzQcqR-D#wug%ySn$YBRg3qM-(r*#h
zV>LtQM+J~IBpE<f{!*~WL$qnS3Tyr0s41Hlj*%*JRWrup8-e9ACBD%LcCLwJJH$Zg
zbV10JY{qM$-g*||r5b9G9C9X26QVhpgov(y?#_a;Cw*Wr+>A_TN>3yZ7`D$7(lS!T
zH9jnj*kjvWNW|}#=}LMigeQo)V3Kt<Ym1B6qe^Cy{ik9~7&o&M!e;SA(#Kc2pSE}<
zq@jVf_;9X~xauI!VkI>###zuve!zUk1I|>+lC9f%()O=Y&nI|ubTt!T#<Xu8mW19O
z^|+pNewO9pqELv*u*|q)%a4w2I*wY6VtPY3ybCURUW8v>cf?&T7<1oU8}Fw2VN}hC
zu-R+r6;hh~F_#uU<N((GZoDE4*A@2eR`MW79lzHSEpZP|TrV)yY4Qq@_DMa6=lArH
zFF9%jFUwri{rhRs!NNWK;WP|`J7wu~E_;RdXxVfihMb`36JLFgYjtPJ1&VDWw(A={
zg1Ge~g(c#Y`RtQQ&A_h?4cc_mom#zym^(3Y%LqbJFufg5bTD@QiqqvC8p;8=2Rl0W
zQL0u!WSF)t>QO~oqnQ7<zHh3I!0dkA^eh$24ofuQ^KLVFE#14?Xb|;OX^AsyD;ugf
zoJZdjXFYe2_7!6)z5}aNW}P(Bejt9W;1##@B};p3v!SNP&!L49c`2$WOnJ$4r_R7f
z1~McsdU8Jp?W1Zx>U`gb{wmm)o-*=RVTg#)PhWj=ZUJP{;UgrG*1WJw-n9g;_fhc6
zFCGxo<Lt{wK~iC8!Rf0LQ<T-S$eBjNysqHO+PF^rf7h12c9vlTh|o)m*Q<p6T071;
zFC)7acvQR{2F0e<w@aUK8dG=ka0^L-{8}{qX^mKZ{`es$E>8F<i*(?PN4Es4agW|R
zY;tsRvJ`SW(Y4dV&dWlTG_8OD5meP>Icjn7#j#FrYWChJSIJgMxZE=-+3>3cd@Mrr
zC<JI^B5q}!*Wv4lXOegCE4kLSMpXR^aX{SBlCZ50EEeSby*nsB6{*6TGrUFXmUd{!
zG%@DT=vEV#cz1H^F;wT$;`+H~v^=Z{zcs&!i@#nQPP{YMFh%%~>-Wy`@ymt#6$R?f
z?h=_Uvs%$P%Gz+MP`2>&cLJkvxjX1oF1fKXu4NyAuTJAv-q%`1*uBuDa_&O?oF3DJ
z!M7Hg>fu|FhBV~tFG<Hv>%8+>-Xfn$m&(Rj^(Nvc^;XM!`kc3Tu4}!pJB#8nvDi78
zsLxXO3~gg)-XIMF8V*HE)@@Fbk|tY47?_*!y^t32wKv}YyQx%7LGubKovpwoL5N_{
zIg2xU6IG26vgZZg<11!DbM?FgQbMlHo+F`sKR2q|+cDRZ-!Rx1z2B{v-V5~Ib-9zQ
zil?g1Mgi#p`YNwjM3`cK!^4gjCujTF_b#iPgaSiTI~4u41Ag5gRMj35Af<EtS_cm4
zsL3$C-AZLk)%-n7u`$@9O-v?(`eFvFR=}ip`yGfV!L(l%MEV#PU6B;^&Rm4z_f8Ji
z)4eX-+-C`hq|b9LYQv&j)Iy_~##{uw-`1wQyhUPQlWGVa%`+wEkJhs&R=WNoH_JX_
zR%0Y3O5-J$>nJprBS9AUJ6D{ipXPYAbU-GZ?6r+h?3pJ$npvc+M*&YKJ{d}O2ruUW
zNq6EjHqqgghWkxD6B&+3%Yhaezhp!cyfhs91&?(cDVQcPSRLyys^uU<icK;sEL9}=
z>Y2ymwC~JHX8WjK#(hA7+LJ3Yp&C;8*p-eNCHu{@?g{FlZkYdoH*Yt#L5Hd@!&U$v
zue@WJr{<V_Yiy6D=U3=T_H!FmQmm}2W1D19xj1!-zuxHXlv7V8W_Rsd2?c|-U<N!i
zV5@YydgYr--sMZK1(cq?PoKeTo<Bu42YV00SPiii{=*UiTD5ZWb~J1DfnaYx*c0{V
zOPIBn!R2GshV<VP%<`#gQP#CZ(_$3rE&Wt%z3&M+I1`qZl=zgMB&}z!b>Z{k@gB?#
z1kQN-_m4viYFWU9P0VV*lNEP^E4>0?iXYr<hZyUJ(sPFZrC~Wt|Dr#DHU<x_X5K5o
z*&Z5wLh2DdMnFcTkekb%n=nf;T!@Vd#iV-IAmu6949?{HMPMfnXK^w41s#__Z`U7%
zpl1+Z!wc#|MZEAvQxG5Xp{<{eU>DH+8Z>K2edxVH7&MUqsUc^WOKxQDeXEUM=|5+M
zHdh8wqvc((z-!^B9g-rpAq^(o!!*cO871PjRnrnjUI-Ex{n|%7=f|3s$S<%gadX!5
zY9Yuc)r<E~>XHSJ@TN%@hOVw+b~SM}UM|S$f#0Rbp(_%ZJ)~x(SnySvAirCcOD?~F
zi{o#rTfNsJTbH^6HikT2y4g~-x4km8$4vPh`33gy$2%Kg$E&?jap>J>SNKIB>A7ba
zC<wvOd-s(2lgHu|qzLxuZOd}oqc%_tK;7^AW{hA;x_vu{T80I=6-|^e&%&P^(z!92
zrC)isI!JEMo3*MIG2IaI9%K%+r)P6@HKMIe4N~4atTT+wkV`a5`Ya)4o4s<zx2B%L
z(<HCqPgkMD8hAv-4V~xDd|d+9oPAt+cASZ^KF)>St~6Rs>mgJXYY>sC`J4%4b3mm-
zZEcA*)eEY(APn)YW!{n>-N2(l6rnoAkD$nvF}f@j5Y?3XrrYuyD|zIFd_M7UBxVV#
zqg-B5t})WSB>R@(+M_*4@?alDIYwY%qExIz)cnIOjf?&4|Kh!5diHU4_hxjA{&OBO
zio}g);2;oA_bn3SIx>XRPAaW~+r(;QO7VM|nK1|0rZLPF(FM2Cz4ghH^oE82mWOTo
zpQ|Jt(bq*_PGXt;5uxka9yhMH*t>Z=F-v^h9doosOBK?wgXLTu9&b0?Q}vwgW@y;r
z+TaG?K?GKr4LKPVRlZzI+9<q7#nLAG1|_rq+c!Sr-T1zzlIE%dLmnAVW!U0aiPuqd
ze0b!(1$zaZO8E`+3YcH1h7t9BI&`7B!l_h58+a|UO`~+f5@d2Zab{DsEI$G%6CJD2
z)D3k}4K+`GY9tTt&gup<ci_fTt?l}=_T@$biD-kK*nl$h9W{p^;Y_-{w4%92oMnp9
z1%Rr^%x1!1(6VYauszct4rx}z-ICXQjf^9t*=up}+ceFU9_Jv)3G=EO)I}0Oi$n6D
z@jOGBd>ln2UA~<pT&{;L=N2^EmW@tUPUx{<{L1Y}87JGUArnQ7@Tm3l!s&i)Z1-40
z{Ph*Si5cWDeFSZkebC6?9z=AF(iC^N#h}o1K)kNilA90CUna>BT+UG{zAJc>PO7L+
z@iwqXY~Xh6v#?(FoXSm|VEZSLaKLGb8;Mjfqsd;i&j}HBjjWdXX!&lFDD{LRmBj#F
zbPXHhf8#mI9)o;32eCRK*sJfsb3B(%WKC)wdh<rD=nxF|Q@-K49}{hz#mTi-w#*i_
z`mvVuTy4phJUx+wG`QhO_~n-`<d`>fpvrGpwT`W-J_K%YF0-4yr(ekgNyIcloY;$S
zE5=o2zd(KId!K_3FTg3q;^?@BET6K%jlC&192gRE_tKSxzb_11>N<oMmv9xR<J<4@
z0kT{V8u2uCmmZE<-(gQvQ<uqQ@eZ3Z4b%9zY$p8V;*)H!d2KycCgC2gh`fZ1Bb@hU
z<V3W<xVN~`T<2v^NBjnw5oRYM3+SOer3xm~dl24NbbPP{TEaC#Z#v+4OiK?w(hJF@
z$&UX`wi!egFI5~#!45}~)Iivi{zV)oRBGn$Yb&<n9<;1rxO8lJKm#J#LgkLeZHV!>
zdlHp(jMFf_i3x<tH{&OVy#l4DmDn^*jk%eyA*Nd57f1Mus8qSxeM4V}hh1`CJ?7an
z-m;=FSd|tNp0N=+pplmXTI%R~76Nm#R;<}R7_r~O3L0^~)+7YB?td;#I?%<kgPcBh
z<?r<Mw@3*l-Q$8%Er?eIUWEkrxVVQSAGr!FRq{2ed(@96iqux1kD!`)mccea9chnF
z54y7)-2S0Unlz)NLiN7*WV}1d=%|a6hpv!1o%0Lb1@}M@XP7{bre3InV)RoemAurZ
zDQlaZIVV;EId{j$A$L1M&9CbR_})lHNSL=4M#Ph(KF^i|kI(w%3cVKYdU|&@SzIJC
zDu{ij3SyD?kntXLe5~apyZOpw3gVh5nya{d-<8{p<<~*Oz1J?t(GUOUSW_ANhkgDQ
z--Ba|*MWl178lKTQifwx#&KZW6ZDC7UZ41w*O(>HZIlz)Sp_4cil%8H&>Nc=aUtLl
z+A|5=xlWWfd1B;m8WHwFgpTmO6yW3IqEZ9GbCnmDs_F?Ecr~&&4E3nH?Eb=3?6*Ho
zPvjR0jt#<4+}pt`TU!&p;sc`Jj{`2t!5;V8`3hk&!|jyTxD$|htTBfrZ(}NPqZ<gn
zREvhI&!PHpKia*o6{kaA!LflsYQgGD&dBO|(^i*OED#B*>1a+Q3dt89+1BoRv(_g&
zB`ZJQ1-%RE#G2$c32)}D8m)?xf{eP#vFkk>vT9wl3^U^i@xJbItirQ*X&sfQ*ZSla
z<NL&=-TURM#Zs@tPo9&X&k~EpYUj8L+I1YBmyo7vRjQz}34*Ld$@nU)vGp@LipHwK
z&X5*KJcN<ZRCTCq<raX0OBdj_>^Q=zQs6(Y_**mb9>tGo<`PA7!`Cb)?&Tz$jUdZh
zcdbwDw+hW;ET>As$q5LZ;Pk0p@IDuW@09{0eLI;Syu%WSYOE3KzAlIchmEDJq#w*~
zf_2R4b%$u38V^_h<+sIc@}i<4{n&C*%w+0Ew{OO}bcuWGE`PPDv7rMl<brlMOEBSu
ziQj93H;b=rZ@iZ19#cISNB>-ogMY||B`idgdX%9oRp*W@75XdU0=f=oE=-eamX9%7
zFIHPGAL)GPUGR99``SNak}x(8ztPB)6<-wRt6(tb>|p-%*qHA<!97Npjd9n9s!^E4
z6Beb(Y43d1vKdq>)q`0)r&pZ{a-c0YnvLNp$*;2iBZ{!GpZ+Lr0aF#(W<Ds5L#!1K
z-~>go;|lw;em~_+$hB~w73bE%K8D8(j@?mwkxSF#k6=@7rmCrJi2Y1Ut&K&UPvya(
zHy$vHhtpMFB4a2SaRq0iL5r?ibCVP&d)Q_Ss$=QxJ981{K96}(2c}B@#Uey5*KiQ|
zBW%UIIC<aQ!lX4!`4EcNa|x+ByoM49MC0<ofXWs}!;F-Iy~#~hh0Eg4m2(37`j&=j
zF_`!D=f*iU)V(;<_@DYP*^xEwi11Gdq=V<DT&ep}M(bQ(wE&x^d%N0tjbXkRxM^x1
zhA2svRr=^j#xz#Dn#I$9?k<fchP(#8uxF8<YCd#*s*ZbXS@)Qa1p}zpHuk73n}bP|
z><b-%(87Wh@p70;rNxOa`gVQ3lhC*O?)C4N$@L-|#S81LX{c#PeA?7+$y`32<2j4Q
zeD*suNbzufitBjJIRSnTV|Z!&(hXMB7yC59D#Wt;<xwRDT{r1G?>x9Rd<c_=Qeefi
z0y|5_N=7Pu(9#g)a4kwkt$b@W03#w72l8M`o1xZ{O7o;YY!)13p#~)gMyPc5J-pE$
z@A0baR;6oNsj|N_o85HyCMm(z8(n7I)~M&%DK1pv91hy3Raa#UQQgGSnL+e9q2c$D
zgeNSLLor`B2jQ+!w`n)K4Vh`R))}O#59mP1jL&C$5$;x{lC(Hsvu>yPL-I9435EPs
z8QI2QX{|!}v84<09&!`HuMb==^GJtAvPIM4g*V8Wu691#b_Am+85FB$E00Lri@kpH
zhS_rE@qdH|OaFog3V*?aoOG{2vbDB#KNXu?34<pRDWn7EN5Pjap;!;s#VgY>c;U?*
z;U4`g|ECD1bJe8x)?jn<aN?5HgoIYCgwl2$Jy{v@3#<T5EaYoNb0$O1cZAXzkIo3<
zH|db1#J3)8xfKM@`D&#}br;fZJZ1dy0(ha>vYpFr`7JvWmy+={k7z*(LM&)|?YtXQ
zcGAx?u+sNHB4~9O=1$ykR?Py{y!$#Eb;6pH)kFn<+YCfFl7Q#l@heCZ^y1HUeE5|p
z3)tnu0a4(cj$*gL#y(p6L!GDzhP896U|8wJ-Ff@SBlvGn5Z#>U6IqNbu==T(7@4Rh
zYeW|?v5g~VM<?8TW*l(xej=D<*pll?iQ$2y7sB8ndWX|M;vZ<)AO9k5cs*Koj?S@i
z(BICPg*~zK5?5)eBI<pK4}Abe#ssrxrUGs^+9Fe&8>M->Qk!OQ>JQhuVA8_9F$gr=
zyKRa5vn<#kUUj#LT3vXKj*~N!+k~lE{(>2JLb*LywY(<b^UZ1f(W_9~u0oua!kZ9H
zwe-UT%(dgVXJ+GHaozYYKbC4O^rfSilwZ1&hti=O-sOFRR#`}6<2<kcqm_2tVTm*Z
zvSYkQD!GGHlkHSnfy7TunTR}a27W=+HgsMNvcJ_+Z;7?oa)}OOgOj|Dwi=lLP(ZrP
z{|yT8Vc&<n0~1FEn#%&Q9Vz?1cuI4MMH@pGWO*r{{D*zX5b$+)ZIdyvjxFs33`F0I
zq{)f!(1cTCG+}M1J^mqVGIbH`J%*Sdvctl0j7H^x;8;IvWuX6D`pLVWR#}c)t=Id5
zB?R?%mm>iH8kF+krS&{(ySw_eeKzl0{L<;G-2O@1dg{xhi+TU+JxkF#nA<4D-)#za
z(t}PdxCOQ5Q_;ouw^*e9Y6msqZfxU^C~bT{nkd%DQxacM@%I+STz{wrXIM}4=M;`N
zxsp@H)Q=ZiI(!vQ@-VFe9U@tYhH3*nX-Rx9XpP^^M@O>f9CpSNLDDZ$C?$@v1#2t-
zcrfM%5_K@8Xjhkc3AcWR5YQ;e#%G&MN_+C0C?b=I+x_P{(yXt8VK|~l7dk4+O4UO@
zFGo|upDBZ;yvX5#kQO7GnzXz7P9C=YX<PtGN5_+y#$baz%h>-N(Pob(tzp)p;VlC-
z%!Q4zeIr2XY15u=ImaJxQ1ib92XfILJ9!D)fJDj+k5GvPybVrsGbGc~cA;#R?Rg(F
zfKPKF>0?2B5484TR5@Zt6;w44XgplHb_PQ^PnfzfY%_LJyq;^-@|Jgz2iv^>VT@`E
z2SAn$iAJLZNO4YaLbVsbInly+3e*A=X)6*pp84=xJW@aPA=Z=g^TYk4G4o5BpQBO@
z5L$XHg$yi*niXz8j|h)3-)ZDS2&25ycS}l<*twfZPO6uf8=r^L^3?DoYzVu2Gcpn-
zBY+*KHZv&o4>Rys$}OOjTRLtn7xR~1sp6)uM?74n_}O=GvlBAr&H-BoOBkTLCKnex
z$^0GRNijEZlP6o9a4q=%og7g9Lk<N0-;x7qLuBHO!FP#vTl^-dg#3nhHvV~Ts=v9p
znCeBm^1|O5daZ<c9CV<4mP;AI6+h9;d}<y4d}JkpM%_C5b!r_a(NtDY+x_kD+Ux!1
zLAfLEOk9yI+N)l{R;j1f--j$P{;ZORm14mS(z9vJf0F(?`@5*sy14iJz+q9Sp!ldT
z3-wuec({$}Ebo#LWR6_qNh(bUSfY`Nmphs_*B^amVqRs@$VhBcINm{Ycr|RIJGGO?
zBv9&_mNMC4H<F4I==4?Yo)fWQg^<@`WJn`=qDMtI1G_1%L(hi@g8&jC1dLIhjRn-x
zv-o)$woKVBqlKPwn^Vk3f7zur0VRm+Hk854xrvBR+j1?Erz?{*4M)CY4)SL{r-Ua7
zJgHBs70$gdSu>S8+^OzBv_S%N*xOtcHRH@&lGEI8qcB>cx>pFD_?=YB4~724F{c!I
zI(itkX`ateuDArzBNlZA&cc%IiP+{ySWu(X%H3S;h`J9zoI5XeWH-Xnv9r(Sj5372
zhrbGt>XNO!Sdj5u=D<ZAwWT^kF}CyjDD*7Rs`H~ZMoNH}m*P^vRodyqxR*NJlT?L$
z1DR8q_WcUuoy<{2?WGRU;dv6tZm`T5NDEg)?t)GfoiwZO^vMe#%~3Uj)7@e+cx;(*
zG3+Z_+xP0h@5e+1{Qk;Ctl0ibUTUm5v-epE3QE5g<&zV-S04QS0yD6N%09wJ1ck&1
z4rIM8sCfm-X%D>%U?N*g&P_WwhlD>kpAEkEAxJ{lO~j!%D1#+h-JPG<LEh6QhMXn|
zdaZ$KpWguI&sPBTL-N7&=hz_{&MAIQb-=A9=cjV`oM#I^p&!Ye1xORou~)~Ms$h(l
z5fiwe#pZq+i@+aHK(ty|56-`~+K}ge1XncVM(Xq+L{$YuQWYDj5w?e5`ZK(oZn+03
zJS%C)1)ki#+887VsitczNs9ms|3XMvKr5DbhL%tJ=r&+a%D;-ZWFi@I{?gAhw|`V)
zHJneVF7)4+d&{UO+rD3z5D-B^x<MqA7(hB^KuV-lItGv!q`MoWL8L)C1pz_28>Le^
zq`QWWnSJ7QUHAPwd+%rMXYciXco!d8i?ujr&j0cM<>|+)^!cTYTc6JA{`#p?Q0C7B
zzs1{qm&zVmkEtRalWed3+7&!)kG-nrPFeplI9Zya0C8wmob>^k?{Pi+dl=GjiDI4M
zey$ffU_tRdQqafcHw9;}4_4DFiqL%i@S(m5sHYqG1q!J$D?QO0ZegxZqm#b<plRdE
zLUDRZBS!+dkR!#FBl+T)JCbXNwOJTEYk)zM<B%Nz$iu~nza?b@V6~~qHE(uGto=~q
zGrb6SXty|W@ZP7k=6X#h;Reu5FyoQTG<ZyI)+#ShZ-LJ4VYULIfR;=}*Dam*DuY6V
zFfX;tbxsp-?@AOJg<zYb&)+YKYDLBB6(sI?71mcv0?^GC&V{B<T}S+u-@@t&Q^f(*
zPOfLe{b}os{nA^Q7OLADC?6%xOS>+=v+hoxi#@+Vk*CXFun1+XJ$E6_y}ccUVsW*U
zCy-+*s|<m|+|y%pcGK{bAQ#-&qq_ey<u6Q4<mKQBOTrAsH2=M<kw>L5_e)}Ofl>6K
zY&>ouL_o}Kly{qYQmb*yvkUJv@Woa$0)6Uggo2Qdb2ifj37Q|at%Msk_Y1u71Kq7i
zmY6(nlQbhw4ew-b)etJK2gh5mxnhsz{z@!}?<+A({kMKm+{wy@ltU73_em511?%_(
z##VEM0Z5J37+I2SJnxCiyOm<kOu{QPzID{?g<Ho4TOHQ#T?U|D;LQ-l-f;WqYpdW9
z<>37`h;Z90i+3RSkR&5O$w=*|3QV^Z6dMU@w|Q|uN8#<UvGD($*?~jnq=N2P$X5D(
z%7Db-m+Qy~;nU4df{fLHM7baX1>(cd!q(q9bVqq`xfoFxnUTKqzEs8qev8<!8%q#!
zuT4RBx8*a-3J%Iq65Ny#0{xJFPf901X~fK%{r9>z^P<H&CmwGhf}}qLeinrz&K-Zh
z-);J!v+|0x@tDky@gs_r#0VKc-9J(TnXdN<UwDOGH(Zq2UYL)>1J8*14-B|`0(;ia
zSQd*dv9-82n^W(iCwkFFnsGz;HN8$J0LTCvfyU(Bp3O#kU-m(J!wW(L#_z7)yPt^2
zKY+oct+DwXX^o#JU0ZC;i&W4QB@LWucbQuZe6jcLXZ9tpsNjzwZZY0Svi@MkKX@ZE
z3b(P|fRIDKF;2M0WpvzpES6^7N@T!e`uWB?@oReAqz;zEM8dn}XoZaI2R0)=X9r4}
z;k^KVTg^~9>5}Zf=zWaf{~f)b_+Qcc8oAgjxdDuHbH9O?fUvSWoViy!t<0c<Q$6j+
zU#tv~6X)^7^{>GU6e_%%{MmXE@{ZUkXv`%~i-LVchB1Z7>RvQ})_5wqF#+|fIVl2S
zJM>7I8O%x-bd-cH_b7vnGfLK~n(!fhR4ewdP{<Kqfp$2~fXQQpFCqB)7-3z<0XNb&
zsrz)YiF1X>-m+&zgMB7TjI;P7&NkHfgM&xov(MvuVqn3SjcMygsI{S6twz=CW3?!?
zEd9{KY)9M5p#sANkV|v_1_pf{{e{%wiUChD_sU%0CC?LPgS)wtMnSFyH~H!MgRr|J
zYt1_5x>3bU-_yzDW(94}4a@OE3`f#YN@W=lUNes=&HI~T1A<4H4#S?-ldxY|VG<^>
zg);)FJ-K;M0^it79f?g_1Bxm<zN{hz%>EAour)h%X9Fuy0};%ITtnJD?0UjVp?k8v
zc(R_IS(uwD8qGjA*IU&C5*rfqweRsUurASMwD+%cR12RLCIaX8;LrKt1Lr4Wfo5QC
zOt7N7T+NgYC{rs%852(kOgB7Pj_Q_;)YWi5$mG_&m0j{hw`=ho0xvHGX%9d9aLL0*
zwI@{O(Tod+ZHaeqMBw;(xB@nz9Q(GLm1u|(sOjXBWl4HE?F=j@a`mzg)S^%`XOA=Q
zG^tm)U%xXtyKu%oW83ktN}a?Wc{SMrD@b!5?Hv+15S;<Q#Oe$8H>MxS^5<PwBJE|b
z$e^AvrbFq9Hs0`52bZjtgXZhPvNGjusM}h6tlkK)2>FchP3lVC-rk-xpEpJGFM2u*
z1bgh)1tZRCT1Li{A&M`QF3MM;M0)jT`DB=jR$IrJF#Tq2TGIBL&h_25zZAf#Ce(8j
z1?J<br;KnOT~^VUcvk&HBF<Y1=ACC1i)UOGy|!{=l|EgP2sK_Thj01gaApqh&ni?G
zUov6c2kAE^Auf6#qmuYyQhkY_#LEQ$<d~;9{X&)ZFKax0Aa*wO4x8iZXMgf@a{~ik
z>*h<-`rjX@V57NmCvEuNAN7HSFHrfjW#duz`22iHeDYOi)aQ2SDXa)t$lu}i=N4<#
z`~gVfRC{y)h5zU;HN;zYOke6Pr6@n~`4$60r`ZwvA^X9~hQCruRj&e-1uM=UB?Tsg
z4%c^0&IrZ&Qe2$Me5#b-pl!7AbyfO}+wXBx1AEzO$6hqhH*gZ<b^cW)nIZl)h4;I4
z`Nc2(b#A_-?`+<dj>-AQdS>23Oehzh<7g6wOJ;j+kF?bj?LBak{=(2i9i}?uNZ~|a
z^XNIk4mD+{vwi<wPyB`I_%qX+chV|0M#cQRbv&5UsC)K?(yyu4fGuX1SB^ZCXLjP%
zcb_8iIcaxs0skUK+g3jw+72JAh6o}%UwlWMVHR5QYQcMU-+Va(K2|aEPFswj`tRiV
z^n*b6usA5Ph5!|WyycCxgD6&7boo2mm$DYY8{)cac{28$E5RW(xR1eZ84i~v4^?*Y
zH~G7BqNy9viIFTfQf^WK6$iC=&Z0iPO1H8Hz6<K+KTs9DSkGn4)(xEA9~@3DpcHJA
zk7i}^ff;Foyd0y-NU^#cN-lI}TH>w}Ir0kh8HCqH2QeQZW_XU)ZZXZzaI-^++zT6u
zWuqRh2-ixCduzOTwLQmO%$)f3{qcHVtEICB)kA$M;K9*RfAPoZFi*iM2F-tXQys(6
z#9h1o(-xgOLqK(bv=i<KusAU{jeRUzq7*PuZ&}9_m(Ji%_2!#hI+7=%cx-Ne=^YpW
z&Xt86IfIWE&a&@ZpI)?sToo3k*|SR}(OR{t;g`UXf3vI0Epr;k?Ex7-VU@ACZiiMv
zHpy>st3vw@A!7#-?i3lzVX9UnSRyHOjvV)~GI0U6#=`EtkpU{O814iQQ#%AGd{kb(
zmUcwd1hx<hf|DFOWZ&Zth7ri8+1+8aD8oeJ4a06GjOo9)s5B^L7vQMN$LXK|B>6XS
z0bf<mTD@GjncUoGm)dx+*%Fvo%q7>l8=bgb>9rpk+@IV05H)<eEirnNe+gwz$~2*=
z3m5B^%p;uoaz4(^*nr3n=tx82N}QlYYRx2&<mgQBJEvyLx1332I0Ie&R(1+$!tv=|
zXIfXwWG$>@8mWq|h|7(!0?6%Ft|o4E>AP90n!FaoX&H7Ojmw+_-PLgL=7=nvVy|rl
zd{ATzm?u;zJSGpqUa}WLP2$xaxg&4S3vfV<ADtJyT<QVxBKCMpNhC4~d<ByW51MZ8
z&OqL5<kGV2l(m5MfZ=10D$;vT{ik1%Ec+wmrYz)rq_QWs!Qf{hdpn4+_7O?NGw%bB
z#hd_quqH>gMOjnA!fC0Cxd{>&6|0F@mf?#SE79I3j8}6TV6*uzh!Do8%;!U*Z^l^c
z>n8O*m`oOd31l8j<4ixY4__aU@AWy3%@{_-qW(C%EcIi*ZX;cLdaEEqsfXG@;Wabq
zL^z0c36_m)Rd2o15kC5rCjjzkHGuvmUHa|C{CYq}TdDL5D9;5&d8H)hzDc6@eetn7
zDQ0IY;Z3V&RwB0;pt<?unpvaRgjRoUi4%po3pvg3E?9Xt&YA1?Ya3p@^ong~oqVlX
z^n&$RnxC~R8H$&a>F|vS`RoD7haTJ{gZ7)R0__5;IF8utC(%x7D$rdyKlH&_MvKH{
zyK6G4;*6YDubtCuH&q!_O0@gZ0AlRs*(NEs-R?y>P7A0_=QH*a+O3!~DLoSwMC-b9
zT+4jRx(|FQ!x8uENgXNpAEs0Wql34zNH??iP0Sno#^d(BhPhFIh{c5fRj4K}P+|&S
z&$_koLm0|FBnbUW2AkDy{|1%x2oYW1GhipYKRpr>f`yI`FgA9{Sa_NV0a12RD=*O9
zjDGoeil@6kf{moK6mY1PJ0Ru7jZ=F1)Mn6miE{{(yMo|${~xJmV}Z@oHpHDpF$WLv
z#k{<uu~smgR8&((*O|c0<hzXH#r>Wc|I7AE9$d|lm)*a&k7fYvgSkQbFZR$6_hK;d
zcPXyrPd<~W9{5Lria#EC4b{S7h{?ryRKx4`Q{M--@6IR(wz@IY?&LC9h*^A1OKz(d
zhiI{Y32`QauX+%m)11~DXWBpaz1g6rHRCfj0nUxOdRRYm)}Ir&u0z8ZOF~4(pQh-D
zT6Hl5KP^PZxiis&*mKB3PhRi#ylrr!3-T_V0K~9NTu07lB(+Ewdfn@cILXWV^mBgZ
zR&&1*%aW4LZy%#YjIhw^GPe=}hSNni#*ceyq7c%7?@LG6m=%u1F539ot6cqwd}C}g
z{7}<6g6+>Bs(74rfoWr+x>=DFCH7rXk(>=0qmim94n1lU(*8xajWm0fD-4`$jQ9Mv
zMn|V>iO@l!%n{|JFpM<-8otu3S#Y<gdv|4$sFx5IN>n~}Q`)fq%1Glz&v`m1u%uD4
zlVy7%=t9jNMZ`$s?7VS9jJ|}`lgM)!HldMfl)6_^Jrm}QfM<;D=${LxzRXu(Pk?M@
z2Jo!CZ__eMlMbfyc71KknS>lK05h#TZy`9^E-w3YxY341r(g_$Cl3t+PgW}Mi0vBt
zj428*nXqJd@&NP0?vr&k^2vt|xxcPs^8UY*HXGNu3uSekHQH|FqR6opV?t00w7Vs6
zOmZy$>?#zi^sk2z;5d~Pm6N8Vn~W0Oyn6^^pW6GqFum8O#3l8Ha4RqnZ0I-h<LT}b
z)lq4Pb3e)&J@bX-eRS6$%=stlwKP@IyCKP50Au{W1Y`bDqw2o__|s|@zQN=B;iqKO
zn=pr_e#TAm7|f6WTBrM14g`B;3|KK8oPDyqGKudJ&JyfMI^Tscfa3y6G32kHafj;T
z44ejewVu?41}NKEXpR(tUrG8{E0}Q~WHwPoZlJ=R=2qb((wt<)D(@4hI3#rk;Jf1*
zBgfJzzXhlhllA7HCO;3Pn!DfqE-G$0fJtbQwgw$Wmc3zs%Ds7k7xzi-GwX|n328}u
zu3ir#(sklELmrPA=$kSU{u0_5s<w!C*;o}Vk{y+`Hrz-a3&^}9Qm}rtd($C8#?w8L
zq767a@<nMeJ-|_L;t00HS5H1WR#s1=L%Gu77zza#`z^!fubyZAQoyIv3hVXdhw=yY
zxFBA<<!NSd@pg?sr5(Zsrj5ZLP0DBiU0ye;N0F*}0;IggdEWH4mN+x{c(}t?zA4ys
zR?Bja64K35rY7gY4<B|uuob&7l;5wV{1GvkJ8eL5lyGD5;=Wy1^)LeF0<hSiPRpsl
z**bnpyyS-%hMbAO$;Pta@l|C<BbliEg)i;{zNH|FVg37E2ABYrsWu>Z|F84?gph14
zio_YXvUe2D2t2}q%Q4d=uC$x<#duhj!InUL6>Ug&u1I`4iXTS?`nVykk0=q0O2auQ
z+@KFs>@b>@J5_4!zoSY;aT2%%0d@<S3Q%Mma6?;|y2!fW{St!m1H{b6D#KI6DhovJ
zj(}m}U^$9S*~NBFLY}uEIb3L5I1++SG+M6Igb^1jOy-<PSka-%;LF@O8t85zr!xac
zxYPP<QqM)N-IOy)`I)`aIQ9JmD6rR8o-cT8*vfVpog)CMGWwUUgJNBPM{)B^L`c^;
zTS?`olCZOR7pU;bu;kj{f!m(bPo~6S<joLLb8Vo#<z@|3dAGD1IkYwYWP_C#BN?Mb
zUl<)-YcwCn2TFU|NmNqdl^1$noovxFg?Tg1<cA^{Z?OL|!L@1*-Z@Cios%@Q@8R2)
zWU6%75Cz-_@N%^_^vQ~}l?YofZSUgJS+i;372I*9e5MArwjt>m=by#}gItm`S{wSq
zH;x+3j&;XMB0Q45`MwTv{(=q&XMn-&Z{f^tjiKSCt>r&m0RMjx(JnqeJZBrmZkM-s
zp)!s8Y+q)dA^p)*L_xYbfl9wM80z=yqZ@;%q;lV$;dh}xZ}dPDAclo;B#wLE&TkoA
z<46EFAyC)`aa2=otiD#R{e%mmX-K)?so2V99!7`b=H&=TW1_&z5|+|-P4)RIMq+Ds
zb^i;m_su<_{E(pdZLGzM_K;9=TNS*S&PyEqIDVOHPs;UMce6tfPdFZjY(BYof;6Gf
z&I7o~W5VBeW-r(?^itrue5c>M^kM#iHg4^>Z&REPK@m0pDEw+^LN?xuegkqU&oyI}
zizvGybsehKhyKpjoO!pS-scl+#jBTd3_^$SB6ZOW`XyP}{Wu*|&>b?-)%$&uRRBh)
z%!fbujTJ}PrlHUgPgGXNQ_`Xk9pHKtQ!W-<GR!794Z+#uMMpP41NPoow02x62|$Q{
z#m=}HPp{}<l07VDI=n9%gch$?q=q^d^jg%XmH_TuO9xz#^k`v(b_PrLN*F|}@2sSD
zZGe?@FZ3?LWJ`f+_-febdoLICLj-St+D0FjGG;`2$ak82ATY-L-N1V#QXpU1=W6Wa
zWK4O?ydW*Vsu0*Yc6mTi$m<ql&PKXNR41DK=|wwPGrdbJ)S{#c1|JY85IdiXEv?@!
z3Y2D7A`Rc~DqS(Exsb#Ydh(?M%|dlan+rr*7%sgrBnpqvjo@&GAb|xrX_JuUZljdj
z)%F4YMqk><MA}f7krn%=YL2Ayfwl^hzL%XsHVdKy)l*it@93_{Pft(fke!3O9=qki
zt6!FjO{EyX*V99zzy)3qw^?B0+CjBx0llW&t6B8c4mz}%P}7JHzffgx?j>tvD{JIQ
z^E#V8*|YJXQmZIg?@wmjYQ%sq_n}@Nw6y5%g6)>2t~y!33@z;R$6sjyorA#YTN`G@
z%M<(&W!w8cbgoONa{MDc1_FQB6d;pwX9@oc|B~4${FOWU;ib}85fXfxmBp|Ptq&v{
zIEPyg#loH)7!XB$^m8^_N;b<Vh&LU~EG-S?NEU|cEasT>C5{pAe-HM$YK@30x_bUV
zQUZuFeY54}(5?*Z<b=n%C0^pCKYT^nAD+yhkY$jMQHg$pwi6KQ9o*bVW_WOH{DCb@
zwv)xh_OP|HW$t2xdYbI?2jqKmQdDCn9#zQb|6W*B*{V`4TmJt-T1?OWJ@kJmEWXIV
zh?PF?`+pS{BmeJ&#cIa$L53rSB?68;o%RE>+mj8Co{>C(ngg7RL^^@kZkI<#F1F?e
zu~2JXzMP*^-m`ckgQ>Xi#Ax8;_vJi)!Z|x1?{#F8Re2W<Ah+Ags|=cZJt=rTTy&8<
zE1d@(rT%-CJm_j0-`hR4VoTIoN`O^cR1;-S0OpL#NV#BfqZ04XjL&){5C7f9=WWmh
zFUFS{s`4y@N6}dYdIGxR2Jlj!kr{KCGCbr_7nt@!g~=SqF#morer@39tZ9Y&+|bs~
z5_~3ZisATy5Et(&Ll}>#1y^D<D2_zXK$o-E13J?ew}4TyC*6_hCglI?qnLlv!`U5M
zKj&1*R}GmhuQ+t^>cthpYgz-|Pnb|k=;DR1O-P`<k{{h<4HfLOSjh@XKxe}F;c76{
zDaAm}WVCSqE}Cff+lcmIB?+N21v}qis$IRghHi+g<V7Sc?o3ept*lNmO=VKlvZO^q
zDyYK&>nn@lD%lf0#kAVdsOx~x!-0O<UMguvWpWG}#^tekDtPaEJn>%vgA#?-_Z}jD
z*U-3qf0bTCi3c}{<c)kUl?vKfzT`P7*5eyY#MUXRqgk(+wHB#gPqBa<ufhnE>j-q%
zKae)~tt5%KaFzfYIX#m;AjQ~oH_+c9ZtZuGe3e%jx4UL1G0~n+p3VZy-WI;kh2)E&
z3`j=)5od%O&bm$Gk<26SqTssC`8f>44iqU&<8?9;`eQ-^s@SksotmpS%_H=UgOUu&
zFNnN>6X~pnnwLeC<#P`AxiL&&fe%ry<`2AsAG6WgwxT)$fVcPN!3Va|TK}_YGrCBP
z-TR>CTKXsi!h3svUuk;+q%dVfW-l=B_$GfK2<^G`Q69GEbo;IuOS<dhG~0IU$kU7`
zt+tQ;xDL2vp8E!^1K#+{g)P8vaQkysKT3e9am&w?dY#3|TfHEwO=25Lyw}ffL4r8c
z^1PZ`Uzxzb*^0l!G5?+2#cT2!zofaFeR~-cOG2~U@oIKt<Tui<F+TuKPrAKMGsS^_
zYO*VCTKW6&piq>)exa_TZ%c85{Qf=t&Vx5TgP-X}I`D_`@DN)U9r)MxO1__^fQ=}J
zHlhVXq5Q#LVy|~<21C4quyLI>gG<%R%gQn^FA}LbxeeO`6I#fJi*83a1-Q6g!u3N)
zYZWrM1EA_6*%mQnvI?t(Q?Er;Pz;B`KX^VxvWRyQsPf{Y5h)rOlDFIZhJ1cTY#?**
z0Y$7#9ago`pkxUIhuZhvCb>yN*bP@?Xx+U#(dtxX<O$`zb{UQtTpaZ?=3c-@J91wj
z_FT>2ibhGn1;-JVIg!;(tW7uJW6{phs$$?Y?=bR^O9fhsvyPwAe(91nD%9vK22#TR
zsJ0K6xe4E^;?3ZA;l5Cn$E2rb=+6RZoi+=;gGYhBp(;}-q<{lx1}>T9yUe@%IxGb|
zP#f+_9YRI2U#xh&TN&(Y#2itk^vC;SUN#>ex?=hAjEq-7st*L~eUPTK@(pzOdWW&=
z{yjeC0Xjv8_=`j3#zYRylQ3h!qfsSyuyBxg2{~!M?3S(*=1AzZbVI*#@{@&v&N<AX
z@DMN|^rPklim)^<_H&loP%0uaTT#4;%YR3=v>v&nL<11MUNs5Cwp|7Q4OYpst2-Mz
z&MVnl&t&%of(~X8+C~1aA+;$|iI7n!?zwG|iZ2BmEhy@dX16YO72>Nc$|E4RGDo@>
zjpOfg53fVdqD9g{Yd!$&KPX;zGzcXSeOO`d+W;Iudh74Y*jC7eKQ2p=*o6yAf8Q`C
z!4g$?tGf8wQw`U>^Ib(Nb?@JM%G7IrUW=f6bEu3kn-jypV^v=Ym%7Z&=HxonNPodc
zWD&kxV!nPvl^@u@hDm6k&p*ruUXx%)_~YKC6hFbFJeCtB+zeYpmUJLz>5^Ywmd}<U
zKJeal&M6aMFHU~{sCXbTi{<%yd~#vE4bSPMDMJ8XBSpP-bQWLDsD2KoS(%V@bf=ca
zS?^jtqj8=>-F@^2#Ajj#8L`+o1v{57UC|u420OLg5Xw?Zn5DZhOEHCYEgP{ooF?&E
zkXqIL{vbC3AA%?YPEdmv8TP$T9e2xnUd`zK&|}6bNOync1qfbBCt*b8vA6C!B?a+*
zh1+Z=Q!4Bc*IUXyuViW6aubweHQ3*`0FYztg==~2%~8)zcv(M)G2~1IzdS^Lb++0-
zf0sBq?L>{jj?><I&aQ{4Ygq%0v*pHKE?n;_1JD6-_xBqP5?YjorI2zFA7cMP?%bdM
zrqKjk`d`z|R+15`>N|#PkRCax^j%-WGJUW?n|sSNEd`{ZRk|&nmnieMWmuaKeDJG)
zn+PM?w8lc$$O-j)n(FzmjNtCniIWD%T<iH!BF|cdFVr;<`KCZ2duuFzR9(mNy<X<c
z`17H$s>%7!n@M6Gd^08mH7u2G_G<?S1yIXpME|t})~;2>+w6@&uTO}xXdgM6=Vl67
zE_+{nj><nBQ~&O0wl#VUZ^82V$nP^IgKd>Qhiql!-DuDFv3!0|htuTHW2Klddh#hx
zerprtBNj7j7+hkWaek08+{^+@?48kr9a-AN#AbV84!v=f;z@loeww2?<<)ZSJ~}r?
z&Uv?Up9?R`q=ot}=1PS7j^^cfdm_|3e*dCp-Vp+Qrz{3%FR5CmJn4QoSx~ZYWt!49
z8MIUQcxQB{$YW~_V<b_9MR{3|u)%G?zh#XB3*>aKBM_Z8&yg2l!oqGzMEOyvz+UCk
zwq$5j)YT8aI2s_58p@OK$?_{WOh|2PJozq^dc!lkO+=jes1pB0H)E5@xP%o^QYDBg
z*6>@7kud#Jjm<f#N=8Hx_r+?-CpU86oIlY!s$&dcEJLGlhDYR#Gjw|owI%UhkVq=L
zr21C^BTG>IwQhGw$fS?<cS*itwx}Az0JVPU`FoW1FXV;6lk%wRiRih2=l@6QRnf?l
z1kQh%z3ZR*_8*k^WjDd5mSr*z&2URnk%wEg==sKvSi%e-(K2or>@a6XfjRmo1M9j*
zhutT%YgW=-+#_VcZsnfHV{l!^O_Op|4!raT$>Tu*5zw(g+q;dTb?>{{(ruGeemHt?
zu&lRtu)R_j$ul$8C}R0bx}h;o{w!e;nUi6C<<g?#YcZ+gCAtTXvYvsJ9Pz%h$7*VX
zg&^RoD7V|)V0U}{6Y1?2OiUEu@3RC}6~DNg;89vcJ@9K{Pzo86X}-}2>kAyc^;1^7
zQO{pu|I9-`>kr2TRL*5+7O+bIvvBj3c?q~bkz_+L1GEz}<g~2CO1Z=kO=X`D)!kIT
z(Wl_?4d?AP_hI$}$A~Qln)Hoh!aGCIe7}`i38466{)hSZZ^hqrfp6rpl?~0RW900n
z4aE~{FH{bZM5m$lcY5;sd<pM=PVUkEH<Ej_|A*wBY@<Q%(EKA{Tf!1P$PFnFOA3v?
zO@teVP*wV?da&9>W+F#^kXMn+NJy7m@{lG@uX!_H*hyvN<U1A#tPStwP{a0)3Qr`r
z$iJ^=+G;d_9tda57j+NCkk%~;bV@uAYbIOo%kBhD&yheR>L&)AOxG5b#{LI`w$wJt
zn@R%&S<3~6*F^{2uhsC7JF(#;3*YNUy@5XaH&UFE2}$-!Qk>F0>c{y)4(l&tvN7PL
z)FJb$E%3AhSbkT#lO1{mjha{07H?kyhmK6k<$%rRXNSS8R2wC-zAv8b8_HhWZ;av4
zweM+=%hg!X7{S?k0|Y>J=BR1tO)$%xFZw{NDr1^86+QjLPqHQf<s>vha~R}YM<z>j
z%fd~q^jEaK+ZOY%Z91&NK!1@toQnAXW5%=X*XE{#UjN%L47gV~+3?{Kied&hi1{?P
zCH=M8_m)l^w=%?vBG3w<l{GVXMC3|%{j2ioy^+A}$;ByBPZkc9^BG_%`I+wI7_|{}
zt}|M{vni4Y>Bbo^YuSpD%G^Y6l`m^dAU(3a5Zu<~0;S7GA!oFHX1||R+WMx$QiQYa
z;oh({P85|psB~TS;AUs>eC*u&0>`|$6a)TZIut6B+7d!wC31lTUqUK>%51@-Y`*?I
z?t&u^j#$$3ZM?5Nv?t72=(<|o^2xD15A9h8OPnJ%4C{9?&PQ<I`U*wo3p-+!D`&G$
zD)&~WH`Yf41}|wj4*I+)@`}wK(>PrqbJW!Je=@&PGcI``hLgy?mvea|PXu_53iJ_G
zoR=2(qUv?trxI@>lL?9afz+e{T7WqncMuIF<y~tFJxjzC`WD$HE+aW{;3OaB>bq(g
z2lD`i1T?HwtB*9p*1^mJ^?@ldf)C~<uL@4^(QHY90hlipa8bySg-3hO(F6s1psifg
z@T(Jy54;*6LftJu{Kc~QmawAAAe9F8{pvy{%ecKKvt9p`cs&#APE$F<<QQRsJxHp|
zFQf&6eN=yfea&~lJ}RK);M#}>(JCe{ntYMzN!<O;J3HYn)wiOWY9-YXz-Wu+h-c(E
z@a5O?3x{M@h0r01!y4DE#|Wnq6UU>6G>)_A{tXK&4j!kYgQ+{IXkSRL67k2lA=)pa
zMaQn%PpkyCvT68JU#6Cdr8Bz}aO--QLDF2*uGp-K^gg$k&tp4|qP{5{JJ$1)K*TiW
zfV5xYgX6uF13ZgsPd{{=l+%2Gd2UD{(2iG)foVDBX=;d)m`fLu%2702i<0Dn@ZU^x
z{LdZ@sr8E`QQTvwPZFqaFC9qS^e3)4<H<@VfgGO5exV$>tS}Ze4ql$kvQPZ@E;n4g
z9R|e6@X3D6Qh3mJ0BOs60q7PX*%8x}{U(cae@888UUyj>mE}H~Xr2~R)Gqpfvg-@j
zmpc4R#)ZcNi+Cuws1`Egd$gwgs*Zg3$ahD+LoMm{wEh(81TWnmHtdw8e(#Itv{pQ`
zD^7B%f27W>0@k4jRqtoy%*?MO2}<#I$F4;$$#jTetGrg>WVEPcMoEyt<VHNP)>;19
zDZo>DrKN~w=sf6h=Xfzy>oR~zrO4kU3JK0}E_NC5^b1LN*L&{)yl=S>)HDs!fzc|~
z2yjo6tNxdLoDC6xI~$@4(RUr-n;ZsImhC13#I#vP9^Ws`4tas3yRgEehK}$Y04H_e
zi9`&Fo$D6Hvy%FSV{ljJ6qWI(mGYE}G=@y*3i>ShVU0?Y=}GY;^{%Am{V{N0y>U<T
z$og@n2Lu*B1K^F;?pgGm=K|1UeMVToG5a#loDpOVBjGs!ZTm3D=kMX-dN*8PNZ&Hn
zfe=QUV7DJDesdp|2w7=IyNoV@8Y=*malC+9O~e=GbR1)sJ)3I3Y$VfPp8stVv5+ge
z*5Kj3*>Sy}Z<naWh2N$qF#XXbb@ASl$b1Yq<hm=~@p^Ipl_ymw2E6@ZzhO`6VA>?O
z6aO?<57=B2F=#zqIg#0IjtHYp_KDo{I*T?>nyV(7axQ)ME<VRGsLka2vw07J83YY7
zFFv`GELyCqeyIu8c7p?ImMTc+4#vd7%<GL;PnV<m+JYz6Db!6y#O$b?Sw`(eu9zw;
z{ai;{{mnQUL$kv59DJlqMj;g(*-56?ImM?GC3*BV@E9#+(05v<))Do-zOi1R^7Pax
z$u!$n0n_Fa8hx#lfv|GHXOmk`(tt#28?oYTr5MhSVp@*>I+2>n-GBd?KHCvn9!J_t
zzj#w92L)G9FS#*RWnYk!oLyW%)Clhcxz&?iOAWSx!7oOKBwMKeSQA}wku<wJN}Z_S
zVJnFYSA(f#g3dOyySB8bVdFAItox;j2=10f0_sZRK=7LurFU7zy;e~hnQ(4rT)ZvV
z-XV2JapU;QDAyZ;qXdagmJBl8KS@;dKS@-q1C%Z#Hbj+nB-7qmGkW^yCMK+BFK{sC
zZ6=DdCtwRubc?&r(Qx=CT;+0MVdMM833p3nm@<Pfx*aUsqv5Qw8^?s8qNL8n2+t7;
zV)U7lJBqfPNZ3Srog2?Mq?W$$dR!)Z`|UJnOM@CR_Sc6*WvZO{91NDmd)WRnukVAK
z?4^XZhdPUsGBJnT6Vd^n{dSD11Ky!UpMvKQ$|m$PrRDQ4QA$GUt5%v%(w-g-Y0erh
zd<IDtuAds`w6Ou2r}Q-W&xgza3zY<VQzmCeyWYnRH<^k3Xk{!<_tJB{r+-87R<5sv
zZfIg5WMk{%mgVuKTcYx)8_%%oP1I(k4Lvw+Tu~B~9hTl>$b|pqX^&RCqxN`$su`h;
zhbka5d;{Z~kx%nIAF(?8)x$nl*yTwPU<njve5w&hP0_xwkj8#QoKxkcRrb}i$3$$C
zT!&jHHR88V{vyTcA>CQz`(i=Y5$j9~2|*N-J0(3_lHe~97!tUiL<JOfJX!>0<Fx*r
zVvW3pk`5fvouh6JN$8?%VrS}YHdZ+7iu<6NuDn|L;Q<z3{jWl-5w6tB502(y>M8J5
zHihLd9`xgM=eA+77hyrc*|Warl|;!}XOz#WSt;b$HwS;!5-8*GQ{vqOs}5rVgNaoF
zfS5F0k!8R>1b{}irrSN6Ngnusjd$$AS#^!M$ukC0wQ!7SP~#!mKuR8nvto}6@`LEt
zI+|1YODH?$kjO7U)-~3+dWN&E47qizqt~l)=%H~L)>*t#uVNJ{+qTI5AxId0QdYnH
z%pG~Xm@zFjQT@_qBh4j$r?ere85l@ofGwoNyaC8%nINj#lL!Q+tZL@fUu)>QG3`}N
z>QklyC2no7^___4gP9En&8eJqtDmHzHKn2vBLGyy4gNP&WaovdlJ@V2m{KS&Rg<lp
zC=%HCJ_^d!{3^`#?Q;T13uwTK*qARc8($bjZ}dIiNYsm+*79C|^&Hmm@Yfm?s+F7o
zUj|$q9)1X~gN{$ib8i-r%`PJm=2z|d4sAC|vrUnv{hwv}67h$ZndG-F-9Tfv_+l~v
zo(IZ!zfK{@CM?Czf)b>W2^esEu^aL<k&Wd}MLV9?IO`%8X0yuR-{ChAW5t(@A<i60
zL*(zXS^;(y!>KB4X(LZy28Ql_QQoum_+t9|WM)pY?YFT(3Nx=nQjQ4k5d%9PXoYJt
zFzkkWoJi)~XCb-!0yfozUN^1y%+8!QZ9|(29(12hlth}+z=zE)EKbY0VPEqLrI&-q
zpfQt&#@;<!DT1m>-bEt)@8T@v#MX1PB>)S_6sk~!|6p6fO)=|Ra?<Ap{y&{PUantT
zhArs?VSf7(Bur#js?Kgpzj0Pr<1&Y+x?214wbiTS^6Rrc)*luGaXPqhsy2l9($%>1
zi$WngT9UtF0hQazbVeOh)&K?Aa{BJ`6Z-+Nz!5s20g|&LUn2I*wpCVa98GLIpWRB}
zV@gGu8aHSq2n|TK0qSfV*Zu3PzK2PZDuh7dmFh?QRqotSe6?*G4XbiD4JTlTjS>yq
zg-LY=_+eFk*sbkH$71i3=n>4e%kmTD-hqJWqi16SMy}W%#ooh~WDS8GwN+f`42txD
z)`fzA)*<1Q$ulTtfU(x+)@{z)V}(mk%xQ1$`Id9+g}4F->L$ZTN7XB~@DE$Di|a1o
zuv@{YrlTI&{+Fb+(Pj-(9CshUBm^A4P^(@kF}yN_KWa#p+Y%<QF}zi|-aC?i&jnoZ
zS?S9BYR72-c=ICdsh@;)w9n_V0*eQVpXnD0UheZ|uoJwTA=-mw?$W=)M;Q?OMcPjW
zv@x{4h{m$Y{GpNrVni^lO<YXUoeqH}_NPi|)`5^u%G$3%pzkWB=9z=On(-TaZAf1#
z=()_%FI?6R?-8rVZ-z+wLTc6x_`bYACZX0eD0rIsE7qr2ysjUHtoz?BO=`q~26LqG
zK_9+AtxiEZ<?64Ontws~BnV81=~ey|RJa2L6?vv8m%soTqO9=5YhVv{uO!>7&g>%;
zG{|0l$+nCK^s|#H>)8D;e6Zd6=Q6_SW0iT_M10LXVZ9)mm0?kJ_d%hjg}=hshs=nV
zj<c+(fYI)|7-&<u)V5p<f24^IL3wu)ij|0ME49LN<Faty*n?y!S{lmU1_$99Z?Wzd
z0$^5pTGJ4i=43AbPwU-Wx-)SOd=`2`1**Pd$&X|f{3Zl3F)=HH4w`Y+gHl`?S7>H9
zx8D>f<pESwpt`=B$v~L7<Xd$uE@Te`5wieKKZo((yPaJ`B#@OHt#Z)GCvxV=(s{j|
zA#@~x1~u*p0vfnEU>&PG{iQR8L8eRZVvn_Wd%mblWmQS|GW0HScMJH&@&Rv~awV|2
z!JPh~wY8JUcRTOBH#58P6KBI&r*q$AaPOd6__#@0R}aiL*g~UQh2`1q^hqa?@?rRw
z+6e-_37_2ZL*>7HEQ9~{v4G2_JDcRG13Z!13pH_MN$09I2TxLjP3+TO_N@sl+_<=}
zj<E1v4!BAjB&6<~L)+*{Cl?PVMPLDwC5k&=<8Ongff+^Hu=gYU=G5$qNuwqrF%c=D
zli4y~t<yVS9TYk8&7ir(hr(+u?mO(MO%n@g@sO@LbJLH8LxCm(@9u~%H=^a@xk1&g
zeawzasMAm|<wKlxG7fEpA+SL7)zy{x0G~!d^7DMTjGZeK6;E?`vf0K+IH={t_gY9v
z_4czFhcsUG<%~LqjNI>omws^<2e)UL!L;si`}Nmgxs2lpM)Ox?i%!nBku{?vEtdgt
z4jf5jLx-}|UJoGAcyBa@q=avap`$lsr?RvjDRW+c6zj7-871c}mmOvq8Yiel#;&Un
zPRfy0x=*{EJkD5#%{}33w&3`l>U{;#qpLt^Uey?TSt8m@3+aDMJdnfmhxKy(cEAj1
zkLI0aRUOVl@prq=SBO=TDK9ofy=-7kH8aC!J~YK0J2;m)OD_J$#Z!CyQAhf37taWc
z084C}0B@as1}cg7I9M+s8WzFX!@kF{@+_o>Ske>7@!%w!w6OlZ3zWA4?>rS$X+s&8
z{HHh7SdpAq+=EY8PmnSiGKYGyffewJQ`dPoI7)`!nfxwP?itb{eg+lQ2|X7FV&!J$
zanVxLZj4WEWJG+O8Qhh|2eXk&;tjmg9e4z{q2`Vj=q4_GWz}I49*jQ_VPF;n9VKlx
z7?Ev*tjPOY?voAg*g1YT=EOYw6e}N^O9m;dI(Q1|E2XzQ+~K7;U3{~txD!<%Ihdx5
zlMrI84gtfPe^&O9j+CAOnB55L5=u*CB}(rcgB&(58?Nvh$5KUx=a~KIdo_O0(~R>K
zK4mk@Fyj_$sL#IG0Ttg*2w&^sdUEBxZ@aoB4%mX+Q!GOt!o8cu?(!Bu9Q$Laz3UX2
zQXCop{CahO7?xFOiEdfn2Iq5VH>0<sO#-^l!Xcd)-MY@#a%Owhp_o;>G5)gGIb<Bg
z_H_q&<9Xtu%(dHMxNnKizo|ra{VHAGiF1vrT+d1|2bpUi6lxlYQxr^aHE|ON1r(zx
zDeb!OvTjHA{|YSIO1=9oWXw-Yy=s3KS9ZJWyS=)Aw*S+2n}oU-q=IXDmypK6%p!gE
zPYJ*l<lfhr+TpJt*#fv6c|y(x225^e#a_48Qpi49C>+y!$2UXUcg@+L+h>q$J@m<c
zJGbr_p4-s1W{~)#p<twUBD2VETjt}#@VPK#hvzhTGDxzAt3jmK;oDz8(Jf{Yu&L&p
z#Ae(`$(L)gHVuKVhZA(H<)R@7!P_M)NM@qGd#H8Y8mW*b&N>gyI;ej0@f9$vN~fm)
z2fsPss%0rpy#nfZHpAFTGcyn;1t&`Z_{U0R#mtRrfX<E~Xi-{cTCqg+3Lvq{uj@69
z5rC&ZL*MgA+8s~<0IzJ(#e>^tVL``6ZH?|BK^r3bwK@I2=@0}QFJA8i;bYOd(ue-c
z1VAg}N=xCa*ZI6TkTl4<O8|71p@q0A39ZFRDFU-G=-UMbYSx%DwOuEn<9f2$do{%q
zx&Z_FzoDnWA6~1fqj8kL)tAk0xghgHC!<J<9J@|M$Ol*1+O4sI;apmT*g;BkIOviC
zDRnKL?bPIS0dDj{lx;nUNFd4p=%(F-mfKib*QFS#j#Pdx#->vaDtUKa_9P7-ZFl7b
zIV7FSf;_ONTAH@q+){UZ#>v^}q(zjR#ztSiIL?#2=Q6vvpDpigm-l4xB>&-7ES49!
zT3rY}O3jqf8+}#;n%Ma+{L^_z2Y!B4B<R^HM-sAoda;0o*5_5P*V!0d&ZNz^^oa%k
zpzzIFqGpDjUwS@PSM6rmW}^-*a7O)?U=7YF@LDdT`SGe8g<H7_!mQ;+u|h<cyfgbS
z+S3+PAGmXs$l1552w*|z;LsN%iK~H{IXMvgg&Tb8R7_;p`e1?E?Tmj%?*s%w()ehd
z;{CKA#fC0{iog;O#Foh?XAVyRrz_5+mKD15VP$XUAYz|uew#e}qsLzG+KYlj2gr3I
zJNUu}qL6A`ktJI8*kT42uU}Cay*>nex#A`ub;O2c^yq<4kg$A&hmrq_)E0mHII0O&
zOn<K@+(evYNklTqf`q=I_wTJ`vKe$keyQbLeKq3@;QC7MQt|{U$DQ%R{uk$X<f<w&
z^_Cfh-xGs`x9HM!vP&lYZiP7PU<$5TEJwWeM4fX6lmlm$Mquml?spEEh3}qr7l(92
zWS8DNrS^RSn29IRvoOB`z-b|2+2JWaNeVBnhBzIZ3unAvO+C}RIPI=<cl<iKR{!X;
z|24_xz2A9!4271MBrc5S|ILD9Vh8LCoza>kAMT<I&gQHDYY%bTaTm{}Ju$~6PO;E-
zq$szzER@)5OXR6#N9ck7W%Mp@D7e;(H~Q1YYz<zz%ud<D)25r>bcv(!HJl|AD<uNd
z`O$k^QbgS@N1X7RHA`#%D7%|33>hm1lyl8ta$5z;wbnaNR&&(ZB`;9oF}PH6CLK)L
z7A}eMQW?npkLZ4Qx%hIIi*CIyY~#DsEI?JaJY+8FcT<ZYv3lEMIG7k3EPE6lVKn&l
z5N3EI-z^_*4^$z)OTw6cVhSXiL~9s0V`bbhXO~>NA=SVRmCIK5o9DjdgXLSv$5iTF
zzp<ty1VW1-hv@eqyfaKF-J*f*k2ZO*__(ly4Z3iXuz?c3<14dRp^0C|VYCTEAVB{7
zY?KvNE1i}-4ZmxxWY$)VuJu)V&V|B!SC7R(-!D#lXIAax@z=*5t<+$CF#is7&-*Q_
z%5<JKNvj@f7d#lpZl&v%ydnpUP$eP+9i8RQ{4J@FLlub=)yfJ}jsqN<0e$yF>UfU0
z>IM4~fA&Y`UGntDq5|#5l`G>y(6bahF65lU(1^(5rBeMtGi*{$w}8L#WK`aK(d#^3
z4RAGw2kp>ZPxWkmlIJY{GSU0TCndD;IW|sBiwhJt2V|Y>?cB4uHdeoN;N^TD0;jqp
zSj}s^sp61jj+V12?;^DqK<w|svaf&X*yPo;h#}2b)ZC8NJ^<)bhqMad>F=N?$ZJc!
zXlC`M%;%QP3UE+hb10>3LQ>kq|Be8*-9-RL5U5bq_k=yh3*3E9OMY`f0n6AK$j-#c
zgd^nweEf&Updp0~nxD+IZxc&XuREWgBvM(+uU%LjFkbH|>FJGt269Qf&49J`pmD?d
zY6CK6RxDs$i)sb09>|S}(dR<aAMkrGxOlUBX@$BxhafhGhM$`CXOXQp!SpV?7BI-*
zWR!HVH?ub9(8>cWXZcS|>8Vjdzj5ney2RdFA<82u7GD#_H_{B+Ze*yMqMY3}oE-<<
zAfLWkeA^xQDk*kM+Fu-AS2Oe8L3pWyPNnM;yk*W7=k}@>^6ILoVgF^r@nc6jPxu_&
z@Jh7U)1j{HV~Vl-UWc3Smecmax2a@5(#};Af~(Um^{%?e2%BAwKo^rF2^(MH)@H36
zNW5$_=F>z?^IQqR+qGlHsUc@#zo$B0-ekAN^n8A%WhKP#<g4zms}1w%vO$VZLVb#f
z`>v1uXQCSHL_$F5Avs}R->P&#mNgjkJ?+3whh=<<zoG4)=nzhhKjgSCA3y76<9?H?
z_+`qxvGpo5`d^l@W3oR*)==x4m)=+YrPn4v6-7*<=1X)dpaJ0#Bo^(W1LJj;TuviO
zR#~>-IImx_{!fgG%c)vi^g9#MgLXqEZ{n&ju&D)aFkW1}&JqeIStvWx^fW_cRNtFC
zE3o7Xqrdu-<v*pN56?h2ZNB$dpUQ|zcN7gE{Y@Qb%d~YyeJC<IOv{BGZsg;o-Fz|Q
z5_4mtI*xzg;d@2Yia*IQSN<JNEElw`Bmq8`rt;Y(ryl1%f*#>}uV*boJ@dXPH6W$e
z4#_+-o65tGA!S^&c*?YH8c|vq%CdG0+PnAihN<!A+8t!JX=f9UD!h~TlRng``oi!W
zvHsm*T_f{9cUTv*Ughd)_KWm`^y@<e(kU`+ZmI)l-ISzM7LO7p6?2Ks4-|>dIH>aR
zk2&}Ez@B9N8Lq8w0Tpy5Ph>;CDiGml2JNnDavecR9AzVQ5Z^yHBZ`A4(w||J=~yL2
zO~v}$R=*QHbv*CwIyRyv@F}5w4{xcrwd6=D1A1I^gDxv#bnXV8bKLweUj`F-yC=oZ
zhg_cCG3C9VHAu9kKl0tgia?ni3-G-a3K?r|<+A&)eWSq}9{$0QP~;IhTRPN>%e{0>
zZ~*J8ZUYQ=^@}Kt$%H4Qa%?z#oscQai<juG+M+_Qj^GrmnNFil)uBMHOP?Ao_EGCU
z=?Zy!I3^f)OZKuYC{{b1D$~wy>%V_9(T~dHBlf&WBr6?$ZWP?d?M!~Fc2zKpVWiz?
z6<HF&2tx^${7?2Wnz<K!>78giv{TQyRqxA$CJDTVzPI<{<X?^0b8P4je+kzwzYwKt
zw>dEw=KQ(~nR#G$HKytb8?c9)xbFK_J&CyS&&~frq%l)<jmk-6N6{IatQaQ{R?BWk
z>=+TEykp(ZRxE^~g)fYiRZqwZgm9mQfhpGeLey6;c}6DN@c?a8Jeb-(#Cbkcnn!Sb
zFin1^q=xooD3EO8Xxh;`80}5>LAce8d5mPcl~dgS{xKF4tME1uV8@v8IB4RVr|<NC
zR^HcGmnyccru)qR^<ba;cHDdd*su<uh+{H}jQ1U)8NK1}(!H<DxA*qq!`F3=CdQv`
z-U0B=M3mCHbxNHob!O)?GUzMu-NMGb>e-j$p^ddsvC81&D3N`^pQGFUmp~dMNguGP
zoAvjn@P((lty65T21%_0v>vw=rtqJDv;n&b3eJE=++R)J?596P+yXj^qy1dpq0x<X
zG^*&|Jh&i0ro2KfYphZA6n$4;zQ#Rxp}u0bv$&siP3I~&Qrk`WeN*hfQ}#uo*b#7*
z1n(ev&j;K>uaL_a^HeQIPM>H2lELWriH4F;cmih_SPHUUs64h^Jdj<M?p&%%Zmn~1
z+gpsYnH$^E1+@-I=VoB^zr3xQ9GjTb1+6^$UQ30u4n41T+H?q}l`_llA%r{^<2?0r
zM0#zO=rqcuhx?2N{W@55Aamb{8c94S1?j)&q4xQ(O5~k!db;9@Cx0S#D|kyqW~(F0
zf}<?DZ;O!5GC!U>Ma^_gCxsFdhzy5IZX(NSnu4l5;mqTclgd6VaN7Ev{SzF*>c+Yg
zNQcOFhWENl?taxT?bzxW`#0Jyd(-1X;U`^Dw^N~dT%LQmjDRiIecwa$YHH<V&jIvl
z_rQD7xw6M&@#&D7PqXtfnfdnkrq*oUq)Xe4Gz6jc34b;bKQPiPBUQHGi0pZ1`M@uo
z(O~4Y*Ky-tGdLhX^5mv55vJQCm;$_D@?EelFNj%sV&p5+n}0drKw@|7qC^tx5l)8z
zrUI*6%L9xgd0ak!{9w8Nsr$S_Z={*IBEmSlFDqM)cW$B-ix+2jo9u6+i6P3}yDmN~
zVZ)4D`$3!JYp2Ceh$p{)UAK=ko%m3j`!IZu$qJ7ZK_;ZB+URci@6PksMCL+iF&OBC
z`@S>>g|BTOSMX~9=#@=0$`hb5zc57C+@yUD8^RAl3mXfOfBOE4cZGA=j^6rhZ43Y2
z_c2<uuw<@g;g~zeenFG726NPRhH2<97a_+&K{ku|Ki;=_{6Jt0e2xz{ayv?|xBXdc
zAN6}mUU(~B`V<p%HC7g#@wAKu=Iu7Z<#o9nbkZM=&RRs{1x(W0FXol|MI)ZKhGguS
zJsCq+m0Q9@n{ntl=Pg+2)R{Tnn}~=kORnb^PN(D1xb{)Pg*9d=o@I|V9=m8>5V#Pl
zTj6mju-szbzNG)oGk%F`FkRbw_->(W4e;~pMi@3*8k6=1UseF_xzbB6XnwS3j&rj@
zlU~T|{f5Yf@Q0^`DOr}@Fz*K~($uyEfMt#k<H183rf(5-kKW&E{YH5r-cxwznZxc6
z?!hXAJ$mTUcMf6o9lJ}!t9*-~lxF{2&-2mcwrj069cQYtZwg2b)&u^2^ruR132O@9
z@Oq@H+qHH`k(_dLX>?`EiZbK$XHoyXFLE%w{I348m4?gzOomQ|l@24xE)geeKQ$RZ
z8zGE#ZTDI0T6)$12ydu{TTi)Z&6P(l8X7Ln{DY;!uU22Ua4ZQTKP6NFqh&I!8CHF$
z`;v(WoAZ%-SAIP3f3pwXIp%t!hO9VJwF-a+II38YeyHP!v^}9PCx&14%E~v6q`QW!
zyM!l-yuT6Z&0RJXa`PKMmgn<V;5QZfzUX-LyPo>aZH>cBqyu*jHOISvYopuNV;)r&
z(y!rq3x5J@Ma8Ah!d6u)4Vqc8h8=)R!Dx98Et`vtEQJa?3<899%;VKM(ONfQT^c`T
z4lDXNa}K=E8yv6qYRpKR!}VtGQa@wdJ=Bs!_RhbWfNboVk?U;xH83%ix`ANnyR4)o
z4<N}}T=&>HK*OO}?OEp?{BKWp_XKQ!1vY>U@O_N)f)sKD7xVF7BNNx;f2nENpgES%
z1Am44UrIL`q(@I^=m^zCul<bYKoT9e->$|EF&j}e*`d$47sCq9bH8<l4*6foZh++k
z=Hk3tS;kuqnnXr=*#<r)$N(h+%H9Zz`jsf3SCF&0m9&%6w3^rrfH(4&n9uV%+vVFV
z1W_v(wOu7D3%=o0Ng5XOQxg0A@*wRRXq#jwg&ZF$zYqV?;Lbeyg@vXIvO&A|DY3>t
z|HA2SV=hU-NwTs}#KN~W_hV`#yJl@jl*n(YPr6p8YFkr`W1y5GoF4<y3qDtH#gkcN
zc=MBIf%uT!mCA+sk+KW%nkgpl!5~PC@icH(ZPxGD<nyWP#7kxHMt>i?W*G1~!PaUd
z^N};yxR6I<&WJ=@mX&7f*jxvHeeH77g2<oU41*$@<CGRL;O{wG?5+~cmpgYs((JmG
zNzFI$&+~30`Dc9bE>{u%%t0ej_cNh|x{p{T=3@nKg6H(~*$-P;nHQx<<ezc~X45?B
z93=ed80hqZQ4K{YE{V6-5AfEZa<%*2OCvI2XX?`Odi1{NOU(1yg8=nl`jA&Z88=1r
zNrEa?m7>9Dv!%j^wy54qBAjP5yzgBFH$&*yOR|+0o+SsP3f}+Ia#M~D)LuFeFw4+9
z_T$dJ9a+faTcv-?-5FTvXMIoYt~$bmI_w=&m&sh1>umv_$lLGr%dS-Xnq9i%ikS>7
zmANYpO~eM?d;S7zJ9$T*zHE4v0?ddG8~g|~=~gT0&KN4X>*%zKW3Ko3Or@B&(Kj-S
zKdD?t-H#fR=3Fj2gFiUVp}ye>C6fM@A)C{PmhG`YUr%LC@X6FcXm`f-y*so`-bdA0
z;iL`L^HoBdz9mrkq>j#c^nWn-o>5J9UDv2em!^OOrCC9wgeIK;A|TR5dI?pEA|Snn
zCRITNrAe1A9i%68kdE{Yp@$kEKmtk5<$XWz^N#PFKj-{AV~@dLgddDtd+&9vHRoJ&
zRqpt@!kQ(&cl+C4b!xUeVc#fKq1e1AW*((JqHw!!0zNSlgpGjghWpJ&u0G|2;BOfJ
z0UK+`>8DPsf&#^G$TJZz?Z};tfytYXUNB<E@jG#DbW^ky7I14*yJ~xLrk6Xn0lQ2?
zA@zI-p!*36x;f4)e<s$i3!ssIu+`I5203P)y+q8~Khh@tXE34VOp={cpS3k(e!yB2
zZ~#B1Sd^>-BB%0W*Co|E*)OGTokoK$?gN9nhe1YyyR8D+h21SNkA{WvhCFs2$JE>Z
z6CmSf3rpruAQl~}|5!s|i95|ynfxkd8_@mv^SyxAUlN=6Dk(mZ-j#@cQ+ZW5=r$eA
zhZe!Ru{0~fAv<b<I}G{?F0F{Wlov{3I!|xj|5@2z{*dKa(6w*(ZJ_20zO~|rqCG7y
zy)+aGH5!0hIDNtGb2^JCS~MRYpC9)?8CvDA>+kX~Ym{A!NS&!ib-8nL+AU%Fk0LJn
zM`(6Dg0=1Ex91C0EDyU?7vj_2QMEC;ZR%KeT>tPyJTr=9;hRKCL+}I0g=OesE9r_w
zM+}ok!R33XnPO$Jscut2b1A9MPYl9WTfU#QSukl|&-_SN3}-a!89!20Hf*?jN<GjM
znrrmT6dSil#nSwRVd#y^T?l%yKmNLS^?OEfuI){jkTA28lJr!Pu$(f&Ca`=WZ?PEF
zbQD|_mB)6B<=GG7AK=(|n+;d$FWg_!@X}{fcwwJ5Dg(`XnGVj;tzOxrUY|8H=8VOk
zpQf6PVBW6#ilapaB@{i8GOpTo$5!sm@mQe8!O2|kdmwHLwJwgRuNS0oe3+@ef42<r
zEEAzoWjDl;i=Zj5t7BQ>iw-~0g9-*7gmM<B3DkG&yn^LR&lkFW_V3}rD}}~@;fCxG
zf5Wuf)V^<F=d;DTv$YY1leup`5UK=%ZF3|^{w`VJmY6DQ!2GAt`rG}yt;;j8mS6S(
zIdDhMP!nCX^XSBys-B?;$RU--?qkeQE^$W|_B;)}k}q9?{e{2<Db98%1`;5sS8|@u
z^;W@2aw~NC#b&rkhY9`hkAA0xyru9#AESISuiu&raoAi61F4DEtrzbXaizX}8BOhH
zu2rdNdFki<`TD2kPSoodd|%&CKuiPbxzS6$3~0a~>+$!Xz*^%ZJg=7jhn=fL#yo*F
zdg}FErJa)}`w<u2=Y<h+$HB^aZ(1)B;fEfWSTFeE!Muhin&=z{OR!!r-vs;>WM9fI
z!B2mpcHhqsLa=V;C%zu@9-XCrCm`xa%ZE!_L%vbiwiZ$9^#C(5d~VrAV+RJJdt7yj
zyNRjmhP0Kwm6_N*{t1G=;O8{fpY?pJw*f!)xv_8V6Xkyr1GU@KT{9pve~1tmK2Z(0
ze1=R!=$QFAxu!R7VZd}n<EIN+un9Gdv_066-vr<)6<`w@p2uhNeFFHpbVqKlMw&S0
zj3ESn8uzQ&GbzK*u2)Ts2;R~><0gC6_Dn`FP(e$u%>tN>$f6xReR*K~D5T>LQvTq5
zyo8MzM{$(s%h)LXJ?YWPE-<MJgB024t>N1|j?x9~p&u$}J`IzLZXiTIgl3lo%NlZs
zEH=`qXp^!ldPh+k3vx}2$?>BJ5h4H!fZ8Vg62%mHKo^vxc*C7$IX57Swu?02a)u`p
zt>O~hOeU+&qwm`<?&a9CwZbkmJ00g*o8@H~(OLc^T`Tm0dj1u4_c<D;CmzeNwNh=8
zi=ur9qkM%083D&4;nPB|VM6%_tj_$Nv27pkp!KvMn)7J=&cud*<_-Mp7vH1BUERZW
zz0iOcpnk*#wsCxdEbVb_;MRjl@?Gc8)lK_5Nc`YOins!9ctiR<s;lZcXWhh{vp+3^
zC5JMPYgN<pI|}ML>5d>1Bx;$Rl9zu(KoPY`p-G+oBTSZJ(FZcq643RzgTAQc;p~a$
zp$nFQH9L#Iw1n?uM?P@Ap~N+8W!JKX5d5PQbbV2-uKkA_(V8|x&&N%)syO*T@#^<;
z_Dw2f^zXRId<vJwnCZ*?<CBjQY9y8xYo)6<%R6->xn@rA>u84+&=m<PS=#J-A!cLB
zW2;31HxF1Ba!O{6MuXGP@;lx;;axJjRI*pY+1joPBA-P|IJQJK?CFVkX2#)uc%QRu
zrk7AfIrKAvHXo)bXXRKJUhx{fIv@FB*)-zTO(ko=%ZA3BHW!6+bR8ns7jbnduWGJ7
zoqDkN_vwd?Gq(>nh$ik*(mnmOO$N!2Y>%0df$H0=+Gl{RIZ8O}f4u+uWauTK-$4Ct
z%(neEd;YsvL`l^7oR2~NP6~`FqjX0-Zi*aFypIQPj@Wm8s{7>J8AhucibR)mzSR;h
zt;R{&z~^Z^F>||G0Bi9peHeYhE<FZ@90wk*{c_U7_yWEma{K`&YS3ajPSY>*RpNyp
zS)$jN>RRmSOvNv<qm+$5eF6p>@Dr`$tUuHp1_sd}WNib6f2=C~WIIm=qXj4xf<q~6
zyK$4ZnrFJ*%#Rx#Pto0lQz2MeEW>(L#%Z+U2yS~w)`UygeTWxQ#sC8|A}|}L&=a;A
zYZd&1c0jY|yK%9B*c^W!5@f1(heA;x32JQoV)48+7eyi0^fKUF8dMC}xZJfy^@}(c
z2OhyLqMd%B&!j;CTFqPhFb9+(^{#{6z!FTgh0+HG9Lx;-m&t-=@g4DiZF+OR*!<kv
z7)fHa9lYb3pC&{Vzi>oMl-#?=Dk^GwXJyvaH^OI2F?B7bUCH1J!A3Sniau{JA!g5O
zK-%KK;&qO+t!_{4*1qZffPY1(VsQ3An8BX?9TBjYS#D)?21A~Gcz(Ol?XtJWhH+Mg
zS;dhq{!fM0o_Og*oFz#tXD|)>L&zJ-SZ~Lgpmjz0fk+Xpy}wc|##S#t-g$Y${koF!
z_jj8N?9$c@=GhmXw11Ep{Nas1D14c!*;|7tQ@mw}_jb56kwNsnTuBV{;Usi-=&0R6
zPsKjiU!9yF2^(W2hAn=lygnnCJv6!hXD9Qe+xd#5yU4fL<xerKbl~8QUg?jk9r58E
zvt&_2bDSL)p5zbF6u#l;x_c@WEAc1shj%p#4q~^<-H4aX&b9XC_p3$UWtPPqx~n_V
z>DZmdy6@g|nTh>OM;(gxK^yL{zVjasaM92&DEkdUJM(QYy{fk`ubqM6rkzj-S(nr=
z-OEu!3nVIIx(nXTQq@1=7m4uzupI!F(Fsf|DW9yiFsHu>JNN4h!G>0n;8$$8aanSF
zNsASFo=J&dP7q=y*G~sAH1eyxNe-%fOu#Z_FAp5quIveBZ1f%aCqqtwDO>l3?<;Tg
zeV5J}?$KZTG<9T2zzci5Oi&zRs?QMX*{zXDq%7&S1kK~5)H+mt4~zQxI4;#wNqwk!
zx%zOy)Uq?s`x{OG#aA&x$9)kWvV=b%&8d4fw?xyVDI{Hh1$L&~t6?n8W90`o|H}P>
z4vTXnc$ePHDkbZtYmw(z*Z+6{_z<*?rOOsN?COzv6rGm&*enVKHu;-COs16xW8oV%
zyEZNQ)a^H|Q5IXmWDJs&ayakGYs$P4QzF;r<s>vh*)gPtN?t1{))E-_oxbHFTq+ft
zcTR$Qo(^t@k@Ia{FOQ7tQ<8=0ck=smm*5B?+uE*+I*mqj+U{vZAy<fDXos_wU%qE4
zpWl*D03-UQkD2Az5`J?3a$m79?HCQp2?s2i-v81*ZI*#@v8n)=ov$kII@wVPPcO~C
z8O6UpM{R<l){OWlGrBSyY$My}h58yu$~fk{FY#6cGOSW*2VO0j6MF5TS7AZu)||EG
z%E`xo@1Is^`D+G_=Nbx@Z0~!o?~cpvdx9c7^ns4hfa26bin)D`SLhO_1HVPY%K+pk
z^k?*2&nn$9MGp6j=o5OvdMKyf`RQ(1bUrp}%d2Ud1f>Qgq>P}GREQxBivfG)TcZ?B
zELV3E-ipA9ikx~GxUr4hyB@#z{2@xr@?O|5=Kj}Mt-y6^6ba`AcMeLxOHvn)D}!j7
zxhyN8;t0oO>eFD^!&a06eO;~O`q1nGS{zkO#L+4ePMjgC^UEjssVmLmd%AXgSN!qy
zfE+O=a6=q6&UTdV(AtFW4C-{EMm;X`zI>N)%B!`B@TJ90?i4n@fjBEer4+X}US8Pq
ztku^#FX7gjqPx*_R3`U>Fhs-_72=W`7nJ5tj!mTAa1vKHc%>0%krag#atCnDX00Cr
zNphziup)uxV-@8Kdh>I?SFT}Y+e@vAsCuyfSDs(9IdMOot&NQll;<OBm2O!yM%|op
z_3bh_b1!jymgNrKAHKyX+!LUaII2kSllTggeQ(^(NY0g%l%b*QzddrPgb?+S1BEWX
zX~ITn%2DjUZ15HFidUrA!F6#9uE5>!u;2=_hH)(Y+Ay=Hj&synyCHdx7s($^cBTN@
zojjRWZx5u{6oh~id?W1R-A$G@HCPx2sdacjC?su3KH7IIgv#;tw`A4=jrXy*Byn{1
zrL|$9Ft4JpJKw{F#0B>=AGBb)Z}ybniev`9Cc7-t^%lFTT(##!+CQ-ozso>RLSG$<
ztot2G`ldHa&2+NPKJ)4K;|$QMt>1G&P1pk=y-zIJ^5#TUotpNG%h)eX!&>Jtk~P&=
zhTdrJuM=457qj+Y8)R;AZ%yhi8XjZD#K)miwc8CG`GC_;vE9CYx6|abE=mZD(B}s&
zzV_<hU69Nt942?CRu-R>7D8d|f)Fbk1?C+Dda|RuuEI^Isl92jjZULGe?E&W4tU=I
zZvHfe$KLkTNB&0X;L(k5_?QnVgGaVf)O*}Ri9F+?lk2Y>eTy96>d;HO+b1uX-;kNE
z>*~;WUeD-7q(3PkP?01`3&4I)jf(RxpfV1I*+`O7UydMyJdA!GK7}7pe}4%%|H6El
zc0t~}l^rDCn)#%*JjT~RSoh=2+eBJJj8<V8uI%A!3-Pt7?B-0n5Fr&n$JqDTq2nHk
zZ$Otrb49y@31tzy7t+IJ3F^Ertm=AebZK3eDX(6P610~|({R1y>LAqab}g#-T|yZN
zk}fZFCGI%YP_mMhfvUX2kgXb&PgPgy>O)Wgljfz(Y;;G1zqt^@gH;<MrH2wn2;F1;
zMoUjw-og36N%@mD|F_(OPgKs6xqsiG5mAOpW!TzD@~|lLc_)oYh##AqTj%;**h^fa
zhUzThPEH?94<nD&z>V2Oh+`Fl!XpH_Bs#EXXi>!zE|;4vceWf?yj{lY*)jRvgqgXh
zv(=<lpdemTMu9mlqd-&ICvK+syzcoRqz>8pdQ1g^D=galA<JE)0@=BIW0$jO+nJ!i
z&klJLEj~0*%q_e88KRaz__ZTNh*&FKNznm6J(Yu=&yeX|$H@6?RE^E=`EC@Ma{6Ol
zFKRoV_aO><-@4736xv;!l<B#n6h=dQnwOS4!G56)gmBi6MRpK8kE5-vQ8Rh~=CC;&
zf^`l!Z$u5iF6eY&wT<{6xW5&PB;g0&4l#)DU^0UnvOI#?lUoVY$#!VHsI~Dr6(^3&
zel(rk!v-+-6VI`rqFMr$=)7}aH#=B@ny9Tyo~d!m$04AP;7gxySF|&9hrIXtiqnWA
z(_tq9`x-KZ)a%6Kp~c)mIpVDH0Ixaj4I0)R)>~W(S8m?<3bXIs$BlaFYxyE!VnCI`
z{XyNR{E@US>gZkkMP+O0%5iLDW&6de=Juv^^N|eSD{c9YRcds@*g)>VWX@*vvJYp-
zT}Rs-+n$|WY&cwGviYiisE^|eBiXf3zZ{|wc^8$%|DiB~|1Mo$zu*i!*IMr!`7qJ|
zqJh06adgp1bIpM9xxcb0N`oUy?LOc}Dh>$TNd6G$o?io^h`*Wj2T5joXGQ}x88{1C
zhfbE#^BBRuJX&y1pxnTehwfM~$oHkZmx4{`l#-61<wJQtIp4#;R@fcn$Y2yNUEc6u
z8YLk%)Wg4HIqM9%|D%)6SjjYDl9#&Ids2u4_G9dHW__Xj4aFwQAGawX+6K7wkB<Ey
z#nGwDeHT_-L0syV`+xj~Ay=cV8-^;ZC*YytDd084(!3k0At1*)Gd58PRYt(9j5{>W
zOMbAsm^SwqvBewg{tY5Ii&6^n{#wiJy2Jx=4{S|5@A|$=3_t2IF(6U3-wRe<6nI*K
z`QCMHdZt;o&;VkoH~4wL@f;~2qEczJ?%DsYSDxtDNSKDuVy_HONFNIw1xjo69NDgl
z{ZqTt)ZAMKJz6|Kfkyag#0I)s6E^x{0Rfg(-Ns-ReAX3A(uu$0B&+LAt0lpdrj=Z1
z?a*tz$L$cwlbM_%*eb6c5OUUUWVLIuFetvbIXKrCwZ{^GO72ZFBzar|0J`NdXD<mK
z@7Q$a3}AQZb~D%GVH)VyvfC$7lHu(V+|^NPn@mDbw#T7XAQc9-C+v_X-PaaKG367H
zR?jo7DfgMkbz-h=3PirS*7#7EaPQg}*ZaT#@rHCQ<b^flcYfbHP16d~I_{Ghazd9#
zDtQX~1p0bn1OvcG+(y3?B`|UylgqDnve;*t@pV5yFDAq+dYYrsm87+WuM7l5sWv!A
z>3LN-EI<BH7g5KppLV0ce=Lrr|HxLUD=q~qEETyp&*R*32T1fnu;KSNkl%y<cLm;D
z>YT2qvLM)q-<fOiXt{Uz$3`zu$_)I;9FW2LQk2O0X=+oO{Hkm4d$9=LJg*ErP2}ar
zEgw=LE+UnsL1q^un606}LZq{aAd%8&Gq94+d;f5{c0b71xjv@h+iZhVs_%t0$3y|r
zY5&3k-SL18_kM-3lPJLHx9kn7KVR73Kvl$*;*E`s^})W_?XlK?2)4(Fb7@4LCSsuE
zd!-m~_nW>o9+)iZIb-9kE;pH%6Q)#T)tmR|3H=2${7IAalS97CyyJ&iwnumOFdOMk
zT%f6XQ*dA)h8LR2%sdAlKMvWe<TT4N$E3)KooGUA<9tVs0%zGG2<nX%3q*$Y<~<(+
z590ZP8T`9zk&s*G4TD01@8`^J-y19z2uS&!N$qJ#J2?&bYK8Pm+g_j+B4W-VKOv{}
z$R?k?Dnfn(c0e<A*av+Yn7MF}hY(z&_g!ip2g@Q`*X!bT!anm*fBTj=4&Yj4$Jw!F
zjj_DU-fzB<arhn<?v7f{xxIS!X1xDLWJywkm_b)T#(~z=3#yzbiKrnJwmh~53ZT4c
zAb%;hWz>H=oZkjAnrSbBeBnGAuiVAE#Sn`wiV6Bk!6;#=L&x4KuzuI^on9i%*)GX^
z&>(4rXp&;g{3k<@m+w(HoBg)ow-E?3sbb7SuH*9kENe>VE7|1wKt3X^=P%R=f0EJV
zLa#0qXEZD{X%d{{<dQuuYgt|<hx1=k4%@!r{@(khI_1}u%(b`69BB6zR~e1!C-M&(
zVKB1Y%!9kkZBP5EEU6`*A}&|(RYw&+;OLOYv-Qv&QPAz`78moPYGAcSX72UtEc-`x
zT8ZERPAE79Mzo_Z^zy%ucc%CYeV~4K7fLTY|K*)H6th^b6@bakrJ6m3yw;K35b8`!
zL0qKSV*YsDfNE!0e6L*c%>ONdy*D}b-G2+9Tm)(y-o{H#aC1Xh(4Q|yytC&lTlA|z
zJLU}K3+>ms)%GWD(K#vSG2CVp8cMu@kSbt>3?<^jH5D<xk8Ga<2uP81QYi4gPkim$
zn*pA^?`G>}J(y@z>V~Jk^M<Bs*curIebExYD*gtD*QA3jXeweycm_CQZ%rB47rs?&
zyAR|#MfEL6xnf*Yh08%Z8q9UcnlZbaq^m!R+->-#->Vj_hwdaPM^JUKmlS<|zEc`a
zG1l%9eNQ;iK~idNNJ~x%26gqE^tzUUn=~z?^JJgXt_X!b1nSZW3sCD1Qpp)V#*#g%
zP&Zk}8=Jd-GOxOTa_3+j!=^4#CcIP6IIleVEWsj?#m+>O6^h{a3q(D1znfBLj9eDI
zk_;Yw?R>I<6^_T|IKV#ueN-9Tp&b9DBO9axNg|*Ay9DjYy<LBeKo4rjG}xqVx_?eZ
zupY9M_Oip_I^xvp^t%Qst7|7z+&eF3Yn?t8?wRIe5cqk{N3ROhwm1=Zr?G%N%&3By
zHD3}v_80&UO`T>NB$h|%!S$y2BW{Sn*NlhKQ^Y^*oQ5Mj6j0(R^;kE=Xq)o)#gd;~
z!mnX1yXRYGE0~QvujZK5ExY~-!qEc#MGmgt4q?BUK`5*mGl2WTB_YdaW~lE~83G78
zLA%WaxeBr)W5NLJ&=XVQZ1(0QKCv6}1V7*>_a;`6dfnsw?(8UWGJZTR&9lgNj~Z%g
zv**7dGNzk;;qCT@=wK{ZhG04PxzXHKJ~%MM1LNj1>8_?;9}4{adTfF9gjJ7-|Bd(=
zcsS?<3|zuoIoRFzN8k<(;0pzeB%Y-lgz^ksdY=P)VM@yw*%45lAPVU5^W7gV?s1}T
zV~*&X_QOhHXZc5CD#X)#jrzB`IDO7(s(ZT3Y!cqj%wYJBj)8&ZPKon)@xC`xuK+Ce
zMZb)<@F-HfFib^)!$MaOV#_!&6zU?JlHBaO{+^xZMfqWwP#}Z(wio_zdv@!tqvw>o
zNs_Y3nw?&d+zSgPoah>VBs?8iaFc}F_al=8qvJ5+2PC^|h{Volf>tokD+*B+iXvGj
z*PzkP%x5<}U3;?n4vn`y#65c!McAU;&8)MTdT=Qp-*<S^kIi7eQ)Fbn3HOP}KfqGE
zSUYi4HUQJ*te7qx<Rm)UDsc?U`=~UaB<^zV9BeYKk_vr*%f^&x+c3>YljWL%6fbhE
zB{r?r5Nn))Vp(g8t1Y0|oG5x&VT5KEgun=WEmN&Gn!GY8KB{E;v`<r;nIFBxe0sCS
z&uX!Q7pIY;cFT?Rk^|k~>rED<*!25_YnvW+NEald%I^B@ST4550z<HiUpl9%o=I}<
zXP=DCC4Vju3I|ZsAQWZS`Nbi=wwPNcGrju^cd9=&?VJc5*~Y2@GLmXywXW;|H|Rr+
zR$zc?^D;@i$&MV+wQ)>#=pkI5ungwVhn;A3R@rNTc+r08u1{sR2(J%iY6_S)YCX@d
zyvxmnl&2EIS>piaG+@22M?M|wws8P}D6%;%z>vOx&?p(``bn0+%N74*{TGX8RF-jb
z%hFK-LnJ)7>>(;D!b?J;_|G{+o<$AA0;1KiT5aODu2(}(5z(I|Z^V4#GeaL_;OW<_
z+=c35rWY9@^V1blw={uaSb5kElK2|{8q0E5LY~R2pU$H6Efj!aTedV2Ksz+(<se(h
z-cKiN{=MqZ6fMHz_r;i>v)t=R66&zW1S9vDB*uMp>un?@?KRheMydPSGoSNvULx=A
zyB}O~^8G@Y<XygDoqJ6=w4Zh4UY7N<p*7#D>`#$fAs_9?X~kr_kasyK(5W0W?ClGL
zQT>i&O%Qq{Wq!S{ZokF&hO(Q2p2&m(-|iqLX!L0Y`C9i7*ILfq{0GWFJ`2fjq$(@?
zc1c~<og~|r>G-1Cnbjl12ELQopI8EbC>}ot61U*ryplNAKJ+QSBmdupvjP03x`96G
zH13{Qqmwi*3~6^xT!f5JD|fXKAJ}-pChOvGx!utT`)Q`$tx@W&LB+OFhW~jbXFS<P
zVo#gfc@D^*xT^Kt5|q3m1RxxWoEH&CW0*;E==7q;oB$?+6MG~~k>h6IPsc9xbK$5p
zuBhfKZetFHlZ#xeyyU+*qy{6>1MhD$#*0E5r|tg%Z$C`yYDp_KA4nn!3I9`7<n6S|
z!JwEJ#KCR1?}zzLtrvO*&>ZuVUOCaCSm{8Onz|++pV?gu*mv{t*fyDe(tI?}DR`(A
z(91Yx<ki$3W}-p8{&-~{vSI7!k$c8-o)1|=L|?>d^=yYYF!yspntr6?FAQ!4;QGkH
zvKz^a4UKzAxri{dy3uOfP?;ZQ+A)TYKo<b_L!XXwUM$b5kE<STQ*JaZc|CcP#|O9w
zd5G`mZ8WW7l-FNXHeMXrB>E7Kz8Jt&&D=0Gd1wDZ$lac9b1D<HLj29AUHIq3!}d0$
zeoer+evPW9@>t9|=0|~SibgIc8Kq)=W)F*4@}-fz>VZ%TEA=<DisvQx?n3>`miM)7
z{8J7|zjv92%(yeN$zN%BI$A0v_e4a<AghPvS0%>{>+FqEH^?xb#W0vjn<_1&=P6Al
zkdItziy!F=%7AV%Y{h*~{63Ut%&<G0J;NwoZRh&SrYBfCq8!T?w}TWDLj7fLB!akr
z6ecxD=yAu&Jx87h%{Hdchbg_6+Q_V8UjTn$73E}n+M>b~8}!f1lQ{gyLQ=z2e`G3x
zagRZZv|iiQjD2>aK=#U`WEN=7!=}jhf{xA;U%#$c^&Eq4<z-@{oL0ie6enH7K;F}s
z_f}W3^73k^ReGT%(oOD$?0}eMP#PBRyN?)aY;K<iLC?a>P{oxZ=PHD_^VhG9_o+D$
zYV#{}omTD|8K=%_sE;t|dV8};4=ey%AuxqUC=KF~L=LViRAr128ZaN0j0hyWoyMAp
zC%ixqx>(2bCP70Dj30EFWlk1eqk`?&KSK{^^O$S-dXEwSa}2yztyP6Z=FUT_R(F=Z
zFI%@??BtX`W2FZwC1I(vJ4b=KLy1P{4QwSq!b)#C98!mYy?-^fHwg>@^F#srTCDK=
z>pbF{DXefk#IXI<aiA*HV`8O!y!3kg&a&yf96=Y>v9Qg}AhUiC?bN|&l4tUXo7H8D
z3mhM#g+|<J8ycy;Qs6^AKi_n?#txug*8iYiDT9d0IT?;9f9h0SP7!f$Gf?-Y{5Qsc
z4iW%wiHZnddnP!df`5s|2qj&M8w!!^&1$?|N#01Q`So_UF>kQ6;1h1^tM_`vFKO2C
zk~vKdL{X2EM*<Tvs3W(y$kpvBl%|*!Cn@J?b(xW>Mx+1|oJ9V`cO_GeUL2}_Q*{4L
zwAs3WZ7INPZGDq$Snu2X9WqE8uJ)Ju@k#;@E&d-kZTqVrkR1?Sd|=&t+rI{U<VV&t
zINfpt#C>p`ov6bv#*+T>PSe6=nhRBpsx~NK^!P>DB2laI*<t{X{~y)H@m)<sE-+z~
zaU9vk?9uskvH%=_VMQHe;U1j*ml?J_59K7(H4qwDAK|Xk`vsl(TPfvp_^*V-jDd*z
z2+1A4r$g*R5@x%QWl|3;P=A#DwmMd%pqG*%u8q)_FyE5CAsaOn;xn%gmOJG~74gQT
z%^%b4)ym>0o`c;3fA=kD@2V4Jd_H@L_+%v>I+zHSc{J^Z5(^;sWGfXvcQK$&!fZ6{
zU{DR)Cq+)uwMDaYhs>zd#fw<%m6mOD%#*5icBvMCVDf6-*dGJTbZ)daY^=tQxn-bV
z*3=p9%;ZxW7#NJt5>WvtDB?t;opB}#u8P=;8}e!0XRQY&&=$Hu(f%r@mmQ93n^&C2
z-h<5Fc)#^(G%3!<Ps9(nj%GNUAFyM(odfa<A&R(RXIYG@#?Mz3y&~!7hmNlJ81n<f
z5BdzIRV_2YviFN;-)akE1aR<?6`1PsBAlRs*>LuYE0o^Wlq*fgZ4>`O%5i*BxFsOG
z=6_2x7}GcEK-85##4COCNFw9-V5Kf<k(>8erCCu~a`DcC&bDib$_?qgSwALJqGCSd
z+JaNq8#*?hCO^9=rc;KUSXrr;7IL<mq`-#;Ki_0}%5|sNY%I%@=I4yThh)JH9XsT3
zHY<4e^VxaVr!TeU>q0>}!#od#!!_7k)_HkOuQ9UHsaix;%k9$cW|CUQTxWC$<sfrX
zak(ABMb}pmi{yH%=6}{6%zn$z%&+Ml>yCBlCYQZEWeMu+g)?c`qU3S_*3w~*UScIP
zzT%J*!6@ka-~rt7lf<nRM&dM2F;&b-Ir7#BvCSE$IohH-nF=y&(-)25yCjD0bokLn
zXBe;doyigrmDfb^OH_LPBXw9-r>Q!Pv;RI%1`hz(&~to-s+z<r9rg9~p_Z2MC}eSh
zFNR_ihUM$*R>ALxVT$P&UKxVxeKnfT<0-}y;Wa<jZOjOY`@i&L(Hp;#t=*f~+9}3}
zgm<#}@;(OYz#d@;SP@NaKhGObCcqrXS00ZCIiAPChr}>HC~gp-o&zbkkK&WixqXx_
zBhihcrbsg};0AN;&L^KV{=+qEBfheXLU-u?v_iQ5<*8NTwYC29-2|x3*aj_U8~q&_
z$ofAa>-;HzBAO*`^a)HjXai(5Wb)OQv7@1`RPf5+4<5nd^k9(wCPOinDXX5|@yW{%
zQR$82YoaeXj;WO&W#ucl8%`;Gd>}SsIS#iPIlk&zR}ru!rXfL6W|uBUvn1_)S0Bqr
z$g9?ljiQZ^FtpM=mtJEC<6a-m>59C^^8T$nBSjOxtEdOb-`yiegi>|2MuK=y+9b+j
zH3lEwl*iRuG`YLqeP2rRTVd2cS%=a(SDwzDEMp88QkJguXf?|k5Y+hW>;FekgCqii
z8iBupn%`9NGK8jS9DohS%g@|u=t{s=M4RA}*Eg(@;v@=YFFtf=h_2mE$;xl}_KMz9
zTxj&}`k2<TUIS(9?K{<bZa(mz&z=F28tV=ra8ld`_vAXw>VKDd@@4by>_F4rJbTrB
zo^_v&hI<hwoaOv8a|M00jpl-7UPHz+P`)Q}yJPVoF{%0L0S``^IZg8*=tA&IcU0?7
zAV)gi$F``92jjQo-Umi-B0e^p%EF|^F`E8BrFD|MRW<mfbCB3<zH@=rBE;Z^7X$jI
zq_7FHsGSYMH=ki=k#xZ0YQKZf1WGgE-<goIre2rB4Q0F_9(>l4$lG^41%Ac2B32U=
zMEUI}F@DZ-`Gb&+n(`t>t+|pw^fLVmzg0D6xu#<kRFhWV!cGspVj@uDttW%M-y1`!
z-*muGa&xM(2bWL9q*J%w@56|3oCXo}0$Ea9WJ>@mWsVt#$u9QD5E3~H_dMdf<*<DS
z-!fdU0W~24vPwXKI1b&EPuiRV4B!%Xi`9FF#K9Mu7~U%lyZhc<yM-^j&d{?(qncm!
zuCHxu69a>BRfx0Kid$qGal|#^k3E-&(Qz_{QNM-r({T`Q;JJ7P@Y(t3b&)BR2^~?g
ztnSRdvbwHkdr|~%qn&J!*BdeE{%zHwiMX5ld;&mt0rI%qrWgswt`;g_IE6Y(lq)0o
zG3h-TW@PydIi*pne{?Ri@7ww5lKL_wEX?S(L7v&|%qnY1_Oskt8uk}YE^%k+Ub{&n
zuOg`AMB#B=t-h%D5|vX+j%(YL<j51(>rL(wUE<MCcAW4G(+VzKbp3__K3V0$pRI<i
z_WdFykLA0sna|vuu}~id9XP0r2$Jq)(l%VrZL1e}EF9f+{i1vS<<Bn8Ich*?!PzTr
zA=CLWLBjBt;teQYY07+L$!qUp&hJ5Q<+~=s9sgWY!had(<NJ2*6QG6Imj|RSJ6`>T
z0T^FbnUt%wy`_L$eebQEg1`DmYrD$WiuvREc0cv-hKM<jVk!KXZw1jzb20lZJl~KM
zR>(I-oayX5$^meCtQv}SvCIJ=u1jJ2c65b9ltUzYO_>}4`y~xM{tFkU6l2|RVeNO%
z(+&eXFey+TG482f-rrL)Qbl6cfI%s;o(EUvx_vE{!>T_q%KNrp{9?d+&c|5Mb^NW3
zz84&qdKt54Ea5w|eZXznaT@samkKx1-3NeWjbsNfbP_8}Bv+WLDP<TrCmE>a$e<$r
zXsKTePPbrk#(M|&1_d=FvA3AcTReR2+JbQQvLCUG$$6(<y?Z{eGWw4g$@kV%71G9n
zj|IQ=%!HT3n^a6{tMW*sSAwU|Q?ws_W*B{$Xe7h#S#*46avcl0?lE8dYDb<Eql!Ke
z8kRL-WEf5278ur%`uIepwH(->8~<z&-QNwexKdsX={eJ_XOFbI3&*%V9&o%7S*`{z
zKC^PAD&`N*@^BECz0MYSdy?8;^LhlR#s|JLmGu8c2h$`my9qv<3E_&(V_*Ng5iS#U
zkOZ22r)#I}xor-qUfj6^Yolr$J8{BLo1I0p^aZ--;-<LanG^a3U&hjWx^~B81J?%!
zuMo04lP2lr%DpmhjdA`jN_yzdoj99W3HLaBVcm&h$pRRl&^g^}*1<2RL81Jffxjh(
zv>W5VfqQ1#le_u0W%W2?Yk^;x^C#SZHgBDnI0RE=Hi6YKeB7FpUdTB5GHK9+3z|Pj
zYx@!jBsY8+U*>lg!Hsj`0ms<~{4pl|$dgh4!-)sqx^TiOg?<WbmM7x2%fx-0XNA-d
zExuiD=K3`w#pY;J$%trnQpE<3<YxJR)4i23HS=SdcHDnNY%^Elh=)lL#pf40^K6Wq
z*iG&+xqxF`&18*^nX<T_PC47?;LwQslj22^MpG35-E>&J5Fe55T+qO_>ODL1u4F5!
zk1jiW8R2^g8ipB1x4&D!LKai8@4Skxy%j1RTFIWvEjHDsUrG>E5|Lpayn=PlY4>Gn
zziOrwwsJ3;2h<QF)zRGnoV=j*qly~o<+{J|0T~9%ro=!rU$=kWw$f&E(FEz(bnrw7
zj8uqlEkEdWp1jRZn6|1@^UYLI_<IU6qq>je+TJ4X)13k2ClA^}V(A*P{4ZD39+~Ij
zBrE@{8Lf3T5Opn!_8!h3FHquDHNx2FpSfJ*(1lgyV{g9$3S~Fn>FkY>H<KN_`9#s9
zJHb0?lRRo@SO}4JIoh*GBr4tLE?Ov?N%W<6x5u9WJcaw?r9YBISFiTK9?^1c_UWd_
zst(*i?dU(7gj~trW!WkhWXS-<b;9p-8_ZK+KxhoCxUU#Be0Zm(vf;;nFdWDI2&~Ln
zmh{-Yy^5)#Hy#>=iOqf)IF!=v(CHo9eILTxT+n8|Kjfmb9W_L7K(ynUpbNQs9_!5c
z{al0RwGS{|h<Q5@?K}S=k=O$6d6-6eKJ!@Hh5lnXFrYnz3BTQf1<0w)(j5`}Z=%mP
zbR)yX|1wI#^B^lAVB=(<o<BVPLOFSUy~i0pu)=N;*KUn)IX~^kmmWlXl71ARF^L%#
zQQ9CF?`3zsk(J{Le5Rn$i1E;mivN=3aQrS&i;&rFsHPN)`yrY6E2bgntUre9LS$E?
zv0-Ya#BOOf3}zL&u)1=4y^)29qG|Mj?>9Q+qUiIcr%D-K_Av0!XcD`6*Ab$EB*C8x
z(&rs5u_G#Xd^?ilVQB1~rppo6LdhDa@1};^3)J7?O(1c*3v8sgeCpMocaoId@Tnbt
zOnm~Xw+pH6a$jPnk_sOYN%hWCoZTM|kS|EDqk;81lRvyTb?CK=d{6u^`;NF&n|Kyy
zg2BIs?|*uj`()91Z0{=xlUaUIW{aGqKLBl)aKK;P$Gga@=p<=4quUjJ`&y}q({(Ay
z&`LN;oW<$bQ+sd%#MAv}g@E#IBYW#1ILWzJU0~?HLc5-un_n+8r*Qt8ocxqNK(&6P
zC}-H_R!F}zP<n`?a@Aw*EBig#-MbtL06OKyrlv2s(+t5qdtc9j4zd&@#tjgj!MGD8
zxld_*+s;XC4L)zpcfTo}pEggLeKmi!0}D3=N*^$|tY9c`uMc%D*Ywl-;R(&)@1f)j
zkM7yxM#3t4bBg6}Kp^J~+c+OjL>zip@7y7x38-ayd_7gW+_gpMd3bHgyXMG?IRhE!
zjH_kHkbpO?%G`?CySDk#7$ez9$c2g=DhqY_v^l?|S27T@y;ua;S_$j^()iUNeVRMu
zhH}bw0)iI)L}^ji86V>%Ee+p3G?~XSqYN_6>@h<d0h$4t%oy-n6YVmePHJ~OOw`t-
zD;}=`DJ5W6GD^-c!4pSrr;Uleo1yz<=9mUKy+q>XRgd-LT0I0-F0gaCDr(>V)DNZM
zOi<Hx?=x92l|A>$uri>COEl0Q`$r)78Q%xJQ1_T~ZF~u&PFkPR&i8qw&(1T5c(hhA
zEJ5k0n730Pv>~u>f*%FqJe0=-oiFy;d2K=}W3%Zx9#8J+MbP(6Re2O+yXlU6kFA0!
za!e^|9v6$ViP6TlzS|AGDCV-yWYvyVAy$WT)0{#3KSjmducnP6hiuYKp)%GqDQdQU
z^3#zD#Oc8)8+)M*<E;`Vb6yQj!}cIDy_Rg%K6Dn_Oq&3TzrvrT?-KT{JTB+2PIo?`
zyPwuP;@-n>;Eacq>-?4LZp96UTJ)DY59c$oJ=2LZ7F2K=5OyP}DIC_}JmNBE%4CxY
zKhXRt7&a=nPQK1wO<G5gAgR}be$B5JW)zrH@OixV?DDQ6n?~f0@>8VcQn05so4C)X
zAPq_PsO?)I+Jwk>LM{K<6CoYVKgRilO|s9gUmrg3_kjbba*z};B6Td4STU8{ytGL?
zt!CU96XC2;oImMax23?S1|*tQ<qi5wenj<dqwF$OOTATr2fly4a|dI<DJPh9kQ_H%
zxaXHob|jqsy!jKc31;@fnQ*=g>U+(Kz?VPvnBb2q=;WV$Aa2qR`YistDah#HVL&3;
z^|fSPhQXef!|oR?RIb(hNzQ3t>z2Fp!^|l5^?#H!z;tXMxO!ZLzu1g_GDptN2%DUA
zR!LBw|D)(E0c6_6t;qUuIm-hu%#_^3^%AEEo{?3w`_ej>UNw+YG8fBy247s^{yGHz
z(HW2r`~Q!0#^=T!Oh`}_<l1NDGjKNp2qmiuL|N2E-xcn*Prz4h^`AF5)ESij?`jFU
zDRJ^Y0vc<Fv6yg-l}|uB{1J7x0UZeJq9uuaTE%Om?inf7+<s0gK38zED`(+Z0~A2A
zj@uI_X)EF7yW7J)b*Q4(;~&pYek12?YZN`F<upCt$qAL)FD4Eg?})gB?o`8m=O(6R
zB+B8%YPG4U(O}XazSU6NLT;j2>B&MJ)S;RC_uyf7?}kbuw6L@Zb<1Oh$8W4KKYfnp
zC#2GhrlcpEz`NEon!(=a`MXZUIj~bftMbi^4Y;z9`}S4*V>9)ZFmBPS=CVTOV~X_A
z?@9VUs9QX?ybm;si3V!Z$#Qkgb;n7~CK$5l23as>hx^)7Tca#vBHM*UKKydtG8~6X
zTt$A>(uG_alz|D6bc}~FWL!`5jaS)ZpyG7h1Zv!=plU=Y!&8z*9_S>Cbu8J;Y{xi5
z99Y>uL6JU$9q+7mCW?xr-nn5AO(IK^$#LVa-14@k4wE{|)!~J>^}tK~CDm@o=ujSa
z%zA84SGyF)UW^PAaaxkv=0Py<k6o>+($QZDqjWeUW<=_zbX_n@sao`BZ@yd7xACf*
z4T@4*V)G^SQV+vVbjpuY*{ddO^y&!01cIXYts`*Y{`ZEvyAf4VjeZd(Z*<BCHD-F^
z_^*@Z`6nF1bWY!gwB~$c8ru0c#>wPNbr#PEtIC%ZeSC{#;PA7G&P38*0=-9Ld6G3g
z=7EK3MDCdNQ1<thJR?zepqIE(zDIxbL8Ni7Vk-+7Sg!XT*?wMq6I2ASHO<#?{XUq_
zyT~okBiqh{!H@6VOf1dlqR-m};OYZ?n7qq5M?AW$?3(4RPHy7gZ64$Wy>e_LB@x0<
zAw}$>YRc+|%r-7rt>a%MKQc0-A^lgkCKMJ~T)hSe<U`wH3@N)^8b_3S?jW+ReS7y;
z!lMDOb4<Dy`%BkQ2iJkvWkoJUr9&eEXav*RZaeB+2H0O(E09tbj5K8C$8g!c^5l`~
zoSb0B>Zq+Gcd4Pk9HXBT39L1$qrk9R#gyYYfF>}YwKcgOmTh``i17qQYeS&=v1)%b
z!=V?yj_%UF2)tl?MVfLMkk-Q==+6)2y`TJq<UpnydgyN+>d2iL5$;+8999(q(22N=
z?C&LrFa3Mf6u-E+{`aB*R}MjQfZUmyv0Uh-5_e(Ok)zoHL48ku>S1f&ZDvZ{mCJ&=
zZFqXjm9l>e_Wzex7W5}S2HiN>mCjtR<tqSsaFRO@Q^otP&?i@q5Whg!yJhVNS4sMR
zP_pY%ocjW~?TaNX7D*8W#w*C?8)Z?Q`F^BHR;3X*)sZ9xWaV&j?G2~DA}JqLty?$C
zeyB-w6$@O^=TKh?Q<8KiZA^;!x7w<ucPEiz?D%6r$M30VWj41p!1^w;#M(&tJkq-B
z#U%b3#iuaf{X!La%MegP?7u{JGM!%yxYaHz*eUZ$q1)7%EcRDxl>TX0E1a--^p*8`
zslo6Kq^;ncm$9MW8sGbMj9%_Wi;i5q{B?(bzwz%TGx86G^RHgRlXp}ObCrJczD810
z7dTQxywUioq_Dj&V%1=duJ~wh@yEhB_ylAjBt`=#zQKM$?1+|mIm3?oqQOgaIoQoV
zhf{uKg%s%?PvPE80OR<pXuvIXHTgNiy^qyK@Srz{OB*rwZj;1n>C%}aP95VDK0-3O
znidD=4{crNvj%!zUa_G7vM`m&`cKURHzg*7hee@z&K%;~tepw;pdAOnOu0OA&v2tn
zA=frJ9>G&_{r6hp3q1oZu6-Y=s*+emVM3uSm7g}~Ly@2OA&f-rl*nIl-)2pBKQi~y
zUS|xdpkfTDoVHqDYG-rrO22u)cy&H#{Q?wEJKlPj&f&?pk7QvVtQ=O6$sGLi-FvD#
zn3Qp}fLlP&k(@+O0Vq21<@;}61rGS*DJ4N3h1ipYr^SA4OQvzgWWJ4}1y|;jcuqNm
zR@?e8EYq~Xq%ZHf3c5Uzei-X#MJMZMDiNZy`Bc=krlZ|~)KS;BRDJOS3M1}22!Q<~
zmsTt?u)^!V<xdCe_9PSs6W7R&R*qxdJg~d{pS8r52w-DQe>**B75^)55EHHH!o4yh
z+-U3v7mw#6?K-t&*X{%DY}3t4vDl35zg%Q2p5|vS>KkuqQx|E2Q@3Z067#@zVqofV
zh!4-Wp+@0m6q&5<D!|!0{H5%bprfHK?|dG&>z(z*GVvH<Cs`1x(EH%P0BJMt-*l``
zZ|05YV~uVITHYp8&eGCd2-)1`iA@o5$u@W%>;MsZ+ZL2=5!U*I?H4lN-dJ5oI#W_g
zd-rV&$#(&ArQY%wMLM%@lh5t^pFVkhtfgX4(fOcV;IhOn^xM$XN}Vq_{g>tARhXJc
z*Y0V_?j|A%Y*l5JCPx_Wjh4v_K8$rAcYO+(S{~u<p|WBL@MDH%^*sE*pP*i^>4^PP
zA*fF<AuQW58WX<SMQ^^X7}eJD?@{Eo<|IayJ?5Yq@=qCLL%@>-kavweLn`f~C~E75
z3g#Klxy(nL|Cs$rn!WVQZFp{2sKcp}y7|uV_C&{W2Y2kufC8I_grjLX@oe{=bpPuy
zx2wFoyr`u=fh#EL1=;*k-oTExE|W(gKDnOzFHv8$9(pE1=PDK9^4bLB#2r3o!YD~w
z0%s%ExemQ)EVyU~|KPrLcI1C^y61105%eVg0?^PEm+;i?L7L6PN&hwW-Z!6FC;xDq
zmhl+QO-5(@Mvq3DE;o!S>0fNL3w}J2ic2s&Q5De(|K=MH;`sp~Ypk;N5d97~E~y_y
zQE>4Bq6xvLE<q3fMS0+VQ66ctpBwOoM5AWvk}9R4OqdjKE;;Tnw@pjUWy`L98W%V=
z$WiLeGU@p4Z6dR2FyDC{8Ev>zN=KF8`D5$h*Sa3*70VzolHC70&)yT&hhdV6>=-4J
zro9OK?kdF$LQ6z09$Rd(oSbC*I+V7THtSG%?FpdXaFT63mH{%o0Yi$4YPW!c>x&mV
zI*><yWQDGp-9<~zYj|takXoR!Sg(!eWNyd>p7;1qrz|)CVyBOPL|KxPz_WZuww3Fu
zM1~x!R)(N1;2^-C?v<1w9A(7!-)nN)&Z3E?eE7o9NDy&EIxW<PIEo#S;X(hP;4g6g
zW2-Ax!zGsi_k3#Z!Z`=FEq3gVbwZu3tkS+A{EI^O-zE{?na@Ajmn&Fb->~(<?jDk*
zNme~u0KBKI85t$TG}p+lUJKV$_$>71kn~Ns#wK}3N7B@-a6!Q=n+wMq*96X^pw!rE
zorDv+TW$_1jP)*;JU1Ci`Yb<l^Vo&NmS^b*ary3%4^dyx;ND+(1Yn`bk(b9>uChPz
z7WTb)a71lpHBNkE{F3Db1EATA(#tOq;KVSx-5(Q@q40}7rN2Qj{I{%N6wJ%xmmT9y
zDl~dQ(<b}%au{_7TP`5J7q^FSMFzz^WV>uK&q%&O$kJ<hms0mLyMms3?m;@`yDTJ5
z>erBtAL&bBA-J-R_jPK^v4x+!yxpCjw!ot53P+5yU9^P}r7M)+gUW5{PSPhIwfbV@
z3Z?G4QQ;merSv~wGne}L&43Ot@hn$uJ|C^ZG7!LX0mU;7<*NMroI0EY<el#gs>_Uf
zwRwAfuPPcZzSWaeS(qa(My2~wAv)=w`1~JAN3Zs9TBuWew&HxRH{;m@3aWZ@dmW#b
z4o;1f8%i9gY_8n<tMy!`VY_i;`!2vGT!Sj2SdB6@C(TTwhkoxB&AaLL_W)P#&SWSm
zC1n9}V;{?_LSAARejv5GU0bV?W2JsPx4S^p4jLUEy)DJJlikJ87g0eYng+A2_mN@1
zGK=LyfcAz4f!L8?K5kqj#h6hFBmKF=CyVSjTp@DXTJR1>2ANxeA`tdzJ+FU%q!3%9
zf5popOtXtgIl=kTcNc@JGo`7Fpd#99Dr+I2Yoi)8NyBu}<^18L*Be;#_&VY%DJ!2y
z3ew)kbSWfqyoLW1HoWzPP4y27TX`cHYyzZl`h5eaav~tTF&cLFM~{h?{fFqy&~xtb
zb^EW7<Sp_at!t&l!XnU$<K)Jn?d~(HviP$sne_y@c7i&5UekA>%AJ<U4Ej}F*n|1E
ziziLk#oNKi%xwUp{AxRv-O(~o6Fx8Nyv`@~`wG3RmrlQF=C`PD)dm*g4CsPM?SOkN
zh5;()Z}B7jG7CUV<uKabwVrw!a9!kim*UWTl#g^HWb+2i%P0A_g{ii7v*~KAEdXk&
zKkQCy3O4?dn0e+s^y$Yt51gC(tuLu$>1x~1q)J#EQqBh@O}RX~qV@yt;A~IvfYRhc
z(lgfMhxXDTB-ce<4P!l+#9d90?VNNw!!4+p74~ThPB$fS1w}=Bz3xQcd$%tJsrLKm
z)j-nf<LtMjZt@b*(wB1#ULaY?qe8EfH9SFQq*bPr+tc%wUdMwk^7hAepUMO_`vgCD
zqg2)NM4u7*UD<E?^6Sdz_`5seBMGMfE0y2q8Z20y6ce@labI>#M5#|`exoR@YBlDJ
zx6+=llx3BO6%VwjYFJ{}wIt9a2a7lZDym)3@dU;5^*1(NSdBxO2SYDk<^O!w{j(_b
zbmz7r{1Tfm1zcbq@7W6$M(zEMI8db2Vgz`=y#Ce0zvtM<HWR3KmA&iZCTjn52GDZ2
zD5U?0adqCr3NLbaDgb0);-gK50qfxM{M(PZo&wLiugHw^n40|mqykI-p#qc6%{X(!
zo1}(s`oH>LGB9wkh^wO`Tye+}F&|n@x*R2WTp)y`RL)`@?jUhiW7C*#Vc;Z`x9(en
zxC$bbqNV=g_Pct2DO~{;Fnjv5EMCQT7MlK+f>#SDhm|Ar7NZ1Klf;Fy4=JR=bFJ5t
zb>+Apn6)^;H@_x$zY1k^je@>PSHC+sG~9XdC591Ql0)q5dG>mw-BCT6v$!rdBl(1P
zJo#)uerek|n}=eAMwaZCXyg3HqV1d{hwE;r{DVhkq$;0+n8yOZLy4c0To3Hiz<t!~
z-CLZ~&;OgZw`d5EG)YM7Gxs-2zfyHe*|@&f!VfgMdv1Qwk`wMB76a{?Jb$DI$^_V7
zyyjJNG&iqHe|H%5B1P`sThMO11T;zL@$wcs2KI%_{BkPh`v%N>5QaF-G#PElK8)L3
zdFl2~1GiQC|0il|$&@a@*xljrHu`TbRbrPMsSES}vxQqGh5JJqom008<VU*@T*sy=
z_e8~pqV=Y<pfzUgeOvF-XoZ;O{X6T!BtT3DE=Z`50<<NcU8((AU8vZma>CV(hOwT9
zw^R-|5xNz(U@qWmLr?u5E(W2Q#9tsSrs@9n4?B9^`&GI;0&}_2aQP;bwMbQwNhmiy
z4^#5HY;p@!R$OTj=;LGL36m=jsMjnsX!0t3HJ}n|v-CdBOs{sTWHqMS<m-Z2VEje(
z@hhKif53Q*o8Cz2Eu)8$QJ9uCDu+AVK|N3)TVFX+&d>r}eq7=GG|w2KsdR-`hZ90=
zn+G%ZW{Yu&H*Mnqy!jRG2_gP(R?|rHCJ9@KeDY!*v=v!W9QGm7)z|Z;<Ae;*1e?^C
z9LWO9;%2dow5Xb1O%Zq%|Fw%nh!QA#Qu?y*KZ*nxL&d+0p%w~8xpe<nG%}XbQ-@V2
zzPQ0AGxwh1|8P-MQP$}vVH{+Nbjy@1uJ@JL9$P#$J1x2?J**P&qA7sJeP|-ALv%fg
z+C4!tXIMv&FId|C{oAL72W2XQ?;qZeJfsc!Aon#j*qaMEdnr)7L7VI@+n?p4|1eQ|
z7O>oR`u_x~Ro`G~9^^qbv$37RHh^7uD8C92UG+D@zh^Mk2Pit=4Ti03vIv}zy|?|p
zka1nqUx5xQo(yVobnTz!Y?E52L6Rr|`ha7#UEf3>pX&u)@1_0a-{L05V%cZM(A~Q<
zQU4clZvhnN+O=yU!J+X$a0%}2ZXtLGNpK79?ykWT+}%Bp;O-7Vg9LX8&{(7McJ|)?
z_x)$iIrGoVIWq-CpsG{d)o(w~v(~-t>wdSt{slRVzgR0SybO#1+RpS$EWShC?Mpb!
zsiG<0HD^-;TG{%cQdFQ`S5<jO_)sTpw==S`u2GS`d*~>K<}grHz6G7ktX-cv-`sY=
z5%X#P4{7A@u0kXY&{93)R0S{h*MNl$zoRaC1pN3uRYVm3HgKN0_P=bEh8z<W^oePs
zyUAnzvw5GnKgumAW%R<5UnsKEkf9@yNRm8<!XkuIcvY21$fbObC>;XWRP~0^+10Cs
zn)I6gQx=);Ke5Pdr-@J!*(i*DdBYd}+PnEG``3Clg|5Ygf4lJZe##6<-uMaW{-WGk
zJt;NmbHq*XM(qOM&W)vjx$EecoYCb#<_!JM0wINoK|7I<>?VVF&+FpLc_Xk{IQr@I
zk959?(vT(_OJzUE2Qh_2p%E)*K}D7PzXvMo+AFg!_>LUiZGdLfmG>MfBXlxzvCn#I
zZie%EP~)W2ZN^00neU|<`D|K_;uQ!d4+fBV>26)M&{r=7@H4zflVwxE5ayEzt4)dk
z?iEb2tlZ}hWW~d6aIvKUltkcl58!J~%T9jbo^JG<50PWFFNg3-nScx&$RF-EO;0I7
zgShnmBF%D<yt&t66hylT5d*Bup19d2%jKYm9%V3~dGY&mLQR79$Q&PX027);_|6w%
zXu&}jI793QUtiiu6llRc-y#1o!|cBLa~g#s+$3&}F`;n&r+jkdevN@CXFqWr03o=U
z@JA4Vdw%B7RI)o!)=2ZaQDar#o|N%K$dYdaHlj*hLv<~iT@-_S;T@(v*AJUD|Cl`X
zbiK{6pf8ubNhc&xk?utHGxn$C`I8tayCbh=j?T=ppgXzQs@T_%e-S(B9}z#8`&KZg
zxVep5Hp1^p=omk|9K_8DldKxb^Vlc#tZmg3?qC$^u4DoJhLF&q?YIqhL+*$E%wYE7
z1AOi<%i6rIU*K!I9jR*X?9OIrE>j9o9XPxeHSK<#pBo_-<@iqRmJ+Nso%4ai2p#%*
zPG;;gDh*NKaTTvja?^Gr89K+vFtF5PwXmFmj3VKuM)LWMdPlCvXR4)5fGmzN!nZ$V
zU@>6xCW{#ej`Du}sTt#bBW`)Ss$THaq@SlWbsgG2>jMhy_gK6U03*frfbEGD_2LTS
z);SQK;Xn<Iwxm+i)Ha6~U+}>AS8pU-f)v11mEwfj6ZJ25wgx4^%xBL9aR0$!S^tYT
ztkS#_9<B*-rCTza9`|7;pgbmfJVd?;OS&RPAiwE0y{xU?&x#lG;XGYyAyJEMFV1RG
zvve>F6P6k)_0VLmCKx(oqbyfy*5y;^DD<(iwzN=J9>C1Nl3NOd%t1I2nGp?uvj)7H
z#x@<v{~oXsWZPz#K<iJq7kh&G{TeUOORU)(ZQq8pp{-=Ltz-uXX!T$tKAjJk)ZinX
zew!7mohtWP^0s!!Ir~}yrfs%4<5jOKX*j-nym6lNB|wlz)n(G1Y59_BIqJU(A{&Do
z<<Nr{NQkuS34pC*2N`r@F2EV>E}dEEG2CN85|JWF`iGW(d6btTP0OHcOtkDB(ak-N
zxZX{gAi<ZX(RDe{H2L9DLtuCw)&XgHypj5WCPda%iV8LfNJaP?XcdAN18JGJmoSi)
zYeqqp`L&FK$i~ClK!D#hz6eX5NJapB>3`rd4o~^-pZ^0SvBw?ltZgvxRoUv#B)))C
zPxo@1ui*LC{Iwvaf`pe*ncpyZvE9b1ta&u~&;MEbxYh{}+qY}XTRQ(_0UX+Ko1mdZ
zS{fea{Y05M3Z*YJ4f7BoHWhsgmgLeMwYtH54%|O8@beo;je$}{Frq2#jbu2ruo-~h
za9p4DOo(nH8lz%aOX8_v+88Q|SYtbUFb&Ohtz4{g9xX2S4SdgqZm<K1d_hq~n{X4|
zIFl|cnanTg$v%adzQHtN;fK^`q*#$HB~th=r93q3FQuFh1DiuQT5to7`e3R24T<^u
zkHG*>Lg*GEag;}&!j6~IMn3icqorlB+l!B+zIQN23L72fBD_rCLH{@}WKkRR4x3;b
zSHE6w!2SO7mrPlU{~#}0;buSL)5+8?sd9UEQvFWU9MxPf^X?l~tQGxS=6oP(?mCX6
zqdgnBV^R$HhVSCOpX0Din!Q*d>X!@R^eY<bY#Zm#^WA;~?)nwNvh*>)`)qr2%;`3{
zd8@-Q4DzAF(N-KMlkgnDAaAI2A?13>LlS5h83Q!wf&SlMg%c~2Eq-K&_MtrLHutA@
zBh03)5<vsDsIG3&$cU7KU-*S$t^J@|P97kNbGa}pd5k{1#Na^SR>!3!3@=r|$`(+l
z@bRc{JW)9EH$Bmv#fY~}FLE4+DK5=SAMP_CI4iv;mI}Xlt?k<)B?Prw+oLxS+XR!G
z6Qde3@BzZ!^vjqu368!e5GWT!4rsG%raAFgeeBQ;fB`-4`9C9xkN0vEB}%9dx3<nA
z*}XSC-d|Lbw=)`zn(S4MzG2*F%JSZmBOcy_k4SwA^WcbcXC!+1gzE`U0X8~=e09{p
zdBW(pvDqy=(R@VVf^w9&dUfwtDw)Gp;x@9Rw9SGl5di_krcp6_+y!`hbg#T7lGoGz
zFHuS$0zVPgcCAQ4Ehxpe?8B_e^K&Dw%W&^ajgB?F;mDmz#oZq0X3oHA&~d*+6}e47
zKrlLf{?({mJhi|u3^IQ3qO(XMiX(v1SrOyt@DuK%d_XEzS_u~0r*agOV9z}=LZ|$&
zMbkf8cpOAAC~r1gp-qX8INe7n**=O-_gRH-N+(K~;~ugr2f?3OuhWiv57C)6ys(Qz
z>nOChxp6w3Z%bTz;A_+s_CQo&)g2{>0tG6DVDZ#I$<@-0NQNu?TkcRVg9wk&z?i0A
zs3bN)f6z0ZhpAmAJ}RB+9H!n81IZE+Bo;Tc>+oXum`#g3d^pCR4|h!FNFfBZShQMM
z7}|rBw;16jxk@@LXB3E3w)wtiWl#Hk=W-vFCD=0b^>oz~Mm(lkGmEPR#z#6JHs|O(
zW{;_v+uI+qgH3_tOSwh1c1U-4EINOJ)Sdgoukz>?VjofH5T`|jRj~d=YOjmn5x4oL
z!}ymI$u7rDsbatfIEMvZcXy<*wPBy<ayrTj8=k}E1{XWb#1xtvlX6E~-d#*=w`ICk
zxZNMDIf{|iks^VvIS38|dsD?&@OT@9k>MJzuZ3;uE5h{CN*f|YrAlG!<ZxY$`e&;G
zxlX$sDb^*Rr0a{Cba%kiZl4q)x&iBwwA0%o3VNB6A}it$pvFb$j{?{-gb<7n)qqN_
zqKh?99>uZ#npO*{C3(&;PA(Nn;IFa1Zh8u*oT$`^{k($pN}L7<37!rb<nYIS8Uol)
zm8GGRq6}GzB5OgQw@Wmv1-f6~pL%l?drswt-Y>u(4W@g4{29~S*E~>Jjr^O<f}RUV
zHH&@>tgh?|Hx4^W!N0SI&kFob=2KTCW);{sQ9{7hIR6e*N`3xC+b>4Qws^70I9*`e
z?=S3Tk<;L*;^IEZ<6EP~?@)TQt=%2;gUszqV&=F^Vsy?BBh!~}WV!9kkU#GR@CKhT
zq;q>IVGe6R_3k}mxd^<9d#kAIBfhbto6BS8bs7)q2=?gj!xLpNeg&QM7Z$_XSUw_s
zYFvoQ7eox~V|4vWgix{dLwL`-dpxDczX7$C|1zM~!@d+u`J|o3VcTJ6Blo1FgPneS
zaDP_)?%ftFMuJ;Gc?|V=7bsR#LK&-PZ>jDERYuluIB;n4aw>_5v`2z~>51j(v<`*k
zX_!mKIrPDfX+Y%$Fk;6(_0AK;2Ahd0nZ@X@DiSzgvj|CO*7pW!FPqJreDcAq-s9V6
zwHUR5DG=BL{Z9mMQW?@%&|6VYWeGo6zr@U)*ou<vZK<LYc>RS6(JLNOlgEOOosXLP
zEMV>J7nZ+TkJ8hVll?sB4S#CtHK2XSyk;0Cc0bzbSntmV?yCrlIDSanPZAxsXYP(1
zjc#p1_Y(`QNvrlKVl;No0M--c#gn_^+jEeNq_K1ctmCGZUSp%5QrAZNJN>6#w#wpJ
z6|GPF&C?<HPY`y+{I;t|fHt#LH`xPnuivOS=ddDh2+%6u&_H1`6kJ-UF%_GHB97G*
ziTynv;jk9TsWQP~Q}v07GZZ%y3Hrkf@`rptHal?|6(6K5*WIg@4M~t{2p2f(AHA*u
za5D#)DA)I4&t41ta87uwv!yhU47X|L&x`-g$NpsnUblIi2es!*XLJFFCOt`{&+g3z
zlYZw5n8ps+u|YRVn4vL-c25>e9YNoxWxVT68z7t~LN$6JQ#z`%Q7%{tLi0%EXJZp&
z0Bg2FkUvR-lRdo>JpWb!riiQ=R!s!e^KsJ+_ub<mJOr5iu4^#>t0<e|ma7v*0&L~t
z5$2H@@^^LoS0LEJ<O_pbNG;It@1lG)em9-zR+2$SbMh<~zC_>haH8xNwz9pA4d7E6
zQPvs>Lr7L!0co=PwK8W+WdBvBe?YWdXi+&{)jy&Y=rECZKEjq}=X_}Aa`=h<Vd99n
zI#vc7Gfj!GZuUc%5n;|>8sEoIg@0+_l*WHFa3X*4|1&{VUmXi5io=e7tnO3bmwN=L
zCBe!PAE}OGfk`GHn8~ui`}*c8aPL+ps*anfvuuM{%0wKbyq=pWgp$<U+d0(~yFV@1
z!ze*zZdhZ>v>(A*2f6X=eH0Nzoc{I!DfxK7JQ{Iq;2HKQb_lfrbT+pvR*(8Y88=yj
z`)WP7r59I%^{tNnz?Fbytp97;{&{*-HY3WY#dH^w?M6b*hmcSP^R~u@#va#w!I)Dx
zww88PMT(gl?(Lj*-l0Rwhe($<A6--R;~~Mb8mYz~DqYi_MiJ6yTEtlNGsd#b5wq+&
zcwAPwTx=7y;xf1S>=@mWvZp81=9D#mAY~wc-c1y?9?|CwksAb8-Nr9$JY)R{AOz-c
zsZ->CwD0l_+u<<gR=~!~W!YB2YqnOD9FXtZKH9FcXQ-Z5(`x<9K}3sxC-y9PoorVN
zA-I-7)!Dg|bw{v7$*d3dWsZVkBlEik%o0Le5x1a+m>twV6NZ0Sf+S4i7daBdlgr}~
z-cl|#&~Tssh3YpvddB}){Wg89FiIYb@W4B<qub9zB(Ri!nReg;0%l+yhhdN2KWS6h
z(v$TKmbnN25yNM>>;4wQf6tSDb^Z@M5SZgj0hqTd&_-UnjefOV%0R-?6&;fkBT2Dq
zL_H7GeoDAqJoqa3)p4ODBRgAtfV@M2h1EK>UpfieNAibqK~?b;`<`eZ&t+D+sivmn
zJ2Pua-`T8@hZT^B9om=ufkHk(<wxHQpMW8D+N3y?z3H7-5g;rzg9*j|gWdq(;C}_Z
z;qt@j>_>Bc`Pj};uvMAtfxbrXj2aPTh>Mf~c|9xw6>D)mP#vpy0oA0$f>E#Z;(xea
zdmJnB8$T@pf~~zl7~;EmvfqP<cPUKGC`3e(<$~=q#IWmb%I^BUAJRzc|L>wVIz0ac
z^roL=`uJt!mJ2cd(}gm4yLy3CQzI-nl5IxMG4svur+ZVEE*inW`&ush9hR7qC+}(=
zm&g^F{q7{2A6DB0&08-lmGvHn96jptTSe0rG_yeK`8GK{XK`#WLMg|i!>y~z5E<DO
z5y*`N5MtGwb21G$*%kUZ?SKpIpBb<N;e^a$LHe-jnu4>~a4C0_37Keg{29!PBF}99
zXy(5D??m8PH704^ff*#7$Y+B8eCU<Zu`**NI#k7J0L>7D)>2a2D=P$$P|RuGpL(K?
z59wx#|2Krv=2*0k(g)YRp+IU5RI&8wdOtyje?H0aQBOuJ=)f%R6Xd1Y8tRN(b-|4o
zaYnepJs<d^BOF$&m>n<ns^G1DR8&2WNQLYQnaeHl&WQB#$M=LvcZmmz_eK5ltJ3PA
z4WtXag&#*<C$y$oy&1O*t*;5XuwUj7Po}b|bLxNp0!S{psI(Kw^7`|;-=?wmszi$j
zL8s_{(jt*?G9v%QBReAAn*EIox(zT7#WvM$jxXh95=)f2?R}{>VmnmO>VTQ4ODRX(
z4%O{A<rOP#FPpniDIJM%xXpJ<Uu`mOX{{e?=}8UV0_1hRb--6ZSZntbVENwT!O_m}
z5O62IXFi#189J09^JISgQ&W^7QFx&n9ROr+dWsX=u;s=G`PY;2Qc$S>J3fJ?=3M*6
zK3Jz0ct{x|xhj#Ym8K%1fF|?s<0cGd96EO*C3*>EM%?2#l3;Nb0p~_?r~_1%K^igM
z@tR*p{-eh@NTBuirrj3P{CfI}9?293;1R4}uvktdfq-wOo~^zsC5LToIwsE$d0B$k
znfi5zldk1QylCp1*wxYx(L#*`0Gc40VAtt>4_g$$_B^@Qm~W{$G>n=bcEz7obiyx<
z2A^X#_?E`{L8aZ_&NXdbXrj7wd$#9mxNl$h!OG6l8B_YK%Uv4xiu17B2qr}2s2GrM
zcR#vSK$<E!pA9;C2qZn3EXR@76@2C$0)dGxVK{1G#9zCgtps0o;+Q)q!%R5=U4s(5
z^*_+ZsQ<?wG;~!Ngdin>4|C~*+nBp*nm`rxO0ge$bkCrZxPVQfymFoqHEO->p|&=#
z)C=882c*Wo6Hws>((Pg7TK<K7=sc%+q=*1%lO!7F*>seq()0OJ`o}|OrBn+tHquH}
z2VY=`T49@3Ht${g;cIbmdj6l~pX$eEpsBsW+9rm1;m61af2P>m0DEuioQo>WU(lm*
z*0+K4P8)rt>+$t=#iZ*qB&xwnIJY;w>oP3PxN}Y>p1%Nh4A1rut9~qCkD1O8GE|1y
zU;oP=<7&10r-1ycbjb+lg2o|38wVDH4f91qG7sB9pr}ASAinb4t=J&0x}__*j6C7-
z=wi|Ls+>7mZql_`rA0F~+5JmmY_u>D|NYW$ZH@Aq-D&{iDFlM>Q^Pls`DhYN;A225
zbK1P|7d>gr@8cEhg+_m3L1(lF;jK}d)p>KVxl9-fWXAu{5pm|yI<enmniSp-RcsVL
z>j3gVr)t*v$3*Ayfw?Lp6$!bTV$-DV45cVgsnQ{EXUD#4z(5M!{L?_-K7OK_x#O?I
zkgJN6aOf1!mHv!fOwuepFrE^eOy8j!RDWX@xz4&D@DHO&Ht~eq@+qEwEhr16s5fZc
zUn;x@4r;-pPV4@52}60=FSgD{CmGBewFkaz;YOpkvh@=Vv+e)ELE^}<uuc>A!K3(d
zhWn2=_ZEt?)Vt7>)o~b_NAU@EGPkV~g5EcJy(sv<Bv7v#pZu#HirsGLUcDz0$zfCR
z5TxY^E2;C6Yrewfw;6a97SeUo>dt%>Ezr&@VBXi&ZKTRZIHTXL&mlBfT~>$>;q-+F
z{JvK@m|k6|sEW(nwX@7tH=%>vtyn0DoHDOCL`)=kw5jU(oqdQ^{aSb5>KpUr30*hG
z2~K(uK6834PRLZrSWKhHq8;5sOoWo?7akzZGiVMAL&tnv*=&(|$jhIV^`+8I;+yjG
z$UKV%ADkig>T%~fR7jV?FSr|45p=JaZ5!$Tvozl{hWk#MUlei1RgC~E+hYo_@L{!*
z1Dw=6&c<(I@d(Z3J*$yHHxByHwrQF1ouPX4gH>*c4e?K1SABLUoikF&{Lw$VJ_<k4
z-DbXzeOkCK3)(pS;X4^b0m?y#7NaDR=znG+M0rhHp%tp2;X@e*xM$|-0X)y9&8z(4
z2Tw<D^r?9yww~qCi4U-Qn&M74^S^jcDmVQA>yUbzvWl*H^LsjB0xR-{kO2N#XhY0)
z_WH#(|4aPa_I%fBlAJw34FrTol+EeW0GrEG9_sxtc)^HnYtKk>(Cax|?Pdpd)(wkJ
zwVp1&C_p07Tk=Cm@IdfU1Kz!NUn+XihrKoR*zI^cMgLQ<-@naV`%XGXkZNz`<LEl2
zXRPz|AN6O2hS92qR7wtecr^L_J}SAU>ucf|eY33S>y!CrvlO`4+^Bl=Qg?PM2)Z(j
z8Q?w9`JLV6Nrf8=K;%hmlL^@ZkRMTc%wioTzgo9`2o0snoD)HcJuVvyBp!L9jY7N1
z!cKxY;FUrd2&80n%#T_7lop1n15&hmrhSti8xYr!LSq46M(4XH>GznI$60_UeDT{T
zrbn4-J@MJs_LYTG65!a_Rhjf8K;V8BE}31V17s>HFq8LlinkNj9Av-Izto?a@3b8@
z-a)MH!NvmwIz5R6dg$qJA-5;NZo0s?H;n=+D3N1H$@y-Y+7z((cCRGX1D6d|6$I!_
z#jgpwEeM_9!5}TTjE+ipi!>&#^={pS_nWbJlcK#-!GpHaFUb(e0C$^1JQB)6f>bgP
zu{b6EiGN>=Z7{uRm!5Xm!r}o=bywv#bG6#^In6yjgs$xJzPoIcuA*XQ0(bYxKK}NH
z8(*p4(<AM-YCV-$>H+kV<+2%-<=gPv)Fm=Cvz0fy4L73`EM)?9k>0iOtq{1cdN1`)
z=&RLiejGPw-qIZ}#3-@Y47+UZ;R@JGk^m9y+Pfo!HH7}TxStW8YY79kLn|&QeY^02
z&=?4?<f%|w;?4H8W;(_HK9%+G?8><Val;y8B5LzwJ9fl?3AAQh4nRMxAOqVsGSJaU
zo_Sp#)P&#rT_r1xeNTx1p?%}u@+(i5y7HScT~rf1tU=K%i)fy-gig<pyz5C)Wrg#`
ze+X}{bAx0Qb3uRB2ac<nB2_$IF$adNsElEnRS+~RG>3SqZ0&Ya$GqaUjAZ-JzcI+d
zZ29x!7fI?C%Fi$gil4%!p8=_%!cUn2<VY+t6PG)YlpFOL)}J7kg#H~xk&Wv6p%BiW
z=8{(_aeh{R)k<1BBU`&i+fN$=gl2;J&-t-KGoZ7od6${N{(o6+Vph;eya3AY1K+`N
zT$n@nI~F~-;i~hz(Ia*?zK|W622JkjSd;bpgRgb=dP^%*Xr=@v>#e_B^q#oHC~fsF
z4&-9~bmsg-oH-LN59K(0lF!>xOf;SkvXyRc-xAO|lX&LdFE0nCEm6^5&;nJm9&<JM
zyX}l*za6pM@)y)Nok6tDJl$%O!d<G02EeqS&;5e}!R2I-(Ym-h%=3oSH8e_J#bA{_
zWI`u$u<sQE-(SZ1@P9MbqkprS%_=k&U0G~Hx^RU~3vvw8R5!SR47PJ*T`CK463-q=
z5HH2?@0@2-z-pN1=}$2ZxZ(wr?9E7Q@@)WIk$YOg5rxhQy!sM1#4+JZ<Pe}~)8V>!
z2)Lne_1F1_A%!~MAMTK1U6pkl*h6gHzXkSb8j+GaxYIw@P2z6J_7yW^7j~R|jsvOX
zdjy#1x<j*h81%gNAA6A6jHec0_f;gPD@BgD+Ko(#_8?1mNZWFwG3PSGdm+K510D}i
zxdcDZhV{9sYphu^<{$OF6YpCb<8Rkz(`PjJ=v|K6l`K1$^Yk6bWlV`I^|#T$uaD#U
z&gf2r^OQyPO0`b}@|4A79y5<Dv$FMP?grmaDBjBGpKTj^WPQ=!|3U6kb>N4a9dm5B
zXd)?}Bd&-6!JURh3&IDI*TBJmd_L`?d3`Oc&--D?R7L=vm<K+8G}(c&@=K?`ii8q@
z8=vU$>KOiY*sBRVv@mZZ#>M8!^v1EQQvFZRoW|1sHm7mKSYx*BL3nhzrHq(Xq)lmC
zxgy}+-AC(xm+wAGY?Kb-tO=xOCZS#T>MeDyT72wzGOUS-Z4?GLNCNmz#d&Ah{JDHE
zoNWCV`1O(7jV~Y59nY4=6;|s0w%yaUnpQV!Yl2!R`$WRNk0WYhlmToe`+lTB7TXdG
z*u)uq5dieMg#bH*9y_^$Yt_GtxhaBw+&e(V)k$x>32b>H=+A^9o~lUSoLE%Cr-Hm>
zl+|HJ#z20=>g1b78+@Cdu$_=OBn=a~7GqM;t+V23NS(B2Oo7w|0*4d?QqJ|SKfO6*
z{qkFY6%#b)Y~7m5$iWd}gNsWTta3;HMBx+cBLa1Y$E`1nuJQ<;Ai*h70Ks>7fQr6H
zsQOSK2Ux_vt2P@XR+oJMDK?qUAIyQLX-GEB2m%-lKG(w+3R9l4?%>RrBqjWnMrbOG
z)mEfMG@8qB&E6N?<xX^8g&3jQW+MD{WsVIy4AYab7dH6+gG|C+b+rk~Jr#~*)d_|@
zNXR#h9lQvSP@cBK`?CAA6^=&^eg0p}kz28Q70)MBoSb&7`hQhB?@KR4Zm%FFRqSi6
zGYkW%4*vPu+~oDqp3KcBh>*EJZ{AyPBCu~CK#@M{p;9_dq0ibKamE~i3WBgg@C;xR
z(-=j}`g8eAwmMn9C7qkbcINt6H+n>PBI5&tSSY^(7)MYW?KU}gfrvIBGadNT`UY~o
zuV>qfZZs$f7}O#RwMoRF;|UwTQ}|xYuo#rig<$$4e-5XTuK%BX_(sFU4A(%cBILzq
zrP~WcpGR-aCWhj>@++-(K-S`i>sCoRuo2V)3i$H(_!ocuMV3tIL7+m#KVO}lP=BVZ
zU)TKet60{K#a12B$6k@wzFn<nJs9q&yo@Ms?R%>95f4-z^0c2?o0qi?`oM2APA#;O
zN9OEga+By|qMiS^rtD`viUZMppBpsAa)vi<1b#~Bscei6jfZ{h?z!JeEdmt9;Y*dA
zeJ4He0Y~ROUK$yE%9*@Gk?I9u9we7~FfbNRamp+(YQd_KZrrh7VOK5o^B)Vpn8>Sh
z^#ix5YP;e{W&$)@%SuBco5XAl*f0NW>Ru^c$`0-(Ejl!)jk(v5$v2{?53deBt-OUA
z)BuFF83D%57XGbC69GoEn3o08PtL)vsu`R|IR4X*CXi8|m=~uT7R0|K9~-!hM?IgK
zV;<9QsNOBjLN@g)D+b|-=zqTgs@ts~QZk>w42saH2D3B#h^TH>+zzGrF`z4Pu03Bp
z#}rGSJg*j3mo{5?`tG<9gemyq?ncGC^6ZuS&b0H+&E=RgHo??a+yof~;l@56+2gDQ
zzOxA5_>(XF%ZTD>K_@VzQp>b0lf-aswn`+*-Ww$=BtTh~-@gsynW)v1SmT%()<!qm
z9b~8R3XP4_j%)A~8=xm$-X<R_wkd|1!^@4x5xs4fwLW>etb22oQJ~#)^Iq6&-?07W
zYwg2^N?6H=OY3cNOCDtY;HcMXok6VRvz(aA@#TABa^ItR5p_#qIqPr;r!bB09v<^;
z#p6$B78WJL+p?1hAPI)XFO|-0tz^tUYO0UFiZ7PX0YD*nE~B#xVn3I^NI$uj+Ge=z
z4S3lS?R}$vFy*0`#db&{CK7e;TpVfs@NWbF`G1c9;EMPk5day}*?I_hjyroVw(39f
z2LhK(k~x^`TELXzZva5@F8}~4rnoo+H&V&AluN-Cl3ED9reQrFcPGpl6K8;<B|CzA
zU<jU~0Lxyy+9Pz_a9jxnQJpz=DZ_V=n`OlG$q0is_(TW=L)#vTEAK&z|B<x!)am)J
zq&*;fyO&SQD<L+*StUv``IWb_8?K%@3v7z#9-{Om{T^_kl)|5G=3d%P#P7RuIiXQ`
zs{{U&L*$DOZ==c`Uy^EH+eG)Vu|IdRN}D4O`Z5U^S$ZlFwz6&g$;cN0V=dsvYnRLa
zIQ5S_0R0!RlLP#Ab>lhFx8~*|Wq$eRqtyrQO?6fhKAR=K2iL=tC7PVLF^8$D?SwCb
z%+CA*&fjTYC9Zz7T~KQBcv0dr&DQ!&|8|?=5k>RX@M28`4~Q|Vy?49$#3(FbQ=oVw
z)23#!{Fw;1Bca!vI%h2TeiAp_4;MeC!JcQm-~xu`-EA~4;H_Q}e|B_%zNTb`pVczu
zjhJ}ovUEkDn4^vrqNN8$5^Z}x+avi}VhP;R`8JbZ(e27%gPVzTiX#my(^(*qVA<B}
zw&&3GX!d%9GlqxP=Z^^(=8v=--@EUgKCV5?!9n{yH1}cdar14tKl?2#gu5BXp2!Ks
za$3_K24xRNspa4v`8XRhSV`cI-S}ja9Mzr(@UK#0Pd?8JrTVuhyYfe~>Adc^FXrQR
zDiwm!E|8M!6zbfVb%6!-R=<*eW!Ty5=ZbbIj(su0Iw?h`(4p9&4*~iq2{4DmGjHj2
z<b{JQcK&P3O1PxyUK9LiAO3aLGwC=q{Q22hpO{7JoG+iwcp{*@Vg8k=uBHHMsG?u4
zA?hMC|0YQFAoq};YGNWU&sUEQ>!nYcV@+lI+O&SvJY6{COWX6$?#>t&*s0f(C)GpA
z=R5~}7cx0l_kk$O304+dc2lruK6}UETdVFiILrrWY7+%`DsMK-nod_*7p4nuLvq5O
zqiwtJ3*unh4k_Fqd{UWyqdt`orV4%m`9j_-TgsbF+i@AACpW`0uS?yindvz!k8J(w
zNJRg+MaK{lf(6o8^^)A~`&%jVcEyf`IS4O3Ro{k3X1m4iNPWd4-h%;7<YIHi9P2~E
zLAO;T@0k9LemTo#`6%~fV$)Z$<~MKg-I3_~v$-!4(50TESU6KGvh>1JpM;4;naOKu
zEwe4PoN|@Kd2syg1YZ(Um}dr+U*T^Ty^rWY|1J7%CGA8zFQ%3d)7A)VV$xB4UN9|A
z22U@O?`QPLe;jRA3D>>%%}*vjAKsN?UcyF@2}A*_YvkgKtoyBQ^@QfHG(4{-DOhDG
zm7u+vnn<EQt@5PvW8!vEcEtbsB)mgWc-s0PD(lExtKgGR2DGyR=0HFiQG}OobC@g)
zOJ^%bPYSi4VvC(7h9>@gzsd9!&iYO)Z`Q8Z5I?T>Nq1*N5^QwyoB9ms#-(==rS6&b
zbD=&ikMZQFzii)s{R}c)12`bROCG+G!a^FC?voWuNVxT-hOave3Z-yQ{<7zRmjPt3
zTonAVfSmC{?4eVwb&?ghds3ALIV+ovbCd7y@>OC>KL{a5i+=<*djg;BZw^3>A>NX~
z37KRFkMfNzgTQD1del(afZZ-aMw@ZVAB!}!5HDbCW@Ufq7G6z}el7D;1vL_O(PO3x
z4@HQjHegcNT>DYHIH%W`Y|!~Jc-1e5T5mXaK(dWH|5PEnI>hf5R^!gtRW_k$>hjju
zd`$nCUOxdXsF4YRlKVM9Y$np1gVP^hN>fzcifId}l$K~;&@X`k<=D8O-9G2JKPv|w
z?|L47^E=L8pLcD2$Rg1a{TwSGf#iP$RT>~KcH{A2J19(BLq9~9{g@6ZR~NM$xqtj*
zJuv$rf6ykJjv;Dicq5}8%H#J`$IAb&CRBH@<NSLcD}Z38XHk0cpX>-<#`NFxKHawK
zoNU5f^gjFye<bjoc1uIdYHmN(FHq#dQpu2QKJw?$?32g7N;e<&GEk_SUTG93)Ee#U
zJ?+2FI!`qkt@W3x*;JP}%={WLSL^oUM|8y@&jA8Bq&cu5j_=z}jVPn#mnTb!d&Rzw
z+X(sP@5Gewc`to6Z_oUcW5aHD3zV92injCJ#yC$X4PLj2QQz2kr)npX?o_Lzp`lq$
z$PaiaTQfWM0ArQ%Gzh!Jd$0_al7i5|oNYQAlVI=dmbP0@(Mi&l+Hfl&*ih8S-_ab+
z>&|SS5j6EmMy$CVG*JD1=VG^a7tTNj>n^k(bMiX&93xba{r-2v5Adk)%#-nN#Wib&
z1228IBq1j^R-y3lM#JSS^R0cZG(ucs?lT0L{Ebk=J`4x>K!s)ezL1=fMyw68c|sr7
zPaY0KP6&8Ygv(g=h8@c;C(9=8Ph}_iE-o%^E-u+8SzKHl;PvxEKbP5#$0s|D%l&C}
zC)vdpF*Qu}o<;A*)~1GA{PbvzEkji{7&k*H8<=nq2J_A7>L|C7uan4sA;yEvGaaPm
zzxmA!maCIbW8)hXYbBY^atB0G&Z6<XAVbNiXys;o+bh3dgC|O2v(azCyO2w&zdtpK
ziqh!l&0$kkA6DYE8wSD>I(qf(zQ7m%c|v|<t@^VR%h{XVVH%Wb&2chrxo3gOhVM&;
z;9acFOVSXP!6%qZ8>|RXFz{-<jX}ibow^UD0YW5&EkC?Dram)RFMTFS31P#Jg3q9@
zjmF&drWUeD7E$4hHX&N`&DA;sh2PcvxWi8;ICrSOAjR{zC=a=RIllZrV=adUVKKTN
zO5}LK6ctpiHZfArl*<erJ=%P=l6uB%=KZ9>JDgj{MMk$-Z+fFpoakO<kt9S;@M=U0
z`PrCZ7@iA4_7LWG^B++YBg0wA>rJWcI<!`uuwhd6*ER{s3<tcEpJK9;9eTXsZz^8H
zy%hiRjiqAHWSz3wY!e1V`zqTkH%hQ5jv~W2$))(Rc9ZI9S&K=${pssuk-cn)D0U^!
z^gHoBZUXOhwjk<*;}g2en~fO-RIMj+@{WpOi4*t`5lUScg+waUj4+YF&}Q;38y9uw
zaH1Nfw|=>qzfug|E~aGb-@0mnlBFzV77D>XdP5MAaa^PFl!DG;9hN#tsm!a9=`Rhk
z%H?4=EQO+xKe!oJV>iAlNXy{l`BMHx-S+MkCYEi~t&M^Wf4BSsM+C3(Bga_A!6|#n
z^Nn~oohL<|8Z>+w>1QCBnfB=O=S0&sVJn5d{giWfV7KN%xVdI&DAYkh8Uu$0VLa=*
zRYA1$+~UDC#&|YF=&z!d5KpjRd8A>)nPz^S40#9vH#C>I{Bf>&O`R=8VgF31po9q*
zG|z_@lBO}HQhzM%1<EnI{@Du?l>$<0fR}NzM*toYc@|>BJu_*ywj?08LWqp?%iw)k
zM$O^7jcKrmTP|DOx;Ofao*$O0ylBWh)-}v#KvmxCrVSWvn`V5)bk9odhZF@eoNLI&
zt(JpeGQs&7zHW5Y&pNofAZ?UUVO{&Tm0xh$9G(Z{7_TNduDp9%Bd9jYT0n+zlMxcw
z^a`&(MzY-(cz|iQe6um-=feh3;f`k4rT@t{Ol@1)H;7$ZKG^W7`55h?0L?(+_}$WX
zoA-xvm1^m{RdVOXrQaq-(9KX*4DhQ2h_@#%ggN`z*PKJ1myd++eZQqa;@3&oH5qq)
z9oE2p6tbTroi!UI5-4bhKBa4)MgSKFiz>n<wHWYlSMnpBcZa~z--EOqTQj6t%E=k2
z<-Lr!1>OGkcl#%ecX}!00pc!v{iWE(pHj^o8CjeT_NAT*tpZds|6Ez<ihb+NZ4t^E
zHY4f%#-Pd#CwLvDMHL$#Zc&0tsrfjk#kzB?g4X}5i~lv6pJ?}XoEEOHt#4Z6B#cD2
zZT>0tB&{vHt$P^?te=r5?+zPlMblxx#ij-yZ}WhAH<|PZoFv7hI0eVpIwFz%{QcVr
z*r*Lr##J>zbLH~MJf-VFv^1y1e#3Ez2E^`w_X~-PbobYV%OUL*lo_!B8@I+i%tOU-
ztAxF}F9MaMEeC_^AR*^p%51rASTn2ne<n8vQ26_AJix8@a?9y9hKMu|I|W||e8}H5
zLGGpJq>rWbiV0pC*Z|jV5iorP4`JU!9<8kJS``<IiQj(NH8C3Lo}{E>l(V>xyliD2
zB8C*CvHDj*mu@SWd;2T@XMcSQ($(njj!uk?m9y~KsdI60S(>gO7Cyah@=d+#+hRA%
zU)Ctr+6}uh6}gNehuc6>-WdpT6x;X1az0+BqbI$AVe?+cZw}NgDw%$@0(*K=jt05i
zRS-mNVk#ANSECeV=tSCE^rk+y%fh01t<^pJ)~`7I5hfh-G&R#MAWMzw$9G&3(pO$E
zLl%y|yz2rIl6`vuKH;8G#u(1{QsBQyBWSlEBPa9`f_%`fTXTXW+kf^Q#Rpv)AmN?$
z(#y8K|F)UEl}xN3Nk?io(T`pSreS*3cwvw{LHh(Nf8K7~f=QYnH2SMia(A6C6LAq;
zLym_&4YM@lrT}Joe!i1?9R7qoSJE2}>BQ$aSUVm><G<|q8Aj15p-1^!{LLc&nK)!q
z%ThtimdhDUxCTj$59=A0YJ4n#UrzH7u15~pksdcKxw8%qR$4yl5pBfxZB&(QvpTfk
z48AjYpE@kK@1@9o?N6=INWU~~o;*P<TGO3as(K1^tuJvH?VM@kL>(f$)9KH-t}${O
zoe1bZA-TpvwyH_`?mAwo%zOdkh;?^AAa;Xow6Wvi@wJz}8+xjKUAt%Gah<Ub$8>X@
zX(YL-CnmJ#*8=#OSal!a>S_(xxvh1+ph~2{(am}h>q>XX1c|C%InU<j^jEgx_%Z9C
zV#BZ*U#C`X&dZBH7d_9+ckPlf*wxjE;~UC~gXBER0u8!j6BFfQNY-zy=JwcZ2v^_F
zf;pv+HW}*F8Zf^(@f{ORjMzhF=baz)T}kH;DeVY$EXV`qZkWB4ckC#xk24hf<tUGM
zQORRMmve}caE~ZwW2&7kH{$#`#tHRTWj!Rc5kQjL(RI7@7T%l^4jrHC=@;ddZom&-
zyf6y~Fcb&^6z!QaJr7Y1)EZyir!Y50tUvxJ?iXg0dTLbR;dQT{>JIK4t$LSCu;HK7
zABOf;KW&6~UdTr*@=ohLc$Xst%gxVqM<7+>X1QQjf38JE#0sAuRp6BL*7eg8?aAx3
zYrVJODya5t;BT&;*H|``qWe7qpqBWPbZ2@}uMv|A$h<sG7B0-|S@QSBK}`MRu4P#R
zhDvOY!zgPzyV8WyB(og%H9~67V9aWyBARJnb6=Eo+UA)P7oTR#g<5EUMkV9Gw7+nc
zGQ{o73C%ViYDyY^ZQf=xj3+QYhoQweibH(Qdu~zO*ZNhs>;y9|S%5r(n1H_b_Y(bY
zwfKAcmGKiKn_s}iA3ota6-`*S`?y|6K(9#Z1&8n$cxE#bG?yvYW{KcC<4^jw)Y>#M
z8<fFZG^e=vqcu(?1e6BakSm71F6DcAR30a@i9As@sTx~xdN3X&htTyEq*bx1k+U-m
zTmSFl8#u%#83MMy8v1q|#dTaY6ORRL27yFB9RDik2(jgu7Meebrx1nhFTbh2?W`E7
zdoLQJeack*9d0~7M@VQ0$6>?R+bI24K_G;}kpGo@1Wh%L%1@7Ap}-{9<WSfKQNY}r
zmkSf;8j|;<w<$%3PlQUY6nGXwl4F=C>x|_{K1HJ8IX!tkunmt%VW2JZb`4%=cC83h
zZJYR0s6!QLu>3WR`Lxb>vM$-ZsfNInre1p1+Y%CeG1yhvHTtj>ajQ*Sed@;Q*aBMr
z$y;%qBz+&d%=r=&v1{IUiypX0yoP55OY0$y3o*P7zqvOJ!(rUt)9)B71Lv}fI@v)L
z*a`Vr47Bu-QNxgdzHce9H9}LW1HNJHq}bw7UX3BLjbmjOza-`~eooP^q<gQ!j6)x;
z4J)<Dj}a1Z;&i~>d8cwBd6Lnv?T~x%25r5wsSQXn>qqi<%di-ePercdZm|0nj*sM}
zAy7BW%8a4G<CXT^JWNdNH@<!|)EZ*^@n<c@WC*M{%&pwgxui(t2f`Hl8kw^o`_}kQ
z5X1et2h!2IgZ@u92X8m#G!`!ihS4B5L`O(xLYuXorisl!0{v)RLJvsfm6Gy7<&Vv~
z2w%NW2jKR!q@@c6pV7(Y)S8S$P18<CvXTYBi@ose^mev)Kw2#)`N!w4B+i3exgd;1
zAs2Rxub(~zIm)<Gn@^lXe$JK32++;VwSXmvEX6lW2Bm+(#lYf*E^Jtv4c@h)2KC&t
zJ`?PSk^I@Tl3U;z%b(TLW}HteAtIAX^clzRY{On?YY}HdFV>c3A!)E4arQ;PiO^ov
zULLLg+AWryEjSPSsIdIlRr*>X-(sWFP3M4Jf1%f>ou=|N+#|m`@0^ozU+Q}nvwXHF
z0${JjLxww@MJZ4M`wI;?jr8!sA~XjIy$x8Ap5lF-&W|`qKj4rk_*=B!P{%xTMv~ti
zvE@xBuKUwa+Z6w<jX(xlAQg#oX3NQ-_ovz^S7v;aBBFTABot>g@cG7s?hSTM{*AZJ
z3VQan!&6Y2jL?vf(CQ~$P8c8qSGo?ZN1j=!bqt&@I}v{Xi$?#c{AKL0<B%L5?0OuP
zSnFnwZ64*5iNp0-YZUR$r8`*WpW=8@0J^mFf|?#fSuB75^05T(L|gu5DL=H85;D^~
zm~459Y5ARqNw{O$Fk@UDqSqJ@i~ZS<+aY{HUUeFQ<mE%xFdi|CeM|OF$n$Ulmb=;q
z%-1&o4!kErc3bJ>pjjW7vdk`+SsgTo;a7L$apKM|$8ZSvaLjPEsW=^83-w^TmQnZN
zXZ)-cc5xO&6~-DYPc<xpJ5TyT%UeX>*p>8%BS&BI9elPeHfLHH-)QJoCJzIN!Dg*_
zOTR&15Q__MPVem;>uj*gy#<3&ju&H3_C25Sy5zZe3}c&xd6O~G(wR(-s`NIncZqxL
z5*)yIXq0Z5rHyz%pZOK}m|<)tRVQlS&F<STB_+1Q1Uv((1~i*C=Ve0!cA@vGpcY&k
zLO;?|-jg^2=Ym!vIKo``#xS%6B|IC2Z=dqt7}&%7&j0!I0sYr^2Yq$J-RD)$2#wtw
zpF)JwEt1I3&);rLoGiuPxhyy2k$j((86D_&W7+}3qO%nZ@A`_v>9h%kSJs<f=#W96
z+Z(6cC`GQR{kHAW=zXtlVys^qX`zQ})1;nOyDSPt-pHtksESD)=xp9Xnol#aqUR>&
z>s+B6uDaKZlJ@t~{e1?P!LD?L!zk_b55jCcop7L|w^G^UUmITdw1oy40`1}rt18h8
zlC_tA4!_%ZaGtjCwFLFd-jecd?eAg>x0;dqt9B}P2^qaH?#<+WCTbm*Csha{egqmW
z2^W%UL7@6qnASVOeS))wj<39%+xn_ges8LtexFMnzf|sFOKwm^oo>^qQSyk6X0Y<e
zhatGn%lw#}$u{x)EY~Miiws7bhS0xfnk+xUl@wKMSbh*TwDdK#AaYZz`7f`;<%{cn
zg5Pego_8dkvE#};A2nb5WrEQKF2I+^Y3{GfFvTlm2#~pL4q}ClGG6O)Gfh8NbDl3?
zrtr&{N>4~{wLCAi1o35BD&Awj1q$^dL;Dn4133nge9oh|Jljan`g2wTKDBz5S=t!I
zdvnzTfcpZE9Ub{%%}Xu2L0q+BLYPG8*5&<N2p-oGpPyajYx)k3s1G4s=c;ZQ+w{f?
z8v=!K6QQVn=eU)p?w1>-rru-6A=9J|1H>AKE@`Y^+%?lIEOIW!uiXWfG%>1(8_A?s
zVgjm_GdpFivpjzQ*AWXQtp~(#AWOge@_p>lLC860h_*p6X`u;#&7;b-M?0$Ax$E&>
z0ZTL_hz;k1{Id&;&NuE3Hmo6PMp3#r9~iCbMl$3szh&@_{$3U+{%*UJYiepb(~Lnp
zo8=>k#Ak0)ZwOW!$WyvotS<<B3K$Y4FKNNH#f_UsJj*3?P0dp-)|&eq-|z$>{jP@6
zYxB!O=kxfaSXmFN`pl4prVQPaPN1&<NiNCveEV3c1(OItDaL+Wk8alK?q>0vfP1yV
z%0S#j=%XzPOk(0xGV`csaD}!&vjpmBXYyTx^I~*QYEDeObRZ#TeRQ@NN<mld2G-tm
z3)WpF4@&}}7gYuFg0y9{7$hKChXUZxgSGjg+lisVL%9}<d4xJ9LXiYJ^7DtCW*zN%
zluiS)fAgnpXTjG_&YO)^zTq&FIIgeM_$1d6HU6A%+XRkBLKim9!h!wHv9`HQC$g?_
z;JGF>;;gs!t9}=rebLCjs(~Xrp-|l3k<g`Esar}E!#U*@wU>mXh0D_;s;hD#Yg(ek
z$BBoxOlZhp#E7guUJt-6Wva^kTgG@p4%$GCt>lL2CS_e8c{_I3ai~qA@|Gq3G^LS;
zkH=)xLfS`JRX$ipT1oi~9L=LO>$u<NN*M~j|6VTI+1;HjiawlecCnf~`@oc)JhV4-
zKU8V9@PSULK4^-pvBjE*`YH{EnXS|;xsbVh`L6EfhwbxC4P0NxrnpXPZ*zYG!v?h*
z^PF5;qQ?EIG6GfeRy4c46&dW~A+!em_KhJwH)KIff#7^b76%f?umgJ}uU9O+bO;~j
zVRo13*~~Em2sYwHz4h8f-Vo-3ratF4T~d;^jA0{{^^m<;amPZ!bJ#jkg@0S|hTl3T
z_hb!mrK>3BRVNZ^i=@-F+z%I-Z#s~0Y+fre+&HnR3^G{@P(w`1PFVgktSN0`pnoJf
zLL|+>f%X+Fcq=&!&|hTJxuf6`z@lHF*I;lZcAl3|pg@_FLWjTaLGIOAf8@1sJt>-u
zWGNM<4!a>xbX=!xA4z~EDfaMO3(|lk+{GD~$FwR7c}4WXjrmk<nFi7Y|Fx`^L(STy
z^f#OP>bU6H>vF~?`Y>A3wI;&FF5A45Ob7jmk$%%2VZK!((>L-t8J$KpbK8r|<d{ic
zV33*T7NwsyD@H7O?z_7Kn|Bt8F;0Ro7b|wIRGv?6A_~i*Mc>hjQ<U0yuSKd6D?dKY
zJ->GFw>Rc4^W&E^`ES*iz-6S@3n39WRB&NbmO!h37QN5AN~-nNWheXETG5$1EZQ=w
zvU>YAYXDDyxGtcp0U^OQt95O#K@C(X6zgf&7aBpx10QjJPbW%`$v_+Y02BSWbS|aw
zRHBi8z3icxJe>HOl&{6(&l{tR^4Tl(RI&bgM%yRvw#+Eec0+j0<fT*7&3c4zIn*dA
z;OV2gSHs8FO_5nD$Qamr=rYr}4G0+X0`rj<hR9`Xc#4)lEj`bMyDL#(M*2$XIcI5d
zGBT6Ql)XgZ;@&=NBMTMdd?{r`+3FW#`7N+f<Hbg<V_II%{Fr8lel2$JGxRLI70zd_
z1zhcyS{Dp2oYR_XLl;xemU((g7lB~Jc>5r5i6hrf`Rljr6gT^`l=s9Pxa1oZZ|K^c
z3&SVQZw`k)6C8BK%&Be2`F?}E^4!t*=6DaDb^Su{wU19i;QLlkjeW=G5W0tS@4k+%
z%*8!hbiAH`eHftvWMXH-*bvWYB9E=}c=45WaWV}-b3MKLaG?@qe`;Pg;cvnuG%)Dm
zIfq#*1YTr?J$Vg_UrJ~1W-<6|IW9qBM-)699BNCZB#cqFt>^+Ud`EitV3ye<!7RP+
zg(UNs`ZhZ7h({smZDX(4k>M>j(MY)+kOx$6T#jf@CcXbGqQ}N=Rv4Kq)n_M5^me%+
zH@!&9cUmW8WWy7t*NOWcLhDo5{s~Ks9kpXyIj8rERC8)C*?KpvRy;a<GgfXq@Nl|b
z2d>C6$uSZ)^`B8zwc~jdJ=UG|HNLYlT%XyA<v@zvapgq2p9tILZ8c*;rcr)MdB<;J
zEnwI9igJ9w9DK0n!p>4aiLm2IhfT-`2!3jmIiw$_3YI|4BmD&9mT;#@k>Dn_bd&L;
zz<J-<!%4rVz)bZ|$YaCxtNvE4$p~9fXglR+RNFOHY1`+OpA71!mEa`w0?5)^q|o?n
z%#HIFc7BMui7?lWg}fn3@t(}Co}*+W>T{wVeYHT@*WGu=aP&q-RH=R{WOaheI_z9h
zR6u4qrK?6t(D9y-$uDqjN#2)m%oOOgp8|f_5X~Z7jjAG19=ZFS;@3hhR7FdSJoD5S
zN~t=Qo#UH#>R%d+_f)9@Ct}+Twp${VZ|_`9lSAb9OnNwft_4b&6=aO2F7FGTZX1`x
z6wnkAX^(BLj|iLg3<mf_cG>6ds(c0PwMEQ*RR;Xd@Q@P?oQ^}!E~L&FAR4KusTMp!
zby_iXW2v{ac@qTlrrFN>UZuDnM!z-9Ecm_Ic>Yfo0823jIIZn5)Z<}H(`s(K?AswP
zeUr)O_iHg&*$Joen66O~`d|solf5w{xrNd^eebo<mCS?Xi*iOW;TU>9aT~26?L-J{
z#E`yDDzTA(@p*Nv%lxg0SS^j|*;9D6JL2^!hnDq<1YpBrS|~*<4yfmteWPQ~QQ)~w
zdq%;kqOchVpAk%&Z>}!V+T}ipj_M{=2B`Hjy_6otf_GXUOp)sco*9K27Mx7MItGyD
z|LA`k5964Omf#h^8alJcT@d)f?3u=rIO8pF7twaAdL=h(+s$$cn0o(AAf(FZ?hw`@
zpM*8^E!*<iWf3<kf9D_l7zTDptx*E|h*O5NOs;bmO-MuNNk?0UP+i>E$7}3}b8b7R
zT{0j+37xGIJ3Tgw5ze3P?@LnJ69mRy`KVzeD1H2nG{+%t4^#;4K?_&Hi1Gre?fL!Z
zLh0}wuQ9)2WaNBKR_DGjq}18MRc%#Ue{k7L33{N+t;eaVmPl+ie^=D?cq?iFpByvl
z-PQT>`xAt~HA!v_T-P|6{Tp|HYDdE)pX6X(uBn*Umti2dR9&$Krw<%Xn-&=FU%N&`
zzkvjOQDTF*uEA7n(9fuh-og!xka|?&)^V>$n`h!82cQfcFWR(g>iPBDzw!JAZ89zL
zI3II&O&)Iy?iZP4yR}tP!uXFDhAKc6Zd~_{zqVL_S!cxv5%GiJW2ftFgG>{AZ}wRK
z%ki2_r>R7>X$O13SLm!&Rg#t)#kBX!vxPHk|J2XC4x8M>N0Twt7v`pg&!YB^$}{Iu
z+S{+NTz=nA!WxB<mL_G-Tsz$GHWR+Fnx1q}$Z5{<nB|Sr@-?baCr~PocT>8TotJ?z
zhY^}xzOht(b5f1A@aL1VQ{_hZ+}uLP-ao!(iQb!ku{U};DvT12a1yo8vx;B0*;{JG
z#kWe{AVpjmE1#RqVb?td*bn`~S!Eqo89USjqXq}615be7<x^he6fK4}?C|9~D+-dg
z!K9TO_<%NFk5z>i{EP1Lvh-Az2hn2ztM%sS&Pxj<RQzMX22megk<WRXo=QH_Kr0cR
zOWg6-vy_GwFFjKsMIp&>UytZacox`!g%Fg`&z)>>-0F%82fOmAPxp%S4CEY-f=`c5
z$%HLxzO=qC6kdE6%}!=n4E1P(xlpi6SZy~}KK|9Vv~W+35+^PY@bjnUH^T>_7Kip~
zC9qEV_Pyq7IE`naTIm`Ou}%=jCH4+rQ)|9z-qPN|6ts_DEH0WAg*>!>S(-EqMIg=R
zTPO_`rO!h-NjAhR)oT=p35O@wH`v7ksUi!>{vXV}2UL@5w=GN+5GjgodJ_Z$q*$oZ
zL_~TAl@bu8LnzWqL=>bWh#(zNst}M8dJqIedI`N(2~7wALfU=f{=ReXIsdm$+2j7>
z|HoiB7$l~=&wAFHYtFfzcUWjh?YrJxpArhD;+--`>wEXGH+Rl3mw(Q_^nF7fPx)YT
zV)ZJGL)&@H=xl7UJ7>F^KqpP(^-h{=A<tjT-IxBVM&=i%os-X7DUk4HS>5VdZ5-#a
zv}oXR_={*+Au!~tB_}<3jJ&bCaJ9gi2tr+^Io!22J6kION61E{=ZL(>c43YJcK^4Q
z3K*Ltuph;*#xpT`{uY9$=7n|_{b*}f#IoPt6g1Rz1ktD6qGJ2bYc}n24)&%|lZKWV
zcymq@Jqjr<I}4FUHbv?-Q|Vnc@T7dI;H<-Ux=CB64<3B9e0f4l!j+Nzdh;a7PLZ+L
z-XD!&oLv%`yE00}BWhgD0vgCXW2^#O#2?K~*Mq*sL~xhOgni@A|LSkNIuU<4@dr+j
zu-$sQ1;j$=2@U+v6CfAJzy`S>yRMITC9Ie@$kJ2E$F%>rT@p5|kp29<GwSa7Q|K2X
z<rm}U6bm`$`Qon4y~^O{Pzic_T$<meO>xKf8x;_C?!wa_SCT`JkJ&myP5ld=G1G?K
zX%%ope6#Ug(X-Sm|C0-nhzF->KC;I)i*r8+32S>w>-YY$a4>%*bqBYt@;hhKi%%Ks
zHzXBQLni^MRuRF$)h>_`=is>4v2-k^MCg(0C7&nLrLA;-Rr7&27ot2+5jroxf`Bj3
z!fyoP-|4wEFCj_}xq@sW>+|B5+bOt=TrpaN{lVTRx(v$ie?6U*T75<T0<L;pkv$%e
z9-b21?>A6x+%BXX0O)n`{!)NhQZHro@T_~=MNK0|*A(9#RiHO3*MCN_W<^XX;~_t}
zMS^6ZUh2Q!^3e7d-p{1{V#rL&Ifzybf=jo0ry|y0s}5b=K6@)L&qI&LY_!dJ9&e{H
z`|0_4TfP`Je@{w=`ZASUo>2wQEHWg86t2H=S4^g?{`KjF*K?LDb^A+M;3vX6U$DZX
z4+_b5Sxav*=(g+Zg0=T7+-$yg4=*ZSJ=g@4RjsUbW$wTZznY|l%U!uv>?u|4a`hbO
zX59?V#_NO6LYqBR=oL}1$s_FXDIa_{vP;dPZgo_2^tVX5ScV{O_GUwojVaz#6u(*H
z<kuvjwfLbK5L&}bzg0kX)uh*(%)XS<$EYtFQ&NesUn?5sfTQoZWkT`s<*uulHAO{5
zX|w8TnN&>o^8_eP)ll;-!H6u}8a00BdVu?MjZL}r4OiVzli{^k*J_=N!&)mk@vdpB
zQt`Bz$Ur4VML*z%&~<w^;myy6)M!exQS~b+DeDOj-H4Qa1NvK2NaxVWOQM~z1kn(_
zBmj!X+@Ypp4+zna5%~{N?9Jn^#?$F8o4+V2F9P~nOr?$rS>|uyEWxP8Imz?43aS>Y
zp;{6(d!o(9KjWuh+eRyU&pjlcQtl4-e?<L%rMa?72@hqEd2gv@yhmP0x*C;Ty5d{e
zk@3rCLXG7j2j3mi>oA-V>~g2{fBl@}GFjfGA2eN4PxD;DB7ey!TSzm$+A6bzstJ2k
zmxkaD&g@nnli!R1uCSuvGa3t0nf=aLH*Ba54+n2>`P%bw1w>evcwatlHGODwn~_;%
zIl(L#uNH6xbMYVoCEeEz>Xv~U+9W3`y2WPjP^d9iirw@l{#*-RDlvJ6h&BJlP0yvm
ztm&rVKS}$1&8#NnMr+jlCT|L@U`q4LqT)#k%ZQCPU>1$_ih&9vWF#l}I!L_Mt3#nS
z4F5>5`D4vt;KSWWUYs;fYvIP5TS7^o{%W1l0w<|!eHX5_J^OaL@BWtcqLCt|pt$@G
z;NHru!3!QUY0j)jW^VZm%XiCdH`7p!T#}|yN*^Of)VLZ>?l2fin-8n0s?X)KH%82r
zUCygX`Exb&`^YKp)k|}9G9(zX`*B|4)yv55<*#K1ZtS@04|F)%Z`n3Pclh22&G`*k
z%h-CFv#2^Lojh3dzF$tKBCDcj<@B77)H>5TvB1b>ZzEnlSCLklfiLt}GkxTRHdYNQ
zb+H`rJ^F*0BK!<Rv@@gZ(DSDCq98`wi^oQogb_8LN3Z^HZ`8CI${Lkn^kHng#mv~;
zUSTS~1eaWsIDE<gl+cS4yqpdsdAo~m_Xo4vWn*=rtbWP2X{NrJU;Q^jI(u5j7^ujp
zF7C0?3Kz;F+plfwUnFm1-*(c_ko)d>#6<^7?A);Lku-m@ks@%ikDr+IBQ1n35=-Ac
zIe?j_C;QHNtCuMdA$Gk#EdNO=5*s+R2+%^2R(Noc8`-=B=fLlZS|7$O+r!BL6x54!
zKN%Wl{I+X2H)OwepnSi097bX)Wcq#F|7fUwNrj|6S0%Icm~8{q3uvtCp?C(%Ro0B7
z_bMqZese*!u8FO5o$gi*8D}YpOverNxv#7X8w?CjTm7E1dgKmY0<dHDy+`Y`xva>V
zj|E9h$;b%SOMn|8gm5(u9E-~oe)&52UFG#oS%)Rc5Qh!RJja?iz&((5Dg<(7;*-}K
z$OOwIc^8bdh47(vYPilbm7F|hD-e>%gqY2Td+V}!zTh4L+F<fPW)B-e!+t6zDNDb5
zrdqmVJEZ6A>it3W=E|gduv&|N-iu7k2YX^auNAK`q7uF&9ISc9p&rY6MXjs5ko4R`
zbS>30Wi_hZ)x-~Vk6s&aeQkldW53tBj^tA%SxPK_zo{v|ZR&$R=NyoS^SV}hMH$B4
zPR%nJQOrq8L0jC@9jjtEw;FxhkjYOHpx+fF=xF<msQp+pX1re&9aK+I-x<g}`Pll9
zmb~dJS|u2+a~c(2e4TRw^Pw=DKd<?net?#s>HJUa91V^*0c$&H%*ip`FV`RHUK<jI
zY()<HYf!56r2QD&qHvYnl?CS1SMS5@O_4muyzGQ$S;-|!abjngEk4Hw8N!u*tlV;u
z`<AVEc7L9xc=OB|u7r2%8*3}3yn|b=X3uX0p7h(=n}%?%2{`u$tO^<5CG(6*ClQ?S
zBSHxR%aU6@=xtGq{1juY&qh{A^w?X4)y4j&h<Cd0iOp{MIcW$xE<t%nh;31Zb@$q-
z5P6dyf4CaOfd4Yk7njQ++NQ4lU|b@*@*9G3ct^N=Juxg1u3foG(Brxw)y2NDMdFys
z*wl)fz5H@t9#1Tzq-P<5JRy)<GGuwdlTPN&I@IJ5SauV=kSF_(XkJ`x$kjNbUdqX|
z{QPo4mOD!Cp!ZsU?n}{Yy0m@UF78|)k5?AhPW&_b{<XxdY{h|kI3hzO@hVjXe(L?k
zlXpufW4W2nW{V=3bq_hJ(sgEKyevkVk3RtBiKKY3F4^Jf%{lcNKsrw>UHbVEE5tpG
z$@NYqyVI{24UK1Eda!vC12SP)VNyiM%=wLX#lpQQKB9HQ^f#pYjks56npiZ*JkJ1}
zu_d6E=l@pAz0M9gyQiD4@imcqO7Iykd`pb^S^hr$c;mz4mZkqfF5TOBy#O<sFA%~k
zHO6BtG_QocOl``&m{nQ*YlQw{VX{&<1?20A3{q`tpunb<LdB(xvD8$iy3>G0{|^(_
zLN8~V??rcL^l0`AOn^?uS~v_a<Y211VN3RcJ91?8>bjMgBGdPrS-P*0GwwIL4Kbi5
zlN4oTp>-ZQr2fb9sIm6o7Dvb%GP<z~lMSu|1hYsz&WW;Ht`2<+uUbpk);eqD&nnej
zA-|$Bi*$6C@U83h?P#7CheBwJL7Z!knu8qTr(0mF15#MQpSSNP1xc?RyeUOeR!a=p
zT*1G~(WD>aozve1pBGl{60X~qxO9k(4NSZPqfVvhP=6%I$O5Qz#ajb=e|Q)%HkmL`
zKd%wH=yk}!t57mzc;a*+PLib7-24!cgnhjZSZN~PH4vK_>&)&_D_1Ix&0}6EsM?r`
z24<{#w{9OS%5E|1)Ravhex%@$n({(ZLcg4+9_aAMtKE-=o}Zo2GzRj2D4#?xv=uhs
zI`$Go^h10L*LyHBwDaqZyqjiby?@5O)LpV>v5P3_qGjlZ#;Z)e6Bv0aif&So{ZJfv
znRJc&G$*s2itXX*3kkG*T}rce1ZEw~g7)~fO1GWf?&`IAl5LQlUj97aD=V^H^;q7Q
zV-YXx&+k7lb5L&>RPxGman{EFBiTyC?b3_x-9~SiByLywh=y}ACRYO30Qq746?x3q
zV;o^)<C)c!k|*=+(qFbG&-`pB<0IP~%zf~HO(g1C3<Ft!a5%T|lb8+eO3SMU&L8vv
z*2`Qyke?T%9$0QuKDMjm<6?R0bG_xE4LAez1NsB#Zb?e&RAkJPPbXQ{O>#MWG3ZsG
z<!RV~f+n@BuG4>PyUlw8Wq=dDbi4DkOd<E3K=b*U8tm>YtAKix9A(oT^-&6mKTO2h
zCAiI5ggN+}NM=Hc>2L0Bdf=ivD_fv}eZQx*u;T08EhyI!wVt(7EtGiKQi97$%2_r?
z#fq>TGd~*Vu`c1zJS=0QSYt6AU%m3T%$eq&&BO~Zh-c}@h*O5#FYYvjK2{m8T(DMI
z@^cl&oOpDWiPySW@6=EF73wBd2I?1NA-)vOqqi3a_Gb?&^;E+v78%X{nbF9v|M0T<
zG|-gj#m4$bxR#kQ>uZJS2Gu;o8+>yh(2{W@HjkFZdZR+|I_R-m4Y!WQi;}L@h^G|R
zW6jMcKCEF>KSh*zEo4!-x%oo7QP&lFn(P%F$hO-(FX*s<QMm7+75Os)qvjkeDt{>7
zOiCmUB#_j<=*R;OWZ;x7P<mfZKwGd!C7d4hQ(QjP&0pJyZ&U>+cDrUHn3PrZ46ZPZ
z%y?vMOuN0zP1VXvR-JII{!(z|+2aO}^a=Gm2nO8SKhx*rHeI8pSDs^r`r^z3gGQW7
z@h8S(r`Wg!m7y#^ljshcsF`(JW~QXP#k0ic#Uy6pM%K0y1{74j+cn$WM=Byq0D=tA
z3Gs$!<6gWF%*Yl|zFK+Xl4|4VoviC41R6nRZY^~TB9!^<Yu&7?P@84?fnN&qC+V+g
zC<1TY=+l*rtA2a4N?PM9U0pV-h-#LG;`^P~^!q{?2>pSMUDK*r(VI7wm^JxBv)EL{
z+GRRk?}na=$Z~i;k2E{0DaSN3oD^(Ie^WDc{-#{3v#npqd6A1o7?~f6L;u{fnD^`6
z^PVrWMMpG!Chd!8EAL1XfTmTnH1j~CU;5&Mo&b_kx1Y(c^0s65E@u~rra4}5m74o1
zG@b0;PqN)53R0~#c3&>O$i~%%b@KDeeTAha624aZ&|6T%RcSWv-3i;d2|%L&(S66`
zogTcx?x+#t4D#~&3g{|+kQLaY?;{4OE2SwTtE+R81^R@mL?eUWZj~)qO8RNcnqf{R
zW{fh@Y$P&-<h9Apht_%}Hs_HzuIXp#bv8=X+By6??<BjXJhWwaD~Cg*_18l-d9M9H
zU5Aj_6>*&67UBKkX99t>YEpF$`6oq#1P#V|?9bA~8y0{SH@jPN3+KK{j80=?7O5`<
z-WrVqaX{ld5qR}APE!#HUC%zQ$v0>9*Ol*{sx?2I7FGU+Fg{PSD_|=eGa~500+Il~
zzj&tUKM1LDE`F^cetgO`dq%yKWFo;$?>pWuZ%UUsP2~S7$a=|Tn_l{leA;4hm2;vU
zJ4=g6%us!u%WGcNn(@qV#4csMe3|pZ`2%fi`^n0eGm1sVto=Wpy{;6)iqL=O6}kD&
zJH<jz*{px5&?G(@uBPf4#YU3Zh8ea+UfG*QavP7i5A)BqQ<H?APt)JtMDsFew`k=9
z+)DNw)3Q6qv0ZESJNqT=L9Kuh(A+Ed8lLqsn?^M*DXl1(X;(e}d-wEf-oSPq%1$5Y
zkk;qf6Nin0`<dR+Gi%BH;*hWBY*$`H^GSu8)Q<MoN^f1cee*bD$}GQ^CiE2rxjrbH
zOw(;Qz$Fk+0lEH96)>E^?`<R(mQgAA`^M7<xAciv5WHr-*|%uAB^dUo+Rxnm9fJd@
z5Z)B7)Zi%`+?g(SaCAhFXO6$mq}$P0xP3Fw%UveFvr*8{Ag`?U;lk)haaERV-`4pd
z$aPMLv?gQ}*SF1a3#O^R*d_7t4Z>5U1j~7P>FmO{E0=Igx(x<*_-VKWDUUs=n{<te
zOs;LwQVJm<VNvd;6keJB92OsM93~<wdoTKWKQbTgQAx`KF=~oL?TE}40DQ-XfuxxI
zyE%aJUMa!s#0N2TE?azgM0z%d^Lv3+lcJxr=x>Y->gZ0AOH}FrJ=g;on?1W9-N87=
z+ClI8I)S^toPOT{Ff^FtOn2%>ia94IM3-t&Mn!0GIp=fvsb)T7_3SXwqdi#x5`8~f
z6_+`B-4?LE=E%@Ft~OrsnxWU23M?A^GU|)E&~L=#Ck9ZG=KvhUneQ1<`n%vA(90ij
zpUNoksM$Aa!iKE;1r)yrZp{`m7>L&IsRXqw-=o^Is4Tzy!<bJ_K2BjtXo)}fjDqgR
zH!XbmHH{Dm^`DV;^UFq9X)5*0KuV3l$D|~nc0(lN_=EJm0Pw|=)^~^6C3FUZ{gmaG
zrqV^6s5uco+^Um5hWF51DvvmP2^L2Gitr%uz6kE}oHyWixq|@EAzqsD-Fi0xvbFI7
zXdS}p_zkzuDMB%uGA|fst-ZdEQ$0VPG1jxlhI44P4c9yCo%F0-jvtlNq&%bo=p0Q-
z2H(*(J%6*7=i1#5&pb$DogZq7y*zF5kd1&t?c|}7)a6P?E_Czz7c=@-{`ToUhgrr!
z!3E8EN>nzl4NiXrVvg?Hy;QiXnXo<{^=w;4ldG69_`dIo8kga>H`VG4hE>{2mEn<%
z5uDFxG8Hb9^NIi}_Z+X*#3h9Hn!vru&w;wCgu6aLY@g(36?QXt6E3LU1-s7*NIF$=
zK6|cBLV0zD&msy*zi_yZNS!qtz<$5y9$@^nSyIbDsCoK~K-5?X<xBdadLr%B`GEbf
zxH|j%`yytm;q*d)O=8ieI!npPhL$S3J;9W;y&v2&d<K|dc(nvp5~!79ngmq>RLyV6
z2*s33pz+juGY;XCXT0-*yXf(ljI3@SY2b?cDk%LzefcWWw-w)jJ%sfx)FYS`wud6d
zR#&N<jJ2LqaWGH9A!^pabMb|pUuoQpO%AT1f~rF@830n3p{-h!ZjAY-i~IPq>L>b=
z#|)?-zFA%hB(G-$2oBtK6`ZjEOA5<-t57fP@0+A{H_F-Zq>Z&eMtOE)`UQazaKhiy
zAlEED2T;0QJt~FoO}Kf^jFLb<Ru!;I8{N6PXn1#rq|r&wtv9L1mJZ-hIq}g6>y<|R
z)%)?(g%76F!KD|T%Uh~$uJ_O<0R7TXBdVBn94G4(xbV$(`A6&fwsRr}9hYeR;vV0b
zWEx_74>TjZ%SfF!jz|^Gg~Lp))#g?j2{9P`hwG3y=Sxg~%CTLS_Ba9UZc5IbeEAK<
z$`H)Rrr?+CW1o8VJM?9mXZwC>Z3r;{T5<8B2!-E)rjcd*W?jdwRQMN9SBf@oY0+|B
zUpf)TqP6#<If-O~W)S)Ifs&U`N_8k2_6>T26Xdq%duh_9M6bod9oRbXi9vOCI3cKN
zE_xTY1zHzhB4ZK(JIzE3?C1#J#zj94Pmc+M=(l`(<MrTpQFc9qgN>rEEPf%H$;-Ti
z1=MK#%`p(?yY`wFZL7H@vM&Ii4iQvBl|GUuU|bY?=%<#$daJJRzI=s^5x>2;uqsAi
z*d4p)Z=c7;s7nK2<H<bwVDYic@$Uj@xl~9-nuFpIHNcdnIjiPN!By3;QnI!rLT*b&
zVST*aI*AhD{-dQNTI)*YnnlTuqF=hBR^t!vS@Fa%``omAWzUXXGwB86{)&~&r<Omw
z@V^jUw`|*N>ZfMns3N5DWLk&RSfV`7y#jT6EHn21-gJwJV%rpkt8^NRq<IIRsSjyu
zfv)W?<>TD^K<{&4EIi!g_Z#A|oHM$N$s1Q+-)K_N4pP0{T8O7{tjzUl`K`yQaaGPZ
zt=)g>C7ZzHh5q#Y20Axhva9wHJ$;c3Bu+lyCM@OQDnwZvw#0p-daSGFo0h#!NM!8A
z<&ZcTXo3yR=pByVF8y%!OQcn09%B6BG~!M(_jHBc@fLYNZzpCpt^Yd2ufrFN^!*8k
zd>tsEig0*3ZTVR`p_jtDiyDQfPxhX?)$fhzdO6&vpQ4&%kyj0*Jqmr!>2#60hMGZZ
zCLK4Q{I_R>cn>$qd|$`h+n=Sq0a#wDJom%SHkrOLU~zx8bc{MTlMgs)_0P*XNNp!2
zaH(|t$jw9hCG+09(Zs7;ycl-b8g?Ceh!<$@#M1<6Hq^#aPnCox+?m`bEQ;MhZRUp<
zb{^g>sx;9EYuFU>?RVB{W0z3m_)dRzBBGd8Wx2xmTjC^#jI76S-9LL`&U}7ZHc61c
zthq(>CUg0)^!5eo&p@^HNMC4h)puWLja`rcT_=BVmqL$jG4r#m+k>+4a%+KOsJG6i
zg;dVw!}w@IckL7zM_IBeL%77agC48S`l0ru6qKd|?=xy*lCn;d<KkVLu^=pr=9X91
zKFQ6xQ#Tuv$@F7nJ_JCME~jraK7Zud-ZgbB1nJ|xcZhru{Zoxi#*k}2QgN1W)SX|R
zp5?QcECkPm1_3wn(KC2uZ2cU&$9BzE%7tGck{3{mB6%Mo3Yiv^idj999G#Cz=nWW)
zA)}}(koKVH=QhA|P48bi7Gk7hTiJBAd(Z!ohvjEBuY#&Xr9Cj#<B|;7^$zzo8177Z
zlo@F%wGx--!g*f<()?dYu~jXEa4iv=vHTz^sbRx&f2yxY4i?lOey`fme8^5PR5;&T
zxYDq;6a$<HfoCRfV<9=#UPjK2twsI+TYn7>LW|Z`R(9i3+W}!dlYAzm?Ov@zd`Rf{
z^)Q68WJmo?BX;5t0G>mn!gelEu9ge;sb~3ZKQX5nZ!(pdph<zrNikGPxVjxi1v1TS
zF8r|u5Zew<v(~MiJslIrE<Q_Qv$C>&HTKOw@1&tjrvyZjwEyF%n>HQW=#+(GxpZjg
z4nJ}plTZ1LQPKFCO3B{JFZXBCAIA&xSKg`m0twHZuNL>swn!r5e#&mfNqj{t*$|mu
zX~RAu>*FklwQ}k4eRO-j^`4aY&`A9vnJ|e&_N<BKEMjL;r;^IM6oa<%YJ7%?Y}~?G
zrL;+fXYt*0wpkw7=L(bqS_$j8<yNz>f@f@R5<%2+0QO?huq@EysH1qhRX(mNS4^w;
z$X>J^!{)?qb(OZo0J&wd6z_8Gpprjef9m+Sh6`|`Rn44hJ(KS7^M}#h<UhXFh|)Mb
zUu~w70{b5~_xYv!y=2B8a46C|qDZKsXE`Sj4&rkzOs^!M1mDVzoL?CntPz)diygFn
z?DlPM1C~D68?+z=6;>d)Hv~paS34#uc%tszQfzAGJ@c3yFiJ^MH2DvfW!AZwlvzN{
zGnpPp?#X&PYY{sSqkT(KU2jCPZ6&F4g&R#cSV`&>jB8IxK{f3Gi!gG%d?wx{xPST~
zs#llZ#dv3!a|0W&M7Y>WYLN0?3)O=nl>o=Xy0SSRV@ODNwuzi7|2CUOrYa4;?D_sr
zXK&}#K?xX#I*i6ycGa3Me&)8jU(vVkE35T}vwMCsdc2|RG85@Jbbmj*NEgp!TFH4;
zNRGBG!Ki2S+b4`xC^3R-Syg_U|F<Grx+1fZn_!|l?|}2gA3k*#rz$SzqtOplRFP_;
z<RtreW%(5>j#nE;Fl1!N>OQ<{2G}yZ?gP^5>{d|h{y}@ExCCP4gtXS(BGY#l-Ip0X
zq6`&VN8W3xQ*=H%Lg-tnfEIS8ezAE7_$D$k-`HkLl_|`ivXyJEFa%`2v(HN&&q~h&
zJdaj=e-caOSHSYA%B-rY$D?n{keS(>y*|h5$7R^Pi$rnPcNjJ56w=)`{pcXvnkCEd
zG0fvDcBiSf`WQG+d)ujYUtpK^S}2W%&79~#+a>BcvuKqjNrSzKm+%I#&MkH(VJP{E
z!E)DZN#id-HK^ZLj=kM3^QeeL>V|uc$Q{z?q~=h@QunhC&X-l6nhbB;UC~TDu(@^d
zftG4<!f$4H=WgaRt7HS~a|QK@$O;V_lhNfsgmSHqhd#+TVVs_mV@%^VomW%wasrsj
z(4iS`W>5gAQQe*Nyw+=MyJV;;-GUDyuCGIo7rFCz+%(m9vt1Y%m(J_mtFAs?`h`v9
zA+ElVqzRyu;%}?FG!hdQLcqv19R(&fgO*z_;}T4VK~vwlIBl}E2LV&YYkHvd4OTHc
z59!A|3QLCIP}kW_SR!>#u6wX~2RlBefP_EsOE#Mr?7dEW%?BL_wAG-VEP40o;jL?n
zq>aij5c%(S>6C4hU&trT8)AZsKlVFoN=A49cOa0yw<`q@2Pvm!4-69|y7bT6mYS{P
zilqrQJIDtQah<1Ccx9b0#57jkQ{ciO*WaY_`E}DpDT;G<&#y3g<dOTMi_YwNzTMSE
zb>7u1taR7(w*8~kREp8_!#5e_EL8mVM{7Ug6OP`SZTLI2h2dHOJ$SuMd`v$*Mvfyy
zSVI}_#IF*4;~4c|GU1N{%Wo$sV)oa~*=Q^Za?-SX)GgNES0u9TI@&pg85t`Scp2C1
zHk;HUD;*|%>l=<W++(2`4h<+XYk%Ve)x~o_-)nI}8uRrJhFfJnW}KBz?FPvYx0NYr
zFP!I2==hD%CB?;yIXz}Y7d}?yF)AMN-IA9lH#NP$7ybv;(H_Wf!p6TKBR$=ahPS4t
zxV2}9_}J!D?;&wzIxfFcK@gaf9jj$u7(JP=(&Ai~=J<yo`?3Tu89!OUea=XKRDSd$
z?RC#5Ma<ndF_`CXZD3^{^(z&~y54!lv%vW`yObLFFJ2n^s>g|V@f^`|Aj7C&2)$u`
zm$r(bSsEQ@`%*1JA(vmNr~F6rm)57`lmB`;Hi;7y=lW_|pXMCfQde=j<TEnOV#@#6
z0X*Nzji&d@|M2p4TmI{5fNj5H-?&rRwB5t@xSWm;ru;F!M1p+(l;*iz`Pa-Q{V1h<
zx0~eR>1S_kfzAjOEjND%at?eZ?k;+nx#kr>ZfMw4YN+>@t{07l9CqYT{+tRu!z>6G
zpXL}Z&V9WE6l94m*8fV5o%=uJSa{nc?oObV@^0ldmmpdywYCbwlw4Mo$SdZ<W|EK2
z`-^+xRJp1y&DjZ%y|WnBA2{K;yz_%jaEHM*y0}vHaS!VjKL}*elh{)DL=xAE4_<{f
z?wX@esQaq!vz7YgAo%#S*e2gevu;l6&O&YiQ=TnFwDreaYZ~p}sw`jxPEUBC0wCrW
zmtBM*7i$rBLYBY#@6EVlukYO9{ve>~(`(F?zV2<4w(<%Ibhm~IuLW2^#pI%0q6)N5
z#fmr8{VRjbsNVV|bAspupUgzd|JKM0>c5^B?eHjAF3`I1O#UM<lKf&8&$xX@Bl^OM
z)hBMjk>3`@Gv@${B5gShFTE9G2{47cUKCBw!2Emi;P-S+WKjn5FX2K*?6Knimt(7Q
z(U-~O08dOYElps5j=<7U)k%mrrZWaGdsC^j5;<n{`JBPewL&3kY%}tpU~)3d2L}v4
z^ltY~;8Y&xI<zS)mc2zFQI4wM{uS~IY~f@w1w29D*WbwW`M4)Y(Yk3<T%o%6F!Rdp
zJGb+4pKFdo@j5Jue!Iqs{sU80qwv0u#LM6N`dn^FUsaJ$1^G3u{eelD^;Rhb+xZwo
zx|IzxdgjJrA5K2az*2qMbEOGbI%2o}`VaU0ufTl$e>cjyk=uS!_Z=R1=e3A4otR08
z{U6G0j()AwLHBy^&*(oZ0Ux9uktL6=He(zpugZ!t{EBCgSG=bAO<lCri|?MEl?<`8
znQ|>%YLQAYPugpV@_=u)8RxSihT@mcPJlVuM^0gqFMWTL6BS^`AMfD`{q@dSfoUx(
zn5Tsr;hrSlr&uZ)WuJ9?s_B*b0h9FTzQtLo(9mn-*&8p~-tcXouVKzTc@YfK{3+x*
z{ZSp*pjO{vofEt#OB}M#g{+1jbk~l(W1e$(%@*))<|bZAf~s$d@PVq*WQ&uo^3Qrf
zzMGntNW(Y1mvR6nE-S4(csb?NfuCyo%mi^8FR{rh^Wle^)kbW_naJk{j}(@!yfF;i
z%@&LmoHX#Dw&RQCNJ)g`CT+=H^xvg;<%N_X;8H&*sEp|xyh;sGH~qumG~TF$a~AUC
zWbNg^MC%am*^Fr?8uU!TZJUBf_1T63=DpD886LK6OHR&VHp=?w{pMD4>IW%N3+H6+
zb;694lgHyUJuYidk@>%-BN5pm<v!y2ho=UF9>mf+>RPZ}u3OTAJ>ka}EQ2>`D1B?9
z+<G5$8F3i+o~LLQxY@v>wkQTg?^inIdwX-RmL65}Ep$PH)E&o+N*9)yyyb2u*S00W
z(wnPi5HI%gjSXD7O>miVg0{`PwjrUMYt-(S1ZY!b2X<3NPM*B{?@g~>f7!Tya{TEh
z?^@THM43nF%;{5zX}Q+fv(Tf=rd*E;77}}_O1f~+)0M2*K_NfF?Ly}IBS*)al!vbd
zb(TI?n}-(|6*~VvhF3YzzlT=~T*m!JLV@XJW^e<Qg`@C(t=BR+sv9x67_%Rh?UL!C
z=(^Ggk|!St`c8xI2FA(Hsr<t&0W?8cs!oxjB=)Q8>g}RhJHU}x&Ai$i4f`e|JjBTX
zXdw^@(Td}Gf@92$PchWbqk$6)zNW^9Ogl?M#S=@hl&en%qL#a;&+cPoeguyRs#w9Q
zv1*yHZ;6#(u;-eYt{ihd4A`VTYto&g8V<J&;Y8>8ZWuuyh4bFBr7;uDoLVlT6pk&q
zHClgDa@8b1qA=oQ_$p8fDp*uv?)2lPR%U)lC;M@c&GHM8!m^-dph|9dO9dlr@k%<>
zM&>)<G-en-T|mpux=mKp#QPYr#H8NOqb7H|r?k3A*#|uAjyjDLSbqgh+xW8v55={K
zxK=+jSh42hGDl)tTU!T!@po&Vrc?sU7>UPD`d2^V5Q@=J6PKNghqVs<ae*Fi+>M06
zq`}_hhgCv<@jqB8Rt`whfN8yPk9owBfz;*Qfs5e^6H@9T<t+Ow^Od1CyH6hJ{^6V8
zVW5A2PFMRw-EtNrAud6=xa;|Zcx}8``d@#fTNJ0gu0lfQJ+N*AU_4E$HYn&3p?&c%
zhA4xX^jbxId0_lm^Ph8we;(EG&wq6y+Uiv#w|qNp%K&d4w+MS68Bf<MlJ*C1;d}vZ
z{v5LPX^yLpbNr10>maJ>ivCY&&T@}E7b7uJ!Z|=D=KG)j{7fX1?K|#%m!p;EPca$y
zg8|i2;6Nid^jdYMcB(k#iXl5!y<HgHxj)ne|K~5x7yeZHIdG{r+pd?Vs*z<HHQ0qc
zjgzgmQuzJhQ|zohF19hCyqX`x{^R6>e>(!<zx7LAFvYCYg3{>I4X@sDcNgptw-6MV
zkT>QWhxV@32Ol>#?nZLzO=V0y1ZD(j)(1v`Z%bP5kXtK_7|Xe2$NPCo;dQRnp@}O~
z7f9dpc6XG~U&Y$L48VW<u}zx~_#R?*Z#Db&n^BUcpwokixHRFMkmR5-0iF!hN$vu!
zB51{O-ucI_-^9w8D~K@BfVz1q@VvixRtnT#??Et!t+HQmGRWJRc3W5psH39sNar2g
zw=@0U<KX{{lK=WIl^19|J8;@;Plda;!1X}uNTX77MHsic@3In!9+yxop7HEsKs_Cc
zyxQR~w$^G#uv}=k>%LH>uBWeCOhcFtMXatqxw+Vg;oNzBNh^<>bdA(lbv}s70WX`(
zCUHjVU&rr%{>gfifl!m|wJX<0&Jlm{qZ<Z^P34A1@%u+lf(&6x>747Kk2|I&;~HmW
z`*IKZSW7u8;62YnJ6vr(?}il3XsTCa!iN(cya9-JrzRQBXH|lwFDQXmj9z-2^q;@;
zzkak*oDTRpU%1ARA9)}@Hi7WjscSdV<Sv=tAD?*8w4LYCAuZdNX2e-|jug4A8UAy)
za*v)Hf<rl^&C%Mu??%TsE2WaN(oy{13fF%g@9~c(+g@P?c5bTF59b6G%+w|1E63Kx
zr2XK5-~y7&K))vP=Q8o#YJPk}RJPBe8kz}5Tnmh(nq~pM|ID#m&b6=Moa@~_A#9ia
zb+Y@<LY9o~GZnCV;1}-6_wQTpVV|GkScx4Egq4@`ktVsA7xG~^P);!q>U)$$@}D0h
z^=FVu`0sd)Z~T8LUVHZ6S$Y^H2LJFG8^~@N1BM6@7_g#FcE}GOy`v~zuk@hf1}Id}
z=y$Y;4Wq*-ey<FN?;H+oDFO6=We~KbZ@;f>u>hmWU2fmiC6~vK+o69v1^J?(h<BN=
zQbk^W8XzM#4&8(HihUZmHDTpQ_|Y*8Q`Xkg?>eq^+_UlRl!OAO=j<7FbA^)3W0drv
zamIOgg8Ac_FKZ6InFZi0w;5emJ%|KqbTtTPyfd!^^?+=<_th4?iKzMF0l^qRDo9#u
zRX108VNua^J$sGbOs%|A66Lcqq<A57^Hcjf`$y1_luUK1#Nq9{Ai@o_tYm1m*7h-P
zfC?JtsG^tccN&X;LVV({DiYnH(AjgAzpoN2xYhP|_#~>$;Skq0*8R#1aHtK0Y^(1Z
zYnF=cD8l|;nTdgX!?PP$m}H}AHhLZQ9w~{PxiL1k=Pm5}m4=`dir!i<nt_2~9=o31
z_6X<Yl_Qv9*IVnLsYHbQUI4UlKk`~#f^xuek8p`*59oPukhRYa8Yz%_!s@&ENySvw
zeJZ0&M*dcQjxRE0EP}Xr?7gNJuOoqfb2`+mTpo6s0$R;*AriM*kBy3y(5tiS$H&$u
zM(75~(5W%}_g5Qq9Sf!YEqm%nM-}*;oduX}DBvhDQo^zu7zxi}dFuL<<nXVch8Fl!
zi!T`BII<iZ&~W-=0{%%Ew?A0y8Wvn`smC3<Wm&=s|2c)ck9nHw6<TYZxsqWpQ{M*c
zp_vO$6#q{3<O??<<&a{kwEMySqrY?r>(8p~&=I`&n$t;P71!%0y(t7(&};#*`6egK
zeagYcBVDpn=05+QMQFDXgY6j%Q49T5klW|JErIeYQk>Jz#%H8m)Neo$y%I6>=y<Tr
z$FM*I;#E+iDwqwj7YH^5;RnH`F!&a)&eqTNZk6@B=yXk`+x|9?Ox(=8Z~iHAqV>I)
z<c&L94WE^N9LmnakJ}TA2g8)7a0%WZ$ML>W|7_GF-=Xl#{;O&GEqiE{F%4G80yw!k
z7x%5Zn1#5_-*DYM>mLbNYcn3>5AV%J96wnJL+DHdB6L6>cZJ}2QVGyHS064P_A5dp
z0AeKa<=Wp#LP>2RR6yaq7^L&De4YyXQ&>r-zZd4TrB}!sOl%rEJbdeh#HR-B(h~-r
zc>Ut1DW#v^FC2-R?XLvtW{lJD*(&x_&h@gWJP$(a(zQKf;$G&0G~;39(aK(+tnVy0
zxX5pN^2*wR8N7a3dkc3-GBjL)z~f(4r|c=)*Cf0P3@Yw<!J3MRt+*oO@}9MW!KQMZ
z$DG49r7YO^7`_lXHn#flbeolEy)#!m@zwyEW6qljcA40^2*qPr$5L_$Av5L>daU(c
zkf!gpv}Rculo0RMPJD;&3Tzor`8Dr@IQ4ZMzOAitXpn0}Jd7TkY*a|V&Ti!(bB^n)
zPy4}8696q(AV~Snt9#C-Wy#F3)U3?>eWQf^O&j6Rh2xjOC5p3zI;3dBIBtuGZ|pai
zkl!nZ8o`v2_f2JE7*HNd`BB`TcOmU92>vLpk72l!+%jknY+&UR_GA$|a1Fl>8G9)1
z-Xy~+Hs5+m4IqoXSSft+zXH_%dBp%89Xk&!w!)p>MH~}x%NxC%2LJlR+hA%Nt37oX
zJF#LQ58TtHbuNAH1Upeu0L*6<eQwOOYp|Pt%pObWc5f{bgIp@kgv-v?Xteyg0yRoh
z-X9#xy?qky$5MY(44GODlnnaRxcs9`m&U(o%L`d6N!$W5G%!llV+9t1<98CO(DRs_
z<1$Iymc{3CCZ3}qni7-TgMb-eg-_#yj@Tt@eQo^KQDb{N5P#RL2yocO1vEdVm$@kC
zK+gBLX<pu6AKb38_FnQ!=1A|jOGUV&)qZc;*rsIAt7|Q(R`dg*qh;QiM`#C3VhHZW
z!Ok(HLgq8bajP-TcZt}z7do~%7!;F{{l3aKEV#cGiGg5Us+Vk7=ZRs$#c<`7&7)@J
zUjS+dWx>N<e%%@fYjQuHbyU_+I$;VMoL=!B@^eqn!C7~b1C?Om5^%5Zzk#aBFF27Z
zLFNU^7wEyz4V7ZaUYO!m8oc4~-|Bdl;^w!gGU3}tcYU@AgLCIB>*yxtq^#=lC()fN
z9&~?J1fOyeph&rqhX3h}PPPz)dwzg(6DaqTgeSgb6Hhq@2Lo4n5q42L$z?t}Kuv`Q
znb!@sx^Zuwkqp{&MXaR}XKO;cMsxBAhy0Kvl!;?Au_M<o_vCOxua-u6u@y-@h$(9n
zI>K2F2Irn8LUAhggP-4<?I~>3BJ(I^XHfZ+X;lP`=S8{R-p**rP>dL|8MOc&3|;Qn
zC_{{nj{C{>!B@fh7Ni`1lokA|v3k&C;dG$0@IGXe&;Snm6dWX;FjLWAMcdlJN6O=h
zFSRZHHQ4*Fz;ir+m_r1tbf8}dk=vTtxO3R@QQp>HJ1#A5$j&WI6+*NEYH#5Bx*84G
zocL=%cIB;^{|&dPdm#S~DcL?tw+OC3ujvW^QW4iuNj>9fj{(GvcqgI)E6EGzn-KIP
z5HVUslYV>hdknAi(5I_`djw7NCkVE*#D7_Ur!*(zK&wt~E}U?548h>i5Sq$IgM~=$
z-GI+QDA#K6XQ(TYH8C_}8V>$yDu#79HpD*YB1u`ADoZ!FkUQYec!kqqf$|-|c?l2j
z+;#`s4>r)G*&NxUzgT3u#~jL@LJrh7nu@xY>vyKPViy(9Q2;$pt9tRXe>)cEzq(5Q
z?%EE$2JpOWd+niU6Q>T?f7^Y`a^cs3)dfQ2DGa`bK>oB`5Va`sxZ$=Pxs+wXk<HxZ
zVCs<$?RqE+nR{nh=aB-IfZxS0ej%Ex5cYZzz-caxMg9BT$|w4_6mQt~+HVlG3_=Ps
za%bG9&D_(8i<&Cs%11qe8466qQ5Dl7<+c4fUgF}9vas@2pW$N!kdNR92!3^ATo%b4
z_RS7Cx6#VuVCetd0o$#FnW`Ij2vs)04|w@k`pv1abQvh4&-J38Iw~9BclZ5ayY{ku
z;8d@m_R$>2nb3odJ#&Cq80U$KAQidCd)Lp9ikw8r2<zV}a;hw(M)l?Rh0oY`Ft|nN
zTG>M7n=P>Y5h(b0yH?}rf{QhbUB<7Ya_1#Y_W3`r)4fNs5Z~UiFf=DRoC%^Gifu|W
zRn#7=nUf+um`bXEQ`^8xW%?kiE5yfe{#KU`oJN{eq4LSFK?%sp>nVp(!_6rvVlT+1
zJO}$>JIxu#)f@a>+n%l92t_zel{p&K5B(7IlNYb7Uoy#nI%N&z+5cHI?Y993fZOX1
zrs^X(t{MO#F$bqfKL@%jf34L2eLms;sN2aPbvZ&c?;gy(dPVI!!lG}o8+p=rk#V+J
z%lc#&wqA;Gj|A!hSA`nG?*ien?Tb2YO2etP>~8xY2%+@jJ*2v*v<M{FnO@LSx%G6*
zGR@qO45baQP+~UG+AW>frm6f%nNTt~^+2ddXpD%P3+{#0ESPZz&&(8;&-fLmwIJPm
zT6=&pg0TTV>D~e<hmkWD)Ff1Gt&VNvlvH4LY72ih42Hx6{o=*tC~-I0g&pHUJap%e
z2dWYLG`vsnaUE&^hG(quXQu?3;E*)a&A&-m(2;wjgYURTBU(;^RZO8FbC$Ye03~X6
ztU%aJWe?feTKKXtpoC3zNRc{=l<Da5V2f07@u#Z%4RhW{uJ18ox{igjgCg;tk`-t7
zAE055S>}@=_zmIg$BGX=GoVy(&|X9=h;W88ig4ysSoz4v#pqWF$3M>k@bl|>*WjDs
zmcH=CH#2Ai2zNZL0|Pdv;jW*W_NC$P3Y*bXCTzYt7PC2}@Wm<ZJ}&#_kq$p71(j_y
zFFviCD^fY-0pvC39WObc4ejPXlCUQuL5gJ2(7!{S01j1tfIHE1x>nWbNW^21TSSaI
z3tCH9*-B}tO4!^X51x8D(i`SBK-`NWRw=A$L7cb7Ng)#$>+<VQOyP2vkHN-+tv?O~
zp%isjBADb2Td=d$V`F2cU#H~U(jnc!1f$S>5ZvW47Ed#8phTQ95c@Xe*MYkRoBcov
z{6~;M$N;Eh0n!#)Ztc(fc)P9zX#qDHR9^X1_Y((evElYQu^UeS_FjV|t|{o4n)mw7
zp(JJKYCFu5_y2ZPzl=TxG|NN<jA<=o;YIYxtZWagYhisnb(lCq#AgJ}C`#VkkaeFf
zRtDgu+gu|F3xkaq!u}+a;+1bg7Klp*r3N9V#Plx6Q4y0l1pT)A64%ZG9E9%#5mK*#
zK7-R$R=_qTVT4#QJuXQ_R3Oq{hw%8@l{CWrmgQSu8Q;=YI~#BUsMaO5pN0k+uwyxP
zWr3J4%>-;)JP<Ee%cD*!BH5bIHvUI}NPs_@ytoN6tY72?dmEIcGoXMotdVpEis~dZ
zSQGj^f;TS*eJH$vi;EZr5Rm$|br%^40bMaWz5MqO&>a#28hUic7aqLNG*&jKEz<&?
ztW*pA`2x;#4<3qTM4y=CxNbG0;~_;J{xkM*J06irn5slm0CL*Z<&fb2!kYhXu?_JD
zyg$2Wm>1w!fi&dO1%y(`U>J~_2$1XXdx42f#TKoH)bg6}mi0&IgNf_{QnsiIsgmhy
zf>1A)7!Y*OucPo)@mjoAxE9{hiIz=wm%W^p!e+M)9ELT-Fm!*R^#h~Ip&?q<F{>~^
zUI=?7W6$bYNl-uMm#vqCKd_?)iW++Q`jcUY4p<0b7GByDO^4oK!U|aKUROS>i~u(C
zFLB@B^?Zx+IL*5T|1rhDI5Fg#IyyhJfpdM&cd)5sLuso-n@GWA6I6|p->X+8l^E4G
z-cYkT&vT3bQ!Gu}GRpiLB6Vsz{<|{%->&%#B#1=$K&J%x5FA!?+68NMy%RQ>d;7i;
zzC?H;5^_op%CD$D5H%UZ*X<03E-fIMBu|pA!sn`B(wR<k@pTqNq%88GWAj*6u8mT;
zjl@D&C;-SC>Qv0xvH@PU;v)kJrf}ft`|W%b&5{x>A5xr<#_;R(QU)AAsBnai&HlZu
ztybY#OQm0gW1|$4Q6x6arm*z{xH&L<<hgcitsSAADa<Mqc>^S6r>n153~(E~#Vos_
z&5iqAnPakWloEPp&*lYlJaC^|XyfSwa%vFrzP!Lk3H55QrcOBk@o=LwR)WxaO%Yiv
zfFQLcNOMh|{4i33U;!uSeZv2on3>19kVv4X33CjnLREr45u2Sy=$=ai?0hN68CJY%
zC~Agv>Fr1+a*&9v_Ric#Yx#FH*ZJl!LB2;Ic0By!rmO6WPGJyYW6Qlw6jRvHUdcwz
z(Zx_XKT=1%eSuw?j|4W(t9_CGdtk$r1U5M4PGn|b;9P}Gy1`1$(7_<|d!&Ctle&9b
zZc=~!UYcIR=~|drOB26Mt|iQ){Pg=P@I=%R`g^y^Tv&CjM95$u*f5Ga=(W;dL>R5@
z4W#z86tDWhm<bQ`urLsRwjYF#-;@ji+5iK{L98~6hSxi91ntpm7h6*OfO8$z0}2oL
zal<Cb(lKo4)barCznQ381-B#2955U}eOuKCbujryczmYK8=opy5B-)yGqAA=cIr}t
z_reh86zB-%I0@1gnUUIqg_lFGIl_-Rk>3Rv)!&#wI+~S?ygf-wNz3U|Nz>{ZH?BCc
z!i#sNt#IF);>k#m*0SR8-rr)_m<@oevhwiS`wUV~gc;wKO%FiJwnCO8_KeHS%S+>l
zunDWO975I&_ZI&wfJGTAPmntD0sZnu_m)-EZ73gw`<G5lxfLL(_lUyi!CZW@5@bC#
zr+ha!ccr}l&nxM@AVt*0(4T=P!=Er?gN|<Gd?cJO@j8`7t?!My&miPCtn(yVSB)(}
zygxzbFr!hx4%;10G~5dqq*<NmhdT^lIoJP@^%T0ZnkM#-li-z}jq*pt<5iPELx62_
zi75-qUp4s>De<=UBj`7$+asL&Bw-&8V8c%eTjhJk6S$*C7ugY+r@6TLlrhR($P4^C
zKi~uz0-heZTBK~TGuzNx6FA^(U=BIVqgll{sS~~1x|Pw8CrXgvabGd~Aa+(qX=_Zl
zST9p%`muipE=6$N-4a$}pg2KkI_7SWQkR)sCs%|3Y9<mM{3dz{U{}`7r56;4ucMUi
z0<}F+JVZUTV)-(s`^5U?sJXynk`|O*@JapeF>&{SsOP0~`D8HzhrmylAl4NXExSRr
zMy>p(%Ets=fC#=EwdSZo{4`~%qNG&53uMhQ^p~Y{Xc*8ABY{Ox5$#OJ06qOgnOH^h
zqyD`d3%JjQVyQZlywjLRurpM)hG@Lpe1Kf|4l9G2`?vIZ4ZFINjDa8a@Tw%P89A=W
z%^qiP>;o{!#_)!9g<8ijo4KR(0tCP>mjdTOHQ5oa8id51#;OFr9^pKMNO0nyZ$UNk
zo~Ur-q<vz=tVp8jECXsI2e0khCk-=idU{)exH*UbbkyPmIh>Sl)6Bfkaj$}tqQ^8)
zMJ;&>x+qDEvZz*_@ZYPVIzYV7B-<-qV59s~{j-;16O*F?R+D9obDj6fLc+rOnn$|I
zM!cj&_mB0HPp2+TGHEWYW?m6MQ($ra@!w2Q3jpcY3T{6%pisK-yWQD4f8BcG0+9AD
ze*na$pU%!{q^?79$Lq=A->FuWZ%MqYF^^JL>++v$2lS+*vX~5b*Vpi!Y4M;((^p90
zrW4G?uJm`ZtoT!sc=A>=u?iaS=amx+6BQRF0|?$_aFa}I&O1Lkl3F&xqj}HZ@8lw#
z_awD!ZP<QWEax90b?({Nv%q@Ao&c1`hoVo`6u{cUYr5YIr~C~nugzG9^!)=5*|0If
zzmX$+xv2dE#mR1`is3@T&kHOa5xj?FzD0^$Gom>LkX;Z09ERr{J&I0L(Q<zPuSm`H
zavJ-;iRB(!UtqiOk0_LpI_KC)lDX12<w(VFP3B8q)ZfvF-!X=(0Z1=kR0i;C|I->+
z^-M(C_yU_c1@>67*cIAjq^GM}9Kks2WXiiW0g$gR&M$cPUR!UrNj&A9aA0ONNCrk;
z3qJSX<GvRD1Gwf?XQKK44t?5oU3h3KGO%AC+}Bw+3pA!BO2J3P0Ml$*U45gM>)NP5
zco^L_Nl%*oqE~Ly^2mL<ejK1oX2cVV>t)nlXj9BxVDokN<LqA!T8YGTt_{uub4dTA
zZv4+Duf`TX9d$b}8&w+ilwBh^Ew~jo#xiQFT~LJ#O6dDA!OH8jZc~k<lf}x%p_T>X
zpWm}Pcif&>|B-&9&zp^+prYUI16Ls{AW}!(2>yE{X0ebIU=(r7SZMOko%Tlgu>iL^
z;rS>eEL<wE!VXwBwg0(1!&wU<ZD(#NDLn;-vA}8I1JZ<5>g&K4RFBU8eC%F_4AABD
z>cFKlp6mEK%|!U6ySBhd0;Id{U=!wC!oqSEuESplv77AVkhOjd@^iRX4pPa)`e9@^
z*BfM-cm;y2-cvO`$n1^g0(NN8@Dqu@m7#9ZovX9sS$NU{UI@cpLuJa81NZBwc$l%u
zc8gB@LU?x5`q+56qVC@5%vw>Qkk5j|!ZXqWTxJk#vi75De3aQscTTp?v7m%_+Logf
zjK~2F9hz^!A_#cwSbO_5ZBPW}udc>}AgaUaljvx(gNe6AtI#(6Qh;rBK_i_BzH6Uk
z-^Qi?MNHXJGye?jXm%);jj%JRAP8**PD#~;VkIKdGS@BI#O-6U&wI+QdQ4WD_kZs=
zj*gC=1(=`gf6kfe<!#kIoEsfcs2%~lEWtSq4S}_;9x%7$1z63Q#Nof%P&JpOl$1V=
zSG+fK9q&tbJTA|wJpb1jTeXPl%$(GoN5+B@9KbO0j>!*6!?0HHgoVc8&7qMg@5_1c
z_W?5r*)ARv9x3C1#5}gG>s1}H4eO0yAQ>26(56ylod4<SE))AW#1#r0#TaC>J=xGZ
zzwz_@$ixPs%%Y6F!Ox%<bmsjSag{YE!v@yvU&GG+uRqggaf;K1(=bf?OZ-7v>hTYF
zAf{mgST1jfk)cX22<~wWLa6;xc&7TV>^ne~if~V#XlTmxM#Cz0-+(RWssyHPLI=0v
zQLYZ=y}1>uxu3^wpFEnPI*jaX2|g}uz$p0@Gz)zR!*gIpD@=|u*U++k_8nJlzRR*n
zIqj@v*NH>lS1sWmU-w>Wz98GTH(90QKGQnNxYXAd_Xy^9uYX`*@;c97NkQVE-vbmt
zd_JYbH|u$?MEV}MLCR|b|C2^iN<3T**t>5lr7gg3{be_h;DyPSV9@T@rApdKPC9W0
zilEW8?d`XidyiYRcsSQ;krt!<2j4SXSp<s(hZ0mluGQ8zR}d~&+|w7t;8X#q@tuQM
zeQY1!PY{I_+%Fz?VR0;g;cUTQB_g($&%^X<>?gADcewCbKcDMyo-{i#pKibWi$H%)
zbwG7yMhe=5;Pjb;H1wmqJr-J5IcsZ?J|S<~w1x6y+YR*e(&6=azK;>5vqFI_YV&y6
zvts_%Nc)O@Bd0Gr-ojF=(^g1viyx5~QlPJ`yF1hu77G17961ix$@SN4s;vznW_#RS
zan;cl%MkbH9Y20S&wD%k)ruswC6R(2%7T(zZ|?$5HdMc33lfy7psM7z>5c-w)qG!O
z{VlO}Lu|r<_1UI<!}+$;(Li*IOxpFP)JnUsjRAQSrGb(@z(PuAuB9EMOZ)u=0uK+P
z{i%mKeV81!DQPt{n0)eA2?j8tu|>8ma<2P63R0ICTgZy_kpqh!Km;q>X@B<D2iVzH
zKu?=3nb4X>pW$D8qkX2~!MC*`ZaNe?@xY-}xLb6V8>{1%F7kftdjK-u^LV!)qOxi=
z$m{JVANunznAdmQ;oQLOGBVw=CL}#FKz<#)FaN4EcBQv{0A}WIS1yg49S6j{m%e#{
zEsjiP?w$L$&W4JJ{fYcK{Fe&sN0kc?T&OAukye>H@oy6R<-zH>nVA-r9`g>7Pe%(G
zT;`^yKFQsUd;b?<WNS;I=)YqQ^w+X29?G@_kE$IU7HKEB|8=SWmiO~*irBjUMb}ry
zHPuJ|D<PqT3L=sUNQWRPDM~6Sj0P1%KtM@HPZSKg8|h|Jjs`&y7$MRvF=~V`25iKB
zckn#l-&db~|MB&L;qJXB-{*YJ``m{XS#8%Rer$F!U3hYji1GBZ&Ot7N@5XEEVbv0K
zkJYu|(Tam!Zt!^9h3;~bQl^F7^~t=_riULOU!3EdCAf`}|Bt&-<lRkPppkxAk(8Ep
z?b83DVxWwGuu=%D1c4=mJp)TkdmaP7cn$29{)!lzKgS6XfqXMbp2=^UTXg{}P7;p1
zkHXuHzl^u+Q!&c_<4YkqcdU?~S?mEztHAGXS^PgVh*#G~1)|3l4;%UJIt`UvYu!R<
zSQR{LM2wl0iba48&f{0X^BsNTu?%Bc@LV0q`Rq7dfcL75VCL$}Mx)$>C41n%vrep4
zxZ*Uo=WqKNWK{c#?);tRSC1&zd5m<*uEj}S5x;&Vdc^Yaz?}>FHyhjXoiB*rSQyOL
zEvDnh&*!;B`yeSGV7vCsnpmA!#fG$J!(8g*=w#w(fv2CO@xqR4&+b$Oa<NCumiE)T
z<|$wL+0B<Z)%l8)XHkwn`H~=~h{)Lk{`yC8i-ObFN*>dmfBv6OUthC=HP;U#qvgEe
zp}D&}f{`gHt2&oQ$WD{cDxUi5AIL`{C(o=H&;!PC?DqOqtvrq;zv4T8|JCt-f|OFw
zCTt|JsdAj$gW@eBkF#CLmeHy4>HL$L@5k)Ki_ZV&0>FPIH~&~(sB&e+Tu&#0o9o+~
z47T>P|2_!*xoFEzK`;>oBj^9Q%a-$>^sS~AQ61}Yf?4q0l~MEZa?#cdD@y`Ta+>57
z<xO$0wWV=RS&4Hx>+ExpP9Gf}!)t#_41b{?q^F5c=FM|D|9sI?%VsSIrndG>A4k{X
z{JdKD&)FTO?n?wO(?Z7s&A$X2cMJgteMz>r2@7k9k~Sf{l-pMM<YS04$tqpKaF)+<
zU!z7HgQk-c_3-7tba5i(e2Qu_r-J-qiN--4|GKLe3FsVnf;*sqW*;{>X{LWZ_TjLK
z|5xc;930A6^jZh{E}>gvUm>dV0Ju}G72CkZuM{oSf!<yUf_hW41%$NhgSNYMa*-Q!
zpERu+GrkDM?iX=!bE|sAT>7pPqW_OM{9%{bMT+3NRn?PD%TpyrTU&cUt!@o8PbCRF
zi{dj9@~-b~u@xtJir69Ypy&b_3~QL12huSxXgpN17_$VO`mg1lCdm}mDN0i?C|cAZ
zUBT$T^P>Lt`j4CVA7AOasD^E>Kf<bCC;6$)&cVUKm83a+?;ZROR~AnMpRd^a`|Dc;
zs}~Z4`Jqv5Z7SlmKJTvB$k)MzQV0p~6lCZhpHcVl_`JQU`_oGdPS~D*kV3L4x-K@Z
zwHVC*sH9bUU=-h&cnQW3y822n6Z?drkQt`Db|GQ90%lfkk-oid&X=fVJ8{56PQWtQ
zeMw|3psSOnfRic%z8Wb{m6t>CvR{?hGaz6G+Tpp)_nM(;Gai!fzR#Uc?_~&H&?h14
z;Q#epic?HXKlDioSB?Fhxvnl}<)kv|rJs_~yNw^8ykk(ap1$XUY%PMA6QKZ8d3V$>
z0(I7Yhu)a}{d$y%z^ye45n(aWe$+YX3d@T+_Xyq;JFOh#HR(dPVkvd!@PNcyIO4rU
zk<>*Z3A*;~?%2#0S^wwqh8g#<xm3=qNp$*<m+0;UiEAp{Fioo|p|!VtHVc)6zE}6c
zFX;y{?9x;OOzRX;3CV>E36jJ$XeyzC!a_8NS6BhGHJ~<TY;4>H(!xrL1S(#keAysx
zXKx>M2Hky@3O()jF*`e3XA9**75OxHVL93EWmez(C(;XjlC7oIQOs8Hl6$K^!#HaM
z^Un~tBoGs2gYC(J1_|9OxtlKgIt0wpKB(Z%cgjp(-}Zqe8REm)v*aC~n~z+oeM#LE
zVYQ!o*iwY~_#%h~o!zYDO)|jPT;B~glS{WC!0UWR2IY5bKf{@PJnU3gp;BD`W8(ko
zdTw_E7In<~=8OnNuQ7(V4pvj=<|S@c=M>i3ScBzEJe2$__QkEw5|QtbuB<Q}On2(&
znel+Z(z+Dg{gQ`YyVz+X6^pS??!>BR2Ci<MNjD#hyaPL9phUns$gefK=Ckt@6O4-N
zlteGib|Do@(~@LadHKhkyDr8_Ufv^vd?G3SGLa@%r*8Np_k~Y32XNWeSzB9@G5WV2
z)6ZZZ>Bjz%J6)}NKHq=k9uWtKT>}o+$|4lVX4z?h*vQyE2;DDQ`HFB+x9}@<6Xt!d
ze36&v^ghJ{!$CFW22B@N*Bn!I$c@f=C!1=#)DPFGOk#{6Pto09KVS388Anjb*Hv<O
zf#Srj5=bduZv#><(?O*CFHQV^?d1EEP<DMjcgU(tW&ZkTbEyvjFA9nJC*ua?xY(1d
z^8Z3(t$U|jvLJHaF>1M2Y%GEi928ysl55`SKg##c-YIf!Yg#Dd?GtkTJ(|N(R@0e6
zPrw)1O#o56kK<e<q#Z?e9rjWn&tcCL6cpIHVVWJ9FA$xlNZ>GLphsu|W)M$=+U|ZU
zbeilc?F05JzG6%7^q=RLPyMRUyruX1QfB9WA5PJP;x{v2iI8L{p=|RuOR<X>wXn2>
zt#a`%xhWx`VYmCJqr3avV=-PzK=vo8E^c-88IUM`uqDvA#~e$Z!X$>7$b2oiqwoFF
zK+DM!_tg}pkP>=gL;MrR3M>-30X0uZHR*z{e0oeQ=$+qMe_gOtYM2`=?~vS0y%~w_
zNNYgMK9|b24ZkpF5R7Q00_0ui#wc|eB7wiWqgFx-|34Pr0=r<K`d^FxiPyW`i$pul
z|C(ihA`!{#m4xX!=+CFKrw_fjJ{Hiu3pga{3SMmRcHhvmN^7)h@(#SjW%!ZbSFB7t
z+-W&ixezxA)4Y}G?fyTx{r{U0dw^mk=}T&QN8O%aLa9#igQ6J`%8SI|umbw5N!PxR
zY_S?lt9I!$Y6c8Vn+$2LXLXcMIS+)j4i~P1;7O9&pOS0V4`s5k)4p|;ty;U690{1s
zDo?X3&n*jsF+%Az;v5mlLi7xu4jIWcIuW+CiwWVh5v{auBNai|Cn1F~5&cQjBnuZ?
zv@`x|JEw?vuUo}0+VQq&xf62SpNj0c5X{2DlfVew;{IP+neQmh1D7x*M%7+R4Hea%
zzSoY({BiTb+e+uL&~`U=5oZ{`rZ*v|@aQW3I%S_`2)ic`GMjxs+ftVxBxe(7dMUcN
z_ipRR0_o%0T5^e2^wx)5VhHA|S!XvB91&{lF#myT+<I|`ZxdTTyD9MwI-0d07nPWL
zmBHM-KE-V%Lr*7xTUt6XDs_%7xK5+|y|-FW>*zAsrwjd}8U&1Vl^1_=JM}V^l!VMX
zmXy3JZ)-4X-A>p_UY1)VeFsK#O8q*m-SoZkCvG(|_<Ix55AuDr$a;8hK^E3V{#|lE
z$v|<6ySv+hgL7JEBP!%xByWFEN5Nu9Oq3HQDmuBOWsADQ<^7(AK=kSt?zgQ4ml6nx
zZT46_FNm|)3Fea9bnGH**XZi5MuZS8w7L?ZI$pZx>&u+IGbXwA<cSObfHz`&x6`<`
zmNU&~FNWVN`dAM$euEfvfVXd1R5co_u=J}6Rj)o@o+?swL6vi<hDxOCRvFYIr(<5d
z8`cOC6MOCkcBi&Pvv#x##)YK3+LL(u^A%-R!VTr264S+Li5IhXz<V>nhj6dl!a@x#
z+0Cy3?yxDZA~TOso6|_6w`RW}WULW+X<nWFuToN&jmxdy`6n{|{VYJ00Y_CnAM0u)
zWTNC>l>y_Bjo~GRT&6fSj_>3N{nuzS6tjKBT4tkmMEW7kJ_ka5{Mx1QFw3#bYnzO-
zDDi@s*}<hPduz-S`siJZ?Cho&7r&%(qvu?o=u0Ed4!FC9R+zqMGV<%;STCpZtaz08
zo)LYVr;n)}ecW!GV<dLipP#fJ#~$|Tr!(wEya<FNOzO5_vC)jM|5&A+sQ1n@TzOhS
zetrb2oEJ%P|LKin=SFEOma~y(4|e@=u!COQfp#-RQgSkJoblg98T*6Nb+X!Ls~T1b
zN0E9wB-fM)LhKFXmpM1>D}CkKULVv9yDZn@fAC#1PV>HFiGNK+qB1qBK;Rkb-x~`C
z59{A-2uj3hzSo=|c^vlJ`SJDI6O-t34{aOGoD?=4wp**EDtE(Bj#hc6uTIs0TwKcy
zc*-Ay>G@)AafcYdrAugT#4V>Q8D}<%{%mAKzvtY0jkoPRv$v_qNJKcy@A?}K&71|e
zXvcHpr+VtnB3*<*z;G53N~Ya=wZqr?=O}T`r}nGHmckKTLB2oh{gdC1NNRo=75f$$
zjdOf6xS1vh&+$8A<MeEy;q?A$ecmDAXk0GwLq)(O5vppXNlpQG;A;H&S>lb`b#O!!
zu$R>63=ONmTw7>#D~*Ee^%ir%_-3DbLT9=EbmE_e%|gBXKX-_JKL6Xa0H=av)3b}D
zSH@r8eqS@;l(;#`_Qp@KNKQ4BS*R%)BZeC*Dy=i<+%edTzm?4BI?s~`UW9SP4oTi@
z{}zuM@gG?=#{KRUyJ!x?aA^o;sa9p~S>Jm6lhkc8lcP<jak=*}tE)jW$TnBmscu<D
zdS>K?<L5qw@rbY1cL4*v9;^OK{XQ8HYO{tMD%W^7uA#y*CD0|?PQPI<>4BmJPCJ}-
zx>zM1#L;~#_1dC&*6sGz4_qL=Y|J+YPTK*x7yg)Bx^(|^DQ~K%kk#8A?Ohk#KfZ*+
zG}cg(8VeC~oc^8nqatIO(%W=2^6;hG@bEBv(sO$9NzBgBsl_z!(gW;pQ(Rw`Dr}0b
z&!w`HON8yb0@+^(suHMP7wy(=h7-okoc90^Y+1?zJqHEWWT~?7H8t!@_`f0V+UJe(
zYx8-j1@u3J3@Z0?Sn092G_bCP-<rZzNspC+==rfC;pmW%bGREM3x{+!Qr}fNw^iy<
zNYyMWTFJ}r`8V1HK3MI)3Kl1?$EMEcD}h<!cEP49iJsQpoc!PU7tQ4qy%?OLyK=%m
zteS9j1LYFfIa;dx!&l>x`=T1uF)7N|-)4PREU<juB=sI!$bM+mA-y8|BF1k&RCLph
zKBtn~D!BQ8jLnCAdVgxyx<B{+nz)#i?~4~@H?Rl4XIhDeg6n9zT`0POi+Yd#iasn9
zBM7jGs-yM4HU9s`0jG%G(E?^gj^>Fk2(07>L8-ikRMTIoe0H9;dzS37MUr@PW=~=t
zjT|@iLa)wPI#YG|<KBO;`Q04W`r_NSyP``UkB;Uj=CQnw<R9a+3Y+W7r?YQ8nhwUJ
zdplExr?-YV_-|?U$RTegimU@~d&z?VO`^`EDx}SfH(O`nATs3e49iVLR&07AAX@v)
zWV~phL7TiCKptje+wg`?<Wpi7h(%YLsJ3w-KkA`2Q_Iic8Iud}k*r-!Cj|F3_bU6F
zm~$QS<>4<4H=>`wK-_EJKoMMt`@Yx0?!CxAj}WUx8)RUn^q%ibMn#%3pV(LdYr-%`
z{VsA?yRfL}mSd57@Wa-i4%>9!>ln;RAnW;ieL{ejk}yD&|H^1%^!PCE!PI_+fR~;o
zxxfjSgwpR#zMapO2U<g=lU8(|hwh-xnCR<nCY9nM0JCX5;(TkchgXO@;7^93BR$D@
zsPKJAdd!vvW?6dV(r|DPzl$xp@$#3_R-NVKbyCtVt*@Y6iNdZ&sN93)#zZ}{2TKZC
zy+0I)r5=3-5_pL5n+tA_@cF|>sF|&FRDdxou6&yZ#V07-%|{G9lPGz_+djg#NPUnq
zkM6y+NK5|;bjxPD{i3Z!T>FvCCOByzjMZ+!NGME@?`v_m>l4idNU+A2?ftL1ALY$#
zFMX7_!DYxkNQ^Ss2$h_QDA3QtUWHcAQYOm#)-roeyqI;9vDsN2bvZ;2!zc!YO)Ax{
z-&;CpvODB<62FKyOIVA|zrDDBr1?>k$OD`<#6?1_@?S7atH^!^fP;?%lJ4c5lT0W=
z0-l*zYW3ay1|Ar0jPQ<r4jLDR9`p(7Ss2>g%(8{*fmbuUx%m0TGM}7J2!AWM8VEqH
zhYT_EWC;LloO8`MdWm|H8j17JL)m`>bKFcHHsk#sFAJodXOSuIR5e_cAe2o-cj`6z
zZ6&-1s<&C`BX$c7?#~L23zu@4el43W`CNo!h}YN*A>%>@v<}n^lJB&!?@WhS;~ecM
z635GJJ`|h6v?QD+cnk~-MC}K7=4^j8LrzbZJ~Y(w-&Zv@PORYp-jMdQ!P^tJrOM{Z
z$qy=x0d}=@oF-#t4`%bLX7=6gJ6c<~XKtQaj~+7J8U$IYJ2{o==1##XD+eZW`a$8}
zIoSO6G61HbI=~^j3LMqbnQvUwl2X#p(2$XnPl8~8rc-OLK&9d&+XDHz*Z8<|lOS>!
z$`B9dB0h62;>BDWqr3R7q$SLGT1cj=6skGh=zBQKAuQZGk<*P-rjg@pIzR{`fXS>F
zRIfr)_YM$uwS*eBe+Hn#Ww+iQ%yTPH7%{BhuIyan5wX<Q=ScU%7HsxssnX0@T)FY+
zwY9Bnu&MdZU)7D;MLbH-jE3J8BLvR%)PSH&X<n>Wc*RKs6t83@e_{D6^KmRmzl>AU
zq{_2&I`FEPa2tmn-o3k3LUR;2cn$(CQdwQ#SW7M|(tXtP3=a{*ant@V^FoIP6}2g~
zs-kV5Fv{1G616tZ7sg#yKgM%9%-)EKOy{Ro4U!t5-J+&X*e#4iIM_3BagX!gO|(zV
z|LCLKFyLEXV6zPlR!%`5a(ZrQf1Bx|w@uH8ik$R2CBs@WS?gXj;k!Gz)$4yG_7sSJ
z-&__`J+EX%BNgkU4IVsrOD&Y#pKt?sQFpnG%92HJdAzWtlhamH8h9ab>!+r$x|UX0
z+4_b*u5JRD=WtY!8)icLeYrh-6kU)AoEm_Ce<4HQktT3zY9fhQgx0OgV7>|aJ$&7B
z$Zy(xM@&S)bKNXa!ZE3dgoOy#%67z#TIh~0Dy`*vDrei1VrNF|8$msYTeVe)RybVN
zK5|VEQw};8Debz@{xEo%#*8H0-oYW~lgMu--7YzPe*SSE+L=6s!vfiZ->nNm=bKcr
zCWatj-;HG&r3o)&$=XzUxZF;{!S7&&km@Psw||z3R+f0ZR&3B`+WeJqj(;rR1LB|o
z)a)&qnmfTEEvmVmH}U{_0`L7xip9_6S<3HxZL*$XIvd)$zpJ2lwDrrmIFHght=VV9
z`aBChtmS{=l*iX&Z0R4iH*XD=AGBVfZ#U%lUeq^-%D$cC^DSy^oO@1_Eh0$w5HZ6I
z>UekYOb4Sab-X}cVf>XBhYG0SPN;vK+8G+YDAkR0_6ALsmFMEKK95tYVe#*FD<)^3
z(seNU*3PHD2)4E^>?;#v-n4rVp|`z+@VdFXva-T%N(@^5w8Iarf3ymPRZ@2$pI1=V
zSU&$k%95r{R_We;_<7tZTH$Cj9P*~p#B1ga!+gtG;b&E!ZC)()q`GW=V}S2(G_kqW
zx!Y_^H6Q?=7FS7ul}au?W=u#2f@cWJts(L+$p}*KRB?y66rZgQ6>kQiXBboZX9^8k
z{$~RkS!c8yhD+(?`0CuTha3LFuxY<KcY}dNWkHy`l?CX|G$?g4U2^JW)`UOqunoq1
zr(r9F_RsQ<-G+2^OIFZE_!RwLu6YdTKb4$<fX6My;)32>>=NfC?@GSVfwMoZ5D$hs
zO<JF05op+iU^2`}jJj#B#TD_B(biO(en%F9`P6Yuh8@7zx)0TTB95UDgWaMbOu#S$
zQ*KTbm8>iDohF%|Ndg`9r6yf%Gvn^o-YZcIYK~3)MTY*A*Z!Gh!xY|bdphigBcwX!
z5k{W3-LtdUwkIl*Z1HXXaQ1DK)20DPz14R7YgvPqi%J?F>EeOL9kPXsQmJk~)wkB`
zHi8}yv&i5MP`x>pO@3`hCB&$!sq@LHZX>4Q%u}P;s(N_FfVH(X$?A$rjrBzJ3nkSu
znvt@>SJX~4Z1VMkCXq&G7RKp@zPtzKRNy;n<F`h#Y@(^(B57D&i-{M}xS9E35L;0H
zL;hc%B&U7!bMGZy_#~8cb|!{NK!nZS98Z#~nSIZHdouO#FQD*K@fgql((AiJ04YG|
zE&{;o5re?QN)RCTUPr1fHc5|=?UljFiGc<5E7zU~)*Q$<#r)@o??)+*L3_ga@AF@0
zw&A$i6@26E#>yr<eVX%o2;*dqOrJvCSB9-GkvrWHXVoHEPN2FKz0Lh{2is^L%%+C4
z{SSwz=;cen%Aq8djhfb7FEQ|G`MB?FmYhBJg1b^Z1Gg1EseN6HW@I?J``M{TPYKHm
z-eI%tR5~pGI$BJG>UOeoDvk~E99C~j^XlMP<(>4~eq}u$`!!EVNn^C^aqv>WXZIwL
zhp(1?Y%TR=*|Y{xwY}X8m&fLp!EbHUb3|XizqK)?Yh@8m>9;d#tJ#|-hhW3)sRnbr
zreTt}*CUI%XWZo1(3LFN>+k3Kq%ZSsCekL=se0xNzBVr@3c(~h)vAZdtnhGz;C7pE
z4fprV!gHJ4mi0P%s1H8gt|vlamC3}ObVZDfnP3(baHF|LL-b=N;rA5$k9>^F9=&mo
zzF`RhabqwT$00J)vX`5W9^b^pTlz^`RUG|*ux2!&$u1CithC&&MtIOAG_97y=Wk78
z!d6EsR9~5!9$pP`M-JWS^kFDv2>$al(BmQi32)Y!GmHiP86%Gyyb)Lc%jn~-c#OPy
z{;Fo-T`>ggYVHlCIhu)g`Ta}jbTY;Knde{Kz8n`Ixm~&nV5!5c)w9s8c-)UePxvn-
z;zRgCSLdLE!9vxj*}0c2qE7?p=;^V;eF_9>kwF920;qEw3;!j}^pxSR87flF>!aGt
zX!oBfsa#A&bsdlWy*0JuG33(Ewjr~+9BGS-x2&fdT}D6W+?HLJk;bhCe%qb7#w+Df
zX)RSh`@1^ZsSL{!tuMehXg`nT$kX_;1pk`2yB3TXVE<)rA7&gdTDY5zJ5cSBnmdQ&
z!_0mVz7yP8(!Yg(hyJdo_A<@eAwqGd`;>PjiEC<TYKBg_zs3Aerm13GNgsZA;80rA
z*5m^KM>t2g?5yRGn6~WZYcuyjSW}bd#?%@cVroK{Y}<Xr?_h6pfv=B^Tnas)Z_}M5
ze&p`8@QuMT=B!XPyOp^t5enb1neg6d0KjNyxx3X-CqMLDez3(4NAO&z<oxT4S|XpT
zB$NESvk=ML1H*>nFv%#KU0&*S|NZf4>*j#d3s-f)YZ^6Q05dW@vn|d90GcMhI*&C`
z`T7h6>xZdn{zu?BVu~U6uD?zyv!MazX?Zyt^w|hPiLe8o2#ullVpiz2M1}?an+U5c
zu><YBixzHGxF5l6dsXLTc%EC^H1u65+}$|n?n+gtQwqDaK#sE~LixQ<=mEN7k4*|l
zQYMZIq=PXND9{hr#N-Nd_U`AZr736cDt0^{e4Ew5oi^L3XON}5CG7$a$6ZhNuhnhb
zJ>1+nbhxe-)XU#<4rZ+$NZA&zX=ssaoezFdlhY`xoMgt@7ikwPrd_^86Xo={RR26!
zyujZ?zO=tsrNfEB;Cp!$oBu(XLX2Y^YPF)blPlirk&wsU6#)?iU#wf-VtZ#NrIcZ~
zgaUv^0^FfZN457-WyGygsUfC;eO_~2iDC#KYVU09epfisb*e#J0@_bC0M48*ty`xw
z%467G+P=uGb<PM1AFwgaGa_4Hd->~h4Q3&^<Zj`9k*+UF2O7|~izeSr_t|=P?#fLb
zD@(adEREmqzySBN3_>x{S~9#=sqPus*_^*7h8)8cj;hUk(StWIRw|%Qs!IvZ&YXt~
z7B7{AYL~7#RLr+AImZBHwFuDh`b&4q{P<qNvNx%nG@*`sIdCqoJ;Z-8$Lr0NuBuD6
zR9({^sBr7OtIEa6#0#2ro~Upcdnfh?2aT^sgU6n|Gt?(=HN_7+#RUQu6NtTU(tI-=
zUiEsqTjqR%Bv;g;_|L{fS;4nj_wNB^Vc+KJs(?G%V)JDZfE>;kqn9a{jep0|#oyHY
z0(ldqKc=6=BJ(5dYU6ci{qONSn`Qp9h}m0D+BX-OxwV2dMUy6He~VvMNVK3&0imkK
z3ppPzk?6hyzld3jSQyjj*xHH6yyz7BM7*+|8jb|XMaQR48q?R+PtI+sg|o_yy)G1P
z*w(Ar8FL8j8xtF7$FAK6{Nl^28SI{w($dO`J-USD?&&<wy2+^IWTsDA!w4Wl7Wq#a
z+osxtT;H(Fc(R?3^2KhKm2UO20fkMbY6ncKc5Ojz!^^jr7^N8}5Lx#4yGfB%7fcAW
zk+th6*MRD|wK9HAi`r;%G?+<-vJ`1`#Ns(|6^~=T&FHY5c{e){>k>H0t&&cz*Ax_V
z1`UZl2oPLMaSf}-t`q@X+P}J!YRB+YbDCcbPN?jNG62esa*ITsLH-o0QseCZUzjH)
z-}VB!OBeJXc!(aKLr~gIXkE~1s-F#(RKIHzs|&C#s_*p3qhch`W@RgyqfJd?O-G1P
z=k{DE>@qw=WW)9y@*dDLD~%0Neu(cpN?8?MyJ9A9rw74oX@vWHYRP%EYGLQ(2LJeF
z-{#ks70=hoWF3Rr71+_wruCZf>N_!6oMIr-<zxe(v9@P6`#=et2b<a}m^8T_HpBf+
zn`PXr(KN}^Ir3ojOO)8kz90mg8Vi~Z$`C_w<v^5v8C7AiNNBt&E0}X>nda82NX^>k
z@etj5)8G;G=^2s*f872w(`iQsB|xWM-pGg}1CTivKJMavL~^KhCW$*7!0~lMD3c^M
z-n4f~XAgI@fjd(?1tfXq=gp^&+)DzHKo2T<w8C~DhD_8MzXjAKecz8mJ<ugDtjFYH
z&jdQ>0+HX+XY&m+cs_E$sST;GEyopa?qS?4gKP<56a%u3Z@KHD7C!5{M*~bl*WOtC
ztwlvg&sj2b!J9Ud6M>+vd0jhg!mFx`*{%lr>p5`8IDAJ{!f`CyHdKAO0$7?Y!2tfV
zlS-@RdR%j&;A$v>%GUvuf59T=sUa_3`9ct|{xytcckm)`1cfs(cDM{^8?(6E9z<oy
z6r3)Kxr14*0vT!3yB)prKQgsQhBc3<SjqF~c7arYU~Ew)#bAXmL1}yf$GI(_R~|OD
zaIisNd>9@Ukf%=)UNaQtP%(JRA=Xb0FIuYeLVqTiPiFeI{KEfY98?@QK@qR5?+4kw
zUKDfK)jWJ(a&7d@tkf@_4xTG~VJ)rM(y(~SP9&;`jXr^4Q+=Aa?t4y#SGGG#5-jZ3
zRIQcV6^vM~EC&EgDMsk*1I*amrhRui)?m}D&wachm?4fB7<CtHs#Mj&e}4@|+~a6o
zy*uTN0Ps<bd#r%z=X-4-jB}Rp`OOE*dFeu^#opcFtcK=;&RBlL?^c@KjXYbKvt6d1
zrA0*-SzK@kVSiqJ!{Sd)QQqq{s_V5#AzbZQ;d&hlpUt~CmrsmqlU`r<t@hvOm&(ge
zGy^$%&SrD=+fn9+4<B+03lV`Yj$*t1>_3ucmmH_hHPY;vze4cwkLvtD`m__i@5Xlt
zpFSfA)R8@22zM}cG>-P8SpU`DgSqn^z3_^((r%zak>Gq`c^;@Fz3)CY`-rbl+I~!@
zOihkFdp*BvAkl%`a6BJQ*&Dx&6x0gVRte9Kn(z@X_leU_VU!Vo-d?xA2@Zy7rFdC`
zwHqkgi<*5ZOiT2$;6-573NLp9^|_z)vm@C=4P@F8ZKvnHnabXoNIc9g9TG&NLuWlC
z3nJH;Y_<k;H|>@rb7XfXT(^>^53XCy?+nquJlOn>AXC_b_`8>rEO6gX;@qf5g*91}
z*uDyN!eJKEKTvlhM^6%?p4@V<x1UdV9A+mrTaRu%+jp)jSif{ia-!J>>CE(lZG8mT
zC~qtP{Y!LqLip@u=f`L#Pbhm`z-O<P4;Q-m@HHQtOT<}&6IX=!ozm>HWy$YA)w&$N
z-^n+>uTVSazqgI*iGd3@G&eCn3u^WeiQOyx0Q6{Kab?2YcnIR{V17GGm2|;Ct#Jqu
zn|IWpHs$LL2}!+a5K6KUdAQ#g_v%1E`uT5&sP$84M%ns1qAW7ZmU*u>0pW(T8n{5X
z+W*}JVDV<&S4L|3<Iu3iXNRVjLw>xCRCU=Mlggd%+u$mU!sDJ^*1bLUqaX_|@j-Eb
zkjPIJ>b|v5ZuvDYBMzwAcf2Z53OG!!sPmL8JkHs6cVk-E>$RsG7oW(q%*0fazyIiG
z$8lKfGjY#J_u(o=CI8`4^PezhOI%t>ue9UX%|tox&;E636jcqbi#_zd_3kFXQQuPE
zoT>Kam4{O%>rg*5f1<Q&u6wKz5@z*<2!ln&IX|Wt=_r5R#%S9faGF@aK_-2z*vvQR
zIWdZnaV3yHuAt#OR<KUw!=IHwgbKd@8K)8-lKW>ZaiYlVx4;A=U5!qpp%^|wo%v6M
za%!r7yx?1IkCvIE^NPXjuh-}YQL#LevuOsb{#4j&0RSdm)Em8g$sQk>u9hPP?#qa5
zI7qxgIlv6y=CBE_H(Zn7%=2FTPSmo~fg(Y^eBT;05b3V0@#{Gj^dV5)tj?l{dLWi@
zi9lOWUh|k-d%LN6tt19$6lL$1t#`;Xqn{crRtDZ~xv!fnm#V}nd>ZAotmT_`0M!hL
z55e~xY)$Mh;zohhQSYdens7(^r{6RIncAgCdhs&yHdO>Nb)#-WzUFXeoVdq^WpJWa
ziEIlk;aa;=STz5RJ57WE0pQCxpm((wkM07_X#>wxqk~VWgk0`>a>pGCG8YbR^$&BS
z>_XBIB@F){c?mRM?t}}l!Fgj`S}D4qMrGH2nG(58=4q!3RXpi_ZzCr4*W92Y<?+b~
zWu(3Vq5Ayhd0-F#b(RI_O1c8xlA7Fd4CCBO6HD!?56g?|Z~Og@9{-Bm#4usA*erzf
zwG-zpC2R`^p7u6j57Vt%gW@7RHV#IqTqbU)CM4%HW+(|Y9()IoLdDTcy6tr@BA{4b
z8f2I5vBs;Y7yUc`Q+;pz)%EMp)zW8Cwzdu2YyvOue|EIskEQp{F@?$Nf%JKuKqa!j
zdxNbH=9M2vHLAQ>Ffg(pT@Xt$_+$|(wec*U&baJBlIMDCck+HmRKs-i*4Tv?lC_+`
zIi$Qj-F`vOg$@vh4QT%gVuRknMtw~J?0MfuCBa#z>AQ=I3sK8l?sG@S5}>+F{LqF(
z4_gY;$Zbd5NC&cmB@PSX=yEO@!J{%@@s%@Bkpn|tSfGTu^yxTvgDk*YR;esRD2Jiq
zNTA8NzXfneJ7$8}SbxYPZ-0uMng%bjB;K@(a)(7MW*Iw4K`?OPCbKj@>~esYJZ3)H
z<r_VSr1<gazuH&6$L%X$D7zq`_LZ6;FkRZ=Ws~^;`aH0v*2ux?sF@h6(d6fQtN8w|
z)3>dDU`6(ZGW)Rhc@*PG8%1BWDnJd3$o!VxjyqT`3-F5Z5RQBpd@i=p*Gof52?7w!
zl;uszZ?YTt$5VE(X<ErQ3$mUCwDod8FwN%pKq0GCH6DZmWp#acHo6uCn=;{Ps$Fa1
zf__xXwFDPgONrWy=NfDcIcRs-44Yk7sI^O)mwKQm-&&#)1C0p5YIICg7|W&$MhE%U
zl;`?oKFgO^HY*jdbF0e%w$jT@phZ9SaRiE$XW!&7eelFWUO%e~XZg(@?D(zZhV#?M
zkF!G96fDXsDiA;;+BLbaHjs4IxdClh19(|zE$KKQ0h;!1$?1vQ^*-i@@<uhaigK?o
zm3I9HHc;S{0_b5~1GXpbLi@%3r$C!5`_9U*883u}-a6WwLu7@^ZwVtA<yIP452s{+
zU}^5sE4OO|>X@i;C0@yp6f!Qq(-y|U^eNp!>TtUsc=svh2<^qz;Ec3GbjCW~{;e&S
zv)%v~67wj5LM3~ktw=8~e98lg@|do!dyhvCY-d{Dh=RAQUHfojQ{;z7EMtl9Jn+>w
zK7b>7Zf)E=l1LuhgIgY51Ny5lHY2g&`1p8DJG+9KcK$zenqtyf{1Io8rAkuxpHcRt
z|MD6?TJ$^fPK8D!iE9Z2ql0|Jl9SZzlW%W6-HUhXMr7QktTN}J-mo)b#a$HT=^vBZ
zmK#y%-4Wu7$UNIadHGG^5#t5(c+dBh&K@<tIB!8tx}9yqKsCeovse#RdOdv=>e1mo
zd}J2qSE(aZi<LN^r*9|-2F3aBeGa+e`s!fGwkbkynwmHNNTb}`CbRL??Uj}HIbCx1
z3eCvW9hD_Ft664Cb_<$)qOk=ASwHHmBlsRab&uW_<U1cPvoKdXSw7WZ$!g?f(8YwU
zNI$%H1oY+i;C(X=a-Dl`&vV=f?oRjJF$SZ$B@f5ZA=H8Cz^Ox9t<@LwOOgfm88O=)
zIypTr<T7v$5sN?ST%W89#Udl>+^<MFrPS}Q*EznL_Zq+qTX=WZ9yd~4`tCAxd{hcN
zK#FbWT@ld79Ua~!tA#dV?dJl?y!5XTp@z*pQ<oxlO|`MaB-5B4&yXhb50?a^z^H|)
zsk=a&X9lAOLF2_VHg_xGK<zz@UYe|f;m2;aP$)!2ue^h+<%+LU-I_!nTbI?}qn^!l
z_@-KgTs@)u$Q~hpS1Ll|Yd-6c)q07f1qXN7t<wIe(z<0K@$%&!t=)=sE2^%#$xxRW
zPbk{?vl9wxeVy-Qm_&CbWL*8)a{LnnUs0h=Pd%yVV(6P$r{{@9hfry7jmy%HFI%le
zN1A806`Gr-QZoFLE|mF(0-)!!;if{}vFdmDgrPuBG}Cer_bpE)$+E`dgPC7PtX_di
z*^XE8*Z%nnszJ(LJ1jh~>D>@(>52zBz#J7H?ZyjCc7eq}xW13OJo;7}zdVd`X4u={
zxrLzQP+|I+Ip(Ye#-B~nniAD~HV-E~cvqA8aS5(A_m~P*Zz!x+_uy`|nNYCY8GdNP
zVlt$EjTprmuBs)CpyN1jDtWAm0#2mL?Fac7MXVH)Cr$icHc!m-sj|i5n`~w=fKQvm
z30tlMNopIc8pdoVaQ&JH?(0SE%Nf2E@)?aQ%{Wu%2Cmj%8X9y&z+tAj6Hq?{+zu2t
z$0&Mdo9AGmfzg`5@UM}J?2KddK9iHx@fQR=LGMBU=I#)t9aR3vaWZ)l7PDH@ofq}#
zmgh!n!+vK@aq&H`omE~k8hJI1_a9bAf6+M@0LAmSq)|I}d>1=a@2*Yo6P7rTttc@H
zTUF4(-&DJM1M?jxpRE$iKp(RqoR{tnN%3o=lLlrH_(am}ik%H-ytK1GZxG2j<v%%W
zOqpzY4PiI)!Qm#0FTkOn>NP_}r$64_z0V4q5dje9io?Lu9U<xE;tZEV;oLhpENiLR
zWo5cYJFun>e6lN1eMsXGLY?ft)xqtulo5=T<Q5fy^6MHHaDmL-W9tvL;72l5l3A@s
zUUcqqUVfkK*2b!oV28kQX(UjCfAv@MKE1h^?mu<;wE0HD+va*9&u{PPT>!k&iA5vP
zkMjBl3iJ^Ld1<0Y3+}b9WVh~A;E&<tZXcycyUOsGhd9$2eX@d_W0v~VdN}geDO`l#
zF^=>Dg<blqEqPpKan=Di(z@yP01bp1KQBtMa7*#gMIs7XVAk>a$HE(eKk*P=e<2_m
z`J+B9iA$Mu(cp(U>CCWGVT5!ALwnixkSGpnHle$i#5M^IBPdRH|FUX<e?2RG?QY?3
zpJ?qX13W03TS?Z7L0+SubCq`13g|(~snrjRrgDNZJ;lY<0x5sgF_~|D_fHiLq*<od
zi8m6ADeBw8V?Xe6PCR~=Md?G$W*bwel`qr+;tot>M7OlG1UzQ-KX`%pLgPpKNlSQ1
z)T!xkCjc#zZ~0(gCr}+|Eky!{q}bg-gu>phz#|)ENTZOp!eOQC?`C2ZtBKnCy#Nc%
z)bC)94Srv8lCDw!c?85Lg@YNIk|OJt*A(SX`>x?+4wZ;mGKcp~@)E^tJAr8<$6}M}
z=Nb3XWJha_hl-6a-i+|aF6Y4yFsQ@*FqT_}+e^5TJfJJm`6EM_*bwR9afDeUEAAhj
zKic15U|9wF8Q#qju1fJYfL3S?BF^;dvRhJ7-S(9d7k_k-<-5-}^LiC<6V=~K>$fz(
zxWnD<!J}bd-p+Wv9;L-AD2RqWKJzE`Idxhee}>ex^ZPx4#1^1fP7WZ`IDREL+P8|$
z$MBR$mRgBD2oEhU8}eSwlVAZx@Y1KrTZ=B&`?(kWu7ghskb<e{vwC%6`#AcF6dRy6
zcf9(bGB=<{c3=ZWuW;;UVRHlJ4@q%scH<a_rLP57dLvAg4{o0`WdK!48h(iJl3vSv
zxYfYM#)eZVyZ{^{+W;va-^k(R;fYWRJj1B)<@Opyffe_gQd3wD`QZkz<_nmL4?X`~
zHJnut;7p`4W7ZZ}Zh5q?3>Mw>k5FXuoR3ufOi_qza5wf+VEH&K|DDylxbjHx3(PhY
zmvY4Z1vsR!GlNgod20IkHTF>-Qk@<h9lcScBLE+qK2-r60Tq;#h|7~_Kn0aB3FaDF
zA%93~<ThT2&tBYkO7bUgIR2}E5@1Yme8uHwg4@O8!DDS0zqWU@IdHI<xVlCO^TW6B
zo+C10P1M9lf%>EGFU5gTK_=XNDT@+EC&Q~=4ptT$r7Eez5HOUofB(U+sjQ$v&$@cO
znmnZ;KV4q9!o*c?Pf&aQoOdUcn0AQ88)*V$tcbQ_KW>YU$R+5<1%MxOHi$ep3(-08
zW97a_Y$UVX_+xTQsyY3r<E%8b7Mt0+nW-8B!ilxTOGcr*O1Y$*>kIu4#s@q&bfC9U
zD$l1DFG4|w`M-R!urKNw%DpvX2L`>ZX9tw9zgLugC;EIk%ij;uxP7&z>V~K1A
zT3SJhKBUJ1W)7)kNA8B7D_&i#FZetO1ekOmP)~ao(w<T5D91Stm}m8hWqmV6-d&`-
zFjx)>72VKBiZWlrk2)vjJRvwioOwJ!tV=v|hftOwzoQN`^p5E}?`ThS_*&lP+K)zH
zwzlF>EO+4&em2V9Lcu=t55qX=MA061ia$WF<ouP}PCouo1BkvSbc7g~z&!cxG0i*Q
zem(%~!%k8N_~QD>Qh_xB^X{~7-{5oOx0WDRf)M5hJ*4`~0-V3_+agLmeM%097H&CH
z%pVlT&H`MbQGm?FOdY(<BPd~ku1^yc6_wexb8?dSj6BNsUrJ_iDLW7FU4X&+Rz4n5
zkAJv4loO&4{u;ExPgkiqoK92DK_l`u2}$n;-CH{=i(ykT*KQpr1NVmiMXz{RAtg?<
z!|=RjLQmIN5b!xYy_5}_F3(GGk~T}pxg=14K=`r9SFE;5eRcF7g2PB1<R_t~tIS1!
zVr6^#8KELhkzEuo3#Ka*dZxqdz)FIj4cR>9S6u0c$S)Jc8i@Y{hR<7G$#%fu%Xqd!
z$Ne{o+a$GPl3AeWujw5pypDHG9QmgSn5d#E!0T913w9**?BsWZ@T4B;D0ls6RleQf
z%T@nyJK7z3BFVGM0#5j^RFL(__niFv{p4N9K13_y!?ec4Hp%n%!`~_1#6G#l7xyuG
z?1a~&1UvnWkhWg~<cECPj1j8813cd4AR?pyzhf8Uqo<F&02}Y-K|QqK@lb8%vkJ3H
zO^)Vx^QPu>7F_j0LY}jUd!j143*_l`ce|!`BgfhajmpQ9T>NkRj92_8%HPbLg<oU|
zh~*Sf-^I74R#VI!V{@BW)kI-l-k4Vh^-EPjVpk*15V@nN^b8CfDj$Rkr6(?*yKD}$
zb7g(SsGP1OU1q?OnW`U1XuTOZd1$Tp)JJ~}KOFyfjSf)x>*vft1iUUlk(=lSO&4;@
zoqhNmVkNS8GW5QlzP|H=&>ueBpts%RMkK|MiOfu&j*g!9Pu;+%nC<)euRtWV*J;-p
zN2|s-d;2`VfxSX&YH7Culm6-{AOA>#H#iacA;MnmjyJfH3~+p%`pU|ckW2H3MU58^
zApotX6!un(-Aeg1beMav${jF0Q4<irIIfX)Y~9KT6LP+g2m#1Nye<4hGZbG7or6Fh
z<|oHbY_P*SPe+VE5IrpjP+!)G34KEHh=Uf^TwmHK9#f>6<os+)&CyZwsfF|K7fgN1
zvyRTrYqC(Kgr6pgWG|AFlCr-{F41&4M6|TXcJy>^hYM^xm->3HGZ~uEvMgV~jeU~;
zXf-%MO%|JLo^oOv599aWdk_$h2mLSU7;~t=8X>z;tHcw4Y9pVBfXEOfGiFc|j~dxo
zkGhMFN*Hp^Dn($9ZGPd&dwtS*ceSZ=oxlm=8>To(Ce7)aTrckezHEf<Znuv%Qyo3A
zkD7IAdqR^DKTH79Q^{Q;!XuzE$1J~<6{}J-H@htKGgwxT!yXB02&I6yUHYN4*L5#=
zGxRKWFf#HyZPf5-Fj5;-Tzsh43sA2zJIXv5-r7#zbJwh^|6&{Ok&QjPb4Va6)tv<#
zWF3^SL&!)tH2{_yc(Q%yi<#@_xprW|4pD{~NtAl?xvxl>M2^m6WHGcazhZRPr0J(*
zRt8*p^}5xL!ept@Zuf)F6({UUzG=+?mjC*^8W}z!w;JSz5{gRiXy1BUSxD-UxpWT?
z&6v3+*G!H?`qQe3on~nh=N3yC#~L`p)@|3PV?h--Qe^ysgs&gc2h<60HTCW{k1d+)
zs=FG)I%+Kot8OHrt4{9ZCRA{dkgnf0p6boWbnav%ARZFhA4C)sUC3A6%_ZnT8R+iA
z+w7C1T|XQ@v6t2ej;WOFXIMBj2#wje$m6fP>c6>~T<|0t>2N}CeNZ2qFZSQq6QPBt
zS>_epHzjn*S>A|G&Gk;%j4f+V<<l<5yiqKtNXRfVhwdyq*0sex5qKb-mr62*3?D*!
z*gI!CmYqCa_Hg7Jp%^sF0R-MXDSgWS-ba8UmV)!9h%@5z8MhK-qUtHgCCDAp7t6^L
z5OOzxi2TOU7bQ`Ti%xipQFEmqFA-AK8bDkulw%ws1l!nuh~t^tu;FtpwQC)prb>wl
zE;QyikD;lv&DSWhHKw0IkKP$MpGfP@1aZte0+Euo7EsV_*duL%;iKg|KuY(K3VrzR
zG6OZ%(<e61*_*0#pO8pi;i;Ahlt@CK(Js{jaHo{X<=^Rc@@xNaX4&K48W4JZbxuIQ
zoVAx95F%AJ8v<<_M|Wwvb0^~O02ms_%;)(Uv3v?bDiHx3gH-<^3xUsoH`_C?i%h#K
z_xwwoRU$b79p~pSlo2Goy(4)^9eal%u#i9mBp=ZTXs$02;to9lZ|vZIzAaML^Nctl
zKu3NZcvLIC;(wMg{OQ&ok-($YIkhwXBUbje0VkI8%Iw<TU6bRx;fw_I8nyIDhn|pP
zO@S>Lut7xjjT4!3hX3<zQHwnvuM^V47vNFp@4ay+^clIEIRKD{sicYj5i1G6RXb*X
zM`(WKBcXk&YBjv>Tkh=)zGXUID!=kudA!v6KV0~S0Gi;tC*naE!QFvm({xEnN(PV6
zc_=rt5-~C|^7heUpJ<p}=VQDJd9a+U`^+U?+vY_7LY6vO0g6{BWHH<DhgCbB@E#fm
ze~-Tt0eb=<qE`i<sQ(o831a|KdY1FPRoZXIVd3kxpJ0laEw$VCy{AEyrAVT8E6L_i
z@M`Zr);41KLPHU_r}Ppd{&fE`6`8YNlJ{A_Umv!RqjsuyDvAF1ezi*Asuz4odD#B=
z^~r!qb14x8RhMaC_4p1LktLjLjlLBAY!n%N=x$M$)GtJG`@)jpuNX)Ji>QlLZi>h?
zpo!>$4gcV-I6NjP#|o{Uz@H4CEK*p6l8KRLX9cv*L;yYUj*gC~iIivJY)y@c_EZ00
zo2q^86fAZ?@`AM9Jd;U_9q8KbWIeb}z_P|rqmCZ_ZZ7QnVVy8bu8#8WjP-cxCzXGp
ze|9fCsX2{{@OqJEK76PJ80|_JhAB_@e$m8`*A1YBUP5v`q%)H7qRYV-jM1Bg?#6<^
zE%7R<S(h4<!Pj^3uyTH3K|}Xpnt~KtQKOxpn85-7HY^J(ThB=ad;2qcZ$Dl3S4@9S
zqq%fMB?R*+RXL6Gf>Q&>8+UPQE>dDS-n);M$LsQ#<+o@77PtCS7X60bIB$>7d-beY
zjMLH&L(Z|u@C+u?=^du~U~L{Zg{j1AyBQs!NjC~;#3a;#b<Nfjo2qXHO2@{$jDPn8
zw>4(bF!2R5%kpH;$y?Owd8|)8UcL3J*-zA?tDQQ09H0vNRBoTe$uDXr&!*e{)n)nU
z3V8sg9t3NS5ED@NDaiZ<H8uRM10kb@xTdb6-47uk$gdm974yFufwqlSxURrqsO=eu
zArbwc{Al$!KV0%=2U#3VjG5<?#uP6%O>&X3FJ=|aLz30mg@r?wS@j2I9r_%0wl+5J
z`qihmTScPdh%BJmNdUZ4@<rWNK7_IH@B(oBpx&&NbIe!FAmc>3a~}+l))?EO)<*L-
zW@$ZuM=85HcTM^ivU}XRV@o_LHkEfVU0ga!zrAzNvLg=;@_1QH-J34EX~g*4YMOdi
zb2v1^EZAR80hDxwi7NBm#jwb$fz;)4AReWcuIWJYs&hbJ>)zWAg>>-!BwvdTcyIg%
zVJW$68Gy3Yu?lu(+NWl8iMaP*`U-95%|(R`4P)asWkpBhI}JD)kPMayW;OF@v@DCu
z3QDuG6iAj4(<}c+FjB0g$nJE_cdHYsWFR1Db~NcMK+1xc9f~1+<7M}qG=J!jA%vOJ
zHPz(N8{8(e9H&{*($Nq&TS}9gUa6VX)nRf0cRCZwJeeoc#rmgzB_+ws>9E8I3kk4u
zvQcyH=f(z5_kxCpFoCGMcS-d=Vnf&C`&N<*&e;PoNH2$F++#IP+(ELk#wG+?gxmSq
zf0}IDsp9a{jIxa)ZjS^WFJviLWC*=Ds5IZXkv5zwlv-l6JtI0={o;ear0tV9=7FYg
zx=WV|X}k<Nrpgaz?Vmm!E$svrmiBY<i}g1thzSCCG1!-nv*F3)b>20@YgvPD4?WVi
z+n1c{F^$YX_;DGS2|nXkTB8kYma2X94miv%=hnJhBrkhIvG;SLk9@i;x|kB>kJ?w+
zP_$~Ky2$@W%7##r>LH{b1czF25X_e9Jha1j_cs4jtb2s@0@%{=_m4a(S2?#cG{`w)
z1C9)X@}`}ZZz;$q@20Nilel&_j{f)+SGW=vi9kOcCB=Z%2mSa070W3H1||2JVl%R<
zb+)!#GJy>*RSg+KaG>VN@w%0U-DTb^biVszW(zKycxeUkp~LUPC4W99NyktgktQ&l
z8f@FgedI;O=J&~GafIUl7-mkYVnRe~gW9X-!lNE4lO+~`tH|9DGDcdDi$-zvHEJFk
zLJpF@fR`$`XI*3=(zdp0^xV*sMpddSK@WrOo6aA8gA;w`8sqyYD)47w=Vgyr>CMm!
zNZ=z>gl88hP7t9M)B;U+z2>p14(FU&w(Puy`&NZ0jFeF{mZqF!XeUN#$)A12fGFlS
z)e^5Hg0x>F>fGK*N!=$c&cFc6MKG#WVZfpQ2!4SE@c7q&HA9Aj`81FLwHLY>z)5o0
z*xKI0Ew;{`wYpY-Fw$gD%Oa14X=oo}(NX<*_nyKmETACYTkk6-*SrE*sp{$<H7z+C
zE)QlU)6va)R{MVn^&aF|4Gq2jGY>@5(MjpZxnDX`I~fXO=fv$5V?GSH#<B1LRKC6f
zTC5jZZE0l&+wsHQ@nRXH+v|S6l4MdaVd;1<#lL28t)@nLZEbAbYpvR$SAN-0kCW@$
z-L-Xw4^;o;!Q9q9M7QGMa^AfNKVR=}nOCl+i(Q3)(V<lKOE0rF{C2OQyQ!4ccWa#M
z`S*7WF7IF7FT8X<fd*4v{-?!Rk!NFFd4&G_<-Z`UgYVzHDKzzF!feG(F`HQ~^H;=g
zO8|Y)*TTOOut7mIhBY<^?ayiu2R@HE9em?<UcFe0wOUL5Uz=7y55<B0B)O#`*+ZrW
zdlHh8pf~bo4}3)@8X5gMI>4_1u%(IiczrR!vgu)k&%v_B<2znB^PE@ZfoGW6FLH;_
z2e&>fwm8_d&D<UAk5mnb$Wmdm?@Go!8>_!Rwf{^1@rz#pezQ)`VjA{$KJ<=Xcqu8d
zbZT9)U+Hkab6%Z0;e(?^Nfvx@0nu@HF?|85nVhO@l!3&>7B*o#b=ab2o_CJi;INs0
zo8j2=8@jlt5q%}czbi7hBct^U6UQX7uf60u+jB+d#LTfD7CH(KOe>yObY+Dz^D3X&
zjhCFpsO^9Z8I#c)G5n3*X*Zf&hb@e2ePSt#ht(>29ax>}SqoKW6uyX3Hc|Tqd$C*+
zFcSdYU@qR{ijcG+O)(Q(k`OfhtdTT;uF~S-yXpV4y6mT1d$3@a^Qq@DVxi8mKNgL4
zF!4Z$`kj8;@<T^-SoCSK9W?X<qAOaviCNF+2-s#HokdMkKg>}O-{_p?rR96-j=Aum
zQYhnM>ZR?QRqkj}WGtplVlrGS?PdLq^ta7Ekyz)}D`-hA?Z@HLW-3)H-1qOZVun$!
zAv(UWpHAhLzL)Q6lPpl3Ir<Yz-@c@VUeviN8N))T{G)wafp=1w%jJ&g!wR(r%ENJL
zb}uxS_<9_3rAYKFK4y+_OUjO2Nb1k(qFF-Rd{r|O<l^2mpuj3u>jQ>kfMqxtEq>eG
zF-_`E6>pOO`><9=O`T#UD^%ZEKY5}u08B+;F4G-nfCiR~GYi87zqW$e1f6%a+J$*^
zzD((dde?qI#4TF-G;oQOwv02Fiwr8v)*RJsb)7|-+#awW4?$_i*EkDAVQXtWdP`at
z^6s-vukT=-{n>9dQ8=>|+(woVW7k+OTer6C%Et+sdY&2mS#IAR5okSI{g~)8ZrZgX
zv~Nw*fVR4@R;xZOH(+g{<zpZ<KoDlN6~bD!mWk7d!kI;12CR-$X-}*uJ1%6m!uxyW
z?=E!vYw!4>ZhfB^!VZq5En23rZMnbn{c>%zBCkuz{L>HA7}^pJyozY3Rti_HOgh_}
zEMe@csRZ#)O*5{+@?+dE8jmMGLdf19iQMt-zuVvYdm6O1)<1{_HtT#D%kOn`qA}E(
zZj`fG;pILvKCoO1T4-Fuo%%|;m^Rd=o^G|gHF!L6X2yMA%J2-;igOn?rwCN#u(zit
z$^~6QdDq?#E1h@Q{RYnX5OKzMYnk$~8|M5<;1x@N2K~&wcThGA^k=ODQG`73r=}md
z68A@D`xhOkvEsXQmPYeYi&L&QYJIlM{OzM!h!%KI@%Or78Mzl!=sLxTQTS%1zJBl0
z7O#(j4toB)2++>t>x>85nQyUAwkmTS#PLmnf~hbaBGl0N39*WDME1q+8aQHXzBB6!
zI2oH@wBxuZlVs}+)$q8!V3tQ+`^4q;1={IpE^P&ZUuNiwhT!GBhK&0mtm0;2()QV_
zV-3A~m!fIniz8HE<0BI4p+?SHz`i97-6E^1n)^*h`#F*WFv$U?BCTXm3u@pk9ktT)
z;K$Yn&_;=!;Vi54;@j=O217k#W5Kfn<m*rJaT67}Bq3o=LBrjz+^mekKTQ_d7Wh=X
zD550uA1qh*Rs2=Qa6cM2D|ZEP&>r<<YKI_n9ML@`@UG6DxK?U8qyI<STSrB?cHzTP
z0wSP@qO_7qN+YQ#Al)G?-3`*xA}QS{-6<VINDti&4j~=G00YC!_i*&Q-|v0T;rr|N
zt>tpL1Rt6E+56hpzV^NMJ})G!G3MjQ*2~a6YH8ph<FWce4l8*O97$?Y+&|D8jh|A}
zdo-k8JN|NFa};kV7MSH&UMeQx3lG<`jeE1?>HqPZF0b^Ek^e)_jRJL)&|znvbEUIZ
zKQ>WnlBPo&zjD}8AWIzXZ7|vP_+dv7LG<HixA$OhqmiG+NJ8w}0!C3`0^VV6X5)GT
z?4G7H-P@PNV|zj#Z+tpLO}jNC&4oa63&B){wl9Xq3}^_xKq4M3xRbc)E}X))TBd0B
zeD+7H!a)q~d9N|oVb~^J<j=K*&&t=txH-pzjgFW29No=Nw3KvIS%4_2w1Rr2nJ299
zjR75+d*{DzzKWWm7a+->eOId_`BzGGNb<?;ipp<IC7}vq?xzSjT-FD2xM-*$w4_6D
zrX}?^&*|OHCf@OTD&&F@HohXUWLu2T$rjCekQyl&S<ZKl3Ly2FmJG?IzT<;N!CtDc
zGG}$)W_PiKeW&FSinP1*H6XquZ0-JHX5Uvvg`bR9RprcVaQoFK$YfXq6qUGkg_box
z1#YkY1ouVvv!$;u8I?{k$)yR(xfijYat;k~4(5o>pKDKoq^oo_sjI82yBNpSy-x*E
zZZA?Qg1Xs2$K)_s#=$`X^D3_l(nlV9K8xIwBnia*Sf=v0(|HBGSzE&054l0GPp6Yd
z*hTuMwD-T)$~lg^^^e10T(Ix=RP&qjo-f_kvP^P=!yQ)Y^S+zA#+(Nwmhsy1qHl=%
z#``RK`Gi!+mYql3N+VQXadf=3_ToE9;%R}xh4N6#<k2qrRzRC@Yq{BBUZwq*T2>v9
zITR>PGbFyj2AUrfmfG#Ro<hP2DH8>NVOdu*Af7*HbY}Yk9Za^e`Fy?e<72qG$r
zo|dXU_hwx;DKAG~zu5UE!K^Zk$byoh1Wh)OLGcSSQIRCUO-$4}U=q$0Y%fq;sA>_b
zAME#!sEo%8TH1^~ApyF>FogRy!OZahjDdY0Wc5FH%OB$cv?M=@v{&xG@{qqZHd;|?
z8(@xJY5kTwx031<Gog;wlbp^7Os<3{cgrJ1-&D)neE2RUb&F$_iuXZC$I1b=qnLTl
zqr@q%s^TW8V@s<0PEId2Q@)*55Tftm{;t{0{{rTv#s)0#&I#B)E3N$vJA(l1jI>8S
z$`X&Fn&I$kf~9MnPMC0$y7c#qPPR56#RJt%LFPM!7)RK!eI`BYX)9)IJf&cw@tSzc
zK@oVFdYFC%frih1bk)E_R}lfF2(*10Z5tdI!$4^n7F(78W88PA^%6?+87%1PIqLFT
z%cxz14?mOzIe(nFT~@1WOL^W|=v;}Yiod(S5GL?0h~SZ#)z;?{&0OITO=SkGfW83-
z0r!PWaW}oQz3wj75(##~zuq~@0`h>n?~DV|Bs76@F{ZNcPJWV*Dj&u7rGJ8(Q)IQ=
z0j7Smc@)?680eY1Nk}?;ZU+~Ep%G+E8HT0$YzCTspP>xDZ*ri6y&g#}^kg~qQl&>^
z+K6&2?#o)qMjGk_8@M;1Yd8S}m|SrawgX$;2G8o^cg=$u!a82dt?#bjz!^0;^;332
zqNd0;l|8{3OXSijyjZ(hja+U*WJ2<6->Y1O$E$fDU%=PR-`D5A!iaAameM7^N)NuV
z#D9mKKk?-!Gms!5us|g|$*0HG3y^u4&tk3V=n0qKM$M+BT^|Hf^i|&k<{4Y^520Q9
zVgJ}EkSMzIDeWV?OKo3wp<@piKcI>jvI6Fw?Z>OwN|^e>JD=fzbg_QIvL&7j4GnRx
zm!Ni-ielN+Jk5)fUAo?mR(02+SWXW|?;owr;!iH*z;JfgyA=Fp*IOplIjM^!ia?nY
zJ;#)h>gnEl+}nFdx9y&-$;!Oc<6W}_WZDE+>b}BaRo?vBjpS-_&ZbfcchH&NSV{0h
zC>f9Sms673fSyR9b-PFW@AE5Km}*Rtb_0*K)H7>pbZcyu=z!VJUn)Oa*mHB8N%&H6
z9f<O8{(vBYHCSfJHbFqo2M`BOeHh=*;~M%!*p%TV^P+@ifLt`2VOz)$AH4lyv!OaY
zJq^}Sr^9M*QfSLnw>oFbW!9{x9uNC<1aydrr$xGG=q5Bf&#}5)EJTJ`d`BvDK-rof
z!(gzN_+aGl;^o6)owfU_93G2vUAd3N2%-T23%5oq#d*D!ArTEuA#mE`S4%>6k><5-
zw5j;+2};e`TEUqD;6gIwBJr)BWN*~|JKy_;cje*3T7BvN>ft}sse$GmA%|*Y60(sr
z%NZC2;_>C_KnuEwKC)Bbop>UzL=s_6=L>e*lL0T|i*PX|p>a~F#u;qi4>*aoR<Ny^
z0UU7f7%xN-^datQzTMyN84Hi3KZ3&JRSOG!Q8^q)5#Xn%1t11_lt;vwV0ygsvvKd<
zV@_IL-fmDN|2-*%x%sJci<|kdhJ9Vn8Y5%lcf3VkFWl{UYhr;p8bCk%B59(}`I2Mj
z*!V*`Z3(=|FBJm^?jC4svMIH_9{X(EazKNjYiCUr$3VmO4Jbpun$!d`o-j9gyQIvY
z0O%_V8Nmf>NxTt(d=KfW9n<LN*dSp+s_@v%S}><`t!O;r$_G8ClF~=klb{SSk-+qU
zB|s9>R7GuXFo9wh8vC<hI7byY{V9RTS({oS4;8i4*{XECJEo0)wP6^yyGHQ1^6K6L
zknjG7t$O~SFs_i&IYo)EgQ<zz!<_A&t!wZ9`_eX!H1$M=Sm1=lKNQ`+q+99;Kq`lP
zl2ycctp(`P-{0_4p^w~UUz&cxzC<JmG~cCNJR7ZYdXQLq^Q*I&dgRZ=5vR|9IHH&{
zV7}ktkaXJRv7VWK4_L&WMjwa;Un;#YVI6HnFgY&8U&g6+Y5pNyjRW-q_wUC|9L>(x
zhP?sCm6A40wVg)ff@Sh#L^g;~tZ9K$b9lec)p-pV-OXa#4E+X5hht$m^bGrs)~Xk*
zuCAU*5J#%&dvBRDNG&Z2U9M@FE~3nmtftF5HMq^&H696?eSDt53=GQE8E^x_>~=66
zxZJZ`abp0|aCE+RA-xL7bK%O`c6;W)*dFQ(@0xdNrSD9O1vZMGD$O?Yef<Q?GZ?Ua
zWM^XBYtTWc=B&fCj&t0QiMfu!O7h=LsiGR_>yDi&KIsqCvSuFr&5{4lzDHj^oF81k
zIO+1q82-=PG~n))&q}Y~;bP)}Ek6#nN0eO9(}43Pti=o=)cP$I#(-157uZg*&wr;K
z%1)tliQn=Y#ZE<3+SbEa+SbS9lc+DxPi}1sKbOFmI<1AD=6wI2lIpnLYdv_+Tpx*d
zpHjE<)erZrnJSfB*)$_C_C+25Bv7`Yg!6_MG{Zh?u0wb(W{uk~@XBgQ68Aq_n;Mg5
zMS(c<h#L+Y*T#Dx=)#f;I?4=e&4o2ZPm_UDOrifBpdOCz!mvV(hSE6<=aRPEVQN#d
z^1Y;qy#9xifN0@dajV}l(#!Zh$EnEvmgXaFhq^EdP9?DSd;D)?0-jL$Obn>%1ozRA
zr7dao^NY)0iXCf-S>mMIIAE=^2hjfl3(*gMamJ>}%KvE)`NI<qfk6#aB9>CGfRWdj
z>sfMrxOYE&24cViUpMi@$Ugju&KST{^?-;DKY*->KNTZH`kV}6v_=$Kp=@gstm2)B
zs4;ydB@~k-?`3C6VsAcqawd_?n5ly2nNRIfK`nXjhy2}_m?DbAcQL;VzoL#31!lW9
zBZl}rGJ3)DNsgu_rY8Hq{?L7zp(fKow|?8cWPyD-p7;fkgO;AVsLNyMksi#&{BmSq
ztPHG04Rk?s)LiWDnTTH6Cs<VKWF=d}w0=RjN?e_t`*&Rzuz4MRz4YkM4uMe2HQ$|N
zFI)Oiy3|uDLN#kiGV>v8bI*8kS7~6|03X_6p!IAW&rvtdM;J*Jb2=zs!=`0jQIL1j
zvcod~vTXCg6=Z*zldw?$T{FLDIs3iWp|z#a<EKRy2&89I4>{%F8@4@3vzwR5ZYdqK
zO0eu`LhT;eHaBZfo{cTh_M5n2yuP&GF58Pq-?K5Nn0ppnpvP4Y8}t|`EvZeW6KJ+2
zlW}y)29`EFaYde^ZT|XY=kVer-#@3mU}V}V(Y4&p|9>|Nyua6a`Z*4X{&_mk5$)e+
z?*m&6jATCILmy$}dJy$Q-ymDB%9dWDjY_>iX;op6jt}h}$~;z!w@92C06Hj;0?=Fs
z3RqU~4%5A^NT#HZ7x)`2B_$5vl?&-S3o8(0PlV4_NJNf%golTRuVqiwc2qZWF~3A4
zIKMVRp0&w&K1qM(tbZvz%B_rrozuc%+XzIsOM1qGpp#DMZ}vG8;T&4{4mv1#bJQJ7
z$qfNASqFq7wiM8WL-(^mCntHTgLFNna^j10rzfI!<_Ll3C=>k>AG)V!asV<A?z6|S
zOgx<;KJLeh6oD7_?Hb3-#Xh~ax_o)cF?Sy6V3pXNvU=#^#?`;=xd3ARy2~tVqdR9^
z6$q7Pl%Vqd_`RlvIFLCw2yU9LirVV%2|`W;pB(NwoISqabE`C1eA$Nozbh0z$=+CE
zsx%PhdBF;7)wt#t6B-X#>(Gt?H<lOpQ^M(?flF4x-v_*AcRv<5Uj7z7({#a;vtg}{
z?)+NN{&$EAhvit3lDaz6f{>62$i_+d14zio^IH<qweYD|frZ>u2FAqMxiUl2uBl0p
z_-tM<srjYthWF~ed|y%7ATJc?Yhm=*smbEv=I%+ZPUC249taD*{6<y{%%1e#RD~~B
z^@8z@&%ZzAP=${UoZGfkYow<Mb-Pv7HyY@cx&2~`?DfO4O<IHD<5y1Y3H05xXfAbw
zB@?)9C2g#g)F$+d6v9E`;Va68ZbHStzmRWND`TQ?Y!N)FWq_%eTUkV3p3cb9%b6v-
z2~GHH)7r&G|LYPN1ZV7i41D{A2Qo)}_0UHsix<Cf0oeJ?GxI@gQ?Yx!z*ILXVWY+5
zWK++IZzqcI?L}Qh*Q8IZ;a~nzPIz{(=L?EmA&wdCnyscdD)OK__&_F5DjRYBD_F>o
zeVAP&H&@MN!QA6ENdeM0E{QV;Nf(&YuhzG}=P?a7S8l0Yuz+U5A3g*v@+EP&`8_}E
zzkg0HfXw%2@0=&GX@s73Ejn+U_C2WLu|KK!|L>*0Hcy;#8}vpRyZu}ma#xxRU-kF*
zADsSf9<%n*%Qd0CtcBI*;sP{qcD$*qQgwoz#_tXp)DxkmprA0Z+81((Pa?C`uK`AC
z(V;Fbg26Qxk@4{l_}4#S%!~QX=@dRix^A(+ET@X`=l3bC064+kt!)g0HGjK^BouiD
zprV8PgwE0+*$FHnZ4s1a)x2ghm^wPJji&-Vzh~0oQ$iWm@!+L&=g#hS%-nv1-uZ=l
z#gD9pBzHTz*6}sl#7GBnD}3mSs0$JrL0`NeVOIj7Ut+l-OU<Bp()CN*1Q1HzC$4sa
zO?GvHnUKfz@<hJUWWplx2uV@%#kw|qZF&!%3*6Z4SF<3yw-*HeTEABjt{QV0d@|p8
zJCGZ^oyMfv(%kH|rI&4%kep1~jYYOjK|KGz4(2<JdC>fXY~3&mf_|O%5tS3^cQoCX
zH{SEKu?cSC0FBXtwof2NM?ZkAs>dgUeV38UoKS|EseYS%G7`6v^s~WeT{i@%D3x2l
zdW?Qs-rR1dJbbVe4L&9kw5U|HVO6PEWz`7ON1Y-_aLNsY;RRpGL`j+|6q@0#rGlqF
zwX1|2yMij$8hPVfZCeVgzOOhzC+G9;>Ux@&3LcL8Or(U6^v{JpcpKwhwEZLG-fHul
z%~Psr)#jJ=70-v`ybX^ssNjt=Q^KV>+~z@`r#!=G*!|J}FJAZ|m71~Mf#P&PikAU~
z1Qof*h|sd07<m!B`GAt-3|LB`t6KOf3(J55boZ2CKoQbSZvXW=7q1(FRnaybq~7eS
z>tnIKy_RiA=zN0B^NvX*Fa6-TX@s?*zP>0jYw-yRz*QmJl<s6;r1^|{(ST9#ZcVGg
zmt@}JA+2Te=&6`vvJvMjgh#DM?fB&6i){s9N0s4Pe&p^(m>~oP$D3$IWOUsIKusXC
zGH^)gIjrf8bbN0H5|Mc9<Z75?j$9JGB<j$mnt$u<xZkl(LV^IccsUe6mXV!)%JPDq
zX+BevRa*(n>E}au9K%Z+r1za8zV|G8?Bp*h36F4=;t#AGG6XHkf%X@v6hv&N*peML
zgnVKnsx5PB<kAGXO9Wg$)912(tnJ+<l_=EIO;|zYe2%1Y%;)05MA@F@1N+Pe1{~(U
zV3SJOldi)+^W^}(B{|mwxp6*Tj+CJC=!2`@Y#&VfXiWak6-o-fEza%5wfmk#8!)HY
zGgyZz4_pSqZF_8~NG;q&V4t2I^=5^VeQ77s85?1{NIOrhx}b8k*|3rTA|ixoHFPO?
zUq<M|(4j-GCK<oWbQeY>YXTD}i*)K%hS&)yn;ybx(>YP(T^taTBbvO$4&&7I*s3x-
zo{qPLh4Vy7vz~{^X!%(DB5#IdpxmXrPx>2IcWW1M)6})pX-Lvs<98ay2;Mlpcp<Ph
z9W&_C<>NXvlxl6G!ipw1{k}txY@G?ltXoW4F;)7=T?}!CyE`ge$}*wk?(PAA{e#d+
zlL;#k>n&P&fA?{HV9G??8k73l$n(ID6<gs)F$@urI})h&(ag^N*Gs{cs#%EG-g}=(
zQCaJEO?79jU~C^*bSt&F6I~^%&W(c#ls~78cN|GW_<o)3GwVLHRQ0@6gNNLkl)m)D
z?f0pJ?A7*zE(f1LP2i_iz<&9_kORG%hc+^$|F%Yz49&9)SX4+xw?}hb0QNltUI<l&
z=1du5UJ(4|1S4X2KucO@_aRel6`PN0y0<|%XD~jL;MVp{vh|V==&r0vvR-<1JKL47
zx!=a0{}MmtloNPKfH=^7qwMUz%x2T9wFlq5d~?x$lVIMKjURe^Psp~^w8QgZNgrjm
zKMM~SSdmmYWMm?bJ|TMp*zgr+6_1Vk>>muQRq`%C(5w=v3TRsE{<)=aOKdFV?^yu9
zzd9iWP&L&LM*Rf_x{&7e_N2;-2*|6qWf~J~*j^3`TD!2<JmBD;M>_!EVN1|L09=T!
zcic#-Z+MKX%Mzyd*sll;v$TwvB58WcHsJQg+j(f;ILF<v0=ZLh!RoNWZ<=U*O2vyr
z@YJ6Y67q||@L>+qk1zW78h5i7V+G&Dvud#pf%qhlh#rwt-kG7)iZ7lQWC>LUi{I3m
z$v%{K2D$No)%P_A`y{^};r`+UL#kTbIZ@wX3?143vOuu))1BX+|1RRT)HPdJ6*_@;
zrx%D_3xpL{H~AFL?Vqx*-Yz+#-q-Kt)(T$Cu<y6swE$3<SavzW^#RKl`E;)@Rr`g~
zA`El3jX6Mba8aX{H==6JXwee7He06q#M#+-+W5GhWE~g<t-Bj$U3qvLK6{_!t)*os
z=lbH=K(kM*$37}X+h<^{@VQU1N5TO<l#*Q4aJlUP+4>B-9ybFw-gTSodQxw+s2g>7
zuIE3xZu6&p>|Om1&-;`I4(33kx$XYmCK-DG>KJOBU7bT8brO=1LQ@9bCpz`y0b^%A
zBLyCImuR~+MqY?X-TU$drvxuB^Ki_y1lr+}e!hukv>Cl-a+=+HZ&hNc<=xhHvn<TO
z@)Bas3qCzQDHKOx0Tn9JBz{A&BtdgO5hJ6ElG>#&Shh_pWY%>p#bt}hA|~L(9?Prf
zwWxhoQ#>Usw+Jf@&-vCOd^Bs3_z7FfDiJVj?$n`T-~UZ7{;Y4Krb0i{{elmLAD9qd
z6N7z6!~nxJb}II`z+U^PoS`hc?oVHo;qB#^RBf+p7NmEHM0Z;rxo?6>7@So&K`no%
z(qYAidhAWJMhaGpt~!k{@J4l<q-m%CanpVE0Ck%AXvsR*{^&GMEy<b(O!Dm(IdG`d
z@xyI1Lm*ncrX5mKRGAIj7vR1xTw=r3*PH1#bewWHVaa8liZ!06CJ_{_G~q$;+9gfq
z+NDbYpf`A?(h5Gz9V}=u!B(2;)zw?Mzu0KllO@u;NdUj3qT(<FHNb;M7shCK7o8dr
z+aY<zyR!tQHeO=Q+72W9l^rKq0*1)&I41R8=cUUK!6LrXlVf+6ZNd4B<m7kom0D0P
z>3Qfr-kw`rL-?Ol%}MV7U$+j9+UL)yR++xO?o_wvTZ7;n0xcWf&gqD4P?4-!H#x^!
zVUM53t+y{!94{9c2IIYR&K*zjwR(;V@J$-EN!N!2jFac>`se7oT|q^f-lg7Xttfb}
zj&1+Yo~}_4o1!cVco}3SDfm!tr8Z!ts(*bz_z4WwyV9MuvLpQKWAmDFUfP}QflZO~
zO}4cbY^0T^Ro#jc9O<lQkD!}*DA&>Coq}-n{tzR0G}SE?Bz%(Jv3iyzqQtfDA=2;`
zc{Z#!a7Mz)C*5)i(K3Q<ee+NlG2*s^sgm@oX%Xx7pIaZ3cpq9$R(t#KYI_8NQ|rI@
z)IGEM6QhcL2AJIaCsO|YoBH2qGK9tJe_d=2dxCD2$X4Zl>4VaKoS@CSWW?RlEVp-Y
zsOI|!2`QLxSmB0(TV#1GqP0NJ`;*iGBiu;ml1)z=drXLO{1rZhx@cxG?#p&(kZ(R5
zsnU(=l=d**`f;=Vn3Jq`M!o6%34n$EPsagcWK15WAkjX$@8&jGG>9B9ZI%`;NnYoj
zbIRp3nd95=>tC&g<AGz#>7C}>Q7tQ6;L}sWo~Icv^o~;&V5aL~;YKOeCcTX&gHc#`
z5Bg{#kz;O<Chv|57LodwT{Sfyl<a`Dp~2~m1M&Ou*0nQI51I-Pb)-kNOD@v&Tcbk;
zg(GckFZs_`t8yBv`lnN@1jT?MT}DYf&Xs}}^P#x~RJKJ^O-rcsU2v2C$&%J=ceR_R
zYN+oY)2vP%EB=R`@VCQz{5H**Dih4>OmpPTmBYI<d7R%g&WM?8=11mQ@+4?-ri4}^
zj$mc|9g+ClnHi2hx%f|_dIwVhEEIuG7gSD|lsF8k2PMZ0@wpeKI{Z*!7)sc1?d{D-
zG2G#dNGja2viHUXo=iahpHQt^sWMo9!0{4;m)`okG#sFz6wHl#2;ptA4H55I)3n-r
zJ@-SmtGpvH^!1C>AUBGG3Lhc5+QmaMe#m!-aiew3@#<HyO?iQB$I-bl%P#pBD~$X{
zS=jFDXJqSnGHJBxdWTp^T=ssP`?aS+j8}lrjU1rhy;3C%hmr&UUE}PTVQp<>OvdFh
znUbE~#!d#R>lGaArsr_7bQH6l<~7mqpL0!z6koSqk=pC`xo%eFNL+iavRCK&0Rhwm
zTLjNe@6%Tq5+u=P2-!C<^tT{i&RqO(mW7?O90P827AxI>Fqe?~B2Ql5vg5ktSXooG
z)bs|)yR?LE-dF35%$>h%RWd~FVQck49R=3#mOKZpgd}!N-f4E*&U+1xD_Z+KIeM45
z%<iUdM^bBQc=-47BR_dxxXH@Ojvyn+os&6Fb}iXrWKC>#rl*H(RjD364A>lT9hjG#
zo$Y#I*kPUMN*-u6?>V>NaB7RxKiRAAE_G-_U1Xc)0vZG8^0H`a_fR%GJe^;tx!D2y
zHX|O{g2w3$IYmn3$|bFW0r_jGFU=J-In6-nlYQRl@1N>5efD#0s%K|Imt$R4q(P2e
z#;m)vP~~rYIKnhlybd3d{@?>9TiU;nk-wI-hrPeThYo)r9$T*MFzG%|+7$n=aAzNh
z0Kj1|Wx95z>5VrcZeYGKCzW(vUc|x+U?IF~r5C}Z5Fh(p<{3}%nA?TA@3}^8>&-(E
z$CfF*dZ_Bp_|SA3%~=2x%*72jZ%({DJJ6$y)0;oH9I<_W>O&u9n=q7iYChxMuQ^!i
z>x;&}lQ>3k5oD|Tl+)De*Yva<?}XuP_udT=CIOI-M`E-wfU%*-edIyZJhBMIedr{H
z;03)n&UK|-wn-#(#}HaibLeurif14T``^fF6`|v>Ho@BygF;4D45{P8Jqo%!Q5z{s
z^@^16Z9|i@ZFTRqjtP-k(*Hp1il+(wbw>&RbCkinS=T}><zGi>xNAc{wYlIlu+Cv=
zQWdkAQ0AjU>1~y74~wqiiS<8CUEUcZTbpDT*$-!hpJ6%5L`YEZDGmx4W4Nt%Rv&Hl
z2YEkT{>jN3C3cz)(EK6AFcX06kuuCNFYuv$fKW`X$aUQ-j7=}7cIG|`FY|iKvtX3V
ziL8Lgxh{T3(oG;*Vv67tG2(>=NEqC<50s9G1bZXjxOopUjV{at#)g%OSQjGBg33I)
zGI_v0C++>li`&qF*?y3d?@syUWJE^eUcJ0c{pD1b@cAdP)c`|6*AoLs(~#cdvZnKf
z=RVH;gxLkX7Y{tZMGrdvu>W_1=94e4p|nv#f2Az&9ZgR3f8+#znPF7xuP0ZbU1)Ks
z#rWGi{DO|Y@ozt$+1sXyZI(}Exs-x!d`qeM62DGb6)w_OVxYU>e9X_*OSbRSUsv<O
zZJ9x<w_3za%p00#tfVC%jyxMHk;V7y5RA}wGVbtnQd2Y;^jhPFj||zyCFqi#8xu6=
zR@A@UYuap7Qs#6@t6%!=eg3q&SAqa(_hlP3==~B{lyf?H?%{p<vFU|vzNTO(FIWUV
zUUk$juxJ0Cm`>&4RrGIMxh#}si`}i&Ic3vp;@Icr-_K-{jXe)?hj&Jn#Z;8A$dL{;
zvrDkH99tL;O`BoB_i9TWPE@yV{!yGK+#{-3ufxA%++~k9Jm9>cc*?ieFl_O^MApqi
zpWOi)ek3A6#sxCBz1l)W$es6}5PxPP5Ef%8B2ty_2dKiRHCvM2Q(KR@)$^<(o){>I
zM}E@fq(5DtrhkfUemV@u=6)%}Uop(LuS4hoI4fJ*Tbkb}Zr<}@bzbD~L3UnE0uq~A
z4nCa`LoOxd@j=^pyxqqrj^-{Xxf;i85<zPxz)V*U@BM&D+s-B9?$iDV0V|sQStCQu
zdW&#Rc%S6}vKWvew9eV;fBG1mIEtMXpPbk`oIGOa9e*0LT2G=IpRwrK2vtLt>v7oK
z%8$nX8}U|SO&(q6ru={06pcshS~q=m<))C1@Y>34V%rv%cq^W)x21?ZPq$@TCYi}8
zZ9Zj}C3|f}thH%&kky+E@}q(c+0vB47rIGH#x)>VpsZ2CY0Y0GoT4up19(;l<6!_q
z4jxvlGiNaAb2JWF8}>ipo^!oiCv@nyc1^KfNcG+xYRN(d2AEi;0-xGc1QqRhSZSF$
z9Zdc`GSzAR%jo#{udw<JqY3she{(g4RPTtfhx@e4vwVkjG^_a?gf8JK`}BXCi${DF
z$93lN{g1iG#v}ibmwy<IxWJVrfB0zGo9W_huzWmcWD@;FDwo!aM(pgD+*`tccBiB+
zko%XROuh9!uT)=6BAI#t=i!~~@dr(dE1(0)B-a-pW>P&;-3d7_*%=bN@Y8fXlOTvv
zmJ^({V$-dZ5kB0+qwtaN-qGjZJfk5OFrz67g6}V#;khlhNyzjxpCCS_qLRi!+czfI
zeL4ueSqU%Uw)DscT2{bB+w+FwlVd3@trS3{WuEaE(lMS&b7AZ&dxw3XABqpPN-Udn
zOm+V98#(^*d$#=V3WZnAvE(&?#NL2gZqO1Ii5gw=a`=@bW^24;XOX3Czjqt{qmwNq
zjBwsd2!3R0f@z{xiVr0eY|t)645Bk^&=4jvZe%q00vn+hU*2`|$A^AVObUVOdg!z`
zt<|n7XYlEsOj~aZcVb{*I2=9N=<kaw0;g7qI7jb*_H_plY`WgzVDCLT!|htIp5p`^
zhh>#)>LoH9u!*4y#QogoI^7pXog00CuWS&q$O}PJwUKeQ$%n;@>>zg-Dg4ZQBk^Id
z&#@@~T0j=qMP0pi!}|11uj=97TB)jMauwHgwh{ZsHg3o7U27XcSGECvYS)#p-nWw=
zAQSJgJI?9@pOUJ&Z0_fYJGGf0P4ueg0lS_O^tCVy#Uqg~V@}yh)96x$%p5EL6~_O`
z5uhp2WJTxn$M+{~=ssCU(=i#LY}|j60Uz%j9iRSXpP91eV+R=kDqhH~Fw{=)Qq<df
z416cRzgUgQsFysyxS3iZpJ5+Oezwv~PDaM0UJ}pL0!)Ta6BxR!a|9pi8{A)_Y|P23
zQjQSXwCYAK=!iJhNL$w}`JqCTBjO?{n=(v$K^f^RdKX=;;FLvJ1aQ7om)-Y{M5ZoV
ze?%O0dC5nsTKp|<<mB=7|5Nq+Exh-9{4H<XwA+lnMh(zcxd-565*6}-Qj`8Fl}u;W
zO0isP%dllJ?D`Ny(E;ow-)J%IU+!{eo;E0Yz`r;Av`hQ9B1-Pk3*fS2O$U!Ksu$mA
zG{C*;f-SNvip|@yWkz_n=c&WF;<iWp<~${0?p9L8%Pa(9JH_LwNaIfv-4+CwOay1w
zE_(kJS~P1se<jG3J9LSY^|;L0JRY0U(|f?8`-Bj+Mpfw!v)BRdiO$H&3BWbFySnsH
z$U0BRIaM3i3j@za@T@1Nrq33wxwUoN)CTBj<mEQ5yy0bnN(VwNJ_vpa+83hCc-b{$
zn#u@Vq)$lkc1xIt&Rq-;U*=w5oX%-+L-whqRmD(-DED`iK0luh9RUZfmx2mPb!^L#
zqofl0;FDB;D87|&mo)VZe~aWEkbCvflMO`ybq>>}cf9{sy&4?pBQf=H$7j}YP;17y
z;Sag;9|kYrL%+pn3%LBz)WDxW28-M*PS6_LW-XJ#n;$NpPOwvLz1{_kI9%>P7*L}e
zamjW!cjGeVol*o3mT3%>1tAQSt^wrEXKm@vYY%rE*?QOXF5;m#U4f0qyO0QBnF#)$
zcjP<jQ25Z7+X%y@<~=43!;Z}>Ns1o^#w$KtYP_60I_4AuVaBL-G!5?0hn7aEZ#3`8
zSND|K<|pX5dS|2_9nuKd?y@CotYG{tFrF2FkFSgV4zwTl@6WJj&^QHMXT=ZiUrCB+
z!En4OpvHEkn^yb@d{4Qc+dhZ6h%G{CvC|9JooeMq&t1Rp0lPd4pbW7(gM6xXF|{=F
zDp&TAd(5$+d|5nRX}alphBM;ap<N<)QQOv8VH#d$s@7kxNA}KR746;{Lb=1|DfMU2
z2s@xK_eLCX4z*B&>UM3C1YCc4LOqiB%$rhOem<|fz;-#>e^!}LrcHOcc=~nzqBR3Z
z+>6Y73>{;vDrV>%y3DB(!c}4#QDX}WG!kicxjxetOJ~iNMq9DHCJ{DDpz{W*zB$`w
zh$g4`5hnlIS(Z^G;U04yF#Vlbvq{E}blnyKw|3a4qU5l2jtC~Ni|i&0g9`fuHXUs#
zh#^!HbQuA`^uEiZX6O_sL2JLRo704o3qqxfayEBr4qW5`jh?LhkwDEiSfO;+sO=B=
ze`m2YuD2g1T>}zdUt9&87m-Xwq;$Z$5NX0_Hn9$F5=P-`HW?)ypPcjn`*s+{CNrLp
z$?1vIK!BV`^X%k_=JyW;%)qEcdSF0siVcSt;5VHo_g&kTm%lchoTIyWwY@S|!v8gA
z)f^aRZ5^^re~4IGLX{)VOly;2REwsB{5w&XMxA{V9PGokT`wlsh?;m%vTl2Dk~gSI
zbYZ<_#FH7dwRhoEe{-utgo*5R+-l|zw+dowzBZfG1-KPeb9Z{2IvNm2)Z1Pb9}qcJ
zAx9W8tQSi`-`xF?r)3wPt23obs7PC`uv8RUg@353k_wh>YbA^$gJ!Y$#J;?lmW
zWA7uh!-_raYnobZ3N7VI+5_!VI-KOmRhV4Xvw5lNx^Ld++`uDArK6f&yPSl_HQXbt
znPwjff=dYnC-GjBuZSXlSH+;FL!YiYu!$?_V#3Q)Qzz~!M8r`o-(s{K`I+Nzu9?A^
zR8t$tX`5(kNk*0k_a_v2vUIt^25y;cAgzaY*-Fn%Pqx;_3I8oe=VbJQGp?~MYLP#}
z>2p)s>q7s?OW;Szg78)KJ);BitY<>y_thpt@-mo!HDnx`wbj+Vcc}y<U8ZfA9s$!J
zot&L}5m>f;w)-9m=^ow@$}^^ef|@6Drt;mTHUHt^yYnVO*M0Pv-*uj$i048v{~&0;
znR%Gpm93<8r>UyrUfD{oZ}9=g13;D^MEz9H29Usr4v=;9&Jp}adjm_V4mNc1t$%XO
z=pn;(xofCh6x;7y)3ctF^tyKkyLufkDnm7mziKU=*tP9aTJ;vy^QdLLRbOlrbANo<
zv5|=V=!Y4nb(t|*pI>bkQp$!|ras)He?u|^K9GDJi>iG58<O$$+^+?V<|`O*j}&4m
zLkG^G%+FsVknT1CLEq6@QFa+fo?cEv9$3~@R4(Q5_RoJgH$=R5-Q%czoqyZo)bo`G
z*L>_7xY;kMr-I<}+8}W?m)m`{Lskj65R1{C3}H$AaUzWx3sK>Vj=0f94smbyJ&mgk
zLnw1<!>+IjhY|dNb53@4eWX@{RoqB{GJWB?iEfJ8hxxbYbU4R=j4KctpS*4VGr+#0
zbbzRo$;P!>aJeY{#j`!k_wD~~BkX-R2Ojx~F0GoZ*ZjPqHkcgNiBqb-y0p30bnPwk
z1TWk(QXQu?X6)6xY~FC(!BwI0WmrG%!$&oW*DTb@v0i+r8jIB`)TCsdpIYxzr5GI>
zqXDjM#pLFS%X|Yci<WwLVuGcAoa}^*lr-B*TYATm^JPz^juH#uSz%5@rI2Fc!)tz+
zkB?jTzkPUeT~Zk(%7f`(od~+vUvTKA5jtwKCS6m;t~OG>+Z^4>`1l}8#HlB%s&Q>v
zh-|fIfz*(9t$}P^K%mihU{=oD#yt9P*E%bJx}Vn93J2)zfA>P5!N|(8iVL_t%v05C
zVbrA7k0Ct%oP+pL+%+Je|NU;Fu=SA{QxfbtaE=nq#ROz$3Bx@<SNFB~45wtj7B7=V
znTP5z=Jrl<=o3=<GlgjI9YXcwqf(J(O`ha;wm^nHw+3l4pqw(XwasAGtC&4Yd10J6
zK6x}-Jn0zhY%Kj1<RiMM`F$Mo5lA;>d}^w*g{NwOU2orvtLzxtGoMD!Jxu%>S7m>P
zt8#v7o&~F`u(=Mnj_9H+I}oj{AGJ{+ougBd^RsyPkq|?oCf1$Sxi#0hO1VLy;$El=
zoE9H?KC9iFE8Wo82#<%~;zP<*c;YVa9sz1Ahl^FEWtC@9XvQPb0j5hds;!5Oi`i#)
z`iuh4y`DWHCx%I@9^R+Z7uxxvq8gO%K>ImaP?0Y>h~iBJ{mmO%x^@Y9FN_Pn2BmBZ
z-jK{|QqotJobT$U5)QQMWc9@5^VHUE?I?@jq}{r0RJ$TQ<+zwfH1XhubHjLtG~Kdp
zx|Hzqv^q%R=<#acq3D#|$F%Y+#>qPL*P83e1cWrXeCd)mT!;cAr6&2DA;?X}Tk?lD
zHoS!&Q(O2_Wb)|R`CjBNb$uZ2oUK$KU;1RRr5qxWYO`+qj)CaqooSxV`5T=aJAM=r
z6+B<WaWT93A`KW60y>ngzS4S76R5GQ&If)eotsC0wvTa!7G^&ku^#0*ey0wlFTBI|
zx!U*}9bsbMsIzd~(q)0&D>Rc>4BvXRTjbMN0uk@6pM(?PMA&QVU-QUiVa!hWe(m#g
zvDq(T#Tv~&z$M4~V^2uHA^-05qUf|y_k4lE_96W?R_OU^Q@hr>{CwV<6AwK@xg3t$
zxGLBH{4TK63eFpRu9pMpcz-^{pR^}ix3>mLasswVwzgDEB`gCIXkn^RqH>s%E>3-Y
zah5V%moD&zhId1AYgxJ}{5dJo54n=n&#zntD1Qh>$!6A*7l--(g6g4~+OS=s9yp&E
z-X*2i&&x+{AZ*AC4n!$km;=R_{U|agp|9a~Z2tYs_Yd!2xJ12=Q1yR+Zud0M5UgA?
zK#{vqP~#~xYk^K0E2B$ClCPORRd)AQC`8z=aXgpL%~#@M&?G)VPnWHspzjN}f@(WF
z+2zt>BFrB$(^%CDgypmyb2P7va`Oq%^cfV-7#Uy`azmHT*yZQYQ$HzkQ;U+HqV+Qw
z_H<)U1*@tWw-{3jOto8w1W<^o`*mm%oU*ze@_xCY)?V{;on9eDYaF5;(8jkT8cuWr
zkB0xps@dm*M0|lt@$~#BMo}V15rvW@(6sFbn+3Qz-opCU{Ns>SKYU^hg*;&`9g7m%
zr0$???eTb=K`KxK5!s+aopXIC2zOZncP=+EMU=CQSL()U+AUE&GNpiS#+@Egx6IE`
zFOfY0g->+Au5x7AdGy(CKEOp9N#*NO6G>_v^dw&Jwv)3zak2v}r5JUr5{WpA6v`#y
z8OZYx-7IOqtxH)Ong+cTZW0sAtnK%YM$PW*ZN^O$1t%ZQa1lzW5HZTOE-)`mPCg08
zhjldYNJ|ulJu>40O7th)MdSXObKXY5*e&J#Zx1~MRaAY?O_LXGg=_p28Hp_sJY5)E
zT!h>tgrnck`p2kVy}}x*ISM6uojH75<#<jOm8*4^b>d*}hTV=58I@`B>@f7`j9TZ1
zA4PVep(^ta+Ud6{@NyQhPl6Nigb^7G8H{-4!)0~>_S3B4ki}}|TG`Zn92|j=b_qJm
z)CPM{*dfGV+KfXa<Iatwb^^tN_V61uifbLsw^<>D9kq68Z8e3r{Q8x)KY2&tM1Q2n
z%w+|u-Y^K3IUUDc)JPBMdQ1E2)!X?t7B024x9DBB^fLrg4}4+b_Ga==$C~NJl<x_i
z;!mN6dDzgp`#kcpqiPStnJaweqn<>gg-`VILAe<5DGjGiT2#4MuE*AGL7%(4EY*Gz
z?ZVYRB9uwCphcZtho!V=q0O|EkK{g#@8VK+elva9BHnvEjyWIvwT=pI9k!u~Mz#*k
z9?-bXf3reF0Yz*t7p{lOlGsC7mKj`L#kzb#p56d^?yL|YOFG{k%=i-0s7A`&XbDr-
z6z=XFMK%e~uXUQjdt}8U?E5V|jSU{aT>`m#dG$GOyTYyGX5Z<id?9?m5b+HC@)GF0
z9eB67^NYi|wuVO<Xv?qioVTocM;(z1xUzz5=7e3-VeW@<bb-(B2NWcNyooa|u?Z3W
zT#8P7?eC}WPB<<yQq>sae94*pc|k^q4*dk720!l75xmpCPU(0wp6NM$gEUNrvOJW&
zusNSo<{mK-gADp<MZ$+cTh+V))}Ov+%NPQ0st={;Zlkw8+PMQeP_zVpN9V1}r+p*T
z^XLkx9hAt$S1|=72U5RM@PVYC`sq_zh0eAcXx?_!P}2O2F2+@kQc``$u@HuF<E(w~
z^%tDfj)*LcBCf$onXP_)-|>#N$B9>7Z1NQcZ>pTeGB(66y%!g4V}y9~y~{GJ=*TG&
z;-dlCAef8~%=~)CdCC`I|FE6d*+67RhS;rx{|dOJAk6*QEuzcMqOIrSeC7wnw*$p!
z(XV{h_X)FhM?|qAeY+by17@m(a(3uU&DhPUs$JxdAh)Q0yO{KwqXYN&94r&3%o|ex
zXI-a4%4a}x-J11y2lvZ0o2?qWSyDE*?|6%Iqb<;)`sOZ=#^-hO6m>C1Y~z<Ugq#QG
zihx};Dv&SU9AC+zg2o@-MGjA8BhShP(iep_t4#9Eb@!*jp#$OgK*@M$-3>n=Ls3?g
zxA*kqM9S1Pa*VOeH;iJA86UQ(oic&`fr}fQF!$V%vh@Lxf7<K*5}q`|^k50a7@z3&
z!vL}yfOE&JLf)lx=PI|{GND{$vXkTgP)U_5dFR4_P|Uj9`k_rn!V_wfR@VFuiJ4`h
zT)Qth=c85W`yof4?uk;k9y|}p|7gPBWkABEDBPiK#DrZcl*jf!pJ9jg78T&%UDZ}U
zc<eo67^Ayj=#A0D&NQaeFW-ER$aciVr{Y;Qw3<l{?iJA^M9srU_O+r1ju6}-(h
z%DXTU9D&!eI?qO;7JMQ3ObPB;v=3;$G43gl5bxbH-$QHGBoIK@k!Pb1Yeg=-a(@_1
zQD_m25;nM`;+R$Z?bZMSONs<{_$sV?#_)esF7_R<FaOLQg}YX($kb(kZH9A`d`}eL
z?w%Lp>Bq(KAPR3j0*5;4D9XYh;91ym_ssa0GN#!hX{4`D7o2ccN7>7i#SKesVqJMR
zTI!8N_mC192uNUy6H^v1Q9cJc)pVs?1VS{;ioKxAJbnuQsKG$j=O<4;hWvE(Oj+qf
zX{qq$9;JJc(E3#XXu`bek1i;XvzVyPFOxtJ_1l%n+Q#;M7kBIsq->>EB)8@=X)QIH
z5Xm|oN@09AUXd!c@*$lnyC8tjf&83y>6BWJPCp)kCbHv~8?A@SU_VOegoQng3*c+;
zC}Y3QnB&~{HRI@V+45A9TzwT^w{jK>ykO(!^9FC<JMV?|`G*t{{kR+~^G%c9^CL2?
zuz5UhfC)r!xk6H69PHNx9nu3#Kb0jhAqDGkF+f|n-4zRqHN2!F*ly^5bWid2)r)^n
zU0=;yRIF3FE#dDn7}?He6<K)8t6%Ws6M8va5XP3&ow4VbSH$QUDTAG;P>zG-PfCNY
zlMmmbYfuo_n(jE2iw1JT0M}Lu!^DZH8p-6E5G}|c6bmd(Nsu+cZ9c!%?uElkK253m
z&9h(7rCnxJ(?pti8PVp18GJ?I?!!K+;Yw5(VgiV52cIBieS4#*V`Voijo?9kd9KYg
z&zsLTuskroGs<#DtzU-VLuu?39$l|Y-{}F0q+{dZN_(jJ0ce9g@-P8=6%NO!)Ia=K
zyfdsPa3qGFl_2WT|8U04A>4{POWb9#smnZ8BBn|0)TiU|S_><z=3<sy!9{Orn5?>b
z%L@_JYDWK+Y-M}P0t~AAS}m><x<~JJ>ReDO0X5~~1)F-!OACDpuM*kT9y^HKSb1rI
zDDs01u{jPrWr1hU;^W}Hr?3jWxu$sBs$DX)P4LknierZw<}_V*?=_lTbmr`b9HN_O
z%eP%V-L!988M=c}$ut_pHL|}plG*tZ!=5}-KmW)yo@vew;A$^dswk`COy3)#6ZxjS
zUg^l>snu9-5B)Yj?%o373ucV|0Yd{k7Y2B)BC%!aMJ{L5LeQ?KloMs!W2GPpMWNJK
z!a0tBPbDqwb}gE!SkL=aUb#~W_Yj_ZV%!SJ&y|Za`>|<4xz(4gOY28nZvD9)?X&U!
z!Hbn|e73X01+1ZDgbz=-XX&1RpCX44cbg*>Zh5E;^WC58JXlx{(BJJ#e+F&1vrhLo
zV-gU)DpMZ6rziwtWK)cPtU(X^d4n3qD&@V+$4tuqgT+6+@rJK10I-Njv(&(+tNS4o
zZH!6j$qIv~3_M^7zMj-q*W^^9=(sqmv+QM1DDQf^_&wGg%xXJaTonp5uEnkP;i%B(
zwYiFXr9z;iSs8y;FBLL0ZJ&nH;<5oL6ZHXnXbxrZ><J|CXT9)_l#&<zuMCp2R=Lar
z068;;ItWHzyJ7M_g9qro8Qs3+2W<mcnTfafbUp1h3c`}S=R({`N=z`9qd2b--zaEY
zr5T$++Iko^uDR+G_3E>Y>oU4*o0mC><X84F7ZFSbv%6)ZBkzYq-4(fNpkJ}*(0vI>
zZyJ!PBEb&MH>!0)sK)*04I~tc?FR{O$9{?DYuYBQh;r=3vUtL(0cw}HT^$&@lG~7b
zUiV@{-GIDC;y&6EM`Rikwbl~@?D;tActe~T+2<sC1`JA=04)HLAxsO$P<O;<b^vhm
z718w#XoC||WwNsUxx%`1qnOKz)!a&zRTYTI>X$d}>{Kc&9f}Iot+bxxOU>7U4L9B;
zu-qLA$*c6+mAcda91{q$WXlANnM|$kv98`8di6x$|L4PJ<jCfI5TCV=&yG~3!}z^s
zjc#90n?GVIQAc?I^?^tDYRE3_>3lq>zVciB?{|jrgU^2LenlMv10ldv5kHeVs(-1U
zbqP+Z5ItnUoS)Jjb`H559%-j59<%^1#uU|ScV7~|hfL?=5_%d$X1h~n7rnNs>Ai<V
zV}9il?{6?B5qhp?%OyQa-xN^5eX&MNdKXcXH`b-2aErfjA#TfG^09UWo*p^@6$#0~
zK@sG3hyccn_1P#ab-&<sHI`@^E9^iCw=N+sT3&`>@2r$d$jv}-n4263ql}-qOK&K~
z*XMS0e0mzeK=cuC(X420xrH~UZ;8`?q77bpz7hp!+-vKmW%N@;Q1~I^RW{1ka(7}p
zk0_FF0o?yx?qB`Rp0Y#kD^76El}GxnSmRZ+mf0ox$IHme9xP!WU_6ABQw%)b&wp%(
zYV(}7C${W=B~8g5m$U8p40NHq5`Ye7#71|-Am%H_b0P1XeN9Stha6JZdd(wSy>LE5
zmw<#W_&ZJT@>ON?=XKXp(TG01(SJ?4?i^%R=Un6=pmsl123=L^hHR}Fc*3}$yOMFv
zhr(h`B>s)|IjyhMljRnIg}H{C({U>DYW0-{-V~Zwsp@u<%3gd6>p|6Pbu<CVG&vhC
z$*)$x=@5^jQkSedgeZGDB693Ly(t$PcTZ=e+B3FG%6UThzLh`;TwyW%>IQ3$U6@;6
zO?}5PkhVm=)skh;<BWb*FDm=G**lOhw9DSsKIWX2f$acic(|brO%q`K3<?Zv)emgG
z;m*hD`h85qZTwnuffjG{!Q=HOFfr`$jjPDGmfg~^S+9q+Zm#w5-t)qnn4ciR`fkRz
z;b+U|<%Nadznr9w<x4rnFDW~|{*}cwRwO-9tJF2FM=pDpvdTbWvge*^!0jW6MaBD@
z?^_%fo(OS&8y~_hW(jsr)h_o%$J-h=Es`#Qu|TKo(n4p6+Taj%_4hz7Tzi!ZqmeTi
z%n>`@Gh2s=<9=*XM#C```+V>)kV2D2Uga)F50#sQYIZ1m(A@ucJb-Io-YOB>{GUw;
zf9uoP()vGum-lF|tDt<>sXqrGLColTU32BT%+GE$QZ7I=f8@v$<rAYDOl5gADOvP#
z$n$_r-%f2e{*{J)Xvff-Ud#R<Oj%ecddVrZ&r7A%#z_2`+nWr6Mw%R)9E!a;{BdoQ
z@bNc4Q!V%#+$V}==QI45_>yBKI0+UXTyOBX6of}|%3A+&bMuU1ecyKVMxQ-+Pqaf@
z=s6w#_;tEPKX&&}jC?GX#xHd~fSV+A+3&xLpQ9gi#SHk{yXy41&JNkFxRNsDaX!iz
z1T%hE5x+5)f3%`|Gr@jhMXPR5UrQCM&A7n%wTL9<+g1WaWs>!0AOFf3F>RTLUPEY!
z9)F|VTYf-VG)RkPh*d66DR<WDp2hb)FLrY=8c-9`FM=%5x`cR%nn7X0b%ZOg0<2Zz
zKt<p$B{xH;@unYtzW9<<DknMpcudIoW;*CoO8mPv8iR~?@4E}|VDO2bEg#gQKX&R8
zMc!r*+&aOG{5f1jt(RrwZh^ihrZ67~Fnee*P_A$rHDSI^794r4|C(%l;p@z&?c6qN
zB1U?4U=&^xPiQ2Tgk-C%es-y>E5TZWP%@x2iE@X;Zy$!nB(xCBi?HcSC^8U`Qm6Xv
z@Eo*?NZxxBNW*+Z1vbKu477soXcn@xfDWnIBl!s0$=}a+VpLe|J!g<->65_!+Sap*
z)@YVF8~UPy>*Ztnc3L|skB|+7n)B?=6Ut9Fh0B#y$jVgOsc)pV5hxN;Rd>lS+4+Y`
zDUJK58vLd9bQ-*tEB7A<<Ieg*8)Ki~thd$VvyjJk+6B|a<uJ0pJ`@oVEPQr5$)*eK
zhNppPrX=Q|LAPSDDygX^J!~yibZce#j?9(8b1DP`T26oA?t9HQv>NacYWCUb`JCfI
zA;QlJL1>AXZv&)4V&cq~ux0jur(5mb(@Bg+L5^2Y7}up4|JKX5Rh4$GjtNzlQZR)V
zEQtw3N?wdN8g)SwnprXdP#HNKzQ|ljk}B)Ga7U46tGm-0#j*HM)`#=7*OWl1eTi{n
zWjj1IWcSvK%K6C|d@Y_RJRPWQ;wjoJHe^x6QR%CGloQ{y9+n#fZ%Pyohxjbt5(p6w
zPudU^B#g|YFQW~F;PT#r&OKBor6WXPI87aadDD(mX=8$=rk`Sm1U{|o@Sg5aAS*Md
z!`J)#F%hltD*=_UzjR{zoA@p1A$M=OJ{q|j&hu^Ew3+D1YY&5UhF`;PJANr4uRBR?
z(Ev2p7)H-Jt_ZTJ%DZzv4rMbXNvH4tk~1EjYJhF7$UybLO^*F`ZdQGUJRLefJrA*O
znmt4VW6MwT1hQpgd%Pakqu#m0?OgC$%mq6lt5ka{JX#|xAhS+PN1;wWyB_=4gn#Ft
z!#?VksI8DU-lhS$OMW2*@*)7{(_<!KeB9=RLqczr^5l}70Q*%S6TxkhR)UcukVwIg
zONQ7b@e+WQe0}`Tt`38{RrdJXJche6nakM<U(br4sCz!?)wB3yzpi;+>1`3r*A)Ri
zVvf=&oZv$@<E3r?BjC8*eF!kS4>wX?+j|ZJ=N8S~m$D9Hd!M8y^KxaF{8l#<K`l$?
z83h?;fVW`7pP^Ne6P^KCaU4R5FC@nMD-&O<-1J*w;aG9az2x+{To$&N0BgUsCU&f>
zTVQ`{MJ+z&&=mq{q9R8<6-pWHIBHf`&`lTCdOWGr&W1p{;Jec=Kl2w@C{UB%$su6l
zF8d_^_-<HUvbx-$0#$okM5cyv1T2BCc$?K!=JoTdx1=$?K3Q2@=~7=xg+I$Latl%}
zRQT)|hyXOVTH_xQ<TJgL>ArKNfE1XewxYpe`yPjQ1o*x)q{Y>D=4(o;7;8hnKRJ#E
z<j~KFsAUGlLq}CG00H#&{RSIdo+P^CEhe1P$Mbgj9x8!Hz*BKK-<l?|RD6VDkKHA|
zA_OYq81LxFJ0tG$$?3GNsaw|3q7@Sa*K)eN(D>S(+yFS>Q*`2;yTezxUGfzlk8FKu
zEO{MLDgIS?{mEYS_jmMUw3^u@4kf!3U{~0mn5J2hA`b-xCBuDG?aVs73c9dqKLM#N
zX{^KuhGVtvP(Q>U60QNj#+U&_?haP#+s_t|IH`x2A33KVlm5U877@GMQz|Jo`WloV
z5&8fd|A+l2zi)jRnx$49xIhvWIOGmiOAiUhmBa*;E5gv(`S(e9Y(Wmn+wceod8Q=M
z6!w)DM5g}5wf9m6MP0~hpif8KFoXXe>fSP{%C&75mIi5%?gmMvySt^OMN&GYQ$Qp|
zy1Tm@B&8dqk?!u8`<^bBYmMi9*7LsKH^$y$?;j2(I-Nh}eO=di9&sL*6rQu#h3zW=
z%K<d<+S{j{HzsOWT?{G+JFeHHg0mEv`81h{JZhQfc}cGM^wDln@P6$8r3FhHYls7W
zIv?3&NVyasXuoz)fq#`)V~`{BR@{gG$v2L8QnoWSR)_^B%|Cml32)ZIO!t_&*I+;~
zgU-bV-=d(bD0VTK)hwnJXpk`Z3Ciae`f~eQ%a-@#+3E@g@W5VY*<t5Kw$V64gKLP$
zPws<cmDJ(sKS+6C9T3pKp-1Zj{uI;F*?fV1nfbzCs+MH^Sck-!if#!P_)dUhyYJP*
z$QE!!Wb*kD#(0R7k?%Ocblj}ybFfh?3$A@Jdf5q?jR0_w$WMa~#%Zk?26R&^zcchJ
zBCouc*k!Qil_C?b<F)n8U1_aGq*RJGZzA!-tPa-LF{>~oZK1`VcOCV^@NI`f_Ad{6
z?rqY*<1<&<g}N(z2xcd^w%}m<rDO@0oWeBw8rC7%(Q%6PS1AJLzINNH=&E??q?{G8
zpv-55_yA=7FjgeE`#Ss+pCDe9W70tyzW4*4G>G$iiQ|TLqD<04l(T#ml~c%79v8-!
zFk+U9)le_un<;os8xp2->;Uhqm4Ea;o%rVlp*qywtZ*n9hz;KAQqk&grV8G`^|MkL
zM79mm9m6uHfCN_#-??3p|M=mSdB}%?UgAt{9yf(lJ;?%AF9QpHA5Z`F1sxio&Ob%l
z@%#OB;)U2b2XQpCmna^AJ!7dF2oU~~ulP~N)yO&K*FXA2v4PRXizi<O;RGCB<;h`<
zoD=0kr`SIYgZG-BFkfS${gAwPD03m4jaEAQff*tw;uGTg>nXdyt`wjT@Yr!1zEaJc
zgG^V5b9-L^y)dBijV2e<#X}=8wV8!@8y}_oC%Dz{p&ihfST*c=){BV%hQ-R?@beBc
z?<oIY73_d9&nRU(@_*bWU0_STW<A$$QxoZPz^GA1@d2(<+A$@rfAMS5mNLXXsS{7b
z7^$x~(C5<SgSgw~1Ks%|gNS5T(LNaj<zMhA3oHz*yp$E^>+%5$D^uwop6JM|;+}o6
zatPXSEo3B#u1)lTrHa-7z&-Zv#k+v7Kk6e^m}=-0^j6T*Go1XPDo^Hd71I^;EEpF=
zFze}CpdnshItyD}K{0$gz6?f7pxYIF0xnVg(w;#R4sA~dCu*P2yirAlN9*-$Kkdgo
zJ?XeGR8va;?~)o@FhejJvtk?D*)pJeFHh+c0|t@^lbhHV*I0%uD7;Ep(CuHPP+o8+
zlJl7WM0ylWAw1rCM03{j@otZ;MseVf0XRKPZIlbH1_LM<?8$-=^|;r2z*br1!KtD0
zJL@eg?Fy_SwAMZRVFStahh8^2xCiKTu6dAX!-3CMUp)O+oo)ga=&a3`0NxgLT=gG{
z2?T~z91vJDu_66ed4~bqBO^zuv=;`>i;o>q+ma+4@O&hwYHBO#Zf{Dil13W+)Pkfx
z(#&Z3gUd={&})CV9i>l6=gt5Qk^F^2+_bn;BlRNRyeeGvha~fPMUa+Ze(M3e`My#$
z`x9=t|1*c;kPq?DydR(c)K>E5PCE=Q*D;MDuy3)#fg>o#ZlNi5qxRz&5d`?q%zqoE
z!g&}+VJ8@DuSdm$VjJ2Gs8h|h6h2m}Kjqc>-D5@_)AEu+zm>{Ko=g%-KT2S&6d*ca
z3H^i(ew?wUnRXZ-Bb6{*Y!SoMOh5ZnK+e*j(s&rOC=<@9^gG&sWvda-&YCA{sRSRF
z^d(3Zf^5mY))w|Jt8MnF`-?@w?4xx*^vP+^Q0_<Wr1C(G=y%D>maIgTD>7EBO@6q&
zx3JT1rk8Gi!~9V)Gl=BYy(TpRbvMw8Ektz0j}Q6ciW>{X6|OMR=ML=|;{ObkfK66A
zW>xCHo?l;7yO~9NFVqxe;u0C2MWEt{zN6xM6+ZQLpzVn^4YFT>a)=2gRy_9={qI4D
z>{Rc7XYI3%EZ9+lx2Hb3Y|01XDTWq=U3U};@$XZkhc1(s3l)-dyP(Jbjr(t1!tQF;
zbi6r?wXL#rh+8D<A7Gv<v=6~KGLc)D*VZfU6?6yREOyO@&Pv?F^6biIFo9+UpqxUM
zw~cskPmVvNd?ZKb0@Ks#=E=qhlW`7^1wsCzEFXYEFeHSIT?)W>TFh0xXiUiAEV}XT
z{q{YLjUD1%P<hV?Q86Q;xG>pnDb&r{{}78vPPxEBS%?JF&_@561wj1-{k;@AcGe$C
z8F3Y{Cw~J-0FJX$IUA7#tZcD{`x_Zmyy6&aGO&&QvuymA!G~9rz<Kt}a2)H;6R({I
zGONJQOLxlE#x-dj?)EOHtxORX_S_q4*YJIsTWcBd;x6bK7<~^G7Xp3ljZee}Oi}Eh
zsp%ORPu&zC3546L(yUgfP4bx&#>Xo3?iV})UwDuSb1S;$+Yb^=Zux&?M@{Q!a|iqK
zg@wWVA!W#})!Q)=RLB!9Q-)-Zp+Wy2kd}M{N0mODy;K4=h#??Nj1RBclB(AKXg7e}
zM`Hxtsk9@gIr?FRbaPptj-nxPE%@TEP~R#6N>xD#Vp(nA<FZcR1C;18-uZJP+I!CY
z#_gdiSUnspn}oKJFlFyF0+s7K9jlVbsqMCrDHKofOeP)A1C+)3>O#=8?}WR=erMnf
zy68yzf35U?{EeCdux-@5e6)yvJ(tjDzGDk45nC71&w3HV@X8l=z2X;VX6QXzTE>^>
zOYqk(_I`k$O5bOpFpKj1GMmW2K-hw!G8d7ZK%|G0E3Nv2&zK9y_=g{GIZ-A_e)2Et
zJ#7m%aP`tweGSadBdAMd(5`sfc$~<E+j1kZuG_KpNxPF(*=Zw-6oTRsHM;U5;d@ku
z=xI#zQC9)VpqQ@rR+ex&W0OJm33VnexYjUOIK0zR*J{$4iP+prCi!3oXgXN8v99~*
zFb1+naFa2lxkm6m;RKt)ijSMjMr0TNSD}&@pP|cn2$zOucMN==zS{-%P&O_C8ntPb
zxOt)PD?t)l{qAPVm$KVa8fb^2Kl$gU8$e;fH2FOIQu__W7HTd9*H7$|4_7V26+%Q|
zo80I#P&RE#1&M@`j{p<&u#2<P<nESTSJun+P5U9-FXa{|b8l~Qd24cc$3hK?U*P(V
z&@u^ob*5f6S%Ql=-t=q)2ooXt4`CwffK@RqnMmWeu}l*_bTiNuG1l-vB&*r0eQsi^
z1b?IHZF<|tiIxg$58DX`+oW`g8>VxL#XfLhec!ZV{|$H-i5dv8Cv1BcWGFriAOlH9
z*4sN{pdD(=MdBCd1!^-|qAJmB>>P$t>@r<VOXvHUfr#wbY=_VlR?v*0=<N)Wosv?-
zwx+TaMV_^%a&mG)kiXy}_JG8fI2jfh5Dvb}!tT007m0z!=S<>tB%m)3bMWN>DC^nb
zJh3fwLULokA<!xP)73G%OV2QVQ|K3O{G5!Rgk&86`OhxIR8`7k*nT*&qB<GBV*a-d
ztAEgDRvIFpXT>>V;q4rf{2&n_T)itngroJx-_{+wAcX#KYF!X5X<n_W?utTkh%dc>
z{J{&=Qk|El-8kt2`%rp>H0}JU`F<ML)$?QD*Bqm_-z=hH-t|hEmgTo?ks53i-QtTS
zP91U7)uHrfb42Z6!WpkglP4(>e3|ZXy4dmNFV1L{#^1$Hxr=$!6Him80K0SU8;!ac
z|GAxr2DcO0()z#mCdyABG<9t_k1F)O6m>rLF=(kpH)YrA^ugq#SN#0K0_Bi=SfQ5J
z;(V#qV|@g)6e+iFYO3CjYFqjE_X01&oKe2AWuE1Q1#;xDC5cb7DV*OX?A0^VsHIY*
zwX8{P$pR0&g6~KH2n6d&-a?xwbNv(kaF>S_LJ!(cm1iBu+@}+-qx^hyUIyu*)m^Jj
z_+`nR8uq@=nev4P?9j^IYuCR|Ei|i*D0A?_>M?YmwAVbZ)DdjG7ahU5;?wZM?Lh-j
z57RKs?8j%m<+y)<l!Z*<HgY6DKDYStL=*QL88yuW?G7n&Rs{~_0DX~K>Yggrvu+8d
zYi{T!hDjGbCDc*}U`v0z1GcozUM1BJ?h{q@a$STs+<^uF1qZcYsNo2sS?mK8LHYFB
zMx_XSblA1>8n;%~?SrV{LzIhw3*gAyroQRj3Xd|~42$AMyx1LkNMQE_5`4d<?^l0s
z+;j!(=9_`oXUrdc6&CaZdU#5JVs=H+_NIkczg6Zz!v9t-jRUXqpW8uzcLV2f!2~=0
z9=%nPOHU-&{8Th#4UO7*r{?dWnCG@#@`&g3P*7A90}P{%k5?WJO@B8Q9swS@Ff<QO
z<J+M*lndC~43jTF{1q?*gtaJCCfI3SDa6Ot1x>e!B<oM8&GViwjHprKf+QD}J|f`L
z;z^WbJZzv3)P4Y9l7xkbAu>*Q$HNyI|KmM51o(J-uC+FKkbM0JwObbiL3wqC01?Hy
zk5+TyhsYKRC=S4p%81x~5|*DU5c3`oS@m+A$kCyF!O&8Pp_2(rRbrZd5wZ<E!*zxf
z=VAc&8pudC+QBehA36!E0i5p#67V4jzzsSuLvfWv_Ps;h1Y2yhv0tD16fo#+soX54
zJ*9bOAi<3mPmtd3t6RQCJ54=K>$`&63*#&|1w0ztMp<{OE&Lru57Tnn4}BnhZHkE2
zbf{xYu@!%9l>Vi8l)m$ez{}|=4k-ttPq%Tm<9ByDN(--yJUTt-L>3hPQGxviekORF
zrN75<Xu%xN-jfVN%F@Kk=NF?*8ZBg{O-5mM`OCD+(;Vurztgs%u+&Kz1RxZvg`ELm
zQ+7*S%RII651&wxb3YYJ=w7FK;Z2pjx%G}@#ee%5;K<m*wLc|Ix^TM|Aa_y-wXCQ<
zC5|lp!g7c&)3~#4j1V{Jvcd!1r2yCt9~Rm%j{S9|LvH`<{Qx27Pz6Z=07+Y}s>s3r
zcY!2EXk1m$kC?}{rB*$y`HH!>h0C<wN73x3eGZ9)g39pw4HxNzw~r9!R)mR*bCbDx
zuas=OAYOwo*urT%xbwpBS+?>L|L{ftwB|qZ)sDbmh=6YD`EPHs5||TO&x2fgE|{MB
z_0ri%Mqe?{Zn`*eeO|4q**bA62wEz=86GL$BqpZNyj6vLWKYpZrHZYtI-VNQDyYS3
zY556Y39Cu_Ov2D5_BZEXL|at%I@V95^Z^j6f&R~hali^QjQ20=;27SAz<j>l;d>8}
zC(odG#X1l<A!j9GP_JIrhZdnMe|3Tde17muvLzI^!sJqr&cTU|EE*62L@yUrXx<yS
zQsdJ^!6Q)F!PSjwI#DCw())Ox+J1$bCg{%K&yl<ODU2>~>L9WlHbiYd{J}+&TNV}G
z>l%k!vP(g00V2>s#Gs>-$XAqv!vfahd+~+p$*05!cas>r3cC3tW!P8UO`o9|E`Nls
z@IsZ`;_S~jBR}{(7&-Lxm4URfEKQ$tl4F>uf!;5pHvx2H)p^G&@3ePjQ9ZZRcv)@U
z%A$teX`i+Qrr9_Kd%t#n`(17R^#xi2P>=quu=;XAOQ>}6;R}4uPb;|VaB=B<y|brQ
z7NnAPF*l$6!6xQvEmI!SSTbFdeXvZE``o!VFi^r=t!+JXUgqLK_@MxF?ELEcKJ?Ug
zAXC5*qduaAa@eyX|Lo~lB-j44sUG?m7WgNofRx%PTk>K;&L4$PH8zv@Ei%~D$xVks
zVGnpgO%z5^l9zLy3A3Qqid(IgGX(N76flVUlHt#K7ySQ~Yj}@u)m$5UPuiM}9pC_k
zT3IQ$aZl)x3&}8~v7E%2I;43OOh&)Xv5Pf+rB7;$^^N1OU+{3#cGt<<baZTrjGte0
z@ucptM1t5;cw*I*3tFIlBi+N}3Suo&m>sx>G4_$lj8L(wCWWIu)e6i~`&0fW*#KDl
zj;`Ybe<C9xUodi2+)H2UsPn4wQ0&FuIoeaUi7tymSnHJ*74>{=xD9LwQX@!y{uUs2
z<2fEKZlv2Ho1k;?nZ(yuHq>HJO3&m~C7$(eUn}jJZ!19z*@t#AnPqweHuR~Z=wuNZ
z89_LI1xU2jaV~3}0SQaYUe1r?=4{X%rIg}}fXxyxX`dQKZ9#V$@Fd>dsFE9?;ShQo
z_ynT2dmIN?sa%V=l}m~}zyLm5l{gu;w=OGOyZt#!v>&^rXhV1>VLsf6CAtgQ05h+G
zgm48<&ZpPvB8htpg9_(X+Z5Bu*i=`Wk)B<V>BIxvPqhOVAv{(o7fU<@uh;<S@tLg%
zR*J!gH!s5HpxB_HP+Zbs>pu#7Q5NzrO|Ow<?{{%>>3e>GI{t9Jil0!Wl=ksHTi9Uw
zT==F-0P1C_7LazV%sx~n@pz|$e*z3<!iwMiYl`RZW6Aet{EEp}^gmlPprC_$Yre9G
zyxWhBUcQUzD?_I>HS90#zPbU?xJh5pGY~OIefbd1FD?egjp?)7yz|YyEHljYmT~0f
zxp|6y&^{G{LILck3r1i&>SxWAyUbIAABE7J_+yZ~aSJe1!*3Qv>O0|oAs#f8;8y_T
z+1d)=V?hDCrO1A|rTQx#F@mPf!xHabpm&4GPDAA+?Sabvxs66IHnXjJ+R)C+{K8Q{
z^^c%^qWy*|y%hQdktn#x=4RSK!cD3?528FohqVZcqV$<sJ$CL<fJ0Q(RAB}rux=?I
z7H$GY85QI&w>LgL9)knaRRMaQFslLq1So*tP6_OLH>BQSsG`EQeKg?l0~hwB5I3Qs
zfUMaUkbsC>fB%}$dNjMBjdgol)h71n;B(G9u~v{!7=uo(##uDA?+zyHMllrZ+ss?I
z&IOx9&MO?JsuMzHr*^w#1QmvMFYQvx_`0!Gfj__X-_PUE7gAtM`t7?N)t?)}=L1-^
zsWU)W%pq~x;~cp9qd>S;-DiKaj75d%A)-`*fOed?|C~cVn6ycdl$g_y)7_jf`Vi}?
znDwFXn~CJ}@0;nWTPQ!WR-v4OCHiSLqyZE|D<`D$3r>DAZb#u&6c<&%5KrAE0axrs
zpl1SzZ3WZJ|96~gFzL6vP!IYxHW9@KuZ@-%KnHiT45)Hi`PPY`{SHwZ;EHo_UC7OB
z8!<+YLq5||0!$VEv_F(a7$@V3Z}+sk{u;F-RfC*bV9_r;>8vG*JkimgKZIN6C)&lb
z+s#VaAi&=p;s603m#+gpnR3nbG)4=TUM`Q$=DT%Hf~K|=p0fvslb6tWEF8YH)#nlY
zLz4L+06*jxBxsn8BmVFX^E=p#HVic@p(a$NLnLLT@dNIH)a9p#@C*vdIGYOPs8K?B
zUB})xal6gdu=BSW&CgUg<!r#zXd$0`1uUGvyp^Tg_i4iDvPbFwq_MC3`(hzNnn*wA
zE3B-Q|9}io>@rUnLf6rvqs_lKMh1?}B7WY8nR-6rRQNRH4F%3Up`R}HE-!ID+)vx+
z{~V8KUog)kncN6WG3Z|puQV>t^d*0A!xq%ShzB6ZFz?&;05fZ#N*BGO{my2?Yh?>M
zp|==a8_-~Uv3YJD{X*^^dnbT}_65qcijNe|@A};hUD#mQT0gf=A==i&MeF(SFy3O4
zV^^)`o>X1UM&;5U1H9E(JUuH*R=rrq${xRN$?cW4c2TX`MDt-F?TH;{|24ro8HTXh
zdF*x)rSGXdC|DgWe6QObO&iwWvbA{xxrAPWB{9<S$}9#4`Jf<l6+%VICw~rK@DqK!
zZC{K27grgw5y1TbKDPl8I}eJ&0!1ofyT*h#^Ass);hz}p*}&iQ#5KOa6d`mJS+KzZ
zs&gLujj#SH3mhZhx?E{PU4bL(G2~4YT~ZcZdGx;lpL4MvV)+c7%g)@WdR^sxMSzJ{
zMu7&@Pg{e()XyF}-vbq(XhZ>{QG@#}7dGst+lX#tg05)SE3y8kCyPOeoAa-ySwZCK
zt?8Nfo=nnS0Jgxe&=LJdY>@*VXlA1r{=H+QguvJ$J;Si8tkF|O@O*l%!6XLh{7SmY
z;tNR`{wA1s$!CHbQ0w%_vq&y0vWcv)vU-(e1HX%ToqI!z%z=JqH0q5henxq?p2hL?
zHbcfap4{-*j~~hD^p(I0HV+ao(uR)4YJf8da_F=&LbwK3=--17%d3u8bg+59OkraG
zH<`j-U!brL?15VN%$69Ii<VeGv&k>)&-5)Y-gZ-UlG%>yK~?S*3m2#WL)hkoMTwie
z@q5akmSJc7)z*!!a9a^@$ZPk1$-n>Wi;n?sf^KQk-<tqH5U!E%8V{q|pov{i{>Ab6
znrS}Ul$WlVW5;R>z%y0)2n`DhYYdElXVx@06|-@0BywUT!Xj!2Z>Pb(nyEgPXXrxu
z8+1U$kLJ4()AIS?^?@R^)7hNxs?@l_>XyLKfM#sr^Dv82a^qN3Fl;{3guRX_FfsUq
z{QusuqZpir6yL|Px;n{e=aQ(JMe?{st)kjbqPCRUkR`h$5Y0d0z09qi0dWRr$c1)#
zz~u&?>VQ;Xfq5h8qu<}~zq|nM6d>4?JgP9=`1KEwbiQMgED?bbT!l#{7x$085Ie7{
zUctuH7I6;L6><)qfgeH&^fd6YOw}f_te_;y?qIK=Zm@_`wD8WyqUzW=H8X=60@j-%
zVn|^{;PNxqRd?nvy%+&3YCZhK;0@^$3}A4JSkEFXA$NCXE#_L7zmMqu)JPEO11Zrh
zcVX|quD_qiq;Aleg9;Yf%ap6URpJGql~&AtZnO_4hF#S}l3VsF+&iwfO@3-bxBA(8
zalDUu6cK!RrpK%p(3cBtO5uxELM`j*>OCA0DzD#9wDE8*NK*ChyloP!F!Z7fXEORt
z_5RDib0{o$XdhWJf&JGz+Tqb~<&n>%kAEDTwk+z7&n#v<Y8|}>?imol&;XxfO2W`U
z3JtZV=fn8qT;Y=3tm?VC2wR`nn3%Do-Tv;1us#}((4c+Ia%d6s!Xd^6>!3K`Bd(4r
zJqfonGJyE;-(UpVH~*V3!u!V{kx>yYW~lC8&aHz#oLkp#{!mS#Wfr_eZmcFl>}DbG
z{UCyPm7o^HNMy)Jmzb7IfIkIGOl<(Gq}Em#mMS`!5agMz6~5@OjdSgN+N<EYP1o8Z
z0KXa+aTvD)UVohVb%QgeXR$z<G+flyKMkQjK|o3aR(#M%B=PTl2=W(RKvh}f$RT(J
z3kwWvYZP$yTnxDF9-K0IG<mcqbY)Z{FnH_{C2$!w1BVW!z2|`wr;MUaS#_9Il*2Gj
zPG7I>0}gj_r7y}w><!i~<5|sa+}pXixuN+@r=a0@{3#2y!U|XhFaREF$I8~k?j(w(
zRNrdN=Zmjzw5(YTZQAeS!!XVIfqm+O_}lLliN>_@fe%nl>4ohUqUgb`?1rZI$Iiw>
z93Gbcy{Lj@KmPywyiJ3X&{mcJ6!5jZ<58FO_D);4t;2UchvBDB8lfYxj*9R!$Txg^
zq-op;^43g}Pk(xK+rbF8vDSntWo4C8%~m5_;x^DMpu@g<<WM_7I}D!B!Sedd;`tB#
zt#2hbi=&dCO)m78X8Ak`j53&=){mWUT3hvY)KJ?l{HHGR6rR^G#5{n5ur}z`2X@)t
z<&@-T<;tf4GqE`Yc^Ce-=@Dm&k#Gm+VXhweOtJWj-!M))=FiJ{6$p#zICZn)*I1n`
z={ZEP&Ipq5b6QK89QBfkI6Xkr3A|VA4#O!f!#kj~mZK--S;cb#^LM$T@KhO?Xpt!6
ze(CL!D$jDHR60n+o(Tv=GLfoXf1!RZB7|0u>6p!#Lr3)`K!_CWb7bnl#-aDH`w=TI
ztIK8!Yn8*%A+_n(L)NVnl{C767Kcru#QN!7yTP!-5e4ov0?u2x&MURJl!FSz&bD4d
z=!~qaXj99h7m3Ko7YkBYUOM8o8W=GRXV|zX1c`~R>R+EvJWy?kX7nUVeQV&gddhun
zv-PAWx%Yzv$fS*sF6~Q<<wk;%l8{cHG@1Z|nFAv0F>J#ZvrCFgz*U%PcJIrVj0VgB
z^(muq41ZifdS=t@%tyr&zJf+48XioXIvX^EMD`}DjD^rfeVw!?6cdA=p%3*mopkqO
zaIS&^TV~^!sIGVc&PP)Cw*(@bPYeU)BiBeRF%1EVIvFwp9xe|2D{{|^KP+w{9p{=I
z4nzo%XH38pP^=sb%qHaPGTFhlEsx=EeNJf3s3KPsz(=RL&B{Jwg{GHjnT3Fd{2n-p
zEHvr=>yv$jJnvm)1u(B{vpi(yUs@bc@)%p3n8d~5R~ri4rZ)fR)3eAYD=aeSNSoSV
zHA_qrtpWbNRY~4h2u}(23&g+wL5c!3$3hasIHmUcExvt7#eK+UAMgb&=X0in4tK83
zP4b(v!rYp83o<goCD=G6HaSY)xVWG`T$NnyEbfrlHy`qyJ++=qVew)(Xk6n^Rf}1U
ze^|*H8NI(jJlh|9f}^dXB0400!6)m*YE`un2WiR#avbJ!yZ?woNb;`uMQUs9yawU-
zHhYl2;&`U`{qW6#{rM`~8z-T9gH>|3)ts69s;Z>vbwVJJW&q;mlaa@dZ(H2Ef?T&v
z)i=4(MBm#^m+n}18VRh~JK^?0>~o&|;a)Mb_S){eDPEg7;ftkB){4tK2F#M-jTqA`
zX|bSuSD~Yj<@+dsn`;${REN!vY|evbmNEfVCPTS#`tAd>;lxv7?jBBCVqTUKvT-#^
z@80pM%}l=H=e&uFi%ANs+-FWQUbQk)diwS2G@Ti#?QqP2+xC%7|6Z328BrTzHV(`~
z?Z<UU-*#Y%iHu;~rzaU?63j=4157cINea)daQX6mDQ`byzZ+VQ$VS93f1?RS<k2Oh
zU5{(6&Y(upHhdC85VS9B(r&sLB`X7V@(}?}zD-;|OVRDG{Oe-DLM(y6OKKtT*uNw&
z_P;I^it!{cico|bPeK~b95>Vo7-D*(<vOgwL>m&SbL;|t8Y#5=2n;c;2wjrW9I~GE
zQT;UXwXYSEHem#C2a?XCH9{Pg)A9IeY6{hoIbx=lFu8`t-fi5-JK|X!?WYfyI=flC
z##_7*arKk>Aa7CFzunX{IhLwDrDT*+E<HImB{|ZvD1X&FtB}UL&$v(N*Hg#cb4j2&
z@w!NA&6~uNuPjc_qb})i4HrtQm8~M=a<MgbI!Q@5i(sIjC@-Q_^K-@>Xi*yE(PBhe
zDr$u~_d-;EF*}09t2AqF_q7)(|CQ@7;lfy{WIYN5y4-sA05-1OSBo{4;(R1psD7W9
z>HqYDjwK!Wj4m>t>92i2n&ykuU?|Www@neRt5;s-RM3DR;5;Z*Sh}f|`>C8kr}_)A
z+dlX1&f)Xzmdwf!Ao@6Os>j`?f9a|nv-<7HxZh=_(r_8ovQuw~*|^xz;0B2u=IO*p
z%a3c?Nfz&!hX@tKk-!LJQsgsz22ClOwg-WhheOB27e?4R<Llq{#_W1MMxs8o{IHHM
zdsm#JpW^<!t%v`8Y&($O7x8$U$15je&OZ35>Wt|gSunVK_WEJ$MbH>^^bF^oofmLF
z(5DEt``&NjjuV#gN4vY3Rm{zw=d>%sfcp)x*3-lVt-XYAb#)i34OTHGG{@N9P;yS0
zm{KAo#-Je!3FEHwUTQ`f$-<%H^B~!?)Vc1@(&5&xX^#)rltM!XKw0_`!WjAk0{aVx
zg3iu#vP)oED;av#h|4Is5kS_JYZck`{<2<t;7AfeKaSQFNY6koyftOCT2aUfZ;H%<
z2+W9l>+_JGktBT_0oG5xA|;Xb3eQr1{VBM;SceX_W%&TCU)aDpyszyMwwjO(@x=7k
zWl-0m!FGKpv83Q}tp{I$buRdMGG7=MT+<z%)WD?+Iu{||L0VqOMhJMGas+$A04wrP
zAd#d(-~Q!NEp>geY23(Lx1B<`e)C&GWjPlu(;AuEDP?(84Wh%lgu15fe)rd~&#pgb
zC7GYTzCqpkG%;i9JaOZF2-+v185NkH9<Okp2}&HiE{;>UF{(a#DUt$hIcp$7l2UCG
zC^({~Bx+T4ai-(r+Ci3L*h(s1_>U{@=W3*UBSf%?IhHH&*V<GHhOml1GKEK`@WV@Z
z9zLJ(cKV8`^+s1uPhw4jXud4@$J{+L_PBq9KvK#QL+0{aBM;B|yt{k#8rxv!v22oM
zU)7KeWE5<b;bS0yO_uqD3E(+2W+B+53i7;M3cI|YE0yZ?@3x4K3q0N-8O(f<C3)(P
zUiAKr1Qu{xmHBl<BHa17WqjK~_}$JjGYGD<Koj{4!{D$PX47qy?G3crsXw)`2V<o7
zp+v49QLIAlD*gB^MvgvBvpDs_l~660>xqmea2;e<)RU(Hd`}!t-;mfM68g;Bsz3+8
zt`jzbyslmS5PHZ^X~aDH@a!=HA~FJ67k9W@pw6oCR)j)BARvC!qq2|?iwbzzdTB<{
zpC!1if5x_!rL=@=#2^gjUT9kA))$8?5BP`E4WFE^noP2%FN81y{)XZxKiDzjD7j85
z0_*96r_X^>e(yIJdRmqs1<%^X*=gYLTy3N@lZEb$AkqDZ-1XCfS>|V}DFQy<R)ltA
zK-|N}iZ(W=j5fLwB`IQga>!nzJi->?(oV*Bi(a?1g&`}qi;8aB=Si{LwRY-EJe3Kp
zYz1vvk5w>uMy<EAk9cSLsblgui^OH-URR73+g%R?$*N09i=s!TBlv62&5|zeXei(N
zm?nZcDN4fiUeg1GP8OM6EbL<FzNcK~Y%yF%uCr7{VF4blnq!dHawp`Uk1=2wMLq`#
zcG~llUAe!idb<yx<{)rhCiINzdDXZnn$lc2)+k$9A%_u9?W@Zex8&u;J=$M&y0Q*L
z5VMAG=-6PC^vmBaF7Q2kUtr!oFeky~PguP5dALkhrby)D22%fB=3TY%+1&!nZ*8pJ
z<++~WjJdN4WG)>ZdhuR5&AMDVnGBN*2HrFsdd4rg?GZ(5qmB&ER5lM4qdIps^D)?U
zG=OB~<-;DDH>N|TSkiE4JA6tE1$>(zlCq~*1lRl{ws-e(-A?IDI`4rSlk$OX54ex3
zAUAh<kb`*$Yn+W_+F(tZN$!}_KuE!lu+s!PR^&ym)r}9Q;yo=a%Q*$1Az>vVpqwVe
zSYjaq$|*O(*IwHmATLQwj6|1im+AH-;0Z0PJ-i>Y4m>HrTM}#5`p{1(Z4GBgl~~;H
z3bGx-y5P(eLcd(5?U%lhqLchiem3zqFu#Z0aDNTE(W6rSvY0;Ko%Y+Q@Y`x!ec4{W
zB|<(QH0rm9rXbd*z77bdDAr)%R0u^_CnA)GB=YAc!V&|sZrHCs0+B1#e?+cib$dSM
z_Ceh6Le&lfUDc;$jG3kHGN2SS2~NK0Wu4R`zVCgCmp0k_wfUF0BU<qp31@C*7@R3(
z-vl*Fz01RhUD@xjnL@=oPO|8?1JgonRY%%NKInl+?=G9HIE!;xQ4c{39$g!s%*~Tj
zNvs-v1W}khOjU6|KCW`O9dA6|zumkq3Lo+s`KmhZi^CAI$rd;r(VCjUthk$%xC>iY
zTI?(^Vhlp13(R_=W)+W0DjxJ##r!vYr0+A_QNTherHb>{2^Tri-v5(x5urW6^yKUG
z2&||o346((GP$rI6o$N7hBji#G1mtaEE!h8`>w3!?<UdaMME_1Jz|lYx2CDyAEvck
z7!&I^1DX$j%Mv}WQbpE!!Y{X-?5ghdk6b4w(%a6$wa47{<k;N&fy<8+&d(aoc76<$
zvWofxYb%5#Qgd)<ywb9vo7!=56)wT)sw`uaWqEvD=4%|AQ(5b+#l3-K?HE}};LXyK
zUgFt}$Ln&l7bRbNC$80cmBq!qRRWVx=iTs;&r(u!9f!p=Ub)K#CE(ef$B$L}ERQMy
z%RY9R<8^IuOksmoYiiQwi_YfsozGF>$<UwLqI#)mY)R&`N1eu677GZF#e+BFUZg@|
zr;tDkl}3t=4#D+Hc;o6I(TD+z=^v-#Y*-(HJsN&WI`VM13G%!%w6DNh#N7R140CuJ
zNPV*4vjKk{h2Ta!$(j`$du6nb?c6|7)b8Oj5icm~LdYgYLFu3aKu8^YaJelq_e%-o
zfU`_OG+SciD5h%uEygVz%C*LjHr{d~j9@<zmVDy<Ko&9GS(FCaU_ep^Dk!57VO8cN
zjue+<WmwZ`L=(Px*&qY+3m9IW`GTq<|3mMZP-0j9hrpXXMO<mjp7Xnwqi&SOo0I*{
zjaMUa)aqkeK^)_qWsc*M-j@-*1s7lZ@y)lws^o7Xn&+fv1h-Rm9<psX#=i_z&XahS
zM3=g^H!WiCrB+FtB{c?<Jm1dpXVyy2b6Z*+s_y3bo^arOos@Il{dtKm#TRM6#yAjV
zwlSix$fCi#HQY2I?)yfSU~Okl1MvpRTS;fCEMN@rrK8$kXW_qDu2NAz$yJP!bISRv
zJ$yhamP0;!P@A8*wdZWTyM4L9vMl0xA969qr{ZoE=AzEo6lbQLxAf?e8dKV<tmpm%
zpUpVViimqy=1ZXK$<>bmo6)<Y5l0=H+ng}7Jw^_WQ(KF8?}&Hxhk@Giz<f@PV}};a
zncU5i=XqHiNVIO*u5IkQ;{@_fd={$RE{Zny$@<w~E@Rz224{%3u!CTl>AH#nPwez5
ze?HnY%aJt-=-Y|p`0ZW^5w7+3Q*55S1^U5S>AhlcnzUojDzA$R&WTXGDmj&F@vSr&
zWC+xEQd##_-VX%wNgSPPO}V9sC=Z96+s;eV-<Pmv<@EZzT@+FIANFO>zkVv4Ah-T<
z#q562K!5OXL6<w$-o_~B>|j5fKr^ms?Htjx&~taX+^lH)J#D%2cy4cEyJ|!LwfIHp
z5z7OL^|*eu8C`FFc3@BLLTG?-?ihKoZ;v4H<~&b0N>=bTn{BWFGXR)htVKG|&davU
z_6sqs4E3?JOMsEM4sLJQfaR!qg?BXRX9-cX_0@oU0&Y>1ugwYqxUML`z@<NxVCqw7
zq#rPMBy3MQaeV}?fkprj_aot89$-XJgjH~8@GH4(37ulH{}T5D?!+`teU=#D2)#&A
zUXcMoI{M%s9m0_24(}A9PB+@GH)ujSLAGyzvOmt$aVV5;+ZFB$yN*V9JCo-F_5A3`
z0M;kFNn#%|HUk&9H$F+*q6kp^F0kK^kY7$tFG=vX=sG@RZJclR+JDJuTCnS(Ei5{`
za_1U3Ze{2}I#RA|xEmZ(jXBWDOV7Pv*C@z-7d|iyy}Z;Nc7(I#ErAq5(R6RK^;Yoe
z!*`-47pQ|OtFRY>M<a~qX$ioB_rIsYo40&JLR4oONOD`6dyDV&q_KFxBRnSe#+PZ1
zMNkQLO7B0eaCj4-&-8a4Q~nF&<B~$r13^27Gk3~!Ic~0juIBMaW*c}ttaz`D2}eSx
zCo*&D2XEh^@LvqJ-SXR$2N74JPElG8M$EB*Zj+A22yB|yx)#kkFU*3hI9b7qJ1(H?
zW>Ga!;DI9gj)~Vsa`|y{$wb%d!gk^cZ%fZ4u}A#zh7J^=p2ni5UV@0fNu#J2*IIiw
zd_Moqn&TF8_R{fkRqreQX3qEfr8a&G)w=H{4m|gfHjP8c7kR0!QHM>S7ZjioJry%%
zYmvB(8I5Hr5^uKo;xzBWZ)_G~wcH&@$7Q9Z){W~kZLC#AMhr;)Ci-<Zad7C5EEg!d
zhubI)<~=S8b_BPFb(a;p^_(cxhF-U!s5^;!HZPcZkL9jR)4U*cyKKm=-#q#O7o7|w
z5p8-`^s)7GvPYz!KD90fnqIukhcFIW!nH_7+5>#0D~drDl!o|i9h@i}8r<n%?8NsW
z2>v9KNZjxl(a&LFL_9-L^ozH)5L^uiPi;jegOb769;y2labJCc)8aIUJj55kO`U!m
zb=Xy_HQ$^b;m3wgqQJnubQI`K;bH)*#B4?>bVfK?pB-9lfdP1c_1Vt>R)}8%tmR=9
z6TT2Z>=(e=eHAK(_T`hmtNE!=MjPsPk-LkKXf2VlRzF*!uP|_xaNJ);1}SI;DT!DC
zYj`i}Bs%zfw|c%!mWUZn-V0Bd$23Y6jJN52)8rRhyKx^Q%&cqc!abx#sXd`<&1FX!
zMlvPXc|S=rx3jc0uY&kWS4+Yrg}eVcTEfG;5B2pz*d1JQ8?6+T?cic4Xo4VithnI;
z6E?U*tv5W~NqxX;#(q@%Q$dmBrHtD^z?i4wWgY9iYpLIEQPOo)mhCrGp|h=q^iI0r
z3u(Y*Jg>Mb{U2AgEh_-ptvMWZ|9aOeBLia~$Aki%b<p&B)5Ub}m4k}ceWB41@)S!F
z<r;I#J$1{~BV71S07B7dYSYnrpPdHqqy=xg&e%+cJ$fIU7e-r7B=+!K>)8jH^%_Hm
z+g6@iEA=g@3IaD_nb({Y#lI$Yy*GE;Ud<bFOWw3*8!T%&6uaGth{#>mamO4=zNt8I
z=(=hZ*S2XW(2COsZbdICv2yJB9*4(ouGw}vUNy+z9Byd6@tNMM_wG$;)G+TJ<ry^;
zx+U^~y+^-4<V&a)h9BNdR(0tmt<4Bdj*jC+Wo^=+8ygT5I*@C*bsTydr{mRf(z2OY
zG{K?m`H{M$2G+?wx^-|CG`DAyV0F6p^-M8iGgm^gwgf5Lur=D$Rd6elzMv(iGoan;
zaid!!DG1ijqIv_vG>K5#VT+N4NOy=r;*~fzr=~5ACO0U6eOB!B=&&Ba;Tgv;L@2in
zC$f2@D9bAWI{NSZtQqM(^^wt}9-5<@*e2-&_H-3WMj2MTr(&I`;KLfY5;NSd+)hEt
zH2pn&?Hb*f9e6I-UhMq1OTf|u9-YAR!|MAga<~^J$&uTJ!d}3!4UF!xIoW5TPlXZh
zK9^|$wDzAw6Fe)xGQb%o!Dm7Htv!PW#~T5^zGDeDe0t;lMiT95Ztv67Jt?1L7sHQe
zb#I^3vfzxm>Ard7-*QlpDD^LQM{6VjKKgvJQ!g`~OjCKc8$}51C)bck{OglNAuql`
zUEVWKBxP(^$==lOW~t<=E4?$#q*c$tyt2t&tUGR%K3KxxG20cKFLqYuRKVAlZo5&w
zggDT0aNo(}Ja!?47`UJb%|<Y)47-zjaHC_i-a#JiC*j#?mq@HM=KxtB#t3eW4D6&t
zRH2$i5NHW=-oJ(R?je6&&L=8ZZ!g{I4-w9GynX?IzIOr<oRjOsKAWFXhgk%L-c0HI
zwXXk7*FsAU06l#%`>C2g@nHE&)^c)S?$zQRexAt+_GOa?^YZ<n*|#Nz)bhFdNz`a>
zfd`DC)Q5&Oms5$ovCH|lrfx2<M#aEA+aTL%OSjDi4L-fAyR=2K{di>)OJE1cjvs2x
z&1f1yrZ}HgP$KV{rn)znXO|V0WCC=Q#d^Zs7z^{zkGxbzBu@bs0o_5?gn?Ho8uD#C
zAT}>u&r8n>VEJd>&F@*~q6)-Q6*+zdS{B&7607NxcfWd;P%f_;wH=&1;vo6yz#DIY
z8^VVNUmC*2XoY)$5`J?=$ylresz)$!Ya~3hUK{A~!tKWnj@j31HR*6^ko^X`ccvDJ
z*PFn$3ee1Uk&5$q5p+M4d3@Ui^VJxAS+n6i5Z-=R-K*ikv6o{OA173=kQnHiU<h>O
zaB~K}usNh`-B@=xkXt_jbW#0#&Uh+9BI(CJ`4t2(qrvl~8=_STE40Tuh{p7F+JTi@
z`)2{jw=1NmR1D?rLtd;m6gz&f#kk`_a5#3O*i7MRSTZxcWey%2J!I~Y2*+UN;?xLW
zE`omZr?#lv=;UajWB`?l0PLWPYjj|Mlp8Gz+6Ty&Qc?&6&sf765l{{kX{x85eL)N%
z2OK>_eteXpb%IK$Ok9!teIM@z`Rt{CP8b|>(f5@?8v?}v;Lv<{EknXdv9Tkq;1{8B
z)is<0Z;&pe0JQyfWFP{hNyeNf>#1d=L-lY8Vo%DouRDvq6lgryadz9@*ca_Sw6dFS
ztF%LYxKD>QI=w6==5cu5X3T8Ra2k(ZeHgGWcWf%Jt6(!!*%pPwl#TbeyCyNdYvf8*
z*L<Rkx_E6yplkacGt4ZK!hae5DsSU_Y2Qr1!J6Ec@5ti-wQA@g>|#8bIc=jdZObwU
zxm3_gObJiFIh3S$GY5AWhb%nv&qe%i3A6H-FM*?;eob#CG3J+0;fulIBQd(_<&Wyb
z7EZ`(F#Xn<%eAI)kYzch=|&gH>(G0f?sauJ$Z1ReyBFe|?L!U!&9dWO3-Ncx{f1rz
z4<ioVq{h%Yf=$i^11k#)%WPsV{`*s7MmC#{Hx^p83kQCQiAme@a2`W=1mVbMm2FJT
z=dW+ycwL%YC`%HH9kqeTTF%R6<a8xHj^_F3@8gp35lhkymlnGo<9I=<*Yjt4O``(t
zo>TP|?1OFntQE_rTkfGt9DJWZt3e(Um~)HU-Yc9}nRL81N0xQ$)oJb>G1c$wYCm=?
z@*U!Cse3v1-)#E&0x8vA`qnp7Gs~Neha95%-wogKT&H_3CW+2Oa}2f#K8QA6y42ye
zVN!?YrGbtjl1(mNaSn2xAf0V27?24*2D-96fia||v*Uo~M%i0gwNo^L>$OYjMM#P*
z<!z<1iZ(Tn;{tkbK<9!Vw137L$HRw&|Hhjf0^E%Uvi20rPejr363d40*01+sLS|z3
zk(sR_GL5nTu$36bke3qej*~p`mg^*VSE4Nc=S&8ewIv<=8~JKSD5~HC52pfNqz3Pk
z$dK;ggQ(iUTnUKBM-Ujv*f&5p4abL^A=wrU_XlvOrfra2Z0VZ$wr-j|+_S#WN{Vy>
zpLD3dF~oNtjBk*hFXQw@46-l}*tLytL=%v0=o2We2en67zTB!@zW6aM(D<Vi+l`m=
zU6Z#v*-d-O?snheUg+GXBj<@67q>Q6p9j|<&I#<jw<LsZm%bcs`!(BPw;O|t2ZAKx
zPV6FY9$#L3bZ)%5xx7cF3)AtotTiNN9fb2tmBq05cDnC^)_vVdD=lD=^%rXVi{$vd
zjEiZJ%sTHwDrss^{%pPtf?xPZoc&z7K!IK|$6e*1O`uaSNjPHofpm5ycumRpdJ@!s
zLR35N$MJ*O<?3Z*ple-P`o(P^?3_)RZhotPyMvBnpiyV@`os6+2FD$&wrI7_uqR8Y
z`^YCX)TP3C_vb+-e7j}ofj706&Z!lTPuJ>_k1o^PFQtJ_ne{vVCNS~0JvqT_pEzCC
ze9oX4eL<CcL^!M+`-zz=3?F|t<yj~Grt#)I>u~Gf*x5Wc!F#Hqz?;%iro@YHrsv=G
zN6dQQNXD9uhS@SW=FEtA9%m^Q41p!dHt6E)Jf_vw?8h_TR4?5UIxMgzh9B)t;0OKO
zsk3>IMSoa@GIk&|VEh6-r-QnlhBAUiS$0e}6_gF7p!bT2CU`HK0FgR;g%<7f$>_IF
zp6!gbPpmuT(b4cD9kw?+M=<4BP+Ymlc14H5O$ZXz`GJB<+8f(M4k*H4<rkzPKp^&J
zClH8@I*dwhZ!EwXp)(E+#6AE5v7ufBxyLnK7fC&d{dq*1f#dyxfp|aQe?qnc5f`+Q
zq5(l1>wUOdQ54U}yw{1aqL|K8&aihXM1XF(oaiZdd>@czM}hHuocY^9zLz?2&{iK;
zt^u;G!Z*IN1V{%^Lqm}TuX9Mb*JZ$kwRTm_d}jLlc$>=8^-)-kJ;Gtb3`e+dOZV@2
z7q8yj=brhyl;nx#PU3TpG%t#4EKNYh5%cYhQqP$@JZHU>OeK0G0fkJn=#R*s;*d<q
zMfU^=Dji?N@$B^UzUDs}$5>z;l<o8oH+Bwmz45?v)a16KARL`zIV#Vg|2J##FAYqn
z5LlHSg^q=+e=bTPyeCj*Y%_tbEadVTrFfh3@2PEKd&_vH+4e8rA$uI0<mqKA3J!6|
zeX9FLP$D^RQ<czbR{@~7Qg+|m{YoOv$9~<FN8{<<v@w;D$9cSX7DKE#hpQB@YP;nb
z@#>u{DC{5$RdBTIv(%%<p-1C&<zDE)FP*C_J<a{l`%9|pCRN0emg#+fIv!^atGX1t
zMLbSYUfLbbqWdyMk4M!IM<xle6ARG7%QXT#%Frytop+dXT4k12Z&{LcL-ga>vP<au
z-(5x=qfJItJ%oPj#dMMwa6jr7;BDoBu2=pL>`qgTH{xwR(!>A=)FZ}t4_r{Vo#PFP
z!)DU_vZW6@t?NSmaNa8kXMKiB4YU&*weCApGfQlxt)45OQ6^riJv;4?z#F;Th|S@(
z1gIMwa|_~C;3(Qs(DV<Z`Nq<*>;u7#V2_lfrTMg*ux<ltiSHx}w|z7M2m|k93SC<=
zR<BfJ!zL$Pr-Ucz#9NyT!$e0`%*k)s1`gSD+&(h+R$DS3%Sg}qp_P|RJolT!tN@Kn
z%Ebr+=LDYUv4>A=Odo(2K~V;>z*`OVo`ptB1q6Jq_t!Qk=81+5#cD6*i~N-ZUXZVi
z__J3I8~~yZ5I<Uyh#;1Va-oxHN1eIEaMw?fqQ8aUhPLB>x$7bH^Aqvj-;-OvHlqRt
zdPe^k=!w9-x=A93-CrAl$Mb3z=tP~Xt7c|hCQE)<<M*2POgERma>H%P@!so#t+at}
z<RZtVX8hApm+YHgibrS}$YWM?YcbI?DPj4>c-bZwd1i2!#d}r%^>)mTu2+oEO&!Pv
zT3&~Jo`D(pMgvsxp|whu|Detjc}i_ysh<ht)|SN7O7Y&=eVei)5I>VXe1Bt42X9J)
z)0D&q<-L(6#xfv#1hCgAgMA8$7+IWuW&!*gR{D<?;wczDe&BwE{MQzcYX2KGJ&bf#
z;?Wsv6HxZjnoaF=aKoI5`F_tSQNSp6?PWgqLlyT~@<E#CBaFPeX(PoE&{VJ))~FEz
znOLdmRG+HK{Np+bcP%Cs==W-Brr1o*rBr&a?TpMP^G)!EwKs?KrBL~ALs<n(_RZ$J
zkLbep^&1X`;R=da-9=lQGe3v(IeNFrkaJ6S-g_^31X(xUD9|irJ56UsD_*x!Na`ZI
ziyt}O_ubO9#bVS-Z21Uk6XXqab8Fn;oLR8cfny(3Ogkadb$DPjx#O6(R0twDm9Kha
z<GfrRKz^+BI2wgApD$@al?edexb=Optiiglf}YL&Q3!u?IrUQD;jyPJp6gm|MpG7Z
zCSC}*663tT=sWf08;-$|c<xW7t(PVNG_Fz|ZOu2E?!#!cHmy6<)kEq@JZn(8JF9hA
zgP=F)BeePo^70L^h#;gh1ixznS4(>!HeLRyF3#fo8BZA+GO|RZN>}EY{}X`ehHtzP
z`o4|o{|Ug5aNME_e#bAqpf#a$3!{i+VODp1A1gMT4<{WBvh4V>s6~#vD!)PxZRh10
zIe?(dxt5Q8FT(T`oH+p?!~xviV%m!suAialTwo0u8v@9j03<=$5L>-3P(bDc+4zUr
zt>%q;zqdLXCoXV+D6Omn4?E?*h!&WSI8TNH6UCVf?nI13jnu!~LLzKQ)!J!1+G%v|
z4%zYn9p>E9R~xLo9K=JWJnm1~yW<SY*D^#z4>gZ<-O`han^)tCrAHtIQW-#uFU*t;
zw|-g3x^+JO%^SY9ZSxwvdb57tg}hg{DRh%zn{N9Nh%0E|7T|SnX(Q9qo4q(Y;uyOm
zFflE`G1UNNg+1Q5RVVBr!j90%;Vw#=dh>QJhpF27dr_$M5p>!kpZ&#k!%PRd;@~wF
z{>OGCyARL;^Q3YcU;X9h@q$$cQuZDT58eUvR@2R<3(4|5F~1x1)U@h6vXOPli!-Ct
zjyv{V852I<^QOC3PHG@zBU6g9!TW7Yx62!ilnfE%vpf5&J1*<@5mnXI)nmF1T9e(S
zwWZ-GH<wEpOxCw&p5Hg2rz2q>j_e-I82}!msj+cqAJJR>fN?2lk0#~X^R@f<>xx%T
z-^Jt594Ue#OCNM=A@uO4QExYw&i6of{wE}pEX=**bf%9Xjl7LFQ%6{i8#$&42?tCM
z7s%(|P1DZ8ZeKR;YqX{BS{w<WzKc&gyWwkGKi!jWwkrzFsZtc|D298G0cxX->ayWo
ziP=m_-9`|rI=kWK(48Ms<N50<y+NQhh{6b8d<Z*eo^W;?^<C|?jMtrgFKLRy_`3QF
z0sZrWR1)mS&8KIbTkkZX!o2wg>zw#z;(cK&MZm;15pz%S--vDD{}Hi`i7Al^1q8$!
ze2d6~gz$gg@d$_9&H|f`Dgc1Q)=1)YVPS7TfE=Cd{upS9LMW+ARlq6p<^@K`4-_Ye
zRRQ!^zI4t3h#-<+e^q#3YAp_!S|bZ0w>j3QdHUcD>wyZ><pfVd{g#0I2xA{5;Hl(3
zu9*-@M~1iOQ?B$=lyaR4T*(6nToEW|7t)_oYb@y=!_jbs8+k2NDJ1nrnR_IRd7Of=
zS;dY6v3nX54M7|{5I0)-x6>awY~UQec+d}B7(4D2WDRaFbmQHQ*~DG5RsI+P@rFpS
zo9x|fGUJ>e-T7LicI<iaeO4z)N<jcgYB1+CeBu&bwjcKmV>6!EcVVmz^i0!wYghHr
z({Ujc?~zYKz9z<rr_<x@rmFIPWI=HGU;!5QxPGSZ&wi)<=}>z=kOp#h;q}G2K(F<L
zk+sLksahpB?^9wDL4HMsz?6}&b*W;@gIC_FPI6h>66KtE5F^yumrO$e+B|>Mxu9K(
z8~)8!<I6mUoixRk?a=T|ynWQ!t)g(g$e4QMGnd6X7XGXIHu*lry4e6d&<I<VfV~)I
ziu?4)_2&EYI;dIv&F&rcwj`N}Jny&n-dpLOJHt)HEPKKLj_gR8AMvthE8*}`yS+(>
z!%dRsT#O9ozD27#e8ie&VMc{bw!amZP{ThiYuvZ2OEBd(@4VOA(pMOWt;N^>)6vH7
zB|F6enw~!zTT{Fu(NCqc|4LJ3;t(xUt0KBYOFB@iZPl|iI?WyCD=PbrfKhw8A2nc7
ziAYe0oE0PX#x(wlbB>guhfEs{Sw|SY3ir_9Gj7TrxjTy;cSX5Gb^9=t3)#o2ZO#DR
zP$3kN?d%X?-*Qo0qE^k35zNzeuD^&rypRi=*^*rE$#qomXHbC19t2}$&1lm3E_&}C
zJu_vEf)nMtzfK0gI-@>^sO>5j)kP2?5(Rr7RXVtQp?2xMh+<s9Lsj=kVYKhs8W0%e
zK|!GaDJPbq*|;A`X>s7r#@BsCyh%pWQCohzjU6p2BL!rd4&QxYlnub321GIT4#sM>
zpFlZ5gU|k?r*6TU0a<-NhyEN9`jO5~sd-#kbxk#BoSa-nAIf6KD9TKeI*qbf45oO!
zUnE-SjOdfte|uxG_oY9R`6_K5l>Pwd-an2+n`>*PjL&CSE9EaL<sCB_u2T6Euh%eZ
zoX^KH;+Rm_w5;S{9u5Q0O|&I7NIb887_<nj!TY;gC1gO=9%k+Kzb-5+Ugd=A7x)~M
zegk2ai!eiGkh~W?%tB%am;c{bIDEi*q)=kw-}-e!SoO`o8y4q5OFNG()x_Q=US7J1
zMTMFL76CU^hj{59C%p};_bS$W|BJe}4y$rs*M;fsu0e<bN=tW_NJ}Uk64KqB(kRm1
zpdumN-QC^Y3_8y{oO3PLI(x3Qzx|zau6@pbFuZv2;{C<*+|M1(%%jH**YTVVn2G1g
z?ESJCx8xq5;uv<*Rf`L2J~mc7l6z3UeFs}6D<wsHf8Ho{t?&0RRbqYpelVG|c}!!K
zz2BSDgh|`2<LLFYYS#}@lQbv(1)DWXcFS2bwu=e@r@Z?Ilgn;1{0|9_1}&ns%j)W+
z-UHMmDVwK2Y3=OAcl47{PRktq27GWya!UcSr?Y(N>R&$(40a?=a>kf4bP{=^<AKkK
z=6+aD-Zy;$TE<h0-Tbr@`n6Z&oL3t)k9*FtxgQdSP{~-1`@(+Y!Rs=xmtW42lOwT2
z@c%SDdHHFrA+Ivh`$Nr&KPkhN77(ypf{-jdxB%kPk8JJa@nMznM_k7Wk5%Y>1rbcr
zQ8GcQY=WOPfyCQETCc?Y<#7Ot?-hjN3xst1qWB{3{J%i)mCg|KGF5+gU+rH1wJwae
zc6Pg|ymvdOYt%Yn$w3((#G4z*)bRC7+)p<X(;q*cXE&v!SsF=sBBoG$PXyigse}0Z
zCf_pNMqhJ0nr3(DUN+Vo_<(k|Z*_mL(O3`dX0qio*(V1VXX`g6H*sEFNVK@xF7Yln
z%U9|*mDfczg1<VDZhD`cqj|b2QwY6LR8Zyb^Qdu!s_h5gOPWH%a{?_Tw4X!yzlHLm
zqall1Iwk4(Z$f4&glXBRxF$92WX2Yq=bHGwG5Bcz!r^DaOjjq+g325FeIE^R?-GbQ
zUUyg|T>>HovmB>%K6gf}&8!xEHC?<5JlpkN%p8n-Af0kQEX9@6u*9d`^~B^CktG1g
z@qbW6E{5>7Ea*y32i@6rmVVT)jF9ws(O6e=Mv(A)+8n&~TU<9ji@b1(8g#~(4<k`d
z3KaU#R==N*%G?mwn9$U`{)DaiNBM>LyLt!WRPPqm!Tq)TbT=~liXz%2mQ2OA`soGF
zrM9zu`x)Yc720q5I+ed5y#&%9dnD#&qe<q&bw^%$N%h{IJ&7I`8(gZuEn$7Tx3shL
z=(P|4;<G}#zgwqJl9S^Y&4BPu-1ZjEmbjJx+?#DA_&R>=<fpEd#lBHzgDf*IFu{+w
zyq2q)mjQ6dn31>63m?zMC@2ovE5B=<BnyqwQh0xOGspuLC*h-cDBZc#1$tG08=tUN
zkXiWg1^o*Z^AcfyWvrV$hS2b4o-O^UwhY@waW_7@uxQGEM!$z!>i>b2oPmjPs@Mus
zSJkA1Cqu}tC-LYCMJ#BL!Kj7CMIZO#sz1}-<Ju^k)Cj@Dn7k$jZUzT=Zsl(PHPgJ9
zd;k)h;V*dPC&XV=oG4rjqn!>~4{+Cs{j3jBv$jkl^qjtk`?AHq;g{9j4euRHiHUr6
zfI04uieZFlxB3gwskQj%g26wCQbsS5V2D(Po(V)NBxg~F1j0ke_Rv8SUsCl2Z&O8R
z#>5yc8OLX39D2vMtvSO!MfMMR&6#BvM3Sz(H@*zk-C2LT&u4aVM?ULffDdYr0$G+w
z=B|Bkb*Jz=D!W48no}swWNRGLy9<dr(ya-ob<1&El?1;898+S(73tlhxBHXh$L1)U
zlO3-)@@o9#AB<t;h%`km8-_)^AJrc(;ke2crt|i<7McX-M5=@)HmCJBLKgORH2Ee-
zP6ndfw)Zu&IM&)4v2<*Wm^qG7!Mh(w%G0;5z*VmiC;=J^!W4zjleBPVow$2)ga2hB
zvnh3geq)qw>0+OAZrz+_bsJS1dLwmVQu5T8j<M&<;54^Q-O>euulhPT*Lw|7%9`fp
z>nWTX-Z%%<_i-`j_o1Vd5N2M=N^ak~?GtZ7lXcelZ%uPdb3AjMV1`rDZ&j5s>0TGl
zYA>y$lFsEg-==$=`L~fZ(589$9zNc#Ns?FfYVhuD32}0DfC8hx(4m80;@<9<=<fEP
zF%<*s)2Ih9vD<NGK0kKVoD(YV{xU4TAyzBN?EBlY4MvB_8g=0>l2POmw+H2X6zSQf
z7bfXrpB0*njJ1PBf!My%>m^++@deNfLI`7HJ*%f<Z{!<YUD>0?OX&Nx721OG2Gru`
zKryB6G@V33TE>RQJE%pUEftmX!=mYn`BRsQX>{<PjOZ6@d7(j_G+-Nl{$(EoRA)6)
zC=}5uoz-*7E`1O`|DoCba)uSSod>OX7_{`MvWJZYjZBYvoeqf<&X^}OQ5HmwfL<yT
z1NAp_=U_)V78LcY1Eh7jh77HQx{mep1fI~82;4^$<p&{N-IHR=d8W9CJ7%ko^8&`m
z5PCf<mhm(I+P89I|B7jhq@ooL@P{zDxLE23un@cg+HmwBx)E<sGlgilm{SQH#MfvK
z^Nb20Qez-9RJU=<PMxry6)V)hq8LfeU;}EAVc*|6l<@o3G7ppJ`$ft&YwbQoO?7%9
zqd8f10Y&+-tq=p=K82<cY2AhT$CYhSoyRi`zJ*6+?>09o&&vzG!R5}oU5i6|0^@DW
zs7fXHu&#Yog|CsloDIz8d)aNwmz?YAwl=tyP5O_QPlL6}5@vY=HL?V%igMR3zdN_q
zA6s#0UtSV?*x6p2S?mA^FEt#_<y&!mhgP|Sc_*I{pEHua-p>AfF>t(9jZ#!-k<t6=
znt|}nl}Sb#*xAVD{|V-f2cf&5+UJn`ttS9zv5=bTh<4x?*zVfl7NkV7>CQWMP2)m1
zl%^v^okV(zuB?>|kp0~53cXM07p}E8u;U^)wc;!1+*F44*Ubi4m{)T3?~gDA2H5s5
zxuk+~pOvp1)lC(rX|+1EbskmULc5)GsJC&tcXG{HP~WU5A&!;3@7qby)!FHP;{8xV
zJ63=_5LwL5A}w~_3O}RXG)FQEqSpC1%EElZTz~fB{=68GOeNVn@#JA1{KLWFJ$(6!
zJA%C*kjV5VZDr=*Xyxr;8$lwdu_&*Xy{gMH!TS>h`<3RQh(G1yXhxG!4^Er=XwWrf
z(_!h!9jA}(u_iPMV~15jJUFAGBK5`BqQbPLG)1NX{QmFPT|_nIWr|ew+V51d&i0Hn
zHJ)(4mg(q`?cIR0O?5B?*xRUo$=<#`2E*Zoi;>HR0OnAT)h&kXSvO`ch_GqK*6d4!
z4-3<7OQ9#oALMbjd{^>BeG{T0VVsYXp2l!^#*JlP?F>XlhQjF~1KK4yAI_?Rt|%mb
z+iqW?XHaO=JOOs>;x49Qk>N4;Jfhf;kPqw~(Ip=17;<{Nn_H;4OvR|rsA`IO7^ycF
zj-}s$uA<FRW;hNhl0pawqy(tpwE#67e&r8pcyrEquZi4sx?!T3V4HQ`-u_`uaWRIQ
z9iUGEs4_MDBD}6NpF7n@-v+afR&TZnE&-Hmp+}X|nVDykKfI^=%S*O$^%1T%+|NEQ
zG3E{tx-CUIw|%5G^C-^L!MkT0_I93f<8^rDgy8BDH*@;_!sGJv4`4n^=;u)-y5{3x
zB=M{zuGQd=qTHlV5-{aY54E_kLcL-AjjK=_Ve_{7wz%To75-m|Qwkwd&%)8d!QbP5
zC;+$TPq4}ECy=`9wYN&#N>4kq+CBKd#`OjQ)_+gfb%PZ4TLYJ-o&5?fo2L)zDb&)g
z63-$?X2ki9O7J5{CYFdI56n3G!-lLHsUPmbevEXLZ?RB}zFO9PQB-958IYc+B`aK5
zNmF*1B`n$XF^?!M-Ezv^g9XkY1QSztFHiMZlOGGGPrO@ebZsY&2CC<=n$EJ=3i3Jy
z#g+iM-V(b%;fL7^u62s5fd<pw!MUvsAK$*>I|0v|9Wv@kj>*y7CVo)zX$ep@5%mLj
zqSs^ooB&&6-_<+ZDLpTY9DoP#q@i2x{!f@bT5iw)%<Oo-mPxyvuE2k^-4}W_V;K(u
zirj-&@pm@}fZ-4StZBC6_LX7O@pd4xx~@0dKmsehMY%~m)}<noQ`_CVD{6nK;@q(C
z#1~ZnlT3_Je8*7T;)g3j5l9-7j;{~(tXqcVDdu`GR&G1pdzaIX20ngwNK(LXvX%Q#
z+xVHLgdr7-C<K>GVU=It#vVC-6IvSvNL-*o0g1~pD&f;^gqh$uAi6WF&H9kv-$DYz
zZ%o-nkq~eyrVP#~M6G>IxsK(ikh)B|Dbd3HQCyntBVRRqXAzrBvj+5jFDx>JhBaRB
zMQmtog`V5D<r=GMG{Ao=y8D9a=Q3{qE;hhR2a-Gee<gQDi(ySsXAdGi{q;oOF6Py|
zK(*DF63jo1icM|Po1WVVKMeYOXPdufL<bApExWs$&{v$UZvzU39qyqh0$1^*!OO+G
zAW05s$Hm;>+o>b>Qh$H|p6o0JBa^hr%$xO*WUt;fuJU4Jhl@F%2lbTVSjZ-ym)Guc
zf39t|?q+*AtbuJ<mIP8HrSGe!Z>d*SfGy6rPW!K-nii=Hiu&-SE|g&v^mH{Bn#(uT
zm3f?ZOqPgf^y@ijkiP*Ea19mG-_ZMCNDwnvAPkoT>WSa~<_q_Wmuq?z;zyjOuQN;M
zc7@=gs~c21r}-Lu*NrXrM)xQc#0Y%=FK1-Dmn$2u0>B>=Qxl)qcc&&Vnu_W({PFOO
zChM6SHN^Wg-$7J^B;4u7X+53}!ed^c`V*?+2yv&cZ_~Xv<4s_`WmM397nzv2K!kZx
zyOB6Cw_VO-Z#HwPw&sjB#L)DT(b5w1Ghj%>tjN^Vw3k!8+Bo5oJ@Of)<Sbj(#TpRz
zGWWFC5&K@j^&>S2ieJi;*{eS?Lf5g*jypIdBlhA?R;nT1l@N7;qUb)55z2!UAwP^j
zwiJjZl7TqmS82lnWM$B_p(^Pit=_DO6tjpgg!@AsqXO(~@#Wv_Z1q(*WlY52Wjvr5
z)`SxWl3B=zv*}u0l`w#0mLO@u*)(t*81>W1qv};1EFhSoql5F`ZLvZU8xK5)4)g0K
z9fTAOFFRT3UwQfl*#8ms^0m_KSsrj`1@CX@-(C!IdWmUcE?j8w2s{?QNq<n*Rgugm
z8<*DnuK7Mi=uw_f+e=+`*EeaeZ=0Ufq{-Vw{~ax(H6cxFJo;ooR>V|M4iMBVzp#kB
zEg<>w>)qy_+Sm>5i=FHmfwQH=h4Bf)%L7|1v1v0q3Q(ne&<mGU-`Q7QnnZ}q^jkr$
zjl;1$9YKV1`fFNIc8F!vb#}x5i(ohEj~<4(&CM#kym&X>I=ZnjkuP^%r>dP1O#8wd
zz<H~u!N!tKfwQx+L-N&pw;-=F$>hm5mI(Y&Eq$+QUQJlJ;vY}0>jSM2v0-@7$z~QY
z6=18DJXoB<zmu)|^GBe;S_D9toq@LV)%^&T__tih5VJB7;N}EOn${`%`B?SWd74=g
zFyii9USP3=5bk>qL!lW$-7Mplp##C7BII~ygh)Jaa@r}T-J8v}<Eo#22ZLfA;_COn
zx|NgJT={ZK2SO5LkbwjlJGxVZM@Ja+y-cJnF(_M5>qp?8m9B%UgUxKk=0hNf7PHyb
zO^3lKsE1`xXXsRNhYA|@SpbDVTV-LQQ)YOW_)uIAW_-;L=Di+pu#dyiwlTRW@6RsC
zZd6lPx_fm&^#HU?IZFcLp>m;22!jvu%yL9BcX=glMXPz&c3#c%*9^2>1}I^`gh4o~
z_V=#+D{V0hL>L04>>&Lc-bEPv6S!@ma~|yJXBkrIv|VF(Jf@#~?+G{ba!Jwe?IvQQ
z^MpSDFg(@I_+k<t&&A)37JwcR!H-HcB;L)2gJSGXU)=%&QWpuyFm3j=XrbitvTw4m
z<yw{-bc_*5tWMF>pnj*f^{Flc+GI?DORHwVpODf)Swd47WB(Yx8TS;*J31IQOK=^H
z2c^}RZc<mTDrs!~e?~WP<)_JbyMh%utN(ZKbgv%iw()8Iur%Wh_|@mqr6)?sC&=&`
zSGL1MQWQ{gLv)UBhQ-)v$s~T|%w&9}*r0M>Mcikbq446<=Hu#@1>b>~W5?LW#M$m8
zAmwlE9*w8NaU?N#*gm44N%yTh{$@Fuci!6D!`qv6s_o@JdA6uWsQ+-l{?)7c1QEyn
z^Jz`j4S7|%A!Pk8qezz<762f~8F5LEaqaD97ZJm{SQR~NZ}YJMWt%oLxJjcsg2~g^
z>3WwWQ9F&4A*bB0?nUo)zM`RAPUtP4<vvJF#Eq;O&HhQ=2&^3vV089AH{)kZGBP}T
zd*Gk!Xcq8#a0`yUMw@)BZBEDoYj+#660Kbjph8_sNf;D9QM2e$$y!6gh<Ujlvc2-r
zbGjev2`3Oib7CxkVbIS_HPYsHM~R7&l@?;UyDm;$L@F?@8VgCF`Hzj(b1X<mC(w6I
z>XEhKonE#_QsTXi!snlgf#Nx8#i6q5d84SulyP3$e&;^8l@hLnsDDZ6AOt*myD+#x
zoK>tOYdj3(LkZ!SK#2?d*}@SZjd!IJ_g^B6vRjk?Jj%qdO0otN`j<cO$7f^ciY81C
zCSI6@IerZv^acc{!ReP8=jxRa==|3Y*GmVvK_qF~jYVms8}tJvJg!hAZ2kEiAAw!g
zk#qBF-u*9U-1R`YSRar1<#z!|`3ymAJ?L6Af}-+3)cWFlm*0?V=}L0ULqUpE;pLL7
zBY)c+U7DE=A#gQoloDz5v-MSh0X7*v{u|w;WkC3YPB7~GrW3P2r!+(4Invm%?l2<E
z7M|sln76lz4y{^?-U)s*z(+U|XwDL*JoXO~0qUYu*7!9swV)M0w`g8SmrO<*9gIUT
z-Ebd~C0&~VO&`QD+#-ec6G-SZ?od8I*(1}fvF#@R??sVjcR#tkBvUVmC*8cg%8xfm
zJlfw`=Nfk$ksa&Xj?2Gh3t)QoemUeh@vOeTV9~dNyrNK&{I@#fesK~>o2Anjq*~s0
zNSXl2(ZUy-_8TWgTj=j@^zZDjf2{wbVIay)n2)=nzmLRIVvQIeU;S%@&?l}w4+ZA;
zweKRbV}PAE6alUUez-ZbMVOSUmw6?~_3Z~zlA4~Z)_x{HAQ@;(9a|Yz5=63QlhI@W
z4Fls&!pB`X=aEtPwA8r^Q@YB=%f@FpI-Al0D`A7qn90$Fh`s$m9Of6P$|PLHdGX`N
zR+ae{Kx~7BRRO3LNp)>}gIIyYdOC>Sdb$aFWW4L6)Eh20iSM|7WpWX|Mq~#g&Yb|!
z(E{dZX!^@i+zikJz(%^8g1)0_=Qcu=jdmW#s(uir05k{((anB*;pGk>1+k->SiTHl
z<5&>%0u&tR9}tjf=4kr_&*4Vq+h_sEap&Q#9ya4PXTNcFS7%Tl`<&>{+MzQ5Knxrf
z@zla+HlBqHvgn336tVu^0RM5Xs7XR*i0|k3-u)fAR)hgQYD_m`53goz`=LQt6Kw4P
zj<p@1qb~1sRLSGJwK^{~lvH+fyl~vUPjiq1-dGSR?4Rh-XD3xT(8TzglN#N$)EGr$
z>h(S0w-@U5k-Z`JtXTwrRywP0eB1eS^-GCYf!{}JQamJAsO|L*z&wo`s%j+<2?@QM
z$Ki3|FMI8Ue4>=R0VqU+H)s$eW}oY0Ag#t9+!m^p2=v48KOt!~e8XRsh5LUcYQDhn
zdG-qwodxX7g#bHqDnx@=C>Fpzuy+J&B@?0tR9i=qfFxf^<e++P)l0a2Q`|m+wFnj!
zkY~~m@#S&YEuZM91aMchsb?aZPq@AAwqIFLZrbeG5qjeT7!*)(CPR%Cr~`b#7R{ZP
zqwGslvY=E;<GVjZ_WDxs1}{rm0t9)@mMqFW992Q8v8u+To7Zys?@ytAA`hl-yF43R
z!CUbG_}>PHO6TAI4SxY(xI=ir;Kixgzw>~fK$_&ho(={uf@@{<Yis6nCub#H>-ZXI
zdO7fyFZh9=!XThvK$AgmyBfeAWnh+L`l8D5Mn!XA%gM>fwVy$EFcp7BEx`gA@KkG+
zmT1N51$M!0Ng|c_^O3ke9MxETGAUM&)}pnEx*Gbv8GSXK7ZLs&L6#Ks(bVIG#DWB{
zRiHY6t#TZQ3T@=S-)0HqXO66JIj4zKK0$0Td(K^eiX(ypndHN3(_q<!)aJ_rfl66=
zDdJC_#<qjzVGJh{pXz;sa@z0>!2HG)D(3!5V&NT&fZDMZmlguirIxhOE!I0g$@39u
zCNu?z&usY>pV>_nvKOPY1&afD;$ZU{q3xI`{fYE+aNM-*uBfNi&+4J2*r$~4Eeznp
zBeYsJf$<K^S!Q$En*sj~c9R&RJXuzv1eV$;uUdtmq`i=$7v^&19)TWdpN(A`qgQAT
zrh!9=GkaIz_o4I`d#M}p65O8tKF)-dh%^#OHb;)J3Cj=gW|Egr-5lBMQ~F7!CR#oZ
zUMj*b1%TMzC2xk=`4p+V&*(;zF28G)kOkflaZ$my9KhA!#a7}*ZjETkH!Tvk>KKM#
zS9C+<Tb;WIe$JY1Jfch6;xN}#b!n`BA`!V=8IWevbbb7W)&_r0>G<mv;TUi|q3sqi
zb@1a{zG4bMf)VH@_!;OAc-^uP>x96Fv6MW1qDKQ*M3hkfWfqas@^v4?l=)Hp?`_qB
zBc=C$s-Ue{MC*!ogJ&J9_h{ViaZqt~re(CCsy)QEOp5CB#`83b6Y~0j7Gd@ja<BBB
z?(S>0u7gv6%a@jh*>5`i*qqP8MsTiJVU`7x2LEq6;jc=!SYHQXpw4!<eq;Un_K5~W
zQXdj1y5-{&S91h1xW>9JS98tMtOI1nJh&7H<99f?45Xqy<n8Vj`35Ly0)+q_)vvP+
zn7xjTD-RBwa#T3ZY@%32GJno<HT$%Mfz1B4TIDmNX*FGdRbBU<EsPCJS`Y?Md9h;f
z1jpD*D~+gOwE9R<w?UCo(TZHz=#z0Vm5XS0JjnS;lc0-0DsC&F;zk0?zy3d_@)R@u
z|Dp1Hj?nImaH{PKv_<NTLeY8GOuL6WFWCl`uEcrd(y67gn9Nuphucld;Y{KNJ$;Q*
z+Pa+n#$95hP#f#4;7~5ME}&%7Q}X=1GyV$byN0lF1!;M+exH5MSxR1V^{;t(z7YrH
z<NYMGTrKYIS2WyB#;GoOu5TqHO|x!pX7Mh<A$^vw!OP*vNfFsNCN8S}e!%{@hUR+y
zb-<_*)nksCpcOSbPB6#_HOrSCNgr@xdySKAuWf`$Q#{;EKUgix)UB|}aD(20DoKe*
z<)GY=0VHZs)%!57uf($ol40F~YD57^*Pl!e>;KbCkFvmvz5jAE)E9MVGs+%C0Z#P=
z)GmezW;zbm?!_r--s<(+FR>7ulIEp?4^mi}ZcO5~hOBF<0uzJNt_|J{3JrQ~eqsLs
z>?5IQfr854TjVbaG+}O_Jfj$lu=-tb`$GSENwk@AR$hJPljyI;_?Mu#erO*ZW(lV8
z$j9+oB~XlvCnOIr$lyVUslEoRlx%`b+KZwG^DNA=5~>`kQ^&6Zj3uwN%K4p@r2PZk
zja|JB!{s7l>jr$sMq1MR&RD{OFuSR`+n(wAjY__yA*Q2bgB)wWEXx$Uh#0U5KFpU|
zN`>C#_pn1j-~|XU50u#XxV^-5i=hWDuN=r)sFZ`qum$)_F_Vc!+a-1Nxfj26i-Z%?
zK6TTGrT_?L<G9#zsVSzw_$jzH^jC@vWJvo@raav6qSzQr5R`}{+%Q4(A#EBv;FsM6
zFAn9Fw#Jio#zYj9e)yj{@d@5T*D0T4_9*ws0}iEtM+=;n#M2ogsl~dL!eYTe#<e~L
zh`+@g+){Kv>T;@YeWE-h3uP~p$#ps{K0YsgMBwp7{^U0#%usA1)8%XA#tP3Mr)gm)
z3?)@n#xIwu%5NozhggQvw_fz74%r<J*<)*Usf`3(PsbMe{#y<L)<<9%6ea%o#cvLR
zu-5OkXc_zRoJtneFFezhoNd75%5g6-&FW!?z36oJhz97}hG#Z!3&%L#>qQfrZqQtB
z%mXzAxa^JUlwG+8ewC_?JwKP4^jLjAo%MrETbM&|=I8E+GBcmBxzr|16QAPjL~7rZ
z$^*BMJxZ1zxb*MZHQq@xqjcJl<!Mo3UA3G*%~0O5Z`M;wkVm2dxt@?BJ!K6RRtyPs
zfAIlgBR%Yce^1L~bQR)TX#-4PHHwzmf(K7FKC@ay6aUhj;Q%(${|%Zm)32!KS4tO^
zIn+)4ZRak0sU9ZH)`fffAJ`Iqo~k20x>Tg3CDM>Pd~9tlPCgs)(ljZ^r1`3?{kAK8
z<wb$0U|WrG+>qcM1Fw^n<sTZcw3m%8GceTh8kS^1|NfqXeoqMxl<b1=I1_=t-~IY8
zLFATt@?Z#iU*Bq?nT}NuxZl>(gN=WzZ>*iQSNZK*kqGqjH$Ni4L74ZsXlMwqmh*H=
zqqCBL890rHs|3921h7LlHs-ZrQhgOC7s`9PQX__!=+@#?3TF;jM7JXIOZ{<elJh?)
zyrw<83LM3BKu4TL0>C2#-?xzlo65n#B4Yc1@$}yeXxw>m-gg<w*doT?xrhpn!|=da
zdbGfkbl$z}1YUG7oWY}{xC#X=xzfTmeuex~zdvw<0AfxNfRHQ~paj#x8fn;#jJ2YN
z0`dPtvt|qMrC2F}(|{C;x`@ZYSZmQB1`&ww^bM>hL^Li2gL=p^IO@oc-ms@~=mV3e
z<OBx{mmTzQA)t~t(K9SE!zSTM%0@OUcFZ~1F@B++bJR<?#~KQG$!>1t)&<Gs0o#RD
zy*t;=&wQ9f(DvDDqMYW~#c(B!tJL1S0b87^Zi16NBI&on5`pt;B=pvmiOwpM6)?cU
z607|OarR%-jnbU}9hr7*z|isGdTZ>9y3S6xW$jMh*&TR@udMhR8Cr^MC$YnV;}lPa
zRn>yi*|cF4PuU++vyw7apys@HCqt)JQZz0gXwYF(shEe`l62J}++Ryvb8~kmx<;sG
z$2xw(HaImgp{#9*uBxtnjyS;qsc29j70vkKh|IwOXfXWrr8}Ua;ZRjmReJUV>~Lz#
zDJo)C7X5klXCcyQ=+2{vQyJAOF}Y}R4-J-X28NUlx!vTHdY6u4Y#(@65j8rbzfdcY
zF*Dr$mDSa+C>>)TSk@N^5c}(94;QrStCnkhiQ;~Um*2Z;h?n2?D;uE4I)e0A$jyKB
zSP%nv3LrBo8kY4H6p^GI(uQfs@h|}NQ`6f8Jb}cGJ{b*cv|oH8phkCg30*0cNlr`n
zEu)!?_k3p8KodX|gZ4gUFk+Jlc{x1e1ZJ_0z$_M}RsWA!Y{$1L_5pjShqz|;J}~vg
zog{C}%R5hK!?!`T?zLCtuP!om5^WzgFnhO~D87uG@w9ICHdwG^Mse!aMOAA47)n%X
ztgrWb0XW`#ixO%&+2U~(({Pml8muwOAwmj$jDgcZeQLwIweEV|)?yWmJ!}k9%LM1?
zQT%^90-{t!c(usFth=4&G;5aj1ViY~X4ay7fZy=Ry!YdMS|?cMGtEep_uU$QLkl_g
z?SA=AD=M?YsD@z#hv~)sOyoEE7PRhCn?ar}MJdFgxV?85^Y#j}hEW1q)NO|6IiKaT
z9&ei-?LRHJtVNj3{xk!A;8zjw%>q)9oeEf4`IPe*ClSuv9lr(>_1UcPpX}Ru1kWQs
z<#PJ^_3L&1CzFgVinN2-{!kk9dI%yT%z&^i@&#>Ze0prIkFEPsQ9b@ndhO%SCZqV5
zi876!lGkgLbdqTM(E^HzH{PSk0r{mc_xCu_{#cx90aUS+v?3S!Y+@nGS&S6yG_JrH
z5=u;{6}ywFjwRAP{%w!iNQuAC-%uJZUYrpq)qfsC!u;PhhLmacU>-zjWV30c*Yh&c
zUX%|$Ld)^hF;0mOJ}i|6--QqLZLh(L+Y`i%_-%;GYW5YRHofa^=*K8(Be|v~o;dM<
zp(eR8wZI(-VD)6TWf-~ndd}4&>x;kf<*qGso{kw)q_3$Lg)@%BEFs?e)Dz{Xsbt8$
z5VvC`j$sYd-WM>@nR}=MdhwfX`1^kNdsR-)2I~*-Fd{S$H-bp5GJpj#DPS~tkKVoa
ztsG+@g@;YSx&#rpUS`OFg~GMnr~6=+R?6NlblOerx+dn?>|Kvh73AvLZMgTn%E?sl
zY*=ik=xec^k@l}*k&+3P{#~2LSV3u?8D$6}yT{WON^c@Iu9l5XF3g1FMGwTenrlnr
z)c7EsG!CY=@<G&BxV}ulLR5T%kfW5PMJ`!buxfmbQWTA=+i9oai-0;P>X6$aDla!f
zHvQI!R6+6MK&lqi{2Xp|l;so0><7_=F3c<{+wSLC$(RAqc{m8r%V>5;zq;d2<is^Z
z!657`@*K4PFm|;0i?JhuPJDGMmLnSmOf&O(7A20aJ>*gex9tyA*8PYpEkH)*_e<G}
zjitXrVrLYdg|sEXL%GaP@<iJdF|8>j-<|An&Hr!yQp4Jar(OTq+|g_zEXb8gv5_Yl
z(QANch<(U>hIqTLY>D*j^b#S#QP8T9{!?Q=4RgflT_nrHinoVf;*g8q{8Q%gzAy&V
zO8g><TU<AQJ-1~)eg3g+Y&93?lbQZ~{ou<E>67uM$Ahkop6b}Nz#9Whn!P|&!qM%K
zY=2JlnbH*?5MbVZXoRV5fA!dXTuEvKVD7JX*Z%6+Amw9h(Dl$36AM?0R5-aT|69!-
z!ZG$CrBq4RMsR5Is%K4}tG&6_;c!yW4O)|A3hDL+#`hX?rh+hFIkp=&pGjx<X7SHG
z9U8#jn8!+Ah_(DAg&RomjGTmVwVhzeZc?&^+Y7Wn7paZxLc$wOXw3x}C~ddXt%QCj
z%ki}f|8E>PW&x7O=Kr#R(lfM>BeawwWS6bpOT@b{H~4F*hxd=4+l}hjCoeY}O}aT}
zq?oN-OpS%o-zP8S^5~GP6f)ml558&cin#8=<nE*8zXa}WCfQFz_MJ9RO;^;kjPJ^t
z+jT7Y6~cZ%{;Gf9-G9;7<v<FLeBoT6`k=N24{+skEqSmFUtP>u=Zj(RJhhoq1d$!0
zgMri$dXQ~9Hbw&=98%1LTn^FEzWBNNUI6F#4h4)BLB<BC?#j93P?h{{&t<S0HySIa
z`}|0kHKf4&RvsotzU98`!zN$K5^fpwI^WMxGT427`ys?n`SWu!4L^^OWt@P*08Bdu
zzNbd>_VdE%KZOUW#75$y*<r^pUrXvRZFo(?+2J_AhkS~c6}Tw68oH24;IO~zjqZP%
zZrRxV!f1*$&hmTo0=?VA0t10>`!#->(VCC9KA#cltcxE6<dO*=JQ*N=ttF3@Uq_M3
z8<RnSYcgVu<i!H>r%93B#LjVto9o>=PK!&C>z8igT`_J5DPFAf0j7?_-7E$sBg6o>
zm##`O2EKP#xLDey3bg_z7wZs{3;Hv_<U-_Ga~zRV0li3pA<{2HAtG8EVSzw9=~Z%l
zpGhJa7!44Hh2g$~UbDVjL$qZG9yK=H#;Tr95<diLF8(@9FK>+8aD&q7h(t)%O}?%O
zpv@^PpB?%wKEjg;DN5P=@;=H4HkIcNC4&Um3dd7?U-5um*LNd(%oAAj;A%EEP8q3>
zW}1>7io9(y#FCmh9eCBM+vvdGRoKKt-R86AY7~x0W#=!}O+`25yZ=c$X2`M($yjKt
zw0YoklOk%xK2@oAM}Hy8b?3yVx(XyYEi??i4bW1WkwPV8e(GvJQ}i{wrR3k+RAiv#
zG&iG+u{;8Dw2^RPw(a}NCBPeV6YwJZE=6kj6Wg+8BhHr{(2|814<v0^%mJlLL0Q?S
zckkY9k4RDE0;?^I=5>Ow6on_ds;VlF8(<2|De!m)KI<UV9i~aP5S_Db5`feyX^EqN
zEem>*fO}<WOiCQH?%{M_rK;N7ju@fGJ9{8e(7d>YCW4d;BkLoq?n`cicBFUC3y!G=
zWo0fW1}c|lJ7YW9QG!_$>bj|%^EP6$#>tiim6em(^rEA)nwpwBrCsD~{LaqKWADtr
zzc+rG&TVU;6D|t-X^VI7+gbrKEqH6ldEFm_H{`G$EH8zjdA;n9xt$xY^U`B#d_0<c
z#rwKXH?P#t-$XYiaWCEDROV*=vjX7a>Cd_7VmNCM#%Ma4BjZc8UXA0)qqe)d8@`z4
zekda+C+B)&3lKBi-FJXLVXpI{YcK(WhOnKM^rEI^g=(5EF_u7&Izgdab-YAmS1^TF
z0xut*S=0Rm+j%nj9sMrP$mFDPb<=Lq*X^pNd&YjVbkB=S-G|foNHPbe9@pb`Tm>Sp
z^)F4WYq8H&`fJvRYSliGyE75~5>2*+{My(pt-0e96B5)?5m{-1X}jiFg!AJ}Yow(O
zc5BJjVtwdu{Wm46U%zCI*a^Qwaboi&;d&AOr7z<2fpi2=!P_C0rgUfWEDVz#b|NpW
z$4UCUlyo%}wsMn_G=k;>kmn8Ry0(UeRhkO9>2w<;0P+k8z{Uv%q$mM^6orbYJ?z#a
zTF|Q;x4bD_-Pt~HreA*EP@{{}5bs1?Iw=i^5jy<1h85|XQqF2Ja}37=M;(_?l=Ph+
z7YQW<<xl;U{$>`T*fX)YlgKqew3w%rzv!9(=>$N9wrc;M5V`;^`DFfz9wwA|Wf(L4
z+{{`%+};-)<_vxI1E<%)TM0v%rf^3``*HI}bl23@8C@c_aLCVOIU61j6E+ND?^9?G
zPRdHOs4y?=?@#Zc`>J(5S`>&b3LC25>2BaR026M5qT*s;eM;g9Wk~*eo{HKNgdo7V
zf_?jy{jCI{wm5VBvFNhZXPVVLKsm@BQ-?1vcy06vL7(BM;gY;(h^z4g9gR2^fd{bD
z+u6xH@_xL1T5fYoXjU5+WXx~~*zEZ{o{cG#ew61sV6QzJl?A=^SacYZi}ctn%pZLp
zuf5sbbk)JUy&A^sw7wR}7g=0)$V=U~zpt)kE1@T!Rnme$Iy_#eBB#={=A*tk$y5os
zxbDyLg>v8b#nosho~y|71Tr<<oz~mVHCIgO$kL|R_+{G-a7?)v%}_?nkLHm7>=r{<
zx?Q|{&E`Jr)FXA;(S|X)%<L$elChCs7|Gg&O|BLl<TT>U72Q@`Q<G>_y@J4dwd~Jo
z#PXr-4lq?Run@XC7K>^?(!JkR-?8?-P0pv%CE1OM-<Dp$(IuHp_qs77ei=qaYv<7+
zKx;(v$ah!`YbA=!r6DddD8QrkqyDs4_<k))D9sC;yp#~EIFBL|DNxl={0C`7Pr@ug
zxAt4$JI%SmnwpO<H#m%GmnA>owClu@mKdZP+3J2S1^TiuHYWzI;DJ@0E)5jAftC>Z
zLrU5fywT^|t=`_Gc31=s1UXpi(oUkWxF3a~pg7B9#6{l3+N!akqkOZzxue>O&Rmy`
z{i&2DgMrYE2lzTgbWtIc6Lmy%%<nPy;*Fz4v5Ks3_0tW(4qivJXBqh2-O+T@BHh<Y
z#9(u8@eew_oSN~&h|kIkX17du1yc#-q2)tCCLN7#2h+))AOA}5nUkLz76IhJ_JaC)
zNcz4Dd;7X0Y_cM-lPGmM>ssy5n$_H1YINFv_wuLt<>lWS_21>?|7T7B<=GH7Gh)zn
zo^VOHw@f}i^QOHgUhv!V_9nxrxuu@;+vfhv^3?kkqFB%zH{+>tKF`%vl@^?MZ>INx
z1z9umoWB1a08}ukO!i#r#i@vifg((;+W)^?oh1NSon}ku;Uo&)EIR0dYtf}`tbWhh
zO7N&2EbTQP)<67k+Q*zsW!8xCA<b#eaAASv(VybZ=K)y$`nU)6;6Y<!TeK_E-S-4X
zQ#$VG$!3=e&X??gOHOl^4%?Z*qv?-#CcJmYZ6JZU(Ed$9v(cwg&#VrBnK0YI9D!L1
zL6cJag45i<*#7-t-O(s;3Ca!$T&Aq8W(JdIHC!&v#gsk)R3ywI=v%`vc}_Ee#{EQN
zF3bZ5k5^qnB|KQqE`VKal+>~@ZFf{f=})NZ5#uzik7)8aU7hDJPcC`WBL2&iu6JtA
zMFt{f1|6m)&`${P*F_{=cGkadzE^{B{pw3*=)B~~^%|}BHQ0dgG9_dVkObp)H@;|(
zBFjH*4yvz#4olA#-2(070dqe+mzO13?EO_$&ZDc(`lJ_)l;?)q+3GNJ@2S{2YfklB
zl69Qw9wjZvh!<_!2v7A4GH=%p4`>wd!gC--l<kzlRt>=%aLwA!N1o%l+WN`!)QI2P
zv7(lotZjX#<G;qSxw1W3J#Imk#tqa(5HbkM3(Hzh0v~R{+r41*^x#H+O|?ee=y9D3
zK|iU?5aO`6Nia&VA&cHTSo|--0c=4wSb_QfoDI<Gc^}IPRCtX+e}JF);{!re?3)pU
z{{sGWg8J9#0Nfd@7&9$6>mUxeVzFU}B$)4M$uh<ogLc>0aGl@=23<7qdnsWqC=tYe
z08}qf|9Ij)dk+`^nHqD}y{**vLMXwwbjf$Cy7WN=>_%7g1^`&2_o5lD_=8&)*t$va
z?OS?xF)ohmybATrZ|%UGGfLFSt}iq9bI|=$<2%*=?yvAyb6GV!gdp*@J4n$pnsTUX
z)pYNqpmGKjS7K}?gAU_qo)>Rt9jCNGGnG#U8V>WUz1OUw8IA2Phl0p+_Q>tI`uoDq
zq{wUo+}V08wnoMI-7hSFO09x_PF$nR2swg?)h~y2X2F7CE(h7;pkgXdB8-6eCx=d0
zBg3eMcOPSw5&Q!v-)ROh803^-Xs+oBTt23~kJd-8eGce~xE5s=-DhxH30jmzCSM@M
zlIDh-#t#T<z=>-KD~E(wDEm-$XHkk6#Yp2PuSyo;QNm~K%lP_;&@sY`$V}s5;UHmm
z_sO2>v^FVhd4b(-F3t`T`Rtb(jyzSKEv2L#+RHz>9r7Cu9^86A67CulH(bn`_cB4n
zuR0}yueZ{F3<_M%8{M&Xkr{e{D9wgx6@>18-mKFK6~-~VHQ<^`?PJ<=Kd6Xb#I9C9
zs5@#bT)nFutX=t5KKSxvBk9{MP}Cmm#eMk9(@n^_cwX$B=oJ4|ljRXW3B^3`)+jIu
z`ly>-w^H*51#c}3YwL%*RBO`LAG&W7yER#k9$xq*2V3?L;;)mpS_v>w*D(*C)c8Yk
z!MC+w+H&>0B8sDR>x~Ls<19;7f<C-&s!tkl&d|#V>6Eey-C9FbTeM#QrZ!e3p6}FU
zg7+0!pzFjXT6`3+CCh#^SWBtYx3Wq$4-PMTD)(g<dPGa*Jdtw<K2SMBF0!Vi8JAum
zy8j8X3qE{b^i5&g3TeY|bP}YPVRZU|TllioLz@Gm^|5<RaKCW=tBlU_%1FPfKdiEy
z<xj%lr_2HbR+;eg9OQmJ+sJi!nOo37Z?0U#LwfPRVo=i(c!IMssT;2ae$=}LAuLOV
zt19^L9}2YbW%sQ34@oJW_owJTugk^7eD<lrN6l{lE!e$J`$6TYPfUqeXd^uPIsw=g
zUw;^5?kg)a3rjB*Z`bqIY_5INh{FQvH_<|;k*Yai4?SB1J3AN=4}y9YeEqaN@U#hf
za-XjQH*>pq+mt!As>H=UE<e~#y!w{7Vq;#@=Z&&Vgv^(-ttm{OZv7f+Jr#=KsEL@8
zU$i-Layyb&^pj8)NB$`p^8F)Ex^qsLd5@(EICi?$aMB*dPz=07&iAUJ@yzl5k#I?A
zjB8Oif|z;^`uOi@i~sQpx-el)y#6lvPR4|I+cMHi%c_MudF~ZB$7Nr{7c-^WC_C>>
zoNp62%;RqEkG#{_-{T*?LVIol^gdai78Y}x-=btMv^vZvX@}mu=en{V<e_z3U`mKz
z7zQdZ@YCWH{)elz51rw}yPc%gZ-U9)Om~xr=q}<`kAYvrS;OSYpi|FXx;2>kRi1a}
zX~mM)ZDDpK?<*PK3l#-{+(GU&v}_qE&nF$1)1~}QhkQr%<w=5`ZXc{pH-e5lkK8|q
zX|vFsFaw3%)7KW6<+soL+A#QD%gn)I@<+d@ju&;iHfT;@bu<4mYuil~Jbv(vsqUgr
ze&h6+KhO$FTK*i7-1S3cVxcas-F@M>U)p6*t+e9Ofv-+f+3L1f?`nK`eRybf4$M~y
zQ=Mj?Pv{c$Jq9#<s|as7NnW~>lu@cCV^Xiu^Lo6$R5-9>zU%=?OY=kO8AhF}m6D@#
z#g;n}L{QGfv?1pC(&Gcy^Q)oT#Au$rd3l}<yb7BY(Hy-=(b@F`cC$~Vk9S)_^fN1q
zf<|elxj1iWSDw~w&jsI0pu}U})TGw|7chE!0g%rKdaYND*WZUze{u8jKClX!!*ce`
z#G}0P-1k?Ls53VgH=r$6;`-&l1^Lj+wZtOY7tFB(?$$E(UaPgEPuB)GXhQc&V3QJq
z$^8j;hJBJxnW!?8x`xm8aKy8QPs?8MQwgMJsT8hw`eF&2hYZzP?SM973{^uNRwybJ
zMraF&LgY)r3NElog0Q}iD++3Cz7b@FWf@lG7Ui>$1y@%ERqW$k^1-w+WgU<7B$+I_
z=xknrhuM>Qk7(h9^Gew8>W?XXEZ^Lg1h>4`k-M4{G%4{f@?SQ5&YOb>@W4vg#`{q{
zIfSQ)7gWG-)@VP(!B25w6tSIcPzN}Mo<Q5fBRN~q)H^q_VzfP1b*s>Ks}<X=(MK0{
z-xYZ>HMiYtk3=CpEi!SfIYu@+1F`Vp6FcF5xp0n-%$M!{A#L%N(6(=s(&g#CDWy}I
ztG-t;!u*u(3!IWg*_F7f<3o%yfA1re7DKW;grB3skKXdZ_EYrl_b^;AL|B_EMixVf
z!w+}Wtr^@^9G#sDBREqgL!-k*{$<Q8b*OL`VZUr<37&Mr?ZOc!D(%)Njl>av6DSba
z1E4r(-RJBU^=kKKXvBhKt6G^y#GV$>YWKq$DVdmR&u*q|<&226xuu87BsLR_*YANx
zW#gSR0sT?WIZ(81?S@cCD$=I8WIdmkXBw9`GO?Y}*9t9#v`RGb3#qH>-{0jDFuu#F
z1h!Sq&}go#9CjUE#auAUjL~Pg*DCw-)-@Xhj>j#Cb5{KrkIM55!R-`WR$6x2je3;2
zl%@{dgrrst=aV^ez@?jSG<Dk8D9EAT8jzzcPwuu&1<r-%@jjnW|I8D@7>sBBcwp@<
z`+cUCe(#|MSgjMDuFJr+rJihAnYh5n<2=)?wGoCoz2n{D2mh*3+Gp+On7j(1wnGf-
zLa9>=q=CxfTyRi9W4rmPd;g-M5xDVR<FBp7Bb1?RZiG>tzK6b~yGe{ry`}ItZfRfG
zpDCXh^13K*kHcLOpf_hSXYOJf;?J&}{XlOY>D|rD*Uik|z4G!C=hBw^tSb<|=^*I4
z@`hz;ZZ3b(!@P!s&*@tdw`=G-0m>h`h?w<?j9LCVyq9Qv9fk-chIodb{4R1bYd?>N
z*?~GMQ6&Ol(SksQg}0qOU7jORSgIe4W`mNsqWCe&XhNLA5Dfz7vlZwom?#!}V5mPM
z?$<`%yx2_4g{S#M`x^SPCOGHNT3{$zy9;)t8PVw@$*SrrA~+wmY2u{S?5+eW4lA1x
znb2!WlRxgG((rENN(DKJCHVQJ2t1KtOebNn6&8kIKC~T%4mh@PP47aJgpq}xuuxa6
z#o{qYDQ$z<L|-|EN?vVFt-`$m^iFyxko&{;34>N!<YYpmjZP0b^p<U?!^qt2^@Qu}
z!4;wB-9pQBrQ&Nku>)61Zw9eA1D$G&Ivj~b8w|cEgKv}kZ7&kj39BRVK2)6!xxc&d
zSOEewFrMG2WgwwWm1J||QKzWei8Z^XJkdVGSm3<kuN%rQK2+L0Sgh*ji!W56*+Eb3
zYy*AyGmr7_DVx8)$ao3^(q&;LGrDwsE*J;n`rO9Z*&p$1h56Jj4Ei;5!9(jpyslSG
zalv&j{f{?YAZIcyqAyR*8LQ@Bntg_Gt`lAW?yH4EB^Cz%NTCN86*_A|`=gRJ4C5`=
z8m78g+05$wLq@)twW}TlFXbxxhvsIV8U4pdzC*>!CGRG;!<wyOf!s1SZYTLme8$^N
zCi_n{Gr^h}mV_FzLeH}RkfJm=XAnT#2CO!mvhm(pmv#{3LHZ^I&yf};X+j#SI|zUV
zEaYXrfQb7I#2xCuYvqh|$Lf>ZbWnLyldb?T1nW5lYPPX?`_W~)3e?TqYR@TcXSvRv
zkNe|RTeN}KvT+PDH%N2ZPBRkMD4Plb=WiTOItXb!7d}5p|Cr$CN<pFT$BZXUUN+Wr
zPaLaj;Bq!11xSpj&CV9w^VlANV`umTE=Z-N{*JHxYgl{|$Bg39X@#BM@sz@>ZRRJ!
zl8SXb!ja09ba@o!9MZy`rtbEWAW|qT(t~#=UV@U}^%?o(@_ta0=<tph@hU;FmZZdr
zrSyJWb`cR~Z!0!ym6}`rlxw4u%ew=A^h4Bj9XaC&^O*JHwvRFQtp3zbML{_X6gk9V
z+hkHwSQ~67>_AN51}F_epLsr674pQ)Lr2f~lfhy)aizlE!?B*?E`pdL&+O@Kp@=XA
z;Wr@`;c}!5A(vK+=N?o7(_&eNaQY?%iShF6Yh_g+@P{4`L!7=C#c;lURFuoWpBvC)
zZ#hAY#E7|2uZOxSqRD6VO^O<q1!?^rpHN56{yO+yPg6<UFlt}~^r|tSxdHX$g}2~N
z`vPfi1*`hcwhL1P1coYg0jt&IcjPRo@5WY=ZHN6Z;YQoOK_2BZ2RCa4tl~6|-SgbO
z{@6thPyh8PKUS$1$p2G#@9%Gg!Em!#dOA)Si@<1f*O<Cv80b=+N15t8g@B>^M@Cxv
ztwGhT6npt1VXldmm;0?cRW?&hR+T|?Gjcjk?p0Cv^lAksYlzNQrf*oh@6V@_K}RcM
zC?Q9+drTDoq?I9~ZP)YcRcMB-wEp$Cx8<*~`DfDr*tk5KcOL-I3jwg2w_KY1UYx>Z
z8TuLgh+X^OJy5Hts%txbA;!Ip0$S~n{gU*FM__=XetXp9y<6td0u|hV+w^nB+^Y?p
ztAN>K1$Fzw8<f(({39&gvbrWuEw`QAT>zG@Ojh1fu1-JC^?%cqq`yVDy4$y~HDvW!
zm*@(pRE`)EAm{y84Bl<ZI(IvrGd64$mZQ@cX58+0=>4{Pc;5)FMGZ!s`e_Gb)-uoI
z6gX);7c3%qcyQU1GQdBEUC67In?rxqsG>+$r{e~*-iI;kIHVPAI`tbX-$36FxI|`7
zgVkYz*JMXv&v&m}(%1UAt_Q<BQhkUc3GYhG-@WoePg$2)+C#zkW95BkZTk*vc=V0;
zpO74p<_V2k6X0)JFih#lf;Mb|sRB7%nLYsAPI)W}XZ40JvKIj;Cam08hr=*)`P(W*
zH!%7lKWXY6ns@~(#D{f0=rGy^T~m?m6LlmwrFi?l2i<XJQ`5lKg|tcui&??8@$P*(
zzs4T!xmPj|PE{5VGtuZJSBA=LFUe5z+m57}cEvN49pU#C0Gq{%VFONH=$&*pl-ngW
zVKrkdP@u_vLMQ1M13XHHV#&SHade<J_?En_*Yx2f{q{s6R+^a0a<hCP#s-?~3_RO&
z6Ae1np?m*BB*@Wh@jMCUJ8opDJ=`E0^RgWWQL(g7M%yOSraU67g9e*5umeJ&;N6ja
zGRZ9r_k#=TOk&?HURLgEmX7W-F!S|;|6>F2_fP23A)SD({QyVa@my+}rj|J&t*q{I
zugb7~z|?v?O5lPhDV*SWLesJz>iAoe)Gw#hbtVdF{5)pnZ&)4yhDpHy*Ao8@GwtP~
z`;SixJsZ(}tG9=B3O!6<ZX;*g=Luc%3o3c9mHOfsWt|A#mgxD;0uASgz{vNi#o7Hy
zudP&P8cRFn9K8o%Ai>VJl269LqQz<D>|Et}Sv%yl`jK`VSjRuC8n2BVfnq+Vw!0Wy
zM%{GevhhWI*Nb%-_#eDkx|yu<Sdg0o%ssOSn6wgH7aFi;1r{D~f|#AB;?4U=1_9QB
zdW#3!uLCxI2vO)t<UGFV?%9{xbqnv2j)xBTOEyckS3H@(>B_=@gjVHu&0#)S)FC^0
z@Up4pM&-)`2sbx5Xx;Se3Fpu`Rif}<h6}}^%GxUh?(*eEr4?8^5us`5^9`lTR;{Rb
zukYL?iy`oH`GqK?d?K%*<X??r{ZMYDgi2`{RHPte@D3!3)=o9f`RMi|b`t%9W8F3c
zS*${cO=~U)cOUIM@JB5py8tdJC>m-12?_-?dQArlDs$4iyp~(gUP`7kPCDjvYEFWX
zT@Wan=rcdp=b&AA(My%gTZrUuUs}#~R8X`H>q!+aZreS<8&Esi7_y8ISvTfIG~Fg{
zp>Z1TNcUkL#inYH2cY?b-0yC9Z8peG<Q>zZB)CYCvQQAsAEY1{;fIy&7Q*LiHBCr6
zjCPB3*{?;E6`zlDY=JX}_8)pSAaw3pJk#xn6o;6Jh!6faKJM`|K0zNzt;eGj3JC@%
zNA{HZ5##l?l)@QvSbdkP;WB`*-x4rgC&>U?Nx+>-DRp=d&?O(7dXRkgZnhcU_Nq9G
z;2P-9v#$3gVKa7UXP626*Tn=Svu`A0!qMKI3NFoS=>c_=;oK`PV0^6(+_$N`y9L?G
zQ(<`hk2h0IYPvV0@ycH0-gmYffL~V5ccqqkhuGA?gM~2#?v;QXB2UQJtYg`*D^kwm
zmD1&9)8l=6+(P?%bz3qkr82w)!1;kO&*g3>KV5Cks*bUigi)Erdqje80zZDqwhL6q
z4CHnjsZW1fb==`%VbOD%=!%EhFU<t=*l!lF4RVVK066Q1cx@*c$A<l~zW&JT!p@{p
z;{lS1iHR?@PrrFz)-C1ETC{Dv&>aP;crSftnN)>jPC1}icFJRXgLZi9=Z{x)1k}#Y
zy(>$BNeId0kA{n+Yvn-CfvPr-@^s`X;6AE~*FHQj1g3mShw-fIQ&`7uV>u2F4=aP|
z+zD^6vd1Y&fJU;-ui1t^AztEbqer0I-hs~j<@@l5<jTf(r8lVs5!?HOr5alGQ^5-|
zp`f)GHpu!@ExPq0uT((YSg{{JMsJ9Gy7s~EwgpsKEM@+fXu?awh9;Z@DV|wur{g-S
zk<qI7Rqfx!r&~3<NvaaeV7!tZaYAGo#+m1G@`d{#aIi&DZDa=e(K%vwDeT6YG*@FS
z>@U3R?<X=X3E2Y78PlmQdV<{`r*H$bL&E8U9P~Kn5-e01F0u^1RoJ~39_z!3)nryd
z>gvJfcHR@S`uT5gZGv+5<6uw#yk=R=j|e!4sU&o(gSDlxk^J?8@jOvYyBRmvUbJR_
zD%A~P^z>rI9GLQ0cPP=bYY_4Jz7{DJ4i%;;hDShhf1NZ7%E=Qj$+=5Zig2AF&mE+X
zmEP?fd)rcp({97w0@*L~E6VjS43dz&LohsC&qAS&jc`!XK!OVen@yHw&l&;A6dn-B
z(9lthKw02)c@XZBBg)m$y$SMiE|Zi?<X4hQiuKx3RgFB8{nuS&jBpo0ztH)(icIE9
zg2Nu#^fzUO6=cd5OcIk9N;!Iq>N%dHGPH#h568is6?jPAn{4Sy-dAlDpA;`5XH6ZP
z)#5>GO599!)9J38iMuN4H?g&k54QtY&wX?OTr}t_#r?L_tI&Ph*QvZ5#LSi#O!ti`
zz=r87zMO`qux$dT9u)wPJYk;F%>QWb%EPJZ+P5h~WXN<%2+2?!!kd}MEM$m`2ZfZ(
z^LUPo@gfx|Q$&X{WtPJsBr=Z~PZ=@~$I!|2Tf4Wux9^><@Av)vx%TDS*LKdbpS9NW
ztmnD!d+*ilx%8pTZ<eu^U2`(Ns`bRur`1NfLbmM|h5gGQ*LBx8zi6`$ke+1J&J;?X
z;a3RNNKBpLWgTAIZRFf9n%gRl3)F^k<1KoL;Qd`gj*`&Y#df%ri6qFA`ar?Rxd>;y
zJ~n2vo2V-<RRzzE+q+A-zCZ+cMT|Hf7|As8dB#ESTUapHqX5dIHwIJ$8iH<g?}YcV
z)aaHS@M9}M#;tM)&UM~sh@22_h4ZN6Y6AlRsb;9~1xu&RNIm0pPL>ae(?v+Kw72Ee
z0wkq>LIDwU+P~qAMxHL~`-&YTYq1KGdn2{gkTM$0IwzeF@3j8rO@cU-5u6}8K0}%=
z)N?IGIt?w;MRmFt&CFftmDkgprbi_;vh0Y<r!h`1PE>4Y`AEW1aJnPjr$=urD)IJw
z5S-VMpJ?XBjp!tudJaoXd8yQ)wU^=szL{eS$Du?f#wLdOq+N19J4d*7ahf_2$f@IW
z24wLC{w~%Zd4*lt0E+U)9AWPe$!b0+HUGgO?sAM1b<<bXyhrIevL!Wh#&fcN8OmKb
z8-+6{BQhb}a(p!t37Zr=QLf0AlPgo%NxVy}DzkXeEZ+MTrEG8)Clvq7yTYk+UX?EA
zZu!gi-{!B6xk|aQ$?r0GbWt|CI86LB5Jy`eSoQ8S>Omgn{H05g#)X;IEaOOTFZ=2V
z)W>~qr_zd(OV#vppH$J~%xy-_&gtWKa<rUEai!JrxBiuL{P~1G4w~#cUY8*i;e*9D
z`?(5x8m$FW%V44hHAOSqwfNQeSnO(^73in~*+oAX<Hv`m&m`CFe_iMYEBUmc0t`R%
z-k@fw{BeZ|TOdc^#^ud~xB#*oH|iMxWeR9NB$@5iRgg2%hKELjNlv>2ke3^IE>;2W
z)8x$Fr$}fyl@Hr#dW|Hd_DpM$>VM&s9!0s~_^jMq;;P(d1qu47z}=mRgDVjJ`2O}m
z$wFPAy7e|hargK3+F~kCh7suGHsXhu_JLOvOMm^GwX{5A?zKAMkQJ-FUlRH{0AM^o
z?ednXbA<HGfprAC-OO2)%?5q1iMqL*$9<OmOAkD1R~x9`vvS@e4|MA{GDh?KDhZxV
zR~Ua$H%hU!Hm4hG$_`+Vd1cP8@%N<O!FkSFRQHWGmS`28C_aRLA9Q+jGhwKOGx)Xi
zWC-c~fU7w7^qnUJ?nV}~TU<%^lrg0zt#lFsrrjgpsEp7(6&9BE(8CYNRLPMzQxSO6
zy1qEP<-S0oVdu~qgyk2!m!C@Dz+)x`;UhO^&9NQ$w=huCDO%GLH3(lG+ukjY74hMs
zlSyjeA_sZRL}17q4;{bx6|_2|C}M{x5H-&hNhP5#sjA=<F`DUrM&f>)hMBj>LR9u~
z+AelcD`Ol_hVLlF==~spR%%(<6e(vH#VZA|TO=t{&srLUN<(UzmFel_tOvz6Wb5f=
zIia#L=<PAcIlT1kr3^aHIHzS2S2Ec4GoFm|?_BM0aQiZeXE2l#19|!Fxi`vD*Mu@2
zAjBGR<8Da@OjL+di}6pLp=>I^Tm=RyLq}~Qni#jp4%g__&qriTvt;HenSpZLmU-@J
z@OqUBz!<aY=wKtXcnvo!)oGL7YeAX5bHyD+_m2z;b?b3g2Ah{1y=f;oYP!6hP9mua
zN?NcQyqjfXB=Sunq3;*~tN^oDsj7D$gCKaMxJ9r><zTA(0%&%8)?j<+vSa_e{N6-Q
z5?h7-S-1*b_IH#d<c~Q|9#0n-;1X&eLh=?qr*e3Px1QP9JX1$@?agNs42r;N>4Rk&
z-+7`gx?XytSG#x{v$MRg@bpTdWopWb{LW$)q)c+Qva(G;`L4Y}U`fjG9Wp!S17(@d
zYnM^C<5MS|P3{53lBTfM+6K^FJRFiFELa^l9)4?mR})77>{FIy5aIf((5hO}+A+FW
znZ=^e;Tx7-7zH5iHIT{8ipwuiUGbmT=>tzKpaI+>x$TxJbm#yGJ|+@VXPjTJsWP@L
zeE~)4BlZ=mz)hnv;KOHzsW9DKO<&UY7VR%p450{i3XJP#sIG3OpF(wZ0^;f=W`DEr
zd<v>6sFgSAIgoPj&b6TkWQTOs5f|xU1)xKG0t55=N)BqT54g_vwdU2>n>Ris2(s38
z-yQDqoC;&b6pd)C1<4w0l1)!YOjS!MF*aY!gnjzpu<c;SQ4P1uR+ejQb5>H4=**lO
z<c++TIc=ZRcmCuhGlqh`RWBmRa`88Ob2+-%R%d9l@0t_^M$2DlQuIJsTr7+061n5>
zEPNgN_1SvVu@GcI1H%Vvvy_%vi5J&%D<>G}f5h-+{JEC&h@5W2AO$X>b785OlVKFZ
zx3WG&$k7Pn9UCgPq(a#Z*~vJyy1C?_O_ozL?JPg%6E}2xPD|nQvGw6i;Y*0T6Ad=A
za47I)p-MiZSm`c?tHsB<!gSC*`B3E5?>uso=z{^>(W-G(iZtafCmU$<Iwn$Px;n_C
zPErpYi=IuGD{xl-2Ci?6*F~B=B**ettC1Gt+o|#H5|fyH{e+NB%fl7oj2w8KLvgOj
z$Gc3k0LD(5rmQC$2Y{pN9g5M@#@mI4&KN?utBg~vfL~*3@%8Ww_|ZRy@*h{|pzJ)U
z>aFlZiGj}|5@j`)p6g=l^(bA+J;x8A&sj<U{<=QtKaNi`#8#FL*Su&G-s;WOO`7TB
zs)?Tf;4``$sM<`HO4@|czl_9N)GeiA?y`VawW)FVUeus1SCC=p=u|ie@Eo{mkJUyO
zQtpF7aht`Vtz!%14MBpCj1CPTKaNiZ(aS*bXZ&i!S1{5Rk>pD#K`#CpG~!etCD)TP
zs+*hYm2x9S=y1~5A}^~Hcvj~9ue-v0!$y`~&y#G|J~qt^k{xG$-v+0B3#WU_U?u_&
zd`!@On?x<Yilj@n*ltSl2ad?-xU*Do{ymUdy!`rM5HsVYF?_rDwRt<fN=qsW0__sW
z!rig2&qnTE+j?A<T7NB<Q2c3NNj!a9E=WzdAW_^aT1^Z}G(4G)tqWqllEQZbP5Gry
zSc@#GH&Od$eNc0NDH)<Ozud+lzhTfPo{oJ)ns9A@?$vzRrglD~{_PZTO+gkW+Sl#|
zGHQy-pgwS!3%z63DRymeO;LOmY4J4N=fOAmyH|M5m(QX(X0dGM9`|hIe+1RDJZ`8Z
zgWeWz;%#pp75a@(_AWh1nl>D*vb2^cmS%I`|8bhNs&_9f(Ihp1jk$k<jjir7@<Zx(
z0Vu{EiUyl2%b40qH~8|NCwtN&(4*qKGHX10qvDg*3$Vw8?TC_SCQaEaa<`b~YP2s-
zdQp?fw^0g8GEDI_`PYIhC#ChDkG)e^xiN<iQ$7V%l79tk%Xo~$u%Fl5e0hBIYEa((
ziUuR!uPu82gxrOZNmqkPsqZ285{Q8CFb5!1`=#bi@bnq0%Md+Npm88-+YFO&#uYGG
z0O{7;JkZ$a?zToT-GdMkM=(?L^;d<}u3%qJ;d|5f`!=u&*K%(Ucb{khi|l1%N_qQ^
z6Q0e->@&2UmSho(>%R6IS`!A$oL^=qUya`B1hF`~aFOYtJ1(ei$ahvaG<(t_8W&je
zA^0O>x}JTSZ;mxrm@DQ}j~3i0H_gv+z6YXjtON3j?M}G8<(i*)?5tyP4=x<TS+}gf
zaWJcJAi95z&ucq=v+m2syZu1glVomM=J)`|b#t1flv-?fE@<GzRgGXN1`MmY3$h}_
z{P5&-kRq`Z`8dEV=YddFrzzgEXyvj%ND|zyavSx<2ZU_r0`{OUILFaS*Jh_Q5SQf{
zk1lQwS{Vbs%f1H}tBeT1At3HE#TlsKJb{PhfoB5%h{Nq3FV&eQC(|#in&4m9LB$4^
zH0khq7kF|~Skc{?=|i*G8j0;X_?rW?OXo5(NUqjHd?8>gaiWgv!slFH<C@=C0GQf#
z-Nh=ytnrKjgi}9~^=N4Ih&Or2En^-rb|>6N0{4qQKgm;y#gx+lrALIX9%ePlOSD|w
z7rd{QM&vh!Z8`OnGzI4nVbQBZ5SQW?XRp*5!@xrB7Tx6!FiB~NmALg*rx>Hcr11$)
zQj^GpSM7lG39S(q&}=lZ(++Jbx#Yxw=0*GUMDMvn_9p==zZ$lIpo^+zyaNSi>F$`e
zaj*7#UVN;^Sv4imWf3_4C~MC{3T^vgk1uv7?vsefaSkf^IYgwQzoK@YQ10K2k#x)=
z?c@p&0mbNC1wx8m(5zVGGvFvk4hY$d-p>4k&F0;-BU#5_MWdFRl~K-)zV#lCmm-{-
zFHp<VtJA#-2ThUOW^~9;*Uj3ziRP$%wL8+5^!VW6sj62d9B0&lBI8HY{r3~(0KJ1R
zHh{VJUIW;#(pR;Wc38}=U8Kp;=nX@9iB|0*t#H!_P+niM!+IO7S=8NYsoUR#_YV%*
zAAWFt_!?t{7P>q@;2Wc-AA%Y8TR;OUM*mW>NM;|*_et$qGkCWad4u)GH&L3=6MVX9
zPv&f<-#u{beyWm_vB$n==aB!he0_P|S;hw!#@crmj(HB=S?u)nHb}Me^7Gr4?@1?>
z#rt0yF1eml9}MW8jq$`1o;|RG_D#10xZ8bS1qr~Muen*ZO1Bj<t24Y_{JO%?pf__;
zX12{<d0D|)@P!YA%h#*(Cnp&#FPJ@hxVIwoYSO~Oww+p6B1i4zd~oh^*jccd36nSN
zVKIbvN%NvOJlLR}bw$M00qm`|O^_GjeckCg^EhBu1*20>(?T6IBq79GN3OG;z2bR@
zqLLE8zYzn;xGUQaQ^VKKY21+}Tc#GXZYSA8P>3_pHo8?d#y6zM9+Xlr8uLZQ)#Q)A
z<Mmexdj&f|>Ft07Y8C;bKxENLQ%1{bEB16#ZU?wTA&XSwE<G)%`?O^`>aZoWK~K6F
z5|I`cK}O6~fwWHbZ2h`R`FU#pd0C?lIxSP|>~%VU5Iq|cy)zd))EJ>S`OG1$K8+y$
zE;G{q4wBrKiHhE1XtZf`4iQ3obB0<bTV3=py|i(b=Z*Pr)nLwnOCCj55|5ZS=Cvt1
zxnx}sxrPyL0NX%4x-WM2e)8=81#hy5R5j6Zrc1~Hs+J)slG#VBE>*{Aj87?cS-Z2k
z=Y|qXzj$<hF`io`1SLminv`>!QZBu^S`A&c^5T~|eMym`=4-MbFZc==My|JMTpEAM
zVZW!hh^eD6mP2?RZ-S)z_qpm|MZ)t8VR<E^E?9AI<$XnLv>ZeexHkBdUGYTsldcPv
zjq(8Cbw;jE4l~-Gw-&yQlb2xFymO9vnT`0uyU!Fd85r4l%jAW%o<e4d0mfp)j<}Jv
zEng&6y~a<x>-;CwbRj)yNq%pP_~n%cJ=IuDxGb%x_46(J@S7tpsMJi%s!>H)j=fD5
z>Cqpf0kgxY7_^D|)Y+zrF=>3n6GI_Gt>YV8JZlFke2vdRf*zdETLswB0y^JT>8UIB
zHkA{oywGH8X|A~lQUaFaXj1@pf4c$S@!_$J#@B+6;72deLp5}q4NMpdm|Qb;TN11*
zl_GepfHi<iB~t7WRD@g`HP~+n9z&ePHX<r=q(nFwA%s}1$|mH>cS^8T(PGz6Ze-ZV
zC#0mrZ5<V(!Ge}qh%O)i=p`3T_^EDBB4WZ#9tAbNNtQ49!}wr9uRGl$a$}jyoqPiK
zjkCxN3&#<;&P|$$zTVzRrq1)%c;AKou?qRUK*=Zrk62Hbj>o8eN3VFo>(vF5Tb>GA
zVU%h&z2MpsUW+Cck_tMp%k!7_ZjN`$MDr%yJF-Y_COu0d)68QFk=}WR+k3LN(pla$
z&OXPn`LSy>_n$)JLo5uc#^-rDJ+yDbLM~dj@HdCB-qNxiB?~u8%aeN9rh6VCmnC@j
z76os%Lk%gb1JyEHjUq`|TI}J=iwmBwkE^wfk<K+a+@8e{A0e^c=ZD<^x)ZU+O_J!b
zD2kcTQK-dJ>3rg)3BQ<(W0lTMjk<&^N7B8>UrkU}#<^7<v$S9@Xx%e{D4t98#~zlL
z9p=BUK7cZ#vXM-IIu^&_#ieo*C<F92gn+vy$K_LodJS2|QiUKd({@)SH)n^6$INi(
zoh{5$eI}plrzHA|8+L+g$SJeK4<Y}J<k1<0+LbQU<3_XT+8-Lxq;KpdgWz)42(7il
zMKEG0;Zan^H~gVeZ4y7to^36@9b)5aB<i>Ud!`z9>={_#U;23_yxv8f`Bfm1Z{F%D
zd$rYq3WwppF9km>5im3uJ_UW_H2mq`t|FtUV&0&9FI3yTH!XYZ9X7wTq(!O4<*Tb3
zC!Dd;4cFNew#iakK+zI3mOaDRHCm!|^yu|3CLEn7L(o0TvCLk$s8rs{$f(u>`Gp&i
zLo!`Jxq9M_d7qqRMZRS1+$)ijAJCd?{z|-4w`y)0Qe0N5^kdZ_q2jzt?NgZ|sr*qx
z*^^JF8og6{|9K`+a_%z$OKD<%9|6LYhfPaGkM?w!SK&>`dX*v3XwfSn$<|lAePHLB
z{J4psc_e)m-(IsU6&00KSua$VPEYTSOwHu7bV1HOznLYcDq1eYw7`b83zA*~yoc2@
z{6+5X+yqS{FT~kV-_SlO*&Iky6T*EW9IE2|8Y9SULh@aPNSpxiF)2^6N&#CcVsyGN
zUd*++dm$M5(ufk9aB@dab^3=Df?-W2k(eD<*I-sXQVXItSbCBbU1B_u7QmmCAq2V>
zr%WnZZzOpO`HQx$H;^ku?@W|+r^z_U1+SGY2d{iSh^xJF<OO@zq4oU!`TqPep{oTl
zr*%#gp1$-X1IXxNPya(!TTf4q!0ys3+N*ybaTpbusv}l*zzd+Zd4<joOuH-eH@E3B
z9%=p!*enu5<pG3ERG(VVYoA)?<rq!)6=IT740wK;G(RU8pHGsUO<u`pvdIIC0(5j~
zkg57%U)NqKS=gQL-*fZ~t`knP%JR<S)VsO4wZ8SMtygebB3P;a>L@)=Oi;mgXQ|DN
zeX23^-iGz}j=c=FE_z(kTCrUsD)Tq<7|Ea+0u~YvoRrh|PdrZ{qMpe=t$pzQu710>
z|M+(-Wf20yz-7tz!)pGE;2(q)xzhjjegCB~zh6|00$ygttzFIiqdnNEdKBRTi|pTZ
z>(5>M=X2O`(CM7Vmt%g6Vq+RGH)8LoJL<o&w`&WE;agg7$iA=D8DdnxezC#WtA968
zzuWfbVXSxI2FBq^Q=U+N@2ye>VwU!bZW|HizZt+E-STHs!4+606r+?_(|Uizs66QQ
z92+)t|7H^Z^Eh`!g3e-N_~`lLW{^tI@KCZ*B>dT!|KQ4fbuc%08?w**tGx@*@La=+
z{kZUt=KaxTWF{BrzD!&PB=&?3kwsu`&=6ddPyN5K*GU)Lo>SdL?fCDjxO5`0U&ehb
zS>nH$%rtzEaXR^}Ro~};A{zq&8^9(+Zou{bvh%kO|Ic;*=eqywu0Q{^E3*E8l;emH
Uy%R~PCK342P|>+qpoBpEA8<449RL6T

literal 0
HcmV?d00001

diff --git a/docs/assets/deployment/hf-inference-endpoints-choose-infra.png b/docs/assets/deployment/hf-inference-endpoints-choose-infra.png
new file mode 100644
index 0000000000000000000000000000000000000000..09e92ad3fc7a097034dd144f6f0c21ea74396307
GIT binary patch
literal 358264
zcmeFZcUV(d*FH=Ukq%Oot|HQ#^s3mYO7Da!kkBFYh%}XIqt{VEdQa#eRiy-}flvgb
z_m&Vs`3}xAGwS<$=bicfesW#8ayV!2eb!m~UTfWJ?R|Kvt$CY@{5&}U0Rh$BJ2xH>
z5Rjt?2u^)Ia~e4FWnycIfPhlnK~+`zuBs}Rw!4d+1K5^;;Lg+62Bd~MpP1539&n#J
zb3^6cf(GsLvnuz_2tC@l@Z{bdqR_L}*R@OEM3NVo-6;7jpX(VrZ7Ilrscp@eiGp8X
z+3G`49T}nLh(Uw&q%`yhk4%E~$U^5P<OzDwxCai@d1NX@m$aDZSCHouUUgmYA`<T<
z9c?;ixIyC1$IH*p)+FA0R9{z1Mr-TeeJytvd30=C5qhDTfZ!7O^wliWIEu|{1RIxw
zb>m41?vwj&=lVY2F{dhxp_Du0_WG>-d)Jp|b8<IcE2UJi2)AkxaOH2~$|wo0)^H;~
zGux=J%SAEC+zquNYYn2sf1A@}x~{-%#rlwV{;k07h=cNi&4GplMEfNY$<mr<xKA#t
zBA76@k#n4}xHrioeOpX4Lb6~fsVt7gwoBAStBf~-uT-v;^O6JIb6O|jN7GiIjQX<@
z5{%rN{Qd*CxaONv2`{%=f0He(3sSoEk>*SYigw!buI3G&Mh#Gn%pC{f?TGlN+dgiz
z%hybKUXZq9(5Z16G3OGob~RC*i}M-Vwt-4lb{qN1W@PyT)#Y_smxnvpD8y&Za%W#>
zixbg&^2m^Q`i!qP*sxLK-nGlpR!z6EpWJV^A}m$EM20a~w0^f(mYEoYPpjSvMwQYh
zS()EZZb(iz$Nbx8M$C<-^=;1f$6k?_Quheip9h%ksR&-buae2{ohtaEwIk2RR4aL&
z^Ue84^j(kN_E+6t_ccpiNQcO1rgO@RN-5I_Yra-8ztkQ1Ob7Qg!G2TqjqcG`|7$W|
z9}_eYksJ0m*~F2w7MksvZD<bCpW0J7E&k|?%#H-{#j|+7OB?4Y$eS`~pFRq3O@&z$
zpZTVGv`nl2=_#q~;2_~!ES68N?1Rn|k83O+gR#$)cs^y4l6@t!X+7R}LX%I>9!H#C
zc09RFyaEj;PTB~%B_?_?Qpxfz<)zcKs!y)nFc~AjeyHDY_1O&>JZC?{LF^WQ;8ozM
zpyQx(rX3}NUVchpt6IlKF`5;m4GZcE>Y{Nbku-CIjj`sb+NM5bB_JIm>1p{8IMr1Y
zH;cg+c9A<h!AxG*n<Cpq-%q`A#g?Tl)=I+jZFpMva^^GfVdc5ovreOy4b>rvs`K+l
zae>_6mT+UM$P!|d?8+r?LZ{{>LJIj9NlPKreI5=|H?4jBu_mxs;E|1LT9(rs{-vJX
zgEifmfyJGhg9*IJ@i}8rW1spK#ocb%aYPa~vRq)&y5P$8!QI>4n?wb7c)xyP;s!R*
zfYz=P>U^|L;KRATx~jO9MxjXEqy*i&Cv%Wi4r<YgJWnuBL%~oMz!)JQa%yibvt>Mo
zCMsCABzRMXSo$l;feP0dlIL91mx7=6;?=8qY%Tc{$>xGDXcNVUNM^EuiA=6BqNp$-
ze!ZtOAD4eUTSesjsMdAY^AU3<YaMY0-6?MFtD(UQ7cW2Iv5J+s2yP`MyV3ld<r3N5
zo8q)&zp2<=*nWQ2hUY;H_*&lcz>lDBm)r>*RM)s@o@;)S+#+k!_R=Mlyk6M*{0i%A
zCg>rX9AURgPA16$ktd&Vxc+aoy>dI3{K)Eq;crBGIVde1S?DF&*hHn;+b)#a2(rHf
zm6uu-Fyyy7mfqS+Ee5R`GGpj?rzumz<eM1T9(T+T1&}MTT0Bme(eq&sI^P(s+*-To
za_antI7_XKOB-iq&YTO)4ZU!k4<tWDJ4HFB#vTg2apC#hipw=E^@%sSF7$8-b31db
zai?>^={V{A?_7GJ^eO$D#<NSCcYWVp=#%Rc?sMzYdqBEKY!nT??tPi``O8md-MOn@
z)x8Xe3V3}Gb&&Mi-O{%{4=(Us|Lpl${Ik@(i?ibILbj6fZdPXd>CC)08t@$ucNE&C
z+~wGfPEJlvN{%qDNH&BN87GaJS8hAf3@YV0<)d>w26YA)m(&KK?=!R;-yDVCdSmqE
z;NhnVh0zDblB*1>gsUN^Ra@?d<ZurpzPX=uKgUgPh9~Vh;;qL5{UXWEgMGq%Tfc<M
zH~a6s%>Oi;T4<EzYq%Y67t5sT^h*D&e$mj`!Zc&%igc%!6@?YVm0_b46$r-+z$}_r
z<|u_#n-Y<zcA1uiUhXBs<qgj=&wHNU%N0wW%Z|%63zru(`wM#&^Uyu5iTdgs5)su=
z)fv7oaSn-JM0-TPl(e-tMwqc<%w4L|Gt%!A8@j|!P}OVg3m&Q*f)5$@clWVWuEg>o
z4?}WKvr_f2cv20YTaz>ut@GJCnrb}vTex?)Shxfw;yj!M!*Y(5g!OLp(7816C2_m+
z_;dE>ilvn7#vGbOH^t~u3Z!J6w@B3z+CZ}<pAB=2#<Rn-xwFapg|Z8?Gr9}9r@P6!
zF^S{SImzYS{oMvB(kW1rM8l}cM2Gv<n<+ePFCa+{)k9mUv;G23`8V>z^mp}<g}Vj5
zLnK3zLs;-bsRk(>Fh8USeHJnTAAz%ii&0tLMczr?jNS>W_x+{)OAk-u;dG&N92YNL
z<i9=Ut_}Sv^G$w0M#0lYE?k~TZb-g?%|T4u_uI4Q^S6RL+`T@#jm~*OUt!+&-Vb|o
z{&u}L+=EHRK*oYogO&ZNU(Z7LmtxZuvm3&!X3n+ZrX4lHo)GWDrMb1s9{FC&o(NYh
zFN^h{$ikKwD-lozmdj_)ziad1*51P6T+)2?<hF<iX)(As%^cZb7)uvDA~jcvNRpoP
zkA&9Jbn*_`muuA)=ZZ`s`moP4sxx|BY9}RPgm@#%Be(k|KUvJdJ{~I$zm$*kzd%57
zhWZNiL#hGlC>lYU09qTSS9H4c1MDm36)x`GIKzEO(B|exp>#T}ru;dth?<BVaz*xR
z4klK84$PG?VN<3F876jCIqyM~KV3ZCizoYcXg@`oGWsfimUFx}@cf~br>^JCo&Lo8
zViMLpZQ@qEZEI11%=4TG!8PYPjk*gBvcc(bFSOG(l*G8)Y_0HB&u8qSYhT&KUD9;C
zbD4+tl8e^bIZm0N?!6d>;a9)CN}(^{RZnpR{q~_X_33TiFT9()?00zHUd~=qKWvWu
zX0YYo=i{*4UqfR0!T1A3R)%Y3iOx46V?Mw5wX_EDL*H;{dtOwJ`eavMm#~<Dsc_J1
z#ut@*%YoiDn3$D`)YeqR>ThEMV=ZSPcj4c5Y-T?7Uq;+reRs1D!<Vizq`nv*_6goe
zhdbq~nofQ2#pOQgO3(v^F6^h`kH?~tprv33<Nizi#@T2M3xz|YYuX<~BsR`HKG!Xw
zVc(O2b7it0iXZv7QZdr)(KRoa*e@pS<2<OaRJY>W$Rx*DBp4vC>=rab^oGQPS>cFp
zFDLmz^aZ0Yg<<9t(n8J5Pnj!)IqH4Jr(N2brz3eZdEW6@#Gi>bJ@6es+A3p(H7rJJ
zx*#L%v#ql)W~B}GiryRNR+d@L&gfYi3>MlI3Y#B#cfXZnzGrq%y6|0*UI9deLd40?
zzSJ34BQl#bE6sl(fGLnRZS*<BQ#Df=Nbf@m#%(HcZTfQn`$8a2x#Z?o<Oz=78%u87
zU4(~1=7T`T59-G){Xb!f<uA#P=3C`y8q^vXtY00gE;wCyf53C?-iVhiv}rBeIAT=D
zKhggl=5hVAdf1BEIMf4%I+`P1A+979qA5~tmC-eg7|<wQE<zT#xZH7kD9`3sRsAJ@
zvzM;pqI|M?3V+NJhnaVjANWJ*#0*J?zvdk+&$KQXT$S&G?QxwMO*3Woz?xlkRMNJ6
zNKd+4hb;7<4vWjCNN1+Du(2p;{N|lo)K)p$TU^x0;ppX5Si2HbJ@u^Pbvs-P(owW;
zuIMZDb#!F8ZaKmE#@NH!bFghp;VY9>L>MAt@>BKp65?P|X)?_}*0p%AVeYVxG@OPX
zhByq=sx`rXi6Epg;b>E;!5ePuwbA2Vim+3p_oc@xN%-m?j^TWD?6v1#E4Lqi*}T3#
z?P2gG!x&ZsbJ*VcY7qph^o(6z^WpIy#QS|>J(QN8sHuajJzetM5XO$rW7{})lyw7b
zU<z2i&Hi$vPGeldtH8>`(LJFRbp6EGggKu@`#PSn>Cx81m()$m>;%0p2rQdCE_&51
z1)vOQ2b175!N;L`_8%LjPpb$W<ixH$hDjp`P_<M90`Il72)Uk}R!JpQxgE<<Kx|*#
z;E_{CJ2hhI(K=i)c6Gz$*^>Hx$fT-Crmh#EDjG(}5*8vaDq0i^q!-U@4e#1%Xb|uN
z$7cvm5uPU?0gecPuM#2apU1ZduMiM_KTkwJ5aB>@>OXBXf!~u)9PmBq^ZPIHi*N!`
z;IFg5*C&(ckJjX<OyWO|Pkjci5nR(zy?Yn<)v<QBwRQG*=;HZKOZG%6GS@ps9s~qT
zJSShmyALjH0OO+^bPYWXHPq#-T_D0B8y72EVIPR=$v6ZGK61bz#MTqU<pTjbd&v1H
zUijWZ4mdtJEpmbDdlOG5#S4ZS+FYtG?zUV~!lJ^W7nI1kxVRMDZS3S8+_?3h?!aG)
z7an?gy2^=&K%r1!sD!YKyS<2*tgNhvsJMu@xDe1n$ivs!6XYZ0>~Zn;LH-!$hOLLS
zyMwEzgNrlQ$+#dZ7cWo63l~mq^ylYyIc<F${<@R1$A2CRctDYpD<WdTq9T8e4RlpF
zIV-2_;A0Cmy5Rr;bOzi*NlaW^O5uBl|8eQBTmI11@UO1o($YV5{o&HDUG+R{-Bn#6
zz)d}s{+h7=-1o<e|LLe8a`Nmy=;C)pe?JRoT8Ugi<j+}CA}6+ck_1d7o5Kw)UEmjh
z*~y0p$a4v<{Qe6Z6M2jdom&UasSw<~aZT5UaAlk<k<&JfcSCw{3`<33aJHIzO#0Mg
zTIU<OEH_+T?S}LeZka*t#=cxLv!6@q+_i(+rC-y&L3k}rCk{_}$vsTv&YedpcdqyJ
zq<Q*HBCHs9m23K|YhNPq>Nyj6e#?b<T6zdoECM#3D+|x0<5GD<KuC1z4DCNUh$Hhn
zTe5rkpEdqtWFHHaCQKlO;y=F2_m0<^hSdHT;UCGSl6i^C(xkbU=U?^WvRr2WXT$%Y
zC+)MeB|@Nuv;V3WZOJb6zth?kvNNc7QBSge)$0t(kMti-<$tvF>eMN)8cWST1;FpU
zPJ!!*|6PxJL_}~NO0$0l0V4RsKZoXb$#@6}(PzVj|6MOall6aL0>FKOUp#sQAyZBG
zSG^uRDun(4q5tUq|Cm~pyDCla&@8oo)k~#mNdBJ<|A+MdHJda4HJksM&4112ztQI3
z#SNnWMw|aeoBxuu|B|%-lC=L{xs7-B+KTLUbD3>txyghzb}Gvs;Vj?33f=QJ>#Mrj
zl_srR8+(nIH2fMd-fPd_{hwzXne_mpgD3EoMi<XuYB?yk=S8}D{D$^kwrrS1fM*0;
zYr5$YcMe`{98l<#@nJ^%b!8U!TBPmeI{rmc_ucuow|jF2t&Eh|ttKb8$U&Fb_IH=*
zPg5_j?qio(Pt%;ImGfHCm2mcVMi~*oySuxmDi>Ws4J=a5#kW7J&(|*`H>>rgQaw#`
zrZyTS8O2fUzc5(dfeBzp@pL9cYgl>E{^N-B@FkFwq$DoU>@V&j!sooYccJlc%oD<%
zeoa{^N>;h53NO4jLchs-!k?n~n}Io!sI7z3<IVz8O948+UUGSS<Levx>;0pZLgv?V
zdeWM6c{!Oeqt-r=)>5_|t@D>7+TRH@uU!leufM%s$){7{7xf5|ui*WU6&BnLq|M`$
z4em{F?$dX5UXSXEd71Usu+%~Fl5i!e)Mp|%{ZzU!tEC_(60k+;fw7NwU*w2Tnq&}|
zrD3^u)y;pZEn&t>-4w=-Bk^1sqxIWa;m|KOHlwdm#4M<`1mj^`oHZkz%g$Ab@*R%|
z51Yg0Ga5#=^|XMZfRI(%AKA|TnM{FYgV`@w%Hzke&D$cHWaX1-%suB}?v!5CBktD=
zyL72hK}%b)x>4%a(9#nDyb6q}=>qXW7L6jOT}5yx*)03mHAZVh$LAq(l;#txyll9M
z4%(a$ZB#xVj$eZnSg!UJn#geL_a8RBSB!*oPD}W%<ldc1gU*HPwqaW4)0rNyc&k-9
z1qC@haaaax5~79PIdc5tytxE&N-m&DD$HrUdj0wJ{Q6ViZ3^RhJB_{BZYVROPDfgR
zI!op78g6YBK4wgaj^OZ@>Pp<S^R_@=v_uaKFcdW|7WFcW>nxAd8ti@a%?WcJud!Pm
zJXQ~~HC~uRxS#?NW_eJ^)_#rGa&zVI@nv~)610Y$C)Ym)D$1FNUCz>ky-0DTm$-Q<
zf~}-m)Fj{1q~S?z5cXlBguOX@@%_d2P%+X~oe8rYW+CIV6KV3wc*6>xy9?v_w^_t}
zEK&A5=2==9=51B+a)1?4i!_QWcBM3O30gFW??iX3)GYUky2sLGK`E2tO-zX35)+Ax
z`t7nhtmlg_nyINlyz3fY3mAkwMQV^mtDP?g;nxw+g0G`FGB(9N?Dc+_D?>WGdi!Y{
z#MLehyUq_yYXq-)E&{f_$cmYS+OSA@y0)R<1?uVILh3%4uw7N_wy%*&0d^@X#>xKO
z$(0~YjQRw{_CyNjP=NzEF)4<omWuQ2t=NFZ3(j&uxGhG|QF9yU(~Ea)k~>eZ{wQud
zb3b-*P++ALU)1L3J@)MN)VQq2Ovk~-#N)OsHP!hpKcr%KgjvL3al67Ij&BOboNcqc
zQjUG^+P4{D&}C$P7rU{Q-#-&rmr&0<UJIoNIZb_rlyf6E8T(s+>4X+`cL?p#j4q#y
z#=-@6Rz?(8YC3z9d)=`tRve1%u?M1R{}^DsAQCxnled3_Q$M|nQxgUb_*aTKkuLKW
z9?0{|A#XzX%@d8p>h@Yg=bOt|L<@)Iyw(^r+5N#NCnVjjw>_EzwnPJ3a*|kDkG<B<
zuq7A~E6q?6xH&uATuyIcs%)Wfq&goUO35+Mcy!>lEUDZm`Oem4EW<nM`0G=~*H-q(
zbmlexg<QjNXkg{YQi#s(aCt{8m7<?#@x<Wteqm$1^4m;z$2YfD&$Xv{>PA|dpiBLB
zlSM((YJl^VFsUmBwVV!<(3I!%T<zmYalF2h%r<W96u7@b#%$(uOUlNL@`CcwfXB_f
znh7^j_9`uzxsPI!wWH@t0^QsLVqiYGZT>8hj#$^vPj5$PZk`)<(#h$jj8&G+ohV9%
zP?^<+Yni(Tb$he^<1(DeZTf{cLNtc9NQ0(Eh!9=9%@iuX9w<X0;|;jEqP<oU#`TY{
za*HE!(u0buOw{GGk14vB`HAxrOg)_!jCjGu)Ejg3@3fuUHr<*dMHI^48;%+`Ns(Br
zS08@~$a7u#)DiyNe^tL=co__ClG5u4TzF2#sKb*nH|NC&>J4WxKSV_!-{%IHxP9d`
z05$_Odo@-SqP*NGhl9An!P4&zR}7$`mHER4>)o+h!+jOrkcMQT+tFi+QLO&zLz9V*
zATxclQ*$QkxrqXWfJkSDB=yo~UX|V+)a`_*HDSK6M5Qqim(A+0b3C{?L6ZSB_B9-W
z9lbMXd8@20496}GOYc0@dp%!|c<+3r#-tz$|1=UQ(7ybCl*j(^=)p1ky;DT+RUXq6
z4j(l_w4PXEwaur#jU^|SP={iq;Nv3vDmK`)Su8@oPQb~^a(mxmJc&e2S=0~dx<QB!
z1qg<%^+X!pylTFoV`fuhWS{ibI-{o2=Er9<8L1oBeP#z8+Ti2fXdX5xyJJHhsH-8u
z+018g)&Vr_@v^1#Hs@LDsClFbaBJJn_=uDs4-2;*RT^0?Hn#;r97sqwLCAt`Jxg}X
zYyBd3_w&)Jm$7835p@=Y2m>TXmdAV#cXT~pxY{;>E0*QF60d%q2BT9yTQM>~Kw)dI
z^}@pxxP{NrqENd0<a7SvY;w47?Lu?;^$ex@t-)wxC5gp%8-3q$v+Rr0OCPU%0L6}n
zM--XWhVFnf0`_sD7tO7QtXy$@kw~iXS}zKxp@MD<G6-t!v+~sEu=Jhw(nwB5;%>jP
z+4=L&p4By0&tO4Q&28Lz&5F~#A<e=qr|p%ZqdS`wX%y(<+sP5RyKCbDrU%c<%Yu%O
z;Y4tkI-I7@*QuPXsS#OCPU!Uo4%HIACkmkHZ_lvV=I_R~@PX5tw?hN597){?6Zy64
z{s6O+S2j_ed#~DjjdaB<RW0JLnfyPZh^J>THDgI3^{_Mf5lBqX&xbPF`KdlNm-E90
z`WX2OD+uJrnwAG#<ra-ffbaLvN1RZtbRWkDaM>_L5!}K^TO7l}0j@a6<kbC$R?%gg
zeXIaxK8;~|^?ZJDyh;5d2)X8j&vHHJCS_AL9KTi@zL}G*tppA^OmVI)J`<kKs9N3v
zWjFTdQjJw)wd?YcKu`3(bK2YM=;>+BpA9abZ{@FP^lyB&W|Y%W9X{Nnr(}2Hc>`$_
z(joU41B&-r!)C`>2ep`78YF9-XD1kl8m8uIoAX}hm&xV}03?;yykmXX;<nS&SBAG{
zrS7&&;YAHqOXP@*x}C?pv@O-XXzeCULSsX%PmHSdBW#^S$7}>sCmFp3`AduRnjpo~
zVam8o8pioMQ){)>hH{lzVg-Q{MmYtX*bbOMu@Qa96x3$jyq>_d%~IeWSMW1K$UNUa
zTIDoPJe%$x^x2L+L-Obw%K=;2$TnCVARDx?iu=7K!yGNrOLazZn+ak!SWR+zsKl=N
zU2{925YeEbKi+r%pP(hKNH7QdL*MKnt({njW{!CiW@1vAX~NguSxQdN{BR*clP1l2
z!`<2#h}pwO)0mPX2Z+?_m)kL9q?}b+<2tX3#q{PBXF}Eu9v4DYoIv0FW~A-W#IXvD
z6FxI(;Acy{-X_FwRyi2?W|3*BI4dU0LyIDWbXSDhLCCV!a_WUEntk11tA0aursdI5
zV5If7COMr2w8bUTv8{vM-%!SK^2^8?pv|Z$^l;fxVhEPvHhYkEkYTCd^}0=V+<<Kg
zhn?`{0q%cXVPCzGsY(J~)+;GA;I5QJn|Yrr)8j{Rc(o=bJ~D&NNjjyR<Ugu;+H$=5
zL{z2I4ihmlE19kfiHBQ*$+qN*JxLPEUCD~PU1?ZzfQS6{{zmd?3%Zb~v?CV3L$iXR
zeeZ(NWaFA*j~*G>WyEZTyN@JE%w#m9bw(uN+<=_4=hN5jNOFJ@ICbhWT1zpMm@(zg
zOt9qV&#h|B99A$)r(yP4r@nOX+Nt{Qtk4OJr@!RXhvN3T5X~*IN-tN{f@gG}d#P3K
zDA>1cxRG;-nATkqbO1+v7}!O6?JU$c^YL;Rr8?>m!?&3Qsn=WQk9ul7T3+yUw)DMI
zi<DLN`RoQNR=mxyTnMoGAX`75{iONw(t7+3HM50}otvrG{D%nM&?J|h&r-2tPS}%R
zWpkKdRfS1nDbs*V2HuLGkChi(PB_LH6<F4K?=Gzb;`-GPsa`m?{eO&KOaC(fej!A8
z)Fb)^G~@A4X360hH3t{Hw8jC-%kh-^OOi_gjaa)UxN4!rK3pl#PcJG%-X-V`qu*qb
zV)2DI6R|5ruZVLIN0_6MhhJWR@2KhB%8x}3cM_sQsK=!B1=5n&pS^aMZ+o;Vn{_*O
ztql(M26Uaq9#V%rSo;F52^TiAK7%=6$_a8gYTiKCa&%#UohXIS-qh;t7Bj4p=}OJY
z3z{&%Z8I#hqK#NX`d(TjF<sV5V$v@(9h{!}gU*z~tcl=!Rq~5CgXW!cE{v~jBA?z%
z)6r6riW+l5SgAP?qTP2#=q`qbNodLE$`sY;q}wl)T$=*?gstiWnS;5>v6S7~w#?lQ
zYp-wawEN>MY>oJd+hvEfYjRgp6@$P-SepOC2mck7QFN!|Oq-;#5D9S*z+iD|?wzaH
zh_=!#2glp&ZmujIy$!gc4XXmC{T0squsK%z&LVv{B?oOdH9JGPFD5L&<7N}4-DK?(
z|7>=ewKd6Ly*1Au91diN6Jmfom%=Zj&FQ2wtW^ntOe>k4!)M_W*avB@XdQ=LIp|HE
z-C`7IDRypfI>fN3AL$l&qmA=fI7!p#Lf+N3JzC7J&?^;RE_SIczF?TbkEcF2CK5zR
zz20p>JJ+t_;+S&2L?dfSUgu7w?v#w)61&2C7>k^ZwvX*nREhZcw{S5+G{ZtVNB(iP
zl;gKG&=_i0&!L=3?^xY;cXwkTbiS;R`1B41b2`jVY#Mlm==I?;a3HGW!&DSadLl`@
zP8<$!ZFI>)MV~P2u$3v$ao}ynj>W%}$5rA%el_6;Z8y*0I{Y_Cu2#uO#4Rrrs-6bZ
z`}v<4aaM1_<l38`(Xo;o7`PQZb}^hIwrBr89F%W42ZkB9*Ogg`J5*g~QR+6qDF9eU
zjN?=cODyk8t@NtWP~L8x8690B0n^C2W{A!Xo&%ZnkAjnFV&s)pDmymdnn}?>jQL(B
zV23KdiXPY28~yBvFte&e(?B+ii)yDZEC;5r!w7b7OPK(5w8qw_;no=#JMk9*E3c7(
z2ef-tZ>V$MbKxWAb3*5>+NK7icz*Z2c(cY>J*Sj%*$0ny7cO>$g2W6{5a>7k2Me!9
z+fRXcm9XwUQ*8!iGoOD~^{f1GeS_c3-~l(Q7Ki+wIdxHMSnS+WzRJm-k4=A&H(?@K
zulGaV;;l^x8fD-4P$Tri$)8zxlRm@3!z?s4Yl#NZ)jtB<`C(Yg?C80^MSg^}-k0HH
zLp@K=f~)@b3S?47kwIR!4O#QwWqbFL0sKWtR2=X^d>J`xCH2bsj{^ntLp30Xaqmz3
zQSq@(g%<23?A7yYQv*6NWW^0q7Zo-KILlO7Ydonks`gTQfzPNeBmTty*86Ex9T_wV
z#o+dC&WCd-)-W&6YF3xItWVUpv~kLo*VQ^7XLVc-Jttvji?8YM6^Y(<0jG#d>U#zH
z1?mkm6df**%%~0voAGClj6GUi=kQUeJH(`ddla!Kp;W0g)H7WF=j_wq&a74E@!B?f
zAM@@pT=<{4^?oqT3P5c^hyF=Y>KU7MKHp01%LCKopm}FTFQbVutnAdv-yVS*VLxaN
zC40)4e5l9-AzWZyFZI^KP`xwTOM@HI3Cnez?{!P~U*Q{^ro%PcDF<C+J1-|43X~FT
zd}}Mz(My#vXDe2F3DKu4*vk~14nBeQid2^rUkWu8vIRhdz84~bygC&@gP-+AB-wyq
zDLR)K*gRUPF=a1377tMqK`~}jm8?m|BXy`znvucdx2;{JU6=#E74+snivubLZDlRx
zAND?S{ZP#**ghG64$N}9YYjIyORHoVxIQ0mi1XT<<{6oYCu(Ut*c}JmEQm=qmIbFm
zt{iShrmP8eVbJTuQ=!(>LaT+7LIxi-F1EAPS;#DHge=j-m>3iqvtI@(4gkByU;7fl
z5qP;P5vT9nl_jQPJdvO^VBF-5S@E4p$8&av!x^@OSW{s=xuB0<gK-0G?m(o>x3a`D
zi&do|bhKoJqsBaLG#Cr&gpIP!lz&9;^=pyW(s0HXhc7$tK?+XSU8aoD^HTQ2RP~~&
z1O?5@uCAQTU-e!!J|`ng-S-0zv5cU9$ft{DAg&OYfz1~gmhu-El^=;bU2&CO5C35<
zf8DhrWyCex<%d~GXPg2rJOZJqIZHIOgu}oYFt>XcTI6|U@0Xl&?Hq>G4R8Rw9I8=R
z#XTFqnS9w_l=mV}2v|w&mCz^9_<&vxDpj&f@iupzSOoPp1-03}C0JYM3=*%~?isT(
zk+n?8BQ#?suJOH@d31;m+qR}HlRJ=^i8d;I+?!l7sr2TV?`J}Exh5xTI1Q)qib;v<
z-Ky0XeB|y)Ss|Q?UAF)+RE@>PG7hI0v=wq3A4C?1-$iPeH_G~@dX3&?oY#`StR5hy
z9)zo$?u`_VnwnCAP|zsvZG?($ckk+f`%gv0j3~3Yp@Q2?eeKukNW{+I4Jn@&QN6jn
zdQMYz@jZCBrPOhGxzx|eu_c^}d_G-PczOP~?xZr>bdkQfCVN*|rHGna#00J|#zH*k
zi*Mzbk8n1toy#BDN^m=VCL>&V(TZTNm*tc&;x1B)4B1$6l%|Q+QpBM|-HXScanBz5
zuPcg2DIPtsvRE2(TUP~5jFF7MfvR8gwkAcrmE=U-JLo(Ds;pa=U{>Qrk#PJ8|JwPa
z{^fkQx)03+zvOhe`&aq0DMqCCL5WnDLxQl$^DrlhFimdH^`ZK`=x@Si=gTJVtg*q8
zbT9tzL={y^GF0f)b5sNRtS|@LbRAqWjH|#M;x%E54O;8zlDPJO8~z23wW_DU9$z8#
zf}~&?HAZb~!>g5*ixJUk2_23Z(I=TAV}e)Hk$=QYjM7___qd4l>t0ExvR$RX{m>Sg
zagm+nVd=WVp45%LSBoG>!7XFw*+-Dkqt659rat8yYg66@eO9F&6`?#Q&L#MC@K#R!
zkzJxZG{_smS#KGzFpSWWf?u#S$yr*zSSr4@W5_LCnJ$)y<1LkQHZlMD6j{$^?z8!N
zrAqfTG=nCJ9KTj?pNO4kF2Ot3+RSSyzpV!XhbsARbC6@hEbmyLhBlb5A9j)yP6R^D
z8w6GwCnu)%tS6)eyeoR|X1tZ2*bi#^dR4G`MbWQVG!vFlVhOVLf%c5WU4QGVM%dpe
ztR!9AkzkR=k)FO0&>+C()1(B_r9=puG$?GRG7`gQ_1Q}_@SoRjH68`FOhv3@9F|nO
zEtZuWH@vwn`(&*5of;el__~%cEK{g~dD?wl!XBg!dr6?8J}OW~e^jGTE5M>>|0`LR
z%j5)ZW3OcmsH;qlnS>Vi%Th;Po5@lo4Zj)5+7c<EQMkbg8+{7G($z9_6vwQ8+ua=R
zG7c!Fk@cB0w1sLfFwK85Q5_C1uyQX>SKQKw|G`JEa1re`S88Z1U$;JRiDv9HV1kak
zxgFb^Z;x0(#6(8R{m}LY!ty(mepA_ZdeUi75Yvf;H4Ky+#P%Yf#XxwgZhtRyt}QtP
zK7E=H-Q6S<aYg#729N}TR>&eEXj<>(&Pw@yt`MCXVg8)LzrR>jB=)h&Z*V^o;?*QY
z6}0o|E@-qOiLqm_pf&DWRq5@H%!Rd)A}SKF&YfLm>G32zs0L}&Q%3#RXRr082Ohi|
zTXw0tcp0hoWm}o!)#JPl4#~?v`Q;mW%`da6IDSs!wU<uVcr=8M%MWix6V}e+KB3L3
z;A1Hxudmc2aGd?Qxv>hjmh9@`o31P5vpKy>IPM2fXO-#zQ*w~S=2M!Exb+vV__W4i
zlwN&bt=4*p;AwZAd}>tov-`@&v#V{~d@A@)v9R}sT4}lt(t0XA0&E5=f`tS5nJM0r
zZpaqUL>)`dgvv4<G2B0PLV_)@^#d!5gY*yFn*Ca)d6l;j<)E;GsqsO)+djp``Wb2E
z^XJdYH49bW`d>K=LGbF8IC0;_c?~}4#7e`?tBe#H$}V}%t9&*BmL`XuQdaeqk05yy
zqxts5qLwNdqCUM%K$XisVy*O<W4#nm2L)}t8s@*AySS(O#d8d0-Q16?Gt_-qKV3$#
ztp6fSX{I}F&Zv6&@GUf`=vv6>P@41r@XfG(pd{%NXp5Fv7%T4x1F4>#ZHb(%F#Le|
zV)#kQNsPsB1aOB%@5r;;n(}&B%k3gaIfL>pqpF?iG8k;SP54O;QS>jHyQC+Js<0J}
zS!%-tdCQ3*m`@QdJMLzbxCS=jE|G=<W3z;z$62{GC$vUf-`9-OwOcDaMi%ovq~&8h
z=FITX!4P;`$v>8ymmTJ#bjc)J<P3J~_~BJ^?NY@;Q=mw;S--$+*RbjB^X=)=n@?mp
z6Ps&uQawHO!!W@S>0MG890CJtrRXAD9N38cQN7@4aDE1I+OTbJsw0DH+uC+)X{Z*u
z?%M1Yp{H9U6q|Hj6&>5L;ca44pXp{2D;e`wr7Cz;L|eo#1ukS<cNM=n?HQJ91!-)k
zzn&ocxDtK*w3_IDoj{e2vv<Oj6Rrx2@Q-2^z9{1JcXqE=?!qC<wTva>L(@X3E_wyp
zc;^D9nhG}~7CBGt@g^sV2z{{ThhCCMrZC3Rg00M8;^vYpVuaewECx}HslJ=h(OGJO
zvkDKtHnCh?vv4cK-6J3ENkVXi8zn@rsK;iA2F`fV^gvyn&%Riw5!FwHM0FA#?zeAj
z#Yt6nMSd6{p<uRGR+vycZCVS>=X~M3ctK}62$Nb38n2m)Yp%ZNea=|-vqp!F<~EZZ
zvH&*O0J>3tLRWi07MJ7aGIlYkfUn}ovPZ6g20kiYpJxdz8jkPyx?6{3YR6jHE({fN
zD@9(*f;B4bhTEa->cj*Tc0Ps{WIX=T!RC8MaIpSDZES_x?vfs8t?uSjx6wMo)GPye
z<1{_9UB})J^}*m69&HiRl!gzbqDRtp#@Q~Glnax*M~K_2E_BcWd9TX9ab0K=u36NB
z=LtI!dAcZDOF=`U;-*dv^$0o2d0n~<M^>R43{?3<1kL(b&ewQT0pZuzEB|s%r*jnH
zbc#!TPF0ASh*ELez3w(H_8%s9^tDR8>*~^=)3gYmRJfPMa+$?h@M6mO)umgelt0+}
zFOsQ5(0z=o2RNFPXUt6n()Q-m@fxqf>Z8?jWk7|~mraTmRSg7a6Xv4&Bk6O^nb(M$
zN#=t}ZpP^bV{2HQX*LbWuB%UlYnf#~hC~{A|K+D2Mi327jaH;LB$aaM7imn5u8r4r
zG~Ve$v{}?RMIgSt_!}}P_e5oXWZ-dFG-xnS&*-CfFQ>qWeuQKGFk*0(4CO4~Fwfl^
zd@9KA5R&C<ro)u1I3M-01t<{@n+B2(A7R!anw!HS%L7{?XsGPdl;C!$R6jg*g;ua1
zAQ<H6ahuUcV1<&DW@%VSWJ2$6wxF+w5&>nUPuJmQHCJ0Rw04ot8g;*m)7DLaa;C7I
z=j#1%Y7MsWbYrLh8ks-gHOvh{j^7S7ulEaO1Qz&w*M-O>>>AFgR+YL#z>0pDkNo49
zXKK+um@x)mQB~fXFKj`!2gkTt@71$Fi6YY-f``2-iu<eGFB922Mbd{Xnn-E9ax#NE
zfEDko57(N7f=R&g2l=z7&wzb{y_Sc<0H=AW4m<IfN>j;i#~ie>84=NwChy`}K=^}V
zz_8#YSIGYHv5rZpm7ZZ=l_1`(t(Tivb)O3KgQ&lVpz^2*PHR{T=VJ;oW$8nf?eDI#
zpYZrJxLg8UNZ<t4k-Y0{r{vx@ofMfOMYO0Wn5DuQ0RluzF@%ZI1C!D$FrU<7Zmq}(
z3Va&B=7O}P|1&*6EuPA2sdP{byxJBA*)ROMbG%K%)+-&<(rl4~S~RDYR{x8N{-P#S
z50QX=0VM^qWOy&14GdDs%@n8}Ji4R}+1($i0TZGNd7R9Dupj`Cy)h?u^PL^_d>Y9l
zLXkf$GPt|&<s#*I6oTEXQtgL4=hwTUl1?$TTEz(%6j1_IP8#BUtgv&Szb;@zLVI36
zL%k`6Pn*3+1DZq%HYhePKaviffrB<h^gI{)N~|wb3H&V5kIXsPTcpGrqLV1^a?Lw!
zQAEUhc}Q~EfE3){UTF47ze(!NuT?XY7>O~(aCTs1!rP_Fd{tnn=6Ykp`Z3c+Ozu?C
z&r<!QywTdG7wxv7#lG3nXAnehqs97#JGF(XaA0xkP{S?o2hacpZz*vqj~MQtI0^S&
z9TkOrcmc+k0htRGRo<}k=}OhVd2;~%NJU3SCs6_#$cX+BvftL&gyKn&)GH_~GB&Ai
zAknl?=e9J_UiizYoWLTOU5$&TFMiz-a8x6Xqlf_9=MvA6XT1P*6n$tpxg{F-zblZC
z2(4lHp}D=pefBeuq9c3r4Pq}C)(YjL0GJ{=)?0shvSo5zK)Zf8>#5(`Pc%<CjEUq%
zubE)2x-@@9z@L!iQpt=a0)RkH!6f{2(22FVi7>GI5ybohyv7l->&L29`T;})XT2o;
z%Ltz8!Ap-I)qW82p=_6Xp_<%LD6fYdb=M3uerfoFK1y21>$cbGXp>d-1uv68wz(i)
zjOYM-d^oVlrSG@7U-GV1l}tHPlOofUeF1|)YG64{6}vXx^7Y!`=m*ByQ-7znb&4*F
zl1l}~mHa!aXn~!D2}p`TDPu|CvC+cMelwW;Rwl5O0`L1#O0UeU#`7jq*(w?VT|nmy
zQ+rH0hyDb!pAcx-K?|%bC@@7C#fLcoHQI9zW=C}krHTzxMEb|$@g_@aBw)m=x4u7h
zdZZ#x_mQ{~H~a0wXn;RCN*Jh26d3h09KY2(1`vS=c+c}c{MBC~1bcG>NLVVdoSN>f
zbW&ZIEY@Nw(O`~`0OzY#4lbwo(-Xl{1QvXL)=Y2DsVy!@kP(nUk`HI^hD9cvgj;|I
zg#fIJ3a9<In;2HFTds~~i$W(J_f}_lu%H^Xm<ogpN(-q6^ow2AG|r%$i!x_^HW?N9
zv+tRUG!haXSK`EXnS~vruAynY$8GN%KqfUul#YLZ!;jA5`*S}OAp(3v1a!WRIi!-C
z67Zb)mMKK=+}Y0WZg6fa^3m$tf^7U>Iyvc9ArU-81b46?A1<On33nF-v~Faru27p&
z|D7&(iPpQ)6TE<3XF8|AI#2YQhFGuv0$lJb6<}?1G#&;#CPU7LpN;LOw&?qr?*R3V
z%yG_k>U@9~WNH0$`P3N(B0&8UT3Mq5eKn6D*WRiAa{ULT^!AV#lcTabiwxTIo8W26
z+6lLRZVXRQ;mFgNN8<T(Q}%JU0ha`9@-gy$dNG`4+&p2a?r-EgWz6`I7!G)QYAPzK
zn}eeaZy8G<uX{9qMvMv<GXT=TW#1+#i|j|M(>$H!fCs3K{~K(o_|pReAL4iUfrS=B
z^n)fTv*Y+YD>UEHMqzb*aMiC{u`Fju@{Z}1Es!CV4oN5att-Cxv!(nr#qdHEpcDoG
zD&o;9JdnEQ*3TM|t5D&1-|cdtFhP0C6#{5)?%t1?`wz<fj<{95Od!|$K3mHM|F7Ay
z0ga||)1dW9!70hfW&Cip^9DAmw<$T3Ijw#uCH*AfiSU_bWZwwUL4p2ufEzu3zRZ@R
zpu434CvFx{-6$*F&v%qr=<9LWRqz*B_9~tFeEc*6+b^zHpdmyvob3f{YuW5FCHbY@
z57wg6Ni;}^1~^d!Lz#xq?zSkTK^@(BSkaKH(d4Z&%k~RmMw3nulkgf#0!ELhy376z
zLLf}EB@l_%!M`+7Q6utwFSUxqf5*g9B|i#&>7o4J2<Q(ufs$^4;ki!F`q{k7*(1Pq
z$>Aw)<_&+w8bD#Tv>`Qb>oQ24wgDTG_p=lZ`yZP9bGkG2fLGP@eOE61pp28&qZi^L
z9Q#p!jAC*r`fte3LmJ?<y45MZs?)#7@`2<;mgql5A%%Su&iG$tDWL~mHC($vgD(7e
zH)n7m&xtGtzREO1bDaz&5JyMyXf*@71Tm|<-a;?gxxahUvc!nUw+Zf&!I71f#qGH^
zCW~Jf$ki!T=e@J+D}ddGq?D~Nz?z2Y_(<i#f068=1<~wrD-!RJbiESypa~wRC}Hq-
zZl(;_`PwOk`PDce3?Ef19egGL%RCt+Ix+m`i22i;gQ385tR9^){Y93Ay%V^M-~D5h
z8D)FuFEjRowWExHw<)3VysJt-M-pJ&36N!x;kzc)2+^aYu1mQ&cC5uUOL?NsV^yPs
zZfZ(%A4oY1YA64$@*^a|Wm!9`(S7Gn7=1tRmJ3$UO>tIOp9g|5pQQ=j*mG%s51rUt
zE<^&}7OQqz6@>q)ogd5s>;OEwkdUL&&mbzHCx6wF@u$el7io~>sG(8MP@&EQ5t^5m
zHTZ=k6_NB>3Z;g_+$B7xCIYs*H&E8GVFu>DJYA`>5|nH*qAS(&=~Gb>J!h=jqdsYF
zuGOxGe|pIqL9Z#p4eUeoP)i+R(<9Q*(3r~2NhengrzFF#A}j{Y^M4TUPsvxF0BDz=
z*74H%`Kl!=#kZ_c&(S~7zN$)BQYg82$0X=rhBE>QJKAPUNNqf3WG$pc-3VrNuHrWJ
zTYTpgt2F)OVsq<L`j&*ogV~Mx^*|BU{$h*9jsA?ItEN6vVP3JNZvCeoRN-FfXp#ZD
zw7M^|$a{nDG_ri@?JaSjmwWaLR=$&DYHlt|G&je~$X^V5)g+URzYFhMB4t623f}-0
zV#6XhgQ|QIClBVN%YzyOy<f@U8Um8m0Z8O;t$7<|JH`x~dT6v&$0}k_zx`&{7Ss2+
zQ>2kC-Dmo#m0E^UU^7pG>4O63+a7G=@!`fhk-*&P7u(oIt2eI;FN?yC4qRuVrNa}<
z{rJ=~loacBhfF}jX3%c_y7WNI$P}<DLs9RyJL)(;nM^+!h#j9w_2_ZfWU#<}HYmf2
z=#>j0-oz@&sV9nN)!l_jkTh(BiG*?<F5G4;e>?9nWMr=gF8`HfoJ>?x3=aTNYeg;S
zFBS`rRFTz9#BN(c8pcM5;W_Dkj!Y%vFKDjlX|qW?kHx2!b$b+^(A<SDZ>$2yGXvK=
zGV)RS_3pE;4Z`z_8){Greme_-EJol36?VW>u_boMboPeBRhNikJnYydpIHoyDsesB
z9ggVNQm!9#TZP!~*CY`wBNevQBNMzk*rB2In9=;p1L=7HTdk{Vn^`dwaqSdBgz~7x
z+Xw)ZnJmG~+bHrXvqgYg)naxEKjygc7<=5DqkOpd45I&ong5w_ph{2dy<mRP`RA)m
z-gGDS{_S_qnI>zAFLVhM_{R7Uaf3@ruUSK=ySknq$k4;NEK};k(FYm!8G%x%{%h5s
z&8~+kfBY|iwXtf55_Y%&QyHg315_qP=d9uLO%DCpVZaRLOrMRBU#r>}Uk{Q-AB}k+
z!)9WYm3G#~<=K3{JqPu@z1xQJEI!_#Io2*%9$;RWY=qI3Xk6SnUd@x<?~z~c%HvMJ
zcBe?6EWNy~yZir&4#Di|Dox&`{+Z4{RNzj$CYUDJU6k)X-Ui=YFbd9-tF0EISpkx{
zqHlBTB9^tjK`HJ#0D{hID&f9q$X-?0Y^684;`NexqMdXcc6<mr*xO{ZuitEEZMn&8
zrdujh*p(!~d$2#;NUf8t{;8q;?S`9|*J5&r_ZHP|&^4~($s)h2i?GJNS}1_xFrdH_
zrY2l{X$3JEv>QJ93yb<b8BNr{zXPZxR#Zp)f>VHX$|k=0jzoqM#uAP7`PT;K=ZYHk
zm!|dDfqle@!2X}oiRW@ea5Tn2$h1n7&HW=cXsEzQlJ}^~UWs05|4VE*s3ja&M+%gr
z=nq==pA={hoR^;@gW(Y{lL7>`M+>&!zmcmIm^UrnAGi)jJ2RpSz{yRlE_HObV%Ut_
zT#p*fPTbL-K>F*TM27+h#sjgF-G9|$POb(EUDT$&JbS1Bq-7*PnW-NQuO>vdMKVVS
zo7IF))cd<UPk?@U!2_E8{2H{-o0X-Lqbbx=?YFxW*OS&hyV{|A<hFM(ubfeA*LiSQ
zjH*gA=*uYM1Xc(ZMk|+@s$X2S@H<URN)7gE*pba>$E;7nB6W2&g8La1gb)nx1NWvP
zT8{AR789wv7JzRom|nhro1HP}XgdS3AJ9oE0#xYydBZ8sJ(#F7I<(oG@L#t@W|<(I
zSyPvlk7ksAw<5Pi_OS;@(F~stk4a8=f&VQW98&>ao}VABbZR-kZI>gFC-t!nrgXoh
z++@dglWh-#Vx11_4Y8ji-tXoXd>#l~=g<DS)jBwu@e1k7tsvuUZKH;<B%<%m#%Ccb
z!jYvTnw6O&VB>=o{t4a1XGh_3^t_ssK)Dhb9=L2WNq*vsmpNYGhsUc)q=)eI%gVr9
zH_t0!tM!p(rG)4X4u8Qh|MmJQ+<XR&mhzz|uvY0Tbqqu`jt8z=u!GoRI!(F7w@gS}
zm`DKk38K*%L@$+bpR~%L;v|wfdi}!|Fhz92<7A{F))bT~C2Rs0r0_iYN~(P3WWL(j
zVF#N=C743Q1UU?24~vH&kNNO9PHNU$@kQ9;qov}lK`Y$Hi?N|L2?&O1jj8dac>by*
z?D5fLWVfQ<&d2s$An8ZNKMqGs_&Mo+kQ_(8z5DVyIbXK-*I?3c>sUo8e<%iU7SoCD
zyd+kgNYVQ8#Ux27sc;xB0Y;YV=%O@<Dz#Rv!MK|=1o&0~<|#36pYEHDdL4k2U$5Ip
z0NNQbj#}Mjl`pqPQtv8R^lh_BI_gH2zuoX8kApL*Yaj)~Jo{^(PgEWp^}Xdy_p#cG
zY}|`<-E3oy0IassCw<Fb%4g&2Z}+wpv19ZPc*d`~0DB&%pA?L)Ssd?L*bm3MXm#$G
zXCrraiV_a{8faj9Ep34TGpv&*9O7<@DsId{vHqofnwS34P=%z^kj=c$&X?OQfcrDA
zJ3idsrN~Kjzc<dclVqQM?&tt{tdJr=^4g{G5MwnFKQVZfE9o`bpmBfDwM(qym9(BI
zzC9o)8yRMCxMYx|w?C>4ms_ivX<p39-~b$N@t{I^BfhqgVi5&I(%d<xofB{62C+EW
zN{FO&-kpC)UXX+3A?aSO#O!De)+(WY4g@C*!P`8zc0KTlx__YEUbB5M3LMI5e%KF=
z5fU4=v*^-Kw)8&@?x&Hs`ZN1du_UE^GBq-H@Fq7mS2nOU)54>m3dI(Z*bUTHAI5;%
z=2%RfPX4>*NC&kmT4>@rC683c`s_f!+tpbn;&MsrCH4e({dSLhTb7t9dfKfmvvBO`
zhqh#=C){7C(s#=<4#911K<Tc?zv~b?IXU*iy7K<kopp<PrjRPec{OXR61bI#k_9Cv
zlTICG)Tw)MbSn^I#zfz$Sx{x{7C@O44`n_S30zcToaw9njFji}0a(Oflv;*$?mJ|;
zQ&Dxc#xPsUtL{czx677;K)i%~Pk~GaU^kPgraemdm1nDq=K&)aduE-Zp43;j-hdy9
z%7;gOXni&_TJ~b1aLL!|D?%s&E_Yd<$N31=p`<SX-L3Acr41<->d`w)Z+rHx+u~rF
z*(447m_qnt!>xGUXwZ;;?5ARZ({7P1c}RBEv9<<xUVR@3hjLIr${Z5;GJbZRO*Nmf
zBgX?V@Y&;SP<=7Y;Bfk!<Lb7=>86zad4Io%{P|+@*x;=>fTS9jn(rnK4Y|}TW>2G*
ziyIr}0!sH?N*l)<T-J4QqdPxS{O>dE9Gu&4cNI3(X<*B#y!S~mCG2?&a=vCcomASX
z2ovCXBvH7tUAW^>w6k5bbGWxtkK6GmIk30FAwL@L8?|MRS?73aA6(A<HJ*9825-Tp
z=MO8QChvUA3(L0Me=_;-%t<Z=l?QS$>Y!mEiy*JvQC&AFNM!JrWO8_}_`C}Yk7nYH
zB<uiNP?|Cg>TQ$5#U94%r3rGT_LK^Z4i#A9YbOtd-{vK;_CL_;9?J_D<M3ahv+GXQ
z1J~>?<*QQSn3jEWOrs_B(iHc;h6wN{&CN(vbWI*#71qPo9c*<9P$!95-(rz<w`qfi
zP|IC8Imd{8;MKE4o{957lD2=fu9}IFFB@z;L^o2MaFMum$NsHV#AHz}Ili6MMc33K
z51!2bINLF8P^cbeVCJO<m(}~Mxb^X3endspQKZGeg#duWySTx2V{|3=fFvOgmCD~8
zpO4jF0k_<f19mt<CP%Y!UpV*~<eBXHGZ9zc^g=C_&h9SFr}87?^T*>m;_<nCs~Ja&
z8Fndo$h5pm$NkEOI=((nJ}kP9I^<L?Ci7EA3Cv<wV28!Wj7OWC$E7T1iOU%Ek|Wtm
z`*U@2wjA}}RhzQQt`;<4r~-qs$*X1^D;as;m%o^pyxIWd1tSwnPI(@8O8HKMRVgj(
zmlp#MTX~i4uc)Q5lu!X7wE#85F`4^}qT&}K0=SBjeu_FNz%NY2!jffI%8?&6@@!K0
z0m?Vp1&%34vN88{#Eio2NlXaQ?7M~T7C$9ECH-WtRKt8>_S7i-Mgm{avdTxRzVm4Y
zfrd<!8iW-CC*>o;j^q%;RyeS^p%`|!JXO{y?6lj(_X^i(aa6|g^6``Y94!&xWw)at
zsLW2Us=(veMJ-eYkYRu}zJ8c`%A5Y4jGP0YKU07gR;7E}$y-3ZF^kSmI7t(lPiECN
zc!S|e9q^_^enhBYnq<^@Nq%|cSha@}CWi`#&)DZfr6@O6q#Ju>ZjD1Hg&y}W-!3@D
zeikUER6g2_?M!JtXP-)E#fY{tshRK`&($Nf?uRo3sZXI8oMRb-orqdW-JSQ8kLQoy
zX5Gw})+*hOP1_NC5GP6_+2L4dROP)ikjtprk55;6Kr5!WU1pSgF-$3+_!%SpEB(BX
z=d-=`4yapRI+o%jy!j^L%K!=X+4{um)Mdpuy)hjr5?&#QpsKfDG<p>>fh%1!T~zQ@
z%UU|g%bNKo6S{ze<9T7wF@BOJ!PNckP_YsesG=5Rvpu+i80(v#20{UYl`Wc9pg+8W
z6INFzAF$WL*)s&}SYe&qyEQa9N{D_&ai#EEMh4%GF}s3R27Yn54PXxj*lkR_i8C3q
zxerJREnK_uLa1}yDkyo$e*Yu_8db@x0&mvA6&rMLhekh_WWLudK9WfB+SE#fIlUal
zP@=LqWgh+n3m^%j=AtDI=*HbXns@EXXuk`)z<ZdRy2I<ym(lYyt8VT9xwt}r7@sqF
zat*$MjO-`@wTYdOAb1BkoDseK+VHL<nzJ#YpN$xfn_JO(n*(u}SRK?aGBq+asfpJ(
zd_st>LAU}u+}0yo+2I(-`SqfV0KR~+U(QG302u2>sR<0i9xEx&0e?8haE}5nIt<yY
z+fkmg>o_{XHWvGfG#>31M^^XCA7vclGQ5t}1H~3%(^x(iCawcUZ`Br;;?huU1q%us
z6khb;n@kX~w(WUVeKhBCbeVNK2^o+r8y+u!Y5NK`i`?-waTeP#_DDYn$T&WjPw|*x
z(e6?z?k}Ch^*|kCs^^lOKKDy?xH|lQq`h}M)&2iJo}^M~(jci6AvBC^)fHt`vX4!K
zgY0Z7Dmyb<WOI&rgp5c;$T|ndD0`E={T{C_uIoyDdVg=X-yiSm-OxF&*W>kgKF0li
ze>`4h*=5-TRn*0}*nnvZ`XX1m+}v@8lyfSVb@wQ66-|`v2F>DB+#I`*ZlTBf9!-f3
zy+Hx-z3zuuD_sjFD_N=sk1y~qT(b8}F<M(4UsJuzRzNzVG?S}UjMG#osBJ>xEtM8E
z4UGY26!IMQsGpqX{+zD7`dpO$!b)!y(miutPsR$+5$pSPZPdI47Y9bn*yYe{=&2WU
zP?Wk2i%+RMd{4G8rWx!gSyLMnn3|2`9i5J&$FW!56cpW~I%4oEq^KT$<Q1=>$kdTS
zJK5RqPa>5Y7`!>yg!(YHC(sQSY3=VIS!bndJ?jXxPp`E8lXa4c`U`pHu#XLwYf?8Q
z9m{Rb^AwM}xS)>yXnf{Pqcl!pW!}^E%UkpNT$aE~lwIVr(bY{<&u6MlhZ$hI2n5$b
zvVdBuLfo#*{xCDCGThO}6m$y}qRcp1`8f%`hF3DTaN<F1R9X#{NLM{UxAvWmil}w-
zlCnt|6&0~wENL}F-ly8CZ``qPwU^zI#}1mSD*5Y4xMNS;%NEsEd(~X&mcQ;Ov&o(6
z3pGAW^^j32?5G#-P=cmal1>P-ci{LbSzpN}%{i!XHI;Lx2#za+Z-|Fgg<eaF3YDLc
z;8RLcM_~d{5hv|c$H5(_niLxZ9Ov>oS@%^fHZ_R~&8B<1WEoyJY|YZsh_s(gJQ|p^
z6vtc?+FC#5LDK0~dhdP@l$wQ_s6FvIbMlx+AtQdM+6V#n^rmseJzlO*C11AfD2r-d
zK)!nd30>!nE14G<N=?Pb)oqScu{xA;nUA(+zhfGfkIc_|Y$#APnICXlK_#5a)vnZW
z$#{*mGn_TK{LPX_(at*;8PpOnyl@b|nME!s7xJOx)NEUuTl;leBbiC&Mv2_Xm%{ML
z#FwHcjxk7v$e;x$ia|G^ByF@n=$XU~)wWL-;$+ec$Dv|znC6x|iIvOH6Xn~CTn(Jt
z%GXfK#ueu~S|gXs<)}6_PChf*K+nO!q3w7Bi%clmuU%G)OYa?j7Pz#)ADTg#)=tS;
z{&NHCY<ccSi<$*O;kC5M3-T%IG@34DUF2RzFP{D!A;9-x7Y+fQSa2|McSamClqMNO
z&kmgxyFvw*i^>*FvMo5nmD|e{qg`;EYI0G#oAIICtAURW2ih+529>HUm#N9@x%Ik+
za_oGL4M}0feQWg4+<2$Z8?zo(vYl#<D>HfTKaM-DEuE6PT>T7bbZfagOv-7$El<_f
z%4gnBd7$)^bdG3Tbirb%5xo?-(h})1tvfh%I9bP4oV|bpCFxwRaFwf*N>jFGBD8Zk
zPQf_UZ)~nfUX3EB%~bs6sd7_y*@rBT^Jli=(lsAES{#gLDZKis_5e$(YgSR4&gWM@
z`uh(5nS1kAkU`6473#S1F`CzRhYvk8p_XG`ZYlZ38QMUIo%Z}<3h+&LiQjEO#SWS2
zdvE8H)mHS=BY5XJY>lsUdt7!i1c$Py;G~-`Cf)b6L5h!6tvYb<-QaRB?kp)To!J;k
z*i{YBC_jS0$EplRStxaC<XzL!Vg~D0T&lf8A3?4_BGM{d-|W$7HX&obbqWLO;u(Rd
zN$%_^?CajEO_BM%_B6YiEuUH?*$FL%GWe`rxZmJqN%<2l4$_Rf+brXp3~d+;$y>%!
zzP0xFIo`fm%%%5B(qSO?e{#!O2q0&IS)T@mRzN+pB%vwbO0rr4r4x%hY5SdGu7c}x
zosNz-sSM}<q;jkDZ!#n7=9Jq(C$!X3>l(S-!`SppXBgmREIF-1-{nYhfLJWrzZ;S_
zvjGmXhngdyYaVJ1_ArOVLB+ScE-6!iB|%6)m})vN946neGG8uq!U2k#!%Gg3i{-W%
zK@I0OMlU-hIdwLlve76pcFP1H(x?&4k+gzut~5U|R1YRA=?8N$bSn?6@40K;BO5j?
zYn36l{N7bYRgOm`T1h(2Svel5?{A9BlCkI7m)u{zHomq}R7!vxW|ytGP%qBza#8D}
z3|hQ4_V@(Gp?0XiUGK4t27z+BK(GHj{k~3VDs*=wQ!@E;p_#^e-ymP6Ug>89SYQI$
zu$1P&j-~0<AR>NmGj4W4vCymWc2Ss5N3|%OJ%=r!>izssI#Zj#!>`4fW~-dJ&HMQl
z)+_^ZdRIUk%U8k|(CPjgHq%+(8GjAOXZDth$FSDPa4{}+Q*_@svSsVVZ7pGrANH%5
zEk1vZ>6>S)4%Lcn=%Zqh;{cI+3eWbakWL3(quF%QHp@`sQ*w{dUY*bMyr8Jj(yU-7
zo?vO_Di_LBouj7>64aC}?`pOy%xY6L1pKMRqL&a9n9e)2ot<&}0JE1n3GuLZ?pWS%
zh*m&@+xOln**UF%x{zGWft;@Sqjo9B{EVLm=(Bu`TR;-4V5dsva>rbu{N+NOJ8k=u
z{p38{zZIet_Jqozy)_#8zIT@&A=YR28#Y7TGHb4aKq-aE3Ln)C&1@JoA7*Q!v+r38
z6xjB1ne}}R(bC$P!~Z5aGQ!%r&~sE?0$(DwxOi7!yf;X#qhx@>Sjw_#O2u|GoAtyM
zz|2FwH$~bS+SfANj!?cVzo!`=#wRzBdMv0g0&if*W0exEd{J#t$-j`HpVd`{WtK4#
zL4-P0&KChxAnU<W6jK%@WSQhSY;XUdDqFsG36d07xqdAb;jTSqXl8m(73&(c(h2zv
zwRZ2OHwHCFuIHDfc}+-B9ZB8<mm@Gjlvi=1-sO;@iQeQ4Z@T545cFS4eZ;Z6{`b71
zqw}GYk$SO_#<AmxapUswk+!kpgt*8jy+Vho97O^HQAwcJW4bl9DMF8)zq9)B>T2~<
zz@$S<40^xHbr>_LhmIQ?DzdAijF)jXR5%?trniB^xvx@cUd!ZfI~W^;AL)cqBjE20
z`Xo-Z2Da{Vn0ONMedeRwvxOS|sn6)<BSrINUGt>-_%9F-vt%A7))&NmF}4`sBzw@%
zFP|H`1!*M|OwbD}0QAs@AUU?_$43gSO$iY`D+(GLtWZ)L86@weh+k@HobB<ujaQz+
zI?N;=ju(I5JG3+(TC@=A_T7-e%?Jx6xVEy{KBjl82<O2gmzdf@@ExB8ZT3k6i{^LB
z=z0QRSmpS(S~yWibn9}-{<ZT0>k9K|hwd<FFx90XFq|eK^0K>0ZZ4!h0y8RSLk|D*
zC$vhx=UU~N4RKQ5)wD8Pv}!OF#$)C-DE$R@97Ak_LpC}!X_wfkR7S+frAbnWRZYdE
zJy;C8^}5w=sb6SqVWe=ZV6H<G)jEfqdLCJy>hjq8yDH^!Y)*Xwq&$yDG0y3Me&VFA
zbwneW+c4>pvVg9Q6qDV%*WTu66cLGAW)U`2a>PrW9>*^0_buiC;Cy(WJ%o4tk82ap
zgi?-nc97x*HHQnZO|@*P@orTB(qY~f*~Rjz6P0e}*^E`E!W_=E#^eX~bvKT13PD$|
z82j8je5TL=J?dmA`Y3)<_rY(30a2XJLq4N5$1##pkXs5^XE!schOpenFq{diuB7sw
zOE%VUSae~}f}LJ&0Rl6iR9<kp3{_IuP1$zTlMp$KEi67$j-V5pcAv-7gsy7KSTsNE
z`tX8^IJqkcs_mrah{u_ZYjcij>7zr*Sj?4b7$s(zjW>(^qOo{Lwim~_6}OLnLby6N
z64Jn=Ue3)T)d!Q%Xmq^E9WKcKLE@OTn>R>u&OMr{=9c#`9w#Bne4lq?!6f8*56w;9
zi(HgBP=R^-UI>H0iV49n9dENz!8jDn9af$8oMv(Rtt^t~FzY5s3QzeNivN)yAKW^*
zuVrim@*ynFsYhvUmJoc=0c;wdI4O*_D8|jiD0PI^=Fo3PWElF_%n?L*NE7YpWN7i0
z+hyB5i%OeOzRm@y>TEns5H9w@1D=QTfFQrtTmdAQd9P%E?o>LHa#%^mf{jw)biH_4
zbEEZai!K=DBKy0EYh|ypCIL-p^dPqFg6Uv|LR{l*LVhetOG~TTx;{6l^kY+h!6=TH
z;g$lWTxv6?<w$eL0s{0P<>j1|jJF|}$N*b_>vFialT%i7HQsSCz7GNM7QpKaq^LAu
z=He!9(VCEKiDK``1Lk2!*jAN1Z!u&zJfBxRbS!^SFitX5PCz!@0Vp_vhgzEY)pQ|?
z)+Ih!ll0$mXX^{A_MF~Crz;%-SCWj+<=OXPS2Gv4<7{SR>dvHCA9QYPQgYM#9GSB0
zHtGEnENTm4)o+my(W{|Yl={AWxp-MI0DDR{T?L0$L`DPdXj)5jV2{cuEsR+ep{(q9
zF|A(>)RvUowT4}GA@xVdcP4EGBc^RU4$Jc)CZRAC+W!_1EQ3DDxzIv3nH-s0Gl1-4
z5-}(NOvfU^V&KCV7h=;)lMX5yF)h!}U>ysNMqbP4y$G$aN;<ovCDS&Qm9Vv5wbfXi
zHnJnicLZhe#>2K;){{LU3ny#_UWY8Ku5_*y=qOv<=vt1#g)Ko{ihYG;)o8U_ot%Vv
z!lI1-(-^UH)zbRr;kIhYsw(hF{O+vUFrLh=wnGdO4=}Sg33p(|h$^Ov5V#19&6?sx
zdFxnM8#B8q6)-OPTOJQbj)o#2-u%V)&>-r~<=uO-b<NK9k!yt#D+=Kp9BeAV?W51X
zUFVxu$yu4ya$*YuHs;iJbf!0sPSH_2gx&tbg$HkeryknZT8YvUW=BZduJad#j{s9r
zD~nE6&4qsXdJ3-++Ur~W1=y{lDPXaecOYtFvWi_Ey@byxq>{Sw?db#@Z`ZX&?Ak6+
z6C^c9%4rsJeGt|zn+3+3{)2u@8LntCxoB6q&HZ%M_80FzU(jz%NYno0>!$MTxarO3
z0g9Pc^WV$q_I<Byk{_v+pPU03R?wi0H~(Y>)Mdv=KTt7TbfT`|=?`<exKJ4zq)M&X
z%nntw*{YDO)mF!{cWWlg4If#>9@IrsGM}m{h`q!7(#MChGVr{KG5OuB+<=?2XSBr!
ze9xSYr5u!Nb9{N$*H=0t`<8p>nq6PVIP9v@sR^43omvX-<iU=2e>cF5+x7F+24^nw
zj(5(bpcoM`LmRKfXhXdB2a)0c>#4p^rTc`=r{7iX9vZlIUY#XA(jl)vkgGEF_`_n7
z*^C;Aa9&x>Q{8VZYFvQYtAe&}Q2Bm!jv-NQx-Dy8(ekAG2a%3|9VZ?M2eP6V06|Cq
z)6;82Mp30d#LUd!b;Q=cvo_OfOnCW0WPIkGkmfg|7oM)@QP|cc$1{`=lTvtvSU+qB
z!T(lE#{J$W`viS}*Z7p%5<-}<Ij>7@8#!p7I+v3<ptbPykkmtrFH+yUXFQx10K(m}
zrUsV_<%nwH{E^Hl3xWzG#M<DI{P9A3ZpaL<*YN|lgD>6xob)zPwG{4?-zc0d45(`9
zcq!UoAXQ7W2r{!a4m%sHGS`5XdIPaYr!Hhj0AFBh)dJj<cHie<{0f!)H^<%SPN@*k
z1!v=2b{`ST)Tti1AO6CH&<pMp1U&dBkaW=H0$|e%tx?v{2asCYe`~uM$ubMQldUYS
z^PZ(>@YO9O+x81@{*UvQtp@m2^`_Lf{c0&|+^i~jSp&BdrDI1D<-Xj%7dEA%qSVm5
zV=v_||FnXHL?n%(@Ht$J*iqJtvyn_Ls_`+YhvlJVMO|Af5J@nfV{h4sQ!26=?;tmP
z_T5c$8%m(itKwMSBUKA?M{G2G&d@-n>e9f#tD5K-tW8scMf%s+%p?K2-L8vc-Go4l
zH~fpyr>aX)-EVVbVXc{ZL!6}LT4~L|^VsxaBeC*&t>hJiLbiJ4Ewp;2*Afb9%v-L{
zk8K+p6?}+jx6s3cojBe~>=N}h*5T(lykb+X6f|9n*xkI;55E*T5Z^`6mE;YYXkA^%
z@=9JY@m5d9Dt<a~8CbQtQl+z>;o2{Tjwh}~kguI~+Ol=$$<6-}X5Q+dPP0TOx9gX`
zq?9^28+pKzR7W-5L){=#;WF>8<jjGcSxQPfJkSP1uM)GbkI>P6m!4z6_<lNowwP`P
z*K0QWAZu2b?i810+^Gtx6va$t-vj9Eivl@76y7?ouA4K;*^q5Oc-w72Yqn<FM0k1E
z;*5lqV!Gyyl7w{Lyg09nLAFT8)m#pA^Opjp!>meYBty9*6~>hh>=sdSyeniirfh3L
zN#CrmWz)gSo8sj`9XBx3aM#J=L$i!~2OWUAFC-%Pc^Wa$YGrXAO!bl&VdJI7cohzD
z=3(<OUUqg3lH6sUf2j{WrG1h8RwS)ysqdAR*R7+$Ez_OGN%W_ZUz$DDrj3=Ov%PvF
z5}PEGc+g6S(h{C~1n$7@-8*Posa@nmPgr_g8$Iz}j^>N)8YrPA46AsQ%wHWqOI~lW
zxgETE@y2E!{o%LH6F-dI>G(TiI~_nbOu4Td@!~uk<MnV@UV^r0v@F}9+>4ex=9U)?
zH=CYSiHCZ!=fKU__;5?5l8feN>XGy=ENUIjZLHd6i9LX(;Wj!hUv8{@7waXoI^P`;
zQ}glKGcr)icx1x}&nW87T{<&?Y8laqY3A13_sS(K8s+U%76KF=;?2zE1wJO+joD>R
z*^a<n7?ru5xK774`!-8~S!fbg_6Db|B603HnfIaA3;j`+=_ifeL%=#XD|x>RqmsW%
zlcfFe<y!uRIfbDnP+UDuMdfVgDuAhWgGTM51Fn3qG;;zJ1Y`gg?VDC!8OuzgZ~pkW
zo4h~Ue#x>{@F~wM=sr+iF}j#r8G7eGhdpcyzN~8_$knL4gt;+Jqf1n!Z_Zol>DS?n
znp*>f+BfSF1)sdHP)ubcecW1XQf}$3ZqV9bTQQzDe6t|#LrI&-=%DqWnUC71kG7Rq
zY>Mb_p9zU0!~o9~<8x%cgqB^5`<Jjg@<}dZ?}?;kEAs1#1u)-F^(I5xi^gzTcqHpy
z=XqzkFxeX&WBjqir9R;<y}>jd>e?fN$FNG-Vu#sP(VnX|AhHk-=e2N~o=-e}{;(bH
z9f(p`T42pY&vSY&ABAGB0EW|vG`s04L8EjkSssgP({D;TOF_-y17ViYcQ)K}AYIcL
z{levDYTdKBX03gRcVk>F#_m`8o5)dwdAm6D0^Ia6fJNSIEC(1@C3}owrp{M~mcqND
zrUC#br5e1p_aqbR1tp?C9Hm?5?a-crDYZ>D9dwS%>71IWQ(@DqcTrY#wuX>CqUS=q
z7E=fcqN;52n6P~Po~qV41qH>zr7^x1@V1n?P>T?$x~ciaVeDxCF+)+&F@b@oC-r)4
zMv=+|@m*5BWWPjNBwm{;L|qY0W2IVBAE>?EX?isH-t|pS<0OGBtf(v0I{Y9+<Vgm8
z@nWv#7pXf>`V<zYX_UTkTwApyHGcQq)qLQ~dsWNY4<clNh*rlaTQDfJKlv@i`CmfY
zdbr~`FI>#^jGZmsbyNHkzDxe<PU?x;&xg_^F~(aBwxRt{cS%XM)gQXDGTqQSLr}}H
zQcc%%`8$o<>U=GBzNB5T-`1l0qi1TJ<|x(Y|LZHQPs3N<X5)x|vH2?*$RrZvyfymB
zn{}kaa0i69I6vGv=442~sPv|npYQ`ZO#nke8*5qelsuXke*a6<)#%r#U!%p}U+iPN
z6;^?cx|tPjj_caO#ZUFK^)BBo<|6&Vfn3F#a~I49?&Lzl&@~G&%@^jQZVWXgGXk>X
z2jRF9)OgHQfvoPy^7)pA2;HL%5R3<^cIz)`Vg0-JA>aLt+05&g?^b~Cp1GhC;biDq
zr*{HQ)y`9C)>Aq>fQ&+&clMP2n&J)8xAdZ3{?wfM%elThzx9~?!Y94A?QHI=E9;X1
zJN<MxEBu|voAj5EuZYXiI|6@qQ&PRZCVX<f+grS|(EdI=A!k1B2VaDt))yT7^7^{E
z0N3yH-<GYpZ1AuM*bDv7Hb1NbI}!h=1pi>&`e?5+V#SjaK;Bd`M%tZ*nIwN~(W;We
z>VmGpIJ0chO;9?%fmMOhSk(ebr8ms~m*MikaAtF@raGGqM;Q!vHAGU)PeMH1-7mcP
zuYY#71H1R9c^>ue+guG*h>{#iYBJ-Vf~WIc>TB3$)BV?y&Tacat4Kq5nfc#8MJyeq
zfcPmN;-`m)&wl&*=WB6+k3sF^xBMmPIj`*k3$g`UZ^gCI{`oV`%7Wngsl3tbNK3R3
zgfSzr)QE>A<Z>%8F6+K}XY*~I)7#1*lf1$Ow<+E#`=;p6A1(s#X?c0mtTj%O#^5#u
zUPN~L-s9(<Y^QKb;%VJnQl9KaK6%F__~gqqH6)wA_-9L9Is?8VsX$S@_XPiy>Vncy
zE(82|kt_<)8>~M&wX^2o3$K+%U4t3bQJ;^vl+tgm!+!F;H>~in6nW7*2_Z%YGB^)P
zY<h|ripcTyM*N>k?c(C*!1mK;o!pOH<IQp{)LmDDnF+|shbda5H{Vu;4&pX~A@HPH
z?8*jc{txH<`>KUuhL(7e*4r>vEMQV0v_;lKGgMJcX;XeZ_YOIv;>bmQQvo&l&j$JV
zw^5JasK<R(ZHys=U@p3)zEpSn`6hf)e?0HY@KiEq^y}FF^kG|^wc&{Qk*^rrnz$H9
z&V7F7rxVPC+>!9?uJcM+HyNbD&H>DnxD0(JlC^n;Q!<g0+d|Z{`Nx)&(!~q5$;k7%
zDPy_m)_!(^{pYwyw&G3=60`K^5dobd-=cnB>8Aly+zq(QlexuiR4m$!33r{Tp6xky
z8ngmd>fv_HkNU%{Dxr88vQDyJnx$%&`o|GX@2-DysJncK*|ncT-_Kt?c^yv8^Wl{D
zN)*kmOsPrJLA+E-E{XbtV?{{?0^{6Tf??Cd8XM#?{I*W@*9Jj7z3oI7kYxcN&fJ0j
zG~>DZ2%A5kMr09vfIs$pICOhYN~y?(d85wky5eZeiJY>ofH$>&K4r|{XCLe@Jos|*
z82_V(^&v+H*5X5QH%Ety`i+h<n`sJNjfL^)OR%goikYXt5DMGLvLk90l>scHku$>t
zaTrgJl}lBU&eW0QnQhieT?lji+H;8^&8%PQB8gMNUg;zmCMFaPEmKWp%eM_(s`41f
zw(HyX9Nn+50GNE>0eX>bcn$gu*S&L)ENnaxiKf1f&JJGQ_~YLmJf~gz(<n^n9^7G5
ztb1vI`sg6ddR++XV;<y8y2H)YZYtGouH9;~@!suE0EeHXPLPyq%`s+2)Psn?TRKi6
zSi7mk%jxU{ltopD%rMur!~M44f_Bg7VfiO;t)HNQR6$h!#g!m(43r4rU`pFdvvI7Q
zeb1?1%Wk!Te2qJ!dTY_+XXoE^$x(=Rx9!jn#Y!@&)96eqjjGNJHO1cYV~~y&qtg2l
z<vcUfy(l}1c$#lV(C2DsJAFfq@@|3OzrvFrx1X-NWHbGM2il(c*2wUKWHxhStia$)
zw(Un<h9W_)H7l_n=bJVeVLSE`dee)On1gAaVOf81T!HeZPRMO1GsseX5GpG{EFHZB
zQo~rSa<9Vjh)eg~mVx2_-d?kP!-F7D$(BF{?JfM-b2kT|bBV}ZDd(n<5LZ2M40=o^
zX3b89T@h<4G4$E0z~$8ESr`;CpEX(m1?~+|tF|n?d#{%SA5Ey|uFMjl(f!~esNlsN
zb;`Kt?$b_(B||-^sa{Z>RHqrMzxdejO8j6$yt`K%txSaDs&($y$GaaVQC8u4tAeVo
z?x5|l9brY`Zo2IHB&srJ=tQyZ=RQ+N&|%bvEZDbvzkl1t<N7&v{e3>2!{EC@d+J@u
zb>lAEj8>+a-Cs`nx?j#0(-O*_KXU09r@p@oM!7{*zFr49vwgWhdG>-}=tb5rye=TX
zr28WR-q0IzM^Y1UhN1rKY8`X_<jpn>7aphPhzq8S;!{KUmqs!p;%z|S_QGo$D$iW6
zcC;+l6h!Rx09SOf!RzQ^HAvU}eEBw5-l7h%{OtdO<w-Hh&2<Lsn5n?V)GwE!Vn0Z_
z&=%m^H9>ltDolXVbhtz2bl}p=Fe7M+yx(Ertoi||cwtEMly(vHGd#dL*rVXRdy?0S
z@x-%q_#wJI{2<u)ab`+fcBdZ5wRrP=s#ZuX&uTm(+u3mxyZYW$?UXuvAQGMsBVItP
zT?P3fwN7JG_}_E_?$krN*sh%Zx3g@|>MGD1=&y6Eo`rIc4FDEDF2mMGbR6P@npYRE
zBjRn3X(Ldl*JtT9cw~jMd)9>U+=KYnZ<_}%z0-pih2^Jl*^>Dd^c_g6?l2Io{rh?<
z4kI~n^%as6O)Um?{4s(ECxQQxet-^<Ds84HR7rM_omERH(LX^HYjMIBG$$_?ruuhy
zT^UMIYnw74U;+TfQKIK}9TkT<<PG3oAYqHFfHzIpTiJedIg)aK-kv4xlz;JClkOfM
zIVMuYi}9hZPN_M&4Kn4UK!cCJIp830=KqKN7M0Vr=@)|AGwx3-HPD6Q0FN|ptn<Ai
zB`_mn(Aa*#9$^=HAfN?7KiblSJmp{kTU^`2QVNq(?MPr$ElsGL?5(<ww2jVRA<Ky&
zAso6->DSlZzI@J&Za&#*H|05#3Dtk1VrCrGL44Fhs2QS%;*fZnq2I*30KqaP5_)Fj
z7;3w`f~q<UZvrv>q*a^Av+=^aWN7!w3j5RGO5Sacx;@95W;0Y{_6g1xtM28?1R%2l
zAO%{Sje3D05vMrU2@ryTOC_j5gm^~MO10Nk=JvI*2Y6D;5tfu4%{fNsz4@j00?$-u
zd((Y;>pr37iDHIq$06C~N$^cndBc)otqPqnr+%XkC~t1UjqN7BD_8?~L%TYJ6R)KM
zfp&6fya?qjY0(s!=53t+Uh`F*!?2mVl+{=p6Cl{nIgHvADudV~O^ubZ9%!sMyLNhQ
zL$7Enc(2EF5#(I9z`5k)-CWjfiiu(&TS!omEO@9|S>6t2wkU<y3}mz9)C7D_Zr#C2
z^9cu<Mg<JaKizDtl%YqOd8$|9_`>b_{hx!iT>e@a(%(N0+R#H3wh+j3qoK4?kFuqs
zh#7pILLFxo1W+t-*Ko+pWu4DykMqWh)(REx-{$;)Gar<;Z4t->aM>DI;=f44#1ZHm
z7X&_MNXE}+KJb;Oo1bAIB9wx^FayJD=Rs~71f5W;Y<KMq3p6B;HixBAQ&8eB=f3Bh
zLoy;{B1SOvlLrH`rLkA($%dboP&=6i?Ph;>2ez9Gs?z2tQ;L}Em{z!XI4xDJsE~?x
zrkOKUcE|>1(yYf&$#SgLFlsPri1b{dC#?Sx@jgL&<Rmv0$B2C;Q+&mboSY|_J+OiZ
z$SR@TD;qvRm<{DNW_z+@Um(1$<qSpbA{lz7<M<`*=el!?bK~qb;|7Xp>dtL|c;i<_
zWEGbh0I(h;=3r&8s_n^Q2^MM&3$gqQJ${og)n}a-A~K!(2Hsj6joksj%f)2U_^SlM
z$Q7N>M_Eo923B)a+*(tQf<P`OTVS;KiqLPpLQ0B_*64v59(S)dBl6~J5G@tF&FnpH
zhjLY8ld@IE$=IKLD}5#oO*iS>{f(-n=b2OC?Tclfho=D!PTQKp+eEi=Jzg?2M^V-Q
ze{)%-B<nrp@6yk|f9Bjp31K)!4T_~mR!58!qxup)k4C$$R%;b~=DHcRYr{iTt{{|A
z?hO%-qX(LAP`Kz1U|@@<^Ne|n!=0s81FYgH4qAam?DDYMnlH>6)S8*aONDDs_I#2<
zA(I#*k%_}iKHKd$U*+gEFkq`AhB*?FzRA&=a6#?FoE=GxUK)t;_LaTe>@b{~qjVL8
zz01a#unfi1*%7}XH&`NAQSp-A-l{6=<+!s7jT^6evc^QzT~&(@a<o_FNd0YCOWLlt
zM!3>j$Pm+REWN(k34DQT>kYbnu)=Y7%J7l2rl@S!rv;Ug-0j*f#uolP+M}T>oDY^h
zU#_iy`4Bxhmyn@~x1c)@7%&rNzHuF2E422GQ{N(E#aBhG-Ld1Hb#zQwp16<S;=s8M
zfJtL!c5KBKE+*Mp)!wI|H*jiYIhuT`H)`UY?voQNFvxJ4md|p!xrBK=O;vCsX<-U!
zJ*P(5zS{k<Drh?Z55t7j;xA#^^b3lEoevB$n8}HeicM05?Y!(71q8Qy$#iGJ4LE#1
zQYBY-H75wUJ1Ek#+vUg{UVis6*`|b-;wd5@B_GbzDD$G_(}sZzN$L}g2h{ms0jpln
zldU-3q3*6S_td*|2y<TCJ(LhZx_!^{<V-+S>%LBaI)NrfaOCm!9lF&aXF)EmCSbJy
zV*MWAfHNOwUyW(985>bbbXFCRg9z7+(+1*KFXpWudAg4w3Gs&eVMP*MS{2TwNeI-H
zr=A`6HP5LPT#|qZKyAeW8;kn9M46k6>dB`Tp^UGBt>@A_{<2mus8|?7l26m{@)f6o
z+AA~s%g0z){!G3|>LEdf&Nm;_^c2I?4kkvF!jv8p)Q%Q@3Nc#%hEvxdThFqT*N_&M
z9I1%+M~(cCav%kAufY6F@>@>+V>0!}3gn11i`FhtI-`bjw3Zp>iS`KvBVos8d--#X
z7mC7@`TM~m?CS1b%S;Duj&tz&GsbXp-vRkJQI*GAanui+)VpB}*LOON_i+zM*)<3a
zckf&9v=CB=eA_<5Ks0wm%&ZrkkZPXgD0P~yekhC?>I3yG+GSa(U5q>D(Iv(3;Tnz%
zecikz$Bi&!E|1?o^7`3{5RSI74))Kcyd=a6quZMnfcWzBTI4tDlQ7U8j<PH<$_Me<
zU*pG$d=s5gJHMA;)YidAlcr<uxxAiiAgj-RfO|{`xVKdy<bM=*hoLn+F%k^RT-xWO
zB~;CV%MWzRQ=prrZSYH|Widj1r%;5Er_QhvZH_{=e$&muRX$AJ^TS9>04Z8c-5~gA
zf!w~MlxY+rJ_g;8?QazEcKDyV?pjgoOj@n^Iu2=P1_r{$G9Y0j!V0E0geHL@JqA+T
z4UHZyaa@=<2}*!K=P-X2P{%IYR)idVx4Jl7NZg(I`pQ<^dMDACLk!+Yc{}XNU08Xn
zT&tx6Z=u1Xj00dKvuq~V$?*7&-Rnj9erE($xQD<B+tN4?Q0`}7?7zRga~^Sw=F)BG
z^~$zh%Xm%JkDz>7oO`vZ=o-3ewU_17Ge+eD3ZmQ&nKSZwT)N8jHV)1?Z}@cHmbB<b
zvSQy&ihaEc`Um+$nM7&zaC0t^18Ge!jT{$xk1zqz*yLi>VJ#{Jqp;?A-TAdB<ASq*
z4w{zC!t}2kFtmYbg6&igK>V5R#Wm;aGOMHfMP@%eeRb<_T9bi&y9L4J!C;YW2)FSG
z?u>NX@(UyqbApNIy^r%qFHR43=ZZJdpUmIaHD}k5seAjFfK67ujdqm-z2JCr`gNsj
z{j<>1dygo@y#|L?rshIFI6SKNYM9TsgI}*M+NHod_|qG|j`CrAsvkVL&{A>|ROsVl
z>v8P)P2_~}AZ~P8IpiPoVN((E_ixXcB5u?J`stS~nYy;<1vA+-5!9OUP9AO(3*80N
zsjT8w6@5AeIBwGFw3+Gc@A|breVoy$Gg}1ZE-Hl6pf5M|ioAa0VK(Ifq6^fTZVsuo
z3}TcZr%6Rs!M?STF<O%k2Qsuj9kgvRh=aLF(<WK@TL7tQ144~Y2)#=GA_6Qu2?HJs
z8~|9e>D9k^F;I~?21Wh7x=0aEYDJQ-pjNMfwzLNmm^QLUWOkG&&mi$iodAI<TVR~?
zUaAr&!n+*g(u<NV&5xsueaWNqN-x97@D*2>1q{`m1(`0^Ot#JL)fSz$z3F5WqWUda
zdVZV~i~TT;=F=bP*pXT3yyL_<5G7~#bM=cA#DV79FPzWH&Go8ZJE@LZzr8kokR#x0
zLPWCQD(5>vpkeRy+ktqd3Tl+E{BJnd;LulrcEK;Lqu`o%3+#SHSd|`Vq37(-xpTQa
zzT!PF5M_!Dyg=ZtbV^lCo*90kwnKt32zG;e(r|OR%T*ARi7*h#Xc!M&!)&3B$lA^>
z(7e0TR1?u!8-a3x5da07KID|Fw(khL_@`6i1547-0vK&z%=z&jv0_j$l;nhKF9hav
z)0nc(By~zGa$c#)#@l{hzJaYsq3C>Myxgfou`3erS!WA3Ev<}~hp=zEc3A_ScDX)V
zh7<=v!&oX0LqH<XM4Tk>VCO+kke`KK=se)T`5`4Ha68iQzVO;Jd>&?FpTRKLn$NQn
zHWj(NMh@VtCiGGvp2md>aa21S?^Eo6v1K(R#Il@xFf<@T>TBbn9fNG#lLwCTQ9lO%
zZac4^=jr8HqA^P2^V4uz7Prz0llkHn^xo#Z$FF?Z^<4j)bYu|6Ur8h#QKoGs<)5G&
z4Z70{WTt-+tQsI6ZfAj^AdPlE@U%>>LHk8eDvH78c0X5@-85-UbyhPDfDWWs{J;o+
zWw;?~CM7qm+HO`W(4926^NWq+b}EXh+o19Q)M{UTtBO_oS!#~ka$L~=K$mZ<oE^Qh
zS-;o;q^;2ebA9yjja>kFpudQwpVxO1QmhafNFTD3dck+9{IRO{E-L0L_zUhEvF*cd
zK+!P>3fJwa@JBpw|2du?&r%ks=)XhWM5j}%=%I*YppI=#(A$W2Pl=`p=yhyUd}k8g
zpZ>WLef+(gs92+u{+(RdCXu>D@lLpTPVB)n*dAe(ihZ?@7tcvhrUyU%o@xrw>Jw1>
z1Gy_O8s!g^$0MVL0P6FNK2h>@clq}54xAi>dRO_%7Zv#@&v^BXz6`{7mwN}fv*lG3
zBxm1-!`^jC?8+%`s+OZ^O<$%#oZn+T%DFQ&CS{R|w$8jg??b=KdSUu4Cp5bdFsVtH
z`LM><l|Od9`$Q}cQb{MkT-MvOVcUR}L1U9P{kQ{oooTbivzB(4ZqA*VPm_Q2`N0EK
z(MOi929nuGwF#{D=jeW!((k;y*i5KzlIc-Gu(^O-LzDJ9N|bglGYoxanGfTuGk1}o
zZXcFgCyIpK5IiCuAupItOVj>aVgKe=Ck+6Quu*n{>V^@U`&XdRa!~n!HDwE7m&%MN
z+2xz@jz%kHM%6e;)1HwY`ga&$hi8FY7qa^NI2Wd<6r5|LFyNWArbNRWGTB?UsAi{8
zVBzU)*tb!wq$w0t3MQP%-wr7S_YOo@5t5I{=J{D{QW}Lvq3iz38%rWTB|C9Kwijll
z;yHI=Y(sH(0X^fQ8C=lOD&{(;U=L-ZV$7#JY=D_H;I6ah(sb;hnnpTzh|zh_^09m#
z$~IYDUZ{`0u^THnn`cgnqvbXC;qG`;YE&*@2HsFr&D}Wyty;>G0bg7jJb+uGOS0m$
z7YWG&32D$5Pqk`e8;ZXpvHX7cC+%W6(aH#J;|R_WleVi`yJ6LZ*xSA_-s{iy1~{xN
z=E|e0Am}J6Y%ruu2vans(`S*?>82jXiyc?tGVIXFR?QS?qV&FIu>mLkA7Ho}!tgws
zin{tl8zwYPpjMTelEfVKjxF7aJ^!Qb@#E)Ts=clx?wuz}#%14KA3XUvM||t>fPB!f
z{3~750+79_Sk8Sz@?R3LSC?E`4l}6JaQMbg9UVet>rd<`fs*>+nC}H4?Fyf#7CL26
zK(k#XN(zJz?Tp-g_`DAQ62h>$Bz$_f3*I;eb5FoTzJQ(1fE;P}@atZV^dv!1++B20
zgf$Cfh{#EDP9R<%<L#)+B%9=Kc2T1cIDqI=;ziP7@PlpytXe150KZrlBZ|6edXMSz
z&MfL#EYSWfXEkh~<5h^c$%vlsbOQ{_-PJAptRD$c`)UuQm@hUb9?q8YU>Sg2HOFN1
zlQ*|gZm`tCr?vs77kXieLBSwy8+td%XUu<VrA-hU{PqR_`uHcP(ifjZ*iuoi1C*7^
zg*^J|QnK|2`l*(=%2MeXdSrO=bxPk_=zQzw-K{+zw5oQ%c*tU`tz|L9Ix|eNL0h8;
zhFm1$q{2g9vOObjc7TbWTScm>eDP}Hogf$Un7&7YjN#oMX-+R3HHKut@sP)Ee&S7x
z-y+vR;@2Y>57-pnCUUhul_&<UVEE{9%(VU%BUwZspL)JYw+NCvx6YC8QXBFrJC@d-
zYZmX%BF~n#2G$IK^V5Ja>#**BA&6fQgW6Ubc3e7yrp{15B-DjJahpw*2)<+)(6y&o
z{~QYIr$(L!?<-kp{0FE>MA+Xktv<;#yaai3+-WhDKRV&xefMiR2KD6p8RM)bt?{q2
z``C<6(paVJ#Y`8a>JlED>2E}zc_yF4Ow>|~$sGvFzN9h3I63B>d~I|M823tGLyjjI
z-IW)cwU|NlAMAzmr|H{w0aQe{opD(B)g7e_uE#ion-lPZ5(&|-3lYsAbn&N#3E11s
z5ktEu&{D7#NFxXQuI#@5!%KoJzGP@vEpQHwaZGK;i{wx)LuTIk1T`j!E%%6frj~o)
z#iuh(@}?8-cPv?aQgR$Gm=go~+HROqw^)u(Hc|R)-BKME;W#dtbp2&(20}UQZzV3X
z8MY!=Kd<@YGAA77HR|fJo>YRC03mNI14@)TBLr;Sygm%e`+BMqlVn+f`K&OVW7mrD
zL9QFf`u>+rQ*-Ao8$Zt05rgs*{XfdjinoA-(RFFlrwkeW%_=<@Y<N63bhb#41)Ew>
zX{+_rV8)<!X1F#pJIrqK(<IaaJ1mWX0g#5+R?Ity_PC_Z=dk=}5Katl`_AlI(2X)9
z{ETut5TasGT=l>_m?ui@m5ao7w0r3}DtB!XBA~HVP&ePxyOd_6vGrB!L+IRK4y_a9
zm{Y|LXLt7;u`0F%i17$T<|5Tx0wEDUr!O!1tPsw30awd#;CaQ<$k=g#@~dG$Z*{b{
zuV)Ui1f+$TtA0n04`Cu99<(tT<oaWQ_6(A`J(~?Yy_A!owK@hC?YmMnPZ7DFB%MK{
zaxE|(YE6O~_KhsQo+8I)zDpY-u%91nV`6@o10}IIz&Bfm-(+5_bQ*>8!k`;wB7zvf
z+v{8sp`LQ(f>LSP_`4}DMXFC65J{rB#Hh~DZN(t~*g(RUt2aaq0An<;Pey#A^ysIO
zS$Sm>7k(fyEZ4lRbnUF0NLE9%9X$XwOcBwkbbOX6$`-N{bbleOvNXI@F`srTj*IN_
zdbII*hUC?FqaO#WorK7*-R1u$425Ky*el^Ofwj{Byro}~2+^u1QLdJ`UB(lYY*u(7
zUXgj01a(z|x}v90L*zwccl>3y(FPV`<xppzZpsoADt2E9PjyF%nK;7EHzr8Z0{fK#
z+TgdL>@L^m<vcH`C$BVMLuzFZf(AA%5sd^TI<rk7T=YQalFzB1=!JoZ^e`7R2_u$m
zmxK2-AI^Tc)aJ{|n194fV;d2;CP`+Qg#9-!suyno;xo-S96}0M#~WeeItvF~iAMR7
zV4uDDHOTgoE0t!@H1q-mn>}n>olp)r>m4|Y0~9n!b24&&ldWphzE{7K;*>#R_SD43
zuYa_a^Fa`^;JdfF-Z~h6C@nl+BjNLl747H|AaJ6uzAfF$cm7bdD84UAHn~g0e%fFj
z_-9{GkF^+^DGirCm8pLA{?p$53=%o&@3$r@q-$ox@#hc{?p}w-&u&ZH=zI!BIH#r?
zZllx;)G*3CwwbQxmto_QrKekKh2Wsi<%RuevThI#st__m7BCWKM1MFw3s!OEnZ3SG
z;EaInY}OLYbrRe$yO}|<xW^8S^mfs;M;vZE8G#1Cop`*@Argv*tOs?cjf7Obta_gi
z;MFKltb>Nh8djiv)-1^aHLbIwa$Wpwx?`}cqQoJu3knoUL!ksTY%7}PbbY*0KF^b1
zarD0QBkh6Is+wAMB}7Z$Pv;GCUl}vJ{(B$(J1}s{uD~We_tK`38IpTIMN>9g9mO0$
zbagnvAM&PO>Xe)m$Wx_wdj0ovx)-_4-YX5hicqmg2tv_kY;S5X<g*;{f!E_yA*vzJ
z#QVZxI`)YCzy8iwSDvJ(?g+bL5{(2|)lg}r9C(#&q7vtPX+IzaH=$TN)GEoXo)66V
z8|OUoLktSe9Z#RE8sE4}y)bj?fqfycrY`JF=gvK(X6Q+xFBz&x8<TGSIzT0_d<s-h
zX52J6%dnZ@xtEebCDNEcX5@5_xJMCV1qH7e>eXE{1SW?`^{Z{GXF1jRv_9^sdztd2
zlDpIH(9k~m$F1rcT96(bB2Q8bu|AZ-c@Gw@+V6X4`KJOxn2j7r^|v9^m?j^?4Bwh_
zxNiCI)4*Tc!kZ6_^41T|fA5Y3*5>sb)0i8ix@cv<IdA2^b{3#j`3|7_OltCL98d&b
zP858Ht{*4TJx%R$1$tu30l<=}D7cmawo_1702>oI%`&z!%RTHzcDz8Ofn!P4teW!@
zK=YZeE;OmPPY*U6!VkLvGxrImS@?4XD-rYxD!8$H6>iFayXuT~Tz#N6l(;#ANbq3r
z)>iDSS$+7W1IT;5vPX*6RwL|9G0OmeYD0d+$+LolB!tUQpWU|lIIvWgbZd?S5@cS|
z2bZD-FhW3DM{db*2YVt35jqQw2_CsxTZE(q0-KR!YQtp0VTd`!Hgces#|FIjdqB_m
z{9%M&?s`PV(VqVXV%*;h^Xyn$y%OFh$+c4-pAw8;Ez9=v^2&plMCQsJZr?DW2J}Mj
z*C+dMq$WkHi^&h}$dg7uwO}O|^!~|?Dkl=sF8tuNMiLY)YYr&)$;(YJUru&{+&30l
z)0!reDJUL%z;C5t-r{)OOWSrt6&VD(_}U9vRq;-#t_Rxbhg`{bZ6`yAavCszmL$u&
zJEE>zzmr8~f-WF8!K2N7cV^i6D@i2A6dG~&5M^urC=S(zaUoaNzpn9kjkonXXiI6V
z+5jOy85J({y|qx?&8uk+{X!R)=h2JTjB<Mekv|*Uj?PX+1Rq9ugA6Uuo{q*@d}suW
z2SJ@jEL1Op#?}|I9V2=Xhzn*q`{}zSHvPLOB7t}+?Xtt%o>jQKWa~Mg^lBK@{L;bC
zQ@ZW%(D7!_q0M}%uUa}?v+S+Km`i32ZxuCdTS3JAje4&bsRY?V*BxKP{fCxlBf9*8
zJ__SNnkQ-MV!jPUkwq3@z7^N1sv(-*boVNdWHt~e?mf;6Y9ex&x57Z9|6;<aG=!AI
zp<8@8_~&4Dh|$BB#-ex@W~zfAPBT#KGANp18AcFm*jwY}&x(@c@R)-N@VSF*ftPT~
z4bkU~FHg7k!v2EUJsrHmdRwGKnFV@$u4}`rGtxeP0*-DZrHhA-GOb`B+Fcu@r4dWP
z0ld-)+pi2aCF_R6TVUSNLv5TXdV-aiz9CX3?h`Dv&g#VgP%o|5_SU3rsASuP?AOo|
zQVT<MXrrvQe3&h_=iqQ_0Mk8@X(hm72w45L#gc94>{GO(illvxFs|JLcv&FiU;e>v
zvAHRmuwfgD-noIg>$;@wUdySqF+gDWBl-)FavxAo<BqUw)suVBp^|=qkaL9;XLI6{
zNHU%mk=P(vIcW*NSjBI)SRw5%c^iWq6+#FTbD4X+qnR2n{Oa+iO2XL}ktlr%*nLQ+
zfq`vZ>u}59duXYbrY)=+L&ZFiOO(C=IO;jx=m+2u;%(2fzw55``+6l^fiWc^`M>zN
z*Rj=heK<9SSB8AzwtI6H_n!yR27<Bj$=~1tLpQy=(Lnx1PhFujH;&TfC663)L&8!o
zza<wLI$LdJX)XwGZJzw2gLWD)+G!pK4RQ20GwcC>Zo^h>vM>wn{sea~{S<oreDPa*
zn_U;49GqJi%J5RRFDBXX$WW7ZJ$d!~5RB?=IHtAby@z=l;pKPkDNGJAgr=*@g`75)
z&u#QeEz6nF_W<J~GUHpr0gbzO^9CUVhMIG<n%9maSOV2~jwRjG>dABmBTYUYi&kT$
zyHWR&pEE2mrj54>C=F&rMrS5_X6h=mt&&5}^AiJ$)>g(%p(rNiQw6-VFNS)6GHvDC
zGrBhbSD(5sjg>nN(PmUp)P9x)=0XqBYVcHE0@2YR0UN37ca}#zIYwo8XG!AW_Hk&5
zq%63H)}@lddl7^nA|#mmz0&2g>Y-1LMBMu$7G^4gXybO%KtooI1k8Ea_zDP`TWw!|
zyGZe}*R<|VtIHA9ql?J{rAo^7GffE5`@*5AfGHTzIwB1h+9$?~S1g*E^<Gg&q3zsQ
z91%YaZG$hse%wYXl)K@U4cCA!4FE>^Ozic+iYj0^G};7jXi!=e@81o#ExVUuWZ$t%
zXP!z7$s#nT_xOdmUYH7IR^oQ6hf1dIKpa3^qb<ttkjGlHtEj(Q0U#66-<OkN+*xP}
z0>MQ?osCMR=OvOanErX#=GPx4{rO=ZK_2$jng{_Dhc-=IR#Ls%kjw+BxFlI!+4IVL
zx}{%=7m-@c3GnMm$OPK+6W^RqXmINfh!X+ZlWAiE)@bM|YzSgHqGJB?-P-DsNx6jX
zH>f83A#yQ{*ubWYcur}ImvSCB@Y7lI8yQZcunUnD+R~{0!mBJf=$6w|%pbh#f!)7q
zZ)#kX1N+epi79m=z-afy-ON*lsUHMkH!g_Y(`*Tf^pBo2j0jY0>=;Hfoo)^k0FQhu
ze`mIVJi>h-dxr~`0(+cNBO0MFP+v)ZGEQ!Te$bK;`#Jc~^0U(?^3!*%_gJQPfZdpB
z{Jh>{9e+0wcJNO%pHB?*Sl3mX(_)%k(QLhlfYaaVyfYudRhgDjaNkUdITv!zu<dO+
z$RtHLrh8>C9ZPHK9t9o-s*p1PrcLqM)mu<oHen+P>e=#j`?UZnz7Nf^YUm+6Ez}8<
zNX;B$G&|J9qLGgQr9%@hB&nC2HW*jK(m)s^yoH>HB;D3?-<(KTCRx>!DPg~1sIuv&
zv(erzX+N+%suNgwY{WPlBtyvJ>`=PRQaI)BYlcjgJB-P<6Mbnx;I48%!j3B`OKdCE
zQNtdHt>)^_db0yPql_ru>b96M-(Q*?mBuLN%2>W;+lVAl(2vV))FM0B`QxAdE`V(O
zSx*88fPIc|1>8kn=L(kQocg9M#uxCl(x#BQrttvt45LIH)~E<Xb}8x#;L-M0pUjK#
z#~;C{%q3{T4L*n$z0{Ia36HSAE1JSImi2b&@ELPe(j;EqaR^84p(FQc4P~AbuEFMy
zHvrNcG~Wl<kv_cEbJCr2*8psH9_^m59{3L2d>0KRe&v#04}pDd5juB5iXuITcb@aT
z@!Em{J_GVOS&@1Mes`W%TsYF{!zENlkIP_dkr`|xco~PofmA|Z484wbxw7$4zZG6>
zhEzvTwN2e~g1<RWo>Ah}S7H#5?@B8(y9}4cdRn9C=V6E^S#GBq>k~2P=58zji^ZJ?
z9myS8Ta*UI7<LDx_V3QWNbnFWNA}@jvK`rQ`b}beHQ`JBy9i;fzB4=w5(|*+d*OdU
zu&nq@Y6rXy%Aj!!j^3G6@r`1z!jPnYJQXJJsFVKRi*Ctp`iBYUaMaO_QQC!pz#1vV
zv|v;VlsJmxg=|OCp8<3)2JMLuqRARKmx|~_<qnRv<=zuqp17Vr-s-3l|2hj{)b3GC
z2C%8{_O2Q{lrMb=v5Jb~1Bk+mq77*s=D*3Mah`h+Hu?TI-@t<yHM{RF77_xO6QV-r
z2otfZ$1R&R@YaKzyY5}mqwJesQ0)i3QRd@dMEVB3%qNf}F~R?5i#QvBTHv*{FPW%C
zR%3sJZ4GY?)JgiDf$yLRWqA(f5vqdGrSq-cpqM+H$6m9Y<7=vSIM}+SmSyoM?^h?%
zlqq8<eyKo$<!3yF=!{kr<QeT#<Pz?@w;5}im`4^V@!EwMTZXa!?e7bS+}37Hr(>Hz
zwZD_0V8^krKk9?;Tp|N``os1TkK@7D%w8w=*%otgP*NQbKFLA`2-|JGQI23<3w^oS
zaH&)O;HXcJfa1Ts^mC|sYB0<+jo*^os3(65Vmo&s0@COruQSPN_f`GN>@Fz!m-i?@
zh!>XG3I*9Z8c&~8TDSL~Kqh<<dRr^b^#aI!u<N11pTEQ(xe*BlY5!A1(COWRUb|u7
zY(7%Mww!|6hz~<r@K677i50QZ@r|g^An!c;r|ODiTl7J=gE;NGPtoLrIBSz;3X*LZ
zVvvO8RQB>d*@zw55=da)vSIs=^Lj^rL#X^~qLZ3HJ-ckH{_BgJXbSC>hbQR?hbLRp
z__prUh7H!lk+*xNw{CnuMHZ4HO*VqQgc@1vpOyR1k;{|uO}FGgC-=heRd!tBvRMf^
zqk^*%1pyh7a8^d{NnGB~>>q-B85xZ+c(vXQtU93o`J3NT=M`*l{Vf&(0~GMoe9R!r
zn2q_GUfW3BPVvYki>w<N@8=b;@i!X=`?<kTJO__yH~TIXr1mkr1((mJB3bj#?BWFC
zbg3Hap!MQX`agg3&tv`XRi4ZT-b#ls6UB}ASq(Xo+v09Vj@hb0QS)Zc(F?^^d^G?5
z12I>)SbgIS;L_KGb@1#zzWBTAb=paS8r%AdOP)iXlm7J$A9x+C_wV!m-LIma!(|>m
z!0~LesZRzW52Lnj{g74n@;RAp9xVLn15L%jVn!;rYc{ahjhl1UJOGvxc)MO+qRt1o
zKKZ{U#{PanZ;%5+!C|@inzlGULfVq-jk|kyO#IJ}w1ove$QDZ>u=&cPJ|K;!W%K&o
zv0e=F^ZMg8S+m0@jT@6}*|@8XgRwD-vmWrih5xU499RU_eAx4{=;oU{8IKtJcKwFI
z2T@Lbn=kukgCi$QN<~WQ7lU{GFnHdE!TAZUF@L<doo|pqJ&Vh~k+TOOXGnkJ47q$f
z{YR%1#>2Enb*uRG@?XrvgFw>)T<h^vyk_Q2{GXnka3Qq%)pLAKQ=7xg$*qVF#BD^P
zol$!K1gYO1#HgEy!O1W0_{HEkKRo;&gOA!eW&YXVzr=*~FLc&Ch<NzB4TDP@c~<&A
z4313B-oIq|>lNo92DjNTc<RSXe>OM{F*u&(deJWizls=K<sXB8A&X7^qroE(gHO>o
zHT+`mU5LSP8wNl3Mh_-=H-FuKZY1g)VsMvB<^TD!AC7yn{D+4(Y<T$hP^X4J8~i4C
z_+AwWsm-C*x$B3)3pWg|EdQ+ge;6FWCuA>fw7maDRN=>n!MAUuVpxX%Co65)s)&4$
zIQyRV%^h;o8D!>pwq+xv+>-Y%{Npt(Aft#ySRvgF{rbii3!gzAooDcR9(;MHVdtNn
z;K0uPFh{HXV~+N}IZYUY$Xg=f*Uc0<Y(?_RDDJ<OfM4~%8+(auxq)Hio4>G(0U4tr
zSvM1|nQh+=k)NW`W{0?W7oMG)y3A&8+T#2d;!dm^F+7^aVDmry*>5uL!3SBY9<g!x
z=~5x7zCfH{G;6~NqS=_jf0>j0ucuBb!6&JzIY=Rs)BpVv=LZOXkGi}boMO`BsDA!|
z%|HJcIV<ljivIUQke@l(|HH!@H#~fS=yd3>KbgrC)D?y`%3@O6Hh)FeA>`(qH*U_3
z@QnU{OtvzBJ8`n>|MF8#&kzr1*a#`4Ua}jGw#lIDzg1*{4`N~89sY}lYya@@)(sC=
zB=~py*~5`27l{?@_uBML!haziUcKSr2Q(V?Y<9Sxu2J|S6xTXouSoyv-N<M9EFmAH
ztG`~A^{v_$AN%7a<s$n7<S}RZH_KavFCrkA<@=4B`?&kV>p$1z(n$S!@JPTfKUFLa
zb+|?7`lA~@Th9AuZ$iUZL8zy^i{QT<&foWWrv&lKe8cs-3ruqtv-;)R{^MTG{0Ng#
zekAhV=2Lf)898*b8!<c~OK*qsXYzN@X-5kIrV$8?^bObzPR|(j@G&xmBn=(@XWA?K
zlvMLAQzgQ#)Co4QVBbjt8>`OF7z*1%yx`p^Yw1ZVu+%F6@NvNwwg@70^CyuWF*_C7
zPty+vL?7X`eiX4V9J~xKLqUk6<R>r<900hvGBU|iKpUs~(}RX*>VF5S`m@s|b%vX*
zmT?P_)!yES99$|F7k!cUMyC3~d}_rGI=hpwMcE55Z4}53My(eCFe~7PH60N|knc0L
zKr=3o)4N!S&@({1Xol+mS`!QKqh9!A^bPkn@TQ>ILh85e@a~I|UhT_>&?SE?uPO<j
zt|bb4n#4-j5KswVe}PH3V=(|CZVczTyP9Q31R|3&h>p^VD)7hi$x!|ZUmgI$ePV$!
ztafWN@F;lwN(WS>XJbS>eSySOblh(W96mCc>z>HHVA6bHoMiI)<IJC<MKm&HnaY^D
z*)e>A5VvPE{^1x?0_w?o;e8QVB0E$-r)LNAJQ*;dkci5`9Jgq^i)>8+$?^@=4xupf
zzHLSYGjh2wdooJ;IfPT(yiwW;UP|B^W?p}5tO=iiC#+0n!+xMUuzp4-+yN+w9+(1?
zbdLtz3k)&%!MsT8O2d{w+a3)d)Au351K}4`6|+vGFaX#C<YBh`4#4bSi+@&7@C((G
zpKYB6yv5vqdd9+INc3DW`25RB^)W%bl=MefXt3McTnPFlQ+VZ6^C^L%-O;B|D|wwD
z%3GBER5^nTRiRrl%7%zA+!q#LZ*DmR93cYtC?x-wLW@*pMc%|hHN@3F2WzjMd&vy5
zQ9rJ`;1LK+nWDx7u;nrwdoVFy^eQ;ist$-A*XU%YRye_hR#2i0-rGE6QI93J3WPDX
zJ6?i|5BiyzKu&^;XB4i?qLRm9cX_8aj2^z=+jn^X*Aq;Owp*s6x###aO~}xth5h+}
z=-ya6SLQDj&ikq7lVA1ehUa7@g*%?lr|EGYnH3aU+G1TuUuf+>`f%}I+q?w3c!v3J
z-+aV>B4ZXn;Aut&!&U<cDjLXy<6oq?fJ5!g7f&aEgl6SF=mq73rg?(^?P^}4Y;;~%
z%j?M2rM+=wFv~{XI$;W=V{?2CObONv_p&u5%Ll=fI4W7x>o^l^pEHsFM7&R{Xakx>
z{KCEy{0cBM=o5G&juh9L2rASnU<h?*um}^6teqtHF84i{R?y|fq78%=J{R8KZHs7u
z6{nV;I34(U;^M&@+-2_uQv7HW-)_ZebWRN}QLF@RzXwx*XOIa8MePt0XYl?@51X?>
z_Sn+JHeKOU9G?-dAJ<X7^q&xrp#rHAr*>-bmt`X4`;k<c^dsI@mjiW5De6g0WkqK3
zR~=B!$oS(KVvg|<igpAqoP_nmEi)gzXju>`bwSwZ<r-nbTRWQtVa#?CUJci-Sv><N
zcn_T2UfA5?3&ge<3|1aAiU&gd7J!_i$XK5bP-}InHFLq2Ypz^}8EQ`VZ@}63f;=nk
zhBPG!YP1=|@@Ei``MBBVi{$jJL$hEc3$H?nVma*bGS*^&uEU>}FZBg;@3no}1#f+w
zjJUn@_Tjf{29$PKp)qn>48ZU{BLc$nftOI11D4KZ3Vf=@f3L0{u2lRt7*N9cLSk2D
zf5pE(^!KlNJdl)6zJ8E)HzQ01ENItK)1u(g_rV)eegwHg1-y{qOpuyGF7mRmS%((E
z?!CH!Pn}Y|uIY<V)jV@D%&;ARnG#=k+yqSA)jJd#(yJ`+vf}@bu{RHddjI}_qohdM
zsL0aQB9U%cvJ6V4l6_xCDf?Km@8sgPpj#pPl6@QdzLikf*Rc~Z7)xS|bv);jy0`Ru
zzR&YtMKkZ^ywCf*&v~8Ki{24HFKOPusiXkHXr;MEkGb^1(yULO)N=;F@DsP{EJn)w
z4;dzI=6E<51b@etuvL~UXh=CZhl+|~BRrAwfcY#g8FU7B{%7i6kuc9q*S?WyYb107
ziK&=3GjUM*>7W+?OsL+U=!WETaCI@Re_V`4G*WJX;omRlx1&u7Qt1Uy07srlNA{}n
z0m^*j9vHt7r@5=^@xIJF3v|;_L-tijNd*F`&aqQE|LYIDx?LW^*8?q<hH%Lt9g9d0
zqiP=Hr$0iI$@A&qqO!OhW>CN4gxY^jqo+qYKE8f6u#e-KJFTAX!kC*Bx4#GGrb`nZ
zU%N7Va7gT98mc^m82=x})^iQH>!WZHIa{M=c16VZUH_H<G8UsU17sN&lgGvTP&z_f
z;H&B@a{Ngo@UR~cHb11p=|0d1<(9jV;$Fx;2XVKnz;MbosBg4n|M~qtor};Qa|=*<
z>C4dVsE(LB6kT6HFWyI!SrEj^?U`q?wFi?xWJWY73ZXL8D>eYNlsip?r#{QVHskvW
zWLM7v{$jaeV^#dDgQz>%rMuj<M1_>}+W$Ec3jiwOXhFc>Lmx@tlyht$Csp%StliCP
zOVhY$+?$`y;?w>m+n+1V^AL-l4R8~wzAzcvdz*~(BOpGUrBzoP+Ow7cK#_JoF<$4*
zpYwq0s)N$JMLNPE@HyIR?*p@SYgHNkwN%e30I|G<vf@~a6dOiJczdY(%&2(cDdEW!
zM*fcd&t(vj3hsk>N6+hdXz+jxq~Emr`{TYhpiDH4nE_~+<8|2T`|0LTjcskwDKPKn
zf@?T?GWe{TEZ>xN%oQs89K~18+Ovb8G4jSd2VLO?=tg7bZXsa%+tactR|mCQ)BcN%
z)578q!_-}c*k{d}kQFmO6We5EQAP|x+F7%qrr(`;$IF(N70!GtPCJUWqwVGG9cB^u
zHh_K$!6|F_G-V9<b3l3UI9V7$jP)2PkJ>Reh9Ka_PHSJW$PV(CD*A#M+*m`H7Jk}r
z)~u?YV2i{5;i^rVXsb;N0+04Ytmbyh{$QdQk;}WtzO?5eA-pMq`k1AMHr)N4{1JS{
z&qY_pUw7)OZf^smK>0Wd&kc}(T*{Ue?f53tifDY3?Mk8fV0l?M^qDkHmd_W@0#M>E
zN^D^{2D(RLn`}W7>@jgI8cmnM5pUX3n?CQ>W*g$r*lL$|XiTiRwgzcVMjAVbrHS~2
z%d)Oh<LfD}uZQ6uanAg+v3O~2kP{ttKx@NVrVGcDQwx{%xkl&}A}z2kaG8)mTBoij
z&VB7c_x)f;m7JOWSU%qRk=Erd>+;UY)m^Tl-0GPU0u}?@a48}Dl^WQy5GLg`IYW;u
zLa#x{y2C2CqUi)R%nx^bSqyN}wqwwpo}<f_%eGRxZ3S4`_e-e<OhXLw(Ks>UR3p}y
zWKwbd9E2<iWvmJFkxh>M4|Qk#o`}g!nkKouu0r5rE3EPGRh{#FPzgN?7Gp5P7A-V5
zJ8qq#yWQ2?5vWP84SG$ia=FfQ;ALFN)BPm{2!3hoi?JN7H61Z}C7of#O=6b8b-Fn@
zU+C_;T?AADxg|oZDFE6T!F?R;YPvT|5srJetbU7Vzs>NpqT{hRYqk)5hQ;OXI*oqY
zb&zl|Uf-)w^x!^$K4yWxW6kZJ|EyrgAR4(}2xW_aftV&;2A(+vS2jC1?9x#GL)iyR
zmU$YBGN4`Eqe(B%tgK$n9xQ`AvpH&TQmm0w-&h+-mW>x*aoa#h*UCL5X6ulu73(At
z0^9&e)B2e0iO~F=JD@+ora3WRP|ns->s2l|4x||4g71E2hvKC11fbz0Z@~|c$bYZj
z_Y|J$nQ4`4Q$2a967F}|m>A!Q*#MuRB+Xs6az=>L;@KBJX}+;H?bH$%vg|2O+_x&9
z&%Vee(kVCPB~Dm#J)4+$oN*85-&A|1@*Do_Yg1q9EKtEzwFmemnd%gDCB0e{&S?<x
z^R7M6^ThkicG91#X#0NK#d0U!cUSgOWerIWl^45$0O+Ed+r=JU>thwhQ`<)#s=rFs
z1E%bogiwLI9Q3O!7tCF``7i}XY3FM&*1So1#v1^<w6w?%>Zoa-3)2OaTdJ&m8F;ep
zS^YaDg#r<_cRzI%VsvYtQYnO&oT#T~;(Ko{IZN!Kp4@F4e)jI`j2<G<VWo74TcK}c
z#(E%2-*<kW)jWa-?~j7WuNrfaHfvkF4j!O7e5oS|SuJmA?s_VgL<ZmIzQkI9Vx0Qh
zl%xACU@OgL*=WBwtI{i-W}M9JedOIH+G{n)>=e;|EviZX&HfS|thGN?Jq=U_sYw~-
zbt^8PI{cj@#5M}050U&!WboPZMHd<OWeN1d({1;<AC-GV3B$XG_EamE9z=OrFGF4N
z?5<)tVjdr(<z6!m#^H0#c#*al=n^`Fqu2R+MM%1rd&)HvTGbzRu~~Jk3#{AA>K_*&
z2x$)*9vWk9Av*;op~Fi3?{vn0Exy0_i0aIU%UurRFqz$L>dj{}%&&NNJ&xrI7`B>l
znVK+7F0UvBJ=o#KHpdF12=yaPKsmrh$1raC!n(v-H)^o$OqO`Ynda5j?jUE~Spqad
zI|{JnJz*7L<deOms*LrWD8*ar3RaLq_PT?aQ+@D{8PLTW^;kmZpP&VhAV@?V?#ESg
z6I^3RQpG19n<mxTm7gN$qZWO4?soO}u9dXC*zLRx&wr+Vc3Z;5WU;-^b@Z(<7v@U5
z+JqQ=c>ne;+8)Kcux{5($Yy$XCF-VoVhi50i_P%p1!tye=j|m~8x3*8sTIseEh1_t
z`)9@u1VvQT?O_paADDsp<+TldT8OmGpAE;=>P`i)POq04ED+t^KRaHIF>-c#s%|-8
zYTx-^kjB2R$Yc4o^ak7Q4RI~;+13rY){UIDjl}a&k3yQ>+c2pd*JBPmF}*djAzx3~
zxN+(HM#wWPh1Pli1K#&<CWptdM(n4is1u#my8e!f^tE*>%pl%<y{npt>$b<cn4PFA
zTztD&y?or!j4w;R_ChU@_M(Z@bMJ=R%))+t+QCE$q%?W5Yn-}Uw=rw~-y<2<njg+f
zTI5+W+W*~ZY%unM%1kXyeLv2E?gBLf9rvqz{ntFTDt?o!_EFaI5`WyT6cBi>?Ws#k
zr{c7ZPZAS&PL*CSB$C+8l<DVp)dbBkjotaO51$?&gKbX2t*21zT9?D0KiU7~o-#>R
zo-Lv&!l_LE^+2^yh$%DkGS1upFdUH-th}dP%^VoY-1T4gIkDCqYcth^ezvy*)GKbs
z1s*%}6-}_I8>#oRJcf?N`grF6hwe~Yg>r!qfwF|;a`O-Y0Jt#5J1PfA<MricZ4q_|
z=YgUbsKWF9?e{q>H*!F2<&!$swT<Yv>%Lc3UfJzjx{Y24*wc4X>74GTwj^EpvdElz
zA>qVElFJNXtV2An<ymZw-@SP!S>0;KjFr%7BGah3R#V;j%2-FfvyL)OzSnj@FiRmG
z#dDWKp`>J}DEwBXDo^V=iv)dS;|P1iDrXAbFwq)XA4DViNm9+uniZtx8Qi&%sZu?K
zQbEgn!!aeIpR0(+boA=Zz%I@_I~~+%9f4}N0GW64n7;2$9oJWMm$IBqoh|EYD$_i@
zn7&`PA#?A4fwAWe$cJ73cvJtkz(3K$ZJ&YLSCn1}JaY@_ca&X`O&&ODLfHEf*ga#|
z7Xzm{$8Rw`Xk~x2Dyf6r_fX`Eo>*!7;$1XaH#$aqy}5n;Q;vV;I5(4UyZm4N4)=PR
zlQXQz@5&>)2Bskh$|0B-SwNzQN?0>35<NvQrp*B4rE^I>zggFLXEeSZq$EZrCmab$
za46al>Jrvu1utW!MSs_8x&6HOq+3i54;Iz%{3lovt_m^5&96*Szn2xH3q<HtJBc0V
zHRbi%`z=Vm1C7(r#aCuKvqDiY&jcL3jRGx%@H8Wj_fxZi*(v!k95lkS3i$P-qo^4%
zJUjM0MQ`*x&W)g78(tx6o0|=kKw6{-|9y<BCVhq5{F1|<P0U{Jx@7f?f=>s>qHVtw
zK8>R<)M<t3JkZS-nx>O1Ud58i#CG<R;{0<7F5$wnb)2&i(PAqodlMt6sJgpoL)~bO
zC!zbD`E&6u87<D}D&ZBEIN;6zA{2k?cD#+fm3Xa5;Z?MnjXT{r!mf}RylGi&sjhRZ
zOJl1W<Dyvevws{#$CYO}<{df+DI9Gf+h*YTq~8)}9Z)FKU#CzeP}FOCE^!__Y`_IQ
zE#)x<v2*LJ&Q2Q>*52jRP7r~hywse~6C?82tn$HT1rFQX2Y6S!U`pwny&Ur5EvUG7
zB7p-pKJUq@#Fjd<AAfOTm_g5Pl6XGiyJ@rBY-f4Z_G}zN37*9+T-D({Y+|B~T2a#d
z?hEmO{dkj%EFU)_xq0>K>d-N7CBh|a)T*X4kCY=_o~z-PwgnBD1ueRTW!Y)lzXs2r
z?C?kz(oLz@ZiH_A7Ry{Cu1$@m#VESE$5fEU^*h%6SXXLUb+4hro<@XB5`xRIov{_x
z<IcuqYD7)p!P#rXfyz{L^2(&MN}GFx6Y6?{)l3ndwIt(c^`P0j^He{)JXM!e&^U1*
zjr~jfS&Qkg3bd)|vq`VUU$(?sPdq;<JxsZ<f}#02BDsK+RodR>{#I3C-8JspFm`%y
zd;ZLq$Ah@-i4U}l)Eky5jF4v%mhC}73|pm$7mcvR+gk}4B447XCw<>K^@m@>CR#7>
z($P6F&^^Djny|XeF#W{G$o8+>*w|iTm04TlPUXI9Ri*|dA(LwVI5Dh8cm35L-W$P|
zz3S}{L0lhuO_Q1&B6K)n#ZNw!Bf(hjV&E{jxz`j;7jY>dY7#{t3+vMvJ24m<DN0f|
zvRl6-6|RQ&2T&Le(lBS*y0erF<mlpVNUAliUMq|6q&19M121i81Cm_fq>7!=w_7R`
z#2OpQqMO*5ZdeCH4zt@fcjgIi`FO@%9?(H(%Sgoa?yy9iEm19=y-9~#3FMq*sn8#H
z!s2D=+*88Tkly6!d9~AqMgtn?D0jc2og3lTX7}eb++JsmT2Ub-_{&~o$@Ci*v)q}x
z!1|~AiBEjZj`$mn23lOCzq@NKn5s=*pnHqUGqG9<(BJh@^kZ#2PJb3M1Gm{pOuKcX
z+W4l%xK~`JT(CA{A%?<&rz7mim!INx<@I>@4DuhFJQrd!M^k%k-RadwXEBoP{3IH(
zj>C}!;n<t9BBb{jD`H(befX3nFAzGnQiH_^ZwiF`;_ak^xqp0wyWgt(lxfAnK)ZO?
zjl>hq^h4#RoJwunsX6OM*dcEMp12@K%#K*pq0{F+g(nurQ7GY2ac{J-u}u_A+_piS
z1I(9t=R@VHaYrxVYG0$R$Zlig*E>l1a;~Mi1$h|!syTl<>2c$*TbYgj<LR`-PcE*5
zdKq4W&K!8L`k#s|@<$+V?cJh}{wZg*S!K%Hal248ahVmiGbv=o_j99G9jYhPEoofM
zCho@ko!7Fq?dJ@w+zZ9vZG#^xgw>T5PDxR-in5Te>@;;JA-yT@h=WfTjV4imxVP%H
z{R^x7WL|R7Y<HKi_z63A%ZSNkAwr4xf}Q!r`I%_V6gI_@s#}mHi8dBCpImcVfZj9#
zbFFWtb@6DXZNO0S>(FHe`z5hn%KS#c>n0ZA1EFeGZt=PPS6P(9J$0~_frI5U&KEfK
zm`BS-aBMoWZZqw*X=<-D36uJ7mtVO7q}w*n&?+i*UP!shpb<Y0%GGak=yF;$1luTj
zIcK)JuK($(%3G0{EhLU_pJucPxI~h+7wa}vk}vUg?SK5kzx4;8So)jczN<YN-hmAw
z(bP_qH;OwnlXfH@!k1z3A-6unJ;7O<wPSsgAu2=*+HWk(&A3D^tV*66Nqwyxil>bz
zj&kqEGc7nx9djf@T13!y7r!51%Z-0<0eoeeq==ZkNh}4ugo7z;x`B#xU5sP)9&bhW
zDi#HlHnx?WtDnzl1Kc#p*<uL*aqs#KSJIC(4zrf2Rt+@bForrL7v)*HzUks%rMV8$
z=`pML04Y3MMTi|gr`hCqJL+NXY8Jl3$GC32XWDH|2>p5?pcCG&W_B{K_5#pnCfGky
z`X}@O5QYK+ZnAXmZ@2d&54TJs<n~TQQ_QUGYh4Zun&{gbCV+WtDkpgy`UM}^>}1RU
ziO#~w50vzcA7`wse0B27x!8t<dly4-<*51ki&l67c^~d*R~x&GFoc560z1rz$Ig{4
zD6W<gS5Uxn7$crZf5Fmyd|Cy!e#brqu-0utG>QH`qvx3JSq=n4H(rL$$w}uv*G9MF
zG}9i|C(@O@6os$E%xAelX`vVYng2xtg%$}n=j45n7|u67Bx*={uRk+C12}UXbd=m%
zMiOe`aOBgKf!&i)t3}rD{@!2SG3bbASuO22%gG+=cS)+sy4)Za)7xn-#U}pY@qCYi
zj-+9deD7YaMuq9Vn2n^F?JOO*ZbP`PfZ-nN=2IqBx+r6-^9q*`EkL_k%y1vLfa+hn
zX&19O&qOD*=}P8}MSf*omL~+Th;(Kg9?KdPtx=Lg-JeaZEd~xtSFh5>^~Y5wCvjEE
z1E6eYzCx`xra7U!%A~wdEJA=}&b(Cz*ib=BUNp(aI2B4i8R_IF3TR2x^LbSAPIp=*
zu$i5xpy%s*pUsR&H1UFG36bhTqCEK{N@%Z!vKS@ODm{Kxr+-FJxJ<3$wUfnAN4~WV
zS2>fieIyo_)YK?`V9sgw*++f3)nxbZ`~Ka~vt)>)4R88n0!MD}>HY;5w)UO9Kh>po
zA>gI7L&Tr{Y4gQhsaE-yscq;iY=YV$UY+8098bLubg}f2_bG}$z0D}mEI>4sYoHFE
z8Is7Z^vaQ&v7TenIUh)G6@ej??i8|pr?Vd2Av762Q6d}6t#P0rEJrs5O)z76;PyU}
zhe8YQ`)+KFe<*=N)x=1+|G=1}g}ppaga<;1Fy$<}I?F1Aa7i!PmH9Mg+O;G16?7@u
z!V5u95{u5?X=a-%YTY!!$H_TWt_nHIa3Vt=)B7(gR&L(8IJM%{e%y?6D~siyt3|6y
zU3jUs3>;q|Ue>jbNr`UOvHKEkV%MhxGV}pYRf*tI?`PlbX+}7Y%t>$is2i~n0_(Vz
zmmnxejw&nh2!37Mdx;$2Y`Obf_04Dr%UjXvnw&fAd0hYbE0#+07)>?LOZi-&r?ltX
zac2JsiHE1(9KWm>`>t?Sbi3gLJG;)A2<O?U{=qN1IYg|-!e{Ge8v7j=r^aI&cu2?2
zXx{LoCd>~gM<-cYNe&jY?&(Uo;s@&J;!G>0X+ZKtO3~o9v<3QyYfVBC_JMnVy2iE<
zI+ALapuOT8(>{y6!MTI<XN$(p+V-vCZXPvRzw1RVx5VyesvT4s#_*^H`3Ihr_AGzk
zn;Q_bNI<^`D)#48Y2w?SA5Y$yG&?VWN%}1MxS*&U+cYYi8mwV&Zj>gUCZ1HQNh%x|
zwABp~S;D(WX3*W5#wrd%3R~3Vg|6g?*OknS1`|n_q|Zf(m?q%ENh)39ja!-x2A%~@
zr}fXl2REDrb*0As%e?P1LNMn(G}%A;A^v-cUM<5N$V^XlhJK0IFrVV1$;|C^M~4Lq
zYo8uf%Dz-#n4zMk!*95*=t=E93iW_L6M2kxn5oo2MnfA<@*g+vIpw$Rk?!`O9gRm?
ze$oBeiR)og8oRqvzCvZqQkEB+kzTwT+kCYMC9<+_v~R(mx?}QSW{23iUcn@R9!Mz7
zY^H_-;$8h~d;8QWw5X2v|Jizp_3f8l>;yL$8n=zx@^teWz}81P=<y@99|tqqZPp4;
z&kO~7&sk@Kf~IbiPq`Rls?tepgquU^OX)Q$Dt*3pRrlhZ9<&L#Y4{z@^eb6i<>6-$
zr$5Bn5q$D_zS0*Ayp&8d2jpjjo)_Hlq@r`Q;F7;rc*&2Hp1VE&7Ylf*&aIc~QR3dn
zAmVc~;EYi+;cUeo!F1j;C&~f@e5HG4eFJxpZm|e%*ecG7jP5C4{<HSji=3OK=|c21
z1~%*C{%R*FdSUldM$s<}&gf}14sIhlvL-bIhD&LR`{D2pB1UG*=1fJz&58jWp5k<$
zo-8!mSn;5CrYAZ)LS+&pw7-lmN3S65;4S6|aQ<OHQ6QJ&jByyVdExQI+x8Kx?iJj)
z>x7A=3;%5^d-E%}ftZzovwyOJZ@wjIKZR3fgnP8DQftL=2Z+WS-7{I0=ECBD1Jmk*
z;#$;wH8}~gJlB^YtX5+K(P7=@+#x10xKzTUuGq`2ESs&{6cMOecyL|xT{Z4CHb5ET
zZKq;W<o*H$Y-K8%WwBg*!_0-oRPqZiJ_hdD-0|lRFON>O(Q{9fS_{@QsD5#dQ*3T$
z8^+5^HqAMN>7dqJizlGo_GdOQPDJz%XV=U@VA>ql^{m<>U8G=GpV%D4_bx!irR47X
z=#H!XVk7u_F&>ywF*=leANfU1V5uF~Rn7X?E`6xqniV=zJzgUox^aeoi698tjWaW|
z1?@Jij?uWkp#_rTw9#1b>&juMW<Ll;g8}3yc!v0t3o>vDXouIVs`kJn(*A51!AnU-
z1qX_fLb>$LRzWv$yN<&rZ=qQWvZM2dlfi$XCEALaLaR<rld2q;AM4Bq3Y(J&_eu}f
zMOA;@7%Z`$9k-o(Cb{>6#_@s9aBBUFM7pk;-oa*Tt&XqQo2k&BvZA&k+ALsIdl#>u
zi5&l6ny!`6cTJb`(z}MD=E<hlgxbIa)R$+nZn^XekPovVB!C5%)=tu?Ra`+$sD15I
zdIPoL$C0&MT4g&;|E@q6uLoW19DKg#r<j8;0nU9*d%W4!h}GmO)Z%757oEFW<^B}B
zcLbWi8)e>KxqQ)`jocK>^>m0no|2wiY`oKq;la}l?mQ=cKi>neaTaka6j~96WPR`#
zk(-BoM1!`g_&TSkT{VMRdwOo`Eg_8R>e=1hLDp>|tjehtm8!K}^sU8CEBMTwgKTTH
z9pyfeBXa_Rs+Fqv40kbv@L?`twB8W9*GBB1uN|L@hk}27a)rTg?X9v%$Yp1wxzotL
z6nWS5;R^n0shD@?JV|Sc*n;L2)A?YUctvrhPyT$lHb;7*UOMv{UP%aRZyv?;ZRaD$
z9HU7rR3_{BM#8L-XGq7ag1l>tO9dIYwCdU%22GxNq@(e<KW+8}J;I(2!Z0*@tKdmy
z6OCwb`GI5Sj4Rkw5A<z1c}E6ktX(JBG`9Tq82w!SN<eiY0fh2akEH05`HlH^nnhrW
znzpB-XB=OS5v+?E<0<pWSbnoIVrRzkeZO_<^5eLj@ph^iShW9@ycyd%_X?GyP9EIh
zJI{S?MLPG8q5kLhalskuUxC(zV$XfFxGThDH&yhH{)C@OhVF0~zvmCP1`bI&@Ioo7
zC5Kx#J~BTxnGk3G9%nD#Br{W!P&2yFGfDcA2c%l~sbb}!H)x>-k7>{xdeP<&b&2jl
z6+Rtsb%AS@#xc4Auiw(#UJ~qPK9EVY*q2&=*Q=r_HKRDCD@7=vAwooOPtOXz5@BV`
zk<AKuVD41wWda7C!b)?ns2Fy-iCWz3^JK)L5W?gjWh<{^(|DK(p^`T0zvY}60m^5&
z>5JAtaLU*tQz%+Tp>_D);Qe5oSb=1zHxAgCIsMTq?bn!f1E{~9b6q&+uCCmw9k+BL
zn=;?{UIBl-FRROKt@h9ZtENP8@>~E}@==?)j^7K)eB&~M>VD=C(Iu#{RmrChCV)7u
z)bu&hu}1=&=l|(+R`MLKs-|-tRHXl>+)EcnOE;&d5<`3*lz9K&Yaa(qmV=5-RN^}(
zN%cM7cE6^HS7+le(=C>QB|_ZBnk?5vR=$d{P}2vhXYo$882LdDOi!&maSltLDx^m+
z<3G13+B`BEDP>$P7EI9Q(sPD#)m3b*Q^sNEy-Dfhed2h6GiE3_gij{}TY*_yPQmN1
z39HRsyD53H35A(Oo7QZ&eI4X&0@>@h{;WMer3DRu6BSbVQ(K8_J%dg{EJ<>JO141p
za*BLCqn6oz@-gcf%@5YVoAA+5LePn!+42)pg<4EFgL??H1lr_g<hRHjT9sVeX_EED
z!j&=~m;;IShh+$cFLjtZwXGYB99?3SD+LB}K0%R@l{fZtDR}vT?V2C_${5xnlWbm;
zHAg>7bFV6V?vZ|W9%%mlUTg1F5<-<3_ih>m-R>^gSLctXB>IzpdEWXh2SSx%s>mn1
zdMto+KCxLn=5ow6dtFtgOqCF~XSd2i8JM$~GKtP9e&QPo)-|wDs^_jwV_($RtQkIB
z7hV~yCA2l;q$;MCY~Z>_+SF}yC)T)5>m3=48Uqfs=%iz)Sq8f^0)^HZBXJ%WO{|6$
zsYaOokeFhLPRW{tP7(gbpS-9bu!F31z6DoloO+|g$Q87_0?VNV5{^d|8&}(UJ|K#X
z&Q(|SYoF<iNBV7|_qL5ArBHu9Zfji_x9)a?euklVOvy_cF@}4|=lh}S&RSav_<)Ox
zHv+B8Mmp0iDg~zXlU9~+aXcsWQtcR=SjV#-G`;3SN7dPOf>K_^#&VOp@~BZEaF#w`
zbszGij;*~V^R8)mMVI+yk6cmt+=IOUvrEEclcJOm7CaZC(EwV`uG(j5a5uce?>0^%
zdXLJ~>wi2QOm%O3{DY<n0ZcZ(gPT9>NO=EG1&VKdRm}$=r98&g0W5TviZ3UH`2nWw
zUdyxehkw(YIdgjf(&_j^<0P7t?8ijLLTHE_n-XM|;9+q1Vy`V*sY*e;aeV=harndg
zW!Rwl-QraJ@af93LWL+UC*dro+d(zdO$O%YPQG8=2UI@cSN5*lG^)rbwu<CC25oaf
zgp*WegMiPA75oS4;2UEv6=vx0g=&iHNYL#vsOEXeupRWf;`)8-T19JZ8%tbGTmTet
zVul3GZXYzTU5+8@5}ERz+uhN?r*~6Z#gne0KpQg;%tI$Lw2WfjW|*T_J`BXggxjt?
z`v7zkk!nxbj9SQu`a!tuaP8zWKB~!4)Gx%L@?<hzzaYxNmFers_{ZB!YF~Sjr-?no
z{=vGq5p?8@9x0dZ3NjI!v?q|?s5yFxt7Q#Hv8_900K>B!%3zOef;$COw#dMo4^$CJ
zIyBWqG0&~vVP5db63Wgbn-y@Ag|(wdJR8zX#pO4c5Y$n)M0R7yQnT{d-2Cg~O?BYs
zW%g&TLnebz4jr<WFnny{g0?)PJ_&X=SJyN9OvUmF!bip`WG7uBfZXKu$D@QgD)M2?
zL#0pX=kOY9R_^8H6k37*jQy$XNOpd}Pi4mZRg{w?dTX9oq>W#i7i7(ZC$YtA(us(i
zmDV93m9ybI=({v{oGgSMH1&GN;z(OZBns?4y*_QzkWr!2aedu+JjQo8Rcd|?ulpx`
z1+`w_Ds(De9W}b*E>-Mml7@bhG#h;$OU`H?6#6B;K-$D5sk*nqttocAjjFXduGRml
zU7Xk><h(fbCE+zCOR-Q!RFDnZ^;{c){`&c<ZN)c}qTVUb=9Ae^Q*{ArE=#|ByB)bf
zV*Nz=;FG8XVoowSnpI|<Ii?4#h<!M^gH^j|6nGpz(NWPq-&ukGvttAJcRpxfAZ2Vz
z_Or3K=4Z|95Q-1$p0V<y25FN>Q#a3*Gk5ym1;(5EtX3&Vu>|J0#zct{3vPz8in%z*
z3IV1<LbfS8#cNP9CDmF~FI6w&_Msz30VCL&F}Ws8n(h^}iiq=`3mdpeh-1m@ka57N
zx+D0@)6-(wL1RK0_=gqf2wt~B1^lyzkIBNJ8NdiTpq1wo<}Y4r>$WWJOIXx0u2e1K
zDZ$WERh^~lLJZQe_UfBm5l_s~H1SKQQv@M4cNC&@H~+EaA;>Kk$d<jR-hS%Q*;>XG
z&$m~mJ5Cu#iezzpu2%(1r5kBN3Dq>w6>KkyT>Yd_pnch?g4&wpg@dK)Y#DTbn%k82
zSv|ofUTAY_P}DFEr*@iFb+z?BLHsLuAW_Ge&!5`rBT7nn@QS47tc>?Z+*iJVf;HZA
z@Bd(RQR6)0)(}G+mQ)H!Tt?o%xGoAUou<j6G+ZU3WHR?eX^y>wO+dQsTGP>u<rr&r
zF>r_KGyGAL3XN7zz+BfgV=lSNkE@okuVQ2-moMrDp|86X9|wi&fS5@Y^Dh?%eBzcB
zaoa|Z9aJ;Vs-R$6`Oj<>DYTZ~NyZjme}ryJ4hLMGu&6~x7?yb$Z|s^ur>)^#GrDpL
zgVjsl&~D4sowcclt6N}#=>j>P*>MS<_%Sdn<IdV;_roA_S0iNGjCEMT#h9-H5$dT@
zvQ^n%C8JEW6`2~7b)w|_+dt)WpPd+*F`ls2?Z>zBXOjnThGND39sF2wk@LMd)Bd;%
zbvi*C6S75G*{nZ>Uz-v3y<3$VLzS+t<Ox8^z}_!U^fH?9i8nvSdT4E-z$xaoQ>ps~
z+0nDb!6J-H+Orb4{L+ER%D;{_g3ICMp<^<Hv0@Pl+o=&jeU&H>Mk|*^6%<FU`H?D9
z><ESu$Q9vpygg3uS<eyrE|ZGle<r#6)dj6b69xo3Qj=y=)|b588aptFS(DhXAw=W5
zYjqM>fz~@{WmBi;GO^|_Q-P4H1k)(Cw(@R!zFVOtvD=A|PC)eOg^4%dp=Ixbe}qPd
z1d6<~a5{|%wyRVXeDlKJP?YZ=R$3EZ_|cEVl(xdT4~l}$pTn8SR>^Xes;jNm-Qr@Q
z15miBlFxN|xk&niJxs5kly=vP)}-*lx#IEI(gE_?mn$*4=IhUHDpso6$_HS~#hK91
ziZ7(1<k04>-A1zwp{%l{5j*qcj9h{L+x>xi=k$}FeFZGu;YHRX;;LZq-jf;-+@Ix`
zklsG&x`0TPm%trNI25`Vwc)m_HZX=5{+gLUye2-H#;b4wh0E1dtQ1JcajO;hgi`||
z&Ox@MeQ%j6;RperPSl(cx94M_?^1r?UnpE#Yg{f^UAKs5UMXjojZv>vM^8384*6z|
z;Jwhk2?BBiM~x5G*sSgOzyfE|=$LA{Ey5SjN6rx$Jj3|70oq|n&2wD1vQtKB1Chi?
zHnw3~llQB4if}F|l0~%*-sL)43);A%bY8QQWi=B=PScHQ&lXNI9mrHUYRoFRfhy8;
z%EXM%NB7NhHXsQAqJ5gkVSaxSynnD2*fm}UBb5EXWSKPDVSx=d$Vujvi?hN+I~`*B
zNR;Uj8?Y|#N#LbrWFCgQ7?&s)^~FLtPmoM{-l>2k+^ho0lL!8uogITF!m|shhnynE
zo!(4KVO{5rvwp-4*8SqVuSN@P&resL8=}0VR27VNeUZE(|AXNAJMzaf;jns2?OmCQ
zHm<?f8>h>|IxiKzN#yPF(U+kX<iSklvQ>3<KAs0)wnfEi|19?|OpxtMuk(Ra6lw2l
zEr4uD1e8P$u+1OdDR_Ju8UzZ4#xg1{h3|Dz$pbm?^O|B0KHs3F)NLsh-~U$`_qYzH
z=Api0`FmM}ug;qf1BZDY!pqq(_SB2rmr6X|3@EK>2pIy0m=X43S|{sVc6H{A1S<gQ
z&kM8&136L{m0;04>l5Bxl*x>JQ~r$9pDeU6c^x#Y2Rr^Ov|>(2n+=1^O+Ik)rFL;8
z=nFf3y{FX6w}V29mhxnaz~$K}#vOVzou@VbeAR4+0B7@z+iK9-mcqM~z41|6Z&2d>
zr8P*^nkW1HA1$$<q1n+1NkOA>v4a4@&ZqkH%BXGVdclMX7k`|UzbTtjc{*^;Ub8>E
z!@O$V4%iy#aI{y#7<a@yHh;08w+|3fd+ueQ6Bs|X=ZboZ5c3W*4CEHL^KUllU!IK^
zo1A2I0CLG`diN!-usnon?%@#T659?lo^hE=PW3Y5T}b%w$!uRHzt9Ofs2)dAp**h9
zf3Sg<_|q{j_H?RG!$##@SNCOS!p)G;#pM`4g%auIN=<uS(8sgu;ZdQ0MBACduOlPy
zvg*&j%-;U6Ifu$qvmj|)y(w%+dbbc^oOrA5;j;&gUzeWhrh2hbzplQ##P8zwlyU9C
zKQ*R7Xam<KuV}T2FZ@^VddZh(Ipk2pm+3$PC6ub_<p0@hs$txfKb>?6+g19(r`#fW
z9pZmk-6HeLUq)HlOy3@m=KjR!jngwv5UOu;KqBs5SVl7d+T3~J#oMp`rFsW$Ej(+$
zejV2sN2&>@a|=OWdQ~I>yG`(dW#fgi*$IcGS**D?pSE)6UXdw1prwpE+iA0Y_^+bZ
zjxw9q6S}CDXMDQ$A+JG5M#n9>%Y~ihg`aj3plf0v1v#32jX)0tXn!(e<7D1E(Arqi
z2cl#NM^<J(T(&%4tjb;T$H3$G42qAaQ(W0ygWHTn=|7?ZTAf_a;WXT_E4VJF42!%D
z)yS_+FPwA%(8#;ueA0r-!ZRbsW*QJ<wU)+AxShIlk6w(f)Cl@VaX4wu>LA?NBdOPs
zcx#`4e}?Vrz`F+_ca=tk=6uQ%AueLl&PiJyXK>k~bp9~ot5&iNDzoeEym(djy%#dv
z<9XseS8#VPFA0Sj{?r-kd5cOrGFJ=d|7ma!&~*r`x1s0-RYOAUy~L-3It*`D=8Kt_
z{YxdVnJa7_r_4LBcKcu}{i#A@zujHrG*Jkz&wq(wcBb(@Nq2cxgmGa-{ruEqzQXx)
z<BoL?2d4UBjnbH((pc>jFNioI*8F&mIkB2D|Bak{?@ng3eSui!w*aH}8(V*5no(49
z$lwuu%8Q<~%7A0a_EgNnlFb~i&uAww$I=icYchSV04en%2nqTMN<&jgTzBd5aiPYC
zk%AbYx@~giUV4P4b$a*op%0k`kv@p9ZWJQN#<tO1B%HEzk+0PFlm$6c_<bXuaScK3
zlMwt}@ea;g8{8n<-}Sh4p9&?>4Ma@%CG*FPwH8h#_{0hYQ9XE1&Gt;DVrQ_5bGiP0
zY&G1BpPwEcXtwSPOk@vz3lVmB<A-S9p)W;<Y{zxHlq+;aM3sx~TNp68%=_LkhLS4M
zMs~ubz32;&()g;pT)jfe^EpMUQ~mM)+_yZMYE6mJhue+Hl?$(*T{(U*!ovIQ9K!HH
zh0?!%|LhVrvrrtU0#5B&D8{F5yh`w59hrKmB)dC`%}wuQxo(W3cjTc%vNWyKs00m=
zW3?8LA@qGXvk)8thjgS@9ALknOclPo_%P@D)-g}v4%SbghjY$~M_GPW&VA*@nG+NA
zG*OdzmuuZXfXJVf7vS{y#-#?!wnpzAqxBPTT2z@Y{Bs7FiA)u5Y0fT{JWV)@l8U7(
zdz3pERvJ5hiur4KJZ=w)o?)*a{bhPDyU{>3O+Z;!@gC+}i$6ZWUy<CvyjdNgHhV&q
zG6@idnc|&ogmr`|jq#d3>a?v)bS(&0AL0p+<7>Y*I>981lOtP8d3FH$c690-WK17q
zEOQB&r%XW*aagzQjQU}=hXcIRfO4m)Xjd5Dd0z-8lA(=KTc|!o=fu{sdeha1&p&1(
zGCbY`BjmoFZ^2Q%(eY&`l3jCZXm79*9IumE`Ff=_x_DxCPaX$(AdN_*x=v-vkT1v7
zS}1UX3&(S|7MD&4AfBv>PVBP$CnJP-E&Gc5hVjXbqC_G*OHs5=VRRb_yJ_dhiMZ=J
zyx6Q7rh(SaACT~Ip@ZLJg9+c+X_~Hk_>dlOO{Hob^S4b;Gc^z#=g$mxEhZlQDWKek
zFh?D}^ZSd4i}B0$W9FLrkf3|{RX%eb{P~~#e9F6GK^f_eMGBMJg(Q+R(I5QVpikJD
zt10YgMf#k;m%Yzyp;3ToF??|}80|CIsmg8wRPqh9PUEL?&23Cdr?TsOj+gqhYYFPq
z`m-?iq#W~BVA$tJeR~+wHYdN!cwxNdQ&CE!D^Ali{d^oFx}d$3GFzCHMh=?2&hGI#
z6FxN<$E)Jw>;jS*cQVz>1b85X1FHg#s7&WVt{UO;Y#Yh=vOJR#zD6r5G;{#&i)5SJ
zt&G|YUexE#u7(bthAff9b~mb9dAt=;={_^k*i??|Pj@*lC=R(o)q*}sl8&b!ruVE%
zjD+`<BBy}~;*GMar->KTC(0LulbZ|3ACx_5sO*8IQ#CV*uQB4Gx8M*(*&=~oO7}r4
z;iWG2R+;K@Njo9cDQS<J8%nfdEi!a{NF&Q5{iF0ee_aRmINq}nQ|6Xpc$MyroQW^$
zQ1HR}j3%Ms$*F)gH;b=z{&F~ytMur&V*=ibvcPFjk#{ywS28I)L7-`JUXhW=vLKv>
z6GLHbGg5-@=-`wufZ0|Yh?bv(oK@BQoiI%P&C<mi-(KeBx43g>fS35l;`QXOMAled
z0_PEYMY)Qmfj)MyS--1`Xgc+E^EGbr5eFg{?QUiE6U932+sEr}I_dcPiqQs!)#P1{
z$%Yqr0jVM>n!WhS+v=U-da1;Pf!NCwp8;FU;UdeM*RJ@9zX|$64vVRN*jVTpBR96?
zm9F*{wG;C)&e)X2>87Mk&nDe+QAZS<H>0&^V`$44@Vn^z6B6ND?`ZTj+CpYylen<X
zS00!rVpDv3Js(n%<yKPc8$mfDX{cBf5=0ZbmMC%+DSB-dZ=CsFLTFapAqM{DOC3)J
zie`2dGV(#IBjB^$SrUFKD<#=M(z(NJN3!_VC(_Y<mNA+t)iSudm8#;T3|*?D`;5#e
zh?<uGkXJJxQ}z)jcZ!hc&>tOTsWz(sv1xN5QnkVbw{CvC(FaOs2*?3SG<Gv28pI&w
zoeyINGI?&kqxrAQ!6N}#2--`3^KI41^&De_0d!Q!9L&Vbynaj8%9c>wo=>x$QriQ;
zozUk&vz&%0prteU;QKKD__L!hj}W0l%A1|qo+$?k;jX}7%N8F`u7RuX73eiP*l;)$
z^qOz@jQ;fX2x)}0aA@vt90mpl;OnOckgrehdSh;Sg<YDW7w(7#=+-d>wOfJyZ~!JW
zz1EkQ&D&3Pa2H=Olxwb^HlW`8@Z4RVM=u(vZ;;n9-VCalh-FL`srnJ1Z3zWx8Ta#E
zcwjVcr~St^CO-<xm%6r1(e;N({AeA{W*@qem+~YmquK+*=uc%U5uHqx-(zytnY@gj
zw@ZzB)erB%`Jf#5eI_ZG&Pbu+cMWbH89mV6=!AzxsR1UdnsE_SZq?yJm}iyNgpBh|
z@B2TkgbcD0BC)yD|Jvl{06Yy4OPKCKR>Eidn{)e(?s^tk<28Y(^ub~Z^E@;qQ-10>
z#$d3|$b~{&4|MY6fuapPGW!zsy{0MAv0EDoaCSi8f0c+7MygCn&=U0y6fs$Oc=<0^
z=D*w*@Shvb-2r>a^NF+dUoF)iD-o(u>20DyCn!^yA3{%4A{G5;2cmO>beq~vv{r*?
zUc_VbkAeye-E@@v$G<>tY>3-ejVcHjbnRxX`8_2$zMDS#fmcG-34W}o9$@G<spHOh
znhv+dn7hJh&8&Ctp!lr^6vDJP6OhzgDv)?2<M0zzlV{37up(REr!@Z!d2^!AP!xw#
zR2usDfSrluw8?*a`!6-t_XR;xz4DP@FJHseX}2sl#g50j3gy#Pt=e{&J@J^^xAk29
zw`1@pi3Ftce&vh&Z&LCplE_kNAxkCf&yx3R<MP(h(|fr0!Ytk%*lKzElH}o2@<PH+
z>1iGRBX#S1f1TDnge<{eFBQXY9?XeKJ4uzt5+;;Na!|DX?OVRTSCNH??t}?-t{jzE
z{mDsv`}vK_$b??PP{Js=ul=-;zmDSD5BQ$I+8W$3{EfpVmmArkRAh&OY@Zq<%vAr!
zf8YE!d1*M1rV~bOs#^!lbQ2j$DGa6eM%ST#)oT9FkAff_ykf*FmaRW+{`zfIY++Tj
z$X1Eo|6?Q`64KCV-m4hEJ^dT$!*1kLN^Ia$!oF<FJiB$MzwET9GAwSw$D4Pyeph>f
z2W>|R(LB@xgNdZg-P+^%i-j8Ph6!oCRfzi`Y4Gm?^5r0(!i0RvMYcnBTM@p9(f|9q
z?D7_H$cYL1lE01ElJcB#sv{U~=fwG~ZJ0kC!REA*5c%;AyLU<7+3o)O{G*4E%c}ug
zR>P2I?5+QP@PGa3J``kmo;(WtWv#v$<13hu2@7(DUL6V8T9Wy1F36wmX@K<y1?;um
zN|_UVYX|I52eQwppNACwKe+HjVMdN8xPLkk-<>eL50g}Ti;OAr1G%!rep$+22Let(
z6+#Jv(HrvgTh}&49SpZ)2Qs0@^qeYNX()bKT@!7XkYCg`KDJ-BADH3zkO|#KhGP6)
zap(UYiZyWGVD{QB{!qL5vHlXY2VsZ!>yS(34t2=bPnNNDI@>7uPe@ee`|K5v*~%Xi
zorMf#v;>CY7cW!v<HLWov>%`62gvjMEblYF&4&rO-}pOVDCwTt<qmFjJU{P+CnN9+
z<$JTLhyF%)qeKH<dvPLRcbCBEem(U69*Z&XLdht-$lhvlNeYO6n(qhy#DqF(^gqQh
znkiwM^F6$79NhXTM&`(;pb#%NCdM_jb;7^yXLLE7XTsUq-zn|)?S>gK7Q*80r$6|=
z=c5AbHu)d-9_iS+L+nqG(_D-gi-xFT`|e-A`xk=)=YI^Wf0Q%pKbprMJ9&r!wkZ8G
zEH2~8k;_}n`j`28?m_q~zPyPs**aw9Cy0M4NBmRXG1TN%ll<{ro2K|bo`NtG%s321
zwf_Cit>5vh9Up~)f7n0UFZ2I0LRf<&17wGoksUG-i*5g(8e2&iSd~22HRIm^fXPUp
zKw}M_MJXnJ-~V0}gMDy=>=~aruw@54gHAzoX%dWFX084grng?+zig2S5?)RpGu8Z|
zw)bQD60Z?ku^U3HpGlDFe+LSD*+`_kGr?i&h)s|yzC#spPmKPenEx5GXd>vSAV+Ou
zhOG`rh6^UtlZ;F#&etR2f4l8CgjMp|?Z>~}tEz~<owkRyH6@xw_y3sauST-zS|o^I
zap`3J8?;-u*~kvr=4;3{8;El&|FV`_e^(+p5;=&wYYl$;uJdSEm%Ml2pdx0g4sD(9
zFTXBf3zu1X#>h3yRyX!O4zd0Ri1nYMX9(On;a|tbDG3{W^hVmhQX>D_bv3dsrpS4&
zZgAKNWck&$*h^qSInHKDKck<%jaG#NdC_FT7HRSO20Z?slu*0gft#z5c(v8DZ1enx
z3`MILh7!**7<#^Tfb0<Ix>T*bI=mWX_Vs0vfT8ZhwE7P=yw-z8xEiyV84PB^TdS8#
zx*#v|Y;KnB*?egW>Z82Iom1Tc&Wn9t21|?PK}W?=_3&ElkDEj0bn{0|jW7@)lIa!b
zEO+hwg7#gU4$GiyC_SAa6}r4F(|OaBDLpkSSkKrTfOz6W)q}0(y^m81*+);9c33^B
z>Z!2vz0U!QQG#P#1(&0Pe!PFPPiGqKE9_svO`FxyiS$rLXx+y?q)Tf7MU8uHhV{9?
z?$q7Ku3YzHaNP%unE%2+&Q4E9*ghNRm<^F%-;d*<+i~xEs2wU19ghxpDS4wZ|JcdS
z-%hw^EaIaB5i51cc1EwX_=t*o>6*+Nt8Z?<#3`ztJY$SAX~L+)V&Kmg#8kQX1evHi
zN{RK+!96QOS>MCx2KHtUy#m6g9NX#EqN9rgmr6c6#aU^eVfbbjo;3%I9^p7fHTP%o
zs6GB2Hy<61L|asF`t8JUhJ%ecrfea``r;ud_v1?6ZCsw8(v)X#z`rl+1y6}lSW2>W
zX)LIB<gq2(F3`v+WPQ|oelzNn;NJxel>?091JynG7%jREnKTX@$0Kg;O`j5NvP1JN
z@kV^t4zsfi`oBH6_q|7g6BOdj$n^_jOGS2{P;F)_0pg=YwkCrg1vGNJ(sS-=X&HYI
z$bWYwJzcUSh;*^tk<O4}^K2eH@QOdN@suq2LybGCX(0SOPS?>es3BY@Sgq<Di&pOk
zXPZ1*)s%Aiy0mU<v#+1eBt+fyr=Rpr(El>u#?o6*0LfO(uxOkvkN)@I!!zMvvmxjF
z*!n%|vHCnV!=`*T!^X#A=sD9CXjA|Q%}i&EtBAXm%57_uB7^UvTi=dUd!_`Bc0fD+
z3!uaUn0o&`!#_NRgg>(4F=3tR$M*_$E&!<C3@Hj?f+w@oWsmY$UH{Z`(IO(0bg;f(
zBri)xa8^$Q)85jfY9ZyoGxx0J)TV)(&4}jsO05}5qC@X18SK0`0EeZ!o7yHd<yrb$
zZUEp*Hb3rbwj^}EX_B#@z6+%LG?aO|93kJ`yQjh7U1Ew^kSy656?2<jOzVRyeZi2^
zy??GTCZ#;%!ErRW-BS4OShyICjBy+c+t;!wK&0$r)(<_1|7La-F=Z<A9xBuR!cNNk
zC|8jt*>Wor-KIRP#VI}a$=>c_yFWf0h>*Cw`G1~W_B6gom_i3MW!|x9`j{NylwI~E
z(>#AFwtFM!shiJoFS|DLY*D@v-alWWAS2-!&-U;B_nw->ryjNh*_@DzZshFj)MTe@
z9ll-N`IxZvNMaGIm6YFi?b(hq%?C21nEn7k@8eEpzrPk^kWHwODFFa1PP1|mTW~uk
zE2_RxNOEx?J7>BrQNQtm!S~C8y_eEnY~wZEQ2~y`=g3KD6fZPw%;s)%A+6I3n5xbY
zZ-DC9!$?yR!>r<egDsj}w<83qAkh&yZ{)jo8uO3$;rALr)kia=vK^F@4sOmTkXCt~
zcw;m@qJoN|cbW0_Z`Y;-3URk#CB}!-Y)3R{x&~HT1MCPnMVF7g%_E8yb!`G2J@@Q7
z;cZ60gfZ-Oou6{EGU!=2Dscan`95Du%ud-;Dc^5Q6xH)9JpCp1Ss6OntH?+u9W%SX
zf5KB5<q_fy$ukg2C_kItdW}i2({wzJ?cAO(UZ0dxb#C>|SpDi5;fwiG-EaH{^Q8Hj
zc6{F-<*3U0l8L>U1%}rcEO0ebH6w?!se}t22i?Da1#K33X<~J}_%?B}z34Shu0%na
z@;^@Btw;j3<J89a4ui&}KYOwR^RiC{sds4>n6vQIecXZL&=5M%zImm1+EArTIGykd
z0{M2ye=cmj&y%d+?q~1{vqRyEt<o3toLA>BPS4!A`1)e3bE1IVw8u<mp3>r5L4}hc
zKMwhG$~J?}?tj$evd&z@Un9&E-9O!nl}j`dJ9|(mQHI{_x|5s53RDNPs}F0P*fnU0
zdLF2M6}9=rNdc8|;vL;_7UdWH`kUbvAawFOqbEn5-mx67**x&M+@2=ItT!b=8ky<w
z%ikCl{b(VCJJOd++X>^{VMbr#^4L}6zPZiyW2G2FLV>ZJyO?ka=Z}Ygyy6gfgKShF
ziV`m@HX`NQjac<do8#Kg-d-7V4im9=+vngpqmwQjJVoUh*5kdtX-~}ub^!Z{vH0x}
zMt+dM5_ogin9+YM=fWG}4ORag#Lb0Zcl9(WV!inq;9_m^aeKC2qbAyLi&hUM=wx>K
znI6|$?fgr~Ze=LBrMo%V^=!#BFRg|p_Q{Xi6gWjMq^_d*x(ym52Tl8msO@s#%CEak
zFldOxAihaC3b=>5pG$L_y!rdT|0JPfdGsssoyF@WbbH)2MvY40T#KlXPAk;&5XsBe
zHdox}kf%u@>&?_pFwEz1;i3DQ8-{?itQwJ2Sna^N-3P#P4o`m9UH%q3re7Z$hmiXv
zedNa!oL8;Id-{3nXFJRZwjw=I_A}Z~{eN&YM}ORr;bQ5tZnzMjkWN~YG3>QSomx;8
zx9!;zCT#1ZTp=4F(sPB@=E>N<b~JhT)moKun2<jCn?Fd?!cDo5D~UIVQTn-?ah|6l
zr3OSQDjN^jPU~r9C||^q>Mu5RWt7Z>Dm@wT7inySu95Kj^(SZ%yj*?_lj&#C!n$)M
zT|;lYtb+nWi<X9;O!K-gOXtGL=r;o)gU+mxCbr0gyeK2;-3Mi|0{-gH-t|j3$ccpI
znjbd(+?C43wBCen<`Dxa)mkFK#MSA3B6Ud8-S1x6L!yi-(%m#)$87_8TFAtY)6;3|
zC7mUuxq@pmt7imEJJXW7ycws=LHg?NU*;`j9V9~@e3^6{R0A@vG0w0y2$JB`Hn{HS
z`d;Di<9$XX{F4hoWx~ns_oE2AT4#a9V0anlxZ@}9!(-g~r!<B@(Xo!UYmtC!^4ZH0
zT6)<tUYa}W>X9TO8!K@8O@r$Ar`X)Zkzlqc^T)35NFPMMJDp7zB7X~s^CH9S-e?MD
zczaBLQj^KL`2v4kTaB&AgQvhD%qVjAcdJfv^OQT?kVAnZ@8iEW=iSpoti5--`GRrl
zy)Y3AGV%TJ6CN{6?*r5Umh-2+n;iuuggiMn2VL0m;xJ+P`AfsJ*XA2gaD=ScC>FoR
zKO?mF)}2o9z{}D2roaQC4#v!~(I72E4)KXH=uMp#0riO3<%Gx^XI~Zr4y6|`Y>`Uq
z2+tT4Cju-rG*>@#Up7lPv$((aWX_Lx;oIX!;wJdDj>nr<EKtdnM3KrGLIk4-GZp9V
zvGnAHR(PEGF*zqs4eLp>ruoxS(?*Bysm-D=pNz_jPD3Y@Rw^yoS~B3|;XKv!LRKr*
z@A6fUTwF;5V!sN%&{hb!16ZG2|Nk*HM38(MpvI4sLrV(!bFU-=KrL|^CZkZIs$;9d
ze9_=3Fvp$K4(fD^WjS%1uUhPYUELqQ_?74+53w6oUJwe!Z0=d3Vbd(?IxBr-NJOTe
zh}aK#t>{mb8g5PYf^OPpAxe4`cJJx;7a`9L_PW_+jSMYXVJah<O><~CCr>-OoZ;7B
zY?ljCis}#=SGliT$VuoA4((T`u8uN)f7yhgPcO`!lz#kVM`b>2lOJiJN0BmLxC0jH
zTZPBVV%uUSxRF0xh6|N4&%DLTWYObTzq|AwS5^@vIcn)!eR_vk9m-doely}W0S;U(
z8L215n=h>93sl-&Re9&6(J3Du^oJkT|Gor9g%Uia_!5BwnV6;J)})i7#CD~8Kq2F&
zUKdHG3I#rDu$dj`hX8_!2QyQA%3IOC7b92#M3S$C6aM@sHwr|Mx&db0#wo_lVa(>&
z64cIh`|{65BYzMH%W9CP+Jc_e!PDY?--5rSn_!>(j$Oulo9h*F!14~g+8N4x*@xd_
zr(Jx35<yt0)(e)H6MBS4<-mqu*T9dvDlO1s#32HtB-6m9kf~)+)-eO%q&8vrTOl2r
zSf8r4Rkcw+aA0;L^i81Q9d%|`^0SGQ)C?0~(98l+N-e;hy|#UE3d&K}N`P~78Y=Vx
zfqC5qVcn`)nERl{9*+S`no!s~$y5Y@<qE~N7GZ?5ln2VY2?G{UE?;i~IKFlYAo-bo
zf&-V*fVeRH4tS);odI&d-de}%G=6*)I4d!LL@-d#?<oZ}(O$sOSs+q0w$nZQJ!YW(
zjOgh0LW?A3sM53LflL~-kLLqeQmRgw6sV>v6pDKXhHMJmV%hNJHPB<n0%jDJp8b(4
zA9!MWKl!q;E*=TXxlDEOW=uOGbee|$MidC0y=UHu!gHZn3ezSwQiUS*9qepElM5==
z8-ieZmI|$IG*o8zhA=}wTo#rsv`PyY)W3SKt_tk~=0<%57HD@hDv}i_uf6ieLx+z6
zNIlW6t7;m@e_2D=^3v6?x{jlnza|cDD1qx!Nq{FV2un6tKmDHJeE%G>HQX$8liy#I
z7@ERNUsDu?*6BBMTu1qTZ~^?NvW4DaufuT|A1wrvBwn=utU|bD{KIsbJ6uyK9w`t#
zTsXPsp-DHwiidPq$Tp>ui$hhTANaD^{mr}A{la{1n`{p4xkC2YtShv`6ul1EEE=yA
zS(^7CD%c|ibR|N^H3}jh#!fP*T*h6gx=_b`aB*Aewrn3DAMOQ0Qe`7z_$apY>#ZaA
zI<Bm1k3;`~1%Q~G8imPE-{#ZA6tkyps0+2-e51yq=IzN4B+KM4G<Ku}_;9URdw`($
zt@Ru9C7_GY0tVH$*KV#pqBdjDE{AoUf<9a4f#uJ^sS`*i#~v2@@#f=BoW^V|UR0+J
z^(}61q*B%YVf)`N6AL7VL;-ml9*SP4D0#ELH{I|z&h52r3aHIPY$8$VjnY;E%8A`S
zd_%J`rA9gH&AQ6Ge>~DpGtqaY;5s{0wHgj7E>IKq37hv7TK@Ak4b)c?H!O#9AI1Xd
zB2C@A+9kmGJ>GeH-L~H**&|&G+qDE*Z+RU4m;Nve1OmuGRkSNH{C>58wt9X!MK8tn
zou7#gVYwA>G<ijL!s|}fsc<}d<u65*A&~lIS?nUv$Z_bM#mWfww=-xwZ~<Dtkf(j}
zQTgM?RC(V)8945&&#yCnmV#ue<RK9d<bg>!ebjq1c6@dmyv0%BBg&hldQT<>@D@0i
z|95Xuvps)6Qs~8G`XV$`6hJRoFZ4x(&%X*&$h3lp#a!Un*;lF0?m-><tt0V3NvEdi
zXqr;vZ6=Cdew=n2l=+#bzje}ss%EiKQ(nu*irYzkG^1kRb{I%{&JaCz100Q&_d>YZ
z5l3KM5(;1e?Wcqhr3v{c`IJQ~a1K4-RamFb`FW(%^jg)jOanot-$x#S<Gzs1X=eo8
zSIfMW{QCeKDuB+Q*sctRpW4O1g(nptE3s{JCCcPD1vcNz>?4p^yXfYT^c~mE&pz~)
zH6t0QEO-3t(z!gj(E)Myhk9=OKb*aJIMn^yK7QwJC8-pZqEwcU7E5-K3RxnA7?Rys
z5@i^Yt+G`@A(HIIK4V|97Fn{)U@TGAF%iZx48QAL-OuxUp3n0fzvuYgf89q%G4J=h
zUe|J7=XIXdM0OF5+yS6VIDjPbj@mq-tlURnxa{r@da&dEXY^iT0^}g#qrq>q0Esb#
z0e533HY-FplQ!LZ{#I0B1$Qx!^{%aQ$zclLfGDN;Gm_~0{)bf9^>lzu=0w5In8qXb
zmsR{bA>QPH(_LU^08<V)=@y`2cM`&0PA^hg8Z^L*wLn-Q;qvs4@t7$=-SG1DTu3Bj
zSnt>`Vg%PE3lzVB%CyPCN81pX$yI_kF^C#6O!oK7Wm*2xF9%&@BmLG(iP{-8AEY&*
zF!N7O?HR5O8sC>Hp#aOyU-Ao?2vY}(AU+X3pKI<xZO{$KcA2=EK})=-RK0SqQFf_~
zKv$GJmhNvFe7ZEv<lYw*cUV~Rr>t)1nw5Z4*E;WiCCR|d>jpAt3P4~_0NbTX1pd%W
zb|U^BUoR&9nJ{+2z|gbUiapnD?|&2w>6`Pt<X%Mi+8^I!tW~I8y$BZN1xSf)+<8r|
z@>Ki8QenpK2@t_W!`%rZ>Q%dSrCtA0UQ@tqKV|g|q+?%mrXhlT)3A~JglN!~1o9W5
zW8&8}s~5owwGi@~Y`^9z9U6{E&Mv)~G^o-YiZylGGMG!^L0EnG8$IDstoK0SHS;g<
zh3H0@i>4<}WzbBqG(8HaWb!4Mr@nD#_N;MZS%+NJi|`?>YJd9gV81pzrWW{KI|H*9
zk=;IUSI-c(%=2)?BTuF3?cRV8sY-JPb5BM!((?e38fy=P#~bUgu;ftva1*i&e5F||
z@!>ouwj4gKZr9wv<>Vk*KC9FvG>1T$nOXU2gL&L%Z(lk<*u^s9^Iyw_hl)>;dVzPK
zuz|i>7b-3X)}yh~)JEqv!_uD-94b+@61Mo~cmH(U)xuDC{b&f6(G>X^(~SQIcEJlj
z8(mrxCgGym4)*<aI8f|k!q3LfAXh@h^97s{)kPo>%@OGyI>YJ#`izU4$OG==7Sz5)
zZc31I_i^gU=v%iV__YYYE52ZD(y|5{vBX5>AR7;$mHtS9%{f6u%2G;Z{H<>lsi6KC
zB!!NXKpXXxWeIhL0?o!A-B&0mV<z)p)=XyNtzZAx@B@f`c!-2z)`sQ$MBs0I+*cR*
z2E%?@EURb`;|?`O5F3AhPWQJTP){YbSayR>u#G9ZbQGv7J&8&_n5&oAnW|L;B(@$?
z?-k3{HlKBipMzclVc<0WIgNklZr?lV`eIR)3ibZz@<o%PkpC8010QZIrT$`)tq-l)
zKG6MVdMlO#`FV_HJ@e;lFdM7kZsq;o>qJ^>^!tZY*xy5gr|S~(0_Ez~$0Vyh8JpUD
zKysYt_vcrH1%(gJi0fG<@6Xjc>ITGcscu&giMT_?+egp8vg%TI^77Exy#(CTLT)+C
zOFe_g%-Kw(w~@OL@7p6jYd_6JKlGszKg{S!ev;zO)sq6isEra@e3prD4l(qt@$sH5
z)i&;O&BtgHwH=MKD;AAprqYt`K9!w(A5nuH6Tb7W-b?>UA+cZl`Wi0sg$jY+9Bgn~
zfQ#IJEK%wA3+ReNE^^@iev!ol&19UvD#`%Et^)5J?*-af4rFvu3-bKjp3~;YDwtq@
zX{$8ld)AL_$^(DH(%>6V@<(V&)N_Y~{_2B{1ismyM>C={UY+@%f73i5|8IhIoJ-&v
z$jE(#?}mZ>oO;CL`*S_6+&AZ~HGBS^0oJLZdl`j2w*uCe=ahz-`Gnqn{$~#G`-8t1
zfiC+L2}VWW6uang+2i*g-%){i&VM2-Z{3kb03P{&jZ-fkQXzYznd|6Cbz}ic<|S1E
zK*OdI3Y2$A)$wV?JFtkxkz+NW{r?PKGMA(Z>=&srx9;MS5KfIA{F807x?KZdU||I8
z*5-^%iEC5l`1>=1Pb^nuq{m)aI7Dbj<bj}3D}9klQFwX20u(aHfH2frjxN#<Ir*&J
zoQBmMcStSYr>%htd;Mx@9OD)!%euo#_V<^Gj5x2kPrs^Q*gUX8c3AFm=V$?h>chx1
z0Z(<QQABdtedGy0boKx3DEy*FMg6W*LtTUaz;_?tA$2PE{;A*GEk*PWq)rt_>eT<a
zHWk{@!?)!Q$=FHGlh$p319L{x^Z@>EiJCY>^m=UbeTbPq%iBj$>vNoCpq7yID5A+l
zQhY!S@>DqM!E<#jfflrPWZ)AzV<2P}K^~AB|A~;}G%pPM+w_8%fhBC--WSVx0@1#o
zPc!boX-|+{MFX+*lSes7VN1ZEBhC^MY8n+5)TEkWRsTd8+>X0Z$!B#nXZ2Q}a7kRQ
zc8Ah9_rVMv76kI}L?a;wyBDbBO=K`%?M0d*X602sjE4Tqr~kTR1Wb}XruCtO-=$|^
z+xe#7+?Jz4$XxI4iL`CM+cvxqlpmT8AL1g+{^^D_PCgq2kY(pBt{pv?cadO^{Th>m
z1>4+;y~5L>3xG8hf&#Bf^M1u6u*%t^Zd-WfRS&4+q9OOK^O8a1y;ji<A}AW_G;=N7
z&#(3tn;p7q)0=2Pk@`lTKnwUJ<x5hK#v5sIhn&7)HjwZwHvxg*;dk%PWOBcf$Cjqc
zIktO&bl`x4SS9pt*L?e-1HaU~PZ6<XhFVA>I7;u_^Bbw}+ntpECb08eJL9q9$3z0c
zD45(=Y&7`gz!1cIu(!aP3@)0sk^}d23oH55z{a`_!nOeOWIQZ1q|A%TdqMw3XjfvX
z=RE(fj3+UKY@_$=*AXLp;OE%#yPkh`9Vuhw&fNG-{PR78G`*xd|9cq=3-%RYSb-*)
z+^4C%QYZlqYJl9AO86t>X85y(0E-b}KH4NB?9^QszCN@W)DUp)%`_18gjI}zcX2N8
z^1wn?-5B1G>tfQuZWXyKL~CGYZ-c=DSS54_6(?@z<YaEmh&GlIoTh^zM-LN=@b0Zw
zav<A3a4`=rE}PC*zwj$tn-Le8bLqzh%2`>2Z89EGfoIK5Nv$pnn|~L4I_AJf{p|*g
z^r{U;4i?s*Ja7V_J;ep4FETrM`6Kh-n~1^iSp8Q@4UkrU-9^Ih7j?E(yy;Js%Yqy;
z=Y45^CN6jp<d}h~|NnZ-wmRU`nev&nqs}`(pjreq4wX#Aq8%D~e7UJc(thS^VwbD+
z%MQst$USne{o<Czn5yL(7SYcXnmc^)`Os*~_>7{WWS9C~5z_3Ltg;VVxlRPCMMzYF
z=smLOp^8bH$WMW?XRmaW>LwB*NDl}viws<6YF0t(DWjofztOD@-^eTT%=|gIHO&83
zNp>NX<Q4=9fdnM;LEtw^>KlS2pq@>M(ti>V3`0GOQ~vh^R4Bj6nAV4Z)o%{g$WoIu
z$(uAAGPpk!eGFs+M8HAXZK})0&`XKD5{{^~tRe|>`g?>{n87ipb=cO(_gVYKLxl1o
zu5l1HOXEy2uG~AVZd4MwXQ4@XjiGl-BnP%gkUt~3+d7$}a)U27k$wN()(3{!b5qU`
ztH?ZHQ=A*r3nEk9;1=?-D9rfnAcoPXzQqAF{xx((YXSn1Ld6~2MwHkJ4*v@pY?F(0
zHb;MVHhx;d%zvPN#Ekkp#w?BFcW4nmfpj*XptHF|3mFeNXig;#reRK9)A&6Wdc5P#
z3g(1<H>Rx=K?=4*YIKW*#eOQX`O=qmJqh-m%Ap1DugKxP`|%hNXv;Pwv4{ZJG@S85
z5XKl3VQz%|=sdx=^mt3KF&LT11J97-)2!Vh6JVyI`IkZSfQCj90*6~D2kvw!7`|D7
z%Led8s#$CvL;zwjAy`mboaffn%7Ts43>qw*&zvp#3T1gA#BT9C>p?J6Zvs)kLq!=a
zug=zH7mqNPK}SRdd*AS=vM2CM$e@DH5qRmFxoMGRo(q(g%%z%f7tWr-fI&$CqIv`v
z(8QM{*P6Pi=Qn+CZb37K{n<5hAxWIL_5L9qBNvvy4;OAmIogLoK_NxtmDuLKmPT?1
zh%%gci-k6i{Pv>XJG5A$;vB-5=R()1c<kDF{`XP)6P8MUm4?4?8yb5k)9)Aj@iFAX
zki*+Eeou=OSy><-9zSYEIgu}^|4hF&<d}l>39ImfuWx=@w0E+h5}DU&(;Bl9*B}4p
zvl_C0oTFVe($5ZsA<14wavbdV)d2vby9(K{Cf=^wVv;vlSchl|J}w-A64os-mU5np
zVga(TuFJsMb^yy7^R`Tr(tCMG*hgTi{EYXp>CB%`)ya4+I_PeH01-|yAT%Nn$z;fG
zhhx$p1}_@m6T$RJm27SMx*zG|1A{nkIbSq}%At0#OgaOHg!?U4oHxy29fCpQ>er;b
zm%aP_qjQ4v_=`uKjvN0pZ-0g*V#wsv^7obPlx-CF6S;+vE8FqqYU=6ZgKr$Ua9>Wo
zsS)@CPVnu9s9q!lQJq)j+rj(03Z*Qr7$qvA(_`FwGppPNQ+?9AAN;-&zE;0qlECkm
zlzjMKfNA&$b_fZ(``+)n!YaSt=9lTDVkknbl-g$Wq3`cDE~mfUP5S9GgiFn~2Sk1`
zJZye4ot_>(q*hH-72CM^p>Oj3==um+*-oYXKgQ6YGll>}nFIeXzxm)c%vUTsbt*Ap
zJBbidt11NTm~RX_lFXdpvEQvUxHg33ZoF~VPSSh$7M=7(=L~YEVT=s@uudD_D0&PU
zF^TZNE&ufx{;FoRvyqWF_V)vqjI&XG13=nn2o9Ol$D<@tfIaQwYSGeXl<&#k|N0IL
z1?6su1N`-5>|pAEJvvc;cm6*l9N)3szm6gI|HE_QKrFSo<Qw|CXJ_r@ojq<Ylq&Mx
z?t!CrzmmOn#IKjEg}h`&ae58juJ>8M{esrj!{{J%*^N%gmvX<M_uap~<E#u?yc;0d
z#!gCqpq&4To^obH`u|FTQPzL@G7&u}+ugW(_snP(`7UXOz|Y@OLDC=3dr$oJ*jDfj
z3vY*KPB|j!R=n66uo}QB>#&-<y;p*oXyx?l@9g;X9j7@~aFjrd#BuU){o82&A*3W?
z0&?}EtpC(>zkW0Ah+%*|o2-+UW_<)E=g5PhI_D!8d`sf(U$yj6KjhgnE+fxAP+U@j
z&kp!I{8kImxFj~#@^>Mq7{P)BXpx<y%P@#~qVsRWPH~{$Esp!ekLGG%HJkS&4d&W!
z9oUPOp2JJlOtO+T@aP^-6N*pWu`d=e&J;@CASK71i?;68`pt2yx_14rCST+*@!*9C
zD=sO!dxPHn@`dr4;VCTLs^Mqhs4+HMK|lfMoLSNl@w|a-Nle#GrSEUh-(GmeSGa1t
zj7uR*R^6P-AT@<sNX(PguIf>yF;(G?XAJHlsbhq5{^B_L?5r;U_zl^mQ>Q$?g-T9?
zB@eRy-VQjZo6PrT$__{=eiNMz4<~lx&k#s?U|`YK-=3UPk=Vk0zGJ_kv+SMWfzPyC
zT&O3{(6`=?BEBPoFex6+O+;oERPcxwdH3ahze~`h(dAl@XLbOTPU*rx$NCa@@bp1_
zdsqUZxhVkvTybOe%wg9ANM?Zv8Wqq~EJ84ikxwvkso#%=lCTi4+IPLvJwLsCjUKe!
zhw~=0QGEWt6PEvC+7I9r<DhV}c`P$qy5QFgpX99p4kqpT!z9058z*JC{GGQAJ+K@c
z`+0YWi=i|q9nkbMdK|sb%(Mj^v1n|AjXM5N(cG8Ed->STv10MdVTWxiJeS-HLbxt|
zMbrX7)tDG{^Y#uIXvVKek`Lqy0wCjc|6AjyZcH^nyO^LogFpSaY<S9Kn%HS@Hzb52
zI7_GGkdX`p*y@`jkXQ*IywP27LPF@|QA#CtweP*^iuoK!$9BWo_nMB%>;<OnH(o17
z4b2zaDk|JHFIkpl>T=y=amtAb_GprNWq8S^UhmdddnCrG*CiO)zEaJ>0rmq=H!AM@
zE%~W<>t=4yO@y}5n-kx)aZAGJW&k@P<}r!6?3c|0Q<3FU4l0wUHip@J9y4_`9(D~e
z@vvMUPfb==wGPel`7zH}g1uV+Vn)liQsxD*n)U5#{~%0+l{QJcf9=iTM0PVT^L#J0
z4fO%XLstupwphuw6wTGM4%X^BJ?}_4=uUo0Hnr+j&SJ_u)J4uxSRN+(pnNR5jHy$U
zbv~mO)DMo*y8~Vw(%#!iY_oLBGH&~B-5+VB%R%)e(kBDl2iEhYy%9A~Hj-W=QoKnF
zdCh0(M`QGk&H@tMhbtO9gg$Fl{THRb#8r$Z;ehnLG%Vm&!?)l3EzQZy3RY1i15iGF
zsYT#u&`;otahkZ~I$#3^i%(&$CR={}-A^d19AIU>KtrOp?p`grmQ~W>xm>RofY?w8
z2df03gGC5uXzex6H2&N$&Fqt=t|f%XLp;tu9&oJ;E|hn_r~xVf&6FZ>z^hM<@a2$6
zze6yW0t}VRMYXfd5!_b<22zfMiJLiwusUZ^7=}?}fYntMv^Eps#yQ^{+db8nehdr<
zf7`d^-oUec^6jT#04zlTbnK~TvxptQ@rwYCoi{3m9oxRj)gN3f=b?rPJ^mXM6bVhb
zZaagYN_Y32-x^(EZ{RI8Y_z|x1Cs{=ccrkSYcjkVgRy5!B!w%<(2Pou$sKHy9r3p6
zfRZ_1!?@$A;jSKUsDdRP%zm9cq?>>SD1x5=MRp$y84fRAD22fk8G4Jj2N$;Y@a2CO
z2|?Aa3f-gjb^n^6osWR;qjF+gt1r7me(5LWmIFQHd}}TYvL#(2AsCPsE-25l6fP`z
z?f5m9U7rs<^t({|&oiZsM^MtO#Rww{Hj}&E9&{UL1%_fa4(EoF2HBeE6%F*}h?)ZL
ztNNDoO-4m*RXaJOMD~@sk#DRngHIT<C+;3q`!A)7+XJUKwG|N`vyemYswXaUjV|8U
zCwJhQz_WK>v$hUAD22AIX7c@pV6i92odvQ@S|8)rjC)mRR1q!S7#amK34Ng7u>0V?
zjB>|!Yg8wnf<-Es(<pf=stR5l;ltJvIjxeVt_=HYtT$kZmB2Rl_<kz6+LNCz&|YsI
zq~3J2ibN_n$q$YqI&`_Zno`MGexC3xjIN!?bo?I9C3)J~7+a#LFg(SE!NIhbwx)6|
z_2?|T>7JBW$3v0txrabV(C3x+qJctk=G%g;_pv1(d4v5?Mo%PczSccErab2zj{!e5
zVzPQOYntS<kd{4HRgj9o+>oxL5k(m*KXmSN(UQ>?dzl$*VZCRji1koTc&r_Cu~l(;
z=n9luk?)l(BVwtcsV(S~yTeGrAJx~+DH_ZQO*f7Ks%QkjF!vebROF*T_tYDwNO~^W
z@2q^?75hak!PNoAEgqCTxh=<4Z|$xM)Vehp9e`{dP6iKNIqY(2B)UI_?#hEbcx@Ag
zRdu{tw0qZ;(l9ExbrfDrh=hYzVJ_2k{R0dG4zAO+3Ypkj_}V*$=C@Fwf+F;4o_GHT
zcloE30!sSwrlXS7M|ek&j-ZDZ3^8qSW|LlP8|GCoGqx$w4^bGyd_3Z1@k1+d<yb%R
z6*!Y}jPV+6ug~*Ow;cDLzk00suIKYif&@ti>vjuDW#6<<h*KW}-g5{DM1bhMzg%ds
zW$DlN3AI99Lew4nab}2;Q86a{Otw(L3m4rX8;_~<R0jwQqGeB+Z3OR>18f;pp%G=!
zwVI5v=m_Oy1$Ck<6NsON*>^Qap<pD<=A)xc%t7lE>xVab=D3jyzneOIlN>hy8i(fw
zWA2gcPc#Tco|6SJrfJX>+Aifuo3c#05>5aXmy~IP;EsMc#_r%Q=bt=DzgW=-U9e#4
z0y1suig+Ce;u1@X;IH>xcJSG2gtY()HP3YGAfuyUCV%A@(ekLtCeB6YWUzzW8!F>o
z(Og<lXh`tGn-G%lyBZvqCkqUR-`C*L(W@)!&q3d{fw^~ZVZmULex<%P<y1kRXC7lD
zSoGQqzjxbGa@K;1F7}f}CXR3lZx@V_wTGVlMy6;}M$z!yAdv6u)CBL0xHg&XJyEHg
zRl7v3g-kNpxFkOBE2agdtoJu==#>1}zi+inQO+O-dd}-^h*BZeR@ms{CB9!{C5~q>
zRw5T(68yKN-9yL*ocO>mx)tnLdGH6a)PVdeKEM4gi3LYgpg;CYdYH}f#m=}WEQK+M
z{x;nIK)`@vK$!(_?iI%L2^;<O01VjARlZs|weO}q4*#zGeOUSidy}_o*J>+Fb*4p`
z{jO573N%~KNzTU(tu-K<z0Qk(0_8_&N`I1j*;Fj(ROkiWXG+5ALQvJ(sHnMUWvOk(
z>`&;p&0&=6(`AMG2SsPJWMD905tb5rnOWsatp$M%w3i*Y6Lf}+y6FtE=a^n)m%A$Y
z`+l7OmKTn#RR9&A^pwzhprkNQVGCd)7>$F2nk4ONDtG@kxjwq(855sPj7vX|xgkd`
z!s-A!t(OKp5Iih@#PEW8D)_##`%IObtz3&B32+?M{)SYu2asaA;Yj9^QGgxUsZ{a8
zX=^8Hl+4jvIC*pOUC(^nn5hG;es{$cjTkY(AYHlq8DJU=i&jj`=$hzG7~Eb^QJ3r*
z;bboW<&L2#82D$epbn9SX6c@$q!Uw?3o!IQLnGw0DfOS#Z`ValPxY4+$h;gDPYcTn
zgbxVn*v2EXK?-XhewBu{e@YI=#=n#Mrct##&efZ~L>JR~%e<-pUOtnS-S%qjB1)4;
zd%JP+N6K3N6}O*%<3Y3*(I1-zq6fOmA9&T@vA)8XXHTs5|7wEH{QosUe}YD-*3K=r
z26C^@pn@V!U(GzIaKiJexsL=*GxNg?nkZu6Ojx2*E+cvZ3T6~h1H<)ov6&_p+LwI0
z!-)Rn1pmT4i;uK9eSyQ*L(y3@X`vf3pvd?v5%7Nr=(R8HrOBppPpl0C{LJjr+J;J*
zTyAruG${8~EQ*bWMnRD$z9wi-YDGXALjPTLNv=?u>0O}S8Np7yhUANTwI8c4vg1B(
zW(ox#bHa09%JsEP<6%Y5XBca)NdXc$g-b>Tnu*l@Z{5<1POW7U0w3QhD(4L&83vJv
zl*-)4(leIz@mkV$fx5fEatyKr;zO%P#iyxF6-A}?0ig5_QQLSqJ_|d+FhqH~_+_8$
zN;(Z_q!{q#J&QY#X0w5-4Ks;}o$tk2ZnOU;e!ZO_e~iqPu-@V5HP`&W#bds^FBo0U
ze-FE31&aDYppu@*2{oDp1gZ}v;&xmPxxRu9eNfug(Tt{QvcL>tsU$2?KHS-_QY`Bz
z{7bA{_Ut(L;MpMRNTCPMH!N7*@p-$=7?m_z=)>yMaM1cyrA?&Rgt|6BkXjQ|?kX6l
z)Qp2Ha8n!B8!lhmJjlQ<0;Y!tTF@6g@zU|#B4)hje|3c{pMV;IHhTB+zbOknRAfcA
z8DoC@VyMEV+t8ClZK}AR<CB{FdZVw~92kREjAvOaA4}tH8P&KbTjypmYIM4Xf>)-8
zkFzDcIl~+S9<M3!a<{a20FT2Vx+K@TX}Xp46|ul6j$&k<om;yr_)y}v_<MglKRFro
z7~|?9#L4_=g8u+bchGSem=$|H!(GEk*8MLfjTT&AlzvJ{)Q)9Hc)|1oDKrgXro^bf
zcD(%#paQWWrCCQJ*|YU7s>*$dnyMh`na$b?^<K8W=TabYdwMADK5K{D6YqB=H?;~N
z8XNVnzb0RXnyK<~r&ct3E|5jjfZ*V0J_?Ga^om^IO1TbmTJ?L<;hpW-DidSsFUPCR
zg+vG=b)?^IeefgI58awN@2QFYXgbASIIvJ>(A+m_P8PL98h=BImHEjE17v)4U9Zc6
z3O~>Se#zsglNth9=~dh8e+C~0o&5#{igxiLOvVdgZ-@U#zVqu!;jFgOkt(yKZT2V4
z$`Hmagp30ivBGWS+u&QQc#I4~S2=o?Dr%bO;;O9c{bL>}?7=me>W<#*aQtaT!mnFi
z{C~aWnj!DcPy#6%{jNC58=}*5o<JH%CRxpf8pKq6#!+et9gjqEvJKN$ojX<CT*LK@
z+lf_z`9KaNgXX)rcbf?4sJZp9zp_VpWexJ2F8Th#`6u9_JT&f<gljiM6Q%^+pzboC
zu!Jsoho_RBa|3JXvE+Ca7?S4Armifwx=d{v+gP93aDc1rp1J=p#d;h`B(wZu3lSX%
zCF$>)Qo(oeMjH#M3MU8m>At-wR}dvr2$4Zke&u^zcegyvAt`~>*~YRCgXi;x3)8)w
z_gt-^3Ax(eD)MVE3nsn8S(r=R1o}Y=;u#;f^WbfZ#xPc%Ra%Y@8j_LAGJ8N|pfof~
zEwlXW1M=cSFg%gu3S(4fVahAuVUxbn;-p;X9%%wsB?oa@8zv+xX@KN1t0$)01v;jp
zT67l&Bjg(>gj!Ys8RPEMh}DRs(dBUNBkK;Sm}=dJmn*iW4@wWxduI^cD~aAa>_r|b
z78{pi`rLq@Xi$hvj8s_p&JLfCQj^d`TuJ<EHIU2k0MSrxd|&CoO!vvd?d_>rJi6O8
z6t1L=2T!HsFR-UDi(z5>G|Z}m%WR*A1}Od0BR`*YN<a4*GsT61SEUD6;J5^ke*m9(
zOL(Y|7vQPGd04<qlX7FjeEZVg&ViuZh<*zfiPW%v0eCtA6;4&~jEfMgdLU9B;P#O-
z*!Q(V%bW1s7s|6R$C6FGN)_$dgrT;a;AEr1Ki&H&ypf*Vk8KXLm|@2Sp~LB<h4&W~
z$eAPuR%Y7_YeCk4!Qize!wUHoh518{2UZhIb!nB^_9rShC|Hx#PD&r54^y?$;&j{i
z=7I0+_Nf>#gSOH`6!9tOpmzF%-9*`aS)8)%-cY@@|GlV#z@4}D{0y(3)4c^6BxNI1
z)j916xsDwFY_2Zd3L$0Gs}4_pQ#Q9Fys0`BxXj9_`gP!EZYK}m?G1FF8CKN%n*CH=
znr~NT3-Gluk({Vd^cxJmr@_us7>?-G7<qxU!sX5w?VhAKih|GaBcfIJFPg-f0#<x|
zX7$uOpc_k)pI#GJk|d&KCNTP>Gl%XSd6y7N{EFHZ#BzJ145Xp2DJWzgn`CrXrI?xr
z?00}~iESfWPr#70r_{Yu>lUR{aL^OnY+W@PFOK89-3`aH!Wb}zu`aFDntHCFFK4v}
zA%A%mGa(hpLZfY<y$SUcYwse@f^Wt8mwiPZUtGik9Ne&9*ZD|8*7Q|GiAsfR@W~JJ
zhKLV+R6Zq6`xdUSYeWCbYQ_3um#1C_rx^=1sdA?G=UhWL56|LS#*&kX@<ah^#S*3O
zSo)FyO(_Q@-SO2Y>b=L3VOB~+U;`$ngBCWpDmKyc$vrWELoGweuz9U*%R(?S-7?^|
zvU1M1d#q{gsas7f_)M&)&YDn4P!Aq&u;w&=^UGFuW1Mm5$(?nw#O}(2a346DdBxC#
z4AN`upiE0uUhNt;K6FnGXD=XGr?B*8{4rfNryUtR1&~ms-kswQ=?<4j=F;w^t$+m$
z%u95yWQfjA8j%?zkMy6Sf-^!8IOy@7<27yB3;pf1Jgzkw?IarOeUPUE<K56~Sy_w_
zho6$l*RGgw#U3}y<n;JAIhoxyo0u*>Aha@AFuZA<RbOk#rC+zYnY8O#n9N?hGq5n(
zNqMAweSj0C$-IGoXf-ZA%w~->7~g0%PE_N#g{5k^W#S4{7MzwplGyEk<glZLA1a6M
zC?ehT6Y6ZSf8FF}xlFNnO%xTk@ifR5y7EnlCZcERD$BiDk@6^fuEyu$D~T+n-MPV0
zTQ)s<*Ujws^$KOHZ_BL5{SH-rmF8Q$j#+Mx{<?T`3~`@^Pj>Z#o1fyv57=!V`brT&
z+OGshp9~-8+T%HKZ;M{MAeWx&zmW6H?BZ@KfxfM1F8||{N3mS0u|ds`9^SdZ8Ohl%
zoE8y5cJeyhZ<EI2SiMhJbaGP#2YqxWx9kNc{L$q-xTHou#mizm{a-&C4=s^AZrD5k
z8jsqcExupsS{U={G=QyA;fID_uUL~PnS|^loR_7;;-~GRS%PV^`S^C}Jq*S9Q?D6Z
zk=#{d=62DH&qea$0ja)4L?dsg@lovSFXs#{?@mdV0ls0<C`NOO??m0Xfts(EjS4H9
zev%LQyS!_B#Pz^2qTFToA}%<#M0&;I2wMfus<JYAfg3T7zC>GC8rOnpmrstaoblAx
zsv&!6b-yy=-EYF(xU*CFQ<YBLk@KRqLk2^uZieL2xuB}^BI&O(Ovb9Rw;X#o;c=vY
zL9~Z&1M7<LttBuT8i&?se%zBU^q)knxXq%p)+UwN<O)x3ce_lssqvxiRAO?wsC^+L
znk-?eP$3cTMl|%Gl+Xs2VNC*5=RWl&O0sX3r92Ydw@>6s>&3r5knPsr58A6&6lI*g
zSZua_dGJO$w#@zIdE%;WvftEblfI1D<_~E$uepPHM16Qh%M*&{#CKJ`-H*;*vR=Bm
zo8w6ozs54j-TR=U$wtf-66Vk&ZLJ%X<nTdH#<A^ByS8k?mDBp^hbS?)F1#;_uXFni
z-mim{f#MfvE>9B!eo4n^hPc&=tNhCSfe_9j+m}A4%KC@#;VE6{yESR~8w0aloTD5A
z4wT6mrw#FWnBiW@aPxo+1dkB^eY$oCq`OUH79{VN^Ri;w7Mtfc217`x?Q1HWCj0j9
z8Is2wHGh{km^m`D^y56v|J2Khk5wr`i%ZT%Bo|EE{lSY53e4pEP&=OzJLwl67kn+<
zpp&ZZ65U42@)jqH&TsGG5YBA>dtKbC-4C7E{cd!9{0c^X+0Tddy)*~r^h8M^RIePc
z)xuW!mc!e7WG1Q0wY_&?W=Nr5c*3&iyZ61&A8fYr3XHq2Pis|Ikjh*<jP*!H+33=$
z<hGyps??V%7GCF=M)b>_y&rz<Tj5q@|K;Du4lTl8eVo6_Uu)mS0=45xb(iasw+;Sg
zdp8@t;r?ilHREU&$~4jKhGViH%YvP;LY=X#ltxLV{9{)hUi-rfmk$1rpXfejy#g#r
zW__Xci^Y$GHrfU~|LVKmMcs(_p7O#!zFlem^*tB0H(iW5dOK-edDF$+FBh+9qn>d-
zyJ~<^+%cMbeD2ZFqZ<2me^h5VdiLI<-O?u#H@|rHolmlVLq2xN^VORI&n7v~)&bY~
z*Uqndd(#to3(l9VPTyyo>#TusfY<$nlKPCv6Z^U}YTE<YI69_gzwuIp%=Zj{tt$pv
z=5saM{yL@2=CmdjS@XPm@P}|%;%w@RiJqz4*mcVznY)J-{*s#ec)VGM&UR|yZ4)Qs
z5{G<K#}$1!HHHF|zs-w6HJnr<a<{^h5C`%a-1V%iklE$@!fvl47BuM{dW^d#TZt|m
z?5R?!BWJ2)1884wG%6k7F%&$V+2CWA9wcKsntqt!c(Q}m9Fip-6*+!oS?N?HRc7O&
zG4XE|#%abq?*UtL)TOv>vD(F17HVueIxm^-ji>1aRTB;zH_lYlpX`X+VQo)aTJL^W
zB8|&(51AiN`AEMx5)kr{?qL{RSXnfm=Dqsda=v2)lroLRoa6D!?KxL$4jQs+-C1gT
z0&o>JU1MG9i^9+p=45_$WK3(Dh4~Xn+N{_;%y7eln?^XpwZ)rWcj_fR56S^oGvggk
zv#5fG;&b;OwD~UfA5W@@sBqXMY2-bNy6OUyf+*SmZ(&MCYUsN9#g@H2Pt!MQVu$3b
z!oNgw?X5bfKE5<Ca;jpdrSR;rc6KJd#WPj>mSRHT_)lwA-JR2SV+FG#ZHitq89#A3
z*(8!5T=_BL)iz!VtwekYDhjQa=<)BuDAGg2)8SI&rbU$Ib>qU6K3Kdc#p{2xiydLm
z!hI?-u!h;MT_ZPFd3zT8D7k|d5g9}&Tbi(q<HK|r9xM*fC4S$`o}i^)yq}5u@tjY(
ziP6UD>GGKfzT8mZ!KgWFT5ULqAv~0f3td~_Ab6rNiLE2~UMREJ@tIC1$>F{oJ-3{^
zsZwPAWE!h4dNt&rNWfp4kN&l3yW(F=yC44k-+e%*C95dw+{x3B+ZHOS-;%$T5^T}A
zId9!tVVcFEn~!}`Urkq?%vhuH{@OcJlMJz3X}Z6cvrprDRuHoq&*1hV*)P_+%96B>
zx~uOL%1laJuI*6W$&PK1<T%%qp}OEPp;Mt2VKuByqu<sxoGFKz)PiznZ}*i1iRq}_
z^;6Gswizcz)U(y6GFBK`V8&49y~3=1G$VFu@5ZGB?6tz{tF+z6S}?Cf*YeKM9;y@7
z7tAj1OllL1-XZX=O(Do6qnJu!e;VetOYcnvs*)h?P2_%JpkzH6d0AFzJUIU4<tVZj
z#RJ9(S~ov;o*gmP(ep5DjOM;$(=RrNY=+!lFr3yg#<kFlR=RsuusTwGM8DS)5v}G+
zryPT*&mXJRxVi3qzCs*ZICK8q@Zai`Xm8`ap;N==3$JT+B&y2WOHBl?@7w-*YH6~}
zh+BYOrGQuWSg2NStPFDrt&ofB{#$-Xyy>#VkMM}8>j|G#_n~j6&nCtsPYQWIANTT{
zweUunb1x=ccR}M;lz*b5Zb~|!WE@tRj9Z$etH>*-H5@#^-0$Tg5Aa@omfxP_+S3yl
zRe3M|`Ep&B*_8zC9};Jih07^k<1!olw$v}>DV!R24r*Z|x<y<QUtM{mR&m%o>akek
z3Wt_n3Q;C8BGNfit8&cIRT|aww7fV?WL@^XSPZ3>Gf8ZSayZ+ygvf(A)}%0=5vIL%
zd^n_!(#Cp-R7i^y&2Bdmx|UQ@%$<t&AM#PCG9~0;BZWCBncL0b<AUm~Zu-v1lky{0
ztzkQ;&7F^Mc;m`2kx+|;Pm~`M=i3JCa^kqN>>WgK4XPt383|hbV;DC?EegG9;MnF{
z{_C_3j!Npp!zH`iG}Thxl7GuMr<i!4%i@E+Et{NAzNN_f8J|dH-tzLeY*Ov&(Nex5
z&RDl2o_)5dCtEwEqf@cI{5ev_SeB}>Bq<%&N-2CB%5S1i&3-$h_i$3-FfC(riDA{I
zx88i+BlJyGN^>b^6iHe$Yi?f;SO!v<=4ttb!YlUE3%qW{656F!EDrce8tNl6ioRp!
z`uiOYc)p@@3uPS!!uNbsDMzq!N+`cMA1AuV<nnpzrHxi_3EF(zc>Z;cTUng{;?vBR
zgWk;^>+-mYWg2^K$>17YUBG)6g^P(i624!=|KG1-)I&$BULFpIA*#d|4fAbTYPDXz
za2mRc?#A-v>h1TI;(O1UNe~+oG7+d@oqvyBrB14@7oLkfQUrROFCB%0l*9)7i@4@6
z)z3z2xQ3e|7FAVHyDdi5ypEas&z#u$)9EQW)te#4T($2B%gGv5&*k@wy}c`sc0X~p
zb4z?6q0v5~;H={VGK|{#<*h3D`|KH!qV{(Z=L2%oj_3Jvd-<O(q#L)W*}g)(W2q8Z
zuRUw1jmPpWb}35)N6Z+vcGfETfNr+lz`7sr&lmOI+b7FK@^T{G0OjF-;ole?7OK75
z?x5F);wH+I{l<nyv~Vu_XfMMvUzA_lY1VKmBp530n4k2`L`93r>-Ww2CO7T$N%elc
zt}GuJ%QvQv*+I<0+D>N3X}?S(%{7yhv&A;$H|Sd=5BZkJ_FVlqO5(X&P`Z%Ytk57*
zDY_y-ibcJz?DgZB5AGt!l6md(6PLx&o;BwSbTc*7jqPvQ`JxX@vN(uu*vaFE9`rRI
zseGoyRxtz2K^=NLvqP<G#FRmattQ)=#@C6NrM5RsIV)<9K8mGsDrSYx(H_+S{;U^u
z<Mt+>up52O*sm;iI)%G3v|FlTij-5M@2|Prn54PgoH(&_kz~c3+HzI_kX-fA$$)gR
zaTc9|zSt;Hq1K|gLzS}MdDN$@D@6Hhx#w5xT6c<&R~fc})$Txh3=TMM%OKIacof+E
z{cZ8?x%Uje?Hx1cVxsLv&J$)%LI#IqBoZlPF4ne!z}<}Z9-7+U!!hs_xADR$ne&|2
zR=htWI`AI1JP4fX76e4ii1P%UZj&N&((D}P>+$+IrrYr)%HDl6?*|oj9@wg0*GL7e
zaq-3#`%*DqbUfuk-rP*=#7T-U=U{?rndF|q)H#t|tD|;a8d(`X(J9sX6hR+GHoYbq
zU$ZK2%Vdm4t=y|ROMOttSa-?fOjb&bj#?A5L!IPI(Nc%JbROq5Vt3rkwPFQ7YL|0^
zD7l$H6?ZJ;_>X+_PioQ@U@ARk<+I&^j54Db`_Z=KJS8QF28s`7jVMP)oxa9SOrGnA
zyHs#Ws}dDmQ&~)Oax#)qdD6*hyODBNKqul=%}@fZUA}zJY067m%_=Qa+_63Wh5;;{
ztG5HxMh4HIim5|&(fAUhxZ-7E^$E<5fW+IQ1*)sJ^1GAe>5M2mp?!tP*wEzD-iKGe
zPLWmt$Ui2WF+$iJ<n3*^QzA78OVEl^{Jg>z?Ina?SKcaDx5H#vQIl+_$$KqR#_R1t
zZj|98ej&2Yg_A$zTrk?B(H7|QK7dy~75Qiti3_?JrQg^w-8)$$Jxa>6u&oWc4~gZ8
z!>N+?z1O4uGJfZlsmnCmzGA^mP_?bqicx=gE3?^8<AH-nD{=YSO?z+LxAv#^7QZ&G
z>38)`N!#J&V=d7H;+o+j<0qc0kLI@!@)dJvj}+Ke^$o;%)VIHLeRXM*8l|ebQ`eVT
zG9GU%Et=tA_y$K>8P|+Vth^&taqafF`HG=vm_Su)o_F8u=$?(ZTRFLPocq$lvS>kl
ziFn_kutJHYz-oQhB)pK9>J^gz`k`waPbe<1;$fTa(EZ%%dM~PAOeD8E?{u)M?dig?
z^`Q;MknN|DV(n*1L#(@)JoX}|R<_x(P}n|VB{Yh}wL-}QFS$=irJR)t=?nau&{2v-
zsUt>bA4~_l9^f4Md3ntsvxo3e-+>{u2H$}B*ctUpsU=4#Z9b|h`r_!8cT$%qZ`3qJ
zOZvR{6l6EXrL3DVY2Evc_R`1`!Q!2!0=sey80E}Gx3lLOe*jH%XKZ^Cy6STwWmuNv
zV)xc(CUK816<NhNWDx2UqfOp65*#tl(KE&USh#wsXoTmAUGxu+08zVuC2am?g7<1c
z&AOX^-S@=#8OwCJZla1gJy#YzzOs5vD51D-J5p|;OZtQ&k#fs3lneJilv__9IzH~@
zVInVb_Dp?MV{eRkMZA<%nX5P49x&1ypOT&|M<f(V*SPODM<7Fi0k7!gqtujqM=!D;
zCzeB`rQ7v*e^E`8Ww)-|a)K>UIX(WufWv}F!<{FNHTewLDbE<a-Kc%(Vu||)bFaz0
zJR3HroLN>`EwS%apyi6ii^bfd*JhmTLl{9``8M{goD<8~MY21Lc8%s7<(Bj0CnI7K
z=W)q;p06%|FoTZaRKm=ZROL%8CU%I_ay`>eI%V&|azvy47RKCKuDt6TD{7-ctB_%w
zUfF`6lhFA!4SzOatgown!igVwa~%yQzrS95TiEfpikv{f+^7NOXe_ZowrAqPB93}>
za{@8EkiKdZx5K_gRA*!QL->k{ov|tU)85L!pN2H?Q@MI_hEXmBQ^L2s1akGbw4_E~
zc9e{Pr=p<vDsTl()st7m*?e(Bf$^1b!wE8-!ZT6Qd$z36Ph_Nxd2PB>9RJ*=OF>lq
zVJwX)0u`>XbgIh#U1Xf8;v8wWt?RW+xFdARl8I7SyR9Q$th=GUZB=I>d2=&Ait=8J
zbj=q{>@%h!($nnJ%!PB|9jhZpP=(pp3){uis>d+%Tq2@vYec^JdEv7Cma4+WnbrEX
z1-At9(U)#<5sxLJalFPmT!Sap?5EXuH8zr2eZq2ch1+81QM}#WCS<+4d-oYh&AEx#
zot}{*`wZ)lRt+^p1&w1ngna`^ndVZsSD9;hEIFyQi(RGEoXL*O1dr@*U3@-aj+e|l
zfu9oHp#F`+n|5@%s;biAhM9e%syM1Du~1aje@PI-n;U6kV7V&WNz6<%lc1WWwVk>)
zGoyQ9X2|-cJQ@G18tHQ-XsIF9$l}5CM$G@x6d*xZ;P9q_-31Dp30P&bOux^Z?J*Da
zYK(^-Wp((wtZ%YgZJ}pXwbkfrC5x%qPiBc!qS9IQwVtodU}rp&V`uh8rj%HO%Mo7k
zwWy`fb-|(KbkWBw@A2k6i$i<IdCx-=;8av6fw}qJI4hTH4Zq#3cAFwb@%h-D9d%9J
zwb6E`*DkpTyj)Pp>fTJqkGFG+Elx9Htb1=9dusThv!wIV`8ljT?|SX#A?92s^D7*K
zO5^8Wq|E_)E_>M;`(miOTklkM{5SR2_YN;xezJ2quIYf#N>0e{p+@KY+^$l-?neSA
z=knWCKD10!WFKW-FE&#y_ZlTyw2-+`XVUUwLtoC&6FO(98rwcgTF+eb67ERQ=zH{d
z{TS@#s23`uzoa(Qe^&7B=xdK2K|=C#x)q!EXHgyUoQ*neq(_*7Ck7fd?@%ct3~*-k
z(0R8M(4{S#UUoS3bH1Ib-zu~1_5MZK&4l$5Rm$V|Vzu$sT-mBhwHl7*C78gcbUD$6
z6xxujm^`gjy>;M^lp(g)Lhn9DPt@FO%HdnPzDc^xDBiiXV_l!cfe~%DkgpOmkGgZ6
zoLR9i`CMW40?Byfb!5(KCbHTH&`nC-i*dxv0Lr<>saxY_b4YUJs5aZCSV~I{zf(b{
zQS4_YcdSP=53@x<9Ra`HN+Ziyy$`c`Y}i4B7rI<H$gbYWIf2XbMJ+*<Gw=)N3p*xC
z2`@VPzeT$NmKgnFT+TYvAv3e1v@t>E-W!KRm9c-c0FIQ}kuv4|tXkkXknCg5?pbJp
z))?p677Axt5w*MTaW$fyAR3z4KthS8_|DF-;+4!Y-EI@r<!OUU*L@c93w|82+qsY|
zAd`Yspl%V|;EwJ{8DRhE5irTXGLJJ>cQ#v>xicX}pJ(f$sx6#avb@D*^<)3q?!w6q
zIR2LF_97q?Gus`giV<&#oZUuVPIO|*JA5VwU*dkXfg3~(#%!C9^II`njx$pwd$PB2
zyBCzbsMhD*q|UF<tPv}LTP0PkyJfs3w&mn<Pu#dW6}0h}s<2mLdIHJkaRG#k)iRx0
z%;T>`<3L<<<u#FGGTzYrD7UAFuCH<J^D0b2UiMkL5UXbkY8vXS#cg#;@Fx<U4=owh
ztdF0eNL6-?%?>w!i5O0Zbrr09ZWJ}hOxK3PnukvBn>TMPS8Epx$%!}1`u=X#Nj5$D
z9XM|HJv_@SHkEcKxUJp5yq#d_z0nF-d$d4R$K`kju{L#CE9_6~j-Zokk@)(`AHR>Q
z{qN&?2(2#nuE%KV#Z}_w0=b{$fv4!0YW;q%U{Xx#LM&mZl>1%me4Bcrn}NEnZ9Hq6
zMt(e*-C(kRGMbZk|HBr}<ucvc{0mOlXwha|WoQ4mvGaVV+RHU~@=h)8AgrTWj#PHc
zJnlmv$9QB>Hxt<zw<p^IFEWg4Q@)*Gr>P&okSzjIfK}As-X5zKU+=Pln!QiI9(~4-
z9L~0a>C4Ue60d=PglkoRQX#`A7kA~1@uwzq5>{qm?USAgK~4A4c$HTiK1#bxJZM6?
zcD+Wldl}xitO?cB|Lo84yQtY$OK~_(ku@n^H0xVW4(~$)o;ytN6uksrl)lKY(fBE!
z=|cC<wR%RK;uc3zX;07EUNRF>XXtB+2t#i;b$}Gpyk4h0qL2GPQ@YXj^IN#y1D>P~
z^~=(xZfp&7qfbr&)e<v9sciwy*v$^vl2w)c)aQNlz-oeAL$JQmf1)jas#|8&>N@<~
zo}NWHU-U7yQVGW!0$pkMl>3IF`J~gwFF%N9GTyPOv?;f*6qd`~n@^?5A7?b9*7NUm
zR`e<3+WQ)TRTwK(v;KFqTEeqJCZ&t>`wecHm))*<G0Xq_OrOmSD4FlFD@b9zI~t^@
z?2o;Dkk!R=nf3GIZQ;#7H^#^F^6hD`lV^M?1BsCfx%D~xTD~~(DX2NFb|qS<&xgg;
zeE?3R|H*UnCirbp-bM=33U?M1o*c-(#{N0;u+MbOw_}Bayh0K9QrX^{Zx9BMlGyZo
zR5$gq$N^(H6`BST5&LZa<A~uN_1F>Z8SY(1R#AVEL^B6!457ZhQZ!U3j9U>Mnz&dY
zwUOu^C6Lk~%M~BH4$PUGU))wATi<wJG{*vGEV4>Qe7bGm_6v8%PGusp*yDzNFN^p$
zv2&Ex%zN~WV`>|gQ4+c0{s}3O@T14^-;%hiURWy8PI_G*-=?taJ5-<V?6kvyVNn{t
zE`$@F|Mowfv4kQpB%tQhKSf{PLb!6o?Z$0Q)v`(ri_~Z>hHI{9F0HK-BZcP}XAxnn
z@XtsYGv-MmMhYvB8W2)cvS@#rkGJuf_l+`B+QH>GyB#EH17z{{$=Q$JPO2wpJdo=T
zaf?&<5xN~BcIUz)J@M$&>P1)qO4B!~XAD;`Z#-BykC^g3`AN)szj_v?(Ws@@*73bK
z&Jc#^=|Uy5*rl1y8PQ?-uWA!pLOzcFRc(fF;{FFj;ROQj)!ydinrD%^DV9OnF~R35
z!X{oLW}7gCqg^hReiL1-|BiX!QqiIyLdJ+Ttbb-xuNASyH0qP^8^pkA$x!v%gN=)q
z`uJbeeonlptaNZ_g)Lr*CEr^*fNOtG)7{5IBt)W#>?1$}tLGrS2K_6-ZLnnDLp3hn
zp^_NYYklHNL7gIgE#OfLCQP&&3y;K4k3PwZcVFyc!;uZ;VuC{=y|BcxC~qN+<&ru(
zHsON49|~W;IMrtD+L+YxIfd6?V=cIqyzQy9{Mvf&cz;3D+_(8V-=Z^TkyWYX3$!*C
zyHrA^Ve^h=yHqp;4amXN-__)Cbb2=ix4D3J!7#C9ZyRwhD*RPZygQy39aT*%dVBiA
z8t{pYr8mlf7?7L-B_|Tz76$(#yaBSb0^x0)Kg!K9R@`3SPFkfYKc;mFg5l`ANVIzK
z*Mv4&jgt5;1ZM8)&b_7j%nqHKIlO&N1t_yr6WLm#D?h3{62K{+DuM7u*Jl?eb(a#g
zOJT=JZ))%AQEkazDY)z*pH(hIxw?!PorSnn0?zIOL2&=l+jgVPgxK|kFWfKt*Mt-C
z`YlQLVl^bR;iNuge>xROsZz{}Hu@}X(Mk*!AI3+FRh-cz%^AMy{wLu=W-zfu^R^CG
za9G?7N7-tS;QUoB+FUZD<a82%OqXG@IMch#5s_)NR<(KkP$gi^vkxNbtt*6oRK3Ne
zOrCsTyp5n_Mh+RW##tzqo<KgX)(<L|G19wZEo3LR{C7xM@vXu33BFW@`3DXb0#1H=
z*`QaJvCll8=`DJv`<^#h89gmlD+r)pZxyKDi3nR<qGL8c^Vs2_+*}wg7u8zI;Y)>q
zEjw}W#MQI*@1KNWxbm6pcG~A%W`8PgxrKNix34F|)G#e?QT^zoLc3}K@teZOXO_E%
zGTzpe*tS}~JXxdB%-PWG>Lr*XPqM{Ei2CZEzhxt6z_$2##f!_M{ky9H%Fb=C!3x`D
zjm;DV=gbqlISYzEL8D1^wmVNdyg67y|BZAN1A@@C!n{<XK*5xNPWi7kh5V;YfrF(o
zogpT-r(EJxzTUd~z4clT8I+;Inw#Gn^8H>*PV$k}P-X|c$3Bi7CHef>9VO?5+j6ux
z7BWjvYa^V=^D(V6_)?G+JfGL_lO&AnDyLt|!;RjW%;D_V%mPnHZ*0->o{M;TRmtA9
za?2fsq`GeRxKBCtn0N&V>8+=vHV(i%m|{4;jN;KYrr|dq-i!%;*g_jy(wFI&!b`kP
zh)VhBg5U0dwAQ;#Y^;58o8PamphP(g%J`2?L~bSwdq{gd7du=yE8l`30%{#0QpTi$
zb@8Mj9~M{#Rmc|DneAS2=$uW%t^M92X?-lsC)4&bt$Q6Y%GD#3lU&y6YD<CnaT{~5
z8wASP#)kOkNnVDd_*j^<tlEaGasF77Cm10ICv}LY=KtDru#=jun2{@)$nT!&6zqC{
zU#hL*?qhsNj!jv&MSbbtSZmuj!Og9g|0spfe8^wU?74#bbkC*esXc!$E4@Y}v#y6#
z4f||0atm~XHF*Ji`ir!8aGZdGW_n894N=B2ce5me>yQU;_-5hAxH`oKZ8lJr;=*zC
z(3RA&=lc5ivTa*^o+SmTR@NII(X#yk++=~s%sE)7SSh@t_YL~tQuxoZzK(u8IEYq^
z=!mU?z=O4hVLU7j=*VTXaSl(g#}K#TQ&XcxGURfzy0i`7=1E+geIHb{{`U<--`2a4
z+yYPYoD5Y%>^+tp+(zpgnwsY<4g2T`d`!(vB*&k8S>jb!sYTlq#yHc_a%goN(cY6c
z8!sWwn~x*eWq0?ID>rgw;gE2YP$h9~9IL0H5tdJ~A8pRL7q&oItVI&1bO0^?DJmiB
zlXZ!d>)46bGWs-HPBY4uQ96B+=S|tk%3SQBAT>wW%TF$BN}?%G*g=8%=mxf_nEwZG
zjWh~J;k9KOg(!$lSZ1^bFft1(7v|~26)^=Xsg{Jwqp8<@sbEj`%uG92Q92V{r~LLh
zQh-CL<}p?T2hh3~CtyDqaYYYrX1vdrT7SR%iwFxoa($Pa&t0KhTH3CSLx%JHAi!vh
zk5hxN1NB;c^Q_ACjplPLuL{tb9pWQN;qrYr&qD|es}$LYy>BlUWr-&S=}<A^ciOW`
znyT8~=am6Dcg@NwkjA7LV>xVRUkZn_vR%*8T52FO-z|1c+sw1qGWz7=YNNK%Ywrq`
zA~UXaVhv>zw0_JEnFH*sIak(7_c=DqoX_&3{vTnSUy0QmNvz^m#l<djn4Q#*MBPi3
zP*b$`v8s^R*Uy3Dk)amqPNtN}FBt^StEBDSNzdlq^nT-O(jH%&=(}s|0%_R2=hAk0
z{*}1xN+L^r1AVir$mzn<$FHkJeLS<z;V^8JS?U!UnNbwV=M9lCX^Ae_zHuxfVH~b&
z!HFFTciwC5o02ujVF}OC_8N`m3>$ayp6BwpU!R*5_R9Ij;d^U0?jjY;WKYLgzPxZL
z)O0cyqutAHK=rjuKF8xV`$1>*#M>9kAH7*X@5CfIYhe9ms^Rp{aD&L#C-e1BjtIEC
zDk<-IrTDpt6&q@fW3bK>ItdVBIMb;J^vH|H@uSoAZV6HFp{1B9W|1jE(ta|eCqum@
z)GqA{UbY_;a;^%$7+agykFhM6^%4q3N8XCrLa-axtdgy2fzk-d()AygdJ+mEiAArn
z{SkG&rLJ^cc8@hyoYu6Lzy_peA*wuV6S1$JsyOq#O8EWVj!PdQtRX5nm);DkUrBDz
z+YXqJRPwod*WMcru@#^|E+knNbX&I?3W;e-huQ7nNZ*CM+&}jz`jtS7YAz*J-MA{y
zo*R3&_(g<bZ_~bQ*vL)Wd<Tyruyn<jz$|H;#+Y@oke!zZlX0@(Bm4WlRHV@8km_#5
z4aafa-KFAFx^?l5PrUwXFqN9WA6*mUI&E}gvc~hY+N<$6oV_5$0xzzW{#?-4nep<)
zd$Kj0)Tv(U1QFU5hK^i!Hm4iv;%6EyVpd)SFKz-L`&nf9P>o8$d-hdqKXN?QAzxMS
z4gDaq0}U_8Ww25j9zD8nH_zwueiP8hHFi2l=U5z|r$^UfHEl)7Y7eGeJ09rY1)!t}
z8U6OXn-BK3SnnHHOkUZ`Y;Te=q%5LI+I>##XjRSy$lfzTjJZ{FXpkwo$9Dc3?(<O5
zWb^Kx(>0cGwkeNpKC9!)M{_2k4@t21Hi^DqQFtz-o`o;gE}l@xO1rZ2S#&j#bBFpX
zc4nayQ7_%jZKRZN=Pzs4?5;OFWa!VrleIiqn=4AZez4Sq=jquyI~sg!67ShQx>1!S
zHXM#Bs(Vhf8mOCjGG8C9ALV6O(tOvOiy>=Rb34-Y^V!CieHpSttAk6WwCdycpzj?(
zkmiiYx3kL~uT-}mA!Y_8c$dA*e(_bn!Ea-?#^}}E!ra5J)NZ%|=j!AXbK^C(y0swb
zQwXnL9Uqp|b|^!3L(&qRIqI97%!)nIY!!Kxwn|N3EL$>!;a(@VJc<Kq$TuC6OM;oc
zi{vK1&``X0LH-E4^p4~^hNQ4<hUQb5tpNQ6cWEJ0+vk162!g*7F^hURi$teRrGF$G
z!S(0^nc#`&wQHVIjhs>oHvq-(7tQTjQ5LQ9r?Bj>K5^+wKey2vocoW3Mg!MZ8&YQ7
z(e6+lbhld0oh<&jC7n5QFstOcTOgBmOUYQF=^ROkIY@tK!FdCgM>PvA046Eo-RliU
zQzpo`D&xtaz5CaO0u@sA@)yR&u|RD2|5*F$u&TE2eE?NN1r!xfP*FOhQRx;z5Tv9#
zln!Z>6pK<2B$O6JB&AbArIBtn8>LG?y5WwcY>!7i=l8wObMGJLz$1I@HRl|2jyd8T
z?;v#hAzU)8*`ZvVBb(d-ghZ4I>C6<quXxX2CY)9CXlS~sN19G#&n&6+Vw592G16A5
zmvxY$nH@3g?i7@tI|6oS%&is{2B}WdvA%rEj<SRAwOWFfZ!6#QD^Llw3`wtHbxjf<
zv(RpP>*lMoPzOgef~U+2QQ&F0*Y0jnwWO61-;6R1)mezl1_aCc&Ej0g`LQ(TsxgF4
zD(PG<$|JM24)+X)dHTF=h7v#{3Ze3~Ugt~e`ZS>FWpnsHj4pMVn67BeYgC`1E;*gb
zg^JO^n@0yTDAsj8lZv3b)FDX1BvCpu^k_x)(?x}%e&TMabCdb}TI7@N56X16@S<kE
zuId`guXA{&%^X}eOn8>5>&SwI67Yyg*1R>U8!@h>SX(kzMe4&@(r6eGSz11P`Q0Lw
zOM<O$UK1kV&QgKiTW(Vj#}{^>;Im%O@#`0|Zoy4#uLg*AKQx;w%8}XQ)>AZ-;H-wN
z5{JGwH&{63Z*{X!J$tNDTgS9=WJ9!z$gSJvyNl0sgnQu)gJNwi;!@5Q2ic-_2brkT
z-1mMQI$Yp?N@(^_YJomwaqP0A%vKob=GuY5Wryvlpm$qgJh`Yr-{v2}5XEG5{-J9o
zwa8vAP8Hbds6s(FS_IINyqt}&vdsiPE759H%T=2E_M6fn%i^7RT8koaIn#$rp*FS%
zS^?Af`-)v+%@P@%Wqo|7aD;dzYSuL|$Fj`S&s*%m3=~P`$&d)1v<2*P3PQGvP{X3}
zx%=dMjXlTr`zdOUDCyAn+Cw!(#I%3Cn%h!`G|JRd^5{S(P-NUyrIEJ*dZaLPg^!=V
zf_U=z!0{%e`crmgczbh9nBLciEVzJtYh1#I$MPN9<cr8&2k1;%J&?2GHf^qJ7x=jF
zZdjGbErs`fWUhrk)*i>KdHYl|KAAuPvkn0O@QXL9xJv`ONqpSUfaVYMUf^y$J#p9X
zQRhr{%$9|#yFYgI#l&$+ueQ_Tp?YWtda5(h36xq$EM|N}7+}*qcD84H=%cLzAFH5F
zZ2;R{f}hY@ly^!F<><Pl7<W>Akho}cLCJc_Q*vRUz-yN7z{wKXJ5)SQ`BD?grZz8-
z_y`RR-HLMPv<YnPMwk{^3FRtHsR)vhzSW_U<d=?n9QLVTAPpSpYahB=W_&(g-75YW
z7vuS^me1En)Tdaa&kCk8^M_JTiCMwSovwNvd-m$x)+j<HvI0Oz;eLxpGPet>+$I%c
zq@G^6t=wYzl;hA@>Rk0QVLLt{(EWm_?}`8$+2sD}%>S_{s!MAqJ!Z7AP~SODSe^96
z`?^`Rlti5}L9f|Mb?5WUHv|r}-W!6N6Yt^^f_)BrVXLxZb>p;;c^I8v&LB*G9!>(Y
zP=wiO6FE9SqU(AwQ<pUNOE#bCBSVP?Dv9@0r~JmnaYzL9*rI@;?IC%=_{j5{+PRVZ
z(mwI`d)IvATt5Z)HW_MKWQq&qn+l$4v<y_<6eA6QzL<ohr`{~Y_NF+z9KDz3Lq%{s
z$zSsJH!4qaQ_cNp%2Y>;eG0~p9G<&(*}1kteDGBTukzCle*)@jH1j4`hlqT{2JeOt
zxRvHJ%Ph|OX+k-?^jx?E^<0pq(JRBjA(1KJ+{^VPK=x||ghv;qO97TlXkOLoAADc<
zTHwoCanYxDOIw{Aom!;1wvE))M!Jh+?6NyKwm%U0ctuuSBrFc?v|to-%XN6t864=%
zui#iPnw0Z4?<tgUK2lUK^%JYMdWg^E-KE%4&uT*&7gjn*Gnu{a|4<|v+gD(Wq|h?=
z=|>52ff>G-O?8&*=yK&1oAW8G8h5&aDHFxQ`qthS56|A|RO&5w*kwbSt}Nuy9$a|P
z$G%B^g#oE|&+4Tb&=HWE(vTQ)+7Y@>+xdalqMIG{bW5_}Wx?$0LJ_++>8Bi~Q*y;`
zdwvL(=&D0XGfYv(hdGTU3<MIlU$*t7n{NRPIIGUX3#C9EHm4!FumGeg6Rk5L-kzgk
zcHvzJeN=^p_=d(sRdF`kBFRVNabcg+cr)K`97pOT`toaRO$|y_u%^38_9a}*2L|G>
zPIiNMhhbpNy<L1uIKUzD)M<aOK?mLI)!v=98u4!nCH1CqMt`88-fn2hP*`?_GN-d;
z%le`ulU()0tosVTux3X_*%M*lwCRI{MapPWut;?zFPgl?CL4S+H6_=l>no@2kBh7{
z<q)@p^J;N3-RkXCoye7)=RF5evN=ADGRv)NTczWr1No&(X*c<^X6lERHk8BzJ9_W3
zs3&vaiHYv4@+=QAy8=xX?F?%C?6qpqP!#YJ5SE=vJ3rm8q!R7ueP@NYjJT?^n&7in
z0g&2Oj9H*bI%ca~Lxy&uH?3J5Zol<8wk<Rp*GS(!)*^l<S$$6E_=97A$7w}k=uV(<
z0$7G?yCVA6UnB^qM+YU)soxEv6)hPszq7F{PGMBpxal|>f2To(*s>wnvMVBB$+@fj
zP_~k}W%f1o552lH^wJTI?<I+Krff<_+Q%ucGMJm_=d_MlEM)01)n5qoe$!4e^<q|n
zyRz8r2uCj${nRn{UX9PM#V>~tX++dAN{3F^yGz++mFll?TnmX5KGwl(sl+G|dMj0S
zjWIvyNE$g)6OhrWGDv@ri<v)?hP$!!WZ=g_`}SPI#l^JRNB02sce(LhZ+Z@P)?HG;
z?>DS7FSWVmjz#0e5VhZ-%!v(B@gG!DSv4JN&bpxy!Bi;-I1xj)>)GE3LkGx7Ujud^
z<(7K2y^6=?-HYC2M>RUTXBkKv#>`&mx+hrE<jA(8y10;tx8zoKZYYw!EwQZ4QX#Dx
zGc4)66T{s4WT`!CI!s|PLpWf$!a1n%vm@D$E_(Me^C)A^!xOF+Bg*ql{IddOzTH8o
z2~B)XbeF_PTaKJH44p|k`c*aJ)0%>z_^12bgGDi1Ow5h1JG9LMm_HkjEDRZ*7a$B)
z%ezztL8dwyrgHZ}ceT(i#zO03&kff!qL>TT9ctHOQ>iv=avvGKLOZ<<`Id9(_On$e
ziDm8x@j9rPd!?(WG-NENXsbYyeULkf9ov=?@c;@>hAUD+Ue}H>FQM{_%lx}!VvB~l
z>GyYfN;X1`)8B8*PI{5exC27LVe7o}_OR7f?Ip`J50-;nB8FMEGco)rj~!T|IE5$I
zM}X!vDM<j$mc;dbgwweGrbn*(+J?h<R=?a*Ma|C+iZn`#FDeF98kCE!bqErcp+i2k
zNNb}JCrI7ps(Aq;b%U=>{1i{wpxG3GO(#jvri-&Fv4!#|;xdO^p<$i@+xw~99nB12
z$0*HOuIVajb6P(eTqewtYVIldT~jK|Vdtt!T-!X8ti`5_Q?6P@uH)#^#?y*VhLF;J
z{PsuxjZV(MTt%(TZ3(tSRC?aBC5SSO|3%B)Da|`-86n{%P5e7v`U5|*x!lOG&i@@@
z_7sv6;V%1r+;h4ZEq)TUxJYq>s3$yDc|(ICk5eHH*Cg$H?=nh%PH@^Td%mZHa;-z?
z3~?T%Yt5Uc_S!Wp$q*!IZV<*yqJH9f-**{l5_Ojee`Zy>)+BeqyUk<wa&=|7t6BQ%
zCX&jzvbv4LgIxvL+vvBl9tAr~%FD1TrTmZxS;vw`i_In-A^(OjNGki`Ri*_R7A4;c
z7Kw>$pL;8(Y0lib-A;z9EjmW78+a<LfLZVd9{F(64cx1=QkL!74jsy;#6Ko$9*<q*
zZ8DRMQ-5|x!==OMd<>ua;`NGV1ch*K+c-yA_coe0^{quQv1gj0FLR2$xmIhHl3ORe
zayA(u_or*eMVDfG-M{K@O+FNI>F$d9=_Qx#ddbmwk{p_TvC5|5BhFM=%F&KC_W)mZ
zc&;io`W`}Cn|xtk$AO6&-{e!;^HaP|p_jz>M>R3x($KogM=<ibP4<k9#}GM02gh<w
zXE(UNA~b!ImZB8eI7XOyJE|$|oUWec^$RH^<kUyXlkB`Y&xS;@m39LW86zzVibS1K
zww=L7ynt-J$MA96WXEQBs1DX)A{ud(B`MQ+!fp+E+U<9XqA##{fk`W4c=be02ogmc
z)42Qau{tD$GYWKSOMh%#=ft(3O&1(*a#<O_llb*niaL#E%1f>rPIKq)EaH_#t0Zrn
zFAA+K@^9nS#cHStcN2XYhOF781w(}rfmD)<t_r#;yuMAh8dcm(7gWH5Y(L}HL!%&@
zK;opyscKrfQW>uwlf%_oL??YYfh6b?Ns$9OVsu`uI!Wt{cMaiTiO{8DUFbYr;Jibd
zV9mU_EFQX~7{GnLDKNKHjXhQ9Oau~FbzctuwB4&1*Lh9*ws!va6=MHD9p^6Ruf3L~
zGu246AyXfJM|_CcGp%>B?D?IM8WL*VFOz`td>>vvw30ORQTUKUKz5K{DNcwUi5pAm
z&H2?z!Lp`-BQ2*cliW>2q*?%Ul;KNh5dGe2pByirXk%^YyJJsfd*JY~?`>Oe?J&q{
z43aJ5F2N7BITmK&qAO`67PoZu-3ZM)zu&tU>A0<B(>YGOX4j%_na)|dpc_`ucs=Yk
z-K?7aRc^h<P1PIxR37ENwQ>oDMqj!!f28@$MK@me6WT#>I<(})XgM6~*V_@(?ri)>
zdhXjHkL`WJyaRM6n#V?$CbA`Y2tDv-+hVruC$gW&ykpIlbPJM?dFdw>$4VHCcnh6r
zCCj~5Kw;eQCA(m{nRgY!6VHSnpTU(v-;`z<K}aZHD)b6|k#bFCe&!}2A+fnu0cqy^
zo1sN3;#eAqa!e8`cZcqY#h`#I!+x{2-g!3dnnB#EVjP6B!`m|Bnr@}c0v)g`dYaMT
zkXz@?)Hts|tLE4%bBUEpXIeC>auvAN-z2-c1fE8vK?n4?#G<8%&dQIc?ltDik@WK9
z427HbEw%OWa=UKU>P$(8d#tj?_vsh=%c4T0`}kZ0)tz`fc&udd=Mux-@spn+Ch#WH
z2yH|?Jbc_SQ2vsRal6a*`;f%ZN?`J<6F*)vWH*M#lzPG=StZ6Oy~A{iKz+qlgLLA>
zYlI{S9Gx3!Jwx{43mo~AuB?d*W;D004W8%wRUDaH)3oyzlHLMKm&!=1zAw;8bN<2|
zXexNISn~dK97#sx=tnl!fg>#1VP@x(=RBbLW@xNDX1zUe@K(NhwIx~Kh4?MpllL0g
zY*CYE)*2JtCxx7aw=T~y8ux8T7nAV0xJO5CSJ7GZrjT~Ey(wxX%h-~dxj(Iv%p|8k
zIOR%K@_}?mT-U({IyTr9&9rZJzgUy%x)G?>YTDnmG;-EFb-@03JiXzPePbzD!`h2+
z(ocDuDci)^A}bc2j9x5`NiH?ho(Jq(L5;7wDUZM4vKoo{BQ{H>Sciw5<SnY72hIDQ
zarIuv6z((W(4wtsk(Qe4o^TJWvPuY1@$Hh(pjWn)A}@J4XrGoe1z|#Tr}$vq7v_7Z
zLrSYp&s^4`@plNc=GJkUi1yrep3I4UhFvXdo{sR+>a<O4Uss6gJ)=J9P$Ut%AwHPi
z)W0FSqG+$nK-gMDdG$$!Te4G$`G{#>g~W#?()M0UFu7~QrMud`Cg#d)Jr!%7n<Mdg
z#lqJXp!3LXs5&5^T79a_Om@2MV!GY^8M&o{U8<v-Qn&Qo&RuksbS+8z>a}gZ8UB8A
zJ95yADMZ^6aCT;ox{vRPahVWdITEQg<Yquh2eJ)x57iT1(dnfHrRHc-soBw$=UOh1
z$Zmxl)DC~1m$R^gMK>x#)ST>QYr3(`#!vPu-xaHmg=0Z_O)c}jhIm>7aaVHSap8^E
z8{4&tjCtIBYYB2J1L*?p4ea5TzsfB{(y?!R*MCerkq}Om-*C5MvZ=(Qxc$vDUvp)X
z?1Onj$8@SK3p%~qmx+2burBdY1SUO-CwwY(Ut`)ZI?AcPM_l*44`~rt(FNnuOlg)J
zxmO_m@Xk|2H+&(x$lOg#FGBp?$5jqaTLPBuejrYfy^|E~Cv;#axdd%sI=2@FLzjFC
z_eexWrz>Rfrg#FMD}U<Nz|Oq4B+y`BskR)6I&Syb@ifV`Z2VuVR}%seZ!H@-JZWgU
z^)b1xDn@<SWA5^2>3bUb40-fanyKBPPrQF&+Btmg`v|7q#m>7%rMnY<oXjaoZkt)b
zgltgbR5!rt_%+|ll+RF;W=R$U^F?(@4;Zl0pL(RwND~<Jy|E|~`nCR*(lKCZOO~qb
zISd1UjN-|Af<YuFrl_${AG{BZ<oJ~@OY5%Rw3tDKBbAKBNTPu2e@ycf?#p*7KFk)M
zG!_WDRm8eG`5VkE#@>i`-dgy6gC(w4U@D$@S3oQf_v{o+GB%|#3Ne3dofl0!W7m3e
zrN+*$S4CPV75?VK@l&}s<LoDLQ9FZU@l0&Hlr5`4S}R3`OIpvbfNSSgYzyIR!O*dM
z$R}4<y3W6du?NDMoT>5g8fJv!-yUhP5W#C_6lnzY+p-Td&%ti;j3c-(?@Ys{(kTHb
zKLY$ZQxebVmltpKfo{?<6U0Ih;_bypAJ|XS!I<<IU=~7HsIwx=o-{|khM!i?-BPtc
ztDuvrKc!XV*goX$7G6G_T42K8|IOpq#pDTepn96IA8TGS&`r86zUr|tJubYE`8<zI
z!LmE}v(uT8V<-pv(+ym|wmAg}6hCErI?;XBXLOaYM`))pdnWaI{)ozzek>He@Ws~Y
zGPJMN=iF<<o!9W{yvji(^a0DbA|pbRWCvW{d7Ae|LZof*n6(O;fsx-b^JOQ80CWuS
zjS#q(MGD;rs8~pmk@<?m)=UL{SXCn@=pGg4xR9ugou|)F(0%AYE#2Q4W+fWEI1SpY
zU&mLIV89?#aS+u^8Hewa@oT$I1AnC@|I^kuuJF4mnuN`xw9#oH<>daF+18zR%`N#S
zepW%nb|XhJO-#?6CVcAa`gi=9P-Ckv2|)q}^VHHB3?;)gYM__J2oS%gik%157lp)t
z1`7c0P%RV5(<1ZgQbMp1&`;ZWtbQi%3pY<!_oYVQX0ejkz8}bH{a!2)cv|X+J+u`a
zNOo+B5&nvQj)z^c$0Y({*;c@z?{kPEL*|>_fxm^De1cseEl9olQSK;pMjBQi8e>xA
z;P1!It0ZN_HEqC3(-=Eqx?o}{$I|0Ip(tIz6d-XTu==$8p`VLIgZr}kvjG7}t#g&I
zSJr()ePt8Xv{dlv8lYa)Hr8^V6gR!+#Y)K)BzxRx*e=)#l{i%%x$Vw?Ed6<w9PI7e
zgCc+Kcjw0<fnC)1_Gb!FWi<Gi$jkEMSbTM!V##lnVxraXFX!@ni2r9v8DjXn6D=3Z
zl`_&N>I@Gk&%+aQyt*4LZRUbgme(NPBENg;VrcaYj!#iwX;QcFZ!Zv{N*64&Lz=er
zPOS{2Do@r?UrZ~+?^@@vuvx97{{i$_g^=uPL}>Pr@a+uHJvl6lHrN5Vge~x)+dxf5
z?nZA{>8J|yGa7VyLJUs5pP(nzdx`n8=P=6S={erkhHy?M0!@x1c~DsuxdD6>Q6`{T
zu#a*5RUao3i-#PvSGxy|@kGzALcA}6Iw7Km;<_q+byvB%g(7P2A*cmxA<T|Vqmmz9
zlGHhx8h~RlMX?Ut9)%Ettr7%+7ui9j5}7QZh$sR^gKkS`j5KpZclCiLP-qPi0t3J_
zbXSbNP(qKTDfs9Eu(tI<fOQ0+(^!=oNzbf0YlV<(#B2`Jqk(^e;0`@wefP`D#{Ln|
znE({bTNj}0MjwZrDOQJ&J6nNSCRNc>h3rzJxz6QUAVBCs1Bu|I4j9#|a*>eI?t@JC
zI1p@e<^$hg#U0dmLxf5pP*WBm(54xnPWS1Ni5B3sdeJ?Bgbe-GkoH-HoJrZ)ZD^p|
zm;p9+N2IyMR7Zs5U`8EdN&!$O_e}#6k8<^mTRT9}5JD!;2I1hjIV1dzhh|GMU+87R
zhx<Kt-14DuT``y;HCx{f3%}!0Q91N`33t`jHAIn*sQo$=mcf_SFjv|IJUA5MXK;J>
z|GKHvT#>zxLy^Hrxcd9x`2O6&7c*cBr+L1s$U*p>ksePeZ-EUu8~xgg?Cg>AG51Da
zAyAY&!nepe&j1OyZIkehYg}Z`GYB`gY(WUy3Aj(xduMoLMYVmjTqc1eg)krJ+rtcF
z1YPp@7rtCZLo3DlEH_gEuXDEE{E)bmHW<#~cvf|NGc|J+=qXi=uJfdQhkN|X7VJ8Q
zl=r31y))s1(2;G@9k>CCp&3huQX)@{!4GeOiI_VDVAS1uovOSY^4_&_Yj$V*&Ig9M
zc}TfTk-04@prU?|1Nn;DVwCsozto5b5e_VvxaRJHVcqq`c<*qTQe;e@`mTfleczWT
zuOK6ST;3`9?e{Td#1hvD7_KZ|_lD!!0{tV<ZbPJB-vu!ix<ID~8}Jn+uU*s3#j`*t
zy1RY9gNdT9axK^U>*gqTrhE=WBn_`eP-eIR%c=pTu}NBf>O6&LTq|%LG(h-Y*!KMS
z^B?=GxPW_boQ5Y<9PJ$0YY+631z=$2MO)Zt;Oau#jTL|_cHjkxYvShT_nM_-y&*ij
zGfXecP+6~$$^0YPLrNHm6k1E!<)<=<M{kk-TaSvAVBb(maV6%`Pg{e-mmuYgQBuBA
za62eSJaI%!D7bov$&ovbjQT%!jEEBP?c)MJ%JCQ`QObVf3MzLX7qL-P`PyB2xzDai
zE$0lLDwK^lIyzQ~HgR0c{2DDafHZ`;{yZ|Q7<M+=s(89n-exS)&i{ot3W8Ie2q#!B
zotzAP=Jy{1pNTd^0i9D0NZ;U%@5aKK3R+BaX;o(t%V$?@{=8OBArmUvwPo@QXn;+B
z_i(5nstB*HefJ357okOF#POf1=(4vE)Qekza2mUTVaDbA05su?zq<o8BV?MXQI`y*
zjGU+6(PeA_r0<q_2670@cy-t6RQr$+Gj!w==QeGn;dbA=8x{iio6H$NFiHkfn`eJr
zYjo-Z&QJ2{#9URXMo5+k1vYUZ)Og)eDVET)s%Hi``*IqB$`BP3s;UZf{%Sbu6-078
zb01)<OPij2?yYRl`Jt~(PWZf^Tw9%D8I1ta@T#xe^8gwU``-})oEv`G2tp}xU7<la
z+xi0#4HN;~ctLgv_0q>{wqnkk+W$xVpfyyDyjhQR+^~XH6jp6A+z!y;#tE3iRkb>=
z(?<={|DFDhHAPk!Z+C^c@P!ZlJ`V<9?Q0&5oWxuY7pURdLV5nznc;do4uml1L!=hZ
z8FfO&=RpVBA^dvkvbf|P>uoVbK1B4P(~4r8p3@L*A7%wkt*j4lGrUFeNTZ!VJ(T4}
zn6?ed@PeP}BkTes!7?c%9t|4G#$^keumw(ki@TE1-Kn&ERw9?}L6S0S&}n97(Ex4g
zIq%S}FauOn_DDzs4LI<zL&wP?!}I!U00&fISchdjUJ497MWB56hzr*@K=&KeX9KUg
zC;53VS`9Za0-`pVSAezMNaF<>n&3r>r6WzA)R&=oOwTk3AahksbQ-zImZrMiGi!&J
zcgnrVGd+s*ZK)d6m~OjjE?5r4MfYQZ*)dn)?pA$E0LBet#;)tdv3U{$K@jo7rO2?n
zXr26Uw=y>NDcq+Phru%N#JF%GDZl)H1ISf=GLF!Dd(30oxF`CK#|CN!D32U~*Pj7p
zOaKPfjIr>>D^hN&Nb!(OfTZ}?(W>F2=^`u!t%@ez`ijb_vmmGPQ>yGIE%ky1LQO8J
zj3`d?P*Pso+i|kELQre5)GcaZAdxYL_|5=_LZ^M0ulpDseMjocS&i??rbs6C7E>W8
zvR98|Y^u)8yu9VlfbxJIiv<V`G;=@IZTwX@E}0EM?;RuW4*Dd;sY`P>Oe#4+YuYN}
z`-W()24%nsEP?AX3B64_a#AaH6%uBXnVbRJBUyCUO=BTF#`plUHnm_zah+kW#B5Oc
z5Lhf`%Kuy}XfU^ZJ?FyfceA&B?B|DTt-3Sx-R+Hd8mLTZJ=2(@bs)oLI3g1xgl2*E
zB8GGNVxhDs=w4K93H-qN^LL8@w3OO{*d0E$2pQ@MaHh}>YGh_w4~Qa$AaCY;R7LG^
z!Nup~A!ix~cYstf7}rPHJGCnvqC18oNZChbZeP}UK?vq`OFiEJHBcZ2X->flA<UR-
zdRN=c(}H;)V)n~;<kB4tKD4U{MP|WwLAiWSI)hPs;)n$=0Nx3%D@Ippi2rmXP9u)Q
zAu-yT&H1pha}|6}kZ$Ey&q(X&pw0;Kwo6I~Wn|J&QI-RcR@Q0`j*nCI(=&>6mqM%;
zp{bj6{oq-G?ndbGz>@vtlHo`x;1jIUayuFQ?ie8yqtm4TNDEb-gDQ}YX&}EdoHHc=
zK+;pBEkV8G^~Fs{<(4t)4B0~8z|czRmr-Gc{mh=z6Nxc1{zB{HSw%j(^a~jM-c0&a
zx3m26Q<tl1<moZzrh(#qdEOZ%1|rOyopHdvng37w2H$%d42x%v6WtfV*qZ=LMqD@<
zx?6irBLp!&fyyD^ci$<3nt@DaA*Mk@H^FUX(lZ0vp#XZKg;sJ?Whm=YOZeMo8#PD;
z7XwVV5b0x-mfgtbvub2@4jQh^06D0X5~X?34p>Fny*xC8&ZI~)RD|^G!|5?#;Ny1!
z0&|+d97=*Y0B#V@Ns!&U-IMu3Qhw|j)R%OcJ7^sx7y8iHDtYX$dyW@bi`Lz>;PMho
zz+~o{oe?eE6nPe7`$-bAXL?mq{ny2f@9mDj3cz7Arcw!&LJA1Qv~r(u=qILrId+aG
zgLw*=Zofg7r8i=m0Ck*!u4BE(2bfc`;L7`;=`x*LpT*6XAwxv1Nee7<4!|g;r;Vjw
zulc?V63#_HoJ*61^!S>AOwaWSWmExl&a6*88E}@f4yuG$0v#YwnDk%-bB=s+o>>6W
zs8YH5$gy2%Vs^FyVy#VQ?z*(WEpg{Dhk^sKR^qX1f9t?_WY3TMKjdFGpNySUI^|=X
z1w!9{_}n+vlEs^4QceJ=DgXnFg+R6bTDWo#^z|x+X2fyKF7a3>;L<N*bD#5@0qRvY
zCKT1}R|r|XBjHD`dO*AMf?^O<*hIQ7=7Z@<Gnj0NG#0i3FMvs!7%yHI8rbDSXYt?!
z%?v$Hh<04?n>7^+FL#6>N0N%Ki^kzKj85C#_)tSBmdjZE34pHTFumY^rl$bbDNCJX
z^RZtCx_nR?tkY}zJktWpy)fEO`Im$3i8$CI95SajzzXBVy)$KFI`T+VhKa4gYzAok
zzqv2QldA`XZy}Bac<dJgx8X$C?9A?Lm5D`iojui^{1gm16w(9SP{kv+$%$}~%%+0C
z3PAJ7O)}@id2(iQQYsgZIrDqbRJx{W4}c~;HO-O|>gJISz*Zs3Dh!pvKgtgvU=E0>
zW&kU45dxzi=o&wSg}R0tME);1n;b+GI_s`NPdkk}iO~bGrx3sR!6gTbMvzB>Xw3Nk
zrO-74#(~AKk5HO<ppqG{j&Bl(8g+?v8RE!1(;mfwF1is{5Ur-CydQHW2@Rvb`pPWe
zBsgO^Oqrqlim;FjdKAn+dKf3=0*Z{&EVy_wIi(K{u4dkQdICT;+97=l)H|W+TM^(g
zf-6=1B(wMZtn0d7VDZzwfL2m|mQ~wE5tgGfWjotqTJfY16s47P$0*~UQir+y|I2U{
zjDxE^sZ$yH)+%!weL2l$xTFUGGT5|V1;N+y5&elE1=@0c*yL5R{L{n8buZQmUR5D*
zfpHKdKKp>3r}6_b6W?#&TR~JGsJN_gr5&I(vq3m|r@oeXOm1sXe}zD#(%b^@b&rKY
z-y{t`h6HKSd|+$pbDOb?VM-v-wOK|R3oV>kS!|QrP{8*h=;nI*9P3}(+>;oI<RtF~
zs!$I+WAQKxqag~XTAE!E7o+A+AzD4?|8c7Q;TYB$q|E|7$2TtE(Fdi@BlC{eW80P6
z`dfL{hp+3M`F-F%g?cv;R?-nBSiDjHTmsHVJ##vvc|Vq>xqn4&)=d|nI}cVL&E=Q}
z|H{b;w*I<;gV$09m&_Y}FzM+BYz1eg^S?S~Wsnv@8%rjATGi^$2r)aIowHsf*Nh>q
z`BR7=QeO!Ax2;lwoM*E~yI~TY^HhwO!%86mO55(ybp?z<Tl7YD_T~TD*{J*D0CSo~
z%zUx$fIR!=2#vCTs_oZ?q2<e<mHb)C)(y!3FOs>hGa!Yy^I<(lCenlXB_j?}*3+A`
z+~={gH3LqCJ<_{ToPHC+LLF{EY<;7mqc{_q0~azVzNN|98e#LWfu>BisM33@plvt$
z8mXmHXlhDIJ^pF-*pqD1CFZG_*Gy4Z0Aegc!kCuX`k<^n<1qZ;mBFtj`}b>ayvojS
z^)Z8Vg88E#nCr>J38s#6!!{NECFR&HBsAgt;6J?v3TMQ81omhSf(_lBCEXdI_LqWt
z<(-6{3xHY+iDY>w6^5Y&@+{IBlor(RPc;N-JQnF?B)9~2Y6){`50++%{PCNJ+ve1*
z@1?F(8-}A|(0xrS{K7iyRwoH^H+$_$9lHk3nc}ZoR#Z(0b7)0}ligUO1LT<&;s-Ot
zD$JyHjzRd6hT-tPRTv$j!jA2#u!eK{>z-h=atNZrg18(oJLCB^(A;@YnDAekdl8zL
zIU)pTRLhrR)}Fcm4}n&=30Gh<N>Vz)@FUXe+3D+Q759fezXwPdT@jtj=VMRXxr9dg
zfdPnVfRB%FbDSrVE<<o6Sg{YtTs1?v0=(fbEz@Ae`NRpW)yfsszM!WcoJ8|Lo60`u
z>mFG1)*ay-xBBtzqtB`oX@pf#QUtrcC{-=6u1=(vu1~_{0B}a_6~Kzn48jT?UI9ao
zlc1{x(dpxXB>!HJQ^<k{VRZUg{7FyDg7hFpdIbB(ZzKH~vh&aXKXyLGM8nQ(L^2^(
z5Orqplk;mnPyv1J!=~#9yIIvT%4=^<BK1-CmZ6B=2_V08gIP$w_kmD#qgPqzveinq
zzNExx4dVCS&=R=@p-A;{6NZ)OgRE|dcfH-M;hI1zAa(Ykn%-|gmF17`69a88OR~<v
z)s^`|d{84YwaFdI;#s5_=N4e<OIfR5VZ+Ug3Gduf--NnkG_j_I0`b=uIM{iDudk6|
zl-e(C-+{ep&Ud6f>|N((<rTeRRPAix!6U+NJ*G3Ii$5ONa65MeXLkWT^XQukV^PyK
zlTU97A3A0|(^MVuHH?kc#O51BCT-9y!gfsQ8Cu#;t}>JVjt5rK#=5ZFk#S3GFLzIm
z0c7Ba6sqLBo?t7AT4Zb2$s8rRunq|oIDMBTrQQ`m>?p)XBp*!D73hmxGTCrJkV9b5
zn;NW>p*l10M;P_PPpMQQO-qsn6{Z)o!<RIs-`_sS-C#R|P_HAt!-lx=6LJW-aYM_M
zd?1B2dOPO?IgN}jLFvp5vJqSja>QQ65JQEw*hA3Ta~xXt&D=h(LTr@X2WsVH;?jzA
z&L)^C2(0x}0PB&Ibj!S+D)1%TeB44(cS<1`X$8z0a&Nk-eqN`AV`M+|x|{wZ{}9AV
z0W*xR@6;XY44Fz%8qBTnbH4KISVe&bji2U8xIL#m%VH+pHjQ68ITQIX%s$26SBaYk
zBcJu7o~ns#_FgeNSCWL|Luaf>wmhh%Vf9`LxjmWESe<je-9BG0wlb_9u((_xzpJ$<
z<gm20kDwRxzcQWbxfuKT+1Xrs)8hOCsS?gE*za}?oMu-naovDnak$kE24$_T$Ly@d
z7&0uQopiz7)qg~Qh2a7qDZ29TP{_1m1vHyP;;xg(GJ_wy4ShF$hO_Ilo}Io(MZ9d}
zBfZo-k7x+O?kBQw-;nNkPgyO2SosB9z#Ceimw~jo;iQ{JIK(`78=1^=px7lC3Ask~
zYSe0j18)U6C~2A==ofBqC7GPz;}oJfZ!32?8F)bRlXZoJAJFh{<n|o*uRsYPmq`#`
z_HpsxG&Bn>Mz}0yz=LN%y&n=GzMtKPu_v<7lK`z)OdJ<AQtA=%J0YxoJQ@@T^8+$K
zOiwdHxKa87X3cjEf`fG6({i?a@{2EDt`Kf?+;O&XH+|#Zcdr07X*aQQT*~M71I;Sf
zGj0Z@{8Lpu30xlTX;)?{O1#4IT=;*?xLnpYHa1Q=BhALyihrK3;2#jW=Q2IJlT~8G
z-1e875)keA9;*G8hix;1i~;|5!Xk!Nei4!p-yji6!SFgYHAYI{ET4}GLP=X~&<zTv
zy4c~fl!`7bhZ`gZJ~JmwL*Rs#52*AFJgpcWk`%xmMFX33WJXnTk-zZvT_<3lc3~hn
zNb4A~)XOpOmR3bLOw0B<ig^uzj~5U6G7&mlw@;~DLpaUb16cC=E)jca(D_`ay}tz=
zrqzuSR7`JoIDnhTe9IZikE@A2($1|BCIV%1w7U`m^A(Fw@m_!ue}>eDLqZO5vl_HI
z@34XZG()aTXmEuwbX8=^c1>}WV)Dy_K#a<bS33~)DgY|FHbb|Yq8&*WU$ATReKGw4
zo{EYSWJENB>$A>2Ezf(jo2ve8ZR=stB`XuLeBi;ecwb~3UA*iu7JSVt0{=+?wc|OJ
zUOEhogvbWbDq6;_5B*{^gfFX__;a6*=5Yqg6-T|!@4PKrlgFhSPV-rKYdY7~J-I05
zgNu1VGcmT2D|>xI)B+r`3UAsz?}5s~opR?lEXSzN;{NgiO}s@~x~TCT8tb2ycRmax
z-h98a&b9)`c4kY}bM*UDm|vCxNOuMym^`Ka<W&l;#nQf;RJ|N2?^HsWvyPo+ry!nJ
zAzbLcJM_$EgIPCp=QH_sv$kz5tzj|k2{bTL-?}*U=K2eRi)pFD&@;9ZVC?FdFAJCz
zPg1^4dz2otT0!3j(da0#cgKZR^(-E9-(Y)!6sEqaS%KJ=4K%dA_EMnV9by`Nz!UJY
z=uXwsGnvY0DJ?FP#pQhKflq2$5p=OCAI-WTjy%(;cI#QY^QNSFb;nC!yO{!ryYCE;
zLN}b$(*?)c3Xn2#Cm-(39>&HZ-omK*U7M5LLUXNHPMhRH?g~!hvF<YgJDE8{DPIl>
zTALE@T2!)FEnP3s{bkVuqm8qyBLWi})O}-}r`39ArbUczpBq9u318rhhjfJ1<Cglu
zn$H;9r1>z8m@O8!Loa{A2HRvS7z-1Jj9oqRxr@Fyzu|tTxEp?nb-?b`2jBrdcAm0i
zBeeKJS_{m;e<?v(uK8kbW468<qd|#Bb*szhrBop9AqrGFldlEQ<F^)C_ATPFpL#U<
zfM0(A(DqvzK~*Z+<j&)i+&~1Q2CzLGEon~(Pb8usGhQFGUG1^ywb5|LT@kKs2$xh`
zza2RO{kgxFE=0{1K=%wGrt6h=pGApfX9;Mg5Y0Y3#`mss*l>boyaaBfIyG>duZm;;
z`)&|HHg+2`vavgM4m5^O^uOv!(EGlOvU-VHtFO#7GoJp0G1X(;vABhJnzY@=syipc
zNP7lYd9!$8Zsn25cx(uE(Q^LSDWsJ+7I4(`Xs*ofcw6twaxd~m2l6kG+LKo#7FA~7
zjf62+lF-85zCeA2e^>vl5t)Q7Ns<Xl=xH9PY;2T85-3P2^zD;&zaR@Z$1~u-IuXXr
zAZD8@)c1u9KwQ)|G0HI<6#o$6T8ibO*tz6OasqP|-IpwL=X0SD>MNUiWC`Sh``{kY
z$bYH)ptYX0_{%i7>PgBv0PM7yEm@I8bK8x6>HcIf*|_7U6b=u4MXrXBppfYo4k+QR
z2{|jUpjc6=ETTg!epSE{`aYB+bLaknW7df=?nTh1bcArO7hIkvk8pmg=%4AB`^Y|h
z3;Xm`w~oWCmecfVVS>V0Ui<s}J3j)gR^`7`g~Vcfo*YWg9=l@n$FVQ=m&e?hwa~Zf
zUt7IT^QG5{;@tQ=?&m^&#B*b1mIU`ssKdO?@2A*2AvWyT_SK!cmC)5f#-qYp->TvV
zEnXKxC-q}e!n4@F6i3Zt5&krZ`EhnE6yJq9-?Y?ZA;?6&DpXN7Jmmx}ZHuALJ57;7
z$5%n<aX*9LW~kiKur%x6tg{w;!*T+bP)#Yh3}P2m#D*)q=4?pqP{P|J;(L%F3dMc!
zSzvMqjJ~MJ%lUdAv7Dg4O7(OwXP=qu0|Yjpax&A=!J+WCH8Th|gaD#z>A@;pWLG7A
z1Sxi{#8PEj$n}KqZ~pjvt3Dr;bx4p(AN|y4q_9CiC&d5MDJrH92%QIFTL!ArVWDnt
ze8)sbe)(H?Vu+6!^q54|bNaAd5qiIIqxBJ?&i(?HF4FJ*y$N@Z7vtIEw4D4UCXoT$
z$a|l?tTtanB{&{C*Zfu6wmrzIR=<)ct?qtxj_GXS%y>-U>(5UL62i{uNBom3rt~~R
z{>9dA><d#a(v;n5@tvW8r6@xd#r{s}gJ*EUcav;2uYN5$9~O#CK2qSGE%Q1g!MWo}
zmD>8COIaUePi7D=A|I+Wil7Q%F}8hDou<zfdi0@@@B;)DXcH~f)s@kJDp6q`4tbZa
zz-`{iyaFX~d`pVk-#$J>L#y9D00J3Y83zoCVx})FR)-*jn`QtqU=2BVBwg`Fv%vZ_
zDS$AU>q4G8j5qi8kB3>ShFWwGFHKMB?i6j*sg~Z%+)j-$>jLH9$MpUK;lhjiP7v1j
zTXS2^j&bN%4^g&K`9Maq10T1A#>oa+iIZWP(CVNM8v2|iXEN}`q-1veUZ`_}Xr)``
zk3q(aQxAoKr%HP*ARw)Z!K#VHt8mteQ|t<YYx=o4Ew6o>bQvo&uc9AYb}QxkGM#tN
zW^B2KywT>evHMF3L4yjyz{kb<K0LpX7beHCvW=R2nA_orK<Y5-&tVs4`Wl_z2>P>V
z?B0~`LPYq}CCsKZRrs*;)NgxZ6xbhrd8`ql_zoRmYsAvD;aQ&VnVC=>Wm2>C{=+uw
zeIgQG;E3)xRH(Q@s<SHeVWa<WdiLc)vMaYWSM}pPcfE;ASf&P{A0HkrGz?SEVzz9d
zQVTd~DQ0qf_X;w`?!712noY)5_qaTdz<GEt>z@b(V*OdF-L)a<E?sUEby}p&?(<p@
zk~&ALna<sPKIbz#x2wsV5Pg)%g`Z$3z=TysmVYlq&wN6S70k&w(n&I3d{f3hbf3WL
zi*3VNxOQCDA?`)me5d}c@(H4bQc}d`u&wwpUT>2s;mZ1GHv%C}4Q&|EGY{3X(S5uN
zgfeYix?!4**SlI;0=?M=4^0J9`Qusc=9JoHW7$$A%w{d`Nnz)W-0;SDv45_qEV8Ct
zN7!btG&AqIN`-BVgk)<uEjBq(dmXbbwh-!ea~Yyck6-OQS2lqegIlynm*|+)y}QxH
z1KYCPc2+q9h2Xf67B}JKZ--ZsWUFQKkFi<LUZX;pgcvDgve`^~4@ej2e|}QrK5ju|
z(Y>n#7P&lUOnRd)8>dGgDpUN`@VS||rJAh30>>Y*o+aon;Zw$fH!m|1?q&<{uExGk
zlW@i(_Oz6%4LtrYpZ(`odJ=-;&iLsQP-F}Q)+|4rG6L~-^uK<%UMM4cxjU`wnwO^C
z<Na2Pty}1Co)@%;1BZ5YcSPrjajoX*w+*W`GOvo71-Ea8xs1P(<#uwvaN9;U)I6Zy
z?XISe`LkFtmdi$8n6q!EY;93FOh1495d9oZbh+nwtMdEXHjyKhn2j5|hHZb`aNtuw
z--CnNR{fi6R{edAty`zc9M#jcohJe<Y14C;v&k-EAT6E-glgwHsRbzkT}9tsb6_`(
zup4+lL?-g!zK_`{Q~kB|bD3*+Y+42ES*2Oy*-x0#3S8r!mVTJ)<v)U6%Wrg$E4x(2
z=JcX;*D_jX_H<As9X__*DbH<GxXdZ|zUi_D`@+?(o?7QOO=R!vkN#XqsH{a!1g!)s
z#9(@>gWP#2QYA#GEOtX3y?!FPY60!i=R7S-DkL$fi$8~lq&CgGka*$tAae$%o=2%i
zbn$5aJ*z9XLk?k(4<d88N1ra{xL9$5-dKA+$emY3+_-J+4^%v|rVT2$xPC_=o29YW
z3*D_MYV@sE2|qh09b8kbcc$@p8;rASThn=#7LX-{kYJ%St_S{=eL=?Mc>~$oSi4~y
zzaMVwi751Xjeyfi8F7J=k)z=y!^0SzRwAKS7<k?)qUpH(*Y(yD`NJ9RC0)<yI#L~a
zyzEAc3R}h!i;IZ4l8AjVx*(PS>-_lxea)}~2w`J`uf=^+iE<%}jA1yVdDmAIc_5;z
z8$iPsk?C2^b>L_V#tOi=5TH-nW#I;_)8B>FMUD}%u~^HMerVp>c*eR?<w9O~Ch(i%
z{<C4W@)f&Jg-eR4n1%Uc=Q6RieN8K|_0qhvw139V{HTS&vr5JyJBS{8xT|jFvlF6N
z0io$2v15&SZ;t={)K3rzEywp3%YAsrp~B<gVSF>~1I~qXozx`)`;>OY>W#xZGZmQn
z5L|!aGlQ7e=O0)1yH~IkLq6{2dK!4H@5<zlkNov(b3H`Pmgo1$3u2ZWGboW*HYBFL
zZm_!sY)?7d{(2bWs{P(=e$Y`d&##)NP5NI3+|N^@h``E1FtD=86Y@NJ-uQ<C{P~DK
zjBOO>McnQM_j_c3G-N_Tfjhg9Ba*K8hwhlr-=0DJddzc~8nU}vRZofceh^OrF?U|>
zhSWddlj38t|9_3>_e4+BK(6@ztF7Z0{RRUE`_C^M*M|6+OPFx(-l45yBNM&6JJF2_
z`8M1=OZ(5L5cy=N0Ys@-?davGz3=4+gZ-iGw>!~M|NRMj-}u*J4@<yqb7yA2-J{ks
zx(Q)_?Aw*7w#D(|e1GMa_e{7K>4A_(dg&|%it^9UFOVS<HQb%3AGcKwCU&`3<L*91
z5e467&su>=TK^$=`NQySjF^e?-48msXZU}78u>L=6+ki5%9~1i=P>>gGSI&}(P`3K
zGHib>(jSWB=db010E?a;WUpH!*z;a!y$9-#b9bT<0yroChtmFMT@aBzCxv5G`1%dS
z9?>H?Td`a!y<cb4aZXTZocI4YRwmp?s>HIwgl*3UV|N{`Ur0ulZ{;mCd*1l(k?r$T
zf^SpIJh5vo{;42D1QEAQV0WTZlu{c1=a==<z!~M9P~_e_v;agI72VoZMgd2;(0{(`
zuTlNnGJg9JW%QAvO?=OLMY0iPw1iPc%NOK-2fhDLGXMHjL<dnu;z721MelbJHXEMj
z?y0I=-S>LxUytq`Tx<iR-Yv8D#~1GTpeGe_s(LYiZf|Odh`n$8>#0`wHko+Q-=4r9
ze|A7XV3#lm_ah8G|Kry9_d+@c!l}}EB-ioBxBU9mvlPLaPX_ExwDeN%A_f=vUuSgD
z4YtR|_UX2(du7mu$l%oO&@9*4<@fKA`d<n}L>7?&c96l|74f?aGVuK^gEgGjvwOz>
z??J|vAToGA7ni%|gPx*@49*(wZno!FCF1wK@vo<DA~Nt4J^4T8u!P9K79)cIhNS;n
z1_2<0{#$Ylf4u~ZC!wo|44&`GK<ILxJ@y_I^KaF*cn^`m=83i|du6bI$bb_ggKZx9
z1OH?E{~Cmd5F&%mfj9TAh#x0%4jy36!TO2U3;%lbf1HCfL<T7XahZEQ2zEEDng&J&
zFK<bt?0w^3Pt}16XE7E%`akC2fP7mPMg~NTwg0yao+0Pps$At?F98{p{**x=<{Vt^
zU;IC1;DE?r9j8rruMCbLF1|8G1|LP__wqdceGXU=89WFS-Mb=w+{iijErX5IuUGbr
z|F3fpg~%YWB`$5x2R$Dks}_!tLF_|`?7eUN>!~{UHkPZR|Bj9R+K@}gx6NZ@5XLz1
zQwFhU9Olh&>aN__dX{mG(_0ROkG07Q1B&9y0*bU3g}c%`6i)p1Qns<zm+aDY7n_!5
z$+x=T|6O14$H!+6IogYP9MGyRKgLbb>-AR*MV<-nf!rXf^Z#R8yh5%h?A<Hs@?7RG
zebyUX{^>D!VdL6@w(%Gi5{m0Og=_vhSa>o_M1m&gJdbrOsQ}M9DMt<d>HFXE3gX4<
z|6HBs4G_}u_UUG<y&^{u!AkI9EbD2nSI2&u4I*M9alM5LeCQA3ceXbVvSR`RvCnXi
zp5<u9KXa)Y|Jn8lRNkCOtNowf%HachmCiFk?azPQwM39m-eflBP)>NqzDFdsPUd+p
zY5^U|yI`Pi`E}~NAjaYq5k)~jpn&q>;r)Lpcaa<WJXsE7{f|||N2Y^^0pGA2;r+Z(
zJas526s98!7tFF%P)*`7Q8U&L<K*O~h}sVv67$&FDBhma74CYk8@%tgc-wH8i?+Wz
z&Ml2ekc)?okrbt;KepO_aM0@GgY@wSxy~I~X8ac8&($n61vwf1Tx>X#Fgi<JGVOH?
zg!Lb7V?qFDBAIX3;bb{`H2LSkdTQZ(iRzj#YKWdHqPikW%MG2jYg*CeJ253w_ut3W
z^&h@@or025$uusmfYG2!``|&Q^mN}6zk{k;OhwDNTjC%6wS%=Q`|BT+q?KSTKX}l3
z6>B17bJmI6*w(23iwheYTdlNhV}SK+pU~G5JLCQ@PG!>2z^FolQ(S~V9{c2e_#vr-
zEs~R#l%Bx2psJ`yl=(Vow6s6og?rK{*s|m2Cw4#h^GB>5RV+5Dv1it~)Av4AEY1b2
zzkY~_66oDz!7~&lGVf7-U@1!3^=bD@G;sF6L#44W1V|QnN?Dp5nK&AM6P5c|Bd(J1
z_m_xBQ_1U=HJ-3c!8Kb_L371kVt!lOP@BiNwEsGX8fM792gG*)ODbbJ_IyfW!rqY}
z!^@$=x{)j%_1)NjrC2J%vVp9nXm>P&S7LKgA4o~pAINsBuX|&$kSLYwdBXG&W=_ql
z1oyKn3n_b5!pkV8TBuPMdW{Z>n-^gI{(I{7BG|!tsQvuPa@Y5a@8`QrEU{lI`8oGA
zRcJVd=%IQ`;+7bGO}N5WMB7a;O<mDU$=uv6`?j$Y^=87`H>*|VvH!fr{wVg38}d3j
zraPOB7X$^LIWK>I-GuG_&E(}jpZO_;=KTcn4=fLVR}!TCN4me43WgG!i-=|tBbq^%
zgWU#9ZM{W&$tfxM9!sMS*)w#E2WvJJ6|qlx%H9_tiA&cmlJ82_W~e+NqNsS)!!#+$
zk!gsPPL}1gXI-)xBP;8i%=1^Tt_V8cCdg2Nr;z;wZ}e<@xX=AoNT`Z@$UWH~*&jZf
zn>30hYRCL}_fs&SThy?b{Ly93j(_c<-K`~(LQ(!kL#fK0t}`nI8&zR{P-sy_wd>{a
zlH6;inRFK)n=!zH&94b0<>V5-eBr38kyMR)mzY@pR8;%=^;h)4M->X0MuzQG2XCCd
zboL*Sv0`VOINXG{v^4ce_FNMl`q`(F@V{0w7RO!-5v<LIO4E)15G*GmSiD`q0vYGN
z;<`Gs<abc;nwv%QPI>S+UWoRW#u4ow==_u$uiasB#yN0aPL+Ms+QDCXU3l8JbM-}N
zXsDDr`cjf+{?U}XOhbGT9%+>IdPhv&JJe5J6ST{k{xJEh?bbg69e2g~#yuS#WSg9d
z<6%|9g^kj>nxp*B+G9lE?{lBfg5RiYQhj%`{e4o?eD}RDQ()M5rB<I#Xc5s*>)^1Y
zWF<5xg{2mjuKg6tFr2dLah~feq2~=!sW{Eg+~@B#yvE6)$3APKebw59w9_vw?Xr*A
zlv&ahnnRQ{sOQ%e74iAYUZ~H7-^{jt&G<dlWpp_<HT6q|HU7VLVO*SVXDSQ+fw&0u
z55Zm85^4p9{vMmJ$cBUnZr*g+@uj1CcFnIX#wBt8daeo1?(lET(pd;=sOSt(b&5K)
zGIluQ<Z3^&wd6QL>l4kY!F%>SsE67|A`f5PiO)BVq9?$~m(NX0OS8N5&;(WDLY!c~
zbc0>i*MEdTLs3-u+9@p!DJj*u`uf+4IUHwF5yAbQffi1Cd*@9X8=rg88fCtwZWeEQ
z&Qp{b`!l7H{r^6TDY|zZ=`1XlMV_=KCMJ@$Mo?C#kCoh0HZ2yT>}D+F;_BlJp=uT)
z@RrRQ;pMe=7o8>+(~LLL1ikHhsqKbUzzlYlr39DoNN>)f(pB$TPQTN9hd&ljue^_r
z!0hklvpDy)G;@qtIyyO6)kI5@Z==qRo1g#d0E$c@dcLz#(|pg?`nALOXt09HD|ZiO
zjkd0)s)Tu0DF1El3!QJ@a$2ESL(FKCRMty4#e5gub_`Weln)7COvsJ7X`h;FsVjcg
z>5}YvLYAerWqcfq<W^x}PjF~>ZytRIR_=Qi20Mm_@xD)=+ShT{<?=nz+-J>l6C;7~
za-464$u$>xR8-&VrsiyGWvVf7C%POKvJ?E{Qu`^cSUXDOuIl*eocGu4FzUsRg5tX7
zcdsKik=p_PNoiabY)yt-+@iAw#Vr*2D-}{Xvx2H<)|hJU5cTG89VSmkeZqkT6Df2z
zBX!r83F)e1^BV#OKbS7@1mdiw^weD(A2W`#e5jC98CpHndB>?Q+xU3hWaz7!LwTm^
zhS$!2s5oJf;HiaT5>`Ewq>GsoqB7|yGm1<sPuFr)pRg!)`k}o)96N|k<+n=xwdlPU
z;l7g*8AE#8+avs+eN5>E54M-yd(g%zv55ZheZO_A2!V+(&T3%ZiMQCOaW}P_8nT9l
zr?@DCsTFTteWan1YM4b;EO~nPcxBJdT#UvMDvD|W)gk-^GP@%G!8#jnyLqz1j~#*+
z<Qf-n=zHpH#>d9k>3Tc6IC-Rc(Z$9JvH{<R1v=<*lCzS-eV=`b%z=%^STj4pZ)M20
z#Ps`KzfT4683E~2#A&a4!}(OR1md56Wx4$M)Z4>*B-6Zo0<JNvbqfHE<PU4GntgeB
zaS>3$bNa=$Wox6P8kq)<Ef)YoA;HVbJDt2WU6?5y%KVz#ef4AXC%}qc0INqoF@7tY
z{X%Xm)P&#K0mOJB6t;!lym`}P^~b;>!2F&aI(DvGl+!HJM=UlY<N4$l$0`fAjb)kc
z!&1S1^F5a?UrsV^igtZB<BWYWariVIfD6bv&Q`Js2oLZw1}?)lw$+6&C7E}n=Kv<5
zxA0Qnh`IXDsnB5Ur!#rYy!;uApWF7C2__+w?jJ8TRI9%0JVapr>O&3dynUut-w8^R
zYWA`W`KQ}4IM{bx?bPRAZhfbEwrCga|E;K6|8|IB<og?62^xj(HBm<DnO}Q-#_Ji&
z=*2U`4@{15YVvZAkUo%f$t_xUUSQT9Hgoq?z+)Q^F^*2@l73ulu=Iz%I_deAQvQzP
zz6)B~H>?wuCSJ%TjYfFwz3p;zk=yP|=|c^ccJq=$4_LhOrW<4h=ETCGQqFRjKE_oP
zDudl#$PLue$Gkz9cA|G6$Gmtz>M4%U>bHmXfLZQohjOt4z?DE-71{El67?Qhkz7P-
z5;<<yoPex$Hlft|vwky~7WET%AvHdM^y22%)*_;hv=)V1fQB3ksh4Et4cAmrQMuOB
z<D<Z{4z)TakZK=`n}FK9H&7ej$g3iUv%ivo_Zn8s2*t-wFH@ht3x$$x8(<VU-ZKbe
zInWDmS|a6~(0Ifs6!~=GxgGh&0OQ9_a)ak+U*D^mK8_Q;l|kmkj{6U!`z`Q?<N91-
zmGT#RJL0;{(%k%(s(dJXVJ_2tfbF6|h45ykKXJO6gvZJB_>gNHc4<8!rE$Gl#~%#W
zjO5UF9aXNY8y77^`>dZX9Vvg1&XIaYwbx!xwXPN~(Bxj<J#8VmV`H}*h`ja%RQ@20
zxR!w*@^B7bZbAB`yrD)iaq~mplAY{b{MvIj3!I-R45vA8X2!<SCnP2mep>vO7)L4O
zZxQ#C5U1Om3XG06B3^o@_vpw;!QU6t?mgLi22_NlkymX17Db0>1MwkSOY`LJe&Aif
zKG=TuXhj~BcXX%D5ne3p2ar<86MWJtFO?pr#qpNLOy>s#&#_U!L=p{Hkq6%@WS;sY
z>dq0k0toN*<0B-!y#SatD*|5q2(@fFRctEi4A(W=$**N)ObRhVZp>FKTjIny?*7nI
z)shf+$?wG403a&f+|5l_K0s_o4pB4#($`GLUWK=1sOnif!Y{;YB_roT)h*hx0eEie
z6E}h1g?_Rn-b?wwL3JAd1W`SO{uQ9|{B;x`SlTW=%tLfs@3H;YzZ(c^(RQz|)K12o
zD9lSyki)jYuMj`of0^Ah^eZoR;p=m+1-`518=m-f@mXun@vt3{WVfASzV*#9hs7=O
z=}2)>`bQD?-$hYYeIeTdR2|}ZOa8hioAhl|5_-bD_XVgoR#k6Xc|WbUp?IvS+SSY#
zU-hIgS=F7Dq>Z(&H4BfCg~cg1*VyWKU0t31;|Wj9?TXl#J|eNdY#fJE9q|%eOXF55
z@kx8EFp*+0FmW2jxsr5TDo?4N@V}CQ^h>c!N=q^*hQh06fFzym>iGc6%>l*N5!_@{
zZ&U5JH`h39hb8H8%<`Zv-`c-}=&48+fkh^o$J;$2;Wf$r7xZ#(;h+kxV)KdIkdeVh
z$~>cM0W@WXTXp_h4wl>i5H-9B5L)+MUz!?wM}L^k>a{l@pB@7;=$s~Bo&b;=aN(cj
z@K#CF5HE3Av3jlXBBdMQM7M`hslu~M@a5_wCaSSK`zW2DBAJ*{j6~-yB{VPVIMu0f
zc-m9X?;r(8?kv>TnG@)HijH5bK1Xy>Mv<C?Sxp3Vdd!Pys7T~OJ*RWjWT)-s`;nI<
zftzQE=OM~8Yte*_dr<DkR67p)nIjY#<Y1V7_7YdH@lk#pJggynljX&U5>}~Uc6Gim
z%Fpdz1+ecj$DdsOJW}>mH7&kSx4jK@WHLfk;c&g6QT@qY<A{@I+l!~1TkjTJx-8ps
z=bRJ!h29_beaX3fC&;RKjLPg2zP@2Mtzl%lT+4O&^5+XZXV(TD^>T9^a*{K;J6f&O
z(HD*relh#=ipn{GRcW;0TjwjKI#F_D{sIe2$N#*<gpf<@^7?gm>~CRB6kU0beOV?q
zHy4^dH$JHiJhwkV=si-ylmpFtyT6SRS}4>24A%U*Er2D%Xipj%B~v{ju`3(8P2C;$
zj3V5VN63C$z6b!Jrcl|wWbW*R`w(vtisYx)?*HI1ZGCgh&dQzMcJ!5TD{%6pJ}|!S
z)03Tp{~hYRGHxAF266>-=)Rsq4JK`jTR6a2^-D)*Xd~5Y2;4UPE^T+wH|z7?`dy(W
zh3Cj2tw5o}MD((6pt}DnJzZ(6dbSb4%zF!pnFQLqOgCw}FBMr%F@DUmoRhmf9X0)m
zBCy+3J&JVyw)WAJ-N#jN^JZ)m41!PAKaDdWp;kW<cQ)Ak|HIZ>MpePBUBl8XC0&~o
z=?=+FBOxFl-6h@9-QA$lpoG$}X^?J^PU)1Al$3XIpYJ(OobRuUAp<sRt$EFB#`Qh?
z5=1P$^F%;Xg0*0Ri!I(X<!Sq!uI{q<n2(lhh5zU71-ae$#h0N^mjzRuYa~rS^)+~t
zSEM_{sVDT(KY`<4n-OYLg^PC*6HBrET3TAt;n75f1S2o#PCL+S@M2y2L!=v}ig`RK
zwDQ4HP*4AVVs^a9C)p*M<xKfrH3(01y}Vu$oLd_T!8tBYYy2O8^->7jp0O^70j?eZ
zUM(zrGZ>N{XqZv2+Pe9C`-mH|{r`HBor5Rv2hf+Z7j)f4LgvB<O5r%E6Jih-Gf0;M
z@r?JcfYq`yTh$UW_n7^F7$g$$$4<I3)#Vu>8b~+bqp*_dacA;FTwLo4pTrisTh$f!
z^%Viz_W;duy}hWnL1h?EcUHmir&-;r6ZO5pQBP)OV%i1T?VM;I42>;dVj1{Ee`K1F
z2aU3L6U0h8egf`7_e{}4aDFI?cFq+SNCP3&X?V6|-e2-3Y>Ao}Y8B-8YeWQ-Z9Xs#
zZAxw$!RODWI>pk5-%6M}H{cPIL~7|%j!lG8`5zBg6wDt_scNShlb1?M=XzTZz4UTr
zid|-!j@y^p5Vkh{2<YeDDyuLn^$n-kkb^%ilE%~~Y<G}(&5w5R#v<Ne=CdDYE^eDh
z2#k)^X{Z%0XjvR#u~qq>b42cE+#i;SX);<vZ~xB+po0xZKi3<{>%V%MWYZ`RN5yS{
z8ECes$uM98p0%$A5oHG8>tSyczIXvlW(7q5H5#tSL5CoMcn@4`ilhLzBs@kQE4VwU
zr5(yvN=u5}9&j%Jyx6tyX#Abn9WUtWOf@1yMw_0QnRqO7dGtx?C;nM-iPuOmC(uqv
z%gYt^JT+SY;@&;bZk0PV)onN1V?Dlv3jXr(D8>M?>)V?gy;S_+<fS}TScYrlOt{eD
zr_ircKS~*F6)m>ptuQ2kSO$0RUGG+-TlRP1WsSyl=?~2<m2xHdck1U-v>C3912FQ@
z*v<D?KErG~Yo>0W!UM?L8PWQ%u<}m4SD4+-FX1)HVo}yOb-(<0;a#K#XqXX?KEsHs
zL${3=x@S@n-^=uv-<)d665mSN)0Sw4br~A27^T`K7QJ_<nRbHr7s?x!njh@sRk!rR
zuQpyD;YZZ{Ujvd3Mj%bi9E#AB%FkautK|d<i>kl<j{#x<?eRPm6ckFZ;@ei;^N`8a
zfndQl-k;kzw%ST~Opy?hRr38|ln#*V7<CDX;YfL`5{^q+fEQ6+U*AqFBcOQGGMb3}
z3%F_${r+BCGO@4}0tE7-KasZVqmi<*Eqim`%l=LCgdgBJvh*v~90zyK>x!0B^wjk9
zN#NN*y-!S^y$U9H2a-!TZ>~1t5BZ$Hb4CA{Oaa64vr9D|N@p*!%=Qdxd-&_E)9O{%
z^Tf?`|0E`6?ioh_tz0Z9C1AFz>_DysiDdKcqaV1#<6iz^)cpxC{OiXUjBg8DIs6XU
z!BkVSzyxWtU>r_?y0dP1!i4V+)UUO+^IW={Y|RJjor(K!qpwA;3pEy{+Mkkebzjm?
zpv2;iGV4?FgQPcVySD3XKJ*O)kG$937r)GhL_p04BQvvt1=iU{fk-cM?_p;s2B3ND
zYsY2C#z9QG95~1Cv~HxM3C96WhB~yIAg_H4%L3&ukMI5SLtqWE7;=R75f*qr!XTU@
zj(LG|4gz@i7yU93L`n180pyk4A@_}{f~KaXo`WA}@f7&kn7@{zx#`F7$Gj6eYi8iE
zpz>IS>%2T6c6f|@o!wrjv)Kba8`xFuH_)&#@B)uYD7akzd14>JXED9W?_`_Mb6UAv
z@N53eg)sqlb~YxqLM;|_9>Ld{Yqr?#@Be}R$I8^-?VwzoXintdCjMtitzm-4z*Jo$
zg;U%2wQ^_{b(^&~Z{2hQ=w5Aia;vMk7FU3qAgo?%)(NNM61Z>+_9ly(C)S^AJ-XhE
z*Ah`-0@%aR8SUa`y>8K>poJ}K_c3rH0lq-n$%*sPHKln-FpJqsyPX9*k%1tE=XDX4
z>eEpXp+)~@m0@2kl_&6=Fe8-mhHcfSN9+b&b6bLNP7QH6-baECTq_%3R*8Bla<20B
zv3_V@EjcxjxQ{p(TvRC?aa0>yz)T7$>=JIVo@N5W$6vFm@4}1C?`ff^8Q|im39&f@
z7k$z7*^bcGl4BRv)4=z@N*Lm)v;d5iQosxUISWAr8}m$PJ0A2m#$^z*obeDmUwr_P
z7e9dR-Dbygcy{+q3j0Z#o1EA--*AmqOR(5*jnxK-C&6<cG0l98%;NH1`YSaOyGvyh
z<BfTPyy>^fymOx`v);IM(nnQ4XT03g65!G;3{TEk-;oi4qaJ4{u>D%EXqRfqf1HT%
zJxJiMoc#;VgH4SwIkGY7aVFzp@LA_Y@GW+);8CE5@*)5L2o-jlue;AE2KP|M5CyRL
z+R|4SddVYp)XtfEm40+4dEAa4Ya^cVXFEBHF*7n&y72YJ`?&X<{RLKPvz@G?pUsQc
z#O<`3ExkJ%Zl7-SevMT0QDDFc{;8s3>*Z<w{a!PO)j=b!3_3X>u_@uF88+lkOu(f_
z=`D*{bQZSnbcfnsWplK<-)E0NkUBLPlWwzjD;5({q_c!-%U6k^M42OVE%;)){+-p*
zCtNDN?TvDAZW*b7zIuM#@Y_bz<h9?kGvzhy_sMQwH_!{Jn=S0*STo0XKMZ_dl5r#W
zH{FqIN(~{>KK*bp%-j4V<EP^P59xdl0j!X~O_Z1sXCtAsBXNX-;>{*U_gS>nmG0z6
z$;zHSXPoC1joTk98G@(KBq+c74kC_EEs7I=;xdmKUcXX30+Wjcn&FEVFO(Z{c7P$x
zNe&GFYDVDFn!>ASS^PrF4tofTqDFNCcs@sxDP=1^hBi(>0$I=xhqk=s^pzn?0_tHl
zz}feJxp6!75P>Y^`rxp(BAcv$G$3gJ2`XdJY370;oKEXf3Ja%cfu^-5py7h^m7M*-
zI{lo?&|_ZDLfdH<`C%iN4_H-+ucWvs`I8xx@*i&7A8NLOig$T&K0JaIQm`cCAEXRs
zblXgn)mcwA3<9%7jJV3+$cS4$_)d;q>yghhO~tT*Y7Taicp&z0jr|y&%!gK<17P1c
zcvKHQA<e>}rWhcc;7YwoI9E{kNfj)>$|2GC;loin$LYuK*8%DW8sa?{7ofH_I2zs6
zG^<9Or!PY)=ZXY1*(y4HF6QKE{_6xNlxO0i`+9xPVU#(t)CvRj+5lkyi;j^PH5U^0
zYQx41kTYo>@f(jOHD$bn4e{O>Gbp029>27-^iy1XbE6aZeq}#X+6XXWz(E{?<VeiG
z9f*=g0S&XE*tBi;a$@DmOE|m5wS^Wof_#Gms-m+d;v5z4)EV{l;$i0FKva~c#PN_s
z{vPqnoR@B;^o7V<UBYoaWDrQ_t5>h|&J<PJ!0HjVTwl)x_@nEt0z!z)Ae$#5ufIeR
zJjd~K8WFuepX6#DiuX8|{$YYVJfdZV|8-3e{?C_ft^92nBNQ6Why}=vH&)0Qc*b(X
zpZ(@eSPYgs%XomsZSB*|c&6-k<m2dB`u$NKmdrRyL?)D~v>VOrKm0!TU9WeiW6hCs
zHc;S5wo`fPjN;e7PAYLkS%bgF&VUNbIQVQ{H#f*GPkx$=Kh;Kzrgrr23L>pA9_{pn
z!^m(P>)~DF9X@VYz9$re*tLv(UiLa~0Ow&x^pTBX{eYyLS_><TY5L;IyO>-Qp7`$M
zZ@>z*oR|!1_|W(|5yQqb6&1YmQjlJ=y?%sNLw<3#y-!=(Uq*FjJD>h07c7=ti5-dz
z8Q-%v2Ukbd5wKU)Zl+TcvcfawB3zh$q89Cc8mddfW~M6&mNJhla5ee0)j!>0ysh9w
zT$Q=dsl`6D#aMJd_y#MU(b%btx-HJl>n51V3@#JZ`H^|>@!#NMR~>crJ;V>Y`g2i{
zDwN$n5JkD5{D02Z|Kiz*9(fKEf5aD)r+uvQm7z?e_;z$8^^qEU%#CzJP~*5r6KE)x
zHs%TB{dFR<0J~_DWatpc9ZaT4h%;<+p~P{AI+{sRsJsk~BFBG)gPbZZ#w$OH@-_(#
zDi9?l2OszjSl$q6%nMxr<0!4w3JDEN*`mh@GCKv1w?PJNlTF~e{)OHJCr1Ezc`E1(
zpIN|<>Ewr~i$fBa`VGI(xcKM5;aF9V;1u5H0l!#ta>r%4>mRZzOex5rB8*>N(NL-H
z_Qp{#Ctu%qF6CAj`E@@Z-IaBfT53LSvmtmRNTC<=24~Q$z2KO`Kx@8%9u-!N_51dM
zcN<@Gc<Y?_xr%h^Hvf#cddorekQvu3FPt-XMECLu(uLXi8=f<RX1_hBR`C<nq%g<(
zpca;{gjt~@JZNQXefzZ@o_uAGXE5CsJ#J7f`l&TtGB{+DNg>$N+D1JLk+BV$91o|N
ztFo0y@))JbRT+kUn_aw^p$lI!s5%H|%jl?3Qg=jlv?2?ZPl2&~LvMo|Wy`tvh_6Q+
zGBh?8{{o}8<GB67z9R4oo-NcQ?9`1V?60`jyQ<X?Pn<srg0e$gg;b`vXQAm<QJ!0%
zuq#=<;07OBsWi2;+uD0a8t;ToZ&+cxd@(xj=OVNdZBDsW>vtc2f|&e=UHMqH((WiT
zqPi8)WJ$7W=m}wL|1H|lI2kE{Elf&uC2u(Hw_?Cq21wl{ZX~!z@3D+5^3k-m7kd@N
z>X*LyM=rs52T@peeV(%)#F91Zc$5i(V^aO^V{&+axad`|&}_10{hPPslPc4zDzi=;
zr?i3EJLSN5PA<$H!iNp9K7lO!-0To)NFNLOmQ(Wr<E+6$ZITT>^7&1Wcy;UV1fE~!
zDYl&Dp19=kPVV^n6=^#%0e!xvj1hHtwB1g^xAW3bUXtP!Jg=%UzT8|MnG<^R+fkdE
zW<_3TXv}8xl-lTrUOqClFJ6>a&b$Onf(>=q#lP1}1Cioc*S!tS=80dOuCE(YJ|rHY
zPa^!!f%hLS5G?iqqZ`tOMl+j_>UYA9217;ZNE5R?Q+O9rpT-+*6wMce_@o+1PHaw%
zu={zVn=mZoPw5=z3;65S9n2nGO+$n=0y+wY-5@<jkP(jy8;vuMwvexs*5^pjee`*K
zO+%Y_vA}?aDTffm-XA_Ucmt?I*iM((_s87Uq|JmlyM@|!nxU!jdA5DJuE7nS!1t^B
zSuL*5eK6?<GNz*_aO<tnxnmgAVl5_^Vp!q0S6;mQ1pdelkpq#!M8&;q&7UHSZ{-F*
zb%sIu2!A^dt;tDg>xzH(Pdt^+$9?u7PGiP}^DBIT`Po>m3|aJmQ}8*&^$AKsUM0oL
zloOD&M^nVePC}~dZu-^z$RVLWmq8FP(YMCuAi}chm#v~YeD>Tr88VHYhDIuVA=f*C
zjf82dMC3(!loCN2N(OmWf$jYrU=PgA%q0JMj(nk|$s|K++Zt;VjkU24Qe>*=<^arH
zN?KQCM~w#4!&i!Cx#;S2Hht^G9?$#oNI<SkGszr-3U5A<UQBgW<L~5Q)#4czT|R_%
z3RW>TjKkG~9C8*aB2xa;VhivwA6PKC7|XFJX(3`k<Z(7=XXu!(CKVTu<=@)tkJy>k
z3*L{I(<K=VnRkXJ@sy*jM%&GpKMcAaq$BFacn>QnN=XY6zqJL(w6-8W$_D2QKmHv%
zlrSoXF&?df5#cI$H;NA$s+V+z8_yy5u)gr!t;dCK;=7|=?(4kY(YFD!Er`0sf~KO0
zVK!KZcEg6mAd}vT7QD`v9VXOqgU<8EvTT>I=t&uuJU%P}8)DRBEuJTOmHnHK`Ge+<
zIU9#=I@;QMIQt;61@|o}kH@o)|H=Z;Bl9`#5`fM_9F1@>4Y?cAKy_F<=m-ctScj_^
z<jZE20Wr8KWEjc~%auqiJTaU&jGTnIicE(=7;Kei9O2iAu}&)?)&i&=yKm%|ds<nA
zgcg@;a!D7-70#DXO{kAn8e}-wI7F}SoQ~o1)JY?bcd_|cS~^6~uB&iR&gLFNAeVv@
zMsG2@JzLo#qEte*Zi((xUi5L(ANi}O^a@iC{4of!quG`^r!JT08x|p^;>g4}f&%-r
z3zBCFYvR~@#u{2-d^sf7O#E$4md@{Par;!W<lCmglWQa>X%T+sqS3i}G0$T>hwn4u
z8w_##!o1OM+`b3Eor5TdaS)O>tU9WUqa1L;v(u=aR`542JRtLS4m&+E%JC$;v8Hx7
zp*jX@ccpm)ZcUI@ljW6y0&nzNwZk*6><?R1)xSA!%{e39*vKPx%7+RYRCu<4fmbrs
zMi>5m1lc`L0sA#rmf_g`oPA<F<+Os=aGN^d!q<1gsaKKHwK_93rD|uFrBP|e9I9o{
z-7MYX(f4K~+}&6*dp@eMECvmRA5S4~II0UZ95$q!Ng<iM{4(%H;#kIPlTY`eK$Z4(
zVmN%M{dK~Z7h6B)wp5uQ5Bf=FzEwB%9{0go$)G9w->V7^)Mpi}SgeXV@iG<`$Xh#G
zjC}u-KmF$t`=R{Ej^e+3g=c%c#bvn@uWt~<ippVEVzNjc#40BR$Y%dTzB8X}NBZ&p
z_yi_-T&O@ExvkrgMz5sDw{3d-pv(Z6Ji^|aQs+QS1bPuo8K{oDlmJNiIG9<~Lq@fR
zXjTUjqXm89$)uH2Q2dCvw+-HE=Ohn#L5Mts*KVG&u(!CB`Go>|2ch*>P|RGTguad?
z$KlLuEM-LI#lYdIVM~i^-smUBuO^xx^Fa&6gs$Icgj3L7oDdlevzz4|ge{l{<!t7~
z34#oy+yku&k2VDkK6UAmc#|5Z+z3#rL`old25wC6U&qnoScyj<cf2L-M}+ins{R7e
zm7hUq<ea?P+qag}ZuE)Kv?qZ?0yR2kAeO}(O^f`vl|j5blqvuHH%G7RdT}en#OfEw
z`NF6gwgzhaolqUgoGMaIxr^np=`HfDx5(+oZusLXtkB8}JoVPYOQAGG-Go<pI8DHG
zEhs<Eze|gw0-dtxf`@C{#@(i$^Gd~s28D60gPbSp=;E@nx=l9uzvp-ut>zF~b*1aJ
zFw><S4k`{Pp>a}w6eo5kVKNHtu?Ej&+;hR#y%OZo9}Lczg4VMyK|Cv{4tK?*5kA7s
z(5;GXY6%wxYrwRWUZgeBo;y0FQ3q6%M)Gd?3P5VW3vMIIyGp%e7bGk+OK6<WUkh<r
z0aU0!qZ<ffCTSK3Mri%@88tncq*6sHPATD_s!o^;wKORu-182^5v=W6G)88Uar%op
zecTb}!Hm}DP@Z@6<v=4fR&ygO)H&x=m-}oyj)gkz!|IU}Xr{CGi0*3w5NBV?%{V7w
zPOQI#hb9xzd7!}}Gw{djTZnf-I6<AM0Sw<Sp`^+K3AxUKp;Lk7)2&Z<^%n1>K@J*S
zc80FgO8Que!0Q+rqx2*^wKob<VuO~rG0zXaLw0PZqW4qKwgfImkx-Mz0v@?T{q8VF
zEtebx$<MnF6a@bojI&MW4{Z?_n_d=Z)-u(82Y1#aHO~6Yj#vyzg<%|ScS#)!ymL$E
z%8w^BS1+3$reAt_Lw$!dmj@K6YRu8ITHcmwh#gM!C{#~Zt$geXu0SYHj+dO3iZC1X
z+e=FiCsaJ&vr{*DBRR&aCu7sxU|(j^P~7miKD@pAizlx$g%QNsUkQ%3`To3lg?9Ok
zfc>_lVN*mcWOg*8EnZ3J`mT}9gl*^AWVxEdgss16G3LNw(3<6V??Ey5?>*^?LlY@Z
zA5>=1-G!WWhULG`vG^j5is>>hAy`H7<~!tU&cl75=J=0A<g-8yfIrBPBmD#DW+f7_
z`X;V|)6<QjdDMDl6e5z%YeNi^W?MoS+HW@dT-iN?Cx=)ETcwl>6AMxONX9&&c;?O!
zIYG!yw@s2F>IHj3U@I~_=@i7+V4b+=9>kVq+QsF0-GCf&=M?%yi4zRu2?q5|x~eFA
ziTmVKeq3Z466OGj)IT7<p+-JW9hoaFM?NVn-N+kkN$~n3D`yS7V|!!CcHV~23kMZ%
z(|i02qpu~NLQ8PW%!$>XLSdI(VM9^dgH8xEiH6z`90_eg1~d<1O9(AzB0i!ePS(9*
zcJkXS&O}6AMz!jRoO%k#^T0yH;Fsqh54cqxKA!VI-2CY_eZ_zc{0VVIQa~ifJ7I?&
z$;!|ho`_tInAemW)jn7B<0yqZ$9$8{aZ#y8pNjt~^K{H8{P<&n>&k)#+r?lcmM~9{
z_fkAa-$2${*GZ>yW$(}&tuJ1TUyW(<C||$Ki&qiFd{qXSs`jiPc^dxlt2$dMc*c{D
z!A2=_3J(oRlZ>3C?dR9#GOC5y@h%@%)?9ERejlMwov%b^#5mFs+J@x$0n0Bz?eoAj
z)*2YNKlJVQ1tH^nm~Z*jJMNg|!Z-Mv4SCJEbptuX(4ZK8%ayUGX00vsmXz$-C)!wf
z<yk!YZ!V@k&fphnL1e~D^iCB!i&T%|&>E^enh}laiq<jl{(VbGYt2M0(VGtjN#C}(
zb-+8D$==_=am*cJ8>}aA2@r%<om=;i)8x{QP|9;B+xRg=2o*M^FmaIy)*s7aKiO)j
zbK1f5Kl;Mlj{<{l3t&w81j43W$>KcxU`c2|u5pO7$?5;Q24#ZhPow(GzaQ9oZhTwq
zR>Ek7$;mh5G<Ff(i*nUlmM-p|t{(A%dOy1XjAy#b<J5f(b{|FFSRI;WTet$#IJUA5
zsV2(^{Wf$`<<mB~TPNwfzc0QU`wY*@><ScK4IA_FUR?4kySwvS+Yl^PpT4RIXo&gb
zK*;w+?Kntyr-4=Yn-Ru3^YB-7jOqhM$uGX&i>JJ%?Gkqs3Ox2TDv_=)>5|!JPE(9*
z@+KbsOXL>FCvBu*T&3}MM`m-=wdiR3T3+ctNckkH#~sO>EC7P+>E@b#YhWl!HA8Io
z&{odBPii5=s8UP94xXU(0bx6}N*A;#@@gSO%*Dfl*!Pfaan5H<=}Nrv4Ckf0PTCMb
z5b8WeDWUqz?$1X$#K5}%=lMb%b{L!(xY7ifhC|mGzb3t+xp*pcuxi^iD%Dsy%mBgb
z&}6C)!r9Rn**F#VlA<u^G-J6RG?xR9Wr;zUu!;iGi>FNf-?|yV;fd$57hsqB`b~{x
zda8vEns5=c@T3|d7tB#h5|wRRCS9ptZ5CN@vqRysMCcA(?&6yyZdO_K-N|}SPOnl-
z8KgeIP!S1Yfr7>TqRfOHJo^+1g~^}yZGt2@MdBSlO@KDl@XAX|^J8K#pO<77&?L@e
zV)iEgbBqXmX*GP!Kha*(cM$GzI0R+-4zbqH*$TH095z7Hkgln~5s<G$itO>mdPYE?
zYG7~`E-k+xsSU9_xm;5jHqU2Yf7~g^!V&e^0+xE&lWHf-X3VBxtXiUuE?bs1&TDAR
zlu-_Wn~!nKWbtg9wA_%T`#Y6fTmu`u3?tPa0>Rfq*H|Z2IJQp98J13lQ2nIuF<dQl
z{Z<0<yh@wcYPx<Pn#yXuJ5tUBOSe~YfH<t@38c8%Q~o_M6|GFns#Wu$$k@EHQIPP-
zXsnOOHSc31^m7)PpghB>N@RvHvZyl1Yvd0HHpkovhLkZBC5rc80-N}eCwZULq#i@x
z!H4UTPv<B}p}nkYW=hDav$^UF{s$q`9`7vvo$IF;Jwc{iV)&~!>(XZ9M`tk(G&i{B
z@<Db#OsE)VP9^BTERdKoySa|KR8+}~_{j%Zym`x~@7*f0NctepuVW9?{>J!wM<M18
z!kt#19_z(%=&w2thIBJsL8dED{jd_Tanz8ApzRk+!r{r>n$ZgTd!5?6>V$aPimsn^
zvQYw$K1j{xBq)1|NFeI6G}yJUC1|DEiX_zSQje|Z$?wi7l}cyanG!7e`FdZoWo%dL
zEU@YUhG4nWt#n}IP<dY4PC?H&sBE(Mf-=DjT71z2S@J@w%j8$ftS1+hSq>j1mGgCe
z)0kn=j8xFa(~QabZ<M-gi<<IQePW?579((Ca<Vx0?bs-CaCXK2p_zaP8~|0!p9}+a
ze!uD%;puev60BNhG?`%Fm`P=%+Qmv0Z@Q}Vgpjg)D*?Fc@OPpgphWn@9#E<YQVgI0
zNxEDvEji2sA<z&K+gYFn+(og*=^z}m(kn_wbOIVE-OuV%@nx=omI?9)m0K^FQ(h&>
z(MgZXA?mUZuoh!+>DiC7ED{b0tUBj!A<PG*VhLh%AO=2N4C1~dCmKi<@D$s2Yy$~g
zLvd8(3SjrC@@)!T;#pj<VjLN}YH1xR4Dw{?aIN*1&#q7me{DEH&i&{PK%jNH11_1u
z^|>}dlbu`GmnS&3TNx?3{X?ho?6-tb;~)@sjnP}l_|{tM8{(qW#ru3Tm{KE*{7Fn-
zyis(u2Q|V3n?cLm=dg&w1J1Bq*C7Tpn6neyI_(9gI+~M%X|OX(|Eco{T%RY}1UY4-
z5%WN2rszlJiV>^s@!V>0kF-A<RxXk%g5*#0g$Q-T<pn;LY1f1~ySQYTosx<h(FL)V
z`xeW~G+nBOy~TY=s=O?kgs7I%$3TQcjrpsqqV1+MmhHt0r!1lyv=EiHaM1sf8e+-7
zR}waCJmRG5WuHRl9*Lc;?I;!^{YE0qm%^1jnOF|VN3Y1keyvgaOR!<m+CPVb=BNa4
z=BJt@C&c$yTx=|lLmoRJdGhrK@%258PrcXI+TciR^-5G`aa%qObj8L1S|$1{qFC|6
zOAviiyLXb~gX{=j;IZlQE~Sw4=P2$!QZskWAiG9YwU8jzXV18~CJxA{Xr}m>X7h(U
zk1XGY)tyl%o{yw&r1UZQ<&1c>rY&bU5Z7Cmg?*nZYx;q<F>xT#fz!d~nw1N8x?oj@
z>~<P;weSS<Af4^*w4$kLhN&9bLHG)0XAI=)Ry~71@{!BMNMHt+fNb*#y*c2cy`9`V
z+i6m_!R0r-5k2o|F=zX%`@!-N`Jpy&jp|ZvaFnf!GFdUMby+m)`qt*on_I#C8{1h*
zLbP)<Uh0bNUjMf(<6nB&lgGsgu}U)g>9u(^|0lW>IkBST5CR;(T*n2{G+RVn(VfT4
zT>FO+>rnEi(xTl1Wf_8_`@Iqjwrm~lpb#Ptv~c%mvTD3*wd>%7Dd+IneT;?Q3yx%R
zz7sDg_x^L_H;+JI%enpAsicHKL$3hWJa{mUo@z<~dLD9<#bcZNv`)^Jj3SyhToJ*o
zPv3pMM-%_>2G|hX)x}y1yI?ePud4O6wLj3;$~#lY4XGeo^a#YTYw6<JwwhMMU^CQn
z^I@KUH{5CG6u8n|)c^IT&4q6pn7YJA8I7G0F}%4q{q-#ho-GlZo*bE7EpAj51KL;e
z-lNAYh}uru)q3>d+-X|;IrNV>yC?pJ03abW;ds@H^Z9xzBTPX8IG+N~x|K?!*xhdg
zkdkCkzUzTzpyDV3f(-S|*PghbP7OVPSjt9q+YRcupnfNif_h^T`nSui`&VgkGq^$o
z`)JzJ58^oHfc)c^THz&|a^fGPLfN~=p5~#)f_7XptUph1IyM^pok%9^VjDRljJ&~`
zX%bWvU@wv<j6o%^xguSDT+p2PJ+7|-AX|X2&u~%PLBT;Dj)b_Ol+1W7cJ!%;APK(F
zp~*g0F<=ou#<j%{L|OQeX$c?s+>fYV8k2Ex3~%}<jbY9!2kvgPhh0%L{ier8s}CwZ
z>U$8rsEr0|L9(j<rua%J5Z;ouim)C38k<)9uYJnjIPRB8XNnx6TPsa&7quSdBKqe!
zO`EokC=MX~@AJf}=!<O<u0pe+*$4xCyU7#b_yYIKq5aT%m4NcE4!MI-OwGBu@1a+t
zFUp*d2~ss`EtE>$Xn1)wsfOC<UF}NMR`)4XN?&k)IkZEAH6QRYgHZ7nFA3rf!pK|$
zp_4gP<3hb|YV6?(;SlgHF&6(@cV`zbzV@q5(<e}O;vZ4A1<d7tX;S`q8v+YufGAJ3
z35BXB?*|fwT7@)u`$4?akqricuDn6Cw7x2yWzYn_YzLv1yf+ZDmEpa3W;icCcnx*}
zdgwXi&wtK9=1ijhSz*C+N?tK9cKDUJ-vWWjBp`rn3+UvZ7S@BH<Aj=qB{_6hk`;WN
zP>J6!CbN6E-VH#8Wfp7QOv|$fD-EDH)4`&V*QD*!pC*wrQ%2`^wVaY)cg6Cn;(U-{
zdLl!EmoHp`!|!wD2#*$DCTK>Qf{Rgtw8zob=ubC5^eY#I-0{hy1W!&T<8>|@Iy}`F
z=VN07y*71Q87iz;_wp@{D)yd{+TPQUX21KJP@3U~e@`IpL1lDSf&nCBAj=L4>H-)&
z(JIwCU@a}eF~i3iueQ0i)}MroWN-!tV3kX<3r;AIZ*kG!0x8D<R})AU6L?{4Kq2B)
z>vFKuarLO8u~P@cB2GJyMQnYH=NQZX`(<v{&|eA2I6gCD$aSeuA`cKS$ZrZ<uG3Wz
zbt|Ze#2G&d1?lI);v^n6Ze+bV4f}iGBJ7wt2%{<JoT&Utl7=q^%MNjoPg!8emceR!
zk8*H8c(9^`HfDr__2EO<8etkoZ@|n)vS3tLL(ywcA_gP$jrZ117-)Oils?dsfscYo
zY!saTvpop)krnv->KHT^bWZJ=f11xpPq&oc_F?(CExeMKspY7+Z3%y^NMtw6VIR3G
zn?f*DBj-Y3YyOb?Q^}WY%SE%^l;)o$+hGjiqE3xXPpL-F)Mp!_8WGPgl3#jUd^f0i
zp}QHfh+==vs+w4V(5FCH`DEDV;cMOb=xnLMqH{k=y0BL?o9n4TsR>z(%6{K(x1f)b
zehCwje&j>#&XSdOTC?J<-aD!~*4AJ7VRH#K%vb|ytVOc0YyHfgaJy|T@FLUz?#_OZ
z`W|)F)E)XI>srNX{6#oYV<r__I(B>QrA%e05j>&e`gPumFbb`!_g-&K>%wb2o<oT0
z*0Wfb^JKa2w!0k=iQS={$H{VG@6$XC1A6MU5F`G4@pvDAl;=V8#NW@)uaJgE`Ck(W
z1Rfq(3DnhejtX}z`s+Ny%)Wm44;S7*EU+OJoX6ia&>J#&*EluFAuhsHs!})WAf4ZY
z)3s1jBkAUxe_Ab4hm)H`hNDJ*A&llJgI1<?b7;Cr{q$pqtaaYseoXRHrSJhsrSCuk
z(Lb+5q846(3H`UhS0;OJKV;vZZ0a_-me7ZA%B$N`k8IsECVj(oEkjCt*J38Y-l#P5
zXX?#sZD*QJ@l^!0m@<Hi=IniefDAVMDv5mR1*d`0V|G3TKiFtb4-H6Erkdh0jj7CC
zaL1sO$Q^1_CjWo01^=@bd5UOV4d2N(>wtE1*iTAaAR-Q;Bp<y)ns~j2qKa?&DYow+
zUpm@q_eUQ2L4&}<w{PDf5OwL&x-H02ej?;%qY)_aF}{}MB-*AQT^HS!jl1}gj1F`D
z>Y76Gt_pp<l@O4UTm7QFoKv|cPK>;(rtFn{cW~>FPkL6t9PCvT#!B>auY3}ykZJD0
zj+yEu$3t*#16a7c>>Ht<drV3{2kIHYt)H%wO0GcDE6{fkNV5mjL1W>3SQFK)pbjMP
z59ez14#bEq@;sB@puTRq7Xknm1p}?*JF2K2DB)16;&u<pMoP-F=lu@0j%EOifH|Ut
z-I%RAGXpjHad7DUXK)zK5}MVfgAg>*8h?!Nle&KV+{T`q2&c<*LN^w~;P1$TxsAn^
zM&&A5nfa-d6$a7Jqew{Xd6gNaPrVV{13#T_Xq9c@pvI2lKpnHFktAAS4XzYQZAGvx
zrs<>t8jg)xp27X`>C!oOUc`$ZydCya2Ol9FsK52%Oy;rQ8i@Jm>FYZX;csseo7lMT
z<LkZ!8qcOCFO<NbpzM_Fv~BYGR1|RYSjdtD9j1pF-EOrIu+gwEPmcQRDuk;K*@aH9
z9>7V$Qa9(Vww&}8Cw#qTI;Prl9^!QL-o9Cisr_<XJDqY$dw&$8{*<u%=1>&>#cPE=
z<3QHs&)<KS!%0nhU`8)~wn898*w9zx@dojWdmzQVdVp`m$AwuKCq=f68|zi@d!_Fr
z?K#sgiQwBGs$!y|X6KTZJ?3y~Tr~E_&ayC^L>A+s#A9(o8Cfv(6$JXGrk?$p)Fonb
zo%%a-ruM(|k-Gw@wP2WKH%(r^L_<xYzr_A4l|h{?U`~qnjwUKbD~wuR@PZ^svb#2d
z2eG<%Z)Ys$xKI%A;+=y$Uw5*uD*I94EC||?k3mRpYy#Ia^Jg`g=N3b*E9YU1TZNqL
z9KMspojJ+93Bh{rKoUR2^HIiFK4K)Kx58A!L3zws^I@3<q@$v@w$Ddfd|W$QDJ3Ob
zCP<u<nHP%1UOM$rdVgbPOA7{1SVgACnJ*YMmA&6DynEiB-_>bC!v7e4`iAXyk_Bps
za^^ftN2c-43fpit3}{}Pfp{uYK(gGur^nf7DlY3TEP*hihtXPKFGk{XvhpSO;3>Cc
zrqd}Y-X~^xmf4Wu0L~FD;%Q?Nf@$`}s53M!y&=7D)lN(Wh8;%9N~~yXbU7*iPj<^$
zu%DnGw@u@*vrw5-58EL64{737CeYX^Q+$8*QTTOtmh<2XWmjY4JmwtLO1JgZ4?ORZ
zn3o;e_zL~sl1>GBCXe78>Yd04rWcU^0gsklf+?CgaZ)b6LrSy0IfT-bSCjiyN%<Wy
zchv#_zXyZSO^NM=g>>Ig^$@<Jx+JRFI;}g6_V@XN7K>DT6zo%yE!F3gdvsxPrl{`a
z9%ofJ9c;<OoeoozdM9Ds+e}>vXZk1Oj$BmJde`F?lDjUcRo2s`m2KxRjqGUc+#f3H
z>QeztSa5S1nl#v(K9fl<1qU_-?njxOr&~k%b04rjC}*A%pJrf)kq`|yh&sRAdQ^W0
z%5#c(l79>pE_Zb<kJzD%a2hu6lFnfm{CMLN?zMQ!9q98HG225qrsv~gd@*gBC9Yoc
z(n^^6@gk4p>3e|L=#>nT!MPr+o?1D<`L5UR-;lnB-CmE`SP0ji7=zc;`mk!yVz&3{
zcJ@RCHEX=IllSs2Y9@^*B_)kFB`uYoc*0K7Q`$UuzPBZ>dT`bFZ)vGbX8W&?3t?%0
zb*ri?*9I)Nd6pa}Td|1r{d~LT-;`T7oLqjuV*mRmHtg76hgeJORQP<?#n?Yy^xCA0
z%%OGV_eH%JU+zKauT_^T>%Z@n{~r5Y(O0tdJ~4OBYG>D`<Q3V8?lE5)N7=<bA6ZD6
z2<uyBvKCl1{HnWk+)Xyi)6$yTWW2R-6IM#9CxnG%p1M!krmw#EyI(gI>-kC(LnXzS
zzsmIQ`}Kv&_G3ljL7(5#QDOd~S`&`_(;Yj`9m9CfA26sik!E^4GTp{>p5NcQFz0{S
z@lkRE-xA{-&5(J?u<G3I+q<aQ6rQ`LUF=(wc7CdIjkpK96Fl!MugU(6>eJqHX3esv
z%&%wqwq%^&eq%ysMz{bLc^fSat*Oc-J%=6(zYgNGLn}0~4eazCwsR~F2{B{8F5&R&
zr!GR<?K7~KF70c#QEusFwucOeGxZ~s*nF!MrR8~R!DHz<V&NUq#Op^MzoWkke4zZB
zJeECKc<OgwF!e=NB=QPFcpg!@<)oKvw1!cvzIUB;-7-igp~2+$XviYv-o17$sktB{
z`|kUadh#0DPjAHhyl+UdfBue3TqKFMk!!}Xu%vHa=lK>)<M`(un?KWYl;HB%`;5Hk
z5d@sjR(1;)_3sc0_x(2l|M!gPO#6N8_f;EGHd5RBwPvC=|1}|EfBX#xGe>-LeU$`H
z<K$Wfjs4t)bX4vTCCllX$HiFcGM=iv3W*v8mt3pLcC2(PrvZ{Kx5qA!Pu4^k_*ti`
zvGNi21kR{bN`K;?H^b*b<itp({x*L&`FUX}ih%i>R}nSkBF~(?e(8fek|JFIdKXZG
z+fSbQtH4CS;wr0bIFV|r@<V#Dre|V&p2VX;?JRF2zt!sX!{7TX4iB?-WIK$b!OFkl
z+h=i9whG7u$VTfL!6~miROB;2A*kU=dF6KTbRMLn->CncrZG;b)5MSM#}Z65uEG~z
zlltI5M~Cp*$3W>fFE)iIQcImwibEGl>e)B>mile_`w=fpGpMC;Q<99oYm|PZ8BRbd
z`-K=UTajeJGK)B9oLpM4y%DN0vejT!{#FoSu<5bDhM5eOya)u#nH;tvVn8&!Lrf_s
z+f!;3?Gw4{P=bt!guBX2&{g=7<`<9If~H2LbQVzjagdziwaje#cKP&IF5Wt2QqN6H
zmAtu5XmP=&$<>PDMDD>o7u?2`{N{4%(U+xeyeY+q;0Bc@G8fl)lNRV|Krjl*g~D@P
zhmk)|KK2D21zH`0k;bS(wdDMe!e(6Es`07&*voyECNO+n{b*9L3v}jqR>&D|yeO$x
zA@=vGAXZl3nORLu%>d3&e*$IJoq+%Fc*Y+Ni^rV#=Ty(RHeUjD;+CXP`=bJPlrzNu
zvt)4;JEMm4!48P0M_ZB6ay-`2K5`htPm^i{KWe{~MK08dM%C^~_X^g`D1Y0ER9EEk
zMf(M)Ra2`koIFX#(%NV`Sl}&G4iS7a`mX=6V8!V)LvQK$#~1+tf#%-KYutHV6`PS*
zC_2n)4D@J;gKXS<JJM}V##^~ir%ddl54-#@Eh-mILM^2^oSd?x6Oh^4Nc{DwJIGC*
z0Fy%|M@dTjcQ9c)fBV$KsJW(JD(JGs{I<MSH|VrgY<%o}aS>1t7#;PJKP40O0YV7F
zOXg0epFoe^H_9!b{J2|8gnYK1Y6N3U-m4&M-g3?gAnEn4U9@kWH;Tck=^v1vSlUr5
zf?T-DA#N`9`88xP&xNkESmjPs|KM9jxcPJBsI{t>&dOf9Gu`UVe;X6Iqj*e(_xtR5
zGb<7@hyPs((a0#0q3k!4O-<U}{w{3H+t~MO^s}n1Dq)yRh3}6IcuqpPMqI2L&?gmK
zmN||kMQgROul5BN4%vl}2u!;S{m=Y){-oBI`FB!pyep!RkyczukvqQHbn-mJuRHHb
z`jRqrUMrK5$|m*&C6<&>TN~eD*rH7b%I-JSuq86<KD(LCll#^cX~3(d`Nr3U*=n?C
z&HSKIi9zYFjhwH&=gG^LhcFp>)^gb<q4@q>f66qwU_V{e*Oot9HD#U;x9=fKrIV*w
zX#71Pj}mJWol}xB{~A5><CK8eP8I3ebNjkWgh)f<?Ib$}k)Xx}+phUkkC$Md!D}$4
zu-@5KVT}%r<iR0;*`WVM4;KzaWW)i6#b?D*P*^xs`<`HWW;%4Me`L>iO8%B~I6pqJ
za+njj-v(LR@!-!}P0e=-2P+ld_v(qiT4`4Q`bDavKPA90Iq|0CeMO5!>WAWCmCB#J
z#j|mw^Zbgfgl<w%!D_6-uP+FVIZAA!P1}WQ*q38&wm;Lpq)xN+<E}6CB(NQ!;rfb7
zRi@nHFgk|a{vb6pn{+bAi7JHBf!UGvdz6Rr?C<vL!l1G{iXhkrr1+3ynmG-WW53Fp
zA0QvzKGkL<$gJqvBfe{A8?m&gi-zNV=Jwr5zRE)m=bpfV>s94b?{Y7bC~*baN^3Vx
zVD}fDycitgZO*1U68$-GID7ivvgv=3AEOcCx=eEnA{~T_{GO2sk>qrD&My<qy@rxD
zdD)>8p9uRBQByNTfmlQIG}s7(o5?mUhTnRMQK1^{<eyCUe#t9G?9SJ8(V>b~&nzD;
z)G%V4-GIQ^-+77hG!Xney>}38dH4j?p*pDu&<%oH$$_5r^aXl1am#8-H&Y7I={LH!
zfy9j<+8qb=wMP}Yb1V-Shn!Fm(1J!7wRP5if<2+43^bwb?o>e`fy35QAtI@ps(?oZ
z!qF9DU1TS=(YbZq2;G1)<Ef=WP9l;M^T<P=phTsESaZk&+3w!kw=M%bR}l2-2)dI;
z2BR{T6V)72ET2TNJ}R(*`Sy)C9RgYy7Tpd=r2kmSD-;2kg?b9v>!zfsAVkQGiI0(u
zQ;kU=$EdlX_rM&)A+Wm#Iq3N|1m}0mLS}SBEDspMf;gh$pK+Yi_Ra#^x}AKmz_Aq-
zJN+J(xe<BpJ+b$kL>8K91ovP9+d4_7k#n3iI+(BS5AOv6J>P*{5F#G+jRfA-j~N(X
zk`C6Jf{gvNYpoI`-D6}brL!MPex#eEwG#4tSf2gH`?aaL3iWJV10RXp8nJHDQl#*e
z6*thhDe&wF;B1`0MG<iYJo%KExK<YQTh%fcYk2k#Bl0@!Xdn?(O5VP}>2RIo$!w_V
z5Rm?9ojQ?%UpAsX&Qwd7m)D;oyJI1Ukau4uf2%McmrXn5lYW_LL;Z#?AUf572hn!r
zpYz&(VEa&oMstQ-<4LK@GfI(RprdCx1zcZ-Q~4$IT;J&0*vCj!rc!~822f0qgRCVn
z?-i8mA40t*zN1~lJ(@X?@=izn02XW?j?t4Ud<^kI&woT3u|b@6RXv2|?yK`yzVof#
z?}e11EPTI?FT0o=T0idY2xVHzdN5o8V&E{XOt^l{3q_T5OkvkW*w6r!V8C>p>`bU7
zXl_(Rqidga5XRb%x|E2#yRYc_7g5u5WkK{ePPwwIgmcla+`u%)68KaOTzIp~$R0Ql
zCHjPk^F_Q}nmm@OtI?bG+rr=Voc?GH8|oi9G(JB3s#&%T*}pvaAW3BC@x}9qNAbr6
z*nj-2=C)(JsfIPpoL6`s@|;rm{Adfq*=I1KC+i?IO?u#9h*tQuJA6x8pT6Vry71Gd
z=}`NRDGEp;OHy)<>C85yjLZcXo`OjgzN(Vk1}rYTl7P_9M<OAzaL>4?J0_eRH-C7M
zr{m-`@T#&0ZOQKy`qozAf=%&BlanEL+w+AGae0r}P$P`|V+Jxit8DLks6A6h8c`Jz
zuVB6G`|!f%3B7`^=s#ym_^JBqKH2gN8*NkSF1wykZs-_eTsz%|;M*}Xl^&8C{`gw-
z!H_1ozp+KCK?a)f>J@24^1*?9%BM*YTxtGhOpsu~ndhED{ZsV!4`Cu`+D3xkmq=4d
zfde|phS-!oh3>7pNv5NMpfEg9TUhh7EXGHDnL>EL02ZK|L}n+R(%EDRr<>8wnK%g(
z4s`wYo;q0C(9s*3Td&7jHeaWZ6~?e{BzIeU4*&M=id}6}Wj~(*h=QrXuA3eR4wz32
z7#yj=(2eu7*t5^p|4(}d#Pe}wm(tc@ZCCP=jNVgm+_X1_nsL3;?p^X`9gJZP88@bd
zSPyKB(rov!{!rEvb`V~Of}H&{j~%;U;a&{61clbp5;+8C5`+Be)8gSizZevpCL<v1
z_WAu-`rf6kWQRQF|Bn+)bkiutSa4Y-j_#B5%L+27N~9Nvh>9gTt0U2-317vDgBPGY
zHf$e|w}K<k;d$DhJuN*0iT?}<%6FnB-l=?zm^c-b{&!BI=Wg^RJ^X>FOMombgU|0q
z-sHxCgKna8;b@GvR|0=9z3PH4RsRM=N17`}o)LcIvlm_PI#NFn!!Vro3zoh>)ZJ8)
z@>d9jrtI<7k`1<8MSv0--CC3#G!xT$`=7;cD`a{KwNPRGC|hqBpUZM3*g)5p!DQT(
z6vz{C9X;T0jHdYHnehkpcn@#|7-y`Af48V6=?ohF8nmuo7~qrP&=*Taq#nXd?iM6G
zG8@M{;SwNt2Rd#USPTM;sS*1-zS-}~+hbP+NRA2_1eK+W@3EQ=B++l1I--G!r%tjh
z^59IA3oZL_pa2S~T79<PO6<bFO;&OJ0^WPF-;{AlB9#&mzD7ET{@D;G4u)zIV5Ptk
zG&5Q68_iha{Vpv_+nNnD2}eLFVZVs*Pzgir7_eUs!L5k8hzusm-2%&?29Va^xL6^n
zz?9-m6_A48{UZhc-sifsvzZ~=Fl*m-ZP8hS_O0=rF-KY_$!IZiNA37}->FaHUptL?
zRG7u0t4=d)IO#1nml{$PEYU1FduN6A05)Zn;WXyITOS&owf@jDbjf3XP(D@Qz5AZ@
zW+yy{aKhh0%nq#vl$T&pc>VTM_VS?Xa9@~GP+BA_fHM9)y3N_+Ef8q-nMZ%V9(4Bl
z{R=+^?2Z{FOtXnU&sSzA4j=63a9=)85+9?mJTDAH($B)nL-ZcYM89!YEyL$4bYRNj
z6piMiNU`oJ_bH5NyDI68441{TJ@zRHGPrITjC}q2P(sK)O&R}hlDy<C2ue4+X;>(p
zPZQcp`Tzt^e)?A7BcvL(Wb!bpHe#RAd7ht>>Orj5PmEnwkr8~DZO}Vr;(zSx7NhA^
zn+cY2wi6h6d>Q2(%Y^h55$8L2dLjk-L~~*WCmnvrS`s3ik3hVCzT@^R()8HS%`NLE
zJsp3&khx_YrE0f=`n$s$TId1&9L-_OJMYQ=+C`$mRC2OB4j6AtmbpF(e|91w{%0Q<
zmgr!qxYEbhp_`4x^YEf0Ez!!C=$QJqE`C}JqAn_Y;b-2YwW?fa&|!@mcyqmzll7hf
z7vI_}Tw=9zs7P(=hJq0&-1C|=Uw^^ESzU?NbK_#gT<0tK`X4m3J&>a9_ZD<f$e-%4
zAnMwF7+IVMR^O6^C85LoLb#W=Nu}^{!U|dSn^GP#E<TEQyA#hp`BkN&E&ZX27|777
zzXwfmLal>N8Cm2y2&rhaUf_0@dY+LI(Af4~JOsv|n()Z!8+5^bK}>^j@XS;urJDd9
zHk^vMgO&Ow;Yy3-N4(L{hu<cIgYJHGiZ~>ygfOXO<RIc_yBX)fu8;wl8o3QP^Pob|
zLHZ{QH+=k$3apE7^_w+uS-IRs*qMoKz7hvxg^7(<g@%U4yjRid97?`kad;`Q>%`uM
zO!J|%c@G9orv^HFr;ORuLc*zdSgu$h92sM)1gmD-_iY{(#?T4+se{5mEhJ~6n>fx;
zyk(#d+oy}(`sj#P@dq)nFHg;*pE}$l`IgcY!&Yxr@oqy3k`>J1`uBS0Hk)}uep)%R
zS-pAFnWk~%&|w(2fi16=1xsM#CE}VVs2J4zfVb!2w^^H5j;oA6l4^c6@(FqkoilOM
zEo=mZ+6dFuc>$3pT`mDE_`V@dOaskalzupE;wrwNR!m>Dfh~6lEq{91`}nZi*e`);
zfjp2C-9!M@(=V(l{v^m#m9&2r(mo`OUgdM1XujHYjKSU_4!mFC$HH;faEQLeB?{|8
zgW|0!SSZ@cq=alspa4r<OH1yt$2lLoJW}Exd^<zX+Q5}#8q)}b`a`2O-{nb<qBC9x
z@@{hgUkjgRCMfHsZ34Ej&TW#E=zU5zMBD>Y>Y#k`cYjv=+iT>IqP}M!d~igqvl(_6
z|Hiv5157k1l1u3=VKz?+joH`kfK8!#upClz)-r~O=s*JPQ#lj)Rb0^7i<)i7F)E&6
zDeWs3#5(wBU*U43>drjMI>reXM0Y_Z{3Y)D;okyt4n8fMFwd<-S;{p?U(Z}$&9idL
zcO!eUEXYALLYOXLIbJaJ@y;{UXM3&4)x0U+j67z(bBE{joay~~8yDtA{;%2aYNUrP
znM7gMKbPu9yOZc1qa4RLGdFYc#2d-Q#rJ!7G#Y$(NM!Osz&Ullo6NpfQbd-s7AL$e
zzTmEYmCs~ksH3BN?0@y*uyw~O{BFn>FVbk}-LDwTeWm)JubJO|tA;{ODP4^=xJ{~Y
zY`gllU)F5MiHQ6)U~Ro4$x&MW*(GZ^u4*drtDW)wg575Kl8BUmzm->cu8b`8E#HsK
z*JJ}VnGARxX_Mbuk3z^7eB?^8O266X(taTn8Xr)sq;TMi7xbCs`AQgVgVL?mrab4S
zOsD)>7*SW9*LK&a=BlcSs_`Zbs4-G6{?IGDsI!Th-+QMrciEA;-P+Y@NaVt8)%}G`
zw<R+G(d%jfn)v(7a94n5Y<8-wpfrl<jIG>_zzkT^>bea?fBMu+J6p)Sq=J>~1J6?;
z;kHI*s2Z!fwJ|`|r&lG*G_0u2hNFf@G|M!ZN@y^ttJv`O&2w;=(OxIF7(%~{!qM)s
z`;ITHF2N0j@3-Oyc<;-5ba#|4Z`y+&VJj0_Etp+r!tPvM&4GYH{&`dy>e#X$kP*mp
zmv#pn$8^Cy_sjYjmBBhJ*S|$k+qsQBj!%H#pkc7D-0IX9XL;6$)3<sdsG_}y%3s^;
z)7ylVWSQe8Q=>O49=E<ari8*B?(<I1KoV^q{~`F%$3GqW$PJ|tebir%dLhCc8}@V|
zAPkdIPRPE#uH*R_zoBrT$J4)?HJ;}uMTX;QXXRyIO4DvG_w0Tx1jyLek=V7(GvG$|
zwA`L`N}umLM86wfr$4`4|Ez9JsC#~-FCNUdtI&K<i)F`SYc<97+vlq1Eyi$j?6ifd
zR*8NCr)$6Xf@42q!L!IN%Nwgw+x8bD|M9hf=Y@XJ5-W`Oh?HNX>3u<K@6mSmS6Q%0
zq@h*O&^O)wRHsbiL&UP1x=;SkKmV5^@?Xy0q{mnY2E!cJkA#8Zh}CR<!a?7|><Six
zjfV_dQjj>=#l%*ap00;le+x_h=7EMTK{$ne!o^RCV2lt#i}M~T6}XU}{)}Nr+8bIO
z_KSW3{!9v(%c~9*a7v+rq%U2q@}uIK$yYJCsO40yh*2{6!TKy?uxsd5!kWjva|@(T
z!HU5Ig@6VPR=?zo0o}uWh2!CgwFJFH7FE1?%7n5;Yzi3)EJSrCfbD?##0AEPtzFrK
zBFFM10Rn~A@0e7?91MZ{<(8Su$-Sm83IyMMoLnh>e|@@j4*c!&@i53s`E_fTg;ZNl
z&M)J#8Q2`<oG3k9l-I%u*rrHlM2-ta!B_&N@@%m8Qo4@5K^$>{Xq(nCSrEye8A4UD
zBIOu9h&F>u%tO*7-{A(UR5W}0IAZSQ!Z_nRiKyy0%2oZ}R7%b>BK*P8V}?)%hs5nm
z&0y7Ob{E)b)dq%ADVD}hiN@KWD;FcUVBOS!BCOg0hEH>RPTB@UW?DFb^SO%AZQn1#
zU4k+4?_I`3cGLs_jkkf;{f4h3yVc{w#Ig#rPu5x2#Xe^0sb3g$#TYJ{Do<GLubfjx
zv}YCe(X`*MmBdrp@<tb$!6#^>voCtlj-U<U>mTD~tc`7x_O8nXJ&bJo&J>?ueqIxN
zGK+#btWwZR1GD;bxm~L}^ON-N7twT>%%|Eo81%{iqwFoiqHfprZADN*B$RFtP$}t_
z1{DxNdPr#)Kw4Uml9m)n>1GfZy1S7a7(%+cq~B}qb>Gjk*7`qR-fiQ<h#Lyb^*gUK
zj&naI?o(XMJM;N&TOO8{PkHcQG_x}LW5I#;P`vOfwD%8V&(#Dkzp|EvKbuVsRb>{|
zy<G~8UqFSayq6QebMPmcV@il`*7%8{&>3k?1F8@y)ztN*nmN!B^*l}-nf7x}sS-%#
z8V^CghS#MG)a2}ExV>Wui8T<;ReIJhAlmu#x`{;!BFsRWfCY!(F$!JSK8^VvW$7JQ
z$=l4ABgYp@iY8PDk<F&-#)W&G>B|#9mG7wzaP`?ns%B_!nl-YWw`OALu2PT_+Qdy>
zWty;NUWfi%ro<Dw8Jj36gHW51+FNl**;}(gv@{i*DxBUp0n$*P<Q#tWG!~Qr?;#Y(
zXbCN=U(t?x8DjqQ>af!zS?>2RPthlquZl&VVcsQ`yTVQf4vCO&N(Sl@4NB$<zDvH(
zV}e~Uzs|bK=94v+lztkrZBFb9l&R3XTscKP8017bKK_1h$bJteco2}FF1*;rPZ>37
zJFzQu!c&nd=#bHN9Lo951q;?fMfJq1KR8GGoj;Nr&&gZ17)kv6NH3?{*JDR=jjhdh
zW?fP_%XjsRbh@A0_FtYZnkrwN7Jt}n2K{!)#Z&5$Ete$uu%4UH+M8{Wc-PJ5eRg46
zGiL(C#3|L0hZMWlO0@<n7J`E#@X868K(11U?b--X+Pr%8bVg)RLR%N{M}&59UWprh
z5$oQLyzut(U{lef$DU_nm9vixJ7;RlhL1I_xLI}XfDqC|<D-2Dmh41oVOihJ;$Eyw
z%KRUCY7$g%v7IyT1z(YtOh*e26Oya4?A`FnUlO?Aw6}=nHT1Bo-(eGJ=Wd*nJ#vE`
zGg8F({Gjf;+ph3L`twqMrbqa@zc-lEJQ<q&SduXQbx3>EWYh^NYLyS)zo#XBvPZKw
zkAbsA&-&}6Gs?uV*P1)|eMz-tu(D$xa5`G}5^GRvzE9(LK~)C*1>jrhID=v{c}&%q
zaME}>6<SRApDxetEjR6&DGM7((G0%VIo?zwRptjvkcr`Z-ebE70-$*!67iN{AlQN3
zuw-vc;S;<7r}T~+fv&q_FyqVjKUj*Ri*+TW@pR?v?l5!l$uz??yi&B9RJS8F?>$(v
z9lMscGrgUx9K{>#3#*%^B!8Zk8k%i>TusQoZ!mcftEyVpu`<;(iX0i8Q(;<l9`!Lg
z3p{HmEF6yVxj3?+bY~l*W_LO3q1QGmHi0*Ix=ms{@R*Kc$AlLu)b@8>m-p(G>Ga=L
zc3vpWxUY30PhzOPlHhTzLvowMjyro-O1}@XqEds~b9m&<M0z~XA=owcN#Ft3W%aCG
z%u*_&GCIUo@VbIG;5|Rdmfi|4zGEp11_iN+(QSI-L06ZwW?vOnS{o&FNOc+E0D-W8
zga9qWfZ5%SJjQ8hLTIX&7kmBTfZQ8yyHp?`mM}4ua4b@ei*;ThV;*9nz>SqqJdnaV
z0h?!jW_T8~+3Lk}V?M2Np@?s9#Io#s2wPG;Odr&rHbw}(Qav4wj!0+YquF^KSbbiz
z?lNL8bz~yXiNkN-|1n_dCzJyA&8=T-{TFkJhA-RaESp5S4}d7eS76iVTCat{M9WS5
zxac|dFjTky(5CT4(dl&CasK~Xx0Ip)$%xY7n7?Lc(kNma!Thh6VBOAq74tU(y{e)i
zkjhh|AaAFkOFBX50P2#bb|1|ZBlyMTd-s*T1QeI?EbfQT-@~`<hqsyZejEb{A1HTw
zH6Ce4Nk&j>J;;meuGq52t9;yi(tgum7{ov`mG4GY(HxSEUQlP}?mMlC1=sJth@<ve
zB7^h=_48+c>7<!|l%N0>Pvxl-)tlk)IHozI`105rhld;0N4eDHS4?zgQ?XVPzn)h5
zbw%#06S9D#_6A$@!<&p?b9ZG}KcC1RS&s9M(Q=-6-=fp=FC=11A+jHf@{6<e`}n3|
zB4t*}UV7|T?=e+iqs32oJpMcnd=deJKSo@a8b2*!!?OPT!gxqLBP!LOsUm29I=tmf
z=%6M`mX~6w(908Io0Gq6YIW+gQe(Oa`u1aDl(WR_EC{c?4J<=H&GLKbNacX%7oU_f
zj`I-%-{AabU+oiKhFq%T#r57X)QGaDskM>IFi8Be=BF89NWqkulqOl%hWJPXEp_Mv
z#<^@*#KK*l9@m2T-ej_Ien0Ou&;t(vE*R8hLISdvNaCke-K$VkEoKnUv^9l6A?790
zpCXFH=ah0_alZT}<n#>Heg2jfl57E(67LdGU+y^SQ2G#G)jsQoXXzIG7${8vwUlqW
z;bP~fmTaCoDazj0aa39EEdRWQuyR2n9VpvQQ(fkHALKdyZo19mI$SFIR50^aco8zy
zd!0z0edd@$SX*uKqte6Ez~26Fw6R!TIA&i&AkDePl-)(qwq&7p*~R1`M}zEc!^F!p
z(Nmg-{SWLuCp{y%X^6?5^C%G=01RZ&&Yjn9S$Az!JwiezzE>|>x$S51Cmmg#pJs*R
zB<)bP-ig{}s}x)F+dhw{T8nJlHbQ=K^*|+!T@N|5(byk4mVU}8FAsgzPamCt_hM&h
z#`}_*$8k@5l{9#s;sLIPiwj|{9D(^=G|=$&3hSJ8+hil>HdPSOg7DxKSDUO%`WF>w
zDU1(_)czl{<O39^cxju$Iss_+%em1X=P3|Dky@)34q&=L`wR_?&)7WoWz1P*A9sw$
ze|#kh=!qA0RIf!*yd@t27VG_mb{_K~S|QNd+m@4SQ%n;0x>J9ucR?qYt=9OjeE{(b
z*;_Q&lL)-ZG6HBkyS~XcGujPf3SW{@%UbRDF@6;2n5<U1x{TV*x8eF+4l<ovbR#WC
z<N9`5rt>u{S#VPsa7^`~qVBuAQ-tDG!%MUXUrpr8`)!E(PZ8t8-Q0be)|4&NTYgpC
z*D3O!-2xxe=wGCNH?1R``YANqV#J8J_VnP}uGf88QI((V^PsWVj%CVN9mYG&P~&Y+
zl3{=<Tr8O+xQjq1@JWj#*~zI`oXQtE@@8ze<#%&0!lZ+MIQo6~)qbbHYGv^(+-gKI
zfb1Bdx@r66=A(_=<X&L-S&g<?Nl6qTcY`7c?%G5x<M-c?6)x`Gg(*{tp~mBl6`{{M
z>M#sf;x<i=FL8%w?PvaWZdG3UlpXBDiUm~>*yNJv%9Q*Q@N;tshmfFebMmkmfU9DN
z65$7y(H9rPB}0M^D?^uOhugcq3JX6R2rir=ZN->3fpqpwAeHkshs#N`RDun&R!%Pp
zckB5Ue-t&g_KA3h?uTX!9_uL{3cqAMU<$5AMpf3xhy^$I^T>Hhfib*~LMMLdD$PIW
zx%_g%9Bi=3n3&?Z@`VT5N@v)w+wh*~m^1hi@s(E3eKb;C>~hV4`9g-|a)!_-`O|R<
zbLtrwTwk?O<5F`)4v1|UYedEOwd7r1rj#FsBmc0|e!D^(9_=&h3%M3o9kKeN2_t(Q
z=F&CvJUgj<m)u)#bfwqV*D1HF<ilFFZ%GZss_W@Vkmx#pe(2bdxoG~bY)D#>z?=<z
zfo_tCr8<stG2&35!?xqP=+AVU_1ph}p8OBS^}XDu)Oq)BGv=^O@>!z22LW5@JZJrK
z=SC$@MNCKz3DxV)?<=Lz{T0pujD4xsoDl)fNg08IR7IQ>vrCXY?&$56E0CfUwcrhl
zp&Hwo?lVpkzd&(1mriqSWRaS!{4Y`2OA)jK<`*DM5%S&Ul7jIP(<1`l<((mqJOnT{
zL-q6bI3*!1Hq}?RGukRgiLWNEI)AO{x&+sLH%CX3XY8F$CEjFI&U(z{Ez(3QWj252
z`w$+TXaJF7p4s8yolntPT~*eDQ{Cd(ta$Bqf}lw1{)YwdxyN*jAj}}7)Tv9q=2xk^
zU(BDklSmxPwG}hTrMHyK+<*Y#{#$_y9qG7gVzNeVSr;CeEja$j*V^Wd3wc%ZE#IEs
zgN>J_t30D@-Gz#Di0rIP*|!PXlAd7)EPBHo@2$q;hN7~1t%nQy6sA73#;N1q|7xLZ
zXr5wbZyf{;c`gs*-7k7&zf3Ys9Hd^HxOv}RtC{af18)mbxS5Y!mbS_3;8oB!Qnn)f
zOIZqQY1*!qJ@;dP3e1UyHv3|fkEsKlK1$G~YrKIjy<bk^%l2mR3v&ugdMTDg<2+>y
zynabrZFt)nq6LEVTdVs0xQnEby=NUl1pP-JW9{(}-mGCrBaJzg-kzTIg<dIR=;Ny6
z4wfV{*}3~EO)X<Gj$;*J*xk`eV&MUaG9=KFhJE(>ql3f~d~~G6JB}aaq$I{qn&XsJ
zE7=IlvAg*uyDOSXi&Av!j^QS$mNWk-ZT_{lK}F&-?!kf3esWM&P6&nI*cGAbZXs5*
zC=UPye}L>q4T*DP4R)rh9RcWrEVeL`To0f0ZEiil_~mJo=)EC?Hft#>OSrm*VLyA5
z>GpSRE`$!uHQKxX!n8_dPRYKv4l?iVWE(r1&~c$C(t4=ED&o5EwS00fY@rye`u|YC
zF`}ROUeSIuG8mHEz@C}*rOM9eM)G2d_pV-NRICBS>}50p?J`C<xBU?`wMrm@YgqEi
zYou)XXyDTF9?8eMk1~g?bC#=G{uqo+IXRw(@_Lx-g8r4KnkXBWH!R6U_i0J(<a<6b
z|6z2ovf<o`6#HKCXGKt*)s#LE77?>9cQN4>&dS6rxBOnh1xE1W_S&t$={Z?T*^X@2
zC}z!63ur^{UH_{1`EJ0=CGa=0R^0HbfsOH(;SXNpEsQHQURtVto0xnIS|GMTSE9aA
z%&a;CyH6f<9+a?Q!n=zN5})ravgT$ygq|Xd@M;rZzngEqY&7mB6asMS^${hpib*A~
zvWg<PCZ|7#-@~JZ5*J<?wxaZ+wI3b9zNX`_^g%hZFWW#yU0sq*?Ka<cu*pu>dr?5G
z4@}M-*R$gJzFd-FWn{N81{;KUiQYurWK892Lp)EZwH$}-0)KT-;99?SNYB1HN7Ag%
zUeMSLE7tDN_jF-C?G^TEacCdoSGKdmJoVOfegNPM!3YCeMMbtE9krMI(;p+E*Y>1N
zbHsM*k{#-xXRm8^0y;`XjawxgTYlZERkcZOqmCeiihf!%Or*od>4u9&THU7gP70(6
zS=5$qRv!<k`ESD*pEz-lveKzOJjQ)V1ckhhu}lDGbI24^e186LPzvHDF+)!Ve`Ce{
zy!<^#YS&=EU14<SF9MQR+CiD)x(aB{JOL9V-vB(CHvpKJr@XW=YdEN{^tUGmE$Qt@
zA_TaZM+l((>dVGym>MwLuV`mk*tMZr=`))-b24CF3vZ|9GxVM^yeL{MmIQiqqJvdk
zcupe~tn%tD>j)EnGd$qhPM_qN%b}jhVdAp)Qj18>!2RPJDO>g7ce~X@(7+S<EXW;9
z`0qE=9!^0+-C>dFkOw&S8sxq^SvTxiMD1bd=9!A7zSi)0>KW(PpVeTByc=%a(y;cV
zlSL(*yn#pv0E<1ywgFBbV9O`zT_i4*$WR>Fqrv$QZ+*!u*?s)Dk&IfpiwD1RiJg`&
z!-GGt-mo^0-#@)wR5iALu<Rc|JNFT9W3D7kvCG@5$@}n{->bQZoUh7TU2=1i6WZz*
zx5~B!x`vs+rd_C6?CR*D3AsO*Q%{zeDKtui1P8Byo%!qtv1`P2_SITOL`!fI&`+Tj
zlZy9%+#<BNdWBpA0j%HG0W~-cY>u#`FF3k0AP!!stEp*GW-Fz>Ib0oFHR!AdOHk`z
zh0rM+(i{E6mu>0-5zX=I9*x(E<+(U_L^#ET*_2x^!O84mu#WewvAvh*71Pr@JRXZf
zya(e*nxQg|I!gyh-jg*3yc3pTEcdN-63XG-rAC_Fn8nAMyIQ61i9AmiIn>pza{L>W
zO|)Y9v9`s$@TRP`Y>M~1bsboMV5_zTK4r;G&c8CaQa?beQ6=)$w@6y*$~sK^ag?<?
z-NZt*MS`od;ie@i{Hm`k<o~7JKjuKYWEUrbMps6ZoBU_A{O3>N!wgNCEIct_!Ih%f
z`3zg?NPA*v1sz$t>;28^dYxa`M%+zwt*O39Eae6)zx+6lo8XQ}tEs+NOU?^aK0Ydo
zU#YVQQlvrT?q6&h4(}|)_hGp&SGcTIOw5&a2EHLx61EZR`4Td>I6FXX#GMH)&UiAP
z>MWT6A_SWAu9%z3Tpj+8gKZ36$3t$DVr{omg&zgsb}SJO)`(uuf%)CAhARJ1KJVt5
zn62t?eB)@<#=>Vir15ZqH}2OR@fQCU>&Hl^ko!V6k#Fa&;pw20<!+t1)E`U{IVY|`
zgMooO%6tcF|5Bt2dF{=rYdXluEt<^76&yG=#(PvoC)j*o?_l2a$!mP@M&@1LvSVpY
z0d`2CHr;SecIFUMKp)YUatf>J(#+^X;o(KiYaas~dacHWBDqIe4L^g%i<m_-6g@AF
zxH3Bp2)T#L<J4-aw~N%QL&l@&9{q%*(}OW{e!iC0ezYIT)Zsg)(Or~LfN~<pWZUb}
z(2>B{f}ZsTX4tw0=s8(n5$RWD*cW;PSUdd|aGz{pGy>xq2`vkApj=8o85B?~(A|A*
zJ6o5Q=`)Y$UODLHa8dOVoM(s-k(8r$eM|!nPJHRhwo;Unnkc{9aB8QC<gUpYL2%X%
z?bL3+e`GeIyMM#K&92=5^=DC_h8m2vafs~lP#lexIe7HOuYbPmq!IRkQ&sr0xXt?R
zuEkEwatHUw>&|=K103hzp4T<KPd3=kk56H&81?SIW*42g2O$it3x5GH?v`_+c|As+
zNETx_B0LSi%BJK?N*CTi`>XS%*8gK?=2bA*nTakpD*u<G#Q$)={^w-6OMZH#Vb1+O
z4W@u{EhXBNY|_}CA^3?dC9jNnu}Njt`5(}H;1`Cn!rJjbZhO6d`tYxNI7hJ^KBUO8
zvF#$38L#KnYD&p%YBuFPC+j5HI4tgV_M!ggG~kZPLTp}4b7(zmy~Kh$IaN4r;^6Yw
zDpN8OOW|ZI^<^pE4Is4;yVR2-5qV3<JMk`l>791|*)1BG=97W=XKS&8t+AWwYOwx}
zb;tH!KXmWCW}#U7Mll`iJbUSl%%VuHGUKPX+)fv&F;_ow*o!0B-0z~pbsWE~d%v2G
z?I{*qAi}?qJ^OXW9wsu)TTH63H#61ite?7)rx~7^8RMl-NdG6j1vl_M*Ky!^2Va{1
z4LFDSEu1%F6!h;w>vz2pEK$@R2hp?Ogya>&2LumiF<b-Etl85Z!?2|ScFg0{hJJd2
zGqDXAT{0-*q^@pcbhOkx8V?v_lCPs1@SGSyA#6wf5I_Y{G)JYkj-ET!s{&ni$^!uC
zB~Ls3TK-Wp92gw28k~8b4BQdV-+;E#APv^*8FJIobHB_yQ7*02hn52VH?8w~iPAQ9
zSsrI21=TGB7)5RA``awRPq1IkW!Z2%zi}Phn-O(59oX7>GdVePy7pn9{&aLT#@%J5
zelE|IU=jExL;-4Yl?+BejzR+cUnt)PB75SlU?b|z;+PZRpgq`Qjso{%cL;e%EXmVu
zA7gB2g(d9u^@8^t)}v(St<g6FWbVPPhG~Ja@#mOO8t)C)v!xM^y7FVJB&YLNT+rGg
z>!|z<%d-gvrQRe#F<Il=bbFw^9oNsdX;$=Y&iy9igporUn-H-eGQNq|e>k>jTgPnG
zkHg?qc|4xjOO}&l?$=&aFaHSP_Jp*H7Ol7o{`8BL53EO|?9n$f5+}ixgsdD_=N}BW
z32FcBqe}<v5yI4F4rcmT9PPh9hKw<D*RYAkpI^o?!E`I!k}FIn8$26k_-abg;i;b2
zu_B_|GQwW=kkuZ=3B9S`r7`z?w#~{EJX5eH%yQ;zn3+>QI`*B5h#ZrhogiKL2C5g8
zzWO8{N05m%gj8U_DMH73^Yfo2oXp>Kb#k_3)eE0(ETXJ*`RML|X{uD?8m6i`1~sEm
zJypelUYvG)bsyL<4=Ls%=8LF(0ms}cltOmT*ZQ~f(Rk@IMyKYn^<Y`bNexidjK~Ul
zl|UIH`zjnT<Fu?+2<#PfFm>Z)CJ%zK6K)PAAy*H!k=>?u&SiMA>ZWyW7(GP!h2=mN
z_^Iz=orHop77e)&rJ_}3UaApKJyT0YXT`rOKy};2Q_fXj9B<{Fon1o3A4HK=j-zU4
zoN|?AvZ}he+p-g{N#(v)@)3Ks;NCGcGN-z2l%%q?&sIhI<xg}tYHOa-8DXfWTRCOP
z;zMf%ruM_xiXRm_+RFxn<f%ROBq%tjf31N8)p)U$e&_s{mxDsQ>H?JKuLn~^>$##C
zVKM<bA%gqb5%mB%YXVdm@E5=r=BEgl1?kO@6AGNKWr+H4PF25`ag;B{?QSgQ$-_rj
zCiKRY#8l2*X}-9)lvm0Owt{teZmW?bBxALpt)})*>8q$@cUzuqBP(P3?^&CI!fvi|
z8Ffh-E;&rLe|^8J{U!O~Oicm_hJ6bMcGb3Q%=Ohp4?*BIvs75sI2Fl5_C|^Po&qTQ
zFLd}D0<P1*vxD(knl3yszg>N|qC|pU`krU5Zst>vXAev6M=&H&ik&F^JXZhu-kyW&
z&f`c~G|iFINi&*BpuHN=v|NyhO-#m9Pi!O`TTY-NsBw{>bBK<UPep(E>EAwRy}+sM
z7!2lo_3xkk=XE;%+h0WNR-|6?4-v%>eW*XlSx34_N~x?W!~OdqXlj^0ydEWCrFO&}
zYv`yk1pFDvT{I5duC#dD(2b9fEc`fk=biN#Y{$JnGvxia$%0ztOEnqI$6OW*)x*^e
zTwadh?651SUd8mOHlhdG7tH(neJ8xgc%z+HJ#Y4#E}cuGCLwnYII<3k?{bv#OC?<g
zJU5poVtI+huVQP>Jj~YTL|MhJ2LqQ6x)QUlpS%*LcG<f-=~R#uN{mQHxhch0B(^!#
zyE(=aVfe>M<fFq)OqPE(1zDA5w_wB?ab*6X0Y_0;U|cDyv`bxGn|*s~Sw1J+5U2ZT
zad^Mpgf3gbyPT6@_AqtNifP(ZG$ie_(m_Uf1JwRHPT@eyHh_K}fE4o8>CTK5k)FO!
zk?Acvw!+ry!_=G6cLyLl?E#ej`b7}Kz>+R)2uUEu32=;w2I80r7G`Y&K>d$KZC~m&
z{Px8ute7>oTNJzj_CQ_01)x4xKAt@mxF&q;%zGeWp*MQ=afKD4u=<8-X{vx(n(ZLJ
zadt(^9IQfnE)RV^2_v7Vf2*y|6d@|u>fU{CB3$(R?WEbC9h>s17TBYUqw@H=s>)d&
z&K9mh7dqLrmbyK={WkL6W~4R0^nl3mV}?uIx#*e9V<Lp*R93Hg*XJ8AZFNE7%91L_
zx}z!M>UcB=qf9D#lvG+~xx#o6%L$kKsYA5J^E>|)>g*n-HSyV~hQ9oNVjzf$_+g)d
zi$CbL?m@mcse3=~=N^A}h+N|R-b8%0H`J=sb2>LD_x1o;@wJ!Zh1|iRRpH4b&VbmQ
z2ftE{)6Ns%Yvnu;{8-AMw)vY)vcNji;InB&nQZrOwtF%$8TT9-Zj`UD_C`)%(F8*}
zu4iX%PYw0`KN)&wsA|~4QY&O)?dKccF~DT9c3;#+-(Mpbpizeodeg$wc*oEnqw8}I
zYhF&A7|x%XiK%xVgV9UYHd0h>hk^#~9OCHRV3o|OZ{0VW-8JL2ad&;1PRZW>=XQ=7
z%Y?6WRl^tJ<Xj9$44zdHOgn^^otXua&mWM0j-|i(tfcs)>HQ7|j`wj}g@n4(W)Fkb
z#LO|3YmGyGVV%meuqv?`w2AjdiuU!c)e^c)SZYsTV|rialmeRIH8oSgM-`*ME9wmj
z^)DK_NAV0crtm;;37=)Qy>t$(*h<0~nAyaFP^TI_h7<#>Ur|nu!cKObs^=|)C1S0B
zw@<n`mFS+6!TAw*+!%vh-j&(8i4Y35TLty_r}->wY`lX+XKvr@=PEE0t#=42l^VEU
z3WdG#dah-vG5&0j2|0rTvf0bZ3zPNX<&zJ+Z1(^oKxs_g?gAF<KC(nk=P2b@Bli8G
zPxti2Lagf*??Vx*n%Qnep8#y=S4zoQ`I4$h_cy}Rnq8uQK6ye1ynMFTb5dwQ$>8`d
z?+C=A4f&><_iyD6RaD#$?Fp%{B5(cMhxiI1I8F{10lfcp+oEn>A0{br8I4?6z<ec-
zkF|+O?4x3B7JRSYfx{g?K}$ii(x!g;!=Y}9CK@t3Rn$4uaYvOQZuHu1K8t_(3h%|&
z>G5j&eShz`VqKxdC?^oH=raOyUMy<)eI`O4cBB$3KUjG5s5nY^$E)jM`&R94ihbLU
zi$xU`oqoi$dA0asEt5hUbq$T4rB&_j2ze`rpS*0dXN?KPS4(DY>Xzz+JUW+#xAeB&
zTFNXJw?!S6cD;9=OlCjBU!-=J*$5IiO&-xYcgC4GoQ;3IT%om0FtI2qa2V-q-?md!
zzXoF8GuyuKz5*#Pmg>!|fnk$q{K{O`#~Dl|`@@fgpJ(pMRvR04VOkxA3b4!lEGyeS
znZ}=NVeCC{(Dj|LXW;Q2GpW*iKaOU!ZM)3WTfz79jCm3b5@ba}YPTJr7-xlqTeE!T
z+l=QS*53Vi^<B{TZmAu(ll_V*Le1;lD+i+D<0)+8usT1t@2Cx^_g1?K4!1%}Qm}0L
zw<Z(bhGmZb2r0dr_&OdWDqv%ifwf@ZJ8!Rc>G1@hBaGRDrL*3?1nzCdMsZ?h;9Oxf
z3AVc~U)3)HR)P$0q2O}&0LZ8wKzZ8Htp)2<OB~*3Auc*9D)ir4aqa%+iXXNru9ig!
z8Fvx525+c6kA58h?;-b`kdTltr*-F9PBi=p>JLq~Wnq)bDQ+821wng?p}6)QFp@wk
zXtE@531Ndro*lMw>{sopkX?6amU#APma6gZN0ntM?WVY`o#Bb`fs*lhT=)SYf?cyp
z^DgezZu|bd6z_Fh*UfDh#?q{(TS9zH$5}?3lgGBA%PYg?XB7M_1+f)1$Wp0G;s!IX
zbAOS2RYkE`!R7Bw_TIX63O2QiG_%}u1c4EepHFV;Nk|5BK6Y%Zx_{{jF+eNM{n&Wr
z#SDfjk@cbbj@N#TZpwkX^|h4V3P+`YUj^=7+DP%{d|nkbtuhB`{zHCkt3!LH|DO-W
zEwP4zk-xG{nZ$TDJX@l<QX}D7|B_&6vmA!6;g4meiY#AwpPR|Tk|hhdP+xlIDT{B=
z(lb-prUbS_Z>=X{eTf`0oAPzTN+R<&#_`FPZPML@h+@5Zb(@A`YNgBDKf2+_2VdzR
z_oHwFkaaYxy>+fIOmb@ZqQk?b{4XSrkMEh?fajzzyrqWSPpZVTR3h6mX3_4Y^Y5zp
zGcGsjOs9M`8445S=DP{CU7FU`6R+={c7LV2vSMA&RxwDl3Qll)MbbT3Ko;nq{bG(I
zKaO`(iVONS{Qg#~wSPm;LPt)>a&)y}$R{`UgzNprg1FCMPr5C^RaPg_WCaf$ZioYa
zBDboPZo(vQ5VC)?7}5B0EP(v0G#3UO|D0X(Ekm(PZLJF~jvW8@pH3pRA~i0%&s?kX
z2rJY3K3Hh;d3eCaOXkYMkJe{IEj*XuY}%v?i$p9fXnYi%_tzWh-K9fP#t(_|xKEPC
zovZvSinY?GM_%DDOBsZ4eyNa}VT{+I$8V|G0eI0EQ1mMkbLed)pWr}&;FTThSJx5E
z&w@4q7Z})au%j(6FaNyQsf7@*hchdsu%hg&e8)vWG`DZTVqW_}R2~kb=fcHGw@iRz
zgYy9}GjZ=OuH6wL6Z5JAtwn|>`T#yhbot^0VWcObnGDwL$mR2^K79l;!=i-B&H9gE
zww{t?*FiR(ZvEy>|J5Fl@5N$0Wa=un7^$nm$J2NGB{OR$geKOnPwO&!2-6tlLqh4i
zUtC3;nA}fdWn+o%Oi7xr@5>;#LPJJ~C9o;Ixbi*Pozv(D6_Ry3-YQlu!sFbi;Gdz}
zobXQ#dmv&^Md^yTCa_x&{dP4*>H6m@xlMAI$u+l<*sHtWeqQY)+OGB}HL@P~6;*}1
zH^m6k9HfVnc_wXLA`QVaZQFS9L*%rDf?)L$4e2c=q}cGsK76ZYGu;02S0LGDCoczr
z_Q%}R4yp*EgFHAmsQVL4Q6HaLbGl}lGB|Kt%n5Rhw_<4W@g(2)V=RY{HpcozYyq{*
zviQ05f955TPtl*i`eRZIME@f#{#OE=hV}4mDbe>dLn7TgyxYXA0mMXsMaC!F(PU`3
z#zq`E6$99OrHX=uAM&3J5ly8lh^B5GT%CDd_3OBfYC073O6-A<#N0JhbWcuNF|LU?
z!Rze!^Z>CqD7!@Ccnhb=Xpo#S5swnzvATJ6x-@T*3)&9v33|<9(!!8O$P`fEF*IOp
zd`Ymc#o<?V@?+xl^0E>`Q4douki3^~H|bPgD^bx)m;d_Rz*#G~<HgC!7fj6j>##B`
zFN&SYu%6E)`gjUfrM?<`{v|G&)rW0ESyh!agqY(vKSsfajg>X-8yjMC@tj;fL|4cq
zUn#0;apO_~&F`4>1*=3nDGnT8&Sf|5`+<>~qe-)+(U%(8{;B%f()2{GA9jV`rS%GO
zxgJ(0RF7BZ5#2t+fWwNXvK14Bo&tNLQUZDvO?Uq>4JQ<ggc6`UoTt<8dt43>A=n{s
z1%Q)E#Js%$?DQDA?zM~(v8ZE8XM^qj<ape|8JotdliB^@Ecq;;-kar|LbIyWt#u~C
z^pFdueA>mWcM9-BT|l>BB{SEpNhGUl_+^6VH~o9C+H5kABsl)MC=mwICT!o5ss-%R
za*_aEBuJq#+bV492%gUR$;<(NliWBN9S*x-G)*huw4?r%JztB2PIKmcua7THO&kYg
zJ~q^h+|#g=2vN*Aes$wEvpviEn6$jzbj2jq$M@KwzWTaDm_|B=bKaNRB(0Qk_U-B3
zs0G(Wh#*0C-~%e?AvAHWqv0FxX&{YB|92STEXmG0swe<zxVVUsCePmZG`-=@-J|I3
zN(y@a4*Sz-niW?`gUVYP1{duUbKQ+JULCceW`)-9DM>ibc7T9;_we$;i7<_u$)}l^
zZVlO>Q5x4Rtpwf+3XTY$M7&6<O5|%`LmdaYOkW$5yaQaqP^r-x`m=&Q8)kp2dQ3sn
z7bjc4#)M7(sp|ed>9pKfZw(R?u3EIe{(H*xuh-(y^l6eTs@kYj9RpI{Sd}@dZQsWY
z@r3u=TKkm?AbYSab$!w(WJ6VJB+Fv25@nxrA%hrHKcp`&!v|v7?&3yf-0b4}9LqP#
zXEzbMw!WV7*88aFmC!h(A0tX#vuz-Fk}H+v@LJl}5GRQ=QRoF7%>Q{we!dDdr&|G@
z_sb&J4ph!`^cmS>%NO{kh7Zjg-CJ9mjbB9V@uoc0p?YFE(>sF@)>@~oI2Pc(1v$aB
z;orFRW4BgcW3(7bIJi}De3y({GPH_MiI%Txptw{oq&ofZ37HJ)%g!&~`@ymj{b0I6
zPEie>?lP)n#Rv5C!uN1U*x;LA9P$SY&N1Ngf@<38bg@LSvTYM@rYb{}r1i{<HV6#+
zr|6%u6cA*%Y#D6)dU18Ur*XC^YS|WdZKZhpF))FbzE-uonFCl<+{aX!bKe!^I0xJ6
z1~NIbUp_SvL!fjSvSCqHCH3QaPT(%$Yq4Zwt?XFLev@o@c+e>dj9HfTZ_eXy%0;OG
zdrAcKB77#&lcfbwma^%(;Q|pSKyf2Q8x*!;I+((i8_4n~oS0<w>jbLF=U-d8khL)-
z$8FaA?nUqA_0Mp@4TGngo6S}wH-mci;J+hoJXvvH(eBsW&vA)}5MFtHb~RgDowGsJ
z;m~2E^n!%$ZCGsgZs0C^CzWR|$#Ol&lh<$Z2twRRlEfRmJTs*NJraaZ&D_Vq<Dswr
zc;xyp*uzB6KEGGO!~J?Pr;GMbXHBTlA970G60a*VfE{zS>Z$-LzgKBhh|6S6)x#F;
z27*Z!P(X1JM*LUI<qE%r0VkVaEX4n}65yY+$s>yPEMKOdw-8PC7!r(ue8w>Q<cTIj
zQ7Fdqpt_a?aUz88TTQiuH$H5y{may&vDIJA=U4bzkKM!Fis!P5pC`<?fv9LR^@bsw
zx2KK+)Z+5w<X9A-)~p8E!(*X?Vd~I2yT!XkTCN!tLUjfvu{vUG70Xsg`>+(Jmp3|-
zbsF&U!NI6@e~P7ovse`!J&0<7h01zmw-uu>?m%?IOxa_x%Gg59TIB|aDq9Fn{yVM0
z_|wcq7L&JwI##!Ng@t=H2R=6uA2RiJScIM}sD<B_7het6TJ9IpH)<zdr6b0&zW*wM
zTKDn9r1lHlwbx<aY>Egb^Q~CrYqT5AA0eK7`EzBA1yx=E*#j%s2O-jobD}D&0a<U}
z`1h?SMtS3cBKXgEU7w<kKt`1JtsWS4v4h3^(UBCq%~F)9LntbXSiKAU;7z8h><;!?
z@oICdNyk4Zcb*Fc8QNBX<{|J<LW@4xntb<0aQRX7<w0*&G{M!xGBAf-0`_6?U<4t(
z(w|5|O7&j1d=aGLmFgXL7_!!vm{UC&Bg6zV)Ga{%XFU2vt~VTs7mN4eTp=al`e)c8
zHk6lub#ma_e!j=yjL76~&BpOfSm;IIVtAw>(z+;z@I);2s;KV#yjBJF^Z9cQ&1}*0
zn+Gw?kO%orS2L$(Jr0A7>YI#DM;+RN>Wx$DUE*ElE;LO=ZfX=a!M|OmPs|!+)_>gI
zu~2wp!qT>mtgKApTlr|DSeD52Wv?;yB3fi`u=CDH%KPE%@<nHYeOFY9koalGF<nE5
z!j6qqYvjM8pfTTVY$$iFx2Euaw0Zy4@--(!xAfC^gh+42#-2d1jTlN0j0>n4hgdy(
zq>wH1W=Woe<~CKq-oEm@OYG#&ikh0&*$pfQ*QbK}CLNlu=$?C+SA@=L^yze0w6HZE
zYd=aqWO|Ch6@3>UGsN=ikXWF>ZF1sCfDz4<J7vf165fA|-(8|v{fs_CPqdayzRS?Z
zxy_%48ia3IgmSQN`!KMnnZ=evmRlIH!5)y}TO@P89@fqQAyw05d#Zx#!*6jiKIpfl
z)zyh$5=S)28Bkz>OGC?uHOx7(`SZOA3qyXu`PETY{^|i3j6Xq6d6?dH*J7eL`DlHl
z6V93ABY6s}<9dPfpGkW#(RkFy)q!M;x_}2%8^kkf^F2M!Ms}8e4vW~%&(4hWowD)M
zAky41SnJqz%G<Q>cdBm#szU{bduIMu4F7^HH#JpNDCz3U#s<+WmlEnYmqIS!3u^pp
z!Q`jq7&-UORM&5|yWd}wG-lZp&a;Gdk+?P=ug|n<r}lGk2#+m4PbE%tl#eTV&e3d4
zcH8CNq{r`Dkkp#t10k$(N3?|V!r|cy|83@f>&?^pe8hZfK!L~DLHF;U{pWSiD{%~s
zpiIL*_#F8qk{#&_dwjEC<QJ4+_O3xwMTKc|oCMOWRqK3~hz>VbMno0C!_p-fzrJaN
zA1h);=ku$|JE>I^KFyD^N*Rca3WjCPJB}AJ#*Gy_y(|{|@w&#bE0&UBsE_kK113~0
zhWbPz;Of`6MX3p=Q98=v1Ub#!{J!b+(b9SX_jYDJ1sRAz0!6y8Q?gLPdAW7nc^b9<
zjk`v{2=sF2VhahKY6<weMIv5<X>c0uv>9B#aByIs1#0$L&i`)5CCGn5L-uV`jEDYP
z)Ayf5;QM`_sf7X<W<eG<^w-WZOUw8pVMlW_^v_xZz7pG-*w9#MH&3dPJ*QAf;{tW)
z+=Wes$Vp?}k$S#=9G_+C>$5Ak7Qwg`Cx-!<(rVy2+aqOJ9?0tbXP;qS24O|HxozX6
zE+sbbIr4&*cG<Ps**Zj8F(=!GCDk)N^W3vPMP-Rf5Cq}hkJn3*+cWdhy_@EG3YK$0
z984CXYtjG2{(t?zql(~XsUhRM`+wXHk>XV7mkTV?oq|LhEuHu1JK_w0_9_qqqUqdc
zmCS5?2ysV)=)7xA`$e#Tc{7w1D;{>-PyWLoj0m}r|IBr1M*U#FZn}ItKMO3rsH<_A
z&PA5$$Zu98%$&}j`3h}lmmFr77fL>3c~-QntqHSMASpk#Kix@Y91Jb#uz!T$BX*6G
z|GTtEkV+fAv{u%v;!BsTcXKY|FqBPNy8WNuw74v)vBglEwez|^fm=?!P}7iM=Vveb
zFi<_zJgk6`0`ThRI>5L)K<(8OVW37GWP<jYpy+D+_3E#O)PDK3)tC{mnuB|V>E-dL
zrNLlt^*r`vZhsygRv~+C@QKpCi|!}T^=9SWWeq_8{=$b*J`QtSpbD7!O5VjKH*Q_O
zym#mVq}A{)o0*#KaN(VA0}Iw#G#-0Clh<X#!S6uCZ!C`=M0=H1ji0+&?dMQbeZ+&5
zK+9uJOJ|7z&kLKD0YtZ6LY=q}zGv9Z$IJ{p!CTNKLM)_Hz`vd;X=7F`@;vgrC1Q;6
z8-GGwO+&uoOu>~?&P)4^Ls;HgWOF@#myDcxqU%?N>XkcRt(~3WXT|7;pU17<HP`)c
z-O!P61J#ICl6J}VWJW<{2XA?jaVDhRv_2+Y<D=Gcr8NUc-}b^ssQ#RMn#-!~iizjn
z>W@&-yNmPpV9sYn+MvG%Bx`J^-$%0*t=6af8#mp=N&kIrN9%K+S=`6^yYO1H(u=QP
zKB|BB0p%0GC24S6AI_5C6*wM!w+!4F;1)oO@@~>;LYE>&>7BwOyjHLms{qV?bPHT>
zu1_16+a4;#0KpFgz;$uRxJ^ST9fu?;7P8LUQm>Dg6M*`OZ3VD6qC`)pxyNKorLW7(
z2IGJy<!Ero4E7J2=P5agiA*CoO7WmApaJ~UdTA1LUp9OYIc$pe3$$R0?0Mk^w2<59
z{!G9&K!&|;uZ5@bjWMuM=K@CckR7mQ`IMt>PjYH=s6d0mR`eIm#}Pd&;+JUspTu<s
z8I!E~)1oKQ312?Eed<;C*E@%EWZBNg&!IF`kwt{$!R-_X$+K>EUhKe?HLm>?WEIv0
z&(~HbQR_`ES?d1Dt7W&+ZN87cHe!;I<f577xNXo@Q4M-6ckHa=2qsLCyJ)I@Z*T_p
zhZLNW*2b;mU$bQP)EyxPptjS9ajRI#>eB35w__pEa<9P@*-NW7WY~PetkFfs6TU2y
zo#%&%F)M?8f6t)O1POBagsTd5$h_87kYg2A%oaw@g8w~lH75s^yP}cUyj(k-R6rMC
zQbFbGcWO3`hcjQ{=1a&EAv#(=fW@?7&~d>m1}>@P^o9O7B-rRh%*l>XE}mEC$HPCQ
z+}N~68IAX!O@yNTF{B!gqx-3rb9DfWWqVLiEjGK23NTI60CrzAqM5t+L1xqfzY=x!
zz}P$*yu}DN8c^W=1R^;8YQD^xh$k>yJgngB@6)3O{@gMD`n8iy*%cCF8Pnb-8cVk%
z&u#)wx`RyfvpX`Go)>U+h1_(B3Hu_7fu<d6xSD-uez=CnpoZ;pVrW<su{t!qBron_
z&fMA~7#huq??z#_jkv>-=|X~OWmrA#@zY_8T}(^Mu(v{pW>iVGx-Y{J-7%cjNq~}g
zTJn>gj*g|mhY$o?xZ<2iFpEyb_?ENEvRV!&MiZE9&ouoLTgzXfowsE1z2M-`sBzgW
z3_SX;N#OTeAP*Wry!xY@Z8cGBx>-&S*$`Y!VgTMi8q&A`K*;P0oJh6+bt1*RxZE1a
zw@^b}uIghga(}mK@xkEtMNq7x>|f(=-?{rzLc-^0?UxjgA5h<RcLILOaRAx7Zm4}(
z<Hu@|C;c7g4CIue^1b*xjmP7V6H>HQKI^G2;6lOx{}#xL1aL+6{tD>j!h+VFg@k)y
zb5Q{kx5h(DJDO3HQ2R-f__3b*<GJx{5L5q2@F;s1ZH9T$k9o$h`dHIbS~SB;<;Z$%
zAE3{AU05dwI%FU1%s}1<Z<otjseoq$L~-p2m;s@=J-THGtmQpx5RvZu!d;{0oLqrA
zQPa5>qTh9dDOBd8qPVQO`Fb_iwh%v(&3-&|twxgsBxL(<*>vcmLS~4G{a`z7U0f@;
z;a4`+$rne?DSi600_x8xhJPw3l$q?}+Mfr(mbHVd%EDkEW+J`t0`_UZz;dOiZyNI=
z0TCXjl4HIpG*H6v>}y!Z6gTUHWYhOo#iP*Xx^ZaxRt>di&C6mk2gm=NyhXC3sjaxo
z`}*<{v^(vLHea3~nHDJV{=2+N1m%^*PHNt}oF3i@9fr?$aihQ_QUeYa6@tjcRsRHv
zT{fp&tR&hRBVdLE6US+&yx_WqG@M3k_NUA=DmGqUu8J|NRkyTA3ND6nFM*kQ91eSx
zIMbV?HC=g)G<G`qnvJgm_S2<doYw#rJ@M>1J%s(I@7m`FLN8I1d6v2&qP&FE4}$I5
zcQ(G?QzUyQf(9u}K3wT9+cX){?D0Fv`56(#2vhW9z<?(_@6im*eshcC9ZFI)9`!;`
zz=Bm{!T}2d9yZ3!8jt>++Q(dym58;aGlvm;tBL*v<76Shu~BAlH0#Rsduo{2y2@-A
z{$boZPFpQ5VqRaZfj^$ezE`-%B}1iy^-HB~!AzAm)Oyy10;}4+6<&5l1NV|2Zt!Qa
zX1}_7n<zE#aJbqhgOI_XsPOrwmR?F})A&;|e@4-WSbwWRBFp|N#l-R93VAuvOr`&A
zD?Vk0x%Im}<tW+f>E;}47Ofp|E4t_RPp<iQ{XmauJHo=<z!1b3kbvRprEN~A+f*Yy
zj8aeq<#$VA4H9(J^*t8*cza@#@MmVdq{S2b@$ZAeyCM+6mSUoLo=0=W!9gy#=3Kaz
z;xdZ_2<I)tFYP-KOyf4<rHap90kOoF51CEySGZ*Ad{S6RA6l@SSJ5<`bDH?1gujf@
z-zLl@xlQzx{%gSeI|GW2HEj;x3OOilKAPk)!3b{PyMsAL{12V1E%T+d&7pH|{TLxz
z>ifU&ik7OCAo3Pjyrtj6H+a{%rdIromu!d*YKx@QH8-`3`+I!Hrl7(*oF`6~1#_7c
zvu!LT4ru*D&o4op;G<?!r2xl<n6|N6h32*chwmo7IZW&I|2?a;W9WZaqbytc{!^+j
zEC;f`qtft#ObXjN<zmp@qliaCRz;2lFJVK0&#xSr$j1*w0%4x%;3%LjWJpM}L4@_X
zlHhVo$4)>ftJo|rEdxtx=Ib#=AS9cDeMFb@De3~myQLN!jzaz`X+aeOi0zVsI9dhf
zR^!d}0Z4yFe688IL?qB252<41-oiPac<zA>wQ?&j?}I`b`0A`(10QUMBA&CdO5fLb
zyB1)j!X0CYwo@e|AmYU!1E=6qg*0!U591yT7wVkt-P0}$8{=@d)_p3srNc;tG)3+|
zD5$Wkj$4@0Tp~aHK7cVQ*}7Ly!2c~?S01`7<idxfST#F2>97>ku`o3=do@U{%P<b9
zm;JY2Oq9&6K}8lE^~4znpPQEH&t>nDsQdphLcN8B4pPnWz-0j9kD~GV)0_g9D0H&`
z(yW1$9{5&%MR~Fx!osJ(J*jOs?cqFWLee~5^8uBfpl}>}yI!ZlAQK9~Wf)W|Q17O4
znWp15?SrktO!ffi9ZGsrwXcf<x6E={?uk9PzS!+Wsh%75isPu95fb473z(=}G+wT-
z3HZ}7WMyS_*uRXU1m1O}={*G{4VK=I{kygSaw4C|1#ot_JkK2ygk6ef&>lKX+I3Qy
z0JjCKOG5Ww=`v^%oYN@wJll5^Kl=crTU{lM*UwPm$s_=B94>-X=HB<dJ~Pv*`&fFp
z%;EhNC9PP&uu210eVO4lOF4nH|K@Cc?G{)><D)#nTS%uu`JO*|1n$E$DwM@_xzz;w
zlP@k0Al}!jVmDtwPBDFQ28_2@NZ$b)o5=me&R&!~0mbRxiQI@hiS4aEgFF)Y1zxN1
zE+Fy*4&yFyKy)mBaCms9Osm18y6E9K#v-oK9gFMTn`<TQ%5a<JMIdjE2@b}d1TbHW
z?N6<wothV*8Drh}skgL~n#CFk4|_tfNGK^1#8lA_GcEvaDGx9tEwd<3(lo+{IKFT2
zIOt|R`ONVQ)-SrTd_!<v*?3iSw2hn?xVIEmo(y`LU<4$b9`5$3I>Nbm8@wR|o?GD*
z&o^gkD?hC^ULSLufj4Sf;9`;H<_Sph>rI)3ih=DV3&(@=b)Y{v8b=S)nd7CM(oR3i
z!{fZuAv}J!k03ORt#Vogr9|jeTs-qE5+2x0LcbHL5!4(9j6yppSI|B_9x*I52>V>S
zo}IV^s+lswP_0nLLJkz-Q#5e@1#khU=n!-2w`jxK=mj;aaGbvTHm}i_9O(xFzi$cO
zbqtdgYI6l%5?fWRm$Lew`+)<HU3FYYWyDZ1O5<QUkYv$GvqJ)Y8Hq&G)d_Ihx!K|$
zAa=vRHmooPvM)oI#{05#o920oCeB8xv7I9ZoKy)|ye8>}z?cl`40nuXuKI1gj3yZS
zHZ>m@5nYP?`F+PdVg^|FZF!<<sac^NC7N<;(Um<ALc|jBcF2B>GkNO?tt=*#REf>c
zq6cy!svVB3>xU|<yqkWo!N|920?Lt!C5F?d?@9;g<^XQ9rTEmGUr)Q)p&yhD#WHfo
zn<ISF05zg%csR^Ep1RM`cu9{McZkk3dV3=)1%?`=G$&X@atv7)KD*!92)(GEZN=yR
z-l}7{R!`%)P<`Ks%<0yhzB}cwQu#lKwSRB4nGr(WzFSkFjvVzzgd&^iGxr|mLFfk=
zB^+?A7EqMgO~}L)L{;@Mpzx%Gh13nvpt6Pj=ug40AtBt>PPg0_Eg#uAp0QWr17OB4
z5yLj~F*k-cEbQ#D>K*oGfhVY_)_VczxJvB6?d%GVk9vJ8ed<F1X&Em~DCBU`ybW%8
zDQO(E`Z#pCy+G=qQLvipP!8LArWj%LGHa_$H}+_EswdPg$jYIxiLckMEUbNMuL>{1
zGt`M{m&rWos<S_Qo`<lhN+ZYc&$l}=?Tmz6>dDATTNbK*d9;L`{QUf^v=55XyobmY
z`S>^63<LZBG%dhI5%mgGb?=|D;6g4ZJlq|3-`@{hTBGy)&pw?Glk_Jvh`w2~8!PL}
zmOS%r5}DB{(t$bf%-MtOlk<!qs~?XRgfXS(bqrah`SEpH*7;^mXnVwLJossXe84P=
z2~0^ni((M=q`qNu;5bwiS2OR)2ugF~|88#onSx^%f=y2+sapDMc)l|W)zA0(u;qep
z*zA_aqAf+K!Fu;AtKU-)b={=xgDTvP)(B$h&=bM7rmQsi>2H4$y+|PH9>zWz&1Va@
zd(kBd5V3I9AjwM`R3BGz&0LZys29}a0xZuDb7WF0Ek-)9hdvZF01d~@fY^<P>)MaN
zOD&|)D6WWF*XQUz^SdS9S607Co1H?VL5q0$pt*D|4`vFI3umuTYEf-HuQL;G9u|7v
zHIf!)r*90!w^RlT#0*=|&yaK1rg#;Ulxq<J<ajUqWKdE_BI4TB41Z;kpg=mlQ6Y)@
z_ipP)N=<{o^e?>wh?sM`-=N50C{f<Ie-=LJ`%tOhxU&+Wk%E2~`1%>_8-!YSrYj^4
zKjU#uqugq-hNrDCThCdf2l1&cl7*RpCyhDMkCSR?kL#B7Vz)hzJL2~l-S4n3T`A9Y
zxB#IoHAX^qDa@;te9?uJWsNzg1W$PDxow!^B3%SZKrd?2x+6qY6rtyR<-~$n7%T7_
zT~D>i4R7@XugY<IN)6z5|9n!VzrKEjAr}*N_L+pvcU&QqxA4mAc7r<Ud#N_%{mhiW
zh+~V5(L8v>^daWvcOL<K{ctjFrVq0czt{8=c}fEMCjL>ACbom@lf+5q{dT)NwGh1N
zuB3$%u61R$%aw771L*|5g^|r#nGb||=gtktj{C>Qn<b;p;oDL2>|ep7I7aNlRhm-s
z;C&%*e`|I3xr?S*H+p+@;9eg=AzkI1S8d`n&Z5`ni#I&+UG+3cdzbf=Z6jOH{q}!4
zZ)^ARJqdRo@TO77wE6NPeoaT}s$360K?)NuP!N;OwLIPlOj|jdzxlLY?dKO1|1`Xo
z0;$R+<{G(AoCWC%40y$bTg4>2ZW^keV$xPY75WzUy;KnP)q*4u)%bvqnTj0k_by_z
zR$OQ3q96w=abTBow0Rvg!-G#uu0ih`!=XlbAI(7JmWkd8wI*AwjTRf#L0KV;*ocDI
zY9Eb28csTbKb@be?s=5seVJ1nk>J3CR^uF4vZ?dd&N`3an=Q|rMFr4T(d$!&#_2O9
zad2_)JW3#;(3z-?E^R>al@;yQ9GiUmr!|?jj{k&>w>GXY<WiTQHvaeS3!(pdrn6t6
zp6SMBdS=$^W(=$f+C2xh_;ZZxmw_A^hBJh|<e2ND^c2N14|N#ni$CYmy&Up8_)W{|
zw}&Za+-8s80k&?(_^?}meUpj75rs{a1e4--;}Qv-3`xy$3VQA!yfKMS*mq$o*-mYO
zm<H45RSTq=`}IJa$%C_L3oxGQq#>Wp??*p{p@_x|=${QRSz>c5v9sQi1X&o2jX6p9
z3LX(8aeY_>vN;^(2W?(n1mu6J(4J^W2h-f5lk~0XbHZO3NaP<BWyGJA5Lj_}RwyC(
z!A9%4DksT4m}q$Y42*bwIcplL&l8>-qi|%o=<{zPKUYzz6GyX&wEhWvK1PM}gl6G`
zrm(E2Zs2v`vZl9(CbfER{FlPp5(|o&*naKi6Fy|DOf`%6i?`z58GV^GBp^(8agwkK
z*N-f;qgcp!XMod8Jw?-R*e8|d1_UP39}YV^g?1}HQd<`dm%{>ZZkG!MVc&Z|X<ih0
zzACUFo)pm#;4q=!-g1^xeErHF6hX6hn_I+YOW7rsR!P2mYP4#nIF^GL(oHRYB6)R5
zZ>yX5_DKi-iUH56ej+{|{hxq7jZ-bUH9_&s-vh168M0bGV0!YIGv5O@ncb76yw}|}
z;}!#GfYmn36Q@DC=}0&c2?_F|@Ptm!`NPHCD?9=|%JEE8PR|$W{k}git@L9*@5IMJ
zVLc|MNbt}M3V!r*oX}X>riuSJ;7d!juw0YGV)HW7ru!qi-RgG;$8_NFnWVlYmSsEz
z-l5R<<=wP$5jpUrlw(#|`TbS=Oh*)`mv9UFs|Luxw?n)5n31waA@{Eam71&fq4rq0
zu;-Ulcpar)jv}qW)=$cRh3>*+AW3*3HvBJNxxVz$j$^~YDKkE+foiEGF>cD2W!B}#
zk}jqyPLZ|t4m0sTrb61p*lhE^-hD%1Y;YRJRW%5vD@?2@{@?gmbNl&Tw3Xve1jtkf
zl%#7P-)<AzN#x07`v2H_%djZht_>6k9grA65CLgKr5gkZ1w;`+5g6%^96*q6M!Hp$
zE>TLlh7OSs2|;1#kd$ta-q&rt&!g`By+6Kx`#TPP+zi8g)v9Z)b*`o1tX=xHCocwv
zrVYV;5kDBIS=td{rH!n86*sHM1vzx`RVi+_FAa++=vY}bh|>MX?w4W$@&DJa@~tgp
zD4m_lKUQmQob6;{TK|U<g)UqS%=iKzIxl(aempxn`&*^6Bk2G|kP_B(<+Y>YM2>E)
z1XBmp0#-!MjoPLi=2nH2J3pn(uU30SE}4Qag><>1e|#YEt+U%uMcGa=o!sM7e3XY*
z<T_9Bfhr0R!kwF5OZW;!UbgA6(h)hk)0`UbVE3!5PM$nj?Ih<jogkc2{J8)1P^GaC
zKO-~OS}qN5h$GQ4=8vnn7u1VMos);<tS1^B2bcH+3>q~ELpQI7zvzG8H?5B**?!N*
zWX`Qi6m9vsdOjmqQ$1f$ZMAAXJ;5RNT#<wm6>qrX+3XM=-uq~8^nn3x1tYV@S}wCE
zbAISMW(<mSO6HXy_DpA?QL6=+VZYFQA2A0GD(RA__Q{qAWGe5V%;3CSG4(^|6bU(o
zxzrx7!E+6~7>29SC*`cI_GUoK>7esC6RKzDd?!G|nvP&w(2vvUz@R~%TJTYV<3p7?
zMD4~$dT_^K47p(6G+t;~icuU)@8$KdCZb;npXQ+xNF)uBld)|MZQ>oQ_7B0Egumz4
zL=ApLTn$Nnk2$e0T*H&X<f{0|+q*&rgXKuaAUQd;6+`;OWt0EWd?&Ej7gw)nhnOm6
zecq9_{fKBGM&ZPhn)v76GS%d&`D(yznR2W&j~CsoU!~7cKA%sT>SBoB%ab<$P}<$h
zXNoZ!Wj!{#_DSebL;-=tgkIZ=q|I1OC7L(;6CIqM^!l7Ot#y}P5F<y*Y$mFzLQ4#*
zCwBrjlrD-=w>}$j2`$&-c;mW=l?64yL*ih6;f{J)U_gE4lKq34oit%J8{O3pmQjpr
zc^?LR_^2=GhBg)k9NI45)^Pj^rJ?nDlr9FM2RX04&D59)>9H1L>oo4(1F7;`1NXBp
zB3BcW<Ol2IXHGTYEzw(-c~(v|)Jp8lcuSDSoF=f?1zqi~iF+p#W=G^IOpb)lkc24Z
zh}BQykt|F2)*KVgZZthPErMZp6Cj$)o*A2PzNO7%uYj=)6zeV4S?RiE>FpfTTs`UA
zMMBMH+U7)h2DoEPDREaqUeb#@0_z*L^!aNXY+EOL`74b}%g5(ipE#&T>g1@j7@2nq
zX(PF~VL9Af_|Koy+?rOga(aF#WKs<ai~rJf8R@&~cU_VQc(Sv{*>VWYzancvw-Emu
zH(IYWvZlV+lx=)bGLP|B%h5sZ+Sr>KN$Z>L1U-L|+8XIk$$gJnV`F~2vtG8=&*L5t
zG&@GpUrg3ZU2MPZ8w{i@UZLqyD?Vd+0w*7fJpUMTJ~n?o&ef?*!}y8Hf*FT)1j+Vw
zr?a4&hIaj~k08xF1tur$%j>pk`DL*=Zr$6aOSfra4Qvr6KQ$?eki~0;KwS4rk>9Qp
z@gH9G0o;upy4nYy9l7>Ld`GKS_D*}8_%zzEA<Xx+<>8qN`LYvQPZA31DZ54h*tRVQ
zSL;b8d#v>R06JB9Jv1Uro?gM)Hvk@N24X)cqQH<Iy1OymRQn|*xT@+=gRYep5lt3K
zCpLMlJ@UhdeSmDY{)!ZBiv4!5E}SHVjKcIQUX_PUTWXZf>wCRx!{|L(WWWL+;cI{P
z+>>N|SE@1>SGJSXnh<lF<I$W?H|^e0#6G&Fyc3PceSAp=#o5rL!Tl9}_k^f={BhFP
zaZL!9oaeX^0~C@c@b4FoK0duWOi^m?2X8mM2N&8)D7d+xeN;-?dR(-W_Q*b<O5jMh
zE&Qp6BPf*a+<S0Sg;CtQ3}dv2Ibqw(J@Ror*Q*Ut1ClA0!$y-uGe`~FaSV+H3{fRF
zWX)qK4}m2&-*`+tpjLY(DIyo^?!+0SuMXV_I;Z5sTYb%6J8OtFDzyskJr*g;B`8B;
zz30_z>b)^u!{a4F&UUL<SVlOd6^48?+BnA?kW&&0T0x{qW-jt;s}$&bP0$otGm}4J
ziC~^H&o0@`G7AqCw9Csm<n;t8{Vu&ARzwp$f*9Hyr#d-HYBMDG@&!`m>I{36&(>$i
zaJ|h<D<zY;i9;{0m8noX92-8LZjey9+C-Bh|DMwXcy@FuyF7|N*$1NAwdWc8{A`!$
zT{<{FC6G9Ub)BXg5-HoR;4afku+wJR_9$)Fdt{Qzkj}kZ)@w(oA0lHL*v)zG1M8*8
z+q%8w6STcr`uR<7t9l%c=af>1OW;42T4xyZuu0ZEr>v*xI7+R69tqDkX1~oWk<BTU
zP0A#MhUZN^&s$)0@f%Z?MYB%h)fud7zpL1kRg<Y0s0t|t>5wPef=e%=wb5?n6bW3~
z6>S8{j8};EIdlwk?zYw`74KfTi5$R{<{ZdK(I`GkSchG&0ddL0#*$pG`1;kR1Qo#v
zF^)pjRelU(_O;zcUQA}%5|3la<+(f#E$#USiD@IZFuy!%3<tO?r96r38)vS%i+gtd
zmJ=f2j=dYAgv$98WlW=^1jFj`nZGLo>k8ChkK@sQM8kR|8^#zkZ-Ac*&tn|FR2!|_
zYMT?3VA~<;aw*LdxFMV@Ye6SNWTP*h0>$;{#n|fkT&HnhxUY5W;lP_rT@bhL&IB1U
zj0c?4lG)$oAtWoS0I#W|G`N?e%b}3IT(ur{dKq9SKN`y*HbTxZ$xe2?yyiOlax*Dv
zHq8s!_3^=(etPwAsHsREEsS%O+3_(Bo29T@tyB{QMy3@fl1-4L7DjATft_h;G4ybM
z^KOB@04W)V1ab$|hV_(Ly9@hZ5U9&cuzgl);q|7EtXwVf9rYMN`>JeMuHt!<-Hq8p
zrYb{6t`|pIGac6v<3tbh2{J8LgQva6n_amQur*=5k7#$*2PxafnS4g5Pefig=$M+{
zA{{SJxn1>)bW$#aN`IY%dcEaK62L?qATtN)0?s}scT;~nt0C<-^@+iM50zF6S}!uC
zlp*D=_NE08x}PYRW|x`O;I6f%>Muh+J)(;@t#t1x_HWUdNoglKbzI@ifWx!-3Yo#<
zSql{-FGKDX89O&428T>eaP}sUsHENO`c&dpCGc|7!FN7zWN%ndc%YTL<YLjR4~ES&
zk@-f7z3m?JK=tXV?oF-n4#5V;1mp_|d5f^qjKvAk-0#Yqc|rbK=LSfY99)smDy`|;
z<3(HdR7kNW<-)^K8a9H+w6`uwg`67j;~bC+uoS+BR-H$~hcRw#TypGj7?afgW65cU
zpV7&d=9w7KoCA>^dJ6L>q4nv6NcBYD)Z&)6-*7>wy?m`e({8tx)@_^2UM@>|j`ffK
zAwFQv*_n{J*La1`5dVH9nwFMI+Psi&ze_&olLfD%(BlwR6WtK!*p!|OFbp`|{rQ9}
zg`ZUC7smoz^?<mHvJTE=5a?c=qq(o$6`G|F(<~0Ps@$kRmiLwf;Xf%z^JbORI=Q<K
zJcBFavknXI1}U1Q8faR3{Po@O&>+J6NL>=<>pkFQo4a|PqFJBp0?yY085Vo|dyfY4
z#;qpLvgi@rn9$($^X)}+lq{S$Rsi?`DUgVirW}{9Rk*7+ALR4M$1c|hA(?dl<Oc?~
zkY4GVFvbyY5(%nDzPBh8=Mbx<tX+awk+y;lzUEU=woB9I+UP&&wO@)4Ifr=bl0N$~
z@a>TJ1QEE$&?r*P<!<K(oSDq0G~Hv&U#~<UDSSS}Qra@V%M9Q>zkGi~sRHEe#EE(K
z%n74&)sItoc40K*dj(+_w08Q;6D0xl-hs)qtYtU*-YJkCQFhN4)GrgybI(;>zF#bs
zlB{^*2bnnnM2oAXZBEI#EXyV8WJBCT;Jl{p-Uu)WFrB9$s|Xo#e*Ug{)V&MKe&b{q
z4*NoU_m-^YRp6H6OHwdsFOdzVbe?!qs{;bm*{7puSqPtE;S1OR@Z~uSDt{$Y_ag_t
zW^gY1MKq<#+mr@*{S<=ni)~w1b4|lO-zA`YODXZZnq7`VklXjgQILXO4_eOR<eQuz
zEB!8tq#k6i;A}YhDrdJjjq2UtE&rUJNLh*?+o80F@lEf=9um$Y)aKi$J|P_Q55H*m
z)L2+`l(c0n`kX($&GQdx${;x=E{Pk6T&<D@ccXt|m^<BIU$z5I_3iGSiey#YNY>n~
zP}8vKpb(MP!kQuA20q9;y1AQ0HPo$Fj5$6>QtpB-jjomf>UzP&@E+5_;Y(67FK2Go
z%xlfxr%vY@rLd{sFbp(QHrBRu#0vt5!}>Kd?aeLS-o@A2?D_Eb4Z8+4jM$nKRxjPu
z;}^EPB^S0@L(cH;M=^(K=jOZ3S0L)CLuWKRZu!=2ftm`NyT=VQYHee#oL{=6ewRXF
zY$DA4s4viHr;k(N?U$FJ!geS5&|Y&W-5y^4(pUSLr0J}hLET*YZcvmCGjWP#t#@N(
zSZF6_wn>c5UQ3SLzkI5Z#-Y)^Z)9lsBO{@&pz0!Xt=`Rf@0w2{xd^4aYxB%n{`R(t
z!TSdjb=6T)8MBT+oY`4-yHwUcEE!k~Q#HCBwOo2CE~EtC-r|c}<H3#j1&t*iW%YT#
z@+pGZh%T$Cx!qZ<8K_HC-f(W6&^^ny2jnS8qm%STa<;1-CpLoP(zg`8soO8>yO(m5
ziUkFpRIsj>%QW-P(M%4x_5x|WEb9y^nqQt?qFrU;0jJfu0MjGtCBfWtTZvb}CpDGz
z9nQoZcXd1VLRU^e42Cb1@o^{*WGlM3!Tt1ZH^vJ-DjT>W8boP`e=@?cee}eDaK0(c
zp-&?^cZ|{<aaYSgqOpBaWjruYRe3(h{Ec+^SLfTfiB$zu^sNI(-$Awkr7zcx2D~>j
z$}4)1=1W&yB<s-~Jw0#4Bn8!pEl&STcanOGKURM11IaGO3yDPjFaHVieY=Xro<8P2
zl3s`D&Fky9Crbj-7;CBt<|9PX2hV*-k{k_wsfk@lsiEJ}vkWQKUW)SqGFmf{y~?N@
zc9t5TN~<~a@2SN=z28QharI`^^BU(XDG$aenv=74c{YMso{UgX>~d~Ey%RUB{0XoM
zLQBw>V;M-M-j*9EQ^fh^;T{FkX97WUahEtu+ZMBUTD?<?{N*`2&~n<<=&LM`JwEcW
z!fOyk;C_#_+2xG?rW?d=7PP&4lxh{yR|t)i;)L3>!ZBwIi3}D@lH7&HV|5WRU#PuS
zUm5K-26%AgPRZ7mv5$yeN97<!0I8>NTXT2SPzzhdmy89i!_&(#^|~&ztnp#i5DgJn
zkbq(cc{xzyUklBlg4eWjYfr-GpB4zQ^66@~CM>yKr77VA_pVgUDP_Kavrj&!dE4dM
z0tae~x#r_KjHm9yGYw+&`@lzBJw{f(U1=G%iS4hcE1V5(QOA+-GINn_Gf$z`#<Fx`
zSQ)lS{rlXtrnI|IY#`Vx2noW#afngi-di_fuck*9XuH1Z6zWUKVUPc0jc_`tP`Z1)
zv@Xv%GTja7#>^y4DfO0~V(_&tbA>OwMAS{Mq*U%Mp>z)W>zvCH6Xf1P9}1pUpy%U>
z_XG`j(HWQ$gr?RV<Lum=bqsa37{XKIk!DGgS!sXM8QrJc!Wh>AwSTHS4s0i#I$Q6<
zcexUY+<(vw{W14xh;B-A8*@NBxJySh3v|NOI4h$Hzb3_l?+Bd8t|_r8DFd2bWmj-|
z=Uz=mWt81oM~y0@EDH)UQXY}?Vy6+*FkqwP8|^`3mDP_@$(7ch>n}-Ow2+oq4Kjq6
zN)XPo=i76dT(PEB660|m(+Ym(flL+xeJ_9_l%EUI^w^m?%~twFx>R>x&Fmmk3t0+B
zRdjF;US9T7;mnu47r~~q)pVvQBS_4?%0S|H!F50|^)5Li`{4e5`L43^SW3{B*83+d
zw1a)^L$CI(jjL%|QrvEKnt8P)EntI?Nwc9VTUW+gu=;2RyQ*Rd@)_ThS<k3-Mq~EE
z2R(cux+G`EGBz=;tOFSs&fx;6PeVh=NUm1-oucBJR_^gfws5574ZE5YDs}OYJuKR6
z_4!L)t_AZ?yR3vIiPCKog3skEstpdU=Fk>2ecjU?Txtq8!aD*{kImgi?V=&U^qTEM
z=k;l4XH3boxx4nLWs<ATTVU|Vd|<V27Zg8jPHXLzK|HfThdS*6osh<HkSY{0_@T%6
z^5z30;*;0=>Z|46-P3$WRr@ZNi<B;}x%J~B2~p+vr${))q0*yjpNjjkZTlikHnT@C
z67fJI7O$5<0sXbGssR@M&y0WotVHsSX8YdssR0HJ$aD7(?bPn=C9$WXH$VRYgkYT>
z1p>gG_y&ZKYlgFCswkAgDaM**0tgr)tvUP6w7zbV`U^$kX?Cvz=>Gb^$v1>D!56Vn
z*6)^qCwNl37NGDBqUOcJ)M>p#=H9~Xw<{5p7TN_pATB$vM7>UBKxTwXe`U%v7bqx1
zW6!>>+iIify=(D~dsCoPPk7n1q*vXYb$?lj-b~Zuy)VlVOhT{9LE2K)J|h*u!-Ds3
zA`A1egD++1U7HWK12_-@PTd;u^MkO}B3=2pbDjH7@;nzBfOw$GPtMw0({#Z&S&2n(
z=G)_~Wt{Ly>54~|t8m&Phaej9Wmo$oPCZxosBoGi-yMXns|&`%@Hc31)6LIZ4lv}~
zWz)vi-1e9YyY856u&+mylV@8lt3dOeB-*agyLZoD(;nQoSLc3Rc0MY^0jZO_9CSgY
zx<i({@7zmEc-LG7w!YAkc17A;D}c0;hB-=<Z9DZ2l)Kgdy0D+eIB#CP3|x5!J;Bb|
zmceMhb9YMbOGGvB_YNfx>)9Uy7x{W$gT@B~>~UELtPSOFblcriRki1QvG{Qc4>QLi
z^AP@^qF&VJ0^(-49&bQVEw{#i4V*kt;mBztTr8U$!L64=Iq&bmNJw9=k<AY(^6B1J
z7Ru_S>|b`#ym%TN_cL<9@D%HCq;VZ3!Coej$o7Y{;6CPl2$Eis!~IF<t$dHcFK0M`
z+PH9G!zMx{aV*{h0@g<|`sY))Y%<t20?%~>v(Y!00X+XJcTha18eK;{1ln^gpZyRo
zN`9LuzVfUPE^lh;=HRVcJCAfZ=55axbNS^`=+(-T%^Kpf>f0ms;D;b<(4WOdtYj^?
zSdX$j!D&2DN7RECSuCKg>s}Idd|YgwS2xOb56|%Qm1Kq)0w*|$fm&}Pb9NxB!Bw3=
z0*m2tKM!BLNf0Xj7&JOuaoqP{@KL2LVj>Swz%;4RzY(5*n2=jPFRW=W_w`tjX~)!T
zo&q1n3)I$e+6+KbzObUYrZHN%RKcE7vD$Gx<n-h*$$Pn6s6{aRR1b}1MqY3__b2@~
zYP~0`I<ZcmSUBRMo;~aCe+3NYOCl+Z`Sn>7ZAWW?Vroa5d7eG}R-U+yTswKQHpL|u
z&a6`yl^NnOx%cvIj2><Y=g9danN~9M4ca}<wI^;YpYM(rwPku8VLCYEx(|x%pS~hl
zj$CKYt0KEiM?9WDl3Vf_3YNCAb-5ntxGqkGu2$$6uM!NO>J&U>%VIj?Ei<1sPq?Nu
zS<aGJjyCOL3V(}tS_>X4Vw2)X_~J4ELQAzWfQ()9y))cOdh=V)@v@Ky8I^8R7un+h
zqGdk##+AOU>IT@{jnF;}ckzVHZj6BXNi?m(EWJWOv|)|mh~c5(**X_2X->?E18jtQ
zHZwwrdM(A!T)m>HrTSgIvQTb#P7<%@e<YBG&@pk6vGO|iTb(?K%zu!VFd(l7geXh)
zWI@TVCfSuBZM!i5$KoKw>59bu%2nPJGAKo|>QbIY$qfKAwh9l;kO`5!LL<a<w;y<D
zs-38RB^mq6$+I?H%+x77ls&D@VyxgyQv<YhL%>Dm+<9s39frgLFLtqod~Zbq+yp31
z)qL%eJM(S?$f67^U|}<L1*rZ;m`7uPRztw2S0G)7)H#~|j?ufvj0PMB1M5(VCe@4V
z$;nBXhPQ73X2@b>3D5ADa#P3|LnX$9f~WI3VX)qwttZUa-UAW(;1ku8SA=xpB1{LM
z+HJM193d-|V%)H4Gtm@C`l8QPu8K{rjaj?GE-=6wCx3RJ1Svxk8ql3pS)gay+-4kS
zIi1=F>L{ZJ8!V(36Zo+;`vE;vPne?0ZD-zt+>Yv2xiVHz1ZpLWRO(R9^#1xF=y%gN
z$_>Gr4D}J9szJ4#9OB}Mvv!ZEq|uihTUevsfgF@^?Q6-PnkTv%b}bIQJ?xkS<^KdQ
z0o%zd-X3#LDEnytVA=CDb6J7EoYVz5nbat8Ni|WcTB>6yXCrj#MX;?#zNi=$^eEsR
zkFJ$dUQAdIPpD`jBBMsdO-@ZYJ5#lOfPmS{eXyvhAokpRLn$SL-137bA%a-82Vm3D
zvQ(>)R0@wqG?J$d!A1G8<k8Ltm-9`#d5b2ONtfe6%>5<RvFK!4Tjs7wjOS*LI#gqb
zPp=M(*8mNpBqen}fnetS@Hs>Z0ZJhh27t!ocm@qRBjvkc{!Y6e1G-XeXFAY?*`E-3
z2OazH*>=zD(09G|1(=J>G7%`869Zr5yyk|HLmLJ4kR#<`gNwg?F9I(#0|2**8UxH1
zsovl*r)=(0HXj!3f@r!-wrv28iOxX&Iw)sz>oa-Wq5X`#dvDtPHuan~`lGMcAlTQ!
zXW(_6%Xx7qC^f-0VAbBdTq%C1q~k@K<o;(80}j2x@z6T8kbqBFH<&D4fg^uGBcyF*
zVHM;N4bFr@vAL1h&;q{_YGl|YM+sWDl{b%EZzf5&Zxn70+vBlWD>b^`NpKC%T&_NP
z;ZOIJzeD6|(bJ!~)yq`JvQ^|3IE`m;T0VT(&V^9!Bh@p&)3r9REX#uec5C(wnWKel
z95SOw!dpMoYP6=>ooho<3^}MQY}k*H@YVuVMM<>;h(Q(zD(zaGHnRXBy=PQLI8Wls
zprBSuoIQ}{vOyhtOfZ+v^V;3JcW*d5KaY+g;ZK&!#s(54jl6D~!g65p22g8HX;$2|
z(|RR)Hu=Ym?iHO|b0y*|0-2uE4<4f@)1-dFQlw5Ydev421>I;L)uupkE`3aWIT<&D
z`;Qwnl<SF_R@9p<#2%~zg|ZN#p#5s(7|y|~-GH&V3&Yk-c6>T|d!Sl$3#gDv+114G
znPHqE_fmj_TAt1#e%^-oKH?F(mLnbmoQ+Ds6e_B55|;x|OfcKc9CrH2=K*z;vyA5J
zCpnLHdus_~;L^lQ5{8?-mAE!-udYXAuN;?5z5>Vb_|^hAoc*0mBX1~YzV8<cklve^
zeCojK5=ydx3El;&?rVoMDmkybIl(L=2uE4g>`arIF@hoh_O0WM!8y@48*2$J0{{B>
z-roK0jN5AR_@vysG~<G>7jH%oc_k487G1QA8>kE_gR=p2Pma64syBs2g>1@RPYX~S
zjLE2@#8#w;zbYOiIz|v*pr^kiO-0AD;1_)=<&H>0CCJ?3#0eSn1Vxk3p2fK<G)(!j
z6(Gy7i=5qi6BK*q{z4Bs!I<bj)@kp7vgE^H1yB-$bP(Ri!0Hr+Y`@1e27OT81^U2+
zw6`goKF=Q$?s!X%97GHHax{gN5csQ`0CPcpTdo)<O8Rjf<#@<QwX5rTo5d^_eDf+i
z*x65zKe81U#fb?5$k2Xs191ZnkPjv_BC6#DBjL8j#os4iq@PT>8TO8333TZu4{_bM
z7DHk<P<mQtecmIMhjs!BTpCEP!5aGJtVc!1yl@t@{NQH{8ll+W^xoHraHPO|GxKgR
z>!Ffejkyt&i8Dxi*)M#L5i`mVWm@UI)=+MjV+%^b5n09+++~Ny%^ko#sFp3i7Mpz)
zF`1d3Sm;k>63st1wBuzPtx{I{S(Yuk0JvSAO0{KjeUW`CvvhDC=O8pHtNSx+Ca_gT
zYY5lC&JE67C??{zlD?Zq%pEt@NF@U6wn;jI^52%vz^x`;hyka<eEEHVxG%CL-E6RJ
z0)5LY8_rl-Q+?)%vN^ID1~><HD0k2G{RkWHQTOL5L6{As6=NliiR)&3;&B_I@4gm|
zt(p3amfj-k^=mxILp4xqiJs>;vS>Nbc}3xtXqztxGrz@;cKlo<<o+V~w6pEQdinq}
zTU%SEnxXcUNCAz_*X;x44wg@xZC+f=Ck7R`;%W!iS({f<f0g_(t-)QnseI>-v7~fP
zTWhOe?KQhGerY&u;;(Of<1}OWWL`Y<R}|;V1k#&*mLC*rCuYv?@lt*;@97UXteOw-
z&xv>`%KU0&+<@J>7Ua6+s-{I+%3RUes92MhF?`a^-ipZI{MbbE6`1nX8yfz=9U)=-
z&=KjVNIpq((u#Dap|YBvtfyz|W!R<nS*4`c<(_$aJE8rrjZ*37L@6oLSa-lokW&vD
zSnbpJu@T&1r13rPnFsJKo`<ed<Vd*CZEBz`VxmF|a@9?!i%)Adoe+(Z?X-^%MiW&w
z36G!4Bc@`L=28=tOI}RvbvV8whoGqc8Y}!jM~2isRalMWYSX}Lbw6-H;I~pvCe3qk
z#_jnK5Pen7^h@KLOA{6MbB;AJS;~k?+rJUDn6UJ4a?H|u3#`8tIf)f*6Q5ii8k@6*
z5;`-v%yN1((QN@d%xk?{FX-fM!lUJsnm$DVc*o}2HBUUzjfBWx&V_^A+>*IA{tp`;
zkrL81q)Wab(UK`iWQ+7U$U>0{Tj30%F`Omo4#Z>h1oQcXBig3t^Ft4Z*R4b_1JAy=
z^*ju*pVQd3+PKFNC13e+DlXT)qnae<w3oSRI-?~&_lnc{8-!He^Yj7_`Zs-5w4WPo
zX1qPyzJ`Zxu01X|H=k;c6F9VYngapn<0f{tT#3qRc9OF>n|N#^c2t=Ajni$&vzn+7
z^6qj<;<PMto|RQymDcU~oeKe_q}_6pCb%tDLWBT7D4>t+l-o^`*s}75KcXO?y8fUL
zRJzQ4+jr$!=_j-LcB7u}c$e4<s7+bc5%(L*>bbQpi@VCc<)vM}Jn#bC*k!d763Zjo
z2m0b{zlVj2Ik0yfk9myNFOPn$K3VJfd7FEmIIT8t_Q8GWOWA&8txhOTYGV!`7i=t;
z^P~8J+?hs{NIk-gD9HH3nbsFNS};BDA&|4Dr4aAs7TPGp?IONY24X4I)Z<zO0R`EV
z>Xc1$TJI1%8w0Zhatr`Y0lRX$_e_?Zj$6PBgYt?2D~@?*XHKoMd^I&tYbnd|awL@t
z2<$PIa+IEhuWExHu`fV9cg%ZwHim}d+`>fl@Hy$5hS{wyy>p-*+DNnym7(732l~xN
zu;b+Y%gP<76Lbi6qBSZp2MgGvHq%?JYr*G-zvc!I8L-t>9v$vg7q(N5AGU6ZsEJbX
z!>M-%X&0&1DcrwYDmrlRkveHc`T@aT9GqCdwJ`O7!=&Q+)zvT>7QV=bIIS@}`d8i|
z9ut+PG%@g+7GkhMZ~`!$4?J!~55h%cf%EfvyO^oF&tt__UsE9+|FT#vP#jM9Vu)tw
z%&zqM2&Y(LO#{*G^^kM<vZH44AjA9(XT9I>CbMa^Fr{DhMywLYkspoK%6oaaBZi{;
zHZqza_G@t5$wQ&B!wG`JYB`Z(-8k-{Hj_%>hC{)ObekYx;MbJ%?M`ei3eT#v7goEr
zdFO8Ji^Z_m7v+z`>_N>EIr3Y*>6VDB=Vvj`Ot+cEB~8V*V;U&>4i_JIp49d{*whgZ
z4R;G=wX4K5k3&g(^LxOQqAr^@u#(ZVeOZk=ak>E9jb)M)7`A#g>2BIQ2%Od`uq&QX
z+W-7{`ZP;-Sfu0!K&k+7z8#Enz=r~e-6eiZ*tg3qL$p_c0nNqpS~MzpMTL6y8K4q}
zTOi$@?C2PoQ{=DvFF9;XB5Y4|X@2*m^W*RtY;pQOh*TVVSNMt{%tG^6>CTfxE-x&!
zx-iC|5%%U4xXTw#MQXkW$R9d5zpc_4REQqCgJH`p5brZAl_VLM6Svib=f;q>fnt>V
z3{5VH#Scbx0Bi_ZX)lVl%x%rNS0opril8CVWMnHkm~KXDa)*$<3@Ft^l28j|bZ{QQ
zM`0<rgK_|jt_m>Y=IFv%Ep-*@%}bF47GmL+eW483LcH2KPBK3#-o!px+!{dD7_d=Q
zLH#0)$|l?~1PgIy9xZfOhr+Sko0x44xH&FTSH}B@kry-w0kC#(Ln-U1u_;oVruNF|
z4HdZ^!k|@HSctpWByy|dYAuz1DZrdD8%^oE^VV}0v06P((2X|P+1bgo(x~651&Mrx
z04UJsmOp#|l5$P=nqjvWL_;h?=q+*%A?wyw&dt2{lg~+#cMLJKp{z>01`>lL5b6Mw
z6=F|r7*mn+GF*0Vx|1{fu@5nU-mal7N;SKvow6?2Rl!<0JgYG?Zsu4xNO>26e_jN>
z#)7Dj5<AhO{q=TCUylQEjz-CQi_Zfcxo=k{?19W{ZzXb|ohUyx-vt0Dx-;TDnAXL0
z>_i&tBz|t`z7qb78sLI^GDDV44j>xn?JjT!FD(Qmb?{V`01WHA@Tgl+wQ=^$dq#g+
zGAfb}j7?+(4BSKCoFcI&j%_Qsf&6dV7rU^DnDmUYA)$%~^ts2{UvBpkKp7&YiMa3I
zv$tK&y7{_&o47zrM<=n^EP>tm>*RD((0k-B$6M&l<c~wW?Ch^!4Y{pon{z}NF3q1E
zm{IVE!xW^fQvdY+e+L;#@t@1LyN9yW_TRE(5fd9U&r7a-G;-5j#(LAlN`zDZ1i`L^
zn_W-FBaH?nuonPu0Nn^B?MHK>U!o7eujGb|7#;t2GfgxPLa3uo%O@AWLI6xEr13s)
z<b$bT?wWkzq2!7&S-h&`<c=yL!$wD!n;@hw1(@_!3|}JwrX|$|HYQ74rHoC=qeI|@
zkcb+8)HF*Nc>_CCMoPBiyw2N;*{Yzvr`#MZ<#!nOV>s&L$A=d<*@c<n`>tqe1~{`x
z3JW(ASlWWJk5Nng(<dF>`V*h`TpSPH^10a9@M~vKxb>c%e!5#j`LnD_hM8&%**ULY
z3wh=rKNl<#6BWg7xjrZlZs|-NzbE4*Pmw0qp{F)QHE&`ohSh;gv_^|c%Xy;tqN{#{
zfdhWEM+eIWX!FwEcFYQ&)lgZ6jWY_D+8c`l`FhL(P`DZ`RSun#YmMvnl3MohtVnnt
z<W84?aOO|18PX-VE|ot7m*v5Wb@Y-RZiZ_9Mv!{MhJdN2L|OT2?gSPzFANbZ-_B0z
zBkY;_-B|4x?^A~m=zo}E9=HQk3MKF!v{^#$K6NwYFBSPc`A{GLU<`@sn`FR#%(ARN
zKw7AmRIoV6UBK1!IuY~n5FlNQ04!naH5&NaGc*ydPpBABatu7+dW`HRO@SIq+=WU+
zX_R=CZFQ?CJ!eaFs@L(h2B5|Vc@*Jn^2w>7#wdDKPRh(IlLOR~%0J7ss}E4WXg<WC
zbq%N%6{;>83B~Ns<KDd+TrZeiuK@z&md|qaUwl8M>*oMcNA3bYlP1h^qR>2UaxLap
zc|EB$Se*u^Psz@7L_)&zs*o7+-)OlA@;w!OkrR4^8!HS!>fZrJMh=Biu^m*26X5mQ
zt*$0SL>T%8LBaByAU=e{Yd?4QjG*~5$2K73$xwmhZ115ck}AF$J=8g97LyZ~tyy{t
zAn^?wi~Fq3S^*#mROb*BfYq)NfZ$v{Q1*cnvp#UtJZ$4_?tWbd>U%S|E|#e0tbc>2
z?c--;P;&O<6Ciui>(D#lIOxZaZqT4U7GTNVrcg*h(dSTcBOg!jKMS2Ed)Lx}u52r@
zN?^}v51u&HV{D~c@bBu?kMSX#qK}T=S@5zs7A*Fp6Ts)sRu~$o2U0DcLY<)r9=>e+
z>`Z2Af!)*7!{@MofPe{e*#tgiz_9}lXo2nv=Fou&Mc5_084xgfe=4sG6h78eKs)Js
z0VS7gM5cV3QzK8G0`po4W!XwgV<8Cbc`*w%jgZx|x!2~Id{+i9u5Tat&4m{7-j|@c
zYH;`je#kHV>#B{KBscB3@#^`GQek1+Q4UL%YUKTy``2@KJTCXbkhTwPSq8OU{_C;;
z-OQc9rqXa<XaavQwZk?tGQtGS05>JmNlK2#z;)KYnC>{@Y|`(sw`c?aM-ku>`N>Lk
z_{(!6Jb4CUY~Z4yKxiI9Xj#zWsp-993E>$&8ISe2(Qi1gC~b!)(%#1#pOC)<{z_IX
zg%3r>?S)vNZuN=T-aOq_-zU?N6FTCy(>E&}J|9*B^_y0HoC9nJ!zUOx%FU18k5cH9
zOX%ibi<UrFo`3uV$N~4d>3yffpC-XSQ+*k%pxQ~;Ke&9NsU_f-xcdKi2)zkjDYt}0
z`44dGudlbGyn@WTD1W>%?y6D|(XYS#zdm&Gfif(Ee7i9@EdQALk7b~qL3BXS^<&|w
z+I2q*0{n9+e>^{x2eV|UzpwU}Q9JKIY_Zt;gDq0Si2oBZ_~S)@PQU-e(t$8moK8|f
z(_dcs*ai|RL1qZwk~t79wHa<A_)P@<Cky*0#2$Pi!w96tDIRgff5onTydN$JgfNq@
zpDH2?U^Z6Q@8A5_(f;$8|MQG$Vg;|9STmXZ%Pc!NAR-F=v6tw3c7ikj#QKk@*<YVI
z9|7UbnG)A8|CjOQIU!AP>c@er44!C9_#3JH+{7Qd$>0oCX`oY>{;lrfx2bSO0vb9d
z^+Wekii!7G|7GC+EcqMF0CfKOe9MR0O$5J{hk^E8YMK<#ka^k<Su(vzgZ$gTzpow+
zQMw+N_|FP1|N6T!3B){PKNdcJ?Ah(#DkS_OoPR!0KL>jm8kFSww^^<;B!gr{xgQIk
z?&`I``?r?)2j%=Cr(#@?Erj;bF{b&;_zaB@SsDm@*L8|EY&@?2^HwsTUICLs$n1O!
z>0gE~)&lFsJN9GUnoD2xTK_WeZ|9wy2^le&n^g0E+siZZz}U)&{Xytw`fRev{xa~d
z75{jUVgUSzQ?T;gGWl(5q}(A&H~X>h9Fp5jtbdA@KRz+N3HDOxoO|To__5sw5^c0U
zMcZ|gqBH*@h`+K?CpIM7urI|Z{!O&qB?n~r{-<c`sjl1qpSKd=9AyDn-hXmm;xEH@
zK7vFW?8mw--{ANt{;T5EA4`VV2z3t966Y}b*<63w_xnr`hg(sr>F0oYbH)ZA3U2*n
z;6GL`4fv5LrQY_h-`!*al+N-)nW1&$&&2!}LL-?JGIs)2?g{*5mI9|Cc69x@aIWfh
zhu;b2Hxhy5!a7vrXMNf5yIJ&4Mg`AzZb5ed`5)}~%n|2j{h+^Y;?ED|$)Icp+^7A2
z8D2`^99TC`=MTlh8V*PQ7t%785>h;Bo(1T??B(Mp5Qo42sd%1fH{bYg6b~*Oa5xr$
z(qF&Z9S$h{$&DWi-{m#3_-}+p6EmcE3QSu5GRsa2h#iT39(cc<FwK?!S@E<d0%6%+
z6WlNLm+|E<LuASFQ}K+FaG?GR8e$NI6c6#W>Awxn84D>M>7R<{vP_@TUk3hN@!WwF
z&z<4M_aJri_cNC=hKv{U^dE}Hc<U@u_J3YCs6Yr7UJ|oH_{R$&qP+~Uc*{@G#&%ck
zf97yt$_hZDjoO70+<^Yz)pmbKv@!h@ZAzX+tbcy#_fI;9Aa)#bjb8lSgoZ?l030kl
z=%=|#boLF?Z`}3QU!PuqeDy~pSXf6#4qa;NKRaqJRG&z`FB?;<E!-R<_T>C+J5s#2
z^^dTRA9^trG6Zu4r?AvE7PFtfc%F$V=zLHR47)xkC7Iz7UrMq(Rmzvgp8_UZ_#Le}
zbgNCATyHHnRa92&UHFoDsmK2Hh|Ap2>)cDVD(PlTm%P2Pa2c?U!KART;a)!;lc({&
zrhlcT^mK6<$l(5*nR$VqM`W(YF}VFS#;rQ@&wu#G|3Z&a?qp7@sn2y9jW-=)BO@t4
z4Gk^0$HvC;)v!D^v_H&mqL>iwr?G%p1T!{^{u=eyOPXQdMyE&R7!vvZ<?sKRD;Bmh
zsgz#a>2qY#zh3a`3y(pU4Rh8|Khi#9=EyxUQnv6=rRc!G>&yI?jU2HOW42^k{jNpY
z;;`W1GIUbmE;PXlkunMq!=fpv{lz6EE=gfqLfkdH45xHk1-<#FpO~C$Q{h&OF^N=)
zd4BN8I46{bu7sqekN3ohZyV?kUtoCC(Ig_~)8KufStO_&K49R`SJk*stQZ$#GGX11
z&y&~E;s1aU?6(tcbni1eMjp&FpYRAqER-B$9YV!UfjOU(`YhX(KbMjWWFC7nwVYm-
z-P-n)U){>Pj59QG`AMt$N-V73PEZDBXIC5-7AEv*xF@g=bIqiuE~I=D#cR7g5iwmb
zLxprRg+VVqA6*xwSrRvVl-g5eA4OcGM`@sm_pVCr`q)+IuL)S|u}*#=f~#5qzTl*l
z36C|!E_B2DjA!1K{&`lgNok-lp5A>6vslO4en{4z>R{^BKu8ik?MZe4TBj7l1MK19
zgtYX^*1=(+<%l_s&nnzEV@F5CtPZPu3eq}aBj*6^g~6Sg=f&Dx9gv{CS^r#s>~mpn
zXT_-)6((>p2(VXF%bZHtF9b36N|s=^-jnHN2d;tOjnNgtKgbsg8xM$}ocJ_-Ty#0(
zEk(t+H!t-01q7ao@m}~w>dE)9FJIP9D@`9P2A#^|)pPFWKRhVjY2<u4omR`3o%3Ai
z?Jby8G8%tjuj!WU*FmxN`u<RU3{PI>B9d|*3_rl!8L&>>6gyCPtAGj{o?(d{DuQ7t
zp#s-0z6NL)e{#}~$H&4zaKFa~rx$lNX+dqU*5ln;?5&%97>v2@gOR1hvc7?j<M{Ql
zaWpe>?o3oQ(7%r{GvpnA9+wlLqB3G7XJ|N)xU4`16A~1RtLeWi=P;S!So&pzcYQ)K
zBzm=FvS3;lZO$)dIc$y|t!lIo%xi30MhaCYDEfU)8_6S{0|Yv$P)E#fY;D(+y_6*M
zAt#3K$jR)z_}aoN=l$})295#ExOUz>#~2)kdHI_v+`3@3QIW6c05_Kavb}Bv$l$(^
z8xA<pWH@$+pl|0uG$m?Lj?(9M=>ZYZQ^0pqc0|niihkv}o^|iqQ6jzOvL%<b6Vi%`
zUcPWZgcwTGf`daD;0KI3*x9uahK9tp1h({9$mofsKTun6ETJ>YdQjuI__%!PO+nvl
zi_&{p{U%Yw>yf=BF?dBz*36V-PoQmn2uBF=SW-#~=pSy>MLWCP+efT#C5W{h(S9_X
zv!Ae=78K<otMP*<nF%GA)C-eniY4P_y5$c(dF+j4s7Nfeg#>hR<_Y#6$A*QXg}AOo
z090louzbIiTjntAb%s8C$$_=9r(<q$%crD^KM)1p^lc%X4tmxi4(fwjTSEMf9UOa7
zR}~8S#T-Wzkm>EB>Lf92x&dK=c_W4Gw1p<={p*639sQxw&>GBR>duDWibgI|2`V*g
zROc1CFQ*^9Y_^an^`JA=(@|+vXGa67D!Gx|H7yt-SmKguAPm;iic4*o-BOwZ@0(T#
zviqIp0PnFtY{1gV1G+Wk2DV%;a%lH*_jNXP%sOYNt2%;osi=I!W{vwzbY+rJQPc4r
z%%514qG&^xr1rEW2)7oOppVyPym{%#mBeSFBYIygn<z{$r(JP6<DjBl+O_*A>pe2R
zpXUtV0A}poQ9)y_y@~vocw%CqxHd~c-LD_$iWbvKj-*bk$6l(?%On7Ej=-hX*LjOj
ziHJHU2bN?nlT6wadnNWH%962I{^Yl*{A(dn91!P30nVu;eZEjp;Ig?JP=>Cq9<E8O
z>McfN4nwy>OIV>b)M;Z!M5t_0y!3WpTV3^f!c>?b>FJ=je4kyc*JF0=O+cALy5&II
zHIfA(P44^I_yU(sKqI}E8S8(pGVNbWBNQ%9K6G762CXYv2ufNM8tJH{1^Zb*LhO`$
za^eiwc|09L7Km_^&tY$hV@?HuOt%*e@+5zmHgs{CItdtHIKZrD&R(sJqUy~^&#>9_
zR{KD70Q{TGx*JkAaCnTLPn`OEUUhXlN3<jxT%G-d%BLo`rDmMzmd>n}?f%qH`^&DC
z$W-b+d@xLMF3fGa_wBS232t+&x@Es{jZGWJr;l23s$jNpi+(+TT@T1IN}WTCPZ=s6
z=;U=1g2Pe7-W0){8X$vNoMe@A`K28p>HJ+lF+pUmYf6P$JbrUNI{+!dGCnsu%jaI?
z%1j#w2_qnJNx$eyn)><4VdFUr`qNK$kG&-sEjNBQv^IuF<~p%}F$?n)9v{FuMGVP<
zyU}%c!h~_M+s9==Wuo%8@z$nFzML1TMWzK)`B_dt<4!RsD?u{!p%&xhx24%(Zwg>e
zUBy9J@^*`y_zN>)0aCc}3Mg}GB?P<hiT$ty<bePT61N##s4{I489nwZgBmu$OK15{
z5AmGhiAq4?h=@SbS60Qg5$mTrTB5V9vpTC<lJ&TL3MD-)=nH4&{I)o<41Z@LLq(&!
zGdCc6NclX<g$hZKQ<MgJKC!HP(_=qG`HxLI582JEI7Gq~bq?=q@?0C=mqhxzKiF=~
zg=o{GN{M9k+ke#^!_HFMj$2(_4PjMOY&VYZwN+Fgs;YIJ+BI7*Sk4okh@feXO+cIR
z>q?rdrAd4v45{Q@+*>skb>eGnGEI-SFvhlrY$kEOMREK#xyPe>%Le%R@W9zI$R|fa
zRQU!y2?N{Zm4$2WoPELf0`}mYFE(7?-}J9p(?Pt1@}tq#qj9#p6TutD5pANOsaa<J
zO@!AmLJVZw_*&2bYtZzrl2X)c+;AmteOKpp9*vOjf#pP2vu0den`2m#C0gelV!|{+
zpAu;2WZXneQ6mZaH!l35)i(M4+o1{55l177;-u4p9m1r?A)8|b*1cBcSKt>6w56An
zB|KxQAnjB=%tGNsbNRpc9ilbJI0E!|g4*gnYO$f=)xC0a%dxpH^Yen2hqX~6-v~^q
zjtKkeTjsP{PaeItdOTZ2O-&?2N2+(aPP9N$jgx!btBH|*L*jv#4mzTAJc&3E#o6B)
z+pTPBYZNBNGk5N=DQYLytPlfQ9be$|H&GDJrW_0?l6r=lozMqN1kRuwY^a!wElbOg
z&xuW){)1Wmsqf${;Bp(-W6gZhqIZ)d`t#>dF@hi|1s@HOZ>(h<<t0wVDD2o{@8}pS
z>Rz<bDS9-7^lwj!vY<ukR2#+ZOxr9C%+pE{K7yzY51UO}Trbf{pGjp+OlQ<g!aks~
zvX3vXMS$WPs|sFC#y|={(AG@<JlH4{AxeV=$>(?ajFg@xi^#3NnDTne5YvSC(WvT)
zUA}A?$*EgS8b;I}CpKv3Q20_0i{L~Dd1vjE0imV2`Ne604wRHCen?mtXu#_&R&Rx#
zbpy7$mTKiVfvzBrVc3C#b^6AK8qY{bd)c%Eejo4}Y-sh1kLccOl$T&syhtxc^wh`$
zwrN3>@i;_&Qtj}JREWFUwbZBxAi9-Gj%<qc`YcNa_LYn_{V#@l{u3|Vfb`FD6n(_R
zL~)z*!Zo`kJxe;3_?5j@RS1}<g4B^is}V!W;KL`ZqXPKZ`IUXQb{z^5E>|{hY?YN3
zjR`u2#2!_eiKuKY3Lyn&4!0NDc)yD~>!`YPF0BWNI%u2b4U*+SOXA_8Pomy2y&}CV
zRFEP825Sjlo_=;q<@M_@@Ozyo_#N}=7%|F{`cw<fAA+fK40pd?oJja}ox^6V2fvU|
zVmZ^U@pf!tVlFghnVi&-@qt5Q<4)}dVOqA=p~0=fk{_j$hj4)~y?M0z<|gmivx~-u
zRW)q|?5Gb1PMzXgLrn$KeFv^>wY4z`AGOWs7a$?_IJC~*F)T*mFn<+Qb+*)8cvK`!
zc<_SiPMEWzYQD-hg18Ioeh>KU-1F&k<PZg_GAgqhDpFg+`_iPJi2svvzsoVATXoz`
zpYp%1y%yeN6&DmVI)41xWerV>n*61V#_9p9Pm0rVk(Apy+&YdcnaXc)Hy)@ebsKI9
z)|?vUPE#a^dMY_{g~1YAMdg$6PEZfZLU_=w#>~ngonDt;#4t?4#ImkQ;a0q%F85Mc
z=&^}!vKR}6g;K@&G~M?g?_`7a?rgcS&I1*O+}IOs$k*4C3L&Za>{c=*MCYlc{Gt%k
zWt>B4P$55#d)EnZKAnV2(0_?FxTzkthjgM}V^rhAO;)XC?7=5pyhRR+yKT=qfrU-U
z6&)vf4(pgY?8|6o-^<S|wTL)X<+xUEA<qtPsd890s2_9lriGjR_E33|qI$Ym<=c_N
zm9m}bJfWq+J#NjCn4<6)RW91e@8*dS!%9CrNpy2k+`CD)kNVZddA(?pu&lGdPFti*
zc7x`YN^b2A896RA5jYT=nuFi7uLqN055lkGkp)e|f2Sep0IADM*&0jJD*B1fUh1#X
zDC$*u=)EH(CN{C&-g1cRFLL2)23G=tV@IQze!awsaWwSt0wj{cmU6=8Cl&adKU)}X
zIT;1_@9AoU!Ym^i(5w{oEpYi5uX*<!BjM0!-BI4BnVYWL3w+lW2cJW`0nKxX+`5|E
z(VfGt*0%tflhh`D*+^8SmF}h{{3JvyWlG7ncOUjd09&{C0lUTOh#l*L%BLk(o2eys
zi(<4~sjP7e;|Dh{oOw2(g?A^cs)hXbm6>~EVGq_1wn#Si=6?+Z9e=CSMnghFO|SqQ
zPQQr<n@F+lNcf`u4##qm(CI_7dcv^hC)(rCmVExpU19Ig;!Z7sM%bSdo?W^$(7x~N
zej)0Pn?w4MMd#2_H{g*^4!v(nFBQ-0uL@4wgjN)Kbxf_2W=FJU_}ysn)k@JtoazoN
zJ)Mc0Dta*JBvSCpBmiq)s4x>H1yl9n$JL@oe#B07xr2)~BW0zB-tjMeB!xq!{3h|P
z_S<pc*gA))8+#h7Euos8Tv|N6z(F81Mj`!N``p+OO;7D7`q4}Jbe@@2AL?s8w~dSD
z9W2j0$&u*Ft7&b^&nbZ2ym^z_xiO&vjZrJI{;YL5yW(hdy*F+~-HI03ad5QT<`7qU
zcbJRtyScTGFMjax*-m%(E<c+^Nq$fKHgDx-EpwQ2C^Hf23^c_X3}d^1)zf^MrtU)1
z4ueBPc9I->uvq>n30UmE*(4c-pP{D&H%0im&IR{5n47;RBn)$THD{APX2h-*H=8-z
z_B_8oZM|9@*N6!in(uM<J(I{HKU93auwF7R6twx?XdH<)<)a_T5?mkPAjQn3YZ*P|
z#tmX*nCK~-%HmHKDiw%p7m7&|&2<>VG1-oL^CUCmOjMFUZ`+d9ds^~u>pHfLpG}_#
z>fYN<yrr$y=A1T3vNtIOm$W6_s|ZNgGMqlv3)wW~8jqJDQBbB-w^?wG^AXJA6Vr8x
ze;o~EDxi)7@A75oWc^hml&m{`Z)M$9qY*o&SLo?0mxBU?F=5J_WGhGRHxP&Cl5{T{
zbyPaP<f+oy9Iy!EJ*w2rGBY!4fg$a;H8xvSg?6qaD`Qt!FD00iWNBKU^E)}-M;=z|
z-ZM!v5jt!?-0gN&E7L)bzk^H|aBq;RyA|5z`T-HqQeK|fzrU-n)%^5d=fg4vnLKF?
zO;dJ1&c_*?&l8M|+Jp2`^svS0@kwUnz?{OpLqRLgvQuKQ3rsc3kt!GN{nd8sVHryr
zM<Vw9$op#U<Dn(|>o6z0lgUAfO%hZ7B7H2M$*}UFQN>x|BwqRf+qcAMk0&`^*O70!
z@ZVA0K8<VlS&Mz*j;F`UEDhd0gV6`K;?j-BA=BAQiip&@T+-2*Hv7f7rf-y_$~N}U
zbE(i$^?}GYYE-_8OZ`H!_YzZn&Wn@eDt}tTxunWniG8WS-Qv*vwtcvNwX+0y-1YTU
zsY9*<deXl4Ge=9&LP}iR%k0x62fb$iYrrhBKCL~|IDbrAq<39w?t?bv{R`aRWGDQc
zV%^l?(3B02@Vz_VxY3IYnqR-rl>hgORyn@F70+CI8NIkY7Y5+C`;E}Cu<^g$W{?Os
zhkRMRIO`U;HY+wLXzin_SLrtVtbB6o9KW~@-IGPGyl6iE#Q_TqP0~KK%-IWQDRBI`
zpjV74+1GEB_L%Y*5DQOOzKaEUCUBrlMuShC$i7eHHg;%d67no*pWI*))gO`r3wI4N
z4zK6xuafpL<+rbsG2Qcp`5Z}1J-91_j);gb-mH67J{4%Z-lxE6>~`_&i^ZxXv-Lbp
zrP$IcbMG>AYHH)V^z!n40YO1$`pgO+8@P3#7gv0iBFy4B?)QtrD_Ja*r3OpO_uJA_
zSeba9O+T6?@w*R7>X{Vt#*D@_Ty)nK+wp(PwQtNLj-O$w^b|>j%Hie0FI=;@@w7)2
zXqfcF&^a#j#bSzr9M}U@hP;`{V7Z3Ei^<P{Cto?MhQLBqD+?qNt#f+Y!OsgrNBHo6
z{|NW7#fh?<l-!3e*y>q#w>GjC+__Rh5Qg!kyj(yxpJD$tPZ9gDRteu9Z0Pb`JoIjL
z_uUVzYRFo7wR)z)o?&xU1iQ_}nx2h0lh(Lp24ypBuI(AFlZ6+DZ#{#&waJnAWkX4o
z;>4JTafV`$D7iuYjn2?FO39}nlQhHV=lNpRo(C=dDSIxGuLLg(aMUb$U68;YyeLf8
zcy-JOOzJlN{OIe$gt-Dq?V6Q+gL@PoL1D;n)=&=?-6PSR$g7uN&*H#AB1O3_^L#F3
zP;mbIoe{0RO)=cNyyfY4U(_?N)`Rj^^aaVEoRLhrYn#K2Jvh{h^WBsAZ*3*dkbFga
zN8_!>lSG2;Ns5gHy*R8Vrm(vKUWcJKY{<4eCm*PW_t1K}gtks+>0!82WVPZ#sYc7?
zrA~MB2;rh{VAFr2l8;PY|FE>K<7y@LmRV?$DUE+)eTEx9r(wEB{--hKC6$N^9bRyr
z!DU>u^COlsxEE!lj&7xj;LqFKDN`=Gt3|_x?h$GEM9)=B`0;9TJS3c2rG8zs891^3
zA?+W_)J-{uwxU^AS?In^F6E~%3Pnru{&6V4&3Rp_(fO&?+i~W6?PxaXr_#x5klA_z
zlfQddX27Ykn!Wo}=}uW6p9l%|6jSoanOI5C&>QugrOlvN0_F9!?>;>iY_1PTEi`8!
z+v>N0;H;gngK`Wh%Ch+2yW8*II+j5R+a^Uk5Hvom6Z)VKa9@>a>}ZgJyuMk#XuM`S
z*!b=2l*qpOSCJ*!aRy~eNZ2?q{O<{yvD3q52sd0b@Wfa7$g3HFOngl%et2(W9M4X=
zEI498$^XqG9v27REx{&MX|+Vf>wK`up+>Z_On^D$VLA=_QeQqWeg`O#|6S@%(E!v9
zvmos|r^O`$F^zR1BoSZyZ%V`rHAo_IVh@UQ(?5mefOQx&hW`JJ@o!a&0@~yM_Ugaa
zwEwqP|3BZWRCzror#=pysy-;M-#9{1=)#2=C~r7hqvT>lGl&)&q6f^g+6s<;<WN~}
z@CR`>NQ|QD)Ielb4+jNWP{jDtd-PRJaX#SH*4Ad#Z*i=;UexxKaQZ&%l?<>1Z!okp
z;bWU^b?t<mY`Yq7>Jnld@720a9c5`-b&vN0nG<N6)m~vg-v)Jbij9j?Fn9<uwPRXZ
zT5i&TlIip9+4qY0nyKZBZnl%tV{c0R)blQ72APl}<KNmY`37WXH+~nE7q!EPG#9u%
zR!^?$9&PHz>?S>Ye_<M6=GtgaQ=6Kb6U46pwB;waY5pYqhE#2123ukVWm!lCp8Ku>
zd8U2HZ}C8|e18J~-kt_q#J}vm>>4Z=@xdv=Ax4&_H4rZU1b7op=|5Ff#eX$?ZHAwV
zha}THLd6MOVVrd)3M~b@8;DHizJ4up9vmDomN~_~M3Lv@yVI(BXn-E|*h@ih+$(IT
z`b_iy7SHY+Y^|<6U}RqN6`pbWm!;RLs&M)Dg#tGkl%;s#yXsN<e1`-11ngVFy#fQ-
zG~g^Hww-)(%{XiV8^WRP3@>{`?YvG;XJdHO?snTi>Ttwi$mZHQXwrfE@ab98nGZ?y
z0j=8%y`hT_pT*=^9@;q$+4z^*21@2euYfim>TPE6D(R3(l;sbdd{kUrclWdMjgJaA
z00gm!HU|9?h#GuJmTHeYnCb2FJT|l1HAi>VF5hhT1kI${Fq#j}zIy;r<NVwI4{2{1
zR^_^V4{rgbL`pzFx}>E+QYEDnl<pL1kj|wb-O{C7x^n@N(v8yHA>9p&|NY?J`<(Nh
z-<RWi`OQn$de(E#d*+y9Oxi0_7KFdoT96m$WN8-h8m~NxNZbb6Bc-Cm`e=(#?VuA!
zBJx73e&FZAJLdiHv>+}kPiX%s0r?I;<?6@4maF~LtAk++ApB7s+4<3BYe-dhv!^M=
z6AUlF**fnlWM^KmInSI=6P+JLMPe*1{`pr8@~7TNhYU~+sW}Dw0~A>yHRT2XCXWFg
z+-Otw?3RPI*ZD*bSYH0*mwl?L?GSz1cXiPx<_Qt*pN@~z5rS7V3rsQ>Qkg^UXaY@*
zuG@E2W*=*vLksmL0B3%4`DNW=3F!`?@LLVRY^l+f?S=Rig7cc5iEvU(0u`*<-6eTz
z*Qf}^>;<*cH#2bpe81|(iMSE|a%dv_p9Y=wM9j)28#F@)1_q{kNOzZL_)t-AN!6yY
z1w;=XDS2qW{^7n>9I8<vc_5KRi&^981jJVok84(h5m{m<?=aaOQe6I&;<7FI(h5Yo
zx!TNbE^eD|O;(uz(G?iW(&1E<)jJf09kN9{q3ADiy1Oo@$K&SgG<?Of4*jA_uKBa<
zUZ=AAz<l_W22-ytOb3RC2?H4ZbiA%pSlV-@2%XyYii<f0#>R*_q^;5dU(<Eef=w8{
zeyQxJ;uWwZG14@6;YaTJfSNv9+v5EEJcx~E#929%Gl++`zyo6Q+usfIsu^WLUI_^e
zB{Ay)G(jlyKnDD^{YG)yt$F?|kH0FA@|iu~A<BZ8i2EciS~kYyk%N(YZ*~ENE9Fjk
zFxa0g;NINagq>)ia!TRCen7iow@^`Q7pea|0~{&I>x13Ld{b|uj(0*&&Kk1NQXtW|
z{m<AQS(J0zKqt$pZZEnpj=7+cI?79FHZ4kl(=^HULj<a_?GVkc&cl#-@meg)I%&V?
zNirG<Sdp2|GpG0P@PP4TgEzCX3>IgOO{1Ri*YwiIKNC>W;b5bHS&kbM8fK>8kBE2y
z(y)+VVY5nuk=jKO@8DPUmz&neq*(3mQ|*K=f%Z&c1&0_LDIhG8uy3dGa~{!zmr32X
z^*L4{i1le1+sHrOzV3IZJk?|78@2gAYK*}fH{9NvONt)d`X21QF|f>aM4-WS^kKHU
zy}iBr`}gm`1Xn#ZJM$RZ%BVx3FCVXGc+%d$<&oC|zl4y^W!8`=(3GB@9&i1yi30I3
zd>X?7e<0?p#Z>fsOibNz<x^zI?UBR8nF|xz`m(OzyWvvJDQ;WDSx%!{?qTUOoy#%o
zx*~?w!EG^gm-h?m&|Zrc)XA2gAF~&x?0RXHU}-*M(7PE^eAz7}vKNsTKao6-v;ua{
zh7Z!+&8&-1J4*y5qa(E`*;h*!S`*8<ScYdSkBX5d3`&ENj)7Q^K;zRmX`uoH+R3>c
zdiCPl3*{NQ36h?eN>8aXUr7ogtvJ7C?I6d@+EGuf@r^LA3&Tmq2!3_J(}7e3w>^-o
z>21Gw(R=8%vHqQAg;qk#u7eI{e|h?P6r(Lt0lQh(zK2I(zh7u5c6XxAm@XU}HJa|z
zW#w5ktFW8do2auf<$cR^H0i4^UQM1?;FYMW;5V+*sq7^1cogf7qu!)GV$~?i8r?7f
zL99;N(-Cz-%+oBExV@&~{q@g4vJX(y+4vfp7c^e+M1udUkfKV2kX`4#?oL;+Yz#|$
zF}Al+4?|Msl)SKcin}^7(s)>|ZoCq+X5g^=mUV|UPt^?F`Zv2P*{%1h!W^|y^qv|8
zGMptuqIdp}4hjjwbyv>4I=tZyoM##yS05oZc?Z6izhSgHb9FgGihuTGPMfW>{C)mi
z0U@D{O*~t`RGctUcT~PCidYbR<|?68Kz6h1MFzI^^tWf5dd$^=+JH^1*s-J6z;{cM
zAQ3mB7w3C2;~-_MBdwE5+tVdqU7;JRit~;|(f5t{YLcC%1$g(N|L8kGS{Og_q$^h!
zu)j2jCmM!eNi1_sr)itC`_y1Bj5FkuSs0I;j?`{B6vNeE`2w3|0|xapCBOU&=z~}V
z5t+JZ)qfG-*{cjcnv{x<SxW_ky&z(r%31K9Zn3co9$zl=)d%!ErOs~{cGGq=co$pW
zZX$c4<x>8&#z45kccolrb$&h!=ptF8PE~IEGmGAcJ-3gwWcKQ+)O<2|C)*(ZKv?CW
z_1CXo4MGYB@4%H#48w#?3TpPAS(C|4GtsR-nG=x6i{OYj1-%Q$cn*_AGJ+8ivrRqC
z?ys=~gb7V|1X<QAmkKAr*4X_qD)qWpvVIUhrM&uU8cUvD0QMQh?R*`VWU)U>a9;Z$
zwAR%^$UwOmvs6N-{9he9u_dU2c{cnINz+gZ&*&8*C#xPW3I$#gcMixjiFcdW+-XXZ
zkS1)#(#id-6-LQ!;#(8OYN#--bTKO*zRE<nFB0TIY89fLZaqn8-x{r^Yh0GUKgGt9
zG7W{Ckg10Q6Vk-(oUc$Kr_!E|m^6MIv)9O;BF0NKbOZIio>k@ChtY0k#-b3OPd@D$
z#MWtnwwqBO8iuzV4X2Ob74d>wl{7K5NE2!-JQS;-DZ9t7wvVN&cXR%XtmmEWW0}f@
ztBLwc&3W^D<GM=M!#4xt;|W8v+$iupy-q+nM98=T=;V1>Sy`9ogV;mek3o<~1hhe%
zc<fKM(p1B|=J8V>0&c9_WADuFdPs}XzJ);5nOdkrS_jL@>7Dq=-On0TXxC?$tA$ym
zs+8odoPW{ESEs*mXWsSR4tR8|yIS*)>yRe!f@C%iDvxBI>S=C#9RcxO)BgKo)SGLj
zPM>)wE@n|friP}pz=}9*+i~2CVIRCE36vk4BHBP@Eu!p5o>h{3?d~y9@9L3uaU{~+
zRzpNAR65kjAt4b^{oQquU}MC%?#%p0B09(bjkq@fNQ)3=S*yJ%gQS_A>EV%i+NoNH
zmu;7iX0aq`t*EG|huZiIEoG5@1CVmbX=-ZvXlLU>+C5{A6PCzh7kjbw2adyN;>-N^
z?%(Gwbm=h<p0rW0L$io#AGE3g?K&)+Q6}^YJN$O~w8)ap_4FPfo<_>?MFj;ubkEvI
zm5$K~WF;9@RRWC#;r`bz;vBg5@9rCh6tdhmf$U~N0s;wUDbJ_d5*)Vfbm7azc4D?j
z!PX`u?)V)fSeu-Z8&xYQ)0OsscHMYh{9gK#&vHf&c0kOYOaf|dpGQOdz_mCBAy#;&
z=(E2YkO_$h_EuTD%HXSIeApI1YQA9}Ry(zCJo2m_pVTN;yMt!K$Z0N0;ZeuML8d4V
zwbq2bA6cUee*xu<*cBeO36*d3b_H4dH!?{WJp%mcCB%pw%PEVZ`SNA1D)hb~ZR;av
zHvwv_Zqn(U4`L3B-@JhWvoMZoC(I+dreb0XFk#7dv<mVScswH*jVakG2Yd)__Am2C
zMb0-2#q)C4-S__Zyzy|u$<|Q+<P1oXYIg&7W%jkY`ZCjXF1O%or~6)1D)(NvUtZgM
zj^f|d#+t6R+J9zd&=?>~9V|OUV*rd2Xw4+le!{=qM_&}JEdIR;$fKh6_R<%5fa->(
z&`o5{2frHx&t)-k#Ct&7GBF9bmEs?a(apEhgdK!Jv|TiX8p;gS40N?AFZ-oMB4<MQ
zre6;i>TV~~^GQoo9{RGof2&!0Rfw^1o3!G+C6#et!|F&qq8w7wi)gt5;-8|*1si%)
zeC&%ER&k$)GoOpH!ZrgKQeM~XCvO`C#wOlGOmQw^qQHrT9Pq#U+UMgy9Y$R%q$;16
zc3)ncDUNycZkM220PXoV+XOj?10wCW5fO=TwhC54kdCg&>(>wV4}tF9X|TVfl}Tr>
z^IE9D^1b~6r&?KT8c&i1c`D-q?dsv&LVwrA52qkKN-Q=D6F%B$6>!0Foa`BwYxEJ*
zI{(O21lYh#dq8E0|A0eixH%vNiNOXy@Nh<ljY?ll{;c$Dvli!Acrv~p{^aa+v2cj(
zw-%RnY|kBJ#f>kU`|0c+9r*W7TSQaO1~ZZDG366`Vg=@bi6+WK%IXPnaLm<qPF=-d
z6CZ~GKP5+wcXHb2Wd(E&{pFI-Ru+>&Lqp}XCVPF9>VgaR2*WKDmg6EB3cmi;PIl1D
z|C-*0&VNZrcW9^&OFQ5I#cicij!-yTbxcl_=OPf}f|E;LcmV=#$z_VQM}mSO7t1js
z5-25ml<#Ib##K&km|yBl-=*>x11h|R7uZ7W+nXRjbk{79ZSRoh3?Iz<-GuwbFdkja
z6V*S&7CHIE=QQAVx7kzu9FL9DkEyk#TrnHuJs?Z`76OH2*qe6iV8FM;fph#L%yY2)
zEbEcW`;Xl(h7OO9-LPlYi%<FydqvWbq-11=t+_kPf5@x`u(QJ?fA*D!4&jV;V(~$k
z*8gx$z;qqN8ZbCa4h)IdOcxDX-f}rsL=n3^wP_W}7B!S0;X1n2)s4wsup{E|d{dgB
z%xX;v59h@I$`N27BCft4e>$4%$EhD6x|a2Y`mj{6|7O1hU@3~{-s79=Q*3lR_U%5N
z^S)pmYdL8UaD+XI+MuC0m7W!3j_Gk<!ET?)sjb45CWSXmZ}_`g--IJ9YHUP|1E*qj
zTvvk!g|!q;)YhCf%SR+T8R;9hC<z$*w)8Zgs~lxKqs6Y4Rijl{^Ur06GNf&#O~hqa
zuIU9utVL5yKl&)CFHEF$>kf~hZsC3Z(!$>0yGFXn#L|Y=1}6QZq#dyBwC(b0gi#$f
zY91v|<n%O7A1!7W?h#LM{PqQmyDibZvy89KG!KV|Q{_V&i2xkiv0Lb3r^(ZPAH#1#
zYOjRveE$(2V}yqqeZzzZ|H38t&IIdW;}FFSFI_hM*rZUewQ3{HFJpLHPW|_Y`cwQC
z2c%@H(*@Wn`LWUah^)V^X2e6}vftZe&pR|^sCom(kX+EVEqX=X5=*l$1Wa`Z+XYS)
zKaA`ZaVM5GZ844D2HAHXk{Q2EqW94P`0)Jkv^rThPYLT0Y`$Tpb}B^BhQ*^3q$`Av
z@9Go+9y7TFu0A2I$TmQ$9eyfuzi56!%ym_8vk6(Jq_Uix`4g7u9GR@B6QB}9-P^lr
zjj?gQ9mTJXxmWGpb(gJ#_Z}O~)=Bu&JMn;}Kcqgcrg82lq9(tAx6pn8FS=xl&i<~~
z6o^a}mDDCyRZB5qj|AER-*B0wTV9?@tL;V3U{#J&LV0t!zJtEXo2f-a%tcJhxpoOT
z%W?f;Me;O$)VhkOZ*+JP37`rit@}UX=G`0G+&H>K_&B2lS=qeJqmw9&d~$$ibFUq#
zXo{6R`~@#8pY}F;O_x0KsbHYJV{D+b3m{N4pf?lYi>KRV%uK@TV5kWvbJEIdfXD5X
zOug=S$uC8@bxRsh!m87j3%<LlMh5g~xf~fH#gdAi=p}yPc(Y@!&96F>&Q!_LZWo}O
zKaNMJBtwBuZf%qoPWs3*R$h;}zGv~i*9;qVFD+5s3nqh?^_Vk03V5T016M&IwhQti
z#+~wNUS#&ZOONmBEBgnTrvmH-BxBaRoGu&NJ4%+1v<rZ)X6fTH>vmoR3#n)2Ps<T3
zA?r@h$cTKD686L0&t5Zf_1IFSRw;5U5eQ;K?BU3l@ZiUsDqTWULgWEI;W(;U4Jzc#
zyRpRNZI{M=Z3@)`mdopa9p>g<gpjf4%PcYeC@NSE&Ua6(%ba@=&$GtUJfCp>$t*|7
zGAjgV&rFP1n`a9B`MEcMn@<HAr46T%BcN1Tupx|J*f~o)c)vD3>^hGErydW+M?GJU
zxXUJ~$80c`b`d$h*;}lUUvp`5E<N3XVIix1jBypSQxR4F1Q{6_m)9{<(<?IG2}GI*
zZoA|$zD$&U+gbV>n{7i*1D*YO{a>kySVL$`uP2KC(c&OU0KGG;o<dC4HNFFh7k<&$
z>^r(3AL9c2w{P`sI0LVOIVcp{;0Od}Vf)7VlXaXt;eO<!s_$?0f9UF5p|^KNrMsf8
z_Yh90c<LkCOA(4Mw4`h@*@In$&R$J5HqzL##T{4nppa#6ccGJ2T<^TR(1W!>(~59R
zHN#b~{G>|y9?VjNRY}vVj6xOESYYN~)ts$j8Gx_EstIQ)!8}o|KN}JwC`GrRn*&rC
z_g4puGNbv4JS)W<lfbR<d1)5LclwdBdhf%zX?Bo*fW$o<ghFUx)iR0Kkllxc@k}+?
zX3nczYQtG#)1<kvop0El5B1oQCX(cpqtLas`W!Bl>*;Td1pKhQR3KS+a%~Ae%i3;^
zEK?EbIO~6!5!q=#=2F#jCK?4f6XU+N2<*vC_*^n|sqo9FO;{*kxB$!#3mG-&H&r!J
ze*K6c`a|uK{0K{QO#Y?gw@G40p#O%Y*9lS+AN|Mm8!V(N;?Ic@Q*73Y&xtCA@fnJQ
z*YirLPo?YjW<PghHCm(Z#;ON5sBA=4D4p&{6#2VL_>&aWX8?whm9jT3r@$w;2ZH44
z>lWR5qz3jbd(~oO^CKTG=5~4{Pa=3r>NbPuX-9k!<%k#C+!{V)j%%79>uzfBp}<#5
z>7@R<=4rwa)2sfR?eJOR@<Y`hBx!%@!}4oLly$C_bq}I<uz-3y6$tLkjomx){sW4l
z!uEBdI6A?1*tJ&dqXevu?~Ktsab!?B28!lw7!lynp4CAe8DWKz^?;4;6(^8T%WW{9
zMmp{trY5r9cN(D6g;{D<udNRnzYv{VMzbg_7q|4x1b&Ncs1Z~{vPo}-V)&_|4@^s%
zlq<J)w+&Ljw+rU^^<mEp-ZkO8<ul-`dxMlb3>3WbZZ#d5a>RU#t>wYFcJGHp;WATc
zb#q_orbc5AY}pDtz~g+7kf+vp{$n3k>OO7}0r+b3LC+*GMF;U>L}YV3|FKqmRBL7U
zvJh>m$fHfj2ZWWmrY}?JNBjVJ&--o(C!mOW>+J2^t9GqSz>uysdl=v6PH!m7zth6*
z$pPRbuZS2LV+0-+z<>2!hI8eiNJKM%M`-gbl}@4g3^CKcS3PmX>%TKT+y}TE|7hI?
z#UN~-uJGHpZ(<|@Cmo8Oc+w2-)Vu_2&4u-0mR??7l-T8(<c|(k=&0xTKU)?fX~w6@
zs7J04sA_T0RR26n&O6R#T}uU4fuI#=x;6^j(Tw6P0uu&OT-quir%Chtc*mLAlHU5>
z3pU$2i`$gg(jThmqh;KepvUxFdRCw%0~tlMp@PhRHMC$~X}lX8pGK`c2|9Ba`HrRY
zxv1etO7tv3inb;wzvi7Xkz3Qdtj&rUktZDP$S+ZN^^buxvN&P9G2g5DE{7-q1#Y?{
z+JL7`L1XEl+H$a=PLsEz?!|~@5VVh;pSSwDNK+J@$O`p*k&oIHs@Fgz6>xS`4%|Tc
z_}9M!0YjQA=%d%vX`ESj>7IfFj9a;92g~}(DdB-TGWS+=+DfXI=cnLG4#wE<ocjy%
z1)SxfCCD$;)N*G6DC*1-H_OKm``q_OL|V`+fd1O@AEsuixQ}z60${<~gj1F1$gbk$
znH744Inl^=8V_3<4|d0pRIH&^JJ0bCmHcKQ@nu%Tu6m=Q(5_Fy!~KoYKFPXzFpuDz
zS;4r=R1~fH=6ti`DEz~Q|F+`#j0+#j?U=VgMC_q)=b)5zG2lE+jy!Og^ChBQ!F};}
zQ)!=B!cs}JzEt{^6_WmqOf=ILnfm2zcG?Z1AAvZ-SG8Ay0=k}==k>8Wpv}#odsEAK
zWP9f+(zRLS`|~v!dz>^;-1+zg6;N|o(?WL9q3o0Ul|IWjtKRi+O<LWz?i=Hzh*BT$
zQ)c;YzQkSk89D;^hf_tYLSD26?pR}736R7HBnJ!gJ6)TrU`)Dcz%Ulf(p9bl{lEHI
z-)%r?VD;Kg`}K?ZIX0h1g*Iw>=lRwiUAeZCSOY<9U)#^OI++V^vru+nwH2L%u?n6v
z4Q8ty{`hts;;<04zkPk9k!?iY1Q%u9pzMtL4+Xmf$;--?Z7pN^rTpCzXEr|6M!w^8
zxvGvAfkD-)kzox-pf7R9CNfb5K?<z{m_?5ZsGi#bp9-}~{&EgOpzPdyCFQvOLqz=&
znt+{e8B(09%~tcnHi4(dm8RiiZ&GmN8L4Rz1=7JyGSqy+O@gB_hBfFjud!l@Ir@pH
z>Xnzu;U!J(CpR#%4XLWpTFVtbBTan%Or_|(xWXccc1DJzDH?KyRXv%yev;{V34eFa
z6SVHsPeRn6;J3K;rHg~Dk{cTx^Tool`<|E-+*5QSS}m)Aw??yQV=ZOTNMXG~)-mnn
zaqYGT`%ZFN5I*;m^Fm0(TZ9lDi@k}K!}Tq6$n$4^1q?!jpg5Wyhhg?5>HOK3hzQ(m
z^VRbUuXEsuX)%IWKrzMNGrsTV=Z6gRG$G<0O8H3*MKwKA1S{*Q&rIj%_-RnmMsUjF
zj=rh$)Frnd!p-YmX%xI9fBXG0B2A#lc2gNVT8IO?nUj~B><M6tQY_OYpWVrfo$^^o
z@+WGl&OPtj_k-HveR2v4t;SEae9<8{;Tu#aZ40>xf^YIv|LrEuXdyRI4Y`TKvGEYi
z+@b~*oz09bS=}=wz0YcnTj8ox0dZ~hC!|iLuL$2a33^=Y_=yhY3F}(DJ=;I6zdEmP
zIJOI4r?(%K>|mcLC_(JeCVgm75trEeS`U~+nW(>G#1hp##>=(|^{-51t3rW;5t93&
ziQnkD6Pm>(_ZnZ`b>tZQH{*atC54an+?ZJsevp>TB{wXfz-<d}c!0c{D{J2IrN-B{
zX3K6^i+D=WhBY0pGR8CNYEll9?0e%Qv@aU@iklXC5_rrH%91>_&cQt&8i~#&D=96)
zz#sH3dO$g`_1^W4=OzS^g#5?&7fn&ZwnIU)5KOb4r*?-wmhKVR^>{R@iV3Vx>HqkS
z&X9z|CPGaZm`Eh4;3`0^@IB_E%KX6iH(o1LY21MiWJnVaaVtV0&qudD_*d=_fNv8T
z7Um|sDF1A3W|-RUE|I6Qcv8a=kWEI<vy{>Cgf0Fl5rj0;b%N)4kIgEdp~mxW3YYP^
zeHR^Q*1YIAAv*R>?L}@TvhuC0JYodE$mOrG_2hVL4yc-<sAJAz%awEMtXdh}i8ezF
zP{}Y<@xTMK%nG2aOl3p=`<OpaLC37T4vrbi{sy<SL=%!`{b+i9y=ci#W<kUxkdT2T
zBFhAw>Fa;opv+PrtZ%|>r+$Y~t;H7~Ca@eQEh1BxA63(297A0ctu5`NTHtHz6%R>>
zR|eiBYnyu8L05!TANYI&H=^vy9=J@&(ROnzx{wW|54qUCip_kje<g<<@-H1q-bd9J
ze%#Ro?9TCp?n}(D6Mk6!B5vKT$FRDo*)Z3f_Q+-Rs4?D{7#r0qf!0JV;~bBYr#f1v
z`X-2lN{(0inCIY9_&2DGck04@jF0KB_-W>LtnXCW=9!5L1%s~z=)gyaY+Z_G^HM^P
zA0{k3A=wYt@_4INuf@I}Ug@WtW*tjrewkY7@*T9q_P##A1j)wC9X!w4ul3(|*kGKQ
zFBzU>@5Iqn<N76cyDX9Hcr~sRzqgFjSb~nb-i~gCO$OZkW8$<d6d35a1xu_gVi6(g
zZC&)V$PLgiWq{p+$=dBC=2L(XP%C9u!#DYx3m~*+>VZ}4KxKJKQ3J0K8;Hc7@tlpY
zvYT+F)E&*o7od0qeN;LNrQwBt3_$3?&q77GLk*N1gsYIxx3^*4zTK^5^X+DYKvuoh
z)%Kt6d$jUrP#!CKiI<c51qus?6G)i<-NE3I{R6i7A!ERo@X#Fom_sN=Ol@PHXtWbu
ze=dE}2o3XdBnljgP<o%$2?Hg{n77(Q5w^3{K*($~2>U8ZR?iIt_FH=qoFxKR2IW3M
z1f!kuD?3|Mh#H9vf{KPzOMQ{VsWa_K`B)322~cE7oSbZSGqCXeuswV%21SFM=&pAx
zvHU|hte}IYR0s*1eAktsV4_y^5{;%UiYCjrSY4FN{JO(Wg&o*jwS#4jYkI29Pr=BZ
zxIaNNSGh~C8Xs9dsdi@@ZM#p?>dddr?zAovX`(2+$6B{e-=&<TKm-lIK_S=gfm7I{
z@zG67+K@alH;k>VGTeNNCSN<irF|(@m;9dU{$>}QwzEk5TVFz^B4IEFN9IMpq9q~}
zJ-2iPwB*RA{yhe=B5W)Vz_K@X`Ci%&kdyCyRMIK{v#pk;Ms+iMe|(#>oAA9q94co-
z0r#cp9pQuTVyU<cMFg5lSoaZidw}ZiFo)8-Yi?$5&qiakCI8R|)FJMX!#`-ZD^X{+
zzOEOD6@yBMp`A4R!eQU9g+AL&?W2Yan1QbAP-`8Hyl{M=U^izj>9nBuj3PAF{J9T&
zZdalch`}#3bqEwZgv!N2n_U7%h4l{&aOz4%l>f>Fo~K^t0;*6hAfj1qYfeD8bYd-n
zK``daSo56Rlk81ogGz7g_66nu(?hHv#lp&Y3>k9UDl5(|c}y<^UQEj&Es+8#gLCJr
zj73(=sks^>Rq<@U$v9jFKCLFRGK9`MYD7TwjYv@O7ouTLJpajoG(k<$`9t}-u;Ti=
zI_!{=E`Ph)FYQIJwE$)_P<^qeH74^+r-!6YozZMT>ty*g2#s)wvwo#EaPLDyLL^%C
z7>@yTWF~mBCOIKtFNfMtvC>*fk94H7`PDlJQwypA)pw}I&G-+FD=E`s9{rUGf=Ra>
z7zm5EM(^-Py=Ad)bJqe%LKj;#i=Hy?u8OnNH;@B8FpSi4o13|%6bqQ~jQeSCHm*<=
z$y2{VID?nU?iFwv`-vA!spHdF7+_jRnv8-Mi5ksc^uKw6_cecc`RCCKNZE=~#O#s<
zxN?>vtYgbPJ*P-nbJU5<6jvs_`r%!G6-jad-E6KFzmfJbL_CTB5*Q0@-+`MIx{)~y
zzJNVSwP{2z9`0f*>wM}V8Z{b)N4-Ff2uEeK9lD;S4wYvJrJGOTjK=t}SN%7c1j)PW
zRzM!q3J_o5droJMZgJC>Wo_M{_+(C-E7A(5y(%-+({&aM_Et_#oEI}Pwk()ePP7XW
zyGx>cW_Zy72xSVvf;49{Zh!)R|Neahr^E*B;hrE0+>^vd`?@d1Hk!r@nmkIRyFm=$
zVd2m0L;-_4(xtgtdnCBA_DzM>wQD)KCZNzw5%VnBcaH3$OJiztj>_#8MeK&%I5)l>
zGy&sdxfT8vj9@epPV69fHWY*HN-3|5kfQGqJxl&8Gh0kJe`!EYy<f7EB;%vR+1u)|
zSZ#AAMeagdwX2KBcn;f?=bO6A$guU8$R*uvGzBOS-rR@~Fyjvq5>M#z^@^n|>XFEE
zpD_n1(CITKA=7f1%SQXzU^^UeRXf!do%VJT{8cV5pPp=s$mlW8b6>gOd4i^qX)kCz
zi@BeCc4QR=00ifix5cbls6FhgFw2u0ZrLNiPZzWpUAW?nrhu6jjCa4Dj80jfv=YEn
zkXC)<Co4bpA>WU*b{6V6h7r`u`wUzk-s<v}q!pBeS(TxxTyH@9M<3@+<n`fYfWsRx
zGBkKg4Fi~8J3F<?#d_OtaG9$4P6j$d)-<had2kr2$LOm-R9>(u>lCnM+miGIm#mVM
zpoCdwv}H3(Z551!Q4Mh8md><XSJPp<KN9KfuJtDiNZNRw{c^n@{&u~#mxYsycLZ^L
zKUf=_w}o2(4U^>F)T7FU(8SX<)p`>DsF51*ZBKISg88aCg#i2r`3RHr)Puxvh;X#i
zIo3QWV!P?xO*0zdLY&7om5BS*5@6Fqt4;K9ih4wC_@#l?1BZXPTxH;Jqg8c?@3|RS
zcmN~8V}E|yD~fn_0&quia)r83Nv1v3gzef{0M|dx)xBiW3kyy@`+zG?$`FWGU0A*K
zNFHz9&+7|iQAo?n2x-XUNq=@B{1aTx6*F39F6gxxysM$3p3FQA1D?fh3+fs09|Okw
zRG>rQfn;lIE@fv0ko`qF${S~6eV+80Qd-Va^8M4GScAPi{RpW<pl&E?)aPb2@NPO3
zUiXJsHjEf%iq2E7PE*Am=@U4fX+CZha*?L*=(tBjZg_`();n#nS=ArvF{@^c1`>X8
z00Yw(8+UL0f5!$mS?mA@&sUboR+go!n=fa%M=;tt)jgDWdkh8sgue#!=}GjL`imuY
zd{Szt<XX%k^SlDIz_%Aq`(@dC+IxKw+<2g?Nb2<ENwd5s!xEG=MC>uK79CD}WW7&F
ziAJhE+crdW-8#&61gjBR^DlGZi_B?}XB~I)=jt@VKqoGiU6-6+QJjBnB&(B6Nrvt3
z(z^*se~yx`@lpXLXU?5go9f+A<&gkjw!LUc!@Co7C(?1}S^7iHY!YbxPj)p}NJ5Ko
z<TyD{r+rz8%8v4?c;Q`=W~UJCWQFHZX=*eJSHb;-Ck0iCbjwtGCU-3HcYXEQh?bN3
z1bi_pT5b{ZUBG2XPiK6nt4BIRy%5~G7xP3k%Uz%-;?7u+7L*mycLKWeD0|TdXckQ$
znVg_1A(~mhNe0B+sy<2yI<!S*5M3kBP*1C&vEd>4rfjq5&rk1>+QuAdd!#l<R8dz^
z0mm$f*aK?^4AF4Pqq{UkSeQP>mx_*Oht;VUiwrQ=XX>ZH$OxhNwWH(utEtqqMH{Mh
zow@S<q9T5_!ktHpPqBsX;`CrtlUh|$akl#J9D&(;=tH5yL1ozjF5-`p(0!8a>gg#h
z2dVdz1w|gT^!=aXqCpg}aYULRL!>cS7|`0(UW4vK6jB<X-B|c#fD{$fLo;W?71Wq5
zt_3G!j<)R%QR+-2bw6@ky6%twlRXNqLE_$8ewW4!=rSzEN~Aq}Ko4~1J+Vu2MNKGg
zwh-9I&`qFaL59wp{VA@5>1qjO?$2ko1|P(dyt!ng>CDm<hw3J`P4P#c=>xcz-iAx0
z-{k$?Wjplj#mO=#zUp`!4n>?v3om{S1v6GYka<U4<bnBb=bdNNNbQG=i~6@w;9~_1
zXQ#ctF88{h>*i3J(!vu)D4#BSuIL7JTo{jq#C_5c#o~>7t~*+6TLklpBBw^nW#$D{
zt@wEXujNJO>=xDPl|@+!0w-8i9i?KEO+ou;Mv^=)LMYYqY&Dn+;Vl#w#cdk34}5DT
zar{-_PsSSL>haKqVa2i%edxYhtd7YlCl2<dBv>;`P%1Pq8oo#h!dG0I@!*ARwzo@*
zJ<ndr@@geEZ6;W0Spq#OpE(|(4o%OBuBIEN$qp(;MB1#H7a+pT`BBlP8ioqAuG>qf
zk$QUTbjbp2*n&+#RXeKa$v5$gIrjN+9y2!kp;xLBtxw~-STxGoCwTaUJlijZ*o9&o
zdUv+bjA;;H$j?h-KLO>hy9p5$KC?NpkWu8C%ey=qfjaltx^@uh(k#l2`cc?U*|94>
ze*?_i`>#KrTt~d|MZ+IbJAf@CMs?b#KA>OK4dAX7rC(T*I<X$8dw*~79}Kafe43wl
zb|=mUoe>X>y%(HjE9*&DqYWD@e{%4Eo%Xz`L@c>y>1zkeN}&IP3nm^f;;}~1HB0Z_
zVUr*0-0=d))1PxW64%dWETvTioWuMEUBN>nU$ku6l}gft{@7)_(N1QiOOFCk_a72O
z#ypQekFG}fb5ha~2;p*Lwj;WJPa4xPEcRKMW#Vv9Nnw`vqtAlu|7yd1(G}#$8LWH`
zT!1PCYuNxf(O&%dM|*NRXcpO;4A2m)E4~gu$xo_xzpr#2MdLJ>Ywyiw5u^e`ZA`aB
zw`5`uns02b<c!7zKnPCr$X!+P8p+lACq}P^rBeOuZT`<JC>Xe-fj9O(Icm*7dFG1m
zxvdvD^^TmK?YiaOtQd%a8Jp}hnw4M!PG~TewJ&YEA7_+)X)`RAr^j6zOtEmMKg@iX
zXXm?rr#@bGiwc5aNEAoaKm_C~nymfN5s)8`EzZg@&WHSXIsGR+sO7$jyAwo$rmDz|
z;x=lJW%JjcyG~eX$GQGVIgcB>roeX6ixKMiH(I&{AJsu&Y9X@pQJEUE8QgKZX$bBo
zphy^ETr84^Ig=DV^?p8S@;=r!C9cj+%r-U%BHm;O()t8z5o0hWu7$Zb8g~>A3Um{}
z@|9W(Z-JFO5RZ9jqrvrN?l76(XLz0!{><}z%hdO7&@vbiZ#!(mW2i<L+n=IkFJ4?v
zV?QS5$~g2pk4Z3Hd_qT>u*mOmTA~GLOlW|%v?w+`hW_%677lYD$hp9z6=4>NIh5k(
zGowar*wx(Z^O7q!ihIsh+HplWHlsnslcu>x#zF3-u1{qoZ)}vdZBzkn5A#M>XviMU
z?E+V*=B#&(5tmg-91P2#%pgI*0I_ZJ9-GHwAj}6ryUr(sV`sT_VfjVppb>mm^Fw`M
zq==g1{81YLxTbrNj@gGRWLqotL#lg+)s;uPE2($cV!=x!y>~Be45%3+-Co!@87lN#
zDtt!Cf_+v4a2eh4exfrF${i-epGAIM0j1C_F{`hufVwy8WtYyyFV2n!kzz`Gk3>ZD
z=@~ME33%hOSIyR~PrBoX4Y4;BHBSGcdV{(qOyZxi$GG`O2aK-F&CI5Eig5wZDx<u-
zrL3Z&g`|IQ@GhxhS|Z9ty*v*~U9F7aU~JKaB-y?DhfKvS%a~Jna_B0xC;gobV~1*O
zVmC=QW&!rMqPUR1Yw!$opLvf=jF$QDt5rMZLkOi1ZRaj`<C}03pk@-kP}u;1Zh>s_
zNxN!OQ&UE6E;C*sE<=*dI{}b)9exM+zSDKxs|0}~R2=|wHI$HC2C2b;l-nExkWh<=
ztOD|$A+-YGr_);x^z-zX?O9;%U1fqi@nFC`ECebL*#2gZvprBlBROBQGSrnd7Xiv{
zrgaran)@loH4OGzuN&&9dl$Avw}HyYLlypwFeZKr>*Y9*+p^iD)V{E4D;pNOk6I3G
z^IpsjjG)XSmdjjVhIig1dV3&yo0(%GMCyRxRS3ZkdX<e(!L5f7hx@GCYGL|J@AC8&
z;+VAh{d3BI+H5mV0Hs5nZ$vHh*fj5<2@{G8fD4W$Si3Kf#v6K3=I_#{axU?$K$>kK
z@`z&9jR=k()80G)rc>`SQaw#@?<%ihxH~a+X6A*~`N?`BE6|V8_ceqNalJ;d>wHr5
zRImhU2zU(8b;==0?}|bHr>fQ0V1?@R;71^JzU}An{qVZFx(1=XEg`FotsRY?JOrx9
z&J74GhtdxS>wBeB=3H;$84DE68}9>%qyTS=%S!S}&vv6dM|`3uK(HJy8x}LPigzA9
zu$Qi$s0AR@*0hJMB6((cdOhuGjv$k4%b+T;Ljhw-ZFs&N>!OZ~iWbSLqTOXEG%@Uk
z=Al`^1fvO1?7&$O4M!M(jECFN&)lmlqDJJns_*9f1!`9;J71zDJYKYOl+2<BXxH5H
zA3!GN0)Wh{cGr&{qu)lSoO;YMlb54cbQRrZVW`~z6`rRa2aev_n(N3?b^1(Yc`+8*
zU<N|e=l}%Wtz|bAJ@XhAbv%U>XE0j{2=LHt*NDptSXu~FKQ6&WiC6SG8)yxDO=HPq
z*a$#0Jf+)p=O(N=%l4v|tBSQ8ty>tWaVo7^Rgykry;#5YEKCm_U5|MaH-!~W+dbqC
z(|InAc`oOaG%#S6j0gNgNPwjPX|IWTqqVg)#Q#kj1HG{5g>c(HjmicGB<d1NYxBcq
zIABh}wI4|Em*k|U=0QTtWRnnrLhLfYU%C2qdpkN34GqomH&hC4AZwC0=Dy$4Q&7G2
z=Fy`^od$`M;VuC6-mR=CY<zz1xDRCGrh$kY>J6gnt()b3WPA|yJ`#zbG@>vGOplU%
z>;|viLdSXTreYo~-&=_?pZDJ8*XKo!s%<W{!5At=*LHK6igf%ZFhx$FOJ47^1CWwG
zEQ(tQTX?3sOgoU%9aS~AY5pv^iAi{`8q-MpL`8`zNsIF@kSwtfF~5`^=tif6zalS~
z0Lvh?h-c!qOE!+Gy89rPOaKjs_<Z<yr*x`jK{?!RRQFkmov7IG<sz&*C55~cT<Jsr
zCLu^lFN)$3*JnH?GHQbPViF}lnBR<wii+6_{?9dkug|h>my2&f@AMh{C+eFW(v60O
z_$F^Hx`Ts5$Ncq<O7OK339`$^wC6M|DkV}<imF?9CZ-m|lMJrf{vqsv1>%OUychbM
zJ|*F$;W!+tEw^cPj_=4Y5D@D$jeXD1EBCE~W1Ir>&f3q{%w71YuswchU$K+p9HX^z
zLBY|C##p)Q1o%@4wD2M;@!LDVNtClhOmd^Dbitv)@%qd;1h#=+d8;QhGpAO2CQf@W
z%*W>BJFfXHAsUM3m?(?Kp%tX{1QVg-$)^k(1s7|JRG+PICmbE(cxQ4ePHVsTOzvLR
zYx1y&2#%J#&lgl>jDbq=_EfM7x=#GtyP$wwDeJ-GV4QCq5PxU!yoLjH&gR-0cXIM(
z#?aQwpnowq9X`?P-?9*V^vKHVJor{KTwBFx!qV%i{i(zn&Nx%R+BssT5U}Ez2g|<8
zThpbxMofNkgcff#Hva!E-o6Cvb+~B{$BG?azow<k+g#h?6jsriCyII5{P5oZxUVQF
zu}QGT{DLJvNO7hIeTQde29a5EiBF=Pc(uKOfSQ_o1qylBZ=4^Z3E;v72-;t}?9xG?
zi}4Rp3GH9|TQWic5WU_Xum`_Db!Zk}HWeX)Pgo%SbE<bWlBz!C?~lF|R8&kHsM%Tu
zdB}7A3zg4J0?TGRKW`7TKt=WAdbM3nt%*C%%V&M!(QE}L=6;3#(^{QT>w0}yWyv7z
zIh3d|;sAJN4+bnhvf<Ykm!VM>$p_J%UiV$Z@P6TBW16F!uaOk~c-NqE{|4T1L^JeH
zvhLle|3lxxqA`!+9;forQ2V?%cmKpdND<s1|M4}qBV^x|a$-L4_fMOqo1_g)Wo3in
zg>%~gS1U2WXwJ5s@Y)aFOL=C80RTfsfgd{OD>DFg0uJaThY5fG!O(8hpM09ZFqiru
zRckjfF_Ev9HUaXISIu|+?F7rk_1v|{pONq`EG(pqX#<+pJ`791?%>Hfls#-YG*hmG
z4VJtm^fcE;c#Z(1C`1;lkw^dW+xzm*Rgjn-g+HOEXOQ>0`V=1*chH$6Ts^X-G4X16
zujBqdP3S>n*tgHPrJk3cRHNZ=m4T5F^KlJLu2)ZACq900<b8FV4_E-Hi&)QnrEWkj
ztWz9XZ+H9c_4ZE|C>QVE7Z;<KI!?J3vf%o5uO=Ed|I5z-Rskt7awUxs(Qp?vv#q4D
zj4xk8rY!cGVl|j9Lzs!LjeTN}?IGtikDETU*Vsb++pGP?RI@~+fJ1j&l@!}$>8*oP
ze3fGx&%a?y#cWZA$N7+gZ-+TE^rZ|LeytY79V7HB$tpc?DoDx$L@a<?`D+|MG~)M0
zhJ361<KOnJN({3^B!G&F)Fr)`AJ_Zf$T3rgocN!vGE9<&vcCA>M#gjs+cuwyvT~H)
z<4Z|HrR=jcYi&lwU-xb8?8|-V2AM%{=pIm}{N{a=j`r3yddP3oQvRN_x!iuan{!G#
zIXgze<e%i=Qv~|$u;2uT^;<$HwY9)$4)iF%2`VWMjtlNW3^iyL%r>hpP#~XDa((&l
z|Ng^-c<buT&Qv*WO^#*cmeQ2lwL?6Ne>HW$#_lf~GS_YIWD92dS3j+F80CMxj^(v4
zcdzTj>(@d2`%mEOt*iA=NGQR@m}7qY<xV8}KMf^m+F7Ep-e0yc*1;R0va0)YTc<<j
z`T=4*jU%p^$=0A(z)JSp5AYz~TUYHN2vWm`*3PeXlLSiToK#IaPNQ!8^B~@0jz~>3
zUreUH#(KR!?BN8V&flVxhWSkMa+8_(7oPu5_6G_O<KlB;=;oOGJ}CwrKF(v9JMb?(
zYeSbho+WM?*49oPF8}d3o+!6Ke6Yri6Rqz947aY-6B!v97o3!@bfA6a03H^^!9kf5
zOPxFT>+Xixtk_IhgY+7vcqwYI0h)HGCY4VLvG2fK>93a+DRWZ_(bu5%Eg-^!IA+4$
zn^hp6UNgv;UjM~}O5X^I0~FfBdH;@U19h(L*dWn$Mq*;Z!Tpv{zTN|vE>}UMwLf<y
zO~Lx(pT?kAI(ptF1vd>KyUfoY>ITe>+<bg)^pqv?g>(nUg^O9hsKK(-G=Zc7WP41I
zi!Of|OCD#V9-dzFi@TJP?>fb7`!;DLbK|<v{0t&lGM@NI@ry`kk^b);o2_-&UFdW6
z=x2%U9$?>A=V;4fSXQglvzm4Z|2N_~N^K-&)qIcB&zTAXrZY^R<~0rnSo3%724)(R
z?5~5ygtHg=AjFPM1Rd((?>nGC>RBRuuxFj<aEYuVLR}C|Ht_FDnL|{R)^~9t@+$$s
zrkts%AoaxE#3x>;vN0e%0z@n=vcY-K%Y69};@tUtst~akDB|LuQeWks_ke}$co4P@
zj@}YPQ!xCK4c|aZlhU(!-JA!Aay2wGy5F68q%^2F78w&w^b_Z1so3@Z+AS_V*^8KI
zLw^572L@J)pD`3sp#sagfOd=duCt><x$Dz;tRk$7KZpffirDyHg~ost>K<fB&-?zW
z6#vck{vxBw@Hh;o0JN;(C>KxO!C+Ke+(K{0Cnkh<C7&XF?*GR<H9SVz!x;p<!`0O-
z?oyLOqvmpd3t4lPOIDUD=u!gwl;bN~UdYhbaDkI3Z%9X_2dIqSr|E(vp@@r7rb0y2
z;~0F+tZ|}kfff^XDY8h{xz)AbgmvQFqey+2t5Ud+k!bByY-w)Uvtgu3jJZ~N_j<_-
z%E#IA`fg>aK)+-y2|81r-%l&wp=J4tp`ctIl{bC);;34d!ZyHHUGd3X`u4xZG0#1b
z_S`IAzixi(2zRR=0lW#dPsUo{&PQi%YIcBJThp<K6%jap%|AFq2MC4U-29ycX+QJ_
zso$8wEWIV~BX?BT86~9$%pFv~J>w3@I_bPqMs;RpW0b>LVH!%9|Gcp06ez$;_3RPk
z)^>I$b9I5NvNXstKz==y^qT+77<B@Vo%NdR{5b)14Si{TBP$W*khH!_Pv5?PiBjPr
zMvad0#^3t@^X$izxtm*c&xX1%&r3`>sBisim=PkOci9k5eE)v$h5_?F_a!%Bz}q+L
zsm$Psp!hpb)!2R$GHPR}(vAtd=C=U3w6~ZBfE;8<M7m#p4rRbE>I&I;8KLV>7XO>~
zjnwi=I(VA$zzdgX<!Tz>(1%)EPW!09kqzFuv5L9KCBmUUoTt7`+_P0){=-oXVwb-D
z`~|$7Z398;X^VmBVSsz^>G~!rI$U%D5emiFsM|6@#-0NiJI^1#6A|O@)pBIvA{Nq$
zG7d3cM>R$cUnQpm0b(ieSevNg{FH*9u&}}s3bxp|DhexjnY^R_xs8CG@oy)eSv}BB
ziUzDqn56p$M*V{Wr{bjSUmS9*7jNcoL%#*UxPY0V|Bji}-m7JNfJ$<7j{KCy<gL+Q
za7buEM+Z8WFwau*$gq&1#<+&OsZ{mq&kfE^GO~>PS}vNjp~UjFE*V5oEczAra-PRx
zXDF9>TD84L$O9(dE(9`aYxC(h+NA%n%J1zct!)h5Oy{HpRq10aW%YALIvJ^w%Sv)n
z4h1YLZ+_W9P*ut`&G&!socvFA@W!i__`wenLR}Gj{3w&593B(BOF%-+V`g1PGGLMS
zY50s6w!$ZybeY*92_Hpa9kw<%=hLpO&G^zbU1n*8HCc8TWPUjpu6`e6v!S><$JjJ9
zh8bR$pDs16c`%8(9lDje|7~wZn!3ntNW(g1gs*z!t%HNJJ&#P+Bujvrdkum&#u~H=
zpaO1J^>#6ItdsQ65z+n6N0eW9c_{fwTt+RdMYqnqN*!)7cI$DzQ*SU9*zYzOM@($g
zDwLU-jAOhp6`ITUw_3vb!s^IJi#rL2OILQh?HdC>imiLH2x~jMIYbMa?Mke{1!-K$
z9}K8|{IKPkz~FLq`<hfihWu|dj=VVc%B<<tt-ZP&9O0z6V`~?|F6#QK{=LadELcHd
z&|a;+Dqc49KPn%C^kRtQf3LJ+Cv>fmIzRgya&bS@OYvA1;Ns+dZRDh3+au4Fvh8w|
zN?09~zhT1s=QzC^OXCD#;;0}TwItCpw<6avh+td+2%D&97=B}x%ROAMnziE^Y3dTi
zX-{mBWv?}|`npQLy}b%>*gR8HQ!c5R7Ed;5#JP(ax7<ytZ<Kb>?{Cahz8V;b1B?OZ
z-C)6QPF>h(OY54FqV<h;)hW(BQc^A=EgM)YAaxzOZ{N+~m??rXcUnY)b?tfv*<l^o
zjHL!GBrbOS76voo-z`!j2L&`PhaX)g_^u2ny=$g|xF!)plGk|3PDLmQqy4?NgqHJK
z;bMqcHNK6)<>glScw!!Pp5>l6oca?1gMr42p@5`<4#bFoQ)zT1)+*l#Q%Si7J#&pE
z2W!5Hw>ixcms`+CT<91kC!ft_qlTASXO0w~v9*cUir@@~s;)=*7#JA!$S@=u5wb1b
zG7^S6RIMKX`R)n#vw_s3Ko`*Q@6OdZ%qbzvzVt=A1qGn5h{u47<PD+53rW^Tr-IOQ
zKzKm+a!oZ6D7DuR=E8ae&<>7|69w#-jg+SB`-DvZ{Y=;2jIU_iOt9!9{cIq+!<AV$
zB653dE5O26f~LEp|Bd~n2g~U-X<fJVz}MDxh{sZl?m8?4{Lf+G-0r-qNA$|HrG#J^
zR?oUCUM{a9&I}L(SSkc#2^nVFa<~(nrf*zZgToZ#zD02CZ{&Ddw~d>f_mo6Cn#!*8
zCXN`xXVUsul4gv@^D7-&G4?;SW_0JyRQko2+64Kx!*Q*a*}!18=6q`V=%if~K%~B&
z_Q%$J6zC<a1iQ~YuT-^-#pSBrt}2yUjB%C%<=%Kp_*iSry7o4wADLs^l>FN$3w5J9
zus_NJapSn`wh+nd>ZXo?wQM=Cp}u_n1Sv9X^b7p0qa&f6>l?F?d`(jThVqL0_U&;g
z*mF))t!dnfV`18+o*XYX?*V`VqvgI-Yp7AL@#C=+Zq>)*kF`hRT@$c!rTOPxx*QK5
z8hzNDxy+lk;xbpU9g%lgUF;=;Sz1XRhJ#gf;WBE6Uul;ePWX&H^82QY>fEMtVFr7S
z%a31bT)UM$DRKcJ4iq5Q9A0!G2Cm$PS?boU9X(8=)vHZHh)GBQ(`#~u_0j#(uHHgk
zYeWTK{8*_eor<lqbMvHom%;Wn72A)EY4Xxl6U?3rOrkiK{pH2G$D;cin9JMPLi5IS
z*sgWw$=m*2ym-fhq6jl`&qWz_&uYsG&gvSgHt7V{knp<KLu=(G<(J(lQ|9nd_kpA&
zOyd_@>uH&pUDc9=K*NAytK7Pe(JmzOyDQHdSI}rYyUuc!sEb^CH0;mk&%5pW>R+qm
zYnYym6!L8*TV`0Rq`E8}X(rZAUlf{jvGU5Y=y*C!xp$E{29pHH513I<PZ%i^n=dEI
z^Qr4;*ww&tU$iEaU#@SC)(u;IdZ<r08iG&Qof>;~f-^xWAsKW2X!Ymo(%Xd2iPG&3
z{bQ@s9^TYH1YAgvG#L`p3qqKjD3pGx0SO`ttF!$Ne9RapPBji;dHYP3_gAZ}Yd5X7
zpKk$a^CRIyW(JSe1ijLS!zeBv&)ct=FQcoq*95#=64&Mhuim7not3HUJ1DIWAG-~0
zCh|;JRGrc<v$|d6j_vB|#2@k<&uk=&0P=I@-VU`=8`x#-SDTcv=3Yyq(qM}M@FOg4
zV_aIfyH5(4ucZGO1jO6rH-w`OW<F?ct&2}9@jF?ij&=8%Ek5diTWLO^=$HCC=>oTF
zJw#MJSi_KL@@g-(Wtw@$)Fh)j!Qp9!*X!=L>iYUo@tm9aJ%H7=sF<`!V>SPR&vLkc
zf^%JpzNb>VjDomW*Pn7^nRTYKo|S7LBeQhqU`)|ISK85ZgH47jql@jM$Hgd3-XC`M
z)|9(5?fFg-n@;uT+WXmx9!&d0&R{~8XkJ*$Yk!{z!p}hiu_Tvd4=s|AbFfck5Gu4M
zEgXCT6tl|&zzzskq1-XUD9|ew{<aM!b+A0-nk4%vhmm-oYTOTTLmeHKFkg(t0dRCv
zm+95zF?REc+YX?rnn?l+7x9ZTC#`(lKsG*7;0|hv>l))e#0h{;;a4vR&^$d1BD(=K
zK5f)F1jYLlh#geL=8ZntwF9vG(HEc04j@xo=m{;YfDA2YIhd<=Cs8w|=m4MTo?5k4
z!^ExyVERuIo$oY|!-!YW&|`jg0)RFRrCQ<>d*7l{L05c_D+A>^l>)jgdy?;l%+G51
z@Sx;=;@hw&dv1@$tKm1NmU#+IXKv~q@%CMsa)7k|zgVjHh}?0x5nIPzynVGNk*2*@
zZWEf_h^y`V?D(V61=*fx)vMk-opO596u-J-?d46kZQR7I&wdnqqF)zRif39RtjdRC
zmS^7|0mUNy>dL~N{E8V%Plq1r?P`;A?vtvSN36Ws{Co3Vp86~LVJ<(e&N7mF{6tSE
z=4chjWM|yFES(Z2wkq4?+L4kROp_5+N#@*$Xa4@P$6hr(lOD&Hh}RQ+eDSRC(a9S7
z`r4j#Cr|m=>L=Ja4#^uuP4MM*?E7zkSPt8uQUA*0zsh0q*XC>iBViYFD*N6ZUCEV}
z6|TOgKcz(CG=x<OG%P)LyViT66cJpeDb<@_gH8*NuiWw)ba)Xb-79@y{7)Y@z}Hn{
ze^n9Bw~ff?o*+FC++BCci<rsqDmGkAMZER%U>@_XAJ<Vk8^OL<`Q}&}FhBhg{u8?*
zPSdKMIcobeDw&?+%;sVIf&tP{jY245=e*l-!b&@MENTC$)QQad)u87Is`lH5nn$1w
z180e+_J5%KJihb!jTd*v(5PjPo}-ArL}?B{Mm-^VE++B8yZw21trKzbN5Yd8*~Il)
zw`z|<;WJOz$fBJL+bLV@B%N*@|Ko=4&8qnG#|%Z&(U~6Qg;h4Yobo9#yjKDiHlj?g
zO5z6GD$Tm?XzVUA5wo#4p~=TTY&1*izSH0l;<imYIpSRSA)!i`&wjebNved+STVSm
zzf)K`Ubo;P07&!D5yoYP;7<f9i?g_re=qc#+6_imo^~{2xnqWkRxpGdvNrIvhjfhg
zoykgFD<OR6DMgvy52<ly#)}WNld3pTO><>t53R1I)>6%mw=UmG1gEcJJ=_{S(tk7g
zaG`qM<dyL5{_z(E!SWasYmc$fO=1-H&%&z4M(-@&B!3g9AR!&)BJz~{VQ^E+Tdl)`
zY7HZ~Hj?tuJ52)|(acZ%84pGp^Xawi!&7aZe&bch8M}qDNPXo!I8^&52cDLOelx}6
zVS;bXpQ29!PN+T$Fh2MmhC%c|&hW!Q40BsKcT3<OaT{_a!Y+GhFO#Bg5_qW;Xsw0|
zodM>ke(xK|FKuEsrfb~>-rdA}Kug<9ebE|1n(c9ZbQj-H*gpe%H0Krb84xwko2R+m
z{^tEHtUmz*<LZ~uw@%yB$s&jo!-}ny`YVL&tDKj`(tWsQ_k8rjbwg-%J&>LsUIMUX
zmO)FPt2O5F?m`>-(uYSyG+gGxEF_QKW__WIx3fCkTN*4iRdmVkN#s)oA710BT}E&+
zXN;U%s24~WV6%>J6^^pfqAW#+pSke@sd$+LCz|T}+{tJUzwstF*m6sH<LaT@gIR?A
zF}>cKT+h;_o~7qWKbo-+iu~00qh>8Tb0Rt%g9^^|u0ix1yFaD&>W8O3sSF2L$_Rf1
zmz|kcF-#do?2+bc)K350+^Mu%+B=Zz>s7&IpQ0Ph2@)FolcU^vKm5_)#)h10U})%P
zQKzj8uVV_r>b<0*gpcupZb@A;Q|H+CGbAY74Wd8XGRpa)-}LCfs7)$4M}TBujz4!D
z-M^7cQ0NIZceXXN+eYjSl);9oXN_{0^xbmpO3qW8N2^>buU85@%B~u4ix<XRg68!&
zoeyk|TQgblzLQ-z?L1(0x2_s+d`2XZwX^t{=<N6-Q<<xm6FQv9YL%02b?HX!gN9Fm
z$=c^6azE?p7rD;1>kToGsvX0u$foF9pTL}#la5*X-<F}ZQGZHC<{FGTd*?rOx;w0L
z*!=&P`l^5`w5?sGBvcxtL!=ui$whZ}w{%LUbazU3Np}lU(%m85AV}w(?0wGp@1qZj
zz?vhz8ZwFVi^4ENOBtz6L|;&KCSPr|2U51gW;9mV*^EcIsWnx|i@D6OIk;PIx4K@^
z8)=(o;2YX0A<|;Fx_6>AyRk0FGln@3bMr2?ASt(95h8ixHwsoN$N2d|n@vT(R0-Rx
zw$RNTuo_&sKES%&ZehhL6p8YP2@NKYw!}HtL|T0kI-KzAnlT%$P})QLxS9Xil74Io
ziqkeZJ0t7$DEC9&9E7&QFYS!V8TC)VrB*@=LVa=FdrnUE*e%`%CmzrGv(E!0aK$!$
z{1hQoS$(12YF29$^+=dc#555^!S%!=8Jy?H>730$)*)ZIy3XW{w(clfUDP3sm_q7#
z?=dV-mSnKHH7FNXV$3$*B4KDo!%b{So=z1X`At<hvS>GxW--pE=!Knq{Zr?8=Olg&
zvNOqAEx#2j7EbJr=hBT#muV*Hc-<H`1M83Qdo_Nk%A+JR&$C|?SetSvvOsxJ*BFLH
zmjhh8I$VLdz^*!#BaGyWyN}FwuLo%*U^T~ByLE$xmC<@S-<x!^F`q1Wqg<wuU^|RS
zqoS6U%4UTdfzLV7HM;V0-|%PP8)MgV{X<mC(KJp$=~OmMbUD$w-;{<RtiY@<lAu~@
zUkF4keo*NN!&cS#=6QLj4w3*8MJ9yjP~VG)1<c{GTaR@GAR%<?8rNGbid^hZD+Z|>
zIPXu1$JWHCQl5NTT&K-VQSyI@0>kL?23FJi6irRcQrNcP+YtGjKnl(%{cChfmWmnh
z`2JRI(=b7Wzj*%xe#sMFtMyAjY@7`$h9!t+sQsFA_{g(e%$2_q6O&<2V^CI|qIW=5
z>&cbAW>_F+&?TKp>=LTiau!rqtN+s^%))1EYQ0lLN#T&!AGY=Lh*sA7KADNg4rfJy
z5^5IGa2(dL&~qcQIo>NN)rhRv=xDKVrg03%i%&=Q7RWuJ%dzJL7CTNV`-t-i=l=FK
zE6s7dx~G1GP)H4>FpF(>Z^!P4ysS~N%_DjwF;F+)m{k0murp7@F;A#0P*>)^HXQu&
z@sgG2&*~Twv7exWP(~G4%$85q6S#km*V1vTVppcb-lHA#Sb6jOa6`LbGz0u?=7{JY
zd>>cha?~tns|w-k)flUHA7trb`^Z@0lc?cg|9S|d-wq^Ld{Luin`^szq0Nz5Z}E+8
zy)Z`a&UUassa%RGg||1QigK%2t-JE`s`r=2CD^conG#oq3sfYbb8@ar)=Tm)G)lpF
zOZwSg?z`2I>d0vgTs+Td=w;gl8jaWEn^d}e!%-~Tv}HB;7QzP#FNu=xn(3X)!b2hp
zcmzCGIXYL)vdO2)9g#d)^_}5R^?a@1UbYVAI_SpnAk;6-MyIh)m+pf<)kP$vbXW|f
zHGFTg$Y^OU>{Y|x+AVokn#|!^{#z{nkUOu-;40$ITsa@=<}WG-xoA{o&eL1MZ0J`L
zjkK3esuSpzG|JSH$ZS@Waj>iV&DZ52At9K1=@=eK@AvH|0!wc2HUiByZvULK`qDYI
z`+RDZ7oH>R#M-!2G@-A(UimKH#+*Q}{91^0;o{2cljDAP;NSOUgjq9Xgj12)jxH@3
zN=*$=bttP76YvtcS{}YdG~-`3cf}Xlc65=rL$Mho-UnSevmW4&!2Vxf4fw%7c@w5u
zG)qhnqwo>e`G*7Mo3Lx-k}}iifS~Iwj2-)1gxIo5S)wJ$JLmEkBMlUDn-HIuUm;3O
z)=1Ry^(EoXqS2?vOX66F^<oG0Qi=s%&jY@fb;u2-vpd3IhEfuX*Gc@sn*Vztu8m?F
zK_(Ne3KCAle;69CudnA#&?zy`epeSn=1VKkb2wh&ta_8Ri=r@`8^tRD`~h!;MMS6>
zn8xiB-OhI*a!tx`c@qN(ll5=9ebj;ee)piFBM}02TG@xYtA@Fp1JGdO@>JV$XjOb*
zU|@=jjuu!<hAPE->qIMsalm>^F-aqz<NrmqL`huI8&rv@Y{6F%9QVK^GPd3mR`+*+
z$?M+b8>7B2H;lgHYP+XWiPC@`EjKzEno$!(Akb{)drGp)67jP7DFrWYhJc{pRz8Fh
z?&aJf90Tq?Hj%fWr5&DZCrMK`8(dSHr&&dQ<~)q%6w?&zJMuY+cg$PJpen$cw8Mj9
zzz7xoLp$_`G80D<@yd~XPyqay7JaErbxW;UN}^RO5l!w=C8R`|4c!t`!16Q9OB-~{
zD106nhaHBx{v5j4QpD)wWU;U$PZA3FjHAf_b0tYUb~*iUn8g%DQO)9|lFCKr<NU46
zyl|Eu$Z^ndeaH>(um>XZD3rZqr5^Pbe~zP@C`?3<rO@`CW`!!0nJ>IU=<>K8M`Xfr
zP_v9#iC^HJ&@%4)z*Tzii^xE8i9w;EM>vpa?OdQEgMKR=x+%~HmqRr>MXxma&zr@?
zyu!vt7dOwdR1GdzrR;^7ix4)p0O&vT7aQLqYE6zRrW)mWipk7d(M5c%bgPmDSC998
zW@3W>tWEo8CIsH&I*^h?+<`?4UUR0$BY_o&fmG=ok*&|aJD90`H#(by_mW11R*>QH
zB)`XQ^V)j))2;CXkqTr&vT}Ie&3^x!^V`FW`-0I&_}?}o?<|ygFU9zvq$;KPoaRZ$
zuUO~f&bvJ$SUYFNxe%^cS8Rrd?zIg;qkbAO8o}gd>RqQTtl6O}K<|?=>#QU`&40<W
z1;sY3xbwqzx5oft*eL*Owi)e(b+S&KoT0Z^B(J@H=7Q%q(A9f))*3*hPMdSQQU|@P
zTak!0k_2CWZJkEqG|BPa$%qNp9Y%8l>SCoWBk#^!?YQz`_{svt#yl)>Gn}eIp<D~H
zP(>5@{W}E$0=wzLcV}8Gfk?EL2@G_{gow{5|Lfz9A~K;K&7tkrkDnot!&Gp|_HyOX
z{M1SuX)>9uV#G>aOU<5P_ooaTKKIZtDQuiEP7l@J?$JgSdkmVWI4FY+0+I)+kY;xS
zbvdRj#^q7$9(wZD=@17~lMK2C9PEe{n(4^J$W*a$8w9AR7+7tzf|?!Ogx==m7j3ME
zgAZO@Y-}FsVW;1#4_MdG>j%)t+*t&R4*0wt$pc9YHjZwS1=3S_;^_Oc6-0Dul|M}S
zJol%lkPN7lY*2M<Fk-HN!ZFso{?=jO4XOFv<<T_B(R@u1=(q(0i}oO6lCOGbe~IU6
zDVOSOfpjh>4U<|)u5%Bdg=8o}5df%Ho+{Vo8phk4r&gxr>IY-@B$0RCYZzY_ZoMBb
z=vwX5xLso<lIY9c227|{4|nR)`Ct>2s#X+$);&Oz<spZ1S>HJrLW<ChXm8ajhd&U<
zr9`P3<Z?HmBk2vsfO8O1(SI(#%K!GNppyk!;S=cHZ6USB3nIRBSPWCeihax|ME_~w
zj8MFxV1mvuT&E=C5Nn?;K4H?;J=`^S{Bc*sJW#fhk}wR~9?BvP<b@%-8)o2M4YrxN
z1CDZKPa|@0iktAl&fP_pJ59c)&Enu4XEv=`tr$sa;WEh_>DOt#GHkMv)!N!{zu#_W
z$o;uC!?=Y3j+@tddpibF>prgyWIuGv-w$yFxxa`_W_~*46C(0V6X9?Y?z|kdc@*ui
zSty9j%C0!a9Kh?TGi-wvnzuK8f1x9@Y*I||7mGe$Feq~HULf6hy)j$n@5oCnQT{h+
zrSGIFmBp?DBb>yBVY9kdJvtKWt?neTR?rdaPZ(~(FOQ}1+#TwkK6$UjDv38-c<sOK
z#DZm_$6$=*uQAm1bN}?T9MwJIKw<V9sja9r{nC4{Pj_6``zY>eaoX#0v$*D?WOQNz
z!rQ_8HraPo%KB;ZCPfr{6;J8yx)))I(`Gi|7-6V>b%stxuV0eSnY`|3;bD7zuX=-E
zA%)T8?gJ}n11rm4=ZKWQ+siGnuEn|11H13Sa+e+-`<!mi4yHAtV?TsV(lA_%J6TQ0
zyu%+i`26PSg*Ve%o4d9NWna2j*k6}*2sL#*esau5Pg=-Fq3uGI%awL4Wf-gFjB5C=
zUW%~>n&WFKy(qiB6<s**%RH;pYMS`C+rzsbZ(=C*1pacZc7qP#+~RRVJeK$lqaY8b
z<1Otl#-^dM8y{V8cO9*(!an}u@%!IMM@`i4(Jd7ZUgiB-<hwxAZn00W-;^SM!e=kG
z8}9mYJ3-KlmP(9!qc^bU9TqBlJ$X~)LY+J-TjaW(=b&mmmd)3oP-fsvsoTyk(YPi%
zYlHG(<!xS3_luI*eQ`vL(0qYI6-(BA*`|BwEjxZ6B3Q)H-~4<KnIWoA-_kJ1;V3?R
zF{Oityn+627J%_!)v%{Z(VR~6mk@sb<u-Trqq!<S{vV;i!C3$lmPDfxD}eY4Sq|cV
z`VyQ)iv$ft+y71OT|mh$wl4qp){E)y>Tx3B??}XBet3YOeP(VY?N@K{DH}B635&gF
z%C#lSH0mZ=fz3-<ynm8=V$VmSOy}2(3UfM_a{&m4Q^<h2L7~n(#x0t~qED;8eYwX2
z_yDK4m+E!;KLgR6VcbCEWKS3b-}BLRU?#90z8?6}a2!uov<vov@k2taej~>+41tM%
zt1bFfv3Im;ej}2x2IbTOGx4^-G&UT}s{Pi$JmR(^ABqof8Ed-|{Pr*V)Mn+AONyXp
zQP<sV)a8`jX<a^b>co4ox50UTy%DtswEozLJa;{V=hEh5SudBppB|=KoNb=B_ad9s
zcIMFBPk9sI?BItfE|h*qZ=2K6H!^KM?#Od~J$Bsa8A#--Uw<F2R%iG12NUV?Cu(@_
zvmk!(hyw#JY>I@vua=$9+!{@KLNNoHMLp-)*3>UH+hk>LlyoB4D&b^Ip`-9QNi(s3
zD>YbayCQ=r&Pe#|>1HR>>|myhxj2KzU84Fah2=B+zzm1;&6zO{kyUJlmQ8E@>6}=l
zFqdwdn<G>)(dhX0aH{d658XnjPMe#2u1G}qFExUV9$fP^kXjvMM&ey(J{{}oKfzI6
zWxpli`ZnejGU0bBSv+*Xjz1vjaD3JKiSCZ%_lwu#uSle)6hB)vFiG>8z`T3;4^W^5
zAzl;7(dxm+*pzksyP3FZbbG?2I`L<V(M4BLq-mO~25c&&C<cph@KR}?qUd!)W5t^#
z<f@$?mff!=*FWf*7UC`GrZziT7ZMcCuF-eSaO`qrttu)tDJ-n79g4YC2OYJ0BTu*!
zd6c9(iGc5m#i*Oi3MyNC<M!OBP_*tk!!|iTV>bZ}+8%c7kjju-o?GTU=1W%F@)!EP
zWddF7Ry=lmxiFeiFFHOs0WjfZHZGU-&>)t?)`B=Yelo|bP2Zsyoy>>3fl34o_nRNk
zZ+1`Lni>9?ud8_Z>&0Tg_Ai10y~=9YH17BDnya(-6cI$!9mpS%{h-Zc(wJ2hg-R6i
zeaV=Mgi-cL=Dy`;;B$L~Z+Fy4(VQmBLx1?C`BzUg5Ctp>fxicxVmzxVewF7@99t~8
zQ>?Z3whX8IvnH^gtR#GwTwZ3v`pil2)T?DR&V^MFfybqGc%9m({;_c9x$HANKy7vz
zoZcm)GMLWxmwQI2{7~x4AC&)SHo!f6hron&Io!Z!w(5QfUk@+<wc}&|VCmGULW)ld
zgo2vnSRE(#78O#f%O`j&Q|RH??aY=ru)NYe$s~BA#Q#@~h9Wzz##@njbC)2$luG=G
zl*^JuKXQDH|3VXdyx9tIbqGQtJtSZnm-uqzMhXkNl+$hG-E7YpqT+Q1OYrE7tc@|W
zV4nYX{40x{uTN^!fJ%u})R#jDiT(|2C)+F7;C`{6M0=Z!@8d0Okh~im;JvG2eU9a}
za2=_<UGzD#OO@iHg*9m=c@&ow6<(4cQYYH9o(BFjg7ia+*9wK8sjNK$i>y5O{O3Ov
z$>*9bHQJp6cGfJkh#IOtN4xn;j8Kcm%^8)=EtnNPkVyVTiRAUX9Rp_*^0DEacSh1{
zB!?#Y{`%t?zd*o*8>k?rXtt0ekA9J0C!`^qY&KbdD%Q<N$sjfewuGc^f$MqFIo~hr
z_M2j9<S1_-n>C;LoxIip;*$`gi6KUlskp4>rrn}>Tpri94`##K)kfl<Ja22c;nbT<
z$8#2%hU|a8XZ3!($3RCHB;az2CmSDXWP^taC9}QIc>UqS2Sp(lUPu;lfB0aFX9S2U
z90MMy0@T6?1Pp2=F*F{CPJo?AC9L{+abZTz?yjk!!U9w9Jn?TVDg~jxf-PTf_d+4d
z)H<z=uMxZ0#fl`<=T$svMS*rTX7eJvK4Fh8v&@5Jw7-S4Y!ML}>Hw@QAN1AI`~HUS
zAj5@D5x4qknRnyo8EaZqN%WcGA=DH9%55!qU<~Z5qPwv6<f#2cnM(?DFiLfmCmv_i
zk=_3goLhkh{|fEsY-`Z$e0TiqsemW!JT4N)9N18vQ42<>451f!{)6(fl>FZ_Ml+)j
z>W>Y=t_+`1Lze%bhCCrY6aaaI7)!mD%H$q6hB9;>_)Xu*#&k;l#@jK}31Q>X34jiH
zm})z=&SyJgF&iIkIu+<(Z77dYz%!>{Cq)dLJg8{TOGqWa`DZSPPk!Dkq!;7z3L`pf
z@@-Te^Ijr+n06mX8jqYj5JT=%;TuP|AS}A3+>rE)psuOjKu0s3N{;7zc?}6DwM?1V
zuT5zC4{)*<brpnAft-ES<C`8wq0l?BobDqc0Hz}E<2gYh@7oBK?Rgd*hZ3;@Sd$<{
zm}I>J4AM-*-(j8+710@%%0|Z)6LM?q<ZqB{8vnC5Z0IDDNIUm|{U3*mQ#$=L5-U&m
zugFxkmE;k}`?mma%=B&wWwV(lVF*blE0D#{*IvQC#SL#W463O4JUVC}B#IGjDC8F?
zGiF;UTB-dwFF|tOpczP`(@GhEzn~kI>rAV0AA&ORiL9;J(M<Nu{%Rqg)vQ&b8yW$+
zWJN@3{#K3m>akM(8P5U}7jvKwL+wsUI9PYeXz(8AAY506NiZ5D8e~c)4=|_7m1eMS
z*mNlOZ|+|8PY*W*NPJjg<nZ1w!GCyM4*Ei~{q6>-+EPr9zSu35g%W$~S6q@g-&i7P
zXks+XqL!}@g}-?ZD@;|Q{Y2R!I~9M?EMl3)z#79n%y_-hynC@y0JX1eYJuK?)m9!D
zx)r`c!5XD#-57=?hq$=;9)Zx?_YD&o^|V$2H4=E#kpL8Tl&F-JkU-1p;m4FNp`xxX
z+ujon%2>Jsn}Fm89cKo1r$aTQ31%hAqhf~R#fGRX%i<wGo=Yq@JLZCv4xtjku2rl~
zr-68?k0w%~3J6oA389q|qBeei3MmToV>M;PJU{{j**vmc)+Yp5!v`Lprz*p~%?Cfc
zP2TAH>MkD+#5&z~Q!JF8Zi|%FFKqp|_9be+?*t%XqIA1<#<Hi}fao5wU(4y1oTPIj
znS7Z#Zolfpxll+N02CM#6LWS3dIHqvsV9&<WG2ktY|6*~b{bvg@8&N-m-eo%LmD~L
zkU2Y}Jda*72v(gkMU1RxJ1TO?%nwl<o=zta`d@t{A39F`+P2Yl&G*xnUu<ZWb`{8k
z+`Avkc}N+8$K(W5jNA(m^5H6lE3Fo4sU9BhPRhw4^78W57n<}GLoaduZPFfCUyZ6<
zKn0*V<DzZlC%lOahmB&qy)w>(?HBKyc4zjbVz<0ld5y<M8ygnVMxw}quKr8>RExI^
zPD9E6P)$Uct!6F*EL_%a33<h7RJI1TO!-#}>o&qUmOjj7phB-ter_w(o+uL7mCU1X
zrtsz#mm0J78PNwHLrlknm1JJsMW`zI+~%pRQ?}-`YL;C1WI!FUkkI5drn0tEEGFU@
zXbwyoxJ$gVT;%+GYeDEbD+L~Ig`S0_s7G-H(+t-J*`K*_2KmllTSG=yOQjZ1h1woz
zp;T_^^9^%fE*=<7(ACae0s56EiOn!rZII)&w3}qL{v%^g@L!&*^E}(?QLTM$_8MyM
zm(K7;J2@=QvBlvu%IHn%KQtD%^Q)nR*cL<DNc)a`?*p@==G9u_+(6_k1K~+0#~GQt
zpI|z1>dY}Vc(r7BCeiDxqPuG`V{`A<{=gd{nSI<dDA;SUyZC<Y@%E1G)@|#l*0v&S
zS(&t}%+*j(RJI@wPn<a|_vAfYwo;J#{x59Z3M>Qb#kxc36b>z034wnX8(q^;Wt<ef
zR1MX3wWh#FE{`+;m=>%>UpV+`EtwAd_%x3&nKTaZ07R^U-&rppk(fqm5P!_44>&+n
zHBqmtG7<8`hWg=dylF550}WS9zsZl%JKKJ$#Pc)aaJs6TsZGd7RMBqCn0w*-MQ8ua
zcVa*7^knq!mJ6U@!{qZdB7``KmJ4DmW29|l4lj4d{rGqNzxtY&s+7T-7i4E=E2P-o
zU!T@`J-E3Ndb3$A7}Ys8X6Ti|V!SO<F_5&S#3JOd<wx7LT@kxvrk?Yyh0Rwo=EsNq
z`jO?e&OU^f%k8|Vb!jMt#cZxppI-M9Cua(Oc>rk{bEH@^G3b%k6&;VUofkstpJ6m9
zq5Oi845RL8WkdOh>-P}aiB%7j{i~Ecz?QFU>l&3ETskFWXRte#tw4uiT_i1&!HqK_
z#SZ?3PY@jRUM&4lJRAk1m%=E)&A8GHHp>O10q-|!jv_1y*oQ$Jn%vev0^Jlp#6z?V
zW)E`|8zTWME2fa^TG7gB^l!=;z?n*_Tna4ETQzU08_Y#f;P$@*tREu`?H(AVC2>>G
zyA>}i*P47t%U7n#G*!`BoDb*pv&|!%;En9_g50Z|PjqfTO$@u-13u9yij73B+^tF7
z*Aiu>d>3%8qUuQ4^t4rKb>^6DX9G0xG^+FqZSD;LIi=voDGPn|c7K()O%N0Ny4f(?
zsyy@#xHKi08RLTt4Gr^e8-c_5a=~JureOWW6ZkFk2Vf2$-=y%kvrQK(iq25gets_!
zKDNM$IWqJ27JPL%fKM7ngJA!GPx3V;((^jm+HT-t5WJD0vD|F@Lc^J1>NDl{Tq}Ul
zq`_u2`!6<qn9Ywgj10c0dqP9svV-7~E2C~X>p7`Py4_E~_{`eyfNntQTKE6uP{;k{
zXeknRMOTw+B>1Pc?@{wb$0Ty8*Es!6$=pJD(cHQWjxH%r6W2{H1sTq?B0p~!dWk>I
zd^scF@fN1iTQ0{3PP}vGl3kQPbYGtNQF3#4I1NRHzt4gjQI;^#VAMAeNbI6%na?2O
zc|*h!fQD`@5o|u)nsj@9c!=8gT!6S86HVG~GMtWNqUv%?r14Dq+NWks17sZU>-S`D
z_fv^jPZ~_x=sVtgj8b~FjZEHpnmBjFC~^ya?BC$p=0uxWB>n*hH+Ss-q2?%{wh^v!
zSlH~G<K|dm(RbL-0cB!6I=qBzg74~3@Z9YgqB9Ps*^VuO8!M_*xwsE(wl9~4T>l<w
zGs>DDM*<@JW<6hb%$h_8-cTvR5o0vL;TXlT3TbK=fra(#Gbo=uzBeCNAWkP1^g5wA
z>_BOq+2DE(F`qtriBLlWqv;{q{>dvakO=GR+uf`99(o!8(PjgP_Ru^=cPLfr9ane4
zBIQpbN1i5p#{e&ltCl%&&!ohig)8M;9a)}of|~am@Ye$F<pcdNi&M8}$3dBsW=xeB
ziChiD{cs5D7Bbm#G({B#3MhUb<VrEq)CNf4tH+q2I<fp!nT*ADWC(I^Y-I8cZhWaY
zsb0Zu4~W|tEMBvvyUEw>vl?-9BcQ=(@<A4Q^622}IqjEX$TZ+}1%6?f!3Fs%)ZHSB
zL#dmfSw<1@$$-QJwl_G;-P?&9a)B`F4CLg-KXyUFKo&46=j9|BJkQrkY}QL0VYd4}
zK+Qn2bUt393elkEo>GD=4ZMC{o)v@M64XjUc+j>QK7-G&$lcXRQr?<&ixa9?g*n%k
z?!A?^mTpN|lj*{I)$C!q{oiXpgAfoC7)Rji<q%*wRZ|3m-pT`3d^$T|xk8uE4Ty4B
z`J(X$<Ee59ex3rkj~WVL4AGKcG)t9s8>yf`8<xLWbY)GK(swm^G&aaS^cojSI4KgP
z?@@k{X(w?b9XS`$zz#dh+3$VUKx87B8k2nSWxv`t)wMB2$m<6n+q$fn4734X#*&Ij
z%?9iI+lvEDqgRbS!H)noFn<K`B8iToU^4-ribbBJsE~M`9~%N#M!*HX!r#C3T)#j0
z?eyrR&jvYcUK-u(PnS|mXHH+33?)Mvi9{UEHpN53!fMPlEm1B1<wNc(nGhNxBdq92
zb0gsFR8fO}2f4k?X;T=ky9obEyaW(Ym?XH8E@GjbQ5(+UupVgQp9k1@bEI<y@=(XD
z3)sIuf8>aQg(-4oY$Ti-oBzLIUV#6L_m|`Q52rDSafpE|oio~6U{+WMvjX`XbLY%*
z^QN_nEUIM`As57ESTjd^W!`B_gC83oeAXlO>+0dkhXvejKR=N`+SLUCzc^LxYUtJ|
ztcX2k%MjcW$G1T~oLy=_LMwGuPEZv2?&Fg%rR(9!-^_w{Aps{hNSlSPQdeZ9@ie{N
zIR^AiX5!Aa-q!`RBKU@5qZ80oMq(b7>{cqg894hA)mQ9PRvRz@kTo2^XQ)!?e=7mS
z1KH=&Afha`DDGWUIj}|>pt()dHeq=3$h2G<W&e)TEc|Vl*baxju3M%h9Tb%Yz;~7G
zk*EgDb;_?A?L0?6?hfWcYCc*XHx<5q<I$cpJm~TF0hfffQaD4<o%{5H#NeK}fqR6q
zldWc7yi))*o)4JkZ4k3lb}g8`XrHq;_-on_x@5iNS;<aV30o%Q_d%#9e8GhGVGWcK
zbun3Xn-#L(9UB!qO61jfyA})Z@&qTIgATesJ*7?9v`rq%nH*M_{}LK+*DVnk+Qm1h
zJMd-2QOFDue~`o~T=P>DipTG<yGSdA(X1_e=6J4=Ue)HgU%AB|m&yxsjf{A{8Q@bs
zOtX8`8i;HV_V@i$`V$=8Ccd>nbVsazvESGj1%7pwOe<ejJ(Y{61*P-fZ4GgTedG>$
z?G{NYnKTxe&dFSw;j^h-ttOvB5T2?X6`8P+U~X4B@Y!fy;XH>}&;4(zg7#pN<^M*P
znw|E)sLN=ZjM1a_Fn7wRmUg%GrfD#7Yyo;SBRd$cOe_DKTpno(bTX&#s#gcoXDrBa
zTJPjlwl-022NHo2p8*98^-H#B67iAtW~Wu~<;%w|8F6SB&3E3A<{o5drbh#1eh{#u
z5CZP7sZ!2U3#3&W=h0rX0F2-5YB}BtG28YIJVW)(F0o3h`RWg4;G_*{_~X9?CSnh)
z;^Cz4-(QG}v5Tn?uP(3<zkbd=zLe3t!J9V9-iObZ72SU33m04Qe)^;#CXDtGHFO|$
z6*=92z-W0uOVs71p;|)R0=vGG@@=g6h^4UG=+H%gK*Qq1Vv5;yGO?lh%JI^5^N?M9
zO6+)XtDb4tzu(aP2M{r-`_HqJi^Y<4TJ+4j&YJpa7`%v)w3<DnGngiYkeFeZNtKLq
zdweKgXS|FivRk#p;fcZ22bY2P!t_L{x!~i_$)zgcbKj!*lcHoOQhx99xqsuR)@GNW
z*J8US0F^=n2cwyXgMpDJJMi9GHgWWt+po11NQTP@oIm^&@jb$`X(dT;*A6+L3<qHE
zPP#MvQ8OL%v~|&FmyeV;pkl)G<j9{uQXMN_(I1rxYt5dnA|cB#z0wbxKTbh--LD=*
zYWRIltei^y{{n#A0Y0~4^zUM1@814oS5xs0axL*#k$QE~H$d6o_F08(C9}$fmHaaB
zwRyd>X~I+ZT*=$wkJW}a%JV}8?xA{jv*q5VduO#*i?ceO;)g~U*2+?rTdtdP;xyh{
z@~x&MOjMc@1QLs=omitij*xGyq!^f9tF3~xLQ9`f8~&nO71{l4#_}>D=2>eZWVQbE
zA&+;oKZ{GVTOFgn^DC$_w{!>3i!q<g+;=N0s{>{r<N!hZ=Xud62LWmIU7t;OsvJFY
zbr;!&i_LOx4L)OxdQ;$4Y+3X@w|uGof%1!P#k|7nYZ%;%g)eUkC_dHIi=WGiHA1+a
z>JO1?#kyXST1J>BT<C0u>*3+yiK>?C6!N%Vg$2AyrGt;3E>+FhadWN{8-4BhhWR{O
zuJ@Kp83(Da{#N+feZUfPKqS-aF+FkV?}OV|TY^Gw7OU*q53+N72({ey9$|Ws^---|
z6_6yb)MOOhb5&cYR7geDdHW+`h^1QCVq}aqMf#*HI<Q>%mB06J4mj^=@1@Nv9M*K6
z*rD+nqYf|glIPlc`Ra;whS*-$Fe0ST<5`!)X_L{lYPr|Q)w@plR3V#OcC;y1x6d<m
zl5))E_ta#FyeuU#-}zI;2kydLefZ)N=^QvJsW1hk7w6Yhw`NChR{Ho8aKG#a8rQJ)
zjCb0%ciyD#0!2t-rSE4plPP}ccQI^<d(@p+2zo(roDQoE#Pb9Gj^3X_V4a7%ySSXC
zOs3IQ&*B+utljEmRjIX08fiK?!}0!aVhLq(UkQqiPlzidZV@n3;fwhu=#S1T@Jl7y
zHb7GbEwpScF4lUCw@Uh^_sLU+9c^Pz;|ufF8>BqOY#}_YN({%7i3CzoQnF4klE6ci
zWfBh~7K&}ulTB}92x&gy`$`>nYhLeU-3}8?Vpt9fRKmKV=QTI1xJi<lNb-z{1uwU{
zvap)!b;Pj7wgH|ToYM-;YA$}Q<Rtmb9kRNE4PdHJmgs11_Z?6hNvD6B-nF`NS?><P
zDru1ub*#s1;qj%TKLcS)5*HGb<+u?sLyLem5bvK3asUvvT9H35NK?}IxReP%d<7si
z%5OdZA&RA_wsrhn`jRQ^)YKBO$LE`zp7@Pb(>xgA7bQu(j4Rw3T+ZcWuQzbz-j*vB
z$FegN=11)4JPb)yK7cu?*lhCSMHaY5#XlohMhq9k;!B4SeyT+Yonz7Id#U<oB!wj?
z@GU`!ucSS>*tda33Gi*}R7l;;8AgqRi)$aUweq(R7UQ;{Pv4bP4*0y*Dc9n3+>I@x
znDbThxIH&(*)&Z;lX|oHeR#SsV26lI!}#222CPJCln8>3PGG>IE=o8;@TEI@Yiw6*
zG2nAvTA@0SY4xw1@TCZG8+=ie5&2wm6!A(-g1q&d3n&i%NEY1DUV<s2!SXJQ_io*t
z&f>B^2hV$%R9Umm2Tt_i_DUWZayW(ezEj0}B&NkK*G+(@xK0^`B|3v%J2FRHaa(=!
z=rl5F0$Q5ZnX?K$IuaTH5a)5PZU<puUnvCG$JnQx{K(E-m~n<z6h+B#Lo|q|=?%Yt
zS-iUNuIExN*<Eoiq}jUIV%$&X*Vik6MK>WgqH3*9J))XGhcDlt$UnM0&y(x7nCQ1h
zg{|bG!3ZuG)-uHw(cIq_@hw~K4@8&a^j%Q$>FDUeVL4~*kM>%Fi7ZtrCSGVIv~^q3
zY9o|J?|zV%SOYvyw!Fa00n<u7%Pu?{Gk>TJwp#d1RNpe31B8L8b}J;eB3E>dc^CMX
zEDbv*$FF!`I`(2u|9#U}Ngg8ZR|O#>Fq?>3^NPJL`H{A|8}C$(E$}zuGHRZSRa(Qj
zo+o>^opX4Pe2Pdrue9bD?J^DF{l&u6;op9uQq^ippI?8pIuk==I@Bqpn8W?K$kjX7
zzl+MCh9ZT^)^f?(Ywx&!4bN&}-vP^g%fu{-SbyDq;{+5G7qju&Ms#T6JTEvM&-=ex
zGyGxG<bl|k2gCZyI-iJr{kpP<(}NW_KR=4S;Gir5)S@$+R5e(^y*%<#kIS)q&2eNS
zOQ?P)UIGZUFJNH;<RZD`;xHFC;0+GPb4AVi>aD)~{^8Z^c2rG_i>6GIk_ttoen`D9
z>P-}tEri-`+bJ;BeDPjM*D@qS(o%PmLIs(BSOv{R_;%fZxx7Pe?eE`?_h1z%Uh#`U
z$X|TX)C@(YD{L@@?$vhl!eAX8rVSh<N_c#{v+-pn87O6!>r&cJ9#|EtR7Nk|Zyk3M
zx%3s-2dUyk!Zo5_F337Bqxc@PfO^1U*1!3^5@9+{^e(>vEIC+2axM;LEf6!P>EVBh
ze9)v+G;nuH76?ET-x>q7LowxqQ-EGrWCfV|u|i|9LV}@}Sc*2-Y*w_m9D#CByi1wz
z^GI4uNv(t@222aMs4Rw7I_-2yO&f2o`dy7AK{!FzWWETyh^RhzWn~C@zxH;GvxySJ
z64J<^k(XtP*Xn9~H32s-FDvvhb~d7z^Zgttop6@FITMC1L5fw5mA`!%vq*It7zVpv
ziF+TY3}SymX+15K&kbz$4~THDHJ_$N;@fyBHZK7?AGbAG2y1@`8dM$IQt~VJJ~v;h
z7N;Y!swtH@Q0CP24POUc4{%sGD09s9USj8I<P(PXyfq$(ANS=_jFCa^#BzLnMR3$!
zc8P%<q+tt4#9EI^zyA+MSikrR<iq|9AE~<$>#YTgpDq=j@q@Y!%3-T$PG4ylZsE!Y
zupMZeKT<5P>UgwMD7O}VclwT>0;z<xE3rCAR1&r9GqJ$$2Q6)U!$i(fs?|5JHv)&u
zN#R!ofqU25$R_ea8bpvnO$+Evqh$w^BBt)MU*9~&j_&<g+xWIx+4)eU^vhtOiboWz
z56@~ROZ6ZRUG&Wg2W<NBZ91;q-<^h7^Z2(Cx+-gx{A7l&%zta;|Eoq^$ROp>zjylc
zM;tf!UuCnq8kb7s5b>M=)NM?n^d2Oe-^jvXoYwQr)K)fOxzy~)QPJ8%-E?-JWoyld
z+W~Y{|HJphf;REpijF(+R1dgFn{Ye{a2P~`n}b=Pa(KvX;wq(Fsm%PFEo{Ab2O+`x
zUY3f<`Xlejk&a7qf5Z5&5Ly0Chd_k-jGxS0d7EHeh{507=ei+3rEgsyjK9gOTq5~s
zEHEJBu~+s=M0j3<^(3E{XR=##BDI`}@QRfx*jCr@JI)FZ+y5jHj>Ro3K*5w0S1>&5
z^tvmjZTzRzN%A)wm_;`M*apW^6D8t~i%6vTs*29**(vpt3D+t{^nzy<v8CKMl+0%5
zaumyP_F<2|o}V1H)4~J2F2;k1^7!fx^8i;-nwJ;BRG;+fydd^NT2y9naEh`lZb(3>
zb~luY@gHeSIw!j(`gV)UNB3wptL1XkF4O{n0I{lEWgE=2qt~SW;~;4UyF=dhs3e@m
zqYJ5$Fd%i6ZVvw9`x?*Q`VJP>f1+I5_s`!0jiv<>a&m~RRRC$!y=XiGEixuN=Ak+y
zhsTpCFqTQu9j~jAlhP(*$=6mT$$Yv<B!NaH=eHJBX_rHABk?j^@B!*_&hIg~lF93F
zS`q+4+>DD7q1GF-qnSsHDw&{IBI9%LC(smHIR_kdwm8)-l_TEV0>v>Ij#OqJ5E{!_
zmR%>E+befs8JDZq6cn5zo{>-Vr_MIB%;*j#;t?!@(;uc|SrCJXjVvr9fWH~!dt$m;
zE=fEl>3UTWca(^MAEmNdkxWkO?cJ+&dNHS;LC8sDD^ReAMZfbXhSzf8HZ`Ne_4)Pu
zH7M)#L|vmh9v|*B^WFrkflGN^+j*HzsK{LW)IuqG&x(p~%*LTX6?%M}zq7nt)*3yw
znoXgP<zl)}eTAs-knUnwPKUyASm4Q|pQV)DiAjmjZTt8@E2t@KDx$XJfKp0;gVF$i
ziE>z`*g>!*`_`_MsxpY{&7w&;el(l#heIZm0&7z(M}WJZ+d;onCU3e(xEPMhsnN~3
zS)Jv4EYNoxP~x$THc3<pFB7r!o=TWcsTwbVe`yZUBVoJ&Q?uSOJMax&iDK-FF#AQ8
zax}}TvR4bPQ=+v|BS1x!PSU;eAF^Tz@<Kv+hd~P~?1O`x|J<X}5t*+IrzQ-$^TcI9
z<*oDEt-y#YX5*g`on^^WbX&thDrZwX3ea@aZU0A9WMD!6VliQu2sO4rGPg{*Jo#E{
z;~_NH>RMP}uoLP_SO5Lzy1B7{;7|W95#B0EF_;7f#R1>loUYv?>C}eF&<Yg`9h*^{
ziY5Y1toEm>xtH6OuN4|(9J6PBe={#_`}hob@ZC3NtgqXQK}Q@Y<ia@~!b&%EfPJIl
zb!rysSH?e2w?#=k1{(n6G`u?+uNWQcs`si*A^yf%gZTNpf5^>%Y!3IY{cgYAw+6l9
zZS6`qm<Y_pm({1Q|G^ri`p;h9ZcFwk=265;t;)<V`hKFP&+uBkFN8$_D8*RtMLFf1
zfG2|(ybC2dM!e)DE9x4mQmYzCiE2YZf_WJt(&BSv((+b&U?Jf0(x9!akg_7OI%ZtG
zWp3Qi0W{)5yJrJdzE$e>xoueOa_3aY28B#mnIfND(A3GiwNhQ^MY$smkR6;3l~8~=
zN2O9pw3c{L2CM5MLh;GTyC*NhdqzYgBv!bsjW5J{&-mwq-lwc~nw)C`UBe|z!#{(g
zaw+`^GAFaWtKH?KtK~6kXPa*@kq830A~q;rIGx<t4T~()-RV**=LD-sjm35$xj3y6
zmydcz9JK(Ck(Czrmc_rYD#oLUWFHVmh~8vA9Wx)@!E7+FP(;<^c>L@gj!*ug$mJ|~
zh|+FyWV2Ak0;}2T9q12dvGx!!rtc#3G8CSHKL80c%gxaok*RTM!8P|iP>vqVJjw8V
zzZJ&9ybj0XN<P~eHl+R3BvARV`S-+hF|)-;%j5G~yroS0!uEsAPo9yym@S@EXLL|&
zI#EOqq0>-;rD26`Mk+i^XqFK-ovqzmCv>y>v?Et1i+&|a<$A9N`u6yL{C5;mi3Z-(
zv6~u-O`(#pc+Br=kP#?dnS1Ni%UmN!JY94J3Y})PPq`Ma^eF;oH-q??VYVp}nw5<B
zE+Qt3dbGba`3D4Ht!$IhxVoVPnqYyRACC@g8EDV~(^UK)T^J3rYnm}IX|>`@W~}4)
zU^JtPv&u{2C5?N#Gv5+?l1u;OSOh#0v6i7nqx#H#dU%+a!l<aIXKvRlu4hKLJPS@c
z-(e*ji4TDZk~~U_WKO^sEi~1Q`Pso#Y(8Dmo45Q4E<;XDsgd_~H}`xaif`cKxe&L@
z3q?(^74~*%2BflpOCwil7v>l+aM@?i!s^gCVBM%tLCzL=jaJ2Meumcv{PFaVDr~s@
zS~;?rS>5Zt-rfmdnG^sur#Jf}u`%Dn`Q-lC!6lG#e%Bt&D5+{-e%U&OOmLb|$`nf`
zC)WDoYrGAX-_936KQVL3$-`Dn!~k)`G`azRV<Z8Yk&(M;^nipUncA&YZ<!L1Q_jm1
zEd+^oGV);!UaBz}o(TSX`$v}NBK~`askc7L3W0AKFCPwFCT|%Kh@kX89^=-aTe4fu
z=~caZ5k^9-Qkx+qw*{s-cd+^FPZh@{56zY5h_?X!RP1h;6NZ)U-KE*$5kNtqsCoa(
zoe)F)^1XIFUB|q6D^Kig4R)Q7!p9bYCjE^zsd-y~pGxa-HYz^PJrSrSaE3aW#o86>
zHE>hKo-{{uF&hUbGw>f;=$L~60r0t7Ty(ap>AxDOPC#nBpL#VZrnG?I2OWx0D3c!3
zeyN21M!x!fZ24E_KPC`?f$j*F1i?1yb<esIxs$@oFB&>E)94R*h|GKz3#O?O@iIug
zFTbP6LGSGQr(j7Xr$p!f8L+OW5SOixP8J`Z-5?VR2*b!>GQd+*9eRWgGFx*e8q5NX
zDjk&~U3)U=_FHBT%*9nP`qYnn;OhFAb)v{dGC{*g@`Ak93Ws)O5)ZRndoc)1(IU5s
zY|ADkU^4r7FkD-u=bmSf3ac+0^bhUpz_*Js)pDK3aLLMUO*Rocu2|QyZGKmMTX=!X
zIT&M}lURv>zciayoWIyiurxa-(8J>O&wj%`nq||j^o)Zl`EF%;2`)P4g?wn^bof5m
z<eC?Bx~3W^JrxTyVvZtdQ)ty2{nnmuoY-+WO}+`6O*aGv6mpDt$L;=n?RCT11U(TF
z_u2GP^JLJJgU_|gmS&x{_hR<@U4qxWS#F|7f;)}e(~g^IUnD;GE|QbpUG8IauA$%a
z>VNxKE-LF}enffaF(Ukb-iUm)s&$9ki!0rpqF}koVI1Q4F#7_jlI?SBEzN8en*Qpb
zw}d$n9rr?zM^38aUg>66#Y*b{$WPz0_^zKn5zNDE{eHs>%e5iE|H*w}S6(1jb#%AH
zf<X!I>UHKumHnfK&Rf=)TD6M$=I(A#MvRJr#6RY+NS5pUG0W!>v3xb*O_&g~i9B&Y
zMY2m%VeAR2SGr#vpDDomRqwxnPbt$ZWEJ?)6JsYVjcQ&2A_Xd>;DqE+O43kwQ054H
z>5ehs^Cg-vPa{H8|43HgFdGFc87ZBPyKJ=kMi)?=m;5bX_`5xv`xSawkwU#v?<-az
z$b*H+Nn-|*tMPd8wWz<BuY+v?tr}klvDO0dB5hfOS0_tNERbSs$3FuJG-v9k*Wi*%
z@TW2_mzS+hJc+Tfu|3qq9`w?t3*s{yE5wfAwtJ06v$*e{D7K!AXWdirDLBa&J%0NA
z9^3@IjE#LHc2+HkzwCU?x)Vesvv?*WE8rNQSK9GTY#P|XNKwiz;Dn^o6yZi$lvIyW
zfY?*s$S9Bd=+{}D)ncMbg^YZhFX_kl%w<+Edt@tl9?mfZ{c12B7vMUPNG*kemIQcs
z@7*0xJgWOEn^7*}bYjtT+m)4RHk44t_9J5g8R1oT2>Jq#AV2w>xoy>dR-GTv@Jp>J
zLP@#hApwz(0MmMhZn@m8^mJ6XRGFfuIVMfU+1T<-mWCZf60-Xl7_J**Reo3i_MKn#
zKh!grQ}vLx<{Gx?#;Y%Glauo8gSPeiPH+9^zfD*NUD9cjUeAeBPqr?n-={EcS%o%x
z2ydV0S6y(%zdcIHoUzIydTNl*p#N74w5lVA<jpdTo*SD}y11`_5sYj}3OLkhaq>B8
zGLOkivORIx<5%AdMLWpijen*?r2@x^?w&>XqOV^ox5*}dOBm)eYM|%<WcrpcrVqh#
zQr?Xz5iE&1;0?GG5^;Ovut8SKt&q&;TSJTkZz#2&Eu-3%#*1P=R`J_pfBNDR-+Ur&
zOC?R9j@3zq`@q<b9ru)G9b4VW={<V7XUi~R>P<^8U`kgAel5f=KQkJdhKt*lF*Oo2
zz>wN#?X+)Et`k*YhrUh8F=<TGb6wYQF9K4#lFU9@DP(5sUKcH&pBtKb3Gkc^;}{+V
zPG>S|@}#urArPRp{QMEmKqSu4F{askBisA`c_NJaBKh{(kXNxaU&A5_SY;&(oyMV4
zal%s31rfKCBjwD93Is4Q@v8WrqQfi-Rk5}j3;QXMiB%HMbivsv+T06s7ljhHsp=4l
zCBSq7>Jze>;Pt0s_RmXdwW46M7+*24L1|KI?<bhCTQ7+LRc|Km!9+UntN=@+M$wF~
z+6_3oq_#D@y9O{(nASc*_i+9fN^oRT*gCe-Jp4U&Mt+vBCeoQfRnI~DAb|p3Mj@M_
zwBmFGt^x#M+~A!4@%tJ}J7L?m8{!Y1dmhk3n~lqRPdn0UHR?giXQ1+dJJx*jmGQvq
zxaeqp5)zU#1>$J0Kahn)trR;?VXPm6L|)@eRRUF?QW&psX)#KM4fyvxcC&+O4}JV`
zaBzwV@CX21>OzP`uSJ>LWZwb#5uj1SEGH9)SkDZGz><$|iFl>j+^_11d;M%R3Z!r_
zyNv-<=!f`mDoY=*8h~2NOnUe_n1cFJ`@>vw9C?>ps2&~>5rax)z7^~%U!LI0%WxLo
zvZ{7^^=hFNO+z=SN><XYzW>Pvi6I`V+HJUWPCkDMxeaDfJ%ZL=ZIlH>W(;|&6y~qQ
z#UO750>1?LoLh^vTkJnZM+4M-6S~3W=GsEIi?TkE+84!<z*33Z&~QLXo`c7k65Q*w
zQ4yJ*ZTwJtoZijmX0~d&fDp&Ilzy*%c{*GBx1y~YBY`?0AN%&ARx{_RY+3B-&McSv
zB=RgFW&c;z2E`uG(@qU=7>zk#sDCmZ68mc;+Wg!+shI(6iPmoB9((@fcgOqlk(@2u
z=sNQiNl!PYnaCqf@TL!tJcrA9o+e`RX+HM*{j?uXUW49h@Yy!AZG9L~Ai4hSQphOO
z1k~apVsH8}`I`h4oNmqMb7CfW@lJ=8WdF!iP|Vf;M-X5XC;cC%;gHEV5D<6L;eT>t
z{;(_->s%vpF>r2av*VBfxYU>p_F$#EcJrx&;yz;!mdCaBz<x|+&tr>LRrle4O-v_|
zMpgs==o73A)}?Xjr}z^(1ulMV1aT3Fjw1S6f!9}AGjZ6E_SX=&UGgsy8bw{t0z;RR
zp|_6q@1(G)b-u$7dpoC~Kue*X?T?qepRUjpT$Z8X;^qA+(#EF!*ZXKXsYnj8gCsnx
zB5N|LDMb;P|K}U&U}6plbmsU#cjWp1=X^j27L8kRNiPo(p<-l|`p7639T02vHh5tI
z2STiMx>p#_5+qmp20jla+O&u79qU>sf?6w#?>jtv{O?q)UC3~c$(3!62W-nUQv{&b
zNz9h(<dO<Yh}r9yn!>YsH>S%;Blau#(kXq0B>UrVyD$!?7`jgjssM6YBBZ=zu34Zm
zpo9XxL?Q%p>(%)61vo4+Sq$-5qWKJ$r&m-??XWlT0eBzef@F@KwS@0qc!SGn=b#sH
zMHtfj0Mjv@Sft2AZb@Hoi_I#puUjP#NJr5qzAYUo{Zt;=W_%Em3Z(Nqbr!QDnn~3u
z<<y0wbG<zu<U9m&-nqQVudKvauNV$aIYc-!1A@ZZ(vfehVbA#dzi)A{d)*g&4U6#^
z5Y+?uJuQ>>iO~BV$Wu~nHc^8Yi7j^q5+sodDCQywc{HeHEGU+3^-u+?40>wo+1fT;
zWD{*p*L%*F97fIZpYOC50}%u;ki7*%u6!WyD~DOtG7PNOnoS0R^cv#^Q}FtM|1mnx
zfXs)DFbvTWhkR~9AmHIYB7g1xeoM<%HEv8%l1_*Li8v$ZaWE=v6z{*;|1|NX1AqE1
zVg2d~0H;Iqe?NMv3>a`4bt_{og7-*jbNlNn@D)sEVc-2&EWfdu%siiF=QG~{I(i9U
z7?_D1-UmWoQNFKMHtt-?Garb`vb4RQXpl>lP(irl!NR2z=svw=CWSJ%`gQ4<)C`Nq
zB+tqq+W&PmgcA`#QR$ibe3%@dHZo!B#JU+6@r)ppjmM;x$`x(>9s7;3i;HEl`>tF4
zROjVn@y7e9@4p^Ka@5k;75_Epr2WlE?8uPifjAzQmH_q4!*geQm^1E6ZeN&fy;>_Y
z;62M~%{L7z>|h#LvyQ>0*D3flxox5RV+iS0Q-yewG?<c`D#lA{`w0H!?76+(OT}gZ
zHQ`A0!-zZ4_*ZDrI=ymQr9Ss#nxEw6b_LReRJ|L(&ct!vg3fBLl+?_<(!1W;@@l@R
z!p=WHr^)%eAG=sgf6#9Kzmz{&+L1y`axx|Sv|`<08+Rpp0s~$#0hc|nKj<Z$>ic4N
z(cB~sS+}{>?G~3G+i~D0OeT%q{8t6^?d{gc^s1+b1)F7lG`DMye@O@NB(S-?<vT<A
zliT5ZoOi)jfoY@x$-><E^MV>314C$T9T!I99twtOR=2x}kbsT?V_g2n@3anYnX3GI
zy5@#69sz`WHUd5`ABlwUyong&BD=|;BByjXdm85iEU~E2>mo}>ZQ1!b-@D(P@yN-5
z;!4$V+xt+OC$B?UFp`;hwie6fY#lLG0Ck`&y;exBGVPjsRPrrH2NliCX9%{Z8}L$i
zaZ{1$Kts^+?CYgb$tzPJ;;<zK;TE!zKVzWD)Qj$U!L7`XKnd(RY8lYi7UWh&%DC7y
ztis)v34rkEcM!K4V}3X|9A&Bt@RpK*)vsWhuDck3;!E}f$95aNsPPd;DNKgFWARi}
zrLjN|ObCVgiDf8^p<N6Ziz8c=EG@qWgqoOW=}wz1sotZ(G_k2fTlxvw%Rjbmr=)d1
z1WtS><rfggH2-B<8omt#I|`U?54RU*@nv^7bPLt3u7Azt@mS4;Ivy@l3-$}rQQo37
zSj>DccFpF2wB)e6kY^pfo&>JQl*GqYdqI8NJc(NQ%kamW9}dV}<t@E&TVbK0)x=|d
zjLjCa^evi$U&+3!`U$U`!1>ZGjLP=ppc@~?oSmkH<FbZkC6^5~IqY<I#ggtv!@a@H
zn?{X}fk@OFpNDbVdW~lAD3xijYC`6t{tMLG;(aZhHKZhYgbP5hx2hzbul6l-M|oEJ
zDFBKNTaIn%x;z|6g3;N5B)Dy20r^=H9Q<FTjchJQiiq|>tMxPCSg2}_5L34Af*@^?
z)M6)uD`meQ(YMS?Q^_dzS%EGb&N9y|m-3FqE0N7d>lyAMU>#GDo4f(SKtrWo)A3eR
zN7KcL60Ir&y9W!XxWxuVtnLP@$uvUi@hR#w9%K-*p;$PIFdchU%gpa;ciSz0Sv~Y<
zP5KY^<WI}4-)`XxTC%@@%|dIsibn!7ec(pcZ+_gl4s2kB#}8tQ$jI|cuO$yBFhD)t
z9wx&j4{jM~6flw3Kbi+-pPQ54@*01RMK!9bhz)mX9*T@Ya=z(`5a4{6TfYTPMD}ia
zBE^EyLW^}x@f15lIC+=G2Ui@-NUNRyF17gcEiC>Om#p4Lw?T>YPYNw&(zvsQ6kPd7
zkwxHl9!@vp<z6KM*VUAws9VQ*k{^|XX?<*=<^7Knh;`~YjprZZB0%W@Gf!Lic~m>g
zj78Duhq8Wpj3pCq+C0qS;leEC(9t|7*MoeT;)@L@iQ`Nv93r$FN?f-%lS^&Rd~`Zz
z0oy$KODLTYzjFVr4zxPAutzI3x`QP(%_Xo#z_{?gtQ^M|>J0l6>bUG~D6rc!f{-TP
z4>x}<(-#eVS+O7L^`Whv98z8UWJ9w0%U!ZxnK6^_s))@CWV4B(6<Z?)Xr@6!UK7A}
zZE!F$%Ar`sQEI*RPhe0DH83nkV77j{MkJK!(Jp~P7A8?$(9zKm?&q?<Q@dTj!Vf0h
zkC>_`J8Z$#`w8l@nY?t$iePpw((c5PpV9=cb~URY)Pqv7-csH7n+14Fbp8L2wYQFn
zGV0og1yMkxQxHMA5tNqh?x90qKwyUM20=;bZlpVh?vj@725Arwr2XzeeV+II_x*iq
zv1G}DxzByhKIiOxU3*`<q>VUR3k!x<kF`-+pgImx^U<9LFlsbA&FNCT9RQY!qk8X%
z?#_9*4k!W?Mgr`yg}71)lm3Do7T&KHV(R&?8BT%3mhpvp`^ijMSenp##dd<=aCG7~
z5ma+P<IbSI));7>4FXmo98pplQ#S>wjBxlIpOPTe0a73D_0MCteqXF(S}fF65U@}_
z$=0S|;kK~`LQjUHB1)VzH0c~ZltccfkPYN$=jku&Vx&KD*)JZArIvD0cmX0~CoM(Q
z00>UM=aWW<mZO6O=nK7g2gQc0meG2yT?Emlk<+z)^v|aMB~pO5Q(%U<it(J=P&{H1
zHwXLi2=^S`m-bV{vFq}8of}ozWz#5@YP*Y-U^I9|VvmU~FOVo08iFW9A<>vk8=H0K
z!-Ro&k}IE#0xe^|YVsk%tT9z2(jeqm(f*2iQu1`}HNWsR;GEPb)j!T8LGr>1j&1LV
z1#%Izu}#B(PzKZ3_u*5#@JyIqp&ET`D0yWFlva$-ipt`3JLp3o>0ht?h0w}c4x`cN
z26N^%5yMrJ5KlsO%Vo@g?|{iX)r33yll+C<RIOQ;-|zgOuo6Tq&?`k;$a;6<mS)9f
z{#-8Jqld=@Wi!6{y0c>h#*g#oy&<#02Hw}v68a?uzXf(jbDAH$xW2m#U(&fr{LW>+
z`+j!#{fiwNB783)jNQ5V<^>84p-|d(a&KCNH0<ov5xOh46sK4gpf|O-y9Kid0q@xB
z%hS&A)^82z-qUus4&e%FwN8!)M8+aYtfNK6a%tQtc6{W@mXWHYT3U+mursU`nq%O-
zm=$RmSwb6-C5xN6-_i3LCEwRRHtBx=W_i+zZDzwam^&Av(F98TqXjiHaaFnMWVQgB
zf3;C{wA~+D#O`5=4FT$&?YDohCH)#^M_VxPQqE_M4XOSyu<c8W0{bcon#2utwZ1%M
z^;2oMBhAvT37)7`tPSnxJXXbi1(yf%desObH#o2?7cv?2PmD>hQEjZjeEZGkg=>CL
z_wZBYEX<pmfun$#5jJMsu-(|5*(JSd<0@`IXb3ur`HLe_)p+PW+b7Z9nf*7z&NE}%
zxB-qmubj!>^M=?@jg1d<xCrfkn|t6R)j9A4w`gBd9xQu{p`|~20s|<((FYDIHWK9=
z=Ne}LS(dfK2gOpb=`Y6b*Q#r4DpYiqzhG3pR0ON@x6f?rv#~UqE*?4TPCR2y*31@g
zyg@0dv_P0yB|vQXmR7{h-p*NL(bd~4yS8_wKJb3B0e#~rKIFzO!X-cBZSn`NrMiIg
z-_E-J1Zf2{;H)!@P3#XpY$@(Y`|112qh?uOfRv73`352r3O4tV5{pDe25g%eF)cPF
z%H1MA&Al6GWeO^hX(rgo@6!eEjsJ+5mnueb#oyq;%JsTE)400YD=T4%O+?bs^~h7g
zvRZ7Yd1R{ye&WxIWdmG@jGa4uo+zh47c(q8jdwO=KtTdx>5@<w0hQ&%!-y}?XZi0%
zYH)Eoflg0M%z6zI6q-O8VNM})Igi&3w=h&$@yX+~WG-uf^pw@^vUgeuHAEYGE)`k0
zpv3qH0Y8D9jQqFXcJAOx`v>#k6rNqBDq%aMOpI&}a2lX(vb)sGhtH%Lkx`9`a|U$Q
z%~2TOJppJ&nYE(tJJiUf4@Ecz0TfKi^NM>3aa?xxTbkL#!y6V!z4&+rZ7LCW{bom~
z^O!h4i$-aRIH}m8j~i3q9eK;HG@t+p)Wl2u1`zFtyQ@7`{FrYbA0;#nb1atDt6j!}
z=g;AY{Mpg+at9_dP!3HB2o@SAc?0rA)X#`QFug7}38f1I7}x{%`^k^$2-2J*W`!9(
z88PoNKMhP&3h!R?|4F16hdDx`<`MpazYzTBveRCx#zGw^c?c~WerW&JIk?S@3k#xL
z4g@i>Q8gf`RiR~HcgMRM*DIicx#s!{rZLrwA5mCC&eL+Yo8w+onfZKca-yPh`2b%a
z(B~)K|65`VR3uzTa68{s%27}}Z%o{X5%l=rddkN{>B_02d;6=@uCwR5vU1hbuVnUc
zVKFux&`}8L)}Vj#m0>Fw;%^M0Pts_T-5qK}P*fGGa}Rk5r|wP(ys{%r&vx+XA`Co!
zOMI)btZ=yN5HEU_@YJhGl+hFK<Z(Lz;XmyVg6R(7$gF_wtYaZwYM86)lM)6cKqSn3
zTXv*SRCN|e&96v`fd}*A&wN^!)Jp6y`A69f8nL%t*|ML9&BjC&#-X?N#}24=KLOKe
zg^og(DrG4PR&}>%=akkz9^$G3dP9KZj>RZ)ckt2Rc7i6_+X(LjIGwL=G+^Z}LrI@`
zQN{;9h44QC%4<RU)@6YFz?Jjwmmz+;*ThWkzs9qscVEIvbd*xB3$-tJ_yVy<PE%aT
zR3<hVLBgGOpOk{u#5Y)6%(_2=ug;(Pq7l+lO$PkLZq76e`B|lE@WJW&;E^ovuW;6X
zS^y<;qi<bB>6L$y_DP%b5$sk3G)hkQcJVuT5>f-XTEKu`@w^~TlJJniLfbFXYqUD^
zdiWGxnaSuEnnD|1BZW9zWlILgG&F>3IR&+QhHa+4{jrSgW)``b!Ys0Z3&^W7JQt=#
zdMTmU)?M$Ti||G|zn-KPzqh{l4S@W6gzu=I)tB}46HA+XKO%m;#cX+$WLA1u02D~q
zx7Qtg8USh1eJJF9UnGmqN^_y;1xP(nhv;Fe5$S|{qm^^jxmK{CBEWIRMhkvzQK@RM
z&OiWoOj2f}Yl=u)6bILY%M#4VT=*S!t0(M|pVP2H4mq_vMEO~rt{Q4p9%)p)>~w8R
z6MCL$=;9xjC)OSv^f?IT<}LJKVgO;}EaL=BS@UE6E75<?wo;)~%ng=^vG0ncB6%aJ
zFY~>SE-qDd2l21GZeKKba4Z#?`g)KMVbMJ{jM@e<eBz{|6M`@kOKFI?ydl`l3xBG<
z5NGsgDN^*hKqR35XN%IvgB|q#3L-4zK9FGM-cXQU{=+Gtv<GM7r|U$cFmb?>VwGou
z5FpnMv62DB!p$#TARM*;R1{@<-CmhTKPCT0Tx(p5KN6Q7>4M@{QbeVguj-etTW9l5
zN1E>^kb)R+)em6VaKZp%yuA-7m>36y6PRhte?|(ie_Y!D0Q<8g&P8%wkxfp1aAjf!
z?g%O_&9{r=b#OiaKq>(+LrT|=Ve_-Mj6jkhT=a#$Nl2eD0QG32?My8b=?O&<h22~T
z>ZVanHKcg!ikrORgA@k7vDxDtVb>|pd;l+6M?<rRuMj#r^C4H-JG00B!vIdA5=P9C
z^2pI;Np-VRTnYA>lusLL>Ok)XI56_KmOY{YOrQG00yB~hRua&u*Ic@(R)h0Gbd$v2
z2po!}b74G+c-Tn!+T<&i^qhLg1E4q;g;}5%E}!&(as>lXX(+J4PR}FcQuYymBQ|`{
zm(gsZgli`OFuhWH2Mig@1w4Zkf}p1n<)IF-2B~31E^sI-YnYcR5l&bK?K6eJph+RZ
z+ccnMp(To$wM*^09hteyX?-)T=q=$HkBZ-_M!m^O@f~JP8D}KFGpt(;wx+<sDWu<i
z(HC(m)g>Lrk(=yE!9c$Ly};G0a%vg|Nww=6Nj~d}eQKzZ;ry$&KzmZA6lv>~6*(N?
zz=I<km95Q&qwHvoZ#85Vb}B#<#pVw+{IvZM=$(!$S^fRS-=TR+BLA8!6wyn2PwTue
z{^^vUos;j3!@#3iJJj52y7PNwW08`bg^M>dz7xo|4ncFPN~_b(m<oUM<rA4j;ZQ{#
zad;<>1W=an`M7V`tiG(GrLpy{C9FmNQg9EK(?clBwZcF#m`SgrXSVoktp!jK-rFSw
z#0%837tqY^cjpj)%+RyBXk(_*7@MIHk-qa@^irhQcjeqSiD`;J7Rr=y-V*uDTGnh%
znJvDF1`3R*)!?#I`(;0@+q@Eslj!1R+~`x8RNlLTM?XOP70&!$fQu+L-#s29S0}@G
zaBI<N|DRlnCG7-SX70nNgMu%}@0SMI@V1>pZmfGz>rV!Lp7o5!&`CMGH}Nkm#;fec
zqaeod77lE7l%+cjH0JOPG!Yhg<f>jU(}8(RZ40U+vp9aB-jes!@n|-l0n{)p(hQ2U
zj18+>dILl!6m-eNlNQR4v3_RYp>C>2&}UL5;3Mh8ko^M4C$ESn@vsRl?8k*kfMQ_m
zMiWpF*eUxO0Ln!+31k}FssKDt`t2P66`n06k(h|DAR`v5<V`3vY=6UrWMVx5OX@uC
zPbZg|qagqA6sU=O-{EvR{B)P`Yh+zqNwpG9eul_1Zf@=wExQ+dnBw~R*;!0VO@j;{
z%rtL*Gy%-HYDZYI5nmtHv2KEO)(ISM5I-MaZLRhz1`-XTW?YY&=?^dwg*fmm+RvX7
zyllEXpML|$(xW-*;=eGFp_33rpN$kw{$SP#A|>H-D)unNBHKE?fy|V*=MpoNBIhgs
zEvzNu?JraE`ahv%H79ad62QfpauFHJA6F0{c{H;<Y$t${66n)?fKA8ozM4a;ex%e5
zvglyIhzSyolDGw;2584LK|6tFW_lu!niO0*3&<N#VeON=c~4IGfbNkUK%rs%qtM7d
zpmcS0DTlh`p#cHeyR}pdB%L$T$H`&#NI$%aL+v_2%f02tosFV$468$OCe*RNLgy?p
z#B-ua2lD&l@Xvp+sX`bqx%&s|rXL4&N5mE8eeT#B$!rlhHcnLvYIa}~-_-VgVI_AM
z7sf=bu7)O&ozF+q=>k+WlvdeK3tX8mT05-Xh;M@5iK13$jbB5fyqOVAkK1#H=FPh`
ziWd7H#pqoB+=slzQ2X6taEk^7B*!LQLpL4YPe&zj)GzO*G`?6Wq=lUzP-A2D00E&$
zx4&MqHgy_a`J))*8+gWjV#FrGcGcS;%s4L=0$DN}MzX^w*03OeQj^O^yk&7pmYGMD
zCVLD8u^lhe;?5U?3N;nHW$fL7F|tIEUL}P_q`C3mB2AWVHpo-}x?&}=?iS>*zM=eM
z3I2*$+NOCtdX<FW5V9pOqdHR=z2@wb5w9J|e}&JKR%r<UkKRI<r;r}ozXRyIR6Toe
z`wnmxRC~`cRi&i956RCBhLS1*Xawa9P$-ax=-NL22agEQiQJKPa|`W`MFj2->BA>2
zp4TjmXd4xbBGDgfHW9_$*AIcyFze}TW|{4#K6z-GA)nX2Awz^<*<!v<_e^5*vEt8G
zaQA0Ty>y7=d5^#W4P@P)Yd0utK<b4-yC0CW^!{Z9pWQn)FCCSb&L}=p#uwN1;s4bs
zAR||Q*MZp|OpbHg=uYB!yySAyh%Y+bg|re+GNPp0A^*yRc|z*u#(xgN(9W5slq&84
z&X5YJ#(SoC+4<2RTH@^ec}i`*M}SO}F4~ETY0>oVDH4|&VFd?YV7pR6v2J~(xdx2^
zmX1j(APy!p@qr%D{iCuA2*`n2QYo5rkYNo7-635PnLz0*j6yD&To0Vpmih?-Er4WM
zihSF(E1-}#y7i|nruo5Ab8-ezQNRDe{OkGWJa+zo<QXd~+6ilnOI3gVmKOHo3>N}Y
zTvq&%ClcA#Yn-q9{oF1Ax&Ci}<^WLingXx%d;C&l%+tKuk(@h?+g1c-FI5F(7X#XY
z^zq|j$swFuN3Fl(4p?C`4<j2~j@Llu502J*!*SJI-wFNfIm<XdKwl3!De%Z76Kcuq
z2)p)y6>8U5__ak}LSy@*^PrBbqvwWf2w%$|q2(6yB1tzm9lVLf1n`zvvg*u2=I$&E
zCWzG08d5CH{NETq)aNx4i(U)El35geIC<uyM~{G%muH5Y!|QtT&o)6v1O0&GEfNTL
zyS{s)Yz~)pF`7P}>ZXDs9@nvSAhmrFY?GulU2K_!t?uielSR{DJ_2H55$x5=M?5{Z
zsSa|gbeJYo0DCl?!p|DhU)Fat>}SM|{9$+LBCd&KHwc;hEQo5Nt)8LyU-)gr=ZQi^
zwU7}KpS4}7q}+R<tY5+5B%LXcMyq)ElX^Qq6QG$9)VQMIf1WIUGP?p#9a+G<f&?5Z
zwI6-tL~?!W`90<Q?(?NDpuMTIqe3mmXK;`?Z=7Uu_|eUXxLhs`8=ihYoZM$!v{MyN
z#f=o-<&5rh8x$52-{=xgr!U4bS1DOIv@c?7U`%2gx(rVcW6=$z@NRDp3}sr4NU-F?
zpY}NV=(eUU%^mX}!HpwwRbfYwTcJAsI%md`8$&$3Cc6(UGd6x!3wRr|^KnS?LKR_j
zk2eEqpXVb-_JeveXr4{3<6~iw<B4b}b$$#3=lQ*vz&xJBT!rT3jlE08{_zMY;{mVD
zijbCCgjgn!Z!5t+;L`3x0+pDUeBYi#D=fl7ZopZ|VC|tN(H4rbKT{#fKv~oTXjK%x
zg1r8x*^(F_ROte|*>UhfCY7$-%u4dpWdqF%l+I<N(nZv>&!OM?(E<II&K}I8;bOx*
z;@s!Kf52n%y?Ztk8LkUgKJ?emqKAv3&{Oe{{;m6PM@hJ6{Hs3EUjKch=6^ZBBSD%g
zJS_|>EGyx-W}A}-o-h~Qp_>(Nhtu!O&v=o$T)Px9%Mp><30nRA#duId>aL_UvxAH|
z`T~(MzH-@rm+Ls6C7%<ikL#-u`iM?xNa9Ptto;orxGjLpRw8lC7jwF#9jl5VK<HBv
z5~%Q~JLs4uQgp^mI7~e}m&E~}r^WrKe&gQO7tm3<dZ?8g9Ez1n(K8m_y*x?A*wFUq
z+-coA{8(uMesQ+k2*~!u1G0Vd#Z96f{|Z~2?<WBRP6_{;Q<o<|<m2{4TH({5iE4X+
z_=gnQU+ug5yRoMJTkUim-X|b;vl9dhHbHZ5zp32`>r*YUK>J$rvi^pShDAE+K<&Y;
zNpX^4S3LkkeglvM>H?5rsklo{T=p7+PEH>u<w^*On7FvIn3zA))z?T$^SNqsEsTe0
z=4Ybw0Kp-j*@e&AcmAjwlnDVCJ#utlc)9P|S^h53=}Vu3CBTQLuIJP!6_PIRc22lT
zWbFlXgzl0x>faR|L1r#i-IMVlL#~)S8h^)c4v$ASI{^tpq<?2cng}qVX(CbMe`^EF
zKl%Jow{mx>6#S!O>cjD$py}++xDr!B{^lJ!R<!qpuVKhCAY}%~90+773S9cL=rvGv
zB0s)Tu2U*$vZ2=Q3dn^fDFfM%58VM8h~ND@8;~=SwJTAsAz+a1fl8_0RO8Kdqg=c|
zO!vOy0pwQX32vqhymJ5y)RYG$_)W$f+Kfh7@7RG(Ej`6svPX{}o4CH<c^K-W1!!}X
zXdNPL{mbVGY#U0JcHr41-uyWreR=xPe7C0Oh~4<D08B!tnQR?!M|#}<;0+v3`<;KR
z-cSIpW8DAj|H%lX1v#+urR=$TkTQ}`)Wme2ThCPo0bQCzuFns1E#pVV?>h77Sy&{n
z_7DqfRy*t%uYt2&8Blo72bS2bk|0}Kyto^n$BMyrC1;{v1wws93<0f-YPU0s0*Z5h
z10FDwN*$2Vsd-k|9EdxQMvFo{zY<|6{q1Xi({ar+gx4?I02P%*^kKBWYxM$wDMBVt
zF~cxZmxP$O7#pJ13<{63v^rxB1C9ieqyB!-^5p;TCqk<i4wgQ54<?ch$IJY$F!DJD
zmDDH5I?p&>qUl7M2^XtpYtL{4^3XP&M9|n5aN7fB|L2In+y|;r7Trby#@E_)N_8$R
z_DQVcDU=fAXjm6OEpNWl!Q5Odt8SeTz_pKko^AiLaBV0ij}U9Sh945LNc72W4G>Bo
z6f9d_(5SW+f1O@*lfV5{4rjQb?Tu$~b}jb_>OaikYmMj&ATg-0zbWf)10LW)_yef&
z{@DX2!fWs81Rm@2A12;^cbVls(xv3^ZjTmmHOzQDJA;=~0k7~!FjY}t4L4^)Y`WJP
zs9P1rqO)%Tl-J@?09Gpw`$Wp91_Anz(J?XkpKM@oyes9A4Hf!M=_5|>e!d?`*kcq8
zcn)S>G#9~t_hu*{y1bph9UK;xmyz+{$#}u^+C2Kl)`6!!JUnVgJt(;gyYm1pZ_tya
z4k~v<q)Gn=wb|X9G0OkhjCDG1HKKigeAFQ=k`~_l)F-U-ZbFO+vIz>V;RacCO@31D
zEr;t1v@QDjwD1ch+nk!>i1&643|0jnEZSo7#Q%E%AYgY#*`BmK-N49fYkLqP9=Xdm
z{3}A*J807RwF;m^;vxwz9vly6?S;=2FvVYW;bU)L_`i>R@48GLWi7_bPKk7{ucjXp
zwv;ce1ttlqK`9!3ws_?*1Ha<Fi$6H{aFwaordTlZ@d<TxlWWIdvg`1(KU?OH2%11}
z+u62eFfJb^(WK?EXRepP6ZwXal9uF1A2?W90f3c{<{d-_vHw~RJ2qUckfrbce3njK
z-B}7)7-7BWFM%|t2m9E&jWOMv^#cD}ca6n>ZxI`3@{GBMGr@+*F)4D>WxaifV*Xpv
z!S9_V&AI=_qyyW*8>xJ~Z8P7pGQ;)sqY6;e7~saNu-!UcDM*n<pXtUbVF6r%k#OzW
z5yPQ^zgiJ4WbijA?fQRt1D%WfKH<%sea(Om(3Av6r{eGdD_~vg_^^bMGrWRLNXWcD
z;J{s_IiX;b5qD=ifBU|Fn-~~|4<@+{&n_=exf|_g|42njiUrM%xn(+Z86xl?NHRG8
zw*m;T8bP?#@FQ~2cKrF%2vqnr=131mT4w(4f**K*9P}ApR0_u5bC4hDkCxkPXY}pg
zB`f|<=Y*+W%emo6RMn1SQ#_KmRiB4vWzykkGi^;M`CA5x&mXw1B+a;8oR{#$&?*uI
z1UyczeUS3{@0oD_%>&7IrVc5X;OITit(}s<@#nbLW(o&+Eu%39lo2k)3A?F8s0_7k
ze}?{;i?-{}&{x3s1`pKE{2v_;oxSU$2}yY(Ui5slHryKCS2KMmCa;mc(d3f_KD?l&
zp~04V{^}9siK>u~Hzy+p;a_LwPj`?;WZ&#;lLm*&!ogPrf<RcH8DV+c+yhjVx29iN
zo4`wSjKHsf9GVL|xj!%KJ17p9<|txs2fb|P{5!RI@Y^>pV#DEYqS5|K!#{}9i?scb
zKksQ6_AeH!Y5D!<!u8QXA(BQ4mck-&7R7>E%h)kX!QhU~{m}k=t9*<QVJTdR{^SWB
z5UfU-Xy+ILXKep)((|Q74fUf=x`4k;6x^McjfeT~htuK@7b*wC0~)`7-kl=+QdE4|
zxAWK1X8<*^Wey-X;D0-t{@1%BM))gzVd?pM_RlQUVn47I`u))NLF;yci;O~xc>Bxt
z7(wfV`5il?|2a$|-_VyfXKqZ?U9=Ictz?^hq(-W6XZBeq(NTLp9T%kLhg>tsa)V=t
zk&*S+3{wimf+n*G5K!!tdY^*v=K}gVe4l~<$f@y7qq30Pzf79M-}XL=%g74%*&e?8
zq4!z=Tg?CKxBgbCxHX*HxB(}{N)-yA3`0XrtLos;)J3Ius00-G9BX;ht^D_F2960%
z#EObzqjuGlCP>=bmv}2j*3pK^vzPr=)2i9pF|zfEhO%8iwgPCp{w@4N8R6SZUH^5>
z)_rmHzpZBTPrYC`aue(C=RdhGejZNl2>-VRTmM{Tovkxp(ffs1!9kQ@_f^@Kk(0{;
zHV;tk>`_lo#T_rZV@v+O=l3TiR=UlHQoWE!RR4g-s!B=^gbO%<BHWWaHOtu4J4Rc%
zvlmaPVt|%5a^;(}_fDX1<Gp<B$q3Rs(0qx&5VT-H<~`fJn7U@wUE^ZQ+AU*Vu;A8u
zb&z8<F|X6g@!s4vSk$&Qt2?KT?-7BfW`@DieoN=`L}R{2zO9tsZ%5Kh*c0VWl4nh#
zF1NxWe9#cdA0Uz&5+a~L4k&^ggdQLPU&Scg^#<!3O<Kod+$cT|P<(u7ec$Jg<b-0)
zxGj16!+#?56-iUd@Gg4OhSi`&CVsta+W}A#l-6Q5dvZz4jSc^lzh7-!2wq3L?&nRP
zyN>j<Doq@)rz-P7cOH5EUwpB!l$m?+1smB{<(7iV3|bWk*VY`P6mS?Hsq_e~eH9An
z3hQE*nO*UNKamR8#?JH5L>NRRh)YKTAJ>e0Ti;oI^t^E6(ZjKa2v`q%rD#?*t`_=S
zLpID1!SJ6TG@^=$da{81+olflkav6^posA!IQy0aqOlmXWQoBvILHDaU+&lt9ss|4
z|K*EEvBFR~l;2g8_%x&j(hTyiDc7}JMhAwPN9W~=Ob{;)!<w1veNGR27%+(J=LpZZ
z;~BZlJN%;`X?38n{FyOtM1|6k)CG(y+7Kf66hA-|xgYE)&CUJmJV3di#X>);kHJRN
z`91Q`=zda_kOs35t1^6UnJx@1VNILEsUIp$`<|=K1wOrBr~A(#H<Vu)+jP0QK0@O~
z)F}b))i7m)-<4?T4q%g)*L)}1$9Da_dD_K#)V?NSNW!Gvg?#^FQjCb~HZ0Sh+CWlm
zkM4g`9`XPQ<`gN$`)7P0q?Cm+Tf3!V7mDZii`Nz{^k!m9MFIuFe<UaZUrzE_q`?lv
zs(hbYQ&|{~y~&sT*(#cAH>v+D_5-A>R3Y63YCw2Bt0#imK5J7u&{B1)Ai~+8CFx?5
zR8toPqPnHO!tm#jeYE5cx1w;6U?PZrr%ewDc!v<GF@!%Oq*&ST3X489?Z#dG^A~AI
zS(yUy>>`GHuD`Jn;gbTxD#szT;nt}D12YEhOA0vI=(if+h(x(xhx;WGqx7xXTH8L!
z8EDvs)Wnrc2iHyQ+aYO|*8E0|{H3p;b+ZqcBrvptt<QME_b;RJ(dTK3>@L>K6V$pt
zPj<rgX`5n+l0yD7H^Dy9*BlDN$@q%?AMPLGf)n`hO1B@yw`A*9^8Vp75^XYuZL1ok
zRNuN~kFT_!v1jKk)Z1Y-&ir?GJU~LEjEJxayAyEso!Mm8nHr3tSA864`LNSWhskwo
z6RCTI1qt>DVjSupCAqRcd+Km8gWBN2mUi;JPeJ?%VfOy4iZyj4rKIAw^ki7k6~pIJ
z{d$p#o!3h3i1h_x6%=YYDq8U!$G?a7F9){gYW7%GD=OGxfLpyko|X{*Yq~}(W!`}8
z(rSavVF&(|cbWF)iP}kA)(cxI!_8fJhpWM73@X{=lcma9ew`hg4V#0r_Pk}6r<)an
zr}d{?^T^hb?BISe9zR{>?*P<M4efm~SMT2Hl?G_6X8_`gs+owc`7RY5YMHw9;j*df
z2NNf;dv80&^TKmdc<fY`ns^El8ZZkk<=jjjBd{Qutmq=XEXT*OSw#J@i>gtk?}&Nc
zkWT5&d6t$my2r+c$iuofWu0kEJEGK-G%*t0UstliS>_gN_hS0ac!-AA@hWs6=Q0IS
z=s6hA#kDz<8Xa8N&^He=xzw()6H8HObdulWG?`AjtzIwljM0j1bPSPLin7z4L7&7R
z6SNKf{G2c6G)^&Wnn3lev6W57iVTC4N1^v~I_SWGWwM9x%>A?a>gbeaWKgjU3WRdc
zE7#P#?(>ZIk8-#8R-tFFbMvwS(6;Y{EjAFKVV*IfJ74Bzr);Fp4+Q0sYk!MxjTo?B
z6)b!_ZWP@N2GbdTe9H0&wp-NG)s^q1&Uv=f?m79k;QVca2?n1&>Yp>%HQ?E*F9dIY
zty>l$mc5EtR=RJ})fKWgBG2bQ>PRn;cBg!x|2c&x-=^I|tw7}2q(<Ln)X1Vc=C|`y
zcfAf5+9KkjzLGVWRvJ+^Mf9F2(nj;67SV>Xi5^MsfW7_AqNzR0>ZTF_uzJsU$2+u~
zl2toWLE9uiTU9};$|Ng_I(S>aD1Q?jR<gS1vR7p10%PibpK4)Q*G#Y6^a}Z%{eyp3
z1MiBjC;?#E6v;lZUwt~u3gSiXzPjIDp`*Vv8{XgjqV3WYBYv(Yy7M3FPf;L0TmzqB
zlPj1-2bj%Pf^&aXRA5c#wueRk(rc-{m<?znK%9T$@?4LluOki2$n`C3FNnh9v>nI7
zCjq(JSiLz?MW>_2^5^wFwZqj<tpQmR4Kh^Tnr3-)ZL=xci!VDrBBPnt2YgkiLzGW*
z&jJNa`<;Y?ih2~2a-4yr*DU|4*o}x!e0B>@8?pq{@aPiad220KZ5M(NXk*?(!moa`
z8!^}C{leIOXP$VorL4OBu>l!Gg4TC&Bg93ZFr-%=byvU2;KiAq{#rv}*T!9S-Rq=+
zA81LHMQu4a`u3KAb+QPQ(NI(9_Ci#u5I4ftzWx>buq);BWy3Wc%?Tk~{Lp-;Q3hh`
zzUz%In-k)j=zUkjEa53<HD8F0Pw#NLXfkoJOn+y$_5=&GwW+i=h5=0~l!lZV$Evh`
z*T5BMaCraDk(XKX=F{D)G!~k;!{(x7@LSsFE6&sSMO<T_Q{68Drl@5X^e2>{g_Hg<
ztrOWHIWi9WEt6_%#zpoE>-_?A#4oWgfkP(JJ6tu(KN)r-Zuxs*_gJ8C?=r41O~YtD
zX71b6j40=XKw&BrJ!Cs~ShpDDS4l8_oc#?}LP9UB<Mn05_gp;$pHYli&0t<H!;%U~
zu@KwFuC=GnRkns?BLnRisX=cyl{135EGcxlM72mL>oKX>NXv)n_XWg)w(ewHI4Vb*
zXM3Q$!r1<2!f1qLS<Tm&&#sr=>gLs$kG2^jt{&MFjI(i63>$a{h&P4s7+CBr)raA@
zx+%E*a$2l@f>u-VPWUh;5sklR><NB<UQa`k*5_7NMzee<dLF)%0Y`GujBO*1INz<l
zi!rYGyHTZd*=H}y!>aQLH-Wpxh6<tTTbmxF?HbZ|zB}24>HX}rsTv4USvcEUS|v)V
z^~&VQKZoW4l1gIRWD#n=QCua^S&BK78CJfjefMKX<aO16*HV}KX0gQ3=7wH88k5&A
zXMKYClimb0+aN}6Zs}r^>98nY0%=y90Xi@mvU58H^)8Ri%vTE<aJ^r8CsK4yJJ3E(
zrEy9=jN8d=2Jrxp`>PI&9p7{dWbXeykSwWl%V)Pwr57rT2TnYFclW-JfH#<sIlGmy
ztJeT@+cV&B5`(ix<N1Dt{cLA;7z<Uhvdw99Y_i(yNH|<)L)MUQe>&(fV>oW~p>zhK
z&K-A!$*labngqBa$Dv?t4v_^dKb#>XfI@8@vmdI%!Ny`vFhih0z-hPDpOe<@O?M~r
zHdS>BI)u0%j6a~Ve#H@HzbZ{~@98jol}T=lg=vrqf-&@ze)sx9&?kO7;hzaw{o*uh
zx8rr#PKadkzF{h68qt%jQ|OJMo*K`?DVgYDV03tR?Zmd$Cn<Y3qnoKKP3k3H6B!@7
zeSXnb)g!5H)yi9AeP|TMGKK_OFbz+CyOsM*DwYS>zQF;N3E(8P(Tp^p{a@VH@405h
zAj|0Dn4(j=jjsx}{S9SJxYKH&HBYTe4y(YEj1so-K#$hwJ$u^P50Sr3G~;b@l90-w
z*DRDGauByk%)t8DR%J(}R(;aR-6x5m+)l1=yJx?*`yn0<WzV$<SBdMMtV)$yywRyW
z*8HG-NcZhg_N2(dGU=eFdK#T}q1ak5y~YFsGhwXeukF!jiR)g^S^Y(;TIA;{sEI!C
zXKyi^ti1DB3sxsFzy6#I4K2$`=q>l?Mms0ciM|z;e;&gOAZZREg=XwUle?c&xp!20
zf9@_RG&`G(D-R*g_e*!oTUu0}fjJ6pCU)$5G|?rUywk(Qe4&7)hgi~%Xc|^yYE^+L
z56ScurM{)y%9l<=MtMbzPubv%X>6j3jeRnueEgPe<7>ruVOer@aH!j_XES9*Y%CVT
z4{r)2$%%LE=_!$51;2DxWdP4dSwZMAXqE#FqiY0lexQ)jZQU&^)*sRz#mtJ`_krqv
zxH9B(sO8<ixxwJ|EaD$q%ru;&U}Z#Ff|=m*xJM661$#f##nET)(;U@%;2#h0mDXX+
z<nHqe?WQ4dS}jRiPFsTp+Bb7CN|K4ll1B0o)(cu0EuTt*pzh0~?VarDW)|(A1`VpC
z&dIp56bCbCl+QsTn$BnfBok52I?nr<d<`%*8qFj@Z4jM7Qqr5^O*>lw0naHT(HN~f
z5J#bMiQi}3KE(OSJs6e_bS+G9rLbS(+Vcs-J27K@qC`)g*>;!SLRDTu=);frm~z*B
z|3ryfQ))lG#&;w@A40OlQTav1aXTP)3YrWGo2*<d9hlJzY!t)I9h@AY3dy}*o>kr=
z5j2++dOS>xtdR6-)kHY%M=;H=kA)#tR3$Q-`c_`Z#JBTux5wdv3Mc+3ja-DnxrGy&
zC^|}7u^iSAY{%88Nr%Qth^7>C5ks;^wTbUwsy@=ICZ??^sQ1qHqe<7)IgWT$dSDyq
zmOrZ^9JS@p%1Xf@;WAemD938m&>A)JYN|&I<Az-17dYH%BOdn}eE&MoU1{jNkUbkj
zb~@?#EW>|jDK2~S6fCMkNtM;>2*gtxPOse3u%@F<WH82K#d(%4JS!YeA4{ZqsmNz1
z@Hq2Ks(B*r5N-!@-e#0kpk~X^0NX(iiXPtu@f6fJOqtNr%6wB6++mCHoVSoks#HB%
znMAc6k!zXp=1kpn!ORcmNS`~M`!e4<eK<z?ETAHX6oGbnOJP`NZn2`enZ31B8+uAm
zl0hk{ux;z~LNZ!Cp?D3MWO$vzO*}WdBCWx(Q1y&qQ!i@u2=Vm<gEIa=yb4rbd_6(S
zkZ=1iO`^^Pqp&Z~ellBZ$;Gap|F*IJW$^u87#ggXtqx2CI`<azlujVoE`4Xw6$Y{m
zCcUhUwXb~U747DT75WVf9Cv~pe@>TrUKI`{P32VPSdV($WTXG{X>x~Ne=Gu`PceFg
zsuiDG3T`aHMxgbzavTK5>>*n&5dQ39wqVUk?1+9a`V$8D2*uzUzGK#bhN?b<Rvr(Y
zF=?^y2=fzsYe2IUS7R(qLFNLZ{NO8wteM3NmIk8vmSFiMCn0I7brBdY)>1Q0j5#;r
zbSJeuHqzog`?VZIhHTF;K(sU7+d!N1Ys8=~zxz$%OcpGO%2mNrDJ6qxbw_?ud6BOM
z!=;bin~a%f$lu@c=iW9wuWQvN7T+V-R_s~x7mLKE){$=dkfPcA3~k~!;o1xfsL8Ib
z+Kj$Xj~jeq4y%S?E7_X2=Ja4F=LB@BDd$QQC;f<p9gRxf8&OBWxI+80t#g!5-EwN`
zQ(+hK9m>zQa93UBBRrTy|Jc?LHvj$u&QcMf`tFiAGo^*{r;l?}Hu_@Q{dYa+mV4nt
z`<N!Dzec0RiFm9&!n%e*R><d#=C`2Iy^-KizwZ8|o4d|9*;3wul2zwPK>NjAPd}A;
zEM)Q$!Lw22<I^1uqco{bTniV=*<yrP1}(Yk%dO%{$XjVG?(Zd5P-?9FT?VXg$Z~@3
zE#+Qib)oq}V;0^g2VW*9g*x6XxbmNma)~k4=x*sZI*A5lv1_$h>Z`;xuCJFBy78rs
zT1lslh@<wxz5|)^4%=VZc#Ezana-KiUa{I<<A0gks-E#XfV=UK#nNKYQiW=aL;+EW
zUHea4R7wVNh&x3|r}K4@Zd~*l{Tfl+aUFl7Xq5|?zupP$gxKdDi!5Gibdm*`SjL!9
zFKfX}7zZE+1d3i%*rAe*p%Z~>zd4C(ntlb$w1D&#^?qxWnLBhP^wtR#(%D>6Usycx
zndr5=qA9EDcLIy0Y?k#=lJEmeGJf?k8<l(|uiY6~;`5VTn%a_8vD-8C`lIvHK<TTi
zb^%uX*I{iY*ngu^Xypt1lzSAR9rslT#*FnHE_Me8ICeW2XSPyZXSR|K4P|y>MY1RK
z85PQ(VEj+)%;a07fxDfR<l>+eWC=F5tVxWi<Mf0SYbcilLU{zbYDAbf^;}yw8H3XG
zTx-Gczb}jj1L|B-U(yD}?o&`bWRB9Oic{_<I4pH7{{^FQ%-2nf(hqU?IU}9KV-_R;
zs*!nAXpomA`Bpz`e_A=nXgaDEF9$S45~cNEuDs>yLTU7B{e!!ouSfNU{e~!)4(V=z
zzfRLEb$M#74K*ou!h25*+LWK21VlP?16ZbLf#25)Hn~n~aAr=%oB(aHNv++9mVl7W
z9K(}7$LSGD+P(0nkoq4iU_DMyjc_}}7X^YoT6^`)dqi(>eE);@tIgnzIyiL0^fh?H
zjAEv;;;Z-1i)UBO`4VCMYI&yM0V)xwrDn!!vnBRas|urld}t9(-1HBpwq;3Kf!>R6
zCA+!858a6Rq)1|(`<9H)6Mrf1HzsIJdIU4t47w)Ob#DA6C=r^fpb<Oi$jI1khhEJg
zLeZcLKNPKyzwFUVGnEiD)4fBp#%GMl?dk7#Dko9={!IjL^ZRggh?|4e0S9UYH*FDv
zzq?MA`JO?w)1s+yipY~8P%p`3kud&qs=MmlFLRSqHnZaSLwAR%lN;%8d1gs|5J(xE
z`Bd6*D{Ap=l;|brs#Qz1`;1G9T?2upfV17wek<;3YL*=5Ks+m^<H5{W<txBY8?07s
zIVL5JpC~mIhBtzt10jVEff?h1UWQB+&u2%QdtXC)vU&M{=;7NGWEK_zDw)l{+*Vh9
zvSBZ5b=bK0<tm_srhp1CPPFU2qTM^ys5Y2gj@^V(&Cbl&=YROp_#sbcEC9S@CHQE$
zv=O;1Gl@ia>VIAh#)(e|fI)!fNpXV~akdi7EI~%0biDtN9U*`06=?|w^JZmbQU?Js
zc)UX!$i^s<3=WLbdjW~|{LDyJ(;a)dn#+XXTDw^kxO`(Z@In6u*%#Wsgq;0?2*Hbh
zRw22JS?Ks#vs-oEbBjr=B6%?}txD6J7U$|;fiURS3+>C^bY9)ZJ7DsJhadC^UPpw-
zr5u(U(3F2EVRhX3CUSj%HB+it;|n{QDH&IdW!O|FTdCJ?aiAX!uA4QoGRmI#jV@;B
zzOjv(#Nk{ptV;&oWSrPUn?0e>;ax4M(|&Q}R3oQfo-F9gtn-9~%NC|>dPlrDoSf{I
z57w^8VTOZ?y8i_iN8vCIASl>1wR(6sKg$}WG?x@03mRYYM0T8$Cz;MY0n1)Cf9CP4
zR&VJ_UytQ*(*Mq*C&#qtuEDkL&}W^GIB)abGQ0dcZxXHc(|z~xs4~F{U(J5I+6PSL
zAt5jcDY5uHID~p&=)g}Ml(SfGNye-y`|@;3tN9n9(v*hite9BWRuV0mly;Ndx0z+H
z>Bd;bSPi4tUA$rFP<y9^^pDFRSwH*Cx@KeHZ?2Q26@ejpKO3(dIC~=fMYZc%uJWB~
zIKF$CW*pHTG7Xxm-Mec)@!S;?c;km}Q{O`qX+@1>b?$?Tl-lZM%i)GA7^%gerTSVz
z{On1QI*X{e<@o`h7+PHMnDmlL7F~_i=r;z}vQ@w^ht{R^CK*&OPri?tOM5L|^Boe-
z0qvQY^&2FRlWFP1WOS<3n$2!<mbfmGgKHb+b?^8lxf#k@_Mxw9aRGZzDQ#`p?Vltu
zpFh{*MO#7wdMtk|kD>ev)XvAae~w^>Ti*q>Apv>$@@{xH4QhYVfjV_vb7q`$Tv#_O
z@ilk?1PFaIcTtHv{?9oo#ErG$Oa@aM@IJPf6{yPRq~ZL?&L9kZ46Xq&O`SA;o+OJW
zJQ6XtpWaN3D`W9;x}=PRJIF)L?dsMzhQ~WQ<7VdFN%DB!JfrMRiDT6HuH$Z8l&;6j
z`mm2qM?4wfE+k@U?8d$d(@YJQt{ZsFaiKx-iobpy?NY1nk)Ik?Pf8A;Cp&*@IMZ>U
zP-lqGd+b<b*-DD2qkn$TpiTUF;B|&GZKuUo`fjVmk0oxX`%nAVR9}%yAKxg`I3GS&
zQ}JYyJ~X|1Wdv?_3dc!hR#|(!r1`)}LaVyjcD*4fKPmAE{#Q|sLiOyM{;S~Dp}_{H
zl0r4rRKk5zf*DYecI1<MOrAog?2!1iofvJ4$av-0hN?~IS%F%?TDv~tF_Z?51T(?G
z5i4?};iB{JwbE4%6G{DUP$=1yC3Q1k=Q~vdV?nrP4mkXcH95LGRkC&n^>+f=Y1{>I
zeyR0Jd9kwcux;~7rv%;mbJxpyGp7rP7ju|+=m$O(-mVNS?%uL~$s4WlFN(u`6^hwf
zh-nOaP>lN;aBbPz11VUMV9E|v(OMJuMVy7GHZo#SYVlp&dT=OWbab6IwvCz(pFSa8
zCZ1vS7sK@g-<F>^qhk}GORW+s1J)bXYV=}+E;Q+Vl5V9<nJ2C~JLYSs1yD|$d1)AX
z>rMEXTC+t!Mt46X)pq*uw(FxU1HENOyQZdtZ)!EJ6xn1c?E8K_8qh)Sx#y<eZsN{F
zX+SO0<<r-{)X@ls6=MfzODF84*>0~ro*$^(njXrYfJ!0K4JEdu={u{2{Qx;~54T+M
z;R<LF3CM(D0|2atg>H`J*oKusJ!Vb`TPxZ$5a>*gw3M!T4W_rnwQ_~3;7Zkbtyv>K
zymo%Qd$jQcLYY%?%q2Y0v>QxBXw!<>WG$)Fxg%u|%e>2_P^sW9UP9h;@O{bi6OjD#
z`3rVg^<<tI-$Ae9+<)ARIexRc`z`Vw@#N*ue&zBm>r3Gv=%j3yI&AkmoKXz68z+nk
zeVtFuXdEjD(sDGmm67AEIQ&jb=Kcq0hyNQ9g*3q^pVf9k25wiA$7vV_$xVI=MB;a)
z6ZVd=srTZ|3bjDQ4yk1~v8e&=$!iX51p@$n{Lk`e2BZ!CI93`jr<di-5ezrB*uRmy
zt{k(DA$E{bR$@j=K3^tOx2r*(BzDiV7O6=F{Cuxei=IdI2Iq{d#(6Ni%?ac#i6Anp
z?gmKd0#AWiJg3Bs(A)3fai+e^tmxOZIM)#6fs{i&8*Vmw_0IzQ^Qu$DT0dKWo%C*V
zgy9`IIFdU$ZzS)v+1*rQNep$=Mlj?d_DoW|W~@hDUGU;T39;&NR)DVGqH|X;@+bG}
zz%~$a87*qr#)9VLZ_W^tAw->^^&#jVM|W`krGE}P{0bNlF=V7#c?@Jx%?%ZnE)@hQ
zJ-l*IKB~T>rS>12D&MrceWyHW*3y*>a*YGViUwPFoT||QG#kLgV#Q_X7&DdMQ<)vB
zC6cDrFx=aKeV;j21yIv&39Z>^HdUHQ(>GauRv^kx1;5bF{Di^%3nD|w6OKHeoCl2%
ztfwe8k^VR-D3C9EUbK1DA2}c#2&LMwC)L98ZuZM{EJqIRs$UFNymZgO6oytDwppLd
z*O17_UcV#IYjBCI1dm8GyHf?Lchr|87So8NDMusSYEk2H`qo)aQ1!}NR8m^^;YY~m
z&`sCe`!3JlW;0!}NL6n$5(IC~?Z4o&4QA1o)2-=xuAk+C&7lx4jGTB~_?`RE%U*Em
zmgrnH{tp|Yv%5sSrGIb{H2%hTiXydrikW1TxljPb1PxYV>q=<lPJ&O5x8PF9<;xr{
zYtZD9h*2~dHg#7YTiVsTSA3d)7T)|dPS+QjUCn_zS+}@svA|NK-CPtNKiN3gF`H{~
zBIe2w)G==g-xM+ilk*%@q063!+hcQBva;L@6aNUk`3dh98*w<B_(P_RNn!=1$@+}8
z*EP5JPSp?Jsp1cBcu)A%VXvTy>`eNTA276{fM;v2*4dNR19TE8nOjd@3~b^EHe$^@
z<|2P?J`xb!PwA)8hdWIM2y|rW6lshN_{-GAGCpk7nh>%#7#BK)rCJm;3F5@}M^mrO
z6poHC)hX-HQA`R6Y8T2xRM)6RlaFKg9=rjU{K&4<{z`)Ok(hoD)TAwA2TPZb;}p}5
zWr)j>IJ2ao<#{4zIABzhXdl1pdk)+aDiss~H8nq(=bcFgzS`1UEsVD3VZFPD6|L8B
z_74dt%IF66D0>x7nL?6hhM3C1dn5}>$331dutP>fP7Fr9N^TBwH9m6T7rni4?Dvu5
zJq?NO-<Gg!3KXowGnFK1=U~g}bee~Prt6DKaSLsvO3h-)P|Na}esWl?G$1+HJ%TA%
zS$@tB|52rO{cg#{6>zO5PZE$`9ub0|$*z^3G(Wt_WAysphDvc4`KE4(Rhvo>JQ5d+
zLB?aQY0IcY&gy8jERyBwI7C5J_2c(i&cGXx*01%UCJRyST8=#~Xr5qfesFD*tGy~(
zjfz<L)Y4gBZn}BD+f5(U-Z4*1d7eh?yu9RxQyCHpGp#daYJIzT;!~XcB_^>uUehFP
z@zX++UYj9V>*VV~HVY$<xWPn+roG*3Dn*p$Oqz`TIK>hIyW}K~C|V5+RKMiMe?!Kx
z6%fx!RLDfIf_n_u!i%t_(R$10lnA0@>_vDuSHQ8UT6Bk0l~}g5_cje_xmlGFK#-~{
z?yl4tf4#`)mYv?-0N;c=Q{<FHqH+LJa><|RwMeX1W5-jLfAHRt``wqa!k+2Mf?uRd
zclF1ZddkotM=Q&T8Aj{3JyY4MC4FgM%Wyjtzy4!bNluLYaN%rdn-?O5)JjbENa>~G
zXX%9fssYkj%V`&SeK55`2yv7@`tA(+*;;03$GdyR{SS+-M%gAx%El%`SEL74H@GyO
zXp`avFS2@G5dp`5_R^q{*17vU*QcFmxvf5dh3c2&M<pJP$5m*)%t$cvQ!zLFGr!6n
zXDzKFZpU3FsCw26nuV*}(gmgPQ5uw9wI?)<Hc@0SE_e_zk-nc{%p8m#gzNx-aHHI!
z#n@n_9gJ<<3rQ4(wwuv0sc##rn2FROgfuU{4JT1o?V#-BjP(puZdgd4%vqS*6+t)Z
zp3V75BGkNnzvaXn`W{km{e1z<C7xcWzyhky&|YhLvZ+BPEjk-lqASVwdoFM9+-lcY
zI_)iwsB{lEEtYQy_H2mR`uEgor(09c>~|k@3hV;9a^#!EasasT+jr(5P~k$!(TU{7
z=(-tk-eR2>a|MRl;NTP$fah}dTUZ4d1%%npbQ-P17EP1LHpkN``_EOs-@rlUE06{7
z#LdEc8u|`JR|PSLO&T!=z*JPbPjYTjjh<t|O4xLekDSeD`%|dw*l>QXvk7Rs1@)38
zoNkSXqwh}qXz*~#K%Bp{pg*~_khc4UIR)&Zi`z4i1##-A&v{?^Ev8MuJo<5sP6jGE
zG!Zc@>bhvP3(BSQb@EzC3%MVT>Wdl&dOhrQt2s=GN7p~Kak?Ek+R5^YYE251E{(bx
zhs^Oe!r1)7p3_X7&KxNwIEct+CzsMp98U?!XBVjy6rY#rwZ;M%Z|Uu=yK}BwBF?qs
z>cZ3ylR8w@E#;fdfd<{1&Nz3=0_nKSQsT@2Q47R0w;fvVTa@)If;6G)`*6YiXz1$D
z-~5#BP$cV-4u9I0E6ye@R7kT{LGyF(fV+jdRCxR~vgu_9p!cC{0;GZIYSe#n2jU93
z`q~Mv!9U+L#M#8k<g?{-GLs;usM>qtO2Ky)1`M-1@r1g3^9U7SAiwa|FsLS~P`~ZR
z%5QUm6U8R8+MX?1h9vaRp^0U}LbmbOF+8#ade)5}*vsn1)?jXGb7(-|?{Opwwd5uR
z;2;g1RhuQ31&6KD+n>F==siTbWmZsn$<L4=>>tUy|8`gMZa5(e3Os?~4mI$VuW@j?
z9%HNf+j_sQc+bBX2ltLp9FiE-fGbuj*YtDKbJ-<ox%1UrW`t9|yua*dwI_Q?S&KrD
z9w*%>nsqH5o3W*!QIBl=y7}P6GhVO14o*x46U_~;MKDGYsD@&)NKgIxQc^&qd^tYj
zV|b%A0BZN?1gn$~t2^Mq+>-d+L0=9X1jB#L67L4Gsh+)LM3b~z`k|~EJNXHT0aT1t
z1DzD}t0BpYd#u+4skw^qo}*3)NH3XCabsf(il)@XxS9>pAk%S8{5dltwpZenb^SI)
z*O!@=MYiPXTB+J|OJDoA*DaOIIxcPS83$855`B5>n;!WzQQNK9i}?c&9t^HCl&@{|
zx<GEsON41MUq=}=3R&l0yGtzj;U4WUj;bxzFP)#l_n2(?dJeQ+!O`-){ezf`^xA|O
zhdGL@)&{q(nH`6-e*DTx8>&kH$3`XPcZ)Kb92*0;rbxpB-sY0X!O9w2Q|2{J7`r}@
zoZzX+ji-*QJXd4IkVkZAH|e#nbP(9;MhXq{Wh#7&H6t;3pa6PD$aMALoRqtGFY3-h
zBp}d$dX&`rAZL>icUgm^h_}#4g_OE?QLjR+-)Q_rs?J`gG0k9>EFr6k6?muSQ{^G8
zPF*d>Tbg#+@Y7&Cc2GOeR+c|G$z*15ONOAMZBbrI3NOuWxo3E&Fx)~zr*mz3bUk;E
ziI5>CoEHYQO1yn-HZs0pZhv-chy;tukSpJ~J+Cd=TtYL3h|Off_U?0K;^uz!1x>$3
zW7wN4P?#)?!DL8oujcqZnF$n97l1zJ<4)8JBI*#d_Qx^16ZGd_y=;NGqG^2d{UGTW
zBkcUEI<x^i&!Syp`bA(VPeU>u^$0+AP>`)}Iaz*YQudk;H-Q^&zB>scCwT1xmkQ5L
zksIzz|0a+xAYs47dJhJC`FLjW^<`aw+<&;F8=F--xHV%vMX=9XUSz!nmFh}<9uUy|
zmvn`IC547~n58-U>$?om)_8w90l1B$8TVDIb#VHVAlcM^S^#<|kYnt=YuxovCG3R9
z7U1(*di$N5`qN!X2x!+{(tYlDTHx%Zdn$|E5g)G-tXM15?^eJJ6_ATpIdWDavqB>r
zw0?fN#fAnP9gj|&TbN$%4m@G_?S1#gC<@l31{-9akYirlfv!`pOfj;ZlrCO}VU8^!
z)h`Xp_q_s8u9J#Sf~CI>M~B%PAzBtUT>z|n=Wo)7KU1pP90`Li=bVl;nz<W4dpj_=
zDin+jC;WjND}eA9L^J|NEE^n=e(N-F2ww+QBzaPDX;PZZwMea02z?iHDm9`ZL{7$B
zG8~VJa5wkuSoQn+qT?|qH`$Q_Xc$kKZ6PyJ`~*S5yav4iM$L_5S!r#u;;0vP?xhZh
z5E_QukdNZi#>rq+#T@Xal@eordC0hfxUBG%k;58QBSY*!(RoJ0$X?Po$+y~~G;X?R
zR1%JS@mPi!&f)MF*hgAfi1N`aocjloZgx*Di;~e%3bv1@Bx{OFR*j^tZqn>D(plUP
zvuoFY0OB8-r7#C+9-FVhimUtwdY_m2OYZ6#lxo#Vo55sz<AlrJ<H_mRuXcz>O(qOR
z3nEg331+Tv`rKr#6O%G3Rpr%Ihal~X{D%M?8tZu2bxeG?mDs8wwP0gq8G2H1E==-7
zsnm5IW{g>)dzOb`M@W>sULjZyaQfKq4b*8ybmUz&s>^fU{)ex*IrV3}_pB@bKla`_
zs>-fw9~A@vkrq%|LPRO0q(P)4MM4@xx<R@{L8L*tq&p-w-O?bPo9=Gdz=qAa_Xd4@
zpYJ_mobx;XoIk!X91I+Av)4V>oNHe5nz1mx$P42?+ws@d2+{+fM%0JvvOC02O>nI!
zKOlbiD|mdzT##cwz!U{Q3)>9v!0~ef=WgbsBfU<W%<V2^^`-Y4$5YOyPX&H?cVI^4
z4UBBosJ<Di-ucc`5Q(iss(x#8D%HF}Sv&km5qW_?!GXd^oxr`gd_Ewpn2@7#WbXHg
zNnTp9D_6@ec=X8jQOZ-S<_t<enVz91v3O{$Pb7ctjSqyGKh&)IR-s`69+Am<+y6pq
zfnG)DiBz`jJfnRP_;KW@G)><VcqHh34F&=dp8GSmY95-74?j-OnII|o{&gl{2i-=s
z8$kTdT^o5$Qfuv@1ZN>oS^~d9FdOKwU>XCHu(ObHi6dM@OEa^KV>{-XeX5XG%}}Kq
zrki8qJAEaaOWiHXKDlA=nr8leSYD@xh-!_v`hqM0RQd+8Iv<)BKC615>2S(}2*%e#
zONvB?=g&-vv2BUlt6oY^Je4DvO|PirS1nQY%TiQ-CO@oi@MJl3WMop_e1J?pLSv%n
zR}Q7T&=FdEvC{@TrNXEN@;Tn*{_d}y{f^s2ai+Sg9^fD@6$sd)nB_EH)fzAGDAt)t
zW>N)Jxn7k+iB5UXr#DC`=cQ{_A8&wk<<SYyyp2sy_6N9hJxVg{vdz}i$4L7k$-K5k
z$W8Jrhi|zh_#9cLcM^6v)@Dev2E5*ZLb5;uqeMaGJ=?WtMtcJsRd4fSa~-hCQX-w$
z9)`949H@1$W24;Pr3YARlqIKK&gI9%?1l3!r%SGSQl!Y&r6V$NhIdrpg_K?)7+;JU
z<2_xXp>;pYZbvOxU6l~R%bXfyk+)x{N`m<(-I5lZFvAb#c>Fz2$={rBzR&^ERB8g*
zd<}^#9uzs-`uBNZ@_aU%cg|K??K%quvh4S0iWY5XA9-~bn%#fJ4=$fp6J<iGlaVt!
zd?>%vco=GOYW5>YG3WhLlkq$+v>;%5eSbh@SC&Q3E5#~B3^%??Wc35IvFkz&&4Mm{
z%G^lLh?*m%u5N>lcpzyCdqK9;9Xd5e9IV^(0`;Us`N2xsw+%U+E^2Qlf90&DISYVg
z<L@dq?vmB_(=YjzScuaVb_u^D_gPsfqh*bTR+N1YgIr>~&6rg<O%Z=rSCMQ|W>U70
zz}P+F&-9{j7fy@ql^^1{5$uWn7|vpmTR@l|9Yrd$nqwsiUYCW)KDLcy90GWxU<~qe
z0ZtVrw^$`|%bZB;C?<ex#~+>I@bK)3c|w1*IWVy>bphe_kKlm3IU9PoUPag$@hr?*
zO}%;RmIr%*N_Fh0eqJzzpd_0iOaCb_&i*z~w<rmfOAwHHW60PCbG9>;FY8<icos`v
z!d{<G5g}=^5{Pa=QOaQ<l%hk741QG6!ATej9TChOrXTBxh})Qq>(V};>y|QwynbT(
zo+Cd`H{!E3f#Dks4KhN;=qTU{SYcrJmO1x*Y7H<6C?t{ljTmtw>jA5}iust3U-n~1
z;y0>4q+}f*xhe93V-GrCEn0>fZU``8=EQO3r%uqz;i=mIWi1&&aqMyPEZQSk&N&!D
z(`WBH=Dyh8q`v~NM9=5i0~wyM(HXi@M}rJ}i>a$MRKu47>oKgRLfOPQaT-WDx4!eE
zVZY(x2qGpRNDZbJ*KrY5<)8$n&CAk1<m5kEcdzcct>mgRsI1=;MW2$@Qxl82BmPRg
zc_F%4T(*B9?K38^yxTaq!qHjp!3Izna_AzlrqGhzVt%v~qQV87xAY_u+IG`T5g%q}
z@e+Ki?7r>YU|FcwV*4Tl{!?Im+=hmMsMKD^!$tBQCcGdo=fSzI+eKhme3WxPg9~yw
zKfVV&i-2>t1wb#l*@Ge(*dU?WZQgHGHcnww#S)>&CLv`XiMn@Zp_K>3M#nXTXWq{;
zx0%1}*|h+L4-C0wnMXSHd>al&TQBZMtPZ&G+MnOODEP@!O!!3k%lf2R;QnLX<rxp{
z?>Bve2hOm-N3$FrlbbWu1p1xPp<z#o_}!MtWM03J8Gp<W%H$twv)nD_8&TFcY|2Hd
z&+=U$%fVvwMan?O8$+Xs9ZWx_m!*nCBKs>{slhD_4|dax56T`zp=R7vig{zZ5L~*~
z`L)0dxO+XL7K*(#r8Na!gEsO4b?yU{eJczP#sOSamL3ty@%T;U09^nM8!6XLTA7E%
zQ-Q~(crPNm!%EY6-9}#USkFt(Tiex}C>Fk?`$h*ofAzD+Ne|N}chs^!^7g5FEK|+q
zxPvDVlVmB%fP&kXM>&b8(*-}Z(`{e%)wt{kPvpWDV{(%BH8KsBewxm4$sph}*)@FD
zt(We5{VGb4k|ORDwrdmtn4ipxCJqvAi(5c2Dns9P<RDVU?)ZZml>yeN^e%LzO0fJs
zHF4r*W4M4L=3;7k(CU)!%$~avf#ldb9!ti)9HmrX&~|jNY!>K!7fAC%$cAp&p7<$J
zP9TB*7g;mYx1NlrOMb*lU6HI44L5y*29Wh55}Eq<TeoDf2ix46J1cXbry?J8_4A_y
zAD1jS)Uli=!xCYdN0l)5zL67}yQ*zKZC)NUW*}X))&dh4QYE6DVHTsFr5au}(QCIJ
zFfL{17A|~5ck6JCOkOzv!!T!CfhGBj%w3Kt{S(`^`g0HmpRWGlNzB>B8Az<0B>a9Q
zBjY`Rf-{pERaIRFL!CBv8z2z{;vnVR`EHjpLrv<ReiAc(>_3!hwK#@RcIQN_>RahY
z@yz3%Y#lFGo~p{i&J}j)*ls5o>m|@m`;YK-avd(9kS%8+F2AnpXf}fxi5_AaA74IH
zEA^`;_O02Hr0a#V9Xdle0QFpve$4m4#t!diX(i-zhM8mVFWa8%T2EBzMNxz=EG&aq
zxq&K+F21L%Z<f1<vb5~rv#ndQ{YYGn$<hMj%5B+eW0;b})znLj)=VZ+TQeMUHFF;i
z=PAD?C5?Wj_aH&gLCe=+XR>wUldW6dVR$^qCp@&y1hhGx<+7s8vqU;-*@s%D)*Vx_
z@@>_LSW|wXx~3AsWk=<%5b-+&`{t;>sRiz`sFpC=#Vfzn;}-yc{rA6Q0?%m95B9RW
zgXgf{5Gg-V2_*E?_LqXWUq`$5nIl<h<TC<1eBY9zi6C=JwwHop8koHTbn6;L?<1_)
zlkmUW16k!U2Z#}-N7v9mv?OKzRPcsdL}6>EjRL@C92K0V>Z1~lr0FshW}e>G$jsZY
z7^~<}xyyfJDpQ=d)2vvlT3QuzJUh>)JyLe>Rg%C+k$u-3N5pOk2;Vbf*#Pu@exs_%
zKdL{Wd=*FJPRojwD(rN{$C{-A%VaboTSe;gbU`CTe|eIQOB6IsP4_wCkyi9XshQbN
zR!p-%Axt?Xx?6=nB|^(<luRNx(%KM)bM9x<4I}=ou;c0=g-Qh{ebMTw!qv#OkLIRh
z$j3vf{&#-lDmCd3wHXt=@8GR)Ej=vT%urGzb64~;GWexwGL)-q4K6j2ru$0BiOu^X
zUw6Z^zE{-%{p0hJCdp}Y?z~q^`$Iw)(LG?l@K=)=CsKS<(~mGui(^E4@C}wy@_$eh
z#LNNF=dznjwu1GH^GEz`|L9NjAN1u3X5K5^E-0z`U?vKrJ8wV2tjTFX*Gix<Ua0b?
zzbP?AKR55AuHGCz<EW3L_r?{d(ocI>(LySm%><K{r5yeR@<ED51>eGDNz5BBeqA2K
z6d;gVS-4JDC54OW5XX@({`4z9sFdcKM6q}1=2oF7m_SdIUg@!M{$6<pC<vFt9UO8w
znt3I(X1YMg4wO!3tRDsNr~yo^hG6jPC;T0Y!nvl^!J{t$4^8GC$2V&9<TOF(?0NSm
z`duy?b-J#vgucELBfFIYD*E+>fk~gS%ej<t%TAJ>?>r$VlcM;I>L2c?Hje+%#ecrR
z9Y*Q)HlH^nMpj2R8$6@*{+z+<u$9>*IpRPoXeLvj5rZ%6uX0)m<2LSKm+f-vFqNFy
zEH+vR<{*t=Jt*aVtFF?MNW)uZq~Lq|QF5UfkmaGi7opc!!MLpnS+W0G?bt7R{!>}#
zHet62Q|t(rfLQdPz9}&94Yt-8AXqh;s~M3K8(Ghp6cq*&LInZQe40Vv#%kU!zP*1`
zeg;kFd=XR}ALQ9z<<#tnioRTIK2;Y7Q<TDw75vp@4cZ)d>t^=IN$NGmKmm&v(@gLt
zcd>$&zFk=UeDP;JGh;b;Eg?Mu?$@D{sT}cPGC4{8!jDKU<xu%nHW87_WwbH9&-~Cy
z|B1AniBj^{&e%$)@ZiYg+h*KMpxC+(OFZx9h6NwKX7C7D3f_|$rp2=*r5|;8r`}AI
z6`3RX)HlNFEsAN_%;EiKIl&#n!_^{^7&g{&@q98R-|Sp}jJ2VShbh<&KlE$Si6S`P
z{GPve^U(`z5gpP8T+ayo8!u2m%;lFt^ET}^YmBNT3b_VHcb=r;Z}%qTC>K0WXPn))
zm-3??suHD1%KW6RZmX4l_lMCM$viB&>y!AfScKxz5(cjF$9G9oVNR?-S>cp9mfWjF
z!sjr7gK}{{$6@?!NM&J;?sjff($9+)Gu0CL#L4jpx)TKoH)_bqm>fB>?Dpt$Zp&<2
zhj_OL-Fn#}JHrS1Q&oCkg9nD3V;~>sGdP#u)A=GB`WAasMt{hJOonvWzC#Ys(D-})
zUc|Ya$L&u!d_FK)M_{|*4I8{y+A_;0Av{`_XC_wW1tOQCcKh{i(GPPPDRysl<$(ey
z(vjRbE!TP|um|y3hf4g+-?zmLhU<G0p70W~s72?fFzw)>B4x|{p*}8M=f3`<vA@q#
zD%__i-7m1O`EFUK_EXjOa|9lD4WvZR=UB?PDDnhTKS|WYs}^W*XMLAcj0<y`yA%aE
z{(J$Z{)~CcY}iXMao?$%(F4Z!jbDA_Terd2jGlL3pbbd=?9N)Y(HwGTn6-3qp~K!h
z9nS&8>1%L(iU9SB;=8Fy<9#oIaa3VsEersjlYN3$@Y(SoS?oA=blaL#b_bYbTNNC<
z)6;uH2X>Xw%Hh*a<U?X2?ToQ8QEwh838G`7{3T^zD8D66MXLT(ASZH!IYf|hsWXN@
z<c({qu=)al+!*Dj2F^`O-B?1;7MAlw_lpU;$H0}LIXi4=CR$DT`MS^f9xMXW)W5OO
z*O#LiEODhL`%H+JRp-yG_|1^d&oi$HP|5|&DM=TJ-n#ax?G?~D?XR{g3#)k~4s(94
ze2My6UJP_nZ3}$jL%eQ8`h;cjjps<}^Fe9Awu|@<qnvktMS}Q-RVU|5G7B3fQC_#&
z84CKhlmD(CLKL{c`G6bf&tpBmm~e;B`!+-lwaKEJkzdSG+rsxvM;Ok)7lp6e(qk5X
zBEDv<E>Yq&l6Wi059NrSUbVA)x+?CLIcdCVuG{^i0<a{spVz&Gh^Dqb-xpC)rKkxo
zy2BxGnWF|SqB<`K(GvF>-Rv{U^=DP13+b2=OQzjKxMLmBhK>so`jwuq^i5ZBCf^?b
zegLCE`KL?aPn(Spl@Ky@&eAIIazH!H4NA(Fh&)XjoSy2q_y4K+?%$e?ONE3tZ1Z7H
z1RmXb2IHi_bDf?Ga5Vb<4jhdVUv<whBLgjzqWEi9!hd_+D^fD=XLZF0%KeVAk7_Q_
zuX+Lhi0$ed^bq)lRh=N%nua#Cenhx!4NopUy9JLq|4%zx|5A#p)uBiTy(}ZsJjWda
z+9_ujyp7;5J^LKqO?lt@|4TO|0Ji?~A2KbV5JAicg}~a~6K01C!wS(~8i2qe@aPI?
zdldz^m}&`X@+(<AxjqJ!`S7q2Dl#ki`}9eKP(Jwg79oxxBz&NqRh(E51!!fxb#g*Q
zg0O)gc+X=i6}<oMO0_nrZ+PWv(uQIqEXI@Y${M+zB%)vSl<w00Zei_(2IKxi=Kix+
zUN<nlWJRX>Q^H;JO;=Z3Eci>4A<E?S5U%ZNegE&fE3Y=^pRYomC@&Se`de_|8AK!j
zfiJh<!U&>)*A+eeUvs+Zcluv*`d@Q`+w%WxR{qD3t`5NeHK+gePXFtj{*QbA|9@mo
zY<SPzmKm{5SEb1JS8qDJ8Gn{8Ej|aJR0$@;L<j_i2}D6QGNqnlPPr2*bORYIQQ`l{
zdkSUR9hfoU0<&E2%RntNwu_tUpy9{;!gCEcUPHcrvi9n?__Ws}GD73?n@OTs{vj&-
zFJuG%FVzto3KU-9U6~8|r{{%^hrlp{)Ju^nD$Ba_I|7gCrv^wb&qZvPnNvK5+yhM_
zvW-GtoVEMNr~|!{{1e)h3aW05Yj>Yhg)qXG?k5B%XvC0_N;#%?Qk2wfPuicVRk;QV
zFlbL}7{%2th!~**^CYm4NM!vSk*8c{<mhD+lD8AU{g}Oco2&aNQ&xvt!pmXT<4)#~
zZc`%94Oyf;92QhA%q;OpO2u#assNNw9HtZC;~O<Cs!mXnl8R{ZfRd$So@E$-tn$(6
ze%FShyM1}h_+KE91Qr~8oBAOT(3^#E|58(-!^Mjr3viwPw#T89+ip5BMW*bQy6NTU
z3{IxDxXcjjVc`0J?@rAkKhmd<LLqQWEBntb)y#<If(%Y6P1h<fYs}+IUESYR>!CE<
zM1Ft|WPo2<J!eY6_!KUGdrR!4;8(mi&#!pNFHSd7zEi>9Ze&ZM!ak7a1EoY1vu1{U
zC-u3h_obXR&-Of>33!Q_hE$~fG~}@oqv2-rP2}X?Q!UK1<S>5yQ{VMhB*Xf$EC3l9
z9EbBM97UDO7BwjxV{@V;_?EzK>92W$;5#XGwN>&}AJ)uz_Q!2k)*8G-K1l7&0~4rZ
z)dyv>e*%}>vR^!R4Ul#39HV6LfYnUkc$vS#6R!d`m^NN9iB~m*u4a}ePKdUQL#03?
zo!<pVzAE~IB2Wn08OdSVzMDTmf^H@v_LblQ7d{|n(Y_BynG9PGStAp&31#7N*(L+-
zL;RxUvUa~SM4(nr>XUu*kMdjh*?^z}`0bh)+@=j3<hc=xlNU}4tymKtvs5jbHF+xL
zol#uDg{uO=`Ksl9iLTp9<c960y>I-N1IvJ|Od7Ldz5l0{CjbpK^9q~)husU65&$sU
z7FUpQtm&h9>7_Qx8(2R0GNreU;#C}{r2}{Vcl<Dr`Jglt*uEMco6wG%sQVYtS$^2u
zn`#uJHt)Ox^KQ*fmx}!UFmPkwCgd<R;6B^ExnxHz4=BL|$kst9lc+l>xb9@J$8+8$
zt@;*!_JL;EE2lG97f!$dRS}1LgB}~4$$XEPsnHxGL|e+yog^r5$>U7TqzXebA3uxg
zVw$r**z?^<=ghaT#lU&rmXq(*z=`Yph2S<Y6i6i5$Cf&@q2o>F+CibuK#gdZ=GQ1-
z2DeFnDR4#BXxREt&aw^Tw}g`?Dn@7Br|eFhj8!R-9n0oJz1j-WUkFHm<H3g5O4j6e
zefk#k(*~+Il?E8gGF_v>5mhEez?aivynyM~D>93l(4+NNH_wjJ0P}ifCA7U_;%a?(
zlFhTdnN9P^1@u$$3lOe+!U=sr_1o%jDRAQvV_^Or=7hkbwi<dwEY)%;u7mQH_VCD|
z*-dQO>!@7IDTst4Yl|(h-2422({Aq0VCV2gE%}Hp*2Zv(!;I_GRbdy~kNaNZWClxy
zNJF&xew-m&yP<j?Ry@T&42fTIgxosZ(v1h=OfO`LI5?3)3p8?uc#;;N0OgmuPn0Zc
zA=<I^MxT4t`%5MHop%C>8G!rA4f(iNa{=ipKWZ$CgU{X}5OtoD&>4=!Vm~>8XucGk
z?%eCUaOiJ<IiS>5wT+jo9DNEHHie}T<_P}m(vK@oKX~|wwn(&EHv_#s{CYqL_i3V-
z%XCxO)UN#u@>(h(lR^j#GG5*KN_KkSsqdbnYp?)LpWhq9FKuT6PJ;bmOl@8bBht6s
zdH>J`zv$77|EWp-6aNZ*!vnOJSp6#S)xW&;fG|q%4&PDJ2J;H1rJ6RAbwUEC`IIag
z4!Je=agU)$mcdacvu>Sz0Wip^7Y1cgE3@#%%U5VA{$P6a_;4j7ztpWw#=qpqbTln^
z#^W=<F$GpMI`SM<sIaV%v~xG2o3+Ws3n#hm)ymrc?7LI|#vunv0o=!T&o%@2ao>Tc
zf%l>Dk^mC^Q~Mo;+NnS$?U{v0F!NUSi_-x$tFrf}kJUi$0<AYMDQc6>4%f{#q5CH$
zrc^~oqS$R=B7kRG>}#$J6`BRc*bG6p#Wh|QmYFK20z(&aho2m~yk#&9-QssRx}CFn
zK+K#PHFMs+A1{vzGU8$ko%d|M_7mKjoYcIMD8P;AR`q^@7tbQ=NI5&vE#x7}Rhs!t
z)~YgLGaj?7fl1G&p0|dh2|Ah<{n+U$F@*?_oXigLbRNhFO7mBhvZaVzzuI*{LD}h?
zu+6{K7>L$!W#ECWJ`o~V7aP13%F-uyynIt?y5sJ~<1br(vdHxKbxl?%nYx(sQhsnL
zZX_C5@ZLVYzC_aW^X=XR=G)Gj$zC5+lH!PT+5(cqlHA+|!#3M?>hQxNG=7OMD02;x
zb069QV}3&Pj|Z~#-vXC!>Nrih&iWZ@4ZnK~nt1B|vwT?u#Va2Zdvi<zPD)F{<LOB&
zT3nzga=nan?K07$rvjC-7W$0CLcVRxuve}=D0Rmth`ni9hEfzrhH@U~^VLm|KtLZ(
z&;67;sK`)00@Q-Jd<8ByGKTA34=d1v{Pp!SNL~9<*Pcnr6b`%FGGAx-6Jo53W17c`
zto3+;xN@&B%=#@*UQk-c3te+y7!YhHfP?t8<x|N{%>46pwS@zz@J%Qr&6l#GvKMW{
zeC$QA;6*XsN|)SB#so($2~?TF*2AbNYbVPp8Cgsb=>5FAJNBnejZ=_M0{h>j3;<nH
z`~a@0vipiZGdiP0PtQAVtgy>;Z_TEx;g62xEHK>kr+@Ik>!Ea_D1Z(!@>EMCfaA+U
z%PoqCNi%%`WIFg!i}c)sVx{(CnwVYh*p+;`SXIP%<;cV3=N_>Yw^l^@LQgTuW2613
zZKtFDWVZovU!eDSF!i#kZRsw$nWmLan;6^%B(H3M)Jwv|6!4sP0neFNhngSDl~S(l
z(zsw>v~=u+!<WxUNio#setssBqmdmi&S&dc54we{&c<}IMGG)G3GAWD&+#jELRSI^
zIkwja11VfqwF+CJc|9;9p1k?`D&q0nQAMGU1#y8!rO8WG$clmU+|q+q_eVs)2HZQD
z#khHm0ClZQQ=j?IO;}XSFdqCAP851(Jc*-4Kj?9O3ONL)-9I~|r=WOw;p|{1*Qw{x
zSD%<nUVW_4Vv}w>=8#lD2EiSJ?a<^XCg(|!ZF&kl`t46iI|)A8{ucy!1BD%+7x#k@
zq#w~GMIA<Tl=(t5fw%`{spvy(mFG_D>~<R$o_I@8mYK{PrN{T6^W(+l^!z7dGOxE5
ze+bHZou4iO8{-$AndOp%7Fb~ql>G;<71kx32+zj#PAA6>=iVFD30Bp4GCvEnJ%8zq
zONAY8^L}3dn*M!ql(Ho*wl|52mNcR;b?MjPtma)rj-6`~{iTAsULx-PY^|GdUxR>_
zW!s82PI~`B=DJ>C%?U01Hc3-HjKk59w-{!ZZ)+1XdZMLxho9wH6EiCq)1BwM{lR#&
zJw85itg(;5wGS}9q)w2#bhm>%olpa~wB3CsveJLNaaON(C*a@P%x%?wfj5>i#k$)_
z@Vj}SX?8?RpQyPEIFnTCd$oiB4^)X=pjkrVcDkm%{rV6#pYGA;Us#uUK@J9`L}|M=
z0qfzjKc_v~gs{{?3xzM%rmJ_piA>lLk6~ZVz2W!L->JJ`*X=Z$sBt1CSA1eT1+-c!
zJyMAT#<55OV~uPiZ}L*j2L49<wfsov{}mphe}NOV#aBe_cVGIiH01pDAGcR8Lxg9i
zxL`6pmZnCV^rLM0XJpPh3x#&i%<%NqEk)q|l4cwp4QM)Jr<APxTGL|@fIhO@`cN&-
zr;WsS&tue0Ztan%|J}4bnz|!G{#m`kx+6SbCX=-Kb^^yKF)(r1j(e1`$b7Ww{*;3p
zrSn=Dj?w7!1@qqf%rJZbx7}l@Z-Uws7#}hJPK97`A%_l)xE^iEvA^qn?}kY-k}H~2
z<MD<{zm7#j;QVXGg@6hgmeZD#Nq^0c(<0v)ZFN1Ov0}PY20ahOtqqkbw|xm|RIB)2
z0mrG0G$PAAJfd141PPpW2@a#jU!8`!^H{G3Os|1+G5Jqd-57#evAvik0`Jz#RCoqn
zS5cbPph|R#A;Zmz=53X0nLo$TXEvZ-`i_9<_6ujdcEhtnEq<PUHo3|8mph3McjOW|
z<EAecN!^T2Ag}n;LEnzMf~y<s7yEjR*E%`isE6*WFLcL{BH1DV?EH!521@sDOEaxI
z*u9=x@yG8YzCjTM;FD|E)vjgvK6*tHCy32%@-|KYaA&?>*cI8A(@S|Bj6}SXJi4DT
zl-yf$*T>s+*T2siZJt_ev$q@WeZ(-FtCV6X=)n~|SlbHJHh*8<a^BEWj^qLAkAvD%
zGNhuIU1a2tcUGrE6W#VR$}};2F_96TUKha(&q+`zOvI|%4xueO5D2m!xD^$jTQKi@
zdOf2s_X3s4Qk}{?P*tZ31IXil!=~VQ7nAYx{>4GmH)c(qq&+LvDh$AirXZB*^v@u|
zjxT1j=Cl=lk&VB(D+8qejJOmIkE!<VQeEe_k;{=KCxocT09e{0keBy!ntK*+p^vvv
zK%7aP{poRw9`g<<i=a$-xyeJ{nyTJ&sEk^+^7x}@K^7UZ18;HdpPD+P67@bT?8e;?
z#Udg1!qJyh=&ZjJ*z+-0eEC1TI3j*RkAa&8(p9#k9Y^tQf)NGd%Dd4*&2U7x5>9Ve
z%uoaEA7!^|B}@24RmM2!ZQ}GicMGaZV?4&Pa5#4z%bF1mo1PRC=B}Ma`K;=}y@5b&
z)xdH-@7n4f!8dg`+Cs%_KBXM_AYf|X(vhpBSMG?}_e?EEP0Hfp?G5IlrFO<*^1e(o
zjy!GuuY^p}8(e0|Tr<#aQAgf4s?9QM!4RH>6AX2@148vg%={2X4jmZLsErk>MdLGj
z%lrQ62-?ma`yY3!9b?qQjv{{QD~_9-_E`$-J9Qx&n@*yF!l>lND)Oz}a`FnADLZ^!
zchmh*kK`ggPu=PqVCKXvf@c~C?|%}<M1uGcFruH$CPZbuIDN+8Lj}|^mXb2qn}%53
z{ykGH8SM2wToS%pxzzQrV|sQM82&;L)I>o%h$7PqN5DKlUxr-p+x}9I-cJWebW4e{
z@?4K~_sYRK6*;&(O^qXWZR6r(&?u^AiuXJ5#YSCqcV+_)GV^b<*s$67ag}aEWJ~@5
zWk3Nt;DETVkbq8NvQePRD<;3QF}A{rw@rFps~0z+3XlSG2C3!l2dPf>yXvLymU!G?
z@F>{b0ci9$9jahBY~gA?+(U%;>&^D8aZqvWTwB%6pUTb$xxp(ikX+q~SF2onL26F|
zrvj$oRIfGh7!iQ#1>7NokDa8fqp~oGnKBzKU5!4u9nX;}7RqAjQBvSq!4rr0h;mEP
zAVe5)Tz$MbNHo|p(g~gH|Gd3A?NvahkqU$G8&9Up31;cP?)vuZxYh~SpBfCa84swS
znue+D!D9B{P(GwbUwwyiOkMTUj$sh8AbJHZF#Hk~%|0ch;b>!Yt*l%y<J4cd;#*==
zV_mMC!(+uhcT*>z3?5)qDwW3mjSt2w-cA9Fo?pEjO55M!wI_Y;$Y&umlL!ojG<IIy
zBM$6vxpZH~TOX;+$Lo!2<J;EfSYDFR>B@bJRh5a;60JNv`}6_{azVK@<sq-#SrCy^
zvqY*JD*QXm6}s1*a`&H2`m<*t58=p}_$tkn(b0U*hnU}b|1RJ`O_{0HnQvj5Cn+|K
z0o2QDGc&V3I#K{tx9XffVG)odp8%Cg>$P^D9v-7<uPzV{3&DzZ1bzf;Y&BG1u&oZV
z)I;psX#$wuxb1bQJNuajdrKl|czoFA{_-o4S3HnpBqP|jW}YJlIG&`yZkNMQEvCVT
z8r5Pw;A!Kuy$KIk@Wj+~)0i(B$|O8`{3HS=vV5L+Nf?=ax|nu@t~It@>b<oMvnqk^
zW6C{xBAwqYOaT)DlK`V@S>_5DyE=(CCX=zS++k0HH>hu*d_r^?Sg;e!LJn1C&O-py
zx#XoQR8PTP<iXOJ$dudmL;hwM4G=owJ+_OFiu~PixSu#TQHSyAP4!$g?Mp^SxB0aw
z<F<m@$k&x}d-JxzRp>gkqV5~Dy=#zh%)__yJK;WWd=A(6Qz|jdl3dmwtdEz~it}OL
zdul-KcC=;X7SIOh^+mraAIirY1lNOSm=c}-3o8b%n%?z&IR3MDJCKyCbT(2GrYCh1
zKK@q`m>Wa8(_yFoU39<?G5vQ!Y8DvH!+u<zeb|Fj?@ZhMaWv|i&`1)Y0ED0#QaAHf
z%%y#UMc&^aa5D8C6q5)D+@_^9#CX4X9Wbdo3}CWg^?w{YD>GHNtmDrDst6weceQ+&
zZNTGT6>MyIM#!>p(bd=c$TCqwjG{Xc=;uim#^KNPo{Z{XYh%MSyHK6pV%vQx^7Fj?
z=FQb@m_u~<M@ke8AQlvGD5mN{rM4#%r<w$l-0Iv3s}DF2ga?CREah?99-N<w-|v~D
z3iN?mHFc_8VK2K({{Ul0@2c{FOv)OA`^0EKG=rF8%*P!n?%9S-#H1yBd9f~@dP$wW
z=-zxFcj2$bZpkRzVFMIdi&lp+9zN#|M0~u>^uVh9Trm<pdX#;$wlxuxs-$J@Wo56Q
zx1Nv3lI=$x?FC@s>rfqZiYEb-Z;?8x?cTbPK7|UpX82Y(3Y_9YXc!Zqq%A*xItKa+
z;r`h)hyR;R11MYqU<elO7!i65gKU5-a!t))(cFU3K&dM8jj`CRqD!|$2l**i1rxQR
zrH$4W&7rO~r9!oic&uhY4U80+AwI6)ai37xp()Nn#W<VU$-OgJW<QV7{upJJ5X^PC
z*+=l6*Vcku{fiAwvyl~n?~(P@JBf8-JiDHryl^hdie4t#s+da3vC)px%L*99qX9ji
zbue05KO(VO3!__|u6F4Uh{0S9=J2QzVo^(@ay$7YrC2q@#5}j0AOw!pK>;nZn<^K+
zm~lN0It|<P_QXU?B(p%%q<Tl6g8oyxGKHSu4pcwhcg(1r)TC+Fe1zcEP1I0enongA
zWLR9d8gF$<sAdR&4)9UaQh_esrnE_(gJ3Ley7RSB>%*zOP@dbtr~C&eH%oO7>|=TK
zg4&E>4|@v1MV~2DBCVWUpu;O!O8yTijID%Nk=1QuUAI$I^%z8a?rgT)LZ<lRg{+}?
zf6lVMzrlS3ud;9jaD&t$t+4WU2>xEYu+9uj<Z#*LG97-v-hbCsT#pT<o~2VrB0nd}
ze_JV=bh(%cc|D`08BjXOp9<W=!%}xY!}~(@qn#jEpBs@F*4bzYf>U@k{CH^%$|AVy
zT=m5pxWY|Jq+YT#Z-eO_D>67U(Ir7SAN)NW;E+gVKE)soFYau(B>)?Og#+-YBheeK
z7L+h(<Hk2OaeFM6nL6*oN|Uyiu3cUL$T+SKW)N2(gH+=isS^aqudm=Otbr-TSEYn?
zHe|`5+t+n9A6C9xw9{C@Uc|4*oxdD3{AJ4!&m!f*jOVsVE3V^j-;DN_%!cu5l3bjg
z<)dfI5uR_rScNf4UR}z087sq&<!gRa9B%+&|Lvu&)r%6KajwvWFzdA*{f67=-taB=
zz51kplahy*@5V1N#B{2y4>+AqIvQ=907?LV*YWqn7j;Xy8%_T;5=Ewl*J@lPGq6_Y
zglVOa&HNSu9R!j^rBv=)3%DAx0zL1&V~{1Modrvy&ckt@&hOPbX=rFi<pHpZqR^j_
zDUQGlQ}Wu~?&e7AaNF6oB(eVB=C*ZO$I8()0*`%(?e_kKp^bu{8-nKzH%P`Vv4fxE
z>kz4*65ImZ#SkzI0#3yMgIj@-DQS4<Q6Pih*!ZWjuuOJ$7&^c4A><ps3uhGAS|mSl
z7yNT(4RBgqO}u56GAy;b6+c)Kfu13N#v#$D25_<|*XuN5W0XmihI@U5X#8ih4etrr
z6ycG{d)>AUV~H!ig$c{@K6AnyWLXogyswS9wPjm84Mjt+E#jT9@`&%sg;NrR^%ock
z{0_48E#cer0jFN?2GS2Cs$6!UYd^Eu6zlC}&UVBLUC5$tAPO@6%x33YTf?KW7nGL3
z`5){Hl`Hyl$(IDoLx3kgB}8ywK3xYJi>?o8Y2^>>YXce22s%mdBH9=Ywyr(mfiCf7
z2u^*9aeeQwE`#xu-L)UTH>$;HiJWc=ea@=eDSftDKePV4{(P4qg6U1?mz`}ur4!JP
zx2R_YWH-|sZUW_AoAbdR6rzNl1JfWfx)scuFWIBfcDAIvZyo>m#O^+S=WNmcWoZ8J
z`yhlUnO-jlJ-ZsF#TzZX`JBHSo$p|W3u|MsPPqZS^es@93D8%s?(M~kT}^^tE`@$M
z2fEG}wtSR=dI-==NAtwA-OnPG6oH#uDXJjJhJg#I?q?rgO)E?SoZ2=&bafjoaYVP5
z{|NVJb7Fd_!U+u^b+7<Z=QkamMlbF;c1rbt>3^KwUc1z@w0JTVAq20PR#dJyUFP1x
z!GqIIQc5_lZ^yYYsg{7qB^2}h4#qWz?#U#ucIT#Jf=))$SE!mFw|XSH1OP?H1brMI
z1A#$<e(?D6$k@!wYP&R)Lh?(xD(Kf!<IP}-wjLzhu~_2<OL`=T^*j1n(&wrn`YZfG
zYS~f^Yvx$$ma+UEem?u#q?Z}X<s79bi?F$q^3WND&?Z#Pd9=Y1A)Sqn*u0$h*EyY5
zb<eaWPfw?hsD=)6-9NrP)$<9lrO0U@+7fGTw|+;0xEx@yCVkJmc_~~NAyd4JU(r%K
z?uQWqljSPJ&inn)yp;7_;Y(*9`^|~mi$W}zAW#_oS<1C!czTZpCJt~3Hry7|);siA
z7t10!ia+AHzs}86IFa(7FY4%d^ymHf_CREHt1uLo5ARQj72YX&s{DV$o;+~usX~Cz
z*o<F;#HT9v&kl^v=2o6oedowkNwySlq5u9OiO(*!>d3v}3v^+WQeo*;;>{JX!)6MU
z!fE;om(wPWB9(`L-i&N-m!+%F0danxq;k&NNFVouP^tZE!gHg@y|%ia0B2^yX3`DN
z2M6l0a({Rsmop-W4t)hky9cxIPI7vevgvuR;05c^>cFpkWsRWV%n@?v{kAD^y$%>S
z3b4KbR47nc7UxA>`Gt0t`HSW*^j_yT2EBHDJ2}g2wb#vH8}Ksb_bJvvPr=D+F8njt
zP0ZaA->PtBFlDMDhE#4QdT(&Gq>z9<yxd|sdfItw*)iVGECr3y!wY0~Aw}stKPNm?
z=%5m11mWK&GoSep*BQYq+3ay%*!2`bj&3&Pr!&L+yZWzeBU||Tc7p#9G45x$a7C|x
zz1Up+3whBxSMEds*rrQWwFgcx-E=obOjP;r<8`@N;KD#SY`Bur1IB;BY3w7L=`?tD
zxE*)7ClQV|rvm$-tPXmlmG=cG$~M`9waxUIdMBj-j-!H%Z6|N0;xmQIx<1WnV)gcS
z-)%~r%@RXclm6j;oL>r<MZn!3kpug0vY!)!6Bvbc7k**^F?o9j3OPw0=eOWctCrj&
zPfJcNm##%Wj>rAc5-{4?-rEAmQ*iV(0x3ImGxJ+t7n_1^)OXFOr9Os}>d$s)TBXwp
z>&Od&iGg6SHTY!YnFSTv<YyIN?3wpg>h~%1MOi9Yliwk7KGb^y1<12a1a6EL4t6SS
zJTm-6227x$i+Tavp&6^?==249AtIsm&ShtM;kzJLEtwaVN$eO2&Av4-<T9g?_Al=e
z-(EKGyRFu_oRPHEH~~2nF;rdq-v}|ET<*@mzxWLJf4v^j0gjQm?ut2jbxDrQ3{oBI
zlxmt9Po-&TZLNwIyk@b)#;zkR_Tvku?wb%Y$P#hl_n<BH`<a!Qmvg+{*^;Twt=7k6
zd>=lY-Er+kci9p&k*or%uU-J1=JJ;=iQnP0;KfR!b2Lxx;Z&5lX0<z8ZO*3>{9qav
z^<pUCjMG&QhzLC1M{}<cze<{p@U8o@2ABxJ9Y=FIcwOKlg!8Px`|=6o6Jt4E^+wh5
ztlY~3h?@@k+#H-r;|zZ#ra~#4ePrW#QWu;{A}P$&Zzg~9A_tOwfYW4?rzKWKA<FWz
zW1*AD0|K%@waR&l&QO|asr$#<;KFs-Wgjry#?G+~l)t(}oMh!kuqpcpPG>YKh`G{V
zZ<Xx;|4S`=j89V4z}<OR>kc~v&WwS!zsx6RS1g0F_fXoI9i|OS&Fw7mWq0b1sDVK?
z!%NEa8r2!C{Q_xlurW7C50iGXSz<rVygu-zDUY|>6#LuK9D;zfjTbhs+~2pLEc>E$
z{I_HuJ3QGJrF!KUWG-(uMn<5ORYRN_?#V|T09Egzz-+gHkI8~umg$5~MmrwVPJ)4m
z_!yVqK3<I@&<80S%y&eo$ITtoB-Iz8;=K(FvCbSnh`MK}q%wMOHdxL-K*?c$+ikC2
zSF9#SsdEsb?fxBtLoV<No}hW~K1{+)b9W>*g2Bz~)<m%zJ(KzmF>GVVp6_-#%&n^O
z(_Wi5_7s{4b!l_@?^ys3w<b#EiL5VsmnzDEgQNDfa5Oo*RAS&Gf}x^^GgRmY4=CM5
z2i=pNR99)%<XSpB)~NW7y^#LK7xt_*-TY#`-trBTKKW~qJOT_+`~!w$Q7Aml2-V7U
zOQa$zlU_?5(d;k&l5v5Mf5<-Ip1<NC{p{+x{D^q{qb`K&1I~JuR)N828WR|G8BV4e
z_1IV>V{Pa!s&&76(o0|GYCo@S1+AL-N>%?bn0n~EU#X(G-LlD0uW-CM9#Ax6$nw2>
z8ag?)BDst+4NiKj_(<mI+CYE59=#Dj_T33(7I(c$<WaP8Z^FqX=Sfz%0u6TaCe~M(
zzmCcP2<?v@MCbdPk`F&foBeCT!XIP(Vgpp9=-;^_u^wHP@2a2cwaE?mCSCN3zBIK{
z@S7K1o8r>?{w!TeP4vf|6{N$=%Zn=i_7VPP9&cegXoYV;c?Cpl&!>y#^j4usVx*ah
zj4H7{ZV<m8y=xwaYnK{7t6GIwC_p?XtKK*HgQ5jr+<`OZ$)6fvoakm3cujlq@W3G+
z2az+kK#*12=N6|2U-sa^le^_jkN2>X+Nf+GRm5x!jC-UivJ?J7P71d<8fjWWdzAS?
zjpSs(;0$eXx&1f?B8uAc^97_MoNm7uCTL8v+v!yPV#?I6C}vxe*Y#wu=aXQgF1?CU
zQsCe%Y@MC{P|43mfBAxYDzCH}@>E0C3T&+%_!Xzb4#JrL-H5Jr{*Ypr=-99YjH?Ik
zzlovxN%6-it;7gl-(T~ePALNJls;cOr6oa;kk8AP;i&$RgYl>Snvrg7^lU<^EAU|U
z8~2-swpQ})c#X`Om8~uB2t4vECW@H(A&1QrUHu)Xz>M>>sPga&6)o2=o>Fs$Y9C&Q
zMtl-3>s#g%HB;zpE+#<u3SlsnKUyDRMI(jv)>FJnZIc^@mShGMbq8C2+()4)a+`~I
zQ2Jrq#I1^}i*otH92yWj6XX9T*25-9mg}uLZl8G^Z{Ms7+=nfk^ooFL^nl)nPZ2N1
zcMUVlUX7;-Juqu}xQT^<OQrvb|J7+p(=@Jv@_pUl;^bXJ%cftY<U0(fmwXBo39<tn
zVT|hZ8@6r{yi=~*Zp8eN7sERSf@ji-OCq(>Xr^3~I_BIK`;AX?$ub5;U&8jF`B9XE
zzF)cd_@E4x+pXZ6T_2RrOqt773cpt3vDqqndYb>za+c+jo&}Ot5p9<jH8rOr(1Ed`
zyCB-<m1{|yA=#M}Pg2)SQX`MJ7DSIqgAQ0gb@#?*&YVxRTsEmQlRhXKDV+u4q7tY+
zo?Y(cu&_{%)Y^_W0)e4eNxk%FWcCVKXPX7Q7or(5+z*z^VxS9hHiKJ`E?-JF1E^+#
zmg;4lMFNLPxcBjl6sLyAR@Rm_w3pZB_^|8d!4dH?*SJw_mL0VrEkV)68JKdhC{+$;
zYhIA0JIHxn$>;$AH%kcS&dM?w#@O=t7WNHfbSlrkzhq-Z%jZvf$BgLJ&rmw%x1C*{
zMFlYBCwSegWXSt=76UG4uQz&X>$|`mYpWOU?zO#5;k1wsS)9ZyyuEqeE^-`k0htnc
zRWn^mE`3RQ4)aY~gv_jTJ<}8G%JF#1kgOfDq21(>Mln~l|Fx@YY^n99d2m7GNwstQ
zR9Gur3Z<-yvKI3bM!|;$eI1(;_1fp=Gc@{h^S2&^yjQ$usL;@}vtoh$UVlH<dh;iW
zkCb+5uQJ5=Op2-=#;JXq|MPyEU>;*x8AlNAAx989V|$2a+)VG(B#yzVjrEu?(Qa<<
z%^5c?l_1`uNuhQLG}B)01(f@$Z}{8A?Wg%Kd`hsSip3G1VWEDkF*j+RO$x=b<v3jV
z7AydJaUoFnc0}zU*uZ{rkMGE(bjSVVY0<B*UBMB+?c@^fiLiXN&AIumf+)j85ALE}
z;37A_wgtahYFoT}$X*(bf?O*S4fg03kFdS|mN>8h4OWDG9*)o8Qbz{a`FwtgjDfML
zowZ}v(C=l(!Utg=w*WH{OfZ90&bFbHOS7r6Sn;hxgFz8f^qV1DnJ=Lw8V%?3lkq-r
zb*yvCLXms#HZ73ONbt@`9A;802Y9&Zld3BzyCa}9D!sPBZb9g-YZk#6yq(_$gE}7F
zOnUvSv$t`Oc6J$J%T>-KbG~VSjxsr9d8cvh7IyN@8s2RIhTYHKwqP}t8jjQVMeK}%
zyoIEHzYym#Q-d@LuFwsnzrRSlZ1`kyRAmtBng1mYS=CQNe59jBsK6(2y9$CA<Fs<q
z3v+kXn@y=qy=g6`p47G)b(wfYtWgHByZ2dIw~4+N;w2YaL-=E#<l7!VE90Pz8kK@J
zM|@Lvzs<9~DwzJ<yiqfC?!LVY!YZuRaZCz~I}1z>gPjbrERKa|qGCr$Y5$^ptQ{0y
zBg9;j6lY7T6L)^mNc1mtN2e-Mgs)VJO{O8zlj%|@jQDMZ(GN0*SG!S*nPeVmW<SPT
zJ9cO>%b%O=8}FAn({7sN<}o__s(Fan>-i9e3+ce$)>aF}ED&X3j!H;dM4OFldtuHB
z8^z4GS!t1MfXS*Ud!^(2Gp2sq7AP_mo0n>;TF%77RZQ}$e}v}s2@og6Lf`ZC!EA;*
zjo860{gJ@(X&MOs$y=Qn+r$c$$4@%ZmY#3k^?HeFGj}l=PlE)0xpR9&<Ub`Y1VCIQ
zf}CN@ZgwPfWYBA_+ibXB9<X{eQjgnSc6iZ+4^#HzB$PS?ltq7T=(`=Q9Uqs9U&MhQ
zfY&aIbQZf=W6@kY46GVTxO`r$>gi4sS4d%wLu_@hLINnoWC*~*JY?N#NL_+BVd^(u
zs)`rXFTW_~2tHo?{zt&xT+cHD{-xVORVdO~$~(Q%1VwZ@aRpHSi#wKHN$xNuio^@W
zSy~9#g-ccURNohZVQa7YK*!zMf<&reM1oa}iWha&wD_P33!+R=M82&Oeb8lqbQWk<
z=UmFK(a@7*Iynil63M``3Kz00lq;x(ff{yZxMn_xjJpm_I_^ir6(E`W5w(AY*xCl6
zn57m9+WuQfg{Xw#63dM<Mh2mn5!AT7#R8PrD#7!#rPBBwk~&S}J-AX+X(FST4bpYE
zBc6{(nLMv-?J>9Ae=h((JcUYszdotkMU3~q-u?zM#%<t0)tb6`{n@Q%6W|%o4U}${
zUoy?;V<Z@@2#s9Br_zaImOMs0KMR;5+%d$3(;wi$4J+l(#;<PllKpLG2(y!rhpX^9
zU~EiCU=&MAWw>f+&?96ihL9y(RV1QrAb~$f7E>agr$^%QD6qB#$MeMm!`F<<^xG|n
zX?raHr%!;t<wxX)in%IWgD7SgV-FpnMI^v8vpjI^A7n)aiG6&EkVO>=`dEfk*ahPG
z=NJ{Iwt;cr<;4zH_-A?<{W&wv&e+iY<Gg^s2mW2wWVPC=n1?!24V;Z&-(k4CM={`<
z>Vt>SRQPWV&<QngYKCnho^O!6QUp$VIpDHq;5}YqE;d0cxy6w|{i8|T2+{uiCFHv&
z#_;-Z55hz+rUmkRfM+Uz0Za3f>;aznp*jfd4Piz?2Cap?7eqWNi);bY0EQuOJ3XUB
zsDm06@pNwwH-1rI9jsdzE?UGcTz~OGK?U@^&>{n448KTb_gI$$_<4gJGH||S=)%tl
zJ%lViVBi+XMA1SK&s*VNnORRq_$lHu`;jYm-7S8FdYT^|8Dhgl`yYBm`$*?SnX?_@
z%rgI2j+6TU_;~>^x#T$)7LAT6?LCAn(xd>eQbjwC1ApE#+%ryaw4%~nHnCeAzUD9g
z&rD-2{?6Dh?X(+=>|ChDdCE^e!xz$*1el1EPA%WjXFvV*Gw}QN$jhxJy7`?0-yq1C
z6GvDQrE>=gLL-RKPlmxKGt4IFW$c11+7!GVFIVj{=-pRrWinWh+TcqWpoXjaA%}70
z&rK9yW$hK7anRTgbJ6fKoB8#XP5dPQA#Auw3D~hE_#=T&F*jOvN?yoy1yE$akV{Ln
z*-b)$pFygOvntt{r<m&^h9TM^EL{O4_ni~g{B9N+g^gfqXWfS+sxn2SKSu3F{NWG|
z<en|JXKS6U@-AIcw-;dyO39-!iL<~W3vVD6d5d}W7{17x^{tyo@I{t-f`LVz{<VvL
zX#tflTnPxG*EH^oF{=$d;;*eu=1ndDsqrN?^_f0ID9j{F-{9aAe<Jl{dO6+Xp<$)!
zj5+$rF~)kv;<H!}>4LC`w!0M>ZtQT82z~ePsyuMD>Fmzv`>MBbd&y_vu}C2sf8$E5
zv^G)@+=B0DG;AfAuA1I*4;;S<h(5#^sT{(ww*TOtbLBr|2*-I3SqCfc73EtRg%uQR
z_a(?{YBJDG&;PZ+{&Bj%z@B6uB4Xl>b`pppVa+T|`E-{zw~*WIU8Px>^6RWxX@qiC
zXwM$?RxhoO=O_DE6uk<S7A)dB<QXJzE$BEToIL?Fu%Q8U5?1L`XD~Y&%@2PjhRDiA
zJDi#FFI)Rd(HDyVQ#C<GZ1Qp>r?I&?&J@Pd5^!zgYa-_!gmQU8fxoEbKI%`tKNd&+
zpuOH)i`v&h1^+*OynS5PccBtZL=FE$Vk@XiB^Vra`a}W~z6lV_#ZDJ)Bz4G)e<?0p
z&VO6;C|pDqSuwv_Jk1xmK>QR(Z}-$7e9DtYT=-Zof#1}iDl)Q8T@{~<X*3^hpOII>
zDZG>GTrsgvQ8~YRdr;%*Xji3TT?!&PJ&Q_|m+Dm<ZZEfb&0!-j`iU8f0C-)Yk=qp)
zwpea5BhzZ^WWW;8F)C^cF*rVW5}=r&p|>ypC6cRCK<BebnJ6=w*@b(3x3;`xHJw;6
z2?HwXDafe?v3#pc&)$_NRLrfN1;8j6PEWU;C@qb)!kY^$N|C1BC(yI=t>j3}0~b&c
z=YoumwZC>yg@K>>bV8<zl#ElNxz<DN-O7jIXJn+ndhS&Sak>^H7v4XyGr)l__#tX>
za-n1t&R@>tFTvTo1$+^Q7a+9TptJK0(%7`zTy?oyJ~^E>3{MvNr&_(?o?_O(3k1S8
zHnG6s_)$?IAvU7;S*u$A-8y;x{xFNOw(U=B{bF!Ni-j@87UG@0(CjXPHEo~==E)q&
z+I14lf;D`H6HI`1S$9QzCx<U<A9;Kq(5{E4rd@E5=c$fToL(sDOAIXYQ8CV6D@1Iv
zjRt&~-Z8(1J<UzktJ%5KJy=-|?{;QQtdrG?Ja+?rpNbcSh}q)XbmFwU-jgR?X*GH5
z@Q)0x8)tB+AEPk&)!B8oQ!uFDPOSklTy+|1kuxU;7;RV7-FhB?BRUh~Tr@{@1V$^i
z!}_S;e^1xT>{LTUJA9W;UljiPcF5xcqiHvTJk5FTj-$ah<L^VBn;AIcV;iMcOd2>x
zXtqsqp0sSF7wZIFvdtah2{kMsCnRVN^o^OBE<H;Xf9398XP!u^#b~kiCYac=ltaH$
zfUx+KgaXW`b!DDXvpp;>i(gflKw?wwYGp&pi{s0cbEp7{vLZA>oEJ4hoNmBAOTx~I
z;hHgf%gb!tbYM=jfs_2}=FNW@hZh+!;H-OeGHf|?a<L-W%OqS}G86CIp-^f81w97&
zT<!8JFVP%lbGf%i69Wo`0a-a#`s#M6usz4>n*ATcqvzJ#!5U6!F5nF{2@<#?zLVS#
zQ(o52Re$s;=w#)n#-@{EJNKIfN&5=P6%=cy@G^tKMaT~!ViE-`FhB@&#E~(T9fUEK
z@wm<YUm^rh4L-0+{$}YF8(^G$=^;x@lW$HApomNuNiFOM^_N1KnBYyz&K@2ixoAPZ
zK*cD>p1Bx#k~w2gSmCl5q`yBZ`1<Ko{%C;x15Y6f%yVc0bLCbgCu!5LxN_&?uFCSl
zIorT3n?1M+Sk($~x&tD#zAzWP2?uU*LY&7OAOZ=Xs||d&Zwzsg|9!%sY{F61O6-~j
z_Lzxp#<H@p=|*38qcH!GouYZ*T_U1r?f?V;)S&7EZ-jsLCsjl<;K<0!dztgND<8;t
zR>3;#o%U#Qznbg1C!Q}vzf!FWs%uS;3NQdx8+7};rky@>dXll$J-1}s!mTjABF-gu
zG*+tRw?M7Rg*ZLnD~8mHZomzLCZxwLklR<W6~*k$YdumxP5)!PxJ4MinV4vtVau<x
zad4_Xmm;<_hoeeJNGQ40p7YyrJYy-UsFSR!t`@=S=<14kZ8xkSA3_<sGU6xN<IcT(
zX0Wzhb{5N_a@d~kt6WjmQHlu&uU*osWXB|w#eE$k!R57X-K68Y^dY6HdO*H1tHn>@
zA#;Tq6@X#-Mk~%nQmo-NFF^$Wg+9qNR^bLtRCdn)fyI!j;c&0gfM@h3Xd<Py_6?w@
zs~vsv3hNQ;k3Y&iz=eBauRFKdb0DkOM_S|p0rETj>Fc#T>OO`uJ7IB2KLl-D!FIJa
z`!kc;giqB2jOhWTVa4^@pfHV!68r(-XxmhH$ZM&=7czyt268R9uV8@<*JN5IRx$x#
zrL=D2<8T4qQ}CMW8%?_{*1)O64f>yvTL^re_W=NJ9wLrrc0`HM<ZI@1=;#<1BL+O~
z6DKsJCozn%u9J^FW&pO@N;ThK&(s7N?9}{F2^#+#l8^P77?4K;F6QL9bTuEe?xLiD
zbK`DTwo4?IwbU*5=K`a5CPNTT*ZTo$JbYz$TFILP0NwKP!n~7N_mB_^8I+y%0}E~w
zf1g6=WANy$mmR?UOerl#QbP-E`QlCMbc)4guF)^xYg40A9u7>Q4ju|3dpaZ|*|q2D
z9-8e?+Fo8i4kdX!p7A*<0sbc$Fn;D}RIl4mRG#nNW@wi)j=DedrI+J=JqkNqKt&jL
z%6mD^7FSKpqN3sNBGiiNqo*Ct_!tTNzU3_fc*B41k2<En*TupLU)Mu`Haj}%8Q9n;
zGswwKNugF^_@Qwd6VvR#2|={5K1Z&t6;K@*%Bef-Gv^i36;2KyQw3b+IMki5u%BgR
z2K*S4bjz(L_KEZ2n5LBe=c-M9E^x~{;uy5?N+Ld8%*X^U`6q2^JKs~%d_*k!IO^%J
zYHWehHsF9xd&Ccb)7=oo2MCqVV&f|VxnBckL1ly0wrN;8y-r--y$u8&|68&`-{3or
z3g<@>vNOw7NJ!OEUVy^r6_iw&_0#E&u^bUVJ4D$Fbd22}TpBI_wXmxIRb{;3`~3MB
zRrO@O4OJj!@BiZKyW^T%nzj!pqJV$}QIW22=!gQ+5k!=#KnOi3O-ewzbWjliY0{)y
zs7dG$Y67TqDbfOl-g_rBA>Rhi^SqvO-tYa#A9rrq?9R^4&RlcN@YGPJ2`wzANjrqq
zIo!({=a=S7B!w{M5w$fVb8o9mp2VBfV2Zzw{jlDTYgYMGOl+kE9$D&sR2+wY?dtia
zK$1`UWn*{>1(x7-+zHtKX&d0v-VJp<GCcnyaPU5pH0MB)mfnob`~1B;T?wL50xj;c
z^^^|OdT7FHA~cruMB*rT%%OI1bGxr<TeZ2_&sQ}sbAiDl-SefVj{5~@URcccSiAf~
zXp;B7p$lw7dF#o#jM#R|wCytv@d;6q2G;&@eE4UPGK*iaHa2)|xC-I9BIA=^gvv8w
zy8mS+@!lB|l0aVwMcN*Dyu{S;lO&Z%m(SZ0jhb261X7Kr`4u|<Z2^x+;Xczl5bn2o
zt0o$xV=y<SsRDVQ80wCnJ`Sg*D%xHvysjCZK$-&msU2_M?|$c>EX>9XU#v42dh_cJ
zyZG_K>7_?KbFFf$4$)A#r4WzN*m#~8I8Gq0t&eaIPT`}jcGZ&PZ62KDw_j^DOxtQ|
zO>=1;-2Dz4?@V$i)+kIaQBI)2u`cWyb$6(LehjqQ)StZKu;T8<cO1<s*JEe!$$M4+
z%J};CJSImUFcqHo*SXx}B!z&YAOsYXO{DD?6D{Krihb^M(FKAZAO9%tidTRbKcuwZ
z*f^yi@$@=y<eYSBSGGeB&E)eDXY-IfZmzD4C|%oU>+9<oh$4Ra0@00E3p)ebRg>W}
zQt4H=ihO;zM+B-u;lmpyZMIh2`KBg>H_!HT&Y@*F;;9Kq+)m_(q^Q1j*&K)UR-x0f
zyN^-<MYsZrJ-k+_RX*ShZ1@$dV(?=1+Nz%<a5TO_tVpU!qvqcs+U~n4+AhXVGT3j=
zywAUXx78rtKi8t}{J++jeiZ6DgLR_))R<4&!foTx=<q|R<!O>J2q2@5iH*JIp>I7(
zO?_-wKW@?VVKI!wvsByU=bvs<oBR@|6N5?TA*|MI!ONlsUabX9kQ&hefnDEV>do`O
zeg(@5lJ4wFT;f7mz+C8aMuz%?b=R|-E?oU`1Y7)Wb?EPr+}o`aq%-i@J3u8AzQp{I
z&q?^`Xs5&8m-O&~(;E;nIyd6wwzyU`;yIPGT{RUOF=tye5%OIHTytUpa``i{r<fR<
zd0QDQ4ZFMhOpNcRc8FR}m@AW{8uLe*?aPr5N<$3aNXD*<Pabw|>3*%)kC*=ooRLmC
zk!=9+!(TnqJHK~EeTg|`er;MNKslMah7x^bErrSJ>y@;O7Nfe(=1<PdXfWJ%KGc|~
z7w}o%<2GJj#$kZVJ*0uW{tMh73+Rm(db@^XXwhA`pbA$qAvc_C-~~1#Y~h<euo;~v
zL1=)!;iGQHI89RWoRginuTV}?rjeiwF#W&X9c+>Qr1?Pr+=4$oI*$5Ce9+lDbT0eb
z2fo|8KE7*PyT{m#=0c0vLrGg{boPNh7jvpWQ)~Rs=Rf5G4I;80goH}Jv^iH!ciCWn
zGBnL|vdTkt*E&G+g4nJ_a3XGafZMls=9loZeeZ5v&lr}@5$uSrM0o2vx&)v^GUfY>
zzH^G&uqb+y$>P3lKjH!UMNdEK+~#k8d@qp<oObe)lOccjsJB4Dj<&eiz5e?Gz<TbI
zHry8IU*D`S=`#M^p#1%@NesY718((Cg#M|;f+S>X=q729K*kU*5?b>wS^f93t5*TQ
z#m=Qmx?TVFWdYAf-XiWgxbr503u*rG_V16iZ2+?z@^*c~^v`e7=KzMIvVx?+aYoWd
zr{ka7_TQ<n(UZWoke8SKHQPuOX=j&6nrF_S|L^Ph_legEkmlla?a9Al9DRN;m%a0(
zQTVa%Z!-UV4S!#MlOvF>gzvGZd;gqFx*}<du%uC3n*JT?{XUgH0@O~@7qq>UY$V0+
zzrQhkNAhfC1;8G;y)!n~_%}TH+y8E2C(XsBPy+I|F~E=~R7rC=Bx!tImu1aAr}}qE
zzYvhGbt?!Qko)HzNwAURqC*<xO8IIs$3NfyKCG}B#mRo!Zt7O+f2x&m3`t)itN{{9
zJH;@n_xo@C&ldmZr@8Y0f!0tb9Qhsp`4IdH2qQ>>@d1JnQ+7C^LBa(7>xKREr;8`R
zRtME7O`iYf8-SMqg>fU@y$M*}EC08~ut9))b6N_S|F!U!NA4)e?NgNg1w8#-q`$4v
zJOSX{{8gqm8UHzBang$HlK{}X(7>mZ^v|jOeRXHg0J*$AyYR2?kvAfF6MP9^MUKsS
z|27=IO@(drF<6iw_SQ{Og5me^1MJR_OoItYx`ufyOaD~Mzia7hut!WhpKbp>1{m_5
z0ZHv%kq&j&8@u0j?|(5gqi0ETsi434ubAHM0+@>rEol@n*ux*;|I07`cj!qpknSM%
zFj?lGdt^;o5#|PIMFJ&9fbQ=L{`>mbjsbnS;or{wPiOO@JxO;vT0z=`*&dp(@$b;?
zHyJo71E4zuw-@9gD=~qd&d%NLALOHSFgz=o_AkptV@2AvnJ1(}F~iqh@y|o^-vyHP
z`-|bxz}r<L-cEaP^@oO<7hxRAOLuC;s9s$n3&=#vuBpOIE7^oJc~v*G-p(z~MZ*~P
z;P`OnSRoTloBiUY*Q8kHf8;1nMOv1)D9~SRfAe#{t>JH4@k>ZhV5-#DM8H311cSs4
zdlut4^Nr7*%|`M^;x%%qFdCNQt!Z9UD5)ien8th){+UI?xNr7)e^>W=Nu+bfoCvhk
zdcuO_Vf@c*{`He0KQQ-7Ps!0dpQlzWHL*k2%H&2aob9(bmwyH0Y(48La;}gZjTBmm
zYNgA+XDN;fJsLv3@1(a#8B}(+P<gY%w5E4Iy|7+L25So0K}npt9P$UbBG)KSQ}ld@
zx4yl30IJ9+09Ex?xzD)bX;XL_l2QaH-62Wo@`g_*i~m!dexGsV0Z<q1>Q~^Om#t%M
z?bR41>~1Od)u+wuu|<6<IR{Z`{_xjPr$}-Qc*Nh?Gt8}7gS#f=({n8}$>+<CngmG3
zT%-yx*g76ugM#r_*=zAbGCUL=o06qo0WqB;<+q%d#YSKLQy+g<;ebb+Kum$E13w11
zBQQfe#jusvKRoT=AFg1{f>A`uh{>!u2Q>4L&w4}F(0ZG68o$kE>sz;)^Iq%eXc1Uk
zu0UjN-+I%!E5$>2a}NzOD4@f$==aY?zlxK!)>_KtZHs5Pn?pnr=FxeQ=m*l)Hbt_-
zNif&e=O=3TZFGAVJ@?ZqrD1o&n&L&F{4wg#?RyU&B?{gR$=<uX>~3xL#5TgFgL6hl
z)g+{i!<6Zx`4K#6`i|<G?<Z~G8*?I5;AxxpQ}@#HjFD9j7fKTx8u%N7_Fwq1)@{FN
zD!Xqy<W>V$F(1D$+@w^^a+ER~A{p*ucPvPu$=_|#?~eg*NLj7thZC%xN<lKR3HYHE
zT}k<hUdj5RAy1`%NUIvAuX?wk@T$2SH;?_+yo;(!#SJ~@TO7}++#vL8r@_d@B5Hcs
zmy8eO@+wMhX@>9HCfHTzMjhOF`)n%>q!;?E09Gg9t5iiE>oTkXK}dQBon5<-@$QNG
zN8>_WA9afKe2)^*k|*7wAyX)y7KQxi6kxso6M&nC*5-$LJ56*it?z2;_HNr*O96u$
zuy|I_Rw?32nQhJ+*YEKR#j3)UrQnptla~Bl<KG#+znQQmT3}62nPlz5mSXhtOS#L@
zKBa3&#@2*$t#1+id+j(Gr{2Xrc~RZ{;qjUu_C5}5PYfej{V*<q2Z!!y-=1Yd<_*Uw
zjm?;y2QNk>7g{CoLzAApa24(6W3i5=t67knz2f^V<Slsu8kT@6RCu(r$ew`Rsnhi!
zG9fWm%f^C+s07dQcm7L}Mq;$jNykz6EBRilTD)8r2YlX|%(LK-2~}@n(<Rct`OJOP
z{{^H~a$uXn_>>`?#jtcjrF$Ss+<sP$^Y~@qZ--{U>nI`lQIFiBB$)rNt!4`XnO=f(
zp%=t*^KFpfRLzLNSd*_<aK*EMs6eOh>{D8X-~A$Wf^3C+vae11o=vFuj!<%1CYw?v
znkP41$jRRbMTof1f16H!Q9GuL;^m7>;D(0a&i&+c-zjRETOO88@Ki?r6c#E)xK$=D
zO$9-k5N1KkbhDL}E5kP~*Uyyk?#p^>xGKyrc^poQ{x?@|T7Gi&>C&cGQv53$^>VlJ
zWab$V)Y+dGPLti-d450krCs;aD1aQTw1AsM{TP4M@9O)vjXiqN^cvi9zWr91VV>=p
zw+2%`nvA_db;>tZRrIZ0Zcl#fT*&ubj?Hlw3o^-)Ed27yM8a3W8j-|ZVw{Dz>NP2s
zn32J`+fo`u+3&RUSi&s7sA=F~en(XnL^eUHprDv`VECzb?3<i9xy38J{^u>drOTl0
zHI0>-wg~0#CZ11}sJx2A*iCKqg@2(z2jn#fp+&WdPZAF*#8zEnuvqy{-JoGqe%38q
z)=hHDgQn}PFUX?=r$uFVo{%}q-3brcKZuHFL|GvD224K4BExc>4^fu<7o|w4Et4-m
z2Cjt1r~WUK>+fF${L6+4S&$!fn(bA!i&dULrFL>K7a05O_V;SL26S`g!{6@31yJg`
znhDCOG1~_AH>zY89-ua7lTw_vL+4JhE-0p8V1YlaMI$C2!uCrH^E^s=9X&*-bz#Gw
zKDQsEuHf>lW=ge*pCRHe863=}w3^4OhbZQ2CxF8nav6VgXO%-nldB9SH`1Q>&K>X?
zF}<mpdje0T>YvA13g_pZWNTd;I~*NRe!#Z1P03u;`^8{B^l3cJYUtBC^yIRidbTb#
z={#3>$vypdO6|8hQ65cAUl8U@;ox0qoVs62b+<uZ^n()jVW|-s|Gvp_sBw5crpn|V
z%+ys){llP(LI(eVSK)-Cw*GrgAxfjZKbMThT&EVj*3VBjn<T|I6>)A@_<n-1_!KL;
z^crS8Lb`@bZOWKI3zvYepqOWH*4-=XK(Z~ZQZvvF{mS`0&brEchSfzWI=5vdB`YE_
zaXkRi0eCZu5K~f4>JPHABP+h_!?Uvy0rSJZKFUS=%VRxT0$I2YGIY4?$J*qnUp2CW
z6{m#(7gtI;Pr&L32mNi8f4li7KLRDc1@&2%OESN0_S2>ak22&p%+<bH&#Sh#w1Qb5
zh`_9W-<Ej@ao8TH)S(@0*rh8)=p`*?kt5g0vl*^YIQ=lmC^}@7E=q3`DwFMIckunr
zFhg^vUFN-ln2G2Cdl$g{A#nHLi9*%Tjmf@f<$E5%5N%X$v1WUDu99#5N?65E5$B75
zQ9bH3&oWi}l<o_*51$MZn4V2_E~%!gG4H43drh)Nls0U=aj)*wpuDv<;hmQ3t*ZS*
zXik!g3{THP%B7OB{+;Qm7oL6<RZVZqn(sugzS`_iqyewwxsGqfpLM-vsCheekdy=E
zEtPFF|0pxysRrD^CDOfLyk*m6|9{!MKY*ooTn>;CvUx+*@+#lAN5ewok+<Uxs<wnS
zt^HX6WV)U1#Qh0~r6`l%(Lv4{sD2}XJ?!Vzf20!tAE<CIYsr#x!%qj+T&(ddOfGg<
zL==oIT$9Ru@wI!|&3*;I^{ryO&#p*#ZzpML)U;70-xc)x`7`kygS%!$hQ#EhiZEZy
zZeqQNg~Psw?}2K*TE&-&Fwd$a%`5C?HYaq|bypg#%eP}`6AnC;pE&y6Ug!)tQ2R>N
zpI7A+W#sbI<4LPY>}kKL344zjq`iLsWPH84EDujhyrUVFd8`Gs#S%j=5z0%G+i{d$
z2Y#EtYArHlebsg;z%+Mc1sa445KAetcynx<j7a<H&_^Cx*n1oA(;Lr8_j+Th>4R_n
zx6FwI5L*=k#Y<9$Mxsd&(eEDI-ydIsvvwMHGRXv`P^A1drxOA7Q472sFMI!{UF&Fi
zUacDu$-KV*xF-2};WtN_;xP!(CYtCyZ4~B~6;|!En3rL>)%nci1uVQ`xZ<r{fX%3)
zRYW8Q<dJyFmsZ|#kD-a&@T%(Ncf9)6B{DR2x~aE5J@oW6i_cE-=sJ1H7*1Es<s`72
zq$R-csMo2jP|%}XefXedK-4$@>RjElb{!|)T73ff*g-nJ2|j@dXDApljpa!2H5E49
z|K?@v)JVM)-flS}Wj`DH$(<*bT&hC<+Yw>xkAT|@x5j^P=?^ZRt4W(LeL>aMeny^+
zos2oJmmUA3g}maR2k{d9=-OZDDF9awy@vk(#YEEV0pN4?jT!iCIp?ckZuo9>H)bJi
zkhFMisr~nSiRl@Nu~%F#=A{@hWJ_PRU0V~s*_t1kOK&wPd4o1b%`2lz96KAw$LdJi
zuOXMMAhz>@yND+Mw+|y3tiogH!skUozWo9?B7RqI0i|=5k@Yde{<PdI<p`lkiLT^j
zN0E92(?palH?)5`V?oI$6h;e;z=$a--47TPzb50C9RY;n682bP$|1w4?bDK@VtuBJ
zW%as9pwqw@!}wPEg1wlR<q^5c-@mw)8{tXxKzP<12G_1^P$K&0pC%o?J!^KQoNmWG
zGG{yB`RAXtR@I@jc`>fgX=}RnmGQ!O(uHLMqP7OKic4PJ>TvH6r;H3HfVd#rjhlhO
zG#<u|nE9bJTyUr$pmH><0k!ew>lti9u=U=uCYjXFwZza+>G{?h-pJ}2YIRt58htCt
z$-gEKyYU|HkF}KdwgdC4;2=Hosl#rt$%@?tpd<;M-c<qj<okV#C{2y>!sbWTPYF>{
zam_HI&K38RI~UyCwwtl>Vv>3D;4ht9X(HW>d}pYc*LMt=!&@WzKd8CkT}GE^<Z9^v
ze`j9JDvjhFO6<o4I-GrHzqA;AOen%9uky$8rx~TRnQvD3skv>*PXr6guT``d-r{Op
z{b|eIY)3!zL#C_OCvx1YCi^7d9|V#S^g+7!9&_l{>IMZS860Shj9=+-ll*Er$f?oz
z_=uSJ2f4v07AiRzg_HW4|2Bq~`}}1WdOl6=g*e*kh8Oz*esqevz7O6jNbCtbS;<wI
zd@mROPVt7uUtB_ih%KS=Ha*RKZ&_>W)4mOcZfeHQy*g5QOCEYDXSuj;WfR?J+Jl`l
zf!fxxojlLTc;B&5Sw*$_CH#x`ob6}fcO)p|#Ge4YW{Sjep{bpLv;%aG&)Pmle#d=v
zdn5?#LL>=#^%f;Z)5@mE@NRnEUu1i-!*#A9zKI?0k#R53RGWDZ8HeP1b2u@p(l}J}
z)3MBGyWBYtm)pk^*S-CQwn}nYIDq0H@cEV?mwnFRpBQ*BxHxUo+>lhrLVRTd6-&ip
z!K_V@)$lOK$j=`W{fI+^>K2rFr@dSGp1Q{#QeO@8NeR1GZ?j#Gc)Kdemyt!Ki}Hu_
zvl)xJ!(G3HbV=`ee9*)m<U+mYuMbAOFah2tlKj#0CX4D{V6dt1@k3u2(tFdVj7mSp
zKUWZHb3*3Qp&3K|+NiHEQSx~&@7hHjP=u6G^ZdEAK9Npoefz~@xocl+{?LvhA6uER
z{Bhj2O^-O9<PT3bS}o1f!uJicFD<phgu^h`NJ0a|$TNQmYypq+{`*Qe#{ylW>#Xgo
z3CL73;E<@3Z;GCMwtfQeI9#Az7eI7t4?Y1Yy`|J?Z}8p+JblN#^oN(+f6{(r&|VF9
z+GYhKipV8ABD4mcGDLLqI?l*#-;N*LDS^!0bee+q3B+j=r>{gF5O5|E6NKreHidlX
z72`jN(hU;tnGCKs2a{qG@tWC?s$Qy3R8u`NE#`yo$iIIW{F0~7v1I&+J+UBHNTx)q
z&*-|Oe<jf(EF3@EwjycvQYT)5(!2wURKo5wQ&qlV77_LsOIOi%FxqtF#HmiZn*X5>
zok{VrFU@{v@am8pT`971sw%d*&z5mOp*S?@z-f6X_xj30&c05QrER(!UDi~3|B?49
zuW{;%t8p~H(YQ7{pK-5nmPSf6;D<0$&(4=thAd^Dp>SGgh6vi{NF`YU^xO4F=<fi#
zvb5Xh5#axnluF1YaC!3mBEF{cKG4<Wn6k(Skd^E8F~_@Yiv9)bn^ysaMZ<3YATjRB
zVgA^L1KjH)YT1C`QQk<D6XcCPO?P<IsM>orNbFp$nCt(cAYs0Lc3?81Iq*E|u4dNY
zwv*T7vO+#LqA^+{WaC-a-i4YgdC!p=Uz$S5D<(=diH<w*O0p7T4P04YeoPY`QOX8C
z_8*^++6qa^d&qCKbWZ9{^^8*3b!1-RG3o1=2DOGOu&sQt-43hv+oLzQ;#%Wu8R`ec
zdJ~Ad)rNVAaL7FKU;f61>eR(GAlLD=UCKBq-Kk!(nHPC_XDtvQ{Zo1_qE3Cvv*3sW
z0O(ZbgzRHjAQ*I3qh{R?VOc7IR)P4>eZ4`tgbG$FnceY+5W6kL$%}8#k>I}A1hG1U
z8(g4Zzqi*WDG?tNKZ0djjBV7;W^ph%pIxq}_kjN7%c&VDzvi2E+FT@CkbLGOLCAM*
zYnMEBqq4H{m>IW!b+va6g8!Uxlvz0)(BT6rXI~J{>Hr;X@A_N9(6R4hz9ae(Y40Q7
zfGrU*=&J-wfY59nWA!ESgPn2K%1?3iN!Ke4ASIAqMVtXoAtKworiVQOJ7$zK{T{Ar
zu_BP-H-PUO;HEShp6yTX8khE1Mb+(2ta^=XHoc)Vyb_VpM9wTLV;E@bTAJN-JBW%<
z{+`{*ZMHOzW`EXWtz+p`){m)OqNLp8jh#~#MPFXkfAGmP8-E*wpB&0ZJ#eU0tkxjI
zZ#6PBS5U^NKDzz0xP0%sn8$%O(#La2U6(J;dOt(x_>~$8eiD<3zR5LUD4wu_;Wcd~
zIZ5UB<pB|-bA)ksu*b5jr2eIitJk-ZQ+<h!tMTGTCiyNf$ti}3a+6DXT|FFo5yuK&
zDKH=e_|`&jhRNCt7tHj9>A<-6Ao5W7(&FM<bhyUcQt&~H2y+4RLrBy-yHO3ZPuPOc
z8Ng)>;AcFlw`g8ZdIyNq{tJM5KWl5`7u_WfX66Y}(T76pAQFD#>BFJD{3L3{Z)MJ^
zZMMFWccJi{N(SQQU8kFNTZXCD@m9kT2g;(D9}lHsn_sTAlRX$}zzDMFofJh$+}FIT
zYpZTa`Qyp_aN(CyPq~yKpQ4qF_OVBr9}xVa0=~6`J_+Xao~m}TX~i<3*c$ls6;q9A
z@6AfzSgJnAuD9poxz*Ky-f@8tKh}4y=Por;^@r#1#3X5CzqzCnK4^t9-7LS(QsK6~
zdhkLaoh<*zc#80ulA~pY<|!|o0M31_5_#&!(X!r?{ak(z0S@3`ovB{X_vTc8$c~O{
zeZw_@t|8_FuM@_(=#SMm=~3#3R0Y3ilF|OOp!X8G5oKejGZ{61hGCxi^nth8koAmU
zvL<ZebErZzNaOcYcjENo-*t$_QD~E*4oM(Ke)YY}t<QPDm$RjiSM=eo+9=nGk>$`b
ztV>VyUD$PXTvVZ4bNj%DN-g%Quqz2^bS%~Dz4HaCk^UKRD(9sGqpVE7-xc5WCBce=
zUG%CV*UceVdFh8<p&(<-S4UW|&dgH2!m6)fe9Iv|UC4BQE&>DWWZMU^d~CI{pqw<O
zu2&Ca>B4Wgr)p{>44k+5l$s6j7O(c~qPAZgP(Y=)X6oy9>V(~wnwKAI-hZ}jWu{xE
zJd~l?s-e_8!(b<{F_}pcmc@~<0QU>ujpqwHEiiv(`b-V%0kH?k+nRwYxhmn(cXTV>
zQ+c0@QA|uUgeY5#pbFkUK-ltr)qdB1u6fb0YJtHgtSXN(_x2wFgXi9p=v~W0Tgf01
zOH=xX&uO2w2P4i`fZ{r7vN7%@n&$xm(D722>s{Q#%Q0TC`2q-+y16rR5oR1<Fcua4
z5c<Pi^Q!92C}#@1nY%!AikMTLDbkO%y0NQ~U#iqf_!zo|f4#Y+$}l5Gpp?o5#I^ic
zix0Ud>T1mJ8Xqb!nq0<nMs;FQ{!7L}ZcSzmlF$N~(T<Fw72P@N{^3oRs&Bism8l01
zHgw9<=Rzkg7r^Z{T0cMsUbF`59MdT9I4U6kTU|rWWr`n){n0^pz~aw90-(=RgoNan
zCUF@5se>%zHf74qMxN@!i7N-%hK7XnOf<J<6bKVmXg+R#Ju2x42spWkXbcdrwt>Wc
zt%6s5XU9iz@)cLU74QjLdb>^nahu)&Th}lvAxyG+H-K4`aLyr-jpW(P$iGzN-@g#+
z4}bf(^5gtzUi$sIG6JlYP{zb;Qax7Ad&!tNg#+WN5hT5p=lsX!>Qbxuc3bi>bczf(
zgV);Gd+KO3uv-=pMxs@sbDfUqI1;;+BAPcHakE+>K3h&YWYN`8adQ3xE;t!4(1C8f
zv7#S<>ugZv?qc?rnGNBxo-6pQ;GQg|a98&ZY`e+r>W1fgGQ%{Oc}M7CUa%fl_ualD
zJ15VU>Mvu8-1pPY>AgHNH6?Hwlv}YbU{C6nES+1XJM=kzEP2k)?@!*$=kV(7m1nI$
z@$$_wxAdU7q7z1Wrd8#>!Boy${U=pbFj~g3!`!L;w6)Ynal3LrL*|9KCuPL;g6t;F
zQcmSt_7en(O;P(Ag%XlRsrzHOaCx_8NLdRS%pX2&ok`AjNYcX{CvnXdMM1p*s=sTi
zhB(AsCNm-k`)N*`(5oH_%M%3fBt$9KiHJ-QStuoB?^-q-;$vET4W*!ZOZhFfzv7_1
za!X=P_yputFT_h+uby+oFZvn1e%S_Eo44N3oNgfTk8o|NePlZx7C0Kc{bxKJ$LI9J
zM{C2+U^Y71-i8W(BQx`Xy=<Y#rlj$?W2gHOHIA(;jG&4Hw`KaP7Nwc`-600qy{Dxz
zX`+MGr6}T<G04{sr`rzNT48qrW-*7j|0hAKPHf#*WwR7yG`8A~?u@(>cJbNtP_H|$
zk-x~J=cX)VNHPn!P5;EkJ{B$JHTFVlYbxlB{>~KTUgGWY+x^!_N_GO6{+nz?NAe9Q
z2O8(-@hjCCc_Lt}2bcaCFfSQO3*gwj3TU1-1Kclv<#f`5w8!qF*rGkEKr{o37gBrK
zvrfXas?qYAQ$OJv8vYr^|75du(ogVInnjWu72$`j%6h#N(3uRn(p&bf%VZ2iYX}x=
zo0aIsk>wb_nr<E$jN@4m)$N;(t!EQTau1BQtFy1$2M#v2=bwq4alIm#)XU}IH!xNH
z6XnBa-rXw`-Wsh>e<?1tJXSJI4&T9@a3GNjipuW4+C2)g2RP_i3Pf+qH`K|q(cYRJ
z72du*z5L=Mpjzb+t^wq~OuU;*&$a=SM)cMhFndz5W*af()sgtZk@^98kXtT*Objo!
zc%R=K$EPF(B6}z>^G;hW&cmc&$XG7!;6J?pI!^(nWs0aWiOb;xF}<}ZnqwkGN^J+i
zXEs6yH?)GJ592UDZuj$kXg)Q8aq7{?_<-{qmrHYRg%lgYH$KDcN^GK%-Tj>*NfCat
zu^TIJ+L5nfnCTFfip|bV87Hl@l`}Z8`)0O_A<k9y<FU<B_>PB^@chIfuC#Aqu<yE1
zEN1508Lj2gv&BKM?yFk@g%KH=o3AF2=63Mah*9)8*xq=0QqoiwMLXFnGCVs5()dHM
zqmU5YRBc8q8@PbRF3$q|<kAfKT2Y7I0>DNyK1&~Ij@?;dGJHG1q?y`V`>x*^<!vIt
zF|8(IYUj=n<FqUZjBPZn_Ipq#wl(|}B&S(^c`tbsc0TjRHa{zcwJ7>Tnn<2!V905V
z$RhIGuq6KCI)e&KqmipaLwzd(8|&*9I>x2v&rfpK6tfRM$6CIwlej|KhmXJzhCH<+
zac$Wm3&6u?9n?_@KJufy*tRH7s*~vrkg)n5+E19M;GOl1aPEZUv+(inw{oN<KQ+_-
zI*f{UjiqqH=d}BI?{7;PJK>$-eJ9RngWxm!fx{jm+xO5cKiRo#!^1?XLZu-rn3>mS
zen_ywHQd?IwOdHKT&vG;fU4SLM;`fe+i-z#@JtrB_I6HWTi??>c`3)cW`pw;#qBw9
zk0Tgn!v_66<}(=_IQ94HUK<0+oC=4K4Odl{n!-LnoKg++_@$Lsfumxa(hmFBoVoD<
zAlky-q-r`}0f6ML)Tt$z=3bgHs1=(pyg&bGCi}-_9{x862@<Y8=p)X+#n+@NNKmkF
z(l^3(F1)2hB^}XKF<U1e9^Ve1v+c@h#*&VE9k_8XNgEQ5pcwk|;QG}dMVRy#?E>tU
zZBIN_taW4aypF~k@yb87UsQcw+z__bR2se1Yre&4x?TR@fLy$Nb=E_4Tt|2;ZT_85
zy~K30S4=B<fuVlD%PDl)yYrg3471c#Bwy#@LiN1-fkYO@B%QpN_3No`EEwm6#iIL;
zPd5Hamj#(9Yp4w(?r<GQxcQgsL)ueZEX*dkKHwl06iywN=1$egZkWUmuA`=ae+`l=
z&oOTuW^0cnvzbcC%ZnY=v4Lu_Q~mQ)XcEfnpLD!BqfTgF1_VXwZ7m^a63+v56q>YW
z_`@|d^Z5<zh|&fS2q4)O%GFrbD`iHJ&aCi-C$=k*nOytY4f8h0`iVj+vht<PIom-u
zr6;8FIeHN4abf9Hk37l~f&e3Wsz^A(GU;J#O#6vDRy{;5z|_20>bBV&LG4{cPzgTZ
zD6OH&{go^)qqK897hZwYpBBAEsn-6ZOhL?8rcwpz`+A)$UR1>^J~c$f$XzWKbyL#K
z^$H~UcB)T}D)wgvl*Dwah}tb0z7_FPpTa4{rgB&^%Q)3j-0gLFjZIZ$VASoNCSA>o
zD-Z_vT+{i#Viyi5HHO95nC*sU2=m*NPwh*YR;W(fC!aFTEky9Wt<hA`ycY5wvOV+o
z=lh7WE9GC8lREF7(g68e`Vdfg$#!-1{a(>$MMo@(-r#z}*Efp1=awnW?ArN{Kc?zG
zhThAfJt(FzyHd0*+YjFmk?<`msy!I~;43yV@v}a!CVzu^&pbX%wReU-?dLYr!PnP|
zTbeWbL1j0027>+Jqi!1WawH~%$S+HKzQ7p7FiT5)R#wcNUAF~Dt~#jBqM8-DJKKr4
zq@s!u`N+HHUSa8x*|;g1fF(a75ZyBYyW(-<7tQgW26&JV`pW?|VZ-kwPIh!+DaZ_~
zlzWh&tah>6y{t*D!i29wDi(I|#rKGT)i^6W#J^|nSR%-P;~hq0&mGzXD!2XIH<^o6
zHdzrC`qZFtyHnF|G1hs-KHOmBTlSwkk^7ln0orf7+Io|LD%T;{_vQwo)noGc3mpq)
z2bXVzzk<TF39}j8YhLq(Thi-k8Wk%RGa)5WWO$I*99ZePHon2l$|37&8TwPWg9>w3
zjMuo=N6Kr@d_)!1a;Ng`3THQh8A+>*<{ZEsw~J;l1F0Y3M-8RWki(+8ev<nR#tOA)
zxvO#90;bE&?P3cNxce*Suf<oNt(!;phFDAiBtP&WMHh09IHDuGc5Tb~ySJ$2y)=1s
zCG2^=l{-N!urz*M*oD?fVaEj#2^*YgE!uFX&rinc5m!=lXQ37B0XM_7+cP-1rMH*1
z#jceMJ%u$J-lf3n<QD>$V(BlJ;<(+GM>{A$`-IBLJD-p9Gzf*W3z4?%xDk8jz`(WB
zVT6%V!5g0GfOJ~*(Pu2|ef}w&>1C1|%R(wRuh1<4{9F1aUGQLsaVjAZ%SZ)2py=p>
zO08J<V^m8H2?|VyV?e}r_@XAy#cRE7jrga}uj;Vxeh<1I;mq=2XR|~(tX81xeg<t+
zcjrduCKnPj3VS6w3->dxIqd-Ud|J=L-e?E=xU>tmf(*o9NWDxonpej^GZFd?Q=D+r
z?PLSLDhC;T)G%~DgWY?lFdD--YHrL9;)!bylB%~|q0esEb(`5zPwh?c!s~_^<rd=>
zh;Tnt5}b2ue5@F0X42ZUwdZv(%_!qk<b6h_p$I<uUX+EQK^4v0{3RHPDtRDaqV
z^G}!FC=MEWaGUJwi~T%a#AAy5lG?cZkbTeU6M0Y#l33Zqt!*V{DLpA+v>Zd(j*N|J
zkx3YvWV$?sEXX=_wHPkh*M|0AVvXaAVbaVymEsvs^=3s3{&3b+P!k;9gZZSR{v9MZ
zrX7R>zlz&5wRv=UZIvHl#I}+`1xV-%`+2==L_gsbq%ar7AH7~Q`}~w*fBL(ikNLsP
zpGo~3*!TceTQn~6{T}H72|S#lz4h<Ue!U@;)=_ei8B*4_FUv|SCSL2xV_CUudr@2a
zPuo1bKmD$J;{Aa@Edg9HByX>0<moSzuYf~qvJ!ML<F65PqphAtWJe!raTubEuTn$U
zw*4U221XWAaJYTqOd+J`BckAfg!d{u!f4Z<;bfSRy-A0(#mhH&ML|qw2M8npr=tyn
zrVr6%V5r)!r}Y?z&!}Mb${CT$QTfGhhyIK*3kL~{2{)domLhMD-HByi)<A3>uad|?
z?dD5Up(Bsc+L+i);E&J6@rb;!W(9lzDITdiAcmh*sU-xLRZikEV()B^H1LT|5oGz-
z732==<9}v9k5WS5C0zEk*6z3@2>mQm#U?QBhw?LIcoh9?BG)&8l(8Dduj~YdHHg(n
zuc{QR@7o~O=iHcROo;RzzV^Owax`;pWmom#_}jyTR-cJ2-L<9+WnI-rUomG|b&04O
z6Tqf%uHN_{)xmvchTHPZ+p}91BF2HPp9iQ#oQzqd<#zp-B+5jaDPaqKwh0vxT=vF-
z(cF3rcHGIieEpT%vQ5x5fmE!E&g{$<Yp>VPr0oT|#1U8SH!-3;Gu$$2*h&-M<oprC
zp*d|W7Q2~q-MN1_y&wCT1v{cMCR(3EfjH|_f1mix`%tKR6AGav!=A}cV0@^^cT|PN
zHcIuYcoU5+ff*TH<+Ob)$Ic&pIy1jHUAB=F|DWIj7o@Np`Une{1y^ULA7|e$H{+c=
z8q`orwT|{3w_`p}JPO?(3e!v!sB{%8>z;2~%7RcFPO{ogXigJaJhuB;Z(p#*+?ff3
zVf5Mu#4E{jhYvsCB&X`2Dag)5Gqs^C1u?@fh(zSf!n`h}N#Pw&9g3l6q_ot}`*0-H
z)^Xm}!<k|bON26OiR^#J4?0`M=AO;fcWV)76LI(bDPO2B9<@effnICHU5kvHv$FCD
zd9<Q>8O}nN(^4+^PDJk*Ao9Mos5wak3jjiSwatKI*1pCU7EYA)>q`+>pX!ht<#9sp
zX*FlR7K$}`>WB2+Nnr>Nb`Mh9Q_Wc{4HQSD5kUq)qnbx=%(wn~;ChD{@5B<9Rh&K<
zesgPSt^x04oS&S9y}}?nOAihVp~->wov{=L%!Q$Im95MKyP?C3`ZhdP!FLxhwytMF
z5Bkxq`Uw*8tNw69t2BPQH^dw1eb~(aONJlc1`pEt`tMTO4f(Lzl^YcPgtwlxhBlPR
z^m0(gXEQyEd{xzcnWq&YbZvI5-<D}|f8>UH?w*tqa9mDF2#Et2_th_7DbOE|Qg(}A
z5!IqfZh0>iU365r2*{eUTZ#wI1GmteLPvJJkw~5ee{tLQHta@I?IH`wk2D9?{PqdU
z?IV{~0ro}x$V(FLCm#UyZ>@k%Nz)8U{9=n&RA8OGS2%R_diifm)PM>s)`LjB$VR(!
zwkYJ#u%}Aw#3$E$DA_pUxs&v)g^CG_XlutF_FvKD2co}y&#QxPx7=_d1J<8rC+6Cw
z5eS2<Z!{-j_6F2zLfwBf@ii_drYcwY{PN;mLFx#loG1PGDQlfZEqX-t8x?Ts*y#aW
zmf*>%+F0OrXKT%6@y37;jb&{g5_@Y*|MHu;hkj3cdzU$bAn_Z=5uczjdaxqEzs))C
z4bJeAfG!1II(DAsMA37GdpC9~br>!s%lPPwhAK?cm>d?U=J}@IuRNBpD9fO58twk6
z7vnVc0TSSvpW4geJlx&8mphgD5urb_ln*PnaT$$qt#zBp0YiSUBPw?1QlXuP7h;fB
zqJh;z^JUv&-x&abUao4)H+gGYGRMRK^7EbT{1oL@F~-nGg)iIGc6j?OGiAQ@Q@$Iy
zjgrUB8!G4vmSz{<Hr!pf@ln}lp(GD2sjt!Z%VB<B`>}q$byKF#YHEI7g=ekdFvWr^
z@jfj2lxsMtSSB3`JSj}-;t^Mw%>X?7r}kuyfmE@dSA5NsNpXFvqjGBAPd|bzv=AI#
zU6afQhmIu}asyOKPub4YOHlcZ;gc*mXX}&Y!M&s_=%+ujd#0z@WF=-FHYdmCMet=<
z&+1)du-m%sIy(LhZ`i}y@B%_i{t@-<XDKKRRSMGiiZZb!IRC<24)O552vOkF(r2?|
zztEbyXzzhGPJLKMcjH#z+qQKV0O4jTM)|Ns8j=Il-P*mZ$qI4Vs`AyPARQI17w8w4
z3NQ~KBE}9z!Y&ro)8cy;?S560h2pO7MQ*8GT#5bUR)qa}ySA^XzfrdqE&f0N0)2^t
zXb*{C=lgB+-IKR&bRGzmwhlQPFyo>6aY9MiS(MeQw}X)FocbMSc>j=44K&=M2hAS7
zHSNBH7Wil!B)j&arr(rsUaAQO(Cl|V0lI!yB!9!pVn)efq2@)LI#KXM*Rmf>i+g%z
z#VpVIK^mv0@q!`+z80R`<wrtW?S7%H?56m^F0S0%zL~!Db*&uK>jRgBnD+xG!D*8>
z?Id+TSSAoo?@^5ZaTLkW|7vj{PGe7|K_UlTbRjFNiLb)=yzmXUMGBXNX^uNhVUqoG
zzqIXzdM>VrMwDh<ldo)70sOo}iw|;tN?j4TX~??YlhD@Hon+8Ns0Ej8ngHg*L4D$m
zxqW`Jdj#Ymcb}x^FmqPeQ`B=L-}YSOQU`Ue4XwuhoWmh&+*Z?65H!2R{~(v=?USt`
zJud|Cn-?PTBW)O--^V>&g{XJ+SjwPx(AvuPj4k#EtjLt(c4j%GbjA27Kv$V>Decyw
zST2RGzdn5XMLsB~hmma)Ynd&iYHo9J-al8OV+PVh^0di?T>TfvigS5gL1UG-K6d12
zc$-WfwMHC*>Z_)SG;hx+?84q;K`Ud{V7oIN3;Uj}jO2r7MC#mef%a(aZA45MR7k6P
zx2tn8x|PN5ZO06upFF6_-hkH+|54{IWF}NFwYt1nXawmay{?kvy{qkARtmZGtkqS;
zJZy^EVli8RM|a!8CtB0jXf!&3Xn(;+W2~-Cpl_|kfX~a^qjdRMui%Yp!hPubrM)aI
zA6j?mZjKs(zF6g@fZ3GB_?A?|SEa7OHVZ#Z5;A`5ZFLYfsO0P?eZMUPwdY4isrsdM
zG1%pM>Ol+C1^o|ZPOF%QmO^5$mk#9;?V~8dWOE?<gZdTr=(~mda+Pckg7@5AW!>d)
zyu^b{srhO(uWvhatruDftDr4ZHh3ooEWfq(%x+aBS3bI>h*QRCPquDbj=5lH3q^rG
z$d%4~K>Ndl;wi+-<e)%%cn75o*Ji77c*w<s8jrGApvoxi7LwyB6OY|L=TM4AyG#1{
z4ABndDCin-^=F#E(klCWJwP^Ws*cf6iDA%fu!CJHmNKt`x17HNixXt^?u9#xwN~}S
z6Z3R%@=_@Db7i+5<#)u4a_`w7sd_r<5N*_+Q#PgEQI*SMOGd603Ip?gD&%rrE9Jpk
zyOUoWsxnGHX|jqvg<(FXqShL+Qo@&R9x93o=AI-3YpUg6C!W8^{a0HY`14ZBWNI?}
z-Yc%T`Jz;{2{a<;l!?YsTO=m~wju>PN5`l)s2r!TQ$As~f)uAo)dgCh<JkR#@Y6>j
z{#k&G+&_wgkKT~1-g>Z--Mv~d@~i7pp{#DLZ5`;0D{ezd2kah2h{svP&g5_J711|X
zY@$6*2M0l^*Ec3-Q&cS)!_Imc4d}b0o8oy_M{h0`fr9PfdPFUwEv7wH7ILagJJlPH
z7zB^cHV6-Uu>?rK=;z~~L2_)5ZjG)cll)k|0Ykv}(g^?lgkA*jchqe7x)^<XadR)3
zlD@Iufi|Xibd3^=QULEg`4q_ZJzz7bb(7nYttN`;uJY6w-_5<SaPc8uhOimnNtqm^
z8~Q$EFYhDBUMjN-K;<dCAbvtLd&&@K#k9!`nN9H<A76D2w8@rnZDyPyN3&nRzf3xY
zrbN(BK9bUpJrRMel%@YjLr2SXZqsXR{(FG4!;`Jn+l&HnL7BMw7C8sQGRu`Gb_wyO
z^saBHj1O0uMYR}asBgQsSx4_fo{1DOGvz#8Z1&P^77=ZiTbbS8DxyrB>Lo6mg!?td
z7%-G95`zlo+(nxWc`w?8BmD>!YcZF<GkB-Gs!Fwu-cNNXr4VW(XiT^qw-dVM{n8Gr
zyE-$DWU-IpfcWoymEpVMCs=bZpv!O%?rb+RLdSH5W>GSE)_cpuV$h7jt_)vrr(Ke5
z=T2w@c7b+K`&^mRq5gg}tLNmKq|4-eg~={Y_U6qH7F)Mqk)4{NslL!p)!P{|w`>X9
zt0N2PcOe3OUpVKj77TUhC4S1%!LS=W6e1QiXVz!7%>4RJN{@}lo!C_?#V-=mW%#D@
zlVWeZ)-Q(bW~&NT_}zaZRqT@qx+>(_MlZ&YqUc|6sNius&^9@OVWm{I71yg9+Gv*l
zJPjrAt6-caS3Y9zwu;<%J5B0mg&brt_MY{$m5mxKn#UuYl*CBa1edc<+~O(HUBHG0
zFz8=Zncz+Bl8<_2dyGGv{B3TE&w3>lp_&Mf@J6tF8iHBqGrJ7gwQ&r1e0i*Io6$pj
zo%w|>;%An2Dqvq4NTR563KOf>SVPGpKC$HTCSQ}Bjclx^L+8jXD+k#%B9*VCVXbn`
zD<6+fCLDNSU@X2E#o>pLd>0G+;VUgj1zZ*K&@R6X!yA+MEa}U(lsi__-Y-wl_#9H?
z!H&}nnWB&KfTkL2EEddsLU<uV#P?5**{Ycf*PNPQdvs^golvXr6ITi#Qh2XdhoACY
zbEN}4M7$Ec4j<6_V%0cFjf5Tt!qh1Y%TCxy>G%PDz1XfiMDmU3EMn3sM@R$3+=sK|
zHAUjZuP^#+0ltnRnF=|&FfaAqvsy92<%A@!DypQsY~Gmp55|z?!KLKDV>ZBjm`{uH
zg~Hk|Wg$FY(MjGZKe$9qUL1!Mpl5ayIN4gc*Ao%2H=<a9KrzYAMlSgvIPxxu8RGdE
zSuPwXu^!yW$nys;%$6O86|A)(ceb9+^n5*rc0j0n^1OJ@@R-!=jkF-hNeP`gf-$7d
zEp96?^H$Qpg+NL>L!DbS92`A%hWeOJuBw!(2a-J<hf!ZjxqF%<5n6U1U(oh1e<aTt
z`vTLcB`ju;;a7LpGHZyr&~R*~tPR6KeF-Hbc4R(dOs`l0Wt$t{R-UhKvis*AwPUeh
z0Xe!@r`9c#s{a+;SSwSnRZ!DJU_LU7@#fxCZ75@)Wg3cCl>2f)isQ)JPPc^AKauIr
z;Rqb5n2d15k-5c4j^1GG3xyG17)kOUIsMAjXOaT{YD>cNejm9@jY|8n-b>d5dTh-l
zqPuYA(^{SMB!#p9u|UjR|50Nl&}wfl@%V?M4tu0Gpf?pyn%-AX%EKwY=aoYoJe-hD
zt6udpUN7-9f=?DS+W?yDO3{Pf%BHCt?BRHp$?iPP1TZS0M7k6F^F5sQ@yrQA6VQ#<
zzE@m%U&yAF)htE{`OPt;c_!NhQ(^P6J|A1iv!nC9TIqnPap=K<zc#~tdfu_{w17?8
zJkJ*y-ism%6o1@}n`uVOf3Ng=&`a4ZdJ|dubsr?6R#d%<9vnP`LFW<37RIIGzK}T?
zUGpT(>KuJvlP3_aN;jw2H%!r3=TK=D63ZY!hoVTp6#r4d51<<;78!fu^WekhuV|$c
zACXw%-j547(o^Ge{Nd5_p|n^Ly`g)4->1KCpoB<u_s~{ZH|JWy_t3k6<XtO%LjqPE
zCA`pq4vs=7mnjpLkmc+(x#uTJ>5Dd0qOh0y$#wB69bMeKU0<7KNsF07358fM>{Z3j
zS>UD`3IELUo8DcJpuPj875y^77(sR1(XhAX1Eq-#=v6Qu6F6^`ZUgYZGg6Qyjfq^F
z-j19!i+t}}7mb(=q4e1bRlSua3E2pPh1--~nwam1Z>X8Jlo2MX_p~Lso_-pNJJ^|Y
zP>&G)=>@vj1RiZQd|G!U#kc9C{tBJ$Q#XR`lG8>sA#%<>DYoUl7v!DsaU;;fK@s8&
zkM-Ot-t|PDZ;tUnn(Oq(H=I4)@0Pt?Y?x*f%P6}TDai2gushL2!a*zcC1a)ZSla3J
zUQL3~S7XTv12GfzgGh|ayOGgo>oS3;v<sUm!Qz^PA+#FpUMM6`AJ%#RSuMR?D(-!f
zu9Lu6Ac}80z(6f|xS9Kn^Ux3Sr1K<oD4_YDkk|c+H+e4YVVShG>2IYWBXX}-MYgiq
z#f@Arlv7+FD5C{RoKA3ooJ+Vp=&eBa7c;M@KFhu(u5WZ^&Z4m=!&g4ues|xS;bxhy
zQPkM8aKVf$ec*S?8&H6bj>n`RHJ-+9m$o<cK|4E4&myTv`~OPX+b`R81wL*s{5XiD
zvS2tKf|&ix>oNcRy(KCl1D3?@{o|XeMRL|*?F9mNmX2Fg1suEI#+@~C!T7%I=bf{V
z`);dz?<|+UNfe!VVx#>Cfkf4Y(fY_di(|+ZS-4JuUk2GC;bizDtp78)MUXv=*Dz1}
zYAM5RfXW<+57pt*c@4*Em_cr$t5mK=VJB2x1CiB<@Wy=s%sxmJs#Ayz-%li0t3{XI
zubN}MxfKz(e6geAal(VzwfhX|)fyC!D7&!ndHQ$Z4yQY?pZJRAZBhsuDdp-FSE>v>
zp44mGKZ(?=i6D5aRzLh8JafQ%$E&fsG6de~Fd-TONar%^qpF^%KE%DP6sul@*UcS^
z_gq^R*)k9Y{OXq5$RJhp{OEGHRePC$cw<7jdX5c}LGm;j5+uKbTdUic|NP@e-VcPp
zCp<&N5UR$I!LIj&V-Rbv_UZ6)1*m%I%J%0kNDJq!ug7o9n$9{Bvl*FvPs<H=#{)6x
zFR5;oP%%F_4Lgi6FgZ)GKwFoIH%p~0*c1>ZjNgZs)pt#}BD0P!N-N<FSo{VGblN34
zJsoytt5_tgEERRUT%K$#7u)ty3YS(~-i*hEW84Z8saPDoH7Qg$7{E;v4kLUczR#>|
z<MG99#F!QjO2bC4{ZM;}Z80DFKF^3*D)hV$gig}bt2LUia1LvfztLmJ?6hRJUlY_s
z7+kYU8YDia<uPph9xx^WebZNUl13T8V4E{JPt#VnZphSBhftwag&<v@RwH&S4I*5#
z``$Qnm`ZgZCQ)ZVlTIJLLNXBUjZz&o>AWb80X=}>4WYjpbrQ+#edXMp@q6(WM~yVd
zIDd8jZQD6g8~Rz;f0|q_5q%4CL1f$z6)iNKZHiOZq~vR{_FwATZV9fU;KNQ`J;@yg
zx=&tc%Jg5dk|VT~RJr=|-2(NZAk`Pl@b<<=mFHf1|EFU{eZo3qhQ|6Xj?pkIv<@3&
zvT#x->}Kw*6@RLMClDkDz>_)6SPjVxy)4>SOVy->yiImCO$GesF7utdNJBkeV6z!H
zyY^)p*Et@K$)bD#jlz$3Y2@-7GSSpv*Yx9m9)w>DcxE{n<=$U@Cv%yVM#DFgcP!N#
zL#uw5E@~fVyO@PYWGS^3{>nttDOdo%$Xrk=B+jRdcCECroqQir<CBbTut^(G79qpK
zK+m5@Ro6dyWsRQgynaxtD>r3I3|$Nmcm5d~fr?Yd(dfQNfv!Zquspt<5uaaX6J_Ls
z+M?j)dkU|=-S%+%&^h7C2JSul{qv<53iQHu{ApDMGDCPxcLHI`QqI$RC|I-z?TL8F
z;<7cs+*4_JYu}%Dz@8I%c5N&khaZ0N&9m~rT@4a2|GmzOcinSgDu4=&_Roc2#GQ6k
ziAyo6%Vk*8?D&P90u~lbwg#f*`E6rkM?L6WT38-Z2pmwIrxsfypYrqKSNs-E!&wdJ
z#m-=T`WHJVO$7lJ>9L0A=c9sg68RYLV7pMiipC?^kNO!u`@N&<tZmo-^uC?7O*Vgb
z)G!t_NfihEC1pXY)%ziUqjJ{nVxFuz1p1R7RXM)-g4g^-fiex<7wzd7;0c6MfJBGa
z07{Hh_32Nz%RA^cOjcKG!0{6RGwPE&q#B9|uKpT3Kqo;P{b^ctRc}|EV33fo-&Lwx
zKTtJY(t_!zr|swZQMr0xd?;TmP4xBprv3#dr4GqIcxDZmY>Ks2o^1Wn{o+ym?rB*G
zVUAmuD|`zP*vdHr6F@MILfvTR<P$=+1Pd~wrQleqx&$Z(DZ1reVnC@eoitDV0FYC<
z7rna9>H3Us-bTgN)n?MZo0rFQuU71NETWP=DK;>&Jc1PT_S!~Ni%7miZhNeoK#K4e
z>bM`2fUNKGjNYR@o_%O@c+&CsIak;Ekxbp#f{5$K$<eCFy%W6suL2)$%?J1|-G&4R
zObpC3poiYy$yBGxL&6;V_PilvI-0@Ko7)eypbRCu9s!!PRo_^y(B?7xT+v;KZQ4}K
zJ-Ffr$9QiQGuZe|ett-xLTl>5>^r??9V#UHfb9%?Ud`&=EuigC1dEWbC8+R~`))!i
zpTpnB6bu9+8>Tp)2P|-B;>r=m1DzK^%@bVoDD?{Jp2k$V?gDr14>Ez#X*pWZB6d*b
z2)zxaF5f*EY=f&By%Rl(iU*I{Z9C2!)#F_i{7=JRE??O3K0uwi+AnNq93)MsNWbo)
zOR?**-c(}4bJCJoVIzSA{tt3Qs*~Xr^X=a@=pM{IjXK8_(@bEx3(a?RY6Cth$}@f6
z7yrznwe<N1)GFZ&C=4pdTml9ow2MaaUcvy*InU_sCg;-D>L##~ZJc8tzD(j7S?-=b
zLH%Oeef4DBLD&Px9ir<a<EL?Z4nEF{^jZ3KFEypA_RVoQ)NOX6w95`4D=Ol#t)j0C
zxh)`cYMaIoqCU@yka;B0I8^p$82HK&tma*v^EB^sC97>lU?^N=5kjI-Ua2QYZK~(%
zfspiPgeenEe_xO{f1qqaiFV+XN;7>^U13vO4-*fgQoHxh4?R0Iq*8K@H5TGoY5ENq
z?A$>o@La-)W9Yh;FLnO8=z_Qfvv)YY2%Z>x<{O%JEuzePi|6j`z?WO=SwgG=CJc#v
zUlu^SC<^yiP&)KVzM930wCb-^XcGi)CwAwym8s!DnsSc}^qff@`0KQ#?fErRnHce8
z5iMQV^__@mfRjvpV`}SYt|J^jhJFO#BLwVnL1`IoQK(0rGOf<UM3zHO=AD1;wUk*>
z82XDJb{%vS7u6@Rh2`10k2)1I>-^qu8FXp=Z)<9K*u-Crkpf&!l>^e@Ht2+`u2qtQ
z(QL2I)&DuRd$Kg*K0daoZ{bdm?b|^aWR=lqF6ceEuHVP$BCb;xx)GgSFuUIU3D91I
zX((j(ufKb5=yeV0l#wdFv}`%xu%I;n3sj_({7SW!S=0f_?arscg7SLIx*~Gk#>UAG
zOGo*nNER#kzGFnS??g01iq_wae)^t*mf0X&*qz3W?v<rTD$K{}e!IB<BPC?YOG0KZ
z*fO;C{}?^=HJGJ_4D`Z^o{gf;jBn|ExLJ&0Id`OMpu<#sAcGxi+I1CP)fXd)yPH8Q
z61$$v-_(4bNuW5E{~v2_9TjC4z6%S2fHVjwDIg#vD%~go(w##|#}I;aiwJ^%BHbO*
zodZKF-7_#W(p^Ktc?Nxd-&x<E=bW`%to48}``P=B>$>iH?`@_jb=)YSGSb}QqUkc}
zmmKe1tzf{a8En?CQrs4$O#{l>@!6bf(9LBBrZud6XPjnG1r21hH<x7S5ZSMZiTDD@
z`!psRWs2G$#YU5GI-Ek|i!EUqr{#74=i6?>4?kccI42119l1b}*unQ}uy%Ex1@An-
z>)P<&wg;BdAx({{;?m{2GQqVUa^S95=wjFsq1s#ePqP{iREar4GD9H#5I2qxzp}tg
z<MxlCWVn3b5KQ*_Pm$=z(2tpF+1Qy!O0PYC`OVTgIJnxE2KCPv9#DyyxmsFU&U#xq
ztk@%K9d>bcIgv%}&g(Dx1B++5!0!fqDy;KYS|`GbtDdkF(n9<kR2~X%1-TrBlZ-mW
zA2{0ntTnImu<K#=+_{=}Qxi0bJig@et@zUAOWh}KcxWuV)63x5wP#GVT{p(Pv0*W0
z9qj+qC6TF&R|K9ro~2BSSHm*BD$yhFnv6wQGrofkTp@{8!P%zwg}$tq&oCJq{V{OI
z<Tqn<-)6yiO9aWZVm<)|aP^^DqJLVqvp6DlB!yt<)g26p$E_HbBB>XXH5hKBKT%h{
z2ShWgP;@z4Gh)=R`V_RCz9D`1!k5&CpZl@Xd;?a>$Txyr^mi_q7ih=8#Y12kH1Ydj
z-4(YUnpf}0y|4xq+$c&Ks;?)?gN`oRUTzNUiG^DYA~P5yubO&k=ic^C-0SFGvbQnu
z3W^qKfFcKQDOKZW?k<;KpZF1CiEgJ(GbUZTMLUrJC%c!q1Y|~Ca+J|Hr;upY;2-gN
z6^kR!)BVRGyx-MLiQzlh8(v!D><ekjWU;$SlY|sp2I{i4A{2Y%Q%`HfARb=0-Ilo$
zq7RS@V<zXP-3;fJQkV(H8ZySVv8ptn_G+1tD~7W1pe%W9?U6G#7U0^*-kL{8NAu}e
zh=9nFjD#?B!n@w*#<p^E2V2m_Ir33PQiia|<IUX!H(cv!ilC1PnK)KiG;tq4C;|7d
z#56n#%Z~+dAsC8c9-<=}JnYiPZ<inx!)!qx9E=5`4|s@L0SPEOdc18D!xtyi!ySw^
zVyHf81l|a0G45bAG0d;lcWv^$Hr^ytjaFyDPJVwPbeuS!URw*Zw|ZUQGx`u6+y4%B
zHVJCt6Vk-G#5~MRr*b`@Kdd;wbcuCeny(r6?sV|x@nyFozh3UOPo9)yMO8rEcaUs*
zj_9D8<v5RJp3CZVmS1^Te7Sszl6FDR3CQXj;MPoof`cwyWt{R~2R*;hi_CV@5ZsZ^
z#OUXTql;URzpIZnrz>m_C!LITU~Gy=9Yx$&*8QU4S-kf4)#|K?5r-ZxClL|arV7?_
zZ66$E1&(waBMKpRSCv#d8TQg5k_gJCWH!D^qG!;XKX;wiHn=HugW1QDC_V8FR|L|w
zt-l$jiA^+px96m*z2?KLVVs2%@!u?5Ns7W7_M7(Nn}`T&+Ll%hDM!E0pwl)_Hg136
z=OkR9N2d9_$;Sdgnhj@Oi^4a$C)ta)=qil}4CaJ~2&W&h;2X#WbtV-r?aq!S9yp=T
z3Fj4T9yH`lOkJ_8hF#f>#~<|+bLKRzudGgt5CRp+`$x5`=|1N)E7X@F(!$S<6VMU#
z8|UMQA0;9_e&;Gffp&Y&-!2CmXAP|hMc`9$3e!}5Dj&hleVHiVBYPe4cOfs8po9Ea
zm*Awi3o<0?iZ1^&>{AbslS(_^4M{jU$~}Eq=2!Qp2W!qCM(^lQi+cJ+!r<XxPB;<#
ze7z@-vzcXYy-H25RHW^_Rc2G?@s#jWi+#xcb0U<X)DZ0zLThe*;aAyYsUZs-x7YF4
zhh|LaOuKyz6-b*|YX(GhAe6qp*6Sx~5NSEKe51?CMYROW=6S>Hu+?C*uqS29ef-TT
z5|tEKO>#SvVn05g;Do-+c@Es=`H7o6z^+wj`F(u#N0H+5Cj<5>kz#e?Pw(m1+jFNl
zclQ8RaK>1?-DQ-CQF9mrohXK+i9I+{I3JGeJc0@=C-4wF+ns}jI@O5m9nQLS@;G^~
zoe8rBY*!{ik!!8&`N;+^9ST;X?>evl<UZi=V&@Flc7nNX8ftKYV(v`zUUOsC5Nc#y
z3L9Y5j3|ljI4iUh1r$@aq-#qytkuo0p7$ZNMiSAro&+0~TGnHOkG(~K|9SpCWiIP(
z(lD*CMIEyJ;ke)8yLuprMYO1T=(v^#_ck77OMgHv2qKRyryTBErFmFpWzhlt>!}#9
z?ILFkY&MX@0gDe~)WnI`eZJPq>>7CP$|6jI4!Vf?;wAZ}+B*{*R;Fcw4PNRBCH?EW
zQEw#32XZ{!%g9LnEqfD#e|;Bw)KjcmSAR^6*2lZ>>oLvk6X5v1skTk_Kx8!}mJ&oo
z2ULt^z_?^9^I6GaIF`F02{S2Vwm$09Jd0IgCol550=<HXmtvT(WwXA5$xBkI8@fUP
z2yk8bGnKGr%-Iaa(Xf%7j;(kgO$xtm{26sm<dL`NMcLt@)h+>=YH~Cha3_~z7em=h
zot6hR@=KXk?a~5!lB#w;)z*bv+4&Gi?i-CX5nS4!Fp|JVY1c>l4VT|f5h~lWW_OK4
zV=r-B@Jvt;q5kmK1{XZ+o=F_DU19B!&}zA5N=7<JD!p<EJ<|RsqIG#|t{!d1OIE#+
zJEFn0UeeeLZm7#s<Uo2MfcsLra^Ap}Fzyh#{JB`pzsbbMO6;&n=cIdXGBlC*zWXN&
zwA~OG*~LS_x6KO_{5gTqL#gd;Ib=sI#D%Y?T9G=m;7I%st4{f1c>QWb!qJ*$KbY1?
zfh$9}yTqB(a_ua<0M<OIHT&{7H!v&s>HCVVV#`|UhO>|U-;A2>ZgzL>@b!<ZRU<wc
zTHc&Cel79*5I%GLBO3cWvGU`rU0R}sgae>X(#1J#uzS;q4kf-EeMCLn;}Y`$xvi9O
z`e~s!-`ddsu#Sswc=R)Hp5*)T8(Eiaw<-GP$bA=nGmRm`a+ww}nHFt{QbkohTkj`n
zbc@o8=&<l4OJ`i>>rbfr69*pu%L-+uj<-=>0&0nI>Fo>!e7}h59l@>d|4Ym(n@U0N
zQFbxUjqXc3cm+-xY#?3%f`h+*Db85XzWx+;KyfLT)I+RW>$!tIO9})6*M$Q)$|D7p
zD$lOg$q%i>Xv2vr#)=ac;;|#N+oRUOTGmlu>*@iB0}UB#X#_RAaLaC$H~XtGIlIrs
zv{S={3)9DGlFujB*$273B{VXmaHlSoS@z7q=(PyRAD^vxRua9LcB);A#fjkebk{&i
z0d^91tZ3rgfbFMGwpZD>Y8>WfLSI((E(Yu7eAw;XEJzn{^!Wk_cInRmMLWK<1MZ`}
z%)vi8D@9Z8k$WfIP_}0xZ(Jw>mm8Xb6&TzT^{`XvtJm_7gKT^suX^JFs%ekC?B0o!
z?1gC#l{)LDQ_r6ytf09q!laH)-!SpPdc<$?KaVLNcJ-Lw!>DmxA1jffgnV$u6<)Ar
znl)R<p{a>pwcn)FtI(^q3lp6XWV<P!alTtKVA@)0VoB|WupBHP2;lT8TP9jMOLnPS
zXhr(<c$Fc}GSETG#9AMJI!tdD=bQhS5BBV^rCQG_kP4vQaQ9(aS#2PIb3X3*a~BQx
z?O6Pp+Eua18fffcpPq&if25)OCO>9ro>utgs55_6`sb-Yw7?jC_<CPNd+fQGR-0};
zAN%<7`(EeGH5nHlIiE+?$7>0#{b1!<?+sE?T&p&1jt+d^S!O(k0vvEyG*s(-#8TbZ
z$)9u!rGV`pKt{kSzS=t00beieIyG#(U}_tWNILsbKbJ2nu|^P3JdXSRiddC1?a4oD
ztNX^ljWR8N2@;%NZT0bY2!YF`U)+AjUmN2&%w39P8TI2k*q<2v>zSz^We46qxl2I@
zox@>vpP&=$ng1dgfE+*h8)4Rb-Q9N!vpOh68)n;eQ++*|)nKlc)Md?M<dJzfAE$=G
zSk=~vO3DOQZ{+4If_E)qMnh^pE>1RW@oY5P-gB9KmJ;g#S7>2>2TS&g!5Zcakg99H
zz%WANTBq)2C^L_Y^P$yOj!C-9P%kFxymoZAa?9jH04ED=t;1e?iYx+NYbqT=p}*}|
zJozAC`ySG`k;#$&Ue0H^)wn-bl8t7=+c&l*lk|KQw2liE_n96RKSAm>8WetzgJDdA
zZ+uGa)0Ly|sBhh<9U3FjFl*%R!qTYYDm-o)oGC}&i+=p*RI=MWnRC?r@g<u&WpBjx
zi1p1(#Z#_4TD$401SLw!2Z7D5w(>Rz5vxA$<>51gxO~3LD9@B7?A{oI_*0S?A+K^Q
zM9&?UlC<iWG_kQRdr~hwpUpx=jr5JFTJ^i0`&sCTFT@`sn_f+Nf~jj#i@^9}5AtV<
zubjM_4vMC{!>|xeIg^|m!*9AwnuwLJbK<2TG<(MV!8;qJBJdqzBFJ@dSGey<sZ%j9
zd<tt?uyUQMN2=zlEz{DL69dYl^WN^28|_!PvC-<JogdtIKmU39s)m*$V0(T!;@opP
zO9YO@aW9K$;)u9X_sCDF&Hgx5E1UO>=A|7nd3Cj=XH951JU$TKj=<VZka9c5^`x}0
zuZ%HvOQl2{P)+1rX&5b=VcO}XZ*AX5SY5D8FCQ6SJn$-;AvxW$>dt9NZRlEWbuBvp
z>WIBk&F-eSQ?II3+g3;AtR}>ltAY>C`$ddYQ`2%p224}aeqCMW?isURJ#gU2)Du&#
zk<wv*fl;%sCgpp3;dOu+@!nxS8bDTxu3tlLb7km1vZAqN3&%qRz~2B~MqwzX!WI=S
zlqqL31T;KPm8YUFQ|x4a!1vdp{h?Y!dzH}GPV06<)~XKe?}@(_CuN=uX03n>-#_!{
z_EuBa{R!)l!R4gP8J3LW%k*Z_`hZ)G4L)nCZQ;tG5XW_|Qc$;<qqxUk)60WdV}HD6
z9sKmw{QRiXakgH4F)nzMmDM2Te6>5i(~r<-vX9;q4@RG}tjY7%V>!99u5FlB-MCTW
zizs9D$#rj{>WLB>VdBC@)KM>;o*k?fri8!tJwS;*|IZKi7?K2jO>~9*nqG7e`S1pE
z+S`|OgG?IxI_O}+dsTjO`|`wK;>{%G(KOp}U8lB4)n^ONXJG|tb84xYQpTHFv7o6j
zLGuq+>Kt2m`pOyTi1C^kPp=EM06QZ^W3R<<4h&brNdA;KWtnY?2V#xmE#Pnx1AbiW
z<h$q~OF?^dP_5IG?UtCBBXOqt76Ikfgu5q#dN_eGGA1X(@^bWgH4P&qF!BOR@;)c#
z+r^JQFlN6Lh;Y^K@j9T)!$SB&C(i1{98WkJE*8_D3Ruw(+qf8{dLVj;F0wD*bcZLl
z0SsAu9}KXi!S8m&6LNR~b|P=SQ~U)?3Ab#?|Nn?B-TjvlSzkj3(LvI`Qt?>4L7CSS
z>Z%1hux}w!Mcun`Qmb^|rSM-)FPqN|KFf>CdoVh}E0<#N>Fbf_ha)lke1}r%9&DjY
z9;eQg)>vf|uIMXi`*fEexq|#QoSDkCMN_9DJ8Uo~9=#txn0yt#Fs=Q-n;!Ly3@v+>
z(4EAikj1WS{U&(#$2MD)dD4yAtYoQ|4W}K)EVao^Tx50i=m5l-iBt2V49>!o+s3Q<
zv6Iu!(P>m0F0q3tc}=4c?slU61|&p9avt5l#=cjUe3@U<vs5-!taZs0Pa8r~J=_?>
zsV1WI9Ed;CidnI0+7Xbf)?^p3(P?BZLfi<*&MH{Od>OT5U1A>}R0UFYnQe+J@AFPv
z`$$#}mvHoSjS1%T02hZO9dr65stnqrMGiYh=Z*D7Kb$PSt|aIMM&Da0XBj!hGEKB+
z+>7IRLk$6#6iitB52bOyfsEYH%~0JjkB1rb!l9h9G6E7I3cvTML0@aoUhqRNIbjV4
z6mk-C{IjWxe%4{qc0bxkZY@=NLN#aVT}C0s=yge>nVw;!%V1{|zp?iB3fsUZK~;X!
zG@J!72OWJ2ossv~F_$w0bf{FTmPVStYx8E62xFGSSv&Vy?UACDHah9!t$Be}`Z%nq
zD~m--b;(WAJenu36NOUe@Myuu*Iz6_08Eeg52n+HHlczB5G0<=uO{8~t>H}Y`P^_T
zdW`?$Vg(a}Ww(|WB?}!~s!y|%w@AydM@65vyy!0PMB)G<o@ArVvV{pKBPemC_{qFm
zKrv5br$tz-_DIEXQnB`=n^lT5f=Ago1p1^D)b!dzT0avbd=t0uDSIVtwMJ>mT)7=3
zYxuL*Bsd{Z*Y?DbCwjz2<Hs?3RqBm+Q|1T-n<;^CzQQo)@&>+^o2>ZI82@VKHYJ4F
z5bgHeV>`9QnMa56>!qE`KX>-3&Dqe-d{d}Yf@>aWWHxR1iWSFe6%&Sfwx_L&j5JtN
z(p1Ut@%EQ02T27qShCT-uTue}j+o`uqiwzHQ8X_LV(07qK@yV%M~+t%@X++=!KDL&
z?L@`;$>V6phOfS-l{`C}UwYRX<nP*KbX1uC99+H8mKN`43wKZHFmYD=^Sif1dB&|b
z6KOY6@Y>+l;n?xzRUgSz5v|6ayg#(&T$CQTF8tNMNIt$A#{HKKlgOiplGgtnQF@K>
z=FeKp?^WtVNeCgX``4qN3eoDqIKQfEeXBhkAWU)ObI~EKf#bW?yFzQ@oN@N`&*#o1
zDxt_<uX=6Fg>Bo95p{wha6Jke-s_P3Sml_1(T5kh_~7sAW)uBOIMD;Ib8Zt(=D&pV
zVB0<(A7x9j^#2l0PNfR#ZNho_KM7|z?19C931@=H{i>JbTpc1bQ#f=n1fKH2TADdB
zB#UseAqz-{@~yRMnZ=B#Y+;$@&J#cWwgCeqenEl&J7uP_aT?-0&kLI$S48lhd{RGD
zZdCs-H#&Dd`e)Phk8xMkghk-@aXS8f#}E*bmdIqI|As-Lh&wBZj%MEoZiC`H8JhSY
zuVF1QI;b=xllt~;|5<cC1`x^YHE}LsY<ks$Mz(f)rW<xG)Z?5<_Unj_b1=ZaN)1DO
zwRzseZ|2p#5A$b1%C;v;)AW98m6do?oy_(ZZGu?1w@@+%pkl=Nr#TRuPV(I#pK_oS
zMYJ0rkGt<!A}(P+%CJ#!{!;$0w;eh}w!K6RW{>W_Nj#oA#tQq(u2EmpCrF3_wmq53
zs+nAmqdQ9Eek7XEiP#Ju582M?2V)@^W3WK_yVsXZ{Px38N-z4daKHN`00w6Lhk;M)
z7xDhC?H{6VLCys<wBR5NlfUm@ifvr7ANr&R?RF-xW$rjD3cP%ab^Ejz>YuhsS&9J2
zmi8OfTZZ-*D*H=lpfi*i)T-ftXY{q@a1yTvz7uxe#elMym!uh9Sd11Y0;7t?LX<rN
zzxQD|KDS3FtZ~BZq5<-qa`Zooo7Q=MtK#`fL}8zvt@s0RN6jrm4>hc}vVUnGNY0h-
z>pfsB0Z;zTUeuUDJ~?Xk)S~{AiE{ri-Ou{#VW`P^%!>m@2lWQp+0>wE1xkouAg$75
z3H2xYgv^gW%L)0N_P8s_%wmwB9JNeJqnGJd4Yn=QXW+^EJu_<Q{3T3KOkwQ){}ofX
z9SR#7F}%b;wMgWf%`<Rew7k|9yDvz8^dnXYmNzZQwTIQz%U;TMW_(*p7Y@mLENFm!
z{qtYoPU$QAOK#_l{>j&uh^#WaTf>q0XE;X6Z49@D!-Xaux$0Zf-y(Xy7xlqVKa7nw
z_h%^b;s>MSK)+qh+t95i4<(0}aL_9nvR9~e{9JAAjD57^2|fNcG$=`m4K5Tt0fGYV
zw|`4iy}$V8ui;>jq6~-p|ApZIR8bVpfSPFkNNgUv7(3m&gf;tap&>SB3X|mTiaUtl
zU4vwne=Y4v@LxZw`Ex{WgUUYvV?Z85f!!PnhjyD=V<Gta_MC!{Aidkf#`~W}U}s~P
zRYr-Lv%miUqfs#iMMWXot$@EYC7*6x$Wizn_`JDphM&va=Acj2B$CEd;@Zh*w-MtT
zHF|~Pv+DN1;%^eSNc%AmL;83PzrXn>TrB|JgClcq{lDO|cc{PQ0>JL$(5L@A3N`C!
zL?Ln#7&W%B?SXb0I=_H){7nVDUk`Y42|yvhxPQ~_vc4$tce>w@?s=8G#QX0ofWHJ_
z&G)qr>Vv-Z{6_$GoZ+{j?F;k2c-)Ytax0={zx*$hC@!;;)dWhQ<8bKc$=crM2l2Yv
z$0^}gZZMU(YGB^Jr3wfT*kM9!rA3+5?4dE(g*8?8w^3f`f_^-vjmRyoU}Y?(4R6Vj
z{mIX=fCNU&9{X>^ZH<^@xkLezm6oID$D0LSCp#J~zE{N+m)&%J*`cBL8^1m?XizaU
zOoeb!^~Q1KC2(7gpkYx<Oil)1;r)4NLX^LW!ny*`zcc(sN=oYJ>SS&-)oVwV6I3(J
z_C!9GBO?fxV#=JyemdTD&d1Hmh_9(gz2^-c`fp}{uuqEmpI<3Kd&}t#!{@xHkmC=4
z1>%(=UuF)JFgIt~Pt-nK=`S$tjsTgX555@9Q?BjJ&$B0>cApPGHiO-D^P;~z#IT{d
z%?#zS|4I%&G|<^6>~i^=pJgaAX^vfd<FJ`y<}5&tb@lAJSAWYL<f=?`b(oVL^SJmR
z!!4eqC1-T4Ds3QSHk5#6N&KglKm`6bp2A<xFUs%_^&H1k`D)^5#s;gxD@va1DFh4i
zQ)AKT)9s|;D|N1B>7_+hef1oxlOnGMCrf9Q4iFAf$mrt$u1MJPH#$v_(U5Ek1XNVK
z6gnD`ET+QvYJ#w<%_(g@4|Sb>-)-|f;f3kF?P{1|g!9?TU0k<g$9`Ve5M!i>2@|i)
zScswbzLe1MnEEjX{9b^NB7j3M(J=ra<h=pQUKf>v%I+-04o@<eAg6J+88I8_7Py+~
zHtW$Xwtc!3nRhbhH#fVAU%L6>K?DuaTLxf)Wj{s!^ihUxqGo-!k^0^Q5o*>k$UB*n
zp~-^IMaPvf?Am%Rbl!WdN1YT#DtdayJg>5(!!yzD-V>Ojx1EYwb4gKq2CTmwV9PM~
zPCb;O2P7FKH5@#@;%~kQ6hwaZ2$2+NgUP42^UjC^z5yA?YDY{N^IuFH9^@mG9wEi}
z{<*dU_Vl$J{Z&Ky*ZUJOs=C(Z64)#sB|7F?+jRA@>IkA7Y0Or#RSlOEHm2x**o(Jh
z;OT~#K1t`2_&2?L((%7mSOadZFM!M1PfcYKw#uuWR|g_^oL2)0#nR1tV<&$H)3`p|
zt{PQBHfvKkG@mi2_#h`E7VR6>nHyG9y{N6rcNCKN!W&#RSAN;w2j5(s7}>x|QWyuD
zFLvbB^ORh&nQT{q>19N&6$abYOn#0KMe2yME+DqZ+-I9S#)@<+i;?g;t6_%Ccb|~k
z2$m+A{O5eA_)`y5R7gT>6QRIw%R7z6Z`ur{qZv51ViFfFpM|b+;?&pI6A%|=JJ|Kj
zt-H>+XeSE0m1O0Q7ixn{vlw4=rKl?j1~DrpnymsAC0^A$16^t=duMg(JcRDW$*zNg
z>0Lkvo2PusjMm3LfF*SKa_$%JJ0#(aukc2G)}QAlL?H<PjEYwsKl>_vbIH9giSQHv
zCL-T@G}klAGzlha=yR;e#>G`TdiGA_T6EFnp@8FK(ftn62ov%1HAbP8cvIBuh@7uw
z@mLK#mT^tRJ(_n(@toYZPrCY%nyTb;fehEdEA4DSPT6XxshO-6791-!qQ~KvPC&Ja
z^`tKS;tX8r?ZrR(0gMGeD^XQ{AzX4cN!@-BdLl&NxyR~lO{aY`8b(7RYb?Cma-Z_0
zMV7%bl$1(s5W>Cf19U0fW_N!g_vJ7X&&^E}wr54@id5)?-8%Mz$8#l@C9YT99F0=l
z?_a&e5UUg0I~x)soc&5zf0htE^E_oh<Vn(iICZHUA$o+JypeyjU4#d{GEfOIHT|ML
zOJeLmE<^qPQ`QjVWH!nDU4yTWZ)UqFuz!8DE4+2CuC(P^D8+d|a3`Ub;dnhSEw`7e
zWm**-)_$zX(!o%6bvP()9Vv=*d@yJT<_BYo@oWmj&!+&vb7;5aW+y*pdr9i3ukUo?
z5pX%(dJu(S`unA>$z>Y1>GvJ96s9;LzM_YH+_C&p22EXIXWj+|KF8y+aE{mtX601y
zWLtU2>go7~zEYZ)Pt>!=5jprStdSha@=5<07JV@F>pAbk@T|m>S+7VXfdvei#Aee0
zrY%gL){mH;<jOT?jru>B6{!yyDMXxC`tk`&K5;)zgw`-`;91IN9|aN!h3J?yRtFfp
zpjyAciW?+!*8eapMXy=D>TyV)_)X#MTUMantM;?eCZ#;yAsHRi(#P+Vk#N<1xQuXU
z;S8>2v&b0NwM>z+g_XEOw>v8XS%lgeF6)E(trkMk@sGkgb%FLRSFSQHlArN1uxQ<(
z-*b2Cin;bBXD(ftOYcU493aQBSvrQL^?#z|QT7H*>v6+?j-7Mw>V$a3z1`TfQTRI4
z6=An3(6?ziUGg@-uW~Ptwl5AgE>H!yU5Ur9Lf+@sc05jh-X^{@4_$ht?2Da7H}Hpd
z+^VINp_;6_37|doT}k95vj0-NEL%WA7@O4}L{h$jVB4mf0v}C-mp8vbl#O?&2Cb}d
zucEuvBJ=q>*GGWn8)(0iB9A|2>k2eP-Qp4Glf8?!`wcEz(m#vxGhNunfBfJ`CPU*i
z*@GVY4@yRL1uz#^JmrMY;_r@zAi<F=>HX!xQ_aokEC}jDMYb;<Nfc}M@84DKzmP3@
zQ0!Aq8y7_W+lUJB)J{GIu4vp_QyCoYJSfT!<|bh(Gar5$#&KN6ODkYP40kfP*s3H{
zOcR?aakXt)nF?|*d*OHOJ>{{QVjzFMRXLb%Ihb0~ee}knXOU;;qTICmGj{9sNz2V}
z{0q|~b^Y2&Qe3Vv@snxil5WB8K`mSK^)ivP?+*6@R@3~%Hu`PIe;IhL=MeX{ws!mj
z?j$hD>RM)Xm3B^ZRq-&Lc8_)0XlSfm{laG|tBw%jChMT$V}Dv;)G_V`me7OKYi2p)
z-nqC)k%PDAz#Vatcz-;?MV08sX#X*T?RxYm1W6yiQUK@4XSx-tdbYmneKq4v=8;8D
zT^)Wf{P_#C_niND>Uh*nWZ|QQu6u@g>q8lVwz^*)zz-w`S0sa*u1A|ZoV5{|OhADU
zFc&L6DWM&dxzO!2xntCz@W`mLxUQ{rlf^lZ2Zck;hk3&COmPg01InE-46(*&9>*V7
zQp{PV`NY0_xo2VbLy_TR^Dp-1`>svCfgbRHnMlz%sZBBPA4<ew9&-3|PY+Ta#aG0d
zQxPS%W=rO`CYQmk7*+BhP5k&weo!u}tDjQkP#UN?Q8wXZ38{ZXE&AW4ij8lbf*|?F
z$<SDe&u3(?$;lnsLQ<x(Wn_N>clSYAPuQe)rN5NOF&yN>`??4nLB_5%^a+R53b{2I
zs}l?nGcz~W%#wCc_E^gZ4iU|+!z6DMJNxs)KA75i7~Tm~AKq_2vP@oZx2w-0F%1^A
zj!%tZlF#OorTwy7ze;OT&i(oTMUQkA^RSqK%KqMKeINAPbZNQJCvD2v(AZVB=Hbg@
zn9-<x<F<5Ons38$|J$vv{1JdG>yolR_3I26YxoClN_51=QF6=R{$EZ!Q&?b1vy!9|
zP>fp2kHAs_t53MK1>{b(aK_KjiGZw$t-qZE)hp;BS@ibkN@7=i+=JQtbKaxX*>CQH
zJq!})a<BK=30YZKx;=X}x+7=|wnLd-kOvgQT)IrO>qP9Y7;X0!2EG8zFW1kwd%tQL
zZ;n&KwT*np4%>s8a?b{YcR%?&9tYzhAuRuO|I8YRKPASnVM4<O+nU#As@~%72k50f
zy04d-*(y4!sbYSSkI21cr+@LeLnvWMBFiEny5LQXC0(NADs8NHfUerTmEs}|qoE&v
zA@jD@>#p^21|lWn-k=%3o2w63$FRoOq_+XZg=pgnz?eY&i?)|lS4c!8Trvn`>`-ny
zQS_z3cqa&o1dwqasj|rMyL(=gVmFtE#oBI%n^VU__0E=yRPq)x9A@@24b`dRQ!B92
z+?<?x&+cWa#|Utx;xECsZ#mF(1>*GnMSOqO{O{-PcxI8WsFUcwqk}4Uif8y8{v7nH
z(gt3UpOO`@YnR}?2!mMQ(+G`yAFx|=jn4qm{f8;*yoBG#>yaG!0szvy6XkhjY@79y
zmnz=YMo~N0O!E2MsdMx9u-{vBTo^T%(ixJ3qS3$_3Kw({OB!!NRc&3L!^RRziuOO(
z;Rxi60J&}UxL*|T#!ybfPN38P`Pm!hG<_~JG2b4OW))BzXKTEYR9hF`P3u*3{Oy-K
z7v#YK;%f@_oAY9_2;vdQ{~nNeL#|J?1!H2ghim#rth)KEHGsXPm))877h#XM^tEIW
zwMtnLh}>Z@VRIE%iw}_u?EK)|L0`@+KP?S4DRVLxt0bjH@DJ%3*MYJosYm0Z71c@B
zvm^J}&!7Vd(OPL%vwmbp`$sSJ>V3JZZ4;y|X_BSR>K8Us4;?VyL+~p%hi7SCazt7g
z-RJ^h;j_HO3N~{;An99?YuYoPzgMacE!=9#6>Vy<@?hdLG_a<ba-*<pl-KZ3UyTKI
z3pu1I^&f74malWbryjn7oH}Z<h?;!mMu4paZ>3r<bKlfeC-hz^zDVOMP1Y)Ot#wF}
zzF=EPnW}Fo(d074>I@NFZ{5-sLk{-H6?*T?NedoZS&s9IHd?4@Mf(~wSa4s}=O<e{
zz2GC$R_)C_F8E>cb0=J&jZbk@!;k7q1hvNYwMFyX09)RTmZqBPUGv6<TqIm9&{eG*
z^v#xmzcAHhyW*2+b3+MmA4B|=GA6HG_W9fD4Ef*>HVLKAgyMiG$NqJ4c%Zeh{-pYW
zu-ALctMn2`jxF0byXo%+X5qr-86T{ZYt6W)S6L;J*Wf<&w05!$=L&<~^RWy?A)2C+
zLc9|Td6$1pB;L}-lB#6KUhbkXg}c(R6o^IW30_(Pjx&%wH|_-VZSnMI&)Ra2Yz)WS
zQmHqe8~786qxro0p8^^n5`vT;M?qty<NyZ9NUoGfPX^dzLKJMFT<1so*GJq|r4XbO
z&nk+l?#wg_kJMNMLmDfFs-?onHCmc4&R@Co7*$yjS3AtjiXB7m5?1wC5;BpP5K|=h
zu&l~a169hb2%%81i!E-!&I6^3{cbu$Y4TFi$X34!p?%Ga*Di!$fy~Ic(xSftvufH8
zc;??%B*dvJ=X?@H)eD4BRAY*S{wRjRt8l});@Vj`fOF-gn%U)rLTk#(zPay=NVVmq
zdj4FtdrPTFiVmW+rQ){-M=q$vQS1XqTvB+eEHEp-cGk1^;N#BQukV5(f#G!GVqm3O
z4`#3h^;;Yiddf_)DgGYs&_n_E6r78{S_0xoL0)Pmdr2L`7H{|*{k!4pBY?cI&iLT)
z&MHD#@9mxAmG;LIlA%UXRP>b(44-#D?8;ZovV!`fjl5xx<+YPp)Y@`PSzlj|PD*Md
z%fV1`*-W!Sb}^Pg4tm%bn|axQDhQAv>x=96DGdfwML8eZJERDm&IcCP7J+%K9;k4l
znt*<eKaTs64K#XDIu6u%(ZsN;Zi@+9j_hCXrek$esHw8{5~t9M^M~&=K8>8>b8bn1
zeuNIwkqrln#|bD;SJVQXiXUuuKgX7-5AIzn=kS~_DQb<Zy$W9sPFOy=v<&e1ebP4H
zHCC131xc3q^vz?#V!s!*I+{}YVB`qX+^K<NHFp?Je^&MSizAnZ86;*l*IGza^!X8v
zyO_YAdi2EFCyz6IE)Tqe-H(l!_Ne#%+$;Rr8#$Ph5<R~^5y#)~a<jpddB)qmo#;jO
z><X%pP*-m64Bi-|m9UaF8_XKFD@P5!2l>iP2%O4C=+?ZVdR~1|g1^>7>dYaH8+&gm
zJ8qnVD||=uYU<|~;kg%S<fDz^4>t2Y&4_^q?|tYm_|Bp*v!iqFl|}Mo=1Q8r|BQdk
zmG94|9o@0rHR_)ZYv_Lxf4wc0i8P2+W*l>YIC@C@D&~KznBu-PiEk~=l+70y-MW5)
zw0pymKN0wRr3#R&H-fk9nhke+O@EM(2T$}TxXv;MmWXr1$j>THk%x0VYdNf)RquW@
zo`#mr2%qz0YrXr_>bea7t77eu1?<no4)v;s=BxSa>eXh#J?GoB@3lPy#56r+e>yzd
z5w@g}F}FXs5q%ll1oy8}R5$6}$0Sf*DQH0)1Sor+7*w4dQYg2?rR1?93a1u)nXRCn
zeRjTC3Mx%o`npB-Zo2M$gtK%ct)h1XXx_HPsKvL+THVoZ70@ZFKE-&G#!{3YKR4+J
zAu5lcwk(z0nv686&&5@a6j;QT?{hv~2nNmWJ`wM>M@IzQ#Uk;F{RYh(HH{FIcBR<|
z$axX6!cCuiZ-dqXfOCGf0T;PR_7#T1s{$_uXbxAp>}qE$zGUdAFw^V%{eE8?Z}e^;
zQws;^hf9td9B$v5th9z1xQ+i<10X32d9|#u@*{7%w@<maSenr?yhQ$NX8YY-M|Fmt
zO$h<uc$<ejbzcyllBaC6?7KUP%JWJZvp*q%@t~=zm`-$m9B|#95{v?*4UbDoK5#ta
z4KGZ8X(K@H<-W)fKoEbGEDv9N#C=wVO!HWIgyJMVUqvGcAHD3D<>x=m-7$?6m2Qa3
z09fGnx)cBiRWd#FJzI|39-Rgn2*!T%gXVlM>`b^oEmue?6xc^%_s({m1(1>xCE(fJ
zU7X$nKo+f&vKVlblB@4&uv9A`c~p-+E~{1@OT_Qvt<Ggvub_{2c#T=(o9NJYJ*gM4
zz1SIMeX(8ZreAnTbpVjo+EI63o)&I6R{8e|Kt;#~!<eQW`O)(1KP3eZy+sEZwk+1(
zdCw6b`t5+qr!9z3>=b%F^SE31!<q!g)So>RPy`SSeQ?ok4{99nTIzku=`gNlt1I&F
zyJMF$jR3EREsLEaXxo(Z{Kji18&*5u&~g<EKvq)Q?JWRcR=@(??eamj_B`%;^WTE2
zb4skrK{xTpMDq^DGTy=Exvv0+2uYz<G~QgM)B%L9^>F^#vdtCVN&xwd1G-kNM>vcF
zSS@84v8^YcZz~?yZvleG8?wRh>WT=LaB{SeR$x1!@US50;JN^7z@;|~^JrE474efW
zy~AjkNpoBFZ6|^4AlpMuu4<>|XLTa-kjx{+<8w37KTjQUO6TBjl<!ZH(?3CUf9#e0
z{J2Uc@7{+c-TG8qu<qJJB>`4xLvMwWir*eTBpjSCCe{fS@~BR_qkp-1wM!NoN<RtU
zJY1S*P9&!~nPvU)IR&QTy6xTpN?L2wy`<cfnD^$;NfB%5BQck6=m4_)F!YC$8H{&g
zJ7QvvicfPmCW}ukU}ZTnLHp^uk)PqMTr60w_Qqc{j_)rg4vm^2!uP{1S5+eoQW!vx
zuN&ClN!#syE;2Z*Wo(c(aMHB=(-N{bQ$7;k(Q9jlA@QJ4J$vA+H%3hRM&z$PxBiSM
z&WZSM#qTr{s&edOoqOJ_p{5~A1>18k6{l}=zKaZm+@r0d-SgNxKOB1NQPSTdn>90*
z^mu1IiGqU`^qzEx;>aw?6dMfc=qF)umxn%pSHSQOW8wj=AtQoDScokG=+wn@Mt)5X
z2JHL?{4g10{CxyKmYV_{{Pa2<>&$)c(25a-IcF<SfW*oGT7^?|&hFmF+8z9u$a);$
z00(<vndZ&Xmeie=8(+v%J%}f7`P%V9FkMZjYy{pEL0Bx@l&*Ume+4M-{$Nqp(u!SL
zxjToqplub_J*%@3stp{JR5jn6B;;cAR@2Dmn2g31{x0GJQi&n;(V4~ZcNyAsfq_)N
zGqMHGd0#vDQ2o75elvL3v)2dMD7FL?&2LkEU-`H01g@6LkrJR=u=%JBmkWN;L@a9z
z($ILY_~MHwujuvZQp8KMV2E&e@Ig2gzg(2&bxxe2&9;%#Z>A1H+_%PD)0cNXgHG47
zBG>AcBAkUE@bxPKN5Q6mPi#ve((S>7c`Y~B!r(J+|L%2wxeH+w6Dx-}4%yL0!U8!5
zX&SdG!hG(g7E*CreC6c|d*}~1y!riVcH@!)gR2Ca;#O}`wzA_<Z&T#p#C@=`(E1b4
zUC7B+Z!}%<!dz2>4n8`FO1XFns;^$yP$^AiS`rlBB6&(L=<CkK&3#I~1UNn4gtst}
z-|7`G-EB4P)P?RT;V^{2o|}&$>1g{@wQYgy50#m*%d^9E;3Xo?8zs2HYRwfvBc{ba
z=p>ppOB$(L5ZQR#E9J3tPx&EeNoRdNm42sn)}<aw44AjT;>ve<F2-I74gTBz8sxDy
zl=0zY#x3b#SsKt#4s;jWG@}&4z<k!S8J9-9hClJtQ{{Gv%er<zpC{$MMF!`NuxA=a
z!{R4u8P+90<cBq5W1H#@c^nFQR9z6PYo(enJ!#VR*h?;dKCe3QAbI1XJZp4Navoj0
zRLWG&=*Gu>RZ*9X*Kb(^gKD~6Z6*3+9@f=0g(m))IMFv|ci9FS$vxS*DjV6n!sLEh
zoo>F0EL5b-9S#djF*KN-@>Yuk3;ncZwu3Q*lNaY_gACcKf^uZGVx+Xww#-W60CQmH
ztH_%Qi|oxPp&2QLwMJ;ts?D8=ttCtxku<rRGvRx)%@@Q;RYw{oDkFFZu?uxig-$2K
zYknOUpoO=4^2MGrO>D<jIbQkvAffM{VwjpOSNwdylVodzyY&bO>`SRCdH%SHSL)Xa
zZ|mYtK<GOd4fj(~MbYJqDYq~oqo$4;n<(i)!{sd&$X9pF8q7}355KcE?cQ<wJu4A-
z5!bMt{AyC}dGBmAU22)^WJ^M7T_&+PTNm}Up_VL6q%lC?MhfC&WyEy8Y+LKZJ$zEx
z%RxBWX6K$JU1fOzT~!z%`WG*fpnf*j4cBMkRkA)tPXRslqsyzvi|ZQd380LgEfmni
z3}~+^kWAJ>+VE2&#wo3<9f^FgTbM8S8A=X_2u7N-$=3J5lc0NEJHw)p4Kqbwfl#s8
zpqRu*K#w<<ZdM)vdQQ=*`$@=oMS;CA>3KJxG0~o#u6$-Ca4j5EC@g`-LP$1dZTg-1
zeaLm+U!Nb}wPjk_e|rH`p30jb8y-6DJ*6YuqV*NfgrJe~&%k_aDF#83-(s)w#u>S!
z#;tk_NS=J?ou$;pW_h*iCi??!w!N~hb-<v6hoan5kN>Lo0OfwSTe2vswPEp!J+hvJ
z0S7D?DOj@Kejg}|xj_ng`JbLi=g^+E-b+0Z=wJ|A^d2XM9e9kB!7KQuy>{w@!$Ji2
zrblb+5b=kN<{y%}mw=yWdl<}jwB5Z<9cuRR>TZ8d1aCN&u*rK@BD;Mp@3Q$~PD9x^
zDgUf%i>`LAsN67+LrEA={%9sCICPA^d`tDa_CWRaQ%U{r{%laL@*T!|gw=d1TzE~M
zYXu~6&<oKCClBG>Cg-=H=?R?=rS;{Z29w;|JB_<L?#9ovE1u(2<Z=d^790X%S#?K~
zlM=^^7RX`;sq$B*!j$eUIx*uZTg%ys?|{sqZEGwdj;f<X<nDn|Pw7>-<DDy#@<4~w
zTQI!aGF-I|su=W2g94uF_sLUntyPy`&N}%jSaA8nTpjwR0`giA+0ZqnG84ZHO%)h~
z_(3?Kyg?Dkc?urX%OcBc1HDRF+9ibdA1St)a~P`BD~PVWeyc?1BrPfAUOPYfBq~lS
zJWixycFJ5iUzza3$sM7;Xn#KZ<o&W}P0EUBY*5PGR6K0u`gC=IU%AbY3YtDG2aQrm
z>PPv(hYC&A);gsS@5|4X2W$RHkD9E5xo)0jeJ8~&zS;)mjGD#?+Ktysk-{si&XI>y
zdTmOL=+(m~8Td64$A7na1)B8Z%*71Bf1?c_<#ex%yuT2H><#E^yplA!FEZ)35fJ)n
z5DZx>Lp01Jv+DcZ6!f%s$e(dU(D=A8+I-9KdcmkyRuxr3L$iiE8dmJ9_yHmKqePf7
z4o+G`J7G7a;6sOp9R0ihq1AV&H$>Z57<p)txTmNB6*-9Vo+?+&4+#*bVkjX)Sa1}j
z56Bgz5GSUjx|fECCDHCVdc8gYH=M@9>*Oc@aq%c+<E}X}o~`BZj%!`{P_}3mgxY3C
z?jO)ST!4++Fa~&TuscGX?HZ1gmI;=;{OrKa3{%-$YrpxriQu1~T{C5htH^xwXDwUS
z4%$bD)W;8&`iw$Gq)FgT>sw^64Ar|Yw(uiGn=Q;R{3M-)g8$V$XyK}UXUv#sgRP43
zOUz}!nJ)aZ?pZDo*TGV1C;@vPy~=k~a!}nMfD`xAfY2rf<mslS?KG`DdstrI^Y@Ey
zP$kd)KlvAfViz1=+};cn;TFM7f1mCzZNDsO+!0!Y#dT9IlED*cwcugtXHyadh$D=m
zur!^u&af*IhA(9o$D1;B^_<z4#3;Ic_kZX*zE{#xx#o!;qEMS_k*b~~6WB8YlnocL
z6po;?;~v+~+kr}~JfloR)sOxLKyR;LDNsrg5~O|e9etAB-QNBg3XLD<){0&C3YL$p
z^QBd2p8(?C+__kf;jl|-lfG*m*3;}+9g|wmC1QAkN2lfY!;D~B8xQg^yNT6!9k3+r
z4Jpv*bR+h&pWLLmAQd`cH(mM#@bk2d``|Nt$}JbQG-WvAg0ptoL=<}1!(IxH6U3<D
z3)QO*sL$1Mu?*+ydf-U#=;bFQ+?23kuMKzG(_`Cqp)ClR<N>_RncFKsw%9uKSOS1e
zMqz35)b}o74k1xMD5hDzoOe-Dg035Km}nb@t;~_yZ)#o=QHev5K)!FdR$2%Ja{1Sg
z93|h!sj%M`{fSI@y0)J#jRk72E_Pc8_p^I#e}H8~2=kM!+GF;q>KQP7^P}h{VC{A9
zmtIetA1zh*0JUo!AEpZtSh>5P{+<nf-=$B-W-7Z@kz;Wzo%Hr-UZl@gn2U!G1^xbQ
z`B+NwzlfnkIWZ<c2{%XkRew@k33)$TAY$n{xhQy8xo$3ZL_zeCwzkxB9C8q~K`!m5
z|7Q2*0nxn(s;N&EH6ctctxR5WKF8->^snV=4~}>Yu<N@C5<b9!2DJNS4NHNzuj%rK
zNokix4R%92D`9&deO6P3&_;ptFpyU9h%e1mh0nm<EdQ;OsVbSl9#p7MKs~zei{~SN
zJ?>6VXozNT#bPdX&vIt6w%j{6gMPs;fX%*Aed#rHWvU7-r1dJD$*5M}*3C$CJvXo|
zZgbTxjfV(#Y4>fo%53ZsJJ@9c8wvE5=dwi@cIRFk<<ihKU499#`k;uJ@X`7z(UG)U
z53^AG<SXKhct6gV>HVOr7~=KHQP4$`zLUZ;nz<QPmDuy8aKFn!eUDEBAv3xH-kbG1
zFwdrC2J!#;p2~h9uWRpfDA$l}ybEhPHrM#sQDgRd?lg%)c{-#O4TdI$1>z^*`Bk8d
zPsOi7OT4L@YU?1tJ-Dx8U?S5zrJ2-xhZR9BX^b0SS5f*w-IyJ>t?5oLZaIn0Ui)he
z-RTIxi{E`?Rd6D0=FqG9r3a1k6j;IB10cShtUbS#VgTnHp1D__<ESFPZfQDcQp?#2
z)y7<lU&v5R13Ks$&uw>h#?yx`%&W9+@qRFky&=Jw#V;T)nI=-Y%sr@%pyciO8L7-8
zn(9dR%&-YQewYc8+P@F3clc2LG7Nz#Y}RHL0F-jVg%Jw?@tP))kEj(QKY2TE1YpsA
zD~dRs06A2jtC4UupPHBqzxe-wcZFB@k?bOKTMe5f5kJK*_as3)REowREiDU=%i&I5
z@4#3iMVotvt!RhzfjS)}_WXVxTNbL%aUBHr`klxRL;wMdfb=JO+45_5!=~Nli?xd0
zXN<lN12LsY+-K*Lrnfp}2`>$JXJM5atBw7@O#)zfIk}>w{qtmQW9S{v%l+<Rw!U2k
z`#J6ppt2NC6yG*X8)pu?P4m4l35FG_N<ZN5^V0n>RizL&YbX4CP&lD0!i<IvqE~G+
z0VsW;xNQaRikrJ(+<f(;Yo%hp;O6V|%`bH5tAKpl>v2jC_DKoBOuK|k;H|iui)B-X
z!H)r&p9gf3jBreO4qXF@yK?00LR`G*7a{pZOXO*Kk+nQp`Pgrd<!zcv$HlUD?bHqi
zY|oxC`#N3%y%XO|iUp?cMn))1MNEoMWz_N6%Av|G@n>b?gCK5;K1aK(by1xOZv$?|
za%mh?dH?6ah%`1BKlA&WkDgivdjj*H^f#)NC7uf$Y%3lu@1g}Tc$v&JN)F-v^u5Ls
zkDH=Zb!p87NOyq@-?1>82KZ;(QcW=~y@N1UBy#e%!PoU_;Cx)Wmus!pJLm{o8H%Tb
zg=k!LxhHCne)~lod&W6A@#P4A{}{+U<)-Q{S?j|+Avs1y*O~EMel&X(o~_?|y!Kz|
zy3#Oqu?KASNwmzmsWNV4i~QWkD60z{pdu!^bFwz(Z!f~GEl%wUsufoA+njajCa}(Y
z1KW|BJ?vsmEH6{=z;=B(Qu+lTM+T4WYZ&z&Ej)BkSzHqXbqs@#E9H!5<VbZIYdb_^
zMBfaa*M78kR+8Qlr!mq-7E=RTKo*a#f0s{54WE&J#rC&}fez;~uW3>I>=kkUCCi>q
zMpb@P=>6V;A|26A5+!X`{MPqwGfbx#*z@Q4hcFonEy`t{zVv&70l|M<)d@Qc-g^_+
zA==J{lD*A{x|JnvyBX-qf}niYg})Kp3c$WD1ib9s-Toy0NVr!Jt)btQi_mJab5S<X
zjv*+bx7PiKT0P`<*dd|l(KqUvML?wPArE!>SpR&Bx$gzAH3av3>(!^AJd1gtc>s4a
z1MuBvfex8}mX`%TReMfyoST%Fe;P;;29;LFUg?-1-wZdn*ve>K#RP28XBjlQMl1o<
zC4B2V#=siVQs~43J;j8VK@ot!SKKkrJXg0sB|xGh(feADU_~+eEq~Eu;R~<tQS;2t
zf0%}lN}`&q`G5_)7>kL_#`kS>z=Qm?lRs*9I%B&*&BO7jsrEUWsWoTJ0$zNuK#%s(
z<Vb;CI={<z{p#l)E1LpYK=!+!YZ*BNic=F|??v=8=>*oZe}vGPeVgaImMT;qScdgf
z#Bn$ed|Tq5c9aak`heW%aQ1ZxM2OH9LMNJJ2lzit9+C|<Qa>&$wlB>d@Bmc!yi%L2
zoOp+yTxE(K0JT<j!Kkr+T?v%bhG)HY?F>eU;1gZSu2xCUVV_>U3Kd2>Y-AM|=_9-d
zrxBi5=!_k-;Hp8X{hL#ir3-r}dN}_zAXV6Qt~lT!(R*hNU0Msz$|@045B*LYMxNw9
zdg;gSXnslc6VMs7Am?<xwpgW0>#ruNm^fpFn0EUTxWB;Craxjk9-CgeauQ!{tS{8`
zU*p7a>3J&RfFXK!y%xW)6k$!|&|H3d;#KW}yJh9SDlZD&z8meS3y(+vgtA09h*&W1
zmTIdDd{6%#o_bRi&wNEhWSZ*h$agHr@c0wttP}m*IqZ3d2+Q<!@#>0dZOYwHSp&yM
zN?^(oYS~EUPto2$`ENG6u5YR>M+n%Oe^#}yneXJR8R8xtDYZl{-_m@hhyywIAf}MX
zg}U~XnjgU%(FXr1UCF6m=B_fLySy8I3!QAJQ;rZDe4KSC?s)E(ImwwPi!c|Db-(0P
zWHk-5csyZia{ke&VJXI6MrV}qebvjh7lyYm8q)eQ0df@4B6upr66;!4=Q-8nl(=W`
z#RtDW1y*7%B<c%5CwuU>d#G;7f;YyOwM<7{ah)25zq#+IN_ASWv8&zmvK3^4x$U$r
zG>hsq`FB3Hfwlr~yL`v|TjK&ehl-ld(`M7f%q@Q22(HI=>(MH|1S(g8!RErW*-IZj
z6|<mv(NJjlwQ=LIHf$os7|2>Y_0ltjZe4ANq9TqBpl?Bv`VVs%1kgu9L?h)K52GFX
zUUUz!q<J&wa=at-8vikW>wGKW%3|6lAKA^{_wg$<x@_jM=+bIUk`~h{5C%11k%*=t
z_zq1M$SWydm|&E%fJ8eQ<NIGPggtBc^{h?tp+%^f?$@4DzHp}a)e7uz(U%RFNapyI
zZSSEJiUW^VbDU+Cpcz~ougXQ(;(LL$^uRTsE3Hy_>4Vq~xlTN1o4(ipgEcuZ<C92#
zj^r>*;7|yh4qip*gR!z;SZg2_sC0=ZC@V`QvPL8>iNAQJOVw9%1%S32&yDQA$}@QR
zjdvFSvUV(7y@a+eX@X;9p<bp9klnv@ws<~=D6e<xJm;|<c_M6W3+#BM@9F|7(VPxj
zq%2BLn%@-$r}<qAn$3<y${<{mx`ER%8ayr*cX79d4N%RFnaD1nOzkk2`?~k}oQ9Dx
zRf!)Y8IZNVXrt6OGsu*I-+bpKzWMdQ*CPqzIzGmk8z94;wnSc<WU$Uh?=Hv0#Kb<o
z0m=roie&rSKvx8{iQWLPPG|jO_*6o35`7NQLO@l1`@nts6HMjFUi<##bH36+*$}BM
z8(+T_7a>}#N!!{-v_40wK<(ojqwWMQ(+j{COF?}f-;vKANPf8NVigquj;rX{j4HoZ
z>1QH3*r%-y>{gh7_PJJQ8zVI~$=zrA^molx4xpI`!MBBv{>okDw?1ff>w|`;Me(y|
zVvoy2t^Jm*k!w)&%XCY=k+x+r3uMTJo8izeUta5?kG*d(rAc4+)B_9jMS>b=RWj7M
z2-jC$-l!g@ezuh$nMWIMzW%T|L06iQ#lE7W#e1uhKD<EI-e>kJrOCQOiE7h{G^a}M
z9@0)x)*82nXp^_Kbgg-NIebD8!Ka+3s(lZ$aJUEiWb(}C9p;P>pNd6N?)uRY)Horr
z{vAJEa@m*WGwylOc<yqySy8uN=`^*nSsYAopW`t9r$BQ^8TR|zCMmUuJA;jM3Y<Bt
zEwLjT;lTFa+dTtd%z%~fk+okyHSP3@QpI;5mg^Ttl~xI#>HqU1D$nXCe4PNQDeYP5
zJk~7K(ltbWAbeB-wez%a0Zs}4Y7g|KTNb;1fB`p-zeQ%Z(h3|w+ce0<WF1LY;?Y6Q
z-=`D>n3l(*p{|n^<{fx&VGOU=BmaxNw+@Q(ecQ%W5JW^uK}nI47Nt|V1QZ0M5v03w
zK@>?@I;6Y1I|M|!bAhFiSddsce%Gp>XP(dRedd{Y=l%CP<Ltl;>)w0c*L7a!d7Q^_
zoL^;T3F0ZlX#}+_0^giqpdEdpc>AOGqY+lv18Ir?P_FIq0y*dMh7&XPnkXvq@~+9k
ziv38^)an8lyXs?mo02;X`wB3hXckQk?l0;B?ts5LwQglV1Akx*t14{c=XY0c-YV<a
z+CPL@3+uP$`o!qC1)LtNQ`f74E(X8r-uuP)6t{WOkw*8U@rW%%9NuJEj=!Mju1Ck=
z&*F+orn$0r{k5yRCTCXrE*yX#b#nl*^-kv_tc^13#fRpRUrdhpX1Ji|Tba$KTuK{j
zU8SR^8L=NcB@9yK6YqzfHj+1*8$S!eH}yHeIjVqwvQLa|Un0vKvr596o%fCu?^?lk
zPn_ETVdf=(sGVZpf%iSS%F=sX=<|F)AmW%x1Petb1|4rTr$WCHuq|EPleyCZv|V5J
z_c=Dbi}Tw2Wld523iPyfFpX8WN~68f*R4ICS^BSuI15c|Q7T{`J>{WXdZndBrY{DL
zqlH$kmWHBBB%s%;B>!p7_!44~O#N))<{rW=M@thX(oD)~k0#r8$qdb6ds1G7nJ^jZ
z1gDyvh8|=~ctT|1i>4ezt%ez8$8R~PG7@k>Eq|*$4D|Ju1|;q~?8{wGeX>(N7=h+K
z7G*O6U|_G#!EC+dnund!@KeW=_WLIrZUM}9a<cDMTPeYdSjWv5M@%z0HZDHU&k4ee
zhkpsR(g&tRrNVej-zwK{OE596Z)BrUSd>589IA=eKhitvm6AAE7$wMO7CKr?w_gtx
zeEvik%bfQ-Ux!|3zU##l-lT@~uiuUtX5`mBUo9O;tZ;bA(6Xp2%WU4}g3Vc)Ya0wb
z0-e@Ex)vR?_~o%|%ec%Tg$-|J&!^@CheKWwmW~~c4cG9;o?%S+wnYC>{8&)u7Ep&}
zF(qgE2?K|j23O$MwcWHTbRwowDdEG>RCm-i*yGK@i?P<<W6I%;rMNlU5MGC6|FSe>
z-I6Q(2m{o-9tJ*w55IDA6=3+D07!tuY?`Bn4v#KAYKu;E6)o#Xj7aKhnog5QZ!u2@
z5x`QMwkE??`xDKH&6}bJg;KcO4t_4+N$+kFPDNm2?mKR6rA8NXSL@yOKXLqZuHoXd
zj1Pn*r7emm-65flf4(9(Dt^u_yO1sOicsQGx^J<YGmn0b0h-(@|26tU0oDc3Gsp@N
zzMPzP+!tEmN&-F&d%^a~kv+J^KPhrEJfV$%+lTYsic&Zu_4)AT^J?ngT_c@pNVTf~
zFkb1RPtIT}ZWw+|*6dd8y1xpo0HoZ`p}U7ZO%poq>aI}0H$+xJC+AYup4{Va`YWtH
z$s<&re9+51Mm$NU-^6}KPXQ38x?|@&inliIzgjUjWujw)*G#a^`6UHp_dG_j<Vksb
zcs_%22IY0bFtakoHG9uyFShmZYpnAZl-N?V2_Ac09G>ULcsnKFt9kC@3TqW&Qpiah
zSQoX~2%bwm5flgCOM~L-?r__zGhCi|&JkM&8{jf{!Vijy>1)TBOvA?gX+kIfh|>8U
zM`s}0dS8R&%5xO8TR`%*1XnUnbd0uqR(!U5nyjfeP<0-!`Vki2vHV~$j`laZ&EOfJ
z!@N7P<hdxSRH2`3`hH5;^}`dlxOyLQVVs+&5<rMJ;BI298Znr4+36%WJC6}&3q*2A
zHNkWlN_t{zb7pK`!qqENhx?u9E;f;3P(*7w_w>o7`s)RrDi_1gkT3h6vALV@m<?K$
zj31U(os9CMLE1_mrbXe)HABzpCaroj;Xa46`^iL8ogGBAs*xWmHU>T~sK+06dves%
z!aG7RimPj{zUwL$Otj}5eVo`ah~Sbzs*)9cvH5}>$PJr`ojCp02eoTMSWMm%2<g$O
z%X&tW?|H$HYWc&K<}cs-59|Bdtx<vNNFUFrb2XjXykjpw?2OvGr=g;up^-@>pFhgf
znin~lYSuLzHGUOW&A7`c4Wm(LxS2CVlhQD;OIQlMlGQUeR;FOh8@*AmR7248Cedly
z6v_cKc>_b-k^Y@w)`0O}jhnBg&ktq5kA%GBB4W{4{?S&&2uypb^l48WmtS+UlXW7=
zX-gcJSN0<P1O$UBEvwW6zKHFegGjGpG|MMPyPBuOttGml{IMXk>>F(kDIV3@rla_@
zYFfEX2j6hi+lkkHdjvmuthS$AFQ>i&Y}{Vv!=|p+Sak@44M}J^Srf&#n^iK_<^`76
zY81oONguu}5m-Y4=As^P$!uwNJ?X+l@3kEx!%YH&f=-v#r2|~y^Lc4y?r81!w1$_w
zd%HE|@5J;3RRpCMc!;cuUgKT^WjCO-L+g6&YM{EFCmmr@@CCPnT}8q9G|H-~^s%n5
zF59mu637hKSIQEN6Ko}a*wU8Z<gz89SG#J>-h;kHho!+(6D^V5GyabAdS-Z`wp#ka
z>MY=T=wW(6+~|Na=nnRj6qbd-w#%iZT4Jq)u<>Gh0Q-dBmrJ@wOEvADWvUk8lZsVi
z5}L=(enNMD@nm2kzteTv_UHSAP?-YTqGTh>eLgK9Fd=gl27Ii|Sb_|`VP48&+ISJc
z!L1*i$b7#lgoP2W$2q_=OGDyG8zi%<W2*b`3KjYXHW$>iY$c@CmAJ0BlyRT>kf{Me
zWS#$+(N)cqIZ+FQ%1OEay~>Dd;zHyT25<igvRJwmFvXGce(5@wjijtOe)q^-`^>p!
zT&0hG-*9(bu|2uSs@)5grh$&5dY6L5GhGkLm)ikdg3q9hw^P$2)M(vbDS&iM=b+-m
z@NVmTR`{a?-PM~RiS|3wd5dN9?2TV+V5PTN+Y$%XhkQcqtRxJh(#g9C&86Qezf$i&
z;8B@s-=8d+esGW4o{~LJLe@fHr#X;u_3bR4xtH*f%&QrG3k#8%u?{==5<FGnyH^6$
zy{{E3o;`**u|h09L2yd_xua9OqHC<G!GS`0KjV*T_3xGe0?41(m}Rloyb;~)PB+Z#
zX;I)1Jp<bV=uLH<2F{xy3+Pqd_K8bcIwd-lW>J+TMsou54Mu;`CL%<)C{JfrtPER(
z#7j4wxgsc_D&HD27Z>YRD&Ec4$7k^B=Z)Q}X#)IekMzk3?r}&JTQpvA3#uc2H@>KL
zm1M%~_U+qbCzIPiSO#;|1>&Vn+ZD$)AtS3;h=ALH$#d*O!k3`Vr&X{);^z~_(?DY%
zVk$#Hiw%GeD=RBhOZ$Mxv--gL8<xdG49byCb^O@4MP&;3tSCn*6a2|U&l&<O{K3K}
zOnpq=g>Dz-(v98r4V;R*Z5(7oY&vA&Qq$IkIo~O(UCD01%sv#PXaC?~ElqyvFHdmR
z#WlHz1Eexzgp+h;VBuok(6lZ(t9u&=w%S>M_aseevPFJSRqPD~?$R_~j53>1Eq*(~
z$!7y7$;Ym?7JAlsX#M4x_ofZ@P<s)x%Sg|HWwl>drUel&j$DatAKF;<u-epbC<1UH
zuIf5&$Jgezj0+{Tiped?DnSkD3@~Miv*cud&F=uaxV-MOrd4f6SWK~$4-og-YAr6m
zeO+ED3wu<;$+P*mbs+1r5P9pzksylOZiJj2P-gM*o4H5LDi2gY)apZWo;_D>&3sp7
zz#WIDG*D1|6#upVut+s+7@Oi&Rg^@Pql(_y(16ImH|CN<#`bCWRncv?+pC_(%P}dP
z<g-Lgmy^#+A0C*06dZ|u@XeYC3)hR~=SgfawlYsa%&uQhwa$gcv(4mV?Lq#hu&Z){
zwD{B<2m7(0h#-sCb*%5#1|k{ubaSV9f90mw5K~ylr%nFR9sgmQUGr|o`_RJGqE4hi
zqi_c@N)YgZ8Q6gY#mz0hw6);zW|`<q(n3m{pomXq8>6{Uj>Eh)q8T6Ftd{WupPs69
z9T%isBf(@HR>q9Luew=je-%*W5IR~l^gVvFx_+1(^7X{HFD{cC?#Qp>jX(jH$e%g^
z$lEWANi1Ne$ku8x`6Pj<*HBljZo7J{3?08Ge)#kOsEA76b!Wn?gDyb(ITgDhD!EtI
z>%m!a6{W;I!6<5?l+nxAVcGb>4?x?Vr9j>tV97xEp2HgflyPJ$<=P(hps69Mr}_5n
z10{N4yl+YG55Oi=K!bTc`W@{`WGwLFX`&t4EB&sm#vk9T3P6>q-Yr#!9)|?81P?oD
z6&x<YHc-nxlDN|>=>x;O1E^;}VM+zB?}Oum&3Rr@br~-~5hnyxSmf)<SubrZEkL_w
z-#H8hW6!WDMz31c<fze>i(!p2+p4L;Mx_k)n$(2Wom{;vq^qPkC|Mh7mx;glZW}=O
z#!@sttcq4lPcuX_595`t@AGXPsg?U8`%V@SBJ@tyFIe_AM;7l#9dr{*ym>>ylcd^A
zA;|eCS%Wio$E4@r=88in(@iH0Pysr$hD}u%Y;q{+=$oc88V}=Ua#+jo1~<?oga68C
z4RV#OL~^l9XMWWyR<?fLR*o<zwVK&Aqmob7H8O0jwx-@_fVfR6?|2#z%3tJ<^7SLu
zVb8&2&O*iJD{Td3Po~W9vPanc2gfTXqeX^;b6#pH;RIY7Yda0{7=n|+1JhhrGY9(D
z`%bfGWQ(lg6-k@=7dxF4P{41X$;^RgB1b{)lGc>#emsF2a{saU(MM|gpI<(eE#qAX
z6en!Eu?%MS?F|=PT8z~Q8KS>_rTWQj+%Y^#eL#q9T9Tt4xv!g`_0rl)&4M0LFGojS
zt&3&`SRPzCj_tfxs)IaZzQcQc98S^(W})~MV$F0lAAlzm-{w5?w1{?uIX1WE#1g#c
z21w~JljlP3P6<YEBc85C=(`<tzPQLH3$@(s>bX0PA7Hy;l-83x`GRR&WqO6YS(nHW
zM*GPwG7-=-Qn0{Cg5<*V!>%+Y#UH6S8zSjKxJBjrl%;A!<YSx>Z;nRTu-{x-2NrIM
zJgYGOT2wS3Sr+uil=B~%^ovI#=m*KiWqqXtb9+k%s=YATAJR8J(?+XU!YZUg9Ru=>
z*2`3&-DU=)<Tx+A$tyo7qO@;qO0)`@7&s(6!%gRVa(n>CAU8dQ5=;*Bt|g??Pr(KR
zkH{EW!x}+9$7}kXAGx%vQprf9)Lo@HzAebqD;>+ihO&WD0)?<TEIs<%c(M%i*M~yZ
zIi%Pb0?&DdU8Dkp)<eba+Ga2T*S|)0XQ^qR<&xU??w^>|;5G=_r`9__ZkV0{D$1RF
zQo4-x^f$#xry@l+SM{e;(W^!)a?k35oERCXo}rYRZUnic>=`=zYtj+qRWXS1Pi{BK
zf!N^<VCv0*vqKuo7U8gx82kOpLxY`oQWT@gaecTWtU$ozmET=*GE+bv<YX8sP0SM4
zKLB;`<eBWG;Z(idiY&jp>p==OTf^YoS}+zNUFaT}X*T=jN>7ZklhgU8w-eRmq}d-0
z6HN7!)b;TP{RXw@NobM3be#~fYs^XYGau_*<*<pEZTQ7yugN9yIhKX&#^zH*+w_tP
z&@r$TI8i{B!sS@0Rt#YZO1L?L6{aIwkQJ6_J9~QsWKPe0wJ%-@xyiqi`l}ShPanlm
zo~yVq;3a^&L8XzX<yCDpd!X#!xhHry*%p?CUWJmH@DE2~YVs}k5R#ehZq@WH^(s(K
z^zFGQC~-skmP0SVUkrpDjw&k-0kXS6rXylHYIvj#zHgi0PYx&eV{737OJy*6aAnlu
zu>?o)O=wFptKpvfS@~bq_*XdD&2(01!?P5Vt=5*{r2=bq^KhZk^Q>~k@4nW5tE48x
zAPL8piNxb-KXmYBAehtuJjdf-3mJ1M@4zEi7<U|v?>C9JtfGPh`!o~h`=ucsy9oMB
zM9ws=?O8|f_wx_*_mBbsVJ4mY$GB9KCJ`k)kxBycao>V^TMQk=;Rytf{CI_HyjTUF
zYau_2JRx?j{kOua-5Qj*OLJw9a-}tz!e#!tyYRH{lyCyPVuHENlH3wdk{!m?jlZgk
z9ge{gqys_`4wth(Af&7=wHR3x(HXl-oiLSLZuueb-1T<$eF@k#CnAz^67Ehm#~e6V
zObGl@<L{FgsVBSZz~`?TR9V?0#wYrbh{E;Hkpz>HW<MQ`xiUWS@k{uJUo}$7t=B51
zu|<+i)?U~4GO|J3sj&UW3t)(WqBV2W@OxeCvp8URSOzQ)EnYkV-U4R`&1~g~#AhaH
z1j2SX`8QzUdyI9<L&35K5AXSFywJLIm=pS>upK6G=G<$;yYVtGyE%$0UJ`^p&scIi
zaeg_wZ5)A8D&!2mi{-|I&vWCSbAR2QMDLzIYfkWOCb<WttckC48n~rX51<pRNuZEf
z_g%wIdp2VTyW^Ik`y%IJ-benRFL?o0Z@KTFVwFi-0h&q~J)yrXi2k@FfLAQ4l)vPV
zaUpzLQPwB8Oab6<R@sy9k%^$I9Y;wgxiK{=%?y*X1&rS6KPIY@otLm|3e&^jeg|bJ
zaWqF`v+zQWsi_JoW$neub?^Hv8QrAJhqjC(BtPv{ZQ{{gobL~y<Vw82nMt<*;7o%P
zH?_LOSo&hwKLy<)eS6%U#(-6t0NP8@JzUl%@%qn|Q@*c(s+>Oh)t748Snd}!aHIYN
z8IKWvH0+_bG@Q=cTD%=~t!>-|c;P4`pN`wYf=?HWVLrr*8-!0glYy-;_v_qI5^(9R
zy`_<B!WY-QrEd(G=&P~9Ezq*RA^=OgnqqmLbkHpab)5?YO%LblovrIlJZ(}HlZEcG
zvr)bTN;fXXZb?s1A%-0uC)P_Lo5^>6Q)iRXkiW9WjiUx(4L#`CDi4dQeiN3Ec=!(#
z>jR|H!_GtcM0vX&3{*3mk2>+Q>HfN6aJsv17I00lfmAq(+gi@27~2pT*9ORE1CA5g
zQX2>&C#QYqA1&T!<hajZ562`yg1p8FYcV}P`$+k#zYEJu_jmzJGpzH+<^Kp;z4{e=
zC*1NzMz2EJ)^^*l&-D_}iINxx@(zIVPA>fZ1eZ4pclWaHEay{h`djA^AIj~>!D3xu
zx66|?!<bQ6_D?@b&yu6ku($s>OPOnFJ|=k2mg}q=D@6^TTK-knHKjh<Nx?<!>bv4m
zewmxHCd^bNFt*o3VHa6F@*KB6i!jo8ruQHPGgL7<YB=Wz?c2;g^hasKmyNZKG6+0g
z1b<cRV&62|GC@%x*6?MbrovG$lY<Ld-zzTiGAXpW#bdHlC)J0+32#jj4|`RDb1PR%
zojdCK9J&lP3k{f=8>_8fJTM(kbuWP|26{{@xN1k?na6j0Vu5j8uFj7<(Nd^*<_53s
z--B+fUZ`#j3QnT<+hg2zUzR%IENNZM7!54zpqpmR%N=q!%Ukw?D{j`x(2J|_i_TS9
z?D##OKnRQr+eJ<&C8AtMThF~s-SuFdE%RU#ex0pT2~#(M7}=egerW5q7q*o3BX-lx
z?8Tsg1@o7wv*+&LF7zdHm)w^4Ciktc((Q9&=<clYNj0j8>s~F~n<~ScQ@(5R0>x7W
zG|Vs}*5Z`Amd}4K1kDx;o1*=7{Q2!Lf^sF<0aadT8ICuYi-fK|cjRUk`IAn;abK^e
z(3VhMmI=rbcyZmE&p;JIQ%`M#TeorF8OkvgAORM5A8A3t_s8-&HO2#?%zR_k&^=qM
zG5kq|1fDPj;R^?bZ-KSsTVwu$gm&%@JB4oF-+~4j#oZ~i+ic&ZZf|w$f)mr>{kvj+
zendq?)b~yYwwDPefmyEJx&qf^MLfzSni;+=J{w8Lbl+&4|A@_u%dpiY*8KHeKYx0B
zHC_`{3wQBUeXF+ftRYrP$6aWftJ=`MUj6EC+n(iYlsgO-Tl*Nj9`q=zot60k1c)NU
z7=!3aAVBlV93n$SZzVGyznVp?(M1{rwxaKoWY8nV<(a>>=o;JTygApAd5&Vj%js^8
z7iQjKGQ#+TiA#qJR6V^s+c6!@c@4GIeD+((LI3Hmll+&aykJNDrU1Bs+v7FB!Z;>b
z=4H{)8+sc;A(&=Z4h60<gjtaT%YUqEJUZ3VuV?W*10voaBkQztr$^OzAa3CL##_G~
z?wQBzay_?46^9;o-775NO^r)boC<4x<x@<I&FaB|GaJ@}^GgKp<uwltaz{LJ;s*?)
z&+FH~iCHF|vdVXVZ8ri~>|`__49i(WllN9~2(?&S4Wm^nd!a=F_T>z2{dQgc(mMwo
zv=zr6T$a;#?h9ibl@`i1+>rG{{rc5gza4gC?|8G+=O6wzc#uu9Xzr~#a=)Q0FZq%&
zU!$Q+G~58Hmb>qz`AUa#rFuB;p;wGrA-sZj)t)e_^d+Y`P)w@8dzlLXT`{fOi-<1J
z$6b(3o}sKbD8!RBSEHsNZ6oCKimI1gvgfY5>6m@;J(Waz>tCm}7g0Bkz6r>#n1>b1
zG!?C0YU-$Hku*(A64e$NUnpCtzslHCjMr5~?$12iJP+*t>1#`#;I(%!oW~o4wjwUf
z#35xnwVF4zan5$XnsPN#W!IQlX?|evjmnOiSETAL*B|4lf1tq+AG~foQLI$i(`8Xr
z-St9l6f+_tJylFiO;v1dZKK@oTSe`CQ>lEvF1y+6RdCc#U>e^(7xg7PPi`J?W7Kv&
zQgwRKZeeN8e7KHA=DMN<@Gtkfl&`RBi`I5eHdLnH4XEh66YE!|un^m0DpiseDrM0C
zh!WKbLs)Kl17OX~g-Njl@<XNa#e|E{tDt2wPLbK|p?gtMPpS)`6+rL8wJd;?732?b
ztJM2pJ6mM~ll^5L(@H8}#jr!n9+Qb)3*ASOucXqh+JXE#BRLR3Lx92pXyOQzDko`d
zr7>tSIIcTV!`O|Ucw0^$*7Q*c^fTC+PTC)TAlT#I80?fpJ{4)VN70@-Yd2D_Pn>s;
z<WVQ<NM%@pFT=nV%{L~$Z#I?<E*jYpF+YwOw(8^3t;!unZmEQe(_zoImv!wrC`=C{
zy7VIeUWZfVB6e**xEZw-9`_}lvR_`1n$Pp<3Ud!TL*Mp@3ti#=fdQZVh5<LySOhSB
z8r%pGTlly)qjBHrLITU8EzziueBb(hBgK@e^{2A&@V3OQs_iWFN~)=`PZLEea)M#{
z<t1-7-r(w~<qLtK5cxqh)`z&&)Ee_mPht7(xm4M^8j)YwqA!4;!!L3Lkd6qBzgvue
zq|kiU{T4e078W(C-p0!3@xCtuJH8}>uPvTwH+c3QH6IJb&JaepzbA9QpXN2)n3qek
zQiElY|N4$Xt^|5_)bTOEvcFAX(%+M`n40j4o)#Skz<Ee4cNnIlH=<W!jQBg<u+iur
zd!_$MeL_jl4?d%*zx>eRWN7A~!&3cB2VhU1D>iRf0dT+<hg54|>82^`b1i_QfloU*
z2c`mC7UX5W`hvPw<)I)V)iwdKs(=}!+dw9Y;aZ>saF1@~>t20!j3Hmq;@W#!(?`%-
zg&kv33YfNg07A=iLvE~;j1(q-1XT`M#2yj?+H%1fci}$2>~_b-9?*RMjiNzM+R@+N
zi>Fa|5tZ}U8^}@RIZA_I#{>ZM>*M{^f~MU`+Z6VYq5ZMb%KnK+u#MwSgItE~+@h94
zVE5o;8KOfBGuQ)po|5&_TX{m%!iy_nOWFef$r3NItMaE0ycB?>nipsYl^X@*mk^<3
ziD_UX&MD*-P@#mv7u20A>e}f7(pNfn<7oA6^SF`)-a{$8CU)ScJTpl><clfuo8Wu;
z`1N}y=dT*wU=jJ2O2nP3b@#HrQbqH*3Wj#Hx=pQeQF3qQ7v9ihn`oJX9L@S`eSI!G
z*#-F!s&(TTR4zfw+$_t<loY)RLl+Rt9!*v@j0PS}$iV%M9NKaw`3sgCcRvR=rDA#)
zTG!q1{a63sMIrSyZ_5-p!&Heyjfo+K$rMV@W2*P;TydfMfWd>qOCQ$~J(M%i_c_7&
zU`R?TW0meF4t>eW$5Hd5{Ly?7v5j{_3_%6QU9Kbh?SNTCq5p|NoKtXe59_>^;<?dF
z|CA`=k|_f!_{)VB%Ta3zU|zy0Q8pw%r*Yr%#2~P=W*fPQhRYL=7)AtE^vz+++;FF^
zSqx;-vW_k(QEOBkL~u-S5HZ&y$*~tkH>b4+MD&61h=<j7j~S~_-6EWa15-)qYfEV-
z#pVNLsV@)kOL?~{yU0)@M1(F5Mxbu*zc{$hzu<03F!<(LvSNR{dZ?nNy`q8Zj%6G+
z+#SV4-Z{Xtbf=NeoPV5eim(pG)1w0ex8Pk*elNJwYdOVq=vAoSrAhN5^xWdtb~tWT
z2BEOBvs}mjBP6^}f)aH;S3B5&!`bO2&-xeoqWqKy<bPvL+Flu_U@cIubd<)?w-|g7
z`u>aO9!u<|h=(WGC7_kOo+Gufj4YCFMaWBAQCMVt0q#qz%gzK79nDeSq2%U<BNL&=
z+))qpfto034fAFu3xWODhOBlcyEB@^B_Q80x+*c@*2po%tqMEs1wg*1O*;Zdxi|Xr
z=#Xc#q=C=U-0vQRwJcJNVYur3EsIU|+nhGX&rnlHlqlp_V8F0%Lyq*_8+|Nh&HAsb
z?jDUQreI<L$6mN(WV{MnyT1x4_sG04wn<x-?B?WHHb(|^-Fx3<ImvJ2#YDpgCx)tH
zC{=D^wW6Z$!yLlD=5&8uVN!?)2E7)0xH@H1Izz5B*{zv&s@}YMtB-F2%aSOhE_Ik<
zl#2h2ytFF}-^%H5jRVeK4D3t@z)H=qy8Y_n6lva0vC<WVs$Nj;Y3Ju2O5c>2io&`*
zG@gVQ?5_=EtCt(S1}t>Pow>xly}dj`M44fa31AqE*8=igCXkq@=94A7DgSFT7l*hX
znUsfqd<LJXwKoM`Rgqy~A{!VCoTkGWl5y!2X{o&St8WdQjEv|2M)EoGRi)&HXeyAA
z{(XPp3UuF`4It)~)z(908-#xVgFHnt<I~_4ASf+FKG%5;1FWAM@addJiyv=d7r-BH
zP+6H576Icn&MH+kgWz8^dVmH4+>cBF)SJ;TreU74(JGs##`dOorS#+ptK^@0VwJNu
zt)hZsv%GKVwyqz+bJmNx(P{(n^*A6~Q)8Asc<y~k%{`bGe0{+})ku)fESY)QFrK5^
z^i{~XWkK4*pzifeVOa#-!B(6EnnE{K^PNq+$!YCRIRBM2|M?*V<;@oK*E_YabMQ6U
zZ(8PyU{p6dw?z^6C9wWn`1}V}d&Kv*6ysB0{sV2}{i){Se~JBZ6~s&Y$IOys0!?6&
z<VA@&{#(tOuf9)qDge#=G0f)ev*FF5%52UIG(JP0p72PATNV)?$)i60R|*4uc#-%B
z%vrE1`0F6K*`E1967>f!3LgQR)ZqsxPUQcc>!*mr_iwiupUk~fe~8S1^<NUmkYwp|
zx1#60fsCw1jV$Z-n4HwfYG}TaSl__;0_=a&?^=#sahU>@*PZTx-5~h%qZElAruF8^
z>$XpICp;k3{|c($+CC7Yi@)hH?E33+hdulR?e}(gg#ULo1Z|r2D@@eQ9VPl(0$Z+o
zRs8-V0+GLV#p3XkyQt@q!}5>qWmT0{rOEHN{r^6Y#`}Z6S*_V$pGmq@gIBbFo?InL
zrkQZ(|Jn2N9}IQl5z5VT<gcZqCMMe*j)$mkrWE<t(DHvX)BU?%B<e|jTj{<~`je91
z^0riBWq)(~w`=2nr4_$_sQiTbUY!37zaobOtD?U73+>;J{{PK$_`iSBD@@eNk7xaB
zM#SgxE~V?YCl2rk{yobh)5Q5IxpDtPOx(}u<J6<MvrOk>ar||8zQ7d!z?;~Idx4K`
zGfIfuER9ifMQFddmr*TeedC7gPGgK*BS$lDZ32~M8N$f9yk7CV>t%S?`+i}2W3I2p
z{V9{EkHNctL&0hwQL8FPfO+N~>VE1+eu#kC)5ow#QgR3WHYa{f6?zL%I|**qo4f~B
z|I^Ld6#<^T7QyYnYM%-y<#!9--9#+{nj6<oY*?#+HGAlbKcmC+h_4@TI)#Y~{Xwo&
z(FZ5qhPB%Mi2?PucxsDFVSuZScpT{QH+ui`_))(;x{kV6@-a2QU)HCE>pBz0%imtM
z4`}C?Td)87lINEXXSxi7y4$|V|F$rd#Nw$Hbhew)Kd?>z=bHx%CItbv49U#Eg{(gp
z^siSuO4L>wm(~I%rlNYJlmjGxmcV1YP~0_rCX`9C&!0B{2Qpm)VwvSXCdqmd*C4_7
zACmp)y_E!gh&UsuM_I?Rrv3Oc!RNn!scYy2p<t;^IRt<?K%%!S2ut)^-lJ}a|LYqH
z6l6C4zU2Qrtp7Z$|Lm;)?5zKU!T+3D|2eb%lVE^6;Xet+-)vAaA-2I0c2}ds<R*gO
z#UDz+E1Ip4n5k7;rrgwUlB<AV9Q`%z7RhZ*A!iQygJRFaiSe#*Twr^v{SqC4#Hsoc
zx0PEzo-hDE+_~^|1DNwxR<mj$`(gR}u9xJn%F#6s2`<Yi$*Y1X6B>r(H@+LAd8<sd
z)IfIU40YO?7JGO<0u<j${banNj1x^4m<+Tl=uu3XaR3V-QKGnHz3nX66~*NDTIx12
ztF*-E74U99RHI2y#Jo<AdzYuyV*N!DUW{*j;;kxS^{Ped=}PzF)+U$Iw9ypL*$-fP
zVMot;OKY3twE4zZmJ)3crh|3?-Qwlh;6l2?+lypwYb!?ev{-l(A4yeKR@U&x&pjq>
ztA!gUWSIsGox%FcJrOaoQBP!pi|XU@R0@BVZ!wMT1d(qz`&P3UeE;$$<%JNVPQ}yv
zEJ{DttSPN0mSX9z(^s!4u*TENkg*fmXy`^r@35|};hCJz)b8i?35j<qE94#Z%t)Ta
zahm_!VagszNJTrteVx}`{qidTRkN^qRPtGSvuaUhRQ?tFX&iND$Z&1>8iRF`R{IXa
z#Av>lnyyNa$JB?W?}1h>Q2yWP`L}%z0_q8yE4sd-ruBOaTCsum7)&a@UN-F}@Hxh1
z4a5~MR9iS{zi2iHp-==c2{Gx!N>^fpMx{x?zKz}Td}^D+uR(mqH;<b2-}oPMdz5IJ
zZSYPv*>kVFhBL|KSlcd4e$!U`wM_ucHcB*pT(PDP=4Or~uNnUj<p!82f`|8-g+Ag>
zy)lj}o^Utr8ZL!mtU!>{whSR=rPZAObd?p6gODn5foAhp&vU~Y<f@ce7nZYiRoO)H
z#rttvJ6_`>^vRw($b{-ohTV~AtlV0PDvVJ_PI0TfnlFW~__}yv0N&(w7A&GOQcHOb
zCl(&eQ`!8|rp6>PD(F17mDG-ZHlunj^p3Ca4O+Dnl+2MqIeJSy$9%17G~+cSW@*mJ
z<<-JkX@p7J_d<u=ZxV?ap(MwaGbI$-@Uj4*=p^Zi4Vg??83(lit2d8y=ML^sPH3Pi
z7&{U$d_vsA?>v6xQ%Ljh#cfU4QP-T=wdz-OcS2P87m9^Xjz_H5lf8!NbZp}HmeU(=
zl$FC<79!nN6T+(25ZY)&s~C~Bp9siRA%n}N_NJu-_u{#?-2p@<f|%yWtgFnAS3C)}
zo~(!xy4a9PEK=wr87=P&b`y@gr6~FExzjTi?K)BU)sqQhqK+t@<1kEjjYD!V-)7Rm
z9f~HItlqCV?$uCVn~61f+u`tQrzCP5wvfj|r*SS`&RCUYNrLft)7t?R7E_ENRrMN`
zw?}K+kZ-D9c6}&Y<3q0PHJdI*s#93HYzy$_x>a^N^vIJxk%DerUonm{iH_sov(+fO
z#L<g_!lx)8DfB7@q05|DrzFL1zd7MS<R=HeYkg;qdzn-py4tTRy2h3Tp?0;D_DYT@
z{>c7Jqgkf5&vdTlx;8wobVBCl87^7cyW+-T`Sr7dPuDAp_lYiLgo97oYM`*;1+k<t
zS00u!%QIFIVOu`Ssk)JsGvb(X*{D5-&O+{7tc#O#B6rC>kGN(VUh+DDui<R-@N*SL
z`XLr={;adc*!>_?!Pa{05nTA{a?^L#{Eq*%KK}IqYC*6T`q>UttV}+5S$-|T<^Y}>
z+cYh_9YQX=5U$b_9h|d?W2p`OT=(4ZJK3qhx84-iVx2~US?8ld3JRr9_b0pMi>+sU
zthO8)w>F+8VdkEQok^uPXZFQco4YqkbVoDELy~F+h6y`8S4y4Q`I84-SLD0Q%%?NF
z2{0T>_{ax$O(qD5Tpba^Npakkc&}W;p4i;jThJ;36Z53oonr;usV+{>?h#XC9(a8T
zBxYK)V~$NUsV3A?&A&vyp}9$4>oiMudh7*v^G}*7HW~d%vN2bQ26j)^MP#Q?5Qz@S
zAzdP`t7>w-dipcL3~}jHE9M)XN1q1Pe-1@{D4%a#Idey*XmIAaXc2z-DZ{!dbkbB`
zhsj~WHu2~s^@k=pc5~4*B<Jq=Hh~$=s&f+e+)3miVs__w&<ncKgk~G>Oa4>R=^ESk
zfd;$feua=3FM8TsF8;~jo!zMz;SCvHZyk6l1bbt!>a&#H0Vjp@H@9mL`M0}#LiRdc
z#$9Dm6-EfU=`zFmPHUL6Bu*KyYW9I=OxeB9TssvI{e1hrjVtReYl-&75g*CL6fP@Q
z{m!rI^tmIr0%yMa<z-BT!KnCUt(j=^*mu!Y<7Btcz|5uDNh~D#4y&pn52Q13W+G#t
zj7bdzUg*60_~19-2EeKR{_jO73cQGs`3qjqyrDUgZQ0@+5cJl*0V`d~9xhPF)+%Fr
z^@y#~YAUunQnklowO6Lzc_+J1(|Iu2tIz?z`;N!9En`-+0+%%q`eSa_2baC?x1iy*
zr;Acj$N<Mqr|Hz5io;&J>3*gItdQHq#W!d|#LSAxH{{&^aECwT;b@_9Vt15EQv9>`
zDfhh!GZW1M_@<_-%@x3L8mUcA!RO)Q+j!|6Gyw&&Q$|J76Vtv^c~**;IEHr{EV2*o
zcN1;9?fv-VtQ1{fid_D75+wU7Nfh`{XLooN?frU*Y&U4kvFpfq)!V{JgudKXo8XID
zVAel$il@rM>M;ioZdtU=Dr8g(d$)|cLk_v56NPmt7**<O2+ERD1l<p7wT>s-oR!BI
z?`uI_VJD|&rQJPSvN6i*Ky+AEDdyL>Gz_<0MHc6ZAxHOSZjP0e02}vA7MRoUDNelU
zY#qz#oNCfmUm88Druhn1@8qafopScTpsnLTpQh7bw~D#erK)TcqsT?FtMpokv>t%F
z(7!VzDbecd5*F{UrjGYu%NCrDyC>H-OuQ+03q6JyUR_>PylYd9IYeH%yT5glTeD`S
zo;z<(*OkqC6>XP8J6esHS=lS<*6GDOaHq*h+vlI&Ocy$=!HlW3Z9CnVjftTgc(ElI
zcILOjq`JAc))y1x+jRV;Gei1-Q$+Bi1HGhfgq06_V(UkVo}Yfn-!-T8{93qXnq{W)
zoqLRe?~t-yxXWBn2#U}vB)n<1b<XKJir2O<P%JOLv#~k6-Co`@e$n`uUb(_-d@%Oh
zSzv{xFR}h@b(cVw)#QBBM!eBoVxxv7)*?f8OO}<3^TCBB)(b$O5WVUY6z`>Y=*Ek;
z?e@``m~D{S<wqAJSo=Zy{~pg$f<QdO1C9P87kUBwI)Yo(El&H<mIwW3x-~PS@jp}u
zGC;DE-5rk`q*{O>JPSs=>ypnetf=m3)>&{uE)Z;GasoV0Eo_8|Lmuz)Nh5@w4sIrG
zzbUqo@B2vI42>7<>cU2r;<qJd16A}o1nP0two~EKbsMrZ<hPw>rou#WHbd8#DR5z_
z*0b8hWnm)R9l;;7g>g@^KB-qt?*65VYpy8kQ(PXw)A`x!QRD$Ps2@@G({ciV^kX5h
z%f4?nqGs!l+#Wp019P4c;*Tz{(5omy;wO8yK2T9tVmc7vlvYnnSLUs^C#;qidn%!w
z#^-3mj7D=IOpt!YGS4=m)A?py*93)-7N=47<hlc6<^;FJuzHp=j%{P%i$y6$rHWg~
zo&86KO#)M$T2IP<=GrcujxMb#td8(`uJ)?CA%bzW1=fVJ#WiVF9+uox0I_PmV3Eo&
z?T~Z#6okM;hhz_XRCaK+!N<o>^sYH`+WD(X7sW$em7Z{S^YZMz1i7WF*wo@emHa>r
zj0Wr#u146e+fUPlFOtgM_lTk;K@x5+_vDXY5`5+0{7NUUFfOC+fLv~C9Hsf8bQ;TB
zrdUX`m%6c|kiaL8HpY1EGxmLsWUj@Z<^rKU$ZMx@C5w(8t6>0$-RE9s7#nXm8d778
zxVBwWh^_66P&u7KExMT`qSp}@XGgC7Wk!8zmcky#PjD!ash-ulTwMtr-DsGNsl^P+
zS@#6@M=vxo8f-^Y-FDj8kSD$q+Va&*#@AY{h6?CioUsl~Zzj)mLF9jpyEKbh08o~n
zlI-so#@~ab{`8Z;D`=(ooAKth^ZKA{@vh}5zLI%6Xm-f@W6lAZvl8YiSBwb@B4#5=
zBiSGB!xf&4Fndyrb6M5cy=fM(DA7oVEveV@@MWw(MApm1^nE*G=Z?)sNX6!t8Ls;=
z51h)SGO{V^)t-mms%Buj<0^*BBYfh*miLBAMuCt`cY3GxT^-b+v6Q9KB5ZYCoS>F%
zXf{_&&TJy9HsO$zFEa_;BVsp(w}%Bh4uj7<d!Xpvgs7D6=I>S4rrw2ZvQ?AoYr7S-
zraLw+t-CabfhpR;fbeNX9k2u0>)Va%U#||T?%|jE*QMp+?)9=DZXNNn-GPX?zcL<B
z+S8<d<Bga(ku&XOBRpVneRM9YIFm29yh&(<uS3UUAKe@I+%J2LQNfHN;|R=3sNi=-
zq=w1HvT7FBkG99=YteuI!Rs@Jl~TOhPpcC`XZ9!FjVgP_tRH>L*Z4V_A|kjkwImr*
z0L>Yb$7nu}7V<P$8+U-@XSpR)Gsxm0heKbV9?AB_MXk4<ZQFc}Wgxckykaa4`Fy*M
zHJ){?P}H*%;@IwY$`NFac>o!;7Fz31<Zh6wV;f<8m|Bca5Qa50A?{nQyz^~`_MDpm
z2J)a`HMrK-(L^2GDurYD?#D3VH|{PVVQzbQ1fSStELm~>;yHjDBPFN0!-7rBmc8Re
zW}IPQy*`i^;IwL47AMWVyC;6zQ}N-mdDD=9tuA}wp<)Ai(wJTJc5WTgpN@-uyt?)?
zzmMrvdVQ}MRCpT?1ZVWL#J!V$9nOCa>K8W%KzR|*YJ1B<#&!22h{9fX#dIMdcgY1T
zK*+fPi^`uE&Q89{2_nl=!$@phkuJHRc@)wVBH%)=QmiUtOj`VDlrs48`!9?izHa+@
zRM(o`d=lx2F6MHoceGSwiPNFa{vlw~f(duA{IE9{rji`<<2c~C$@D?(cUE^SilPS5
zn{~XIN#~cH9C7USO|LB|wkS9~^it>^X<tJfr!<aA?%T^{SjBH|Pbtszw82Ltnld#p
zPm$GK8YKjQE#toz6wS;H7>j20NbeN3=}wc__xG^{d4;k{qJwsZa>}2~FWE9OC6J$P
zi}`$3gd{=Kh0n6&NnSatP!88akci@gwK5e+E&-F-v@XYK(v<pZj|SawJXgpCTm3O>
zF&mE^26eC+XPF)h5$>NV!c+N3FJY!xvG1@G{&uNszV*v|{Q;4$fons_coibD`m(g^
z4~J8!{no?derlG9+sZ0Ys21lbCo)E|t;Gh;>)`s{*)W)Liif+(Ml&l6AR&_-P=@YR
ztO%oroi&s$>MUpETX|%x58b9tL<(a|Ulb-#!5SN_R9>3@u=+uD8W%eB*&+2$i;QNH
z-DU`G&NWDXb*2!*(Rf3X{+!OxpqDT-D7R||EgA9#_MjL%GZ{SVV2`k8hTR#6X#XiO
z7DYOUd3%su_p$HQOv(guxp};hL^-D4^1wBqM7q8>u9r2wK1Pq%>ONm;()?`4#`>ha
z0RFUnDez!*-?(G<XB66hMJm(}-af!vU4u(!5oLHn8X%0p4`><Q^teh*LR-Auz!{;g
z@0P0G=Jw}r7j2F;n7JdCHvSJiE-v0`)H!6@I_4_T=3G6;b?xh7zE!X7>S2~6APmM*
zcr|C>kXDh@tK>yycTzS<Db)JZk3RcF9eHFhm85dSSh)T0$7-aTK7|9DRt8?<!8xJ#
zJxbFXG^hg*SiFcnZW6sL{FXF$v^8b?KsCokWXXCx*VxxYObmaLFEjDiL~<-_L^dk?
zXP1<_X+1>Z6o;&+vGlN^k%==$cY>DJ{sPRhHXX}zWbK@FcF}*C?Zncc;A5jm8gLOD
zUp?eb>5*!UoMyUUFjm+}(s6t&9Ok&mJ>o~{Rj7<?+TohcJx%FSHX`j51<ob7S(-RL
zoADU<Sds_rbA-B2S?JGR?eOOqAsIzxaAbxiXe7y{51Qx_c37WBtc_SNWt|jAgOOip
z6xA~?ZelO*e`O`0=gu*#f;Ttxay45wU3`Dk1G9pc#!EH|Y9v#hY+OTHxfw1#y7HVV
zJSChvcO{$nijKeF22(>Gtqo+kHXYFI;XLM#$@pomW#a?E1XU(}=P1tBy-B_mZU*6N
z`##r_1`kgM*ADCh)VvX05!og!a@3WHiUMx9Dn)N}cI4UxYTFX~6gYVem*dr%f{~m1
zcu@?93s~%lyXIKl%6h3^gO_#0ne5L<REp*LcmWGk3X_JVpmkfQEgpvZ?+W2}5Tbc>
zox&qbevxc%%La?LUoIk%$8}tKgQhe*Qm`@A!z9dOaY(YXk0Dk2hGtQ`;*q<0yh@{+
zgj>duwwthEnBL8*`l!K8B==>$b(ekuDvi0YxvR7pFHZH$eOv$3aEk`A7K0%q1CIRB
zGXhtmmZyS)XNw=`bEFqU?Ya$3H{<J_QdZ>)1=qjsyZ*X_<*N4O@lodcD{piyv`MW;
zO~5DQ9{C!)nhg|5BXhPxg`*CQ3mf89fr%ab6=cx^!71YsF50)=h04=dTrIj@1gzc&
zwr0hwsd8ddU*^Z%F>JVr0``*CaJ#*LPPf-9fih*JV>Z3T5hmLW9g+_N^WC1l81p-@
z$j!|?_%`@j<BL|klgb8U2l4*!1w~-XVTjCg(~Sz=Iuj*pq_>0kM|{DH;~w-lVXxdK
z*ss)!CqTvEMu~rgo-mWdUu$vM#m6L(cEq{h=6qs|z&Ld|xX<?Gd~|=cM`CTvefDb)
zoGgQ`!gAybpR);V{cG&L2-b5j^3_W*_DpVD_f+sIuWIRU+PMMYe;i+Bk?st?5;Yzx
zl;bxWYDk?^R78i!yZyZBRrn_YxeS-ueonlhnGNF39;L@QZJ}=Sn9D5zQ@g<r^hh+Y
zkXT4fE{hz;uEtW_cbZgSEcpA?T&|R1_W4&jQt85Ht&_;=XW_h*&fmk6s|OiSHRfCr
z6w*nMDo6}G+bfIb9?}14&;RRHn&-yjJi|6x)^8eER3-8?X88D@5CoHDdbU4GoE^Se
z*CR2^9A?M<u8|R={>)vk-oa`Q9TrP9Q5IWz%^Hkc+AEXK4a+n8pQKE7@3Uzip$fhG
z5tz_Svj9Z#m=dhv{*%xc--gM~%$n8K&zO-<YoRi+Tj8$|u`xOI$Y=!={B=Y_aW+&$
zKLcge+~p1?=l-gY#8cSAZ8EP6)il#4W|gD{xI^Gh1{NUzGJger{sj=!gYNvD^)#oA
z!SLxyQ>(3PDLqnzlPGD%<IB?sn_Cv@cn2@9)JAFYE4tJ&<zn8<weJik>A5oOz^`IO
znJzWN<l{L~wrBZbgUH5?{ker-%YE5l@1EbjAAOdiEc-|cU~C_HOb$8v(Z<>Gg_w+?
zWa~teo~Iol6?S79>15kFIX74nB)+{6SM<9}nc6k7Ivh^R<iM&nkuQHV<61r^Mf3D8
zC!^&jANBoHk~Evf`Y#^l9Eh1(n9JbI_d`fowWl$kJ6BZr8Y@S`XJQuB$Ry=_mG`}|
z>>E)ZVFRgcb7LzmOO@W;LGDD2I~40z!{!>y9s}CdgJWuA&%!N~C??>Xu3D6wi#NN&
zdCQy5f9~Gvj-qz26KEgMJ*L0lS;b9Un<q}n`gjwud*e%!q(QKBdl#ZMqK7EVkMMK+
zBtuE?p|w(LXTH;&2hWte<n#wtLJpdg6_f?AEwTsVq?W!bPE?J9>VI3cxhqqV$7|sR
zjynR4&u%#<Y!wu?uV$ym98Y=oqX!3?6*vxoIPb+LT^HG8`;Y=9{h2Fmq9voAuqes9
zr1MGbo1PV$SaaG9LPRiJI#G94FjCaq9Vz1bFRsQPN=+ya3iKe7`vZE!^B}3hqo-+0
zX3HG;8!zV8>V96iF6!jHYDxh6h~|NJVSTlT_2Xe193@QiB~*S`+^m=yNyspor9x;1
zt5YvgcgcWPL1NtQCY!w@qR&w)CaSD&dZ=AvGi114C!{F&LS{vFQ=q1hoo(}Sbg3~%
z|1%9_PEemB(t4ump`+OjJYR)o6N_!4KdI1#-+q-WQCjA8fnr_B!oD-IK^?cM9_D{B
zi1owIz6<4RgilFTO<c^VxNvs3&3#ATI&<I%68r4E^jW-INDEgu!spCxXf>Nq+KT{8
z^iDb4fq8`n5-~)wwvN==ulYCjU)Fluk5Xh5tDc()0H~V&cf2<qgFV*6L+K3PIh|+5
zKNr1D8+vGVvKy5@Zoa@$U4L_Q-oD3Z;&nOQgvM$!3Um7zVSRAo=XR74H^xMIwvN<0
z`_6xrPM+7iT=?><(&*0moa7ADt2d3FXeXNCYn3=Nc2-Ds0>|n3n=$&Y)fu-9*V$?H
zpR#FN35C>f0;<or#p1%9)3}Q42T*6?Blv|Xg_*LF!mF&8U!SNIC9LNuG3&);T@HK|
zq@VRrcF$8umz6%Ljj7k1I2=t|chuQ`7L>%}?dk|!VY*6XYa%nyis4sOAQ4(tpRTjS
z>{AtGINV}FaA2n}syvaJt#`VsLB?;}%`BF}{Mr4eua!XF*}sWy_SUCvQ1ZU2SrjTw
zyaAKGphH&b<5uS<d!A4iYE&u+*XtZPWV<<<Z$PpE^~lrt9op38K=XOPWu3qYG{m-f
z@HGT(=7LZ;m{JoS+8EnBd8$&BAg(Ad+~eOPY_wB$Img7sG_bl8D-e%4%_g1)QZ|Vs
zGY3)nBTgrLd{ht(db0OF<!tCQEtCiEBY6Cn^P=#;0`M7BxZ#9l5mWr?Q>1P-j*{Jp
zj>{#M*zuCic;ngK!PP?k8QjeaCE7s7Fh%vo0eoHH;9Ad9Bpx9Z$(>${eVMV+bLCV!
z9&bEmb4RIuhT{YIWxc1>;O2BXf$rYlL-)ECg1-xz=>D_MS+f3?%xv+mD)IHdxrU>X
z^FZ@y`^pc1_NG>vb3b&)8Ep|$q|Mr^mMBX)X2MS1naRD+X+HCz%y@uE+Aag@;|C9(
z7&(+7`!0T*;6;g^-MoEBeT6On&?L(epJH2xtt)<`Dw%CE;0|_kuPAx~Noq(Ak38li
zgZ;&yHVZaKb0u*P>g0DYN!i^+nj1TVIUwUV_*~{g4Y@L9qh5U)bvEB=2oH_f_I&sA
z35!kL>IR>K^MI8d-z<fNF3Gb%D7o;vWwm_O`)<FQ_#Ng}e}oIG4b|=!>A&4~rEoA_
z`0DyRD5<xzaPee+CG~8lF}OR5#V`uJ6N2|bcL_~_EJ0K^;t;QGcl+DUW5pxVJUB65
zg|!Izbk!}nLffO418HOU#RA3jE9mYc6Qk(K05^OXQ@S=Q6arVwlqGWRGU`5<;&`{n
z9AiKp6^vkmnGnH=l$jDatd){IPhCICx$WP*8ebo}z%ZLkNjfPRIIb2xR|sNrXFRI3
zIQEs-1Vbt`EywazGephw16{>*4YKerc~0YgJ%?uUqay97wUV<p%hkA$$MOTqsj3J%
z#Y72)PQ`Vpmd8B{pH6GfzdM3jY}=WbJ?^ai3bOl&Xt>+f{zvoFnc)6Y&>idXh;6#`
zWCq=qVV>3PlL^|?>4lxtV(9TJN>Aj9F<M*;L9SaG_9`_<8YyjtUAqB1!Y4lxgMydM
zX#D?&%JteUbh!`0t6g-qcd1HnW`p8>iT{lM0D$GsK`|po!q5@!a)Kbb0UZ+;%Q39k
z$2g-YhKjV^>;OjA+~?KZr3)@rnLFllqrvKYRM{ziPR8T%^J$~NxnRs2qheWB`j3+f
znH^qd1|)q+jX(AnFCPh|TrE+g4PSJVE|yFP4^H4b9PM0FnoDL<q-YT5wdOQe&GOsc
z$t|u7<S9*h-<=>6b#XT@3!}JnO6rABf*cg($v25Ri}|+EH3Y=c@c@L63Mz`STwQMR
z+tlc!MF~DZwLjkE>W3quj1Sh}^>=8_2(I0<v){Mp&NgOOF;ww9v}v$fBC;gSwk00e
zD`jgsQCEyz5V-_B&l(qJ`C?4X{qTiKbG6L5qq+WS<YbcPp<!K4L$ju3G0vtUul+J;
z?-Zb#5i2G;b?N4H(bO>w1PtQ3gw2YikiIBm(jsT#{r9{?p-%O=Xq=W>!tWP0qX_E1
zgZ`7Ofv4^L;=5Z{5AI_R8JzZOyN~9PCD+XOoP~$e1`Th|o|%rtIkH}Sp=sFl-CRG7
zmj5!_r5s_pxcr`Xg&<mm$>SblXv|#-zO2S#xsM`f$!VgWwK|II`UN?fnNBuzg-I?d
z<0@*VF6<h2wq?Q<Q;LUN9utV@65{u=+Y^FHQsGR#8!m|<aF)~4F5~%h8)65~rpzca
zls$zQ{nPA{rl0$Ep|ecwJ-fqd$CNbxW5<zRF(F!vf=ZF%fUE1<xzO94ytvWLqHT(a
zZf|O-kdgTqc(}GfxLIl1XJnH~yD8GAC%~CFKl}cvEeM^dnk#OZsLF+jc<WzgI{$Pz
z&{3pQkAQZn5?Z_PM@;^m50zy=3VK=YL=6!*)wDb_z=g}J<i8m_BM9(msro>IhnOi1
z)`+W%p18gU&itTYZ(lTwV4IT<l)WDctKCZ;c`a+EkG1USEOFrKIher0SJ||(8U?x>
znVsB}K;D{l5G4{O?NSo_UXa~A>wWz|0&l(mQP!XiEsahJh8vjc#>n&K7l74#F-3?U
zufxJ{*TRD$rU92$-i4QQ8BSNsIADu9+XH_*j%)&cPp`Gg2kkx(4Bf*O6({U+`j$R#
zg?WyoU%fu|w<fM#nTJ#-6AX6mjR;!r$l`2FILaJ<BJp2!>TZZqMIe!dq$5{jMG6m}
z8*wDx=53O89Y0fWos2-_UFC}$F|u1fA)N@$PI|a#$8f|c;GL=j@{<JE;!yI{i+C=}
zk<Q*v2ipTzU7hZ=S_8zHYI<jT<~!yCbsci|(yw1o3>mUZ4KtNE9ua+y&{K-6K3+1j
zfgs~>IIM@1h!qd#q7yk|Fl`n8B&%GC;r)Cco4zAmeKuzef$QbL`kHXv46}8U)@Yrp
zf!XLUl9&J-)_{*QymsPPfjYI1pDYFt7UQh%AO%?l|3CKLGOFsg>l#&15fl&*kVd*u
z5RgVvq+4Rsp`<jM6cOnz>2B$cO^66cceAO@rZ-)iIKQp_pL5^m+~awlGtPLwy<_;n
z4~`*Rzjdu^t-0o$>l>qdnv`1Jz)4~X<e>CzgXWF-^N{SH;puOxViTMXC-xePgS5`O
z<JpTvnl};7N3Db2L&$$n2?R3uQpg3rKe6d8BN!Q$(0l^jAe_o78xHIsvj5#O`tSHk
z@|ysG9Ce{UdcV?Y{MSQZ0+sRU?g5z2HSxg{?ti=hfIK<?<k1l?ai7CAY`~vF?uAb~
z{tgT@;vi~|EaB@e#gqQ-XOpvuc|njML$;qP`EC$3kfqg!e31CJ2I&tv6G(+76v&he
zfXEoSZsl?Ac%?%?f676>N&bA(1k|T%w;`!OIzEZSpRRDkEzz!f<r4Ox{gat{;hLDx
z)Io-I-b1Y)QVk9;O-kMawI~|@Le=w1^(IZ8gv)u?HTJigm3P*g>~LI^mYt#7u)=E|
z=h*xP)?N({NZVjL3X=oizKyYss-KlPVdG*h?!1RwIc!*4$Ri2&^Tt#FCUgDOQ66Y_
zF2d$XDzqr-E-PT`*tcA8BV^C1!DKK{`I>EQzQM81z6CV91`H(RdaE61qK|)o3|Y-0
zKdh|T94%lNbaN1@q)F(j_s*GA1)$1-IaE1NL7|w;pYZeMdB?L)ka=wP{r6>QrK7aK
z-4Tphxc;1g52~?DZSQzvy}c8Z?4Jyj!-<;)pjmp7x~|qs-f5|?w3zifw)0tdHP#c|
zQg`U!ewdtk^<o71bgZ{WNLh3nU(Qc8gmrO^wXdG0w@4g`y+}CBg{S2RfgL<d?Jtf<
zNcTqWr`DQa)L6SF6FHq&vtW~7d^r)Cs_v;7gCyrOUL0XrLvIiX?$LJ>99PS4Q<|-!
zS49&mZ=O3|%t`S~iI{DYLlA?0B}nR;mOY2hK5(D2p2<cw&$G-0;X?D{U%RpucCP@U
z_ua2gL_>kNzy0NK9ySOo-bhAxkMC5>B_hu*CNHUK>}J_OSD#k97B(yfLE_q#W|<tR
zIv(;VkxuQOb?bIA%36?NI8*}54kV{tHaa|cjh5oUVC@|Ys(L@m@dD$VQ~?v5tLH{}
zE#aN@Kut1)TnlV^!Z+mFMbdM)acV#6q^Zf;Ts{Owv|I^L$S^3rnLu6(p`yRwI}wn=
zd8?l%{w;f9yuucx<Vmh;p@{{`OP|#1m0z)FR#StDXOPX{!}Y^myi>xjY2F7SEa~bK
z!iinp2jn%M#_iNXSA=|5;$B?|jofi;1ImnAtFK9Jt{bW|eBi@hYyj+@&woffTE9OE
z3ZD8qq!2mj%1M0TtTTgrmB^J_03C%K^PhIFvCpojp0*AJpzkQrXebS(ugeg`1)|vT
z9|QjfFgZ|b0GdbuBnN6_C8h{#bOX}Dkl8FLiA@(1K?s8NpckPAY-RSBjuyL9d;K}4
zWw#SP2jPM2&xqB~ITHCKkSrKUDFbtP+D&%}-PTD-mfM`~`8Ickf9|;LnNCG|>%3$&
zTjVwSRXxqon>q1KC6UrSBcCqQ;@-p2?|G>C_vYCnR$Ks_M)k4wC2<)#7M}de)$Ybb
zA3op#Ap5O&xQoxbr@OrYjt%6fhOX(U2j!0F9uF~kJ!HSOhnhZ}J0E<}gK_B|?4l#M
z)Gxw+a;3ELeksfBCkL)7F6mxQ$^l8z-R=kxCt{6aonfmBY_hr`H(0J6aw3%y4vxIo
z5Ae7PqnM&4NXGpte7KO;EXbp(pZ2YmvxQQkSL@OwB_5_e54qZxb-apd?mO;H$+H~C
zI(m(0qDwS8tHF<9zjBNdxtZuD24-dQ?ogKRt-Uv+t_32g`o8QIKlE*oBBCiA`t|Qt
zt>{@M_@sXL1H2nza{DS1TiR(RyPaE9e06u%UhGdyen!sw3lk_Namm&7^l9?0x%-q+
zdNV$IbMfx;T==dUt9lB*M|||Jc!0*kP1d={+ca3kx#d0r??Ey%7lzu~`ffJ)D0{uM
zYhlpYJI}Vf8~RFOVYQ$FRoQK=((rRGjhGd0Y}xrlfeyx@TapR19nzk!k*5^TPJkx~
zCO<T(caO{%pmIoluy;=c05C?NtvjxF!=I}{*B_UqY`$?R(x@t0s0#*0aB515hc%X;
z$B&mpu6F|r)-`y(wd~v996*Pm8+HbIdGN7KV)}8GC(Zq-t+78Zx!MDPbxt4eweH2@
zot{KYvo^N2ba_HzP)YwVrh;!5#lw;N?|C@Cbt*6K)aHo11@QP?QH&-)b~|v}PkN|_
zAU})-J`ke@&R^ehCXshdreQBP8?3NvJ#FClDTki^LdbO;od~ZABZq^pHgkfVR5vH|
z(x{3!&s>3Q2p|Q$B{Dv!Hr*j)R$G%lng}Fzo_X2<9oNsW-I(xA;(4Dj*dWtqtXCz&
zbn3K=R4ihgtwm(<LC@1UvcQQBUXP+8?*o8C!;~xv&S7XydD8emUYyw^V<9|cO!2I8
zv{}+Q!!KtWa@;_yKRGRe?2}M$RL6uM*ekVytj!rX)w70LtCa&sEB4;6%XxXaryRr^
z)Q2Y`BWrDvRNy!zY<6b5A#a$GNLHM5AD%ComvIb@HO)g^K@PCqA#SBP1g+Ez^C`^i
zD#(|<1AyE35w0R<DZF+IwsU!^xpeLa!}`+XH)o801U!dIyp7CrcWc|@85S;*UPGEv
z)Cm~ieFoxHv0d$B+*-}9+&2rB%c-pz;-9<}mlRuVW)<BJ=ar6a`eI&a-9W;neNOyD
zPEW`<&pqvUCVLnuAptB}EM-8eP=90FxOrna1aXC0#?8U%=h1Wr$i2cIEN8g<0drry
z3eWuEf@Ph0k~}tP@~qCU&IKW_fcDn6r}>v^91CoGwavqGo+b-^mW&*|`m*U-{Fg-l
zW=DSznyyuB*ZsLZdF-@JGockD2^qsST{Tp&gbrD2#{ixJ`PR@>)0BVaCh_n48B;WY
zl=wA0+-v`DRk2gd*Nyq_V%FcvA^dQZVCX~8@3k;=*N=b^LL+B7*dv0h(8$l-yFakH
zZNdxOL}~dUqawZC7g+r;ddL|*R67Tj;j0PNr+`rH1cH0&)9PGv?;UUH5cPoOjz3)#
z7^r*A!TVE`YAgxYhcOT*NrSt>$aNI9KX{BlK8s_~)&okdmxXD2Bb9a#WFm)cdOl?a
zUClSP+9TBTIhp`9@^O(kVH4ckVg2O9DtCQ#N<$%>l%-UaKi-#ENs5FZw(yj7mvR8O
zb(!Ay<n51q3~bL}EJBt=dRQEgz^)|>Jo%-m+{|7Z{7Po5TR0`;_gZ`Cb$Ipm0*SyD
znC`a}mvZE(_>MW70KF9N9dlS|KHro$yUZ!<dGX$XOGZ{m=jyrry{m>xyOpnHKH>Q}
z>$h!*NZ^C%(AWCfL24cg6P=T}KO4rz9LJQvVR2!Mcd^OlBDhTVcB8aM{N)S<Hz7(j
z3CjSIRXDhE+QW`_@f6^v;$}P%?k}c0o5e3I3p#3gQ0E*oUPK&|-!~DFX|7PS*?Fa<
z2^nG}Cx7mt7#l>cIu{#DaP)mqrE+UIOqr^gd<ns&B+M;I<-NVsRA?E8<qp*{J?oBm
z2VJ-lkj)?v?08x(WsprJF@y(@bZA4i9-xLoJA8#@7#3-UpgKk8j;4mPBTriZ&D#XV
z=Ud}>9=pxcP<lMUR;yEeQlOSx@xJ7E=Gk2(g0LZaFj=JGPuYyXp}hiH#rLbp@6Y#c
z8$f@GT&}X})Y*pEgZ>PQ&<Mx{OVTn#pHpV;+@Pd)y>C$y#->0Ts{c^Rz7|6v{-g9j
z*L<fo>P)R%&2WpO@!?pAP0rogzHy<K$`!`^?wb`JUdw6Rc9>U}Tau}3u=YXamS*sg
zcQvgY6X!R<SU$}K+x5AmnQBW*?VPbOb$YhO%4TRx#A((W!syVWf5z@Vw5wkn)cD52
z4!DZf9`>V8_&${WTIQ@OoG9YR5r#DR!m&`yDJln4#$(99&x)uf9|zUs|G3{z8Gi3K
ztMI`9EhJ_J(?DtaAIP6BRj?+jwj_DO%PvYu1gZGI)Xzqgz7@c90)#EI(CvJWj2uAq
z9fZXbLvVvj)44CmNF#|0?b^b0pW~PV&8DBP$-aHqIu*?u4oy59EiK8EG{C*XdBKJI
z!BN^*9t$e~xOIu+z|PR%-G^dy)=wgQ?t3X1YkiX3usUOwS()#gn{Y_J&eJ)j0r=L>
zRW<<PxXe{to!dU|RH2ESrK^`?LS?eQL5t=seutx%*xu*tUOR1Y%6wy~2U}hSQGZDt
zK)~o*?+~FXya?)?`@lT9ymLniNK+)yYThvy9)@eKPxLW2j<wRVziC&!)vvv2drEpT
zgS==SWhhLBbU0F-PIM=DD%K*6`lzZ6m(sro15=J13#8DyALp}Ij(+<2+>C>yNX=q5
zz4{Nn7b1M}9(@prtA$p@t6f|t$2Y>SeDK!^9*CsIAd?nL_Pza4O}eYd%l{+{1?<&P
zs$JDTsp=NsiY*I-wu902X(w*A<+uQd<9hFM-A|Yq7^7W$^`IjKjDk-wIR+&lh>WE1
z;(Fr#DT|0Qbd1(ajCUagx5tUc+lpdp%i?4@a^<v0rIrt{Jx^46Z}0sVQ$o~KnTjQn
zv#i2L-|Glraj}lD*$}0C@<eEx{SCkOulhU_B+*!l&4W|}YCOg<f|D0qn>$KJw`9WS
zrZ<i=2k)wS=3stAbul@A!fBM%-S~~-J4Q6H4ktE=R9ATVv*?4x?V*GVW&IG$C&_id
zfNlX8(9JfVJ3BchoVXj%%#MA=G+3wxSb_W3ER)jQPN$_~jT$DKBMo6PQEns$#Okf?
z8zZeh8^k{MtjYJCOg>aGY?1*#_EZ29y|BBMtX+EaU*jUsLm#stOuXm!Gs<MQgCk#i
zDZE?&xpB#<94{=|a8XQt!%nUpK~i}avQ8J^alXwP52AT&6tSDgZKk?h`U3ZSw~pd)
zi!Mpfu0q7x8ye+jZg)QC(|Y0H^DBzBDP>~m@1&FjnPNM(#i`8Tj1c4Xt}}j$0IC${
z18GZGtghYeyYteYn13SfOd>d=3==Ts(KoFF=pU`JSHk5m)-e`x0|RaU?DsME#vr;F
zWeNMI+bRg}B1T`wtf(>(C1BaZVUh?b#<`a%Fws6P@qoILjhAXDAd+dV2P2ITBT=+6
zVI9Y%MY53H&C(e86fQXrFF0nbg#Px*u)#fnM3BWMkv%H#mQM_==bRl3OcD}N#C;b$
zslQ6%e;WoxengFd^5jw^D7zCPSA^6qf55c&74cc8kGoeTLRN_*c!O;eQNPlGAw0zL
z(f;N1;mi+f{z_GZew|7u7EJFRZG-Kg7A3X!xlJWe8Sgvg2=|kE6@%WW)*Ef5bk7Tj
z2=Br8?ahwn({}aLZY5KAsjwwUosts^B^zXCf-ESZB<7Vl2lRxZDXx3VgPj5Pz}*R0
z?J(X}5K|jwdFxVm^p+bs40Gi~*KY4gy>Mx~1jWTn)5ZB?rpU>&GrQVOwh7qE;AK7^
zpdWd|NOE<4TJ3)94x#EhSaVQ$vDGuY!W=7P5k<;mP|yj|E8XRD&B_bglEcHxi}}lo
zNu8o_Y@o=>e^*P;{?X}FvCH@>U>B15i!p9oKhn+kyMg6F4<Gbud1Tk^aF^AuOz0IX
zO|S{<)+6Y;D}?QJY%|YU)6l{^KUCrTObW+pW}m=fsCvWkSa^4HIt*ylWe|Xy?MM3F
z?1La938V@o6@mRxX9BGYP|y`KTVfsobeaa!!Bz>|?Wy2{)t()Pl!SLT;B85rCYLIa
z>zVTFSZ)~{$Y2yuyXJNTgg@ybEf&cQ*wmflyY{NkxvEX%vf%&*p1SF4jfb0y7Qz>{
zskiWO|6)zJk<Z<!qb^9BprDgoL9w#deLS<?#4z`H`v(9qswbPsGmqicr85{!>>pxF
zPS8(ZZi|7DVp@?5xlK`h{U*u%ti~so{i~<}|3xVH;%gk=t29ae#az5b0}k!Vm%`^$
z!W=snKl^9bA-F9=V4mh(%M}Vas{7QHfXK*wYkp8ql}l-3h1;|{V{rcst&e<K?p=sy
z)}-)!q5gc50JhA~Wc}iOWcZ&!{WdPc8@_T~!(MaAExz~9?w?bbE=ES7v=lAhz=vPP
z^dTW%wQdW1lPnMoC6U>hv>V^poG4U0J>ASaO~nU$jdfLfoa$%4+>Wb*j^e8J;CBiI
z!>_#^Zy>@2wmX{wpx}#v6QJa9Z*@O@12lYs$1NUI1JEt^FXhHk)tkTo^(gzH72O{e
z(QLUUy(!Lra6Q;p_$aFR7uL6xeQy*vBzXJUtq(nVO+o0{-t+5>6i&M&Mm5>PGg?=b
zCGopvd>N4mIv$AZvg&seo+|C1?iNS}eRtZPlAWo$`6xqrE#~8x;Ibz7ou(W{_Vup7
z8d)V@oAq?nh$8Hja`RTt`QN61vnd=)^!iBm0-he$C=Wh_W$~6IsSMNjhnfH>Hh+T~
z-Y|7ke!!uZtz+heEpvhpeO(rQshn@J{~R|E*e@P1Q3{pE7+3YF^cQ&6HW|>Aw%1kz
zZo60wB8YWZ&Z(8NUW`nzg1`rKsV%uAWG(c7f`L~t>Dkh6b{p=_BjM+MAL<BP<fj&)
zR<vWEu}M<mEV^tg5*>1xkGJ_}@|$xT?I;A95KtSPdh#{QTM}bjV{0vph2q*p-xvz^
z4DEsiL~SO7h?U%SW2p7GLcinSwzQu8VuHxC5c^^z7He`S5syh$+<l<+4x!|^JE1F}
z5+mKNVEgP8n(1B+^Ej+RZuh3^33VUXFI1Wiikr#B<*;dU6~bMWJ(v{*lTXU(E=-7o
z_wQuW_?NQLrWM7rDe*@w)5u3&o_R+I4aKl%ypEQ*k52ukZF+FaMxIVKr{xP(V8af#
zXom6vXsUP<7z7I>8^6iXX)um{Uby?+|FGI{7%KtuR=YdtBuT*217O(exF7r$DCCOX
zwy>qDA{u-+3^qo79+-Y7PWOrCvKZK|q5I2w+;S8eUP`(tmg@{5%-az>9RgSkNBjfD
zK2RCGJM|Yi>48WuI>4iuNx%6CK;#HGp?WDUgF|J1j@`CF3Eor0z5U{X^y!ntp+CHW
z#C(E<CN@y*FB7f_V9C1Pwc<Hh0=QVC3Tu93yvah#QNU3MV5yfdcqR5edhMBdL3y;)
zW#B>ApU#O($TQPF&tdb7aTQw6$r@3*8#5xr74+TL1|aIsB7D{kgwDx`MLWo+s|ukv
zjA1>~O=EYwrrq#OTk}1dJgt@;chlA$6eB(WGq^0ESsF25om}_$&~$TI6#<sdioNvm
zUn&K-!~0UAm+-&57;GP}?-c(*Ge&KTxhKOlO*a7eU_6?711YDyRDwRe$hOTm7rxof
z=Fs;=gY51tWm}SL4>n_|emhw7odrVO-Ln8E07I7p{l?4dYW}TGt!Ir!lwNq1;bBF<
zZqD2*w`s>7>OR3a^F7skfUkbF5Y#yqA?lfMz>>1cvxCEvak(a#?KP25d>xU{+0?lL
z2KNsw8@}8M>SPDu92zQ>3EI}`VGYqgclksEkn><PfOU<e@n@Hyw6B^kXEE*2dX&>1
zd9b@9S`9|MVR+9X!!T?S$_q37F}KbHPId*%F36L(oE533huG%@Q~|!gy;$Dppee`k
zz`F6AwBBNlxAVw6vRUO~qOcN0T}r-?z7g8;I5PRfQlV)@r(;uAc(Xs7Ik4PXH}+QV
zp=*)$(dv$lT^Hayl(#8CEQ5vH95*T3H8lBh<Go}HThPSh)cJ0u)3oKq#^gSwIFp@H
zl+Pj55#Ar382B@7!H1lC0q%h{tCI81$bGF4c~x6N5Zg7ytY+cC4We2J3IX&MFPQAM
zE|z=oi1MynkNCWM*(WQ83KNoUy{&R5<j;{f;vtoiq*=G3`7|BHmzXG&?oGzWUQpTK
z!HK=L{NakBM$WLewlA&et2c=tGj&xxg~xV#6SJ&>fYatr%6aJZ9(OB(UC%qsZ2;N^
z@H$tGaC{<=%UkL1I}L8!Qex2AN_P&`?O1g4a>%imA8H9>RzCyC=dtP^Hd5v$?^pym
zTcTPmE9sYiEJOa)5eE4CVgQPJo`~X}PpH)|V$drhsfX+q_decJ>DPYfzQoM3x)#;p
zxuA8Kb)eowDVo=xf>=Ht^ThV~P?ixtY>rDMg_RH1;Yo+P)!(UgNH=4>&I5=>Z?Uo+
z;61YJNg%k!B`f$PvtEu6yY_PnBb&Q0|I^xCzPATNx^GR9u)0=vA;E!cBfsK8k2)O6
z<!24NU!Un6|Ij6I`;d|l#jcX|GEUtnb!Pk$r_rMqqwDf_`;QMmo>5OSwU1t$b><fu
z`g(3~3F+;82AG4q;XYLg8p~7KheX;qLzT~})R06Ra>4HC9ck8GMZR0(R=jR*?(m~+
z`b{7+vLfDSKtQ{JCXBINd-eq8L&h<uqRdZDX+gH{Bv7p8fKOQcz~Tb$c@NjqjMCHi
zuaG(=Edup;4v-PEx3QAC0vV{po8U$D_RVEb+SCaRpzAHfmnsCNyPJH<B;%Y3hnjTc
z4?Y6QgIm;{_R*5tR%iAz$GhJtyBL*{6++_KT=zpcG`>Jbb&5_(O`75zx}PtJjGOx$
z@4V&mAdLOKf2XmQJz2STEsV)(g3V#dqTYC%^kV0<heO{BhNj=XDl$I!xEtO$5|V<;
zAmqIHq90WL*_@8E+>;Y7(jpyJG^U{--V@KBJh?qQ>DGx~>$h(8{maBY$)Ij|EI=6$
zSB9;Q+wVe<6B(t?8F9MoRDscz-bCuJY}Ok}Xt_~w!@9sgt7}=ImQ0O_4YS1n`9-}N
z?HsR<s5yBFw7%17wogBpjHfvm5T~w<-nkCHsd5j{Eq|BTB}lGxQJ-&7=M-X<duyqH
zF}jZbM^i|mwA+f}uGMy>9!e1Lzi_FMFqE_82Rz(XV1rBb2fME8Lq-B_>jg%tOW*Gn
zIQ8Jig4mnZVt2ZuR;m$gw|UCl=k|tTS+x{d^a?&!u+^#kdLqyNcDu%LQom+y-RRdh
zA!|DNI2_s4_$2pml)RczDNV)iHof@4JMwo8CYfn>EakHDV{qZ$+y5e#k8}tE{auVt
z)4ZI{x}Vq3t-qIW(-p%E4IySFRVC|Nu&+Z*DKKj2ONBhn;j+{Qgl<(j=nhkfqxpl8
zdyC$Mf%t`$1!Ku@M#jfi%?C7|dy7ULj$GUp6S;DPTH6n_gDq2)cO}{V{?u(MTXN4_
zy2K4k;7xLtmMr_LjS`lG(ZHBVO?6r|98}YBNe)KCX+@MT#v=)BiyQiJY9f}dEpM(n
zoOqAfV9HtLTr6eZ{jrkl-pi%59+L}rN*?oct*<}#KJCj{s0darjP4ZYXkx!B!Jz-w
zqNw@%kM@t4Kfc?IpeokVd5^GD%Inm@7&I)RZaLVmc$d)0!;iiOirq1H>TIA=`D23e
zzz99mwG4pTF_N(>EargGULofEbb&+eL9l|`0@N5dMr_VkoUcEhpguA0D^~tKlylPm
z^N-+t0JlDj25@UYw4hQK`P=YI(ht=Sd;GTN{bP?dg)%q-(fuV9e<TEmUYe#K$bTc1
zZ5(K*P^$eO0!f%>`L|*KgQn%rA7d~uQuJzHf-j%_HY1}EZ~KRF=$DM*popbB`tXMU
z+_Mruf@=64;i3Iw;gs`ciQ(URz&{!FQTlHSCs|+`14L|9Z3hcLm6xOjp1{uE7GC#J
z-cYyhY|{WBA4l|Gcc!*rVCcch_3}@F3|Lm7h+MP(Er%L!ymA9S03{T<bE)<bW#DBG
z{P=$8iX6HrLf&6*qe^YOr++=Ex;xqxe%o0o0)|&8PpakB{f>vIuMv3P_n(2XYVHSu
z|Mv%a6sUwk;kM|0qj3A$vqpr#!Tj$sr2367qg^wj{HT0i0zdw5lPyI`(LPk<_y+#{
z9#X4Ii@y*55#wJPwEe-E(LEH~T=KKnUyVIpp=v$me;}a$U<3f7O6Na^clK?k91HOI
z!b6QHDhL66`W^8<htLEdAQd5We`$2(sP7g0Fx>Aq7i3DR4UpQ*qj;gjDt|q={{2D4
ze2wxaYXqnwzyR^~&0|BZKjCz+_z|GAGDc9D{|+$8zu$xA;KQH84<z`@#Qm43r2gAN
z1*$X8-T4pT{BjHmoEP|mczI5^yah~aBk!Z+G*eh8GrXt258)#S(1K1$;s4bIy+s*_
zN!{!ECma`n5tHqI%N#_hJwU(J9?2hlu$}={c+@~Rfj_hXre`r-xZJ-3jOOq6zyrVh
zbND|n|9Cq5YgGPY?j~9E*cR<S^@Osh!%O{hcp_GU-_UM9dVL3_=eG980Jd>H`sd!S
zTW!+>{q=48hWcJKek*_Oqzm2$0JEw4AIx~~TLWzJHqpCZ0Ut+HI0?O61Q`GSa^e3N
zpalw%|2ceA-uUfS_b*ZTPnM(6z~cK)w97M;RHjz(k5neThC&md7ya*YlKGuV85Yyg
zP)>EIaQf}&_AeLy@Ar_T#QAghsJ!u;X#FoyN%x2KOcurB|2q@@!+`qB%oFoO>Bw{$
z0Ug=X^02`foMPbP<NE?xn^<?LUGp{do!@!BJOoH<O|Sm}_gT@_t-f_HzWgT~fx2|c
z=6{W;{m!HWdrG$%fXjypr{C5k|8n8~eh(U4jNga<J8%59;`^7V{M$r@y^j0-I}`r9
zAD$Ss2+HTLB<A<w{j{(N&;Y_HNDM&vLrV4xS?M1ApJ(VlWKuxN^M9TpRKEHD{S1AW
zJjs?(TVKu%iRCn)1QZgEVs#H-NgugRV%`ldpdU?cIy-Hj$qFPSy-DP<$jp*DP)h^^
zbka4!99oCafw9EHjqm;;99`UIzg`0?QFF!b9;ifpzYDZP%^Ywr{PO(43t{k6P@_|j
zrAC=NP|+Q|ro|v)2Pp(ZkZ0o42dhE^#$g}iKU+hivb(}6i8$1$3%ID1_zPdA<^$EN
z>Vi;%P^qxj#lut)$BC7C^6szCW3)~j7IfYAm!))?ydT(1HK!`33KXa9fPbY43lg%b
zeteU_qNu?_57u)zI>Q7kk{Y`9fpW3X0iOHm?x89Gayh_%ZA9I}7*RqE(-cwH44*sJ
z<*CG%Q1t>sk@QDr2ruNoe36%M=1gLrdZim)cK-=DN`X;LF(nJedY$Qo5itY+EU`}|
z?qx$*RGOK_OI3mZ>!VEvlv_idL_kD6`HGc8p-ZlE`=$CbAAOd>84|nMxx2kguphF^
z&0FI&yAnVHpt!|no4vicP@?<dC_c_4;_mDu%KE3)8mdrO2v;{qO#sZZ6-Wq`3}*LZ
z393!t`fr3?)38|A=-)ifv@Y_&a-PlGy*X_Ri;Z^BxmjRReVM+WQlwQPrd?%f-!rqx
zCj+dYVpiJKE4tpZ3rE8%?%?p3`$%!bgSi*!_bke%%Q3kv8HvQMLjcUC2TXj|v(9!1
z^u}jxlIvDzcL*gb4Hr}f4eG@_PAPLBNL;njl<5NHr{k`VS(lG(;bVeI!S1K~HH6Au
zUVzHMlYajtv9&=5i5s%Ny~`2S{pzl|LC2Ls;z;NDBi>{{A6-H6?xA@X;;x{}PHuLW
z;uFNZ&JdzJA^jHruL>(7L9He`f*-y*taVGDYv`&-do=}){XD&~I(A<^Sv#7pIx2JT
z`W3^6OUS7cSfo+7xUX0X-onwTGb)zZcPK(|oR1@un<w3nF7@VD=744*Vc1n4vEt=F
zyLnem^U3ME=_8$AiQEBQS1E4PUr)o1PRLwZ9#9E*j-7?O?+ra)xeA7=Jy;!-=v2Qd
z(aaTs^(N1v^IeeQ(%}iBN)(R!|D!1k5yR_l`|BZ>Wz(b&{j$dNO_Yg%vhWh6EM(VN
z!sMxMw&}9fftVBI7Da3~?+5JU<c!2iVZlgy`#uS^qi4kA4dixgc9f6D>tf?OS<b3s
z>zMLI??HRCpjWnWdQ?g*TER(tg-UFnqQY#h&g+<e+Riuf#D1tvN;$aSO2$2G_%`R=
ztIfGm|1K~i<;x676Wy^kjF1`*P_yCVipf+EHl8*$40bz<c@(~pbGk6D&_&N>zezsR
zdK0<rj%~L-6^%xCvO80io;Ro?dBgI&emtJfK!0;6FQ^nf#kRMW;)Ta<x@JNSg%<k5
z8Y|6AtJ0zkL5hKU3V+}77wb>z7gO*>yl)Qa=GXL~MNzQDgH0dak;>Kyw@ZkHdW_gi
zt#yH9_`=<1E{1Q*P3cRt{5mv~RlaBzJ!HVcnRPztBPo^(T>+2L#p6u!snAeP-d^Qw
zrIJZdr_y?>a8{ow@t{}8ykFb;VW@?241xRcwsGQsEaRsgtGCsA$j{nN7f0`jxw*`L
z$@i0uA6}68BP*ojv^L!7i4WTLd9)@qV@z3kGCztForb3i1q{^3wR=8S+I>IUn2FEu
zcp?D(s$Zo@{kdhPw_U>nCuixv&ys(CHT>--_3yT+xYws(n5KYjk;=-}=7#Fc+16tL
zugzG1z)=V)ww&@N%PQNK5~+90Y|iE|sEOAs)!VYC-7TK2vHZp$U9Z@z3o)m?YOt=6
zaX<8Jw9Lva3*uU<&OG5sk)dwocVM=6Bcr!vT{NR9Y#<NBkoo(6lbc!OiMXxbS5Sk}
ztj;Dj04pi@s`J81PaaJjN>;q@d9c2Cds5cT(`JoLyHI<@UA;8)Skm@TSUk)QkWrWq
zszJraT+PaoFCd;fJT-;pHLR@(F>tobl37=<0td!<-QF=fshd1?$_pEuomtnwOGsIH
zpes&-oDH9I%fh~m1`~p8V}ozoop^2E?|l`~P?|8t>M;0A5zdPOg8)l)XXm#-pF*IK
z6aG&HSE%EU{9CpCYY`_#{@V$F!5(ko4PdiOE^>B1xmp2})uJD?Y_Da2Hmh8^U;io)
zV+tTnn&hvyKP2iemzfs7`{0TG&B?al>wLvL?AQc0?bw+bTjRMNHWwpYid;D&?w^DM
zX~Giuv99BO0kLmS55y#RVPV-abuRA8bZK{MtKjUp?7FV*LSbS6h2yyCdCdCvbJm5{
zW=!k;<$DpyAdw;Mpq{Ca^42h6zJb(MdB)x(cCvjjB3$pP^(0}Xp!%>*Ih*medTVoE
zoA<DOW}g;M%aQM`DCC1eYr&>JYp2LkIdizi8K(M~7v(t?9T&qO4_MuOXHEMqJGxeM
zd(v+vN0YtuP@tgCxTj`|cf*OT)O2tK-no*oiEi7Pn|+|4s*qp7`W-#8$z^ABnvhj9
zFqn0)l6b&CT|XaZ*odcoK$igqIoh4I9ojIx6^)Txtj=OVuA~7I&X%l0;!^V5srHOS
zmMQKeH&uH8E)UqXWkv`c(HjwkI@p{YciH0;ad1PK%S|em>k`*Y_4_7o9Dc_<%&b1N
zd2@x*%wSmW=8G1Z?L@EbGZLMt{^gH3mGloee=sT*S`==63_O|J`gqQVp>!tO$oBQM
z#=?mba|MToY%KJ|dX^nDbH;)-a98$kywa_GeSLj8qfmV`sL}W>jwPP^vy#Ii+<tWZ
z^Tic$_k`FLgA;Me9f#D`7wcA+cvzR7Oo)Q!i*6lQW(wb~#ncMeaua-|7zqM@g6yoF
za1h`oupyJLwX51K+ASxG^6pIYc;+p|Yyf-{_w)XC0`DB}15@?1CzTe^C04|{U$sqk
zttze1gPN(4zgH+;WOKN6=8On%IS6z-KV=FrsbW>CW*o<Q>=4RmQ)fLPMjU^)fgpci
zl%TD?1aL1TPF=;Mq;b*ca&rJ>5QICg-Ikt8-Ztj3SFQzi8K`L=BVTybvTZ`7!3f?f
zUI;ADWrm<k+fetaa_<DK?zyG$b!JD`v7Pfk-7Bwgr6kShU>RSV0t8tm@bW+&98R@=
zh2}NLvn(TWrGg);9v>JS>pMoeapjE3I8rQHgtUBNmb8%ji(&~lKXm;M)-AsE)YRw*
z>(IY$<o5do*_J;B=8^9>a32+f-DO{H9|P4JbC@zsel1f{@?6`Ns`l!lqzz%SY=G;=
zJ(`$5oPATXI-hi`yS_$NrX?4Y&pvBS)TCahrw=Y`{FVE})BAfYzx%V}&0<THR2_}b
z7yE4GpvFt8nR<SO$RFRS&NC<r+IY2ts=(8thieLk$Q8~QY|hV}!Gtb&%}HgwDbqJx
zMa?;vO09|$Hd%4^T@nw(YhHo5nj1oj(DQPe0BqZil3OW7NCB`Xvc04zAG!$NrRbNE
z6iP+G2&U-1C6TYc4PCl2#d`od?Wv)kdwQhtuRW~in|*Z}D<dlg(Z^%*IWroIQsZlN
z4k~G#@D7S^+Yx;ya!$V0mR21D=g8&#6;c`-f?!9FWc#+gEA_HR&bm}PnPH8&XnSL<
zw1LB+8Oz#l$7-$bCWhB;+UUdkg=!Iv*DNMKB3Pczodxv(MuTAE+lQ&b0wk1hB^ISB
z(c&JyOXSzYT3hc_A`oKUCz3%a+2Y8KO{`G{GZbyQFOB`M5awaGIrgiwNf_SVi#C{6
zC$F&fUQ#MVFOhl~!H03<eWMZNs-&l1dmT=h%A9<m;MY$HbgA1*PqrF9G(D59d2lcr
zzhh54rLSu9GdComIqBC<5ANnEs}fCb;b&!`^MPG#uP}(D1X$+kKoG{SU$WS)uMe*D
z`(|uRWWlGRKgy~lKjI%J5{!&Zn-|<zS$i$bL&B7OakXeCr)1CpMk4#4+bucF)W1(w
z2{mL$d_ufPl@0(kXFmw)7-4qdjOQ-zMq{z`PagI|na}D{<<YkDW@0=yK_B__8~ko2
zI18X<VPmcZMRC!gE0-Sj?aQt2Mq!BOYnaQ@Xvx=0cH}>U<r6xan~NlNNaH{ba1qBW
z9r_|m7~QeAhDJI!ur}BWK3&K_tEd%&4_*n1Je{+Lxw-)Pc=WIZ?@g-_ys3Q7AdSF>
zu{V{~hAV4-Z%p)ZK4$AyNRHK{QwfzSqGZ8tc=Em!QUZlpYP0^gnAk^*W0d$*h=~&z
zR*K)xq`32z?S;)xPg+($Sb7K%Z}@^y6+t0)NEFAX#8HW_nOA_@yj{VoJJI*6Lq-v{
z1iy1tBs4>kOj_PtsJ8VnA>xqHWl2ce@UkCwC3L&rj|?ECsl{5vKr9oRO}dm=5QPn~
zj|!d<D)&YR7;$qdkp;H70PWNZvqpUOLUy~B=2!=z&Oi?`xAV0w(a`ohELgAdA;WQ)
zQ|2YN*-s%zPHNLL_Q=b=?;>^pRo7(TlUeoo0rljL<&Y40+H-VfE1^6<a%BvxBNC^v
z7e86OfE>7AA#y`FcE0cdrVwwo2X?SLz>Vy8IBS5);_`*$`mcRyOMZJwYaFLTzFR%#
zo_yw6OF^kpS*}p;PGrekT{-??B{6HU%|uFPwGGm?mtM;RQij*AvcK#f=a!lH;9hO=
z4t%H4>LvncFbsc87w^^Xc&rQ5d@DrqdaH6#G;Z712NcQiJDR#GEmyXh1IuA*Ui9}8
zdoXO-SHVpw6CTXDpaGdW#@}rOu!tco5^&MBUWzAlk)Q^s?RVbUyY-Z<<d5!~0IQ;2
z@5*qbi6WksADf*VXjr|^O)Agj$V;|WmeWL@K?ZDg{U0Q#&qntjxUOt)TWoAkI~L6k
zWE@8GruX87cwuvbTdW2}1d0~6+@i%QvhD^U%fvqCwoJ|1b40q1Nm#-{0EQ1qT~n#=
zrczPPF{9_l)+*2AdBjgwVpk*Hke;{d@e<%S7KqwR+l?KoGeA)4SWaQ!jZ9Yg!DaTQ
zz-*4}i;kWiTpE}RkVW2^76#l2h&awel3p|?Rhsr}8`tdejj5dS!gBB%^e;~FVf`_)
zFwzyWv51wh9_nj`voAA~@+krV0JFn%j&I7PExj$CJMI)e+!ZmQ|9}tB^$8S~VIF(Y
z#(L925Z^C_+_>*dm@ww=6hL33&hV%appP<?<WU^ma9)t!gnp0vjxt~3MJZVSSLRE9
zN-i|b&}T{H-C{Y&9f=0>G94n%N*&6Sx+I>Wp&G48hrxKa_q}#4N(4>uth&)U%yv%Z
zw+pn@SL`bi(0v0zXIv!f=625WV}=5DfH=j1jx&owaI_ggN@8#w05Psn?$t~drcN4^
zVX<A?QZnonYSln{PQ<z=rc41_GTx{hmsWvbTDP8QVk@)00+l3b6naCFo+g?;d{pdf
zdm{O>*Zx#}!HnDN0C7CwSp}$D+^0o(&ORs&CX+wKe>VH5*B;oj!7GO9*%@PfHHp}2
zT3dp49{{|0xccnD4z6Xnwv9${Y`!$M9wZz?oNcV-=UiDFi$>qbR;>ofCAQdsvwMcF
zef{Y`sQ~MSA27QQI|lxV!DMS5&Ulf&>|s>*r0AuQTbyaxI>l@w)(849e!b%68BSH>
z`wKJGw(_WAGyNp6_akq5ePI>;1n5L@Eox}_<Mcf{{loK03c=Hn&{cnFoSiYKcn`i5
zyF<s4A<+C{#=pJHz47RmzG|wL%`T36Vi~t|J_BNUZ^r+i!21lGwU48pujt&^XzN^@
z^XA#HUD8Jt|MLf{*`=wv9tx}k7?NUyTVDN^oo>?yt;eod&y()<V~<M)u&AWHFkG|Z
zu|L|2T6tmn{b4rnc{YrDzgDPi0BoVvmN_JqTJ*-EFRgmHq4#E1b8<jqZe7_D@&eg!
z1h4`Rb{7~jKkHmew&HjxWKG^uLV{^JBZ?4<>|ak4%37%Gj#NfO-PXQI-aI|w`Dv$m
zU7A-4C(Lm3r`#Xg*%8_8Lc^OXy|w^48lfFsWe?bRo#Z}^H1EMe!c!B5&GD)bj|q35
z!wHHP77OV=TaXCb{8OHp`-J<)EqK<gMqN$iu{Oga8r6U!gUMv_sj)1aRnlN3MA2=K
zAH~vk_#d#e|N64D1>;G_ppyhTwR$m4exRhGsXVx>a`D6OD1aTf#Y7w(s3b((ZAx*V
zHYOf8JuLHqwe7XgEuil_n&Qx_jGicgTCethul!_rD-H5CRm5xNrTNL%<anlon|rk7
zJRZy&V=Z@g)F@TrOU`DQs(~a6hlcXpbN)mqoy`0dLIe!t_1JqCx;+Il>P3Coaf9~_
z1vm+l4X~436}mFOVt3z^O9EqrK9p-Go%B0Op%UG?dm8dAxsd3l2iANAuuyohSr~Zh
zn@|Ih3gy1|wD^V<V0n^TGV4NG=V(AA5Xtr0z^vvo1AM>g;HS4Z*vyscL;S%Pmh!NG
zmM;);pZw;uL(Ob=Gs_POHng_aGWWKpo3=r9&b;Xdq<lAd^(x?2PW5N$lTMyPmmW`t
zF6X(q;YRf3govbV?HI-y!>R}XGDp7sX{@+S|Dg|1!a-9<;=Rx3U#`@FGSFrVx#6RL
z_?mf$S8RrE%^7aP=kCTMlpBw8vymWsZ(wtrg*D2=CK%RY4!5nLJL{{aZ=Yt`MNC=Q
z1aD5h{n1IVw7WSxy+>~Sgu>qk%}eI$jl$XzrXO4Q?np&0QCcG736FY=XHj8~NM+D7
z-dNd}(E$zV_p8%-YSxCJb~sh#MQX^kS03yypbzY|fI>+RY#7naR$fxfU_Pcs@Z!>D
zt@am`FH`v<31C7Ee`}BnHI8Lhi`J>DA25j08^8co;`zvM-3-JZG`1q@=frltLh<_1
zX5X$`_0^uaL+{r@%eO#Zdrvz!V>bF=i14~X!XyXNL30ilG5aH)+eTP&G^jFzgzdjA
zGyaU;{;USVeEa<SyUO#GmbiSX)7bzAZ1{7F>-1`HFAi<fE@+&~p~11yR9KOH68x5Z
zwg<i16&hdbS^F^DqAxaaw_!y(;pp0>&+n_IaYCF=Sv~+eKCk2oao>J4^=pxR))8Kk
zdbG&SsnF;NBek6VcH2yaGX2vuK(n`V>*-Dx#f?+*qu-eCL#J&Kno3Fs*Ax*JF4Z{q
z^bLRvtxi&6g=KI$1ox$2nJ=q!NFlG6Jii1KW67Fb5<xv9+_lDY8f%I!AU}nDwGDe0
zoI;qQ#_2B-6jMd4*r*2NT;x2+)}bGf!sT`fC;$};MX<UIXs%|&?W<ti60%I((Y3Xf
zkcmjofc{kA4z(+ZXX7Z2=ZFu3V3+Ea3GL{e?EU&w2p|u`3s)E#K2gcQn_AF|F=YFB
zWKv!^Z3BmC(5cyZYb5>v*3aIF#dO4X3%t09m-LK(x|=l}|Hz3OEGS>r#;bpk#5tDp
z&^F|dX?Ox?K<htP;Oes}3TJLcwBGh;_;8tHnjHqea2lilIZ?5}`!gH#i8PMCsWlO;
zjo$9;Z{-gr=9C|2&1V<%)&X}4#XCgv7D7eY)|c6p+YQ9{q-p#B+RTsA`!vQ&Crh=-
zvuZB%bWyH>Z{mKbsMUO{D`SWKV7~Cb+h|#gyxC60Xde4<(uE7bqES$JOhz5dWO$p5
zCYZ4O3zIQ|qW5sxgHvf3UZtgO{Z?h0Nz?j16U!SFyuy)Jzivbs69_5+e$Va#_Nh4^
z)KlbHOphrSJb5lf;UJk?k$n8Q#F37bMKtp2>^g9;d7Pqli+X3q)-t*IsMxM00r4~Z
z^x$Mpt-Hnitcliab8G{^W=<D+(+~7$Z@drA`9{2ZC-`wghdq#=4H$Y4V5~yVtvK+A
z2n@?~Fh$BtFBEQa1^G-gQ^_dKrn6^pMsn<FiH({~*P<+U!BVs$nq@8S6Aup$8x?vJ
zI6#}1Z+PCXru8^IGUUx_eC8RJWa%~Bod5!@8iL{*;cQ;ssV_HhInm1EH$s`ca5oFJ
z<0J1cT8X1+OZIzS&AXB8EbOdDzjr}PEqOn&-D)<nTIg-6a;%MUyt%ZSe>{TE98reZ
zBC#=N&x*KCIl0Bm8%tjfs<j55mwS=x2px(SywrPwf(E`ePtTI5E9D2tT*?L}>^>i}
zeY>iHiow7UmM7Xb`#jP)%Ogz4q;jUOVSqC-%^Sf-A8*~EzIFS)*e$d_fAxKW|12sY
z$rh}j@y(nWZT5-&6RV+BYf;I2P09e_=4LTAMYq<9eb#m6mz}2QOQFKisRsJ9r*m1o
zyn0Q(<W6F^t=_ze8B_F3<>Q5u*Vi5`p^l>|ib)4DvTC~>Vo<-6_(ta~w=JXl)(UK<
zQPq_jj@r)p-dDnjJ0gAS(d1VZ-@Mdp2Bi&)$uUIv`j8*9jI{|l)&pV}1CmXBZJt?b
z6|GomYmXu<Q=>SNV1pb*xg12}Q@Yy6>C*L}r5_&cxjJ!0BSqu)yj7G9w}|t)3l_EW
z{md{EK0;pBY2r<h1}!TEK#nsnVKkuPw*8?6VaO}OSN5`%Z4+6hTg+lz4gYunWPC1}
zvDx+ch7&y!2uAKSRQZ(Q*j9OhJ;M|*OT2_@$)lup&`qCxDp?SO^GEG{HpuI)r($pu
zH`!S!6?BbP;9D4K+>&wS?A3abZtDBK;w%ZS_ZfPZ6myszqdxExi_3_V&uPoa+I_oQ
z;aZE=awq(nwuLyR;BoAkVfy5Cc<a?J4R?zHe&R5Vf{t#IVzP)D5eHk42o;-ML%X}`
zD5$LQj*sJ=EkGOJDid8-q3?}$mUK|XdL-;Os*ZsuW8lCP(aNbh4k`QD2>+BW<TKui
zxSg9doHsido*AW#ymL?S-PKc0oCK){#BU%M$E)Qc^fX=KCp?@@9-G##b_yr2Hl|F~
zu5-y&U;e~)8KV#N#b^-9E@C?CN@uv3|E66Wf4L%Abs=atxC=7#BkI4hNvddP!}Rwh
zq)4e4OlvYH@5B32HY_n?7v8ocXLfwr-Hx#xRUw+|l9eG3{H$DfokgFnPdpB$C(Uv_
z5;U^S6*drAZuvUWUc!n$!&w_9r(Le*Tj9H)=G#v-<2m}rC+V6crmcvz%fO>f3i)hG
z^yTBH!w-l#;zh4hI1Idy5H?Wdk6A5f`ntzs-2=iYqEBVdb$i_xy2tINs`Oh1zt6PF
zBUGG~0RdN4-$PNG5x3OOuky}FsTBMzvbL?he=_2wDaQ_B+WD{h@LyNM_;s6Pjb$TD
z;jPtwT?;)CNgcjlRS`Q@obP#bBC&XEFcnM8)qcEJ&+gKb6a@Xkr_>f~f1z6u;{EzK
zi~R17I3Vl|9EY(i>I?iEtt)%JjC4xX6=_#V1`=#raGc9vv~Gt~vqf8TAQ>n7r46k(
zFPx$1r--LpFDw^%Vq^`AKW*?WT)bX;`Sg%ix6Xd_d)-l%@cTRQgRSH%3e&}5+m&jJ
z)7CLz%_pi?e8#Ix=g!7G)jK^Z^gIG<YJ>6e%xUFz(PA9H-CQRl3VV}n_FmF3tn_{F
zPcj>7LFbLHHRaz=Xcd&&^iy=P@6<|X)sJGfD#k~MT>s+cdNR!!(>5W}O-e$zU;VZ$
zXsk?2>-wueM@08T^@c#@&BFXQonJ4A4YIMPUL?T?ai;fGT^N+7ek$<Ik1GgL=pBR^
z>aw-04Zi1I?XMGMd9|{;!cy+MLT|bj%71NVY-cheEYhudcp<1gnD2cy*-jlGV5BST
zifyLzNo^x9_~>{wa?*5K^d{Dl=H;==9-oW`aq2>zF{r{gcfF00&|qq0YPz-;*!L0@
zvfYP|bK6tlCHaGrxO3Y_9fzdg31MzJr7D|GIo5Y-CFX=pfcKT3?3H(<it^{Nn?3z&
zMAxEN)#Ag4{@Ye9B;5Kf&RHy=32h6TjoRK5Oz{-z1na}HhV^}JO{oYaLWt0;%QyYn
z!2;5!H(_-$7p<(;J_=in7Gn!Y*94s!%X=Y!c&8;QeJ-O_f!CH<*QTO@*j^RGAoTKx
zOuN#pLd!K9Tle+p{D@K~C2&E|&s+IZBDil(d{}Rk;sp${xxcJK{Wvb>sz$?SKXYvb
zO;X=rwtNYpe%+R(Z>61AFzszR(l%h#gj}};2_g}iXvuHP9FKY0U6~*!vl66DB%Ti1
zpSpUh({Vl_AO@#*p0)}P#vRKa_x@l$SnB44tnFN-mp=YfHtcPF*c??1edaRL!U6Ll
z!fBDQS!k}<Zkn{E$1c6NNyQb3gL)&mGv&3MYV&slY&Q~CtUMnRrUg}&VLtdW9oWXp
zmQ{`ZUw7o6mn87%ZG!Qljd(tzlHB{&CT>RGUd2>hJtEl_2cJ}2`9%d=H>%H{1cwB_
z=#`Qh!SxlO&u1q}<W!S<RGgf0ual!^)(Ld?8Ce6fa2=w#23R5>nE58FZ9;)?D=$Q$
zP6(FOR1}$C7@}A0W2m$7p2J}!8R6Ni)3zb<sT7)(nCw!UN|ne7O5XS-dcAFRz5$m_
zd$%rjT9Gr%QeoA2VHTGFtYA;uDyg$%O|7+o^Cij}ZfU)V!j!&v>vOeMsdbvFI>y3`
zCG8;_K2`iF*CNel6zU2KhS8t))9q_08_sq}<ybacH(rY*4ZllB54-r8PT7*1T-g$k
z+?YmBj&`y<rz2r#MHkGcvESq!skYyUh3V1oE~nNMf9e9y4rCTam#>zW^jhV#E>Jp&
zbIZiOw1wdbMKd%LX-25<25A&>b9)2}t<am?W+W$bd+7aE?5KqWYq{5;f|STKw(9F^
zL(s#PpC7_phwq3YmvwLW%Hy^c14vQJBb2;Ohp*hH^HevQcC+_mHK@W|cV|?1q176N
z0zG#}=MBG3&SyLUsY<DM?$@}QwO>ZxuU$ac!|j}88Os$2b6o&C+bdnZu)Q-XpZ$|@
zsNfaObk`wV|Mm?`>Xtzaam%OqbAPRcD6k_O+`19*($v6UvFM%|YdNU;UByFtHPF_G
zb65C?`Jtx1Nb=36)9^*Z=(3h`{T4F81*_%2j+4{QB;byX)wP~&Hnn_J4;$@<%+}iJ
z?vhXowHK1f=YJZaaGjE_eFu@{of@6M6sgN0XaW!7Dk_(#C2xHk)JM9+7<gYPv``#o
zvl(b|MT+MiihLW?*S;beg7>!%HYSS1bH;4)SpHH8$PYIxOvTaXgdOwDgkP=Qm+qf*
z09A{MDtu*2k09L<C8ls#)UVY1!n`hbvU+0;6l9f|k0S&`1=_C|ZEGoj^gYR`TRVq&
zLEPg>JbnoXe|sW!y}}nxoi-L1xSh8nuR$>rm<xiH`>3neaKR(2&){2vqhG95mgd1(
z?Qgw&Plb__0bjveU$&H(Je1@y>OoS`{dL%E^l;=n>{+`1j<6-jwe*5g9bXC>UWRz=
zlUQ%bz^PSmEtlYgrt29NkS~4{g1T&<|G!<f^GAuEX9wFRHf%c0l3#>G`*i0kK~~c(
zqncU6ihzERu#D|Icb8zWdCg~A=%RZ8bNKnUey8`!hQ(CEweyXV<VAS$Ta#tUDq~qu
z3K+QHajV8}uPY)%uZm7p1>)X1`6jDgbVSHBydNRRH&ny3aOI2BA1~q%G6?U*XB;V1
z$!=6H)@1Jzmeb;tGbCGuW*DJ&Sv!-35V7ymUc5iT2f6IbFthIODKlzbcnr*isxe!7
zu+(0RDJ&Jq6%~A1_@Z%hKCI~QcuI%t`e;=a2?%)(@XCqdwR~v0v?|RTx(F{epUeFO
z3&R}&=alky&a1Xz<d6^T;&#b6DFwQ9wbsMt1WM|MKx<$&^7yo3@Cuu9NwO5sO?qE~
zvpkn+x;I9~rIKu`v{^aRH(T|*6v_uZUiw~r*`-YFH8v(D+&Xd+_XZVd7B5Rd*|+qC
zrxe(WM^zIDA&7ogk!aDIl&1nV>mNICU$5(DB9k(nZ~EjnZdh0}w&PlrXlUv1-++2S
ztS;fv7|VA~v4dw+&sPoS4fQ+A28B)=wPIOD)XI0a`43lNlMDO74tT(?$*U|qdAcyF
zFxzBnJ9?rcm=knok0(fIxtu8FO8l-Ub~KIn;FU*Oz$+;cY|^n91`eIYQVs_v08l1q
ziJ%1GCmu&G2s;wd=zO*!Og@?R!7V%gUE3+X&c(w*)~|clPI<{sJ{Sg+P4`pX^(+#~
zT?sAafU<9nx&xG|RF+-L&(0z=DwS??0ICE_*EnX-%y<Xv((=q@V1veLBSg-BrSsE*
zKPu<7c<qnBB{{uP(vOq(bNar=<NgTQANA(Q^y;!d=xhOuAh2@|sZH()pS7_`etk&&
zv8)GOA8)6qRV|>Ed!*`hx`k7lx_0ZS-`bYpt`?Mh343JXKmvDW*2Db%gzNx(+3M5v
z^JJ#oo-QmbYmH0P59yqf=Yi8xeaAn)i_%$nrf9|cE46{=d1@V`jEtIqe2>!EKy3jY
zMjfi|P1|Q-<Po7&lSKB_P4dDwXofMFp7k8W*23WSlZBVc%z%IhvkK4G=B?y=jK4k4
z|NVYFl0a+6)%f>!>+e+}u<poG*m#`cg}X2tvbY}<l9kbGgn^(vMx(NTei)TfavYW3
zs*FH>XtJ$h_?`REX4QvRe_5_XG3p-`nFhZr@=1um@$Lx`tK489%e(wg_J6VWrtws^
zecNzJh6a-4G-b*hDj_q;5FvBMrHEw8oH-$7p2tv`XBn1^ODHoL7nY&SEX&L?d-h{-
zUe|fv*Zo}A{r=wH{q6bI2d!g2j{QGw+xFl0;5m&i<3Wc~toyfzju?^xw=?r<W1QV|
z@brwstoEvwMsx&5Up3s$CCp53+xY!Gao73zgQ(%+MzfuBmJ&3ZN&7cF-ypFKBXT^6
zc4ZHZv%<om9!G)5GWh;#Mi*iY-ku^NVR1&!s<d`-iGUXWh=7pR)+n2_pW4xSg^%S7
z{cy#6yz|_M_~b3SRes}9xiQsT@ijQ=bD4!(Zjcq5P5aCllQnU;^~7N@QyGo+dJ^30
zCbtHRyp+*k%=aw10Cj(B$R4TIUrT=!NclxY@HwC-^-EdFm7{Y$e6AyC%X+ljTuYcn
z;Wo`xbTQ!e8`WkthxeapL7=sJt$AHjU8y3erPN`<J@AiAuf3*?<;d*!QK&byxktZi
zs=a*#;)>cxPztC4n!P=Wz{2itw<kwzW^PS-ZV{rQDQf!tiwO9JL{oM9wv|TgQPv#z
z$imuH@AeNuDD-sql55sNL11x=(e<`s-`<^FYK$TrA#}~fE(;qpT;K7r$38Tv?Y0j_
z=TaTg<aBm(Zu?8DKQig=fEx_GL`t~W%bk1rN6X_k2)#DyyIFfPz$i;@oh9_Tj%6Hm
zePon4Z=jTOAmQZ0=w;`_<VY<0Ql)@q<M)DFKOq~h>IVO}b*<#tizT<B$BB|B-BbMh
z5h7|C%1KLf)`enDc6{di<<hYV>tus3jJFfi<kxxL6&JRkzG`0lcYXPaVNXFZYAqor
zYd{SjeyjTCz{i#$_jeD)-Ceeb;biU{`Q4o2+jHkBe>-NR1=RD|_SjfgB?|X(Q&T<4
zM7IkpSk&U7nv%j4Gf6u(zTN$UF3Y}Y3&0>9J{d8s7E_-;S-bY9E5^K{Cu?12L};YC
zTmc|MzkQiq|At?S|Bms(oul*vr=;>Nf$|qa^?@WG^aWiEGEvEBra@C?(^o%~CM#d5
zw)Bm}i<3-o6_w2+%L+Neh?pa^ibrkr%PD6~MUG>48i%?Jb54ftRUZ8t<3}qc<qy7d
z2OBsbexUC}Z6*jtf3%q&vyvNX9#wf0=xO3HF&|s=*`!;oD0$j`m0xPLU@VrT(^h!e
z@;lE!xe@jLsRYsH#s!zdhs-rqd$xdYHyN){IR7xeAj5CQ;*Ez&bc&EgNVV{yhmCrU
zJ^j9XzA7=PP?20`_!T+#{q+4^^p)j5tWcJ$25{b0i<W~Ha0+4x&2zpUnFoE(%qTZK
z)|CVm#PQM7AdYbmmg0@e$S8Ytu#?@(xINug_~TVq7y7P5s?V>5zJhqWOM@lS{%+y@
zZPd-t3xDWl^m<B^zqlEv{5}8herSI8AmIi&`sU-bLHA&B=4#C6fy8%aUTk+PhE0+j
zvIbtctT;C=Rax@p>sp1qd>9<FH^tW(TgftdfCV=iM0eG059CJXi=}u8{W!9+udA&x
zyMmfVTa+3P?avT({!km(*i8PiA4>r`AFa3mc+U;Ns`}i9F)lKsFqhj`9WLDhgmuMY
z($YQ>ZR7b1Q`I4WF+puv@xdd3bG=;@|FmOCC}m+_utqlMd6Y`Cvi1FWVG>>W_>aWw
zM!g5ST?Bt<IjS~>I@R9py-Wck|FQmdD8AJO-{Udpt0P&D7?-`aE1bWU>H8i@yJF1!
zd7@{Si@qbH>Zuf@qCAw?2`XjVW%1!p$kOTl2{)aDUdao@aameQ<<-O%+%iTq4d;z7
zCeXUSPh5~T$&rpVOED5@i$OOjQTqM#i0Tg|PBk#muBlZg*4TWut8Tr!`0QwZlK)9K
zi4Vry^AoxKMYmbw`H@fgmLoao<w7v;{MxVq%HGOS^O9_b(ORF_@}mvrof7MFkI|^#
z)(Y#wWfnuG@q%97cOK`~BCO+$N<*gRSMro)(w`Aq@@*P#4AM`dZGO0DMldJ3&oxTZ
zSQjM=mO0zeNPW`K;oWl_Phou+5jyHnS~=G@N4PPfM9u%=S3coUo1Bq|T;{&#fx)tH
z`wX+n%GW7Aa!|u)o%hZUe`hA#Bm?(ok@?!sBGj6=>kR;dmr67Rqmm@TMw?M-x)OIs
z&0&<7>b&eMVD`g@V2+sy0YpnBYE{Z~^Ju1ztfX^4$Bn4Hs|rxH_OT&`1_xc@Pcy06
zC$tqJcb-jL*?Bn?J2pUYv42TSLB`f~5<_Zm2ODpglr&<iXEV@hlON~a(UX28pRddB
zfx59ik-Pj(aI}g%kIrTAP_4xDBI-K1XVMLN4}GS`{n@|vXnz_|3p{QcPqs2mPAtIs
z#g4CeCT88VE>99^Va->NGwG5u%4J%eHFO2{KN>DNq8ZqxtOq}CEc;sSJ*?>m#Z0bF
z7#HKppn73*D@9v+-uxHt&*qhLgF`Fs)^mEw&#NR8`1RyscwrnRW=Ba*H}8Mir49}=
zM2)6IW=fIDPLJ6VvSqvgZ9(&Ze3E6ds@3qK!{^>E*<f2f-KY!r!a3vKYBjF>R7bt{
zyLI^C=&#SRJ<;nkzs&qwfQCygAScqf8Hs%E2E64JxGK=3)keLh!Fg$lz#EPdt>DUw
z^*L3WLHjengwo@!%ML$Vfk8!m$@ADG;TF@xH2Ul5Pe(#WZzze4eEg=-bwkSgS>eIf
z3IT15A15VjJvESN?|mR^ZXn6EzVQzi2XeF*E~Pf@vm=yuq)8mkTwknUqxZ(BVaJxT
z84F#SvUT$-X?xtde5rCA8se6{c&Oe@thJQL$n+zpcB@sdA;@M*is0$B_XxMpJwIf6
zmlr-SWa<LHoUl+M>p<LSt!4E>E9l;&Asc)v6Xo=0+x<^0_ty1~yx%OpRA<~TvU>4Y
zUYg-!H?QT+dLfnP^)k8-uN@jTk?R8ed79EMgm0yCPY*S1DMgdGS@;I(inO^6*&uhr
z{pmpnLfIq)TJQbPqaV)6LwMTHmv(3shmh-lQ@z~d*P2q+I_6ec=tV}Fe3(g4Dlhu;
zI6z^tncB>y>|m~_$5yPVs_sLuIYlZsI-FJb!<D|*(M=sI<#CienwRrjBOf_(C6yCC
z>@nNvd7T*?tr)R)Gxf7RMIgyb0qv>J6Ui(*0R`MJPd+VH<=s&|u{38DSf6I5a=se<
zPb+%GUSdn1H-o_jQ&~<{g3;h;Jhv+I#&N6!t>zlpaP%U)%}KdVgXtaINj<%g^hh#8
z1xAtHo-~<n;2RrbolwQ9MD4Pbb;&h~e6PS^!iqwcjwWsbi+rGN(kRC=!A}uh{t_9=
zqZqr-Y@bB58~Yy7av$4O(2!p~c2C%GkV#XJos00ao2_*f;Lt9wKI9{|jBd^<Y-$;_
zm2iD|XW~~uZidZ(+d@&ftn1Tk>ZQXm#PXre>Gto)=O$H|$uu)`(lp3DY)BHSZ5PcS
z$)dcSjV&xh9DJjcTdGBqeD)D{Xpvo<(0sU>a`?lo=i>G5ck`85k`}0Z)Pr@?;AfR3
zZX=}RQ|04_8}Rv4uMaz$;_I@3L#OnbHYY9zMFrFKCh1?14`wQO2CH<dQbLY;=E8ei
zP)^s*AJ{~!!<MVqx8YfXpS(qETJN}+&wS=gc*)?Bm``|+5R*;Xi+*W9$^UpnWh1*c
zqpJDsc*|!^)qX6>O>i7>*2{iQT%>?Hs$|4Kn=>n6!IBE_gT?MTEw4XiD2*<^t*ILN
z^kDrusQSr`$d;1x>$ac*IB)z_>cuov0V+1IG0s+^B^DOC>FHBRA7w~0Pr!2(9A<Tz
zt4s7K1FPo}%Y)kXq3XX%aRL4CdSzN*{gRcw^wIQgP!3<_V2MhmRe1z}ZZOz(^0`{<
zd%>Ug2&-vFa{Zl;;NK`Ms-8FR27N@F?;}Omczn%87>&6XUfiS_9VwC3Q3SKsDEK(-
z<^nPjAaz)ha=Y&eY<Pz3C8HM@jcZdF*0nb|cATYkJdE8;0Y2UC9^jaJm{01+xAJP4
z`a`(zw(Gi*Zfn35gdk0Yn?K1_x1RS8H<Ln14u=bRV?Og8^yO+Jr8h<gQ>M7E*JNY$
z39z7UEXBmayt-&sKDi|QmfHI=|AV{6SsdzJ-H#^mmy<qNlZrb}GZ*#4-<&yP(O<xA
z0Jq?!`HBrXKOz|n^8!c*jfi2ci{eeSR~jBl1zj}fM}oMgH))=TpGVn${$g0ADn0aL
zr+UVE<`24?d~FvAdS>&?m#Ac7^Wm0}H^cB@##5Z)!2m)C{P%d>tL*t0<P~pjJXFyk
zt%m;2hJ9h|kp9hcFqbV3^r;r!Y#Kr9>op@$3G-KZ>r-U2&cFMq*zZ{13Yt*0#16qN
zfwSLv@(qTRMKVGLALS%Tenaw9F3l}_5=BLIF35$~dblcJBsYdb4NAjO^!qO9Z8QYP
zN)|sa*B$%j@ewoE_<^DVpE=${*jk|a4ZXh)ndPQ5wy0cUEd#X~`nyw!qWmeApL-b)
zVCIPFh0tNo(JNG9u{O2q-7mte0)(~t?0g*4o0bf$G~eLqA#N&}wmIcL+f&v{A5yS&
zAsP&{M^WOku5L`7me+DM1U}uoe|DXJ#0bC2`2~K)nJrARW)vIChup&M=L3Z#^uGfQ
zdXv(XMw-kij$U{<d?5{!8jrUg*O+GI>6n`w329O9z8YBw$Qp%PjQO|K;8H1{-t>7G
z;IHT8#+mJ*8ef@l?Vs};gnOu`JEHp|&tNe#dxyVlLNqpgo^jR>JI-R<_1>VGV?#mK
zaUThADFnbYHOKN0<=Dzi%Wfz8q3-vuTTABhuKGASg=hvIE=laZGpr3QvQs?YfyB>D
z*s^?y{SC0@o$%GtyxRm9P0)mIYF)Y~Sk_vLNKICAyf1SK10X6S>+xXgorMW;H_Q#;
zo6^e|;jjjR%0Zz%VQR*qn5*0gErz4c3T~bG$>{(lt3({k6v2DaIWLcybtM_}9SqOs
zJW6H;6=g_WK$<Ju%l^d@7)Dqj_~U55?K;&?b|3@IE3fHM!8>>b(G_mlf<`tCS9QW$
z`;l`V7=En&dO7)+neK++7q2dZ1D)%Dk$G_i#b}+uMk5-xG}y9i_<7Evc$3dGRoo`)
zRavzs^P<`B7M_TmJ!Wy0R~f~%1nM;c*x}T`yxGQbxQW~7q(#u<SLUFae5{r5Zx~FX
zbHq0a0ZY@*yYuvwj_(UQIPW{nyPtcF(Q3&atqY}w$lc$lj6ucZHR1k4KC_N+aN9@c
z`x|B~)=u=S3x%4n%8F)3rBVM!dT*Y_TH>d|VRktaV}%Gh-t(YoIk?rR*+W{~k;orm
zEn>6m6-2a@+f4$XX1yche5>`(abG!P%SWE_ape@<(euUtiQaV}U61+#o5zR4BbD8@
za|3yvt3T0mQNl_YW<I{CY-^2bRX~6q+8v#7t2BG*&8DLQwt(m9N97%A{oBNro3sP4
z+=9GGrfV-W^n(N1FY`c|C;vF}v|S$Lq^NNY{X<BBRfQvdcu>ASTTi=kxiX3VR$nV$
z`t&NlqCx2}sFSvsMuu!|iM*A4vM|Mz1-I>P_X+fPeIel08&pY)Mc+m^xIdo4Fy5x`
zK;!xFOAJAA3C;D(8@2<cfVqrba{eZl;?9Dod^b_MVibK~rE9}!03RQIxTQw%;G&D?
z<9j+8(Eu-+4Sd4a-)lwv{ZZ=YBMg%W3oo^Y;eoSV+B&fPDUZHoWUihZb-n=%f}}Yl
zqV-cYM~DF)V5YU`X2M)_&?csS!G40-K-l>OF9v00Xno_G6dny+UuA1<fW=r3v~)8S
zI`pzZ`)V65H(rH0DJuxrZRN<f6C|135p4{f_K@x0+pJ<1kIc4~jlh>!w(Mq~b6f82
z54~ePx|vLf*i*fFmqcpM@#A!c_0Psm17Y3%yxz5KYO4`X`zYZsw3iiD<QeAeCg3yC
zmEJ+qh-AewC2zS?F!HYRzu%h~uA4Ei2TE!So|jJS&~xdZ>D2q>iSpzq8L@E-^t9MR
zI(G59IV~rw@A>O{1dmNZT+)xq=7E+s+6PKi?-PZXb`GNp>$I#iZmsw)xmYih>Krc0
zBx9Du)8RH%j)_srKA&eS)?CKe3&)Apbsooase6R(Rt4(PZon#){L0Yf&pE3wrAdNr
z?_!1kxp|o)MRo}3E7M?k--za_>ah2Jq4Q4@HHJy9oC%%gmoW;g6L{-IVy-k0yIGQS
z=|Sc<%fXl2yp@lJTN$l?BEHY_nY!IWZ4Ow)INo9KkSf@l_ul|j(t`s{^)qh=%j5;q
zv4!T=3xi%C4!Cvi#3t}tOpT8Fou_PBM9jKOEXyjt8W>a>((R_-To+(sy$C`s9~5#K
zxC39yO7ytR2269M`6Y%31-Z%TG+nSpy2UD&i6WIs^h->Y%)eNx+bGN#CGkfijTcIj
zgK799WOdFR1-2lwUR#7zH5Ha=iJ31jji5C~qQA`XXCYt9nre^d<Cz7^c3l<&xq2>%
z+%<~M``$YLi)a#}ctM+F^3(;JmA6Aw)ZMzAuM>qV;CEj7@F(8&itJeT-OWOP6PO(n
z`J;C?6*Jtsnnc}|#5XvdVD3ua*LX5gx$Ve$H!Cu<FbO@?=Em6|%=#r}Vnq%-^3UvS
zcxb&O$lxEMqPuX*ao8by^0T?1&A@du6>UHZGOEeO_uxieSHP}*>KoL8^~-mL{uGWE
z^IFikf1pC3EL{E{fqXe5F6GBQxXp^YaGL1KX~^3%?$3K(o35qeRl_yU?1_?5%d@IW
zdP64Jr*TcREJG`HogLe;9exkea!3y0PrQ^61RX+*huEVt|AKU$^1g%rP$M^yJGAbq
zw^c%$-&5#!!`X~@JM&Wkf{4$7(}nl~(ue%&gJZk$b^u-6eDfm`+ykGG0nmyV^`BaL
zQ9L~WR_&|TnGi{Slqb5sGbtIhr*%D(o)2nUG>E*}$GcKT%FhW2(c(kv4!`tn?Lf5E
zgDavplnT<MaQaHpF3p-U<Dt$~q}?U@yIcjV<l|ikJIF7=J?OhjnK1=E!zDt9gtKIM
z1MJTaatZGu06Nw)JvbJ;goT`{Wu>EPWrUP33^(vpxA>o+{u7xgckDptaC<`R&F)3}
z&Tc$lYQvZS`u%f^m!|hzz?(6$`TIcX0rtyys<kO{6*e+<ySJe4FX?ybUBkf$a8y0U
z*eitp>Zw=QAlB3|26_<uZlP1&8*nU&B;eu`^Y4QuBMm3expWmI<Hy%eu<IVOI%FEN
zw9v_3F@VO<^4~OtMxS;0N7slf$p(Lb0sctFQ{GHq*`a5E9fg1JY=`>CM~wKN-6cZp
z#yO{^US5K1LgwDFW#!8&OPE4$mURiw_G?Na$iG}u5fcpmDj}M<4jxq2iF?r1+5Qks
z@ba`!4OS9O1ebkt1!s))Os|1ATt8M?ND2cNb}(W0KiRAMAf{P?9WQ#<L-H>h&hQqp
z+zh>IP_g>QA&1dzu<YyjpZ9GU{%$tM9^&_bmIM#76Ug`=AEIcPZ@K`z8O1#Y60AK$
z2Kec#;jHiP(eu#<=s^QIxCc#C4}Up_cj?_3$Q$98zYWNT9Xr}%;1o~7(~dzcd5|e0
zLoQ68?3FhpwzB%ahvwJsU-Ub)F&9CYm&DnJZ%^R|_)11eklg>f+29-^H!QM23i6pN
z!1!=J!z6SN2RZ-8dqj=DJ*|OsB|l6t0B3#wgaV+I1Vlm)62?79?}N68mJ~Rjh5@*G
zhZfTyHSuvsAqoUeaU<e{&YuVV(i8rP_GGUv0p0}uZz`^vs`)@Oh7Sj9|90l<mJ>g2
z@@B{W)ohL(g2K)Y=f*hW!}-i#qQTvft_~1VDC{2C;;ip))+K3s89YeW4ELbG^%qT?
zz<o*Z7r$2wDd6idOPvEB;}qT#;1s?x5y!9y10C=e;oDKtxS;qLA5!_i{|)`anxol!
z91|}bUAakh?8k?9Fa6zYaG^H;o-zr}jUnU1`OIIVf&X3wi1hG#JRCUdgC74+>ta{N
z0}n#qzy)7hL(Jo|AW?e*_C`?eJrEAa{~4IJ6N=<dJRptvb>RcKw|3AQULp#V1V!-R
ze-tZ`4Kfu4|4zYU1+NeJF+Jhuk@CNo&9OshHn;r7xiMsXxUBM*XmFB6w3=DI<E#&Q
z{6F91`vXW7l{5`Kh`TeFE*FHtyO#jSY05?R|B}c*H~ddU%>PRw|1XLBuO<<{YNcd;
zw-9|V^r)doX41<j%gP72)u=S6&~e67#YM7d<pi;F@9WA0Ng{;S4`V!B9U`xdI&-8I
z^lB5`k2nbd*Hu`P6ds&HgkL`IcPZ=9Nijp=8gcirA;@?xzm3g^eE*R^*<&vR|2;B5
zL1F?I9cpmVA$S%h?WuJnWK~J)-q>QutPK;sbh?-G1J}{=(G<p6w)v=HGrxTJo^Bp;
z1a;fB9eew*30AXz)k<&^o<Hn|kLLpEKL&`Puwwp!ctd>g6}SrkzA=W#)W5qDC7)Vn
zbANZ^XN4wMoc_7*${)k_Wo42ByW~8W?GKZ=xRExDK)8&d+YQa`HJM_Ax$XeIaZ0F&
zNku-K{ya>5itUeed|2czll-&=xGtTQw^non^+~rZ$F8ncEKMsvA)Dso6+EF!5L5dt
zC`c2^QdGCVB+g%=;qgDcA3|k=<8g4$uy|{gP0UcF)G_V9N<OvS%d;Y2X!o0{czn$5
z)y|Rl%2&~yjYqr)aQnMmn`3O6^=mbvDS1%zp{$`Q9K7k3o+gWZ*$;(%^<U^<>UU=Y
zl4C+88Fzx$bmI05+hTZQJzPn{WCE`$s!)<01_X9(QSVHx7f$Va!O()+Ep9AbcRf#2
z5k*A;oaw`_!F(f-*cDQ89BNI!)yotkPs{C!h`KLx_rN<$4~4<s#X_0I#Y$nU3skC!
z58pcC63#y(KJ<>otf0Uf{e~;>Og&DkcC+35jeKzXm#=-zCZCF!7Ky~vscg0M0EAdd
zyTs9rNJK_g*pU5UjH@HMbr)U8<@f^Gnb~p<h5aO#67GMEeu8c}+KfJeRcT-q{3h4p
zmBuAWP`_W0gL2`dg3)}B*VM-b6>tvEtO9nlvY8_GLKJm>uK!zU=1%4KHUIV`L0E#I
z#f^>xf$$v7+?Xnlec6icFUDst*C90+EJ-wf<DcuWF~KXfn^uSyofgz7dig~#Qg+gj
z`dLo0Eec@K;U%4jkzD%&3QGC%(MnfPU{HPea*GsHrJ}#SSWFS;nZw9kPMHhGbt1uD
zo(Y<$CI&U?l+{QM!G9z*|LlO+%Ui}nk93yymm6-IE^hk@BnUCi8;UtO_QEk7+=9=;
zi?~q~N!AW4e7r4+h0zbsP>vLSckP&JG~TT+UW_RZ!?s%3#L|22vJAQpyO*#AKl_Q%
z&Kymy{@rZc74bgO%U(Upnum16qXa?aogez<VKY=2@dws{QuRl09gsXv6}VlCah7wB
zFmfHObWB5a8knRcS1AHSU12Z=(+Y+lOy;;6rb~Dc5#8elzhu_WFID-I)6p%vYvcwC
z5M4EkZn81)d#@1v@DxnFh3$1iAsL?Ef}q;B?OzQl)8MZ5nB^bADl4iBXZGlN6nC*A
z?6cWr%XVGv0NKxR{#tHGcViRXzX|qOJ?V67Jz&&{eVDB72iGNR@XuS)0ZEbFX0Y>a
zVil&?=Y#9SDK9Z(yFD*S<Sfip3_ZH!wEQ!n(%F3I#=QGQJe1{}YNjYu&$Sw><aj{4
zkUjT^09OJ2%_SwZAa{&DF6y)>Nu#G)%-*(oEqjSF6Cb>D>v%S+7)vK?nipHWnrri;
z6~R*_{@drJ9i74Wr*#3l27by17~L{8tInME#)m^1TEABmc`jQC1fKIH#dzgtZ<a<9
z$R9QAZC8Q8T-7k*cu0a{3dRhGd+w5LPqcO0twsw*&r2(dAIej`Z2Ts4u`f<^+PPxk
z?NReKecQD-+e4wuW~mxi)8K1}aDGlst=phrWl1>&u7vZxw@H&NX|f)a;X`rcJbUqQ
zkve;rIA&fXLfk_o3=H|U0f`k?`MAdA7A-VG5s-+{vx5H|cgLLT9R5IB;RCbrh;+s2
zIdZ~Q8-&Vc?qWIinq7;Z**3bubjiWz5C7^%w|_AudcfRw#dXSEN^a+xuJIFDwl&K6
z*<A*4jwACyx)UD+A>5Nb{V#3UDZC-58XqXH&Jd3NoSp#t^3<;#R@7)Apzt)^5_2Or
zx#sy7*YD3$hh(WqP9NNS+3BavdIyf`L@Cx(Za!<rPLdmrS){uyR~rhKjx&Aotc?Ct
zND`~Jv<<7D=@1x`7j_=jHSIdolLZ&4zInco<>|2&Q2PazVqBfwKu!{8%0lUlS(o;2
z!T4NT(WTyB@iLjzqS*nkC~hB4(pYn*_Y7xv-J+2FbWy6Z(h519h$RcRZXTK`Kqba@
z{OH3^5sIN}9#f3O&*rrpR+{2x4PuHaR2$wFd(4t3r}fEu{sC}VF;~m_E&Y9ZPv+Bf
zTx6`rt^U>D>eT20isEs3aobSw)x43T=3dV)B(ftVdpyO1#CfbLJJQMYmBJIhIz_D5
z1Y!1HV1nwV^}LZLb?;|gHF@r0ugu%mEqr4pvg8Xl))PNzBG#UC)>?!>E)nnQ(d7}^
z`iqg5O#{eM-1;}2TUVUL<)8EQD!}nj4{Hg$tyt?V+x-6oNZbpqY~kRJzj;C92hjad
z_?%2G#KEq|r9{-dp6m)ICTDX)X*dYaZCRvE6L9ZWQu{3zTUc*0?a%v<CKe*@ztAXL
zvQdeR2LhT6;f=dqC9?88p<mJYRl>vHA5sd<x1yKiFWnN`Trud$(Ny$8=-)P|Dh#=i
zi^(fDTraKC&Q_CoF_0JT<o2>5{tPb|oTX!?W?b0$hCM4t3{Fa=&GUsaonE9W^-VGe
z+v=%jyE!)|H#I+NxO%Yy^S15s=PX{s>c)$nuO1nCtsAJ?E;e9CIRWy%iZ*L)j|X>w
zi(>HNcV``J#<_TekmN`LEY(g6d&No*`haQE+j+#@50T8_Gv0jP-%6F~WZTm1<zZUn
z>?VjW!{@?x)+yz?&V;T7642U)eXy%va2#FPoU^t2Q4zcAxKul-J3shD(M!x=rkgD#
z5?r*>irSy(#a7AtDjnnyS$bSCx%a0vteJnT2qVgS0E;XLH2x7B8`-t*oZSH!@vf?E
z>Ya^}!Wt*u+FuuJ804~j@Xu|~CDbZ%S+q=9TpEm#3B^paTsr9(tF?*uK!5(X7zP@N
zUx6<u&H_q<@_rP)POh5_4=29Hhtej`gZ-rucg*)<dn9JxvF(N){Gp+{%U9Z><!fr?
z)^uDvd<WKxq;{=3l!`#G5OKa!=mE%(S}#&SPL2}yPnnB7viOy4_v_GY2R&qZmDd)&
zST!8u4D-?jXR{|^mdw!|_Viz|hMV41K$SOL8X2OT1%Tw!gj|f5p?b_DY6-xQiK|T9
z?s!c}uC;<+rMZQQm%Z(FTbk1DEF@vYBRT}kqt|~0wWxc>0t(?<nTTY<9qXuKjMR~v
zMzSaTx?0pOq8vu2KO^^SUsfUNifq)0@7`B2TddN|@?_p=4BlN35!!nbahgu}^;G)o
zwTD7=tMIC8VU&i{GZ@bqjwS^}gDZ=m=8J>DNP^Z-a#n@J4uKfCC4|@$krPWhMzOdX
z)g{##FF)?BWv$3n)Sp^AY)YEGc%jcqnBlN|Jkzxwa8${!e)t{cF*uJnR4o1?_~HM>
zWQ{)^AAVG&ISe1W6V%Wn+fIA}xCHNf583&zTXo9Yod`gZsG@3_g0d(g_|7HM@u$}>
zeSj-rXm;Dr=*S(l#rVr+TTL)cn(Fe@ESS33G-et`*Amh*n5EPTuUTaryg_Aj#c|Z^
z6<l5LTpRoOYsPL?^Q+@d84G>Na?QH%{Lfm0dwNpdn5C*EcBH`$@6K$>v(I}qm_wxx
zcfRK$c4iWrwJ^i-2x-!GVLR)3@5k@yAl&LLnA*OaX3KafNWpV6{Y<)lB6Zd0SW@v_
z4W8Nw)1#t7(Y;6U;ujIWCz;ewfkOK1%ZRzB1Ni6qZLZU7|Ik}*;};y8rf^;?iXQQ3
z;&0Kc-XxXt<e@b1OpP6PE?lykmodx8GxO^`OkgD36lu{Dn;&GJic2LaQ!-3YHrm_C
zvY9G-vfQkKco=bZowD_ZH9TCvN+7y{WLRRutjU+;i`pIVR2h5DTa9E{&tc?2ak&%2
zK5olgM-_Wg%lbf8C^pp`>G69h6+6nBKkAn29$W0LR9v^UO1Qj2ps4)ej*g-GG&dER
zVBu)Sv}d^J*?IGtp$t%LS1Imsqh?UtTcM|Mpxg?CU;bYwAaQ6G`G9T!K;bC~Sk11l
z%$CmEt&p+pIa+^RfEA;7M0U{>(Zm57&I>&{))h+;A4v0gCqqS-Xl)QzfuLiSa6HzY
zCfn)jeuCa~5>{f12}|O&^IlE$m5;}AMN@&@NVmuIWwsv)H*M{5X43Na{_t2Yi%koT
ziL+xnXZ!#HeOGbyzdjMJ(^(=gpR?O$By85noEG0^f@!H-bkSL=T~<ZJgF6SKf#Pf%
zoqc;dSVMz7kQ3AZ8eJC-I7y)bq6HqZZxW^dYJSsmmC!~!(eCva$RT051&H2UXZe%^
zlV9;{+k0uP)%(MGcD)#^YvMJpI^qNYtLR7EU`{LxBb+t$1GTi8?01>7K(|}idCWcC
za;U&Drz1+Lj_q~fs%jVq9v;QKg>2}Kl(N{~)0APa5i#e9wDGCVBk`$dApOOBIU*~5
z-u<*NzldNYcG@E1EL=s*JvL~6QE_MaAau`()vQ&dSJO@;k5Uk~InDoHHYfH0!?x|m
zwh+4M84DgB7AEeJa8WLOw@C)7tpPVft{Utz2PKIp%j{Kzy(*8gQ0`QN^j`jOtB3Pw
zm_1F42oy1$&@OS>A9y%5!2AQnrgVwNM|tb60se_*7qk2jxW#nZB_b%;X}!gj(tdTD
z<s;06HLD?J1<K(E8<Wn8K4lBqaXY(Jt9|x7;kS&N+?x8{sY+i%uuZP6(on4y-FgGe
znoN|#A$tV>T(?cy?JZKuishe&nY)PvRr~HkH7Mo7%4cu33?1hyip{VFR_d(|zYqm6
zUHW&1O|6~6KS^JU;?&H!-go|-rK9vq>NVd0Z;Jf&c4Oz*7hI40Zs6<two?&bc~$VB
z?wf))8PS*<a*D5Yf<<vEYqD#LxqWNchPPs_T7CL`CM?R0{#AWyOlX}}ilft#ZIOz^
zs1XU`UQ9gBlLTmBss5hk&1ZV@%p-5ONtNA&DnVkj`@d5rAEUqj^cUQgNOIYXfAP_`
zZILwZ%aV%Ud#fsS#6v2wpmCJ?ZJv!ZjCpUXrD8r*f{uk!U+waI_MWvt+A?E}$s$&w
zCB;iAwk(Mu*9z5<ZiVhJNs_%-V!ap0E7vAOX*l1nLOCj^W0V`MX@VLbDw^CvweE5c
zMBB)QM&{a7^GUth%Lsg{7k=+n7ttXXJH!MDclbYNmZGM_YZ!M5-?3(Y-<~Ou%P?n3
z`CBw7Te0owU9%<8ikaP`SNE>xx<P?a4r^e^|14l!{=Hv45qTZ*{`S<*GSG{E9+x+p
zibjs{*wkRd5j&sPl_L%JF!O~f2kX34FDEJv*T3g>N!$oVnorrNbmE^?n*UtScHT1o
zA|35lMI`3gc|mgj0Ix#C&XVtt@Y2_LyP+plR{6pl_zD2Dj=FbG>NI&4JIo&GMIQsk
z&ia|tyQF;R>8@`s3`DafyGkv2tUM?b1yVwAglyWZx10-RP9#t6&^b3~*EQ&2qCf{%
zFV+mA=D7zfk~bLwEZvogLYzNp9%1J8n`_;cc~DM+t?O2#V!IFD(2HgqG1~Rm$`Lp-
zl6vDqBp5MWhw*o)?I*nN^xxExNuZ95{<Dt!3S${e38;H0c(65phBtEDGiAYMAQs(3
zdRN~SJFE!g(3sf5_w7Kr4Dy3h>UgO#DY%vrlv1dNYjPnDdu5LFZ}}B$$g$p^^QO0?
zNL$yXVc49S^<nkomjW(eVA?8hGoi&wP@k2?>Z{bfeo|R?CQ6uNAk1l&Tf4<63BHAF
zkz~NNTXtYn_01g~e6764jN1BciPeG=z4(!i)QiBxVrDw(1C2J28}Vz%4JvSfkv@>C
zg|6+=EVq5Aus@hgw!7ywKfcV6op1%yRanI7GcM0s@7f0>37<XR&cS$a?pmVar(#y+
z?K$bS|GlsnKs7x_D?VwPrZjCWX8Kcs`X%wgBHK42mV~ZH*KK839AVyD94LQnhdS=M
z2IZB&5c-#Kv|bM-ypk^9M}VJ>cwc1LjL%t*47#>n^TBnCMLeTw`Ky+&(_oJtsiILL
zE%&IzV>Q{-jj>l48KBUIKhRSsG@Z0iBeo2s|EV1!R%ugT5>wl@>@_lU+jh-n%)34z
zJIA4rgX1cW%e*D<A4x#gys|6aRu_0LJnRgp+o0l`ZeK5uzcjQE!dWVY?lXRdsHsvc
zd(mI~f-6>`Ew(U>T%}6V^TW+<RDNophAoy3Io0C}!&XrGx6nCD{3<kSeZCPYRSug}
za!V*k9uwS>n0u^Z)c>q0#16F?o1RB~WpJU-iFCwXy|uX%0<A{3g!^nJ1H4kW#juMr
zg^}Kpx1j=M`WW;gnyXn~%e4t7V@9w)b2{<__Xd*r%OAKpDq6LbF|Y?+T&h}?<(|%I
zBWN{EEIoHMvwc!f?dhkR6Hu6ykaFNP!}FUGY`v{4BX5@MmVJ~Lm2-Hww-FZDDZwoj
z6_qmv>KGQA>djiLJNAcSsABL!zoMq%)j{#YUv%aNDN3gcf}hj(c<*+fI>op9;Jy?n
zkA7{aVN_3@1}x02%W2>587b{1d{>NVR&7ebbglI*|1`AAaN{*oe2j-m@jTQF5!w;8
zfVXc9(C|bTh&Z%9=B0r}-Y60~`Vcw&(a<f^(s?E9lO5>p+)x{0V~SnkQN`E%E&-Gk
zFwsej|872s^F`73KW9K>-(A5=C%$2@8!Eb2pL?ib|Bc#8KPpX;N0<vkIAAoYzeXyt
z6(qVnc*!evk6<)RQ{#e{zoh91h_HUK`pd*m!A&VrA$O}oEh}5zs#Q60$KQUIbK%<B
z(|cF$2iLDQHaNEm2U8R1>LeX>dsyCe>Th~G#i65(yi9z~l0T=9+j@7+L2>+a<{s0G
zy1|{s)R4P(4K!OBFU^OZ*-{%<R*z~#46yY~Fn&Z#%DQi7@6RUtn^Xo?Uen(&^!z5o
z_5eU_1cCOQndE~Dl93IhL*oY`j~0-Hv0n`KWo1PzgV;}q&UeYmm1O~vpSFXGl?UI2
zibq;lSGFZ`iWrPChK@(t{`|O<=|hcO@`yrq0ySGW7cX60afOLDhHd$xl8(xGn=15a
zm*446#<u8$ZJ0q*C^KAX`TDrYpwU(?CC=l3+0TlRwq3$nD^t=n9t@r-R|KGs`yWrh
zSzaB<%#`|eNt7H0W>1B8wwconPy;<_tHMhLjdxtIKH+OClU+Ma{p}x71u@DfxC(no
zw511Blm2$I35Qz=l$c)b!AfjD=Be1#LRe0T@XGh+XdXD;1~tWr9)L!4eG13;{k`jJ
ze*e05uoP@I6Hdg<7)EhAX>FYhd-)(8`IfCuJG`6usH&`;^eeH*v&U3?*3}=}XAlR}
z9wdW$09!Eesu7Jpd;Y3xZ&P|=<<e@VVc3z_cG~y`$h|LngRrYepLn@z^h~6pyFuC;
zYbB%#y{y4Li3jdHcqqQknuoR5#0F4Ue8GcJTRHlra%lp*76?v^mV3}hjqBAXn2Sv2
z)l}Noo5{PPFVh%!_51Z$#qvxG>_RZwS9;H=v*#&WeTgHdN>s<Mm!{Jv+0<@59Wt2=
zzTE1=wH?fGan0{fX~CmTn~^;#M@0DizUc0hz1>lRii_rkkmWBbw&uAnlhgfAY+{Eo
zyIe`6Bm6a_`>q>zg&Jh)`=^K7x?-0`ojCj7UY!C5H|$n}V|rU^oDE}(mCiAKJONa`
zx}Niqj05w32rV@IF1W{B26cbc{4t)Ml@~aYa}DD>-Zp?Km!}$X--x51>MP+L$Qdi1
zbV9Xa1P!cniOq|a<K30OS20R-EjlT-uhYg-5dGnOLRLEsJoxXnFCL^zM>#;cQ@oF0
z;F^tWC5cur>X{m!UZ6Relqo3+nTxVi5x>p8Jpc75PFN{K-25YNnA-22RP1=TbJakX
zL$;^r-L15BlX}3HM02C8AZ*vZb>U2iL{lyj-jT7kQj^PUdR@Cy#>lO6N4u307P^%n
z2|)XZO%tf<X-##2lpH~n=Bt<Ez<kSvO025OL5DMWQ2Uhw_D@f*a<#>9M?Ps7j|Hvx
zop0J=J1YjnWNB}deha?2(@c5p#QW|EAvQ{UB{dFYE7#XoGgI|7zM*S6I13Jz>5vNO
z4#Cxd+4gugmCAUbWY4W>-%-9D$<1e4UfXRd&AJx-DuYNZFyJaKu<cT@{OQ|R0f_Jn
z=E5g@()=s6Yf5-KAeIKk$|F)$ux5*QJtbj6hjBeV#SK>mO{H(UWQ02Vi*W<afTzp?
zUdswlKWAgFF!fGd?iCp$y>lXGPyeY$Im4EG<G;ZvE66~By7UaE8nCYl$Vz%B$!x3d
zIEuObbc*sYL$9FfvC~3v5+d2cw3b{p>E$j02<tO<tHgJHdfk>iyTSD~%w?`SbNW+L
z%BF5l_IDWl?(=M|%)^~nTDvI@!yOK`jo8z2wE8(A6bw**{REow8Q=laZc^vGFXOeS
zw(Mci%$Z4d88k#&x(8H5%wKOvR69)B@5^Qln&;txih%QyfPanyp6VLSywThRQMb*7
zWzwauHa{;$yl@Ipg?X@P8@g2izzb=iKzOhA?vzxvZn{Eth8w+8HQV5Dtuf(FSH5=4
zu=QD7{u~5p@CkW(4Ldn|VIi?Bf#9A)n9Lez!6tl}a!XL1BCXFTlcI~bgD5ry&0sJ6
z#{0sWmLCX}Xu<)cm>(Jem;*>Bal8NDs0txP$v>nkem|84*gdN@McZw#gQ+CZ<e_5q
zur8L8S1p%?X6tiJf)dC2V$g+OB`Yxl{aVOZ!iyc)so_Mzou-}bQOb0M9{)K?n2Wmg
zL6?VN65F+EX@SwSXqbc$P{G9$p`YNGziY?evmc+}5dC7uvQN-ZDkEzu7uzi6JoUw_
zrLhI!BC=H7>twgipPS0AW3hdaSxWag_!53jKjv&|@jp)p_6)7&CYq-r5+6v%hS0$y
zK+(l&pa~9$fKA6mcCD979LzBcJ#V<U@7S@whQ2Pe00^z(^)4YDl7%wo`mJB*@K7LX
zJprte?}JGAId4f9cO|>DL4C}K)huTEZSGML+WOf5^4qEh;fE!p+pncW6CguBaO{|x
z05BixM`M=zxC|d}{y$Z2)KlNuDbBSH2c*qJ*{FHq*6q2iTzm0Oh*k44aIJAaoGw4C
zolWwHpmqNxe&{M=lI(7pwU0e)s*yHN3w1Vh%jtX4C3K{)GlA~@9RAVJb?cKF$_JQ<
z&z)v}2xrhsgiMA5UyJ<JYV>bw$;PAoH>6|kS^&8HUFaW9JT|MBhkTe!uYda#^Pqqy
zv%HTxBj{DG^bCD2d~)d>Xpzj?z?5M)jde{E%KaFkpo=ZY(e_+?aAvxRn7n46f)Z4D
zZVrlB^g(Ic`@fDJfXbfDlC%I&7Cj7qQWm+Fh@zU1qWn|OT#iyh+wRyb(Dxq9P46mO
zOlq;5;etE*+^$dVkQU)v+Dn;g<U5?kqO;`)9^?jJCbY+W-d*+<--nO_?uI(V&Hmdt
z!#^px$IPq}`-6OIzl^1;;Uc9rY}hdu1LY>2T6aHvr_ByreDGwW9n}sI*?s9%^Z9nH
zp<@YXFVvS`f{{^9(s4J7`cJc6Fa|MF(N-?B^PsmKz#^|(su&WVD|9-6hNd_VD~XFr
zKNc@yMWk8Rpe*Wm1yaWP)xE%jdGN`0iZ0tBejNzDg=X;%HXl-LD)r}Tw`qJwIkhEW
z+kVE5udF3nRfmfn{`9)M_08t`FQfE2K;xcU^z9x6MC3OcliN?5*9%*cj<~6QmHQ`7
zPf`n_<T9ok`FI>AGE-_e&64f%HbnBY?`=*hi@|;zZ3m{U!H6kFfkB%v<@uk8JUOo5
z?QAC$Te?qVQ%;Q$rflS3P8g%8GDSla>}8i!dBrTF-k8UMdA52cJm1xv2jU>`gthKn
zhZJHl@sLdOe<a$QGFhAWt~e67MmUwlyc?CEd}r{{OV_HgJ#5r@!sN>%A8sL@em_^S
zHjFwT`l`G0YizI8#Vje#7BLmPd-<@W3lRZItH_H3Fy1HYP&!DouF@{}x=m|dv%^Y^
zdc!sDE~u<5F{_4{n`0)8i40v{F0`1bAr+5NEaV{@C8@+v&zEAfh*6Q+z%j|6h~0n^
z<}h?>i~Qt0$>l<nWlg%n=qGjENJ3I7PV9*G<!Dg@hanA-P%1&g&I4q>-MpWfLb*Xz
zTFyjt2jHJW?(RO6P|$$r=`wBoxJUGe@Yg=kc%Wb4C?c12=DW;(1@Wm%F2!TD?9TI|
zn9}iLt2au_5>zadl{yj*-OauLE|Q}z>}CHHlHYEB<_y-5|K_8%0>oN9eu{wc%nhNH
zBJ%2mp$ki3jV2EoSOIsM$d1uu_2!?qDE`8w2dE$zAAm808fs`nwz8xl2&3nk7Mjj=
ziUS9}Dd$KnRP0jY!_93=7*(J+<dQJ645<b;!^8enjVj5Y4K!-~2gfpo0;KB5!nhOi
z%v!x-gJ_B4ZnyN_B3FM7i|jhhVJD#-pr&@8^Hj~<7&0pyg-qDvlUK(@=T>k|$CNhu
z%bv2`G|QRv7yUV&Iy&(HE8v78q;}QBxb<$YSd|O9Wg-*AS(&ZzDz|Kodc>}2p8k?=
ziTzCHCd%b^_MS<NW8w}vp<<y@#ALgQ-j%*|+<pH2?Nk~ja9LQB!aE$%{T_$TdDrb(
z7d5ct5{N7!R7fe6_Mhum<nIz^sC>9Hq@=xTbL6vJ>*g4%$SchENjWEa$bP0(wJ8a+
z=W}?l+iZJgR{<3Mmvg#4@XHlAiZ2Eh%I!_JOt6f;9$#4v<B$Y`06bB12O$>kd#f~D
z+67UbO&>UR-BSa1zXtL?KKPJ&hJp0%#@+F9$Ki~ck(V7ZY6!zo{Hj=P*iy2U^@BLZ
zsm)KJ4^rP=+;=S`ag($Dx_Qm!Abig{Qh<tp=>-cuTwM4zBfy({FGS67;&|~P>geD)
zfylyc=jmCPUB3J75OR!hkG81%gL{2=55v3;8VFiIE+uH0yEVRNP_^6RosM6D+h}oR
z@LLdi*QW9BI?BIE9*YHZU@x#sZf}lO2b@N1tE`@(^M_sUp=_Ewmk|y~jBwc;Gj?1{
z!PjDsK>c8^YWHo`{j-(d(mMbc@|i{P*?a^`vE@*}FIEY}@3-hSP>atNN*pY5-JbIb
z-A3!dQTo@u?wQ&gU?so>@SQap8C@SRHpqufBzi3Zbnvi+{uj+(S0!4SQas~}4uT>>
z!<l!l#XZWP&%w@%)fxAc$O%%CVHbTd*;<zdGd|zb`2*VeGQX3pr<yfng@s;AG|Cy<
zD|f_h$yyY0ld~PL0<c!Oev2}tR%O5{`R;S3PxU#`IwiBsXJhqemEx^X{0c^0Vos4j
z_w!0dJ!7Adw?<$@z-^u+sXQEIU47%pYa+n>l5w4t2fByXY{5L4*B`NaPPP>`HS5g6
zl8qX`0iGP2Xykg^*ekS0#mtYYeaB5zwrlpjrPeiHH1gGC4nGJOTyvQaf~DnBs7ScH
zrX4B|MTDAm0%~wsrvT8+Yr}z|@)YGZ8E1hb3j<CUh;iv%7in1VEP9Y87G?qv-z%E}
zBQShb=DvxE^OauMtL;pJ$NUJUX=!|qXe%loQyi>?WJJCEN6N3R_MF4n0P$lT;&4dP
z^Vsy?O-vmlxF`DEu*epO!6_fvLEw{FRTAi0|GWoik9$LnH4a^-I>ipz4&$>cmN_vw
zsZBlekE~p#RvFjoQo9CovgEPhdp20)=GlXM=Y3vAwF1N~8QD~dWT%POYI<+z84C~-
zc=K>Qq?%*I`F{<(l9C?H4WVMpD&p&E@iRFqb3Nxfn-`L;g1G@mPcVv&6Fr(hYen4>
z`--i#>zr?jrZ##r-ux~&_^c$@m{V-;c}!(KKHC2=n_3%gf8^-+M#-jj|9*C}cgs_x
zFI|KdPtD51A!NrdGJOZ(<!gKNzbWW?%p|B@%@BX<;8<^I+MlZV#DO;dZS0d0yLXLx
z(P|m+Z1umIOGUmg!a*hZMQl^XY&&6#f9O=3tdU+!VK-5^kAL-btoX`(0sknBh*KE4
zp!U&1zfw?!;WZejUb&_;I0+$6!!9n;juP@h1<@-w-S|JXp^&yJ>>|+qzc9clv=ckZ
z$g#q^&TEJ7RHiUk@rQ9w?=+`F?CaN5QeJ)!ry^xLae8m7;@3`VQR6k)8kj#~4IE+?
zOOQ+Oh0NvZqi|6{hqxdrkul!$rW=!m%4cem0$amhRG<;0ZG2sb1uIu{|F`svr%Gii
zpshX6TV*KgDcWkmsu=}-OZ_SgN`*wYPR5pL<zPEyI$e7_A{3-55RbW^xyI6ov?4mi
zG!yu()L!TboMkqsk{<Dp5PB1dL4mHc$L%P&#{wai&(8QASE`%>{mr?RwC?F3{Lf2*
z5J)RW>lQ=r;e@EchAHxhGN&t%vnj>6CB54O$1KDoINm3WEww?)0{zfqVXG?5>;pOX
zjrje&fW+#xqY=P9jaNuRhnZCnS^A3}C5-Hh`&Y9%5JaJD6oOh4M+DHTAUVFr?(oW@
zk)?$#jW^hflmuTh>A}_;wu!AJC(o}P`lqCerjd9`>;u>iP~R?OeUV(zO-O(t9IS$7
zU=TC|q<h_{u2|}oIh*U`ZpXMB?f*E6uHD{A@rr3_R;dkBEUfLfnDtHFQ$W<#q$^{F
zUCL;Fbb=a&M$lmU2TfTNRKplYQpY>zBnodX3wZ@9`|1{YdJGj!yHaJ6AopZaYT24M
z;!FHO8>v={zr2A4DMV<YW{6r2k84!Swchu=-Ec*$D-$!tfT8;#6*$yV_S3JpTlO&z
z59}-3llk>>H1Z)vfQP311qc6&K6#Y5Co?y-z?DmYDLkEYqcVZqn|=2ppQN7(IF4vc
z%(y>-8&w9M2%1k>8ZxafjI0)>DI1X#7&NMhddg-oHB3Xe)9V)c$DyUHm+4*@z(PSo
zkjGJ6syBo`0KRxrt-gB)U?`v?7M^9eT?Mz<$J6M;P-3L~_Fd963elXqTHKp&3LkX%
z^#HUGI+BU(KYrT6Y-P7+*)yAGC-=`Pir!Pb%;o3Ux+oJ^rX3`ZV3lU^_O)lV*!H`~
znjeL=4j(t>YTFWo9yRJFt$;aIK+G5x9`dhf@ZOVatdw_tdNM4<Z5sPvu^r<vxH=|D
z6wK-NyH1_6-*aC!ePZ?(BiZpB(s^Qu4vkaZ>^s5dZX!i|YuD#oeyNVVj=EO0d|eyn
z<S9d!Fe%Bva)Oma-Q)<me%k$FEo%g&X}d7Rv8F@7lu~f!U%kE_nv=2WT|36&;~LF#
z9}_of8tu)IceNaZicTjDfQ&URQ)Q)_m-$E4IbTRxwj^s_cRy;+v|2teQZh>1a8fW}
zojNd4^LVtvwo3Wj&=^>2z{Fi3p|x8WihboD*!#LAV4}^|j_p_g6C+~2m30GDGTRqA
z3-c_3CS#QToP!xcp5cc^O#X|MS6&*Z{40k}7E1l<iZp|y(QZ(@-LMb~y-AnQ0sc@0
z+Q~crd!pD@n)h02qGvT!4}e0!u=?#&oo~=Uz`zq6OVf$pc^7*-UcjSrWARJkhgXYa
z(E)e})$DDdSMngjGJ2=QH(!1iF`mUPf8_DY)@5z})7bAZ_Z<MkX&nRz-)ZueQ~*nl
zddz-<32&R)U5U(~^Q?sel;9ry$F}bu$IG0FWDGm&ZSK_(=ChkL)i2sY3=a`n_<3XN
zGZ4<*fQSe=Dcl^!qaFMenrJVQIjOr~b-!PxQ4rmKU&knyd_(={15Xm%oY%)1A*^7K
z%6p3i1fBW!O^csF^x;_O)eHL}1E!eH_Wef;C9&w_JSQ-2qH_sS2U4x=TNrjUkYZS9
z;FjUv4K=*$5?H{v4u<`>SLaMQ<(azHby|!FDidf!O7Xn2E<FZK>&UG+spX_*Wdq?B
zWrK-ZG!Hbkdqexc%CjpTo%6m2mdMe^r#*6jn?$VskCTZ1IKLAbu{!0A2dyE0?|2Q6
znf(8s4*ctmK%-3n@yE^8o!fBewSvqr`cH^hP5CMz#7RE-6W0CfpPY<wrRzVXJ)SQ6
zs}Vn<#f@=29`h}W0aGd=_Q4d8V&{KjwC<m*8W`omE%kUP?Psr2IRp`F{E4Y52<hNf
zD(QXsWZdyDe{upVN87!(ee_>l@wKGwB~YyC8oS`=cKF>+el5sb|2O8+{%V+Dq6=Co
zZlX(4MQ{}NejI<!3Qn6Guk@_K$*kaC{^ZXAqE?n4QvV8*f0u#=h=NbVi4%8`kD-aS
z|Baz8n|fVEXz;NfnnXQ?2Q3vh4uvN+>OceJc9Q8Qlc%{+k>7DEg{%=bX!qAYIT_*P
zi2Va+j(-o9R|ugIPJY}0f?qBTDkuIvl_#F58u03CrS=rgCO_hUhFoo#wC~{P_~G<=
zxXO2=#vc|W_~5mTlmN7t_n@-$A}$0goPsqt9zVb$0awGr|3|_YYC>;J>3oUFbU^eW
zMUnOT54Exvnh^I4t>Avj>)l)s`PM{q%XBq$%5{vrYKr-`6I#X3(9%Pn;Shw29lo@)
zILm7WO7F;cQa#+pF?ivrV)=LU9{1n@l;_XEw7=#Gh98it5#4~k_2#p-017UX!#6C~
zvY!Sm2^;^Q)q%TLc(L5E>XCoZm$d{)U#JN7o+Ez@PO@*06KYz14v5%v^Iq9Q*Joxc
z{Lvl+cg3N<*asElnwk80$ZZ+I;z7*gqlX_)Umk**(qgT=DD5nO{QjK6g#PT$jgbt3
z#)HXl-v2|&NW@}GU#D_|{z&0@UzT@Ywm}<=?f3xWZnmOVEo$+6X368-VBlK;Ob6_u
zqm#ZNHMXdJZ9|V<19GR96h>~`8%rLa5Hol@bGSqPuClOYyguUUC2%Cu$?W0Z=)7Cd
z%!G^)<hIcMRPUUB_U(<#Ve}(}rvb=qV*lJ9$-d=j)n(X5*G(~BD2nXhfA-`Jbv@!d
zy3lh5+Ldm$OPg*keS4G#d=E)+VMW~g>qr~fpw?lTEa^Yq{2w3TtP12~?;syDr^Sc2
zFvBhSUiJnEzV9rZIP3N43G|2F=NN7p&(L;rELpzSy<_JdoJ55i3-wb3oz>UbkYs3p
zlKl!uz4wIFH^?DF`F$C@GjZUJ|A8$`G8AdjWFGKy{Z@EBmiGmm4a@&2hyrI}?^wOT
zosO-rUh?Hhw1CYG&0N`8@sPszGiB0+(5sk$1w?XlEZ`)uk}kj!S`|YMa4*TAhvx^*
z>@7>ra|Nn(rbZ{+5B_!YPvN&hHCF!flh2+%EOD~`9j=NE1e@uGHNtR(<1Hj(EqeL;
zX}pMy_jtoU_FuIH2tn*v=Ln%sbbL_7k88(fNCS#z>*}mySFIptzXFS_dX|orG}22T
zX2Jc*pC)*`5n!qZ6j6z|UC_segOfxeT-LAd;^!i>csdg9tN}R-WH6Er#1B)1z&U7o
zOU^}7KCS>jGVl`Pqyn10PW%I$1BiepFSQRI5B1vtgs~-<vh3JHo$>r8EbPkjHm(s_
zD)N1TChGrT2FL&OriJ{$xdh6*!9dB|-!}?QmuD!mK(>Z+_Tzr#BNOoronj5suK3uO
z&5ntJF+efQ8YT1OER5W*M3Nr*_EXAWS48->aKG+70>EgyNf}(izSNuqrjrsz^0{gV
z@lZVv+5bCeQ4WF@M{!|dlBr0Oz^f~X7n}{;ombxXQq?l?^7nz4xasP5*S)EDTrtJq
z;GjxJi?-p5$N&>qnfi7@b27CsH0!~@4Zel$|LN=81EI{`IBuq4N49n%w6aCzk~CdR
zq0-LUlu)_nKHA(e<F;;<Rfbmk)1sEdh}1^bZL~C$Vp6&gOOnwnr3+TkT_Nmq=AC|K
z-c9}0JD2D3Ip6b~^Lo!YLt|laV85xc*#K*xH2TS5PI<i7c>+5iEhqm|TSNAuIMhVt
zIz&-WK(}P9lsy(d<0<S=2#+<x9?EMhAgNGY^h0~8=6#7Xe{Cix+PJ@1Wn*ISMgcXK
zKXi#ZZo1eh11|tX?as}XSO6Tl<_PCbnim6>kw!V*L7iDz5_Ao8+u!fg03+>fBRE3r
z%HMkwyt-@aI7^)iexWh{OtR;CG+Kza0~1MbIG$#!Z&SofR=96}Tj9bPbMG+RDJ|;N
z+NX5l15pn#hh6oXiM4tnPY0lpl-Ag)i5#;R5#ikJ->h!#Qf3Eit;~m$B_u1iNP2n*
zM*xOHNl@Z+))rPFKiXaN=15zSvmLD3?)zA?>vfig-gSdj$NN7d+5cgS{uZzZmNmR>
zIK{c#zTxey=4Hq_c7(B0oT$LOfUaBXYjFr;W1e#uepyTFe6eO}<45(P7$zB+qnW{l
zo9L#47D#mUKI_+_I2<+jQ{#wb)`fGqHdoGlfJGGO3)Xu`J(W>!eu(7Gq%y0b!rUXd
z)Kpo9ovv@fJ{ToJ(9Ha4#`QoHk}_=2w+ksURzw}TQc+h94h{}I$md;rEci;wJr>Cc
zc+7c@FNz_F==$U&(N+0d*<+>|d)EnkUm@oSiF|RJ$@~0K>L|<mnFoLE82Gh?0pg^>
zP#R*~Dv$@(Ij=w)ddVi6(9DUVO00X#tPgF1#s3G@M)3^+pEyj1>|L<BwVhqOGQ;?3
zkm1<-m5n0`N6@wdq$GPIw!MuZJgC#$qQ-Uaj+TEK^ZyOw>|i9tZu2D=?raz{P3H1M
zj_5|DgqHTl7VzYz<ZAv`pU}Z#q=Oll4pfj1Onn+TIt|<Pw|Q=d(^^y)pRERAE<Jf1
zE8$KCNSWOW4lN6gn>W7Mi2l~UEjQ$moNcj7cUSVuRq|(2MISu65!mnQGhU9^3*g}0
zt3CERb<u^zLhD=A+S~KVtWd3u(f<*q3@nd?NpE1OsA!e(9nb5#R=f4w%4S%2EpgbO
zwmN?qtdMN+*B2#Q8c)`DD|ZUBSUX&Eby|KUuVoE$GfXU$3}-)3tIm_zrsj?gT1b$o
zj_>81x{$L%4yMl^Z`!r9;M9$T1iCsb`Ox{29Y8J5SNH@W3q&XpBcv+Oo0~{A>U};;
z{qf;S_bpB^xuG)KxJ#g>TIl-9ie&W)R?EQbqQ>)xzH8bXGdI^_=dyU3OH^@el3S+L
z7mO6E1EQUlOlT>eRXekpj%6BOfMX5xLn&>vm+16N)Q>3I?8;#ds{^`C+U&RZdV(r|
zB@)hM>|TAq|0i*2b#|xRaELS&?hW^cQ-0t<j2!PUR<l_0MbOdT{LZhfv-H|CeMd3R
zt|BnNxvJZxW3_YeTi65;S>FduX6*@TUI5QOs{H<;!euaAzURck6?zk0d7oHG;&~gK
zLI<MYnR%nT7Dv&jW9FGjwvpw9_AU*(=%^h?F50yr2?pGRytYDz&{-;l7HtK;1Wx<q
z2Abd<R-E|LHmypxTP-&Nc7fV%EL>&pP+)&Fe&T*t=g{iJ4LfAQ?M!pr2MpKqCngSB
z?l_ql5oKp$8laS*WXQYjs}&aXP0g+2XKDBPH9tgOQV{ew6}EY__SbV%3B+EN(sp%~
zigtD0OL+p3G(r|IXEHmOGllOD$PkFpq-U$5%lBn1@f>Y1-4p|_kjNAbI`$v+#fPl}
z+_TqTzIW$3ql-0vJY(>BP~h0B;npMDn7x0F2)h|U)!~MQ_k|g$8SpL7T4H<q{HmG~
zZp8i_J8G|}hxrY0zBBIp70hy{3z!~SKN69H<GP+)<5|s5kgFF3e8qR1?{$g1gI?-7
zV#gmN7<bY*dGCTobnLl5;C<t#b5(<?qo4QBHU1z9^@@U<dvsq3cl}`Xte@Uj{q-nm
zh_k0C#YRzMIfD?jrD9ZW&jiEZex%@rJSDw4=F&9}gRzP`WVon`xzzJy`gB1xEd)`J
z$eGe7N;(aawkHVNZ5sN7@Al6h-}747`EAJfh;kEx!~UL_**FU4>PK#$|7}=dTYvMe
zLu&)M&VT=wxtu@@g7i9)ncR-&4|TzI(yY?<XWPr#pGAhGg0Jh)0Q<Pwo}*FoPbhvQ
zElzm91_00EAmAf)?;@%O#)n7VFD+)Q-#-$!cG<hsS0gW9N4#5V{kAwRQV7R<Rh1+~
zzH10y5egZsn^oBt(cRH-$f4qb+d%cnh)et01G>0B`=6i>OkDOTyI*G``c!HAy6(Qw
zxJ!B5^w;tfr_(^<w0A}O@vFT*z}UM0T4ryqEGs!LR8yLZ28DgV|7q_V`MY^{msQEK
z7Utojm!N3nOy@_`7w%+9yoLm#O_XoD8{Denl&R;rHl>bcC52v!274?2t|d+n<m37P
zs8bgcgpNTK0T-jh=lK~V66-J0zzXRQa=al8X3{@OMO&0h1BPcTH=HsAx+{^$3n)I*
z@llRg&tTh-6bp(Ep4nEq+JPUDn)}jvN((aVg%CtCJrwo4$$kZ@w+CUbK@ANeJL9u&
zfkfaqJ*Jn$#0-SBU%MgseR>R^g`yycqgdUrD@V$Kq&;?>0$D&ESC)}{5dzw(YM##<
zOvQp|&FW<1JWDjkgLQzSH)LqGbQ;a&bklRIZX!)g7pxwep019|bJAnZVgf;!m)7cq
zOT!2$qE)PjrhB{frnC@4-w!6neM%(a64j|}`9=1w2Qd?)Up6LB34%aOQKpn;J-a<;
zj<lEbWR%B4ERQB%lSI@}KW(No41&n5A@ppME|zi>fEjocgGtEgjGfW~{eeEf^xZK;
zk#^C{LqRlPLGZ?ArhhY44D=i=2qMj~)eQ&J9Kn1fhI#wpZv81O#L$DlM3)!!KQI*l
z=5;Ylx5mFdO+nPIb_iyF{Tvu%BtMmY1m*Eq4Abws8Aqo?Q5p<E{9GfGhl3f9U=E65
zYM$<lo6-XPfjUyA_0X46F=#Ybq97W@${bfrpC=upMA|u;5JbF6t33{;6N33#4D)XP
zZt9d4V(1JoQT;;`e*E$v1I+oSMU`SmHglRJCW#1;l9Uk4zS=n|(q7V2P#!&En7hmp
zKLe8mL3nd(I+UbLv%f=yA~P2&R}_Ck&B;zFEnzanC=P1P*N07T;w`5_)onDus%~+O
zY!7~-Fj*k|HqrUKtaCIa>E>9@L21NbX(aL1&9lP0o{YKK4ov8zx5`giMQ^f?q4v<h
z3U~BBJ!EN6li!EhNRuV8&YY)iG?Vt?qXl`)ScBzJ=3*PCH6;pt7Z|`=8iHO)H<{-g
zGzbP_L40%Vp1ZVWq-5IVLFW$*B%0vLDs34Av4w^O(O4s=Z7v<8ghjuNKq4cTHVX$c
z8^Mef!>m}J{W+N1z{H7TWq6n-2<9d%kIreml+VCi1Tb~Z>&xL__8^#vVwkU8?0)|Y
zOf(y~Sr{~kgQ<aFMu=gOg#i+&OExE>+T{i?8~<m5V^xk|Hi}^m)O_Ld8JK23;^<M@
zS2&ob5X=K&n3eQ-TW~HURM>0@CRC55;9*81n7(3|I=#5TMKTrsY^2Oey=xn!z4&M&
zWv<0UF{T2C1b?_V5EwKe96K-U3KwD%y|KY3EC`;qB)BEKu&to#qEmQbgF}T!jc}~v
zBI9|I;o9eHZ6EH}<l8{f&z0{HdVAy^bL+#<6$GLsOhS*B-yY(mymzyT;oHKre-rmj
dIzc!=_<c#k`ljCc5E=Nl*=*~E5>wCEe*rY6n}7fS

literal 0
HcmV?d00001

diff --git a/docs/assets/deployment/hf-inference-endpoints-click-deploy-button.png b/docs/assets/deployment/hf-inference-endpoints-click-deploy-button.png
new file mode 100644
index 0000000000000000000000000000000000000000..687db6e03212fbe1e7a0125221f9345a88eaa28a
GIT binary patch
literal 833513
zcmce;2Ut_t)&>kxr3hA}_o{&O5~?6bM^HLMlq$V<f}o&)AVqqWCLO6#1JZl10fN#?
z=!6oI{DHYMckayp{r@-L%yU_Z+1cmpbCSLC?)AQFo#T5=bwyGlDk3Z_EK;S%@>*C}
z#JE^kctwQxm>%xD96Bs45>;zCIZY)wIR;H<2McRkb1baK??34h=xKM~Ni)=9#3huM
zQC?FckGdhFOvoK@$n;M6@s&3>UOv?PniWP=Vk}?wxsV~0mi()!?w$5+gFD1r_cmX&
zlr&t$cAeI35`l_%pb&$JpaC(Dm3aWx5ad+L`dYzNnGzO_J2$rmsp4b%nB1=L4-w2X
zQ|j&FIdigeanUsM51|?x>aUWU`}E7^9}S|=29<A^YO%0bh<*xY8hs?*lf~L)d;K(y
z0P6{n*FnCQ7OM&A*9a1ELZ?qREWbF$+{nw{{UnwA?JiH71{Oo%!D%@OmS7#@U=M|v
z46S(h9Z{t>FRr%vlOvW^)bBi$pm;%Tg|nJ{?`Yaudd=)yO~6hwW^nLsTY=sgk(kW=
z_?6u}bo%-UlvPBL??H%A(MDqV$Ghfz4;(bg*+V$Linr0TSYMAKx4{Yc`NA~4@rHoF
zZN@z=pD_i7)$b|TY;7->#J)E8ODS}b5e7|>|8!MSm-hs#nbwIuw#GRKiF<$G=|sLM
zYs4B&&;f^}d{m2|OgOfv3-4WDO+PUAlj1l6bCxfParvnNwA(f(J86jd7jH1;KBW1`
ztNt!P59cSLm%FVVSWQ`$P2@$hLhidK9WSuIs<K>#>#o1dSuf8>@JFQ9?!TV;dNc8b
ziM(`EQamNa=bqbe`R1Ji`i?-iFqV`PY}zPaqZ66?51+_naJi@4k8bNM@HEm$TBXmT
z3WF%Qd_IFYfu5+BMT-Q9s;AKd9tca5@u+{2GGXZt3)Mb-A8)xQm-Q62;3F%#5Qx=$
zg-CC-+3X`;Te0zx@vi##P23Y1eEtAJ(L(_o<{JoamR%}hqULn+_W{0+DIj1e;gTF`
zlU%3!J%QNxICl2&G3T@L7VUQ~vUj^)ABRe@c4rV=UASu2hTeTgR*2Q{5vQ;m4L!iw
z@(9LB-1S%Bd%zqf^<0UB1)p5*ovgg!EY@*L<F2FUQP4Q0<su!9lWz^X1Z(AWy6g7j
zGgm#>-V>Y4HP8^xWcq7@{73xz$n5cijGaKU)CF?pDetMV2xjpHT3h^n^p$*Eh9ipm
zh-}`$p-d+~t{y?2q;PPU-))b4A>f)FoEp5D5z0R)y`s2mGxNNuHb_!#brto|kI}X@
z*x*H28P1g07K=N!&G!v#VnBq@bMC1ptaL_B8fQAQ&9;1gC^Na#Oq&%%%rgtE?Wc=l
z>xYlV<Jptq@@B(lyGPdfofItS!f?QMneJ#XInuN^yF0t%$($meG|tb<AN%Q&Tl9L^
zqjs=7>33i-$^BGf$!pD09w*A8=cyH@tr}reSgT~jx5|BQhuq`EJz2?Uoy#K&e=Sz_
zdQTKbWC8D7hJg?-is2f|>-R$l)o%ml&$$w=uDoW_yb>2AltE*A#ZdP46e&E&dk9xO
zuwvoHw=4Dm^^Qlb0Tdb34LIr7aTyr}-@IO9W_!o_B2tvuwvFJb{P(E4ELW8t@snTu
zEMviR5Ou?hRV%_)wjj!{%XEpw8QWTJn}IA!eMxBlYP+V}Qv#uf#Y0gX)XN#BRy5++
z{W5tOcxzW&ISqn!KGzS4AF_B~ZG2sw#XCet^8D4^n*!}L4}?3~nZBCcr;RbK`1+#g
zR$<$#uL>tArKT`F3ix&QpCl=70nN8*0y`J4_!3D`0|Vn1pLx>yQ-On}+v@imaH(28
zKG)b~*(F>gq<oYAhUp=vDc}eB50Y6G+BY8ZOi@aeY;~=T3G#hR0}MQj_6*yMX$;lZ
z>2LZxW{H;SPFqq7W!Y2m%4Ql7AK@8s8hNHgu#Thu!S<m$8$nb|_YG&p+SrB|-*Deg
z=i%pxpOwC5dulOpKJ0Pr;qMVvW?tsc3EEFAcvO|^t-bg~f6Qx){}uNU$r0Vrhoq#W
z#H0{|$|OCz5`)AUld6MPWaCl=HieLUmvQZ}+Z!t59$(Tm!C9zag)IHybF1!3i5V>e
zA=oV#HY^BVuJuV!9^+U-)|1R9c}~w3SyLa@WV@{0T*o`qI>SCQ_l{?KG^!j^*gct2
zte@$ncMxY0c}LDBRwrAhWa36~ssTl1noUe)aV1XG+Zp1@npf!<STx^VA>om0P8gi(
z5N%x>V%*T%+;uH?Rd#jXtlV(je6?A(#<r$DT0A6K02ydY&{3rm2&oOPP4|j9wN4m*
zFz{fwtiAPBh%qhP#Nk_7dfMYsJ%`A7(ngK5`$!q2E%Nr+(b+MnBMu<QDkvYHnsnf<
zE9oTVwvf?-2G0}J4>0BDVE16YU;&aEs_MJ&yOh*;)Jh*FC{y`2_${aql$MmG!crEq
z*54oO@m)_Y5*D-HCs2uRH(f64(aY1H%MH$D%q1G-&MnSO?=R~A*-z9DPnZ+QORDG}
z?bl5fN%k;I&<n3huzvD#FPXJH+Ah($c49we+2@{3p?u+6og<yW;-ez33A_oRiDO$U
z;U-~iTQ0j2$PK&c>gj4~+tR5__Y(I+_uKCAuqQquK3|dei0bQauG2BIFmox+I%|3?
zh%N!fL?v9!#Df8M#3ukvG}e6lUQ3}-s|x-u&Tc(UGb^qhvG6ZLPu^xxDK@%SyWA1g
z6$R3(QPT=~53B_bml|yu%kxkh+t>3Ob=L8?+PNb)R<_w(3f(qcYaBJ)fII$S#jO!9
zcumuf89YyX`u42$PuA8~5?5=X2fVxlrM9K1CWD=Nk=H*=3$J{wNfd$lgn87H^|Fs!
zR%q0h=JP^pMvkM>Ytx4u>Y)M=-0Wc$VFx47Zr}>23oSVr0|@hB!XhTT#&OMxbnIF<
z*?lr!a<e<J*Pq@TqurvCU_Oy2WMsK-_Na?H?Yc&D;fh;GUC02DByBF;9cmpqIL9oH
z(VcnGJG9i|?&DKF*W<27zdL(O-W_Ii+e^Af{FU-pl+_E@r>>6<M-!g#3A`L==YPT8
zz8&sIu}WWaf7`x6t%0dY>~-45XwB4JDLw`#^B0J3QHvHI>SN75vZ%j$%*M*j;-Ilj
zNiXW(e-d$PGWK(9^35W4)nrH0&n;~!?-kjH+4tCKAG2n&<!-AYzeg_V?)!{*T5pcl
z;Tg3Uv=C>eJ64rxFL4`iddF?2Ht{39f;~D4!Ut5LeItE5e7Z(F{-16~S8;CoxtqZw
zw&qjXQY34aX2)h*Z`dhSFCCgKc8{{vD8X_bjlen6v?o;8<KA{x_g+86^^!}wc0TOz
zWQxOIOQP?%yR-}aK*)6CwY9-0%cwyvL=7l`)R)z4;T71W45aKAP_rCJK6SifIT1JA
zwN*LY@6xw=KVg(l#M6FUVxwWp3w%fXcFBETfV7kU;*~5s7YYd!=Sf}?(+4K~;o`R@
z#3J0^Dc)05@z6DT&i!;~|Nb+KRh>156&ObtXLRm0HfSz=%%cXJsq3?w?pSVHj$Rhg
zJt_HOkY82)e0lNNOWpBei((!Vq<eq15QVa_vPf}G$+IFmUSeJwJ<G55r**u`iOV8f
z=l9@6B1T|OB!cuisjkSGUD2FbWxm;H9tK}EHMkD>g_Q;O=agrYz(?!VZ|qk6P0?D7
zbI*Oc;iUi;z)azb0(ISbUELkQ+1euf;wNLS+se~!<{r)4!3H5S+&&3D%J9I(&_>Xf
z%AAJ_XbQE0vxQSdz)e;n-6s0fC}d2nbhBiz$id<9D=Pqv_qW>N!o8vEoy>qF)nu-S
z4LW1@aBtg|uk(v|oj&T1HC$8sL{GnYX&uaIFRB|$)B4pNsZJ#xSOyKGiFb;5oHrbw
z<`Sn-TmzZ`i@;0n`6caD%R{9lV7gasHpTT@{<S|sJ3n<)^VxNloS8^^aWBkFZ#Hbk
z+sn^d)l-5F;Ki|qu$s3u>Co=lgN>SVs1!8SC(^O>q-g~?LJ&;G1*$>%Y1A7chC{H)
z4C&gX>JWOnC+#;+V|Zza(?-(bqy)Tlkh7;=+LoHDpQJm`!+Q_Ue!A!mryGDuK-LHQ
z3qXHRm22eYwkNC4IKsP|8Yu#puWPW|e!t<h%X2)pdfZNbDE-vW3?y;Pxi?xds15$u
z6zf-ooH^m%f;7(0&YN%oJ9ZGan*;W(Vy-oB(qauoV?A$nVRmcS@SV~nA5W|%dyRhc
z%(AQLC%z2#d0ympAV{PJYpR|U>)sa)4Qz%`e3=vi8O2DtA{@)wCYQW&@*mUBUD_rq
zX9ag1LN`>;f}nDS8Bg7?<scyJyKjR44<3|6V&p}rxt@}Rni>`trcH>2i%o@vhiPGB
zo>JJ<zqJ*xIk0dp`>$YOg;--@<jLhe>X_GyzmJ&b#h71SaiW8<2r%z%V4j{CSAN}_
z7&imw*EU`eW*e5Qww#g@=2iQpv$?swi<N_G29CuMrsJyPV|^DatUIh1Pi!SEmR-#8
zr>vjqx$3E@iobNQ<1saJcwx@tY3F!x94rY>aZJ<B+|`u9)6Ul3Mch-8>2eQoO#7mn
zmx<wW7grleCOtJx1~~_3a|U6a2Rsj$q=*<87$ls{EX1|s75+6G^G=e<%GK3ToR`<b
z!-K~|fXBhvl9x|ROpNydKQBK&H)aoR7cYBPQ%`Pt7v^6M^6PQr&0StPTRXa1JJ>T^
z9M|-PgPW@)6Vt_se*637bDDcv|NBh#F8}&km@mkCv4xk9=K=3;$HokmxabwvwDvT&
z)t9%n!^|1x98!FOLi`e!1OBw>->3ZDP`!T-<rn3D@cW^^+w{kw&s@x%<s9rVCv}zj
zx5NH5`1c$CHBf^0;=BKDE`FKl%U;Y(OA$%%{^m6)BKCKq7>8rgSj%fX#k^vEW*2`~
zCNTeS{PK!v<1W%_f)V*xSTa~j^0H4ovA0qQQf{^12nhp>L<I#b2rzRn1%A%>lJJO+
zf$MIX)a{DT9QZ8Cx5#h1v=Lsxmwys?S5`^kR^Jsa1}?GAdR@tSNdN#)U*l5~zd#M*
zugzPPHU>`i>rBQL=$RkWeAN!-F@xMrt%#tj40$K}oNNjQ9w4cQw}34XKrlhIOY!5P
zvD?grMTY4rn+O11HUbEAust!Y*H!rEI2R4fHlpT>R*}#G{bgg}^)oCwOzU|uHkyG{
zg5%lOnQgJ0?AXv(KLb_P!D45;n`^Q@&2*Td+0q%(ZS>9mfN@+!$>e__X^GOaiPOZw
z`#TTifGa;pT7>=QBG$fcqQnq#%>L(fQ*MW{^a4yh)dc7ixGW;W?>W6c&y?E<7X1Q_
zZ<)mI;13+%0J7bdLA?5F7hM5laRex_i!N-bliKH#|JuCYEFE&u)l48wu_gY?W<9!-
z)yuAvh1Edg%gwh~=|2nLT3WHZtY!~SbUVzDlqb1@nX)p1t(IRM!VoBV>9ps!F>b=5
z)3eC{y}4*K;}l|Ddd>g`g?-V$Z2Qft7ykOASNHpa9D^4gt2%Q$OmzcTU`wjDNx@#j
zKW5QJ(zeL?WJnHS&g&Tfy0ACW0e{0ZQ_f$nUHHi5pYf4<1JS|Ix7)5V1Oomc?lOQ3
z+UEq0Sl61dMX?ALuxJ8s{?Z%Gb20K%Mo~Fth6+j3zM?Dw7~>1_OH@23`|U@6eGB{2
z55LVZlKFo#$CuOo+d(kM`RG9RMgUjwMU4xKqCi%;{ma_nAPoL6upy^f#3TE`DDfs_
zmz*w%uk?`MKP=<~=dW1%ApN@ma+>!-mRJ84C^R#0ImiddZ5NO1+RBZO2dC+&ek@J4
zmt>KhC0u`AEqSt9Nj5_O!$Iu2w3M_GT;L*T`8DWYSomk4lF4!Ui-Rctiw=sGyS`Bb
z;Uiu%WrACiRff>OJhuqxW^gbFxp3F{g)yIF{|$TnbBRpek}#qzsp8EQj)1@M(7bYs
z(2}rv@mWGhM{x#@c)}i_5@!Y*h6VVGQ1~5uUjH1tz$_&db|UQROAA^_E3)fBmn#vr
z&u=ULyFZ4HHTwTk_z3bnU`SyUy-}aaES5z1$&I@A16?J-7B*dT(9m68Pr`rUVkq1z
z2NOAdZ+|U{aQLHSTrq22k(kQgn(%-ttTL}1gP&8EIxxq<>OcdiAwqUAk2|g3P-i$+
z1*}Cn&u>V|ihe32o!FgLs`&yJ_sPy(ehC}@5L6y@hg>?SJK?|QpctA^P0P6meHpTw
zUo|ixV#%uWrQ+@oofX-oyB6p#><8Jx->_TkAO>+cN0x~c)>|^zf8+7`Muv>2Tp4ZY
zcL_mzJldg_aA+p&&^0T9DeS)*BL0nwTcB$g%nl3@cG+s&6}TWY@9yGaRs;+Xf_|kx
zvbcW;*)nLtUjp#&Bf<YKhr*&;N+!TClBg*dP4{r$mm-LsJ%$lHC&NVcHyxfWa=+rj
zqVFCO`#+2kh4mLqX77LiLpu~-^y@$TI}?t5ivybo6Wt)5e$-!WCy_4j5Czdwx38OP
zK~fgD33g;CF<20WL^VsD8<lPDVqf6mxz|Gazrw~p0~HQssY?ev?)dLHC}BzSjrgW}
z-xcqKcYc@<!KetJ0|bV^WiSZ2a2NW*2tinX!!krqafT@anZK^w&%`3i_#2N{EWGcO
zfiTb8E16FB)&j0soL_?lU`SN+wZBfCe#J$`iOU6MgB4^fe7+~>E0WE~wJ~5w>jh^j
zx^hWQZAh8^$f?d0J^vRVz)&NM$oTajCj`3;Pzg-5i)gc7eH>w-U_RI3jG=7UJ{Wq-
zAlN}n_x)eE5PWH}PPX<Rwnwo07c4Yg`hs@cuo<}Vw<bJ8=Bg$px=nR#Lf)CzZ>LvC
z3x4k|4Kr4xKjdR>w)NQ^w5GoxQScwX%7A8qUK}*dFJa@Kfr{Ldea1@%@&6Yc#1g_Z
zreE{&&QPoT)+i=Kh|TOxU6-gNz#!zpT_+c&_*Y2npZ9I={%2`!XW;{~4~DV?t`8PH
ztOzbhl>4v0@&ALqXivYutbpJZe#p&^K5_3MIwt(re^77aEf?zUcbsZS`uoK%{`YDc
z3nT9S0D{Y|-y~qObO6EWimWImY`Oy!odpHBHihG;F_dizM<ReAlg|VrDSp94Cgp)L
zNajE6-Ct66n&<zlmJ>FCD%^*-p;M5V*VX-vx5UpfA}O&gAVDB?jM^TODkJ;<RLp-5
zDxuM2mkx^N`|ml3P3%_YKpkyG03F+lbWDio8jk3USjfbv?MrtxOJCUczm*!{Q2%FX
zF2Llim(?thct#K<SPrAMhpv_3i2k2(!GWT|NYj+e>mR4n9#~9Z^e;Id;UDC65aAy<
z)oaxC{|yK(L(Oj*9g_#?5+TDxJLaztvFNPCC;ByCXMfE>5q{VUypY<Lxad#NJ;V7A
zllx1`?)A^re^$%woe95~E<vnrk$rI7-+VDSOyJi?_y9t8?t)R<LGagpe?7VMzlMrt
ztna0RqQd`s4&v+1By^jACEy)CxQ@Vt2)PJ%33psFjM|pLaEJwL)P-ID3#9hX1X#vt
z|DUC~dt7~Ti#kKtw0$SE7_}YX9zffS{eQ)U%--sSG$r{E&<B6R_djH3<^Ra34kIsr
z@t*$?3H}5E3^n@CWT0%57bdAg^L}n1il#rjr|!eD0@(}>920e9t->iJE>ln#Tv&B9
zjL;ALhyDCZ%I=o*Kda?FOx9fQb)S>A1X;a_0aDaQNUgn82$+U1q>p0Mb|u+X>pzo+
z{eOc>$mb=wO9z?#7agQ@?a`MC`_B6rA@8U1Fd@RZa`7v(=Y`t7bk{B!#v=a;sr~c5
zp)vm~&5h7CrK73|ytekdW9LF`SK@5_AE?u>8Qf6m3(Q(t;hO!0j5r4$@}<SPbF_Y4
zxS3g8TzI&uUyL<L;#E9%XFTU}R)9~4+0GOXpxPmZcG@sh2rSV1CDr0Z9>A+`3I0n3
zLAl_HKlnxc*=>uTJBu%1z&+o}5BtaUFAD~wr|x0c>+fXENd*R6v5tQ|t;<?3{a}Y*
zpjYSPh<VRVEE=!&{*jWR0Q`MhNVR@>js3_s!h_tJH6-nUXwUP!dgsEW`6rhZ4$Oz!
z(6!YCzX&<IEq?wEYIxeHZ|K~OLPVV%oQJkT6&oT~`~-Khyy(?H@)&!1xN~nkQbh+u
zlgjul8}(YP@t5QLxma?8>pB0G_}+pg{416_Lt9@UHLr5V?9@BPQoaa2xf=Gul20e&
zVUB@1Ot=JHb9b_Qtw2Xv`+H*e6lIc|NQJAu<@T5Yj%T&4L8<Wdfh}G6XW=$^N&TV#
z%aA2ApHb~wPgra3Uur3tsC$~3%HP016%a6%EbD3T+3lRM(xFoOTZ-V%992JN{+ynB
zly#ZS(J*E1xy-m}w$=Z-0^m;l?^b}vAIQvmbYe%6oW@ky2t5%KAIh11k}C$J0r6LG
zar5930s=jv)uw@-eU-)nXLfUSO^@eyJYj-{FxTW6>*^V64l<H+vUM4>B0Amx9fC}d
zP~LrMxfBB15n0E|NZms*!K%%wpnBjJS!cJY$F8k|*D&@1R%bRXa#S<eD;?snOWM@(
z#~M&(#zlU6%2#A0*(~s)=#u~qe0cMc08LQI-{cy;Os^GUU98WT`r8@7ud?};09`CM
zPzi^wB4x%7(x6^#2eq~7@nwJ7j87QFC|VU_nCt4rsohlW5`FVlgO}fzfQRL)cL8%$
z)uRvVnhNhswx+kFJN3Ul26ExSGN-CT5=dHh>-DN8`OW?O-(C~`p2oC-3;b~p^HIJL
z4S|NG7aZzVWYCW>c9-uLb-!;(c9Eh=IMl@D-xL<6mF#;*dXWK%eTj7$w=ZJJ(9)gH
z|B<xi5JQ?$_7iQH;SY4jaVJki-<~?4v$Hg2VG!NXm@qrK7ys<h_4prVMDrGb9z-qZ
z57nb?uksAN=sOXQ?R-wC-<pEX{d%D_tVcVLBIT--YYwAl%e$Ww_W7B!Tw{UP&#qwa
z++2gMLD!)w0|?x$+dl0kUv*I?KX-DX&yH`L2LkKG!I)(QP)c?}@IRDCGP3V|)UQj4
zEzD^7AZ|DPE$R6}G)g9>NE*9EiRkv~19pyY4}~mu;yzHxgZ)%em`5wbdelX}q;5~e
zr3G^0T^{v$o(=<>+^)J`4eRj=zkplWllJci_moSt#%TU@RtDqC)Y+afhEp_La0<`s
z{{yGc<QIGXD)rgd-~oO!$ckIJ9b(0`QRQ>WixMpCmQ#?7xpIi~fgQh%gB~Y9@Zh=Z
zVTi1|0r}+XMb?-_36V5viDoj5Hf#vg!2s<bD$V1~I#S31%Xeiwz1@C<%BMi;KbfJ2
zMZy&kt<nL%Rnpua{gU^jSeZ_XU-?s!tgQDS!zj_Y9AYnIzTESv+&T<@vYEh!mT8Ir
zmYD#-fm8G8Zau5wSb=>y8#Xb<+aChQacV#5!A$S8T1`(}zs>Aty{XgNW!Mj?g=F4w
z?hwV^13u$diT`A0DDp}Z8T?q*tE|&gf>(RsWgc~_ds4@Ks<Jj6QWB;9dWsjGL)0A4
zw5*~U{5(xDN-A=8E7Rz08Sv{PWGMHB?ruZq(ZSDCj>SFtU3yF+i3pQ>n4nq%|GQEV
zD*1~@7!p(OAfABTy?Xe7QWFzoLxvJ4F~S5xpB!~pOy4@|^V?267ek#aX1iMCx_K<`
zfKZ<l>3klV_`pc#@Ok_1wx$+?MT_*c*Zq%Ew*`)Q8c=7Rl*kRebJk}IKL|pU8YMTp
zmX*A{7MdCNk7gYXPXeu_r+ASRzPTVSj;33d=qU?=`EsYKt*-ev!5Fc!rF$|mj^1ge
z7Qy~M>jV9N8dl&s%$9wYIhQO=wXk%U3~k*sj+z8Opc=DeJ7i%Mph|(N!QT*ZNY9#q
z?(5<x^ndiMvvexk9}j8V(tv&~-GFXMU)i~OLIm_+14Y7BeR3raj)hR%C_57*1XEKO
z*u+7}V&B^3(#%nQmR}38-_BJ_7Vaqrqns!8F*$h-FQQmZZG~6kp;JfDUepA`)t!&k
z(H<IO-xh9ruIF4I+3#ZhX|h&Q@6(g)&_wGY4Nxw*;^%$*QH5vwt|yN4`AJsFXo=iH
zld;{RhIHR2t(-o3i+qi_y5m@<MWO-!GU!;kk`jPffLU&1%R~`1E=vWeP7WwY1<e@m
zc)(`d%AFQFQqdN*t+BVe?i;J)Tq}4CkFYEE8r_H;TzwN=i~+*BkN<K-fs%p+<#f4I
zu?1v4x+$<Kn*%Txked6<h)52T=zeW1^BS|_)i+DV9~#~VeqA^ZjV>WQQv6d6{Bio_
zl>uo}5oKk+Tp94-^2z{C&a<(S#(Mt^KatbDkR4V-fyOr-D)`di%wtIo^WIpuV*9uL
zbWI?zNfKp;lm~!JO4^wQp`wf+tRg@d!F*Re{Rze#7z}IdKS`tXZrL9LCXtV}`sd?Q
z6{W$3;!qX}le<^9eNLh}%?=azu-$2W{kPmc_gaF-`v*L(`T3`yKbXbxL&1b;{-{$5
zv5Gk_Y#7H8VrMEdh{nUVFoAe^X{k$1#A7-KR>QGX=rOqc9w!juLFl;+&_zU!OTtn9
zDe1=n3-v+_Cm;442-Xtnkn+cinFqw9{y`<_;r_#`?Hj%RF=UL{D!Jt+J@-mK#&Ji)
zHo|A*UQL#;>MvIqS=i5&KSJp@X(3ak%}~eC-ikpf-ol9@_raRwgsAcN=cB{}cD(E<
zQ#0Hmw8S7(tsXvEBkvC=J?d<{KwsM)=3F6Y<rpxQudP_1Q+$89_mf9qg<t12b`H-|
zaIbmy2zaTuW<IV4n)<~f{sh&B5_fwQW@_|#JttnVyGYFC&<er>lhE=HV~&jN<!NNG
z=Y#ekb<(`tagp&{w}$yX17)W?YRf;dR@i#2y0k&6uM5)EIBjPG2np4pLEPH8fw7#r
zPpTc}SRmCU8t<XkeQIVa4?ZH}?-?q=1XZdxEn8~}QWYY2^`uxvrCB!U#nM;h5DzFr
zizE>jrEkR_Rb;;`r3MK0nHp#b%o_!(cTFt90yFt7zXZLt1buanM#EbU7Ejx&@12l)
z0|Wh92rz}f`(()9*8?wVd2Ai+$qZ3$hmXr8pUxvB@->g;Id!x0&ElYvP;kT6RD)`D
z(Yb;!>L{}aG3Og-oF`b>xiS9AiebE1t3rV^uM2i2)^T;QvzMJ7bgSl^fZkh>3zB-1
z+*hOYTPFZ7FTZIjtB}omwE{^$lKtMuc^aMFfRC48-P%FAzoo6w^ZhOHL#EY=bJr<L
z)9PcVMUzi;Zkxf|#%P%5kM{k}9Z=mSE6o2(sZ<>c;@&FbYG$KuiJnr^xvxU@2i*I`
zMpeoNbUCkIdT~I3=qJ3Ayo!R-5(`{Rq*OwjyNIJnOI_g3sK8s27Hdxw>$9CoGeRCL
zBoV}4W#gdt9z8L_zx3Od*80eD?iZ{D89i^|q=4yFg$9P!VCmQ!(wz}r`bk2PW7=9M
zivH$^V1l>3eL0Pjg}S=<hhRkm+ByD>ohY+crYH+a*B#Bo2c|EUb^|tr0Ee2CfV1T;
zK5UhNfcT0*l__xJ0i0UB*|~XrAQz9ALMgf0GA|n>em45uKD~Y2J8J7?;gQN+$WKYC
z>YZ$&DXh#7R19sg(s=v=JyzAQSDCgD;V=g*je{5HC+>A~FY~Oqpp7m)S!m7$aQwjt
z$~xT?uS{c0fF4d6!<Ybnx&_g;;5@n~s8WWw9qB6pLYZhqd`^d?j$EYs<l1QdrRa_D
zb|d%VcPWfrGC;FOXPp;U=Ja`5;bLzJThL%gRp<#U^I_v?wndDI_0=m8A340caS2M#
ztHHK<;*S*T*h@6*5db6CuQcO7*S-+jj?x>~&G{EDQsbwh7lKd$3(xp7fEwJb5ghMI
zH8j26A1<AoO9BtWN`Zs(ID+I&-cKRGvRx6crAz`hL#uFD$!DO>>Ha<np*`E2RJA#w
zlq_s_&>wI72y9&3IE5(Isx9}GLX2`y@0S*tG%6U-_!Zd?fY1;2b5?)i<BHh2a=?Vr
zQ8ESaB%|Qx=h!iCYo2mu$!(0z&H40-(q@0UhS-yaey;|ikMtvV(zEv)l4)n;)4VtM
z@(ps7H%RaMb|h8V<ZQw`x(_w_u_9-Y=^pG2oJYq{>A^{2@nKwCdQZnuqf(H{D)rLY
zW=VI2+O!S2-nX{W&ZneEzeYi%9j>AFY;yKWpjxV7rG!qe9>o;;X{mv+MgNJYsj-^O
z?z-LJRf%+PBvCH9t3Xei-YeMF0Q}JHxaqXAIOues=rV-V<s901>9AI@BkRU;N$*uH
z%pxKg=J8K)Zhv>LGe;^<XQEqL1Amy758@z)rBmT*KA$CTEBN#jJndcI6)py*O`zVx
z4IN>Vhe{@3rY>n2bl@m`<LH5Z?t_zH^c@5$7_NfI0cC&!!0SHrL6W8#Q#aw2_fC>A
zS?ST^rj%%RY`j;3+g#76XEm)n>Q+`e&6gVx2X2kBa@#RP`nO;7cy0}cEXSvVLZ|J8
z+xp3AJO!zrWSnqnD&bHPkkHWRedQ5>-u>ohIqx~#PSMk!%6yFMW*^Nqtf2!OaJx8I
zYcbSp<*CD4M}-ikRJl)>Z<-NGl_^n`$Xw6o7|Qb?q72mL^kfGJi%=`M*8dWq=ha;w
zH^G;6YFuX=nz(wpUlWa$g24?!C?QVmI@bl%Q(+4mnMuyPG)~NNFFH9Yb?R9#HrJ?L
z(wXBd^E7xtls(P&=hgj_MT|038{Gk&|Cn{rbm~u9PGg)(5&2n5Vcs>g0B-j_Tw_Dm
zAO6hvIcJAw`jW!+n<f?Q$W)_30WlOLqG96Wrdp8qDPeIg+{x@6H{am>)Z45KqN%S!
zzj>FaIdqs$s*f7kd+(%;{33Hh3$Gk9w;y%0lu!(Ef0f#L^rtA_1-^{(s8lbGYjm{E
zqnX}W-%0VS)#h;VO3zRzN2$26bnSS<osW&j^PP8A2N1`b-1l^o`jjkaWL#^%QU>ZO
zqx~CSL>#1ddRIoQJ#qCmv$7~-JeKCj5%?TrCG0SF-vc@=R5k}$b?f1@%eJm)or9xh
z5}uT=MLycDlPqEBPX}#_Sx@a^O`;q&W*;@3ZS=kokIhC9|Gayo5s7R>t`s^yZ^fCb
zUIgBCN6YOWzPoPyH8P5~os7_a>dRHwvv%G-_qlpY9_$tv;MOa@(85&RLLJG>YccGN
z+~Wm0N68Tt{x$fxU_KP=&FboE6DH0dXb*n3on*~PtFoDl%h#Td+F$M=s7`ILJ-3;L
zj-0h=JKH&=51t7EDc=We-02~=<!>Z#v5l03f8>l|%Vs^9_CYGe<UNjuY`?3uAC-$C
zCal)q4cbTzS7&25IjpwqG?M<(V79ezPRtWaEbe|d|Dvb&V0AFQ$<KRb=2~>VhRIGA
z!=MY!U60{_1>|uduiNIh+f4g+JYr1npC!OPp?;D$VlD`9SFt>pD2A8~r0ApMLSbhm
zsPj?e^P;rmv9uBE8oX!rO3QbS)CZx(c*QSsyzR30QSmCLNs8H!v6TJlq7$Qub9kVw
zk+@hfTxY0G)4$sa41l<NrsqtAMXc)Zr$Yuh$hJe=69&LGRvMM;Gupd8Ca$s+CxrAr
zuxL1xe-S^&_Vc_-<q>q)u*{!ycG>P>okUAH4*YLX0tkiaGPCkEU21KADYa|XT)OUc
z;v4)bcX*=^!Pi0!O=d}2yuL}nm!s&ATK3>mYiSCgcOs3KJn<k7d7`*mXaj&T<pbZq
z!MEk=lJXrXMD1#Silkge1l8?HlUba_Sluy%fB^r}qBXtpdY@_@mtl=V{6uG(rq!{_
zv^hoZxUO6D#(2R7MaqZAQP!<zq|Vv?5s<{te1Cg8kKwcNFHelO>4l$0h;I<`y@tE<
zw-`HwQ}fRG9A33k4wA~cfr~3L6tHl<%fO3VE%9%Zs>Q>t*?gWXm$}#0_?&9S&{PsC
zR*|bBv<w_tvLNKiKya!exbI8S(jI)#RoaM@N`_~S&DhmsSj3dt@kY`xBMH`_SlFPQ
zsX%ZlfW7#2SMKZ=k{0a2ozy*t$3gf}uT`pf=4&}$j^=(S_wE<x1U98SEqSWc6U(_M
z$>LaxJf-Mq@PaDB*N>7}Damcs#diY3mg;v_6jMQ-qZa&UpD36iKktiC1`08VM$P9R
zYWSUzeGDR#(lenJ&}l;Zo1_%3G<l&U25YegnT?O!UTJkL*C%!oJz)5Td`)T|>Fv{n
z4G{s<oT#kt?{|gJuW&Vp4XSodmaO+lqb%QsBlu3jBnPm)PF80&9ioG%=$2AWC(F(G
z%^cAQT2vzTOzbJ1(M9?d3T#aP**M<F0hB?Nvd}ujA;V|B%rwY+@2B+K(a(nGIBLRo
z77lm^j?=g6YQ1Mvo2<)MIRI)y^f})ZSLa8cO6zvs>V<%t@Rue@36^+C2$m4rgI8yc
z=_;mfR;K?vQcjX$t!)ybf|dZo>gVmK@M_CeR@o0#oLWy1L_Uv`(Rwr|3HAsNM3msM
zMv2|d5^SfeHCg2?k^TV8|FoT=+`2dSp|!)di-3PpDadTj&TkjQUITVL__#mjzMzE5
zFh%x<WaeZ&!=)DH>lPD-H^s6mUfW#z;Xvk7b*jqWyF-Vq$jA%B@K99Bta7P=vZ2k!
zpe5MvIDSz>RH;C>l(9nSo6|s%J|-tI@ol-?g3yE&=j<rlrvb=2@gs~D5gQLrDuKs5
z;nGf`b5E#z<rZFj4C6<}XqchScfL<hQzhSe3byw+j+@(*m--}W16QR4c$>YqL$lL@
zK9k&?67hvHLHkngiOf1`XU-17jO)9`Q%f96VZf<6w?dkcF|(=nXo-<=y8RxF68fL|
zIia6&oE8<RB+7NFZKv;t-9a(}oZYj>K~zHfc-H=U0w4jW32I^fL{{w`w5NaOYJ5B#
zT5su5yYzEGHTF`cE}9Vz_?*`F9HdCTG?>L`rTXJIr^QYi>cM1Cye)!<1i`&MSiy3n
zXqo0zcdhO2jjo6FPOZVD`z;~#g+KvdpG<l%DYY_WRKq3E48|wxvPdRm@9g<7Z2-M(
z<3S!(6aIlJJbBW(J#^f8KR<7Cy#<MEs0Ff+YzrOFWLeVdS9yPmyZ$x4VkV8J(c4WU
zVfZA`GA#x{M?*Ib6q2lbf9B51?gmI#MLaEO+7AA5kWRlBPUANgRhvfNL+-2ou(9#@
zrUtzYun__GxDtqfZ|7jQuss&j)9^Vj`6gYc#l2d4OI~KJwUd@R&*6dH1J9(VU+ZQi
z>=gP22H4X$L`qNZS=7&w??}{3fAX@&Zu!KeGXf@N^1Vt#1t-9Tg3y|$2ZK=Ue1$05
zP5iPujxvrqr}y)98tcxpWG4a64GvQ-V7HjpUNr_)Z6x7F_4aDp?6@>h`9X)T#%B8|
zZNI)~cMjph4q5hz8F#_t@eFj%JQuk=EPsCb3dWJdK9wUNd-nq^Gzq<nfkcsXyfP?i
zVD*zB^4e80emz<`v$7Xn-Vhc0N!~T&r;Svest8{}C_Gjf8$B?bO|FvHR+*mKZ4zqZ
z!?Ol|8oQh<?D>6<U8SOxEFS28s+6mm#)6UG!^P{1KBjZ&N5>;`(zkVxVRc9-;Lx8F
zD16A8#Hr2Jv!ryB_^k-Q1`Qk=jM-G2CySL&+dKF4Kk+!9uP8jB-@P{90`Mf*IgxBE
zJ3qomx%`Hx#VKR0*F8Sz?De!#m0df2r|}*=bx<frtT%?J8FA>YGI3~D5*^ZdmOd>u
zYA=41%s4ftRep!ge+^sg=i{5M)JbP#cfU+Gvq8qMqz<MZKl?riN)A})P)nk)qUC5<
z;&`w(x2FX{Bd^?>U6AP~?|b@%=x}|G*-55MM9wjDqR7nnem+SH>t>v?nVpIjNYHPF
zKr7Fk;|t&8Es;)e@$|G$Zv^eItkp^w77}qBbub7JSrhbt?6Ie@sl<1Xsh^*AI?TO<
zeTUNmvWHt*aD=z`yizX|mlVoTd3KZ@w9iQ?b^i4m;@;CQ3<8$EENn8oR!In$L~TZE
z`;+=4A%Ng|!1J5(bMk(lXr~z)1q1|^>K(u&BuNo<?@B}|12rZwS}@5r`1wt8nor9j
zYRfw$?egYyDx;){eNCyG+iYn4dj829mOJ`D6u>{wXI7EDQhB4n6%TLq4*6{Mdw<Eb
zp2E4a#6C#P{40DS1-2`J%m$wE8)GHRmNhoK1az(+%{H2~0mVj*26wnmp3QqApG}uJ
z1<lb2NW-TVm&b(dvdgcPSHuj1hIfd~XQ@lsZ@c<6W0U60)vnqEZ+KS|S~k5{Rz?yH
z819cx0_E)ncS1>Lr>z7Ytkg8`o|dGpRLu7EjX0n0v1c0<wyWIf)sRMg-1n+Yb%cFr
zBAE-q+^Ns*qG~_MsgAg3U5&yH@(m)nvRyAaE;e2_W+$o8Ga25Xp>%ZKKm+z_U)`T%
zr&w7YOK`bnHKYljapAQ@YzP%D_wq_bigl1^i9SVyc#Z~t*rbIzO#@Yg0>)V4yZpq<
zAF0rOx$|SLNME3h#7f1Yz$7b}W@5|nc*yg}o$Rq`%bJtk!HSmQPOZUFQnbFfws4U#
zFZvu&<16f!bbhwU%NeUveoaW<lotWLZJ#53dcy4GGP}9$tz__6SNewQASR(ZDk~yn
zK3C^fZi41r>pmy7#6Pv2E`Kyp(hrfze7Y&>nZV9)(x}A0p6a2+&7{#uvE<UL{Z{nP
z_Z~dY)4seGjvjKI@|QwxTQH`K({!+@Z73l7^vh&!7pdvuNcVoE#e2dJ5MDjxO99-{
zSQOIR+Ty;CF#vj+jxL!;d9)+w`46!<b*ocs4k`o-;R(Z8%C-pfE;2v*)9s$~=l-tt
zb7%6?)i3K~)=L=D9k~56k<*7{#<W3q9#RG-BfjASAErR7P7L$~Ci;`axb3mLS{2lM
zVP=yfc^qfZC4O8(pQAx9skqV#OI3}JjNkGaGFws~?fKdvKO>b9G#(|Zx+<U{r0toa
z?A*tC?mB6%I)wE3ZtK#gc%b9vGB5$PPExy(wD~E-LcZ3|Wcc8it&thAMN4$Po9-}y
zm=(}e0E-Lno|kW+eUH^_GrDs7lMf4txxdq>mrCiL?`YK`N&tZcT=#T~qq7XE20o!z
zQ~YvCXeBtxFcBkTvhwsv8iJcO-;7ZBEqrSZqlb`gd33r)aA0jcB=z;=z5|Ilp%h^9
zOc7%0>*sS!yU<N8F{oQ&N3b^ty?stB62SL?@`Yu(Q|Q=<&sX$bhcVD7Cpcwy*fQGo
zK^b>fn&spH{~$Mms6bXFNh2CtB*X2;XH4FH7m>yDNX9XiW}t_Yy(X&KGVOMKYlZn{
zb@6`RsD`*cg=BJSJN)d~+r<bQ7?h?;%IPOyKMjAmEm`%>gu1RVwL?t>vIgoO)k*Is
zx?I%0M^pu`RDyA)p1<Q3aX2r?z>&o#rMpvl=2U||8713ax*6$x_O`(o3MB(l#4vsX
zM~>#OU@mm?E^**5X4xkrdVyxd4kEE1mBk-M8gw^GyU-)55#08MTwSzb9XmUtd=7&(
z+Icq1ALSkf+2~rAnS$r%{FXy2t-NB5Jb!><>Qe0>HQgdmU*^&X${gU&nU$|uYiFc1
zf={`0zO2QG9U(dQw*j)C<F@L^FrHe~2#L>ceM%@jhtX+ir>~&J5mE~3fJN2(pI5cq
zc^C8_;M}M4G5c0zQ1v}e`w)2w12b&hn~B&5Au)pml_yzM;(N+6aaxZlIl-TslJlPx
zR%iA6YzGCWyO@Do8(*XYO}8Rpiu=0YSI-JmAQgjAnB4mYAfMkp>;bUdpz+m*@KIUm
z12B4EbROmh@p?5Wl87>-g&3%dFOPkBbE_l%L?yj9k17R|5w4J&42uQLtlKTWV>YOB
z>$7VyD-;23dLu$w=1E$#*}IoKpdV&{nlJ#oc3BM^SOB!G9pg0{jDqXlh0`KvzBNty
z4|mSwq+VQIu?LNe!$pU$b{>Q+i~F{sADmXMLl>BR`^f0CFctc>^!`jU=}d4s=IURd
z&s1T*WwgHk@$7u*trHY&a(p*^jN$E`gZIgdcM%-7kaHbx<{y1NMv_Txp&r|(y-jBP
zhAS1RKtRXBtRMjs&VLl<A0Ng;gdU2CL|D7b<U4mz=Jm`|IX?9`uG9Le^@#oBsM)Y#
zy?gO}{qm=MWSs1kQUi_dLxEnLFbhKX*lM`IOqXehHQU3*Q%E=b+-YLfAE3*onqYMt
z`lk1uc3q{Qga0?0>Cd$mU-Ex$)1!8olVC3!>+K^wMBWUR0zshKy<nT{ZpM(up9-F3
zKh%kfo#0pb#KmeT6x3NzwP`jD>{*pYYZe2?G(1Bp)V#JkIR#q0KO_9MPbnTI(j1-7
z2?<PRyhbiH<4}vHEAndRh9?w#xTjMR4fQu>xXG>-rwb&t^i*<`bnsJU>&79I7&?C&
z6+OS=c@UoNd7l5#Ov$LUU<0JRx@$SvIw_ENXLF*Mxs%2(Hg;U~{$6gpLWFvOf4V<B
z-}ija_4u@Yne_`WRlI5$9B;(Ip6(m1O>vW4S6pE9l;ptOZZ!Ew41IXO%Woop`Y^em
zHfq0E6>nCuN)wYIg;#~n2qx$`nlxtRHmv>_dRtD|2LGz<e7SxcFOc<RXA_%-v;dPU
zu>n|0QoD;hr44zP&e+*W(RzHtD&M5BAfXRHc_x>TA2jSWy3)UYFbM8BsbT9fbkO+7
zo!q~w(yD!9nSFni%x*@WXJbk>LcHLu3#{C{SA23{V$e5PRiaS0^b;73GEDP=<0Xn8
zAuFYz+5EVxdnlq&|Kg@c-S;3g4RGBdWRy$4gj9OQ*@}({cfZbrE)Jamy+`=n4j=ZH
zh5grTD2WdDkr?<yiZ#I!^Lm3?nWoPg%oCP9*wseDGdvy%`)m&$ZffVXS-dl7^!`9I
zy+1W1mbREmdTO*YoRxgOGZMypw0FNhK}?Zn$MsnWDueRr{_?7Tgr&lr4-U?bi>*x5
zl}-KE)THFf#P%kkce*I;AY$ge58OU))vkh=mRa?j`EhH;Nm{O^#n(sz9<dGyJdi6}
zJqe-~QP)gvfF+@k4VB~4H3*eXe~|;dq$`2+QrlKyeys%!@8d%%&MAYnxtVGLo@<*_
z6^y6IM1M#Y?n;@iNRgr6aU&#z7ce@j*B>0-++<g<6T}8k3)@A%I(tTWAo4m@bzvyA
z#_c^(mt-R>(Rqe54<bj?7|)~6^yzRmDG6^B(1;koO+548iZ`MX)TCDrQiD~6?;K(T
z?SMB-yy`Q`-58Vm<paJ`>NLagz@#eZ=0%rRog{nI4_Z2li1eKu=&l5UFbRS@Iv>Ge
zRN62z8)D~qKlxTY_%8L4#b|$4+I9s`;DLb3IztcvhT+f=lJRo{o}C=2cb+xD!q^x*
zGx2frvQQQbEsSd4v0H2=9z#v$<kUJ2d@%(B>=p`E3UXTrWTiNHxqUS)hQ2ACUOR32
zfup0V%x;pKO^!xnJ#76d%wY{lraaAWKKD{h#u4n}y`)4I<9FoTAMPOJNUT=&To2XL
z6+d2cND_Upwwz*cW%3x}0jfQXgUkZbcPBhg7lQIL-3F1B))1YU6!+kYxqhatX&}uu
z6sBmKd+Iw@iozycs-t#@9TB(U8a`~SKC(>nf9PC(^vGPQL>E&Et!;$N)#B%Y03Ia`
zC*NJpo+ZGZOxEwM7%l~zk=}SF^a@y0Z$IfFmHc^&olUOnnzAy1!z^*<aHpSrhsN<y
zWKsRbBS{BK8yd+ufhi52?`cLZU1aHBMV?`$HQ)5SqVd~Z4u_GfA1`kG5#DcCn8IBD
zmGXvZd$@Jut42ML86ViD64o(E7CFT;wR$s_(KEn;Q26@GYQL@g^c08(6q%iCfh{Dh
zT0BBxf<8Z}X(CBupFYF+G(Jd|p6+&_G!RTxR;}15nPbquaW-92wZ9{c?!u(o1YM?x
zil6yPmX~uqmLm-;s8=-Z=F)u<cONNt$7*2~+>4H=OFtju9X`4_ho<w{V)fas%G;_o
z<i=!g8V<zDF+xPKDP0;U>@c4IKl^mg(BzucmvrJ;9|um|+>~=vC)4RsJn(xu3-O2A
z{YepKW^F1#D-I!#LdNmJ@!0(&>xp6iA6NA2JiprZUNcWp%ky9EwNMHQCOveScFQsN
z@G9wptaNL^bfG`6@^Q62G-=lhv6;S67s^9+ZIYfqa<ph#;HYAR*-a%Indc3Dc1Qrs
zLTtNjTIY6c><>bFmoTJbw2v%o)Sh=9K2@lzA=cQRzda|B)#5)0-u+xcAiXntC=O4^
z5;8oIq{21o<QABIYdvbYme~<hnI;!J^8-9!Ify(uJqx4MYKc)}OSC!PU5s>&uz;2y
zgH|Z>dL@q!M;I2AU+1Ogrtg}ZAefFl(Fb<WlGIs$pZEm&4IJVF+jDrmm$PmS-GJqH
zm(kH}4Oj3a)Um?%WUrHoVZu<{#L=L`h56V23m}b}aG}<0?B^iWH}C0X-EJ=Aa9`Zc
z<Yc|n>0FIDChzi|i+TE!rh?kR>DbcDC^MNfL*A<)J6Uylzw`G-9&(nA^4oBO3JcQy
zcLMSeQX5^_g=Saw`y#C{*@F9=es(^pxl-K{r46yV>OnwyDk;?<eS=l+bT(qEyuy-r
zUhtVgbT2s#7+rPj@(ur(tky$j1lu(?I@fM)yfI!i#VYVcv<(pMJ-=v3JFXS9hRACx
z5)%LN10x`#SAo7_JoH*#X&Cyff}zhf;ndP5JAB7*Dp$~3YcTu_v#>iLc#BY7khF%$
z8t+?6D0j<rR$XJSS{g?gzYt_rX9L^u;poC=qZyUrxmUe;qw|xCfq6SC{qYClMz^M#
zlIiDF6&lYU_Pq!3m~gSDzq&HBZy&jLSif+7U@ilm=bIFyo=@8?nRSZqHnUWaXJ6^p
zI9SDpM->X4EO%u^d=Qs5!6;8NOPuZV+poM_ZMwBU$SktF6A!T<mp+*r=vx=*6Ro2`
z7^dnx?}zZ=$4$mc={oqf5J<cn7(t7C_PEy@I^XEptbKSConKnx|JKb{C&yqw(m_>Q
zW|udFKK2f&Hs?|a=`{a#XS$YHyQDDN)DSL9uIP1gn(MZujqoUleSPa(nfc}&N}+w$
zQ#iyS#V*%4S)&Yi4pm9bn56*vsyCs|RE|%ANy(hAc){>vqNdGuh4h8`D-HV%oFOoe
zjeu67fjU#o^m$1$SX~!;Yd>^1D44`8$bZsKkDbiAd3pafm1<T@x0$E*Dv!9P3%%vs
z`N8?YV9#tVuzu6axD2}`d4hM6iK(HxRMMwcEqG_IB>q`bpao&mU}NK3Dw0N3s8Ty%
z9-dC@fBLLxs4vW2vSu-6&S7gu#&5-f9~;7UFAI$d6u@QQhDJB~*X^)R?-%G6^YjZP
zZ?e&vJuoDoOnB|TZp-_~5B(^fQB-mV1aPZU7r>?eS=p-@{G7DtXxb$#jysDV7c7ZV
z^K*G=E2T*A<<mIWyrA1&+^QIbP4Ml$Gtn3b|Jqt%kP3P@XANwLe}ZwxVh9Q4m!N#~
zNY06b^^{DlSF75Jqem#_=7OZgSuabneBIJC!#Mp1G{_eNt7lU7?_+y7mS-oM5EHs=
zldh2horfc`Hjm~|BYw!nDj+})(z-)T@m65IW5Y`}gm`%^E7Ga*WNUPN|7`Q6tJvA;
zouj&=<9&#9mDDz_SPk-Y+eL&pmlw4P1?4y|E8C-O$vho4ZY5^#4DEZPg$l-pj%g&b
znv^YjOzQnpW6T&;1fV{7ky2-x^ZuKpbGL@k5rF#6O6wgl)N*~jwM^NyCOBO2*c&qu
zd6a?djWz<foz)@o@T6A=RbBMXICJWe%8|cl({l*%*=JrjEfn}2b9>Ad4x*Vp^rZ7&
zch}8>J=A<Km+x<(?<Kn3+U3-II?Z59uu?qm-3j5N8)G2MJh-zlFQ+Oj0Z7!)XgpdG
zt)~(=wj>nh{f>VG?iAb3j!}<_QI`~2$w}aDYY<JA2Bn459hKWom9^MM0FEaeFc;Ho
zmCE{B@F&vrvDZh8588N3PcL(CtpY)D!%4NKpDYRv)!7iHhy#FC+;A%nXi9{Ve%^P{
zjWi))MY6a#zF#smclwS&mALT6fftGxLVpzrfq4%JY<Vk+kcxgVtJsF*#aqZ2udaDI
zCks1oSlhiYnNQx|UYmJTZAXmcu<jM1d>A1K$IY)%Y?MK6ITZ?a{j^5T=ALHj^J~|`
zSCtB1ey3bHd^6b*;l!_<=+YlavYHBgLbchu?%8tpqAJr#=l8g8HQgndiq^NxXn1|&
zOKY0n8RzMGC;jK@#BfeGLCqRp9WhQ|iP2NG8!j2vqYyQP;DG$qIS;XERvdS+WYygF
z6@%97KCmi}1;$+47|!J?zAST8!_Jk+?!k`tF>F>09zr$mgzW}mh0gl4QdR3|MeM_A
z%=o)koX+f89<C4V-5~V^rrTVF`U(j+U@CUvqD4MGPA%JTg;<l+ZCv8+kA-)my36+S
z+390+6l->Ol&$^7?!C-$0KZmBjal<A9SvBR=%i<-aC?V}VtUfjk;Yqp{_1qUxAX?>
z%2u)jCkVU6K6urrlx2S@CbH|j5^fILlc%$CQi9kmlZgQfZKIrdDfc5KB>K8<B%gFG
zH14P&Wdv;JGqGt~Yzd_bcWW%x86u8z8wzpmKg8DR9&0vBZ8|Jhcea3xriM4ku8Lxx
zymF{jJD!IC2LQ(@v)97vL2)Qe%#?_{3TRpR*4YNx>ykU}wa!bu;owmM$x}__N_ALI
z+H|U={fH?9&l0__06&0D>SS_wnQv%LA)^|1KBwpwYdxw!c*G88b%tKm8?@t3-1~pX
zde5LHzc*SN1Oe%aiqwcGC`j)$AOa#yq>B`#N$)j~C?Hsn-dmL3doKxyfYi`?m0m(<
zA&`*d&F_Ea%$%9`OD2<Vnd~QfuX|l<?QO(&1Q7$gc;ViBoYMJThiYeyiT=l2YWZ+q
zR@$FPD)ytRk%(2eHW<6>D7T-rh=Usqewcnr3V-*r!)&@9l)#B#F)2vU#=R1wlCZ3W
z!-KR?>yS&opDSy2G}GiSb~CO?P`a$~Nq7SI%@i$7zX?0S7)=h!!iQe|zMUNO6naPa
z;Gnaym6Fop(QD{}N}})e2+ZEn3K!>x+G{Hc#c;+5D>g$hmRSprSfxdkcc71K&mF|Y
zGy3f&4!mZ#4Ccaz{aLOgR+o7WNl0oarULA@@uY4rT~B#eQtq^zM)QzsQlBvW)0F5N
zfKlE<P5DcEjKY&azVHdii-G;h9BB&Mfk%|k)p;l7!QpX{rbPw2G*CQi4uEGR1fSey
zHA^SP7S_;lQDhf$4DAjc6L@8Wia0$X$h;_NW(!lI#z{~HAji%9Nf0*qXU37Cr$VN0
zgOX22Msf%Z^NZh|L4<xN&+GwI$*~XymkLL&>zi8pWMid%kvV{p5_!z1we#h(y{65*
z_nx>dP7L9iQmunkVb~M8fXskjmp3&B9uYfq!hhA-@BI8U!fMx!3rOA+RM=&$J#%4q
zz`A06gOE}z%x~KZeb0FL{&qN4ffhL=LbrDecsHr>y4{V$NNjSRo~iXZj9=QV7|J-!
zbaH($?AFu8d2~!MxneJPInb@V+!_$9|3-_2-M4k?&0GK!FZnpAg?<eDr=R)YN!^Un
z%@w;=LZKMwoF1_}+XFu<qdW&6ERz5~RJ(1!ogGCkM1_jri?#nhS^mh1)a9`HqS^kj
zdyb#4=<&ZAqz%*`t}carUEsf?njTzjpi{(|h<ptM2yacic9;XEx6`t*uNI3KW*Z)e
zwdUIIv^~r|02@-A!qbtXq35%sh3eRTS)agHO6zVb9&qgV<(7ro^$22ifynpXXzn{r
zoRG*>xMX<u7e{D<OJ$pZ^FCdjT_G|<?mV3zI*KSK-owamDPN%_L}uLE(0s#bnU9)2
zR8JlHc_W@XgWqyY!l6{`m0o8hZ6M3t-1LxvUB?xl%q{TgkM^^FG}}=vM!r9a0&<aP
z$(^$|!*9)v>w2~VGD;9f#-WkR`<Kv#Y8;gUn~401ciBOn2unC$-qKQlzu%zTzb`4?
zBP~c4DnZ<!7{YZZEnd&2s!3TjczLcO)xkNMQV4Rfh7(^y%1H4Zsd}RuW;U^3rG4BI
z(|5--xf6OIgu`itomS+0Hh&)g^4`b~I_0kjS#C1eW?;jrymot3`txYOvUJI0Y7`Qh
zXnvWo?;aP44Vtkl+MQ4y`?)Z4<|z^LNJ@c89u_mdcX7PFI4EKbdmHXNqWd9Mbu(@I
zB5g19M2o-Ke$(&W<+nTRtB}`~=jUkFAbOf<`Yw^^Kn)4l7WWWnewUs33WqWXwo4j_
zV*;inyp|q&{$?@IkTr<d&EylB^YswZFw@t6eY;8DH@!1dV?R%-82Fd510hFb)5zQo
zhMWiMD_R|q%rdp=HP>7m?C5vQxC|5UG4``n5pX^W+$%>KQn%{)DuIaVVo-6fu!A<l
zGNE+473Md1H%ME;r`H7(AHB#k!?#1Q9)B7n6!RfxzrkCf)6O3DZ@^`9unMmCX8YJ9
zI$4AIvv~cc2{;$eXLzDc#9NQgFpR%DkKVl@PKim9>4j%+pO8=uH=NK*E4EO&HefBr
zGGS|&NkIqbbM<VoQ0d@P)W)u(CS_wA(em7ScUegKi|bao9JXb%>{^huM!1^JeYZxc
zm<{zJ9V7^zjr*K<XVBV7V&`A;G=Kj$<Fae}E>!_5aiGnEx_PXAz_fLUQ~v3kb5*GH
z)cvTMJnI;_<%{|bwB|V>)K=ndrp*CqfFs)lT4otOcbX_1G<WQ^0w(cX94PMotElQg
zEQeADic=zd2Hhqf-(p@ozVcZ@p0~G;AebDvq{+MR*fSlAmY@oK@$DA!Xs5r-inUAT
z<NpxW9kFe%Qdmt(c=$uk%yTM}bs|@%EA*3IW}ruO>KsD&Nb|EVttPc>VZ+;t!z%CA
zftjS5YH)%z_{NCqV)@*fcQhkyg+W;(xTG)|?6u{A#}1-SE?Ipx^zoU(mWJ|B2p-Sm
zDUO<N{bAyec2HEJgJIw}WOM~v0EY={nuZkm9#xQT&Z6+2!*<Jgi(m`8(Ox0T)^9iH
z#V0)A_y@6y;)~|z#0eGRVY_OmjRM2;LH%G#x=vOQ^nV~qLJj=B`}OS9N^ij(g*?@8
zUh*yxnCLSYVXG_xul_1Dp(4P&&+@-1HYD18W=D)VsFsFl?CEk#@*v>?;&FT9w7!+q
zGIDitg-EqKRx;6$!P874c1efi)6LI27+s+^+;@_Bn)fTRxmHFXS>}kzy9*wp%$V%8
zS~xMK3v>S6sgHt!bTIyOCt%6TWeAP*(}9SeeOfytyP;k6Dsq+E3sJWX+TQ9ovRrx)
zp04xy%UXt|QWNG&!w~DDqzlNsZ|=NCVnhK%RY&^Yta6H6{pSze-P0UWusuDTefTWM
zX4Xdcf*A+KbcQods}9J_ZawyBKh6k|$FC>N=Z&FA?&OAm?u&OtPFTi^VXrEx6rVE#
z%|TNv!S*}2tAC+VSB?VJfzTZn_ulxPaSYZQKsZ+Os~z1QW>&mh3V2_+4tJNIo<J{t
zvjF8Qt1sy10kK8l`t`i?H<6FAD2g)`re+$}|B#&i|3bvB;I<>iU`H;c5M&qeq$!5a
zQtsbRoo)56pMIqiER%&eq>~duF`|VxuSKM1+N{_MHV!h;iQ7%|a>}7+br=FAK}HTs
z7{U-&M!In<;&1$xu6TjJ@kCb|6WDIh6n+>7Pl;e+%zi*e;!LK_TOlec)i?OK6r7D7
zgXaR^g&~kg8=s(4ilFxLinYC-p&>aYWl<f%MX13C>yM$=rx292%d?j$X@Esr;nlfS
zJ2CFSSV`Gc6$Yv{o~`S(+oNecH$32v0PRGpw@QmF*Y=<Xr^N<&g}$gIg_4h^nBW_C
zvmA@byO#HHP!d3(BwW-W$18yQ2>-is_evm^9zrq+L4cN*6y9Y<r3b)=yJ%BM!81-&
zY(9DL(k2~^^c*vR07|bP3oaCQTdX%|T?y5k#48+M<ea<K-t42K1fC`hO_Xbo+^$@S
zdv{4g1IsHr{XJ`u(;pl<=+@LWm;bs&<kV^GT{v}QtqkSPcIYwzhpt))oIszfXbby`
z5Vtbd?TcY&enk%l;eRRhmlHwKcN2{zcYNj!(ZA{V>h^TA{o<a5?eh<)?1~^NGs)Ch
z&Ljdy$=aT*E#9E9x&Uq5t3XKTD+^b|D)7|`LACh|QDS}B<#TE#1$b~`$^0meJIPT~
z5g;!av+Oh|%3c)Gl+#M=e?~*&Pf|xEvHkUOK3n`+4aQA}H|}nMaoKN2*AgNSGjd9L
zp^Le6Hjtu0k<_-s_Ti4_rF49co68+^nKItje#Y*t{93;hzkmOyaB;a^W5x8)mS*D@
zyHx!@v1L_z4+9ptZ{%wgUOn%V^*?K$k1v8~`Gyufjpf#|r#a_D0fA$|@8+vIi0wym
z@i2dD@pgf4gvarO#>0~OsNavP+8jQ&zoh`J>vD;-8UdYvGPMg61RdsisTtpI2XrF3
z8H(!eySd<0y|$^+Cz!LtCz{-IZ--drbTr;eu&uc6Ccyt3z5A`evbi2xq_B`UwjER1
zG(aL<Xt+=~3<gLTJxJSDhy7hGsgkSL%{1IxTZ{iFirW1zNZ=6FGzo8N)Rf-89R5d1
znHkO~-|VzVw)ui5zJTN!Op`}9NKq_l#s64)#INSLP<J}SRCEu4r*fc~##4i?g(-Yc
zsctYOUY1m5>T6j41lt%z+USSA7OE1B36O{_;JJU1$MU8hGF|CgYMDm7?Ms3UXh`w`
zm_R}bxcxx=RFo^h`$%lS7VNM^1b!6;&i>~Uu=I4Y#8T6JysIQxu$Rc;bCUE`JZQYl
zV0+WAhbkkVSIskuk+lV?gV64^l$c#3Py@U?Hh)EN$9<;Dqt0B&=F>jv$myKMp#XbS
zFF|#;A!lRMC({=3<k0gF1r*S;x(p36<RAPKz&~pll+pHoNGsxFh2cDiz5C;`XZ7wP
zA5@NHtV8d#%-r73EWyv!^l|g+W=bVGV+n=jR8^TIqq)KNt4^p#?Nhvq)-zbI9dXLW
z8W?LEc22!3=1*JfvH8t-W5ZA{5sPMu6PPNK)vUB^Fab}A*z1NuzLn2lTN1agSo9Uu
zYXx?Tw$UByVJqPOO|maAFT1IzweS>-p5M&s9Q@8$>lHVRr>Ypad=|a*f)2gb@D=)_
zs#F<M<InSlu{zXjJDo<3v?v+tRXKIIiT!!i=+8ED2}k+1fGSf{_?A~B$!}PGZ6I+}
zWnO23{{loWEgG5E271|qb_APL8K_ZMG9{DplzAP$DekMyUp=sBa=X!yHic`NXj&Ob
z2KuQ~D+C=P=I%N!kzBW=<?!^Z^h<tC;NZ?fh$za-FT8H}Z$4||jK6dym+FFF-k~@u
zX4r1qK~4k(>A;#11>GZU{<mJFKljui_TBfMQb$t5s}`#Df|r(rwt|8rC^J7Uv#*Jm
zDji?s{i^a0s`NOVnZ#5(3~$yFE!WB`t=cq7ciW^SNc`TgLWwNei}55G0~b`#sw<3=
zYa0UceeuEa1KRdY00H5stDks#?Wl#?ocfSUpg73kL)@4Cry;+;@@u2nr=%wKH7@_1
znx8C#5*M)~!^(<%&t?jLULk_}U{O)<Rb+_OlimV+dC4yp>NScU!WT|}+tD)CsvyV!
z$o<^hR-b`gGVbNPH3&}o0ro-KF=f8o>Gztye9*t=TpLxe22{|&CA4F6(r`i6+NSJn
zOD>Gs0(oY?g2?3ef#c=30!a@_c^m!(JC?uObOMN)U2Ea72JOgvsK&uU&a=!(sA8%i
z41mIU&bYf$oLP!kfkdNLid0X}1;52AE55~rTmNeWShU02N&78}6v;0-M;`YzD65ht
z?*Kh0@ujY~n2&}mhZil{Z;x4d`9C9psoAO>JCCgfmaA~1HGyY7w}0Y00T=uK;t1*m
z|Fw3OUpxD+_@#O}?qtREjK8M}c!Sgq=plZ#nN8SkZ}wSst&ZUyL%t(v91XIc+J62k
zJW*1Q%hEm1bkks0QXYQ@=Gl4VU30Yo9pf>>QJD!oIX4n4>Yu8CEt@U%<V)+5`X#p`
zmh(dKbyRpla-N8{_{J=+_`@>S4Xy=K;O1ZJ!S=H|=8`bjT`o)b;xuN#gZPoYOF~L;
z`bCAhCkW%1;U{o_>$7vhW1tWzpJyp77xzTW0(%CMNht-?5m%p;NHG|uEmy{uh)fZ(
z$Y%9CuCx!+&XoGze$=p;1~?irs(Gf~_QV;crMVb@@^5qhUSaKy<*Nf4TJ$JUP`3a_
zf<y@2`oO<$D==>u{O4_Bl{PO}^y$ls#ugNGGtX;uLL8qNfdW^%H1on5S@&Zf6E6{v
z_9D4KzWul{(K@3-os6r>cA20ANoU{cx1qymvA%f*zQ5g+hZ#<>N`!T=@bIC`X~X`E
z7Aj}y*2$UP@aP)J5K~%dbInQbr!_UNGffYs(iMRnWjT;x#ShUVP603~N+`3R^JBH6
zfY#ymenur!JIT2rM+G?hCnDeITUbTz&FASuFnx@u9$o3Ap6|pYPA-OOH=OjG8dP^Q
zb{)0n6H3JQyW>yhfgJ>_nV5MA(zpLnYJZqI-TIzA`pDXY&}7}xrQG;bL8g)Pw5trC
zT*WxljlbPtD>&2aFtoRUE9=F@DUB$|v~o>fJ!aq(PZtggBB>{d{AZjXbjqfsH2Dh<
zvc++6KR8xuuxOXRopsOVItovaC1#Ss9?&|wUF(zWe~)UxOY$XoUBIortbwgQ1m%RI
zghPL_sb!w#pKa}0jElHvrA3n!RI|{|X*whDY5kPgr&m#uO3zGrkxL-B1~H%){tI{&
z0j6x+ex#sZ7=l9Q1YW(9JHD9izY8r|FC<NhWLD;l5e(CyKNI@>HGQ0Snq0fHts!`0
z0zROC<p90{#_cc#;P@u7rDau#yU^k2g&dY$)D(Y?(gykp1-o3lBo{jzjtsb$xtJd<
zl9x^x_^_%bp2)(y2vbYK&tfxIzaq9n1W1XqSc{~V!v5;^gDQJ=vR7Kp$U;?C_NQ?l
zg8!8i*<Yx|?(!Tj`1F*2!-j9x=O1>@CXNAR6vV-cVtqNqz~`Ct1tmnhD5$rdk}V80
z*nGT>&Iwy^ai0;?!8IV79tRoU#vA0Gr!1U4`GzlOAO+tB=e)u%e;}olH$>-BI(Vy<
znAk^6M_g8fdvEKG?yKN=u3{=J^Cyy1x1D7QKmO-<xJYJBzht1QM)K$6^g=R}Tw0Av
zI5{OhP|ZdMp&2eW67@GoYCAroZ7QypS}K8PNwDUkHv<;J{JUS_Y5#m-wTf;5PpD;5
zk`~;yl&f#C;_0NV_hL=o?E70I7Tim3B6n;mf0C>JqVL-N^A;$h^bd(zYJ&5tRZ|6!
zs(-F7l=070?YYop*N#V;`uN+3S9J0N*SXaGr{%n>QV%XmtVFo_9F0pi6{~zHBW^Ks
zI%AhtCr9tb`z%=AuZRUMSH67pvy|-uq_&-DOGuI6Ji&B8A;&Gz?3ZB{R#vQwWYdzA
z5i1iOaU9Xo+u!Fhg75`NrS{^FGrNTS+2!qCJ^nfAel*+xNz8zc73t*caE^JXJf!KT
z{0PI1EWjjq%VwNNeVqB2HbVC4YB)ySf9qZUUW*gnTS);%Om>EB3&{W#`vt63NkxZ;
zVoex|uUA5eJ=lan;qOjWR&#fS-~6QD1Wbugri(=M?7a&MWjeDXa+R8A;4uNiXc;Oy
z8pd;xg(g(7^^Dwz#pg78mKU;C#GKQaB2X+S-=tzGYn_M>XrX7H)l9X;54VBNzG7)-
zxtapL2E*U&Lr(gOv=$@~-UD^!R&GHARVo73sO+`n;jT=l+ze$G`p~N>tHN4Xek~#~
z%Z&h`=hc9Vzg8xO_(y{qNr?hCfmG||Cy|c`we9=Um9O2ZmLJ}<A4p0F_B#to2Wb1H
zRG2%?lnXzaDs_0FQRu|tFn*hf-Rxp!rPUfJYU+rg$K#ah`yNJ^HR`~riprA9>|Xfs
zFB?O(&!v@=)f(NT+;}86H}O?deGA<3BzK0Qh{=nV!JcNi^NlsmZLHQ_CDO+5%@HnR
zp>?_7(;`UTK0_6$rhC*@70Pf#LeR_|ESypTB|@vZb`gsBz@g)<tIW1VK51U;kU6y9
zK*&OFJA$N3Meb0}^g)1I$MoFiKliw?3)7UWnIe>rKrpysn>!UT6JzZl{;4)Jc!@Ni
z1UGQb*O$}{6C{YZpp%0M{g-lFZ$Z;@+k2}CCN~!L5(>08Ye+8Jk4%|T+Cql3ySHj*
zeCK1E2!)lg&b^l_U<r88#^0~}Ii-F|eXb*Z;wXfSn{>Lb8X_-?zy(1v$h07Yi^)#W
zDtTWq_!6ZR5S)OEZF0wV_+s>rD`(W<HqDr2oNQC$3tU)KBye>ZB90cR=-N<2fjZr&
zZF{2=%<CNfD53&qnvh)w5EW_;b6_bP2C{4!KO3tF(a%S9<dCM1Bo(cNf^ql&i#~W_
z*c`KVl}D;z*k@MY-RqXI^$5GYeI;c}JfsvecwExJboQ+3`PF~LXCDClmwC$sktssL
zdLI5AN%<Z;K@num!|?~D=PabY2z*`2_1iQiotX^3Ictc@1sl<M+S>NIjlbY6gV<s0
zZg0<AZE%M}rgIvPu^*_BimuAMiaZs2cbv1xdNeu8dg)<m{S*Ev!Tmv-(66rap7Agm
zZnRz_rx8$XzG*}fqAw>BJ>z~WUDCGfs`W1?Yx>=o1z>H$#yA1JPtuNUY+>t3YY54G
zr6J15nBdDt=|BXfu|^@5S~70my<JR{;?Oo$`M^%;3n!O3ZK<`L$77a1W_YpHA^^lw
z21=SHXMEO{h~5y#Uk&P?%%_R5&!S^}@`Ko1#F<bHGs|L*F_VA`Sek@_14v#vEp?yO
zGQ`QqU`sQ`@yvb)bGohWh8P-3(w5@Ym?#|1ZH(o@eH)r|75rNG95I|FV_k*Dy4cz$
zQ#oapxOW8CzL7|EAMezWAX(R@M%9PchT}x-#~+$EuQnaUT8+G$uWabZnNfYi#S#1q
zFwc&~wA@5|Flq2;&&*B1&wQCL5#%ezA&)(r`M$p58YWD$PlDWWr}(IW72*{yhH;0Z
zZpr<xl$z&7r#E}O$-uojJ!-(BnQ+H}x8oe)bTifZuS-=-P1#{c6cu9z*&URxY9C#J
zahaK=!_bA%a-g5<<I}2b%0%S$P~FJ6>rH;MW}IcfpCm57SHgmP6#Y>E*f#7TDO-}4
z1~`75%`WYFpJh2%=}6KCrP(B}I#g7PH#9K`x+ICtfA*}QXEppAYnnMn(5=cQSFil}
zU8}=ZOWEzLM(^jR-AEF5Z^v9=GIgmg<P2(0o|w;iM29x)S>BzsjY%QFW0HJi*rw}r
zQpLL(!|t`Spys*|Jj2Y()DfBHH#jD<O16Y(y|0Cf;_mDf(2za0psTM%OXZK!=ey`3
ztI7<W%8v}j<o~WpnwNeWIxfVbF*7=fW9`S>Z5S(Jd|4H2ysh6-8W<_#KE7y)aQk)K
z^<(4y@ak<3cG;txz_xtN*b7`czb@{~kgJ{fJuINjTzUq8(I^*MScj$KDtue_<oS2z
z-RriMFpGv>3#K~fZ&3Z}^^5026PsP{)NWZV)erA`G^=mzg)TUuIxq>~j5$nkisroT
zr&H1)J16guL;l5xoWe<WyklzJhlAa3f>mRHZeq;5y*SPvIX{O#3!K!m6#LYo$u%V(
zCwD&E2LQd$Q+@*LNH6cBKymRUN^vA4wpi#Zl5k%;6{2!25saIE|9&eLc$q{Ga1V<&
zgeD9yX9d@cu#r%Q#&7C9Wx0E?2cfA+K|s90#c#&#o{GbAIq0B$s^7P^75YWl-9PKL
z=S*!xo)U|I|H3CRVz^swqW%gY7kMXV61@NUd1Y1|tvVU9R?Z|NW1^1N$`c&OBv58v
zr?yVY+bWe8aQ;;7t@^>m=IcD!XbrKr?^y4~FVZ3T><xF&^GW5pfB&!1MJ?lgKt&nw
zp^B6;mAvjiqh~mG-B`zHt0u(C&aSO4zX!_qs?f7Y>rUC=@Pxz0Zm!szX7>Gxo!qM~
zPzi~zbnujXL@ZWS-V$V9?x&~SlUZFZR?X*2L+3FmkE(v+@V)=aZTMPH0mmzc5w1}p
zw>j*YMDM0;?I*rV1{xWWA%KzpoYS8={oVUfU*L9OL$%2s3cj8OxlXebOf4wQEBgyX
z+i7Kvd|F*)-K7M6;kdz6Q(>?vI4sTqk-kg$5{qcq->z5C*BeDZGy5-sD6p8uwiC$!
zbUoX>Q=^v$TK@y{pK@h^QE~4MuUiFLNl@<NB8-YA5Q>I+3h1+ZJqc7d)p?tywCgOh
zPY9_u#N&MBXsn;pc3IcAWy)@KnSYC2mE*t^+KwB-v7B=E=vjJn^bAuvH>H32h*<(I
zR?44lLqR4a$Hi|_y3Tvh&9aBenNS=)4-I+xo<yc3>P;VejiH!y{NHgrcOr>wkuS&&
z{Sf%VTLfnS#<FS9fkFOEUlkRl^RuP}dSX9_V+xpANk3|A2a?uA&OsO^+jCO@yV-QN
zpdhO^on7x>G__;pDnsZ8X86^z{Z7iLzR=c6f#4a}Vi=dVT^@ajiIz3v{>ZRJt^G+k
zSMDX_Mq0Ocft8SwCS+luR>-1oXkaXQaw`fpnv{xxpT9*Z{-@(rKan)}_k)j40h^PS
zOTo=3;80toX<tO(rqUuQk76g*vAZQaa>&L0JapTw$r-e`rnJb$DgTgD)G6U!yL@o{
z+mQZ(5ivay#<8R8FJElH+j8E@vD97EUPK;?YG1G1_Ul?m(Y3jnd}6q$66BG--WQu#
z1;@S)#voHY<33@sfW#}qL%2tEKw{lNhXWYdXOZ$`aag!)kgx1w4mmG3GlT@#W}Yi~
z_k6okV1cj_>u1!lbQ>)d@<@i&?JtzISq{%ATH;^SChsioa|ay#QN%0#p_C~Smzvsm
zlxltRlH*`x!Q)3TBFEJ{J-q<EPg-J80VM9>o`rV+pV^VO!e3>^@vg`jtAKEe-wBVj
z?Po*7vnW{)dljGFKKB_^yCe61%6$Ic%SC=h2>#cf7p&!Iwfb2@a_+zS(zaG*0)1D(
znUAOW9r4X*lZ;;mD^hS7pSCM}RnXX@*CpOhb^~7)!Zw5oKEW*V6C6UCS2x7<PQJ(h
zmjwh(Hb11S*4C~Z_I`W$m9O2;iV8Zas3u@a)6i?Y@3#=`ivOg#kPA~e)gwXe0PZNa
z1*bzKX#^2Q@>$}<@-&?o!Vs~kJhPPKnFvw$nS;VY2g0e#OsP=QN>IQg6Qq!!o$@pu
zch(ahD#x9kn(z}l2g=EVnseX=9uK$1BilU2q8}hx9Bv1pr%bc-Z&Ed^<aA*B-KAXS
z2W5RuFFQ%AeLf)DCbS*RB(MSp?gVf3ePL1#)UR^XxIMqkmf^UUVwK_d8_bO`8f|BW
zs{z+J$CtPPmheE*ZcIEG6!~jv4bC~bB2MCBPp=4L2-z5Jbi&hd*IHF{9U3{7SC#44
z`?gzW%UnU^hTq(Z@=#EK|93`t>Fu=s#T6ffqR<LabR|!7gAgNk9w>)ur+Y>XA|S^%
zH4w)psiW<dByM#j((g->ho4fj7fZ`tsf&{7D8g!_@%)x0j7T^i*SB1rMvoNx3=bsg
zD++9BN|agHakqlk!<lX-zME7?2MqDD{lw2S?AM^1FkW4ktbZ%8?`QQUNZmY3txMTQ
zmzsNbo)G8DsuC95k*?prX28!*1jSdEyT~zj<l(13X1-qnKVXgOwlV;Pw;Dv?utIPL
z==_EJy<HptJbEAj9FXyWCmLhFz9iyxaU`$$sPT~l4hBLAty=-s9oVHevjPa}<ecAj
zh@E(~eB^Ey@Ij_cu||~S_m&t80Y-T5uo(S!>xz*}B>r**0=T%MVmc5(B7Q*o3%)n@
zlaLesc9@&Y*y$*qs}O1okic&K?Ay8e==EY^3l^+CuV0G56rp%O-6haTyH5TI$o@hY
zL&rey7_=cAMBq=5S^)h>uiN@dtZX01GxWW@BgI>H;~+X!6%(%sNY&(qh#y`O&bLDe
z{nJ2f^A7fM5MoIkFDaK_gSnfR;y8kRi!!Zq-ksj@R@-lK8SRuZ)dW|6lQ%bgz!sK=
zSkab%>Sv$055+>xuh=9U2RE}Tr}wF5AOJ2J(n%~rG227gOTG&;=L52ou+E3lD4R-D
zxXs=kXy5RFvRtdR_aGtZ6k*))tX3g&MTVYu-e8S$M2?t}YUFCpN$*7yMUL9W)z57f
zeIOA{_ZytJKE+gOS`JB6ta^|7?^o0N1^lM`-_PU(xqYcRu^{{mKPD9fhFu0J$8X<p
z)9hEaCSD>(oCVdQ7WX?kitSGWdc-R9r}a5Sm_n2b+f6lKkD~y06<%xz;cuzrst}9m
zu9v65J|vv0^K|4wV=>A)%xf&Mz<=~FkEm}_-sWiTr*!c{1;uU$*I@Yum=|A4gb~}`
zw+yA1G-eK}<mGhW`dzBv!nRgH=0NSx4?3ZwU=l*l0=Ksm@R4MRDK;%?{CGg#6;Izq
zz%}k4qcK3}sYvr^BI$2=i|!nihrEAzl84al0IP1d{m({SAaq8G=jT#+-8nJJq6iCE
zv83oa{6-m;UPaEp?iowfqfYH_NrLzcDBc3t!EnYu7R-5eGnGq=KUaTt{!3%=o{Ov8
zwk~;X&-ODt2svp%kw%|5R5Z#oc|Scv%2~E;Xy$c_5Kh~QOW_Uts(zCDa0GY8@o=ge
z+D;_&U7nmJ@(DT|*wsD>fL)pd^aZSh3X;Mco8=^!ad6}BmQa?xPe)F`3fsLeZ&l$5
zqndSJNF_TXa?>GRMVgpdxbD*Thc!0n#r*RmJzOj)3v_P%D<s8%CWewyQ=D?)<m%K+
znQL@arA1Xj5X7H2JQ;EeJT-7<{HRld{b4{Qt|ZVW>+;q_^*c=Og~v>f9nB%id!Cet
z=b4?BFoOFdM<ztL@X(GbvijT$0uZGn&;3jC#Y>qNMK85dKYk4R686Ox$bGycET*N-
z&drb;@se~$8t;$Jb)p;yb&$Q()+VzYx=O?>87v<j3}wmr6rPWOw<H*CWVZXr1~#=*
z#=9tRqBPW>kPT$URmO%Cl2>j>XHi9AO>hjRir&LMcO<*b%ex1EgtwFTj)3U5E+bCV
zMv5wwSq+i|Jw|inY-!&g2a23MU>6(kdyWsg^w~k_LQ2-Kx>WIjfYb?o23^`n8|t#s
zEVl5#0OYJHb@eYr0}?@fQ5{cZ)a<^5s`uS}F9iStgV%>;p3wWWdkzIEunm>UxG$@G
zVBQ?gWP(d68@hG7qz&1O94@9y$nuaE*{@kmBQ^s(0G#@yb70b!V(+hJNn5(VcRkFA
ztzUJKeO9kNHK{#TqkTaeldCNgMy3PS>aXDr`FCxbRekq$ugP>skeko0wSg~n=Spnp
zACr$g?ZP3KTXa}Ai`#k+-s^IWK+)DMVD*+a4cKdLeDDX8UCfIM6<0mlNs=}+)0N#P
z{f_F(Pc+c%(vxIWIErErhP$fi15(E9Jq@>v|81$O>Kl3-+C@9Zg3FoyKV$pRuPR;D
znVBSC{l*{{H2L*7e^D{83xb76vvVv6rG)GSEqi*?q5L(@Z~Bk#qk@G`=pHC_SLSjO
z9<Q#hOpgk++n!Q2W!rSXsWT%!YZjkgM|=Wd4t^!}#Xc#rza#uMLcp}5Fou*CPv59|
z+mc_SeIFNV1))|uy735Z^u*BcoKr5DU{L06=_fHLM|RPoSQ{$+i>Uc-c^jK3Q{l-L
zi1bn3`m=Bk$ik=de5zAaFp=+R=bMF<d$vCg_O<cN2;TW~R?ACo?CL5ryI63!e5LHP
zORDppR%7g9<>xGoADRC!x=*BU%IUp6DAPh@vR&9czqx|ndu(0%P)lq^q1TY$)>qUf
zY8x!zy13EMZOE_pI6{C4pgj6_W}iQH!KIVA{f#{h-^-jUhP|aG=o>3A^vli)6ISWG
z7}~a6N$5uJTY1cT>hB^w--+O*w&vk^N((2UY|zDp5;x!ixDw;h7CO70dal&P4LCR^
zy)5>ri|NhcyAJ{W#A;mBJ*G2L#CmuNPZ}KcH*?ty?#5&ZierT&Cv#kVg|0p_4yLAO
z_6m3E9(mjv#PL;SKTdQ^yVRV@Q?GrhBl_9|MVeBW71h`j2;sDTzCGK(^?Z}I@7Gz0
z)iomyby6NYmjeSe@Ft5^ZT<E+`F`-x#dSQ4r7r+T>rX)mCBHvAb6!ep{$u}&ElhX5
zEypQ^HGOM{pnm!I-xK0u%So8l1Q%s7cYH}*RXn(SeNRfz30-=pa8oz#K93n8vh7o(
z*$fJX@9lc*`dV2DcYV94S}eL(6POMDbhMA`{~n^$=I_NR@gc$5U36*>DNC=ZXO*0;
z?6*0w-M#sqwIz_p%?v&w4t(@r<B{GyTK^%?H&fNx%$>fQuk&Btm>vPgG>^cq;%iMY
zm5fk5V9HE48S~ZIN|B`Vh3H3-&ON6DK;11SfP{%<(%tk(^zPSKzL6@v)+<GE%Kd+J
z;Gk17=EXO3q!gQVgm6WiUdV@=2x&Z;b-0gOqK9pRe_%nd98mBw{q;k`yI~-IO%Ab|
zDE=VBu7gBDQ$}N}z8K373o%ILLEAY0^zlbVawobj)#|Q`M@{?jl_8gO8>H)79b0}E
zv?cQEk5S9YkIkH*Pp>hDaFowfSU|L>J#QCOov2?uzZjR<o?)|@Zl$;zi{Q-IAK=F@
zIXqu(qCS`MqSY4Zy!H%sOE<x>r@6%)Pvtyuch&s~EGy@9xy81QqparDX5W*EY98Bi
zr{J3i9oU`kxsg1x&w=_Un@8(+Kdv5-QD)BR$FK1aC!Jo8LHB1$=lW%aI^X8{2DL(%
z6ucuO;%3;%=G`q7zTC?Y4A&JjE!horh|58HESHOYUQ2rmS!y}m=DJM#%j%6en9mKH
z?~(A@Jh>}m!d|Yd|A)8xyvA=r!>~|KCeo%zIh-0@6e(M|{P&o;^xvZa`Fm+XXC$B?
zY%lZU;w5kJ$lL1-=<JV7!^UMs(gSaTprsd9#;g{NssycDpT`T~gjZ?9<}>E-k%D*K
z8mmhTcO02l7S4C>sCi0m2ws=g0<hpQem_i!pD%Ze(bkZ8i<{MY!&v*$C*9Ibi3Niu
zuV&ouL3HNn`pjXzJoX5J^a|Cam_k5J!shN+o@UCWVEQvSQ>jTo&8+LX;Ny#1%ZdBs
zir(AjT&V=AO`(WkVIN)THlxxv;Un2fu>p%YXIiJRZ@qm35T37}gR3{-oi@xZp2C|W
z$=a;l{mgGWOzO8pT43~SVFob87R!&TOdJ;ku)TB+n>Z!M?8MWK_i?72*7n?VWcSn1
z*48zW1@M4{3U}L+u7$Rk3n67b(p--`WUdNADXrdTdS**@8!B+5qEXHB@HutXT=P2$
zp_nWWv%<4oiB~g~O3BrZv%ZTJW#OvhqP46{*GC_=k}~}h`FV#*!DVuK_kfY}jV@K(
zz$&U2GS}K4D?LyW#qx_X0Fu%o<%Gi(ELOQB9@6YQD>A%iP3~=HdfR5zf$Tb6pUu=I
znNh#+b!i94QcWF|4%;gbE#C?m+EEvXKE(*90>RfrDYZYY+H3Rf7W>vFx$=5JZrE5&
z{Zh=bs&@h_`}9h><}dGl`S(-=Dmg`()eNKjHX};17bMr)IB+5ozWW2))0$EDV?6(g
zn2&F~1hT|7Lw|6~WmQ^sl%@mI3mSZ84l{-?=-<Mrsr1$~e)xzPd324P`FK6=C})D|
z80Wt*xM|rUpmLI<cfY0XD$5jM_0GAydRb`{b==m^CM==rd@n3}E!gDsUEh1~siLck
z>~*DuCvw7ia_m&Sj$#;VnD=K5danGf!Aq&jVzxUXCa;5fT_6<L&tsOZ1mi3T;AMm`
zm0`f{$CdGetTo113^<)9?dyG&=Q<67z1L=;A2c@TK1Qpue|mSE$Zkeg$eaN?5Gx3g
zke(9Y`mSdctmmTgz@XLBRUlz_tS>g}d+zB>Uh#=S&27)6o=k&!JGI;Is>G#vB%XJ!
zU6~V;_f3;#l6cH&qrgATF8bHaCjEDQXExk=XRG$%!-L^q&IJfJ)UGk8PVJo*H!zNk
zRP3YpHQ|wdX;{pUY3t32KfSRWd2yPP<;E8A6{3_FYPIT0VEQG8wDUD)XSPQ|`*S7T
zrr;U)g9zf!5G^uyR@a$-mq0Thm$)aHbmn?fgB~d!RB4J*d;j~J&o-j<v*Tb!Hq06I
z#(K5`#6O&+Jj^rigitvLbP&YVsy~QiT^<?O8vU$oEi5Usj;Vq|O)9KZT}&z`cM#m^
zpR;GWalWX+cHlm8^SgDn<~2p2TvDHPNqg}5##%SkL~>c`(%!^N;<Vem0BZj!v=0sd
zr|GDFzn%A9)<D!}>*)aQdaP*x>MAcTsNAaMt%Ndd=(uAih-HgcKSt&Sn2rxaw~dg?
zeYv?tebP+&zP!L`s7xoOXDj!WYxMg*d4?ZfIs-(qR)4yz5H6;I*D+^ge+`p1fUPHU
z;MqToRr87m=Qd5$ZNTQ%@Fl<j!3INmUwpTE1$uyagbOu5GM-<Nh(NHfIAxpY6k|jO
zl6BU3fxCUZbBg<nzDrU5p$<*te68w*C-XBw8DLRar<gdctk|@6hG|!>uuA7aV2vy-
z(Vq*Vw}7d&@8Tox^gNgB@;!Kc+g=x-t}4O|czTPqnkGxY>1l9;)Sm(f{J!hff4l3C
zAu6^vc*V;)JF)jP%VDvr@ao9OlQW&VrXz#UQ56E24W~89Fqa64a5-lFdb`P2>tUK4
zIA9R*0<LDpiM#RLHs@r2Ofc(p(aX)DF0Xe-n_Ie&?(S*n=~Q6j4{in3#28jD+&aZK
zeh`+O8&IC078x_T(L+zS-Wwx16^mqJ0%S)r0xGnc0>`e+Uu*|Qw9XfmBhqRTCu8{^
ztf4t%oOV_TM;Qy<Iyve1jf)|H`(|Hc^{re3L<iWnXF4436=-E=<ds%J0`J9qbX<+}
z3jKOD|FMOi`d)}#pAN69e%{Gc<pkM~{GH96KY(}Xk9r>~Z$qi0#SiJbrtzQA->-L`
zh<+6dld$j2B)sd$2KYrIdG<t1D;LQ=LQ2LOwENBn9<)4$^W*-mL2|SI(0YY<Vp%^X
z({9c&PM=HBTDK@B)H?K+k7);%u6;Q$bktLGX69~56>&<it9KjJxM}HQ-#OBTGF2B?
z>8<meo!D#kzV2z1%c%s$-n+cCva&|UuLBmF29uN;wP(2NLmo-+vZn?hMurRNyFzj5
zqwSZcLW8FZd-h2;he|cv*P)P!?EwP_VJ=T}R%2@@$LZmGKl2si@5TKU01lu)KP||T
z${Rp#hzm-D>?4%(Dzmcz;eJ7)E^gY@w&_!`ae!!DWlhGzsRIANJ3pOs!V2-Kvw6nf
z?@s1{9M#yC6+<ZfQ=X|`@-_#B_J-v|>6~pSlE$!1DV3_+gM)zG!6g3>&zb$L_cYVz
z#D=oe%*Gxmc*S+I0>S6zO|0B)jE5_m($E`R8IY?dZYwQ=x<sH1LAB&{`;%O!%6%Ev
zd=b&8v>&Fwa~^$XEqY^P&L!@fFCGc{hSI%g9EQ9RrHq=${rh6a*$SF-V1I}E|JiKM
ztjn;HE*>NYzsI5ZYl_V(<ZvnPWK%FG3owI+WsDc-=IsI<xWU^jKe_5;PkbEs97i*a
zL6D|rL0KO@+K%gPNt)-(Dee2MuJUmD;O;EJx>fWr1p6N5x70fSqR1a>=SZ@-&DD3+
zN1t2`9BgQ)I8&>6x-}gSOoZ6p<&I%G3p&~OMZOk#NA%MNk(MsAc@LY2_qSNps{KQx
zU4SG3aw+p+_QiXeL%Pf9bqs_@5uAJb8&@tJjd8>(qRin&45NbR{sEP=ol5RVf4L`Z
zpnhLv6*c`2Zly3`E7{mYyI|Xp7iBNj!P4wM@!wfRcJf)sB2lkSw}d9Ql|a5-H(r`;
zh<fGqHmiKM^n5TvCmM*|zjmEwB%YVG;rc?E=Sg5+rn$#*`*l(0YtbxP>bEzs$fm@d
zd$Tt`YbS}`WVk2!oZ{S`&(7gUoA$020r><<`*3`BE&<KYXh}+}ougLro+C1wJ}#hK
z7;TjDPDlF1Ba{F@G6rWd9Q>(iv<%^IEP%;Hs5{WI2Q+iNXhl{fRb&_0<TILzd<$o~
zm@F=ll^XcaZa0nayb@+P9Jl9$Dqrg>S_j^Q;;i-Rx%^GZR=GYgEP2buHuchXRUWsx
zcSIUhz72|J81CIlMlO&kN>@Yr6AHW%qFvSp0Fd$m`@sjsp)lu_ueA=tg@3(8Uq`x}
zv60<%r3w|>xj0;cJhrFpyO^u;0JH``RU2b2>s}X>8g;bVuJcxTMF?hcSe||Y>wNuF
z!chy;QcHXSSGui!6s3wBx+SndhucMV2cdhmIOW=XQn>}nF3d$MV<>RVoWci6&If@F
zD`J5tfpARLrr0-;{W7MR#OFui+Ee4RI!y1QKEo-Pqj?0a!XB4ei$&b})2ro)Afscv
z@%xFHLA~=SUHkX;{M^fD#VXUxt!Vw*A8}o07h1O;y}Xy7-{C`iRIz-PV5P#iFOmh^
zhv!~-2fb-<4*x-YdAo)&(uT~%5BXJf@&|_ui#f>8@>a_i!eX-(Qa>2Sm~byF{TKF6
zjV<ZHDT0}z59b*6S7H(^0@eH@5|gvFsDjrmtGzd!Y1^I(=GoKuqgnG#yz!yuK^%8N
z`jKs#O?q+v2+C<J`<_}!6Zbih=CkT=nQU}kN!Q6C3mj)RTRzQ5Y!Y%kfH_wkxHD56
zH$}na*^_u+sz@AOvkD&0bCJ&noHn)EZrH0j0d-Be%zT&~{qzE91*{2E`|$UR!Cqm;
zyIC49BvvYEL<-D46>HoaxI%Y!l|KX2E0?`3W|!7_7)s%Cphks}aMd@#`X5aG5O)}g
z@O`dOo&M1MAkgMq=;y@`!ja53t@XZtq3cv(T*$=D%=qei{j2Bw5l{MJPeETB@k~8$
zl<RKQ;TY(<%1p{%?d7ROjU>tWm~6@s--*Hvf;$vF@Sie>9mD$8(8iSx$N+M%G1d*x
zrqtYP(FUBwcO5eML#kI~>QS+cO0FO?{Bq4g)RHp61*ta3Tu%7Y;NePl&qBo^oLTIj
z?ONmeo1zJSuBjctSY?Bw)jFA@KQFP{ANi1fv{^R0Nf{>!mtJbdMHA+`=zjAU6}}LS
zNdRfJ=`q_QKB{jti`<lnIM0dBRZRbqqsTj7%|YMA#B=kzOszuQ--gG$z@}D2hA!yp
zVV^OZzV5BPbcf4z)#nfb%|UkA%Bq@xVCbJ!qf8l(+#nyYAIoYi_}Pohs(C{_E|s$)
zKv!!xue6d}y3pr!0ebmth2WQ4KFvA0pRXS*w51m6;>YryhAO4ay`mZK+umN$$xz|<
zd}yiDk`ub9IwxQoty(C)A4PL`;iur`667{M)I-JlfN*k3U!CX9YBfB?t5(g|*qz9#
z`6Pp+CjPL-e!Dv%E_3YjnZe~Ig`85Gtk=KQdm}X&U&48*Mt^Y3NFmyfjf!8zL^5)f
zYb-&?e%=dVKJFu_BlZr%+u_-t_GeoZDk%R>4JAJ{$a2t;ao@IRLj8;dy4$Bro&^Cp
zHJz^099}Dowja!jepvYWJ)aFu`ZTWxbk3Nk{yinb!L_G(Zfmg0X{nW=&`Hi_Yv_ql
z?mY^hr6oo({!D3?UGCLQmMS)ljwHuB$P0th8U@hEm5G*8B>w8uNPwVc&>aXQ$R=z2
zThEtqC&G}k)oT}?xv@mmAFY25W=txliU1T@T|do;oD^YnccrOzX}<=YZWOB1UGlco
zoK6O)mlA9ivBmvSzsp)$#V8fjm;m#6?i!;HKROOIYn?3x0CxZ!SPXKh@SRH{ub59&
zPWspGSgyGuuuaPPDZY4YeK!hFv;%<Of}7HJiREkQoUP1AS>ai?@=V7dq2xOs$^UN`
zfE%rp3z$shR*cZL<rlt~Pl3q-Ge2Es6yb(u!}d>e=0^GT2{|U^W<LV9xBrmEJiC5s
zsOkECAXO&zD^+Eml#2|R8DqJRJS#_0;Sdx!7-w(FI^`l#H`{b^=ELdJz996&c;&-n
zz8rFHefDRq_vL%ir3@DsQ#_UK?Nu>4>kj89_WfC3J)~mDyNt`G#udNE^u_VqyLP&f
zd@pQ&>WALljQU9Wu8ey`rP#=zrz(58k4?XoDs2pZ7u(OJqjEsLr)7Rys>3E=-k#+A
zadR+b90e&iz@O-%*&B+-amGoSLr*dLBEZ2ecg%1`Xl~3qUa=g@){rrwm?kDllB)c8
z^z8GuQ4*a{+JAo70qOjJRnogFU!;sk<OhUe&0X#U{yiwYvY4%*-S}cssAG<v1xfun
zjO;4VuO>^9+FyA2_fV;=(@4SiN3yV6@ZMxYW@NS@gYUBF{=ah}i;}mOv;!<uEa?3O
zZNM-;+*!Y?bH~v6^sh7UN8#edPkSy}4Rh<P+TFV<y8c2yH{I*Bca0L6Ix}Xt%0tsz
zq>*nwTE|S}SvUsMQiZH7-U}lSo>0*DdJxHIn4XiqRud5G9(=PDs{fFKHZGgYZ;4#t
zh|JZSwesowGdz~zb82e<GT(J)gZc)`$yW>Bq-qJWX)9HZr^cnx|E%jhKV3UBQoNWb
zk&xcA8z>KyqAwhw5ueB>ja1kw9c8Dg6Xe&wXfFjb6u0{rHbpMYu<<+%x!-ZQ#qrGp
zwX7r=x~Ko3WNX0x<`4pi$kJ=`KOBv~{Tr*g5f#y%FHjKvB#FEWqR7t)yQXra&3gYr
z&f{JmJMaA5o{*VH@0o!lgyzoBEuFG}_jS^T$Mb5``oN+gC)+W#1AD7Fxo;{7m23(m
z1t}$v`b4ezwmE|N>2>pE@xXwS{I9}yUq5LaVjlXq+8xFCgd;hKg+;-h+k8Jwvoz$0
z+_>zGWe{Pz_s4~hLM&<MssRXjr502uN@*+f*8<~LG!iJ{(++=<$=k~A@i%!PG2Rs)
zTnZBcy|Iu<cmn($C06dX;O|U)-RpMU6ZNeCAt8_NvoI&ELgC~jh3Razj?br)hz&10
zZ2gn^fLI)^C2n(A>ecC&qV~Y`K=K>SIDA0j?%y@FoP?Iom_r4!PLK8B!K>lT{=B{<
z0XKnRMF_r^f&JE)HLu_u8tGQw{a@AHr}r-TrIqWHF-I{8@_y{47l$B$qcoP2fP$~G
zUaMzMkn+ij?t=7PgQ<qdR&??E9?ay`?bitm`^J#_?pDSf*PoeMM7ohLTx-1UN;iAA
zTFAztv+?8q{osn|M9!}!DpD_IwFH~@uXd+S-}}I-+dTa6#aV(f*@VYcU{}3^%WX?|
zFW|P-zdYHPY6`U@7UtEf_G^HCwKa%{^!3loLT1zsUlv4m@vnK3<c77e9L+`iL|8uN
z8`T)PO~gs!V~_F6`$+gj@m0WWrI3gvN_mx|xxeMgO$$$DbIb8FLy@cAq|gA>`ufv}
zbJPeky~<H1tne6(e{8*c_2>IY?K<x^EL(C}7XmqBxeT2=vlTek^OED>r#JvNg`6SZ
zI+WRvyY7!<!%oulMEVk;u_no}H5=`JjstT!HD)f3Sz5*DPAl=rf+?BP;jrbywTtN^
zQ3s<NL$ayTx^D*3C7A3(6*vlB#Ix(Le>F~_6i)RVng^XPvUP{FVGj0tZ6-@>6{-%b
z8s7MEQWHP@)o2m6I=C>iH)8VJn<NeD+cGXlr>4{Mcxty95-8USuMTzL*ywTP;MdO<
ztq+ff4ZRTp+)?lwV5%pQk-5it++I1jY!=HamNgUp%pn~jD`f7x>^`({bjlOXTMS;B
zf0ne>>Uv4LH{Ow20><Mq!f)_{CDQpqPqXzm--rJ09wP5TShxRNyrfOvvo+Qe#Pxn>
zNv*XTewHq7pWh_j{u#3S_)c2CZC{u9uLKE-4e#4jlp-;2o!=}gDKw>#YNPNcE?C=c
zszL7`>~hi0CNt*@zcQ}T5Sk0@gUe1>d;4PL>L7RjNt#kwYzmr9*1t9J{;{_{`_4zj
zGiLEJFB!3Sr`JYEm>J><xw^;F#40Q|+coqt02;cSLcoF&3vw#nP?9mzN80e>Zh%q+
zO(Vg7q68#NE8jmNqezeM!{Yl&;Vt*VEY}S^Ux{+b)z3V&aGq*qz;`&+^@W&M`CZ6n
zDO<9uneQKsl?ly)?eU3xjMqWzP)3^rW%pw?w<XxpxO=UlAP&p!vEbl(_eI8^S2b4m
zIPSi8rLhCog2l!l)-!=<>$F%ab<(H_Vc51a3*!o%Gr_?sJU-CRR~R<&WOr)X=%2_c
zdXFiR+0=dNqI+>CJ5$_^iUH8C6H*Bl*|*rlzm$B}zF+KN>D{9MTE4co0{K};{1)P~
zIpmb|Jhayq-QXhg1sKCmM#J-H>mTW&>+~P}S#c|<Olc1-g#gs_jwQ3t!rR1_3a`Yi
zdJuFSU#8j-EE)I;a<{-MfV@?}s<!-1j4_{2bU06Q3cG$|YC2a%4oSkLc~e}q*&K3;
zQUZ)Nw?>fHC`oq`nTB$Ixnh@gejY{kkL`=@gRx|cz<3#%hVnPrkHUqjU7yG(e7tP0
zF<;GCLtf9-Zc0wuk?sGzS;_FldzBwrpZn}H?O<#>%v8lzGlY8n3;i`?;#|${g?76O
zO<&O=J@x6@_hQz6@xc{lYoS+neaVlh8TL?iXNGyJ*?i&N>^&U)iEZ5fV!C|WNPEZi
z)9u%NdSoP;Fh4?&Lz{Qo<sY9;T%5Ag+_&2BDHDH0UXHEWycRYHYa|e^J9o{9f0li-
z8MaIZQr3Xb+7TI&7AehK*u;mfzgS1d@^dfmMlo`eNyy$`Aa(v5m{)Px93G}@PKLK>
zG6J5ZR=$0`oht24-*wadL|HTI?XB-ep4EYa>#&f$#P2n;fy<k|6+mJFWoN>|Gt+8U
zx}g7$uD1+odu^kBahJ5X1}O!KTX8}Ql(rNoP^>r<clQJ-Zl%SwEycaKyA&<%?(PIg
z0_VT?e%>=@=FIyg4Ed4_6LR0zwbuHrh>m+M9qoqWd}Tz$_0dAk=VY`dCsy{R)AL*<
zr~NricZN-@>EqUp`OGh@RbHw+z1NrsxXr-U2&h?>EK69J^PkUV$dtqz>_W&H{W89-
z+e^|`D0d8BGOxkUc-Anh&W6m;)jtK5WK(d=Vq~-RjG!F<Nn2!$c|hX{uG)EbrPcgb
zOA=WpWb&o1eY2zj_C(y^eeMTG9JQ9;m3v|;p&M6Af(k(eudkWX8ur;V+fQ$BptM8!
zX9+Szl*z}^OdpZBm_aYNnM=_TRrj_Zvb0KD(d3+<4j7xpc-!B`s@pK5k~s=Z@Q$%V
z4V&dT&w|u;-&g!#S53+g{515M4V^wYb+{pm1?M_P($m3ulVn-|3*0fAWngO5hHnw`
z;?de$R7i;87iuso&Sy+{|EQvR0WA1ffAT^|s}#>itB(6j324Y;$pO~<g9$3M3sHJB
z*V?#c|BGQPAgh#;=EyPsyIEkWqr&$k@yr1;!VEX;JxRb1;6FoI_jgMSe3m@z3NoTs
zK{L3AF$Zg&f~C0agN3k0adYbIM5p;C^im7VEN4PPZZDuc)@V21P1cKMN^*Yhmw#*t
zg6g%5b2aT<P~6K7v%bt4tC8*KocyW4RU@zHjL{Ak!<Q`s=eWIEL*bH)UD8oDUc*H$
z5ouG#6c5^!j)$|(1y@w|dq;M2Q&Kxaw;{C-OFt`N^d)LZ9J-OUYquJ9$jKeJjEY&Y
zVNTw&U{U{fXz7jgs*H6rt9o5qQOO17gQLRMy<9|x+ZS=%qk59fkv<oSe2!Oj8`!nd
zv)9!})^P13M2bD>0^@bPRb14ym~kBD{~kao&a#7`XafX6V)4x%TZFx@SpQ3U9*m<G
zhRCh3xn+X9v|Kq3HH^-&W_kDvJeNCD@+ByF2==lLIqeGiCThnd;c*r<lv3PbS;$69
z<atXx2OfAX*lKIqvid=uyrzgIokbKC6_N_N+ePUZ!<hmCbF8+ulid!ZONhp3(1QH!
z%XNv-I-W%ZzVV$A8ZH7le$E(rJB=*8=H2!Rd`YQ<@WU=D(}HnAn)XiOpe&G7X?dv$
zek{G+g}OG|j?{_BIAR}!;I0^h%&PZ+7PlV8c2sce?g;YgdQ)N9aH;Vx;mEr((>E(Y
zH{tUbVB{zGAfJ%+j)x5I_};G@q<nVVN5`jU3jPtsEf91avuCYv#xsFmucD@GB$kM)
zNHaPW-?T_w!*};c@U&=x+_%Q^`HU)Arb+?ENqT6dZ1OTN@bSv*08<3ET*V7NHCT3#
z$V=EF9hi)E>l1jK!+!md;%Ve6#bEN-{E8M~`44G@`?pW>p|BD?!tc?+9SIBWx92Bo
ztQ5Nz+?UA{#WXB3!S56??QAx6Jg(BN^rH*DA}{wQ#!hUtQy7iPD)t46L*F1oC-Sqg
znNlDeiO&qia*KY&rAieeqsV#QEj7AfU6`O>nf+9%cl0EX<Cle5+<N!aTdQS_<%Fsa
z(~`VmXt8)ESE1m;h0v+w5M&Z_y#E=?jY=rrkGkw5J<)EtOaD)Nj5uI^P==M~kUO>(
zQqjGK2oViq&JMrL4iJd`m{8}i^bxI;NRTJJv(_%&aMy8a1-R2Q^JzvVT+Z~aC|{JS
z*F4P>_Z@k3%>2L>e{otlNljnx_<(LRTVI$by*ZHiEeWmPYP;xz+_Ghcx9bzqTU^0K
zuFzHLarUQoCkM3U_k<T?#k*~9>8^iD`w5xQQ;V&L*q#r#;$Xrs_@#nP{23r*tJK#R
zw-;*+{CwuVl0v1r7fn&6%P-s3#28x~GC$_|WJ<!ao@ti;7|ZvGu@Uwl2glhRQsYT|
z>gPxkUGeu*4%`?P9~I11qGj)$pc8de-xK^=`W?nhC|fZEqJK>P4go(xyHRYyx4IiL
z`aXfDnDxc7c2C{}uZ+a^=B9PS7Af_Z=|&Ft5Gy-Uu6$vh{drFj+`R1s0CCy_jCu9m
z1qNYa<5(~NXWWoW%%W5P>;{Xj1<_257C9@wA7^$tg&$CkbjPrIY!GT}F?TR0^iEUG
zB(}v@?`lw#c@`vMGlX>o4?;5-aPIb}5AYW>4qi()#+PzNVlCn9D%YbwlH<gGE>>A(
zYP^k9H_LHoyxiM+26fDWz_i|U!DMiXolPp}swDll$)8(Cs~w|IIrAF)w>Skb+dFIF
z-o6|B>h$t_RosIoqu!m~e?6IE14*&1l9t#4e!PmMH5G?i3}$7v-W3IZQPHRfgrhzG
zg16IqPgqe7^>aVSkpuPZt#|hnzF_SmD951Gt0Zq@4iVx|U6LT~DA0S+&6J9sx?;KI
zQG?0dP-UT_z5Wa}`Daps<0k~=3NQ09jr8%M9M4zIF<97G=^L2GP;%a9{huh9SMqDb
zNr5@P*~Oeoz2z=e1Z*BthKVVjNpcoN4h>6#ExwfMkZd;&S<>-dP0%j<O-VFUrKpY8
z^P<c4OLi+X8Yw8}#8R@O#q;Q$^)gX!A%{GbqvF`I*=QltbkIb;QwF8y?KEK|rk&II
zUt<aA8Fql57#puSh%K5*ej*u?TS8;1w!dkNy?mXKrX3YLVQDx%m3|s*w|?(`f4Sjw
zU-Ce^=Qsf3o|78|l~l7*T8u*mwf(4UU9Uol+>Q@vXeAvIp0?7-@jG4zNTvEGsRsDa
zTz$nMdASm-F&%>&$^{4R2B;2@-OsqMvd`k6r8*2<?t4)!8bL0bL%C0=V3Fj`Wsa+X
zq0H3h-*(YEyuc9e^Uth>32o=?d!)q5FEu*?^h@ONi4n#9s;%cAo#DJHFG(%$0Qt}H
zD*3=_!Uzp(G<#zj7TFx!I@=sl(mDfA7k!9v|2Ahhlh2}KY2?m`e~NrU5HBN#vp-%F
zCQ;|Q#J`80J^SfbT>e?E=gPe?o(gj}nPb^(+ytiP4mbGWni?bYq8<(PTN3+gM8t-3
zT4EUz*m-u|sTCz~Qqa6wk=%4npPMEm=O{=@Bs-J(OJz4TF#CtpZ)k<P^`j#)tLz}I
zHk<g!4gGf=$WjaJQE%_qgW=&@)yL{9r4=UU+x(gHU(L@1-4|Mc2$p6HUj|jI$Q8*p
z!Fs$N0Cp_qpS?x8LEr95J4@i8`c8~CRBTI{x{o%?(U8Dt^!`VNbH)30KfL#g!wY=7
zYZIV>6k47)-XxqledfJIJA7Fa4aLlE`$Vy!n37I*+{YD?es^pJ^~j9nx8QeF=o~8a
z1ij&lFUUoo=%7a)OHvXgk$6}42(-k{EnZF>6vHk5e4Pql_9E1&ga%R`Z*5)r<jn!g
zxWC^6kuQeCT3a8wqk?m~DgxLfW%5cb;k*uah@9;Ha*s@$4;|ha-}?tU(0tJh`xpsY
zq(5f|>IDS`O`K!s?x+lj6)=!qp2^EtXyck4;UtB_NPKI$6j{B)Ao=FCE1Fzd^;><n
zLQ0429dZ%60iUP@zJpT)9bOild9hXfagr#j!<$Uk_4|=6gDfSY*~6^B-$WDoN^y`@
zlI}OEIGZUk9JPLYlq)GylGpLb@;8|s!>hBcI}U9_#8{v?^_*TpU-or8yQ54ZjpA;-
zd%8Pp4JqNd7Z}&HjM*1rSA2j&KTJu}(4K!c7|#l1gYUjQO9~WKP7@AZnPLp_mzvZ2
ze6mzSfo66X!0)u^NXcXPQYpE#{pA(Sz*jahox-93`+`<Z>J$jmHcvaaXlWr#f92KM
znn_FHo?;A<Ftdw55-psR)%(@0xepiX@V$Geg&+UW->|SDj7AQZR1?_F-E5U>6`R~?
zBQf2V^oEvKG1R8`cn&zB#>JOfM>+g5L_?|46BX4Yp{t&tZ5ZO~!bW9R8R`BVk?SU}
zu?@uWe5J)K%0;-$(18inC2*pgd0&+){jtXCg><9mwWQuXnkF7mht}2H`bOSlv8CsP
zREquFvzChdaukn|j74dNc^Y4^%V?HloYUx0i0<2Aw2pk0>|XjFqLi}RM!$yNmtCGK
zI-3SjBN>th6JE~-;k||yXLa`X6G6;k^k#Cuw69E_t_)=TGvn=eT{Z6fv$`zZ|JFBH
z@4O!H#^pIROI2#ECyCe1Df3k6O3Fwkgv#tliLp%q0W8hG;*uOb_s6aGe2{6;XpYW%
z_*khTgn;F~o!T3p8cafYcFwAO$bHMEkxqm=F*ms<1UjaM5m5F!c7Tuq)Iso~TLChi
zkn^n%bI4<j<`3R?xZE8tmy0NroP^z<ip17C^JC3SCx}XHMD(l9>fNL={9b9tV_SGd
zypPS@hC@sjAH`hHx9Q8+X7<zX?)>BJ2D?iD51`OdxEHkH(2~=?=I1}y|Nkg-q-~;~
z@^OhG_?PYOZpK*Ok}^G$v|uGZnV@6mks?=1u+4d@T=?lseLx!13R)pnBl``M<(g7V
z^Lf2o1HEJn>vP{s=D85QT_Jl%n$0!~4rxv|K0~{@g^WJtww#gvqS%?$P57A2W7XTj
zNA9A6m_Hs3R`50|mRIa-;L390R6Gp2l-^b4pFNRzUQR^wT%D(nsN%`VT$2(*n{+Oi
zAiXd6Xik9Z80ahE?i-yfoG=X*l8sOiwH)E*7j@9O*tk#DFns_dH?F&L|K-|Dbh(NR
zxUH3GMcgYQ%5`hb<wpQEw0J=D*(f5h=>65c$ds^j$KhQ<9JlMV_D0@tftYOE;qh{l
zBC6~5b2d}SOpF$qrD<mDMpy`Gr{n6UxB4=H+vB-W-QVAJNcdyEn+wK;yG|%V^5kFf
zekPjnix(EA0cN>$3U+1sxEjo3RUrB?m{cr#wf`o-ID~oD1RM*-J$bRXLajd<t6STa
zjU-<79N{=0NZ={|MRlN~7zb9kdGfj8QosjRNs#=8<uM!dO=47VKQpge=fh~W;@JH+
zK2Ftb5H=P)`Q>BoHhOaTWQUettob<wR#_Zx(?ED8^@-_*f1{F5*$MJ&bxumPC_j;*
z5kLYnYGx6zhpflSw;Q8(<*hB1ZJNc;jqyhE``!4lT<NCgbHv(<V(2a!<Gb8D<~gb;
z=>Cvh+um|M@7dw|{>1C-9NYb9@&%cZOk&L3N*uj-$!F2d-jT0t^se2Gw%QYf%?A<B
zYXQ4NsnLVvr_K@Jg!EGnJOGT2h(~K%l`2E*q4?}Oe3zn1qu>3;TIq>87PT0zO`Xam
z<xby-=x_3^=XcJt2fsDzi{$yBR#u1J-sZO!B)DTfcwhVbdH`L@@_M(|7Q5^Y|I@>n
z7EC~<LS+clj7HSq<D1B-5xXzSZ<xN}rgc0TLzhsa-_qiD76osS9aUYFd08o*uj&P>
zVQ|vzjbVtXiJo}7l626g;rn>a$n)@Js*t(b(7M=*F~8PAgM7wT_vYg67T*&vEohkz
ze!P*J*s|<fCpc9A7=Jooch`Gw;NWHLtK=Ps$k*d-kP7SVUf9X$<P@WVx8IavH|Zpj
zZ&N`VEZJfUt+7$9ZSg;V)wbCA&Y}J^!E0nk_^!Pi;&wcI2^JA)OWB9_pWy6G5R{Qu
z_7vcbgdWZtE@1c&_S=EzlW6Hm2zLm2St7g64vvVqFJ=7RCW!MuTt9R0-SY+S(#|rI
zWU~2SOs@>&nsISICh~<irR{e1B!6~Pz9j!dp`+dXQh>7F44cdBXjy}A_nb|Uas4D!
zLAR%LW~M~!x(+p?5{hp5ED`W6Mk?m%esf!Qe*K!8R@$Ta^qF>|x%@>!KN$5HFOH~!
z<!8s#7iJv`uyfv6pAab5`<F?Hdnk2cd<WK$h2JhyaIyjKlP8})Lg&-YC8!P+`mwnw
z(*<fG#l}kOm;%JogzZ&&mN|LlX$@~TPTc9|{Eqf11~S>>2K1R&iitYb1Kp0s7J`^{
zA}!qpqwa<-nI&0$qnu##iiY&LH@XLWpYgW#3)`HY7%fCR#UvvIgY!+W1S8lXB$&pv
zK36vTIh+vXob0@JnyCB5YTKDmiRy>(>|deQt;c^8waRaY`G+RtEWT7?Va?qB{f0Mq
z`sBxtYUeIm4W}}5(<s>xX0I{z32H+DhqSz>=aI~_EG?Q}W{7gMUN#d+LfzV|--S#~
z3s1VXk1(X4ny^>ygpY-H1gvsuSbltK{B&rHHSA+=B|)>>-m{i4R;E&Yp!2QJ$mrhc
z(_wQ>ZaFGO^a;1#Pi%@mv{uwXTWG<)z?8IMJXx$ZcomrZEt$hG+G6D9kL=ftcs}oR
zf-|9Zu25r$x$j%be~cip+U347J`|{#A{C8%6>O)!7#aZ$uLsiu_or>&kupkw;tcoP
z50YZUwC2${#w|-sk`#^StF5iN8b$7`iXIkDplBQPnBFA}Rn|ufRWa+`?iJR1W+w}<
zFSO8`_`BI6$9|%Y3?`#xscNSVJCUO^GWJ3omDgXE_BEB1{}sZ%=JfXaGxCcQ%AST@
z?c;Eh%7v~5yosZELAza<@`uIvT}L3!KYKs|5OQ;coqP<Uzh|~Kt5Y0w<m7kli8ee~
zrp{L3`WCI{cu9hjiCtXf-4fyVH%w@2f*kL}8@Aw6c{YOq##^F`E*EepE3-lrWsb$L
zj9Snq<4iUEDoY>G#qJpEZfA(A#aN3^88H9w`y>vyKB>umrQv|QF~(y&o)4Gtrv*;R
z*8tc5Lp-d@2zS=~wLD~y{Pui@-9nGT;arq#@1`=RQwjJ=dW<L!|3neC^LuRLX=K4K
zLDwSHMaMK@%+)$-M@l!bt4p?gi1zW~r9!#~3$<|<FB9wQcP9P_uF+T*@O|%C7~uDN
znX8nnmK9YKu42%r)*GFgU`e#DSMAj5!uJrL`cwpH7k`~cl>ZyF<KJ*j3H&DJ_##^+
zv#DqU1hFu7#pCcb!<G!FLmuwe*bd-hsb-s2KBrYNB-_TsOmP#!k|#O5ku887OXD_q
z;$fRf$0P^ePK*s&^6kwl2LuO_sH9?agI-gSlPe^b2MDj<5_aRgm`pZC;4sTN;pw<U
zl&wUw(6{GEz@}kS-QzL;C{}=uIooBeO~m4GuI8#qP!+M93>pUh7Jy>qO!H)c@F3`r
zni_$ebDiB)4*B(is!E(Iz(c)#_aC(?MigZGV!3hBy8V2a>s<^KbWlcOoO9QIY0+(k
z4~kaCV2=fBY}}0}X{=smF#6wF&2QEo>FvQqY<GKO4vL0+uISVo&MC+tm_eGM#+F1z
z=a-YP=0x*;P>Ic9{aAUXO6EDMbZ4l%<Kor9%pPMv*_d-+n&PFzY4f;bb9UpOur4ao
zMFio7kz2+hska^NbFc4(^`<>ae-(AoE&C2m3?x1HV{9qENU9p%A){(-_#Myd!%ql0
z|7_HH^?DyI*C<^muj<(q0GPAz@W)5C@22#sDXOslf6CPVd7}M+h7f4(!frJ<)FFeS
zrbs*wttJ)}ZXQk+6bC^>H+<CKiciJd%P!?!_<tSW|0UdkTH|0w!E|u86OGx1Xm)ag
zdsxCp4P+%qJjDB2>4N+`_)=|B3fZ1`J{K$&0_R&P5QaV>Y`dq$>Q!M4T^%;|%LsAn
zz1kT8Eb8y7{E5#6RI+gt?XJJX&Tg`ts$4o9zSe&CbN?V4`m@>n9Ze8i@<L!bZXzs1
z(TZA@fvCf%VQ+^^?sSM|!fG@t)8TfeOv7ktZS)#++#ZOk#*FHOqtCz2=4FUgyO))&
zRqtLqxN$aS74w}}hBUw$XVQU;N*&?a%zVCH-Esnn1a$+KSgafS<zkbk=u)e{5|0rf
zy@J7a;}^<b-;ni={{dn;3)=9k<A7BahK0QW^AaO(Kl&oQy1=J=fH39Lb$MSMC*_Tf
zmn3uUY@t^danEx3SUVZj=y4*qH=Z}O+Z%PeScY^b+#b$lkgTJ*l!PM{+CH}0;j^h`
z=@0*&#}(-?_MG`EV}UZd<P-NJXg|>Eb1tUwsZVV)espIDt3mZ2%_Nq4-*$FMp#>fI
zbIc8DLONyUi=Su2tt?eQd19wr`3F-eLJlrzS|_D@!xS2zH1D|EAKg_G;Th65e9$H>
zLzd1yT7ce)pejv*Kk#}YqG<&tzcSYYOZb+`@_2uO4V^1Mj+&-=b0$e06tzFFRhF$)
z=6zGywH;t=Q8P8*Jg16S)Vc3<x9w2L8mOQj^6~_iBz|P)&hy_tx9&=vEAWkzaRY%R
z818QJvcGIM-etFbtSJ&EVFC#yb2+})+NjRI-(ires1Q~ADIZ}qb3JS^htaJ^dT7hu
z@_Y1m4`DcZ?<<Fe*i5m<O%$8;0GFfXiV{`p)1c<IrF)g;zSmu-p$<7+X>FZ80X&4M
z7-Ff?e$2f%+AV~>IIr4LcH5R?w72hkMGaH)<5F*5&l>0tU%+ebTWGSI3m-Z|2*#qV
zA<u@q@`xGGVfR;}0g$5(nLfo2QRlnm0(z~vQ9HrR0%1SWMzbLK&9_kns5-6TePNfI
z_g(eK3d7)Dw_Sdr0dc5_?i_6EcTWOO@!9qp#vP@^!qo&a`DFpDro*T34H^Ht31m-{
z@U=lrCp}2N)Q6}1(sL^L<m#Jb9U<t@6whPtBnB0I?)bN&vKurs<fl*Cda&boKkxQa
zYWlVqt=CGh+XYeOGG<N?iw{gGbYua>jH-a8oap(WZR8u9nKDHRuGajt9e^E?+hrV2
z#;eggG+C*kz19=KPH5c~>RtqS>WHEHkX?8C)n#WWr@;4OnunJBkwZ}<QqpfE!>FCM
zsYkd>P1eZTew_$<ap4Fv${ZRhvFkmaAJcy1a26sB&VgY6erOuJDuW&LWn;}6Kt84X
z``#(fFSU<u#vVn-q-I3N1f^;~+uUNJNW^_Ae7oD7G6vj~GD+tFi9@kI<^eGNy&Pqt
z6}QMBVEQz@?%1w!G%i;Rft-Bj!o)l^ICCyyhHk{t3cWyON^Iqypj#;`h}cf4?WY4i
zee{F_QN)7y?x2Se*C?Ms>${v+M0snE_4YrXneATE-1^V|r~@w07|IRbLZ4#Gof<3f
zKBNje(`QP#zs$+EG6G(k7vY5BAKac{kSI1+$5s-}XL^uCtIbyUb0T+qJuxEGy9Q`U
z3rQ3^TOU1|84tyFzUZ-MJVxWutuV#jV(t`sly#wAF(DCq6Dd~mz=B@>h-*)bI2*Ks
zxZ@kNXmI&A_XgbcUlPRws$$*Kj14M2webLEvA0yJw%O}F)d9vc5f-sXTvD1JSw4B@
zyKDqtvCm%xxI#C(XW1{yO$R_FJlWypVDM%PZN_l>y+68a>yZW6-^W`h9I)S|OpqAI
ziU6(MKSBqu%j0Sae{T(Nv2D8NfLk9Z^FK1U47M2>@G#Zm-c{(s0uLd}`w${_+wK@L
z?Xk?huv=>O%j>Cf1VZAz@sM|4W1&?lq-m73HCOcODAA_0PngE}uQ!RmFS4%=9=@|F
z-Lyb_&QmMv^1f9j@9Z9@<ZSsQZBcQ4q)-1Wqvf{hS;3pxdM*C&xKXCm@!`CFn8ulI
ztMc}6Ph-;Y@B6DJtg4EztK+~cRz}jrKB{DfmZ~`4mRs$IGQXqCSdYz2)Y6f~!e}kH
zEo}CP9kh|Y)Yk3wvu*xp(7|X72CG0Mw;JKMEwvrqo5T5h{XiRm_cn2)A483oC*!ci
zr{<swjE&b!eD_61-Q{$ZldO-UOx`|Zba{hz3Wqu*nAI~nf-1_7L~JPuLyf;(I}8Zh
zJ~rCTFCauvaOmK1*JT&R-G-v)cHQ=?XZoYYRPnC+(QJQ|58-s3dz}@N#j;KwP>Fiz
z6JTgWt;;8h`;8>}u60nXsWJv0>xvoNGe|bch(&NL>r?UQ%fcM=<I2UuORKUEMN38F
zBNXnQf&IQSPO$&HxRQ!ZyZ7#O!wn93ahJsNu?hX3qd)jYn&=;$DCUJ<gWnbxEm{y2
z4_XeFU6)GoGO)k;SAS7y%`md%=i5Zb3_iRhB69I#%L<W#b*^|_5PxjtR@Ypkl+m9l
zSiAYV6DQTu3PFjb4kWts;}oWPd3T`>;@s&@1Jz7xPjiqcDfA%oP-E~`G6#C-*xoi#
z&QQIW=?(QqM4yCWq5HY??*NQT_BzYCR^ZmZfBtR4w+Cbwzg*-GNGdidjDVW*ocR~T
z0Ud9IM7AOoRdPvnp3JBBIc{<8v$kudn6;pCMsyB{r&oJ!d3h5qvEgevSgPG7z|b9E
znl*5s3ac{pKAvu&;?ZsFH1Q=pG9TO~PE(e22`SaBN}BiF|2YOxSrl_~T2T>C+io>W
zKCX5N=|0?HevqBc?yC%(>oR+t4Sa_`gq-cS@q@khA%R5YdgYWlzgV~f`J_f;)5TI-
zGm-x7^BP4TI6DHUUM4%UeCFGl3*Q(Xer|lKxP=ko{5Zt5nHV#Dv2Qrt>aO@uje5A{
z5KPt=m-kHb*`GgCzBnv9fAnV8!kS;s9tzHUs*1{DPC;0fA1@V{M{Qpo&It_|oifln
z@+ec|8QG)bl@Z8RaFqWHNZwLQgtI^y@j*xvOdz4OuVCpX@ConwWwz|rNn8tnSfR$j
zs&cpw3Nj-g8j|S2V!GMM&YvhVkkn~j_aZas{<4<91jXnXJ?sEF8=v6R<FR9QP!Elh
z=BG$`-N<6~&1#}4V|0M@fAvdFHhU9lYU6}vimjPOlB4_C`C#tNUUmfITFrt}Q9{rl
zEMxl_M;X`G90rZtB3L(u^_&{e@0hsP_~kyzX-_zpdS0orCZ~yhGBZn?&8WBU(@K**
zu*@j{dftvWQ~WR|A4E{Xv>Td8EMvSRw2q1VU}i74gEo!yu3nV~gU^ZdO!JRfX!a*x
zgS-3S(D&->;qj^DP3}0~mFBxodhcy3?ze!5m2u2FvCSFfd8;8;Nz6({f@$SUnTSee
zcjInQ&GKlbq>`Cp9QpVpJkVjO@=UVDY(un)Bwr;t)QcgO!4Zx8UFMJvS9@0mJmB7B
z5*C2jKZvTg%_m7akGxf|NSoxxlDrZzXPZh4+e+lJ?EpnP;gm*GizJ!$MV6MV0oz<M
zwyr`fN6XO{aUI;gL~YKo>)9@Eg980v+w7^#v*!A+6EC%RI%y;GomSpMVDF=L`^jQl
z@&PG_+5JZFt3QyU(@jx$u)BYw^i2I%!N+hFh8Gn~SGb~~tE|R&9s|V~ET3(_AG9aV
zhofmUtVw6zgcR%7&{|UmA%dA_UxLRN7490ZXw`2CC_Ynd>_gXMLW;f(luNnZDboZ!
z%EDT`Mi;F2$7nxdR~3`r-@H0r01x%W4sVB%F#H0;kkjvB8bE@v`9I+UaS41*DxXRz
zGpK$>c{Ni95)(1MU>?ZXNCC5}W-tXUtsfk)H$nmJ<1dn2QpIjR)ceCE4V65Pq_5l6
zK{3Qy&@S33HlI88#d#QjSUybNnkv#rUiOFkZ=L1z#T5W1#WW{>KUUa8oZeqag%!1+
zo48ikfcwx|+x?x8{Yqn^Bd1<%-Cl9I<TE(Zaw4zI`W`tKdZZn*nd?6Zgq+;KcU5*^
zHdVfh3r&b*>jXxv|IxKIT-9Byq7R(X=|Jk?3!<#p0isT`8-csTGHuxl7ZK9gvloTM
zh~~)q)lYcaJ)(U<>1IHRzV66mk+GVnL*2}uxXzNbij&{O5DQ-08ch>ax5|3M_l4O5
z&uZ%rk*NOAe=3FFVw$sGi%g<ZhW8b%h<M??m-DF}zuPV%9dZ|ev`H7l0?W4cUU8n!
z2tAzR#*JjoH|?>n`+nU~_R^~;<v)n5i-j}}WlN^laz?pKZ>=HwqBDO%iPoj+ms#FB
zb{cA3i2@k_cV_Kf&((JHG{G&&!As!!u(3O7ZAk9v$hXu%pNXT0H4sbnw58Ih;rt|s
zxxO_c0a)bG5ltW_WX?B-E!#nMOGdM;$Vc^VslRELl6WJ2xf^F(_1-Thtn_EOAdu@9
ze7oON(+VZHu}>X#PfgGVAsc!$*2tUq1TIAt5mHA7kHbam-cuR3z4JsXINu4iQq4wc
z-Sx>H7J@o)ud`?HL&IBl_KlyFeyP&$`GR$2sT6pHcpkDc(>Y%ReZKn?nN1TkV?P_<
z3%`G|51R~UP9o|U2HsZUauJGx_dN)}v{D#c!hm;;jPJO(*;KyoBT)jcx~FdS8?;YC
zmp31VyU#A~eJR}48J1&U_sZED90n$;j+@>ZSu<>WJiW752h-F^iC_}6l(iY79UtzK
z)$set?=k`AILG~CIUnds6z}e99O2K`S&L&9tM?!i6_0X2n++}Wi*0n^J2RSy4t>%1
z)`v58Q4|e`Ued#^OIRas7_Dp0O4R@At_ni(2}$_Z==;9o!Zw75I;czF`ROZ?i~FOP
zmZ9-J`3DqV^gmHtj`v4h8YqvG`G}AH^PLq2QDH>t<^f}Q!^lT7t`CB?d@is8tx|#%
z^sx2a{rnF<KVh4;XVW`q-edZDrU}vr4O;B|J}E-kQU|<uKS1NRU4NUzt6Fz*`UbaI
zciiiqVk;Fj`0kl{{r4YFprfOyVO{jsXR*w)iAG<ays=u?j;S`;$ezTx_-&Z2$(8gz
zX()B^T*iN!TeH}3fu~i*-woB^y7L2y$?#nehzlvfU|au73Kh?f8hLl#3#7_GS#WQj
zf&$*x5r}xLa&d?~?PxDCJQ%Hf^9aq^V<>t!AGw=3M35f<XQ8tCxr;8B<GkM<LbxOB
z?6Nf=XXJO5duO+B%_EG^HZ*b)L;d0P`}i0Bt?frtGH*D?Kq5i}a}3Dng-r-=+jb()
z3ecv}&^r;qJ?dz(sV_VhQ`FpU2iP=g{^1?W97|I;u|R}PA6wwe)CpRAcs_S-E%|#Q
zIFQe<`E|}K;=~*dcu=YbE0k>a=yDpc5=jS05`Fp9*KUUsFVl0wV8DKOd()vDPB4V*
zL>VQ~Wu7rXn}I`xv5<12=l$N&4OJTTYAYV@YGR1kbc=lUSW+F+^A_0n&%`v~wVTMl
zWRyTgd&FHg)z?o$Zyt5wH2ga>@cILms~;vd=1%Yo-Nm}<yNWhlS01Kss>Sm$6GfL7
zxkJ?hLv5Vu%@Ob=v0rGzKJF9UC-bGrJ~op{rRjyABGlh{Q`<>79CFm1JKbKH5mW^Y
z-aRE&#tB`05lMe9gx@x(k|_aHUcrsbLXDICf1C0A<T)HtL1)4!DCcwhjtXRrct3f4
z7Y8JETztu|?Wc-}se>*!ZzTZxcga)@yMNO`P|X-evn0(QGsN~lV!BN7c0dyxO_<~)
zCj!!+z$}J0)PWz~6=D|PAIF<1a=?=aoC*d<9q%B#MpDtFm}gDe(J>iRqnZ~`6vfKg
zjZ&>I!p!^lUugg}nqmU~Maz4@T4gJwbpN$qffnI(-!aSI8GT11_$h#>)A28?P_b@=
z*8AUE{|f1MAa#7!)XlVI(79xoU3;f*o^64`CabPUwj&ktMJyQgAPkwd^K}ZsMrND2
z%QeB0P;xpR_B-KLeuPBZH^-G)O&X)CEijY7$v=H&p(He`PqWddgF{KQXFdRbsR#jA
z?h-nAr0*}qa(<ww82h!{^ZFY0cq0O|G2g&F9lOWtp5Hnip@h%EVyTtS*1I=sx;Vp{
zte>LYvPjRYSZ2c_;D4mviao568Sol3?B<o1Ur`m@LjE58N!nR%+qyPh=&OxeVw5UZ
zyp>>_KWp*Lt^&|}$jbj7lzf~0DBAdrZnqzn{eY;G7HocAv=%#>=X4r3o#ROsWxEx<
zkVST@mrLSEIrow4Q{5_EeysG@7yZJvUsa@zDW>DpbKh|`4`_CgvxMB_WWPR+N7s@U
zuBR2m@^tdk;SXm#QWWIEB{ZuziQ3^yAQkXgL!QM#_)9<5>YLk+^$DCK^c*?WfBlm2
zM_9{0i~1IfW0ghY{Sj&dI3d1#S3GG=Q_zb2`A=>p8Jt*-7P{&~ys23272gdi!Dl|t
z_uuSMi_EUMf5~b+SUW82In6yR)RM37P4z7XPtxZQFSan_NwWadyf+kZOcmb>+uz}5
z%J_f0Lilz?OHSnbt2VgU1h&J$QfR@K-fxLdnZc!0kLl%sCw_8im!W~6p|K3oui73e
zvv>{N{DtA#xbbCR89@<LLHwx=aDi0=DgZwFTyyL5r=M@R^LPz%_C}}619erw$o?Z}
z-*sCDHQD}k2Ke%mEPqu%npiotsPg!^SvhqO&$u48_b|T=TlXM8mxpc$+qjbWtFis*
zQiZOtMj81*XGUqC*8t?D)Z8zDb@v!p)hn<nlH^uY+`AnwdK>J*x_oc`GDc!ssIu1C
z!WnJO$Jk%JNV8O8*=e})ebiCXHk^(i6!<&RpPD<?Xa3aE!tJ^1*0T>ki?td0k_MfV
z_zYgpRkiUz)KB>I>tCN}-pO92FF7qMCG&olL}T*UolUHDT(PE{I@mE3!1Co8t_%O4
zSZ$OR=U0sXV5)k%C;3dT7rk5HTRV8~VA}T6Ec?*7m(Ma-@fmEg{s*o7PMP%Oqh-!!
zX8;nBhrgki`f5x0rE+@Bhb~DsE5)OEo0X<X*~L@Elb)#I9aZt;X&yRG@nzlU#WvM!
z^<@m+B<|wYwO-I6c|UlA9frVUkn!v0iJB@-0(yXpwTibWA%B6c^WkEQAV`U2b9`5}
z6fsQ@>d_^^gjGtPp<3%QFfq^)4fUWZ&J;fseYPDo2CiRd^tutAm%c?Jm#Zy3P_!Uj
z9mF*Qr>)jZb1^Q75a_vU9=A=aUzcL1QG1id>qDJ{C(e%tBE7Zkp3q8KJOS)uT4XEQ
zacF5+1fcup&o64b@(kB*M3M1wVS9^nRS6i}`zPc)c^D32c0>J-X0g20<h4^^G?!fT
zadXYiT64d?2#MN(o&_ab1p*BrV=?J7Q<i=JRz${TsWIj*`b9>*YSvF6lbic4wMxCQ
z+Iot=RZZu<_5vq<S8^&VC{W;zg#!P-fX!J4NNQ1J=Up~ndq7L~bGC1_Q5COhg6^E-
zzX7H)P3pA}dKvU$g+VPF16LF=jno$hw7+bUx06iRU*c{*oJjTHcOaUGa5gT9o<{3;
zGwCHyRAsv~?JgAKwzO9s`&d>lcR61N5_{897n*BRl$2_AEEjolCGq9dw3SXnw2(lY
zW~?!rv#T&r*xMlFXz@+mtG?)wp~InAQLd|wJi{D8y6|g+nlVjKi}uFQ&yr=JErhdN
z0f0Q@3Wox&PW!@-SF}LV&7=lWkz!QAX}fc6|5cs^;E$vdQwTI+1aMB5Umq{YO>|rX
zaQ0B+671Xk^DREvQW=E)x9E;L4cOgs>BG~v3E?t!myZB?%HvLdA^f4!zBqio+wr8-
z&+Ez=>pijP6OYzR(rVLi%;3pKZF$}JWX0z+pv4v?_Nh_P*3G@b2QRK-jh(Ut0SyaH
z(&g{{=^a<GgYD@LAsgOK&!<(c>;t<}-D~|qJS%H&$fgYp!=FHnFh$}{Qx^V#Wa#_g
z+oqVkBA%E`W>?_S^mvqWIxAv&18NK+rvA<Kp&svfl3$U`d}xEuH6NrH+G;&s@-Ml<
z|7ptS;ELsWcDsQ2yjbHF@9F40lILzB&(&~1;??%>M4w1Z++lR)p=lnyUpn&V^)1_V
zn$<S9F3Mh=pYg3%zx;US96pzk_hvJM{r%Opf|dvQ|0N+aOL+sX2>>eTR{tCon`JlI
z;|fXs;=U$kd#!g><C(0OtUYmcG-TY5Aa5=&=hj_B@6bbc$`JBRDx~)W=vhr)L~qX(
zJIYU;-=Ey<4yB8h{p-7Z87JYsuYt|YF>uVzeaI+Lzrq7<S?cU$74D0_2r}4F5nCte
z{EU<}sM@pZjQS<#e0fotF3Q2C6QYhG#Q;_;TW;~i1*19sU6QOrjd!j1aB2Ro{(Z``
z;5@ZYak;Rc$arNn*2w^pvhLK8@V@)?gP{rThKuF7ziZGmEu>u83YdGYLVfNgWL)-V
z%f#YPH}9Xj&y$93Jvw4zq!!rP0MOS>YhAb#Q(Vc!SA-uBrs9<yr&T7XlYPb1usBAI
z+_#CCUr&(YRRyw8+?;524x~8#cjqfwcMO&lD#_1b-e_1{(YecUaX;^G8r{E%e<{!a
z*a9wF&nC`saIq)Wf_*<A2qh!9FoUQRc}0}lEO#iCLRTT}I2PvY7S1KQIgR})uA1%I
z#(1@F`4(P)%lT!(hf_;YubBm%__3%&c#;$K{bddz9$syrBah*DNm%vyn{WY-QC?T4
z?g7o>LST!-c$7fbe&b!Cm{IQ>fo>sUGm~G1)=QVzH*=0F_>WppdCQWR&d?J~N++7r
zf`F&*Gena9)ceamMD1xn)G>cQ-Ds|~Kdp>-q_O#DM)hND9?wE;>h_?Aev1o@`ACAA
zO5U>2><{Dk$Dw;otJE8#dUfg>`;JmqU0%)`W7};rWH998Sj4Edk*C(SC9tq2^SyZ)
zO)M}4HU0U}Isz<{gu%A}W8+QV#?;RcS7k(?RW{M_!_7CXOJvW5RZQGZlyj>qH1mzP
z%O@(`f|+5xT8%-iY~5`#$tRR&+bLLI%(gr4h`Zyf2tSBV6=~)==P0Hq<a41tXnWOt
zrCk|<W^FFkdw&~9Ftaf2^M$?`vUgS9uI*J$n{a4G;5T`>{=Z6qh*3Q3dwD|#-hnAz
z8C?aER@jbP04ogpox}G*zCjK2XmrzX5&MirG}Z5`+UPhIi3AiFvzug8v!Ao~(0>ME
zV1;4)9aPLG#F6Nb`a{Hfm=ah$oNR>7eZo*M9A2vPXtOIjrQpG|=j~rbut?ox(9B~1
z-=b_enmN`zh+eC+Z1+s)gAI$A^w9p`VV7WvPB#D#6`$6Yu%70XPq~)>k`xfVn(ttL
zdLv|KR@_+jCUkqa-iiY9-i2&c^yZ5Ruk2~`o`w~vPKy5+AMf%5jy%y1zztTEw?;gl
zUy*fo_@^!5nes<|9ov;c19o)lm0&vbFGk~NUmnl`{7m9P!*g(t%F(SJ7}xPygv^IZ
zDng40)<V%ks75k17+VrKzu~+aAyq_g_Sjp;76Hd+*ALizi3A~Uw~}e9U3WZ0j7A`u
z`@)lC`4W3et1om$F?9_3zm?w!usu#E+C2UB;|*}!=un7TuZu}|?|*)3^r+2F+^*Wg
z0Ye+DLnnvKW6joPQZbH^7ma0RYOcz1w*!T1T<!m38?iY?W>?mRyFF;&cA#}Re{x`k
zH&T?OINO(PTdZYNz+D#W+*p^sxX$(#&@{_e>I>(ksb#yd@YgjKy__|jzJE-u7trIQ
zJM0Ddz5eFd+I+hgOj|>t);5y%hN?rJFIm;1w$&fbt8i(FW4bb98#9e9u3?zm;(kFQ
z?c){qwdL$-$kVqaBbJfsH$pgcn!Lt2k^Q3N_NhD4YxO+YFZC$b&TFizC})M&=c9X#
z0bFYA-xk>Y54$<n`WP<m2>`wKh80Ne_vxWl`~lNW$yNc~^a1np_a|tp=`%QhJ6Cz-
z9c_M@9$hBL>uO%)a!}*)a8KxMz{+&0przVQ#maQqPaw8ee57=|@*5>3P1-HhdEk}V
zgh7<S%Rr^!-n<Ps%ZbK=L8eS)@lDRCr^H~&A4#mHr~JhAzI`JM!UxHFHuW5;@MC`t
zo`A_t0pAnmj1l+^=d?Hh<ydtTu$`Qk<Xqu8V&+{g^a&$%qC@CvFZZAGZ5RLg^L1Pg
z4Qo&(LyGB~O51zUFjzu2Mq+HC4fq^?7;HcfHb3wEvH~+YqEyWu832d-RDI<eur#VU
zVgD!4Ka1*x1CX5+;ODWZM_Xkdx-Wgje-D8Vus(DiIVXPT*Z>wm?MiJ}ne>wppi-OL
z^!~?3L#v2Ci1en$2^66*_SoLepX@0#P>EnxTD7MJU<<mjX?V0;st4xIYoM$XJIqGF
z3yiW2<#F}^1z~e19(|e#V!|gEYV2nRT6@b#x#y4nP;lG#;V^UkrM(1TU00@-?ET9)
z_GhJfS$^c{R-r*1qh`rXR(P&H?3M-`=3!q~t#~L_*|9&i5JT+4@{c)leO4+M=|he7
zpKkD5dO#aX&dC4}H4J<JQ&16kVS#qGQw)!nv-=Q7G`hsC4=kV8c&xooa?V<ZT<X`%
z;6;y78&rCqV47s@x&8bvdLyodQ7Z39`dz)e4{t)G75XW(Lj>Ts75KMej0&Pqh-!c_
zuq;*dE!U@cGxz(`BZWzQD&ELnh9*{2Pq&WdX=J-cO9R8B(C&nkPAE3=6ug^F@oHa}
zlTSZcj8uq6@9@5$a-SV|(qi+PuQQHuUJ0qz+i#A`G&=-+>&LeV3u853Db?wC-F$A>
z(b+Re1=clemQ|qZ=h7=82MTXQX}1k<u(iuIvqucX!1k!0dNSgu)3x9Nhog^q=3AtS
zr5|h9aLAvjJag0!$kZ;=c}X*FyW^spLbp&Z<p0`<|7gD95BciI&^l1|^h1bR+uT2-
z#rNv)6^~v@utR7ZwcJ0TxRPwK%Jsh^3@|cG-<U;LfR4f_m|-!Twvm(tapKE>7c+P9
z=OeD0POR6vPxMXMd^t&Zkia;h_Y3}H<(bs~QXRGz@oET7y4S)76OomMo0ULll$P+?
zrzav2|Iu#9!}PG;B@lmAB*<^|^{^j9TMrR)Hg|HMRzbhDy|Ade*IUmt-DNd<mwK-I
zYI2a{+4~AHY5!2O!^{ioSH@po{vQ?qo=h!RqJF{caK|mZ)-LC{ee2JBYDbFvD#yZc
zw%xuHc1$O#!AB0Ko@?uDlf}v33Lote>Y@cLQ3tu-Mx4DJ##t-oLF>>&$D`a58DDvw
zRepBy`X5eQ0Q2mof6ojO7(H4l6u+OtH377iU|fr-EdP!@4gplt*mycH^Bz8(*Y@!9
zmXIGVo=JoufU)*;3_a^|sO=?*QE|YV>W`W;dDRWBmSagg)T~dmTaitd(5(U5@6qH$
zs}GuXK`H-0JHLSu?tB4H15NQL-|}lXb&;mOe@ow0>Is+!^HV4CQ}?quOjvBN-}47c
zVS9b-H*Vj6+Wr05Y{j^Q+9~ro^dRm)IHO+0P`ol_brQgYQg((~R*ZmN=l_=gdH6R0
zQhbBPIgsv>j|pn_ggYeTH&2REs5I~WEsWX<rDS$P-9fDWtSgX|t3ZFS-~=FbAzXcZ
zT=<|i5So#o+!M%yW_SE11^0)Pv^pyjymq%w$2WuDd-pW*{sy8Di_4B%w_8FL?{<ds
zmo^uw6sdezma%m*gdQH{^x3HVHvMZKSC%>DBm%SaOSM+-0v!^GnzJPi6!(8_)7PE(
zqeQ?|k2$^j*|qm%wt*0+a#4`F^4hxU_pXBF%7u~Mh(KDOhpzUQK=+DiyRG>E6~I!g
zZ$=2KSdiO+y7^9s`fXxu-`NxILw7Sg8JGV2b3jbT1Rb6r6e`!*oL;I3)d{3r3A-$A
zTLw5ID~4>M&-Zrv-jJa=K)gGdUuxfbQD@_rR-rq_3b-!z)}72233mQg26V{(X$_XE
zCx7E}IJ7Fxn%p<nLx63jM2(EiRH4#IE233bKxEW=1T6EUv$SP*A&$LGB2L~68VS}O
z6f9Sp3|2&qtVN5ub#q*GV?w*rH7wp`u76!GQ8l#P3v$0q;9PbKp;=_;lN{TOAk$}l
z4Sr1iQu)mPhm*+;Z3frm>G53*oiObt`hX*c0V1K#9`GM-xzxx|n2g-4p|!KCrhV}4
zK600B<F`xdMMSD()j?~PZ=|JZFWTyE3q#K|j3iqC;Q@7cZ3EZ-zX%V|HgGY<|GcGz
zOU$4XJpf>TmMe@Wsb^%`S9U~2?YO{re6&_t1T2mWZM5b5dOZ2E^m7S|l~}b`7HpHa
zbqi55yx*CMTiq8ZD@;+Q&s0Z+2d$xcO=()3lD$hutaqy4@`lm<csj;J9Inz5t1YGo
zq+DlKz$kfW&4Dlw9aT^^1TyN}fWfCEy~a|e^(bcZ&s24D#Z-d^f|`c(vM-lW#xER-
zH2M8Qdg$`%10xAo$m6R;AY%GRl3aj)XyZn!+3StX_^(tO!q&Op?n1-q7sZ9r<GD(z
zM$oI8HANvq@|~RbG5bxDvlip4!Rdz*?wfH^u`OC!TYO=0f7}nIlfOyO1c_4T!SnsG
zFo&M|L|5+;{6WT-S|*QNN=4FG4lTf1{jm2Yv`R(pD#PLe({W!Nb5siyU)u5AQ+prW
z5pQ16b1osGbnn2h8^*pr+v*p`<27_Ly^a?t*{M=$V4@M*v&vd~r>CP?(mDS?!3d|t
zC1A%v7nrq8t*Tj4J*H<6wD4@%RH<a6-3uUQuzJ&9{WrUG)nzCzlX@uEA~rQ@>*nrq
z!UBn5@zSou=`H1LC5)Sz0D`9RBi;<8Q9L@2mQYP`Zg4_a>C|kjO}}S_ZT!g_5QN&*
zzOhF@xKWoA!i|{Eof@F<!$muS?{<i-nQDhF9A&?jd%!AE`RU)Fg*ZgqzdHc>q53uR
z=cxRF()~CvA9}3n<h8Cg(Muypsn6B5jQ2UY|57Dar!?GgIxg_ro0oE$-si+SImwQj
zMvb4?{2y4`_rI{u@F7xf-4~J|JTJ`R+M#3(pRkW`=?3F-`kaw|>Hv)eEP~bkOfK~D
z_uKuJV9t8<l%P>&Ds9Byorh<rJ%Lvbl^(f8Idj8#!+O>WwG3{I(WXPcwesG*DbjEF
zigRg~Fx>+>G+efsD$)^zp8H8!9%FoLv=gV!z19#M>dAdenNPwnpHrGEFreb?LHtg0
zYoIO6_u_hTv+I>`0EAMno{)-n9dk)W0wXjJ6cB!4a_9$diA*|LUk9or9CDw9UePsJ
z@%BWJ^;P>@jAZ;FKkSc|eF$KS%q%}jU6?r7Z7a8J_A$7KFG$s%gALDGB!)iz4k7xD
zs-D`h8QeIxzjI~C^_sZb5Vjn>xXT?(-aX$c7TaP8`Tgj0Sd?CoMX#{V*yPF89$hTQ
z{F(PiIRukQv;7&TwC{a}R=FYO>LPlh&lOHcH^~orN6VaN)aAcF{jp0;!Yuw!9O0RC
zQSW+L9fW<Z$BzXg3SDgpMH&2>sSDGbm5*n0ecC_MIAJ-WUb9~lUwn(mS!TSyaorhV
z6~LMy)PWMyJ_lG?H1F+Y?(em?+ioK01BPWWU)G4&9!~@Z8HrG*h?t#P9ZPw08iW#E
zB3E{*9UmAQ1Hbtg)+r@Fm+p<a^a3k=mO=4lcAbO|CiAYpKBhv~P{yw41u;o!4tx-c
zr8_L~GD1<ch4HQ~sg4rZX;B}u?v3a7;f%i<*v=gkQ`kOCodDRHW>rr@0cwqJ@bBP1
z(l3zmZio>c3D0Y8sNUl9Xu72^V4?yqelBRgg6TTA_4bKXZj7JCn@yUIq{vX5cs2Ra
zwkg~@pYdvgPvS$O$VIT$mfL-I*A*`IPUC}<&aVy_i298xjLUkVufC(O39O7HA$jc<
zTL4xXl-+5*2`uUhGm!2VPXja=_w(@vrb+-80g(_1DV}AoCj52}a8hY_1gwTg`d#v)
z!dG@IF1|s(z4-L&8tyUv_Y)x6Jn0_$6|vD#<g@tRaL$DSsE0KqTZ^f?yUo?&Iq3*v
z(YQwm_-r~gdff)4OSSm5K<wwl$>A}cp9{2I{C#Y34Q`7gOi;U57n=Z?j?EcWMfUFa
z?pnRVm>F$KPd6#1uV|spf$QD&&?_JtpjDA3^Ss8gEl`fL@S+aYeP$*b-QKpdw2+>9
z-<<j@))f^O7$fJrpTW0xbtHm6Z?aXSS*R27I8Ro4S=e{?FM1lpviAJAaFkDYvLl+0
zXv-K+2EY95CPhM-7WiJ_;|L)^{yB<|z_l1jA;?>5680%EBOV9FB;9|<Br4QI-W$~;
zN%x;#&WoZ8w53!#{qgC*IjCr@X2IIW-Bql`o5KTh#E9h}P^;d^EQg-8Qf1yo1dg)4
ziWO0x*$~18E!HK^-vcY&7n(&MG$vvgMKXBxH^2Q_oKZ40A!8NNPUbKeuy0+ft#n*r
z#I_r?9ecHRVd`H*sZumv#}zMLE_uG4ICVo}mXNhjJVZNMG7R9&_z#U}&PFB*T}7E`
z>BLEml`kZ3P{nPs!w>h{juxbPS+FbXg^3ne`Y`U@ZTGeBgN!j;wFx$l>N)1S_A?t5
zy++y~eJ2>fM`vS<;Nd<+fS!K$ZMwCR$Jin8^Innqz<M*<z0cy6{n74P?iAEKOGNLv
zsBFam$c{yARG91MS*0@oK>Y!DH^LPM5(D||0b)`rv5v&CbiFEOr_Y8QnD3@R62QZ#
zO9{3|hT~`hws?}qi0~J*Ft7+p$M*yMpqj2RlEUVTijgC&$H(BC^+&<)eXq9TkRRdF
zGI#XiemWOl;*@+JP|rTJyiy)^oy!r#8YInxOMi)D1jeubL=@bcCWjWBb5_3uJ=vj`
zW}8TRFl%2lCO>!WtIfQ&_L7j=lRq^lf5%RPml)7mQ!+1UXZfS`dC|o8ryUC_R0IN`
zB9vzS&anF$L+mO6tI$+;j5X?#rCMUl(4QwanB#L*I~=Be`RSD#7u3H~VCI^?Bn_1G
zIR2S8{E@cT24GSDKkU7AR8(KvH$K1sgVdmOhk_{GNDPfdiIfNfD3a1K<WSP70xI1h
z4T920gOqd+4Bg!Wzk}cJeXl3p^?UE<eV?`7f1Y*zVec8{oU`}!xoTf=*s5!~$OHfJ
zxIK~~r@z02oHRUreAZiETx8&0gtWETC;9BBNqKJ8S~DU*cx@Gs9<;q1%A%Xnu?ny2
zI{D=IVMSW%O}}pGP18En^4kuKi(Q`w*H4syEUYmId*_joY*)F6d0$ej3M5<O;)ZUS
zleja^U^lW8Q~8EwY(=0g_%RTuUi~r-h`zdvQ8^ZJpJ8Y6nl}-ugdXBYmR6XERz9?(
zZedyk-uGz`snx8P!on-%BMT99@UriBcgw!wjH~*h-8JVPW#3$7xM|Dlx*G=JOU*-h
znw)e5Cul?}Ljw-^eZ$_?z5Aw(r#89`ZRBFSiihh*q`%T?e<-<VZ;S&E;2`(Gqx``u
z8M|T2Z%?1$ZrLZ-x@pPmT!<4%5{7pt@$!l!E@Fu-L5WxBD5=x<xfGivDVyCshft-W
zMzQcj23L`bKR{n<d1OwmgeATnkrRbu-AkQN!{HKzuI<u)x??5s7)M>d_GEXJ-6xo+
z`iSy*UykWQ+owbxDbQ&jr~|)bz0H}Mc{V}JLGR`r)$kr(Jx;Csp)S{wucJl%fH|>(
zr8;v0cLc&l(~f6~GszQ1X^|IO`j6k=4%zc2TLY&E5L&i9{e0K4vVi={-BQc+hRdmk
zgjByYF*7r@k%y?20xS>xqN`!V)YY>zq$Bc%;-vA?QTdpsCl<$LErRSj@x3xH!P?lE
znXZ$#GL|Kv9%Gl%`}i@wE4ZumS0|d8bn9Lf0#e2q9g*|dpV``i@mzWiSy%igpV~F?
zr1zITbEqYMy0g1}inM2(Q-J|wm&qVeIpBYOEEN~lkoCH4ELlM7UML+0&vdo(ty%rZ
zo3_u6+xR_%Yy}=i5|8ZOVo&wZb*=YYEfattK3qDtobrxLu9x^H<@}?v)IZ|)|5<9P
zB@s7~sL2H8J7#?6;_NHK)|hc>RoKqe_85oW7SG4q=kffb0xGw!96bf5#U&>?MVU8v
zijp^Ne>K+V8Q+{s!cjW3YJqZnZGXxzT4b1Wmn)9_@y*AbCH-bgZQ(Q_tqtYbK!PwF
zDuB)!e2`7lbe?od6aObJpBfO}S%ZU;Qp>h)U}-6kzLa905ATRWZnxJQ+4{F0U;29-
zT$~DWf)|_TcQTZtRtNlpPEMRCWHOtb@QGw1JtNlPa9f^0BQiMB`6JLhl7`=<mQE1s
zzSG=K+y~wlcgI*?Y5FM;<bfh}D<AAd4nF<D7pIymZDF3WB{hxJl=Pr-F!sqx-Z$jw
z9tb=-jO9ngn+g*x5`DUDdv1>P=A$1jp`(V-7Lb7Av<CiUt=^<p!ra@q)Z~xX-vgX+
zU7&rWUZGN1x=f1LO9z{o-@f@-jabFL^Emp`Z$Dg7=QW{^e6n)F56Wc@wg!?e70>zB
zQqGRFC<|_~DG})mGD#vny+H21OT!dSL_I0$zPuAk)vOT$%P+%mcHFvfyRl6rt6%x{
zl_SvQ@oaPaN9#v^(FYIsK%wIf5ofmM=?WF6+r&2pb6{>e8f$r)SqBiJ=RkCxndMr0
zel3y784gj?mW#t-l!h2y$s6KP`<}AP8!LpSB2R2xe*NHTp7p>3Q}Jqz6naMh@ouqP
zdf3V{mnd78$JK`*Fml(_Bf?9u=B7@O*=H8%7c{K=f}{0U-dgUVY|;iUF2hkBIvx?H
zI~(J(*+3M$hxLayi!kpCu(WyITk7kO_3eh2y-!b8e&887Vg|+nf7T*8xF(riSs%64
z|8Q7L?|A2n)55L$ow^_!<Fq-Zg;XYOrDq-+PCj&TS-5&|R_uz7?UtT!QCpZsEGE}0
z?9Lb4Njvnx^&>wKM|HYWOshyRRZr-g?wPKhcTU{mP@qK?|0;tQ%iekyJ87)!dj9Ps
zQ~Ypk&Lm||l-H|z(sc_3LEk%AS-sVBG6y6Sbn_&y&4v$u#%dbQ9~EGLRX8YmZygP^
z36i8#8I{(bVD0y%NW@bby-L)>xMie>qFtF6fJl34li<UV+(U<@R7K?|H@fLaDrUk9
zoi&(DtJ|gtP!Si1f=@?=9+J8K7@)f{96n(^a9!j$pwvO{j#JE%9KZ2uHsv+eX%}{}
z;{qCfB<`L2iEg|LI?OyLWinrK)srsI+P6P`bTjCl*Xq=dav_(Ehn)4=^;#JA?rDnk
zrnm4%DHqEpRZizScX6aPkJv_wJtRsu_Zwa_9lNy@U0pG)&DPDdh*^)$UXdOyOK(ja
zQgs}^nygQkS}i_0F^VGn1<JFf`e|E53bggu1e$o5NcO`wulssz?9L(GJo^Q}_-GY5
zcAjsTN-3@h`Mug=O7dSus7ZX~8p<S$d5T`SE)XfvF(}wmO}?{f!{7LYZnW6-jzC8r
zkO3(JWI*DbhFscoK&J?ZnkWy|DEG*dp8oty!D6z)*PJn;pjZ222A{6E%k+sw_fk*f
zO7+FT;Zhs4AdELYN1^lm(Dz4zwnP0b#?jW6B{UtXrVx=1HKZhajwX#C@qG88MtwRK
zvn~*vkab+;Rr{G0_ub(pFIDG(xA+?R_?s2|T<^u8KXI;CyJ~i-k*4vp#uptgOHJ~0
zHtmO2=AKtS=M+Bdh{>=RNPqZ#U58+3ynS+~qt%g96y)OTLIlk>SeAchuTz{tfn(})
z(9g$8JC^a=V|!5aR{Ke8>+;)4ji95=yJ}lgajSrPgcJF74=CdE%(Jcz@NtSfvTd_8
z*Msol0BLRPr(e?(=k}L-(t)Bac~M?<8Z=tmdry)jX@G{~Qj1+=QX(cJo9tuu`C4C9
zu8dv<NgBFMHVp0Qt$c0S6|7Z0<{4TWR2#Cctut=i-kLtoy{;ed0dVWkt>~2L+Ml`X
zeK+?%N9vykIXnd%PX&3s%&_rGihFTc1ZbuE$_`&GF1`c(Xt@D>r`18y>kjZli(U+W
zB}u-Le)c6I1T)M|f!g_0pp#ZU?D^^Hs??QYN1GgeQp;0K4%H_oY-uDRA_6P^+yaV+
zM)`&^q-F-Q-o1f$_n{v1y~_05yYDM~o?%Cg9>UDFB|MI|Ha(8(UD5j9wc|e|Bqa8G
z5^Z~Xlf?&jL0|TMx8yD=Cx45mdqqr*AoSX8)j2b7*mFA6(&;a(B66~3@#Pv>@ov+T
zK0ReNM2Q>@cWw#j_0~#)gZk?)!@m=gHd#Zh7jtwYNWIRIpUe-8uA-NL1h3JY7cQL;
ztf=bTVm&o|x2Jut4uS8*k#abP`p|x9lrIr1NkHUtz!Pc}yUZ9JX#G#A%8y85sZNJk
z)%y@GYg3<J?^e>UBbKv(kRiU66ZiI{<1av{DlhyoI>o!XQh+`{FU2oOHA~6k<>Mbc
zq|VE8D81Ee#frCww~x2%jN^Ex&X}b{8Bf}${cjaCd`1U1qdyQl^qY&hyJuaQu(BEr
zE3dip`1~_&pl9lpoVSX-&xHW_3h4@ID5wp;1Ls60i)G^!FPwu~jW4;nwVl8%_Yk^K
z8RDYX!B%9&;S*Fqy)(<SH|dnIgg+xs^P|=P9v+$h8)?4(9zV}~(_<s#j-8vI!SSZ=
zG2tad`rVV_`>!R}t&WAx55@+DVyhM>&9?i)v0L@qGpX47-`|0OxskUQ2ai@)N9A{-
zUW$&=8X!-mytZ)|8CkP_RZU4Uo4a8asW#kH5`?lm0wqzwG0hU&^@{s5UXx!jfl)gL
zD@#Yvjq&=>lsZiDDpJ1V?aL;{h@ASf8(!y|K%=TXPSQsR%Y%n!i=$eGiyxMWtI;;i
z<wb{h<9L$P-VT^Cbahz}%CVs8J#`YYc84wHSa}e3mh8dEV1J^)*tbV<x_JyAUwKOO
zQ0iRY(1ypL50CHdWW}zte&eimiSm-@*p3N0JA&n~9Vl>D+GLO%lXHMZN5Mkw-Rl<L
z(yzySL#7_+7`kvyx9r8lex@nem@_1oPs@nhdb~(s%D9NxO6bcFVLi~Ij8|^yK7DWI
zp@$}&fd!l$?rxaX@0DF1?XX1+Jkd1FVy`uw<zVW~*hr*bH;vkF4<gA~=1`fRo!Y#W
zTR+cof^!75R<Y$Su2{Y$&qT1oqFc*)UNf6Qc54=TIJXD&<XT2E*?J(Yb^D{+A{ib5
zjpD|Gw0Cpexji69I`H*<p4wEVX}9*x4J;|P^y<*%F%JY+-kai?G)dmyyKM9q1&4#n
z#6QgVl8}b8(d#GYOvrwkX^#N|SCSjn(5bJy$MucqC#u>cQo?V*46YjkEHL=3xQ}uD
zK3JlI94Vcw)K#?sp~^hnb7DtM?h9l=7IDV!UbRa-$!HHAkU?G6c&;8thHuv2pelfk
z23?GBz#k#MuJ7K}J#U|{hS`?apFPZMz@;NKmGm&}BCKfNs!=|G3@B&U3dAzb?UsJ&
zi;eP|8xC}ZBMwS~+=#?(r!RM@l=W<VsNHY<7@y<ttLh?fiA9XBLGN@ssp`$ZR?TKt
z-@fEaMn8|hmq2tYF$HW2-mK3qy3E3s^tiIS_uj~7^S(-1E^#tGVqIe>qccv<?uL~i
zP8^3}i{7(}&-?p5IWapQDm6Qg`e$4VJ?T34?T{;IJxTQB;tt#Dlp`<SS>;Bh^D%>e
zuAeLK{wUB#v5wcEJIv+qlei<E*TDdG!z!EGY_M6adI|ulf#d-%WbTuTJ=zK(1^qTM
zj&=^DC$^h|QZnBqM>~SZ%}$B2Q8XGq9Nt?8mrG_=i{|LKb#QBi!}(M?^pf%l(=#Yv
z(o4h&#x`c{w~KeY+u*FzWiir8hBo5I=9#>Zq9{K1xpDQ0@r}g=$Ly;<5ThSv>dmo`
z$9j+GGcBz<&JS`0lRTPmy``qR+OL@6xzh9ma|YRuzEF3OJvtSdy;Ysu!l=|Yl1nCi
z+M<58-UpNP-lr(_fbc9A&frhGmltP7UW}|KN?Z54*Rr`iV(*JU2F6_;WGH(dx$N&j
zH)1AS7gk<HrX^cDCB%MS6!fj!{aXAq`~CZyY&~c-qT`)FD|g6IO!KDeG};tuef{^$
znP$5x{(xyb+yWCaQvpnUmm?pNFX66}awmT^P~+O*6KL30`9Y1OeAcp!RC+;OBpY@o
z*SG{#ok;9!_B26>PNYC|o7AOjIoYFsq4UG9*GSBv=;5YEGL7r}!l#U=OnuwBm<Jo>
zYBF4`UL)mbj{XnL${tgfhdL?hAKD_Myd7D~cF=08`Cp3(zYN!(yQFHc1r6{>Y}4}<
zqA-o}QT;#PrF>Zh+Fi>ukI5YG@B}?GG_0q3<Bvb9T&$L2oE`r`=1^D)4D_X?Ii0<-
z$^KgO{nvi`gl@@$zAxfE=K3k3%BN^1<mDrdl;2Y6FIA;aZ&zPdf6Y}{7a8*5CmuFG
zJ`{b^kE+=wJpIi5LdYy*fZwSR>-^aRIw-D0S9jM68Yp(Gk<ngVr;lI5Nm9gQkDzkj
z>uk?ebQIaxaeS_=Rcf~9x>8iLwWx?2>omzN`g>TXrq*uUc6SeIt!5PV#6$X|QEI5b
zLUWR0J6H1jgBmP@&bBt9i+bBUYETUpyH(@LN4J5$Ozw8%hs)IeDhl?<YP5)ObpXbT
z;aRw(c@`L_P^^-mdOYLNut?Q6cosc-w(#|gI!cnPIALsPlzmV(=|S6paZ?+f7vj9`
zC{tqVgo(lJb$qngv)Zd--O~3(HJ9u!%HI^ex#e>AtfwT6R5OU=JmBD^n-4WMOmtV#
z@cG`;{^iXIP5m<z#?>=>-Tk-4!SSq>r{Vr_22Af_>zpZf_6OBz4RJ#|$al(*{bO>B
zqG_vsZhkc@o|;VDZulSJYj;riF(z42{8S~kI^XYcSfxTr+MS?_K+0x}CH0nmYLf*B
z3~ZzVsq{teXE~Rz?#A<ov-mn(ebVu?uj`#0gL%`cqO+}GPeNCdC2W`Nu`oTM6urJO
z>8wWXU$jV@LSDp>-*bIY?UANoZ)`pr{tUwSoB{&EVg`YIKu{324Ct=`y<F-D(0qtW
zcIAaAHocF3ff=NbY2!z`p|#|2%omZjN?8<H&ui;~iOoj(%TnT>%^m%W-X}P83rSWb
z5{i=iy~&^v4ugBVy%8H9tNH4P{-vSz<A||a35=_fkJy<cz6e_>&C8C*+i#K1BGo>y
zOX;lVa8$SuQnXKP&`(%xd*w3F$ydIe9=RJwjVRVTr{cam($9ar-I&M9`{RdO#iUJ*
zW{rVMnutWDanP&P3g>RhGgr)mv)!OO72oWv9%AbB%9kp1&X0!jha-V9n@_ra^=2YR
zG4dwr7aUi!7qd&zd!=aab_Q4VD8at|B6;4Y?jgw@y+6G9H+Ge!_D1nT2726QLM8fH
z+Dhhsd^h&T^L;;{6IP!V#`8lm{cLjA?!ip*<VLjogTc%5ttW5C5$2eN_3;y_1aAyR
z)O|V0&AO#dfTw#?h$Jr>jz@>X<hY^XG{xUumROm&)RRzZuSY<@)Ex&@5-CVyin}nU
z&Sw{3^w_AR^B7rEuGuOpF9oVwu}xIJr7N7TzgQa*MWiX)KRvAzrvo3a4Tnu^f5ZP~
zKK|apv5eDSO32no`ZQ>99dk_8PX+g)xb?%bt8dFIQqn_hX^!$^b6=c%IOUa5amRh_
zOF1U*6Bex<>|FKsCz+1gSC9a+{3zwa9*OY+I+q7Kpb3wZqYYsM=?K~6t}2~MZm`=P
z5IJmtIg6;+LBBib<VY!3Mp-JmWm=%wos8NstBsiBoTJTSfd!rLW90dv>x;8}fti@s
z1VBK+#O^ZQTGZh*BclH5cqDNH?_*4oGKHz)a}5o8b^O-W1$hu&Q|~tmZEb1OMRIjh
zHv+AXwyqyX9rq=PkDIETbJXsfo!Bo9V=NlHj*nMXCJ`hK>q!0F_YtFX!j^I>UqrIQ
zg^o%1_L6rG1~beF`+nSZ$7pz8p<#&I-w+Dz=Qn4_Kn^j~4ly=*=Fhdua5vl7Xb|_m
zAqY1kj@l5oGdQF^_>DLytQ`;nB&jYciCSgRO>EL*05g+F_A^a=SdR|MU7U-SukL?G
zWw_Dyu`fC0gr56!&STy{Oup-?mXJ4-Cx~G#CTI>5U&rm&z*Q0uoa3f^Gc!fPBhL7H
zuJZ$Qcyh&OV#jc{uCv3<(FDfoE5n`%qEXB~Z_@8ViCC=?peDn~v+$j^UHtF8_|5|R
zCCLxr((@f?`8fRjnY-&$`4@9;-yopv=rf5k!m}`65D?(*)`V!OyBDxad4Y3@bp<tj
zy{N8g$QG}oDI(Gs^8%9V3zY;b&u-adOuv1urC0OHU;a$Rg=hORE%4lwve_$WPt+>v
z;{7w^_mkh<xsJ>7zuu5I30z^0R|?0=4IcF~y)T1(+Kf6<$vZmSgN7ePogY>42;EzL
zr-Wz_9w*$Ni-vdLEY(Z}fZTi}Wf++O#ry>136fT~@Tn(~h9r<$N`Y(M?pPsIEWenl
zu+KN*V6gVmte&SY`qylG`AFpo3*r|p-Up(K)nKjmqqNcL`%EI9w@tInzMMWUiJy_J
zn*Q}e#!yqsFhTgODscKFbl#G!l91;Sl^hviwm*~fq^2a^{Cu|~BWf`01AHlE@aG!x
zzPF)CUstg0cv);Uz1!2V(|6~dnWV*aK2$qDPyBX;4cm0Wl~HUvWG8p&rMvE<TzQW!
z;M%qCs)CAl@{sfG3kuh?SYf49NCh*A+HO@$p!aAPIu0ucr|&AG-U?!yr6%QLe2DB^
zo(_&&pBNtdma37FT?@S(B!DoBPfx#jZ>sX0_nAF`*Le@?M5R{(8bgJl*l(TdU1s${
z?9Zm5Vn<W6_))Re@k!l@eem}C9W{=7$sa~P{T3|CO@B@2;lxX7B~7#GdkR`X_Fpx&
z_wMp95bS~7{3K<OZRa=#Rx6{OMWhIKh|8OL`X3-HfM<KM@|g^2evD(kk-d&^Y@@5#
z$siS`bvRkb9blYfv>C4iB;$Ee^tSTP1$k8d*P_gB-iDTfu|#p(LAEGK%eD-uQ;SZ~
zk4Z_Ju{}F6Y6F6O;m2oE{iNdJ;s<EbFi#-8!-XNK|64+z)d|@@#6%n0!S%g=$}->2
z@hNlI8~<t{9vf>zysVw6Vh1*YZal?VS^$vw%R1j^yAFVR?`zBMI}OH;mq2Ufb4Ba#
zaNK4uI>}({>tFGa0f7ON75`z_lfx((JUZ-Uav|f%TZZP(zvo>N2HXVw`O?1?O+GTe
zS=HBBbVp&ixZm40S&C}7S~kC%)1QEt^fYoXO^n$tR~<`H=JF}jbF$gn^~WN0$G!UB
zE(ztD&1Ol?2Zl#qF2_W<(<)s(nZ6V~{H9~R?6UdG+rINo{9xDcSFSzk7gu{64Ns7O
z6S}PI*TrFGdf9vT<mn*q)5XyjQ6w%uM!&D0;%?NL9sLr`HK<7vB8=L>;4=Mo#<8jR
zIJxhQT>KDQuyU0*c{Omkaut0w6mx|_5Ac3-*Fx>G9qdB(a8DmIobHX3-)y)FOV2a(
zyZ@LlFTHF?{#fC*8<~%+-N9Qx`Fx`HgV;@`@Xf2~p69J>1qmF9=%8QLB2#@XG+XiI
zbM@V@FvruHJ<U29`Gu(6>4}tYaP#0xU*MWs@`xoQMn92us^uN8$3o+iVs@oraovOw
zzfb8NnY!`E##8AXgr01`XB?n#4AbJEcLvJ@K3cTR*4EI+6NM4DJoHD5!quh2i>cxK
z^(LNLUOySzU@(C6RF|ukEW0zsuQA=k4gJF&2ilWUYo{b{4bHzeabIXUw>UrARA50(
z+T<9lWb4}=?vQYOj_^3+d{OG4H?)Xz^;zZCGmjQRLzCPZyE*K^b0_;poJok^osmaD
zr~6C40maoCt7G5kkhh`#cUJexwy>3XcO3UptJBfJP_3TegmF7Vu6&S}d9l<nU$+H&
zSt8MoZDaStZ+Qgo8Z<7T3!;W+gk9Z`)H?b_d{n2`jk9!FZs#Um>Ztx%W?LJ3oU1@~
zQku`=A3w}?fQkw}NkwZn<K$&g-Pz2eg;13HLL+y`Iv$#ldY^7IMMag(zvU7&<sWqY
z{d*7)O5NjjOlR)Dc0_0?PO#y%4b<r%HzV-PL{fl;IS^hq>!h$_VfQEN`f~%QXosJd
zhfq!sqRHCW!j=EYBO6a3(jX=u(nkD0Q_wq1Lja^Foocu)$aE%cP%QTu`<eQgURpsi
zVuQXGZK<7a)ufOZE8SIU>QkfcW7O6u=fIi8aC1lmscyO4W0(cn#qsX|dCsbA%0%c|
zCtSQUtNg>!WU1=G%_>rX^Wk{7_oJ$*2OYM^P;iPeqq|S<s&m|FxNf5LMD6ED$un^8
z1dZE1hgt{Ii61Y&p%0ViI$cO(6m=AHL-cG*?Ccpmvi01Y{Yq3aDK6NaE!^)_T3@?n
zG9M(eR+#7&N>U_!xiu+v@y>INUcyhWBxj>PHz~=vZA5$`<)11pDsnpT5*b-kzU)^^
zO_6~$9s8esj_S4Q|4l9NxYBk3x^J-ifYCJ5Y+o*;O-Vntl*iCOEAmJVxhM_7V4dL{
z;IEJ#X25)qjSVRH4(|!oMc8rs5CVC00JW}tKTmqCvoec7Hfm<QoeqUZPk+56@<*Pn
zDgy<|*pN<N7f6kUhr*@4R!*f+Y!27g#j}*WF8gLjN9?gdHesl{BB*xpi54>Db!_0&
zMw9b7whnV7u>$x;1ktLA71rbLrO!|XH*H%=#Q-xVS7&?Qd@+Bxw1d&@Z{GEu*=P6e
zBift8AnZdQ85bKIksB_XBhNHmJfw)-ct@`Mn-%1b>i8mZzkI}lX_lw0aWTt;=%uK#
ziz=4s(h%)d7*O$;dTW$;4{_tqi`bLx>_HR1Ydr!A?Z56Q!uduR(G{9kTX5H6Jv0>S
zf58ebn6FvkW&>IEMx!r|UG$;-3V!Jdeh`DZSQ4^HQKK9+@y*I&sDmT7wzj}UN_^rz
z<tDDU-SJlvh6nvmKCr821oHH$Xt>T#5NQ{^RHQO+z{ONK6C&_y38m4}pc(sp5(ERL
zDPGb@Qm$cVn75H?g(~eJtiW1Cj9jhB^SM@BdDAQYT3kBw+p|p6;Gog$c?#XvY;1y)
z-!)!m)Yj(q9{#@8`-}lnc-`!^BXJ@{?yU@y1+GUu$L0*%PbzI25lw7}+D>1uw3v+t
zp!&!Lm(VJ2|GiB1l#J<tEovq{>3^f7p@gm_;D2O8`0Wd6fC;ynSnri*EPE0ddnfD8
zL0d)M!REYTWNf?n>k8f-qL^(}80LBPMp@XZ59T<_X+}xpeMW9>aQ(SA0kMY(m|MRx
z5rQGb@U~py*PDQud84U1!enu&qZ;v1@>@749DmYq7)xZ-AKo$QW2S51ZY}J=LV-3S
z`1<wh*u$n9`4S$9cPOzfnV<i{lM|~Yd-w`lMXfK@>1cvOsqrSQvWjqQthJf^X_-5k
zYEYAps)KLJ%+^m!c!PWF-WQgx8a>BMeD4)lwwMgk<Sw9wWy26|5WLxT#Vg9<#`(k9
zm*$ztz5~+s1JdkRsZ#xn)TDrO)EkU}oTcg0Gm}OG-qD371<)DmK`VHa%IaDR>#;i7
zSNmeh&HWE8j6ZS7f7*4{|C)DfR!`b|{17W|Vc{nXD-2vLI(j+(PVrrZ=Xl>iPr71-
zd+Uvn<^Z?BPle1W(S2th`VJ0+9@KUlTT^?2HtWxehEip5y83ui{rn`mdVABmy6zp_
z(^9>2C#&M^q&DErgj=+R!dDV(>(j0(t!1y?UC7P))pN2jwh4wWYeeBwN2QX=F%`hP
z_%vpfU-Jn1*QLFAv-l;j>Ead%b96PNgvCx#ky9%^zNOVu{*4lk=_2K)y;YH^;)Rft
z$2=J&q;0TpB=yyf^t<EE=P68om`V*mPzz8@TK$<kp6Sl~q0>!yl+(Ff#_!GAog(^8
z|I1D<&}?~XgB&vGk_5wWcH=-eJg6T(l~jhwM_S$W%qJ(v=+zkr`NtYQ^p{ap<pJz0
zztFHSPKo<rmDb~rO--{7HK`^4v(+5E010kKg+CQB?C21Z%+6m%-7Xf%k6(k7V3i<R
zii+}I^VZJaNsz*BACGAxR2MAY<GfE7cy2!;beH6B)7!TZ(jk|z_bk8QZuS>T{);9o
z@V_(5{~Dy)kO405f^~Z*MZZ4^kT%zt{eajGmULOVJWv!{;YtR$d_2e8WYH-69h?)a
zi&Re|(k9YBgQi|WT6~xfQzI~3#PNW5KV<jr=t42XwyZM~9k08L(5vBK|K$gO-oOSp
zkY#>;?)y3{9i7<Wv*vf+OMCu60b7^~J7(xyifA+JsP!VC>ZQ-sOEd_$5y%?^yUR2o
z|L3mIC*C^;P_A<&ZT%TLGJM7rQXAjDEQV-&#cPWJ#FQ(vQyJ`eL((UR)#noAc0J+4
z)P#@1*}*!IA^S^C-Xrb@q~*UnCHveHV2WdJ9XHBklwXdrgGfs|l#wz>yTUntz+AaT
z^A5{Nv@UNW!e<wR#%jX}$G_I?jU)r4L0+IU&;iy8&Ob=ve?I|*{~?;HxBR{Ti@o~W
zpYpGN@(=_D%%^pC;(#J&x<)Lqjx&k_oa?It3$Rf^jG%vOvi_HcEwDfA(~PjgGK@y>
zA6ncs-@w{Sg<LBoD4bY4)<0vAn>zT<vim;9X;TLF<ByH^&#8m!E&5lcWQYFRj~WAc
z;SCxJ`)`YQ03}4@1OMLmt&PwVA`NEpBW(&o$?NTh{`(DSL_q$l8xjojY6QH@lOyzI
z|8Qpg>x&P<{*V828-)Fh(Qnug&K)OgLux<$?Pq6XSeq~DP7H<71k(n~8UFRP(EJ}k
z1^R<97sGzBe}ZD{FHnHIOZNTR{syD$X(OZGA1LnlCs7HJ0O+|!W*7bu^beGLm^Nxt
z?f-yDJ>>#$PlzRP(|qNA^D7vK^Z>s~=GyuO*uFpOHI{rxpVJ2aEe2%&i5=?y8#rm~
z%N7P1RjHJ9%Q4s+l!GK&OqeiOn6yBAMuR5*OCR962CWRt#~TEQq5mRu{u8*MYJXv=
zQ2f6YOB4W>?*G9O!~bCEzrfu72TOlcs{g?fz(M~Zm;MJ!fTHj}a_RrQTzcWpE-@0_
znv>TpH{B2+P!xtMu`?jda0JERU~u-Z{tu-r$Xi{yBnb7F)@-zl8{z-Abl&ro0{^Ww
zOYoZ0|1F(Al5QA#?fU~pL)Cwu%=&#}Oul5;#DM$bX4(sZN#v+lQF(^x5q$w-Odf^f
z*$-o8`tMXM{{LTjh#2-=5}Z@cZ6$oA459BQWyb&eyyU;EeEu6V{;&VN8H)d#R>*=o
zyIt)6Mn?l-T|1Hi79|5lu~1WP5STWRsEzy*&~@{V6-9CXw<ylK2p|~YR(~j+A|CdC
z)Db~gf88JSuYM9L^FsCmgVpc55tb+MLYHt&19^+pI5BvWGa+D}0Mt9TL<s17WauD$
zMm}jH&&Cr}9DX?IwJYTNA{H8_4H($CHJ<qFVxj&2d%nU+x&tl99)S4%J6HSv$v_61
zHCnqrSPI-7>T7ufO|;pChKub0=9kB>z(1!&(f9_&1b@3gQ8-IjwJ;QhU^@zdY`gIN
z(R}kjekG`%G>u6P7T^uRd~ySwvHUe<<;si;XqtiEL>THb{)1O5?fp?{f9&>u>XC=p
zq>b`+*e~okOkxBD%Q*$_CkP0X-<4wX|2-&pmz$fL?5m#u&h>V^zv27k3vGT;QTkf`
zz5M)w)UHs6`~ohuPY+ByAAQP}ll7JPMFvV~r8kkhHsJ`dQS^k=Vz}6kB0&pMopjX0
zVfVqzw)VsHcb`JR{cwL!K(`Dt0h!MfhjB*wV;SaND5$SR&p%a+^PNn3H~g_M<vl{+
zutObOOXO#D5-0QK%Xbn_xlJaMgM<$WYI@>70<rA+XM(|h8{SlqU|%~$J<ixzO1ie6
z&vFs8SN!!YilVYCJ~DF5%%0l4p4v8Zf*wulA7%sk%Jks9f%Vq5lr6q8a;!$9X=@+g
zV43s%H2FKPtK`zq<XAPelVKL|4b}A|ZdGiN2v#<u_^Puw-t&DH+mNZ6MBbXZhKUrT
zZJ09<>^K}LHZQ~M4)*J;lTNE&U~(wt_JKlf^I$h2vg=P2$#DDb-h_N0^F_oroW&s}
znU4I^CP>fb@efkQj#6Iu8(FZvqfH}pKtVZ4RxPX{iEtxooCLX^86PXe?Dw^NOA!)P
z(K;NCTV3;7nnWwF7ojBA@R3Ppj*f}3AQxsEq<CYxj374%_v;P~%dO51MHa)onwC#~
zX65JSzrN%a?B=$o2i7T*5gS!LWaT(S4H@FVZW7N4aL$z*Nn5~_c+Ywco_a}gG_W*e
zEW63zF?8XODERom!OYv<X-&AyC^774(RLQaKz;=fMmP|~YQ+rAfyiv3D~#2-n4=XS
zK4$N8`88q#<e6g@itCpXb}!D7w(&0;VdOOo2uLNd{KQ*pSc1k&SLge;pp%cZU3h@f
zgVwYc+T~;=p65@|q|teH!TcrExH{U}nR3n=%GVS}j<x%oGl&+Su!_QV_A$j`mbVrC
z`tE>qeJ&PZI1(d5zyrc!ZiEE<G%H==^|(X{I;k*6*8*elk%`IECU=$Ir0>aZJ(Pn;
zOqFTunV~e;O$*Zmr^G@ZmhK~0sAIm}*$PDhyOvOgSHIBwr7dKg8eSMYKNTuda=E5(
z)qG;4NWUzTdPxRhKYsDE`Xh4XUFZWj=4g5d82!0=fl85FGUFlhQy1{O#$~}LAixcM
zY6JE`8lB6cG#gHICBarX!|bI&-?!u%uT5Yz9uNAio^DYesJzi=3;9*-t#_P?KfCq>
zW|Aj13!i!5%l+9_Ru&^<Cnq;&_V4+(FLCdeT18xtc^-@wq6x!w$<+dYeGKsTv6a4G
z(8KC-vFPq2aW!?JlntCC6XxK?P(p4~V$URMwmcYeDGJ#09Z^Of^?zRfaZ3Ej@kaQs
zM)6QiIc5|W_RJp7_S5uNV~a1)XPyz0%^gMZGZdl$o#8%JwZ@(*OGl~))o#Z+;iMrm
z*>_=3NT5&ERLYxA8~>;Uur8M6I&ml+A>qN`o;Du>P&*U$j3f?*_4EaeaHtM=Uh#5j
zUnTV8+N~q#r~%|}Z=0Xb5x&PKdQ5Y-e2F$83lxIydx59&l+=27c!T1T6n4$8R!gy`
z<-r<jEnml<*y&k3660g#{^RK9A&ZWuKcsxw3p7!xvdt@Zc+nnz<5lT9ByX#;_FYK`
z1mqh4c*x>PRD%3)d;=6fi65eS0_AXggP}gP%3wMhY-}<XkXsl;Wa_yZB(-7W)((OT
znyU<EK0bs<GZKTJfw6X;h6)Mg)5JrDaxPl$FyAEy?ra|hq61guJzAbGCE#EIlf)eO
zU*JV>w>4^66LLur1Tm}QW*9kvugMjRwM~^+$UjO~fPP|OPZnY(aSb|<uQ|XL6~maf
z@PUIDdhkY~X0?~quVuIc_x4JE+D{AaOkC^%;L)N;U{l1vAu(u=lH|oh{n_h>bR|Tc
z%A{@qTyj)u3Bd||2;}h!=8eqf+DfvhGwo4@Fi>q=8C?Z=e*oIH??CC**p#v3TE9iq
zSP}kSTf0}}dxCr9xI(h;%`;j}e&jk_Ctue<ZvO>oswf_!^W?9`Q&47RWBcH+Z;%Lo
z!K$C!sr|iFyZ}u|q-WyK?|_S)7Y;h%iq&Uw#>aM!0*U2p@weadmGJ@|xR`fgcj~zU
zXfH0bF!{T)5>jQVQohqyCKF%`Y>Fhu!0`+89yaQ;dW_ryW|SnhGbge)o>3e)35vb}
zp=R{^mR>CfvZumsZ2o5Q6OQcY?ajIfjELwK78a%-i3VF(f4a}#EKOyP6SepIS^jI=
zroVKakVv0H+?-sy`@D#|!cw?a)9DPbLUb5c?p@yd!v$o24w~rYL7q$0A3Lte0tzj0
zRHax~FO!2unICfefcei35L(U-q{(xZL40MV*?>3k__f<IqzJr8_1lzSVP&LBi?;k{
zUl}LJ*rMUm??t<LjM^+m`3@ts0o$Anb2JJv=7zVgLNJqh*ISN7ooX)!T?ayEUiw`4
zaGYrxd33yP%mJdoKH03LWhVyLKtYVjhDZZMW=@u7b2j(bm~ce?*D=8oT`crYm=E>S
z_)<|70$jm(tZ&;3fRO8l1(<m<MMs@PlTP1IJhPlb(&bev87e2z@B;5S9gVxm#I(7s
z|3HyK=CpA(q<t18ID3=W4KKyF&!pLGCh^s*DTjmCjR()IC!XrwOoXV02i#)W?&tSp
z0ZE4tr^w8B9*Ts+ckkJ*6t5K5LxV>z^Gy{`)9D&&7Y$WBSdmwb-&BaRa!fzXTJpyi
zNsUmX&nk`D`oc}-mU{$0+1_NAfvFaFZ*<Ow40@M-gi)~%tP_T3;~FmDUxxr;$4u=R
zAt2h_ZvuD-?NCtqphQ2Vj~^10V<{Ft_Ud=g1?>cOgfRwtpfp+;{pJ>*N&Mk^HyM1V
zF0kLnMww>ad9Gd2vtzg1a*~G*^THM!*p)j4w5(t_xY2BPQsgcT^q~^?qhps|(7iVd
zT?Cj%(j3eC67C`m8S+7o+kpB!ckW?FA1k~S|0qF5=2Lse<ZG7A=K;88)uzTiu*nW7
z)o-J|;P?W>C#k9P5G^j#Naw5DnWDMh*1_=|lklq;hXeJ|8q>%JIm+g`zy@EiMJFfA
zMvO_6&<_u@-W1;0)z)6!q50_}_A!oJGs5>X7Skmlh(O?*lvwK`cPCq(*nKMyi`*)S
z<mG!4Lh=MawU5jS#HUZL{RZdti!fr@sUA?X;xk9zg~-g@%F0sjeJukJA5r0_2hK7`
zm841~6<;4#&<~y4P=K7F_W{tC%2A$T`=TH%a+iKE3eG>;zb_e|6xd1tN!bU87|;oH
zaZxlivDWX!b|Vc@cr~`tiUYw06aH>4my*q2(CPH?DME1F=S+V;zbUQLYau0119SHD
z<u6GOgaSyZmTRO+SuK~J<2~;(-uav!1WaPVA-du@;m&s@`c|ZlW`%7Uk~PmGNf;i-
z$U?yL_<){d)%iSm)3{_k+Eo$40^Lz+<guOWieJh-mYpFd3n-OooPi(GOk8aMUs)**
zg~~BQ8?Irs`0`1Cy~oP-g9XFupYrixHCm>@O!wZWC3Rtt%z&_fv75;3UR)l8+$;Xi
zGUOfx2VfvsWP#x_8QI*NQc}}9c$|#B_5qPHD!`#(X}r;2%<Z*|jE-bz)ydndx53qq
zAJjK~x?_1a1`A;9#()Qy@D|_gYp#3`+$gTm6qEocg8*Ms%UzN)zD1AKq3<VZ6iUH_
z5pJcWAI8NF2Q4s8Uo&)FHc)bi@Xrn=$cb{J#p(Xl?Uz{C*K#>f=0yhk+p$bd$uDax
zl*#pyiSyNjzC&#sZ1=-%&<YEu@>K@uh*{PIQA2W0*HpjTFf*TgjE_}!*3#l;h5Xsm
zkO&#s<~AkV&`ON576pZ85srW03s}UY{HXK#$+PF*wQS{p#R5Td1;MqaPnq5>b4Q%l
zlSpg6{6i@aEVW+F<;)Q`>N?HSHpc2=v)85x*J6g8DnN$09=h|<)y?dEGtVfktHGf&
z!(P!CGZ_1lZ0DnBc=2V-&sc;^V|jy#XK;{+ERBy$0q}tbL(V~7KIw$~_If`d#jR`g
zV~lKPfo6ru#S@B;U8>N?dFqcz=JhW}ooQt5uO}a`I#%SEPcZ^-jwQiEi!Z(FLkeg@
zFa_$H*gxEGKXy;XXlsAer1c<ZBa_CCwdUgh3anhO-fbN0YTU=1wyp**o{`(fI(hoK
zqJmjkB7lz+LI4@`7-TPTy>Bd_UIId%+j!Un5rAcpmO%PWjSsLa2u6%J4PPFNl5c}@
zy&nVMQR{r8oaHN%#0pBz)BL{6$Bgpz(cD{(;baAV5#$RYgP>S+9S_W!BG!4p&j?c_
zkHDW}ljOBxYty+@i2S}?LcEIUciR+eapL1+^FaVTUO%J|@Q|U@dvOTFk=Etl8gAtJ
z3AVpcE1=APu$?17Cj~`h?fX75mTag5N9^?{TgSGoMS**?BK$Mg0*4(CI2YHlzClDb
z<UJKYVtbWu1xAQ4!Zi96&e+(#z>1%9CyvGAOZGHhowF?creOQ$l21nr!cx9(9oI*m
zvP+Z&;{e=1><%(!4ZrB7d$-_T*wb0;WIxcECTn-p9E<L+2VYNNawup46S<IuszCH-
zMnA1fvT6h~nBLOTGPj^YcWiJuCN56tecP<>`X3{jOzk3-S5!+Y_IZV=X3JSXByU!$
z;%&Fn2aQM+Y=`Njk4m(|R&__--5qZ`K*PumdP3xhQ;#*<^4>NRnMb14<K8DSlE#`8
zWzn*|vU&k<i5oy9ix=hTxe_xugMu?rM~&bEx;FEjBwGt0TB##}E=m1_VDEXuUchDO
zWj+LmU^FAa-u9hXPot9C(p27>uAA|q>^{Qp8zS!A`>0#Vwx{;gGwFT9!{rcrrVWhW
z`1zc><#;QQ>{EGZCN+h=)9d5oE7Sajn|QG;rIga>1{PM__uuc+p*L9xfc=qSz9j39
zr#lUP{@qQ!1$SikPBj0Mmd|LVKYBOhnnQyK9s%I8Bf_$ae5KCH#tc0MI5fIGM7{C0
z9KfL!B0ghl$s$#Jm6RxaeTcC->WHBV086){$Jz-;N3+T^Lj|x^JK-Iq3V$i{f6gXz
zN|hUEj~@C%#lTzm5nrkVsx?hbaf9Yx7;JQs1%}Df5cx%T2f(h$3m+Son2wHOywbw!
z&ju*ItA3|}F?KwNF$fQ0a$A^lI*19P0kYCAzv-o>sf7#l*<%CJ#epT-+B5EDq5lNP
zcR^l8+^jnr$(9^t@!Jz0=M$no?S1h(bv9-cJ$AI~a*2Yf3^O%$bd?cg&Rvql=aN>f
z(6<cW{<0tkxTqMKQ-(Q~4AhtDu%5AX7~ykk55GogjQghzf5|lK4goO}0#dY1#?q8r
zjHj;^TeLYfOt1TuZ2jc$obvY^clV*aMiAVlBfAtPDzqQsd@77YKtx#Dub2Okk5Bzn
zu&iBXP$ci6#V^*tMt>W+hssROVp^E;Px&KPD6OP$Z3fO)?Y#%9X7Kma1kGY&gsc~U
zV5RkaJy#xJ114vLWJ0k~iR6~n&xIGs9*Vg2Squg{ObTTuGSInIyd8&4h9g!d3ZGYw
zIB&&($e7jfA-5B1hp}EG6r_Oj@)uD+V4+NEG89m#{}=!dSpeC}IW(4QImLnsxM(%V
zQfI!F<TtU7pi`CX)6WhprIn|MAv-%8q?RR%K*md39#5~$n5zWwhWg4$#)O*fCL*~>
z01&Dqap2KE&L9GRpW^rgyLL4O_*yfwE|ITU!)d57_+{nmn?bX<t<pJziyysErb^ZA
zff0emcIquR*_viHkJAZx#Nu5h-|ATQr}~73hMFI)!B>9}@b&|-|F<%3-Zgy=x&0tT
zQOj+Lp4_*ar|#1O*DZy&`r8kOg@u7iS?un}CVU~UvtOyltXR;UcRopuKZjFpdwrNN
z@LZD*+SB5=Sc;J8W1P-=^ntzYT}s@g!mRgsoh$3b`vb`Buv$^+%p_xQ;^4?2bPSGT
zbADtyan=LB<UzaQLpypp)4VZf)Z$vtKMq<I*V(LalDuYcpfpPv_NNtgI1H(p@s1a<
znWEmSD}DHh3ou|rf?UPJk7jD>?88vJo6vQ1%dM!K!Rn-^n=UrWdY|=xco&fuwI>p^
zS5t(~UuaXVw{xgm=8eHWWbdkzF+*9f?;Y!p{ZPuBMXx*ZNd2@#ivYW_2E|&Wai0IM
zvah12r{{F(hItBJ?t{x%jTQ=`#jvn<0|08J%JXIxQ()ajB-h|$!PL%WP%&c&AW2id
z(w-6<`|Ld@UX#T|ap2XkmY5H*AAX7K&L>miRjZ?oCl{~hmz8N%rCmN~pu?nXWZ`c+
z^2^;JhC5JenW#VLB)~q3Pk5N0g??f{SN<z`SAd~ZStO6e&b^r{<AkPg|8AjiwvJZ*
zNGx@OR-yAdOKPGFBi`JbTS5DM>rZsx&f-~FA>MOt;WQGFGYA|!WOD9pGp?9ZF7+^a
z_YPSnudA;Sx5MgBM<DHy3D6bFm*vd;-|b(0;k)DnN-xDO>Wr=)rJFp+I3G7`K;tt5
z!6u!J;^UGwOF20js_qX=ccEWecb}4&T1iN~CM<sJ?Obdmf93$hT3L8FN05yQb<)@G
zk38+_>l4iXZayIDG@07e`O;vhhZH-6XWIlawSr2z7~(nU<0B%8)X3zVsIXBft{3R6
z#q>7Guk80V2%#N**SZPP+Q}m=8%7xqW@<@STH~`3FQY^Rwx@ykP&UVJ3i~rxK8)Tc
zyXNKLYnKW!RfDQh@6HaTf<$a*p1w+9RBO06({DLs6m%D3Ks0){Vf4rOs+85@V-PJg
zct7k{(4-pi%_N7P^V{{jI0XgSvb}nj{cjz#E36csZ;tvF{aCxv#oLk7scD$;ju57*
zUZG*l3}u4c_M2+Qe|8ra8cgr|oT=u0gxMD%i>Ku?iEmtj=bGF53&b6J#8iD`B>$jX
z(@UN58s$`24M3>EZ+-c~^gm%i&=Pd|?&~IH;>vsD=m6^ZeAyD(r8WWS#giT<-7p8*
z9=s+sZtmc-)B7G*uY|f42@~k>nw<4g%6^X_Aicf4+4qaTE7Z{Sc&!_p?W-Y7__6Xb
zK8$P#Z*7$KhOb!&UzB=I3Gxkv+-TvmQA&7+6&IB`5>Ll)EHt!0TNUJP&>mkc1fhI|
zYNqAMDBDiq;0GU>feTD4f=uWO0-H{A!qa)ZIdd56cuF|JEG{Ojic+0K8bg+V)I*!D
z;%u9Nblf`rx1nmUjGB%Pw(5v%n+8zf9=C9??x$FUY}RJkBS+W$`zpAO)QNpb#ZQ>e
z@32X4jT4af1vW7pjVDA(uGy^(m9lNt?yEl6)_(j|8zVRCxzFHrHojb8EI*A%A$+~F
zGdvn*-oNR3-a-Y#_BDdsUCuSjHM*EzclSa-C^cub^=O8K*!*eVC=>;eYikW6wX`bg
z)4O!n=!l9H>PY-ifL&(RUASj++@I-Cm?o`-9x0JtFz6c0Kldj8#b!7D<t?MdhJB~9
zw?51@FLC75IE9z+8>l<3FqIS*YTGPYBfEoYIv&VLLC$Hk&Z$X0#%G!uzv$7S-8TVq
zX#1m138gcG7~Q%2UMAKkE^;Tg>$u@3U7mHn$r>$&t9hLnyl!ij%6sCE+A>R2x~kb^
zPf?sIbH0E0+8?ERES^FdHQ!!aD>>m9HN84I>s`F>irg&Tm6ZOKB;`*l@^PDg!#;eu
zKuw~MqgF<FVAk$FRQ<=O{bRDyHLtz6EPMFq`V-!vGC-@|jg-lcGUyWAEr16M1{p!=
z|8nYxu^>mrwTJOH(nba^YufCm-}%fNlLFx}WZ(^q9J=#24A4sTZyG-Yl2YVN6%{ih
z-Pr1FyLJ<}@S2D(mIkx5#2F^a5-Cfm=88wkU2mMe=rj!8nCqG;D!k2e_KDaJC$oHZ
zS)sPzwg_I6da(Rj8^79Z{iSJ-<0K8(^7mWSib={9G#$$2s!1e#WvA%lh86gw4A~}G
zm}Ca`tqHCN;7wl9n1yVB#nFKEBYXuX7HHZUV?OF{<-OE<IQ)*{_KaTx&xU%AQWGJ}
zllQkt!m-rBiuxCrtuKvQ>xUr5??I8`OXlTkdjnUk@rLaDO4j3LS!l+JU-)ykx1bLd
zq|5!Oe?i8Q4d+d$xs+?E@qw<n{VmIF&#aCRR4cl*Cmz-NMINut_^X*=DKlRrnqTs%
zKYO7>DtQ8-u(_Yv93>VmeR(4IqSVAR)g;i9o6$KlnlLJWj3qiZagc>KfmY!MbLWjQ
zmm})h0tHHj(H?&93th|c^dF}{9gc=TARy7QElK*C0B}gBQXCu|$0ipjU(}sZ<$S&A
zdb(LTSyb><IOj%k#@SZQ9eW*VE8m+MGmaBN>Dp%1l984MBYk?0O|7cjs0qFv!>!zf
zFAo>>bocuu*I6t2;@_S9TD-44AUrw)wcK-mL=`H#Q}B5(mtY%_8Z@X>vug=0z=OWn
zw)?5ur!f{`*~;IzYoJD)6U=C_{+k)mMpsO0n3Dy1wzb<Qr3U9cizAsccqH=nvhNc-
z*g0iC*E1mIgPM4ZyA#acWztz^a7?Q#f1&m9I)ZSGBbi!p_6mAldS|8`-%a`R)eJr9
zNBnbL1S$p;^NFow(q^|1=gvgUTZ8rfU7q6!-+{<b@K1!SQPs2@S~}c7A>^lE+7b8p
zIXzGgA@t>5=95hRPJ+`X$#L>3*XE`gkf-u8WrYJ(?krH@Cj~w)Enl1+b}Uhom<ld#
zu-=7A1_F~F^%4d+wB;4PQBFmBg#uDw(G1>k#8?vCy34i)79C_Xp8t|v6T{$J6qF9d
zuZAawtjC~>Pn<X1U;ZNUTd($d;4B%f6hZ&SNqJZM_wiI1+g3`bT00KuPRHOHR#wrv
z+4Jx#F;gfPlPzm3yp?0(d>seQVQAyzN$?uF@%)O~X)?m;NmXE=8Ol7u_Zw+m6-p-A
zFX>)`w5A*fvEM5VX)8Un_>~Ua%@>evugG<X{D4H2(HBl=$>eTcT!qtgriOROTM>N)
z48r8{DBF5W<b@mINNtPQ$*LLq$Rwh2okwDDP%SFk??RIMSz}3N=EtqNZLG7ib=w{%
z)h_vE{|CQ==j3~8fetZ`+>h%{`J38{T=kr9mxDa#Ut<bR*TnZ+1J%gYJj`1~HN=+_
z-w?0#l|3%EytvUVV60T9>Sr)}M>K3^?D>jw%B4~3Q)GGI+)E~eJo3SEVtGN8Cd|A2
zba@sj<z24yvvbxxB^h535-EaQ$1r*C@MMkla^@O;KCF)Gq-Ebb)XA1qdplVvoR97k
z<1}2058j*E`oi|BC>^if&n&~=Rp7E)Q5bI|ps*JJ!h{e&;?3|X;}R>Ejbbw?sj)Ro
zsU`2Z=VxhNU2{=Lq}FK#ear$AK+*=T#OXF1DY;Q;>o(s*;&=?+v>o1lzuaAyMhjN{
zg8aVt1nl;KbYi<sViIMYHw$E1JfecT$7&Blnwz@gW$na{JtV)2%x`-$Slu39hI@7r
z9t0w$86T(Y$2Yv8{JK6*e6rilm>r4l&V%S*ej$%M{2-(n%S(2)UXjN;KvL+!mztMb
zkgi$noMUO&Zz`4ev-wNTA^oXGea4t`YM(A;Mv|t>p7(i8;jLNnM6Q%?ww*urzDUYD
zn_JQ5oWof=>V_ILIW9$neq!EsNGs0?@o4{Al$^TQ+@#*Z3`jE_d$2+YFQmS2Z=FX>
zH%q3hMdH%cm}p2J4>oT%jCd?cPVC*e(HHPS?fg8E798Z>zyOaxd#hpO><9RgcS_eO
z1=w3PPss%dlA>W&-eQ1<32<SA$`s0$JZ)QJf!jlMgr?XF&z@MK2Xoz?-~>Mwfw&yr
zYGpf`BM+0^(X@sZ^feea03~74qIq6)Bzud#j*&`w39B`wF*u1qfE?l-vn-$+)oS}+
z!}y|QOR($$kQbaSWN(5dSrv?;rd>1c7uOCgPfKi8+}fP7;n<%5mOAzK@0)@}9CRYq
z>2qvKRuwZpZ>c$XNX%4N2p+C^84j6-C?*e3-gryN;I|c@KpYqT(e^N>(VhX0O#`-4
z9SA7p!yDPl%`xJ?!6<U7N!vB^+Qdupq96MBcrJ}sLJ(-OdtkJ`%i3^X+uft2z@$%9
zJ}4p+AimEQn!5{|KLqnq8%;e=h&@EAo%;>)AUJEkAh&O(Jo0~M0_Iw6fg(1(?^diN
zY~Ox7dff2-4DOg^zqPIAg&?M6tE`$$R&?8#eijAf47zXExgD$*H)u{Ky#Nx4w{5ML
z6XN5)KKlQ-de5My{-|5{uhNvND7}h;h!A=YRVmU$M0z41z4sDG6cnUOkzS;$lz?;y
zM0)Sin{+ThfItF-gd3mx-1oyflTT+RGiT2Eon6*idu<we&~`5DJ8Qsk5qJgUYjx!^
z^u*x6pZ`nRV9RHWrs7|%k(oPk=C=>GvVUD9;X_~he9wQuWbEWz+QIJcs9W}2=$ooW
zbELIr<N0=J>3F4_S+)UN96`pPE4a?G0Ar9XI&${rD^hzlP5HiTHDk1t0V+r|{Ef@J
z<7h=p_nLKYh9in`kH|VXr(;)RukjOq084+H78wY<qql6~x02vJFD<@W%SLRDgGB8`
zw6-D0T==K)zkiv+yX8rFgD}#QMw-8;y_oet;&Yb+3BzA^|4OJnqG&I$&GEW$s+B>%
zyB|E2pe*cH+eiA!6fVa8%Xk=#sB>G07?EqCbXzjlGAeDoJyprvMiX{J<?d0jMjYFC
zwi!GNN6#%5VLzPfLi$FhL-q3*-5;eJWFN-%;v+T;M{>8W@E#IU&cC}*^VG>DV@1pY
zk@#<)Ck51CUpOr<P8A}(eY_nnPRzunveYO<x*2;~=u#Zf^?nuVEt?>J+t@uwh}BSW
zA*WHc<670lswbFK^tk7ad-z9*t!%&-=2o_U^UQ*SFLOhv9!#Wfe7Jn}gS*jODI};D
zbAPh;T?5ZMBGc&c4f=Kw!R{4?+hYlF_l|E{1{!X*&~*q3xR!_r4>+BOV=wVWH!$ZH
zEw5I~;^s8iD&k2%w1;sXEcPw4h^q#;VpN*+F$90Xi~ctyuF0sz8&A>N+=R2tRosW|
zPi=K}QQJLfD3#*AyV~EhjkOQwO^du!N)u+A=<s2RdRMyE%rkuvAR`{dI+wq$Q%)Nu
zbA_kA*XB!8EHhLvgcTVzPW&>9ugvUt{=>8>PTXJd)3E`o-mw2{r-C6T!RAT}w|5qG
zGEg@8cV{;WmrfeWd+Gl=)$lL~4O5|4z6@M5zW&gk?ETZ#nin+h_ceaC{dcGHjhvbo
z9hZW882kwbVc0#S<z#!)cj;6n7^u#qM#B}Nkn{UA@G-o+h}3v}kanHj`7#p4UD>#H
zr}?Y{6IV`3OWtd8Nty+_TKZE8UohHtN2(jfNybFwn({~$4|@YIcA+xCm~E=r`n2^a
zP+pzT+`?<j5Y0L=TV@^OY^&D(#mI_<%%VYd=2$14R9wcf%aqJXEM0&eldi^9F!u7u
z5?3<HBU)aYCHjcbFwwUMx1DAoV|`HEWn$GVG%<;u>m&P$G_g09Jcb9qW8UThsJnS)
z1vv<tj7W<1BY+1{lop3;7N>IWji)Qo&2?l#|9^et5%lHfJOj7^q}!6=vNNgp<ZMj9
zahMHv{r$gAdB!sIquH0|Ag$0f?b0l-QiD6j+`ep-8_ZnSk1B6GoM>?i-5HCzk8|uj
z+_>}IHbDj91Kzt$MY#E|hM9hpv9hh!%`-Lm@PE!*aWJHiND9ER;Upp#{h%aU_MM6r
z)y|K}TUds2?5|+k@^wHKSJ)g+pwo?n?HH3cVocb8Phy8gAqjOg@E@lPt}J98eb_#O
z<0!jO(yT7LIOz)aR6>N)lTi1&1vjVBNvcOUViaxXe8%kC$Ni9tJI?EWaI;1`XLm?N
z<_p9P7_uN!em}<@kgKWqBJ+pe!&i0nA85lg$C;5SMhPJ1z(os_+oVyj$l58MvsN6_
z7+(S{E#O9xJ{#Fu&S=*=+?YCDi8`H9A7Cq=<vPAu?iIYfT9StA;!OSbW|ex}TGY|L
zcByaabLq3w0FJ;vL{jsnFZ8<nB<;c96;fR(JMLTbt^FAV6p<83scW_K0(-}dHf(?9
zeq8T7&shmOytHQYuk~Gc=J_*4=D&%gvjAyWiRn?sr@W4N+0JuDIQKAOVow`PlqJ1Z
z!pH;D`j#!Ko3WkF|CJ-19)X~PM6Z3xm(A1rn+gqjwv&#g6Q)2~R4dy&kOqa;kL<s^
z#!At?-1>0YFBpAC^J;L%u=D%+dps+v+a~9`;FCSZ&=Mu@Dt59JXfN<&(*%syVnr(N
zBYYIta3_wz=bI)3k!&t+wAJs^59>qEEd$5zoy@Gjvb+QgURERJqrgA5?xE#h+;3f&
zj-<<Z<elKJYa9`^65OkR>t^)+cO-1=!H8@0?fLi96nF19>3XXXlS(&VF#bc77~h-I
zw>w{as?xVw&g3tR3U7hBmOlclLs9U>`Qn^brOgjlBs(D(Q~00j3ET9u9tyOJ0WBnW
zy^_ScUc=vGMQS^VSk9)vk}D#Y_}j}aE``$0GD)2<{GB;y-9g6^HY0k0+O#Xqj4HH#
z#4X#!*m3H*A=ta3nE0KGFG23FR`bRLwNo#re~~Wn>ub}-;n~;0Lq_Z0ii*0PIFP1z
zcT%(5MeA9INJC>47Q}VoY*?Y8ZO^#!RimgBBVIN!YTY&g7)>YpMtPnzlNnbrd#k~%
zSo!KKW;qmgZ8)#tSFcsBa+FCUqrPlvyxhg3`GA$yIK=^$NoC^M!nb4xXA&1^!zO`c
z#gA%SmgfS$IV4Pe4~p5^;}p-5c3speGr3ap*+M*vLE_uDf#a7fab8ZSX@!Z?87sa0
z1+;b?n{>$?tR!J34>p-ZGD~9yhh#hsgeaiAb{{eumc15^%c~db8C67K|5)qIR9WAk
zhj-UFjOG)XLP-dXnpJ{w>U_PM%Y!ufZ8Sn+G`Ngp2K-1vHYg~FG+(+@FyIsUx?<-q
z3F#onH_lt$`sud7bP?4`sf6GAkRC*#J0*>A+~K)Bn#R6rwmCSa&Iz`0Vklq!*R~pJ
zpcLWeOUF-HLy<oQ&O*<Go0Mq7!P!QtfDym`Or+%Iin}y|3?L$_Y)unZVcVGpBWS~0
zu@Udp(aR2oXplqoo^-Lz)<lBxd5T6nn~RM=L~k#rkEGw<#YB>wh(Mj|c*mcTIu~Mo
z_X<ptQJ~GSq%O}i&xtbuyI)0b<+o{9J6NfZ94oOvO`WlFRiq7Q)g?XkWFUJ&W2~VJ
z9U|U;$&cB2{&!vINwXiy@%-3$2<79{Jz#7fJSSbQfO(188vbsO=cC)nqm4Xkd1&8!
zo3EF&6y8#iQ0wlCodbS<7Gs~1mNsf@CzimQwKL3Gvy&45Y?>G<$38t+g285b=S}8(
zYC=r!#<zry4c7{+r+>+KhLUmp%B#-xU~VK3Nswo;xE$CASK*2cl<<p>&_R1m-yk@n
z@7n7nU3Z7Mwq+(=xsaeN`K9$lN{%XJtC=h3`KSiX;h~|oZHp>8(94VkZ(S8z9T)z@
z_%stxkf79h{Wlx<a|1eVySH=aU*mlVw1n?cC=L>>bh3bkP5ff_5aUkkUe1KKU?2be
zy{qCpjbPn;yFJ#UC$4lgVDTQNM$O#gu5cK*C2@4?^16o~8ujTn)vO7q9YHZzBhp%c
zgj*C6_nVFkB+~Y*H`Y@GM8??@taIfXeFXmgx||5^<rEYK#!VA2^cCh!nLR)Z2Z~X|
zmfwY(PT}Ouv;?lWFhMB{J3nd6-$a~VKxg!~Ss~Jyo}Bf?qWV=SIknQj{(^OGlbOdE
zE>FSdga&2OZsfMFavrS}{jp;=IRz~_4XOXcSZvJq3k2ACbcbe4T3sBGENUD{1Nh^I
zw+q7$T*pZP&bR*|^UEx0g_r9ZadU54Vu_b1kBjr|yxpl85PdMr-(PwKc8zl|xNWDP
zgL0w4V_T6}zzj;~@QuNEo*P#)sE-@z%SAOc7LVH>Lyr}Fl53A7mmjw^H=8HRvo*_U
zDzZdW%9w2n|8-6ycj;yv<_R=NUA?*9`_jDP_TiA3$G91ARJ81Fg{r3yR~f}&<MjI#
zqoNh&8vR2&`aULaGE2f?(skLqRSc!;{lxr)c1hZ?>f9Bt{Qx~Ekmr5B&TXkDP-gns
zy(IV-_ygh+y>eiyhi2iRcCPn_LRizm;ib?*0yuPP^LOzeZ#hy*W<yUl`26^uB3SIp
zbcN6UK~X>yS2Z`rXR<_ZC);OaBF{-`RHxkZ0K{`YcO9I5k`!d6Um#qjX>YA@=h<?_
z^80QUQ{aCVF#4Lm_TFN2%gtv1zU9BVX(Fzn5gDQs0{KHEc*PWa;YJOmZ;sd&qFeK-
zQVpkg)q^R4UA3lewc?b9*KnWTMD`WLA~k*GQn2$bfC1~K&p7x!A(IK%Ra0DrRNj~J
z&Y^6ng-;PS46dA*nMyNFBT$fW&G9WhR>lghu$8T#!rn-weze&zOR~^+pVD})bj0Ay
z{>5h#-hxYB!wo%r(yM^^TAA1YWtcH@&d%|mh)pZ@5ftg|RgBOSG5h&}U+L-&@OX?t
z{$xx&c0pZ?ip~VK=$DqWyHglnVCBD%p)dEn%xuU5X{CF0+0y>$3XcvBJ}MUM36c%f
zcmMoR9tg?RF3p2J#^sdsSpJ%>u!xnLH&7<r|D)jlAawfC+jq*xBBHK4eD=|#aF8kP
zK-?MAzJFp;7Ed5K7fh<<vj5~FZUx-gg@pgsT(;AfT@94~HhE34bUAuk=SLv%El?O-
z9ldS2xbmg;fH5!c>6%I>^r<||X0(?pL4$Gv@fNystOF?U-}f(|pk+_mBWt!BWGd7H
z2k+i{oR*`?r<fhsKx+a}JnC9Mw?fvKtvQ^rzlY->+MZL!X@*9*D=F$1Uj88cF8SI-
z?YpowvxD*YHg;(?tKm%B#&!6z3#W;nyJ_V!30Pr}=78Cc-VYMn?EM^8MT^X?dlMHf
zEVRlO?39J)Bl(-rlCciCM<xO{0J-e5ADKP+Lw@X#7ME6(kZgBWP|QQHL4;Jgs%I@G
zW-I*c!5yISruy;uaSVKS-2mt(FbrPi10eTo;wH|v`GbdZ%<(^=I^Ll($Oujs-;yv2
z+Mr93!c&wC3yx$U*I*Cz_TFMGHA4D~iY@bQSPYrx+MXYF(zmwp1}(mg`k)|<s?hIy
zR%`q6$ueUt^u3zE24Et{W|4XBQr`21`!rg(|2MZHNsyx;6wd2j$L-euxkYO5GX@)9
z@ZY+B31U48HPZJCy2j*zw1qmWSebvBOj%bHu+)gD7QK?$gEn2w11Vv3Vp$?2r!ucl
zW9}Kvha|AXziTs^Eb@Zn-avTq;?*m)rBTJK2q00Evx70GjjqhZ)KH$1fVRh||BwnL
zH~74yuyGB!(ABRwyFj_*%ob#duFHjC&zXI3OSoi~ybJlK=Md{PS<<f5I{2Ux3}g4=
zz7SHAhTGo#_BN`=>@tZrf?l61ku7c6XEdj$ewH}!)6IgH<fj_b+Z#?ocY8(OjYE23
zIW;{HVn&7bXMLTxaYM~!;D10RU)hE!;jL2@fzkLpN477N&l^aFj^h}{P<FcoH0H}T
zL7igq$Tgc|Cms1mJ$NU-_xi)A9rGXcX0mUZ!0wjZ?{z`Hb=AfMd_$tXs2+}M`sd5^
zE@^aQ+#i&wdg@s}H1>dt(tKzE8I?cehxN3*E?m`Vb{K!?V4o;O-~ZLyj@Ov^^^49J
z<$NxOJOdI#{w2f1DyQ$kCWo}rcxRgBuGGy6TXk#e+kWWr7>#(A0d7@!^W^cD(!Y=g
z7wkd28hm#W1~qHiQ`u$$AC$*kcJ^@0oN(_*Me(LpjHVpzoE$iij4^2n+?VuEzI-`4
zvRjl`cluk)ssslQa{n3KpAmQy)OKz!wsiHUu&4Lh`Iv<BhG<@p8BDPi0(kuRu{bO#
z>bpP$kje9M7W7KDVNtxV^S`;FcLuqkTY~cr=+@Xgjkusp5}c+n8q4m+_RwV>x^3n9
zq`qlyB4+oc^ylRDNN#8mFHTvPajr_6spd>x>HI{Z8J|lTtMguT>8G7g!|1zr)WHRu
zfQp`LOZxk&t-+@!vryw(W+VW;G<Ul55qeyaYYBq3awThT&d9UfZ>}r%QFPU%y3oFJ
zG<r1T@SY~D_ec{UmwmV_G}@F)+eZlEO?8kv;sD2;AQ#;2)d@z!I#=wz%%QD)K6fS&
zEE`Xi#4UR?7(1xvTvb-l4D_81w9UzJf{M%>2=UDzAHx(R#O`Qz_z5bwPc7WbR&zqc
zRdf|?+Vq!M`W<r0(v!I&{%%zKH@h02!JL4l!Q}~!b7ABgKh)L1Nt3KPf3IeI$i#_m
z>1b6%!OCd5QgV+Hq1?a<%<n{bTtHX0{TfB^7NLH60fr@00xTv!48m<V&h{F`BF2-X
zxKTk~UN>pC$?xVrv8-KY9%!Q6{_quGHr<ekhWk~28vvy}m7vNMBN#g`$8KLcW5_8q
zSi$V>H!Mq*-HTK8ymEmTK|>+<DP^M76}&oK0sxo^%vBEm<G7r*jnS-j1syW(nI5md
zT+cC_kjo#`R$BcF_D(q6nJZLS>Y|P(^tU1gm9b}xk}x9WmK)#@vUzX`W!+<#1Mbr_
zw0qXt(P9yAW*Gk``Gp3d-KIj3@3>&0t5wjEm+RX<>lTIvGZR>D!t+qg?x5KAsAP)v
z*95FCwj=lnyW?^&Dh`T2BEhHH0n1Wd9u-fCc~IxKDufwm4NF*b?@PIIwDBEo#WN)+
zB|%MpxKn;B#&F@tYUv`CKiXcm*5-I?NbZChu+g$P{r<LXfnBtu?%kl8H6}-Wo#n)c
zMOXv4G7Tr_HCx382ubE6McD@z>lF=)TEG!S;G5(fNb7@J#iLI4y<DM^OFn4MYkvMg
zl!(n~1t3$@(@BTZIigySN2}K_zpYIOI&^H1Y8t_^`G50NE0hrYcM^R+!Q3L~(QTxR
zmfgX6(>7z+5D@YzlTU`GvD>!YrWPZBz1%<2^5f~(^hH+NMkELJks9-5so>v}yuxpf
zzG&8>>l1fA+Ry~ytQxYq&Hgb*=dS}S0on8W51KLYS57G<2C(Fjjb~J=f5+@8408kf
zTDR_P;op=m-x!ad=Q$8Hx6<>8etS6usaXFpM63BPA!!Vny$15nW_w8b_$GRTtEzRp
zJj1y6*Wc8x$kn=zf8bJN<VWt{T1}5)TS05T-fn!d_Web~&jT{N%s%)Zw&x57@`S$;
z*kV3aP5k>E-6oNB?A>k1nK%nv>_$7b(cxuCuA@!usH~(qz#vY{D_FvJrx4m(rOC~%
zfj;hdCAN_xy6Tklal0*^8+I|5UP!k=#+y`ambdxA@~J$3_c2fv#r()ujW~44mjYe{
z$NYB~-dZ@d@q`?ILy@d(^O2hUvoHT$<v)h~oX|4beP`44?CVC6^kEYGQ6<t6#T)pl
zBJxisZTO!nOZqYbq+N6GW?=Z>yQk4!Hy}6L5`mN`-kAq+9AzXg6!4os`Vs#rf#~Cp
zMpx0nqzq*IYlH6>@`~u9&myFc^~7d3II%-$+72&$_R|#CUWap`$dBeFJ_Gqb1`lQ6
zMSw>eRPc?TFWv78!S&c=q~TG#KLh_uo$@5cPCOXa7HAQuNKicX3_i=pBb0QhxUh<s
zp;c1U3|ra{dWsom+5dnbdt4{lHgCQ9i%rJ!V9kmLpKzb$YD%*JoSTSEtl4Gtk55Mv
zg~E`Skf39XeQUSr!LHYOq4@F?qQbi9c}oZjbhr2>6l_{P`WZt~yX1(pUb5jw4ZDr%
zhC8keuW#~q9KGsIGi4=<Ir=NS#P)IyH)@1!7YSz&+o&+zy?7*yjH>qNZJqpXi>Jw3
zeovl^HhDEkFH}YYXm^%;!u5W$&w1t31e-k@MMshcQLxZ)cEiAFhfxInO`|~mf{)QG
zk&TSnWGF*wrgJ@$$pTS3oPnY9s5lQ}j&x>&G};fd$zOF0?kht=8kvX$6k4j*M`0zI
zF}S7(<@Fj2@Zc`Z3BI-Dg|EmQqWZ{a=UR`sK;V?WlJdaf;pLr5)v6GVqzd)@pkNZ8
za^J2sGS0g@3r?ugU+YT`n9vqTx2$j~<|NtA((pOwoZJiF-`gwyN^v8Aj!TXCu(4Gc
z!c6D;EwKSEsUMp*-EVD{?%nA(6TI5+Hx0ZyAcSWRwK?91O36sHX43S$dphL)XamJp
z6l8Q);Aq5Qt+hcJVovS*)VYd%h`}^>w@APS?8gA-=8K@00z`2vj%c(e?#+w3Y)R7R
zj1T?pjS4wa+&`&NMDTueVR!;M<VT(%W^AtQcKVN0u{k~c!KW>Cf9m$V>p~5EYvLL2
zMn^{{2bDU9uLznBxMQe572s)d7P(28qDw?LC4~L)l0RzLmmi`?zxhZ|u$Wq;d8kyT
z((}wXa5HWOd?ZeRHFjq;(%<zjF-SPdPniR=$!wQzKj>k%o8?s`!>iAn;)i8uPYx-b
zP}9Dy&YvG*g=ffUI5Thz6g<Q5)(NyN0}4aIbTd4rTV&Z|oA<|&<$<ORkXqsa%982D
z@E<FdjZYilq!@l`T;d5M5nlg<XkkGIb?nCjz_$3FoCVg1P9hCdio3~#CZeLJqwP2b
z+dw*LaMQX>?6S+~*KWwpc)k*I>L=z2P43V!TSQ7z9ckDLkkfI&F!$`~7Hp$x1f#t;
zBkRJ6c_vfMPNu2AZ|(;*Q@QKtm6u{j2TO0P)WFHy-q3S)>>kcj^~6c&7cR{HS*$dm
zQ0x2QGC%q3hjPyV&snsPNPY}JaRsEC=Viv?@8yO}s2{xudAHeH+8b}<ae_}rW_Mqp
zVda#)Yg!+O&QsN)tuYosTC)6!Z8BP5Hi=*|^x8(QLZbX#CihasWhXJANuaW|2dr#7
zp7DR9v@cJ;x_?pdQTI&{Mjv}AB_f};16t)8M=WUkV1CZpiwO%tnLdf}-}j;N7!FNl
zySu?|oD{H<>u{Qn+ZsM~(Y32+@iWXh#W{|w|LYfWg;5_W`Q<d^iOx>t&6c$onWR$2
zY`ZDju;FtJ2~B1}9Ep-6qbxleSEAFv<fsp9cHJITw5`Zvi7^O0eby;~JjK1)CenoE
zWP($+HGh;2v{s8#r7j8E-G1{m;6{c4GL<$ak{+hGvv`I<O!kpnF;nkDILBj$lQI~+
zZ}+F)Md8Q*UqdcQqQGbJ2C?}2Szt={U&AM|Z237lh-LIH?<}SDssPWMXDTGM&@4}5
zWrAQGMSBGEpJMW!^=_RijvKRw4LUL2;)?&lcEr#8f*Abue)j{x9-cuIc<0u^H-W|#
zs)rv*|IyI!J1JGvCt*-i_W<uPTgXw1bf^x=YPUQxK-xuKtdej%2r$dYF;J*qN^HHf
z+7<I!8>FsaIc_6~ee%B!e3%c|)7vkDBTGh=@X?vlE*%RwdHPHGO5-81kIG7OrYBw4
zeNfU9Nv8GSsR~p#Paqkbr<QF*>2R#@)$5lUS5@0#Q)Mu*V`jdl-96rc<_mm9!}hoj
zW3CLpzg->r296ecNF_i~V&nL?>vpBrcft*9YK6t_swP*d2b1uY@L$X~W)Bkp;Ng$U
zD}*cgDboF`*()&+BRyqs$m!IK<W4+9@~@aRznf69_1euE5<%z6F!63g5hFR7mC6Fv
z&Dm<AC6Hp;#_E^Zq1j&T2SIdPAuYYHKiI^I`Ta#HS~t8CpMA6UR=NPS(9jT>KfBnl
zTx@L+$ex0K^ioT?*gNYZ8H0c~a?zFQlnL%D-_}JEQ@rV&dS!INXjkvysDyO3it@@G
zm#?~(5)_`m*smTNQ*j=h=&4^ixQptb`(2neSW}i@VT(1Aq-dX3yU9Ij=dt^92|@xo
z$A&U|f^_ozBvE?OwJvMs*}UAFO7;o0;LxVNL$W6bFKM6TDZbJrmuSUKdEPgnC4tH3
zdoh5WaB}XKF<Zjllp&9WA9*&6DxgPX6uZsP8N3u$b<5r#1rFGcKd-iGf{3^Um~wMG
zW;U(iD3!jjbwqBI1zdDVl2%UkZFNwON-1{?_MRpvU33jWk5f!yPsCGOv43^AxWnJN
zre7YH)dn8X`%*!STX(`Rii$3`prIGp=uO@^d0r=_PX=A0SX(G|x?<t1(<r{lE!l5k
zCKEJpfn7k4Wg=(BgSK%PmrEh87?O<g7w8fx${#Xn19&9wt_5wQ$<Jm3R3vwr`;U`%
z8Id^Tw$jBt#R~#%g%)6sTM3Zige{6?#-gs|;~+ho=dTg7mVv85J?T6Y9cf^%3R~Nn
za}_0RGNt6>XzRoLNRGXk7<kdmDHl&gmg_n}r-xGxP}83&8nGOlud|dd`Ut+H{Q>NA
z(ZrK+&Af>MIP>_=dqO)!B-to5G&l>v8&y)XJwI*`H)-?2M88I-CC98@0n#^J#JrST
zM8e5S0cH(Jwzt@8EPx_?^*<AS9wqdBKkU`JfrspoawT>0u<#eY@x+3u+r>k~#%G8Y
z*k!+i#*+L`nbVkAE%mck30F%axmm&sqy5q$B*$F0<7m(QU+){({L)-Bk8BXvZd|a-
z7YCj+Zq_SE3Gt-_(2pZ4dOH%7i_L1b57iowyN&A!`GX=&vzPCLcDr;IgSNq>f<%@+
z61*S$b7#Dvn)2=VN4wb1!lxqk=sodV?Um0;YbS}1vTfl31%Xt{F>xok5UgO02ekH(
zk<EKWJwjI>wj?~*)}so^+4q86C89cvk3mf&7isyuD)sLH=v*!Yk5dRMnI^vNiFhsE
zy@g^!C<uGJIk-!`%w<L=;M=5i0$5+Y+^*^j6vFm$k3Z^f*^wBHFKt2`mLm$n;%$hj
z0jj6vPbiW~^Oh$MMcQ!7`?Sy%>&Vx>^WO!sf<gvjs$Rp1!?9Pm6(%1D&T+um{$CB>
z2U%C2H!KXdqCUA~-Tgsn4U1^Il|1!lCarY!MQnl;K%j$^=v?NC=wVk&0Vhhx&Xkl?
zOg-t9R;F^^Ag*?w5k~wx$c1qIvyZu>rvhIy6`2BUVrJ?E@&dD&f3<9>*y(EoJTo5w
z<&#9kj*81fkko8%2RkYq(A>DhGdtq68Xwhm(x4@3s8~qLsJdJf|9X-1AO_DwPwUc#
z0*sp+IwRtG+^Lm?2^oIBLw92*TgLMvx$dV8b&~R=<VE3L%4G4N_1o=bdgY7s0ME0*
zKr9KsHG^fjWK*JilC)yWBWV2+$d9x3N=WiCvWuvIak-tZ@xMz007=ink8?fz!Wi80
zzBruAzkQ#*S2WY)BY^pt@^7I4$p<s<ff}st?`%6Mpr1YHz(xF1W26s`djl-$liXYP
z{U`GymZ}^Fgy7>piwD0q7R^e^`#BSz4*mheKBY`Tl<0*<#Vz}b)_jpGVCHWnErf$Q
z#~K46{-w5ol%go!m?7n>OC6K}Z;s}%J9`}H(MRX`T0y``$lS*BpeuC$2-!*F<#Ehz
zQp}=HO*5n61Nqu5RyP(ji5T;(t1@afmt2QqrBIDOklHK<mvM{hcOA@5S^7=rU_Nc*
zL*vf|Lfd;p1mQ-Pjx)UvJ>>46kE}LJTp*7|B+S)YBB8tL9!QCV5<Su)(Lntps%hm>
zU<14t$J;cMrdpMZi5cJd{<4kq`gNAQsq}4J#L|$o#h8X;RAp;)=274diXjq+uF~rT
zAPE|wBXSGsqxW+D#2z?6mYDWupRme5WL}Net`0Uhye{~QUcV3gZqMr`X$tM%T!knV
z9qZ!<cgcRg85DK=lF(7^nJ&aH=}td2nMeqTiwq=eR$9;$f;-g@4G@_#-dFDk4K)I9
zaQ@3{Hyd?y(yFUc7EU;xY*w_w2kGub<hKo~%o18aGMx;A4ka_*PCM&F6|S&u70tVH
zFwL*1{E$D63njFz9l4wpy#Xs%zbvv=+;uCRi84!pK=$WN_2}u^0v1r{>1nO~zBwVP
z>z)6a&%wQQoio0jcO;Gjj*23E)sVbaTHEP5mzmvBd&iZDkgmS!tzHG~SHFagD;Aog
z1uW)%&Ib2A?`ZO|_cTviowe{lYN|)lHt^>sc1E%>4qOy2eN{zyoZfQCIh#TSBY`yj
zghd}njRUf5XyKo9t@FiDFzg>8=K@DKmfQ<R=*%%{82i<oXJvB?L_9X2f&9MQf9_sr
zyjQG2-(nKuf~POC8#D<F>P@N8DACVa9lt8qn9Y)QEAg4F5}qImZYEyD!Tg`pt+>z^
z1|~Vcm$#h^<4~DM7MPwrnmqWE_0oUK(Qa~SOToT>pi-F)iZyIOI0dv#F3tH&=8$Z|
z8p<ybcIXG>2>&DPW<FU4Fc7avm2TNc5*l`^mV&|DN@fW4W~Dcr?y|R`c-^q`uNo5T
z7r7s|WkyQ<-nM|%<l<Wnx(4Io0VFVr00a-R>|E@z0*tl`Oh`@;r=U`GFh%?O0fEtg
z<7VBxIUpJGVjczEoS7MH3M>Gk!(wRRkFdv4%<tdJSn7~iD7~2Ug#DR+Oe@h8*mY(_
zq;gp4;W~fSwkZQ1O`!+K&>-e)RX;sBOP4^=-r#OBs9!!<7$t~VHC}a+qx&ANA2yID
zv+Pw`VG^vz%AKUL0U*`cKRWTaWeb%AMd??7jC?DR?wz-XOSr6=Izl;PwznZ7=~KX+
zRuQC`z=MY(z5lDLX}MpIY~v5z-+g$MmM*amO6~4zgk8O-D2cu@HnG}TJ%ugSj2_v<
z>~ih%fy_5M%ecZ1SaiXmr*Rs?V=IB*Z|)^`9`oXQvfK+F>OdzRXgu1?b3gj+gj4%*
z7Uh8FG_R9XMmX^YTdiY7f1{#)IlPpqNMOMXkl8hY!s!)iYs3r#``Rhz^2OKRBd(z^
z!(H{sj+HU)=R=KRTs^qVR@Vfe*ILX2jnMhL(@d$9Z5hWGDx(H(_(oVIfIZK(1!mY~
z+`G7G!BTmATui35xBvT3<v;DGs;^#;?9DCo^_WA;WT=8lSjJ4@gS4&qY`q(^_&Tnd
zK;CW=Cnn__F`dxA21LISbFbO)^KTve!IzP77-e)30dUX2UidBxugTGe>@$A<>tr?f
z`?PD_sc*@>^|C#ZyAZc>^#YKU?>c!w3`_VHO`BW3?~wB#t&6mCwOGbsNE)4-92Ryx
z*l8lL^Rp2kHt2%Yy;DZY`9s^;lyiu1R4t(#6j!YH_dN)%V?GB$e=AJ*N^a>6ET1`*
zabX!beY(z3QQDv?I!en@wk`D$NCOSsLt5;~WE^>lN_ng$vmzL3gKF%13<_pWWXl?O
zeQe&?Nl`KJ0mY^<0cXL)7LQT!IO9zvF&kt+UpUCj@)xy#W%IFk;Y$BA(os!927(fC
zn~|o_=?Z)=A9oXUd;hAC1R_hq8rlFZ=j9;}Zzd?@XC;E*Su&U?<21&$hJm6YO!1)E
z3Q~OvNvG7vNT_jd?d1sDxWX=GY*7Nm{yUh&T~EN-X!Ch1yKJHO4F>O*-(=+Pf4Khn
z8Ou)=^@M-&Gves7-!E;$Cxo!|gFcqqC%cR_qlYw9I}TmhqCiG_@_Wx-yrTJZQ|!%u
z?b!@B?4P~3>odaIDWP0rLq;ZoF&+jDW3eN9BSRwx`^!W;v;ioQbG2k;MfwScIn^hI
z7mX@PO%hx&(a{MTr={F5?e%+8OL4z~ss4g)5rDi5i2G@uJ<yFr<FcZtnR^LyLtc3}
zEKU+vfu6X0#09<H{#WE$>xURUTy5XE`l|p)tL`-O7GcvMfGvy7Xp1A0SsRwh+a<K}
zF;ezoHeY{53WNJY&<#JMxF!Zt>=IEx_sQ_adM<8iUes|!h~W#V?ybn5Q=~<FV@PKI
z#Jv|Z_04cwK5}1Ic`F?rB(_B8c{-U88<pizow3d0fw|=8x90$*ryuY`w*o@x{@t_Q
zz}vO0hYTU7#*8oNO8Va?Ux~J+$bDhyR-aDq0eR*MSyukLY3RDSZLJg9soYnEzE4};
z`DdNnkqpL=i#m2eaM|YJJpoMfd$wWZVFB$atzZM1%&CTRzM*uO2nXNdF7=8LJ{p{l
zDmT34F_yJ$oQ2&-#T%??l2t`=C@)rTE=gu8W3tXUez)G8FYC9ZyhkOCV<%&7w>_&`
zSH!VX&@075*VLn)U+obn<b0(ryOON}y3KIxA7Dv-Z)o8Mb6EDSydbUTj%kku$COHr
zbP>n5E^rqpS$IJP`rZ4;vSix@lmHeQ9+-5z(jPK-OQ`(M2QeJ`@1+ssdi8m)tAW4r
zU9LWl_$O?QA2na`od%pG_R2@{oMz2losZ@YCD3^(M=@ks2EluD!N`pIefLo}iG4w`
zRceKR1Kmlk=9x5r;>n-z#_aw&wcCqrM?L)`A?`hV^v!sRiPQ))hzV5Dx8yj({n#~4
zISV3q0uk(tL!cWd;NzdFab6o)X72FdyB{g-Tk6jt6#`K@u}h%RWj`4!SU3!rxeJ*p
z+|AYEJ(bDASGMdu<ud^G)4m;P-zfZWC4jchKxA@=OV12IPE1AI5)5!LLnp1+n5X@T
zYYy>cnfdqw$mh!Dt>92UR|vs=IvFt%YW-I}fFbi?;%4)fORB*%ZeL1%(kjpo66gNk
zq^&S=Lm&<t*Yugh&jfiLOV0I(WVz3t7-Ae&b_!1nmmYd$ai@9YU8dpW^r;#~c~^g@
zAE9I>N47w>e0wU51XrFhgP$ji1`i1TNHN+vu^mx}nGuurLzbyjMXAqUtbMuf@L3*t
ztGUf_LQ?zpmXQ?S!pTZBn={Jj?3I@U#s;qHXj&~(g$)^ApzN|55I}9XR5Uds<TdC(
zx&9X!C!`*($=B4K1{yo_eJ_iaD^oiBUYS*~Dkq-5WWP*i(*K+XmG5&d8s{{0tZ7wq
zw8uP6%u6wtJ|tkThA!%YsLf<#mZYv!w{A8s<7p-tl1CgloFUzCcN=_D@A%b_?;#Bt
zN%{XNn&h8kinD(sfUSBL4xqD2GoN;H@hj(T91~q~a-_=bV+)faSeJ7K&LW8;^OR2+
z4_(SRO*`v~taRDJ^44i<d;-V&q&x18Zgk&~@-Be=Y1b?gW{PV0?$&Eyk=C>BFc?wb
zI&l;8!2TjO<B6kxF)Fl^cE-Vaxrk@u^LoT&Z~2#DX+8taRma}XXcCCa$=T77?)-rl
zYBNn^(m7`|s;Ft(^MKrGDsPs(N?Nk@IVc^qU%%4r8-K~6(fHf4_O6~7ejiq~J=K@Q
zY9zFDgI=-Ae5ld~Gh1OH;~-%PcYQr9xwUIz@k{>(L~Qmi(-a+BX{h)svgreo(fR1x
zXF{cpzAyL$v;eFDO>J9m3rBu-ZtJ@f&!z${`}{k@;sF_CVKv)bE0I)WSNK7r?>6Uj
zDSGUOkUZ&e3YYrRxF=aHWUgnfN_D%nBCV57Z?v7MQne4S-Jr+ZEyt1fc#HN@$bD2i
z{KIDyGE03O8YX$C&+^ygGnqJD$umX5M&ZSCP^7A*W?rQ0_4c1ChiA6*Ew(8+lnUlX
zT3XUcdoEkU$6BVh)1^PU?w##DTcI{Jx=c1uvW3|06BQ=EmuBxkVcR*louXs|pOsTp
zN&n1wMYrL<Uh!#L{0&7OfLxc{E@^Tyg!G&)@;q3CJb25*f1Hiusi<t0{i<%*FQ`*5
zArv^h7drmY)-o>8|I%A)KZ4!eU+VMRf$GZWy2agk`)fDECQKTvt-%ZFS<ltj-Qt4R
zz>*E8rXu-X+8-#MzUUm(T48Lbw8{ov%rfqf7LfV0Qfwx!t=)E;w*fS_u&z_q07$%o
zD_c((!TG`?>oJ4kWtY)zD^B^vb}aU_g{%H{ULK;g!zKJRUln~!6n{2>Uf10{1}S<n
zWyzCzu>y@;dP!I0*nD1Vm5EWnytpm!O_k2L+bRN>y7%<zn=`XZt;tnV^Z93&4L*G~
z4G7KbR9p|D;ujMYT^Vm9x68MtjkTgf_)syO?4K&h)!TZPVh1?REb?3gS=bbqUtuA{
ztRwT}`LZ#OX>MV<F2YjeGA(XpZadzN)^9fqk>p^Ml^SG>Xq?N6BxSay4daQZ!4x%^
z%*ViIH>%RUgYwJpbE65tFOX28E>12Xq^SMaX5o6f>YXE$`d0d*up5ya@}HcYT_y`^
zd*_yLvuPhAlN&QBKfWDySlCC*<Q(J%3sL)Eeb;c!JxjSJaRY`tvIFTX%=}I~8ka9f
zxhvX!&7PWU!AIOIOVRUBes0+JJ2OR5CSw<<3ciGqVc8pvtr`3x#PO0=L-H`0{h3IS
zwnuWQ&%sGI<R^$>>5XTyfR8LmZHI)3l_B=0VH-lxc`qH|{0YK-b!cK_(cP&M_2Qo^
zJRbwG8NExb*8yxo(2cRNd*#(uv3l_RHuFyeiWcsRBb6ku9GL(D&NjDlz8YEdlbIk=
zA4=7ZVu;>Vp7a@Oa<dG{-{@XMeGZ;azE_>?+2M6CoN}z^PFwRacWo<QVzt1%cntjz
zz6nb3I&}7mLrQ~L{RsT}nRdrw6CiOCY6p={c8e3C*-x(h8E54+p$XxLZ5~aeEfhT{
zR&f|2^4ithV@Thu+xB_PP!3(Q1P^^N_@YS8L?!+9_JeF;h9@gS^-m}*66F7yY7$i!
zbtMjxsJ{VLUKjVEG#tEY=;=O*vl}`W@>f>N9YAmU>PEZdehqwDy}ko8oQb*}@1k3h
za(ia(Hr-iWJ@y7|yWzJ$*2wYUo{*ch_F>o&H&b;{7eedty1wLYr+(!O<FwTuN6Kk*
zy>e(kE!n8H<CV`18Re6G5L&VIVBH-*dfJ*x{sUwEQ>-hgWcXc>+g-=y+_%?+rkXRg
zP5XamKFUn<XRm6|xIN3Hcduc|zb0#W0gce%(^p!eMG~-t-ExU!HNBR-<}`?38Y+r=
z$fyfz%#796he-6qYUbwIU$eVcumtU0`d%sW-ESVtegcg3+$~H{+yKS7u3MKnh`fQg
ziPI~3D$8%}6fVB;KpZiFC+8PJ8|rSAslTAGAW&9^_c-OMq?Cz0i^<KahI_npdjutR
zhG^#4X$skSCoi>>(sP231sOP=s#j6r;~NVi=oW;<Kpgduj#M-nHmzmEr5(#WYPm9A
z!*MaLqh8f~uLC>5pm<sd2~Do=jW7X)#*N5gIKWqP92-0x#^p^GbyLA{wEmeHJ%u$R
z@;UV@{_Fx~fPA3OICv4hEu=x9V+h;?W~o$J>i8~xwq5*MkfUGw`<xXouLgNPVA+)z
zr!k&#KU4ZLwrK|?@cEIoiB&Q4lDE&XidM--Qy;^>`wc7kw@b5E`MI|PokZvcSMQI<
zq8&yQeTrHP`JitZkFHPK7>;J%ptgJdKG&{8O_IXEzM|1^xNc_UsR=mi_XxLCZes_h
z|4zFv4@Q)8-UOl{*wIj$7bFe7eN|ivDM`4$1IP+*+0VRt9lHh?9#(}D1y0;AY9EBQ
zdQV8jAHD<6H%K7MYR5}xRfCEe1G~P~J{#~}0X7)n4wiCkLPs+*>E$2vn?zSF8I?O(
z(PR7bqsF(hQI0<jJ5`aSoi+^tuAhHvh(w-myvWOIT8$`k8lE!o$qATqL#Nz`vEC_b
z{RP;Km)-OQtFp_Cvv5EEvK3Ohth`%6E_Fh2wQcj7A>Rg6bPrzzzmz(O(6b$udc94X
ztnHpvOHaM|m?31Yv08AZCQo+lRojnoFqIPB`#-K2yY{{!lj8${p-1j>x(pzZ$5&Fs
zW1U5z$E|@+B|K2&HPTj{Y~tOsJ_u3v4nvId*29_YmpkYZ70=2|T1F6AgpM)KEYq6g
zV5^)<6`KOq5;u9X(?GxJq3s^|_SjZPO?0|0CEc);4EzR6b<23J=hCwGY4Y|cIU{p9
z2lw-Qr1ouz)q0Yq=*Z1opiyfmaKo#4@A&ATh45LANA~~4w&7}(0q?~zM$#!)s*c&j
z=elG~eHuP}Mc}VLBybNA)8U1=Dp&X|i%CK3_Wy)9&Zj)GlNb78`y?TP($(IR2K`od
zp4*yP0gFy)K+*#5XZnq@GX{&XZ-c7v`FSdbNg;k`wUlUoTl{DI?9t-Pr7j#KG+EJL
ziI#`#i#5iZafOYz>6w3~20xnHopQ0u9CERd2N2Mud6R4|<y*Hx7G!$0Sj4=J$D&wj
zu2R*IX)jYCz@GN9ZYiSu`sUE<G^hWKcyrSs!<RuoO0z=h=Xgn?uC2-9i5Qh~<@rGU
zXg<-qPUroIF6>O{Z%>2Nr=xj{m{=eG6~p#Lft<89SI6=9J3Wh#{%^dpMJiRy-2A&y
ztloP(@^7v-@_+4{9=)Gw8}LT7K>%>fkBncLDcqUTR^a|8FcDjyMZ*1^^t&^P?c@(S
z)Hw(MwVzZZlM#|#tom0ob<vnU%zetyluS45w$=!$#jUf|@@TjD)taQ2*iAB>GN$*S
zdt1iW-rQrTUn2E0cd#QBSH4QEM3;M<Cwq5Fd_cK6&v?!fcj=om=frQ4fh9@j;77b`
zSl0D#y7m5xUKW2RA-3jzb;g_#U}opLhk&+=dAZFJbiL=oCnJ5#U2zuR1<icr)wI57
zmKayi-~Mu7AZ4!}KXY>Bz!OovnRutR2s(uf`%&W9&6cUx7RPl7I`X3+<r)Xr(>xgQ
zV;ZBxI$qQWT8rWjGZZ(&ikC!OZ?fP2$PC6FZ-p!b4+`(BT!BV|Qc<<^(jO!xKYusY
zKt|>4);cp#K<4by@`dZqlqCjIwtFr#f&+W_4jOp8qPMqA)x+2Fv@NnVLiVK?cfl_3
zUBvu6+Y5*2mr&OL?{#OY`g4lV?UT?mYEE$UGagySm#9~@`PwtSeH$O2TaganR-BdR
z_>(G5YLt7k6WAP5A?281m*&U3Fa^)HT!!L{QkBlR>{b8F+Qt{$px2^G3ck5P%N0V#
zsd)IG-bnT4k6x#c%>%avy;I9GQJ@1Om6F>=f9>E%)RB5ekX7N^9)X$mC7&6$0|C5q
zi7s`LJI^}rP67N$?nv;WDPq+nvJ{vdB2!Ql8EE7v$d%9?a>na%E9dj#-Dnp?O5<?%
zs&2=%H50N%_eSF5Am6y!9Og4NEXfNb5sKfJ!9m)%l1^eLqh*x`WPmk;B5J=v&w>|R
zGhzFl8OzT^O?9iOC}UK*cq2KqI(%j|Duor&r9NMEWd0CmZPz-xHl96gd!Bp1D=9HV
zVincFFoH71XkhCrGoc#phdAF7Ji&F43woskNPC(Xgxl4+Y)XKak6d14?8sC8PaPRP
z!PNg}7*XBK#x2iai<vzhZgbafi}F8PaL>#1p2`c683qRE<#PdpW%HOsET1Z%n@e}I
zu^}wfQQSdKU-D&qKQ&g2EQa$F(hgtt)+k@5JB`rhHY9$^la15y;h=3F0L)33?sO{O
z%o)JtKZYMGRZrilRkM3ZN_v!K=lN}_+`Ey@6q>U$gkSV`DjjP4t>e@?dLJ@8p(N)H
z{38+&izg%~bLhRX=W@-DuVM=uUN9>fK5?kX)zj0nzauzmO&(S_l=iUwTL+C{P}8@|
zG&ulaeN=fDt8htgcGIJf(qdl@luo<)ElBTs9|stLSJ2GNhY3g}KiE-g!?*m)zhxf$
zTCec%vzvEJ^2x*OXrTLbGa)fNu76zM$kko06y*Mtka5-DSi|ixA^3yIMF<+`D9f#X
zC)w%7B@u%54dMYn<@*qi`_l6U|CN?>EMk{|xP~=$u*9mpvlg?~B^mK<C8-JVI!ch<
zk9*AE8cz;VtWOn6&e6%53T$|je@SXB6AC|D@7ksMe|-7d>SAj%4XmA@c##f`Uc$P=
zvvqIB(a#0$@%U=J7b+o8^e1O<;~6rx%;x*anX}gs^ZQbjr^%u&Gycjah4kW-ZN7^i
z&1nXF@wvg`<mp4eh>(h_tXdxCwig(W=}0J}1>Nf4)EbEYG5!8MlQEBF0;pFo{-Mg%
zs0{d#-OXkV!^fwO8Y*f2oEFz3>d_9lL0fVGND(@aaOIH<6`<5^pcZP2O|-;nJ*?0T
ziQVcRjsK~^oPu>Cl^&I{yM;x}_8dc`NP9jyg)NcbaQW||;8^XvM8bds|3k0#1Lm{7
zl$>S!dmxp7Ovzy`9O2jjCeu5qc9SeiQs;PGfZ>Vz*86Xy#mip~(lag7#0K*QXE_3p
zRPy}V=WFQ#T8f5x90UWr^~BcVhaF_U=jvI^i6>RwtN<C&5w=KS8DzfC?9A+ee;4tl
zl0E$o)gw&l_4biQTe38ApIu7lHDBDFlhbI}Y%uk=m7k|4^YAZ{iBdP&=e#!MC1Iha
zEP>87qE%3dk72EA356lW_ZeJsM+P4-gb;%Yoyvq|0(gcVFd$YVP?OcY9K+X@%e)lC
zTr|cF=Id3e8q=wLK?j`jzF&7I(E;R&%fT2o`Jjyq_aYNZsF)jKJmLV7PT87kC9U)9
zhB<%ou6gp;>+LU7dmZ!#Q)1y+GbIgypz}PT@e~UW-J2#B7QJjaxT7g3$A|WMskg-s
zegUu_1hukr<o!2<>bSiNgMGIcB@ZSBmjd9FMl6<#4R))Y6ig4)bAkZ=!PYFN76Tjn
zHV@?6HgtFbHv~JKW|7FRJ$Wm|^;VC+J3)cQPgdSP4(2C=FpqkCmA1MQCd?;NR*X~f
z@O^&21IaBV!e6&p=t$2r+<r$R_CxY^Pac!pk@MvgJBPN(P^Q7UNXx{LNgwGjcAv^D
z>RL;ZC9wI4w30?TS!<rC!3Ai5sTZdxl(P|z`ZEc?`R+ASBAB@q)fqVff*e%BD}_7w
zJPz%NAB5mX_gEyEsqBY?Ger=A+3X;$A*1mOY1FXFR(`~c93inZ!9PbrSgScVHu7ss
z+s`V(-eiB=00}AKMqG&~E&fbNj;2D=0#_f%bj$YW#68(t^Sp9vC^2-1J#jV43nf0Z
z3O)5ZS;liao>VUstBlr;-KPq<{9O1Q*F!`Mljx&CwN@F~>z#Mp`^3Vt{~QyB8<zcZ
zPqQ#<M@G8l;UCi!?YcZKdX<TZNt4K}pV(dCWSv0_&)gqX&9M;$^wS)9JEcC}+Zwm2
z>X|K!#8Wpni_^gQh7LK~7q>e2y8HPkiiML@jU?b{DphZQB+T91_SAUkcqe>_-hLz`
zTjs0BbA_+g&V%Q>rFlCf#L-36U|}(qnSNb_(;&fn(Ya&7WHkYvDcKGr`+oFEnC;uM
z7e}kR89^`!-P!Gz1#<Rt@!(4K)7{^>!5CPj2H7WWBF3ZnBCV-OWAlRy-0xoQ>Ni#O
zok4h;ew2dA`#+J~&1r8Xp2u>i%!eji6?J(a$?j2&__cAoPUkfN=?}1eyb|9&m3}?9
ztXI)%E%TvpL&^f$(U?Z+&B?=%Ez1y*sx`4J`R<XDsRj%5z3-@=s3Um`OUyDccdKm^
z&Z$H*0)^JN@!&sVE=VEN%KGD`(_hZyrAMys-#|wEXO?gielsh37ip1k(w8!E$oq0K
zO*WTBwO)dK8ZMv3l+(n-M08)?%Ink-JdqIu@h^(B?S#yyY|lF*+<(51sg}4&*4wX4
z8YuapQYFXqbn0=sPL@=)MBc|z&W?r~v@BIIkTJ8fD84gid;FiTtRiXuYS#Z7Ld71}
z6DWKLogO)tSV5Wb=Ry@bciXoJLx<))U;TgoPd|Q>Y#~#{K<<<VL>VYxiycybw56!P
zjk-#@oy_!hC_S>UpZP~kc??i~UG?v*m>)4uyT#U&%Y1U6TjV1Yuu1(>gO~Wcn9FS+
zpA@i=eraBbFwb81U;yb4CXs4Xy3FF;w`;b)6P&i2|Nn85=I3a>U0=6|zq~El_HB|X
z1IN$dZBjcf>16&&sqP_Jm>V1OE1t6mc8`38(&cq&nVQRk-gop{|1Uni#)uhEQN3Rm
zjwdqn1JB6+c_^Imj+LO2grbLRC;BY-<$#T8Qc6FLbjib#X$7tfKqTCy$k~}9HSlTS
z;UVl{ZBT|9>B=f|JqLN1X0Ci#9p)hYdeoC|#0wPsWM5`w+_mke^GYbrUsC*&0N_0s
zasz#j={0-k2zmTisjEFm>gbk<OLUjm&d$1#<S8g%_<=cOU#d&6mK7LG(|S0eL(VAj
zMaUYREC0|}>ESynz@-B+e4=BXZLcfb(Ve}|{Pa?nfdc<;mS(wC<~Zhll1h~o6dot0
zpgLa8rzYq8D%>HTENoxVMJa6dV`U9b(5>~}oW;vTRfq!<QMETMgo@0g%?!*IG$1<f
zJN4N7tjn|1@o{ZgeQJYuT;*@cQeijc%7`9+SJbWRWh#db1R)OVH@AsymtKh!K5n<g
zr_ok)p^2d2b15bgOxsZhZ-L%AdIK=+5oSPO&0XZfz+d(szl`R~A}2kC8==_U(%R(<
zR7;rkM+U0YSl4<pWwsu*0U!jc+n<K`^yZM9*;02@38$86A^rZ1&*kA`9rF*D?TV|!
zYcBE1*0WSI7A54`Gs#B`zT-0>tr${)kUG<+@l}%(Fy%AbZGBUK8c~|#FJ3V?^8v!i
z6a44BlcZQoDojtgd|!L?=NP=JfA;P3^CE|&fg{o`!YPXKuwNc+r|#mmtho<Hc*5H6
zJQH)IO(h>m)@RF{P@<D_W%xf#y>(Pn@Av)<2r`ODhcrlt(%mT_l8VwP-Q6%qmw<vW
zNQbmAbi)wR3@zO;bPiqf9NwSrZ>?v|pDbqJoO54u-`Dlpd;8zme@rgaf+p&WxHb>y
zy<hBND=x}A{Dr#O8|O^(Y!R0+%mHE2f~V=-{;pt)I)~nQBW5<Yn~@0=sX<2u&L@=8
z*3m!TjEBYR9LPQw`F_3>V5EjV*MLNf9`|Iv&9QzTqxiD<GT^M>95!hfUDm?vJ<?6H
z1c+E<U2$=gd@Pl;Ue#l3UwxvBhbqyqOs}Xzbdh7Ce_mr$yp?FD1-oNU;4@dt*@J(Q
zhZ*qySYS<_m!yF0;jkSAI}O)z8)8!24x3ec5GlM7ufoIFb+6Fz9o5O0+ux+BqW#zL
zV&ACFt?iVpE~)vprvGRK5Br&=`1ZC<q*>&fNMI9yVoh7A<df;20}GNo3B_~M(oOKU
z7B4h(0Y8ba1Hu2UHRxJ#7idpY*CLVXNYhEYn$ElSviQ!~Q1|$gl@MT|Tql44hqDB7
z_<q6Ds3#Jpj}?@6RNH-=>X5Q(W4SX`hZpn0Rp9e+yBjw{VeR<PBP#ojp>RYd9c8I>
z&uyV;&J47rn%ov#^+d4*roUf(Z=pb*g(CUl2M?M1`vlS;7&t>Qw!hlz%N)2Ybfu7b
zE)PUn0~|rM9pMVxALi_8s|A*KQ#W?3H(1Rw=#epg$<^l+S^lIxe!bnM*x9mC25G?d
z>ImrDRZhB~6z^J@8E_SfryS=rIc2VLl~b`f#+-UOxi`M=xhN;N;8t=&({rsjU1JM)
zk%0EOeuiF^>3v6FYh2DWw=+Em-)}{ny=F6?x+|Hpxgrgg6oGw1Et7A4WE73NWxgL&
z>`Q%=DmsrwSkYa*6n8Huv?A^^9b45aiOphUZWG^&A2jr!iERH}V*<D=Vi2iX17K3d
z!lb>0`&{$SQiZINe$#jVxlq2%yaYDe7yOM`)oNoz3D$d22@>yhO}g8Ia4>f>3_#Zm
z=7b4qfHWG-2(mG|e7}V=<J;Bt=ueTs>vK+u^4Nf-BdPOfCUfuqY{;=R1YkrSTUL&D
zUxDs8nZO}HbS&nJ;?A@0#hJyPRd{@5Xa!Q;<-Yv>1pVK#wq61UW+JOTm4n6&O3q&g
zd6-D+{sj)Bc8&TN5?J7Xgi!XhSwga=Hb2E*-MLS4i5>l7(wB6W;G3B0dXY}4B@m`9
z7G~16s+&dWwG2Ms&y2?=$WOW2VoUMcCBC?(zH-Qrx-gw)S@NSUt$fdUd_Zo(W$UH!
zTlU80Zhe~J6(fdhe#2G=(yB`3MmUoZZ?l5SSse*f+X_X?yI}2`uwDM>i&&bek~}>n
z{3Kh>K5;gW<UAoEQ}gY%4!BK(enOpA4Qog!wbEvI(7Nx>GHo<9>-)@LE|nYxaZS6l
z42kSA3Y?5FY~tbiCDySe6+a;?Fu32mYP_r(ev$jZYqs{BSUfU9M0A7*DkRyMK-q90
zk~4bDMBBkOPTQPt?RFJnv((fDH~81BB&_SdE2(7X5=~bQx{9){lh4VVfZP1OhNcuA
z4=@*N*Ra<tWp`9`sV&R}2vLO1d6Y5oJ|87zbFg`<bVP}q%18Gtz}YUz^qW2piel$7
zFL+^Lr)^*J*<0HFV-#JCRa;A-;M>;ARVBe4*CC07YsacY<N?!LN@jRDj(G{Rm4e!H
z&v^DLzs(a|u9zu##s9?hd;QPW<l~g#{n?t_f=s`OyHhG0`b^hF?F;eopx?WFUZBP;
z+wq}7jCKp}+*nA8zbiWH+-iB)2ffP_(^#6fbLUGb#U&-DRi?u}@%+L@$rDLQtI3^8
z72{QSOG<{k_GG+&@XM(U|2v#BuPlEVCHFgOdt`mI+?jscA7|J98b<H$bX|R85Gd}9
z+9`orpR9|fJu*Duuo!>~T1uymMv~p1&C>A;V(*8lJgG;jijHivwUx<V7Q^n9hj>q$
zAa`9_Mx(=$s8tcUl^-rE1P^C)<9uAEI<)Ri0X@gQpt0}~;30=voAG+I(cFv$VMPWf
z=jZ=Zo~pN@YT9dlncm&eWHTh;$tI5SJIPYezAgrKjQfbJM;8U+7qjU}U)n#8-|}pd
zwW?mLBQ@BDyHs6opISe~yt#UEBMw-WhAo=FIQ0ezyD`@Lec3$LSUBg!qAMl)l)vz%
zN}1Zc?ct;5=7yz8U<<}?B(R;xc+dm=+cnUDWd{cJ2mHD-<O?=(|6DFovgZC%@RF2{
zAJ{+gr%g*EZNmD_8i=ob@#zgnPCo}4KUp(xw6A9P3>`_F$lPa%II5s#hFs9?noF<Y
z^)Edp04I9SwOq{qsLW?FHP_Hccmra)BFq5HheH38CAIO&7iNYe7K0GXj@U@&FY%gf
zp#R*?3Z4}Y#IKjuJ^OX;N-z~v`dCQ2fdaUf5#Mf@$aRI*ewGq2RH<-o9YlBsAp630
zsc_QF`cy5o0rXrT0A+etJ_3H9-D0s;5j;YVl}~;_8B58Ne7?ka){QOvZZ>0z{?jY{
z6V86cA#(RJ(yod%ZOJE19`+ZqP<M{LG;ysnq$TOAJV%PDx=qtNqcQ&Rfl$r~9)0H-
zx$5I?%Iy-{IYG~c=ePJj!v#9mul1ka8TOO^pG>}AnsI2lk2g2sUHkFtl=2W-)EBB1
z?RtybIbf~}iww4475H^Ye)h8V+o<!OQLH@w6p#FhH>%gKwnJZFcOJM}d3Ve{#5t6t
zMhNb6W!rE318MdWmSfp~LTapDui?%5W<G-d!SvxU4>Yd2ZTJRvzKG5;jW>|KN@kh1
zo<4Lwl@wKNeuNJ6_{gDa!)X6Quf5Lr$%V>8CWuPNYc;E&{Vkm~sjQiX*a8Ca_cAX)
z3pF}laGp7U(e570ycAg_Djy45ayfI`oGeN`WiS(qM5$?8qT_A`aOZGOi>6y$sjW(X
zGSUJzo%xTMbd*J-YB=tWI^&)XA=H5Nt3%avm2azo83aE%VVg}KvQ)7(q@c6Mt(+;F
zt6Ga)6EBo1|7~sq@k7GvwtoJ|Ww2cNO%y(w;k&mJ0)gj+;*d6Wv{zPCvlvyC2EDLg
z`0&Dx_xX*mRhq@s9p+zny$bGQ!;bL$C9dJZsy(ZQ1WI9hD(BmYV<v|{<I(40ciBaJ
zs9N@S)#%Y}WmZQdDy<~qI;oCT`9>O2+9APRnVF+p6yZ;?Q;&aHyU(w@pSA5Z$NEQ@
zrWUx29C{(ASCs`JUwJe{>&q>UJarvvx*CtiXite#r4}8V2EKB`C~x&7NB8g~E$lg2
z8V*kY`+b^5vN_~29AuB1q;c37UIwFQ{hnbhJ@!o@GnnIg76%Tbj{7GF9>d25RFjq0
zGb~gAY<=zy9cqy})rDamv*vh`hd*FsyyA1eFT(hKUD0vA>}U(8<^MatIwq*Ndr7aL
zaTp`0j6>_GYyAZC)_A;OYRM}>KEor4$Om<Ip1*ckY{U;3O+vI^DWK3Y>Ts#@g(YZx
z5cDMDI3iU(IsBE_M-H(s>az^yz17)2i@v$Y&5=M1l$AKEs(0bdQ5<Y2i}8Za=d@`#
zaDFy_cV2Vx2&pR2YN4jQ^P(e4b_*ix%9h#C(#W^ziO6Os8z7bm&Nk@(LIO&{%_;I!
z&VE0so7PutJuV<eSv^RdCim<)pVyHyt9}0)8em}2Vk62WZRhf6?Ob#Zu>rqJ0s@P&
zD;IT>uzD}yy04S60`~)Z7dgWE&!4>I22`eHtT#yu%Jl)3_&%Tx3%q|)+;k^C-UNBP
z41iP<xT|^6)9&B4>E|B1B%1}D)JbCoK@5FZ8<FRI6WOx9OKfb~<q?l*UDGy2QZS!Z
zj#5|**6|XWDSsm(61{tMm^ZcrNXtmu-S$>{A7zVOMo%|Wf>ik>|J1b0|C5!8dh)t*
z`|kp_Ynx{htG`XEd%phFEw10>;XIErf+foM!vEW!=`Pk|2Cc1TG8)OoQoqGMVrTg^
zc>02O`{Yf$U}B+>FE}3Rk+U5Mh>E1Nk#8Br`s3DujI`~OK42e5f=fYcpH9CuFTl~N
z?o{EZKuph!d|aWSDjvM(w@ZDT@+IhGgf-B`j}<tJ%DojQ+~|LZNWxY&cuJT4Dpv6v
zb6b!_+Qx9a+8?jx1;XI*9<DXx6|A6W&z9}uUwBQ(tYMweK{~^@W8N8rE5eJ=EMWQo
zhZ#zZooVwF6NVh}bsOs|@FrDp$g6kh$Sa#0?Rlo6ahX`e-h_T7?Jz;fy^47;?$NCI
zdDvFd5OHN`*^mi$*S)g(@@pVP<-e3<opf-GzRWvFVS+Vtm3%X|jOZnmmfTxmtPs;Z
zh66P^{o~pu3*7cX9rZBdpC1G%l|IXs7ols*Ta03`>4xub3RUBa{<yw18^iw-)F~lt
zAZ^8YVfU;eM91U`@EOt*7M646(+6a1ppAzX*M>N5`Av^SP|c&&|B_Ngp|xLCZ+2`_
z&Mw`~-q$I&rsvOlgx@$wm=S?!1l%HCK4UbIxVcpV3dDVNs^(B1@LDPEVW_)rhCbU&
zgx!rl_=~(=2={@v>(@z)J(XKh9h$i#Lqm>VXTH!XJHVzoqMd9MoQ`pcYdKdMjkoJ|
zw8{BiLhrfY?`X3Ow;^al@>+PEy(HS0b8PA($sug723r3xZ8UCpF8XJxQgHK>-Xd1p
zo4t|NZ5cOVszylq+Vw-=<ekH>Wdy%sb3SNQ`1mOJ7s~gbHO7YxGSbXszG%4=c-li7
z;FAy2zc^sLXKE&gmH5IhspBT&Aim^*#!wMn7Jb9xR2}sTE_aJ?yeQ}k)l7bW|2lig
zi=TZeZ)0_OAj%l+;B8xpmU$p$%C=R@4pn=mMuedmxEMB!5XER?7<n_Sg4|_IP%mdk
zW7{s_I$FKL9jbciHP2=@zcE6#y{g1AmIqNgwS)aS0az&C#Npuu(w{`Q?ZAJY>3A*8
zyqR(ze4*lw)g*C!33Ho2?o78UY(n&rf))eG=#;M$lMp(aqe`5xoOX>pIvjJ4YYWUN
zL*5_vHRmZqEKsa$z%M?(T*=e<tGv|u-g&D$VY?Gg(q-VVCc-pK5XmttP3q6od@Ff#
zYU<#mK{p+XYQH&jA+71E0x4#4*@dJ^HZ}7YMxB4Ix}SfWLc4eQPkd{&+{i0NVIEI>
zolfK=;&;-0uGbIsnvd8|Xc<vm%ELTQwqL6jw+Ozbkshx{G^W0+!G;$Y-6!c-yqE;F
zFfI5l$?B{fPG>(_5<31aubBUM#~Jc1yVd_%$ianNrEE$dCjXEH|IY!CCsO?ssOGn|
z<Xw;(_&S3BPo4v3Iyg>3!uGypHW%*sODz5us{RsJa`sD-+BiQ_AUyQTh53rM<QmDM
zJ_r>B4VB2b(%l-D&rk;TcfpkZ>XmxN2YW28Rt48qZWd(iU3%?r_B~ZblQ!jy7J5@@
zn@=pSKU^eg>W=DQYSsB3v}BewoOl1c))E|_JVFQ}XWZ1rs2a@aXB(Bj>yZxf!JD^S
zwJ+QPjp0q*R&z58(0it{k+K)E)3?7&HfEl4RwDv$4%}My1KP3~r(|zlh~91&q<2tE
z)q1u>lTwaatXTq)WC0xF*btLHpD~#Fw`ltY4*9pR4q=>EZQAR@wu%pL*hnQ$g@}T;
zA~XDl5F5W?-Y-;^JdkU!J+S0@{mSVv3#ul#=@5K8*O8?4ZS&EK@o_w}%g`yzzjrAm
z(9;c);E;=)ZHwDg!`F8$dWVUHyWMYuW(2Xk<%pbQb{z#hkVXmb#(3oDtd;zB7TwnZ
zgq~YaoX~SLr}xHWKI|#SGtZ{oF3z7OpvpVv>_3%dfq^1Bjq5r4y2UM<@qnZD@a^!-
zfE*RUnULaN!`>Gy7h4UMMp>KyD9;{ACSi?yov(-x$;3RTL@q=C*LanT1;+iM6MN$d
zbsR^cjV9u){*lXjBXJ!UD4(_!kzP>BgPC`fs?i#DHZwMaUH#P<J~Ek7B7WK<aC}4v
z5?E-t>?ySU#=w}(Tr738HEKEHaaT8KmE6;qanNufePKW|cv~RE2QzaSp0L=UE45k~
zA~uXC=ilL*Z69H@#`$c9L;C={+6vH!f~Y@=HJ?*rI=VwFxzE9!Lrn+UV``lD+qI(k
zjR%qBgfQ@J!nKa$g8NpnqLvWU1#N9LnlpDX)$XnBF~wNipOJN->$HW)naID139s(M
z8t|7x!FTH(SA708o%M5T(MM9_mSQPMu>St{J^(=IS#~`&-%ySH2J4t7{+{NMM?r$B
z*rI#J`B5$(xZ~}nxbi*YSK)xc>H=eAXwUN(h$37`y=#(rXo0vJR8))D1hJOf<7amL
z=pgy-A}F-_=Bt0&{UK>Q?X8#9xLWOLXCnm2_fO`|te_vP8t!&JEU2&nNSDFn=RrM=
zs(-mJ7E5UEu1gW^&!9`ndh-R!t@MdnH`@xcKc`Y}z4%3M7c?C6{!1<0ABfhV-%#W;
zPQxM2W*x`#YZdhrrWfbYMgz%_aonA8P03SR*ZI)Vnd3QIHw7y9Kdy6-e2D5z+3MBO
zGk4W0;44ykEB6;n{DS<uJS~g9a9>`N;o34_r30Gqi+8Sg0{Vy7=LPTGtN&0capMo?
zOyM?WxSf1a!ApLs3-%(6yU}q&e)DzImbymIItpxP0PWSfS+TwtBU~^$P#(&5B@jC2
z(X(&BLW(`XB3pI9!Bo1PG7ycN)OB@dsb467pSEBI-Cf=RA}x>vHmx%2RbJ}LI$rz7
zx#wLRcCkyg!!epttzwR&?D^9AVst=!T&x{;`gWOQ@pNsIMge8&Cd{hi8;DCa@_Ym@
zXFO2A0AhyQ&Lu@hhf&-<I*LDNGT5C9SI>>Q@wY+2s8$R}CUGePU<ZF*c%`m0uSpMc
zNJHU8j4@hBYW{n!t3F2jKUWc7Zn*zi=u4AxogLOm6&%>i0bjG-5)HAZ2ukP&sN406
zT%cvwq7%SQGP~BDtn1b|d0U6@3vyu7_=P|{h-1bF1O!dZgDMWe*aiCN>m<xWjwT^W
z`z5AEe#cBAyL;T(Rjw?Y6R6<Ope{E3`UsB&drk$X)iI^+kC_rJ3ztJ*Oq$8qO~mGg
z&qWVZ-Gy!H0RYti%!w`rzujQlT1dre{ij@iV&h|_`w`y&rcm+0a^{08i(n4D(1WFs
zAm#M4P$7dSO@41W)MiP^PNW#W{4Y}qxT|_!U-2vx?i%uS!yrSh)3J%avDY^0L!gOX
zuG9F^8DmEqh5VhO@hJZ74#b_$_%Qh6YX4?5MCxdw>EKL-XK?yxJt6KR2~Jz&ue0@W
zx0TSfvDMPz;?*}z&|DJDcOW9KCo5r!<Brl&M2k+HXWI!tHDt=H?%mHXsk4dAq_e=m
zTFDG?N$-5yV|iPS_i8W`_7%X{Jl}(P*x%)Q*@2IBPtQ)sAYsOlb8L<rYv#3GCRJ29
ziq&Oh8DKMZ4#Rv(&K#A^E<S#+SZJd{Mf9%>YwuWEo(TRWyS<_ot-A>0a{ZEfgx=v!
z!8Z?lY2(pnerGj;n6bR3K{T;4f(L7FszNjG08n}>WQC=GDy1?wxsEns?so|^@8&QQ
z;g#x#bU%n8gbiMW@;A}gV0$jwXG?JIF9D}I53_u<uzCZh6{gemgyHGM%2tJqA2}xx
zfM0AjukThvmf6)p>v+(7?jsV%>F`B4rr09=bgP2OsK-yQg9vqhHl;sndw8c2;`h%v
z4*k#e>hItA(RBc)Dxc;OCL-!Ve*HQ{T1&^BBt`tD^QX`tnTB5EQnKYW-i`iKzMc~0
zZH#uq)(-zBAo*IsSYMud09Eh2OV|ZA^{nNagpWkOy`rg|wNVl|Oyf;gA@r`R;prAO
zTJ)bX*dj*w1C4b?g(S+4s#_a9^qciR-47gGNS7hqcpb%hnGZDl=wwy$-^k}8KCi`g
za^&4R*c<}Ja4tZXlv#64+;hd*1Y{`iOXi<1g)BQYqN+icvh>xDlp3Wc2bxbd&)8oD
z*y6BHcR)LC#M-g9%!#-oYMr6Yy>)cRVmniCnduk(<jX|vy^D|Aj=!7|fY|s4wt=+7
zXigLF()S#hx6I6AlMan56g$%u!N?h<1V~FaX<|Ti4N?v`PBknMlSXL0e9HWGWU$0<
zwLl3n1oY2Y+DXr;)oI_U1%fV7u{z<HsX{rf>49GImmQ($qV8^KEt7oB9dcKiPxtvL
z<ETTPvkG+8E;%hWSdLEW*{_%lD|tsCL=&i|t`+n7l<T;}zKd&pMrY-f@FtZWv~FG;
zE46jGU35Ksv;`Pe)h&;G@I>ljqB*PieM<5bQYAC^0d}8L)u5;P?(%pf@F~rR#zXDG
z`-Uk~s%BmNHAex%Av>R$NypV39l+S&m2@s04bAqC2iHEh8sz_B1SVe~1FoziFOc|^
zKhLtQd96AUwY*7h{;tScL&ZHk7xpM;_l_AMXI=VNpZeDK>lT#XlqOF@$Ru18G?QNX
zvgQA%DFRNK9(ZLDsSg}$WsUjq%WfsQ>A1Qfz!EZj;SOj1AF?W<_AZNj*byMNGScWC
z2A%X%qg#Qx`<@;=dflJ0potq>6HO}89^&~!J$5DBuT^cq!=XybNg+ijm26Gs_omh3
zgUtCX@=Ikw1<~?#pvDQu`cg!nMu13S=UoD$12_FD-YzUVd+`b3h1z%ASgvQ<R5)(6
zPVrO!$bI*PzlPz84jHVI>I1<7JVr_QEC31Dkdd`|>i*7H_$uJ~m*prn?eC`;y$sWB
zkMOb#OUjf@yY-1hs9|V;Y?=p&2CG$gS{d!jU+lSZj$EbD`nKybzY1D`*C}T|l);~I
zPL)JknDZlYj0#lK(?TUk_K>=MlFpaMVto`@?Z5_}qo9W-pu<1z1fNe8dg5#SwnEMJ
zy|4#Cwq>T=UAebBfUXXv&-c1d5%hefHd+P3vHRup>d~O0iA!WtY#S7GAaGy*N=~ob
z>ViK8bRMN%&ML-sz#wH8mgu;uRfDc1Mxlur_1V@bRdshvH2rZcMc^_vtuee(iJhs7
zML4o)N&;JGb|4+^7T{NHkwM3D6Ga+?T2Ocu*V>2t(8{wZBM7r<{U8Bj%a_~4)5|{v
zd~eG9rzZNEKeRR@IkX<ra2+{Ksn7(0F!3ndgs5Fc0v&`#MSR3;6$JP_BGuzSEx+9K
z_;we8{$LJ5-k`>a+`u5fWic%)qSs#gI5&web{di}(O0oX!5Iwjtuk<6)CJHXqQq*p
zlh<nXuPtE2s)}zg&e~6fOk(Ot&3VkFkKg_#X6R7j9_MWmVjyR;=;eMg=K=8~SoKGi
z*6Dn|$miSqf{!7<%QX99>S{{&fF+w!gLz3hPV(5Se}#Rt*LS`mctP(a<5$qT2vXxw
zA38)3x8*pgUvvmL!LsCSL@u@cvmxwzf|V0REklHj_vj(u2!$RPxc<Y8>9&SwRV7v3
z=!{p`3oO}b%%Z;fTVooLSaS9wI$nlu5HJ}5vU>@y&UPCdRp41_mb?SzEiiVdKJa{)
z&M|`@4ovq?`duYNkWVN)w>Qd~yf;$)Zh`jj)+3{`8r4C)%=>*Tc&?$Z^9-?({5~GK
zCR@8If(A+@RZ>7R%;EeGxx*?1JU{&GW}$cnejiS_GL}fHRt1X{$I@<XK(Q&3FsBU;
ze75?CFq4_)4@goYNk1MVS-X_>;JB<{Y#L+mdm<13rs^XG1lWB-`3cjV5yGt714>lQ
z`enC}g+tgCLXQGG*2|Yo^sDN*<cinzj%@?|R$z5yver?5Smu12X{tWbribjT<>$3;
z-Qt_dq~!oF($9R?#i=07Vej=^zJLW!z3^hKcOc@(Ht1g#`A%yzJ<)RTa5%MD3!7D=
z^wr$MxiSz9c^;kRO%UKhcf9E9;2EsXbMRDQuJtC6wle0b0kD@%z957FhG5%q#!2)d
z?E~Y~Z1E4c*JzR;q{gq90Bk;(>{?W55DI4C1diMMwXbeX^)cGxbu<D4n{lWmEqb4v
z0{zH)OH3J;a`^3maOVfBA5|W_74DiFPSe~YOh@+vC!<qM>|cX9+YjAUt>@Ztw34x!
zdU=qWD<GpYzrS<45FZNvAH%@4D+-9T@zdhIm=NF;$>Da^T>~a$UZE5F{?`&2&J)*o
zTKOb)@~sN=k!>FAs=H)C_U`0PcG2j&9%D{QmaAT*q*m)ltM#zv>o10P9NRM;nga4*
zvFeZ*p!Na=sZ9F+Q?<Y(f;;)!F1f18WA2m!p{cE)F$qP{xoPu@JN+%wWM{5%iSRF^
z;Ra9L<h?jXf0xviDK-E&yk?`RjSHvTWMGdGckHB*V>+=mKz^{W(SFwhz!!snhCiH$
zj)M1(?N&ZF;3E1J6*sJ1tgdo!IN!}E#5<jnGyPAenK=TDBi~F_=&VLG8DUZ<<O~um
zuJgAD0sI#yeIS#}I$Jrh^Ah#SS6W~)JRTorkK)1r9mhkE_Y$KzbYDtCC#&wT^6clx
z@*5fX_OZjcmcV?9ltAoCi{+`!2#ZbuKD!01GA^fSui*T{4QLu4rcxaj+4Z_XHPcYW
z9eSUc7o2~}4eCND$Pa985RoFsEK`m5CrGMdem<F~^0RsGfN>VTjY56woFIA%=rkhn
z+qHoJom^o_WhFJ|GfqXG8LhxFAwg6p2=abWV7rCDz++o3MWu(79k7&6c}f4826jc&
zR=<ZPE?_m$f-eIf)A;>f8z#NH`vK(@aatx|b&f2Da*f*9;nLeeYnY7`;_E4tZzIqq
zf%XXRaqbP@?m|(V3OG>zyv*(m%kaqY){b|p#OQxf&i;|xH7EUln0_Z9|43FQqX776
z%XUa$hfOr(U_Bqij~OlHl*y4PL=mKdZuIZD9nK?L>(7^3eCQ=bzBh4v^d{~^dL0o`
z<$sH0IvAw%TiSn|cHh?M#Yi2QuXR7<#~#rfGQK(K7r<A)u}N!<^^AE!2lozZCgAO#
z%PXo05WsFvlzdRZaa7ss)SlCe3r9p3*fd@d%!cmiVvWqeTYJ^^&}T<31)v_?iC8{&
zH!2go3+88t4&&rEI<9A+tgU?lX!Od1M$5=GfH0M2oxee($--6kv*T+)`at(lRI*Vr
zTqdxl`ie9)&#t$>-oJ48vmT*DF{_17QjszPRhlA~c1P5tF~Ktq0cm4)h}FE9?dkS`
zJ;AksU4!N^8RDjRPHXg|5_<x}5#7Q0mx>m&*ZyaElOng<mYE4h^r+?CVtAKDq^$BM
zAg_9ZUA|72Wc^m^9Ld?5B{CFXNou2KUh~<ihza7>{Qt=Md`}if>8mn*ueU0Euj~m>
zV9NI`KBdZ)kq%=LE2ENkr>@rkW?|($*-?A<{La9{IMNnmv~bOh+_5oxv>bS&W1PJC
z*ygRqD#XYSUTsWJ+Iwam$L_i0N^9V2(3s_`er;nD3*n=rpxnmJ-+X{>!S~yix{fUY
z$0`)5^&5oQNFc|Ot0GG^sN}P3aHufJB1nu6Gw!PbUBprQmRT%SY#6Vi?l0JFJ&W8B
zmjC>Ey98>(jGg0bTiN{D*jh<-Ll2o8tjA?gnnwQo*ZWh#Y}ElAUF`!K{Q;5rJ=j-t
z-)9c<Xu<b05Wa9EYq;n}e&oMoho>z`60fwx=BC0IeFn}ZN~Zet$3m_iS~mj{R*><>
zzgc1UVCYtGs@Z0~VK#4aNhRBmwTZRawlVVY$}H_>URy3j7@TXhotW>Oh*>rARX3R)
zowipnU3dg#!~TA`#z&$=GuBrDsVa2Zt306;KY=dO7fXs`pR1f!WUfOuDIcb;!F^VX
zs@*xZUk*zk>wP>!s0tQc9sApVE1QC;OuwWh*JJgqWPiHW6PPzMIQ;Pf@Apxu44(PE
z+T>$7(2yY!(KN9A+VG{iH3a|)hCvDUozjUi2G+qpu6vHKyUB)q<!%fTk4e4Z=MTj{
zK2BfuHTp?@#t{X^iyqd8`moidVY<dpQQSvuX5f&IlO!2sOciUX^(FkVq#AM^1{U}z
zF43keYxR_!n14J>{Qva=@E{MwOE^3hQO}#UX#Ammn|$2s3!rFv_3NCZ^{AEbOskb3
z81;rA;l*l~3g6)&*6E$6<PkbzJ40~hZv~ja8jD}ri!Nq>Bi9eou;aPpuSRX2(P#rD
zzW*?3dcM+$!tuI|wCVVR+UzGwk<pWRc`@y3q=`}025<b<<GBcq7OhL@MDs<lcrQ!7
z!rPZ8@05Mms59?y(-^YH9t#q2S_&${&M3!?sQBJc(&lb=HOP~NotslOF$Oq~KI8}O
zKz`sftU4Dq4LI-eqIOeDw{HW=J+3po4`HsGs;##5fPezPul$BaD1-zFt(nTPg*Ncy
z>BH{MDIxY8cdmIP2BmEb5e{WVq<}J&nN|^t0sC?@Wt*uoo-r}{yqqsyk)~;J^pp`8
z51mb<{?L2L(O8o|(U39>tbpx`&J%%vv)w|}@rS@=ib;GsGSQ_&&leOyP&4*c=`rNQ
zGqHj(>jT4-K)3@w<9*@%fTC=<TR2=`SAi@>T+KJEfIaoz2z5xQn;`hQ%j*f|K>jX3
zS0{8(`N~h;ejq=Llf36l_Zll=rI>z;v%)_Z5v{pEhv+NF+;HQ3zRF*cS>BOHxB?Vd
z|J8zJBv+y@L%#p?u3I?wAl>UW0za{@9(`OkC9Oc4nJ=e8wXbpFB3D<$edS=7b~sa2
zKpA&+bVX(~mesz(&k_=;Q5G(7{5M-?fYTf{IOb%G;NRf|gxlp{y&G_A?(aZ_@*68<
zYfAGJK?)}|eJ?%sRza9rWs|8pFs}iU9s7Y4-&E4yHrP{a#raG9{EZ?VE!PfDK_x~t
zU2#t_b_Er3o#Jry62pu~|9Hbd4#yTLnLk3GHHd)6!T!{oR{){|Z^5Q1H|h^dH)@qg
zz9Yc3q$t4Q-QffRSi4@sfQ7e~Yo9x>XBf&~%QzZRzLF+ognI#rC4k6L^?1E-bJh-#
zR><(E^kpj10pI8dY{gQz=|@d!&#6s#LNfZk6!mRchtQl399!0JMrT+P{@SC{4ZiCr
z5m*si^h>RI3ftXehc4yC8HgNo5UaG$5T;3(G8=&9b}&jpxcP%`y6Ca7Cv_~@A>efe
zd^YPe@GNUJQg!Zz33B599Orzm2}RGkw9fP_jyO?a;w?Z>93R$YGrE1@!*O}jGF5-K
z$6B|fSU2yYmx4^OEtA%Yh5Zz9v&uwR1ROOYKHp*HL3!}Vc@b0>*Alpg=F#8#URZu(
z-llY>gdjk8Bwt&9kK|dPt{TnhHFUD+g#u%z5ZN)QAg0@P(|(r)q7H?JXB`e<+W%3I
zF^KG;-m?=r<k?)zfEIlVhC~OW;$`cJSoAYoN<u8Vfm5<)yWHvE_;8-rHUN$pxEv?{
zbVNk!leH|I-?<`4;6k|)zUQ7XY{n=~w*akn!@hjhdA$}tt({h18QBE(Y1^lFDJIJF
zUn14`u*t@zf%4e#ByafSo#*>w0KLU!z^4j{O^zH$=5s~-;ajxq?z||Vs)fvzd(5zV
ztFw+L)Al5jvoHfZ4Dd06O_|o~=NA~UP-!P1ys=DoZybQy)Y{)5Ibkji65kKO811V`
zZ&2g~QswIkA-_4+DPQoEaz;pUqc$E{%EnS6jvO0~oGmjX;(?;1xwpS{z#DB9Ad3if
zaO*cq-+zDoW(!2#ppp-d=>fk%ez}u)9S)TBaNH|8_|*r8%6;aJh_(+4H$vRXyi~~8
zc>M<->ij3u>>UrB6@>TuDL-SmKfAAP2%Prqk>UB{)@6Q_zDja~{U=~QOYMA8>N!%X
z;h;9q=>P9l{9;jUO5ZnkmlK4y?-RSyUbSQ!Fm-vhP@B4dTsY*Xe5jQ@wrPlk{qhnn
zeN%Hc={RAqCuF6GFCjnv4Twjd?GFfeSTC+-#r+RJOWjq`wMs490tPsNL^M8smeVre
zUrfXuVVkbq!~Uf8xoI~Hxb1|@WoL4cZ=Pn_(1_F|4!ldt{~=xsaNtV03h4j{!0a%`
zMjB|`XE{-!Gmsny{$a07s1vJ?c#?9VZ$Ip8`10Sq#hjBGo$*@EVH@@(2xFGUj&i@V
z&Y#Z~q)IoLL}16`k$m)AZ0~%;yC^Tc`x8K3v{DZpeC2LY<HrnQsg!d1ei~ldH1ZEk
z>}bZ}^qTXJdlb?X3_Hn<CFYaJ^~HR@G#v2A@$W`wFQWq@x346!g?yFkS#pEa#n=Fp
z%hV^svQ}jUdo-$goWu9`6;bw3wrrfrC>mpiS@3D_#ZtkjWn4CU-FzArtExwb4<M5k
z{iSt_<W@hX2fwnB)4J}dBNLEpsmZ>F4F!jfe}in4Q{2QKuwQGFTyS})lIM&&r<w`3
zD0n7Ic<tMdY6L}z_tUon`6I5wuy;hv$}VN12QyXJI6sx0bG^@MrnXOchdh?x*w#cE
zhiQA=Z&J9QlY7<g$_adPtOtKgd5n8Z$HIRxdxJLRI1*m&93@}Et0oz$$z8U~J5I=+
zX3E*fm(=y1*AVb8W+HyWni5ha!InK;#GwHr|8XCjxa~85N%sUunA!3F9B#j2Y>iMa
zCntEONx%AK1mCagQt|ZYRDtl<=_M|&z&odgkG6x}mg8eeEc~wqJZHF288sy7U29!+
zf2`MM3TP9CiGigt(qvz!^l$7HOVY5!?z7pic+y_>jPI}2B+u9k{QAsQ!F#kCK+gI<
zH*3c5<D#0-z4okooq?F(x3>xXr`x<A1xP<)AeBb26miJ_E|?V5y4<0()yI-KYV~ms
z2!G*uyE)=cTTfW>>QgxzzClb#!{wT0xO=GN9syU&0FxI<A8iIW=_KiG-lg0Q*j#r2
zYczPuW;YWAz`#Os_?J7jj#k|C#!#2Y^Y5~F;@{0&Cx;_Qdz~RM1%Tl?JRS|Y*B3hX
zQ(O5mGYtWAOfgE{j<l4K9s>tv!_yvB{Sbk$@@@-~`>F-=;IjkYgMv97u1SeBI&kO7
zI}`7>ypn+V5W+3^v-RfQSLE`0?qFe>+-jAMwz=G-%SxWV4gy4UWz+mC4*vd$Wov}g
zWrJm=VvFF+Gyn;%yX~I|UXSrdzG3s<hwV@Doz|OD!QuJx&m)z(s~?8Js7jnYQ!s7t
zi=Jb&9&-F~$?^+Y_m@6IB7JV0Ilb64cnywKbK1ScU(p3&XIP=6`E~zw*ItrzDDL%E
z)du3v!tI}N{e2FKqUuaX9p1wTjiD^`M;_Uo&xL!PeeOdcTYIi!SlVmJoVK%MvEq>X
zIK1&$`4c|l;k&d{i`C@~mkk(WfQ#H&A+K5<`0l!af)4Jdlp%S)uF*Q{)9fgDJKX9!
zIzr!5kJRD4HHR1|^3tUDQSiC0{io)TFF+MVK+XK?b=#+x#Yx7TCdN>q30SudXwHxm
zCndkS9iT(Pfoe=g*gNs>uh&L|#p0gW?mZG<FmriL%P81WX|MfV$2*436wG1zMLlDQ
zH2%DUk&V>w9*7*Vx>OLmS}M(HNruc79F9pkm$OLD`jOEbfwS1Y*o4x%u~W|BhNHNS
zOi8Dubcdg^YUJ&+TaqqIXY}t<HDHxxTq#$*xc4pK_mr9!FfukXEVMQ1MFXIgQz<p^
zQITvojqHMsQU&CPEFZ1^DL1XIc=XQBPIL3$^V0uik%K88EA|C1tz(BY+j(F!uF$)&
zNoE%v$-bogeVPz#p3c4MHIG01hlSNOV#hDnx>6lm<u=njO|n{^@*2W6%U$PQ`DJ?(
zg^YBH*Q+*v8~jjkTywf`=|RE$(NIT^534TdXvEN2;mYFNcfsmeQ-)!ow=rNS>o=!V
zC+K%Cajn_Zo>5l85i(UlC*1Ld`nGO_TI#b9`@Q)3iS_rio!^3i((3Q-@^Dk_x!=4d
z+tJsY#OXgOsRhlr_L~kRtak&0MtA>sA^wbRj=N8(xL}13i#ys;I2Mw3RkRj5%WY^d
zHP6S31t!w|8Sn)<I&s^sTj!?D?a?$l77uI!19u~;^;m;y&GjfR1m+IXc!qv?d&N2?
zk2b8~3NFfcs<!mFd1U5(gHs66J`@c991xR6W=2yhprZR}tx$580{Wq&>m+tpLd`7v
zEZP2v8Mjt4vQ8YtxF!Qn(Zz8!tKOB(o5=JNSt7_U8-C%hAK#VPZ+=)Z-?a{U+4hDd
zud;wM2*z@P+J$M31*#!y^3z}@yPP>hQ;PbYd@Hh~j}a)D^`${aQ&})(Py?Nu{rYbs
zn1sJoy8Dz%nXB*l3>gNFQ`FbppM8Rjl%*Go7icXvi`YZmS1#g2vq`Vt%vH4QQB=Ri
zi7ETr0qP&@f2<l{8`y(s({eVsu`4>6#dP&_GbKf2GWI6WwZ_Ij1G5fZ-6=7U$l`x<
zo}Z|7U%<<KeSbr{o$k4mn+d)aw)>QQH(=eSqVp(0d2th-I!x~0YYn3nq2ZO97TRds
zYW4F+zHZS(SdorHjPBwL1J+8Lts?o5zXn`wOL#fi=KEr7K<6hvH&SCcopJsv{YbeV
z`2>`GaM|2m8310qSzeCi>fchMS_+9&HGpC<Krzg}Ika#3^bv^mF0ou&qm2k&d302H
zEXRr}|BmKN?+voureNch|AY}s=}<3G3On$rUjL{B)PJ_hJGNZKHf_&;oPo$ujDBiZ
zjd~-Ln&XlsS0*zUzTGKf3v?S|cHexX5MZ+MS55MUjgx{A`Qzf1GpS3nosofxzrak0
zrjhGsn?l<xNP~Y@b~dwK1CY>}4>V;qfgU@K`I_#u9EY(QMt#5+VhX-xXx4$Xrm7Eb
z_?DxAeTz5XmzluuC`0fD09WbmADwVeasZ+kao;c|>8*i!`5<27WoZ{rA-jU38MUKf
zlp|vU92@I*oinuKO@{%?pjE6$QMR~=_}ef8n)c?UeE&4K=BVbyb%|rh?5CuA*ml0Z
zb<IDmJdX6HBlHAEpqY%tX5!=C$H$GkrLz9lrykF_TJO74PY;@CFFDfY%ww+&`}q_?
zg1Xij$Zy5RFY2_(FR^Qt7JA*|bBY`qHj?t<B(HxO`fMbQ?6W|wDq}JSQw8R#X^o%_
zV*E$#g+TM=AfVRf-_KN6Mr9y$1Dszfo7rzyg2HIC4N5F2om$pIV3h1;7$u2S^?+4t
zba}z)68|MysTJ-uBK2?!I5nM8y>Wq;{BlU%{CIGfe*{g^;d`V7{f=M!!|}Z7n%7=0
zwR~GMcDPc}TfjCrzUGbfCfT=^X&nRmLi;Rph!R!Q&U_Ist%GiY&zY{UoYV2e61bq{
zf;t%^^>W4{mEF3JDe1SP*IqNK^>@ct;y4{cT^r@W_)_(uy!j;_l20L&*XL`(W5p#x
zt_uYj;3QJE@BG(R`N@|GtbrgZ&>^h9xaIQuJJIVCTSKJpKK#$ED~G*i_rM~h<J$q~
zNJ3BC>+6F#TCZmTiT7q$pirLDnikThF#RhQjq$WsBn`lr6=1wv#!#9wtD#YRDKrr^
z6FsTz%5NB#RI9T>y1(bzGX}WJ%dM$+p}LY!Iv-izzdi1Tp;|a>=L{ne@Jt1xllEPR
zkvF?z$Dzq)ZNo{Z?$9d_bsCZP^A^b;_bxWH<D8K;vyY?fZxj7UqAa><<jF$MS?_=C
z$&B|Xd-we-CEot_Q)efO_7Gi5Q>&8hD7881M$zmQP?+|uzu-LrXdM=NeIn6w^5)d|
zJ|}5PXsO`BE2jRZvQjMEPzZ}U!Q~f=S03f59$?#A=^kM}bVcY5k%|g4Rxtj6C2GR!
z5SI1k$mwWn7U+*9&xc7iJ^v3tk3)Qo(mPYY;@@(&r!FPz#7RLGD@M3g))zhsh1$)G
zn9*|N^+)+Y?TxFn&*>JgRnxtm=m)bgj}q%%)={EZQB5NqWOiNm)2T-^zz0Tr`zqRC
zJ&8|c{(r<T>qM_c*!XtA^V~)}W{rK{y84Yj+7k4{^R=!!$zPr#qwp(|pOWs8thKso
zL!DL?umVe_B-1+WCu~9k^Zsy2W!2ED@13%dH4ARH(BtSh?tw~SSDHb!8-%nS80d80
zMKKgpUSezIlu8nRG>tZj)GD-5IDzI{ntxQ6fkobF_~*X4oudf(3a?yw0Wy=#nz(5y
zx)apXX_^0ARSwZ>05_o)MHMmQ{sL)4)HmJJuHnl!-Nz=m0Ry?Ny^F2<UCwQB!BRyR
zf}c#i>A#-Ox}3Fiq3q?!^qpc8&>OHEGyR_rdi5G$`W!Uu3J7*eJ0!b^uc3p;L0L<b
z#>B@jy=oZBsLa^kU}W*?&<A1DeHX-B{a?Qxj@j#n*-T{^qngZQDI@sbuI)?DD195;
zswyn9!_U#1sAoE@Vh`?;N(zeZHfJjGo1rdbM(O$6<pbqs+LT<jpxT(+7hbh_)E_&G
z?6JoVZ8nz|dntTwzgaydh^YnV>n~V}`ANF(r;PNoYK_8rDQH{1t-jQ%i+#a6d*;&C
z)=9<QxN{()jpw9rBa6aO3;4(^2!FcPd7>oJYDNee$_pq~FL(1Mct$$j*3tTUdDqVh
z$jFRH5d5$K*R|op^4gV^bIVPG&@lczfGO<O4P>eG_%%g+0f74ibYfdXTN+;1>u#<1
zcLl^-FSgLP=(~d_d1>nT6dZI$ye-~|_Ojzx@s<|Ax9Tls3zx<UmnO%Sn$8R(8y%X1
zW-v=FnZ7(JZLg6W&TVk?-@KOgRjJk*efB`(QR#>DEH$E3hg_NchJ<gFcVKYMSlH~W
z$gD}hf`R@Sy@uDZ2FF2Z9xPGG-}<Iz--T6j);0&Bm($8g>q)=FTvd?}$fC1$4pa@=
z3Cdm=oUouCI!0D>nf%}J*7LUd?ft^w@uM+LT(J7?vpb2vx7>All7=d~>UN?i0ch>o
z(4+FH=oW{nzTaYV`z&3fx&EQ<*y)ONNseg*0oE}vlba6{*D<*$IRh4Xp|Xt#m#3hf
z>Fs!$J<ai0ZP}yu(Q_^f0>_ee%il|>-8>$Wf^uvoe1ze_hm+i7;YK{ul|>aDuIXW_
zOJXA}tKUmdUus;-Y~%3=kCn(+u5twl*FoChgO6iso!K+gK+^__C+D}9gW*>@^?z%s
z|7T<`sI;PQ>_ioL&dUIml5V#X|E9(tDDPd`=RnEode~Q>RUAM7&vX+=dQuw!c;RN!
zz*{TehQFi;R(ToJ`sHmdlw2=)>Z(^V-?$=-KoFN@7;Mso`xt~4xGJCZb4$nhW#l|M
zIvqYHdY&*cIXtS7CSh2QH0UQf7!U(cn3V1A;lBaTyz>E1*QZ7c!BeZxUdpubOAh7D
z((=;o2nPLJSmPOBlf|3&EYLdud^@#=*!0Fh@^o(|*df)0=<{c0hq|lVXin>q<uyA;
zFGu;Tnlr&qcDwRu`!yRo7sZNe)-CR+4YOsSSSkNyERg?fC6@d@h;#R6j7JmAF&ZWt
z=ExztRMZhkvo3+=(@Nr}=p(<>o!WWvBS->;u8k(#zk~!gXJ%48ZiN(xvGHN9g?ug0
zhh~a7LYN>Ps^Z0A%UydvhUF<2Nz`LV4-7B)_^)k2v59L|az70G|6%HSrq?VGE^wbY
zG$yL8OjVUbtsi2j7_l?PoyC@>o2#V0y78ZL2Tn`C-||(;5A^9%b?!N}sBpo;ChE#}
zRv2XZbtJHTT%ZTijWN~>7u;1!wVxcuT2It6bj|o&0^KzhFEp<3o8&r4V^6ybM8}ZI
z5+Zoz?xUGj$e;z>%1iq1GOpTm)4R>~_!7l9w6i2JBs>b7jCdPb9DcxzcRFhH(+fA{
zqtITlOT!+)NCUUyy#L%V>8fD~-!Y)T{$u$0zp}XxY|n17aIiXmzx;Zi6#Jx=m=nVa
z%C09EPUS|2OW{_Z8d<mK6V73#dwX*jP`|Wp;;kv-vct+UCQoU<3`Sihs9E<q7xh2Z
zR}e!Bd<JNsC0apmT3ZQ;PAHvdAOTwXlV>Di7=hCS5hee(E<TcI1yg&&(Dw_^s$W`x
z5RHEoBbQm2L_G9@W;H(vrN&gmeK#k}27M6Z7f4dHUVDQGqbyU?(wB&x6`{x?Iu@wt
z-jD>N(h<X`xlx+=8e72!awoM=zsYOq4sYz=)ci8I^ASE8#xX-y0%f)>&gMOdj%>Mb
zt5h=6qKJ$gaPcr@(N5XORgbWMTO$Ta=G$~cWapGAxd|Y)ma|ujDF0$$uF9j`i95X2
zQ}9!u@qR_^(JRdw`h&9U{&EdZx89f@C;|*^<fy>>Tw}X=P0+rA(_<(D6e9=S;Nlg5
zvS4|ufpx$;?AMs@766mf-KHj3CmJ+*etx?>-po7|JQS?9o(pR{1_zIrjyFGa8uXrh
zRa{icFS+&tgeik|CxNdlxALS}_rs@0JOt>#qYKKS2jNFN39SF$ql?3F@fhd@n!px*
z-+|Horqa%jlGz#m2ln%sIq9AugF=JPi7)Zlf=V5#Mx{Td5-bvdyjJKj+EsY|wuQ(U
zuf+&vRhSOBh6GdrxRN7Hx`+$0|Mj-zOmhb{u+FLQ3yU4p5<mZ&P}fqxL1hecv##J+
zrmo?H=(rT(V*<tRbUYYYmOrv(r2v|Tf$sZzSA_GknawprKTY7n7lcK;3PB`+bW&Mp
zz@;EVTPIXmJ?eZ8*Z`uhHjbK%K0MR`P&l8w+f;APr1b-ayUV_L#e_LxsMlJXq@6>#
z;B?2RTXy53!#m#AkKY}a`4%Xp(bj|=p<&+QOTjK=^Mzo+T5pDYq|10-qKPEDpsmLU
z^kcx+LPa;Kesda~oC>6LLe6?x<L>9c36;ti2}J=W6CWdyT14GFJa%G4{SXuosqRF1
zuN39KB2GyYol0KQg%5f@vFs;iUv-vLJ(ckY7&~iT$m{sE&VFvPfyQ$sC-fAKYRy)l
z^^G_5TahEg?cjP4R5JAR`3V<PiBa_{moFl%5p>b|-nfq*He#>%fNK;gPqmF6cp{I+
zSJ1pmo5#tCIkGfR(%P9+TUi-@zH}j3-Iat=P-35n5pmz?*!>e-6j+1BseL5q&vj#(
zB5_A>eVKp?i)m!L%Y`MH*FfyDM-8J3b|&>r-9^&ytZq%aNQ!JB9G`S_Hbz$EaLC3u
zUBP*l8UC>rLuqo+F4{M28Dk7A?2%~K{z^Ht?Dj`CqfWAgNwR2e`5Wa5{Ze#g_t=bq
zXux7|rUSYe5CZ$e82V#&3^y-JyHq*-K!x|dh0C@(BFFrSUr3L0_>{dcQ{Ix32Nkab
z%7TEKA4M3bYCve(5#;S!^aIKnBLYrY8wk2`jjsIDOANegDJA+y)uaLJ6*c}V0nB(l
zOB$rQdz!c*B(nToy}jdU`emaj_i{EB`OzcHsONxU<&+Sb6_Nm2G#T}#j)W9<zlKEf
zbrdFMCEfS2!(DG0a%aib9BM?MPF5H%{wqDqk6X_sQ~PVFvzFO|rS$JOUkBj3`@h(h
zHsmSxQ}}uJth%nFM$ii6@T(&0x5j?;-}s3z{>rGwJzYa#Ok^xY3_>~rxzwHMCf41#
zMMd0^1R21cL&ISD_BF#ze}3XE&iys-W_<D*PFeHN3)Qy|QVznD8kYHr1%0^t-_Wd7
zhwvFN=+t?DCmo{vnLf7^4gIuEQ$5oB6K3@kPq7^_35f6IS8!bZ!|%2Nde|q}5kU*O
ze2MRgLaIIC0Nw^I&=^#`-MIdqp?^EM_I99A$spKsdF3AsFiGd#=Y7$mf9~#|w6q3X
z$`t#I8pfU<zBt0)Z?mJ4wy7(~lc-)HYIpMN`}kVu_OaiH#E4{6LBQ5}ewhUUEuqfV
z`BdR;a4aXoGq!M5yWsmc;AJFs2dg<#8>yP0z-oDT!8uz>{}eM{33?Y6-X@$H9;t6t
zZB<?ES2Zl}c9{Yz*wH@_`?bAK)cxa(#kX10H@veYI(phj&hzuA+b&*-l)Kj0sj-%G
zqZ&)h6|$0)3!93hvckMstGeUrxlf-G9NX%Ij`_F09n4^5vw%-QyDD8e!?Q%Ac+n-`
z)q{YK!wsiKA=qFm$?q3-llb#&ZLhQvBD%F?+j!;9-pmK$)x`;r>=$a({Ute$CcR}h
zeWEOdnMEx`r+)MpxTd2ovxq4Bwt^a5t+{cI5&e?MYtewfD>;n{J~G1xRX@e#8LNsw
z(vDPVj`FF4=)RL-ezYDk8kFs;jqVWvhE0y==dcftLYz);XkK&v3wswR#fa&5;~Q~r
zKaPER@$Pe=l=;`MjsaB{!ZN3lr*%A5LhPU3E}c{4_<!-U%I=q~l%iw6Xa$-*6@l((
z*FOF2m*S!uc~5YZ$4jskeexoUx3sz<OS|Ib_qhAb(@v^u&JLuH=+T<Ra>e2IN2sE;
zN3&Yi)tpu!fnIUO^<bsmy2FV`Gh^3k%&AFc^-o>(QLKwZr|QScDvQdx=K79aXc)jV
z^Ain2q@k#!G`kTC$7Rwgi{-n!-|@JeI>rcH^uv$I0r6qdH0kBQf8~t%6EVSyR}<m=
zioc;u!EIUChiQ1UU6wVcJWy%?SZa$W?q8{X;$dt#ZfH!EX8*Q=mS&TFcua@?9DV<y
zGRd$L*`~i4KtW@>y|RPe8YpEeFSQM<I$c-xT)VC)sn+Yv*b7~UW^9Nh(co9IqmNe!
zF7|ju6hWT}sRZi6pT(cFg%?>;Dm?n3FQ?vQMb9t5kCDh$YT*oYcnn!@Lqi92<UJ93
z`gAXSIF>8wi^Iq6!Q^fgQ@<i;36l<ED6sVbmKqKqB!2YKUVvB~$<QSt2F+=Tf3$2X
z&Qk5yk_@Rx@F-y8ZG=j+q6c;`e7!f+ZvOHAvG&$cadb_;C^Ep{g9o<+2o6Dl5AG5m
zxF!(X3C_Ska1TL(I|PCyxI4jJ0t5~2?r@stea~HY-Sw@zzH`2J)jv$ry}NsN$**eH
zuF~@a-c4)q+}Ju_)|;)GOcDl%9smGkGn)1t0${^l0S?;NV>k=s7bBAAzMoSmIX#s<
z5?3D=4OI_!uP@do4jpe-9#Dyy@ZP6S!j9lzN%OZvAGa2|NySLmk~2s74)CFyKgVJR
zZbh<5bx=v40q@}twR&R5m)$w7n?Kv+)4e;`%Z?`~j2-tsTGf*Lr2-QIceUs?5c)+9
zvGfJc@)X8-G6`^#kvu*>)_msTdZbobj-4%)ABb?{y*)|ftak(Gl>``Nq6Ye?(ZIKw
zH(E5YP=tFbHbg*c_&gauhfjE7kR#bF$UVow`TH)CLoeYYP=?dNVb`Awz~>Mnkwi!h
zdyNB<!v9;oGa6SsS8HLq-2I$9I(pgW6po;!^aX;?e(7#+fDSkD`+)c_eWVV}%E_Uu
zKAi3Avo=)5o~jJK@`=h6Y>|5hv3wac4F>?-xCFx4_o^MtdK9GmXeil`?k{1@44iT8
zk4l4MD6fvx@)w<BAJwH0?wbj1uszw|0)|hadZYi<l4be2?jh4h;N!rI7tdqHk>L_F
z2!a~mFL9`lBblt&dk*8>U!h66#LfYp^M%k`>+1^?>~;gRZq`c5T9Ak6>h9>bS8uhn
z$tBvAqiHHIKoO<E>%o0@WrwA|MYzH((M|u^XAN+a%R3EYeMLZJ0HwY(dP&5ww2hNK
zG>VtOp<HwbURsgW0m6vz=?H&i7wfMf{k=^K1~WzW8M&Cn%h`Gk^AdgGxPU=gEg|?@
zbPll8wAXG8Zz9%yHSaWYKM2GPJb&gB^7tnrk@c$nedsfPs3u4+=W*Rzg!EX_essYY
z>TOB6k4P3kdrTeC<;QCiNtkWI#T!AartzL$>{~zmrVD9HM6j8a$rF}9fRD?xHJwO(
zg4^iQ`(&#OeqF-^=_xc)(q2Ndo<R^qSc3JSRQ^yPO-KTWq=ek0dNQRmZ2m4g7<4%+
z?xLU+*1WC~_)@hFf%-WJ?8P}>(*pbt`)JhvLdKhIeNJ)_4&?#7qTH2WHQ;t2Sp-*x
z*IGyD0MyNTaci7Coe+mpOZE$o*p?c3pUrPS3MD`rKfUx?5m6+lk`33VM2D%a*w>q#
z<Bi=A9WjP|RzX2`-}o!6Xc-f?%e>6e{y)Z$I_wg;;pa?P?#qD}@P{>sdQ7Io1e(AK
zQ;0|xv4*yW<VQNJw7k8$J^8Ws_x6BY8l@{JtLdp6%9L1pU%)mZM}0<q*66YA-sqMv
zSyqg3_Wi3P+~|qclZ>kE^i7Y|B9cS&x<oi1ed7BH-+tU{b2-CN89~EMSQ3=YWH$Dh
z@WeWEKMOh8$GzU*8e2;F>UngAgLG~0P~Q`C5q@D!7i;4!aW$UYSy-MQ$N@42w~Xcm
zZM@pj<7q$@d|yMi*OyH#y(>Ex-m$99dS5=eJ0Pdpb8-@UDJh_DEW*eOVp*TKh`a<L
zwb73qBG-h3_cL2BeT%0jd?9XaL;S<UkpQzTT-}L}FC(nHZ%J#pW%i}n4>=E{CnffU
z4Cx|IhWNmmm^G{CrorrutylV{ySGo@^U2SH&!3<NlRJPe`kPU*?x0x}V4!S|sM3_q
z%%J4@S7U`#2Ny4*DPh^o&c+|V*ieNvP3J-CHqC&7s9kK3{)by@pSblGHDZ;vpY1Xd
zNRI`uOD&0;@GvW#oGp|zT&<&Qk3nR8n+VDJemq2D!NBtZXImU57dReM&%=!RT@bP_
z;x%brFBsvFc&$)h@>UTH5_&O4-6*~7UcHhrw@OG-4acqI%iF=Bq==FWSJ2QPnEJ^l
zTPgke^~5(dY-IAM6e0xBNsPae*<|vZ|GB;|o3TT4DDNCE?+K#|iiU5Iq5tv7d!M+;
zw-x!7+3kHw^fpByPu}ev1gtWWf?He<A@Ya)KKp4m&jZu_f$X)Rg#j@A7(FC%gVl^m
z!7?)QCFCA)=(q#{aC6}h@br@Tu-VBol$|9v^wA|dAc5f>7_{r~%vkZep1z%1V6}E6
zZfOl-mWg>7v<g<PMwBcDGA?TCL`8ZL1mzLbFuBPI4H#y^uh2(FdNK8AFsNVjNPqtU
z<nI?T5HovQZa@De<fM$+5?r%OefaI37fpDM$2eZEkMYesrzH3vsE>e@4{v)X(ACZe
zgibvw>A{27!=}QH3Y70XB02KMqGJ_l)Ud$*8AOt7G`P?#ABbG80N05aPPjl18db5+
z9GyanAD|ykW4P22kirpeQt1#I2_aB#wjezTDmb(WoOkXWCE9zfZ?JoujAk9whKiIQ
z0VPX+iU0pRJ3UhO;^XQn$wC7Q_f5cw(@^rwoSIl0y_EOSC}hv=BjB9RLM-RYDBl7-
z7Nw<8SRiGNpik%h<FokUQcubUkp@DBI5x{3|Fxh;#`??SjhD6cbQQVa4`Q(YaXt!E
z_A@j~4i8X5<Kf~p{!kWaz@<shVhu+D2?P4(5&<RCADRLDH9$}i%EtlDYTiK6lEMIm
zlOdkn=9E#H;XENRsD++1Zw}-|I1pZK#SfzVjSARdRdAK=yKjC!u<Ao0B}@Xg%kT^T
z2L!?YB&jjGB9H}~KDUap{Kwh(*9#+n{sH^{r$3;y5TF94rObvKD*A(Z+_J2w(<=C$
z=nTUZ;Xguc1;_w+BBCae?(s(ASdN1t>?7`r_q^e?#C@VU^3Qh(F!4tyK%<NP4~Sj}
z|4<g#pX!M$9T5Efbp*ld|K=FPpQ<8wIbnz)9)zp<e>yi$&eQ+*8bT4I#9$L*S|i(E
zXtnJ^M^JA^Z>}5UE#$4-c}nm-;y)w~u+|feF19hMbNO}Lp`S9=N@j_f__SRuyP-wm
zKBMLmedptfj?^O?8S{+#&w>9j-WvVW4|egkt5DzvFd8RtN*C~B>;?GW=Qkq%>-^5B
zm{CaDbLxL7Vg$q|toC0$?0@G!FG3J(z($^2l{5ljG+egJ{%-!T|0K5}2&$<+@vEXr
zFgYn8A^%9{|KNG$L0PoV@b_N4Xva~WUI3cMpfWl@Ye#XRX#W|)5=6jmmtV0IMnwFd
zOzYEo!aqwQAho~HHvh%>UvScY=i~gpW=oE4loi4%7&ujgW7Wh6L7+lUpL>#^0E8Rl
z8{{6${NOFzEVO@7I0CR*fw%>~Kt1~Rku0?T`(sXHfqaUr^(XI;GMrY>Z?K-o3&|_z
zKP006wRp$IJqfN65+2t7eCmJ@NGJj(=qIp}C|wb*l6ulkr{@5hacBG1GS3HO1kcuO
zd0($+jFkm2&%IUGubHp0Q?&cr8nui_fC}%9AemS#V6guD7%XFLTeSHo6Wy^_NS0f}
zKW{H^DJ5jtyYK%vhEqk?-=SjHh^^9?aG}q<7Bk9W)oR&z%s+Eh6K6^N%~g3jxuE>8
z#?a%^nRH2g7kw?JhG+Je#{Yr{H@fs?;v^sKn#8JDy2GdwRPpIN9rq*baDH1FH7ao4
zIBTk^I+kri-XYteQTwUO_Zdr(Dt4i2JFlV6>ZUm=yGHXr1a<^Aa(bBg*0;5iY;k`M
z&YE8@w9i<Hw6Q-&dblsBy9rsk!#WdcEk)U<Z@r>(qfuiA2F6eC<>MhS?j@hsa@{+;
zF<LmVW0BH=Z<5$Xqy;ppvN?0BgZ||SJ_AYFhuoL!MZf3A5V6ZD=wWbLc^uD*>3e4b
zv(xvTT{@>cKnD@x&ZCO9$wDgTgIYGree-~v3&jx?>O*vpzxF$dQ!89MmO1stV(a4X
z#jek6&QXPoK%eT1%1a7^8|FT2<On>_S!Hr(TWd$TK^#hJqh}Xt^at$RxnA{jkd(X(
zxR|fOo-5Om&EEe~)6O%z9>YV=wjj#c@`Aaelrd6lj@z_16k$#~(xm2dQ5xTy5n%`H
zQ*3U&P^*>WHl?K%&-qs)`eF5|InGCzpnh^hcZ&FWoU7j__E^$dUXg{;TD0aV>4aoq
z=ULo#C`@iTAZTkRotDwVm}q}V%NsqKSPqZ@RjJ&}?H^|}16;yxvwa<z?0}gaDaf<%
zegn`yOCuS0v63Xwp9y}Cm<UjLx+_6%)<57rM5w^>X8-EOQrFfJPQgqo&)li8+ZA+8
z3NscEsKk#fCu#zU&0eJiL6s+FXQAg!qy;jIrX93uZ^nkvX$VNT5?CGW$l7b8gPs%f
zhfOah+Lc?PeHdC6(3vk?so71-w;8*bFR&voFx?mL#F(@Vti~R#MtU3Kz+J>>Y`F|U
zMzS>K@}KR`0Z%iu@mKw@mUZ%n_R&EiKfp8Deq*q&M55WGK2ue!3s<DuwG4UjM){Xn
z9IZc0!;DDX?6>$W(+>=BH-Bgta77|vuQ1;p%)POnSxd9~krix9mY`^9J-z(W{$}Vb
z#NwZ*!86dOjN-lMPe0e)|LO;VQGZgXN;dzJ{hAV}ua&{b>Ko)YNiyePb-tvD-7XPj
z;t$0E|B`RqiKhIc;l>QY3Km3D`w1#7wm-a5+mKLsHpOnRmB!bP&*Ly`iRKwt^Hw^t
zX1=)i)pSReT^EMMBAukjI<}tFAUMl6n{*bOr92zD{1o|r2L!51l5Gl`PJ?T7fyfDK
zzN`>yVhU7L0UhxyRlT^hW0Pn<_b8cOnr4&?k4Z)kA9YiK7>U^2+>V8L!GyVxhMJ~i
zxdT}AMgU>>`;Tg7%X%S5e*S`tp0ixuQd5Q?0L2Fs^cNu{2$=nn81nwQM5sbWdAj(e
z45=;W3>Q+`3uf;eEn^MI>Imx}pTd_&_i12C`reV2jit@Oxk<Qo^nz|dSYckw&*#>Y
zi08Dgr#x%$bCt~`!3V&&gak-gy4{-OzaqjA<_f}4GxRYKt2z@UsJ0Wik+%5r4ZN>M
zgyv))xMVP(SriZ^Vm*99n>Xq&YGEk>ZRa1WCuc_yXqU5SI;a5+>M0G~DrUZn|0Km(
z7j5oIwzG4Z!cGUQtYtOfIf4S_D?Zq0G56~knj(i-?nA4PYD<cpz2Z54f2<B7kzzY6
zOJi;BQ{$PO5||6XoGKf``F!qQcm$rctNqa45fG)gF9Z(`DzEGas+bS96h|{;p?DD2
zkPtzU#(2ni(s3x&)092-1k2=l?!LLM(5y+k3M=BP-|FRK)A4?dcJGAkL_X>(ybu>+
z&7YGnia-Ir&%1A7tAjxCO{Zy0XB3bEHezZbp)(b^*<)c&4%=I|E$BWo3#DcD_wSQ>
z&rSe&#zl-TQ`jco+5Kj}LbrHo&pg}W4!Oao7yqT4lP(pX%F4HpMO$~*^L19y7Gr#h
z)xdwkt&*NXR3iQ>B-`ZoXkV?k&@cXubv&^-d(TOiFX}mVQsSjYrfRA|y-jKAQn$>7
zb2wUBRbeKt+ev^K?S>;*YB^0JJI6&M%zY4KxKj53jpAU&2&l9Af<_$_T5(Qwk*Z>R
zaw6*BK$K$?zv?--A&02Ww^xO=H2w(N++18OkQ!jEa1_M&8hn-mLQ)n>O!mY%aZ!Kh
zt~k&Q#F1RosUn$|tGE>Z@WviU_?B~<f3j4|8dEJP%-3W%To6=t_6|Txuyc{F+D@G&
zAb;eo9=aEPxCnDoGx%t{Q!j7VSgqM;`DU@F&{|Z)pwCqa%TnjKHf^%TbiDei*Lbvg
zYrnlUgY!X3mWY-Jv5G?)sfI3gj={EtcJUa|Col&G@PXk)PbO%^!X|~+pQ-uB{?;AA
z)$gKe&5RZG`GV-ev3cWn>A!`9dnQh7--|1x&*9j3h!pkc;D*PDD%^fQXw$BFrz|8_
z-KH8xA3Ns&ZH;JZz{n7(iV2X62Em~vQZxyP9{U4KnHxioy=;E(h8eSn>fZ7R5MqG8
zU?UZnRD8#qZafiI(4Jz)@>L$UQP#H0!@Y)%C70~C*NlmVSNlRG9e-mn9+ON8_|Al>
zE>*VoHC`P@(aX4e*7`{!#uzb*vs(1B%aq=~#)dw?T^hkoGLFff{9JS4Tw|wR@|O9W
zEK=;zlHmA#_%pzv`b7=M-E}81*Jd#AVePMIU4_9}ls$p;?_L56UJigQ=u9Nur)Pb4
zgbVWbCqW9zdSSGkvLprh)}SG4t*yK56Koq0hLZsd#q<`Wl)W5$<5j$#+PV&5`3K9;
zXoGxsK=b&2JXEK$u!ME)G6miCSJRLxNbN;PmuFtDWLSy?b;y1NTXkY?4!K8LbWLT9
z;oN=Ysybbm_cSN6q1p7aDv#J0DJ<wIz+#N)7+bF)vil}UGRnyzsEJ`WV@sZ8)2GK;
z)6jVp|DF8w+w4x?V5)GE!oz6GUW#H<lES^`rfBVjMGg89w*04odSx&Mliz`G{n086
z^-899CQo<SBAyM)j@c^}pKz^hB+bTDSbAO)v}&nu+Cva8lS66E)-}=FIVs7#-ldT}
zk2tO>O+)^$#sAG?8`v_}-%YtMsV`M*$bO!wxAT|0f9a&j{ae%k16!Ck6^o8#>e-L=
zR4}r3mCYv4yVD-k^Gw@6-&7rC^*O3rKGc|0EuC1lZe&OF1fv$~*M*XilfN48wsj>q
z_}WXfjO_EJrRD=UkS&5oGy=yfI+%qsmy~3azUF+#wp$5^*7HayAVx#pgC%8vx=+LY
z9503%$+8jlYguSc#;OW&Qp0Le<J$)Qeu<_HyWh1;>M!b=(Cf$F-Z&mFtqWxZ58?h<
z0Xk5q<{k>U&Q|kf^x2}gR}zDAUf`Kg-X&c?k&YT3q4XK<h03AN(%@pM0eh`CK<*38
zNp~>!KKp)#czN!xN*{PYJfMXT|BRmtA>Y`?D8ZHsu4vH>Uyf+9jyZ*|wijL!AbBn1
z4Z>>Yt)r;jX!9qmz?NW805osoGjvHQftd&cc}>7QWs-@;ok;GPju18?K=8j{#Ekdl
zhRwk#0VD0_yEF0cUwuq{x>XJcp8CVQbw=-x;uq#@F#=-<O@|P@H5x;qHCl9eVqV%@
ze{DE>R-y@iC|VTSOEf=wGezEmMY*lsi&|d$F1JU=eOEEA=T+3`V9UF3kmg#WQWU}Q
zAHRkRGNhN-NM6GVRw7hl`%`tKV!jD!HpR!B0+(g>`gt^2y~=qsslxqJS8>8OZ)znZ
zmt`br@LlAy_~NETr?I{V!I8xkdY@kIISJS!D4;w??Z~t9v$L~Rs(nbXe=yXQHp>#+
zg5JtLfVOLajqB$lm&8S%H;`40EbCqr{K(5d#ctdLO5%u3Tt4cl?Fl@(l}a+fMS7@H
zyq4%Sj%vJEro#O;=tS>&H(H1H)#&oDaI}|WO6^j^?B=DB;?xyUxd=(U*X?ST^j+*D
ztmpQ8`SeXgB<a~=FD57DIAj#!NQ%_rl4v``cy(vS*J>r$w~nLG-hI7VV5F+S$-FRH
zaJx!75|=#`GYJuqT^v1_q>jM{`SeC*wB~{?>aHVuV(PY;4c}nHlY{*a4e%d4U9wJF
zu)gBcD$iBvy>e7~|EVkucv1g($g=0fP6CVL@%QgUB4_s%h0%hoq+(O^eq^F#qATf)
zJ!E%P!6t`W)3m7&Ip}^He|DltDdj9f+q>taOLKQ(JZz3s)u51F9;#26;^|B5AfAJ{
zAkBWoLMM9B8-q&?pEHf7Y4tVjrVE3=JEcx^&J|NHY=DWc!$lOasK?bX%n^c&)@|cZ
ze0;eg4qY?#IGU)}U;z5r%YVJMubm<j+mlczoB(D73_`5k#4mBkABaU9&k5jm-W*Q*
zp-`~&G#Kz56~WIx48N<|#dvw!C`WQ%^>hg^ji`u|5TC=x$}}N8LukU<qPNbfNTR&+
zsGw0N<J%pcST2_wxOvKz8{h0ZT3!MilHs(#UF~wO9$u}%?JJc8nKg0NGYf@c<h29o
zu0JKAjoD?YRuK1BTLP@Q**I&#+f5rLu!&uLvoSgoF@Y?x^BaQSu<)62URbxyh;-Rv
zB!R2<!wwNa1EQE+$b)h`@iywDl!VHmFBa#P*puvlq5hk!)LzqwzGj0KIvmQ3(pfI*
z9&wSWuv^EFt8bSpFDc?WY+I<Q1iQqP>_>gca69+F=^|w`%l!7Ad*BnNA|m#y#q)OB
zT5BP8YTKX4kjQ|=k~WvH%9!Th&7nFj^M-*DTsTZIot@20PKndn@%T<aQqs|XXN&1y
z(rbo>*y1CO-RN;3Y|!k}?U#XV3NshYNk7FayhY>R@G}&%5}CT+74(f8KT-rXa=9r=
znvqNKA8*NIOyf}KzLqU^<>P?XhHmk_DN<PzFN&SGmI(6i`J+agba!gC5E>&oeNRYz
zPgq_(`ERzjNeiX0{n+>Ps0WhJ5#57M&7>_H5RZKWvaF$k2V~Ua8P%QZ!54Hy5qtFy
zt@C!(J-Cgr<J(Uv1xdWEw7zSP{M)F4lT4MClF9&mvbbF9)7O@J36V>p;>|BSwNz;J
zCvGdxec`zObPW$^PoixUG8m@&&REQwCTnG7EQ@AM@<s_gmcdR>+5eT=>fmOoly<oR
zT+w2LoQ%5;UFAq5um>46^&%I9Nb1f(cOclVT})RvQ%9bU6R~Qcxe$AsTGD<`y`@|3
zfR+C1%2{mtoROPTr7z$5PNA>aVbQH8%tr3i2-*NoPe1p!2mc%h<#DiXzBF~TG?s))
z(nvs-1tKoCt7d37U0ZU_QZjg<g^vcG5Y_+zHv|>4_j7@s;d(}6nZusnsGJ5;1R7a{
zz6T%Gjh(tvxW5CHlpWItv`tCdfb(d;M+W!@p0D6a`G-7z5(6Oe{BNJ`zy!KNl6k(N
z|M6jJ<l)5W#4|29CRnv;B@oCWb`76GHv^jurje@WtDwLKT^2qytUboq2I{<~^jll*
zB(K_?DeDY+Wx?vjbY&BTRwq8?K{e%6<}@S3&U<h@oK42Rip=jS)-5achHcF$dh9Cy
zID)qAs>CUP7C-a-oW8fAUyl_jgR@TW?RXHkEfWRD(U?nO?dEF!NE7b`P!IgZX5s9@
z!FgBTVL&)r$3C-1(!rtI85r&3{kstMu{D_(@?ihpb(2@^qhqIuq%e={+?CuF0uMvQ
zcm}q-kz|CG4E}-FvZm?^iK1NX9=->IFFR*^@#;8ue0Y4S3{*}M6%`Vgd1KW$>lHVL
zk<n3Y3Td+dGC@NM2FkM9oQ68*sye6L=yrChQQ8FHqU+l8C40kx)*Lh$DlYG7+6JlU
zutqWkDNj6RJRINOaJ=xFLUVr<io$$rx%>8=mPp78e&LgL?6jHh)8!^-Q5iFI5v0~)
zD7&~N9)DEh_6t4O4F9e4*w(rP^2jCrEHPL%&^o8*DNX~-3W3CKvd$IScxm~|pxJYR
z%oZkhx3Lc*3GX~faYt-mY8XABKdy|B*e8{q4rMpb18f=hjc%>FB+WQ*?Ptf~)Tw)i
zp24qbT)NhF-(HVX77fe*1BbGJ^As}?#|so=k~quSuO}=dMGwJmTj(ZFiSC<6|LXEI
zIeC0e^9wzJlEI9wURZ%;<S>#zy1^Ak0`O>lPSv)cl{oHY$qv`QS6WoHdbh{O@UB7K
z$bS4+YJ+(>H<2U7Bk011yi}aRRn*F052qw=9=bUM1So>Ml(?on%0xrAM}PIQ#nfdF
z;|JxA$Gp^Tiro9FV1E++zn)RY{_{N}#fM=tr(~Tkom)J`jxQ%+D;7(@oMGYamq13Z
z@+G9iyqzTS$p<${I1E>!W?Z6s=$|yDrFff=1)j)2^d|ijf6R;vai{dHy+m6?YEy>u
zHnY*mPrs(ckXK4o)XbnJk6$j&*HU**NhU8J(a3N~`Q}t#LXM)zMf?iCh`NufL{Y0`
z<xf}xc0&gkH7PlLfK#NW{#y6E`PgbaKky8lG>SwI2fmWy`;U%9#0AMIavJv3xjrBn
zG_%^EYi+)TefV|!b7$8B7o=Ht^b-&*Tyg(n@$)rgF~D5z@w3q$biZeb@`>C`@$5$y
zg83ez?rT1^&8F&dc<gl<LOFPdh}?rXfXw>~Py*IS(Z27nJFba!MLqXoo%Jf{+4UU4
zXgFw2x|I)V{bTV*_269AnMHn0+j)2FXuk8c6Y+Mi+NF0`iaofM-WB~xmDT`Se_B9!
zWG)~{g-`^{X}@#M<Hb2+d=i4NwjwZudx91X%cV6zM5N;PdZ<BA!|*FTrVpa`w{Hpd
zSA;Crf4Zo2yS{}FJK)<-&%q6M$P6Q&kP!DL1e*_xZ0&$$#J(0@h`JV>JWW(v7dpFy
zWJ`YW8@*5eu`d2b(os}`5>U3b;!vBkV>FEn?}K2VJoOu?!PHi@PeAtBpR7tP?9J*(
z1}eg)a)ilpW3-cvA>^;zFFNX7HkW5B*En6KDXy+JjnlM^HaUTGeg`U#N=rQYyMgl7
zwu}A7NJrMkZt{a*q=DkM%<V(`-aM5K3sopjeSOrz<()j$k?fy`s6>Up`eQ{!Cd&*b
z5H1r~l1#V9i5%126z95yL92+Z_8<t52d&E#E7p3vJ%R(n3BmCta^^kRh~k)|tzVI9
z+82<J;YoiZNfRVNQ$M7e!1C7ryY5f2=Ig1I@@1ffb<FRKp;Z2s=~_!<?)sGvRV#(9
zn}Fe>`p0nf2l!L*S57Qd{<0ar!V>~25$Dh@^MP^%HtV>O9B(xWm61vD2_j`nDU-AR
zH)9!tkD9!X7d-3S){7nTU{A<z6rx7ss8OSTa4+VUAfMK+fRY=138h(YXG{smiZri0
zm?_c6)T_2-D85!W{^59k^YNI%29beq_&x+EUZX8h*E4-Z$%Y*Tnondi>VAo_n^Pwr
zU)a%~VDqK+W{e$_!e<3iCY#~^{7AjpKG5AiJLJ_l?&-weH)#mIBHvAUsIk+<-JU3X
zWzuBV%l=H%XA(QmUD$V)guiHG`ZNh>xpC~}8{re<ef!dFCR50HJ>W&eCWgt`fe_^4
z@KH^87rG}wLv^$(19iBms$G5vK#5d+Jnp4d`{~vhTY~3M71$Q`T-iAz_;%!x$}72j
zm7JO_C8?F_S4^#lY*x+I>nD-(1BX7DM^R?#*QJMdfAig&k1M4{>=)}$@jojy!|sk5
zN1H8-%Pa@4-KJ~zemlT%_UGGtQBK;Y?HXyOIRYBd&ETm$Uf~|kkYGLIUONo7?@GV_
zjVwgMm5*qcJ#@hZWm1PNMtp=pYGrN@#ItO_s;f0>eZ1Pt^fNj6LV9$6OufJ&jH7_R
zCNr|c-&Ff9ZYJ+|EjTx*3<{!ED;h-}EtY;I2VEIQ!A$DN5IK}SvZ>T|<=Ld*N(w#w
z5F8?Mqm-yBpP7s|o~Mkd&2Ahpki_mRj(2>zK49@BmA}vZB#v^vMnFCzXIxaLC^j3q
zPq^ASZKuEDP<q59ecozs>q-;L?u#my$}VCcZMv*jB*ig#Un%^EDo8!He(Ke8KQOWt
z(nfvSp|Lr06#rIK7N-^P-e1khXTBQM`3K}6$Hq?O)~hcKuf0KpIE0)wi3`Pm>c5|k
zqQhj@vbbcUDJq<=B{WP;0$}wRQ&@KGiy5P|jF1YKt?j%f%RKXi7p88ER|+53&c@pQ
zIGWG`yAzk{$%C=UNmZO)GL%P>Pg)*0p!%m<G`Db7(QUejb)Veiax2|lP=anR{2&5Z
zTb~UBp~A~aHc=ndVu``1ob2r{+6RZdXeN3qrTDw%GddAdcJiK77Z}l~*JIdO(D==b
zPL4%<D)gw1U#1OcXiw|N`(iAV*&ZK~wraszT9`u+Z%QMu_AN3*<v3=-Mp!9Wjyg-e
zOWUaWU7Q@=!MfZVH42o!PMuR5$0nD$0EE!=fU%yW@W4LJ6bicAN}6;wOvMVg<h+sp
zai>*dYhLHEt!}G5*F7igGQ3j%oB}4sD?-E^)Svv~Ct{G?0QDE9w-^cuOr*qJwfnO;
zdYrQ)pTfevnk=`$SJxd{9}(AjqVY!fnW1$FLhkly1l;YlOO$~n+73-JZ+}GI5$Hh~
zB7V*N4rwc`-QZ+><LkF~8(ZpCppbx(P`H35_ISdQCMcbxyf%`r5;ZqTAZ)X6tzn^7
zaPlaTc$qyd^oM%ujEYOEhXNZH8~0k6i}<*`g!UOD<{E?l1uumhc?k-YB?CnD&`4|%
zXVWuqBbRnIr`6#(6&Cq8bvQ8_9kBQH&!rmX2%QHYg^s(WwFOL3!bo6t)Kxv2WM2K(
zUHToHIy2yS15g09=U>`iv9u!Arq{U9D;uoi>_!{aa-Fo(12G}6aE4Bv>06exo3WMM
z=F7$RgvaY7#?nFCRJd2t2w{A-RZvb05F<eY?cxQ+${?*^xd3Q9UlA=v<e~!ax|LeB
z<FM#lzws|J+(Wl_PeQmJ9aL`klj6sRKDw05&+HBu3rY;T-?qBUfW~))o~Ik)EqZQs
z&g&Qy!dK=7P>HqdW_tznssO{gQneP=v#mv41a_nExnUTMkkPds6dF{fjy{hFX`}d_
z7=-ka+;{j$Zr4^ke6<dShZDgqz8Z-gA(q1e@7VFk0!r60zYnKw`=*?2)A~xF*17F7
z8wgYD()Nwz{=rk9l4uw0#G>-LGPRtni1U!I(k?d=>2|3?uC{p_ILB)Py`cE*E9$$l
z`r_*5*9@o0sM>3wD2Zy?o!a-SfzfP3o9nl2M|ph{CNsnCY!f{8lL-A^Ug8M2Y;c2?
zU#@IVSS-)yE_Fbv2zRAkSHGSv)t!)u<)UrBTJ(o^E{|rHv$j%NONkSv?N3%x{_X$R
z_@-;Fn%wlD2_><6D2)qcMAW`AvNoKieG3)4Ik9ftHGxITzxXYS#DS2Dq~IjY@WI_R
zW(BNMCYk#qL+g(-hnDLPTQh}dgi!H4Tiu@+(yrR&hJiqvU7{P@XBc94N4dri_J%^@
zadacs&9$dF8k<y(t6lO!@{$UYNbS#``Jk^jo}UmY)|Wv~%MvlM?3%|NCmbVcoz`=K
z_R^%X77A}574#4v0t`ZeY>V~J`b}Q1jlW9?EL0i%v~Cf%T#&oEvK?i$A$?6p<^g4x
zw^~y;5aU7Dskdg!RCof<RurOA4Zh_qb6_(5?+!lGkuRyX4@1;pP0RL7c54r{^biV_
z>$7yrzf09FKP$gQ5!>g37DBa_q@8`kLtsBTIiq@>g`0^<<vtiTx_(k18X(n3W#%OK
zcG!yy!-Iy#nW3c0MY_DDsnbfAp`F-vV<(U<_QN*o5Mx~L#Z;NKi*MNU$oJ5#gWWgK
zCv#GmFCAR23p?v<#w;#gR?1St!w7`Yw7;*bbc%T$B^_sU+INTnm_Q4u-M%C8R{TQp
z<<juYbfKy$li`oLE6w?f^p&HP^6pn?64#=eFT{vX8Tl8!tgwZ=$GcG3ooRH(RTNH`
zuk~1&4^Cud&O|Z$>v7#k(K2>ShASe1_nn%`8_O!_xTOl|lJ>g&q*wAT2j%DeQPMoq
zOeUzK#$J~Z#Qt#EN-$byH4u9#aSRp{u@_FJT|-$5-wPpgkVzd_cTVmfNqEILs*5I+
z;k_*|dFY~>y)kpO0yil-!X$YRY<0OxJ)Zb}<8b}s+VR$o3bBSoyIlO+I1$zZdS|+C
z$=xxPLrAN#oontr`q$6jG2)?)&)9w6A?3-ZqLvx70MRbPGnT%n2K-hL;})OM;sn`W
zr=7^u9dKN+6Q2m8{FlaMMy0{Dp+!v>o@t`KWE5gBVd=4Fq6lqhJJjP%f_LXDa^CrT
zIevG?vdP@$Kk(d29w!e^ej311c&wI(!ro_(241>UeN%PmJX)cLe~Ih67I50t8p^V#
zG_D5<Jf9Y-WTGo3mGMM$h-h<6Di{v(L>pxYxZsfS*`q!_+?HFVR55||8#K{9uJh@R
zmIH%mxVUmv8({Y#ZHvB#w@vZXgL4){k9)6zvZeao9bM((l7}n*bro`J#*_?+jx{DV
zW%s)*V+**rP$XPN0V?5q&iMIUKsRZaGFxH&<b<X5XzB3|If|^-|EI-JP@~Ic3$mP=
z09QN72WN2}{=u(}qpEm+K6ksQsjTA&eA{;%n5JB2!tjoNf2CuN^CF`fWZdjb#18BQ
zdJCk;{o{=y=+WrV!|B1Zc%YA(CfstiA74|KC`S<gWL&s#n5&S1RA>6!y>#9E&A34K
z5r&TBh9i>ymkTeFWC0sZ#|;$F`BF^J^Kx&IS@e9IC13irI{b@2d0c=Y&j5gge++O&
zF)XYe>vsm@_~%F)aTd31Hv4j#ERTlr(^DNq_(SYwi;&uRZTPY3IaZ_GLP^pp=4p>>
zHY?`Y(}zVt;kl@>i1%LPqz^#FgCecmvim_n^FhfcU<?RB<t(1tG(Yz%y%qyqrcmOD
z8v8$}AuWOw5z1k5>7U8%Wk7OV>P3dahRxRKX06@1^}tTUl^$A;NS^i|WMsH(;%fwP
z_?9S)SBgjoQzcpwQ8pGPzfTh0R2r;J(DGl2$E5yp^N&9!j%Z?tqK@mvHEg(rICiKi
zDk*)Mt1gj5ofK@eo|+@HFl0<|i6(bJH&v8K91I>^sDD+sAWQX4N|(mteCO>E0NUj%
zAKHZun+S^EmK;!LH_>J<AGXFc<twfK<ho2oDcuo1{u}Rj+#!8+wTA3?zB5%ceLSu2
z(spJQ-(?gc20K_l$wTIV*4X~`0cpuYs;#T_3Q_`$cc&=(6JPd8gU(Aq0cbc|$lXSs
zeT-u0l^<kEtGCrWzEVzA8U^+Q2k^jpVc8P6ZC`2`j&d`X%9l)LZy#W-m)T9T_3sJt
z<oEG*v`+QWK`sqyC;=lmP@8LvxAo6DwO3?P(sAjjgTK6A(5~>0K`AV6xgneTc%+BA
z5@5-m#_yMio95T07{I8S=0E>N!v%hKNp^~p&zQYTTsqh3zC^jU=kb-r6~3(Jfl44h
zV9yFsIv0)ce)7_u=sS%G7?k_Yg2uOOZU)G^M?=?*x4)H6W~!B#)$yVJH(=!F3p}rV
z>%((oa$AGlao1Tx*?3g2SfsP}P*)nCE;*uOL$P)s(Dg@crbMT8GL`}qU^UT-qrCGY
z0;p5+eZ&SU{>#qkv*`7IFoeKbdn!S1du|LNcgiz6__9t92a;TsX)a0t;%Cf15C`w*
zzrwwLifX35X&}#4S)2M8VS<*5j6xUO*WfD7<2Qd9AbWZHeQa!NADnen<MkgujZ=C0
z^yESvo!8NV#*?fwzCc;J=pTyj2}><R{A7v8ReJRQfqzoOVy@c<k~DL7JeT^AX8c@%
zO(1B7BX+?+C_0!dFovM^9UY{RFX*;sR&rVew29%A=E1WHXfB6}9!E8MU$#f;x~z1C
z#rHHulD_IFitFsIM`^y>TP7LJw^5A?L8h0*f^TN{_ITXw*DjfK{i>ue-=Th7k$vqu
zr>$`T)b&OkNMeI*t7eJ@O0+6}LU7(x+0U|0P@seDUZfx0?B)Vy<79IL?Wcvximcd@
zGJJV|p8p0s+E0zi0J%Go45FzH;;b}KsXsCIVVytQ7Xn}GKSH1PW!w|%RKKf)OpCzo
z&}gC>waX0ftTamp(i<=Q1JPOuj|n~ApE-KmY!^nlKYu;nID&As+=)!5+~R%OG5OL#
z;^u5S(%n@&3)cC8PIN@XU2^)nZuif(%fkSqh&eEV{~gk=>HPJ^LFa}0zHjg+sZZ`?
zz|vPipR;Gtty#M20GeK3;Pz#oBuvW&>}EHoOp4Oo!1*U?3+3yz<dVf{Gk*@dTT34~
zkKiEslr%D~8GN}^KMqW_tqKa!^GnC2Swsnt-0!qpwlDga>(eJrQ@8AkV$yR~3wo9V
zbhqC<O+iq=!0zh2Ay5vsa+V47bg@9<Qu-yWPxE?u6K>flg9-8m1xQjl{L7!9*G%5^
znTBkQmhny&t&AmSqXd+$5SDWtLm36&rK}a_Kz~>0WrlCMS&a3Z#{#)50kjXBKNr1G
z=YBeRKb6KVWm4vR^$pEy&AJ|ZLlSH9fOSRmDhc6LhYDDPW>ZEhJ&LYs{r?Y70e*g-
zd=kz$qnSTT5=Z;GA_+YPQz2QvH*P(e*Exo()+>349xDO0v>NY_bgcIBam$Rth&9x<
zzAWS`CS_}W4VTe*NR1@(q?Q<J`YU?7=dv|knnYp8vH+kA+AD>*P;wqy44~#@qv|61
znr!D<jEHs9&tgpJ&xy+*LQ4jBatyM|y|HfaL}n^dJ5WfIWC1o`nzI*2AA%m$-VO?o
zE<k_-@r<^9BE>G)SsPq6OP0eJ_GVviD$6caOXlUwo7h_Qbux)iJ@%XQDa94yJs0N^
zt!8A07GC9O)Zh5$jfX90$YX-hI|_-+IQL%OppI`b3SU?Y8PIQ<e17|U`n@j$ln+P`
zD1K{$JS8+9jS|3--U`;{FpfUkbiICZ^_(!^&#~M2vkOKaJ5!POem)l#D`|<ol<O*S
zT-p4KnfdAaS8UCgGd2+_RiNM)XtG2b?Vw|x_baz~0451XTa4HpuEVttqT<-(%sK+*
z0?<YYRL*AwcK`E{(X2m>l%F7JY_h|z0?pymP-g3E6Qc*wTXTh^w$2%A=mx`hp&~AT
zKF}ycPq0}Hsz4cDtLR&E)yRz4%#bt|Z57LznimW1#;`g87vfxHM%6ozG3=aZFtzsA
zW^g>yWH*At=<uVv4C&>?F~2%lK;IYDpp*PK$OsOvjTT9P5bXY3yD5LO`8O}D<GI-D
z{7&WfYdz;H(mZce_-n=slrb$vGJ*&gRXfrIFauJ~ShZ_-gg@2J{9@DnL7}p$%-PU9
zQ({5#%a}$CztCzWM(ptu-0~t#Nda=K%plq4Tk$B_NrCp&;=6t=v1XAP>d;#=Ndf}@
z*O$28^;_{0+4ary*2OwTYV7nn(k)xqu~Sg42?iccM)8t4oj&K2Cj2m0KwPK4JRK41
z%;_Gedo9-b{&qT+_I<!HY`%sPsNiXIHKte?k`W_(0$B`Z#R{VGfgCj4s{Bf(rN6ts
zG(JLJ^fIXO5b(JldebUccOT$1llwLF`0Y9JNb8s|0-cY2!0T%OT+w3MJCElpGj2qe
z>et?$qqi#peX^=N$s@@`re~9Dtfwe4+LURB0+V97P9{`a+lV8LTb(r2IF}*|ER2}-
zKvdqVZ<;7msqKg2I+NXD*Vp`4d#8b%-WS3H-1r3eS(F%=u|iHKAXdYMaqvvh8x(8J
zl7RPY<Y{7lREwRS=SMS3&;tYawm@9sPZk(rc6qt2QK>cIoG3W3V-(w^nu$%rI^0O|
z#ndfkqobd^Fez_e7ni68Ol56eheZ&^c!RTx)_eQHkLyP(ofXdKWLM`iOFq!OJYz<s
zw7q!#G&BdX?!}wVedm787qhKbtC+9(NdmkNhu*h64sL5WuKF>W4n(KJ>QqjBXV@vP
zU5*YiL>!mf3Ri!#J~dYnKYrI8S+pib5t6_%ll%f%ueVsM6idK)0g2S<q1ACk`0jdU
z>1cSTy25jSZ$kKPJnB5i<X9rk0-Hf8Kb)unhct3^WEtB$h2D(cbX7lki&LQd?d!y2
z7K7POKT&~_immq#LX%|^V5jG3n#Gzp7-Hu<3oavuR5v%hkL{asHf#n>lbp@ws1}7)
z$O&)qonI71F7;>7H&)_2T+bLg?#*6SP+8HBw?X84U$117f8X>Q5uFtlO>sqT?-&x1
zt*feB;Fns{0!&SR0!yH)Jf9pC8&s%rZ*jKX;!B-8%vHty=krjf!Q)XN^3kH`lBfRw
zqmNIu6+P?|=_`xduf4BwCtg_$gY5KbB~sSV<p#fyZhldev$(hVtGziDzCJ*Epxt|8
zCL4vWy+UF@;(oZeFPj;mz=X*CYVJpO$<g2|)ojo9y`E>+MAd;lfoF%SF9z<Wb%*V1
zjI-)Kzlab|7p#tDIE{?(d$=Z#_I*T-B!4V0o|pHQ_gtVJdnlM4;E*_2sE=9=t85~*
z68~LlSc@1<b*}{@;$fYMyA7MuC!YC2HzJ049akfl&Ky<AFX(&~T8Z`u)F}!`Bp+_-
zu9KW&>xoXa^w|yTr4Dl2pNE#syO8-_b;dAey)P`wp{lyHnQuT5zL=$V#H898&A8`S
zD4`H?qi}0&B)Qo0RL!f#5PrC#4~<Z!xumS8LEOHYD13b7f$Mz<Gl|%!VV*hg&iHwE
zxxH~3Px{CXs0zxAk8Pr!%kY5M^$k`>s_kfMC$`^>?qW?pKTv+xZ$w)1W>xx)2gV7B
zeq*}#CC1FcH@>%@L+mkpcOC!yC#s0bX+~rtPj9vL6c&}=8D3`dLQScV$^H#C%)E$0
zJzoK(yy=9FP+Ami|7YlQ>!*;vkGD&z1sir8%Zs+-W=oQs)k=jUk*OQEj^0<KL+4+%
z%0B0Zw`*7y^Nj$lrH1m4eXe$M9nps(i|x_I_mtv)-4FUu>8T2Rv_%^cIpul247+Rf
zdldhf8{s=GTIh{bkMm(E&x6qhC5bU9fA!^1Zr4a(A{&clxlz#1w#qfJwlRk$8?>Qg
zmyKbPV`mz-t%l`W?^ieMDIRi;E)8WoRtpf^OOcSnLMK%LyBk~5JG#AWxL)|?$KB~p
z$vWzf3M{{_RzXXhD_mg;j3|4<Guf*g6NG2=>mJe2y9FqFTJ<lijI&a;9_K7U!LW#s
zYyAz?IIWuQU-69EXF;3UPVuO*1Xis)9`KdHuM<bdjA*9g`WkUFPU8OXVe1Ardt8)5
zj;-Ihcb6Qo#PwnE1vlsmp-Sp)+jo@Ac4a3iUT1sAXrd2<7{pDudbPHwmw)T$iynW!
zvT%$NLv-2X2#^eE`E0!d<D@#0wBtP|iLz<DQxy<PKdq8V`3@N`lLC^`ZkAbu*HT4&
zi8F>ki)%+d_{{0r2%aZDh~@Nb0)6AJ4lg&FXNpRQ9yuqQi-j)&j_=GDIiu=TDCZ?I
zgfD57SAHK({Qkqg<P+jUwGaclO@CwjQ!K|Of|w0SRrL7T0qsGEfq+Yg@;7^=Ieov&
zeXe9dyMjzN<(*SCk0@^375Yh3d5aFX!Rss9PW6mlsxH17%SE2Q$CSffCBp)~w>Q>H
zSRl+oC*dTI%gT!jw8i^9<ygM=UUCs+f@_8}9`n)r74K6yGJ9SM4~;LueX{N@HzW=E
zk=?VJBqf5+jxLQK+xjw9J05&*S1y-)M__-sF^HHyZPrueQ&Pi@;I#DOC-@1>S^>hB
zixHb!-&RJJ9{u;{Yb9ImuBE3rj<F7tjA3{q&RL_9xY-NchCL;%j}PRcqK;50l9%d)
z>s;KVBWR*G;D_r?YWll{(-CA{;uo^#B3Hk~>21$tuO9C(Ii8Iru^R@69JcIsmKR+A
zy*b}4_$|+LRo3X-nPjY2p3BqfW;rACmqWK9XGyo)N7KVu^>au3zL0xog(<zX7tk}b
z=`uG42Rbryb8G%0pV@T<{wLOy-ehyw{d#P2<m;)MPEA*%g^LD_&i!)Y(5@O4P4n>_
zHqb3N;xq`8BwIZp1y*r5){NO7{)MYW9;qgwWKzAvT=;V5H}*)E0_h3|E@dzdWwVcj
zSH1TPF|7r+*Pw@R$>O`bw~ve6uKcuzsRjwwAD4kP1aISYMEPx|pONtvS#-q{ukzUm
zNlP0Ah$cTRBShSdlrT-g&`r0e&IWGHr`$!wY_7%G#I_B~c^|q;e2RdY;{rju;8$R&
z2+tJqpy!Or9-R;>&Jwg{dI>m>u1~1cm%UK6G+`@>Q8oq^cOqPprL@;Cwh*!K-f9#o
z5%Nb)o>)4G1%zM(Q8gJ$p^QToTKycD-t3vjX<^6KgXwevxR|DVR5CmRi6h9)s5&Ko
zgc0<B>{NiIhvkKO7dlEV4M95kfKNo<DYz!)s&@C{RaICp2bI!zP*Ap8f~_=`&RBlB
z{gFYHd?U(pw;CbYGxX#4D+c}5Js`9r+4>+Ese0jw?SPWV&hBUQ>GAfEu*!O({fm`+
z0SlE>0a3kQEKO<nr*8@I=zkJemX3u8zwD}d+&OdMI+Z3~Vqj3YZjGY;SXwnbDmp$>
zx-L}Cw9+r?_>LuX_>R<l>ZaCi0?9gCO~`?6(!=Xvxico~(LY<XWB&y8IGuNQ#hdWm
z)?8^WHI=jHt=JW0C=Kf`P%3?+Bjb;dIG(UDjwUX*`$Vy_tQaC8v(g8uI5p!Sg(+xD
zWj}QuCO(Rq$#Y5!Ayk(S<UdV31G;+&?Ca`f##YYA-^<)2zg9PuMv`>dWbcyP4WjFp
zZ>_PLk^hUy55c{E-WfbMKNDc8@F691g(fwNJ8<OoR*ci$a)3X;oT2~F?+&Nh+8bqM
zus`;zs;iD#u9k16S(gceu$<D_0^~AG$?LWEfv}O$j#Xc>`+MJP&vLg?vJaV;-r7Kj
zc0!<+BRi0!GSWD^qbG`2r@&#0du(H9e&wy1rtX-MUoOP+XX3sRsj-_C+7911u^4P2
z+25lc_(GBh<Kp~63S<MXv-!IAMMB7{xMq&K>7-+gJh4$4CQewy9+Qmy#J%!sV@$pa
z&x{$&qHSutDja`g)33fv1quOV2-*eXiFuuY6&v1n{o<-H-^I!59Mk<-u)IDlG$a~D
zf*O;hX2m}s3F_CZS4Y{3lt9&bAAFHuhH8I%VF+7_?Zw(B`Nc!I&vp$JAA+Vp8_u`(
zU9MC&b{8}3RO=jWB7aMSO0doE=$6rsxhN)mZ)@3knS5{EGN4_aL)x@hKr+u%N`9KC
zgqy^!feu8Cuu9d`B-}{UiprIAV|2R#Xn=-{dWOgF@Yj`sfr66L@wLz8A1>GnpN1~}
zk0+o3SoWtS*kv=E<p)AIQ(Hb%cu3bykDq_qr$hvGjNkS8D+d}1KG-cVdW9XF5c50+
zxum%=orn8C>$?Gg5$g?->+W=)^8>glDVHy9bS&++1})&%FLY&z4#{^be!)x`mJjgg
zP;NjN$G#lVs<WE5pL3ru=XG`#^9v7|^mQz6es@hrNO8g>yL{)+Dnh-%rUP2pL$71K
zPR%YO`e6R8P8e<Gv$vBn`o?f(D}woeH%jo!=7QY-@gaWE$&co<u@Avngh_l>Cz=xj
zS>?FYAdcm^Ui--{r#k*~k-Lr8Q%P1Rq?dckjpV`%Wib=if|_>;o9oa33j6QU+`^rd
z16YNQ_a4cu=2V0AE+knJ-Nl?ACLKL?wi%UEIrRHz;9}#^7JQrW!L^9UA#D%$)G3Js
zJ5Pp_y*8eCvgJL0kxpgWC|Qx#=MBfXOIH0By(s5>0ji@wa&qR!_)}b}SrVh3SJ6=R
zQ3~<vzt_(R1vwlRg*h+xw>7`4OqVV_XBRsW`psxsn=ZtME;z0PW=U%<j*M^jco-zN
zk3yRIXg$M2>0)rHDte8Dic7gdKdWeGHCL4##}6@vUv&QQzPP|!#Z1U#IEBd7YYfd{
z*N4Mkb$}K8yiw^)R1D2JZ8ce&k2=>XBjBA4Z{0_Wgct#?zZul7?At^^m@a&|V?-2r
zgc!!h<hlS9zdmfa%~F`!iACmE(-Y_@Bw|VIWX$w=my)L&v7uJszX?>S{48B$8Ghw%
z=wyGagSn!#))N&pY$zCUX)&B0WGWf_%%U|d_zt8=!{fM2!-acywHCu^9<H4|IBMD%
zi8=Sh?QpT#<BbU=O15-~mKsf_?DEyldC6$4J9X=is88~K<^u_m592I71l5(QnTtK$
z`d)7e?F}c3ZeJU;IFs_(&LU9zTDD9x5}EIeNteAWLQJMaccKyxlKr6{b_;C)iAR4y
zRLVTAp`he3cxLsLE7zE0+bf&1f_bDPj(oZ_c<?Jhl<exzanrzYF?Bgod*0QD1@c@e
z7o*)j)FXYq<~~fHr&Ak><lq$PB?+u=+co3#mRg##G{fG>2sZqkM;U1~tM$E=X&0*b
zA*Fn`Xeh*wnO63xqqk5E{5zVy<un-k5Ny{=&Swwja)_*rpGx5QrcsDEj_<SI|F$l4
z({Ju6mDduSEWTWz|6`MJ%#C<^x<$51zq1_)2VGZK=}68R%&?E}10CsA*SdT04XmM0
zz+sVf09k3c_rZEHMYbdJL$tm5P#W)B2<8W?!9`tk&`8G*jK8M~Tf76khoN;=3wbDM
zubn;{*YBL7?%#cTMZ4yicLXH@S6J7vLKd3!Ns2<rJojJY)0M|C2!whT34WCa7UPJS
z-mDUd3FjameSR@Ou4^vC!KDnWjglWhQn=57jESAx9vi+_In(gWQZS4kRC7h{d~YRb
z&Hxein&hNbE>D~3Kb&hO@wwUF)EYBwC8@imUbPS1)#9o8&{tp<!0R<t%xl?WRxHQx
ziX;p@k;*{^&81T&@?t_lK`B!@Vgp=YTEQ(R_uVK^`~Gv^AbrQ<xefo7CBZ6I6>S+D
zX_OxbOc8JL2IF1Zm%Zr%>OXG8Om<pbdpp<J-46Fiqj_!S8K-j#{&gre<qCf9c)!xn
zUy<$Zs|*T|&()Hh47HdUOF8M$;h<lxHu{ro`}H%OkTDM)M;?Ne@IuSSW)r!hK}P&0
zvQP=N4`?RpTr#m6HxC|M=7+bpQ%r<vn2#Ok=xAf@{*)y0KsY!JO#&XJZ&RVPG`mf%
zAi1jwh~8bYv704Y|D&)q5v8c@|03!f-0NDLuiwT-W3#bsv$1X4R^!ID8#cC`#<p!W
zIkEfhd%yShyifjtoRgi|GqXNxP5d^l7+2YzH8BY@4J|(9Q8sod-o}<ot2iFog&93`
z-%Aj~HhVumLWdMAMAAb+c9Aqyuei`pE$u=>P^(knjI|_Yb>gpS5k2#SdK|+B&u4;5
zYAXk7UayInL4~<5dGUsRUcoozX&)jOJn`qKRCLR;w$Yh~#jfNVl`NN=nJuQ?=^+Jc
zEq0g7+uMEt_)Wo0%$Avu@aFKhp{fSuM0KpHB=!x#hI7sxhFk0YX;>46PG@&kY$}!x
zIjq4twI0S(kw!cbYlg?Yx^@+dx>uM4qTBG{aYeD<4gY%w5Q^{K29?1wq_eJ%D-q7o
z@!>JDjksWgdZfUate~4R!PN-0YOmHKuv&5U&ws6Eii_YBX|c?7Yj+FLKeAd)$z}00
zotk~#Tjh`F9Cv(xK=Apm>d*2~>^ql%rDRr{oUGjrXlYnpwfJw+^hJ?-m%vr?9y@L{
zkO^z=fnVbb1!<_1Ou?Mq#7Fz|UBBNP(pF!mmk|_907Fy_AEOTJYg-fM=rw`|ol8LY
z`S8FS{jH(p)(b(^8cG$>NCNSp)dKd$C$EdZY~Mgxc`PIaO4T)8d&<SosV|z>lGR!G
z6rS;lV^&4NWV?Hx1<N*fuLZ3HnF2oO#^Ha`=mtFPN?P7n)803M=%y(P=Dg~yT->%x
z{ToG|>pf8$8a(A1!z;z8HvX&Vzws!>jce}DD9%Jb^9&b};p!)GIj_g+G5NM??ATmp
z9tyD0m$KfTI_s=DtA#X=C_Y)KR!_jQu0t#1wp@#beT`X95`0JSD8yVAnzHs)(X!7w
zRpfukylw$soR-c`m+4;_HXlib`K4SM6m>j}g9&`9ZL2lk=bHk^v?Yn=#R`oKZ9Qh%
z`B=qTVCmX)z94M3c9do^amHyiN6r<2DWFCP4{^28gr+Zq_=Yq0dQ;3`(1q~+ayQsY
zYDrL8Pi2f}jkr~}sj=_${(`uxq<SG9dkw6d!e6iB0A-0tOy;XxCL4y?bPg|cEIv1B
z?xN6D_dBu97s0D_lkNUW974o)kG;^pu>`yk2O8CS%xCg$PJ8;^r{dTwWi=zpRT6rF
zZGrbT8j%exPWzOfwGN&4te4Bf)PwkKzSTx`kcA<O__rVT=Mg}%fM`%UZBKn0KO8$g
z4+%vUj%b5MP(>kIPZ4sa=G0n@SHT)<owGohbh}dqtt*rf_zI00#bb*xO)~Og-=M<C
z-bS@%V<n14^L(F!8J1FO6c=lJlWeQIj01Q6;fcj<4a%I+c!=C#<w(R9EDZ)oaP|V1
zP%hRQvsmCF0c>(@r$)PNMG_ptF4kf)(<VKu8%@pxSal+erP12ivJJ<GlFG6)v;v!E
z^wt{`v<0#vREMbzFH2HaqD;6>yogn}uwUYBEmBhR7tK%Q7*Wxp*zz(Vy}k>zQYE;5
zx?kl*ZNN7V)RA!~A%Z$w|NM~EjU%Q`k)%Kh>k)txcz$9PJ(po;1IdMBb$U@$4cM)@
zA1HJH^`0J+9Rm1;Amu2%IPej17f_))eqVTE$#vE1d>7kPGmWkg;~l*6av=J0bgq>D
zLg{&W_;aSwiEJc<Q+74My{!E{^QQ3Hj3Ur8;xmt}KXQ-X*@D$bdc3}6UkXl_vv>J<
ziCot1ai0I+)j~7+$JdRGZa>PsE$FZvSq!#;iFbv=#eSXfp8ZR+)i#pa!Nbw}(#b?$
z#oty^^I$eOBttXZT~`CcmQxpn;6ww3ma#3~DKyu>RP5+HP?SLjLrSU(_nYO9Ga9d(
zrHv)?zD3Zb4@`^KEoOgSnOmJ@!f}E0{>u<W=uz_-``NQ)aZ*N<E)>C;zyCGy#Y!6<
zCwbazvXiKZz`iHP=jrK-8b9a^JFb$Eg!n0+*RA38dLle+Zd!FZcr~Z31c$?xs~HUT
zLxQ7=Fh<tK1DO7B#IjY;@6kL(lf}zg^GT=$6x~mg>4$-(*M_Q?-g&$Z3E3EOKm7J7
zh4zw&L&80K5v^0RY!<*e-$-rxO9e>K($AOd*|06YMs|TA;w`Zv^+@C0+jK$0jPRT;
z8z^3n(PJUM7xkCazz!rsu&FZ`SWc|64I%Gc0%msrTe=E>ShXLuo}n(5!Nf8w?55Uf
zu5TTbeU2D1Y;l_Bz~(on6MT6pI&5$$b>AbfBH0}vrm;9peBOg%`TBDp3Nk9S*CNj^
z&;;aUso7H<hXTG>Y(DAjzvi{6X&~i-&02lH{zjhp4$QD|mf(<>#soFGZF{#28{wKm
zHHwD&OSrZY+bC$xjMZ{FE%uy_yKTpLf!=QCPdkYj4>-Jy!NTJ;+Iud-A&$OBl`V)>
z14R)L*wt+bB^Hv<_8}ei9hyV1ZB_PvxHpPo)Z{Q#E#?w=Oor&5;OMP@4Pv2Ug9JM<
z+LSpKF4<R<iQ4^V5AeCoUy6nmcITL>>Ux^I508RxpV%ujLMdm&sCj>mMi^DJ_lGJa
z4O7)nApaaLk<0sxx8xu}Pp+{OdYn5b+N3W6PIHMdo>Fl!@RTwftt+5qLHrWW7Ca;T
zZ2;=t_aT|zy8w0<JTH>Y^+$YsJZ#gC6byCVlb`$bhZSPDa2H$e)zc((3Ppp#Y6Lw`
zH%$6m>w%5C8eua!ejCfCX>?)f1d6Tf4jHop3)@9<_YJ{$qG7H$fsHd4>wiBZ5H29=
z`~NDl+?+F`Rm@tW+s`;Df<ipQT@(3{_iEj+<nJ;mf=-djE*0Q%$BP}9c4?^~d2V|g
zYv<d@-py|j7`F%sGQt7_F<B(cEaV4niLzRA?7~fgij2A)cS{Q-V#WlRirLHohG&j>
z_a@=MNvPGlnX@@*2*E>ib9~gC4L0nmQY&2BmQn?991#loM^A^ku+Vy+_J4gs^nw|V
z^>Zk4IcFqvRKb`b{rth8=iUD}9Kh5obgP2AKsx%yt38}br*Hn-?+!#6#E|l;6-K1x
zOuDsC)brQs!s}Eh(UB{g|8ttdy<DjcWXeCgPnL}00K(<!b%&nGW9L1APCCzvbZB{1
zAOimb+Gfd{&C9AimUwR>w4=K0w$d8V^0g`U$D!DIR3*?lOoi#uwS|YU+EUD)<U#h=
z=^{BbqJ0MC4SbAQun-+>m|A_T$#t@B9s`2|Z&f#jt(zg?>&;h8Pcx0fMh&z0(*iNU
z$V#j`n2jMxtRC`>G_xBPjMgPqyc^HF$sqGZ`S#WuflNn$zv8t1KJnRZt?{m{tl4Ya
zeE=7>Wm!%T7|GV~kp8MH;Y*p#cDv#H!D_Z&hyCS*tn~$>f1zAWbOt(k=vzk~U!Ee5
zv;1ji?4?fOPsFRO2Kz1w!$FS}FK#x%6Jvf}&WCb!E~}y2Ql4u4I!(<XaxNrXE`*1R
zO^e>@8PQP1ld58))kMo$>&0_8LaIft-{--IxFP+n3@?8=UUy9R3|?MNl&F;6%*yl{
z!l<(5M&MLMc1x9TSl%ijf;Rh+X*I)mx;Hf)7J2U3cOB5OHyrIJz7~CtoRT2>^&@&6
zw_J$nm@-h+-D4vI?@#+a!$^z(Hz#BeJO&L!3?3)**w?^KaL?{r;9w(}!aj8Cd3DFm
z>T#~*_#iSa=uVRFi<Szb<Oo>bTkP9a98oZ%z+bSb{Xy2b{wdtB4!5fa7R(l0X)8fy
z-zO#~OecWD+{-O5r3!<HZn0k_&80T{iX!{Yix3(<Um|Z)^!Mdt*%EPBci$c$PVzae
zQOr3#wsg6iS6uA1egYRH)#}M5aX!kF$du9_9r8T-2uE&A+Ukp=P1#DjjE#jgavw*v
z?>Au{eV?yF#TF7}`zv3sJ5wIB%(n|!33%2?hBH?t=Vp1m{A%}9#=Q2Gh|}q25DC@{
z*b3dUVz2KxB?lXD<Bvu9#g$Kp;ok(JZKicB>9g?%m#gPT6iP&nRFrw@yH|0Wg#Q93
zt?w+kG9GVW#{^x^PY3zsO^%Y((h<)!U~xsdEp1Z;l&>t2N*?gOIg{R_>Q(>aCeRh_
zEhI_L>ishPvI_ng5qVk;2A1f;GVE)AEG7{x7M1^7>+Dbg%W*NHaZKhtq)YCW$_Jm<
zpFX(*)>^8FK!q#3U11v7#rnb+{Ui+?yl5qVN&gsJwS3VIjy;Slr(G;ne?Rm{%h{i>
zJz!t5EoZLP1`w)s1Lhu{j<Otn;K?NyU}su%hMle+j-{ZbGUN`&dCFW-S}wG<O&c+b
zCx(S^4n?D!W)`-YvnG|?Jc=7rqtNAYT8ab{9=m<Na&N4Js*tRGx?JagF%oB0K}rs|
zEol;QfnpCv8ac_2#!piaTYYO|^$qEul*<SUI=1n>RyF^E4Y^~G55BEoU<W)-OUFfF
zf);;7(s>;MQID<|(*@VBB$!}vTEu_e-W-mT21H@X`LW^2W(lCB(&<s}QSXHHVqyUl
z;82D4$>@C^ix=se>y3q{$p%E;i*u)MVceMc<s|;}w#vKW9^{{~%!pRQtS3C_4K+?9
zRrZFgsD+227~EbC^m@e%{~L;=n<Vvw)T;H@^qrEoiXX6PrZiHQf?@PlHw7^VD^3pm
z!)5GY1jAT^>%9YEhzHB9r++7yR3<^_1uStV1a|u8OAa9)THbdq<>n=6`qY<65)9jv
zq^Bgwo<tk@&bE8OPXZ-zcQ57^F+ZC%D%4jc=aV}nm~E{WD&YtebqINlwc}Ge_o);q
zYkGcXdjg_hI-gm4-I1ezg@4s@eqEr8ZuOaq|2@ATbQIS6Z(MLO34{?-(eEEo2iPTN
zWwod49`PiOztz6xtx0Ec!EG6!gdq~0vI=l_d(;prwl``}dA@~=?iuFXOlPr*!kmry
zO+2>|nT0{v+?aFCzv-Uzy;4W*o-p+|^z<3O??1Ba=WHc>a<LfnP0TunUv$8;W<P?5
zc2%<I?JdwH=y{3wQS_-r!Ebt69R&JrumF|Otz;w$a(<myGUVQ}MWm2m*hfw&o#PB3
z*{|>`wfFbT0*ou@ciD7E3K0+V2HiBeovsm)%-OypRn`32=3sL-<Wytw7`6v5jQUT_
zC~y=c^O*GOxLRDfw-wz<o`Gm$oVD;wJ=oI8Pg2v|h-ZsU8!kU+_S4%DGya_A1~Zb3
zF(rgLQVY%w*(_B*_QBGwc^*c3JSBzoSPkIj4Or5aoX`&H2UVn1KUoo_o!<z+*+29>
zFHG=<rA<)$G{oyjEn9s&Y1sx9GE<bu<v=`Q(GhRW_Sw`dzhI|Qx4svt#XUe-DWMfz
zn5taA`7cdSD}D-{U(Lt}PFhz0>t(lDeC&`FuGQ@@4}GH08_AEVyf|PUxJs?j3_ZU=
z@Ml|-1gol#KUD8zdjhDY7`6=o@AzeidQTBt*#l3dGT=5R;}t9wUX$B({;u)m{+lV3
z1Bo@csY^t1v&%B!_49GK@3l-$3zuLqW$Bd8A+36NgN2{fw-iDOo>G<LKLRBt{KcOu
z_1nZ|ew%AIpS*f(B#d*-klqH?tDOD<NXGsrScfrbgeUj&H7(5|62vnzsq5DlH?o{H
zfxL;Q9r7)QDdi(F-aEUZ(^dM$zf<YLZ1dIx6&fv=jh0&rmV#eXA%k!zfabvcNlG=Y
z)9V(yA0`Tuu~>5Vpw7CfdsVt{&%Vs3EhHMpXkOwfd*YR?oN0g&BU7KE;b%ky;iWtt
zr`;gD`My}EW%ieyw=o-#CFWIlR`ME&zl1kG0k<&>UwDb{s1nhV<Oe~<K#JZb54)m|
zFZ_PWY5`+Ym-K$v5Trgg5iD|xs12=oEeT>@C*>2sl=&Tr(ugi$i%s9;e$O2pZ9Vh~
z#*$8H3fh|Y<}K@abX3--rP8nJi5%Ar0Je1^6&ELtK93z&8O;g=Iy8F2W}35Z_zD66
z2L6=c!Go_m1)^^zzA=Drsi``Ck=iS7IQ+0&t?AdiIZQDm!gz+%{zjVEK2ue%)4{kS
z$3WLW_^g=ItGqKNDu<^mLHsb=Qrhru*h)`Xe1-0I4aMgV-JVV_tL}%xR~7%cRw-X~
z_voItiRWjn+%#$8bT;+56+??AOeenAv)r`_@;V&8#X8yh2AM}ti<yC49=@az`<BIq
zqjC5?<=no+VV@#9^3U(e%hg@KS7DnfREC>H%EGclz*y<E8$%61^#qT!dO|rd``-!l
zbk7#rvVI&t+D~koH*%*jzN-EOB+WhX<hC0d-~n_f@Ec|r;{LLnSNSPkLS#%dmSK0X
zdVZzm!&%t6XWR+BIWi9VP4QUmC}0dsa{(|tn|@F>Widb}GBNXhakbm-hR5fBq3>aN
zgC=SvqUh#UzZN+uwjGVyrJSZr4m;&@dry0$T&QVuIR5xb(!yTR<w|AMLCE<bhpKRx
zNXFxE94jX>BGu%4Hl)93dyxTp`}Kae-sRFz>ioobb%i5<E?u${@P6o#cZ(D`olK3o
zl^eQ7piu+TX`vF3NzF1kjQnbBAXi(Z*%k)kZ}VmK&%}2ym3m3?GWw^5-3wpe*AbY1
zK9~>oe=@S@QhRNwfepwKGJ_NhE6#Zek>$i2HF@vMSO?x>(XBsvk4j!&F+t?Sx>ee4
zWPZefh9BJleYu?GAi1nAxPXrbO53ga(H-Gy-F`FIKXZuFEY3G%cjw#43^KmDkxXbX
z{uYzG*L@%Fq(qQUujIf7@j>3t*a~=jXHMt#YX@yq>p>UfA5A<rF!_!s3T{ae2kx}H
zo%fl<c`=+Abopbv{G4HIiRe+-rqij$?*xEqbcm%-vPR#s=-26~=r*zl5hd@jc}D*7
zh3v1UjhAw})8^<ENt=izu@n!<=|r|W=5BU0|L{uR{v`mKKAzSwg(-K|;fkrePlHgb
zD6EW1Asg?fSCaUS58{(araMkjtriq7vzUD!p&^H((&1+B$z)LMoY-bpAr>)%9GeD-
zc?doU3GdI-@J-xcQN<I5Zcs-0|BPPHK%<nC*nJ{0e4Y#K|AJCgYBDUxHm3eppGW{k
zUuv#f)(K)85sw4Rs>fmRMork@OO9fdw%xpoL&M7~jv)0FsidDlw+K7YID>@PT%MMH
z%id=Gv1bq6S;&0B=B+kaoP5phSH?VCB4Z>X1jIh6x&2m(TS7vjQhSr4TfkHLlnhVA
zD@$Bw$b~RN-&m!y1Pd00c?gA=1!h-%$)(nz-UTK1j`XP&-?(}Vm(FJ=CJ)^6Hay2$
z@fQm=H^H;(%3`@0D<~5A_&L<~lhAJ?dbU1USuIvdn?%i~GXivqZ1YsQN)Hw%;y53|
zWA`Bs<E04+0#Yv%m8~6MZ0J#Kgh9ZWGw2P%_9ftT!<cp!+T2NU4_kA?8<&2AFh3CG
z%nOl5rYZEmw)WlX_DeHRUhJF)W@IG2_WK(d$)_GfP#%n^vw6$xCi+U^xx(*q8k7qS
z;V7(figx)NC8nJyMtbG&$4sZRMjh7fa(||`n4;8M0YC4cN{j_-7jzgn7MFx{HAFo2
zN7SLcPUpX~yjnI?rFHw`Ew5TDic_U5aWEQZ3pV(U`bZQgbZJ-WD^YmlcZbCm**lWt
z%beDwSvJY#R_Sa(2@l>K49WgYI_~+d8w$rtT#V|=L>L@?^w=eVYtl}?HP=EXd~)a2
zO2kGJ2WPTVJm`rF%7dZ(j^*z^86Hiv)jEQ{?9Y>@H<{gPD|OSTRxT-E?i7G0D;Lwg
z=r%jM_!T&e+q7oX#%l|5=I(#)*$9itVb>IZC;)#PQ|r_=Q*C`b*&39*{i2tj7%Fzy
zG#u?t94Pw*%Hq-|a7kDzzb|_B*AjiQ#Sm<qTJ+3=LqZW=ncRP~{=BVNQhW(yrr-rn
zh7lbRcKNfJZa$Y9ar)M%r!2yndD-bb03@Ry0#12csOkJLWp{JjJ}UXe?qx_u>5=}Q
z(*i2k5;6E=gT0^7<2M_Q`9XBhrZP;w(^IR=MohwPqOrN5nr$~pEU=6+p#BlmXHX#x
z)hsklgeI|0w5m*qGZPzylN_;mEBp|Lv!30L=y5Pr!!kY*q|p<#{snBeQl%WbW%=EF
zA5t<>i0CgIE{zK7jZQIK`Sz>r!Fj}iS^}k4o>R)FMTW0<+yaSrl{^emLd8gMWtx-l
zS*Yf)u!KfxTEyu)dlUp{3`7xUWO3jP_mlRxI35G5<NN>}Ma6d9MKue>h(`4Mf>$0E
zcfML!VZ<M$KbO6N!k8=B&upK0Ibik%FSae|&7T6P4BjUqu)rQ%5e*L^Gv}-UX+=rP
zhYWRP=mR!Z<IkGiB*HKbmj<j<7n^^x=ncR6c03KAlEsAESJ7(C@ZDH9wkAL|X(XCd
zD6$as%Blz!yNLi0k%-s8pa%^ZO5AA7^BTj4vfjw(ZGAb(%4E}z?&5yd>^j-Qw%t9W
z4|Ol5t3AljKu;xMH&;}L`LM-3b}QN92BNw6Djpo<Dmut=uLTR<+m<9yNi!=-p4iqa
z#QuHRz55M5@)OCl&jJVKn?k#z^s9ioiqi9#viLLHaDrRa(PY*&neAF9qC^ZKZ7wzO
zH0AD$7t5rvdqF~XaW3U($%R@bAAtWvCIxzaSSecCA3wyXvJZg7+5FuHh@#)`os|Pn
zH_b|_=3#4;2qhN`*k^G|FE)N7W2DYvZ{P4)9LrLwel#PnRxnL}?TmB#mWP^yIqFxb
z?I06q$X*b99818T_6rOaf|qK_eGUu~Zf7t(mGu301ezkno&`wuvl{Ue0F;IUX_U`J
zN<=hG5}qOdmj$3&2E*7*HJLYGf_q#CprDx2r3!iGmUNhmiC}<%1YNFw9)Z?7m)8Rc
zpW8VkNTAwd+dm%h)X3RjN9*>dIK1y(p68wumGZ&YR@Y}RTd}^WycwPXwB>3$nKHF`
zvfpygQ2VQE3`q@5{2eW83`-Y5&yCbcJAu%DSjS)*C5s^d@b~*x%{|JtN(vp&$bZih
zVxoyyjT$p1-8KENC)N+hcbM1ebJvyh3@FUy);#<wBQ#&qb4Z3>S@IP)adnN)Ka=Y>
zvh#607bWgnKi58N;ek%b_2eeARiiLe6fW*Ln#vxQrH9Ejjuzp;2OaM6(f4|&c;t|Q
zTyz`m{!z4BbEsm4FYf&2$p+zbozzq4hlm_^&<=}#VVMo<CS0N46&a^4wn}bX%d)uM
zRM|H`W3bifW%y@(UcAv)sF)>vf<u**3@Qi~!eQeY$@H5nQ@!uYs_@C$B|CSAf+hzE
z$uba-osKMv{{t_J;+<}ix8zos9P~Yl(%~A|a8pK0BD%)$kB!C*FtYZ2k|)kuEcB=x
zP2D%6_>3B`I9t@7vcqwhfYX({^(|kWT@U9(NQa_Q@coYUWNp)DKB4=xq&Ic*W!|F-
zpII_bENQ&n{2U<NK5c5pg`l;{WPXVB>hzyWv0xq4$@l*qRMKfxp=8Bc9Dr-9B=szG
zdb$?gQ-fZ3csfioh_K-O%wtNLL{nrGnw_zVn^GWNlIin^gI)WC2Y~(+x0zWs==baG
z?Bn7@*<8<PaIu_d)9zpecNIC#!NsU1>Ff~UOtEBLAOD*GXA-e1{hax<pwr_rqn=9I
zR$s1IkF#c=&Bl|1mc89rBa7WiWLL-bf<9%G*{+wQJds-!kxwS8%P)T7w%;HhxL_{z
z0E#!uAv+%mS$5A=7!mT*A%*QlbsvkLi8~DGKrY*Kk|RL}fDIQk3ty3FGOY<0AA-YT
z&T&fZBeH_Y{ETn6<qkYYiDh&ol{kfJdBnG$8`>X^4Wf)6GFirCCnJ<VjF8Xf8*T$W
z9ZcMMqdgJ;9iT7LDU}CJA410x(=v{yc_E{l(vl@h*!ST0{XUF009@rvkc?T0WWt%>
zQo6R0In1MFr2}Yd1zL={MrMs9-orj@I?xJ&i;RQ4<<F!-N7u@-;da(?08vttJ+6X7
zsw-YngnU4;;|62F6@TQ{ooX$AwC%mPo+!BAFd$_$7$?hn|7QmgOPXL{jgUfs063JS
zSfyn`N?-Eonj9xX%9!Ym-HXG8D3e1)lfT@JpYnND!6FD6ep>r?OoMTnxbhdf$6uR1
z=-4x7qMtCy>t{_=K99W1hQ{EtW3oHjv5p}gPEX|ueV7w(een}q(Kafj>i|nRTbXm!
zGemIo(Npr8ghuiO3x)SNHl(d^mbZk&F(`A}-Sc50Oo~(iL`HW|nh)(v=f#n>*mlw`
z&L7RAmw#2p%MfVMAo2+l*rE~9r8oTO)Rv&SoagmXPnWqV|9Ac1#6bh*a`Ug)R%#BE
zS0)643to%Ve^s_xbXy%~Yj2DoiN2_k;*$8ixJrC+GmvBipQLnd>+^hYn=uy7B9DSh
zt^t;k0=RCcITORXG9-7o**ZRI7?i;PRk>^1KYq$;t_7#*V{QF6kHHdv#g>kP+Hu~`
zLzbxqW}?G)DE!N65q`_KoA^TOIKbY>pPBZQPN+n-kxM+*Syv@R2{C~*q_FG!UXgxA
z$fVMVgp%b&S-`Q`%;LjgQdxGAy_jC_2n#J8f^pMyTz&tD=O#%?xVT$oEmOOvF`dqw
z^!#`^;bgLCUN#QaRR=ovZ=5JSdFjl|zp`uUvRe)>%06@9S$}%a7SG@_V|lw8Ci0sL
zxfMFTZ%{G;yatH~pY+-l398^L9OJy;m%{P27+2~{IDI`Xd`A3^2^5=ErHR(E=gJzZ
zd_RX&f;HNoU($YK<W*x1&iKm8?bitlfkpelf^c!1;6W^oT%2HlC-psT{hQBEAYlUI
zeei0PGMi!$A<$IR`Cue4^;80OS8s~;RUU)TRBRj~YqlJ1U#SQkdc>^}E{dBA!C$WI
z29t;AAyOlj)wB%*Q4(=jYCmBKB^t$i)aSwL_f5lD>A{l}-2DB;EMiku@)sNJt8Q?k
zzaPkhF8M;crFkL$@F&t>n@@*gH^QGbiLK*ZPhPGEko$BjDSm8r_&oIY3J*NZPHSW|
zmWLT?fy1K4TwVHY*C6<VZlc6@XC;X^2oHIjI`O(?@kcm4u%|C~Jm@T8^qWlyGY7BJ
zMY#h$z>?_=z7l)la^7S*<cD1Hx`v7x5MX)*F~f@W7k$?QFb+1UTlNkiu)eGOQK~IN
z-+PSA;)|J#2Au9JFdg@EMh#*BNm7Js(iZqw*|$9VU?>1d%Qu*wI(ODtbmJt?hkh~N
zV4s&Y#R?$%g(^XKZXQj+Yu7xkJCU{gs4QChoY?r9EM$J;V(APDe7y?Bw|og_=W_0{
zBvY?9_3~$XQ%slSR3?7HxAT@=a^rnM9lf8NWIsDC&AmqL-)=TZGkTaS-4EgmnX3_w
zY{ZxZDkzj=Pc0GrxdK%!iG<qe++e}Aih>A$(h`qPa>AQ`0zX;-5h28+zR7;rbhV4F
zvV4uvaE-_(XBJ76jh~lU&FpiU*hXhJu0LOFz)Pk*FV4tjiP+L=Af%A>jf!%)?}x=W
z3z24|K{W@$KWOn+4kq!|a4(X(6Ogqc>@PQpOHVQk8-r!X(Nr7&l3HB9;Zuf{*^t(2
z?B>o4(1hwtj3sX~%ZIp#3M9G)ulpczTJ0A{9g9@!wjnq|p;^WoF@zs>sW(CdRRBO<
z&NXpDPKprI;CQBhDdGh>WlLTo2fgMAMslg=Dr(jAlJNq(QQuIs?$pKVJh335Y<$B{
zvP&3(4R0GHD(ySSHp{&0Cfa3Rh7hh_WEgDF=UxuV{J~aq<5`@IUgHe>viH=U2A|Ud
z*F;Pu*)DyqE`xumSb$}au({CivjavHE}xHVE#-Z^eTjP#o5V0&)=9=x90IZH?BY3T
z_Y<;`05a+6v88BBeX6iDBC~dJJ8R&7mh%+b>#~3cVjb((eUSz4ey==kM=P)|-09kw
zl#;17=m;t|Z>`?+=_}29A-qr)`}@&VAXb+~ZOQF`onZ9wZ@YWBXF<NKV!hQ`M+U0D
z*_V*1VxXP*@W9IKFkdUI866bleYb_2QhbDv@5ZsMs#QtV3;gC~JBX`yZ2EWPmJB3F
z77?DHsbT6ZHq;@6#c(+Tr<+RPyW3b!1Q#bgL`}n({7;wb><2zMZeJ~a$4_~Uz>(Va
zvHJpI3gF%Cv(;?DWwCgGK?V3lLS|nSzC2T0o^)cWKCXrTD)CZPrtl_DQ}iEXH%4=4
z599yp@U0%({gjPA@pvKv?em8C=CV?z&@F75u>V$P;3=P)PP?^IGz946hVAxp+uuiE
zLZ|jeBu929M@WN)TTs&7E~e#J_vg&Uv`rvJ!Emzuz6{04X$C&SSzs?I=`dZAkO6}G
zYUC@#`yrd0z8&O0;RbJGs5Q*kj1zKij$ksS`@G5bso#%^<OPI~b_0*UYz?n%5;5^h
z`jZ3oIcZOgn9JwkLh+<eB)-S+^FIPlh+@@7cMKj!Z|>v6NR2N<P{8Xu@&;!ND5AxC
zB#D!eh75GG%(Z#{w*yKP3b_uQ1{g(k>qNd%MLMG#RO|P^`6)f6E%CVjL*8Bfslko|
z!mPf3eus8cT@kS2HE1$sHk~}16_AC5LOURTj*Am~M(BS1lfM19$SPR>U87vpi{yl6
z9#-(Dc-;_HtM%c6OkdGg{`g*7pcwaX?;?`CI-gXKQRU4J!lCcI*A{^1TcR=sB%yyo
zVa!3#9EsgwbH5O4Z12?aw+p%5aN(TDWS7%?dwH$t*?k4<6)LSrAfEAzlRc$|BRgAa
zx?d_CJdIYHb0gN_O9u{O{m0x~*|*5KaiSSLX53^se<?1E1KLCp4XQqK&Eb9zPN`vs
zuo?Bs&9i$>SeT$>y|z+v{Yfpm$THI<=@2Xh-`ENS2Ed&3CTH7<wCS$S%~V)uB(TSS
zqWlU+jw0I<(rl|uHs<{0>6NH6Lw)nFd1eyJ#2kwgN<}7H+f+SMLIzN_@hTPrk<-Ne
zXR&g_jRv41H42BL!-0<M$FZR-SOOEZVcM*WZ1$$-$!`V}fl&&F$sfiU%w}fFkv(Ma
zrPaF6NV1uHF@*@*_V3hAhu<*rh2PgiY%&yt$3)p6f+E^b&SHK^F=H*%0f&RTz&Jpb
zX>IAej|8=zyZ8yyXT+f#VFYU}VZd5L!qNymBU#891txaU3n;SRFx=t9qZHUOf><&K
z2VV9eI83M7+$vJ3qLU5qSw=2X27uk1E3elg9HWZC5|<PL>}vE}E2wPNV-rfLs1h|K
zozT4GPHeB}`^3e^Ng?>mZPN#71fV`((A4Y(B2|h*>cad6_YVcja$Ghny_@7g7a}ci
zcP>wf2I}XxalFu#H@t@zs^8Cg94hNF6po}&r%={`Sw2WK({gK?0=CE{1u5NjNA@8?
zj)##L`8FCgLx>$<eXQo)h`=TrZ8CnHQGX3##QZ%d2B%GGHB*`ktgjqX;~5WKJrpi`
zA>k%&P^R@a7o|nhM+mROYH@hXw;hAJJ;r?!Wd#-O$Mvi3@X=P}7yL=tG5O-sgI2>`
zKg+N>#!M5}^$2cS33l2lKZ`aluEK%8ktsG15W@efd~TOc{gQi7D>%^Zb1Q>-yguAs
zge-+*R)5><H@}exfkub(L|St7<-TojaQX&jF}LR`<1I4Vm8|A6L@V;Rn`50_+_4^8
z2yXBPCOJUq&|V~)Y2+&t=xpfo`hP1rSH*7xr<6Bos-F4$(Ambyov~}s?utXBT5j*9
zNDoh_X~nk>cDVyzY9@&P|J%%SJWG9d7y6%9+<_Lgbrbi<%W>h)>#)cYTNO}WU{WVV
zpufz)czn3CY-Km9G+!6Z{n_0M$rfA!iRNhJTnnP1eKAC{{$o<AEx7ks&uGy2^Knqg
zYDlfqa)e>Vx8G`{Mf7;o{9uta7w&LeB<>I4SLTJkX0yt_0prJSN>f~=&PJU0$8vec
z#Hg!{U;L_7$_YfF3SbM+@zY#Jd+1N^ae}{nxP`E+bl4o=%*Im#fB%klPPXDo1XjQM
z;b@v`1lzlnEf9*7ZY-Cdpcw~szYGa*>`!JOY`p*>2>8C-jYS~9Jw8GfClrxbOmckL
z0%`XTqjpzEQNs}meHAcs++n^Qj|PDTqt5>6|M;@Vlg$<)Q<?VY_dZFYUfv4zs8&bt
zn++K=yNyN+`u!OAiWOn-*PowmqkcyFkI=3~@sT+fN+N|?<Wk#){C&G+EK{oJM&)=-
zY8uYc`=)gJJ4=Wu$E7YMJTxk;e<EY6!LG^fjt+ifPMgd3x22Q)^-5t}KIZ8kE(&`r
zEowPvWe!s6z(RN~@=yM^lNm9tMIkk(6;(0tbd3}VM@B!{pKegT!j+6>2vX6?5LeAk
z>O8?uyR1pQ8Y3YE8=#eUhE9cdRU9ISrY_Guq4B>7BlbQ2jXPLeW!^foK!#xB<J(UM
zktp}Os&>mp&&rj5`8p1=2!4^n<rEvz0Z*8+9iSpj0)s!A3<A8)<DQA^6JsGz;^mp9
zN%ioI@j^@)Y1-|cxl-rkDA7W$%Bk7v6i6b2S5kYQm(?&SSkPcnGnmYwO?8o8kp&zD
zt%b5j;w+aeIq3B3H(vQJ>05~$G!h$lLa-v3f%1hn4HSwIuEQ#j2t0O69tU~P`wQ(>
z(JN{<pDPScqs@R43VWd8n=utIBwsF_X&Q7JW60*Ri1rTJ3k{tMnVVlSVG*_V5X)w=
z>2LTS@XSE|NTLh~bBH4h4NoX=Gzj#SP_0LSDUnl1bcrNN$X?#iEnKLtlnrIUpLnxm
zfjqn#9(Xaq;^6mj6|aCQK0Lw^Q3pJel-W<)(p;`jHf2Ec-9KB0In64SThRAMLcWu)
zkAj`l@)WTnsALh?-wvd9A{(K{p;1{TO*!0SqQ{7=u%(lDnm`ZZqTvbBdtGnI0D$2{
z=*aWI?MHt6`43V?H!L~b<r40NDzWGLT1t>oiGC}b#OsLX=w;LS<CP%#)_Tjdy|d1#
z=M>2$sNjzWSp*ue5QQOTK{R4N9{CP0hBppaiU`+qxZOa&-I<nc>5fJ4S3?sChV@v(
z9|Q%#btV$MDwcA+W1%XNG%5@R7%=WOTZy|wKL}ITrNBhGyxoGs;rMq3CXU%E)T;tH
zzg8X6@DH9|JaxEV1@?*Rw<Ikn;pR3(kH<-Kd-?4J1@TKdPbE&Ct<{;MOA%}8Gxiso
z9MosuBw$y&50&SzxjQXS>C0oZuJrr`KM{0H7e=1j-PUo4MZ?<oMNk0PF5dfmhbA@k
z6n=d~L_`1poU_x2Cy*hvkk2PY1(*L}vr(3tPIOW)6qWiB?(Y7g6_$qQ14g-x(5${f
zJzgzT%-4Ltu?{PlSiR59vf^urNkr|B(ntQ~JhGf1sk=~rrO>0kL6p|foA;^TY7{wb
zn0#Ng?6yho?a&)KGwtvtqyuyIF}s&_<^SeryEJIgT1OS)m6-pvZ1Npo!K44SX|Pp=
zH>a1`8W0^^=#~Nrul-0l8kMcft~`fTIyJCwK^F7}ri4?V{qCiHD*b9`{&lxAff-o&
zv2D+fXNv+d8X}`85oi1y96%fS;$Da;xq3L61-;eJ3U`#?j6Z85_%3UKPB@uWf3Mka
ztJm?yMq?0G=)H8z;m;LVoC6~G<1KUPp-lOWD0aVT2*@(i$nA|LWZj=O6S}<m7r(V^
zI$mS1A@=9GuOGu>1Y8CL?OL}-jt*NsewiZLZUL`{oLr!JST4|hoMNdwKdJ*o<$9&K
z3zcSme!@^hnBmw=oe5<tniqXNo}fQIO3%s|BpOVKFTZy;RLjwbJv!)qwr2Lr;<|(;
z2B!ah4D*my7b?z?L7o7Af$QkrPxNPeiB1F(#e5<Ebas>a5pJ6$UCmm{2+&58jHGJw
zVciJsg|b^mGkt;j<e5ab;ZiG=5+5wYd^@x8lVPFV9hU4-7#sK1O0)3ArrB4XpC}0N
zhkyv65t_Ae>`I~Eq)i}5tKs_DWusLo{ykMkY&NMxHaLa0Gc8g~Oj)QZ&pJXyj_A}P
zH+W!oS&`s!YI%b&N1*Xueqb8>bBy5ZU|yE}XabRuJUMo-{wprw(o=l=*Cb|TGA9*>
zgC8W<_||o%k3eFie-!KRFaK4R;+Z>lPLMZ{%HxlxfSQ3G&%P0#@!gu8KjhYB8Z#_`
zEG+V1;N)nwIcHA`5!e%{hYD|RHgFnhIj;u%^qMc+_NVM|{yOoy56G;m>zo<#0XC0#
z)c<ZC{a&sd7D{vr87$cE)#z=(p%BCQeL5#1gk-@Qz%E(5)$o5%BK9R+$0x{g){*_p
zz_z5-s0N|RCN;^g8Pz&@$@?+>Nt`LY=fi-hAuB%Ay|kc3Wb9j`W4#B16@oBfIGWBw
z#xY0=xhC>UV+)$<MLcEhtQ)c4`7WS%k&+fI*#I67%*T_N>|qj!ozXB_ub%>z?Y5)v
z>bPs#+9ZCtXi=@DiJWS1zR)cJc5h2)j<a?J6N~wwDkh6Re8h5@7p5{0>iu4WQ9TIY
zFZUevC@$T;gJ+I^Hn_1LhhRK!q~nB^cgePe*4=YjH3x`5FNU5UZ5D$ahWpXj7`z|~
z4qlczHWaI`?xWv`xnfVUfHi@ARiFGRo|fa=$g*UC+<I&@g)nlPS!a<GGd5(}MZ1E)
zI|74#yD4W|mFpHa<--Y-_4of;x|PyOl&aL<4MMdW{yZn1=T)Z=d-;EEQpO!WHM!O|
zbQt8{xkHFvz!1cb_KSpe-tjJnzE@~e{}_M;%p0-E{(Wz&j*oh|;3Pb~^eW9?x;V0R
zZd3KV(|c%NwHnL=)#<ZDLB@=tKoraY)k?b`W#`9><$lh$tQap7u(!vn0D;pg!dL=9
zq<?Zp)Lcidx?I$4=NiV-Cd1bqZY>R!*fTQNdE$j?JM|T}98c06pQLmh{u^%bY#E2|
z6Pu=Hcz<Fr{&b&-#+h^ZGC*nM@x?nX`F79Twz_oV4`78tV5E;mhYr8{V43o2)Hs%L
zx{GDl=Cog%%Wpf?0%~H$d`A<d<ISX@O=wR21)S>GzUsW&#`#kB`Z=6dv=#uPw3bl@
zWGvCKCbcFHAyxI7t@dHbpF{m8+BkOs<19<8%8TO?>DU!SZr>0~%5fNA`d&vu4l~+K
z6{^+wN0&J&%5jH)!lBrGs*5E8ObKcNe#Bew1By9?3*00?LuVH6kT$i>U?rp5;7%5u
zcU@xC?MtbhY07$3-o!++UDZ{NmR)pJ9viZ=)@=Vdj{l>qjIlIf+B|}&&3^J5QB^Pb
z37^H3NS@3tBPKPNXt+0hhPX2EiXAYZj{oZ?OMU5+&S~8ix$kn3K6zcai@+gf-;2bA
zd3X>33}Fc^xAC4J#@tE!?Pf>;(T`K$(!$`YQlUiDdmPZ!#R-03FI1h^%s%A({RmE|
z@tH;!6Hf#KLc$EZL0_p13W5@XA+lc|{+L|2$)r&ScjCv*{Q1RNYV@R7lO6U#KsimX
z%@zuEfA)ipoJ+ewouA9&qtg@1`umYh{nEJo=8GJYd$uHVhO9$+PM0&`4RoP#dRh`2
z;<^$hmI7E`y<xRCw|Lm+@F>2&_y|M-Bc2EpQhGi5cB1o)$5nbQ2|LSGn$1F*{2V$8
z+{jh1c*`|mArNs7-VF_0@-p3H(*ac;0sn*(IVYBdb-6g6yk#mL(z|xg9H_Ewux)^i
zGK+%=hJ@|R{01x3(|hm2146bJxC*U>tXA8>0Z5~&DpY0B(M*!cY4|}-#O26in<)Hf
zl3!c?6mu<eQD)F1ID;`hf@iD<j%6G;`xx*B>w0xM`$Q>#a`>GXi5$^e9z>Jq*}DS+
zD9SdTND{It8E5oYLuH{L$%Ubjsb9U(dJ;8bhK@4CPZw>stybk@i;uTfX#Ep~fSou{
z+LA`Yz3)sR{Pee>F=f{Lj>m<h4sp6eJNKZ@HzMg6rW;M<`><a+6XIUr(pi-x1CssK
zIakhUu!5_w5W^>(M@P8#K+2P1MbL8cY`NN1{t)jrh@NMK6h*EiUpLfKGvK0EVkus-
zUvV<CMM6%lXGD&@ANbQ!7tpbBI`olxzFt1pn$2sEq%#LAP3;(wy$#j0mt-)H#Y{*C
z&>%7B*CVhW`q*!)e9<E2+PDuLOImj1g=S2q)WrfaJnb66@i><aDevTtCNhACRJEV9
z3*+>Cme3fC;{{eSoaq%mMUcRw(dxc&wssvmCUNMu8gj(<LbfTgw~o53|0n&kTne+?
zb2#;5qb}F0`Si#nxPw}q2jOO#Y@n6YVHc|XAw&BnHgY$02G4O=x5LDv(jqKyQh`jr
zux}|gkzAC4|1@#qKof^n0N!>XWJKv!<ji63DQW5cqVomQ!)2>p1{vBKYtYSd8Mj=c
zh7@VoG->v%-Llw;e1&r(`j}g0sq(<J2W`}k$LikusQ@~LA}Ri>79-37AYWFTi*vck
zaseVo&%Yvv-bND{m59&tYD3A3*7+_^l7e=7cz(0B8hlpvPz=+)c_mPqhWbPE#2P9G
z2Gfrp>lMJLe%mx^;{ju6+VN6u?<i+*6^8p*J+0!eSQWWtr|GO$`x;t39*+>36n@-6
zsr@~#gU|JCI(vcYzm&&S%Qj)F451BLn*d6CBfaKwk8zoIrn7R-lgkFx4+vBbjxnna
zX!Ylt*mn11LV#`oxaG{AoM=wUO9Tq0k!zUcIJY;Lw7=B1r&SE6<4nnq-_0%L0*}zz
z@OfPci__#r8|r@of!nBI2shaTa~leG&2&$a&j;RN|68Ex(Wa%x8^YN0f2<UejuzC!
z=0lAz47vQ5{6uO$FhtLE6a(7J0G~yNDRF3zAd)x4vGwh!+fshbUWk|r-}hvIwIIs+
zH{JouyXJp!kO-wb!nZ@gVTSeHY@XLBv#CiyxKT27l9JC2J17=B0XR0CCcuw?&Go6O
z#*;zo@7p+I{A(=lQ&O$ntNTiwUzTSoIPes+nvQ&b)vT$#n#f??0md%T$-XW{7e}PR
z)|?La{v~>SVV!3@`Tp`=Di8}Ur#(qyJume*o!!GlOYd0<VN5T&V8E_%I=@eDLgNYi
zbm7unAgRtd2f^;SLu{l4cdhs0mxAJ@vCNokfn10nzmu;Kaa1jmNdH7EjHS?<b;40(
z%S4!J{h(GU9RN%WF`e}rBKMj1yNs&+7Kf&GQ{^Q_><YI>a`{H@?R##-TMbg^eV?ZL
zcCT$3JxfvrUB?2JPRU4`@woXqPg5_-NU(7x_s~WZm!@$E)t?L{Suf;%D3E_QKdjtS
z+dJ7gHV`^y;D3)~9#=SGZMM^6gdmnqvNAJ`&Ey_4Xj2wHnQP1Wair6F7qsWGFQ<Dm
z`isJB;i>|xZ}404Ey+Y0eMa~Zo-?kQo`@X-28~+ycp4+#w0VH_vvsE9eg+p48$>wQ
z7Fh)JhQ5~JkgVwSf6IJsZlISY<gmZ7M^WV(rKpW4P=>>ySuV;-F3%UP;)wy<bE=)>
z4cPuhoW3s(&Lo5fy(Sc&ghM$5|CWR!9vH&PvJ+-Ee$)gO4k*jPi#@(=EHe$^;ZCC4
zH7YgCnL*Dn6~@Vv`??gBTG-o_ex$5WA`y>!_H%MADA&tVBwkc*h0UY=0e8AJ!YV2x
zeL{!pMhwayynjX@qp+q5rm+F>Kd?67Z@5JIo(8=E#A?#SpRz29=T~5t=G=*Md-9Gf
zfWXB89Og3{QwxO0Vjy2+YwX6#U?yIU+xBr1ZIAeaB1p<zv#M9vYNtk{!J=14wMAt!
z&cob&h)8p6(OM=joOOTR{Z5qLug(yBJAQTGSnHYR@4O=T!*$^qWz_#?vu0n|y7cY2
zdWazJm#wcP`m4<N2i(E}zB`^%WUSo&fA>93)*XH@v72!$tN61J@tWVA>xLA3?mV_3
zl*6@tPL|>T$xmPMx(5T<E<f{kH*^h7UUfKY&@yoZh3zsny&rZJ#1W=}7<w3(8@`(U
zusvA+BG_STMD<q<y<q8?tYr(DX;?q9?Um9_GRc_GNu5rFEyM7Qq72m`nFbj*>-SUM
zdKXsx9SD8Qg69G2fPvd6txke*u-yf%KZ0)4eU7^~i~P_AA_tyc3<aICcrJWt!`<KT
z(&)6dP#6lIKHhyqBa9hUW*k{WQ?~0I)IPM?Hgnl!Fv)QA`U}TB&Hof*MfJz`y^AH&
zpvWF7WbwfMVbtuED(sj3=*|$jRzuHB7={R-0$M$|aUofs=T}{h*S;Zy;{7-EAQF59
zt3$TRucEP~Y~}EnM79dV#~PDwmy(&a3fsa^zEuxM&i>U|(T_4|Ro?;5)G2v){MM8>
z3MYA`(zlIialx?x(+<%Fr|4JYLzZvgO^3<0s7thpUhU0hG?q(h<>?kl7rHc$^k%^L
zD>9Bf0vc_gVWdY=Ea;fbFT%Ho&^g7oUsv$CIH%5<GKOHI_zHS`d^TJBh*3H}2cH0j
zL9ZEKpY8_iU?K&+`}s&`rNw~=@Kg&kJGl5vtPMLIgnwalWDQ$Z!5s&Vtg<n@qrGim
z^P<{Md*ShcR`y%5_@RjipRno0E?FDF$FJiDAn-C-Guf&gI!m1O8Pp}n6O1gHDf0&m
z8t#Xz6?!4p`{=*PZ08BQ)3ZHiZI4(t6R!R0p(*>lmU!?m3$5C24@xZdESMP&W}+c^
z|Mgr<MTTwP**l<8H;U}+qSwaiVZSgUIDX;+MyPkR0mMA%@7-DA6?)_myn(g5-XCXV
z&B7(;=4>FFw^9zf5Z-9iXxfgNB+h4m(z&(*x*v{Tb^P+iTW_Z}YApjFjcNB8hbw?1
zj$TjKO2*mcT=MEo-uHyWdu_50!I!@#cSgNdk6%XL$>YpokMGK_*z}{buycEYL546;
z8}`5#9c$r<h_gYY?_Ku;B!$&KmRdvlvN-vy^GC8|vJI(T;eI^SLR1EG8l&cw6j9EX
z%h~!}?Iruc&-@%7tK{hT@j_>Cn8&|JCJpJC^5{*$9`9NGQm5Hf;GlEUWHV?-gP<z-
zBSxJ<P4d~H<6b@g4xK_WQVEyM);y%m*G&M3Cn!?r1bq)U<B@qSeoT7FoR6=8<I||t
zhHo-`2m#*FEQz31lz_b3a-T&Y^rkNX&^Rmw4JM~yFQWOs*`(x+?|N#@ey3C9_g+x+
zEO9g<YqK^2YzsiC8!v5iCSnqli{%6WwbGk@>m_?CNxb(<OdtZVd-1+m?{%tVUvS1-
z2GOk}!0$UHKgt^#%O;?~9CvcdwX?+|VVLN4xG&Cpq4N`gsCvmnTZw4_-k+d2m(XH(
zl<m60;ri`n0xGJG$#Kb)@p>J>F_n{o@O-DjA=1}cBT*n*inXMbY3wUvpY!|Kvcso1
zfiu*bo)D3>U?`*zjV#V^uxGwkluQ*MtRMF8$9awlcMqU?4!abtwOqjf0gq{*r|09m
zfwRR5-;j`Blck^_0bX{&9*b={eSQ<Nw(rec7MWV+9OKhwNe&n_Hza0*4CHvVcIQw9
z=~IzC#Wc}O4WEkqw-tz6|DvpPT=}()2^g{WD42eKP~y?r9f;Mt`pNN#YV9ubq$rZ%
zuTq8TEbRRLF9s__-*?~-tbO<_0@w|o>u-8ImMX(x(Y9GU{pyd**EnZCM#mCF0&&^P
zac4s)2bHEI-JRcuqH!6Pto4@<Jh_R&$#AZq_`|XPWc)?o`EextZd(bBOZWpGmnd<-
z^BM-?HoC|UF_0LD7?;H=`tg1CrX=>uO<;~z$?xA{t=}mKq-f!|7saTFf-1aD^9>OR
z6)oCU8<Yy3Xco_iK`%8@G^`h=X5sRiJL8O9L9E&F5Dn&&*<fCO+OiCutzguVuO9zw
zLcc?KI`l+DE5SXXK$G~h&Up$g!cm}9e(5wV>9THG10y;pQL7GF>u>jL3iXRLS8I2_
zqNfC*r7LAX2t<JTkP6doG=b*waMpz>aAzuKO?Z(eMQrJaetmax)MPIMEM)r@wDY~G
zeU_IsaL4f8VZ8)$p;|4t9uH6MnRvo8<F1tDPK#JmeqWty$w|X}MLDaAgA)OH?ziXB
zgqA;>uNP9|8nLoSN?RG>h(p>$?C4R#VH~Q78-R$_R&EU0WM~baUa-V*@jqjXrv?An
z<d;S9Cgd<?i#^Ukk4}$r+sF^=Xp<NXM^b%QcfsuKe1@k!IX*E=ls(Yzbd~-cI#)yL
zf*t62QfgRBGH=)5v}y6E?ckCm#3pe(mGSvBUY-~*ue<0!xEzdpu284jljOVDgcgtT
zMye5bzaVzKe8~Kf1YVzy$h>F0U~T9<|NO9S{~GX64K5UEY_+_pzcV6*B8v<mK3GZo
zf>8GTdnC6JCMpCfB;;uR4_Fj2lz9~;R0QIZ?QHO$Ut*-#0;#A-b-Q0H%xf%s%q={C
zpGWt{ZgqQQ1&8V7MT5mVRSg{hTifmKU`ooIDlBpRGc0ONq7$cv%GP2QX2POi-?qUa
z8G_0Hh=e!;i#)vazG_i=o>Oss93lE&^uY%0!DR<Aro2*wdJKaSf{Y=$-?qd`UE^UH
zx4AnTV-7cufH*&nEGdDaJpZ9K5;7W|RW^kw|Kx`?7vw^O|Hs-}N451n`@%?o;8u#e
z6)%+HTHM`=wm>NqcMVP`P+VHHxVE^IqNTVMcPS8Dg9g2u@9%ftd(OM=dgYwEHh+-4
zlI+Yp^Nf7vnVD){^@MGCy(5P*i@%azR+C2)EOcu`L4!V~u^z>k9&z*Y7;9Z}w%{!S
z`(8ei6|MGzI*$pP$$(}@{PURWueFOau;hs@b$&f-=)(NoGwX<`OvHZ6T-}Ek4+<V^
zI)MroiH(c%UD_B4Q;CV=@nfbGRXW!yw}+L9-y07a=E6RDjTt+&me;TZWb9^ope(R7
zF7M{}Gp%mN5_wiJHP2mDGseUTxE@6FgcvA~pUbs)#&ExY`;EmgDna}toqaDok`yWx
z#Ex9GS(nJ^CS`T{(_)f$YuLy#`v%KnDfi+^NC!GsaP=MMjRsEOSse#X14r`XB#r}#
zE<=qzufmkq3YbQe)s>EltM)PpYO+t2E5(L6UhZqvYj*)%YI=4pLfV(`$X?os1)TL4
zrz+2$hSicR_C>QVmh-Y?u@>&XM~F}$QsCz+Zfn-2J?m3)W2@w)JSt1AiaQ-E2|X6>
zRA(*`Jnbg0WE>k}56W9Sp{tJKBbsSqu%q|a#{8qDaXir`B6G}}sNK~`c<|gy5}(QU
zJ(3428^3qV)e0KB1ir8?()JT)>ZOY~pmTZi65vRUD6A2CI2G{vrD!x<?{W~?uil=H
z6o$M;$fu6wJLTj1pnMkhIsZ=aNmZE|Pjuhn`f!1kbA8Zv>Fil%^P<GXHm6%RHfD(P
zJzCmM<CmL@eyF<Ef(KqC|1_B`PNxbY5`9qdZh<3!QY~vpKGLNZo4bG0iL`!q3U7~q
z%JMwK5qpP#DtY1#QxLE7P=!(CZ<xCKZs~mrLxChN<x??C)q#l|xmfc67|Hc&7rxbu
zYU_>3FfrBwMQ;XVMOB9dLw}p^g{`RHK|QIdm+7kUwcDtqf;p$z5QpAmaRQ^lm!qq8
zm*bMsOZDl)v!e)CaD$E5{&ClK9=0EOarchlF63fvi>$ZZ={}T2qj>=m?Xz#`BYYdl
z_<ms}a02LUHFSDCVq5H4oZ-~mDaI^>_XF`XTleRX7^$5?+m58@rP4JplWBYN4WkkY
zt`Kvz3IHYvmzn<TXyR<Aw=BLEToFBLN{K!6PIfWv(f7;tG5aI5JS@1RSe&(+6UpBB
zra7C4ihB9}#?y55%*>))Ayz}=2l2}-C%I7xLCFobxg)oA0{eCa$!W$bNW->Ub2#g2
zxQcHFn-9jW#|cTQh4ppo&9T*-0!{jx>~Vwl(*df#=8#-#znA|~gD1AQWnbqY)J$)+
ztzKz(u<!^qiR{I#prc69oq(+l#;s`E1(_e7-rP_^mUAIbXM#1PLz^SK_h;L<l0X0U
zFvB0@LHl^}!g1eWGsadAIHzi+YGC5S)_T25NrhN9TX+BIc{4F|Q(VRwLA)-WRP;Kp
zXF!`WPC~3pcRCTV=hVjd#kQ37rkA_4ca>g-OTBZ=;*>yPD;}nGUXbTe>h|_Y+t46S
zd76(fkBZ3hKyAss%6%Wk@LuJSM%?`o=5@qgN~9G9hWtiu2aoJT`;sgTRx;H>wqu2`
z95_|`ypUz%iZr`5;QZx`QC>on+gd#ROa>48+vLj~Kht<dhXQF7HggR}4Bu9FaD(V;
z<+^%~%H0nGS`$TT@2~5WCPVVkcl!J34X@*Iq)MzF6rK6n$zsS!$PDX8m7nykC*(U;
z%f=<uB(4$ICz&El8{rv>b1BR<W+qouJcUV&dVGmPn`vOZYnA+#iX~B)y4`pkdHaT$
zg^%=^owJttTX{2!5s|G|D%4>-M?d!P%5-`kYS>fG2k2)<x{1UcftINdDWWsMCzYi+
zZj7`ar=2`a!lK_!X<aA^z%$hYG*X9KJr>F4n?0g=ll1>43`t9$XVl<MsXNXqke7el
z@6uKnI~X1D)As!2KC`5=UH{-GLyfKmH>|NDUlOwV>|^R_wHC4M`d2CCmoP|$#-(L~
zm9+H6kwzfoDbKw!_3H+p;MO!-@f{OB+4IQh3R9a+VjDE0HRDEU8lMdpU-*vAkXX%n
zAtV9rt{^3>-b2*2Luc+-eWH!Ack$`A%|D1-!oNaJ-HIq-W5Oe3wrss;g}d=HTjBv7
z`MI>HaO$(o#uzf|>RedMS)3WEsp7ZSjqWj=bUtfpxmK@u1c@G)(%oA8x8k?p;{wxJ
zS_Ssx8~c6-QuB2?Uc&r|EnAB2E0(c`id{m=2!{K<vcx-71TewHcK)m*3=8qq8>p~*
z3Q6?S>7+N@ebeiTy08@LeNGWTRJxI*R0jBmU+ednLbkA72UHzbNH@^$EWMsVEp9e&
z{hm0TLi1<G_MSC<<OYs|mUZ*$&m(e;CWi5UBx<D2Cox~@!v8TfZ~fYjf0>kZ<H2~i
z{l6Ukbb1#*@#FrDoCH(m5aF~HN55l6KZ3laW%YEFOEb>eF%GuPL~7zq6Nia|z4P4R
zU93y*h*82-|Bi2-unNobkBsfg>LWq{*CtA7XU&?{ybbDjoo4gACx8V)TiO<Et&F5T
z+Q?kj_goT++8#l=uE~FDk>qZXriL(LMNE`iwr9Ven`C9~8!%bBwWf8N*dw)DQ4<|(
zy>Q9)UdCL!FS>PPGX2}Y8SrJ_nU+^)>N}8yu*fggoFV3dnr)MO#Nj6Vr8gdG8aYgl
z%su%zX(H^~dwaA-ID^NDT@0I9TWWJtig`cf$F$bT|73f{Vl;L}g46{fe{p8YRHfZg
zs|7}H3Ns4hlx@X$W#GXHN3V(}1b+ywK+>4Bo3i)I*TIb!LI)Leq6|biC45V>KI}(-
zGN6A-#hWRhe4cqdR#r+k++w)`y6`pAmlR*bu2xZZ+DemRK7Q6Y%#yEcKk?L@%Kman
zrck&vEY$9@E^p=l$FdCk<zTrjWCnYcIQs|CL%98dTq#y4#r~t$aZjC<z6%S36kbf1
z#DxpDn)|WQj#-eG2Kp5`F@AF5xNV(f=Vse*^0d2ME?v~T_%dLu*&cg>+xUJ9uZ!0(
z>(aMebWB<IHKK^h2|iEXbO5>0Ix4@_8Ypxe9m<kX5q=-3OyqEOHlbc@87Hcq#n*5m
z0#f<Gs1R3l?XgD=a{ycxQC9Sx2vM&CWm8cv-axm`XzcA;jc-X4iz1+CiEQs)SsL04
z;GHW7o~iPKOG%%d!ZdHW%($VIF|Xg`-nR~oHRAjDoK<$`?4Dp;5Py8j(oc^<;|Sa_
zCq{ACN?1r&Fiox}r2-p`#9P()_6Yyz91$3|8&S@a+P5%4{^RS;RH6f7r9hL~)bDK~
z7JGZd#;_j6*z&StL#mMTBaI$Wx6AC!tIzB+wv=%)RUi&uXsAKy*+6;asi0Q7Mx2Pv
z3Rc7Du;0Mh&TNebhw0SM9A55kTPeJqHs0ZmB)1ywL*zE5QVZT_E=m{u68J;D&)zTU
z!%e+Ah20(6KUmEu(w>G5CWxKz>5d!xzHwN0a@VTlkg--9@agW9Pre{%C;J%aLVX{2
zvhCETu{(&*0D{sfWO~Zekte)4SA16X6h7YIxa3=ATq#j+hoBvdDd(6Yi2sndkIL(M
z2qbU#-?>h022ZpaH}YYq!_xha#h}zMPv?R+e!j8PA?ekY@yc&iZ%59rPUF5!w)p7S
zEjCr##+QiI)B`@Kuo02lxVTr}_b*HXU6+y-e5tL+h#K1?eJ(Wx>w27!FLPbg6GHK@
zUvE|W<52-$gpcDSd~547AsNiYsslKQ=&{%kPQ~oyMYOJ^p*}c1aIP2%@+Gf1^87j@
z@uy@|vo?*K?NwFsc@HIzv6bP*Hfwh2Y+m>GqQ4xlsFnfjOeR+7Dz~XdkyZ;%iZapg
z#Yfg`K5F6LV*&IESd&R-h1MMU6e@TJwHhC=57~2)bn=>?9tlueHL9c~y`Kb^yM1jj
z`S!2_w2YVZo<3ZT=*qRDtiMhB)l=Ttt>m?$ey~7W8uc<W!1`%B=laB9&|T<txYZe8
zX_VAq!hzR2Hi_gJf%ny4BI2lQriY`m+~aY5)OkE6uUzs=CNQU^Y01AD0-dt;oUJs-
z?f<Y=h@BljZ0`u4;xy%xmz?DV=#uaJQC}-4;bCRcqTf0u8g6!rzb91AR%18>4j_kE
zJ^$gb&>&{HEcw1D+qfZtDnvtKP6Sitknj*F#&Ms+{jwkWcWvlwkf(i|*1nQ|p`N_o
zwKmGBAin;?Ov0?%#m1zQ<rI(hMbQ0>vla0}1w=Tt#!7ey#dBWd>k_h<*4vU!OxNM^
zWIQ<Y=q@^?5z#OQb;W`p)(7he$K_krmv)mKRgxYUo(O`e(;+u5Vx^5`#fDJ!KmpOF
z1<B3G7llIQTbrBD1z++BDGQga{7%SfTLo*F6}u<=&)5caJX1I>Lo2^9;7RZ8Z_iJ%
z-;?yvUEOX&FULnUQt*q1WD@aa10@H?r(M-E6&vsCKizi?qLh_%G!L`;Xm`^a=FyDW
z*yxb#nC`M9)CQW=M+nq%F~+`w-#X0iI|wxmg2pHOvMs-S-o6Ns9`IZzt9gJp*iNHf
zDtR(uPUrA79$q!Z<4Ig0F-A?b*ld*#esA!lKBxRGt;*2Ww;C{*>SyE}FR(XE`}_>^
znOU1?Q$5uB*Pt{8jfKAP@`1I91<<f#5wH8!WuMHh){En``S_2u!5MFywL<3i-w0(5
z_{iz{?v(B?-=^;|^v;w=<0T0RFqnavAS=_}rFV4>UM6$wSmTPs2)t>HzZ!C<u~_W(
zNh0^U0jQ>@H~j8r-K%H>7^)v*PQK;|67lb$7NP<fkcTYDO5K-(uD3oWj43H8;|+oL
zg-70Bwhhev#1);&{ZAYxqy-LQKl5=jxgzibf9v}yInVZ61{ycm=cXZK3MdpNPh2KO
z*xL<`Kx4P>9<5hJ@53b>(1%@H982S3PS%{uXhdcHNO{<pzt(>;%+%)Bh8-(S>szlY
zkLwQ3Bn@j5Y33Vt_pw<lN0=OB5D2B%IB42ZZ}Jn&1qH&hoKjjT4@5oqz2$cY;hAOy
z?yE=ddy3tcKTXjaI!_HItQ+>a=j}L+iP<ngrAuo`*{C;UvR`DMXs|-xVrJ%2X&cwu
zD*-c)syl?YBQk8~;3TPTuB#CmOy>M}oj^jk_=j6|`~oMNHb{<VSua1Kf5zNc5e=<=
zNMzvWTKdZm?-5Z>IINpG&7RdU(ttOC(tLDpBoDb^m-tl;|FjC#lT19z6~DU4lAtMs
z{O$+pCcV>>xs+(J-CV(`VrKmc{D$(oD`q>!g6j(*!KD4z+zGxLZmSfuapb?~KR30L
z{JA=5e4Vb4xB310ub<s`1?COWz8b;@k-FzfP$}b__Ptm$Z6s^h)n+JDnsT~QFb+o9
z6{(e9f_!7ESXRPWjM=F6HSpnXW@vqy-q5k>Hi`pbY;B>cFw+0?;xlhP*HNphSs`Pb
zSmKD}1B%Ccd*(nbt%T~p@&4OS)*D=@NA#}JJzTPFnO8kc2@k5-V#8n@OWF^KdwiRh
z3zhBTD+>*^fy!L#qLpT;ErDjgiRrBtC$a(m5_ullj$M8xC|bd7-j?WTbN^wftkB4S
z+--k&#UVLX8-XvfE!Dgii@Ez})>Y>-gwOTWAs070?`hx9!=T_`DepB_`tr#g+kxbr
zx?`BZnNFR>y-Dgfq?JLrmqv2d$w%nyBqXHc-DxJ)<k)&MRv)%{dualrXad)i#G}{m
zt8!&Z6uch7$ouJ<*R#A<ieV}Se@61M+_&kWnwN*gpDo7|x29&63xFOGoImA(c_Y=Q
z=Psr`?Y?*CUN|wv$9_j_rXt26w0(l`Xzu34YHGb7&Em&PUgag`55c?I_4ci6t9GSg
zkSAcI-~u`VfmhG>hzDc1sZir&6*QlerbWKMKY@<)s8J~FgW&K-;o?LepXFuTE+E#3
z^se-;OSM)9<}0p$_TstM6c3f;6A`}H7L5D_G%^nu)&U$x*ON(_rEM0oyjOxm!x{FX
zZx=H?=jUQ$2O27XI@9$I3CkDh_gUK|6mU&Pst{)Lg@&8)I=`c89OXWr;wS9mRT~~J
z6u+kJcz!j=tXTHjdKfZZcLArq%A~>?{#EYzdk298Nf5dE>e)jM*sh*WUi2<f(@8C1
zCZl&s%;I^efWzR3aKnaT47|lan8v6mxqvt4ddB+7b%ESS#J+M^DTi>#kHavVUbR>l
z?4moo^3SC0Wk%Y08fGyJN3TaQG@9?{y^l+(4Qs5X62zPVQOf+G1(5oc2}Y{fKy$O$
zE;-?<EibnUZ?)kN-Ggt39&VX9cP!^8$_ki`if7%7KEIR-m>m4JvM&Ds<I9|^>f0mZ
ztS}s0rd8dw50ZDUw_xF;#_sJnu4h7AtDNpbywp3f3%$^Al@0%;Yupwl14>47Ca6V!
z!DvJ3y7S=WfQJ%%?5fk~@&xo*{Fe3CEr~+OhZ}q>TVwA+^8&1T_^A&G6z!?Pt5!RW
z;V&xqlDD5B?1y*m2|SIn-i4taH}Vqh^OBx(!D-0j5Gu53iK}Ob#aX;Wjd$ClnZm=o
zyY(iG#m?6w*@Eeo%*4uqeXWjX!7Eu)4=Vjtlr500;{k!EAS><l-=dD#A2hBK7_zso
z7~O`>Qx%mxF|bn%9AH^C8znCM=@@$-47jS(*zr2G6~36btxWbyhpv>}Uwji^i(I%w
zW9$89*=OQ8-cX62w|m0aK4Z32+%Do?Kee~LiC#^6)bb(GQukS<_uw~iPQnJL>ttH9
zhn+%2v%m9BfJb1jbifU~?k^VhIj``dxMSs<Fvsh*#M}NVo26N7c(wiBw4@Ki#`m6e
zs4MtlJocjvRsSc*#7)#$sH`X``t&>u(~_}GhaEvAad)wB^l8dgc@FQKZ_Zk0AXZ-@
zDOV%Me~pkRYggc-sry6Bm!}eL6C-8*mCKlUh+)O%Uk*mpal2ApOFkLC$zKm(Vm`0t
zLQ3Dy$Z-U+2l8!bcEspaE{Y<!MSz)K!xv50>B!RM8U5YG+5VI8dsfQ@4t;-z<*jLb
zXAU0iDg#SZZGAC+u1f_*U|uj*rMuSu-3%x!dsBt9t~uE<Hr{ciZ^djp-wwA|B;TQ<
z)gJZkk%Zm9@XeMNTy!@5?d1AaMXlzW0Q+V62B7^P5i`B)`KZuT@vp-ks2CFimF-$a
zRE;NX<?@V4L~3_=*rWKuJ;er^3|4q=TbaDe3Ka15xAu))xE*I4B~Jx2sX~@wi<RcC
z4Go*Tgm^X>DL5I=op{b23QipSD1ZA_G%;nLKoAFuEhYn8eS&$Y(K^m~+9I;xRGXve
zZ=zZ5<4SMdTy;514CfW;wLLiz0twpB#v3G4zG(}DwD0;|uQ0};-`xXa#^q2k(5dKV
zz8en`&(J<Um0KrREK;Lv-b`=XY^`Bb2YR;Aeg-@J=)<5E_1w@iK$TY9xNdT>{PZ!W
zM)IzWZPUv|IF>~%OQ7rXd!9>0^Va=DGZvb^0|`z}GTtxQmS|>9qiK@1Tl@~luWvpH
zoh=K^HY?Y&cYRvQgO`0%{e09z7^GKonw*&<v5tHnaho^r)_x`M(!*f1V#WOsK}s2n
zICHaGq2bgpzmtVw)=xR?Y5Gheghz++F=(%IMED!w%O}S&ml;X7!`OJDME0c`Imq%B
zQqaLoHcXa+TmMCQcL68$j@Y$T@3z2_OKUxGsxI2+7Tt1^_ZSEzam0xNIJJ~%yha}T
z1TQvN0qmnVy;@49D2V$bq1jz{jL%PjjS<no50o^fBZ55Gz#gp&Y*{<$60K^iavo+4
za6We0f}Xe>vT-(fSlatQ9d9XpVg0hx8j{e*YC_)BrD+V1x>#ujEZm@7Ar+N&M9XO5
zaG__cged<ANXq8{jkr(u&jQbl#TOdMFyL=#WCArJsJ8Jsu{}WRg#WV_fSLc?8ow=u
z47yWqHRDynLELj(Uhz0tZ~xU!D3{90?u_-y0bOvjhM>Gm06}sK!(g+_F@Si7SM;|0
zs4Yc&zmF@r=&RoKvM%R=mgbOR)ZO@8oc~HQ%RRAF&@NW*rA(s@T(kAvKbiB@w_G{=
z{7fh-;7~5re{FUy-!F|0P;9wr<~}L!hWsPb{AipwNw@@Ay6LZ+4k>we%dKP^pHf+o
z@6(537)gxx`J`CwaDGhu5T{(=rX+;HcC)(XF@yj2{rg~iDYz&R^G?HwWr(-t#yM&B
zut-#zc*6F$vIKy^rLN4RO($5UY+M33Xd5B5X;!q?2iQw)E_8$<dS&U>nX-bC57E?N
zjf$U^j3-JXYo{+J59>?ceb9V0<Ma4;v`A$AHJ??X7VEI&z0|U61(xH*A!2X$V#rU&
zH01TY?|Y<H`H=xNZxOB(;+p~@_g9v~u+l{#P#lE^wudl6wwAox=h8U#YLf+*>Q5Y_
z+XWqoi(b0|a3t2uSGZufVC!7DUGWPB^=vGF1y97Fls&}C)~Om6IA`<!dcm!&-<H?e
zgZ&tH<SVSm8?~@^bID+2jHH#BhViuBZ;Dd9^fmcIWWpY2zch=-4vZTYxfyyPBcd~)
z@MUL$wg6x9-f(GcXL=Gh@U)DKclIY7V)8RL@JBQC!rkB}pV!jgo>u~Sma0#B=fAZa
z`A;Wup;Y#N<vi|Is6`Q7JFRESH?(CsoBG)w*fkbK;~j|n5<h0iKtJ&_pzb8B`I@>i
z-vJ$+Qumvwpm(3Wu5J0fomabLOFpJ+H%at;Qy6Q!eNL-rm72ilC?FwH^1jcP1~@M<
z9>M8j)3~?T#-r%dY}q&3Vg+MPyO<8_SxmzZ!xtA?^0#@;b38KLexFx6(xxd%;$mKz
z-@<zN^TIdXdGGxo5KR$$r1QC<z6`tVqerx?ay4F5-Dczbx;$9O@O53_D0UUDOca~g
zo%(<Xo%*C(Ag8Z4Go_zu+j22qu7;uSVdh}Xce3a+Isr^Gr-qxF!#;U@a81qaZAyO9
zU=t^KVF*bhds?twDA|Y6(kX~roGtDbubP~E)(NGZ_*|Wvh2L6Zxkj!KRj_i_#xS~5
zC{s1@GqdGLe1sOaOYNAyqy8?TpFH5k)JBwYC6_IO?Yl<4%P-wXMPocF_ap@OK~dIJ
zYt8vu7G3&EOaVt8+uq{oNZ#J}gT0akR<-mVtz`2F+LW{gHIkp)=e?nzruXMj;>uP{
z+wpJ-$*rB<p@yUr=6e30w++U|^b|e`uB~L2iLOlDT{Euj#)wZnMUe)ia-lW_ZJeXq
za>^L@vG4qqy})>lnYG{Xt!|r*<6eZUo`tj*YW`z@CaKY3#$)|iexRw9Xkx$&UAy)0
z-IpGwk?hGYx+XDWeQjo0077Q+BjH>W3?-UI|Fw5RW&=8<UPptt#V<VU@s+=hh&rtM
z7<`gvfi*I-pM2Kp+R@BzTC>U-@Cx@@hKzm|v#TtxV0m$JVJu9v4Y^S1xk>`5B%FYZ
z*i^oGZfy{73jU=2;4T_LXWhdAfM`2Kk09DojMLz0Z-y%OM@upNo|T%KTA;Iy<XbO>
ze9#_VCr~yQb$Mbtx^%(M(5fu$)OPo@^=>o6C9M=|dpRGYl3=dC4l#*%6&nxqBRv|!
zIBM6}$_|w95UOc)VWWXsh`+9EVO$dUD{$>48doe*5bb-O*M%oO1hh7~oA9ApWnCAd
zfLi>J9_8tE+Y*;iX~Sxb${gLwH~!)Hqs^pW-4kk6NflDK-*9u-wH_?<NvZhSi{S^0
zQcp&zn=FF&_CQVl20QKdMV5pER%K?Bc|3loP+lyBxWtBGhAg=4p{@UK6n^tNFK{Z3
z#%aMTqXV@>XV1$+8_+ktvyp|$FT^imVz}?a+`y^T`3sJe4yk-sMQ_fg3<ihR6-8My
zoyBmQ?_YQ2&Mc!d6bGI}N#RReMOr6TwyKh6r1n=~G<+cCk6`xcu3Wo0G8h|f33=1x
zBBS?RBKvmtgOjuF8rx&IpoSM~*}{@~(reh>-U-a}Wr{d4TcuvOH0#SSUycEHMl7-+
zx~5m~gF_kd`Xhz9{upaR@f7~FIb0N8<L<(TG9>}HQF05WBKR5}CK8|aLk3Sc-p1@e
z?!kVma1vp;%9_KSmzdZwj+uKnH9DwW3Z?d~BJ|K3X-7;i)Fq^8etOyO+NMD5!BlUL
zpzXT4fu*gy?;p2zN!e-O9uU%eAz-=lFh!5yn62>+lQ!T?Yw}&rv~H!NxTojs$5bw3
zay~4eOS#U=IGkTpKEMCgdF|;($jswQet*{+fuDCT#ihbXJ(VktFziX=Hj=0Hf3lxE
z5t-H}-fW36pJpB;aM$*68FCZQyZ!oOk8=NaA>tl}Mtg2ezAOned?QC=hNi>$7IL2Y
zL<JQerKHMKPUgydf$%P~%p`n?V>-J!72te+t=t)mR3$Gp$r%Ry$wG)1E8NW3{{HY?
zi^=!b_30A#8!tw4%=_h=PtpxUl;@?;pW$tktg6krls7dc0~wKD^)GCj1kT{EMe23R
z^|^L_6UP<H<5G^HPcx57HqwEk#11E@Mcu!8VjS9V4xTOh(e@NNIp#c1jlDbK?KzS?
zMV6}k?0gMzSkQivZ2}h+b-b&xBjLJV;}BQ*9Z-1|eH)MCiHYIyKCs~AXJB>he4d>7
zXTn|veU>Pk9VT<Qp<}gDGF~eF(_Y#@91RLvRY`}da0%18$h1GpyI3xQ4WVZ7I3_e5
z<+gpbPfp+fVpy^IUU0?tJNDU1asV^&j+LPI-N@fU2Toc_QJSgcDsi_tN0VAd@qm##
z;qkAHb>W;7p1L;|bqj~XKIA{%HjJi;a(A)&=)6?Q5ieTT>QUHeZmHOR7yG-$6#>lj
zl0bmt_n8QDV>iKZ@J`*-R#U|J%&o)^v0b|`SF;3H(JW^ap3vDS2m)qv4IeD5dv_pW
z0Ar16WVmbU^TSB34VZ5zs!8O#4m((OrajLZNQ%6H(t197>DY{|QBx{sUU{3E3df)k
zbUoBH<KKE>Q<x;qaU??Y?cI!N#(3k(Z3pp?M7=C#+$Ms#lGHQidf2chA#ciQx3Oh8
z%5s%BPTU?+;d}9e^!-i^N%F8$=g)>?4Z4xx;Wsyd=60=K9D^9jh-aQeqIi0`y59O+
z%o(K>8t2S%)_DUZW0pQ^vTpPJH#HUC3*Oy2vTL1P&e_naSe;zXAzSZXEm-yp?s<iL
z<{;|&M0D3E17-B7DE?Hve;k1;dHVT}!W&j-=l5v5?cGTZvpK8_)(hVlwx?~WBHaw_
z7d9>;7uux4DLF%KK;FLpch|kK8Qd%HI-_;OjHbBU|M!b~w)IIkwH1IqlMg6E+W&gZ
zcbn@Edg1Xb@XZ~S@!1;cQvm}hmux4BhQ+2IZ2Pw3uiccZ3K$n?)gR{eB+rHgSB?uh
zHC}PQs9dpG@e<8`*UmHUQq~V8y>8Ge?^|C;aQ^6S>Y^leRLz&iuyO;pn_-}B-%3t>
zqNC)ZRge>l@NI|OdD|Cz3|&H-UAF&Z$e2bU{2dx*jO*>>xI7oK9L~O-Ej6yVt&(Qb
z8H6VBdiq}dl}E~S`l3RV#kBpZH}=35-!ZgE487(cr`=Y(5(m+VL91}^fx!a^L1hqr
z{ke6p(QjuLqDL&8LYc(erp?)^T;9yZKSm{Jb(XRQRC|Om(f`DTjz((8nwjARG`#1H
zn+YI3_i`lPOFnXXivi4V?F1(>t(1=ov*E?sw6N$0VlNhVlUmcG&~(Vmy(n!sR{#sh
z>ME6$F~r`9lX_pV4e{Xjdls#m%fZQzmxP|bOaA@mA&G=*cwIrk#WpsG?Wb?p>NA+2
z5n;##)oxvRo18$wMFfmG>plXa;$NF_P{4pLI~Q2^=7ruvpKLDL=~nuSDxEi;E^Exc
z7R-bEeWGnxlHU!44aLU=JApz~VVSD$&Ba0m!C^ogT;!figo}baQg+>h;U_?G#m9cM
zJ=Rrvs+1LDgGI`$D_$o%KsDQ*Bf=y&sG9M`bRT5(;^ld%?5)q<r?gLfMr#BChlsQ=
zk9|Vc#56PiY{n%7V|;k@z#$5al@bvOvanTbOfaqWE%Cavk{#!*>Hr<VwqR-h3LB~}
z?l<s8euRJ+4JFt+Ca9m;CFYV+@9oV<+Is%22wKmZJcHfc#d;2pgT-!Q{^{?gUFE;p
z<UUMSoD_&XK>-CJ5jaN&^>@1XKSZA2iA*1HU5PuI(&QjP_^Nc!P>)Mc7<j$uURC`f
zF_wIg@90#sGQ?cq2|dmw`fk7@F(4Fa)5Ee6G{wImwsU9F?<n?SX;CO3&!Idm|81vv
zKe{(p{Q};>Mq^B-)$QR=7BVemCa7$>*uj}wjM1Tb190%ew=Lb58V*YfNuR$j!`~jQ
zv_kQevD-s$9o7}yH8#<(zu8eq9T4>|PHNscUe99vc;p{dYca~Azc~@CWA=F1!n{3u
zj8x$hg$Aw5<ja)IT_^L1(_dz3P?Lax9f)3oeb#r5IaR#?_Q5v%HkYp_WI#ueqEqfB
z-9RQc^T39!oPcyDETAr_%~<a48sFXD^Yq>F*wM^rc>wV66*UjxFsds;DM>|p$;hYX
zXOw+~bOg$dbhPnt&hWnqtaZ1mA{z?*8VAkixX;&o;`AJ~YQE_;3RvINlmf{`b{?Kn
z)ZsuGmoEcBd!^Q)C7xQwb@=lb5SbH%8lVU{?tTb+!(4gxg)Q5@9dkZRAjo<<P~q|9
zcOi_RBb|>lcoA-c$Bvmh$-z(uJBF{67>)}|+4!#U=?)n?^?cSdF$6;zRE2U;ih*C)
zn2YSmUX10ZVJ9#izh1LOJ=lmj!DOY<XpE(_HM`xI7=8b{&t;R>bCDhi;R@AJ8?YV#
z?MI|f?t4!^Ba{L*2eOKVXVN2c31DZ>uFq$lYD-IV<<|f{mjaOQW3uXIo<GPezE=SH
z%sz)FC#Pxy=yLcF?I4<tfR1jC+2S5bbJ3{Y=IN!-IVZa{)vH2cQEH9#9(4Po;?1E#
zC@q9j*E3Ut5TtF2rvqZqMFkrYNVQjY1fx=-#N$)a34wrvDJ&qs$y^uLf4I*~%2Dw_
zLqxo&5<+7{My5jo*@>X2rN3l#0pI`4fJtk9rlRTvrrkiE_KglBY0Q<}xzPzuu?iY}
z%BYfg{`%|nYr0{w{I3v)r)d>m=X|6oz^vLt$T>VvyQxiULg8zjzmlSsseXOZ$^uUE
z1_SIr`3MLKS)KLnL#{a=R;ywXNy_bmX0+>F#?+@%zr1u4NpVRI?fFDG?#Si&f+saO
zWlWCLl*aRm<%<`dsvtUZmM62NuR7R?t0?Knr0AZYID_%RRb5Aog|RQ}UB@(9%`;pc
zbVaI`?%#F)e)BkL9n00#A#md_|Jf#GDNt$nZuvp{f=QhBhV4{nnY!G*s7PWdCFfzz
zM<YG%8t@6m`^MIHptSm5wycW3ehs=lKajCG+kYcVmgE*5E;qSeS6h+?)FCBkKM8h^
z?|KrBH&xaN{<<=`+T(Sy9gj~+M~_W_ghEJI<*KxQRP8xhcH4|5pS(Jr_?DfGJIWB>
z3JFCD32eoVGC*#a%>yL*Wo_f8oKP;iH=R%xgEE#NN>i4y;0TOBU4Ih0AF-->bzd$_
zcG14&wS+|7!$|AMV6?9BwuuSXqm~2Qfh8P7HWy?EF|Wl+rSqQ6rBNvdfHb=_!Jli8
z&9Kq5lrt4X(b98)z9n_eowdQldVbb0*koV_uJj1DG`R}{7`e}Yfa&FZ7#qM(yB1EQ
zpkr_cy^xqhf3uzI)BQOs>Fn`#x7jxs6UqHvIszJ2dZi((9!^U&;SEj?Gm$hV?GRMp
z7?zajrtnJ2+2ZM`ZO;&N$jxm3bIq5vYj@y0(<G23<&3*Mip{D!IBGAcsL0%%s#E|<
zv+FFHtq1j+-yCaR?-b{7UH+vzCr~66Ru$jS%ukO&x>i$jyz3jqLqx_9x*{Rd5s)J%
zsjT_O)dv<|z&11?)DKZ?SFxl&sN+!q=zmC7$_qV}6=#c}g_tnJ@`Cc?)C%abTC-={
zCgO(dC)r)*+aDUy1f04IO7)o!;NFfdo&<<bUwM{B+ai_FMCoC|yM>n9*U1^ZgWr-<
zb^6u67?EfAZ%uvgc3lmnDlob!cJm0eHppi2MGUXU6~!;Pr-rRIV_4<K_<S=QB*^lY
zYPbEvY$5nZ{g0$gCWHc)M(mHQ5tWdD!@O+c3hzh#@3-?}anzS!skTK+JssEA)_L)?
zqN}<jpYD({8jBQFhXd4wK*jP47(##;+tn$a&#Xl<;uS79Q921d$d?TR8Nb{NXsl{q
zK~0c-6mHJ^wL4tg>rVpJ%Q-dQ^LoLZLqC?E{ZV3UK|y+WddW@O%a`5vUEZ2l{48bh
z{Gf_EmU@J!?blT(u!U%WErbl{06b8I3DM2vrW6UvMb@>x&Irf;N1f+Hfb>dzWudnK
z7;1yRML-ovP@#!+T>5|$Yk4ODx&<NkX^0GJOmnMUl;Q}{*|@mrN4RkIoTtZXs6)76
z(*ulTe<9ZzjqQNU)|G?}M5(A=UraRJ+-D`_U<fNV_Gp}5@75R()KLC09>8&7ZT}I!
z#Ge+ny1Q3HIP~EVhI-9KX3R4h=EUlCXK)=*v`y;*pZ$h#taDh9JUc1QdHZEeC>$3~
z!Wu;G{gaz`#4}X%4(TU7YB*|~mGoDj4z*4rqxF*;j0E-=I&#jq#8ZLXN3dpV4-Xh$
za%Ql3YP)J`#F-0MPn@_<e-Q^%0*h{=V}NBnC3)O}QB#sY#fntr{fhC~7?d_amOx#0
z+<Kx+BR^@>YDed9-Lipc=UB*sb|^aTvvz$hMt0{nZ|E167T%9-MelTzn&++vI;n$9
zp1qI;g9hKY!;5?35}BcxA;{e*!6gLXL&3x4z#8x0dJp&E5Mq*j+az*$f`D3h6iRTi
zywp}=&6;-fz2=31#fK@L;M0+7C4EGNUS-3{Z6R~Fu66}Wcp*Pi3Dx5Y(K&)LGlL8N
zIOBDSHs0;63jQ6cOt>PQA#t>$%(_Q`U<uZvL9TB+Jo+#cz{`TX`8_TZ)L4pgpc*&-
zO>Jt?1}Bwn_B{1B1SL9^!7laQ3WR#cH6N>4`lKuR{<aws2JQDmnQX3L%qhkR$cq*#
zh!%d}qBq}}cl}r{XvN?%n`Z@BiWUW=Oqh7lvoT5#UB>cir1qK&k}DZ4r0M57h9HQ}
zi-n~F9T|y5hH!sC<%P*~aByRuQ`U?ZS1d9s<$(r&D>4CJ5+udKNbsl(g)?QG{|d-z
zk6Qics6`I;CV0*ODo2^bv7ovkM52Mj1^g6yGFdKTG-vd@gXFnwjb80b4i5HG=Nr6i
zwvENMT^9yZDAluqDm8u-&$*P9Xr`RM-(@_Bm)`bstSAYrCE)kTznvdhR{wiloN*x|
z%3PE+Ua#9{(A;3Mw)<^RcI+ZcK8)!6L-lc-EK}#txK{+mk0b)i!s(-70K^@Mk*HNk
zPeNvUqJy|I{uH0&eY~-hlS-56PN;_GPa;#1e^6O%bAKguB)EFyZuetjk_4VWm3hJ;
zMK?kC=g05pqv70rQKM?ZyeXAe@inSx>|(S8C3D~~H}t1gk4Fc?EK**buzd%Jl{i5_
zk=xI@@CidmZr<!sAoF%u+j@NY#99mAXXA(#ef1fJ<<jbVti|)b#$Cl$>tpL&o<szd
zu7+q?M48eZxTgH|Qu{Y02d4n|>K4@AkWg7~PU>+HOJ5h2QH7V$Zm7_&uM`>I7=0Ke
zhKPB`^$icQA}}&Y`RKvk^g7;+xUD5mjz2wQ5oB6Vf#OTAtOqzoLO!9*O%j%TZ^IOx
zG)DGR^XSjD3wK8ZoKa4_y?1D?%c!3YW~|)9M}RFj{LI!ra8bihS0<|u4r<6NZ~cau
z)z5Xd;C5R{Jc6tR8n0SLLvA|tR?CK9W$rsGpE3@W;XEc-TLb_G^EbZhC7ot1;VQWE
zM*p2HSzj>?6$TPAO(#4)D@(0@mxPS&&6n7qiUN4HuW*vcQwN@cfher}=950JryF!B
z8Df^ZMT3s?gWP)k-^DB{;MjA+I46IsWxT(ISTma4pj{99%~drLpT%90&1?|So4@>V
zo|Utt#PYVDbjaKyqY>#yf`#f)Lw1OQ_A}A^rbX?wwEe-e);jjy+Y?vMyO+iozYfy(
zgy!|)drhi>&LH`1$U*HNia3SDUv6|^l4PO+`|~v@vq^R!(qJX5**x>5TQ{3fFX=R!
z(EOGZ<R77Drz2qFt17b;g05yQSXm!SVRaX?V|>TBX-Af1rv5mwwM$AD*q<W#A<QDd
z-4;2;8At3@pNu220_F%dHM8MIf`-!IAYW+?j=$R-;d*1i;@d0o$rgRmcKogp)4#Ml
zVMgo8=FW!K*fDYfOuIhd0BbSZCvcRxV|@Y61JK<%SJSgkbmjyoqA1dQglG?x*5Q5l
zOBM<gy}(xW4h{+j98_Oqwt-_Xax`FYXkSUDOK!nM&PqR$d797>FhO@|(%?lk3ougG
z_Y9#~II?slE5GN=bswbL`*Gd``&-G2uCWD4c`y?EX4a;UJNtyNZ-CeM&n5RlFy|zM
z&@#y0U;u`@PNC!5iz>1ALQo4p{wV`l(sQ&V1Y;HMF(ah%?}CbZ;bGv;#o7Y%Ql_gl
z!`#0|PU_x$F=C9$&z)3MqDl*zo;ed=Xk#ItyUM4eSjkSVep5af5UniTi2IB#tQr4y
zj~=CYpMucB$TRCo@y?1L&PkOzI(Bb`ji&=H8lC2*tl@OzKj6`zV3$10@N)h7C>CB#
zc}$Wh@jQwl)X2=ldBjoHaxv@~f=^b;Z<b6(-}xaQNnr8X2O|+2qab%1!LuD@k3+@x
z&?=sFp@Nd_U*-5Bu|!3ZBQryz7&$&O^3ptck=axoLHG3<_v&W^zjtyRCL)sPxfKQ=
zV1&rs%pb3oscijYz0r7Fuu>H}6RSe1Es6g!0ZQIBM2df;1Fra&Duj@p>^{KkQ(9z&
z+<0$Owi*0gG{I1w_W5633ggT>XHEvwlpv@ajXxE+evFgS^OkZerfz}FLGqdMu>9s^
zw=jzrK1`#4uQRX?d(9+`r|Mo!%!=}KZpla$W(|9KfAUJQzXRDya3rEEVj<Kjzi!CQ
z5AB-kKBB&k_)OzAC=Y}UFa(=Q$O6R4NADTBjjlv9_fz|cy_qyJCKw5shroG*6Ca_x
z3-+6iPA&7X78)q(Sk3i+l`}2&BkJN~=mx>M^w_J&+m{5vUm>BFxfIXPa%suogcOt}
zj~h)K<tew)AMbXf41yzCq9M7w=|RzOCeRHpVHe&bBf_NW07kqA81aoT<nIc`gZ!0X
zx;w$I>=LD!Z+M-XNtPJkCK<X$eHz%t7R8spIJ<bYRxmiiwM73wq-QjRBu%@NQ#$=C
zNLZ1e>Sdi_pChh=H)$O1oHMdEmX)+<p%kN)GYOqJ`C=2V1ceoY{Hil0@Z6~oB%$)x
z7QJ!JQb;vBC`?vBle+k>Fqs(IJ}J;2C%!5zaet;hDAXeF8J%V*p(0CKQ?M{JfY`O%
zpLq4jK05Elqo1Wm5ZO&`xO+HHFQiBF<owZiGZR=qR~znMHqL4-y2qz}9v4EVu|rV;
z`NV@W+DsmZsGqm!<e4YkyXu?0R%fPS;~KjY&4JNTy2ewW#P`%!^*Le=I%>K6I@dDe
z+N=_DHY|(&#7#*u^r3s`Lr;1xW}U&;mAo{p)~v6Ak4h>`0SQh*lauZ}#XxK?m|U}D
z!Rbx>_l}w7E&=;zE=v?eHaXZkBxuB_%0@i+Nw{|yVBlbXifMAA-sZ`5a6`%Pqn=7{
zRDJ}{-rz1n?ed<4LEiN#ytj8o1J?c$Y}mx4w34ypKRPn4kCajz92jyVAg2y!IX={2
zk#h<%eC;L&n_ul|y{F>LV=EstC8DKK+M&oRXFa5ZAumFY%J10VSif`eRNQs_WSr5?
ztc?d$21*Lzvo;fx=`fT~L}UWdYcg_iff*js0%AzKm~vmU5|LbS?=kxfa2;<6;_$wJ
zk#W>fk?G<S!9lg!HAb3j^1zg3UPUwz9klchR*6hAeGnwckt=oa`jtdtv>*icF#?<F
zXLfu(JTOwU`1%J`-Oy1E-DL;wEUs%G>Z4OaN8k)zPQZ){wRv1IWUwIvh-1{np4>K8
z2uzjNMW2?o-PeyVgcjYB`h>K<C$Yxc&b*K}rNebztmAz4IKe3W2V(#8u(6VLw>1^>
zH>Mp|9O2_=zKz*dD$xN)-a*GiA0a_nDwgpK<(j=`l&dc#`-N`5eQ%HvHKNRK25R^i
zCLpx%!q?O7!*v(+5?P|u$yo>34L)xKXLI@E=wBQ<XcO~0U|b=$d-rlv0pV}O^kBu$
zZMXhCw^)IvXQg^{^^AS*-dYj6mSB<}y&556w84U@c9P!7*OvrlupQV1lyzv;jbZ@y
zn$>S?&8C&|616?OJS|M+H@VQlmbp=FbDQAL^NDy8DL1(5kG8pYg45KY^n))AQggAt
z4)XnYz@Q32B@9`Dv%q;pndb1(+Iv46$no_E_`nTF=*jx>d;Pk++e~O-BpV++=mk=F
zi8UJ3V>?}G*dU<&P_Y_ySEV<Y{n`gp%ro(!R}1wl$*Y_{3xU7etEv1n{~tew-uzgt
zvU@6JGlx{E=T-~46PsrP6J;I~Aory~E#4_=jqoA=q?bu2jY9_U;UU|MgotOj;ATbO
zZ*T(sneA+{t*Le2o7aN0?B;4fh^|X~YzwcAkK?y}rb`Si5JDL-(QZAe9`oONT5Mr7
zZ0Lo<&BK!)1$Vt-D`?u!^#u%}Y@AdFJ+SZwapq_c(k6xcVtStbw6uyIwFP~a2OIjQ
z%S|gqEU|O@IQxU6usQEwW)a!&etR(`n6>pi7v*2YF?u>4OZJ_yps61KM$gW}U5Mq0
z_5BcnE3Ek~<QpA<lINh2r;3qhcW!GlLW_legAdx@5uDxeMucMdKp_$LINi&zSBGex
zjpoeRi3xx|5(vtCW*GY)5hYe)@3(aE17O)T&e_`1Mc*%`jfypx0qJuGIqVu3!m25$
zQsU#7$Y&YucHcH;0B6*H=p<T-j+ij=H*@J34dub5qj~J;RU50ZpY{r3qveVtvg=>r
zA00K}bLx<XIimxJ^cb8UUR;zzJI{PNk46|$zI0yEY`Q{pd1Ev;7ok(dBM7aj373c`
z3YM~#V^+}RV)PL%uP9l~QRFI%pkm6KdXcYMz7K%2v2kyANPijgRU=cS`uo%l0H7s;
zYxR(HO#RUL)%RI~Aph<NW0n=`6wF!NFN@RO0(9}1V8cgLho#Q8NGw!OAXno>q3Ohd
zFdcMf`fZ65I~}m4vA)GOdj$CxI4*pBCq<V<0H7|rt-bO$Sv(vZ8SO{bI-Yn6xFh|W
zhCt&0MOGhKQ^0IHL#2Q)101U_NeA?+NXiu_nxW|=4DsPK+|P}7G-|^0e;XeMWOtUt
zh&3{0Y6FZQ`IHfjqFmp%61PilD?_q^I0iYqFW&yBetGjD>QX}o&yc2OZf@Kg5kj@i
zmHFdFujT{Jv#Ndln*G$%>AYoaLr4H;t&v2w9%m?eyr~mR_vE$kDTRg|c<tr=OBr=-
zT?tjQLHE0&dCcoxV}yb&1X$;IkSI#?l4g%5D$fC_mEf^>X&EifPwBjbNFdtnTy7RZ
zNBIJkdM2KlcfnyW_$#MKJo@r1CPl6H@|ZtfWBrcun*R=_-MBaDO|am#1HVJ|G`)_t
zcr6jE)2_8%vU*f!udTs>i#UFw{sbLl$BB}=Y)MWq=q2iriGIzR7+~9CPIlBfCo5*g
zx>DNxEIi-&(*c^dGhI9(_=)2>xKq_;)0<W@CA{}VQ2UAhd-J}=Z|3C?n%qFQu+@eT
z>VH54B)~X4y1Gb@@#=r!g>9sieo_%o7WRd)BQALTxx_^W2E3Dxz!eW=0~L;pka|GE
z55nj`T}3`d@<tLvqWQ193@(5pF@RnyD*jh~;eY-NohbnCT6ll0-DhCnXSior<Gn`y
zFaNIpNYi)<1`rk*EkaTj<EHcx&@#)Lr!#X<{Vwb)DafC|4%#S;j<{8YZ733L2_&~+
zoAzH<6#l;PG3piaEfS>aG(-elGKjVVe-)z}<AUp-n@EzgKGM{o|J*zdT|>Qj3cM2u
zc-MZ**Vs<roxq2sPl5xm|GC+L?`fvl3*3|`gQEhFf`-X;!hd;b{{!O`Wk6JnpbX?3
zhlJ1+sOWbCv@mpu)V}ffxH83lRgnCue;>w17h9sx2I^g?b;pK^sD_jTkQl%}!x!Z#
zvHUlIn*J6mA^)Z%i*%Cr-vmCBsB-!@C7mPKyJY_+@Cof~<3Hpf-&$;;dEoq;!2gS3
znq0R*;7(5O|1&~S5=Ah?eXUnoQ<Es3gvx!h$@`rW{Mq}t`r0oC8dTcVF7RhK(xWs>
zg04}o2yej<oHLB=#|tVI7zBB|!2f4&l+a%z1FD>Yg7Uw!KmWCe@v&eK1IVqzm=6W@
zh7n|-MgaC!To*YG_Wyi`eAo3^%5qKmA6|Fv|07ZwRWD%3x8NJ13y-gWtaZk%_Wqxx
z5}IB{OF;kG2k9{|`ESx!zyahJ)Mrv<S^>N9U(;g$OVk-PVFW`TjNOKgIqxgAyYYH?
zkAuVj9^i+ubjJO`_zxGf3c~`wgC<BE$q(rQX&-qO_5a@uDdh#!NP?l^P!Q<9y+y}K
zkhxw}MTHvmk1`PQy6necV~Lfi(9{IXCBp{u_U)J7x!u~`v*vwCfu(84D4qaOJu)2u
z8cIsa&<;Eht+%VP<SW)(>R>yT13KwhPF2OR)6-Mupimf74l0HMy-Ob!C@6>;SrQ)`
z<Acc%l}V=wr_vR)QvYCT-?BQqHar?vbk+&K>*-TAX%qmME@C98+L?>63DEBJY@IzL
zfx&P-1-2kvgRY-kfcDvrk*_q*n9q>^(?$Qk<>1R<nkqT)g%>itOyI9-_m5I2G#`I6
zaztm*xFXEe1rW2yuc$`j|KXpKbWmwqCN-FSV3zG$UFL5mp#=Y8)x(Zjy><xU!0^bq
zo=cTRD<wu*r1+!2Nih&wtZ|X{S|mYJaLw*+KXV4q5p$!6;TQ`gtVPrSqSU7e;%pAf
z3hOqWReh<Db45!&n!$O8+k%GNN4cRkcNmXxh5?X*<iFa8+W}pbIi|lN@CQrif`jlo
zFji5gC@pCJ_1|&uE4mZ^4!q7A0}4nQgV(L!8i-l)1CvL^Zf>j#^%WRJnPx2+pH>w4
z28Wg3Q))un$LEU+lNMxP@b+dmGZpveqkIC;^fAJ<FD=P(IVmH}>99O2s>YR_<4v!H
zr@Brs`wKluWstIYwh&5asNRhwHbCK9Lg&FQ*iaV<QKxv<iUt#fAD*{R^(*N3BXL5Y
z#qC7bh8+&sv|}sc${wEQke<A-ldd4K(rnn+71;(hJp8_!@9Q=3bs8;lxI*Uo(JJXN
z_7&PK3Z(n;NR`&S>y-T6lYI<nq>H3LG3pD($FCq>MU@mqj~$cz16(MNx+P8ueI7rO
zz&<AIJyEPB8oE;oi*9j?_yufJQ@t%NO?ngjUQdY%q7ohbiBaf*UAGDi2;|7Y8?c$R
z!npvdT(MP7lm0>cG?LQ-P%OoMV~n0!3#?1_^qUTXj}VorVxIUB0oF!FwxRiMMZ;}L
zbD@FfwpQy7vuWqb>}sgmei9hMRT1Cu^dFI@L>Xz8ojX%bQ=Hpz8Z9orKW*eZR=DX;
zBTb>hkH_c>-NpT*v5NZ7vVJ8%`ey;l1Un@D_1`LLI1;elND`W@$QQ_0bVRgQjG)@z
zij7*%Z?MIP*zh5&{N<-Iwo286Xk_Xg$k#nIj{pTUNQh`VA(VsT7SEPspDa@mq8f3Z
z0^4?jcXm#(nqFB01T4}a(RhXu!GV4GD4ar|S35*s_S0~FiY~2CY6iw6<>grTll_12
zp9*O4$?!V=N_<_VAUMWC{s>9c;eh(<4UU(C-#epRV7*BO0_UI^@N5>?YVL1M9v>0L
zUw4(&Rre3PlcWHTq>;pMgppAGkvMO{J|<Hlo~KQ;kIX{?{XgodK6_A2y1-I9QLa`~
z0&gLGt`5bc{xKFE-B%+bY$|B#6YF`ziKOUK2&+U1lb@z)%Gt`j@|jR+P0kvmGC{&q
zw<eca0-gbmL-GdFn@xbyc~s~Lgy3;z(YYcXn+%$DY1>n?&=ZwZw?2*y5_+RQ`2Vl2
zW$<$`z)whMC#P4)1ow@f!8M5TP<k<0906?a>ubV4S>S=FLB;z*UlfdDU+i26K)Gxv
z@B=97;ve||kex}Os9?HwMkR#tuOIZkti}J<+=!y+5r)iJHzk_()=s9@l4o!1&bD=X
ztakBP3`E!ZTUp!GGFHXaxCKNk(z90~quv7#iQfco<AF%5Np$rM?MguHG%%<N;a&fb
zsxaD*<g6qIIy^jew@#UJVCOz3bl!Z!vhw7w`MDVyjX(yD=s#<fEYp#vqCDu6XD+O#
z--ksvvQF8#r6&QYdom%Zj9)l^^ReEn1OK3lS|Nt{j22^A`aue~9zDriT0``ZeeHjo
znSZ%7|AVpjfNHAkx<x@iP^zNzDk30FL3#;D6A%zligf9{cM_`dDkW5ru2kv01_+1{
zdhflrP(m*u<Zk@_|C~F{x%d12vB$`O5y*hOpJzRD%{A9tH?K+-<o^f$`jvlWB2Q%b
z90dZ^w8$QZ61vJv=`~79Nn~DJMOiCIc+m_6)myJG@j#ps?*(jxB7saG=z6J_EWeFe
z+88Lo8zO$?@(A*%w?2HBkdDf$f;38|_A%It;)R5S$lnpa4O~wI-ATMf1*f0?ldV9w
zY>2zB;;rMpP1hlIOzyNx1LNbeNJ*c}J^RfBok&MuX!1fCI<Q6&kkG#u{=ZEw-cb6m
z6xvkc$)Cmq23irBe-U&pHt0UIpjB^KCW-ia2zSck|KZYQxbw7!JHP55HiAk#Sq~0p
zXOCJO2(SZ!%pc(}sXv)M=l#1yEgwaHZFnpg)1ifXvq=8!-oUx_MX}}i%d*R%H%!BI
zdrCOx_ydn)p6%2FlI)<Ko*tt9mV#Q7o0y&Z=m!JQ<G0RR>YjJke|e7OFh90s5Ea#8
zCmkRF-sZ%2zlm`r&WolVPMH^CDL$fvHD$r{H!(0!W}4*(@_zZ2h1f@MfpO*uVK+IG
z@vZBiJ-mxR|5pKJJwdS)XdjOVBn1Bf(<v_sS2{S*kZ<()e<f=FGk7i<a}_;S#RYVd
z7{BeZ3B5P*P`saQum$l)=@FjQh9#Ro*%u;D;AZ@~L-d^t-vW|n(nC!^0GN9eE|H|-
zk!eT&J(~JtTVle-RycwJ9`1*PJ=~nUb#o7g$#KK^xE|!0KyC{O<T;IHEs3Ls)?Rku
zt+qh}f44OgNVh0al=XZP|LlL0UTiY|uVmmqW=}$a%mt6|2^GuOZ>xMeZN~%D1;vu9
zs~fTW3sw|>hHvJ<r;ot>2mbDRM5Fl=E#Ccy%K}fi`K%n04KS=%DRCKQK=sgoO`eSW
z4iG;{aogK0dT$O_+iW&H|I{|g9X#@x4+LR<_u}zOnXUUnY&q>YG=O}Vg}4l>DqFF0
z=ZXnMrQz49?~2e06hV2SF?fJ?AbvBBaUlPq296)&srdhifn>xd@$}SETtZDAvrur{
znqr6%sAZYp%mL(7Y%iTt6_!2!KKBo-i$`nG@(<(Qb>C}$D*C~>;=ZV;-m4Wa;Qx7L
zf#1@WKP&$0hAWq0k)rseZWzl%^z++)h+=;~_$eC@I+ddqzkd<@Tv1ucRqB||y79Nn
zZ4lor0B!iY^6!6^F@o@R_w|T$^Iz9~??l~E-yz8_vj0eSihUv~YN{3<41}#$ls8M)
z^yZLOufnMHwp}bPy@;UzNIo3g8{tSHAD5}&BSoo4i;q8KWctfb%7!xDyrlh!V#YOI
zB=);~%CN&bsb5xW;?(+oqwZg{rvOEubWIh?aE~Iov*mu;{V3~ufxmCgR$KgA_t|wH
zg)4`ee0h+%iBG2f;y35bhIW_3kxX^u{e1a%^}QtzGDpUa%HaqB81_F>A;b5AigMM+
zqq!)$aT)aCY@*K2UqYH+V}PX;AswC2E?D?92j~A41SR=}@XpyJW|Wp?Sd<xpxmCn6
zb%T%XJspL=$dx^IF2j{m?4%IA&#;xaz6eihiRp^o|FJgT+D2s>%+N}up$MuXO7q0I
z2)W7$zarSWpT2`&-JrCb;MfM^uDPcCoMWlI<IAjseTlsVm*Efow~R~nBXXL1!R(Lg
z?vg@_LGqH$&S7$nX$IZh{V&~3)<quQJo><wGQ5HYdYa1Y5-PeqPZS5%$GY$cxd+Pu
zc!on{O%xa=^sMafhQYb@ob?AXc9=1TM#K#N{)thDE9Fr$kwFl5M{TSAf8c$Bk`Z{<
zM6J)kbggPajJU=nP}jSzBsA~LyOX2tr2mB-KPcYxkR(3*rs-o-FTOiP#jryg&q)M4
zJrV`r>HQ=PNBn(UkM9M^BV!*+--X=$AApr#xJ1A$7@KzKW@A8HSFZ+!Eyzj7OR@-9
zkeU!lJ_5GNbG9GfXuol`KF!qSl#WzbV0r1+s}@2JtmI#;M4OTZzhf9J`cS&(+Lr1P
z2VP9t-M?64LlO8lvK%&(F?Mzmf{yUU@jT7}eKfxJEe-x%!%oW8JBJUh(L_Mt{n<g>
zlCh}qml#=;Ouq}k2L<1x*-9w34xQ)CBz`Pnr-7iCWybUG;B8diudu}2gj3D--Nk8k
z{?zjBi^*3$4+hBo0!3iDwTS^AFHg?b;jd+lbYHwqkW=-&tptmU&XX&2H=ACDqSKto
zF<{lyk}cq1?X4U04PwZCa;x}5b@mEWV*J;v6MaBd?Yysu5ck&)1gs|8v1#@riIr;1
zrj7U$v@atHWz`2Y{s&MC7bR1T!cih})ZxNtu#b_6p0eRcUb)&NhNT8GboY1V{!3u@
zHj%QzVXmQC)3LC?;RWdMG{s3Vu1RrC>W85O;Ci-VGqZplq<3nT)xW-~RFncSQ4u}H
z3;HYlO4PW)NFQ`9{i$`}^iT*cA@_q3ubD;#;_cyjVgO>u?8DJ~nDZ6r7W&yQF^X5F
z|2i<gJs`&xpxxrEiRlx@um52~1=^MVWP=ik;)76&Y%f-Vl&TE2;Kb>#vBG~Sb??<3
ze(l-(+QTobuC1;87SP-32`+M4+;bjgf2+rTe5YgORv(#U8e-wW%ND}(K>l}5IN0F7
zNgt5v-Q))V$2X6I{?}K5<PUEB%_w9}Zch>}h9vh9)&Sfr>6PhIiZ0+BVgrcjib_r(
zw6<n`i6Wb=x6|3~Ceu2|20Vnq7isJj%GA>ufC+87N2|FDB7ny4>^owtIxZzel~?~d
zth>A0damJQ>^<p`SB^Bg%0_JgTlV$oQ_=hHNb&(`<aE`1%J|{Y&SW{;=ljm#)I>YY
zXvfD6<-R9${9oM+KY#eB>&Q7}^jjUTH~$J`(OzO~A(qzYyJ#{I8J$V16iF+0f*cpL
z)zQ>b&r*yMs4HzKoXJ+Ev>o!Fs1qw(3pf>EvcP=KSoVFq1zTHNtFjr{cS(qgNYPTT
zG8cqbIl%Za2OCtEf*oDbQ&Uq_XY<7*J0gI3>)|1ULQaK%k*2rpip8aQztcpe!do|N
zuIrvIoDZG9Of&nveznDuFnJ8U7;@GJu9e8|j&npp{bgFBWOBvu{VW70U0lUaUn0a4
zkf*5%iB~<sU;<>j=+1@r0--agmH`EwN&hmz^c(XVk0;!vd0_=|Y=zR>SuxuL{p%`I
zGJ&=*g-G4~zxkV%DJFm=ZvBMKH;-5;z?)wdrD0~~f1d%QQfcztzpSl3GBWHp&(L$c
z7bUQJ*#{$Ja;Gr#+_G3#{_;l1e)7$cXp)4FkB>X11=syhnd6N^RD6EysLe+IBj2Oq
zTI=m9+U=^9)9g5jp%z>WL#bF=s<atZ6S^O*p2*3;5yp7*c?f7Ccm;c5`)B{2p1qRx
zFwj=CS*c(=oZWRMKA)GdGkjvc?K7P}T413H7~Dts<VU1U3p>ufihH7#WznPaeWPho
zEa~|sc+KM78(59z?Duj?>$UFEtfvit&eVP72Xb>!j!a-rALh$TN-O^8BP}qQFw+bw
zCH_%5VJTMCFQtD-Ek*dJo?xD4%|IR>Y`#SIKq!(?gw-6<x|%GlGgQ)-OuNfT+n(=0
zEYWq-+2h!g|6Ia1>`F6?xY~At)#VW<_tUJe!+~Z#MVIXK3_F3YzG;W$jSDV_v~MZ{
z$wJ}dC2A#Y4Fxh`r%G=YAmCrXTs%wT7`q&c<$qu?9g!I{LrKjL%%%IB2WE2-kNijO
z?1pQVw4pAi!8Ms09E<yum-ju0-qmk50Q$41v@Z0zO}*Vm^10kwQ_bha#<f9~{l3xJ
z`(Y|Z+aYh@KQlBQrm>Q>G?g~SPgmK<!FHA>4Bu)D0bURoIbi<AgQhwZd((ClngjLr
z6hmkr*XK1i<_bm{2Mp~@xmmY{$MpOnW3<jMY70sWGg~u$?=Ik@3mJ)ID=SEu)~+=J
z1a6F*jcx;4V?XsBX{i$W)r8VtFyl+yC^!XLStp58T6sf_Hg#*^Yfmx^fo89RZOU0@
z$@%ykq1(WD5FI81@W}tV-u!O@2^#Y6qRMBvGI4;{sFP(GzTedyB=Anpv9#84F8T8G
zM8b#fL*qYG{Fk%F*<bO^&_Qnf(utl6W?nPE1cMOruWe%=+GIO?*_~HwAVCsEep}9P
z`D++>c{e_7&FeRy7?$cw-STQsv&86ES*w%xC##cA#_$+iqW2v}u?_T_6UG68jP55_
zn9I}La6U<6&_hpb5FvAJy;}x(H(N|zdMf6b62ktTyIR`$9{T+#9D5Qqbf5kH@|@Rv
zfB&D|cc;-a8X$f7Hl+yChCQl)3z_-dc)roCP_wN-ylKreaa=1~F89%22ggGk8Hzk`
zA*DdcY9$fd0kR;!z51|rS`=V|mF+fg#&1`2*R^0F3)-J4Y!EdwdenO~CF_t9gF&^C
z{q)P5-96P-Z6;;#Ij-Qo)a_RWrqNpiMnkkiX}r`9g!(m(IYATT&sS9pU45lJ)N0BN
zbN~R|{q$FrZM|<(uk~4LD})2{rmlTh(O0jl0o%bUq8a`)uV?u1EnOb~q3-)sK#Zl_
zuy*J{f{lzqGRE5Fcj5upFB_nYzG>TDAM;jh@HMhK&5Z6Qs)$~q193yF#|p++D?O0o
z368YllfM;wEnT*m0oUrK(b5bZ^u#GFnXi#$G4xk|*!1*C(8$r&+4cl!+5tW?g38pr
z!>dT}Hop632z)aFrfbD;|5N|qzRpQQI%D~OG`ctXd%pjD-nt2P9ZeUPa&e2P(@n@-
zQnQ^l_Aj0b=xsYjMv1t5Jh`!<JIq}vC6Wx`Y-Nn}9Eim?qWOMJbr5s(DJx^}+_#LU
zlKIY>`n4xI7rXki8MMB$^CjD&2IvMCA~G-dm7<3cblmdI_f6m@pbCg5bj+n5U!sUl
z0b~SVjsJj~7a!iz>r1YVQ@-^|rbXzMkB3jbZ@PAw8EoO_z)7U0<tStDhKk%K6bDBJ
zM_FF>-9SJP&{LOK#=cXIVA`Q@Q=gP{)l3bZD9TUgjJU_0_=kj)?!}KbsA%w4QP&k}
zV;=R(w<nC^46>9?@JLs;q8L;5yQXAHTE#l0CGGWFwUO{4g{BgB`OR;pBARE8hBvXd
zN+M91$t5=Zte0{$f=$2Rag<en!;}i_#eDnQ#P^_*pVAY@I#UtFJa*VkHlW#8yLrw3
zj#Aqdvb6Xe9Mbl~?tb~f0Y`e(s+Zqj$=vmeqw9RuO284MW&yRjqh!PHiSMZbnAE6W
ztoNlcK2RIx$`Id3kVD0?_iT2sw!JIw(4Ia>%45!2?@Q6|R}CF@^{gq<M=;Ck8O|P~
z_uX4R1zAsRHzw+@NwTp1QStt=<V`6mYJ{(~a@~04A9Xo3|BuS`SZwL$!tPAmhv!?|
zaU65X%kiZgF4LHeeRw{k?XxUdbDJZrTDY`vk(CwUFzaZRpH7dM3(IwQPjvCusuF>n
zS-n>q=@a3eJG1%fN%|aNqq{R+G*?9$zC;@jc0Nfz<9=Yt@!q}TrsD;+@0doC^XTVB
zWyDyi@xbAOh4K(r_%$By#_D1yWmF#Evhck@ecJJeIb~|LC-aF~${~Jci~sP6B<+gp
zjCq7PvgHTiKhBRBeY{($bw;YerBNvJJ$?zX+c3DqW$J+<z$_Fwrbk@oyAT3YU?6?i
zB8vUp!244B+qKnD9Yg~r&HBivSTz#^UIi$;|FGb2fK-P5hM2SnTWk@5{CT59a#Hqu
zwDJaVMFm{!y>la?3W8r>$~vwxskfHAQL)dho%e4yxNDS}nC@>&CWXBUKOO*KX+X2F
ziC;4W*7$52d-yCBatBfsfL7QRNo@(Qc^7WRxdYA>XTVL>9g!9{#*QeK7kvlM5-@PS
zo*KnYH*ZI47hQe6O-lDs{?<3^My%f|uGxie!qT^;tgT7~TtuCCwcUu@K>u^L6F%bu
z(m9W_$EwFuM$~B<;L@$)uRkgdUB&C&$d5#m(}W#9jAW4ykobh_hb<yR8}{c}Gtmtm
zL`HRsdbX2gL7ItYp!0vIc!=QHS6>s1Q-;{>%G;(P=xWjnhRaV&ZB7D=P}QF9seII<
z*v%o|hJ(+@tzJQOA&oA<2)M_i;;T#gmDH>G=oH5vC21N0DEN9Z?oB(ZU_hql=>0Z!
z3Dx|HMq4IzlFKLDVPbW{qN19+@8Y@vBV6vy;c$Kd=8L?HfS-Q*P0(*VhK}j<gIGFo
zY-5Xj3Zul`e1wfv@`T04VGrNW!ji^OQI7sUXKHD(*t3q5^~Z7ReO@`}+&MXz@XT1F
zQ)@W?$c;-9!gixt$LNLFyW`&{A&!{|z0|Q$QtQ^q&rFN9$}Z9C3tLyj!D$ywgM<ar
zOEvkKf|mW?6?e%d2YwaEOTkaZC9DCbGRv_UW*<?tRPVxkr?uaJOHE2DCqe*sBj?jV
ziaLC_AMf_O3{qD|<^H_?YD`iUheqRDo8fGm<HN$zd^wdGvKIlOUm1zX6QAQE&adOv
zRC&n#c8To6IQ61hjYRQhkWpqV(R)PMg>q#&!XY!K;eVH@?xCLhm&xPjlSk#-%vsIn
zP2W#MP-gfnpy&*mUE^csV`da#56&f2mf*iC4mi>zgRGZ$f3J`)IP<lp{43zr9kM~_
z%@wrwW)1_CgsW>>9L<3ifl97CZL)-aHL|YKFL&N^2sOFj62(X0ddE8L4qg*AAWLRQ
z^LkrD!jjaDeTC?RY~_!Py*u3BUS5YW=R3iX$2=X^BvJ8xEK0ozs}F?6>nN56DvvBv
z$n2KoeXl<yCaV{^+8G%!^#wrqB-F>AtGIrxsGBhI8^#md&&tbyd|sD4Dq7)>ViXKk
z7eBy1ng;wbax>WE;lhG5o{v?W9gJL!V&#RIe2*e6$!f`3mpftP64Zr{Eq-x!IWh(t
z2RN`kd@w5T^*i8)(^jsZurYReZU)V{@fDyFvFLXHaDK?WUcU3fVLCKD?JS;)|E6Ej
zDA7P6haqPw{W0CTwr9Fl|L0Sr5i|Ej5Kzk~;4J>9-rL!^cW_CO{?`42lOV#}5s1Ut
zPhdP>c1l=e)f$Rfz0TtWqt|TtdUd$3p)A~C)|#oOA25IXu5_9kw9^9nlvOYjhw2T!
zIO=WQdSHRsjAGpEmv9txVgxOb`JSbn^_fkTOAs0QUW^@&02t=b`zJXM!DrD|0KTNu
zPEW=V73;%;6r<>zhV%=zJ+D*yD4m(W$9FuEZj)^)ZKV5s^YK?(KyCtlcgeuo{<M*v
z`$R37ChY!JJvv`|17(hsdCy-v<G#3bs>GxSJ;2YF&%-0%{l1w2bOmxSe7usOdlX$l
z2Ds&tI41WIGa}c$K6b4n@O@dUbs_&B9KkoWCV;`!gQ+By{diJhg3M^S#gOWPT0?gx
zZm9Z&E#Bmv^N=Go5%A*zN!UTfoWrT38rEhi)^o;<yugq<qvonU0djp}b$Ps^v30f}
z@`<O^5awC6VdO_UK@C2oRg%V}Y>yWzNonjW^PbJ8xVnLl5&J1N2h`zHta<r*{pkHB
zB?X24{wV~bm*iMJ(#ymUvjVO1J+VD%26B+7o>Dso{_88ZHnF#4QPS%)wu3FqyYIJQ
z?p<$>nDWvtPmm+ev6xbq{JOgD(%x8bxLhpH#Rtu$9h|9}-Dbt?`AB-X71#Y$*e0rt
zT&NrCHzO>*(t8wA@Em;**0<T@)O5t86w@fksZmFHKl1zzpIi=Xzdq3jyzAj%?dW&b
zoXQ8wPITev$<Oe;6ss~rkR3IoFuH^`Z|r@s9QPATUJoa3QyLW#44aDKOg&0Za#(jp
zQrOSGsb(YVBiz}CP9n!y&v$E$vSt}FG=F!-tZc4mfGVl!C(1?5RFAuF?P<im6#M+&
zUOY#&%Puv-#0S<K{BWwZ^))RYWidbvO;4HiaY#^Xaj}ed7#ILDZM6W-w<y%ELNNKg
z&H8+jq*^=D5eXlz$Wh$_24NBV1RPQEZVt*}431U`-d9=n(H&m+kLIZAh;J^2M0Vlm
z*IX&=Hy#NmGX4{PNi1<3(Bzt9R?l14D_79Xv+`?vzX?s2;AZZuEWUxfnyqorw{1`5
z&;QP`(0JAl>wwgOIJ~xc!Gp|Vmm?a|cfJNPeGO}G-KaCesxtc@yL2wI`|fb_H<=ib
zw?i#IQ%D@8`vfP8I5`?%HZpeIFKIVExb`QDrJXJW7_S&`mL!Jzx?e!0uR|3ho5$X&
zH(s{9)%_>LeUuj9ZyIO~FM9YB2cuKMQZ(|+YCLzv8!Eg&N6F1>lw6LCBEym%4p`aa
zU9W`{grn#E9K5+J&ju7~qKB&9C$;V{J6z70Go9oFm5HamIr`;8jlIH25_XN?3`kmj
z0**1mvHbA6%Zg15<yI12Tfc?<xoszZFzxa@&0P?6y=?G6ZdMLR3)Snxl}^*#!%`QV
z;Fx+ojyGmCQ%6Ux=io*D%dJGx;|^?-`lnByV%g27(-t_?B@fI2&vPyz+jkjv!&R)=
zKnP%!`rJY+|8v$OAGA^jXBypOu`N@TD=7Mv4P@5CfP2Ew##NN5F?*X)%p38x^nt$e
zc=kAzC=-1M7IT(GRYYjso)p=biGUVrkKk1@k?Avkc@0y|GCViTjD4ckJaOKI@v-=#
zrM~qsek%U?^yz@`<pE;suN#oQlfrn?@HmHa8ky7;#k5z3@Mt`T_yekk!%lF=O!l5{
zAD+CH_f`Dzd%keu6N4<+t3bcDM6>_WgWj4;X(j``bM)@*+mBq2;^k0X9A24#t7BmD
z!D>z8tR#eg=4IhTQ5F|N{X#R{=Ny^c#a=<*VOlA_vR)zK?(>xa(8Zh+Y17qV;kQlf
zG_U6FlOD@gxlxgK0}FZ^__(Z6q^bOvR-9-8LT5#xBDbg)Z{2X8|CX-~By3y?Dj;ed
z&UyECaCs7ngF=NTGe@T0VzvPKe~aXt!=jWl5oC-BsL!*$yA+N55<k*>#>Gan5BOLE
zv>0Ax`0eQdt{nV~N5^|^Le+D5#V)%^R_T_6pBJoA(X9-cL;KeGj>!^UWQN{97r5T{
z^KRs{W<V~LJ*H-voB;}_{h>}WV8wcgEf@T-$adjC`J^l)c%k($3o5+~ZHMHIN`ukE
z(#110X9@4)hdP(oUTrfy_1GT@QQvXTbkRGEq<KE;oczlWCTs}yU~Y5S<M&(z+n(A3
z^Aa*%KBPRnA`Q7csAqNhq9n1LZSKbNXbpTll^3~L=4#q6c(mCXc1<16G5f_-F6<3-
z&oGjw;x!oPH&5!BL!K$e_k1G06%)YzJ5&Bc#FI22{=Tp_2{`)p+{}>}8DV7^QKpqf
z*4mIY1vrELJlSzxwxAR6rjY1B&opHhMf8hpJW|@Y_vOi)H+2BBLHQv)oj1mWzwn-p
z9#FGYmM_0+l-pcXR#Z^5d7`Q=%jf1yB|14ycfb0$w{jp8Jaf*d;*i+aHb5QFuZb{r
zUai71x$$U-ineva{4ZRA0Ki8|FP%y^YL+L!%d1-!7`4_#r8c#s7>k-u^O~0pz?>uk
zvLgxmKSZ{(Wic)+{Y@)~NWprAjVm?DDYNcXzX*SUm=)ll73oP9c6f>mG43-%_Z#``
zDohxP3`$}aLn=wEEX7y{Mln@;@yMQ>c4NL=>U6*PUh2Mn2`9Ls*bW1)&Gpr%7Y>)b
z){Y{F&4<JOg1;{_cCy|3eW>-j2Ypr}Mdp8g@tSw2FCoi)-5i(JLMBK?JY`y{?*)gv
znOGSkEJ$^paUY=-=-SAk#%n+}oq@7lR-8nbHII`wMU<Dy5|O1%hmXecSD>%4fQ$Hu
zRNNJruWO&0N<5kS(Tp||-<tkMKWrCQr!prwdEKe42$a$-z1`Sf!Pvk4#X5R!ep4ZI
z@r|TSX~^sOy7T4mtrk4;3S$8%_tPF5R*ja+oe_;bH(RAA3yglVF5AznVGd}}aZ3d4
z`l^^zNQs2@;c7HMy!?~~mzd_Qe)AP}Gj?yq6SM+0JH|3yOF~ai&mFK>SM-mXSnv*!
z_TC388G1g`Fxm2ODgALqctZbiW&q+Z490>{__Rr{N07^^zgQ)Dudj{<j)4R8Q>y!~
zZsO{PN{ie8dB)ecDCwzwqM_^3t#4rPQiPOI9dMf5bx)f2$5?a^3<#EV$@Ba0i^iro
z%jNJlpT~YCqgVJiFcT+wi@eE(g0Y9v6d(D<hEjt2tm*W!EUFGTyXe(2#JilEN#CoR
zn#QzN19_^w<q%`=T2t-@?MAu1nh=L@GHszJK66sbJx7Ibz}rghOuZhlYUxMo+K9^0
zA>H_xXJ?cVKJhowtW6a+$lG6T?q2AgK;g~jQj2*<)T_9MI6g$qV*ib<{})Xkc=qtG
z+6NHz{BPdvukJ@Ej2w_CCTS$=d-&P6t;FbaO#HL`uF8#20{k?uCh!vFS_<$uqqU_V
zmAR`6{%Cnq_qbV60>3Q^|JF~`6>h`#91AR0lcd27S!P9h$0#zTn5%t&tNd^Q$)kVo
zt*mz^lJ0q|@7Y#ce;Y2M7QL536*{n4ZkBJv7=Ul$V*b68tfj%s37FIXV*|#NgA^Aa
z=;DHxgP!M|nxns-W}*tl3O8fIu3|i49!PbLH22sf<ILo~RIxTmPnaNN=hgP;mNy&B
zUw40eCE|y^@%m;tFa}t#U!&ejJm46@euI9r_M1}3B#tTA!g)aaJ%eE?#OniVuPh*h
zaFO|sdDUO~)$M-nWr&&4RZEzFjt-Noj5jx5Sz9{SYZ;QY-fuc97BLdGn@UQ{S5<8v
z>P~r=r_LBfc9psnalR-Atr+oYDObaM74>QCy?B@W!iKI1u=(09o38Elk;yzx*x`)S
z+g}X|37I~8=1JD{D&_IL_*T!C=O>X9A#8z2bwj&xSNBExj4ZiCQLM^wdx~Sj6ptQ5
zUakgwK=NB!TfNccY9x?`eC2TF5jomSEtSCE*w`2;uAR3O=LTQ5Z<sRrcrZSWvdmJ7
z6oAO3mOpvjnC4pH*1M1@>Ek;2>cmpfLFv)0W^_L`>BQ%J39*$gHefCGXn(IGCN?AK
zs4mH6t76T)EmE$}%nwUS?NbBTVcMMYLUt7LJjC-;^rCkD6q56N`Xu^FB+ca_hkE3_
zj-jP=UoRn3w$DJn2-FyCfjd^LH6scEy8k!#{Bplf>`0J<Uc|B4)(ER(dp(mxHx=S;
z0L&;Wqt9fYTaInIxfuRL!TWH=Cr)I^jrZ;*a-FIFRHGM3PDGy~Rg2FY&6vWb?}aVH
z_8Pf6Ek``UCTGMNKfX-6h23WO**$%DX6!!k=ZkFOfcS>J_~oxG-i`JkoedWcm+>M!
zh70dV@fS5|>f$lJ?nqNH>TQ`P%zz(JudC1C4|-(=!}k>$Pu^|J*;5}r4*mRopD^Yy
z+|2%r$?CSkNCMhD%*5sJVcG+(V*T3mlDdLY_LR+^z}@d1!?<R>{<G!L_5Pc{XplTX
z^HKkuT!#X{d{5QKBe37_mP4ilzA7YXGE=+7xxu*KVeO8R)d4zKOMLx%lsh`qMRtJw
za%k_Er+*lTCR^_!tTr0UXk+uu%zT^;6XPq?pa)r~6(yk3X43d@rSCsfly5ZoEEke3
z_kzjeo5S$&4OpY~6B&c+^Y$j2``%xB3$$-j6hX9%hruF79UcR7r`dBp++C_+CVKtn
zhdrgwx*vwkwTDZKWD0iQZv(hy4iCvo8c!UlmO8$Gmtq~;{ic9BiC(3r5U<rnewu_=
ztf;X{sOgtx3EN)l5m}i>sCgGO{!tC~I+4vV{ho7bQ$Ppic;qwby2sR=H3}YPX#1Df
zk5p7H_rmr!%azjD_JltoCYKmwb#o9I-l@%)b@~<O#TI1bhR#I1V5PVxY%DQpp_7b(
z`n2KEruLkkOeWJ_dtI$#rO23R>f^UNfE&th(GubYjWlo9(=7i1rj8{Y)o-rm>-wWP
zKZ={HF8_;X3_cW1qagh4x7U!ChEFcUUwY|6dQzVY_hA@N_YlJmU+GNEV-hUj>nE%j
z^#_>ISKrVN38DP(4=T)%^E=A&gSx~2ZR4cRE{@{LOYQGb)WLt4BXOs@-El`ZlfR2M
zs$If!hp2%+i32D~x2Rvp=U_Ybo{^G~IhKn{9+>uifBtzTymRsEL+&lY_2RKY9W4jP
zvo>;x)F{xk_mSdK=JPB?!mgOTQ47oUwBi7)8Z#IbRQ}j!#8Pdm$!lJS?`)^*9y^p&
zK0Xz*YJZuWC8u)VYSv{1krXEm(8M|o`_1_sLMKWa{&Rp&|Jgn$5CH!+=Dbh&vY%%m
zXwd2b?tI2qYt+YAl>>BBAIgqKB1JxAnZqx;xf`=D3Dw&}B`1Dj?zs=l;UcP2MBgq^
z8}r>sT7djq(PY$Jh{%y#mq{qu5{aI%P7u%b+&#@pIwM4h<>+fXeaa_Xij;7e*;6I&
zOLk1(cG=de3OUJAIoQT~uU_XMzD44K-wfCV=bC+&PuX#q*0apE_2~z^n&T5;XULX;
z$<Or`-qt?!&p&de4X>HwrSt074o@+Z&#9?Yk-2LTcEveL?wr=YeQsRA5KKry(=zm4
zKbe9E0Y3<E8XUGzCFSVCOx*_UR*giwf8Kn)t?KJIFDdA>QDT^Hx52kwJ~`s%efW8@
z_fcgSvkQJ2czntddjTxLsV9)pUVe$6?g%IQN+1-3j+f}E-tWR3r{}qV{nwiWy<=x@
zr}N~+%8R9o9*`Z?USDr8C%605xPs#B4vn(4+4O4cY5S6nsv5>7ufse#aK;&*CVWdg
zG>_dNNjt~xq!D^Qcs~)Sao?Ac`0gamJ^4R(#|H*pYRc@GD7@PVHjJJRf5ejcF-uny
zw>_9($MD_*?n%f);(yM61`Z!B2&M>1Na$B63$q4!`2&g8)Rfmgcz<puNl@IeV7~&J
zKCvcA?f;>jI}_X!c#Zebk&2;2q!Hio(NK!no=XtoQ<5SH^JBni@0Zu+UBt=B#KO0F
z=6;U_ZYt%%Z%RG1j2h6c5(%@8*Y%jFJ1+bW-5Yidnl6o#q&6%Phy0`7m1?R1TqBLs
zjt$ylzHk7?=WOmQB&9LWUsw2;d2WPf-hF{w+B={m@lKswSdD8p7e~9f;NCb!{9@;*
z^Nda+X1+zh>@w^5+6$AjYjj>`ic=FWY^SlZ&}lat3|na&aP6h>%37`*qJP+i+v;i5
zr*gHfzyFUV<-8LdoKtz^`Rx3nBfV*@jeJAT#c9tl+)rGwEFkUV%D#U8TG?pPx9ziE
z=VB1pAlhpcUCNXlG)(u*&_GKQLE>x3K7^n;!B}PTb8QPbOX9QO;1bE;+@c7?`TzRz
zm0}A4zKF+?vYsP6<$0K#^vRExC$FNd3j$3@Imdn!nQJwm<8I@_j{Gz|x{O(tAfy!1
zC!-^cS#JsO^ZdZAiSQrDPZjoE0zOOa8%->gC^US18kysmHhs+sMxP{j{4~ikasK|$
z-*#Qg1u9&FlsE>MinFY>4DhL*53*P!r_qmRABXxM?Vkn&`!6yAu5TtGg?Os$BW#+Q
zO(>>-afWMA0Ug{~8z5v+r3Dtl7F3v=R0JiytUfa@E&Vi8W5<DD07rPG-e$5s{g_s@
zvlPb6%8}t;QCouDG>d0;#dT|4!K4L!TD*2%OuS7T0Y7rYe%L9SFakecS8|(SO0{#|
z4k4F(L@s@0J$ukv1Yc6hCmi_M;}yZo4GgKl_qKc1>a$_Yp!KK3n0cr~?|~O!xn#3<
zYnx1BHTt{K1)u(Dm;q#MEc0m596?x1kQleCA;Ka$b#O{Yxz}KL>Nq^9KV~P<G$K~h
zlM)79SRmkyfH}N-og~klJXf!i0XgjA$Y?(x|3;pHZKqB@5X{@M60}C4LJ@W?`V%FF
zjaoJ>`Y9_C|J-Iz^|0iy88+w7H>i*Gn%xe#PAG+6ccfYA{#KF=GX{A(G#JEV=p=uP
zG$bI8U+-aq&tMM=l%|EqqIS)qY<!A{iDnGbQ>Ep!OAKgrl+>*kWUu{310KRfK2@G<
zcgV{c8uMMf&3&EBAjY|GT!=?^JmVx20HVyc++f@ksI*%gD=+@g@S|&`k!>`LO)1K~
zRV=_4>FGas(HdwnR|@q9A*5>Na$Qy&0c-H>2FB7JI`i>jeJ{h~Cw>0)qXZ9=N<-2o
zZiR%Ad>bp&zCg1nwO`Xq!uOIS4;*a<e>Cg75@clBm>yT$7%`9Y^~?Jp(Xd!KxAu&h
zWIS7$4gSk0QQUht+d3m#q74_L#7Jqn!Azq&=?L3h<)X&17_rzZ-!tYlFfV)?eZ3eI
z_7QLU`0>)&euk)%>=|gwXhEPo3>|?wSdz}_AxM0@x_?GnZICe}>63AQVD6!0DoxD8
zz;Ej~=~w0=^O74lNEx11+bJQKwmWd~!aDu-189zFjx7^H$Q}0_M(h)Ir!yF+pOs3S
zJo&-F6wpZ?ibh;i6?4<4?qJaSd7+mwu-krMee!{x<S_jgpcZ7$F?d#N34-07MDuJz
zu%SN*Bm%4};mQ5i>%1RcAx0!F5wq@E8gQc=x5mpy2^=0kU7eBBD*Ya*$^=hymg3yg
z06wS#$Fy*i=ppE^!>-hCSIHRed$K(|F~{&RPMUSOUjl(f_hp$5MA3PKd&L3EaMVi@
zdv(Nzb1EcJE#fr#E5^WG)4lh6J;kZpZ9pNTY!EQH7m2Fx1X(U;f2puudKoZBb*#)3
zZt%uovJG>)fg|MI7fD+4-OK8|E|#{BjuFEv+;t?!cm`syt$lz=aS`cjvdH^J%)kBA
zPw1<3`|=kKrZY$RW8zib?4yhKh1&0*%z<PrCB?Lu{QMPrxsJ~rYVuh}^3)Oz`LZh1
z1F%hR#Z%oIY8fO0L|Js5I*?O^#s<Pmr@K*!Od>`|#!~ENoJIc~i)Rz|4LTmM*T*)G
znENA1OUBHiB$u6Ow;fH&x7fUndQSG9d|!Ow*~`19nANGJ;10VjkuiUe`aREV^JJp1
z7DoJ!v^<l~3%bCPHA(_}&~t~+vpy3|4Kpdn=UGtk;YhAW3x)1xsQkwr9R9piFYM85
zR+L^V^N&HCx=xCXtHa!Jr)<8j&%Gs}eOkNZP}*q*ui%Bf5iz5l)w3p^^UEb^ZFnNV
z*^J%ojigEAoDZb?@ks3wFE_?GDo29>7w4?&K?n+msRhp)hkOxNGLZ29<C`C%k`!GO
zuhE&{oT=ugbtJ9gId>J0?wT)VWaG9fh@Jr{#x7&pQ<gfSJPqGXV5k8XwXy#fIEZG}
zf<8o+yn$Eql%Lz~$gUJFyS-BtS6dJS3%N}aKVCd@KK0CFW-%zlyf0bE^B)lT?XLuQ
z!PSAcHR!nwGXyLu{DDGy1C8Lx_J~eRpC1D%m>{D;=|FmQf5P4pQDe)F7M>ZvaAM<n
zlZ8~Z>t&jPftjOoE5Y5{K4I323TU!C_TIzG4m*Ayi{T5a^^r>R9fw-P1Jc{{k{7EZ
z0*+UP&(R^=Y@bQpTl>R&Qr=o9HLh=Suf@k{kT7lYBGH2rui^=KOPq0qv*{^P7r2gy
ziO852D%OVhW^C=t<m)1ek$%k2tm_&NI#O!5*8CU1XE6sWif9Y*v?0B3*ViyOlR@43
zwqukRp;O##E6JlB9)51ive(Xfcz+NLfzcb5O%$^RMLk0@FQ_HobV5YZQUnA}p42=h
zv_tLvbC0cw<=&d$Mna-RziRnB5ut~Tr($2Dqpb0lI$=Q3#aF-jHeiCj6wb;I7eK(c
z+A4THhcp*C|5wbLC`_8(Wnk{bv{?A2I)+^y3HD2Bk%^;NoWN__?*+^USpqWntO5V6
zI?eKz3KM%qi3G${e|83(a`Y;}t5Gvq4k+G4Oqmmwm5bbOZEb^6S`mD42x@96kWacZ
zus=LSpsaA~N3}zZ{TSbtoppyi>1DMIYVh7+H+Shw0r7b_#sI^3hwA<b;hnGT4o{20
zilQT~sNdB7m!Enz7et<<RP2J9R=9>SUwiDwEMg$~m*oFoQqN{9e@4*z+4V;9(y`1J
zcq|VTWTR!U%SU>gs!Yv?hvBP-s#&<1)CTVLJ^h$+EZNaaY3uJeLz!H)r4<K1mp;`;
za?Z{SMf+@e6b_kZG>w|_h#omY@`Ln_m|ym&d}{v2^I*5ZLP)vuLX3TH5g|Te-ZLvT
zjgx^QbrTkxKstaNE8MX7R=ayP=T+)|)F)CyCrECoKnALo7woUGTbL(+?mZ=z#>g9i
zFV^Zz`oG6Lbg_sg_LjQb?CcXynWZ`SZU%))m<`r4*O9bI`JP5{o6+Y=i%-o3>P=`H
z2D&IwTVK_})BAtNjWC@EQey!Y*cGrzz6^W+>y0d6nM#X&BJZ(SpT-}}uKMlL;!vN6
z5Fbh-refs3wH6viuz&_OLD&0<*~P>Wma{2-DWq{vPiZrs+~)|?86kDB$bQbDC+hoe
z9%{?p=uMB{eF?3Fp8HMenl%^TFVZJ$eekR|{rC7+&zPg!c79onGEbB5{{L@%;GLjb
z-Yk4_&LwD7H|?+Ry2=3LI^f^g8X!K}!be(0YUz?Hesb@OW=Z3tIu!}o2u_u3$n7Vj
zugmai7a)FHLs@yut2LV`3Ke<8Zz`4Ub96tmN8Ap%{~NdUgJLC#PO-rl_w`t2slm5S
zWzSzC6R(4s4AxCjenX{ec0Z+M_;lE~URVsVY|G=S_&So3rQGWrKR@6gUR_Hxjsu+R
z)jj8PN~#=2rU(43Ck{t@tyXJXyrykmD|U5hF@57Am&Z%Ny!0V%MdWaFM_I3F5y*ir
zrxFD$dmRo#dY+}`+qe<n+X)X!?9p&v)_o*h|9*5>c-Swo-?OipsFJ1Vrvf}JOK9fA
zS%C*kXaCxT_9>+cjd)!K!<NA1R<>;D<@Xiykwsa|>MyKf_vfA>gZgQL*5X(PTl*D@
zyEPc!rpr1swq8jp@y{wD`Qt8%RCVl!=aD3>NxuC0Z)M7Ei=8-6aq+q}-0rabwz&9!
zdi12_!Np<tq|ztCo*CCfK0^cTad6}N;ss*35vLlR$iX<)@CZucDq>+hzKD9@4gn6Q
zo^-EypNawLzQ(rWp*;-xggoQXle*U-F;-H{U>+ZXrCW}i8`H-lf_ci-1@9Z#s+-(*
z+)EN^1;_GZ3GhpG4-zGXj;2B(P1g;DYk$aMTHf}c(zb<+yl`8Smo)P3oXv7TrKs+F
z>z5CR-u7@Xen#wKvn>dqY<|xvfqj@)MdMO%1EpH>iML-Ocq$ikeJ&?`?%b^3_mGrl
z&IQ5fkO(rag)~(;x&;IAkaJ7=+4*$-w>TeBM(p%imb*Z8Uc+bivo&gz{vd{OuO9TI
z$GKrbbJDe)k-{MVEj#T_u(!i73EXS;o?lzyuIh{Z4S@!o(hq$z3BNRmm_~qcm>?wj
z3cAr_rj>UI3jv3n;!63QqRu{1m%y$S^P9A?d2Mdb%s4S`P~Taos~C>d&wZWB6HdJW
z(w5vv?XSr2`xv4gQ2JpjIE4_sLCQZ`qNP*<I~8}ToIe-vw~jZhvv(=cah>`K^Mb!r
zw`L~2<v4L2Uzb7^-1^ha$fwT&#h7$l@moa1z)MaeNre9ttvwtvN7iQ#L7YFYm??pI
zx4U0?|NfG983xP%>*8xetzG+`qeJ0r?Ju9P=puWD?ganXMcMGN!Rkd)4@CWWF9<+{
z==E`g$3Hz~_N980KBfqgFGi)Jmy`0PTJa7;&E`!=_S!u-`N8$Ym4ko$CjY@G`8MGR
z+XerN8~@_nkkc5RSX|H|;Z-0rN^bcT$JIZ~2W*f((DN8LsNFB{I_CQMd+c{nxiXCS
zedCNr=@tQ@E!v%7B(2&PaRWlHYPaUqa!gmGEG7)SPC{%$lzM&l#1ez{BNubCp$bu4
z@g@qDASSot=PrKV>JeX|4eS?y4?F?Bm*|qb*dbiWcVn#A25f*Ty>@ocLV3gy6zWX{
z_j}Da==hj)gCXPG;8341N{w(I2B-5>tBkQOi~f{-flM&{{F;=b-zaYzW;dC!P%Y)u
z2&d37RS+$Py|+1%2V!5@Z=B($H=+@C54=K1z17VF8M16~<)zc|Ef*ur!X(mM8mM2_
zV#sD-CZnBM7R6<^CnA}o_{?Z+MRa7!nlpfj;oSf@<QvJAN_a+@BAtFwHKJZ#%Li(Z
zu?A;5K}L=S`i?6#=lvG4>kxc|P-ZFH&=*b+6X&>1vluiv4G$bs^JjsHL~=AT1ALw1
zj${J=sWL930hR)u@;<D5LTwoCto0dJMY{BD&exqecPE=FE3>I42snRhI-LMIt+@ck
zrp>x}*-P-hdXt!@v_Tg?4kR+zdpoV*{EGMM)D#AASv)T-`4=e8R9=BA8nh{2%7HPT
zglBH9z9ZAqFoxORpgBBpsYh{7q&7=A^amHO80~gBXGV*jRNL;Zg2?8(?a=V6uZ3p8
z%?+Nr%T~wg9Db(Hh@CTczA9{y?}%&lsoG^|7LJn*!*s~=wTqMO_1);FT2G{w8kqfe
z{83W2mWY{-`PgT$%7hV<U9Wkt2EaFPI%$dO_IGbJW}{mc?eadTZ<$Iw`x4;brR*ch
zfTAbc<lTn&f!c-m_W~Eo@D_ZJczsUmt%e~IY)(vD3o?0Az98(?NH$`xa-ey*NN@Fa
zWP3Pu4=@}NZ9zQjW#BtyQK1wf)o4aJN91~tlh~c^_u_b<m>Bq_aM+N8=Wh-V-PXd=
zdTq}V`mP9=e>>Lvlz3pKq|T@Q@L~4K7Gu+{c=JA3%U8qa9|=ud5r)}i7P0ML*anWU
z7YWlINN<tYPZ~c(AfGBbsUNd=LvNp04F9oSkiIT~Sv1h6JV}1h=2-X*(P<jS_(<*4
z_OZlh!CJt6*&$Nc-dV%Q#;I_4r30A*h6!K$mP+HT&Ur1IO^oPqzLG)7pBd3LoMn&f
z@7<wgoQo5%ziSi@$)gESdO=^8aHn4=dg?O7QOA%UAQkFs^+9pFwF|<!FDx&B`|#>~
z?rCncKG)87R(~c#{wQhTA>;##l!Zjy&n6Oj(ikOE1lH3x%Iooc%${lBB02N6($)UQ
zDku@|&926S5c%PNmX+8kN~mkpF+U)0K-SFbAt;7_?fTzFWgh?fv1iPo8!1ENF@Yv9
zoOO!MFqsS6wK?dQM}<0;e4Ct8s^6-2;?aAsQa|@o7sz_4`Mzqcl>m#b;8&Yx$reY|
z6O4kM5j+>WBKnaj8`KmG{WuH|eAiNGu!Vl2vTEL$w6{ij@`3rR-2+QGU=ru*K|VP;
z=!b7qGnlYTf4@=x`^W`?#2v~m{baxV&yt(8)X|;%q%$KUh|mR_*Gb(BA~FVZ>ad-r
zBgmINQ(st{x&TVPvkQQt1WFD24MGO%z!L&P{%~SQ=f1(0Q>XsGMfnNJd113@Ha<}Y
zLMJx}?NC*;bo%wRUzT1ftPW@S9c@AgG;MrE$hz1oBdCE!gaD7{cPo?2C&9W_awgp^
zCVqp?JA@pBc}bH{JHN&kwv(OYzRKF-ak#CQbc8~nSN)q0{M=+RCy0zRAOK1c-rOQz
zhp-6dDhMoXH~%+?HjKY=#5uV8a500JUs9vNT^a#e7MVy)^*Oz`_LZd~lQaQQ%X<`$
zy6AB^T#gdZc)+*C^*wO45q=i#auCQMNz{O-)y!xy+JmnQgniwwZM2bp8Ddgz-eZw7
zFc{Irkv1yJ*OYDd+Vj|NFO3tb9w|_DRu9bV>*`|*0~i4LTT~9{&yn<N=>34`6yKAC
zBk>Gwj*JI)qV;Qb$i<qps?v2Y<d2s3@F<%sGaW3t+7w97`}WV}{RQfa>+pifMNI<4
zkVV#*lvqn`FEEsjMBHBYSg|~~aUb*zyA{l=bRPELF-sk?omzE8irxqD<Sx-TPvM5K
zchCeBs4Uk0pxrPISRwTpu?Sh%oHlpfo`J(he`!nAaqX@#NjbiT*~=2!!r<qb#M#Bj
zltS&|)cqv|QljyJ6AQ1n47CACbYldQV83=#eN-Y0Mn6U-bsQZpB4fRTqH*cnj44@=
zY5^IW3hYunW;r(!A#>d6XcPa07u+_nZ2XRnST1aV$8EiFyE=rWR6eZVQ{$ROcxPQ6
zcIA-7Ah@Zlnh8DOZ;mET+El%JG0brL-|>t9`*_H{2*AJ^8ddh<Aey2!Ha#$>4!aW2
z0%hI@Dx8B3(H|C@C~&>ez7>3e*eIbkd`!A6@{bQJ*~6}@RCN^)m&Rs5&RZ?sNX;x{
zbOkQn-9wyS^Rd*utiOAGaZ-&w+vT7)uq-s!dN#OITx+0RZM9NaFgLmKB!5kSWcwIE
zzvhR3l;>SVb<fB3m3%<&{3OCr(Ay#!VE3=Y1@m2?o(NjOwNw8Jql-^kJfV26_u&Cw
zC68aN#tc9uUueGg{w5D<@NEg{w3BdrlK`^;HPxe2eqB_Ofkz+dylVq?XP;@SNRNhB
zHBoxG!7VX-SW42Sewc~Ef9+x7tGuYZi-~{_2se3V<qZ4nk-WSr8;_z|{g9y#HMWUG
zziJHyGqzUZJXB6-{N@5Ce-id|-jj15O1VopXo{dR-y<Ziv;Uaf0Dp#YxF}e2cD}WV
zsC7VAd{f*G-_>qb4KQ98kjFj(U8Ax#*%o#WP+x*Qi0_YDl$suCJ51MIPETt$U2vB+
zKjLpX|JYlzs3MNrnwRQXz~I?wI&Zr4dPg=4Xw6Zb_g*<!+#+uBx9`cakXiVJC&X=!
z5bWo5JzYZY!?>ReR-wlxdh#+91s(uXtfU1Xv)0&T{c15*8^!aoo+H244FSU~FV7iT
zuUX#kY<<*23fk83Ole4-Ml(NP=#OQFWYNV>W_KCw*$_sqr8vRke2%0K!XxTELK)l#
zgXSCNvww=%JurV-BK>U64kfkY*vq+dmUj4FrK9bF;F!uIprQA!e#y<w0$mY_U97%>
zmrjV<j`CL6PgPX$>CDI*i>UMUW@EZH^_>pLd0#EW7|WEU9Y@QNCybXED?eC;E$_qE
zN+ddZfLc_McW)otb;k>;s*IhfN+mjWVxw#b#@7{bUOpcu5UhmM0zm*%{|jHu)h|q~
z5wM$$g|nIn*bZbQ-7xVM@2Z?^Ds;>e=X~r9)-NCO!LFCvebvIVlVGitL+LRokAVEk
zYe8tf{`vjEG<9M0BD!YnH32?hX?uU#UZXLb^>BU0$qLy2q8%jcQ;6Ii9)teN*poux
z2ey*Nlh=7=3(Ve9*UgDL`+lD;q*cI~(wZ5Mpqbei6#Aa@pRjWZW&vsb*?szR%7A5!
zt1qAfj)lB)>2~kH1DuthSX%OER?#aY8ItQxe4&AQMbAA7hEPBkNNqFi&Kxj;orQM0
zS;9GwHu@3)UE0NrQ?nQyeloDL02Q1PAlD1Pdf1!pHTnqb9w6+69GOU-s8Uh*j|M<v
zPdQQ-84G1Qz`iG^kYmZc^Oc;na^9xhfZ{9t&!k^&>vS}|!4<|AG~F^ahE#V-eYh^T
zmCEX)*%yC4T{yJZXfj@QPzya^GA&XHKx44VI*HXHQ^%`SN*3rwmaVIbI~)>-6)ooI
z>1sPa7%}}D3TZDJaw5mM+?-<%XhrSTww+_V29>{Uq013Ky}t3Betw^(`S>hncq`&)
zxf@?36|Bv{Pn_#G!hc_h+0WnEtGB}PCuA>)_PS;<D-ILcUS`sYhx{7NN<)YUc((MT
z(u01y3&|I<EU~8;b~6YXw0KGHTPOa$M}NRv#u=c^auVILAU=20Q(Q&5ofCr&ov0fV
ztW`Kz>c07fUPOv0&h$CdMkW{sV8&oUO9h1`ry4Wx01z<HA`)&i`6+~K+E@`vw*{wm
zP@OAnZVjmNHXSHLY^^LS&E4<o6a!ys30(KXnzY7?>LVpF?_QWWWd3;O=KyZJ0BSsq
zV^`A+jFjnl+vLA3D2o%@rL(M{$Q;8N;p>_D)nUhqO{CM+i92;V*tcQy*S#+J56PD;
z?xk=ZpSoYT@C(KazRKU<h+!AGDZU*M;Ui*BPc?wa2k(Hvp9`SAY~?ufrQfAjC+~=T
z@uoXthKlm`8_`kzr(0I}WCv$Jr?9~Kle%Rhq8e&DfIqHs6-gN_)EN-=0k}<ahG%ca
ziw%**3!^Zo{l?{^G>8lMPvwAo$j7Eg<?E?M$Gxj91asUD@0Dd!{$f(nh*`z0fc=h%
zI1bPbLFRN47M+3ZjAk8b*^%GNz${n3E&sThix4Yqd?FVXRn@k#4y;R;*5TR<U<@JT
z6_Yp0)T!xbk3VE!Zsq2aP_1FE`xvcNeXo@eHN49+PZ1i%wc^is!AemyJC08!{(S9z
z&O1X@r*8F>#rqFR*7e*p>~ccPy5$YF;ZXm)6Hr5~Y)74bGHh^H*E8sWoa(Kvr#ZJS
z(+S4AGt)ziw~Bxwn(~GRC*FTJ+3w1*B(qKufW2eRdzTg=45KV5@+YjYmo=+(*ojho
zBqWp%u!Ap9(Wer?*C{d31NuRB;D52Xq1PPk8K*Jt8wT7~*ltaVJ92z308Dyovfj}!
z07I52y8{R<4ktp0xA5_G3f?K-CXc#}p7&a4It1olbw*10HuSbic<1%-6I-H$w0NP6
zZsD6*YYxLoqZ#16PXyOL=c335PBb?))S>41<6xk~_3L%&d7w^_G2Cc)dortO?Hz8z
zr4RfWk_)8E=S{Z1_ySwMH(j`zP5J+@b{$YnZCRTh6d@D^5hXOGh=3qfNP?h%R6#{L
zN)ZL5_Y$fIB3+P<(nP8ty#%Cp73nR~A#?~WB>Xq{-prddugtvp*Imn)8wmIAv&*-?
zz4y7C;rfGeBc-sL_m8&J6BM`w?vIfA^-5w-RnAON;a<YZ9kg|TMlrm*>%%aQ83*z>
zFTL#YNjL3-?F**`=t~NGSs4r{G!q3X^Q!rEw@dR|x&U~>*9+UtK(17=xVM<rZ@ZYf
zvY(ZXXe(^5VHq<l&<rz;Yi(!<&zh_!)~vlPY7-4KgL$DB0*0+#US_NC*v&O1WXgs{
zHk89zw?vstqo?yNQ-!<_R~kAoaa!b6`+;LO2$*@)x@<$NcB|+5CcwwcW<;ySa)wEK
z9^KjMMYgS!E0Cu70TES)H0N4kItAtMHP;17x7pW&)}?I@wY-fzFa)04egz|gbEsS0
z(a~`F(6!$9oF?Mvyj_KhzV~oFE;@)&69ant?u2&dqg1+{&w25?uN`EwY*9O<gP4eY
zh#*fJZ%uLYS5TG*9RLacHE^N7=Wqg(6v+rT0!LcCfxd^3K?eTdR8Xv3wm1B^59y6-
z&AQe4V*dimm{AgO!;aLbb$PPKx%OuKkY2fZB2;zGd+)9G48Z@!0Nm;P6-$aAKjhL)
zTx?8E968*|)|v&z*D*$zN*%$D_j;`d=(31KA7d}g0O-}vS#KL{VkI3ooF0Agf!c3>
zJ;FFIRy<uVirjqahre<UzAmcm60N1SYMdQ+*F+VmVZp9N+@MY1V`MN~N6Ybh0zXpu
zUj<H`Cm2X#%jm1ikGzyro};)BuoGd^RM+wI6*GubKbtA!Xal)`E2+&N)j9}-XZ|Ru
zDP<VeEr>dY(t<64BE#B|IdkB!MC#!k^aJ`;N0z?v)N5=H{9liOpDAUZ#$HLET8^7<
z>nwT9Eq$|UFdHO3{ur`oZ^(2cEjJEczpP!bP4WTv%8e@iBxM=8&uy*F%Pet8v_>14
zL$#U3V^`yR{V9~1PoAl@zN}riS-eXja%Oa+oy5-?X@DqyrrrLm`ljDFbbp4yZL^*E
zs_f^36n|!+#@10cs}zf)7Y|8iftJV;j?MWaJon?|{^m}@S(`3BMMuvfm0}#XlZ0$R
zwZJ)PnKtq&9X7Z``h!#`=`7HxPL(pC2mQ&wTkN3vq*6E$hZ{jgY9c*PvOgSgCvG3O
zW2)|iS&n}b{Pv;yL@@wBY-ENpdOu9Debkg{&Na!1&j#h46RPJtayw&j?Ab0-t<G*+
zhhgevM+17#m0mJ-;~Xwb3-3L<U9S`_xJKeTU$dQOB=+XVmErwTTcMZw#cYpc>TbRy
zHT&NERV9-<)jjL5w_h?@Ga30Fd&M=4huP20cKLCJ4rLG+^25vdpjS&>=HeRi$ndk+
zn;ajM@dZhg4=y?Powe!q!q;y@W{%Qt<*peod~D5jXP#c+SlKfrZYZ1VD7PB#*q@TH
z!PvybYl;+GM%b$Ews|D`$v&)Ng&LNVXUk)EEi{Z)E9ZOOw7w5VI{2xivO<Is7F?ZD
zF(Sb`qiB%7H*C+gV0&SB(79a>Jhrwgiaf$sJ4$of4Sb$|+#U1b9-l{Rpnr&y$%nym
z9CykW=o3Ul&jv7arme!*VVp`Q4FIH%K>IP$o1)UqhNm5~yE@MKB$W=Tu#Q<tl7cON
z@i&`!VG)6PuV)iYs0;B=UE#iN=t3c)d8x|H++oLe=a!}cGL~1F_1UVhvw9uEuU2&U
z@sXmK#(3IV$$RV;OYUhW!n_564#A<p=9E2a4#l_}=^TtIuF%X$cfXg9S=ctB+^W^%
z@(KJ`oVJle{&y$YW~qE9aVeVfLiNbEg2~gb)Zh64%>pg}7JpLnm~%}ujvr^x63RMz
zCFn@W`4GkKpQ+jW;;8Njxi-6cBJ$vCnZb3*xdoHMJ|IWYjpf&wDhy(ZN}lXE<8*XI
z92_Y}10A|Pj<g);*sxarq~+mo9Z~FKJX#p&Z*skp_B=3eZnwTjf3W{)%{C#=@WOuG
zInU3nK#x<*<$@Y1*Z0UIKDIqY7m*GP7p)Lg2%;EXP$`zsJXywF4INKagBM+Zc-r4C
zGWrfYAinye6&o7g7!JL(J1#z4O?G{vfLmH{3IE*VS_IJ1%enaG?fd!3$EmfmYA*g!
zstwTl<-_|7n2!gwT|1*2Kin?uXy-68`=2pWfz$~Mu>Wau3a~2{rRmBit&*8Y%Xs%Q
zJtfVwZ5=&P_V+YFWRI7+FHutpe5T4^pw*A)gE)Qv`mN53t1lP7K34MhF#NN79m?Y?
zMyFSX+oop!xxj%|aT*8-w|MK6IGy2?dmleQ$9bzFtpx@Y;>^EQZn@!i#3x<*$Z_)i
zm#q~D(zDqjrICjBNNri!+#|iTJ)$myxn|?FxYnsJ)}xnaF;;W?HJ^ZSW+lJ=C!x8G
zjs`z}ik;Vla`GfF(1f%fkTjq--`l2|y<#EM20W;f>m}0>zxd8FCySUBCDX=$X#F;T
zh%#;)(#Ct=zn~^HPHt1U*@>QB62-n%17NeF0CI{Ck$OeN%dwb>H3yxKpD`@iax<`w
zTdr|1aQj03sXKM|<MwiYFF0%qD7Y__b~zT_%YS;tMtRS!={|laRzZ2?f=di{mQ4J%
zmyS+yHVf@}=}TYj0lKBZWLrkP=I9wyghXR++4(V>PLI`Ljn(RT8koi7{ZvFpPIj_c
z_4FL*d{N<;*rjt^4qI1DX7-s3LoPE-2sv+e+oOE39*Lqudre;+Tg|T3S=L;8LVu!7
zsb#Xm-2R!bMS^Nx5d%%w#d817yAzFO{N;-UCtTXWN4to!rQUKoW@np<jax_N!E1F#
zJu*^<&k#rfu9Hh4ytKMG8Xw<nL%taC#pI$^_NQJ7&H$r)uAL2eb!hQ|ICg>P!vxWf
zI+#AEI(J87!-&L`L$$a-e8=U2Z9@fvfoc~)*o*Gbvj^FB(=D2fwMT9cub3~&80SgV
zRR`IiGaWaD&6a+It9j|KR=Q{|s03>Vfms&Fv6J6(Z8}s&AE&rg>3c6W<CRzukE+H*
ze?Sqn2BXs%kHam>da0@nFHL$uusTnPzUQaEBSwu^8F2#yb)ZX_$_~i=Gw@iv%DP2Z
zPlNit_^CZ6G~;c#)VFJH2cHy7`&v}(7iY)KfXc3a+}RROY{k{$$vRb>wSi#WjXK=U
zb%X)a_eJF4re&9y9wDWSw;hz2oQ8O=zum6LNnPo2g)F2>G*X#$Hztrj$Og~%L{~z*
z&MTz9$4;xgX`pUSW`7_kde%4>t={c<d%|Paz#ug7Q|-c$*!@#RlOB*7ZuM?g;nj*m
zvC|oAl!i8d_W>G5+JPiGV*6sXqoh%S*sD*|ld%G?Kc?GYItFaTUu>_iSciAwAFTS_
zRJbIg{^7#)s*m%AuXdxt=e)R%PH!%riRPZTLOu5ClGGKPSB|3;=Rqyk-iSD+Ms|dC
za%9pG7$faC!cBtlRRUzBev|HK>%~!+yNO&83TV*c1KI&L#c|6iH|)YZ&IPJE%yn&I
zE92&Bru^Eck;uF6C;6Cqe%%W|LpDpLYINV~@mi6*NfQcV@m5}-bnrX3<{|nlg^iCg
zH``E{IwP$W*2q@8ZODbi>s45C&#THiUpvg~4ZmOYH&C|Q{kS95EZQq?q^UpH;`SF_
zhltrPhm`!1##>#txCDioQw<5c6%|>=wE5<l{SfDuQf5+Y6&r>gN`qACFfnzn<vaVX
z-q(!fL};BP-ufTTw^`KZ)&;$zAREln=`)L8Spm&;C5x+P$>86FbMH}ljJu-q)2B%6
zf$%<n3jV?Qyt=h!-gSQPlvRK3-L2SEw>f4v>`Hmf>^kgcO2F9Nh8-*E?EsnxnYH-$
z6d#Pg4M)HVJ8y1|+O(G>kgKQpS}4qzG2%OAI4Xhq=_c@~GxC>;`MTFDP~Q^G;tZTO
z$`J>{Oy6)HEKu>Q728o%v&$tt>zyiI%O@(aDZzO6wM6~rEz`OO=<?8WmrGI*U-f#O
zQ@6C#p{t<NmKp>7gJV1|<(%%5inWB*-aI!)uC&mwrSDa_dXRXywe*=(Yn1`lV2};W
z*tx~``!$eFgna=XlSG>bX#ci?naA!~%Vb7@gIhpqaF*$XEs7Z1zW&fZ(|-0g{>-Gq
znmm*3UI3ESP~xqZUggGf%fs$PXl$KY@`x}dlGnTX3;#nV$6D!2{uqF-<ry?&IFa?8
zNikMw2(fWW;K4flPD$_&)I!iZ?{kuy=7>h1aNofhE<IC-{*1@2aX(IRid_>Lj}7)g
zIrK<s?~K~OWRl}HfTCY)U5D9=LEdF#;g~92H1{p9cV^#!B`Hp5x1X<yOr-Op!5@qk
z&H|LTY^ko8gn?c28O=gNE*@o@g@wt&)YRnrolkalgU_8>es;HLF_3A#tu2vL*1YV>
z@L>jn!5qetGi4BEipetPIfeb;lo<PMK8pocmNSo@5hfCJiudvFOB(LoAKY9+T4wac
zC*yXiqp37K_9EN8;e#Pad{ngB>I@{M9nZGM<LqUm?Ti#Fu;HclY5@Yila7R*>#1wD
z)@^BY1P%$S;wWq2)h#+co53)O9R+gCE8I!0ACLu9J1Iuq7$;_7u5*t0SQ`8Ir#7sT
zW4#nP!@lZLmFcN&B7I(Ib>?=efM;oLe#_OvLQ_F)PN}ww+1i?UR=p-LUa-vQP$h4&
zJdW;<rV^}y#~y9K2n>16rlh2#urZ1VHeK+{b3VCzR!7{hG<4p1%DQ}9ZKRUFrm*H9
zgiz8LUG5e+Lwh*Md4x8L8%$hb^)xQ#*DK?nbK=u3;P*PfIMIZT1#FI>3)`uBVQX=f
z3sEmK?=;@RS5Yvk#|ujeyw|odf718i6~E3wqUX%B(<jt`t|Z>pa><F&j8zto(V>c6
z7XDN#w}lA2{R|>(z1IOx9@hqj;b)iz6CGQ^tM57YvY<!84oUn<lgyv5!8B6a=xcM<
z-lQL0#$k7NJRi@WldyPGv*W()(Hbq1bzm|8pkJWT-8l<#zMyrX@5Zfh=^G#JzcMu*
zuns2iE3Dr6a5nV=7({cHe%CZoAh|bkOK^d|#JrZPJd8Crdn-$Yg3M)Q<Yv!xar?fk
z6n&cyH90Ou``dlJoPx2tg;EEA^~D@`e18cLrVXC=L!``$`t%U#=;p7jBk0rf(pp|h
zc7~ku&wsaL_t!pNWAw#{()3Q+<ww_XN`2%dtJAcuO@l%9ukE?2^%;p93KAB=xBT_z
zT2UFW8N`Yo(s{@Z^h5*cn;I$n;L@F<8{V?uhH25FVG?~&><n9+jQ#jXsW%<&ZLP~1
z)O-EjJC%ov6l7?n>Li5kwQ&!dqr<8+7;0y2vX?yXmXY`ac*$wYvPX&cD}2U(2pIQd
zrN|V-Ia`koeGngn^ou&^sYz<Lj)f1lXO*p}#RBtE?H5+<io3^5%>1KMrU#9@BhMi6
z9d%0hDwn&cAN6F)wmwew^43Q^y%!hg&=T63VV@a-U-ZVUXzNt0voLWL#VvoDR>SX{
zxvbAN!uu8e$zGsjjuWgNHFEuCr^Sy+{V#31N4x%c_<1A2H-&c7GMPzK@Q+HQ)IG4H
zsW+ja=jx?#!3udV#33T)HPX0c2Yi`%_fBLYur0`-ldPRitdPNEkzIP8L5Uhut&&KA
z!LZCZ(_9uChlci7o2&*GcxRVBnJ}6bHjs<WN^#OS%AR$AB?xw)H(FU^m-=%@p4k-0
zdcrE<3!<ws!1!I6w@m4cj_te>!J__vE#sm9Mv1LufhVBgppxz<@KTCk{C3}?;a0oR
zPA>|vC-Ao6`4kAl-AC9ElV=U2vFsH^IAt1|uzgqe>bw`C21T{1K<fmrkryVD%8*~s
z<C+!E=-u$u5@CRnrUAVL_Tb3f1fbH;V(tF$<J4)tNKWQlr$&I=OH!}f>^$AHA9UXS
z1<)3;i2qo&UQeo}pZ1hXuE4s)t@LSsQaT7&GsNDHApNv2*%S8TQckA8_+{p!W<}fh
zGl#9E<My+iZt>Tw^<42l&raoXn_Pw**4Z8hY!l@5Dpsq|YxY^!gDF2R%YpZ+k`F{A
zLD}-M*;Ply%GFh&+jq)86vA*bTJ6pgR%JFKFt&T0VYMr2@%!5%RST-|%it8mGjkP<
zp|MIxJGIQgkh0s>w=a*$Al5ca+2XC9wF{Q}0Be&G%MxT^K8d1c)_pe9ojx1L^mvrr
z{?INzBaUjQOi2b0B-))Pcfb3}u&gi-maA4^4c(SEnD6Tg4}%W4uVj&LtxLt_$VhbX
zybo9IXlxF6E3d{vLpf2zTboD;s=k_Uc2~VMnmgIExLT5*-t(!AN^24fx1LV5JkC?y
zpUXX3$+BpbAm)|Og<F@i5%t`94ve?2J>6eTTr->ffV}Dd+-2BJTRe7n`0^2OxqHOT
z6BN7Zmq`2w-C2U8wG)aKeTA!Y6%g-3LvIJ2>T(BcxGixR<EcEeTj8ug!RVGvTJ8dg
z7q%)9%6I=on91vX;5X5p>)A6^DpRG-BX`cNehgxnpMBwtIJ<E00@G6>hH)VN=G>S1
zEb(Z=)6Ht>?r8GPVFt~rc_jLsIQfz)hZK$8Hby)pI_9x$-V<&$ZlHx}>Fh4kuFm0#
zpC9`B#GTJxU5`@{yyIi9&NnOqRD#>^vUTF1wpV4FN7e1V+C*1z+7W0XH&BuEQde^j
zZ(1p;J+n23tcI$$j`WYcN%yWD$6c-THma&Os~Pl?B5$pzT3ayTBp#aR`2yQFqa2t5
zS0z$5`u4-BP?p`mj+U5NQOjqSsaaNkAdr<mS_~&7pxc`J1?G>sj0H8vyz*+*?0WJA
zzh3o{#ezFpkGy!FLU+X}b{jsj=GU&LLBFtCfNv2&P^6y5`Mw(@P+%^M2y&L#(+9ln
zTT0PFct`k*Y@HZNdB7$pXFG8zxe}5U#qkK{sgG+DNadX6GpkmJv03-?Qx%9$i3>c{
zaF7xXtII#{vHX#D5-%K=b9eM!ehno2B|WWYy)UT3C&xnUeZ0uy4j{8-*geSCEsqq-
z*TarJ?oPO9Q?pTpG>q^;Jr{Vt8l^0N3GXMzJv<7#{w#c$QNI!xi};pd$AIYT=+D*P
z`7DcfU%y%o6q}fIA%hK6fN+=$T~p#NTs|uwxqR)Q5sw+%4ed-an-y(bo>AI8fF+FX
zp!7>LouO+SFiSIABZ-%`wnnZx{vm>upY-&ftKb^EmeREzg%F68&X((alZ@W{#Xz&u
zXMhE8kALoe6Tq7h3+ZpEgjE5;S9)(feS&?~;QrUhMv(H>94N~vWOkKqAlZOu8}MFQ
zv1@kIm~V9k*B%_ciM5_C#$-y#N-S{R(V=#PW^a)T(9R%&otZkts8}DAfAf1sg0m(*
z7+l^QmXKIK(QoqwE`VI#tdHHh*&T*$42RvGt|8icM@E)wc~Fs-d#?Y3haj+%5K`be
zs=h+%!-`3Lny)ueoMEH!Je;cTHusnAiC_wS8Wu6>OY8SZYY(=UE<|q(cA)ibPA&Fj
z+t@}+&lL~#_I5r(?C2!xn{O9f#r7G*i`&!ztzd$Mt|m-EQqEoP-w=)5op;;&+FHZ^
zxxGUl0qo-UD9E|p*<;k7^(150UBvnnRd3TaX+q?t?x0IRHsEF~G<KW>c&^{EHP~~<
zJdgLrQFM5$DfqElBh9_e!=8Ogot-G-PMGwV<Z_$&+RCsJrLygNLOrSB)g7=UZAOT=
z&Hef{*zjygQjkN48UNV3ePa9B**N)vD~(4zIExgZ-5-A{Rdiz!C<6v7H``ngN<$uE
zZD!0f9Hn#Or+R@sbl$KCO#u^W#m^e0+<<9+)32Wcy(6=*%bdyAQ_<w@2Q1P2Rvk{(
zZQ}utSO*`)Q&JA#r)IR&Uo(P4)i*mnCIXukJP}N^TfV<RVj{TaY^I`NQ=ww(HPwVQ
z`}*!CKC3~FqSaJIEyih5Fsb+RcLi=`z`bk5>aH&`O{ls!m*`g!H{_^&P@k_@cz4-U
zb>aEV6$VT@;~9NKg4H*oabQO&4Z@Ugp&~$tP{Zq7KCjrxHU#(NPUC<+p@!awB!FA4
zm7Fc8ZrN97RC1(lum*bdRG-saU>=JZu+M5ab@1q7e`^+|<)lvAnzBAz2mzz=Ox<v$
z7@%6mT{^g9>v^Yz`zp-$bLx&x{l*mx=m?ei83D_{eet${eS+9XckaF1V44;jJiX~z
zzbmKUga29x-lGFLat;-bP?*q21mS5)w^y-R18P9~Y}(F8O5ej16$d(XPiI=ciyr0e
z__1%o-lH!15jU(M_PiU^X{8<wR#kWOxG~q6Bc&A#Q!aFeG4bi5`pZ_YepY}uIjR)J
zrp!!=9<}8b)?Kox!B-_s<V2qzlisvg15_G(PP&bp@7_kiMlXOw;B!R*gSoPnwfaJD
z%zD1FJ)aP8?PB%Uj{q2VUt>1|#PUXt@FaQQ#YDi!xV81|GLhJQrqsB>3si~1XK3^0
z`+Pn@Ydv02h+aH-YM{&X+;`xCQC|XlYn)Z328jfzL%*riHYoX%dE3PY2_iQ~V&)~5
z+Kv><pT%9G{?s2DXXLq&NuW!?PigAH1YnzA<Y6TR6r7)|Jv6&aUWv-BUnmc!fyCO&
z+<~t*t~xo7o5jVn2D)52*<?AmBT@Mty)VGI?)+nFqN;A5$?(k;la@<hHZbeiF87?&
z@vFSW+2r9=0;!XkB~-LaXBoaf#>Vj*@M#-3$>|G~tq2xWl7k;SN8LaINJXxEtqyxz
zVSdQiT>eT1Gc9s&nJQjv<wV@#r^uwqS<kg0KzKnV80b2RbhCLr)nlIeD1FdrwK5sk
z-JnpD&9E>BSz!De?tcWJ<Qae=IK>#OM`Ip62(Q2kM06kcs8H<QeXr3#esedL5mc^t
z)+!SZY{ZA01v-(Nq(957`fZ6VOgE|9$~K(QkI=W(442tlzw5RTIm3Ke<SQh=KdP{9
z?$&-2hCMh7u>AL}*xj`&9%5DzMd0sN3CeN&ktyOBChAz_Yfm(0zp&$GQU2ht_9iPc
z(Q0gk9Yc+=<Y=r#N-$LDtD8t^KELbUmU;+uPPG}G?gr`HH_)1tk6hYw+zrIVt=f4V
zZ10dhqnc8xeYm<;wqmBow8xzCU6zWGKVnfNt5y0=V+W8UIoo$U$-bTb{1tsUy9;Rx
zRzT!Hxx^^ML-^K1Qa>g^L;mU3*07h?zI@Wk7BMX!cTqi?mN$7h#q}^aBmM^lXJKmx
z^mfMhCqTGn9UfiyfPLNkxsa(tL?ktKwlfZW3Gvix%<fy2*=2;+SjA|~$3o;=A}S#M
zayAB0JFA}^zP!pq9aV})EoP^z+uUjsWZMHOM($42K(*{e^@$rY;vPGfg`a*u`}L#A
zyPPL|msaPR@OIPp%r;9{rgvAaD|+i5melNYP)+;*N+?d*Qd`f_g|7$l!-LVej>rk0
zjhSfmb_0ghzIzBhD|k^AcC4q}W~y@G-PY{gxGU99`#bQK<V@H6H}*Dmf$2!(g|Va^
z`%A6IZ4fvLss}<QUP{D9aZ`UVw)krj#CCy1Ku(CbVbSNE3cs)YYX>0riOq9i1`p;N
zFjR~9TLR=q{56Xr1&ZFYlJ~+{zbcqKUYfb5|2zxWrAIlr>N?N|g6PmT5^#*y&^BAz
zHrtf$|DYY`Pa~mGho7_D2O0@Oa58uEb??#0d<tBig8J(UY^@j}3L_w6oavLU(<>Pb
z<?RBuNyoyZmS8}4<-unEXB+)XWiBRu_R$v}kBX*M?8|~~k0+xm*qTok?`0d!09aM|
zI;S;S>`G=&*!6Z3^$OH$C-m~CO!tD}S72#d#304fPBGD^9l}hWY2iTwR+fn--$LWN
z_0BH{-&?zQFZW&~%s>nU%(HH>rq@UowEBVGG5b*=&PYh4Btu6GF4O>(&+4>6{r#m}
z!CA22bq~+s{3pu52EjE}4G!}?PU7oU{5$2|wlDq1=8LL<Sy#Dh=xOX)uanL&O!-{e
z>m|RXmAb_9c1;fj>ht}mw%v8SufSoN-|=vp8i}cOIn$PC_0D3mgjpEoQziCPZPo2F
zmpceeoz)d$8nw4X_pycdHg~SC?ZxwIA^jH&rw!9@IqhTOE(#w_t4C4LD};v_@I8f`
z^(gDgf9(vmbVjxBs<(}?sM%+E?ZB?JrxYV~Qa#heiS8Hb8eCJ{2EbQzrgB^criJg`
z2QHxf(M3G4e{)sa2#<t~@2zCVi2G$aP2D*Cjct|!s6z0qUaHST3cdzPSQFqFwRy*L
zMIYA8S}#~CHHW-51>pMZW2WUQpkXK@eil;$WTsByOv}7mbG^~`azpSk01ssHaolBe
zoXXUDy4&UO)R)DY@L@qHx&Y~?y`33n82N+KX2Z{Scf36Q{Ob7?atXmh-3hl{+^5z~
z0$;vdtu8X`T%EAF>ao_T;4shhA-ot317=!lj5p7X-gQXr7j|142cP_IH0&mPb+FEI
z?b0h#pvL=J)N-H_zpDjI5DQY>brH6^u%DcsfgL(5$WFtG49A_`F69OPMI*u{C;U0;
zkn$spotT=U$1eQ#z!OXdl0LTmdkfG7rkHp?U&Ou&kc-+}SNt?N$aE$ki42$wh9{8m
zyQZ}<`;DW2psu~uIz>3=1J_w!j|pZNqrM3uE08LA2}}(bttQzb%+))F*)&whfROr2
zu-8#3Y<j{T0rgecxwweryZ9IUD%_n6AXRl%H>M9vRp)GZ6lHjfM1O4rG#F^0_I}lA
ze@3Z9^kU)=(2omRF;U)W+$nXAf_aDc-m+*QO<<Q`z*$%F0b5YYybFJOd<;Kq9Wfhe
z1XYKAXucOd@4fvI?Y}N>x6$u?qAoty2%v3#BudtWrca$9Lu<dQli$_Ox!-tQ!)Ehx
z+oZbiRs1|=ulge91#)zXSo(M8^MIQ5@h5O^R$FGjUFw_E3m;z6s!4r>KqC(#4JOP^
z6uem>C$-cNVgLrMee;ujC}=F;>+b{^o8A`rpn$HfmX()QJP(dS{G*LcMabBS?lJHr
z1yRizk%k7nB6FZT4fd5MZfM@RopgreBiXk#<&%R5d81d;``B{`#H+HPb$VdpKo(0`
z9<m^H{J$6f<+(fVqabEK11y()-FoC!>|1+WRcZ0Fm4qVPgCKxvD(a^#swehp%pvg;
zdCmS{ZSSMXiUhE4rg_aBN;n%iv2+p%O*NYa#R*zkeG1s8E2yZx73DTs{XHb-Y+R)e
z?l3tD+4rsPcSak36&(>U0U5Xp_dC^~S1%}06G+b)VbBA}EoP-Q#r(uXg`He*t(YJg
zpyX+vXeohR6GbymQmUn}SD@A?Kuk%@3cwt@-X&t`8Z+;Ln%w+EBH{+U-Fc+s1a59g
zS*+D#R`ky`Z%FtAP);-{(HFc~Fq2taM(Z&!&b_L6y^+(tQ#RxvLQ7KN8jq^KuPD!(
z6MzZS56H8fmq=Taae^03NJLiRZ`yR!H|S}-ny$S;MDmb?d}sak{KMMJYt4IQY}gIk
zJ%)!DNaESya9eW;``B&D(-nd`rIARcjosqVFz!99$pq(^@HMDEw=|V-N_L%w(R;yo
zthb8CJDIO37V7Z_9xTuX?me<p6vMplDSXN)byv;QB<+2VONibs)LLU^Ei{r{qIU8*
z&uc$;tTL^B!R;_@zt(|lqGka~xbaKQ2p(Jbr0J56F_Uye!wJx1+DqAfL}VT3iKX@D
zpuz%YNuDrR3|K*O^mE>6<FlJ#olzH+`=GIYv^<o)-@e41o^j`;`U?jWMW>j;KEyF?
z&D!(Dc+|SbyH&zg!PoBNK4VW%>j1aqBP&3Y%I=c1lYq8yS*Iw=x?-4@A;q0$FU{Y7
zR}v|;Y;nFs*o{C>%9q1K!hd>edDGQZxzMHt2HZg>m&QUJ*Bkbs7K~W0@zIo-eDT&u
z(pGgx1qP41B9I>5PnD<zdk^^(ZqWj<WD?8v`U16pd;)LDx`q*2_3Ob81&5@7mpx+G
z8}Mg`!(STs8wNH=y?MyJ+2o3HpR2^PM`$(3l-2n`>u#6=-ci^=vxkJBa;NDP&q$=j
zB?4{v{-BVDpBtKqUTXmhof%8SDo_fcW+F5=r*+Ztyz)|t2ez01KKc`MqQOV76FyjM
zvB#ZR{pTHd_Bw{nx4SjtEr2ICMCsRxaI`mh?-9lcl(tdyrq=kKk6!u7@<-~T)?q+S
z#d?0(KJc}llwYIm17Vm3Ok{ffkfb68#+r5E8w~?Py<Gf;#-plGxeiSnpNi4DwZhw_
z=O$W_b#I<+D&H?3qWOz;{KgLSVn43D+g!N{13a+3Ok0N&@e|3Y*POimetkJfF}{F9
z&={f2V30@~Ofq8A{fH?SP-M@Jy6&O2#3FK=MY{k*2ohCf>$X)HJfP!0*G_5rPH?#B
zDFZ@bdhNyGh1W>#>0_5kuzT0vI)Q(@f#+-i)wXEdji#L&3~e2Z?Kz4Xwr`2;*?_;!
zcOrvDB8@542ySavCwpE$$x%`q@KTZ|P(QkrQU?j_c##<`&t<RnSlL7u;y=A(xDo@K
zoRACO>CWVnQORf!xn-u|R_{|m6I&&1TSGA6RxVMV=CXww2_k(^k2-0ST;}gNJI9)8
zhnk)oKsPkp_60lwPbYA@I{57hXMzrA`ok|_>4nL*0`fUv4__h`7&|99_w`*#jO~tU
z1GlCT(*BQs-x>OTTO}4Iiwm2~EbGc`qvzGWs#n}mNiGgNyx>02P+4MDr#*27xVvV0
z9t)I@9{|oP<c)uz=o`9T0)Mwzoe0bXGchD4xTsjQw62|tdIz9JtUn--KW?XBOD8LS
zy7npc`RYq$751(l8s{<alDp<{+&mKLSK^{&iAXNqNE7lUb$<x>f6>GTN;~CClglS1
zD&+Z22?F+Ennc9fBcZ8A3CP(vms5k^tNp2X*8G~q#e-UkiGsz=UA>VD6K^m443dAa
z;t}DX8_a(BEnHZy7r4lC<f%<$QG?-DaTg`BHOmlZhyA=x^Ao(o3EvO><r@==2lrSQ
zYNluKp{E5#@XPkYJq_+*Z2|s-XbCsA<cJt*yt!q$ElAU@c&n%Pfdn(8Ob#$g9zC*m
zUcpq9I~;eT4G`_yg6)Pf<M`m|XgbtZx;NVBd$j7$K|URH+ED|+TcCnW$&MXJyDn%N
z^wV!B-XembK!*`|PD0*oli<ix4Y!2!Q!o#Z_34Vz#r92|r;}#={H-~7x)p^8PS25q
zQJOZIeQ3h*#I~T$s^~Q>AsVrTE_MJ4yn=@Yt#rrvAg&nlcaF0J1yM@_H$X&U7VUF9
zhvdO>aVXVQupND7aZSrR%K(a`Bwk{`@a|#hF}??Iuc8Td{O--;i9=be5Xl}9Ky+GC
zZ^s?~=O^P?4;nak77{}Oj6*kIXGffb!uL+lG<V91WVkiZehp}#KXt0d{*Gm3rL5Mi
z<hRPpL12vk4xMG-g6@+Ye{yi1QEB@T&dp(4{2Xnl{}Z{d_Zh11CX7ZH@(#A1P2({k
zl0N@r?Gxw7ojW6Rn4p7_(!o@|{->_O{fUQ;@|BV;TQve>IWEmu7v;UrOubV&e+Z#`
zi<f;BpQDNoX)Jur%E-;*T;lmKM{whHpnC#nlXykIBZ^HVM+E0Obc6B%n=a5_*gbT#
z)Xgm6N|mEuLk(b&D<rNGS5!^|!3_Xfr^ycMnuN)0S~jHV+E@MkV92g@mxm+7f9P|L
zb(5`y)bP16HotKMgr*}|f3f$j0`1QfbH7LC#xQwyAUE)M!oC)27J1U=@dTraxk*^v
zE?TQK6Nepf!vW`c<L>k4Q*3SDP@)0fp>v6LyQnt2d(o(t!pjR|!)WpltN7+v7yHTb
z1V5f?aQ>M27WNhCGSY;J>6$D-U0{cMrPuv{l*n$oFpb{8rU9`mPxK3Pofr!6+Vzwu
zQcoXno~RJv9TBkHoB+!$o8<+6ZhZ0Sm6vWAfz|>v0$R4tVN@^L>>$C39;q*f!zBsw
zxDo(=(oTCm?oQVR=GhkjuPCZcTLa40PKo+qYWhoLSfn2UGKFsJZhAMy<+5R1Z!(f|
z%f;~zmyH<s<aQ+pfbF{K*2QQunHxl`bm2B(2NAO*0XInl#-)`nKPl52a4Y&e5_pw>
zCN*wRy82qI>MDC2akz;;SvU`hi|lAN1J?BkU6IPl{fbWqLoB3dReRSVDBm0*klv;y
z271*Fx8$F!sGmAF$b_Bea;^8@v2^CaAyU(7zZpI${G?5g12ME{0Dkm}@Sl3nKPv)+
zcYAD0{&^#%yMtnMZ$7JX6?N*FBCHtv)cJ`CgS+pChDPXMWDgPi#K1g$&<?}sB|ppK
zQC`j=jz@7%04y=0V3kN&@Rfio!i`_PFvvQ_7$2=UDsCOGk>3>#=Xd~xr+GD%1*6XW
zMC4^JhRlwwlkTs-aH8rMgj-XJh1)tAUx0oOe=qz5{0THdy3+9Lsy9up{?rHy$Uklm
zPY-ATpcA1)gxjpwC7mX`14Qr-e-QdpAiq@}p7-D>5wf6OS~C`%M~FN-6oazQfh>-4
zNAY7R=fs!g@QZNlTYzhQG%9cV>iDk6^yHU?e`Xif3=N_`@5+kqW9LsXm8p^q5+K)z
zLeb48fxcrg4T;g|ryq-{fsw9S<ycJr!58YeVcR~`_IcCz4$yKooM-(Gh~Up{_ID8k
z(QkgIBZQ!#Kf*h2WHpXjC*$ZyS~#VHz@9Pi3d12Oj6ZPeX<q+^3<12@;7ObE)9=d-
zQI-7yCjV&6bB`DX#0A<Nzx<!S;=j)(-AafeR;;iH_BUN^1uKECyWDkx7v`lZNrQJ@
z7OwyHBLAy5^?*f$wLO-(QU3uXje1M=9vu0Qbj5cE?g1zPEo5nsC-FV_J7~$jl;QyN
z*ZS}qXF@Qd`kw*hSgClb!1~WoI0u}f0%wQx4MrN<FRVfCaG5mLFEszvCI8DRrJeQw
zZXxN+3)ikQufRR_M=d@17lX=2rLde=#$5yE*L}kig!Bcik_k)W{RP?u`XT9k4B!K5
zjnO|PZ49OC1pqv7mVKFA?^x0((0_#af4j0F$02-1Ka94h&DynI?t}(}11IzwQSQ?J
ze~GfK0!+f}#~E`)c=AmNYkSNo@KO+cn#>ng4(5J>sRQe@!4Cayb15<ySV+PL>%`Ez
zB-_Aa#eZ`Ig@Vq4g;<TH>yPKTh+9a1_k>l?2AoR{m=voH)MxT5M4t<WBze@C!#v+Z
zuC9C@IkCdYaq5r`t-7QTK-jV1?Nk#WM~Q-_@Vz@|fAJrn!?s<jIwJ|@2S{UwLlh-S
z;qZ79gABwAM-UWrpm3nj0y^{xMiy@DisI{9b``J_Rt_zoQ1DrZ5Y*VSe$Quvc$$=j
zX();C+5*zU?Xl&mt&rY5q4Fo$(I4YfLQ(~1=A!MUT^{G9?SVJCTirV6THh#o`iSQ8
z5-9->dDzOpaM@cN(54{32Bzc=NVP!=;2SRI`(WRGa|lEKN_PL0u5T0zFfBLq(fk-w
z{Anuj`zRZ(b1~vx^$v06Dm0*tS`ruoS|Y;u?x0qc-?F0QJQc6kle+$kW&Fo)V(180
z=B4qs#mSRP1_XiX?`b*$H?6*%dixXm{RoW{ioW*K)&O_5umm5Ih{F2<2Ya2t8^PmP
z2wG|U-yLJ-2-po^ov73d0~;Z{=wLZ76baJ^9c#ni6$px08UQ0>q;A9wt4_!03_v&k
zy{`ERE7X&dK^CGU=2c^P-e4$+UFGQ&v>@-nw|xM!e6hnwh)95gFis~0EEX`)e*+tT
z)PC?2j30;Vbziz;r~AOt*fW9{0!(D;CO`PwN*2#ao5)_#WdLP5^*40%7%t~0!U5ph
zDcU6+<$oS<^7_l)NtcK*KF)tidJ_F6%Km#a$eaYgG>YFPxw4>6IEeIr`!a%=_!iF+
z3$nSQ)uOtp31ITi-No<!0DSl&fR=?hqnQ&<4VzN7lKxHmJ65-jA`rlII{Q~v+7lAD
z|6bdODHZRJkAUXf*~ck3#RZ#^3HnBfX$(9ZmG?@6n%;rrN$!;g3{xB<u7~-u7LZVG
zX4qGwgBxjx4B*&KB*k$aAL)W*1h;&kfRz05i@W<Ten{mjEQ)=|hL@0M|DD@_r!CU~
z{5RMhs1^iPv+%xY^mT{-eeZTG-F5izCZLrlMS0s;%Z5r{^#~_d4amF5&0|;$SfESK
zPh%p6qOkrGca(m4U?TjN*S0^6kpJ}Zzr@g(*bVsoaVem1NMP#!o*`*mI^oLfx1x3?
zF^F@(y1IK9!t(W*z7-8*kBk$aZ#a~63~1!nXiJ?RI{ccs1AB!0A$UXu6){;|ARtR0
z$bW-^43hv}(>6YIdhXqyli$CVO#gk^Y1t$0mG8(_LQgThNktD_gH9%L_#Twatr!zf
z#3%4EEU1m-m6BxL1``f9RT9F5Djpe=EkKwd>$n7@AQ=D!hK(yEy#ZuF2TP#e!#C}6
z*THlw(-5Y=q685R0zwEq&TIbx9sc!X#M&Ovx>Xb(?beiL>*K$}_5b3Xbe!~`8`r8N
z=8Y7yvJ-_Xiey1GATdM)^oMvTmLc;~yME)U|F*vuo+lM1!?K5EG0xF7*Avrx&?Pw6
z|HVRLoWZ93PRxFRy*Zx{YWfh|3EYX4&;OG*qj#@2qkNXa@(dE|BT+LxFbrWgmj3Lp
zSFdm)03Dc5;Ml)|M}mIMYyPfk{vj#fIJY4O1ffAL2ZJ_8Mh6KEum$LU@y<X*0`@Ib
z1S$ujCUy{$Z>O?<VjSP!+h_AX23{!NZ$F6R*el!$nD$xPH814H=P6J=Pz?l0#}HxI
z9|;_T13*y-P~K7O4geg!g8)_z{4=RK?nC?oAn+&JrNIR;UD0nPCu^N05vv;c7HVtT
zgQp}03I%>EpO;7p2%ant8ZduMU;+%@zh|NUAFDN_@BIRp0ysTrkqX{wvMaRprCPb<
zhWtr^SU~>nTKUogj@KZLUE*>?yYQeHnYqkUHo(za067sla)THESb*&0Z!H|7de0Z&
zjkow_KfKSs91+0Y7Jrlr{fnp1d@K#rIQ0C?kIALK<>%qU91*1s$&Bu~C;x{?L2;tV
zl(MX;xqSkJ<pfLls6QeBR!`wWH5I|kmJ}YjEZzSlLj03+{(_hS0g+%`PMBnmn7~ix
z`~S>=iD6uvz<E+{#Q~|aKf}ep|Iov&1K(2(?fWH!BF*o^qrW(tnc~w)JI0~Sxn=#0
z()#6ha1Y=lh=9$piVPlj5y;9IpZ=irpHc1$^k4VEB3$tA5+whvYGyVPX!l@_^DEJh
zQY1(i1#I7rbFKY2CZIqoq<^@T?q8U=#v|5s5wgBj3ztvT^p-A4BJJO3o&<f88)5%b
zl>4VzfBHKqaH+9{lAZV7>dOSG-p|||7zUabf<$S=v%TbFUP7cvfVeoNaJaybhDbwD
zhGs7Uor?<)&+Ee8S-^=j#Cjn7ND(*|#E;W%0>U$*+zuxk-VQ%OAOHjZ{D(r<ASR@K
zr0*XD{KfkIv0B`Q5i`+x+7?`t!q~92QJpuJS$j_6>MDMY;Nd2yF9Dd$zj}iP0>n%d
zh1)L)_&hOSu8Uy(3-yGQ{2Ro=kFlk7FXA_r`&V{bq|*xQ2jGm<76M99e|&X+V#jHD
z^gxY|ZZT1mBRTY`+J!Op)(iIk{3ldl0nGd#5Gw!TM1F^I2@zs#>!i(lT*Rx9&ae43
zu>^L52<rVZ-MfPCA&~LQVl_zaLq0nId^5l|Vkte2tIxk>qSpTxj`0^0ilKl3VPY3G
zCjX=UM|cosD4dFQU4x|E@fJX%5sJ!t?DkknXwy%E#ItQz6;1uCgZ=%M`9BL)ijyD#
zx%Gw-^EZDY{y$$eUtz_1D$1Ud0UGmF>&6D)-j&+GV;YbwRKXQM%{;!gwM9<92#v6r
z-v65uIsT$w=|UcFfTA5zX*~b;R17HDMZgCHoWKJ~^}fn3xp|F^+;Fcn859U9NqNjA
zrpf$6ye{B$y#SDOD1iqe)N)V?p2vaz&j|bD2>7$w^D9Anx)}uQlTpSM`*&rpF-Hj$
z1%oUUMgOND2BbSB#l>9W;@baTDIZYz?=(Iw9`|>-3}Q}T!*qUusB!Cd`=fba;^;vT
z=vdb4>^Nc^`+o)#{%PTClN<2L5K*q|N20viZ$nI9=d$SxOS<hiiXgeank6sC?YEsn
zufLFgYE_G2cj>z|{OMt`mF{kMo>8@?SiZq*IsKIOi%E9xU{?Y3#bdf?j|h^%G^zaD
zm_=LUKcz8d<kIwK6Ey7-r8GafU*I)z@@VhLdDBa`4D>sEyIAyOT2}|@UYTdGpO}Y3
zix01_g*bvU&;KKj9a;ifoHXZYYXjNbrypL68MzS>-xzctTU}53r|}C#Ed471WSonE
z-@hMrH>Y2N&qjNaoOrFMA9RigXb`w*j9Y@uOwJy0AMqdEw-<kw0eJ@*d5V1tU$Pn@
zUh#3R-xUVFCdwU1;e-OB=-(+gO}i3oIwj^mrI(5@ZfuvY>wQ@LRE|Xm3KPfOCF3b1
z^(7+{v)1R%jq_f_8}U>oidE3-rG}pk5~6uK(YLxmM2OpLFn}jLtByJ$9hu5K6wbX)
zmhzw6bD0$QZcb^?-Q4QbnV7;THt9%Jpsiw#t;h}sD_)8t7cg0O*;d|G)-yoLpRXyQ
z!KAqN?g|6tWyM7xIoQ*<IiosY_#g-%_@VNLO24xCO+k3$V0`3;Z!YQgptd2xR=|;X
zItai7TM*`x{=nI4-1mymsw@6JlwW!GL#5t!qbZ^3<Q~~T!JZQSV3BjU0&lcd)$zgR
z6yIR)UhqaVF!rPlC>aonjmb_<lLB%3MXsDP&(;e~6cOm&WkTX9llJE=8UI*y%T0Lm
zxl*%4_n^o#L+@zc$fccT_+r(7z^$j`;jrQ^ueS#Y$0yQX6$QxPnvJ7HsRlU7P;_6(
z0A@aoi~!{is7lyZhzS?<A6F|i?t5yu1<9Buj)O}-bOO$qhm#C{u;I188@{$DBeSO~
z^y^*#qh5w)&E>kKXCdoucZ|}bGJ)y|;g51^+yxRR%~mtY9{YQIgUKP1=ih_=d98n<
z`)QP{Louc8<gQjR`ZlYvCHA#GV60v4wJuESK;D=Y)3x-YS=Y|tXNLEIN1)DZIVE9W
z;Z9H3Iz{1WD6-qi9(lUCk-&=G^qs8#Fo}#p;1BK$6z*$@J=34QM*k#^97+d*8(+SN
z!ZhnhMn!8Wb!d;=|L{GJyZ@;uuh1(b6M`!@PJn;Iu4bp5#bNMePc43!1!KVj{^_in
z=wEnZzpWV@Ak^-=*{IcU*d?0HdbsLTs=?%nZZe9vOv^pyl&JsDIJk%ukXR+{8&w?^
z({wCyJMaj23V5<rHx+fy6>iB@gdI#Zu53r}ocY}rW^R*SXUc#RF^(R2n)O}vmfCo}
z%icJ}0sL0=h@j_w9?;uxlPhBO;K%KI&N0?YVsW?o(OF()wppmDbFELRCnKr{aLArl
z9=7li2rW5*nF^qMzt(AX&-O^$QF*utEeXwB@!%QM0`~BnBPR<QIhXs_pil8-{qww1
z!?X`)dU~8CT^#fWvd`~EKP#ikb3z}a!Y*QOemxmej~`PtG&C6g^fhq1;z<0NqYiFN
zEb$tT1b6w3Wv9^|`V{o*XI;8+Ngt<|=?1zcq+Syt1CZYp43h_g5K~57THnEiGF5pq
ziDK3%I}bkIvL1fc8|xg%JI^vu5Mefn<g*++{1NxkE~QjqzV?mtqs$!0NBvNcCkFw^
z)CF#}JFOTUsn7X@ympSzr4D;-f5!4$aLg7A>2`AfU(00{|87}74jayN%4+`0M>Vzm
z&50p}R+x^|&PV9}(Qq|QJx_?h;p#V~8*4IYejyyH`%iA);rF>scjjgU8QEzvSvc)Y
z{ud`nzR40(ad41)yOVHj@#g6W`i$E_0oyYOn;rAf6$61E0vPHU^X%mqo4MNLaok*f
zR}+-8o>GV;)aMK4NyS9Ehu}tBz(D_1{tJ<Qq*m;bQ>-dw!Ctr6#5s&}HOipSaiKyU
zNh>ez&lN%fbt7_Zv&F2BaGwtXF+^zM0n$9s18@<mu}r<Y&+nb^9m@o1TJuJjzGO-g
zcUPK&puog<yzy@N{B66exUWjV?GZ^y{1f|MEyyy+{S6+R>S5jI%I%~GrJMADH=S+2
zb?6QT@pwEBM0b;nmE2}sAtq1TOTN;;N}I46P-Sn=ppV?<R=Z9@<iy&^iGDlgG~9D<
z`gKC+plJ;&H+Q>bG4)BtYL<|@RzBb6S@*tYNL1_%+AFGtwAM^$J>Y$!M4QTp=3yA5
z^!42fk~jWNzI>MWmJgjVnQ##N<kCS#6W5`#<7s1mV?Ca|VG^Nb!$}9J>FI8?r(uG+
z6}yDP!HeEUWWW5%U%aqQazyya-zz?)(la@!9^u>0QN-jXKD+}J5T%BZrug9GI`7RK
zej}-e<dZ)xRc5^J8!caox3K#HqYSPWyF?-)NR%D0yJtOo>2XR}dg1Ix#r_sr{fb9b
zQ(miUH)$a*DYKDo-21oj(yz6Q<~T3o<xi@q-7jcwV9!i*#Ble$9^T94{?YOE)#BXN
zH931-k_a<n`%lblLX<FTbu=q4Lopl8W#P}RJe2F6sQt8M_Nje1Wd<ks6Epu+sO)$W
zvoRIpfZv(*y*Pq+{D^cZ@u`M5(;5AqPJ%KK{nV*He~IX&RlLDr8=}hofr5fvhw%z&
zF4@iCKra5dDIuMcYPS{X4LCJz;kpsauX??>L)#D7YUSeuz^G1Kq<=6p{BhORDAVRy
z%^JSbAMP57(+&hZrs)c7%0NHrpor)(aZ_=rc~Ix%5Ij42c`Hz{VKd?USq<8b0arCp
zG3H0<LO!j_#(Sqn6pt7*P1u-EcfOWwXh4O>9=uk|{BgJZ?Mas%NrQ*@t59j!1Ly<T
z8w}k2AhK>K>a05BgdHgb*^LMpmGfI*;67c$e2QqT7@;(JMlsAxEzM6qe%|t%C-0@2
zzscW8{`2??+hDU<A}-cdMu;U+`$e4P&YS+>!Q1X4jNN?wTGH^jgS(Ut@N{lX+o!q-
zPkDz14^(w2$~ar(D=vjzG&F~0Pq(gU(F%npo)UpFH*%BDMpF7tL?~2`LqY~EsJ)5b
z4pB;S^x)%3C#i&m+BqYAagLj9({Ud+MAAF=u6hUfxEZz;^&cwAU5J3QIISn-Mf%M$
z_jo_mJb&n7Oh=@f+_hYF?dlbpsCD%`55IQ4qExGM*k4u{dV}o@@_UrefS=N&vZk#$
zMj|y%JXLwUq6(tje52@EXLlX?O!n5nooBknsq@smEV1CfbQ1q?BW+vm@F-vMJE9V_
z%g*$NHEWt$eP3?hd&kCpkWC&E_f3FVrJM(3>KkF(V{>*Mr_&^}%}6p4)ml_6%9f|1
zTJDZLG=j<LkGaJv*if^^HB!0~6W7vEp5P_V`~aK1A7-Mq7Wl>iBwVVdu2LOrigFD+
zb>7d^xO$vQ2F3A<{YuNSoe_87YU0g65$Oq$jhw9L->s{HP21aj+H*6?8lW2vX3?X(
z)sDfaJrhX1@^HO}ELP;dxW#UFwlkV+Us<^)#wp0t`$s%)h0qCROh?Nfk@opD#LmrQ
zc9oxqH4SBXvWmkVEuXmRvn50lP@mty$tT3)WTRKKPyXo1z^S0i+~SR;%8DHFt(!c?
zD9A0gR<^W3;=qu8AC5D?)132MW-_w4>I1!~?$~fWUZ_eYX{SwfH`tb>6_<^4vduhM
zlP&x5wZ*lhMiToL|9R3*QZ(u0V&mygr&U-)+R2A+G)yuEe0Y<3d1h|@q_nq=2;vM?
z!wtuE1p!@&JhpmQo|g|&z|s&(;#g2Ds46EqY@W0ilmgZ~_W)K5HTJ4M@WJ@X`(TLC
zqyr$$bFRlHj^EG|4}kK(4<L$9+AwJUYb?5LrOhW<RgBYMd;9afy=K{5(^QM{9H)uN
zvYwxO6nWNEaN#;fG}j2TiK@lk3p(5I`usK%UwRjK!%0lcN&XpeN&LwqsDu%%+Ga_Q
z1B@i8gVI!xB!Q+#wz68v2cbb1ht5YIJqt=ay5JmNu+#Jw{36d$1jBbLTNZ9iRN&Dj
zEOfDh!y>ZtAs_~S4q<+99@sM%tQDoj&KoIaK9c5BTVxN;Qh{p9g-i><5L5H&n&$#;
z3)B0RazX!7=T8VJY{RiW2&K<bhD7v!-93kRQNe6(c6N!27tb8_k*o{0jrFSpjXz9E
zT`whxz}k2sZCZF>)6qI^{P$}wk_9k|%jG=p#g!6GO$(k(RtPYbLBhLdB-(oS7|6yD
zvAxSN;2csv|Ce%$*GJ=<wWzt94Fi-Bg?AelFK}fv->}#9+dFpyPFvu?H5uupx{$eE
z(!1q9>o?0mwGG$2QM`A9Oo#H4aswg$)yt5aWPh_9_p<jK&)i}2F13)=j`f>xXP(4q
zvp0RrkQ4|%L=*DHYXF=Fc>pW&7DAIVo8ux_wn+teE}(Cg^iDq(_0Hil3=Ka6O@Nwu
zo`o1fEH>*8?zsuD+Zp5P4}3ACXiyHg3yKE){Ejymzf&dN>&f1V%F4cESk;X(UI`we
z`Y;I3>rU~|W}V=Nncf%!TUIr7RaO50vSN+E)O=OB%MDKgTJwK|2g0RwjTy~2TAX2g
zV7ulQhtCVY8EuS2VSA@jR}agh6jWt-L)!RL@#G=!jq4C?a+M_!$shEOdg_Ncl^r)N
znATcF-DdXN50sLjAMo@0?1kDommwKkQx{UB1ReA&Dfu1@e5JkVyEKcPN>yf;#3!Wt
z4jlMyD?HT|ZpwTFb@WxFxOCxj7_i2G^w>P;(jLnOE1tZ>^hl7*TWqYT`S4~How)v>
z=}-;+^~SgPZM|wlFZJHXK-6--j{f!E22M#@pmR#Vga;%h9wZuUsL!125PCIP?)RfB
zyys@UMdg6{#gVq%!jmTI9^iP$XC)<G!%}*ydI_Sd1GR(QU{`y@R@|YhM~w(y_}k32
zfOY#)1HSRCAV#^d?vjw3j<E^@3VGqLsrj~};LAg8ZU=n4cPcLho#r9U{7`DgJ1VZW
z<~QVks8oqN5&T4)o%afBKIv$^V0{=Lm6F_ExL1qsJaH#6+IP91lvgRo;-UmKiB$uw
z#bvgBF+#{N_64+^C1QY)N<!)UywJ2Pm3s=fgPOV%a5w~)GZ2&qUL@DXSFlFhWSJ(F
zxfmMhT*vC_D8u%qiRBKtV1oF_VS`yYd)LA1jW4}mg3ED*S{!_1+VlxuF4=ZhyWX|c
zdC<T#-Mm@96*S9@7(*1{Q5Y~9JN9mk!Ro53auS8FFaERrm2rr&%xfdu-Sg7L8aFe1
z(!Lkz)lI4wT^G8g9N?@;vzKZ&=hm`SFCy9YUYfBM$4<$0`5ld<h*7xuY6^{_I9;r)
z4yz8$tn|Z45w|XyBu%aLgrqm2g+j|3InFVi^H)y{_SE+y1}asu(E^M9Lot_K-<-tD
zQ)E#(|FU|LB*gAV385LrEK67oB*)^?)|fr=N+E2_Fv(nCV15oG71W1FnJc1QhTrAr
zg!Tw~zstORj^I@J!6UDOW_^zjcJ(FV^Y@pTR?v3~kHkQv54Qi0s;^*cbKBNMOK^9$
zQrwD5Ab5pfEl!|li@ODPN^vc2#l6MdrFgNT0fM_bH*2r6?>+ZPen2vlZ_L-m7;{Wg
z;Psq+zn6DPyh@}G8bUPe!-V!}SrJ}lo(FGR7qsEY+X)=@T=chwJT6|MN<-*|#5cFt
zBbL4?;3FUcrv#N_=;Ch*OUV>8%HO}2)xZUSMt-$ssUJ(k6UCp@t>1{9{vm*}9#-{R
zYK>_!Qu0U3MIoaEq6iqOD(=G{%45#rB`xLY-Y(A}+xP~&vL53>3^{3Z_`*Drf0vN}
zXW<=EF`B(s!DRP%uNp)IPnWTZkjM<7Hl5NST6@SscM0~Jy=G-cB-OLs3^R`DWjyEk
z|HYG=ENJlw%3-Kzi&%l#-;TP<FU1A~d5$WtZ%usXITEd7e?W!@;W4oc53p(hTnc=2
z<bVDjIuK>s&bzpOuO3eY`d6=w^PVGhzoC{5iVy~qT3%oGkZU}xpX(qxbEo4t&da)>
zzkFHBdm&#qCW^kqPl&6%af<Z1S1CaO-#OBJtq%Xdr`bJR6aV${Yle4}(o-@oogdwE
z)UJ~4V#uH3Kr*h2Dx!p%v({iB$Lo^ms7vcb2Q%+)yGErDvS{g)s&D9B-5z{&8p58^
z)sof!UX8DF*UL8<(TNy`l98T#-A)Z;()b06wm27~epQP>jNXA&HKf()V#$JC);ix+
z@y6nD@m<M9J)(xY97dTM^@3NyNA%0|qA@Lr%>8UW(0Iv2rH&lFSL*rSBI|XZAKlHw
zdRIg-y*$kxrU$aOc}J@LXj=fwHp93Se-spetUMH6Io_M@)ltMdiix{GVV$3pRl^<A
zvQnuq5YKqPL7}Ko$i(OWQXwY*%8fYL)CupzM<kR3MxIMCA?>PXvELq>4Y!?Sfgea2
z!m@nML76=l%BcttjGBePh4Bw7+*FW~$=};a>0#pYu?X2*KHA1W$9f^_;K7H6Ha+sn
zEsH6ZBpc;aglKK+QZ#2gi7@Me^P*TZhYyye$*oh{Zt9alen~sN-zrrl<n!ikhR(mk
zN@r9tg|{UyKn2_K>)Sr^B6bgSWl%+o-=3?s0Y<R`m;L(Ppy--`u@s^l-1)=*p`-yB
zB^dEGr?H>jh9WI-am{K+D<q|@<%cBU=;`dHkc~;~%1gdcRYmW3?FUfC9=f=c93o@m
zySg5T$-E~t8g5nxSC4$XaeRK=Hon1$S@h}d>-~?YF?=wbzu1`lm6Nw~A=B5@>HCh5
zf=vpwO?6Mz;SJ~gjr=Ift$~#Bxhz|&bN*u^h#<#vVs=)~w2)XQkY;%KyfwsyQ(Zgy
z;RWX0_@_><WzuXa)Sr~Yq2mcV&YS=D<jGL1aOg0*gim^K)4HzsY%+dHZ+rB!b^tBq
zL410ES#Aqu57Bb=*Z%^zk)ZzvxEyYK_d_JBjq;SjHg^Jeh8oE5IQ5XaBVUw(vLhF{
zH|+XBpCsGS-l_DT776aKJUG)tR^PH^7ZAJo`dVSX5~ToP1?Rz$`XU7|-~5JqG&*8(
zW6f`xT3^I9SODrI;mDp-FM<0?A6x-y6!`r;4f|||@TgSln-D&40LRS1OJr+~E{|Y*
z4$Y0z=C{4Zt%_gHat-2sRXb6I>H0!Bfl<60WhJj>MYs^fjSHU$nbRlMDyHwSyo7)v
zyrsfnfhj`yVB;^I{Ye6mrla*Q+Q2E0>wZgA#Ws-*RzGrp4w2pb4>mwl6-dU6h5`c&
z@6z<dVK*Yh`ry@B*s6G(6;b;wok53A7oQO&YYaG+@;Jxs1&&Ki4V+W=EB1hhq>QIm
zDcA?4lSend>qv7V)t0(Jm+>xzEqpUzuBlp*;Kz#!dRln-PxaN6qMy>(#rus9ItVe`
zb8co%aGqX%<N@Nx?eH0S+O`8g)xxdN-v5sT$6gcW%&~9wrc0hWq(q|zqU5NRsLe1r
z{QkD@aEO>S+2qK5EVtfA7aBqy2vUdy>3GPhbLir<yGfJ96U8FGq+{NgR(YtR;go)?
zHT_p$7zChz;v$K6WN`@t4rTQW6yFT*wU%Hi(?#@H*EsRJY1sqJToW3l|07@g50^1u
ziZ$+Fv@=0x)S=m(<No<Hyb6<NK_f<yErIdyzvGqdNfoBpwwG*rmVEl&YG%;k!Gr(_
zWpW-(fAxfZ<nJs`_fEISu%MkoH*bsI$3%@QWdU`8e&Gb~?4>zo_9}5RcX#@C4GFxD
z>@~~DqTaVfA=B7Dh@(jS`ym2oB9VM^Ln`ZXukyrx1}t$YGTakZf8d()|M+^Is43Pw
z`*iKL^Xz{~M`x9E)f>Yx{p9pt@@MoOs+)D<UWC1ng9)JXjlIA;b##C|=!So5ihC@Z
zF<1(msCIazUW$W;zF{dBSK)SP!__<R@>7gPA0WJ<gn|j1DAKfP<V{nVJ}a&p&Bi`0
z<XGpZR^zBuVpZ8W@5TEbPF=ouJ||4d`P>u6Z^~U(+^OZiIU6S~Q@2fzGGm-*7PdWq
zJ0V^OX-j5h8r4x4zThv!s8eZIz<bZzV*xxaB)$zdP^PlQN`4$krMGP18FqNd5NWj>
z!=+7bF1qOg7dJyvAUB4diA&1^UT&+>^$aiJnwVRE;t`{ddO9`Kl&6dwBMytEPXp5z
z0k<w%r8^q^evY}qo%$bA<~GCsN>%61?w_R!-ZN|+AkXcxr_f}+_E}N+j%!Art6)Qk
z@gMXh>$ZmsAZQl<U6uOQ=V(v7^K^Djsh{;2_NkhHt7TgUF6x<4xkM+9yb*2;bz+n5
zVwAP&t0G|OXANI`F4HcrU^u(k8aquo8{Qb$P>NwT5X+*M1fGpQIMn03;}6J{Rr_g>
zN)TtQUDeq%&1M*ZJz$9vFa_rT<#sFdrlo)fWI#43bi}w6m<yt}iOg@@vLec}%hd?g
zBD15`H5;%x%eayD6s*iACVL^sFDv-_)nDbq)8DS0w@LU$RS^a}NOf4rVcS*7{Q8V9
zGt!wmb~hdVaSW%hpNU;GLb<EfXAgOwKDc+ec<cCfd=9bZ1tBTmpEbh{>Y&xo8<6z+
zB#5ucAIY6MbrV`ZHkej?eQxKa5g+IU&;yKdJyG=sr_qT-Sg!PecX_YDvNF*P3zksH
zKBZyP>Y+~!i5whk<u<qgPUkAL4>xxg#4SaUjs8gNF#=_t24<<#q-ZR37TKpJPyq6I
zYplufSWE$nxuy(UPag0w!>FD8<rWuF;5Y%Jj^ozFyjBQ7#`ok`m4gD=3nJJ4)87Dm
z(*2~-gtYIOexC~bMu;y3>Hi$>jcO;^t2NAD#EkQQ(=J=Y$cxU;iQ`$dd3b;0|0GzN
zFr+uU%-o<1Fo=<H;3Evc201uXYeFgw+wdyGyHwM}x-9{(Z4AhpuMf;#`8~IHtWB#=
z<2behpyGC-iLY{F8_aGu27ECk8je$BuLS*N+@j52d>_(1CqU_YOBV7cQL7QUTWVg#
zp_mvnww$Ft{j_u~!u4R%L^YO<F?^VRqp%eR!mSU;?f{aM5#YJ`Q5&>DF~_o{l0;gv
zN830){E#H!(ZkV5m|mOe5Mf|VlNQ^`LD}HZvz4u+HFr*MHoTO-stEJDRx0SCAF!={
zq{u-xuAr8R11z<qSwq>LEP{r}3XChz5Cqyu1cj6%Nn!sug+V$?m=z&a5AstoFi7o@
zM`O6n)n?{<fBzDcNbO=?{}O$Br`~zve`?!5RBM$Xr@<)whh9K8DGraRXvT|p|6(1M
z(WRfU6xb+vNW$AN{f3Y4Pf7As55KDwUHN=bazFZuD&c+@Waxc$1~tBQc(-(r-jOwE
zs*~m&O9G7%4;#gp0y(HA59rTyu#Bt6WsVvu>8_woTlkLNWmefYeavPPD-Txs<J<Sy
zcO)F~V8)Rg+!@-x8&-%D65{T1`idtNkjEx=Ac!Z4uY;$9Z<bA0y%-o=iFeM)1AQ_<
zlyXb7;1J`}h&Kb@IHWprs}}|Uju@8FDJH6x&>cMWF^szGge@gyWj+#lCI<jf!1PJN
z@^I1A=YbqUT+N5eGJXPb^04gp17Pp-hjFr7dcH;p$v@=*vd)>3o>X3L-Xl3hP=0A3
zPu2@YD=EF>{+L^=j}<z{ug87VJB;wRL(VX8JkbZv{JcbAW*47#NQDyN2w<yyi9Mux
zjJ%wqY;yOGxwFZc+~h7;Ow~!h=?%I^jXs8}DxIVQ1=;V%K6Z#vEb#CyDj8~(X*sY@
z%cFlFETLEQOBPmZLO?=>#4l3WvzsvR;oVK=Js`1+0@(zH&iJHAWFSHQbt4u<6m4hP
zE11i0N<5=`*vkM%i$@o-Tcy7+`DBEjf1n@h6R|1r*_EpCjYy2sw}zjWHmY5#<E!{@
z)?Q-7FP5cLVG6LpGBy9Q4J;lw-#d*xn(WrH=Dv-ICZNbU_`X{2ieIi5Wl`f?;j4bZ
z;)Y~{Tw=`Yue1Frg(~c0AaOOXn?j|nhmXbWkl0zm@|;K|q=jc>A7=z(MCqu__w?=?
zT;zJVYSPP=$H?Qhc-IRhuhl5+@nWkZfZ!nC&7yu@T$$#8?w06J`?!_*Olj+`;CAOv
z-fbOLM;hi>R)Ee>zU~ufWC<5$9=CS1ew!XZkil9p_Wg}yl6mq*IVFB&p9nyiR)#Fl
zPzv}>${WcpV_{p|P!FIQ(WAIdl~vqvrppyZiD0?^h){`^a|`A8hrW#KAP`yL?JYYH
zn6&S;n?Cm}V03rOn#qlZEz||PMGw$0f1{&^<~H|yP){bgd1$1Tt05*wY-+l0vbN8R
z>v)7ns-T@*dHZD6(jXdX^%g%!`)wwsqB6a}IfA`oQUEzrDYL}g&5uG}&!iDZl3{j@
z%-uI`wdz6<Rbxf|wf$wO&8^17kH?Mmv^N%Bit;PZV}=Apvz6|=lBXo!k!PChExG+o
zmGWHqk&?<j29rbVs`^zx)l_lYc!-|Ab!0N>9u1H%01rE~+Z;>g%NGus=WTms)i=Y=
zQsXMLXZQgB@Ws*~T9pOu@s(hY)~sn%1rvITY)+1WNN~r2q#T3PNXKGKK70*es(W>U
zR1Jer#n)+`f}42+ZC;dh3rN59Nu2!t>o_zNUm7XoYj9BZ^0=DMn=e>2xA&qp1}*4g
znd&atjHnnC$iyhL5<ql!ExGdrJSBW7X*zyn?zFhVv!$)zT9R>VWlJK;d9s{dczxF3
z)elxi#+#Q|(uSEs#Hv!Uga?BE%jJl*1#FtteyI=0E7OUOX|-U~(RNc6Wg&tk@=9x_
zgUq@zTdq<163R5UrBQV~=CXVy^4<M}fb@JQx)J_tXQ_<XUAhY%^s_UM@G*j!Q7gh!
zv!tb;lyxDz5zkybDADg8C8v+rUunHE$Y`+|a=JMV{PbB^Gvrhy4J5ONRHXwT3toFC
z)ML#iWOIXrLp3pO4R7Myxqh#&aJB;mx~F`bhWg7O=40i&FH=$&8psECKip#bs9}@u
za-)@gXraxrd2G~M+5r!g46I15dBW)4s{kypyN(>!|2%y2|HMcEkt8IPH6I(PUPvJe
z{^#!69gfzB2t(YQwYb?JE5b&HIFRTF>DSJ*)1gl%Nh8{hTC``Mu6$m%zx_B0;*1{S
z4F*EpQEdMHl(UXWzq`i^4-V58cA9cS?AQ)S$vR9ih5L09U}JY#eW<r&(F0uZKk;y*
zF*EAyyrrKz-hVQ8y+t+D1t>a+K>S+$9xDtAnY2nZ@Px}3zH~MK_PQbo;f_~CA&P2p
zr1Z>#X9b$Azr!%Ks|<p6OpB7vS|y*UMZA%|*E`IrtG*dg=$(T+g`3S<*(Bl8*_;Bc
zKGiC=t*5x23~XgG84laSOUcLrJLIstZg|V!%+|9IGYtAFh-k8#31K!D+P!R?lL>)N
zCq0nSkBkTMFpgp(#>o{gPg2A=wJ9d8@HHivsBl<jYLukW<xV^+ybg~WEkP5iXF1{3
zSF_^a>|^=3+XROoS8ohd*&v_DF}1oxNc;*rC-(b=xE)EPsxu$B`a3=@d&4G$@n!w}
z{B5%I{d(;6jhDZV{)NV!E8giY`MRz+Jq};8gsrVs%wenHiLCA{-+(QUY@s9)d2o+h
z2x5<1<6$(%ysu2R1JS`sG?}K$Zs@*Q{RMb3W-6~4BDx2DU7TKKSc)5e>cr4)V4AQ`
zfMbc>Ui(x&=cjreb$`r~y};`y3H;+Ze4en)rc3f$eNM^H+r#(l;iBsyku31>(fP7;
z#PS>1?VyesRPE_=xO*uvraF#+<iyeM`ehkIlZ~Tb&9LQK_IhP(vw%)nIBM@IKGHd6
z#h$^@BZg`Vb)3NJQvR(6tO?HnKKy|~(2j`ac01LQ&50+#pChK^Rm=^z&1k<eCf9rt
z<Usk8;DG7z=7>G7JcA>KlJ*POTyx8rb%U}(1h}=@YA1&Ff&*fySL1|>Lw&058_cMG
z&*h5n<+$ed#c$b~w7Jn*-ni=kR8^x#XWMb;=J7*Y7l0#+CzCt;e0vEsx<>ZCl_wRl
zsIfN{6mI#y%wX}Pg1Ab%8mzE<e8o<m>skL}KOH1`!7hnuoo4ZxRck5OGR(eYNa3w^
zXksFX&_M;N{TR0WFLt)1jbnO_@623iZ++~p-rqqC$%mmCS-bbzHPIFiPLjR|qnPb8
zx82t{LI55f3KJ>@28MUVL3uqzs|Q>=Ie4uDkM45*%}HxW0^@5f{`4vg5J6zJv#&?d
zctYmD!sidk+-TnJn|01yZHoyRkiS8rLZE|;wDY*$`>MY?h`L84uKsOst*hM-BaWiH
zHD_?G#I8={i`O$ZV%h<X6#E_kmlNqR&Yy>NSu%!BjF5<!$UO1nJSD`K>5wDXUO-Cu
zIb4dAf&@u{GgOvJ4@3Iw8o9=bloA*C?q>8AYz`^A^ShPncjmyk!x`(fBG{qBtr^bP
z`&!j>4kOSSLk@4I8;j|@yJDvetxmj;<^+oKa9X-5+n|e2U=~4nOwmR}#{y#BopZT;
zcZ~D`&E9gAj?S<$ZjovhdTp@XtTQEh(D{}v+EL&BbHX7BC-I-@k(8>g-f;^(w`P^|
zyA$KO7fj#E)%|Yj?YU@lJ|3yF?5X6^?XuxMV8L+>)11ClHVo4ny`&k~tot9T{I3pw
zPZ&!U=!_+HbktIcsrDr4@#?;-i%j_}PJ|0>n<T2jfAkf*Xp3^lVYVGAd^qXXUf_VE
z-@!ble!bnbXh(xUGM73{GWYi)GWVlybgRqFx-Y5tQ%ar0o)>@qgAgy`)SQ&#c|)cW
zRMJG+pjopO<JX`fJhgIVexF3qXmEHKD#ml5l=qdKP5HUAWD&8GM{oc^>z+2n)lryO
zYoBM8rv`>c56Hnu<BBNI@79y<wcQ^i;iq=WK`&k@Wa5}8nx3sghy2jXnL9nHnMvz}
z{I2J{u8kP>aaPk$pN#)ljSu#7)7ibi7qWZxx5jN*@#eC@)yP^?l~b7jh_MIgVif=b
zjD8yPNM7Vv`0w75LqZEjw6}lqZ0}tGKqnI7AP07OqQJJ-yiP)EJXFW@IRt?VplWP?
z(eH#ZXf~uH!Uf#%SaShB{j!yG&P~VIOw~rF26CXKnX<WBvvw{c^Y?(4WjeO>F~Mek
z9XBmnOILlUp?9}@KIb#0NdyO54+nqnc~lCPLpj`~q;0Mr`ZO6?Sd{xB@&1cS$&L?t
zN0ucAkKAx6rcmhwbZw;~X0yB%U^;gWG<7Yj3+jH`gO)i&ddM%yebz~Sr(Fec@CxlS
zFg7~K3S~@QDP)V{PAbJ2AHXj``4);Ghff+zG~+T-*2xu0`}Nv0Zlv5sXh&t<_+u5X
z=bLPK4O&83ET$!yIfr@Ota%;svV$=2dIFm|MB#$jDH1)($UmMI9oHu0`3N<JuuOE~
z2msu4!DLMT@LsH3J@jCFXrv56EXp;8F%fw4BY&#w$JB76!i_g>5*xH*iW)tsZH50j
z!-L8v=sQ}}R*_DMRI56s8QxTe_k_NqC_W_{!l%2jlFT|hBUy_6s5=@Ro*worjz!LE
z(Cw<iC%^QOaQMS3R9QT0W`XDUkTR3;t4C?;?5ev__&VUu!D#oiaNp<`RRhBJoim<`
z_KBs4p*H8*I?uO_O?~nQy(14^Gf@WA52k!L6rPpy(g=9B^Y%}IXD9)bRQBadKEtA+
z^_o<2lKu^vpbi`Idr2NiUR@sD|HOA<S1<g(w9SGSdcPZvB!JL+V9O0*G6{;8jzlO#
zX7$}Car9l^_C;zxaA|4)2$5s~W1DyH<0~HtHV(SAXZ6V|kmpJaiGPe{90r#$po6KH
z?^>*{jl%b4#!K2<p0t#*J_}mtCnu<+X8bk%Ft%q7l$~S>QJ@yQuk+m?^VoQQS8F)S
zGm!07ONv8Xt{cQ6hjB^udi>1I%(bIUH=FIOm?+Rt3kps7gs7#1`H3UHZ<Z%NxnB>a
z1XH|I(#;4IIIN^e%QkC~7_P_m5FmZN|652vbYSySnKyrEaI@9zQT*X#W1R22%wFI_
zOv{sJ9k6n5q1HFVf-x1)bqtN=yoZ(gH8DyrIKGcA4pB5UcrChh;2SQsaVPfWUFn%n
zQ*STz9s76qz+3Xs0U<D|N9%iu`S4(4h(xX8!)%U-F)C4PwnuHyTxmL=+iREIC6&aK
z$o|h*NyTgG3rcuLFKXT1+ATzWn5fazju{(aPYVnR%u$!?+v(2j34^U_78wfL?yMop
zkmU|d{^~Gxgws}y5HGQ0h}P0al5&@BrHVYWg+t*&LccK@qGg_?+l+f92JIahnXD#t
zPh8D{Q=o{;h*yYRiIkXvg6A)>#elmn&xO<gv%GE%(x(S!uCZ<q-y~>9J^G@scd&Y4
z+r?Zl-7(IjpUwM}(Ymv6IMJbG6`nMlWHhXN*Hrf`i_-q?y6~Z~mf+oC2LGjm&QIfC
zi+8J(x8m)8I>2rtYs8F=BhHV@S-ji7F6x|oJNO%01S2k3;+2`hO7Gs(zr9=el5LIM
zMNJ_09y07zcwBL3?r8yRNCrAM;Qti92KGEiM3^o}IO#-Z`gt`aZ^Tlc9MjAob9_Kt
zh|_$Qcak5BiXW3o6T_I4vBs>PRcW5dD^RCV3695~``^?1hv~i6+8*ftrEh`&Nncug
z0{jX~N!R*PMuXQ1rFXM=|7O>mI`e&vHIbi_W<p&&X>>^A1K?Z+)fK6BUs`KxJ=}I)
z14y{E(1sJM01-9p4u>{e1qG~M-%L+v@SXY(8CBP+PHu9G?9fAYFx=11-+X<&vmA9~
zL2CIDjg7wjMTtnfnLz3^dzU8Y<Z45BM?6!p%VU+Lr$Ipa`cM0`aa+<~((G6UVRjmz
zlg5s<^DQ@>H^I|fF`juy{&R-^al2l)5(3*D#<$->DS3TV$5-xCGJ^dUx3m0PzAQ0r
zC0j6x7OlzE(U{Yz)PW$MI1fWK6!ZnpoCgj+<idO2=hDT~45x6TI-X)WY#r$8)Vc_9
z8P!ka=jj2j04`Q@RBw{GkddE!9qxXM&AYELKp&T59G*I`>5_8C<;enf@7__3M)w-S
z#la?#L+m#rZj?TD^fCAlzneSGIbw_Ke;oQ*d`~5ya&0Lv{zKh#+YLx*XR#$L7gNyE
z2Q{I{_jCBjo<9pcsWNBc?&acpYASl!lw}G{YA=QeJ}i}Bd4`NgG*F#jLSTfbm0K-N
z<nd$~@L;KJAfwL`_Q8k+?Y=yY2Me!vw4<X+ztWfg>?Xo$=fpspyh-dY7IK}WUIn;&
z_>X^et<}5kkc8m142Bq<@2Pe_jb0cI)i%X`PUr_6>IoSRw~P5Hc2i3+pzV+3dmm`u
z<GH-encf~}A4um0bcq$(-WJkoU^Lbd(0FelEs3^_?;>^z`$ecY5(E;vKt{BZuc)GQ
z35=R|lxP_}u(>OQwuA1%a1ibaktQjKuU+C?!-rV<xmOwRvbGH4@OisRO0BdYn&1IS
zo_)2d|490+_etoB8htYFtqK~Lk@9BDd%wx%d4drk4ho~O2d_D$_51zZJUuZ`I$X9q
zPp$}Phprty!MD%uu314Re6EsT6U+S}II^g|Q=WVsQi!4SfpNuP)!$z~iSiD5mOu-u
zm-LN{38-Y`igW-UW%#S^&2$1^_E=<3Qvx;Ow>%kpnmm20LyQj}ztbpP!4+6i?q(*K
z>>M0&f*M~|qDtSge`sbQ;m{!X$g5w*l?M$@;l%FxQzBS2E_+=Wv^@JfT}w$ov1T8E
zjL0<U7)1ROZL(=Crbpla_fr=kd-j#g5M%dkPv=%ay_f~iN$4+q<Hs-1P8dkKjW8R+
zjkbtTvw*=9czqmUK@fl3=;w107N*;ij|K}<uDPnCE1^tdS*v&wSMLORb<y=29){Vy
zwpSt?wwCaUZd!>5!&`co?aJ`jRX#hgQ*l$m#%^BgM>dwQ!8vizi3R7sdd*WiB~1Ty
zUXw#ncDC5>@B&pAnHhU~_`jM6^+n)JJ(!1<DS(5OcfSzDgz-e&&i}0LzQlEsji@L(
z8?{EH+E?WALsJFO(rU5r1D_>ftZPVyu=ElgjfTiZistDq%?zOk89P4td0xmGVjqUA
zAmUfj>T;%`k)Xp}hEO9pI-YK^5WakC>TCfGNH4?E{gEIP9+%(W`F+)jICq;Tgd1)9
zjptB_)9*vj!br$n%D}gQZ`<5s$nDQVHFs|jytd8~Dww>@nRnr=dbcj<kz;2o*KaG~
zCR?Sw%GYb|%D|c={K<O=<REPN?s2}!mD{uXeL6q(4<`QkgT2|8oSmi$KdVWW&Rw0!
zQl)R5WqDkZj$8s$n2h#kXiK#ss=2;N>mMB#E%~wK3QckAS7b~1oG)KjJI@)72ta9d
zbD?58H}CWtqano^=gas6^!7gX>-%n-vu9FqN->BJkL39}26f2DE1C=H9&^A{+Z1n7
zCQxu-xk*#zRKD&DX?XXG0D5|6KHq9iO|*KbMz`&KduE>N&=t6LY!8i5*(@5D&PH?I
zezf{v79F)%Yf@;z=mDpqh$IVKFy}`37vX|hYjxSIy>n*jZTJy!5Ru>ky@tLjrnP$k
z`W8kj+EhR|wXhwitd}bH;$zw4`Z+jv<ZY%r{{>D<4vWwa&67zvZz0ghS<*>V7D2{X
zlNe)@Tuc4QOjJZ3`}SCN*kWnR>}pRaPH>m_x~0ctZQ4;__A(x?t1sS{Rc-9{ObPsY
zo5if%+8cRmw7ZTK>Xm82Ky1b#sgU-aL-XxXPZ<0MJbXPcFlqbThLIvHC_CuvoP~UR
zdIIFYToB49&2s|Vj%`x&lbmmDr)b#MuIwRwIKO&$$>cC9?k=}0(AU>@w4Vm-jxc@p
zYNJ~?>f`Ltau5EB^&ZIUvV*E!wOn2P{Pa8%*r0U5pP7r!YuJo99jW^Z@aek3THFAY
zT;Cgbjz`40!?^`b#?v*;!NMb(&0_6htuJ`9^tJ~#r@ze|<oWP$`E7sBWHqb9m^0b^
z=|I8b7ew3YR)@Hv%R~O7xp(dd-G~^@Y%Xgd?*hUl*Xu*IN`ud`iDK?YDA6BYbKRTM
zvaqqXBpu&={jpZm6olg%Lob2-kr#4&C8>SLKS0h!@d6+Cmx6;CmdE0I7AzfhG1t{o
z?R<}XLk+}LwW+>1IhV6Gb6@#DdQ_rITl%343%wfz+l-h#+0G6#UOnnqTkqqvbIcnj
z(k|BdJE7Dq#mKLcK^_U0Iyc}f_VP9dU||Jo7L9erhgeS#nfx?wdhf_}+*eZoPMg*_
z>Z^G`9XR7kzWx5SMvDvWT)a;bXvg~S>5m{s92?bkPsT1#CtBO<oRf2!TBL2Y8+1aJ
zUB8H^NQ5_^k9c>7GkXh_Yr55%Z7><0&q6q5bO!qRJ)!MfY_BCr-X!th^}QjHYfD69
z%Ln%qKJ!>M(&%Q@f&W1Cwqer3-*qVR!YYJMf`~rIso&T*+^k7s5YFV_3D6XKLwJjw
ztKvvnomb@>3f6vSB)~#FZ-YPeMS?tZQeR!3C6zhQUK%Q9;yQM0RC<S0c6g9*qiq1q
z(DTiW5qVfA^c=_hIOgoj0?IHWE84~s>iy2wFC!#)<JmIOxNOWR=igDy5=WNA@(3PO
zpQpMHYz*OX!&dH(G^ipvE^18=ia$FDZv6oFxAEzP^F~0Xa$F5Tp9Bn=9WckTZt;mG
zL8T&Fx=m+=CvRyB8AMqKcs9h(4@#UJ4)vnolJ&5jp~#<j9EK<w4j7Lejr}bSPk9Wz
z=>rnXFoF3{#GApUht#I$vrP}KP0)wu9pulRHgfDr)T$=bW2V$j9P}MlligN^tt=$$
zdH@liQJChWC2a4*@yfBw@ja1V8#l*R!6!zKR``uBEG^D)c<C1JFr1C^j-QkpO;csJ
zB{tSLH6WY2(x4{ryO=a1oht0bNW6!=CZECNeqy8TfZYzzs_{FRj)X^xfZKgMcrC}6
zl2sbR9kU9(FYeXBHUrrN>RK3`Z5hGkOvVxZYwWHwulHWrT&J~9*N?4dl}6iF0$E%Q
z<qiKdAq;-?Vi+@Nn;pl;?7D-elwtCwNE@lr-zd_1)b~u+y1@K^evD87i&n?=AsVAf
zh#^J#aLOigAIM?r0x@OWhQZKM{eH&R#K-J|77?bo$Ooq!n;2$UFcz8T;P+}fUs1xq
z_uKpXLR?VuK7o#fj*yFQ9o!)(jOg;1-q+8Vyh?3*lEw{c?d{JClfX*)4m3E!PD{eT
zgur!9$QqSXK_>Jwqt0MH`Sxl>bW9RdT*!#rB=+qBei}~?UI&IAdP*&%$XC;{DfZSd
zqiW2ZeAf$fk_>bM?039q8aPWA{tTdxrl}<QQc|o1RlOSAu!SKOO1*f@n`K*M^&!73
zyY<O9k_Y&bBffn|K+JwhU)f_)qcX%I)}$^QW2z8Oc@=cxo5I&uU_hYE(!0?*qS#<_
zih{v-v&+SThVMcUxae82jm3C_uAT(~TtyvtT}((5Gv2UP{bJ|D@@fO~diVvOLDd=2
z=3I0uKo45Njg$8QCwb-uTkzlmB^gGvjtb!dwNoc)L|~v*EkKwS4V|2f-^91FgT}u7
zx8r;xmx<(=G@UZQF8r-J-Cis3&z(ectHcUIvhQj8b*u=ly1b_HUC%N~_3oJ|cP9T+
zt^l{T!y^jJkIC!>tgba9<T5+VuCKm&xYI>YYu)F8Y}|mBV|D4<vR^t98eC}C0{~oJ
zXJDyT1={0ERB$-p5Z?4L(8=Z8LXzv&lN2iTRoVwei3k2=jhQLl;L5Z-T#HXDj;9op
z;Xj}+l%(FR4d{|vo}E7bMIL9f*js46xtXXn-)P4fMJZ(%t6F{s^qbTws{clRPg<_0
zI@@lrk!18-_Mr-^s(l5WgE<RJY<xnBP#Hwj<z7eL{c!A8bFi&>NEeDXULOhy>CObt
z_Lbk;VneU^FA3>q^`qXZvn2e!eR5u=L?Z4V3r!lC>;7u^cYS+MPhzxfb=HQcad#yD
z%4Kh943k&4S|E8+G#P*B73{6kb;VkVJw{6Y?~yTe+E{|9>?PSEg1~K9oTXEm;VqSr
z4?_92diD1mkb2fG<kDK$vUxd3sr5&^lWLYIDr7u0#+(vf?=*vTvOe;cXB#1cFb`Rl
zXiA@Z{@R=Ie>wVW$$$q_>1Hir>4~<zH@Td0r4XLA#9MV!GPjy;XAKVJ;AKoCN`y4S
zIy_D}xC|SKp1w&3#We`{x(H{16&NT}CDTVCgKiO}k$7SkMb}(evA<Sp3y+G1wYDQk
zGN^|-|CG>gjdo$E7s@~5(cWS-yB}9v2{B{L9DSriG8Cl>!fzN7=hMSf1XVk%rz(!<
z`K51b`eM&j#J{LxQt5xa9erZ`^6vXkry1#d)jMQ{vQ96{u{rZlM9d@K(UEtRQicBF
zsI1WlQ>*OJXIWUM#fvz!O&?t0bq(qXJ5nn9fj-lGf#K42<J#x7bl^&tZ+Kk=Dy*HL
z6v<M)K5Zd()YK$eLbMzyExrz#Kp7K1>^;@wBcBucxhs2B=DXq5NLV0^c0<k2_So=c
z!RyBK+%Dy?Sgj<g1Q!wxc3O5Fx1A5&vio~NT#r0-9sM+8Z!q_sTG*KSMDq(zKO;(o
zAaGTIndxBQz1mklgI$3RKN%z(FQsWxzvo+gBj=1c&&rd+n~%2oSWF@xKRKv`KQHM5
z<t|SB_*cAEQb!D*_sMR24uysM2FAd!(8{TsDelhC?=<?vHOk_JYkW?3wI@#d*mB=B
z#eYFDlq-P{L9~6Pma1<CiQoS@_kB1b7j-$YYTjmtPx6j|YYNjYOsQ@>5s&3mwKVjC
zZdneAfUxn{zX8_S)uE8;Yvk3A>T*1*i`zl5Kpjn6<SjYs!+*tG>{@j;C5l(!(k5|6
zeB-lE|0R^LXC-*+J#|;LyHZ#4x1Z6cOND@ZLA<vxkAxhxfFy3I%KoH{ifxIF?#5Sl
zfsV#B233|i;A%vQ!^}W>-DbGXwS{(W`pl*2&rr7m>(Y{t`MS=l5bEZ^%nk=aqupiv
zJn)p>Jgl}_Do?STSLnU&KuAGc632pn)NQ<r?LZYqgt?FK<#v*tVUD*JIRg`;m<mC`
z2}xwaGEoVVJXV&lif6k)%adHFOVMlb0T<toVSbR7cS-<hBtvG}U}Gh}+GZ&OdK7R9
z>uxI_P%>_yT0kh402)(1Gn5j%c95*}_%Jb&pc%x?6#QE?8_wU}QeR12SX`^h$Qu<#
zv-*BNxr{6@f?%m-9BJfiNO{!dr?gSqU)nsWi#pRex}BAM*O7->Xxzfr!%-VgeUVBH
z%u&t>(24$WD{thmji*?JUsJABNy)I#0xhHH)^Fr+u@?NWJ}*O>1SfSI-KEiy)S#@1
z#;2%8-szO*vjhe-;2j!apvZkItr?@oyuLja=)|<*uUAET#0CPorjVomkO$y#YW!t3
zh@oA<FPz9BYbqT1xGu3zE+x*}(m!Hwyra&X>pp&z_qaWl8OAYl<hbzE5QY=T7$mfA
zsRNrb>RDal!CP&Xygr_$UZKB@rqI7**DBy*DSX*Nv-*1vGmHG_(q1_r?-Ne<!_LZt
zUbeI3Mjkf<9K`Q;TmQz2QAZi;nGeMiDWF>ci;3}uXC%u&4$(9e(Z%}yW56Y8Y{;4w
z!sg*@7&K!{b?c44)ZeW%XnK(;u|8Tov@p585Lh^UO009ir0cllTo_`UW_P6zoIzpo
zmbNb*&rqU|mUhHifj-KaNa@hqOVhnBXM6qS6H8Ruc_S8aL}K}{UX#PmW{In>u<qgX
z56xmne>yC4?8n_13Axw5FXJOTKenjMkl?k;t#Z0B$lfg7U#aupw@lSdIp<cBqP6Gg
zOyA2@>W^<kfBMyvlDx{%Wfjae#e=j%Nt-)f1Bi%-Mpa}!Zdv#NX9=D+S_{<(5bP^(
z_G`t`JorbCeVI^TP*wj_sa-T`u~uQAe^=%hzdqoJiW}{%(zbTwE4CoYGnFt!<`T|2
zuRn(7-?+HYsvrrsU<O>DXV*kQ1@KC%CviWNZ>GeH39ZAJ0gaO^FjGLB=>hd2S98uy
zrl9m<$#0vtM?}!iKi!Idepo8H`Inp29De5IHjM-oE_VB4pGN5AtpWXX#Y=Hno;+rp
z#Rs*jds)X?f~c|dU}KK)NRn2wnYaIt@i$~+kvPz;2l{F=bL}+Nfx8jkTgr$f#ylUT
zXu6=m!K}0|Wh`h3A;uvDQM`}6rgR41H+~uE=9~*GV=eLKPvsZ|hki>tNq1w$jK{-v
zqiuYfUpu;6EA2xmaFo^XQz$8_g|y?7yyp(hf-HAncuIaKcrf;Z`lT5;hWyDvaC7uv
zR#qc!W13Y@mA;{c(Eiv^_IN+9<sbhS-}W0N!-%Y=`@qT+zZPsKU?IW|O20Vl&X4<e
z)wpgQlgzU+CPEiW6*}vb^OBB^gPuEMR(axN*?>q@j6o|t@4poZ-E8thN=!VBXBrku
zwFx0fv7QFEUwsYm?%l1?w0)$Vn=tSxsyuzdT$Dz(hlOPQvdT6}Hnuxy-9HBWz!%Y|
z%MkY@vv~h#gxey%vx31*kfK31tDY4Rj;iZ)^;^s(pTO_#bP2?l^!)B#cmlS|##rj^
z_p`iw2jJ6IR|NK7EY%`YpSBnaSXdp^PB`vPiJNBgdD-m(o_V^p`$v`g(k#jFwilr_
z2<+5kdwr{%EHItWe&QUUOX;Mf{I?<XKdGk^T9ogXdP~0}XC{VOTcCGS%I9H;xEA}u
z4|pn#CfpK>%pVK!&Iol`M#~c@h<C*$?geenM2j`celVbc6;K>vlvw~9^kOO`uN%Nb
znBEK~_7aG-)m~C8*x;GC5Ob*89rb9iG2)4=lxp)<1UWuvkWf<GuH}RKT01&aZ4tZ9
zMG|?nUsQAzc2AnJt-+7<#4cFBTZk&rH+JAH`DnX7c$w&)O0Qk));a795>iOm3HY8)
zUZxls^@;E9YyGJdTYW+rh{@&~)F1Ue3M|U9VV#=WQ0#Tx_aonp0p0;zd~=x-70*bd
zup1p<wZ-;-c4}lGjZSmp2l1AWKb%AUN1OaO+-PB5#*CsBcfZO1I}4x%t{xMUScfp5
z*CkrojcCDb8FR9qI@*owN2vuFZ$7Y~wUmZkJpA}Ia$1%o3%Z^F&lMY0yFbgOJmO*E
zg=%|W`-fic!z}jlZfv-5RkNj0{hnL_?cX1{GsK){Yul?Q)I3n(X?LD9A}PPq1hqG<
zCl6$;CJz{kU02%(q9HdD-dB=#9MS+FuO3#*HJ!skbOm)(@LH}iz-<N`$*b8+a<RKi
z`(?>Tgrw_wadT&+;r^Q5-;ube+wW$n3+g)(mM-^*u@`>h@vuHOkR9#3Kquylde;$3
zy(1?t?X}`~bs$#cG<vx?>kx?%yrv@ySm8aXziWb36TAyH-epO)SWVd-@zX74MzgP_
z5wxELnoS_lGTwYv&lVZZetjf}4XUn9cF}&S>A~OvboC3p%3N(UL8TD)K%#n6ipCmA
zPD~TRY&B@Uf0fC1b&lz9I>nkI0NN%8;044Tx8cV8w0gOhZ+#!JV>RF8ECP*$<cd0;
z6)c{Y;E3^dV+Vt_$9Ti5;(pmKz9{_|kz;n+`n+$y6=`}aNZV0fZ9Ps$2=yLJR|fQd
zBib1>R@8xMpgcz({*`@xssc6Dnlp-u0>X9PK}0>;R%IIfALCVL!B3Bud!UrDOnIUT
zM#UJ%3T7{P*P!j}LnPAS6gg%ybV5!82^w)6>p46BQ{tkW86Pjp!b>m&e;2U(N?MYO
zM*3+-ituuLGXG>@8xp?p5iI$_47o|8FH&ZFkk_ys1+keM?*$&!3w{w(1v>E#t}Dl-
z)R<h=Lp`-><3^7ouah;%Nq=X<+GfYI*Xw8MSwE!Eb|HXWM;jIiw+7n!2C<{m1wEHu
zD~>ePBYQid<&9NcD;l`vtA2B9Dba0Rbww~geZJ!NEQRZ5vx=M#e5Cm<WQ(%V@5=;M
zLc|+b&?Ks0=AmjCrpHZbrjw!r<t~+Fo{Wo}BPj^JHaE@6C`!YP_8&{z`X4hkFT|L(
zDHZ@=vbloaZh25{xu7Heo5w-R?hZi&CNf(-|1!%Mz<a1-^i1Y?I(5W!l3%(jTp|d7
zM?{7gV=&GeRN;*L7O=TmF5opX|49Jd`t4~z!k&x?|J>Gsukbd<66eu(^E506+`%L8
z)x(OEn%KIUqf8gzW;Xq6pZ%u+<-&&8B@~QbY0&<HS85In9af^n@Dxa1^;08xJ*|t9
zq>^>lU1}rp^GLz#Z9O^ohXRXkOJVwXRHIZ2UUzj@v_d);{^RXeZZ0%t6O)-pT)j4d
zj&iloQRyEY0grZnTLXUY#(_<j+eVDz8jN%KZtR}WV#Wk5^?rR~j-o#=)NJ`mCX3y5
zE-hjP^x5M|<b?DS6yZy*!h{-qFGD*!fO^sGg*8#qxNUhZn|6YB0$kJ#h?sVE0dT%m
z`t|24;G{m24Q6+F-(~usc~Y#IqG}Dn0RtMd-Fv;Y+XjF7-L##2w#-eimIaS?r~=ay
z!Y3PGVM3EYbVjZ>DLiKk*SzwZ$9O!^YQ97cPYO2HY)guxd1Q*eDAeReOFvT=x2@ih
z%Hf<S>b{J&`)%Lf7eVa^Y^gmr_%R*yh?#FWob&gYO6b_X$kEh)g%I<E%6Cj!RFr_5
zl>+lQQTS+slE7K2KfJ}Jh)Wr9CM&}n$`iY8HW-%!^cx3i>-Bt&_1>WB){sQfG#~0e
zy!2T5V3T{AN}Jv0iMzN30l-JHKyQ~P&G#u77E{$k*}ji?nzaOMtM}W_%@&k)_3Hf+
zKA`ITJ66UU6r#XshieB8UDW>5k2sL{Dv3GCN&&8WPQ+>9|G0)y<hToZN#=>x9_{;u
zofcZJtM)~r!Y7D*M_C{~-}6ObY22uqoB#2>aPh4SSjLz{{y8i#Tig44B^*fBjR+NH
z(sZmE`-sXmG_8CqWm^pD=jXR`ZXuGAJXn~eHR6a6IX#h**T`RK6>&D4*^=VU&X}6o
z>m^rZl}YIExnu6#zi4zUOXZopgav~wInvc!E{UHk9y4==*XGEnq_pT4)s|fQnn@;K
z7%Wot(=Iwo#JeEOzuQ$V;jIL?@e>l1Qes{nki~-8)%=up+UCpLKgHC>rFT5AfjSCa
zNjDSo`wb^z)TvR6Vl{rO>X>1c3tnSa2K@L2vd0@pu>fhS^M5`W8dQn(=gmhms&#CB
zLWc!eiz|umtv1G}RbM!<o{zi};DQ#?rO5{ygSpYHw;QD+_wJZnJYke^CXdJZlkwvi
zUo2{$7V|!v5*mem^p&QNQhk5kFN@`v=U5l*ard>?vl+!Wn1X)%bP`U!y%B>9RMkE;
zhLWIp_?pQ)S3gugh-L}aJ{dpC0ygCyDJ?sA`d94U)<bo_=?OpviVAPBp}`?*@5b;y
zGtP%nSh8hJ7eygL0438MC`@S6%kE$%bR}0(pFaa5ZbvKiMg=pzYqCY2)gy6aA!a5_
zvud7atp_K5N}Pr0Agu7Kqh)ubW_fmb8STTr&5pmm9M*LOap!Ib+UD}c<6ZI~cgSdT
zsJvxha)>!HgcXu!_3$E7c7*1SXQ!qDq#*nFE!PJPy{74vV{ngSewQ0%xpt#vNNBMg
zZv>P3@p8<u|BJ2zUN$*W7Lcx3=`m@!eazRpRw=v>OiU-%oC9^X8QgGnl#N*M45*sM
zLx>iifZ#KuDB@-p1`o3eO}`m4YyW+-JJisyHL!Kb8ATQd@$TWP8ohMceQ1@P4F@bA
zCP^osm&&yi8BcW18Bz(q>F0H7zh8N!)BGuE`j#}dy5oi|q(G_m;Q%|1&#~K5jVz+M
zaw%9vGtTTG)BJuq0pbHx^10!WoN6s8`ywx?OGy_fF5_nuQ_Rz-n_uR&V*QBG_2a!h
z_oCePvZtlcjT@QNAFU<-uAa4qU(|+M<G&@R8mgS+(K2Lc9m?QlR}WePLSlKdoWtl!
zZU)-MzjYBc*CN{qSp38E#lU$<suq0VY&7+&_(5Ueo2IQ(ACKFqkQ3ts#fh_1HWOw$
zq+HuGs@avQ=L&?KNQbuX*fV1aCSaVGxO|_%N7lT@g%(D}5%H+p@i_2&tEmJq3Q(*w
z;=9Pk0hjBwQ&0&P^D0dav3>1LD0&wrD;J9GR7MH>d-3|JZgQPAXL^VtE+Yd)y{Z-K
zeCu(CknZ|VBlXjK?MmsZqDGVBD1Uy_m&Q#<Jz;nsF}t)ZZ{N6gHm@dAmly71Gkn_L
zs95Yu=GM3pk_^M8MMKP5cvU-n{uc%PttiZ}-9QYXnUN;C<?nwoHO(F0M}@T<`#FfO
zetF=~t^{CQACp}6_x8$^IDIf4>ZZ@ptqYUSxK+}5-~MPf`OL%X7N|lDR3a=O6lg9e
zF!Q*&<*Bym!|J)&-?psD>sy<f>5%y)VJDJRj!jtkh|!8E-&_BsgRAOOVPrL|AxW*a
zKxinDZ@JyHh{0%Ny=QVy$mhejWXCHSco)t7)37z4I~~mC4{whnSJ+O!0Lg%cy7^xZ
zOUs++#j-9KbJ)`Q?#LA>Ky&3Zcwy3g$3BP`<5j}7<=Mr9$1|@(A`+i(lb3Hzh_P7Q
z!Z<MiVJw#)=djHN();GIC-Njn>oSyaqaCk$14>s7NrBsCl2!%2wtpLG6=B#OZRvcM
zQpGgtvfu8AArIPp<J82kcjDRz$-s)=?hGIzGI62n%pxKRP_LETwO_5rSn*!GWxdUG
zUwx53z?3!@!dzQV%T0yB)HIjmY|iMhSsdVy9pY+LOC-zEPjbPj#T7Q|8k7-9C$PpW
zT76v2xROp5n4Ww2(-*aca(E7d$dNxioDAC2ofsCEsCamEXW++z$#gplQ-r=o`a%p_
z-dvAe^Cc$Vf+>Ie*&WSA;qv9WGy!gbaEyQC;dTWFvskS*w}hX=b*MPt{*f}ow2Y}t
z5eH=rPn?3ybp!^)<^{2)MNPl634wPvpR;x3$9KsBvkxYSj+%~nNI9Aj%@`KMHY?Sr
zx9KhtsNHv4=e!L;IWq4Dcx2WWAonrF+mo`_?N*dEX6iym<Bws%r0<$_S(K8)pTm-c
zsYS|S#3{Jj^b>Ql4knS8|K|0iGr|XXhFLkgvUCB-4LP$(mlY7IJ4rR7etQZ0jruHY
zK^2Yaq!|b&cK62ulS01zJ2?=jH`@Gw!s4x*p(ic302Q|YMm}jocO$k=Q^*UGn$y2R
zELW5nxc?-i_f{eJRkwwX7#9knH`|bEg-5j3nkOcmm2n`W$uvwg4<0UpVNFdvxL#00
z+kX!C+<Xh-(*>x$ecSczwK5{OOl=6+eW97AJ6!eD`T$+3Q=qz-iVMK}io}At7)!!s
zD4_R3RROze^CB1`NI4J9l3b0%;hJt9tL}+56>!=2-7dDw`2=_RBFpKkiy={e@Uf@C
zYocA#y4ZKlHuRI~`Y+SVT33gw-+nT|u<%mST--g;bBo|xtHUb-y*43<x<Xx_JBZ&C
zs<+!gm|y;Qr|k?!PXaAnA9-H?D3Jhg^tw&rIXH9is{7l1joST__nPc<Kl@Y+b_e7o
zSp5;fsmp5#%H62&2j4sgwE1ng!uf(paYB+S=(<nK3dT`@uoODH@3TJ>yQ0z-Kn@|p
z<^dNRO;?$E5&LMg)1r^zANNL&Zh(_A_@)wWo><&G^2I|Pl}iBqlfOH|GZheQI@`zC
z?+^FQw$-ZFa7>{tcz~S9l-w(rfCb~cc};Y1<xMyLS>d+4RnHIGo2f&e%fv#UPnjK#
z*WE(p3B7OD-*nYFf~dksYvCl-IfDOo+5e~6-VBIRda1`!R_m-N6Cbmr%i=0MLXn`!
zm)zTvsoee*be8E-#gHZ&AINUI9c@^R`beit^73o<)`N@DviL9K?>`Bm%wQR7zk}B*
z5d?1gB6tlv;EQbET4@`ZxJ|3b89d%Tfji4YSV*Av^SqZ(wq{Z;W<3R)IJ0(tpG9Cz
zU-`wKmMn452`<ah&Ha6e{97OC$J3-T?Oe|hwo7$7S`q76nu;}{kTl4c{M){PX(=|u
z{I2G<CETG<>&d&-s@<(?g%{w>NmJ}DF`4aM^C}6VeRqbM6@696)$1iRK6DY}n_=5p
z2DBpWl&1`5EB5Qt*~3g#%84p`Jx7~u5_{6qAxmQ8BYYrL{O~@YD^X_ru>$ZpG=Y!r
zIt=|}$Z}(JGB)dB3UhtG@_Z}j*So{V3QgJOaKC7}Fw0mRHbaJXzxk--aCnN@XXhXZ
z!>h?b*u+`f*7`+n0ZZ{}aR?WOAy8!BKm0G^cwmx<gur>|)q#@Js9BsYp;7yVWeC9o
z1tQa`gz)PeDTKSpFA;LwU;)BgVy~JJ*~LbL#~6qLPvf+`9>t!<Wtkao(#TmJ)*p^L
z(s6C|sJ|T(>?TxxwV2D@_<Axj1^@DT=6Ps<Ugp?H>W`>9hFPK8l-W0(<I=}Kf>zhI
zmb^bdO?s3%EfFCd5ooI7Ljhl#Y5e#Xb{qI$phqExdnAjG_ey^)PVkxo3)=q4OS=9^
zx%<q)&X4nixy?EeXR-eKNf-TP0(S4>gN>&OCvT3*1>&ujo6;bop(8i&#sJj2=8=~t
zuk=9EX?IUr#cFg{M}OmajA{efH7yzVJ*v(9j>?U2>+Ou#+J7>fd#{I)v!f5Guz&fu
z&<<9zG>*pY6cbiRGd+Wr)fBujYc8LlhAGio<Hi6dsrvI3j{Rac(^ouJL;nv`ZynUu
z`$P{T0fM``w3I^8V#U2J6bclF;O<u3f;)WhB0-83cbDMqS{#bILm=?x``Y~G`6DxT
zGIJ$Q?(UvF=d9VLxZg&gxnf#()UM*pI0WRC@r8?^@}hZ3x;hIJAwQV_F1=5+{mn^#
zp}WaI|Be!&!7oWdEtYji$Cq_$Ta?1O{oSE8T}uj2OnO925Fa(F_{P%um`DcRedH}`
z>WS9!FI`_!U7luDhVG6o=B36xf0g}<XYXBdMNL8il*kX&(?$AxKRp!5ZKcg6ql1vF
z+IIfCInBPCSNPtjZ|(Kx=oP-m!*Inxi1aQ%y<Xt2qmhS<7_V#BI`igGA~El~tH}rN
zkDTk-9zO^V-6bLS7kvC9<D`T&3cgbtGinvp1T?~9Q|nas>&OM-wD}8f@b69^spZ?n
z$Rv;x-(9K8Y{-q~xgV`F*8w3zGr>;*CEE&#*W}-z{RN4lqW&iwtM<*Htb)O4CjHRE
zEvSlOF(q&{AL+Tp_wjxE@;RzdIK1c@dz1BG!>dbTHMH+A@jNEn{*xL(Avp&Lp5ZIE
za?I9v=H&&vNurmR1wXML(L>C%+N!|R?c{4a?=k>vjJ@c@7Cp;Fk;#{hn9d7bLkpv|
zj0Wmks_n1o>c1MGd`)31Y_u-Qtno#V6-4hMZ^Btkzub=8jS4s|J;KxpBVpO@WcF_~
ze+Mhmsf(vcJIivH{bNY~f(`W+wcZI4SK9Za5;#`;l$KSz&)$-KEhvu-#XsZ-chqg7
z6)0bOU)RO~5!aFl(RYRSt_RTeXPY2gmrNznZ4w;6mi|CA)w{~YWaso0=hCz)rL8?5
zNkeI5cc)`dZn!#wuJ_&WgWu7;e!lPIIU!9!Vyz%9+uedzC+e<*@GGp28TTfQFRq|8
zOXaG`3bzM|Z_i0Ih}sZ*x;L&xi`iwS8<7YlP|^e{{=g;OZ)+mpsMUT!6q)E7jb-^o
z?z&E6Mr_SzejP@GbUPNLQDv@Gm*&y7yw$q(v(SV1jX@Qz1@#>+P&@GSlbc$v8@KBo
z$@7g*2vyTwlRLM|KLwj~hcksvL7K10-yNvt0iqGHvB6MB++e>4$&}UWNwHu}P-~>A
zhs4HsHimk!-yvu8uOe1JF%zRuY&mLDiqUhSSJ4>e{^O~C`)nqDi(m(*a)VA{Nc<im
zd`9sn`J*0NnX*@)C&?Li@uK0dn3TCT=+-mW5<OqJ{q?J8(W8t9!3_r{1Ig5|Gx<!#
zvt(zA1xKpPoX3|M{3JM@ykgZKgRB}F^s1D@8d=`3LQ6cloMu!AOGFH(4wY?0#~0}n
zBz+&M3ef$26zPA7=yMt8<Y6PUQ2vEY{@P|Yq(W^-=ce6L>^g+<lzv|<)Ua6I#a3n4
zOK2BN*HycOew4X9ETG>baBzKGaXBkI7dBaqJ2QOQ*`XU!7i!ceS(JG_o5oSj0m!^=
z>+zV5XE&0lv>kse0QnHouiIQ_eV&sz{5;1iK?ts>^x`$xSZ8E@Dp}-do$!BXyaSJB
zb%}zQ+m0#|wJJg3T;dsQ(XKXJv1qZ8Zjkt2=z<P?Bf0ASu6`_j(%3>d1b?~BxPH@1
zHIyjP#=M@Ombh+oY_C>z=3wwy_%X*FzF8UIkM4KY_Z6-8%n#NTw-?VleynIswslKs
zWWQF`ulr)?qq6b+DeLk#d)%H-_Wv#7XCVB4O}~=SJN>`<<?2?UF#(P(Bf?T#SSGm#
zM=vUhn|xYH5fX>*B%lAKqhY5F^-Oo&Uh&OJe9UD0D~T|)`n0#ujBQK7dI&QW|CqK3
zzoAqg*ed>Y9-Q5FCy5|kD)D!K{~0nN>9v&P_$8J!V<de9+&tQ@Z2)F{H~jtJ6Q}ji
zqT9FF(8Lb6<*b#a(|i6uh@Mg6nZ%;wYRJOY9b#gT<iq}wvv!w%(!-d0lKd<2a-~5R
za@k^e=th%Wki_dVHJ#6m@xkh$&O1<f2?si6s6^zXav33>?~OaBVGGr|w;mBV<?i-K
ziVWOlRV*AgktG%{yNY}9RP;e8j6X4bW%+`$!~-H|e64xvRi=(ybZNbwHPk&mXUAtj
z#P*O*B|tAL`y*(`;cp$^{`15G)#!zCE9=$gkWGY#UCjKkG~$Y<MhiUt7MBgU9q4z0
z!hW9p#a1s0I1D2=@$IZZF>UR%t9=$ThjENm4p&|3V^K~{TEX^k*)_IdsTCr*T9B6_
zrmRuO{b`!h;OU6G2h*g45mT)|w@R-H&1<AC9_1>9h(Ffz&9#YCqvOnPWCBV7p?BK<
z7_qx?>3m5dHs8_`g3~yjLFgK<HyN(g|I!MpVT-pt()+HoE7GxT{K1T+B^XqKem^Wj
z6s!ZhuM|mrg<L2^7p@2!IN#e&2woc<){<_9%cp-fY+ouZkn#@zwUfxVzt(t9+zjvZ
z6=6r^UejAGp;V|J?U(%`6{s}8GtL|F2^`mJk~tT5w2C}R<a?o<MHYyNh;S-E%^KAz
zBg0r%O#8$jCVdfG_cZ@D-8TM93&V_w<8$%ea9nW8C>gf&1#^5u5H5AVy%%v9o)_`D
zykdha(BaXO8j){2Mo%K(QA<_2VZ$Ks-#R6a6j^$>-W$Mct(|avKvB{!F#yEUu+vH2
z58o5PZM1qBBEDGM2>-qakSb%P3szBxC)%$vXriODy{-4=q!qn#;?r)wP~eaA#Fq){
zL^YiF^+pISUgG85SdK7hYz!%ZS46H}xf|MNIaK|_mQFwKXk6*F)}N{?0mNNqu*U~3
zoZ^XB=R7MeIXrp+iZAVsR5NT&OrNO8xOC9jH7mi0VZ+_If*ai0d=A%cKH3d1!Co&|
zt<^XY5ojzyS#!QC2VO{}u;8HAV2!a@X&AoUA1!0HIKd6rN1>EpV!G)Y{#)mK%Mu+N
z5iw#lWRj*n(vOfRrfkjIE=aZ&=YTo!Y^V2PKBA9mRfY%~PKHK|q-+Hzo>N4$psv$k
z87lp<6UW7)U&SVMr{-{2ZANC6j{}EBlR>lR&%1H$*AS9YR-FBY(+g1!z0Mv2g&@=L
zS6OjcO8%SycyPRYZ~G(m6zszOVlK&k(>!amzDDL;8apMBWc8%bV?EvUFt)I>Q%~3*
zry@Zj$js<)Aod9mM<dP>to(B7@gum?5980};jR{+_annceXmJ^JuT@E%jJ{8cKT~P
zbdUJ>;h{!U-iKDuN#n>c-ZvESt6+sKrmgpk+P1DR1v4HY0!J*{{96r`a+G651d$Np
zBI{-7PnH3M?oS#9e%a{^Bc!KtOjp36#t?bQ4R;VYxL75gYOxh*$S|{SJl$C{9)52h
zr0_q)+)vp0d%l_T!xi=ETV1lNNeR|G!zvGMtK{&%w`X!!mD2B1y@od;e<yi_$EjYk
zFIchJxd}R~hEz`8lVjV}wa3!%cMl&`nJ_-sD==cM)5rJ|pLJBV=55wlPRQJI2J=iT
zfv{eyt!jf#*e|CS9VcW$RVWlgHgQ|MXXwv0RT=~7IvO%bym)VS8qRtzw@_0Uv(-SJ
zQ11Fv^5DdYU5Vv0!kQ_4p@2g3Pq*jAyR+Hlf{x4e#Nsqkg49%Wa?uD1E+-JG5GO11
zx_(Y|HG1bMkm~uT5*~$SX<p1!n7|kJreEk@YXhXLb>YSHC;02bn>i9i=(Wc4&7m&U
z?pVu%fQ{~?B(P|~ds~3X+7nLo$e?$;F?Ij+2Os4?-e(M>zD!NAxRzb(gCj!&+X7MA
z(I1T~56>F@A7vno*jM}c^J*_R9uD<r(iWnR8WM&-uYRpU#iw}UROlul5kPUZZfiqD
z7$NSbvfizmR&4Q8)ev?l%PJi%A^VXiz{+bWEC5m4FW7L?)1LZN31j_<TiGXJWp0;4
zFS^1a=LBH;XJNm5QoKznRt`V!(xTfYSoRqCcUf!mx$oHMSkqo(W}(-L)cD<*XIh^#
zf5BNG$6L{RUvh@pOT~xb{IpBCuil)lA)A?>E&3)aw|gn`TQT2PGhoaPO}8`bmp$es
z=TMJqyc++pE58^wGs^f(=0CjLi}GWpsvf3jW)x8WuG~YGsmRS*Lpv+_ap;IU#aMZ^
z9ALXRJGOm4uu?_Aajh)t=Zq$3Yu+eYVQ78fyV&?0tqX^d*8XkgO@=<kr^({#3vN$8
zr{potXS5A2cWvRtEA~{227U{due@WwuEerLTva_PQ(xx=4K*wNsD&L1ni%boZ%Et4
ztmilVC&A5)gpPM!IPylP816(dT%$>sV!W{Nm3q&Zn)5sFCsY4p0pD=@?|V_=UGCHa
z#u)>bofW#IEC2~Mn*vA|KAoImt0IlDDg1{&l0WCqskW*=kJh;2l!JQCy8i6GT{+_P
z%C9~kF|Cbtk@FVXzhX}zzkVM5(@Ez~0hv**=uv)<>bj^Ea2T-7(Uc(lX!g$*UHU=+
zOkl^MV(7oYs7gRb_NUQ!JH5(@&QQI#wnH|`|C)CES87;LjemwAyCg)Jil~?54GkeU
zwpFUgY_2%Xbd-Et!?3yGoCMQylC3%I9SFxiM^KT3((j5y_SPRY4DSe|;k+!!51-gR
zN+JKk!ngEsUBR@Eb(>c=;E3NlK`CHKxK%kC<v?pAAnISW{|gV@|11NW7bZCnww3=|
zCc=#V4hD3;Z*?<?5oSJGX7-)9h}481hdRH*w@7#6^?;a`ZK>&&-9^sxYw;ZGumai)
zmZ|jKMW=OvkJKM2m4gx3%Up#kJ;8L0e#H}gpP^}hVdN3hXDeB%w+ek*Y@gr$C{LwY
zDPyJ4B@8pzV#6Yn7`SRrlrRl3qPBbTYX~Ax>T7%VTz*}-cJn;C)Coqz?rA^ol%5&&
zeSlFTJZ85P46}6`+=3o-@!jLgp9HM$nh#2^3X;?4@}{B)p2t0|x9TPjm%B6#N6E&G
z=fclRcDeLwu)>Zy!6pt}8bZ9a)UrR~zK?SM=iBg-Iov&{LK9BOXH{3SKv#C<mv|N_
z8kSOuoM%34h0_oZW6UNJ?^N^xWv*Sl!-UnkdqaRdB0tZFu8R9?cbpB!sj4l{Ar$tp
zT_6Ec-V3dCEs+iV9KoK6kWE4TMwJD@y`=lR!{FEyhL?rX*Mzt+Tb74e*Hs0*hG2Fr
z5`*_o#9@={3zfS0BWp?sG^C%!TPycwQ3+VIUuQV+LUye*C@TLvcB)hD!~+Tzcdu7r
z;}Uy}mBjuf0l#S2p@FGc5xE^MP~*MG^|4oUQh97(8Y;h{;Nn^v%K2=UT5jSHr3|mB
z?{KDH7s}62^ZEZLa~@&#tom2|O+GJ&q;20!V#?vE)s{igsHfJ}(9q}V1>~=fSH8Bi
z+%j){^dUdNHNIM>bt7EvfzrStm*333DNZLDZ~|r^bm34?jfBbR#NC%OB(w1n>eu+d
zp7udn+R4=O-}FK?vY^ysD=ihHCo=-dXemyEiRowq{lDOZFaU_9=27*tfzZ#}$@}iU
zMYLltUo%Y&TIHelX2`2Q9Ez1Ed-1RLv1Ke_FZ!adT>cG$O7)R3Q5qGRsGOi~%hA?r
z?9lMu(j<k;mddW7`%6~S&1}MRpP13cZ^yY7-*##L3i}Rdx7fJLJi_j90(>Hf89krL
zlai~{j|TE&o{DkJK;HDXF8|oWT*8@4pFXhM{6~z)F!RH1yf(&zSXb)RW=A#JaS<7<
z$$?hT6v`C(m-&s!*I|OHL4^(fC|3C0V$fQ?{-ccSoq{vxGz{U}F1Sa`x+5aH-SHam
zZ4;r@;x`=kvB^#3jZLbtz9y4`rS2yDk8<E?`S4wb_W9|Yt;8olra5f)@cQ;_o>=_p
zpA5etP9-!d?T=Bn`BdPdabH{SylDOK?*YHt&Av<GFkeJlKbXHPH9zG($_69_9C-Hj
z<;)Q&9p_n{Q@g!uyTmR`!#REbql6$U>Sa)9aGka^wE#l?zC}-v{^s`ZDKq0iyb8bX
zo6!86c<d9+7pN86lK$CgdNJ2t${F__WxUt;V=WVnZgsL%m<i*OE`<Gb?nWXU6EQ(9
zR4D^%ThMWbkprOaVJ^6=6$Wu0$`(Sf(|%bA3-aw0H+?ReMLMJ-VtfGT?%$-)WFR<P
zWt|q-jZgP<U`AAh$e&8t{8%2`Y~)f$-Ek6k&<JDGM1tp(JP9nuW(aasC%g^X8!y27
zuRwAm=e&Emfc3+Z@O)3c6VX|SH>~C}e}Gy1{w5ns-7nfiJFWbA1NP^2id9;=8J(yC
z*GSpFik6H^_#Va|^u=ZTytqc=y{&Vrh3quWY?lTVl>A~&L<uJH`c*PEVz^Qi$-r8s
zdVIWHMLXKb)3InNGPe9SkWO)(D#2$JR-AB~d8U&0^MrX%?ksM{qaNmr>E-wmPi|Z_
zl8gIkaDU3dE9>YQx9~|x8pXO8gn-SMvS;>>SgpZhe}JkbvNqnulg!{Bp`+Pxgtq>@
zKf*Gk*6{FA76@vxh&BeziaMDyYHtM8g?<U8xs8ruPT2{EOi+q$^Ura~P9b0FWKA=_
z{WM?9B?$Q7*L6v@9w@T<e4g5!C-JH}>W4i%QY$)A>)kKE)aV@k>kRHyt^?FOkTXNv
z{5ghWEWv7%Kik1|;Lq$tIDE&AL-c+}mGXxlJMTrtbwKxjDF*YRlwt?ZJ=aqeD~d<f
z-ZSS~2*pLz#HZ>U4*f<Y%7?p^DxAewmgnTTe(YDNJn2y9MUM#Gw_?D<KuEsL#@Uwx
zM4O9$eIA--h~R1&1{}X%CgA!2F#JRn4I_)}Mwr`bEOpAZQX9ORBE0-2(bX;?;WFrb
zo<e3l)s_Lq+%l0nDfHBe``qCTt{!8J?BTUD7hAG(M<|R};=M2gJKkv8^jg(Z<WNAI
zMq%A?vX6`<Z8stJ^qmGc;R*Fe4&n{xb5wse+%rQ^U*ud4?O4)|_OqA49}XwbTmzhS
z95B=~*aLJh0yfDB^c!|!^Td9PV$UV0o-1{yF^{CNnTd!_Z@{j`;krTgOF{MtyBTo*
zrLgbew-`3P3QJ)mcERF?-eln0+gY!mhfU9^w!dKny1^>a+vUQB@|U<WwpZ{lD@bFT
z_vt4k3bE_dk@-nQL}PhX*{>Pd0c?F&{qtNh6D3WAL-qK2zFZGgR|3v0^?tRAU9cw=
zm$Ku9jSOsG!klt>krTQ(O^*{EcAJ7L#(I(TGrRTfzi**b9vb1L#23)Ftx3fbxf)#U
znjs|LXKyjgq?+N^Yk>ny%*u|8+9Q?q1m%OO68OS75YtQFi;3HGXEPcdNUgZJSVAY=
z_lm`$H(Q@#2-LIco~Ow1eAC1o#s)8pcF=3Rx2k0FrMg~ZWGhBs!ydP7@9FJ=@;}T-
zSMzZmj%KhJ$mr((mDqRjjjlS`7%L?XNil+<%$Tt}*_;k}!ue>-Rg3dMhuABL-S4tB
zEBjb?cByv-;n#xp+If|`_h%wVT<*t*jR7kHa2p0dJe8Ox<Dd~M@9ayw1QjxZ9`&Aq
z!9~fwKC3*Xp#Bx#ARD1js=mj$Zqtf)m=ddv4k29kzn4MibcIuQRs;N=JkFOf3<|u<
z_N{MQ2PNJ|0fRK=t}Vv0kO$*v)mID(v2@Vme$2*0gwSV;C%?}&cxSDoO<!Jr?($@a
z&!f`?zV#Zrx)VuAzP*b%!g4=eAglQ=q6!>~(Qw2sFos`i^tmr96q_8gtgDtrSfZqz
zZq1NPE+K|E&yW&hBW^M^w(JKswCC%oEu8kYH7B6MTV5)8LbA7x%PqJIpO(ztac(o<
zqQ80iJ&7Zp7lvlV<2PJeI64Kw&#>OH%<f41rzq9m?K)5fD2M~_Dykyp_%FPm|1EJw
z<)gsG^?h)K6~8`JNkj)FcI?!4HC@-uKaZR664WW)Qa4jpCGfKAo{3M^W&FtkrFR$6
zo4THD!&K-6;mG27i9uJTE{>dY0dh;yYfg}Wy-1WPEb-L;JRADQT<PzSepk(vzI>5w
zrz>1docV)WxAPn_uUL;X#+W26!|d(D5W3B6E8VLS<a`P_M;rLlA$*1o!6MlERjaDs
zC{hO3U>`!nZ(qv|ECIWvf7eIh9ie34a9jkdi29P&`+sPGIgt(`iYF_CY$kBC0DLx;
z=_G#ZF2T{NTu&niPMl~V*4VBV(*wl)Vyjn}_4(~O=xea}MmywavI(tg(N}45?Tc9^
z{&I;2lV?i;($WK^83}${v0Rm(KJD(K-X(?104<n=j}|gT|8%G!4mL6v<J*OFP`;e*
zDjS|$w4Rg4A_S$dxlR3@L;u<uzo!!>i`9Rx9m|<5YaJc`&i<1Oq#QaOqV{2K6L}gJ
zJR~5n>&H3Rz~29p!&I+>ZKz%Enc-CSp(;lrM0*IVWbyhEjP+UbO|EiuCttsdN(mO4
zc8y&g5<uOj?^>w{sfb_gPQ=%Dre_zsSgsG@-X#N<AX&pysqc&5M~)}t7{w*LGK2F7
z@{%w|XjwX}H3LAP;fyMJ6xTYl(Za-wHh<OLgG_!OhrZeeYqMt4^U8{g>&eF!V*fHV
z+D7}8H>+A)*+KQz;|v?<xS8D&?28dj4TXA(aYII;pFR7f5`3zo#6H!+v_0+Fun4}S
z#u)%f?9Pe<;-A!eNtDLAvp=yLxsF^NHH>;nht*opeUYnX&uG3(ah&TTu(KCWdwCXT
zugY6$>l}Ou#DR9HtraFxJ-q#xfP@Scc6r_WZV+`4SlswF-yGP;pL*(I+cdEdm<sCf
z#>KU94>|MGl}a?(!%#ul)a2R#)9SoVwp!a=<4+dqg&Q{qAJUcUJFfG5HO69S#wIsi
zyi~`K`ea6^o@uE9k=gNHn*&ja1R;I$X!0$w{ZWi98c=yMM9b64YBrgnLwvs0hX1{+
zmQtt~Q&vIH><=G$;vIQ@>8v+2Iioi;lcPR;p)C5!q#To5I4X@JWH6Xy7Jz$lO`av{
z4|<^F157G}ZHh?`kd6L{<)Z+~e(*t$_dQ$eZP(7jt6R)@SHt?O#)AKEB9qv6rV!kG
zx$3-FU8|>>P1b<g5dK%&6qYSuO=zcY2@+KuWc2ybP$*7+*f<yX3!WB!w9n8Glgg+a
zDRupudG8HxsX~f#GNb2WBdU|pJx{a=;^emdHykm#jk0nA)>pDqMDeEkdkCk6YPXzA
zY=*SFvQMvTEBHMx1`2W)^y9YDx{x0|-%<xX&ESo(ZBYE6r$k39VM5%qDUBCGk!ozz
zH>_W)0y8T0g-o>?(bW1w`}t>dV$}oYzX|!C$G&aXkTEHo`bBKX+Iu;xUZ3-`RkKnX
z=gWUAWHpVaOQA*^=G=}GZd>;_@hthwfz27hrdXYGMf=M7pF6__SKLTXps&=z0Icmq
z*VUV2L5e%t?_@~`?}M;G!P`A4r_+INR_m);&8Ic#$j~8WTNFShCHRpQ?=k%>+GtbY
zjr7Mqv5AALd%uuGXdsoHMCIM`l14en2qghGpiZ@4j;8aDVh$Zbn2bM|Jk&Ssx;Z}@
zG1)NOP9zik6IZrH-1iwN01qpm+^bLtYy5BeU{q?q{+Ef=7Im|jRNj;*nHLn{(8UE@
zpG^v|b47+`Hq}<Trnp7I*l!+J$$-~LJoBMI>Z)=+fZjq}It$`6bN94@`rAc4W*BvW
zKmoVUOoJIPXDCUq{YWQegLwyf08NEgIG6oRcpsbg*>r5G^a2n0;*N55HDVGL6-g7e
z$rOs+J;aEW3FuImvt6Y+W4cJo+?K=ctw!!>PBPfoQZ48M`Vz)7DTU)u?2aUpoZA&o
zf&v?}8?Js0q2uw%aHH4y2w=)h=$j^F-~30F@PDjoMO2$RT@<n@b*!h{u*nar<3vAN
z3YebHxsjj{<^XTyom-8?NgSZEQ5tBzM}LqCDgS-fq)wNwmkV^vnpit^T+btrm{sZA
z>CaWkF;|XmMTl!4&zqsyI#z$r!xdtGqj(;MrC<K@c98nRD(%uJy!%(}8dI4`2iiQF
z-6#$b7@K}M4FC=Oy+hJV3{t34H_3XV1|NWx-vTs8kNKk<Pb+?MoLW=r>h~Az3tF@B
zGX0K9nO#8u0QMLZA0LlKp^b#B0f*{7K6plrIq3})WH6@h+FkY{c7$il*j4Gu;52L>
z%JX&Sh9d6U?Za5aaW*j_P8QDMS2(?R*iYIvM$Z+MQb?(oGX2WnY9Ed$DKhjfh8_e`
z7&w;_V`!Gq;(_SSI`&E&N$%g-CtvMUIkr_gJq)S-e9Z`T{Q;Uo&Jc7&*;*vpmGg#O
z?G7d4?lF4-GLXz-Su7m>MkwA+qk=`;k8u$^I`S=Vc*#DWuEbCQb--4vp~=@h>KM#i
zy(z#He{0uwO8j%ax@7g`Xp?0xxbBwd)L+0^QESS3LsBc+tZ;SsPsfdS%4aagC(eUq
zpTM{Jh7z{$I<IK5&7D)3Wo{X}EkVb1NohQGY7`|{1HWGZ?D}PZ_eWuICBztpLSW}N
z4l)J`1mFv3DC!HzTx4p!9PGygFbZjAse07Q!yi}m&={JTPF8%lN3PGyPylIil1^sx
zi$nw`)=A=yPX_Xm)hG|@NKp5X7wd0go4ck0n$yJlL4x1Ql>HFwajw=L2QCv3r>0Vi
zN2m8K)_>lGHM%({60bNuKj8{G4C`CMo`w16UyX|qWissyDwxk$f9Hj-I)L8n_Vmkg
zbqkvS*t6pB6_(<f@TuV{_7ZkWo$x`y;oIW}so$6%w{{5$I^@wJI$drN)uJ}(*;<!l
zgKy(afFtB15OG_!EJ%V4)QjP*;#G#?{kU2VKMa;yYz6lW$E!PiJRHLz*X#hiuX<jl
zIC8IU+qY|ai|;Tk;x^%VpD$~z1RWsdpC6pA9vG88cHhy8<e3ywDTzz9KU{o9Q|k=c
zfY(|S`@}f=xS#)}48x^mnQ>8&<jyu3+HG>stvWOvZg0muR=7g*pNRIeqgGTrG!@V9
zKsV~zlyv?@OzPC+44;EF6n2yk>w&=vQ1=sNN?vnm?&=wZ(rOECr@7QYT_3f_odK;*
ze$QqWb6Apu8mby<DwU+<1=qugY`oG5;a5;0T{XThVt_?ZF$M~_PWR4@+Ls9(*hy{f
zt=Hxr_t2~~50sR2g6q;UXxMP2fAR?_vIvMvM*&>ft^dW@^Mro_9?e^gE-j>1Wt1lh
zqJqbF0@i1o6M#BZb9)>p+E2VlWje}hD*rKBIV_-z(n`X8;F!fKpn>1g#z$F%3GY)V
z0g{Ij-VcCZg1^HtcHAmZ!B56Cg^(9D7W$hLOAtw}8!eCe09W8RwTJPKH*2J}#Zo6r
zJp5k>GcN-&56yd;+vQ)58=0a}-jwnxl2-=3!CuUZKRvu~nVugXM?2y#56j)#-i)*R
z-Iy-u$?<dT$X<0$w3GO44E}XmY+VGXREan?t20Y|AE#+1RjhpA*dm27y?ZV0aLXrJ
z>-WFOW^Ik{_2fZ*_h&+Yro=q`waV1MO;RRN`_?(2{5Q6l>P45ke{TR59Ylwv*Rh{{
zp4CJpI7`UM`tz74@y{9nFf8PxUD&)H0XUQKX7?a^^W8)xISC0M02dO(``5on!et!?
zC@^X+U!-Kx^e+t59P_jE%E|v5!3IvNc)%WSxlRpQaI)JD>qX$+=`l02GzTYV<&Om!
z9~B1eGaNd>7ee^>PRd}@>(^4FPbU)2fSt13B=#KnGn~koeq*l{Y+%u6McbnAXSOvR
z-`jZpuuYQTYw1GX>-l^F)i9&49Hs*}+_qtl>+<$)@FIFMC5ZArxxvLOao5xqG12WF
zSOdETeCGqgPE*~r-KX~V7vuh`P^OozW)WY}TK)t!9bPOXs9-R|N5FCrCJ7F-yf_yF
zR5N{1DBuDMYB3D3KYUC@!DU!_BS+(OsRrY0h-8+>MaN?o6QfAK8d)Di3t(1&ocaiu
zifnt)?lDrIcZlFKXZfev9VX_@iF%0n!BC1~3ogljwisMK=BGvVrw+_s`0wyvwmZ*i
z2N%_UFQS;Jbf_>S{h&eM{{a*j9gG4Lk90WNNZqyG*27mT`ug@CYivgJeRdj^m)@SE
zJ4{ZIbSlMIaH6gl_qy2goA2?_NVnAR-j&5r)&vrP(&W#9TNhVXJ|w_oLqd~QS2Dz#
zI0^+=^!QZ|4-sMk0Ad2k%$#+DHdT$G^kIx$k~*u2_syZK(N4nT<XUE{j;wp2fLB&-
zYQfw~r<JNX+iKbpwk4H!LW9L#GtNmp?35fCg5T^)GI>ooIY2K}Z=ohb(t^I<9k=dp
zmR(C`OGw-Oo|GTVhqDMRR2~(Z*?*K-&hnwg6I?~P+5Iw1=!Z0WCCiz$hE)Vma^9ML
zgpBwzK82o;ySyY{2WDX~xzbHlFK+vQYnQC4EFsed1-j-3@kXQ#TXu2zosb$)yDU}z
zi4iK7tna$&9(FH;ftv~UhDu%e;?3z5=pAfIP}k&rHH_Ob<#<Wxpi25WHm#D%!Scj|
z4fndW8PH*sWccgSc87DoLhzIKJuOX<XuhYcXC4Y#0%pC?zp+c^-_m4i-duB;zZ$4(
z-8tO-;^<b{v?C)Kn+16RWxXr)4xAL=!wxZWR2HhVfd2oyOw^xy2URYX&TR61t)OP(
zySS5UU}Ti>V}$R`S;&8HzDB&~vDl>Kqg9q@f40YKG8X-X41L>iI8cEEP)NEgaR{)5
z^Q#xdP;omwO{{If8mP%mona6D3l?@Xbc4<m@~=(B0U?Xx;RH)mBB@s&qA9>D3^Goh
zhxpP1O8kMH+QU&7ybOV{;jzt~nY?l?nrY-*hCO3C*y$4N;gw>heJ;VurzB1Xtk0<l
zO_Hj~8nA%(qA<VUC`N5$z&SA@_PU)d;ZZSu&&V{4N>gCiwq>MWe-H}|w0l|GMl{8z
zn!TuFY(@RQNJNv3^{Geu8!fY$bG`j%x}D_$r0mbup+<SGv%$rA-Owh?;SD9X(^uRG
zBT+|~J2d;=Qhh4lFRrTkyOu9p8~RkTA4n^Nk^FBs7(!ngJo#(a3AS~Mk=cvJkUmrr
z1HnM0&k7fO*)I?4!t?Jrx`h==v{At?l4E;@xOjVBS89=?$mGI|%(~X<v?$v|yM{hP
zyup8Oj#r3>zr(t7#QF%HsgK!?oEp}0o{PUx;(yEhXfYj`D3B_G3{J@@QC7Dvz7T1u
z{DTC|%=I2`l@95Nr(2G{UpncD=K%bp5qBYBj-6hN$0i~!Z)y^B759IpkdLDp5AI7z
zi${9y4ac>3fm{HDO~7w@doy}B!+Y@Q*NaVn{y=MAUhFS^&p~h>nGNv{ZK1Ul)BZ0;
z8n3Kzv>_)F7N)fx&UGp<rKoJyN)`6EMTLThSZoY%U4>kUdLD4!oXnHQ(TNzV!*5`3
z!Zz8-C$Cr%r&~D76)aqtuL01e%bh_>DG`seFc;D?tG;G`%_?1VQubs^<Ddul9A6@N
zow}#BnchaVLqo)3n@RwMNZdkAMbo6BnO0mdb^VZj+fQ2PoL72>QyxmS?VzSbF+}6F
zGOYEM8oOzIro)zXn(H0MPkj|!#HR9#S&ZMNy5*sBsQBO|)Gx?Oh<iTQP#nhQxf9m#
z{Zi1Cnvmk*yrv+g*214~d}HB(4m0^>GYAK|r@3FVtFe0i=w}G(8uicT28>=Z3<e)Q
zzS=@Ch*%!LI8fD(aW^<nM19HJRyD47m4@E#b2dhLAsMFaNc!||FV@Fs<l&J3BdB0h
zD^p6{O~E2?)B9%IKIb(i-MPte1%D?o@7o8~9Q1FupjY}2ST^G~!_k+<b{Nr3Mvp=l
zH;Ca1%}!@jH%9_9Hmz&kVNe3QktWTxsHy5NxZhgigx)fJ5370oHN!uHnzURyXybJY
z`*M(hgxq9dgv7O29h9^=WUOzedT3CkVtYo_Fe(!~z<;65WSNuoO$&`+Rry-ftim^C
z<m3F%;b;qzR3Djrq(T^<rbW`r&F=XE^-8U$)Hj{;)fRkvy&I3u_^_KU48fX_m+A7i
zvw21@{8RUc@=;3nJUPq-@IEf0<<x^7dFa09gdX-{60J8$(C)Zsyi^CT?tLtQs^Soc
zq98+CFZW_Mt+2nZ)W%Y^Jcqi<WMIiL<?}YXZBdo${`n>-Urymk;)RR5sg#Y0ETcl-
zg`~G|F5T@K(d+$v08Kiu6p|ZEMx8C44P9PFJ0(N~s7J}?Zr<#Sb3L;Z2zUk9pnAE~
zYxu}vz4M&v?)<)5U!a#H^l4(V$0l5PEySZAYd2Tnexm2w*3N(mk%L3VCvy}|HFo+N
zPEadKr~Rku-2dJbU=h%Orwjq8!~{#2BDO&3^`!^-HmK0z{l4R}p93K1g;YkVvofQ8
zl1OxHfgR&9tRIU824hap2ZH7;MwBhnTT!WH1tCI54pEznBts*k<1h`qt+7%?LS=-1
z&FO0Y()fN=4VwW!Me@k)e!}p@me>(=4*x^Cg>&4K2j+ycCae^Vf*hh4Pb+G!v5pcW
zLWT^TbY_lv?}rGM4ZhR=c}sGqZgHnVzlsQ0S6~24DM2QbKdvZi8DuW#H9Th#<WNDQ
z-JaWDE`N5{Ob`bpeew7xz0o1CMNw=opIgP-6Onr6%ndecC_(uQc}j1Nn-9J<KBp&y
zfjB0URQ?WPrK;TE&jwGn{!b=Ja}VESu@VNodbE{mw-e@*YS>_}{&;9foFnUeg;24&
z?c!|2x-vJQnt#<|H3P<l-+#gQcCu7sbbIBsxpg+7*6eco>EkW`2D4|a4xc4BL;awD
ziZ_nIN2~A`?iMO9<MH^abwG6dsn`=<C_Fs=NUpq<QigjyQ>P>A&_6cc4b@VsezXh~
zE_d|pj+#oLmVU^e;VFm)!-Xy)#!E6#L*|e&LLxmkC1diqQniBUIf}Y*=%lwGPpbkH
zF7WH3<*|L&80Mt5fWM7|!s&VU6BN8zs1`JJ?+Nd@<=LIgkS#SrY!}YIp8Z2<F{ciS
z-?=-}mI)!|<WgSPl1_Yh6zXb=X@e*PF~y%l=f&MZJe~w9@^t61z-Y<Ec5W3q7|76H
z1r;(|2guBl-0`u+?;3a!Fh%eDu3n=Rnb~kTQUV171?9us77P})?=X#m9JGGuX|X-h
z-OZ;VDM@JJ^ZGqs7Tk`zgAkF>L&ZYLWZy=`kRb!(<ac;D;ASJqP$C>(_*?m!x&1@a
z_mbQgd(k6$BMQH}O0Fe-n*uEYje@UAuQLU0v7VFFtyxWW#<O3wI7)dX&Ndp*wg)uU
zcjYea>z|Y3XBdg2jQkK6i2>3*D$tDmGu4#lRng*A_S5P4ALSciC9d+z<1;!86_Jmq
z6AKPYK!pGCB#9OqeidY!600B#A6#qx6*Hq9ExIh?gS7G99A*NSqXXH*a(s)^d5%Hu
z&u>)MNL7hqw~O1mQ$+{yUSS0R?oZBM@ByTL`oXae0MyAW%B>q_U2!r)B(R^?B}Zit
z5ZymG*Qf|@ee4grCD0$f-C6rF*w`*|kIxVh9SM=4a=C69Sk)dI;z5x`4K*e2R1o1P
zh~mrr$#QhyW>jM8#_!0T#AUiJkpjj|>#?OvyZ5ibK1~Fui4pyJP5!8JvVo<o>ww>@
zktZE3E_-IYNAxgGA&+&GgV`o}hl7Bs$oq#aF=Tm-!J2+LzQ*uzZ((20u6HZF;XvTs
zL<w7XD=h}zK^ZDwu<qAnUhos62WQ~~4nfu>#<x~fnC&d@j9|^~*>c0$cl`TAHqSYT
zsnOpXonLPAyBbZX_xE>qVeDxWnEVSRI@FY4LCS@lt>Bf<PH73lXR9sPBU-ZZHo^WK
zc85$Qpl>?CtddSWvcn<zD*~Mti%Sx6{-gnAQRQ7CvdyaA{(_t`U$gFqMSbpY)P7%C
zT*Xquk@<><hr>)hxu2n^7fsabzMidpVrK9Jl7|Zcfp5Eo7Dtm5;_hoGYD8r}-Q8dp
zz^<-@Tuzr7n$Stc*hkZY2IFwlC*%I@e|{7bO=&d4fx7whiksPk(q7agHf&$NBSC!u
zqh)j5T9rY7976&E8oAawEJS0Mib+PV;uERd1iiCI8FsDs6>T2L)Nha$gGIBDGXl|0
zVbo?pmX};ISi$c$444qWrd*0ag3cy9+A{lJu*!66n{a7TqXW;P0*%-QKFK%*5Qd&+
zRsDZn0KrIz*<bTS4hkROKC$uwrhu*Vm_#~&RXTR4YaxsZ8LWVpgM)#e1!QeBcWP6P
z&9kG}?7Igpd0qWu6Q31goZ@bIi;N7^eAH#9M+KDqyICl)K?pcz>`Q}~fHtkC9xBMY
zy6AlLieZ}p2;*zFQW^`O|1A^JM9DzJ=Z{1jn#fSRB70<@1rGFYA4j(;(B?HQu<gBi
zi52Lb>K=JYJba<9n6sxf<&{!??8+4Vomwpc%eO!64@aS(cAUV++0@?5#UL1i$m&Pt
zT&N)TF8vxa;-Mh0xq#@}v0BML&DG6ekIa&A4Z*F84ngSzBm}`jMNY6Ilx+Y=;=6rf
zmdw{>=c==7BNjk+wzr3MyjVem1fqkGMU^d<U~qv%_d!!s@fziN`yN}3{nC=%@8^?+
z-YEXX1~!6T#+H-iGA&~mDUhLgeRv26zJ!aTEuX*c%#Q82>1~pr!Mibg2lS`V{ykfj
zHO!0SkWG`08g#&(%iwcX?xB+9S<FSl0(}aDYw8VCcA1t#PZZh>kBEu9gogpt?X`wy
z4J7k-tB6@kHE>#{xaY~^MoO2baV%RuwUR7w6Bjrj=JxeNevKXym{R6~Jyyx>olMvm
z5a>|CA+NT@X(%gsvHiceMEg<Ymc|STsEM7ow%)4hb}OcW1ZGaCq$1%&g0|koWYIcb
zr-dJy(%9Qk@;mYJG6VRgVGk4AN#gu<vpuhn2ae~<9o7P~o=d***m~(99279E8StmO
zd#L$!aj@3aZ;rzI^9`9@-B^mv#pLE@md^zA0+qUbt6Ud37kaViOiK2L(=E6^9={n^
zq<0vxjb(JnA_}K$WbkFWkj0W%rkxvpqP&gd|FJelZ39ukGLavWIx4O_47}d>2?-CH
z#Qx?6h%A6CXuEm=`Qf1J-C?v&p!j&w6RT>eHQxbs5V7fl*w5{c|3(W!cIB2!J^#vk
z!c8Y)zA%ZQ%+QKRorgoJIsso<kO(toEfGo@6CfV*tLdl4b&wy1PReA0xEM#e2<hsM
zl~mOEdRH)FAQZHaU5lGjGUe;uxiG)Yt1${-RwOPz+!Vv3lmh%34D!QtGQo2kr2uDs
zS8Mhq!NO{urkR+{JHG0#;}6`dCH-Sk9&y+v7oD1*+)w14q%CDR5#iKI_<=m$an$o8
zA0UbB11<(2JWLjHIdojyMZ|aU`?7#h=RcOs*9)F{1(OilMMtB;n3cz|OVsinh|e?a
zdY3^j!O2P`UutjjhRf^tu@-XnkxW>3rG=#JI|l*5c;dH4JMp|0Rvm`Z_{iXSj#k>X
zTku-jeWVlTV3oUn6=sLe_hr(Zl}2nDQ5OL1SMMVi`}IGxU2N*!(4vMtM}Ajwj-W2q
zsb9_RVmC+Aq(?8HwPfmwIz~laUZ(5kh&OK2qErD<)>F-IvP1%qX_c!@k3W6R`uuoS
zZ9xl;51)#x8-VxF1)!kmO&|l%8$tL!Gx1iRl;5U0K~{~C!1N3ZOZ3Q4O&kmWhG-XS
zpce#tvuI+!t0FU(0tKv?!uhI$1ck$h7@E0G-by+xV<n<LFz50hQ@2EtvWkZ=U?P7w
zFFh{v=<<CDF{XaEKBnWE`)vg;?5e~2XLzN-CrYp$L?QsMi-Zk%vC5GA5v|=9y*_9V
zR1lb9j{%?;c0+Q>2y6oYm9qtcjUP+bWxZv*nTSE+;rM64t1YfP%WWR#(ychDfkrlp
zIjK}ee-=E((rX9+B9t}@B@UiZ(CLD~gzQ#P09r?#u7kU`_`0~$F2WaBzXKf^EQr-n
zwsN2NN{b9!mkQj(O2OGp<ubsTFJrg82ny;W$ohep<Gm7&yrd&{xnI2cxP_o2GwEm3
zbL~IYu`==zNhEk(za=1gtBEvV(CQYV${fxY0Atf^|41X`Ib_q}<942p3>f?wA0N1B
z#E8Ijcl?yrK>ts)@fPtuUCow+N&q|bJAPsg#L}@H9a^;}l5&B1ew5qc5O92D`|v*m
z)CSiI8Tu@op!m7zYL)Fa&uWwX0Dl_HDD>Y`w1y;iW4H*|H|<3vW6jg6@#uJGP$f?%
zm~L$Jy^PZu=T{Q-rwKh?bfPz!AR;f_{Yit+^);vB_Z^eY1xNTGw*R_gyb3%cn(t1<
zu_l;oc`}?4eL!?k3tfA<)c|0{uN&3&ABQ~nZYw<m`Ui`mQ*8ly?zLl`KKqQ=UDcu%
zN(NX}h8aP2TPR@M5!>JN%(*vLZ;p)!Esu6Wu~<7ebY^=Gy2iPbM5&P1m1)GVT`j8u
z+nSy;JQ{wP=UOZBDN=jsB7u1%GAY1b@_(*kGr{&5j4_SBh2DF)=$Zo^)*;{z|86e}
zsol-YpAT;>fxv|Z1-Dtt=0GEn(JFKWYYK2iZSsr75ce=LwCK5ZZwNSVn@N5cY3>UD
zWB>DZ5&vAGJ3OAg*RJa~DAGx)j$uk@Um@%=-~aiBaDcIw$MoP|&d)<s<8GGtSj5Zq
zClBD5ZzuG7B`r2fIGzM+D5e4(^r1IimI32M+|!L@!O@=Sd04IVME`RlN7sNOJRo)x
z+Pgy~(NFmErJX00OAl!{i4D6?G%<-)MP|RUW6GLN)X)1iu-07Bg)p;n^1{l~pGIT&
zKL|3x7$sQeu=>QC)K|eljA03PIVd);U4Z{LDI+rhw<W%~_bldBAKn}{n&tU%{+Sw~
z4MhL3R;K^Y-pj+*4hG=sb~uu2n)^F=`ErBn;*P?k@jwV#6nf8r#DphI62gc@Er2<@
zy>s!h!@paDRPGXHgzyA~kp&t}5ZKABqx|pm8dr^D8~RxT@r*Lu7;lb86tBW?pj;rf
zFTeg(Ab!x9g1dSw;KJ}qnc@2?#8<Qe+5Dp29^X<Jyd>u^%2acTow0bW8)B1>V)rY~
zD)9H0zj{zRu;j;o|NHTL?K0eJHjQ2S&%+qAep4i4x~9;u&=7%ACM)?w2F|)QNdhlz
z+wyM>jOIfRg)fVn9`_6Ln_&zl-ghqzKg>}v1J8iKN*ffwWO@hE9v4r*0bfk+)f_j#
z^zk$4$kCs#@ATohc7T0+O2Z>PE6F=S;hcZIOku$=|3T5+hlHIS5gK}$ax5TFv(btT
zH7G~-w;mdB4+rXtUSrz1`AHL%pdi}cPfs9t;X~$?u1-fzw|jcg2kUI{lNTP#0W;cn
z4<84l#Qeiv+_-Tht5shVdXWHSy9NdZMjMsmD0WI;nZECl0KOy2f33MH&qyZjGZmCw
zHhEm&-k}aE$(56Bpb=f=!fP#}dnkX^7-xwG{DG)wYIq^Va62{#5+Iz1jusi9AZw^v
z2#Lv<VW#km!Nc+88@sDU2gV)24w0euh>TLxr|9}FY@VGwQyz=K>E-Q|=N8;&GHyJ9
z!C#cj|20S==Ec@G{qPdz=XsBbM<>p)M~yf!=j8RynfMUin2rbA^;L>3G#CS4*4sGN
zkX01-U``c<n%!b0ZtVfLp8ivLJR~w8K8UG{<ew^oB}ms}dgT0XBVE_67jK5xP}WAC
ztH*^>0@6=M!6eAD=B`I`bU6eDLlp0k)Tq8rrbrtE-M2ed-ieeOZzZ`cfqTE^*Q&+?
zH{0~Veoc7|Y7Pe?%0Jo=2V8)_b^6^$9TYHgac3+we@F&jgpfQ>M%{Bn`Akz!#bjG9
zlIZD7h8)#LPaqDx@c<*mVVCAO)l`=u{m_4J_$H$aB3tI!&8c<)LN}LP0n|jS%40na
z#=@;`r^f0}oj&(?FDs4N{d^;a8}uB=&_f-4*z_R%$7%>N!;<!^0v=+!q7!7vC9QWO
z!zHnSab=i``{#RPsNUOqs2d9(65HREzGK!wlpUytl&H=R@HLG6Q}(oR$)_WJ|M1(P
z5M_D84TTpETqJ1fEdsNnnlG#Q2qeg2FeXY|r^h{lp6Kl165djO1e3m&lWf867@As7
z;c$3jgD_&6K$6^IIjH~SX7;zWD}usO>U2E1QQ)J6DtW=mSTzw2(_VBC>peaHA<k5u
zD?V_|XQMb05`K+SFtb*wM?aKxh=BkJh@Qpdy~1Kgo=-{*+e1eFcA^uMXHH(Ce{1?y
zm*`L$e_k$uh!T5w4EAcMhK1;z0GW&G&H#nd%5oI&w-)6raX`DD8fB_6bXDUb9&^)z
zU8b6F=^Bl0ezjWJvR8EIy6OF!JdG6?+19PCdms|=P~&8G<M(POx>y7)walO)c0lE{
zI+RgJ<LDo^d!rX&>|m8v9cnusH>z(-SH+?eGF0Ggz0D3zL{Pbt4KW>Gt#0ayLd+TF
zva5}ui8w=@ZdzmT*4+p1L_z9IB<Q=dcQQ^0;zkSl3>hIVB8_1FZ__e@nv-E^f>#^q
zf7$BY*9?+h4W+Cu<O=QBkfDaY2ujpH^KAH(e2-Q{;?++SCx3rR?pU@3r_N4sI}t8t
zPalCfpc4u2I(i~pc6%sSlK2u>ij4UAoTC1D<*8*nN~=vGmE-S&7o?#2JrBBtGmcY*
ziaybjDE9Nv0&;pWe~upAEsSz+cU$axAAsFPyO&~fEC)FkC=fHLs0IOjouUD#3rij_
z!#1g<fZQ?`M#BVldF3VO0E{OLsf%ESL@wkY146fQ0q=~rby-_ND51=~%|x~w;`Gxf
zSb}A#_92S<mCnU7TJTl#Sbj~2=YM9Axf&R-=6nkD?{pzZ<|#E;92&zV6^K&7F`4mU
zVce(Ms<C#nq*9_u4-MdoJUb79t9`r`o7B}?NvbTsf%2F%OWh;e%La4?yz-1?*8&dQ
zz!JaaN%#$}CoO~mbeFl`iP|^5gJ3)NeC&6MVf37sb8b#3<#?Fs$T!#rA)FEWxfOYQ
zMhu6_Qxb=jr1t9iM_(HfAi`caX8e9`B|2TgwR{<ZBig`YQ5KnMWyTpceun>l5mbC+
z=>7xkOMNtt&CH}G;nEBtH5r^(+x`*7rSqOO?K1-ILjTlQq`0B^jgVq>OqcuGGIx_K
z^&c$^G3?+7(X5GN6FM5tgRcOr(s%%ZjA2H{drORb*oS)``tF36zBd~Ow@x+GJ^o0a
zw-xNpWn}(frkMOLYRqQOkrIc%HybI-f*6#8L$I2U87;Y)2%(UiqA|4B>oki?Wo#DZ
z0Vu?=Y5e(Ux6%2*g($l3haF|S04liP(sL~2ygun|Nq0A`FrU-Xh^VWyjwzy?g;=ku
zM&i*=@c^1mNi3wuKcpis*O?RZMmzPM9@OkP*4S!(K&C&h=g6wTAZKSaJ4MLdQ&1?u
z<C$I}KTjiZpidQVd9ZaRBE_;Z^&kD^ie?GU`qXQBa`=>K)}mQmTeu&~7Ato!t7B#L
znWI~C=o8&o9D_{AOe&lmiejnF#C;!-9<j*6$;PRrL^e{#&MA3+r@k|YTxPyzZJk6;
zgc3X-W!%Q@B$g`LTH9|lhVlT?I1KRa7;GJXP@~KeAth3P6^(Ne&7(-!u~uGJIR2v+
zHKV|xwdf>|LP{xg+LEreOhf5>b3X9xmo?I__o~>o3-tbh6?y`JX=!P|;}u7w7?>-L
ztD%sGZgt<x!{^jh3R6ZV5i8-J{}RFw|NLKWn(9;^tGm$qj>%@%{+vwrVtfoVg52ny
z1d3T7@;!EFeoGgzeA^d8sSYUYy*XzfcJ_Rm9gnZyk)I%wVAnv^U<CKR9ssyME8w3?
z<%eJiuf@@}<=Q<)9T^!LcG}gT6VPm^BfBI?zC1r}ZoY^~{~Sy2LTEnyd+g1;s2{#o
zGeY{4m|XVZ8If-kQ%TM?I^N{RQ1Mg2?&#mGdLzh&3OMxd+f4`VrrMKaHR+>2>qYg*
zfp?p}@*APn-YEzYOQ=$5vfwfZwUVl(D%fmd+aj2Ba?*#?AN|ymv`WJr^XUJLC6R8k
zUR3*7k+P|FBU<Qv`X6o0lj9%_dX|h%*che5fOc<O#4D0$r{Tx4VXo=oTTyNO(hs&8
zcjjDyW*#2#xTBgXL|bNzPI^h+2K>AC_8Um=f4r|uWLBuEWZvp&Ic74v_2seLf+Pr8
zGkv2$DO)I6`a1MF{rmkhXz{Ah)v4>!iH6c){_xU&slgKa-5=YuHjguz%steQcD}Pe
zZ>B2PYyXyxlbPjaiuwm7@O_2so4Og){KV>uv-jUDtY?kO#9wJVnLl9vzo`1_sHpz1
zT^uF`7?2o5x;vyBX;1-akwzL3X#wdPx>G`skS^)Yp^<K+8>C@qnBm>u=XcIo&%5?o
z`%h-g@QM4r?kn0{t+~mthg1~^%ZB%s%0-r29~O2mMoolMP(5aCM$((n=E|49Xl9iP
zh0`zKdgO`X$UAwf`ekLEn;~mDXO#H83;0I`zj`4AKL^|EkJoTvT~QOT#%0&D5%lSj
zLF+A!@EfdJNzie3dZx>88~r-JOti7&U#Sf(Chiu82<V3X&APuvJa@o=7%5)%`L^Qs
zWF0F|al5aXxw^*lJ3f~`Ya$fjy4MFlrd-+S1BUUa!IUPizbr9E(PY0VoQSw;;wZ(4
zRx#UW2j6`2FW0L8ZU4#mn0!1|fmLO?D~*4EPTy6Gvx#SVlc-_cP_~F|1e8n}JA|4t
zRcysW=FiZp2-z0GRrRtPR;iznvdnEoea3yH`)uj3)`5;k*$9!Xn{HHahhwH@h#+#5
zYOAD?;e(&q_1`}OU&C85Vlo=uM=jWq2CQc|{w35$p~oe|9fVL($Pw%cj#ck0Ts`=z
zNsDYIO_UIt>VjSYY0I1JQGMirF$-bMxav|0Ci9BaPpSs<fypIF=i7m4nEg{Mn0DTe
zry38f3{f_5fuBrSn5Ag<;#);igJ-ijbY5ah@7!r7_pLnvfJ>X67Jl|+Np8oNleS=7
zSXqi)%@2pk_tK2$EqBOHw=H9dx$|W0JC=^(xDTIvRo;fKla8Yc{#VZ*c#*J|yzB{W
zcX~WyS8boUh$&J1V3j8LiM!2<JSRatfrDM}s^X>V)h%BQZ=6Xndr=F*y#GU2jRdp?
zX4w(a)_z~`^@jXQ#~ypYx((sG#`*Yf>rj;o%g?pl;eJG1Q(A}0AIBGCIBbRMqiJ3d
zztd%dBHrDFEBr$^c3I9a+e4l5{lm=DKYM-X59@|djm&<TcI(gQi$BJ)%FSHwLtw@R
zuRIWhP&U5c_ryC{`Z?6@dqYx+Tm`LyFe5!|rt^cDU5fZbs>PCvO)+Jk<??dUR~l)I
zk3||MQ;M`i`1TM=>ierD|5NfcpzNG7iKP^i9=wwsL;p$xwxt1o^@3$t%60OJj)~h-
zq)FMMF{%Fu{=T=d#X3>yhSd~uiZq#WLir``@#^uB1UxA}&~U(KVk|&+LI%Z|H8t~=
zg*E(HGH9sU{)GdP@a)#REvULUc{o9c-!^L~^_cr82blKYyhT?B2zK5VwDb;<wB%+~
z9Xf_aj#-(1z5tFs61E4p1h^vud6NtG6eut;7t0_F7iaqs%g-vrj|Fv@9^$S}CdH42
z7~E)Al=T7dy`I(mm%-X3-Y78Vl@%ZWrDD_jcvu(p7E#m2Ap|Ccw0ZV)#&;|0-~4i0
zo7ySuN-7!`v~dd4y|AqE?BQq-mho#mSq|ZtJvcLUjv;5nq<Smtf~0Q#IB+si?Q1)j
zMlYE(8C3G7*KwwM4+RZG8RKa5DNyDKezptqEIa&I8T1`*brJ*e*qp&pg9_sYLs{uq
ztRLD#O>b#ycEGg;U+CDdS>7d58E>T34uAk~=5@;3T_A7wOzXsFM9Oy8_4D$eN~C6$
z6QSt0BhhD3BeX(JH+NB_@q+0WD|2iF-T~PMuBQwdBK)YZ4-K5@0zG#wyD<h934!g_
zm8)<2=5Bo*WOxHpOgg<-?q>m<kFGhjo2-mIZD_K;kywRHS`DO{&G&4v;gD{bb`2}?
zZcedM4#Ks83S}&d`#a4uv-4nl^hw5vzYN}Nv=@I!Wme(hLx7Oy2l?{|Y`T9?SI~z>
zC9{2QOd(+)TCleSMZF`Uk>~YgGp@J6Y)b$3{i4RG(~t61Bl*bBqg?m9A4A=$BxsC+
zzn9)@kxF-9ao$_E^~X`g(MScR#CY2pw+wXxCqEwQ5Y`QCSc3dW`PXI$nAg%$H}V%>
z9F18^4Cge0{f2<oRL}aGVC5^cK*c5D)5>e8ng4Y_rnJ@MZ9<-V;}h(zR+sD1{+!nw
zob}3?-p-(NIAve1(4eAbqVA3T#%@X&GA`FX3JG374z~9SsdrF81|(UI<aIP0bbe>Y
zieJ<PGzR((z=kaLn!v67auB!)(S!VfAiE$En7IG!AJ+_BFSb)wMJ?!|#|!R*sK6}@
zXb*XQnpxdm>>RRXoc?+#&-*XWENbn1feh|}6NkaiNxcZD^!<$XC-Ryh{ukRADo@@W
zPD|E&=3pH?D3QW*`KlI)|2IVr%%V@jq8M6yhC?Ilit>05lpahf19@bW!geUt7U?3c
zkCJ};<;JzKLrq)V$8SLpmo8DyZzogeYFV!sr@+IBtmEou^J$uL+sCap8ozz4HW~)H
zQDN!{^l8=TL^AlYFpx$bPk5bZiBDn`>#U>t^)i@if#)p^ock<%PWbXlK{V2?Q+m&}
zUNN#;%GkHyJiBI^ywIVjV0%zNihN22!LmDwoy>2qaXatYEw3lm*Xw6YuqEYxPc?_E
z)n;4-i(nS09Wp;YBC@-Vl%hfm9dqkiu52sFDJgXv!=?wuZC@Xo{U``u1AsKnDP4b)
z+>E$vsqW&y#XUR1@RY@v($4`kb7XtRvphS5e{o?egeq#ZNloN)1mqsc*b(0P?S;Kb
z;^6JE(Uhy!T*aZsTbf_IQ)|69Nz5*~a8s<`h0O^%&S}+g^d5`BnuEN_+S}d_C+JN+
zJ2<_O#D>#1%_!9M%~nflC&4?<KFO6P52a^xb>;P|Lh}^VWnpNZx#~Bu<}QDJw`1k5
zttT*KaghKWNmNRH^i072d%9AmP^`iDcbC`7#DP0YWeTLlx(co5UxsSFpLI%eVG~GM
z%l`aGT&0vb0m8SY{OEe*gu!c`F*gbdIs<%%om7olrSjD?Wcq5Y*-kY_4H_`eNEGVn
zQ>H|#zuzQHTaU^1uvB!9T-<J~Kzc6y>LSRX54ilvfb^2yl0WeD5ug?WpgP4LJjy9`
zbn|kgH+s`=3ot&<ctgi%u69%*r!U%z-4P38(rN1!pMOTTsDYA}G@IB4R)5G-m1$3H
zzb*08*js^-Q!ZJW;*ctb(M}Hv^@AA?j!}!x^VKf_s*611p8+5{M8f-mE(u{|5lebB
z2%~N?E*trdML-=grvpI!f;K2W7wO}ZAQUVDKHH!5ka6F*=-=S*EI>{59m02NJxbP^
zrgv>iKd_rkxA+J9R7#<nO{ds*S2RRZ38RGDK{LKT{SKk;89D6T2B=a6_iherp{%G6
z_*9_{$MtKUJ=ZVUx18JQY2CXO+vd6Yyt5M0BS!k9_eMvdvDDJop7DKY=)qB`NW4xA
zX^}`EMfqHej-L!_BGu02`dTuv@@>N2o)alM5OeP^|NAZy?M-e7-z`2hP05v{=OcJ~
zBwarFJ}xxIY-nnyyJC)&?=ef#MQ#MW(P0IOOYUFArrvz9V+!Bp;>2_FxuCmQl@!m_
zpvQP{-W#Jv&AfX1?VNI+yVm1!>*<U>U+vf;!SD5w_jJFTMxlyLLR@PYD<e8Rfv+bP
zkvuQIU{bDkt6{XL&alhTpezicGSV*fkKbmB5yD<A39mEa<8t#m-|P#b`s*Kzz)F5V
z9V+P=QZ@bJ?!Mz`Gr7q;(c~-u7&D#w`uMCbYQy`Zzs%ag0O}Fj0s~@z;8gzCYi#|6
zSb$n=*BluN5aAm@UuKH?x6#mp=#0@qGGkNSPfw_2?536l9sfOZ*&C}J9Pj%}{z$t_
z?3w5j`N3ubK=U~{3fvFp+>CC7{H1wx+Fl$j0WN`XBt+m7r>OH0-D3bEIU}ulv%AO?
z?#^jm)%p9tf}lFCpjWCNkH_D`ArHWp8~O=&5S5Y=vYU0~IEnOWjrncw@btdO@PoFF
z5R!DA|1$pF=%_nNWC_PmcZqnDK_lE;)?#~Px~hujY&~#c$xk^OAJ6oH?0yhR?fOrf
zjgRI1@@e1)X?blG;df&V&iuF>l%<<PZ6DZ_pVq=utI#h(n<+8*D;FyPfTPdcPbFU5
zX|=edM)!qr4Tk`j9055mYB+{~(sT7<qjt^@CB{GcW?6q*g9}}2t;Ru&1D7*V3_*Hq
z{QF2OmjtEM?ORdB<UyiEw=dvkLXU^};(t|!1+3hSx7nTaG|;@+P?@nO`9guLST0?2
zvX33#N-=`?3Me5EFe8?F@6T`ZdUrlkMS-8d>qCL-yXr9di6%ADWY5tH0dsJN?;*|Q
z(W5jN*JpThPfn-P7_p?sOQ~g?Fa%M#%4(ePGQ>ZTMm<^a46r}O*8ZaBs5}Ir5`ur#
z!-d827i-ZnxLnULdz4swsk5RwbGACBpeBRzd~6y+@wmUY97)9YbJS4M4EW~`Z~5r7
z8O~QL78Mt~Lqp@d;nqbt>a%gQ2^w9T3ELYt?z-1rT4$u$C>W1h2FW-q{7M;wr_j>8
zk&con-}M|}%W`f?p%;BY4*j=78c#3k+@e=bWZbSevYO@$iXrTpryxtS-ch8Y5pgMu
z=C!zII<a&y3t20b`~Ig>Hg)Vc<Y_=1rcrT!dInJJcST(KUkoN|nkmx75oAlj7WlSI
zhjrkDAMTt`>#4b=)Uzb;0MZ`))UUq8t5S<?w)M(RmTm*1g&cy{`3kQ(xFqDG7Sn4s
z(a8Qt!@UQ{pyXs^vam#Yy`^zq<q(;S=f$K+&Ps$>Ms3M`Y$v4Yx@c(s;YMKND;95B
zU917K1-S233vmK5eGp6QFsZYeK?C{UUoq()l8O{@>rjKyMF`eeetlfRkG!xN`+@&u
zc7E)mc*99p&x4xYi1^qb<^xvEaM8Ow6zUSX=pka%-}jHlR#gZca;Qy*wg5bFOo!8e
zV4izz=76+l>5s=(`RnYFXTeOAKY{U^yF>K2(|JkS2<Hztj{~@+tU{OUCJ(>;N05S%
zJIT#ehKw0&+z!A~k9~YCE!5!{B4k{L3sY00Uw<*)w(y6){z9wmvl*FiPU?3Ji&I~$
zxXs!t4MN2uiD%a8-EnCiPj%+pADeMTm-HN<bqw5X%<@ip$G_Wo7S<dseU`E*t;7eB
z%mYzWJYQ+z;Q{9oUF1-CC?TZWSgLDJZg<Y)PAhgbyOkO@n-91x22)c9KF#+i#K|kK
z;V*u5!p_P@QVeZS`Me;<g#oIZj^$<Qp&im<sG?%0>Pup_TP7$pgOM$*Xt=WUVq8|n
z$r$vTZ=C@O&1><eUadp}ZD~&8Q8Ln{rAC=(?}+=c;mYu)4jisoAhCel05d)t`(m#O
zOsAf4^-JaPTWr&lBlh^QfsCTD-v9=+RT!UlZ-|2PfIk%sO!eU;bHP!#RYt?9!2reL
zyNN)oCz^>(6W7+HPN=Cc&6QU;=Dkvs-M=K3=uqyJ`>y&!5zfVIbZAMj*ae+N<gUGz
zB#5qw7<v{*4}KDu9Y=#K|4w4lT@<v*=^FRUd0WphsFEIGoA!}b(i5j(cvD2tSdAv~
zgjjjkX4~<8rTf(O_{G`F)B#(go2H2(UF)W=J1iq6pBFhDan!$4pu$S)jqeMa?Cv;j
z*Y-PK-zoYd9<Bonghm3q(EJEnc~BE(?<KuHv-ZkWk)^jk;BUAq8qsR}lYWaUvJl7F
zV-&hA?68W{{(z^mJ%~P<&4?x6T=R);LtLVyIN%4fzP9u`Y47XuDi0(lbIrj`;1eU8
zE+Nd-C@ajl5qXan4FA8EUP!6M-UplCZJIVq_j_QT_m{e=Qg820myxu#l4$Ugl~&T@
zcg;~G>}cp%mqEZJoG!puRC$0+s&Zge@`3mFlnrC8U%h`NhB67ywj}O6xqPnr8j{zn
z+tTBPrqg*^T7oZXdv_#@U3g0)c<g6ucdwFG)rZKA5+BA;f*=~n78v5;CimSeh12~d
zxvEDZlhXQi1tr5zPx!8UEr~}dA2RQDAeJW3sQGK;g;9qO`MYEe^tgmxm5)y#k0<2A
zX|>bIktY!Ukr_UIHGEaradAt;ip1-v7^RH+A!v*LjC6v^vSba0jzxw7jd_^YB&JJC
zvumHWvfSCcH!H89kl}q!zb;MVchO5Yn81j2wA4sjI$w;@Yg~?B89+%pS0Uus&1SM8
zvd~~37Vh}LFY<J2D<)uFSx>qTupS~(zgcG6Jbz?I=7j~*PXH2@<Ke4T^S|!_U`q-e
zlyRk7C4;)q=_oRucvY5CVZg}d5jZ$cJzs(ypC#q%MelxlM#%PPtEt*vrc;LVQkRpM
z|MF+0Yx)HkXO(Ar-_H$nmCfXAPOm@$G=&jE&Il@TuZ3T6-#N8OWC!DTLz^Wx`{J;+
zo{-PR%xNh_P8@Ls<{eQQwq%YdmwT;pzAon2#ExJ6sXVwn_=X_qA!54zRC?}|fD8Ld
zjqWXlPhEngEXgawoBeuQ`^&oFw2T1=W9d(*%`>{RfG%%BFx6~%*TFYn45l*-Xmin{
z@5>s`?!(s$4~Rzy(qG67m~)y~V5%i#cSG#%V6T*>f_Z(BPn>#T?D*tTxg6ZXYZVzc
zuzY7YCmIgo2c_4|Ku9~7EQEgH@vJ9_La>~1dnh|dTxdS-_AAX91B&}<JJxtGwg%~L
z+-;=^mTWu4r**P8QTs6`3GPMQ=ndrQs;_DJA5eGwEN~~|{Am1btDSkNL}2bSz)jlb
zdX9OyF9;O_1|6t>T|Vu~{x~ett)y357S&mb3KpZ&qvkW~zU2jU4|e-10GQ?~l`;l2
zWy8z)agr1{o~Lo2g!GaD{m53P+w0fk>EbVYZ!RGY-dv4{6NRBiYdnaZ<6V=_n%VBw
zbPyD}Ub!LQ8Q;XBo&fsMSi!nXmB}pefdp-@R3FM7F4OYFy#kUgZ4QW)_!9%yn4FT{
zDvTiG#fSSoT>n)3CzAQ>w)$T-R2nvS<-O6JK1@+~_FCz=+}2#ZplKep;WaGRm-Wr7
zYyJK21b9*yFNLi$ZC`}02iuqj)@BghejMOmKi?(fV^7=*kr3nBySXyV2+rUPgtjN9
z|HWtPju1%N0P<AhZ0@b^<P?7hmMHpfZkJSj-J#eu?yy5;QcqC{{we8>y6C>&y*xxX
zQSUKnv|PNw&^>g4YH|h)ThN^)CFnxSy2&0c|7jI#mUX;!fcFa>WtCntO;ndf32+*<
zz4$bqRf*4EH_){e?Za;w7$28=_BbZqR*5Nq!qUzA7ZKo4ce$wUj%9-~7IT}g8Dv;^
zyS}|qcpg>E$Vtaruwt3=j7mXxqnP)SFGnkTcaWPxK1pJf2<wI_OnH#(@n}eSx%dSs
z|0g8^a{i(~SMsUND&f>H63wSDlvUGNwad3${_|BJt<60(6X<cqjr@8BU5f71c0>+9
z34;m9N~o^lh@WA^(2BjlTsr7BF%wv2TK0;<p!4W4mXIQp7S-ni#5?QoRL>(d3IS5%
zO@YkC*J1n`o<6ODQ+BS;@UcVvN$i6UbrB0x2|@~=26cIh-iFTiEJ_XlEHJMF?^W^4
z;Q`$A{#rs^@2QFvvcJ&+UQtav#+Y5@5z6b5QVL1A4>QAim4d#i;JgBjNePW#BRpSt
zJ{2KVd<D&?f7m$Whgp9Dz+PdQv&s;h_5O~ILXU=z-;P$X&_j_WgoS+vnrUMMEpf@0
zd}lBCquu`T1=zovd0hjO4KPJntO^QUsZ9?N+ll*s?d5-sW>@N501C+e7m<Ss?P8V2
z<y$%RPd|XQ<NkRX$3W0ATI|Q@LMLm_BSzH7PI&jDz9in1yR)`%ML+hHAnAx2<-GIR
z0Nsu}OaJ`-_g1`%`N20qXAK=79EUN%9Ny%H>P4xJL5`!S8aeLBVgK7Md^~{1t!nV)
zs(knfAg7|K)Y%N{07B4svxk{dZM^%N6MBQ6G9i9owKmr~9LwQrbV$JK&TI8<9QiZ6
z7(X?t$z7%LUOmo&%+EISg(0!@P4O(5zF?6d9+Ow<JrJW7JK~;;vT5A`Qe^34o_AA}
z;q8{D85l`uYi0MSre=i-6Wx2$c;0uVj)=HV*Sx!6c(|rwdQCT7Zbc~?d9=hNV!itU
zvy1hKs`=TE2fP;jR}1SBzN#$=5WmZHHK3ug)pI0Ve;2BD#79B-;v2cha>K<jc-*8z
zkTY9Bf?%1dQ!{f;-g$rJ5vSjK{Rtu$@5*YwI1`Vp#LO0_e!Fs+YHmfx8{QT62k}zK
z0^DG^;(LRnhIFNEzb{bf8<b}AbwIv#+B_0__U4t5zxOwX(BLfWG_t^<IR-KZ-Wo96
zY05Ddieb9A?JU9mjhP{eQUs9(sMcJ6jLvTVtqb9)DbB{P^#w$>AZ(&9r}EREMxaB}
zpKLE0$>!5KT6|2rn`-}MQ3=bRd3tR5XZ>5+-*e+dy+$#X(p>CSWNEp>@P9vd{4SXj
z&-)rer^ojuiedOH)*csP^c=O)WJ*J<Si%c_w!xU=Hv7WZcwwMK<j3e8eD6GXUE&i#
z9pctPSk(8=2%Sn`BhX|M4XAgOOc&9k$L4xn9Yj2cgphJvzN8ZKN-iJq@bc<LcsHJl
z8>^i3?S^X=slk4VyZ>#m?vEyqpA}`DaF?bSk4Rz(6A{(17rKM*1j&b8KRbsoAs4F5
z7~248uHW4iDN|lL6lLO^(`O<Fb?~69+;EEO-@&JTzHpFAiiH9Jy}Xmdt~oADid>Mv
ztYEg*+8wiSm+-T3n;+s8m4pZQ5op1?LvUpO)>yq3*J!usiyiLkX)9D#z=frTsMLQE
z0?AjM3F^~GU(BOGhm*M~NzG1(hp{2$K2hM_>BY@H_0RMoHk+WcEBk`;&M=wt!};GE
z%g2F~EH$?GXubk!5l3C9sEdyH$pP7GZi+#;kINc{%WuEgJYgZ@F-5k>t~3*42nAyM
z3_L9_t1$s4!lS2)r}J5UOCGP~z7s5(3#~&-8OkJ8z6%1U{Kwhs(nD8UEs30{{VDh!
zeXS02>OOd!go=jFV~v}u>coZJZZt*z2k9oTqlItVlipnWV%7Iy<=&1w%|y6V;p+dH
z2}OYo>lmUzGiGW*Ag#7veQ^1C<3%hsH?O%Pf)nZBIn@e(yX^XP|9C<D=eCnQSFEAy
z4O{>z<5EV-eTeMr@`EeHL5?F306@D-i8Hi;d`d6jFmq;{FON+Y+Y>`hpF4fm+syJ>
z1a?ibLM!HtKPqfaZp_o`X4&z2ye2iw(;p<H(<AV?W|BF3uPg&_`8Lp@>_GsHIjUQk
zpjAi%5W#|%-<)wnb*@5pdv3D~)>Do92UTs_rvhuDx2euw8gbITco|}c!9p~7r!%^!
z$m72Cc4S*A%2wsoNxO;d2Fox&DKy>Lj3M!2baH&i8U+y*y?RbfM0>^ojvJ4Nc$T)9
zdI<+#e|#9%VWAn26m~sXc~7mqu-4)GY&;uNrd*VdE5PD3;f=@g8950LFtThSk)%r_
z3;K8#vWl_E9EaiHoZ0oXN?qO)<)js<hIVy;#IG>;u~(Yf6#l;8;PhAcKj(9^>+%xw
z4JaBWE*Xxu)4V`BL+2w<5nolKVARU2sJmDeH-9^BIkR8hC-^+o6bSgDkn(&)T@$9B
zF%G@<IG2RI)TX#4dx3*WAV!xaV-Nb)qu^rnS%YR`$Kn-xm75ZmGVk3ROg2#o2=9)|
z@;G+kk!vhJFYk_Q=*f`k(oA)lLh?kFzm3_KokTpRt0~nOx=|NuFX4I=iX;dhN>VN!
znwJY6YQ;;E@@a2@Mv*K!%}yIP!f*e&g&M@<JoY(VrSI!KP&ZnEVU;KiCS8-WEf<}~
zg&w+$lOP+q_CD5fyl%VN8_mWlPS;8>Ha77MAsR@XQe=%G5|}`NW^N?VKylQsxa9s7
z!uCKN)#0qKeWMrrECyn+9ez7hdEK!zg|ixwk)t)aA681PCT)WyI=s@|&YCn0Qv9eO
zD)fTV4DwD!N5f;;{=ZccMG3cu;Y3Wb0cRxwdmBd~$|-&Iv#cO}>eUIoeCfxt+(+G`
zhC=$Ce9Zs-{L(-V%qb@irV~9;rg&9vy%3MoC=ahewZB<KOc1PH#YpY@kA3}mM#u*e
z|MDv;mYS<m%9s*#e;^C<BLC_Vzz{fBNcWkmG=>JU3_*pNkps)1t9fpu@Tv?Vn$`_a
zBBb4RIV~0Fh}QDQP+<p(8#{mJ0IPxW*vf`ORG3x#<fWlVL$rc>C2gP#Y;HuAi0)Q-
z+;i@ab=1?}q_8wHROrx%Flz7+vbmpfr*D)HXf+=6Tb~!Fs#zM=xi$+CZm36h!*^AP
zW&8<E`=-jqWftn*n7wCC_@ILV)A=Rfh<0~PD>|ZKd0!Wy!Rv3VsyF$3X9ENJW42J(
zfnk58taW#(@>S*%_NAo9zM@|H+lThlu(C>kG!P<OVF>0i7-l!h7i^P-tlU`MQpIyO
zR?dDQA`=Bjb532X*x-iJHZZ8SPfI9{>J^H9jb$}EF<R^Hur5kCFyz?xbUOcqp^*#a
z3;)2Sd<~==&<!7$wu?Llo35?2x*MP%xj?Ek0I4e2YPdT)b>_U%q!UeQb@dC6nY7C;
z?)F$xc5@Hfc_f%c`85hmzZQv7rt`Zi=6U+%kU<kRC(yoWFWj#QNAWVo@nC=pYakD<
z$BVnCL2q{$r5QjR26dp!w=0zCocjDd9qrzn!n*rban$0Wz5>~2!e}5Z)7KAask&dA
z+;18N!#I17jLJQfV%BaB)&tf(em{piwqK*_pPmWPkwbgt6OwO31tBCBRYEen)o47K
zHqG*vE+u^=p{9m^%n9Uq)p`73MiaIHj%g#cfEb`i%{W-rx1WAp7B#)Nr|D;aTi(D8
zDlNz**gBS43|)E$p_$Yv1c=?ErdZbPNhDa7bl|`QGmXy%+is;zfhc6bWshD@r;$8i
zsNArf`jgtn(uBso$pQrdw%=%yp`?3&o^H@mIHdX^(QXZ9pDP1f-gpy4G%&`uE2B=l
zFHl1cErDqMP1(?SkK?07ar+z>mfr>7J+cx;!5SHe);QRSJ=U!8h+4p^bUeGL((@(h
zll^o7twJ?S?ZXdMrkizxBin=ltufZ>1{`S;6+<D%j@V!pUfw|HmPdbpDE3FX^_^#D
zo&E#w_|^7lNhS`4gB>3ngF+Ez6YCpQwl~JA)c0417zN5Cq<*NVmAUV~|L9ibnGV9b
z2~#1TvJL1l3W!~%6#s@+)12lm1h0xcUXr;wNTJotlJv$0oSt{gJ%r}eFOqHO{Ls|F
zUNpF}JW_O`0%_GCWtpmXZm$kANnr8g3QMFP-}j=D@`T*IVRhJNLg7s}eWC;N{l&wW
zgp;8Ly1$l$=>3#l(WR^}jiD@hUfSMMM}%^j9YV<|%zvhM;sHe|NaxM9r<5JbYyltY
zZZKr)%u0w2K{y3-^?;(iKZfeut;4|D)D$xEI&|eg^vR{+Zhr)#QZQdjYikQ~+Bnh%
zVc3dHmsoufDa8e-YsKxRu=4LtSn3qvX_~KC{HEpPrNQ9XAb$s)S9ZPp4|dh^(hPK>
z;ay#qVK??IZoG_~%kstr|9@vvM>yulQT-(Phh)S+xeCGFn8_o<{e<<w=I&S<Lm0iN
z*S?;Kg2J-Bfe6-`&Zzzea}<Xuqi199!_<GO1+44GT3YB*p)vPIRFpGPN%-LYRp3&`
z|G?_8IcN;yDB=YXe893j>II2-c9UV=&Vq7+glh<B#V8u=R`4IbIfj5(%u^3MIEX8x
zOH={AIov)XV>_dU4Rp&`sB8PFZ|d$09cnnZ+~SMHQ6fBT7zM9?_-};s35>kGiXCWH
zOpX^(=kD)N)pdAL_*ZNB?(c7`8;3@mmWO~~vbb!CAj3w79>Cho>`wZrn}`~Pw;Vdv
zI8NAuDLZNMEU2ukEQBp437&S+1!Lswrv&)>jA_{!V=LaWh?aVKM~B)m550*cIx=Z9
z98UdD2=D5+IFa&ht>fk85!MX1)7iKf-z@yjsRb%vWNDbO>vwRdok@9rO*xX5IE$P+
z;xq3>S=8tv*KzzMRraCGUiC5KYR^T+k{8tJ;geJ`Iq~X6#ccS?FL63{!QvFbVIY4~
z`**mo)*Dl4-tU!q)xV(hY2A8~9Zq*)1hhEzKE8ng?QcUB{YZF>(JBlYCl7ue{{7%*
ze#%VunFZAN+$L=ml4lnd`_uGf`EJow<-7zTvDp^_;7~9}Ft<*eVHU|KZ7=6?skW_X
zSdqqJStpay^PYsBu&yO>F7@|Dw31%9?D2t_fA~DkWT@qxRLT&C`;$HK1HBL*Jbfnt
z>!HGuwH(>SIwK>CFWr3N#fC+~(bNK%iOkB8W{Xz}r2^H$sa(1=d)v=acDioc{P}!M
zp{`fw=dwDhFMs&~4U<>TtvZe53tX7(e8qsHz0k<l(#yTEbc`4ZAxj$$Tv(Rfn+3L~
zP=CPyLdLf!zBkj9-4&0G_Tn=Yh6Kj+0#%wmU$9ECex5WVI=M8OoXmXrWqe(>pWd2D
zF`l<_B}$|#{#rKgm3z->l-GZoZ{l|Eyt35|#ekCqtQgQT?yiw=8NR%q>ockGNWeTg
zio?Avd0)hLIQ+rE*v}W)ojv?->gh+1WKyApJrg-Jonjm4Omi_a+q4+uc}LZJyf*WU
zTQpe(Z8JV8l*Bo{r9CIyPp1pS%0E{sA%6krgi!-;jzyzUp4~gyxA^)6BC9@?Wzma5
z$e|Iw6CFqZ1}GE$Ox^>I2IPB<yoae|K;gDjLcc9%`nx{QJ4?zBGm7+g7`5RIySlRQ
zewo{YbdFKquTUFIjP@XMt(5Mur|X_JD+|KjUsTodc%ME23bdz-PU4^+fY>}SKY}eX
z*Yn|8(oU}xon+i32<4NxRh>$uYqN>|%GH&W`!3GqG2deDU7*ZdOor}2n9!je>UdU1
zfV6^24`X*i!g~>EkuSzXrL!E?#UiiXdo$FGQj343Kt8teSl-EcLKrY4{E^Qo=4FLH
zYkN6w_STrju;>Fo*n8T!-JZE)%HZh~Wm8r(&OI(_i-{C;z5yPQj+y%^9clfJVn<p@
z`7{5FYgjcps}N!~>sqsx8TfbK%EC;MYN_m8GY)#>14*9M>;E~Y*-7zRPz>hLz2Hd1
z^5f3TpvF?)>Kj~czCvmEy@nk}D>-1QjM({;LG8z$o=uG?@c&zQx$luL?nhvX!QbxR
z&FC4u%i42M(%&eSX};yb5_H8xi4J1iALJ^e>{Z^u%)RCJIll0Wmb03rj5OOG-|0X)
z5fHc!BBs?nR5WmI130r%xs5}W2QSO)9IB0_-QAguV>ACQa9;uGxm`nA)=lOry2H0K
zyW{}fd~^dB^+u{|fB<$R^&+xM_}&6@i7C0BwV4ku5BYgvH3e~O7?CX^$&V%UU^!KG
zy?L~Osdj5^DGC;qK;exWCJV#{A1T1QQzxzOqiu3O|C3w)&VbF6(s$J}K;U%W%e>I+
zDGl0kKvbPr&uE92h?wLWL34Go0bBe^)4jQNr>kEkX$UT{loI_6FNXVqXY(6t%#;<o
zCi#}AmSCj*V5MO_F%SzJ-~JtGSgGW8rsTLPDD1GU0`AtrpSc)ne=b|waP{U#YP{$5
zniWV*$f1%!bgfiBa=xOMKeMn;$>PpSwbYb+D)Mq5CM__^_Y`;M=SQO)uN9o8voC(T
z&j}|t-QnEjMs=tF;S{Xx&-3i>S2kL6rM2n)QF-j++Xmgv7oFo1*TpnHY*9Wl4)s2b
z&h1C-#%;6XE!wj;WN`bRe3MUEyC40s-j)_!Q1;a9y+lhgVq_-d$8nlGQ5@olj(Igd
z8B}EOUANJ30Zz>lc%_N|MtgTyW8T#1t;X5Bo!lyei!>BUPDj>SKqTeJh9KIb7ke_i
zv|f6M`sQ<v<l2HGnXecJNL58^r1iXM;t}%K1Y%NkaQU3+XV*={kHkS+zb-rzg5s7@
zMciNA0z|I5&|q7+wY1pT9FtO7RR5vv;f%0AVxTPU>Pnv9<8}R_or@+d-*O3vc<%HU
zIxJW_v^o$}`oj_$=>Jn*+YLf8sSD2i6i)kE4o8!;CQc7&;;0}a98l@EIX*Pk6-L+)
zy}ErKTvJMs-&hi!kD%D>R~V^0CiU;k^RYmUHuD(Q)S`ofPT?_9CP<&NqrY0BL9FQ1
z60W^0+LOBh?>e;uF8{S{kfUXga_gh=7_;4I=7GTRH_98(cs_Z|wvgcN*~9sbu0Z)S
zvSG(Kdeh4dg!nmO=)GXqKHruZ%={rD=4eRZ)t?J788dJL)tcby+O0`I7uH^R2SGYH
z)bZ^AM-4yT{+ha0Lm)a9@69?)UJwbSBw(OnoB|;CHJyf@{q@m`^+pkX+!ygcgJ))I
z>WNJ3Ouf!7cn`>kEmqT~K=g0csw0g%!@4r@C9Ii1sU>W`Xg81joV%&tuv!jdFpE*V
zS0U#Dfkj{{&0n4M%6IYL(M+8_g1tem4<{ZN8h9W##i$niAwaB)mHKl{24(oC4LKk#
z%`o&QKR_o#JzZ=UM`KNStHgKwPLR~^@S%RNvWcGKnS?ho`YO!rP<S1?`dTuI@OPm{
zwYdgL_P;?+qdM^8qXS<nqcq_^3#;Mez^^-hYE-{0xgQ10md%U44|e2MgEIXQN%!C$
zDj(ZB5*vrz2%P({Z7C!C`VNbt=@)LD!|@1KY~%N@r)Y~*N*XI$r9Fz23s5m!{^tf@
zfZUFade>x^-FxDS=(3$DJ1C}d<MsAYyX0pA%v)Fq5$VR*F&2ItmLmvv`(->)qBnDh
z_sydj!2$9Pu8Ut(M3V|C9sIthpqRe+%-yChSfmntgCF{KEUO(?Hqg=j%NkRJB;jM~
zv-d?x*v`uq-P5c*rhC`&P6UT`ZAO+$O*yVEJHz-kQ-#3`;1RsunxB#`<YQZFtv9sY
z<(&$TP4TR2acA;#Do1a&{}dcLeSR8p+Io}U_NCoGnH8_W%Fk}tav_DFip$-?u%oM?
zj)e!Y<J+6!M?8yQqH%x>UCLvIM{)kRgq<D~*q*JQ<T*Xq^Jkj0y=MvmVN238-7>cM
zoKrj?<UKC7#YD|=?b#az(EJiTnNeG4`+9%o^Ef4iuEmI--Oo~HY%Uc_v-XQ9uCrTl
zO{Amd49)lbC6;J253sdk^|%<M&64(g9BqfZ9l&8$$$XK>1c$0S%F}l}p`+DEqsl?6
zr-RpdP8dER!n`0?j2PFSl>KWeq<vQ4YFVziyp3Y^n-M<pGV4QNkd!k~`YXP>{hV=8
zQ6A<2F$Q{vvB)US9X0N;GaQj8i3@++n^Otb;!GQ7d80&2C8x2dkQ{kZsvDklZmH>s
zN1~4h2%(f9VUm263@Ux%=RvhmFKvr#bsyJNWh}?`vO7&!x~5s$2y>1jGT`9+`{#ip
zjgW0BWB;LGlz(ea#Y~t7`j%P7jb9C!qF??Xo?MUPm);b{F^YGI2y-bGct+^yCzJwV
z1!K#s^Q`9oqaD2u#?tARy-bfwzBv0jR5mlPmmT-3$5+3h)z1Ad!Or88<TyH%{x;~s
zXE?k5w&`|t<u_mQbkVZBcDYsYi{G?{zo}di*lr_uaX0m?OZU&UoSqrujeeJjjLE3~
z<hS<D*Av6aH~FDOx_;~bdI9wB&4mH8<&{H)@Qh7`Y46k>#PRM>N%?{a+~Y%BYss{A
zcXCOsp0BjK_v@QSFr>|@r?V{$NZBL+^&AtzMF?&w`r%J+@k1kbhN~I;aqvR{kbVQx
zEkx+rmQ7mH+L<Wf;zBF{&}P26w_Oi{gK?xBg&y6`7<H0K<0`kbX&;7LqlmfC0IQ<)
zgRi#+zg{a@60Js^cLGXTp0%v^Pc=_(20V9d_fxZ!1gh@h$e=rlND2d$>r0+V^`C88
z#M;spVviGajPLM#Dku~WlW;b@z1An+=_e50hR-slcFx@oeO1O&{GZ3?l!7jtkb-Do
z5Ia61{z#1*GQEPg$>L&`@$B)pi7?-D|I_=(miyMt-{#r4`U`|Qjx-oO4_$GCkC2fC
zS~)_JksJrGgBH!$4r5Dw%IA;#pvB~HGTt<lE=vIU3fuyt{SQ1!cOf`YZZ8R{WhKEL
z%d8`#k@jI(jx|)NWo(@w7)|wX!@K*U56}}JxQ`KJk2W;#k;!-x`OIP>2_*Rm|I1JG
z_JRU(R1c`)Bnu{{)7m(^*4G*PAxEYz&eTLG=Z3Q{QD4A!MqdgFS{>kudOdE77_K?i
zQ|EcN12Pp{NOX>=ZKwdq|9H#!<j4jLO4;Hpf6)E{0y*lSLdEImJc<Axo|Ol29uu6(
z?JBoviiTZvgx8_}Qm$=W$J);0f%#&761O|0t$b!+AUYw$ZWQF>H3<DBK<CjFfSikT
ztbK~7muIHCZKYy18;$hQNzlD(AVNG~V}S--R2|@LtQdfXOaw2D3_6<h%2z|6H9R5I
z`A@EKvMf(efuH5mdY)`7!GFYSO;n!22XtSwgc}7<|LBez1rX&VoJyW-viQw<0udiZ
z>t;3)8q^{nqm`(p7>n+(c<ttz^HKjWgFl9#_bMEV7XAEljRI}L-^8vidI;5h#3%#(
zjGAac&C8eRnI=6yObk;QG^&zR*G<t-X!|<1M1KDD@kOhAj8Gd}`-+V1fZxpD_#{Zx
zip<#P>5o*z(MpG<Z;@^`<xT!Mw3ur`Y!Uno;G@oz(5D$B91+$Q?UU1R;_Oqmq#5PP
zJ&mWnrCy0s;`xIRd*O%%BGAE|C(W*C5@)#A`nt)!Sm{r0((yEiWF3g}k-|H?`*2P0
zSGr>s2_uI}xBF9%W><BnoEuqqRYkAJ6V=?P!dIrQ_Znr2_BioMws@vP`R5%K&{MW1
zB^d4=;<_Q3D}u&cJs9#;nedLEv1SD<fFf(_3*lmig?m4QQ=$V+nNz~kX(#f{`cGlJ
zm-cMGQ(tfy<7ahxoD(NYT|^D;p#atUSD)$WFY7_ifW0`NV;-Hgh9Q3j_#z0CXC=G7
zq=>)QXo)={sF9Ax-1fL-*n$b96UtW|pPIad`)~Vn#vkr|MP#buv`JsA_OE2~81aMP
zl=T4f?f=_i|7W8mQE1S#6JkWyGm0YtKOA(-)_|z8XT8e*a1_aKd9tO06p%L^N?bnw
z-Z8`9VPHRJLF+}4??R{pY=N#W7}$!Dmr^#sM(p_$pc(5?{VqcNZ^DiVUa3zy#Uga3
zFBs66KGtq1lPOyL=9}_fWnjkq3D~`t>yN1JS=XO7B{-|^+1IxkRaz>?5|H!9Uo0UL
zH#lTzeAl(w7SobHxJSUxZsK)IQ2*Bx$Ww?a;LU{w{pTD-qrI)Y9~czJ5JI1Z68^rk
z#((I1=S;N9N@8&Y!a0!Fb9`1mVga;~!CaId0@l?4VQM|=;(Y6cBQcQG{T2c^U8W0I
z1(Wfahg$~&{2aM8WKidl=ZsKjjS}m7GAK4g<;K$CcA0Y}5;I@Q@+p2RXdH7_EcIdV
zoN#9=2p!5S&wJ{6!69T?g35ZD{094%LstInHdEy!GSH+U<EZiL2Ju5cX6N=J*QxGT
zszFb>OivWz;H}_|K<6n-6<979>l+Kc9O<_h!X>=rq$CDZ<8~iZf>Q++k0|Dck55eM
z>6m~($?_H0hYW`n8cz+dCg^eK$hc(6;}yxHbzfM(DUek!-2rDBtZURsX-ofj#K!Oq
z);w9S;3+PxlurN%dsCLn5>xGmAU%l+UnQDxPrjxLWAoZ(uVSOn584u<3F19<z&9g1
zi4rZyBCkk*NCW5jPd|AG_>sgN>i^+npiU`lC8wlmY~TD!R(u6_+e4(D=O6l0zEnPq
zrF8t3%zs*pcz73S29~Jzu|j_eJEhzj#DQ;XqX!2C9VA{%gWrO@m6DOV9mJA8LdXBc
zL{0#ldM87*vdb_2+AL7~$Y3qv^%tY*MEIp~Xmc!-nu8qxMxDFGgTg7+xTi~@e1}9c
z*Zparyh4uE;kU_-N6iuw5h7dvg@ARJXyye20W6TTWs5Iz|HlO1DdDnw%XjhbGhx3_
z|I%9e=ZLe2)JXeeA>(=V-xgi~Rb$>o0|V_akTVZ+Y<c1hHN6LiWRIWe0#>vC>)QZM
zmD>_$$D`=s0>Aboe2CoSD9Nq!L4_SBuXP`z$OkYsnXJ&xkSm7&RY7QLgIhA`HB^tz
zafhf%iJr0}dV?tuJgR|l@*5T!U{ILf>j_;p(3Z4ZJ)vkC*K<1FG=p%TZ3(8mTt`Qm
z#BtKK#U^f@7Ty=!Kd^52gLzG>yh@omo3&DU<eykId9x>zBa=8*XGY-6)xR^A>lBI6
z_cTQ^H4_lXsGuN1kjl~78R3nuPtF5(CxMn{iSESrlVMk8TI=cWtvlLdVPBDtbGz#L
zv|^P*o~mQECQA|!5YGa9sOZM=jAKo={um1^b7?y63Icy~^&z55+kC!nfJ!*%{A;#$
zCTu2*Yn-4VW<Yd^Uv@dU`HX91;r3@H#{i?ZI^ufZ<9~OQCMt9Za9Y|sS+P@dca?gg
zI>$d=!am<*S81Aw`fo_qdUFzVB6%<7LwirP6MOGDLT+TyZ*{zvv^4J#kawE#U`=;6
z$y|2)ct6cpIFK6WxNbmHF|W+{f3&BNpMo-nhuDdQ*6^k<TR`{WIkV<&=P8A_&MwN&
z%5#*~AcN*j?|--Y-xu<KX5ZnKcoSPqLv-tk&Ko>HMBGa<eJHs(j<h*Fn<$@Lf;mTx
zqcK)j8R_^2VACSea8l}1IOSQIxn}KQ6n6_*6QJ+C($Is-t)hb@3kbY}!Sc725#*xD
z^u3>(zX#ZZuo&Yr?o##t4?jXia8{=F+ZA22u6fiHq1I{JznAN<6$KKrggw|Nwdwql
zkxaqPMAdY)$xlCYze_Z$Y=7@+NbX%BogA_(^5#J#Y6ieYm>-iNB%J>LdnT2S`6~i*
z^;LT}YlW$4fax`j@;K+E4|8PzZQcsRXFHmew+}z&)G5lD+W+;0&`$=YtCtU{R3`W%
zJi@U93lY9_#*5h%vGYqspK3-Qze@N$Y)#D0;`t%P2(B@_qzM8AtjBsXL_`S`;17lX
zH!cSdj;<dZpoPT~-y#uMdb^ID?cKJd_j3RzgmjrcOIY{WOhh$ylP_ph>Pi6r^_mDw
zy;{TvstXkUPQ2VlE<M`+-&vW=&HfN{M39dvMk96T;p7~F4G0YSS{q;Xx>Y|)!NLlF
zdk84<H26U90XAE(8~N`xzjp{o_~6%~oFm#A|B2dID%!6;gLg3C*u2vmi<`9a%MVe_
zEOK_vTvf#ekNA=E4`Gx3G5X7SB4-D~&ZJ}U9r)ERPxSmbnqv^!Mo+7I6ZjgNPbV3T
zqQIHBb@J352q=2x>g*gsR&6eOBzgj_5)N$BP^C2%gDs_k-}exB^<t~cLmmU(aWH*i
zE^w#odETNVCvMynxr5MNHTj>{6}&4oo7M~e8bdepVTNV>ic+uD?&WebLPjL}&9}Sn
zcZs7JndD?HAIJ_rOIc07Y|+GLUFMnhull**OFA5QgTs;AjiU0c1zn@bTuZLxqtd}}
zW97Bq>m8kO`5K@1(tn7e8%)mp7#_m@`wjF~-M4S!ZyGBfkVu+UI?i2mkiX9}dKhhQ
z5>7Tycb5rB5wte-!PF=D=tw-sB-|H;k!vv9q}U*hf$ZC)Uu~sX(VcsKpS)b+5%ifz
zQ<^vjQJSrie#TSDKOU}8sV^i1UMTodWO(n9z{28CMfZlz2ZdNG{}6S|$Y0L&JpFAY
zKw&L?4BYCxwC|eA2S-NYFwCw}UVrmSnXa|q3IEF0Fx`1|L`<1d`!cdUGqRm7hwd9;
zYxre|m9p^h)2gL)qS9a0Z?(!bcVpCQ-qTX>Ri2^kMjo|P-FBAL$oXmgdpt=FH*{U)
zvfWNrr1rCEDgP2YZ6)6KJVGx?OHbupp&m!<cy4r^hbT8;5Axnzu^u~ICGi*BzP-n6
z3H-WN-7beCQvQAUBNq`C0>7BJMfUV*V?+xTHp#Mm&LXZMcJ0E&*gt=E`E1!@(9B>h
zqMvs?mMcim(Le~ou|jAFT&c7i;nBT}Zd|YUl$bUDb!N^xBB(ebv~ND=`J1eiq=<f0
zJ1;e%fhU*MnN@Oh#aGJ!4HiYQ=1|w{t8{~cq7s_GKEh-21w~~o>^VXqM<yLx9}DA{
zSwuvGz$V^#e>p+h(>g){*&h@+MqD!%Ahmh!#Y6`Fv)P&QC-KcN<yKm(wf#qbH*rnP
z+3>uG^J&+p*eeTsxKH$jGrT!gB<8NY|J;@TtKHK<+?(jF1NhvY1u|D{xvj#-@S)m&
zQ`rZRFQq|SOi=Bi>YXDwLGye`zDu)cDo~r>X`=G^_Q7lhDW+D}4m)Ad66>mBi3gQc
z|HJg_PL*ABLaXvjK4B|z#`t!b!sE%Eig=oglhkXJD1Q%agux<D-9VjOxeT2&#t50l
zq>ZG$ZBP4j*7j7TNrFbZms92HwL<pz!rIdVqtGUSuCnhjPRYl5CI{*M9;#g~REb~T
z2SG4&0_qPVf%g+BSGnab>g?=?98%V-=VCLd3pSh0cfKfx+U<g+`G_n0?AX%{y~?$*
z`#Ax+02DOv|GZp1P*-@gwsMG|F=7al?`U=-W!p?b-zb#camX%^l?9tN-fs|pe{pnK
zTodzi?MJH_74bypJ~{qtrsBlF9@#v{ce6xQG>0^SvwEx*|D*ya2kxg+k=f@~tsKO@
z@?%S14~T$IivKBNbXg}?ER<lbyZg!|^Os^7NqS|?uITI-#e9io`3F0WSrSfp6jTsI
z26)Zo%P698P<wp8zokgbnbb1g`n%uAd+t~k>9kt${28@cYI5nS;>S&!bNia;S=tv^
zh!zn!p%=N<)$^>sr46nO4W4Rk;v~ap%kN(+u6)wvxqD0Ug#7*bb6hp0oCL@He5+iz
zx`WB3kY@!_T=~tos`-_O1IKfm!NlhAelDdf+_x0@EOjc9TaNLiR-I%w#!u&s=OW8q
z<-&YFf`!a{3c9^^%tSZj5gKkXjim5)&f~D#gu~mv1rI1!?e)5UKCWo<z%D-*7*L|4
zv13qpgJb<kEjkPYVy$|&h`dRa+jER3Xg(A4qHdx%=TvP4yh92}`KC(}l~zxdYoB&~
z31>kq>oxg)S9Vf&Kk?fOSLg7}6`h^r@zn6_;{N?+1py)B#(bOK8*_;r4fZatX8D4L
z(&|F3&Kq{K7^_QAdCLAye_QB$#+!kVkCiG|{mTj;vrDjMg09Q4V$OAE#Tm2SqT5<X
z&YX+V9^}1JfJ<Z^Tupo7l>WRtwDtDd3BsDUoyDp(<}IX#V3|87UdsThe%s2sIEnav
z{3CPDb7;>-j+aZ`+FG&yfz=9CS)<qiyvle|)b;F2E!9wh<4*Bu^}S7g&FoFZn5LD;
z$-3XCcD{i=9siL-;Q=H6!_6?|dWE03X*S;F%TBE4ZYLIR%ks~8YELzfH46^PKnN$c
z;;ht$lg9;`PIE6`!L1)+4srK9_*Xy5{p5_F&^7}!i<s(dTmt=f<Vx<(5uer^b+JfG
z8b!_Y>yJdP%Jkg6xWM21T_%E0iUfMR#waG33Hv|`{Y+~=DYcx%|8KdyGxCqxzwMJ*
zJBht!@$rqQJ244KP=<3F-~ZVbbQ*$aF+*+lvMJ~Oh%ULO={1vouh;jVqD6+jEFQ5h
zu;oZu^5s9DXh&5D`#j!tAfIy2uymiDAW=TAkV<CqgJOEpYLe@Y=f6KEGmNoG+tx1`
z+Q8#*cVgILb-7c2t}X1x8uN0KlrQH0?!@g9nV^|>K?kgQHz}kzGZYb>pP=g1v68F&
zdDa}22eb<>ttvWP&ieyH4PK&F>-jdHd`4r&PZzUXq8awWON^`!E3$9&_kDuS%yIIX
z(;REM(<S`%&7o3zb?&J;gP!^hGTr_r<$EPpyNDF8{gQFJ>F*itd+uW|mp8s1-*0<_
zHY-h-g|z*NUAPIGT}##AB4yh~7b0bM)A)a0dPh~}*WPCCyx%;s3$^bDcC=g<U(VXt
zTP&-4aejo`3k#}ZtU7dHJqL)&P|@MPkf)m9YCnH9OBACQS#@AGsfgx4C6e;BnBU7&
z>m0^r0D4kdlS+>F;-6UHaS~i<<YU)6{FiJdIVY+2MZtDePi<N0)ByK5;b9z6lqGU?
zpZF0m;qQ?!o^}77E_*!AqZg6ux64g4ne|z{j&)IMAOf9!R_oKx4<+t=zr3)G3%s!L
z$*247X^W-{ycnYWP(QMKKM?3B8`@(|@9hca|J~Q5SN39l1t&12PC?y<^q;UtWu3y6
z?i2enKaW*C^%3RaUL4Sc9Gw(qdHcp%?|g~lBHZBm_=)L5W6j?^{#->3ov;+L2mR(t
zQfv%_&CL+be@9o~HK9|p?^MA6%9bhd@2t)D?LF2PVo`g~srQ;eH{z{((WPPQAM5m&
zO`rF3)u`4;y|a^#$bezdA`%lFa{M&@f82d_SXArRwv>QK2neD`NP~nRoq|Y*Ae~C7
zba$hObW08jg5=Ph(v8B<-OSK1L&LX+bB=O;ukZD~*LQt?eSdh(#+kjJ=UH*Dd#z{f
zy+yxKu4zlH=Sx=;mQs%6Z!qY=Ub~(=8uU>+`6;Spb#uA+TgCa<?bxN9;Z;|Ay;9@#
zhUMc?!jl*629ydrkdf@`+#fS9o|%2ge$#fh?147@c>`;Mcj!r}$Zq0Zkdf!(aiuS^
z78I0F%nh1h3c@S_@e}FV%)=u@rN|zf`@C}5!JQm*Z26WUe23wDP$X*NT~z?$$w`{$
zr+jKx-P(<2_FOtDI3XUlbfZDEyy{aqp?W*p>e~58!W|jO$=HelFGF&vPFhs58yVK&
zL4t)9{Z{@?M9x~_mEs6EPJ`z&D3s*Z-h9BPr&N^4kf%K^cYITXwwLJ{t!9mUocDqH
zI6P?U0w&J#m0E=c7Y-?|e*1a6FXUE8x;o!%nkbhF{x{4G4SZ(ilMfXc(JuFwRG`qG
zclvt;KGE0eIL5%UF}8tdT_Je8Jlv>pJSWf)^32f+^*@bMhg@0scFuwCaaL^z0!;tK
zR*aov!e17hXXM_(YAu|<i`gu0>(D60;9hV%^L@V7+Vh~tfwGxAT}%&!!z@QCC(HHP
zol695>s(qYXrO3t-(v!Iz0UwKc#U6*`L_>rH1MTeXjZDLuPRkM6St|9cJH>&NzHcH
zjXaND`zfsf7i#qg`+4kiPyKd7pKsBboaQotH2XjzLUY_G%|Y9&q*M@pSfg`mM(Fwe
zBX(8-7J?2m-@`it-W|8*5o(#jxzHKW=<(J)qSS>f?}o242YENxR8E4Wd%Gm(!NKP$
z;^SzAsK|Jl1{5m4#;QzzjUR825U7FhMIF{T9=r7IeI52zTso3}ISeKiMz7GiXVU%`
zB|!25SEjUL6$rtZ^#V3jNxJ-rH>7nS#;5N9f{$hCe;zZ$myyUh^61$=0sAs)6NpjG
zV2IDh3uN;saw%8HexEa}2iYn1_pdnwXO)%|^%Fw43U%NF$*|9(q4pb{=K=*{<`e17
zYf%&u_ymE_4Z*3x`Gati)+qiq=&KOdHC@dxF%hhmcAo-aDcO<piA>@A566!FUk&OR
zBW)Nh6JD^O&Ix4Wf;rUlwGm0^Xz;h%&Ujxg?nsMnjLdxE2*-r`BE*DVce||G#Y?Yj
z!tNAR_Kc|s^{E&oUI4H>h{{auVs<;_i?#Zl1p<XvO(=n*NhI^A8^Bra0EDTM4_K3@
zkK9wZ;D$Bm>&oLTJ60IxoinS^TJYzz`@S8YRI;dA>*1SjcX%Zag!GpA>zAjd2@_y`
zK)Vd?K70`dwrNk`M3ZSh{nXS$p{&-i$5_dFcA>`+x}W@IDfZWl4FgqcRdUW_b78NO
z5MxwOhOXcrl^o{R&FbjU?S?42Pb`?1Jl}s~k)|}eINsFC&ezlQcx0_GsSy?=mWgWn
zC@n7!yic*uTV`_Xq+7Brm#uXe${c+LbMpMAeHsaYZYV0}Xq-}iesK0KK;9a62?<lW
zH!6p~B@WPWrDWg+SMu8`^Uw?@kjQieZC{C~kl@?8A~=D?^s)nP4E)DiAEmb_P)xXl
zcZe)65}}5|9r9@qJY0I%077M*O@tRX{-EYDVJiyH26e)@&b=f(=i_Hd*~QLe3PcZE
z(2-~C|A;<ND#afMa0lTQ$tMXw%76%=j-*8@052VCC)>IDerP!rhAG74-@rUk#;+Qh
z@}bEh5%7t;ccRw&;+kLTJ=8lJtzvKF9e?}Co!6GFTLGpuN^!9~RX3k=cPc$@f`1bj
z3)>J@bGLYNGFXT1Oj#UWDP+=SDgSmf6zBXDYMX7XTo;h|C>$Xz^njwBqNmj8WCRzo
zw)-I~<GYIj!nH=WK_T3t`0N>KS@AwhV-SItEOYt|J3m4!qtB(Gq#CLOQ7t@fX1soh
z^gOq1+-1LhDF#R0T(^ypO~}pNa7k#{()BzqyI*PhenCnUkyZSods}Nyq&#5Of%oIm
zZ|`b-m^M?+Wz04(B-PV%ATIM4>;2n_0H4}bYn0VgW4QCpfb~gwdu^r&KIyWCpOsRO
ziwE<LG%m$X_Qjfh_PALg*@=0gj2N^0%qQBFhUErMpgm@SWTU9`#O>#sDOMx3N4-O+
z0C^vgX?lxwsMdos)E=90uHwDdaMq$W8qoPYyTJ-xvh$3yuo^YxW^K9bbt|iH=Z={}
ztS41fuX+o>mhv}-G0fH3R2rg`A?rNENODf_I>85As?t@n&&i`0dvmh5uJ|@;E1e-N
zIt&yL_U$6Uh)ZK4S&6(v<hYIRM{9CB5Z#(a^6-O<03-50esUrmg0n2N<9jIPK_&8O
zhsstS_#~kGfFESrl+18>)Pl)HK^qo?--0=hwnP00cvUxWBvCN$Z=f#c|J1z`2jd=)
zeyBI!f<)&(dYaOEOmZ*D;QP{n+Z0argbwqu*;{zp2?pY$;!UfWW1@(=5Ym!2>+yyX
z`2mhw8KEnYLc?acfv1S2(@IeRJh~CI^j&&Zr4fqW5pH{n&3<6+Svm$)=T7ta>t+-}
zmarpO%}Pc&LMdHW`s~)z!YA-Mck$X%z*RV#);tFzwd|St79u}>JdCWIOg8g;(YP;7
zPFfJIdN8oXQlcN--E}MrdV)FjMLH)p7kn(Cezsr4Od8CKTrDpwg&)K>41-Cqv{GtW
zlIJ`*6BnO?ntU-rLAzv*R_Oa?;GZ8i=OGP!U#^4F#btH%hKT!}2@T?Vj^y<lwpsd)
zCGeY`-I){pZC!sl8p8^BQT?_~_GTFU#D{<v;Djb01G-L(5R)J5%)MZyUiSH2=jo;W
zj}r?-@lY~N{Nq!(7Y_>M;JCG!?;YAc+xXjh6+O;6Jzy<8ZajkGeI3?yw*(_rUx>;~
zSq{9mb?ZvBTxRjQ(9DVRNG0BT9o|AYFS)t!Zg5S;O`%|&U%VPIQ$ALH7jLL*cPmqd
zkKiml(UiBNP>f2K!Euh6<@zB^Ey||1%hYYB-)4mvnFxM-(U?CSeAHF*0sNHV;+d#_
ztN=^v!b4V-TWt4yhjI9Zw<>bI0#lFi;hJG`>(TW`L7+z)eojwnsPL}9FOrM?@lP7O
zrw?vHRBb{bI)&#@<}YqVkh<$q;!Usd6C(=)LWjN&dl$v#3iH9^jdDhwOr3mdUQ!pv
zcZ1}0kJo9)w!#>Rq*|)l7W7&^htRw;vv|qrE5?OtUM=h<2#@Q+b?#YpWL*VEwTdc4
zS6538tKAmwDN&5WM&DIVtGc8;!`j}Zm2%8nZ?n`y>)CNxF5X6uY<+N3QYF==!=1Y;
z$C)?1_xSP9x721>sJ?$QH9YWn4*8`~_~-$zzxJ*YdIsLI0w3Qdv998StZ>+G3v_=S
z8q;#9s%(%qk9O%hj}_=I6R;3AU#I5V!AnwLwXNdsKmO*k7RlF!Ny!?a$=>7ow?lF)
zJemJ=>5c@HgbRNBN`E_~sgN`|5#X3e=X<5gvGTV=HicjY83B&@*>YY&(+}#6WLf5g
ziWjUcPdtTLtswUbb?DGwYm0oZ^wnO~aIQ=^d1{JdSX<n9^em0vcM<X0>ScLFi!E$8
z-pN2oAiw5oRkUgQIaJi76;zT@Z~FP8%V*PWRlo#_iEMJtkL0>eq(|zLg2991WY)T8
zF!^j9L@+buMZC`Pa*%Cva=(`+AEB~$o@y?kKWr%S14<^95df%EIw*l35A=cAoEyn!
zHK+4fPaO81?}U2x@tWrzc~RNwR>IPS(HT-302kx|3to!n^(2QdVf*21`oi04-{U7|
zX<ixT_dCJuL3D3K0Ya|yD)&S0pvY^=(r`_8>Etg!40}x(l>dN7=`x<Z+Mu@mcuALO
z%Ri0^ZTJJnAIbt-vLBdJQe%G``m`#V!btk)7}F}pkJhj3toGd1IWQ6dQ!#jwtDkfC
z;;WDy#kA<4M))3t?<*b7EotfjV|R;ogvPi%+S-se*9n=a%_$_fA$B|m^!2k>6}o>J
zVHmpFWH<PeSp(xTK?gg^!tJp+l8PGnTDqx>JUij+RenC$7G|#Zg*-Iw^iECX&2j5!
z1@7hz|62{{G`NJE=W7V?%n1S7D_%b)q|lfNJo~eN0^z4EJC|0=(>=O9<2&BbycW9O
z5kjE1P?Jh5Xdo1L`RfPQl#uid6ijjl-82eifRta!{r>20zcNGQx2;5&vNiY|ZZ|Tg
z1~=avyn}3NWT*PV)cPAIE527-PqJ^4f-7pL36V6)ce360HGUJG<h|z#A&>Be(8f{z
z&N2VzasK9D${Dte6WQ?&6op^;rsyvJld69~tn#y>`WcVhU3IpMx}W-Qz^>E!opLnn
z;k8e9xq{F(h%i^FKcyP3VQWB8&gY+cihTEV6BEh+N+Q3=-G7TNf3KDxKI;YZad=Er
zm)8&`6b+2ydR#rA3=hmZ_6&Q9>R75e&b0AZX@bd>agio6TvCL@HtlS|2as<C7C5Aq
za~Chcx#RCO{7*w&fjKG?Oj);^5g$b)TGv=DFRXVv)2RL5-%O0zU?b0qhTzo494|Fw
z==Q_zfQ@RyTJ_tJS<5)uhA*G8hpiYL`c}@#1Gah=hWT4N-wsOM|E0PA#ca}o_-1Vc
zzUGZkG3l7o*jCnVjOu@%jHlnkNl0sre?)<ek>Rw1uTrxr7!=?SP(mrewuO0f>&3`O
zsdm`Ije4Ut6!_2Q=wMJ7{3Msc?;a*s@*~RIjWl<sv+;*8S&_9UO?DEX&g`FqHiUVf
zEFEnp@>tBBLkDe(^aExK+C0imBk^CwXH)apGn5@47crn1{R#E2uPktDMX4x=t%Pj&
z^i;+@eGaQ}36xw9G{0Kyyznr7y`wlv;ETsTQ0P|m<DO0PE{KjCPisU@h;`B>$NIrR
z_zCF+v$SU#P!7(E=bcagqG=Cr`aylFhTl{aFsli9b>r_6=5I3hrz1j)$*(D`6IJ0Z
zg83%2m{RU|iVtJ?C_&>9m0_;v1RNL-K3{+HO^XdTmqaej?K3(|Ju&wV%|Auk4aT$!
z-Ot<aUyIu;RKdtsq@Q{cyg41j38b;o*SiN>5PD1`QgkeSmgY$y`f3A7v=-si!xS!_
zvvA*$Kuve#2c|wH@D=jI#q&ei<;U#*{G(k2yh%-knhkue!7RW(I%miIjJ@7~{z8mb
zSMC1mhBxEZqpNUU@_jkl+4zVCZE;-4jgV8~UHcE97NvOxFlDXR?m4x=E>|co{qcs(
z6AzKBK*I&~9m@YCz<-jN_Jg#jxI0(BN$Wu01@8WAzkVjQx0cb7LmeOdPciLxf%`v?
z2JWKNn_7obOg#8UoLE!?Md-UU{FOz4vu!iqI8N@G<v|nAuLa`#U!e^FC8h&Z{M6(4
z_!h}oL)tNEM8sXGA#a+uiXlsGqBpOyvqE}|<Y%ehB+fLH_*>~H;06`PD{2?}5$9+1
zXZF5qDPt=E<;+s}O>MXf{{z4K>#C3G(i$eMy|7?IGan4TUOR!jNISx1^t~z+AhD13
z7oI1oXg15ZVdfMi;Oo+R6DUgkxD_bi_0-d;s12$cBDB=9v@8VMdG6Sl!){u~(LRKa
zqzZ_aZT>Bf{$}p9Z5Z~cf0KqDmk2)kznFVqOQm7o-=x8x44<(5lEeERM%*FoaRo>N
z(i)L`qjKz!p!3^VK*p0ZusR%VG7WL(-uKTwtKN||(%(ZbzPR^1Y~m|t$h@j=ssq$&
zXF~{Y;h@Q>{c4dMoG|aa6`ulPRH)PS!mp4wy&n@V*6>YtH@9fux0G@<FDoN_;0C}S
z5*%$$ASh6@jV3JqOAzpJk^b*^;eVo?SY(^8P20%*kkxu0jR`k2Jd9Jqn>iGI5(506
zS`6Mb{x%{XF<)%HmL(OLMk`RIkO*wj5!@ug#OsFJC)BTOJ&kZp_(9<Z`7C{5j&GHm
zZ8lU=j&EMdHBPn>;`Ho)Jsb0RF{ALtUXSnsIY>7%gr?BIy9Vrb4Ns0kIqMvf%PsKv
z6UtQt67chZifT@#62ieR$Q83}WdvA9SyEcR5_)o-oW{PXit|oY6Gq=E=zsUG)2>P#
znetuceL&sd0ZGSc?w(=B6FM}F>{5fW(Bu2FViNi2sAZBC?O%TZ6c&{-IVy!xf=jIl
zl%2pau~0%bLj_K<-a9`J2W^-4&W@(dtbP!AbVmK||1zTM+KPFSfm#oiyt1ErqK@2|
znGHnsdb17Al$tH?G&2NW@v_CQK8hHKW9F8n9kP{`XuBPL=Hg@B&((MPiaqu~s-YBq
zYL9f{TQd#k?d((G&rt?xY(wxxw5f{pKkfa$v-{6{3lc4dsX~LtV7U_-$WJQAHhSOV
zx7g^g-d?gRg7XoJ#CDman`c@x)-BVJRa3EHh~@nz`o?VUv?;RWR1YGty$KL*M+bOd
zUx;lQ#Q@&_nvMKT5q!e{fKr-Gm|3x*&2z)hr$d3yNb}L+GL!KU<9)l&aTPGd9^q6b
zQ|#nq7zPf~0cD4b*}nOZZ`0l-hqctV)cA6DWrZY<+9>=S-xu}an1)CU!e>ue6q%OG
zyUS>N#BO1ou0++i3NM~r+X{9u_}}=PfCV|0*;Kvbj5a)ynTCvyT!pF0F*ioB604qj
zj_}ssc8Ih{Dk79XzE+JKLSH?KSYq7=bOKD8XY3~)FH%+}c7>)j@tc;ll7un1kklbj
zW?GYyUf(uHi|aCq-d7Q0K);8!GedF#5hPxQ8>lCs0Xx@F|FOHT8Xmu5`+Q04P0fJ-
z3T$Bmkm1XOq!0x7J;RMBNP>Z+6dV}9SN_~2_%D{spPc1t2&3^zr$pSe;CTgXkNk#(
z2u1=B@p`NZ4O1l@NVMhFfiF{cKYN((*}*^(2USGmHDPqKmZ#L{1dN8h=Im8jKK-ex
zQdfNLxA$Eh`R=2Rd2{PiW|K4wNz;-?9gj1^Jw=4kvJOme|Jl0&25)6ei}sW2Vs4#t
z2vX_-tSF1br-csPtg0;Ctl{&RH?(t?ig=3;Rl~qltG((@0XlGTX=<Cf*7&cQT@QXa
z{C^A%{K+VSawh4q4|8acy^i+|tyQY=_P?xG9hEIh%7dASPoPCa)wnF0goK{D@|{g<
zH5qnOtJ_MI75YahpMcr<su5kLEAzc7F<|;@807QHos9zb`IHS<eGNU2zvMmnmrUl-
zg*FLyVjNUJO#7fa<pwH+>9xhY!szW&SoBw|<kv~7(x@i4g+sfu_3AQc^hiehfS{Q7
z2xT66H+`iM7+tL9#^F%>0UMmoi*c5;!CS3{BFUfnw;FxK=5P)@Qd*aGWTek*KO3Ay
zzI4Ayi(V1P*?z?+e+?&Qh>IOjS^j>O{~;=tgC@%S+rYXq-8;aF4Y4bA^><>Op6j_v
zW)zrKL4UAV<QrX9>VKWx@wAazk%@JSe%|IogVomnaohxp;T%q2xR2qXe_URNH45R#
z?#a206M(%gs4bB1HD<}k&CG~cpJUIdsGqX7)xw0^BhpmLNswjYe;4lMQNpw2ft?&|
zOf(e(jjvJuz1)^ufZ8l|$5{TTBUfs%d2Rj4>x#g%1tPB5mZ43_vtb}jh#1fsn{%o2
ztTf+4$FgohIgaqF>;ub~PFZ_ck6h8LG=4S>N>_;+?I(lP2OU<v^IuI3h&SH}sciEL
zH%ZL^Vt2$YrrUer-a>{XZmfjBKyHjo8+mS+h#!JBG5!}<_?(Xz3&yKD^b=qgKKF~e
zd3uH+p`VUx$td|B2k{`GvSkHr;jO&ChWd_COqaE#ri~wI)V)}b>Cps}*#J$L5*O&y
z$v+^pGL=xjYVX%j6>#`kn7-bg3Ke(c?xrKeljMEvj~p+lo-|MLmqxGHNLm_(v@Xl)
zM0+OykrX!wH1@VLZDf%qXpVk2+853yG|jnl*hNRY9XvBLYOi6A=q>-3d-xD;9|;6^
z4<5?V;+8#%CTGBiCLm8Y`D5nci^l+{DzN6OE&*WgFOl|Mk3voX$f4t_m@a4Gw57}&
zAStHU$p!7;zB{cFB0LelGHD>-+f;eXvur$^GZcfua@Gm?<!{hak1BSP|Isk+%lfpG
z;W-Lc-2nzb1FW865?v9=EIQtaiE|bLaIXHNdDMOb`t@zHCKV~B3FXz5DJP?1gLoeR
z|LkIj<;87mhuI45{y}AF(&&H$qwe*ZJOKO_n?PeCG!YHytCkEA+fy|n5#1YV!cLCB
z9+70Yo~1MWI@#5We0<t?C`lN9E*TX|c!P)5z!5JBut7yr6YM`P=^1iK_AFHdz$%D<
zC8bVcDWU-ve4Q=!(b%w#CA{L&cX)<mB_tH&4*CEOyb2q#DBud+NvOS4qX7*HyozRN
zpbKdpsyW33S7-H$Vuc}ntGzN@7XuY*G5ne>xA!K784|6GStIDlG`HF{e#+>k5@HW&
z$Wdv6;00q>)P<atY~upkt?=W?TQ`P+4Lmoc1xp_=eF~T@&B?oBgTK#7+eTXBse8w5
zzyQ4fS?<BSY<Q5?*oLY=iw5(IiF3Ri*v)!A&W!yIjchB<@88R#zr=f!SVC-!uLVw$
zgGr?v$l)@zwEmcji9NxIs8k=Q2#=P!<|{-@Rj@p#Fc$+X-gg;2QRez^QoOnYQD8Hj
zV{W|6)9<|-k??;Hr;dteo6~=PijELFyZ?T7(o8vqOcO0SZ@(<|AA{BnbwGQ5b&kn=
zfHboKX)0OY%z6h%^D$k-6LA}@tj)Lhia<<w5y~~1mc3Af_b;7D6WT~?N#d71epm+S
zjvA(CrK08w3c&c+l>UJ?;<9T&=8~Q#RW5)Mkfwhxtym72QyMD<XU_&JY-o@#cpM@(
zzH2ecd)3g0i+td^*#gb|_qFIT1|@86X|S;Y@3H#F9)2CAE#PS4-;uFcJ>*Sdd3w#)
z=@wN%ISv;lGA`QDM7-oI6uE=lR7GvZesy{g`i*V{F>k~Rr`1T1g378eyGj#&{}hAW
zP}q=`x^i}ljubH8BWeI_!%rHukhV;Q9YK(Mi|F0eIi-1`=dH*B5ec79>ffRH?_Z_S
zU?b;?wJBW@YyRY#FE@a!dj5yxNQdrtMimUWj*c5v-}U(7-;)3`aY7VWl?o4b)3F#C
zf>0j6iM5Kw!v7x`|I4v_v4HCfDvNKAaw(SVTPHchbN8YHk{zHxz5l47Jn-ISU>?^4
z*oG6siqF4BDFtL61X$^3%|BY{HPlYjVYD{9D1y@t3H%Oq9SbYH)%(oUpE3-C{Q*OJ
zjp-XkqA}qcB7vOI2781FApIw9SXLJkEw`@3XGR|6YRa*j?lSx9`>jz|j=m)x`O}EX
zFD}Q6ARq_b%p>ycw^(PYOlQEL+zD^~Ds@ostnSPLv9i0fuk<ko51btgcdNDQ>SWLi
z^ge$VzjPpaUbt+}{T#{?Nu(syH>&69DMsNk`vhC^d)2sS)0Wxn^?M!D?i*Hm?HkdX
z<(VTxPo+NQns-GkAVa1lo0zyw5|RD2t0vchG@Ga5HV7Ase^n3u5u#WT(im}ssQE<5
z4p)uZJ3_QdjPqo%*xqN%_KTi8?UL;d$vK^q8e9s9RxDD3r3$-swUVYXBw283>U*r2
zbOr{<Okk6&%2yQVEk%b<m-L;_#OpCBDJHz?U3vS(yTNOB_#RlhMi9PVw2P?O(%x$o
zvHkh!5$DU(F_Pw41u1F9T2rD-L0R20<pd<I2_%Z)MEP=~2%|ffer$waF_Z{z)M5Lt
zalr0m_nXXkL%`%3-22F`GP_^a6~To9Loq^OK+lrB&f_~S$mDYHBi&@EV{Unli(<yB
zT~9?vBgyvY(65&c{o>&K#CXE8yp)IkETqI_TyRTsPrg*%P=OBJ{$l+gIKZ$5)BaLi
zWLOad4*^n~%y!n#s+grij+Z4%{+iyN3Qhatm3a<Wp+<gqIs|_GuK5Xe;C_S8G0l!x
z&Heg(JY!)n19fHohq23UvR|_Wba#3E`x=dIjhboLO$u~qNzSYyOrz_<qq_01o#=4k
zJVHMy<GP6{#Hf_l#X@*q#o)ci@dQHl$CxT(UxUlG;`LqC+LS)M?oA@PhfB^_=YA0N
z{=JU}r+sGCC)>LygnomKrF*Xk{U*qgn~@@W$2RcY*wAzA-Lynu_Z(q-)>GY0LR&sH
zRF2E7sefi9PxZx%o0&K-URmrcIN-)EG;amYs(>}DG1W42{6oU#i8_wrp91?e-yZZl
z%n*!Emwo_tYRgkvS~XIVcAeX+Kl-kzAA;S)tLq+0UU*R-*F7gi&T7BhSGL?6#Cvg2
zoLAE)(DtxyAdz{k9f@;q`ndsg%HnB9@)-diF&rX4xam@g+udtr7>N2YYDIu!wQMkj
zPBpeo4?TGM@Qb^;Ikmh+xcn8<7}!L`ThL%5hqklri=Ke>(a{_M4xQs%Gv_1<9wr~~
z&^Jg2m|h3W@|ZxuLR#Er(BZ%3d_9;U@8U)YKsP<wGinxlxD>fIC2}%m4~y?va^@*)
zX?Wl_`5G#V9B!wFggKudk#=@L)yQHM9uDc^H?hGvPPYQdA2tVCG53oc_<8V{DbBNn
z9Ia8-vrN@Ea%HxMiYn=QZg?|w7jZBH{_Hh`PUyF{AYwxTn26XDtWu5@$YdS?k)JRd
z$VFBlo8tQyGL-7}(hpFkQ1n^9Z$-(pzhaVD9O{o2LydLPM?;kL7|>igf?cz!EN+cS
z4}CBo!-1z()`JWQrV_xyO^sN8op#kOF<1>n3?F6$%pRf}l(f&}mye25xUPCF=(jLn
zWHC>~@jeuxc3H|%D{dX0s92f{@#KvsNM6Hk*$NDpU4}>lFDd;dEE_>ENzp})WLm3K
zsHUdYaq&i0>aVez^sTEZ>rC1p&mJ(};*)=16IYQs{|_!*L&ab=q`fYv_Ns7`TNAhG
zz4n{e-<Uq+J_3zI6X+6D1V=ypO?`eJQ8l0=)e}W9`NGfol}cgU^xNQGTpKRi%6vEu
zKlLGu-88s;gXaS<v-(Vj{B>q75wCvc!>#Uu7=|qQA^?1UG#H4w!a_Cjr&7Gy#yB@p
zob!%ef%tX~7nW+VS2S<>^WLYXhMdeLlHXu0D3D<ZL$-aE=K3UzB`rPa?Y+T7J-Py;
zWm5{W{W@o(Oos*@8)<vk$rScms$z=hKmm_0<;P0OXR*4&GYJ2fwa#XX2NI@rm`kj$
z!uKzxC-BYZ$ft+^P!)h^)=C~Kg;jZVQNHk<@dwnEX5p!JJMUIH3tu*8=v2sN=jTTQ
z&&la7t;p=82^VH65jj$>cG$Gg-3+8uh$m7MXsvZH60$qA;a?wUxHs5veq1vt>{?vr
zm6Tr|HTTvtoMLL}Q+iloocG0<&=C}7op;ng!WyMx4KnWK<$mNfsae)Q0nIuT-`$eC
z=w}qL@yA{Kg2T`i(d3_zF~q>lUAB96u($N{qDI&2Y=hU_SwCEZ{uHJ=W^^!>VLrlE
z?B*DHdN|n6>AHKidmc!swUn5+I#ClY|A|BKJ??!rz!4sOWYeiv5doc4>3TQ!egV@B
zzO3ZD7&){pZaRj^NJ>^c)F~IQKU&st-OXm&?PTCug0Y+F)O68OAA+RLCBpdDmDeCO
z@h)`~T9r1D9tTs-yF)SAoStnr%?);lsuZ#Gt*0E9bRENa$T(ZJpEo2kik_VYd+@l2
z37vKr?Y8@2>;zV1>Opa0rli8-EX${~pWU2zah(0sB<uKSXXfHiqW%cse$-#aD-G#l
z&h?mon&b8vHuH{%LHgp{T#kb{j?(KByA-*j#eAmSzzkl*LYT1Z@i%wao~ua{2xlpn
zy*{dDvtFZo%+0*&v^Y55QW~qA@zbTcKag^ixGlt+@L5`EGh#QXa~1+Gh6Gd{EPNH3
zC7ILQad@KqAe97Be!VO3d_}C`gNaCw!TU?Gbw>da>)#3gY)AosAw8NQ^5c>L3`v^D
zq}S4pyU$U4+m)H$sb{A>2UH=qv#*}A55l?NBs7zglMR)VjwSFwXqk18Wl2T{&@fXQ
zFHkq<cY7WkWf%W=c29e6js7j{tx1ciPL__P&N(DmYaV_SVxnVJl770d-TVR-no!QU
zEU$Uy0WYZ8VD&yPQ|7tLr<|I)`{~ojtGGw)(F~$gBQqYs{7H5m6TQ40`tF;Nb}3cc
zUp4e&cZlc{OPJaz;&muI7oU*vKQN8e++JAYGC_uH65d#X+BN#5j&%GPb`z5&^`n*`
zhD;%vczvhm?;T11c@}`{{Hsni@xp#s^o58G*n;P+@y|y+7{^}n)q7Szlke2>gC9YS
zM*RYMkmiLKge4=|seC_X54vp`QXhc4NaUiz*oh3---l1Cgb6@FNanI5nK5m^-aI5=
zuUTVlkZ`<D^fTXF!#>h754J~Y;K>TW`&(89>d`NTm*pTT{j}RNE=frw;^KuPI&4<f
z30R$tJI<gtzcl3gfb@gX4ZOcn&*_h!`e8sZWkRPV=t>Oxhb91}pa#@sv^Eb#tUmfC
z-lSqnTMfGef@B#x^Lg$?9r5j2SJB5wHhJz?^}EoE4!vkA(u(d_7n$-SPlTxS^2K4g
zWkRYgfATJrg}uWKZCF7&{%w;GglNMHlOp+TY~-~QMCpi{b!nYSfl>vBp7?fw;MPND
z#cD}-CalylCt8b$s7`gNL6;U?!znxFjdksV6hX)06p8AD=5Rjk<(?Gtyj1=(wCr`l
zjW_&yz!O)M;Wva;=)z9!oi0BxCkGLDz`YBiar!_J4reo-7j@(|1E1S?sx{U~Q&S#L
zgtw1N(G$_4n|*mo28bsO3!^7*nnbs{>P<ZZy1TB(PRuiJ?g!*Iz9k#(_2}6Aus~+i
zf3q(!Od^gbKfNC-^1jt-(2?FKkik+jUDBm618bW2uaLCg!c;cA6sE#I!gNfs1B|MF
z+P#yNSKmyqx8Jls@}5<-8t|O5hk~1xb>!)8nhNqh3bD%LFYucr0&hm@IZtUFBQ|I-
z@4NUo*1oZ>qnYVXGV5j6E0?EmKb0}B&kj0lQ7X}uknopxhgrIwx5gVc``+uUEa@i*
zpRg<_4_)yP(Ma_=)}qPYuLU0OQ|E>#9QNk4k0ZCAykkC{T)9(iZhUcu;5L&yaB#ms
z!|%jlucc*kOg=l9kW%D3zoVnF$)yU4#$m4-8gEOk1QcbmRfl+N7HXVm26BJ0>Ag*z
z9ypoeH2z$Xf2T5I+DnxV9rkoGeA>G^Zb(3F1J;&gb<0w~Wq_(`BkrE@l;dzwSj7wq
zW_Rt;Uj7lF=?26u4ib8`PHv*3?#_Bs#<hb!Jy48SMNBvw@b8sIhoq*=xNdp!FO_PB
z_c_nF)~r|WDYliXv1oMVf`PaHcx`{~IooC7H*Ba|3LpxLP8EK2usSCNQpTPh(QM~r
zP=Vm2eA`C|ZgqwvaD8pjVBUi`D!H%RH;TrecAs$Ca@=aFn6VA7{o>}L?|p_+d_qyv
zJr_t}QIq8c@D~N!zbf@{Vk~>FdVBZysWs2AieuuORYkGaBW(D9F5}T^5BjTVFBS8w
zaznt9LylP#G~tC_uU(Mzd7U*6Xk>+!TGODs+3Nraq`m!o2=1OgI-!qP6V506JA03)
z`I69QEV{~<6oQqohTFADjo(BEx-TbW+rc)Xqq=%hge7F<Wb>E64Lh01+*Y;R){4m<
z^LNO+`!sX2AQnV^y=Qq9o7KC==IjY2oK~l<%sYGD!yY_DK|!Eyjl766e4(dt5A|Mc
zn3g<GUksAEFz<z7r?d!eChskJTi3p1b<Pglw--%%Nt*+GSLRs8DGnFACz{tV?Y1il
z5iI0iH6HOMcMb74f{!deFcPv@RbKeCBiy&i>Bg?Ly#i9NdWu;$e~QB%x034pgE^f+
zh^=DMYeJzI#wMuK4H!!Mh@9SbOSDq-f#_)mU|ueJ-t0OuO*38xDdaBOFPE9$Sc-4&
zv{P8_x0!D$3sSlayeto}t}FObE8dpsSgq^6flH`j((_p^t8aH6M|Ei~kTUw@;>5td
zh<kImEZ1W@Ro2Z)ep_Enk2T4<ETwEZSvrsOSSU<j8U1L#WX$xIxd&8+p|ffw*`ybi
z8h9{jE_!6tgle9UiX;s}nb05O%%7*orLlPE{_3pIM9n`fpO_Q^5&6~C->`L;RnwQy
z{Qf!3aZUaz0s!rI*{Lx8A$C^`G{>K_29^d1nD)ziZUEn&HMP0%52*Zx7vP9E@iKZ6
z`YjMKg^M_a^nBuGVYTEj8Qi3mVj(2*OPbh78k~;fY6~m5Js|@>7d+Yo`a-<fPUW0b
zgK~Fd5{G5EcaF?J(pqm4iWp}I{oqwwRR`zKtQ&S#^0LenFT|K@93GLt76+QoZA(3N
zmg0k27ZFL;F~SFvQ_Q@tJFs*TS|~ihHRq;PTTPgjCOrwNN+Mc)_eo)A2(8#v!RK_R
ziOukfDs4O=Ls5HmeYd0AWZu&l!ycyriUDVf=?8g|K>+g(*Qh`A$b|TBuz>66S3*Q*
zm?=ezmX?#c)A2<OAKpOs=QJK=G<P&7@|*F5;jT?&Rg^UVk+@4PCw@v7uVTu>f4yvl
zqKyq+CtoY&CizNy`$Esvaa=!ZCIL~++F6l}4v%gNiNs#$FJ}u3FbwwltEi{i*t5#L
zQbL}Tv|=uf%sWAw_cd|nlp7Bn{U5SNUSa=O#GyVCXF2Z&mmU?2fPs5}B*k4FH~!KN
zwA_aC&)Rv9)DDQyuS90MH`Bs>G7^9;QH~>uF|QiSyg}jRN}{Fc1g?C5B>=&5I4Da1
zg&VTHyQgZB9?J7r{VPmO9W1o4ue!9(rBvbc$YU{1Wd&TZEPCNk9TOXSZ_g3#$mubp
zK3v^`9S=Q|IH+F-cn$z@`BALp)6>j6uxR|Raw~mp9@Q=CB{ufhP3;tCN>!_VnyA}x
z6YGp>EV(_s(QPvx{8E!_@kJi1A6WBfp~JN3&X<Wu7#-`y{vLbrNIfR){Tgl@Sx-8<
z&Q{V6YH!hw@!oH&<*^WM1cmxMkza0(dRN@UreSP2X!XT&YEbX#sP;b0x}kG3$9dKP
z4ZCU0So1RBFvR{uRyXXoPT$kJ$4xy7V<oMqkbm$JB53nz+P9>pCg%6{5#uwIELETn
z!z<z8s4@#KF1M?sp$Jf}-~(IXF#Nf0_Yw<<e{|F?>ttD-2~ZHljchZ+J*##G^pRmm
zSEW6}r(BgV@AD&#AK2kL%`k91Eeuz4M3Xq^sd4mY8oCTZp`W<#5(!QR&<;9zbgbX#
zs;go*VV-SVt3p6o^1ElO+NX>=f6@(~9vJkiiSDg%EQ=-yONH@4HO=*Mg3MCgbl>An
z4QbxK`R=AciLQsrX4F?XlbZX^+!}PDNpe{A%Q-BITbTD>TVzECgX@>8Gdx?^2RfUV
z9m#EnY<I`j$J&s>w{F<r*=_VZ&<uQ&({7Zj%ta(<QIWr1H<HR}w}_>c<t@77@<lkO
z#k&0OfVe<91{4UHpL_fR$Cf9@FzYU@m5_>Mfd6AD62C-l%ZN478=CHolbDJSHMrK(
zqsPZN@<x%Z-sjspk(K#P{N_nG+_8tfUubC5JOp#}tiVmh3q`6{qx;p9O(*flff%$P
zx>EWIZ1M45K=cd9j_835y(d1v5J=Aj>8I!_vc1=?mn7@Y=+4_zdzQBD9tO;|Oq+2D
zPxpk2Ms#(tJ=@77H0eFN{Z`z@L#abSZ$-p?i>_kwj$G!HQ=p#lTJfs?@yFd83BoMH
zN$W!^`Vly6)h!t^{Pjm|<|Z?B2j#=KWCF6NpVKN|fT?D@;8kU(>1$kzhmRPv_JW9j
zf?7L+5QEjk<Y~YjdjzSzTPx#mV!*6Xn1BjfJ;$)bUJDRu%s}2nRm}|fBX!q6_I;ZC
z>k<BW)1RVmw6eZd5Z|W8yicoP0QVlAKHuufT`Fn^mHvld2fD1Qjgq7?Y6rF33ig&f
zOGL=x2WjeyWpBZyj6W+kI<58m5)gnCVs0q$a%Yh>P~%1eov#8$9iW4s%X`O(&{pVT
zdP1%3QSBQ0w`^`(K`QD>CdT1EhI{4NOPVNS!9nDiB#Xt<{rcEL_WJNjbZ`JrC{3}V
z(>p)y1{bf0oWS(5?tkQ`uACV+@1C%(Hyx9&zj#u0-j<Yq^nxf}*WokyS--btZuz(q
zgVyshapsyAT|H}CI^C4suRiKJN#>coGM8L<3ZRE-mJqcB@BOGst!H~?A;KEd$vnM`
z6M!&_%yK9yl)@2}`Ob)n21>RWj}yyhD~2TFuV=+vp+SILYA1D#Lttm{-QXOMf%jg@
zBWuL_JTvWR0-@!~g~ijoK5j(zg?)=?cx?Z2Ptku!m!NyKjJ3~!zTDM|9^GBYWPT@B
z4rov)JZ}HZnt`JPY`zpWxZFK9>_c-}f^WSR=}wF$NXV$XU&xQF-~a2^mw(<@X!K~*
z1d`gL<ePc0XKaMO!pn0=99WZD$GSo_8dC6y$dAY!?s*o<yOd|UkhEXDQXps?pW;;7
zWl`G6VSao9Udai2@<q?I7LKT~8&5FGcf7Q`8PAoCVp!h~cTz0$#dX^Y*-6Rqqi~T_
zHb>?;b^Lr_Z*bj`w|-@=6f<0B&bG>AI0Qcr-LdZNbS>rLu;6AfVH~^|neWR~Ol2^H
ze&)t*65J~FpL8Fgwb!tlZoyePA~h)gqp*zI>fZpuI*|pob2p+3kIVd}X_Grmo?rj9
z>jTuNVtktCh_l=fw{IM`8Z<Cl%LCrN18k5i&I=s%p6f2~WCqTzAC3OIgW&H9kgwk@
z4oVInfwZY-K!YWv0#=tr;r;Yk*d42(&+p$~A9H9~Rv6BD1%x$@zXQz6eV__seBlo~
zJP}qFZxDeyY|zh`PUIMPbEbz`)ERM;iIs_ax#8?wkbgU^IqxqKG9aD`y$!ZBaqNY*
zOg$Ey0j#a}Sy&7Mg?ooUn?$$}n}*&VrFnf-(4+SI>29#Ic(wI}?EcPo@w#t;(sPwO
z*5;488jsT^!R3Ob>CS_0T;7?ty$p)LwiDxbA*4<CC^V)*%yl4>A)bS$@>p!FFw_0F
zBzPDv#0$?tl4?YTuWZUI_n=m*Ud!q>Ivszex3OFMnFCq<OXjTzAo}x8l?}4`cN9l3
z88iE%JuH%}#FSgjI5fXoQhd7%Xj8dN&~UR-MbxLg4)n}LY#)$fH^B-@!fKBi;`8+k
z+>X?C0ivt5Hzx1FZ5HR^DPk1;cVYdL-5w_W49$dfMQD+gnq!$oJ;aHrd!yt)->y4!
zL<?3v^^#Pp+9HAbqOWwsWTW0Q#5D!0<V-Q$1R24O4}<FKPC5jw&-$SlhbsnNvBC#q
zGt7hy;6kX0_0aN!tfd|lbkl;3+9hzKJobcP#&V;kszp85@cUD9LO)M^kjEplOvk#i
zGH%XSd*58Yzf|c{tUpm4d(*xV>IlzipMObHA+N<24_MQ+9bs<vQ}f96QrIR_crIxa
zL2}&t+n4T_-xD5cNs+?5RT}p)k$o!(-Wd~nFrb%|t>1gMa^|YTMtt?@-nb2qcT~|S
zdECu9QBZkQE0Rc%7f!S>&07#X6L-JX7IU9ql2fGoYL~$;Yfq!P)I`)M!3>TKbEAhM
zfRssq%?dx;VsoB!N_RX8lF1#u!Cf>07*;;7fi<0n*WnKb{<#d*`QVN*vlMExWD>nh
zB2!)p!VOQp`iPN*Sn#sfTUIyNhVxP>SGzW#qf%#an^)qi?pxlB3@L7IU8-KQ_3kDo
zmKEj0dbSYAZikVQ_MX6wCIeMc^MaCmWOqU3&*ZXD_L{|4{JS4C@xNcxugkjHbrI_%
z92#4u7}gH5xp#bN1*|_Y>5T%g(|WL{3W`#=j$e*vf07}%gpetEYGVE_ar+xc#-V0P
zB`eAs{);_kUg#diuh&jcv^mUs6Go372+kTN@OszhYi7d5t@oR1tYyGuZrT%+uKTvT
zYi1?+uJ+<16DuH3;8wjt-zw?r)&k<<bKED<Yeys+tmMdC)%O+A2b2Bs)h?r?6<cu|
z$$fZKz%0qsE1usXXS741q1Gf@>@KnO6zoB6<C3~AE$&{~x%^c@CU_l$WXA>+ZdPTj
zBntY^>Jc|BQXK#chS!U@Y+0^BRN;rid>)TI-;;|j)7lT;xqu~?EG<U2jmDKdrq<kA
zOk!X8FtNmm&`>K=DW7!0oT%qY>3qDyr6G(C%NS5H^J1i{Cxj6LZuD2qQJY%%4`+yj
z0JpSL_*4|pg{uQaBP9_pjbywmwav^V>-ZW5rSfIRpX)UEqEzY6fU@&i&<pIQm1NJ%
zWT&o9b^a-dt)Q&r$e2l}O1t1%%cJ6*G+(>E!@c}nH}QkFr<)UCoo=?;RTbCes+GK>
zWqLw)=HVrVnTs@C?}grS1?NdG!K$<JB;%cVy5bZ46EYb6lvD7!h?|CyHbeAQE}`cN
zP!cQC8|f<89ZkpYYJ`te08<#IM`xgK#q@i^k2oZ<v>IPJGRu-SF(I8OlEEss<v=oG
z;tH{c>AdEcCz(LG3b*6>6$c{r5u>I<H}6x2Be%XWlxg@Se^I_)P6C7kZKeoo?56zM
zWbS%b4}kb37&6BE;1}Lm9Q@**%N_WmX8i$Bd4nW#w+Z+<o}YqRR^VMejw83g{bo8~
zWIR9J#p&;Qb`P%<an$bjj?<{^rdG|&crkDbaPdUyi6$&D@%2`Kp(k5*l)i?V1`GK0
zF7!RLT0rf^sN%^tBgKdWP@9`1kH)mi6nF83*GXbYo6FJ1+q><QI2qy_MvXp>7TC?E
zO@Kb!rgGUuK`|VH7g-=<z%yFXqY~WrSK0hAtu5#tgKXxRcIVm$d#64slAI%8{rN{<
zyW=_+PbeZVDcxGMhbLP$cxM>hH>+y$N4wN=7X=;hnhd4i-=r{>10Ktesk1bFvKjA9
z?(|95YpiwHsXBfE1k}TT3cui(!yxq=R_!E$Jp9Ay32Rx<bX}eiEWmh5ZU=Z)e}>Xb
zeQ}(f{Wp-b5>Nv8n|m|9LUC8ORwqCx0A<u0;oq-n=EF7YCJeiDK7~IjgrGy7%7D-h
zT(>N%1-v80lp&>AB{nt|8U5|c+gk!=<(*Hz2eWqv1ngDr&j&Apq$s8r*&O<_<>DU3
z)_c0$TLP3)I~X?6y;!p)?_LX(TswvZEvo&@A5d$8x^G?Z>9W-=`o(ls@2uoRYqM7^
z+PNN&nJtj&42po2Qr+fXju~$onrr0*<;1eIuI$Oak;yI+&;z{R^_{%y?k%#)rt8^G
z(WUEu*T%==yag6$)+V!~%j6Fp3yH(6lGkSK1eWSM4?3JCEFkOjzG7nZ`Yu7Mdjrin
z;09*k^`7Q-HOQjoTyvn7u>8scYL_$ku&Pz~c!3~9#^VSw!uf)ZAqmJLGtrT^-(5o~
zGJ~69yqbv#n9bW}4Eddgi1`8=;<{A49|!-q7l+&f-ld~HY+Xr>dveb@c}!-daL9Sa
zn;p2<>~$aF5XiZ@5EE7@@N*TQ8kqukWa*^G8MjOw3T#@%`}D|+|2!aC?ZNtIyW{Mv
zJMA8S(?QF2(UUx`#gM@-Ft`)&YG^ARN>TgMBB}0{z4O@O6-Y39oo=SknY_nN%pj`_
zmVUWMl|{)}AJaj_0%D@m^I+N}e*#E!o*qOcy&aIL9m!tY4dof<fV@rM-NKA@@r?91
znQ~?tX=fMm{_etmUYQ<E7~%--->N(CP3Ct>miIiyX0dgdJltD^jGU7;;7sfv+8Qmb
zriVoo7u!wP*_+N81TO+b&sg3p1ujyp1qpl+&4Su_l?hKWA>)967k2hM%|%ids(pNC
zFS6Hv(!Jr*<IVKul<O04PksT`x6I!Hiei)Y2ef1&4yxt}{LcZjWviKIUZ^(nI`xHg
z+aMA9QEd+9Qs9L<DC92xccBdKf`gIn6z3@h=NWf!%ScsRrKVu-kEiu55OO`d8YEY`
zq1u@GBMHtu$_u3Q=3+d*!-81aHS~|n)S5H+a3h_t-L7dwzaWN9I^UlG>o5NpK|*L=
zn4Eae`nrxmPG0GYK7saBv5DilWiNbB_k+kOrwJLi+?^HshM0;OFCFo@^{6LY!Yoti
z8(}#Wv(*0AgOrYXKo{w?JIhJM9<3kcor~JK;hPXSr^%O?G><eHs{2m7Qfn{f0*hbo
z%;)thFp$AKV`E%iJlGE8G~1laJGj-*WSai0^TW#|*^14nR&bQIS#Kh1b>P%{F$s^N
zjJ43~crl)cF;&YE39s`t2G{M+Qc+#T)rNx#JdwRT_n6G#t4!xU2Gi~rGzllIqzYCA
z?tIfgnaJ3aJC(~UtoHo)adv*LrCpM4{(j|TF+^Rbqa*T%F#;%(%A9K!QfbumA9?N4
z6)c~AAEgF}t+F&wb$mZjUzMnO!M;@+N3C4rCNnMl3C#c5aBz!ecR7In))mCrm8Jsr
z;5D*WJ~8`N?1;Wkd^B-a6zFYDZ~u3T=s(`J*x-}!G(sr|_Xyl}**Cj}@gaB3QWF`6
zN|Stq(|L27>8)kOZPb0P_5`Piq2FMo)+{M!M)vZdW+x=m|1mLRB?j7a-`Q9Ijk8!8
zKtEch?@MIQ@jxnSr&b*q@J3}-LO-sybgC;SW6%Qa2`Ez!6>nb+XunJBiKM_KU1?;I
zY2X+Zfkw%XFF*%1)xfjAF3I@+@g*5qwy5WAq^F=?37=mWUAo%q6d>&6?-`i`HbBLI
zn(v~MRQiUtI-_<^yDb}1pdS^j+S97oGm@-aNKIN}bhVq7I96<$0UcKJId!TXA5nG4
zO(vfkirk!t7TGf{WRm<X@~cOHSIc%+2Q{w|diUPImh{80X-j?p$UkBR)znU1gf3*M
z;*MD$(t3QwSnB5##{qcfseH0d_*<L4-0WiF+ldXB$tYL!ekGPJDmQBU)Y7#Ap+nVW
zs22O@QpauszXZB}0Uo;Ixsr2BjH(|!s@RQ7v>^i-ipj&HuAELBfeghCC46dE9OKFw
zUh6k5FcF1=b^UN1e-0E@|8oc2Kn8H0!fqjQs;?=1GxDZ;@RLfJu$vMVo)h}wvCTRN
zm@I_y5`#x*8qN@bd7955P2f-6e?62g%?JnRM=9E3*FY}*ztkwieqbZ-lZjQ61u7oZ
z<4cmxXSy6nv6%xsRQ9Z0=fM1YNw8>5;HLHAzt-d+hLVErab!Z;0br8sn>RrlH=3D6
zdJ?!a+LS6s%ah5_Z)nXTbinZ<btA=k-^W%IV=!<?#^Y|!%LDJ9SOl6aBJwMyb>rA{
z*!qR`Y5`Q7c;~{D%muW%N&{Vw<WGw4{aHjEl)gWUH|LcN?2gTIX^HU``-5!hfmMm2
z+yFwe4{xaIvunO#3=uJqq$4_dO8_61U1FZ5`D5=t@AP+8sFq=7smZ7-mJB8Zy0DTX
zoP=2j7$5sOXV%f;1vWd4Gk|y$mwS_}b<{s_^^5F%bAV~T5rlgixWxj{>@dM;3T)82
zpi5)1rMmaVUTxd|C0gL=Yk#%*5CUDyGX{E(M|$5~HY-vC=%MqiSPAJ5a+f-+P(s>Z
z&kp056{^(vg7TPAxSmD3`_9tH;+UC1F{>OmmtBi8zx(=|a<v&RL8XGabCL;8VJ^cd
z$Hihf271<h)24>Lnx}DWdT~4S`Bmj1_)#yLIuEAl?^zXkMSnGLKVz*zR3{}pZ0-u9
z<FHtzx7*}5D?j`K?Cd^RQK&6#ov47nzt0VX!iov2Dz+f&=~K|+qG}sGs~O+`#DRd-
zwc3KJWdEp&kFt$RHbLOpB-`He#M^`)(SxDKRhr1v#RJ~3q7v<iEGx1SOLswgJw#=a
zfV7;Sf^I@#c1MaqZbrltSm|E=!D3D>xB^(I{ds_G@qvE2WiAP;Hf<m!e_OeHKM?EX
zt*Yms8B1di`8ERvm*Ne)yIrD(b#>Y>JJV*{?pZS)OpbYc*$N1{h|?-DH7k_*=s@i2
z9ZJb^vQZ)x%$`+HppTf|iXgF`8NNpXbPD*1Uc`7)c-rZdj3X`%8Yrond8S&l5v>|C
z9Yfjd+Izr$nb--?Gd$@vOpg5<7_J_TKW~KP5>#Zp5P#Be2-7HAh~y^*`~|oXR~l<m
z^B_7G=om%?R=wK0c{hp&ARmHavK7H%=24~q9;}n-In1Gtc~+!E-I(#dpxNCYS}_TL
zzHu#yY&Q8hb-)n&@<}@hP?fdW+6wL$rA9Uy=ryudOw;u@9DcOa(&-n1AD;cp)nJEl
zbjPvAH&8l-aQ6eX$5N2k4?1)fZ7Elit&D!54XM7!E5LG<{0O6y&&Q}t$rUzJ|8*DN
z#6sa;y=pdq-kd9Sx-h7H#6Dw}?oMoE^vYndmEKh*UXc^GnV4Cwp`Uu_k7@Z@aG>@`
zw6ilSq>R-l^APC|lkOr&`}!Hw-ksKTPX^wlwmYn|RS=nRuA%Ry-PJA2DoyCedV`+e
zwKIS#6Di4PfAk(7F?VbiWY2>W58etmKT4TzKtFJq59#26w*av;Ps*|ZH+<btqhd<u
zt-+BQPY#$}zs5AhhH5T=?91!%R$Go4?2BwT*N!QYGcRCW@HbYrfyM-8xF2kmNA-)G
ze3|4~(+3>+qY{;xxXsf#^}L*dJ}e0a?^K)l1hQB?qIc5?h^S*7+rW*1Uue)K-;I%3
zx8ql-$7YU6i>^Z~PX#ns0!^BN{FwhuDu5u~cI$54V2uWDC&G1Pp(DmFUzy`4K}L&h
zWVASCT|@=IWB?<I)2*Z?4Jqk9yojG04+au5#`YLOqU#RsS_<|9@9gQElL{+h9pp-X
zh8LY=RXJX+%OC>mWqVH)>-Lo{kK4IYu!~#-IBX7emUp`|h|-3O9+g^>akVl;01pWR
zY5;blx7wYtZURzA@Cc+Rx}NlsT4GXDkG3`4MBPBPT-MmxbNtc82{egNMGP2hU1h(>
zG{JLMnOqbm(Zhm(Rz()zw5DkRMc}q1fsbM;&#awD<4XClo5oO7s`b#dqaRO168fDW
z)>!qyBb)}$)#z9>+T7SF1RM(2tJ*hzRw%LC)(GbW4pJ@-j)A(fKz)&h9A}gbPHR84
zDBKrCvKiS+5cv$L3CDi5r(Lk&Vo{RQ1Se5NNHbL5JuHq|f+zC)Y$Q&Z(Re>b=%Sr+
zsWtwb!B=dsp<{5UY|WF>tz*V`=-b@SDtl6`dXEHv+v)&)cZ2!%!5~I<_IR{|8L8`5
zmG%4D=B(Md`H{fY=|J8`?`lu_0(T^%GvP(UT3HR2M?gmy&{TZgd@R*{oj%E0MAq#<
zTkaI@xVxk=)77J7)(ud7>)1{QaR#}~vi8?xk6mcAYQXgkB1ccADiT1wkz*w*<6%iw
zp!_nW3Ilsr9a{AG_*j|#RN)?pI|~M0XT6E+J4cHH4HpVL6pxjwoi^y@;#p(a>knl!
zl|XdIUdCLj)nzmF?j4P|!|}ztH`4WblHmy+nI4XH9>C-1@^BXdUkIb~I`_GqDGFM#
z3$7Q&#>B*Q0<C4aea@M8y-6EjAz7IC<I+ykZv=riw8+G>>6!c=*4_fBu5H;GjzF+L
zZ~_E(cXxMpClK7-A=yB1cXxMp2n2U`3AS+w?)-~$&b$A4^}Tz~`>MXGRVgTTs`i@Q
zvwMuu-E;N?Z=V6R(;=>6glGEazR;_f`SJ_VW~g)bj<tF(hq>9w`}N<hU*^YUwt5dL
zs&VA{%4)`vOttdID0EKtm#o|JEE&H<ma^&N6qO!Q0&;r5OWrpgewapoYsK{ir~oJe
zxi~f2-~aza8!u^cd;)^IxIjN*pF;h^pAm>_k;I<oWsj!-{Cb(R^bi#Yxc%BMd;DC+
zN#Y)CUT!Dgwo@01^8y@K5SA)yZ<A4Ady&r<Pi+r5BY*%Dz8X5G>n$oNB~{9mgM!s3
z*C_t3v?YAmb_H!RN6f`S=b`%yO~roDZ1c-Nbl&ff?NFt@{;UApFIuzH!$~G`krm2k
z78~@|hkMmyye%PWB+q$RAWDv#BbU{L=Z76q7`CSg0fVM)iz%2CAayF&ubMkFU94e<
zn+1*4OBCy-I~kmJ(DBM$UT|xFf`Lf~_p;PEo&E5^iz-q&;)zc_04|Xx1?pRtqgb0u
zq$@-~B#I8jZ3_wI+ZoPvV1OHY+_2y<d4NP#?ckqY&K$eU4%!(k91#s(+LqLMX#2n$
zO;yoMU?u28dpL#LY9|7?5}wo6XZwvrL(70wj}D<+Ak|&4;Mo3Hm5^vQ23k%$6oE+!
z1qaq6^|hfPx)$;8meqEHjIUMbY})q_FkMD5H=J6mi~uE~fOF^V2VO-=%E9eL3)&cO
ziwdiy0FImpho0?ciIgAK@l1Wq>1obqc9U%$`&Xqyd$`GDD^3}$*H2<#V~W0@BT0<r
z_1>lJZ8gK7CwGlv3yYD*d1;c9HQSXqv!yIv<BiDTxnF6{%d(?5F5e{sk5ko`lPk*0
zqn1>#y*5W0%8XvJuKTwxap>6{ynCUrdF8tUbMr7@EVkj1NlqzG<9`IMuioH@;`36l
zqh3gj>rrKi-|5D34*NS0y!a6n#PC+Br{qVAp6$w)SzTbRwCut8g{xX<1CeW8#XsD$
zml#6q#M;1q?ZoGSK#uPm6v}mfQ9BT0+-54z1A*s0&rrY0Jf;xj40YVmppm;^XCP?1
zGn%%Q-eMik+vdU6QbwEUamoFAtBS&-O{TRT&-+0l-P62S+q1Jnkrd6F+v~eFa9PW&
zU4SK{xV3y+Bq=F^79=vMuG^&yP#o1li4T_Sl9q+`UeBA$mA-sxzPIKgiIdZ=1gfjs
z8Dbf!jq|J>EA?6>#5?Cxr1DF!B}vWh9jVTD9LQ_F*0e_`5ee*Tx-gv>x{gh$?)xy+
zvd`W@1(D3pXC*d;-Lp&4@hNbupBld{+bvygocFj-v(6bYjxrP6lvH#uA%{<qWcJ}5
zbOzwY1mJoTdMiv`7(J&Kx<jt=nz=PYRurXISF|029ZN{6boM|=zy+mX?_J@iXKgQy
z#dFCzLI#4HEtH5Tq6l_sm5JCP$0aV82a#%V5-H$-ZlL-Mj9)BO{<m7-|BpsEGx>pT
z?)FysOkL2v9{KXcSc)@0EbR;2>VE<Mp^4;vFElOfh2$S>&a<gGgu#hJk0wXMFUkXd
zC$}!%YPX!%Q{yq!&2isj2>^N;Jd|yIC}nu7bGqz*Ii}6|ZBoOh)`q2*s?7R(QMFu~
z#He^jMJ{>O;iS=`nmZ>t>$0-*?(LVewg$Eo)HGN5nw_<q?INJbY0iX^=Xcl8Rt#oF
zK6Uds?b47DhMaU0?TTR9u-E*0pQOr+WR7_G(G<>{_A0RW;NOgx2kH6O3)hH6*Y`2O
zE=QUaO6l(8Rx1*V_&p$L6p)hT;#M|QdAsha`$1c*5ddc?b6gH$sZ!Jv6F=eUF$2r%
z1T1ggNkP+I_x;48pZ?0v(=f_Tz7&G&{q8EVR8oM_iLs_ApnuCo0T9rxH3!DuB*}mA
z4ghOw;xjO?BO?SonQe%ZXL>&|<$8mebL~kE_fYy@uy_wS;QI`#PUXN*>6v6^oQ=d$
zN=Z{MB!JdubZGBlB;tVi8gPOA&dLX73y0`^BgN}}EIw+@T5$wEd+7&4L-*<a&-PRB
zYD@74#5FpiCpKE~LrKbWSNW13TO~;lND+#n?~#X?St?MZt``sRFWp!d$7_zhF|`N$
z!mj90WW{D7+_Sy=*zs_da`$sF^S!zY&P<K9gkn<7SQ@#*j<=Ck`cd8Ed1B0$PLThG
zb4ytF7Ht~W(p7;;af!v&+?qGrXx205V+^wJWfQLLkM;W8Nub~98E8YWe@JAC9xbrR
zSUo!xx(?)$iFTkzjZRL++RKeDO$(p@kgMl75O+4wm!W<?RM%Fw$&3P+JAqb%QVhpK
zGMUC8M2X~ZzfKItEisiHoT%Q3F3t0J;lQ|ed>>QaYIBCeC{GepfaT~>URIJ&JsBO#
zBbTyN%S_NnfQT3{1+2mFqj`hSlU*u@Mc4<9E&i7d(bC%+m=#^2^~%N>@2N}SRLTLh
z6C#xsNfp+)>zq1Z9%#+AF7y)vb$Vx_Zo8-d1O2nuUcUR8Zh;=3)`xMImGiIMEZYmY
zR_cK1oPiy6g!}LMGNWLKN#9{CY&$f)1i#)lbtSiEv!PYwfq-{xDFQm^{qtcOq$jEv
zcCVg6Hw=<Cs0D-Oc%0CGa>M_PKe|i6uj7lK!7XTX$H&LAf%q`U;`qd;BbM_c$E)ci
zO&`ZD#9Y8>E{A+I30ucaE+fYp3#oDKSoqMa*d$o$kzeCYSy_K35kZ4DhxIDEcWsxR
zmt<_#zJI(_;xa9xAqD+%*r6TgL}$1jUO12CP!dgMF(hni%2WIxcEshJ<8h6<JKtcf
zTZVF!P~kC?4A0pv5{#OQsnmBcPp8`~_!cTG5~5yvn)CBAG^Iv$W7qZI4EA)H7@xn4
zR3ka3=fg)?plLL#Y{>;VB3$dNWuw;Onm4Oitf8auvu|^DiK9-PG0##%o??<%*rUnn
z`?J&2NK5V<-5de|dJJRhrTUP1>m`9}Jnn4Z;=9T5&u<;OGqg>$YgC1L*jp=iGZtcb
zQrN~Qk+1O>3|a**mfDswrYpU5?re5=lbMaaZ`r_HDeky4YJ&86$~nQR(#(hV({g>*
z;$N|PAzDgQ%L<OTTu>rVSK4)`%vWoJWbr=W@@B6sxhTv_#Ze2O^hL<ecXus1VVkW!
zkVNCRI}I66=gT<w-)LU2s3Cej_F7@_eJ-w5ecA@Wpos3J!moC4f|xPtPVQ`S^5s28
z7U7u_Mv}<9`7ZZo;=D_>l*osk`^F-*59wyjR@A_-Aj29wPuvyGXMr%_Fwp{HZC?<m
z=r`RR<T{s&B{9@}Y%r@mdMoJsre^bG`ex_5V^G`G#Xghzdc+&(uU}bTLxbv?e!#xL
zfAw#kQ+VWG8~W*`Wmf(rGjk>KKc4wtLGb^=CVM4t%I5v5(i8F3H$S3Nl^@tsFytvU
zlWK1vIvGgJ8+C+T3xAzbaEH1+P0dxWt2WmmjHZJoIyES)r!S>((P<_uEme)n@#kZ!
z5I%8A5{b#s_o%Gr)Ui51baHR(g)TUlor7_Ly&blP1>h22siuim_5ZxrfG}`k6hkaU
zYnvKd%h0U76Iv;gR}Dd~gQzjbtIBaX5h@}HdG~O4i9M0qcsyU9p85#~wH|Q8sjZ?K
zR94;oXc80}EpD~X9esXnM_j@ol9w=`pS+&Ax@}OCBU&z~N6&}z@!pSlRb9PsaV3w1
zm6-btGd4csLkR+~KDxF}P7_E;TA;SkACy9#u%O4cZwfavcr+Y$T!J-BgNod0=S5{S
zDIW4=afNz9&=lrfKO=+?x5kU0s*=gceORny)nuogO`(JaU$1SDl$b6A&lo7}CDZBQ
zCNp^iE2A@Mb1yep*i`k8$`J|7Q)0FotCs1Coj+^jvnt`y!ailihkFf9FVtG~(faEg
zv;!;gY3cD-Oi&QM>smSu=NmIxe6XN_(*|gNjJmo0<E^$%1S4SO=vNS(lDNQWThL$s
z>FI}N=k$Offd(1LM?$^^Y<okTseF;lQ(esg(P{jax#~5>^Y=Em;Hp>i<Mi5}QkVTZ
zHM2E@q(f&k1Q9)N`WdiBvs;r>YG;kZ@m-G}dTNc2L`Oc?b$^vgs4#xh8^`&S4+|<Q
zEe#C0baj+<GheOdxrKrllu>Ng%fMA`kaa2=W*X6~&H4JnBwEIzyj4-pPeZpar&2bJ
zJKiL(+rP!hdmL>y7@<V%Noa2>4<)2K=fhm_k~rl7$}y|yw058>6^Hl8?z!6eIN3%j
zuSIxxq8870^?Fo~Dj%=88)S%%5AZp7`+K5qz~_^}<fW@z#|;T-GFlcE>2b&rjKkM*
zdYp|m*m?44CQ6W<y?0;(Lt4)Gg3L^ObewCpfn460R>FrVvSOWrsQmsov4PblL*H=y
ztKTSkcV$NziXGfJPI^g{(BUDEzZ?PqvmEV<#Inj@t!hhZr!Lod_{b<!Zuz|jY@+Z6
z5dvET0t)dJu*(1Oxp9W!M|?Os=21m>gC8jlO^()PEGN0}38Y{1I(htS$hWn3_sPF7
z9Wb=G#O&?HKAj^VyGgxlul&?hh)&H7-l&mYr=dVN)olsA3vJ-7RyAtIqeY%$Tqpw3
zTP}ACDhJ?Liq-PoUGDeGOuPJ`=k&M&eVIb0P3QB8a=*r=ye(w%skM<ANqNksKX1cf
zajxznrMuXlNUAnDkC*1|vWVNi%&q4AR>8SZG5ysD;b@JP4)!*kI{CCmN{!_H!HtQ+
zW%N)n$;9<y6Yqd(r@~eqjk-sdB~+Gy74!?8y16Dp@2hNv<{Lesjm2UWs>#aEL8e}!
zF4efBw2%-ctEE;^lTwioHFMEZG#nZVpd;&u&U`+zoITc71up6Oa8cM<dW%X93IR7O
zDu--PCitO|L8!<wX%bdTeIBa#d~*yoW!5Y2GWm1RBO)0xia;egTU7_wHSTz}$k6We
zo<lZ_8ejt^XnsV?chrrbf7&Boe>8}`0{ybF>Z{TPc8IVTf6*?Bhx;HH5h4YCT>LFA
z8vEgj6p^l-Qd+7=rzYrEWaPEuuW_WD({?HaKStyJ%+q^Sh)$}6u{n+VtLLlnEea+y
zZr4s_0o%ObwW+}Mw@!;G7KxlkHjB+(1=GXI>)F7vdVYt`9E=+rl3^HBtC)!-Bqa2!
zXF!6$(?>F%L5lIX#1zJ$)r|t@pix|b%UUi>cG9CGszUSTv9Z;p5Qlpj59XdND$Q(9
zEi_xaWAY=K-b@pUz)pr14MH!Q3)p^paN9f4Xf`-q^@5tZg-c-B=?sfU1+bUH+x;^W
zsI;o>Hx4ucw}%{Xra!;aa2^T&v?)tbSX$Ez6j?6@cZTJ!s>RQLu(Jogk;!OmR6K1`
ziGyB{*BKQ?WQERk1tLLO1r7`Z{|{!s?NfSTbpLI>`Bxq~l|lZBf0MH8OpOJ>kI#S<
znD<T;aQa`3tBb#WEZME(bv|ip#Oh<C)37&@&<LEaJ_eW#&r65`cL~^hC{}7|?i$k;
zu&qHqLOrU3wGmpKxW7KBD}KK?tdUZ*!E5&eZ3wK8ABx$NZ5vjG->7n~SESRT8q8~`
zC@)6A;$r1F++iY<_2%}x`-`hc$_*lfMcJ4-s(KHxMyKN8%x2*bVAq{7y>Ysc#bO;9
z+7v2&8f|jEk<{|g#1ix$v&9-=@2=+1)aRayFx$Mavt6u#)jUA4V|&VDfrNyNDJX!l
zt7_!D#HLRjP35UzmD(Ou8H^c=e66T4JYBw&$m{t)j!r`g&1%HgEzvEEIJ^WNO^Y$E
z;*m?5ls%L@$HKb%*6e&D1mK#<(f}j~etwBpAbpY#u`k*ApPnxe_|Wm4{OB*AL<W6T
zoUpihA3H(-;JwUm?|x(AsHckBhap>ro2q^x&^4rje(EBWQ!Ub!JER@00GG;0DHo&9
z4w9L|2-u$I%j`xVbPNOpDd^(V%`Dgb7BCq}6!wP&hfLfU5Y-h<D<XmFW?g=bD`0V$
zgV@n>)TFA|SZx)NAk@k<qrSr*7u2Nsp+c}(-n_lsy(<_^HJ^S8;`O={E>dcl$cLwL
z+=qI9mZelMwl^;#RA(M%x|`W<pwK*9Iu+RU^JiZ5Y}1tcNTnaYR;sWxWM?Z6hV%#Q
zNxjA~rCf0W=OTyg>#B$`bx!-kTv?p=fX_(+?nmX83Gr{h&cB=w_yM2jl|beDchxVR
z8i@!I8?0Mnl4*$`P`U8xl35&@p^`mr>m$khr-{;jfmT7pPYp;QDphhZBCmHru6YOP
zj{&)@6iI+UNReHiOsO4v&Esk6Q>@qoS{BYAB-+DASxin|ZTA+cd2ZmhZ-~WD6#KTl
zA?nubb<OK^IIUyNnAm{o;p<yHm`eyf`WI?3;aG9M$e~iR*_{{hB_V=vIhc&Xddz(g
z{HEzw&hnJ%7GiqT?9)TBukB;A6s_4{SzK9iza0nc%^(%vpoj6Hp_pcuBk{bUSVAD-
zO_Vl@R(f>k`sz_oANqEMzu>|DE2O}WNbUQL`UO)EL%hz*o;$=OPZ2`2Waa092fej9
zD5`2*=v;{Tlp5D1G!$XJfP@bnzF|?^D7OqRB@8`F*369VuaX+mUeaW-`B-Z+m)sbs
zkiPoePyX@y$QEhMSv)cXT_RtM{dRwOqLk?_RI%2HiT{W^u>Ih}1`eWw@#lj@B6%up
zQbz4VgDmPGntUD>e2<r#3U-IIC#Y>6u1hJD@qKVb_&($DDyHFKN!9bTutueol_`Uh
z4Ey9JBR?CWvbud9%$-oqc2#H!svV6fx{hnIp!#DU^C~d3$Kxk)nTkLoAb5*}CD$s}
zvgPR;8Hto>K1kANvCN>pqtk4SjxSTUl2ki={mmvGKv`>tvxe*c9NY9$fzS40cD{Yt
zfz*<J<PUNq2WZg9yTXYd%ey}`aHz~LvaQ@dxeK=l8vEm`zw<RhB4D>Bf^eAFPG3nG
z5Jk&#IJnYbc3QL~@nn+BhsD^|L8nlRG?vDpV}rSEe+-yhaKLan%>PJD0zHd7b9OtN
z){!_{x?(yw-LH5U24Bu{{a5(HvM6p?ReYmNV|P?zGPXMhKDrp~Q3UCG$Gd*nMLkT9
zDgf@Lmk;1;mdM|h+ED~cC*?AZor=#n?X%_w215I%VE`c8Y-zTx%Pmr^_<q~zB^NAy
z;0=)Vsm;pop!7dE5&F3s;4b6p6dD~9gJPxL5c=s*iE<H-*FE+7eW=pBJOF^?foQKj
z@RsBsz|bF12@_x~M)ZH;Q$PGa@afxstsam?hp1a9N(>>xa4%BA+dm13&GQKj%<wQR
z%yVGbOV~RFB7Ukf$`8KphOZa)(_g)w9xyC)ts>l@pRDt!c<p$5#!_S{+q+yB<Ylwg
z9G;pMyOSoS|Cl6#=Y@ww*_`BA7mLqsg+-^?;$Ah%&FlTX;L695WUauP(+P93Ag5S`
zaxz%uAeU3BGJ$h0MnV$wYliAM>tb(muk_35_=Mv_H-Tq&8%r#uw11g<13g2WTO
zbJZgXa&q+vHoD<-jwD$0{u09sMkiLQr7EfFx%(_upp{63G9)Rj<$B65XsSEg5r@m2
zJdR3BlQIM|V`6h}ywlJ?p)uKAPeTz=yG7LrYrG=BKv%EbGYjwFx%e7)+r+0ku#?$g
z_IVe$6EL{m;F}mZI4XF1uX|vM*|eX$3C0arc{E^QRruv0{v#g!6Rif4z7nuyhTD2c
zHuwU6f>MD$L8&=2G(v0HXO(11cZ7V{!wil+yIlp%-?{M<q{n+_A1@`$5fCB7juKze
zun!I3o)}5jOenWyde3wtNd>6w?rv_1c%-h>D%B8SxNJ#RCw$bh3eCwatW}>QtbG)I
zzH{oyc7%t!=SRtxo<kBxr;LqozuXl}Vlv4l?RXNc&~1xfJPpl*=xjZS8`@FoeUIs?
z8bzqiJdeo)9xvy)-<v9s>vm(Ynf1e(t)LQ4zyUMGhkxQBsI7wV==s773sC)0m!0x9
ztkvfH4|sgzd~gX<J7XDnl2S18RB9A*yh889Hv=(g`E^dm6c<lVRD<<Hhhk|ZR$5%L
zYt1GDX@g6OK>DkJ8TVn>tW(u-78Jx=ICcyN{ZT^XCeAh@8LdBvo@a|6V?dA?q$i8F
zbPEfM`!{&J_MxOquNh9}MrhFBai#+#W6AS3`>u0FBL>M^mj|Zr2Nmx-cOt1w5H#yW
zsS*C`EC70&cVm>30MagW$>@B;hmDPGZ)b;oEH-NRxJYuSdx7{cme#^g)F++YU?Y@!
z#VvUjKT_gE7&n&G5;<GGMtn=~_6>ff6o4LdNGt!59|9lnBzYx3|B@|$xKIB_+#mQW
z?yJ02%6a=?)WUm9Q7QZF`CenQ$>)gZhHTVX*4VB=O_raz8h-ff=4;Yu*Fi0o6aw@o
zK3(j1lsfxdcH}*AA-HQ09oh7x5Kb=F_+(;GMNhyP5;HdQ(twLQ%#qgDR99!iAH+v_
zn6m-o{>-$qLKiZI<=nwRN`^vdQQ{H^XSu77-zAOGt8($#wdzZ2O*<_Gwn{!KtNuE)
zEQ`CgdPySBN=m_jfr#9j$!(UdBc<{9>QfV6?QR0?9B=yV27X4rnTEHBk0e7;=_3Us
zFIJOOj&t;hMW^R|<|5THWR&}>nW~U?w5GD1e${u;st{j}E%v>P1|EN1?;h)<IF7Pp
z=&^H6eLfKy=$Y|P=kX8)$ZUat^o4efrjc%$I1mZ@$N0X&G!v1#9Dm|8&<8sIM7Us~
zJ@ZWi{@>+a72imGy*pHE^+W8K-5;Kb3=N-Daxm#MHI|~w(ophhT}V@6WqYxS6+b|O
za#(wn?J^o)z&@Pda-CGtFSa`N)PcEMxcJFpmIJgWaJkGXyHvb%?QTW~3na*%ugvqH
zK5cg(ra&={1hUgJGQWd09|-kvy-Y0UC;3*)4p-crJmm}6DMH%NATQAfHDQbT+*fs;
zP1Vfqv2IB7Gw-PhpuKN)8S1R&G<af_XUY8HK3#mNw_X!bDj1n9Ww~sx-ts;Tg8wug
zVm?z?%po?>Peh|uvGDckWWhlGf%>kbA^-u8C?jff#yD2s6@)SXXH{Pd03i6EfG<CO
zGLU#Ds3YILNE;9Yf20n`zfy-e;wM)v;A+HPVMI%FNBxzFY?|5ntF5gK5msj~Tu6?G
zMB*oiPK9Ne7w`QdAwZA!lh;TxnbD0Jtv^HT)8sA-APgk4Sm3?{?RAUeMbt2jZy_KP
z*_0pIuL=~^_Gq9w++`l$y?>EJ#d+h=A<n-6f?kOG<$f2T+d;$)rA(mF8;$NMf}efl
zV9bQWZ9}u|m}LCKiY)g_O6I^I`7j1BQm)NPvrJDgx+*nKIb^5HJm!6g10BU+jRC#J
zI)KC#07U);{ZRv##dTm(rPlG*yiN8cAEQIGG_p@Mvq%ke^5(5Jodxr?T;$WE!?@m5
zKE;l3l?dp$<z;m6)tRqEH5Pt+VQTb1E`UE5p!sLb$a4xXz*Bw$UI^4{MDh0!21Q;9
ztR{IC@5ttuyY>aw+Qi?Npn~zAhJ!+(<(M6!<%kb;5dGUcDA>%vP&+K21k_6uq_f{z
zT>iAWk}VqOT%Zy~`gnP1X4Vpq?>ZHa!)yrtlp}O~vgErzU0#0b@z9;%ZE;@!D0CbS
z#sxm$5#@OzLL&ddI9S6^=))RI@iHakaU~@N7X(6m<5ehRXslJ4B+$Aw&TmK3I)ojg
z%C*=kNYyYf0IBI5gZgunCmXq?rvKgLzI+H+hTJN-a1Nd(qq6ctt=*KWX00ov*VBVW
zU(a&gp5u@AtgNgTY6Z^9z#x{r^CX?8&n;shcvw&P{u*y~uXkV|$k|e-#IQp9NDL>%
zlpO%4;it7a0kn?KokSBNJNs!Ya83t{QNfG^#k>=gCagA328*pu0kR$wh!}@G?H4*U
z1kmNrhB*5(N|-d)BPk8jnF<agW~j8W8OE|1g@tetftks5Sd^A$Z%nw2CQUa8ZJai`
zCQ{f=<U5{(ioWb^Y%zWL+SQ{haC*K&XSyHyJP|42#WJ?s7qMPzcCI?&Aq(8fCZ8)V
zu)mmxvORoEQzL59gqR2yYEnJdalmFRqGq}!-Bz(-$k#}IbD|MLAqAGkVhUrFNo9_C
zTB;KxkEK!yZgx2l*45Q@KS3IGnb_E_b$%pm^U8kne@jAz?NkkrLkIE${^SroZzM%3
z77kSYa2)^&i%JA>a8|mr)KjGO53tZ^Xe<?%$iMsc5v4zofhUe!H@3CrOMdJX!o{%{
zv`(9S46Sav;K^D?gk1-NnR=x@FJ&YhosqEv0cob^(*uc4yL+7Va-&R!dhAAbv}^8~
z{aOO4%?b6^alB@rt^3g;Jg3L;n>GWaP#Kw^ptd51a5_FHC=W^igrL!>#)|C17fhMZ
zj&t<REt^(rDmeQ3>M7)qmigtKlF!6Z#ulVDRV#e;d9|Vs+BEEwP38&j_lHYrB4-8i
zP%L8}kJk;N<n;+(K1zY?)WMvMa09W6Oa?7YNWZq<*?Ip4wdB>k3&F){6deu#0~(=q
zsqEevNhRdI$DCC9vSre{{(7a|BjR|qt>PB)Z5gjV5WfNmfix`pM;iWzto>CNV7&(-
zzOXOYIuP%VWj3VzgR1?gfG6w{+Ow*xm;j^kKq*09jiowXY=7kJdg^hiu5%zJYk2>~
z$OvanCx`Fle~UXq)IxNA&&DF-dZmsC{goe}#{#z1^P<#%_5UgQ0=FoG^oMLkDqaYZ
zKI02?*fP$}c~O=LF&rvBpMb~#-7IJ1-3~m<evb1;ham;4;2L{LC^dV@I9}j7F|j|m
zxHce%rfR#OAH4Zy6Y|2jX1xvT{ui7J9SCS6U63Y!tb)fMtMEwmU#kERR&1-}#O$|2
zWCw@w;fIGx12X--e<*>4fG$}221E$FZ8S0Pw$aP1(tsrOPj9;s0DQOKKQVJ&tOJ+;
zaBf{TFSHkx@L=;xKQ0okq>Zl^d=s=2P0e9`X*gQw-2e`lhgy`54+{f(Xelv8E{YJc
zDQ`f6LQy?w3H9ma6;DSHUqrD5b81wGXcpjwVlJ-??Ed-X5xD>t=nKcwq=K1WoLAgq
zG=eY`7KTXUbqa2;e2$i~mpc-;h1*JqcQ~9^ps?AK{%x=pl@sGjKb#kWvA1&X5|4}g
z*oW~=eU<PGyijA5<G42k$J7Cwe`O2rbxqi=YT)?kw~6c*;YNkE8%Jml4B^iwx>%nW
zOAJNKlZ+As@X7`O5K=ds%t~gVbvH`G(=?w;{2W2xxbBphpAkRthfcs#Tm0hKfSc(9
z38k0e#orKspJWkQ0$KjS$6waiA3AWOw43;2&A8%(6*r>z_P!{QXm}J*k95FV@v)Vo
zB)gPOVl*l;n~I-gbiY27jMC$kGLkaxl}i=8a=z+93_!ri97$o*v}eD-$$;1jUi}zK
zWwV+kL^ha47BL<&7FgBA!qC<p!sig3jo+BPqhI{vDJkX&?ob*-kB+ry;H&m_p~sct
zmyztpV4$+B#=L$Evxwy?#=O^NZzoPUX6b&Q@cKo1TH^#v*KvvR_0pIB>}3a?&5M=(
zZ+4I%KdK1{X=kDcdU1i0oE#mcVq>APmAozDEw7vOL+}@@*LC==SEYN7C*I1jic{|5
z%ep}#KwV~BV6oOsXyd#8LXs?h`7TRa+!lompk?{>luC<N(s{vtV3{|z)%|&?8K!nO
zn<sYi!Ayn1(gAiZs~7VO$Tor}7WbyNQziB>#;YS#TpCs6KgIv_x@L&M*r)J!2)lWO
zu6N8|IbDv*DzgAjef1_N3D^KZZZ7m}FDCuZkGTGuwPt*En$zjUa5}yA@s@Fyt@|68
zGL5$A)$gqn_P$|AU-9Sd`}lDQ*sEYcX=$kgLsVg}*7uZ1D?@L-aNrLVnKWgq8S0FV
z%5Lpp_RNe$*gc|Vokp_-;H!V@-4e9@WtGzoh|_W{DM^Av@IFPkD*1xUdHPN{n;2ZR
zkq^ABEW100@!t*)b>81)BL8iB<L?2=1pD4GjxkVv`Qyd@!@uZ2S=3g;e6cofAeE>?
zcrsolWw$@dm$czF{u2Ro{jxO~q=4-aC!hS0rV}J|kV>s(6Hc(mn7v4aC|jNRT%Km#
z0W^yk0$%P&%9D!g01%x@`3>zm6Y<&q+DQYCLE(nh9KjlGb2>&T3cr>2E@nf}a;))k
zG(L<4i;R@ylwd4yHCxPfLjUdCMqa$c%!_M8s{d?;KmHm5EVViX^lFC>o!8S@(kGlx
z6hghBTYK9gw6e_;=s?ZWbTIcf>a7N5(UbvpoG|Biz%tlzs1Thp-e#g}2~>3a?B0ju
zWowna_WaRGFE7{Iocu5uI~aejTgcJbXgyykyH4`res97g`~y$r-LVfX#vA_HPbr}=
zpfbhW%paOO()-R*KXCSK-2w#kJjh(^9e*?K`bz%ImA>Tyy!BUZi%TNMKf_e@7tu{p
z!1g3vhawsVv^}sm_+7KsT&5=^E;2<U_SesglMczx>0RsC)IcGqNk$G9^b6?W_Jzfu
zCFBRZFSG_<?ZTYd;@$&_Qn|5G{;fdeyG-?DX(R|OO2JAN6bPt9a_Cho*MvpAMQhtS
zpuE@p_b)4c_7cj@v;raj7olwXr52@)NIf~0QSs_=b^Sy2=Qp3z+dXdui9ElLAFx%3
zB-lJ9FGF_bNhM?%k7!EVmy+NoP;Rov0A^TezRo^eu!p7!0KW8FePP7qJP)~EmX>h>
zpoDA7GQmOs(6-?F!Me<@a<kA;=fkv3=EqJ<U+?g8-7hD**5gode|K?-1Yq4HTu$g6
z{<iY}W<yu91A$Ej1LAz7P(F*1#d=wIF#)K%OqOa)<yEVa8h)2nZZoEl%-|);liZfX
z`}uRv$re$k)io*{het3fgUB)2XfQD;7?p~2!R4{R_f|yGh`}(eE7<(`G)Fzx!9;ed
zW@jw7np>&(3+9<5HVJ3UJs_SaglX16&SfUh?M@fP2=eMQUnrM2>kOuHP;qc@Os25e
z46KbMT%9aQc|XZ*>qy-uLW2yu#IQ~+zB}|sQL!0~MftWS*)n?Fy^jTntiFH$9)GPb
z!VK_}i}g(?C#DhmZ*Tky6}Kt3_Tu6Xl@=#zOuk+Gdh+6Q--;Y}Nnt(8b^Z>~*%RU=
zwiZWCa<RFwAzY!?L9kX3vA3GW<@j`nnI=B1Sm4eGh6X9MG%2OGx{+&LeX@LRrEoH5
z`|Rn{QQ!zrjApyd<aCAX5g<k7@6T97sU_D6-UBqm@;PJjC)9`CtpP*SD*|a-u;KP-
zOiF5+cA;ii^49Jz^7%Et);y+yoYCm{gYxI6Dee=4Hdh+uN_wN;SLnfH;W#;J6}}XC
zX*?|v=GD;MJ^eE?{=Aj<yO2vMX<YSFKgB+D=XceKM;R#BnLF8EUu5?8kD(&|lEWCw
z$YC;(rFghNb5%ZtMWa%j$nNPMS@AuzwAwpbLWDiNMj4Iv`I^z557Oay&ar%|=wBR6
z9`x2rAB?4yDq3EK;PVD(eXGd*)e(BTKK==_)BbcUl?!g~Oj5C`i8c<7-#(iqu8CYm
zq;^xh>)5Cc>hDXZT%iD2OTIJcOJ1U0*tu~RI^t))(Lg>2LZU7dcgo=3zHe=)1~vUV
z-Gu6f-&rZ07-v`Z>-+LrRikDF-IicotjCc=Q0Mn$eed|X@n=L2y@LFEo&8%bP%HbD
z+hmi-^3PGD8}7A2YFr|O;qU6x3g1`?!*qOh$h^!6L$b)2oEYYj*KhB}11dJe2l^SW
zD2|GzGSUW?xG1X&T4jeFkk*2Yr1mEB;Ibte!9yt-oX-2y3*g}-nFgD+*g*qQxpdEq
zoeZ6B!ZdCt&}_K|Mcj6hL`*?USy-9=VznCz4tK3w|By&4!HJOR?yuL=nF2(`ih0Sc
zO|d&sQEC;M0w$yT!BpE`zu(m)so&wE$XMjfpCa9F3jR7nqf%JG+h^!Bm7FMbctm{q
zW;~WCE0>h1p=a+TA+q9eMexDpXgAq&h0R*G;LR<Zq>d>JkXCgHwXS(%dxw<HluT9w
z+6&^S;**Gn(Uy`4p|8%Qg~EJp<IcdNRIF32>FiFavlSXLdh<T}-D9pxYh3i}R!B~9
z%Ha>l5?l=@nZR5&bk~ymCAOr~cgD91ZG^DEtf$i#6HYv?CGIlKx>OkVw}loBxYCIh
z1q+s)peD!1JC$`$m%T;bYU9h<ix%fgN*Z0}wakwxa7|jZ)-tmcr7ZWqL}~fc?>iQx
zm!B1;#CV_MsDN{lz+*XN=QUYz508&PUmV4u6R~FPDC7v=tWD;2IpT+N2M$MDA6O%h
zRXRTOtg!L)N904Pj4pUMZ!O~m8KBhi@kr|U^!m~B;%>^YNrI`P(3IznK}U9k)B2O`
zCO(b3y@XAh`Z_o+t+X^pcSi)f{O{p$;05Oon9x-r|8sZ@bO2y@3K=vQI};trB1l&!
zRmW^R^7EEH9@@;*eDBeGRoK<>3Q3b)*1=X0lRtUGvg<=PgJy?yoid%V_iY|#9F>|b
z^<+tdjcIqK08lE<m5Bkc7ZxSDnctW^!9FEhzeuaL_RZD+5ozHt>8-g@BOZoJanAAJ
z{l-!4ysd}j?J2J-7MSV#a)+o^SoQ8RABNub$&?n8V3~*c2P}HiK;6!wcHJ3}K5ae@
z`@ERg`{BO&&k82nK_TY%m&Zkzw;IP};4m1FR4lm!U__*qFkP3E6$;@w6)sk@$=LR1
zT?+T<WImg|Yc?r#o8q+}_8@&eKEA<70?LgV_i_V{2PJlyRQmX*{mGxZZt5N0@Hl+l
z%9h2Av!5sGEoKUHD)*@TzWYxmD)4sqtn3qGK-}N)W?f)1!6JcXycLsH<g|x7tVbvZ
zl>K2q2Lg!HzbhSk6+yqwE5K9bCOp!~?Q-do7i#qzuxnpG5HR13!f2lO2z{QTv?ZX&
zfFSyN3ly;)U<|Ugww}R%<Z}G@vq17@)k8d7KNb)Q2#cM!S#C@Z$K@f8bIaFzCWs~Q
zav!+5(t);Gd7xWqc8U?nyv$UjX8e84NI>V3`WOE&pK3V4AME$@<8FHon>~^9UBbyg
zR0^>Kt*TM<a`ED4#HF7xw;&b9d9Vb{2HFv~=IL#X$==|$)YitnBwtN`4Xx}1lI(|1
z^I}>J*2pXVCCzkRKtIH<pHL5V8gP_a&8hUxrw4P6$s+A-KG(D%<Ogz)u&CMlEEY_5
z<q7g*&kcrLD7q&h=(-_jZ=v7|UTPI01i?q~BiMU)bq8Ccgzt8!<iDCvm*%0csM0{I
zidnYXZF17+RLchv5B02zgrF6C=VL+7#sna`-)IIORhSvIp)}&*;g)ocXat7vmUgAr
z-kC`AKyQb~4g!#S6@sGk3MIFTC+W3?xhnBc#C>k57fO>%-Ogh7q7l>JhJny8D9|Y&
zJ#H?<;jo=eD(!c?w=RG|n_gffg~4ELMsYo7+79o1CxOh%=lu{knx<5K0)et2>Kz{2
zJCzUxXD)(gCu1U;fefAlP9eG!b-22`%tIjypFB4i^Mju32^I~ZzHMW-?0;3IwU?YC
zqVjZ5Q4Vw>h2wEa7L284>(@WEQk%Oxe&>rSp&mQ|3PWaRTXw;$t@s%o-0#k5(6{e5
zZXGTjZkZ?*T65{yvKW@=Xc6(|D?WJLT}aU9NenfDM~Sv>8(C)+K=wH0rAI|5WaJxE
zYQoUykx7po(C9cfG$F{A<VH@V;xsk8?cN{Fe;)KM+cSd+XFL`;6eSuiwhU6DAASn%
zCPr~cz-#n&F8Dr9;U#Gwhj9NbJMmAxNDq_CY{UN>>A@ceNnkjT8|u8-l!?^614!gV
zhb&}Ot9<$TVu)@e@9ygl{$yUKY<$?bQ0koU-9gAkAt*68G>h3%A*X{Uau(o#OenA5
zKx8<3LrE@=WO}<`AONXW=*ku(nJT8cU+l`Pt|~+k0i`xUIE>Ml;u%6+UAxU$Crx&n
zazX0BK5V|v)x_wRAE5OWG{mGHPeYsOXasDvf3I);=D6IQNkG7zmoiDTRZ44wcG=ps
z`(j~81pvc0YIrIT+to%x6BQlxk;!MKjYI(-avBJ1h_S~`3wzTN^_hu6RH;bo@YQj3
z)bvn|coR~a?59Rj=6bB9o3T(J&Se`<mzI`NX3KTTn0$2C{!ExyW3XlvC>Oe4x^x+~
z4YTLM(>Oy!lG#ptlFzpc4z#2#sWDK_MNvp)(Yk>PF?(tc*h<$mYGSnIhp^8b_$<JV
z1nzb7Np*27cBC7t!B@{uOR^qUho~W4mldNc<Sympb~J3JLEyfyjMBi}Hp@K&Qg_~h
zU9vnK$^99VuY%m|20e_Vp1ftJF=H8UAV8`%U44Ga_qaYGe@K2<jvb6MnMh13OeoM`
z%AfQN_<+jWN*@lK*rAk<dPw$h4jy}!!gDLz5E_JLDovY62n|lF8?H{N=A<Mt#m4?}
z?3;~>TE6UIXl0;y5>E=HQA8Nkmy1{X`fmtby!C~8w0ig^{XPEu&oqP|gaU9KPXYQh
z=BCpqvCHiVub$j+)&nL_`Zn)#%~DluuG$k}NLch}%c%mHe6a{TSR+7)z+&tcE7rOh
z<8F383RaGX3$D;>p}cf>>}AoU_X*$XV~QyljU;R+h72`FsvsaJ(B3UXr$4uw_A-M3
zZ3ch98;hN8oS;+AG9c-U6Z?F$Qj?OcvF7cIMz{uO{8Luw11eN;pQF-JSgj~jFp(k7
zs{pw^izqn`D<z3R1ktio>Ht;ska{>)c%{YpS**qRI5N2ivNMJ(qM$$yUQ8wqt0wfJ
zo!&8g%c}P5%%PVEGXk3{Sho#!*3N1*n<b7?L$kU<y(%`yVNBeJAt!v9+h|bu?9z)`
zRf(1q{didTr$Mv*HY1HDvmP~NInbLlb-JEIoB~u#WRlrMDbGVap8zsrwsE6CJy?DG
zaQnEy6kYd739Vaa&XLBGgNkwfgbxiyrOtTK8F7e76+mj-MKTdW5g(7ZSP{4x=_3$B
z|K5}o+4@4*Tdy%n{uIRi6K(&d{-TXk{!qeOW-ug+22iQ|(aw%o3~3nJSvZ0$v-7fW
z5hlhy?TtyfvZ@I;PvWjiVZ;|+k7MdG?J8l)A(702vGnX2sst&gj^`&RG+J$8a=B#o
z@VhH)@-03;pUl^f?o!@+Qzn^Dk5E$EuOB_80wVBot0@R|CvJg+pp-YL;+GxYIIFH_
zHzJmr&`uSBtCgc_RjiRyzcpE5Bey}Ql<wNCMr(i;Q&B-Dlf<Y?y{`>mh#He20f4JU
zFY>rwe0{n#0j91n2p0^JqcZ$|1|Ur4k6;fU56+OF!DE7joa>zhmqIY;#sM^)=RFPj
zOnayMgHVLe?M(cPA-2j7=%1QT{{c~_S!5oErQ9JPR8;IzVU2prp$JruaaY_>Lr`f*
zoi5hutvKbQvPF8#u^0>r^IvH=?p~N+45pA}sOLUCx>FE-9fIt9{q42o)1dgGqELJi
zrxj}m2X376$!ZazX^1x>L<ljp2RzJGp4@uYJ1C&>`sT0RhE8uoB{Pd1aoXb~!zswc
zzc-N*BfS8PsIV?(pji12SOcE`VE&(&1Wsekm<Blg>ne>B=ybAsq|l+=PD&RF#m0Ci
zRm*kTQe`uEN#g1lH+$tsp**0n_J41RF<UJX50vS&gew=yf6jW?Kf=ahu#8k@b6zI4
zceKrwL&_+$$-rfHoF_lCb-~ydi@3^4pwolCO=dZeUuoupz5O*;VU{ab%btiG7Ub&x
zUGG^f&)&&={FE%~!e4~tXrU&gb<y<2#tiIKr%yoXOuWfqJO4c<lSG$V)7q{=sEj;n
zN+>3ygrNDc!^JMrVxwKzvQ88mDKvQ0UV)m<L3S>Y-m@>f47I;Ii$MmMU1+*#mR}c)
zCA0B9GZx&QE>e_;`qsm-+~yMSl+GhW4LjGNp1ZtEZBWi_mvvFD!?k;NSz=!!tJ{9n
z7>sBsjz}F5Jwlcvhd6wYFZZ0H=U3}|B+2P^=BNI}1fNs#;(q*^*;SseNR~>e-4pWe
zb|+tPrW?j^fbWMKWeO2=I=vkhS3$ktl28D`c>Kt-<YOQvG)M$FzD<;#;Z%zhmNj1U
zFM{BpG_6G`Ss7PH)6{H2KxKj5<4XSb_(?4HV&XBcp5lM7FW><9vM=IJJN|rnkV_vE
zQbnTk(UV;8ei1skYzk)(E_P5kr~WT`$pqH2@ifiKl4H40;r;l*Fi+7?q{Zb9p9JHP
zWZ4m|+I&S4DY$x^rG|-BuNFVgv2-sA3soBepN(ld%?9JRNQ`HbaQsGt9?I#$i7~+`
zK=YV62%^E`MZ$$_RLm<@E;2{6x3fn|$h)S*fWV+sPh6}!A-|>7X%3{-<)(|9!Bm3i
zJTBrX^r+yC9qdtANqv*SV`yT;rPJ&vP%xVK(ya_0)+joTxFokZZsmNVfBEsHai(Sk
zFU{}D{CT`mp0m-14~M-{jS1Pt6Al!DP9tlzSR0dXR*dgDl8olKKP^$T(m$~|FvGEb
z*iYmwg-|R#n%Yz(m2e#GwBB{=c)4#>WC@HBEc;P>86#9VhXC|y`c6g(3Q2kl-^NBG
zVk&2mH-AfWH>|+IK3E+xslxnC`}{YOEdx+KtGosMvZP)#zdmjwUIorOi-kzv9#Z=f
zCFB#gzqO$>P&jz8JCV}bRs*N%<Tx2CP2MjOZ-5M00<f^W@9@}gz)2!(u!4e3jh6#4
zeSo$hoaKEsjrqk84UNZsG<Cu8{z|5bYaJ^C0O{b(y>*cl_pA8s)Qzq#UcaalB|Z0t
z-7NiLg|>Kgkux3&mE!j-Hmj1wN@DJDl<mfVtO#7N+1uj%_+7c&(@mhV^mwN??4b5E
z<5pT3JF9$Bi&X^i0pJW0?W(Jo7}gF1)g5a}?l-5rGo?Ce8+jzq=w$Nshu6v}BJs1x
ztmmdPOa-#}fDk0&vYxCA*=b+@JuxsuCV`d*{v*9Gb+o4bdtiA*$%y_a)6W%2y?+Nd
zfM>ez`S)a=mBvtHOOq2x*>W>-e--6i_Zl+acYi0r5-*LT681~<W{5ZSFz+#$BLQS1
z@5;Rh^iAz8oMTM;{Ltrg0uML9lOm}4T%3B_%cW@+6qrpJPw<6c9L&eWWSLykPPea|
za7qP-hGus4NWL`uwzs;OfiDJP84TZ5e~!?CeZGluK3VEp-Nly7P}d^<w}e}K9|9;Y
z@3vq_cu_DUcND#mbK5yubjlU<hn31_FccjR!5H(m7eKeGZ=>EQjen(Pe#64_S74MJ
z(`(JFGW0~H^?etS$*h|WI_mOwsI^=$*k7!J+U}2%sth~Dq=aSyDt7>l5mcV<r;C~{
zFmVA?&9|2aeB!5@UE{oM%?euyW5G|GN{F8lJWG|-qsDftf(w6eYn}mdZ0~qwX%fp}
zdr&Bi%Oz&eUclCw^!S(*#bqpmF94`glin6HfzvT~`xv*|3yNpVB|WIG_V5t-QOH8k
zLqsd=C-&Ecpv<Pg@WHJ6P5wTx1%TKxi3A>koHU3Q%ViaLNG6lx1!h!ejqWKmG46x(
z4Zxjm?<V?ABeEqBD;$ux<oY6T@-DGw#ht)kVnK`i$@Jc_#^*p#Ep3I;tM;&M1iNM{
z(6;Z?KR?=_uQWMGm6C2hyq$lzJYgb)keWvpAtmIFU43_tl_vF9vt^FAeLxOf-#F40
z9cvIA|6$q+MV?pjyrXaZfAf>r7e8^_q_;x6QH6Pr$C#+e91)(1Z~v?7*M6OMW`VbN
zHq6{d#72kBVB->wbMRCxW(~_hbcn**!iLS)9SV72ha~R(&fkVm1EaI51y4V+eopUI
zlyf?N{I`J@zvu-YwL*8|9=~KiakG@BU3>kG)#!dz91h1Ju#DsBIPZWS6_eSSBSr9G
znup7-PmKxrvbXsSlS;9+NF^jB)Kp=Vkl9AA*<qU$m%uKEEkE9X&#%n&m(iXqZo@m&
zjfv0$HdFH0$A?F=NnsrZO<*`|Gg_`Fn!4F0WOujS<LWs3+1WBiJrGj}q%Q_VhQ&oo
z8O?Z&kwX(=HKSIyTkkSfKDk=rHDg3u`q-ueg$!BK>b)EJ4fX7}Y*D4gQW}xleArdu
z(+K1bl-{uXIUC)B3!`#;^~0|jkKsPfMjMWF6S*juY(=8b@nU=6YsZduo;((FBlGD(
z8NLU3xne99`;WkjNEktbNKiR3fnu#e7~(LQrDW_cp!Qs36tBa1z+?>6+$R!4WO*Xq
zSX%4|J70|+W&ppvbk6_lSwncKU8c45N($g>AT~Nap>lAVJ`=RMue`%LMtLN)s8+Y-
zrh5al6IL}52%O>_EmfIfuCTZSg-oBLQx|JM5&ezU{`XNEVv;x6>~Kh+9Ose5A4<4M
z2@Ug=pJ{NooP`(dEl8J>*^RI?3Ig3jJph%1dD5g(xndNRN)_aNPjk0t%;j>Fxzh5a
z)MzxYA=Bo5iDvo0GXjIsTUn3@k2E-^!Mp@XU0jxk#cC-H#Ba1<s1G>$8^3B}`Fvhy
zwYscXFIIV#>{9CdxnYwT7;Mc*VZlLg`rBQmW_Hwu;)uhK`7$Xq!Ybg~ul$b_rfy!A
zK!>T<{`4`kr>kS_l9d+Q)YDrJx44Nf;)s?OhEm$<wE33@bK?Ls>&f20QWB_~A87m?
z<6ppi#u(AhZJ~P6c*X(DScS*aMJ!Cg#DO#)J&@IqKnF7x;xolFhza5VwJrdT0+KRv
z>NVL?w|58&9v>tkxjvfl1&a3Fxv4&fL=X{a^g%#P0&XRP&m~;7T%8huL_0@}bbmYx
z1t=4URo;hwq|!#2I%v6JB4dC9$%G+uv)dFJ;7L=Ix+<pN28ccnkI(h8IFS;fe_jse
zX`39>WU~!xcdpcm=QqD1o^91Tq2rw#P%5D2`o*^BvEBtaFfgH^&hz0T_`rhO+{K>X
z$jVA4Pcl9>-u@8`?|$D~O9w9z7Ab-F24Jwclq!@;z0#NiQ&Ta#eqNbCNnxsLlMLt{
zB!gijdtWT|>N=4YMLnAIrIi8P{&^PYa6oSKdaS<4Pr>RcVlpXmN^v%48Z-vl9_G0P
zPPbq-3%%R$E|6(;t3S1QJj>efP+p+?ijvZ-GnEa)X3J$ZYwhps{3gO*ML=7N;C3Aj
zXu|VEkGSLC!%}vqlbG(fCJWc2(psF4N)-&#_vU{aI__3pVS_b!wuhs9IcsgC&<1_v
z%11{Jm+qXq4m581A}$EY6CbN~q{PBMW%*0Ro3RAI|Ia8MIrJ;}sH8Ng>c;PL@sFv6
zfh5kV-NGbBhN#)Oi@PK2GfY--YRNh0BTmIELI1pJUc1k*k^(<P!?ULK{QX-yGrv8O
zGat51s}4)2bNX7ATKa9|NnsS3P8bM!{{@&P!m1g6+m2Oie187=N-}ORF33F9?@j`x
zFDm0%X+Ukby8u5i0#nU%Ys0dAHV8#DL`qQ`82kz<RxP7l5REv?N)VvSt=7gL3X35N
zGm)d7M#HmXaM&qdq2LN>rY5cXn%Z%_w;d-MQ!{UT*eIcBi%Pq=TJ4sjZgfhCv4qR(
z7|Ck2iht|jmY>xr^j&H@=?}@`I<Gp>PHJ29E!2mYY}7R)q@rh4kzBAs9-etE+P&#o
zISLxJvN(Bh(+3kljo;iM6Qw=QU~RzRhu}auI*Jqh3JMz<ymGwP6V&?^+FMkkdNhLV
zw!gV)w3@|B(aQ&K`*abxExS$arO-(D5e!b)A~4a~<~;cUN#tfT7iimDGUfZP?xhR%
z3-U5o#UWFaYe$7_>zr`gK(#j{Qr=>GY}UkK9Jb?#>oqh3KNxS%cXEQ!hL{LUppRB-
z5<sBroPeRn$T>Ovn^S_xu>rUQ+KEM$g9|RQ94w#@><p7vT5|$8=y!K8&O(u+%A|d!
zCIf&a`|}F75YToN<=Rb>z`ZHxA&sQ;-*UYpFn?Z`t@`#h68E_Sp1oOaAcG$n3ZvcR
zDth<5#yv@^;V6^$5vq7Z(d~GRsR-ze1w={ET5DEtT+Z5-lCrliB+#sc0^xGB9MtUm
zBz2zqF_^k^;g#sOuPpbh_pVoo&F*}&Bve#XF@>q@ZppwX7zMPyjG274tDR<>K@dgx
zJ1=0YS~~4%-+Vkkt+~d=mrk2L0CsE4W;%iElr6f&`9x%ARF8fDPxfDt{lER7Zw4@$
zguHwiEy={~H*&a6EK2#qu{<8K#X1eN_lhlylAF&@Y$3qB4M`mu)1T@<j)=j-V>fW5
z6**z}S$nh7i44$_kDfAdX`yD;$>)$)%}s>SF?gi;W`knNSQ05%WbH3fYM@{jCM8fA
zQbQGn#Us1#v(9(EyI)5ItjR{OT#R1w#P#+doR>pyPLenyIlHE-k<AG|4%ef|LTe3G
zuNoX^2FZ`31am5%T)5LyhbM7-@#l)pM8ZSsX>dogW5F_q!_@Xrg4xWV(FMbUZ&yZ0
zP)pS{R1dS&KC%15R+KukYn&LE#|uncrdua?wsX=Zo5U(bsn_cGEuL0`9FX{3t4<0<
z4rYUEvd|&a%C*CQBqIE6EPX=I8C|c{wS4#IHwK(ezZ&hE;TX<+M}UfvTg+N2rg(dK
zDBcv<7Fn8$QWVy;;wO%Ubl|13x#*e&%cXPYYcLfc@qI9$RLuQY_qo$T5g1uZylKMb
za?V8{+kP;l0|s4d*o+4DX=HuhT^#i^ijKj7^kHODjRZkndrFPJp?@$SL8c&+%>Oyt
z(!1b}EF?zKPSx3-ncea-nuAVG`t?DbcwVmBA?+i$G~Jg$pb{9sfyc&rJm))IfJ689
zPHx7I4FiHJJFL7SGK9~NiO-K8PqB9g3C`1E9>BrbjzD8%9p*L!VPq;~=h_)hB7Yx+
zK!86!yTETlTL6DMzziGNq^p)`OVnt@<kRdj-oJ}$cZ}rOr#Ae45xjqTYD=kp!R3FX
zMGJ6Vpmb{Z{e7*^m``%oOiF{bqOWN4qu0>R(EMTuDy{Hyr5HxOy%P(#SZQo+{?q@*
z*jonW-8ad?2_Xb`ch>+RxCeK4cXxLP?(XjH?(XjH?iyUrKlk(OIlKGrR=uC7R4P;j
zuK7(*cTW$8KDvdD7W9t<Q^iW2S|dri1H-xvWFXW5k5=m$ZdrL1{aot2%648Alg>44
zB@9?}|F3A`Uw`al2U<%!u!H+R(1W|QvJ%st4rKaTdvA@Pj2<B(X`F~Lnk{6vIC#m+
z+eI7v`i-|-OJ=w~l);CnU|U!Pr^DcWgx|h142eQnOJ>O^bNc|OJTO>4f9dS{<8r#j
zHj09}eY|S`w(ph*TIRldfQRDDVDe~SnD~Q6YchH9akSPv8xwA{;}gjyYqpmt3=Dk;
zoSv^q0@ve$$u;^iL0bI~MPIwuHoUr|MKfvAk9gIOhI2PNbV2kg8B8d`6BCI+;?tA`
zX#hDUHR2JQr{j!n+Uasb=M6O0>HbXqq;*D?JAi-XhOX~*N+*|?=O@}SE=yIU<9V3p
zq&#kVVxtSvO@gI*ry!HKdj^%0rERQ04(dxBln*Con;&^^&Qko#<I~G*?ze|zmS>1&
zH)q*=Q3d2f$JfVcWOQ_VN1^$Wg*-sU72bcyzC1olp6$CV<Z$^@Yuq<`JYT9^tf>Wj
zxWn;ysysy9c+S#hX!04#Be(I6-+kSX-wD!Y=(4?9>P+(4GL~Bm=y6z@lyr8#{`2Xs
zP^|}hQ||0wm|(xpYqv9+1b2(3lEO`S=}bm`J*k)8{A;`$H|KZ?3kq>fOCsz7e0PLI
zV`w2zp&^AI0{^CH7y)I)xTJLJf#o)c=VOl?JRy|hj{040kIeP$gc^s_H4dQ4awn;~
z&jvudzd{`pDpKcm>i2miK%=8m!%J2Ln?aBD>t$qQ@WP<!+37gyirm!tfOm@!@mlky
zd6=1*9S`GhAToa}qi<43Wvt!0tuoD2Nxi+Athe0l4RyRmaSA!I*<Zm62nvec4H19$
z&Lan(=whIHeK>l!+?*Xvq`d<X4|0>f)R)$=0iIMfY&tN2%?%O*dBxfnL!-???9at@
z7<f70?Fx=9n5sc3g@$#wJ`>sTY8pZU?Y70_2mGRt&QEwdE|ADFJ~8np3&j$<%Z)Ej
zSl+rVK=Mkx>1>8(yC+GCH6w49;C#vVm>zivoBHSiSqFZ7P=#W})C^7~!MrH!4#O12
zw|GJ5(6>}7;Af$-90<YQV4-W(M48)Dbf{PKs<sMie^Ynk3(xmn^uN%~V({?&D#0Q@
z41*m`PUWa~<_^hLnyVbQxuO0d7vmW>i(5IQ66NBW4cBU)P|`xFba7hE6R*qB<z;`t
zNL*Sbgo=NQdlcqv(&541PUo$Ps;pM(qG9p4vZ{jpn~*{OaCrzuC<IA054j#`Yi!%9
zU;XVa#9#=ExgDC#w#heW-+wVF%4nS}B7zo5o=dK)*sD=bm$h|bHCD*Iw|ym!Rfj*z
zSn>5Vn^i<0P_mUbXi|2*4?Dg+y5>^|f7d--uqbxEzC?!o0(P4XCoVoA2a7t~V%C@u
z;_BcHrH;qt{>$ah9#YAkkM=u;#4c&4^s($nAzjG}{OHGft9Jx8D><q^Rirzo<&J)E
zeNGGtlhuZBAgoCyUvs6bG#0myHkaoL!|@X95jAItCKs8*`&Rc`oxy0QX|1&41oyp<
zwwf9iCcS42a+;4<0|9Bq=E#A~<CRV~z;6kY-Y){%?bVmW0h}x>ZZW>KLeOet6Na|Y
zg%tF+dNRI1z@MPi5|R#**iV2~1?iv86^cR$U70}o@EQ3y7!&(Gt2CBtIF5Pt;7{oT
z_z8CFEZlC<#E~N)q@yxX04NfG&q6TaIS__Xq_#-Y10hjlyjE{Ip9gF$LfLI`M|uc`
z>2@YkWWq*&YJ?A%<HM(b^cf7tqJ9<MJ{+Aw6Gz;^o%6*waK;DJNRD3v@Bn78k?Kki
zSiQZv)!tNX)Y)Wvpf~xAr9>-i<rf5l4~{CruK{e9Yr%g<+}nIU^lJN7O%D4CBS$<7
z!C<PKIS`IPBGCS$J-_0x{pF$9vOUwDN<X0@on2;e!fW_D-6){yS#8!t+a8YOH`;C6
zSY&d?YK$BiBbpup3?rpNLC!`It*O`FHK6~20O&#l?Qr0!VjC$-ql;vDIgkM7bVL0m
z<)M<d$nJDBk*;Qomiq+q6;j4GfV&pFHiNCB?c>kk#B_jznYe4DF)<Qo>rb7kq=fG(
zMHu->P;!AVcoZ!Vi`!>nw^kd10`Lm*RlLC3x%%8np^}q>6F|HpJik4_hCG0}-5>G(
zwZ<T;alzih&eb?zQATxUwU}+ctvQ$}O`oqaivSWP5X^w3rlum7+Hk)73UzwhPsC!i
zUK1>t!6CUzCK;V0WL8dv7wWg#BqB$UQpvGGa~bEA^s!?AKc2~+stMLUg)tcA9h&eB
z7PBO1irr|!T*pI~-7_PV(Msfoys<4ph^WK$4zgUO-bWyET<m<+2{~oxYqu_*W`;?T
z%cx=;iJ9U!_~@(0IH3N_&YLOqk%pKB++q}~O==<%x$F<ikr|(-!~>>ZO^PB$KKQj-
zDgn=@vgN}%liGaxX2WqvHiwhE0z9L|$3(4S{@_c7#mQVvt9K`y^(GgMT25xlL#q~i
z=f#Q-W9FB__@7na{Ti;f$RJ5qcEqF^+~W&15$zFI|N7V~+2w)`diEXR#<b!mb;4@4
zI!ZjAjraDZ&(wgQTNY~!FQ{Vp`Db3%pE6DLhoa?f6KhW-;U`H^E0oB~m+{Ly!#{fq
z402}{5nhf=zs((yQOcF%X|vfpBU>!jDQKo=xd6LvSC#7ZAr<N(m_Uv0K61UdC^Nin
zuD+9YxgsEo$C61zfS^TwSS{zUzO>VwI7z?j2UP3DX>EiK7Hg9uffEbxT=`wgNV#o|
zo^oqPbt?=!a2i|xEUF_1AO>{^S~{>VK#U5qpr~m7XN4sF7+4$N2jQ_E``RrUL!Qj1
zJ<a_GK>9yZB)I6i&%AvDk8YD|d$6kgmE$5*8B4H`rz6lg6BH{#T=nEiXS033$&{i>
z)R&CajAwR6kxFG|FOwQYVBg|}!j{Evw0Vr?Sl{Nz8Rg&_?04meeY`!0w?h|<zos6H
zNu+JUE~?_0{}(*}9}LcLWLF~%ctj=6-Hm83;h<}5VIrEpe}Ig(_NVn$w?x9^A|_T+
zDLC2@tt@<2Hr5$2(ku?AiL2Ne-O<6`b>A9;NrJ08j~l;>wGNUXZM~j_l&^t9ajZ}V
z6EP~rp8Gc_u2{OBej~_nK0gh|_*rcabU#a!9bdG!?hX3wKZBMQjKxD`HE*rZhoiL{
zMGkQF@~f+teV1DJj%e$6k85}!u5v_=l&)oz!_GHdxNkA<GQmg&6}Gjt#Xq@}-0t;}
zA+qBz@q<V&iC#!v+TZEB=&eV?d)5~I9ei-ZST2syWOVFIp_J4;EbJL}XVzdOZhumK
zx4+=28%&FeN;Q4|JtJ8vn$+b6U4^-n^N-l0KDL*Y%vdwb?*EH0dU6ZXg6s&oJ8mgB
z7&eTKGH9gQB2A7zOCY!yPG+R90AS`(w%3UC29MR2!QY?6eNF;k$`cOImEIanmwg~>
zCik6v@L4K~1}ZZ1$Q8rZL-ZD(TQ5bWV>7X!(uw2nn>1cFfkd35%wY(Wd=^LK&hiD3
zbKKg-#zF+H-aHB5VNbx07P<ec+25;$eFdaMYmmP?7aHshM_qt7I~deQ8^E+=gr1`6
zRh{9S72k~_&O$z4t~HBEsJ#kaZgk2m;oxAK?B57{&k^$U*Z8j9Y2yoApXuCkT8V?W
z<x6MFX|-Q({P+Ze%f?HIHQMI-CR!QFHBA=@`RegR+1L5GL^75vEcf}&Q#$qds2XYR
zB2w~yrC9Mh{=Ih*T3N4${g;y$Mg|oJ(oRxK|E~5tv-J06z{~i=>e*{g{KfANwe|J+
z3!U})gsn$~3_wSZ{~D??UW&vp{58m(5HKbY;J%Vl6mYXU5L;cA^~@1~OJcJZp?;9m
zgLhv`RNKaj$^#%yXQ>Y#92VSNaP|%~HN=VuT`KjLZ0lg#5}L@%?F9uj7%(dJGiQ3^
zv*1SjI&Xm?_gJ~T{vmq{&+cStu!;Q;$%Jo22ZBMbuN{f86`3+3_G&{iF)@KWf_sVZ
zN*Oef#wr9bgaubuQecCfqx@Dnc)6X`Nvv|DqUmh)ITGNZ<WE=Edj98)iqu7}ccyV9
zc82$XkuYDYg$l9RZDL5Jk_QOEj^1^2%q;jAO%)5-&a_&fkB7rKBm5>G?oOHQFE=>v
zm#Rwb56)CtTs1z3!jO@)zdA8Ziko-b+_L_Rsi5P@;ApP0d4H}YLZMI(nkkSFy1#ea
zJ3N$1TxvX!O5+d_io|9<#=2D9y|$?vKpvDjPe=(qJDJ(?eiMkb-`{CFpk5U=a5*>#
zPrap>ao+Q9aWIvuFNp`8wn<?yIhrj5zdyf3yS+V@W3xX3w^(lA+pzH2qt6qQ!g*|*
zv^~_H2KxzV*EEi+;dF3|f$DKrW#3?_)%l$hR*Y-<-`xB@X|9WBgqPWRNR82?AO?LN
zk&=?qcG=TQZ4v5O8?|Q3U)hj;C9)Vco=PE0mC>x`g#d|N&t!OdnukRXjYd5Wh~lUc
za!aRc%Ipn<E<hb0M*}?^O;vK<<>8d_a_rDL3D(b=7aZ->eYz}GnbjgkTBUcoe@4W_
z6m7IzFR(kLo$7e|Hay9FQ2B=>1SL0tI`yZf%Fz0Hx@<vRZWR2zaql7R(GRzEw!x<A
z!tcit0T-<8;n4C$0^Na;*!i&OY^N4FMrJ~26WEJk$gj`iSd<D4J{t{Chm-k``=iHm
zw3;<x0}^4WLj6afuI9$j@0cFfuM{=4wQ^(Q-1t$HN~OhB!C&RPH0KN-1c4Hl0efG$
zObFSi$)xc1o;*I9-mP;UmTj->bk}05GZWhHpzXcb4GU|e=5%@WqtR&N7mCb`%fSx)
z(~a^!K^T0Ozw0M17gUO0fgBn?aCGO+jW~sWCG8P{rt(h4p7_Q7M;1Vn)KV)xq}#(x
zlODG7(h6%#sGGd~4a*UYjDt=I&@5L%JUqMK&X?uT0rKNn{C-&|OL?w&Wob#;KLn)+
zABrV*WIep2YI62V@~_E<VA^yJ7tzNw@xtf;0w7A_*2CX+?|6H7pfUGwGGn$kFw%dr
zt=4dSjLXWLrhWzyH1VSYo3*tGoXcowme|+#?pxNjq@|^$e6{V@n~5EX3d@SK_cua!
zu;;67J~polpA8o~!DW>nxK>tH_n<!C<7hNgx9zqL&;F=vl6i^`T1RoYKa!6tU{e`Q
zV4vA33YDnV|GX~x!_jUqJ@BM_Q|ENa6{6qr$zddpg2+tGf98k8@6cMJ7xzc%)Ji-6
zg7{WwFiHe=4OVKFm%xv2gqJ^Y&T2hAapj*fS4;y+Z}ODur{?O(43`$`W5jZeT1ifr
z*ij&yGUunkXw{?`r}CbOn(H-3kh@CVI}{pi&E(75?LE;25t{qua;?&povm#SWjvLP
z<^5B2X(*D%Bf8}0&!6qDd%gl*At2mm59QVF0&~9fC#R60_hu;&+e7D8)BR+3`1P&3
zsXCX$39!Vq*dG@ePZRn~uD3oY$34FEO?rBRJdta4yzZrsr<RqM4`q5xyk2b+u{qsy
zgpyW5PY?q!VAd88T3Sq~#cC{}W$)Chn}Kk+;4SESZ$V?ujjBdkTu!(wC!bFf3)@`&
zNDCBvz0!Wb-ptL)Qo7wcMp~&gi<H#2e)sqG`3e<-Gz*DLrJ3e2k->B1D}>1H{#XP!
z2L>HL0VNVGv?o3@aEBzMwz{n&V-tR0B=UkT0xcQPQ@tiqPvt4)OUTm|-uu8RRN!Y>
z8wzQ)PTtS9G7lAt)stsx$l&vA9SS11w{O`VVc7W+kN1jaQy$Wn$h5o|9WSr?UJmrG
z<ikw9P|A}}PBddd4WJ03EkA8^T6IbnUV7bh`1tr7oh{q>m;nP<5*H=j{#d#i%i)gM
zR{m(>lFQ-;W?E+ba12T4)F4Ge#A2lulxsfFuky;4+lC`dGBUW`c+3{dXI(VH&X;2=
z=^7rA+;MDa0G7nvpn#~RG4z?$;qF9XyI!qqw&kWUQeO8ZF5uYh(M%ZKE!=a&Q}FuF
z;DfCD`1q)%-s96q8VM4xaV&lkayq+rJe@lzu4OCs6QlJT$zUZ$$3o5iNK9cN87te8
z9C>KpM~q3fWCn`>b5h2LbV%sSvh+t0y*RM?+Uu^Xp;l)sa^Is$xbT*=3apGACO7>l
zYaZXS0`tCHqWvsaD4u68{t0sx&@?T9$T))HRG{hqv?*?sKfq}2DwplQVel9s-szM!
z&G!-LkmHCbmi7i=aGm=BSePmcmgLq4k?u$BLlrHOen>x!My^CA-UX9~B2$qBr8Re1
zOneyryk36*8@$&eoX*7j7+H8yHA5dRuxg_{gUjUjn&Vl$KcW8H{eF&aJCdikIyqU@
z;Y5U2#X;_!yfkCIRThf0$li8t<6E_au`)TeR!2xd6*uoLyTNEm{6IL4K>rf$8-;A%
z6#HxWYU6QZgV)q`?#r^?u(|!~7y{^Gk!rl_!$r1TfCHNW*n8+}->}^AQ1!0ryr9K|
z<iuR17H!D`A5QK|*W}QIMr*NECr?U`w%lZbt1NSc=9GSe#S84ox>eSS2Dw>1tLF|w
zy~QR^(c#X4$ahuql1i^3Q-_{Kde0qV(lX6#h4RILPT{FiBj#f`=k^Fe%DIO$1gF@N
z=12Rd8G*CNCp8AcHRoIl*M}oPoDbv5T_bbL)5VHBLVw8PIxKciLTVL5T&Z-)4$Sw}
z1{Ja$y2_K8a^~}8w7Y`eimT_T%s;n1Z<$w`;XZbFy9rl1#f;zDoJalEH{;(mk2=JQ
zWf|NS81BFE&0&eD>IHbc3V#WN&b457q%2`~IQpf*<}`;uKAQfR%G}BH68=U|;@&HK
z;rpKrzyFuZ{5A7;r*LMIuk5dPC>Tka(sf)jtcI1!gAt%qnMB)RcKDFf()zow%UFH1
zFSKg*oNn!Q1v#klN|h?7L*h&Oa&}akta(fq$|zK-C!OnM`woRwC%A}qyj^Zd(C$@6
zwbDO`ok*wVMPL6Et9{3p>)>$7GX)a$hN63ui|F#V?7}<*N4VwYL>Cqo=F-NSwYx!7
z=Y7IMu^TOyC-{8|iScMaX$C<n7|j;5;u>Ujh2v|WKg@xnW?y}N$TKME`yAt)oNyV)
zl_hEc^n!d4ol95h{rSqzYa7MpR6?)7ui>f#K7t;)nI6Yt?ywyAi5-&-Uy?tuD^Q{x
z*G?os`nc$i183KHXu!BmH(NhGo$K`&l@o6cZgUX@K@|fPRq+s(uA|!lr0tkGkSslR
z)SEA>Un0pi&l;ebmkUSt$l?KEeYWCli&>tW-G`*JpRhS?!&DnBv*9PjaH_<e`B}!(
z={Jj{tGQ19xGgkh>mPCaakMp5?YL>yYIO`>DAS+?<(zdY$eFlucMSNFXX4`QEZy1B
zo?nwa77+d+N~lD`a(-(>cB9MFa!XS2qTK4}%d1^H>9p1~?K<hRWO&|k*C#NnThk~t
z?1S(=aY68=^}JQ7V76E`PxZq|Vt)i=9|pc<kN2G}cTh&mkp>Edk{p&u{b^ab#<{qs
zfM)3B`Re+ML@HD4O5IcVOf4<ik(h0PY3AngDPM-VOr~$8q1o2ULhLc>T;*u)V3?fy
zGy%;7Zl;*}x}JsCNBGS_gljsSVa@@BxLy|R@MQPIdh0Pf)IwprY_)a-4qF`=trT3j
zY4^a_eKF<V^fWg(j4Od>=5ag&b(l9~RJ5_jcwy_lx_Igg>)Cp4zLk*#XB3lvmL{Xn
zXf=bzkr$hqGEs1HwEwkXZ_r`aVvkWInf`ph93~L@+vs!MX(x5{(PxQpgro_-uGhq=
zCeZ?LpJwe+?dq7hJQ*U=3!I7vH0^i3EaB^!o;lGfD~@n<t|VKpw`|i1cWwdxsVN<<
z+slJ;u+(EDnfH}46#pu#m~zeLxvV0Y4b~5mokhd)<AO6R${W{=Mdl3EPe~*F@e>(b
z1(ueIDwzN$Px0>5t2z?Jm9Fxpq2uKTe2aX;Tf<tmpVP@ugNLu2a&l!Q^ItdZ)UdG1
zDSs*eIq56<B^qMvF~x?1T7a%>kqyl2n6}f!RB9~@FJJW%Hn=tIG2I!j-14kC3D|PP
zfoG~ki`s_vfldkj^|!~D+IzUWy9}GVCS8}oiS)TzC$H+Fhm)f%;Z&xIZ1ar`SC6q`
z=}o(Xx^OBjPp||U&8%gO@D*;z&4l@qIkJWGwft}AoYucegO?k^PZi||!kLZ1s)YD3
zTs78jE>%YonKO0UtnbSweFT7Eug@m|pT$RjX;Q0*#pe0}FznvGx52+`DRpGN;vye1
zg|3g*i?=0iRvGugU@{SWbRBUw?0XQw{XbL3|Dy{2%c`*O&Of<_Xu0MSqFOM(>QeZO
z@fR@&-)8hBU`@e%iLsf~?rV3NZ<_>u=yz6&6$TuR_)_^CwtCa!rFv-fJmB7oK|1BT
z{ibGnYbtS940A*=eiGCdx4R3GS9&YC7!J0ZPxo_cbK>fTqB}c1I(!~^MX_`!pnrlo
z+MjRd5F)Q9Gv|6X7SHVRZS?BDd`TvJm8+xz635M#Yo_tM>ShrLO~;kAK5TW?0ox9R
zlcYfx-W`WaGPj64Zn@m;HgEq&trN<X0=ATM2q@J>g;z-I)<RA<qx4$(mLl<I5YWUe
zn(p=WbrKf;9m#CzI{565WU&iilDU~dWLwp0USD2bZoj<0Xm5MDU%gmw<tvFBHi(rF
zGV{~U{X+*S?pbR%DUh?xsllkxIgyc$&v`LpCf4G1S;5c1e1k$)D+uoS=c2q%Bg<(m
zAtoW}7@Qz!qS`5QgYD;!bv(Kp0VM}1Vt1=cf)UQ#5@bk11o<DOHG~97;KLp-_ch5c
zRd$nrlymu;5*LLZkv6&=2oM2{r)oKUZP?-UBU0pF?NdhXT6n6{V@A}f*0Ml^=zf92
z_Cq8IIi5%y;22sJGCdh<J{)r!TlUkI{d%!f-ELW7a-C}{Ee!AM1`{mL`y)89-f~{{
z;fx6rZakRP?huGD&xsTUcf9pP-L=`^0!@N9$J0C;2k-K$&dn0MGnEwRLFN6yDXdm!
z`YrVBP~|KYS*dif0xA@B%y*|hMESNpzs6MpE-T*Ea5#+L1({?=O#9=u+f*t>B-+qo
z?3u`&-+ya}5Hxn>CM5rT3y~^e8J>FOawqXfRDsAV`q!K5oi-3wz~mvUhHb5!&&X?y
zy%u5g(jXCq+E{7LfWS0w=8RtQV5)b2zKo+JTtA&+LF4s!^?41lRO!bGTVq{1ODMcJ
z6{HD@I@6kN@5Wq_i5N?u+ISL)>;^z@3Hen-GBw<1%r1N&8OU~R)a!-nC^4EY`eHRf
zu9D-dbPihY>rzKPqoNU`_y4SwKo87BnZM0MsoU~?rV~S(Nbfsmn)6!X>OU_LO`QG6
z7NiRU@7CY!&?{VrQVJ4&l{0ZtX7OTrz2b9()UyKuWjGiF4O}F{J`r_+{{Z>_e7Uk9
z?DE^P`qOfwLI)D|3z-)`tn2hBXnwpJ*-)FeDmO^g5)Jzi!3X3cCXM$G9yRli;&_oR
z`8R4L@BLY{;dVn}@nt10#A150gefPpJXAL4E9quYwwRhCqe9q_@FDrr1xwJCmN!6z
zih}UB7v^M?JY$K0gHV2YgiZ{y5+xeDy;z5mC6+2k8nQZFIJbU#u8d+4(RHu9`4UH~
zBq;R5ArAg*xj0soBu?12)#<|f6EPK%NJN88WdM6o%*+*ryHKs;xT=A<!|A*~p+B!v
zhWpz=c-{Cb&YI;rMu*i%GX1wWYBj}t-ex;yM5qV6sFhgLi;wq2i4mnzO$CA?PWMOf
ziEn;X$uYgfa)l_e`iT=6ls!k`!0HFk&3ga@ldloEPNndBM}Svgyy#pInFL88d{~gU
zj;UNtMo|P1<NZCz5B}h8o*PcYAvlq|%gn>EuCOWXW$`!M-{58uI^nT6g9G9c2p+em
zA8;E;#B}C(rXV`CYsqGJJCa+I!eAt5PqEqOU=bJyw`clC;gPXHFZM@wu}8_3zO?^I
zWiY9cO`vBqlMe*0GY<)vyyI}#EB7SD<p7f}$VL2`gP$4j9FX7}f{*?VMcca0C1WXo
zmhNsRB<^jdB9qm;|C36L7O!__s<1tXCq`jF*mtqif#l@g9$-h8!hlvPU!0fn!hgS3
zZ`L>?I1!YjLIgT$arC%%OyBfduhZ^@M*o+t?H%U4{M&dEE7rwkXC(tgP^-rvFPG4;
zY<`>_@pKh1J5qAR5!f<~%bc&h+#SFuH`srTGL}nYss1~+OP8~4SQRz3+s;#hgHO?7
zN`D;yp-37G!;oVPaKhv6dT-y}kq0KIz{N^Fr>TqO+HZ(Gy-s9gck>o%PF+^cwA1tj
z(%HPyWx_fN%=|kYZVweB1tixa@rbPG^CnvD?!l0&!SIuzSNG#;%_~>NsG*J@K!h*D
zT9XZu>`qc>Heqv7n53OwM!zbFbu|2UN9UIb3;E8Du#jCm0#dHoiR=_65~B%DqYb?Y
zV$j(?##u^U@hR-lYXH6k0Z1Ni{vzSakXG+RYB^Qc`_Tt?CU?ogtV2dFX1o2N?5<{$
z+7x!4*I2iq-ssqRw<yPAydPI+K^U9`YoI}UURzx{&VZ#y|JRLebB%$#=oLewU<7)(
zY*^s{aKRcP0K@IlsG9oFLg+U{cY|JkM%bshVhyB$u-p0|(6?=ET8IVU#d8qVlHKDL
z90RL1Ja@gqJo^Ip5qxX%y?)x&E=y|doy?gTpI8azFj#2w3Cv?UY@xo(=*Epb&&D7T
z`NE6mEg}uVoea4O?$+u5N&SgqIFVv8Ov3A6GMne^(b~Am2}kW<8V=uPIRA4flesb<
zo@pM3+Xhm#!Nh2KG2vxO_fr{ztWUjzrHLMUD12GCnN;#z;VGlB`HKEQ-S8t3zsjs@
zNtRoX=dUV8lS@{$Ro2<bFPX!+5*fp+f0|NCY%;lQKoK#@!W^lUp@Wjn!}LweZ|qc8
zrEc_xx0kj(ROzSi#&Ou40Lz-TAUKnK1V7PuU<`MHZ(`+pP@g6X!~gtzb%DRCf&U<Q
z+~m!8F#tvXEQk;7{R5;j*SRQFk7BILPg@9K-!a<zH<8~K8?J*qF)Q`wMYpO%-kewL
zTa0*<!6RWY8XB4(=uYeL5YlQ5=Ki^Z5mbfBpd!u=)p)GYrbkCIdJ1YQayS(34Hm0{
zB%--Ea8D{k`Y7aEU@#{i;uW%lw(F1Ap2ETkoxTtxSP8%RzQL7(kMaB6-roB43c*tK
zv9Y4!1aArZDL=W3G)E7quP{J6QImoY=kFFu_7uPjutS**wi<1EF0~3twB@1K(UTwy
zlOwpK1}*lLN5w`?;-jGTlt~e)&fG<9nyrX|Tdw3G?4fL!nGNUNI0N_GKz>prfzBOF
zs^Ke%2wk(qcw481aQp`B8O5*9x97R!lQS=M?_b*F@Ax0FezSXq40}x@5~pgRNzAl<
zu;JE6pW$?r7Ky_m<J1##q&xs5Q?AdU#x#s>U(o0E7AN00kZF&Ty5p;(X}x}0n;rhC
zPOZnKphsqh5$MOahfNf`kv#Ea#1{MWJVKS12=x43-o7zK-mCj`_Iy?v$0Cv|Tvl69
z;QR?ei|`YZg<7ty9eMZLSHzY<qUu%h`TL@L_=RK4Cukh7OfC<_W<*UDnWfW#a4gE!
zdLI@rdS2)09D%M}NedF>;&iD@E)7CrD#5X)=Ka6`7))|fLi86{tZX0=fq%#2<sB#E
zh5s?EHD)!ot{NOm78Nx!(w5`AcIk*!n;)D>75f)mI_pE4M<i=3e3=LCG+~5|-XK*d
zwZ3~SsRW2hjlMU%(ZmSpu`(nY;#}9)ueK+PURi039ICC~)EZ2)37s<8?7$W(SF=J%
zXgIP(RrPD_mm%Xb?^XEY5t=g<x|_98K9ho~`3K>kds~A>;A}*e?)NCY`!8-mvbbM4
zUQS~H9*J<SVV!4rZtL+(DSMflx)E}CCBNZfK>4@6o-t@fC-6~f#P!fVyjT}@6ayuT
z#9<)u@93w^nY1QBDJK<8Ar3CagBbzt$SXymo5zg_#|d`m=h8ylB-+vA$)Z`VH?-^2
zt9T(R$%B*nOUSN-375#{gRP+`#+0i!phGq_rv$iPT_LCorFCp60~j-+RE8ewIR?_`
z8qpw+8xk6a(0HxZj!J(ls#`a%D+}NG<ASqK3SMi)v^R%dQI!xBu={|ow>qmr^OPPM
zlgJ^iNe+Hh>QNExXc8FP$sdK$sM)%wUTrk5V$mulNXILm5l{Nj5z*Cd*-MJP#VCxn
zxzL<%@yH18WAdIzsqtB}%{?0@qb`1`7%32jF4r+M;kz#c5}BBn^WkJ78ju$OCgL}r
zrQ2oHgXfgV?E&&IvaLlU(CI~a$*cn{Un(oGh%?^EQL*g>ZH5EfipYQF;i(|2@q|&A
zNXP!T3P<{;<g*(If649Mclb=TRO^Iixm%0;?vB(VDrc#8jBb74S9h{J6ganb%4}Ld
zh(EiwK*>MLNU7HGlf&hHj$GW2ix&Dz3c3mQLdN>4<Js?w_LpRSZTkQ1E#fx-&?<I(
zC2nLof;MOe1n69tW~-FQI<}Y&7%Au~3<+}(KPWZ<sM)YIur=qGSoB*YI8KG#;Vdf*
zI8^f0`jmM$-G-`3=@;XoZ450%IHHKWB&VyrQndRatupv+#vnO@O1-8AT>c0GZ<Qj2
zeRq$5V=R39=OlfAS@}#NhMZ^`Y|WwlyK!Pxk+&*n67YZN?Dz$@DC^_ruV(jxQSt8q
zKV6DG+4FkBdR5t({0BL~;pk?<$nHg_q8u7Ce$n_Bu~5kF^(bWV;5e`L_JARU85!aQ
z1aG^Oxng*1?6R9|p9Ey)KBJ-#bJcQFl*i*jym&{zl`LR;>X`rCFlg+YUcXAW#vi`y
zT*@RY+5UKjcabI?WtL>G?7JGS<jHJFNrg(Qq->fZCO8Il@f|+myc2%1k~pEE;F4MO
zPeQ@b>po=wQF)Vqy@EuCnNblWU3{ah?53<~St}$GvVk`A(=G>j8j{i5f<fd9mkmuA
zR|u(^H5&8z28T;tAxOM|Fw{API3Ev&`g28DEP+NK-$ZW%KA04C(2Yv4?nstjmgOFY
zOBO{#47|g78?j8eS$3ZYE$v_L0)X2m`LA90CzAmZWYwX(F4G%<02JwX-RV)<A4!{^
zC9x6?r(Xcue$&|vP6i=4-Ge*S!)}8OL>#;!0>SME2qMUnb^Ma5JP)I2-8#==hKIcZ
zu%YEG3yec&t=6mI6~eeoVh!Y6Gl`o-LXq9K7`5Ao6%F_xrp>kn+THG6k5G-|*$n1K
z+QyG|oD@<YQ+T9$*O6I(K2;P)FCyc(eu7d!{7bB)+>lr_Uv8|;<pot3!EQXo0kJzl
zI32KZ{ni(W4Y3r>c!ffv%8%<0Q}OZ(6b46KmG)fT@t0;XH$$$Tz_gLRcc4{*Esz3G
zp~B!Vb&>hP%tZb^R4PhE>u;UGde9J!^wI>*h%s>K>86WiuzEtJoyx%;Q%?=2Qy7wI
zZ23th3TtW0^!O4d@*xtbbVQ&?*UzuXy8-%gAv~-5490WV6}ygDwv>u_;A5%mvvKI+
ze#fsB0#|TUZ+PMhLleMy)9(QZ)vjKl$i0i-2dN)D%~6yBkj}S{5OH>uWplw8LWhd_
z2tJXx?4PliEdA2iAB20)7Uq#w8qIRuKO+rFx?FbmYTvEYtI|8e9KlhiV3dA)IGcrQ
zuu!T@2#Zi_P2&f#=>dhXuMT^4ko<`1CMkdd#XsgI^`x68bzM-X)KD^098sc8XErZn
zQ62*9%b0B0s+H8DJqvSXzE?utz)qC+<xuq$LSvn&zgL$@EMrVLbtYOKemlGp;^kVk
zm})wg-2gJVpW42%*sXd#9`-95wg0G6B?!X68`_w+v&}9BQ$Dw@SfU+snI6&q`e0c6
zeK6`P@gg(+J{X@t!&q&YGLu?Z6MCS5&lCo)<LftgYrj1e@Xe2Rb=ueTsX7e$?QP${
z8RJw2OVFpQbubdyA?$5-(Gje-SYXlNXqm{qae(_;<BptoN`~-mYrEGykK>K+60=Y;
zy&$eWISA25Z!iLe&!Yz-6AqVym#Yiff*FAl>9~|5Cexr^6Y_x57##GgKU7NeI4W<I
zV;hxXg%1=OjjUbo97cR7y}mHne6aok7|bc(=S6EBnsV84rX(Uee_dk~Me1mSVXwZS
zZOCpLd`L-uKffpyQ9^?Gpf$=D10IBG*z?t4fg}zCOb(YDehN7BB|Jp`_C!V^qtS_b
zM4w}gOvPyB2ogL2l=DHUjGj0OxqV9a5A2F6iB^@^l3Eo)o$Tx(so;G?F<XR7qULbM
zF@BKj`s#<XWhB{raT<S81-%sd72+5hY6Ks8gAu>bZ!1*emz!STp^4wU0Usn4lMww5
zIxsBT><;)7__oJiEk-F-4|!F~E*J_^+@r~-C&VfesEO@xdfa1|@ewu>iC~%Cr!}+X
zo6uDhIhrvf3h@5W*wpD2>Kcs1>xUQJNVc0?en_eX?_N2awnQdh4g6S*O#`l32fcbf
zgLIm|1%z9l%$dw?Pvs!0suPl3CrdIJZBE*9yVt=0Kw&ii$&C(Vszg8z9p5|<pO4qC
z0>nQ=>?EZ|f@@&Vf@dO)ql8Gz^VhK_v$<YE8A4mokL5fQD)1)bcY_pNB%O=7YrZS=
zPH9(|8<}Ewvlqz(VhU{bn$0Nl$E#^1a;<4D#C+@z!kBoIGH)L58WFacC7LvD2)dlp
zVfVa?6f!TK_)c}}xH=3O-m3uzDgvbm^_w4YL>@B5inCuV*E`CW`ow#m?{t!+9?@8u
zFD}~Mq>D`@nvd#s3+_tsjUv(lt^sZI)4Zv35@oom>@y<~=tDP3^?CG=ah!36QiUp1
z22@E+4PJ4UrFtu(y7ee#E`wtl-k4gGw1Pm%Ab`k#br#&fdmIh|P$fK!eAMxju6vwT
z7zO*`&FSWSbKW28o4{1*&H3_hDyc_YF;t?&>@G$)t;1CTi%W0mV;plMhD!ZArwLOf
z_4{}?q`_!U*l}#V#1`~>_f(z>Rr=fJ4`o8OQPE?=-4>g>obB3)F)gz~fluSA4fW5^
z1&-sXOkh^8d>gVkhe6TL71YjZFKtOo9;D*kAN9vw8yZne5~k%U6tg?tsO2l&&A&hO
z3nt4q?N4rh$tHGC_=<WI`1|#1i0Qbx;orgIH&DR;?Tfe7C*b$&^#v_j${YCG93~J`
z!OHc+9LtFOA77As&I4kw_z6KGqBy9ODnJcJ;}iu+5II^MPD|RLveU(#vV}ucLW0@T
zMn*ciwRpSCw(y4;VLHT)BW(8U&-Nge+H6AA=WvKb!6h>ZIPI^`^7`uYP)k`<hV{Fg
z%2@3Vy4Edfc~9ynx=8{;EBXPhA%9(|A5snYxLzZApV4;+(Tf30X+R$YlIXnK{dr)!
z+r8)$O*$um$Fp?Kk9KCFn{%|a;o0x3Kb6Q6ShRwwnoQ?0YiWqxdcp4Eot$H%$zMPr
zYHe!-E#u$nKqpjc4|{;~1N){Z$B+G^+}f|sZ!en5tUtlKao8GszbErLaV=2#MBp;=
zvVH*n;T*`y>fae0T+!qd8$!12jALg6@C}z!s5OQYg#M)dhCpIdGuA%&KjmEP&9Yf6
z{^x4t?zGBm5!d<sl{Fb#^q*q3_d=B7lT46LGQcC$9E?CwqXa&b-~|$JS`6B>!AcP(
z_I1pt6dJLZm1$rw_n%!4zmrA7n>&u{YXQ@K^wMRRn|Rvc?eb5<TV<D}mfa$mju679
z2#waQEpNV%$VU#s-23G$7S$n^Sa|h(TLW^r1G4-^0<K=^aSr(~Svtt%$Lrl(+viXH
zIV241FP@5QJ7E&QK)OVlv=of+34Na(`owi^f#>=Yw>Fi0NlEQ!fL`DOA29Up<=BoT
zug=Fc83%6(XmO;}8-D>ZFcfrIscKE15UuUTE1`^nyUYc1^6-J%lVF+K9WBl^I@3Nb
z(rwBJ%|&d6lkrjt2~dV_2sF|8@UI?im)mQ{dLxM%F5m6bLbNIhBr{1;?4N$qli_P}
z)aQ_fGb`aT&$4Dg>H2yru4+KCSg=T%ZcNu=opC!)>E@*_(qJs4BKSz*a_X0Sw+N3D
z0oADd{09Bvc5{mnM*-YdXP&p>kT1z=7={HRcLH?tdp?#D&+oBu($)SlChZ3@joEp5
z77UJr7kJ#RT}6=hXX|k3t#?!N=d0~VGlgQgwUru;pTTxawQ~6>yB8}prxe<|s1ror
zky|ukDsJ!?;9&z{FX-f-NcJ@sefqyg447xAndcP~%UY{EloSA0XVy_=tB$0e%oZzo
zEYhGBVwM3HgYZnbkk(TBVp7{`jf))m(g#}amDdg`10V$Y8j*UfT`aXgcrie}>HLEJ
z<#8~C)ZwaDw#)JVyC1(tEV2HZO4th89w|=`{Y^wXX(*BU3ou6IdmE!rw6}fx<#V~q
z&LHfvdZ*rO%Nu$y9)}M6$^a&gmde0_G{;X{$z5r)NaqX58IYo}wNig7y1W2g{3-Fd
zn)qD{awqldm3+W94!#Vh5`9+n9oP`8!rfGoJqf%liy;;z-rsC<gCY|0qht^R^Yy|`
zra~^T$rX&^_R{nXT9ANxL+h^W+>pjDk5)4n^b`J#OWuZrCgKH*&3ud})?EGmP>I_8
zBk{I!>vTXV!q{{SV<TMS62`RAhA0dlcXjj4OcdHKA1UX$GLkEl<jFE>XElZ_S-{Y{
zf%{pkH29n?zmwe=2-2VoH!Xm72P2VzO-|szWMTjqj{oM_vdR89#MZLGu#XNMxUxlA
zoioy`g4gc);1f5@$0}TT-F^WuD9B1~B5k64zG3avH~XVsBrus32_<+K?*@xXXvowc
zx+l`yqHQ8s0ba=i*F<5+VC_3jx(GO`!d<_ScmBJ;&VBQr&sDAtkAzS_|4bO@c5nq?
zQ`unOF{<p4c>2%!*<Dr0CcQyJ=lk!k-KN8dr{;Xx04pWkp{|l%%Q%yOp;GGJUvhOd
zO{Br`GpRni<?S0Ruh3e>MluDP=k!<xCwqzVy>Cxbc?gpVp$n^MP9E3y;?b1tU1Ki<
z8E}9r<pfR*3P6S4?lU@VfGCQz8}=R6piqjPjJI^bVxH_evUKzYpf?oICgzVeV=V*=
z(&yv>r;;pE7_7A~C99ibyaHE^kiX0FQluJGfTqzYK+veyAy47C+qO8rBliX42+@>8
zXtdlhk#Ln@QzK*lQ&LvTEikShh#es##!X5zY4HtYGYcB+jxZ;4vq-|@!mIR#;{hUa
zw`zq$HsKSY!c{J7kfSsoD>e@i)KL_Ag1ztIbNK>7gpZlrcIphQX^jo|{IF@{I)p4u
zUSxgYNJ>m9ocBj>P?V}zn_9YhwUbb04;;nzR-1^=M4{-BH=_xaKG_{ab%yyIE;}qm
zK2#Usvfe!;TW^66f(qt(|Gn4!y8(KWhkZf<OwRqg+4LY`U5(zq(7hL@V`Z2JWs|%i
zx+4fj&I!MK781_jv}T?K!d66kpZ=Vy5i12Ci3r?ebMBJp6arjT9_iQXb=G#@_}RQ+
zxh)DvtmJ$Ew}zro!Pc8CO7}!!aU*EvXh(7eBb%^i?-;wglaUrkWpWd+Uea+m!;i?o
z$H(K4fSL_b-5XJRoh{icwHcJ|9dIs*5zv^SNQLjP03A)Tbb*@S+YKSMh~2?N;A&4r
z_s%Pu>n-|}n`W+lFg!N9<9GBEdVZ4vg(Z2)o}bY?;Ffb$1WhdgA@#w;zsjEv0X}g1
zDmr(Cpm@Y!G|_+LVml4Ayr+n9EKLF*`JZC3Cj?d_0!xZ?HR_xZ{*u8bYeiS5<5*SB
z)3V?Y5YzL?82>7php6fHqVV(OVkG^sB+Z|($_rE3+j+J?(X1@#E^jFFH;~1Yrq%5k
z{^wfx&K2py>mzN!{HlVlXMBDn&RfNj(Y5speeYba+%3L`^;!XyR<oqe=Kie=^x!|b
z61J1A12wdzrK?Z=E`o&_2D~*ajXH~7D!tpX-){_+tEW)3E4|~J0y+SGLP8)BPt70p
zH(#?})lNu)(fgnw*oDS_|Kip0G+UKkKG4=|$G0DXlBImD8%3>#Di@QFUMYN?3H`#@
z+n=IK+g~sr&UZc9E@L`XgaNAFR#a+R*BJ!wLneVv<#9a=8}M#?veKToP)5~gvJM%7
zG962<)?flRD3vDvx_)!`O_kBWtR<wBXEKAmvdQhAInTecNtW^lz2O;u(&Z&>3iO|Q
zc%SuArQgSLWS9fhg5+^nPZH=~=1csnun1O<mzq?>=AYJ^T&JbqmM~7b<}!2bMuS+y
zuD?gS;h6BzQKWM^KqGG5L#@~!UT_wvmlrIUKXWX5uM#?3&MO^Cfyt(Jm|tPsfO!d1
zsF%f6z)({fuN86ehoWjI85t_Kn1A)#q95PjFKNiLG>gOCW#TlTLPt^%_{iks&>q_I
zhOAD>P*Q8O3S=~6>U#PO1&@gR-6DOiMu5IZroCjlEp~UlV)fSwjUbI#q`emHO=hY2
zYEF5hd`4pz-oOqVX9CdT{26(xmKh5=%GNvIp6>&g%2m-}OJ(CR3m_K*V3vmdCr$6K
z&?f@|Ku@9I(LP^&P;_rAjDJ}1!lHjePaJ``RRJ)N`xp)+GD*<47yruu=Z6iABu2A}
zpA0e%2^$0!>zJZk3fSU5ySoX5Q#|nJ4M*Z2*c{9&ooQ~h!YHddDgV{l$_c9#;}usk
z8^leMzQ|yx$baqdZ8}@8)e<lq59y&hU#*u(!HR|lwpKu@bq8YHBQn__Qkl#ZU-!ct
z+W>yXKN9aFrj#02E9>N>)#;Kr6F6A(t0ayh@3oZs!w;ZgRL#vU)uVmq1#F$7e|R$x
zwo$8B30Ks(x?gP(fbO#Mv#Jm^j(8@3ckdBVnrE=tp(?~Kj!HNT4&ei2<*grZy+XtT
z;X`LAN=H_+w9J(0TOZHDOEWGqjq)$LVbRr^ZcM`oQuq*kbpROOupF<2;&<lSC(ne~
z)~i39JzZ`cGK<ita)#*rAOtnL%zlDG?HNz)R0*TvTGecO{W1`lnf16TwxfWFsecx(
z(823c6!bAV?9@lTk4u(X?x$@u$!WByH}Ur$qm}10gyrVv(nECb{E2>^+vr@eF|PcZ
zMWFrXfI1|#_R@&thmkoiAObOU?={Jl$eUz|qHywzUI#6xae2HWJ6dk)uSav9@n(6p
zyB2k@DK7>D>E{`~fGf?K$laSSYo8jvp*3tpX%G32)EExS_#~=u)Wl-uJ#@W4_UGgG
z1>yF_l<K5o43Eknk~r*WR$z-~8onAFn-PLms&?=%llH=6e+%F64eU9oKaE>3B$nyt
ziDk9B$7V3u5UrNX{0Xr}6(={MTi`O<V109IGOeG~7zn>s4TNIN*OuyF)2dU~8Mb>~
zn5D1Qo4|OuJxrzK-)Q4$DL1>;$4U99*{5+h4o%T+^#~YGvACDw@{wVMMNAmfo}#Mw
z0STfHyd}ulUhtuX27=%j+(xLc%A%DE=7JabNroj$jhAcwl=Ei6>!L21-M(2iy_pV<
zVqoPUbtGEN6NnJ$8U2i=^Zvj>@9+g`WZnWh0>m*5okrH?CoAXc8~<!>&cVe>jpC@l
zddb0vOdmyyRg-bq<e<?n&v)|(A--3GK2BDfJTb(<Fss3WEt9E@=6a$T5krUm7{eQw
z1Wgj72~(G7yZ!KnnJ7D~Hh;;Q|2FIWtN-QT0#smx>tdMD7*K<o=>H6SWQCR!e%h^{
z_rN~D|CXFuj<d)Fo~QIcgWe(yi!=VKM@~^ru>zbTrpj<%I2M|KVH-+ic@c;k=)Cs0
zEI&jyAWQq;uD4QbJDm;Kt>Ae|iu#Kb;K$IN5>d!W*1cR+XteI<*xI8Kuo#TQJ$5v;
zB04SK>{}ntpyZpI6|i>5jiys2?!B`f(L>`h%<0Ox9fn|wmujE>!}NR|o_E9nz~jC)
z0PncCe33slZeFYfxY!;1yNcZ4FpG*rfIAzQfWNZvmR)zxItYOj+~MT{CyCxIL)It`
z;gXfeU&btnHT4%TubmTsh8`wxzI<d+gwzc0IhSBvup@5lMhrI)+dvEYX`gfIha%Qq
z24#o%TwA2k+xfBT(FQNhur6VhitGxK|4vkb5D`7Sh1HU5K=c{j{1?e04DK1oe)tTF
zN0FIx!D1Rm%l|@?qQB@VXaX?@q-Od6A^93;y)oU%!1w<%ZJZs%f_lC-@5#mX;)(il
z(B|;hMS??guMJ8J8pPm8vBf~C9l%v4pd3W3)Gmkv{=}|+{*yGu(&=&q3{XT-HS*gS
z_XmRD+v?I$?CpBt@bQLHNNO8KDr){+Jen2a7)gwJA=@k+q`X%h>+A#`Eerv>VL>*1
zMRZlh!#_#<Fj%E*ru6Ilwirtjc;4H#wW|1?)P@s*h9&d_>)V1`-)|ZBIti27)i0J9
zU!zhWevGFxF?Jj<{|Al6hi;ct*nvcPe8uY>o3GR1l)2}V6{pJP)Uwa?bn~kek`LVZ
zX0EvhaYh6NL6dy&PL=kC`Lx0?76P~2Hr~a{{n_s%x?8AkW5N?i0};F=>!zaWYCjt$
zL|7HM(pF2AzSFsb#YR$_w%C4mi^Q!r>p6<vRx1xW9}k)b1c-tQ4GsY%3cMh0%DFNP
zxQn%RD2B?HyK@LuyS=%m;DFOk%|KOL82;FpNT5QN=?9H9$#HZGBt{Q}!7qqX;@Xyt
z{CB!A{wGT0Z<z$e00T0Ms3sHcUs2ax4BYRJ2{s#*gB>X-J18M@h&|{TflGmCJf!PA
zIN3x@&GA%r$1nDakz&#P5$S?4DO&{6XNdqH)r-nNjXtMkulA5u8fR{@&IBlxzkmzj
z5%#|IvLp7{`QiFYNJ99Jb15~M&i6^_s^6*lsPmfjo=gZnf!Vx2E+|EVK~oef)bnA8
z+8eRxbdz|UYXyzxzk<`t_v09d?Yil)j;C;<UF@_n)ap;FBk1W5MSVWP$w;dMWm>iz
zoyKfdh|md#U&|G8+F!p!+e?KOl%b=Ksi}qN22v*iB5->ABPDaCr`dR>#Idmu*nuwS
z4LOCkFDHis#9X>v-D75rtp~#4b=Mu!%X2OKuw(MBl2}!Y;#~d6qib_{K>h0yz>F;a
zT8{bDaL&F3c<`AR8wJ4&+%^Eg#ug4pLj_aF9ZVVkf{<x1)>eg!H*2l9DSuxojNHdK
z#|MC6xaszXVIUnnkL)QC<y*Od{~fh-zZ<RT?btDq6N4YV!GF2^q>I1V11KE(8B>Tp
zwfe&#I4g|`E1E!DVFHa>MV!TO96yclcnTx3l36JB_jTWu!`*-8u{%tX2Bz5}9X@M^
z@xmlBsbokg>2NK{iH^+urvFTFB7(@h4)E=ZqQFc$hpQ=t;j-h>XtqIrRoBS&`rwMf
z_jKpe0_c2c499XE91J4fD@0$WGA+CS*lSrX?LIcQKZeA#LLzZ<Uh)K>nH;V|q$E;q
zbmwdJXlKi4@B3q6X-23@V&Iz1=5)x`c8oyu1=XwX(iFj%F&u&O!Yze#g*isAHHm1v
zKVT*JQHB%_e2RZdoboCB7GU3Jwps@Bc!r4@bBKy!9q@}{Mfr$IV)IC7XkIrEI=oqw
z1SiD@lw7#sSQ7fay`BBh$H66W=jS~PuFbV<y+OwS%AH#w&Egpp=y-dgRQNO?jBBah
zqqbP|a-T{m+w$#-+Z|ep!Dj$T2#$A#Sj1jN_?+2^tA58V$1iy6ar%u7d$>{aZNOTi
zHeS9WjkVjW8(TQ;M>b7|x$$N(JvK+)NAFL<Oh5_6CIuZW`V;-XH6DH7f%{I>E%Z;#
zy_5VSJbugmi}v{1K(pBqJ>9L^LNnHJShKxflaUaykNk|W2`LG*sfJ^P8yz@LiZ;Bl
zC}sx+o$mOh<6?6mv;Q^1_ioloWc-8?k&@c08i@|_0N|WIaKDI>DVKVS8lk2rTUa;m
zW*|IuyKgu)Zk_~@KKH}-8V5Na_A!H23^43e8BKZ#-PBxLwyT0vL?iBfTJvC$@d1@p
zC$i0y_x@l&oAVfMnDRn+eLjV0UMa{;$TH_AjsIfsqQzvq+7fU3HmTM0sZ<fO(<)&#
zNC@b=tW%3l$nK9<JoeQTR_AOZJY@(zW(!5IBw`6s>pBk`9#wE3%%Z9SGPy35B-<|8
zRf@vGK{6~yfT1W)6r+Q_+|kku;vxY!D~QD;ecsaM-VYhfPUL6~Lw~*`qO<Tl_#qfW
zrjy6_nex5wS0zt?GJG;4>&7l&vdn5_(NDL%A%vwCi@=5cD)Vr7@$kBbsT~rrt&{oF
z7Uw$YtdHNGBOW5Ke1T6T!YlVt&JH-n&@0MNsL#ECeV0))yZ>aqq$`p;AojVQ-{7Vu
z5dI9XMxMEeyWvIrooGAUi+lVl6pSV%qqscS`YT94<@}wcq?gH2mnoW?nuJ5Y^3U&c
zxY+U4l1lL6Ty6Tlhh9IulmhZa-+M&P3MWKQu!uXCEO%aj#jX1s%_nET5kX^!K@tE0
zuqGv2>Qy1YXkO0S2OIW_1!P)g#N(mj9O3^k_mxpuZe6=l(hVX?r+|Qf(%oIsA*h7X
z0@B^x-O?Z>-6_(bG}6-DU1tG1*!z9=9^ZGy`EmX@9vzSObFaDPy5===$@@Ecjz7hs
zQDo=L=A$Elrf1XGh#Pvn{?6jP-EJBzYtCb>1}A*!L~g`=-BQyn0&}>bod!v`DgO~p
z_ies>ND4^LN7)#5b9%=(6intxsyJ%=+q>kKvTzly4B{{d(Jn`onyzI!;3$55MtEG6
z<o&u`7-arHG`)rW$MSC!)O&g21o8ER$9L@VR{sZ{LWoO#QjzDUf$=F<jeO!`Ke{U<
z;iSW<UvSryyCGgO%)R>w8b>Wx`zMQRbuip8DaDcOtxesJD{}{*)U|A=__$mGhgGg@
zz$j|7Fri9Q5n+cZQ`+simF_f&!H`)p?oFN#KE88aEUOceLXL*mNDxx+hZmY-2&dIP
z4zFUkEC5@uf&VAx>O2cQq(fB;^YuE9Bj52nE`;z*gZE9G15^30agI=*baGn?@d!9Z
z9Z^_Me=NS%KBL^t<OUm%g_l$qn|BlaMmi4WCN_bR9BkL1b-_~eLRo^OS*wjDS#m{5
zwPI>2{@xgFbs+=_a|QhgHb(fMmy$tfAkG$uWjbEIVRqau$M77)4A9le3{afUcOGR*
zCsGUz@ugaRA@R)M`~cyzEO8Fa)*6KWSgpc<xGd7x^7(ZU$9}}K=!@<M$})o<!D7u4
zJ^Tcbk7CB1ZZ(ghsTDDzXw^TF>KzLI`iS6a<2c()uJXk^gZgXmXnD2Xi2R0z+>2*V
zBKUWWk;!H|eHCJGy4AC*lN3ZexJk$}B}4f|;?nF4zq0Rs(h0l`qcG}(q~?hm59d$c
z%K|;*c@aMQlcn$9wgXmb6cz+%=e(f!4;rOB`Os3|+Np9)Lr+d=r-nJl=X@4~q0=)>
zuh2M@jLbv((G$GYKXCi`T7_k-QD-%9Uw9q|$WmFoOuUJ?3}Ue0(7u8kDOm9>-x#lG
z!mlW422=L5U-VA)B@b;Sf}9|9B71qX3~FXi3_L0!r$T2G<1Z#3D~x1NU)if^kNTso
zMrTDHn<_@M3k>{ov3x)9WTTLH#{wOLw>6!7r#FcSXOoDsJv2Q~=;&~h>ul!U?)|R{
zO?8l!h+E&>8$3kkW%J`oxq#CL3JIs*s$qbf*^#SR6!z-MUdqQcrRvG~K)5Eg_2oTX
zkn5j(0hat^Fjo-@g@6+YOoLOJ8R^B(@2vRsFzSmHszGw_{&|esxfjnR91fJE7r&)u
zja_aM;u?#Q$IC3~&(#(nu7l7E^Z7d4KrOi52$zj6`j7_#kF8eu!0e@cO!V?=)v3C;
zPtBR5)ZkqEVKUhvoeL~ft~}(qJU~~<SEI?v^&^u*Rd|hWoZ5V<MFAa8wdLh>+=E4*
zsCfcNDWA4%O26Ju9UdR-E+Hy)FnVJ{Dm#@XORmyUQZx9cx!gyi-{LyOxY+B&&=tl*
z2u>^G15c2U4tG2wKj#;IUB3;Twm$QUu0YLGZFrR{0kV|T1-T6>oq=>3wa^ETUqt$&
z5H{%YKXa8&mnBxIws93Wo~U+&%^iN0q>fdjHbl+qk7gtVs>9p}>Q4E6ij2eM)a|A=
zCrj`#yz;q+PoeL_@CC*ZnBh3r`mR5JJ@F)4E<f%yi(2zVsKA+7hK+e7{RKn_i!(7C
z0=(v@d{E?Wp)cj#&*NE`6!AGA!Y79g7+6WTs2>aen5I_|06zIJ+Aq5s^Gb3XOsV@@
ziJ>SQ1^<M-LzWcPs{~f+;`Gs@9`y?CvHk_#t)u|?Je4nvT{S#k{ct66D2jjPt5?hp
zttoF?Z{vstA>@n|>xG^YF%HW*^x=AJrF<PM(U(z>M|M6Em?MRmQg*I)n->e8lTH-F
zZdLn|Na~?&pjBdp{6sac@*%>d!`TCZUmRaTLK=t#GLfivcYc0co9&J*38B{_c-LR~
zr9TMH0d<qd0}xFjcvjF`o%{_=0?Za#VdUW(>Wqw3`O3fwIy=AmU}IiJ({g}{4V+gE
zmoIba)eD{~6f74U%X|6!6l_F6K=P>kFvl;fARPri0IK{ILVva=w>JZ}n3fmjqhd$s
z8%;;Y5ULS<|4o&LmdIGgEB<F?d+URIB7T`)xIt(&m2`*k@@R*MrWZaI&QS1PnQ&fs
zn?5k4PD7s+g+30+n`5qs=5_;WjQ8tXkiOld5ixWZ-@<hXV4H<ZVKwDD?r_E&(bMp8
zT=c=~tVl2ccbG=Mz9=euz4BH97YzJrFd+}P;aud#7mZ=m6<;1=(%AOfgvHQ2J0GEJ
z_d`Ss!sno%G8*~(n9fbO&%4dWge>of@)Z=x)Bs(NAX=7SADn3+aVMK<*C;<+=0mkz
z#<67ryUTs5uYQ=18TEVN=op%-$i6BPe>B`E5tsP&k%Bnpo1pJ$=2@70t^$?o)QZ2D
z6M-*t=ePhIh4XDivEX+?cB7(IyYG8D#N0gZdOJE-Em15@J1p9K&?G^X@_rPzz!Q2(
z`8ucbWAv|q-hI-wZNI+x(kOaPea75=<wzbG_|5#_=L-j`T9?w5esK$%$)B>l$S;bl
zP{V?)7~m#ZfFPQdE@&oHx!}`Vz(~)~E6|Jb`tWI8Wip5=t@?*=T%&|l-e@>_2wJ=Q
z=K`fdwcK%psYjeF&S%I!t(PHXlDNti9}&CZz?lBXgSVMgf)HLociPF7&yV^PM}g@U
zhz7MC|LlIQVovI3GB>TwS{Q}S6!t9V@82_ZEtZcY2wMoeQzNd57gn(&goA*S+Z9O#
zRiY=!fB?0|Y~%(}x!_f%lbJ5QQA(!AwEOGv`CNq=!vUe_@ac=(t6})2s3b&Tn|5Zk
z*TZMguGG8L8aS~c^3YQ?_8erxdFfGS>1TyvB}&Xxa$UwG<{D)Vz6SA+*&aBqToPM5
zRXxEk)Zol|`L_IH5`|d8LumqzbU#X*-5PAyhHccR3=G67g6@0&(faUPKLncUwL4lI
zvQT;RjZq($xF3dZ)67^tT0Hf{1?4$G=u4N5(1QF$Wk1l~n{LFFp`mGOqWKOYaoAb8
z9DkToMWh*`S6N17F_};}p^#31W4E;$M4wiWRyoGD_U;Mgs(E7-fhI{-c>iF{{j(uA
zd6X)}GgdS(*U$BBJ#m%g+OT4lWR9`@LZ>3Q3J&%wulW;la6AJZGKB0i3-0{*HtMI|
zL)b*Sw4i`JofS=&k5d=A)=C;Wd47H_7#_hwB4m*06LQklH6r?5nplyIAC97IsN7gh
zfP#!_JS^y!tx3}!b~r7t$Q7Pwk_OqdavN;+<yXF%%e#fswR~a4h}RjY+!AlJJj4fj
zDb|Vp59lMUBANGyQ*G0Pk&!#*-#jKkp%aoT{j7XIT|2LjT+&X2rdCbpRAcdYIA0Yt
z@bL@zoY($KWQ!|R0%#QqT=(vgz=#R*DST}MRe3&o{<a`*ft5}{tsE@~V`%8xo;8rw
z=LQD<uWDSu^A{DoY~n>I=djwudOE9W58pJ{uWHd3d-O1{D@uO|xV`E60eS1j!f-)2
z^aNmHyPOC@rc<e}&jq-Y<4wSbxT5ZaYo$?azqo3*1Ij6qJ1nxI<nSh+Ia%vD=<wvX
zdu%0_<%wmnMEf0mfJ$0tq7N%N-1z!9Fei-qUmu4UVko2WVm^_5gs+Om`?7-+@|Lw$
z7wk{>wIIi>A386;AD3kV2GoG36(qn56he!01r6d%VEp2!6`Z;}W?C=zA~)m&W!>cR
znQ+4FXfqCt$9a=q&C;|9PJ<zV9)a-{ewog+TD9-wR7zzVcD?TFNX;q|0G=>2-x1dG
zrR8isGnX_Uq04(-NWwQFj~+U~E9ST@UCta-$}e~2C0rM_o_`=6pMQJhI#uK}r&qQ7
zeMcRb>&bD~%1K|uf`DNPHDmi<U#VgkjWhR=28KnfVwEa41axQ8E1SEY{2<H(xkWFo
zv%^P<>SgFFhmqUlV+K%`tRK&dh}mL`I)nQZ8E_{>gq_|zW-t|YDjZ3H*Qj<-wG8~e
z<f+Q@TOv^5!UsmeAGLdMzV$Fc|G$SnAG&6HU#I`3Ud*9ir~g>IZfJ3d{9kCXtLv)^
zDfo(HC?3+24Qx*PLnK8F!X{5d9KIU-x(o(%h*I{j4TJ}lt&>)7S2b29F+*)DjHXhb
z&;vD>9ZnY`4e8K)!&UcqvfeSPRJU5Ra+Rl1Lf!|<vDJ<=HD`HkF^Z7-lep<G4|t)H
zh%5#z&<QFU7=Dak?&ofh3YrgH5_ryu;v+~yJDBsP@3EL(-oH4#N_}$p2;D754%E4Z
zWDhsV#vbjDl@L+OggGCsU%4Ap&SgptlgGy_Pi}2$+Rx7CykytVX~<J8;rD+a_0h5a
z1Oq+1{d2*|9v=vlq*JuXBzj0a#<Q2vK<J3p?Tmgw?vMGwc5kuA?Cj9k)~55v@LD!G
zv`i8sb`mGUgU~a0YxI2ijIbaZ3Bf^&B}nZ#ufXrQ9}zuSIh~vMSJbH8n*&6fN!<#P
zr?C<$q!bWFim$@6`m~WT){;4GN#Z4g1@j8k3sH1BBF4UZEAWrxPil+GM?O|*k;LQB
zG_7{-mX9yb$HF5>P2B>aCM3=462NPUJD9EWS;~?p0GCUN@d|W|WvhOEKqj=?knJQM
z`8+DR@KsAQ45DN*>d#SgRWfMxM_KF1;5No=rMgGd!E4ju0|)6sXphYZ-bK1D9EOU)
zB{5lZW6>*N?Jo9^T4&)+JD%TDXEyfo#~Iox#)j=?1s3(NH^zRKHQ__B@0WL!y2d0J
zn_$B2_KAa#opj_=^xVUGcpj}FLY_|_qdQCC(n)gjqMxWrW=zp?4DiF*SrKqM2r}mc
z5oDWdmYNYq1|mGScJx9Kz`p2{Pb{;SMUu@ldhh%0DNTm|$NgAv!y&}LPKYTu^1mLk
zn&Ms;=YMOXDvSI)>^4aCl7l=dpU-N2G(gKM-}&A6qu>jEbd?fw-1)v}Wf)kh%_xh)
zfN^05dgHgDkYZuiC95Dm)m(G5rC4A7fJ7W_s$Ms(G~c(pLF<E}b`Lv`VUKtf`sM3q
zmPI?!)J$Q~X=LK7gJI2iO880y>1h{I4>=GFW^gD$@k;}rC=#>8blVw0Zz6Z**)Nex
z!R)7(Z&keu%T$wtM&F|(aX3ztzCZC({1ET<J)a{W;ho6<9*a1Wejh|b$AG1x_u&@9
z`L1M;fLEXkHjVPi&vvg(O|DN&1(uBB)|*rAokIq>xtTJt(3{wuIY#EQ8#UIl+3&;v
zZh+|V#|=i4K=*k)<5b1eI%nLJ7ZSQ6KigfqpRqJcn!FXveAVy)bDxkEPC1U;JFgN3
z)p$sNCuO4MYKBl5DymIPq<Y$FYXY((i~_qSw|1-jN72IyXLGWHjY-U(W$(#p`<ExP
z8l*rIaZ=#EH<*-&tth}yQ}5{?1^JV|O+M9=(%$M3J>!#;m$ui5nOs{zZhBD5;TDGY
zPxe_G;(FumwZSW1Cv;SPH1~6OJ+H(+v>@Y1<m+!6`m9V0ZQXfFDc^}jHPaSGPRvBT
za1nR~N(b+u;IrkPajhml^v~c<o$K12sIr)=iJQotkAlaBymEmJCV<Qd^@YTYdSix9
zibjqu%Vf8~4fC7bH)4sHAo3&SO{bCfluF`c`^x_#;pmt<S=27QRO~C2I!0?s{^&r4
z7)_N{Q{S5PaRDPEW+01Z_49uF(wP~0v!zXZP^ebbN*7Kh1}>=4YqpT0NSp)2UsB8?
z3Q}w-o|#ssH$lw&Y<q`vqRs;L6)|7`Q}SkfUQlD}jpuia)<RBU!gBSHfX694q`&*8
z@8Q<Yr1fxKEb(hMkL`!>rC%FT@C8XpGsMClb@b&B6V%fqBOo+cucFRS)k7h{!}|to
z=6xfB)EUlG-Nv`HtaMx|5cH_{`J}rkz(Yjv1Bp?VWGsSMzVnQA-C6&S;mTq{&1ewZ
z<K4xg+DV&7thKqU*{|Da@kTA~Qnrm?2*hMTaX4KI-+y%urjJyA!N84K<d5o(C3^JB
z8OIh8Fz=w!s;tMnF|Oa@xgG69<DODEG}~`l&l3TlULs5kS2N$~RxQb}74RozByAvi
znJKwFJ85sTKhMDFu>E~qAwkc2aUy)lo%ATihJT+e42-rGb?ti>N58L;34>Gal;rbe
z-T_RF+~Jmj5Y%(_o`AHwU+efb_ARe5eDYIOM!q*#nr9ezkbTZqlT;QIP`fzqKEQE}
zTnS=uaXsFU>xk;}559VOouJdH)zn0Ek5_LJ-4r6^CYr%3@Z(4;)Ryo-tF&9GmF}@T
z@f(_9nqcAoP!<T{(Wxqe6r}R8%##9DhklCu%AN1mR)=!j)t@6Vk}-#wDo{dOH!Es!
z)qEUIDpw$2vLfj|I%3HS4}3ga@LXd<>|o#ZRo9&UXP$1omZ5+M6Wlza2<n9GzOk2W
zM11GRUZFmfDrI)YErdeOhuin2X9bYN`mnkK&?d?iX^t~YWm+ypL#tn>>6tD3e4**+
z`>R!ZDgifhucvDqb~sO~(BKHlq_9MHPAyXEsm8Z_<3}&vzZTca_)=~>fZ=2^`ZeSs
zSGyt6bHjdFq@4M^d3v2kBLU|pWoT{|v((LjYx`e~nrBH09$m)CHy^`mj|9>3^2o+y
zR8{VpB~0s-82BGL*!u3*E5t6*?*wbcF&)twt%ZR}V;Vh`(nssj9C6pR3PH(Fa5Cmr
zFhz($o5YO`{TZ`&0&>Dr_-(m%5}jt+L)#RGP_apNZJRu_@e_>xA$j@`0`ode2Z<E-
zo+a1)%o=x-gtgJ|nNd+uiRyKBo7JQ>5mdb;VkAt=rM1a?dbw0!2BnBdO8R5VJN)7s
zZvD%Y%jG)$k<B`(GwVWGh)ih$!r4!Ok3|{==$QirSW$O3Q6s69BH9_$MC?{B$4x6z
zEGm*7IByM<&oPps>7o?{X1%jxUtLr|U;^|Ii?QJ5MTx{oKu2Ow7-ft5r7}85k?8lu
zB3g$ebozo|e7zHRWxS3NP&)Vg$x5M8Rlq#m?8;tNk;PeN`{p7K?)1CI$DpoL0OpAL
z0k+--3=LqCtA?9-E3%I&!k>v_USu{;*zRE~N}i${r*FwVQ7#V%t$E|W>M?U$(EN>z
zU;e~+u#{Zm+faN&sxyw1+7B`eYud6bW<oPWk9tSg<|!!H>}+vcx%@`!W9{}>Qp)e0
ztQF0l)FHDI5)|I4G;kyB?Jx%(E^eqVPnDo1u-mG|K?xyXyG2zl_@P6{A-w^s^X;s}
zfs~F9BX^gxwcVbXEy5i#hjND`md+dfUi6x4`AR~|GlJ?+z_ywI)R`If$e)bPUSz+E
z?=A`ouym?B+joCkIRr_iA5ttF+n+(+Z|=3fl5SODwxBWesO%#Hunaf#0An4`z8k{j
zO%^p3Z5mQSj})lle+weWd3+X>Sd(I3SkHdepbPRJq3K9Qg6WZM`$)=P@>`69F(}0$
zcjnsMSwH-0SM+LIpiyf2QDn^Wt{{o?gNnQbPNMI-8vQNq7@zTliPq@H=BZWeIzBjq
zIf?_81@h_@Zml!)6Bq)LmwQY6zQ2To!o#LP{CLXU5gC5bSdH1+sbOEvp%p3LflmEX
z7$_@8KdA++?<msD|D|94#%Xkc2Pnb}aldCxsnDg?*8DNM%1@ylLtf{1Q>CFRrZR7M
zNoop2-t62f<V$61K8fmyZ+3B7Y#8dqm%VBc4sg@$QtqT!5FMXC4J1s9!0(YvVus4>
zi_slTa7s>Q?&*toPRpE{A0aY>@>U{hrH%R&WIlY%;XKf7@bN2tYYwr(k~3+$uKsBp
z@dcc_p?3`fTcp)vCfjDnraOT533$WB*haWf*TzUhePrbmSQywe@pY*P4QGh0soV-E
z_!A5_#!W)A8c*dXiI)#6^4Z^f>^cT1?`2DNdn*r+0+#9v5H;E|JHz}rMatdzZ9FWM
zoj4{!L?)T@&FLKVMas$Qfgv0cQnT^PF!9c^lS#j9AE)1kFnIX;G=X+aSa|{|PsU5K
z1wzX5xKh@Sr${mElgHjt{!PYt&tFoOeX05sk4qerur^o#|5jK{xg*n7#G+Si^(MJj
zG4egI9ZZC!XQ>M^C#_Bb4ugOZ*~drZTTKG54}N~k%{ABUY|O)bslfb&_ejz|%J`#S
zn-&K#E0YNoUv7=C@8TM$jEyMgJKbL?=_G%cY*_fA%UjvG)=S;mr0Gi<WkU5f-}=)J
zsb4X0Szo(BgRQcaZ>4)#pNgg5@9{;pOkCHWL2T$0+{nsm`UaPKtt_x&V-$kR{%9Z$
zr28$4OpmM*HJPFB-*3+BQJ<YS+1uWkqim0(MI7AAhI;>jgQR3IL)~<=&N{e&{U*jZ
z+|+UZpR(f5_&|*DTjOA^95NV4tgGRx!~`-a8U87<5G(^$de~{-0^9+MicuWbEmUd3
z&y<SQws?HnQ}%Lcv*>DuPcgoo0-ELh1loOj<f7B~A_G|!m0C-f<Dlma%xcbbOpsb!
zH^nF|iY)s4MU(f;p>AFz74F&|lHgDyAcey>$<2`LpyB=w!|}Kfq|nUyTI4ykkA}wH
zl44B7l|61m#ilCj48x+l_K1@i1n!RpLN{*Jp9T3zi^(OTNfM3nFJm{YPF4^afnkme
zp+DDm(qOO6oL^5UQYZu>7TxP?v{g|~<9NG|tBvjG0%ePEk)UITYI~n5ys?hI3hsa}
zaKv;1`T|x>scLy@2$S7<_2H-b<wsa_YT_TSG9*JGgYceHkaQ(VB|Jyg>xm@=mIvf%
zGx_3Z^<)!$kYVJP6B*v3<Z0CXyl*<L>1AWj7yb>|$W%LxlBzPAZi&v8#bETF!+m7S
zpB6h!Eh4fx<{yQOH969$oaR26XUH-Zm-kK;$L79h^=)5*0c{#}80&riz0B_18XW+|
z<<9|>m-@0E%`iC8@gQ=u?N(LtNkME*bAH)cg7;UxYWGYC+HsB~j93V0<W}E+(3j?|
zwb`-UOm4PnVZ>0k0hKgZ)N1lW-#{7EVIq4=lYofAmlB;`B#v^E=ND4JqMgE9e4^x)
zVkN`<ZVrmPbfCNs7ve?Q$R?BA|86&LyZM5j=bE=4F2%FRW@?ZhACHJAo`G{e&&%yz
z`{_g4sriq^w`QV6=|P{3w`tMbXsI#``l36*-9}y}TxZ$2%dqWWRI_jl7N<!wSqz7>
zD|I;&VpMrf$zbppYBtE`{AlpM-xYN#0KuXxF-tp)&t(OvR<Wl2L!@B;HiAfkv%%eO
zJA6?UD!pO7Rj?64?8rV~b3Hc(n1P(tG)Usn*m(u^6HH1O0smoRMOMM|Z5hxq>_F~^
z<IYx+=`H~>UbuAM{ez1aXh5w{6eO*BEgAw2^}CK%gGv8r`cE33)M3BMLM?8b3nPyw
z<Nvi<3;bgv9B?ky<YGAt??+tbMAY*afiiYqUXBkF@32E7ACw=hULYnQ!iA^}1gTvj
z>ZS3Dp%AORvuf+r{9dQ5l{iTNwUI8wVc_fQ#DvfM2J5MMy*%T{RTTl!5pMb;N=2Jg
z@oiw9BQimN-%}dj=qkU+t}M4Y23&pOTEJyT!?1t^pRCi2|Gjht4BL2SbSzr=@r*fL
zEb`HHL$4->wM)$FhO-0SrxjbHImX{~g^3JEQ}p(KI?~;+l&=yY{C)>J7l<`)g_WRA
zm?+5};)t2Oxed+~A%dli!{BhJ^8#df&^SviJVSFmVM6N!=GUyFBOI$hq5|h<&}+vJ
z$O(012hf49qxM!Nk%MkR@v4`A`1f0BNreb%bnp)CsuMvERDr8t(5r2%`Y&eQdH843
zQ4fd9Z=c(iq`aHuPaVs2m|5y8vKd1V!)J%<7zvH^NvUxdBLST(rWQEr<t8l~Qz-7!
z#|+iXKu64>s(Cm$tcu{Zs*o?fbDEr!#Z;JmGAdp<F7bv%B4mD;D&(&h-mq?YF{1U!
zVkBvMdFSm|I$od?oH8|oKyDE>wIa3@8a7<h^O+5G=6e^cTY07L_mq~$ol{;mU%d3t
zeq?mM)!^OXgej@0l9%{>mQ<vvL;^J)yWSfa9|?JNsBA4Mq>Y!Jc^Rhb40TI4eDh&w
zA0kkN86Bv9Y7U7ZA__05r)ZApki9}@qUAhFE}RnU&VEbE|Lnv!eP#~=Cq--^D%Tp?
zJkR~iN+519XFk=k)^UkWA?KBZZb^mqetbXw75OuRbymgfdQj$CW0kL19^WwOwpzxi
zz^snAxzO3P|2|w{vy|vEs~_8PX-lq#B7k7!^KM2n==*%#SsKf3Uz{%X`pXsPXwe56
zzYpCbLnW^0KD#&6fD83E&vpGt>O|0WrHE@GCeQ)r#1V4pAU^=_JGnbCxURB*vUW4M
zq8C9ys0B7StnmBbC^rN~;lH*lkczMH8qn{fK2+?Aeu%-=1D6ZBHYBH$CO=8VD`lp4
zfJ@i!<=1ZwSl>hAD|>r(`2Dj8jwTrszu8&2af(dgCc86<?PbU~BW~pOM5$9*0WEGP
zvDi<aBHYl+`5-@RD#$&(H1TZD{E7DH_Mf^m3SsdpLAv5sKG1Jv+QT`b6^p0AwZ4rY
z8xH#L9(WKfUMZ0DuQ$3n()Ny7Z%qp{IK2wX6}a~E+negDXUD|hGQ9-Z@xK?+M?975
zwwwwj%#j0kCt!UGNW2HWPZ>T*rPvwqy+Q^xdwvrI4ElI59!^pbeIz?tBIE4zrbQU}
zu}fcytJg?Gc~{qxlAxux|B?(}!srJDW@@yi>LYq6ODjg!eqoeS-4?auS?_goIkx*6
zm2k+9Sgy-pUnR27a5(t1t`VP(hh^!D1aSt@@cTQShkIyOO*`1`@%L>`rkKq_Dq*{?
z*jnu^n$ED;J_=hz?Ibqh&XkEp`4+J2c@9E`-47X_mZ#M(XY?*J%*|~7c>BOH=ep`g
znJ$Tm^JoW?vL(TGkzQ)Kim`dbyLyDYqz@sH^zlDI8j(0LnCP_Kg^dq`Af3!fP0NW|
z@ypaHx{&v>)>aTR2Hma0_bWV@1pykI<#L(dd@^tKd#2lO^8?!1@f2|v=Sgny*vn@>
z#pqedpm!JPv(Gl-dJh;cy|75_EERF|8m2!dJoi+g`+`={k~=NGQc={YX!z)oyY|B*
zb$cXJ7Io(kn87Gr=SBS(=b`Hr(hcj#%KyCt_9n_Bhz|YhTOcABof<AIF<l0tdJlz!
zdt1(bq7l6=w>(Z#mj>L?GbM$ns{Oj6>DUjL*==Qq4>s?#a3Db`mN)PYSK2iM(Q3_h
z7}F&~@!quhA^%AA{v3(1Lu0kBg2p1PAz=Q=!3&IL_V|E#KA$=eEQUep1^6Owlbgx$
z0zH*OFhXo!5|4Wch_)W&mSLcet|U4wK#1|NSSL-$f=o0hYJ*)F$Z};doo=z1h}$?!
zv=?2R@bj3VWKM*k3R3#4h7E3s_w(ysArkV_+1_0+tTaDBNZ_)6b$UggKzXItnM_Y_
zV>9S#`M#eQj3IKVKj&$rzXFxT?%-Yp;m+^Nuv2kEpZS6k*oZ6^B}1Nz@!RbDLansl
zg3zdOLM}HM+Z?P~dQ}fO-xZI@sM`q#s(`)vvcEaNJA3e0EaD|JT9ht5N|%UNBEiLZ
zGJ_x%PT`7n&UZdmqF;n7R_`716)!UEhXm9k9@=Ne7p+?%PhRtry=-&aN_EUiP<l$H
z+~$k<_{|(sk9_Vc(C<4{t=mB^J_rVx43-XLiXl?TXS&R!X!``wvk|2E?e~CbSm4?N
zHHDS3B{DIX4ACDXVZ{=lUV3&Qi&x?CWkBEjbf~2R=5WE}J;2k)F~b}|UCe*!iM=TR
zwY+wkQFfk8zm^?Iv#Nx!Xqc*mINF@_?u?r}dW!C*2qB38KS$}plr`8O(r;Qb{FPO*
zS!{8NtD4XI&{&ZUhwhczX<%Hgk@@Qbzl<3_#L3p@*S>|{FPy{loJvFG4Droe3d7+7
z*uo}m>UfPxD>hyc!Nt~PMs|mD8Io%YitJj=2Dsh*kjH;_^5mcaW{QL&wzixfp^w(<
zl2Rw@$sv<Hdxi$)Z0lz0(6D1L6w7QSeNR<=`y+3@FA>#6SW5kgZtu;5W{{xYF*L7)
zi&#<@p%QYrg5jsDSUjbU6cS-rdc6s5ofNiZit@JWtUT8S?=}A8e-;ynF5q7a%8u5#
zJqe%LR3#1bUXEH?P-*z9>nTz=T%fa%^u=__jCOlsp-V2IJ%SVFH{LR8MFpt`r}VCJ
zZ`(lZ_qFzwR*J603sswz%%1P2E*0x<4n*B(L{K*rXAjY>hiFtP$vn>Ur{#j7rS*DZ
zQvJ@Bl1)=YeF+tr0nNOkx*cJnc|F3!%LZOv^b2>r^K0wwb^{{kMGt6LVI>^A=)V;u
z9_w8nR~GyCCtnkM@1fh#Yq6#wRyiy@+Qwzp&}U)7<1xP%MlO~6ncMah>AC5cu)hAS
z%|+)+vFcfUX0<P>=>tUCT(!6K(TWr*=e<^gT~juKa1a6FrGNCJ;V=JK1_>~6W}J_g
zLf=u!<BK!YBq{8XSPhJyqv=>VzTMFVDwwG58P@9Wr-&xU{|x<uZwL*zj#x|JOIU_b
zxaLV@*Mn=)su<s^Y1f!^ai+*zrCkaYTetN*peXjHZj4cLQ}`p^D$~P9Lxowz8&fr?
z)s|~iV;XO&d0$OHJbT}-Qz<b)KH<1l)ftTl@?X9;`7eu?ck*9<gY7>|w5P~HB(dxl
zHx9{oMn0BY^t5k{spMUjR!l9CE=<=`3JdHmn}wd~C2-gGh9cjls$CoBedkid7sRU{
z0Qb95E173yUHCpJHpW<Cl!#;H<yxV6Xz)M9)vqHN)7N2w`^!J_nQW}qQ>vSR@pR!A
zl3O_J!r4ydK^4cMPt6T}LVOH@Jt3T`jEda?-ogAeK}po{T%KGU75v|ja22FPXOD+B
z#=$WIu_ss~wFWgh@wRd6P5#K$G6m)m{y2r4*_lht+*RNOnbFE(LAnPF@#sq?B4Kw%
zE0%paVtCAA;`)Aof-jUGM$w=}OIG)|)t^T@WrT>;e7!OkA6OC7`#0Xsfc#&)oj)Z>
z<VOTd-V^grHZfOpkl<=Omrw3>mhON{qYP%RyspfM9JakoP~Co;gP~TUP%e@`@a*30
z!F$H5-Biman=8nm+4C!drqO!-Nunkgz|8{zN|!oh$2eKZ9-1$FbTH&M*80aj|7%P;
zwnINI#B_U^AxRagmNsjm_Qv2xE`9>*M{!2Bcr+sl1$q2wv5DG`5_n#kfT#!agXts+
z#-bl$BD@2`&_5mZ@l5lEV(>hw0==uXbtz(V_o>e=-Mv%N^p!zeH&3k|dO~B*pW-2i
zE`$5<&_Q{~=VC)d{obT-D;=^hW=i3icz)iV<+8KE!Jb$&BNms5zk{z2$#tEBpT-k{
z#Rh+u9|$(Kf~W-CkXwA**S$Pr>FoVhYK~|7Zu=|!+3V)Bi#^jRb{o~dD-bKPE4WHf
zAYO?UX%3&&@}Y3hBQQ&m^ZQU+009)Zj|8L>OPMcR9j73jA96UQ7SR49Ke>LddM@b8
zHIJG6$0K|oz4}sfwC)VWMSo<|uP4@HW^2w7wJmtld-Tg2njI>EhJ`BSf`Z~P^-8-P
zysuzl;LuYRx^q;1h<j;*Z`quM^Q#{ppD@jTpfQ>+D8bFaQ_hu#+MH@A+>1o!s4(_=
z8q3rnR1>^5Z0Z3q<-TFkh74%&qZ@ttlpD`PJZf^U3gT~+A592No8JtpN|v+Rnb4Ky
zm^9XZQH1e>LNd2Ai2f$EfJ7j%bOI|HqI0%H5~uGbEXS7~9F0$}z<dk={-otL+Z)S=
z$Ja>f?4(lm#<w-ox!x9vUhC48+gSk3<VQ5Cn7jhCG$ca^mQhr;)DA|5vAhV2f0NZe
zS<GuLpY7i09E&zl<mC8paW21Fh4AVWPRQ>9+V$8zE&+@kc~xV;2DpL<3N8NC<(X-=
z+-DPyL078pApF<V+A4(2A#=%}Yk^KP=X}MLz>!Y@J#ZG{U?L>Q(&7MoirM2(sN8CM
zQRo664{eDKAHk=mm=D0<EZ#R3NG;aS6ts{dBTOgjX_-OuJX+aprVQu0Wn&zfh~@7A
zeGpZ;65`*!g1C3@>Wa2sNBQ^5A=W416QmXh+jgecAJ$+9m0oz3QjtrLd_pr;^9d9G
z{4t<dS4-dtwmd>4tptW|y1Y+6wZvG74!+)1^3pcmQB_y>L~K)?1y2Re5$AYSpKUVJ
za>5oT<^%Ooh3akoMj6*~V}eMN51QwA3pMug=EbGXi?*s?b{|hCzT>+G0d4+dyUBj5
zJ&;AAXZDpe>U4#3!}Ep;&-Ig|>48WiVwZc6a72IoWB$D>BurmLF#YWE6sKdtCaiL{
zHs6WKg1N7sA7fmS(G?hLRo|Q)&-uY^LcT6eZlq@GUM%y4KpI^Me?>uJ2580Qs&-_w
zuD1+y?ns-O_S<SuB?h;XGI$MTYswsM?m3yzgEv1h@6Z>%0$u5%2XP+**iAhP@Hs?l
ztb!j)z2uIeySR_^e02h`tNvJn?x|*HotnJ-OWpSGvy2~Cy~7gX-c(fBmS$LP4J$S`
zHwRp56`m^*m>xyQi9oofJZPUCFt(^vWLHF2uT1a35OuC!Yp{@i8Rm8x!C(uG#tWo!
z^GB~Iub@up#TVCO)AP69GP;55SDri<S36l1#gq?(iCFE;0x(tvO1wGGzeBNQ9_x==
zy+2ugTWsH#gtz67e=Rj!`1#-t%7IMjC~<5W-9cIjW19L);UtGsTrnw$E_rA6|0-W(
z2>f1zbZ;?zfx}5L%=FV9y>=EZE={M44VK{GhWW5vc_L?sG^deGF7ug2ry7&tb+**z
zBHTIx+he|!$rh&lnx*MF`K9vHu(+hXGjo6LM9Sz0dVR^cUW%TDLaF!wcFk;sFR9(J
z@4ey_wO&w^j6_R3=n%q*Vy-SL*`%ktS~X1Tt$SvD*k-Qli6C5t0L5Zr7i=_D+?uWI
z$z5mH*@8M{I%ryw)G}yjmUSyrR_vLcO@^43{Qew27bNJmBub@DEjVcXBO@l1-^7W=
zOB4aK&Rg_xi)41R-sSc8qewVt*lw!VBn6Na!v$3It!=6--JLZ``qlX+7$z5Irnt|{
zd>jrAIwj8rAizV~rCceK-_gjF8j}k7$9#6yImD$J7JtlhS^4VK>JRnH%cbP*>VcsD
z)L5brSeSkHcv(c~!dGSTASf0=qi^{mwRP8_t(W^qu|gW(_U**G;7F73{A6a8tXBfb
zG{>hCpMt%pwxq-2O=_FoZH#8bKRvemB$tKQ6UQ9&$-M{LQQ4_RoWO8g+Ir{oRl4l!
zlh={@+ZE=KYl%aSbtt9ObueG1ZT4t!+3fO0h~>~jcf0xw1Iy<qgSuXfOzRBF@e*aj
zbPE<vd%r<JUFS8sglr{$%E{j^A1=hDwcvSo5vrK7JY1BVB;x%8@(VW2u6fAph;{pp
z<d9AJ5b?q7^}MnEbYXEX3{<8wE_teeewhCd!V&kyXeA>jS8Q%+Sy173!{fFTEjOJe
z26w$j^ySApo{FgGUcJQi1-~;dIkQTwIR7noq~mHZS#y|$S;MRe2IH|hF9|6r85Nak
z5Pr$!I=h3Y)7b@T?29$b6Q_gK1V^GY^gm9@pJ&GH6)#UEF<QdK%UC(0%0=2C-R5yq
zQ5%)Y9SCZ;k@Crb-2;~CM+a<FNQ8`{am-a+qph$nc_NfgQJ<|^HjT?jC$Jd?S#JH1
z08*VQmwLSNV5H+6hxvZCLcW#1+*1CtH>29`&7-TTw<s-^Bt~rdhQbeywT25rv$LOQ
zmI`=aQ)|sdjPVjJ!<fhTzwm~&B4VY`dhP2I@CCAoYIwxFS6LYK)S?gK4yJ_&xjtK~
z=dV1FD#@Yp4YT=W_CO@@#N@Od!*zzqw1@J}SN{rxHzyon8I}dwjY+4o=!Y`V@uI<y
z&Mt?kt%vJS?=P)Y;*!Pg9<zo^=K5_7d)v*}!*4}e&Sz3_ljF_V1D<S5JP`mFR#Pu7
zSKApFFE=Uz*^in>M}#}^D@K@dN3Lr5HcfYmz^ct;N-`O3w4Kx54=mF5XYWi3CmPO1
zCl8A&=%l~QXdZ-i!$)D>b#sYbJ~;E~o^{2C3-Y5Tl4JOCn5*}GxKpq8&kX{n&=7KV
zSmviJk1;9RP7E0(rH=7;)#Z#W8gw{r#8C(6{{Z|u0tg9paWca+aGj~ikF+!#$&E!1
z92icy+`z!coQoLpLilO&vvjOLeg8!M#G&I&+J#r{NY~kx)b6AEP9FzVaIc2dg|G6k
z5WYQ#P|sD49x_zwa=p6TduYzr5mx+W3?q%ZN6mF_)$p^Jym^=$p>96){+`U|z>}O5
zV_*boH^)D2XYDPuFGRmuRU?0y<w)ju8q24Z){^6PI)TiSkA9FQeIVhung4MsWD;EU
zNWD}i+vHZfcxIYV{F61*hQFY`Anq2go?+HG5&E%l7C|+k&&pxEOvzU1f|4*WD4uTX
zym!Y2@GBCLG@o{`4PQx6Qs6}lmNuSLl-3st60s^2N(Mdt1KNJK8Gi~IQW%^B_%hxi
z9!l-qukcD}BS<NSn;g8EQdi&COme3!!)uvVq)3fEb4Z`P^V;7WP{t|QFW~<&Fy*XV
zQ2EQ8QuJ)kOKZN#TTRT|!0$`2ZHd09C&CreYOUu-txW>@eDzqG)63np!v6Dm*uXDS
z2t1eD`Cq?%dnBc*s;Yu|Y}BMtwI8-y{jS0J=mK^3U3|H4B6R>R8~>x{*#N!A>tC);
z{`j7q=E5tB7~}h@0ksv6VANInquB{!M3E9RV)Szww7hy^7o5BLpz}1PK8JY%0Xi!y
zqhrV80@s?mEC1%ClpyuB{Woj&hw^Mfo;D%7YFoz+=sH6-y)ez8!<=$zF??v#H|5Cq
z;TIW|TB#3qHZ9q#5>fBPN6y)p0K6B%^7)aD2Zr5GXt3<Pas3pHne?4WCbc$mYR0xc
zt__Cn6gKD$<}_+nY|?inRPAk?Qdmz?wRoeLH@8;r&B<_*YdP=b)15k8T||E*Xv4v|
z3M+9=hLU+PF_!%);1R=M+PIr1V#eDg6KTgarQmjnoeu<ic#Qjsv8=Ym1Hs79Zm)>E
zV^u6{W?<dY(%zCYR=eQqiApdv<Pb0Sk;C3WgGO95IMm?Mh8#L_D!#C=phQ=h_Di~h
zYm6Ra(ILAl!aoG^8?OqXxfRTGf+{k!KGyxiI_thD{p2+w|7g08kDOE+gi}-V2$5G0
z#l<BfJ{Q#d$XC)i$c>b*lqC*6b%#YA`$!$Ke#vgL9HQ{~Raf25G(2o{s)qC0;k5dN
zwBW9z&&u|LXSp#<djdJY=!=xFXF6N0hk#oF#u_F#vJVY&r*tlC1_xZ<A8|*Z!?8m!
z{a8EN@0oQagbRZ64~ZH5b@-uJyl6Tr9^y|TNKBEU46EdwXtVBefc!NFf;{CKJy5a-
znsxp>0RQoc2n$%@$B<3+eNIYHO(3^TbHco>(J^wAR9C@y#!snQtK&ORY0_hT&2O^S
zt3hnukgNI2!P;=-hqoeCR$XT5`9$YBXZpG)%3AuPGA~}q7bHAYW9>_uHm+ca0F$!q
zz)CAqbi_`6?a7d{v;S1aDLgP9=c1)ia+)g(6o+<GYLwhR1<t~DBP#S~sDL1<C!umD
z<dbU1T(psjZWr7uNPpTiI9yk=wZ|4M&CTTGCzWL61jv<h!#A8|BIh;#pThW$PiO|e
z?Wq2x2CQ3KJ+u5~WnIz;{IKb$3Lq(j!R3?$_L9G<t@g7)P0s5XJ^`<e`J*Xo(_OU!
z#kmKu$A>n-%%)8`!O|w!8FZDri;j#h{jliPhkvOm?5*>dg-D)gSL>6$fP=2NLHu{!
zvrRzy;bt9$O7JL%;iaWmV){d-4SgI?f9}C<J+F#QrH8kO-$A0K`Gguit0v@D*23}`
zkjmcWK|4Ch9d*9TKEU#LT@Y`qoMUn}Lt0*>^VT!vOUF+FI4A3SeSv)X2A(r;YY^I5
zI9efkJ@K6<ONsgpi)D(YQ66*f!ijVWHM93|xeO{Jo|t%U*47?wOw;$Ne?~7n*%6`7
zpZZ*z&z+!`ziq3#U|5IRp01SdFi|36{r=~%H1H>Of7<Uw0Zu8wa&k~HU0eRrm-qWE
zTD9R3-~qG>kwa&|h`gF-flkk$P{)Pc6Fv9RzWe&NqD0-Ni&fh`;aABC4(CN=Srqr@
zf2>?D8)|p|8Py%E|5I4EpWw(LE@r%V&CC)Gwv_0iua8W)l(blAr?OV^%GbhN1+mqk
z8mU3QS_9BeS7Y4;`d*=^wLkOsT|-l+vSKNJ-;z2Fk!P2d^M$TwL3DdiA_o(fFgp?2
zAS7FNQ(TKXC0bsus-<O~pfFC6GG~c00tFV{U^HX6$RFmU9Up=NDNpHs`6VIuEwn83
z2K6<*x}|^jqBZ|z+wMVL!rkoKg&YTqqv4diCWVyEz{xhK))32AUt`y024q0=hJ?bt
zMnNs$En**yiQ&gUj|`SAn$}OcbKq^|8ebqK#5wR|U<O0)zh1o&-|2G(wto{J%&qve
zlQ)WWJKN8zn8=;$&wB;WkRLt)F5D)dY4==-ux~7}2OH-xWYelkqHIx_aUoVh)M5qH
z9py!XvjQ9~Yr*4lq-(zNGr+DmZ?IL|{V&$(@6c+7atk<1+hjVsKk^A|Wq-|8iz_HZ
z4D8K(5|Gcgqs{8R4+#hT<>naif@6dWrv!_Sk53c&17>|rMn)!lzf?g?h9$Vy6z~3>
zr=vkb8Ys>bZNtGMB39_fheZ&HiM6?DFG9Py{~}`$`!}H=LqImUIwn!pzj$RZRNESp
zj?m7v3%o|V9<{V2NboW_yeLeCi`z5E(4R|iu+d57P7r(}J&I)Xs>|ff?AV)Ti0X=C
zng6gTycCdDXsq1`km@v0<MeA+N8vJfq4R@ZC57)xm(&-2MQC!hkdA@><NJ5d#w~Jr
zWCKpu0={Pp!FeL6zS6%Uq;D?f>)XHRn*|5OL1F~lC+KTW1y%<IbrUGb@iX}7>=;N4
z+{mj^PwapqW#n>YB&G31x#Z3E2X}tRl_mwUaaF69(!Eg$?s$-;IR_V9N)|o;6<RF1
zw2|u`J=4H7oZ2^iLiiURg~l3x1E(`3IY|e7ettd?2Ww6taE4_mk<$fXy_(e>&ahWq
zrzp$7mvN;JX)*c?bP1~I)I&&xCPPSYA>60kAxl|uAh4G7PlN+28kG4eD#b>e(=klH
zM)?+cPGVY_1Pw1hKbY;#_x}7Jx1V^EFutRj0JnAXeZG8EvC;IGa3ZsrBoaL@-rgG-
zoiTbZCGr;02nyOnc!*?cg<=p8yr)gqE67~@8Et$=F(Bn<24(6*B_u*i6%J@r<p;u`
z%yTa##joFDJ@}F1e{-&W2Pju2q7=djG&pXk%5{uu$Jh@ja8D;(S}+@@>3z3AsLa2-
zHw5Xed5(G6Ecp8){)@ng6mCz;Cp#Fk2{<CN-Wy~XVDQF-JA52+2MpkdLX06CwS0Na
z%HeT+{!^j;JSg))K(z#jSgkq75P@RMR9wI3tQlmJ6BOeg5O-~Hi)n9Ov6q<`>R%T=
zfqo<Yr65ZC>)_S-10u9_7Tmi?!AtZE`UV_bKXAvu+|kCrn`w`t+jsMzheW}LfbPw|
z=Q?At)|Yj6_j$`<Zk{zpp+od9k0J`;xK+`K9UXe`J1*0Z&~6tLZ~r11XfKx=zu{Rg
zY{{P_<3B#RqCL1-qW88?<0n#=#wu(gGzXK56U#fggVtVt`>b&fB*DMP@o(E}E^_OQ
zb0n?9fF0jfci}CX*15xR00K9n-3DU5ooGM!yNv$aNg}l7+a;pa!?A*QVXXj5?91m#
z{!6%J?7_{m^y5QZ|K(9GyqmXn$)YX1?)oR35YgZc;{*PpVrUN`Z~TfzR>E$`|DvtG
zFPmTGW{G&sI1t|8U6zzwc(<z#mIm&s5z+YVvy3nq(f;L8Xu#Os82n9}VjLjuMpJ;*
zPT>r{|J03eAq9AEfa2kjyXqbB{N=!bwe!N=QYL|8l9})5yfYIB;J8*?I<VhWBOUdd
zXC)Z(-~U%LUPXFy+<Wn54&8uG9n<m>jhZsvHApVJ+Hf~i4r<Qf8RA`4`I~~ly}n%{
zoE9`5c$Wlqu*9X|WSKu12T%zk#G7Z8NVW6+%cFRStf6oCeAQgXt83Xbz`#MDNqxKP
zKBK`Q-6Dl{0;-<tU(Ul{g-87KW{D`X{w@L{_gpP#c!`cDPWM*ss?q;7>fCeHZs>UU
zmo0K7zQx3Vy{4ysJ2ZFyO5|~iiNp@*X3GE*O~4Y9)t$KkVEp;D|4+b6@`AKEjf|83
z!Y^WbTNE%8oV5zcwjbA#)8CZ9)dgKtCVGGWx!7H^qh~jk=yL;2HEsa{e^K_||Ko3u
zFc-Up6N!}d`{19pl>wY6fAJ}T^Y!VZL=Qb7dpdz|Z;$`aM-T<Wr)On|8Fa#nNtHWg
zWZhr5W!~<)`wZ{@c&$HQ@b^#c61QMeYpKNc02&RB8ffXa6@+jzUq31$;ISp1S{h=P
z4MymQRVc|xNJvCJr+NB1zi_d%<c^N<rXYIw9?)y9#ZNW2kdk$uuHc}D$_=yB3$YJK
zi*eI+_`(l2m=7dWYmeR{V9VH>pu76^7li>vFY8tpY)_wCn86XDwF44g7Izcz9&IMy
zNJGiwnNA~lLq@Gd99s0ue$ybM6st^4jo?_W)71f<k>!u|x>}H;p%dsjk|rFyWXRJx
zq~X#GyCrQFOrMM#a&PwHu?^C-h5OqM{P|b&m)GH?%tjRx0-m#Lk@r?zvsiof8|o+`
z(k8BB32}D(@+Ag&s~SG-3$9jE)VqiQno7`Lhhn_HhzRg$e`vo-B?ccBVfpk4iogxL
zVP*M?{R<}XzPhziOA964Ux;0Jd2gJuECUqOUS2avNn(A)=k`LS5tvRK&+aV3RU600
zuiJW;Qcndo)k#hG&96`w9<m!I(U?q4@o!YZR`XW%M*5z&dEbMCpwXtVyGY8saU0l?
z5|W}Q#3)fD4AhFJ@830VM1^pI9wK6v_01R$2net~Y2W<Vt13t~lz$d28l2iKNPbV^
zrvNskiSGKxxF1>An8ExW2O51nGv`ePq`Ebye;3wlrHDwL%BSw(d=Y5+O{ChWayKF^
z%JT93mk1ee_N`GASO~C40P1B1sh2vkwGw;nC4!I+@B<LX+u~!)LLyx+xcBZXvb_t^
zAY&#5QfNa!lG{lo>?J1DuGx)y1Yv6zgLT*7{1tQIJi=}%P(&|#n;#G=`HfKH*f?1s
zn_gqkoxJt;_wW?k^(75UFmK+P)BDRpHHoMhlLZ%O$ikB7+Jf;zEX5Ej1^zejkr`Qz
zJv@5g@dVr`t{PBWIB1bJtcdpP^RT$EC%%*@XO7)>7RpPc0R3hcI|}Hl7&yOTz9LYY
zMYjvJHi$v{w}r;tE_AS$v&|nYl=NnyQEZ&sApH9p9V1N%w)~ZE+hzFRK2}3;>|G+_
z;m0eel76tY^yYAuLhUnjR%X`y!B1;94)AK}Gu(euBcWS0dXnTAgbM);$$uSu;v&Br
zPE4mr4*B|()QOP(E{BDC;d<+b%gBdekWsCu@Z#6sfI^BiV)(zHf~zdnEqDAiwiJWT
zOGI?zlDuT}hIJxhb#}!7XMoNZ9+vzC?bz0w?%mz|L;(<qoB_s9+)gbHPiB-**1Pb3
z6Vm%+bI7I#fEw;5d>C<)g5bv25&hzZbampG_t#B?0R@$Mj&C(}8Xeyz-mL3?6iX*Y
z!+VzH;S0D`HvDzKI(X_jU_Fza4T*t`X?T%6H#Z#2&b@l{<*sYtDvRwCME4~0#|imu
zvI82){pKgNrQtFERg~DbqFlwEv7JDlMaRI#Ca1)Zv0;{XzXw@Gf2}}M4LA7%h7$w{
zL7f0HLY}7`IlfMWG=JGjMb~VfhrXR!D)In{cfQWv&3pcfu|dndwSeoI5KD>H_2<?z
zJRoJ<F@*y8PN65RY`(W9PTchzW?eNSE34~gnW0W+gta+mSKJFji4FC&pJ%a09Zyee
zTV%d**L<rp@(uy_+7J~6+xNWNQ+#3}r)pa&rCwuuaavZaeW{_P={W2y78CK*)^+{F
zx}uN!Ig#178|RNu|M%QvKA{C3v2R-*56gi2Ri9LY%!9kDY|p$tBwxQixQ>^wC7BV$
z+jm^NzTxi^6}rLyvQ8HlEwE6jCopcLAkNB3(rhIzAyLv?n-d#X6(lAtR(@u^KC0Lm
zNn`5yQ(kxQGpWvac>~j=Oo~;u@)64W{(Y0+m5WM~{8|p%RFS#{?4zl1euJT0W7K#q
z`^=|W^@F3W*>ZF1=5ORvE&bPYN>8X2vSsCdRyg;XTwe4|>z=Q@b@+IoMu?dxb9zYl
zgy9E6m>DOZT|HiMhGElMZ?+&2<qZyV#kN3kplJ{tasu1V=46?iu70(1hw0pN&4bT2
zeb=M){q(5xpr;1D?NIlBn^qHdonimDDqf;@^z$h!3PD7@<Evhuc9WMhqpvJyJr57R
z`kHn`(Z**uUp4hsZaJ%vzvQv$qk<jqLf}9pILs9k5*{1iwwy1@JDIhwN>QLX+4U#i
z9mx!2<4)j3f>thc@-Kb2<6~hIPEkk8b5Yt$rLQl*m4aN+9Q1w|O079)3?1nQ16y}%
zTniK@n#Q)n8JTzgG#jy<qQ&T+JE+e~gtj%i%m$K$P?QP(gYe@gtX^uBq7d}OjU96q
zHoNs~8D{JVe0HPsvTWU$Ns)Z*&q~GM?pBZa5~Wzh!lP+t8KuHkx~8z>rWxXqQOCyw
zhowUXZHXN9A#2`fKCUxwTKy!prY;iRZj7bX;IY|_f@Qq@+CD-?@|1tLP>X)6c2CL5
zswqYm>pHTC7}Ej|eTLkA*C}xm{Cx>1Vg5ev|BdEMU84X$6$sPn1t&Q!)MAjYV{+IZ
zN~(gvgni)}WvhYxxr&d$wXeO2j7H1%>}#}*_^LKfAM1=1B<_xAIiKPYE+da<SR`^D
zj$$4@2jds$Ko3dh0Tt{UA{G2}1OY8uU7-`*miuEhThn-iN7uUQhz8fop!;s)CRMS%
z_#e>{S0Z${ulB5V(jeM6Px2=2&%ODNPa)QTvR>CcuoziJKQ}VVa(n}3tbPu_W9wcL
zGda?+&(T<+u5p~2VB2l&Z{<F_|5l*PfTgPiwW2tyUa!X>mT@6bgC~F&8G32a_1goV
zNC+tJpEYD?3Gv0mMfBI1B8d3^2lAyw)5uf#urgVb?D%G2U?4*x3kOiEo;6<rpeBMM
zLgU6<c3-=|9NXH%u59_hhHObykS)wMny!~R-0V3qD8+S5;xV>mK+{-EEta29gRonR
zqBTEmCw6A#JoN&|#=6BxrFqIPCN5rlSfz>)j=^=BGvqZlXFqxXl5U?JwPbT6G|c#@
z#L5rr43Fqewi=)a&U*9sJwv;+%yZJy(~lFh^v+T)@DQ#I59J#aN)UD;x{H8t7_Pjv
z-f2r9F)T_)l6hTM@i(&d$6sxgubDeY46~;>o}xsgdisx29_3d|g=jfX&U{GiilU`V
z<Y*f^0L@<^puUhDv{kOq;b>ZhYC2`ept9L4rwnAWq>`k~heqWu#2FSu78O0yq^0&a
zpFEoG3|JWmATpo6bkC4A;u9;mv}fa%mL^Lw`<5NZsFYo4v1DR3`I;tXqDJ33O%pqJ
z(x!xS-%O&$X(vo*cg4+?z)?ZS69IeSOSz1wq(VU3gu)qpgHZ@P=C^UaQMwO1pe(1t
zc2A2@ulvc6(f?uX&BLMozy9&El$1~*OO{HCLJ8Toq9~GOY-0!s+4nt!QphfALYBeU
z#y-~UTe6IO-<Po)jOF(nEuZfD{@(BR?~nVs=IR>6yq?=RkMlT>bDm|FtE&xGvLUQ@
zE<X!ZI&?#Q*y2G+u5i)2g#%&!LwHYM;}k@TC1@<DZH7tEO0DjLo66SGz(UuY{}>`5
z9K?+RR*R_{xz)oMgr<2Whkx{4DqBV<>{R`EeGFUPBxqP1R#Mm<al)VOk-l;gifc$A
zR&QUUd`}K^68_4maeI{8q$SpBz;yHKHNm<x2>nTNreMeTmT+DZH|}{`37Gvrp?L)5
zl@rZFt(Y*u!r|$dnp>Lu&C3;s(;2V#Tlrzl^-K!r8j;~{G*H@lFPUUHYtcNCm0z2c
zs->mA=bEO!;MFol<eBFUI_Li<^z!^;0?&G$etY8|?FT+glDthZSk||1WfCj6b?U%!
zNW;;7?S5d0>#_*>!_5A|{>^x<gBB8W`GytK4ab8Wy8#Zw#)ev-inqQ{J?bh=IOkFh
z47$1u(&YN19P-z}B0AjAEXWuVHfYiheEKrvT5FOvYS*dA0XN9jFM122lJ*=+%a7sh
zD_SK_saTNiPUn|}tD0)TKP-tI?kZ_B328J%l-?J#S$qzPcXOnC$mm~gC=pXdUgF!+
zf2u|tHdKQ&6r{*tcu#$6F=KL3RD#NCi4omr*|U@=?Vrcr?N>20E;wh5+s~?dl6<g4
z_5sLN(wWLbzD>M)hU?-TAI@s#P`QpxG_q4vx1GJfMgw(7Fx%QaXtn2<N}N*?>EE!m
zpX{Yn->Rkgkz~Y^7)a`YfaYnG*gE%RLFyUN$ixmAny&Qvk`auEv;NBG@{)Jhyc>AP
zb)f%8xQ9ZB@2-o49=5IGzWt5(j`Mqn?_u-f&U@$-hCHDBhY*_L9^eJ5o-h;FwS`v^
zv&ucfM#yJvJMVq7oMUvqvoXKBgUakydLOItpa?di-7{Z^i+ypaMVSgyrG+F|wC1w;
z*vyF<#2{4DVtFU7^li0^St)+HvsURvuFi3sCU<~Zjbod$pt^2e<#5Z#3NmqRYpcXo
ztZB0G{G#c;X5n_+vl8VS(0uUgSL7<R7DK!1DkW-?#19Cz*uOyqQKOWe-LdUr6-k3u
za!-o))(!<&CS7sZ=612nywbgWtg5;pak3W+MMmHwVrO*bp(3B@;C0B}vTX6H54~+j
zOUzCV=&;yw15O6>&_Tb>o5wDto9lP;kMwfzL5k<;iW7CEP6cMGK4AO~yL|b|<k#qQ
z`T*mw$@mP%Su~>JV4Nr~-erw8O*t*sEEvEIgH0&g&e~Lnrg2xO99MCRQ8cfKkIQCv
zguJ?Gk+yw_gm-oY&Mq0m+YRJB2X@QDtRl{vA?Iq}4?u^V)@?xo7iMEWGsL@+rOK^c
z@G7mdu1@{PN4sYW46?_j<Eebs|6)^L{;{c_xh`D;VgLVXQxotBkvG7n#=<VesSJ3X
z*a{Ol#3)8@!F8%6e^eamI1db@7iLvG#)?}cmeR?2?fNg~I3Mgoe9q1r5?QN^+Eji{
z*zzlAywP}W1Q{}<{l(!FM}wnPm@1OsReQvQf_&XB)LX<i@Zv39U0wO1@XTm~jZ{kc
zKHIi()pc9J`2JMYr5BFdW2$yW{>a?L&>PDap`NT1839;i$Cdluo||wLczu#_H~r%H
zvikw&1dJ&$deI){F)ACD70ed@${f36zpPDr?{na7&TE3wZ9>Z~eL2>pO3U*_Zu?G-
zGqHs+e5izKbh`-l3ujX)&?PdtYXQks-9A?AI<Ik8?!u4G&ZTbGZr(4jEOczT5(fcS
zq!@%>XqnffCme?{(TzY|Dm9)pfsS}*E@+{~OKl4X+wD9?+OqJ`H!iPrOm$9~7!aj5
zX#e890I@?fF2W$fMo@L!b&mUA)4kV}39D`~y4+76ae42WKI9c<JKq)dq7{Q2P|etG
z($L+Knh3Tadr@-I6Y5omF?C`iqaR`=qaQS)@jXM!3>v=X7oH?z<lI@GDlCM#-H;Dp
zWymW8Jz;Muh-`j9q1=W9i>LcdGAS(6Z7|!O&=fZ~xOWYp+HB~-tB#blzG`CmXapIW
z*(Cdfr^>8THr1>=`cZ?@Nlnc7+K(J1NNLjU8M<x1s!<M#MLN%e<rS8>fdzv=S9+mb
z(yV}Tf~qVyp?QD4B50{IRZjno<aESwDW6B>vo3bgIQFV6^bknl8}xoZ&WL+TML8C9
z$L1Tn=iu^U_m_zhy9;QY9MZek*^YX~QquuG+S}v$+e2BSg?UF@)xoPH%OwGrd)fcO
z!+j_4a3Ggy2iY`nnBe38h-Lrc&3@T1NeMh~=oVk8rHP1;Pa#M=#0(i`5)BLpEP=*l
zVOCR315>(ECu!kT>9S~@uO_pFY8~T0N)^PMV{oENO-dCiWx2t^n;Us{b13_fAf#AU
zK_Qb#XWLm^diBQKa<l!2s|i{Rz=7g44O=1Ry|In7we5+e#a+cKzRf)qg}nnyaSj^n
zFqPV2M&Y80#bH$QaN8{Z&)Ig(d`+*(ta{=MgE3P%&aXNB2ZUJ-Nk%U!+a=pJZ#z0F
z@k!LyZ_g<6&f>z<{458Bu>LIkiz<yOq9YL&c1x4bacBtYA1%8-K;LUh58M>ESz~F#
z8ilFzcYeZWwpU|hJ@RtsYo?a{(x%<!2U?~k0I#QPjQaD7yE2_ip?0XYn6s~9L_Cy^
z4==iX{$){Opo(>Wac&fme<oW;o2TWU($10(e@=F`V0RWvtC?ji>+QKWDA|P-2rL8u
zE&<)JiA*PKgb8;iFNI4j71d;)p#q{m+CsR>H5D50_N_&A!f7#0=J%qwuB?h4Qj3Bd
z&zO0nZcY0g-D(HtQu`5)XBifhin^U?Ol2nRn!Gn*TgfePJT;g^2#vg~{5j<1SE|}s
z5<O+qK-t4hD`1?_`dL*&m4mai{0=G6h?N|f<ETdn{MN#4cICaPU@rYyKZ82s()6Kj
zphI<-Y{=Q-P2RP~Y<x-jnw<J15Zw)dEfAH17GP-7bgbp>b_pitEGPZ15X-Lhm!p+8
zL5LD2f$p-}5OO=g980?+1}Wa?{{Zk#iCZl6^suL+W3?XG_UGToHSV?_FL6Q?e#|Jj
z>_W_AUX&1(|EjMa@xG3iB11J<1>TvCUOiu*?Ce6*7{OI>hEaGh%lU90tG_v~@}r)V
zga%1aEy%4=^ptXL!2I*jjDksbFFLbZFK^9?EZ0e>XKjiz=<KD^-qQXYJ>N6*c56IZ
z*d@UkaKZ9J1mkK}tJN~<7LXhD+YK%D@fhr^B}+R?S7{|C$|Xp8`~4{2x3=>~P<dLP
zBT*G9PuffVvDQ(abboc6GyZ1qb7DufCk~o!`?g-dLeJi!V7NqeOUl<j9|!0`*_nV8
zsfjjudDGAvN~$F`0!FjtxjBf1Hdm&S!9+ut0OI~B@Koq#tJxKa8yZQe8;%CAp@l}B
z(zHC&lbc`bSKPvXvM*-;C)1w2;8$L8xElSzT`xm;5L}FFSMy}+9g~n<{@x}!o{`1_
z0c^!n6=J6uw>!;x8P2tJV*E|z`_AB=Ygg?2POugTQ60B~RPCHy3frtMuf7r14>K=W
zeNmca5^>f_4{6-ySHNTF_6qTQVUgPl7+($#o#m$yP^aQSM~GhWVlKyrvr1x-mq!j)
zVxcqm*~$={8_ny-46ZspdZM5d&4_3UgM-ozg@H}n)^fzbzLS8f7O>)BX|ZR`=zse!
zG$*v={&ZXHE&IWahnTXw94J4yGg-aREOX$xpP>pqTHf#YzlfI40^to@by5XBcrE4X
zds6h-i}#eDpZ+FjU=DeW(3y5*ZHr(O!Sza=3t(%I8!C08kJB9*vLCrpIHcN+;jx{+
zkfya`Ts$3RGC4XX^&<r>XXl#i7dF+H5|>lRChwq>uEB90=DcKUS8N!Fv6`IKbr#AS
z(ela|Ca9X?<m9>}6f1lJMVEsUU7shd!qlg!_PDOi%}iGRNM8C1G>%Q#32cylTiXpP
z5>*Z&c$jCm$#!;Cu4_G?^T0kox)SrX)x9wiEuVEWV|S+nGl)%S{^hC8QBt!wZB7@N
zi7e_p<)Es!ogd|i%)nORXsPj3iF>3#43G!B{x4+hLn4Az#sC1ON12P?Mqc~h5g5rN
z6tLabx(KU&I|<Pa5NKuLkM!_x_L$)(Zrw8UY34+**;dwDS0^S5N8C3{$YEjNf~GJ|
z==jn!(ge~>MaBLwp;xlUI3KP*e{#8R6Hu>rT)w>o>CC(ZM5;yd1rDwI02PEp!2H&c
zCV@_9W_Y2v#hB!SB=ZW7t$VQJGtHS{*745eUPCgz@=&qaVQ0;UnHtEYbWjD}v^FIN
zjgAeoJ|A)}SyPKGu@zEf%Q`)BxCgDP5UooziG0)8ps2UxWX|bStL-id@s97_QNhe7
zLv}MYHl>Za)BT}^j?LE`O*i0M1q<fwqS!B5mOF=w=`gn;X7h?oACtViA@fQdoD1B~
z(ON8sE8Go}Z(uVd5Ie}HQE0@0hB~95LeIZFozo{S>)zvu@*3d09{1>oHD~+u7nS1i
znJN{wZ09((6Eeb_LOvcb;uf)uVXN?vN3Y@~7n4+furWf*fZ^mnEDTX5NPe83_ZVe|
zKyR7GJ2Z&~8i(mn?J9F2*D&q$Zn=d+?#<UD9S;e~ANgw<_e%xD-{U0Qt+*@`$Y?p@
z4SIjVluHXEw2|B2gK9uSdfn1yA`?-1t?ABN<td?@Doxq~MX6LLR1r+*%rJX4h5W+2
zHO&_uI!N+MF#w96#6|#dWZDy4a&;y9Y&v1CBM4a}zhlK#KDWfICNK!wJY`DX&uZ%f
z!O!BvlSgtvoUz*Z3tTtc)5>}i@=&p%F;^|2LUa?#RkkXIDvZAZTjX3B-Q6-JI^MEo
z&XklCIhR7t;7FTlqxRVnYr$gEP<9oKalr2&@kHwQgZKRdeW&21OHt3wNbnR6_T?Yb
z%G^$p8n$<u`sQ_KyXEl7u25lXErz$|9zB5tp(*i#JLV2UCg?1vRl6(s?B!(;fdCEI
zZ~kq)E4i-f53%z<qZ4s%e0fL$Bal*`jz~ZR1Ov`v=I&SEBeYV^21mtBcNLrIUuaQ=
zW9{BKH=bQczs-J6&>f?-)2czW)ew~UY-{{|CY7~$7(7GeUCNW_%WzfKnGzFc+$TfW
z$3v)MRqFC9Zv~}H*Ez^9768co6$+{=7c!n&sKV4w5n*ThAZ;9q)x%S#IAR1%>gt0-
zL$9JW;BDI0tw{NcYPKuXBw0!+ad%DZ0!0pJOuDCT^su+EX?cFn;$SDIy(4a?DG^|^
zQ1L+<$b5B>=@xr(s7cRY)(6B^6&mG_dk}|;1*SL|b}e;9y1PY6P2smp6ihq6`r{cQ
zXQ6ni3yi`JMLbiR3+U$Y+S9D=2L!?4QS8xthX#dd-?K@{7tlYF<t9@$7p@9klQ!;3
zHFeZZjGpXNm}#Dg=dx)szLL1mHan|oA>y0<h<K#bPM|nFPZQ#2sL4DbC(_x6XLk)r
zrG3E-S_}QPyUvpv@s3W<!PS8ujXF~nz;bP0z?ZrS_e?7mm(P>+@T=EeJY;;7bATBt
zH!Z!n>k{<XahWjwFmAngU3l1HsT=(;X7h;*20<>i_f+(g&<LvEP#{aruz0J)M5G^w
zWx8H*uoW%iY6bx$t*PP`h)F#-Dc)i&He!G%aJRc=?>{ur|9HpTj@JZ%-Jr_0OKTD~
za0opRn~5p)5s8(J@Ne<_WE?hTHsmZQp%IZ#H|_3A-pGLxcF(Z%r$bI2;FxT74@&Lh
z&oF!+xB>SEZ8jdwv{_2WYJ5`7d>Y*iQ6;ESfe&8?hHkaEnM}0-TYbl1Da;T>>?wDF
ziv<MYwsp(B#Y#S8mqtT}mSh6ySU~$ByMB~uOq#fbjdH%t;$Z73YiHaml@tP`aU3Ad
ztV@cRe9bIGw5b>{#@@By&tyfT%FVZTfF-vqlhJ&Ej;(*KL<QV)Fb*T+Dw4Tx>0gG$
zT!js#iA5jfOceNjNe5@{i@RQFgK&gDa!`w`pIIJp7pLP#4J5{q66K4RN4ng3sUudr
zGaYTK;<M}<$Pi>^Ib<-Tu)woOBkMm@TKlN;>l5L#j=-D9c1~lRx}4!p4||{mi>DE=
zdJ*TXAXd4G6~3F01rnkeb~YiYV;;;DzYnO_D8X~T|9LL|FbN+Ee`-1|^AA3KqEYZ_
zDP{#wmkrnv=d3}v&^Ox!7C^t5(l~FtjYyOUoV_+90)lhAA*bR{y`!3`bg64TZy_Vh
z(6Bv*1w6S`-K>8vLCzhW(WlT*M7aiM-V4{s(9OCPh>V=RLlSflRM&1SqviMw=AfBt
z19jk57}xb7*`1fW%7_Uw1R6|>k#T<7=qjm+Ht38UBp*9IIsU%c5z3-QW(7^)yM3dB
zblS#h%eIvl-KZBRG8Q@msyK-shXZgzAE9mascdDu(KS`YcO-6<Hcn+i+MmvlTnway
zHZXldz1<B#dQ0p0{Fe6oaQDknOiB8W#W-Bj!-Q&S6gwy^5U*3`AY|G$ujo+aF8Eyb
zJpmpnd?=i#ote(SgzigIk^r4p%vtzV5M~*&nS!b1r)gRurkX2kc1z9lr%J4s5QSGV
zO!T+kDz@3)GoG~Q+r?53wcv^`WZx+haQyT~DKm89NBr_$Y)A-CY+)Urao1C)O^3c2
z3BcOMgZyJ)yB(b*MBH_vE#ni@qjyST#g$C&YGF6SAWjw4##Pi&2=VN-GHm%t{glm4
zx;xGy7KemCa%$GKODRdVnj~3)C;X`Qn*tnVh}X9Ji_iG8@PEEH`4}JPB~_}m1zhKr
zfrl+Ng;m`5qvBw{aU*RF+mo4VKT_c#(0As=loNv{pLtHTMk&v%DPNknF^HX#o{mYb
zjkuqjDjadUEg0kO_NW*{3g@UUv5FmTgrGm>-yXe5)m6q-Jb6x_opcA2r)o5uYw#X~
zWcu54G@&<HBed<(F6|B%npeE)+lWA~1odN+BcRu6-_zt_3r)~wJ2UZ_v>2gMe`BhO
zgc|97k5N!SDu;DwXF4A@<jTY8dvwrZe<6q0)|XeNw^yxf!<t0Ja1()s4e&&1+^ZB8
z8{%sUaaXCbiY^Zv1D-DQfbirCXBTbSNJVCca)Z0fr=>en+?c1Dpo?K|fTW9>9jGTg
z82(T{0-~tJ|4B#uW#1Y;{nS?&27Hia{!WZR%^Xit!Kpe&8E+aONqG>*DDePOp@~5r
z&>!L_Vr-8iWp{I@<Ur=2dd6^hpcE2yx3u0+h%Dg--Uc_&n}67JS^*a&1pB)m7~Kkv
zGjlz!Dquo9wl18N^Jao=5>p!8*r8WnhPe{T&O=JXBoxkEIMTr^72uhZv$pfayG?=7
zVi`1Eguc0h-w#56!hTGQ-jRm#e|6eGlX+CYiq~XPtPngPr3n*7Y!pff&CShi%~t{m
z0MTBV)C*6%IH%^ffir}TZk22%!2pJwVHC7^=y&19^RA)pZ8L$Dk>iO0k}pqxa5c?W
z&U8YZtTxfBYs{bP6q#o#T6S~X+POwfLioEEfZ<iaJ3q9M6{Z7hQ-xw~*jXAsDq3RC
zFd5uddt*s_4=%|u7b@hK(V8ea0MeRC2}fnoLE_BAH67NMDPj_pnsxq4RQ$C<KNWz?
zGe1=YF`Bt2i3lEje${6cEavWZLp3AyE;xMv>W#z=7sAVf$WvS?9x54df>D~2Ti*k;
z;Bi`u9^yf%*m-)Yy7B`b;lo9qI<4VDo%9cR^E^&a<z2~l0q^We_CNyH>N_dT0vZZR
z@%TZNV`$0ePzHs2*9HpABgn;e)eia!p4eLsCtkihmEfz<prVo${QSZD0oR^`B2`s4
z)Q{d29%e7R6;-v^6fDN{n@ss}WMw;jZD#5LSMZ`UBX~{FjkirWX;DpD%AhvxGSB=t
za%r|h51dqOglS2xS?s`KF;uG{<C~hh!s2kAOu?)Et9dgm$bj|FnCW$B=8B7D@q7O*
zz?sQ{GE*gVs-jf!T%GZ=5}O+Wmg7Zx8=WV1%(~fkrqHlh(Y`)#qpOeB(=`IUSs$_r
z+0vA_JM&tnjadgkL+?g3M|rq_^-M9}&Y&vVv*c`61x7GUtN6<|>YF!#wFuu7JG=^a
zR|`qY!388He#s1b7cCnGhd*pwZ_BHYFg)}iT&p368|?4KXJlJN;V4SWTybZC>|v|_
zYnxP!5Peg(N>=!LF3u}PX-2u$Xfu<rN&lYWm<j8cVf7atqrfF<YcKYy+hZNDcAQ#5
z2D}t8ortg_=sMJP2rj{$jKeWn#0KO+lPoB2XqQDQ_0SI#nnp}^U4Y&l?&h^oSbt%)
zb9lg(oGB)E?p%PMAV0pGKK$l>_3VOn!{S2n(<;femkZ&~awLi0y=&xhKin^L*;uV#
zo2m21lz#aD3~KN1!^KT=;~&BhW{ZHMWHc#}%o~}9#v1bi;WHDI_woopvQti-V{vL1
z&(o9%x@0Hqk}!Hdiri1^f!1fcQXf%JOuqqpTS?{G6s(`4V4fV9&G`IR-O{3(_h68|
zWzc~n7{CMa&A9;BP4%0^Ycrh>)KO0U!iUdK;!`5}E29$9(VdO`+b)eXKT7SHQsxtU
z8AG=e#8?%3WOFfy&@N@iWQB^yUhebsT-q*Ujz+!N9#o4$m!8>;z@n&LGw#g41U-+w
zI)^A}zwkc8)9>5aVXC*#Q!$kwqfycwcT@CmkmpB+x^?_D_Q?HuCi-Oa3b$MX&=48-
zG>p|R;^WTx^u;Aa0K+Y&_DB{oOp#Pctu3;gWokpfa%p>_#CC1ZnrnB@xdDkNTw;yq
z3hwPCknRMMo~dFQ?Yr~2nlD!?34eUuOnjD~TC9P@9Z=uWc$H~2BqmqifwX2bGV^`}
ziWLX#LyUGl8OGBXOdmYMmBAnBy?f_pWuDtS9|bMjK27`G{dK#*3u+R1P{}qh-?c8N
z?VYQ_d@m6q?J+vIr?JXLq1C0~?b5cW&Ir?Nf<Fo=74bYwcdvl#KJ2DX-xYSR4`6N3
zG*`%%EMsz<TG`sXqu=mUC?-o)-E62N>`f_@KAuzS>i#YkTOxMkM}FnSBNxv9V=k`#
zmkvly+af_Z%WCLodo;Lua7Em-uoE04jeg)0f2JTgDY+rO;*jM$TbY6Pm_nAD{lJpF
zfa_*m2@*b8L5Q;n!sZ>x7!Q<xn=Msh<DQ}i0Qo+5nf}2Q(bz2F)MOan7I9hiSo>yo
zwxXVZ&Gv?0MV6`YfCwNS4`TH)ZQ#|2PsH3Z0WMEOqgHb^9OhVy7qX-=rCZm@FY#4t
zJ9eWaG8y~Rl-SZ>6>;~a?-%joZn|TK?0@7~Ll8^Fpp1;;OZk3}!$S1^CWrl-SXnAH
z5D2|(iFV&zzJL}TCJ4wgY!4#nNpB#d>#|>(w{<Q>%C7I<VqEJFSDy;S4u>^!m3GaB
z>k~tk&H7uev>4emeg3R!VcIvZYt)?^CewS*OE=g3(5-m+;N;Z(@l%MQF7_I|dVi$q
zO6DR`gd+?CiX%DMo;b;I=Bw7VH7x*Bk)s;#+M<S153~lwui`~G^kW#u(=v-OL#Mav
zjOgUNOIAHp^HG-MNT<_8@$V2}87Dlu9pi56mEePEg#pK9>JeypuIfiSSE$MkJK#Vb
z#*f*d%Z;7E%~y9`uIONm5yyA!Q_9RUCAA+%@vZI^M)rGf*$2id0aZ53jo)FC?<8xZ
z#NSmm{|%IhGoL!DS|psy;HDwUWgDd<;RGzHmX5dfxpU|6`Y#c?hs?cRlY=VwP<}@D
zS18|>UO5|dB?(;nSZ8R5`Jqz2vn50;sQ<AmUA^;VG`P>OOvLhw;*5p`IZ<hWK|v<L
zN6^1F^gU<U^}H-Q+*plovc#44W3arhPm(kXi*7E}pp<+AVhy^nBc%{IJHo1He)Dh{
z4W!)`4Hc~cVp_AvLN|pIPVeP=CP-mA3eE@50Sun{Pzolcy_nN*6Z|&K)B$dJeKt$7
zY9Dv@Bfzk$FPk$YGYLw+lO`I@OmPsUSEpD{w}h^@32_OP+SV1F@XT}OgdApT#4UgC
z=t~&}j|$&K9UgGZMBGd(ZD6A3myPBN6f!{NSX8;_Q5jHutLR-yIp^?ay?n_p-2~ad
z@4lmD6{eXOA)__@lng%3ip4vQV0Q{jwn?*b5u=_Jn1mD}Xw0><^yr5A?hPEbNAG9*
zA0u#7`YnuVi$*iZ{Ff#q|1F4;xcakR<4Z`LGUW;jSfj0u+O%sFi%(;4WO!ka3tl*}
ze?q@fok|TPd%xX(AQ1m4IEo!<jLvCBnskS<c%2k5HNKM9tq&-6KGEy%iOpGLcx^hW
ziN_gBR6HiG$OJsJvdX={p*?6)WP!y%f9wsP6c%+|{nDPKQ>7NT+rlnrH-C8~Q)9}8
z9@l?8O#_*(WH<D%Kr(-xiptT7*AdN!%v5zX?HJeXE7vRSn7lRm(xySON~9>po5d~y
z4p$E1udl%5;i|lR^+CI?wW^byc-fJm81{s@gl#w5*!C#_yUFYeoT@EFW}6PS`+Tn)
zA{gZEeT6S#>j(0K?3ViJY|~djmj?Z{v=yU)`T^NwS%}kyfX(cNUvGQGcSXJfWCw=l
zMc2dPu{wI;T{!nf_!G^mwN6~_j~w6K`Z$spXp*hQ4~`o=EDmh1ucdEGd=`d=#Q_6{
z>4IABP^}G@hJfA`k-R1agVqYxiI`Wenfk00gXvQ>YmaeTb$iOXI}nbm<v2NMlt!Q9
zaG3xjJPa=Hn~9jo)C32<ri}}a>Q|A8Z4bPJ=xE{6INWA%WaL%b`5vC>`*`?hLG?RW
zhPGcA_;1VnU%spqp!lhVW1wVYNi#~D5swbM&zwzMef9B=%tMD*0}qB^yc{fkDzCnN
zhsC1Pzgxd6m9p+_1)piSYG6UZLRWe^EK}_Tk)aB6PB~S!HM!P&to{WORo#kr=SPBC
zqxl}a2awRZJwF1Z*hIP<AY*6{jyG=1G4-(wgALQr%0KdIL(!Wn;#Ne2HfBr_Rx!Nv
zqtM*ER6A2p7+j~QzO%_Me;ujwDuaqBcGi}69LMC)aK&a}^*AS0Ycy|2QC2L}Sl)~i
zb`bWhVk1`xwz<1tuo&4PuWp{Ix72e>yIgz69~veGbNh66)$|6eJO(pfRvO0y{iIl_
zxa8cnsGz?UBd``Rr9IQrAKuKN?G;iu>=Zqm3|l@w>?Fqy$%-7iNM(009c^yVVxni@
zYb$!kIZb7g=4PY`%o*=Fzu6Dx1lI79;F>sGCj$mVyrPCxbK=D8146GWR&T2z&)J+b
zdGHdArbh&ZnIMYmkg{dOMu^fa4M*3(i;3~<;C?NTQ(BrPdfJWt{ubif_{0oufq)%`
z2=BM#)j61Z=<rr3_OK6Uabc-!PHrr4*e=A0+T*q`VN@{0UC(dEWrY(@H;ea?!RpLv
zu9rUKc&=h#IL*R?TjU}?o;_)Fuw5E#yfT;}ScW|~xmHI%5nEpSo+`pV6Jdl^`3!TP
zAp5j-pqv7ehH<5btkLiH-&<%er+W7FG3^a&MWdajwMo3$*#1M2y2kR(|6Pms-{VM+
zJiH}&^Ne}>X2;rXu;0Xch%(NY%WF?tz-`hm7pycg;TS=Su628P`8J!Cz)PYw*<GoM
zHTQrh?ONZM98_S*3oGK8HZkI&H0-+UI#la`r6y5j8JF<#Z7AD0{h_>ERZYY!lK^Lf
zGn{PqXM;TN_6omwFsO&@26g$+{sNPf(u>QhmX@kI4xds-Qwkx;epCkIZwiH@oHm^v
zP`l@ROB~kpCZ%bM6REiZ)T*4OE)b<h@*>6a2s$`H68ppX1E()TN^8xC3c7Cghk~xV
zpzBb_%WP7A%&W^M$uHTYyAm^mO<1>AFyqO?PKc>6?iJ_+x>5rgvM3`In-e)XsEo6i
z+=ZdC5uCAMn6-gr_lF2=*E?j;LWj}grvga|RWHV2tSex*4u8}Pi@eP|;k*Dj4Dhkq
zh%63X0sR)Zti?VVxD5LtD#DA*hWtx%5dH<KPUXX?%`Z1!VG*a1R+-Mn1|ZBunp!k9
zcG$R~AA51Q*mk=SERN}M*t2BW#-+`9LDw!Hz^xcJw<5wmfMR@&Sb+t-!0uRbCefR%
zQ6q*KE*aCw+H#_>t2sHu^3?MC2aRm&`YYcPz%W8fi(($fzc}d2Uqw6t@dBSb3<frc
zR|y}JIqpqo1R01*nK=kNwwI0YS`u{uuZ@2Y--BYN&-k3hLysIDhoVI~V5LZek8&h?
zf4s_hwG#cD$@cj6?XtQjQH=+LxY!c5%<LsSQ%2h+;|TzFf=)8IeM{{m##($yXX3%w
zIwN62G8H4*g>f4TXc?MVd#u2$55$)|Y`z=5@MXVzW<<p9<M-5!#OzmdH0RErH~kQ~
zhrz8)Yns#9mXi(>bfzzNF2#p!itSIHSug0%HQuWs6)7}YFY0W!twH-$g9Vh*zGUl^
ztP49{FKy3P;929VWp8ATn|B{^y_K8qgs4B8>4&EWZ5o)14|W&Ic%8w`dfOjpdHg3<
zW<$OG-kDe23S);FZR|~uH*Z*WZVZHRd=NFR9q$)ay|2Bq38_o(bwAXDE|bTW54*-T
zf7k;=9yIE1d1qt|3M;}4@Ql@b8L_9z+rr0vr>D}`;%#=*{J(<Sq%(F2NjRMaXiEsy
z#bqFzmgyBs6wl7FX7bK(%iIQn0{26&I|HPI@vyZ?{`%QK#hLMhlT52lODd@HbY%M0
z^`UMzhy=Ez5X}#wUmio3>onoz-_v9tKMoe`iRay&TG)kfDDuDj-k|<K3p<0ak8F7S
z2Td$4cHom%|10Sd^Rp^-h1TZ<7W}W*T=>O?N3=WPF?{?}!<+<F{}7fRQM_h3Vo252
z`P}gZ^H^FJ)EYhLWN6c8)KEi@)^bIH40nv>8$4|!ZO_X$FB|7x?sBJI>$Zyb*@d1`
zDWHSp-c9!`6ki!-k(vxCUKiQbR!{IO<1zA-ab4;!q~%zcKWhmUlmpbOO@|wVW0mja
z%M-W!&vJTma8^i~m1YJEI@FL^t=1YO=_E)>uPE7X7F1`LS-YBdmW0VXRYJB$AEupQ
zxZ8k)YdtG3d%UmXr<g)IG+x>a;V9oqMN`FdMzYoVQFlMU?We@M2c^Wh^{1^<S+u;Y
zg<)T3^!EW9aUHa1w%v-3^~d8AQIs<sNB@g_CZv-!z@mWZ$WQBbHZNV`E1n9Eo?L6@
zjF5alDrcjg)S1P<wLHS*A035m%r%hnS2615b&+fB$3uJ24+!SEnXIHr{~N;2m&G>U
zHF00cq$ol_YEIZYXqC<vK_Q4OY7z|SFSE&uR1SArEq>$eEl`S1Sg9gBsm4JTFB$+a
zMYu1c(G5N6z+if_)cFkv{Q;4u^%`=VgQ5&*p3+n^qi(a=G78!)UWU7E52vENQ{vrZ
z!9D9~@3(N6q0%J#csJ0yEWrfL*|TYxrZnZ2<?4z$!zB9bMH}B?hP7Qa=*PkQ(c=%J
zRrN0M)IWxe^gkJ`yo6Rm{Pxnuvjq`nX(7MqW;V!!Gf842>uVzd>_mg8fyU3eOB%d)
zM2%83PM)DNGbf`HyezlxRoq#5e1EDyu#nC-+jPK=mUnlfDX+wG^s|R_<g@NTIuU8n
zz1b^6wT@U2AD5|Fs&gNnH_RAbp&~KEemlRmt(R%bj}yrg&n6ABn_ck)SC}h(DSIR1
z9~;Y_aiEJ79!W?nyq1#H^1xuShCIcI$d8=i9`loEKCGHSJ|L|0D_@tlIiM7ejC${F
z=!OHffB@456`ImE;f3w5fjx4aVzHbws~>IMZl6t1WwK#ry`f$Fj1^>vXOaM?^a13-
zV_#hO_QCH%aDjp_Czj8gllXL<6Fo+8W+^IC*eF;z)xx{O{@Yu{J9<5j6WcT+ZKwE0
z9!6vh#kiHXC3mvCrw0m_kA2qD_fQ~hWE(lWFZexSruMxkk5>K^=t}pfJN<yz(|W<A
zHafxjqZz$1a%6Xt-oXVmYeu-c8CGIz-dX#qqV(WXa4aI?l{+`+<iLCt$OlF`@udn<
z<L4%s{{aXvf5fvx;-nvlb7`#cRmfJ*QRUbCr8r(+&15AiAj0ODKP*z1Y5SPr^V)R@
z>g}~|#qH2I^ZqJd!D~cKd;S6FY?<7hm?^TmbN(n`yt!u+S1+nn<DBKc)L#%*&tyKK
z!8%+WpDuM@tq7=z#6h|-$cVYSH$kOAmf2w|BQUv(IQc_@G3$>W)BdKq3O>5c^ifk@
zU2K?~$O(0-Vb1|feN61@iBD&V7W9B{=dBH9u<@*|Pick)e4x9O)Vl|TDmMv3?Z0f6
zNg4`Sx(e9s#9N7^_DtPq%}C)JtPcd$;hpmo8@Ia6!&#(G00urDvfKEjUCdte$3U?S
z-G1+PU6{z#MDdj++l5CJZmu>E9Lft>y^<P~QsKzL%BwOzsDVC<-aSv!wuGPpZPez)
zfg*;@%jXPlz!REbC+jlh;`Ch37r3F#_RvKals?W2-=Kqq<xlMWjkQ7Ip9Jg7Kid`%
z?%cc$3YHr>kMavrzt>>@>xT1d4JwDRy+K^ivLo*W7tkPdtu5)48?NN+Q{5iTg|3jv
zP<^!VsZjA1-_De#T7zafYwKGKB2JINwW2qYxo)z0pQf@hZMsV_I95B8TuVrPQBPTS
zcZ1wuBQl3^GhNbKbD+?@|79~+k!+;kdM46@cH%5RAY^nyQ(XpZqYecGRZhX|7a5pF
zS|`+OaIQUm^+Fk8ftwtnobs6R(s!IrWo*~3HDW|cm$D0Sj=-d~(S#_7e&SIgrQux6
zK^(PA1MOy4UkcgGe!L5WM2gExT6C9k)f~oZ1J-KhyXBVw{7LV`o6)e6z)N!6lKUp;
zgX`_0hn^@gFzEn1kDKGcv+$2K#lBoyxQIP^WY}fGws?1*Jxj&SJVhOcP|Pdf;S_>#
zwdsH^OUI6L{U%AXBhE`x{evrHw&44jk~CC`ZO0dwY2huJoKz2AE4~upYxuf$@ud?z
zJjPwyjKKM6LR-!+yE<(KpCA*4=x<_2ftVlPb@H|ku_Ut^vAN32&i!Q7FVG^3gb(iP
zrUF(QZ-<1<T1>3=H_^0E9u1alcTl1cGV*CQXFi)Wg|A}9O;0S#Td=SvT!Qdqk!s%n
z89i^fl&`{xXCic&e)iYoLpcz8@g4cDIJ@GCS}A#`9YKJh5Jd(XZjomxdFl%J!k6`f
zCXW3n9+Ph4&64yrm9;HR^LwUFQp7?P`&*izFoBFsc=x*(dDH23F?eb3GGI;8$G-fa
zY1#mWG2_^)Gj=x?M=D^9ru#(<+sm)zG8;^7=hZm)u{`t2V|ne=&Rqt|w~aSmP7E4S
zlQ7<K_=sF{d=g)}*qip=rO-HRC=MuOKW%HQ@>677D|5zj8o4118_HoLkjX74TYo+I
z0#&<%=Zz84P-$-|-@_2a#QJ;C-1W`zGcO2%r&+oD`>Z$%=qmrE9sQFr{DWc)@g?{y
z6fS(-J2wHot$YA9XeD>`O*=uF>z;|Rz_RT|1yo?<U7*N?o2vaXau%vw8by_Q$;wFC
z6vw5gdTK`M7piK>Vh6p~O&Q$>Q_0_mubkshqodcXjEo><C~(M5zRJo*y9rz@D2_B3
z-cv|Y>-bV9s{9oB;JvQ_E?`L-Wg?OJ9IpD@)_rq+2tv)Zdg&^3qc4S#<03+{Lc3pV
zJthynNW{>t!mO6rg`0ZTJ`sy2!c2j#sd+%)(PR1WdM0N{KJ&gshQj_8HVT*ZC;W}@
zD?W~Iiv2IevA^nFfeWv<<bjUL;~iR<ajQG7{W!+WPu`^>CyG?`L7b(#0Te%0^tQQ?
zI^IJILvDhT@js`(@j6AubYH2xIW3>f+j`5g&7Og^w$f$VO$Cvi(0rqzAF0+bmVuWo
zk}TkmsQ2E2f&k$S@o%viMLD;?f9ZJhtAoXFC;-}u9Cd2>)mDV%`bS0fJEs}&@;`Ov
zX3GeSW$e@x25MEt1QTkIgA>7i!Lj;;VeN_pz~M|QA~^byrW}D{!_qWM_Ec{&q40pD
zuPFkXGobQCvJ~cy8vGPE{L%?4g3l{KZH7_a3a*(Hpf??Pah@U}-uF}McbV=&TTS}b
zk{RKh2YIH^RLWagw;}#YK!L5II|N&ncZAgix_73v$yeSk1lGFf>l2(fNG@Mn9fE->
zCG@@ZwE|0t#?$(3i?obSTyf;ts^$kRS@FN<fLWdwgA1Ue_1#2ys$4pfws@|Jo9ej_
zwY-*0dNRVsS^eaKs=ZmeHEiuV!*Au<Eom(5?$oJ!^iB|FlEP-Jwqg|YXS2tKee}~f
z0W#@tOgTO6Nc2Nxf1E2^7NL#m{<^;_<~(y8_Mii~Dn*XM4hs=nM)grBQha15C6SdO
zN$`DhmgVY305kKG2jUb-G;<F;B8HupQ71+OqFeOsmr;#F7m6BPw{Wg~MuuB0?k{LY
z`ex#6r70MoSidV0+%j8$eADz_D(Xm_MddC(vPZ7NKQr%24yNqBZAq35PkMA-DiJ5^
zl?6q;M8^%?F_~is!qxsD{(g~2ymE=8Xq+)%<CLdPp=Q8EZj#r>{_*u1PWh3`jG4p^
z`N>0!`51wjRAuTcQutM3afA1Tt51R?7MjE2mUE^?7!1D<9-<8B$(Se~Y8EVgpH7fX
zCRHwe_8{fWw^y2QdBSFsDk`$wtvM;A7{b6}si!qsxzx;6>XSf-DAY+~tNyw5Z8Ao|
zP}Qt6)K*qg1JpzV??G{5Acty}@q}~SpyNv*ZVtWs=($v^h(z`k-SM4un$$)}>zS>9
zJBc#H6f$YNOeiO8LPg;#-V1DxKYpY>Jb?Rihu5!J`YVu)FTEvUNR*`zc58XbzOGF>
zg#!lNsPeUh-IWEaM0Fm+XH}j%D$bu?_NJ!!WtSP%ILU@yPssSu7B^JV*#<2=V{mgV
zRzOd1swu4V=>ZU+?k0V;^pEzg+3LS2c#2I=!J_%vB|*EdppeK{&$ObSRwCOF%>?)q
zAHGX2-HY^IZ~NlhMMVi;#_Dhc&XzzHPkA~HIXT%uE)P#O2EU)Fv!eGXL#0lbKoDQ_
z8-ryFk?Ts7Mn!h9B|f;y@5~<_-^WC7mq=0J*Xkq30X84MfH$8~96SCmFNbEL$@lb-
zb01I!SBr%4zh0(JApHO_WkTQjfHUcsr%v<r*gF>21XsR~9ltv$_T9|Atv63Mx9ihV
ze|^5BGo^IIVR5hzS)u=Z6UKq`F!yIop*P5Cea~J>SRN=)F)-JpSiC+zH(o1e)Ro$y
zaaYf5T_x{YR~A%A>YJJXNgne(i9Mo?h>OlYk{;=wx82&>O4ckiPb(9!T<Ez~VzrsB
zss-BI?;1@9PG9@>ym9sXwT>?%)JBpT0pr4MgBR&<bJH^l+eG%~n;OnuxlB->N<n15
z(C<yhmrvCs=6)b~emM)2s<g!jz~2eTg<h9vEjMPb3#}U!GBg8atnsHUQ-l{Ekce7O
zf4FFWlJ(dvNWo1qdcM%$t6Lvm%)e4t6tZo)z^+)9YFu*)Mbh_l?0#L4cueApc3Af7
zYw|I#W?7|nH@Zq8<m|9=;Y}v)$et`slhm0HJf5S<H<aEXiw1Q}rt8DnNIVlKw8u;a
z&J)3?u;TkC{EIX$ZG8!_o~rbadf6S-oem{Om?>AdiG)SGW0Slf>=GF-G1+3f{1(}h
z2l5#WpE|FNbE9P@-E@T*z$s%MefydNGxjhZ9K5?G*H8Z2Dj)OUzb{^1<iWg6cD&v|
z{1`arkHI<RMf*haM@dmIaArT`Q!9Q&sgn7uQI|{iokwyI52cTu7xO*Mo>v<Kh|`nV
z-Nl>srn3zliR{bQ$JmG>yVGf}ER~azewptU{r;xl6}Eu5YOzL;<yt=5utCl=s?`1l
zC_=ixCeL7IjO9M<Nw~M4`i!;Sq{WPl#oMJ-wq*93*9o$uK(W2btW&4Gb}S|b-a`<n
z+CyA(Z9_sQaQO2mNwJ5W_77!tbMfM$Y&=8D7o(b?miCw}fJr7<F5;P^>o^AGEU6Q7
zvt^<GJP`=(UK_h?B$RVJdF#5fW>8|kd>rMnDcOypHrWODgxgHik!j>^kV{QMyB}Va
zCf-&8CAS+7*!Q2cbfbjqXXn;uqK>IlFfs`{h{wC^elq4b57w=CiR<*tc^Pb2J-8g%
zX#8s8u|8S}?g5!iRJE%h2g!87mfPn_&$TGe_Pm+)qEk5*j(xeTq1XH~!Bw&X8Y{7-
zg*UVZi^hlLP2O^%46%&6ReALMN;3B`GzK4t@aL_UWz^64-VZhs&!xu~{qSq^&#%!Z
z=Z-9{TS%AXE&S>JPRY&gWJ}e?>OW0EBqVcdJoAer1%o!z;!sLFI_1`Y-TgsDn(W1~
zDb~xTKGM$(BH}7s9(BV9Xi}q~S!xNw#3w%7r3pbSi))m+#j0XRJ#}O#ADA-OKh>co
zl9AqSx;)}1D8c=no@W2xv_Vs3V^#Mh8ti;`^ucgR>sN{UL;;E{ByAx=<WHgn`?9wC
z>mHpXHtESsIoLmW(YP4}39tK*!_+bG{kue69CMNJl<eK-Z{i8xXTLA5@Tcbsim#|h
zU}>LXa=)2FzuEi!yZno_$s2bKF~U;*d7h*5lA$B{bC9M2XDs8!N{3X~%p36C)N;sn
zzba8xz_e3+z$H+Jq=1nZvYKvqWIfaNb$fNZ@p4N0lPI?*Gh8u{r7Kny*Y&O*?fJ9E
zA%itRq7oFZ46C0K5#SHfKfcU^U%OZmN~}aD1(<jMKlnP}wPFVxZoz4E*O$3hz&OZ6
zCHWa~x>nkk`6St?@2RoK`MXc20?xTQIR)9rV*=8VYrV`Q2iAShShOFTT%7SBJWRB^
zBuLj(-Sle5ImG|E`N+Y3SAw2lYYP=o)nY?@^8pDYwXwt5u>IguxoO`Z_vGvaqIK_c
z-xS0r>ioY3FPG^RWhI_@U*NpC_ypYCSuk+*r_Iabc_(tN^E(S+n#<1G*(>w|wi*{W
zHOoDHaD6m$0W0*Jm)#+D`sq#fn88QHq!+mF2O`->UU;qQNh^KAHeJ_*zXN_TSsR7B
z*dlz+@oh1K6v#gChWdt$?J)2d-@OGb82sL%E|Fc;AW^3-!5u9#g{t0HrzEn*r73-V
z`fj{nPtX=4dANt;;_o<1O{@?n?C~r`mi2wL$OxrkRH>6)N=S-)dI4oIEcEs{{G{vn
z{x)C*Ji6Bj{(l&-M?VeNlV|lv{9=mB00Y*oaxda8Fkp)e$iji9OGH%+tv1c!Px!vH
zzJA@YfeWscSE!8X%e(GgUgonE$SCqPP%JGiEK_5LE&1`MA5Ysa%Tg;vkyD45sa4cH
zZK1S<E2qgz9HRI_t*3E4nQ1EUaGy1x$?cr6{h%0Fd>p&P?*gs}*6jHn$K&F^KEw6Y
zp3-Aut(zlXcSu7vrdJ9%P-Mijxrs?xn|4weyI;+~qGrBkfZFZKo#GGWgbKRm$W{Q8
z8GHHJyhTNj%?##}ikbXXxv0>dEOi6UucTq=y`hZ+&Yq*@QH4oLDGJTk!rMOa7<`En
zDNFq(#CqdhKyvYUYTbBYOF!uoMEI*jTe^K*a9c~W3ol@bgZC`YOvUIX%ve-V=GzX~
zMTy$71HtTlWKQ9=bJrd|47n!%`OAaTa68IJc+4T_jEV6#+Ap!4i=J++{;;<P?tR_e
zL_gS=*qF0J7XlQO=v-fST**U30vXtTOrua2m1fX2%rWRFQss&EJh*2)eTEnJ)w}#*
zvij%JSAFNA9m_3NFY}t6qdWD9?A*8a3Su^xhrD9@p~0+j>AT!)W<zC<CayjHiX0#2
zV**>D#g&;He*&EdvWk4KxOy_Hi77qw`e(ceep;!?%nTb8r`V$&oe0M7rAnd?e%j5C
zKTKbydG_({gA<ut5U28qk(kjr+mjO6Q{D`6XL1c%rK#9MQ?vxEe=K~4NQ#$uZDEE?
zARl)Md}2V_kzHvT+7v5PxN`d~X1G)#MIrV}YczkS+?e%ap-G2a{icVfyt##dA-7qY
z=M{7xBQPDmjdGgX`1tIUrQ?p(RNDP_&o_2AO+Y{R?9nxT5$A)JInkoAvUo$KIAO<7
zviF$~goYF?Pg05ycA104d~Nd44cC&5(7Q(G=vRg5!FlnXZi!9Vz0Kx;3ZqhdYdzKU
z=-szoCJ`rb25;PmI~Mq_z}8kMJJWd#l}I+I?mq2duV`sLLvh*t3%Iq6LWV=^YR}s+
z-mlB&jqpz4Ey;0ElWsJ3o~VlQlVb0`pm;E=;ur94Me7kawRepa1V62#yGQeSK=%g-
zCU$)Wpk2c~j6)@fJ<O|93tUXjnv%6XH?wK<o+4x%|GDZ!pbyX^(c$3}DFcPe_i=~z
zl~2F6TU_V^sSf{VR~53jz5;+1To{N*I79mroMNy2_JBjqrq4I<pZ$+7PVpmC&`W%c
zkP{57i0ydd7xW#%L;<3z@Z-`!9v6;b=ccCeXZbVa0JfpN)aCJd;oL>4QLZodeGf=R
zL13V~??ql?>#(&LpDJGN;$tV)8YR{FRe?X0h4ARJM~8{DEXiedi6pX}5l=oa{+my(
zBqnK~;in)ft<<k127|(0)luHic%g%L6L%^f(q&WJOTS;~1YsuW=@h3UdVba;ex~Is
zxR>=J!$Eo<zs=U5fYc|^nxJp{GTVwV_bfMRy9%HucSowceD3J~!~=uTzYV6{GV)!=
zzaEpKW5;*KPk8FkM4l<aFJ|1)VxIW`FoNcZi>JIqMNkc;3fPAmqrDeAb?RR|B_zmt
zTxq_|ovw=XtEz=aNaU|Xz+Mgy65A{vh^R#H$jHwR789ymp!9BiJ_;PIQs)a8yx`&Q
zops)#R)hh+-P98QdG+u=T?s#RG+z}{?<%Jxju8z;0LN<b$*Y3_#2d%1yrhVIu48w~
zbCg8>OpEyFt@93rHbzn0ZW&TsY78whWkr^z_bY$Q&UG4gmDLv7%&oDizv01SDe!vv
zd*!&PZ~Xe!???Q9d|75duvSY(RAugX*}@UOaIE-+oBp+MBp1~ve+R9pP=n@zOZ|Pc
z&Lo~!xNmbGKTg9kI#kHzdeE0bxi-DEB(z})U!I-LjHb->r9Ap5@x?zITMye`Gy5;V
z?ikVYpKCUHkz3t@l1QA{?i@gNw*os}o|VWpcuh?fL%D7hA?17WyTzdnOZLvWwvFQw
z*`Mgvm?`o|y5O1-{RKM#KoT$)IstAlO<{76c~rrrzNqYc_osigQ21?VdqvP!rOE!~
zm@$t^;$uS+Pw2~Mqoe@+IOBolt-zt*kE6<|d0z#tOxnqQ6NF&^b6yiw_7u;!{1ilN
z?Am4brdmUMa}C=;eXYUg&!5pYhX;fu?#rB)1YIJ-xnPg%F~jdvChBy4PRo}+fFK}F
zKnC&edua6T&kddul)!?Y?)$g!X25Dh+M2}k7Gb{5=!cKk<y!-(s<9_@x8@&<y#>!F
zsqFd3y}Z^u_j}8l6<@vm@~18OhkqfLkKE3pY#sp&JoBI*e$P72{`GnMWwVto0*1RD
z%)Qm$KL54-icbATo{QJsQ`8Xs8{Dyg{@j*XLNY67z(xo^kDqz+o?kP6=FiMm)3Pil
zmO^S4y*Og$*aqdl{~bFpt5W_RVUBT{F89CA>FuB+yle3|Mr8X80W$>$$wewuxUc?^
z852K!0s#H2XK4icn=|7Ui227!V-`XZgn!MLhuVWmDy&740tHchda_T|KODTDKl*n6
z=QwX$ZjFKiES|xPKYonCKkdM+i}xSskNh%J7KmMJxT!K+-pgVj;rL%i`8AH>_b4%W
zXKz3I>v{g)(@ewqa~;2&Cn^N%_*@LXZ`K^}(UazhmsORYNUC&CImY^*y$RjjSl`Vz
z7&!Z>mi8|fP}zFwH%G<~i@7NJ*TekTU4Or+9ANtiShi*e7{S1cZX7u*qMr^+gWE!y
zqGhP>{F(+8p|zOqyZ6P6C;$4B;Mn~cACmgE#=np6>d*0ch7d;J_o>&>K5hBEPjw!2
z3E4OtGaV{`E}#^+xY9L}gS|Pt`KH`_a3_7JnTh{03!??Ut!efEr`#Eazb4`DjrQk#
zrOGcq*z}>296V^@m8116|Gl1Slth}dd@Wz!o@2Pi_+QTApD~&tFWgr9*D*qVjnOZU
zFdjcf&!aIm{2JrSY^%O6Br>>en4fof+kG<WH##D`Nx;v5|B8QAqW&x(Ry+El$X~Pl
z_qzRg|N1n=Pm<H4@%3qNiZGAxBxg(I&*MnR?O=m7Cd!a}lGISBpun|;=@iMY4h>#<
zT-)#;b91!pzrxSOukX**ocMq5&i@SE;?gf8z{9pe1RlEe=ro=*{|PEcE-I%fdmQXq
zTN2%T*K!#qL+LBFUnXkWS8zoV{raZ^`Z)mc#jC&ZmEKHLP3o^n_%j>-<IQu5Bg;B^
z@ve~t72XZ~wEL|;ha1FA!c~m`cQ+QkN*udFV0yp&g=J2n-ER5Ezen_c>uZAU>L_wE
zsjx#nr>n5jI_X(*F>Sr6^zpe|vv0u!f^Kez(T<;^NWQgq**g{2(Wp{(|08bYmjM!A
zWcxD%hr2Z-|Je!uW9&aCM=R#Y5N5wuxG+cvKrQMBJWb$3%~!NKZ#^LXT^h#qb1C`z
z8+mW-&QIAbMnGDX&*DtESJUNo7QQPg|84s2NBxFw0UH}%{x+EZ%NBUc@N)qgEZ^|r
z_vZab{Pr%U|7kGh&$umr{KP)F{<%^G+d%bY*-BZ5mNL@2$)%y}!YL_=jA-$z{~00h
z9ly;-j?1d9!@oL#EQO!wdUJ-95p3UY&yMI|3A$Dml7che^_d@3X)Ur>>x8`jCOP)t
z5|2r(dPyuV<jNuSDNvN|6MXeahGVw-h^W)Xc8BIh-9Be5vl{_Bq`Zu81%lA-$ch!3
z6I*q^Ctk^T95h&39cNt{Ms;fQgdXuLa(~PKCsKLz%)g#Xp`TQkU437DBp9-mr}$N*
zv9xv2=^GEDE_?9_gE+80)ZKdHi;mBBfp^u-V_Umdd5N>i<pvbQlsrc-rNnhagk+U`
zyW?}difC_-u<=TQZ+Kt65#cT9uF&^463o`qH<k0IXF~72JDI6j>H}`trIub;fj|5D
z@B!gTG8M9Va4%{~d(1P(tK#Acm1Wul1beeTlHc!MJBnjpH-qsU#)SjMY0;{g_$+>m
z|M)7R2Mb>pMx=+~J9&`{K(6Q`$6v#JwDCR@5+dl*8sRV4rIw;EoX8_7k{te~d^`T$
z`@@;Us&DWpX0_d|Yx}ofzZL)bs&6e+Slx=gnT8AY!+@nyk8=2Z1lOy1Jq-_SiZaJe
zX^mVP#mDs3^qcmhqhq0W97&g=Bo2ucml?GIq0vl&)1h{dzbNJ-A1g{bb`Zn+I7pb4
z>bly)J$DJv6_&i#pFV<9TUa4QKJN4R`oPXsP5ziAcGY~Ik!2x!vy^%TMj_sUuC&gl
zbI+F33$U1xME8Tf#5KiF+=z%uad*?<FKcwOr}4)4%YP2Xe4n)Yziv-vou42j`+>#F
zvv^mf_yBK=2jM?`Obz$PYEA3&)Z>_Y`^x8Mq82VkM|8YSCQ;jBtF4TQa5I>*Q&lb9
zbDZUNmyNn=6zP^rv4I(K&NrIS=r4EGj5LKJ|3A*&GOEh{>l#%=LZqb|ln&`Gi47tk
z-5@H`-K_}HAV{}#cQ*opbazR2ZfaBKhj`!5|9Ri{oadY~#{S^oi?FYCt(bGJxv;$6
ztQk`4&YV5rG0AUf4*SThHMSi=E(+%YT~~-%)GTWrR`C21D9LuT5*?iLGBQ{H#AXL(
zAIIkmH{0My)8kN*G33@%q*E2AdRfzx^V@wipEuIID8a;aZBCGoqgiVujZI&d1p^-P
zOa}_8Er!lNMb^r$mk;*v|0XGb;rgEs&E53GkNmjzHeZqFBH#9DuD4J=NKZTnA@H?B
zLG3MW@P#!DfeAvk^KLOz_qX^btTzcj@S9?g=@CT6zg4t*LmH|<o=uk40A1;hHinf;
zw+)KE8v-*$#pLE>9+|<f1P%7LqE36Hv$X3?<6MdGA*7Il#kMqX)Hzf@kbiQd8?LOG
zo$p}_qtWg_3HC~Fyq>O54?9Fe_wd59+<q(S`E>giuwUbG^ZUW(-f&0G_w!I<S!C>|
z%H|YEs<dDK{5`?{B*&kW|MQ>zsp{1o49Fx8&kVq$g~mUbnfPw3T~GfM)J3Fgi@SeV
zBDic;<lgQ^@nYd?Sp%2$2YG0>hmk!d2D#}M%Z*T7a;K$LSw5=;y#PFJQa~mou^IHe
z0HXI)_ycVG`gaFw_0G0NdvmkEK(J2)!_3?P>)9*ul`gd>wq(h`V^0E|Ot5&mC59DS
z#d*AtL}e<$>6_OA*ACz7uon`MC`GzWsXJO#gXc$vboxKwBls<ax+2+G45X6fD)bes
z<XPk&xsarHy?yt>v#I+a7@su)uvC;~4*dX|O+_Q&BibZK;#v?vxP3u7|8~^xKK*Ai
z@qf-E&05rVon{mbTr^;Xtn_Y^w*lHeebGYx^NF`rUsg|2;fM&^nuB!7s}1)^<G3B8
zdT9?=7)0hPjAclXKR+Cv`S>v63I<Kh>Q9;~cWj3P{FR5QfB@FFWWA4@69BCK^(`Z%
zMeGYhGO2)zlo;Z1)*4Gv9$T!_>FjB?aaj>vqaUq+@sJar^<qqZK!xGe6*FRu=_#7#
zbI-z_DM8O09e#Sv{Oa#$UT+?tz5i2mz24;iSA_o?>i_#cI^Y56)q}u!n<@4s|MWyG
zfADy=W+X!KisvyB&BQ8Be~Po6Rm5+k+STw6E}v2WFV3IzT=a#>u?`Wva&a+XN8{Da
z(6$D<@?0b~co(m>-}ihCgF%l~Nb0=EtHu4pM{-9`yR!DZ8-ImA%K`#`S|9wF@9TSx
z$Q$k5cq3)LSv^w;OYQzL*J(dr*Yg}aw#R@cvLgQjAYs72L;XKLq5q!#d8qG+7Qf@l
zz7PKLPuwqV6PcUzUmR;F<*hDy?pJPBl^&YD#hU_RMz~cftK(U9I=Hd20TlRFEch~1
zln1_#PqW%6+42P>gYaL13LB;oZ|il2ob7Uqp5x??6~Sjt=mPWx1y?m?hDHF?hA#Ye
zCn92gbN{d-d1PeMV!l?I-*I<f2%uu=i|zB@;U1zW1U&h*0l-YVRj4rxBF^1tb6h(1
zbB-*}>rDv9#ULd4b>rnZokZ>v&1m#p!4xGL`GG0>yp1qF0aGDx<@ts4;mUA;o`9z)
zFmPexF8SpN{Y?`=YfV|;*1g(`=4|!ZagI)6vea;VYOcvKy3%4cHKW&aD63n<pgUTv
zJx{d|fCZxTMe=TnWw`C3WXWD$UPi686>W>Jg#z#xM0ssihK2wKnDvb&)YSM|DP4;7
z<u__nK#~S_HLA%)vg2J@pY#y$*(`rmjbM|YC*(28&Lw5%``DK#EJMKlJ~ggFC~bSv
zRuNFn>wu-QTRD`_WO1u;TM0MWGfUO1K+o1~U{SFZZlbW;nNo=iHKGIs;4RaWl$n|%
z6WgymC5W@N&fl1I>qWFG%^WrfN&N-NY3snMLWY3zA=c@^`XDx+`zpMki&0%tp>`u!
z7`l45WFx*uw=3n@RF=Xmo2#sO^NmJ6WvL@{N;?qcWi-85ua;Zh=&Y+%vSNl*PDU#>
z{E-t1F8wQKo3%9U8e2sd3UW^vlt8D!Mng*;$caZ_C8r&r-FR^IaO;Rm_MG=XKbY`|
znn3*7^CFc7(HzA+#g#4<T3Og*z<I;fIxq1h3Ogp9Y|olkSyqk;`vNFl6xcqF)G{h%
zGJ;JvNCcm(i8<Qo?xeKo*kwi&@ep{uETrzH`B1VMq@*w&x1npJ^8sb6iqR(P@XW6F
zm-7Out|G4g`y2Yd{=^C!3^KjnAl$R>+wiGxTcB$EPg0GuTycTgQldjo2+BXz4js*s
zT=#~-=|l2@sO}wM5~bbaCuEP_dg%2V*{cT7xj5O<-->v1NDxo<vXVc@Mr*Xzy#F->
zl?{yI3X?EMQ!CON?AaIw1a)hvRN}E$Gss-wP4mxTg|e<)anAxx-pMg)^Qa;F_SysD
zP;bmqTqReP-BG{Oa;`kgMMuB#A1{C?MxFPxdD=DfoJIrck-<d#0euOA1&6Eff%+HF
zV}*8Xnh<s*OBD&JRQ*<J<s3yECa`*cqu^M??BLU==P?<RtDKYDlO>=0!WW%P**W&P
zo@eL6eY-7(eNV?q^LhVAzT%%7U3LhA_lX#LJ3W_;WNC9A5kEyEy(H_6VO7Z+?We&D
zf|AJ@bVa3|=6SvukL#!c#{#C9yrWdnaB*FokCmyn#)~pQ#m=oC6&Gzu(ND{aU^dtE
z&5SET@h++(x#*%aFG_0Y1ifslM-R?ge{ve|@FonPvX!@nz%Jb5F(TBk;539nh<RTD
zi<hCHRbic47lmDI=kmoJ{wjs`!^rY-kS<X^nU3ek00JqK$C_BCmszjo1@_Ni%EqQ%
zU*`rMEO=MI>Lu{nG8`p)CP~~}mO)l{Tf*}B?GMtIrN0q%9mlHVsSV{esjdf>m(PV>
zpp(7!OcsKgckgW^hCf3!M@RX60X6=HYS4Kb5M=+-6}wfWtZ)C<5c;R{`S<5|RG`pR
zhrj7*$7mtB{i&bsoot2RU$#OYBN!eECu#_o)quI5jJT17Hp|ofrsH9g&-+ir-CQV0
ziOSa57_Gn8HwOqu2O>3AhB+r<!gpX|9@Uz_wQ85vJ?{s-ed@uIWFFVS;!m2JW`&pc
z3h>%;C2PeSYEg4Ek2f`c9pUxosP$XaYEHjztUu3DS}V+byE!6lHxd$4o7_+S`J?^m
zoDPTQF0la(HkqgLH=&FA$|(1fMS|nqjc0kZwV-(_d=)Feb68rNP1j;Om*wc_aw5R<
zwkl^zpUVo$!-+W4QPjkoLc(9kYqpoYnD?O<74s`e#kUn;3Z0IE*Y_)*Zw<?9R8FT>
z(XB*ixrK5<O|<C8lbq6+1c{YHziq+xtM$EE<fV@6<0nu(jAQ6wIcAKl_YCHBTDfcJ
z!^<XSZ4t1i5WE^LDEfT9s__9L-Sv<oWGxVnMe$8avTViqbrlWL*u3ye%g^AgjZk4+
zB3M^E4VnG=<>z4GlO&pxBu^J%9+#7;(Y#T?w59<t{}>Nv9>XYa5to^-|Fm}wtq=Vv
z{%6_(_s{4H!XD2Fl+p#sKmFZ<yVjQc@f_0q29bdz^1dW&5<dIyaOaPVR6bD9;n{E~
zgwWH6Mi=Q00lCKTr>l!~`_~vNeet2171v4OPvufM^{wB}&k1^e5P}vCq8z*zc58Gy
zXEUE~^a&y5eG$uMkouAm%VLnST^Spf>ty%0gq!Tu?;vup*Ts@k%lww<^mvV|dwrqh
zK^%Fh(}Cl98D9nJ;tx(!wZSf&?$Hd*ax>Ws@%QhAIKm973KuUmN4KyaAfl_KszXwB
z++A@Q5ratc3Y*+7RAskwEnDH_LKgCb-@jLKC&)Su)9b~Q1LYi#_O%}{@DlfVgqxb$
z9*}1NTpze2SKC%(@Kn6tLype(55!=G{iLw@PgfBF5|2y<vP(pt*6FwM0ShJn@ALa?
zF7pOjy4*5RjHyala-FGG{q2E~DP!{$qf;gLc55d)n(%AvhH^^a&6lv7%~gKIeO<QJ
zH!#8a>5GSRAAtX|JDXRtCx{y=KVvw{SVO;M$s4VP4wnl7M~j!Cq{2f(3f6Zyq-Xse
z6U=%nU!%gbC;6sKHe!ihC3iSlk85P}cEjSQr?Pm9Me529$lX6W9G_>%ev>q9eRZ-o
z4WW@I&H~v{absvtF*q(+G1c3@+~s;n_$|Ipjf=(#FPMxzh+1tZ8e}^MT1NJkV0RdG
zr617uBZnvp7<F2Sacos=sSf`<-rD#z+|i~GA75o80W1d99ALDQ+D0d0TqA8QrmDlB
z`=$l@qjJYR(%PGar2L-%z-^ZO7xv@UiNNRjABORdAGiL(eu=!FXm0DFB)M`t{`XIJ
z$~a6fDsODbL2(fl3_DefnPLT{T;-C|!_MxqGEpd>Q+6_zJ;*or8|T_m^{!gHnkiZ(
zUxUW19Golm$O7bYHuVPzQV4XJHUY*}S~8jZH(Pd^><}lB^8oef2=LD~X!UAp4x?I!
z1)JsuVS^~mw9pkqr4-XkZoF;e3P{EQ(<49GlT0HX<?4`I|0-Sfn<^3w;;($a@J)F<
zmLxT22(mnrm$gL!>?Dz&!|7}2cVlS^NeephU#qQkmhvu_%O&5P-Z$g7d;b1WQ*OJ4
zrc#7A$`=5qQ!sU*T%`NJV7S5*63Io=bM)&N5<-$mpp=C_CYS0>y39=}BJmmYhPfC)
zXsnKSACktELv^oc#b9<^JG(;F@>}DV68x3s?Aqg*`cf^Y=2OGLTjLx3E8XJI88xn6
z7br9{U!yeJCgiZkRF~96fi=1}N$}gr&ILr()KC}Y$_*ixH551OOMg5iDx_Vo9dCGk
z4|Gi!Z^x8J(tnM|k)5O-pKR`k#ro_gg_cliS_2Vijzc0#dHt;hcBSCPfC_dTea^M?
zrqyk+13s}W^wILcUX!bFUqbSGRsQ(#!0YP;*L*b=%l5#%&-!8r6XM(!lZX8D8l@4N
z(d|==uer!{bsHjSCm0#IE?O!Xi^;g0Qeq5E!}5B^B>*Q(e)2C|RbttoFMd0b{6BtJ
zgYNj1$MHPXC}8k+{WHCE7;xa#d<7#GQ<}FZ2Nr1U6LH|<eNx1H(b7SyXQaD|>(v5W
zSm{D({Ie5j#G!Jo9W<P#gIS!y!?`_!D!ni2W7)HYZ?3E6b-5|uT4)nu^29B61Q(48
zJ3+s?T^w_jqsn7wH+fLyYF5ORY7{RRPE~ZPc6OtJqdellM4lN_g?dd<fRf8S1Yf#B
zZMktpy<pfgHMbLI64+Uqd^r~}PNiissU}~&Fj@T#>*#rEp~+a9tC|?cdw1`}R$sJS
zq{gOeK0R^Oxy<dJA1gu)bwuLRgG@+smG&rCl}6tWA;|-J@l;3`PDE>p^J5BeKJ7bv
zb|a}O)26MM>CSUwg|Kcq{o)3p>Y%h|j_U&&Dv0oBgU>JtG)R*@PI%o953)3)(jGYO
z;nI6YnxD<2LG;4IT-5yhhD{}wjh)3uL6O_oJ2h6K89Z3(pd+^m!W!Qk7cG7N%eWIm
zxEB={YO51Wn5<Z!nQUqh0^g!(z~c#XLC5ggfod|ip8B0%M|-_N4{aOqY<}~SvCpm8
z%5y+O&*kZ^^A#qGg}@<Rzqgb1qH%jXw|VL_nPAL(gA23CQl-<~7So{dhx1B@&o5ep
zU#+uvERcKNBcJ{a$g_KJum0h}-Ua{vn%pVi=KSEE-}cD&fr#VTqq=qS6g(uLIb>EV
z6yP+61=~Q#29;T)R;1#t++o=ctKzFY8s$>S+I?YKh_DkC*`62mpzIIi4AZDI@O}?P
zAOz*#+4=g75mpkpI@u>qfln610b;FJ4?4yC<j$X8=+@Zam<*)&*ETk+*9$d%rZbP@
z(2QsDw9K5xyUCsMjg*RH!$AeMyqvMD?+8hNOmbz#t+e<ci(oiMb{b7{wqyxn9N>q<
zfZkAil=Mbeq$6p1U7}_XlY%GzJYTKqzDnM8<7#e0O~gB^)dUtx50jDfSghnY^CW-T
zBH{id3D7ZfsQJVjQn*xZ^LCbLWyf5sB^wS3-)t*X28(m-1W*i?w_<VIK3z<e2rzcI
zIJuE2Gwglse*64Mx{h0napB2$U4R&POGE-(Q=w$SI;=g;t0>nkzNu1A3v4GGEsFPh
z<fSn(-RKVKie={+s%TjAKEE~;-OmWb%XXEgNI>)N>{*;?ZpK8oU%6U+cC=f!H^@C-
z9-*;0+Z~uB=$U!AD&Cx3vWfUm_eD8VnrQshM2RW?Rq30gN#a`p0mi_;`gz9xnTo`?
zlV2lw%^!*{9D<nHmHERgwcJrH&z-3Lbg&OwVC$9J>AGfFp>{48eI%MSZ)01npGsjQ
z$8nr%=5a&hIZ+ONV12bgT<xrBaB)bx1!GKoX^=<-UAzLqVNEwADIi7AX}S7ynS1+{
zN)`JJZMzC!=1d4%MFhyf#&dDXT}EGy$_6ac84oPz(-(yn=RazdT3<8!+q@RoAHJtE
z+W-1n69$b{;xHJ3CnR_-*=_rDG)YiEr6?(BHj>=-lytD8enIH{=PEiRk0uxdDlzL4
z$G`}KLbspJ2JG{?o+MDx+nV2^FS9~F0^T#B4rR#7w+BS0!1+8<>?5wBH4aZNeVKTp
zUhB<ep_z5)qHm(UxH{+VMyK>MC~kIDmPmqQS|T?zyEdy@>}o2^Yr)G)`r@P|$a1z(
zRt(|7WPB`ejQ7zV5ZyANc=0M)>RTs2VOI7&T<(@9V9QiH^&w7iHn*v{ed1Q_U6DC2
zY66CO$aPhHD3Gt%18Vw{FUo5CDQ=F(nMSUJhdg<78f~QWxGym0Y&!?&*ue9#fc*1P
z*Uj3ref%$)<&H=q-$b_Z4(*D}%?;@XV1sMhDjOPxl_A_{o~Ovhu)zS>FMvtaKe-rA
zw60#B5X5pGFial(UTwW(a(zG}14{YTPq(Y}R>BBAdn<49#`Uhq?u~<Q9hTd$YK%YK
z%16_`>lOvhpSW*-9}tXS-NNb)Gy1U*jB!^!s!T?|yo_*y9Q8BW5c4?kWV}kEe9`E*
zGo>)8fwLINs1XNR#)9n!aF>t6#6atLyAW{+2~n*y9WThl@#Mp0vu$;;Ckmjg9E}W)
zHZ*($+pFlRG8&9~8A)HT(u?VRtf0Chv8Iy9BgL~>XS0$^$!7ho*JP4R#<=xo#WMdJ
z+6?K)mkdNgX3uq+tYu}ks8Z$Pxne=%`M!E;`U$*R0ZeGLXkO%qCKtZN#)>hn@YLV|
z{j)I{AbxsZ5>rP`I5Ho-D_ot`_1<fIjD}M<ttXc47p1RZ8F|cU?4=}p?#Zf4;hU1u
zXf^rK4^e(-^?KsSQ4r->rJ3Yw50K26$$kq50L->cdUJ0}wnrym?3hyjY6_L%#q+>9
zQxDC+t|*ow$~}|B>GP!^a;NU7CV=D*IHJz<t}v(>rF$Bco4Jp}T*dWvUupKYZ`yXo
zUJn8|mi**j(MXBotp0oO2>$D{zy^P2tGPn2oPzGXzp-62TyAr2Q|r1{*nNfwp_E^^
z+9XrFko!JJ6ha~_**JG1j2WZuMxFnYhBIfR&cJ9b#Jt>NhtK7FQ(`&M@4jHVd~}it
zn81O2CX+MohRscp8KD{-j|oF+JIwn-Kk8Nbj0|RMhQ{zhGzV@iav5Dxf&QX(ZmC?N
z3)KE-HFqbB3eslC-k>5>i!I!D8LOBsmC3v`T7jZdZzsAEb~jR6vD}f&yPSLYOn`7g
z`NQ?{f4Gx;;MZfq0qhh=u1N(O=uD#+<2*l<<moz@8r=KvJ4=N^_ZDah#4Q+k2CQwR
zf!tcjxj}CgDSy?k;Y2(>H|=X%2if=&VcNoi0N2x9x&9<UmGf6`i;5igJm~k<xV^z#
zk-Ku?f}ZktW7yQ#u&pEa+gITAzxR4;%v{;JC`p%+@Q{6T-~f^SYg3A<kkeO|*+$#=
zIFDn_NCquY2CWL0X9X}*pO`wcku<}7Atu|s-BBMeUBsMg9!#x=EjC|)M2x(M^bZ!o
z2r4)3;A$_CiV#>i87Tx6AfCI4ehK*EHQH>j>C{_^)=%?@5$mXuo{WWL8KPqb^G1((
zJKw;z+<--1T~vP}e~|+!-A{Mw)e`ysU1;)|Fu2%L$Y{H2)|fRR>Djd9Qv_~lr9E2t
zoVHh}Q5OJk%XK9RuT`;tZr+_B@|f{PwNu@;ODH0WUy*jb)GaVm|L{=hJDg9s2|y`e
z9#G>CHSQN&?qN|D!*b&L%uk40rZd?Ry!^2{27i6)s8Cf+7W-`%Yy!Yyb-8~MQO9As
z@9+O)7RAv&@jUT8T>d4aQTpLK<7BCSKfeK%*UxCXBbaQ-prg;p_MB{gl5k*BU`Mkq
z5trEuR3hI;zd@~dRiKIBNy?0X2C3;8e7e{km~{w)w`{H%CM>2zIw8UoaXwsCsXp1A
zl)0w*lIvzB+lHO|>caW@MF5#_BjMtR^f%+HFP!wD;@cEopIT$Z9UlpBrmO=o(3oMK
z*9iiao|{5woI4QI6Nv=N+~MOqqIYaFvbqu6?W;5>O0FD=^L;M(ub6i~`knU1d5EVi
zB}aS74=FHf0kMo;#m2m6G2z7qdzR5<^}u@VU9+;lGOyj}77JWvWGhe^4mL*_7FmLR
zwdP{TvnVeMxw*rJKKq^;IHu#N#64`ee6ZC#xTG>|u2nT)8Hk%(-{7rl)O`$F|5@rT
zoGf~as4>;O8+U*iv<Mtxe8RlEgnN(8M3~o*U7q_XQM|tT;I_>Su;K@238$*|$e6lV
z_vFj6%d0Suj})q{6ilWoKS!;e<MZ0Y_&I3F_zM>4G|73iA{rmVgiCZVdfsuOw4jsm
zNez1@q&_dVn2id+WBGo_XryyBZZpL&cf6h^3Iyw-y*>byfgl5W2qf#*kDZINdDd0F
z26T0=Fb0v}tQUDNm74!edgCZw>>oPC-C;1J=w<6hm-Cl?W5dQ_UKhm^g3Gf}*Ft4@
z6fsRfV|hhY6!iOrg8as_o1=C|W2n4ObM=ZSR0>pey0tLj=NoN(lZ2dKOt$g!2*soo
zIqJC_j-1&S{FL=+uF)=Tj=f0cG6)}=ixp;6Uv+eKQ+G$>9TuJfPqR%IuJCMr_;!=!
z-Ck{L=O0$*mcas_)K4NqPo*~kU5+=f56;utNWV8xbL$1Pr}#=lwEV*UIoKQjorrAJ
zVK+RP&7L|#I)3W8Hd%?a?d6$*n8vH_AQJ8{Hec}$t7ZP1+Uv<9JiC(~;~jP=f2Bom
z<X{+>myQIX!wEGA+HOr8#%CE6SYF>n8Gr2?_VGC$a0IRXI6tDKhp34Wu$6pnj{g&o
zTk+cWG2ok|r>b%PR8|qEzl(4_YwVl1bsebZ{)p~+jhJmH9s+HcB=TpYr?(wA71DL1
ztSh}{dd%TE7-x-UVWaf(6?u4I`47?^pN5zxDfcx0(ZL@`=w+0upsT~q`w6YbG8jFQ
z_tSpTV=nztqA^<ZF3DwaMZV(MK_;Bcv{|7aNfE{F)ef*@_&bzE&Q?1IenH(S$|$(r
z7@hWIGwezSOLq;Q#|kvW=B~Uh0KxHGHXfJp<NFfZ=4|V@H=OHD<eR&bK429iHFeHn
zraI~R>|IIk%B(0x&u3DOwot{VGKIl<ELH{wyH<%-@e-*^KSN6W(|f)EjNSQWdfM>b
z!CXq(((fhTC+m9<z}lA?r|Ox8)nrw_ySggGgSXYW5pAWl4~R%mMudov@>9QF0ZfIb
zMiZt=j;5?>zw4!2a9T$Qt!u2GA9>8)_m&54bo!~{%Uk?X{>7pGjxUv{<-h8f8rs6|
zfwqyerQ&-SHbGuL1x>9u_H9o4cVg;T^zr@v-*Ot$r+%R#z><_J6QTD(``!*9FZ~>-
zG}lTrCN-T7A`}cMHR!j%*X!S%U7x8b`@$CcJ3Cq;5O2IRnpr!Y%)V(P+Fbkhb`beQ
zQgWTcc8Z2@?|{(Khaw^BC|(96ISdw|UQ7j><FH6x%1$*|!k=yWT8A}KVW}K%1~5MN
zVji@90zeMXV!uVapXaquZak#8RybSU(&Tg<P8~ufdrIalSy=*U-z*!|CEL|S5G}4N
zx)(%t8~NIScTytLUX*%3^I1{B-AGvE|Iw&?B<Hcw)+ea|J$}nRd<(d)_+7W*#c4s3
zkn2l8zH*4m6zJ43yPy5;=#mCx6c?tviUB?{!wZ3s0R9=_kBjZd*EU2DOcDWFo~fLA
zai_mkS}Fw*m+j<eS0XeSKP{xIF`Pz5^fLmw(%wULMm`s)ltw`x@vm{v`5y*8%t&_E
z)$+IQeQRQ{F77oi>vlOvqbY-nyEj!5Y%+fSqWe$vYjls_lwcwKK-OqEtt*j7!fEmp
zI2*`SL?VN-rIObuf4s&0m3jmq0yr8fIA5OT_hdEdC85ao%dPGbub#_<M0#VmcAV_I
zsK4ma=ht8r@q44><M*aWw@#Ak(ko35kL4Pz!eUmEtIVILfL@$ZK-3D4BD|l3GF-3Z
zE$?iDD<p6xfmWZA&v}!FM99q#IG*P04SfyCbq(Mjo!|Q)S}bH!ZYLs{9CZ%9NB0Iq
zzs?^U6|2A*K6PW5T1KgLGM7B2efzrAcj%aCyuzdLEL8}QUcR~g#*2KAw&Ue621AR@
z%}JdP#v4QP0K7(}-!uEsRcl`<Uw$Y5`nwHawXNfbPw*eOp~w@=1-;Q5a&b)@dX)gH
z(96k^l6R646GE9paa3uCna1cW@6wg8@H>KHMKnqcMgw+d8fAbj%8**!E51~(H>CFh
z+aEw+rV5{RK8S=_wSnC#y;QL*GC<#+j*dF913%bgWg#vaYT4_sp$znEJMvK5{pS02
z`wO2Y1m0JX#H)x}mArk{>DVmNZfdt6b=#<PP0OgeS59rU&UOQ){1oTo!7b|kzfTV2
z;>|>Zn19!N7yPh%bnI@Y2QUppv*?M6SDI&v7jJjxYp@&LTzjHgWJo0`Vt04_@RMu-
z(`KeztP%GRt=?K-t=`bZsPNb5^uGXRwgAl!KwqBSj;52_Q)S<9doDCqj{Pkg&!gtt
ztAgkk-FrMwcT}9+!7dVJO|`Ps@}j$!iofHW0^IM$7q70CbKD0@8qr-h7-P#6`*qzb
z=y7|Kcx_)I2W#|Pt{+etWa6RQa{RV2U@)>T@_tk4TE(23C<L(jvqZ<2gTN9#tEVUR
zl?nyc>UqL*kH?98?uzr`8B|nA7IT+c^g6YVt=ncn$r+B!i&kk`_156%I%3z#Hx?4Q
zTzE%OT$q>9iuG)*TkRvC{Ud|3j-hAe*28?gAveXe0-)eK%nNuPB)A+uzCLI&SrDhp
z-KA@cxc1-%<7PPPc=zXV2+KhqHBifx`hjoZ0?1t$2iD%DVJuuzcvr7}js?Dxu2RkT
zu9%g*TPy#78#)L4wJoiZ+1cI1f)iPmmY>OWgjI2$obHW}Tj^!@{g8^eLNcBGGKiWB
z63UGCzl_Q^2|xY+gqFk;n(rNK-B9|VOxx{)Z7$7<LwP=rZGf!X#13W3%Cxs5=nbZ}
z=e%k0`qDepA)ho<)%#f(^}}#j{F8L4B(IkNy#qvxYO`Re64iEO*dswUM=@hys_m)h
zKJ0jFeYs>Q4!j*1X*14;{=tQ25nMW&x1HZCt9&wF<XEAOK@~GKjwUAjQFW<dw<u5)
zkcSXkfotb693xT}FggElz*^YAPLn;`WIob_?V^)ZQ-gH+rmT7#tkj0ibd`;AN;l{f
zkt2E3U0U1UaeY*Gd=M4h@@*%v5d5bo>-|;2{{cu+dBGOBeJ)1?yBagSUI`Ws{p-$!
ze&AXD%kqp|EVie7YhZHVdb@_5!+rA!(E$TQs^EOX(C&B>XR5(9i(|YG;P5Cg)dF>C
z({X}R*<J-%jkfiz+3{7))+;z=Wo_Jc<{05|s|F|Qr9lje=dZTI)FW-h6+#$ug*Qjd
zrABkr)FkSo*M_U2MLBZlB`B3Ldq(OUg+UkJ=(h4G7)oZMWRW4l(iq{u=zV;!%TzYS
z3-kmd4ZbBo3{JW~Ly$SjBMCqvUG*E}cQDV=!|nN|gWtD${#ZtxKta?>qC}2}^O5`7
zj~8?HTjK+}KtQ=#K!o7Q1GmrJt3`i6uZ9o=O_PacG1&o5J1>EY)@!a0qVy2TLanM#
z`b<{uz_;UG`*?Y_sA<!1{p%;L#_X==ShqyZDePjF5or~+JA3iE(rl84uI>85d;JE&
z#B}3LgS5NG?l<Ir`qpg*TaS-urYZUN+yZB7i)c8FEOXsc@cVxHbZvLA=xor6d_)|(
zw`DRqm*sLyNK4enohcWWy{fLduN_tN`V*T$&r6x8YwEy?vPgT==i*?BZf5$Ih^f*J
z$LIKug!-`z9{58^10j;BQ6G_v@FUE%T6<IR6!az4CbJm2cOM9O-s5M;CB6)VpDx%!
zpOVbV@8C6qvt4C+8Y=EzF3Bp5K^*n5NW12ca;Ti<8Pa)s{nO^H95r+nKF8gB#(*#|
zi7eprO7Wn=;UcNyz}rHjaG9D^)R4BEQwb?Bjp2Y4h>(KsZaDUPaW@<*AmQlz(Wm0T
zom8DC?6&-A3H>m(IbLwMJ-CJF=Azx8PkBns!k<bjKh-KD>X0J_t`VN;hW$x#dF5_^
zF5!^c_9<IXBV`;Bv|i+yZLs(C(rwCo9LpB4aPPdrwBGGF9Cos+@3(7=yZFl^DZn%d
zTQ7d;bGuKDV*1F?VgC;wTjRAp61Kd)e~{Uvhkis{`DOl;W+C|9!5Sk@2X4g}tiBkK
ztS6$(P>9G!j4<6txM7>!$Hom(icu_@P!#i7SXGbYdOqGx7aCN-!hj(8fn;#T86{iZ
zwfaei;#9G90odj|cGqig2$noURkdepQPA|gKm@ufUo_J6yz!#fC&auPAO@k`Ki+&Q
zb{0w#!{~u?IN=8X-H?R+>apY1ro9W(7%Ae`f;-=p_5Q+*(a)fqTtA=RjFjVKj9$VX
zP^66RuSth1-InU}rHL9CJu5CJjAp`sA)jq>Ox8tci1+}#{KXEo_nAQl{5gb}&j@4C
zCM~-<tD5ZU$^tMM+HNKJV{3X=N^!!LA;C!8pj{{{(i(C#m>b?cN1r$C2qDe5INeja
zhI_cvCoBH2WyW)@Pe<jwSsyUu_$zg&eo4aU4ca%jb{P!4nSMGt%WJny-+O70;PfNB
zzMM+cu>!Uia3EC8|0`5=qVReCBUHh}aEo6q(a2^x9W3T#0&ADlPmMx$+Gbu~9IYZg
zjlFnP|8AO#&uL%8saK(hYQNhuP{n&?f)Z)<_cQsZ1ecS8F-obeFAQ9rqywh~TI+#t
zwFyCRavNCj#36&&<i5z{E#Xli#ekQ=8g%_a&f{{P>UftGP470d3arIU|A-&h;BMK1
z6T`nu64lEm4uhhAnS5O2iL1gK!ySEnZYb|0>ra(-y)fB}fy}{}mZL;HH24mpj9rEy
zui_o1-sHi=q}MoN5xCmhlrfaijlbz~x@$pY!mLrs;Xa(2A;wz1{n00}>_eZGNph27
z2K`8}KDO~oO%cDOS&ou)`XG^1xARB0%p5{DZ<%K*sPUW;);}2&mP<t+xC2v%>4b9L
z1Wfoc%$t;}rBI=gk~J@YQ!BBs$_e!x5s-Mj*?F;u4hb$imu5N^5{=^LOBQkur<TPx
zr20{CtYMyeU@Z&zpm`n~&)v?8b}Oaq26h@-66N|1xQf3{Cu=KA&EU7f8nUWg|AYx~
zk|(TWrp7T80d=1%#tDhynEb$}*E^G(7A9GL?YK87z0##R5CHlDISTlOTQ#?>yBg9N
z;<-y+v*0$Q4lR*Zez)EQk2sUta*8$;o<;Ha|6NeHoNPi2=3K`I%+^yr*)4cppc)Lu
zN+;5D;?QYEl)mqy7BaW{1dve5wzSi2-SGCz%e*bSjUk1uh@ADQ3I@tYt;n?=S8=l^
zswf%@+SO7DT~UHW&twx`U9?U3FLkUBE-lbvsb1KQBvGL<o-sj(&B8F@4f~@$+pP3G
z^YBmdDfE|m2ni(yMk>z3%qAfvOVo<1j2g;@eUHu%PzmIG9uWxFaXZ+Nn*)QEV;o&d
z+f2p?Dnqoc@MrOrv2H7e&-ffq7-w<99#XodKMCUk2X19!%M3Ew{IRh6*>7&TQ`FGv
zJczs&-b;T|`2Irz{&Rku9*y_w8)(ijWo;*lug4daFiumhE}+kw80Zx*5^wuL#9eqR
z%4nxSO!hXw-LbzUD0@sfB!Px$Or=%14L#d<$48y?5RXOsb$p`2hPa)u%#WkUWX|>g
z9GZ|HSbFJ2+70==rs}86^IM>;NZ~LZGEpE2A>)6EPAY`7r#Pr-se&={UCA(4_v*pQ
zx3Ye00}Ov}hUaUZRW@sVVj69>Gzwngb}L=aYV8iNba2-?iIErEv$UNL6$=w;XnmY2
z6Z!1DLIT#AFAqP3-s%HY3mTQ87d#CS{qT_ch-Vx{4<2`Y75ZFxLMq@PLK8}og+ghg
zFyL8~xZ&lIa9+005Nopa{~20+fPh-&U&_F8x!ulQ>wZ*u($wxezoAC~?*Ul(e6-U9
zusV^e)pQ?N4utTS3#sEffwPsGhZmIbf|_L*mWyrHz(7gGCF{MkEjJX1Lo`c`!gMI|
z%@X+R2{(twJIIw21f1bWggunG6xN`Np5xrchmjPA*||@UalbNaKTo!ptNqU65VPtY
z^|86+Wx11_I4ub~^?<&sA;Y#riNSql6zg8ZJ=W2JiwyeJnw{BUnU!8-!-p+q<5I=B
z>W$$wD6(fWz7pg8$r9=qJ&O~&v$YdY5?#^ESFt$?OPQK>6Fk<76Xtz`$!Z1K7Tl@j
z9B*2VAY@~&ZE3olJ)N$mD#|@t2~B3o2~=p+6!J=GkeIczkt)o`72^2Zb?coludYrd
z#V$H$lxD)NJ;=Bno+R?RP7QcE#hQ!?rMMh>jbjFW_eCXn^X^AjU6c8!s(-q{gT{Fl
zZ60~s5B=$`j(ds=>j#=D@8Mf!?xQpd7o5k|KfXHb7WgwK*?L`FXG@~`3cp^Uoe1>2
ziIhtcuqb91_WglXO7uAFc3PMDcVm_*`YFPHZp>nk-k&RvuUo(qvs<_!IU_?Qm=P9G
z>ONljDW3`@U^8;yZ~xgo!J6hLAxXk_BN9ok#tOxI@<d#gi2Jp{wjqeOjaEWVI<YSc
zdKr0LU*Rq5^YxlSGUa25Go7B7K(OL?T|?NCg$x4DyeIe;P2Hw9U11Ap=yV=#ONKwI
z4}yuRj6TZi#mj1shDj;sD#!9&4XEIdOn830{Nn535F}hPI$DP4{8a9hKQ>J|e5PK+
zQFSlm;|)^XAl<~gX7YF@xYx(4QJVgNeX;QjmIfzDD;gt9MT0^~kMx0cZvq(`RjtNl
z<&ph4#dh!uQlh}|O+VUHAdqL9=<We`vew6aP>jY46H7ZcYz<20HUm%_iFs|ODt=4-
zY`UuaI+hRX&b+=OJQ9`9St-a*j(5`zVd57di8&^tCb>r7&<S+BOISshx@Rj>Y<iEg
zg&k#uKcN3}q*Io+nF-I{g(KO+Abi}+j~bS*GhV8g%#~JP3=s+6r=6bA^3*<sZm^ro
zXI9M0IvSe_ZS6T0ZjBuy*18-A)Wmijxp`7icEs%=TQr}Z$Xeg@Ca?xyUyXBN`E9oO
z!xt4~yF~F=^A6cgG}zJvlLBs()BJ>UwD8Jj*0A?`tFLhcXm%k;4^eP4(Mb3Syw49|
zm+#<k9dzqFRB$H~gfCMN+{Y_}>E}=PJPyfN#aDKofjb8Bd!A?CRoiW!^F9A~vOQ@q
zJVGF9rFKA2_d_C3ff614Ag5NGi-oAibPuq4%PRyh#WuIlnB)SNEN!2fIU2cWaJ9I;
z*qG9zK5SY$W97W&XzfsVz2CsoPd;esTI<cY)DyOwpTSM3p{5>h9R&d@5}Nsnkfp6U
zr|l@cZ1X39=)UV-WZIWtLZv?K8ne|`4t6jo9U+^QNHvQb1yWR-)!lyHo4cM?9sQQL
z+K)oI#H-o5vv>fCrVgAj*3f&1Zk<dX3Go!~5K895ymy72$UP=J<hH5it*V91aTkMe
z7Te2S)Z?>QxOK&|B(Jle3wl6bLv0l<SgYBU)kU=G&-f#l#a#3+{2T(WhJX^6k3*Ik
z&SDwU!?5S8v}vpBOK`Z4Yg>YsV@##kZy1PRD-54I?h;ScjXUf~8DcGk_XM0mhcl(K
zcE<OwS98A6Fz(EXcceInva?)7aurmbs1v)L?vlvH5ULj6Z(xzeqQP0*uU~|0O?rPl
zMgv~;og19ZZx^`C`HgJ*6*4>%xFWf&CHDQvOAvADPZNNG+W=2kyFW}2&!F!~{n!~S
z1infeFU&PyXKp!6&{Ym|fD-W;j;MfK5|7+kU!uKJQxjcNX}}wLVt8-&MRH0&-O!-r
zzcmOwkUbCBy2ZW){z()(s|7SpfAk-JiNSpYB<1YaVFC><_=O|87kk7WiroVPZzWj}
z_-tVu$GfA6ZitU@G1&qqp}<^31@_$*(fmQS>JHzC2vRr}3Pmh?$BImJCj^OuL;}hg
zI3C5KCCL!Qk|rv4MH~>kVz1ZWBGGsS3+N1_F$nujoTLr~SCP|n-C=}gKe{IZlVT~I
z9})7+B(r_!!cXEAblUercvSM{JteE8GDc6|@%o_e9D~}}!Wy?8r!_6J0p|9?cd9l?
z7nje$X+2Fh+i4=6YvLvKtn=d?(T{K$*R%P>c#DQHTYU*rF@3o^U}&IGmj%LoB?*+Z
z-mG>R4<(>^KHXTFjb7{sq;WegVfY&9;P!zv+b}vr-{R1=4ndDAQ&Lt;_;-haYRI0J
z=hkzRss<0}DgQWs076&%c-qgPG6uVf@jdX^jeD|1O03;xbt_ug=3a$t8v3^eZqP%C
znf-#*_k<d<Z<<>oSUf#+7^atZrX92MoDgi5v5#QI=CV`h_tYbt&pIhwN1?_A{q5+a
znt8Rw-rJ>NS%!|eujx1*by+rDrXsHxGzi2e=dehKPkoRj>NeRC&|l=p+B4>Q4td4R
zj@0d`rq6tTpKxz=ba<7QcB|Jg>B7U^WoU>0MA$sXvOoSx3=;Gtbz%R;-3_{4^1Fjd
zAK6PL(j{8cbDnv|6FY-NK3NbunF;!R*ih~lWqg^3ZuQV0d&^IZhj-yoa%VARm7k#d
z_z@r-s4;Fy2UoMd{A)GmeK5XLLspkN>kk=T6CYHnomya!*Z$hvo$XL_D|mi3+ZIHY
zHPj+@gJQePq~!s5CKEL@CC<TT6N4x6?2g$e|5v6q$hET$OdjvV3bz~wHTL=%`v8V}
zgpbtD^p}92sWxUVtOLPY+{XR8iBOH5DF>Dk<6(q24t;_1GqhCTeK~E8t@^u=grD~L
zz`O-^nNu*;O{Vm>E{pdPt|STku2C*0>mQ1`B&!W^3&45lFD|F{yVyI2a6r=;H)3oI
zJwtYQI7Hk&JeT#Oy1v)3fDxH*<@lT!;6EsCS=T&D^CagNsCa{v4n$o%-&o&KQ=pL$
z6(Wt9b#CRztexmv@Ra$vY`6U}dMtB}Ij^x@9RP;G%0vu5+HRFSehD;|y7s;MSTa$U
zawx04_7nL!7a`CVUowJCUdpY4_$pdJNT8)X-$G55!PtK09S-RF0lk+pW!W5!er#_o
z1?3YtG%m~%gB9=}4jwQfFWKb2yqQ^I74*0aQp_kN`>sLY^HlZnJPQL}I1NVmsG1#d
z9x;*ci{$;W>FPZ4Gjle>Yeoc8K?ebYt^^HXlHZx<9W;zF4KBUb$~y_XHevIf_r$z!
ztoX+`t)3#Sb{;WlRSs3yG5^90X|kOCq5tlxp*a}9wtkOrZUbZi_ioUeeOt>a1tvYU
zKgKdA1AhSsGlFN2XTFM<VZzhMM|mNjl4hRlUSGSiGwELD5%pzXpiWYSA)W^#jUe>x
zkq8KiHD#{(NnW|2=9pA$Y96zf%um*3MW<!{H4wC7{U?b{wBw@8+%6^k^RYsO!={$y
z7Qc77)sF)m&L>N2=PkpR^27{5sy8{-v%6T8rB|+|HJ`7%ZKC8ZYYs^pT=FvIlZ3F7
z1*YX7Xe60pi0F!dl+JlsVFGP|a6ZPwa;Dn6P-WU^X+`W(rS9>1qtRzr$<HiwRDL@(
zvj`n47mH9}s#N3zFLZ@{r4uNjh0tAH2G&M^EiQUSN-8`CO=TTG2CkL6Z72fY#HO1$
z@$n+PZyJPx9|R0=k`IQ!;U<fedCx1Az_>U-AJAXz){SiVG9&2k^zBRoKguu{pqm84
z(~-m~%VjTlb!AmwOz(uh66#i%xwAPVwl)x>`i4`>NP?TAnJ%b=1gr7W=F_!4KSK!G
zrRyLI>m?C_u4rN;kP7WuBTV3^;6p0tmhQhKd{&GQNl!vt(42I}U(Y+HM-HHVcd~kB
zG}1G&otctIQlu80ngE=Qv{0cjZVHQ|opHU}VFGm}AxFIg%YJ8U_I2Nu>!P<c^aYag
zd1n%nub<?Mp4(gIV3UrwEe0}TJ_BG621UuL;ISCi>c#Aw;5QCwMVN7jLT5ej7>wib
zcr54)^Ir73>5k+_A3a}0$yKfi7&~gYAxUrf?A9BN!c9ifA8y4$PZ-0yZY~$lk7A+O
zB<d!4SUc-HTD1aga78zoj_QT>3%k;3otQyK$9sQ?A=Mst+?)5XTkg~c;HJkkkY7DS
zQS!&yGiu~88j)&XT!c$HvNh~CvOnwx`fH=spZ07-yP-_VVqsP|tJ_K)eLC5io!w{~
zRP#kL9v7e`J0){D+y9PBl2NI?w7Le`<SeBNE{8pS4_&!9u2#vOeua-~Hv+yVfft;{
zL+Q%mm;6d)t62_IR{U7-S+ByvGkedZdoge7s?~Z1e^ViD?6-)$7`axT35^6_t#FCI
zqUH7dKw|df-lMmBu_>0JcSs}f<@vKENnE!^kOuf2EB!xPl8`$G5TplH)EGqYEy!)5
zXZ-fNFL`ZOhgQQ+(SS8A<}O~(jLYJ?!G&+nWF^Jg@UE9x?bbzVosYhNT|lL$^3rqQ
z|C!g?w|-H78p~mwAj|*cPUZlB?ti==;!F{A|C8DT7DS*byunZnA;1v<W^;kKMLloH
zox^;NR)-g#HT}x(jrB>m<p$fEm~JI3lQ@u-zDQq5c=#K79fx8?@$m#s(=R=_Ww$Fk
zIk1yW(eXk(6?5K}aZ-Md)bD2PhbtUFqaa3LnC~YsPp1$LZe8XH-SJRgNFq!0KU0qs
zOTRN{jW76&h?XMeAoQy}l{v&O?<T^n<HWpmCP9fL9xDt7UOtJhm7J>rucbyJP?ZZa
z4Sic!#G@5qx`!8XaePE3u`!gz>BMI@Ai}rbboGU;kHd_%niFm1r$K14Kn9w5BR0{f
zJdY_4SRa>1CFIP!FLWhd*YSmq!Il`XUMP}?Fc|IcLc8=Y7-#OMiL6*=p1-#S(<)yK
zfGY4h%1k4J?$$U6;dn3Wkga8LW`o_3?l)Ia!5CBgFz`luk1b<(1kl0D)8B}k+2+0{
zx$}8yg|DN@_;TxofDlS9SM5e7PQcm=72UnAcu3)j5qV3qw6Et=H!t52hV?wDkc|}A
za37~|fkc6(rzP#TSk$fY!H8c!*DxUSNgVdIzY$TUt1L2D-v#x**j+M5@mk?IBMw{h
zkG$wpiNRw~^#Wbo2zuh~Tmz&*!u!1LbeFJ8V_~`gV(C(}?fT`gNi{z`*(1(^cIj1_
zW!x~H-Uxey?R?^tyFANhU4ky&BZ*lURHdvavNO7y7_3bcg7t@uqbYm8@nKNl2U~&v
z^@P<vx>jayg83Qu>LEDaK3P%rJ+UWdt$mJNwDPY*4fzQ+uqyG=eRw0nbP|eBb!#>B
zDMqeY5{{UUTu0>+zU3{88mz_llDi|)?U9df1V5Hvj@JUEM8IGNr_gsA`J~r#Zs)hV
zV{whBL}LVv#hLV9{VL$Uppwy@c!wJ;Eu~-!_r}OULP<&p_UiT;A*h60xO)7LuT16#
zC|-!Tb(egc$i)5|_Vp_NN<!v0hnm~}Q!l9<+04?!#D(PTR(~;cumnkK*D1sIV_B5i
zPIn{+1F*{#pI=gwQz1*GwBtJTflASJBfYT0Hvaj^R@xz(zC4E8!Q#Ws@vKlCYuag4
ze2xfk{g<*XWtQJjLF8j{SGPCLpr$x{%ZK}?UNyGHzlP>lR?PdzJhi_85?eL0NT(q#
zQ$9KMu#cLOa$)#X&}iKX2vfh(m(sjUWVifIF|`pX6P;tK){#uK<OfHr!{u>#ma7M`
zy&g_D2R75|nN%ojb&gvv0avP6*+-q<V+}xtEuVXKxzhLO-IqIS%GQ{k@5c$~!<o;N
z>vAa=9tqB!)Twg46`!n@9{!+w(~ZC;qc3rx98CPQ=d@1nV4fS`u2c4#*`(XZ?J5RO
zo~FVy7K3Cypb@Xshn_v18_iQQ>)GjL;EtoAY`i{z7?po$&<AHkl%emL4KZr~bPl7|
zoJxGyVi{Po*G%z+cK>q5cr>-9)zi=^RT3dYb<m#YMzQ|&d95+_!LiOPk%NMe>n_{@
z<uhnI(dq25uiO`-L$e~lX_<=1#&ar3fKGO)Jvd7OzY@<t&z>CXatXPJ^!rxumHF7n
z*%Hd+oEyu8D|Kfj&)rg2o5$T?S>jp9`T_*q#Ea&$Ch5n#ItX416KwPN5W7E-7RA&w
z+-URuL)qWO^BVkfb-5Ii(bF7{s{!}-q|8lCHTGLvg08TbaR2OPfH({_f*WncRxzGV
zq&j=a%l3cgSU*iT8}yDyk2f^HIg-a@jj-WAvuYb09Aow+kfyat@l{wtxGi+KBYr)G
z7?7~_gko)aT(N9H*Cxw6(!pBY7T8bJc-%%=04&FEtFZZ$WO~Zm_Ln0ST8;)TTdU@q
z1K0eK(a1o0>Z7d3ZTuvYtU~A_LDOSe(?QfwE;)0q;YHCi29R9~9(nZ+Qj-MB!+sdz
z;`iwkf5q~X3UMRmbx{^?*vZQ%xb)8_uYR}2tX!aJZ~qIFN=13hXG*vJ1K;P|8w^zW
z`2$Y!ET5*Scd><-OdrM<p?dMN8(I+Y*ud{hRVc-2@M*;^fj*a{fTbY~>}n_iO-**{
zt+S$s#&bQef2rW9!NC-IYqSDXEM57%HOe_dBOTL_$RgcyyxtgI*_DF3XiGkCe9KCK
zLfwjeqjf+<X`bjF#WP$LE0&xjxDFKFXtM5ZhzbW-?J5mvWMrKPA4D_L*1Y&pyyg*X
zL&Zs7l=IK;e<m{A&HCXJIMm!CwhT2{3!}O;>QB<i%?G-fMF{;*u0HY8HNPLk8tSAV
zlnmnc`-q=8?Rx1w?v3Lzd4oNgNEEa8(6t|44AOa5B->0t1O+oRyb2g?X63nUKA&R`
z_&fEg^ez7*2Sn(d0e13d+#Rt567k&9<e87WF3<@jbK3DXmRs~xrt4fokyL-5b$gaF
z^_6@R0Xxt+Nl46?EOPZ$h)&yWtgwxajkois8r9~5cSBHf1<>nz%FEn3X%|$$S^n2-
z1f)A3KMIOk{go6sG;}97k)x9A8dk~aoelR8+@e><5}H$t2ywhe;6SO3k1T)QL*wD}
z3;={F#Io%Tb|kx{_K-->bD(&UR49@7du!N%i-061^IXd0jMJK!fpI>$ju!J74(3|F
z3eEafkvjXt)mG)GUnNKawfZ>B_9<?8O-v4Xsn;8zH&y<w_-r&!V;?4lC!edGk(=u{
zCVxFLk)OOqAnv&IGbpt{t17#(XXZ}F=~1v*aGR6>`_&N=xIQ*lIaqMq7}rtZd_)b}
z!~90%tK^2GkD;lXQ)ki++;tnsp9Wl6yvW;iF-sZ(0zPIV`K5kL@l$+)0Wa=?9YN_Q
zh39(yq>h{(Ns2`=-SNc~b=@z=esBKR$?$EnfVy9{=S;TKyr*+FJyAUZw$xl)A*+3!
zY6UV?(;EkciKC^anI%rpc|V1;(aqzg>z7KIuavtb*$Vd@<rka4spa7_WS1M`jSXm&
zx^I)0IhC#5jw!UPZFEj)5)Vz2U+v(sXi+_hI>gvA$Dx3aW49OCq^!za8|XNbLIiPQ
zI-fi|GA*o$N+RQtBKcyex_*6@77-VfJLcTo6T|D<rAAxCRdlg}7sqEGuDN?W!oG-^
zxHH0bu{&~bzhaw7DaPx~HEDrD8MR7|YH*U<A>HiPtBd0U{QJ}EuA*yCZY@1QM#BQe
zCe_GKTh#qO2R*z^HX^$4%qUJro8fBlbJ`KiY9bg3c%0>*M9}UlNzvX4D%-8MClnSt
zb3P^U?28m=R?t1=h~SwJ0~@lRgbaF$@R4HLlrlA|jKyS&%tWnA4k+2Ip86}PM8t+k
z=g`qD8h@zU0NdqhVCNjK)$IA5rIm;R22z_XkBuA#JYGAgul#=vY4<**&=k9^_&NvB
zRiH4MiCTG3GVM%ExdET`oOTr^i6_08%Cdf8@1a`eWPPsK(&to2g<4sp!OrjM`Pu-j
zvc91^J6hU<j~Pga10PDv`GpV&y?iNgO)chYbeLSb?Y2(5yJ(w`O6J_2D1%joA5U{N
z%Az(sx>uPvR*%C>oR`;2MzZzAD(dyGT;e!3WGfQXRui2AX_=WNcS<imXOzQQaZDy7
z<7s|_qieoFVeZ-yUJJ}RWEp5Aq{@cd^n?+p45|fT8U`0e(Q>*hY%}itH`&wJH66!s
zoO#9@;WJ3Be30`eZa6o=q(=y&MSAnS)9r!M&`BCH|9BLkQ$9Uzs?RtNuNV&uc=ULs
z^g`|2gLe16GVJ!qV-S<!$y@eok@x<ZMn%JbCsQS;`4HfB?tUsPqC@8XiX<R(O;@lk
zXT_RHGW#DdfO@t<?$_IM4e`1pT<V+zd}dE|ChKE0h3pSGj(5`VR&s;mUWvlD;4mns
zj;ZO%s%Z}fnT!`Oq=x#M3T%}Xp%HB!42DY1qqr2&-qofE4!FY~z;5)JdH-8MFyD)c
ziTG7K3Wu(y+SR~;aq6`X(BS`vMF>3UClLW(sx^2~s|6C4nE&SLb`L`xdad}VYH}nt
zU%N3uwNN`Vsv;J+xD2qnCl9OAor8<aVZA0QTkgRaX5tt<q0gEwc3n4iZ)W9LSrs<b
zoedr-VQdrrf;M5m%O@Y;s${FP7CpNdIoTH@aofz=QGPADKXV=^UOuHgSeVy2$Vs{C
zOIDa_K*l&I*JA21bB3&3=Ri^cF8En)>`a!8lrmI3+hYL^+pyQ>+;PZHME6_K9l@n{
z5B0=GZqec`*v(#Ekuf-xo155UWf#tSG&j1FC5`>_f+S~L?I2lNJj_XdL1rXZ)|3}#
zc5K6L2xi|Du=M)@pFJ$Sus8XIzDLv<TVoM%dXbzCDL9h2O&hoj(^Vj1HcU-RHNO6F
zI%0z4<q!9%#`K9^NW#%j%KydLTR>HTt?$E%2R(pNQqrMxBb_24-Q6M~(p^%55&|OK
z0@B?Lf*{=}B`KZK4gY-(&Wz5z_gla9t;KQ}nSssTZ#-{3FYfSpgj$ASTkmkO5><In
z?u^r5#B=3xGxqYy5d!Kn42YiFhQpqGo2+uWnTkW*87n$uNgTRym6wwSs_spS*LDN;
z9%tf^y+Ga1;r;P|U<r@(_U}$Yi1Y~*GRIBG4ceYx&674i{2k*4Mt{;OT~ZjcMOytp
z=-}8H5nwhJEq%(nl}gO-maT)Lg{}=|?(h#6MG}|QiKL&YUvrvkLE^DJ(yLjlSsTuH
zPYHFzuFghbk2z+7G!=wp0naYc747k%_q&6I-BNdoRl~WaMIRlTX+L^mjQ!9TnY}Mn
z133Y?Tim6_15VSPxfKLGka*Ig*94XyJ<gLy80<PfB9(cZ^OT2(R^Lb>d16seEtW4O
zC6`G>{89vRJfOFz#5*5uvye1>=i0_rO+1%k?!h9$2pKZ%BI9}==E$)NEx`gHt)U7O
z5u0-I{>0bV_n<GgJG*{As$#fSj-*^l(hT3h^9-Y$Z)pQjnUYMGfk~&t7fgz$N7Wm>
zh5B?+Mx-eeh7O$z^q&}|T#T_TwNMCOrsQgt-w*Hj$N}i<Qm=TAgaA1>Tv=R%gzv&$
z0qeo_%Zp((laHKlz>2L`f3m|xFoR8BsN%hVG#Jyd$bkFm6|esEd#r!-qEIRPOR$Pb
zrfgzLL*HVc+t=58tfDl~0^R)A=r`m@OULr!o5o6)mUEc|(#oej9(T}mNNQCv_~6th
z6R1>tMDj6dV2{SU+m%DeCApog^o2Y_S5h(qY_cvm`N^*I4%!5!&C`pm>aq#Uj_4jg
z2c<Ey#I^CAK;?XVo!+<jY$5o=Rv%O^kA9#%eDURB`TDBc*FfyDr>%<Rlcrz%nYUYU
zZz-+iPGmi%*V?)MvdTDJGwL3NKzeW?hEMgS5QeuJ-N8bQPOZ~`_sdKFHdo`Ja?bA`
zf^K(j6r>syu)Tj9$U4R;PSdcmsI_t(BTU&X??u~WjS*ci0b5{#hOC7{!*S{neTS3$
zKoj*Xs1Lsq`wlS@WU)SZ<#FZIH&vbPhI+T>%kQFxZFOUB@z{Ut)v-hTboTPFdx&4<
z?g+GrB>(uGfO?6##bMO83OXSHfw)zVOFTU}Ya>Vc#Kzu_@vY_EKEd?6RH3;t1sF4c
z-fQ5B3W@aHt?MqcAO_$gO+kXCo&(=|=?=VbzF!aMx?f*!{yP^9|HQ{vh&1VQm>od$
zPf*FF@BWsn{@{${97xP_us=`+FibL)BJdreTTJQJ@iK`h;x~xT$Dbs|D04*FKl-`M
zVkLimvcF*aykqWg`A6tT)<SAGmIykZ!5~%+SO>$yk7Fh{n4Kouzfx1-(0C>c*b)>i
zb~?K~+yoxnk5H(s3JhoqaSLA^&d;r|Qg2M6lo>>c_$o%iD&`yDO%CM<fPO-ma??B1
z-KkKX5;PPKO=ZyHbX%KKs#j3R$Q>FlUj=3*R6Zy-u9hQgO~7$&CMA_xK#K474^^Xx
z$2LelVASvN=ht=X9C{Y5yM2vWK{cDfZX(VQ2JHklwws=^P8)*~AhtYQ+HGk+Wkin=
zJo@x`cqNQ+wdVL{NT!>ET9=E_$=;eA=cIk<xY6as%ZKv|kIY>9r5<Oitf`ufjkI4h
zAp7W8mCSh8iC!#mKz(8nFyXGnOW{hZ#5z(0;aY`xy*_oMNa_E_a}>${e6>JFbN{{w
z(NW9xk3H>1ldrZOv8k94wE|_o4C&+))Gcc+(;2S|`?D67a@lyA6(4;yo2iUo&jErT
zV$U(KG^R+dlgMS*q)|S6I&3;w2Ufd_e%8B}nro*sF+d@{e0=@f{v{vw(a}rK72C-l
ztJ87ZuRM-sdCO~G*nbbFl2vSMsQ>Dic8{XDMF;~TIJnPJ)A;$uG2{MR>wQ<lZqxD0
zz6STx#gV2g>Y?~XN}0GpKw4)1)HuncFln+bw(2YHSCfDVA!6FMw$!wbtZNUP2Eoq4
z^xmIG#fHO|)dFT?N?-P0B0aK3O<&G3jcfeLj~z>Oy=<+AgTBnOZ1;1-ihY*j6zg3o
znRK(Sxw$<BoGkV)*KMBK6iUBABTB`+h5AmkP)iT&rAT*M>HNw=0=Tk1I;?qo{rVgQ
z9rEJ&)&2w089KO%=<5Zfkig%B75*l6_0`lm1^#a(l-&^rmv|fOZg1)0{SFVjyd+7{
zJ>|N%AED=MQa<~`EeXl#AGHq*gI!-b3o#0X$An~MS&$|o9zGGB8b_5Sz-Hn(7!OEc
zj7Fr3kbE?jx!mVptg`Oh<<@nY+#kL?_BQj(9FmX|9DDVi@j<qOXympydiT@G>>(3{
zW8?*gA^h!CIzSiUs57}gGA-11$N7=k;m!x#l~3O1H9RBDf8i>%$=tTP_AD!@noesB
z7THcD^*?Qf+cC;4CREEq!(cy}E~4<skV$<yqYW^Kd#y{!in}-rSvKKx5icAweV@3l
zMfLcRL!xfn!)})3m77q_AMgJVeJfXnzF>Wr#nZd=A$3k4=89lpz5=S~18Bo)j_Tgd
zyOdSs@NlK9w!5J@Msl&Uh4r#B_?)Wo$WrKh4y)2R%IPJmPT$_%+xrn(P3}?tD4b=d
z0R^%MOsQ@lr$?NT;#b<Qrh~)J$7yXBeyp(N%WY+XsCbBncf^OuXNJdNb#Ro^mLlua
zHbDq|T@v5u3WMuG+fg{Z@8j(nO)bM|;2yk&n>r0wKuLb*hVSpJ)z_d9q`$G<J3^5d
zI4{<(#}(SXo26d-9^JBcSQN>)cx67|?sBLg$2@Ne(5+fA$8+m_TFr`whsApZckQr8
zUGLt(e_6*Ls#I!hfiGx~%JZ?Zt&spDpXKm5n{l=PH^L4@B5#h-$Zc^;ZTi&NxE|y3
z=Mxnc56$Lt&8o9l#Sok7DljPYGFg$fYiNj$5A|HZa$9=`?Vn{8^=^m#MPy91`;pk@
zrTU<CYJT*_t&5cCTML01)rGCkG7h8j`-!Fz12D~>k=zpY)wi(M_t0|!i!nshKWgcT
z#<C2s2n39)<!PqHZ+%8v5PR~K-I*E-Xx*EX?>X)Zq<4ZO0R}4ZuM%M3oZ|@{$u)7R
zao+YJ)U2#u+jLtF*yML`n1bYs2`Y()5K9H)b11(o)UE(%S2H7u-{@`K7J}b#6}T?P
z4W3n7uJ=EG=#Y?^L@DLl^;88G9rMEi2_6EqFu~KK{pjT9<HH>Vo5Lj%-#@UJb*txS
zRVHax8n&V0bGyfAF21ERkxS0je05ai44Q9HHRuh@_H!S<=?5!Khe1>{$ux+nbrlG{
zmw=<gs%M*ed9b1_6uOLE|C%Zf0FzN>p+8kr=-uDp+O3X9zR!Q}*FWQg@CXdY@;GkJ
za~v&!jm<$g4A!~P*hog0BEua9%4x<j8lqc_F>-ny+pz!-q&@xcD_V+JEVJ6u#pjuS
zP@dOQB_NzQfdFO-5%SaNRG&waL5f~I2i%o4JQgX3Y%iC;O^lo6!rWm0tsvZ>Cxs_n
zEG2hC?LG%{4ipMr&JX=qO;2=O%O&OV6<!YE-TJu6pEQhQJ%)=iakA$T2UzoR9r72G
zSB63@s~1$uyJM{yF5<xc+qB#t!ZGN{^#><-iK8KFnbL7WfSBw@9^)O?=hWq9lagwc
zM!Pt!cHh^CV~g5@L)Yw<82z(`3)j}Q5$#-vqP;<%zu}okj!JDs%}qV>fSg2>ciRi+
zj1-BM<5dC1((%$X*)+uB_SmPH>6uEE;<e7}YuP1Pz>NkkXfC1L%9l|<@?ltH)+G0>
z9N+WQdnvQKSl!sDP0=AqpoiFWJo){n`SjBAV!TzD<w}3btB0mDyH^Ii^2H$|zJR%Z
zW&sv;w+@BY?lUlnDN=ZwNP6YKzOveB?c1x(hC^MQ^H9MHQgX-|#Z9|6YHvbQ>Ed)#
z)_9$I2~QR$3LPA@{ey$kSbk8-KYgm96HoQXdXi_~w430^SC17(-u>07;Prcs<+8@(
zW!0JinuYZeeiI;$i~#JRG_~1UBj-DVK}`KkuWk)H{<7SXxK~JNuzb20(7bzJBcD0O
zdf#_<I6i1_A+SA0q*a{sWrMg#V56U~Fg3&R+Yvhx0VYDC-y;s84`3o`tzlMS?y$_+
z*2Jtc)=Q(BuMh-~pVl#@0gd?Ic#BjXNjjG26|GwK97lZ+Zn)`X!+Dv>i0pW|+bwP)
z*&N+mN_NZ9n1Y4_P0rb+W~Zeg++<vB^mPg8auD91te47R7b`py`H1dPk#f4_DRg+`
zQtc)$tvWz?0#nC0L$s<9@M@b|ejuribx(O$uzRhd!mb}$%Q${p&nWLjCe)F1^S
z(VRObTyq-}c2lX7wT=oI6px?NsWFCGHms=DRDM2xR;u~DC+=&Rea9&euO3Q)&y1dL
zm2)AwY0w&ta)Gu>jz%ty4P<b16fcy~MNb;<^5*&R(iZVV^?Ssi(&^Z(iVB^lGP!E>
znM4znVGrov#_6~`;J*-&lYBy*wp;GdrRw@}52}+$Zw(pZ-o>FNd`4sirqsoyaF{+e
zf^yHtkN0zwG8xOwhvF^{8&5l)vC`;J$>7NmaGYhtm75N{zlqipoYUb`ofIm#s-R8?
z1pp_7orDf$u`m4<c^qpYHyxdnPCTbV^>~xe7nL(kYa!2*!*+wOk6V$+S&!d-Z=a_p
z*C}`R!;I9P2z5cjJ4&^jKHokic{tlsoKtwlD!Q-ne!A*=63Hz!65!qzZ8G|tgJ_lW
zvIurgw;I!!T7pT=VwDO#ZmfP^z)1Aco*0WKjgf;g=<TOe&{c0*S){#CcCpkdw!fDT
zW(%viy4u9b!PxIstv*;RR&x{Wo-9LwS+55Bw$p0u?sN)6Jf~6(dL^g%aLgtyXX8VQ
zZ^|2=W9R3wRwr|B8G*67f)1q!{mtFaXwyT7FGdE5$zm4!7G4z8Cs{WBK%G1lKiL6Y
z4O=k}y3{%uI}et_C?xGK1TT+X3AeuS2+!zQK5*Q~Hp-2v@hF**LFcpk#v7sDkgzV+
z73D5OQZNvj&Ov^)fk%E0>B^bXZTA-o!OU(yW<Q;4IfKB$J}g^8j*i$gi(y19@}1sF
zj$5wR{Egh&W2)bBVX)2xkLKLiys+&Eh9t0Y#FbJ1UHh&iI^<S2W0S}~dT<Sb5P1#7
z`}J)S34jp}+yV&^53n&794`e=zq{jMf6@4yx7X|Ahh^D?-7T5P7lLKp$unZX4D}&d
zIf+5{;RkTwsm;f?HOu(v)ndVMEupE06&^TQnts+CzF%wNTDo2B-4X@|mDtN0jC2s2
z8Z;L6=E~nX??>`ckVtv5zZg#Cq?ERguLT<vjb^`>$_cKptY(xw|F$QI&*AP%e^O@@
zcAzBZsC259ryh{e6O$gr{kd&C2b<1xq0^}5L<k+iX*K2Z`nH=2XJH+39ge{33MB9S
zO7ijL#m0*rIv-h&twY^<S2|%)IlEcI{nQy^4D4CTXY)T+{4V+i0>az)V_oy;0EP;E
zRjs_()|AeRolbgGvsR!+UQ-jYlHbj#Usk<{Uk(#2UV4q11bTAYN)DHxxvsg(Ltnh%
zeYUru{5V;5{7WP*M`Sj|9O6a9c|Q6A2gbb~ZEHQ4n!4kBg`Ue@OfF}Pk>|S32JdW@
zLg)!5T>*b>sDj}ag&Sn3PBMH{BU{)b0@??ZP-1RZdUmr>d6VX3_E4vdyxhmv;b!ZD
zJ^DLbuxgf(=#(HA)HR_(2+@dj7roL}jFQoG2ny)t<*n~J%+tHe?%S|co({>K8C~Q3
zLn5eGAoP@U8qJ0xMa;ZoL*WR<)jM^Vkf!UUQp^~?{g>WCR6m_7H|_iCFWLBd0A?Rr
zR`|R!-*K1NA{hC{s6;rW%=4r65x$cl)e<l3raG75#nl(X)Is#RtHT32=3N6%feB2F
zGYMP{(y6sq>`G!~fAKA2TR4k$=vSK6NMRBmBfnSyBp4R!PYdGT$vRN85+-hgfTv8Q
z1>>Pc*#ZN3VZrV~bGDL+=}}RW{pOj5T#w5)kh3+unD(rU!eP>U0{o-P$q0vPzGASh
z+e>;;QBkwp`b9J%o+lK#_r$WFAEP7^JT!gsSdVCyl68MEA#^3+?w4x*ZyuXxqL%BG
z7Spn6Vs)u@*uZKf^()mUr&m~5jr8=42%Bm0@K0}PfJJ9@g_M$ldQ)4Klj9*Z`|Gp2
z7f&Q)(#T%j#K*kRC4t*&60nyz@(twZPg8+G;hG|Eda?9rYjQ=2YN(fp_j&Jk7c(VY
zAN>)-#NZuFH`m&G!XVA1OK?GJF<mT^&AKy&Z`%FYV)o%#xdJSmxUo~Wc+AiFbQGP(
z{^-MqKuL;tsP6DZLG81FwJ5*6yVHbnuXKs?kc;b)eA39%mN#5>ch7X+-^kZFWk}?5
zd|M-MP?fhs3w4})Gx$L-*`)5m^4-g#D_(JG7s$LHSZ5?P)zAvtv+3gtN9TjCyPt3%
zTJ#vtipAbjPz1BGzQ0q5ee?GO5~;i<lCPg=7&m<a>jq6kZ0x1O=-k}>KDtL>7^#H?
z6&_e$rEP@*NYO!Z1WjNx%(AxLq9OGI#pQ(*of>`G{@Tbw^+BvvPkKvBiCOYgebSyp
z!g!U!-Bl)XvM;TzSry~m(^{7qU}AX)G+1YiDE0Y^$5txE)g!$Gc7vXE{o;s1GuqMx
zU>ndhmJxjuO<{x6;=72|TY`Lmg)uwt_s7`W&5{<b%QW7h6hOT@z(wMIWMJmhrh|14
zV{;&iPA-W{A_#}^gW%=a<cs7p{3$%aFte`(8|4HjP@)iNNg0_;Pe89b?RgsPak`=Q
zSXe*bF8-^S4zbJI@rqrKGo88^k!1I}*8=DB6#35^jz?qET}AvyEURY4*pW+fF;MQQ
zG3d!AyO(?^m!JV`LGN{mS(R}ahK4*=&!tIf_A4rKLaVJBWv1PCBLSTC42ge3vMG!f
zaLzPTqvw&5twhz4T5~4_9si^gYUXIfR^Ds+g<Z0Q>7b!u`k2e3P7AGOp+altERWlI
zhQ#%}Jj|Zv_&w8Sw{@k_<OjsJY_j(vUp=HVdsIYoKjMUMB)I^$tufR7V7;1<<!A54
zoPvBxnf-!Uxt6ZaObOD$a*u@4ci*#6{=wMwdr1_`{QW5u4x6jzrB1zh8hew6)3iSb
zTtXrEc1T6%I!;P&P|+0J-4pT#EslBD-fT5wKG<qp8oGlzSS1smyE5i+&M!8!Bv9+L
zl>vry23kJ`eXNgd0yfj4Gm=5Pk6-ZJ>PTUqXr=w!kxd+n1?|RU<s0p^cY>GNf;_J4
z{_%G_ae|31Gvb-!T9+Enc1pE8f9(*7F#lCEa1%6i08)8fTBvZDoll|OMIXgSCIzQN
ztR<k0khjG!BzSV&9Pjp@+361u3}~o-<~w<|F(syVY;<h;s+2IfC1kFJ-2J`74@!wZ
z56#uA=TRxpjs;|%!n4B8__V9N$%5iwhi_&hhehgbvZu7GEyAgw#av;7$H9-8OPtG1
z85-t!YLQ4btE|vhN_xS~YWX8WO&+X7#Qs7hn~09VQ&}sTx&Kh?`~(o@mai&HtY^NJ
z=1t^xi#pgE%N^w@O-PdVNeu~Yq*QyDPWv?{z`w4zWp2Q*Eo2bzzGc2VJ-{)&lOcas
zX8;U|<S52=BC(|DSo7M?Tm#L9!S5LtE=S{S7cjF`;yEJZGw5SwjK_<ASdACWRwDFd
z7X=@`WP3WiHvFW{>6s>V%WPW+VLI!!5p_2XWiHL|GetbLLRF=J5(|#_uN=L%3Hy^T
z_-)nI)JFYI_VMNGZ{Equ(_ig&3~cAWXRj&p{9?E7PGC$i^B1~1$qyQ=pBlK=pWMl^
ztap_>jF^8mUT#OVF;&`yYZv;G3v-iwL|Z%nyGzOb*+U|JkBEkgITV}s?WZQ_;u2QF
zRV?h5gCg6pl$QNm<RNSqmJ*ejZiG~$bjLTtdFE>0HmV(;?hd9)+0RdZE_3LL;?r2D
zw4BQ9F4o+~Cts}yKH{A}+;2R#{}IeNeO9lmM@Y3md;fjU(=<TY+MglFd4ip;6*7>c
zLa;4RC}(Vg$->Sa*>JuH*cRK<nar;O2A^oJI_n#ctbcAk?gpEkNZXNMQ7mp6Cz|;q
zW+p~H@<-5n!Z&2w_3`-rB~vlb`6>122bOtk7kgu=2^sMCLP7Dh)o(uZs&mxai(&>}
z#Q~OvHN;TiZfwD5&g_fJ58|o;oYp6+T}(S{qP)ME&uh?mDR^wnrKh|M=hhN^3>Wv;
zQ+z)Wn+y!X<`mj6=DVe-Y9}wL(C*zt{BxZSR1rb-#lu*U59s1zInbGKO!?e*OOd2d
z)T~LLjz3aoaC42t?j5a5EXJT!uKe1DCvneo>5b_8Bz^L0B364YcB=vHjoQ8Q!{<HX
zxnEgf^l$%s%rIT0>^za0QDNu=`3dZp>(W-lM?U&W{sDPmMiCC<O1(jL6sVtHy#6!w
z6M=(}fnIuap0L}Z>(<G=ke%dR=IEjeY8OJ|bTKG@+z0H?LSc8E59`sWS;@8UQL!^5
zCOPK?^%*wsAL;~#hAN$gdRW{CgHkx<Z~v@`99>=IsGd&|=yJT~jQ~T?cX)^5Z#9s{
z;Nlqvlb1e7NI-=lq1%P`{_XLg>J}`|ShYIBV#V$q%zJ57Tt$%^_|i}~9Q!+v1fP7M
zMv_kC38z)b&O>D}n}?29SmbIRM7gYHn`BwkI-1!T8^1=sD<~Ela=RS$*VfNpvhwpv
z3X2*c2Df1Mi+KNo+8(}R1}7ToBWtLiB9}N4DpE@Kp41$nc+ITC=ih(qHHak7^`J2^
z9Ib~6jvVO$%b&*PC&I;p!h_&vwNY$S|L4X2dc8|-Z?N!XAkk?$y_Z7kZ2Mv=)en|E
zSWx(`RjW$0`mL0TJ!@L1e74)?*ls14sj>fS%3uHQ)pxtVgyYbIXwr3981caiULEY+
zTWlhOE{bYOtCsk-QLmL}>XMqMX3UoV`^dD{m9qTuFu3K=?##z8&$~PTkYqK?-{Go6
z{JW4k-<NN2M~vfhzz4~w8b_R)mu^SQz;uRm8?*VnnV?QF=MD_*JEqW^IF2uD%&4|o
zGR+0$mfy6{8v)}AGoy>)!C62q;b-*#XQhBH`n~oOea}trQ&L(&O|e1FT}t$N1np0S
zqJ9pMCNoAx2~B_3FK_$oqoSCY<R?ajBsEZ>(Rae2y!o3>T-}nqGK5wwN7za>Zk`gk
z*NX4W=SL{GjOYWtjopQG<A3BTKA~SJ(c{s6_<lX)P#7W`Eu7-3f;82s=d#C1<7kCY
zbMYgE`P?D7&ir>fI{1WI0>Z^=9m61oaf6r0u_S1^-8%t(mp5FP3@rci*+s=jzvIYm
zY}Lh&Pdik$QGXiumP_Q5X)HJm5YVoE4^lN2cX$5y-{h&U@FEH#RRZi)ylfC$MGFnw
z>Ro;Ux}+vWtnOnW4?@;HG<aF-?|>3C&$OCT1TkpZY{AUbxuU`y6;qD|*fXQtp&|Uw
zSBB7egOp>Ad@*JulU|bfEQihYZZX_my$_`(ef{2^2TGD=GXe<I>am7Xzn{<b3KqCB
z!g~vZiZNiyjh4%aCJU@L4?X?+ZUc<Y6K>47&q<OXJT@Ty<NB_7>r?0>vxJY~KcXyE
ziLIev3uayKcvO5FZiYUL>crgt4>NRyaR2^ONP?1-3G89ket*dN4afm{KU}tyzQ*4w
z1op*}MZ=Cf)z6ojkc&3%ab1E&?Ca`Je`+s6q8H7uuyIhZ^j!MK_4NcQW3E?A*(vat
z%-f^Pz~k!o^?Twa*S3&QM=O$P{rh&pKeZC^*J<=4tl?j{fM3XIfBdaVa2gWflxG+N
z1Km;9k)n=KuM$F}I~|P`Rina7N)jU&F3A3P7NH_^=&W81871-^b_M?q^3>~E)c1$;
zWRuenOae0jYkQO??(KW<o6;ZEilKntl#n+P7aLoP1a0k+Fs|MrPVN!w8|JD{^0R;b
z&VS2^(1(6ly#RFa;45;$7ql8ekh5NZ+iN6MZ)QU(hKNhD#ahgbOJ?PL!TH1FO5XNf
z&!bPF!IW#6$$aV`Kjp*H0ncpwnEIS>rD3-*W|%hj=I!Pz9d7ygw`s+GCU4Q%2;;Ib
z@+arHYS{eU(p-HGD(vu5ZR*F{)3B=twxm9lGc+VAesA%CIC`EAgP<h0vWNl-d#va+
zoYJaAa!B)B4a!wv@h`c6-0?QwejBt-FZwuQ!CpSf`NR*vPScDni&Xf-PC-+y_9=g8
zL2t(lEtHhwE_6?!3&Nzzq!-3AzZ3f9Ri0$G?ib;IZtC|NB&~uahCmkQ(4%D?{H{JR
z@F<SVb@x3Dl;bwypKk0LLaVS4%ve>aTN|Ro4WswmeRN?m;pKR@)gA-6%(r_%&x+MS
zi&98$0yjlV(-@X<5Kfp6#Y6reyC^*Pin9ND5ZkL`EU`X<`~Sd5p-m&i#@Am#i^w{z
z2;Lv^bPakW3O~gtlRNX(E?(#}1j=oH+DzyclaiPjrjhYSBo=G>@)si^9)PNW$7Sau
zIdX+MMaR=1ES>EqbRD2o<ag`$&*$EAR99Mfw$4Hh6GUpb7Rv8|b*2P2p?_NQYu6i*
z;5o3<VD#5l%H=KjiCx&*b;re)XFVb&<_Vg>5oxS6<;lz|wB@to-A+s{#UggTxRR0*
z`!K&74liSH|A$==>Y%tf$j$+SDg>B=`|yK=fBSDuGuI$zl%%jYWSvtO@2VsMLGdp8
z$R@nL_5nm6{q=`axzJY{x9jwq5F{le6rwPQ?@1YaqZY+Vh)ld=U|qDX-Tixaz;7ZV
z3B8hH%#z2&w*l;#p@1QZq{b<*T>A4hgFmeX=?v#}m?G;pVl<<}m5dY*`pm>gNpt63
zXRoayXuDkr;obaDRmGK~Sx$St-9}ROtOK)TVgm~kQ!=c0`x$nsJ}8u;zIp8L6ZT&v
z1@@O8oPX&$n$=r4&!r^<*;zrz3M_Ue(EAnW{jHB!_uxmGA%A?k?dp*(vAxle6)4V(
zO^lEp{nQXe|6XNdSTp;YfSQjlVfAaScx-HJnd62g$jbL&VOX1H1&}|TqoJqwA&f<}
zH8wd{lloM3^_~9n&-AxfVF1m<wmKugnltDyN75$+JDY*mpHAaC`p<YT7`7^!h8jTO
zt{*)Mvge~um97KU=8<h$e9OBBnB3ybIS6!YTCqF#!r#9)?TKRt1eZJmRPpLqgxFfD
z<~<QK<cJjiQjx!ZeJ>%KUx_}{al9L_H{pXFiQm4xRuUY_daA4+`A^g#9|M8Aew1)p
z_p9%EwggeX-A$u)_9G&4;p1MH&&*;^yb>s{QInJV;6F6|0DV;|0+|JC%m<qNPyn$`
zVxUYGs8twtDyTYIel$qGe)+$Thw%$jk$<uVEdJLJj$xi=cWvWa0jvOc2c7m`Vi5Qi
zerMKUWUmdcOweWEH7TEkfXY1jH|UULC2~k9UKOC7!y+b@RmoLN55%TZeDVa!EqZ?j
zbfygKtqiRkZU5*jdn{v&97_L~T=}PG`R%vxpZ%ZjNh%+BC2P^Ci6QAgw;(vzT@0G~
zG*-X{&x5-Z-Tyk>8R?ZG-r|e7dIAWVH|$uM^H3jdVQa8uCIZ?N5D=i8DNDo}-$Nc~
zjl(U{c;gmo|9nR{4LiGv#)l4bGOY-7M7<CmLcZKD(pMhnUq1%?t55Kiq!n#&cjE$`
zXn{)_)Bjo0ZbQm^W{i8{XngeJd&C9?2J9Ci)o8&|GE92WCQy3J^h3d=MKHiY&}ufv
z!oeW8E!9f+KhF|#br$q35osb2{8qt(-;vb+R>B45Tjt7qTlq3y?e2!&M9_R>4f4QQ
zfLamj-aQG`+(>**OX=d`;%BU}SdW+ssrdO51pxo%$y^Xq#6q$9C@rLkGKc{$Dv0~{
z67WA#4<3r<%5afRddGm}Btk#$!Zfi^{Qs(n@cRKoZFhrwD9Fiy9ROpCS%521GHHaI
z0+EV}YG{3|6ju4~#C$9)>_^Qd>+kc~$DrdEfceXT|8pcE^s7h*wK?$(4FC-hw_yl)
zmK`QZ9JkT`?P@*l!ei|N0<zmz*Y4vjq#E^VkSQ^3eVraOUh#m6nQ#DVw}Q6@-gmHI
zQH7L#Bs?)urY)2t)8@yQ0q}kitNkEVmD(x)#58OD^`G6a{~Qc71L9xZmGEO^ahMM1
zzlFhoZq>d2v%9(By-p9z7EdnJhfX!`iN$zXN>LFrkZ>&8mU__4M;3zB?Ld#Y*y5uP
zLYTF0`DsqmFQXG=GqdiH*{N6gV-cq9HT~~>r7)WW%QpXIlf16O?(X{Mgo6Lt4dUfB
zePzSW#h{O`j6^EsyTnLQ`sIb?hB1w?xy_Tj1g-VQ>PZB&sr#?xpZH6dA3vbwzkd)G
zMGt9emUDOK({bA<mlT<ySLpMZ@%4p(T@Kep#l+sXKE=2gHG$f=DJo(zXqNeNSbooP
zMnyux_L<>g)oA8>>r4ATzy+}P$#6X>y1Z?G1haLB<nZu3{r{*Z)b<F%du#T_?}nO~
zPK{WK9I-Z5%CxUDqc}g7!66$ir!ABxLst#|85`#=wvCOAEeaai!pYB!SeU7RiaV@*
z1Icoc2f{^P%~X7w>7f-98({hrBaYjS5)hC+S|KrG4QF6&%Dtws;(Pg@2Itq`d?JO*
zivFvaexT|gR}<uQfayyjun!>8sW&<$On!d*@W8wh<GZB4OeJ!(P!vV@`g2^Gt`+JS
zLo!s3*yeUjoJSeVA@c;n&!c;h8)E~}k18fCl|(+VVit{=XN-=jKagY&dc`eS)Db~J
zZ44GnNJX1Y);R2SP$m06X`O>4{j@3<1>u)MkxMf^>{S2t<KdMMvCF@M)i3~bh21`}
z#{bbG$g4w2L?2G=MeGKes+~M*vUGOlvQeIniNT{)D<BjVM<FXf|7mN>MHmqkB_<&u
z0aE1}fF>_NQB|ZiI?;M~CTp3Me9#Kn=wl{zIp>r!MQd9doeR#z4wr#27Yu^53XT+0
z1M{(qckkXkN&6Y6DHrhoobK0T<Onv-SmH>%0jzmkpZ`CU<l0pbi|7Saf{7qCSnmaz
z5vl%bGosKZD+G81;X&a`b`^3NVCX-x*4)tmNR5_J0}8V#v`QIo$wwC?aaK#1W73W#
z$(Tk;KSa0ICa7b%&wRQ*UTT7t$YtY`AiHGLRHy=V+mQ6t!@2mDqaqcI(A|)yO80=0
zQnB3ZE0!K1O^j$WJ!3DX-4E&}FqoSO2w}1md_Idr=%b`U=)P~md-Z-dO20lAYPyOI
za1$Qz!T!oi4~~QxK@g>cZjOw7T}6aBN<LgeTaG2@1@qj=+bY>t05Jb1f?zJd)Vrj#
z)R(wDg|9UsnQODV^LE^dTYMHAd~phAU1fQw#Sq3KVv{ISk0`SZOQ<V7&QFxnC9ze0
zb_EmGNBcDsa>w|6qF*-JF6iEk60IZTb_Ud*pncYu=jBNmIjZp~py5->Rn3pMpr<tU
zH1GQXh79E}i0ooTo4+T;#!9TLtOTN2MCc0)7%8Pfeu&`OiC%>-|HL1EWt*t+t_-rz
zubt(<Wx^7oVph7gkfsduyRq~ftg#l(wyCpe2!A+^CLymI_jrg_=DV>9*Aw(#H!)jn
z5W>?X<;uU3Sw~yYXGjXxuh9`Fn8K>C#ba*;xphU-iQggMP=<V>?_X%yCluup5J*Z*
zOT%ViLU~o4gxFBG5IttDstX#v0SR#C5b!N9>}OfOuPXYa8^ddik(E^u1F=*P2eFiB
zqLg`b*81I~W#;g(vZ!{Q=>R!U-|2nJVDy1N22~^3BeegnpD=48eANs_ie&&tWQe42
z3;B_g>7LIF^9!t4hFRJma}3d*mG+O|9}H4_`z%ua4@BJA%ZdI>g+lES$nGbJFj~5z
z!14|taPBb2;B1Kf`ka?_h<YfA)?>jq+o9=Q7(Ao>y50|tB!p<lXS&P6`56LAS_AIK
za%oxtyqzr;jGv<(-P&{(7#s|<p`v*7X^3{7G|NWb%;L9`*i2A?!;|QkwjYwg!o|&;
zuO<od9eaJsVKJ_ZfoGTG*Ob7@${Io41ek6zLA`qbtXPY5#kny-{v(p_0+vnwuOHq%
zzmPjrbQFeigswxe<VSKi(JUVowcam?9Zi+c_E+$-{rK>fxD?&>P({X17zl99|MmU6
zF(p4?(LNMDQ@*{e_#Vm}6YCMcnt1R*qZppi?O$h=#)7?sB-(YH8zvtg&{0K;ROuVd
zDxOVzcyvSZ$rE`<BmLrnE6!F4bro3A6j&9F*r448K;eD~Y|973L#It`Nhzr`5Hu<6
zF7`yaZhn4g`1EOn|0k6k<rK58IW!frnM&JzcW0h7b#!!;nSG@_xj5ajTfD!CgB&XP
z^QV7aSLV5Uy#}?i4b?>#cQK_D{5Sni@C4uz@s)K;H%T^32kL!YY-T6>rKd?cCvJKd
zb{I=QV3+=}du5CT_fvhA7nz@BQ89>mVmE%`qQLXYf4c-yQ)rBEOL%)e2DzDa?@%+*
zy=-!SeM$LlJ$M?H+7Xu$?wix!38_|~&yM>stBauY_Nsg<`BW+Fhpb#_$shRkt-N0o
zN4!kHdY45ct%@S~MTvS0Vk7;!5zAH#iy<IQx0BR5J=nmWFt<@d6TgLuhNe~lAhu+L
zJ`R%IoTKdeXUoc=hL@+N&Av#1LR|OnN91AH%%PG6`I~kx9kl!?_O<4c;-d``?cuX(
z)!h!;?aw3ZC_K{Zm>1zT78F*YUo=#0Y3(#b@*R!grJ2NPvJOdSy>|xB`TuVEetj-K
z2Mc1F$nofGc(0+rjSlb(%xLhIXei~QqObV*VxmgqsoaBi?7aRguRwUOPs-TNN!)Wh
zP507!50{)zTeQ;f_+FCJ8y0mT>R~#im=y7-`86TTfH^nn0gunk%@Nd%^f<<3OybZ2
z?P^w#j@1n~=@O$~29$A3E2Vt`Y2Dq@4}_T~O7){HK7NStYYN6^S0umLwcJc-5VJA1
z2_hmuO?aQjZt?9;eBnjrcz<$2$zJJNf39^bhibcdn{!#=?rsmemL_AHLxmXU;wKs+
zqQ;pi=+M(1oL>o<e_sZ=*A)i1VZEd;3BH*AO6a=W)>@C~imhl7SQ>}3y(jwOBh>l5
z=)Dz*`R-17qEjMRd(3YdiUyHR!9gx<rS?8gctnaE1+yOqMQjRJ$y9V0N+{FE`EKmb
zYk4FR!58!e!^_anP_%5O24sY?{5>^Vx>9v<klI>X6@ctu6*C<gVK9jw);n*L+uWat
zw`$M`ASJ}d&)EwL^T|~!EPw`b*D#~J*0|kWxVLBjp!sKxO0MaTFTu3;4|)WST3wFk
zP!mQd@7csuy406(RJ#zjiKI}Hp;wGzg%x3n;?2!yi?sju@LTBJuZU!j$p1NrNFahR
z!0^)*)H5DHQBi`huFI3#wtRYy+Y!6LT<7txR$K{K%3Dd@IgcFK@qd*vW+c7R5KS^3
z1erEDib~T>XjH|&dnW|<G|gdQVS%5bDK2+{S{uLjo_n0EP@SCZ_C=aD1`}{*fO$Kb
zIRl(cF;P(($L}y-Ea^%7SnO7Bd;5oZP#&&vpaZ1yr=5hOCSxT=kxyEUIwKTX+UX^u
z6oSg<^bcAGUK63d*?H=D1`=K=pz~1F+<mqgaXagJEi2_=BoobjV-i*x3||=>oA->`
z7`ISpSjlfmas6g~gs!2RPSqiP&DN1i>@Z1wDg1mT+pL<J&BE%1`1ZEZFj>RVoRXx(
zo$q&5Rz+a^hA<iNR=k>ZtHL6IsPjO*K6y&PE3UYp&H?q&nAZ<}tM=`MT)kKOr`Lyn
zR)Qs2uY-2DV1K2knAj+hSXnnAMm4xeB6UKeyb`XNU@uGtb*K;95EIQ)je86+r=?J^
zoGM4MMLz`9ymZXJwVFP|$iUhU85=8Q10)<_nGVUz7lrkz7#OA2YGOEx7Qjwp6I2)}
zFrqkd3o}QD5^@XMEq14rl|6ibybZ|CWH2x=%pU4*er6($x6pXl9nkg;L9ZaZp*kcD
zWj9L6*f?V@-mh6alvqVK!Nh<yD8OYcPFQ4KzjRE}I6mf9Y|Es?NqbAdxxy7e-j(7|
zyCQ5cXozv-st_$#3-k?wM!B!H3dV~J>e8_BN%R}H_A)&~301q=|3-ii;wuRBX@V0r
zswqT6215e6Wm9}ykfyn6Uo2u8OG@k!rlT6E42sF0HUCOQK1lpkIC>IMLc_2?i1a|=
z6N3i)K4%>7P+lR#859t<W^!>y3WrGJtSovAEJEEVvJ}!@2Xe)vU6hPQA=cN)NK1bN
zwWC4c<6!w28a<bV$iSm$(a-dAMvtt)%I5%zJ5mFT;u{MW^j}~~%%D>fA)COJB66!?
zDaj4XjaVztdja2B+N0yXXrne&Ytwg13+_G(J~Y|yZzj~;y9ZvO5%Xo$ISbTLs@X6f
z-eLDsh+&ZQ_tC&h;H{WLho#Q&$n`O|C>q9uGRpQI#<p_!Bl%7=qc|L(+E9pR+znNr
zSI%mk>E1ur!Fx<Q-809Dj0t@LxVNP+{}Jb-D_}K>t9dm|Au0ryOE36!f>bc8R&yj3
z+xY)1UeB#es-`GOrrmb4{luX4?|bCEZqpa+9~0j+;FA~|h^IDQlEon)pc?>)t#xJT
zzm*3<VSY08{PYlvbG?YnYTRG_ng&!nTUZ<CCZL(p3%KYK777`4TX|o_rfaV8AwD8P
z1msrIK+sB~@CL*Sg-6k;x>KF^clk(YroMi&Y0<No;|L+{KIh&}F!G$*kqUfYX*DhT
z29-#$rI}u6uE7lRT=;R1FdiWTq}dqyN`<-I%Zmkp-;Gby>AORwS()p;q-Mk3jq<nB
zKQa7+1JbKeaBx;zF30z9!J6_M`IpTa19z+HH;9IFowkIDfF*ERzHB%tfqlXHE?72F
zbx2~2_AAb4mAOK#RUL+WFf&jkEo2usNkR#l;cy}G!qU$cmOqh?DfNc4X?fN+liV!&
zy;ta(_j>@-p5inn|A<@|6OGU}anwgddJl6ejM?I(-{7jB?k`k<zQRLvuk%M<iFWFa
zAJTQ}9(?u)(<b_xi|w_MbZV;0>yx!=82cHSnRFQ50MKXp+f>Vej5`e(*`t-dr&>Ux
zaVBl;ry?S-PG;YbWNDNd2U5rQH3K<rD!|&^A=T~+SmR<sY$y>7avKv1bV*;17Hvvc
zy1({}B%dh>MVxjD7~MocPu<uwEMh$loEIhj;<(lypFv+?QvyhT8{HZka(Om{_R#R;
z;SJ(`_I_xD>Lcqmz)`x5twvq@qkYyBHnHs2@FLLgZF7SCb8JZC(VTu@AV%mz%;&8o
zXr^r;8-4-U4cbsJ2!sF;{mbim^ZhCh1t0~(9J;(cJOuo)+;c+@oe&2{VzCHn8%V`6
zz7c)95ciLGh*W+Ys-8datYox3EQ~g3H4#(3EBaqOEO->}WX3e+M1@W1e9J@LKD6ap
zCsb8idW~3S)D@Ku=G?L{e7KRBgKXszc|<{GR4sMAq>7W4HW1|HRSI<ztI&d8rIW@W
zR<8%8ok-dgVr@zmGosP^)qRg%t7ZzauP!u?PSqJJC^z9HRttQcE=Y5G(N%U(aH2#o
z<muUnp65WZVH-8DEwPz{3TJH<XUhmd?1~~N#s=1wScYS_V8tpYpw6{yNC$C)w9q6T
z2TGNk_jZrF0WD7U;SfLaOEsJ}JU{Lg@I~EXv*5t(=wwe2r)6XrJwr~u25Iu^!y^8b
zyZvzg?o|&%hugguAoPHmBAiH}yv_t+h5I9GXAz$r`$ul8h_=Q?__|ED|45^JD8pd(
z(`?7bpemEph=_9K_z=Ye?|zf7MGU`^==S7KMi@m$wmqG;??4f}Bms4yOO@JN#SW*-
zmh~j`<zHL?BKkP{wpcniJ-TG%6t?#I_mE<E?f6mLxoa3Fia?j2dR<qlwya`5onN(L
zU9P`5llaa8k461c>WiWApIqzFZ3f9_PYJ3QTsQk121AxeyR@k+#so)pgTmMQjBsvR
zjg|PJk_hC9utv@ONbnFgC&ZC8e&IVOrA~VQ3qC)wT?bRUc1VkwLELXQYYQJINmYUI
z2rNcR)G)vi!O`Dz<JPkQi`vWN`nlI{Wi0o-mA8BAL_utqCY=oi|5{nZ3|RBEvypY|
zdK_G8+^eKabWS@Lx+3Gl>?7lvPo_Q6)5Jqf%@F7ajFHj~qZ!qx5FZr<rnZBrc-(uM
zT)$kSH|Evo)9BHr#ZXS<)8PyUsW^cb6*jku<e|#cdb($c!>{8ws(ngYT)uc-@=FVz
zpV6I%w@tSQ-9mT}D75+DW@FSp@lT`BiF+S5E0^!P**d*7zu)-{K=>qvFpIG*N!lP(
zTPzDR-&GHZBh}epnI8zzbs7Xm<n2O#NS?nJn;#wrm12Q5YS2>+Ap%fCK|(?r2HB|x
z<6E$dvVS$GUP#uz9j0q7*Zzk5LPMyFT<4&TDK`2?J42;}o^4mEUhFg8P>S%qRzqt&
z;^;Ll8_y)c%3?vrt`--M4i__vDzu3wk65Cs^=xffEvD+mUNOh`wNjRhriu*DFh4-J
zHbDwpUKOyhqlpsFvs_*r@X=~9KGIo@khm-I@YunO8;?y>;VBqb3Nm~<XIvPZ(Piia
zn&mNA+BCioQI~CFc132!mM&#okU~`zur$O@8)hCQt?kk$a=FyCe;MLQs?=v`Z4t><
z`Cq7m@*Tv`TU<hr0tex6<Mej<^RJ2{%)2GjcyszhIE8+lk+cIPXgEs8Ew;p`?nU;9
z!Gz~EZ5+xzLILo6u5R2EUlC#xj+F0?$Rm%Pr($9yv*rI9&6cF|E-IpafUcLp@5jof
zbmQi$tHA2-v7%3r*WQdS;fh~75QPvD5#@_qE6^;@K^JVHM$o|dB3WF3HD;TLbz?Us
zAzE0Av8xVi)HYU+z6NH>7du@mW?g0Jhrb3oR5P8<;vUX&&}{a!x660Z-;UZhFfa%t
zS&<5PU@?kz7-=`}VM{!IEJ3x-OG6_eQg9|EvUe0cI5?=RWn^hg=chr@de(CG*bcFM
zkXQ?ydIJKyQlhw!1Qvuz?>NOZP2$%(2#`y~kyd%s-+bu0&V@|@X`&4z?*i>C&rE0k
z;z*Uee}(AkoS1^VxG}ABzdc<eha5cXn41y8ygBW$mOor2@i<4ZI<QJX&^LsLUreiV
z<HOcB4{_P(YtW=`N}~?@tHUXw-}3I4Lgi-|>RF#+<*QeBYJnAVAJn14*-D|CRlAHv
zc{Sy0HNnRVYRPmCdY=1!TJe3@pjyypT#^QV7*(yeP`szG$%an*@deCZ4eftNc<pbz
zTJI;R5)(g`eUrGpB5}OO*kBBAPnk0e`Bjv5CwupRd~rumoRXVu$PcO}f`EgdzCWf(
z-j=G4(<>$>7TA{DrT}1g)_Z?IF-g;46h@C?Qk{nlks@OlDJ4}!wkdDcvhdZdFp39J
zu+c#Y05TG8xnFajug6rs+3-%->IJo?_6DzM5Smv`U=z?lji<Hy1V&|hRZjYQ!*=;X
zD$q_NcWpPib_HSW4YwB=LK&2x;wY#=SWe7i=nU$@O*jz7yVUfLiX`g#;{4kzRC5(x
zb(4FpA1RDCS_#6a-|5zJRB{w1Yxc9GV<BKffOKQ3Jp4W5@!>5$FpPR~hd|+JwMeU;
zq9o?VWO+O)3D5Fj>lbFJm@2O^-%ho>Cj(&v_OoX$Jk~!+#sNYbVLu-Hv{s-{dQ*j3
zPeNpXPmI@Ty*oUdNg()uM*5NUn6IsJsVYMb*mjZr@%|8FG07#ryE-3>qGv$+GGXu@
zr=RcOU}UaJcq*`xi+IJwHp->O3}C#NRf9p5$8jABrfH!>*b{TIel$>2U&C6JT#kp!
z3r)0N<}e{6*-C2bL*rOf2OD4^;4&Bm>|BcD!HAZ2*XCn49eoG7=yK{Voi@Ldd9)>1
zuPnHQh4z`Tn_*5rR23*j(5Z6v4k12|Mm^g_OHa={-fVx|2id--lj}&dz@Oy4f(bf8
zRdpaUenHWSB2_Zw4>8GN1Z!Uaeiind5p>SlR@&s^T1e3F!|6>9abJCG-oN@=(SOw(
z__tWC2E6zW9ShHy(r)fr4R(ZoQJScz3=>Vb+>IcdOPC??H2>JpcjtrDT!&t3<hMLc
zv0wuBPP;0c{DSmn+nfxTfLk2$5q(qzQs?B^%S}DvnnV%w>KyYX?oaz*xLkt?u9p34
zcLB}}+I>|mCve7e!1Cpf+=aJ3Ijl{MomJN~HUW5WM*R%NKl<0b2W5oB5FB|}vB<1d
zE1U@{(OWxPo@#*V5vau~SD0&%)no|+htL9Wd!r;-9#)@OYl%4>;-~MS6CbT(b`!K;
zJ|Qc{S~5E|wHQk}-wpDsw{_p7cv+hNmbANBpIg<H2PG+yr<mo?h{U|lg7x`Gn_=-M
zwU7rCXm*~PR2%6`W1$mV!au!l-11dlu;O8AakIT`iNgLSz_dx>X&3GTAlM~s74~<T
z$)QOCKNx7EW3sNDo>xwr0yY@Q2B{J8l_|F^CBa)|BCvs+@M-tQP73)R=dbt7lN*#3
zzAw+jskd|6g1*nu?()!z?zzSgG^f;6VSjo-@v@DC=|)eI`it==k`gjD7CY*wm7@J9
zObsG{z;Ay!T+ps8*;A8>q(D;?%v1tSAQv3zX@|c0;aTrD)U>pN`CzoS!hA|NoGK*q
zZTIcUgXRM2+mEcfqVluX(n1xCwqGv9#S9duiLV6P81e-Ynl$q3egBD>8+Tr8a6=}E
z?-4_-vDrvYn#jw@Q?AGE;&n9cg1hT>&rr}ZfBs~)F_g4~xK>0bUux>X26qTJFH-V5
z+4{))uJ@tQma)W)eNN<23XWsv4{_Umiuv+jr47d96s~mUtwWgo0ni~4PS8^(3#>6r
zo|;chZ1s<CUG%LDk}UU!fr;sl6(nF2pvTdL+sX7xq6jc3`Z}9avO_j0#814|p0(vD
zR^WX33xSoQwr-VmSdvRk=KIEj@wF_szRZ@bN<8j_8h$|IB$LSc$m#BN6z}AXiR3t)
zG3gB|wlm%rJ1t0iOUaF0IqsEUfE~sWWIwTCF*$X^ynCy)$I}8QRLnyUV`6blekes_
zh;F6WQcfO>RkD|JYZ!NKO;j59e7I*-pRd&j*a84?#On8Sy2<g1{E3S>jKS7mo#dBi
zEcxoi!xrWih>#{t{PtfBc|z7#>GR%6y#}!xQ$O31_u96&J^S`HcBKn$FjddJ#V5qR
zC;CE_3FNPHTw;S8;`&bSxH&*x?sb@)ye6ks$<~f-I9-(D?9(7u+y-sV)CvhpPrz8u
z#CW;Wno@sYzUR5@H|E^c46DYamH4d&C0P36?(&e;HHjuB6fZC^h_dZ8PaJB!X_|bO
z|ETxCiEhIqz{ieB!kLhwQSuidMF+PD-jn1lj4-3)W@!3@WSVaTBfEzFj(<fz@Wc|R
zW(cQ<zz315dL!a&DfKhx{-wDRUVfhxA>9+^J%-!rN1fy|tVW&G3SM+UcZUfvVnoa7
zeIlEwaFVvAkoCY4*Z@C@gsSca=PsrK6Rm<DEfpn+UF+fpkzw8o>U9g;HoiKWZ2@W6
zUEJ2Z(cDJQ=Ka4_$&TCcPi&u6CvG@*{g4_c!dkQz<QA{^(PC$EY3pveggfz5D&(^k
zw;=Ijt-b}2asx@aTy%s@HIe2Lt1R>djl6+pn9arSx(MyWzFd;Z^C012KwkK%!N@%f
z9_wac04T@fFiB#NmF{w|&W+!{rBPxsx)K#{m1c5s@Rg%>;kdpRVQPc7qPn~zaIvQ_
zHL2b;2*qg*4TD56uIiD&@K3epV9<1DU58S@`-@yc-rdTD=QD#<&wo&o0hY&Hqo%1C
z8!JT^<HmjxvV=s(UL3l}rQ3W_=Av*e9ayrOCa~}6L8|j|qx`t{&EZ1#iqZ-!Jln57
zKR6g(Tgh~ApwNBk=eYU3AUE8PM#*H^w~ZGlkDQ?9V<xnFpjWjlk@Y!3zFuQ*X2bWD
zoLo)pPCWX!m%o^}lD{k-cGEr9O)XvOJsEB!O++S#GQKr*`}s}{#wa)Z;2H9xv+&8}
zpLk!RT2D}L>N8I_issK-l^=<0H*A1$FEl+?9b%96cce$Z_>HIwjyXj$L(t?asayvq
z55I>mS)UO*Kc7MAbgKc=vk%R>xk>`!>vtsK6TyLP_m-kTcAj1Y>oY&HH~$#p6_?aP
zc1M1})ns4-N{?l595T*kO#zi47{RaEe?Fh3AkgDBJyriu)1BmFx?2cd-ns7F^E-t7
zjqQSh>|Nr2chi1?QB28@B7Hei7fXpb!oLH`rEDg>8FxIFtt{O)OQ^X7ZLAf<?-*nJ
z6wi&OljC4RUR=`qrqGw^O2E!Ge3^nuWV#+RV$X4g6`WgG9Wc1QQghNw|8u&Rx6<lc
zH6iH*<JnwSp}hljgf7B()~916ZylOq=Bg0qRUDLn;Bm?8g}HKiU5_3>LufPUQKq>Y
zHg)#?sIGZy|IKUl{oI!j7W{Y#v0%>hANNZ0a<dN6bj9A?h<al(ODleEgu#sBl@5&&
zt@{3@8H45<Nbm8?;*QwWV)fe+q39VsC9wRFkJa9J@jZINxhr6;n#8KQaIeQglSEOy
z8^MTX&`5!)ah}V(kE!4X1B#1FmxQGYp{0o+tbVo<-}ZyUxEaH*I{4Ivx6zq!MJhhp
zp^nmH8!y3`Zlv|;QX0ANf}ZEOs7Y^v!r8(e(u2}gFqrXir=7VKWCVq19?XEQa8WlJ
znw2@qn}=C3N%9^SV<y7r39@MZ(CUW!A$en!eM-c&wjU>{l9p$S844vs8pd-?I16=h
zRI|klzcj8;T1v^vrbtQPW}8=+93zivgRw~FBvwO8zo0(nk&ox=gB3RCN^%Duf^eBk
zb5Yp0z)#$|naKP+u+2ZkMW#O--DxLc1xEMwb^YuZWw=%it<s-?5Ye^2>(y6}?o6k`
zBmnm;@cHaxG`FO_4Ds!hyckF|@@~^-`5Ez?4Qs$m*RZ-`+le%YAT*h4aa=je$P=;2
z&%s<=Ol0soB1+^mf~~<C;F}K?Vq9}RH3wYjyFHaTD)b49PwM6NJyiLkjvULUqG6<g
z>z-Rv{K{(D?)wj5lq;HNQ{=ACf1)oqsd{j@zjg9FQ;?L|rS~y9T`Q>7#aLWg>MB2P
zBk}y8!In|2y4I<=U0Tr8CJaVvamLtg9oNdN4NjQM#SWRQjF}`2JF4uWLvpF#{gvYX
zKn7ZKBUEjo224K@cw7$2K-Zs}lyY$i8Zb{_iw@6NHJo(6c&2|5+;%DK$MsF=#Bt+r
z&%E&>DGoV*Gcx7z^0s*G@|nf=JzNKu;nU;mIwpcB^by7!<De5X>gEnBYmuIU2h$Hj
z17>j)V}+l2_mp0~%2C@pF-}{#3ihwxBg6C2?@4<6x9Y*Gn{P4xqOv5Ih+e*0uOu&o
zKo4>Br;Z8fen{qljp5!JU?od$9PID^AqUijAM=ejxF7FGYVao5zCW||%rA<xIBwmj
zGg4q!;<gcdPSsjhl5{F5`27o$Ed8~``y2C76JwkcMGPor+<i~=Eq}0%*lC=o5b9in
zPN<{Pr=6BCRTz2~e&Za;Oi!m#rN3#+@^GSrG)6CBDH@B`&eOw2FNtocT+6X#cb12n
zskaNPYI`tVVuS)X55>2Wm6%$-8k5;qh$?0Mq~mMf9Q6^(CI^x}ij5ic!$bX)2rPPf
zKknaNd>pXLsQn~W&+{UT!}3hYUpTj)B2-|LvW1BI412uzGyhX_b7}f|wo9Fb^WNQ=
z!_(xs;_L~hGnt9YDN5f?8hgOAq%<+HWgXNRA5CiCJAne5^sRXqLd$1!MzD7{trfw8
z^VxB8Jd(%WSssu!fb}VXeK@s>PA9`OI`)zy?G@iwV3ZMG=~Vl(ho~aO-&9ns(ypFr
zdnS$^RXVJh{y(nXDy)vJi5A@iTQ~&Qg#>qZcY*{+aCevB?ykYz-GjS?;O_1k+#%@g
zZ28YQ_h~)!%lc+_&8iwTYK*I0xbTU*hY4L_yZf__!|}FTMNt$YE+N|q?+AdC-qk#a
zFVbMKfF{z1P5s?d9s?^&@cg_u>!e6iCg=*&e0fy;$a}XR^JDT94Vt<Pg~{vqb5LvO
z7;Q3RaUyLpnxtmyLFW^-teB_mVgVex`KnqPnk4<pO@0iZuJe2|gW?GM0rgQAO&r4;
zH0&nZ)?X%TYJ6Snw5ou0Eq+*6epP!d_nOCsS1Z+^Rk!~_=LDZIRa~VFF&O?8-XGz5
zvGZRE!ZoXqb~Y*OsWz>puWSx?E3G@mi<`;j)vl2io?7i!-lnjp%NwP<I)HtgMA!3k
z-8d(<N~P8rg@DU(LFwSf4<5jV?&I%)Y_o$Z!q08;gnyJZZaI_tgVOf!X}mXT{JdX(
zQ36B`e;$F=B{`;XPDMHmF5QMHlVL#G5Z89h89%^Q>fth^;ikz|L<A@c!}@Mq!a)7c
zD^lr23YoH9&)egHPpfvlQM1)=*UM)zuYd5n0k9X9O$`tIyjpS^r>(H{N`u4oSSGOM
z{=3fOj`!Me+xE5c{uS7xl)P+7$%vC(E!J-1Ej2ulZ{;4%5QutsIZgv4jLH33{!S49
zL?!@07e#FF{$6OO?h!C2$64&}*<BwimO5K+m#d}oC2qFLjBQSVedS#7bNXBb!8Z{%
zjZboyPd9ffD@xg>+3z_=gK1x4h<F*i2R5YT$7W_%2{1+afC{5Tdu7Ej%Vg9&!elfp
zznu0&WJS{^x5?y}ZGQl9a}70YwIKEGm;&OcV&L!d(dw?pAIAoTjM?HnEyZIUkE7+n
ze+xDcgT^E9mj55PmiXcSNNJwC{)qeo025Qe4Tg57;);MyFhn*-On<0>@UgKa0YQZV
zJQ2{STXb+arm56rnaUxJ`1jQquff;$J@1UgXkC^#hWj0C%Ep5ar)rMnQSBqQt07HR
zi~~vAx(p8WI`UgvTj3i3-KQ_u3rJ{-SqI&nu2xu(b%YD{>hlh|^6k#!b$<m8>|sCc
z(63yojHf<1-~${P@XFAwy`cKQ%PwDiV;n?NT}%Kh3jF1k1e()z-gd;XsQ9i#1S)j;
zs6lq%5j5*+G}JrtOd(<Do@X6zZN71@r)X=Q&%hd5g!|1&AyAV6V9`gwt1eF5c*MW6
zX+5jFbD-tx8nAUZTN>~9VzhN>v-T^?<E{86Rq&j!HNjJwqf`?syt7UZO+4^G;(*_M
z7sM}^lf5iylE!8((<|9Y5i#sMi7+vf+Y1Xw6uEAPWrYvQbJTRZ+*RP#me}wL%&Jpb
z>`YWl`Oh_4Yt9L<^pZB4ZyOXiS9xW*rO9UtkhftR&4Y#Q2ua=%JoTryx>aaV{A?j&
zc&&|f-aR%1blM*+-kO4Z?N43aij%mnr4|MbUy)HtoJOVa376RM*bpMJy|3UnNlfdC
zRHtjU$UX}mjAs?EE8xeFR`OiLUYa5*3}8x%5b+&C|52E*!7#b|k<&9<=0vOglDz%y
zvF&_(ZVuC=2lx+)1S<q?fU6tc(X@OfkEmDn*bAbY(*sp&-Y-mxr{LRTfNk+|IT%%y
zZ4QJox?DDgc*8a4jvQ(`P=$tnQaNt=T1dlY-1=nt?tW_`CpSQs)LZPkY*wDswf&W2
z^;vC%%`u*KI(~BJn?U7nvxX`#_R)f+5Sc`jGy2xu;azh|fWW)&V;1?)5m?8MwJ}Sq
zrqlN#W+!QX5L=R79eeaz4|J#)!uulE0&DF#IVB~Qj_2*acs$N3G$>j5&VfDlAyWH-
zyDSC1{kwHQw^Tgvza3pDq(1>#59iO#a<MI*W&2=&b^+d|P}R+ccxtV?MkijdoSjuw
z)p@%0KB9Kl7t+;!8k#XZ3{L-=eUfXv+ciTO2^L+@@jzO$Kj?5gYkxf_wbr#>H(*h&
zqfJ*D!BU+nO!x>$y}~?7u4Wv41ax_bIKAI>(0V^T#yxn7k6?|J>IAqa#AV2O+@0kE
z;^EYs^?Sw}*I|^0d&xSJPRul*{VsHTb_*%FDl?J2;iO!E^B;zf<}%ay^5o?GLd|Bm
zoRFq76>4Cx^K)j7Bf{`PVfgd7`P2Rwo(V96!kfXA!wcI)Q_%qUN7gIfdpQl|st-%3
zT5HvnFPlDk?b&|Q_HYjCMqXKcHJML&$fzWK_jT2E2PpyITlj>POyc*+C1lO3wJ4EW
zQ0#vyc9yd@JQB87{#ES=P{Ss6a83`)eO2!a-&jrM^S!o%)oi6D@Uy71Ky|iV_uk<z
z#t_w<y1(cCCdvR^_U~_^|L>wX6!!o0_v{Eiru<Dcha&W|B2jWODvFN}>Lw*+ib&<M
zXIlZf(oY@kw<T$=Vp>K<1$gSoPZtr;<t&WQmCLml^;atU4gRV`Ax|Sxt*apeiCzVI
z$;awyBi3{UiQjzGGe)G7mQe2Xr|1EMbiI}yA&9$-@qVkpP7v#&_OFzIctziq=qI~v
zccS!zK|_1~r=6e1Sifo&?glg&EYa^xJ??s)PeKOvcx>VsZ5F;7g0(2o4}SL@1HLqf
z)~JfVqr*b|wDvJb<*U+rNe2z0Q1kRAVwe&-YoPt&B)Y%w-PeV7bBT%>+$3lPsg|1m
zV%shBb9{baZaO1aa+-=Ov{Cd)4wZ@p`?U903aZ|KFZ@GKJOY**UCxQ{IChNzeYqOn
zXhGh%s}`Y|qOmzPyH8ap(W6TZA1Nzo$v1Al5B%zU;wiaJ=Xezdlt>Db8gPj`E@4L!
zCdjJpDFgtRvQ&QaSgwZBYs1^a<LLHgrdDdh^M!pZQ<DuX0#IQ_!R5(Fi-^c!0S3Pj
z!Cfq3SZj@RSQ*^BF0TaQw=LciM~|0%V@nPjn4BX&OKu7FZldh-69>D_JDb$7xtBC&
z&3t~g9{CEGJmVSyGQY>9*w^<-lq5yY@Krz51WdrE(@S!o(gtd&^?&XYzyx-Bv}yma
zv+JPqg~RK5Om&w=;^6!|OTp0ry`BYjVWJ*TS-d_+jz;bTgpy+({uLgaZMcL!<lMm7
zVcx!WTF_=BwM6;+bd3l8wW>%zBHIU_m@v3pJG$~Lwo|pO(Rg{|=6Ile|LLBHzeQcH
zD_rWwjF{L~`*d94h|{^U0<g4l!Dl(n%fnfvnBx?c$K*O#KD%9pWpTT>AUOl<D$TN(
zYIP;UARksoOjjL8zWX<;`w9vD0};)iN2ii%*y;nGXTGaV=d80uUp~GFr77uy{3)Zs
zl5cJIHc_giSX_ehm7APqI%}=$NVw0Wb0vz}Q8X2Vp+51|Pp2;KtuEkUR3FZkqHLe%
zXoEbmJ~z1Zvvb6=fyVKX11i>^@#|IXM;59Mt(T9-W*3{npNm!Kn>ZRbK8V$eh9DI~
zh9H-oR%$jDq_P%;I+UvHX<3v!q^qXaim~lhRA_ONzjZ8Bh~ryhlY<%dpN9bzqm8#S
z#ph;csrL$LshqYXW2wh4`%|ZyoWJJRs$TdVcMlbh?$lJ>JAHI7cUz@Yn}$0*@}A;p
z@SBkH@{&OA%*NBM7K=H4nye1oK3o1QO>XC%$MaQ{u}@8Y&EM2Kh*a;mshZ_81tK~h
zu4vWw8aq0yHPi0iPPCytF$d7Iuw3Aj2*R<#+dle{7WOqXV}xVVexj->gmQ6lNfybi
z9|VUtn0?#Ed-uWh?Ma*E{_Je+<2nM|2d1YdZD$u}6X!dRWJ-^Xu_&U_5ic*V(oa)y
z7K{`WV<{YAS9o_!IX5As>zqoQZVu)fjSa16bwTv~6SG<Oy5XK{EgxN4%kI93*13AX
zu6{U|cisdfD=m~=j*Ps^qS=Xz-UnA{s{0cb=gdWEdeyZYLBj{4o?v<AeE@;p`TG(B
z8k7J0h~Yr}*dan5_z<`Wa=??$`TLm|9n`CGdK05AUm^CyGY0c5w{u(rw6APL1!OkW
zdnv#fr~agsc*K7)oOylID6hN`f>6pc2=c~0M+g?0qegry?UpH+V^=Fb>bIR9!F4Y-
z@}X~RVA@dEp(r*q%RGc44!Ox_3LZ6%JMnYBN-926aKHhCJ`Su@M~$Q(<LJx7rJ=RW
zPk;MaVq8&_J6XDY*CnEBW_h#TXl6g3Q55Y#y%Fok+#K6_VKD4A_t#yJ-zba-EBp<q
zxZ+RKM0z!;9=s1%2mHd_GFjJws00M5BWY9UF&S^aiuD=3HN?4`uXcXiXf)qa+Q@`3
z0;g3ETJ$SbJIhgu=m5Ee+NbAT>vCLBgjwHkq5H-%4yQK@`3qGkMgNnG*8>~h{%jiV
zd}f2M7{AYyL8jXM!iJA>mq15_a)``^vIvtM6dc}pB9)p$L{XGAD=R)E0hen^7WpD3
z?n-pUV%xzzl)q6SW9Q@=v!WU{4ju`~G2ZB!g*y){1J6Wi*QWu*c&jBqu5y$up0qOF
z=SrI6NYE};nh!wid0g$fq_H#z72taG-E0=Bv|}uQZ<P`005P;{a6OUKSVmjG`pRgz
z(JNw|lcVC?Twfd@Lm1%FtJhC*HI!Ndz?M}reHuI4FC5<HDZQ!bJqfg>4%G&W7ka=E
zT7IGTK7Uhc{}U0rJ0h^@rO{MpqSx=setoglc3+}>oK$qrvF4Y{?9yW}GX{1J+$@sQ
zRO%Z}bSz&3RK%eYTWCt+XpAlJ_D(0ikMz?8ZswpSFbfNzqC!DI2ormfc4OPDbBZwO
zL~XL%iG<Wa$9#d>ip6jV?Y=;G_f_hEsei84&EaUC+_z@%D=PIh7M+9w<`l<=LZdK)
z*(Mjp+n2dZd}1m=Z||5=lg#SO+WoBG$7-KU9v2aAGkGkX2gamYZ+@4U2BzfQSE
zr(<f?tBB1&rbz(nkAo}w(i9A%a8O%xOJ7riSql`Zy)8${jK-0wd^f|-m-}Bpjo+)l
zOJSA^71HAHymta>3u+tfPU+#vkE2x6D_<~$-G0`PxC@r_XSTVNdJQn#boK71KkCg$
zb^x|kvq-~Q;FT6j&Iaq1Dd(s!v$m0nWQ0$$-F0?T)AhzP8sT8Ztg`_88Iw`c)j)jd
zQ*zsl)-a_H3jLxCmM1<H+D*c1H4g#Shzv;Dh<5WEn}gjF4zXSV!^oqpgYPp)yd+MW
zRASZrA>rDs4$Q4NR6B(H0Hr{2r5k97|4#VtgZ8_K5^`Pb-AVyI`pyZ$F!?{H?*|I&
zrfpbydj3Tw4)QLNQiKrGh%MM2h^Z#pNlJ_>ABgNzPLGz=*-INLl`S#gj@QOTv|`(4
zI;vwpcg`K*nG7H(P&@Psj9|X`rXLO0Q=?B9$=ZU$!aye~TO$tcwAUlL5k?J00<{n?
zhy+6h>Mb%2VX<Ju`U*daTeYhk{($u~AP6$_NAA~$BuvVWf`sO=LIG198p@AC;xqJf
z92<-S>_Qs<IpM48YlKNa{Vg%CFS1;!2jY7jN-4CT3nm1u+c>(2on0!<O5?fIA4k$$
z1cn)-#~9YhNwnxu28CJipAt4Y#M6{;R>b(S8i@@Qg~OBUdE&G)c7WwvW-Xp3tKxVz
zZ}NOq!-Nr{X@18*DkvN<WMkJpd2ZB(1s25X1#Inb`PA*714|P=m>X0cBZsA&@>TMa
zLun2zFH~t2$|nu{Snks!XIw@j&^H}Jep#H*9jO{UUvizWU8)Ehk*sx>nQw?-=SnSh
zz+li4Gk$+m)YfOJI3uAOpWT(s;4sJZemu7hP}#k@BifUBY1qwr@85g13PbHZoq(G#
zN$b~1@eKYTb5eL;T|O#H$lE*~Y2>AVKr3>w4UJ&FS7z+4H6MKIv;XP^PIN0P{W3PI
zTW{2I#~&PYx?EqR*<|}wwVYBR)%=Gk;1$4T|I8I1txf52);?Qzk5WXk^MqBSTkBb9
zPO!B4ZH~VgVA?M}X0hgM#5it?O+q1A%C<Sb<jwQUV??9+%h^du{u8%CsG+E!i=g!T
zZ>Xb;sG&Vnr|&G2G%a1E+lV2s>0%kxe2DR5z||~h<sCJXG(&<i5^c^r8x^o|HrFcF
z)<ZcxV_rwQ*+yd(_!(mWA>}Zlx-5ORB2aB6C)bc1N&)9s4rm0J&7jr-y}rLUK3so!
zx@isEWV1jqoC#*f;I>m>KTL&`;IvvU@b<W~Qv&)aBXt-1Q$aHj{U=Und;|l?sd;U1
zO(u^u%u9idJX_MGp``Nf+Pgr*{H*U@k2knwN|i;51r3#fdLVlSqv4buX>5N9ISsSj
zQ}cMr_n`-8Sh1@P`}8<Q`$jHaK|qSEvPBJ9DWmH-7|;Gvpl7>a5^e3Uz#|-)GWLb>
z6LH`su~0n8{}Xe-<@SygmFV7%i-H77vKw7S1nch`ubtGlqMI@6X(poBJKXb81O**R
z-3Us)l0!lmN&><UOH2z05h05o5I@Skqu@%_6Mx_St27a=f-V51UOxhohwD?y^N5({
zO>V$D!O32N8p$zt97Fy=rsyB;7rh@gLynjoYvf{y{U`#E2fK;q{ACgNQC)KbdN($7
zuY+2)(s#tu4}4LK;QE(S9}ooFog?|(Z=}*;IdFP2P68HUet*&nfpn*etwUr#zQnN@
z_1YW8{Ikpk7&;T%+1%oZN9RfPTn1tw#ul_+gVcr`a-~648#yFjD)*a-u?a}HgrA|<
zj2~qQ9aM3RouEa@mL!Ktg>ppz2UB^OY-X~)aNJ%d3ma1Ov0pPj>49Tu4F&Lt1WU95
z5pz<$y-!LVJo^aBFEEJnHmF<D-fyRzJiqUy&sr-0i`BgKg?x)0*O)ThrlhKLhSPxr
z=8q;F=VkU+i}tr%BeYe)>@A5IobIzyk1zLL4Az~GWq1I=K?>aEblo@{yOYK=7M|^+
z)02=`f9#TZc(wPDuVP^;Pa@yEZa<|q@+hE;88EP1ZuZVpG_vpznIB7GW-a{q_I+r*
z%HidRoyYsRL|}J_fa$T!!pY*IfsE`V0Jd|s*3EED_fyn(W?NZ>gt$}UOtC^aqRhte
z%OoE*A30P=UrQyUEIW(Qpp<BE6jQkD>86cXO=ocjy$I8IU5_YXYS}6Y)I?g_<juOV
z%k__UiI*80WPc$7?+zMP^+GV1ZlmAeCyV|&#@pttU;X-c0*;`UbDy4g@yPQKJH2F*
z#WGgQeZ*qf)1o0r-hO<Z@hpDP4v(}jWD!uKsGQM%HJ#9dgfHW2`$VAL4(+b|ydG+R
zVg;_(+87K0mYCiSUNj+hj`xT-XZX!sV)=skY9L&_#jS=mmX_gcXzu5|h+zu$lhd{P
z%c(nn`2Bu4PU+Zd?WdTKbFy0GOTQKOwZ(PIu<z6EFLWNSeFE{Q_v*%aa@FU*zs5?w
z^2s<IaTdVujm)T>XR8rdMTsG_Tw~AQka}H^ytI1olFKIy4xLT!jX3V?)5~PiV3H$v
zYM{|Vqz~(=px6f+-5FM#)<U7+vxJtZzD$=C8FO{IUb1MnJBG28ZG5Fx{xEZ|H}P^E
z<9?*@CEk0?V$N)E^OXYE<vIId#>aw@+hkOYj%AK@Hmm32+djVWDX52nOca*Op5icm
z0EIVG)Rq2~&spS2E{WREU727^!&B7b{>A13>#C^f9%`&vxww(U<$d6u*`6+_2ibR*
zb-*vE9w=S@tziE7Q2^8rH;TD|NcVWO2=Dy2jHU-j(1O=KV%0i)NFSo(BueDsDUghZ
z;>1Ug5m{)Y8i}+0FW{Bv;W-GVBzw3XD`0UsvJ`V5xd)BSdQqMXd=7iFq<_lh1tIn8
zO*CG>ZPQJJ3BVtV#2gsl4kSuh3m6jp+&@14IF%<pGY`4V7}}iz?&KzVFlJ%sCl0Ap
zg#BvhIoZ=bDN0Ax4ig(_PYi?c;Ku;(xP@RiIpF6n@U+FeXs^$22;OP3S<55jb&ic`
zt?7RJMp`P{^F0t_R89Kjj8u<&B8Y;dS-#`(bAE8ZBp$&Khx`c_o8g@np_L1$M?4&(
zFb%LFk#SNST{DmbHOBE@de4-(DZ4)$=EkqE6pknzH%23HI;VOLM5jxE$q`<s;^oKb
z{g>Ixf4w)7?+cpP9L|GAFq<pe6E1U;0og3ovL`-0UlV(^vT`|I2=RRV`P)9Xrom*^
z*oPS0WNA5mHEO7(soUk@a;|)An|4`K+Gs+?frQ6XET63uQ+itZkq<}>fYe^@*CPX_
z<OpnrPxm$(_MC&QDwVCD%jF5R2f~HTvJn2H+3nSNY`jIYja)KJM#W*8qD<b#nO$iJ
zY=ul1Na*?d`X+HuqY0l&2%sQ+=NV48Vt=_3jcVo9;qJAe&ChdJLCYok)e^>lY>V?_
zl7gA<@H-PaIXn(K+WdyZ6HDMQ`mHkt*6zmeIZM6T<|&*=pwc&EqyOu%P)SfX5jaIa
z99>#xr~&#AUoT!ELrS#UI6gD^2-KmAGFC`;2bY%Utntit+1ln0mLiFq9yQ>b0simd
ziyj;1t5l)6gMA^$XZchX*_dK8!T}*u)gC@GUzCcZgpU{KIMFzmo6qkdXA9gAv}5p{
zam_=J!P0g6qlTCrjbxm*E1mH?j*s#a$oPUfo*GTg<m7TE#AgOz7S$~O-Rk)v<GHK8
z1UY``aWx*NU-I~z)*RtC&ak&>jZYlJ9&8BTQXADrI2<=8Nw5?RZ~52U^H=9jc}uiI
z##@o`<`H}NK(*%}@rt!}w{n@_3zD&P)_|`E!$Z9qQMX3pCP}AD4FPc!(pJ+uk!^H8
zEm`$f&1B+vFcaxsxcOZVM?^Kewg-j7%kEO5pr5*K@z{!XC>1OWRI3>chE;1ymW$mA
z(qY9x!5dTSJLX$?eHiL!fJgga)i?K%L~2p={`9(oZ9ZDv@8M_IQAvO#i{$N-VNYIR
zQL%bzg2<$OGU{rh7v*q@K)ygg8<YX6zakH;I2ZEhVL9)8jsD+-v=QhIRZ0>2PtN|o
zLj4E#yDfW^5X1K(c3gsPANc-$M*8j@V>a#ABXnK&LNp~v=jQGHsE=+}ySX2v<IKd=
zW95V;`XES|;uVB_#f7s`=64!cmoNi0BEQogvrgf3*8C28Cqn1ABq-Hj#!8)R9pxYd
zhQ8J(=(M}=#MxP_VL&zd?gqax34x2#n1T;|{1bvO_8@jH*@*<!9_KL>;cn88fTta~
zehK^JTPdeXg<2ZJ4H^myn;vpBCi`<<Ki7zx*I|Cnej`QAv#=}|AlvU=u>oK|4R~G&
zQr|GCxlBB*9aar!w1qb_|Fp&tRDqjfI$@Y@)>Py&C&o`2n=d<OnI4XpKLit0wLk3L
z%TTSL`IBVxcty9ikTIlbv{W#Fgcshzz!4yI!6y`gg02Mvz3~(Edi@UWm2Zg!MZ6a^
z`X8VaQaL^vTf~4XLTZSi0P}<RD{MN{lhqz-#FLGQ1gC`(Tk=m=YIaM0xd(9S_i||d
zl_`X;8~S)0j>L?#gUd2JJ|_nXa`<x#)*{zhHSgJv=c;gx_UCK3nr?%jIgaLSh33i^
z>cfAfV~zQfqo{4ntdon_(Irw_&aeKa(9&SDmhDW6IH7<R9e7-pOXo{%v_^4luS<+Q
zA4kGH;o%ag(O$JWmiBsCW<Of&v1f&`s<dP=;lKOYbO`@HXrwz`6iA~Wl0~9xHwP07
zNa1f@r}Tu=!BOcmuK}=x{+yFX%PnLL7E64KsWl3m=EI+_i12Tsyn%AIQ1U3uxa)kw
z_P9>-Kz_Ei@HfRLqbYjTEd)w07r3588WrMm#r@*M3|^lsnlJXNB_rd4ibEvx6<WjE
zl|*btIAfVzpOS$qa=qyQTV~gIeW&KV%@X&%1frHu+?Zw#$faR98WnNc@fxf0aL*?i
zP<~1qoFaS5WZB1}Q<}bcI_~b|x0v{lB><~4QjxvS@p~H98c+92sVrFt3VT$yWRQ&R
zG<3t80iCP=?7FUtS%F>tY8n7gkl+AIC5h!_#gy8tX_nST+!Bq3hU#_B{7z4u$%+^z
z)~NmyS%T%EGbT#4PCsJb`|BqQqlE>b68M&Q?yF7E{X+QP@%;lZosppubtyQ=ih!Ko
zoG|46jW0^5&lEa|VOvYex~JcaabSM2B@T<F0))cEFw!CkD(KRLux1>|>><<DeLR85
zU?M9a0poWxyPkRk0-vsXc2#C$zcbDfcQIck-EKt;e9E`IfiPg)mmuI{1ho;r`j?ET
zyKdp{T*Po-4;uUo%{|VGX;JJ&IZ@0Pisq=sHqsw`lCoA41w#kw-E5(|dwYAQ5e{}=
zK!Z~@nqd}6b%;WcmkC&(YXz38;2nh|)|>6~gD?o_V=)L&^JzW4A-qHT(~mNcqWbTY
zTJfP%Dkz>)E6UXfDxNR2xttULCfB8s<~j=lfV95o<u-R{XBDW2I<B}NTf*b`e8cXq
zY+?)nud9SO@{jUvSNl^hdG@!%m`Ce{to%N>cKJ{!(b-&bYfRgNSb--wK)&A9Z#oL;
zj4}IZHy~c-4J3{MTbOJ(x2<;W`s?IV;qfi=;LUmKWu?@K;Uj^|EVunp+>UdbUXNL+
zR*&<l_}0gp{4nLB6%!%vn?vRXt9dS|xH8JXO&VR5!s@blyYL<wF3$&IIRZfyY!4RL
z$cmIqUXLXA+mos%gfhhr4f?W`ZsET=J?@Dbe)rqk^RrDr|AC+EZScQKrF2J7$YmD!
za56;$@rx#2Mx=+q-B5XMe*T^WCk9og-YUp^Y^}{(5}Q$nX-LZni%!G9eS?7gE7$49
zTS$@37;5C(B~L?H+gIZ_SRji=JORp76yP(*XfVIb$7BYUQh1U@s1V2hZe~A_-(R}T
zXd*Sg_h?cCeQMNw#;}C%W2JG7t@H@%oev{PmF*^ow5eK$FYvWm>@MH4+boN`INzVR
zusqQ#mtn|d9X@oxaKDG&9oJ3ya<i;0a#2f;Ky7-b;Ka)&1Or38SVi!ljb^mN4XV{_
zw8_8AY&|T?LiJZJl$GXfw3)S@;wtQ9^(pnnUryARE1%gEevuVTt=(t31=>r&u7L#F
zY*qoL<reFRWm_qe+NQW~rm~r`eG#eB0}E9fpO)g=Ccp0t$Td1=Vji`5-YL|j21gSK
z=4M6jJe*n*5b#@YeW_BLqRQiSIam6&UFeibD`IzS%R4y^i2m~%lIdhLJKDYJ<V&sa
zW(hcOL@A2hn$j>!sR1B#4?#d1Zjd@qxJHTz(Pwj;@D))02k`!j^Sb&AxjqYwF~gB8
z#;Ynh{tFxtfZ88pvIMV-4-~+qay`Bka8t8nW3{FeRcQXgFfitc($&Nx+d>dim}2lr
zeg)z0e$W~bH|N28!~FS$Vo0Q4Ok+_9SvNMH$sVhdIa&buMv>UCh2oPBQ$J4yY}Z9t
z3!30=%0M&Lq0l(T1qA+KPR<z1_(Md?7VK9Y>;b5k#qWleh8GYbOgA;^G2A&QeA}f_
zjyHagpw`aL&NPOnE!iFo)FYH#s!(j}XaonLU~X5!)p^8sZ$iO8cu>CFeFGE@EgX7v
za^=6}_ve^R?UW1!VpRB%`>az#RqVEe3W122T&awQP6h)5u#M(NaqG=@+*cO*wMCdB
zX;mKm(>NSZ8LbIn;DN=qLZXPr0D48I9QOkA{n1pXYv}9!X}~D<=5@u!RR&b0*ugPZ
zs;hwVRNeKO=iS5iUPaY8U$IVtuuQwU>f@NTX5(bNdAxSChs?awFRD-og@YOc7^MeJ
z`g9oP0K*dNr|8eMM%3DNug~00`W@-(C}Y9Jftxh~O|U40RV?<VUt50W2Ea~zBYSh;
zw((N%NCx$&-TdeqsXy01>;_sYz=DZ?)k$443?mhbPTd6We5wIKyZIr8B7%^XW2~N!
zrA0Bo{ip~uKo%p{A1rSds8^z~bGBGTuidqkQ8}_XUs;6ezveHU@V|Jn3;H{rn9!uU
zp%HfTpP@fjW?Ai&od~*0;nyAs*(5Ig{)_uT4lUraqt4|V;IcicE(>I9^U-<a-o4Xo
zGMDT+dx;WnbZTWYuRrMpwkdNH!nyD@`PC!uuOneDlG#0M@}(@>K7wAo&Ka&`QYMYM
zJcEumE`eRm9Goe`!^e=A=Te&!tAcxe5~vk4&GYp($*$*G&3jWT&jdPLK(%g=Do;fG
z<23&*6dQwzNDb`|wj0%IH4$~e-+^)st;)$~_4YF++9t`usj#*iEuyTLxz2YPzZqCz
zR<-~<7G=4{9=(lu&RnUu$U1%OiElArJc+fs$~0sJXnsp&TPB<c+xl(0&I*2p5pdeq
zjng_I>7B28v0443N*1%5M>0R9?paWNnWBMY4mScJy9VvDQvL<|oA&<~TY*r17Y|-(
ze~LvZ9mVfxe`?81FG(RXNI?~&&A)1CHbV<J(h)Fe3Wyf6geW`kII~lm5tL|liR1gj
z&?U)A{ZHU=L4A`RWi0Y}ITO%3u>l|iFmXwqP_}gSVI6^W7MP{p9w-*srM{=68;8Qd
zawse@f*Pp?hY@h4T4G6f8R0>V1cC#8zni0&5ADEQB*;EK;zh`#ERh1wKah_DkdPPu
zf<z5EFNrc7jo^^#2}Ktm?hR)5)Z-r{wxSEg|IPxF0^6E`?|_5g7}?j1oKGOO3n&Mo
z4fdo(UBQaj?V2%1SxjR=t;78Zs|$Hh;|SZYmurQ3+w5b6(6jgc9q-+zN|<-3O(JvZ
zaJRg+7Ia<82Y93H-H;v6Rukc|>C0l;;+H<FdP5=s`J*o)Ip>a$_xKzC-F0zM)JfgL
zp^OcO@6%7}=tzKBGW;`aw$)lQ9+u2)iY<pHE6%C%?(Bv?vo{=f{?=)2S$?VDbpO>n
zfwNEryQAgg?ZpMp*v*kXro-lxnuLpP;*?Z8T&eiH_2^@((=js8@CFVi(HD<AKWBd$
zDT?~_8{w%!4(R$^q5${4M}pfF9m)P{xns`BilrGRPc3#9(_s<F5JYw)&ev9m--2)t
zogseYBPtdfxoV{f)me^@qtpOUwMGJ^xsxT}1aG}|M2y|+NHpq;>K_0h75pD2?`IbZ
zgqK@3T+f*aB+Qn}^MiE#8;~;+PbM3q=GT2TV;M}<+q#*xm!@6g)dMb9I`n%V@xF0>
zOHL+#FS($4+ObD__;7lHLsF()SJYZsn<_IJJ5A-h1e418u~AEY2RL>G0&XcqB##F9
zXn(Yfrvq@=jrbSs5dbR(VDD1vbX&)jST>8<GRXmjtXVlA$QUyOL$3Ci<4Y?8H>E7V
zE-%Yp5?*&49|`7R?(9`7bUp^m$xY7#Snz|l&Ubk2X2+o;iF3^bUkF1ABVLgUFf6iC
zK85hcp>~Us_@mn{)66;8Yq}doXTlFMWcvK+UNc0eJO;57cgD0pK6BKAs44?U;g~FE
zLwl?P{25{&|3j7k9tsJe)`$}Gd1vnf;|i<$@G#kbXGI{W&nBCcgNOuDFkjLxcLo*!
zjO@Yx8Av`f%ft`9i{SxbO~f4{$h9;Uhs@MiEEKIGC{QYmuzrcwTiIT{NeD(%v0J{C
ziv69N*aAW<5?YfzJs;E;Ng1qWMS>#-;J#oXqT1xbUeRv{3hsE;?EKaX;c%>Bz%UYq
z!NvZd6G;X`aDk%TIDoUP#&{8g{8$4ye)#n8V0LLpaOwNtp<p~9Bz!^)CJSIXX%<4(
z&cgnh6~9t3aaltjBZ};Q1;`{g8Qj1giAdb2!TstL`q3~YvFtA-CIPfu2<L&Dh`21%
zvHE0=gJ6Dl*|9Xw%KKA1;8i}|fyJ^-Mv7Yg`c-4t#*r{ci?%nE9urqARkiMOHZ$k*
z_GNdcqsL^7PNN>j>Ey)qGu8Tar}<Q*C-`wW=%L>j06I=<Ltv6i=hnoLaC!V$j7Ce!
ztF>A(uo$(30Hn33LcQ+j3LxlBHEq-r-<lVVG++KI<}R`AdR_gZzV20OeBJLZ$cC3S
zjz;NBkjCs$WqxG*F=?{aI6{ualJd*&EZgvkEJrqz4Z-Pp$4nU>jn|)2(8)$J0xzm)
zEG?gi@uXQDK5*7&JR5*o4^l%Pg*z13t(W6yRH_OL(KU>Ys<gX`-vz-Rd1EuGNztm(
z&pgdb{4>QNbNbGUn`b(nRc#X)Uby0mVfWI?9brRx3s?a4h5zE2nA@>Rr!qLdPG)pW
z)z07OCMk;4b$%mL`FgtbMp&dT3cK9GIs_oBE+;pHnDi=IO>OosJWghBmFp<xy?74E
z@`S%OXp=>c<WK%ff507$MEqweDJjAf+SX$X+5hpc?W%7V$3r9j-2P-R*95jSmUb<*
z#&hT<?n@>{;&g&HghC&a85fdqCCL%gD!s9bWKy+~TV`B=O0qQGrz|7@`Xr#0HT%oK
z;wAd$y6ByLbp=q5C@e|=-dtyG>rIJns}*#s``G1Ek4zB~jc5&TpdPZx{!OX;QkYw$
zr4i?Atp$Cn*8xYwAo7L+hTl^m>DM+I${4~Ts-%uZ(!P%~!1R$l{!izX!DvgA#_EvP
z$a!kvJvb1VErm`Yk1W%d&rAUo0~QP(&*Vj~s00fA3BXJq9+PHfUk=}FBq^%Oi`TZi
zdA<RcIlWvbhgfCxLz=UzyN^${po5hT4;tM6uY)5Z`LBb!J1oR7{-=ZU!=A{RWcAS%
z*Fjp0G-6=_Rc3s_{>gwr@mGLQ_>Z5u<If1Sw1dTTuzr{vi@wGzH2txd*ibsC>cUmx
z*7OqZX;(!0q4Wk(u_yXI=-q|c52l17Xh!BvybAs7;}NcfF2(+e5o@V98RBzxtwjuB
zIHraTZ<X77EQG&P5z`_pX5!Nghr?8g!@MO_q!Sw_{22xp#~OnIsaMcQb`~ZK+qpY%
z0otoS+Hx?mPd++@QK!9xL!rs+yU1Iwlp>qb1uU2cG$<hmq%%^|cW6<lTCKCDvqjpx
zghvS2uen5P1V1&sh-<zPd%wdIG_P&#M*jk?9dQpk5x>S}oLeu>X?CBJ(P-Aove_|*
zeBGzl$n%l!e*GDS&X%JKR?rR#>nsk`gJO1kkdnz32q20{Ds7PN)e8%4^^@zBVerbc
zF)&}Qfxtr2`u3j|K!@jT+{Ln77Kf-0O33f4!jI;^rp4v6{<MgO{m^_^=m8I&CBQHw
ze*G9E!V-eX8q0~#UQ%5-@r6#pfXDH|?arx#M|ipUYA<?KS;S5)b4BIHVX1O)$vFyt
z1GyS2tf<+&58`jtFXhSs)%ba(i4LX{N`PZ=3;s4wJF5Ro;Y&*J8{2SwbYTS6%oXNG
zSr$V|@$dvT_ff9=P?f4rKcB=AWNX2XH^l_p4u>qB3YJS1(y^Q@zEm3r1Kve%GsxCm
zh4`G+$KI1Q5gva7LN6NeS;d3^Odg(c_&->{77Wp8hn@v8w0(zZ1f9ic8az^ZQVY@c
z+1ao=v!bV8w%n%K(>l@J>G;!IXGi99#b;aqNVyGQcr$*&lKIA$x_;2_aLa4^_8M^W
z1cp6a;P)`=i-RtT?5zF>61Y4dvGz$ixUOHXb;55@<-D-J3`AXRaFC==XIXLA*lF{a
zS8zxlYyemh5>`R*7&&0~+Z@?c0?vC4L+>K*4Qxj3th1-ph2WEmhPaeU0r_k`i^obo
zd$O<xCs5A?CYgrg(ef>CnR2;%Z1szO(8rRuoE|2((>M}Q3X6p*vP^y-6@Is2UNs*P
z5HeOCG3NThL<X_&H{t&qR|GDfZaIK)b8j9k4eGJ!49%nXr<lx<;yk*XQFtMm^a&3Q
ze8*y^csuA4t1isaw@(8<m`B{?|1)A|D4r5eAJ(0CO(fY#$l2I{$s*P?l?#EC=D8b4
zQvjyHj;_h>_t<+~N4PubryH9s^iv!Ri|)UL{fHAn6e=$9j?U`SX8HnD9KEAmH@0U^
zj%_4_VI-0jF6^O!z$mn*UayhSA~Evl$oHIRd`<?yH%wtBfZp`A!{@D29;5$xvXAST
zSd%Hff+PfKUl?L5Wk(|0UYw3j65l&A=+Yli;J$p|2O;-YF-uV_c6Y1rJY;JB?lvI#
zkwKY$#+HXc!LRB?d1wBo3j0-8+!~1wXkbp)-dsJs8+p1p6E9YH8`G|AG`V)<WGxyB
zE1YSS)1<jpSC4lbOZ!r9x6Zdh*Yqj!M*jniPTq%?#)E|g(&aRYhF^h!s2PGj!bkHv
z9`Q}e#R^lCevm_NVcF6)C%faBAyuVx;()0kQ}_@A*-1UMve`=GSgX#OJ5q^zRGK^Z
ze1&k?>v$KTnO@^)kP13roxiKN&Q#&Jv3dnGMBtpFtr8>plDlx<s9pq2CnXZgKQjll
zdfYQOeVfc+UM#ps`@_gdVW^)tMZ_IV?P3l|{LJIIOC^(hW{7AGjccRXWM<L283pmY
z;qq&qOi22r&(tmd(Mk8|jT(r)?=_d`#fots!fx2N-wZ15CvH}3J)Cek1!U49gK16-
z`Vd{?Aa^Hi=h~_HFTA=fG%`tBNReaM(L-$4o254ZX`YyucQ%hKc%L8h;MvWm0lv!e
z{6aKlh5b&$<?C<CTkT^M75lPp=Dd>Q8I6_!wTY;!+S;RCfGcu5814U%!Gs=!|3N&T
z(}-#9%uG+9;aW1?ujG23e~-pP->tKe;LMC?F=vKjFzAIJ9Dd*VTy6s?r_!b(hd0|*
zZBCFG7GFHsd>KC*6$jyw5Sz*MmFY8F5A5BkqDRl=rUqln6&9(W&q9}rlX!YCkeJfu
z%BEs_qKntN*T!|76^|PUt@zp~;XjHnNyakB;T=`kOfzV=23kAsjcGP2g^X*nJMnt1
zG#-nsIG-806!DnHeE{rbo#PP;F08n(4r>?4q3Xz1AC_~3wJnzNxXI<>Qu^GZHa`7^
z$0`gt8gkE7^dEVTIBoZc2*GKj`We?pk;8gDN1?;`TB2hN$p|)>p-RW`Y&NOy&Z(Om
z`H7jcz{Ft=0YfTSkFy&c^WPYbL6gd$Vg^=~v+^XO^Hv@o1PTE6vSTmvf6p-x>3?H`
z#rFN}FMsoIT#zAReY5%Qa#a~2LA8SknzcsK^iOmk1eI+nsY+QEXf!ONFR{9cqR3ve
z#DC>SF=IR!h|oBuenP;#iMpE{2qqhu+!yc^iT3AszQP%_jm;J6cVHpGF_eYs$9Wb)
zflhT725~(0a%~3?4uo>+L1t`Xe^?7a0b96F_Vw8R1+GB<p#2~zjK4#C^ObK974eOa
zb6Y4$Z?RXfCQw%o4j&8#TYE3&MBxeKM5LfCD2rqL>`}9~Dj^8~GpM1AsDmA<)$4)*
z<!{W;^AHSvc@bl5AwCmLfSVH<{wK8mgCzW)juL4#ibjBnrwri}c(R!Lt5VAqCRKJs
zL>538E1?Ov@JyUqP*W+BOgLNWNIxq(*>MFkW8K<Voh&z^9T%9_%_5=fr-OuQ(plU{
zGgWXuWtZbCetJ(SFH$IzluI*LrsR0*-C{8ZuTihpS-CNZ8XSlk>DG0=6mnHEV1b7q
zwKP*KTh#l;D;7fpt3?1A#^{pO{<&IM^y*4R3Y$^u6E<8IYuYz<vXjd6rn!7;%~VG_
zMP!`*7_e%xF0eNDSXFl|KDBg>r8tT+<-`vL>x#plNdU51r0rP0Kf~nLnU0r9M(_}+
zm(jK@0hhzZ{Yg2~h;<r-(LAt7H$5fzHY>0rFq9Tmrc$myJPscKsKhA)j`N49!*m2H
z<N(QXlCNp*RFchn7*XahQAl??nsCK@xB$)_jPx86sTyOxH(@%+QK75gV3J-}p&#J-
zW49D%9--C&MLA{@I{Ld|U(q{g_$kJ&6FceA1tg@X3o(#<A`ANq+ww{vw8&bk8^Y=0
z_b3J}E`_l6_vH=(g6tNnpS#q<lUY6H5tp0w`Ca6ks@GqrRL?RfaL0SyXwuK8@_owg
ze^BCilaD0i0!>2NP4iAT>Iuym@E)h$CssZH42oq-|F@@vQl)Z9L?7|K@Z{Nf^ZU-I
z-~9?HGSYE842z69HL)sHEItx;T1x-R_x?f;LVw5zwt;#%F%=!BvuK|om|freMC)~5
zI+3K|qM=3wMB{xk_%%5!=JIfF59cV=u1+p;14@=vb-&_hcs&eee{K>ctK>I4GNRF`
z2sM8;J-=jgEBnnWfFY8O+U`9jGn~Ne8#n}kNW_z|Kgueo9xwn%MwS$>7`?HjOIL;r
z2e!)?i!~-yWP6H~(<{6PiG;2GM$r7ScGd+a!UP-7B>XOo*RoZ)fAiSlE#D~hYua+_
zml0}*eOar#xxu^DW_5)4NZyynJA3!5n3xGjnok8><)6&Z{GCF|Ae0_`y#=|@GBkZw
z{D4h4<IhO;yv=kyvN(<D-Cs=f8<*<M1KhVWS@jopX&>n6<69dH|K;vgN=fVf+wHQU
zQYltYA%O)(ci}nV5~<XeKg9n#I~F<w1}Og!i$Y$H>52YE7F-WdAI|4|Zbmnfb@+Vp
z=I^p4xagG%K;*J1pU4!MgfRn^F=8cz<;8n&;6XGvl1QXL{ZLDsDq`~?D-Veq^j+2_
zNMTSv29HC+pT?0H1{eM*AaYNO6%G4?*3Wl&4Cuc42>cj7qumr;8S3?I2?9pBvcIEf
zk3t9%Ph2evKLjDo!{WyOV&XJ?=*tL26ZoVz@dyOS{0(skfBz;*YM^2)5{}mcK;;{p
z_2bwHV{VsF<J_0vOTl)y(#Y+FZshA{sX`kWPNcnM7mI$Mnb#LS(F=StXn2015+ImG
zNEnnty3{(Zt>`!XXGU06EwqvTsBBqjK^eS^7J=ydp_L;OKV6qol@INekA_T6&~sAh
z9E3=O0!khVoWm_hEY@td0_IWpo$2g07)JZrcW7}u1%Y~~#RCdyCZvaW2R>DxWH1#A
zxT_j}0Osyo5^xKc6PuTvK)rkIgw5o4={L)3VEq>Y8UnVD<<mKNYIpQ%I!VE*l`3lm
zA;{}b+*wG+^HUkzteK9hn1M#fMj}Ll=4HeF=fv!7tl;qj9sbst-#+6l`9ubpv8evc
z>SmcMfCzY@hSSmE<qpA*7Te_8w!gU+67<^GQ4E<p(_N|z=|*IdQAL2_Ynss^&O{LS
z=~>9<&1+hEAd#34%^%G$NG7o~H3H$FYW}a^-}48|CcDAfWgnz768hybc5kwFr@KwM
zfhk_u9_{A>Ec(%(KKTefw_c1An=V%Q&&!GBfIbi}0Lb3sa|H@zF=4e=b0{r!6#U;M
zfY_gKjS1BA7GEWY5#3m;=sA1ucVC|Vy}w+xjf9-w8n0ObYk^Rc!z|T3yYyUN+vBEa
zOta~#rnEmwx9jvJNQj6%36oY;c>?@skw>V>sa%#Y6xI9rPv2XX#bZc!@%?@w6Cn0g
zV;NSzdWfsn?y;1apZ>$z%TC>W$P};~=Zmj!i<g+q_YmUHB<l7y_#S6Gbl`^)v07Cu
zi>FZdF^TDyLN<50#Pdy^bbqEG%1hN<oT0sHIbf130pJ{LL#wBO&?GoUOPI7OX)Npx
ze9gbFE_%FH=PbxdTXG+xqhD|gd(PK?^vO)|-v)9S_N@1AL3X9G2pM`VT_w)8*$Qg2
z7X)q+EY(?dxkVH47Co_W6e*-ik%wcmhMNu6ps{(_9IiE2qPu?C*R|}|HF|RT0<cRZ
z59mB7GYE0i11meNUZCE)S`VzEru{=3{8K|DHiZk_+h|j(GF;0|f&lS;q<XW<?Iyf*
zSt8%=grWE^aTM34BoZ*?#}Jfnk0bOccwTG1fHk|`w046<)FUFZp!RsdW?uY9a-v`B
zz0YgiL1mQ>>uYVZRiczD%xJAK0RFf(Aj9_eEdjCynv8#F{gd7eec6ALQO=3qF@A0Y
zN?T7%5;ot2bY=cDE`TJ-BaHD=5mhG@HF8WQ)+@CDJ`b&5krfTI03B7mWdcg`#@_cC
z+NVbUJ-z72&Y>a0;de$Wv0f}5oL)bHXW|ux+9Q9X2!E><;t^8$Q5610;dU<K1E<_E
zXm_p2eow7tBp)hS&wj1JzarIA3nG~NVOd6@eL~^b9fg;J6e^G&;bx0oF%vK2nR{Dn
z{1Ewd@aN(1BYPM<AslW1swDodo(}JJAkvMU-f1MPg^g(R53ec|LZv13yYqz;CL(?n
zk?;bJ;zH0nG(x{nDNw(75%r8|$$iY`8|*jpo8VTv#T<RIm%^{&Ao)ARuXua>5*`!N
ziTq|2nr%t@W0`wK5M9K~9wML)04u&ded%bWa$XqHH3NyrfcjU7o44O-CDDx+SgC&Z
z%elWEL<59eLcR#79YofIyt$+VBRP3}tE+SWX||Oo?sWg)X|`4tG)#KlOodP8E(=K6
zsl*;Y*Gjvb&Fb9mn3EMa{0t=uc)SDWbZVy5$+e_yOuWIpEVfZ<w|Y(`%9IR=%77&P
zs`jw)Aiv22=C<b9E$unx7CSyGcl4|5b6hSI3hAYtls^~toKp({*0i*j_et^bB0ERf
z$&WhvrJ&OrHLP_|PiVQ>l)-H7j0?pxmrk2|8>xw`GVX%^h+VX7=L;;7;>NEG#%{G2
zqL*tbZRIyr%&w9O6lj2DqxAX={j05N?dCkYRUZ{eRcwE{P#~Y<G$ZWC=}Kd6I;Snv
zmSXV#1)y1z`~lERMVJgx4D7sbKZp1;WZCq(SJnRZhtjGM>eTZJ<bX@r`C;43-_}@;
zFR}Aos{HNo$#%Kj7}k2ZUHzp9uGtL*YBXB{F}L1)I>m9SbfX52P^k+}@uc>q>NBoW
zmujk0O9Gu@Bt_)y{N0OM@S_u4kL&y4OT&;1mfm$mqpYH_uG|^Zah&3OE(?_UbCizR
z*In4zLJx%*93K8Qm;53*ytG|`BWW}7h{U1;M%|R%Lqy!gY>WAl{SVpf9z;ll%+u03
zjgIC=v)>7wj;1rmGX>Ath?WEOP6~Zzj}L&IbfVdXum|ljBl|Q9x9O2N%LUBbCkJ{C
z)E_Z~{9=l;M2+9|CYrt`9yy-&JIN6+%4^+<#m^;hDU#-=%`+&q*SjCZ7-oL}s=tTJ
z?V0tpm4<86iFL18z;F9vCffCf?yT)J#!x(Pg=sdvCON;gE`0D<lmAqp=i<eRyZB{a
zPg5}3+Gk~JGw|=01VqBcwQKZjP3n7}qkDfcoyA}pwF8Lr-1H^us`pL%^n!LLl4JU#
zajkiet3B?NV$L%KEl(4Y88s``dzDjy8?Ba#Y-(`z;#y{YmBz7q{x-&R`E2c!ReGF2
zP99N7&yfWRLOp@g$oqTFC3N^dc5}#?CH?x}ZyzW^TnoKp`ERck#U^~C7C)CNDXzD>
zv9r)i70RYTmtw*i5$E|^g>!)NV_8d+SZDKs=?9A|dN+l^0(t>>1!@!}BG_MNxi(?h
z_x%|$?%=qWFCa)69CJ|o=`3O`h0{cW^&)ebwlKdY2_x&ucJDP;Tnon_+}P`#aoKMl
z?wZBgGYi&Uu`sl&JV2IWLpul~gNfgf=|n;x{Di(@F!X1B=;fM+;<gfUmB5GPh?#;#
zri%6Bi&S&9mPPJQv9~_V7mC?4!$;T$nlZRFlu<P_>aU-}iFk7r#R057P^=qW<l-T0
zhD!SV0Ceg+y(W~jT7${;vo)~9xMQ6S2fNu9Mi^o;npM6NDw~UR#LW_N1X=ctOVQwH
zvL(WO)yO1Y&2|G|823kA&a;f~10aMuuoWBQbT+ADjNO`d-|~(7no?t*&|A>7h4MDg
ze#h+oEK{Ch&_+4m*_!6fjXWHaHF$;#!KQ4$d_0vu9+{A*JCEtl*aqUoy8xZ?gmtGG
zK1cRf?dM8~G2%KJ!MkhK7=CSu<AusExPk9%c&N3SK~87WaxM`Q0k*R{#$MpZBNj_C
z_xeLNr+uq%BG+DoexKjQlyYfI;|1{kzczEpsB@FKcQ9zzy3R#6>aB*?Q0J;yVQX7e
z%2j5>%-CW49K09Cb<KL7TY3a67R>H>tjS1lvi+Pa=RiqJ78&PG<EOx^P5Jvaxuc8o
zu8tQ|%{OL4lUqC#)-cI3$$mn<=8X@K)Xk>nV6FGhJ^<qzkN=S}UhY%ofAkfanIhR-
z>lKb;FH5qQ0bE(^(>3mUlkqHD(k*AJjif4FPE(P(@oU9tquCN^*5P!<>O1~^p6J)T
zkIA##>@m><zq8kBDiPlt)-ZpOYR*?QdJA7=b9yue3zsSxAFenf=Xn7`aoN!Oi$`6~
z0+FMa?l}*J@qsSPRHOb`YI*e>ZnM~*A&B5Du|{yYfaP7;1OfGbv}#{s)YpG#oX+hW
zvM1KXpdZ4R0Jr)M%q0dan!+VX5vYjiMNfImg364Bx(5vV@x<0pFwsV;aNzQB!2fbP
zq;HpR@g29e$#3g(B6kb34oy^bl2H+}wRv3%ROr)rTLxTafLk4CKo9C03f>+Jhhv#L
zI;)P@kEh{2?u(#0Q_AD)?2b&FGZXSV$GxY#Qwl>eP#$90V<TLBZnr&`zis1ejYqoU
zk0BJ4UYJFipjIl%k;P>_Oig+da0>4%(^(m!V1w)VgMPNu6{qiCT)GMQWb;%G4!(Wr
zY;U15?2jyp9Q&lxX@Gfqbe(Ur(E5e;aeRLW+<gy_K9{rX0O-O=%Sm)@vBo@p`QxEJ
zhN2Xx=UBBG08&|wymd<W!vNw=`NA$&UnE*4JXKsLdj$J<rB(KRZgLs&*dM6$vE6|D
z4<VDMX?(h+&UAI;qTIh`*=DJJirS%OL=D(+Vi*X(W%@Io5CZk|{6*Poi|H4BbX^AA
z?AraGzML+swL8u1H6sS{zXJ$ug$8}$OY(vI`?Y(+E79sf02`k4{pFJgDEgr~x8e_@
zla%3qn9NW9>JMN4hH`!o`Ki85DJSCoe|&v)R8{S^w{$ncrZ=dRbc1xGv`BZiv~+B`
zLApDo8zcqkln&_*r8~X_dft1^9rrtby2l<4_FD6q&x~JOerNTvDr>M^GZ)|zqJ>j?
z?jKye%^Lh%RE6>g($$V2nJcXb7yP_Sxi|6B+_Dn^ImWm)A`9q;5TNNe#DpZp!XeCq
zk<bJq7#^5*Lhj#F=_EWjncSdHvtY34PQ%t!DZA~O4<j4pou&6+?>j)NJy2B)*IX6W
zQ-O@SD;pbm(XN#~;UF8qz^!lBx`FIqZAwJeMgl+GUT*|TK|AsATEPftl9_Luz3oA8
zwn7om52gm_xPv3Mg7{Vp-TZUZTOaDeWz0{Krt$ccq2pe0fr(h>rRag7@<%)<!>Ykl
zZj@K|)JS5H*lE^_twMnqcahc$sJ(P+)@-v?p2bEs8xI$6>VFrbM89CGvXFMCgl)wr
z<irahpwFjBbyXM!_J_R{kC5vm58q+sXREfm6K2#dA-JdeSMLw*u5Od69gbGv(%AN_
z7gmHA)vDHa_0{p-##0dZ5MLkqlvC(uyyETt@esVEfrPasR!2NbW47vz63l7+Gqdf1
zr$~=j9jaxRc;`o+3jS{vMdSlw=X{TRt*eWw{&)vA;dGcVGv_z;FFZiOEXMth`%$6F
z)k2~IZT^Bim9iq~NeM`ElFu|ww7FsVa5QV6YqK3;2o?&bUrVNiN;$3YflhfG4L*Ux
zk36|@22T?ewc)kswx(zH00xK0?$V1Ct4B*On9eezxQB7|4s+?b?OJ==uKul>BRMgr
z6Kujz;vL1FO+H-`&2eCKZAwSo$9drkk6$Mh6aSVMBL3usIxmGNb}laciWVbp+?UI~
z2<Sg%1dnaxo66tdv5HG4b9vG|r_lt9mQ|RjWF4#QZZh_ueT7qUYQM5K3Fy@^1-ite
zxeo)lM>F@E1}Z*x_AA-y0|~O72oE#wjwU?q<?{e`@a~0F`zMtWuf<e?xpZTBj;YFW
zBK91Z-5uj@>}0>?rHfy7Qe7OwW|jgfHx(IiUkcAn24TPEg>JrQIGg_-W2g0#cc{xO
zCk+4|l@}{fVh;1t?@fKI7=k`1B2&3e-N0W<;rKW@0f;!7ezATDEz*%Q*uFnj2{()#
zY5p$~F;-aiZ2(qccDiKT3pb90Y6gwER8M8Oh?wJZ%$Z7$6eoj#FNn$Yree;>LN;Q+
z5hlky>IP7vN7}5xs=#?%B>AT``Lx9w6Zh1AV(ua~JD>ZdU)|7BY`+elP*>uM;8m+K
zBn-xlVWx=<&Mp-4^e66mkNHmM*(N_?ai#wEA4cHnZ}4l<?qX;flx5i?_CnpT8d0+0
zo+}6^E8fJeqb7Wp-eJKN(h#FJlt?Fp^1gnd-?~&U{TDtkN7!2y3iW<>r!%l)x&@1u
zL<jeSH?nm}w+;9}Cft@|Js|VT@1Q9-7N#jgqTVPmE+GhPGO0U1K%qJbbzE`uW^iYk
z1#xicMqV-FUsESy_^++DQlj3%q$-zb78$L1OIE=WjYZdiF)Oi{j0MEIed?BKY+j34
z{JaL14rj^Nt9JkxB_`nPw3Y3D%ISZ@pA!SDJ0fz}H%yflKA^Bw25zpBYN+||y)1^`
zNZ8Fm-+?YdtYfP8^L&kq1y8nhNKHJFK}(V5EQ@kwQ6yi>8kMYK`a+|F3oxm&9iNM(
z!6{OW7H;~zOt^J_6-eu$Fez2)RGQ3I=%qu|sK8{}%ar`aD~o|vyC%q$a9EWO3c|mf
z?Soq1@&Rx0!<Xq~HsKh|RJEU`+~RzC8*2_`GWHF-x?Z(fH^VhnTe4Ko7aV}HOqCW;
z(;H7rTmI;{=GbyAV|if;5Tgu!{pNAZ%pW3rW5imQLd2qC_)+DWJdQ}JL!1nJn+*=F
zs1*FApsbryxp&}|6F*Qlt9b?u2SA3Al2DtCU=Q2c-tmpm17*lY@j|0VO0iPuFLTv(
zy)eOu{aLgA^<bglDvuu7-SLYaup<*_%1_t5`|7&M^G6zUJHp#?*`L?q(KRC8KyNJa
zEIIK{ti46_>)|7QT)<_WQiKvcT?mWp0OfssxWJSD^jPc}4TneoYOI`*-m{}vsY0+f
zL>?KMCdSbRW{w&JLl9qmmK{#lNezy*!_&k3AjE3~p`E^534#_lL?Yr>MJEFVq5<)N
z#{zI)EfstnQ24fW(MCIb8V+IN`pQRr=p8CJ81^w*!)$HH*pa(uIL!wmxsy^+`39jB
z8IU(u8pceZSyorsg}My@K=XbIm#zNU_Wq1I5rL0Th4^^`0tTrm!e%fIRYU-*K7_cA
zm$4_j(bgL`oRFDSDsdW?px))6&_yN)ZSCRyhOt!Zt8$D8-itbX4-hw4gY{Ywh&b>n
zc@(hVPG<4QC%ptfj;0;WjR3t_e1Xf>?7D=zssChaq)@1Z$5n^$e^T8)q5+7|=&+aH
z!Z9HviLleiv=)c+FQJLnBJkJ=(TI4w-zLx&Ro#4NLr<E!m%BAPiMKlK#JJmTbS?J(
za-8E@;&$g+TgxYzgD%+yjK>R<mum7#)C97)tMhj{dnHroB}iLF!u3Sp70!w`_gh2)
zBXia4H!DM|&{ED1<`hHL`z(9NVby9LygN>B?(Y~J`{U@}Eeb?tQk$1glnrWBB*LSU
z>JxtB{~jfDS0oy&&u~yt-{`(UNLV(t`fwWDN18TH6`6e4`F`GRi*Y{}q2t??J+)5y
zLVl&JR?~R5Oo~huz+!v<TbqwsYE_hSNjxtG&><w@ab!30<cP2*x^((A5e;x!1}Wa7
zVNZq;*qa`+^;lRc%9CLF0fJnH*biAOhMeX<7G736trp&GVs!?{A7%T~6gT1Ns(AmN
zIf^meJtc7J)T4x92IcAd_siNdadUNv>Yjrnmp94^YX6>qb6lx0ulI<t^d|&p#4{so
zBxSEwq$Il)uR_a}y3gH!xL(49_C-L;WyyQDQ@x^|`Vdo)AJ!2`%9n4Kp)%^I$^I=F
z)BR*hrdWL_8r=1Pm;!?j7GQ?Es)kTK#XPSVnD^I;4S>%-Kb^$&_;U_$VABQ8a!lk%
zAsa<lk^`|cIYudPLU;%qcZs>k`qaphIp9hbBs@`7Os6DW6k!I$;!%XLxHCb-0D*0h
z?w2~Zh5ihNg;&c7?Ogal{Xr<X%3W||6(-+kZ^Td&Q4nH0R`5Nx*94iT#07|9%1J!c
z$PBt6jk=*O7207rk%Ug|kRB!h<nCo6*HIxNo&^b_y#V5Ku&M#7pKb{W2wE=6*9Qq5
zx3_WRei;T<H!9Rcn-W}&uJ7$d93_N-FtAMIVIUO0{AHJUfjT-zw7|4-l_)Upu^z%g
z^*P>nEg!19w5=eQ!5>#=y_kF9YmQ5=9tP<DW`EIaa|-8iGW~LqNB+O?oljX~`Eiv2
z5JG%{ztRsArnU)s5|#&r++dJ8OrM7D8cAlP1Dnyppc)!#1%1XQuLmft#$!g3s}m4V
zst+EhViy-c;^@>;?Y4$x<R%su<4fmvyaF-4T9K)T6e;HC0=Cf#0jFd*`j5m)68V`7
zz*JJZxJBX<auxbkZ;~%^;WR^MkJ-+zmK%qiW23q3-my==79Dq>)#%?9OE)Dc1uWK>
zy&qre@pQQC#hPn-5R7tSAPHD)FHoyiJi`87d!|e8_28&Ja7jGjx}QIi``H0kdFx$%
z7(s2zs{Ph|mdLK-`MPH1$zB;<dehif)uU{sTzMha`_(*GkCD;fHL9APA75{-o8G82
zjIpx1@}Un{mbv;s0}v0?JWw+^Y<DDyh|39&HK?OD;|PaJ;ihgWnIf@Gmt02PPUV&I
zplWQ_cNx?&OI6Q}rPtTtOh;?qRi-J1rejHY4;`h%om9v&2#UsYH)(3GcPA}QrC(JD
z2IIUzXE(oP_xQ|R-4u`K3+#hM-zCuJu$sWIL|eQK5CDL^Ss`(>^4AV#ADXpkTfeG*
zOC@>ZIkxx$t+@Q>LaSqFlk8qY);55KQg?Sb*<`=6o+(61d*ihT98C&B@&@UmAG^1M
zGDYw6vQ2k`YdC?BKrs*Rz5RXC-qXZez@I*PI3^(_b8I4)F*dn3EzR=FIXi<w&CYR6
zT8ZPs($23hiKN?isoZw*fXW25SjhTraB=hwKx1$a{F!Kf*iL@uJ{{+4wmuXi@wJl9
zYK|?L()!tr)e`@K=0FM+V>sEC)v-5G$J<ystIt_DN`seVMOp<M8zTu4KQW^OJ;=U_
zJo2GM0`Ci66|(SrEolA1cj#C$$<=)@Lra5)twHck{$W6z&+KXChN*yw80p4E9D@mY
z(XaN>_KD4O2#<C7JC0(C|8f1CVPQA|cw&uHWw>WY3u3`@zzTA~W#Njxp8(%Mm_kr%
zqOvf!5%a)XkT7KKs&QdsI&drn3Jh|$ej%Bo^f{c~bGTM#{>u(cX|@2qn4oAYeAlR~
z0J1P2n^3~K(GEf;{N9QnG#1=my&kL5tb4%#Ujq|tIzVA((>ZZJ>}u4Qg5EOAV#1^?
z5y6$3H-h8#8v^n^mH>dTBu}*6+y^wK;tMMowwG&#(KI5U8uW(}an`6Sd~|?y6hHoU
zN5FI>GpPw(W+(^8+o)HnL@IZQwo1xj7%wVc7XedmFogW@FQCzNLPd%4(0a)+JAw8@
zUVbAdx6d@TzTQ>9)-r@%qslLyUV}I`DeQm4-GHm^aPd*8#1Hd!F&(<f21tp{^N3t^
zT_U)_f3q?=R;vCfJmyTx4Sq;**_JKT?CD;BjOj`K8QqUvBF?h+wS=`YECvNeCz}%`
zYB)K)2TlM{%K`f!aV%#7jRH=(4!HDkrk3WYl5A9#UT5K#>eSDzf4V%xs&NGrd?u@2
zv0E=h@heSNhZ(Kq)3e!(f^&kZiir5H3#ISO=+^afeuSrR0wmNZuk{gu@KwxOTan(>
zSyq|4H(s-166g<7T1^fteFv-TG=;LF<goQ0FX%s%st?7&%{Jg^dhvQ()1iU5q8I>I
zQeu|cFDj*Pe>QPr$Lk(eW(dU5t1RaBkjR~WvRpC_!RVR=K-vmTHD+c2EM>Qwk(D5R
zs{zpQVz-)tSpRGtqDWxxZ3PwxN^+=7G0C&bt&tevB&_M4w?_zgX0@+{E7&&$Cf*bC
zcujx!S)v>SPeW(W6=Z$v`{1S%=RwFxO)xNPzxCXwHCSPNqHfXhnLnS~g(9GEmF6J!
zRB8x{{&PV^6q>|!J!Wx;Ac*2n*a*RsFp-2y@0*`eu@VhE4!va7Wi;FmD#Su*Sh!%^
zE+t&U?{G=6NG%`{vNbvhG>tGH-4JF>r!kYyH10m2L0Ii==0?18O>iK(gI;7qCPK#H
z_Y>jnb^XEc+V;q3L{x(E;J)%hA8w|AZ+n5Hn_}U%Q6HHRuA3RQg}XgwPUiGNZ3lfh
zPUU9;#{^6myLqEJ(QR|W&nmqb85ynaz?a_`s}OR)PM6F4-J=p{$4mxLUZ!i_I=F*y
z4?!qa+ZCx6@#Os5%c|LuUiC0ugW|z>DcRjYrL%oxK*$9-BZ?~e-TS|b-+6dY?Z|tF
zZ}zRB^0Ch@fD;QQj%&TGqWw_*L8N7iySIJD)M6|*s~;2h&~w+28v5xH|Ie0U(f&`d
zwse9c6wmlL8Nh&I&6!@~8r&?#r^Xbn=#dZUAQH?}9iw2g>#`Y_2B)0gXJJ?^HfS3m
zg_{t5kv~F7P!oDVLGC=<d=(3njn`FgjmCKzS#?Ks=W5JYKNUHZ&P@~<ycy?j<To{2
z=23fq@>PO=D2>M&X%aZ!dH0+)mX+XaXFT$L<^jQKem4jW8AHiw4mqxsX-ECdN*X3H
zqcv|bha(H1JM@FF$?75Qo6AhaN{#g${JgCkVyn$^aBG~Vo7yWywJK*C$DQjmoW=#h
z1y;wQGk~)3JyBt%*jKfQR>vJ}iicEb34r68#X-4s+=@-K>5$F4oYO-8UJ-~?40JLU
z<{$pek`Y%xC702FY5*vu;11dFk%cVPS&`9-x+KK(|6wkE1o<2`1a<;!sY|pBRF<@-
z_1OxE&jaq&NzoFF>(y$JxC6av1=vXGQ|9UbA7X~Irjal$j^>dsEJAOoG%_%C?rj1m
zeoHr!-i5OT`QK%6e3r|Kg!brqhW)zg=dt^!$&$3ghD#>Kn^OfYdxml!spg7myeNHU
zgx-q6aF6Y8RGVV%(!Kt~dp-hnYmF-~*NNjGveV2Fj-aG1e*xSGe5;bcGb|i;Jz{or
z%hAj0Yx5J|LA1L^*pEk7z*Qm}nj5Asxr8NkBAMO9A&Lj_w!LMt{xVswJSHny6d)rU
zQfD=f$CTge$E@#GMAxx7I69XJ=;r}?K|bxAR&zg0GU6OVCVP5R`10TJsUP&Q9`I4v
zW{bwM%}UI<<tWVR{45#!;>OwJdJv*OXZ3%?9V`?KwEK!UVh6l@F3sc7ZBG$xAKX53
zHvZQrfjL(H5FWE)plm+Rf^+WThKx=BQXT+$B+`T=v6_t65U>I_ZZkT0gKdnlgE$tB
z!oEK87t{{0O}=bgNW!v`iqg6|rRCHYmFZyI9YbBLWp%X!p0l0)$*AAKA7^WX<j!F(
z4%M2SX%2Qgh^9)(H4)h2c^vm}rZ$TGOoVM>dlhQvhEo@MCkgl0I|DEZ*e!<CN&!|f
zK>G1`O+Ld=mT4$t<iJph?TALe%S3$w?pb&RdvnQ~sak2E5Zi9irChLR&^^}w{I%H@
z<2;Ss@|o*Y60Z^RP|}->ulYQm$~4(*zj4J30!uy*<tb@vPMSZ$IzEU&|L8P9$x$Pz
zJ>kSEM3*;C3JA$B1<t51VUe)qi`w_w!Tu01auqeQrvn5Pg@Pt1(=^Ap>UB^dxDA3D
zM)*<>Q;r#3XS<W^bcQjg>=0oIT$&vT-KHrL(5M?oc%O+uLRnSCKfuhmd3bR#-B-Gg
z!4uRoBatFiQOJzoesZnr%atTLU=Rki&rF6t!-_Y$(!h+av8}HK=FHKx+BV=HMi1jw
zkne;?m>U%%s>}o!)bc%H1n)2WZ7*F<x1+_wy7wT^(uwWigWrPub*MbimdTijY*#tl
zb@|tP8nGUlT~2BmGjZsR-9v~cZwm=}fkiDuuuCYjmI5xJk{k}99%66K`YCr#u=TgS
z0M`eC|INe)a@lgrqoxTW`DF_~n&HvoCC!0_`0_A-4fby!5i5#*XQ0EXFg|q8DuV+w
z9^L|)fk*mm?lbb^rz&NdSpe=L$#9`as~XSo*MiSi>uKeTkDoD#m7;(~AV<-Ne_ZKD
zp3FO-=dB&Ob_F`7Cf5zZS5lu76>}xCv|h7b1Fn|XlNN`y3hPcpfbKTaNbbY$HkCrB
zpWf4%UJss1t(JmeB{jxFJcJzju%FU)52X=F1*TGtH;49cSz!UjWCKMRz)mG0I(BrX
zgnjYOCP^{FY~9+**2gPbB2+fzITo)vThBOt_*(nw)d@Z>YrvjG89)jN_XL&;=F{Vd
z2RRbqxq$g{l2V!W*SG8zlk9yBtj^2N0DF42PqoR_ktu#Zo_J?q$Um4NiNlz8-<}>P
zSP9GdjEv9iIw)PhqvXzXD2bH{aQ2gVk)ThC$)_NQ3D@@=At;|qeiVTj*G~~sQV1f(
zu>?4Z{PYhg0gUX#l5$ZzqTUHf`xD!@<Jm7iQ;WL+nf##J2Xl7&fD(g330pCV=6x|k
z8^JwL8rGdtl6GQ5Ye7&v3nn_s$MoyefM!@1qDD!a)L6Ied9W%L5qixEkwIe0G|bW=
z9I8B11oNfw1NbJJ3G4Fy?gm%D)7{E?Mu<%9vn`l(5QbpW2O}Nh=)}T@&|Z(8I>^Vu
z+CYXY4DK2*n9dOiL^oTNjLuO!O+>;Kgz^k)0)YLnK0&^Mo6>59>fv*-Z{!&6JUSSz
z0q^m#C9kyX53l3L`r2e?ih}+!j{a@#21Hvs<PXaj4z%;9g3iZ$3^oUze-E}2OzOn8
zXD)7$ER6!6?#aw&3M(l?Pdfrn_tLc}vFXZ?;$G`Sliu)g%)(9kl%MTQ7w>&Ik}d|@
zDwk`A3Knl1*CBR%vR=w(HlQkG|D6>}^IowZw{Ls8rOix_UafhQCWfguRp9(C+Uejv
zPK3%(?2ME(IU8P^b;GB;Sh+x>zpWr|>tbm<;R9{TARdFd=vuejgrUpHdfw4mv&`DX
zub(;nA6i-Z!qO@zVFdt?KvnlJv+T~q`Gwot0hKbQzLU+qoGF&>mm&yTl98l<hQiXh
znE`WlPbQ$fsQ_H+sSe>=j2Nx-PfkRpW2<?mJ@<D2$HwJY^lfI@wEDZ8?xF4dM(_O@
z-l?xDjMv$AV!w9T5pP=D9x{i=T9Q$_R-j-!9s1Y9I{*Nb5Cqt?<CSW+$bPNUu8{Yf
zYp|{6Q0Yb`F#DC7q&|OHpr1!e8(J6nDAkozO3r2s{fPzB=jqnP!u{7(%mqnT!mfMz
zP|v5`t6cj>Ob`F*?uI>mHDGsW)Hg8j?nNMk?r}&Fqb@`(29<={r3jR5@Z5V{5hN*}
zDP@YI4U@W16d5Ipq`fCo3kAU0`XWAk1%*P^{)~edZz!|u&;V^a8Up6kb}sX<EHpP_
z%RuJzKr2j62YH}I1b0=T9#x`E?_(J7MsTm-z*$9oOllZN?4WY+CW^6c43G;Wu(<R=
zWAY_NFl<LS$<{?>nMlMT@QOy_(r$K6rk9)s`4XQKGdhfJIZ{yKo<_d{Rkkyt8)$CB
zAP`rWNb82ym6w+{S-5(7>r6&s4TSR7So#U7gaE%;lovLe`tySXnTM#<Wb{ij>@(8L
zMb-(E-n*|C+fzd+z);|OP(Ah2g#ACuKUkmou&0PV)bJ!XbbV}Tyq?l0?z8`l=u5LM
zCR+8H!oIuH9agjM6167FG02tSD{a|y7BMXTtv#M!Y@Yk$3A9SoTe-V@#>Dh$O%pG@
zi2Rn@<kIquhcpsbmt{Y91)B}+#w|?lF=%}qYh8L6y;(5*(LnAoUi|!1t?NC+pG|M|
zWz1mOa5vgss$?!8yq@)Cx_oD|?brQx8Vf*qtakf4oTw?H5(}8+u4xL@x}EP@QM{K+
zWs-fNq+z9Ab1VLe_-f!Ke1|(w5EI(Y0}N4R$ZiTH?3(({h(M$*1+PheV)W*q6XnGD
zo$WKL`PQMDFe?p?_xm%I(kz#EO?o)jTi*mIxp~;XOlLA^@gzM;@ja69fJ|Ha>Y{4R
zarXfneeJ~*5Aak+6K&VRDc(lYantLxcD?L8TOE0w+;>0;w*%Z`z*blYP=xy1b8kz%
z()-hh;~_S?-^Zq3^T~IWsl@U)n$s#|`-z9ZF~_p@tx6#D=1WtGk#)&OnFv9{9mOFP
zoA!hgsSGHh5U|Vu?ovLUHwQpjbw&$lu?e1_xNVcaumu)m>^g@iM3g%$QqS#hC!|IF
z`7VT1#a5Vei21|TMuqe~zrNKi-H+V*#-%Tm0mx!hpm(o~{CcL%B@dFA09@a)1`-%8
z)=e?p#`E44c&>k+I>kiT^cRRAu=imbgfnOd!JTx%=bH6qhH^)x5wz-E9Il9jFArR|
z;}In41=>y=_HpTHM~I|!9U|O^TNr7AS>u6sXKLX`_qJvRmtDO5I*jKr^FsZfl_2n;
zyqre}iA}T?Vuu~a)3ZB_|C3mq{xb|`iX?-W^+h=wAF|(mcoeZ<uy|~Wt$s-U&H<i-
zQL#pwj})F#4?`&Z=}77u3BW7ek;P-&PuH;K?)D_)R8b4R_BEfILjhx3i9R8Z%kf8Z
zJ@UIMh?en2+eFN1@@qOi8mHX1UFvnWTa=stqC0mmi8a}9Ac4L>VR3lYDGOH{u><I8
za}M5oGPRx83-B2S=u$D1Lu@2_WGV#y2}QLJmZ~>Ez(uAoMdLAO8ltJ}{g!{QXQqF!
ze{}mXV>RBsR%0>AS7R;M^RT`>>LHtGe8>4Kc^CV8$dAL7PH7f^Fygp7RWR^yZ*i=5
zz;@jPRckgr_Y%<AVDLCH`Vg}Z_(T*bmnKurHk}cf^^RsyCjF7YaK`^<#<S$lDn0e5
zPc8&!_U6keO)XMIvi-2|frg{Dm?|M8cn+(8OWDSP6)TkqhVk|5f2mdz?TE)NSpX6!
z@LVX@sE+_J{dqT)0cakW5WwT6Y^NPPS84CoGLS1Vv7f~t3}{&~%CZ7Ea8$<X`WrsJ
zTopD>jYJwP=}fdiqjN@&a?H9I5qKB{%zL*3npmfMdL&+K9p4^etXfYNf7n@z6qwS7
zB}iZvC-R@}sASsQenCkI>$@Dvygb5@s+VMyg^|sI<3lcy+KY_prcJcD!CX@cXTZgU
z7goIwU{z}z_mqd$eKB4Xp=bmv%^9+q&Fsou|DWrKrw^MW|18bgBFkG#9!u(PaL~r$
z<vrv{e?gd$S*WbOr+xOHo2o=5ud*2|3hSB-vmzq1Uybbo2HQWz0(&|w?+=%`Od^Qc
zTz<g5r{?F!DAeCzlxF$5-_WqAv{`+83TWTOlxb1DU8jE3l89@d%r^rWerJ3hJSy=D
ztty^V2JwEUV5~+z&K_Pj!lJH!H(AZ-6MKAkN*(6sl?Gaa9_KF>AEEl(GwtuL9gDTA
z>s~u*xYRQ&DFBAx(gsesqX9b81s~^Yn0Lqt6ynMU>q;<5kvevM<mdULY}y97{#?6B
z2daz~K$*B=Ak%&SQtCRt*0<(5AF1O{3p1@DGI_l>T{e~8Z$YeCZA^kj#4L<I`9&jv
zr{?3Ai$;Z7b(toYJ<3lqXM5NXz>!6ggvZO|*lfDv;bb^%p1P`O(~1sAg*mTP%C~`H
zDFK*(3jDY+Rdtm1{aa%~|4)s%jPp+TPmRfjbt#7>lyNNpHbjC?!tYwhm5MPpRE!cy
zIz;+R9h3)-fmrr;$^BwQdcLl0m?7rX6G5V`tox#4g28D!|AW9SV9b?!g`n^}1%<02
zbIAS}bfFe#K`L=8PBtn*b_9|t>AnO@WO%ew4d_OmWe1?6pEe3&7!+0pv_0Hw+)2(A
z8HsWXcU*V#l&X6HVC&PcZ{ie8r_LnA_?sO*5X*Kj+1eRYa5B=YsmS?0FfhZg&1y$D
zRY=4QOYUnAigQ#T+S+skM1pQB7<&8&*H;_ux8MyamG8EhapZHUBf>GQ?5<w?U#o$C
z?ZpTn8^lk{_GPOV%MG|#*^+-JEH**QsO&itefA1Rx8c+tA*r}mz7LXo2GQBY1GKbh
zA&Zg69j~u1$_*S=CTzv9@4fF&`D771A_LS>SNZ^!ly9L!(dYcA`@0Kdmq-GG&snU7
z+n6EwWpIR{7m2nthC7Nmy>);b!;3<jm2a{Jz5%FtXha-5edNyLe#_s)Lg%|XzByVb
zD`bn(jtyDh^3vA|zha%`;R0}4V}Q)Vxb_*WvH`G9WH`I2e5%1_)78j%u^|Jov@(Dl
z$uj0yljarj>GqL9%SWrhL=Kr(b^ZF-I$u4*%_mB72EO5tJI{U=i)Ar-%g4bsRi-5&
z68HwOL#u61n%!K9bEjEx+Ab9DwcclfHvmx+J*3Mr6#=l89s&Nwu}pFiw#k`Yp0m2r
z6dB`BzZc)D`L(h1<vu-VfI9dr=40o$%+JT6_EKE6^wiUCrrm<#a5s)3oWH5OH;s|T
zcD3tq3>dD9j7?**Eykf1C7kpO`5TpFrZg}6XW=n;p|kC=oLz(=^)%^STIowj2H^Ol
zFr3OwBlY=ZGHr}Ja|8#OxBy6Gh4847WX>IA6=s!FHij_**S1f@QbMrj8;0~Xin(Y?
zGOWeph6Au#g#21+`<VKp4(%&2>wgbK6OH5U1P=|Ny=@rNI>+>WSoNKL%b`DijISC#
zb0^u25K%d^<Z@6(HH=8)G_01kfI%>Gx`ciHJriXj%C%*+%ZV}17t#Y?>{sT}A%v`D
zQ}F`-|2+3+`zqtyl(-%wtNthTAs{9aw2(5+{IioWDkQ+|o%Rb^e=lVk+ano*8kQ{8
zp`b*j1aKG*1XSpi49JS5J9e*wnz}0=I<V#nB0iN`E;RuqSUHsi@1K^&Hi|NDlD(VU
z7lCJon9ns#-D@uuD(?9KVxZ7$!<XN2qoGsf8bjmTjy8VFB=hx8oT<Agw*4wbgpD2s
zR(tttCj%6G`fS@ZDjqa{c5;w~)nazuc(ZcH!ThJ~tI)0F2C21xQ<*Qyl+QIy=&)gt
z@cNy)oR$JHc21Dv9CTKKF`FHZDBi}=nhGEGu80(=R_eRnn(_joApqJd#jtxg<t41w
zXKs|CRPG@zJ_6=)oi@_ik2j@e?z2@Jr`7c*L-3TZ{#&6ohX`gpeBXu;VtE}>W!NWt
zb+R=bQ~+F-)crskEEG+U*q6~8hN4exXetr`W7RuVt|QkI`PH)-d+$YxjriG28erdL
zwmwlq`<?+A=bek^1Q(dIKhYhTV0DH0vf`Xvgn1WqL$@`zO|-YgKdlObTmeCIXaLBn
z=^R#bqWAarbaurn2+pr0qr8vT`*N^c)&N~@J|6gcrs2x=nHdfq5#sjLHE+@>YdT`0
z8$)c?LlYLJQy1+S5qu|8R_@fhijUh&=;8$H08xcJ3ZlR-pJK+m`Z5~>6;#>!Zz!dI
zrKo?UujY}zcjbtQPl?teDu?#zuFU$YbF2&8mCt?OerTroP^F10rBxLiX4$?QlzTj2
zdeF{OERKxc3vze)iB128skfc>RTu?4&QM!rIs<<r9_^7I0@dI0r%jo<!BeSf!h|Pl
ze3uSb0@mo=sXLawE;ifV88=b73T1rWG3Gd>@(HPRe@5%BUJB6REZvyVngqfrr^%5-
z&01>*?o}IbTYV^19+!Gmg49vA>4@9~Ha&HOF(1#b6~eX&X94VTnc`ZS43X>uOmuW~
z0ED5@PZfZd2x!SBzKv%yfkBt^(|u-<(9-1T8vwvB#gaLUkUg%=lu5kUG>yJ+&`3SW
zUHc%0{4<pklA}e^c$&(MiZ6d3r#hW@@S*VZ%rx2=ilvE(=Z;6pyYz{K@$YLbjGn~j
z0sCf0`Xc3m3l>}45`g7Wezc4p1_jODH@w-Pm{;$_feba~-hp=vaC=NWnaFNC@eKCo
zK^PA5T&)k)pSJI~O#h_?Kys+?T+SKn#|Fkk^rQWdiy(?AhAJb3DJ0eouV|Gy(|#-=
zs!*&7^_)mmK9(WdA@?F1;_ZDZFCzIW_QBJQlkv9}(kCf!!UA2}r>}3`u)euz`INAB
z@aaU}ce_9LL*15bic=H6`!UaKq#FL?YNU;BjsJ9rKhqZ^o6akRf=357MBe0bMjM6F
z&dSQ-VP!(>*cKrrB`vFD9@(4W=<#O8?H#O~&)q3M47Z)qBMS=02(t~_i8sXTtYpBw
zv@03%WJVW|l9FO`IW|lyRYjuassX{ls(*wvlQ^dMSNuIS0RIt`WG~u@0F~79wNSx$
z2H<Plq26(0dyaI<_LJ2pfG{_EtQtq5+nNFH&&)uI^L!I{<q`c{XeT=x9_ATwTy({G
z!J{_m_kMbqKGEc=vo!M~k%L(+G=bH`k>y+<9z(>RE+%_)fvm2ls>%H0+-nTPUM#j0
zlcnzm%pz2@@5ml|St)D028v7T`Fs2`w}rPLBO;aSG8SZ$cuZcCO$XYnbLOFqnaZ3R
zqk#-#g@A*D`T9n{|6pa1KtQ4BbDk!e%PR{v6}ON#Zd3Yep?=FCF>enEEIpEUDRl=s
zmd)&*)x!xHUS-&tS|9PovP1$4?Gvm62A`92(Qx~#*V)~X+T{I?h}xrdI}M6{VK%kj
z*nPVhKt%w#IXjTxYZ9>J$a!Zzaz2Gx^-5;|wF7a#@>itdQmY3Y^KkkJN(-w#EWK7!
zA_SMyd!Ta0U}9%+cp*;xDS~+ey%_<D6QHt_y2Ze$7WFhiNfKISNt2V!t(kyLOFNGT
z4A%+^sbvrYI4QkZ6k>zh3IX+gsH2$R)?SJM9?(*?NhD=A#0L5Jb=4T;G!!OR;j#yG
z1H}z`sdw3#3R)YiIYdcHa_)Dc8;_Vk0mMr0X9FC;TO6m2L$3QU?0Z${1FC^NjU()<
zvhUvI0M1XQsDcsVbnUtFS;BsF?S;M&2;EDA5~95x5c0?XNGO0?Au;yL8*6P<{LaIn
zBMNj<kyQ6XcP;^HUPkjS;NT&(9d;mC&I)V_``o8;+q0q5+9A_{gyBR&x0zj@CZYd1
z)%)jP735EG7XMoK>ERFyxA$+K@gRO_#DuiKGo_%Kb8Ji1K5Aj=${@mHsp7a>0a#p^
z0}o$N$tJ_)yqptD1)oU8kJ%LWSbpA9dk(Sq6Kl_#GkjXbt|kFr50brFi*Ou*7?J^j
zhy8p~J~y6_opkgAv%^dw*<+w#9&O*!arpcOxx3{}fVK6)48>yGgTU^2RNTuxWR(=m
z+ev&Kd7u+;=FuwGsZWPTbswe}D3cvK%s$;~=9c{>h&)u-z$2mK$qx8Y@3V#`F=9hr
z$1=(ZNZ$=(Q}KvslZm6?G1z>rUar47DGZvE<4B;_sQ-Z@$8QzH<J6D>kLKF9ofDmZ
zUXk*1ae-n@Ru%`MQEw^M8PGDk0&@I%elfbkS`gmaXj_WZ;R6T#{OD8k^_VCyFxeR|
z*hw<U$f1d8V+j=3alc~s;GnS}=%Yu^`%@H0k}rq;A*<fZe5Y7>I^j_`h?>fxBPV@F
z4&?M=G4dKUrdbx4qC%UnSh2zBK^UU)l(&%6zAkw{-VC1|$1|E7kHC)H1p0N1_=?<;
zWksY9lO_N;?-V%2f^iu1mnx1rx*aumh!P3B+4sG(LF2=%7D#!SCXcE`y465#uw?Af
zTj{iYl1f8ElZ=^`oNV5^jNor!-H9ivYbXofO}%-=JPcRoUV++VoDtO-0Q3@wy_z-=
zLUkNHgOw+mhX}w*I^H4-28B2g0Rj2i@+(l7sW;l?#cvIe31<1frS?C4pxcG|F9Fsb
ziM1RKAUAK0#K7->#>gjCti1_s<!>H)DN->lZ`_yJL;*Wp@{mYzQB0-1SseqBVRzD2
z+9g2ljofeVg|&QvD#4JLC1qWQ+F|}67VdL;-X-w6Nck5dARe3hyESdKCQ7+<US3}@
zJ0=y*!}TmXozKliWg1+_@s&P+LA&nNjSo|{D(q0|6)W7_McvFZ0_FKStAe0JGdeqs
zw(I`a6Rlbr1DAkAOp!;R8y$-S^zlXk!FYi}?%aE}g#AIx+aIBf@&yr7jU!+9YR?aN
zMjQR?H_fW^4roR8lNz|1zWn@2aQ(1)BBitzu#1=WLLze1<Kk0guX{9R*hz!KtUj&o
z+=J*S0y=3fgBDp$*GQUiJ$qjCi^Y{P1uwo0qGYZkoSdZwg%_?L7gTdb!i|TL-_LzV
zSzzDg3~Ui9Rj*^ZHq`{O+^^oT6VJQwMfW}WcbW^0z(jEHX65F0Q32XgFZuTM^i|vY
zd5%vYmi^~Tv-v+ixMYB0Bt`z5Yw>pc-%r@K;gwL4{HGSR9Ut=<ITt%k1cNr0+^e^-
zne!jpv|_}Mj7SU>qQu9HSE=;j)o>9EK_Wy1z-UgK41ooTm4=O(Ia&~v-|N0vsLY>i
zX6>26bHnAsLz|zQS4;uW0^r<als&<217Ik;3E>}@8CHPzh(BtMV#b=<Co<G2N%9cJ
zfO95Swr`GlMMZ_<NsgpgF&l8Cmr_x|6b@zM=QZf-qUXzDqfZnOeUq5678r)ImleQw
z%cMqh1m?$`^2Gr3`%i91g_ei~<})|BT~gPCAJ+R~08FI-$kVqo<h^HLitr($*yGRs
zzlU#LV&0qpq-DQc#k=IOsIeo4+N*<1uc!`v7-0bR|3FC2fhmgl+08DZDPg|gQiiZ4
z%U+7<;CLUb>qbFPs1=!hRCse~x{O)MJnJq~@}4_s7r=x_++DmlkmQNlNp$~y7?+@v
z|8;)J2x%+#?WX;w9yfZH9$CX+$z(o@rkun@V*XS>iTY!2TiP-EhceCCZF_@uRv5Fp
z0JMdnieF=QSi95p<uSt^7XpHSKN|ZwI68vt0c)~UqbJJt#T!6EZ>rU8r0vx7f|S>&
zZc^ak6ef;Ft9$h$APIijMqaLA7?B3dvVM3MWZ2=p-+MDB51Gr@SPk{l?b@VeWn1@!
zZ<8K)Q1!`IK!(T5-4S?@1f*>^4NY|!tIkNQ=+~V-ZGF7;Lt@(?vQS>tj^q<>al5Fw
z6x~wChA=PnKOZ>TLZ8zV6#iYZ2-7opGpQLOfm;9=kuD&id{T?TFA5vTBJVK9XVYJo
zOlEg06LZRwElmcrSWI@hEL5%uu$r`XLZ5a`J_|wr+{HxY)WLrizn0?5$9bW#pKZjW
z*%{@5RYs9i3}rGVDg{$e7S|ye4W%>W5(S$kMjUXh8LZ|?6h#(hLbenVh3k0k<SvL#
z&|3uB`gY%dL4vz&uSY>U;DXBD?M&=(k~q7lFx*79#WlLcZcAh#p;>~`7Nut;9q}DR
z1`^3%_Va_4K^7-7IP`Jx)&SfE*oz3yr5F6s%l)VO*9vXh)8{wOY>C*rhqzc)K+Jlm
zN6UgMjz`=9UJ(h74FU8$h<sE2WMQ^sqK7~xQFM3bg{P)&V0w;-?4OML|C<6o2C4tE
zkH9upl>y=DOLmApr}RP6aJuX&d|v^|PZEUnz4(XSi|pbvH(KGew`@7G&lG{4j0wlL
zavnFcw=EfDnJ^#JA$k@+JSoaM1AfOO*<n8I>&agU$uD|QpWxCqn5Az{)~~ram?rVD
zZ7tPovc&iN*2UhDg{b-#7+B`>-(8!H<zNVi%JCjGxTw}YT$ymTys=J=S)jYz8)*xZ
z?i@1E-#%FRm>lT%hT#`o%ki#-!+Nj6uFWU6-O;QTS)29TLfBa;#DE8~d{2qqg<aJs
zp9_C{_%XoCl3s-5&4P@_%~{?%+78(pbP{?40!L(gTIse2juEMiS(A){+P!J+z9HyO
zbs3)51Rhssh9Z+HNFAI?<+3`S%zZ&IL^EEuhdD>5<24x$;yQ+n_lLe0sfZP$OJ!v_
zt#_&A9h0vgbU%rseFIh+24=HW&nL27Pys322=l4t4iG1289TZ2WlCqESm@>^ro$Wd
zGhQ^$tLN&~PW1k;f$}LFpMJ28pl5<>O@6DEagc)mV_?2_X@Q76Md9~>WRV5GTW=P(
z-~Gv>&Hody_~l$`F;B&#HieDUT@Tf(9aMmvp!1tUF;X6i26xtAs7o&DjY1-9$U{&T
zlgp&^zCXjdG_n{O|Cou}Och3aC4aa4pvQI<|E(UX{{}BSK~KLyR8pu~!Ui2{`7E6X
zkpZ}0-^x^^+ctBAz=7OA<I+T9+uL+VEnx)#)<U-vB$VMHJbY3?##%ONKqqg{8&!=l
zlXXaJYJlp|)nOsDuQ>|nzrn2?4j>p-i0Gw`ZC<Iudqkk!1Gz^6SgMFaBf~1#Wa%@-
z{Fg=qoQe5#gAZ){8Lp#~>l&T9lK4$(p6x%vUD1s4(bP{hOR1a9KYkNM>>kFGY)?kr
zhY+K3v%qm`@XO8mK$o0rRa|6SWVc~I<fvSD#sDd@qvFv&`ar_OPP=^3W9K)?n=;U9
zP<`N+f>4g?Z7um5e&+i6Ohtt})43WlHe)<Ej5n;tgSiR@-R1|&nY!vV+ZWO|keGd7
zf{uE7cd^tIPD4%}4R{lZ={Y0QVm}n}u`>Yly_^gaE)$haTl=5Y5*WMV1qo`Rzk<^6
zUb&h4+E0=dRqLTEZ3T$!*a2v6zUuXsE9PddUf3|r7(0c2s7+}+ixLGRsZPY%I|6r-
zdG8XOKD*I20Jm<`*R7F<?+0g_QVYMzQug~X!$7VAQ!%b*o`XhQGh`8Fiy^}Wv*$@#
zw88RE*DtU4KY0#;fk_SW6gFyN%Rl_t-byL?Ee|AY2M}3j!lMzICV>5tk;*Vv1vJ2g
zc2GsQEbff}Vvd?j8Xiso1h-Z)!oN&rM@((m>Cx*<Y;U7Sa2;W1pV5=`o7zODY@IkG
zDQtkiJ}c6(0{xar)>Oor^82y6Dp?bk{Bn<`AbNloKT`z9ji6O}N@W1XRL4Ttiyogw
z=3xZ)W!)c)o6DE-Yk~lkpR_#E01D6aq?s4vMgom2YE95>tveh*bP#@(@kFN4gd7(!
z{~H<fKRVZ^-zJP0Z}HS)_z+8gJy0m#XZ^ihZSt2-=L&@#J{IS)z<&7&PQy~2?niOT
z5Jc>@hVA{9{LGRH6<@w~7+lglS9&cIbC`)C%w*o2ZC!sSbC&Ej5IQ0tcd=+Oq?}TW
z-PYCBK&i`9b{bE~IX=UjL-L)?u$M^bixb-JaXXBxK{_&^v0if9Y+V>hdW8;1Z%%BR
zOh`&gXIC)ojZ;^rV1`}&KA4Htc0alb6Sn2vjF8@aJNtoB-%$0}Sarc`N2=KeZMX1W
z=57UI5gyHW^uIG>CvfR6jD&5xDb^lNPcU#l(Dqls%klWaqvdbBR&G+Vny*7cb2<2s
zU=Z=`-FeFoXmg#|(69E}^o{2|MN99mjyGmX%S=YnMSh178%1ZG?7l9Szj3lkTTe$W
zgClRy)fG~&GR%6ndR)fmR_J!o!;7YJ`c%dA)*>=pO(l3vJW7^xO=~M-H#|M(*}!(O
zGnAHzT&|5n7GTR1x;s&ngOq8!N;?9dO?3}rM(N9f6pNHePEMYTi^`2`(hgUN>yMN@
z8c5bl;vw99J~~oZLFzEdaidRQ4p8Ln^|+^byFKM$P@;4dMmH13#5>gGXSxAJOS_2Z
zGjd-v6C!c4I%&iJ((8Q$5EJ?)yD&TvZdVu2X7W~mKn*jz)}^eJ)R=8Wgj23|=D?mG
zLr`ZBK7s?c2-E3G<klL$r7ninxyO1hRx<z3^LN|sy8`DOdf%zNptdAt+XMg0J$Z`;
zwb*c!H}ul$4MLSRa8(}K!<K|;mv>Yoe@WK@`{|Zv4aN%jU$+zqJ1`O*saVM|L#a+T
zeWZZ<(n<+EZ?W!h&}{5uB_~oFO`?jn!@sXHbMo9uW}#fYvAUt3bT5P}Wo-9ewKaB7
zRBGFLvC7}+U@i_InEy~vIK7+rP2JmivB8i(vsQW9`yz5|LC5&L(0gTVl|5Qgh1AXA
zq@DHRzS4T`z6B)pT2m<zZLguvP%~)^0~fbn6I`kF*Tv$ZXmYTziG@S)?v3{gDt}!f
z;h6Sw0uDW$fc9P!0F3LA<soxFt?akq{V?DGsE<5@nM_|nAPdXcc0Eg-T6z0S@g_3?
zetgbxPZN!ZMXn0AbNam;|Kma;yZ8ewQ60AsV)r^@%O#}W)jbj`@N0Lafy9xJ5xJrc
ziZIja)wb`&PB)R2RQKRfI3ZuW@t}ieTash$9}uy&;6LpFib`UM&{NW)qp)G7|9}G#
zS|};FkNHq-EaUrZ;HA9EdnWGKp2S-u2yKjPQVH@gO}Byps-Xg97>mn<G_8>bWlXXK
zW!-VJW;OctsF3ZeahQDkDgWMuP5xC_D7<y8OJ8(-4jexpI78}DvH51%)7f|fh>W>;
z@zmOxZ~(MMO|%xlNlv8i+8T#Db2l()hH#Ma4%?-p9G!6MdL`mGQ748@hp-Fb!?D+o
z1@gOp!@D-M?*QG%%F5<{Y`aq~S0hm9SpJ3!GQ8X1_(T5v|7;K1{tQ3P>scB1o&%Lw
zhS1aWgYHY??kvE$J16XyCScpCB-Fsj{S5V`B(7Lln~gv<4e=BRp^G?ZCwqrF-B%Js
z>&w6P@MaGtS_9HB2a_Q6G%SbSKXnXg%ThUnHzx(|Rn7PBY<U0NMl+uqD(G@tkEeAM
zYKuS6(IO!QpZ@%`r0_VpviryrK>z_j6Tek-WV5kfz2$2B#y@d=wzt!`r9B}!ud_Lr
z9TbEpGV+|fL0%O^f9cVh)rs~Iv7>^9fS@QSdE|Xgclb|iUo0|~n+Rg|5U2YS47oVH
zpA`ArkAhlK1v2yJ4jlI-F$-zBvsJI~?AT5ZPlpQ-c)!SKVnMv_U3kJ>KBc}%u-;(A
za1G{hXqacYU-E&OsGS$VQ#0ndaBNC&J$3HdxC(4TG0(6Y+MPTd4jKalz;|BD`dqXF
zSA=3`3SrX(pTjmL-_Hj%=)MJJky=0~8z?quczG9AKaMUZm|c;*repcl(2sdLRKGOV
zvqn`B^8RPj2a7m*XC^qf+4L?8Wv=pbXRo^r6~e5t>iWPou^|I%&VZj-ke2XSo9+Cu
zCZpGc9Q%#~)KzqxU+FhPUOI<H|G@(QaLUWoKU~Jf)9lX`PvSqlvak&4a#^wK)j+wN
zi$=(nxmVt%jl(Yl`tGGEbT1m-soC(6GD|-dzy)Nl>SoiOI-{~gNw2`bDh_tI7HVDj
zeLVN6YiwuiF|Y<EEt)9@y1u?W4MRNOMhcGMsK=db5W*TUqd@>WQ)7H^XEVc;KO-h2
z3t^S<HY@ySd0F>o0NU*fe%2klBO#2yBySXM2L;^$gpocDKw|#LRToC9D+I>l9EMLD
z|2BK1Zo89eJ_o=?r_WPXV&z4XUjpr|I<7o82!ir_P4AJ~@z3<`KYQFm3s~nh0ATFt
zLD0MU$N-_js<8HPCJFwhR?C})-`Ks#syb70(yisob_%te^@zjA^sY3()=ij4?BIZ|
zkg<M&^kS$FhX|J(B&y5qO$g@#(W~ax6X0uc`yAglP%DzD_&sEzP~k;WnXn78{H(#n
zLw&|34R$W)%h@kj^oaTO94%r-pG)870s470Cq*>?`74dt<s$v3iox5qQ?*iacJrA-
z@nWSSY%N8%Jd@SoA8l^uqg6%&)CbuIMP-Z6V6t7-Qa)zSv0Loy?KoS~0mJC9^I!9O
z;VBknp$#eQUu8@fWZz2VFKs@^x&d3@<en9-l>uLb_kmyM)w<>%ZbPrn-4-bR>c+V|
zhtg?&0<UwGYdcmkJUzW;!DR>qYyoB3hpr#bignufKNKkf134j4F}>r0B+>p~Lh$~n
zQd!b3#n7^8(WA6hV0fqth4A2@@ZhX)?I|^SmlKe_7;B`95E-rb-*v*dC!=%&4wcBO
z42R3kOac7e3MbcNn}FdJK2OxqwQ2&=nCfeX(LmB`Fl;9&+;s);-_koMWFok8J57Lm
z(_K&j(eyie>Fu@U1{d_+%+9^<&BlsMo1Bq3ktdc@5~%xRYZW>*rdW3t4|3+Mw@|o>
zg|Hi)Bs~A62)pElZnk~#XvKnQcm*WDD0@Uzf)?!_y}ym6w#ZJcP?D(_V#Kea?XSR_
zx8kG)@|URIzPJ#Tpb^qkt@)OU)plEjZSdT<JlY2~X4T1=H7><M#8P@U5-a}t$hUE2
zAK#RZc3#y^qj<Um=to*BL;v}M);(ZD0`T*6Jd;ZK1rErP&tC~#DS63+jocviB0mK%
z`1t!DoY)5PW99{33Ye7~L;w*&bP{_8XBHb=C4CF)6FcvX?Lk?TjMULv5z36aAgD(~
z8KxhG(W@%QxzAzD?a(;Fvq@+`{CY2I<U}~3XUK_ejWAaQ)3MTtKQppcPi7QGnHa;N
zp&id-A_yv1dnT(L@XQYDt0R6ru#7LN(QDgIwm(B=-W|RrhQ`8x4oHo<QSRt_##dr=
z1w#lC94@_6kp}4uJi@XL-GdMe4lUweoCBMV@nm+38s3a+I7gcm#OG~jIP|gj|G!g-
z344nRlrDf#PloohDofyNy)I9c%Ub0>mCNbeayO~Pb52e^R;D_t;~fu7A`|?t?`J9n
zOED%DzH0E~RFuWtP7b|0OEjnb>F!WygQfm{lZOXWS?S=Du1?P;Ou=NO*Xj(VI`0KR
z;@dya=aCmo_iGqMo(?reX+8Rp3I%R&Gz|YjRv2IWYdXEP@mg-`kLq$DA`>|m7%cG9
zc`aP2#nn+p-Uym{!5g-JUHKG1t^A<s7KGm5VPgYCC^7ws{ge#9es4(f>t9#8^d;?v
zKp>-&P2fJ^0A}1e_W4Tb*E2fcwQu&>ksLkYbuM8&<RTsFwwYk`nXC~G@I^L87*ha@
z!RU8awMdIDSfcGpf!-NB3sE9CJM9<d#2^D=?^lxFG?~aED^dBufNprwot@_4kiStP
zipAOtSYpMQ0HMx+dvk@of`9tZ=ScPJG7Yd?F?&A)=Z}}?EjZ6@;`MLRoBw9<{xpeS
z2Eb9>0Au^^Xn!CX2*`FS%!;4LBM#Jm_iL$Ul6)+5rByHzVi$GTkhr`g@SvY=Eq&Iy
zlOjORbDoJeaz$Nx{T$2Lr3l$v2iEP~3|U_TKf%}Fcog!PoRe2?A5Yv3rgP>AjKlQ=
z4K0XR5+I^w?R`;pRPTzK4jhB{qol4=JSA{&ImJJ3WAcma)T^hpApYaqXmd4Iyt_Ut
z0*cY(ZRAy2{F)>XvM@C|CXX%CY|Ol-?=xg<I>{pNu$@mTMwHr6?gVh%9K>w3bB(}M
z(bOyCv}4qdan^Hd_bSYg+VNYy;HYA<Oxh1gMp-Y3B(%?lryTXwiI|oSG9s!ABsm@J
zNmhWt?;YJ@9z@aVUB&<<+CEB8>3J>>G*$S@F_^;0ZQJ>vUY7)NtQuN2U=W13Xo1#h
ztN1RmEVO-HNG~B|Grohoj=M@XXPJ^egtC;Fa+wAnIS&8(1^jIpm#6=}hijIo?*Lj<
zP?kcM>d=@2_HPL`OqZQLD@G%1V+P2Scc4pMuS78eyQqPNxoP?SQ4D#57j?A46)gg6
zO-YMygz|N3b8;_~DyDr}Fy2{_2|WLrq&$33&MWojK>Q}Ju={Qor$CYsUpDZ!!_veE
zQTo%Ohy2r`OEB`N#Xq%Ii(s20ciOy{Jv%9+V3_GIDv^RbMvByu8C;2~{c5&Du=3j(
zifyR8PWzy|++5JQ^0xONAs(K%f`S4rDXDBP7?t4GUR)PbWd+6~%m=Uofc-$3$zq0Q
zN4iyqSBO8gaj6!;emF!JcGO`PmKDw|?`t{Wk2Ge9!F@W&Utv8%PFe!xVei9mD2OHy
zMiv9nLm;^EroZL_F;c3)yuN&<U16Zn%O!pZRR;16Lz$y9;C2`~sX{jl!eGwP9olpR
z?2O&BD*%w0I0z;Jn4e@`UOGF_cnO02aT&_y|J(jq;P3u<>x<yj)BZW+Y5)AM^8xIi
zwFxHnDwThKgtEbOwyGWSk9!to%c`e(pg;}fVAK57s)$rmshEOZdDh4F+H$c>GlRP>
zcxn(wxB?>mh~QplhRxoa%0a^6xBFVGR2%93>Bena^BZ?P56hoHleXwTJxQoaYKhe2
zTY_T5YDjcSSBzQ3-8sPquv+2PO*@n_&x}^7BvYj^{Vh%v1TRIqRsJ7kZxxnh*R>1N
zoq}}SfC7TljdYiwG=elph=6o=cOxR8bR!+o-AH!}2-4lnKheiG*8i>VIM#+6Y>8fT
zjyc9T&WQ55yE)T+`SN91l;pP$H;A>6sQ^DeV<oFt1{Hd0YEit`A`WkDp04V_J?+lb
zipL2RwCl@!6%qb+NDq#&w=Yu}=rK4to!!j>?ZpOwTdF>fU|53ru%t-8xXH1|n7`*@
z8{%zA#L9}{4&{mtj;jb+fG7TXGvQ?rte?)g2<1__Q7gysa2IS-7)>$yax?ideN;vy
zJmRgjmA7Yk*ojj^u6Jw#1S7>P(0NEwPt*44P@4-Ovz8PP!;ZUL93m@7rTzRkND)Ku
zJ@ofM{2%X+N6>HNcnVv-@##Hu?gkIb=gn2#@)v3`!fhzi&RcK9e`|<b2|G|nk!x<Q
zY4pa49i`P2rp8kp`4GE`#TQMsKr8N+NqG!{@IKAO+wqIgm-abiDyN(J9Ca1b->=#s
z2Hc>~6~_F+g-6_$2wblBV1uyd-qezfmf!DRY~?M2+rb}u&3d<AJu|=G^L-p|X~Gfu
z#|L55wmRvDz(Qg)TQ)qbLdMCTF^W$F=`C?kp=OoEc!IYG{#)pJY&PNszTb3rx72+*
z_K-<K8BbOu3NadgS*u(gWQhU+!$E9tfy|q??qel-d||dJ=8J(Z3W(ZVSUaJ8usm+1
z817N7U>@vL@Is!z;;~yqUJk-t(U~goq}}ns5B(-eSQ#7~T#M<RjJLcW-1nV+8-Cfi
z4cYWK0jKYDMz{e&5hfDBiFR3{_f)|ktZR6U%{*1d$voFOz8H3bZ8l+Nnya_u2Y{7F
zfPVg)Nu%4vlWHr!kUW^W55I{8|8ra3B>rdF6qln*a6fA|dU@?|x@6P*^Y$;wh`C6#
zeK)67O3S@`iLI<n+Cuo8^C$D=c^oqrN{dDpZ6GrgF%p?dZ6}&v^NLg1bfJB>TVjWs
zg0L=_6O~F0miB(rbw~o|t9w7P8Cz~s>MBu2Sic(>x;!D>=;vBU4-L_U{8@*2{_9Ge
zb}=eVJpKL7z{ABcYp0I+v4?CsM~4uy$bqjikzgXijR=d6*e+KgvTpcb3k;#CP1gqG
z$W^M_KJgm43RFqaL`T%FtSI^PMC_Bb2A<ZBDp~_j^JMsck<iLGa7>c1<Gpt7<Ht7a
z?(A*!LXNQ#+3nzdckYknCK|wr=i~j*julCtS>GS4Q;~HbAr|P|ZC>lG2L=YdGB(Z?
zx%Rhge?v>sMi-N}1TUxv>Ee%KdqQ*?^@UBGpPr1*uFw6*9tO%<{EBf}cZz_ciVfMU
z23uun_eaB**M%BcOl+zO#)@bt7-g;>Uj8l||6_M{_s_>kS<`)e|8WGpypo!~OiLB4
zetky>d?m|+bf$~sBJDMLD)U>!-xQ4oH?Lab_=&)DUWkO#M#$f4Wy?={@%C59&zEkQ
zASTKm*I4O}TbGiWgyQ&sk^FuJ!=}bjd@8zUl9QRe(lXxj;m_Tm_&bwKT^&6k_;ZPP
z5SST1&_WS(YvZ%oM|^O!3e?zSe<0KV_zvQjp2+7YhsTTe;K8xlYZzFnXWZQJB%Eea
zz|?olP^B-h)$lcKu1|MJWx^Y@ktZN*mIS(<RwC3M$p&H<c-H}4&rhq**PcBgwu{O@
zU|kr?oh(X>(oelT+&VdB*&hppJK5=Z{%l8;jS_G@E!Y)9BCqsjiE?LD&J_j$b=km>
zV~Y(ZHVs~AKk$NxB?8$UKgv5gI$^TKrrj4#XtmYmQwtWdL95MJ7_M1gJlH@`tnnzM
z09`F`dqjVza;W%5f&L-J6SJ-F`Tt8r3;9#g<XK?U@1;#E{BRSRzjV3`{ynoqi}bj-
z=NZ~r7Uoy+l}x5p3dEPcFWRZ2`oz|47D$bff9kg*{jC_*Uf&F!+f!jbRWKi=W!A%8
zW48CdOR4Y=$$vdCSCc6Pe~@}cY8cV|ixsEZs88v^8EkB9%8hQ$vM|47DrBrAJOO}f
z_gnxC;nDCmJtQW;-(NBRb>Xv`Sk!z-nU8XabvJ;|VGjt*+dGgW(*nrRfB@fE;)}i7
z0D{i3h>kybjP7s%880_?FSDUmDi~<Sh{X7#GWttX!{Jx7ao*$M;hBIUNg{cimZI2l
znLy;$hRL;F&{87O7Z2}2%$Q8bq2EFT=143oe6T&b)ao;c51jNRF_4J}U^1i+BaBRo
zJnuuiRJ#Jc^%!%9$OuYOOFxY`{upBX|518y?iL;YX~1^JdVTI2VO1QdrjwMspuczE
zm6gtL?x*iq1rFgKDZHLD-eBxo1cFc!G&#!hp5ZPwkE;j2mY@QfRW+M=`nK=i>!x|0
zPSIW-P3DZ)XZ`79|9<bN9NhhXroN-&EV@v<`@yeS41rlY`{>CU{f^rQ+J+x4TZO!&
zOhL)roB(UA;4+&M4#Xn2p>}cMj?v`6QQaEPm$cuS7=QG-4^i|<cMkBMBD7{@BQgiV
z-mu`Jcm#)t%-7|>B4^*H{yTz>4jrD(Qc6!Fk%231t$t!peN-vdWK@EIkHGcLe4Xk$
zM5LO}_TOx=b%@XnF^W|33H$>Cw|Jsp<JsZcFb#Y;OAN?xu{#wY%la0em$Jj9F%?Wj
zPiI*n6Ebb@1lKC^Y8$;QGxO1BAy2`MuCA@T!(Z5`QKB7BQbJ_!yPW?^=X?9lIoB<Q
zQLnl`=iG1`ZX+`O`u|?~ie;22aVd3h;$e_C%){1~?xdN{t785@wAR){ZP~NbmNMn?
z(<zwzzQ1KcBj|v4!{qlye(8b0f7Ur00k}q|KdIeCP4$MbzsrmvGF%8wVxp8u9_nYS
z*=lQpuR0C2BIgJfc<lq8cQ<jImOl!DbEetyGa^B5phAvZ(z9rMTc|qWqt{Wgz~Tsw
z^<A<AsR4a%fBS3NOnnRlm8lY}VpN-g@Ed^0LU9~$;bV-`LIqJOb46NZU%aqBG*2e<
zh?*um0b6kpHDg{I;Qks-UvzZ=yeY4MFu^WN4Sq!?`FVe7hLM?q?JSuuBe8)m3D~%^
zUQ9g|o1F`^>?Gz4du)hK$eaoIz*`$fzj}+=5qycB{=bnt?t3HafA>cAma5QN7K!I)
zZ20l}@A16W-y0y6&uP@rqDB6I>h5^rG-%z)wH4=t+lJuOFHh15s1W|w|1N^JR>Z$X
zhF%tC)ZY;X-rFKDev1geU3<)L@rz}ndW?+7PjM0V-8mkx+ClB;=-6naJMux%1aNvt
zP*5s>??=4hk)QQUBrzQu=<Cx%p-Nre&ep8NL=KR|bjwfdJ#jCJWn>V&3H@(UpSN(M
zT|#o8!;^}XE>R-LhOZ|OQ4@kIqihNEx_L-h3}whVwQ}TBCZ=PfAI7bD^XDVl0yAO>
zJYU>bQc^*kShjE6$?}OwlVd=BX6-tkz8~9Zhxs~N8gV@9EfLohEYj+?^ub%zVx2<v
z$8AV{i>X8D_&91f+W#BQ^!N|X)Wm;NW(<zsJ|e<4!jHayf1PECu?Fq_-L3IAyrq+h
zF{sT^Ta_+~d=QO(>#$#KTmz%TK7l``28QP!UP)HE$$>u(5(0|<jcj(4{tMT2UM7iA
z`F*XTI1re@WcZ!uC0|Nr`7~gVe`I)Fkn8Rvg*LJVdNhtSU@xco8E4v7*Yn2yt9D%_
zEgsM{egx*h;<jr8S>T<keui9ne7RMe^Tnd}MT`j>3v}2fKs&6B1q}#vzK9|zJtb@p
zg-7I-5tc~l$<tzAB7CoZ$Pi<whb+|nATcqqU^WcV&gzX$rLTOHB`)K;RuBl)-q~ro
zT~GCjMn@i<Rru2)t?Xw7HMRHw4Ghh`a3>->9nwxBnu>n^1L&4$r;Tkm$MPHPu`s3q
za;$ZBi*?)SQiH%w@v~U%-zyCK@AqL4zc23pP)hz5Zvnm&*o*PeQaG!{t}Ddj$bs?D
zcb)0Ki?47tu2jxVcGXnE2X1up6#17Oae@oBM+=F+t4k#w$JnmmiMdT8M#V^QTfyM+
z>TMKeIS1AGPQckZ-uH>xjE1S64hL`N>-A4BL{W@VGyhZ5*o=*{-?2A(uSU69g!}mT
zw?N$LG3aBI*8aSqqG@SqV`Xopld=dMAhte>wN3~6Nx$My(^L<MGoUw(M+1EL4<Aa<
z$t9)&;o``2`MVP~&s(>ddgpR!LWxj<Ea1vvT2|=H9Ho;mh4vG;W<%md2h^<+;?V@A
ze!gjCh*41=s8u7q_Hqh?)0`5<Hq-^kJGu?aar{__HSKH}_WGii;8x4t%(wR(#GiZ0
zm<f|5s90g5YxUX!J~#KVAs{1fIT7(C2TTs$gqgA%85@w-3l`}`+IkDxd7+}&UAUDn
zgS4S@Rwj)KsjWo<4R4<o25GD62A0_WrMw4%Hs<_+Uf<+^sBk09$;Z4mX!NPO&Usf(
z_ils2IMt^pnd}~;nq>aqtBeb{%&x_<xHqn?Ht|HCTq+sf2oe;GSNi_=qOhSg)}uhz
zLOUej?jWOoY%czWQSm&>UMOZ}Db<m5zF4;2dHPz#z;aAN^}pI&NE`t87IJuKsSwr<
zL;w07@cjqj4=}!RCJHs*>$BpC3?}hO0;A%rS2=Rd{PVBm1tjDJFER(#UH2D7F4s~#
zf$%Rm>han6!SXZ9AN;&FD?u?rhSd#QMRj2^&5#6YEF2vXX2b-1Xpsn~1m!oz4~#KZ
zY)C?otn_erAYkle=}m<fW$cV^N7HAT0c2Dc=5}AR4jH89{nOsK*jQ70;3<wtW9u4c
z4m#Ma+shuwlHRJui6N$}=ttZ-ses{QHg4lWbAur)cxW@RY`xA(K;%n-R^$%=KjO>o
z)dxz|)f6%R8vu)YzdL^18eg0k==M=pNc*esn;_hgU(%a_w}d0>haJ!C2Vcym)MAjR
zUJ5)FQ~YD{=oBJMASC*`5Au8XB#&l4Yw&FDnk&aB@&rwuuWi!9Vt&U#?H2@QcDv7}
z!kYh^(br2&n*`ct8%AfF>h>~kkp(M%y&C)|@!vVG5P8VIK25N+48d;+m+%Bmb%8~E
z&Z9&{t^pQ>U*BW%z&{RYgTPQe$|>%tdis0$cOXfX5VStBF%kv_1{|<}h^ZJ867%7M
zF;EU>W0Y>_h@k8arTL1?bf5$k7`3v*Xo-AB?7{bYRiTZmB_jMboyAT>*`FEhQjN0g
zTr{%hYm^=aG8CarsJlr9xXGH21tC7ti}Fr5M>}M3YbKcXmQUu-TdSL43CaQjF(i+A
zto9IJHgP^i#4V%x#h5h!hP*lAUe&LMNb>RUBp3}Ontbom^728KkTQxZNF*x#2iX7b
zQVxFd)(ZdUeh|W7VxXiqFSb^<WVY4hCffwiC27~&op^ffp>M?zfxEIuLVeFS5-1(l
zLTS-~U-yPBgO3XWpwbSaC$U%E4huq+S-bAFRJ%1-`}%vaS)It4?O{)Sm!k6k<xRZH
z%?U|!tk^_>S*P}an<=K0SKF_t;AiCnmH)G(o@4&)lS&q}0?HJA_fT^*RxjR;NWI|C
zK*_ks1=T{iSVutC;cfaF@ZvFU@j*loEzZeO%y>Qq5=3Mh5!nckgPQjd;dX(R!MHPw
zSZ){OjEaL@!KB|S+FfYELqE+5>o<MC<_!;&vfcraHytfo-V|uZ!asnawqQbg$Y*n4
z{4s#j=dce;-WPgeC1VzNTcllQ3?>4k7q8_vm!zYqC2|3;Q@Kcs=cSa?5Q3>8X~10=
zT2OEI1FcFk^}>L2J@{>+rm$@RVqc**J^oi=Ec;@lL{{Dy@z$7qfFCfUaNnQe$f97q
z!TaA9iHv_1i5oc$Z(3Lx6j+tfnRTSH(DPo{9hB|#sBCDAJh<=OAzyI1&rh!&()~d*
zh<%DtlDg2Mhi~YiwN)dkFEq7qJf;;dcM+t`zR5=5We~R@=@B&)^)_Xqe_yLG5&()B
zTNTQML*kB?MsG+<4jKNlUrzZqfquG!zW4WGYJLbuIFO@YI--t-j-CZ3eMNC`KYu5e
z>vQWQDk61l0Vc?4<N41}d?KRU;8aMz4?YGQeNYET`OO9fFFZAjuM6U7E2y`a(PGpR
zhQ1^1hZfXBl6;K6KhiA{;g^6_j}6X?FppBgjZ476AfNgPlQ%A7=8xg0ne2;NQnGe|
zLpN*jqdwtuZ=ra3{}}Pqe5N8Tf}Bt3;Ae-unN04FDoaX`hL?av!M{F1z7168FZ#c5
zO>RAZ3IZAonxU5OJA>TWu+}rI0t_qEJIxc($%YcRER$)244&#XUgMJyh+OPUf1&!z
z$FnlW&DCv!RVlP-VB46hDSyKAxM%%crDC0fw&`poxk~jeZwS3k7%;CBU;Bx-zSmSW
zdTcVfuC_hgS37XzK-H3_oMo!wjvq-ccQqF2dwXq5n#AqgYO?c~Mp|(anKE+=5a=I7
zKR#KQ&GdV8qHRdopUk1XbQ2d7j&g_v*CNs~R-}!*?7G=_<7(0tVDJ3SyX?W=38Pv5
z4>537&PhQ*4`3}5NfjS$KRUEHG!4l!BdcepP(k)QDS4J0;4F<Y{^DJI)SG6i8CNdv
z(mqVBH&kjc8pFzYnTzk?O`oxjbd8?S3{qr`<O>ZG`%F&M0ilnQ$#i8xMQx3z+txdc
zPegUYoV3ONd3RCZJb<3(mNEjw&6g}_N0hz!{reRFp@rWt5L#Taxjua8{fL(KIUZ{K
zA{sCbiZnfBj<GAGm^+IyKcCRFR1sfh1qgEbIuJM;17is}Lv<YUeC0gRsyUlb+D+&Z
zz73Ao@H-zyJRdfsRz@uL3w%Yru(#FI@S0>%Y{9XpEl~%sJ}hWmy$L}}*a<$0i^!Gn
zgb9&gyZZsUE$pUKs*iX-8nVgj);jFGOyYCQhQ9s2&e2AJEY(5}dFy%DLs#K)Vp_!<
ztz8XXVdd%)myhWTL9yr)xt4CF&AlY2^kFoY%@5oc+p3{GGX>b>ec|xSU>bT9)vqXw
zf`!KPmD3q*v$6iZL)?Sls8fH~-5rX4DG{5!;CU6xX<_F+I`2sRNeUX;ykeQ7WTg<L
zC%BkL2js&$!x@D0S<t&W#uT}DVRXWqU5hEpUz^2`?OoUPHm5dp;)oXa)&ut<Uo9ZN
z-Z(Jo*Iy6LNv^y`={Bo&`Sp^7%K`&XXotuhE7LByI5Ro&RY%eh(I4jhtXDtzT9L1k
zU*xerE)w0sLT_^@BdgTNfOk<k3i|Kiw#cuNpJ#d(Jnv-10_(qP|3@)`#6f;bl4wsd
z+(?Pl7V2bzb3)@rY<ko`vLbr-fkSoIxAbY}_5HEB(fGsJw=%;0HZxrYf5wIiTatig
zwmUn<y7`s+J6@!Dy8F>pjncz}|D#)5^!wMT8QpmB$6M#tzq#XCYz@~FxoCNG<3kJZ
z3Uj~!^dTJ}qDlajq|M${A>I(SJIVGspDs{mPb&QsoCf)Rd$!>D`Drio6cuU?YBdKj
zfdRKL6mj@dPeYWqA0S_?7_;}_^J-0fx`JeU#_kr$1{>&n8KVv&HxOHC%T2H@8fZRr
z9|?CWm&h#w5T%h!JxNW+8^8b>0!r<Tduk}a#buuf+N_{}3DTsgL`(*P97)P0_xAE?
zHj6Rp(_Y=4AcM-+k9x=w?MBS&G!~ZV+fGT_cpN3ou=PamKN(<kTSc(av0effiZHXT
zsD~I>IdBYhN%w@ieR2f2L*${4d)b?VToIcw2Y4VZiOLE};hZ;MA!>CL|LM4WRQ?@`
z;^1zif~dY|0PijL`6*vUuIV>ZVrKWDP?n)a_d6x!ypiLUu4VQyaxRAoTI@(7o&bh?
zN?q&e5)b%r5}w35)vO|=8iodT(~6F>Wp|fRpsacd-7v)TcHP|&#}=UWTP#SUpZI&Z
zg$M38P`7d@%xbJ*X!sb9HK~2e@1LKpD<02)M{pvGoA*Z{Kd?|Wxv*-e0qS4&Z<>p=
zZ#Mu5#VZnUwv}Yj`=2e@F(u;61}zUrjVMZ>+}<46shIqqZl}bcExQX`zSjk|1jkVQ
zE+dD$aMgLqp9?I$=42_|D-pm*@*HVyYDz7sV{#Uws)#i|8-<C(bZls43XGFD-5rp?
z&*&&=OG`^*UsV{<P*K@}zCxm)Ksen5`2l<tAW5whE)X<!;)mwl!b%dHy6XomD=JfI
zUa4qhOr44fVo0vcAoa^&2+^B(c@>`6O%c!yB)@Q)+i1{T*{IO49|G=DQTZbSci?Q8
zZO|35fzc9=xAl`Gb2FMoa`PL{Wos?qz&V6OL`*CPVOOd#E@KJRJ4jwJp70<odUK*(
z8QtafBkO~iD80dA-eu-qp!)<_nUy{a&KG_9^7j)g=-q5y#gTD4h*8mQBkX=#zkgj$
zkYIO+1UD^<l6>5O&!F_^#+KZZozrrr;7$;<BN8|JkG+#gxgnNbapC#Z8`+)5KT})e
zDEd9?M#r#gDK;l0w(2iu6uuH_52i;p71Kqgq`uq?)RCZ}&YjG_&TlFgIsUa``P5~9
z`rDDaspm+em<e%z@<6jUivr$BJBn=ryDO(`!gZGVqn)SJ5WmHzaP+HxPl{LMeZjbu
zLBYE3C8MY>!yv)lhDfK;p|4u2H&ME;?!Jm`Pa~*b?|~-r4{06gF1Et-cxo{UTW!ZS
z*R#4<ugJWa{qfZ1cr;31#)}VB@o7>2z0_%j2P>{StNT$`fZIF$H(_4*hqy4Vj!O3Q
z*vInAgT?MXO@I~q&V_LJj@9aSpuGg(7dmWED#Z2EQ+1^nv1sDB;1r8+EetD%H-<eD
zul0dCg%!^YJStD|G-?7U>{x}mb7fxt5<E`zW$Olc4P!E={)y%A8Rn<(`fP>;q1-<B
zEdlOSt}NfdRE$4uUuEHXIRaRoB&=^>07f4n{8Z3t5e7Uka)bWPxa`;Pdmue$1k7(m
zJ>wC#Y&w9_0osPbQo#b)!)=Cr<i6@u02iyJ^>f2gQoQQ}v6XV3w--6{5`urUqvoW7
z+p6~)z;1N}(}@BJvA~A6sG<~Nmfke-_GK|RT6szjNqAhs5L5KTbX8NXX2EslreXDH
zeZ+vPK1T#|ah9~y#^I1gm8M+&+Wf?wRtT8yKi|4$HLpELLh;!c^-RxOaDP8#OT(H9
zBm0`T=|CGOW#xpXzOg$NznpK7WHFs=Z0I<v$P*f>NXgbPtob%tW2^dAB_{&wZphmg
z$j95s)I)H5Y!Muq67hvJj2#`34R$OsoMkN=N#Xvc5F4W2Pk*YSCAGa$RC>7Qzj(5;
z5;H2$clTZxp&GLhAh_YcdV1bn^*t$tx-?+*nlb}2F>GHm1X@cOn>)#;-4?y)>fd-d
zs*h9g4R5{*H<&Gos4n4ja4&9G_mAPkzp)u%B!E=iEpdav`<>NKL#g|z+`B%kISbw7
zV|tm{V$~>EL8k*ui0F~#KqI=+HfSG>+X66o+lm<ZU&b*PmJcH#BfmdfJ6P^A0c~aN
z&dY^Z4DoRwN8Sm1(U6-U9zw$VR4g1GN}Eo>YZnwj#v^KNZT&GSDmAzqQj;o-?YE2)
zOH~}=BID2z^6*5Xe?^5hPrqMHD5wf-UMXhwk(C&+j!TWspX(hmnhom!IVbJ$rU<sK
zzP|qYxT<az*z^ED5dhX=h%!k{^Ly&+Q!kwZg@s8!2`O<mKjJ=|$W;q6<ron)1(_CW
z#7}zmGxbUBe!(Sl^Y%`smVjBA)BuWJh2^Q5BT9SoLauCj93mMJJ&Ew&*&fYYI98A7
z8ZSB(W*Xh|EfMGx4H@BpbjYEPncVg1r%NHGNbTblKb{9}3$BhBg{D$FB!9gCG`@{w
znMAir7>~s1k{X<Uxwe`_29&`qNd}>dW0;U&6N~l1B=#?~o;O*;O(fy^5~0KA@`CI^
z-4O0Gk8QS>axZF0Mzw8I_8QJ`W1pzL9(27NBX+6R9ehs#Pm3>V716vK7bAG8Mrk^`
z%WSYSPf@M=)}lfHwH@c>Z}AV9cSi4*B~1@}(2*Xd!+BHL9l(7cYJW!}$%c<$Ljwo=
zE6x&ZKY5S}yrNRSZ%m>vfP8CIKNGcO*nKSd6Xt7MbHxffE4aST8}Cq*Y+oo7`}pIS
zJr|$(S1J45r4WP3=bx8oI3b4Z&r3uP7dIAQZmLfPWbMzvGo;cUMWpRpf$GDEg=3*8
zJcsbaX};F}Gd|GB(E5PMDE2d#WzmU<hJf?oqy7{jT|99Ce{5oJuyL35N6Y(i8=?S!
zO<OOwP^YL1LU(*xBpTOUpbN66HK^d>Ed1DlK0!uKE^DvM$#ot;jzv3{j;YT|c+AEX
zqr--zg+q$giAyQf1!>kd1D2e2=lgmNON!drGQ=*c3Gbfqkof7+QnU%p1i{`W6x6$2
z*Z}N1Sb9Ot0HiU5owN{GzkMg7MNdW<lSkF2<+jh!QEmOy^=voeS8tq%cAOWS2)<S>
zkz>|9)<`LusxxoQpq0sLK2sh2;lmM9@L=HLNrD0>Ky!eZY`5orM*3c}$wDBU;-qpo
zF5o@Fy&MrWMGlH|aMq+5XGaze>)OT^>Zql~f3h<_uh>7rqFV%~lJ6jJb8?n~PwLtS
zb@;~HEjO2{C${6!c6s6)!hgPzSv-DbJd20rhvW9G2y(C`je<dT4#!b*@|xxm6#}Wk
zKf+ow5wPFCj>aL2ViCSk(0Ysf`Z31=hIak-rKH6)Tm?7o@9N@lcQv*lwH9i`@RwUY
zfS*W^K{C&k+xSo~)F+O7)&lQ3%|78n#8-@#Ch34TEPBT#CrBrxO2%qI5!RtI(lSyq
z`x{P=xqqLAJ`{0DE`_;ZRwmxmWEscBW{;ziiu>&yG5}=n+N|$0EWFXhMSnvtiyG8c
z#D<HR<qV^p&a!VBHnP9qKgs-z1uHH~2C?$_*lUi%ceXv9QT~ILj_y4ieWx%2B5EZ-
z$a(Xbj=@Qia7yH#N&c9c3P~a+GE~Dq|J7=!jpHR!?Jpl?GngzOP5ST&rn<LC)UVcq
z)`4wg2LPFxMj35Q7R%pvMvn~En<??E)d_8w<0;!;Pv|K<9Yodcj#8P{6t$9)LOI!6
z(8cpv!bZG}$H3SwEdmrJCf!nff1r0RK}Sc=2&8ZcTEyct;^#J6e=E5}v_xp$hnQHs
zc&&#Sr5AP*(a|}w*L0J8HS|!Fm4^1)?;FJ9E9~&V$Ms}e+VRKugjzRT?D%cDJROm{
zN%iwohn?DIhU=uAiwW%3W5t68&lgIEOY~@5O!j*N&Py&Wp6yTHKG!8trG!1Y0&Hqk
zO3MVQHC!U-vF!a00XGQ82a`VY4{BHWyYrCx+oNWMnmpO;+FvU}l((ivS)oO^zPQ<Y
zwe}>`?bTmC+l>0^cC!%+Cy8aP-_?Z1V^_sH<(EX#=85rkwl6<mw9q~~d~VyGTZ*s6
zs>WipG1BqOc6HF%K(7o9eE5BIgn%Z2kXBK1zr~Zy;JO8mqgdSnO@b%)f7jpk#CA0H
zQR#0aK1u>0@nuG)N{O`azL~+>jSvLePHl%sK}s2n&Z$QCE4$|!hQ%B)FEi59?E-Xx
zXI=^r?<BvCL?AxDx4-~^<NFVVG}aGSlp^3CY2oMrAM8vISjT1voG*7Mk%-K5GBrGa
zK_L+nAS~d~$r+0t0ldo2Z2xUU6YwS)%Y1>ypj}%*D`udx-pm!FDq_q*XebsyfwjIU
zOcq3FYcXBs51<lb&VyX{wIs()H6rwLLpZ3umu2T$fS^^lo>|0sMBCSZq4+aVSo|Wk
zKWfd~gy?7}F=5P<IbLZhD*@z2Uyxl##-fwx`e+KgSsRnOYs4#hR0wtc>PUZ}c3PD9
z;P7~>=2!9~rBfLRpJ#({3OryAr{CeR|LRQ%iweIQrz$3u7IZkK$6UY59CkG020n0k
zdlZA1WQ)19H~B%$*rVB`3+12^JoF}*6!dM5FWpo0-zsAN2}r%L{(mB?x(NVg)=7!l
zLX`%#zqN!pd)hiLJ#ADgVHo8A;_2lj)O6>*c|3($pAg<-TIAy3jpM@}n%loy%O{vM
zG=iy&?4|LfX~2DNwQMI5Cu!=CIBDuK&#|*cxlS?TOP*C)tK4vk>Xm*VHo0<-6V}K@
z#jzp3Tu6=h8(IVw&00UBzUwD(;>nI}1uFSi60sprf@+5y)1EoA)M$b5Y+1_;2p{fk
zYX^FT+4O@*GS&RoNemy0Q|*@rI`i7Kwgk!yvK~C9Mm?)+VDh}J3D=M8a(TZ>cnRuA
z=;+hXzF+_9YW}@WXnuuYX86VsNp4(xQYq`@MqhnPOUvg>R3S*HPd%zAU5sWze28_J
z_e$-X7Px!7@{vNfVhH||^e!IPLfOsBhk_zVjVc1B1cq<ey+6LlfJ7Y5<>lp7fXvI8
z8e2LlX=XGtVYp6SjVg;m_8aP6D}eP4T!*stdBgcYuc=M}UNcf*GHUlpFY0{)OlZww
zzV&h^f)6X2AyF4>D`S^05iZ_}jD-Y0xA2dSbFc%H08h-gN4>Mi#7}TeH;HhBR)rJe
zN!eJZNlt*}upL>^wJ*+fGdwoYn!o)bGNOlKbtDP&)0POf4j}&)fK4>dH7ubPpNyH2
zdgAxv>#cg{jkRa2K|XC}Q?9Jva)C=v0E|bpX3a|#22X87hNvbO@HocYs;pc;v$uVm
z{}|#4GoGs+`aPCKQjf~tc;U98Vk;#nq4CM<0%NvX9ruCf0JDL4xCJKTv9-~Z&A<m;
z<s@GxPw(NnZ(I3!q#keSZ?)=mCcWYBHZaI__+BA-!y*DpMh4}B+K|n1W-Wtnwp|M!
zKW<M)DrxmQa||*KNc3xb%az%%v0LAVO_IGUs4ZPB(h64tZ{*~pMUBm`CrfiYpcVV#
zzkfCUaqr2q_D>w}*1w)nRof{OOYr6kzy1Dk^b3w87G?U)X4ea#)~NRFXLMF*f!NEL
zzRC)TJvsAfa=d;4h>Hi`12b%17fb8XAq3{1X>^3d=GxVi;XlAnU+6jy`yMeUB>A+)
zlj8^aHmQB=ca;s^6CR~{C)5)UZc#qR?NmHE`FNGNN_gPCv6qweF0SUY-<z)Y?+25$
zE5zJa50JFK)XgXkCO3qu9kfTJiRo}$s+#%*5`v5bhF8S)7QSPSWi*ml!)d;O>m^^y
zHEe#?_Pp%N8tYU(+2m5l`=E%QBWUT>BD7gs?R4=$x(a}so0h=z(OD&0X)uRjKFRLQ
zonX}^a}qa7Z(P3cLq?S`Pj+kV-E&vuB>rF1_8W`e^S+EX0lkt;`h(~W%qCG3&eW)Y
z-_Omo&;34w6p-gVA@}t2-Z*9j8>LgXg~3mF)Zq5N5Ateiyep<^PnLa4x9^g@UGVlF
zqQ`)mGfm#GLEA%<=BW#qxgygu+bqrNn{nCQ@x!U01jAJe6BEJ_6!{{JT0?Ia==w`X
zQ$Z#|(UQHS<Y9v!8O?Cs&)+n$#LFLfBp4iLMROonv26WPy?tj5b=ao=CUl!3vHEp1
zUsdSqtDGVVUOdlFKZp)P7&)rSzF1nMpH@*i@a<YGuBGG*Q+htN=h~jMIePca5ao1B
zT7+P)?O%8PYTutG4d5lhyAm*wke@!1xNj>ng}!%JTYh|^Y6N8sN`WN(05-jV^K22N
zvqWS7u|z^bA~8Rvl7!8}+lir*H`U)!msm$Y9s2_3>5opB9Uo7`pjlaPirfTvR6k*?
z@sCmkGb!8~JZ@ZM$MmS5NcBBrP)?Og;#CYM;XqkYJ#ViSMlrI1UbiBxsN*Dx{FJDd
zRH+n*GKuaddf&{ig`;~9*0m6M0M0G>xsQB%5Jt;W12+XRWLt>s9+m`|@WQN*Oh-39
z8KC8@A#D(`SzSXUSaj;S#agY^)QAMm7kx?4X*YN~TdipXE%-K52e)j#VV!rn5EFJj
zu$fw7T}I|{`$@u=4;5U-J+!ulwEub)>5uXHi_lV0Hf{oB5f8;H@kr_{8DG08xz}kR
zIXnlI(lZyDU}?pJr6*-Y?|yJ%XmDK~jAwH20ocfs3P+x7i!o_@8%t3Q@M*BVK7T=S
z*`&%(3$Lx3MlEnPccfgY#UrU&J1AsiMb>_0J2gbLiA=;7mWC}zCLjG+n&f6JnSAlX
zvy1juH(*yd`%On{PTeJ4mu0?jDS%{b?|@Fb)91qD+JoVS|3<RyE|#QQXBhO$X!)-%
zk2(~EB-|$klQ=>_I*n@=Rn^Tlca@bzr)mGD%JHr1p6SoSm>cAw!p*pgRUg}-!rmLB
zXp48MPmQ`D34$XHfsZq2B55K{02kKDe#e9R7Vl&}6$RTFSVWcDETa3;7bwKj5*#fM
zI2bqX%8?1}LXVh!phGwvs&is4tz{HBzm0*=zEsK_5Bc|#MWx-^_I;DT5=O0$SMWGn
z4Fj=~a`P|wg7=VD55F(QjlDwDdbhx}#Zy`CqWyCQ6_c@`aTI~C!?3g8TIc$vA7#zY
zPkeJWKTxEeYZ+EIrs?+O4fngE49y%tsI=X-T}tnJl<())07GNA5xi5S)9e})XdlZ_
zb)*xJ6me)E?Az<L2S!wY33aSos5$>ao5D@aU6o;ln`6n=aJw6~!hV(@r}V2z{%|?G
zZswblM<G#BKAU{9BB2raM;u0DQpM$_C8I+){3lByrt_<EIq%_lrxL$#-->;UNIzD-
zyEV)9v|B_4>#1zY^$}oM^wn_cGbwkK?OI<tNc<h{ke;A3ia*i%R&Fz2VP=hdvO76x
zRp&fPK*Djzl(F}9xM~k?tp2UEfL{~Ka%Y6%U8LGpCSb|QZfw8~k{r@qoeT>-%T-w7
zCE4#2j+=BYyWG7ySxeb!nl=j>%-<DoQF?#UK)&Ee-Wx_NG<vq+u}tqU8`xAgvml$a
z+n_73(|*b=Tn;TNEYz$VsWW&^B5rlWUDdyLw0-G%eTz()KbR|uk6+-?{O)e}@!;C#
zXWjGJz2ghQ+i3Mr>pv)&_qOQ$6cmm_Mnv?|TSU)p$*t^C&rQ^!<%tLAef;mMpZo43
zXHUL`vcJlX%H|anx-uOh2Hg2B3wYsD-B`t)Sl2?gk;pQ5gBGI?33SHff^PAGS9bhV
z?~N@OKqpdIZhv#aH54PCy-+7=mot95Sdx}}mpWhddc}2k&T$Xk?h7!9&Cmo!thGWM
z{&g1b@B2X7E~LJcaZ!|k(oqN=Ivg?3+Wa$IFXhFE{2r&EkuWjN>|3y>7Y`FY^gfP_
z{_e3CBtbDAH{R)P`Tz<)Th`}8j|R00e(*RE<q;%yadEp@1`0cjfLyklE{sLJlP&wj
zj#i8ItN!x5iZ_#6Yoo?D)3H<$_-{Sh-H<7LJmN3wxfd`S_JBY78K-X<0;gJ_7QI`u
zMp1ivxurr|^^@Qb+POq%TZ$>wkZ3{(rTywN6dKlo_mJ2U7}2c6Pjib$^WPf+ulWj1
zl`@$QD2JVVo($*gwDv_fcan}bx)wHFz2FIDU*)%54ZF-*q5S-@zqZJ9O6ahgroEDk
zW|BKl>-?J90)Jx38dzBSSWkFk&a8g6Ufn|GtbYDxuyRP`lSx!VB$?tg(YV_E(l-~H
z4s>L0xZa%Rd+Esy=bg5lxVOA#gqMf;FPLM6w=Ye<S9MM$PM2@Q@syiP?c*u~dYjnp
zSMR|Xs^SJ4i8B2p-jns%$=kILi7VfWGq%g+1r-w(*GPZ9(3L60SxxplCFXTn_hK6e
zC)6R53AeB)sB<cI+;C&@w!7HRh%5`4b!ofA3|Z%x+u_DuEL9N;#I&VeJgBbuk>L@4
zuu3WhwxP>mEz|ZEY*obh4R^QFzQ_&2VgZdW07suQFnhLZEb<l7vF8Z&;DFkcwY<bL
zOWR59IeSfCm<_4JLryU(VB27_&zL;ljMy_2jUV##yCoLoi^tLuwc(@uB__*8Bz&7Y
z80Dj%i>0r3U{SAjvB)=~CF{Ou6YumH*7ikg9d@M{5wRIMw$;<JQ^dd91ajtM;?X%d
zROlY#9cg;X`r_-JXI@(#D|~HC>WSn+XCq@Ybd;MD9frT=`UcK?F5I0Lo9>K<LI+2W
zSg^7KxH#;Rr$i1r2xE+I>vf-wkXqIUBQ<Pm2ZUK0NRFDG(7;+sPeXqhpLY*`>YLwn
z^D;K4jn;W0#@d}TC~)^+eylp0FOJ~iehm5+r<?vNM_zrUh<Dn0zM>(&;W903C-8B+
zLC$w^ftB$%ZP|C-NLX&(pL6M=tP)P!us`PxxEFots>q~E_V`?P+@z|jDD)H~XHCbc
zXX8#X;6nr3!Ez+W6QcKS@7n2;6sHxt=9)&F-^^3{hYsyKK3B}kRRV5mU0rm!Pnn8q
zuQf4fj;{FYZYf-^h`;@e{B_)NwLDiO@@FQ)L74l!+<6X`m&~HDh(7d8JUZ@8^7hzK
zVcb*-09KB*OAGt7e5Ve4$n8gZuwXr4G-_o`c1#z3xKAHG3f>N4WVzU%JZl<E5}VW{
zqX;zlr=Ow_Th9#IZchHlIP9k#neRuxxv-$CeL>+($F@R1&fc?q9*hT!)M=AS(#3<N
zLKw84-$^Ybc0Al_y<-7u6R7!A33Juc7~l@3ne+ACV54$Xk!@M5o+ZYxJm+ztvF*EO
zt7n|WkY8?Sm>wI>yS0VDMWo(g-n2GTkgG`fb)njlBGNMBMNjDR>d_Ow#d@cJx3bQ#
zu)5bmWL=NI&sP3DB=^LLL255jT>1+Y`(a;}{s>_&jKmK_l5xy4&|RMums#^F#XO~~
zXL*wa*oU-1#q_xetZ3=XGr(K*A)+72^%~`)A=}O9W!KZ~VW5)eftKRemLNWPnBXRY
zgd{=;ood6bnq~>Ar5nQx0<;H{56qpoj-d2x++OYFfGy#AUri7$n>WPq_S#w7KnIZ4
zy|Bz`0x(Lwp7w6Fx=DX}nie^}dJD{3IjkR+rV8gIelMB^@1r?9v3{pFu%cW+BS!n#
zG9%2YlTkKA#aCJ*Ov(LoQEeXgYg(w2$j|2@1wd&t(=?r9K<d!V?6%;3M!bf`{YH>^
zs3-S#^lxQN>LApDhMo0lrLV`$A`RY+HNpjOHY?swGKY)6o*1WsR(`A0r)5c5SinX-
z1hV)Z#ZFb-dv@Nvs<*_-{pg$JYqeTCw(z@kv2v*@@?h)kYf@arvGZ$ts1?rkLRF-W
z%K;CviA$AwIZ^D%euABMgMZhQuEJiE)Jc$~>cMBsGG81FPtV&E!to-N-fiBt(|i`}
z*VE&7*7@)cen|W3IuJM29a$Z=KcS&1VC<T9wpdz_;peAt^#LZ&%cnEe_0P-r2-*#3
z{nPf$Yd-lcDrKdw&!7EJ^&~YD5<GnNdhuH3j&9C~*}i=-X~}Y=w^)PnOQ)^&hKrtn
zZIbq6R+S;2ErzNouv5kG`FTYtpII^##VD&sd}nlM_*sB2X>t3!#__SJl|vKgP^A0Z
zId{oo6;k|@@!g8IZWXxDH|9ux@(o54i?Tu+B8db#4{yS6oR!{*iz5;{&0SG`l@%mS
zYs2##f~7cD>>f7Q?9#G$>7dOu`2hzb-3fpfw&m3ML<?_qU2b_?+^4L1Bi|NiO#A>2
zOz+N*y@K>ROy&Y9^KwwQJ+U3m&M*%f8(hCqn()4RXLCK*8`0GD!{a$B)szdSl>Ber
zq2)an#FGXg(C@i|;0ZavK*MU0U0O)HuXVWcS1{#ax6j%~l`~v03q6jf*hqMO%F4@@
z7pUG7S%3$&oPu{(ND99*b+4fNu=np~K}*fj-<3T1@4^l<ixY*(o<@6e74HihyUTR!
zF8rG-oxrT(l__||J4a~9E8XzirMp!jxfi9Rm>izQPNL9!jT4v6`6^1pd^$dx8mEi&
z%hG*FtQS>+grGJM={m|`pVmo+6HCfG6DoLs7|UdEB{KT61D)yYfjiyi+`|_p604NY
zx<3`r2reZy4z@cr-ThFTsq(Z8K>xn!_#F&TqS|$WW_<_O&9|Gb4NSPPR38IWQJfCd
zcVfj90d(zc1_UN|*j@LIJ+tyv-1xuc4qQ0Zb{jsm!C26JMA>9Gs^izOY>W&HFJr98
zQT1e^5S<AORl>@#@Lu#MIEb9CzzNX)@}Y<M$z;k5fo-GfE%6R-ZPz|t!X`F|R&l(~
z3?Mv;eJ$>PKPrI~JA4yn(HLr0N~s*kNGpLyDG#<MJ<&TTgXyue`+l$*ghi{mWB}@R
zd2AB$Dl#j9*Pa1{Ur8=#trF>>H-Mq65S_0t+}Hhxmm8_uyDI>b)GqrC`NtbX1l>gB
z0>o;_siz93z&cdW=%%j%*S6=w;}c#HnNFS^z&nhfye;8ekDo-TQSWr`E@8IS;~V2H
z@mNpAbno;ng<drSw#ZzrlxH1Bz&2rRi+@O7KPBl#;xE8&<_Q<Jvx84EpCm&rV~x05
zhd-IxW%`(1RxBCIAPblx0bj~xf8OkiF9^ytnK?e{Ot@)XP0_v^+Kgq~Xu7$|t#$F6
zfCssq(Jgat*AY?Qg9XtS?GZ(LgPlS>u?;`>a*QLPvsTDg&0^5|^p))8b$zv+t~%3|
zc93UJz~bFqb$kRV6&ka)KG<w%ikK)=FD&n<+Ooo)SGYkcN4qH$yb8P>w4dnTr(Sxt
zH2Q+z=QBaa#sp}>Cnj|n)L>MEB)(l^>7+Uh_DB!#&M_=sEA?uv8=lqp%S#qOmVLsS
zj{pxxE|0QdP9cM!P@|?5BCH#(W>Hs2eBx;Yk+&S%nkdM+k4M2AV^GOgyt%~89Vd5O
zAG8$f`2k{K$nwg9+MikG748|2erjzCC1Mt-*39>yZ+k5FwqCbnpKBhoJ5Co@Uda0U
z2h2XB!NeC|xGXbSPY__*XEtt;6U(xSv<{FP?tav5&nWTf#9ddRz3kZx<eZZEQS5=E
zTx5nA>wi}<aBX58B|^tn+&hp|x0zs?Yc^s;?XF~lb^~?&G)uoJK3QHLw|{ZG#bV2J
zDI|L(vST^j=*sgmS}|a;boqy>Q1{n22Z((}x5s#eY8S|l6Qzez9y4kD5IG?on{+Ai
zs8~F&iNmEjH?1dxy692}+694V1hLsli{X@C^AsNKHuL(53m)teP49?Mw2F83Hlz?A
zI?o@tEgjiK)Ebea3;OCCMDm2ppR#qG%L`2sJNLchZd%A2Y+%yl+@cH{SDut6J<(w_
zUl3;7G7?Ae_<F~_8BE1yWG}kSo-O-op@VCa@>)W2GN*3*70>stlwAqvP(+~{aows%
z*W0xgMUSbb>KofL4K=a^UriL~NIVXSOGT!19^3fLy0y&yi{%79J}Z=P<F2>D)II0d
z6^tErUd{)8E-SC;z7dMEAAxe*EQ+499=8XQydKn_e9({-eMv3HgwEOSjP?7!svPgu
zWiT}kS-Yitc?i8aBl3Keo^D2JpH!!IH*kA>^sLsdrM9KqpljiHEoHXvmGp1B_22R+
z04pz`w4~{62J>ttE7`QZSgy+tjB?Hl2n#&fd`?>171=f7z;gR~DbP!zEtKT+e87%&
zw_<p(=lSa%(&WzMSAL74dj9K7Cy$7kCqIYv9qEK#nl|1Y+{J;Rb_mg4-Zk#!ZuID5
z;d%7V(T`YU+{QJ?v5Hy^F2^O;)kmQ$bfjl>(6TnQUoT^Gk8aLLOeM!}0(utQ-W@Yx
z;(3lypOyTT=TX3|rxFm)N4^w4vyPgn{e1VHWT}ykqwhn6dHV7fp#wfB>%{Jp9*h)n
z5N)e+mTV@3;=QxV^ksdkSWt3w4TvV)*YL*`&f2a{$_1GAWUkdU%B*1LUH5Kyo4Lm+
zdD~AKz4i*4&uBKTg}G`^K4tR`*^^E@I1N2-sIy*1`V9Tmi$NGYzV{JKdpJL2FkLRy
zlb)>UKLWJUX`kltYauNo_?3Htk2*q!-0ydb^7-NiYVB;=C(sgVM38F%wffEAB625N
zg@e*kLLz?(QzCL)LdMdc10+k36$#ASVwfM8(Kx%<0^s=AP4J<W@YV#i5RhkRX=YY%
zir%_S9+Em%?`-=Gm9l6OhR?941H`8B=neWQ>mb`vt#MOvbp=~T`HDmtwKD39zFq)9
zBO_E2IC?x=oMux|40&Gy>6>A;e%iNkZ97x62ZptQmF+hi_vj>|Er!e>*@93G7PXS*
zW;q~=W{HQN_5p5L2?4k?Xg}}8K|rz=neeLwB(80V2KbgDzaT-JL^ISfz*=l^Ft%K1
z)P9H7c_H4DV~2*6_q5YHjh80uUSb~AhJru<Yz;gG5`4zrAreNt25ScW9)cbN$Z^68
zDCvY{sv=F`QArW#wD?gzOfvfFWEzx8s%O5x{(5zTEmYa<p(vzve!0a0+><G`hQG{I
zTE6QRd9;0`<|wPd>314Hb76c8uoRCQ4M~o9$48^i(kRKlIX&BM<r}|L1Bf1p%J>b&
zF(-|3z3XeKFQmxOQF)uN=F^ph?XsjE7g>ZHeF^-c^i(8<US{eDP?VZ6=!V;dqLP>X
zgg~jab;8wrR4Pwc8k6;}=U2ID-HvgAYfw<#b8TqZ$M2u7KI2jKYl@aEDR8*_vlPT(
zI^W^C+%6A(zA$GMi|erUsqop)9j+v)!0Koo{js`Fvcl&ig4>ugwdSGIg%))*om2*^
z`&>GXhkGj!co7HPxOlWj{;GlX7JX<+$6mLUUw#D)jTujsL=PnPr!(SWlOI?)n)7-j
zw+ID&kU!li3>urrp?p(dz5E5#<XU>AyZ0|yaH%u6J$7qo5Ol-O;C!r38r#?U;}vO=
z1kZ%)ubqBAl3tw*W3}hk?e4sFYD(^$VV`x9idNXG$%*N>?n~fyxjYbLzPp_pJ<xI4
zPYVp+(_poeM0xJ;jY@36>QF%KZHf?{V<$B-+eHl_@~CXMMOnA!&07lhi(l^uh<T@-
z=T{J@rpDJI^56RqV)<O(=@1u4VceBUP2MCsg=kcoy^R)_D@0FHCH_h-y>>P3h&+m|
zZe@N?-iR~QxJH3huM-m+DQ6cr5f?hKi(MwDirBNI=mXv1{;znZsYL(8wZGDM$k9D>
zVgVP315AgCCThu1(Yme9M{EaOK7PZvYa(H@DfpG?0mw(2KPFy>KF#4(e{AVQ;wXpf
zv-S0k<^*_kBDJ4odBdliKHJvHiksi_bc-WDoaqJpWYQCI=vXrx5m;Uihb7o<gjW@u
z6=FPgHHg3TJR&dD;08~I=E8KuKwc(g5t`IVhGb*m1JAK^zz-q0^K8K@1S?4K8)S^W
zsDk>p%Ot(vlL^M?c$f#}=Or4(2olTpTa-s<vN}C~jBMg2%}yu4R5H)$D6r~1_Rkhi
z0A|qtr9ar>m5g9M3!55;OUxZbmxg{F{WkoP7s$%I<jrozco!uFETxR9x%NNRa*;kD
z(}z4$nm-bB8M_(vjf#CnoBen^Pcts$VWh&9RNS}QTX)y-NGnx^>zeWa7F&3Pl?lhn
z;q+GwEgdAWT5wq!-!?bPGbpr+AIRW8QBu2GcPV~ZQEuJl!fSI}GGTr4lZmR@Dvf&V
z>v+<opj~u&r8x2d!*ECPe4U-XFG8&Sc<ESm8m&r^hDzvQPO_@2`w_WH;$@-6j~60T
zl>&i6`xVMuPTa&Zh_DyvL+1UT^ZbB((^%a4B;!Q*TbGO6V`Lr~bdQu2Dq1T=$$8SR
z3Z?0%0Y~0|>}{e{HRtlBwrkR_HPnBrba^uv1}t|n{TcG$=}3p*6Pz|iudKhS)J2#N
zs4&`nKsv(q_~G(Cca{$3Ba3I!%a;m+%j%J2f(3Xo%`jJtm=<Qa=68cXRA4kz_-`&k
z;a-Nq!HqzCq@;Y6s2`&+jF69P_)0qF*g2v-K$D_RgUmm<K#Bc?k3Veb;hJE3mh5WL
z;J63Krbq*`pOcc3%IS8K7Y1(of0*`1;M=7++pJ}&D)A7AwFNiBA~k&hi8>$fg+$y=
zFzt4@@>ST5^V<jDOYkO_yF5qzgHS%RwcXspHJ<%ol<skEvG+kZnBwVRs&(4nC+D;A
zYkIuL#r4q2WieH+)7Az}=<LD%H>Hf{<d2bUm6BR#Tw{sH9bX<@IVcMtNUj1E;^x_d
zl@=cKL~k|4&(Ai-8qnTiJKtW_g_F)r6%6nZ6t=LzBsMKJ9!C}5>9S~N&bvCON04)+
zCF1V+J1J+IA^I$Tdi3JKQBfQAI`tqs=%=DicNW_CK4NA*;-^HJ=|8KxI5Ntsz8=1E
zPFh1=I*0SKM0)(PUiyWOOzT3IM~*<9BYn-Vd+`H-ouSI+rfImATTDU>&0slB2shD0
z#oH-@5~eqr5G3`*lqSkiv0udJ(Vvxl31<L5?A6OtG9+PI+G{&FwO3w^aF-JF7eT(w
zzWmX!%{gA;5)}M<Xx#Wa5G;=|F*0P7HyUFS#4u@V)9)7}x0g0Sq%GR{mtaqR&*Ndq
zj{>d^D#-l%1)(l5F>p?37ekm(aRNhWO_XTt54VsAH=NC-AacISP10=y`R09mvKFC<
zY?*{~FMK!~3G%7MZ<9J1K<v)2*XTl;j(wi#xsH8lzubx0wp%jHcP(}U7;PNKGc~q3
zrsyX=FV-n9l}q&{;*PMjt%W_OkQ^S=L73e|+@lg-X>+XvyGKXz4pCm%=wy<AL}w8t
zTf9o}{0Q&m4)SB^PQB^Y*61DT{R$%C-6Co^rwN=i2)qJEJGWs)P?}S+F}Fr3J$VTP
zr5gR*RMUuUSC1l{)>e$ezf#t?y?F+|tZ)Wq%ldH*Lg^^-@2*FcD}YWcri{y9k3}h{
z_Tf3VTf1=_(_oHlg3OjP+)xPAs9W4OfVTn7Wp-v3Bm0ODC(O0^ywu=n!;xqXko4v=
zZQ0*!PUcB89Z5b(TC{h#el&?%!JO2(-lslDVcuGI3_{}h1LD1Ju4-gj{eI4+vy~S{
zt)X%ULKW!k*x)yYBDh#;>5=<&tK%DbyBr>!TiU_;to7-xz}4UV8W|ibN?OCNKhNc{
z9pGQSK}1X8wib0?fA-PyK`C4(>>}~%T9;=z|BFC<EzwHiH<uMKE$nMgt!m<yYHo;U
zx7Siwf>E!r`p*R9y%rU;&=p49v|Zq=Uk1XoBSKVB&~Zq(>|~Oqll@kY9zGS`-*!eH
zuk;wf+FmG<Wh~YS$XC9IHy!)>ScM<X$Mtk$@25XW8R<m+)&VhsciZ!@bg=a&F0;mZ
zKbgCG%0?f*-04QicYvq6JYP%1t0pm11vF6ya%7^?1T5K)r3qe)ph)ja_N*3a?XkU|
zELe)<*oC}PhFh#9aE+WmU8|K|i?D#0?yEU(cbym@Vfi{v%=t6JEchR-vav2p<Etxy
zl+C=JoD`C`uS1#o&KlkbL}n?H;ynFSA~p+GiD-uI*9mvHM6299HDpX~pO>~<MVtx~
z4$!O)zUl4LJboD2*b8@II#L|BgaC})oG*_It-X>1{y(n%vMb8|eIG!F?hr|-5mZ9D
z1qKF?MnXyH1}Tvmdg$(u4nZkN>F$v3?(U%*_T~5f{r6sLzX2Yw;Jl8{k&)!G<&WD*
zIo;0FGnco^GHs3cAM@lS`&)Dd8kpXJY%&gjte=fumU`Hbeyu^@>BZ?!VcLwYiUH<7
z&{d<v<6g`0-0XyY(z7%-;i50h1joheZxnLN8!?AM2jB*vsO7)<Goh2L$2)CJU-%(R
zWk_xK@~932AvO}v+U38h?mm{f6GxNl_jt8b@E5K<E>9Dn5{3_@WaiAgv)f|XUmlrx
zC{S#=?e?6v{@pSYGa6oS|8RJ%;_z(w578&u3>*vy>>3`3Pa_kN%9p1~Dnu{43G}N|
zv>NusaS%cg(zIUf;CZ8ulUxfGuFs#$^!GlhSMCTMMEBIi4J8drkIg!m>%h+6pPDe`
z%TLotO<kWDhwE;HE3iL<t6NPL?~gX;hnjEZVyz2%^^B0+uxN682QuCAHgir{s3%04
z)%Q3;Eacp70w^@JpA+x?cDlqF(o2v3QEI-6pcG0`%zU?r>|9w<+}l+G-|TN;m(5%S
z*32v>@>fGkEk<i@?p68s0Jd=~IF+7SD6q(`rnl!^XB|(R$glPp!#?c;nL@XVIW}wZ
z2Hkd1?o*EMi@zn`%4M?o#h6E?3Ap<HQcCU|(xpibyO+yTd?=jb#2$cUcui&FLHf_`
zB?1MPlRJ+xP`h72znYXv?`pTBhUD9|_{475JwA6W0Tzv>=uP|8vMNmf7O~9GZci%Q
zx)N;PKv@*?r?awq_P^c@(ORCg-<WZ-?Z&>A`y{y}`>DCBf%qHpwC-AG2yS!@30Skm
ze5u(z$n9dMJ<=~lc}Qm{T?Kr_c=d2yo-^uJ%5~MFI8S<A^BMf6St$&->DSAGdk0>#
zz)?pmSAt3_9@g7zmTvcf#wXNZ(hQ$ZC#YG3UYIMJAN4rUh?(Kaa6NlaEjCT(v%Rd(
zy~z2W;H7T58##DX!Tm1}=}>z~G2j(<SI675soU{x2or5!a1hPIPh$lj?8pBCv<%=K
zQ}q`;B4g21M$$mi0U-_GEanpQ`gz3D>pMbqFdqo13ESm4ZbQAqX-;W`VXbdfO2>f?
z&>4pXTe9J%{LGXZ#i2~m7UX$fef&zF>XGIh%(63J*hR;rvAyVh7|GjT!k6vyC%_Yy
zm{7|RR|*rdLQ$`f%oWdREcKIYLtKOK?<kpnuSBo}v~TMyLa_eOF^gxf-&LB?U%<q-
zlZHr|;uO@n1O&~oC2P#diK!U$=qQPQvzR}*rjU|D+^Bvk95#AKlJj+H8t%)oE2yd#
zX>~B#&e#78t3l=Fz@HX7+{>(m2S)r=qT77isB}Te!&R~R0B-!_ATEnNkj1ams*C9O
z)6xD~Urz0k27yy$V+^6#D%IfzVQB}m>(#bebTAvCH)$bxQu0`cZ!!zKF##L*Cl2EB
zJTAzk#aw;a<KZ!?j5B|1tgHOi#g!vWyiM9ZSnd0LOUlX071EMDV!Dyf8J|Lyfw@>~
z|H+lqb3l)<5!mRXq=v5uyPkf8P1~}4aXq~(;+`y?hA)+B_Vu=N=X#~j*=9+d)xHn7
zwD~+f+=7a4&HG|qhOztgMk>-TB@{yIDI~WWhbNRwlH_Ce3{YEkEooNNO?_qk@Qzz*
z+fuF4bpB=ekWuGgH8wg}K)d>&kubMq6rC<d8h=~TY+mPd0E;_%_OAp-<NV;3js4~W
zF4t7?P2ewW80+Y!v38HhgN_rxDDlrDU*vGv{&-G!uv^E>2fNuc;qh8Cku4ngf)qBy
zVYtRarnF_|?lXN*d~;hx2~0W|>xOGn(T;Ah>X@)BwGN>*xjQ<oaxY)`UI-^jSwqV-
z+wpC1{-GAa7dX8^l$3;2I(I2P3ehxe2FasdAo&L8{SSSxp^v~Nrt*Xv%ur{To^8JE
z#R)zhXS?(u)hY}3!Z$V&)|`G4k_;Q^#4_G}mvKC`yJgo>@D736=#c)Hy0X?Kueygt
zD77u^@!UN?A>ow7p}MD%1bnTQA+O)y_7ewu#WQS^4j~gOJ#ExhcW!-oyHevxf^NGC
znN~1^a{MhS-|l#5l*r^~?r*q2>irdmhv}?IuW77UQ%wEzWatA$YTHTB+t#?GvZ~@h
z&9J+;5wx315}NijjKsH<&|P@G@woC~YEMo755{tpEsJ3A@beYomOt|+$i|*8D^tO&
zD2mM8krbvINn|BdA|AoNlw8s!IFjCd{P|6dS-r9LukU)yP`cnwm)`p3wUAiy*bwz>
zBWK5MH{7df(fL%InwrofhMFN)A$^R#Ol9uczK8GDDCVlpYn3-B>B(YY2I*iL>3cov
zQQ6gI#$v~yn%ax79H1o1Ldz_{^}N?GMbIXe8T&ODw$wPQTBNR9!|8T<E}OzJbYg={
zW6;rX@fAf|JK}KpXyKO#M0XqZ`_?=`qgaZSS+%uXMoM3pWa%fvPnirIwb@~sDD&YI
zTQ%LyE>!4ORp5;3Fe0@vcnJ<2vz5w!0%9m&6K~M4Sz9xx4S|f;gG93A(xR@8s41sy
zUS6x{WsARJ{&VC!_djgQdE)umu>z^>X)DJ3YOoq^<CFKr$D2H@UsU6U*3V8L^1FNP
ziGEDGtYB;G9tNwsRaY1rpRiF{A~uOW$eZTrCc5TN?I7=?%E}Zn8a5*b<9kfy=PO$8
zM%eIW{Rmn$L87nU*Wu$Q2!f=czj`G__Q16E8z?%VUh*`j&srR|@zWvhiA`S*)Rqj9
zbUYs}rd<QfU6C2d!CG*Cp!cs=8+MOgMT~j%=`s*4swNtVko_DvTjUmWg8;J#W>dAQ
z?F0x<NL=3?x4a#$oG#H_CpfV~s7t(y#~r2Q$`+c_Yw?2E0QAnJm<Z;#xHAGq*lh$E
zdq(U&qy4?45O~MG8FcOu$nXw8E1o0zFv{+zL(jWQCJ1#^&Li0a{DWK~OTiqW(7Wy|
z6kJ^D)*zHuFAw}sfSEP|@P;fEpXBF_5ZxH5W(0i%O2w;4F2p)iL>%@pFx}7&;bW~_
z#^v|0&GZ?hZNhrrUN=W;{Ku@S@I0xh%$=UQb`&@8l#D#DMkNa>wnsiS+lyTL=O#}P
zUPhb*;l4$7VAHD@sJ*m1nKJ)CIsIIPEt^7N8_U8P9n6~20#9VsU!&_!<3RZ(6+zy8
zwLq&oGa&5gepRs`r(5d3y}R~P5ri<iT;ecXAnzh7bii3P(;iIXjF>91x2FEJ&v2r=
zV{{}m2aJ}z8_X1vPPrf#!GnGUCI}05=8wq*Z%~3!xT~4ccwL$~17rBj&SmE6FEHNY
zaYX@j()eTW$EJwWUMXJ)n<N2u{;4I%SG)3yL|52%!UULh`Q1cWb5R~n&PY_S=v5Pd
za(|@U)So*NJooy;)?0eg*OPeVeRcyJ$yzM;W~M>f-vNmG0`<vB`t<nSY*F}%cmVdN
zyGTPR-d<bfn(9<@XFsv9aBBXL8XiXvD3q@{egcW7jfQ^|3-fZ*bLNY}#F~q*bkx%r
z%f<_8VG{w<6-ig|KW2kjy!SpI8U74<xW<34U+-4RHtD0zdR659>!z9P_jY-u9g1%k
zk+X$%>%YJH5lyJb!VG+6Wo{aqFx=%OOZ9`__9sXTg#y@v4?Ob%^UY;>N3RwbID#=K
z?h`dg7Cwig3?DM&{+JEtY1h~>b#a}z?=8%ZGwp`4zX-*D!4+;clwp<ox?;bFHr_=r
zce;2U>afio57>3thaE({xBwFY_b<g?KP0gWUX?T`&C0KBu?{UCm74a6>jSmy<+Jt}
zjK0*?jT%GL14d|=OO>1MXx5)dAop4o79#A;gR39Ep!ia6VNNAEaF(QBdmAEAFIb^*
z{n>jTrf$O||BIz?=cTAnhmez_q2JYb^<kPT$cxPkwA+Sqw`=!^A1`A3=F3ce$m$`H
zo@zs2(8;vIjfET=jjz+{jLoTZGcC2KbNI(x88Jy18>f3UKW<{rlkhJ@S)?tF)IAca
zM#=rNVZQ{&n5r+E8bHiNjQ2Q+URtqGx!?zmf%8LPRi#<g8NXN4Z3H8~yA-<EcSSwt
zH~Zsugs<hIl~0c5{=|_EoI%WSwpg?(K8BGNt3hu5L~M(>9L<UG+byl6fB2*F^RF7C
z;XUd{1)zp;Egc<$!ZKtBZqO$IOY@1uxID}*(kLNncG#hbgUo7{9y2XfYT^7%<ZWOM
z%o{5>C?+}o`<AJ|!8|V~SPbQEETKq4HTjW&Z5U;{UjsVKwN`Ef=@5G7VUn9|eoV8t
zd(<Sv%pMOnup}PlgZV?;Z+W~Myb?=vn|=v{a~eJGILON0SpzG>;`MFYEMAS*{x_v`
zl1rpOYH63Q=Ef#xME*VP{tT<tJYSE4`c(;Tt3_VfCC$%H;6ihhNIQ<);~(RtQRW93
zaDtEQF=n)HeIDE=`5%FO;!lC+Lv^j0vslAr+4xc0A2C*~aNhuB3JDpKK*T!N$!Z!Q
zd=KHx40exojq#mqnrjRe_h<f!xOH;$OV4~Q8|zQ~{qWbki>->|LeYB+p-NVSemPXZ
zBa<}U8jA2XC7yez{Kr>(W<d}@V{u74qUL*|D3WfkpP^7ufcr$zL1St@C+mqmNqeGC
zh9BVyQplpuali_fLwC6FhJ&^Qi9qRZJ1d_C)V;|a?^hl_OuhkSfzq}%i{<<geyFdY
zN^r<))|a46WMoMyV7zWcW%X12H}TfYUJTkfLc%hT%roTk5JH1Reb+D?kPo}?Y#{E^
zH~DzR?DH;pCfLd|*jTRYUq22L2{O3(KCsdPZ;gKKmW{ijk^4;guKwzCB`a5S)G5$U
zFm``)Mxsfk7Z2nfJ^<rWY<60gzGKfH{C)$O-@@;}RFd;ZcLXI#v=-L7s0Bfm0qj=t
z&Pd;1pi^oE1LO*P9rk)^@Uf-lLAd+3q4&Lk7GznwYh7WVwg!^%8iIw-ae_)RGx+xL
zMcx^>5Lz=kOH!QLXW3!CR2p0Pe!Ii4fg@^-`L5S5Zv|K+x5$WfJ%CWAt~EwS_js`c
zm-kgeD?hI!5Hszb*{?_NajFAT%eJ`?N#)Y^yJN~O{W7wapZaWkV~?P9+%1Nf0pU?W
z0|X)cUCpxXXx@hx<dz{GB4)x(KWs9$26Id*zQ>K%hD55J=F_%?aR>%D5dt587K8d;
zP;?+ZrR?rl9{=1QWXBY-LT+<~8q_Tc@r?I?j{L<0(7I#mo$TR-5>B?GNiEexUE<mO
zVY0Dfxdr37SS0uqJR_yWUk9r%(U@H<JL4@T%9s+E^oM$@=B8)@nq2owtnY{DD&xpj
z!^t^SWA!?i#?8)xWP4Br$;sF?W%SwZ+JPd7?w?^G0<1s9KLpu+QgFAP10MkQv#D@^
zxp|&&fBM&kL;L-G-EqL$XF@gPCN>qj)wQ2{)N&>hg?bU9%nwYm^gNlR1|Z*mz_ae#
zHqRW;ned|O%Wh*P1=_D*;0r(iE872DwNK6qC^HftUQBY2Ezup$YAe26Dwo*F%k=s|
zvzV5l?F+FrA_9|pPLYj*4{-=_30Pd0{^F@inkilM^2}S`RoggD81<_Lp>8j`UF@CN
z{g`1!IbH_37@SDIv2a~Myfb>ng7Gj(<!7>Okp3|i;>JifUyV_G{jBugLODLeYkm)=
zww%pq23);W*>&l!P3QsMtrCyGzEx`ERZl)F(P2NANdkkw^%U2#(1-!05?WUBR1-#Q
zRyK+1c0X-g*x$g0lxy|td+eK^#mnB(!vex_2=%d^cym4O<u*^DNnf1}0xIEnv%zF@
zvy)_zGIOEfhMrFzR@23KeE0M13JGtUlz^YFIvaIO&3~7QZ;(D@j)vLo;c%H|w`<LI
zvVE=HzbfG#?j@J~4=&RIaQWa%(33X{AqDj7q|z5<AQc*+=xn__XR1-@g@R70r@VSo
z?J{iJ7&ndLM;jwhzOMY_BQfK5<G>7bc(S`LS?07Eqt~p?Kg*aDjN(YW&}y*7D}FGm
zA}&(Kkp1k6sTjK<2|QslRWQJU0@t<QE-GSzWI~Bcm4hPF8873O*LwH+8ZH*<a4<eZ
zo+1!O%#orvTf;wf8(e@t@K>IkOcy(|8nIvS&)2%nq~^3uMpjn4AILo%%!YG4@2+Z9
zeLRIcNEQ3yUUQ#rbFRP$P@<g1GIx8Q_K#aE#{5qlQy}wustJ&4GN#+=7~ZY3n1jWK
z@R&;m-*oJtNGcmpp?P`G9Lhm~y3FzP)j^wMvZbxYwQxYDYN>1hj^K6?DT~28x6Eh8
z34jWU1{S=ezI!z@et2QH)QFZ3<lm%jQ>%(dcE)>QM57Q<6zk<;hot^0(=GnI@myJH
zYC(UB+0}HRu?|rxoTajU@naE1<voC)*_kNF#MOfk0S6bc>PNx7+WKbaP=@L%1jzcy
z#`+Ys)zQ4<n1HWn9}K#_T7J7h15V$WD<(K*IgOQDdz@@;dW#@KL&3n~CY1u?89Wi8
z`=(;G=mSr9Q;*>*GD45LBkC73rBRzdq!;?dJpm4*<9{56_WzH=5V<{g{KsJsvXX)b
zuQ~ltX++(6K|P|GjVo?meHTgv3{VAh3FKE)Z`G+VWRk?<aWzcif4_wSD!j61FWdmm
zuD>z)0AvL|Wq=UvArhFIpzH2PYVA#V3TPT~AsWHj%5yl!o*$X%H!#79BH^ANC`E$i
z%{mwbb>uB5Q#z7Lr3a{NBn~EBa+R+j(+2sho{(`NRNT+D2LH{Yy~eP~ZUi!ujW5`W
zW7+GOSMM1N+x_K~D#NNl%;*Grba+kcWkE<FkC(Kd<;fzAA_0@EL*N(iF<U%96|xgi
z4@O8F9W6HO0yPhO!lXI49$$F5{OGg%2(P<nFh?JOKB)u-15kFhJ|pHWC|4(~t(EE1
zFIB-{nlYLop<DFytUNET0HD45+)IXfMq;SAH<0DsF(a8C5(tMDrp$IfLT10(GBB^;
zd3RWY?O*I@NS)!y#?}>?x`M@_H$4(LPl{QL_U$C}v1HNxeO-**>>aN<EzS)}_;Wq1
z@w39UmmPufvBwfq@Rja})KPcSbXsQbO_E-l`AVL>-I%g6w)j%07rp#dmX(P}$TiNd
zFkDdIf!HWEp*1>9^2Hg0=jJKNm&L+lBfQDFfUn**uLXm|zyH?K&uf05rX9_t*4LiL
z$)o@fF5KYH^eEt71PW!&Bwv@l6ec${Ii?c_yo9VDGImf;=|#ELKW@0<_(9lyvi^6Q
zd&1M9Ot7}ZXp(4^zxP-V|DEQ=f2aA_64_Te{5DO`lQ$w?>Ct!N0SPs=iNIYO*N74E
z>SNUxr^3(0DKR$a%oy$qojlO8`6R^Z%i8DewSB3>bpqpif?V?h9JcTnC6SV~kM#fV
zs@^<q_xV*L=Kt@oTH~Oa{dZbX{-m<o0#E6<ZAN{CG)=X-zYRfnR3r1oPK#l*A|+wc
zqTZmkcQE$@x?|#;@A`7x2EE&}hOH<-LlCyj!>W5`!_p3R*IM0b%`%fB5Om8X)0g{u
z=JYf&+_*lo`zencToqC{{rkhs>DDJT0H>mWRRSSNh9xiU*WRD6v`N%=o(`Ro?r3|@
ztl1-#;M0U+g9Vh18t*gWGxgR2{$dezuD@HKcRU$$74$rPb-38nPXzk(TT?bP6WqMF
z9!XonRO)7wLzWRG{aP*|Hg_1YdQ7m}5V6mCLuW-PZy3{yyLFLC@9vDeb3x=jdH&vk
zJYJ2X#rR-ht#1E5AT5i%z~OvE1pVk8Ram9PY-00brEKUuz7iG00Q9ZF>G*?uBI}>u
zcjGES{EEb+UJa<aE%qG&N*JgT%bg)a1*guqW7=nfpUL!OCkoWk$+(==`h;A5f4!Cb
ze_a5_T+rUtcidd?6?|MT)Fc9jEr{DYkmtK^CV9-Xsy_e(Rgu@PF(beILD1_SwRjo9
z>e=){@WdsVA=7N_wIk@<XzT%!WUOdy8}ualzt2dy(d&G<gs2F7eDaZ?Oe+nw7sK(@
zHt9oe-YAgEGbm+nz%FExD>e&sX0e&~bvm_fJ<c(6W^gexIE|UzhlCB{_n(121cj4J
z4vVbUN-x&Ae0OsunAYkg17CL#h_0qX!zi3c+0x{NTm;*4rI4h7cDVMH#uTY3mt~t3
zyTG^Mj#o6ESYfQt84AbF;5Mn`_vZmpEuz=y_0IOb0s%eD18FzBUuG*JR8Z}HaGNP`
zj=8-G!BVx{{Hf~w3k4NoqU`<Myr`EuGYSnyr>(kun{^<Wo1fQWM6-OweZ`!5zP{0F
z0(hLc(xZ1Q-nr<KX1d3Palwpjav~bI%@s#y%5!uJ16~jcyI<liy>>2@PmRUgpNRN)
zQuBFa^R0#j0^IXQ;_vJ5E@K#CWEEZ6Yoyi7Hp_9f3fqcnM?lmsN=*Im{75L8h`~{q
zn}9~RH`4BRk0KyDsMqhgZe2|o=tX6tqOL<=ul&+iU(P51ThnPGxA}!J#eRQcESohR
z+Z87Q@hCvwze!O;*7o&mnx*U`F4nrp&9W-kxB)JwiCV~3d!@z5C+S**Rd5!*^7NOn
z^3D=?*Ft4j;0ZR~+=SPonOB)Glxi<S9QF05b=q1)BKB~>aHm^jTiOAI9FiZ!_3fR_
z?fx(Z_5xsU&;t54(vil9!M{M<NS&yd>J0IHJ{}-Rv|OClUw~ve25!{!<-mHgqSzS|
zMd*QubO-v;H%YEvC{;+{w-zFPrvhB_W&)Wj-5H>1@_61lZi<oLfaaQqm-x;$`i$W|
z7nfP|!sotV6jS8)k}dY|tmmLMnM|Od#T9ePrw&A2V>7Sr6ZI0~;hB)ED9{7~49TCM
zm1;JYn5+@NfJ|*y9Qv{H{q>33odwR#7(+QmYhPIx&<sMdLsF0KH-g`YY`%IpX^{6`
zm?Bj8AuXgtpp?;1F*a{MM3^b=b|(y!^OODCkTSZv1Uk$>zw;R#tv}ypWA9CLvmaSS
zbhmv<&BV=W5G`>ur4#2?X4v!0jIhD&8B|~Cx(@(MH1&ynz4X(JwYaU)r?M`QjNf4G
zV=t{i8bU5u78$r-*NmJ#H9qlHFD|A_b*0DiJ~$^U!;YIOCTe%{==1_?v};TVj#_Fr
zWZU&QbQwW1C%`t$fDA12+2ZSow$W_C8jF5??GU}}k)O)h?Gw#84qP|Sl=h|yS5Z%7
z=hauoL8z%Vd<ia?Gl)aMw-*bi1Fe?;^>fk*BpNZ8-<#>w^P2p{?5d4_V}uNz@lbpd
zL90Z`@A;M)o$A(M8K<iX9GY@BUaqT+PNfrV)IWlEPZ2@m3y>LN>~B68?Nmj(RB1MQ
z6vSK-pI{Ik4D+tbHs4S!nnUIN>W2sn&4i?#7VgPFZDy&i6-}icl!OQU;?8ydA?QbM
zEr3VqeATMysL3($Fa_|EN}0KifGnx^=ytUyRb#vSZU5Ji*gm@7JydoU3#FG5On&jX
z+SUptt4gBa4f^~-)GU6pdPdOdS9mhky!Ac}*2OoNUZd+7KZ>;xy82FIuttGSLTEWX
zk`k(&xiLjjfX(m0T)!YX6wJtB?W7vZyW~~gK^EHGyO!m=o3pJE&Lu@120J+0ne)0E
zq)4C<45(4X+A6Bn>u*?MDYBdK2fkeFEkyu*+XH0xT@H1#-vnH03H7LRwVRDdmXIMF
z!_m<W=PP>a+MRz()m1cM8qe(fL6_7*70XHE%*wUoC@J3Df1iyawe16LFs|bS_01rB
z+UzLa=nOr}!9tRFCJFR}i^c9i)j|_{k|<m-`BLnvBdTh($LqbeB{3W_7K4GG^t2A!
zUu@GmZ022*&q!^^ueYwz4N!ayU#1#`qIviX{61$<&H_*7tMo9w;QdCP-a?o?cFT9J
z2^}wzCi5Gn8a<xh+D@cc;EQZa&!gDb4cVKvQvkTVBVEMATzS)To-o0s3|hwNrWbd}
zI~7H*UUX&+)|RjTU`}@8M^S2UI?T<m3ccyeq=DQ~921F_@#~x^nhTcF*eSPQZ4M;#
z_W~2a7(#gVjj80xpL4a&)Z;IBw<E37g`5oRvc1Wve1ylPBVL#<q!u@FP>Ms|r&L*d
z(E4Md_H%n!dL&<^Lq}lHV7txlZXA#t>k*o-S4`{ep2PyDP2k+_&c|z833DELb5&>e
zgL%e1U-fdI3cuiIM6W)ZRk%%RzcXxUh77PUQ}Z94@gy|~;tZw>_3z_*%_P6InL7_%
zJdo5ffnf*XQWrGZ<t+TgDaWr2NEh^+TH17v>Ghn0ul#pmwOuL6DAyL7)b^cYb5}di
z8(>i-Y7Nch(F6)JOrxpazv^FoIfFR-pTa10r~d4W_t}7Zf||Q?hK-MR1KN)}{xs1`
zVt`dC6P>DXwf>)^Vqk~_L-RWC@kDEX*rs(cU=S`x24jESl4ozq1*L*Y==4F+pkQQ>
z`*)2z<BRJi_bXyJ=?!vPrNw8{ckuY(G4A`E?PPPK@l5Z9O^Uo0lHO{dQ??LKK|~B6
zUK)&Z{js(1%eT;<Shb(TnaGaId!;iJqhDt!_HxqZJNRjwJYBCx35U2V_(<r(R?+@`
zXU{}NLD>ltL<XAHlXvcbsETWU5(+W9p73TBzr)r*p(jYuP~sfx)ZTyy-_7^c`*$#V
zP(1c*ums;6s*EcTs&m{Od!3NzrB<So97@VsxB(?gE2_1p7CkbQ=mi-#0R^v)7kg?s
zY;zyt-r$iKDz&YU2}!W635ub^M-hqlIPS-&GFk`uXE)D-tY=Vc0J&e=6(ev+{2R@v
z`3$z(k4UOsl$UrkAw`%^G2e0xg%BYT&w`d#e412ftEH&?1#YoL5Lr}~s|g|!(w3AL
z2Igr`5<&P(UK>cLv<$Z5p<VOTvnJZ$dX{K@JFh+BBSHI+!%>u<rRpr^1nWbrb@xc!
z$@2)n7UBjNm49pjuJYhouS4|1xw`by9`l_G>(Wp4=aC_=4UsKibCt5OjyQwx*Gm7G
z6?RY8SDhHy0rJg`qfA`es~n{sPitWTa*Fvwtp0aaZ+8KMNMFk2qy)!N`DCFN;|Djq
zOmr}8!M`A$CE1vgm9fU;#0V(#iP3=kEIWpa3D+GaDN8LSvZh+z&kX<63;>GG*pOL>
zvdO=XDJTF(e7NtU9`5Vus2vKKoncRQ;%VO<@*SrTH>Kx<)|Z5hMmJnlley<TpLPhq
zwOVJ1sudFrftav_{kflUF_)w_WpZkTdi_|SX8ZLwyib)eDz9hOw^~4$eDk<MAi$>F
zRaPJx)8KM6I`Z;CSCigh`Rqb?in0uXx<6I6{?DH=LyFmqw$TxRhlyWe;{-(jMu3Sl
z(+pvJyT?>MyWE7gI^HfnE|g$a=j{R1+BqmXD(8nTxY4ByP=pn3vnAloPa!y)M7dX|
z9G>UPG=o==G~Jl7ZK@DBSUtv4q~%UqjTW++_QgvMSA?S|Pqx_E@n@-kS6==xfaljc
z?jHhKcmWMzAvx;G<pN`OvSS~?>u%ik5ubUw4s8px>(D}*#ws!yEl2$)V=2763e%-e
z%*Z+!+)*73Sv%py+XS>Ttg>$O=6b#ieNfB(ZoG53(2c@5-N(n67N`op(#UZlquBFq
zA+KTM)H8kuA(yJyOGhY2BMHva^8JU6L7kgL$1qxUk;BER54uqx;VANxcSyt-q0Hdx
zljVC)-|gSf+XcQg=E0Xcue{~+PgR^qYLMFg;$CKw8zJd~x!>|S9al3>L-Yd!oYW#6
zq6wlmQYQ6Zevuu9T(PK?>S-q=lUXLU*#J7+Yx($Ja<r;^bDSvpO%PFKS&Rm^v--Dq
zJT`N_fVf{0Yqq$$>9i9ZL%i=DX;)xo@QWf#zyLnpQPF!vyq95C4nqft*qNZ;<56=(
zd)-`^=g5JF&$BzEC~)HV&V<IX!(84-lrj0fo5-e@rsUHCB49R)w@o-?OV0v1qZ$dU
z=P&*A9XbRtsgWVBaeVW1NpOQRp^&BWO3N{oJAB1FYJHD#c*`F*uR!&D&Doi@c4247
zx~<yT_1}}?HL6UXK4~&+*Oc_db&sDs?-}^PI0H90=v<BPy15}5OyM0gz}mX7XkID{
z%X4i@=FzFvLGz+zE{z2#1bJ?uo?}Oqx`!Z|;?GU@mU3!dS+cN$ggY9(VpiGFcDEio
zGKX9R3=1OKU*d#^AnxilFx-ay7nGNZ-rN0;%&vesJ_VljRQ~`Z;me-Sd{O^F4F%Hc
zAO?>|*w-MMA}o%c4SY>dqJQ2j|FTD1O~_v*pfNuWIAs(x+GtQL5%?>lXw<JnStHtw
z0n??8yq!ST0<kiQJ*=XseLi?$i?ysZPl>Ir&_BcwV}+lrln6-w<emP;DSJJK+Dmk3
zh^%#*D`Fxia_UcDkD!Z?SZj~^hU6rNS;hbxU81-oEd#n)(7XaX;OhUlX}iXgz=}9{
z#wa_29<^<qeFO6=F-W`5&l;&JR1di|KyO7tJ35Hx9Qm58f>1gY)Bb*7{%5gfxwubx
z8&3Ppzu^(&3vrRwZUOM8+Xx3|AdZ;AZ61kyE~mSb;M0Uh%%VAxPmo-1)Ash;*CBh`
zmpCt5S4OmNBkIk3St{ub9AKXnhg(IgrQbNim&Cb-z@My9DB5$r=R}I|`4cpbP&@?U
z=Ds9&340H0M0vs$5OnV|2w|H#^!P-xMAE@ry+Eijry^p8jHY~DI5QXtfsf#a*;KF+
z%HcGo2;xPMAEJ_qY@FzPub~KM1}G5j8Xs9|Z(&sVri`Y$0{7zFrhrE{`vcl|05-hR
zV3f#7DaNbPrfVsj{fVv*-l3eX&A3)t{C-z?$Cp5l+iW=DjjCpiI$k>lul_j?s7>?c
zY0j#YqVS>C>21VRH8u}63ms5`l9ww>O;fLI&6`2b&BmJYtsnccHXa>-xUiM1?D!Be
zW30o4W?k2}(T-W!|ED{eXHCD}gM5H~)yyl2Kkln;8Zi}WQHok4xM=RB{ht?0eDcc_
z$9p9Btz{fKz(=C$9fgv-wJl3~=a5qG=<GFvd0ESe;;WP{D7#qi$TwFL+L|i&QZI|a
z#7PO7?0PZ~lBuXXY&%3i|52Y{vHLxs?(UrE3x>%ze%iKeB&kL*@%IHlDA$NZGEUUZ
zBfs|%6(G6R;V799#nc@GZ?#^{xf0|5e+g0p1J!u{fSq)ZANnGrI&Vt!-sPA^ak2i2
zt8qjN$@fJ2w?^h;xAX805(u<xtEse2Psd0-{Omj1r^K<megjARmA`riro;vc>EI%l
z79?~5bkiARx0{OB!g;PCVj2ZEx;gN$AWj4f8FhdDkKgf|VF{q}BAt$IsNkl#24GG=
z7Ri5vfTENS$y`Xk(b14;xR@a!AjZYCCK7D1M{8T!CG1Rd0yluW&;F|>@^R^KYsl#;
zD=!o0EdsAmz1wT8TxBkr5XuRAMw}w(L_`g7(~Kp?ohNVqK^}6n@4X)A6fZdWR&GD+
zyI1zd#+-OXOIH!^jyW}E9EVC0(d*zs)f+gM=|KLLcg^vP*#4Ave@02^-sHj>tww=3
z3dT9-X{k<=6fO6PUTMv@S+a9C^&a2lV$q|lz=+fr_e1~|k4WLkS!!|{D=PR@Xati^
z6R}DxD<o_%tg?PA2tA&y$*exJo1bFU&UaKrYU47Gup>aYHF|Vu#53B{G3y^e3OgI9
zPyOq^1ht?m7x7VBoF&rsqNBczoAEXZ{vRNpu%0Pn^1d4=2pw30-JMgu4<UM0S-8cm
zgkgb>ZQGylmSD2<Sm(E}hk*NfqvNQ>`1~2l(iM_3NqeMek%lWem*4Qghi2ouDK>*<
zw~H6$XBonBxi`u8OYWQb9<I%z9BuU8#~He63z?#xcLcxu4=ic@?NWh4%=6Ez&)Gp=
zx^R5_2aZ_*;O#_-j*U4KC&WHkyq)HPoOBZ<O1<nW$?q>q^v)R~x$tEb|J2Ft;o{(Y
zH!t$;-DwonyMxiyzHwyKmJ4+epa7@2q<Z;;)_Y;E#v!o&;>E{|1v`q0lSp$(_BV>w
zChip)09moM-=W+}M|7}%Vu|GYoIy^Z=?<5}%>o^DU$6b4j^O%#SDUy?+^Ll42GG=3
zT1<R)9`UxLY$O3!(Lq#|HO+sPPzzGH`HHAl%ZI3^Z@$z>)~JN!@M!{(Yba9r3JJNv
z$9Nx5Br2H5K(-Ghi3qGfc-rR2rO-@=cicwCu9pjRsWC>?AyR-PNYi?U?MURR!q8u$
zAfxu@cBdPCB+5KadlT_V`sdj=bL}PxAi-xC0;Gq1NcJO0H<%YF7p6w!w?5H<REU=Z
z21B|H&P)WQpeAuLcup7@d&xP{FhF2W_z0F^or^8M#GtVot)4-1-H8KzP{A;jp~sJA
zhGk)_fqOAt(taELRf#ey0DUG*(c;Izwpu{eh(KtkT@csNJvY#Xe;s{;dArsKA`VyH
z$o7PBOL>nH^!niXgI6V}4p%{#<bufOcuJ#5@BK>zu8fQ)f~f6V|5Q*RvT)PE(sSZ3
z4#7P0gooJK3VU$<^Y=REl9_E7o+Ic7a6(kC=ou1E_)ssIkSqn@rCCR+j;ptj-Uwlf
z4rv6$hH>EY*RdqyB|-YU-;)i$%S+^?JFfH0c#Pds)j#`JE6(2qv=TizQJaMkn}&9%
z_7w)Xc_IZSnEZL<s%``2bh1`ruDy5iJDV4VKgP*!aDL&CfGq!3&fZfwC^9OgawSid
z>hH_jL~Z_KDMkR6;#>BZ=}D|9n{k%(G~4-j-}ABGJqSP#90WCI&boWwITu6r7}3fz
zLL|>f+4wS?dNVm}SqzOn=k<omH#O(M%6fiQJ_pzzK)n5d9Dp4n=lFj_cnm(z8UTt_
zr;#1;&g<V(^CQeJzMSu{yRg%2ojIL#+f5vd2NFKB1X^#|o-*={CR$p<dPMejj*{CA
zU_=0OanI*oWwlt{q(XA6Q&r@>Ml!=Z&><cEi^p<YE_MKVVi1*j^*1r6`vvBThL^tG
zeD_&(r1F4=Xvi)=u{Ymc9_6+9-M-+9w0;G!+JH4q%WD4OzegXT$N%%u&F{etU~ee}
zviR|+c)}4S*jy;V{~YSY^8!n$ATSM|BM6UDWDb;=;=>y~nrrFsH{%fRJ&7x_gKCjV
z7&Zwbi?#4}L#E@g1*646EyXbVHV3eboQ34MQ0)?URR_FY+!vaukO$zHFc})i7yq9u
zi*bt}+v7Q2h7oQ;M0ECboXlk5r0dd!O+ven#dpN;0%<XFWh#>cDZuaM*VPZRE-x|*
z_W{Gz{IiMpP{s=U(?~~d^AEf;ex{TX2E_EEt`FM=J>>dqS{4?<=1byxqF<w9q+WS1
zHS*XE;eHn`LIoXW@>zWlx=w{NqzKsJCNOI)FnV>KeFP}E*Lakiq3tvDj>RdHsuWvs
zIApA1HOEVwu-89OeCJP&rzQ$MmYYK`Rt|-Qw3u|KkSd>hEppq(nX%@7Z4;l!@}gFw
z!i6G$|HT5!KZ(LE$Jn-a(PHDC?oJwqAVR9PmffY&^Kv}Q#OKCAobAZXP&0M8J-si3
z1{%~nU(}{Q(PUr&!Vgy{3R=yk8Q27Z{vI1>R1Y80501{A-VVB<D2sKuov*yn&M8sL
zb=<8`%@&u;VWb-7wo!?iwR%`-d$>tGDh+M1;)nh9*6MmdqNR-Z`o0D*lV};-3*^y1
zPghzqgOIYO^el_l$aA8dDooGg6B91PiuEN^q){>A0r>SOGriTe$%{%4G!f+zfdVJ?
z?~()}Br4fM3@3SLm~5ZVsc)~1d;WZIJmJ6h>Nopb?Gd7XP>*5W!p!l!Q9H=VV*8Tq
zng^+^t(j)<^hdu$89S6C4dqqvHs~r-l(tO~9Ow$MX+E0tS>pc5c?O}=ykd^A3#vwY
zlqU@yTK@Vtr}odl_xO2W>kr`bXsrfm1HlxE)|(Z+hl}1_Qv&eF??$&K*Rw6vEGUv(
z3|#>7FKk94kUUbOkvNX!eXk@{Ht6Lu3@8pr0mO+G&eZw=WP>CEaXZgP#-M%o&3_1J
zGUa!@qwcMsn?U2ZFnx?k4rS;aJC(kF-#A9psu(XuMg>MPNB&(vy8}pRktnFTF$}GW
zy}m~y7<xWv1~?qwfYOfmZQYZ~Ft;5XXhSqZ#Y>!TNGt(O;OBg(1Z!g@8A0_jIP7~8
zk-bt>rv|jW#Bf&eT{1@>e&cxa{=|s2o~Y8f*s~y1M`@A06}V1sr`!Sn;0td@(EPu_
z1W_3^O=Op|Xz`;r3Q(V7xcY)3qeFP`cl;#A=p@7+?t?$H7Ja8@Jq*?z4V<BLj`uRS
zH$2F~hd1tgPh&^CjC8{^!~vydbBn)>&%wpmkjW(cL38>wIP#+sj57mRPcs2E#yshy
zp`Ke?Pwi7kLkf(6-@dq^Pv0l=QzL@yzq@$*)8nd3pBb4q2snmVL<yl~_&Y$~5YIne
zvBK2b@7tdme=?%Z94n2I)23V8!^J=IHtjtNCAt4W<cVrs4Cap$C#!^lx@H8oHlKwc
zpx_K2|7?L8i)DT7-TFXrvOhGyK{Afk5^d7zuNCoX9SMYN>ol(=RaXCAdHv^^J08=g
z=CrnQ!$m;=aK*+XV!kn*N4%RVaF{V~ly9ei^s_#SZ4wly+w=qpGg*(7i7c8CPzp+#
z>FixVx+FN+MiVIv_N*GW2U9Zz16(*K8at0espo1q$F_n+FB!GgbiYiEk-%naT-YzG
z?R!~<N-JCbXYErS@qjp5PbaeJ)vu_zcq6re$j=WJd!n80E~&qa<!8i1Ds=vRWKHG$
zX*FHyO0rD=7C>^3OBS(;45L!Y(n{|;XrnM)?}_}$s+|V%c-sUxpI2mmI*{enqyeRr
zpE_=<oT?VqAhYz#l(^P}rxP_vYcFeMVt!0idrGTlG-(^3j8fwu{Mt68J2UqeSl%$h
zSKO+s>Rowx`fJAj<2cG#S6cpKIWCvY9>4CvSN8dBm7lyIv;E6Gs=r}aYM#eS5FVE!
z1qoHZ+YgKk$L;9tq{E_*wGn|)_X~&_D|A$p0c>dCfP?F)APe4(feB3OpcCHP(@0N^
z8Acn#CG)YGs%NUp)9q^IW}@Na;_Gv?C7?Htpx}MT$3lD%xT)UdHEie4kITdKdGb=d
z3to0QXSQxURAG}uT{RTcqDL;wuKCN}ty@9zzP}P>$+Ww*2d=e1E&|<PXEl?cKzjPC
z-p+QKG(n=x@3|-iJx9H#B6YSLmSk=wUQYeA8tAk7{<951wcpAaQXGu^w7%ih!d_FS
z3&{*G`WuiETuUqEIrsXU*5w27G4b~o0;Wpt67dh0O()njbIBJy)^zC5gye6$#?dE9
zofX`;UA%au-?XmhBm1^I8NT)NNe4?ceM)-JZ}@`d&aU`#YiXpkCags|>d_fK{ZB3w
z>`Akw7kWHrUBNLio8pj-B`eTi-(H{-Ug<dd8GUp?v^=;nx<uPv^CS3d8+QuYW>Y_{
zi@DpUcXhnrG=%5o?$vp_%*|sop_y}NqwSsbT3(mhpFBW`j`z#dFXWr_upOu4?)Ld6
zX?-^)%Z~{Q&1ce|8^1QYy}_dq*3rz@7`7D-a_yJ73*EVFayt}cx8B>VlEcp^{gTTX
zoXla!l0K0pi3*%<8*)srz!di|5$X4S$Wl@Jul7Ts8QaEGKN4PmhH2Rp-1d5-NF^=$
z;J6T~wh3W{mbt2og;RXmb#X4-AkZ}(zPlB;RP8yyntPt9CbG4ALH)dSeLsCnE;1vp
z#g1N-kl^19H)aOce%d~YKTXhxpS9&^&e30{smEGe`|pBZpo`m=j&07{&m%vP;B<Cg
zS&sIhqdsX!WiKlIL&&~HKGNRziryj{eHs~^NJu<bgkOO&6B0~fkn)BP$EY6)NFM%b
z^??McM*WH@O9p{t!jz@8u?}5C#Uf%fcmvJ2w#WUt#kzEgl3~JLPS(^BL{NkRGK8s-
z9M{TW9TIGyVB#uugIM$Azbm>vn-VJ-K@lAqsg5q8KRxF{tigMXKt4$7Qg<Ua#WhPm
zfVc!geMvS#a7B_9H8+f>^#>TKoDQF2r(x%f4IQy(D}gv;t6HxV#2*~eu{Fka0EVjj
z%lIkHMT@+oy#!_B!M3|@#I(gnsQL7Prt{M^mO~?402h}du{R5bC~U~;hyw`u<tUmZ
zV#hLF+M4e28G;S=p5_)ru~XDbqz#S`l*u75`jpG*tP&~Q8H1rmcna1ZVmM%e+XBa$
zuRVzb0;a_n8zHN35^vrKx^zBXDh45p=ATZaV+0Of3nYGi*sn}r>-gv2NJK-l6@KBJ
z2HsRB(nUCAL(=tF-ahtjD38d#+~!^p=(yj!@^@b>g(zl<{0s|KT>#X%e2~nHqEj#8
z8C(5u2JiSbsVy6cLWpvjHqUBlv7?iCwmhIt?+m8dy%=0+#xDEKA5HOw$^CrKW}#H&
zogk<!=^(W~!|O!hnV{3&E2sT2tytTadjm;AnKg+KR`I|jMWSGk6VDh?$Utp;{ZhMf
zxO^oUfQE;=+!D7~Z`(~--gn8D{da21EKN$}feTyO7#k}>D?~HM*nTGm^isa2DBzGh
z)vy?VO&=zosO+7M(nJ2DSmYkVeHuSWlKO4Wlp8lbnDEoH#)wG-s&t1(5<K;~ch0L$
z7pskfvM@7gQhcgm+eNxLDe~z6C<a25<N3qsv|Cw9aZ-3N4ZM8<v;Pb7j7|PZ!pE$x
ze_G|&)knX7A3z7_iKv9ana8ukkdsanNQYph%SkIS$>L%C|2w|WSG0gl&wxd6NIw6r
z7=;*>@V8$oi0JTK%N=d0gWC-g<y)pH7{^QA3EQd^n!5yQ16-cDDOG7Wq`;F83go8F
zEb3jBn8awkuFF+Ktfm|@p62q#who7<ZLR~GwVM8}@Jf65@SodsUmY(?1EX{NVH{(E
zWncK&UuB5eC905O!g}-1U&X%kl=?D0RY%A}x5i?32<f8loz>CDpufSvw4M6FYdRP^
zNyr=7#FSxH8Y+m^&sRT?-zniq9c&x1H=Q?>p0;hgc#AhtpMH02345kjX%Lx$^LUrp
zVmVo82UzC$M%f#ch1@T#Ra<OrfIM7ru-bHg9_wcyl_N^-N+g@XLNT~m{#|k2>HXhV
z3vDzm`%^BSdEdGG&7g?Cr5fYk^;vSM>;&M3f3^m4eEfn6nVZ}%IlNLm|2R`u9TJkN
zLJ`wNE!ky?LtS<C8A*pF8hO8vZ#yK)QsN8&&zbSFP}Vn#%Q;p9yO-tboE`t5vKi~3
z9zw(Ofn=Frio*KvnkF`K`>UAQaT|IZZ47XPFRn9?q{+n(=c_&rf0Mm)^V%79_7*<g
zd$^C={)C7$ctZ^j?P6R_7X&<5lKG#jQbH$bp`}{CL=X3z1~S6$E)He+ZI?JSkzIf7
z^WmZrrt#Y$0Y&g7qh`l?i#v%y@2EL;!(vxlX&SJS`tBo5^hQj#q(6(&%B-iYE@-Lr
zM6RCi6_pnL_;c{vXkh!u!M+~S*c6upDcd`CQ@4?RQ|k559sgFtR!yxth2h;jZ)RWw
zl?{vSf4tP1;L{FpdgHA7rk87C$bbjzeOn{VAbh3H!F+V7sbMsnGJ#dY=WilY>FG%-
z_~4JTt?*-pi$0AnCI6Z(^xKB=>FVNVZ(0Ydcy5oyB9tccJ)52B!0^ocr6R{0=Y{H4
z?=Iy3Z#X7F#R9O<12F+c?G@U~F~rK!hfAV+%|7I>n-|mid18L(D!1pmBnHF=vKz*+
z7zR>=a3o+gMqSVT<b(>Uhx7qkhUh*YqqPA3>Lt!SC=1yl9K|CaCHnQ>5p;2o1-pLp
zZ{hQ!<(5oHEp_%=jS@yeuDv8I8xU0*hoQLJ?$7Ux5`nm=cFh*@(?}O18E_d%e3Q@&
zGMEq>%)TpBatG6{&(&3kvzO#6!}UuP%NdDVAK@8fO9+7ncqhntL^{6Xjg0*K3X*^t
zd?Fg-<_G(pkFth!02fs(ftHa~LZ3HaDjp*huS8Pj7>e6LqM_oS`O^#N5}4IwaBgUu
zR)tBnFB;B^3}4CSO1!35k;=EM_K*nSw_{H60*({=bdg+@3^wAVr}ki_TYnFPkw>eS
zfC2lA(kaq6DatXLZXRgMir<3@hBMqc{-x5KIMu7eACX!NOwyQTH#N&%MXkr}WN)V&
zh=ufwY(+^mtpTc;3#T=1tupz~BrHMdXrWHpliXl)u;G<3)7qoc`OLEdGyg~A^>A#e
z6EZ@bVyO?eJM;{MHh()qggG1Z$Vdum0k5<&a&-5HB)PuWCX=10yMdjU4$JK!YN?EO
zzGqj!C}*RAX;EFUxV`OYa7*<V33dQm!AGuW+wiy1_;5u9sJ5#w^OKikp?*ttNn)rp
z2ACX=*KRfiqMqPrxf~~LXpJ$Q_XHw?(lbZC;0zb7ecGWz2?0nA{+BddKrm+XpTZ{*
zRi>!Rr2ps<{K65@D)vG!UlihY086Aqqmqpkz;bsu>=x2k_>nDfyD#~La!U($g%lZ7
zMd~LzNE~W~Wb=Nj{+x^u7kt#to>=erQ~Uc@;48xLy%G8x;&%Cy%1-c2(9fd@*|-^r
z)HCDM4F<XRBr-o-hdSvW1JA(%`pwA1Q}1*Nix9|mhV$u7KieD<lglp50zyf2D{2r^
z0qZ?pN3lWgIeG>ihP!{=gpoE>mS>1=D5Y*4SuPw<YcY2LYT3E<RO9OemWz`7-|Y!+
zzmNOYIp~TQ?ctKU*tL8LuYN!@ZC;Qk-|2zjD_GC-M&;QVcvU}_dr+_@iB8MRKl_jM
zn;{KO0U-DX1>|taV(G_8e5V#CxG%^zTWi|Z6Lx3YV>j3r$1rlTE={qM<d?!@`HNVz
zjb{5z`S!bL{Er;&m?fI!T*tBMpHEh!TygAkR%APIKVF+1e)(ME9Kp=`saiPUt#(`f
zTK`!(JEA*S#TeJF1A~AnOCpGXykanhe|g};yBimtoqN}5n{X5)g5*s)h{=vj=yRb+
z6@S-epi^;tZ&IIPzJM~|S8xj$w;(WG^~-b#gX~<Ll@O~A$FPk2E6wU>t}1xI7XjLW
zdrxgVSh#tPi?S?sjTg=DtrE48k1D*pT&v=l^3E#bbu><kH^_@ba8Rf@!Mmm6m0A*$
zvDD`}4=hN}Szngbfx&ubNSrDVu8|;6YxN$=2+JZURIOULUBo8TY1Ywt0cl4<4$Ny3
zmkfKWB2;aYO*YGko$t}b?3m($*~#{~?Ue8U@Vg)P_kU+mJw7Mjmzb5`sz_L7_WU0l
z?@rsRd|>F-Y9;Gc&>#=X7IJZB6F}Ge<NjTdEn{hLSj_XzRX4E|243MCc!vK%Z~@k>
z<vM?UasNMG+fRjpiT0|wCT;Wnx=$Rhf-{v}GkR)Rqi^07aNQ6Huj5m5j*Z}CjbRI4
zrEnUXbs3?5l84x3&o*ye5jrd`d18EA^AAzwbH>0lW?<0F0u%Rg>(&^8;RY<I?Y`g<
z)}_&6m*JAJMpFwt7GB@uLm-XE4_j{{jN10ccmbbUroC5$)H|(q?H!%POTCWV=#7bk
zEc5YJpyM6LYn12#_P$*CX+3{5mMq|bQr>FKi1O96Cn!!>L%{H!ys3_{CkT&raCmAv
zp31v*bTFmn$M4dnlIvn;Ys7`(uDs!cCuJkBli=qHX@9K8_-Z%37)0wOevA;N1U%s@
zatVdXeX&EXP}t|79w()ZeLd=4$oPU3<B{4H-$A8~&yz2j(b`?*jtPqI6At~zQO-Xx
zQmni+li+AHNA!qE>$>ebqY52RNgRLbivwn9jR7&rVuD^nV?oe%A&xah3@DK)7~u;h
zXqAC;iRIISH8x)2ue^mOVIuKK>cTBmB54Z+l#ltBNO3@h*8L896HIz1)!*sp=!nZc
zwk8$EFnEJ8PDe0cXM?@Z9d})g2p=T0k!Spmkk{U8=Lc1gyj9PC1l@<CKn>usXy+_$
zvZ>L2C~h72BUs;JFo;sY_;%eg9nPR6xu+P6I&f!p-VEW*H>l`_A1drO(LILg7=Q1G
zs|p5&<NH)1x=4>SfD&IE;lp&+ulhpb7gJqS9Ua64FAf8&A&qb7l^AwW#7CcJXH4B(
z)FLGKJMF>vP3OWBG2dd|dP<8p#y1C36aI(-cp=bbcbzy5bd<3NCPuMFZnri`VY8z1
zx2~%Wh4wU8cNA-z<~~+RXDk{=oI2bT?u&%4j@o400v+xOk$!S--)1a(n)_#0C`)Mu
zDkthOy9IQst(j~V%Gzeysh>w{>GjKjHrpixx?NB%<9*ed1p|lxYqcw6!@M(%f_n$(
zVLYdF2VL*?d8(g}G9bMkW<DoVAd>?TL8m&T>+CqI&97*x4qr6#<%lNj$Ub~|0ccPt
z%(u>*PEWg|#YLOdhHWA>W$7)|T=VaU>m3iLQon6Fd-Nt;0;Y5&huH=|sKB_^x`;mA
zW|!%bOWd%Ts=x}9C)WjX22XDklZT+U*KCJCS%`1b1IsUC=_rJ!X!TqL*^+PU8_&^z
z<B>Lr#!Wl+@4~Wxe@{+V-;lA}Q~?QfU60pt4mY%a*el(3p;q>6Hm7}6B51<l-KSpz
zjaAlOg{lP=Zcm`&U_%L=)?1&2D{*_)|GpaGk3%U9(PG1jc9S)>i-rW#hK`4GYQED8
zjW=iiAG+Q;D$2KO`yYDfL8Nm40YOSiVrZm62|>CPkdhucm2QxbZjhGl4y8l7TRMm4
zz4+eu{XWnAi?#d*fmy6|UFSacKK8Lcd%Q3<fBQPz(hvcx`9;lM1=d@ckGm|5_5;mK
zH?Q6o>UGTV>}oyx!oE|4w4@(a^xRa_YALCuqR<ywJOe)}r%Ql>m+$t^t!4`C<0EyO
z!u|0P(I1t_wUN>N1Z+nBBvueIcgI?vMWF+GfTRC-+*Ma{q%}@n)qnT(Zq*unz!2l?
z>FX-wUO4d9>f&-8L%j|@^pCu^zjgKirrp(>wB(Akaw`S5ekXX#VQ)2}==`h9u<~kI
zhIwx<`!>BATbVpMpZYnzl!Az@p(>obsyO|(A4{ig_7OV5h}2Wei)&-^Ps!mZ_W5}A
zS)u(#q`Fyofy>{x;E5bN?qBy`P3*q;1hg;XLW<p)QQNXiZumrSc|J|NI{!`-CggIs
zywzah8}2G(Z=1IFW{LuiLQCKyO()rq`bHGc-Zk7g80CKHYl~(}VLoXfGWgg_Y}xw$
z16+=ed)tt~cJcBJhX@DW!9r~-5^00`1N-^G=->wz>?5>sz9<qLtaB&Oob60i#Fon%
z+20zg$p}8HdGj24!YiZSujTJiwIT(6PE`tR(SeYcE;?V!_X%P74N0fuhtPQBc&P}}
zFtHytO{e{xD6-MTUKa3JXZAdk!<EwO!-C*^rN_7^aJA}EXx7vp<ghgzo~5N?piK2y
zo)+F}@kT^`D#hY^f3kr^etgA~tESk{8t67qh&ShLob%Y(l(G;O1s2q9*oSMo3i5I|
z28WU8R#~9eDy8wHMWnxC{96}5b9CB>D%uO^NIIRvF_SUsnPppn_g+3&*Qe9c5T?Hq
z7HvY=o4l1<18H(M7l)4_TOW3zn=-dj4;MWIf%1uvarS>1{#~M(pPKRP8NBFjE)jLV
zt4?0xcOPA-_2w8%f_3JGi>2)}-~x!%H8LT`X=amokJb;|Y-?Yji`!Rq!{Zt4ow(nC
zxuTQRHG$XK7^L*4K;e6tWdDa5@stZ?R<l$~`8%HwvH7->BS%GFBnvIDsLF*WC;w>m
zr%BW03(_-k6!-7kZJOr7{^6bi%<$b358;Si1tQ>5WAPTUXMZ|=9v+r&dwTwqnRZ%N
zv}h{({@|b=1)it)zTm@ez8)=HURu&dk1SZ`X&xFpCXy5T(9zc+%yy6V^nj|5dx^U@
zoN6#M<93OcXBxq>Z5j()9?Ac6d01wT9+W*^9$xQ#R^mfcycF+F5u$rkmkldaq+<QR
z=*x+Mj=~0-s!tZOTa(LS8nV=?iJ(sbvN@WVB7DThhdP=mL+yDlb{a?sjR!k}4V1K6
zNNgw<O}{K(g;763a17uPD}eFoU+zZ$9fb7hdF+W+*h}tAr3rrwEgyewv!P;82go~w
z9eG-c-0lq5Zkv%KH;UEsi!}rz)7D(mls5e3kq<<ISZsV-5`e3O3vRQXfaIlxWc_Je
zv%XKGoV3%|#9c%M*1?aZb=T#oa@v{fp>rOxWNlUDBoY(tt`8C7<e;)F{4pjgE?|a&
zYmz3u@Qz?13XSYO>Im8ey{2Wa5lhR-we6F9FeF*`B{7k^rriJ`I&^r3o?D@bm4kdo
zIZ{ZbsWS{FfGPia?}wIOl8s|{zoOCcO`!(YVGfZzvW`;Bb`vPRhs*8$IP9|)DUA<Y
z+Z;pK!OVXgO2wXOwBMWP(Do5;Pt*%-3?jbes`J*kh9!$T7~X$8Cr=h|C{kz^^RZJM
zHNbBNX$<Mq^&PrnmR7gIv2%igz}FGAf%6UL?g~B$kL3hP)FP`+1UbKR=_bjI?4?h-
z%<!q_Z^c&K>!jIZXS;V#2OO}k?q^v99px_U?a76VvX<7`<@2|ZQM32Yc3zGw8+D@m
zAzAJsPUovRv%;ze?0^MZ9BA&kJx|3ruWkQy8+->r=Bn&q{;-i7eZ@L<6eQHC^%9^U
zyc*dqlR9&mpTsdtwZ6Wj^GNH!Ys$55@Av{Ex*0&AgL`DI><IIZki}d$zw)=kZ5;RK
z`+sbO7=}}9zs-?-`)RHvn?GLnm-9(S6VPNObA6xzwZGxhYdGUE@8dkTv0*NgE^lKR
zigo$KrqgV|U#yuxE$n!E5LMYXk3dF3ZSA39xW=Vq7$k!(2Cwt?0le2je;P67>`JPN
ze|k<n)<~WI4!bxT5~P@q`MocmV>qD@`-(upW+`dkTrg}KmyAo^S8h<pcQ*t1r&&wh
zp!S=Z;+gm_1Lwj?N(nBPN6=&u&q`zKk&MEXToU~|k=>C$vEcYa+$JM*h%1pP3#zQk
zQAW#a8^A-D9rGMn#Z*gCD>0QRNJc0XZBA1qov(XvE*<an2^#oMEoGq9&p>etj>H;*
zBp`2hrRrLBU9p|=?o8t};F?I`wuPS8!ppcxZ^ImSp1#KYJH=JE#D352ZqQUT))|PC
zB~Qd!aLKkPUGXN`*u#tJv|Sa6I$&!kO<B&sk^R2==6GNRFRJOt6&Y2<7^2?)q?>4N
zj3eRn_Kd#h{Tg9>8lMR<E|rLCcQzs9R$~5Dm3!|y6iAcD21`rrD`%l#IRxTOgun;K
z8<ntXAAYgVF<l(0vyMA(<t*@rjU{ivq;y=j_dkhC^e&P9qzJmkP+Sr@JOLR1YcV(g
zJQJQ?07V^csMVhn%A2pYQw>K+%{yzZGqI@>iM}<UL}YWU$`j&9D)==%rSXx^FxHv&
zzc44SLWrIpR_O^f!sWib40x{E)X|9MIQ3KgcFVvk(?}AdZsR7_sD^{mw5^dD6ec0y
zu$gy#PC<71Be9q4Re71VI-4*U1<-qj4O!>5?Vpvlx<H2wB1f->a6ea#)vIAV8+!rR
zYG};+$E3$nrbe1T;4PbFpO#w~qO>T`{zVXn>bf<FKs(@lZSNx;#@-sv2QYUHRbQkS
zFKG3O;d05m4#{(LjQk&mMwT9geYFP92gLRXo1)yu0xHnIv!4RS0)J1~#b2SQ7~$i%
zaOGt2^{bip^5Nvw;k#(UX;y^>7>kS2gr~|j%{Q;g>{#*J8kjy+)!Qyn0|q+AEOer+
z3ffTOXWUN#`Wi4TZ}9&+EpLduow3{-Njl;Fz%Pkj<442&5vS~EphUzCtBx27Wb<E<
zZ-aP1KWT4|B&Zn^k^G+0GKeJmMdAA}o*>bRX}5g~@qM5TN6FAa>cQez2PKAFKrt|W
zjWDi)EIT?`glF^{ox=gbog%OwOvBK~M<6p@c}&D7<7fgqGT{gm)`IP$S>}H+N)7fD
zBg5+>;AH+qkl;3gi`pC=*aF4(6nlu`o5S1}%i9j*!HepXq;xF^y?|ul#?ePKnB&_8
zEEA<Nphot+_O@$_0KR*YL*-)@9ViGII9P1{-tuu7qivdYLLp69z!pVS6{)1%jIqix
zp2LHgkQx>t+$VE0g8Lzh=`S4{#)<egKVD9z5Z;jwExxngUAzB1ZMdBe&k(f7AKr`(
zr)(nCdDVtJ*LKh#5*6AI<y#kq*(KgbB9XQoCY;0Ng;dq@dBsnjUX<9M1_|q)MrC#y
zaBoi#7XY>mBL#bJ%r)noRgQVaJY=+<Oc)?<FSDr^a8@6Zel>4HO~t_9vxQ$0BHjDx
zO5%$7i5&UOul(e6dU$f@@nx~8H_N7ch|ToMlJ!XYEvJ*O2fV!d-KXO<q2>pz>d>Y~
zQVB-_``da170ur$l2jkVDw3d<Wzk{Q?PGC#!umAkmuq9OFI2ADDHA?&ZfqEM=kk^4
zz&|CI6WQb+vA?e8faqsj^d+A={hiHD*vP`je#>Tm{)?Af#0nxUmBMWgSgNr%t076d
zF9ERIshvTF1-IGBjfz$F@Mhnzhjq2>)NIN=_d>Z5A&X8+lZr@_2`-IbK!;!;1wzKw
z#}M3wQIY0(eX`oBD6-+dg22EpB(d#=-%A9j+#7~bSeQ<1SH!V6eUj7u3ik>pgT+M9
ztg$ucD|5r|TLJCli1oRu>JpMaGO~q1vs<bt{OkDOk`1ZnYle|sN+%#{`+Jk3<c{Sj
z1r|J8Ntw7^H;JT?VPl<1`j0Z7@q+f>(!8?LW1cJr$UWD2?kRH@YwuW8>k9r>&afuo
zE%T!I{g^C}{(|+2!~xhKGxlR<V2<?R=#Karu-+9#%&Zx?>o2n?vla)qq1e_{pLQZ{
z=WNsCNo$)LT@LH43aJ47T`BQ7iW`#oyUGc7cG@@PcO9+1U-5PhRXYtJuSc_N$9ris
z`TyF?G$nm2(=yIEm*uq1{v9qa95>Y-!a<@|GetEQAlWM!7&+2A`RTQ^UbfAK{NWEO
zdWLN0g|AhiRIxraR`YF#4gDHTnoCGkpGS>}_#coAT{+w*x({VW#Q&5P$%z8QMar3<
z;|U7HMQ$LfHN>dG-X7{<4jL9owoWaT!x_Mn89Lvj;7M<X)j4PO2FR&d4Ee>&_a-`e
z<8LIYrB*+5X<-8dlCV+tRv~AZZWr2PQ_FYM%kA&E^N#t4F*fPqd+5Hm2;*b6l|g(O
zm{jhiTJ>5BiBTBVZjdMmGI2qN4POK6LE3|h?9xLhHr#$&NaCRPjDN(u`gE$ysrRQV
zsNRzN9sQYpoYL->8cxybbV`@PZteDI>Yh8ntrj3dg>DW1XyU<%;B&8~5%J*EYj7OR
zjSv_GI-^b;W2XQor8vcY+x5O@ty1$Gz=`c+kL)G=%-<Of^gh8;c>WyCJ8)v>M?9<f
zS{|<3w-5}VCz{?4G{5G4!p1B0#9z7Sb?EK?z<O~X_v1(;{<+=|Gm_6KK-8G{VJn(o
z7kqlkFLZJu<$dIG1@*rn>%MNJe#vz)bUgpz7LIvI7T>XPQ{cghi%v^w9q(29LId7P
zmxYd`<;}i|b9av6?Y?1KyfbFT*|Q^f@%aI0T%ng~pk96f=!6uF&^~sOcTJm35mcR+
z%Ee+JW)rUYHE+r#v*u>C<PELdbA)vq#$PC@lb<WBMW+a-*`VS{7fVMop4fG3eQQ~s
zoXIr)mHlEi3IylK<;S0WDK?_jo7Y`e4o?HO64Z{bf`22_xW6Dn!ub4v@%dfrd~596
zIW`F4QvRbq@z$2c)A`|_d5CFbcr-ff6qWXhzZHCcb;M2+LDK~iXgThon5eZi(BDXs
zKq5l}<IuADgvw&WRed7+B=vlr<tmEhoMZ*_h$R>Jlf0q)n8Ea`JrZIMN=BoR6-zOf
zF{MRq-G*i;g5vGO%7Dyrw#J&`!KXQ=Z9wo9q5WH$eekPSnx(qHvQ5TL%NLhW1Niy%
z7`qipIrA7Z2^Exr&sYCQHWXqFMa@hfGds#+A1m<Z!OIbk3J27F+yFi(wnf*Mw*1!h
zT|sOh>g!Q9P`lj(WmCG*OBn!uPYJ-4p1V6W^OGl?=8PoGNg<x4n~=DypsH$(HGtYa
zqCK=KAV{)iI}f1;htScW-qB(Uu8HYY@b{n$A;I5#<ykE!l9<L{qd0fcVO(Zg8Zq+;
zkXG>-fRfltc~1~|w&Q>IH;~B9xWH(76#znCEI0BW6W_3VzgLG@7rtfJj`f`i5O0#u
zK%a}=H?n^i{QH+o+!liP4s0km&3UkDa9KK@ANf7lR(I1Xnt|@r?Cpbz3ek;*?N1cy
zsMx;Dcvae8Q=&b#!P-iG{vSy{=R2>(9=eDG&@p4XGFfayUz+HTy-IdEUo?Cw5{!x^
zCIReva!VSPq+;n?Hmk2q+Q_2mjikxnQDYqMRv;PZw%IXE(E*=Ny|ckGCu<**mNKra
zQ=2-7gX!=kxEIBBp03Zo|2a|5qTj?&ZN7oZ_8JXxi)nj!b<BhpDQs@p+291&O&Kiy
zn1DSkCyFHxTM+C^OC?C(fW}W|**o_9vR3Vtw-HYt^_&H<4#RMT)AIvtNZ9_$H7==n
z!C!0$C7C<JYUB%E*SB4BwyoKV7-2nC;GWU3?$DhdW#268Bg{<?+zZHxEuk-`J^%vh
zcJf(w4v*moryG~W6NZKDf0JV#bGAo@*r(Bkl3WbOiQWU6qXwt%qF)tLMdm<p*T|>}
zb02<dX0QOB1vG=;XTP6$bkPj(+0ILyZVet|wYU^^1s6n6L}O&U{>^7y$Q&uk+F-Yq
zhk`Sp!|vy@62pPZr{ZJC9p$yO=(%?{bd}i$$&jA^m)E^w4H44wQA)_^pr;Xgop%iQ
z#N2q+Z)6rfWUX4ZJi8Esh+lE}aE_y!5{w4>E3CmZUVqrHy~_2V0VnG1Q&N2$L6;rz
zdV8T-|3C5V4s}kUn~vwRM6fxaU;jv12H0FQ#8LSCT$r4jfwONv{!>`^kwI{5-Ehfy
zoOk_azNZ4o^UfH~MZq$v``O{t_tK@hO-8ks1B-R<j@&yo2bT(s^)yY-_Q%Ih`0M&k
z&=yC|YmlD=Q5qNlRfIw1nf+~^1;D|=_9>P@usb3asr;2N=v_~Kp+|mOa6jh*Ngi2E
zwQ9PctQ&*J>Dnv98DGkezR|;QaIK9&o^9OeR%jh@|M0uf^>29bi4q0B{jsTDp02bY
z0#z0<KI-428*m^nT~s2{?5>Kdua16whq#GjEptHNuLG4sHqIiPumZ3dDyPE~HkQh)
zOr@D<>zqsePCP5lMgkv<m5^9p8<mYc1A4oXyqh@LbJ3)hNK}wL1vwu#lA&}Nz$10h
z{p+-*zd-2*FV4sJ+bkF|^dA<${m8o9+RkOL3HlEvvGR69f~$i@+`Wumw}^6^1@t(k
z$kSSZqCoCflQ^G-9{uWtnoIDnT0Gg6po|n=6G0(e!R_GgzQ>e((c(|NELv;q$}w@<
zdY>x5rkzlhuY`AePf_~bk{!=lvITwY0uLJk!_SFxq%R$F><*W@7eA96rNoE^TvY>O
zrR2p&Dc9VG_nH-B7_ZYr2~zSSW=o|3R&Vx26JY|spz|s-l?dDi&^>ae{m{T)%K<6A
zypws$h0xaR7MNYYPMithpWB@&+{tGP%L1lzj@f_QgjdyqHy@mae@>5DJ$M1Vl_{ZI
z{(5Ha*3Q@H5FCN_2I>_8*S3tz0Ir>25PSNo1Bbt3)%nK3cw(I7ZimhG>Mgf7X%jCU
z>z(%nb4?YI`u@TeJ%%ayoq1A49ORF0ZkV1TSiI+IuB@<cDPH`~bwO(6O!LomQG^Bp
zqt`$}v5~%cd?iF2>gLOMi>U8|*0u7Lsl48@4pSpmSq)KrVnIU4444`8cs|TXI4GP?
zd}NTMvqZcuS3r?I)JU7slpuNNg!jE`Z?9n=F?F0|M3fI>Cdaxw`8ir$uy7RyGR+B8
z5|nd<8Y%*M3JgPk6!g62S=b~xSCz5FJ_q4>Mb{n!t1oMrdENK@(vS!IJRq}>&pZ-4
zWj@*MD9vy1`H)G8oRCC_gy?821ll4|1cUV6%3KGE_|sy$%62k>qtP>|@uE_&<45j;
zsNP~&OUh7=5&wD?4)HK2+yV=4-<0i*8UxdzzkZaQQ7z9HcZVGRovxB+Pkst~xV<!g
z4nd&Dk5k$PTGZgQ7!FUdBz6VII0tk+uCGS)VHRZmM~-YwBLo;jsUY`El1r{0yB1m$
z;etrvX%s;p5b-xJDE?hLbYpq+Jie|f6mo67(4gU4A`O_egca;onKthQK+91kfQ0r&
z2Sl51wdcvO!CJV3cF}}YK0(%EmL}p9<JEYsQ}7+Z{LsmwQRv3TR0l^4>ER6NWY#dd
z-=kSea~Y^4#(93J4Ia3AC&E86nstS3K4Wi*FGx+{jfM7TxLJgAGvzAA%exwQ-y%#d
z=0E!?AG?Brp6F{K=O#MZ_?KY&*za(E%-OSDH*7Pcb89m^0{{`@z)Ax84?o1LDVRmi
zJn4JC$0cj-N*XB6-<|v(cD&dl^OC`|Qe_>f$?l*Du_Gh$^m|VNYNM>%RL##yh;32y
zKEfm48cxm5ZUX<sbH~RfLc7rh$EQVMb4<-F4T$#}C=azVrDgus<oG!?o1NpX7-4l&
zF6pcvm&j->cri_>*}qur8L0VLmev|6EbY14NBM4qx<^V!;~b#UY>%}2ds%C27nT50
z(3$9O%lFT@54DgRh7Svw;48f<dzsryvY?(Ex!8BGwfl8TTxz?a6ye;SCuuHRUyds9
zhT{j4Dn~kH@OKs$+@H3$h0+J&yP_?1J-xGr{o4yq$o8KqV(;l+uU!xtH!W!^>}xsV
z#;m&jnGcE^V(;&m6P56%3t*`A<Hrm3J-Q&mk3M7Nnf}{b2JFvk0BP*aoHJE8OG_Jn
zOB;nzYQx*2xaaXrfx@i|Y)xu8i-*Wa_+-Cs$mITEPyMbJ!wwZ~ovUjvDDjULM)DI1
zM7+_ze}j1%0+=K+ekY`crs5iD1O3`jsn^fRLv{_vF1gezrR*fjzBjoW2FHBZZl{T`
zrFt#?l<r>u#+2oSsh?Y_hkkW65i~GE*;1WWuKno`%>}rMdahQ$T05QNhwjs!8T)m<
zzjUj(koiU#m!kKb^~_|q(_9w!$Xnk|fZAcP{K8Vcf5?=R|BEX?uZhcPeIUXA^!8C+
zHy$Wdp7l0vLUTh<ZEt?ijO+Qi+EY#Ox85;2wQA3V_Q(@`=SBgvqH%v@@+-X+1hrwD
z&yGCKTHG+Gl%yJ8CF8EM7GCNMA$AS4uZ*SRUTF4C`1VsR&GUwex_@v(cI|2`*AkyZ
zY`H6V4Q_XC$A6Jvp!|CB$JBai+{?yz=o*gy9x<D)*i@-O^$UJ8V-eHKpyBXCZvp}{
z3m*5TaF%wIQ<-%2HQS%AY)Au|WMXxGE>u3@u(!0sj(23YgR_%WHv8l%#u{D`lmdls
zv-8l0r@6A@NKEKEWpb8$+R-y8x8Mu>KlGX&ZVF06O2kr=xLbQ@XE$w3o~+rOep6}+
zx=~ns#?M-9KC0dSYRJU&Wh4>z&c)H0vT><D&!%fRc7Tu2pm1GJ%llJa>owbqmKMv2
z0*yeD>!<2;84qSuvzIUoLSVl`02-162Hsx&`=5D*0O}5RqD}%C`^R<S;+Ncre2CcM
zqgd4)jfN@-kl1AA)n<>}om6|c6L;2kVtK4jq<HZK-Ok_|VK)YFrY-lniDN_)lX6_5
z8-k2>Qr5ed|7E%qCnE)~#otX_(ygb9e)*?28r1h*2<VcE_*~8Xat(dqRT>$<Rx3Er
zP-(Eh08IGj#6iJ_<Bzkc_fz<yjsB0twNwu>2+bdaj=p_7G-yE9w2hklH85~|x2c=>
zml#L_8H8#0j1dmf?LunH4gm42KErbY4M~ZNfuoiCSf`O%qy+GMgv6Oq(tW~^0;JP?
z_?)PZb{L!hvt@l(uAT+<b*56EG?`Dj*_Fw`_4#i67MG8IbQz(kI1NZN_JmItgpqHw
zj3<^wJB`dI-Uy1$5}8Gk69L4h*>55W0_&YM<|x8hqNZZD(44n;sqOwKf|)JTVzbgo
zK5_&Ya%t1(t{suDfH|aVOniw^k`J<y7(P}634*Q147)MU6t=fVv*k&SBx(Ur!E=@I
zZHf~qlCCdNfqW1;0}M0;_c4-DHCvtaAdi5kKs(0$49{s&>*ZTRN<R#HBvfDFBWyUS
z@T)fwf?y=dZ<e5@D5S<t^jE{nz4b_CK0XAi5LmHeyq6@#ihu70FR*{QM5i`Q-42fF
z#dmRfCOW53o;Zs4;7<&CWi@pB<@NC0IZkjSHwrp_E)LF9BEj+pS^y`d6Z3Db>pxh(
z|JxY^99+PEjG6){D#BQh$>`|$8^jy{Ai4XY*-EhS5#m2G>ts1!^Ar%&U&9vW=r*g|
z9Pw-C1(?Ne111t`Z@<--&NbDQYDTh;RUxzC0?rB06=(w4&~Gw})(5Xc&}HLG3tmPh
z5nS?6h<v6dyd6~`g;p-x2(a6=Nq&5*wTx*P=#vH<Sp0P={;su^yg>>gPMJ#&U(Nv?
z37u5Y=-fac!DQ!VIW{!FFp&w*c=<t|f~9@eCfMcoO?4uSZTQ%`+5Y)p3UA<R&jY-m
zCz&&s6#XZ;p<%}!Ynw_e>Q!}5#~<;u^CB;6JX+(Ec^uq$coNg3-aY61h7#lwxRrZK
z%)HtG#IP_u_ZrW`qsnl3(9^BHt8bws>xRgF{2n({)i%3$q!M%8q0LHbA~eAT$WGGb
zwd)90PsQUWjB2i2JNMLkT=|0L4;5@jUC4<p%IQ%0X9{UyE-*J=7rq8b5)P>m0N@5g
zrXF0b8NSjMbUDE3UX>OibDbJHBYSy-ywdn$i!Rmd{r$+PT{@GGx`F&frM7O9<rbdX
z(UEU&(eWBn22L@5)3IN9?4p448^daf3>l~{i1Td3C_C(Ct;y8^o}Zq&ScIyMens~3
zqpDC$&&FX4fZEAEB_QxZ`G)do&!7Wm+2rp;SyA`Y@r)5x+k#f#LvOmbln#DHwm2ZO
zUkZJq<9*GpD?Ge*B@Dw^l}I(;RpjA$TD;5UTDkuB9@r&w>A|*?8!OsgKRjr@?R&_0
zG)L>O`C{+sGcLXBE4tJVX3UWfcCUC(^@RRXX0~Wb>q+YPS^Fje|Nf0(N`yIE?LWSI
z@DSoRX?|ou;INhbrRi~6e=_l-u(^B{nsa&uPy|RgBtgBO@Q6_&4rPM*L*fydkE&QS
zazlWXk37<t6eYAR3G@z&!;}^u<1ePUYFiT64lG9rH5L1|O;;I(;iqp-Xpt0$jz5;K
zoVvRI;oVq&>}|{dt!CdC=F7Jv7)?vWEb2kcs(Ekju0$^uQQL-#1Rq-a_qYKJBLo}@
z;Vj0IErP^V2GO$n)YN3X(<xy+(9^x%EpsZIeAhUAZ#~&i<sBM={i`Ja;tXaehGM?&
zm-r_4@<!2X%fT$ob}{LNX;RdoY1;T=J+M}2sD4Z2P>9~Obr{hUB|))9b8`tvNQAuJ
zIhK5dZ^_dGzWGFBCE#!09hoP*^C6U4$Sw6dTo+?g$g((_2@j?^Am?78Y~@x;WRhHp
z;l?Xl6$Twxbe^-`i4Z#I>oPa?AGdqEVg&$Oue7sSvAn=`L^|u*8*<7)7xegl`mo;)
zxsIKp=$x?h(6Ud9Z*H`7;ujZ?50b(hZXw2>Vf9;N4%U#;=l9duoiucu$ItdUlS}i<
zKQ@zw{$yr%lX6{f7>4bP%4Gl58iu`MxF;|WvT`hLl>dzWOBDSXa+&)++D@eC(f!!W
z!^yBnW3L7wN8R@7nT&VUoz9Jl$d&1}Zd2O0F>06(0Vne7HZUm?z2U#U;9x_(Ud~Ga
zn{c2ZV_eTmubM4kwWk~g(dXq_md@O>?6mp}Py}RWHIYIu=N$~bFP`Pq#_7^hc<vvz
zr2Hw-(HT2tIkyx!E~I_!Bx+)^;(fm*V{tGq@Qec8*6TEWC&giiZKvP@fiSpH6;@eP
zHWU<GJUY4;y?aw8?;=ExD(Q8#+j?bR20Lszjc{BTzIVZ>Y)>3DS*xB;kns&#>iRzX
z?%Rdg(ITQ*wE4D+>^;WL>BH@$!G-qH!a54gt*jvXA~Pq)qR4SJjhAQ;fAf!V`)~N(
z>&dD?We<0n?gY)wGGO#^(VNrZjja$=Ey92T*j<c+w~?B>hbYF~mHW|onWuoB{c(40
z7~IBv^qDPAR)0v0jV6k$hs$6~wYrjR`&wka=v7<b_+Q#%qK&<uL-G&T91qjGi`Spj
zJ8uz(9{HvhG!ILyxtha!rN%)qQ+?iBjZ17LmPctn%9PXZCobHVH+5_jXf8)&s#0zi
z2>iI}o(0{i<x{6wA2vVuo?#q%xKQuPct7!T&GS6;MD%*z1nb)l)NglSk7>5vPQA6s
zyK&{ypcXwY6jf+#USTBkbArxO_%6_nBtV)tCfQvG@1N;42p6>vC7;hWnaOC%T%R$O
z&g>+(>yPC$B|Sd#41DB!ok<LcN_d+--AMYw*SX&%E*7OJir~d(Qu@FT7;@5QVDL#o
z>0Zy_K<l>Vv~Y28cd!jEB>>BqI-{S2^V6MZ>KHow0I83rcy=)%c~L%4{z_&4GiKjC
z<`X8tO}dmyCR_=|$qyCu>^Z8dhOB<i-1@$E^`r~9$1w42AN8t8DO{*gUeKnYQp~LU
zhRb>UJ_B$HgBrF|y(oqk%vkQR6kQ`G5dw^<<YlL1A|CJ|IoB9^C5P43Y|12(;atk?
zc%fqgkMd{u1af5Ao!=OR_L->MtdbB5ky_h3@5dLzoL-kpsl<xd5{s5Uf5(z%yfy57
ze~S9CtJ|d`0P}6(N{6mS0_hWDUkt7sl3+@T9a57Y%>vkVx!D|84yD<s!a?2oU1p-F
z#vFDKBelJmKuwahz_h?$zkK0gSDqO!d1}DN<(+Aa^F$;Rj_Uzzh`<v~MXNtO{&!3F
z7qv-o1C)h@p}%@~JrXOaI-8bhUK>Wy9wiNXvFp=R-D!jXPj>RHlhHVJ>ODP8GvnRR
z4+FKzJ8Sio`^bk&#MnH_f6nCpI-qb1$Or~MBPxPpk>fS^W36bgrj(?VHgWtcZOKJE
z2|cRGLq((~9o92S4g3B1KS|$ucmF^~BB;3ef_h~x-12&Ndt0vtZR7TMmz|cqPdCcG
z6`^M5s~%N;P*78FP)L61^od-+BVa(`ZV24|f|@K~E0PF2ybb3)=YD$$ZG{#an+qEM
zjTX;K`K7w|^MxlHxKFzNrGB=^sm2^@%}^4zP!Y31I-jk@i{yPycH?2X9A<s-hXL-l
zj&z@sh$pFsJvQDy({;W`KGY-dbN%{2l792!iCz4q^}hAntCHXq_KmrR+d<k|k@Tq>
zl<#^rRSDR4=Qj_ztyjBeo4+}BtKHp&%{Fj@qA~){T=jK%g!hTceho()*6sK3G;Oi@
zXa}yhz>i}lo+6g(Don<zn6Xsj00wFPl-}ia7K>7nu)xCSJB|}>Q#M1yslhGXfv@z=
z(Q~!24O<V%r$g|hZ>L+NWp@jqF0{0*K!hu?byK?@32b16cwcjSrybNEwx}wi-zk9^
z8HX!LWYCrezmt#W^s52HUz1aZ!^?JiH)h!*@1wxOeiKdb5a(qe!899kAQrUla1L}y
zH>Bcy{cw1(r_b{kbekr?m$s7%;dKb1rv%$&-ks-6e82hwmhYt|D}caEdISyv7yFw^
zd{(UCDV5VZZo~0Syh$4NU<@bY&Xdv(xRm8pkJg30lK3Q*|EYmaaFg~pTh=jP4~(Q5
zAa6A)J|B=FXM&q*B@;#(E!R(%vg%KDL)S&P^TeQJEz*!_^_j!jB?&@`!zh(ETF$8@
zKh2G0!Esz^CzvU%5B2TE^AKYRO4$A7+W6VdxPs|lI%p!LMNm%%fzXaXf>feW{%K`i
zNNtx<`0M)+CY<g5gdSHOP3kU*Vco5dVN^<Hu`rk*rpZi(2~A&dlwW!%#uvIKywJcO
zW!`tY<6Xgor}~2UBFjClQcWLT2x~FnUua0?bHOSg8xmzdD__5GoR{h93G|p&G3!k~
z<<=aU2J&n68$TGsma&tO6~FatoJmY}5xOM!qf+8-aukXLUI&R#4xD;({qt6;3*!MS
z)z(~EqsW@Hc@AUtQah|IGo-C?@qE$o_}QGOWBt8mtNha4fs6iGomo1J+jDPi?g#D4
z(Ts}cOIV}%O6c|M|GpLfa{{kPkUT$|NPK=+)n>>&D3&-%+pA#;Fbry<xg5vGcn+Tp
z{i@q!`t~}(`}!ke`N6>D<(i7@;oX|3Ts+6g>*9P8k<=fDPfRoe4FACOt|t$@R5)U|
zu2V6kHiy0b5;ofl?N@2$xLg$0U1!tWX*L|TxH}VP<z)Xo5-Ri3<j8Wgs2B!S9@XBj
zP+0Ukgu0jPg+LUYmPH>zhY^(vv2sgTT{oeFX?yidz)1Ct0mINie~a|@SY;S}t6+0O
zk)Y>|!Nc>rp&2ux1Q!8)is4`mx4RGGkfloh!7k<?yM<w|n4U1|=1y&c?mRf_0tH7a
zU5SU6#!{}j@D!8i-HhV`hj+98;K5T2KgfWWn@EXWTCW4**)W@urtZ0WlGtD}W_yMq
z7jmP_@*7%IO^tWC_+H!Dxevt4wjJr77qP({8e0FP92<T<5AWiC$A6|qq4K@I=GXOJ
z%>b^R0~K|u-(XT-q)0IXiO&e%n%qq`3RN>1%QRJS#2U>5JQ#xG8vU!NDBzdqK>@gl
zQ9lz6s->YyW*dxQJOJfc#lVb#^RR4>sVBud$tFgzkx7OGNcGn-haib3zPg0?3zwVe
zd38bhRd>&#c%cEtIt&JtJt;7YfytjhTaGv=J^Z-b#zNgC5zxy@DVqQqdz0;wt^mGk
z8hkal-i<T<+e|uTu(a+z(<(F92p1F0iCCN^*KmtSrN+Tb#TJI(g{f`uh2fBvmtiMq
zR<V7i%y5!<M+kMM8C5$m#fATwp!>z1BY@pncMsqNmijn+1YCTt`}4PD*m<M`Hso$0
zcmp$$aGta2)%@G-q@P3NW+a;_;apzDCcmqxsPHZ8m8VyK+$5$1`@*Jl?BYof0rmu=
zBoyRyFUp~|n<0UvaJ^|1ij5lc(JaR~>)MSan6Z(8ny8>gSLdft0@5(>K%$-f^*l+-
z^e)hr@v^)=#`lT>44oqi!=`5iqdWVDaG7M@-RkB))UNPF>Q?Qa3E52ldHerYwphLd
z-uC}4E(5k9?d?p3qc^g5Yu+FzdRvf`VdrO#=aUN>f|{k;@hvACtp}DTS*IM{8;67e
z2J7kB9ed*{qV)>trv@%YZVQL^Hbp-+tlu@GNsJ8gFGktapXV)N3nht%U60ceDUphL
z1!@%Gd2_UY=j$v?t~*E`Z1oL(I_uqj_nJa|U-Y!~yr?#Rr&nosc<dVeOO(*oP~+J7
z)Wb{JOg7Ji@qE$K1dB1F!1yzVgXC1Nlhy~l<U^a!9cP5&I;C)((#_uvO<706pZ6O`
z##--oYsVT${tzdez%>JwTe>Q!C|xoy=UT5sbFtcA&KOudHS@l{zrN#mVus+OA@JLf
znOv|ez51+<O3kWKmbQvNb$?5;b82w;L;t#k5Zv={zwfPF_G&*)ooYDl2Fq@f11{XW
zyKty5SR%COJ}vtBFolOsBvNb<aWAS=yTm0Fi8$-+6}?_L>pi^5wrXJvac;VvpW2^y
zBJuXyggM%JeT^JfDZP9D$<|UuQ}6s+fm-vO*QWkKP{+&G%Z>A$)AWZQ6a6|&?yE_V
zCWpEbUSw(1>wCS2cj}`CmwVjOv6YnR@YS%hMiSjb(L<rlX%jVTC+p|KI=0OMcdI0#
ztb?$BssYLusJFF$4WWmg_#aTOcb7ij1xMSzgw~0^b$S8hB<RA(-GTgqIQW@D+WymX
z^LN+WvQdW~TSDW%^)D(F-vs0oV6_X^&DPnOl<NNaG5HQ4G^!KC2Z~p<WMO2S(FsW;
zQc>W~<aM$B+=iNb!i~ubO6q!o8S8YW&e;>Fuc2Q-utPZZ%+2krOR@m#_xnB+s$(q~
zCYZAz2F$JvMJGB7>h)5e2!DzOzU-@rr{Ch?%Gkadxm~=6;!5^pkE@q5HaLI1U%-)i
zLsn&In_!b1Tk=e(lT^p*dNy-wHW)51d^K*O5~<Jis_a4>pD&0rMj7VT9fb>XXV-6f
zb;nW!m!M`6fm4!|X*V8qU~^k&UtNTwt>|V=3(~+Yc&<opj72VsjE1Y1lZ{m(*|t7J
zP)&Wc#I8@hA$JFN(#u2)Onv2!rl={FjA6p7xN6Se(AVkFRolQo-wq(O1Rozsm$}DI
zPZ@Z7_9$zqPx9mxB^$kc2EUQiDyip34irRgIyt6zxKy!NH6nC*_4o7`k%%R$mwN1y
zSM*Y(i!7Z{asIedN*{J@mVU2ZiuzL$!ur3C=D!QM*ULWi8TdBn6wta-FGb<uV6$SK
zZ063IgDr6k%Dn_be+wDvct(|^l-E58`~0O#QSZ8cuC`3tA{cOk`ebN46>q<Ls|uUU
zMWw+#+P&`Pnrrg-dcQ+#SwoqskN?y<?bJV0PzA)CMx}h?z7faO-)1?_)$;QqY9e?J
zM+4Wa%`KgG$6cbg4%PA~(;@^eJ`}!8JBR%|N~)qulQCU2HCXfKT++0<rk}LGze{(!
zT-n*vY-XY2a+3G@+In)eH4Y%a$EjQvtEXgu{Pe2KT~F|!E+IER-IZ~{ZP)s$eo`Mp
z@C}}jS3s-_%M-t{o9?o)e9;?{;{i9>s1y~IpF=`SqMd1?566zX*0sHdW;!a)1Ooxf
zC{DSQ2#Azn2JkyA*O6m|`DrzsMD-88H{<x;M+;PE@BS%<@z8<#$cgg}A`N&R8<)1P
zHcTasGQAL29zZnQ<3^UYKdPZ+;j`AKz;|lEtORy_xHYVXu)dTdcuCJ7SCl7mwH~`O
zBy>2yAlDaOl_mBmfL4xIzXzNn(-%vJmrb8X?#v^b013bkWx)x9;{N{TSswT*IOrDJ
z_lZyuhU6kc#2;Fl5IAQ46IeZgzW|;4pAf(BpwuoO9(lYJUtukOo{$WT@4z}SQ5ZmQ
zu#gkhWq+bwVMenmW}GJC>Bfi=NkI}XE}@kT?J^5fA<)@ue6nYr65JHp(m`#oiY4mC
zySE`pX_Tkcfez!6()#eC_}HwJQKxVGJHM?ma5K0k^V{k(GMS(V+&CS-IRoge!_&sS
zUR{hB2mGj1S(Icy%?w~%1ZQFOLmj~R?3Z)3qpHiJ;Irz3A@HUpJ2t%N%#8e~E{fF%
zNTD(pzE(;iUEK*cK3oWli?H|~eXVDL_;#cwk}5+yI|Y#22{n~?W1Nx##cEs+p9#;!
zlrV2nU-1CY<hz#Z>au*fSf<1CLfgjuKWDapqEYzM(!Kkv8P6Ew|D!~j=0H7bA2g&#
zotlV{C5q=Qgkim`a&d0WwQlvP`bj|Q1IGEY^ibIdtZ`m!aV5fRZ@oRY9b*zbpJ`!q
zU7Uk`gkfod7oY3CBlpz@<ETp<Z9V+89or_LS1_BIt>T4!Ub@>c6Mc}A+wy%Zq?Zlp
zms>S3Zm{4Fk_5i?xBMwUsJwjBwC2GG{Bd|-Wa~j4RrlR*loWpJ?n^g|juUTXK1duk
z05kSZQ+f$$!M0VB&H-)U89PUhxzvy{^;X#RcJ@zLOB6GK)da1ms)mak<YVEBfy7@G
zKQzmfyO`LeWP`q)MR77=>{uGB+xsxQ@Z)qhQP2&j<Js(7i`O>k3F{AdBbyP$Dm~rx
zwMnX}i-gAU*IRd!-y#D9ZY2aNQaXD<G9o<StSDdLJ_y!@!B;xIBnd0MK-EdUKoer&
zQu)ruwxvAO#n1xI`31$;KJ~AoOJosM9AU-d3hf{l7_l4>ya3l{PMyC&)7=<s7=oU#
zz}z-6^y__p16aZ=@{W?LSwb53A+P>t38u)e1aE1zV?$4%ky(cRWq-&lOY7DLJo{#j
zr<&Vf0k~5so<Y(F5ZB<q6612Ft#vOtkqe%nmg%hVtK)VOIxfo;3aZDdB7?+hCZqQ&
ze7nB2FSN$6-H!*@T-3x=Bbg<S8L*rg{j(d4^A5G(5BKS0nR0^Oect6#x<%s`qu<|3
zcA^7m6h-e>@K+~Ogj!-8YKQ(+g8h%~^_b)MddY~<%;WG$eAdwLY&tK577YPgveFK=
z%I@$=QOJE?${3d4-zO}5*nu8h4E_dkgdn&L>NO2gnzagSwNG_9o>eoa##v*Yz3{iq
z$eX1o)<d=8k8(|9XWc9Z2@6OmQNRo1kBszCLjE*iCeS08fVtPZ^EnftpTX+)_Bk>n
zdd|-T(|@Yjs`<JtcLf`MECWP&zUDQm!@jOwnp@gFb<3%bmGq|aeXV9`t{(+=a$;Y;
zC!u3sH<V3;&_bmp%me1ZWQ1Ats0QFzb=5Dlm`E{cpUNR@B)y_^G~Tzzx?e8qx6(p2
z>$`WC=<!;*vapV-Xosk&%MOh>c7lC5^Pv#lneR<~ase6_PoHbu(-}z6<z@y}J%=4j
z9jIHa((WmB2I^YSc}e(fSSk2{l$><?CZaN`BU<fgMT3SRrjf5!gLu3=5I+urm8gSO
zx!;LM7YBEzP!IG+Q<7$z4J8ld>64O}u%MID4G=_YBoRiw_FCsy<#gT-mZ5KP8#<jf
ziOg+0Y!O<*o>o<I1LRWx-uqraB;eCta43xQ35t=y*{p(A)>NXdd6YNwFv~3U1|P~-
z2hoZ5ZU+-Arl^@Mdl`u?<WFO%8DnEO4)n*r+M`b$8m8{}UJ<|@O&>o0h1K+m!ln*N
z`0ay^&SPS1`IHTK_&MqZn(2&6Asi8ud|csF{2~tr)zwwG=M?&~zt@~n7?Ez+x&B)z
z1%4@x1Q1I<mJ|4~etnmleErr!M^olg#8w$GJtrvvX>ser2bU5hFngoIYQTSA&|(5~
zZz3MPswp#~Cah7dr2yY$)<La7ORA{0P>b@@;T9lJeHNhIS06<LElKmdnAxcsS5_F$
zR~cT{_yb*(*b6Yn%v57|1CCLDkjB4y;>TbKc>&c6DaJH<Le;f=zB{#5)Ub!?>Ue*9
zWdXP$EY^C$pN%oNtHxgz6c`GBnkdkRKMB>H2}Ey?Y5s~!@$EDRAZVE~T1m`z5sxuB
zgH09B=-i0c#OI|V@xytCe9Q;ZW(`o^YQ%3?LHq>>QMY?~diH+fcjqvr1M6#YEW~}%
z1f4$h=(!T8+0Ce3jsC3N>>_|BUam)!50UCfU1d$BIHf9hb(y>nIzi&*Eu|5Z5~=K!
zskdXJ{kr7+aJQ2gNc{_e?VNH2+ysLR4nsq{tJFS0KVTK~5f>7}X(?)3Mni&ES)GCP
z_HS^8dSRjZs0JQ|;DMyNkGk2wnzQwrXm`IQj02Mc0jtr9zzZXlRXdtpL0=5P%`>n7
z?EvpP72Te7kSj2k;7!;nImh~4RVlCNqZawgs_!|eC|801Pa*s<AUvw#=%9Z;<9Z&a
zbCWgKp%M5+1DBKYxmWfSsLoM&6uife?0<#uZf)Nk1_8<(Q*y+I{}$Hq-lP6HUi$o~
z?MPnKoVEi``_*SKs(59!fWFaGT!Ub(=F%4&kNc~wd_v_{P(t5G(fdn9?Jw$>Tu<mY
zQD4iJ4M1fiHUrMER-VMrcgdYW+@N2_X#GO8`pHe@_eMfTu*fa})kfA~YiN*Rg-xd>
z4qOF!)sN}NS-;GRTnbJ!>`uI#eq)_TZO>%-F(?hfNpLGY0VpXreaX}PU-iAF`y=)F
zy14|ChZ+GEu`bcoPJX(wy7Xq#6MN}6Zie?o^y3AKIQ`YKf<!BE`d)jIvE}?`ba^M^
zPSLnmm8DI*J<5K{c5MN>%yg`LVPE1eSgtwI9S#zN4(jM(M{Ouq_u?vR9!zO)<CbAk
zht|*dL|<;J^M}~IH{^$%Hp%U%$wijK*mk!=5Np8wF}4TTpXnooV^~is^`G9hd1*&g
zp9{66c=kn4&v%|=Z;_9%a_C{C`d(^h=SOoN+cX{bR9Vebs$vnvPu6GQ(9pjB@8kAA
zT@KEuNBz`48ltPW5XJIiSIx{_L0EKFIEwwd126KOUz_3m-609+hE?{kcOkdnl)8c6
zo6&zYq4i$rdOcr6N1GMTt+BUQW|Y%df{!)7^{{0tM03dGztfO%7jWE~w+br|*bxWX
zv$Kyc(i@2kx}eBG9euE>u@0kH%SCmW(qj-WjSvI|X5mUVIl^C?WV<!VrSxROq8On(
zA(z@%<S2VknUFfHq$kD<B9{`Vc_C%8c?0jw!Y|dsn{N&p$JuJ<V}fJo^o>=z4P}#~
zWPv_W+9hz$PqWBG`#~`ysbLLLaUWFnq!_!YGp7>aA>GOLMxwVf-_saru2*%vmSv>1
zgN9XL=jwim@<T#|7whDTz^sJ<M&E3dcCZrOa%uB16OA4=xMDgu=U0P0p~yDG>PULq
zNo4cV2REFzdn7SUxSD2nJ288!;Wx1{XO1Cw$#Tl3?CTFtT6_m<T5pHc0_rejjr3rd
z7gAi44iB7v?t1Q*%YMEL9BBMFm<;HR{2PA<Q`}X)cobME(zBa78vUl`IpYbw$V>3S
zua9C?s<Th$(5)*ExEslgFLa*XE?^$l3x9uq5dJ?;^*<%gKS%b>!J{-`PZ!p#o~VIS
zD9ej$a^hT~!=E!`?S6l|llyD*hSV1&`0+`LM%5iS?d?bAxYs8`=CScq{`<9Q%aF;S
ze89~Ilqu@7+I*zPu80Aoz{hHOGKrjDBz*y@*s{T9D+g3dj*RvaJx`%(rZV7gbs3`I
zDp_I;JZU-xR3(kBXCfVxqMKdWfw!1%RRdHB*dN8qA9ahLJ8_e`<fubLfpF|NZ`T`N
zgr422!tg$tE!3``LY2*ZOp@=*9_GwbD7sRP(uooK7%PLaF^~aykg{@I5YNPNwS;84
z+R?~Xs^fm8R76|Z_??gd?zp@lI!Og^ER0x@G@>G-eJDB?lhk3OtePj1BZzRF6z;re
zZol;MjH&wfCW^x4?K18X$bg2LWmdW?j!$sia&w^Y*db)}X2m$~I%Mry^ID(XSu`!S
zl+@k$)hvE)6tujDyOYe)4Qy%XCn_QO&MO7GU(eX>*XCk6h)?1+%PUmN|7K+xntIfW
z4+Hw1S}ZarAHuKZ>k(adcUr+CI0SXh(}`^p0fyyO|DAyS-!3Ey2B5QYlVY~(=Kf7K
zDy%GGcXF=E`}3{G*I^~4kYF1F75(PWTU2aX6zY6y4()~AosFw{>LIpx079-D>$}p~
z9bg-_$)D`cUzSrlKIHy)a3?JX&S&dNTr6fg%0-R+DiG=^6;WCI3T8$}W0J|Iws>gY
zx9nTnD#%c~nlieCyux0o%*}lkYproi<o9e{=8qKU3k0*CV3ppIPI48SizqY3(!|81
zP=fQK3-UfrtH=*KI__1}N9Z;C`$`5q@4NGzb_|*q8pw={_iA~H{p*H(m3s>8A<vB&
z-7}fk8?w@1P<K2U5#iVX=~V_k6Ay?RfvA(sOo)e0mv6<1(LmZ+m9g+nVMG%k>&+LC
zVvCa^S9`1{q^@C9K$}(HYfd^9mb3ct3at23ZE>WfR+OqO)vb4uyWN@x8FMl+l7>#p
z3-ex?+nz<aj1p29h2Qvo8u{_AME;Qh4^Vst91aLJ(!$;Mco*NRh=ASSXk3jca12i7
zq<i0AIqp|aZQjUS8Dd*p#;GaGF{OLhGq$VwCjI2$<;?{Q6!~W9o_w(*0QG96SZ%RO
z6v#@)Eb>#|HL&j~SS@T#kG<k|f6l)msX}=U?ATL4EO~qPd-p}Pu@?2?gnPXB&prF!
zM-OO!$UYw9c6o3FQ*dDfOZ%~6LGuTPPm%v*S6UF#Js`VsNOk9SLkN~E9&qixO@uT}
zy_s$QU%l+d42}0c#rx;?OM=QnK$34SMavvwVJ;kZu)U`QZaMkIst{n<R~|(Sm6HJF
ziM!=gpeMa$kRza~NWcwHjiwvrlA%RNv~**rvUQLLm~Ms)wsgZQv$GBc`Il0DG)sK@
zfWIo)5HNzBnZ(i?7A!6a_{}`byD!Nlb#ukbzgQ_y{(%^qE8Ytdnp|k=Zaz7?B$7sb
zyCKCvBbyslFzPE1@NNhP>UO-^9bD8uD|6pH9o8PzWD(`x8&07qi0}TBq(vIaD7ex_
zsxxC57HOX=V=z&{pE&M7y!ss7ZN{I=A=*56a(+H#c&MKDYX-J>qUB(7C%K4WB>v5|
z8<q345vDPR*~k4Pvotx;`{T%QAm2M_f%FUu?iSDIsif=E`AUL&(XD1MjQOM-F94*z
zN$E$$FDrxJ`4c!F<!MH=UG2~8dpj2EA)JgdZc?PNG}Gl5>#-_8rk<vDg1L6NY+j7n
zPR8}{k9zq3KGNt<{z;*p_|?DDAmS}7vXN@BDp8_PGt;~gYX}&ceAH9!@0QHAucs;y
z*$>ST3;$H%!0kycFZACZ=Ue&uKOvcYSEsihsF~hGfP*0OGc(aOHu~5KT(K-mx4;_A
z><GakDSZYP0x~j5;{Z^wGA!ry8C_y!Pa^trRS`Pnmw}LC(ylM0SkDRV8E}m`ou|vc
zLhw^p-)a!YY+BbYd<#yF;)+KR5ch*!Oq+}o$WTVJj&9PzMElU9o9zi)<9RPK{n%W^
zaq_ZW<b1dwh$i&*umD^hYL}2~=5B67R(C5>LIdDUS@tUi8dt#51iD!NLdF3tRO7u+
zk(taR|0aRZAyhl!Rqie$$MvtcT%`WZEYMhrsaR^*?zCK@KgvZ{1{4A(BU#(I&XS~k
zs1#)|0M~ah5o;~ui<1xxon882!j9|t48u8aB@SI$PE#ofPuM4Y>TBycq@sG#FQdGm
zsAYPMeCffS{lTXd{0@I?TJJ8ZfWn!QaOreNh(jrv=lSp#p(`-!hJwfwM`@4pz$4Eo
zJ(rE2E^}y5I4O}|V_Ch&0>%Fg%l~~=Gv)~%bEzcA0B=#LjcoknxrL6f!6(bbIKf({
zR`HVgGN5sXeB<xq{eZw|_Bz`i++NsiYhF+SFIs~3|Le{M(roa54(bu8J~$;0h}aun
z#74B%(43!x+jsp&rqlZ4Nc0@v3LbY6Dy%E@#XzVmAS6(3i3llLTL~*uB~y(vx`0Z&
z!YB4QR?<-cO~K~MltoRI7?wQUJ$Mq&Ea}`?@GriWUmbPg=RX#JYz8gDgu*i_5-(VK
zsa@vnEPyp_0_^vf_9Edk_@gZ;!FM47S%d<ls@ydxk@Ib6?iU~NDu~>zo;H#yTp4lD
z7(JunyId~Q_d44{kxO9dC}O~oBdz4QA&hhwBOP~swk`sY_n*8cMds;x|9=R3>!>Q*
z?F&={38_st><tJCNOyOK2na}*h#<A;l-@K5NJyu2BOu)+DJk8Zn?|@VdcJec_x<j<
zcf4cphitdQv7UE5Yt1$1TnzgabOvXpijkBfb;L1@ZpAyh$!H^uzSyo}NV(mqxs{9t
z1!wGZSm%Vi{hA4&7+#Ps30@GFn;zmsK1gxJY7_EO&CwOudU~l37IA<bFH+{pv$>r$
z0a1i@8roA2lFc6mHV{GQ5aF{ri=y+Z8J42@$r5cdqd5vt-IBy?Yap0PsDzaNqiXW;
z@%bQJOS0>4Sn^6qslm0Vpyo6F?C7R^E8+^F)2C~n`xqiN+&avic0X{hQm{E^r$^!m
zTR{x@(O{;B&%U2>Nl7sw{rB@>7)AZSyvSPX=G?(nFR7-4kqjSxAdlzUzy6UIhlaHW
zw7GmFevXKI`yw}EPQw@l|FK=*#CmvsR^vB@9UxmJ0^Vndy`dly2#dJ2q~tKZYfS1X
zbt?{;Y}BSCopg6HB^7D81+`*d5M>2zhx!D>Y&j?b+4W_3LML1H_xoFE&c6S-#e9Qn
zVv8Ks1<jNi&N&eLp*TM&`3e4V;xR^%n*>Xi2@6B<2=z&gY7^Al)uGFf4G6Nh;xf3y
zP%+YTf$vB=4-L@@RyY+Bq|X){z_L0HTzMM>HR?41PcgTu%gf6hFw4g0;oorWU*wn$
zDsmaY%Bt8*x=ejJ`Q(WGic2tsGG|-lHZo;49VunYlS$mI^5OmUgUq-*UQ$f4H0~>T
zJAoAESd%I5MvBC!gJhMe&1@gC?DgvR5g1Hx+sr2)m>aV<oy}N|0X}#3McS2b%-Z<8
zuJj<>Y`ih{rV;p#9V=JQ_3D`zkcODmQI(IV^y!eyTW;F_ei8naMu}el*D4vF?>Cmu
zvaJI%I?E(#GUxFlC_kheE2IsvaSjjeC?7hee?N;M`gxy)LjrN|?AO=e=Z(M=0ce(~
ztF7l2<#$o8n(RIPyX*0hc<d7biObJ5a_|V|3lZWjX8ByXwGamY9N(YVQA-=zLWXDX
zSNjHQZuV9(j)E%ctz86NHt9sLXlZAb$@ktXC5pPPM$6>(vos6F;5$1Z%Z78p!az@@
z>iyxU<<Wu4+}l#0Oe3hW72Trkw-Q4y6a@XXqL?76;ticDZpN9K5~ZHtR$%}PPbA0K
zQbSUTHV?+maGa^KNPH@fafa)vcCxI`&&V&Ek9r*p<9D(G@zNmk7f|4Zb|qeg*ov1H
zlwCmh5gWS<+Y?-N5h6V0N{jlj26}LGNHarPft3X+EDeX^bm$VexfQI$OIbS-Dl{rr
zdT8z+Q8seyC@c*7Pcs=<kc_v?0H7hHxH5`kDhA#BiMg9GO%!yky-uq=HFZanhVbaf
zNKwLjfUSE~7Yr}auB7upq_sa@yaiKUl=JvTaM@?dvkF<RRsqTthdIYdvunU`F7G~D
zUz<pH!8@pV&blMDR^_bWeJPh8pA6;jLH8Nv(CvtjATD8yNE?hxRDXX9|DrLph>8Q?
zW-Oi&VCts%r}>4Frce~;XI1xhRQq|VHZ<e##^P+=C+V0oCl(uVTc!66z2y~j)jZuB
zx+y;wTE0#O)%g9Rlr}|G*Fb8{wU%7wld^0W|Dr276sL&F9M8Bc7}f$7Pv>CRuHk&I
zNZ+vS`(r{Q`jemo)I)(EmVTOrtedkKQS<2ssks=~zUj2s=DVaaECf|j`aZSiNDL)(
z@ps7h+o>K#iy+D2JQ)f7lF#N2YkBsO-jez)Hz((+<F1xwdr&#N55WMItni6R?(4jp
zWs-=uSMXGC5>gv;oEIc40%(B_d?H+uRmv0b$WrX7v353l5Xp>R1QX*jLE%98*PY5m
zTAomtA<=?9`USOp*Drz?q%GyrNhom1MuZT@c6L!7k-}<L(&gx5_04XjOEEU!1?HCH
zc!7p1b0%X`2eoEbpSIBTp7Ip7V2{LPxIU(kMi92ZZW*UpU#wzop!z^PYCU{6PpimI
z+M~`otT+5!7s#hvqPEMh)?zGI_Zf*XD|H1MTPvyeE-wc!E_#FZ%I;!Eg8UD4{dIl=
z+tx=pjnmj7NyZ$~rPm?l_H;q!soDwqP43FVG$&e$j+pAG^ZKrQJHP(N3(xw{ECR^w
zY>?XXfIh0Kajc;sPpvI0o8YfCojQf}_2}5}nzMoXWKl+i3V#FNcTAt(UsFOYDF_+D
zen<LJMh7Zruuw5+Uj5I|7on<aVu!M@Oy-<T6t_lNFpv?$bped4qK;O%0~Lc3X(q`}
zaccY%rCu%duZ=9dEqa5S_Nt54&%h`-v*3*=LUez#jTc1rlOFKu1K^jrJrj}~+NzYK
zX+Jdyz7Uekv<ZznEDFS}9godlEYSd5pCbNp(R3qAhzRN(@;&jLE&~u>TmxE#8~pfL
z7<x1m*gCUS-c6|hEEj>6M4@XZ=*IHYbYzVl9CcHr$u)MovFW7K?9A$>B7;w*kKKY2
z=oJ&9g7Z71@nwYg_gFHYTax01I-Wg1hr@S6DKN<<%oG$^$N1~epu3WNflQ1d9w5D}
zeQoC_rnc0SwD*jp^>=OI;o*tu=ygv0pPtu=B@v`{Ovm9*_LP@K{U$j%Cfrxh`6e>+
zy6$J94#IOR1FfQyz9(!b9I_2?bV4T7<-IvRXJgS>VW5W{15mt#a!^wT$a<F%m%VPM
zNgLR5OP3ULz_*bcgVx=#>NZkl=6!6UjA7M_4l!5<zCkc`zxl4oLwaKBn-ecVo)RiD
zcIe+<(!a`bR@*=1!2_4?%V@@+$!#?=4Lu7x0JK(Lu~7NR?|Pyxc>R;mpeypO^7nml
zM&k4925<D=_kjHUJz)H{0mAzD^zds{okhE_#2cCaz6O91#uVsFAyrBs5`DnKk85x<
zGa*fOh)daAv~VfTQ$!?Sg{o|jQc`S5<4!MpC5Ut^i^qdy?u;c(QR8U)>-H6nS=3T$
zURg0CLl$>8)x{S#44mlgA{&ntGLC3fRWPSKSm~WUt#E~YQ2_&)Y;+W*RFo;Ue`+9w
zqzck8Ev+2<Lhevz6S6r9qZha#Kosa~P3@xOv=2(Syg3=l128j|IroFc#MQ^s8j@-^
z!RQ&zFLhT|A_SNtr(=Ys;-v*~-d6`5k9Z{q@T%wK7#9!H3aoV}Yw_bjqoqb5)P=^~
zq*^9HteRHqQ`A#WdF;FOS6{*M+vF}scdR-d5cyZq0Qj89o>C;0xOJ3GxslCuMXr!T
zWIA5zsxtX*s0q-k_48E`)%8XY7g<DL)0!O*>vwowECr3>sR%|p?mmamO<pdCvJ9@8
zEE|?eTXmt92lr}&CGNI0oBR0pqhpl$pRFhhCfUF8x_BmI?AvH8a@<3cSQLTHZrU@f
zPUOD`k@$Ltwfg9PHDh6-iTAvKzF^i@)=?T5!M?~E)kjI!GcLE4D@5!4&kZ(AkN~nA
ztmSOTqbAZ}aCrC2z)*4d)3413j;DeORIi;Rku$dD|6X0hl0E#{tVJYsl%)T(5dJ3%
z)H5k}p<-YmfswGOc=#Gmeqwj<L<)?xPyVt@`jwUzx{Xy0R0}^oAZDObZ%mwuIqa6;
z3R+GSDf$PL!9-#B8EUI4-?f9D$^~f2#sia2W(`v_OkCPk8PqRP;gN#JJ)FiJFhO%n
zoXa>q_je^i!@(E~)QnI`Hc6LG6g^MR28IGr!p>Kc+FciFdybdKYg;uxtrb)N*L-2b
z?8!_D_m~4!8H%`ErO%&w%c(ogzDFiZg^KnGqq^Bc@>H{=;|_=Uw7XHrw{qwSAF9SS
z4v+1)l?Af6Ew%8Qiw^O{(g^uRxGci3L~d}-x>Zc90wBV>3KBt7w-=dXbpaHXVbe0M
z3VGzKg|*w$X}_lYJPu=6fIr0cwjv(Gi{C*b(YowCxK|6D)48YbFzT+{S3Ur>la8fV
z`g&|dhn92!Ku7uLge#Yw10C&g0>f~Oqp{ma-PXePQ{DH&uMhHf)86}{>hf5Hp|yT6
z`oH6;-|sLo{ym|87S&|!F*Q{iW^wuv-Locts-YOS)S)=b!NGgJodkl<-cZliNQV+2
z+Pk;c_;hP$=Z*FC5Pe5oDk+=S%azeC-|{;D9&=)!IqDZ`9D?4eby>yFT*P&pEw5j)
zY}b86Yh~d&o*x3f_afKMq#&#y-}}Zug}$e%`L^%dXr{Y22bd8F%9oEjJ72+9{grED
z<GXrQBYaeW!<DP_9P|{z9rB_#0og95uMk+cWk{#cG_{8SsVFI7)-)4Z^2cMJ{`9yi
zN<iu(zQsqauux2a*CWUkIi$iNS^9Cd<zkxnI9mA(-%NWyBH7`;d<NC%h!eUN-@I?*
zIqFD^nJ|TfMv18QP+sw))U*fPw*w?GM3#M0=Bi9My5*hH<|yvVP+@r3(R96|<pdiY
zk4E(q5smNTUQ-~M@?bHhq-8w6z+y>%V}O`P?jQnar7=a8BASzoS0p4#*@T2wL!v?_
z{2@YoL>r(a%_1#TYNX2MoBK+hkXbijqD1d=@Q|*Ky`dhv*Ug14#pmmo+CD$WP9yAS
zUtp_A{Q6K@+QG)jkcdc{#t|>iHMGRIWRsW7Y4aydkibDL$9|nzj_w8MOO4MY2fRr$
zF3<h%`S(A4bu8mwkq?PKVSfmeg>Zp~KdD>~)HZ(uW}IOOQ7dsj7n}=9COI95uHJ?l
z3#a_7U+DO%67)6Z?^g(K2hJDbmn3(;1o_h{xE{+mS?_ouy4I2F{Jq+1%z4&RsWX;#
z^Hz1+%2H|JZn5xX|2k%VuC=KLUY(ODb@_8xsJig}w$+e-Crtz|wU~W&!E<uaVzR%y
z0I0=jO`>_W?jdrolg|sQloeU9SSf)n0leM(61To*dD-{%aA05{Ihjs09gtsfn1Y9r
z&OScpx1yaI85Se&q{J=k3W>yQ<8Qm)0hX5Pww({`Oqtb1Ahc(teGv^z6bU;ldRp=5
z6rXC)5-N96x=ZpAxG!UnaWnDY#BT+#*-hze1ko~j%N8f2xWfvzA;b2<q%VtZ6f{hY
zv$BY$33ZHoA}6L)%KcgRfX${}yT!AI<|RP0F4IL#R!PMM3;HstWjSRzkW|v>=Fpd7
z*)0@|Ev{J1Mu+8E^17Pg{v?w8w3<3uxgY8_p9nOo%^*@4KhyMRjqsYTFta$@ovwQa
zcil*dcTYiZKOUQQ{1qEH(Hln$ihB~L;h0}<EeZ1dcA&KN{{zjeNfR?V&nBnchcbNu
z^t-e#`wfdf)f8t%DJmf$v^gwNxNicgbL>ioto}i#VbubC$)|{BV6c2C;|_giIrq}3
zdjk3d=-~H9c_B2mn>54YBb2Mtr&}Q`zv$lURzID)2**Y;vVB`XCTuOLd73?AX9<k6
zzwvX7#6E5UoE!&MHDO`Y0wKx04dvx*n&V~|8AQu8CbBW=1pxyL4|8BCo(CXUOw>Dr
z%RbHAa+B^)J=qmOx{r?tT3=DWd;*2VPX*ULqt2a>?8zoAx7v!PF0Ud^dt9+IQLF$A
zO<mj;eNaY|xGaxdA<K`^&uHjesh|UFb-)}nQ>}<vzfb0NAUGo#Y$ySGqfGv~Jc-$4
z83LcO<L;V~xi+Q|tU}H$h$!T8=tD8+@+7++zM8>7q;i`mGg4&y=o^P#vr8`ms~)Ik
zaY8L0rs=HA=>GHyA3o)SJ^le=w=>We<gy8tk|6h5Pc&zDB{o2t-0Nd39Uw>^Sqe>C
z&RX%xwX>N87Mxw4ugpS+_M}qjMamYhwu(B^xAbWzw#N&{fNh?~o}J`A7`hs2L^OE5
z9N=4{zmJmtLdh|R0g_WVFuz#;$fpV<04y$~8j=0^yqHs`NbShXWVF_!XHo@O^0tCQ
zLpJTZZ>RGrfA;=8f0OqCt=mLy!ORlK{w36Q-q%dcseAlC;Vtt<MT%p+-GqCsmU-h~
zhdH0D6OC%y+^M@Q)pd`JReBR5H3fo?JE;Z{o{P0%R6upca>2?@Z^Y@d7dZxbX~xIJ
zUhLAnD+qdu261T*biq^$g9sBoI;L^!i2-p!UcAI1_{b{xVj}dRk3&}&Nw5&4YZ<+~
zf~6c^<P6|-u!X<-HjrapRM(S8ZDJf6;Rw({ql8Q(8+%&S<2(VRfIT{<l86z7F$jl7
zIvW@{z4^$xs=uZ|`-O05&RLP1)J{5rJh8X40tYaWn^xb5P8A#}FPY_|+F9)7H*o`Y
zG#O*I206NI;geBZEcTOLqYA)_ELl8aKRXQIoV62<c%}=LjWiW;(A79x$P<sjMt=N=
z4IT^|!HEo{!o+1g-|CBFbOt*zrn<ql0PV!PXMy%=y32NRb$JjZD24v7ZOx6H9O7h>
z40`Xu9A0WP4uh(<cJ=4;?)Lk0O%gBX%GfO4n(-hs>1?F^zjy4w421X(ScB4aYX1rN
z5V<cZ{C3K$6npA-Np4Sv1nnsZagi{^|0(+VGk5M_$^MW?MVrW9r{oXl(*l-BH-4*8
zkWU4yhp@3$+)F7o3x=gKCW3T7#dph*_y|cDl65p*h<x$!@Z-VUQ+hgA`4pwQptAT0
zSC{}(^;hnk@0OaTxC>DkbF?jfF{<8sqzedWZRVCY*rJ-|GEo$aWA~Mm{%L`xSsTr&
zG%PHNCZAIwKn=BdQ}Q_5Jfi0nzX$l`GQE9SPwEt&H?RUT(H{dsD1sVGt@ZAX+Ah{H
znz`IukuhZXZAxlFl;cqzJ)N6Bz)0XtMiJkgskVf!Edo2g^E3)ytyPNhk82-3q11>0
z<|FZR%E<|ZgYQJv=-a;Z<j#chNxt2UMK^I!FE`Vx9i}P5i{#_wV9_T!mM(4F44!i?
zu?!Nj<TSRx_TZ)8$SM!SGCEl1GFQTEJQkxD=#-JUr9Q0)I&Mc6;vW=kt_;LH&)Tmf
z(szNppRHxX^X0>Kmxp0~(#6}CDpuXQtmtR%hdS&^sEjp6MAY7sCY$I0*wKkp$jw2R
zF~P9kYq7O%DwNVF1?nUj7DVO7yPx&Q6?@`>>>=c0_(G>G_<u~lS`6>8ngozwLP`D5
zJESmCZAjTKoD1Qc@jr2=M}kgmZ@Yw=IeIQvcGs*c<wJG4g^dj9|6U5%K83ts%VvM9
z8!=$haPZdh@qGV8g;476$k)X81e4q=1|Rj72vwiR(A^php7@9KZNF7rs-~7r6zZs(
zlYAPQ69InY+*KIFkXhtr=J;NF^@o9+gQL`=>GkJ!P1eTGXys&Eqa3BK{3Yea4SJG5
zU>sN^rzEZX#0Z;t5m!OcJ-{V4<4=p>gWKwKak#Wq1jr?0=#;jlzA$}c2&R9?M60kD
z8c_~Qo*^ScvrB*y%GRjU(xsv%cf4r-#3kwe77HP+uM$v9==zd303467V1|jl2;vzO
zUse};Y1I5p3)rF2!0pUu-d#)x0fh+{YVlOa4<@F=XsVhH!i+d#7(6VrCag8`L~e)@
z<}rfKvJ4K%Ysi^QPQX3Rz(I*-Ie+A4WkK4HrE_UdS(cmsn(G|*stL((ua&RGb0C4u
z0zeR__kpQ6<D7Sqf#bNwWl~w*av8l{9QOI`Y#p?6&Qkv*N%uR60jp|6TS)2&4mMfI
z$V89pSxRNryQ2_XU>AB({=qGFIeEuFUd;ax7+632>CCayL)X;-Vgqj#Xwz%9X~=wg
zkFt`oQxuE@-Aqba%Fp~aE`RMoKQ;2-34QT}=!d?R@oLpDHeSY*z2~aBHc)LUh2Qnr
zPXFp^SW5)z;dfnFl|)cg-b#cJH-*>5D%ih7C6tf_%XqEJr3PeLw_OjOeuW8RNK7_Q
z2PHT+kbaxoe0_u&{r)FENAPj&N`wN7_hmoFWi&$($W3bXIW9MWHa{#SOe(}w4|)@P
za^GVEb3=37r%oVUpw)uc%3!HDI@+lqMZe7C1wDrt76iNWx!I}6CU3%8o2cL660tMi
zPQCS<Dl^i?wu=c|R2kDU?+>|X<*Tut1Jp!-eZTyW@U@lj7~mhlVWctcTCO?2D`LOe
zgDa+W{Sn*Ms5^Bvuq-cWeY-rSv8QS(bMkVSW@<~9AH|7NQt0{}MdR|)kk+K+*%UY=
zAp9n{^A_Ie9_YB{mo`zR<_A;oV^VzbW*-lAYw`IpON{`YvEP$yo1Q5{43dQF&|hGo
zp+pY)n9((FV7JZsPG$mpRoQyA-(_nw=YFohHwfVI_8w={bV5_ZoZT{RR~u;tDQ||F
zIPemyZ5$g$iwX*unO~ecM$I?=y`KIHk^u%^4}mJZ%YV_wwmLZr_)rk-!$y)uch8Rb
zeZ)x6fREJUH^2KN86&EHz&gZMsOnO7{lEo&Ifdwhp_u7b0&vs~zv+0+BZRlqlnnlu
zsCW`i{wkiiezVPC=@C)3DotSCC-9Y6$@S2Ir%17WBR|Yb>~T0lTbx)}VNZ6?UYs5Z
z=L1Bx%UUcwySW)Z{N%z%C@Rr?H30KaMJ-SHd9=LL5B$rREcRS6m_Np|6gT+0DY1kA
ze8sF~Mp{K!Q8zhM(V9kD^wX}=Y=Bm<sCB?$FS*FxXCibF)5ymabdsv1zL66ns#2d4
zs3R(JJ;qnMYh8rbJA4KE_`ZBld}LIB0<8hOJKs<<cD%w-JX*q_E{UKN;twa~V&Jg{
z6Ada4Qs*zXYeC)Ch7yuD10F%cx8ej$wkj)zu%{Vbji~r*Zuv*|bZs8BNAQMSceNsq
z@So$>ik;=mu&f$%%~C}<J4RTSQh0CI`;wSi_B01kIB6vTWSOQ^G9K#zTHQ`a8o=h^
zyxSYmUN{WoG1Xb`@N*cL4w*y;cFtW;BVH%F@7E<(DRWPam2J#Jnrw|y*y_8fys3q5
z4ka!XH-j)plHQR?=Vct3q5dOW{}poTe}&xTG`aFV<Vb%)o(+UN1~iaSSV)$6@xoJB
zB<;OpRhPLg(38Ean@pej2e$zOjKmNqxzwI?^|V7frZN}RROjaeg5AU4fSaf;Gra|p
z?=DgH=tOQ8r_t;tJk`0Gk)b*D6Pg2c-}|XD$gjQlrjI2qJ36CdLxM5ugN^jhF&~=g
zxXTpeQxJC4*MmoL@MERhT|uBJWVYH$p#lLOXFR_wUkeEd31Icj%OqYqW4gi+PBaqS
zk!mxh%qNnvNbH5MN^0Lsa|-b<u*$GtKoWU>*|REW=oK_9cT;j&fivFO7-w`#yFY8P
z0$Yw&iI}QQ9Qt{n^AR0$_^bGH!8_D2tP(?Y3zExZBGV<xmIMKO_0og!RgvsHQ$<o;
zwmr%a(r6s?6#I-8yQdfq@`uRy`3)8|w5n|2Omt*fC|y>dn5^aTd8&r&Y!bwm+k&ye
z`S?aw^HRxM60ZG`36qJ8IWb3Bh|_~y6d3nAy`)CGbm>d7SYLLUu`bV)2S%arm7x&i
z2cTR5HAg&Z>y&|g?-LU55(IN<kwJeDV%j~cu^`E&XVU1EI%-#BGU(>5F3s79AWK)|
zr%w|O=W|eYIo*pxDif|#8tmzi75;DkqeovHmim3qdu-~PqyZTGJ;Pi?M11Ey=}Wc4
z&@LAdw+`Gjq?DYcs!})3)TMS{6Vv1R>qH}40P*2Joj$Qo<L?p=f4)eGV59=6^hq;Y
zR;A;C9|bM;{b{%W>pifsL^?zEc`pXD1X^plFsc~gn^qAejyK7~v<vkYLC)^#%6dtF
ze#?a8(&l?owQ48S1Eef4ngr++5U~ZL_UkQ`UpK7Q{rEA9i}d}1+a~H{IY<ub4n?>c
z`D8ggJ{|31J32i=*wHhn=;Y6YwuN(CKq{#O-<BdYV@`RAXB5YmEiW6Z9+;D~4?u4A
zyYbC8YdMWz16;&5`s?yYw_^~R+7UrK*YOJ)WPe2*yJ;OsHH~!wfI|!t)TWPcGY-~e
z@ZReu$JtVI+XDB9`v+*rJ6gepw?~3$6+Qf2_!)_#XgaLiNcoR(npT6$yxC;dBpQ~r
zE(^@VUnMgVUE)wtU<#BxQCc-93wWT2Jxyf)9BKvrHA-ZHQ(9_^H7L2#p#CE8LV>^x
z$EQv?IYp~4ns-LV?F`9$PvNeICUW%}<2ox+m_NnixR(#>+Lxye%H7pr<OOW3Ugvn}
zbFo`FG<fcR$gGcOoJkZ2AL_17_1w@?MW~Bji-II#=xSrS)?KIezWblRY|DfDst<#<
zZR&yVWIpMAfc43J=ELTRz8;v2{PZ*g3eeXcNihYP{G>LtaaKDaLr?f;#%iAWwv(}c
zTZWcg&`S3IW56#uO#>Rp<#a%OgzYDyiDN?+$)k!*GNZQ|u_`e0S<SuS3C$FTnfE7S
z-}}qM7Kb1*T$F_RflpO&9a}ghm!RHBd1Q8s3jebh-h9|q^W-h(cX#**yx99DNU_SV
zBOWbJ$iHb2oLXYg3=wKF6iaeH@C1&I*bM%-#<!YB`5Xln;;Ce~-m^?BLJ!q3BHRk|
z85ww;9cwxzVj^@O)qkFvR-)E;6$O!kWe2IFm4A9%0usnSW2Am2DIX4bXRk6m25xvq
zAr!7f-99QoETz>>sH$SU%TmGAwEIX5|CqrSlb;mHP$MDkc@saj5O-gGsR&z$J4bxD
z+t#u8jiL9k4=M(PSe#SCA5wM?zU+X1h|8{pNda3w8PEDO_$my_mr6MRp~AMdM2L{d
zS?(m4aft^fbIAtS{m{?T(Oc9y@K8a`(bR392&b(ag~ek^vo?z8dQ2-%uFTI=Ip<BW
z2z*!~F#)sgJd9(oXOhC*wmtCLk8ScZV9j!_+lDd+$mhp^snq9ldMegQlFcI-2X12_
z_;9;L>k9gDJeAgp$mqMk@CdJK@AQnXe_FQxREB@O<c44ffZ7A@9F>LAr>Pl7t#iYV
zL!KWNu{X_94aML05g61+$55-((i3g;V$VB<seSs=>aXqtZup4h;<iW31*jEBaiaj1
zqi6dCHLUw@EoTtM!^1s(fy`Q(N0ciHHi)Xf5quxudOArL1IPI2aOWAFa&6I2T^RzT
zF%AwKeESui+oR7Gt-jr3-%7m9-A+C;58XZJ*7sjD9C>u~^|Q;={QM_w9&2R<Uw<C&
z)|)TnH!oh7+iSeDwg|U5!$LpSQy(YaM#(|h>*`xIL~XPC#SaNNtGak|%H5==M8#k7
z>`o?9G)lcwv!|f|9umO?i{<Qk$4`^3j3XxXA)o=hm$>37f3R#hyhD{h&#fo1!&kJg
zzH5ptH^~1n4q!;*!Vu8~?_lU!#E_~eGu~3%jw7o(6UsWKXC`ojJhTDYIk8-W$~Q`M
zXeZw~lDU##-;bY9rdIlr@!HMRo&j<R1w4A?0U=sL)<+Unt>_gjTB2=_cqDm^5xbJ9
z$ham*#%L<q2{8!pbXzZg<iMoi)Ah>Va5uQM>0;LNd@eCr>GmG)I;Y^SPp!XQWibkO
zvCO)<)T=y@2f(WFmp2raJ>LC+7YABsc-VjM*Z&H>k5AC=!L7^W<Y0D{p2-RUkP+%}
zrb@Ao-BBB^L(FW>6HcEZ^FwN3LCs;RlI<pcyAlwBMGrL>jZS|Oq4y&p-CqN>ip;Pv
z)`y-r>AqHgB2As*5zE5Ke&JXEk!}=eW(ECfXY;So`1?Ur;{5SCPmYL7_W{bYGCDjd
z4hxpMk!`QG7V?i29V)V|prfSEI-^~uJ7XL}!k@jI=2$Y_wok;e$x<2o1c@D*n=D+s
zUf{s)5JIj$&`V$5NfJg_&WsaC&R*19bL)5FbGJ4Qn99kf1D-N<3{2yGiA0ZH=Io>I
zW1@aST~#8bRRaV~Vfo@rzPUXK)CbFcENq8<vISb|8v)q`?vZxUvy1{;Wi-t0!yNQB
zXDqnl(|M&&Z9JT7<|p-`XJB*L7GS5$cLJMyw{OB;JYN_F4oFNU%KUa2fV6?~k~gSq
z@rDz%g4zSB2f49Nv7ol|V@wzU*{?gNEx4x;q_7g|C!>tA)W8QwXl5Df4K|OWBWl&r
z=;$<prqddnpBz70sDo~-^G0<VoFq+}ikv-9P0^~CaqyhJKI%@B#TL1FA&lp)dYMxL
zDM0LIB>x{>K7jA^{K0pe8$!I^|B6V^0!D8S(%zk(6ng!R@cZ8p#(E-t*ko)X^54<D
zzZ|fb9{#TQeLAN{!drwP4_Yg;-dmDZ6w}By$LD=*-s|J^=;--@yV_ZLGdG#pcHp<w
z$2gx<Qhywxj%TW{dntm{mQ1UOj^%6M?gL`_2>!(}#1tmqz7TRcsIJCCt$#lDS+Ib2
zzaQJjI@4BN4-@wZf&VxDpP5#kmXtBiR~2Qeqhx`d&z}q7;tW!fo2E>eIXwxZ8AO*v
z74%I}TvE7in2cG3sZ-hMnq-SWsst$R8lM9cLoiK^CaS4~ZsEI~O#{;^PSoL}g+>PW
zaCe#+znh-Kt^-tmBh<mFPoF;N3t4XRhLU<o89%oR71v*E(e_6twta=;0WpDEPiSXl
zAhIkQ=?GG}XVN?CQKk5$LWg@)B@Ie=ga-gQ8<zWeJr!}G1w~Q$m~Ks9FeO!IS1L!0
z$n`*~kN{o@-vWtwa&)e8%Ig`TB2xvGb^|`EnI8%JfIArcra(hG$kWVmmcF|ER}y<m
z+5bq(h@^k~Ko0t~G;nO%LN-K>UNEs7UJYXDFOf*${SLfO6Y7iBnu-E$;gf<r{bdrD
zhVaV9%Ieash?Dt9xU;S|j?(WiE24VgEH+sE1Mh9|qDkM7r$aj6iN!KRx+3ubpVxfl
zLK&%i(zxHCz2$lED~t2ZZY{XkG3UVZu6gvnKZjp8pSy2`$LkUL4_Q~3YWjc_xuZ6g
zW$1PtAK77x+v-??i2U%UaQqu;YR;+v6$ZQ!P#2C%Ixgj<deK!^)yTwsR~0MRDIxwj
zlxJUy7$(Z|Oi(sykHRkevoCm72{#}a?FcvX>9`g>0KcK-QfrIXN=mN#&-Ri+afFV7
zqU4{v#!=Rer`Q20f3=$aXd)&#0r)mjO3~x8nrcSB0R$|R%Z$E4P}J-W9I;q7ZaAma
zlnyr>^;|?a35q3oBDi%K?X7uLBo~BcLdtfvorA~si6a9K=hby|o^b|VF98KKMZ;-R
zYJSaQ(_&Ym)7YaYAT{@-oaMr>KY^I~ihZ3FM<SfKh-Nckj4^dE9&;H5I*o>YX3Ruo
zl{n@fR6<pQPQ<KuvN1HY6EzN8)3aeHUdfM^2B?Kr{6vnXKC`e19=80tw3>Peh?>2!
zn+F~c6aMq{`;)W{Tkfanz`gAC3~1Yy(U(rON2YNMTx{OUr>M%d|F&3jVY_eCj3Sb*
z)K#bTF!F$LX=;qkT%(SS^uhjn=Zcx1DMQ;Y3nIu1-UXUj-gz#dy?yof`W}I1m<4t7
zezf}QVV)l#R25GT!k8T&NgnhX*WQw#x)CL%LK^G?cYLq2RK5zb@nZZn|8pUA-nO?h
zpFuXR^&>j9zRDw&cSzlW3KMF4HJ_8GMwA_gYZPxSvD-G2xC+O3nl4rHn@YG-?guYV
zhJ@k)ucO<iL^=d<+%ibdTn-8f&&IYWa??PYB^ZFh(4}@9DE7~#cp!xKPiS=*ZYcqt
zc_J8tgy<Qr0N1(~?v{EJNEt#n2KCP94t!S^rJN{n5ipE~K=AVE&Tc5CSC({m->Ncd
zD(EHT1EE~j1qd<4&E8aG*|>DJ$DqRqM;@5OLYJfClVnSa#)cK(0@?bKnr_o3g;U$*
z-GQl44m#((V0|_M8Gg5D{Z_<en2&9-X?L>Ypjud`@QfOg!9@93vV7No6fPYhAA|V>
zXD&UJ!*(2EogY;ul=T(UY0;9zP_^g<Zkq(QP%Ko``D!aKuN_;Yp^8PzXegDM+Y;NY
z0C9nA+~<CT%P*oqS&&tK8P&!$@cI8kD+vDG*q85zYN~NGs4sD7p6|XT`Jg%e4B$}P
zmf?IUDB3Gwrwo2!)KKksQlhpEknO7Hm|wYlvkCQm+J3yi7NP^by>3EZEaHCnw+c<#
zuo-9gel~MXCXd4U@Rz@6FvcvtWZl?kxA5_j!&J6h;%+UxE@umxb|+rHUBEbY@0b9>
zEM$jRqp;h84kdfCf@&vm{D;qKz(L|zyKhwhz(dyi?$jptl#DxDGucW0b-k4<-EOhY
zx%lhzwkySw!lHfGa9kNibt>+ylC+Xj1$<=V!<v#>l+0z$(qTL{En20X>X>CpG65&6
zlF@!4KUhL<a(Pc)k=Uw#85+*ljEoFPw>5pg*vEWCRJ+4s)&XUG0IAR4*dA0zkOJ%7
z^?@lWkatmMhdc<w<OejSD$5^vgi*P73mdjZjN19YJ)>DMjq4YXwnv|vTnzhDi}G<|
z$_HB#wBRs%!?1{pP5)r4V82vKBbzgm6gm<3jThho*F~(;)e)znrl$7Hz+sn#-FBYV
zi&dtyOE@ez>%^oz!Lpl_JEUEgc-gN=w~qa}RvB1KvCHP3CJHLzF!4*}YclMf#&PHX
zy1YE!7dM8%OpT5Ftdlba#yy7rEAp)A_e^-YupAftDJA4}5_25|lkMGYud(qDO)bg*
zSH{OLP*jQ;#v$1J1o}055$Nd}2fuFWtNjFx2d|veTnKPyXI{I0y=yw)%69q>Q1q`9
zgZ;12gIGV4_#lS1)clyAAzx6mmd{J(q`B|VasdslX~kTZ(&y2Q=EF`00IbY~8k}t7
z^5L@EYDTTH_f`f)p*&M5uH;|{mgZWFhyeRLA#1Z<0Sq>2vqhU6sZhc^fZLdRD)yiR
zLwun>LWqt+*v!6u>(ftPtI6nh+cK?#=<F7PR`2JN>-n=@TX?wF70~Gqbrr_xie0qK
zWBnrcB+K3hBY*8KECZt`NH%4YG7|U!Yb?@w6E??9(II$Zk)kt_;P)>(UzsXTK!Phu
zwyVNMBt!!?dz0xNKI2b9Ew~7ME6=k0%$*H*Rrj6%<`P~gfMz`GX@tXQ=*{b}Uea>2
zcD^YUsN0^@{HlL?o>8PoChw-B{w{>Ql1`xWLrds$x8<jFJJhFyCJZ(c>Q54gcLOL~
z$EtX^Ljv^KLisB5CU_A|94>rlgi)arJz{n10T({0zaU^hU&yL?YG&gASSQGBBtw;h
z{h5UlDwGj5^*Ht$PFWhF0KTR5>u*j<5#NPNurMC~kIP{3#qSQ@sZGn#Q81{a<iJ(9
z@tLFb4sR@T<q&Wcw1|nP8_VK@du@_Khv=6vL*E}I_F}y>h3}VLEI+Q(>|QAA+kW~M
zcW6TAGnv|68QZjL*`24i9n$-Mj)7a6sQ;7&jJ{_a4}ZZ#fg=YD=szkac<ElP(hF0r
z&OQ@^6{5A-XkMLtZB9`ZJX+gwelv)XQeY>JjFoAEt*VkOcBOcTPHp5Kb;b{QD1%-8
zH7AGb*H7oB7)saGksmJ%(q8)|J1?V+jmZIK@-s8rij-cfBQj%t*h09aECmYVN8i^z
z6_cqsu0?S=!ON=h?JQ>+s=44azA*Ebwj%ns@wE8ai#0BrKSt)0gOj89Ai>li)<g-6
zK$tKfc~m^c-y$GGO@*O;hHoCOP@3pdofEKuVeB%*V`YAvk4My2UrrDp9@AeNNnkJ_
zn8>K4c67Zemz3{(#aE8vi)k0zY}`-eo+5PTC8@in;6?o%7f}d$_R6a-jgM_ho1QQn
z;OsxQ9I!}&GT&sg%vg%-sR&x(0Aeh8&aTv4@<Wp_7L#547{RwvI-Of&1{)Bp4UNI6
zXDrLO*cm~n4S;KO)x8+{2`Pma&=2;<`9Pv80d^O4$NFm{dfh}djf--?qQ>OtJXjZ`
ziSpa*??12Z8L5wUrT*ux$j?!~YPfCWChx8^-6`6!{+-oZd?fDCo;Ph;0KQl7xQ%jj
zrfMY42YYsJy+_*c1+{3-qAotY@&aXA;=OxGMk!L)nashH@p%l}(t<EwqU!ca9ZNNj
ze8}Sq&all}=P5(r;^5((nfULa(7mZeqm1bN5NO_gch?B%iomA?TwBd;qbNhk#^t#_
zmZmrsA;_+A9`%UFS}QHp>x~ir=?^tEB@n^V197ClMfBE^De#%2G!rVc0Cj*r`&-Rf
z4gA;Ll~Mh9)Ad-kTu=@mH_ztLcd{U5^N=iny=zV}n#9Q#EWo+Dx?0G^B;&~`*q%|>
zOc{-fPl*}iy_|v%-vn$0P0pus^Hg`We~cC*#d=w0)&jogk{}(N@)<BxQ9AxmwEzTh
zfNg=x7s_+2hd6jI-vg*KKj4f4T{8fz0b!_Fo5W)hoA~+oWU%BYA;`9PiJ7vZ)uu&7
z)}#=I7~wJf>I*CIgOx(}1T9o<&gE#o<w|LcwH)2@Co;>dbmmAD;R{5@fcBkFRI*cl
z!$gtXZ8?S>FtkB!DjLad*T*F5N=7j#xMbfTN4<QDU0mKQx$(;5bhT|Ba6o+%W;i4a
zf33+p5bCy8EOglYY6J9UH-OT8PYN6DBH+vFH|x22#bphT<wXU8?R!oC0@dg<o@K~D
zxfwRnFF@j+#ebN5<IKpof<j<iU>PK}bZjl~FFKF@JEZM*JEM<?^kbFXI~m7>pc~mb
z*7bbV&JNzLD>;Lm*S~8+eGH%anXCKCz07oi@=p2Y*H;6LB=^7YB7iL5@!JRINm%Dt
zulgiNgL5VEg?s<{#kod*YxC2=`=cR&<x|i%W8G%$F+b7ZC=rr(`E#f?&EGK9VsavK
z|5ku7;KNK77-TGd=mZn`%^>@)K4`H8{5u6v5qnSo5<Z-VAa|Y5JUMnI(m9sGXVG7#
z+&z{hW<tOyfEAJ&V8Vts2KzFRBxe(a(N1ZvzYift?!{&=g|&b#!HCX|#zbdFpsdDX
zp<jpHcPZ=hP@5!jQ$tt~;1=0wq2<|7@HD%U2If0*XlZGw1QhS`Ul;fUZUn}pD)po1
zZ*!q99i!l{eQPhW(&nSBn=JLCQ2jjktkk2<>gB@R9kj?OIFV`%fPbiyE6~<;RE|Ce
zV2zlvzXfEwx+ejN18A*yOFjhWy?`$z2b-3pYVnu}P39N)<@{<>*e`H{IMW-do|IW2
zQ9(SGBdKb_q}X%JZF(9}cQ&gcM0S!)+O;HKcB*;6J8*k7Tw?$;%8snymV%R!6_jZW
zclI~UnWe@BZqNA^3+dcF%FJw*M@&Mg+}1vn5KGiCQbH%HS)l%uxNIB4q;6;CN=_FQ
zJT=r{6A6#?8Gwm&VHAnEVNhWz_Zq;fD2Yx?ivn4E7Y>)&p=%cV^j)ig!+4bdIr6}d
z1xo5AyR!ZrP#aUq0(A8L@)1mu*ErbfD+elOJS1c(zZsmiWuS}E_&a6_&jGfaJ*ry3
za5#?TZeeuRZx2-+Blr$$^K!wt>c&Ri{N_9t_!~a)SUy+vSMa%u%r71OhLEMdxWA&8
z;Cq8HMo4Y_8?A<v66RFxulE}5<2u&Cjz6a>$%X8VlvzUt>wG~EnV>=iaJJ@~v~m1b
z1_x^{Zdh(3PCGatwf<!&|4xhl0>8+?NWU>iM5MBIQXe82LmhR#x60My5@YW3zk;^z
zO_wp-NtZRmH7pd=XKn_aZ)qBLww-fFvSi|Wd_e2$+AMen;EP9ztg@+5Zc-Qh{tcAu
z#^&k)fX~MH+<7*@?_Jj-GVo9(C6xT0A=cGS$Zn^@d1*6O!8PZ0y=QS5La?=6IH*FD
z40Rh)t;yMVRix~Fx0jX|H&hylQmKl-tv|Q^IEBS42Rm1aXRCqDvBp{R8wKE@!oL=)
z#=iB^RjfxFFs6H5XK$8Y!DI>IfGkpyXcXo%V92Qf2B98zNZRThgVc%Y*~%WUjF4t^
zENOaiCSjOt<|Y>rUu@m-Q|2@3g5`Ef>RSdvA--iqHeS3)Y6HOAq${E83NYG+D(+=)
z7zeS^18!bH4Iq&+F?tA(!_-GA%oLC7eIFM7<sD}n9fujB%+fOrE4N)7x67<NBNcKq
z?nP1E36e@>8et7D9;qDLf*WfrcIIp&W3X<!>d~V|`*;QP3Z+xqt+*dq&N0q(1@;9P
zWGY!QE7`hJEk&(IO(d*UgiqDo9OfH5m>rBjrWF?g+H)YD%`@m4*Pr1=LkBA751#D1
zn_FzRy}pI6uX;zHE{e>r@95y{#2qne%EDZ~E;ob?#0^I(hq`{U39J52TrEB_Er3B=
zWV!QS_h?!3ZxOgGY6<bn=yzYR$VW*D1O&c1itx-DDDK(ZV<l504+$hPS>+_uk1;L6
zeHl`Ix;0fbP(?ZfO0$I~1*#?@&DL|x5B4mSr@8<z$}WSJ`9B~QQSU#s)H!_t;M{Wd
z(5Iv%;zzxi3IFYd$r#GQ9lb?c2U>nELqQ%gpY{8wqx~?3Mj`_TqXKMTVOK-V)0l%V
zS7efSuS+n<k@y)3#j>-gZFvyNJ~yDU9X8)>&~KG|TVItgjd~KyW2L1IF8QMPVyhm8
z=S0x~k*<mW<FFXi0mi#0#am@ZG^6zM=j)u-vpr=NDxqmQDf_kNUiF^)Ci&IHG~++Q
z730R$?YY=&SeSn)ym?Gg`@G3#eq^51-MZg@TC?dmF0rV$(RcNl!L39DY1rH^S%O7~
z8^jOERY~FJ>Ndn&e$#~Au2Qp!ui2q8T_H^lIDq*kj)8qgLs`+$@Nw*jsq9TCDC|fq
zRc>%(a{%6QAf~wR)FR4K9G}UWgjF$z^dUW^&{=2d0^@oG4HoyiO_Hoh;jkl#VMt$O
z`7-oX*QywXe`?)pI}xk3ez#~=jEE#ZvTF`a<rx$K*=Ebh5+%TL;Jd$JiquiBpGW?g
z2VjO4XYVf<);!oHtR8?YaQuS=@^FlHRn*Fe>4r}PFe&T4r+}Q#IU7*MdoUKfd@uMS
zN51S|i45mU$X)8yZRD-M-N9%3C7b1g#=XZ%b3~v`1yrx4fYYsC-Z!bfQU^-_(ig{E
z2e0^e9GZ5Gj#sSk*2NI%C8@w0tE*v|(%u(U)irtESL>5wxm`-%0suC~T-%D&Ux1I<
zZ*6Rt|Kj$=Ll=N@#cVY^Q(wna5)=a*)5T%w^xQWt9&|)QLqA<68mq6%uEkJGBASf|
zxK!5!g<~w<XKdRdaR7v`reF{LzrOQNzI!442h=fhP)(NSgQR;OQ9aFM9QXN}Tk}>!
zBW`QTWgPx_-a*^#GMN5N1znssWFrKe5bS#N1N=0Wgm!%{yOEOG78D3Uau(6uq(i@3
z_4ZBzMBWiFS8@K!*cdfWknfIPtR{i!w~)6zHDEkvRWo976L?f8B$}IxC+~VWZt~vi
z!)-;%JdZ~YUhre~M-t(49TL-#Pw+~zeK`fqA|(kwR5h}NbZ$PDcI{Up^}bO*2usJa
z<T=kD(e`hR<pJJ&bZdfjK_DCzM-{O{T|lqo28g*7Bvp37F5<NTpvQGF?s%=(><l}c
z>mexs6z3K#-Rs9oeLfmGfUc@8`O0cIv_+oj4BsL)0VG!r2|V5qq>eN88{Tn7d&zXk
zE)z*5WCuEva6mr(#9{(JHYyP!W@Nq&RaaoL;w2K|qv^nBBh;CI0TcoVA#|cDZ`l&l
zdr!in>$ORkvT#VJa1rEQqV=HZ-FSgj5T$_sO^YMIM6=kPD!)9y<zG|Mm8@IpCq3#_
zs8uB){>YlCyV;65U^bM@CRAZHeaz{8mQwew(w?-fa6OB`)vTfG`C7k2`mOK={vVBP
znGCAOq92uV<(m}EieKX_-qB5Wjdx7ng{C4}=5c)&PD{>nLs?uspSAof^{~9P8UNUZ
z2&kWN64+K&;dLw?<^FAx&1d5PM}02mau6BFQ5Xa}e@%q`IE=C4`tEFZuYVn>=9bd<
z&YWuT`uFcq2z^2_RNrQMsoxeA)meC+znP2dIk#A;zxraY&qm9DWfRhDf{zw#D0HL?
zaY+ML|AW-e`q16y!#x|Yfhc_%J}mRV*GlJP9jq!H_p-<0==)+p(v=r|LxqY$1M|~P
zMi>}L;z1y)^OZ$jZefXw<vnfY113q?Hy@8|Jdxu&6f~As5cD&3tU>>}gizk|u{48t
zFZXt(+MIX_cSU}i3BLTK?e;j0`~u^*q_0Uj8nssVBzbUnVIOwmf;+`PSoSOT9B3uL
z(&$|w!>G){c^4QLTWLps5hATwf9;buDugXeu<||;B*?k^y6=(C`=j?~6JSJ{xP{sw
z5G<)1Y3t@*-fd#m_bby~+N39`3h)KXzU!WMZP8Q}wDSPd`aj4xpMQjduome{fFNe|
zRKqPEYg8<Xy78QP^jmr+XB>l)WX}1#02;zW2*T~j&-l7oz5ORF5V4lIp^b|7PEJn1
zR_gd~2j5e8?R@uH$(hkw=p4*?KL%t;=W#76At*jU0X^16Q2g##m4Qt*gOF_8eiZ3C
zf=tqqS%$VpjSeE|rZXMJt|eS#wGXTFysr5uMaE6rBhIqhrG;Sr=z%oV$22Nx^KW4D
z5lro=2Xj&FE<YeBzYfEHuwh?8LN{yPb`xteu7k9Fd~-1O9>hhPD#x->dS)WlN3&wz
z`0^ouOqi~sBnVA9UafvK<Z;k%_DTVKWfUh%^wb<jLdy>kA1sEEaFAX<*ozWlMuWoM
z_e6vJs*U{KKa4O*zIbT=1(7>Yh}f?>9YcuNd8timrok0&uGUVX+6ZINV_sOU=O+(e
zS|rV`?dewY4C4KBSAtSu_FWl}SLJzLpC2FOh2E90sT}UIJ@Wne^+2}t6Z88bS;W>r
zMh7u>QP;)O$%XWZ_dm(zhegYl9_tNL{`I&N2!VO5Z!JY_kz$Fue4af_-S+$vJ_-EZ
zrCu<~-)9jC1DOn)#viePP4ChCz*c+x1u{)@aOA;VzW-;}l8?x~?RuFUdkFvM@o_o%
zpsP75YTHn!#ptyy*kZer@^g|Tic5yd&^8)@Yr!<1SRE==5*F$Rd3?|)Am#x9hgH1k
z?Wk|u1QxkI-ak24QRXVt%*m7rWse$2f6r^R;d_MSZ$gY6n9kB*klv8?sWjcJ|J744
zC~6KRj)A=;F>y&4+4s`dp9ry4A7k~&qVAIqEmlLG6Dtp+^cGj70*@!Gr$l`aeBkSa
z0b6m)mvQ8wV^_uQTL*J8aSb-3KQM?b!BcAk-shzc_Kb|k&A4xBA6O*<%4Px*;<6la
z`iIW)6rWajqcFkG498ZwBh?HI)7h}>hY`WNIyF|0Nu|g>sL*Z(U_q@@6|T||(fF<q
zrmn7Ot}Lm!;vZyh;$3jbeWWd5I%K|j@X46Ta0>8zC50l&OPRjjL|F{=YN^p8>XVJ~
z5gJCPcsP`a)tru<2B~VN+{E2{W%#N`3|J+M<rU*<NW(3sh5qqEq05N*1ev5<W&(Ry
z%OUuVm8eTBGS(<^D$Hpr<Z>}hA_yygbLdMJHrmyayJRGC2m0Jphf|N3{!FJ+xtN2Y
zf#E_rg;!g{FywgI2Hw6<LD&;4GL+UV3jAMQ)r5EsAH>0yY?|@yZf%hrcCv-ie?NyV
zf*>_;t>%H3dabQdJ1-^@S;_FDJ%lwM`2%m+(`_Esh72FWc7pmpAHV;3sO~OmJ$p0x
z!O+G=1ZyBV7Lj6h$<pQPe;>8Qm6$MGJJyilsGlBs0tpAj9fMvrHcj43pJVrfW;3GP
zzqZFMQl=Ju@mZX@)QBAY_W}OvAP-X>&LZ0D$sx9;UMngHuTZ+Q3@_**`%>A*&K{@z
z$Pwoo9S++XBfv-;?*IIe^+Mi`IFX%cm089PbNOv@{?qrQ6W_OHs(0`~E)qWWFv6Q7
z8LAgo4qF(kLl#5{8Fg!nnj@oWUT;K)2^uS3v~GNH$k!w&L)`?nhD&0s8a;2pAFoCg
zZT)ad%!Jh7e7dc1_5Sp=d>q3Qy*DrTcrOS&wf4PZIdu4&qU_Q>-ByH0q&4+8u`v~Y
zSgiHSNtyWaGxO|0rof7^>)W2^jyEBkiv!{Tk5&6(pJ6WIcB4OdDVq3zU6qGQ;$;v<
z#G?;6=0mA#Uy6w^%J8n(2%|lrt34U%x;<Ini}1{RB))q_IZ{OG7f@Xda3hdEie-H8
z%*vNCOiW;%-~-X#1671;YGW2tNlGy5c9awuSYv?3GS(5bHiR5%OumZrF2KXqw(K=o
z7g!AI0rN-6Z*lblj}{UqF|~h0r&HZZMfkIg2Jz3BNl?gbN5yb~W!kQcSR6tqqkSk~
zs2<0wa@8Vc7!x1fuELPRDvBt)J{WXj8`ErOl0n6hPvl7WZo+Au(y_iprEA((ecpL1
zVz->__PttC>s8wg3bx4u<Oys_n2bZopVQ{x2F?{dEL+NYDsVR#mF;7A<Ud%AqD%Qj
zBahh=u4>j!L5j+)n}Pl(E8hQ9sYY4t`tFU1s=T{1gzbMKaYrsm18>?%`l;4Pb7!`4
zvO1`c$Zr1fRWh%a?_i3^HH%Jm-W`undSuX-#)G}Mgoc<4sNn+W@shjK!$WBy278-j
z+TKf2rwdmM8;C}5>B2YWr5I#inrp?cZ?XUH(@~7FS`XyKm5I{VKh<`9P_T(no3<YM
z(hq3MpNc$J(QDF^!4vS1H@cB5#WnyPD(@1RGfHw!MlF)X!lq}L$e$3iQi=+RhQ~7-
zXn^$Ck@-bTpVt0hEM;{_;O(o^EV>Htx;UcmOB5nY5q4MhaUB;fR`kMn;Z|u~YWsi%
z$57<MXL1O!C<`ulGw7T|boJ8D8hIpef#(@<nbru=*5-%_ygTjZGv_l5`2Oe4P3htH
zudjBf@QLvi(fF3jY(~}j-<ij{(@_c_JPfk`f#GFO(H%o8`WbeX#9|;^O@&~+JSC1*
zi)Y568)Ek*i%KqC<wN#c8Lzz=E`G=D*oP`{FD|HBYFv+3RilmAl;Or$KM*|oJf3DL
zT_I6+5?3YSnIhbYBb%^de^6hA-GtTvoRR!XNo5CA|BzErN=FO7FslSaXsA*Y(NjW8
z<R1(zj8=Zhq7|D#lwm&BKccfSD{!NU&3ZDh%?5(&i^%xd^c}>p(0<8&F~QRTlJ2hr
zGEZI`Lt%G*?_0sWpI=oFzGo7dRG9XPKYEP+;u_N}2b+(30O4B)${~7J2Ij8>g<XlX
z&6avrLiQ-BkJZ#Nz6)l4<XvrD6ar4fUh2L#C^$2o7lALRsSGSe>&{y6mJnEOZwFFo
z=*@bQ0@$;MBoPoMErwF{9M-nuh^O=5s{=XICFZjK4_j{?6=lQqjnbVWozh5mcY_kr
zNVn46!vNA93P_i9N=SorcSs{ObPYAscir!MKj(bwJZH@!{(;3}&Dz)AzsyZSa7LPG
zakqsaDcW|q->SuW$TP%}OA0To^L?6`=~vx9*bGMGZsLFYl(3w}Ztpdc!OCPkmT2(D
z+w29t)sNk#)1&@Pow~(aXn^_1S6)G2Aqc&pUK+*ymF4}a_%+Li4>!lc%pc>AcgDM%
zaVSLqO$fyn`E>PF+jgFi-B>C&FSY6)7WchM4^AjmwxstrwH%=y+{pelR<{&}_X?AQ
zY<=!lnnctRWA@t{-uVOLWkULqsBbMWkkr$KzRvtmwX_3KNO1*RizzZpq_g~lRj+h;
zb7o5fMxU)21eK5|^ylHFY~z1+rPv$Gj&QrQUEGjF&KB~`l5Bfmxx-OpjW)mh+ni)I
z{9Q+Uh>$q<XTzr%&Fa+_7W)MUkB1v}5ubCoY~esy($kkgLQJt+irwK%^#hTB^E?si
zb-|~JxUCsW1}eRyUcVXJp}Yz95j}6G*`B9|?LIwy{TSV<gR15c68l(88j?Yk9+^ok
zn`e;fX_^tGcf@^wPt2{mgH}NHc47UXU>)b~=Gh`!z<RIu#;_KX-AiYOhp2vmhdjSX
z0j{6h#Xgt)x5~#v>$j}|yFA(A?%&mN#CmXN6&_y*xoP)`*(%#M-NWYgAD8Or4j=Y8
zB*l(77_L=STCR3<HuRzZ&xEI15Y~p?>GAZ*f5wpO8GMWDl__FK%3ZPUV!Eso>Urkz
z-`khkUmN!7IRiH1A2oXrkiVJ}bC?wMgu=vq6+XvMWuiha@ER*RUb#qNbWUC;p5d>f
z?;Ua1wIe0=aT0QXw1!Tko`a+(EGyZJa#2DG*Ku3*{H6ZuwK*+Lv-p({?-9~DN0vj1
z%cVUibsqYVuU+f&2?oogw!6Cj(%_}yz1(<A9==MV0aYh2snF33kqu#XJk)+mRznJH
z^Li5LWtGNSz_;Eeum39f9Eo>9tdS%B)E>a_1ij)J$t4zK{W*2$d310ugG@@#F|0w=
zo4AgJ6d~)gp2Z~PVb=MF^~(H}Q3@JHt8%7*^AC?tvpny<rv-OCc<@4qs*Jl#f@KLe
z{GvFFaPqpmsdc8mT#yN#^$n*=w7qYoN}$r9aY0i=>MXlS@?{JP3PMIGQR&YU2+dGR
zM(mW6iGL4PE0a~rdp`uPK{!Pa2<HMsu8wR*Tq}sg4;!_(ktRhVJA`picqhvdFV{(z
zEHMVwB0G{qPzWHfeU0n^tHUG7QlY!&V^1eehjUK_mo_kC_C*^lL`lGZ)Ks9hlBa4i
zH-QX<w{R1=a39MceH>$WCio~X38j%%I8GH9qA^!fo<aFot85J8#ubqI^;dL`o71fl
z*{i_Rp|?}yw^=uk35qRhE*t%tWv)|3+YH`|JE4-)T~_TT;SbRrX(u=?9n)O~b*D~k
z$by2FkuIN7;Jas@@d6mM)Rr+R3?8o|a{rBpDbe}Z+SI4~>(8#1dl!d2?jt#sQubSH
zoidZ`^?<AQ63>CO8Q{r&^XKC@DhWQ7yjjT>Nu4so>~$8s1x;KDK~eAHBIK(*W)jvJ
zxu$S#OC}AG_`5jhK6TL4P*SgUi_stNGMH^6DUZsJ!#zoF;gS3Eo>05R)9gJPozul2
zyxsB4MZ1@S66#OStHKK6<uYfTPxFYVi9I4P=%I21iBuz#lr7Mm2e0#7gu$TtZEn44
zg0;=-v;e;sg;hf!S;|ND3P^#E6I|DB1Rn*@75G{L9mc&Q+S@-T+4etrc$_U~bdAOX
zMae8izt9>T*1iREFRqZq#-GdJz2F!=UwwdGL@+#l9QMQ!98KR>e5lOewcCxhwn<X5
zuI%{j|Mf1vX5{eJlpfwmsJHu10rJ(Sl_troR(8i?)h>mq<p$nmLq7Y0_%3a%8sN9b
zN4M+uL3oM19)E_0V^iUsP5m4@K*tmF8}qreWESL>MB5+TXxpRTDBEkA?|M|(P|LJ%
zimuP<TTJ*do@G50AZm?KWpc&Z3&|+;Z1Z{~f7><9giJ9=JdwRm4nc(cmbc9_vKk+h
zb%<AlDCe*V&zBm+jHI$xbSla>@7x`8d~8i6V*k$h-pRc?*7Jye)BU~hb%z7-7j+;q
zR$+S})(dkqbFlsK@}*SwL<ECFpt%rB5}4faDA>p9X&lB4-sGMS7ck%1fk#Ponyov#
z`6lrf-3vi0&AaD^ewACm5M$A>oga0&CPIE)ilI|6m#1E?%PrUW;=~=;>=UdhNc`6#
zumCsrLWH7c@t_T%v-LMFSna_J<LRx!<k)|*0InuYdHM?5joWav6RACv#=4r5&-anK
zO2&qtg@uEjDLm~q7Vs`q|0?p@O!6Ok-!<!ZEc2u97q?!MeQ5C>RTOcSx#L+`X|wfC
zpk9cqaBnv+jR<SUO3|w@i7{a_q)&FvqrICjhFOj>!n{Uym?r~$q>2>AMW8dI{gl_6
z51_T>#s<5s0MADS>zt={Uf;h+hFu``V%4-95s%|B7iX$b7qQnfEwjYm1hnCF7q<en
z8<t{{U{hdwRD!{TxC`#x(szQN|J}_VE2t951z-4SmN;2Vz4tc+yq%0aA2*In*H~U=
zb^;ocRZ^LUaeau28a~Y?Np>M~u<^xq-6Gm;<a7kQcckkYpS+i*#RfmCik_fn>r&%t
zo{<DBB-3xZ<DpKVcLv5?mF})xGb#_@@^60^%pJTVQuFyM<70r>^Oqpo{{L@3O#62~
z9PKqc(>e%7HP81*E5zHBgzA0vEKZaBq$pUEm2bdq$^d1!P#@&_h_rcE8WS)CM^S*}
z&*0Ooxx({ybE@*{bPccbz%Q=Qe_d0M_KN%b!Rg*j`|e)mP=VcvG3aIcgW>h4GZdkj
z&^MopeP5}k*=g;^2(|VHunjF-PgFZ8^Cl!GN=SrDzy#5WavP<7Rj!i?PpRt>#=1L_
zkz%qrWEbi4dSH{fNmem_<_G&n799-9@SDhLBg`FFtmg}@S#*PDwS+-LTtc*f2x&8W
zIkPbweSSg3&!btwKkH2EoLytlj?sl1;M?WeTG%`rhJ}VOAyERU_)#}PvLrzAp$e*1
z;#BTey2&>@bz`U`uhBhY``Zy%^02`yd-CLm%rTTCsM!{*9_Xu>o7!;ZtFaMO!G4;=
z#yo<DB)C3=T&z||L;Vy>Q@EmiC{R_(ZFAHCOAdnwNWYKr6gDMos23yz1VulO;U?kq
z%99ilS^|UmaSJfrND{EoVcaNw8YucPfuWClijZE$&Tuh@$#3kL%k;l_24uP_5&aVT
z1X8CHd=v9zKcMw0)pLC6^=U9~A1Yw8kH{JebCZ&St1|ehuv?l*Fv01w)V-qD+ilYY
zx$HU${!px<WgkAj!;Alw|L*a9rpQ;&gQE_8oeYI<o#Ld)qi__~YsFW4;rH(QGq{p$
zUWYu(Kh!cErMgN;YtLrN5IrG%U6v~C4nx0K-(?DX)veNZI;b|e;)OwH%N0JFnc?v}
z8cmkAvBLR%7iL1>3pFZ)c^>RlWqx}DSMY#KAp=w%*EWdi!0p@|%!f{7iJ#292UgkQ
zmkUG<rE~xBLmfycuH+99&+HR^#SBN7FXr2iO<9E|{&Z3m+=U9IN>h6hSC4k4T;5cH
zFTLJ2_^PCdPF>HT!k_I#RNLA{B!kZKwqy&!y*5Bcl%LnjzvdU%CY*i|l<_$G!@InF
z3~Pk@ywPNxrBEb*RYxcWA41Ij+#~Sz@bE`m*KGPUT_F+A^|JZU2IxKvp&C_Vo@{>p
zHcgrD1ODJ*-m|Hw43ySEg37{AOh&OY0J+qAqjUOHaENL*0vC3DF#a$hY~cd)Ahp{`
z=cYOc=>!@VrssxJDBuI+c%4@|5j#GVzm_X}r+@p4yO2a}X@}WX(xlDfuyoyo$Lt($
zFpz8W2=oZHz{95CnJbt)Shc`Mt68FZpRl`aO-C)b_d4we5lz%$jszs`Zgch8X>=)}
zPyuUy=x5sMNV@1iT<+hCd&KQ?(wBAvS=q2BUhoUKsJESZ#{+gA^xz)F=QVnltbgF2
zwM&h#6d$9U?QCe9eT8WkzNFn{XPc9%=z@6q)-{03=r3zV9g6mGVC7=%Tp_H#+T{2X
z*y%G(3%f5V<^#>V9z?ZpF@f!6Die7UzU@@RCg-nfXsM_)YRdXCnSNOPvH3rPMGX0W
zhMO>rP{vVE(O}DIGJ}f7@Jq|H^ZL!cX@ld#ja@?GAKsE_FHk1cO!@^u;n##Jsj%p;
zrSCH8cL@3$5sjKZ)|$m{hZd>R!bJ<Z(yQlW{k{td2a5Rm7x+IL86Eo3%jP5lK5n1x
zOz-n^@|izBZSPLx^3}uA*!I_5z=A)*nUqgqxo_|GbY?YliK^8Rdl;J`1vlXTdP%kW
zNIf@C1CZb^J=VbQ;x3YWa?-7EGjBbzWPDXS)Fp3g-ZM45sC0r@hFRlHjj0FJFE-i;
z`tbjL&@hZwLj_Od;3Zv?DRv+pM_>k)eJCzUizeJYLc;~}{MZAw>XCrK6?)2D)SOy~
zoW^;Jqe!XN>ym>R0<}=W&7<1H<K&DV8xbrgxD@-$F;T;dR+mbLMOW_P8ZQJrmr$g`
zj==4`yPj`$LUm8w#Kt1c;eLl$x!;Q)Vvscb1M^}B9wk^-He1>ZoF?qPr=7=i!vt2P
zpmU>8c51?UT5=KFViYJiqK&GA;0f<2!HK~I(xSTfC7B9F)C<4iajiCL!CE42bvZVt
z5P-a*v?;~mQJP}9LN|)`s>8O9O_6}0Vqr^>bb_-CIHA%gjzj$>WtLBS+;CpzxpFP?
zluvfOSyRDC<kk{UOIdQLIl;qJIFFlD!%$Kls&yTzr`%e<*bJ&Lgnu8R_`6e<)Y6R3
z>@Q&5oC0!tbaG$)m7MwtG=+=|52D@hK3bV11ipuaI-8}9VN)(?5I-bYKBZHOn8z5H
z+`zjfg~r|?-#i1Ra*D5FO7HmHkP+Rj%$zAnm(HU&9v`Sm4I5E(c89vTl_UQeH0xrI
z;>islX%o*jnD_dTNqRM`nA^|@rFJztBdr%T90<LQLPg)N^lSWVNXvj=m@Ve{-P+?p
zpz2`t{^vIVe`I`apuNh0FIU7fS%llpMlG^l%<Whx-r*pc(do3eMSg<e=H^Enxrl-}
zA7VNQZ*7p|;X+}F?=Q_xzuoWn(!a)5tPiffvBycUEOikVQQn)bycE0%eaOsYlj0F6
zKnUTr8XC&mw3FcULkS&~OXD=oZ>q{{3l#65tQ7+t>la0)6pXUG1Q$~Klff^4YA<nA
zr^P!iJFyY&4ifcxbadhwsS~Hl-z-j3(b%tETLqzHNs#YZE^~!ou0PUj{!-qMi<XL;
z)JF^QUMb`pU0PtzRE$0y?Q*k&oF}D<E8^f^F;fpG%>a+zSIP^ZcC{R?q(lDCkcA)1
z{1vQ9e*$ts0g%9Ec80nup=e_@F}|=AzBTpBhTv2LDm6p@HB7_<@{YkYP-l)@cw*c~
zY4(%kZ&dq*=g&h5I+6A?B<?+&mn-b$Ez|oPepRtCNAB&AIF2((ms-m&XQcxt8(q16
zSBOk|bCtfTe*4+=dyEMqk@ZgxXGfIQCsOCY-yn<;B+;B(mQT?U^l;-CUhPLg_-h80
zn#9w+XYH1e7Ehf-aDlCS^goxadeT4e+BTA9F4C>osb}-nMrV~z3Sa!zIt0!XuJ5NU
zh*fqdg*&`90@?X_d?|VZnoOsthO3BovUHC-o*|rl>h7VXoIn8gRk(0e)B{ppZ7%Dy
zx}@m=)$d#JFCe!+OHeiTTAQ?Za;3rr|6y%^$Z^|70i8o5s0%?uPs$g~yA-c+&IjfM
zu#pDmEDcTm>;9GUr>PdFd0DZe5vmrixE3b>pkSAGLzMBWqunbJrV}L(=C^jAaz8)9
zV6TCXA-K^(HZo1qvkN0AS8To2L?2DT_4Sa=nosf3cxE$10I?Me2Y;)}W*Tqmei8z@
zp%m)YaDIb)=F8o^KTcyoYk~+iTirp%%Ss$9MeD)3g~z~Y^^Ez({!yCK#bb*YLlSo;
z$vK%9It-KT6;k1n?1>{^QcTFs12lRwYl;3lCn>4s9Yt6~_9RQ~L4OMaUQE!|+Wb?3
zRrRd&$KVs;%&c)xc-?p)QGqd;J#ZZ3)=B(`KN3@zyWoU>+D<yf;!D8`@6^75e+71O
zup=<r1hS{!8gj+UyCcA1tiTmSSCOEKD^1b4n^Q)%#)!a>{UXNU0+Xg9xTj)_mius^
zm<<@Du>^UG?Kl^Rdp#s$F+5NyPMC2nE3r##ot<Jll5m~8gB0Zxq}K;*MH1@O&_k7>
z2<LDhi=#w>E>OrOAwv#*6XnP(i-N~N^-Ah@KpLm%UMZO^n+v-~FX|F5KvwH<aY2<r
z9G5nOmJ(XH2HK^Go|I~z_Qo?G&$~VO6XbZmHCkjxiXESw)$FNe3RIP=cHNP}Gyxt>
zoYK;4JO>W(;SM%<@4Fz8P;HOf*N5m8sX1`E)|^0eRq-3%l=f2jBF*%NdW9};UQ=gB
zS3!rrcZ`rEG$nq32O2h+Bm8uAE7@TFM7I3Xzd0oITtq`osBgbN3oqMi_D9?vW1$1;
zZY&N*mZ-n3JmzwT{XZ~V)aQk2S(XoXner4pt@w0<8oKdp9K$J*p|aued0CGdkwwmo
z>hZ4`e0NIgQp4y*GG~F<x=-ke@8rIW^+`mP-KlbFRtPw<Zyr;BY?_M1mmTlb{)1!o
zH;b{e_v{DZXwZ)oia!$e-;ODg9!08*n+@YKc{~}rl;8ZuP2(^rkVfqK0n`eWgXHuA
zx8s^2v!8Y5C1m-AiN?vU&S;K~^iQtZ5JT{TJ)n2PNwh8|?JmI}*o7i;I^+9qv4GG~
z?Q4ZLT^IerMrNk(M#7$DH_IP*)t^}1Q1LdeS?Z61ns|!B9K-k~Cz?rbX7g@rzhw^E
zP`c_g1%0bFZc`i2<gYIU`ZENXEfw^vbVR>&Sq*zX4#Y>E@nDI$n04*C+i31-)P?%m
zByEa%e;VD3Ylur|tXQm`xtb(ql-uPC!l6m9EcUFJ9G8u&fATqp`n=o94PjKv_#AL1
z^QMz?e=J9y{O-#2=!QMy-Tft@4xgo^42Mu~<T)Mf_srSfzE=l|@d7wX-J(eeekVXr
ztS5_J^{R@)K<uXmi$9ZlZ^~EmqzTIPhdp`qMBu{!WHUGjl}hVHeP<#ijoJ%h7iDzB
zQSYNY$okmmbV9b=W-IvOrL1zmQ&iG&j7Tr~I?DaygI85Q{b0LI)v|WWWr+gyL~|(0
z4eudy-!3e<etgz;ybhuW{dIvQinM`l(;xz$OXoftK^-VpZ0c`3eDbFw0(O03O-i6s
zEEOE0T{IM<Ql!%OdEg!gJN;-UYWv&PVzmkXgg+$mkQeTSS|lK{$!YyviCRt`!hLSx
zXMTGH*!tmAb=6AgiEChdGuy!XVy6xi=rby{q2I2)VO;>}mRP2ssf6F|*AGyq{^$`~
zp|eJZg}zrk&+~e!nh!YHY<?OBEdgN&9$PE>_wPlV+b;yZGT%$aP)O7`8a8gCLODJH
zYv#y4WMh0E!X6NhyK9d#Nel|MQOmWFbL2E^5b}JfXX=ana#o1GJup?BEjmvU(7af+
zF?Fd6SJ~w|%jh8vHubJd`FD})*4hU^&BEZ#yA@9aMCa`YiNQE``TJ{nky?HFq%io`
zgAA`@U&#Ff<`X`YykpTSdtAN0YDl40>2r<);6JVBeT>owsg752My4bJ4vEnNZxN}P
z;NH3`qy_!?$!SXNx;B_D<eIg;LRK*Q=E=28)k9+Rep`&HT(?5GSheHFYLq?c2D{0*
z_OAuE(|M_Lt-8sEr2jmY{_n3z|4#pUXOEa0sb8o<%S^rLAeNaaCd6+u<>v1XU>S5+
z6Y@rOF|2xPwwnSwYBUVCc=U)}<vLQ`rBKw3mfoomWWTL@8K^}PF@#>xp`SHD_57%Z
z;IhA04(r*^myU-Ev4?^I>)eG_DkuvvH5kjSo5u&+%O*UjMH;>bmz1JCD3>lfJe*X6
zs{pCSG7>;GwRTQ2jTFyfKkxTRQ{VJ-hzj~r!-=^W2mgM4g(pNVYY6w=_2*(1O(^!s
zOvJWw_gHtgRJbjU#_4Jc;jbvKpOvu@Y7MHAPHu%*#(UcYiI9BR2<<P18S2N%!^Ab_
zwmcHm@@Y#U6nHFqDLiII;1cjI4d>GoDrrM6P6n!FG47L+T_}Z=K?8g=vK*#qk2ge-
z+M^J+{x3OnSfrTEomP>2Paz%~mai2+e<jllf%jmisf9@8(#J+nf*asrGLq0}5G1?<
zl0vavXWZr$r{*SScC4ig9O)VN{PU!|Hhi>9qpOLboHVvg<WK3uj!MjyK@<`J`tl*2
zuG`_$B}ngrtb)?Nr<%?dt123h!Vo=hgeXL~aTi3K*TotcuhNlLbJNW?f5rcH%8^ZL
zM721CmvRR%rY3ON6ugw<!3;HRnd;x85?VNFp<2!lJ1U}PF+ErNV_Qlrs<a32U#@jF
zK!;as*>|ggm3nDi&7sA^L)l=n0D%Z>Qimv>NO(A>LG|w=a6vqlj|QO9&6pd<SP_g}
zR_&sJxJ)v~(@hEd?q%DF3|1XaiHa)&Y{EZUWEHwwN~8R=wCueDpg=!SglsUiVnVJJ
zyyZs$XCm~bdc<@dV(`gxU}wD?!q-lKl$jCSP)jQpDG~UjZz`RpVCe&2(^{$31z)vU
zx>ur>+u-d_@n#8!S7y38yUlJ23`%l<s-LQdhQ~&}-faomkZ7>Kolp|^g~*mbA^a}T
z@4Dd_5v%F!V?*HlmFja~EpES$Y7Sh_-Y_wH6KLSGZpEu%JsV&3k<;#W%9rCj0C#nV
z8ZCy36krPOv<2Q168hFf@|CrF*KmG%c^-O>9=|{fLqx&R>@Ils>a|BqtB1p&Gg=hZ
z)z;&bbGH;eLw9i8;i9H9PSU`Hv7i2Cx2bMrk#mW>+z6rY4w%M$f7~A2yw}<8do>M~
zmK}Q!T?+||7xdVwSU1JZLqNtLxl~JXUZbqhcQ4^w){rs-bFUlKDn7`Y0vH9mREYuA
zE;>Ppp@ibiq=r$=SvJpZnL$h>vpX@#s@)2s8@=1oH*tTQ^2gy4KG(-zO1YX)|73*(
zQuT~G!CZQ8&5UB|mbOW__`*|Tk?DR_;<3M}ELt{X;$H2=j>5UPwwD$4CoB>Z7dOJk
z*8#p)S})R}?BjP%2h&xUl;UK<e~rGe8I(D;aY9zgHuT|A={uF}mdE}aHkUK^-kvT#
zQZ_ojn0(^7j6Um7$0iftIb_a~^p6K(@T@<{_GeF;+iukO2_Fs$J)+!u?Xhi3(>0vz
zzih*9PpzX46TFJbo0>_5<Qu(}5C7HZ09<q{uq?*`T(GnH_}&H&!#$bbv&_QAJ$LrS
z`STi5=`S2bXhO`Fv#Xh6W88RYQ)bk|bS@AZAai0%hH0~CU4=HBuwa|If2^}0eS#gS
z#EfktNwE_sY92_Mp>4epDN;lZ+5VvSno*M17`V{wmTJoYH9ty-E84|V=J`h<<)_&S
z%R>X9E`J8--lpu*xvu=G_tpb%z@#+Oe=BxM1`q?{p5LHOOS=r9jtz?cq8_<@Q`Li)
z`@Jz8>+6vUz_bg?6E~u+`qIF^$UaQH&Y#aVs$3CP0jQebKp)93Jl12~N&HV@A3V4I
zS|gL|mg@(bVmGCzbQvZGx6*%sbVs5%$f4Rql1gzc6XIc=z>)Rln{@|+FJgn1T>n~f
z;c1+Uhljw^hVvx)B%5!}A1&~jk*Y+c6l=dg{H;ofqLWb1!wB3&H3AQYq`;|Qd-zM*
z?`+-g;lBM!ihX|~yPm*Im+!=}9WKy49g2$kp(g}chhA?Q+c;4%xjr@mCsscG{a!HJ
zNFu6`-{Bk!s2|F}5F??SDE-9{oDZkd&$xu+LWJ%JP}O_H!cbXMSWzqmnC+DV;wHv9
zk>wjy(>EdPFpYtW7!duC8HWR$>zh#QZLWl&(X2#8$pP5}`Z;UyT0$O@&{YRiC<0g>
zN3`xuD`!AB5;+$Y4++x|FkX*d2Qn9)01=h}benQTk=?c8Kr<Nz(#_QsZ$NZQU60AI
zc}3-WSduL2tG!@cc>j&R%ztN?M5b_qx*3Pe-|LGmTWdxCekoG<8tt|>Ru(S~(XY3P
zf=^;Kz3P{hLs1(F6#0ZJrcC96z|`!xrqUbn5xxcDFwuvvu9)x>K_^m3C=e#-6tSEy
ziPnl3c_PI{b#w5igB4(PM>Jm)sdauBdLEJm!U1GlrRAI^oRFCPX@I9wN_<n*$C)t9
z{o>EV_{xpug^UWBvlUCWV>!<70c%x?si~}b!Qc7p8FgSMX{L}&XGT)b*I97y;3l#=
z?e+!!veP=;97%Rhg`yUI=PS3Jv;0sydB!1gUfF`lrjaJ<@@_Bu1^?6Q{ddZDIA_<^
zf@Nea1ZFMarpl7O1=r~*@R1)xQf{j_Uvd)pTvvra=k{^h+YCV;f;W}72S3u5im<PP
zj;X}mzO;HDQ7F%W#H46ix2MrPP8M1SC`Cbh$)Hb=<tiq{84eB|vU5+#<>4CiZ+s4S
z%!IB+hXez0#Q=<`GQZva@zzAU(uZ4ieT|zLA+l23$)eBpb&|nKgVUR}x85Qq7Xrx(
z?1pmW;~ry6=&4CTM@rvCZM}*jIEyAv_2j-(eXI!gs1U1O)GKj9gl+cX#tB<o1)5{s
z<l*T_ooDct9E>`xQBVs7lXg7Zl*l|1ktqi~*Tn(7VDvh4%|U8^|57+Jdu!F6$wvBK
zW;9hiZ1yIUsTm*L!cpl1s9T!xTxpPQ1x}#RJwai-%tKREoYK|I77iNKQWv#iM8e%_
zbo<WD2F;z5^Kvby2$filYX9cb&pjTiZCDrT34aCX@TN^;;K1nLi+OYS3cUKumk3;!
z?sMx}O-{o(Q;5*xicHk|&Eb!mMg$K2i{<L}#!%=zyMP)lx(pRM?k?e8vmy`-+B<Is
zdk})xm~GG`iohZ7#}#j>MwNVvN0HWAzy~8e2*?_g&1^E&I5qN3-RHx@5<Gt*TVyBq
zTMjmpW4OKCqhXB-Fuo<oO`41_3I8vg5bPu6>SpeJAc5-C{&L>QC#ln7WI7Eje2ps&
zb(8g|R9r^HuPC}*!f|B-NlD>cgMBrtNV(R_W^GwSLks$&iMI4id5cDg5rC}eZsJ9N
z<DgO9!9rp}!W+Y**%T%E@R=}@NrS5wT#n1Lidm`-A4(Cmx!$1>uY{-2Op0an(+N=#
zU1AtNL|CO3cf$c|k??DF>!drbm|4&UHjWj|%JptYU^0-z1`6}xZVbvte?U>D(H=^F
z^RAKl>z5<k8#>zi)8$50_>50?^T0_ioGM?k^J5DI^2s@+b&MJhFHcHGt}jf@9YG`7
z_ovnH?;7xp7MNujDHi$sOAGv%1zWfFPQ5}IqD)vNsZsyqR2X(1rxlkjbX0^Pt;H;N
ziQ}pO*KrEbUn88Op;vb<pZKyC+eN@Zn)JzncPAgwQ;r$sF2*&vPqCKpiYCH|{wIzB
zCe+ldbPr3`Nm^REKq0Q@k(9?uqf=)eeD2!^LhDsqLTWQdouIVn8VkOM7m=kN_>JQL
z3{y(aouxkFzqWGt3Ue0STg03ud^d;#N+E2ts3j_2zgt&poUi!@z~gfXAv(j1Xq{&6
z33lK`9e~(>ozE-v2C-Y;f8;jj0S!u|tiAh_#to*jk(j-T@q3vef8rR&Hp=CZJXk5c
zXoN)4r*KAka=y=3M2gTg%bKyKv6me1{vdnW`<<9i$81||q>v*1!5Wapmg=2JD7?(G
zE|$t)4JfRYflcY%_c%AN$`TG0toqi)+dj%=!;RfIk_?FiEzsIlFD)i?LIP~4oH<tZ
zy%9oUh=Vd(z0S<36mFD?zfGL0todO>o^WY5WwH{E7RxBnmwzID8%&@qtTq-ADdSu2
zJpMEI>e_2K`OI$X(N`fT;B}514GGQXs_*!k6>C*((oX~07f&h*%>+i#Y7ZCSCP@4s
z3ifx6ew8z6?P8$HWcIGEu=p_DcJzC8ctUhyU1;6S)6p=udG1hzr1#H#b}mrv=AHd&
zo=GacZ+@Zai?l+j8Pm&hf?jL}w<TGX{ta)m<_}!S%6E-N3;b3S+2X1vD~$q&dotsO
zjb(1T>Tv+AQd3fANgF^!edJ#=^Pt@&EjOoMNxkpqzw@cLRFQ3|tMGW=nCTj5DcOHn
z<}a7O@31jVo4t5#y6;oMuar3($_msh{c{6GMh@Qpy3k?{4EG2R(4NkgN4uI#7uS2@
z_}1ikwBR<kU-v<$Wo_SX^`}4X_0h^Gt!+&#8Gk&F?YIRWF11K{ljB2gsVJeuQxTcY
zOXZJg!ue3K@I;RPXyn9P{~;^L(Biv{3G|Wzw_l+-t=_r6HM&E#oc?K}Rubg(Xbm8G
zT!?x5cjJVz5zu|JHzv@}Wi!wb)?y%5`?bohb!WKudAGD-2aMQ;sJBdBFa=&}B85|O
zcOoU?<z=#JoiX?*l$i69U$v9!Zl$II;)J&DMVtgDLZ=~DUo>1c^FU2PsTfc7BZWzw
z<eCPg;k`X@4ZMr+h+Crx{i96$Pdrt!Im8+E?3?vCObfIqkgOj}gDyQ6wbW)`J$p0X
zIw8+{pBxgxwiBw#v(h$nHFH*Yt;UK@`!~(E0n}-_rb4$IGEu;0z*G4oJCard#z1n<
z-njIEL6r?#0!We9+TU0tT?%fn$qpwo6{1qqVbm*;`c@Oi5EX_@67Fo&kh0LwBtH3M
z-JJXxcTQO%R*v9HPl&*5pG3tyWHL^=TspRutDG>U=~|vVOJ%KDPloRo1oVBmD@M=B
zQ2<xiquET0;H)Hi<9vU4Zfm2GBUWa(lJT>|?q$6reyS}tref9YG!9m{=`}(>JX_wm
znW^`l2M`o(%wiy2QQ~(}Lk4fj>8K>+;EEptIFH^aYWjEI)>Cn@;janz?YuUg`!D6~
z-J&@7VG8{|zxm5!mm30(8LAU<j|@Xt*n0j{qS<pcc~6_tMoQM`ivSrKDET(I=|plr
z*x%dfA_b-AvAjkbE9gfp+?UfV*EmiZV?a4S(xIgwkJ>*xGK!6dMS)LzP+QjLRxQ$-
zYG<pjew{yt@arNdSGu1Ig;G}N1DDh1Tq_cv>*ebJ*E6bnSn&+LxN%NwN*6-dHUh@0
z&0#=y{{d)XC!At2`|&QE{O$(n?$ss}45?2J`Ujvz&nu#SYT1CQYLA1UF>1r|)Q5Wl
z8JGgYLP^r`Ui3rR)<WAr*l@YSLNI77n^qpf^NkRH*NmE!e(?K#uW8$GmwZeZe4`9b
zYmq5fZ!Gu=@H4W+12R;e!3NXe_xYHPV5>JV*!6a4bv!0}VNOtZnEda6sbGOSRN=kf
z;q(tO%hTb)R!>t27m11n&^M?^vDisI4AQte`1mB`3%FfqUt&SP+A44mK{*wM7L<Mj
zXlXRS0?=scJYw?WZl4_+JAIGeAX28AXfd#DRvO;$-QC4DM)W|yUsMzEm%QJyn9BDS
zw2I2Q-=Wke!AzrwzcdAcrY&MLQ<&Zr@!JPAHu!$X;PWLbR!bSdlP^+}JC5bpQqXCp
zGBxZw4A7-}Wn_aIBHCcDYCDnB6w9lZwV?ackg)TO<&z1E!6o70R9Or+9~W2TcY$i#
zx#C1XDr56M7xYAFZ{luX=O>0T`3eE(!bfM-ug*5|ly3}>#uL90$T^^Ld7rGxKXsk5
z_pa?-5e1Y?_|t;j*Z#`KK>SfGPe6F2C94u$1bC}I9R2-Ht_5Sa)Q-4B-XpjFrmD@z
za-Qb5nL`88Lkg9nAt%l2`FmBgCR#z~c#5x1@r9FXeG>zN9M0in_!AP|-+w|0;XRLA
zsM}^T{C4u%cNQe(<0hu|uf`E_y7Iu<8Fd`3Z^O5YaaY{wa&fCrK^amxQbSg4xP~D@
zXLvT%6Ivi9NP^K~_VTDmJa0I#ObxEh{dhcRf1ceoSL(z*dN1Sg$NixN<q5c+J-?)$
zfEs0AF6ugsD3I;Xr_70d;?Dz++4^*F);DP?-M<KEULj2<vnzp~C(E9n*VzyP!rPy+
zUg_=ow6X8Cu5m#5?N<{K5D>>KroVM`yqaDO+c4NUH~7;Tm{~ktHq-FQ{q4uj_Gx6A
zLW2|(1xjQlnqQ8r@xOvD+T|yV>Vnj_MGt=->J&bK>LtN{(d8U+^Z+!a;eTE^Shz!R
z<N$TD@$7;Sf_xh1r0cG2PHO2C<J7Jt2{+c$tLUbIyBIe(s#iS&el``3@>{h*kphg2
z%2#_61-g%2pWIN~vuAvtgUrWD&6B_;L%%y0*L_mfE1<!CnTfML4Qn0VX#;Uo^0t%N
z+;WD^PKtmOnD_7$qdC-BE8!F$KRJ7cN?tD<N?Kqfx%csU6vMF5%@=4AxGO1=cwE3L
z%4~Kne`&T~EK}#~fV$Be@TK2wU_QEd^eVh(e_0&O(+Fo_dQY-{bHWuGj>Tk3ZOX7-
z;;jxMA6ERb;eR@F)73QFF3d}r|L*Ey69)~H`t+!l;pVV0c>3;VgZI&L617LCWy6+q
z+vLZF0wZB}a>twBJ-w(0D=aB&d5y+<nn&N<o!K~bC1a#&oAoR%Z+5Q~?mFP)R4`>5
z8f-UpMiTtSAQ%5P-uTb=lR2pEul#s>e>?YYzGvtZp!U0E3|q(b{Y=FA4-<7)_Q!g8
z>LmmfkMQQyQ7!^os|F@V|K8b|_zvRq1b3{KEg}n2PMJbI>loDZ4<tcTQ;H&i$bK=C
z^8S_2j3085;2+{*jgSuHBI=7@cW+PqSiZoO$X%u4>Ld1&j6DsbQE_2j1KuCzrJf#_
zbDvapwiP9!QVxc4PQBEymaR7=H<`+l;B@zfl0r><wvg#s*}y8t<WTsjRA6MSGAo2&
zjo2xA7<P9*KR;81(d5<z6>o?sVDCxVrM!o33CU(czJVGF-wPxSy1K!jpIZH{%i&w1
zLBsH6|5O<Vk3_y>wdd(AVMbI7V*?x0gDWg>rL^TX<huaXO(ms(#gkn`dqZJ7j~irA
z|AKHCDe`MeA4jm&G>6-VaL_SvgJtikT`!~Okcy0CGF$_53}`9D6TVWR!5D7M#&;=x
zh-?WCzE|Q7j;G#fjAa@O=r;vvF<+i;H!$YpKW_aFJGkG^6+9+bF(=qb8fBCKgQnvs
zo`$#u1z70PuqEJVI)h$7BEz_^%^at;Rp3HN^>40hjjJ=M>e|=Is?}|m5ncC#-%%u4
z0f0YIn5X@`N4u~MzFX;7c2{E8WMC{+cQ-hsQ1ur}2wL{u4${NGYqaprdrabr$yP|U
zPN7K9WZT5gnSorZ?`>vD$XTAz0{Z!X{R2WPqOb~2R-TLUWl_mIUms70Hv=TVLqVho
zUFgw#h4UTGe!=8t?XMhPSK!|<(Jb=Nv|A(;F!O-77p~5-`Zw62Xm78qp4XpHH1b1`
ztudCHJXx`+CHhJgb<zR0NRocfIg%|)F!x(P*HCGp87iANe8|bPR<pyhT%iJXGbHY4
zWEKml7uYUd%v_Z#_HwV{)>Xd=sK=v@!c~ubZv$`OB`?|KNSv(L0f2y@)9M@v;3P3W
zoMuN@S465P<Fzq>MxTFrcC53ypj`%7O+Mj0>Ok#`&+}#WP~%RIFc9p|A!6aIwoe+J
zRR&$A_hSL&3!|8|Qs15rKZ<+)OLxy>ra;%URYH6$j{ocPyu6QdzsxBuu`n(gCEUMQ
zU44lpYB~nwrMuC)Ult_?<^7DLTqNQH7J{bCdaals{GAgQ14TH<4-y^-Un#@oKaZqF
zb)5|wcAXu~R}-?3`4<JRo{LBxPk-+rQ&!v1@}gNHKwEhxN9xKhQGe0>;hJe_RD8Q3
z2qSh)ed<>wBJ=!ztZzOdVu10D504_~VH6$BX|`VY>z!$o9aEK7P5v7?DVJ=&IJ=db
z69xZwm|+-%jAC~5pYAVn51Kc0mHBmBNa6bJ)$ZTsw(1gpt!EE%_#uzEC;#eTzD=@t
zPmsVb`S)F?LRviKT@cw~<B?*p&&gH4u3pZnZ<+j&0G5Eif%Zt_J9oOgWq|ol&m6)+
zvc%dvV59J$D@Xcu$6-4AbhjPZ{7q;WF&3HTD0NJV>n48<RKh(NPrWNx7#llhEkU&k
z-;+?EJKAm>FY(B{C*|^?t7xuKaZ)L-b+!{7tyMbE&oiN+>DTAlEPqSiV3+}7NMJy6
zxj*>);;9x7V;f?3ORcb)7R|b0FaH0XWdLsZ9hhb=E}|gSa6Q_^r?y)Eo-x)n(9D=e
zgW^95p4vixkHVYouKi#xP}M?5o1joK9%6F9_T(gIR5S^e)TD8%=aGPEWUErY37d?3
zbbB70S&f{@WBJ?g5Yi^qA-Fd==O}j-W@g|34HP?dYol8kNm=j~4fU)q2Ti)UL_2JM
zT^z0_k|-cSEmv5zVzF{Nv*^uECSPOxt7E4@pQY#X9@$p!eUt|x^{>AQ0NY@4SneHX
zwV4jQi0d0H!BFIxR1vW1Y5)-&;ULCH;#!A)b2Qt>N_}pAoD(?yB(8O%G_M0KnMc%<
zDTaC;oF_YCpV!vPB#6S`o=Bw_ySf5dEBZmdWCqnA1#fIezr7zG_B$4UU;ipGhM9ei
zD*(aw=MoecLZC;Hi>X_JL#LAl)Z|hM3lRbUNlp)y1?X+NH2y-|6A1A~&B1^~#K&j~
zM~fN*T?gQK*^MJNFFsjw8JZ1*+Wuyg`WuOc1xIp~Pbs{^MTG9@P%8}s)a)t|xYW8g
z-Kd;hk358LwTI40cly(&;M?*D$UP#T5@ikc0BWW|HP<(;7V&b4Sdc_TqTB4eGw@-~
zHA;XUx~<GgjS}jr8@<b~$1T4P%(uV6fRj?|meZfCRSez-%lu;x&MPlKe+}gPTco&E
zFZZnVAfj@uI(JNym`ZW6ectG#>o9C>Fkc<99{mK1EmNQjdn2o;F=5maD^P+~VmY9e
z7aQ>GH>X{tVjUB`1eaa_S94sc*A=Wyw+qM+^W?AgFA=dHXs?w+nXVEj1*1%TGo-_(
zZZ|l8AYakaz9px`2@4L5aN{d(SD5_HU-9Wuj`bH2d3U{G<9F?1Lw?yBln`vaU+hag
z&%sX*7qWUU`a9ynRBVX9EF>kD9>mK`TYaJon_;W8-``rlJzNap>QWHME;fD}Io9@f
zKNqr}`%NSy;r;i3iJJaEy*|tAm8aL4+w)>Al-**3xEhVli_2^>UYlzN?S!UBSASnh
zIw4aTDyfgT{fuRsw+n!d=bnO#^OXh%PtINfCR&rCgcm}{_7Mg3SI*-Hy#3>KaZ4Pu
z*Q~l(g%^qe8<y1bl_m`3WpNU6+~i_oFfRG)x4HTS_5CPlO)n_ijIrkC*EL-;sVoGR
zLMk!;k?%dO{Cg4Sifh)(p??>@`bakD3`c6|kE!&|HkOs<m(d@LM~z9;0cao$S_B3k
zDToUo^TK_m3fi24U%sC-^|+t0CUm^<jDKWBpZc_@MoBAgUS;x=sKc;6^;H`ciP8!Q
zg@o4*n(;4}oKWocZs&KUQU}7dQAN9>Bz7hz2;X^&CYA0n#S{TKT>+2vNHm(`pZcgl
zQ?5fmu(b11^DJ<v7PbVr+!ai@e)6N)%2!tIs(KDvs4|f4@piiE{c=#oA-n#Ik^SHZ
z)Nydw$oioXu1A56xccJyls!{mrp{8a6c5#e*|a*OWrdk;Xe2ktsgN@0MV>{g_{ZmY
zd;Q}KUR%be>&4vg_Sa)lwGD4%F8&dU0&FyzGofGpPz+I*42~36x0yQ+HSQ^RQ*mXI
z)JKw7TMMM!QjdQ^HeL2&F|?f3<gjihhP2Wd$ke%>JqsDQXz|$!xH;ih`Nl`86L1#z
z))?kl7<BO$Icfd7m4}2y4{!wU_8-`yqp4*Hwcr!JmzTqAdx)f3=>5;8{J;D1Kc90X
zaDA9AJv+EV-w&?v$jCTJT*M^4I06ovzO%QEn?d7<xTNKn=r~sNr|{Mjslle0pai-v
z;Tqx4PlQGL6V!mo=Z9!d4-`}!9bnG#6#>{@5V25RXMy1*36awcG{Qo8z^G{IaGPJi
zVber7$nNs*k^N8UWL%hgyRpu~xHm~C0@4;7^=k@{n4p($a_L!ovQ*cz16$X!QSmIE
zal$T%Q8!hO5shfrb;?sitl+gUmZCtsrRWB73G$LRaor^a`vBwcme%1DN(&ylF3cR=
zDsfK2R-9+RNHKFrS`wx~3?bMqW}9MOPP77e=ImcX{`Z&G)~rqqq6`q_?|dx9?=yAb
ze}m25u!32j`LSPGGzC{;y`ZwV%kcBRy)Nk7AOzxx!BnJ7_NiV&=COCi%So76n53!W
zUMyjcsP4l7B#5Nb3@1yRwO9X~r&$V=%6r|Nz48aZdH#x)#gZb=WID9PJoFDWFhK7p
z@e5qpXv`lgYC6jc<T2&gpSh2~m3PQ~V@-u@=uJIT4br$Ckz#Ih+zCsOuKLtc7ads0
zXRCEFj_p+*dAOP(#?v7kEw2FczQ+ue&ngx3m6rjm-CEVsP%L1!7UWoX`U!qo?Z@PI
zOMK_mJSyZhta?CRyJWuM%=rE<xqX*@-wBVJ<`;Hg)S$*?(;`{E1Ek18wEHxcKL3$l
zGhJL4X1LRCE{J-ceE{qaaUhl@$JCqjJy&!j%hM3#+!BG4&O87kZsXsrISHB_G7r7;
z<f@J!84JmQ%e!e5J(2yX=H8-J;zU$?p4;`3FOB$+A<rxTE=CD4=7>dyNV-o1bZ#Bm
z-+{(T@sph7{M^JyFn(=%fVgh`4LiGWUo|=sxOOJHg0(Um?WCPM@0(ztZ(i;=)L6$G
zxi_b4j!ujZb+!kw(#58^>kYP(9F}qp@p_hA#I-+!DLjoq5&1QmPpuv)@CeETjB3RV
z2Qx}vvkHU<7hzU27-u@bS~~9<JHy7KHXT<ynewQN5OT6FtbXjBT$j6@ZB;bhiQD|r
zk{ymiO0x#g3}+83J>I3#Ym;JR&Jls!rOLgqN4!;R%XZ^|l&knPMp*+a%nIGgyic>8
zQCrOH|7-3AoZ-&@IKu&<9_R*%7QXo}I|tY-IHuY0C1xxs)bg|Nvm~p|AwNIX;>>ch
zGocn?(#|*>vj~2R_so}zN0&?U7>D_{{H0KP{O(;qSq{02vLwprljxi~jZtfGI&sEo
zdNx0hMK*hz_tCi%HTd;VSD4>zy+rBPx7MFw<=%ZS^#n}ug|b*d1C0H0dQY&pGP`Mu
z0lvcfaUmu(D#61Kkg5C%cw}m^fW$z4-Bya=O=D5-87z?g_nI7Xx7|^_qFWL({t}vJ
zN$a~r>Bk4IDLa%etJ|YBv9Qy%wmZR<*M%I&qIm6=`;vUN3s{Ih2wQ+svm`S9&u?|E
z!@uFvRXQ{L?^OG>G|6Rgo{0ZN(BzHddP7pDW#l4D$D^Baxp7<dbfeq68_aqhqmTno
zZUe{esE+o0+wJLx1dePWm8v7Z&Y?beC*fO#;{}p3kS_2q40d%sUtgn<*fY9iwb;R8
zul(1%|9^S%V|}_=^9Aqk+{{F6TyjvD_5a!H&UxM74z0yLQvI3~+=EAEQa>G}aq&Zb
zmT#8n_F+=b&VNVBqmj|Pv16BswRM3WRr7{t3Q|lPT~BLsY?Mc%A?gyCC@me_0}i=o
zY(s$kX7Z2@xh4H;Ns`_pIYuy$c!`W68uYOvyr*;XoVlkO6Eyv&?4b(KXFj)+Q%K=b
z|AI4+0|f$4142B^DR?dhID_sC1h5QZo(eeKZtz*g7*6f@Crx}G?BT5I3VE^sgG+&W
z8F^Wb6qc1dMhByzyNbjK7Eh9;${dnKA%|I+Bq8Sc0bYC&@6)VkJ63xaThzy-WK-p|
z_`-L2vGg<*OY|+3sO~-9OI*|oY*(r{2C3XcnRkYpx=`ic0ZLxtGtLwJC=D4sCUaW^
zyzP`@aFR5i?zTA)J!%or-DPp6oSz@>=a=(|o8Y?%SKdTmdy=wlPyb_uUY@97MGA-!
zi7#wk_fs`q4F}wZjpl4_ciru0T+~)m@fS)w&E@HbB&aVm`LXn%UPC$5y?zu@NEaZL
z30c6U6e-HHTS^8`YOX)RkexS*Dj6&!nTufwH{F&{si;>BWm;*~1F=Fj;&CK)Sbq^{
zp_4C8Q7us--j5-GebxMvyI!3l1Equqm*a{}2fQt6-QQPe;l{HzV_Om0=NTTw0HIs1
zBvq<YdPl|YFh}1WVaKjmn{5?i7Bk^W(3uZ?bV;F?O9#?8leNW1oKe;QO?6k((7@~N
z1}p)c98T@@&vWJP0Y^1gqr&SNQ_MWhHt#w)beS5atChv)wclaTHSY<*K3W@(udo|x
zrAb#l24(WQ;K~b2MOB^MI(RmIykoa~CbJwN|1Iwg@{I_)hw}Y2k4-SYUjx%%C`9(u
z1Jvzp@oqN9xXo_5;NB?$e)R>CGV-=Hne?*&uD+171p7TGX&UN#^-X&(I}*+0?o?vT
znLP3n8Gk@&^eO$eg?sym{;;U`fi!2Dk3l(~_YIq2D-=~nJxzczF88%7@6+XO#ay|3
zpRfu_{~}CI((QOdaO16Pu6C7^@Jog@up5s{d2J{OUXSyfj;O!FbC8_upBG+VTb^ET
zx3&k;>UhG3E-VL2?TPmRZc_#)EY0+p+VgaI9Ma>w3|#g6hnj@{WVG}u8cYuJSLoCo
zPcFgrcx9T&I!s_oKHVX{NY=8KGe9K%Rbm7)O(D8%D<Jl`HoL=}HhrEqVqqhF7Uc=b
zr*&e2<2&Z~Q;4COYBq$3MJ4D&yT7uA?d{+^(;&PR^r6T<z%<Xj<R;#Y`x75x-juM<
z=Hj=F-2&FIAeF<}<}PiZHSJIQRLz^sALj>5^GXHSbTcjyH;!z{+`&HVh?H-04uAK4
zkquAS+1RZX%yQK4$^kM4L{a1941U^Zy=)W`;0KC&I@k{V32eBy#s2n^Er*B4W~Q$k
zNh4-8wMcQ!Aoo4C-9KSnL3{V-<3fsgFA7=U2S6hibm`pc>u#&8SJZAf=+quwso=lJ
zK?&jLiu#az@8g1s6yu=n>+wKpDUKW>>Uk<{z+<aBYuxS;MGZPV5^5wyO(fy7N{7$F
zrI<?KFz$pfKQPCAbFVqN^opGq$CRo~Q2zixU4yq3Bq)2$hU-Bj_gi-)q6)bGZz{-t
zzVjIo-~39W>6171Wo#6g_sHWR$~fuK8IUtFc@cl=eV(QAIZu?i%RPyB+;MEG%pfFz
zL`eb;er_Z8FqJgFu*>s`wlnTuZT6EUBN=p}yTjR;ufjtEF%B)Ka5MvhSKu*F&PxP>
zLwcF|8gaYJZ+l5FI?tksC<ch}&%##=<H!YP@jEY60yM`3KfS${`@-b)nKTWR>Jl^{
z|CI}eJpsw?vN+A;LpLLB3qmOpQVe$Bt1_YoLXBM@EBdv56o3F>3)aBf=LG=)lc@j^
zfh>@ZoyP!s6VVEn!=Y+~SDp$aEoJN?3CVM0Qt&2*1x_Uh#L5~cH&{AB6mTfPW|Qu6
zqTmXf6{{@a2$Q?s$w_ti3Gf&A!QV_u2<5cI57rzRlMdv2gZewQ#PziX3v8VOBn>eX
zhsiWC^jAG+A0o11gDDmw*b_}FyrVc>5SGHltmw_D#xen}3nU&u6|bA2P({k~S5~Uy
zFY5)j+Zd`SP0aQ0l9eV$tweTMGLyR6S^E`^^+>Anc<{F3o-9Wah@0qgDRI-Cr7#|}
z6v=Pit6!(M7m)=~Al=qfl(a%dQ^=je7lr{1pIXn-lDL0;UtRe!AP@eDJQp5-6p5ez
z5=*4>S0fX#D6($#YqX!vZtDTSt+)TM2@;~TN3RXEVPh@LdbHo$ru=@Es}ABM75wQF
z#9IZ^9cl-3C7UnT=LQuR@Rn4-z`?T2&Yb}Yrh}ZzWp;cDvOf6$6-%_VfOY=I+VVpJ
z3z#(fbgpbhV|OI?!yoU_3imXF=cT&Bxj4G%^pt;QUZ?deBU!&@l$bIBQ;>a>$uSba
zAWH3=RPE?P4nj}ahaUyQS|tWv2BVXiGhZw8*c@{xaKFJD)#XwzH(6{x|MhLt&zid!
zeIW#CNnIc2YVK7U&>kEww4_{oHduvJJsZe1oIO3<x~JAqB@Og7yb&0z2#o(77Nb$K
z9vHg^*tK|FrgZ1=w<<r!9V%=T++*5ZB!?*&{{ys5J5T--dZP2^tlu;`QjL*EE!X}a
z=50_i*zCcVqk7^(vudNW#`*l^_j|JWn9q@xxdd|`+iX0Mw}o)H_`k8;V|YU5`t5q0
ztsi=2>i~pNU~RWKYOYGBH(inVKW9>o<G;kh8t7YTcL8^KWaq1EJ*$%zO8Taw`1d<o
z0*+mIt1XwMWq9z7_WS>bt+$M8@^AacM~A>bK)Mv9yKA7dG^lh4QW8@-w*e|3B@NOb
zCEd~>(%sEKy1PdGPp|8H-M>5jkH!<W*S2%V`8nQ6bZ%#99Ek^#a9$N#K_P#by&nD%
z*Jmlj@E9Y(rxrbqSFeo{C!dP3f?1QvG%Awg;^mYoZ(IhDFhcWV_iNDzi7BOsg%FFy
zC0Ri`h2s?yF9oh0PC!>Uoq|#%9Ug<#z-IzF704pw$5A@`F3X_OcuJ#4=jJsYDJCos
z$$0i^C>Up4ev$was^1dvX1!ySoV`|Qj*j1g%`92muDfH^lMj0aKW*2B;0P1<d@X-8
z5SviYI#JpO8z+3)X?*X~`JSXs1Z~~RlQ1ges76FQ?NpERz8|IJo~9)6?!QB13Ok;d
zM@10OHmu10pS&VZ5ov^STga`>kB(1^cos08<MwpTU%hK^fSQrP^O2j&kX`~hwSC*R
z_KQKss?mvnw60t0%Y#u@;%cE(X^%9fhU-(Eqb%2@C8o1g*H6b*>{Njt@u*gH4|xN<
z5T`Gz%t5W7b5FT6#D=!GQq^<s;3;1I%L~LCb8;riRwg+=gtjPjrneMm{mOtqk*l;5
zf_Ra`hiT3!IPhPW=m*kwS%}Ex69U?Wt2jMV?O{%kdTS}b4a6p;$Ko(^EV0WPf^zaS
zQguk)V^Lz6<LjRQ5xyJ&WRD3g37pg(u;B-jx~N3BcmF)Evqu68BgDm^lQBp`1u)+-
z=50Qs!;>iM(LW89M#yV}mucpM$wKqnf~|q=vh%0vFj${_$@Ry}f|q1(Vij0VUl=&Z
zn)G%rbE;T~&Suj1*~*z@=*MPaxMy-%eka_~<KyJ)pe|o_abD{s$EvqzdE>bLv3$C$
z1#QQo9Y(S6wZr#upx3}jwppv~rXmvX!`WTzFLd642#kTGSaKG0?=r}0B8Gjtp%wfY
z&TQ0M(}sZ`f{hGTNmCAj4$tW%%0j?Qp~BrqfdanRRPt)rzZ;=Q2v%q|cP540k&5n*
z?zO}Rj4@ZQd~L^6d>EUh5W(LBH~Opd8K&>;XUkWhs>!Tz?7B9`UcGM5=#Kv-ZMk{Z
zv#H~MGo;;uHp#}Xq2=t0(Y7^amGOa;m1^Cz$vNCm2-@Gm-e^mY(dWE~OF)p78=m@x
zYrfH|+SN|33-I8+r@8GQKF%Pf0gYi)$BL*+Y>!k@Sn(@NxBbL+vme`A3eJN_Cn1~9
zU1)Ff{2C@lzM<U@Cbej#Rw{V@`dMBDyEQEMA@$F`c}j-M^Xi9C%i}3(uPSS*<F1AO
zWC2WQK55Dwk6CG}IQfgasig`e!EW8+Ot=Pj;ui0}Zci3MePR4<>2QaY?w5h%#-%NH
z*ws!nBuTsOhjfrT8K1Y3z(GtxT>@BVVZ!C5Bd=;-tCOSI|L*3G6*dydZu$`DP4-)K
zdXK$%(k8vj6sLbaBzxqWV<dMsiW#l#{KVKeb!G2Pa0=;LNl@)T_kpJaszi&UK{DOH
zvTG&poGcCX&#8kRl-eFFF2sxEy(pG&+scmQpfS<777&pwi%}n-7X6NB1zGa^Kj`26
zZ{{5U{nuVoW<Y!Ho79SbW#3O0OtJMUH-D{V^;tC&lp^p`cBg6}%JU9Hsc$O4`e>qc
zT}|@%N2)t8LBeuHm++G=h6MQn2y0-{Cwz+Bo2z5pbuI%!(4^ERfP`^Fr;o_~2=Bbt
zJAX-Wx52J=ZjyryOBJ=Lk&OG%<i6+Kd9NfFMDX2ZW9Y|uBB;#|Mfjbp$7Bi)7#0fw
zX;W#l&WkN@GpX7_g8>6XQArK41jG}JB$%DQMjhG=rWl+~nazcHt3}{YktN@Tl>?G+
zPu!MU3KDzMDqDKwlVDJH2X+sq-ywg_I*19V@Z`=jdtLmsM68c{!}Ow-B`f6sV8yST
zm{?T48DeeYHu=Onu|kGB7uW0lA3xnv%O=`^eDh82&gz%U2A6AzO3wZ<={G9>S{O-d
zEUUz4F|5J!4~Q(@^L(tZ>iM4a``h(=+`+<woG}|?iozF-FH@d`um7PLgc00)_^sZG
zAh>zD8XO1$p&jCqg-H+(V%p*`hvEHdlg&M&{9}px(%%=%c6rV{TXhD;dT-s65<)}=
z>7~H^#imj*E+v9q;cAoZv~hrQp5xss(eIYY`Qgv+(@q+w7N7?pU&0F(REnU*cPCGL
zc>Msx(rSjN6ooFnBymSeU959adKL%bo;ukX0z6W=k1<y|f66A5m{6nn;Fqy?p>J0J
z?%X8Z-Yg8+0z`^!j29-CaBYajG`7)q&9@^@X<X6W0mR=8jZrvKH<0emoCr~TNRBX+
zCsq_PK@?O#wt|Y41zM(YXoiCbD;@_{XYuUB9hE(>DyP$Ok(EVMFnkp}Cw<$G=K`e5
zv_pVMk5u$Fmd91ok6nTZ1&H>h%}JxFb~{p7sjwF-Z6c3pI+w(L0L))NFMnP?p-h`7
zC2zgFXlKtiM&4H5^>*)JApK7pH4^a=f)+5~oQPw|2sV38f$Auw3>Bu8fu#U()p_SK
zyUN`gvA<#L-J#jxW$wXtZ2Df$?!9Q~%K~dQhSIX#_Y6Bcx83(7v<jw71v}B67Y&Vk
zmOC(Fc*uwO>%m`Z`*W-Z)B_qBBoce>?zU6$K%{_Um<vb0+0W_Ao9vcHO5+5C_ZrU8
z45BdnoT0CSo9KzLtWZdw{UrQui}l;yQ<VDFXsPzxIf-_}dm;o8tJYBB@4)8{KpE&b
z2Z^jP;Iz`-;GjBrHN?Bs>hGuXs+8;&$;lFq3aC5Tyk;oUPBjB$S?|X7AIM>U;z^Y_
z#*n&+|HL+`!~lO@{cfsUS;$U5-3fD{tf~XM%$M4K$-7!+1$V)N%RbVMMZ}zbol?^2
zp;dQcTjJnC9ivE>r4dBr#R>o8tv{b0jOV&NDCo3b%z9<-y;CgENozBdlF9qaY%iJ1
zPT-r!n0LEW4OoGa^!?xSmRDnJGHfxRH=djI)i<d(j~!>L+R)w8)`K=A+=D$QN}2jU
zT^go)5qYdVWO<>J$72%ibOZTedPWN1jc>;DKg25!t#m~IqQD|B!L(b)y5QH)><L18
zYLX^SK=buY*v?#=4$$QFG1q+2UEPoC(;GhBLQXShmulQuOWY&Z&<Pm*PP<7y3rHx5
z4~H_$CPI98u8yJJDsweXIm_)q%D`fMB#u4nh}xSn+e&69<*s*A_>b6k<`fY70^a+Z
zT{C~r>@N>@xB4H_iHT_Y54gO%`^nLCHEE=%8+2a$MB3NZ)muLp5A+UOa{;X_m?#vd
zVv*}aghjJgR3=+R6P?&Nl4;MP<BO7Ify+f~52-Eu^8St=Eudvv5}|XIr}ZKmJ>aP3
z!IcajfacwZ&_OK1$|-%m+h|4xDJ=}~wURPU(>KlV%?JJh0yqBd_Vmh~YQLTLZ^7to
zfM!Aa@c}a}0o%vt``8`*UWSJMcOJ>C`u}de>n~wm7i~jk`Y_d|{fzs!y6lg8xQMb3
z<1Y*_!~6zY+Y}Y{ITNB5eO^IXETQB?eRgLGV>5i}h2YC?CeNBpX^%un%*{Wab43Mc
z+jJAP@|l~5koA9mj|sxSjmmo-Yu;FL8tDiZAn;B5Yhmye=h*pHy>k_Ebs|O2G^)!c
zJs7|B8rb1<*f6*=nMBDML;Rv6&1y{(pKyY#vAVypYSLq!qR-2>AmTvSAa!(XZ2b`0
zC^xLC`CidXw1h_-FO|<Qexkp`GXQ0Nl@r()=63nH8+sWE2~*;+I?W=W>$WOFWIhi1
z@RekVY>5@X<^k(MP^xV^Hq{LAs|%o+og;v6GF<$vIwj4khjW<TpLmyP91tJSiXUgv
zHIw-86S*<l$q^a7#XxYkLS04LWXjM^E}fYrWs$+ygp!z}an+#%iC{~<M=B_mARgu@
zrK_d3K!O4~K3Ss>f-u~%;lMKsjq(mD8Q(9rfy`YYyQHgsT>5cnGQc7)=m0=V;?z9V
zLb9_Lf}r&c5)n6*7hV6X5!T{+B~WZ!r-L@Rso70Y?RV*BWx5!0McbiWN>XRcy64}u
z<nMh(qYV)Awf$r?j68aS^Fp4}??dT5O3NuSxeO{syGJZ@ejFbpZ~;_dv3BUlkr-mB
zmjV7l*nUc6H%Z2W2MDH${L9siOlBGAs$w!`2R^vm9bC7qb%rS*7n^(vpa*Hz<&+7Q
z80Hoa;Stj-cwr8at>Qp<K*U43qjxVf*F6lcqn-p6DAn>fO@;E0Q3?qvkw|~|BNq6Z
zM5~%0g3z1_xK4rSxF)St1;7$)6ZQo9CA`~=ODER*6xC~64-8CU==zr|E1_@rE?1sM
zMDPiYZ<2l^X&R{zyXasqei8G<2fU5S(k<JLNe=tF20*C|7|1J<5~tq{Oc?|V+NkBN
z^}#Aay^XsD%zY`6vkfE(YYt*mDR{MaUZ>M!Vc>w*kl($+z5i;=zQa;&8LauR#mN4i
zrt+Dt#gCUV1FK+X)PH#mIjMTvzN2!8<`8%2BcsUlcds62^;16x&NYYIt~Ovj*lOsQ
zRIYU=FTW!2M8}j&-T3P?s70FADt+vP4k(`OjB>*e!cPm{O;EqA_IB(0%0nkP91_#T
z?YQ2H!vIrr+ny8@)vg^(-JCwkj<1=%q{UBh*uGSdgq@wRhr&!o{?UYbp8uDo;vDcd
z(e_;M{s80@{2{vX=3A~5XL^XG%`8ITd%iM)HpwxZU}Q!=)ubMR-p%n&=&z-rXK2yW
z5r>IxRxRWB-o_X_GnXp!THmFTa6A53p`CS<b<7MLbAro;U4}U4EKoK#m;A1)-Aux}
zcAx;XV<I|{Uj21wA-w!XbF1fwnBtlW8+f-Z=d&~~bH1Ei)V}c*`h*lMiacd>7m}0O
zu1WDRsnwFAwt3`j_ykB+I?VbVOw`Z5>JBpViIhP2dkxh8|G?&ECkQ=sBHIL^I74?_
zCA>}=yR`4j|5A9V%yP~?+C#$ue_SM7XMNxVgoyO}TFN{|eGSYX`ACzwF=(Ro-n7G`
zPkZ!j4_V3v7GG5D#}F|Nwm@{y`9qMz+hEPdSPzH^%D_<p1|h1vJB>rKhi&aac0lIZ
zsYH8c50x?D%I0UlT%T#CS86RLoalRL7c9^5Lg!Mfox_9}%r<=O&WJI|10n?-HXJnD
zgR<;KziZ3#WxPV9zcV|8wZgDysc317oaILqXdeG~Y|`i%CE_%%3~jls36Mc6!gmdU
z$?Btj$a2yUz;X8ZMQcle`x2#{0O`k=dn+|tjz<PWm0-PR>n+0qqM8(bQTFh68so5i
z>Fx%7M0?(c;(JstpRPk3D3hqP8*l9J)$O-zs-fT{AsnN#?M^)%(uCfK<{PS+VYIGD
zr3Ha6{Ul_Nq>vADFH(KW|7fS<0~&*c6l&<be9J<E2aO}buP=dD)8GoINa|>`jj_ac
zECZu5<j#Y}m+g-VE-A!OZ$kS_r}WFgkmxfIB;JyuzATdEO$%C4ytozNFu19^{EbYh
zVf72TseINYm)91s+ki;Thi8AVrY!NZUIB`TqZNPGo8FG2m|XqXm1#Pu44J*zrm<0;
zxZ^d>VH>w?ZOzZp1KQqQ>X)B~u<R7n=ngCu!!rhwMX4Nh0J8@vA+1D8G>RqaDGRbn
zJ5YJ#4bveoroO{eUR4?M<3`Dk9oMNpelq*)d6XcaO@pdfEwbA?>1eGr&QvZa-gO?t
zO(8vFM4&edB+tVL5lMfYjKbEmfT}9#GXb^vjHdMp@iW)n+Odf%oms$b+Nr(Et2$u`
zs`Bcayt$<%2_eUaU9VC6O$qwU!+yz!Ik&NM_lTI(?@16i2LKI&6QckC3fSzhzrF_K
z6mGCCaqq=>@v76VgYY`QfYqKig4XsA^+&0DbJ>0&)go+BJhJtsjcEN1<zxQ{N|A9A
z>!E~F(AoZ6Ld%#jnB*BfQYD;b+~uRArHj<_yxSXuxMDb^;#|$Gzf)Ii3bd2L>qw!?
z1$P%zbl-lV`qwhyBx6RnEt>n~Ku_TG;2+cc_+FI52-=~$c?*oTSbX|xB?a-P9Vr<u
z&#h4fABv83&+zZejc@*}LfO@+r_@zx(}S+=V*z(*zUlbR<PR#A-}F;EoB*eb#e5G0
zI{+nUxLuZ*o#Z^mAHC1^Nt^L4%ocM1JdoN=^8vSEbtb^T%n{4DZ8N)V4=)1#gxz#B
z`J&QSg4;Alz}}R|2{=YI?D=X#h6Ws`O0k9$78=B0xkss^RbCHZvYC|CP9x)&rfnN`
z+ows}#;o<A){D*Ako!^yr@CT<WuD~*&m%97jVfR&l8Voe0j63Y8*%yE=fTQf@E?Fo
zssLB%OSk_dR(s<AvwXrOhwyL}lN(lvE`iKZ>Nu_=fxwP%O1{N?C(o+AONMII1p3eO
z>2SwvFBfa7vuQFZG+71cOTe*rvweF8Qhm8(*%fgp+z^M&_dxm*Szy&Cl64#c0@lYO
zh0=Jg9EbX@7N0z|Z|2h!CTK0ia_z=b`{~$>(=Y<=bsQ{F$5~r0!TJ@Zl5@eQr<k~%
z_woQlEx4O3vPT2sTyxB(e}(4H9N=V#Od*SF%=3$PIe-)3o*${a2=Tqygl(D-DY}g5
zCfJGpUmNLt5za$ajls5EU-n&7J{Q%rTi%nODJ=gQk{`T`hq9%KRl!nkrvaWmhWRM7
zKS_X^k7<0Nf#QdgGsZd=m&50MV)e86tI$|Z8zS#DIE%5izX8!O(`q9z_cSLh?%Qs#
z#LHOo&lq%>=FJ5#UZJp>yCWR(ZZp}oaIjdwkso&UbE?BRk0nOOYZpo6OFvna=$zMw
zrd$a(VPHAer8!!Ov=*}IJOop^&%QW09cAlN#$H-+XRTbdq?a>|npp9eVb~cDuPNWN
z@C5udx=$7v$OU63OZ&L5$srQaEiJg#qcMYZmo)9<TB>H&6gpGn=$(~^gP7e`5eCCV
z;tuE$_%Au!x-A03n4^NiW}aT+>;yR#0WwrdLS;in-AnoPc=4}YZUNzCgf!=*jQS2B
zgzk6cOsC%%zsdO?IV<aP?zVZxM)lWcU}Rk!H24OeJs&))JJYf1HgD2rl|4+A^x%NY
zQe+^3sJQ}5d~bgE_ILpvNuUCb^ATrfaQbjW-I5*<Uy5k}_|JGxvm$O8RVML?4SP2e
zs^u6aG0JH6$}~IWfK5@9GH}HkC=tN-RAk67H<N)MW0T#0l;3le4t{Bqn4&*y#h9>%
zDW<~=g`=5GRRJHrx5S6tMDN2~HjMWNue{TpH+r()@|rdOFn=PhfwoCNBi`#=61Y@a
z2wOh6fV%$q&Hr2|KH*BT0SLEvgiG!$m<w0sjOUf(*YO6jg`ZX{jS0~Rcnt2^KGTNY
zE$~N~_3a;|_e;fsNHy1KT!O?#y=<qYCxGlrZ|_huCDgOENOISkcCe}~q&@$fOczAT
zH~q0km%H?{S%bB3u~}_=1fQB`I(&}NswX9`-u*sW;BCLT8Xj@shjs}-DX+P4p|L7Q
zn&(Snw->zM{C4E|Yzve(ea?5YBTJ#c=~fYYl`Up(u{s%=4`X?yN>9@|O3Fyt{H<Nv
z`)Gj?@6dejo3Mr3T{t`Oe3KHC!*Ew2$<R*;v=om!fb{?}1lC)~lM4b<3yhHOnx}QI
zNZMk-kq$FeQ4tK1FAOTJ@}f%{U!=b-rrr{i^qZ}%a{hE;GcvaFY&~v%;cA&T!m#FR
zcEFRzY=bO6RUXViZZ4nvwLZi-O8dA1&r1}{QNaL4yIKE=bu%+lcfx>=OQ7X^)2F7u
zD5!L+*!BHr#cr>D;xi9fz59+zhZ%>HT|13ju11>t{mpFxaKkvXDF4H&Jz(fIe&lof
z8*h7l>p`E`%iVJ{zWs@8BW7_;>K_vFZgC&3uZr=SeB2X$%t@6@Ca^z|vE_45`Ovs@
zG5F_Gs4b8Z^~kf*^C+RfBq*Y@os7>x@*XVg+6}4|so%-hI+A`jogb1zGqRDuW$-<M
zVmdYz`N$HxZ!g{dCuYFP3N6$iCAl}Ftv&3(l*IoYNP<z3q#Oin7gB8$9hYKvt7F@p
zUX-QnX?#47AHuKj$*Er0a&WwiK&Dq347uMiT=q_I#tLrS&q#tnoV|r`h8hZecZ1o{
zHuNu98Piw~o<3D1Rd4?7B*g#pN=K;aM+kqpg032WN3^_p)|HWN?9en8<}-zyi~2H$
zgEM&A#eSWnhlf8FJB4`Z;Gofv&mywFX?IY{#kwlRx!3NvO#=#El3b-RyM0ls-S463
z;_@d<a1d}_ZG%|yZA$Jh?&;(2HPY#Qvm$U*i0CCXE>p4C($36aTOD(lf2cNk$lqfb
zqv<h<lb6wm5@8-RuZ+<Vt5qTQM~n0}9LUdw884UQSY1V3gSMS+jsSc4dnd}V`Pm}y
zQ@<6HTcc)akkIyg4PwdiDFZ9T_Q7R*TG}1M?c5d~XXix^F6K$YxPeV7-Ng}&S&QNU
z^mmE)Z%&`DGZcuW?1*n%3C71gm+xR6Q>AOESkSJ%IY|chi4WGlfZJXm4n<FG^I6kR
z_{HLN*P*C=BTxzOu-V7sIQpcSnn_GDPph;cPg%~f&Xi*3=VS{7QK04){!jE01n1I!
z9(GCbzvq5ewbp2EJ(-wrQsGG7gVNvx#B7)S6fBXwz!ws=6&mQ|2tOBOZiStqW6$SD
z?KxLgeoQ{L!`~pJ<zqyfWqSq6Xl#6*o8lTkzyOh&&k#8jC1ljfTpHKV;?wp=J0id*
zqPL^Ve+n{vV4k!1aaHkcC14t{wycD3n`M*4rg^Qm;4?wB8t@gZFD629=@2$$l~ZuG
z;DS5!NKBBfSx(2N2<aq5KF#A1e>6o+i7jR-AzLkkia#6L$CHzj_VVAFs<uR2J>hm3
z9R5N8Qdm^hwhQ|7kZ!tjI5N2n+slG=R`H{L?=<s=d3Ga)?QTKnMq`{@;9VKywYAg9
z)a-O+l3$>fBY{unNW{>j6O4ayd%$M9+lXOFN9Ya4yKpC4e?OFx=(;en+e70r&`%@+
z3@O8D#Ja2AY{16MF1+fZJRXlq>^h%RY#8u25qWra*{5h>+G+kkQg+zN%4&J~#81{@
zceN)5gCNZ86iWjeH^RTO+>I~&>X+E@>#jyytCM8-IKNDfP^)OC0N5>dOU?uut`;HV
z=H`|;aJn)5K1EDK1S~=&mn4nn(?4)^djP*TdXqnqDXoB3owA4}VUt_+4jEr#0`|ed
zxe4MV)?S)SU(5vChkY48<+|=mM`jKmJ~$e*fgN(y{rRHV)h9jR@Bq7`GYvf;k0ax{
z#q7qS)(L}tV%+H-uN$cN!zoJ~^7IHn+6j<{tx2+fyM)#KsZec@XIan&ky0KQA-94X
z$x;J-y}WV)>bCGkl8QAqR#a{y`enSwDeJZ-=jw|FcA<`DCMHkPTeing*QUD-%`Ppe
zXk0$%n3^e`vA)+0bfTLMi#yHt(gwtJ<+f*Ya|dk1Qs+w_oZBPeqa8)JM(yIyzi*cs
zkCA-(p}L_#p4!%^F)+u?Glc_cJ{u@?tVTwpfK$U=ah@n%6Dx=qG5p+0nJhJ7)ib;O
z<ax#myRxS$0>`^0T>4JDo_c}2X*@h|sM6dBqAVgDJ{&~en8HN|Dt~;GmSu;Elp)=+
z!bNYEypv?^!)+&cumY~v&*G3sKWKm-rvrCZP4yg1ulS&sQ-;%KlSZaqHKmdqwGcff
z$%=-V%iD78yVhqm+Oi`8Oo3!KDci%mYlcl{t}Bx-$jr+$7Wi_P%%gk1f)g8aJ@huQ
zhQgMWT6S5VCmU_Na2GuaM<0RnFMT{Aa(k!uleML<Krjo<&reV54i<eLn)c8-&QlF!
zue2Nu9Q2IDM1FbQagt)B?oDJ+b>|sq?fHHy%?HL%eBAi&A9X7v3jx#&FnV6ll>u7Y
z)FemX6&WUQ5;P!QFXqFk1kIvaZqM#Kz3h|v!}<>;&1{C<d_cD2i!}&y`b){zndUks
zen1bR(ZaoSl{BMR3$)qzK9FW*teFN>l~<z}PRp%lHnx0_9eF3`$>yLm)(pZtkzDzD
z-hy#Ovt)$4d55mm+;s9rkItqlJWaE7OYS@T?nK&zdE?ELk<)$BV&E4O8pFo7Q8y^P
zmd#P9=4)o(i%uTRgTvG7$Hen!0z#bK#6H2EK@|HKz|d{|_w4=Gga56T|85HU+Q4Y^
zew)PgT&Mri?cw)RmIELBk8EwiInmjN(2*toW$c4lw;d~e?M&Zecy7-Z;ST5fCqo>G
ziJTayow3F}VnWe?Dd=>*XyDkY-<ZY&1U;z8BHfT8^d0qMEKc);EYUEzWYaJ_?T-`K
z?)~wfi6iioUTQSulbM@`W2-SsXJNVs`l#9!+^9aGn;aik$py3l-p>S*bW~#$$BPSN
z$*^b){V7iS#07EQducvvlgB9;+iXS6vP=*=f~5{+lYsWG;6?m0yx(5kOhLBto4Y)s
z7vgF2r&g7=KV{?Oahop|eXPdwwb5>J&BPSF)w1{yXz{e9v+Q$6ISyTO+eHqJB7+eH
z)kZU@avRf=z;oNQ4<iulucMLGQTc*0MPY;(I#ik!;*PX#BBCojMit`hMv!-`+fV!)
zV1Xthq2U62Wmk?hn^5XxlascaPM)6LOLYd3ZA#57+E!{48yD5ec*~6NGpq_0f#V{B
z%3o>xVRSOEMztgX7R1lipYm8dY;3q2q~{KeS6z!D4jE{WBd>_~?48F$bziunXIQ|y
zG&hq{)FkYQ5-5u?S@U&1#>A_=#3Zw-Y@C(+Cpw2Kkup4muZ!{T(6BBBcPQu~xDa~=
z&63vrmk8wovt|^hbBZEzU*%7uAJE~mRtmpTrTta$fi=xD+E>MK#-@9_w&uPiFFhW4
zzhBEVyE2K|WoM+MlTZrl$Rp>B?-Omgn<%cE%1KiWmuWm=MYTQ$Sn~ulL$o5#J&zWa
z9IFsbgM9)7o-L}Qu!REy=lsCw2ag-=(4149xIAii{%7_HDc(5_s(xaz$ucTkVs6LS
zG^dokY2ODKH(NhDsD5<3j~;M>TJ2%juj7S)sj4nlStvfywBZp-v+c4GhxP2WU0#xY
zqO09dwBd`qGs19`oI~%w?+KR)Q;OQ3*YHvr3K|r7stI}Bd|X}H1!vftUo@#Z!N8EW
zYq}imTk8kIGP;n0h`}k?fuvD*Jl5O81^ZGkxY%t&&cm&>s}||4n!u(h>C)_OgWPty
z-Wn3Z-&f}REZw4H?0eVM;Cuhn^$VH%1WH3@&(C=#uVnMlV3-=k(BwFWRwgo45(6Wd
zB&*tQb^fGidhZTr3TCzl+bABMyb>%c^f!Mx6Nfxn;K@(!ZN^W$+3ZYym{spF#%<bh
z<uz4$5Sw5IV>h))>f>$EfxMr@DgHSijeORETH{^)M3FWJv{;WcR+fkI)V+k<EW1eR
zL94^e<nv*h%PmgTk)r>cKA20<-B*C$?}A5|J9+m5eYII~k^q+qm$QRa2Gwt-r8TFA
z?eLfc({0c0>1{_Dhw1lMzY<E~sr@z&avAQm7|6DRck84<;|^t!=qaE|L}h&QWk=x}
z0)q&@<BUe6n_Kk0``g2Fppd>K#eKHQb0N~{r|F9thlqr_w8ODENyLzzbu$<Ieh1^|
zoUUg#xY%}eExzW_?KMgg5B%}$?c!TdfEnyc!D};fA6_eI-tT|h!D~Wlh7V1wyFEAh
zV<qs<Ijm#{c4^5z9CWTc&s)D7gals=%0SKv3Re%?C9~{3BHqo{-S6|T`d;j>=B)dX
z;A&`2iPBoHzmt931f9@tYOr#@{_n>z;NxlaQS=WBTa3<y);NvUwu=fo-a_`%Ov`Q^
zS7Z;<UN3IAV7cq~$9H1iJ}!uUBZs4E^{Tq6TBxVC<x)oA-R~vP*zHy3eJ?yMxll6z
zJei*(eq^w{Lvt!zKx0+)E2~QbB7tb(AJ$lw`{bJ)6@WopM4YBTqM=O*HfP7@{@@a|
z!-V!rS1d8OcHR{_@*qN8eE>DP&T`z_Z-B2_rSh6bQ{I&UST~mFdnsQ^J4|bd?`Nkc
z=%snfPx5-J`#;E{I@vy^oc}4gV5eJ5{f^^h>2zTa=xL<PohOxugFb>4O$^62b_1vz
z#>t3TAya>5Gcnux;vA9bvfdvB-?lH&l({_xX)7+jz>q8t^mBMG<u9R<8VRjZTg>Pm
zuDiwA0QI0Mz#9ra(q6u0u=vPx8>wb}nzc=_lOYGKT&Pfz^tQxYn@Gsf>5~!Gdirg-
zD%(M?1-8oC@H>&t8$KV|()c`ZkAv&J{cV5bumN1Fra6oyiSXFY4u6{ySM8+}s-nYp
zRM|XST|oEE5}`L!+V7u0<#l(^=~;(tE3JJN1u5P1l8I0ls&&5RO<*G(sga~xE}Bp8
z^zyv0QU8FV<OYq;`gaCdK9Ov#va>gu$&S-Cm|_lAMv_qh41T90#O#Uu?D$evYwJ7n
zTW|DtlY6)>7s;ok@oC{Vc*jSY#*A`jK0fw%W&7uIPI2nVp|z6=*kF!mRT-~Ov~H)`
zM?*RrgN5XXmU~`!yw{28&ir_e??x#+9aIZD@744`vylXQA40)h_uLtKStl}?qJYqU
zyC3RzeN8R>K_{RNdAF^1jI_Du&2;j?%5sLCt}rBAG~EX-D6Ui=b<l*aHTxV)!goxo
ze|)^Pk-2Dbp53AorGvw#Oa%N;@P{ae;?^BG8Q2}x9A-=irSFcqXm4~*XoGO2;E9cu
zbq~<L{&;LrRK2BCu)f+zTbn&n<~&#`)BNgubVP~a3G#BXc4c9`SwznX)kApX?2(iv
zk83?&+u~BJmNHJl?J^lgbv%~-bWwkI5a!{Qt;E16YX9-As!>gB??wqKmb_uXCHo@T
zdyr22DA;N4s`gK4`u)6!40OalwN1)=NfUl7P<JzyK8eiEb-VUretseczc0MGHq%s8
zcS}Ylon%&KqTS+jf1)sZ+_iN<cpvYcpnnm7^<Xu!r9pMF$YjBUV#`cS7IJ;X+r3Om
zbl`46@M}<&7sBgt_lE+&8Csu;?Ty<x?<>jFsBb>(J{y5cF>6AOJZle62UAK#;2u7Z
zE<IDXSI@_G^=$fzYj4CdOISadltY^5c$#+c#m`Q4Yf)F734d=@k+AnoFJJ8h1{?^a
zdhFkKUs0I+e8o9(usN8H7BRJ!;N-`pC<%A(JLMMAGx555y^;M!&#w#W60H#~Pj%g0
z#}EVd-E`>bTRCVb2|+U140<ZSu6N8><kfcOV{j-D@0GTYRtqc;$&>YF9{AnZLWR@9
z?0)_49e2f(%Oz#&`JZy94a=jB0arJ$TOcmH=N4WM4SJT){W8t%@6y{!KHY~u9S*F7
z9!P&a#>+voTSZvr+~9Z1GeQ%1^FidXlY?to0y2)b`Lg2UyT?V4<L-7Hx~nFB!6&K_
zGRwaYTfds5uRtfw7OqY%r}xk@jv~IzJR-i4VQ7)nkXrseoQm{^xwgCEd$~*HC&$Hc
z>-n9Z2zZYt=Bw-_;9`z>&h5!WVhqipE07X6<_zl^>E@+zY-}F{$NzZu<Fu{JtY_BE
zzKCP@thexv(7n;Ll!_x#3Z?bjNC4C(CUkICcRYo&KZUfET%;Fr-(@;Z8iMiA+a<tS
zt_D&oY)8;5j$GGlAgn83X|C9YF_<3xhP@ESiE{X$!xpfQ=gtLbhJN|nE!r}3gw2ZB
z!#QX%E4}Zp$UM6B$IsD}UK6UjNRx5B_ONbTY3K${vhK#Yi%g-wNj4=Z2TD9DdL(Se
zn3@~^na;4(!~NeM=)b^(zX#fL8>~@XK^AFAO#^X17cW1nQRO%AIWgiCp`hP%AFyh&
z5$H8%)oamdxltnI@sb<2UA<ip*R1%lU#%4t9CiD77pewU#RPhr<g$^!Kh;+pI~U~V
zN5^PNLFB&*w-QbBsXxKO$<W;UzMW`_Pp<{$q79|&Un~1Po+VN~mkS|bqRfwG%jL$$
zBz4@Hp)idVwx4|Q&O83?+jDKh^2$&0K0aCUu1o8=-hQdOP?nQnaPP|fP2|l<P2u>)
z(@*%<TZSGjkptf4CFLcLi6n@q1mvIYbgVQsHhN-C@mqGXjSKUE7;POW+<Gt!(O)=c
zPXV>q_X`IwipLKk=_Ey_*A+$m#7b6G!f-~vJ9II0|6VVXkbLBRSC$tJV?OCZy=k94
z8hYr(snj*=d0w>w-gAh}_A6JAnRDQdJqm4}w07a|+)d)1?XM{gf-#Q;y2)qK><R#9
zVcegaFOn77IuysjG)mGvz8Un_>#AgIHIUOh21w`4_s@DNwZFTZZ&X4lc;h`5y;vcl
z+6bAOWpL1tXcv_^1!bc0*tAW1E=!^1Pzv+$Wzf@+mFK|oSku+OPNq7Cv2Rp=fgftU
zcdLf{9)?iB5{Zhsj!&z-W^^?zXixa3fV|1I<sb$kMxnieg01L<JlPhDQEyr-KFTwO
zlGcWo=EE6n0`9wF?9>wS!CVHfUq3x)Jc}<fF82)@?AR@$O?v+u^VY-X``ev%DQ*;W
z3+1*$cIu<_B~-LomG>fbdA^mJ-{Ly~mBdTvL*bA4OMQ=cqvAOAc57&)wcW(hl+;ov
z>3f-|V_^39V5Y{i^<<+@+}SH0BH%{%M8$ThT(Ij$95FIxV<4%A%dA-~p2wu3(%R$d
zryQ7$mo!33$2471?-7q$W5Lfp*10cjzhIvP?#kNNGBCjL-nV`wh71u#b-s0t!uJDo
zsD3x>lgp;F(a=F~rL$Bgt>;%-uT^<=wq4epQ)J33PQ6|uXh#;zv7>t7wfc8t`%_vH
z2*syQpO!1jtS8<XRJ<*B7{>_^)AWf({9x6Pc%ewZKs6|M>!|wfWy=}OB>s|vCOzh+
z6j;;=JgGdVAQy^$X^;cDekg5|z-{t_Bq3&leRB|YQPo&DsU&n9*cBdg2gGc8QTxcg
zb2(anAJ~vpk(IZ9n$K{bM*9Q$g%Ym6`xKrU&}>isC_OKI4)vMHJVU9|{X<^U5gj}O
z7Vod~tA!I)rh0@5M>U+xNz#T>$=(y+646TdCf+Ti^0=X%rd02|?n{O?G6`1;H|Q6n
zCG8ZBOo~m)efg}SabSFVUB>Tw9>47&XHeJjr`CqUoA+N^Y_t(t!w299w=b!IeIn3a
zG~@E?prg_>HT!C2E|n}XQGSVVlqJFMhtkUP4f>nQ-&hnqM_p-Ohhyw5bG#QaD=Lif
z&n{vb7rmRBbiG%j;G2QZ?!%|{IT$aypRo3@%FG-wvbIbedpv|5QD=iSk1ibEm6m`7
z+;K2TJK}9?;wOvEN?WoA67K4AfxBO?W9{wlZ#4}_5+h*WDqQwx&mSS@On3k{%gN1C
zK|=i25P?Lo4xf@$Jmz7AMTSiRt5;E6vV6@#wIY2$#@iXRo|=l!_A9~YHSWmiB%qxP
zlDQKxBtK@5xqmLc{F8L$46wat-E1K5M{&q3MT<SwKCBP0+oYc?UmD*mN?lJFFd;go
zKLm07yc2AScuhS!l<1zDk^??f80-9FVNmXzBqS=N5`o=FDeN6acD_SVFC~17JU)Os
z-M?ALZ%SJyZT9gw-*BfG`#Wq?+ndT?628^Vh1Yg2QcqjGF<t%-!uel#rwN(zD@7LF
zz_$-6D@sJpMKuyMd@_IC)c{xtZ}5R`J-TF}Z0O>yeLi;#i5yP1o1PhC)AcGF^VFNY
zjwEPb>II~Lqz$F=>=~>P?Y-0O=WwPM6IHsJBOjVDj48|^pBT`|ibj;tun}j}WD)sA
zKgN^8<m6~>cd3;NO%bb)-%f)9=Eyj4L7C`nKrfg*Ow}$)>g?3jugR_H?fUA@r|SJ|
zWCz_mM$+eR&Rc@-^L>vt?qj3BSzm1oH8b0<x8#?(yg2;efzc+<=2TRu!&b*r^r-b{
zGduDT$ULhKT@xKj@7&GA^s7)M;GFpsJDQ*?7sy4>;L)R8-)}e|0<cqFwAX|`Fb9SB
z5|8>Vzp{wfbu|x=U@7(}&24IC@yrf&0>$qz9h<ufQOWqo{Ug@;B)Up_%VL<l&!n0_
zOL>nJ^Rc#ies=m<NC_(zv8fE{IDh9&8N`}&PdPT*Z8BZ@tpC{`PeJVD@ehq#7{oNi
zwaxuqo~Rg`6@4AOA_@gFueCU>T$!$042DYtt?TeJ6h3N^Nq}!dM?*s+v1`%}!jIh$
z-*1x~c~_-tZF-y{DUv1;=r{2BN`-;Zt+yyCT)E@bt5<ItQv*}FPWh4D$qcIoh1L8x
z?zT$2PGUDJ4EJBvlSQx?#zqC@zMD(`kp7(A4@EZo8}Z&X!*|6FK-=P}Un0Fuz->1C
zpWxE>*R4+TV#JL;U{b9^isr*QvFW)O<(AZEe<TlX26#UCJ9gxyyMIQHV<`V4a-oiz
zY)0N}Csg=$RD6Ur;Nx~~PBowJ9e!^3h$le~H2V>XpOzgR;kE+$yGE}+eP(wr@}lTE
z819y4_nP;*y$^!97fsvdbUQb1q*aDwE{YWKU}B5HNkEsd?!w#G#fI!2cgHrUVH>Ut
z`KrF(Axb?~sHZWu-b?;6eTAiiVS0N%R{8^7W$M;yF6)TXGo(*8v+uudr0pQ4hQv3F
z#rLWrL}lFe8MsfL_9sK@nGCD@j`5I9?t%_D#Rs9X?=_s@PAFv)w-7TUWZTN#g314Y
z+RmX^xW!2eM)364CAl@Z%yz%aS{!L{HNMIHiTH^=r<<YfKl)BZ(=Mt|#;-<A%+(cy
zmz|ARE4kjnsIYJ=SEQlM9X9oDqyj<PKU?^jjNyv!C-y{-5(Pdaq{J0a?*k#o@soKB
zD_#;o4nb5Bu8D&rfh1QCpP*rOWtcZl&A!pVx(t4YOFW;?h<r%b@^(wW&+o+AuU<^O
z!WsYkU97peaTX`Tbx3K?VY_C$0leYWWb;`CYK|>w#*anatg@y-x6m}W9Vd;5X>DVp
zZ@fS^CmpgtMEpWt4>b6JT7jT7#_|n<+5G#nZveuMR<f#(p>YRb>fk6cO{t^b!$B+k
z`ZQ1<hjOa7c;k2}Dp_e2XXW*_N%ez%`A>jKF=e`w4%zwh?P0|hTLz5hj((ZtV_+J~
zX8k0mcpHsCtKu{X5#LV89&_(^BAF2^GfVF|$_P9!U*;j}S$<vw2fHD~M2tvhbmAD|
zH7dqII<}|M#xiV%pW$ess<gOx!j@r3wNCN&=`uyvU7}?~NMNgc(kiV*drfib-83_Q
z!dkidqA%l+H6*%=bx`~y@MPk~N;64VfI_w`{0+~bJ>Yi-OUe_kOXa9p3^<6e`iv3H
zF|V@>c~fb+u6EJ;aLHR)DQr>AM5m7Fx$q~yQ?q#DHgMEMRkr#M*JTcW-3p+qSDV+f
z|NY9C79|5HuxmQvMv6=!S!5bucqN#PYCc#GqY-*v=DWEI?t6pEC2RQnsJiQ{5-8B@
zZMvAJi#(=wL>e$&BJZ#Aq|Vae3hJM_>nO}nDpYXWT}QH!PVStX<BJw)#?VLHUk}WD
z<fNkQJ!JV-A|NRJy3H)rdXq8fi<@VQo|dNLHzFsJ@9ek7$KK9fFS7bMHz?{`KQ<q`
zzldzvX$n`sJK5(VzUk%U-KxIEA$2fd!f%_LoapsvzIC(zasaJg%Zr|XA^&V`-Q!KE
zA}{U)8|2?UeRp^=1mOfWxM`8nK-h^9G9jxiaOE7}{{Z}FxuvsDUU~6VSCXutS^YZa
zhx?TnTkFn#y;Uf@Nyab-x-20NxrvH=hxnHD(VLUl3V55|&rM-lIgTYGsDsVs6-8L#
zVmI;^)>`U|nWhJIhrDO_Q`>u=&%Y;~`#PC&Ww{9WwH%b*uTPI0HT^$g?q9d9Lnkuj
zPGsHyD^37%AnL5Vq?P_9VzV{ejof(~F9^8l^Q%_~G$<|<mz2b8*z_mJ+^!h(^!1JD
zDQ=D7?uCSYw6Y?nzN&qp0Xf3-`vJGL-O9;G&C2lhf1ZuIV_*M>$B>Kkta|u~A_2Hm
zfyLR0jDR46Zi)}#Kas0|<K(Elsgv1k5k7mhTRGH6qNMS)10Nf@X#ALJ#z*wU`@-j6
z)YYp6mNE3YkCX0Wdk5^vc*b#aw`QWFCX_PQ+=GXI&k|neex4;}N-UJw6nEd92L4hm
z0aCxCWq)NWMQQ{$_kO^r!2F7t#jIKNDx<F&#j(?Jv&QTEn*=4X#UvLn1!`wrH|GN7
zm<U-HO=yGPQaR?OqorH7cN#XuIWj!8zxQ`6#1X)$5YCA4c917^oE%I$au|`a%yL=b
z4SCX8rwWfQ9&pH@a4~F%8^9SfD;f?87oUllc2O%D^linav5KJZNsjzro!rP$DA=?G
zb$3kNol&k5#AcY*9V&ks89syB{$<r?K_as$_i{;aNJ_8~Jw>^(wKYYzwKc5Gtg5^^
ziGJOqYVjt6r(PR+yK8LaOLn6GUSFln0q=#i;fTmuqeu-Br6Eahk<#!?H49C;p7mO3
z5mWfBo7Zs<>zP|f+-%xoag=w<>FNAo6B%}OB+HjN*8kj_Kv=Z6=O_Q21p$cYnZHDI
z4`$dN-oQ=u*+QY3>l~BZ=ia5PHXSW}w(5y$YT7LMcrH_B!f?U`@T_|Er(1lh(?pE#
z_XxBK>$7(Tjka%UM{H|FrR{%dXpek-fB(j%=cz%}d;jr?t`d7F)VIpd#(|JdfD7|^
z&%j>so#^M<C_tI<+He-bOMdTQz?Tdcc0OYxB=+lm<y{TIge;#Wm_BbxT>&^`a;he9
zX(KJ$_-fXmKTKt$U2on9xL&@ub8?6mT};Wla1wE&swj*QJRzimJSUP`%HUISQ;*{^
zs+ULd6twQW)_De#p%Q-=yEr$x(@1USdG_s<cS&(H>NBc1Y+87Nt`y}ssdpRSfwo9j
zou+P1+w^&8jzcm6Pjt*8o)&jeTcN4tfBlNS&f_z$2-BYQ_%E$OJmw|!7}<y)&rino
zWZe0!))(>)=U3pDb2w0_BjB8qWII@)*jMdl>GA3;aVY8{?b*_73O^ACuGh9eN{$Dr
zAUYew6f(uaYg{F7#$EILDLwzQPL8*UBSd8AvpMFNlEw|goa#3=Wu}F*m?hPlt(ux}
zMc(PtC>4B6!KoA8X09fkN;3R?y7gHanQ!Esj!qFKLg+-++*?%Q)Kp@uvN;WNtPy6G
zCOJZ)9loG6<{vwW{Fcw(zLM3f@yEdVJXK1i6=JrjF8?yCvI6I_xS#+Jv8JmjokQ{<
zzS}M@^-&OKwmFx`fTEbw9)kJYpWo3G^&T=KZbi&$b(}g^%qx=Zg;LllnqTm=&u&Ro
z9gnhTerQ6$7mr)PpFs*g>RRVR5-^5`hbkoG5Fy1jiqr0<Gs3-9$LA!b$AY9+Y%K+8
zYD5X`LI)$&JB@x3g;;7xuZSy#l@It<i5I7di|wDX>Rc$^N)4ol3&xh?$-)-BHdOBK
zZso{K>CxE$;z*Y7grA~jM&eqTrssThOD>7fte;`FyYh908ETorJ*f*dOYIL6*DIHE
zHGc>sczdYxc1G{|3g1s#4*8aQZ&S8=jwO^2Nu7kL0gBWG_aDvC&z?BtRm*T?)+pbs
zO7_M4*Y_`5mX7g1;q{&pfE}GdB9{7#q?&SL*wwuWs|&1#0!n&d8b9IJdFa}VmscBU
zaZ2=lp7&%H;35fWVcpTnlT&)VK%sFxXMV3d9cy<6mGT4rPXm@A$?wWjFxn(p3c=3*
z3*3o*?f<s%vn52FIHf8tTyh=Xm2FsGkGo)$&Ftq5m-xG1{!HjLO7>i}UM_VGvpP&`
zal*%^CoWcPqt(u>iP|4L2T`PLF72J_02Zd4<U9VIxY*^~I1L+Fq-oE<81s~#eI_Z%
zd-<`t4tetv{6aMNG@m)&F8NP;JMEu<BjnKlX~9XgS83l!%v0=PH(*;iMsB3(85u;U
zReK=J&F4QG`aN!_V=sClEG-C>4ydc^Eec`Ve-ml2NB+><6n&Y%zDgO$h$iaqiH7iJ
zC6on>wI2zFaUX0t_Q;wqDMiqkTX}ia#cuCR)B7H_frx?nV+fJo=un30xdS40Jcf<t
zr^?LIi{u#h<8h-j7_%hUfuS(`_V*g4CB9a#R1sQ!?0Ll5N1eBR#)LrPf1(TLY@~pB
z{>*m=*cdN<_^keRkCG^j9312IKz#Acd6+0NdxfiluZ*YOFxk!`$}1_*(#D*}a5TX?
z0*l7WAu)113K*;9&we2jPUCESJC&y;b^;k<1H0&pHneh2x5kw4g<s&31o&L+)6JI4
zS#XhfCxMgW9ZY-2l{TJ2{f<(@f7jayiX}kgnV(wl+Hd$;n@$ciCZS9$P6X*CW9@7l
zrv>P2yGpK}ONUgfu_wo0{<2xl45E*oGWFq}UU5lH&WjpxO!emYq`dAvL5`934|{!X
z1dQ-SD7cAt{=akCeu@AbP}zdkwzVZ5ot9J>rMh!Et9=G>X`I*AGxuO$0+0fon!*Ku
z3Zj;JYV?iz-6^#TcP*DYN6ron`&fl@PEMxA6VIutIW5b*bKn)&4g9|T*M<M@<@amV
ze+|Cx(vI`|dW^Xs633l0VFe{k%52%gpwm}f1|~pmD<yR8+knn1-NG_xLF4i4bA$4F
zeKh3Ahp$7}XiISkdddLDL<`^LuP|TE0wvLVZ;FZQKf$o!9LK?>Wt0tn@h$pcXgu|j
zETbe{WH@DaUX&6!Huj|bq+eijeL;1xaN}Ts_VUDrnYVarR}$(6GiaqL%8(q>>0J@w
z4r8x;X{^wKL`JvtvTkT|b8%*glx?SPwqkg6jD`ezYqD&(ZRjEny{9=yk}z1_GDF2&
z!`xg}H48)U)vLeR&~MLoXP8F$5an&@*zW}5Kbkz;TP+_*0p-MQDVextFQ9Z7)JI^e
zj#7RWSMR^%ODFbE&sQa-+QPTFwTHYunyspg@W0-le<b0K@~1OOUfcSmpB&_UylG+o
zg)TJlKCFu(`br*-%FRJL@65tUUOdGKs}|N;pDq`@o)%z8OlUrRlMT+`+KXqiWavHz
z!kxc%gi>_PMM@njiyI7OI)t~Xl9?jRA7haUQ!-L6#k+J4G7K`EAaBZ~U1AP{-a-Uw
z?PR4zig~RjKSP<b?xS(=t$BPaP6&dNBzmhXDO%KgdI5A(ykBpf558$>dHBF5jGdi5
z%IBa-FP_(|q{fIvm$%+}<CHMU-|ampfT~a_J@uahg#WER8cx8)O5lO2$A248<_y}v
zvbzhFegE!7JpewaCS$+OAG2RhGxonV`TGy^R9}mc(oLt5Y?$$O6CgTCFDh|iVReD=
zc*VSto#nN?2mf4kE?wg`|9kYEe?;%`B<%8aX7todL4yQwmc`&#vAa%ZP{>}N4@U2l
zTzw><f0<8g`ZxnG@#i~}^5;!w71n{z+a}zOOKsLSg+H4LSX`Dl*<iQMm6hu+*FXA1
zDY$lN8SyHyOe;NLkhp`Qo%Ru3;uYvL>piPtNGv`9LD5vv`SV!4)VScr0rhZdc73!?
z7S)`DW+!&RyvPXU(*~n1cU2b1)~>($0u6+1+^95)+jAoJDX8m7gxK?^>fe~_>gqDp
z=nzk2`50O7O#JEmpQCZ0@etBuA$$QF|F1;AbRHz_M`+9f)nXZDt`S@BmlH@7AUh2j
zfLdXQ6W)dG50so)IfSu>r?U1B_?DmKV&LWu?(&Iz%X9PzxfAhFN~^PY;^-)HU$d)l
z%~yM6?M_8wq{pQrkWqS;NzeGRoFBVtmY<*Uk)yw9c?Z9s<ZeiOXpOuVwgXFfUYOsF
zMK*6&=+QWazs&v3$+EGz8W7Wz;<I0e4>Vg|)@p+K{Qbq#Z831IVY|-z#7z`FHQ474
z-v@oxb0gfMx)`F1LnUU}D(NQ)J=J6;u@n0ntH!KvIXO52Oe%+HQ|6dE|M0q9+9lJ0
zJIgZ3X>Qpt*aTT=_zq1x7RVo`o|wdp<)zoy{BWG?d33#7duX-vpH;Et)!$X|eE9m;
z|5z1m{<SL75ci|?4ziEi|754rT7<Za|DA4AoWOJ|nW~Zur2{|NJiDA7)lWG0AzC;?
znwq$4$TTG`sshCEY4NvtjDIe(H1Eaz{{`sn8vWOB^V>0YhQ_=`!<r!rc=bbFXKZw$
z&jce)M3kdDuT;6=vQc+6tU&3-XY}`}x;^pu>^ucuM=M^ivlqu=sZMq8Kuf;@TFMt`
zzr2i82?@h1oNlqHbcFN)L1Pw*F7zc0qtqEvc8Sa+#@{Q|5euRD29hCpERW+fZu`@P
z9NV<sHL0rVEV{@ztt3Lha8C*bXTxyAz&NRwd`P_Vp^J_c5cv~=SZC2i(S^}5F=DcE
z9OYkQ;bK)_?qX)8$iSPWu6HX1EPmqx{cCDvA$#u$PCY@E=mt8SHPxTO?#y`}I=VYh
zwJRpM(<sU8So-W5`VnYpN+JC_2pMe%^cpQJEpGdXMEYL~L180`W^-e#-}naVY|f`E
zoe(<5HP|gg6T1J&0vP*+dc!MGI#cE40INh>eK*YE^U#HoKrL;hvr`{rF`MP`y)f6e
zGk--4y=FA19D6)^gR*Qxta2n>c^K&U#r4`vhoQCvfVNjYu<RjVHEgf@nEn^d_ic4I
zF!=xYddr|X(`{=MhoA|;J-EB;N^o~~_uvqG0U<zecL~AWU4y&32X}Y7Z+GwRz0W@P
zd_SR9)vAK|Oc`U$F_XohBSrHf9*jJk^|&q_eHI@|Rvw)6Ant$jJ<n4wrHms{Cs(B#
z!#%V1W@BhKm*VSda$VaDi~I8V92NEn9gN5yB(IU009K;XFHgHd@CdvV9J(I2G}E#5
zgi>hv8872b@5MCCtG4e~|0<;hLP{iL0>W*V&xgP1^x9oZpHAG`LlOlx|2tM}VUK!8
zUJzi+O}4B$z7w>L>Xpw872VwYIJ?*NYb^ppcY2Dw3=a#&q-5mY+F4zDc*)vKx;gA~
z3%7SEu~lDt%B<mO>X+X9>e(}x^II2ilJUm+dqn%!aAqJ+6BRaRKMc(3x6_*Imo532
z5X-hDQwSA^-KKl6Uu%X-+*()bX0Zy(X=0;=ABWu9&m0C0Q$z2+s;IA#6wg|y7zBy|
z!ZcD$)!K_Iq{|xp@5scQ?5NWe$W}}c^QtN;v=&-q`5CODWH7gA3?haGcs*bjFPl%G
z_OBwEeX&Lm#9z|I*gh8|@|2HES)|kDX#Qv`NrRGn19twk_gn<(Hi<B{4sElNdjAd#
z_<qm=a&(k4auV`4!59s5gP=$oP@D}o9ULnX?tQlrlv`874(@@74&w-(jKJ)JHHcw#
zM|TgPE=?D}zZBy-wDas0J!XOPG!sfdYn>q)w}Fq6wq>7~i&-#~|GpTOAZ)x96#jFN
zT^Ks%7)45ytJ=;Qq&=kV3#20v-`@N@^bk%mi!uJ`YREjO=AE4#i=5>Wh-;|+$shq^
zNWJ7Be%JGWZjGHB6z(K`7xIg%(9Vw1D$6M|NatEtkR#Y&l#Elb{{H^{11+-wy#n(k
zIxbFd8h=Rb2AAg!$r_Jl>%Qgjouu!<0z~Fd#n{44ubfQF@p`*8`!Xf7@ZnIQxa1&K
zYm?HFaF3me#-vn1^2>Mu@51~{Lb_R*8l%~VabYxAjSP6ADt1<PHCIn(M?!o)KBGfa
zG!||Qf-8W?`wtcMKO6(_%P4+;FHe02q&~;Fb~%GHdnqY+R~}Z<+D9Im7X*a2-I()E
zhyc#~SSxoNpSQ*XYnc5FueEJu7Cp7*F!z#(FE+c=ft5o7H8BI<YS4J?&+hJ|GHi9?
zKibDXiFqmj9J1!#iG}Wb?55e0qpXG!0dE_9)GEiqjm!LCUB@m3$hrkp)6N-}XA7!o
zRb!G@Dc7E!`nIxIL?OFF@n9^pYs)l>iVsY#AJ7ZcaZa`ukW9jNg3$2M4LU7ePcA?%
z_@P{ZZTa%)q{)a0a0v2#d<re|WAhRRkQd04Y@XBS#P(~$n&pFos>RSHiP1CaoqNLu
z6tn7vg5gBNv9lr`5<_2Z$7}ARh9A|u8C1MolHn-Bb!86b$}<5mp(q?G0Zx`wfD$CV
zcsL&Bx?%(p{u$X@ig*4C<6mZqR4>YXpXmtLNKv5Gp<tnPp)$U0cCt*MC`_$O2PpCQ
z*i0(}CAD9B!K<q6s8W>FZs20r)EFp$vqf?)ESY;l4LHM+y2B|m%HL~y4)`8=2cNp#
zV!}JQ9u$cQrHKz@<qw4gtSKhej(}ELo&Hm4tzqg2NW~@!CpI>=)RqOsGC#9(;chmk
zuUNAdmiF`K&mm(0LS_LD;1Y0UondPD=JOz3Idy~nyIDktr-?`(6|n6&@!N)i0_r$F
zzYx@6?sbP=gQcBccAP-%&fE`TQWGa;H>`e{Cy_S_PqVv&>b72Ve5pk3U1<C&`!E@F
znIzzHbRO<=_Yt>0i8tmrIo1_@b3WVsVFS$-If|0@g3xXG1K=GtRcRZe&#m!jfnoey
z9%wxNxeMU=X`X}rtNZ^)<4>Lpi0#aLVf=Y8aFbgp7<7MHbH3MAhPMCW2z#Rp3mAZ6
zm9<xS`Ln2~sUGD^9krR7n{DrFKeOgG7Ruq_2k$IpES_p=IEdfkYBpMNNtXlYAGF`s
z#bchgEkC6^eE%yEk~Cue9hU>%Ck<|oV5m|=4^Fkj{vTbATeH%A1Lh|l+OwZ66G~QL
zAL<@(L>hk%Sy+Ca4(`IdXrmDy4BVBAKceqg?5;7D&b6VZNtC59Rnk)=1HhS~68BJO
zP-40LI@s?SIxUgA$T~zKr6-kh-~*mJpc(8f9%Ff{@TOzD5&HFrch(95S3g~VN(AmR
z)YVXb0&;88WU;_6W<|%4thCi)$qOeXQ)AQ6tu2&_jnjRBz8I=bV?`&?Z^*c$RB85~
zz&w69kkpc`p0|L{rx;AbyR&GC4u}MBhlnSv4>{0;jST^Zy8lq>I-YgH!zZDW#JJvc
z#3w*-@^DT=t7~DX9Y{<sJ=JInkx0jU{1Imv36-+Npo#yyfc!frowIjS9ph8&d7b$P
zz;X@Fej}u-j-)*7n%BVJTpZiDaTt~rI<&6KcI{6^d4lPcm8V*?6PvdX=9>M)rv+IV
z1J<pSC5*PRP0y=d$VF?LXE7RMF_Xuzc)&*v1@2&#CpJ3m_C6B(KAk(x8wSBX4htCF
z+2fXgm=*o~zC!wQ+02t@*V(*rtu)kjKECTq10s)ug~^*oTw;gK{lIo)8k!jT0U!ex
z@B4ZzkD~XM-1RyPYjVR;g!Z~T`cus;23p9W!!7eiBOq<JM(iH>OEoG<L7g3)mL5-t
zh(R!Kxe-m-uwEep1seay#>xN4mGpn+N=$@V@fnI#>Q0Z=g2Fbbl$68R?eT^`GVB?V
z5{a(g$`!qLa~d31;Z*R}jZb4mx10L_x6bKoz4^CO7TECAE0mw)@cseFFJ1qYBEO7L
z|6P;U*z%K^Oirn@6hViF>^Y{jI_|y9jXT0WO=e>p@2|?&67uShy*U&znr0y7Zo0+S
z7rrez;?6Uvw>|dATaYh2ajTebhQPHrUYivvymjd6Wi2c#jm^(Ur3#m2h>0mu<m2#%
znvf2Kdr!y)m$o=R>S@qaL>vC8m@_ZK%Lt5E8rkWk)1YuLTJ-(~3<mCk$M#4k!X`!D
zS6^{RgL}xe<v&LBA7>KKU8<`O*hZGdl?Xy(AT0A3@OJu<Gu5zLvLgv(z;Q+3vWZ0q
z+{{BjKu6;7zZrk?Hf-mrw&0JDM1_kZe+B4ZI1oBF21HC7U|Ep@r&UFzDE=!CGU1AX
zC8BZRh`X9gVd`S`v$su2{LkkA!{<(1dGc8c?bKgs3|i(8)SDyU!Vk|TNEdp&>Rq+z
zOfSf_(dtS@ZJ@oXSn~bK!a{Dyh_AZ_XM>DIruBCq7kh|O6wKs*&u7&_wh~~+jK~vt
z)+Nh(xgsN&jfvrh)B$F>AB9p?4GAW|W4wp-10y4E&TI?~eQ`@NPyPL&aG4Fj05(Ha
zV!YWK{(-k*!BFm^PV8bQ=wr*U`Sq4%<bf#(4{tW?A({LybLUR98Yl^|R13a3CnqOi
zeV{iuE->%nIubK97=?Y9SVPZ*j!BQb8_>`u^I=8X1Xx(vdw>(h5#($1zTkLp&$v0{
zrsVIRc;-qO+420ZwDlht`%TNA2@}>|k^c|$?^+8r<gkdLv~nHp$1mT%h#5vq30X-r
zyZdgLdNiVzA*4QJdHE?28AKld)X-g}xBx}@Bg*T4ix67e{wdj~>6gRmRa_Y3>XUPa
zq65RzX7`=<fGCj)Eq*6~v+;oIa=Vag5DF(X1}n5-LHRc2pqN56WeZ8&OM#Nm)c}I$
zr?KCfS{Z|yLWP)GDNS_m4rMZn`HvDkeRM`6h^<*wJH?`MRWc-VNyUjQM$YV;e&})A
z#THFRz+){gRz60CG?Uh%zI7V$%kAva#SI@4)G$0u+DvmMl%M6X@De-k=fExV`oXn!
z$FInTnG~-n)skh6cF_-u@=6>YyPg6Zhf`}hXA{uq2~sL+lChMq1ydm92pR>di2xKw
z@)#>oQPD4iI9cTDTfcikfh#y2;@QafTbA||B$O^!J*cKPSNVd7O25NCmd>s%?#r`2
z9*wwKSiBlubB-?Vh002Iq&rk7Kl|aBiL>Hwjpz?m_xYkf%iv$Ap@ttHYY`qzidDHJ
zW0|ep%*rL3Y-*r|IKWl)4t5mNY+QD0bXd>!I*>y;D9hKF+f<ox9#u^A5_qk0=WSJf
zBsNgLsELNK1{{fM0sa<%&Q--C2nr|MANxBXp-rQHbqoWG*}!G)Z^kmtdfA9hC(Oi~
zHlJ-+g$BGn*jZDJE!QZT8xM#Nm0-(Sa0TP86~ZG>M*5@)gMZz9(g#}};ati1J{ca@
zRAcSrqZu!-%^m;;bLiNDN=Lj*Q9CTMQKnwo9#4=IIPM_>#1A0lLM)e&(^egPs$Av&
zuby%pkv!nfkc9K+LB+*we8A#G`Ia>o`6X6QTDwnpbHF}r86Jq|c`i(e<9JHkhYm=)
zTbs`%GlxAKy4aIGr`guRV^%g_zWD^5bIP{9Wkh*^lRZg~j@f@)c^%nbV7b=&udfEV
z0n_#A)E~{|3L#6m6Rbx82p?4OtG<;@)aQI(cq<?lPD0FzNwca_ZS}Q_M@g|9Y$MmE
z<hB%Kom{25p_fgR_T`GZ@%JyboO-eQ<22gAVpCm*LYsLN+IZDkNYo4tyGk**(U`C_
zjjgY<YJs~&AyW9EVOs28qCPnuY;h_H3mb#|(QvusdWl&XA>5@70^jL;fn7z)B6m5q
z-^}ijHd)2DgX@oI133R{DEQ0nUJkBlsq$H^#?x;AJDkP2prS{`#^HZ~+3q3D)U;)-
z4;#6*S=ji|Z@uZFLaL+3q3HCTIKjK@5<CgSc?p>L?CflA8$=mEj)xU_gGkTo{oo8(
z=Y}KWu}e_OB)x?vg=9gI<1k=DOu~CBgYUEfKQO3>5NB*tLE()IXBuWZ9cxkj5@*?m
zwToz*um=qxt^34ZCAPAJlUnaYeCa3P{d2(U`{>A*2g9)gTw_<8mW3*h8&2_Wp9&eQ
zg1(+w$oS&F4>S)+LUKmzK#cpodS~FnOr&2jdNYl`rKPKz+sBM`{FNsd75S|kk;W51
z$)aXimyL3Gb=wQ*BSIxft5{}BtE;I=NlHp`o1amn4BK78%MSaF`dL(6PbB*6`JG<n
z54*#i$p{sPE<%0JBj&Y7tri=c@4yP-#}DC{{Jcxb%w${{!da87R}#wq!0PLq9#<)u
zWArpMG=!vZeLbhoRIFZ};QXvdOHDv}{UFfCEf8bq^S`p(zbib5mBxVUbIco@CG7_j
zvzrMpx+V*CL)#=7>}e_V#$^-K={wk9<g_1(o_>DrLuLU!<<6<A+qs*2XTv2rlCo2e
z20C`~;ku#nd8cl#T=`3E9d!SRF#$?iKO$i2ZkJD$M}@iFd+R}^p5+M(VR~51DXsYN
z+tbm7@K#M1(sjI9Yfe?0W}D9%)cxU5s_^t`hRClTtY{PXtD)#}-xGdZK@$*oBb$wj
zR;S)ewNgbzb?95TsgkZXmAsIUJYI?x2cCmaYt#g!VQ)5-3hmP@NuidI0mygYaH=^}
zwi-=Ay_8ws#idk+XCG$2JX&0m1Mzw!^EH8;M#OEIMVu}y@tr|Se6iXPAp65uB*QCg
zgQ8(m=c-*p6{@eRE8x`L8oZ?Hm(}NyoCLI-+xSJMFDX)uSJ;==zoavAOn2t5mR9Nu
zTh+jzz_h8WPxj8GON1@heC#wBD+Thtu@IzaLQiKEkV#O2O7QHGCR3ew*O>F~k`hNq
zOQ2Gq;DzqDVj*L?;U>QFQGq2u5=TbWMMbm(bOD0Np_?+KXf~3`EwvMgEffzL`WFfP
z_}#dr`Gl!;oY2yRRCZ3$`Na5V`L&{kioGJX_##%ErQre@m8?gQUP|WAg~rIHQ~tc@
z*WiV)kB<dRa7~ku1r6lR6oEW0O2Zn2)?ILy2H2@bmBPLkHd}?p1o(X^#-fDAKum3K
zC+efxUZr!|ro7d}18%!~AuL(vet|%Y#ATzLCu3z+41{z|4lr@5RGaE}%CfmsG#6xx
z@Zdb)iBRkF&@jd@fp5!Y+NE8Dx^w*OG^*um!-nd6bZ3mcp6C)=f@WQF`Mq{M|2|0e
za43y@F*&GPLr@&lDI%9=d$Qc<xEam`*IwoHD3u`QyY4ydw@#A$`j0gGzc&xbl>xk*
z{5^9W7X>Rd4lz)Sukc)s9>!O%26h2ix1YDXpL3w&6eb*HExYC0#BcL1`=8a(n_b3j
zmE~#Q2i5OiU#xCyz^w{ONc|PcRN~W*|9&TbK?y5#e}}T0?{Ld3=3X=us62dz!g2Vc
z_qO$JSd20nT^u{C5r=&Ry@oaeaf3sI3Rj+Fp1%bahnw}c)B|e@QM|1|q*W>^86s?W
z>{227r6QLeyf-y+YNaa}S#`KhSc54j+MjAxPO^+iaV~S%u%$aGoG`oyn6sEs?~`qp
zppR@BX)v>+GQ55{c=*+-nzcO?#nElK9c}$IxvMZ_xl`!uN;Dr<L8xE^xfNO_BMRQi
zf}Q<RgHZe9uwPyMuErEB>;@d&Jymn*>B>||?qnsENw`}H5l%W}&RJRB9XDv!TF!>H
zis)0;=9wI(cv88_OrrPIRz6EQW%U7V!~k$x1R7$11vU)Enf#M|yU+7)W{PMvlp2^i
zokmAfun3Qsa=skOE_@dGzzsNV-hjwJdeE%vq2e^H5A9%YY&A=^T6UpV^n>!Dyb!ct
za^(F&g><q{M@m>YrJzu$M}$^uI2$pr=_r!{5GuuJgjYe=wXEh!HaaEWD(AUm3pm>Q
zH>n1Wrr@H!qdY<ToARGo4l`!iAwT32N864FO$E1Y6`DWCEhGi7)ZyZU>ed0MZGWC@
z>L;PBHK3Q^AeggBH(t;3!~5W2AMDR(HC+G^4gK~#51s|VQeI$bZhUQ_?%-XQ7Q>jA
zYf1kSo(;WASf|}olmKVJ?vp9Mpn@6nAV)gxm_~<rZ-v=ZfK%Fwh56-=_wMM%!$Q3Z
zd4POniG@uTx68rE2W%jSG<-g9967M!wnixU{ytFD!z`yjzUX739X>rU-Tzk@|D*9U
zIQ=^>ds=myjrRA?aE<gpN!ypE)=$>fP_%upwtL*W1ay-iN7|@GItG}$4I-?<Khc1q
z`eU2jRF$QZm0S*ohJ>qE<W_7k5TOzvVtQ=n(M8Qv|L?FCP$R+h&E(7^KsY%!yox9T
zsl#fe;N|4D>5K}RW$8F8DH0&$nOn-ndL7JNZnxX1N~p>C<xm?m)J`uhV`M{T+Fx~E
z6ke|7SLnMYmc_?&RJm?qEi@FW(9&9CqOOux?=Yw#sFRKCoS8Ub6w4CG)vV`zOR=vc
z6NPMT^S;CY9n)DJgUQZ_)(PJj*iG%A^PGX9F=nl!bBEOW-vtp<!V`W0LA**yNo`TU
zV$snWO_(byVSG7BFOSmidjNkqESB1ywUdt@OY{AjgJl<!@Oy;S)3VWq+Ad1k=Os@t
zd<7FBLXVmyQ~MffB+3W(qH+^{U_M)?abv?&NoPj-!{Jl6D5Ytktf5V7$22O;&r3yd
zLW&>)z;6bB#P)Ehz8sl=o4Ew)>|KBKUSUTzMCX{mtq#~fq~BxNp)b(Kb+`gaL()X;
zC<+ISTavg#@(6+mS}kTzJ|mp}x!;)1Lr?+j%<>qnXAx)6Y%FVZ@5@sbnhTsq3YyNF
z(2wbrPGe7oV_vgDGH>rc;scV4x{P`5Y_z^vi!K}6JAcM2!059&KXODeLy$Abuc)pr
z0n1>mE{o2%LezIwIOCi^{NOBvRcjtAzz=iQ?t5odT&3{W6>NPkmU+`<Nvd>mfT=~y
zvIZ0$n^|;OXZ_J+UFUFcl)TKlZ#a$coV`*CjJvRxG_czy=OR!97d>p{eYN3T@{l~e
z;M#Ht+be_QK#ex8L{29TpR<wHnL~W0C&YeXz46@(Vt6tl8ocVlUN;;hf0*~s$SkE2
zC$@m7pz>gKqStLwIceBL1x`;zEXv3K^6PSLqqLkp)%}0<(6K-dO_>a?G#RH7;9$dA
zQ7$Kp4nA8b(UvaOUz7Z{xhdEHHIN6g`rZ~Ix5l1aq%Gm`%q@az7or=vn%7R4I9tD9
zYaJfaRXeR0or>N38Y{DQ`eHXa8<9PCN&{O}UA3K!#28gA=$yCOhkm~+^vZB6be1)J
zxMX>o$e#5Iaer)g8W&b`br&;4SG*M?%@mr*aQWDL64My~r@?Y$_cSoV>NH#Ol^0Q5
zCW!>tvrP`e=TpO?*P*^$cFJtw@%2gcdGzcl%ugfLZ+wt`!#eDK>~i0UA|z9=gpKra
zzla@~@^}PrACD<e19y)#_gkQ|HdoHZcFA0b353OzqHQ*FWM!O&%rw?Eg~_F#^PF__
zcSqXVTmF2jadj%Bi@kc{)9#Sq@^F`U)(ZVH9jBQf)2(qo$nT*y)=Kua_k%_><wXhM
z_(M5TWS4@^zYZtI=SejipV3J##ri0AFcD44Ji_^lCtM)|9=CR+!asd=M?}EBp+mTY
znw^=RmP+>b48${Zx+;ifb?gp?*igKkq+`peVaE!IQztM5MDU{VVP6XyDwI@`7@3}*
zKkct^38$>-(U&4V3EYli(Ue-n(D_^g8%o=Uu?xr8#^_>n^ZDL>7MD&+Ti>UG246FH
zSkFdZ-EFI%6#UjlI0|{~^nMj=(L2NXQ^}=K!xMYiL*V<7N`kT>;zT$o9FPm3&q|7m
zkqpkrBKgq=$*wfs8ge5FLp3PDVVOY}!Bnt6g5u%SQgjyqWfKbWv5vXvqHUKD=VDR-
z|0TYKG*7}FHnh_|e2XMLh^m4rg!ibbFJt5#KJjHJ@8QrYSm7e9GjGJw+mcN57?;G>
zX$j{c`E^TjC-OcqIr-hX?i4gWM7b+L0oQyY&j{7QzOh2-bv{!R-L<VPsJ^m*(ysM7
zfnKA6Bn;9@;Q49_`U>d_U@wR;%(A1y1N!0ZtlQ?*h=GkAbf3({>5KfG($3mo%qxLf
z+xJ1Uir<sdtH*9u2Dcrz&w*JWxI5IAj~K#XM9>x2npZ>U00+<klRp?Fy5kVb&gU^X
zO%hEp*6B^fzYLG;hKwNsC}EU(sTReYu3Nf~@8>vz@cE2VG!}MFb}RPeZl3H*_kVG4
z|ACwQU2gmYN&%IXB&C6kymdwG{Z;hiS#M*_RfGYaEnZT#XnA^l?U_NFAph!)UEpGh
zkKQR_i#q0b@w`WSsP&A8E)R#U5@yjM<{JY*b4hu!Es0hRyL23$jzJF;oJGJsY*q53
z_q?Z;pSInLBtqDG-K{J07dk+Oqg!(zke=x{8RB?3!bMS1DS0|1o9tori7?Ro#jdFh
zh5LN<K^8dN9x3o*@@dTrh3LB6SMc3QuBLGDY7k(X_N<ieSHkZ?ZU0<5H~6^bD<&Se
zqqe8*$<(qJ^R>ylay_%$`@EoW449QG%Ky#w)m9HY%aXz_Vr-QrOwaP(FY^2}`JKei
zv#kK@KegD&`%LC5YuW0xwbNK-qa5qsjJQnOKg;9rfi$;NPtf}X*Kx9P^Sy!i1Jq!t
zmO8x%f?jQ&$WJZKq2W2K!GmiGL|nH(2fn3KEjVN~1r8D9vN<p0D|{t(YLN346|l8z
zX?eEY{XQbG&D|X@zClVanML_0yj_IwS6odzQ;m&g&|xo?Rs7;0!^I3;M9iu8#+Lz$
zg4i9?VyKp<;Z%w$NirDU`wZC5+nTU$A+57wMZ@2EwkWKo7tD>9&H4Qu7e;_;c!PK5
zVy)aRf%w%paJtUKS|oVh`uFcCO4B^LxBQlq<haH1#!&Ql3UBTti1wx+WV56}GGK%3
zc0nL)AulL?F&h+gCS1XTP2`;o0`x{AAXBg43&^9nNHC)&A0|;P7Tk@IT@)4GH}445
zL2y(`3z*tOQz^>pA0*T9Cb*_%@`t$gYOwldyVMxQy4#@8(A*_q9oUAAi2Fh(;F{N+
z4WM7Ljyh)(EotRy+b|46wxkw$Yfp<GX%O}y5>^;qvSMFjL1L%YR6^E3bsPO`Y*ZxU
z<{AW`M`6NeKxe)O;k!%QfCj_wyf@BGfPBRJ<!s#mAKXw?#o9($J?23_mQmY1`#w}-
zxJ6BzuT7gZ{77RwvK!|qZy0A*YFckpomAm{I<{<KJ~1cHoTiYmMqdJhwm*Zj8G+{|
z8~YyGR1|BQi1*KM-rl6lEy>y5%AHGQi}5UbK^CFtM7!qWI%f0FYoEfSGI9?UWf%M4
zp#K+^{qNbtueIPWi<d+A52~F)**<xBrY@eX-iKtZJpcfHgAI!iA#6a99a6s+0L2%#
z2q<Oo-tVVz>qsACqQZ!aTpa1CuTO?D#jpw4@5nu}c;47FZko5x@1Jv?^<ZZp*;UuF
zKEk!uI}g(2ix#g=-LF8x_&yiw$6t;<N?@;?w4O3K&YhkdD7BY<pZF;@07#xHN*R}I
zABW8a>1I5H*m0*kaS?9D)PY^hlRw0mEpz{dJ!`8+=BnW_En>f=NJ*Z~P|tZAg%PlG
ztLISzE3;<f<zkC72yOL3ZJ$1SdeuTzxKHAOZD;miQCu)tx08goE-v$3+>0W6;u6(|
zntm&-)Je#?r2BWIn$9kZO39j8#p#CgmVkecQZjyL=Q=o?!LyzbDc;(?#>$Q{qm_Z5
zR@Z6K1ZYQ+_ozZLJENYuz`8d!34hOt^NEh+SpPArZ?S)Pt5%We$@|3q{tw={rXyOG
z3^a+82V%*M1v*%EB?*T_Iz{h%9w|hy;AG0mX%f>)^e)oJh^aE$zhs+GgXUZ83)}GW
z6wR1u5;a4Iw)-MWfSD~?c?vSx&D%=x72k^P*I`aDXEeGWxtm#C-oxVC<D^PZxCjCq
z0$g^E4T$d89Z~NmA3m7O6FdOi&C$NwOlg{u<6{6tfukUj$idP!4o48gmd0d|Vo)wh
z^27&~&?Rs9B?&Ka)+O=Bscgf@qNzlO!hU8rTyX^_lv$C^qjVIG#u8;Ygnuo$j|;Xl
zW5Thkw{uEHJ4!}spO@I7b4rP*VVUi%u74RezTPS&sI_bgd~+3aFGkGHmTr-6BRG!s
zJRZw$dsJz@_;x>eGnnDvJT;tUW@g5a|5~Jcn_GFTX_RL-&0dD54Hgy_5&^D(kkusE
zhY=p`E}_4JPOSvNczkd+EVEAVC>kR1{^&Q;WvWn|EZ>0!^s!nWZ~rFQVMQ%lCL!_7
zY-a07hyd7y-GJz6x1|S;H`(@zqSCx%flZ)N@^vrcr6$(Gm{EGKPe()vF3Wt`%sXiV
z*lvra%JlklTrb%P{xP|joe6s_J;sQC@c)ANQ-EF&Fd)ew^q<B+k;;1aQJGx=^j!=F
z1?~FKh2)PevVxc<Yc9|oNxxVO+0NE*3XD}sXg9cINC6;Jzq>cItjg_4z63>nMVk*t
z<bN91H{FZ+!6(r5J6C$UYKU>|kJq%FsE1%zQ_Jc}x{&c@GR|Vglee7@yl&@pT<mz#
zsOz^5)ZkB_o3;}OCoc;m#Rt;cpB7NV_m}U5&3#4c;(GmIT|O@@ZQruKO{33bB31K!
zKGc`yo(9}dQ{&WC$fw;q{~)~lycPe}8n-ZID4saQP>)ky&uquUFVb`AdPQMe4<*E+
z9aAmrAA^|BQvB_!ckPfB{jF1{$d&a~(W1l=C+rVtb1gu2jSquPCf(zHKLj6seuQj^
zx8^!z8i>bBuGg_TIN09b-K8N}qStIia?^x?@v_{gl|+QA-=CUnM4Y@nPR;lIn%ln<
z!vHx+Hb`?uL?ZyWXAH0M`p$(GkGO2JZmfH`|3)K@ZEHllZLQXbYlw|cJ={9xP`x;q
zbi7~Kq~kDheC4)TDgx;V>n0=P$I<yV9n<sd1b0qKdt2$XDQVFa=hoy&>Urg>5P7=9
z@?ThmnB1J?V}CIwF;FRYOGS&0ory%tbc}1MwMnPfY2($Ak&_-%OyX0XYu<F?w1(M(
z6Bs35?*UppB~-qn3J5wac7114=snnP<Y-=RMBen@O)JX}0B5g1!EF4Y_S^JhfRK2A
z)<G9dKmlN1MJTb!z7Cn2j)ab6atN6R{3u-7Yj|(uVfOJDftUH!EX60-e)0*q-~3Qb
z(;pD)X<JHhNe@`Du{)HM{P>K)`3qs6(#@z4i&-=8CHdS_fifQJ_V7_?5m%nodpr?%
z%7orFf=5-12ROiH*AJRZ_zty)3A4=#d7|d9ZEh{0gQB7$f8CvKLD%`3>fsDF@!4{H
z;@${64k<Yv(;^?#OK9rVe0jS-?Z+W7By<j-Lr6oqYjHhZtXN<<8IKC?z%xze*cVl}
zxEsUSp;&mBPo<o$COS0tN%4M&F%K_^L}@-sPIZXW<T}h1iZ0jWa!I?KU`Z>_L2Y;7
zfupFVN|t>vSc-skFaAjkWRKylUH{;2P^VX&g?5AekEcCxA>i6}f`ph^#MJ=t+o#{l
zTQiQRa6fbYS!Vg~R&ieYFKdb0*>`8|0I+M&uAW7>zM@Hp9%NnE`pa)UU3I$e7!@`K
z7U89buzqOEn39U#;ikBHTYAom;>Ss=&O9N=-mv|X`$dR&bAKJ1K^b(XuF0}FZOrzi
z%dhjk0eQP-j*s=$<<EXHzB{kz2Q7b!B0Aa%K&*OQEC3|2iakbs%fo}AFke}gr{XxN
zy`7jTsPbTvKM)dh6}vo)!@gKt|0(CEcz@Fz)&Q(f#)oo-V#TOh(2p7oav9RgyqcMT
zd?AN#X<ko;kj|lu$VraZO-6+UCDE#guv{GV{b4*vz$Gj6aL$%g(k-YBPOh)PoeX%b
zNx|75H?Zpm%Z!2!2;gpa$GUTEJjF#<v3wMho@<<mh4XSArgfI|cI`H1Rb|P?j3ixp
zw6+R8#|t<b*m>#TnB{`E=g~n|iS5t732@bN6eCkH#dK@676*&3W|&J^-9!WF*A(dL
z`RhKZ*;y)9G-WN_|9m)>X;bW683>Aq2^~wuGT3v$`{4dS=d@j0pZJwJyU-FBkB6H|
zgzDt;^UBD8!{-79G+Bs{_mnbGU1&o59nEkBP;yY3sCYRk7Emg%=%#2G_h*2SYj~TK
zDWC;p^?AC3;4}(72PbbmUMu71k_{M9A&NnX;&n)NtL#*T`*g%#8II||X;)Dt3tU{8
z3-S?H7=tOt^R9oSQ(a6=89~?;i}}KRhR2jsZJyq&MvW*BtejqW+NvDTK({II%bv!k
zAAG93!AZj#E4Hh&=$;Sp>$(ypLq7y5AB;x}xR4i<jXj(Paz3yyZDR%6q+YX0dW(sb
z5D8E#N5X+S=8b;p{E+8W3VNL|)>l?8C2{-tbld(KF1$XKCkq@r{05tpV2m^_6}Jw^
zJ-&t;t7&S|NMF+&F;Gx!q>wu06xq3UzVij!pJTUcYv?x%-I?sd9_FCow=J+3FjUs|
zc33QOGZpqRa#k9rh+LZCYu|mhOB;hzPEFV|yj*Y(5lWA}H}hOP531UiPWS6Di*<*H
z5vMVb%`qUQ9ZThsZ+l!hg?skc#iTvT1kgN$x$NE2|MTqteO|&}C9Ks2#!K%H^6wP0
z0_lj4M&!3WL#;ZXFpKqns94DcRY7z@b0Cb)sQYS0@ZHRxDJJt6e_QtH8;j*kIXdCS
zX@*AV9g9qJs?)LGfZZtl36tLR`U1ZdLiO6%CH+T<qmWL49JsiD=<X9@RQJ6PebWSZ
zl#m2r1LK|nF#ztBZzKWq%V`%?LUUU^rUFTWW9Ze$2}OI$g~GtFMEqtSri5Oef7~E-
z-qyC%Vp6n{z7A!3v)ebXOZiaDoMW<mO;9o(q}qpx!agF>%%^Vl0ZM<Xd=Zs(Kos^x
z*CAwDWe)!Bmz`zN$yqvG*6Ir=nI+49MurQI+yu(NmqkCBu>4$eOO-W^xS115>!~?r
zj{T+`L5D&D?kbShoNZJB!}i1XJT>>7QuIL2rLDPFtq)90B`PFezz10dhO)_N%!Lv!
zFQJhVAAQ8&k#!VHk8P{UYUEZm6lsROA8z#qB}z+6B|uFeqMZJQNm`!NpqcY|G1||}
z#Lf;}#89ohzBqV-y%=n9`*ofr$iX1}@mC21ymtG^4PdP@H+L}@iX$QAye^C;z%GJ7
znau<u15w~l==+ft7Z*eGzj4;o(_;j-jzxl>_<#j;TpmXg2ogUMTxnkti7Z8ER+Q-)
z!8=nhxh<St415yIJiE}Ixi_vkh{lO|6r`{S!D<Xa^H?(uw{H37PI(3SExijao+)k=
z(09!nkJhkftwl(i>;xSrv!!Uf$G^U+oOVAhL0OY1VM)nHF^K22fhbmrpnRwht<7!^
zx17C%J)67ACa$1Al$VDG$)R+x)bV8Oi8bGc$Pb4L^uEQtn^D(Cc@DOE{DJ084cdf-
zy~o?Gi~Lm**o1-*b#}JV6`=nF*$!OnWhRnH<ba_1S$-dxxq&1()(&xp9^dFaQi9zs
zkp>+WVkPDKlsg)cSQ_0nj4dEo65nQFWLr~Bv{T8O4K;-ZO0Q)by~+w_y^P8BtjV?!
zTyVGQ8+gje;O87*L(7Z={KJASfRpH$Rj)zIZfmUvzNunwX7`R-7yWMfZ*}cE{t{~Z
zBZB)+RJsEGUrxRsC%kF@l!0U;Ixm+6&)#rn{%cCQ)%bMU0FSYUitu^b^OFmnL_XDi
z?cC0wTf48Ve3M7!F?B^Vc>P#rX>+F(vJ>XxfhF&&e`t;u{KM_^N!gy;-w1+#A*KiM
z`L9q$$%4yYqjYE2<vyaLe5cDW(5Ns}{Tr}<yxX9E^m319A=_oAy0GkGh0`jZ6QZG6
zx4(t<N`3PW?~7oFdP>tUnbBL&jPW_Muq?KVS(wsKj9k4dikqeVk{C-&dWMB*Hk4TY
zRDn#)nl<$40Q0+cYng}?$EVNdd8~zMBrXp~<<jYkg9o}e;5Np9n5^vFN;SBh{C;WQ
zb`Ttvg~?*zP_FEc&Wk3q<jMk-kL{fI2gIuhvZ{OI>SVhKgOZ5QLe9J5<mHk6y&qW5
z@GO;aaQe%$%OuShXcG?}%<d1R54ZQZhA5=3m$2emoLH%sbyaDp<befgpB)U%wzE=*
z_cyb_CEk}v9GUMR3`IpuuODPt4@Ux7JzqW*mRT!ADL_iV=1#FXHVH5?$fA7s#C!;8
zLcr%*0s*TnqJNp_dH`mIlnBw2UMW&7-fG;<Kw{nwp~|3kcX$7h;Q%KF<)kEE<(^$Z
z{tTv(1jj%k&$Pzx;}e>LC^o^|xLpKWD0jKxykL0)#Un2Ew*qw>B7UZ*0TO;6QMgU{
zqw}XQ=;7zdW9)}BQC}NA!4(V;++oVbo%hWOr{2o}nvSWGn^4G>!a|YgaM2D^+hO1x
zh7yAcO3<1?HL|jmf`rzgennyCKbc&?8I^|b0`Q%^A?j<C(bn;_*_ya$_H?liY-I1G
z+PT)el+_N1lj8oc1KrSgKax~X2i_#mA4LP(lfoN2EmWC)_|0G({IXPH-NA+KGQl7U
z`{q#X*rh3oi$R0W{RxCUmB5jOVtTVT>M>stF7ObAW4*bL#4WQ>Ln&{>cu*1O3P5@{
z!COO(pU4ek2z_tTBY8Hn@i+JTmP-OT`F7`(g`D>kXlQ8>Gns1IwiC3s0Cs;)VsbyG
z7!8of#X=qay}tH0ruPqb1O)8=Zre!C6S`4{qW|@HPAlRB4Y+8>3Ew_VD^G1d5Wm=S
zjUMDRD;wy;_&4sl{gPB}(jFC5-vxHugiPw!TtflpyYn~ifnCY}qpUn)1dH~}NW>wQ
zx+DhcCQla27SVAID8gUGTaQlk$08ESsgX4J+J!qx52~!6gB2BQtIm%x9cN^jhNkS|
zq&&pz0Jn;mp_g41p6#!1AdQfomwX{Ul_~DkR8^^MOraN++C`~zurl9=9knfmOW@bm
z=3k=V9p4t52VTtU?n<t)!@{YTe3OaWPPH=aT(qJo{~Y)FeC;JEIX2PXHR8zb?R%@Z
zkAz&J_%&6%G<x<s4ubZ|IK5K>HL~s+DgF@N7QC-EEr)C&qR8%HmC=N-+ss1>zLn_a
z(%`M2TXYTQZ2zKZDD-f!H%V8?vS7?wxxxbqPL6@$(H$o(bCdnOmAmDM_Qg$%YBqPa
zi5s-_d-n!C7f3G(NKd&mZpDksOX#x@Z%&Zp0hoaSkuHi%(Rj^$HyuJmE}fU7BjRc|
zk|BT`lFm<zK~uo=0ZQD6xFOyF&Rom4+LVOidB8Zxf&5?(emF$mCazLm=td-erieN6
zV`f;r>xD@AN$$i~KlbDRA5Njm`Ne`zORQ>nd>8WGXssEdOhtS<K|F%NmKsI0w^oNx
zc@${FgI;xNH2`Wb6=d>ka}55;aD2#>dN;@|*nYK%6C*=)F%9WaJ;7DitMLlZNQy$2
z@rEy!Q+Wfy@5rE-`2bYxtzqJ(wuZ)^cs=(l1qDSFaI4JVJ>Ok_i{*h+af0nJMBSYj
z%<i`bUIEVJk8BUUPqrwF>%`ugXn0WoUU5AyBHpXTcUhIZGyOCFV;3j9pxB&@(5QHp
zxs9XD9yIbW5%GL~wPyBc1d{tsm9cf7f1BD^+TF;#S{7Ic#G#cCAHQ#IT?ZH+A96r>
z)|%|@9J*DD*_jJAf3l8!_<sT4Ie#H@Xm3uY{;W9Tntl;O6Y1I>Dslv6xi^UL{+{HS
zZi~W*M^YpW3a6Pn+b%5&@g3Yfsoyv0k{vH39eZ)jB_`HMTk}=v*vv*^fW=4V8aE<o
zQ%%iAu~>%4$TclWRcOfc`%X5~UmNeQG8QY&>J|ad)4`Y?>8)sS;&{qdq2^Nd8jD~P
zle)F3xrk-1?_!k#M!#V0*WpK}4cLUQN-He^>$_}weao9-Cs*!<VMTy=FU*&T2aLbr
z5&@r$widuc<6_hwc2XB+m9iC$%k-d7cNv(V@}wi+$V2l|KeuTTc|HwT#Al5JN0Xr+
zP`|x*6<2n9aacQ90mhm8`p+vKmeZd734&RR#C-QSC|7J6rypi54RY&E@-q1B4h1d=
zW#?1a9h4ewwKNqet9OTE6ZJhLXKgi@)?RkFw$hwN<(L<AzpfwO%RHV_5m4o4c%%UK
z^7LszY-XcTfH2GMR!1hOrIi`9hUYoDKpewjEH>2P7jX4rSzDr4tL2?Z#?*4<=qB7W
zeSLLV+gfY*#XM5nXRYmGY3)htbc`}1vi)VmZVR~BEqUf1;Nx?M&$}vO6CU9Ftelrd
zfP*A>I1(=V%iN;3B)Q7I^OL2eIde(->7VkW`PhF}&jj2l?{pr&0t)vcK;cd+l6R74
z6}L9Ls@q{;-&mtps-#+}nHL67I%`5oKfCh=bD%Fw71oC5d8asH_6jy8rGM1tO(MFV
zb*gXs`aagZC{0R7q&ipVxC|ug`dFG9SX%z6fRAB_ugWb^n*BUa%C^g(q`)BSx6XfU
zI`^xB#oTRVj5j>VYhN5Sda2DRWoueRYG@}0;&Mbop=cr+f4jD4+wt+|kPC_>tC4-#
z)9uS;u7!adGMrwuoS{KDatVkc+D~6!%w!#_P?`De#C&#;E|ivo*Iqv`Wa)Z^gYnR-
zR7t;8bd=jLJB`D%ir(EigPp@_Ywa_-fuWpU+ZC}2`8{ml4{=S=_@}3~AX6vzaFZ<z
zi>u!_C01S9*O7G(TCo1w#s&-^QV_E}sR8LasR3C9wE+_ZnR@`$>t*KaSL%u@ft@5{
zC=p3t^cM&tbRI0~7}kL-NjhM|W8_FHne!l<nZgzzp7BF?ft>fX3b!D+Y?oK@i}F<i
z6zuzF?BE*JIpmtu>^dVEbL3G9G-RvGs&CxD9mCPoym$5Z7~jyWC){lrcTUe3uzC{r
z+Tp;Hr?1s+L=Z}<>cm1zo&mb9`-F<`kg}<R=f|nP&sSR0f9xsC{7zBXtCuZiY!ku|
zj0uDB{#_5$B!)=NZBy&*>C;In-|*4suajTs%(s-0ZbLvj^5|<fm+s!q)78n3inwS$
z&(h53GY@ag_W6g_!@!kvukH;j%qYQ5HPvkOV||-UTG6|<Ghw0eit7QLrOd>{-SYRu
zXGefr(TEFtl)%f~<_HG`oqZ~&t&FQdneX>D3#+-Z^z&ASO)(mJdiKLgv%uBrZV?+w
ztQF{IvoVjdGBx}9qQ#@Y=LtJw^V5t-L|<YD2bA+b{T+K>rK4Kt-xRLBrGmYnSC+#A
zJglm`Ob#2F^Ye2tCr^}lBte_Xxd_fS>bkL$v5dx>n+M~dR@-VK*OH(NlQ&}GH!bd$
zX6^v5whasb98Ty;?9vs~{B~<UdXnknAoIb>9W?70_K4iDX;A;;N7o-vH=W_o{%$|^
zKGXd9v9|@_TUTcT`PhTbsoL#BdysvsiE}SQNyjLRzrNQ7Y@p-qwRl=)W_i{Lvt?}b
z2f$gh#l+O?zOUd6x$jqw%P#8+Aa@x+;ad4r+vzw2n9oWgO84$nXD9^jdMf8VX%jWP
z`oS4?HrXGe2@S_g%;_@eHaka~XLx*?<akk_prR6IY`kJ!$QetjQwLj~HXXV`S|F=B
zUb}Cw$qUf|RJ-~3Sp-xkIO~0{FV0qMuOW0~!CZZ7L;{4raL;Xbto%^(X79kcFu*sj
zc!W}7Ai`zZra4`u3W@7G=?2WrEIJ52mQ-(jr(;ALFlK(a9BZfEdkzi5aiEp;eFF;<
z^!+~BJTn$;^;Ln$<4lm}YFzkvjO97PE8aJpkWOCUIk9Qw!;*mK)wHKs*wxX5z!rCU
zPY(s_&5FZCeWIS#_&2}a7q7s@r3k&q`ZX_MdWiNB5@@(XGZZ-~nHav)7U2jS_KJ_T
z_udy>!^B%<o-e@ryoX%XnfdcSbc6@%+IMSjBZG>t%5e+UHbqm)D$17e$WtF+d9018
z&o56*%hn3{uKHH>gSd7}%MVp0r6dNbTRSpyRIBo2&o0yU(Sb>pmBd00B{oenQ>iaf
zG1CcZ{gG2UL&>+kRIr%u9H-**B~LR5OZZ-K4eWaWYk?f!{!-0E2H2ilR+k5U8fx0P
z;f7L-oNKik`T1~KaBVK)?5bNAsBy<1n!<4fulh9R!YaAWAXJ5B?=f;rePD~2Q%XlB
z=V|wvZ5!NXD+{+#REwXZwqXu2c=QV~xtU*okPeJvy_Js%dolerUWpJZSCfBgI3i$8
zVS(jc(N(P3yINDn+nHTSO`kd&o#sI_63#8$_1ZqcN6Fk@0p$^?<j1jOE|J9){FHZs
zhJqx_xc=5fttCYeA<qxjYzumR7?9XBCStHUTWIP?5spNF9sU4yYDUIqkdX~N!kcM?
zFi9*;)+{6WH(%XsIdvX1kzT=x)5nWpiWZxx_h~d(S2a=0<|NXyzp%|VJoLq^>A~&Y
z7-i#4i8P7Bl|*Sn&3ahNJ>`K)=c0xJPl~|--VXAW;1wq0`K1O1(08WUZJW)$*@qhA
zyZS>Gxy~T$YWREBQN^-b(Ofe>G4-c$^G#z^-nT#D1?O-iune$Ti^qF+muhBETN`@k
zp$Doc&7VrNYL#|I)6IcXRRb_1*K$%)tmdrH#%T1&5)o)sZ`js)rDgKU%x8O<QZCs{
zoF`kMQJlj2vBDT&8?Xf`D{mub!k-tss|7d1Ag8lolOy)4@ie@7oEY}%1vQ6O`R-sw
za~1kf)1gAcJ9`Ikya_P89NzL-J5Y-8i4i*(2&W$gXY8dWC0RI|jsiIG)&u_MC{e&7
zGV^RUtS4nV^>-BvKJK#6|41JHBbOW*!5#(R!^4~!ZLB!{^)cFt0JJRseCwgP4X^=S
z1>Y$uVh#CQowBj;QGEBdr_0Rpps&1;R`R^=4beX;JF;i!DR@Nn+_&u}<*FY!^Gc?}
zim>&ZB^7ow`N|pJwpd+T-OuqEZ|9}jP20V>$q?0CYT8Bg_ThYrQx0H7oU7$Io>tyA
zyEe_Vo*`UQd-Q#W@Uk9&#?dJ6Pbtg$S$i_667bONPd1NS&Rc=LU7-^v_MYan#REis
zZ)FH@ac!?~w`OIgQ0~(>facO|1!V~)d5nJ(x$)(}y5943fdk--Db;n{<1rF3mddi6
zjD6caL3Z+a2nc?$D>1QDJIjj$k>KFm1)#0Qe!XiDYg`wGC~tjeYAKP-(sB4R_ckl}
zt(*%G;Ku?PcRPK3c99IDfSM)>a>aP7YLi!DF6>L=`E?*-0hY9iP7yI;#JUT}B`}V5
z&wVxOhV?3o6EQYWy52Qpvbhz$Y5&%N8aa*hUGlz_HW^Q-+92WBSd_z>*${;}F`YQ_
zyu3b)O+1Xf<MTI$m{fiGL(XjpL&cCMX1fr2{Z>g*;}~+*l;H-*_jPh81vI^RKFD5$
zjf~e!z2M4(QZ2w{M~H}QH)CG;*IZd(U0f}XDXTo>8tu$_FSc*Y({CwUr+rArAs1m}
zWSv&S>S>c*TziL^1oV4Tm*`5>1o^tH#3Aof#)PA6yb;tiN=3xqCr3x=n7M(IlpJzp
ze5WRw_lI7Ev)B$xv=HAk)0-ruie=p0E>s5Asx+JGWaDX^)Fo_9vi&zYal<BZTSRWv
zx4lOszxiaxA$O)hV)$XYvmnqTV!X+E1M?<JGH*TPJypsJFilC0WfT>o`J14+fW#qW
z4={GL@IlhwNA?g&EFq<AO3)q(-y;Pv++}Cp&qKJeu0iApk{!6Bg6PlJ@sr|M@S%OU
zljJLXaO)43*e;WYl8t_hBiKS)L6H~_;k8hkk5Grd%k+CRDsz?0fvPa%or9`5g4br#
zf3##Xo2z$NYOQRSD2sjJhkP?-Cg`9^osh}?FgT6o<9^=vCD6zAP18o|p(LdaQoGUE
z;#9sowjR5Y6R?{oU9Km9nIy|H-hFm8^tTrPJp|ob<_fyHj*>fAgkGj=tH2TKtKHB{
zuUU|BGd6p{c+wpnrLLTj(dP8ntmm{<r(Wq!+VS<KOxm7RIope0>_ixMMZSSJAs-Xt
zDUliDIkT9M>+)mGai?BVUuQ~5XKQD}3ex3Kr^o!_VYna`LLTrpQJN>St)kD*%fq8i
z$`r~nsp7a~bA3Fn#}_dEt$e-MvybFB?cDSK-%9+M4LZtHI|LgX0RM=YmC~I*JB}yB
zqjl}Be>D>o`iANYC>R!!BuVDH_*}LniMaEh@tH4DtjpO(dZ9vbF2j;a>Nz*Uu7OpS
z1z~Z0UtxjjCXl^Az_GJT+EwAQ+w1d((g-|O5hAbkwkYH9{U-pl!2c<oH3CS7NY}g`
zbqx~Redf~L21DBUR@XjT<yM01m7jg?0Wa|52$m1|(Ia;chhjklOKRq>t`We@LP~D2
zJfB&v06MFiMdnbu^#D$UET<uNaSpi^-05Wg**RIz{8N=b7Z#s9om3*mVeSqLz*7ua
zLbK-j-eQD=M?_s_rckZDXjxQUL6QAhm{m!n+e<EAw-@IzYIh!K!DT$w>KpJAXr-@1
zc$+t_V*)SuoRg&^ml5`AU#4?&6j|k)nQ;+><V#gqsomL<{b>ZT<%7861)}Lx0{=n<
zk9yvi4s|>SB7bi#PL_jbwpzS3++-Cg?1ppC8FfgA-EzzE{mKhB2`jF@)7CX$2e=Vr
zCiz9Ku5Ch*Oz0_v3jcD*q~{xY<7F+Z<Ag){_CDV?36o-#!qpm4E0x6WMS$;IokW5i
zJqw6U!O74vm;d_QQM0B@BpV|*;(NF{CP!$A_pQm}M~*>%>-i64qN4;=?HJoOoM(o@
z?;(-jD^KM(-LA5FkB(jRa8>8nB|3+Me~+TMRI|X^<bH3y?scQ2s79@dNs)(7QtA8p
z0_Z7DV2og5VCc6=teK<8yuGAc2jghq!eHP|<|}{V8b<^IkjMZDl89t`Aa!yiv4Lim
z6j*w(BN`%hI3I=D66yIUngu_xwsM`46U)B#&`|gT)`=x6<a;#uacaR<j*tQ9h<&nH
zW?UQFlDm$?a1{L6(h2$@ZEpk74@>3P`77`1FlI?PZ_Hebd`wLPlZ}A|ir{D#BLh_L
zZW$pT2>nw1qu@w3-nl&whz>tZ@Wi*6loTTp-6}n3&&|lgP&?Gw4K3(1pO^bxIGLW?
z!iNyUlXvSgfH`ckHIjv_O`7}9fO~MmT~-C9XYphv+3ff6HBp^_y*=vp){2Th>ft#e
z6^Tt6%<PV!88i|Fen$!(97TFB92(A%!j-YPcGO@T96>L2cm^~DW=_lzshP9?V2)%l
z`Vq+~SjyB~S8F;<G+gOvkRd?7H!Rrj%};^Z-a81DFf4DcLQCjcz-$;Nnb)Q00VVM(
zMjPB<z?kL~=Knnhq(L=HK|ZecLUuMwIn+n|8T17|!D#EHQ%iehXU?|wyaaETE#9PW
zFe+qG_^lrYzJ515_u4=8<uVJ0#bS9GQkEa=d`2tV&9G@5N@V03OKfsJMrZxGr>Y*A
zz~i(FH?pEglH?Le<R~NXmW`8AjZ*%hn;aEUYkUskhT>kqOUI_baH^gPqEnoht)}zt
z7(@}`8;4n-?Ft8$a$UY;Y$zzR-fv#>x%iDVHg{N0n49}>#HQ4)sgl{usgi;O6PsJ7
zl{v#1$I>8{*+u00bb6JV9l-W*v$v`XxH-<iu|aPpn&&D$$grz?IG-M=Usba!s1(v?
za1d~XLHJBf<inW2s7ZMb>pt0Ptu8sYC0~bO@u>`;9i>g<Z_`$9nydfH1eX8K1pCFO
zPp1xuaacCd(vhQaWVf~yp0%=Zt&0@>dA|^Ob~13QILpO=J3J##AJud<DdSE5Kfc~F
zD$0i2A7)4$QcB4|>F$mplrBNKyIWAYL`3QCkcOeVySrm3>Fxm}-|_Z7=Q(Sg|9d{o
zS`2)-SZiPVmm7s+zgv+b^OMc<DU6Q75O$982y^5sTvgdu%ErN0vUCi(>MATl7LRWz
zpM+Fr3BD}}?Q`wT$`~2dz%hD_eU-RRPo<l8I6i*DVD-s1BdIPEJLDz#Ep~I`I<BX&
zakIYy{E%l6g<bR8zTX^#bKLgkP;&}%kCK37(WsglHPmONMNDxCAR#fuWdkt{6nsVo
z8?$|-luKR87<1c5-lr<<mB#G0RIZ$+JmwilVeS?xs(yK;=&UVEPc|Un$57GcNk&P0
zlH55g;@mQ1=5Y9Hr@i?wrUDXI$vD$kpLOka=>V|i>*x2le7v%p#aHwBWwwKi(QU1;
zsKdF6nzxJ?&2Dm8_mw<4Z+=b)zR$n0N8r@rJcuVCQBI-3IfeTosDy==+tb>k+GF7n
zRn&B3++6InsF$3p-q&dj;M>bRN;_yR_X9#?Z6w*NwJ5~<AFSx*>u92ro$2inSLNfm
zD0D{)x3wE?WJv7{)iM>2g)ud};u}VGUUNlX*^BTfAOpI^<18ZXS;p(*K9w*P%`Qgr
zZ$&ibzJv&7<e3GE@x(A2PNZyw%&-}B-%FSAJ}+Yqk&mxu^G9Dj;NK?p!OtIzj8RfB
z&IQyIWLM1K=@_aVd#|tenE3d#CPgS^YI$jmBw}|DahrS3mV5S(jKsl<)+ha%Ax?`{
z`M=xuHDd<i?@)Z3Kg&;-Nr_p^cGl51YUn@1<(zAkHQ0>=B+fHjT0|PpiT4%Ip>%Td
z9EL=-sOD!ruO(GyTsJG5uk^hQ@i#65Rg{Bm`BhK-4Y0P^=Jw6|Dtf|Q0d7aym%mbY
z(B@(|gM6@TA!HT5y2wMJEekbTAWzW)2!sh~4vA+f!lATdcOrX)d;OXQ)H%NZ5@928
zeEMJ9!2ek9=fD1?3F=-)lQ{pg$ubwhhlAZQ?thU4E(ER@+T#B3w`g?k&}P+`$nv%`
zqef}8m4P>zDIQRu8dYdDiO;FB`Fy`PIwge`2^+lR*RVhpH;HS_GWO1)evj~=GZkBC
z4Z;1fp$!=}K><A-sk_ghIicq?d69g%bw*1bCxOjR)$g{_4BEoh&?B3!W2X4r3%^El
z1qTI9Cv6Fe$&fu16!|HxB&B8NU+)qI*QtL5Hufz!1!D;AeG>EL`W(+|KAh(BfDnAr
za!t-}Jf7)M+a!pi%esatpznPI`UBvLco%U_Ltc*`27|n)KwdXlOz&rn`lABX^1(BK
zMu19qaa@5%>nezMR!FH#Fft)uW`(6moIljnyucgkcHSKmk#wLlS6e9RSW2VZcu)!+
zge+8rGG1Lr%o(tUWbEHQZpO$sKLui=x<+{K*m>J8ye^37z5fj!QqwTl2-a14<<Y$4
zef{d9xvKPxIzgYNjY%7SdKtc<#5a>8a~%z_?(4NRojk_K|GwT4J6r6feyK;Nq3hIO
zm+aCYQY^AvU=oOMkuL0EO>^v-t9N(hJn=3e@s8Ru+UB4Cu)khr`|%BVc-R1Z)~}&D
z${lI}V>cb5ixn+dgJH69ZdMhOWhv$hYONPdJ?<RqQT!?d@tImY8w$O1MdxoCJTzbO
z=X_$6<_?JniG7V$`(Any?F(Wdz^QjPf0zr;`d6je`7qcwRtl{Bnik}nnCi1`gla!D
z$`TotOz?TxJjfqic5}x-W2m#In1BuyOKpDY78)LF7PN5NXI6Co5T{}G#he&rK1^=#
z6e$s!w6a!?24L(jD1S{+y&ix|RO*<;5qB6DXj|s~F7AAX1a&YdxOP%$He}QK?(QAG
zN~!3na2adl;XP36=KL)BRWTj`K64o)J|o_SXET)p)K9MhN%A*%xF-H>|31B!jK1Qz
zl_05aL0Copd9<!oLg|8kgn+2*MWq5pmhB$;oXtYToqjTaPb}T{z(gjbG%hq2nVxx0
z__1-+Z^W;(BBbQQkCJv4mtqF|XEXBM%@;^ZaK0Fggd$PCT=Y9aLVL97Crso3_X%`-
zjB;spqcsCVDL;Arw@9MVWQm+>lsHrtSleqqj639J5u3Zwf_Pl`T{L%N1Rg6k+Fyz=
zCCWf=Gsh5<qV^fpv(#@9#44&HX}n37XfJJM@DYshJij336O;6iTvu26lxLN*h}d0e
zUgjuN+|iJ8t;a-*rX2<=nIfJbcB|N;Y8e}o-<goxc}<}b_VCVqb*1b6D*Q0-Jc8g;
zVI<PCFO$Z8$p3ObAMb2L4CDqcDVgJCGEe$#icBu>u>kxJ)rrwQsL$7rH7s;rUdw#B
zkjO0#D`r1P0W}-J4dv5n2)EsqSDVYUhY_8+hx2&emZ3^m`=L6_^WY#Ku5MJE1#63{
z*CZp}BIOme-S$6bqFdNjN3&L~Ew4kcfd`B1I<)pA5wNbLPOtkHV0HvOB&`_g`TZaN
z=*bm*<T20jXvU{k1#ev-NwIo=A@%>8ktk;*D95%Z#c5_#`((rahxPPFK&fqok&iFj
zSpU~L^BFVEY={vD_{@H|NXUiXYkZAjN_qS>s$bfifp7Nk{jXq(yLQQfhAh7|iwt+|
zTbLl7V-ft~qU5NMr>Sy=-E@$*L`Sx(UE<JV`sZ~kqU%S`**N~|Ne3tIhZ>E5TgxTy
zu@;W43wp5!RgpBvSQc);?WyM@%FCh3t)YNht5m1OJ?ANfIW*W)8Da;OVWatF&G|)V
zkeG+AH;j(|X~`w<){>Ox^jl`@*LL+*SJ#`u{JV~`c9|>=C0>+gsKjl*^K=45)$aRx
zdIxd_lIa((nPy7|$Rk9q_@J@FJV`*&h>JQqvx%QQ&S$v^i+N8%YvU4I1GMDup9b;S
z*Pod~xpv@eC3g;-t;8mgSM^`hv2T2jXBk#LHR9e85ahf-pn(iqkgOKDtCOj;%@7p)
z=TYkA{%3^jvp60cz6R2*CA4Xk3Kj;EE>XTyS^v5Dt%U&N;;co<r&9bFR3~3`RU1tl
zbWp_beRDCUNfr#kA;lwm9SG+wE8Zg{+%g#as`<t>LZ13l%LEqjkeuq3^!OW*|EZ8a
zI(|jczR~LoV(j}$=MlnzQRc`IAj*z){2D8_pks*nfE@#dPA-n2yH>02xi9t*t;rL-
z{dI&_<c$}OX$(sMV%2?FUZYCUpd8g3`Cse1Y(eRiIT}r$`K_Nm?#)puXj8wF6W7h@
z?vorm1$(nvfM&!bF%MXrtm{OY<hNOdV$2SHY#z_~#&2L*Q#w4ZzDA{BDK3ZyC2S7n
zAqM%|ATZl-b2<k#U+ys^H8qQ7frI?H1)UQ+Lj_xQwF$O*qF=pa$yNj_p3jy|!-Ut^
zrnM2im2g&3RY_>T2@kG^FAL6lQ~VM|(_^V-B=}xeBJSVys?7<*#v#2t=q!iehG
z15-NfNO;#%WsG|T8FVP}$RCiWF}}$969PzSmC~8``T1#b;2nu~Ss%7f*P{@ppE1c+
zl;;Im0;uWdRqE_Ku~5`Gz6zr$Q&TYc0EGQHjv8l!Yq&k(F@q~SFxoq_37bPC--efJ
z!A1KFCI>yFd7j^3T?M9f@4#!nfFo3P*Fmhe)7fVO@anhmXCs{o;2_u=d^YppV=1KT
z`(4ePfb{mP&@6&eR<yH8i(jf<72w6%3>U)|&9>Q~E^7&hrP!}fUo3swO4P^t*-Nzp
zcHa)KUwAXa2Q$S91LT-DLoEQd^w?O-Y9ob8s4<$K4fn55*3oW+=Ap*Jv^&gKiDjGg
z%*^a3f|Fy94LgTENpdN7-$klB&>kVJSK5`>#(=l98|*e!w8vV&ieEpBO}f(S%Ox0Z
z3w20(%Z(Ini7fP*UP6O~o!CYfj$<0C`Jow@J~R+aH`2o&KBB)d9*C2MhvloVZ~Lc(
z{=_ZLdPx+7--vU@(B|%aU#T&*)A%2|(En0Vs;mDlM>^V8JFEY2BV3t(mLtQDP0RnT
zN2hMNE~rh){@aKhUo>BKVxW*2UnlIOC;YLBTL)54FExs?Y5C@RbI*8rI%H;Zj`Be>
zj=0M+ZprFaS!l5Z*$eJ2IY*;ilXLpw{}2_%SY}V~cC!IF);3!`*^`#5XbpqkO>K6J
zu5g6Tk4?^{Ozv|t=C4QdYitc?!9k+ubSD@T51$Ls%bK*9fOOZgw3^k~hE=hL&4o6h
z8s-?(zU1WBH=k&+VuT*zryFy#9;RE+N=dxK;7ad;YrY&^7-Rx;(y9{<_F>GF^Hud*
zv$OKZFy|4uO3Xe|d30GzRla8UnpLT!gO<es3=Zfgxwr@#`+B)NabUDz$AIH?V}!JM
z)<<45HIih}qXfQy+}j+^XZp<jeVR{p|Bb319ahQU23I)%3WgkzcSxa2Z~&kejURv+
zV{&W$s-0K<b>;U-Xa0vQA`b8O73Q2_@0Hd4*HrPJt;lgAGe*85BYGWtJrJ402kI`m
z=)%LLZdS0V8e5EZUO3&rZMgc)f4<cz-f+0Ik*nJDap5Q2aS!8H`JlqEI;Kx`z_V>l
zqm3e$0yvL<xg%3Q3O(qb+RT?Jlau%Q{#Md+L4ky_b_7*dEo<CJEvefkdN}q*n%_8s
ztKnuBYqCo3XAYI5&6OGo8|+<TR<3IXL;MnK5s|*ID9V%dFgw!m3k0e{bHRmldS_4)
z<uo-rST#pVK^d{1lQCHo)$qf`R8EW^^n&{cv%&0qE`-svCr@Rhx0pzuo0E-gLy@&n
zU(KxW%S`M*E@gPkw@FfzCSm2OtQzA>RWIQ?QVKAu9&?%RX(8#7u-s2>;q%5+ajkj*
zD8lH>ZLnqR3X<9kaLW4YY+}7>oK#hMa%g?Be=VH`ydEEk{%Tq&8tz1&X|ILXllV}~
zm}}Q08NxG}mI$&GeQ-zqWP3DW&hS(js6&LAdBju@WeH^vxfgj8*=G~unM_3{6&tk)
zz8Aax%hVif!EFRNW3*x5y%oBPEmNwM$q!7!Jd}{SMY{4LqP*;%#-TLr<;{3`s+jjg
zFEb2hO-fhr8z0qQy-ZA0!d0EevvF6Zi_E{B`aGaGJa;rd&&($ezB3HRO0GhYu0Z)%
z%Z|(Gdds|PEv8;o8&Dhv<OtsLb~qX&=-k1JzJVb2!uE{4*U=DOMaByRqnJ1NtRB$v
zFkgCq^9h=O7yH<709*_l?Erxd`Zv5byI#h|PmqoU@|zkbz_f~`iBc+ea;^}^clqXD
zV(rYyD&qr|R++z~HxjtdjIiN-#u3p+bBiuVa2A<oI%#O-2=;T-`>hbZEnWAB(4id@
z#Nx!DcNnIsvmg3?*Cb<jqa7|WOoTqnvyb8nqS`9Nud(PgCT5U`npGmVopz%C=};VM
zmLeg^C~6B7o?nr7`#)irrO{uFrLKH@wB;`yAq@bvL&s0AZUg`7ENe&fJH4NB5t%WO
zFXRtzR@17NnYmFl4~xc}Ry-~;#9BX_^I1>Nh<W>m;e~@3C?!*g=c(sb9b>$}CSTji
zDjZAF*nVwbD?}4Px9=yUHnzqhgw{`p-ADPIk9KdJ(gfBq7V53CS6Rx>bx;Eg++nWn
zdnYi!-dBWaQDq)w%KcTvry~0VbG%kXbE`^_PWs&tr}MZN+F~C6+(<tOS3y`ja=@K+
zK>169&#lMN&f8j)W+RK-c~9IULM;i-Nd9IQc?!;h-=>h70`}o2r303@&E=IrVMeqW
z3=8}VkB`0gUPenQb6u#DA1D&t4HQzW(;sv|SGo|UkxiMH&7QUgJ>ZX8AI1{0PZt01
zUFF3D^JJ@C73};JpEXu7?OT?$0fzG`V0dWfJC5vAdSP^264U#;D_p-7qNhh0#d@2@
z=`Zi(?9>``g&{vkE0r1n0onKh2W=WQR%sA6a!5++IJRm(+nZv{%jC(><Pet`ZTE|f
zAm<Ak^ew*!kAVrK>xAa!Hv^-LkuwLi{h{tZU^dims0DZi+Jh7bLWMuX5=zUfe2?9<
zdk+o?LkvjDf0q6sj(%7}l||<4*CaQkVkzn3`>&T1!d5hE(v{`66oxT?1ltl(Zy=IO
zdYzEL%9BUQlH2G?GCQAmB|5_v)S$LsVQeH0xO}(Nh7~uz>zGu<r@^yhV{Yi(q5eUa
zewArB{yN_wGC;*oE69qV8(kxDHqZP@X5j<9_~IO0tZeOyJ=tRaw+=LEr%@UtqOV-D
zqmC_kdLFPS?XaCQjXoLZrsaUV+;ka1VJwl{>_I-4uqZb_yJGk;RLz`4oAQ7Fzf_rx
zI1%STjnqY<h@nNklT3h4v&45PrZ5&s6!#{IGZ`U3r8ffP0KaZ96o@4tJ$pc_!RxSM
zD{9y-t>Z@=A$+BYB!!r&!t}-J^++QQ+k?L$^;Pv=9a=ecBvXYG@@?-|aqvarSO@7?
zLIORn$}jt4Cfjn9ahMMe{_w0#2P|C0kc`ZaI|*J1B-os3K`vSzqA^Dq!|4*rYT!kK
zU$Zk6fxrEB@6|Qcfm2zfub0j;+*L6_>OIgZ2Qa7hF;waGb34-4$}cbP2Y+QnH{?{;
z+5@yf9M)ky5!hIMn!TDSJdTI(Oe!YRa5B7{Hx529t<=}3kd~q!h#o?Mj5nwQD^G;q
zW(T&Q&erK=@P|5m*wx;(;_m(Gvq*|RdYMgd<~SZq=1J{yg)T3bG4gr1hSL1D98lVW
z?F1E`l2p1HCDJK=;d*N)50Qfs-X4$-V}?$wd~yRr!Z0nMeMust2qQ<(I$mYAh48bU
z8iN7@iH{TSUM6L5`k?h#^L)N&8b#e0{eJ_ZzwQrh<-a5^GhL<2(Ld@;ZLXj9g|`k5
z^c8w~DYHQ^Qb677WRk@#U^N#`b4h5ue~KMO`RB{X>`i~PW6ac9$Sq}r2+JQ{#Md4U
z7d}0~YEQj*%f0T;KEtmum582>@UBqgXZUDmhPd<aI*zYpwzl`C1CiU#W_A3b1sXd#
z`Ua{L_0^E-6-^g}={*Cb;som3<cT?WP<iO&DXnfbb~G7-t{kG%rl>e)JBb+wpBH$r
zg^SoRnmHYh;l!pbuxcCI!v^?PbaE<=^Eq9W`AED?X$wmxZT(`YosPSM?t^^8oc^ak
zIDkWIb29O1WwS3lFha7z!nvQ%#vW?#!meZ4Pjj~qRa6rC9XqhAJJ#;{FEx_$A6&Cb
z<2ZCk1k|LsX^asV><~r>=*sa_Z$4b+SNnOr3Pt!Dhmz|&F#;Mwo0>zHaW1>pvmh$a
z`VvQ{I?kkfr3wwVTNm1WUq_aw71&j^D4S>=%N=Q=n0|lWh0DJa1u}J!sZZs%%@lW2
zi`G!4G8ogO<9F`?c3ZpY`t_Q><OsH&RWg(8!cV7?v+F`xQ!$!$eh6%ClvmlHH1!<`
z_u3fH%W;^)mr?wt{!P*7y)Hr)gR;f_o)2dEfuK!YtlGXHNu#<vm2zRCZ9~S`3RQM`
zGIc)biXwTNv9DG|g(hJs1DoHkMFr~fu`!JyR-5ls-1I8Z#&4+0>Sez(d@ON9DWr6@
zgSBz`H-DcLf3C5XbZz(*w5S@r(cfBhYC`A#5iiM3P}-wO@jL<>979k%+Yeag;J(uS
z?bJgvz`_*AQ+O6_phEu=Ls0f=Z$+%ucI6G2Mf;7xhye@AJD^|D4qZ@y4Of+Iu6b-8
z!iTH9slHSIAwUJd?EluE+MjVRgUu)aq>N&UoLWt-3)P)v2n%AWq?8Kh+91qBj;ubV
zWTW+A7L|dDN6&&R4*8jM2a@=hE(bw#p-}ObTJ@9X5BwG7W^0Y<;Cqk#p8z(t3e~}n
zZ8Rhw<stBgY~sb1aYM($$+qBQr>?`9`BV;S3f{Ly`Q|E{yDt&CJJ3--GrTWPLN<?g
zHc@-m`BmV84xy}DTz*C9syLYu0=$$p$gI5|R%5&g$6hZUAD*h#8qzn=VWp>!|M}DS
zPw$DpdB~^nOfl4Fic@#lapFbI2vjr(dP)at@*~{?x1?8%Ri(=byr`c^?61Vtx20iy
z564G+NPZ>iE3orY%ngWL8LiL2vta?hK~wI$aLlAaKv9JlCzhyTF}M|?-u*T!EIf4r
zel$S2kF~V`ExysN_gj){VwYH2*OjUixZQdmf3X|$nS8t<g)M@SF*GNm(R(*5coQB6
zXKSN0UQdoUT4q{%{J%()arwXN2Cu3p@5o<wQUPLzgB<UI&VNxTrt}hu-xRJmtnxkz
zuy5X!?lO%T*v8XOxoG)otP&g?4|BsU65!$c*U#)RYskl}W*z2nxTZCC*({^WCKBOi
z=05uCy7v%d<?$AtjA4VBK;A+f;QT_-)A>&;@!@23n8@JUQ;BV@4Br<ekrS8m8(&e~
zP-d>*QY7B3o!W_xijiPUSkfcFV$MJ^#p<^uqX4txW_OPLA{#`HfMVw7$W<x@!@aD{
zH$R&nBY5R0vW~lyM3Shk!8eAEnXcMd_acussvO4;*Z1*Zzkheu=avRz=J1QMxq#}Q
zMEGwDUe787?hM4__h%e8)pa=W{yRqhW8=^{9~4~m%tWkFiEh)9BwJO)T9wPv4I1I#
zqC9*pjQ{L-S)wy~9W$ra^2(XWxd)lPv>*yS;)t&AYUsn@1k$8{8BM>BUUc0tnRJP3
z;}<JbEm=FOpv|XB`Qy7CFZbW82b+;d*OM6CC8iy$jAj#+HMrz)ndQlg_IT^d`#w_E
zG#AziL9q!0^r0j)Xde}#b)-JVJT&FYs5mz-ID9q^`0}n#^i-zCC+)db^g?mSm?;J-
z4h<0HIi_4cm~^FyG<S>p{OV<~>CLaB+&J+zbPa;RLCklRZZ0800#_Ojra96lSI?b?
ztd?`-B%6oz;%Obc8q|IC^{7(L8FL{F!=?+E5#ym5kfy-gW-0??O0Jkf@%iN{m0T&P
z`Xs}9{|`Y?lwO%ddT)4G#5|5a`3-BAzg;1IYPdXzr+!}XzEYhN;i-~FXZ`2EQjw^=
zZfL5<{K{mOoQ8~oO-V?mjoHGa8OK>lL#4Gz_y8eBqMmBDD5O;yu^sst>P_{6rvD27
zz5g43A^?@euEyNB1^O@Q?zhs~#<2~oLkvY*JKR0JV}<$l5BntBh*H|^Q@19V`_0N#
zYgDec2;f4UXR+L8Vt~c!p4;yDzyLjQL@<f|G9>!}wVle6*>oS}aHc0m)@Y0vB?Rz6
zA+<=s);6_}Gno5u(Oee_At-cgX{qz8bkft;&ua9DWW5WY@Qj0u;w$M?PY-uDf){!0
z4VU|+Sua@5CLL;i-H!Jyx?zYC*nMmGV5FgB^2)vXa?SfA;uq>ETPv%Oi7xTdOV405
zZ@ejZ%GtCd00q?tWnV-Wyq6diRm!T)O<9NijD`?>3zzahJL528{b)dt)BLrLLud<t
z-9}ws4_?Ek%ab<jLw^{<4JS#)1VpRbTjwXX4ViDtbLRyF*s-R=SyQZtJbP{BtL@S}
zQ+OT=p**ceBDSIP?=3m)A5?bIE4)+fGM4d(waJLO(B^PYML0QC7x!tc`04ysbYoVZ
z9<QU*(n?x&;|(c8@B03Kogn^tKmEKNH~iN0-qh)I|MP3p8ttBpjXu7Vp8s0H)+B-T
zm{rr^w1d8Q$XEp0k3}KTbsokAS<8*A_&E1_`Kp@{*DKJ?dJ=T9ug**GX_4-m9!d-g
zR-Q_k*5LKDro*XX;UcXUHSt>mgW)G@-8a|Tt+1Y9sdU*?<NFD~Va&+IOgr^cil`%m
zru%jstcuvh4wK^6f!(#*&cH`ONQ_9_-EmvnN^^TSoK`W35T-xzK5bovu!9X=)lI|7
z{kdK~Gk?^wNT*IPa4V#dx@g^-yM=f@!mAOtzB86iZyF66*RTJxNWq=7O&gwkJT!0%
zTqj8fbBzU^a&(&v3vo1k-=zYtpJjC(K*XbM7I&FP;*DS}XG#H6S@c9*SORYzB$5-g
zCgv9sR07OkNds)@?KirsRi`4HS2Wl|DyRQUxFRruC(8L%y#z`TBl4v7c-pCiOOnAP
z+*BKrbU`R*<zCZGlfzKG0|;ZzOB4^C;f_-&q;L%FtY}%J>96T(q?=ErF5!rw78jc-
zztLQd5%&eI&oD@9#-uTFCod<~syGXvK7)9gPT9u!7C?;;wnwm51<3{KAeEA{4)jqy
zHo&dETzBW{{pN&HkW`~t<w%jjJF^<dvI<R^PlF`QW4V^PRZFEnr|BZBea+AH5MDE-
z5g#Y*g^XhrChq?NC}tsBt>2V$V<{su4ykOd?}8D3T(B`HjDO~SIpY*f4x-oNP|dA}
zh?_HOvCcH+hL^;cdfP{(j+Zr==5>?cu(PmhEq>Z(U<cN3za$*cSRIRY*kO$cSXa5I
zVf*qtc0OAQ8|k%5-P)URdM!=ByMYg~(0LpA!sk&yHroDg5}c-GZXqf^MK4r0GzJgN
zP$sK1SpSq;pV=76qu+C6h@dMwqxNHv(xRfP8Kbj3U$VNB$GOFR2-RVW^|>woF@5l|
zkSOh_KEF(Ssa1}EAlKwRbXQn4>(nBySG3o#a;}%|^Y@i*^Nmhcr(aS^9(3g;7kgDf
zhuxNM3H1?_VhEs3M3}>%tO`Vc4g~?pc9pN+nq^Qhk%`{-nU3R(+O#f#+Kl1esQ29)
zd*8uaXQFE=s(q}v1qJ;OGz|H)D%izAS=(Tx+0Zbb;|=_-3oOW*F(g7MGBy?;skl-E
z&1JY|%9R0@Ilg_$bzc2O(NJ5*nv2Ix%2zG7bGwMMm2SAkV<S)?sAVnC)!&@R1j}2r
zb2eV!wvyJ%NJ3adWW}$ex@2X#ffwQHnFIFv;Ls3ftFWKoQYd=_dlQd^&a3QskwsT*
z<2uicPzR_K=@kW>k#baz?|e+&N)(QMxcMW_V7s%IIyEtMsJnl1``=FUe;L%w+`q!i
z(xj~5(?3up6M*6sQAPY}+5XeNTSc?pUaeK+!j3?Q!dWGf!_;XTn{?h<*hR)8D`e@O
z`kIR3rr@>2W(V4Fah+CW01w=%bU77m5P6b;3+!Hkp9qvi!DVgT^?D-yV14;}q211O
z%9SXfZqRkUowAl^e>%@sctq$9^RU(Y62@V3#pF9@Q`Y>(^N8Ty(-^kT?L5m*`M~4K
z$ei^0^Q!k%R9oAn@iH|vj^fiz;5C&*TM~EqaFU=#X`{zSLk;B?i94+G<M}$cRHMsz
zD==eH+xAq4fD9c;6*{D9xSagKJ)j?dRP-r5Gbs)<uV}vI5u+RY4|g*!_TQxEO2?0b
zyr(OCI_CK|eW1uUlmwSymu7py#u@6s-5$A*8TzPSsTp_c3|OMG=H#O{uw)Z{e077Z
zX$8H&Gp5|?e}K}3Zd1O7_4p(PxV%Ur5|}$E9vDfe0W&AaWu#MbCJ@R5m@f@8(#03>
z1vzDNkvO0eRw8Ps#mXp{Rdf!$aK80pYH<6EJz@{legnfEEuXjaO_g1ev2#i?M_r++
z0d^)MhURCM4*((Mx;Pl}O<Be(mun-~CkPZ=d;YI&;D^lQT)ACMvT?FILl0brwkjgx
z2XgpzOkMoNi{4k@5@c)rNO`VM^>l6=l)|m!5MYjSy!=`(dIO(u`mjp0qwsmfc4K~S
zUDTDH=fDBThX(y6Yl4Jl4d)4TSf}E>^N+zC7mx3zFXN?cMsmD{ANB69fe5cpZ9LQk
zt>U5z52gpp<l=|A%Pa<xM;d@G9t&<zOY=$c<t7s87l|(lJ_h=XjKVXi_em<0mp)c;
zq?F!Gx&1+b99#X~lU$5WU*ruEDRY79t7qF~mCi0n{{Gh!F9}4$cY)L2z!cKxX3nUc
z$UnIj4_uA)(EXhk5*?11*9Q39+=LukYicN{c_0I~wdA=X?iD}4e#7ckRw^HKP1iIL
z95Zz@4cGLHYY&`gquwQwU^ohjbH0_L|MG(wMdt+K2wCA7rX`<!Em`?ON9UIQ#yr9=
zZ@BKxY^gK%(nu=B8xBh1chJ0rm1p>7d>II;nORuauZB(dIS`OO#W=;g`&A-zg>GbI
zwmtcLh3GZSb}#9j1c?Qr65+fWCoG6(>M*T+$E$P5jS(6ma94_YJ7YVb&CQ<Tz0bX4
zQ623m-se|KKd<^NNH{tzfzN6qBCv)CX?-h{ryFrzKJ<n{f^B1dN{U2hmWSP{t!3=c
zI|OT9M=wu4>CI3AYl8i9Baw2t?Et>*Jgd*4(aF1BI}rTS#1wR87@Ek0V|yKdZ4AF$
z$=!%#R%J1(3ojw@S@()f*wgGdnMZzz3_iK$z4+G`{r~1H#&Lo3XuR-@_jA`YrGL1*
z@n<N_b)zIkuNJ93H`aQQ!C&?z8YUi}`i9$GH&&)NP)=k-9d{Jdw%|NM0b@hzX_Jwd
zpTi&XXf-m9*Ajc*V9WK2s>4>ySImUerBsiHk9-uLi<tz0$ic(okTHh{GLQS&cl*=Y
zxX)T|exh#<GL{xp{p>$gRf<ta;Z1o|#&P*$8WlAA+~Qul5jv%qkYeAs!t=1Rn#L!8
zeqJYj(!`D9^^fSAC-z{AU%Ot~bP}td{JF#)E?~uEM+leN*V+6PQ3=%yKY3yI^=|sD
z5w={8{!T9t)pAO|Jiukt$QXbB(@WVQBRpg>SE2ds)gi+#dKuu)5Qu&prDw)XBWa^X
zQ7Cy<1`lOQX@G?jkQr+lQs)F@PyWfKubE>`GomuDo~0^l=bjtOr2kqeLXQsHw_bj*
z*pGTc9(9Qg<Yk5N=^V@rY*dSVX*~*+UC5XCx#X&-MC9ctC3BcaZ3OIOXxJ&~_ry0v
znGJ2{=5L5}Ur9V><>M@`rN49$CBJQyZ+qxN110l{U~CQ`-ufaT*u3LxW}tr#DDqxe
z;2dW^Vw?@_SY;WE@m$qoK!+0*W(r@-kL2SWQSc>LEni}J)5O@CS!I3DP_vxX9%)T^
zMM<VZ&4@utIZ!0=wR6?;T3DKpNr(0c-dCZt^Kn4=^wUDGkXG&MvH709w<Hud-@FB6
z)wO@VJ%H6B@E0Sp^iosFs0WXFD8{DVBmO=tPU8490UY7b&08~qTpljSMaRToFf|(Y
z0AuJ0p5Z3esL4VuPo^YUKot?BwZ3`XWd^iHMaxBpDoJgX(*A4KM6mTSnvL^6@%5v{
z8cqaiQA!a6ApnRTA*wxwXM+I_A87bhnJfp09HV{qYcqHrPmjdPR`_ZmA!9`h=z|^y
zJ$-!@jpU+@HROgxR~~V~-=@)uB`vR3rH|?k784Hz+(6xOLOedB-4Y>OV4ao5>I$>e
z0K)2!nBQ(#-Vm{@3|D|`AySa`tC__YAQylRQI!uuz|bH(Sa#*k&aQ6aXP9Yt7~&7}
zx3EhR@opSIR%lYn5UG56^u|QSFicBKG+onP)10jd;tomT2Bepu>Vt4t?w(&5*o^rw
zY7XfqN`cQR4c39kpS6a>2f9bZFig>FiF~vYL^y~x&`*<iC^#QA`)>OPpLPvvDD{h7
z?Cndv9$<4EzK>oT*>DH%whs-@Vd9wBFXH!g7j|uAUHL%)g`Rgat3yBr=)n*l8VZTA
zq)R0VlF^iu{PpsujNxSNq2V7PN>kXBpTSDzKmQN>0LT|br!xdC@ln*Hbi1;o{YkBf
zn&6+Ve76rZlTKONTReB=qu|TYg&u_}9MdP=>DB4M)mFm|B_%nnj`ii&u}8h-w1AEm
zxAHdo2~X^+;>7h8*dq7R<nEUh?WHs`I*8AXrz^7W57O%Pd)S>O^PN{8uICQ&y8s<J
zW()8g;`<P5f*eb$W3hz65j=4c<<R<2st+cEQwmDyd>ukkn7Z}483|ZK&ed%P@hSGP
zQ;H<N9H4_BNj>HZpZf`(z)_G7n<59)6csiD8(KR?gx5H3y~I88WU&eK*=8LZfSxp)
zq$r3)5W~<KPVX=FN1(I9AI9eYr6SY*<I)oRg(jTwajAOC2nNWC|8Lc!S2tEO7v
zN0d);E_buq_qT2bwzua%hMa>a-#8W`C+F+mo{Uk?4vWWg(y^f$RiiYY+mqPU+nL10
zs>+cOWSD^sYGqKWRYe1amm-`RJez7V^2W&lmH-!_p|s1g1mWsRh^TS4_12d_j?IXj
ztN7A8x7hwm_11ZBIl!tFk6{c!z4WhlqC#N?h4lh#Y*&j?;9zEdSLjaQ?_m;9-e?Mi
zNIy1RqDZFU2;m`G0DxqV_sSH#G>%(maC7vNPn_>lY&HeNnk->6@Dg#h&c=QRBUCqA
z)X^-++^(dQONdw0vG3A!Z@Ho5u;~eK-feRtm-AuZQICUQy(BhCZkA-XPA&ystJKl4
z4)UR9?oRxg6#m!I=EUJ4>ht3nGO>rX$ppNVa@sbMhS5l4di8Jfyac6qb_k`b17e7X
zh){vlflSoQ)RI^$ta2>irZNnH@)oLK8}(HfNp5Y<hbr{B{!eY&vOY3#kP+q>=wpK>
zHD*i{r4(`Ii(Om<+{_n-(TETkkcFZAEr620e52g%&<bg7(Fy&7c9SR$9!biJ+1uI!
z4)ce^SDJmhor{f;`WhT)HbG|Gk{lP3`=r>C;o}*?4(NW}6*S~)N+gVDuh>3ZZ}E4V
zm4J4+P4@jh`)OJsH8^Vu?;>Sx$*Ws<;W1hmsvq)c4t18?AVqE^C&VRKwIu)&Fq(5c
zFl|2i5Co5o4GgdonNRc*mcDq@v{<aR>it>)Kth#1S@E>0UE~U5*TyBFQTl)|*E>WC
zJm8$OEF!MJI(3S>rA8{BJ2BIt8MO|o2KfE>fj+`NX{vQ)sCPA@?;n0<v(b$f$ut*n
z7cFqj{$P4tbHOAnXA5ujFgHNx9G2kqS_gSv*{#0^UBanS_}n67(xiabz;n+P%O$V?
zrB57=ZMNa4k_UB^wA;@BSYB2F)#RIsAoI+!_s(QzV`Hzgo*4{9;u}k3mq?#2i{wa_
z?3K1PF7j}=Jt4-6{lCWqCH_A~ucc=dsUd$Q(dTfZ7uhn?$$wc>t2SeWUkjEmCm{ut
z;J*3eBwliyV%8BPF5o8A^twvQ&oOB8fi>&8!Yq?GKiRiD_Ws!xh8w5a(#_LfqxLFi
zjh&AQZ7}(&YYNUbs@b?d)FdcW5<~kMRF2R<?jH;j3gMyA2`Ny*HTa&bpRf(D7wy_;
zoK&;&Uw;L`X2y<9Fg7vi^jxf@%Q|}Q0e5y;f>xEq?*x(Rr`PAxsu6e4+De}X5B`f`
z7kr7+^fc(>BO2&W6RxGOrfUPunZR{3IwXmo7yqK*{apVNXa{9svVOPo0&axW*D8DZ
z<9;QvZ(dl<NRDQRp$Wf+yS~zBfPx3ZQ7~hXy&Sx)Q9=7U^T&&qs%^1?y-Rxzs#b?%
z8WNt+*@wx*1EavCn}N?VQw}zmOa?yu3ieGV@^EPLFq`5qX=*%izDpUwK>2g^t4@9n
zRet}b4Bq}FgCY2)Ao2=^q4zJCkpUitpZuCngnRB{SSnpEpzr_WR@ZYh)9X!HgDixf
zvGNG$hVR9&7y(1y9WASN;@>kdsViT0C*&6WR7t;;Fkrna>okx0^<uJ2Bf0whw|N8n
z59k`ZEX}UTZN)TYqCAhy;*!FG8X_qP*^V~W=w_MI!zBb;Duqe@F(zGG*b;(+1*)Dh
zk|&C|>9K3U^a_T+(;31zX;`lU&5sHd*A>2`=o))J#m{_5E5Ca&@NMhfWt7~F{^dGS
zG2pdydG?Q2d1I!}XF1sso*yI~wr?-v_O?6?<pnr5I4r5SpFqQssWm>-#ga{8A`r3F
z7gfr4fKjZwtaELkA0N8)i|*?!;qD7cIb4GA)HdrX+d<Z-<D|k$k-C0_c5edw@bAd-
zuqz;yY~I?YfFT=>vAk}8Y3&K!S;#=8k4vf7`PTLM!FTRX+N;D291?o8W2hvHu!}E|
zK*5ik9(u!41CVNqR-3q_!OeRfc)l*x4240h#Oux`U5MAcCLola!|TQoNx&HCP#R#o
zi9&?JhdYnQ7O%;~Hc%f##jI=vm~ZECyM!W&K0h1~>xg&4nuYfXjV>;+n5X&#snWjy
zqNVIke~LT7{w+O{qaZ{o+Fm077QaR!#kl-#P)X|&v%vi=EU<<y&j1QRca#U0(^nvt
zBeHF*c1|JGh<1opK~%N&%zm4Ru*V$5H|z%2Ld*=+g%b+W)3Gd>d%waEbSD}Mq&fKy
zhzu@&1^%ucIK6|-P32~0ws(6UR`khYKX~B5&l|w;6K<K7%>woTM<3yAH};vkX!)m-
zA=iw{;tD_v<3~(Uv)MNiRYa;sh*gmrAU#BMj|%K{Lp=_pY!c53W!6SbyZ+K2!nHS@
zw60jU^oMCY7f1Co-|KC?w+7?R_wq9a;XzJ}oTf36J8AX!M~wXwr9+{Xmb>uUy8IFx
zHk*0z<<7Rlpf1GDOFXoT!u);o_q|Mfp{1gu*us~Qr;>ncDO(lBv?&$PV)^@jV<G>`
z6!u3@d>Z<TUmguw(U(@>JB<HR5#owToOv*gke*H}78)|I(xmY7XDmYoOe8zt<>s*C
zbuCYouZB5)ZXj&_-g#6}qE1I@g<V0<mt1@?iEXk667BEWbmTeGJs&@3$p7||9p?*E
zc09@e`DlvV){B^ad-yAy2r9!8BEaOV*uwYU+7!0@?~dcLBSaVqA|&12gO=Rx$PjUe
zUy{(m?<h9w!rQQJo81rUzAVaM0y<(uk}}7t;2vrIU_`MLq|d1Qn3i7<1Bl44kLwYN
z?KD<DACUdy04d-<<0cd(dzwItPES8J7*a>Db!h$lggl>cXR^s}F|=TjVV16^P2y<}
z#2HRa;xr%ZiV&i)aSfw-K%Jk+E{lo@PP1G_Ns|yeENgo#x}3D=b{$%Dwb^R4ap3aF
zCJ1lY?L^<4lw&QmF<;yX6*5pS)h6PqZ9?d9c)W1kn=R2%w!J@u$A#56;C8~PjHvY2
zDRs6yuno904_<LeC`^crAINyRmu|`U1$AgrP~`ueLy>VGiphVQm?`qF@r=3TzZG9*
zZ&=!su%f?p(9WQo^H!3ar(7`=%9)oSpY!T$bk4Z>TlL1b)eek3xoRAyn>v-wuIcw%
zMXkWReb6B=@f|!+ArXCPo$;#r8m>-@{8X?p=@PYj7Z=N_1xH{ybl5F*^46VrRI+w{
zWS{ik&#M5M2hS0$;$FS}lrf_^O1>x&?fH>I*=1Y+NHn|oQg-C)2x|9qn;*COYL+V)
zL*6U&{o%r;yB>|tR~U9f=DNc<>NCvI^fWXS#?5>!zqlJtigK`Oc|{kYi33piblHJ5
z9=mmwihvtv$AC{-TD}^N9|O-uRY4eV^h^B8e+EZKkuvVdoT+4K8EQDtkH0kYcyJw?
zAvRepO^U`*eR@aCo*3GZOwUKH50F6lk|Y86tT3TuRy%4-OVBvSYVk-lwZjzob6sUX
zIxK$Y1S}SQIH$kPz-@EZ%bZ-;u+-+jK{cisP3zu6E_#37HrMaFy(2xA-m+QVg~chF
z8$<+92hai}_p1CDEY_rM{iy+O3SDaL5M&nH(=XZWv*fl_@-v($6tQgm#P?_enSx+P
zUbYDCzZbrRUu|pk^NRahS01h-JxgR9zTK|0VU!V5MwkVPs^HlqPP`zw*XD~KZhql`
zJ>K`2eW?xT;K1sa-8Q<{>7N;`@<amC@IWJcd&~190tFuTq~vBRv^kGEddPFMH8m}J
z#{=2d40|WO{Lam#=J3Ad%>%U{1PHqBoBC<bzE)*+w6nDhwU)p*oVg=nyJeF>7kN>v
z0!~EGv@?09T8X5w2M`Sxf&4&YC8<Jl*a)=gtI0Kt$;fcHuf+1>m|GO@@@qK^d9`Qq
z<R&7roBw%kDX=YM0I_4bVRn9^&x^|lWC;w#!1z<!uGQjE69PZ#r9au=V&O|@VBFm%
zeA*}0oJ!OOvYUM_G>`t!ZGAobIT>;OFs{?fb429skTXfhz4Eu-OR}z$-L=&N^ML<z
zeQH-!`J2~O#GP*Vs|72lwR@7Z7FOL~{kuSw8~mhE<G9nMt)Lf9;o504JM>#C89X_}
z==kijULiGnF<w$^TLKv0-m7zq-*=%goci*mB*amA*ya8tphL{O79R%#N5K7@7FLPu
z5axDQ^VM(7x8)-K<Nka_dZ0=WjS`Vhk%$8ekI4wY{(v9m%7u)~YYHlQ0zds0?_F}O
z^ZjSkJQK0*$8kUPzq_~L&WD@7>MLv_M~Erv?FVdQ=ucYj!f9Tkj|iMDMOzeN#wi;L
z)Hb2xcwL0?_QNMWA%~Zb$N(}a=q3CR!KXloW`)X%r-Q99Gr~8x2PsD;l}8#{s}*4G
zIurqZq|yj)Ec(A_nv#G|xj{N`AG?6e6FD&XmS-a0B>JOOc6;d~JK;=KN^G#yz&FOe
zfzS+|{*8pAVj?pFnyJHfzpA8?^&H<a_12`7;s>@Mu`W(dDtWPYs`#PB`fW0;Pv(WX
zr<Xz_kJ^;%XN6)5g5Frk-fy5zW=UvBU}qx-A|KsPAty`kJNE-1#BvJut>&nsUpJvZ
zL?q-3v^?_d6M0oy(p6B}b~o7n2<I2^^FtC)>nAYN*?<<2;bS5UsYAQ0hA1#Ah-l-K
zps2Vuc5ue`Nh|LuIzK7J1ixQ#MP?Cz#Nbt!WZc!|CnQ{7TdVHM&TfhNi)Uam%eB%c
z=o!vWhZCN9KTZVOX7NoKxcv-h_+H_6pfC-MqIR7fW5sj&O5<ho-?q2#7HXrIYP%SU
zY{g?53-U+?tK<>>ahT)?mJl?7tX>5$rt?%G&9kl6pD7l2pHYPLv6>a=N9|8Z-ySBK
zDjMA$G4F&N5Ieu{5-(JXBGJbN8v)oIa<XYUqjQaDJH$t%`vVq4W8xPdYSiUns{IbV
z)G*fCys~5;bVUHH&>klMwGTn$ns>1>f3TLd5S(^nJ+<dRqzHAd$O>y?&(ArQNfzvc
z4dWqgru97<HR4q-Ze0e^(Pq1O(VW)tz?Z6!_*D8`vkvtug*LJuAtAGkb>udio14TV
z%s8njDK@qtX|T`!7w}fTJHS5Nd7q+0*w;t<ijA9^y2p~Z_zJ%j3uT$9+uC*8_NraW
zSN&VWx_{?1mri*p`~;x&?L6h3Nn5KO(Q?SpF-l_6Z(a1_ni1Vl-%?JIdeEz#^5g|i
zEOR=KrvK^!FqoyCd+r-r;j>2m4WuJ#=$RL;Z{T$n#H8OmKMaUJUaTqpy+~!;2XZ;H
zKz|^`FGja(B0rnITkH*E_LOk&Jb4kUX9920J%`s}5NpC0TX<^8ZSsUj-OWtt14WDL
z*HrK0hRGT^je-7Qu4}^(^I3ze42CDuPO0-LC0HA=wbD}lkKc8<?M{7Z6v0@0@&X@s
z=?3U!R7#&7MurCB;dYn)yN#7Nj)#*xMg>*F{>W@<%9gOC54ze^c-(@)j7`Ca@Z4sM
z7!ulDpjL%*!^*+x9ki)v{WwZ5w_4{vGIE>nU&qPQRcQ${3J&MWgXz|Uu`J!n{|n4r
zP}wozEcv!!H0&?6jJyHg*Y~7mc;4-J{4o9`oe`S(*yt8k@!WaM<`1#Uzzjf^+U2Z_
z;JULpn7#UaHw&xPxH~W~i1ckfGmq4g19UKPY=;Y)&dao+YnRc7!6%a^ev$C6FB{^G
zjSu1M9IzoPa|nOCopk<U1Kjk^nm3pz*b-U>nM%DOMn~RwdT=r!AhwgM(aNRvgUf(e
zg1_;>)q1?;8{xu=#}8BLmW{`sC5~o_=lZpFLNWN8;oFO8_v8JAQXTq$?`cQytq?e?
z!&7LJ#yd^u8hpKkzHcV8GE2()w>rV?>wh%mP{u>A`(FHlxaj*4j%HsQ{)ciVUpIKr
zkbSaD(4Z^J(N;F#15N(m)+b+<m{tSUYrS!uMf%~wZjvrk1hQt|uP4|ftHs_ZyKlG-
zEHu|=m8fSo3Hy747&p)Jclz6Qc4Te6lFb`onZ0BLHI0?J46^7{{5<mH4Fz?nPU1=-
z2S3@$%}X&E5Tf|o+iwxI#5AezK4Le9JQL<S=m_yn@;zKQK_-DdgV<y|rD5OY1-EsP
za49&*KPgVZU?5RLVh^lAT-(ZQk6MUE?$OE1oq;W1JqjBat_wSP6?9Y0S>+F)GP?Uh
zSHH95BHWN!xn+je>KrQT)cpD#GAMcy1l2!2D8z8-IEq8emERdKBNRWUF9gQcBslA>
z-?_K-Up9alzv(ha9i}m4D;>fwQd7x!eW>ruG({VoIc!&xOeRQ?+e-fwPX{KW$xn6u
z4sbYo-v8`g24I<k#b+fZ2OT5w!z1yNMYq<jkLGlwdYE@YE$Sx6i9dsHnk2g%f`U-f
zZ`5*3nRFJjRTuntfn;d2DD63{vL`THm_=20FJtu(=x~Y8RMmX>RS;h>{ynng)`2nt
z|B<i^p>FB(Q(D&WkcgUMd{Gq9@DDm1XOer((k|ZkH)@{kTKB5s@XfttBT!g}tfB+#
zP1;^$*})f_uvZV4<2<7Ii4Ehq0RaQn7^WzZ7_WvCXS{~uN6z6rTO`6-NEC@>av@=1
z>KX5&V`EJ}exI%B50%Hb5-^OAM3}Nf!x>q;1ZY*gygGrMndp_AY9xu55afk}*Vo9a
zeHs*ptFCbtJODlmoZh6v9psqbP}Wioj9?TDwh*41?v>HLgqmOS;2y-TB|OsI?j-ph
zcyURB`^7d<2Amg<A-|2|Z*PJ~yf&ZBOuTzHmxBWix+yoaD+amVeoGOttq1deBg>dR
z8+w5Er9}+E8-Z&K#D0I_8hP8|;v<!UunhK$MGOXsC`%sD#x^*J$AQd8qov4O!PAik
zF2H*Y{BJ+P5}+rIavmo$O&u`Srw8iWJDxJQ6HD0u@X=d%4IrND)70-yIacaWAS_hC
z_n~dz*RILe{kaL|xR8xLIeUG3X`Q(S7kobJes+%iWSjd@AFazDOTyc3zMfJHVJ+zj
z4N`7Y<h*nL@v``@=KW3d_@>Ow9Sy?2m`8$B&$ae$ng3%9Vc>Yd`n@-cE`(n3ImYd*
z>eBg_p9DP5N5i^1@OQ)f-FdSP%^w)fXfCV1R>CUyGml=u=h23+dfW5MB#ZRuhugy@
z*NUU*K^Xs{s*(^r$VW(|zmnSDkgyRJpJLWs*cCX7F*9Fo)Z%`e6qmFGvVZmrHHYl!
z3~ie~esx}h=<c}bd{cESQQgH4+W2VesRXZYRnotQ8ssL3s4nRzJ&y1?_rDHCHp{Vt
zL$E5vbVmDPd;)@@cP|az9LyfntVj|GS!OOhwLgee*mmifk0#RdE`5eKc*mPPt6kB9
z9|&rEY@Beu(y~B7)6B1N-eTb2S-RLfA7Y6?XW=WG5OBmi_FNNtxYBy))%Y8cYG+aZ
zZ&gdri?e>~3Ik>EyR+GoBD?cL`6$rQ!?*jL)R&<NZyit3{6`~=tPlIkx5no)zGZPu
zl2@^%N71ogk)C12d=9clyBdj{r(0~aXy-k`*63$~6G4U9Z%aBow|;00b~%hD(9%H0
ze}~`_RS~@E&EwCNG-^DL77F@cvl(G=9Xlj>$ozcS-~YhR7B~Y3RMN0U1?7m=;dbB=
zH!>1l=#zssgSpG&gDs~z=zgb;J=t=onF!HVPLBlGM$D$!A%wIsd8P8qbHfMi%{zh_
zcpj&Cv*K(hw^`e$rTzm-(E-93;7YJqTQz&l*uC(BM*Q9b1rS+EjwGntKhQ)TRkuz0
zk-7_Z+qe4=i6{i&a{5y1?vInJY*8F4FC#0LfC)5L%HTHGX4TK4_*9ZALZQk6F3nz1
zH#*<=j)-Csrg`2G8g~BpDTPX`&22j;Mv=pjm?GPI0&r@1;1}f<YIv9!^acPefU@8H
zL`j@NjJaHJ7mfD&Ntj4AWv8v3JYbG~38VrJKffe-HWn?G2w!!4P$Jb5dVOmGR&S6E
zx!HHeh_1inW6p6bEt!czoRZaE(czuu#e2?uQmW9XJfGcH*mSC>0ooxpOTJ=@ty<3a
zSA_L|&wj-;v}eI#hYZOGox0T3Sp9NLh}KROOYJ2R-4yotcS2Ip$xs(EKFF-;uLns3
zQ@E!eA)v|a$oQ&19dBHdn^VA2-Dyql`!brV7htNArnSP1*_O*O?mhP;`^TcmRc<o^
z;K1!wv6X#T%g*Z1?y!CcnP|L?JW0zuiO&SeD&!rRWs;94D_gHFNyNl_KFI-2+001q
zSQ7V<_90rvm1usUYX0EiLX`rO-C{MnGMh~dj3}e~oA0c7x*l4_QrFT@t)ax>Jlj`H
z6oaL{)CDw)rU)hQ!w0w()T9Qe+ApNe*>KT;qwzS0Pr-S5!TM;I0`-B@#Ab`th0toJ
zKt+GO!uAo~RhnQ7zUmI@3z$RukgxCizzu&S)482bmJ&fv>Zhw|PeHh#m#k$E7Ya}6
zbtuRg?%Vv%+Y35IMl1I%m+Kb~E_!A=jN{RwjwWRms>e}jWqudC|EXwfPcQvzpc8(O
zZM^xz9SN)ZlX-bk{;PZ2uaH#;Q+(DzU}e<)_Q})j4$E^4`DR}ta0_ST4QbJ^@~a!%
zpa2pEPXV0!70;6)6W}OMjSy^e!?^%4&VQ?F41WD^>7uW_G!nKwD*UH7EdYHiM)X_l
zF(P%Y8Hd~9|Hsx_2F2NKOT#b>9$bS5CpZN6-~ocWyGw9)f&_ObxQ4-91Hs(}hu|`}
z`#aCx`|NYRs_zd!Zi=az8Lqz8>eZ{8_u)y7H4I2gr<iSoJq4V2>Rxe3`^U{;aToND
zalw^B-YfdAj*C6r%hjs@GzdyX(v8~~Y4f2=#p79}#zFlr**y6~5s}LX!7|JPW%1bS
zNqZ!u0i%0{zMTbK$6smoZnqFV=bHoDm^g`DtP)=h@>oH;O{`ZgBHhEK!qVsM8%-ix
zvYAs6L!c#+!&l#Y4xpja-#>L`hcofEGhR?<$>DOU@8H>}+N~{YudQ-A^R512j(>KS
zD48A^V&H?l28N!(pc4OdXrnouMRLwMY1uv9FCEZ!_X>4`K}^rG$%=m0`qHGk8!wK5
z_MS%y>PMBF_WBy-dpX?SHXE`W^YXB)4mJ&aU0sJZl4z&4qp8f!m*-d(7-o1~R}%te
zJ%O;;AYV~&^VjFR-BX{_1gO#PC$p``e~&AFe5?`Z3O6-%7Ipez;JxpwsQ&YF_ahHg
zz6zNjsMI3(MpW|F+4JnvI7+3`uius_BdA@x=EbW|Aew*Vw&r;(D3P#0Ml1Zno~1xP
zT}FB$q|GC`{%ag-Ec=<1qpJrs&tEnt2oFcc#m*O;SJdsidIj5w9tVtvur#A`&MEo7
z)Y2P5o-ek#66-v8^aa@P*P>ssbad4|s#k(-+SWd<B@F<d?a)EhE7wuo1q!p4h`!r<
zMSgDWUWHV4$HZho3$GqxzK-A1J<DvL%@8%}6m7;c9+nYSO|t`dpB8kQY9&~_9J<Ez
z4a(Tuf+dcPZv(C6@B`K0Ll_yq6tz{Xvdu+Sd~5sMYd?!kqml1KvDrrR`6dP|-)n{!
zJNFbQ0L#WD{6U*z#UqhzT)55mL@MKQoN1}X`iJX8L?RBld|KxU9pTRw6|UCpaYJ)I
zhcMUERmsP@GshmOpE7X46(WJsFtVa@Kc&!7FsWI;5^nc&oh~i^g)>U5ho@&A8zwPQ
z6v*Q?T}<F3EK6eFq^Kr->F_jvDJY=aXi2M0K^<OonuixLJEdV{xv}yKlF#b=3zxU(
z%ogitAg?_5y)z@-6(<O4bVp?Xb)=7A{qh%5He^*O1m#>_OdK(;e}07|i=HnGm~g_v
zG2*~=X~Ah_-Y~6xA%8L=TXHN_$l5~;#+Zc!nIX|qIX3{R`fa(I;y?PI$6?%(cnZPB
z4Qtrh4-we~S?;MZhU%C2;bt+vCx?tbQnDy!(O=Obxoz!l8Wb#YWgzY-)Kakc&DGZG
z%vku{irQ64*18Q;Nognw#G<kPoL37A-XF^_wVR!tE%v!PMUWX_J^r@2^7towEw9t#
zpdOs)vobKycHKPl?(`mkqG>6nHTC!gryZI~UgL3s7x6>Ru2a0bFtRU2NHIv)p;P>k
zd`5)+yjU)6s059;SPopBn47@T-F;7)geN#O#06!xY2Z0#ICokJf<N4Hyoe62YS&XM
zbN=!;Syt$Ju*vMWo<WU?I=@RZ_%N8)asq1I_Taa*o7>2$x15~e5$H};uhig%#(|p6
z;Vxc<5f~<D_!6@HT;<wB*KV*f7LBVsm4}B)a2y~vb|XS{oOh?b|FUrSw~y`liqgL+
zE5~i`HvNBicBuS*k5BDt8$I{bC%5<%YE&ht;DL+Ov=q>c2-J0I$!Gd4@umw1&hp@L
z@75+=_K1hRLuf>;Ybqf;(vK*VYhAj4xjWkZPeeVdc<q#?XPdp!GI6JCMH1auH?zZe
z_Bdv12J)hXA#vx}XnzLjh6cuo=l4qy%+}Ud-~L=UJR00%Nt3XgEH@>kRB95x)VtJW
zQUAHEV<|oIIh7`NOD6H03R3wQ$$P(0$BG-uGPB=2&fq(G8c!9MOxEcwQ$f2u)4XoJ
zbcx5|vKKA%$X^fY@_QN)LnQk-X{JkTz3|JBZX-ZMl}i^_<>TfiZ07yWraxlFem$SA
z^A7mW53|?cu*9S+9Ou|$*MHkge)(UU$$9<Fg{4B=vIY6fdAx_q=iN+g9;pw8hKEbs
zVz)MFR-SWc54)FBPjb5_poLK`I=2M>&KYWXPOpy{B|nWrN#-~emWwVTX$)TBdJo^1
zDZj~Jgu2+)xtOm7r#ScG)bF<c34@A}o5Zyp7{8!$5nI*1J4pHHxb9rjAoMdWlxFT>
zC;4?=#(k^8yz-{1H8$v)2}zGtpa${$f%-hC#qIGqM9tR}Ex2d#ejV70>qXx$v4#P(
zg@aMSm>8HK1dgd+T~-iz?TXm$D4M2y(Jr?5t1!pZ``3V5eYMGzJ;SDwvA9l;vsZ&L
zwA?3ZR(|Yo_yS5-74$Pu>k+(@I<rz>euqm!P<RJ?JjTMqW41oDrxvQrNlw)q`CVMO
zQ-4_hY1S_PdMGNX9>L-e^^Z;GSt>C_Cv+s7n37`NqwIp_R^Jl`b)AbfD}#>*PW}D4
zfp2Rn_62gG493``M%>0<EJBO09)#f^-a(N^?nk-K%FZrY3cPx^IkFyT!N?`fc8AFR
zzD!-03&kfKuFy7;8mAhNcCR2KuSCqzk|?GH>RyK-%2A`I_!8YOp2ss_2VxsAh*a-n
z%+@tFq1k43Di12+GB7DHQhXjT*oP(5Re+Jw9wb9>RS`}8hFS|ig4@sl!!U#s6B0&z
z!W^*BN4e5&)H`u;c9#EcWXBMKfTq&ZUO$aNIBy`mMT;KQiNH;^)x*<7Yg_kfRfDlm
zHpMg&edVJ1>q-2H=w%5-(<<Gr&qDsB#<J^1cEF@v*oWGpUGwoIb1}=d?D1PC{o>4|
zkf<@4X}{y05eUN)<u2IcS3lI(dQo_x;466^N=|iNL5_e&^#!WudcCD$J^uTs$e7RX
zNZbRe#D$!)TTU7qFN{LSPmQ79TP*p)zQ6zVw6ytnCf6R(V1MbC(ATQA%kJWyl{X^G
zQ^)q>NF3TBTTrK6md{QGq&D)gJ(J@$r+H^Tj{uVJ<RliZu~}6wHS!+Tu=h^@U3J?f
z$}sB?hLEv9XAEqxc&k>eZ)?Z%%!b)Cs5_KsoeCPh>?3@!!#R`x)jdL&3-xyt-ss&>
z=NYnCGd1Sw;_*_lkD21s+@Jqji~awZS|0cu38?(fCc|EN+dswFdq3@IK<`Sui>T98
zbzIgi?!BS1k&o#4TNJuO-hVWXm{tFsIQ4=@8gF6XVI(T?Y|5%xc&5KIiV|YIFU&)l
zsmhp27s!u)Xl!89J>~DLygrS$f)Q9Pv2ouF@+p=zmTc5}gecaPQ|tK~G)c0MFDoOQ
zW>t&Ue2zk(c$ap1l4J%#59IDxrehI;D=q$5leq=UyUfs7jHgoP*}8gr8F#rHu<*sx
zweCU3dmvM1Dh$%Y@D1y7Iz6QLP5J4Ir_Kwg88mN~ug<6;YhU|2f+%Sk&2#E=Z>U`N
z840d*e7{%>Mg0`oh5)$+cC@elmyL@6`(u%L?*lhlRVP0RUMFm~1RCNmJHNZ1>8~^i
z<Xr6%CI0mLz_p(nx)^Gx6SB2voRK&DQ19Uq;`_>9LMP{o#FlQ?Yli(*Hi8|KPmAf!
zrOH2(vr^nLQc<m}sYc8H{(|7ac~3C%N5wRxj~$wzmTzWZA$zvo2`xPXk$aHlkosj{
zU4a_KFxCKW6-W#Gr$f`+#{3D`Ps2;U^BZ7!_-f$Q8eN$0WxuP7YAy7Lh&ng?p8iKc
zJ4S<!YF&U8|Irf44*OTm(Ms)09Qr~6HDS55yXB4NRbF<O{Q4X5@VWB|MeYkdpJ;R)
zTZ2@lBZN&DS-~JKO@V)0-xL-><DsL=JylipTn4Pi&N08c1BY@!&gCjb>SqSCgSi*5
zp6crAC(Xw8x6*qOFyI(s9-<aJ-Dh(D`@b{gs&w_a^Er*Mpd|rB_+Qhgp4s<R>-RO@
zm;^dWZmr*WZvsR|tx(Nk>^E-)F#P)e=nV)4;8)#>x)8(p^bQ<ZY}YS;bDV<O{%Uz<
z`zfE>zi`HiphIAb-WQI)GBk+@2<Ub_9x+12J9e{(9V^gv2~+7N6Q7t2Mc*LsEVOWa
z&Fj2^iLN+UKF?Z*Lq^WWX>%=(e2nbej?+5Oul+zt`O#fc0#i~Hb2L1d@*_9XqHu38
z+F>VHDKUQiDPX--fTukRm<W@(8NJ@AI+^Wt260&QJJsGhB!4>ap6GMd(juhXEkWz-
zUdlUugw#)-pEPfLVU097IcCM`?ECT($*|0RIHuZTSn$NE)iPv2c=snh=mq|?*}(MV
zyG`oDd7+|xoTg0CVg_f)ig{A`D@ru!6U;>WCcx*zM!+5Ex@RXO4^%IZno!P!SvBr=
zdr0T$_*bA!>(?Y+kPvIK3~AwDbR)Pu;7$0Uylty)&4{B^K4=yhn0Du_VHTHN7e*{D
z1zQ-X+(U1K%Z8H8j&i{20Ht^a^i=9Gp^tyIF&O#%QL+Z<hszBs8wYNV$l5@E99l@d
zhmQu7YQVw)^K^t_xc>DDP9^k8cp`n%!tW{W<(JIg65TMjMn_YTTD$<)$nk}*G`}`E
zf(SdQv5O7kCBTgZ>bc3(9Euh?f{zAD#6s;7pZ%i^GE9rWWcGa*Bbra_euuEv9R-Z3
zzE^aQ&!sHYCq(cVk?)x1@*Z1*=_Aosi&LH(I!+>>=~Wm|e_6`k%=fAG0LU&mZ-ip^
zN*KGNgP2XV1n3&$7w;;Qu%$V5flR@?@Dhk`U~K_S_@)4N(YF2PzJMoEn5?zg%1-<|
z1Ev-V@Rsm{mb!po8rO=fWh-tD>%`*P7mI5cIk+@;eHyT;zKS*?mvTZdJW4~55xNQD
z{O}(@9rc&<hRIu_?|Nwfq<#i0K_Qa!eA~%c!;h3qAC1fnzP5?RgmNGw_<RuL#f+g8
zr`c+dcvrF>E8*2iW5ZYoUmp|CmeefzBcH1e{+$E0j?ebyG_P+XL=z&6OGi<F2$i%I
z1{$JSVh2;h$d)DiG?S5u09b2-{>m?#2OPJGGazr{$C(NweP{5ZT^y}Hm8M8>Yv>DU
zLRLTW7sQ#MUL1D+oy@gksj{`Tg*$d+_rrzVn;Cq>JV}fe&w*W&mdtE5OAL%@ZHkU|
zg}=wf-OZlUgzIT2hS6FQ$yV(vZ5ZzI{sobyNEc-dvcBD3Ui=!6VM#e8@2L@2ydg*^
zrYXIhBKEO>O-$$Lw-*<tJaJpB<?)c}D`&UQodaZ}+i+aAeXZR?T3^ZsA4coxYflPW
z144myk`aivydfW5kNjyiV40b|rr^=pPwxjjqwcgvD~B)`*^2WU35dXLfoLjV*_;%|
z{!*uowQ;kzYc9&(n+e>*v2yLX#}{kwO=4d+#_d=0)pqEH?LvMdy@i|BfK^K4_4Vlt
zPhNo>noki^qL5Y5rNg>B@1m87yRt>tY4JD_;&(%0XL@Z+=54Rnx8CV<@q9H|$;AO^
z4RE>_xg{#>XTu1n1dL~L5AKw+F1nPIS{n7&h`G1&Tlnsl1bYzp8MQkE8tF!H(sJ&G
z5ll<?qbQWN)?1n`UA`TfgiW4`o|AczKb>YdCg&JEWEINJ(qbP96JcGpLC#w8`}`79
z0-htSXLCJ3)$Y4dzjO0H<numdf4yv0VrsHq(K%VrT_X|B5oK$npS-C$AS-tuA`XZF
z{P(c(cK+w6db@Ei{Oh@B2Fk%%)d<At83FwF`RnMBW8miYv4+NRWZ-7?3Dw2z4w*Tc
z^hz#yWz)Ffx|#(!cXDZ7EVo{2J|sCOV(n95m4&J!6a>^v;oo8E#jxgnTl+UCNWoWZ
zS@JH^LC^XCs-t|KH#}1Ko>}o`)day-bwc0y@Y`#Dn_;)K&Z-z}7$@FON&3Z6I?*6U
zx@|FcZ|pX1w4O3sA`~iHvET-2&#P*lrk@sCyxs;2?;Tkl$%K|eP0nf1>?yS9c|#HI
zw}R2J&NTw*2CocX0KLdo2igKNM{*%5`k2IVomuEV&*tVAz3Fw0>e(&~H@8rVe1k|_
z>Jq=XyV7@MUz1C?TIFw=5#SUUis=DRVh414nE#4is7oU35xE(Ng>a}a>yjbyJt0<f
zg=xPp0^T^g(hYu!RpeHaMN7?g$tfgOoR~-7RLrrXSPTw^GQqHSf_<MQ1cJn7XJ~$Z
z!$;OMcbz}QeV0n#8;)}YM5_Ma(-XyV^l5t|9ZyN^)5!3b6r^8XHU_^d{0mHf#fwUS
ztAk)fB72S-K(0Po5hA`VUlZcM17I*lm)HmTOXPl#ZL`tMp8gQdVp1T@Unw+>qd(S!
ziAokpv<g$Trqb}{b-8}XI+tS{S47@s+H`<;rYj1H;Z`kaE7g!pyY1(y{oV&pHX^3N
zO6+WN6SdW%9kcgotS?NM$=m(NK|xoWe<N-yE%r0vHFjO1{W^dP*9o>K`)8#Trpsd^
zW7y{#01d7{n+KDiS|UsfQXXvwhuq7&W3z%cpd4Q+3~Rp0sQ~JFQ;+&l-z!i)!|Dg(
zF((H{vSWo9SwqR(cX#B;8SYU#Dx*>HG(JTe8zOFp)iS$j^nIJvmfCD&NrH;5>zHz>
z7$rULLvs|A+bgOFX4^!s7M`-kZYy#9Mn6DLG;r*q!yz<pUKmRV)y#p_0FKXdoEL=P
zhWw|F{H1iG;}jy^sWo_Wd~CPW_^C*WWRO3%Q9su@2@z+MsDHlcI^%?7l<VARE912m
z!=6*wkZdrPv~Q+ZuGa6#eb*M+1gJri9sYCyXZXkmXIOBq1g%t`3Z4$QYRCt1jOf%9
z1Nd@J7#JARKUrfF7N`3p^N@NXD_PHUiwDJ$P7D+(3R<&r-&!$AZMc-`SI1^7Cn$UF
z&bKxlBOo;u^O|x%W1pnfyl)^k^0}X|Y{AvFqj=*jaJ}8n&r}xUOfRUhk2l1dwRE|u
zS&Tafyv^6Qx^I7GKwYktzYHYdd^Apu-P(dSFRRue372JNkA%=W^*;w(DHZVegBT8&
zRvcf>gYwTWO0{A4&#FJNryM&m@O^}yP-J%Vp~yfZ9n$%3v{SOhwtiqA?Q?WD_dwcG
zHKNs2Gm`+MSp_oY<ycu)I@p?rh6$;TU?7H{Ab}ol-#tCKdhCDS+8^=CqVoP)<w2i*
z1U1yUJ>p>!vas^N1z|@*>ij)Elr6yz4Kqs2<m+p_%^yc>w98WNe34M<HhR#$O9~0T
zs++}npB_FOqQn2wAZX6)HBETq2Q$0&!A2z_<!|wt%|df4tlgMtFjvA<8X#ZxlNPdO
zRY9k_qakWg7jO&r)C%fuY|se2M?<N(`S@j2;waXy#cz+uxAr4h7pyT}@HinKpTJA{
zB4ba%(`4_BU)yg^>cu7y2jBs(q=YKK@LjnKw(}7^EKq<FSg-GfML1Ef0TcupjgPW^
zb}o>xid7IT>xQWoHW3eKGiFVAuYWkSY>%FnovCif@WW?8Jjl#U2%AW&x)?qdC8hM!
zO*MH~K_*vxV(Jf5<im438CE6{QrPuenemCi`-hc_UPozoYP7((?!dkxo3|i|15O@J
zNwW#@aSBH~A@8doS4gz1coRf3fZTBo4OL1!l2Beoi|*)zhQd@PP&5YC|I+39AwpK>
z&#m~d%;d0mDv1{$>j-!AI8ro#6*!b@YW5c}&8+V#Gnz>MCy_4Q2O4k0IHVj>Npk#7
z_NWel2U&pwWGssoUYGlm5mq_4jHt$}8)k_r)PoCij6KwY4`U^x6hFFZ<eNOCPp17k
zL6q^YkprwFY-pz>`R|#kQhmdqPhNY^KyEIkFNRimmbEhV0AHPRj;riE`%uwV+El*O
zS112vDyNBrWzFTQ#C`U>dPtu{p0*+wnXo?Btzlen(Bj9qU63O(6T!$j&Ely0@1CV4
zZJX@eEDBqjik>Zwi6!ByhEj}FK1U(gw#VC(%7#QK_~*KD9fFq|4VT(js7o+OgYk{I
zs|mxX|IbN-f;j#kWRGKf4cylm=F24uZMl|YL`U<ci;A{YSJxpY5IGTEj8UMib&?y?
zvG<;~w19UU!yBpl_4-^5$5a2nfXQ$o&0@1-UL6i8X$&-D+&t|T>BgC5c}K88TA->h
zPcZw%Ok{21WgMwj(4~56N(o*I8g7hHsqrh(7=ZuuSV@eLjCJKSz_^JHBo}f9-o<vc
z>wwzTN1^vj>+mhnJ4`#dZv$qlL7V%zIrP)>Z)6ndl-|SRIO5?OQI(+11xeK|vJIEJ
zoQSwMmvYco_<s&}rFr0Hg`Z!v$A2$vXoal>`|=0cp(|FU92!F}TSEA+KL870KnnK>
ze|FxiZVB{Y^U03F0c}Tt-WeJWQO&*j`$)f`AI6IpEn8JmEajMgB{zwxyK9z<i2lAm
zw`ff}Wr-awuL~}l=y`?<^Z1v4VMtH8+Ru;v-wXXXM9<4RW(F2E3SeNnK1XtYM9K@S
z$41lY*`S0ycdnm_r<=CL+oUr$g#9c8?_a5g?OFYkg5Y6kINimE82F?;wZ~(-eX$;;
z<!VJ5Gs*&?_s2E4(Cq%r$x1qjmfEg}+=_*Se?F!-v8Dt5JZ=<@0Vs|vEJFP|jFkG9
zOFj1$Zx@fk@yvhh)rygpc|9z<046e+i29bv^HRcgXmVI>+RCQ^xvx}}I@7BDdy~CT
zlZ@!VGpUbKGF5`~A?gS7T2P=-Dqk8u@Vnah46RX-r3AAllAiCm3=wVjBb~o4X$auL
zqhCGd+cB2{Ca%)EhNIS4ANQ9}{WB5>N<=rJNLtqfk4j?Eg7xd-pKcr$fbFs7#*6pG
zyhM4h<lk;e9I!k$-!dtbu3s&3Ru7-{G^mRRdPLadtGnS}NWpoktI){Dgdk3pIWn|&
z=ThCax_^g#+NjR7uor%<hVU7l4Q2|J1Mcxrm`-C-Z_ML>$Vzf2G+4>Q<E)}4-rVT@
zrIbmSH9b*tgStj1ZN~lw%YwLIw~82iw-8KvpILBLPjPtgw&tnKz_Ccb(My->C%Z+=
zG(G3YU~*&^n<16S!bze7YToh>3V@`s`WPcRV_B)3UG0!OVBq`O6!X3Jf4S-DwZxjm
z0FN9h_Ii5R!EDSe4WeSjt40k9y4Q^K^fGq)W#5ENeqaTn0{f{K52>&cTe<zM@G%J~
zbd#TE#czt=h-iz29;HRBG^4onz8IyR=yk_(j0(c)ce%5Ho~BCLuxIl8tm95}Fcxa%
zm6Ba-l{8kyM@DeRnX-VnE;|nc{1Yj;x%malv~vAsv9m-|hP2D(CPFxaHRSuP8i5t{
zlc``5F9)X_NZ&z^AWpW0hyf$%c-l5<u{`fmEv1(*^7ThhWOn#=3++A^?-|?)>ZG8R
zVcd4(obc6H$jK_5e8aX~-Zn4B;DwRFBy@|WbU&ZDlk9~2ghR1iK6;J>2Pfpu4}$H8
zo{R=?ow;0SSQvu<Q}|E}Rhx+4j;Eg%h4)2vl_hy~ko{_s2GAm4W#T&;F`MbYJM#_I
z+vEVHmYc_NK@JSdIzTA^DYgtRl2#$BKrG~YUBGOu{fY*Opp&S<a@D?{<c;k@1K-g+
zDBP*lSel#0{bV&#zukQ#hMI4eW4`gYmGEt<&wZl;9S8<(!2FuDp$hazgFu-91G(n%
zEH(&yi}}~$buOE^Wcr<$>6&j;k(+0~_STub_shE_*Jy>|B`3f|vZ`~oN`|kg*L{Ec
z*dzD|L&Tk{Wgbg|j81INh#fw^iG{c-=LG0qpjvc1C(5l|puGCOUOroYN2tTFS$HR&
z-P6yGh+(wR)%o%9<zgVWET)NAnn&!#`)1c79tpC-%JXW!9vUtGAQ{auBLWY+^4e(m
z)^K@c1u?c;X~Vl1jOuRq*te!q=|?jHb#_0&RBvYaypu+sn3P!Ku|amjuW}S<qoxf&
zT5m#A6y)wT5UY9q<*jkd?cAsCr`~Kj$PHO<gxV?B`{(qYdSYj&)=Cp`TZJCbPM6`R
zV|1+RHru5TQ!;vVDw;4@l>LWy_@};k3;cJ*^9Hw-#qh6&1_rNeb<nNJy}GY>r;JUs
zhFLj`0}nPh2Mq^!y1=3$iM~MLq^$(v{8Uv4FR%h7-(h-p)km&5QPf2K>0n-}GcFeY
z)xkWIqNx3ubZSsUKzbE$56sy9L{EW)mam+0odN&bL=fn?y#%XWSNt5=wA7B2VSV9Q
zqiO0IjV@{DjGpTmKoBM9$5u6Ie!1J42NM@|@4aM0!taX9DczJXR05#n*s3I12c$LH
zs=%SyqArd~G^h9LV@RpRR25UA=(+(Y21$C`xDcoI!?<`8nM7^lC9v>iPWojFYD;J$
zCLit(@+VrFHXg9Y!DylQB3HK%apej)2PLH(aq{6xnYQd7H_@15oX7A;w-uyeLdblC
z7gJ!ZZe{}*62{LbTx&<0H&5-9OpCB<Bk>$bS2T43d>?nInUZdLqN6aG2t=z{|2n`U
zRw~N(lSfu`u>XOBBY#9k+~UAX_b?wsdcMoOMZ#j^X5hpqTwe?>u8iwlVU;KVa-v*a
zkkse!(Y%*Jn2=S(PG=|g2Rs?96(U;*dGS$(bi}hh?iX2>BXzM4)?GZ_A)cQ+0*lOW
zf4YxTe2PgtX0ATv%M5KvmWPMu9AQ;$5#0?9JZo#i(m?@|Q2zWDD3N<RKb>8y*mbSn
z&4c#@OegCWrJS<xp^s>=fOgz6vb>3iy>etg9xu#LGn1UtzIp^f==~>)nG$IpYf3sv
zl(~B!5rG8n$MO59)^v~>VAK)JwIofeM8W*zHIfbVL+<1tVxxlbL4u5W!2zD}>=cEN
z-MvvIzD#LJpPK7?d$%3Qk@J2JWWfO!fcq{U0Gjm}`)1@5gZ=CpJ0{j?9dT8|b$#xq
z?*V-eHor*ZL{r!p?XA`tXqQ=x^=yg)HKxO+vytIk$N+uq9%l*QDDjFMVJA|{95?*m
zeSIl$a}mP8Q8YMU1-M%G$9PtA*#jjN6}#&JW-(Wg>8+~w5dKB-zO_RW%>1>&b5ZqH
zU7hyNKrRgUG8a;gcvaLu7O-BOUPx>Oq=VqPu_QH>CACYBc$B0RBGbN3-u886+Pr%9
z5_~kuvEn&J*Tl~7wln4}gkjG<+3)>WIH-Kq>2tT0<FPJgVp4EfnA4*G^u8g4^4LDs
z;aBHl588vA`(~u}Hr+@77ljV=4(^8De!g7)M{B&b44-+{8jCQ>Rz|A5d>sZhmjx0a
z3Oxbg0q8co{%VzH!n%K|cPP<n^R!$p&4G~DitUKUYID8lcEi|9!PEbeI?~&(L89FU
zK7TGK<a>c%_$|%zv|mz^D*MAyDc)k~@%2Ndt<Tn*_s#ci$hQEIV=0Waf%>OREuOLf
zL*kYW$PDAR71HK<o#IB@1>>V+OSjs&D=2FkCdbk)-+1xB{qo29{um@8ca3(A(ckfa
z3V8$@<b;q1=zSj=S|+^f39(wP%2*p16ZSe4;eGW_<Hv_$?#Z%SPua97u<IQwI|if5
zt|md(qY1L`)3vGBV9h#6?nG<i%j0^fqlg5LwaQUMa<ZB)!<FB|1NKv9i^mSv>HM)&
zE5k>api6_J+-%T=q6o|2s-|VT2SdH@am32E`9|>K$-kSvY~!@i5jK_ctgDTbJFZs+
z3!2lg{15~Zf+GvX(+B?-#6p*}ueUy7eWCmpFCGtd=J)3zk}|Tg?hgFMU0zrC1$UyZ
zg6-nvO`P?07lV$B=Nn){M%VyN;BCid@Y`mt&sqJ8cDF;P;6B~5`TjdY7fM^OhC1Wh
zJseb_sQSRj(v9MW_zs(5{RAvh#HIV%<@s&oN~_yAr@oxy%C~xrb+R0tRL+nG6yuNK
z#&bC=O+FmMd)BU*Mz5GD2(OTZFJif&d(YB!|6Gs#;`*l%eAB=Aq0be|=N2+hh(lI4
zdip;2!LhqtX}!HuZPx#xF)*CmyXSNd9q6dl4LkYOSH)lGC#}?)i(v-X_aw71oqM+x
z8@$5JlyPY=83n<ze0qL@Ea!p??_zjHH$KD$i1WK`x}^IY6kDtA5PbMb+5`C%Hca$?
zI$?O+DZ^DliWU^TciX|x3*-DuZIfDL?;9x#jdU1nFk^Gh2pkaSpwmax)-}n+y4-#;
zPMwPi$>R`H*`nJR$KO4YP%rb>_B@o8_B=}GE)>1d2!zEKele?kA#E@ipTErLko`}E
zetxF@->SLW!!R=?tvC?wcj&o;wsmAnmkXi85m}hE+^xxW&^tX3ZOaDhC7IfR(6a@H
z)sU3RW~0kZ4J1^oGNqqJfL<UOG19x$T5B|0TEy!TluOB`G?*kZSPcn<1w2|Lq_!7|
zM@9WG5%;2x6fJ^Sv8b2M@i__6Ulqj9U&a_|_?@V1g<oVgPY&2|Nn%ql$beO<{z!q+
z2yxRI@MLPDHB_KwWED9P4LsyeJjbJc>2D9{)TMF_v)KR%F!FE4yW9|TfFP%h{U4PJ
zL<$n9Lp;V9Cc>V!t9lO)2;MI>X&aXBK~hG3w71RAnm02&W)vRDVouNTqE%_Yzy6j`
z>Mcz<81*j!lX5U=4GeSkME^nM(t7|LYTzNG&t`!G+WCMB_-E6-20fNM>UL69V<b-W
zWoB|lT#A6|`Gg|7RxLC9Qfq%C@H5_G(n&Po>d#aW1br<6KcBfY`rqqFw|G_w-~ndk
zx){V6CsCtKavr*^@i$WJ2xb{cM2mhkG&h@g6}WVu@M=Cr(}hzt9mOzzFi%5o5mo0=
z$9D$g#yW-GdcX!Pl7uW94;!1z()E_7HUNa0kFY$;jhyd9X83-x4e)-SRmsE3s_Y{p
zp{DOSUOclV<=N%K;46`Vaqe*4aK|nuIFD{Jsbkf*n7t5|QI|u63aD%A0#LM;Mz`s4
zJ0Iga0A(tUggR;uwjxbp-_!gY5f;=M<m2E(23l6oHwk#0)&-e8%IX3Yk!u&qRi%Tf
zvg6KKZ{+3V`ko)IQtT&O{@|q*+ON3VyaN{%5MS|8x)a8vpL6Q(Uxg{YPf599S8)+8
zT$eS(yID~U)H{?R?m!1tr>xJ!x#@urf)C@q>R9I9EHnT5CDdE{NTk)otd(VJoPh`)
z6(*5h5u8n3*M*E0-Q_JL`SIpPnqCW%KzGVN`clVZ7b3WTR1}x<(Qdb2FVeEu7Sr4p
zrH0bntyJ%3UFvgB1dqUJNI7+-<%po&QP%D%3bTr1s_8>NIPnz4y}x5>n|*P@%y+-P
zqZ84KI+d*DVeX{YZcn{DU!Anoajfox#(dv*zqS?3vD_T<^b84{e$L`vP+U)09xhLO
zdcM)z-wHS1;F||{ta72G>ASbetwo}|JgwUGm4+&W$F<Cp)hQHQ3tw1$n^S1-W#Dv&
z!1101qe3$OkoziqR60PP^t=8W4!~sTg|vdwQ2zM6oiuxHLnjn#s^vT}>;C&|Ezg&X
zc29$&m~%M{(+)fidI22{=1o{I9RaH$2i^|N98bJF)YQ~lwa6GFPqx7>jU$@<XCeV_
zq^w=MjiE7hA3vf3XV;6<^kN01W1QKAUj7iAKb>{A&hZgczjYG>u}P2g)GcyBXGwHI
zx~H~mc8k9N`l)9jI#PFelvA&_C%Vws!8^u{5JVI~LmlUE)wsJ3FPC)z?rR^TH-EuT
z{v-o20fhQ(?hNA%a%&x4j$2v9hOKk01i$-ij7J*MfYHBJeZZOXwj-e#Is48V;n4pj
zUY1RPZ!=d`^A#!f!60L}$90qL+eNh4F}{7*-=Wgv&6V#zykL2KJ=m#!sOZ+%J}x%g
z{3}hC&@B}8c2fK#kcYFoVQM-U{qY6?<JP5Ff8nNTh-~^Q{ClX$%uabk1x|70h~U-t
z(9%3lTtrj!<fXw+|Ce#}!}~YRJ{pK`w?c7NX&i4e{Fp95?|(*rkve1)o>yr+Db{+@
z&ou9R?|K&KAet88&Yz&@OhTE#@_%>^Lih=a{~a5M5sx$NLZu!*i8Hj}_3=OOFp}CI
zc_Z5qN5hMdiS<1;ew%gMA6Asog&~2R>yyU57@ooN>;OGSJDU9joFV~Ht-qgRie!UX
zKKF1IcvTPAOQCr#Fui{6l7Sh_&UyN_vD&D0KWpsy82TkyH?pFlMi^W>QA`45z_04q
zuND?sP9}c*eXmCn6!Q|rQJ>K47uVCI5vph&H%FnbVj0{W`l&eBpZ`d$$cQN3IkTsd
zuQlxVF^7#-f&@M;FV_@t*ZQZe#|wmTT)HNK#OV292FAXJpa>Em@y!PUG1%TV1q`Qb
zuaPuF14h8`#AS)azUf%UFReO`uLWF)zXw?tzX{zyN?*rh2JqiyBa%BRx{9>3;LEq8
zD`N$TChFydgi8i|TS(xzLaE7sas15fzmgh_p+O>MlZt1bNZ~Zg58KjgsjBDaPZi1)
z`Pm3fJH#rf*`7|E*M{@fYcN3`!k_t}#`QyPBK<-*wu>?~IA)Xa?+ny)pPoMPoXS}G
zw<VB<3rY4o*sJNnC<F1Tims&`R(^r~(EE2Hq%vQ2p<W&{;|g<T=k@Mp*8o3W%Sc{o
zn<jq5s?(Vv#Xi<J0QJ%A7oJ#JJnaX?-_;A*1^^F)iY^G~!`J14xCSaZbyjWSPv*%6
z0D-ws7pu(_Zfohuac=u?w=oy=WoBU%_?dBadx*F$F!&Jes;cm771dl8wMbv5`6xa$
zo$fU1d#_YPD*AfX6CT@zcRBoSiFu!!Df!QETXrW!-qdX4Vq(;7F)%R1&(?W9Dy5j-
zLnzbbhcvR29_msYI^G9Oss=BnlHn8TOLX7+UR)|;1wV9@=Gk;a7qJSam!T%Db9$dt
z&H9z0VRX`^gCF_8^|9co))=2JeNg+qq^9!GY`Mu_SHNzhduPFwvJ0LK-w;Fp2TALR
zvMz-zZuK_j=-j-Qj8gZ<%o*0lGYIR7RR}oZC%0cQ>1qD%Xxes?qOkI*^5CVkGnkQM
z|ENgRJjlq)Vl#}Ov`~3_08hukI?(LJ8;#9xuL@;pI_Ip#KC}aVc$_|V2mSEyaXaUY
zfx>eM<4yc(k9lP796mClf(k9~OJ}*H_4&u+hvh=UeJ%H|m9IK9(}{F^nkkHmgr1Ml
z+GVQE4y}*JU$4zq{Y;&9%AWoHCVzB}dHYI{&eGMmDU?Rv+c97+Nnic0V}j2hA>xmS
z+|JfEjTFd!x?uOBE!k?@=Ux?Hc%+84Sl<D|U@rjI`<z8X!-t0TESca;eHxh$_muX2
zt;sk<D*Y2Qq72RPMW{pp+w-fOLW0*lD#qnq|2Gw{AR{TT|5kaaz1+3EXtyq;&c|XJ
zk-YrQa{rMbDX;HnK7dbi$xDi?`+0=%<njr1qmM3+rD^mu^U4uk*kd$HIHhdk2X)0a
z>*2NAazHS$tzzB{3Sj4q_)abLt*Tq!V4snQbY-mzI=J}X*~ra*D#9au;_ZZgDneG}
zpZD8GUziu&T9Qfdpm~qU*}PbodInQ>zlMcIqTk6+e&yz8vnQlT|Cny}FV^)xFSfZ+
z2n~{YC;emwUCx~p{=~=}2LP&M3<;uOXe!135RG$%*V#i-6xd0XQx*`E@GBo<HO}DR
za6Vr^-1vK1NxWqz1&4pHEQySN&Llwz<3T{Nn5P_)(;c3gPX-%w9`!Ei72inK=u^O(
znD6ro%j(@8ev!o$-Jz{kO?77Z4xHFrRf8#j%*SLtT2A?HwFzaj(dUcLdbJ<@7g>+7
zGpAs>n?EgPGP7USqp<CEnSX0EPZJ&6SF%Wkn^a7<{;0Oh5w9?TYYVotnV2|YDyWws
zOmL(2&sbE9tF`$eT-QzQzT(ac7h?HqaDqzv{01WdsSF_Nl2iI&8k{|b`}da%(Biyj
z$x?DFM7vXo^$W#%wB63xQaB~7q}#|CWB<TQ`N!WE1%|Okw$Xtd0HoO$sRY=Ti)a3p
zr;?_!wYq!>@*A8Uz2{U(yndRWoAJ*@9ZBdUE^Hs<Hn&`Ne)uzb(3(y(v$x!KpqJ@(
z!>${)k(3`61O>(eso(1-Dl6Ws&kJ9S9W(){ki{<{=;Sp9aOrId;whm_)@f{2v5C6k
zfgZF{>NHA+XJ@594FJ8lfH|Kp*YbdyXlJ?jdGV2K%|80*20eQF^>qM<pW>^7pkvSp
z+)k@_7SI9N6Vrgk?zewKFUJS7WhVNeq&j%w{au}@nmATiMMe~sL7dwi!aeIWL~y~%
zHGiwa?XI3+x+NvjnA??+(5U=1D<@Phk1=2b9Vu4CG_5o{f&ynl5HUt3P0o~G4t>DY
z`gnxT+i@b4EG+2L)6*>n1wU$xdI2kWsH`2B%(_i#;9ziJAb;eUo~6UrTnWwF@7)J|
zr8vi}hI0Xe1eYZ+sJM5yY?(S2oBWLq-U>Fbmzz}#U=YUIM6I9}=;T{;Q~AmvBgU<<
zNp2fQEe4J~Tdl!U;R1!*wH!G_nlywOg?oQX?7;hUwH3SfTYKGXnKG4xq+~g_Tpj?b
z<DlNt5<-LybzaZqR~n>ya-6t(-B0Zw`)qwA3j7pv_~&cy1V>4S^_j;6)db)jT8r~8
zTN@>E9KaguhNKLfjKqer*E;*x!-GFgtWx{J<NCS4`p2u$eo$tiQFDLD#lN}ZbvTB6
zJW~$%7g0%|;@%RHn4}7SN_4~#8>YF}5wzS$1@Q)05%1D%L)XnCLJ-k^x};U#PlgfX
ziw~l^lUw*>u{o#0B=U#Nzw6u8)GLnCH1La&OP-<%$1n{Oy*WKB{6k&_#$0&I!3th`
zS*-Dg^Vhxju?kH1(R8wG`l@>cLCP)FIRkHGvrfKk5jUB{4SZ3Xv;20T6zyE;Zief9
z-9pH7(<<3%fLYe@6uT0C(!$WUcDJ1(9YaP1x*}+I9ZtQARU}{?$mFV=N5inp^Fyyb
zn@7DN{^WExDARkl>ek+QwzycLpc_fOVQ|yls!0BHlY-a%_Q+^rQpHu%;j)ijrQ7^{
z$+<Ww5_1fBRcuv!Yjp8R3K~7xaWyfx_-$Km4jRL&0v~j?(k^`~D$t6MmK;$rb{FY$
z)=GSF@r`Dn-ehR%?}69LTWiCGTfjpddChet>o+xn?W|_2pwqR<L3OZR;q~?nq1&KL
zQE}<g_A5HYV(wT%zCpn210r{oVK~3C+jPK`QQAIRJG1W{DboW4=PtiO@UGDd2}JXD
z>Quz^kY%13c*9@U*pXGZ(G%pnonR}GlV+Gn8?docrhIYPEbB!%!(npQeil%cOYYqj
zPDU8s`E+|w;O8*iK|?Df@`vSk47w~7u~Z*r*zGDb2^#ZX+ikpBSN7Ppf?&1(5NNRF
zk@*gGDeTC7zIZ|@`r>-#LKD^Q^U3M<y|7i_D$?P-M??~=$4V&*Qts<z753x>^yd6)
z8ktH)K#nTXT3fBUKhd(k&VK13&))Jf=-B<YIL*N6a?0%gN?vgOjr;fVEtwW*&|*`x
zQLX1Oy=|tt9X&0v@Hb3vO49WiAb92Wxy2csKZZlJCW(;N_Wy(ThClxo?|TtG$yEgc
ziVkpjzj(%OM*&-6G~*Z5335UhcaSj9f<O{OG-mi|@zFO~w_BCwjNfFlFjwdFDLb$v
zaOoAh;H3jWJZ+7UqE_*7yP-HqM}KLivS5VC0CY!cPM^@*dB`Nr_FsSJwvgN-hNDK%
zvVD8cAi|^DTlVsb69y)0#q?Jo!oN!{#_g8{&JaEXufi^C$7}&#oJ2j3n7jxm((S(>
z=JG|sMJZN5%2dcL4m##XUjzF-@(Z6BiJ6m{+l({$x$svF^;CKIB7>G8y$k8v6Lf(k
ziw0c`uy>t}>XM^37iftxz1W@FKZOS&pFC$GyY|dWKd|!14bRtoL-Q5fNBCq-f)FPd
zB;|3IhBW?1<U<|}mM{2JwwIuC>%12vosi6;RK8gDekVrvRTabZsX;7918tKPD+qa9
z<+h+oZwD2qLTv=XOkg<{NlXs80TApHM39^8M@kALWNZhm6EsM<Ue(8+{S65-d=AWc
z!eA^5W83lC&k6UwIb!HhhD%=^1(G3u#x9u-EJ2`VNJgONnkpBQ|C|{5@x7-MrRV>6
z0a&MqGU3=eu|O*~mKE!e?Mq-2P0ca$wlk1pIECI5=r;_S!H)~}4ekg#PxNM03`%(M
zHAfE!{XQoeFX6DOhl~u69o2&<w)3-dRIjH+Gs%namPVB@`n6*4#%{8J``iIN*TZtT
zj&_!$IEqB{B?i}#+q}}bdZx4s7e+-o%f<p=1@iamsnh-#r2IvX9G7-+WI{j-wB#l`
z$V#*3&o1VQ03)NHm*JRPR0tTjY~lP9xk9>Pdf9pLN6_#I`X>dFq>x9>3fG|fB-Sfz
z><gUx<-QPaEv$<c?9Q_rF3TdbYGsh>@u2&@w_j(guuv+hafWQ1Wv-vsIsY-oikr50
z57TjHkNfic)j>yfDd}G0fF3K(3r&OEcuRA`1gPt=BGBlf;-#v7LWPYL)Of2eZMo<9
z*i+juF4SMNZ!REaB!xulIo8!tooxw?l;-tT+w}DczI6M;Lm?5vg<)9@AQi}tk<Rm+
zF`$5M=Sy$cr{!=$sp}q>NkzBn-&=PgJzH_>9_6M%Q>&_z!r{=!_a%GKxEG!X)6)bC
zr})rSxn=GjsE`gApA`v*c-!7^{9AQWUWLd1faC5Zu&cQRrm$_C^i=O+bTXaKw9SF#
z=2;P@SFev#Q8;K^mpkQXwtS&oDkjr&yW4Te<>JP4C&E}}GM>0{RmDk(4FQ8Vw%E`&
z=mqh%wK2ElfJ`!lDse{>o{TJ@Th7dK!3DG`@@njQvXCMvfR*TX{EG)t=VCE1wp7M=
zcE>Mt2kA$F?eWeQZa;hPv8i{*cr2(RI)Dmaw7?)~G?vheJ}>EpevZ-8@o?7CQF=ur
z_;jsWd<uIfBuf=;ivAaxq4uqI^t1IQ!yOn(gZ{487m&LK8Fs@Cta^yNKJ5`Z*AHu?
z-FD+3mBh`Ke66K2v6V)On8<x9c?L+-RDX_MwQ_x1^f{@UNNxfTY=|_?`3XQdg_b5u
zMIklHZPvcZdPcJ1=hk6WJiT9NeoQ<HzBLCz`VEuCV#{_rE`MVa`cC}$x3^Dzgk5G<
z;Pme0hddq^@VAS%w<Tac&ngO5zn;#y30@&Yt~j)>wW25rzY;b%tU*);gWFG3VSyXY
zE+VTlAdnCN=s{xXDvR5`=Ge7F$_i~PU5Fs)lBf1-;b~i;Jd(j3yXC)RLI22s3E?Z!
z{ymh_1RYy+a6unHyZY<!!xX*5|4||Fi7DbEEhGde;(l0!0&u&qMKZJ^|My=*i|n9)
zdVu-`C&@_?Z1CH-z--l;0_<S-NSMp)n~~)lv<NkuOOWYOB_l5Jw@B+re+I$S7fR#Q
z*lu9?c3f*pz~gNO87MGQXc=+Hs2P#Nh6r$@imxI0TQi321PDZ8DF!_W=5!6Qei@gz
zjP*O<^rF$QQ%FSWH9mKa0+`3SnK^SL!UM(z!nY>|8hNte&LXyk3?=yhv<_>3Hd>mz
zU6ft3D^)G&0<_#oXnKrdHC{3jibRbWb@vK;%4w434sF~lw8>L*HMFH{2-Brp$y3r0
zEz#UaC*{A|w?0VTn_6NIjIDeZss%v2ACTzZqbR~YH4raAc|!aTB6M<r3!gHYkkBaM
zYVX4;r@CBBJ)<V!5lxlS(`_DDRj2YqXoAniil5G}QmM`4ii}Q+T{1(BW~Q1Bd>vGQ
z^D&rjNPyAL{ZjeQYM%-Ll}LSabFyiL418M6;NYOv;5U2T@9-j|y<9n&`ToB!gRDE0
zE8X>hVUnAZ3IZ41hMFIkId#R7_j7$%3JMF&QRJZAm9DZ0vITbAoEz|4I=F{gOg0r+
z=8{5QR)C}wR(Ao%%$yYV%d$~UoFE-xW7;+|MUt|AeLS-flhB8TW9G^CkEc{up2LK<
zvzEW}dV4>Nh#ZL{Nl0L=2-~o*29+V7>73J3-Rn3p?t_guPOR^fZ~g=_6jJI=`!9t@
zTHfXh#qRTxF&)>ojRS&Qipk?h%+oBZ1GWcZWaQ=5xRD=K0)orshlhtz2-h2|lTLno
z4-yv_S0|4RfcogF3p5HC{yZIsA!ZzRHb-YXsyq7liUrM=k-)rFeTq;HEsqHgocE1l
zyR2L2t%X<1z;6*YQ1nyaBTrgq9CI0;FyC8JB-f!!y%9Ffy;&t#l^f%%&9PtpUXhI0
zbbQ>y|BLU5U9mHRFfvow*Gs5u7h3OxLe28zB}?}Ft?87ht@BR!v99OiLAR0qPQql~
ziswWZL~|ADazTT3g*lQx@P`#=-m1pDkkk9Y);DeCbZq;aUxT7xdU43S0Q;`|g9}D0
zP4=EpO45BvsL!e%)WHv~W<lk)aNQ`{p>8*{&X|f<>R>;!Z`^l#TJ(|Lp8C60R@1gl
zdRkQ>dJeUptaU#jI&qJ@f}*5)<w82|A)im~%un_93u;b9!Ivtz9qX>HXhMF8^_3_`
zYUjKyC;>5g9MGVjL&r1s?r1}C9i!^brCp3e9Sxe#^JH<IMy&5@g1hhm?ic-P+v($5
zJ8Ve!J17j&5|$S(wteD7fkQwaK<jjLwI&jfy6vPYsCRJMV64hx<XL6XeHB?NUfu6T
zMcUioixatY%HV;$KAI<nHcYiIQ2X;idn$w#^BiOH+j;BpqekqT$M^cKd{+Zy9_v1a
zog(!g*gqh9th4_vR`f#YbZEhXqlv2h3f<!D72h5_Ebw!WjrNhCOc4-=G@}!5VP|B7
z@Ozv_h0_X}#If2lpH8s|yq)*GQGa=|^T~FRdJXP<4*N0JedYR63F-*m6?y&n<8}#3
zD8K}7_**8RZnn$3?mb=C*A-&xfBQ2}=ru^%q_`3A#JuiVc<<Nm!1n(CLf)_cK;DX+
z70Ex+%ZhdYjfh40RMh_vp(w*v9>Q3dtBrot>$$6ar)RnB|50K61DXG&DV!>B|0}Gl
zsIIG3eZg}Qt@`t(#R|356ZHj5#<XuEWUm}DrEy^stu)?6zyvI5U9RQvI^WZmY%J@D
zO2MuHNv<&Or&TuxXx&1lOW1pbQLAR@{E;@X=taE9m6NWs>h!6xq_1vCdbZ#6!@*sA
zfq+Sv$moxoMhuuNg|i&q-%f}Ow4SyCFc-9YctprYrGxe^-A^Qyqf{jXSjPSakCb%?
zE?P<(Z1MqID-3d$#N6r>7pQkV)lB$t=e?wr{ZJ^q;PLCe`f7x~x=Mh{Irc5Xbhj|e
zzsOAfsV>A9ou&SWned_OOPwI>XAH8@fyL(LEwKIY5Hzuzl|qdIQ3N-opgikl8y^+;
z`va2!^%E84904lXX)KwLK#-tg@3bf1&VEHJt?aewpC)R-E-S>QezUTOu6$SnLSJj~
z)s1H60v)bkj~dbKWx7aeJ<I_4K$BWlEC-s7LUXw##?N+jJv~p<9PGz5#rr$ky&moq
zdIfj}?(Pi|*bUVLAS&Z!qQ;|5(a%KdFV3ykxAA$opqNTfmyW(AnvM-&;%&NRCnur2
zF3~!*#IRtJz|gQaSv10^e;9xl3%4n`rU|p~r4FNT#oWwd$c0{Y4`)iXM;*Qa<r9Q8
zVRA9tiH+(Gn-Xp3>d#+d`~AH=`p6}zH(olwJ+W>i&Dz|n`dB5V6J3AK3J`pk4caHW
z5k9LQ+l}aBv*Z(!K1{Q;y=qd|<_33`8EkATDk>_}fOCtY5)=}aNM&27^Ij-a$%uE7
z_DYHmV*wR7#+KEKDn^chwf*rkML+Hr<}j$1ltm0(Cn%jjlX<F_`RIZSrQXpxjZ=G8
zUn8r%Smm9_&n1?Zm5CmTqGcdib54fbdO2l(<)8GXU6bBlsvg8$X@D`Z8Rn|V^~%*Q
zNtLgvudYw~fwpXBxZmo<%!>h*SMan*hE6j>eZBNeOil4>+MRd5xG9uzVk}R)%&;75
zEw~)J`>id7Pls5iVKsU&A29B())>QCjHMetFg`IrcShKZZP$r@dbH`}dhv?m(z9Yh
z7<tYyi(J;5o6*R109Gz(=37PkC-l8QLBw0uSlq+)JBi&^(73qgFShm-RMlKoEbZi&
zd03?N7Go+};j7S2{JXKkDFF^jm4fQ7Q;zvi#6i<Lvew=sT-pGUfU$r(As^7xb+cUe
zK)`<M#EG!^@q+!ub-$&4#c10A6#InlR!<3eUO%jObmiWj`PA!M?4>M$3f<L;^rb~z
z$2tok&erc=nJ;byQ0HwM96aJ|Muky<_j8j9w@(*?yXjXW@<K(Q|A9W?>2;S4P_gw$
zSPZ!ctp4PQ1?VE=4*&1AqHx3LX@)jvOj0d}UVZ#-4c5;=Dri>0`t(JPQCezY0HSGF
zpLIY?l`7D!_&BsdbJq2i@26kVeGeFjC3cMS(l2;@I}1O9aBzC8Lnmkk?ydToI%;kn
zRvwe5Yo7P{h!FN-b26W2YuAItUWbp21^<t#vyO_o|GG9qry$+kjYzjhBPr4?EiKK^
z5>nFLAc!z@*MLZe<j^4{-3-n9^;ggR{!J_vYjHTAefGX~P1|7-O2~4N5KXi?blGd!
z`cBgzJkYtl?GO0IZ%9|bdA^lMUBU!gDNV3%`fqmYKerl<j{j(>zQ#fumB8lag39KS
zNORiy-xu{F0}B@N{y<khQp67D(&zc;#<ycKrJD0>V$a*`!nI@nd8+?cglzDCUMtBY
zuUvgY6v8io2}v!<&&ef5hm{me)KJIlV1&3U;3S-+3Dz#k_-K{Bn&P*cTRZFUnZ;`R
z(RZo`tB45#jO;8$uJ~gFK^2~Q2(1mznz{~BW46*%w`DZAUm#L<5>v8-Cv-j0KEj73
zmu`np8LiOoNnX#5Ai^txXDtgxvQiQv_uF2tRr-n1HM>(Jg3D`YC7+|*;ZA7o(7iLc
zbgg*nk%o46Fd%lo>hh||wSK7WeX+(6CAW^23%eort|<5`nWx*w>45M2EFRM;V`^F{
zTx$nu-#1Q1elJI=4C*Y0+)MDC^!PTPm&=#wPN^3bAd<a89KUs=*$(i+8`MWZ)JN;?
z7b+u#HpHg#Xus9VH*?LEMQY~*zc;)f^9T7Of;GKW3kCZrtrfMcVt7x^VlhaC0x6y`
zZ?mEcw0a`sl24Pvj3@AAE{ho1s}G1G8s+pwSR<q5G{06TtYL(#660}RF$OY<P*7YA
zb`rFSc04}FfZ~!|^&@OwLX2g*3tD4$DEI2^N$?pF1xhvp?0@Bhd@ueKKy`b*tA^3~
z@Y+F>e2$QC+-oc7l&{viU+X13yhK;kNczILKK>!frJrky>4Y(lCjb!{4F%JTO`3UU
z%$(31^aeeel?GYk@{At3`+a-MjA;Gc>))hfGSb?ios_at*$<^$vs=UdEiFDn3QRR~
zlMd6>Rrbkfx5K@jkWYf?-m{&q#v=rZTi&;Msi|MLCm(9->ZW564}O$2Acy=-m{byT
z8I+YZOiaX1wEJLz)Iw**Eu2?7agH(aWrNb8$3Y;Z;*OROtzF=BeIEiWYSULy6V5y>
zn-;wEte{sp=w$@x%p=MgVGad($l>2|lri_7XZL~(4DlL07=q3PW<*^Bm>VZj)j0Qy
z?@lUk8z;h1oqd+)`Xss^dQZupS?kAJg6*s-t7h|Hd5svzLiW>&a;LHJ@qiR8#tXjv
zh@$8I2;h{<1s7~GY!>2UV(J;5&O|4PAIyJez=8pbykhqVKb7c5bN~q7K<iwywNHXb
z1FC)_>Q3}`0zMO`juQz3Kvp|pJxjnf8}Y`}9KNr9t+rx1l!ZPcU{4tvUaO0SL&kkK
z^I3ZA6l)cXrXqP)9QJJw0Xe?KhA@sY1wQp+a(D8s15UCy?xi*gD~^}E$IJ6?Z+-<U
z!EVyI1Vol&L`k=}by-w8ZKp3Hnr`6&^YA7jj+3)to>bCzGeK)uJO{xOmVFBWXAMha
z=-ZMe*WDIvIT^KPHfd^F%@0>?E;lK<3o}YegUyzkE^P;$x^phTVy8yxu_(BfdeauP
z<_eGP?oLN?sv{w}@tP^bm12i{F|w<o!BzLB%n|jfz3XT*14%yJYquTby2dRGH+Cc4
z(kVFgl-p*)uiDPwnfD!sit%dRdI3b{ZQQAmS7I7L>i}$dH~`16%SnP+;x2hPF9Q&h
z>4X~P<~$g}pUL}%PvLx-)H1P!3DRe@9k-B>nEFQ<Urwn@SzJ{lny#h5JbmDickQNu
z4TR1em*IyB`eZiVo#J?|`ktyC|9G3~X#d-a|9$(C&*bk&d_qL|EOiB$w)k(@Re3Oq
z0MuPCTHfU^#lCwKTsf10%OTWfIp$}0nwIThA+;mfx_W{kwa?AsAqdn>4%(pp<4k2n
zSmyb^SqSl592E99ATsOK$jGne#T6k_I!QtAN}?hA9Dez^D8=<LW`y%VjI=7KS5^TZ
zFE2gBs;lBB(i2JSEDqTO41|pJN1uNHcX>e$8ed?kgWs(7s7o+7uWcr%&f*<0VFh=V
zh%_00{A8?9yGDc0y-i7*_XAP=Mg;%UOAZ`<h3roSu!bPheQQP`&14SEaG~L}!x&CO
zgWpRFpxvrONkbGX1&{U6qAnE@hh*s&?{pP3bEa)5u8`2ahiowVC`{~CU^#*36gT!b
zai0lQV)`V1H3C^kJwCAZb+u91>BpcuG}LmKPhQ2o;&piK;PLes**0(~F_Q1RaZSU5
zyB&-)9Mkz>T-!kYO0n@ZD)+#+Onx2-b!Q9N5!DjLBMyLB6wv`KW3HvtWS=j3^uG<W
zKpc+w<Kgr@)7$(#+Q)-gLdkW3X%o$<0YuEL(p)S8{Le**?o#;BWJRbrjq*Ux*M}Do
z1laB7f#hGg=OdUK914AwdBcVRu#!R%%GC60SvvI^D0Cl7vtDmq{w!U63i$|%Cu6$~
z!Q$3fW4N=|OEkkjA48*4#<Ab?jWegB(*!f~4wsd461=@k-3hW*)KBBVD~-RF&QFP&
zaNxp&)jDq(%V^4@S`(Vb*{tY7Rn>d4+z2PXGHCGxYhTedE0Lx>55ov>Lz+;a{=lF(
z<O>P)!O3*1;7=Z^g;)kIY<gd@Y>o(y<>Ye1M$PkVmd75$KEWytOQB|vCcCMx?8>|i
zz|C6$hyoJ+A}1j!z2!1#*PG4!WYA!5KJbMO(_m|<!tb~Pj$AzdZM%fa-n;u|he7Y+
z9ZX?+n}Zbgv#jgUjjOCdXZxrQLc-sQ3zNOOy`6-dx9VGGseQ1tpn~m*tHHz;EyaeH
zNW>jXy({%*!Sm`rnp@+YHpIsyHQf>0r!yQWVb$icV)!S)NNCj`=3lfwJ>Dq`^-RQ!
zR2-hEE*kkQx1P0o%$3HA3zIyUi=BJyO=~vJ_xZ~E1;_;``vaf?Wh`eJG8Q4H^pD%@
z8YZ;Ox>YNr!rqZwuZ=#4OFk8T_@n04zE}R;3Rh@SPTb`QEbL;|W$ZbQtn%_2xPGMB
zrczDR>NuoDLXW^**Z1!2b!%MkJ$4$pX7PkX^|TeC<vBDk+67Mm8Ti(9-p#-MI#fBd
zc)_-c!l@T36Y8PqgsSv&z%XKAYs0E94verf=+~qM-17Q2;sILqRZBUj`{5S1H&%#9
z0eLLhbdFT8S#Jj@A~o-;m~VU<!KQkNr$5gUUc78>*{P2G$1B=#7+m$&Sp*StYFOmR
zWaBwdYTH6loQIG49MAD`4znPJ%-j6y2L5t81NCa3L&%h9m9@9^IfMM~J%=i*cO|B}
z_aS6FUB%H%V_3wURgd9jNUIJx-G}%&@!GCW4;vH4k7^Tx50?XE;S#=^=topwA!`3W
zd>?lg^l^ZL)h!*;-R}C?@e9+an7d$OPqZ!%S-F=m%UfK^u$2zy$)7J|?#>ptkEwn3
zGL&qm`feu^lb#;;tLEB0>VRRGQ6L*JxGME7%nbfuGE4fe$nSq%t<sm8(t)l(ujrop
zXiO=vAwtQ%23<b)E+N?xHByelL_*e8n>+(lzB>Os1;9=@?O@OO52q$D@P__x;0=lO
zUtbAv&_1z~TqQ~y$016(yFL&t^PcoY8+Y1{lLWcKAN4lh@BCgXupGeSJsB5RWc+N5
z2-&BMk|dcXT8Qh-k@m!A5@v;x7%#r2W&DM+M^qg%C`+&6D~GPitobS9Gcx9zRWP2A
z<Q)s3`h}TFzwy4g{Vuo@ksU)wNc`UNq5k~&GCii`DEas8c4I%yWX6PA+gzHLdQ-x<
z4QKWN3TQJ5)JC_pMn(xNF7~Px#GcfH(&4Y?w|otzab9(}M7<umT!<26+HIkdYf}^W
z^Q?S!@B6+^pb$lz)0I*t?BLDMwG0ZpBwDktFRyRB=^3F|b{U9R+XR1*76h?-?lq~B
z^C(rkKi(y%Vte~gUG-W25Xuj)<O*Iy1hHanv9b;jAf!n*=n+>>P7R~2NIv45>lFUj
zw!(<aDc`2>@d1kqRO5t**1yt}XFh{dGm3P7`@$jV-yld0A7A|3iyifzo!mIkiI6#7
zoC0S-{s)I%kRDeSLKg~#605R$NfIL6XV9ra&o;ZC++-(@Ad(^O*C?NFUW|~-1h|*<
zoJn@zJEZwnh#|^Z@z9-u-~jZCG{p+~*Nq6>s};-f>p~`<<Z<@suJq_v9uLG0q$o@C
zrvdz%x=cIyuVSB&_%J#FVI|rytDa=>mz>|$l_FI3HnB6@#QW_@wHGfgQxq%g3;fIV
zesKq*zN%O4MD&?NlefD}=tQ=d&jW+EO1m(UU)1C@W(ecT7$X*n`tt7VWQPHK1`UWq
zfJx`)L{*B4QpfL=zrsKH9PU#0^G}exD)W`NNU{`BxBiO4QHKj&>-N1`Pw#rXRiXdf
z&n9+>EbX`m$qDfx^JolsxXpjOumW!M*TA|{<A38O(3x}5_ISImQ*V0fetq)X|7zYw
znEqFcno%I|SzDsYjIOtA4x5r|#I>|WSl11+=D`qv7;tix+Hr_rdf6}?#0e<>i`o4(
zxgJMRVBxrk*=)c`dCq%!%R3(Wa6xKp-A4UG5d3gq#Ce`6VrpqWU#`P}a@_}{69Ix=
zx{x#VY?Wyh1kHnaPQ}kx%I%qaCPcsP>shG5i(QW?-0k@Y%}5M8cX9acUk4IU4q<Q!
zPcBOZ$*dPw=*){}`(P%Mpi_&SsTsM>=&*1>|E&mS;(KNaIR{IE(F!-_sSdyfg-M2=
z#DYq*zWau)0e`Ed+Q<98k2K-WC?H$xt}C@39Fj)$8YT{E*heX(oJ0&vg@;6H&mG}|
zIH<UBU0wAMraiz4K;yK#2!pVA2aK030ym4d0<_*s&1kNW_SN0ZXYRS~YAmYW7p}_{
zCf|p#3I(H_KC?|36*0m)Zsa?YIQ)+MKEaN^_0!bsl-qu7uVy(+C84!iokBrw>k2;w
zpIjM6FmOr4PPG=R@U&2R#gSXVa#Sz$;fixWa_RSD4Sb=|G|3ifZZ4p6lU1U!1-`>E
z^4XecKD-h;kOcgVsRQ?X<xBsHTWRp!KTavhpEj^0sOCvNxVq;_dg|yWG!6Sn47Vv*
zk7b66o;9rxew7r0OX?F?xBqkfQ~b~R_e+is@~;3AH;Qt=fpNj*f3L|zi4#Xgz<(@<
zJ4K8!Lc92^4%_IQr?wYBil{AF@cbWAA29jI|8Me<`}KNjS`mJU%o9QMw=Sil=S1ca
z7kp(_jX-kzjPkRry)yH&ewIO!-3&!V<)7+Z&eCto;!n(|y`9WBu%@3wVL#GN3UNgn
zDn1Ql2E58_Nly%Ui=Mnq^c;i>ipU^c7Yc+2sQP;`Sc6+=eB?S2A>o*Rbj8zKMy4%o
z-wva7Nx-P+3P2}LGuS8!mYSqlw(|+NWMNkBZ<vNE)=Hnpp?V~uDI|o}xnZ4--g=Kb
z_)5(l)D%wbJ^%Ra%@4dK9}k8l7bjz6rCuWr5y^FzY@<C&iD{(<F^|ch0*Kq$4<9{w
zHIRv3Ey+~ZTxq>zl@5+7@v@;1`m4{<wO#0n4>#q)6{}g{WcW<ig|mqJBKU8P@tYfA
z=MFB6Ez<NTXjtgkTwn4u8UVX>Y@_`Q{=@{3+$1b6>~dPDf6k%%$kd8{!UArWh(^AL
zgr-F_$w-G8WswU2EtJKisKj63-vv%d&$o#gqop1@b4dgAWyM7+80-a{(Q$)4JlKau
zWzE}Pql^&)FM*J!DJ4*70#AY_)8u)atlb=VjtG@`N&N7<qqgs3_F^ryJ#x#djpQ*y
z=$e@nO|i|+x}H7rf<R@&JI95=fNxRB^&dHJ?L}stSBvu3&Y40e3KVS264w|ClyWiT
z@zXam)|mG(-q&`iec0$0&Bbu4&2!f;FB#RQ)g2}-&`iw`mX|F)NMl*!?l%bfj?ghV
zuCfgr88s02*L86&-6$V6yL|+{4BtH5`=@X<e!F?kt?m<m51DoNwLfvf26k1WR0xv4
z8*r^)xKI&J*+@sH+}Yez&d_iPuHRAIT)h-##lt2Lkle|3Pv%BeD=IAf1rU{px>Fzd
z_6`6PY>kc?)7VU#m-9=fCB4e%iSUh$4I(rDi$9uH@wn6ZhD}cBBxUlI>U}=Zj`DFu
z0py)q<d?1OKC!Qn)LUGGff<K($ICZfeCN>CT0y={{V_{Yn_ywPdlUQi#ds*#Bhbcl
zUcRdVa;qvf9d)}O3j6dxAz)uj&pS2t_;9DwyVc^pL(j&hR2i)ql2c#`NkI!XH9?Cj
z;-V&3v!+^P*c8ZI<8AobMIq#b>}c5PJrqmP-jaXq^F|7IC=<Fw?0#faffL33TU*;U
zF<w9GEzL`mXk4M*Vfb~^jK-3$y`$!t;~qX9pPc-Xa;^&(XUiuaBz7f|6udT7(lp!X
zvESGX@4VZx4*K0i2mJU|w+;ed)%{EYp3|D@rtBXa-2oQtll#r6E%N<mAI@|+!g0wo
zEI#NUg_wG~wzlWVEe0ITcTnI;T?83(AGaQW)X2Q96W=f>V9P4of8N`Iz)jDDma(++
z+-o&zD(?LIk>-Z6zD$M!vu^5YAAmK(Yc#BNL}`zc;-zjQRgkv<VPkz4=*omkFFQXj
zI<J4{k%Ili%vol*J!`O+&db^gXnMsvc>`Rb=dN;n_LM#>)Pu|gew-|1ogdr+?)ade
z(W|;!zzsV#nx}KxDeLzBeT6{-pv0>FT>&52Xy+a>9Rk^X1*Ki&i1;7==bq7M_>a5W
z-jrn{=U+M>hZ%U<bQk4+N?%gFxb#WcqoWJp>t<pm6<oKuZ{X{E{jggOB+GZTX6OFi
zfB#Q76!;%D!bkufbGk>P6{KliH;FPvNa}P^oqMeg_e6{$3Jq3LvJ>WnIx5?v#!;&z
z=52C8s{)<m?|e;cDR<+4cJ*VXFKDf)Mg_3bk})9rVc;#5YqDm}U_EbD<59J#P)8I;
zVZGc;yFkpuFb{9<Ks&iBC&l)+qr#uWTB9*ik$c><jeFl)H<Ijav;biyj@yky07+d&
zVEUroRg@+sysSzb)+hNBy-6i^7HeoRc^dXQ-?)=cbM9?_De*IcF_wjnP6x-4<_0c%
z6rhI5EuC{W>qn}n$o!1{VPfNkf2yQ{wj1Nnu`eij%4KVQJ)O?XX;~}Sp)~l}qEVl-
zSQ76|lEgLG@I^cFU;d}c1VH{XVoIROdKne2pecx1hl{l~JWwT4OY`|;G0%b5?2m91
zBrDcIOm1yd^N?#f=PU4nH(NUvVq6=83DSu$(8xTRG{bM1o4W$VkcAu(aD%ly*p<g$
zng8Ys4nSd?bRb#(CIOc*cLE6>t9OGy=~!fBdIEYyQuhz6lBQ(wkpqg?MAj<B)=?k#
zkWok?#}_T|U0C^aaEgipYH6}&D?ho5<$iKsXp#v?K<hMk6bmqFk(s9>R7KDH!hmbT
znuu2%?udklNJy$w9V*Rq_oAv>wXu%JTwgMf^iygS7+vqo?7{%?r7E(2%cg&@IK~Yz
z2J0)ubejcuYAA1`)v%#I_PZ}U!Mcs7EG4^0J5!R+C#|StG#6;am7nTyFUHHqb=+OS
zG26rZxI}ygeRVVsRypUQcF|UG=5H+o`dq<(B2dFc0sy5A^JHsj`m1Gs9H#2lZAhpr
z;lL1U_h^=of}7h5Kz#dZHg$3Fai*^$gGCTvk0vnFdIbbf&sG{oq{~Jm2l%hWqUE3v
zR}h(~)Dz}NY_<;g2L}i5iQ>QC5^bkU82H8mo~^Dni8tW@&lsGJ6ptHVU0GSQ)c5-C
z{K#AlN!-QV*%rt*&YjmqYMPGnP@T?*I=q;=G0<{2^ixzs2QKQ**~T&C9Rb!OZs)_5
zA!kZi=z&6h8nnx#$VBXrV0wE6_GsVHtgcT(O%0((c9(LM3|T}D@rh0M_eWZ%(8D(P
zrVJn_Sb<0J^;nzy`s6To6Ku3&bSF@5YM7@pD6ALRZ|)+^rXU~`)iZ-^!KA}pK+^OK
zqtSWsYc9OPE565<8L7Ke#d+^f_QFu?%LmkFTABkn`yP^-^!HL%1G2)Y8jn0AOW@T8
zcNXf5lYBv+rSsSh=jVZ+L2F@Qua`XfE1CM<GSSZUFOr<E8kd>C8;VQ=PDO}E0#!&R
zN>qfzuTPNMM&RS12dA3h{^6G&exdVpivK842@EOSgHZ<oW}QB!G{Vs0Bi`C!s2gE9
z1D;Wr36g5oW9`Grkk#37DN)xwr_ify#jpooCMQv0LV{4V{@6<1lOxV`K)Ma_#o1fb
zA;0%Ph2Hpnl`;4H82&z|$Y$K<^39E3Lu&0$zR=rCwwb0qWaO?FJ2=x2D)apx1M{w~
zHJ&Zv882@<GQMf&a;fW1_5Z_gVqX~a_`46GduB6)ObD2N!Tjo={f!gls^R~d!?TNl
zH~Mf$@Z|?bzkrIm(uWU0Yg61c8UL`Y0N%nBt^Y;=T~Zd<`!WIzf&t6)=8kod<8XMo
z%Q4ppf$f`8O3={NL9~w9d}pZZ014}X%Ll|+$GPD6{=C@D3xDjaj^`VGaz$1hW}pz1
z#PifYS&}PdBxGUk24QS-sz^->+~d?Sn{1}2eu}1FLl|m=Yd3fyU~48%%E8yt=z--c
z_6)xLti}3v7|oZHt=^D8m1_}NsetNyNy9HZgP(Hh5_8zNzq7Y3YdVX)W4sEc5o9tu
zFf??PM$o&eGX6mV`}p}aJXPR1YeEpb-)6n7;Z(1MgGj`OxLPP*!B~}QfxIB#V&;@B
zLa=H)HMEscBdJ1nZRRk7|72@V_=EVDxUiQYIU48nc6c!yqTw4Mbv^5cdMaAh)YM>S
zG*UM2q5OAc+CQFWXjct3I$7Cr7_TkBbt(H6hj9mu^#9OHiHUok&@O$PiY+4|j_lc-
z8BjNl?ujvG9a2gS9@1RIUmse9{Vdus9_~%cygukwb9-aN!uaxGG44G!K!wEk=7WxN
z(RZDdxp9<b$WZP2U_q*POZ2sPAfX&;>c=fQ^dvVX9!1z;?u8%6j6TP{)`H)=KI6QY
zc(UNdcS889@oy8We@twwoL(eNroyLhw%u*<%;tecnB;P^cp7uK^Z1p5Y!Zg|L&*al
z<jM$4kkazJo-O3f7zM3eULU~(BFnYW!a^_-@O$Z4l@JoYFeZgF0*%}R!PtN;kXCvy
z^p{nmbW03Cb7#5Ott_m>FT6ZE!}}tr3+f1XbbIJk4Ib&wAjQe@%N~UFtEZ4rrRQ_d
zne}AETqyG<q3zHksQyXv85{Ra-AzJO63|orm8@wx&tgc=&#%mVUf<nW-yOQK%Rw+q
zsUDduINz6?kWkR4g;t3&?(4K5!MFxgAUWtz?Kn++jSW%BU@2aZmhSqCx>JN^TLNHN
zObg?#fR0SBU->e7swe557;Uwy+oM^oYf#V@8jbgxF_E1Q!684G5MRg~((Cm5pwCTu
zF+(PNaz4PKd>ZX4^{QYccYj{o@tqnO<mAf2Cv5D$!SQ#deD^#0T-!S@(mWf$hXmu(
z!8Uutp-~$cD6j<Z2!GWM&=}0?xbPC?Wb$2|^(f)m@MC=yZ20DttnA@~n&E=F2}7f%
z?7~)iy%<ocO)1GK^i1&#e{Phg`YYms&L<z?qQ7Ti|EXB;FE8mpzeB^u58Xghh<zGI
zl52#N-A4Rszz>c(Yg(AA_NTgKz;d_J;*Lh0bMoc<g6Yh%Uoz;NyBP}cio3GYRsKpJ
zR6^|~dNJFmA{G%blUQ~rw0`y-@-diw-V1(YoPP4_dNMr4VCP7T4k{-9jHjW>Zwm;D
zyG+QDEY4Vs8m9!UfsoKP!dHYAB>6X}G1^|1d1*X#mK?d0$Z84y>yq5*&2t7W2wcrN
zbZS~!!fm?PcSzITJgx#fg$)1>?CtxmcgSiUsOGy<&3AokW~!%m{&oS}w`&Y(55gL=
z8EMWBvA<WIfKa@}b!6g6v!7II(_k#By3}bpj!xQaskjH=sgbEN={SUtBL|)oC~P^O
za+l{$e5N7w%3JQg@d!O$esF40>R{oyJz;1YUr(29KJN4b%#UB`GxuGe-iED3CFOdx
z%$u!?VO75$EM4Go7yQ3XZq2m(-}CZm62~mn5pez8pJVEo`n+Ahg{^D3y#=CuZi%^^
zc=ulN7{F4w1*svk`lq8hzm@&J(9h=9BlZnAn{K`|G&6gI5j4}zciP<@>7-#8Y?~eV
zWU|_E9ElLuB21Y^t4UY)_T$=C7epb=R?6RdbsoP#kc3415v^4K>t}v6BR;XYNRNj_
z)jOQPj}FEv2ruQQlYOI$itNOE@PA_webLi0R~B`H_pPPwJoVz@=fD<ukR<~^lNLCf
zoFfW=g2nU9E|~7=8!k=Ax8ICKQvpq<q;BWYzuHtBtyCmj(nTvyhfvT)c79`xM&{`F
zX}Rua;~+j*GiXV#wLxqnyGdXQ@5`VW&j{*O5K{4uL(iKS-W6Wm4&A0oE|BG9Dfe2=
z#N)nI&l4F+DD8R?FuFphdTT56j@O_{x-fPRwaBxXCIku0=%z1eK~U$aVYYs5IMZ7U
z;zIFGi7b7o#xLrM$-E=V_Sxq>CVJb+&X4r-Q5nE>V+jokCYAIT9y^+&&h?2%Ai3i@
zOWNEC$KpECo@d*jV-Ta!jlHM2I#B<iTRRpP%d}U=@SK!+WJ$eHltyht=1o-cz3pmh
zb7dOBB0kwD0~D0DgVmd!9#)7Q#i?AQlUN4`wCubtaY1AIUd;5|Y*=zJ*qjLT1Z^KA
zzl5iCF2x@#y+Xm8{;sPIN;o||onw2BiqVaSFovJs44hM@ae1y11ksoKO5XpL_Q#y8
zJ^$70#0crE=J?H+c%m!y$fmhOo)5UVFy|N}2W64c$Vc9Xy+ceQpPP2!J*>-(LO|=*
z=Lwb)VOdv}ii)EoH;^?OqZB!tQ&EBnItTAyU~?e6H9%h?QDii71_g=mFf87pLw9*J
zm>pfH5o^QvJysB7xuD6CznrNr;=v8-7g>TBDQ*?0D)SInIh{@_Ml3$5)k{4`ZTK4%
zm5sOdmGwV-sV_b~4>~_POUTS*m$K_n&Y5qr8ct<D<JqD0H*Rt=uD6{qT3h2Kdbk3*
zOfh?JHj~tob2uQ)h?n~?-K#Rg){(&nW}>-9a2sNe2nzvhNU^)#s<Qj@uMr<T;*Yws
z+zBC6<hHbFzSYKnx3F7)f4o=Vg{$N;gq_l3WdC+@tTpF+ujTTw=DvZR<h->y*WJNI
zcYG9FQWe_inH?=zlN;nwBp*u%RWXADqF+z8h&!R;sBKqRm59*JTE>R3P_Su8muhy_
zVFio08lIkl;kHrxk<{Zg1JEsnJF_aA@AhP7?<4~&pA-l9y?{p8dD25oDq&sGaRl5H
zv1zm@2WOnhq^-9rM9LVdo{REj?u?L4dDQgYd_?R95;r(bZHJzIV+?2a<nG6;ZAJ!t
zWCxaa-;hJpBUVZ(yF0iG-!W2y@1yWFvmyW;DP{y4epHgW4Bpw-(4SCS#!>Y<wR&m4
zGzWP+hp(Rgj@JGw7!uLWt&Y<;b9w7_tk|!TW_VubgWN(BFLQf*rA(#T&sXkRqeb^^
zYq?WO2$u@9z1HA`(cC}FCW;Odru_z>j{^x^3hYV1LOEiJ=k40Zfw+1{<25+Fy^|N%
z^Py#T?QJph#2Y@Vh3G~$svMt{#bY4l{iXbAGb#S$(GTlT68JpOQQH%!?LIkZ@JtsY
z*WbF(7(PQ{IuI*z{&zNtg1V2Y5**%D{X9>~b2W(@{Kw_?gy-$Q?;wHeKZR8O4$Jaz
z#94*Il&hcr-wwH&xrDU5ppa_kKh{&3-eIefaada04QQ@fZ!CxZZzTnm$r;`MEt4~=
zQhh(VWP<5~muja7P_Q|mm%1P2x=bVpvA>qa#i!*tzrhQ7A)y^)w#!ny%MA)^a$1dU
zI<|}dF8Vr1)4@5tl~^IM_VhkK6|rA=`b{t?*`*NU9ImmU0_}k5-Ur*6v4NL}up2aJ
zv=kYK<!9vE;nf!0s=x*;b?$}W3V)uoKS`eud#!93%}&#=n(JeOdgZ8v6SG6xR#pmw
zCUu#VogWNhGWXL%SrEa`sP(r>6szAb^+(-!M~#W?#d2Lcfe}UJBi2gHZ3?uLGz5D0
zMifdxzwgdQqng1-%%C^!r-6v{<1Iy8ua=6C&t-9+xo1xy`+|*TuU0+_PghcfX+9Vh
z_(kx}tf$)!l>O*oWIZ```M^xfwHy%|F-epyu7zMF&-Tu&I_4KmnQfCWw}SM-7NWMg
zel1PJ6qt7}cY>79pLK6G>b3bT^X5-*Y)Ep>3&B+@5z77CdQ}lb5~=%1a!$QkwD_fI
zLd&Y?cg7;y`9Z@?s)o^y5ic0Es&I4vcoBzRet6b(d%5=9R*si@Xi(O?@PH;*J7vnA
zyFbh#%=1OvS&fq)J^mCjD^atit%1WcpCty-_UiXETKwla$a*2gmB`#PP-dCIL&QjC
zM#e~=C`3x)uy>azuXiNhzT2F*H60<Q6BI#;VN`W#1rOU!N1^xQ20|2)zK*`#G)GLR
zA1pRk&BchWj*Wsct}EfZ+Y_86=-Fzg20C=Hu&}fR-Q8+8S<0F4>+1=cizOE5J{Uno
ztjv6U!xxHTdJnj&tE&)x64&d8YIEqNP6T=6x^H2;9vNs3Q`{AMU>Z?*LU-Mhs0!9f
z#bCFwvid&IL;k{=&}8gqfaq_&bKi$=-`HwBc~EX@)nHT9=h=%ldQDDL7MrC_8TK>f
zpPo^PvL601eET-}GdU#{Rpm>)t^g{}qq!(t5}tSDFYNgj)6x0dk6mJ8%yQWs7CQWd
zJP+mywykJxhX*EN2rD2>2v8Xr<dCgPg}yUUJ)f02Gdbkh6Ar)^0+9`!@&y}+rP|5D
ztxQ-NYw{%Z#@mmI_C<IIc7C1z5xgpqYK@--oQv6^qJM50#wu)nQ(F?+Q7>u7Y>PR}
zauWGuz<3Sn-_tBi?eAoZqd&SyjsaSv-Zu4?jGt<~>?kl9Ew^y*Zm!S!Vx?!CsK+=_
zhOm&)&`>N_?!AnNrF<sq@ag;;RE*^?k0zuPRzxY;*kUY9ec5^N#Qm=ojog<T8WU>s
zwc0}8|JQS@dn(}jFZ6T$2!Xm(w5Q|Z!kbcjbV(}T#kgErS=!_;-vf*-;4CzO*np-g
z*{%3pgi#pz3G5fFvRYg3di2(SaC!dh_G(IfIJ@nezYZwmxZQz}yW_x(<Y_2G#MEzt
z%LfdxgD*1)iAua!m-#z`_n+p)aG_<N1u&naeIt<Z?eTq&I~1SGb#q_!)xpD2DAeVU
zU;pH0W&dmzNUvN&r<g$B;q?liwgY}OmeJ;3mxYKCf;jePOYOmCd*r~{>)7ily33Jf
zG@HpJZXBsX+fxeG_vXda*S4M_tnJaXcuC(b`lS95F{)s*9hiln<hi)Zu`xbACB1Q*
zM;hvNMP^Laj0KP)`1#qYnJzw0Tiq!Aa-QTm%l_ek6N;1Wwdxbm{?x7Di3SLr=;AlW
z4O3R@Cn!=QNtFIh?FVNGo;js`;@oZUgW9RFgeeU4BUn|J_{lF@zw3K{*ZxYOjdQA8
zdW*k&pZ{h@o(xbfJ^={aCx@n>jAq~iC+Zx~XyQP+W<iCa1b{`qK`?{R-Cvqz_x~-V
zfQ9jlNSG+_$Al%oz8o|SocdvxFCCy3PPl2K66)JvCEkv7ca!$YSR{xXF85Q34?2Q0
z;X1_cBH14B*zR3f@3h7?9`k`2$zUeI$U7kCe%Zw52_}0sLiDD@+|hfDK4|CJc*2S2
zVx<+YILf(&aDgBt@nU%M1`MIc&SPI0$J84Ub?#j?Jm|w}0xgO9wRT)Fab!~<FH{+;
za7y|lbH`8lePr4Pq%hy9dag+#gkwWk6EP25OIqCnW$|5;Fb8Y8jRS%}cKhMv{vY^0
z{wBoEkf|`YNfl*ou_mgkA%v1SOE}!YDwP;q^SfI7YETVD;z<%h(vD#XX^nNa>LmbC
znO^QO&j%DsQwQGj`K;w?{$@~M1Zp#FWz%aF3!hmHAEkfnRgsx5IguCNNejhCrE(T4
zO)#3T>b&+vz}~*cn=_W2wS$=l)wvgKj+fE5T*kF+H5xuKT*~f42~Nn_RIl|v*A;0J
zR99MZi@P47=>51D@u&QRkho4pyl{Qjs^an`!rP1r%lvK&w`ov?#wq2zEqtKjP7I_>
zs5Hj@C2MtsGa4jMfEsYMFzdE)Gs;OiM{<XdqFn1%!b*fk5~MQ|ne+Xzl7GD~h7$^H
zOJw5W$GyWb(FX{)Tzy`=d<x9t^E_;%hOq`0_J)ysEgO9E9Y$s<zI<;~Rg(dY&{BOT
zIxnrw8_AoA@BpdOAHn|ahhYukY)$?Rf^HE3ze{m6O?%(W6+HFFAlYPrB@1A=iAAKr
z_+WpX_=|~7xhE+`>_=9G!WS7D(#8-r3{89pQ|~v4>d8eX>L3D$(cyw#R^clZ;$piz
zC_0N1sPiW#`c<%(?yG9?x~lq@uUd%34bZ=&`(^k=9O{qdcc2oyoOL(r3|GK#e||AC
zG^B;VGeyZURZ-P}UWYSvP=#(;QfjiWMw&j}jQT^*BodCk*~2XUN^EW7aIxvTuThcH
zaw}-^Qm6XGcvu?-##GxO(3P|aXHxk<n|^a)KdeEp!SI@r62Gu7D+{TbT-0f$U9Qn-
z(Rw`E{m;yI7AN_W{*`S}{Y*TkE#F_yWE^pNCj~b|M}6E(vXjo|eR9XhYjYtghGVYF
zCOcwPxOe6YHx-VqI2l#zMzg@Z=D;u%s;X@X5g4yfuWsUAQE!Q8fu%~14<@mE_b3sp
zG-%NB3%eq-%@UkvS>$^ohCQtkAMAO#QV3tKLU1IYwsCQX6RVs0k~Xfyzx{f%6Qhw|
zF3rm#W<L4eZnmOD!a2mNDYg|veP5ZyaS+1(dgxWe(kjeI2eUUtK!(@tj6=H^KxueB
zr;!*}_?3o3V(OM*<n@5#>8S%923Veh$*|S>MP9d;(mvObSnsC;om{_}l3f^hLhdPC
zmIZWM>ML1Y=`UxmknWMnkvCFMoLFLL(60S*1l>p6=WE=@giO$?T7F*pYbm*ei|T*!
z`|bPZt!7s3hTrKY*IIMgnSNbQ^rj{MHf)N3&YX@5_|LO#iWI+u5}P#zYQI;ao_n@U
z=3&RnP0QltubhW;ja(ayTvPU2r5*=t=L601qH%V5Kam*I13jZj?y2IZb49fPOEaxq
zx3qozY+-FR&QN}tHN)RRRzTL{%E4o8dY5LbcZYG`j*fEj4;syvKk1<gRL1jJsF1c>
zc7M+v8`e?{EFo0z?M>RAGezBw|D9BZgu_?u*dz+@ZN`q#6=)UhLeyQ#$nTP93-x4n
z@mQ%tW4KM7)2VD|Y_M;N(4gG6-<PK%Zo74ZqpDqA-o&RwZRoSr@MZ%{S%P9eq<jIg
zN4>r<g3MbfWmugDzzhb?$0du}Uj8#2`1lF)5Aai<Kay~FX4L+@DcQ3^v0nUhKws)f
zyWo1G<$`#+Q$Bf;_-pG=V2le<hp0Cf_vQa%*2@QL8w6{g3Q<Zh11$rShW*$_#~S&h
zLDo+1FoUWxUu+*GOg4HD1m!opg@vJ9$y0^1Od%>MDyMALt8P(w562<Z!lf%>sOH~h
ze!5lcn)T?VsNNb&S0xjDR3`)JUHm>Oz-&euWCeP0Cq>0IG6mP<0?;_Odty!%Ku|Bq
zfS{02nNpBwj3nbXJ`A_9Ih|UnTvrM3o+4L-7gtYy3z<@_gBDFxu+Xx@>N33q2uZ!I
zCYA$xM8BE_>MOo@!b4{Uu1<Ho&qJ=hT!A+Y<=stgRT?e~wdBZN*xK!u(RG!*roMR}
z;oou}S&{q8FmoDZ&PYaam@7Gf$MMU9-O(A4;246|-72{T6cSQqpy|Pd>Z=2&3ecv#
zM;s;Ex8#vd9@d*k#jjZO?9qIO)B%Atb5v=vF`-J_M_+q)g;N6*_bmhEtgpvbznRI9
zyY=3n<*Bocv0XEgkclg`r+BqQSm^n7^r2==Jfd``>z@ddNNofp5|A`EMYB-P5C0O^
z^!TNR9((D*i5K~AzWBqvg$9Rs5=ow#bXWB8xPm*KFi|`0kj>U^&9#2unu*+Us11Ly
z@ODFSwaw@=aPQE8X54WK6iEvnsinqH27M1o&@tYulT+1#w4W^p1WgA;IpFc)CT3T>
zw+hWQLqb9#B780V%8#E3Aq(5N7nuU1sqg1cC1vH$XVBrtrJDX`8!!k9c6zP_Jqhl8
ziNZh-2EmALKNPD^15Q8lCYmB9jZCk<6};K5;n{xvwj{!MmhSbS=s_Nu44Rks@YN@@
zHz8?ZFZHXCZ>L`wHdbv}gVHOULG7tR7C33Q*LcW%>E@x1b*HwTIIV6+b3MOGr}sI|
zD<nD1l7Ffa98F8J-C0Rc$2bfmd+4P}^PZEzHfX(vpf7{XP>siYYH@H;f&P%gxf)p?
zXX|Wf`<<~IB1&VdeLOsXG=c2(=a)=ydE45S&rG?_3x}%@4W41a7%2QMMj+6mR+R~B
zJGo7fxZ!0%!J6YU)^y8rG~1;P1zgvD0~dd%Uo#ZEFYb1-y{mI2(`Q$bb!@I9&gXD&
zW06xa)atmA4qds$=f=q1Pi%>c!E7ju(`-<4bIw0z9+JZRBCg0vaUeuUFy$(W@o9s!
z8m<n6Cg)X?STS-FT%ekfx$EI7tDJzEnwu`DJZA@TH@y<%u{v!O4{)LfavcCFsy~pl
z975vj*CxpCOmoItQLpTx8R1_a(a0B-c8RC%*qrF^Z&vm1AESC<z9c+2*s$iB_DZ2p
zB@OawK%Dz1QpHt&uIhzwEuGnN&3K&qDMVRzbv%cIU+QMyCo@5Z?`7&lyrk34d4u~#
zgDwq`k*C-B7yZ0I^Ct7n(oa%D7rWZVXX(w?zg4zcDV#Xd0t<uJ2r9iEZq2w6wf@Tj
zz}ajNT1mWa_V%&+9i7sXexY_xEuJmf1z&cDQ6+xCGj$qEv3mRRDpXVR46uu_U;Of&
zdLuL(iN*7guj&1uh0opS=Ypj`plNaHYmWHi=G5;{irArWU1s&3)#endI-N|R8r7#i
zmUqr*{1`J*0^6EE&o~<_oLus3ZiD+WDKT*iFn_Y?dJU`<xa~;5n>SflN~DkbnfTbc
znes3KNSYrYZ6(_M+-|GOO>OOhLp`}EGL`k(Izh=E>cn_U6?X0!CzJ0z3wl}`_TT>w
za~1WO9N)pFVs2XYDP6{OZoKHTkw@*6iUaRqw5cj&gFZeU^7O(54z1GFe|T@R!QlGK
zaXWjqkVT-V<l5G+n4V{$J;U;9B;)$s+ebf){*ecfwTj?c|J`G5Kkf1U?Ekp{%m{@$
zh<=g$ZFusnDkA&qhIb+7&^XntVOJk$5YdXm1}vWXuhKsEBZlbT<T@-2EyEgI?fQGg
z>Kca^^Bg(S0&8CYUtF6k;Q5bl3SjLsF|$8+t^eWs>k3`sw|*O#gvb;$@5T>$huB8B
z)D(KZQ(l0;Ua7F)h90G4ho6?t?i2L8u#jL{ZazC(T>pB}K%@=)#YieY__w{70y5O0
zvh>Vf3|rboO{S*Z#lzj3|5KWlQFSHgq}JTnbaxUz{u_(`_Yg_`Zc}7$1Z!+0#k~!t
zpFxC}xYVf;QcLvwX_SeD<hj3hiSnga@V(=QhgB1gkB(`Z#^<<4U-`eks&xFh`W+E3
z7J;UXKCoZ-HiDns<6Wp16dJZJ*#90nbx7P2pn=q~zr_4obJ!=w);&f#-+OcO^6V5$
zRpMH$E0QjZwxV_H>m1FwkjZww^F#~2y+{cOGi7?hJNm^n#AcHNbuw~`^S`l7j>&5!
z`(pRzX54DD#Bb3o3I!_WtQ7NMC53%-??&<bR<f4utMq~=1*^K0g#1FIJt9sZ2)$iZ
z`AqA>;@b>Q_j4>ODd~M-XrqWv$;vg9l2silhmftJp<apk@(h`flK3~5P@I08L;?d0
zyNstQ)}Da_UOYs^<E#;MsIA+SY$*Sdr0UkA#5!MU8~M0;@S7H*3jt%10IEli6#JX9
z+SiF%=T_${goB9QCWyFAANt+asxeUmF7H^C6dBAuyCR@M^oM2LUi>DaBqJkZdz1N6
z)74YjyGAWX6jN&`7_Rrq1euK#T^Qd&^;4<Es~&LzTPrF^eJREI2s!52MYzp+$nVU_
zPD>j*Z098M?P-_d@SqH9sj&ALnfQ2CQWw4|k%@Pi0NA4rBD6+}NOe(OF3sMFN+fPr
zxE5}J5TLK7k-iczpDWlR)zQxRC8gSx&jd;CSCrs9jm$gWj+xwW3==$StF8~jP#=8B
zcXqRKRDB|9eLmI{ho>o?^Cr8YzA^4bM*IexVG_o=a9Ij+)ft;v{T8>9$*c|9vV}%R
zLjljRPtrmillUf9lIt@w-*q{T>yTUaXTFz;%Q&#6`u@`9x?~P|Q<X?c-ltCsBnrPs
z_+7D%>g7?pQLJmOErGH*Xnq`i^5opmyX<bkXNKKW3<or;Z;xa!kRdE!<TW`h8+5Ov
z5>FR>bar+6ut8~S3Nx3Ssvmv)_{**%)mL={=59@f<R}8~7R5GVpf*y-ZHc>(UoMox
zy1dOFCE|EDpsg-ZV)oI#zlHbDqix!Tg{cw25!=EJdCjxS^-k+dG`NJLTP3OeTI|de
z3!adZcX|EI&WI*3w|Q+Owxeu{9hxBAh?~D9+-~c?)jA#KH7aQJ!~=xNBnL>FOi1Yd
zK=8xeR*eFUryYE(ZHg&O2vY=cePF&$GGVLh2_jx0=)Cgk7A~bSM#J~&P}f*Jj{_-W
zKYTi+skF27`#1g$Ew!+;MgR6vJnzH#Iw9Iy)6+-ujxqh+SfSMf-X+>K%78n^gpsF5
zKa?MhA7%_7o!bU>0IJ!YNGzZ**o<6K)0d#y&t~BxNtrKDS~*}b;tYovH<GM`<B$)M
zLLmj_1y}8pQ~X=AS<cl{I<YZ67MxegBx!qgcDrX2Xvc$nI26-<{#lKOn~5qsUZ>SV
zs2LghZaa=b-!I+x))cdWm(s~u)vt(PzZN!eOCkFuWWSciVZU}u;k}o*cbfpn>*E+Z
zi4?s3d<$sm_8Q!|yB*1(879By0!mB2L`Eu-y|j(Q?pi}k^S!4yo%<8Pw6_LI^Unc-
z_*-s%Nr6I=pAIjB-s94UFkb#3S0rf<;Ay*Ozo)8czvMP)S6uP=J}o9FsWePt`lOzv
zvoq9w^A1f-LSMQXO;Q(($x}bJ9{6-;klN!Hpk+~bi@jsCeV^$yCbc5GsxEo&ZT)G~
z1}v)GnYB^Q#L@V(Gw|w$q<ltR7Xs|?qfw|K-|G~XTnSbHg46qBA&IZe46ZL6_rz)m
z09t3&xX1o%k_=MBz^615dXsCTGk~W(U{fbK^JZlJe{u_8lz0sSuLI5rn}Lu_yT4Yi
z(mccxsZUg}IpZvbtpUIV<~qm*h*x$Q8oaXbIJ&+2v4cYw&bN=uE;`<ck9<G^3V$~J
z|8t4Cd}eoHe+)0`2l#s0AE(mIAE+>s6-_)_35hn9^_CaT?ipYz8egiGT}@0nf%p?z
ze2rX?dJ;lk_c`0+o%;rLln5aUkI9r#Pl$Lh^7NNJkM?3&g1|+?1C}nDR0SUFH0u*~
z6<R%nBvdpX75FS&&=5kk2(4fn|06y02_!sw5s|j$>jA1ER$M;<*IGD)81Y*b6<eo8
zrkPSf+f!{umtv4H&LC`;_sdpC##D@RBqp48zfLzoYAf|bt|AC;#Cp2+q*JN9HrML~
z1XVgsJoMyEr{CU7%;(?I;Zl2I;HTwSP@Ap60wWXI&Wo(}3@x{AHH(;}t~dri=kP?a
ziQosF-reZ^%5$%h3*v!Osse5DN2#mt`UeBK9ogSd+;J#$wIKNDIx8jf5ceq;F~70u
ziQcd}fv)_{t<yZ)2>6m{<h|$qN5(0E*2Xg+_#kfR?Meg|A2VtypGgn{n}GT|N3~=s
zzbPg*F7@tinaA80_3Er<%lH|$m(&<1u1WDnyR;GpsDoBXvqO-%4`dRxElYl`DyNvJ
zczQgf`?`!j*#=Lp_Psywi%sNw``Ku=7PcuqUn`|kD}b$<kH5kB>cJK|q`gh8ksBP9
z@9TXN-Nqup1N(CD5n(ULVt2G2kUWQ8uFHi)BZq+3Fj7x=x)pn(!|c!x@wH}xnD<|(
znF#<M(BQHPg0(}sL&MjKGH=x9{dnK`)G;Lw-5!LZEk4g>e63WL?s}z^o`^Q=gZF2%
zTd@8xs^*tvrP#S<6*{e&WZ!G`mQ>E5z|+hEiDA@g+dtjSP4Pk>455-!l(-V8?#39m
zliY`RjMgGMCNVze0zY0l;@?lm%tM<I*Dq7fX^kB0<Z+?IG0Gi(=F=T_V_|zus2@4&
zyH{(2*ze55P)g}L$-XQDn#x-mN`9GX`B?IAqR7=99bm%tg?14$FX<-a@HB+U8^SLm
z5aTwTc_4v0P1+nsZUp!}-nxz@tfXKVx*Gx7bJ5we(N1!~53D&S%~zR0IyZ_w5S(uN
zF@+AUHC6OBVlzU-YEGLB6aFzTz@bt5aaT)V#X9I7^%-T^P(z$}UF>YIBWd&Yn9Vl-
zxDO3q<@sFcQJx2BdcUXmzBu?RaVt-*N9J7&Ex#$+Qq%M2&xa^@*Z2O)FfG;G5<F8I
zRn$m#Q<fXT&Cf(fU%Z+NixD9{@__KI?;nGjC#c~uZ7f0N&RDdT6a-_~DCJnl1f72S
z%kY{m7Xo#ZU_2?1+fhla`I7ti(Do<=(7VJ#g<*CrDt1UYQN^~?UVAzeWHy_1KSYRu
z8_&A<y2ER?<^i5jYIS#2>6rs$E{2hCV;iUXKUdst;O@?p#v32LN9blzJ_degNEhHC
zYKM76dwbExvF2!=N8%J5=T1qKW3H~WQAz7eA-nd=Bfn;hg5Mol86e05;Fx9hgCBmY
z_zX<$=E*n?w(CDXaNmQRP`@jep(jI>+v08f8P5aK4ee&6y*C5Tm+df%E9$kFP=r=L
zhT@#p4RIng-ttE|X(co*?m@q?0H~7d6@Q0vtX@dJ(R@ZA4FC7W7W}6QLckLv+qV)S
zn9l6B?TvORnAHOzIt>SSP3Ve@|Ec(KtXtQ0tqksDUEE%2J4(I|Yp$L5Y!%JimuDeI
z|GHd$^n5lpGBOz>iCI_JH1+%|en9xP4e<`tqxI%1Mf_gyN=s+dKaPtozO4B?ON2zC
z0ovjc;g0fl|8i42{=^i9JO~rID2XsFQN}T<l~71ttY&N5sagqX=>)IU9zI6Z0|+II
znfMhO829qee%P&q*N@vv?yh61juJMB=a|hK3szMt9Vu)k{KhB|xGW1~-BF~aHJT>D
zq79)Xj$-@rSgG8GjrB$){12A`W>DHo#;sq~w|nH?Zd!#E#%=OcTfMwwe^Xyw?*J|4
zyq@|mv#DWmQnj5|O83lt@+VrZMxOr~yB+cKuj0vCWFf?we6B%5XN&|Uw3fImY<heW
z{DuKW?P{W*?goF5ge{U-f!9Ia2<@}@=8Nu(hT(CBT!&fLgH*B<NR6`GW+J9ixVs=)
zVJPk|j;gH%l8=?9$mkLwh&sGwh8y9GQ^jU5$td-aWV-Q65M?Hd$s^qWDyxz=ABX<l
zn%Kxvo2c@44H~OSdUlb}N$IL@?84G!1u#<^)^u8Cv^ZZ({8?DWWy|!mYd<D$Rg1&#
z%}!jeLE|P<HUgF|rcVmn%8v;sXIni;Zcn`eZg)gn@0U7qI1WOCc8>n2&Ihs*1hI5?
z;VX@gq=`g78;mP^)dGs2=)4<SWPDjBeP&?|^nsZung{3UDf=rTU0_0eb>D_FB3^R^
zq1kMcAVRIhCEBEkE&Uyu7?s3njb3Fo<P$V7q<=SGmqx4h*FV<C@CI`z4Ra?3s6W!d
zaGV&`*N!ZmD_kozf_@;VM1$fjs!PtzBd%8s7>0*;6MBv2iBrO(uP?Aw@klTEW?xaF
z;k#{K`e-I*%LI|+7eq86hRiH<V@epF102MlTnRsR-gIf^DP*zG&`_eKAs)Rj3XC>U
zzq&2Omv5!jOZoWt@NrK<1<^yE`vd&Cs$Z7x0qy0Yk3`V7#%gUp)Dy#Gk{hY}y|3|1
zHM8S6Eo*s!0LL5k?<PUXASBs9)E?{)x^Lh6>{{hgbTYCJ5LzMYV}V+Ip?*T$JPviT
z1S7+Ud>AnXmsIpcm05^_TyKP}4dhHon{pW>?rTjEr!IuEarLtCYGz}srsaP?!mj6V
zzkc%B$>$_-?ewmI!kDn;O}YmZX@Cg5i63l!1^&mp(W}ZNC=2{0A`6?BxAW^aAv$w=
zHQwtq(|}-DlXD7OAJVUHlT*@H4ofsJFd(R{{AOkb0X38eSwJZE!@_5ixO3Xd0)T_z
zeOQ@({NZJ{WEm3t8BFs>5G4)lx->5!vC^=qyv3C!+kH%A$Pkh%cBrB2pz1%G(&s^y
zE5Zz(1)q;RRy>$@52%VAQ^cvD%@%=C?MI=lBOBe~aTx{^Q#=J`aTyLR)Kb^&K+=qT
ztl=-qT|#%E;VMZ$4T90|>t;H_6CKIje~H9@)c@fUHnh*%FLMmd{eN_wWmweT+wF($
zkdQ8Eq&tQZm6Vij>F(|jM7q0_kWT4F>5>kCL1KU*hHf}tfB$%%bFS;WoR>2f+<Wh}
z*8N#)!7(?~c70@Dr947RlyeH88fN+5#nrUmU?UpWC<n?5+Ur2oA5vLs`ZfFr(>p#B
z03n-1yi%3)6GEotpR!1yV(z;PllND;?T&8}ZzS(&`7He*>ipZ^g^KCcYT}+>XZZtq
zi^W~jA@9Y*p66UL0`kmt)HG0VH}AS0_VuL8)Q6xB%}74{%>SlXzQyH(CZj-H?qO^;
z|A53*2Y*=PYB{oR)Z?*+%KLp3?G<6oV2Hy?^XT1i7kypihx4g&_s7W~$1o^tL$iF;
z!~1SrXzOa7gr*_T#3Z4EJMcs5hE5k}Y3ErQyK&dp&rACFn8dtJzt*j~qu2$*!z67g
z;R|!b-gE!^5xbg|pfdwh-H$(httpmI88~*IIg*K<Q>K@TT<ZtSTr9L~i7>OB?v6c3
z?njKQ)CPF)FFfR8)3%iRy^asDJHNlim}`@!m5@*ykPvvAqyaaaL;hcMrwP)3nTq*5
zindH2fYF<Cf+@@?A-uDf<f=eQdwng~w}*^eN|nP^_UkO(=}XC+yqd`$#hOp)ksbk2
zDhSzpXeyNgh3Y8#3r@7qTrY%bQ{Q1O$tUE}H)3p6`l+Ek!L&X{Hz%HRLhBi>@0m$F
zf6mbUfo;C*pP-;iOnhfCSH4Y**ihQb&qnp(cr9RSzoMpjR94cRCIbVuTscuW0;>qP
zi{tekS{i9xy!TmG{P1TT)@m64UDQf+-WSp<3+L~xbseAP<1;^)F&o*=#s<C}WW6Hz
z5eNFdtyejI7}Wc;7I0IO=i|Z?TsKBko66{V^C{5vmxwsRkZztVtCHp0xYtx)(B?lx
zeSVh!mI_7o)UI3&!DAc#v!Nwp)KdO&7Nd5#1?l#1p)Kwj0b3dIo9~_?j6qODd%$S^
zeW)&4PkwuIw!5{SKKcBa+El@xKm2^C2>=H_{1rm?XJ*Ji8=ZQKq!#9{D;y`s6dEB$
z#dlsoE=Z(V`Pp=ijBskdH+*DEt$82(ITqh@y$rMfy|xV*9FigGGCaY<J!H)=^2b1P
zqs5h5{6LXu_5IiU<47hqd}Nh1qyPCH9#?68&|}@K()C-+WGw}Wo#m_LkM&$k8hIU^
zonYQ_!(zj_BO|Ha_OH_xcoX@L`1HMn<J%q}+1zCzV)<J&%;a<h`M@-XFo?5qVBvv8
zMj;rHWJ}*D_{?Qugd@cQwrPG*!XS^zU_fZnDAe(y+2J`0l3%z2MNVg3-muM0Jvnt)
zw}G>itx2v#KtZzmXY?MDA-yDAu_t|EW^G)1MB3-DN{B5QtpX0&ES`h`9<>soHD_8s
zC>{d|ni>*<rP@T#q*(GuNnfV>9NS(xB7`%+^dECt*9`{`PkT*SAVoenaZL$WFH72x
zmP)Fn-yAFT(m>rIL@lv0=t~J_ka_hAzI%mCCTO35DEpjUr$9>1w}#PNzBY-Q`>>WP
zG$~xo$FhK`FG<wdK&gR4{F>mch5oC&N*I`F{%f<b??tggWUx9&C*22`NBrcIc^=s!
zHEPO(-q2T$rp-d=D45uJ0&P~YCr8lTB!5<Bi2(6eTIA-z0i}TQ<r|ZXZT7FLeSL_<
zVS?}U+i22$^$R1|_q77hzVes*Q-G4<SB3e@Dr8!<;A3<6M)Vu5p1!|C|6DPz5dg2u
zG@GY~Lpnv{Tpqt4wh6hfJo&I<dT$`)n_*4^^k_wtj#!lAibH@Xp5eB>9VA3}VT=&X
zQMo62b;L^>29)6K@aWjl+I9kZd&R(;D(kC*hDj|WZ(Z5R+{5#h^S~mi0Wx<oSREB!
z8qYZ2_npE!D~gg<FVaS;)qLvwwV5$1n&0{1^-F2^T%8ZDj=zud{ZFIr5o(Gn{}u<L
zn9T^Th^}l0T8drvwoww&nc{Twz4Ma<W&Dk?zccY)%ny{_ujCz*v<gQ|OdL0#-bz1g
zr4;ekIqE)k6bon^O6Zl@o*tE@CYBiM^Bd1`>Pn*N%CB$?X0eMGdUX$-Ux8;)=rzd|
zFFnqX@og=<k=!6Ql<B&@4f5>Nh4VkI=1eylLO$VR{zdA~*%jN9%>=O<b83{NOyv4}
zhnsHX-O=={pEqQ%lO!c2agdVcebl{bs8I+quVTX=6M29R*o`hpXbnV7Wd{JKn2+oB
z+yW)>*w;bGFyY|nk$8KYKqXshzL0<T6utZ5vNZ8L^c`z7$pce^#KY@)H|LpOJg;;!
zPJfaNq=t>hoAwo7r)4{(oAyt74ZqBW__+Z6(7?Bqo3AwDc&Wu+F?DCR<e6HGv1#np
zA4~9zOxKjS%c{n>S=uu2v=C@zeXmpcMd@f%vEbr{#NgA_#plkpGpC0UNv)w-ueE_I
zkc3E&KsfS3YC6PXWwPdc??t6c|99>7S%4Z*3KrbKXg~S4K<>FLayl<|+}^Y6wdM)q
zk)E9Fx?bLP+VRjf{y6!3TYUJt?cCeEfWRC@Lugk8K@f2MoFIq2(Ja%e#tpirx;t>=
zyrGzPN+B7Pge5_9NPTWJUAG0QgD-xa&p1?kZFSVpq-_yxs%VovC-vUBd)U@CVuj*T
z7!?Y+8VViB<@kd)Wp2(U=R`;UFD*Tc=wDhoDo1(d=f7Hd#7juaBP63(afJ16K4k^f
z2!Vs4u^(x0;o8a31Be^~qT%x($tPFLlc>Bpo?k7Fq*c|WsTIyy7Q#r;iqD^z)+cUm
z`Llc1#ePEvHY`1!Kyx-~@`*7%?)-svjn&LFlX4@7y-uAsSqDq)ciu`=4eu=cZmn?|
z>iJx#uHwIHmNg!{6@Cd@{^=Xa^)h#?Ra5j+vW}`DZOfO1^!ys&YNJ#y>vKKyER(<P
z&-%cjf^wo>%Z{k^l!=(t>g{*u50-{*&3r1aww7UzDS6@sxgoobTKytp2fF#YMI!%t
z#r*2tAf;WjNB!EvS`fT#D1<VkRCj&nJN!KzJ7wZ9D=H{By`{H;1tD1cE}jLQi-TVO
z4?z;~U}j1VT{q_nEnW<I`o-N$v1x5O_OYJI_@@N3bW3Rh)N7&c+Sku3qm$c99MZ7b
zJ`Q~}lp*%kM}q4lb4%{wV;m=*liQ!Tq`kOT3tm&luow0D%wb9`wRHm{+=|;<VXOf4
z<e*V&=4UgJG}drv)Yxzs1t)V%rIh3Z8unmoLgcB=y+?%~=@g^F5koV}q_kwIM>WNZ
zo<0nrCA6PNwHe$kzr~0|+woZsqL<h+mXr6atj|fz<)Y%sWcGl04_`UqB~6*MfU6ns
zZ{-l|AAW|0@m|1WK(8Is{EoYDjFL1MC2t8?CqzQ`WVpg#Sf^pd*WV$`Q!5Nbpsl?C
zg}#9k7_itiF^nY5oh0Qb>)=D!J05W*D?$uJ*k5G{oTM*5<|(|e7@}hq$L@Z(!OaX7
zSbeyZ3hu+lhkwA?--#2R*Z7%e6;-JxHviKUc@xdy6C-DujyLMsv((Q#2#cDq2@ljC
zpT0l2sbq~Axav&1?cNa8GJ)Q!(D+h%tZ_pIHa0}L#56r#lcv;in#vy;Q-{-F$Pi4J
zW~tIoV(aSaVmfb$h>Ge-$IhmM%mKlg$iLO|P_Gr<hgB>chI%?Kw9caP?I4U=TfkX9
z`yedfSrS9=u!OZNQgb+y4|l#54o(BrX5-H;-M5QTo5ibo!MhkXd=sLxu`Z#7%Y;04
z4IQTh<lkwHmZb$04rk}HnwyF@lx+(IHZu#@JCR{0(^%XKYe)gp*|oUj)J*OQ`V%2;
zb-~{ZP$nJMyH@9Oxmi1r+}1wABgSO6@zE_QCZcIQBXOzBf%O*5eIUo37^;ntOF&eu
zQQDM60<&B7E=fan-)o&mi?1)${v+bnrP2SV?fh^?)@Cox_qS{g%|gr+MkgxY_+XxX
zk6<U7U%9YAp+lZ-B!F*lD*^VWWq&TM)5d%Ubd7S{i#cE3iJm&%>Pa@jr`o*g$rg!4
zyiIU}!PO*q*`#Y?rs*5P70KYBFkbaDk4<SD;kWyfO~5TZ70_m0T4%JqdHc4!t5N*2
z0<US?x6XLKpWoPN_LIjV6o{`7nb?m%qb}|I6~7th<}d@yn2v@n#*WE(CmrL?OWx^e
zgruXiPH*w;EozFRqR{VQwu<eShm7?$ZvOl|>y0t&OI>E!2a9zNTo_|lE6;;BSDIlg
zU5|m@L2L>AJdw4{3pB)Uv9Zxp(yH_-nkc2TEK3f0{MIJAcLg9^?*@KdzutYPQCMg?
zU8YFlVHQFW=>KPP%)5Uq?Ois5=nf=`)K-K7c`94Ti4KQC@V#W4mASc`(z*0fql?+c
z9&ZsOE0edY32oCQ4q`ToEs3`)naLlSDSqf>nOmf<p?iWgO6L=wy(>nzK$WBL+Wlm|
z(xe&pgG!=A#MkR+rZj)Hg68uv(WCblxypOtphwnb<-_GBZKH2DUeN$0R=%X;G^tIk
z7cFSvpfsxB_u!1|K7^GJfQxZ@(f7yYia}zVh#VzKq)I~XQ^j9>YL`!TwsU&EC9kfY
zbg=qeAD415XylNmVfNp^!+#isIw;CNqve@BBL=em384u8Bz88K7Fknk6NGxujV3t-
zdx)RB4@Xfh=1HA<a7PT?6zt|~-D5`cWUm-Ceit8f!uUJp!1t@4ZZ@*ChPt}NiIe2!
zz|*!xv`RFf(o}RQg>xDETmZqzRO#wiazU+yF<zH<v~)ac#j$RGj*&wv>PvG62fR6}
zzsLL7yDuHE6%R^?8SO*Jzv2=j)U_SBgY(g8Tj(hRfBT;~T%P+-T@*$heFua!c=H?v
zp(52h+$PN;zt)GHVvYm){Y;*#)7DsM0^ue1Luc8DypAH+!}G4mfq(>$>F2**KM+;O
z`+FSO_+f8!!Ig94Vo)c12iix-#(5nXDU{X_iJg`oq>J3btMAx#YHzbzpIB6ifT*mX
z5v=>(y@Lq!o8F|&efv2mBeUL8o#w{zT}RB*x{;61dkWz*Ms97S;M!*Q&)DyckMNkG
zLq3yL@9{Th(gg`6oxE3&r=C-8F|O*NA~DHik!%ZWV%!xh5)m1^g5$%#B2o>Le~DQ$
zkL+mCiYuBitCSOe(yPBN<W!%Wq%yKoi_FB1OHS<p0zE+$Tmwstcg3<Mp+7iPxu@fJ
zY)pC_ohT}O8A=Ou=8xVbXRj~4D1?8$AEyXIxW6^)C^i}uw)Z`*qT1s0K&p~$dOwSF
zp`tLFnhx}oXs+0ejMj9$2x$8rstutjVzJ;TST+#w>dW>)dE?5$seef`k#s(WIE<*%
zF3BXb^AITaCEnbHjG<>iCgL13HJi(hZan)M0rOH-!)tG4ema!v=}Ix?x42{Ky+n0$
zqdmHlYq%zYMxUWOE4I>uH}|3)qD;&t3j=me0=*b+iF_a#sW5Z5TwqA^pVlCz9=|%2
z{Q1glPNOck>WFkY#<^>5^28vLe$QWmje|})%{L5Hf<Ok!;TBXTj5>m}t@K8K4U6(-
znjiM|^=kkJCPQ@J?!5788zBuJ{^w^jF?<m{{*%*c+xPMc6NB^q&R5(i!K{Vyh)H9c
zc3+sp&5*vBXWfvOo9jC{ai#pyuM!Z7OV0BUQJ%LFd({=g7f<a=W}VE<v{Hu?qVhiE
zP`xMP0bYPx*&ilYDVUaSzT9-6TTm8}yf>F_W?>@MRLIfPeDDm+q5e=G<3stix@O{A
zc1lk8U_X2M?0c-`lGsbo&5MFM6e2T;#plSeKnpEnjsjla!|jE}6k6dynMUa!v~;4m
zv|Bey%6w{yJLs|+VYQ5Pr|+(quH|H2)xc}-HX&-82`+AGc&PI6X!sa0J~m$OY)F8c
z|1vH`T6M^FRr+l$&eb>?jX#KVJD42p4hT-xgxW6UNyo>!!~x`Q#hsb1`PcwH_(3J>
zp^N>*p^ggFroD~BqgVpm!sWf=>l%aX6NVuC%-YKPW;-20?MT(78Vfd+cb1W1X#yZN
z8&M4J7FD^=cB#DAI(%#mb=OyCNK~C~#9+FX{}Wt(bVSJ!$D6sk6!-eA$H+CKZS0q8
z;JGB{*Rmwi%DW$7chDI1zc>p2%p*!bl*rZ~n-CS@6Vm!8Skc4!CHSHN?t(Y)?^p&+
za}mL;cMGy0S>QeDV?<hMvX{w-nxQwZprF=T&@q+#yM}6?2b`q51Wus)TAYjqfWz8=
z(8REj`v$?cwL~I0E+YEA79$i=IF+zkStRhJIV}*g;Y{xhi&(5z%HlV|-5mC@QV@P7
z#Z7mXZsenRNW5SF)FT1Dxk+VHJO`Q@Vksg=cYnn%ndL|XWZ5s(4=ZPX`e%HyRP>Zx
zQ^ft%i$|-|<nvoGLC-mcCKE$Dl*+V)NU8a|KMKtr5nwrGEf@!d0X5^gM;(s_C=ns|
zNn5kn@=D5sUKa!+1o<zbpB7)3aXGPl<@%iRI=IA;#*ni)kAl-MyWj66M39C{h-`}U
z_3vksz)RhW<RF>V?Q-ND5{2CH^K-bKOb2+i$ge_FePvRkw?)ud5snQnL_yGB`=AIh
z)P7J6b|FEm?%Y^?cY2magu*Pz-&hEC^&~t&{$09X8?e;F?)v$&<`2m@Vd-~tL4!?O
zNqgH`+jRL>kCS|1o92w=mt2uaNrtp%2u%`C<3>@~cnK;@=gHilnS_#MIvTje`G&pE
zpV%t(gJ*P3ojht;$c%E*_lT^+iXq}s`Mdlyw9e|bT?d~P(ti+n|56xF-iB>j+=zmj
zf<prWeiz9H7`I+6Yq@G&`4V7*TGR5ZmeiJ9UwldXs?+tzs&GWz{Z=Bdpdn{H)+nEj
zIv7HJH2cgY(ld=!Ddp7^ZZ`{^GN~|=gudt7()OMngR`-NS2yeX!Z!i>pSQM>5z&;e
zdgeyc?;@f#U54aUel*oVG<^x|*C>tXO;!5S$j2B|%cM=xp6!D{1<ADxNYYBas*LZI
zAVNzBDNQyrdO#g8LFyy$)@BeFH~fbntFUZI>;BiSLpt-pr?uz?XIP3~Zep;cp3y^K
z8@+<z=^PNPmG`tPCR2LC8BqH$DX}vFe}#5-XopU^UyNs_tb>4aMab5RzOKfQx>}qt
z&dtnAYuWySm>DEtQ#Vv!p6V#sSSW(6Wk5xq0NQE<v_BGWbh=n^jw;MvmOC9%+1=fJ
zS~MowCT^;cwos;lM*Ui!jV0So2CvsR;39Qu)VaYDP8t<v+_U#H!wgE9<57HATYHNc
z0q8buS!jp2q*KN=V}ZYGt;(pRO%S^p`x{cNLVi+GoayFUrPbjU>g{J`WPB?y39ZdR
zf?XUeY3Mat7yikq!EJnlL$;U}88_2(R=Dt9vqv%~Ut%%NWqC8xgUre#OZrNNRL9SW
z$v-bS`Rf2RIe9t6=x8n$-gq-1cKq#R21^jH3F`fg73r|S*!Q_5#bw##Y*rRG+=IvK
z$iTz0EseqmPa=dk6aXjm{@0ujN=H0rmvFd^^z>Q}xT+e<x{1n_&|?6_qvbsQ8uTO%
zL~T3Ds`&p*7GQ@WpE4j;^B)=1SqY^wKQ~^tsvfg?Jkix0*ze{2S)N9-{D^RZX|MKu
zB*?AmcjGES^Ut}4{dI7-trrv<d2lnznnI{rL*)p&H@U43-q^nUJ#03)EeGc;Yq(N3
ze<(kw+H*ppcoV4JTRZjsb8B0(7EpKTSnqqmHaw(MGu2~P)9C<}yoQK-cGz#_BZek#
zRN6o%94sO=ICJyzn6P#pR5`oZ$XfbXsl+_eP-DqQ20UQf_<7V`OdkmmkTv29dT47=
zIyVYlC~DQ{l~ucGYnBEfq8~-o8TqZ^T;j`0-h&n?qkq=&z5DUcuO`g;pWuN>=||pQ
ze7Zo+_r@nFKN**HQjxmrK|#dn2Req+vUF%@|CZdV`kbIgXZi5xCm0t6I#<GxD>u`#
zAP54{ADw#t=vkJL2roz%0dg(TgyHspkkH68sZzZD(aLNJu>YUkRdQ;UPK5H1pp_s7
zjftmY%#*8f#&|;_IwR`fMNs;8+bym{kVfi)cC_sK9u{!~{d3ldPczv(pZHVX#P=#T
zmkxcOY5Lskhja6=!AbB3wndfk&S#2x5_?&YK1K|8n=S*+CXSr^RmMQN_niD7ST7z8
zeMfbMZmjp3G829%p-Yp>8s--{e2pfiNM(&XQLPtpS?`8rKAPw5b2^?o?bV~|bN`q~
zkZ{*P1pRYD?`_bA8Zra2CPbEq>H4}sbv<ZNSMT7J#fDdX$oSAUn<`dq&C2oO{^tTk
z8<hito+NItOJxwx`O}}$FxT}Tk`@CGxfZYSep8ioAR)bGjQQpsrYSDJs+GHU(?r^4
zK3u(vEwvXcXBuy(V3KN<-+545xs;82Jb=uM(a|Or+&5xsqD&_#Ms>;lEnU?T5POI}
zDLSk9DO%*H7F}j21fPLSOe8`Lkm8Zm+98R%7Z5{1US4${a4w$}ZWnw3l|864R0pFO
za9C<EQIF=UvO~FT(t8;03ZU<oH>IVLZ(<rG`+AW%IC^FgJw@_9^fiC$_n)V)G(xJa
z66<i(pDNw{neJv$yRT!ya`;Q)v91|xsvX*XutFF>0A~-6bkZ`TsWc96oF+9h7dhjX
z8$q%1+i_7om_&TdLD8sas9PPPffMiQKL+i^r=h{a>mB_YEwWzk3Lr{QXn&&<)U+)<
zloDK4Qxo54JEw<=N6r5Cb<JV~1kUcSH{;bM*_HGf?F(;9-%_T}hnX>6QxFh*2`t+1
zFL~#u0z@9}u8wQY*-?TpgrgDl%AzM03OEjVCc;9_EX70Xz<g9BB+TJ)7$|PI_A*Y>
z$RoNFJv_YDxta4m!2K*>7kG~5kng+h>=nRxRce@FeEAN-xFuy+3-ZT4ohq>TstW!O
z0oCh3NnruR@@UfYaJkI!T<0RMK)f2SQ>Z~@fA|qYmM=e~hsT%#s5N9WB=qX=y+tv_
zEjH6e*`fKbnQ}jlnd5il;|e?UTI^KLf6TjYbPfTgQju}@<7tmfar~HAOg0NmOZO?w
zb-d+h%KxIy|Go6QH~d%HNONIqmj53f0rPtV81v(%;NCJNt84^9XuQ69`$pL=>$UqC
zcI8iZ)X;_d*0+`cqB0~)(4BGp^7YgXutGjuFWjyHpe3|yZS5>xC~tp42vxb?_xAA_
z{Sn2r5~1>jwxwR&0dM(rTv<;PVrcx*FEzG%LMeDpNZ9tYVpZwR$@1ARunCRDZpjcZ
zIj%|mJ2)Ugzuw+oDH9ivLTWp5_`Od&(qWtw3|1GmXc^JeN_O(9hpKyE$OqjnS1QOL
z1!IRP)!tHZF~Bt4@biuOK`ozVQPDioPZH5D<Lp)+9!zRC<Yl+HePpA*)xFS^HgMrj
zlrmpZ*ZrDyg6o=01m*M(bY**H{mb^6Tee*G+b&y-eI(UGqG7R@9M-tV6sI>|K|#bl
z8z2HQO`mh3n2zEVz{Yb*c3YWETaazScS7v6|GLjQQ~fkmiTP<(it#e+$$>Vbl7`NN
zlG7+uH#Yd?-;2!1)96vdMz0VOwId$W)`-<8?(hrm)~YZOiPL;fAUl-d-T%_n1F3NA
zN29^b2k999Zgvf7AGj9TERQDm6yY~9G^`jUA=8*)FWBY^R39sz#NmfqGKzTK&Ba70
z<$x3Q?U*?|XI1WP9tGWnOvjJ@)liCf(dV|qJyD4nKce!oFp#?+wjDFCe+lYhI}LJ>
zUn8NTcAyJWWDkj^Xx&G~dUNZs-vozz-K;nFQqm<QHTuSPx}D5eSAQafx?hK&H0Mf!
z#}&j*auu06_>oqsn$}fw^tSXHt%_^IE+d&hZP)qKa*;eCg`R~3oqV7PBdt7o5-qc-
z=1v`s^ct|*if$?&+8Z8B=qv;W$nix|6BJGzYUBX74)jO2!IBk}BE>C^IU|UN<7xXT
zsfWQ-e%VU0tE&q)VJ=jNV~Ef$151u(vtCNY4)@$3+H$C&KxG-QTf{9(%J}ap%1l&!
z8JnccFKtl9;=jMIpUvi6ncC#SI`_^!+`pNMI9)u<2s_GmK+hrIwaB?yhSlbAonaUd
z?z~e_Q19OWqZ`V;eXG~QwoIsHITg%xQChkRAm>Nuq=bO(pj0HZFI%vhZY|)JGqsz5
z^M3sxGJ)-aVOD`wn6}5*=46;Tp9OC!Jm9XEuMUVu?fWj$a@=h%H&Cr(m5Cu8o=iz`
zLVtw$ENgIXVxNbC|1w(oT-hnn0NXm*rRgh`ZTWXou>pbK`hwL9*;Z*bVr?o-R(aKf
zjn$((+!K6vv#Q*a;huk&H_nyy!#`r2JYKFi+2R0gV&yxfSBMKbD?3K>-24~jetAC5
z)Q#PN55Bt1j=8q|7w6}=33|$sNo9y<@&CLT{#NBYTB0mBAG4U{2TU9ZpbFK1Z{cCY
z68n?Y;c`0G0Y2N`7vMtiDxS4{+Cc9cGl_q7@{avKX_^00=$w=OEx{)t3tIl`;Z#R7
zm2MHIS(D_tup=h|q}2_gOy<TeF|AGgFfZ@X#8C;6Er;H%8;+CZkk3^hBD)n)UpwsX
z=sTs)S1m6h8F!oJ0&+i+SOA+WkaYi}&D?184Scetvr>x?>cBejO%6b@Y-ic!fVU;w
zja%1KR4!qoKxT3_jW?MGGpFu<a_}*$o|Yf<LjJr8PFS)5Y1j>a?DrkM32Tpv_u5;H
zsf30Nw)@RHFq`FP19{@=)W^<cIXQ<Qkl)YKmD6$c1_tet7+VggSM|%IaO>idqTXy+
zL8+EpI}?KIcmfmVm#WQ8x=sjV2AD(q-cclhDZL9G$&YcF(vE=QS5U<TM)9(vW<h|z
zAC=mDCmoG>PJax&_6TMkKqz{S@VxV|zlt}=ENQH@q0{|iy6MN}`rm4+5*45NOXd)8
zSU=(S4?MAKf^33Sc|%M}Jg5gWo}*imppeQ^L+1U*#Kdak)IpmArO?q4!?IJ@4ukvz
zYtj_HQ>(v@Fzs(90!j#mFrH@x*(v5{bLb;>=J_v9R?ix)<h(Y8tZRqVq)>jTK*kX}
zX96%E&8P8{{@{e>W0f#jNWUu!9ac|scB9iX1|g$arCX0G{Z5`m(HDpXsv%1{GW$Wu
z4+f`0>KG?p>8&akX<6aXtAz}`>Y?q|#vCt7D;AKU{$tx96G%Xvg(>8NyaHFP34|p@
z#Kgn`C7}(o@heh#MOtYn_MGURe+(Bh-?M%Wb&+$u<qB=C6*u-mxmP{d<mhYdUNs||
zUG&(?EiPs#_w^j&$PGr8mL-)xVYECvYUs!_er(dCfD$?cKqjjHAZr60WBj}#aU2bT
zj3NgdH{Z>RG_33N5R1m2yst8~^zGk(dVYJcf2Be!Z=)6{CI>tY(W#ugkBT6J2Hda+
zTMxg~z3WIb`WE^2Wz;WhhXyL$mpa|}#}t){?ccdMU+wx+)lmt&z#l_)E9*YpjrFu2
zb!`GJ8<BwG+kX@}WmBr0OJtpsn_RVwe>&gx44uh-^{cGcoF`zCVzQK!nnnN;^Rh?g
zPR_T|`8<e#w1X{tuQXo)*!Bt4Lc;}PQ74Pf=`2N{t<*{^3?m8tcCn-$Z4taxYDv2Z
z|A5gmEyKBDO;J}@cY4%*%oeOG)BBqu=jDns`)t3+ZeXLs@&|EhY_J9))c<n02TYCK
z_!Y0y(_XP1oG~bFSwpgnkGa#)di-s2#i_f>2=5#;#$zWoFTqMhcxOd55%u79Y{%8>
z9}8s0WuJ2yRUWw7QyT^TiR=HL)W&@>=4>ByWXagS_|a(J<@Fn?gywaB89>>sX*g(T
z&yF;3|HbIKM4S#heRY>aTw&iR;66jQV>UwE&;EN``A2dIA*>GWas~kBgq&48*8hx>
z@)A(c`4d*}zh#yu6t#CVgw;}-Ats&%SPR2O8So_hi5b)Bq7!FwH#z3f+*OxYr>TO5
zVkAn)EN*p}ogicRBaoaoN2&HHwkk@s>&HeMf?|uQq%txx^_)!5u&sT0^HNx7pMm2f
z<(=q2RJ7QOJLgU}jt&YMQOb(__vb1eA#Z}ZL1d!t8T?Ma03J7D%JBKD`%;5n`u+WA
zd`n=KT6MNy)rx|K=(+UJ<Y;<+kdaQc@={Ep6<)u9F^n}uF`d2aJzf)Rwk(>z@4G=n
z<17(4*S+j>`a`LsocLZ8^YDJH^J9lX&?trHnzIK-!b0Ekhf}_4tIaItS7^c{)&$QA
z|Fk>Dx?UaSvP}d5`w%rbBmx-m33=kaOE<GWMGn@R@o?jtzE%Dw-Ev~5VU&iXcE{Lg
zl#wIkk6f)5Sy5VAQd~S*xM+PtY!)R>WVTSFTqNq(_M-g)CX`UU+E(!;x237wYLe4{
z#xvOzn$HDf0{WAU9vDPeb)U0eOE=jsg~RHKFOri9w&NwW-kZ-)h^;MzyGi;Q@Gm#L
z6C?A#RK-9jIE;dI$VbV$;&<OY!u!26FCnYdhG=BM*0tfYIK*7S@zXUG#ob(KpN2|!
zZD%<yuVrbN@xjgz{F5+G?3dc?=|$$FiD?ekEQ#d+$-dJn{No(S(OLOX-6y!*g(z&X
ztfBG8T`cazUG}jE&=WBC<}xz?E+0^6ic_oN&&bHA`Niyu`AQl`z00O=yV268Gg$0#
zG;7&#-&KJk7Y%FTcvdu8^@7_w%kle`97lx5kj3nNM&5d|YGbrM9<AyrvZ1a3Kl7z&
z#?-FMm;1>J__vo7paEnR(Q2x15oAGIpAJA!IF`}+a~w6#^X-|9cQ4H0355g^3#jX*
zA|*io_|TD|nEBj@CTa3^OohLq8q6I`u4O*DMTP=MkIFySozF9{0bJKH>dg9jxfD+U
zmoMt&={Hs=0&>^x@4P=)Dw!5CmX>i0R(&g$fS>s==62mj$6M>=CqkLdUNL`|LV+rn
z;3kHmxL_GFO^Z)6h45v&UlESAevnAk{dzQ7s5yE05hREZb?HR$1!C5FaXMS+?{nV|
z2y1QLKD(jl7&S;4*v?kj+{PG@%%&M?O+@%(!bp?1BuKA52~XE!7OkJzF)(-Qq=`?z
z*}pLjHqnx<se5A+!1SF;6Czg;htJ$TBJ3mD*M_Wj(v7Gu!o716l!IYVf^;7%KbE?<
zWe_#svq0zFCZ59>sSa5p#(()_A31xH)C9_@5#@R%+EmRU-F4o9O+SZyz$GHC5{UR)
z%+4q!N6h|POdGcnqTNq~PZN=Y+x{X%`AAOfOG&{e_Ul;q-Zykn{Vkzk9p+NaZJ>~B
zg^Cgc0uc9|b;y*<Th9=N(j7%ty}Tl;-p!Xg`*9Z)@i&e3f0*;87=@bA*CO4vK9cEg
zr)#?K+PQ0sR0N1)6`?9sfiKlnl+)2JpjnWiem$yBqbU!Op!+Y~1U<9o{5k2yEH0p|
zZbLF=ijkfkSqe8Cf6}u{tfpJ{a-D>1j+@p!wn%4&&QSsbhDJHkq&zhY5rUMW1wF)G
zWHF4lw(&LL;61X8gs+z|3JC&iYzoyae=tGi;_r2}w9*hm_b|Q#w(T_V*LLwSF}J}f
zfJt>k=4zDpRm1tMVr^0_6Vjk{@0a=O-MVZK5iKDhdv!UR{=H8mONZz&qUPFu<A^d#
zafeGa5{=@yHKLyPUk7`OI2WW?2Y<2>KPS?oai=mXT)n?X6mU%AduN@|bp2EJYLriW
z_wfdr{~R165gHa&9Q5?KFCh2n{iJMsB23z8tkMmcrcuaY8J$H;UR^_jxKR%|zK^@&
zywG!koBNJwSK(W>+cgl0doNaf5sdIK7ti8&biQn7^F#C;dyGpXJfxL#Y_p9=`3@|M
zHxcWy`~rED4`w5r2I1}1^Ub#m*m1)RAAgCZXSIrVSAeV3pag9Yzng~j3*)8n#Y^We
z358Mfowdf1gROERyCnfCmfz8pQ}@Gj<KNBSB=%TWmYyG~n&o9qE?`3^Pkx~q3(bZu
zyHy3<pU7_5h4+qALHIk6SMId8vx5G61%+R|bRIOk8d|z`X|b34`7?&zB@!;eYy41E
z5zUMfK98pnM4t=Wft&$sDskW6k^^EZye|LGv1IlVh=c>_!$rMJ@_&3vND+(4!<hf?
zlK*brDB6<eAp?PZmCK`5+3K!aUq1$l4XNF)WXCHuP&p`|OGRYA-S8FWdYg{-F}P2{
z|4DpF3qc2pov^dDGo(mpoTBg4tw{a{Fl9H+CMCc3Zq$2}BOx0HE~WAU%c2(VT8h%y
zAK!K5o_$v|dU~`P9!k_+@^R{TEI(N3UQkYt#g7R1Gi-Hm&<xNQQ98b3Q6>VAG`(Ad
zc{9jGx$Ij>Rk{POn{Dk4Ux;p;){EnANll=C*uK=G$o`2d#!rhNnc)2imDlP^2g<bq
zyiL*VqNq)GJ|CM?B9E$H6W<u>ea@I}AYnG;vp(XPJU7J{)16jaWMFH#k5wYwla@hj
z6$_P>wfEMUbE`8J4mhOTa-7}wn5mtC52BgkFhU>O12+O96NIETiTr{l{~L8{L%saX
zz}-SWk5pG^_i2{%krmK0%L|(!b6pU>k~e=n<NCl&FC?kG=I=0~7BtGJblW2nFUL)(
zsYxVE(<QNjfVi;X9Rk_!K=m-bH2`>KKJgaj7DIe0v55eBTL~3ULO<I@M7wG5Z9KKx
zENq#--n8F0lgF&hA%3FesN-%;VIh>*3l#AH=`3@`h3<o+EhcK3Gx@Ao3a;vy^VqM}
zL@qO#4IRl_&XZn(T=Bj{VanM0l3(_`+@}4Y<$2_Gd5~Ej^d!;x)EoJ8okV4@nwGNf
z;#kPYPuKO#^(D*q`cTBMts_606kl(04~vkv>9t7QyU`AzM@^iUu*oe7lt<<NbsQWa
z&n&E$2S<eLk$Eo`RJ(3W<psBn^!FeWUs1&*cl>^Zf$4x5-$P;k82WL#?j7M$0HpT1
zop=~)p$T6FRA4HdH(g~@5ZbQ*`t-AecqpM%TkZ*$&ef(nqD7;$#N9zpe}4{@AA2X!
z3tYXL%D&LisP}gbz~g}&om;+)W|xkN{I25mxe{hA4u}oA-F6EU>NQ|F4A)*ztc`E?
zcas&ff#5;rP(y#A(u}cTFH;`!#`PnHY9ha8l2QnyL4uUXS)k$PL<crgjip=##inhG
zsWW0pRZ#3`Q9MMT`pF}CBOWcjQ1$hwX5NUshntd0(IHH1qEq_XYUSC7lx{3Z9;CBN
zwcxGJDvLH%z7$Y6P2_w}3lHhfOhU)^rjUZ<Yf~oC%eSga{*ax385>u(7nJdr9V5Y4
zs-~aeBPx#$rLUs#nLjj{>z-QW94w~elD2@nMu^$CI=>glqR(G%!1Ux<CRS7>pjV{w
zsGxwSkMFjt&$1Obq*DL9eLzS4D&{xN!p#(hvAs<^+C@+13UQ7g+95%B#h!-UvvIfC
zV9qhn&B~@R&5Ko>0E3~YtP$o#27qeryypmv5A=76ElEZaQ~b}ddZw^w28civ`h{W#
z>p3wD?sn2m;ji{A(jfGbv$lA>;iL@>4Ikl5y)&Oap`!>+6Cfyt#vxNLML08w=N+we
z>c5R4rIU%kR)f%wHaV?xHdsxjH8%2Z$7UEgU?>s*$g(j}?C@7Mve3GqzEor$-AF41
zZDhGDYFlE1SkK1o2wucLA6w`(eRdiBV`KHy)seFmeC?iOj`dnbGa}AgmV}_2l#4=m
z%a-Ee0|ey#q}TDBGl#P+YRXh|ZLYQ721R~})t=(VP-eVY$+D$pH=Algk9<5Cq`@4s
zkXW$n2}V$OIX?%gvkeOZcY-%iTAm%%J5&tF#g73<N?R)QI6246|F8gj+7TeoMPmHu
z1quY)u0dzV#z6sE_p!&n0nrXDzIZ9_6>neP!ZE};5fZNhi|S;wu3ET~SY_#ki4`Qn
zLdgx6-73ey8W3cnx^H%}ZL2BiO_zXUQ{K@3+G<(PNij&kxR}|jIK;zUvT?Gfb+-xZ
zmRH%&QyUXvL(RU~`}mFHtR)VhdhdE{8Zl!leM{$t1NALmm%}3?E84S{@Q@sKCA@cj
zV@x#UoNbcYL|TL&LMQWUI&2#p#`TW=Y*T~>1o$6EH=6#BgRGo_=!J+$t&TwC&wl3z
z*L6NE!hkC$xK@^z{Qj>a^si$Ane|@>2Qr53*uP#l`)sPdOC@a_ngRcoKl}|`v)(ex
zhiry0=dPrDd~?CQcXJtv#Wg+rH4mew%CLQ)IF9f4AfnOnuLT<ewlw*%yA3~YILC2j
zGaL7dYW$I~VEX=k`VpNf;Z_oA;dOtr&xUeb^<15&<v1rINOhi!rJwl5($n*q<0UU^
zHEeFI&n!8%*6yequ>d){^c7dJisV^GIE1_qx8liwu|e|THS^(_h|Fa2GZKSu)8Vp%
zV8LZhw+NKc>XRr?D9~!iIJJJ-Veh5K)F%-1VT@iD1%H%ZO&<EtikkNo*n$1}#Wr<E
zB&@l8gDPV|;$^7gptz(~NZQ1O$j(SGr27^a^^paoVgrD|s=o);Nl3|I-^}CsIFb8u
zp^S>%EYH79!MWM3eFg!2N0bum4XW9egBGSoYc~!8>u_#31K<lKk%Y9S(JrfElhr(m
zJM&f-;qJA-d!LXT0h5GiW>3L_tD`~cfFVb}t4=(*(H)LMcZ<Xq+{9eqC-x3v=Jxk4
zM|?nzj-21tq}!|Yy}LrCPOCxJy?>L2vQ3In$gv-s4xI8kb)2P2jhvq7VVA!6*n;_0
zzdDS`lIR*r^j~(FWHXo2B(qw`hu?-7`MJ1gEsU;5y15qD3Doec{R)W=U36U==s7NB
z0E?Qdvz4O4+mLf|@4^_0t1pxT^sKHMJa*2JqONC4u|zfcSll~3p1psNRO$=H8Jb%n
zz_%xYH;&uS$b`ysXFrzez3Mm2o@+8ugNF<UtJ3&7g;lO4vf~+((iOswU|0o>cF7=&
zbB}u$hOOa{vIgqH&B)L%1iCFeYL0g%?dJ|VTwDgf-@gd!P+L`t!+U;<hT^BSjLe5V
zE;5aYIxyvMt&PyjV%{AW#tl!Z8b1ATV3?%2#T3vcJJMrxh#<G{@yft^!CjG9vIf!G
z=e~d<G6z>mkdBNNp7&n2l}DOjL*NPwnvuEdds$n<d}Q)6#T(S)_mywU`BhwbGrExn
z9`lY|SlgQGFyyW4#V0x9E0CPNnyOLUugR`m_PN2U=&uMwrAQMTpxMD1?|WJlYhrSk
z6d5_9ujA?zp0jBbKjvlH=$&9f7ySNUFC?(`NDyBM376&By22dEj6aaE#H#5*i!=Z5
zM5KV(LG1*%_{1y8jBE(hehBDpj|YQjQ%+O|kxX<(1kd*AtH^KV&Qy)d;>A-E^6*sp
zTB4nLrI*stkAE70el2;Sg!pyRO6sS=Wh^VSs)!clNHc;N&aQuc1a#*o0&^f(Q9QDV
zrcu)0*GFVNd>hWON9BFE{C#8w_J+i;2s}yft%zjNIPm68;M0Q_O8&GTcdz2BBry8a
zG^(i@>SYz)P6O`D?`Q#H2;2UsB8OD>8(?NKob~fI3GB}Z5}tF8Nd@QAvPYTBFI=Jr
z+6E_|nTpLl7tjonI~%*<g&SZ)lCy)QY9?m34<c(_3peA$1<>AehNrKA!Kbna{k6Tf
zlt^Loda+ciL=c%<pepZVd$WM8lqujA;z9wc0k($Qf8(D&SCVQrTJ@dAHwv|}qoJ;7
zuv_3nS!uFE<J$7xLX%a&`#n#|!LbT@<3^doC9PR~F)8`Pj)8$;OSN0IfED0oXjiCo
zfgx5o=<g&|g{{<pJDEd>S4DTW7zg5p_O?XWVl29@wsJ{aLy*9{tQt%7-V)9bDGL4t
zLEUd2JDE+3@$-oRdyg44qdL`t6D{+3+oJhxJo&J%NTv{=HUed^A*M-05V7mL;9(<@
zrrdP`z~cxuadf_2mRR{15mD|^Up=1{Ff+jmp7=;BjwEful}}qHZ?gJ7vQ!QtW~1#A
zc|1kCdYk*9{Zmziwa)#0eZUIt&1H6tdBx^QAn_cZ&;QCD{+-awvj4KZm}QO4=Kh)H
zlo|*yf<B%KO|AckP}(IK!%xga!qnc=WUpUhCAs2;Gt+q25^*x#U!c&|$HL2pVJ?8s
zFgo7+n@M7AUVzmX6zDqk)jKMs%NEFo>t!!4>gd*eU=3_oE~&P<3}ZI1IxY@h9{`KC
z<&aDOx<|T!Yb!Q6|7$PC#*2P0H;c2K*nOc!z#JL=6wT=#vJ-ggQ#h7?)w#M;qSh=&
z;{Ddr<Zh5U5Z`JvD#390nUCXdWQxyK*vlS{{S`}GDn6@6K>!#MfLP^=XsbChhZsVo
zt}nYM!5cZne+=jWB2mzt-&3cTX3mpvf2c(WB<<RPho4_bui2L4aM`PN#XoEvKUc<H
zsqv7mwf>@rdEvX={7^|O#SfYV7yu_r#nNfD{>A0&e_qwFWHu0Qr6NY*f$EfdhOxk@
z+kuXos2;wSD&T!&kiS6v5;0Wehh1MQ4b<f)wI~A&Btd8t2khrYb9K(H(N|uHf`1%I
z)=suYeU?1g3gW>7<19V97QJ_z5UTeW)dHBRy%)P~6I44NqBT{}Xmuu|p!-L4f8{sy
z>R&VtL4zhv$LrnN9%oZB@om3f*9Jg6Z*HR}iP(>zFlH!TchBX)II3~bgGe<!m!`vo
z<V1~7?%)|`<z9qGP$+CjZQ)S6rU`6`C+5_W6SRijZp)j;4R#wqbA|K-{={*It;qnu
zEb_bNCx?}$5uo4GY{9CiUP2`Bl8lCg%dp+k>m<!+>8^r=GEp3@<g-zr2Lxs@(QG`*
zDg3R%u(ZkjaNcl&OjIe>26dp#v|rSaxF)l^y3k?lHPCNcfLQv+N!V8jK(?U?MeN;f
zv8pCyM-8r9M&;L}^JC#97f2a{FKJbm1)V;*BL$nBr^q|yGZGNHA;<enCNH)yNEzPn
z-cM(nL-QVZP5Y3gEZ$5P#I?snMw;ODL}MR9mV^kT*s$ezr2529M0oFSG(m5}wm*l&
zLYC&<-6Bw5gqCXio^ZUP39?sA(Kj-F*{P2_T)YayfQ#E`Ov?6|4)(s#3um!sJJl&H
zKfo~#1&Mcw9tSJs1*ul=X=*#}Y8o#iQ8TKRchR5t5lC3G)jxaE>rJ$z@&L7%A#8$7
zIj$EzSI92Uke)_OIfPn4^h+H>+SQGH9{2RO?y;Ow3Peq<u|PH4nx|&nDPK}9z70#1
zQ`ZwyVsW+BW!9qwALQ)<1mPATZ0>`l42{8gY4yQ%#gHEPvP!gXm#S%%VM6N`cAFqH
zsC>UKC}h%+T|1A24hO$x>?Kbp!puPVJB)f~-AZ=jeA-NSBkUNd0B<dJ?^jE>9p2sD
z2i{cni-d))sC<4@?BC!q?YEa@c<`E%>zf`5HVBklLFk)YRg1FHW)Lx@ofN4zo(ZIr
z)K6WHvjd@Y<XAt6;knr)lJ}V9`MsibhuaKjZ-!UZmme!B!UN0*GW#02cmHZpIEO=R
z%5v`Lz0Yxazxp3#(#25am+Coi+v?<W6U1yF5vlE$bC+ZM+M9_~z9(hM{BJ$Ol$>8B
zP3YijzWf5lnRCZ>pexa4x+p4!TtEScJcWQOmlB0h!~_2UgE{<7YZ%DuByqDAnl94`
zk4Ru>^1{blLo3I$3pm`}u4+3_2}icU0L~Nf_1t2jEWX}PwS242tCqv6Mh{NJ%8C^?
z>RZ~W;ewTVDgo1=#uD)ThcVwu06A2`k$pey7&5**%09|L@qB31b>52RyadN><Z&Xm
zJ%vPXzW6QjH`qpW+BErQpK1zK&iepK$sn8A+QO0bHjfI#8k_XPUHMjYv$sgQ0|6M$
zB$4f6mwczBja`aq>}qhqg?i)eKmw3c%R#<gEz>4gSi4h8G~OX&vJLE}EUJ8mY??WF
zVV;xciLp@fCwdUjIihJ^0FiwSH{)L~c}Fq!>SK-Y#4Y3WuLiqv?q(iNEAgN_byd}q
zuKTuC+24<KCIVFOx(vk9>Zrw8XI8idYfX9)b-&xD*7q;qm>Mr{c-v%$1e_KOnoWdc
zotRL2m>EixTV3qWjWDhFc%yyJj!d_8dgS>}HA7F?mter#Xmcj`oZY+saei|U^Wx?O
zBP*HY^-p=C4wj7naB}~Bz`!T}{T9gAN1AB>JXScDcF%3uL(3ayhqx5_eo*fqN12T`
z!QW%$6f@ZJ;r6mwR^vH7rBL7(9FOU<!v?ebK0-aWgWDK<O23Vt@-1B!A{sY<!D~L8
z^u{x{9>iL+F_w8InJ(Jqx^%*R@6yF?z^y`3aaI=$S^f?i3VIToaFlV%sZq*fa5<4Z
z0Ke_)+aK-!O5=7?E(%B;jN<g~=FDy~cvMy#EGM&AD;9L{^K+x*oO4ZlEDz2+=K&HW
z!>?azo^AC*G9zIwMQqhWcXn1iLto#ns#o7=s7NsBF6naKBpU~g&p!bgR%+_Yr`pk6
z)82Zi+G>7hh)L`DbfPFLo`iQi6&D3-dmj6GlUap7w?jD=_hFQs4Iy)<y>YUb`*m#x
z|K7*?owzK|wV4Am>bxS~#)OOv+TW$3?~&IWSL=1x@+CC2T|~qdpb}N+=n~IrFrb0w
zpsxJ8-21j&=G^yCt*YfAL$6gk=mYAf%z_%X-I>xF1CKcmPc1si1M#Qzx=V?9l*d2>
zSLo`Md_O9V`@9Vb@>8n#PDl4k{e`1dzu}98b!)o@lMV2V%Z9&L6+JY*MJgiKtxMsQ
z>2oP{(5%I}SofNH_U9hcG?Z(!k+WbYk58YMxoY0|pwRFbNP0|}9n0WJmRAg4pG@|K
z=yc?At}tKq0DE<)cXgxH{X@j`HEDqlXp8?ycsRGPF}1IbslY$dZV|pJH6GsbXNy`l
zl)O=x!rAk2!!<kQlnCY3jBjcX8jXK13IJ=wi%r~A`TQs#-yNtWOMF>){qAs6TIjHC
z&v;j9qr;L;ME<HwA4LR<j@MJKFc?)x;}4-mIJE_ZY-55U8o_oX%?_~n>%<yd^@~Ix
zu{trtc1XJGXu6pZEJ;8VX6Rhv`h=#x#Vl1ixjLmx4iY|G=9k-_8(8JuLVu>td$t`F
zFE~0vC4UNs%l(7s*&u5QpqC6D073Z86)u&2E@5IA6%L+kLE9~ElVn^c6C!v?1FmrK
zh`fl*%Hu>Ujin33V`d^kL@Zs4_hSNyw?2ab1u4gn7B8SfM(bcWMSgPa#lr7X<CC6M
zamE{Y^&CQupPB8&+#Wd7W!!&m5x$159kTl(Jz7slEY)#ob|5G%prNngfIMI&AyXJe
ziU@NS(C2cm6!JoY|AKwyvH{}?Cu$_yX=VV}w@w&vWi>Hrs=`K|7-3aC3<??Cp?N+C
zI-NkhhjEUBT$<ys6Sy14M_AR@LbXjgF*mB3eKO*)VWcl)0P{sdYIzNgSZN~RZKp}?
zQ#UX>s7F6Qb?f38;}%=@76lZDf#ejckoq0&dw&*z9EHf97wzxm9gcf)l|Vg?WTARz
zvbWII#E*!6h-RImScJGW7AC9L*YhhlWOMp-`=isP;@iTS*>9ogzwRjyZon`_szH@q
zejsPp8-Knwf>#wzcXhN{VX__(tc>x77k{^C@cq20KD7bitE91Zpa!@YxSxC?*^IV{
z`7t;+3X~3+pZxh*o)3gomQ~9xaTP%+p6FV(?d1I1!Wk+m&A*|@?3qjjqdhc;M94AT
zJjVqe1)mdDex`a_9MP>oIR6<4kN?U!y7xc|VjJNm^`oRDfjuW77Pfzu#0awOG{K1B
zt;HSG`$PkJPhDVPTQ*oTnL~nLHNW7nga#!cB*dc9uJB|Bcx~zYJtQo?>kVKk{fAnK
zK}D6J3xr*U(xRchk66U!6wjW~jUzY{J~9@JwHeSfIS<A&$H01o?{wST%iwV~6zBuD
zz9uR&s0(#W)T`2vT<%7SWp5K)@_EK{MKN;H5{Fz%GT6yjp!bd*VYP*vf<h9Y=#Ko&
z5xIXb^7d}Y5<0Yrb<f$(i7!qs7CWq`zH^s2_tu#RbI?(NN$X>WyLm`#A_Fi`m@tg+
zVEYkDK3#D<NE1}KEEwvwgT6a{X<#>RAr==FQj=UzKwFISef!>L=dn2VP4x4!+e+95
zF=%paKKDo|`~MmL|JO%|&cDdK5^3uHmW*;3P|5@MD*6yw1fc?06<G+OFH=U%A7wCw
z`;+Y;7Vh(<e2<fBJ|Hc%O5=O_&dBft{8#emomVeD1z$v=1aw`^cCTKYi~C8xsS8C^
zM<%BD{N)APb9;V-XGLM>MuZC1d!5jriGy4VH;e?@cR7jUM-vnNXXBZj3tMaJ;#c9B
z!qOswf!nF{1-b?X9pHPonP&`e!V;ps$v$+0hRkdy;g-1b&i$mKeSr60odj;#2DJWO
zBRqEM6t!)9(7ec8(mlOzKpOcj@(dpUXFLJRsa*AU{*O1M-YUn|3F$b%I}|tL)Uy3B
zN2FnEkfys~GC#l(zeflbumCLG4t-PWKd`$kIM!TXX;#XE?re|nsn8%?0R#3jz}J{<
z!C+;w>-_bT>_{t}7}aNtI$N}LU~#Wk*QaoGlFA^^SL(@is)_J9m`V!XhtfT)?W|Ds
zO?a@R9p;8KT4V9%|L}E|QBj9&x1XUyLb^lgMx+~5Qo0){>7lzzk#2A(=`Lv)Qo6fC
zx=Xsw->2U7taHx$k+o(m;LA1lb?v=>+Xw10;<cddS8C!`ui|#f!^$Oz1h#TRW^)m;
z@PZZWVj^S~_XazWMLj;<pA3Xz95|C~U5(tQ(|w@yd0W18NuNQcg?a9?lU`MgI8uq9
z2=J2nBY9Uo89F|LK<s?I->(n!QqPxXUA=siQhA!n?pIbv4S`N)OU>pAV)h16i-&Qq
zp<5x%@g_(4f+%F8N=}<yDh*0?p)-Sr%JtW_Aiv$1jx7<JwU(WE4_Y!$(c8_OoZpqd
z7pyCiS6bOMW>L;yr-xip9ZyX;lOAsSilPhUGcCtt@s$4VF1v#R(^}WlUT*sIA3MXy
z^b~&CbTwj7UZx$<e3ZKBU~h%s>6LFZo+u`U9y<&-DzDivK-gfRIZgn7f4<@MP)dP1
zSfGty+YIjaAbj^0wXJUVdI>KJUsYwLblstR=W}i`5FU0*ymQGp6&=)@Z{;O!;|n@`
z-#@|{Gk>8er!2#L7Sd&6pup6wZ|Je#goM`qT5k?<q?{Yh2hSAcrveXoU!t{vHWN8X
zXuoZ8k8GKe;oca7yb#J#AZM=i-Z^X0c_y!K@;9B}LE5=MNEx}<^cV<TOuggfB2u73
zA=;hj<1YeYQTw)s3PsyJ714K|?dm+(Y`GNf)Zm7^$G|{OWASSfi*D5~<Ogathp5KY
zDnWgq0~FNc^}BF=V#mpp+KD3D2>F!L@~OgQo$#w?2HJVjcj0gHN^`{k4-}1X2@0e(
zELZ{_&WWDM8F?iwg_gVcUK+)Je~jvLSf^obHTdjUG=W_ZJXs$0`gnr7zuHqZE!PYW
zB=jet_r!*d7w$(?;5W98_t$~gao{!gji?v5z9SUcmFF>V%^L@ZatA#i`}KUXwUdwv
zb%vz8gI%H)L(Ke58593@H$xSvavNRMSCT#mH|!F+-?!3U=oe!Asctu#b=h&|=X=8M
zj7{M<h2s-f1V^-x2$=6Af61&5n?k(tdf%MpXci`IiB#FxBq}aD%cACoAjSxaXu{w)
zHP}qTXcb9`r?I~Jorc`*SU!&`OYGnMaHzIqJ>w(qU*)g?T>sJBj7wkEvN15kEH}H!
zF~Q0MK=j#05=rap>pVvNzNN2sr3(|<H*M>e=~z$ksY?g@`joO5v)3|x?_@fDIcH&@
zp{a24A+1Z-O;_>3koY`oI@+YxbS3VKm9X%l6qOP!pvj2vCgko>&wsodW_zKT+@S=s
zj<j`-m1JHnm`gRnCQc@F!KVBzQDIE@(IB=9vvn9k`TA6DaPN|diID4+l7HDqJmrVe
zIQfSTKKm7KYKGxCazR%$f0p|*C}(OA{oAqI8p@6dAb?U*Yq^*oxs`he-ubkdogN5O
z;0myR9@g@PF*7k~IB1mVgjBH3=dCRtFSEDPBTJ59VskiNQX$A&nBzx}{0i1NBWlm!
zhve8H_-U737Us_+xU}?KZl$mw1ahk>d`a?%CKuHBd)9MFKTG4brbFn}E)+)JI42p5
zy{!2J9PsE5Zezz-duNVPgG9{zcB%~6XSgU^m7M}RSb{wpt4=d~o*%Di`T4aQ;hiFh
z4C~E=wmZr8&`K%U1?baf1K^QO0U{|RtzP8pcq<5t{RUBYl+p^g4gR;R@IM_Kz;4lg
zhCgQiSDd~PNG<utuCex$(WuqiXJUQOtv9s<z)jJ!7VWu{;6Xa$6A=TOo%fh{mz_(}
zhj(W`%&orNLQvtVezO&_lTo+WNcm1`HmM+kq_7xOANJ>g%N5rR#rE*KiRpcm?Ul<l
ze1Rlw+sxCM6eZK_<~xoblO31u{Ml9?NzoccM=ytCjvKH2zi(qerl;~=xvlJEP`*fB
zgG_JM-(GBfx2HeY?p@ZzDq~}Z{Rv+-f4Fg|wp%8-*Q=n<Zi((`W4~VV%5175uH0$%
z7jbDktZwU1)HKLbn9P3shIypD7mTQgjP2cW*;2lW;iz1(!c-qVqoU6@f>qYxke1NA
ziJ9CKR8Q%BN&y4A+BS-e-~xl)@1KLc`)iNG_Ma*LorFES1J@IUgjoYpJHvdz>yj?R
zn$c*)vI8VP4XT^y6%(L%^by2}<s>$c=_>#}31gqFCa-mC@@ign8tElH$+kciagpzH
z8yoDRL0Ek=RBbgaOQatuYQ>_z?hS1gZ4>MjnlaJqB^LH99foTVtOQ8oGIp((n9FMU
zAMa7kjVF&THpro}7}2~@jplfKs%X$}73;fDz{r|^497J>te!<wcOM*BqRt#|j&UH%
z)d1%O-|#vt>3cH!0S_&l)o^Ux@J6n<&Cg9R9NlNF7hyBMn0dfTAA4t8;dc=$HPm95
z^Fp-W+~kL<P#(9jj2rt-i0~ksIlwirk-pf5KdFc}1l7RYb)CLOzDQvE2!4cnr~Z>V
z&8)-6?GS6xY~lRT@#NPf4GSoSjLiCA=2W$%An<@F`jj5ty8I=7^qoU;1hh`qZWoW*
z2b&kuM`sERt~<O_rqMu23BqxpWOJgOn8TbA9{G*uMTDosU?IB%lpQoU5qY!cwXku3
za4Mzh5RO*>-e<0bs$u1A_0zAOB<!`(_WSVi#QH)GY4!A{I}NQ0d+k7#-`7Z5ynVtS
zVAStj4@YpY{C{GAFzkmJ<I=_h-fXmrsBjHUEb}X%QXNbU!D+)0u4ir^CD!UrCU`+E
zZj>w|YEeJDuos(r57b*+?=Wb&qh}dYHe7BSMWAB+j1wt))lGOi89c+3f-e4U1QkL%
zOOTrlv>7?=4b?&6S<{I94q)=PjvXSYEetZ4`GjzK<#Z0QPv_Bg<BnzpIyj_T>;e8k
z_~XR_&Ax^1W^u?_?guck`OGx-+b`FHO?bDi{8_G8{)g&g$=5#OY;74mf##^}INh5W
zY()sKQ4tC@m`PC}JT`Mm0qF>@J)Rw2=gPD@03LF{XJKBXThAuq;#%fdYnEAB$|4iw
z#kwxlga8<ub<*BizH)GID6YWGpm{ssPExvAN~}w`oW#KdHcI4WZ*rtw8W8BAJ}shn
zE$iBZIw?LAsH>k_Ii2ZHsn$}y;Z(LeBX_MYNBXBr8Fh9{9R;E0b+3`AU9bfAsV-Vd
z!X2lpv3NEB7q{?vgV)Y==W$+@8`q(@DTlm<<2`1y{^NaILPG9`S9pts%CEgd_C-G7
zZ4Q=`Jp*Bln}rBk+2+4sJFR-W(T~m?J1EW<X1;o=Z+qv6&>NYIDDbDOfOLzMPa(Pf
z*RHOvgs7FVtTgoeEpCFkohFFQNUC*@aK(W@#)0(+w<+n0;Sx&b{r!DOFVaa3Acsp!
zNCc7uaSFN}ml}Q6z&1BGZVmO|CqVBV-`KY%i??+VUaUNAva4V^4O*y#jB;;~oTr#<
z|Awbx0fWJ4C^J5PC1;R(k2QdNOGCfha`C}}*lde|(nxnkT7WhKz(FjZE}$+9<NLr}
zDk`e>8#UQV^*=76|9ZavbN;G*06+Fb0uS|^BukTjcvTgG;G|Y~_=?uHnm2~j0m4jt
z+@!O>M>M{588@RtElGi8+j;YL)o3~20JF~XZro7@+*dON?FpY3rYPODjL$+nB3&u+
zCe5CEDe4y0@ljmeMtt`BdvmiY+oRlGQO%*Y0CMmLk%!8boMQ4m7s#ma^*X7#ZXwt8
z(lR+$!DtE-mxX+dWH3V5Kvsw3;f1CF|L;m0O^TiNM)N@pmP8p`QRT9rAPLjcLCNW}
zsPx6H<@(-%FR><5{N!Sp-oKRvi*Xh7>c}`nYCi2EB?cg-1F0?H^S;NXd*%D$Qi~IV
z<i6U+a#hZol_EhSFEvO#T7d}E%~N2NUDWmV(?mhF(=2AQxO%&;tAO&o>SYSwINucl
z1o8}zC6^N#sh%i!NUYk73AK&(ziWHsF@)W2%UN7I_U-_^)Tv%W9)6n6lrt5C=%L$R
zYIyY<(AzP{O8&GqWd=9DC|=6MWx8;mbdZYl?Q-4FhvzXlYMQ>AP`;ljTa+P9iL9cb
zqwCupe|^ZKPV98^Wt@YtW@Y2)a@KIO`2<$A(eV7dHq840J=2d#RUt1lk$ChckOr_r
z9Qid1aaKS=5m_#=|DB1CxZ9wel1Ym|^Y{SjuC-=S=I*j_=cZ(<2c|FR;bZ&<huS>l
zpauUuAyY+_Y8LHAM5;<r*uF4!BQ61J>{6*IaP^gc@^K*Nri9BRe2W^7EeaP3LIH2u
zA}lS~_o-NFi>f^>*9W|fz>Lf1goI6@ttHP2hdFJHJ6O|DRDQnhna*>K0pJ1T3?jiI
zw~9w)Cg?9dShQ$ykhUMDpV-Bi*TQeE7}U}dZMgREb-+O2+fQ)D636N9F(N2wC{Y*A
zprnrVWDt+Y?=HfGRQsott^){sFWdMlYyLFTP!KA~mKlDE1M)g~^)my!HLh|cAEwQg
z<d$;{SOwU1hnX(oW6T{rVK$(YX46Y!?NATfk9`R?4PYs%3I&iKDbjr(G>E?%GYY1-
zGO6-(Kl;JnJ(>@mFgZa6?bDD!i(x*yblm1oZ%c&PO*#i^9Q7{42X9ndo%u2R8(uyn
z#b;Z};}Dg-6&kf4>u-guUBZXl>*C*q+%RM;%wUqU@)~`SsKmP?13MDqt>u^Tf*c!u
z*)1p2n)og-PHK=RwRGYXkss67UzIaIdj68N@&1U4a-R5R$sX{Tj*(~m(4j9+#%C_5
z)T%q|Pm&zVLb*Qb>9+B(KNjz2$LPG#gEHam>aIEVnzO@2a9htLcwX)^QpL4@`t<1s
z+-ub9p59)$ckhA&`B^^`j8uV0ua6e#ADCWBWM~@t)V}>Z22v`n5TM7F7mE|)&=0g2
zPRsL`ZbHDV-sC30FnhyBuBtssWYhISToEog*s`b@aqHZQ`)56sb6_WezA#Gl5AsFq
zs4Y%vtz$-}MF;sFGxBJD9%`k!tZ!`KPY2>+w?%D;3e5zFKDXHcZxWfWM?OsxZZv@)
zBdQ>Fuzm^lR4th&XG0oR?-_Vk9>rt6+N|0#{xXpn;U{2&t`Jl0p(z~dMZB0YQCSQ@
zCoFCR0Ah%l1lyV~v^^4yj-hgl8OggELu7oK5=GuGLpILb0j&THvgPU6l9IB(<hI`x
zxyDv&vCh9(RNKyZy;PdAB8#;gYTZ}ILY6GXVsa)xt-WIJ{B65cGI;}ldTIw$+l<!I
zuj#=XroK~3cA9DAimHVrO>*__@H>r#Z0rlU>l4-)x3WbHcFwh&{46h}#~!NUr_iq^
zj=!Dc1`uGYYPNtS-bB>gnJgV^=T{XUau2}%3ToQi++3TC7F|5$z4!FI4Yvo02nBi#
z;{CTL6Z~I4(yNHIIsDBHFq)PBgMt+>nd|R6|4h@Bd=kZ_83JSuRg@-=eln~D(=($Z
zth&q!-_S{;zj1Pd_*kAQdF$Hu$!zT-$d<sxI9Ar#E)J5rE!jp3I&N~bh}QLrh*Dt7
zk43hBXR9$EO(+s2Cp9&1KDc{?XRB*<Cgj5rMY*6}bdj}dd$hBhEpKf)KBhW!J}T`?
zpT+cy2r~I~Jf1@j{ra5e`FQ&1c0RZSoJzh`%whi?qYm0y%ZA^->zg$oWXC!XhB<7k
z#72_NCX<%Esm#JnF}2vaOGFQi2WIbRM(ftyfxQy-4Qz!H_|oxG6uc-yb074jxAH5d
zz@;bY<qvy)IsscQ<faxoA_wZ$+OWDk-y1aF0@o{)0_~Je@*HTi7{u(DbLUZi+-LVV
z!t2E?Q>g(UA<1VvH2RdiiRR_G>fwE`>RUb5>kryY!1M4py>LAki0a22*-><(n!EMx
zu8ZCXBBw34uiCyn8z`DOb>B#_2FUbz?Tt4iQ6m7`(qf;DV*~1dh;lx`T8n37{Q0xL
zv-K*TUjza}UqnAPn!(RcHKv`6H-S;ZH0`TW+iW`Q9*7`9__dUM&=8vA#5#>GO~uND
zR%g&&8sh+K!+U*D+k**(?H<m<To|b-5@;%bmp4A&B`{I0vhDgMc7$E^VtlpfWt|%8
zbr3GSfAy715Qsq6mW7Jwj1Q=d@`$K#;e)ahV(EiB%jA(Bg(<`;3*I5P%Pclg53FCI
zn1)}CNZ`a(O;PlcK+J4v$s03N)tDq<%hZ{yLR1x^%QEF{xf$eN+kY4M8z94AB!(fs
zsW*@fsg@VtGtuic$1Z~JO?U8Rc(Rr@f5Ocpptx`4<7wBk>bo8fC;g0&Ko$Fr3DLEq
z*k`_6-z9xPxGZ`5>y3?Ev9lc|Bm2_ohlRJ8s<FiEv|NVUECLLZ1c!*hJJcB24v$0)
zE=cX!s*N=iGOsX>J60cBbT#ax6Fnhnuzbnjcg9d&i^C-J?;-tJe%x_ll%TA;lefFM
zYbxc<6DteW(#l_@L3kei2x?0E$C8cb6TG@+0(#+(l_Rrm6|8Po)^s1!W|P`0sft3$
z1}nE|W$yFdzW$C^-0C1g43SxBA&hFCe~+R~_qE^SeEW}2oHD}anM>sPSYq|#FV{Z4
z3MA(>S<-<K&bPFn7L#5~#CO%@z;-=Q_SfbPjtr(j706#B>;h^r7+5{mqZfd)Gn0E<
z+aH`l8Z~)Pd=_oMTAo~TaRbl<sHp%%!9B{dvc$mghdGN}BD_`u!WU~jox=A;y7+gv
z-n1-oJ9>!D#g_prY@d^ToLLT14#K!4jbDhc5J!*EnQ$f5CJ`_UxE4p1-4Z$ANBt6E
z5z@Fuh~mfUF=158WTWeon^RNQ_Ta*NdTFF#RE}jlV|62&>T;7~RU0maa^H#0uGYu}
z1Hg|C_GRGgoi{-7NTQ?V)x||(Ipikqp6%r27ET0Ezja)(Bb|QvfpC|Y%e?TRktdRr
zSHp*ok{xsfgZau5W;o@12-Z(O$d10$dFefU%6w3WytwO%5QsWIQ?9QYupMl(>i6uE
z%IEMym`8kpLfErVh#z^|Zp$=aNXQ&$!{pi76SBbcl(zs3OHKuBr6%iqL&<j2WXWeJ
z7w5i_QBfL?KvIk@42x33h)X|^AM@V9#H()lBCmv}Le)O1U$|Gl(kQ@jrtU-S`Pmf)
zfjwmd^upuU|2jB(mH#<7H@=v%{UZP#Fj?e(!2KLg{=?f1+Q<ZKrq$tTz6Fv206Zqs
z-7%|s?U9neZEhMhN}bjaR`DA_^zY1sx*iFDI$H-R9RFCqrg3l!^f?}~Ua4?08*npR
zoLwUKYJ0W|A9{4D^J)DNB*)$=ad*|a0DEgB=4bXQm)UAMJP8b+F<tP+W^Rx}YoTH!
zllbPxyH2&Ryf>#+R=YRj#p<Mu_s3p`X$2YHWOjYGj;oJYG8-R0sy(iWk9KAAzqf0;
zCD@y2{9gQ>(<yBzMFij4t(!Wj>Dmtp%DjXXVCoQSjiJg{XMzLEuHDnGIb9r9yo4%j
z9Q@>=OjHd{JLQfS!}SZ6FZ^7-&>XE=WHwU*;EmrdE^s%;Y3aM(Pc4R9i;RZzzzfOU
z#N>L1Nl=Uy6O&Acp(_-#T35qW-W9Uabu4x&{2Zd|IZ41|r|b|bH2(b3D+2fLy07>)
zsnHIP5BGo8eY#^1SC6)87J?zFa!Oc5FzAw4`L&ury)BJ+fG^tGClzAt#`D2IZX7Zc
z3vE$K8G#fwk(+QgEboaPZP{=%JX4P@L}f>x9R`<v<Vp+P1_WeyruSluh#Ymojbi1*
zKi_?N^{};mK-$5|_wIMj+Mi-{-ww8rE?a6nW8CX5{3}S*+i&N|9Damv<uhW$$at$G
z+5A~3mG-8)GzZdvGTc*qmprp{u``M9M4<BFoU`dmn*u|#F)y{EPT_@xO3uaN;o^Gt
zKC3t^(8bYSvst$y>UpP6*%pknOq7D?HDS#0>#n51ok^U{ZJ5LPA3q(qVrF<X3@V&i
zIS>;8L87#kc{Ul`RGKq~rt8sQtR&<_7#fZN)Jai*rUO6q2dc8u#C#STzU~Q=d0}Kg
zNjRh%%$IpAo6P-L@Xy(mqiuzN7AYm8*rC4v7ttr<FoYbR$bFcVQxlj=kpM3Kp5v(i
zBDfOmb3(8_QR2~nAh}_-IB7O8A$k57Po5yhrB)@N{Yq=Wgq+m}5_yny`A!epk4#J)
z))?~se0@py4UQ)_I7Mi!u5Kbv7pfKwqKWbfvK_1(p+&}&B|hd-3PB?>ZF%MYHEa^y
zR9B_WR8m)>A9>C5;cBS0TC|sNLzk+ExsmC_eU)$xMo%^*0f{|*z3k)R_mVBoy3*At
zPm)RBdvam|R9>#q{ukw#E0;X-Syw+G0l|CTu(_lfYklqU{(A7I<&5SE_8%H-+0SuD
z`~-`*Z&_Jb)GmYHXiK>#gxKEnV%%3^0Ll4p%vLUVeS08#kB`^u8KfNsaNkK#%!TZZ
zLrfsv2P72-Pu`Ud{ZZ}h#hsTy<=q7SB_!)uhZ2Ik_#ySN_?Y#WpI#BN^Iawx4GTN8
zH~~gLZ6}+~0^pIy5Bt<b8lC#8G!|V%Bb$}{A)D~tkyWEyk5M@`b|TMOGZDjSQwSyN
z4ZYn|{4c_&ZUgt@9|X>w=>VXyNu$lzr-fkx^P=Wh+$ul7sEJOMw`Ws;lkHnxK^|7c
znV$7%?d%%wqSfalAJhSyyU57MUqrA0%e%7rmAGHu2$_9|!<60z=w3}8Y(kSMzHd01
zz>fKMYiDQY!${F9$h9rh^L#56tn;Z2M^dBOy}bcSmJ9)_PHxX9-_pq{XUrv4WRcK9
z_+ATR^60(Nk69V-cY+IEoRzITGZ)9+8vl1x{l7Q-Y=7SkplSzGc_{mz1j2Z<)7mFd
zrGbB)RQ<%%CNC41mDH*DSXlH7+>I;Kk=sZz3}03ZI*nrW)a!?qsQRMsCD=!c**ATB
z?*+4nk7*c$si{-V?KKTjjf!5sh-hy|YzW8w?1UUBe6})IIBvh6Uk&N7KcAj8oZG=C
z=M&d8s6YwzxoQ+Q!nqj+=v&EbaRAEv#Yx*OJSIia{>?_n4zlbA^ClmIRCq-qnMgA3
z53TmUt`^o4*?OG?N07;cKrtM0HGl2iUMH%(deJXmhxTo0>M{B?|EMT-3PVt*^;JV6
zcq>+!H}h3&`JW5B=TU=bh9o2isPEfd?>*ec=YO|I=wRe;^o<mP+^XAYdAo{Pu!SY+
zZRmK0QJu*6R>w(1RDJubr{Q>1{qI%}(1*2CsXJUvJE<SCmg}lbs)H_WC&^J<{n(t{
z<m!=2*Vfdmw8Y(2&G7g({%0cg0BwG2sp_Eee8>gM&|o)vpV^IPgpuWJb$}Wc23#d_
zm|TpGldmp32Oly-C)NEH>1#bZlnnoPrw?!TyjnF^AVN26b><x$2pohSKbHoc5JFO@
zv_T_cMSj>CG_*||^<Acad>+?Y;4WlK|32mKRf<>~;9K)_gY2yf;;W;oSMnZ|UBf%{
zd=Cn+fh5CYFPTAXL_0lhU}xWHNH`90eGb00u~P}_g?D(Uigk$C9H4bMt2tcKcANj|
zfWZ-^%%;Hg-i!(!Y#I7}OB{z^dx6duPm5)Au+inG8DopwUK_nMBTr5#J(4^GeFXw^
z^V2MDo+c_)xxm<Yke3G;2GMo3PDiz9y_he50{t088%8gpmlkr<fj^ff_2!TC5MvA>
zFP+?VdF|$kA5RjS?JFAcn6q*p2wsl}Zv}$i6t=-;cNE)@@qGqMDu)^JPu4g;10}hI
zZlrJQpyfvpM9L?VD*0zQwWOV$O~4Wpf{C#tYye-!64PusEK5v_S71hES4eEYi6>vy
z>TAKnk^L~O01_3;I)orFYW`Nm@iZo3i|~~9gZjr^PRd6d%*}y}u12&U+j(8Yi08+p
zt<{3$RHeuPM%Nwc*G!KL9X=IVMiV{do%jA!b~ZMpaJ)f*fp}AWo}I8@MW<6a>-(#t
z#BbJoPww;_G7Slp9NETp2-JIgLlO+`{c*I_0NnQLw{N&j<2VFclxM+g+V15YiW#^@
zv@9}T;=BUWrV<u#m@d10q@)u;){Nzh{o{dWD5-A@DV*%Zvz%kzQ~o@IfYT!S4`zZo
zC*pTV@V01OGCz5fO9~6=TZcrIKRF|?sclq|Ur_fQ3<VqvKBGK4N}69ipgtYT$;NFB
zCYSIbm{-8=tn!Rsw%ZElCzhZXuk9O8ukY(As+=*dtanK<JfiA`g@qM46h#gol0ZbJ
z0`F8v_cepPFTkdw-+2|wm^)6;*&4)ZmE)*H?LVKqFUuyRwh<t4D&t-o@OB?^aJIXH
z9`r|sSofc~kUOEEqAFuf1!r=-d1KlYig6AkEoFhT=YAKNpvyi@EGXUOm`qZ#BjQ&T
z^!rG_?J3N7oc}z<R@+&yXX2XdpuvG<|Cd+17r{s>i0fnzuoE&%nM93O8cXilwz}sn
zR%dYXi%<%-j5O}vEO8;NTU@R48y^PU{4skeBDTIk`AN99Fm@R0zc%ZCx!3+Z9i^DF
zRvUmOvGIizl7D;-@&T`MWrTk(``?rCUt&`s6ZS)<*AqQ!TK!M1+r3^&(<^A|)$QwO
zA-1Y2jH$+Eugc{@9AtIGK>M~0U~R5zCBGe)qEI@S-9w`v+r~tw8UDvsJj)BzWW&@~
zNbZ}Cb=Ft-M<rT%uQzd{DW=P%qS3cPN$u1wNhXeF%9<Yz40%hMB*Ws(`k2|trYqjy
zD`L1S{5Zp?WRXi|O_~S%>+qSipKO;J#CsyWboF10@txQ5PTi}~u3_Ja-c<^nu61!7
zTIQCIrVC2Jo}YAG4j+_(XCtU1=@UJiOZxQyrH4H9Guh4^ITi}$DOLitWZ2?x+x;;q
z^`=MZCx4^g<XhxJMTyPmH^HbIW-herdTwRRz|GPJI;uVh1lvdH6vmQ^e^v~n{A-;C
z!_#p%_Zj*3A~Pip7EM*Ez^8rq5HMN#pJlqh<Lu*&lNfj`_}4H0zzeQhKRb|{hzfmE
zX!rCt6}I#?*5xdJBSm)6EzDB?CA0~)fziYtf%1*5Znll3F2PpHBeX;@`ixW?t$QJk
zw0eQ?k1b~HqTi+OL#JtZCLATz{cc_(51J7u<biC(31x|?l($1yhpN^y164Q?Mr9s9
zWhUveXui;=Mh&~zDmNIP$a@K^rZ{qMG>@r&TS87FP9m*7UzK^#j(?3}bVwpK+niP=
z+n3-6tJB#BIX-!BhNuX_A-qM?cPkiLc^!>mm<{!1KUBhH>nOuhOGl*QBW)ai-w-@T
z>UerqPRB(+*KZ+u99KsTJNK)it|s(9Mi!jNL)425`}sA=6D%??uT|692>Oa#9<pd7
zo6&MEt!s&KZPxjVc>cXVX0%vYx!SZsfIGH7l_m8;>0%liuHO<PEM?`0a5|}>5Omf9
zvebTmel_Za7jZvras+bhn#Xn2W$#u(w+8;q=KVRb+8QJE+7Cj#X7UCDue$Pd++EH>
ztgFI1O2ffY^aV1OOd<irS&}{e7c6!1pb6b;pp-|0`dG$VAvj<)vsKfTj*E^=227rj
zrb3sb3ZeT`wI&4@i9zyKiHc5Kx-()4McQtuLAmjf$7)KNt@-fH*RNldV`%;6X{BWf
zV>vhij0psCah`I&?f;d6e|LXH3p`wDZHAMWm+Hz`5KcVEqy8Ax?}Xu2ov||{C0-jG
zP*q-9@QwBTj!R(X5^lp(RSMQdWrmaKI5zzO^l0k+ES7M7xrr`;{^)}?pFIIa`WrWi
zz4z`*jzT4rM&^jcuj*Cc3U<FO`FMLLmZKA}sflqIYr}Oc;V!9r6fa^lZeTe-gZ#dJ
z`4R&-$X;dCxA41`4rPiOg6DiZuQf)sX}=7TMf*>)VK2KhzY&!f8cbr1-`q6i)&R7s
zDKcjm!c{AH<&E3Ow>!%nL!K#}%GMRFihHMYclpS<q(=|Ms;Ekq9Vw!usPW()zsE~W
zkF7+_DbB?U*m`THmoy>yx2jZhlfBCs+lC!2&sIR<*^fLc!r~?9+2Y>s+<18K#!v2z
z=<@auy>Q<h%SLObqXAHzxYL=BMBg~)!uUD;>eivP8aDF1Hi2`_edd;nb!Fl8CcO%0
z=cu6INGvE6Zp{#pSM>ic^YESE{Zn0U(beIi1}5IxC;)z~K9{l3g*6|%_j<<#v?|J3
z31lE47Q-P({Zl>vY!M5@?M6i&X<!&veO~pNhRccoqEn@LxYC$?qqXbt%EJr``1mBg
z+wN&BWc26CYdM*Zi5)>1%)AM>pG#0se1G=`;HWm&?RQ-VWRTw^Y;I~CUJ;Ywy$V9Y
zs#?XBm6wkh&yh+Xjiz@#Cl}f07Odbk@cVdY;8KgR(bP31g~+Gyezl}LR*t<<ua-)y
z#raI4@h;7J`gXHF{**NZ{b)tOJ%#^aXXQB{Hj6Q>&$=QK@PFV=Rb5D#8Fc_6-XP$A
zHFER%@%-9dboGu-wRyrtDe=;|XG^C+u%@ZkRkUJ2_-G}0M;&a>Jo%(1OjjH?d**Mn
zE#&z}>;7pu`ufU{oF`=(p8y^~x5fY7M|#fp#@ght_j<-wck`%zrBJC0S6yTKEZ>AL
zv*boRC;<MH?C`g!^Y?+nk~jJPcrV(`RaOa|ws&2{SZh=yMbov|XHuR3Pe=C_hav8q
z_EeQMJ#P%D9iX|A%Y`t-VWb=mgf1r=4xp=bBvMA<jnWB?lodhchy&x3q9_o0y${jq
z1E9byGg>({hO8=G66RTLh=q!1r=iXiYTcaf15S*l&PS2ddQBw1M)l*SQkdQhEXmml
zu0S0)@+)nWfDy>S!Abc1{zl!JA>y~AsE8XaFD`3l3;Og=Z2bi*!-Q7Z6(rVwev`98
z51h1v=OdU!3z9259`rAF*O06;Coj3}5}0;j^tV4DtrsV-8;r@0u8Y^LumYisSS7^j
zGjxeAQBnFdONN64SC)7c3|iW1gAwm_COen-xE0O@iJMK=Ql=*cX5}($bX4n1xBDwU
z_Nxqz%JsMvF}pmnx+x0_Sil&$44)d^d0~OCWbK;XV6KrZ@!?}z)t-a=WkBCY`l!W4
zh-OJSsHxkn;-ESVhVrYllzwfho$DXGEl!BOVqW934{`G6DD{kfjFTk3J@3&U-uhu~
z{CkkU$dvfIfRSn%_*l(L<A5iH@LY*?n%lof#9srP;DrGHN28Ld-0{idy-J{A*5Ems
z40W*xSs}Ky4+pDa-N~r(nlmFbLfa3e{8w;*8yS+;evlVR`+5;80Uk6nKEKm(c<*pA
z|05})_&F96Tq;23SI2A%=BsGE(gE7N)%|J2rR{=AZ@CGAsZo2Yqm*ct?HV~pmKvQB
zxtKa+o93;?Qrek&r%7>*4QERDQn;p15uy7S`i&G3z1B-Ll#3TBUKoMrP|lQiJ15f@
z?|vo?)ke*<_E*h^5;o=s|MXB8i+>+2Y4J%<r79J<Lw8wWH0+3<XR+A9LBT@z>AY+)
z0fad^GLp2q-U5_qOOqWHIRK0&e0iO~Ih&H29CI)@U|$Cy807I71XI0`k4eHD32t1h
zwf=U-qG@KeHkCu<2XVr*I!>7l$G-uIO9VQG9Al(tjYj+MS!@prM3r2VbZ<Rq{b`vd
zOLR?AXc9h1MK*z$*fc3!z<#%iS3<85PBO1oycB`MZSMBa*&g;%m5J1J=0YV0o5`-b
zfTGK|OS+3q@36MkD2!!Fop8Ia^FF1~@gu6dQ!C0J#}NeY)Sa8N4KrXw?~^#07y?VO
zr_jva?Mpgy`I$3;^q+vlU>kJdJVb{l<a6gNGunsO=D+_NJhu419uV;v|M4J%yx&g|
z_~(NV32*F#6}qYP9}ygH%2|*VO^qOf2JfcA?=jO8>m9vH>}zvrNMWFv%lCMf4i{wU
zRj+H-`JWy+n7Vd;wry>4Ck8%;O~hOU{SkYrM@|%c0d?X2MsB+fd*`(0w-%X6-?9|}
zV~xVzSayy`qN2!?v_`p(ai$=aT^sqxuOpV7-|7%7+sJD(?uLgKM*B-G;n^k@5#dqR
zQoVigio!W;XRSr)g7u48oW|RSP@CrOxD@%{A;}}lQ?;K`NG|;jQTi<0+Qork$YZ<E
zpYHawc+6wBB*>AjV-Nh2rCFzcnW9GMuFh_e{<=rIix2{lg&td`!o#b%DfvI890KCH
z$SiWkn%Qw!jx(@N>(fSy-WfGwfloWXQWz%Mnqd8Q74!Gmt&DZGeLpH(a7W=JV06I=
zynVS+0nu7hr`F1Lhx@p--fSZu<L_6-Uje*oDYJxt?cpQrZXeyJapJx>Vo%S|jVc9R
zpyJ{oG1)M#t3S-$UF|F+fMoUitbBLT#A#uGe2DTI%m0`@wHv61Vl3pq68?FR+u_9D
zKfJ~C2>d^2Do{QvogoZ;AUbo;<6xJQ{pPp@8$6Ka<(sR%0igi)e|d=nLH0F1DCH1a
zlCNZvoSk^pi<Y7yXFE8l-_i|j)$q?ZQWOY*XR-W<h{^bH201xpj71&)W&tpulfE?C
z5OoaSpA#4rZ+`Y|P&P0Bm^kAS6eFd7M*I1Y$@xXT9K?rj?L#ogb%XnAHpE!3$|Z53
zISmi2_UQ4kdP&qbXDSjiK{50y=BBB`b#kf{E|teVGvd}6x4{2kIggesCf#f}>22fs
zxCc(8)`@dOY&R6n!`iyqW`rfKfB8Ue5}VITKyZx@cWranKfsN8H!EyGmdMe9RH7rm
zHv=#gDO!P?uez36KuBKT7WjMQ(0Y=kuirpa^nGIv2YCc{%MQvvr%*1bomiVOH{nJU
zIt3E?)<{WZSFd7mq(3rnlR{V%#)u*-*?B$LoO(a%yIJ;tIbFF8#iB1wa!JUdY;A!^
zJ_LbHuJ=Q|MR=E?<>|LiJka?1!{NBiA-FAu!IV<b7$hS18H)MD7Y#GK2-f-(cJKUE
zRq*;U(o2thkZ9f#hZtU=GM=Y^HUJYM9?g879O2$lV-1`Ns@%B&HAp^LyQ#(Mv#MZe
zHAc2VXDotY+s$wEEdqJBMf2gbqAQZzDSx_A7aMhCR+Md=p-uj5Sww>$QHJ#!dou0u
zo;X*VO_UBO8uf2{v142aT%wzq3b}hXGe~#jzd(<>$VLODi-ZZFwpDu}JJiNTaJdov
zx)O$(CO^Q>Cf+?~AACJCLUxl=8b~2~8e7tXJQ3ovOCtVG_|oC9Uk%rTDA3<2B*DSK
zOfftF8h>|2UhBSQR3!dyMJ{oz{i=d^oepwf4cYgzO9xbuKkc_b=_5hbwE$xC)&8{H
zQ4#pE*157>hoa{6Y!jI;$zjUd;h3cq7-vSL1m(g94f&-e6r~$_TAKBC`iO68*uiE3
zr%!;XyO@1_If+&G_knt81@D9d_tanuQBX+lNDI_S3F9=#Whn)ow`Zf_u;id2=`Q7w
zkD!;Tg^Yrte97l8T?oHGy+p%`!lq(_0~RG0lVUfbLwJ14M@2T;i;uqZeBJh}FWf`G
zrWfqe1AS0Hey9lL`d=QEH}U`4qBFgzKi>WIaAs<PXYVEG1q05P9kz>sChvYGtGjee
z#3*EhFm<ftJNM|~1H|P#%Z>c4P*Hz-Tyh>~rA7gt^VNF_mRVoTP6ZDjy&D~9h#IPY
zRu8-B`9<SBxrMW=f3&;~i>t;-<#b6KN)yh}6TGe{q2IiFXt#(W`Nom$`imCt{x<jP
z)^BWYZ;!qbS5kvg6z}HpRng5?Eu;Bzb_V4_*F&mO;J7=_GM(`^M(s6sQ!6LHb>wB2
zVb!SOw$WdwjWDx)OJZU??I;GB5}RInO4G#i*K-$}b{7wyp+ZO7OBpjGakt*xUvh-~
z02?n~GGVc~V#g2_B_F%sH>U$rz}kn%w7$n{QPYZ->FI`)!o_5G^7MyN6kZZmYr?7)
zML@!9eB;|=`q=09N-(Dv*BefNHOlYBsmH!kOLE(%Un<v((p@(n+>du(<BHs^F-WZr
z2(37`hi8;*k7m-ZD&F1|?qr`<l0Yy|=tZA}^o2+FiIz0Y<aZX-|Frb&oH4VtO<<1R
z@3p$E2%z1atUO9IK85<VD;-#*id@o9KdD)M#<IhVfU{5za602AO9zy&(ch8Ap(284
zT6Ptn9?<&B{hZgOTSGb&z9kIJZyNk2XdBE6>mypqzGAo2zSArS&HVX_PY#4}s!jcy
zZ6%4#ElQhKAB4W@W!B<sNyY{a4jm8Wup*{X8Kfpsf>1*P!DGdpZx1n$hZGA!gSr#E
zZx>G!<6iKt!j7z@+Z2@1;%YD6>uztMb2NI!)K9^ak!_yjjU3&$n#^iNUHobJ1aO;N
zZyndcd-I$sJwnSeR$U%i$wFcymZ>2(ImPdOSl`KHwIL#%3smS|wCl~oX!YsbN|?cr
zKaaO!`7ahzSVrGQ#|V<X`;wdnjiQUgnmevimpONGEEjV2QneiCkRP7y?UfX$Eu{uS
zh_3?kgZXU9^_KT^9>(1SO%J<=aR}Gx>-C6O!Jsc#)NPqblyR5MPM{AaWp=i&(n&*J
zQSK^YYuUT9C5@n=Xaue4Sw?YYzt;DkrogV$OkYqL#&X(rDWx?&o{$X7!#mDF+jsrN
zhT!hb!D?7XYbIkLLjHl1ZPBESo>sBvu|?`C9|s9D#H4V`%JW^Ks$2INn&V_{ZUZ)E
z%ME-iztQVLtqKES?Ka<5Q&Urh&lkVHv1=I7=-bSPa<G7<40a0Y+!grZjOe0KeR0BR
zr2CtuZv?&ol_$kbB0hHvV{srl^o{v7#u?SFHj+9T`Tj_My2Y0*Ln9+_Em%Z^I}sJU
z=-c(jfYiX9+po2SwiEs=d!ywPQE_2Re!uT@Tt-xStwP0qVQOGweRR8|jHb1$JKXVP
z1U^yzdC@J>R*AxKEa1I7VwZ=z;RppL`T%XR-Ya8&#YBRJutG)D^iE~($443#7BVr{
z2DqS&jSc*6Iivd!LW39}Im2Mvs4xY?8<iTGl;UT;;6dcT+PP>E@?Hab&>KC_$|V)n
z5$Zd~>getO=SgQdi<PM_0;+!7veHRj%LcT&HyxhKp<d+})J6nX8~jeC$~mDxF(4C!
zhn5zRJ@=uQEP9V<=xjb;wLoD&T`SDOrmWHF1x1YkVS46D&1$Sm^|2Fq*zBLyKJG2f
zMaR}X%psxF=k>0zt-to3jj1A4sWRe42N5!<RTCj|ud5Bt-gP2xD2rZ$($&#o!NjJ?
zMwH;OlFm4Js=u2U%JY}2i3<3Gy_DAfFo^#jtNHj}yZhYIi+`LZ*H{?WJWGyErPx=~
zPtdhv|07s~0lU$)ShW+Yg*MFaN4m{&?{bSvjr`3ie2ZJsj;~Dm{oPG}R&v-HskqP4
z0fGyl!o9NWFLFn(ReNRqo{@_zO5FW06|7j;dc1}ivwtTPks6bdrGOfz9@ZFD<9+t)
zT?=L1oOWJRrk8Ie2G2zBZnB{{<<=`QT~P%JkDq>xu)S2`YI;uP>FF*nz3dL^t@3Cx
zREz0WuYu{tOriTFs;}){(j(`9MR6by@giMaUBng6r-@7di)aRiLFU4JY(;C-_1s_^
z@?+QaYCpS^#k?&Pd1UVXEV7{jlk~8qG)njkb~v`4Ga%l7aF((A6eOckZ{Q;%_c4*Z
ztrBE>efdxV?)c}3HDX&+h0lopoUDvHdV8a|&_;QX^osj+4h_zUnc(U-Gt#7R|Fr=j
z7*uKR77l200PY47z%_vz>!=e;{!n&~`WNDR9Dn=C$Vh7=(dQv3_j0JQOW5Brt9yJf
z`z=ulY%M6KU>5~+$Ef>ERwA!lRA|=2K8ekR>U99oF6gi#Blb}H=nHS<Wv&tNo24o*
z#Xtl^BpDkUD8lc>SZ();*7I|@IH;pmdL|l%Iu($3fF$Ab5gK-l^Al6uu&k1q--u?y
zEzsW78Psk~%*?Q#i+~K9dCJ+S{WaCWR7uKOOz<KrD80*F=W{NRxr*PVEp-Hmo?;ko
za>6h>&`?5iN*8cZdY)0#ssDU9#=tIJaM~$0sR_}Y+<IQoW`FO0W4A}lO2~~4AJK!k
zg)T1I`BTJTI#;8iqI>EzSxl_IcyD}I-NLa1nG0=`x&eWGC5@WU8HD$sCRK!M_Bh(~
zfU-4OM`u2;^_<E|2=|U+p{cG^VKkBRJC+<zT*ky}1qqZ*0a@zp`-i5-Hy(yb4+q73
zd&?mZF7T)ojv>7k$xM&|)D1Dj?w5(kJPmH!D&w#fGSHl}UVQ+`V3|vxW7PhoqPNZX
zvcuqf{5ef-&{O<(7vEGeoMYTW!Jj%YHI&1NG%rGg2$%P7(2(+9S6b+|w|hpu%z29&
zH4Z^U`dIXd%fM1O)pUzsAivvLW{?qK3{6@+GR(RG24DW`1dJpC)qZ8*8ypY~n#PyE
zz*7Ssvi8Myw#XxL|Fx;(;Nak4%ZMc&w*l4U69AC8z0eqq52KsC2#OAr6R#!LL7`;*
z!^7&04F32Rv=7qQfJ>6xU_LD7w83Em@14Axder-yINNlpyigm|Oh+<<*%)>cfq;((
z0<(Q^N<JX-PkVYkr7&+B$Oe(kXr~i}lZlYNVzTkpaf!}XI6jZh;2lsRIQ(1^j>Y+8
z+T#E?1EIKaxpig^EjLM_M#8;fW9X(&OJ-i?W0RvY5VM?xwf+nwWy{uhk{D^wfX(>y
zEsmmJ!+}-G;mLzdOiZR1fCfQb*wY;;fHlOLYWmg78#6PO98#Zzl-I~Jl#MO+27T7%
z?$6$S3dp_L^+;`HD8Phy8KQ29-0OTKFvM@!o_w+Ca^1<J$82ZQ73p7!WHFy{jdX%O
z^7WKI`nI<hC{toRX}O4MG9(gw`*zB;berGAp*5k7DC~AWa+Z${{nCu|YMf;E(p(sQ
zr{DE(RG4=;Q(?AcBxNY}_5vyf0WhID$O8HoFmt`0vG=3jAGIoaH%P`%JpkdXm~r-O
zM%O-3t8@!6S0#LNRj|uI2%AwGU2VxMrKcdDKl}%7-T(hJNN<?`_5L)xW#e$-1&9VC
z#c(saFX+=HZjbq#)PXQjE-g2?Vi24H)y=zg)Jxx|`FGy;8|S#(iD@rm&&P72Wgt}Y
zKbe$Q{<XC)Pmoj9vXku?jX<@}H=<Y7=YH2M9w%HK2_`l37>PaSWNrU-RhHGSI>;00
zAZOw324nSh;eC!Q7ube*U88SNJ~xcRMy^vcJkL2Vj|yG4WXJ&j>PNelvm{4h(c7EX
z+KpE48wE0iZq{DoV1=nz5dWFDh)YZQU0NN@jLvY?x=#X%O<sJ2A|r+%T4j_v8IHD*
zV9R4X?V9{ngYS5o?@0t|5mX!1OE=rt#+YcaL~kyB1yt)qS6twu<a5mGIi>&EbNX5~
zeul{ecgTG2?$l#DT^zaOFuP3eUH*wu#8CLr^x1KgU!8ce(G{N`!RduW8<z0IGXq1)
z?2;Us2+Qfrcas6(=Lcns<z9}R4*@mV|B-PlHljF8o{I1p;5m{q(_e|hrZ=~~lXM0U
za1i<b+~qK|)E&JGrV8j(0Yx;cqHp%ZGUK0cuOW$bl)a`!z^p@)MNH8^T2pF-hsV@7
zuJ$$-t8x2MWNd_OPetIcU(5`ey89Iee?CRHsJ1*T{3BQM8wuN(CNcv%m(w4l&!l8)
zv=}+?w0PwmLKTI0L2u+om=fqkmtVD&E5`R=NSGeh=;vD6ptRSA-*b#?5~H5?jcvUt
z*Z<j#eAgGZY2)E}Wb9FH7Q95Fn*$YufP36AIZkK&11efe%k@@XBW2S4T!WEJ`{ep?
z`McVIszxqBWUiS3_vfYWZ+;r5V6`uP>hB9Upf`Q-qMS`r->23Y<j;S$thtr*+%0>w
zfAf~<X$<E))xS_XLG|ZB2odeuKgv`L;u8Mt(|kPZ%I#s(aBG;dM034xutvMQFqPa=
zs?}F-&cZP_wg?mY%Hij$cZ_(l<V#t5e>cp9Lso5Mhmx-S=9!5bL9#xQ-MEm0SVT?B
z^dw5>x{;8YTEgv#pO&hK=5~v9A3LI_*EQr&&VizuFlN@-S;+vX{N`E*yua)P=pBKq
zj!qMt5w}sl@FLESh=>R^PSg)i=Y#A(=!*$a=IU@>wXp&xgXT;Bm5n5Jd~Yxxt62PX
z0%HF;)+dW~7nDL%Q?je<d)8%}TlZ6hp?<CXs*a?nC!y_pr>%?-ThxGR?0wqqA}VD7
zu;Q|rHpw|lvS>9bB0zX$@{F^B3`kX_w>N9?Bf23`u$dMiT7X#B2sc}Vo3pUBxyb}n
z=R|{XU%PdV89?r~pb~*W(*;P41hv+)J@mKxOflX-%H@sgp_X>DYx=&^*)N}jZ75rZ
z?!GJ}(J2>3qLR*In`UZmUVMxAnkU<+$IRI4#n&ASzSU31)0MM2R_#d_oB5Yp8KjF2
zId)6Vq)~&4F-}iQ7f);4QN*OAC1Q)Lx^;a(F-JDkITiVy7m%|8wj%nkJU{-?a>g;Y
zIrd2R;nOT<U)&YwnLHTQ0{-g@Q(gVuTPLy}Gry74SwJ=wL>#Vxxg5+`u?d;4yN_sj
zKPYKN<vC>w{#mHCp60)3-AdBUwVo|k0TG_Dw>_vNvFW3=mVAvCefA6RN)Etp^FG|s
z;NkrB|IJ1QTp0c{p)>ki%ft1z!)8PoaiHzJ@)pg%lacC46V7~*Xf1r7`#1yIA3D8d
z_@S@v<E{oMym7Z={o9?hOKr|VZ$Gvj*v9~H4wUF+^i{d}2FoD%+imMbMwNO8;Bx7C
zfU!5;TJY0yQG>VYTAN?{4I<K8{D8`)m+QR+nI7fP??-|s5s9q2JbQFkF!Nz)|2keu
z#Ib!OL06l2c9Be)uz0M!;*I0mvW(YKt#)l~NimhGJrTq%OCpJlyC*yBl3|f7vk6(8
z;(FJ>H!tPh?8%8M_pEDseDvbZF|v99;xlR)+wQ`$aImNSp{2yEJJzy~Fko}Xl{k5x
z>yr8<Vi0nXVF3Ho=*{EMd6q`$QpU8#DyW(F2ngD0X3&4z#?y3Pk=05?Q#ecsX?J*C
zL<v5#mg&@r><cV6_}%!1vlz4}K>?z1v{1X-!C-C0(8eHfPBCVO$co4t@9xiDL#U7r
z0}Ngp3;yZrx%Y&ZNeAW4;uy-Q_m!xBU<A=s3u|B|ChudY$dQzGgHea_o%+_<c7*=x
zme8fsito9=ZR6_V+l9b|0iR!hd{+aa`;efVdXIDY@*iSVv+W4W5v40m{jQ2#uf#ux
z^CeKp7CSNC8{*0Q0jMF9E8X*Jl6}sh6$S{;|2!LQR*20HMa$sc-!`h~rO*O-oJ22h
zjVIiz9689&hv~egOhl5v<M>xu26FXzgTg1Ju@oS^lSUSeh3-(a=Lc#vCWOFs>=%N%
zDmHUuaoE_eDMRP3R@9|Fvl9BOWVGsrJ}00MecX)GSa%dAbM;vVdAD>zGW<OsL90B4
z_*Ajku-{Vjdi4^#i$9k>d6-xQdJEW#8YxqHT+EM5l(`^0L5kfY-01BS346+88TI$2
z+5Fr2{Y~0dzB4-Acgqn$<@m{yrha_#*uAFFj!UASeP-3Tb1vEn47infWxw~LVct;i
ztU9Q~1l4HR7D5fPKgF4^rPqB0*J|3^;mrXvQz7@8T6SHuMcee+%?>lYJvTeQlrk~x
z^dpg$Psv0){y{D+gpQOylahlrax)f8#lT?M-rkq!6dZ5OU0Pt#N`#K|;i6hEBCMh=
z7H2R7Ul@#^G_d{?ZVL@+s8lMZ9JoRD%>=KV)_pxmEw$w|Yjf>{)4q)h8J<fN{gdK*
zCfWhi#PWi_hGh^(z%QVZgCT6jpw)9;iRPs0FXRt`W173jk{-xSBj+C{MvG2vkn`ge
zI3G!xNo1MZa)M^MLLprMEtuwW5%ov7l!)vAZ49k9m=#s5Cb&~(qy`q$!TnGagL7YY
zFy5%s_NX<B&8UDK%i*Ad_S;HrG`=)y?ltXjk@rN&d8G))?I0()N(<5v#a<IX=A<p`
z!>?YFTjqITWRNJ*M2@%VMyZ;BHj=9vhUq^Ql*mISC@82qjH_KN`n~iPqA>J5<|m=p
zf*2nH`~p^4xzPc@?rqP#J--;`0(x*hNPd3>$W)20?%-~CCyN(l_|d7n+}W?$XHS7w
zp!$X*8`RC)y9KU```w@i-wq(*x8m@a3;O7zhEU!?kKEH88Z8XVsYkhA40(2TIHQ`A
zU+A`a)&dAX>A1K!HR+jp<nGZkK0<<?Pliz)XYL<YDNA?sv`0HzDGX<;C>J>}(NEY3
zGHNhpRad#1*cWlP^{Y+4k|amtm(wmD07j!Z7H3d-K!x|jqqfwX@9p^(6VJw($JcgY
zCwdMM^C2RcZq1J#o|3xuLcDwQe6BsMk<CkYkieRZS^57Eul}#M<XVg7Ki%UOzD2_b
zz<V>mNgX_E{Y3xW;NR~^Q+)2nr&2U*oNw0H?6Ka@W9(vYj0|cl+yco2oOc;G6h_C%
zkG&o*XH93z$=#c0<bIR#ylX*<i%$>X^P+iK#iR;wGu63XRny&>4_4>N1&?i1$to#T
zz7<<hj;&RThey61EKe7t5v0G@(q}5AN03cXZnNNa_)UKk+MkDC_gJH$QUbW<Wg<^e
zS~Lw`-Cxu9U)kzTpJloz6mXry1CE|!@BOJVphEutQ1;eARrc%t@LG#*q#HyKkd%-P
z=}zfdNT)Q?3lI_M?vU<oiAATRbcoVOck|vpd+%qTv(GudnfFg-bR37d?(cPda$2*y
z%&=CAv-arQfF`4+uMco4W|dg$oI4grT^>k?!@)nRJG@nBGYjzuN&H)$|JwRpm|04j
zo5LZ=BPS=9DCwi%syTb~W|NqBQOrhaHWuX1flj*fUS#g$*29@RmeVWlvNvxFV$@a<
z|E+oq?Bz;|fDkf?5l;jzaUWkWCO!hKiAz-ieqY$*7~%E%;5)tNEud*o<Oakbo!cLv
zI-HV(oHf%87GI*%Fh@gM`teW;%F7{v*Ih8bVwmqsPJY9K>4M*7!jG^4Br5@`YU67M
zV#Sc*Jfja;ODlrXzi97c5CkbZa4|2CFez|2_ym?ze3mGJQk1b_8>GxQ!`YQb{n&lp
z2M0taI3v#xvEc{iXiKnn?_JyP*q`g9iiaI9YS5#?*1l%!exio+<)obcBol&8`^llG
zc<>s;>GNWDvr8l1t{z~_{)&VJ1l@%yCb9EhOL3x945+}J=Ba((9ct>|`3RZ$zD@LL
zU(K#NoYU<rL<DrLkABx~2L{&%wT&Bb-sEy^j(mtNjvI3rDTdh<UQdygGtiNr6JVi0
zTR_Yn&~=R0Jz=Bphh*lP#DY8prpMK1W}iQxDOs8k4;OrJZF-orPP7f>af8G80n3fs
z#?zE$0V(v)Kcl@rnn3eu4`=Tb#r8bW2kfQ_uqG>?qg~}!fgj$F4s}tFd0(uSvR1?Z
zRI84mK^0x6iFlc(r{|or(>LcKbN{Y*#HVPAlS~Ovx-WwX%-TbhFjZYZ-|_b8_%4t%
zJra>!jX$^k@{1f+1g8jZA02EkqF+R0W!n;*B6KN@ZGh8YZbHf1KG`RNXz%tke5e}j
zXqTiH(Z3v}e7B!3e>@z-v^Dtcb73w8IGi83@+Hw)g>i=w_{;fGzebjb@2VF$tKWFY
zD%+a5g@x=B=$4JuyJma+YF5hCmT&_E&<QdM3V0h!{h$`H6zvj^n_f{qIq|e*uV$El
zZrBM;6~AjkkHi0<n10b|A7DfZXx=oerA`N*I`&6WCd`n<Z|o(b+`5d~_18lU$`LB{
zoAt&t?YdpC5V?^1H?CSD`8kw<ASH+u+63noppKMZ@i|qx6<Iw8{69>>8D6y=kqV5-
zX%%Z%EF)2FBf-_nx3!rrmco@>yrXIT;hkO=miO(xxA6)bx7<A#iXT$u6ZiReeMOH9
z#=^WCEPt9>Pvl712xS_3@7Fuu?l&@{n5~?)%6!D8d~xSRa!%1BJsQ}2brX{L62)n2
zd~@#qUjJ%K{~_YG^q?Hs{=>2u>wxcHEz8NPwhN9L5CW!Oxz|dK9q|yrxN%HjKIUe!
zJ+cVwR|(H41+#V^lfmX==TcnPfA=D0fBt)J4SIXIzePaw0@UXgx3==+b+QXvuf{&&
zfl&+t%QHYIAqaMwLbPx;NIWS_JjAC~N$X%F_6zT;MC|jRe6lY*@U9%7z{s(UBfD>0
zh}|@rOXJJgOQ8Mi(@W}?n|AUs{R|FqL8M49GvR#C46)`MB}59?{dDu_wT^dSr^)M;
z$s9J2<i6vcl>v;Rk#1uEKg%vg$=hZ99dYk~%cCu;TP_6LPidW;Xh_rMkjC0P*nDEO
z=1AK3Oq0rn;_2*6F<Tnf=|%)=$VTJ3P-p~(8i%8#ThrIKc6~)uzgX?lJ}7|F12SF?
z9vv*C(X+SLY7yP}sp?Im#rhknDs*;V2h($!9Ej*P2<tx_ChErrv3_X>f=!H4cx)5z
zj;{Hx&sO^IFjV!L&mkvoI5>Vn%X#}RA&#=RBu6zHnBgwpy`_W0WORz+HwfW`d`PxP
zG6rY4_;wDjL-%BdV)NpK;DI^{WenTm7)P5_`|6zN8?{KcX4A?|U5VBtS60zCp8^XH
zivaITOjcS2Ou8i#Z%9#2PA&Ucz!YH0dO;F<^j22(6PDs6X)@f=&#xUg#jfAb{FDJE
zm#+EAr#uagPR)kLyVEgxR#v6yC+HUB4O`OoO;3cTX$n3vp~X65p+QdsE?a~bal6*t
z9LgB3l;;wo0UE&ey+%I^^ID+30#LdKQtztN5()2bZ&kKR_C-ai&9rwD?W=R%yemIe
zm`F6P?0RrbTE-4p-TamY{@5-V&~_(}e?BhV-h5>f4S^NsQzUudfuMbL>0yRjBx9m*
z9AAlPJ={8A+S~Oi`CT^uI<TCr=4<F-)9;re-c!MXIO@@`vDIA8yM)UFEH}rNnpQA~
z+1~sXANaGlqfY`^3Y(n`^4b)(8S`4krWrHv$<9d`gn{sG)6Fh-vK4x(VXsko78XVD
z`uE*GHj8H1rSAKvqm^~H-EXaBZUPWQF6>hieWSI^wJJx&4AD!L5w-qR0M_b+`et}v
zY`qUJ@4r8rQklM*xcW@IInq^4q7v2Zw}je#`ZD)00nq-X@V?7*p0?-!BC>|sE?1a=
zw2BwVTT;Y3)u#PJV6o2d!3a|>UXfA97wzC_Fj7{=7RILi=l>0+`cpv&ux>{GJmOj}
zEF}L@m}C<;wySvH#m4{3+AFR&wZUEp2aszNl;D9s(Fd0~e^Gyag4gVgnHF7tF$I58
z8~A?w`#SLHxE;Au&V`t($7emG59XhIDWdb>A?3T#Ku)#CnnCu4nElA=LyJz6C??-o
z=-4X-*P^J_adxW6W-GCU1XT{W_<0Vjv~3zgl(pd7Lap!^S__ld+yXv2n|OyrO7KZn
zJmpFE=Wg{6$*#BOrx($E^$2<PLAV=a6bQsn_P*C&avjlc2y)8Vm((SKTIncM9ZS7B
z)t_x!p_Y^ITdYIu9^6BGzMj#*)TuqMzce_{BTc|uSY?byT_#c`oNr;lvBB3wZ~c}*
zYX`6}2jrz-+tsVou;20_n>;<ltDJ@jXs$Emgp5jWgJNot9-K166EHtrtsQy{31+=Z
zI0CU>%goA(jl#fSL1!XCoUK9IABT829jc@pP}m*t8y-5on9+Yw*&NBFH&&rQ30du%
zMD&dxMYTcb{7#|wW-a+cbUhcxn6<#?Rw3ID3ZxXm!=Ua!>^!^G#$hvK=XSgKG$z1F
zL8v%r=499`Y&zDGf#R|er0Y%3R1Vtgahy2Ed4l63)ieLX{Hi3ewT!^+wx_3uF#}b`
z;YYh68LtCo+wl734}a~*qCW&yAO#u&UgWo)*(==V`BP;d+0j7w1#}d0xUs=v^d`!I
zaX`uCpRB(Zpt#i+hM{PLE)+yvQF~(%_dH@H0U8aO3puQ(>(vgWuN4LMygXZIRO?KI
z7oDb@&fX*Xc-m#?;}$t60Ea>oY9#zq=PNSIY13-fFYmhgS!B~hHI?ng43f8o5=!GG
zSe8B5w`Y{Z!C^J=i3FwX{PX-AG0)e1=!~af?>P=wTa;ZCM-x_=!L~M(08(<Y(Ckte
zPV!QGdr1+uek)jbd`6;|E?aRsalhFTQ<%6fuMemb)~*s76Lj6C`OvBBs!!!Yd7fHB
zxmF!%-&8$1skY}%7Q1020k`WHA_=?aqwYh;#@3?Y3~*ZU2TTI^0^Yx00b!4tzC{fE
zCT&J4eY2-)FAsTy8%D#tD~K;y1S}iY?(M)o5=R9@79As7x0){iA8H%K1+BTix3^e;
zGRzx`)<uOR*=5qrrxh1fS*5WZl5Y(h*7ZX2zUE;?cl^|mO8wByp=!@D{O5lvMK%4q
zc9GEw77G6AwD|8<{C}`=mAU_Td;K$bc)57~Krb(m${IP81&aTraQLH|eFz4+d|=Rb
zt;BcmpeXn@gH}1k4-Bu(9R@mf(L?sSSc{UsNB7G1-vTD%H7f2}AtiL&RptRDggbo}
zUiV7+q{ebIvFg;iU<8M9Tw@H8jk&9!EJtk!&BRv63ftoj=`&&;WJXz%ret<h$J*Gu
zcSUS)NV&uTs7!O40CO`!)sb|y(I*nDbH1+|dNO?TW<E&|+UaT~!LWiWR^NDD@(gQN
zddOR&abTv+F~`ixZe>8Q;A5rhJF@4z=S8fnKi}@*^qX3mq*APHO%HNjmG0N@)~mKO
zMnxAMI56#}28UJhrW?L2%y2xTeE10zukuLXYT10am7ksA$#?P<80+$kH+jO0dd-a@
zL<yGF>-HXDAf!3st-Tl+i2A7)_TX=;FTu}#OG6FmQEbX9OC8ZoV#(@y+GN{^vEGS7
z9sj2m1<+lufBbzr*lN5rSV-N@N_}7WrLLUZ?)9t=`@>HpaqS4>h|^qV4il)Iju5JO
zZ{f;!&2p@?Tzx(F7(2z0=<rrrQ07Q{HA|7cAR;m3g<-X@gvhm9huIc_*ZCPy76=Zf
z$_pPeGVyb*dk%Dgt4Sn%;KZR4V*KFlak#<?6a+X%?y~`~krwXrpR$3UL$E2;BMS`}
zW}ZOlKyrm9HYKjTXF4*B$?!FxP@s&$1ugjEU|ByP$FBc@CA>Fcmb4NPWc9Mb$@oJ=
zFfPL_ZtC~(f)*I{2S;H;F^)<nQ@aD*IhmlO5{T#-Po%<X{JxvA-62bBfr$ndy^EjL
z`@rgvPKDm%9=WH`DZoRBkg1#~;>!kLhb=|TgoKcr9>5fLu(=6B?c<|}Yc7W9%p>4@
z?h@xyUE5^qZ5j#oMNQSJq<T?Z?bKuhs~4aXeYnbnNb`q;c^NUjwldw=Eq{ymHb0Xh
z2z!hr9VNg(ykx3SC24QZuFQ#fLuiDLW$AY->hi9ajWkD!x1goAV#8KnL#whc->ZI8
zeX3eqJPXRoTGlnENdEC4<xbaO`l4Z500d=4`N`SN7CuOlj<LpXx=WFaa=yxsaeI`!
zw!@Rpwm1BeUz><BYGJ(oPin`DM_{8U<u8%G`oi;;YKgD$=*aP_sOcjxnY&KCB8W%S
zepe=67CBr@*?hu}oCY4q>bBfk5Gr-5#eJJh0A#VLQND+rW3S9FS!`_a|3MV--J@><
zA7WgeoBCJJ{+jgwbV9xpXP}Z+<&EyYw&)n=%@#GW^)Ylr-ghhNY;Aka=a~jR-5;+m
zjDGtvRP3;Kj3iR~CBIFa{r9dOaH{%mF-<r5sN&AZi|lmmS`E6nSqZAI0z{Fm0eGuh
zOon8dNn)Uyp_oMfBLr!Bg4SCo5F4HHbhaKrXv8ZpA93YqtnZ2LSWc5P++Aq(C6p5h
zDb8i><!_MG3&(_`7tk5b@5B&}5oVSI=8y-rZ-NGNtP8H{AgF_K!QM*i8=^|(_$Fkm
zJo~Q~lNE-7NJyiZ!uoz`qQ<Z6mtg5(^zDfqOCFxWJBu&XyFdp53Qsm;V>KDO+n3QA
zS0&Uzg-h<=y4Dj*$z`K}k^_bpVka2#W*Y@><bpJ+<nfzdN{vpDkM^GbL|>wLE*mhA
zj{f>r{o>@tqVCs?Q&KcX){5u8dLI>3dd`uX6td@EBnt_cfg60u_g^s(GF~dRWQYJu
z>SW_#f-_b_Z&=bmlZR0f&Lbsz2G~kp!1Vq4C`G)5E7?VWE&K9kFv@4%J}Bq+?=OFf
z>u|hV%!;TFdR7<6&yQ0^1U4;Wl9i}8-y$6L7{(sjt1lkPpYI+<8HIl#8HV6fJ{`Mz
z>dZPY7W=Eq07-1JI!TrOwRX!Wo@yDein8c8DBgE^&6_6`yL3glD$&!)y-ya)N47-s
zcAlas$Rq$8Lt<Gp3KZ2U>VzTztu{GWF)&&HJ3u~@ix?6|QA=<MRf|FTUBiyi|Fo{S
zUt=HjJVzLi?*fl=@bP?Nu=nO@*KfOF@_?wpUvFFbh)U<S^L|xRu5q#NlMR!kS57Cf
z>Xeauh{HfX0mlMqIOjathV)8+Ce5@WSSq-JKLHH;W<k6pK(t!638P5HUk<6C;#l@`
zd*HG89t}(ilgw&QkECv$RkhDiCrXLRsl~TEliZK$h{<z{3FPO~0xvx_N9s3Qa77G(
zl;JYHdil<!4~A$tHElBy-kC0$>9v`>_2c{L_WUTBwZe;4!cpgaKJPPrE8r%dm#t;G
zeFy|T5~jNCKF#X!vp^)jNl=RbN@Q*n@MRkI-0^WU3Lk#;J=*Q&;jJK%(X8)#W5+e$
zfd)h`?MkEaR}Ejf*)MPW#=QwqMdzX%zEMQ=hf8q?fgOc0W)CN1s1tyYqT(xxAbxz*
z&AyB8FdFXLS_(c#F+l&zOv>w!zD`5k0YX4xHW~RpeS7I!|D57X_PUfzVAFOycmbO|
ze3WJSL1|fmj)3_1L{sTU$7jf&5X4Bq2drlW?lP=XCxpWrwW0WtCA@@xKf)a7>C}H8
z!9IRVrWQn&x&f0pK7(W5qPKTNPWG^l@rd?Vc_e)DeC-&Qg1~$)Pzn9d@o9peRYC4`
zWFX1dokG$-nTog`Sd8JkRK)1WLbk6vVbp{C&Wd)YyoCeZ`0lb(?#q9wDbZCIQD%oR
zyf5CspMzf!wRGT#*@9$~`;C2$gGbW&C2BY)^Q{%LQ#G=*p8Wc49+0@#&5efqPH8Bn
zdJ5nCro?RHlY(QTmXhesQb|Ew@S-DY6T;LzH~fc2;N7bF?jh2{jD+)Q%~zbrLBu?5
z2l<$M+c<jRQdu&|Yq`oz6W}0t)7drjgycONW`Noe0$V9ii;1%_RP?S<4tg$2D&o@=
zs3`+<wejBFA3FEu6A$;D|K6B>(!GAaXqqn*#{ue8CFaN9)QI8p*vAfUb4J+&s*@h(
z>G^YIXXx`3l>K7rx%bAfj_a5?W?hVJ+FNn7*D_E}r_EK~`5zx+G|coyy1V1ZuX3c}
z$k=wpxFSABR3v%H%&f3X{(%FH8E=Hn%5#uD33b^5O{FGtAC>JSoulw0r)LED?;@nj
zy+T6+H0jY)9)<HQo~}4VwP&=n@icqGUG>KS8np}t2|G(eIu~AFu%5~jEoU|p6A%;~
zb1xNFR#V=drjz%Zd#_|IdEe?(^ASU`(=isS9PNl^fWVOqj4es4q|2OqjK0n`vF$`B
zi!Q<xfU0{?+5KJ|bS#t)Qf0eMO4M6rGBF+v+ZxF_zP|@aJ(DJV?Xq&%H0m`vOnzxO
zRq&1O#S6TsvF;k*TX&#ZxrmJY1*dw8p(EHCjJs#wIqyoineLVuF2P_q8g=d(m<jNe
zkR)C0S_>tlHfO^+qa|CA&Tn{g?dZI8Wt2lV&*a)sa*N~GwT3pNG991yV#0hZQy3^1
zX54^|Tz#-2=dsCSt7TuTiK0r|q6mRiQ_1w3kyl{3to1dFNc8`7%gC)~%eSF))ffLh
z62jJDH;XyWb7~<x=Eicdk^DV)LHF|GM!aIu4}iodx<k8P@%Z6830TeCMvqC^|76~D
zhASjFR3L2Cnhz7D2)LDuKW)-)bhtXZVt>D97Uu8R(|r6B(q?7x?*B|3fHVCQP1j&6
zNBc+l^@~E-Ig$Ftg4TG6k4Jl!84stJBhuTH7rC&szlJsVwFDgt-S<o-KzdcC(_m2G
zbD3ah2}o7{9$3Cdg1=Q%cVB;ugpUS7;Fo!f)Y)bxk#!Lmi71t2><^A8kztt8&nE(i
z#D+v~c96@&ps+}xnXNf}MULIM$TS3bO^q&3e#SYZhZ1*00v>|!wwhnP*zFn4G__(>
z4_38hqU+B9j<&}2U}^s2E=iIq`7#FzHboJvG3{NuZbjf%rVPm+o?DdH*IOyS)U;SU
zE<$4-W_#o!X!v#o(BBJg6nQb$sur*a({z+6AQ7Zth&6~cuhU{_cgCEnWVn3JKBt5C
zBRKQ`pBiPDD>5R*$16nA&XM`x)2bIjd6<sW(Hh|{IwC1?G#LVJi3iJHnX4S`u8y6D
zAD8Lc*jjO6%YL4BgJ8~^K9c4VEHQ!SC7*0RN(qS#(nJDq925z0Eq%cR8mVLzS9Kbh
z$Kp0(aPHniNb(zd&iQ(VJLTxN-(UbUr>XZX^5;hCnT)k`iC~b8krrpc!Be1k9jJY*
zqWdW)o`d)bjTH}@AzqfT7WlZMtAAfLla~J2!pq0n6+_nWeTq(2aWy9T`A;<<E2x{p
zPy^VP?1GA7V7fc<iX7@e1>xP*sMUDm>m*AWa&BXeQ7(`KiZn4+u#y8yI>zk@884A<
z+3yr;-oBsdVPP2a@)5nSD6-ZP<HyZsrjS3(hpbg)MSe5I$|)!;Wd6j3D0aZwxJ3Je
z$LYrxm8VPI^?rN(B4o&$AxPVpdtpsBD~{4yQLbmT&be{rg^;4PUu2AiXcj+Q#)QQi
zp<M+@hF+m9@7h{flFVmz_)n^PyohW@#DQ{!nerOPpW^jIcEkKVzyYZw@pVMTwy;xM
zyz(M7n|iCOOP~#4=xW%{-wGe19C$`}8?9B(1n~n|Pk))0T%i>}Pb4}^<5|tB{$|gd
z0Ndgd*k*I&H=jE9@UdH!sC*Z<hMzn{eVg}jSy`2<Zjfe*FzR?3)$&8EhS}pYp(~w<
zwW9?uADRHRk&%pZk7c(cFFQ5Sz^m3vv>pxOF8BvOe*YF;d=^W#^eMMlLxwm86)n?S
zq>o_?+3)@zk)C}1|4dT8Gc@Jm`s4Ma04DN@Q>=C3zmTRsA#&{bFb2ghyECQl#`u}6
zvu=o#zy6{SM#Y3T{(ALEyMPVttGk?qRv&+AvE1-~S$H*y|JDN)I_E2ubu<CUQ*<2m
z`v%z?_cA8`Lp_DNR-ru2HfS*+gjYS#CC{&!$wT)b$}Yb((*LFxte~g`3cmBd7)4MX
z+THC&X<&CtGBOA6NFnwhU*PGt_Y_qJeKLIAI~U4oW2b{>`<9nzkFs|~?Fr%zW!|j$
zyixmUdJ5NwI)OGEe0YC6db{F&(ERAVwQRDP!ZjX^UJwKIXB`WY=yZ${tHVYRoRc@b
zPcl|#YitwHpt^$=8#s0bL(VX^H_@!H822l_9@Gqcf!SDMlF^}1`c%D62lBU*f-#5&
zz{@oo4H^QB+Z5Nj-iL>l1<{47dv*~kf|k}_Mhpv}M<?RCO(i<$b**{a5E6?#%_Ivl
zrDmynOzYVEY?^k-hvwn|-C<SO5c<6eREj6VQN3oJNNb?2QYpccd3eJr0#%V)j~1wH
z7!Tsi_V=H!9dl4GgI(xu88i9|@+l~<d=1UxT>kX3Rz`Bw#!Dw2iWG!}+kiSSomZvv
zbZ3Xzd_I*HdDd@1ZT6cOl(tE)?k9Q}+1-dG#zr@_mUWDH>8`1bw7s0NQq-A3l?*Kz
z@jC15bv${vY&>)(^BFI%wgq66gE;`zOzXFY9ZA<@N~vvCh0@tl#;f|!H>*k)QPjsU
zOUVk<f#DWVAw&{l#b(@Y05B~U+3S#Hm2eEzdEnuAD)7>gZt$tvZU9I17*8}^RepC?
zT`vlXVZfZVjIK}>X}~M6&$HXHMUY=2Gfbh`ol8)J$Z~Tq`AVz{TLgkGbLZStpW09w
z{nE5=AWtq1v+lV#$0-UU+swcSJw2>FA#Q#;037H9hg!g(%WtO%bQn}bGpXurrV{}r
z9vO+^wNpQ(r5ML==j|^jrJ_%KkI26n3eJYb6hFJZ3xEfxf>VUS?Rae|+kJIw&=o86
z_X@(EDhA$}ujo$NrQ3=2z%!xFyVYTdD<OVMK?luSREr+#Df+;@-&E(8jq^Kza#P%R
z?<c+`yNAD(ir@)_)obbsUH#pOSm&D>8SM%K>+`+y#ucyOnPvcLnrw11Ew%i1)VUSx
zdxLO|x140ViSDSBXTPA~zFS;4ByziFI>tZ?{u=pACNf^|psAY{&y+Z;=$U{spxZ7x
z1Y#xLnig2jB;+BsHO|on192v*G>o_esOX4Dfsoe$|K&%&ddNek5-8BWKECrGf2b%G
zQau*aAnCzFR8I_BE!iRULi*3Yg{K)H>4Veni!SDvbC9|^>s}0d8xY%J5iE^T5&as4
zXZBO0TfVeS?3tCJ{%)Q%fqZb=3xrMqrPWFG6#~_{2wvozci46`pfXAha>5DQVMna1
z;V(2*FFhqYco_L0ij(a+0iDD=frt5zX{?2qe9N@qeL*ha#@Vp-ftYv9*{_!1P0JoX
z4B1*8KXqF1uDp*6C+AgeIeeq=;N~TRkYUeq7pihqxkk8~zG;=W%CCTt*TfBZ)0b**
z6IqQMgJD|`#OP-UH3*Y-Gqaa-yS6()Z$1q^j;(cJ;9rFyV17p!@CJ^fjkAD4xvb2u
z^3q<P!JR0Z1jCyCHqYw0@th=~ZrJ^rxi&C3`fpN_aElg6<`emiuhz`@*^<5%ZH`^A
z2}abiaieBPJr^<YK+xf6-1YFYagJ5XREYO<?u5>4n!LCfI1ppDBL1WXFG$*B-kdn&
zEn*9jBjOCw!afjlP=4JLif;}izlgt?0@CqF&ITlZ1wc_~14t?3&5TWO2JrX@Ic7{0
z#1t05h$?BXzV&sZtg5b#0i&e_fl&@AY3jpj!?&UtOjpUD*oS>a=RrT#L*O``SOlB4
zM8R6^lu=$Q5Tch?sPeUg&%CHZ_?QYirkUpkuV95@d4w$}>fCzFo(o*WAl1#8Qf(Ck
z_s~845?rBs1qB7#MY*k^E4tY*&-d+;zArRIs}0rF%T!Dw49cFAk%pYxth5G$TSKV*
znxty%D~>K!d@t48LK6+_9v}sr$n7qxSzDwS<rCqaRhwBpC!r(BFQ07^+k>FszG^8d
z@-pUVHaK&r(8aw-*L-F1<?%d9_>Sdn)ebJZC-*O!5;jm-P>bXil6)aH^>)92Q(yaH
zFGI%#@L%9EKW<n1_^>ClR~6NSjJJhp5XlBRxx%7T^1c&O*i%zBu4sPbTOV$P?Sy{X
zA4>poC5Ec|scc(vm`s=6uSJ{yB-mo|94)OgAaQ1S`|6e4)#=q*)Z*NdG2Zzw@}}MU
z|7C>!IZ><H%&XK(h%{H)3Z$6-n6nZlT+iEf8{c~Ejf2!MB1D>|q1ca+|84&M{N)dC
zXrBD&cFKa_rbp{P=c_klRyE2|J(3?RiJ_BtOa>ZS&19EH%;tFtBh5fN;`ex@I%9-H
zPf5n(g`~V@{K=J`Sd2qw<W)JAlDnLcQM}`!C*e|5sydG`@~-KP{j3R{QQzXHltuM#
za7ds~N*H++Ioz-q@=l{bIY$3on`U1mC4&+HCWX)y1nHN+uzlkXHlWX<c$7)=Ks2}Z
z%s~S2dyx||+@r?H1te)y)hf2R6QhqC>PM!nRH?*}ArmY9F`|Ym-+WCVHa_twzCTO+
z?T=)ZcM+NF{nU@z2xl#>J2tD!zL(3)g;?9{Z63>-yXLbAry&L`N^wMkzJ+eFc7{R8
z#syL0rO03eMB5&9O3R5|T2fx`dPs^I4&hB5&)aW9gt*8wZ{VlPPQ&ZLm5H)3(nine
z=?h<A8pzZ~iut5vj=$5__;Sj~Hj*&;3xYrc_75NqV5W>rFINi;Mf^IYEJzv;kcf)c
zKy$Y#=p~H3ssJG|eb9xE8+~aYv#UZP*`S{~e#&Dgo{3147!>DsB`K+Oi6%(5@RhYu
zsX0o`a6f71h64w$q1Z(>zUC7v(vQ>AXR3t@Wd%<P1KhxYZ4uq=4q<+CDq4?6)rwns
zWn=giV98MQk<PmS@hIU767TlBf`aXKmg=@*1U=zbq-c*zS?i3F2ezvMCQ(80W#07w
z41>Po9{2KxA2TryrOoLg&@)0nXK(*di)?LOjJzi;HcK#wn5Z>CA{aghjz$;57#Y&}
z9zi9%khxeE#BlLZ2E$z#9J-^B>D9R7TeXGeYqe(EuLoL@-lVkN@VxoS1v=1B5vGT4
z(}B!rba!|9-;Yf7cZ!^@LXGBf!yC4D_KyNMM-RA8-Hn%IKn6ab^?N|#Yu@{raHdc#
zS9%i2PO9CxU&3CiJ`m#d>0s5XlLg))E(EWXe*Ud=)0p`b9Ndd4lkRn(@2>G!(0$Je
z-u8Pa(^)ih;15l@*aSwE9*q8vC+P1Vt4#kfLGSyGwm822d87geKl!{-HAi9gm^G-Q
z0d;C7a=T*w=Oad!2MN8Rio7L&t$tYI>@40l3^>7y;7;j~*PBs^Q-~aj@v2wPbIRb}
zS;#5K6B{9e?uu2llZ$<TvU0tN=0&-4d^+>e{mH7<&nB#FD2jh5-Uv?>b3~oJ5P?D2
zgoE+DMX15WUX*ip#AAHh#lkQ$%hZWb@R&S7q@vcg!^AJClSBU>%+&sOp<oz-il7p<
z$Q88t@Zpx{^O3BzYH7=ow->|CB9p#4EK2T*GAqY3TkxL2Q_8%CwoylGGihL<i<4>G
z$GT2gzlc+SohP9<#@lvQR%>}O&tcy+tVLf>So3pf{^0G8%6O9~pQpt<zX6m3b9y^P
zg|SLV2c&!0@|%r+V?8b}NgCB*sw5b*?F?O)+qA6J)x^U(F<(u|DKIa!h*7oRCCU4P
zA@LMGQI#)~$x|^GpaL%tF`KR-OOy|Xao?CBd2L*5>{F(ldRj6WdHkztad~u}x3%J(
z@DO+-C|)cMo4*3+TmULrOeef*YiqF-=@yvazefcRS@`++k&PkVIcWDnHa0>Ap{VQC
zN`fH_VBSH&9yA!*2YGJIK4iXS(<oug1J|t9j@KCrN$0tuo_j8Qbn^PtNiQkK^H?wD
z@+4QzFW^nV!BQ3&S#f8crVmU@SkMt2x$xKi!Ce|W&g>27ghm-cp0Uz18BDgb(iaFD
zK*?;qY}IxcbvS}pxYC`OM>A0c<r*jT$?-#6<3Lw@X?cTSBR=is3UJ7s3^7+GXJ{z%
z)3><qO?+AzNs;v5`-S4J%jJUz?G>G&YO@Z?Dmw;*+$QiBzOq+CB2VSneUlN6m}jxq
zCO@wGT1mWR@#$<IOR>Fkv~Q&{wvx!&nJNUnn9CNoffoSJ6N`*RrbE5J!G7Zs?QxXs
z6yThK@17iY`<e<%w(hd$YHoOVYRm6C+ii?+c5kl#zp?<7BwgV~crN>ZZ9TyhWidR$
z9~%*2@+%vx^^Xe7?p>8~KZQ#;xC;)49bGL{8jBWdS7y$?^;vu-z<##@ue8kao$<jD
ztE$xFL;25L?VsZX?bn2hHlc|fMSkrwvH0@_1v2B_e<~_5(mJSUwt5W;EG@CxCjQSI
zQC1NN?^u}Pk_prq+H4u9z1RjphY%5NS4#tqF8VFX1#z1K2Dz{@%$;#=4Q{P+Fgyme
z^Tq-6#QOY`6zV1x#5)d7g()8{hi9^1Hj)iRU0}Rop0Mhi&Y1`hmgm5%dF?gPZmTe~
zKBH|hh+#UsKG9FbJBMxMR3eS+cUIlMj(P8StLJ7jJejYs5hFvbQMHc{G!-fO@Sb1U
z|046%ADHF4B5RVM%5Rzw*GhJ4(7^A)qFZEi>B@3BR|mzkqWTeX>?FprAvn`;c=wA?
z<+3+85xp<yr>D&9JzIp%Ho2Q06Asr0x^a@0FBkNs!`~ZKbUX+Ib1@8yJ~-vxoi~|c
zp&rZ>2N|43rL7M~t;B4FxW=)4vz2aj5p`ujE*(Ej-w5Wkew_)KNBy9|J&oe_*{YhJ
zjPUA|iFqSsjL15EO}1yo2A!a=U^a1`8!4hO_e}wZ-OmL=WGP4`<USVmL{3urPgb#%
zEfNgT9Wj;8<^>s0mD4FE4V7Jpg*~H$(BshUIMS=;mWvXmZg1HaKLhJj7&K4P7Q8K$
zi+hed<0Wk08YPht{yK#^UM5FVX2?fTOk;1HY9Ows*<efG@RG&R>h<d{)BSealiIUe
zs>Kz8=VzBrq(K)zMNq)C9rAg=D*%v4ic=O+tEs8A8_lOjM<_MEQt#wnz{aWy!lBPc
zzuhH$WZA9Cw7<31@9UY3{Y6`>-4OtupSST|g-@B!l<7{^m@BkVS<TLgg{cc8q%PFk
z$bB~iY2Uf%OoR0no@ma_V(@t%EH$41Kt9v9(6a`Hxo2XXbuNNpjeA%(U!^PfQ#oYt
z_S>lU<-R*{i0*>ImvMFjpwyo0Pr~#RGmBc_+jA$L6G`1$T~zsz{1)cszy$?lb(waw
zM8!{qaBWz9V7C&ZS}st|uyGU;8IK&8z8YF_|54nHt;fl>7Kego83phepPyfte|A`I
z*}1p*AhqNGSVPWsrutXS8!fTU13a%fPY-&Djq8pfxO?cqF8|lv<Zgg;7nBA<JZ!S1
zupk1ahOP<nfb2`ST()HBG7$(u)K(iGXZ_EcD>@sU?w2>;fd(iL-*pPH(H(?DAkEA+
zqES+*dSPQMqr6;L{9RTlwgHPPU-KSQj#F0k2O8}2c@VTt&*2^JTpHp<_FKu<nn=AY
zPM?jsM;CbR3<>f!4A9V#IZg#It+MiMKW~gRMkH-gUcSk`@RFzZx6f<^`Y+KD{aCiL
zJSx7IXlnSq;XBJuGD`H2X|v>54rR!sVaRZ;5xQQFI~m~`leMYGBNfSRqiDC4kW*2E
zPZ>sLrbN1P-&UiHRccd|YCnR2Wk=zRG4>5pc_!QGEZtyAV?^vyj@k8=67S%ES}u3$
zjx$ogyJ$e+G^h!1Q~p9Hvh%)|B9rwlGNi{#sGdh1I74xk^-02u(+M`!$F88h@sMkD
zgvV?S4h2=F;wVWaqXcc1DE}JO_LLOzjE~~Oa)YsnYKyeQ+Pk%sW<!K{tONQLN2al^
zdvg;sS~PMX83gllOiVP~g)&{PAeR7M$`7trvp?lR*uY$rGd)xdFh(X9)TyU3>@sW>
zVA^Vob@_O`K7>rWxvDScy$#^LUHxY1o$`ta?>La98$}~^b*Pl#oK+4cDqs&<F){IV
zAYvLRQwl{jD1iyNpFRCmx=?@rWs4iBy<FM;#-QWwL}4n#q^P?CNXOAZ)X8bXn@+l}
z@|Qj9_K`%1;43rbM7;l1FYd89Y9N=6adKL37|U(Fumty|Ma**QBPD7hV!Uixi>z(v
zT}WaLKbS-M@cbvrn(1skbYDp2jedxewSt*`_Nt1=br0?NFKXK#Up?L-SnPx)rZb^@
zIQPsBw(U)M`D++vzBUV4tn0*fyHX^5P)_D}{Ve`*5oFjmG&oqz*gJv-P4ax3Ry`5G
zb<a0jtkJ*sGBN74=x)k0w6wF!W4<^PR0~QgnY_JFd<H#lf4GQ?G_PGY6N(GS02$eW
z?doc$Flz|tB`vp&q7wcfyC~UtFkf3(_wL8arZT-L7nP;|3J3NAh~RVs<FB_!{QuWm
zRP|sf)iJ(2w9G@yiYj)*PQb~H^FKDdroT5m#2-SPZTtG*oIs+j%Eb8HeCKVp^Yy4U
za@mM@vz<9UjZ_P3SNRoGm?XUr+flYN%s`sztPG|@2j+Lisv`j^=OA`Orqe@bonN4<
zKi)IWojiFzahtR&W~^e&itxxK<IuFDwX={P7U&pU<8#f~{1||eulOtp8%QtYBya$7
z)e~ER{3*_p3=b?la&D{WfKNcJYMs!{b}m^*qt2IAZ0ETOEIL-*r>Y+03@H-%t%O=^
zwS$t>$ry55(yps-Gv0j3lWV7{^sRkUaX)71JpLMGh}1HZDap_;pTZIT;CwM}sn0zI
zgu%#MEP5CVU&M@33J#b>y!SaCSJ<fOCLbuiPfdOIL<tO*N@Us-w9u-^4&DjO5)g6g
zMGuY4td`GwaIG#IiW2((3L0cWr!JU%0~f$sp7B|Zq<TS6#Hv$k&^cm*tc&NF;0dOH
zJQGO&`nDH6h&14103{`vd5Kt@ShQI98G^yOV|2o+xtwssZP}di?!0ihF63EkDL=ra
zfbPl8wdy=;=)nWW7o0KLZ;IGeTa5q8x@Xex=Cb0_L<sL8c8LL|WEWGi^Rc&=4yo-p
z$P)<U`Q84h5kEk;bntg&he`JHHAog!F|HTDP}Sk6+63>ckv03LPYC^Do}K>oN@P6I
zImF;N!ZY6L!_TfjpW<>;ZigkwU1qx_x!hM#6#VLcwB}RTBn^iv-U|1~SeUB4M4`@o
zAXO<->{(EBLJw(G!a&3Km$N=d(E+NYrU2Mbpmu+A&ia;XzdBU94#_7U`~9^2jo$5D
ztMF;qI~kE2sU93Ln+sC&Z57uO0K}LBIr-RUpCYvMQ3*(Kf8HLLn=2TtOi7ZcPZz#U
z{c3#m+Z#PCTq*NYCs5rU^RE56ujN<LScI)z4mrx~9s;)v{>dD*pnKWtX%aa5rpy~C
zEi}$*?bO^(%&adv9YIiX)DKX0e=9s2X^D+*@s*-$4E^~3fb3rBgCAF)gF4e#b*)JL
z+SeM&ATd!~C3dyW9^a%eAh-tRauWUj1?2n33Ml>}`qSahCKWKM@&GG-`a%VPDyXW}
zU_ukAo%W5j`5~C&4;nQRkIvtsA~D~gAY7b~NN1S#J>ILHfC52!1BA&o-CYw?J87b3
z`s6+5$!LI4Tz$@f8z#E)qz}QvGA^nXC`#bQ$x5%fL2}dwno}mbB6rYqj~zT-!epgQ
zhu^0X?Z4uc7WmP72#p~f`i(&)<wcg?MM_}cAxWA0gcR}M6B&x9D#GXS0p5dzQk-{n
z*v_(1A7hDvd5(==3WR;6AXTGIQMWUyo^&Ht`$0ns4h*ByMJGVctgbT{C3&che={8a
z^{{1%miWiZJLTqIpNBW#2sqsD-QcjPJc*EtlMo4<1ZDJ^#6*I@?Ap;7hx6H?jC(<O
zEosCLW>q}F=y%Hc^uhU07{AxEYI3A)532aIiuHXP3~SaaZ;{qfnk~v+<d3!#b6i2s
zaA=l7Imn@D3W|h9V@pC9@SYNKJi*1MArXsdfae<^a0w{N2@c7n4|)sxR$)k@lgMQX
z(7fsU!g?NGY4}wOkg~Ycg89&@6h-kYX%V$cwU*%ueSO#{_tg^QeOuwec;^m5uU4W2
zzBasC{~o!Jhc$+DgCCLn;RhY`4d`2ItI!l8UptUP@(Ot$Y!eC@<{``9RjbhBQbyE5
zDv7XCRSOs!eAxz5-9e#{*YBHzgnh)clSf<tiic%?r_VU=yUh*)*pIpWQ6q3c5gpGz
zLnz!P#;Gf{-fQr|z6!LzI~{14yKsk9N#@fFusyhLkG}>I*v$PVKfWA~cbX>_tJ?le
zcAILqr$|0j9mZNwos^Mb-yYk~_WOFj@yCz^j<A_GVil?A5%CXxpN<KtuXCrUZRyp+
z6#PZ~7Ct%DXu^C|{Q>q1kY4-^;w+FqIKMjRux?9ng~x8GsoIc>&D$F=6%!4T>H{bP
zZVsYGNLIW_QqUGC)QzDT*`Rg|z!VM1+1sQO>GJc`DAfP2MJ*5_So9Bw+hZIFdkP(R
zQ}B$zk2)2fGygt(7_GMdtZ@Gg9G6x7`|v?)u@2M^Efzyst#~+WYb}%Xln?GC;AUnr
zD6P^e&YK;X6e!eXzBM+|qm{ZY&2#tSxgMs9Fgv_JzsRRon6==cFZ~D!<S4F|?SxxQ
zc%a%fZM%&$Y!cGe_Q+M5ig9clh52a}P0*~;*@H357@%BS`3!we#SfS+$ADC2_Sx-(
zw*0&%NoVcy_$_0fL0U+b^NAclRD{U-t>~q2+Nb*54Ke`azBh6!z{e}zod0G}5jy@L
zbTaTvAWFRXxCh(0$AK(@mtHQ!g+?cL;B!|RpZ(MXN*0lMW*Io;QxvEZiOm1KnqMrY
z_uJN1QTLd;^UD6g>?xF?2;O@QB6cGd-X+I2a7uHj%LZ*kYHC^<b3er?@lH;(g}as^
zzyA@gu7G7=D`#CuT@i6;g>KF%m9TF@+32iW_)Wliu$1}9@jBtj$##BhDZI)v#|yyi
z<ZPr_r#T@ZdcE#9V&8YW>X}_}lJvf7<{Uw!`y?Xak#srVlz{?++^JWIfR%<+M@~Om
zE`*4(<c#YcL{a^kym6QZ`h3tt9z~o9Av!PpwAJ&}&cLn#*hX^3Cx4hIjt+Xwi9{{r
zvhRamE)$CiHVyI}KY;F2vn-yqJel)Cr>G_TrXp;LV$7es2(a?jPs{=&L%(A*De8-<
zXB%Z(Y=V1A9ny>j$$Uw2t>BpmttfiE)SJ?-CPSY_u;MW(hV<qs>N4H)fP^BQ4(SN8
z;nK?X7wqj<Ij;xi;8DVtOI$>hb6YlE#fRx~@oS}pfQwuIgZ^mUQ-Q-zPoA-~uwMVM
zej1rL(A~M~!{H<Nj6}x#N5Sis!;+^~vc_kfI45Te5RNJqw^x?-9X{92e*`uosXW7W
zJV5>k@UIe)FFs?Q%Jd80a^$=PW&N_}q_SUPKkW9ixL0(s?<Si{^d3Z^_JQt$y#{Lm
zlB<DdJ56@xET0vn1y_xn`WWr;Q_YBhE^!W#cNegFxB$Rsfds&2+q2j;BOf3<<j)Sw
zbnwT>&N?up2mN=_=x@Xhmtd}%;0VV7g4=3ZZkwzG3}F=|6YhOcb_tdCU$BBWq?2cN
zaf=1XbNKtWp-gSJhcCweIjXCd*|1oKSTzk}73Lo?9qzhait|6T0dA>_Mb42fh7j~n
zuDadW#Ha%EmLnuP$9KdXU>D{RBzyXPs+Muesva1+d@V1x>*0flymui2u?d-PRUHi@
z4ASy=(W3ASMtL4D8-h^O5o^K-c6oH!)tgw5k?`r0odtih4&)-=lFIVUsC*I3LHzL;
z#8Pba{IPYzLM}8gl*@7?T87GZiT2pYZ$5vrT%Q*Z&Bcsl2x>pmij0jCd6>%y0^DBT
zCfmF{Ja7CT<3b40*_cO@TyWk!E2Nmyvnlx9>WcUIk!hw>&D>NKC{`5VDUkVmP1wvh
zq07oz#)i|%rE=i!k{bAafBoR=VJr|&MRxaxcN!l5LQFn_n(P4pz{6h;Tc6#doXs}a
z=Sh6c*tifp01A7lp0XQ!SMsV;r%~xoujMv=&aP^OkFKK;BaQapBo!lc^D~Om#VG*E
zt}n#~{d^x)Ex<l@0)<9n^{i&{ZJ5_Wt))s3Qvj}TFG8r;Y#IM=oH{hgofx|SHaV(*
z1Rff&fPh&j>j}1(GqN<2qbuLkvl;<Jv}ie3J=$rAtNXzcKl*Hq$FnD9ZIu!kXJ14^
zy1!oi+Gpw}KA{`KcWTmk`hHXrL3#3FVSx5_vf@pr^$my2O_^?-<%CN$5~J_5ruO_P
zj6VkhR5+I6Czf;8t@0}C8(~Hr_WK0izGN}DlvHry){1&TOo@^TWyme~mApLd6SFu1
zHfds7(~k3*H0LQL-o+-sK8L3{zZJqxaTUeB9Vv~Sy9-OKLaCA`&z{vb@|3dJ7KYsc
z!QyWnSs%uuis0>jVvQql?Z-!~(!O@1bw8nYcX{DGJhw#v=jx7({d|I`9H<5nzRp_F
zCrRS$Lmrh9oJsfOWV<*D^+D{3EF<;v%=GH(j*J@P*=T3*r4TdR0~XN9JManp=Mx~^
z3k%g9>l3QdI+Vu7Zk1TAah^PU!~LHB*XgBG$HR>+!s_uCAi?1eOp=ChPM4$Pe>Ner
zX$lHdiaq*Y$=N@1MydCYZBOuwGi2}&5gS?tZ;6sGSvUWSQ=+5AP5+W*kB3?)>%UP~
zMtgFt3>fwV{s&|0XNgXyIb~cmW9->rY&|w>Y^@T#e#i`j&c7z2Yl>+?2dNSfZ^~Ia
z1q7HCr|{6{y8G(3y>Gae5n;`Zq|0|09c$7qilAj;8{lEQBB4cUEPduikh(vaS72so
zgQ!l!|1egbUGhNFmU+Ig!t$xz6xw5VCV(EU8)HO{8y+qR`6!&1DGq`{p<#Fw-!uvz
zW#J!lEz1%gF2|y$#)PylmOZGMG^--AN*?!4$2N}pv*M*A$Oo}z4VkgH#kbCOxG=x_
z?4R?l1D{#EoX;!H!>p5Ed<BE?f5dt}oWIjeYm~;`o{(e{toX`Z7RRz9hfcTKqn<B`
zgLM1i8`CeDb*BvD{N34_JLl%D{p*u~B7Sw=uK`OX@RQN~g+c$v)2h~+o8Qj+JhKA<
zD3oRsZ^73q@7J)9VDFOFqC|}r>Kt-$ZHXhsuQLq1cFdi7)vz|c`=*kkUd^v3sOyN+
z&7kYX89#p)VMv?XR~aApOV-Rl>@bfY0zF;%&1!PZail}zEPTHgsnjh31IrQd0x=RX
z4^azIavfwr2M&OI#M`d}ENjS5Ds^l7c0v4LQtL4u8m8;_b9jRA1PU(8(fADa1tw&n
zNt|tuhr4U!^oFVWe0JNxhi5G>)+{Y8$=A{C<fz}R`8gNhJjl>2qK3<phBp7C-Uo3V
z2R9rrn5y=_{tg{IJC@W<73o))UI{1V+8Ac<sJj7NY5K|{*JfY)kWY<s#W?nTFz>)6
z8=;tvWkI{?SLy+fPV^2=>@{6~-<9~Hj5iSw1uE8If;Z1?JW3WA8FflkERn3fWe&v1
zP(9sWsGmh$j$$V94+RfOP9PCPj^wvU2S!R#R8*MK?dXhTd2;#Be6I|!c;+WfD};}f
z;`Z|z3y4}9k3(P`Tob$?345s9Sh&P~xc%vkp;TN*Y3i~G-4k%zmCcoo7<s-gx0eFQ
z9VCFtC2LPAk|bepb{IRnxeleh_c@GX<Ernqpo#-=$1mTU%=S4r^$ZTp6|jspa6;dU
zndMwVNbw_5JhM^uJ(X9PfA<+I)L8=pPTRf{&ztrWHxxdLALCIXl05}D`^O=k`1vH{
zq&&ZOh*fCS8hk~5QvBzF`1igDkIaYpJL1DuDQykA?f%T{zAX5Wui`V?Kb}BZNT>DA
zO=-XlMhg8+v$>qE8lfdc%m18EfAl=Md^ve(d#t{q&es?&_|hPMV*qzYtEKCV`S3>U
z=b(5n!!SXnq8d%rgtDMQVfR>~Q{|%!(HKc7)QDA1ZfwbCcG^fzE+C$uB1V8z&biAd
zBHu&VzBne64k+oAUt2)0Hc{f2261@j!gw(VFvIc~du<7Suj=OaV;=E*7^ULI8AGEO
z`6A|6e`UKMxK)xgd@66Y+O}qHEv0eYFIo{7euf#ey7_pO+j>2-_(xC5FWb4;No<h)
z4x4T;eo(_KU%J=l=QXj}h{q37M~}twMtS8?WzLJQ)y}!nEQT$1Dcr@{8l%@P9`i0+
z0<ng<so#~E62fiN82JQpukdSGW~|z5!-ma%4!v!@3T5K7m?0Y+s$l4@Xi@jNJYdBj
zW=#Zm9F<h&bdP(tSvf#oLtyhf$0kMUkb-kveBLsvoy@*Ajmi+SKxi$TEC2Ngx~GjJ
zuWn0=js-iD>Q&>&C{AQ5Lzqh_ZfR~Q8z{+|v>p@HeR|Dz>7WuE$TR6CH=&2X7vKn_
zf0sk81reA7aKV(6I%e&#T+zFuAaEL`pgZ>f9xP_NDm{R~8mC9WA1Zx_<2tyYn9R`$
ze`_aLgyw_hDwl%^PxP{b;?uYRxVS~sr_w(Rnb%u(h;EIUSgRbeN9t2ws9j$^mc4M4
z{bdLjis?&~if@SvrctLKPA=ror|^3lb$stvbEATb2E_`uGQBHYcfSwX5!kq{`UsDM
z1eus5>1GObT`6v~`<1_kI7fgKDWlm$fGmcLIKnGQ;vBFk%8w#;Ca|7G`&^L&=m1ct
z*@$t(gpLXPX1UhMbw}8w@;#fF`N$7K#NQxE3zrf0G9mx^XICX(Gr?)1)*%;5`qV8}
zGDibmoW$OTnO28UfjX@sC>sxNCZk#gTBPdou{>|4Mt>UinZ1jFng4Ow+@1swN>Xo!
zjlr5>J!cWyZ{E(H^)vM4t!xeQiBOpv+;-j_g}fRGIHytP+ybQh^DZBRn-zh+fUk9@
z7vX=l+-tSN6sw?j@C)o`xuhtjlTlp0pV&s4TsB8y0PjNoOn}!W0`48~i`LBwU%>i4
zi&{ioDb<AiuiFh?sR{kzdzplMPM(@lj|8-Jl2<<J#eMPrkDZf{@UN}aKng6;_!m%e
zWJ`FJK#i&S*U}11EE7{oY^+u{gqDza>t1g|{P92G6!@WZ!1wQ|vFRmt88zDU^w(%y
z@BTfml5euhnpDwGwV4KzXhSGnVkvxoftuF?UCidosLw<PNn=Y^8ON8|<s_}>7aZj#
z$RY^R>HK%5#4c>~wQY9YetVHl)<pV+iP>w-x)aeS^J46MYPW^1Ibl(f@Xuet?G1EN
zM514!@;SevnWIITVn;`v(!!s3FPc&(KYDkFNy@ivH}8?<hn!ok)^vP(*gqV`-j<iW
z2x&g*dJ4cG*fE6Y#otl{wVhpN2c}d+?W-)cv<#cCH`DSG9@g&xly{>Yg)07djY0PH
zgPwJK!c&w>o9F&>^)Xf)X2l6*YSKJ59BK+F`qn8nIWRh!quD9#;YSf;y130PIW?)z
z-1ZBS6|H;f)?Zx&5qPq^4?I2hj{7&#T}Bh}BSl~D?l!?(^3fF`9N6TqMrc}rWLeZB
zn;_)#jbC3R%y&P$Tc3ZrY&M_zRu^d8sr3IUxkBENqyA=f{kv;$>-6hjM31FBRWFkO
z>9$cG5D9KFDm+8b<5km?i7ZSqTlR$F`ue(I6qJ1Sh3Y7VOO?)^GBOVncM5;M$Q$tG
zo5ES_K`#U7LfZjhin_@+7+ssN>d_z3U}_#~wpFQCc^QsK428(Xh)6aCImJ5Z>}$n}
zW%fS!b0B9zphDyOyH#!4AZ?AbIuBzP7j0XDU0$rW&&BtDJU(~?L6755t6{lw<_5Ie
zH67ow-rR*smLZL61|bK$C8tJr6DH~Q?L;2K*u(omMvh!+V+?w$Ub27)-=8qmw$4u#
zx|lO{23lWI5B+bZvfh%ttjwW}KrFk&?~~W)*hV?CT`OX}gN|N(OBP!=1i}={bgH}H
zz-h3kXS}-|l3CZw0M|a*jxrQ8Fvj2G5<xL_iT26#i!hA6F7(3<O_J?zF921KL><eX
zF?_)=ouY!K+s?q8?><MpRa`kQSiuL<7&%3)`gu4`fIZ8`o4U%QaoN4r7o7qJH@u_$
zU6l&e|3}tY#zozB?RsdWQ=}1)knWIFx>K4VL^`B9ML;?PX{15AJ48UbyQRAZ1_lQ9
zU+?FB_kQ>Di7&v1`OS4*Yn|&j&&BlhjvDkqMI{D1#P0yW;~*c(N!I|B7AfLf4=vD?
zwmNaFY{e-oQr9678@IC=5&J+OjxH7^4(AJGxETG_xV7Zi`7q)KW22n++Px+Vf-~K5
z_kOQzW39CuTiiMM$hWYQ@K}L1JkB8?cD<#^g?*zj8PQKoG87g$i1BgP(n9pL!y6QW
zjniMBj6)Otb1LVv{?mnumg}GK0aLg6Z$!G#>knTFwVPXaa#14Ckr}mB<Lic7V7Ec2
z7z1D^i=TFy=N{4j|ES+kGRMWI7Tn9!5HV}&zNIqNBQS+MbZ7wcI#a%2+$Y~9K6I1i
z-5&A}#9xk5vjWLtz>|euKft_CCf(qU+*BS6#b?s(e4&=aky<jdHGXonwLZFliY}l@
z(`4W9!w%#0CC~Q>$GLXX94*~tD~w+0rlwzd-8IkpFgRt6SQV;_SttyZ=_1MKv7QZ!
z2X0vD=c_xbw%qxY6tBosbR1xym`@Sau*G|k;a>tD<d<EUHX1#QULe(~d{SSsai8b?
zVCl?vVvNx*j9H#Px<<S)<X4^G^^+RkOkks5h2CWOUkjxQxikdj6aYIr3nQlGv?bW3
zcZ)VzikPHdY$t%V7;G_!*UOSwQ!&OYEG!2$0tB^imIDGxh@(L*Qr{*pQNdOwD;6on
zF98XC=GO=YV=^M+Q_`f{8$wlJImJ}L*oj}hUhVry$!;J(+)Kxya}$Sjyt1OsUhB;X
zxsYrjn--IS<hue);w?=YZX>$Pmr`W-quL8xV+9y3m$DJ)rBb?C72f!nMD23tCiGpo
zZz82SQ9dD4{h8ASCHx&pAk0HV{Fu<Lktg$gfpnCo$3!<o=+6R)evx>lh<?HiObU#j
zM`A*$13;0QpyI$U%IW-H{#MVKlgU3lqa?{kB{J!cZYX?>vx>58(Ox&JC@Ri8#548H
zf5VNi-FW~qhz;%l<nmXJWXQ0`PNSA7#4Pflbu=t0%JtZBrCj{-J?pv+joro7;T(^X
zpb^y9rc_Lbmzab^dR^yu=piPFSe8a3RO<V8?7($MovU>*?CN+)C)=FouN-|BM(O@F
zs9B=u25f9x2u1a)IGpO#qH{uO<fcZm+cY(SaZ=|7SI+Kwq_7)dHMvn!(7Ue$8t#X*
zlkwTir}e!l??|pI!j7;73yk_l^B<wy4^8-B;jy_59|PTM{jWAiIp9<5Zn=>c^_wS@
zSfuAbLhnPp3LMPXgi7Bpnx$;rp^*<?y?}EgLj|u7jD3zRpw+<sBt<~{Ilg`K3TBeB
zOGqZD78M}T9u>*3H(Y;sGEu!hc5@Sg4S8p`h#&oR7uAi=M&R>u=g1V$xz2NA(C@=f
zA|6EveH=`#f_zRBp{oIwLs(Urde&1d<;$)^<zL#wY{&Ou(#6|f1{>Zplnu;k3Cyp4
zMNB14y(sSRza|Pa(J||B@$`2nmS-v{lc2q)EICsD^`9!a>$>=#68reWRqz-9uXN#j
zlYofAOGgX-jywqP(cj0Are3k)N#_P(Y0rp5F#oLx{w1I7>``X@s#Tg3?(LyM7dyj4
ze-x&(onqp}dk13BJPJlkm%bF9_PCnqI#H<Xrs-lSdL6rlQ&#@V)~319`fXKFa)q~_
z9)7mVV4jTAXdV<YvP@wXKlSSm)PziaCKdcqEx8aMDba115Y`zPOMr!rm4wDrcEuki
zC%~*FcwI1|xRpjiG6?J&EugV~g>)E>D&lsa<#pN)wSdg6{h}tCY`@8kWQFbgluyK_
z+Oj;Ro-1yjDpckfzdY3eGqds8Ft#8xvVl8ZzaLFwHt&y4T&Ue;!qdyatCYdj{x!0!
zl?~dlVXm8Nc46Fag|1@U)bmPA=7!nO6~ckB{=g$I?RhpI;sN*(rnA3T9~q4xh+)|H
zHV;2QVCNM%niU>;RX=;{yytF)PX#?O+mzh!jKyH=Eh<uNmV8TA$v)pPHZG-E`it3s
z6*F!-SJ8$bGz*N1rxiw~RrFoENz9t`EG$Dbva?uDgrEsYX$~ZR`UDQn!z`Z@YY>A)
z-7Zb;%Pu;!h==oWx?5mUss-(`i)>KP(t)`Q>zw&^2ctZlA<aqPzQ$3bkIxQz&1{~H
zSDk$ILTEZ77L;<{;jC<Cn2pKLRFvI#)%GTR`j%oiP)zN*kKFND&XYQ?Rj*z7bpG;k
z@9jZt)M$c;#<%5*sI#~8^9TxV>BHDvw?KEw)$YFL=Yg<}A}IalK9B8khbHzk!wC1_
zoOoUE&GW1f9N}M}Nq;zu^rxcODixgNC8&t*vXJB2cSSJKlgf)|Jys0%%ML+|uzZdX
z-**4-GFNmCRMyo!{3YbJb;s}({h_-c53cy{q3Sot##x<FC~<ed2mh0HyXHD@Ba(!p
z0lj5U>cV+8>}Qii_Yvmke6P+RDaq0a;~f1x{WlbMO7y-RU=V02aVD_lYrf77_BDxt
zY#iO8iSFa#4X0L@co;pKT2ebTpZtUb9#6btP~gE6X0DAv?0$}d(oluycXyq5c@@cj
zZhev=#0~lV{9L*-{ScFb;-wGMJ$1J6l-!1@$b+2k#M^cp+Zyd{>^^~92~e;A?I6SF
zAD1qKKR*8ciWqU`LBFHa^lx)}{PrL9Y3Y~%wf~O_d~Ag9h*k0VviL9NB83vHsmb?C
zx)imP>3LUg+RIU4*Z(?s_x?n3ir+2D^sKA7LwjurZGQjrpxWpK^F$O%ga+$@y0>92
zLK24eMS=^to-)jf;QcDe?iXZFYB*IBO10(g3R5RL9SN<q-sA-^=%f_ZYZPcVybkcT
zr+e$qXu7heg_!CUvCW5sRkqCqnh!L&@Yc<I>oWUsKZ1-8n%~-|2o<{<O0~@R_C<<?
zjep$Zq|FOsTl9OJK|EF~?B#+-rysG^aN}N0uXJyX-L12i1|5p(lvS;AI&VC%4MR!a
z>gU{nO*Xz09pVpd9yyhO5V?fJ1mdb$I=z5oxo_>m5Ui4{4ElmnA5+unEfS)aNjgf7
zdc_kK98}&B-EJgCyi!1~!zKibF?e^+j5-jzFK5Q&F$|v)r&uBXK0tkDX*rkjJ<NzL
zuM?)Bz?<eI9coixUX(vGp3aM}d+xMEKik$;_H)&cdCEn~3nUqep~)LuW}~i5$L}!m
zb4+}Dmt9AK%LoYPHV=G>M>`RWKtQPrU}OmD8aPep`RI60_I$b!(B@mzcLM3=Aaoip
z`GuCLENO;xh%0_$*<nEB&9V`)1SZ<wB$*JnSD{fnsZ**mA-Dp*rKCqwG3V!rJRLwI
z7U5k{vbnh1o!Y($2MM=xbhNBNklg)mw^QszXqj<IxqpH*cO>bJ`Zi6(qQ2phaW&DS
zM*K#TU@}K+iUH>IV)tinKIb`oAa8Z2o<Q=M{~_yp&c)QDBcbWKY91>(e4;K(X+d@Z
z5D!niQvJmoVP@&vt}f|@=D2q|jo#h!pl;A2&_-j3HCA^B%87$@F6w&OEuwn6MG&l3
z_$_WC{iq{5&IkJYaJ!6Y<;+8bY99Vrqub7YVDeMBBYdiU;@WC>Dk`x#Uz|7bGvcWd
zdEL%1%vmi=bS~(;*?sM62xCPmi!BcFNCqf)0Sa1)3gf>S6s)K{lndb9jq<~>GfCt+
zM+>Ny4M<orQN7jY5uhc|`CiyE8zXUcVh+$Q4IdHz7%puqTE8Wf02Iw2Ur$AuRs$P%
zyAL$JCsyPo|8#v%#pE1Ay7va5ZG$w2%CWc_j`;6z1%BB*+id(Xam^At+xG<4$_+ar
zA;&+}0pvNo^JxU+Ug@LH&JIhXUqe}nk?JV5bG#7PP>c4l!?LMt)CiuKDF3mOPJG{_
z_+L2s`1OCzZLc#5<DYX&sU8Hrb=TTH@qLSj&#WG_PVaXrR4%hM2mL%-kyP_}lJbLg
zPsaZ<*!kxMFpvtOhtJ&Ak?FnvE{DXGtes?!-)b-z-dPFI)@%h<Rkd$eK+o)SZHcm0
zauc;B>gwv`K4bC`RKKnf!k&EBwW?eoog8d8STd`moN$fJ!{+Q%6MK5f^wXsbW3o5U
zgo6H!&*ENlRhi+_GWKNtXg+U-ZHewhMlpr6&p(_=uZMYW9povScNRMpDWml<#$_P0
zUY9#VyBOPkXWe0w>fIAd4z1F8uKbDA0fsb}J7bz^l~T!vV@u+fN42Pq{I;`N5Bw0b
z1^GOyx0)av0aw8g*F+*13ZjZO6T6XQa}uwFO6YH1GmbclIMa^TfuR^f`0`D1m$4!j
z#ck(127jikgA=lkdVu<5j~}W?e1<}XiiM1BTz*CsAC4d>f71lebwdIGu@5AhhREQv
zbK^C66Rfit+Yb>%q><^7hiVTIKbv+mN+F2Q&l^fUGzMv@d{<}8?SJbOoh_^~TMw@H
z4U+sU_2p`>O$rk=2U(Y1DF4YYdf6{YS{vp#GoUE500^6UZjcNCC!HF-UsVV;PUAo-
zdQW!1gIAddRq?w{KAkuUabLrAc^ds(WS^g=T?Vvs1W!nQCGz8FnT>TT`kE>Y`ih;;
zP2Vj)OBcST-o~-lh?Sv!*@Zdnwfv!9kKTN6zh@(d6^~`}!}@omk}Y|_&R4@Nv5H3J
zDe>O6ZmV`wcxc@UN^OAi(QN5XW0b<z;pQ`ZH1icXNNM^vz(I|HOmi$|5z`?Xi*PgJ
z4r9Z_<)`*Sfwg+(eTY>k)9*$1`h~=^9fgSv46=M6-A~PP@FzUaqd(#%sfShgtI3KJ
zSY+vr0dT@1jG&o}di+Uy^1dkQD<O<cU^ncqIy53n)eYQ;_KDYYNworJPXdI-GkV|>
z1_^ijUZXcXO;YIYG&cb1QOEVn5#W1f|1b^wF=I$e^sW~|rsDn&9fi|AuVCK@{d0?o
zLNQ4eg`GMTDoMRGXAge}F;x{1H9<Qb<>09C9A+k$Fx$%b^UZ#H=F4<@%dSAli?ANt
z$a?XI`A)gihs@<<=I;*4%XeLGu6^Gb8iO;$Oah6Bb{rK2=+$T6rK<>IU8ghS1+Ie`
z{BlLa2{*EChmw{a^gZ?`l|LD|*bkp?G_I9`HSR=`*XE^j?<p6)I(}pQ4=36{{SQ>?
zC~o^y1RJPe-8oV2FB@N~eE+A)B}RXrR$|S^=c)S1pGt>bI<#3k!|T7%h52)0ImOEI
zASyoeY}7|q_Cdv_CwF%W0Qb{W@B{}gMm#Q8jFE{K-SoOsbUfdo6zgb7cX4`*m+2W^
zlk^I&b!x#xux9Q=@Mh@eAFlXB$}Ab>d4{B;1feHlSq=Keq^(*fLIp?=BV=^c@NH@@
zxK5ex^3WQ4N~d_IL`D0Fuyvlg?#%PZE+P9xS0u@7{~glMi{zn#ln3R9Vtn~2Vn}+0
zdQikyy<9cUsy*Avc80ZR%I};Ggv~cUo==u)e@FiqW-I(O-Y1dhJ@RWMc@!+vd7!Y~
z7JfvGer;Gh5fu5EPT~wP^f&wMk_GCFk<-KNWCeV5(maI<<A~`-?``QOA~K0whYTyK
zR)(Op8LwHfZqfwcf+w}}>0a;Vw!Jo#pL4XeJ7#J-AKILg*e-|Ogw&n56cbk`C{JGG
z`))ulU<Rjyv9*PAUe*!Pxhjg4#0ZV;mrn&5nVm9A&+1V#l3zsbu&}1usjE&L0T3HM
z6R{IM=fsBGEM{>+Ef|T*|6+i#@JbSxB&lnBz-8hV`_1e%`^>;$ENB3TO3-;~J-w^^
zVu|qp4IX3%M77zhGfa2_iWHgR4{&ZBV%#K7PJ&p}i0;j(FGbT&kBVy5+!*eA7ck`s
z#7ncod0XKYu;rkDAh-cHAq!^@kY3c|Ky@RQ?9MyT-Yt+xPS%Fut316~pqMg9N*3J;
zL@(^H@FS>COw|97wc|pyMDw%WHQ_b6Ru)*H#}&V?0wTnxa$#m6Vh&Ts8@O{B)j^$m
zdnT-IpsPd%<%B1M4D+5=SRfTj`&3NZ^=oDiWuaP}g@uJej!n&2G5?>99_`GRwsxRT
zNOXCpzk4IuUY`ku!mUHZshYpSG4Z0FmJyn8itTJ|>5|Uf^xV%g((}IHDx@9`{jhmC
zc0fWAI1!Yza5!JMk|E@RbyAoiy5ST0FfXGsN)e?j>Qa;;^-7#4>n=oeNAcCpfbk=+
z2mWZ6VUqh$H~UZbNrvHi+7LNiYNXh=mtuK=*}!&xaH;obIU9gU^9-y3sqd|5_f9of
z+gt0i$9~aD6;Z`-q9}Mej{$h~QYsy3fm6B-oYI*ke{aa~67ahEnhtM_AOu@yFa^k(
z#e_xvD>9w@M`T)IGjbCABQmKI6)Qm=e(PzUboha~Kavm9C{%Sg8s&CJDk#jMl;89s
ze#H4Nw;!ceP|`c>x9CF!tg=BeXtQf!s!ge||9d>Mh?z8>)iu%R1XXERtFh?Op$NpQ
zkWC1ncq*+46eq^h+mpYus#_<L=lUvu_@&oYrrK}wD-WFL!O%d19ZsD}f9Eln;DTd^
zkDzP~n6%TRyVo&Lv^u}0GFplXYO7E<6;gQr>P9U9R+YZ`Fo}!Nw>?ml?f;V6_a?s1
zW=7$p`HuaSt%*T2gP?IBUl8#elLQ(kteWcTz+xz_dsi`i)*h=4>7&cuXrK^{WR6g1
z@b^PLP6`@xK!_}``A*X*LFIMCMS8V*=RC~SFW1@OLmrrtSCzeLj-5dlOzlLAXC5!J
znEA@GVt87v%mM?Gk+Dc&jy;pU)!6TLZAx{BP*sH4A{SO*!ReCz*x)NSQdWMc)ulNn
zsJFXZ==BDL@o?~`9;U_WR<(w{q176L{7_k|G~F}8ZQ<sY2lYX4-r5Dbdgc&T+H$}n
z99sr?9L3IVJSV6e_i#NY_f5v$&qV}*hqE4BZm)}XAz~4WSa$pP=KH%j%=Qa}^dMRA
z-S$w50k6Tj!l2Nz#LGT{YdseUHIN$ZH9_-?eQgRTm|VcY4h@gNpOeb3xsQKyBH3Bh
zA;e4L6i)Hmm3$h%Iyq$P_-yGIKPb6cbWC^t8{6hEko7<naQ{IMFnL6y<aopOixgS>
z#3sV{GmHc(&Lg=5Dda4CcY1WK5KZoZZ?_H6(IGbb$zuI?yn)$Wq^?Mgc?rh*chObK
zLS!GJm2nm~FeNzg*f)Q(1hP*ARQF#db)37OrEr}`0*Ku}E6)6Thon~Vq={IhOu48r
zPd2_Ef)X5HUYb%!v3lMxN0%Ngoy(4wxB(qHVehkS(8zf#*E~<)fS9=N@3iV?Yr9A0
z8lP}00z~lIPCM?>z{6p8*y>5=nBoTeu-;Riosaf7_v=SKfe+J(#V%~)6aBJ27rqm}
z0g7sZ<H=sfV6nB|k2h*2vf3u|d~-|f!@E!egl;i^pg{KL01ln!o#DRI*fQ+U{RUrl
zpahQg6Lry$MsW7I;r{@5K(_D=ng9ZNMQ-3XgTJGjn|chpd%Djf4f_8Gx)jg94iwPu
zS0=xoZt!}#T{+1yAS*Vva1;^t>Az2$ZczRKGh)BA!WPHG?Vppj8YE!;b@94HqWQIn
zG|Kk^L(^GrzQlq~8H|%jT~p3bchg^>Ao5v-_)K1Xr*hY52~w0j+Gj?tqocwvA$?H%
zopSc1Hz#C_kH>53*EXuIhHS1hx=UTXh`+S=xZLF9Gn{sz&RwSc2WUA(uPMpCqTV-1
z<)yM~#$5tn1LyqNqHV>5RY{mW(I_nnDgxT&>=tR2P7XdQqe=$7W2~=%MuO(n{pG0k
zx~pZ#?`Mi=T2y+^B~Z=+*Tb(dId$F^PP`@7Wt%~Aaww6Zdsr$+`BSfL<rAv@WhNY2
zj~V#5ZRNZ|WhPmfzx+<1MKR(Nu987#*NPL=$@{4CRd6Dw%SLzshjNjewMheE(q&Xg
zb+=k6583iN&KIpE8S+n7<HF+D)T+Ge7@0_6jQ7ez#dPu*7>hqVrN4|t6-^XjUShrO
z!vdKB?GDz-vPB9YU9(AWa<ZxG$b%xw&}^lBK=QK#8_Mgae?*h(K0w!CJYH%P;GB|_
zwHrsPB9u$q@~g%?l1tL=l3k2L`|UbD9rO#Gf+}JVL+c4deoNO5ui0&(#-f45dRO8_
zpdAqHi9L?YfHMCMXFBoOn4gKr>8?f88|Uyu9uOP8l@QXj#wY&3n)yNw38ui8Zb`Sk
z_MP8FN9)X29ow&x5g<~iKmpJw*-+O{ViyO>p2+a8V7aO&n&SfJLJ5?w0h4!1rpKxt
z&_fd<1@DvNe&YtxSkdmc(mp!wsW{Wj=AHTjqa)OA?nht;L+@e>xQ;P?*Xeki`f<P|
z?kxQ}>d@tl?12%TFT&~zZeII{`&WS1cnTYjf*f=-yb=UFwssO$68hI@eiJ=V&;t^0
z;@4JNE0hT|-yCY;*k@cnj@E5~4ca5Jz7~|vEOS>a$DcZpg7;*9d|E2xFpu9mOpCYV
z;L=&FrJBCg=R(EL?~fv-E7^CW7h<d7*dx&Zj+@qc!_sL|GOPdzK)l^w{3&eRhyg3b
z?2L!49ximayx>T<l`+fr^Zj{jz-MA)8bJo>{}Fo1%l;8q%UNAHssBzz_zNV6)>pKy
z#=iW6G2|k353^_^Y0?+HKd_W1%a9T;V*MWOTX^B(f^+rXXHG9D-)0cR+>c`ZRzIV1
zxqtCvX2svG@uN}h`uwRL0xdGh?k?H0bR#->)N5PX%=GChx$f)LAhCQ#9RbcJ`D3k;
zFNFfsBjl@OXh?ac)t>;Vbo17EuK4!imbg7%UNrP9FlaND39n2mZP-YgHlW!e%5`be
zr1{;Rnz_aob)ILj#bwgcy%)a~IR-t}qP6#&1pW*-u@{j%hvuw0%==@$)O$&EV|;sQ
z*yOZ<7>#@vbj^~4iH4i}DVj{*&=@4x_kHx6fHKYwDwd^0M#qN4N5Fz}XPD)8Ekr7K
z#!Fe0%Ii3>OpA_)`*v>`6ovr3;8S1{cNyiIcvYmF{&Fa#vdSJ=5dA1E7vJmjcCHiH
zjA1-=Yb!Oq#-vasRM25NtP>JEG(?0odrPZS^XaSVWN}}E*zDPys7WKI>YEvzBvPx-
zIG_Z;SIW)w?651bvhCutwAqVERvNk|g7LPqvywUn0_8{)et>;|O@V`E>k+>8NXq)e
zggm=S(g4;h+9f;tY(4&?{ec{)7-wH&jPC)V)j67ywu2iDW*Wwah5-lM@YpqO>nWm$
zP6LJr5d%neiw~3Mfe}GU`-c%7hm6+@G|XMhoWlIeI1L~>AtskIo`xbfibYVU#;2^U
zR7@wPO?4T{Z9^W}iiw|hP46oh#k|4mmNZ7|6F>^d<Tb40?u5k)CXz3DY#1<V6`Va^
zh+`z^i?!38wt-~1n0pLZSKl8ZZKdbMdrW*3qaXa5xVzs2<D$-P9Sh|-))T*fex6Z4
z3EvM9uQOe->LEiwLHhP5?E(hcXt0|2F-!d`ZLhaZS_fw~1-;|uHLvL`dU{v47;1-8
z6ZNy5G;d$;2f&ynYj*^E_*|J^$<6Vizg8n01??Lt!hCY0w#+{qZ}L37vWh<G=-7*S
zii2Ea@m@Y*wez)t2ueaJ<NjKH#iYh5&wzKk3BXjE!?55N!;{LwOSxW(?Le}kkDh2M
zk4J-2s))Sv+?GQPTvhw5cI)_+d%`E|aDK3=^W4s0-GC;q#)F+-kAKhIg6aaS-VK|a
zHzD&XQaqZRul`mklUr|RG&3(?i4F?Qt_?W#dyI!+AM~baqo7x4*CxZpS3z(9fjV$;
z4U)bzZu3+hK51yN0tPFqDf;^yFQ!wZBT0U3$tOY-Rnk{U40<Zl_-qu=R;b(jX_YgD
z7p^S<tnbSw+u5>aIGf#kPIc0OZORM9r$d5%EB%L+<?-B;JP<dq;zG%`iudX0Bsk#f
zH(`~s3r`WK{&roB=wO=CBu52&+U2Tfr>;KRXX#=Uh+qfQAGS+}Lh$`>M`36}X~k6X
z>MQYjl2ZK?bf}VVCAczZYtMFhXT)Iduv`R=5+~2?c(Odw;n6<^?mS>VUi1L6DE0R$
zYu_nmEgBSee&%|(`#`2w%GzQ5rJ{PR;|-eil)L4nW9ftb0IMHcC-c&BSUSJ0O(#(v
zN6ovIj!zk4erZJeBys|bnJ%lhH9(=#pXPu`BWTnKN}g(owwYf(@li}>2UZ8}3<9eS
z`Gv;5hNOFSUzV8{jb1+<kijsCYTu6$J-n|q2ITX9gfBCuzX=|KT(fkZ_`oH2k3&4)
z)>y;Otn`<)w8NF)OjJ<(UT`XXXvq(IaQ*PjUxkzw#nHL^jr9KpOuAw!LGeMFQ?}$-
zhHv%hrD0@3@ri%0KPlsa^`%q&AWx>I4jBwF^EHOaj(Go9I=4b_5uR&?*ESk_CF$|3
zdVCuB?rA?fm}iI;5Nl>)m5BLSSeX+yAM(zmKBW43>Zyi~)lodtJv37fR$u&FIuN|9
zAq1P{nylD;aGoL7(MA4kBisi-@x)mfFJ55$z-M#)8NQ2M*Lu1dFvKqE9v|fzomMJA
zuFlgRO>T>4B>y4eb$4%#44vC(Dvyr%y5mbDqTwMerm;^y(L^B=1R%pyD&h&;sL1-q
z{%qfuGsG3PnTd4uHgoX+#;zcW^7?iM<&0w7={aDIA=CRV;aqJ@av0Xu72>ixGR6FM
z4p+OrQU+xkY1RS*J?leXYK_@;=^Ceklk1OjMwE{%ge&J?v^#f{(}VdG?aTi-7_iBB
zIcbOl333SKJ~Yetp`J+d(4r!}PnZ|C!m2`-+oxgP21Np)3)O#^_(fB4Ig)XFiMd&B
zjCw>>L@kY-Gdhd;>kn1(qz|BEM7e|_Tr`P2V1wqm$zTN4kSEpg7k^Ni3$Y1^st>IZ
z*GdmqiTs?50~qWsf+}CVqc}xtI7__c#_<buK*$!7n|BRQ<hP1&7@i{3H^F=q;$gSA
zkp^dzA2VNucZrEv;y9{O+l}L5pHcdB6$7Y!{rw+<lON8jBhI0zSwFYVv&0_0qO6{)
zT*_-ojKY{}ASGFV>6u!x7vdIo10!tlSVQ~YEC3Uv*6G#;EBS!Y=?{I5knJOXr{l{j
zv92|U1y$K;BcL??QMGSnjerFu$7z1(6iVViKj2+mw7_%ogeVGZ$ir_he-d&SEl$59
z|Iy@{3VyxpqI!vPH=KAqT^+mkCdm$Mw<Izf_aV+Bv%25qvp+?JsHLmrqnY{n?_St;
z<SBjLTfg?*@{p*J?z5^9qNcknpMs!OB)L3b?c68a&XI~(@pJmnv&Uykif^C!eFb_c
z=YBQ;onYI=##1I>ewf8O@oVm|h<Hfnj{vT9W4{5@CLe*GtjNX)T?;OhXtON6A-Cl<
z?{jV5ShR&WZnkiU+LamI-xqgU{X+4MHLQ}HsvQ#r!>*S42X)Hz*(|e##w&n8cqYp%
zw-`y^Lk}}maVUi6;z#6IIoRU1_2i-P-OIYP<O=-Rt7fWfPn^nZnP^|xhr6?oFP{<8
zV}uVLw*o_OXMEhYsEkU2-k)u@LuCfuK-Zv&apaX2RQ^Zjy3n?^dTy)rl4{?3={AS+
zyWcrTxbd4Rg7T04(@~BNb8W`W@N9vhrqg~0H4-qMWBP@1`2a9GXWKR6q@TUY;6WQ0
z)Mk01xUt|eMoqiY;t@I13-$$OtIfyR0tyiiWW782z@nD{W;ogboadr8{t&t_uRl?k
zlcP2&X1@Nu$HRd{?IPonql%-|Q}3RXvJ>uIC*t`C*HF8e;^e;DtfGra5{KV%z@Tk1
zZKSPz&<}vWnz9i-WnAkpZqgoHezhFA_GSsTs-aEesc17~3(-`eq(P%_9hW(^E}I%o
z<=FyztkqB4C2~w9FTZkdfnV;3i4$IB?O*QC*a`@p=O+qyof_wWQCn{d1NLm=NA6zt
zmUzbs-o%Am)sME!{SbS)tGvQksFe9~&d^V~Y##=#uN?(0+_Of77LO(AQF7l6ROmMn
zFu+yZu4z_3uw7vyGiJG#x*pHE<ppG0H`!=cEW7s9qyFd<mf`q>)vPP*ev%uIGI{mb
z7(X|3Za<sdAB-YC*h_*F!*}}v5MMGOh@Fq#_XCr)a~0%%IA{77A<(sy-7LRFNcd^%
z!xc<SBp*5m6@OOnSgD$TP=uWT#}zTjTV&O%8J^881t;mQ#m4<>BQE_XU8d=P>{Hg?
zdUaig8Si#JcaY)bpLiJ)AB5o4rZ?S&j2C0iH^FlMRnnFhNPI?hRg#arM|9JZ|K?0#
z+c2wUF#Jzd%f?{MNklY%fdN7xDK}!1inG^!B|W;**}OG9g<f-J^C0#bGJ^a$q5cOB
zihm*&j99O(MUI_}>&@tVQHi0ORE%U7K8@}xdTS+9cu}_S0X~8RN!cuVccUMpz4sAI
z05$(Gh=2Vzpj{7WMVBH6wi<q01l&EpOzHvpmIi=*a^G24GV_uIJvak?8Dl!ha^v>J
z^)><&*9cZDxs=Q=FNB23%|ID34kd=Bna(JhgF{518CzO3BxKbIuAtpOZgShY@vPSC
zX#qM77KCmT3>lfgb-9o01e9pSG3Ql@x$vMzjjIqNUkb5%6|XN$-7}Mr9qf!K?^o~5
zaEUAQ9M+G3)O|aB#21Lw&Q93VauA)ao-9$HJ{kiFX$hq+sW5XrOfmE#iksx{^1Y0L
zL+@#I**|^j$15}}#t9re%x4K(mV=__2m(*g6SxL6$5KT$c^JIxkWdNX#M$9dn4F)D
z`kp7Sp>6gDn8ae!-Xo$;;S^^|Aq#gYE!N0VEWXQ<O0Y1N$lBX-J0aQBaHwi-_$Iy?
zw@iI892D|%VK;_){s+!x;%*K$+<N!e2>0lNvQMD)A_5%}tGVs3xaZexbY?tHd>|k0
zGW0xl`dyH%QiRr#9%@OR5gI^V#9PKp#{wa9f0CvTWjjiOqph|E{N5}1JnX019@QF0
zsfyceBB6N=TKDVHSEQ2IZXTDI+sj6iS@>(9b*aF$Lgi`IyEM)2!np*)f42f#Q$xan
z!uR`qzY6$~Vp0nE+6{v0vi+|0rbxvjaFoGoMZ*z7G1TI#M?OEzfV_<xBqJv1hj9|T
zY_a)w4|S%7i>4%x;e%o_-R;A|*wgitP%(=ijAuOoRQ|N69-}ki<2uIvCHL^f!-8^u
z=8Yl(^@FgCfSB&MyJMfg48K(`@tNgo1kfoiA){T55#Z>zSkI~Df6`F_IIv>puv_)t
z4`+1vYqL^|i(_z5aqI4kWRrh~Mt*z4k+|Z1YOZ&^|Dpe0@ANJpAyGxBH{I^yegwc+
z*dFiuQLn~CA16^Q#I?`%8L5X>Jg^%X<YA%NJuxB*54k3;pH@Qz7~#cZB>?r;Mo>(-
zcA63xf8J8f!QQ?FP~Qnd`8ub@=L`bg@Ux!B_(p(*$a5p=TVm)e;nNEM8~JS$!-P5I
zE1F<7?O}ElgFRGF(BVJ2cVDU*;4#nt+yuvnsl<prRHhfhZ+}Z7q205#J$1Ag6NM%`
zC&7;9Slr@+P8MbPzFzf&&qOzr7=3TJ-z+r9SKpK&FOTII9vMlrB_3RxUoBdh^*@0p
zLzBTZr$)7GC2V-7XRW6X3!;bS0XG|H7ujehYoPVj1fTx?#d$B6?Cc2lF-Wu1DTVJw
zZ%wQJ#QrWprRswlG!yptQB`1p=oe(L6Ko5HEx*glE?&pXL{brYK5GWQTP#Sys(&0?
zxfwGst0Xj!zWUuqUNOgE89nhB!kZ##nbkhPLGTm0k=ALByXw)|27P$-rS#$I6zz({
z-gBkiE5c`A&ob+&t>Ks5sd!jHa-ymb-}}uX_NLPnNGv(zYPU(5-(W3l&e%_T)$>@p
z`Gi{F@#qlk2)FeBBQn2j0O9q&wX2=mf5uO4B|V_O*PqEIhLpI=lIQkV%3rf=_cbyy
z&(O3Mwpvn}H6a6mzO{PC1MR|&U-SL0HU`^&jgKR~OK9-HzZ~;oJEc%OvC`Im?KIf-
z(@k)c=PxS#A@}1@js)#XwF>G%VnD+yZZ4P<d8IrmUe(N7l4(O7b-<WfEkJmdY3KWL
zDww37^^1C<&Omr=%df0s-ZaJ>eWIst=}^)8X{T)5zae(ZuJOwRt;4rkY%Ai4LRSNA
zB5LH38BGj8c|}>?3L9Ogd<X9tn_X_4?ot;ZSY7g0%HJ9QBQ>0PC!$984!=6Zsv9t#
zU2hz+1G6H?5L&h1NHZ%265;c&$gsEh=E~_}JrdchD7W6sW%^*cWd?-v{jdf4oIXT&
z$w9prU`H%R>=u5i9()TTZ^e0r_!|Mqk}0Xlw^w0*tux@a^pgfs`-QN{->>1Q9u+|?
zK1bDI<=9SiRV;CQbM(0x03tD&Gq3~G9I+zNOOeykH&Kc4^d$C#063z6Qv%=VR8cGi
zQS=dN(*W9F{*9Z7$m|dMyVQm<(t)5kPq_qJu;TSobENl(H@^wtK}<nuL7%D>FT@Nt
z>7LwmC3odZeR1<#hGHED1|nDr-7W9S8Z06tAb#O)K&qd2Ur#(gkKpNI<UbGPvG5;9
zGoa_V{MAxd6vcyfxp~y$Np%-kG2eWDF@*h9>~}cbaHD7I4Iqns{ZQ2nWcJu0X>8K*
z8<D^`IdT>A5IC<Gvwh9fs#0pR$3J)6bT4uSR9J`DA3TfXaqA!%kCh@{<UzF`f7&Ux
zRbpvRntq25kAMyNz90T-dY3A8o;E?!&Ty!zfb@(|JB`OS3_P4DX6V9+6Tzb|0$q0D
zC-FU+`JQsSdH1n{zRUB7P&7?cTJ*99oGoz8Wa&@8gJ7s!XGY`OC&R;=k4xs1l^3@G
z-DK4LXma?B%AXMB_eNzxf?4|`(SfMzX1vCn#~F6J?9+X}n=!IXSC`3zUd8P;m$7*(
z&D@OZ(@q@WMXS7Mq6*{8)&ZtQ-q>vFTjlPeb0_lS@L;9s#}Q@VmQ7Vk=P%H>1S27X
zMUR9dL3#u0@85MyGHn9I`jCu41+IGaDkD|EvdmK7p-k({_t`z$ByV#2R{!VFa7|Sa
z|3rN6P5UViP1_nVK>^Lv(DJ1^y?`d=9kBO4iWjVeQ9v(Xc42q$0gXbpB+F-^reKI(
z`!rKe&y8iqp7l~OaQ(e<`VghZiaoT`(;!N(qLZqc>sKn%Xwj88b4Rn0rR7ZG2K3%G
zud3-WQ@4|F+cLv{5fyaV;Q8<MHesh|lb(>o`q=XL4f~qFw)+ujHkRVV*8QQ`Qs=W_
z>kDX1Y<0=sa`8B8z!&l*V%hu7$+`p_e)qx}a9AC1@cMR0reML%wxb2sY9y0Pb3H4k
zImBjWt+x5N=_*tB_bAwIglKO5prM**Sq%g2P6?}dKx|5}+O23h*>A?7vFTlr_!&`q
zTbdiC_A#oeRlixk+Y+9M8eo}3Pc*;Yqmc5}+R;%<_1rh|V<H_vg8;8h#}q>%9Rl|M
zn3GKm{*xYPz(U>k4}_+UGJBVCoN}P?cV@6ejyK$<nSfrJhd%*nw;@oUP`F}ZiS?Z|
z3Eg=9p9%c`++bB9OmSL9A%g{0aVny$`@7oLk)#&VOCwltzXA}lqk!U53b-hXT1Ae$
zX}68vW{%P#|8U$T5yt4KQiM|*dY-^@AI+f0#QydrwfqV9uy$_6&qFV_zO#5MzGVxY
z2%Mfp3*PS!*t=Q_*6zhX4q&t=M(+SDqQotlG`gnzxq2!YyaS*g&L}(`<Jrmq=e;Rd
zpV}Tfd<p>ns74QHN-kgBgrD~7=p-)DAFI;Cp#THX=O4ylILFvudvMmt(IlL#t&x9Q
zC_ot5^xJezo8KYb-dMY?x4#?NB-BLF=cUoz5cPjbS<Fs_-f&yW7E6>-L2Y<RSmnX&
z#BKHyy<|Q<4>`p)UmaTyT(P!#0_4%w*)PqS$fHRF;Rlfg5$WZT7<+biZCoEOk+=P7
z0lmxNYe8a3U{sf-t>HZ5@ah^yKtlav+QUKze~Zr#^4#kI%*16|SXjN1S$tbL*d0}$
z=tt)Zq8fmlnX)Nf8&|+m5R^HOXoEt)V8c0K5}~9l<j*7CWf`bVqjAj@$Bf4?p+`!1
zHnpJ(`-VHt1d9ud8Q_Vzi@-i|asN6E@7KxZXyKB*817v%Be8G8oipAsSKEc3MM_cH
z3z?@>pUrKY7yzLi4EvXm@i(~j+`bGGVdwij!V}bw)vBbniloAvjEm;!+;bo0y7o+}
zI%Cc|9_+Y|t0j#Hqt~N3C?MZB+^bGEx%eaM3o?+zb<J@q&J(4m+LuwiV1FVwX?GKL
zJ9-uow-V6w`>5wIU(JISEsi4yl*u8v*!I-}O@U{_nNmXPq0O>6NDZxShwpt51F8l@
z&a>g4ROjb`c+}(O*RG~^H_L5o@TZ5O*goP+O3lEmA7R=9?<@RwL__VBmyrJtDf!CO
z<KB&Xa;7S=d*ag{b=I2OJ<!#;yCJjvyosl{B4;@_2iO(2sTX5nw{jiuYjW$=+~y3Y
zNoH~hl{u_d1qPLS(~u4~K)OMDybC{Od%4iF7WJS{hY_1XO+>L9N#Jwb-bmp&{+wJ&
zYK3SxH1le=k@?2euPM4C>+4+OT1@f;*xz(4x+fNv=W4aq{rz~@HvA?#w5ZB)&7W+g
zwPc3c#n9sHI+R3aZ>{ndyo+qF2Z;E#`0-KhBXqU>?$?VH;~nh;uo@G<I~p>m+(<H5
zZ8>y3cHAB1iAVcay*nUD7WuZ6GX+yTNi*d5oH-X(%uj+ILmF<37jXmlQj$*lqrdb;
zr~Nu-%xvo(TP9q%{*nSV?EJnh;Gqm0tj%bIt>`%p2fy3iqJ-~iH+|QP_NW=I!7?5t
zWjyZuPwlTT;pva30V|Y|!;6598!dD10e{teLdB=viFJK2#L;U=DscS@9>;Vc!2Y%=
zBJwXodsMGe_Vn?D%0CS7{9Cbn*UKwBTC7dUm<-5yV2fPt=eS#X0n>MpDT@VTbzWv+
z)AZtsd4i3{IlNi*T68BNS9=vO{q;6X)WddPBi?Ne@khgxrp>nk=DYSl=T7Zvuxj8x
z(9z!yRGQGhOEmB^aW}8)0M(%(4pGND?iWJZ!mdYF@xNT0^$l8Osr__UeT@S4>DcWD
z+6gV)^HS39?v?6%7!rYng>m;AXFV@RFmEmq;GN4r<A3z12)rpX=s(`DNDpjN1@!F~
zy*-e9e-;-BIaOKH6@tz^esJ`$SP{)p&0b-n<*M`(iT2!C(A|Q)j@F=h6gVw9v7LWh
zheIJ$kL?}rzdy$&<4Y>a@?0K%I9v^TDczYVVo?)C{YnMw7@gt;6RxtXT&)2(mwW@L
z!^x*iarNSBs!&_eddD?&@TFVh5jaMa|5_j=xbn*J<VcUFy(BZ`@KJpA(L}54C`BY2
z@Ia|HpZ!)e^Mn5`7g$ZI?0gvPJ6JA=gd8?zLr!Ybb(T`+@<=i~VgN^JzJ^fhm0!4H
z;3pu?82@C~<^5Q~^|7!O(aq*@y}fU%a{JS8N5YDKABjWezY?$Kp*02TKT(<4S~M4L
z?^XG4O9uajkIhpBne3FDI@_-2D522J`fVhFWGo6`3qcPp%;4Ybb7Sm$Sc9qq1PA}~
zR{ZPTe^LOF)GF1Xv&sPWS51PkRNqz<!CJ<+!!ZnVI}^Tjx@D{RKW6a!rJn;-O4O){
z<nT}i6+ZK7oY}O$_@dZfnCg7}FjC+kQ?tW&`&fI0B<7%h-*3QSG5Mq3`S8`{)?OC&
z)*7SRIC*NrPBv0EM%g~)=-^RVp}(OXeLx5NmGzuUz-`zA@^_@}KwBv!S2>sJ;1uY}
zW1ysa3fR2_FFuK>U?0N-v2#IL^B4&c@e{j#liEf%BGQ3|2I%hdF*cIe@D|gI0PY|W
zI(z>IWqFBUj3v_WQvTYSnira;QXmmAwLURsg6bxT3*O%h5}bjw7V}$3stF-pQcqFa
zhO~0tmB=){0-^*x_L#bfF_1~NE2j&9^p4WXpmM8V|2_2OC%>NXV&30uC90;aih4sh
znGzeU(7x`GwNwPg%+pNn19@9kcftI?L@S%Z`PcJ8Q4qU?%{xE3xU!zyGQ#bxcI-_j
zP(mUFlLf1<>G4xmU6Xii=-a*Mj!WW}G+^1PWU9l|93?r<J2MiW;Y_(oiJ_aJ^T(si
zCppU6B>gE~?A*8(R0N;HdF7d{wRTE~lr^4z`79-;{;62Z0{xqOL32kRNA&vw`sag6
zg_fQ-vyN+xqpi@6yR187s?zpDK_5e(<42+0)w>gTrdy!Eaa*DIWfem3<ZQ7zof3)!
zr&pgT;W`!^i_AjAYxcd%lE~3SR5Z~EW5<L;#CcM+<SKza*XX*LLE^0luxK6yz2nbH
zD|uiAy%D%?opAFjdEl&_S+?7_4D}B0O)5Wc0o7es&DKOFx5Oc!_pHOlQ(T_>O0%7f
zp@gRr-VMJY_aQK6nv%&f?`fG|S{%V~F$=qHcG+$D)eLbFpxyIQdS^wmRzr4<V*u%4
zKg_2lTjy|bIg+O^80FicA!d0y+}*tQMjUjR0`^~6=$64o;T{LI-t@e;&E&C+@yYyN
z94~}$P^~C#5NqA{0I=CEF11uN7AAf)7WWL*?mI=p&FxMTP%3oyL5lW(+zk$qjb-nf
zZx0xo>@iMd`!7beVB{?_(|Q|ukN!-m;(UFd9l&yVj4^)i4V{eCgzkXY6nwf*vXI)>
zMYgYoEK<N5FcIicz`ItN{#X?uVu$;&8+m*@)<B!sSFN%hZrgiT1*ixGsEy}L7XxFe
za;B|ge(-$v%tcAjIjO^B9klH|CD*$3hH`xh0(#1apK|S_-;&y3lSABuft;wG`W=QS
zq{6HkV~u>ymp>!Mq+8<<a}_x7hRMQ2g{OlIH~NB9`$gboA-d)M^~P(WKFbch;eKuX
z^n6YyyV)s&Z{RT0^$OC?;{6vu9_>5i1GGD_oE$d=kl)X6#saO>N&aa+REo28B*_Kt
zTcSa70smZ|@&X)eho*|eqxsZ_{++07L22;NWvVqP@A`ASDkp!n1|@z!g`YEQ`pxLo
z+04TvnfeV@bZkrXNIN&YYLz-613h<0cQF)~u0O9PkCW3iB-~|xFZNXCoi7q#;}*KD
zQajk6cI^6>7*skq$*ua_QF=Mt2LwBNqI%W@uP(m_S$QsP2z&gnFHDYw!bE0`d04bd
zk8*E6Rbp~N3sQ>0becuxbRWaeTE}>2<?>e_{UII1q0qDe4keFlgEHrf%fxrH<du3{
z^K)fhr4YZW05t})WBbNF|4OA}H(=I5IoY~<j6dOv6p~hA3@6$bUpH-+G--|^6;*IV
zH6UH3*t)}gmhbl+&BB;^vEG675^la#%%xGIwO2@tn(yWkO&SIDrfs>nkx!&sebj7y
zsP>bu9m>DF5}4<8c)UB{bKcEtl%7@(zwQ>sQ-^o>cpqXn2IziSx)c+3cHP=dY<xeG
zAfMPL3%Nw84AkjjStk~B#+b(yph6dOPP<EOLo`OHl=z7FE&B^?>7-^jMMXjW=S~(p
zJKM3sD&%+|jb*NA`GsGKy}kb_@fn6E%HKcu=O5iLGC8RUCBh>HxzDw*+V_u7zaII#
zz(szfjLm}Hf=dGteSG*}_CNUH8&^46Eb+1}8DRa-#N(|*YCjzm)`w8wrkWv$Lp<3P
z@j@&fzw+4`hkA?l%*zmPZr5nm^PNE`wzrKVFssXr%Yrn-?hrKbvT+0Uxq!QdV+;#c
z4JYTukmbPrzF6wYc%cA|@QNVF;gU|?J#orCN{maKq5Daenvb0n;!bsE1jZ`D+VMhS
zPFF^7E7`4}`qDKEFS_8b*c^~+Zu|krpVFyl-Bb+4^OBh+fknpwy6NJM^11c^cji7Y
zvK<*E+T$frz4=`X9$uMywe)Ko$cMPh*M34XsAm{7Yn!Sf&!-CaaTj3oc}LAntqaU0
zcL6fLM_!utGt98I@>);+4EkO+9QcNp2F9jtF!2aT79R0h<Tgo)AUOz%!aK*!<#Vmp
zX(YDEYrt&Yj7=`}{14rh9^!&roM7H92;=@_j+G;i$ciFdFnXUGU6Y9$wP9%TD2}on
z7?;jx%K)tPPP)C^MQhkY8Xl1O!9HOpBs&k{4C0G;Hw3f8+3EHev@#3ih!3x9-XTM)
zPFI}=LLeVN-NTVo61`DH9JakN<qNLwj4zIqN$e(YeXP3P+w;eW%@;*g(!(|}-G)P{
z2^m#fyO<}Ug?9LH;a@|3p7WR6v(M!`s=dc{S1OkEc%>qx`Ce>Y&)2Zo*+MGcq>ckD
zhD>XY30~mIdbsKOkQ3#&b(~?szNkzG<5}%fQ`HA(zetf$-9Qu94T^Uo6yPJSm~*?r
z=Vxr7=37b8Gz0=5`7T-^iRpPX5lB{bbVY#3m7a@4g42h9j4L@>nD!foaoc<*F5oit
z5Zfg2A6E&ORf4^7jLG5HePS<#z9aIQ@l|2j7dJfRo7U4Exe8y#8xFlpZ`s{!tD8u<
zI=_>Xg8mCA5zam_Yhs~_BK{RgAe)Gp*-h6TdZhSco7Tyxi>hY|O}6qHdC;}FbR)K~
z^{4Qtc5lWdIn1+2V{n@U=N!ZMj3rl~k}tDSOOyx~_XYmRoSR)`yst-SE7=wgBJ%D)
zrcNcfn0Y?@YqEi3t5N0gWk_@Q%hl5$G2jlIz|;12RUC(AbU;_qUw(Ao{xVYF*RR6=
zr6c7yj(yGpYj7jgGgh9}>7)}QOPmlTEB#n^cUMzYjF~#%0(?ktWZ4EO^)agXoZe!X
z{W5&6(B7vRmiBa(kKKxWk0LoD>ry}3co_Jl!idBoX;8-$<Wo^<WqU$tDuZ&G!d$uo
z#-h0AsVJ$y$$pN~j+~*7>|y;2(Ovk)to!^KzH`Fru(|b7V%~P5s#uNL@?DSH$xj~B
zwmC~)Jl{GnPoCqX+_Bp@FVow)CXrjM3%9P3%tnvSnKYw!3qc`a$lIB%1o<vS?vg^n
zJdo-Q7-{uuwUuh4^skjG)y8w4Y$yJQ<=%9=g(kjbSON=n3oS3+YN~l;Jd_VAWBH!c
zOmAMF)a*cK-eO&+K0yZi_i9g8Pt|uDzH9nmI+2Tl@3s-@e*9`sdxXxhZ2v<Ttb<_^
zx@Sv9-U)9|pxT>~1#6mjqREC#uK8ZoW07CW-9W_ty})GE5biemkh*2nT*bfqy%N!N
zXdryvp2{s3@jdlPTIU{U!9CLJ>VtZGpY><$?pGxPak1U;uRY#+g0rFj`w~3Eph(2n
zb6i3DqWmgHwNo%hwN4!PIUhjt6Ol6Up>IFQuW~DBT@dARr46zFBO=*3pE@1N=}Ng;
zm4Bp@M!cc(@xqG&jfghbIF&Li*uvzj;iJ?(e3BzU!1C=aEXZ4fiJCL>;Y?l@-Xn6e
zwA|f2aK$1(|7#|8Eakw`kme04wnpIFAd_RIpF>_4U<RhGCw0li6Tae)Yr7c3BMGlD
z5Mn59Kg#T~7FBJWConovp{%?H6~X5RpLMOZW2_vb*uB*qr7_J#LPDiRUZ3)(??WKo
zoxP2~$}q@d61q`A5HS&2eB)0)NY$kpE!Fsj`VsqAxP5I11H=NU%3RdzV#^KKA;Q1(
zmO36*^kWo=0`8)Wn?5-vr(E^~QcIh!$SETF0^_9IQ1J>LfJ`MV^i4u*067j}nMjc$
ze-ej4Y46y;R5>YoPB4=6tB%CbDF}%Y!DG&b-a1DvCUXHH33(9t(@!cdSe#%(VCq{-
zi5DOW&X<7<czdLl85^`@gno;(Q~Gu0v!V7#a@AoRH`Zc2Bv%=PfvNPfnB#*PQi=8j
zu}|1F3!_+gR$)ASxzCWkA$r%~fULSyO*HJ(`+eulu{O_xMBraZsP$MZU_3D+kPk8Y
z;;%eTTsQZ6gd7^GWnY8)lz_lRYR$*`+Wrrm^GioHjDu`qQ`ztOQ96f7rhdAO2UwX?
zmf@3IDS>m35tG^;AMPCdZhEU<3&6fA?^L;&CW@71j>JTiM{v;(mc@R6<YistN=HJf
zXNOkEY-UQgK}&qLvrV^v#p5XjuImrW+R)CMu@8XGP1v7)`RQ^GAc#NMOLR-c7p}FQ
zb{zJ(h<#YyKpVK1R6GI^A${MZ79(cX_}RTz7Surjwi}O8rBLN}T_?+5i9z$%?34BN
z+|BfW%ouNMxAof^$&v4VeB2FZ#={P{YHsy7E56iKfgB4+*vyua@={`yMtt%RaG0lW
zT%COJEIS@6p1epY9iNN0KD>3}Fp>n_fBQ?yyS_RS+MRHAr8I8k3;OP}x`F~DU@E$I
ztHB~*=b5~`a9NQf#220Syc7cJwl0s3h<rLx#3usJ?n0}$Z75HCzL+D)b550L<>YY7
z(fO+#N?*ydT)0iWcNaG;T%Sz*V)nyUU&)g()hDpCmYE9Wp&W|L5~J1_NOPy7TISoN
zxg5<XCCKf?MI^^yB!^1m1kY6|kO3gy`GAW;sqt!75^V&epgKYR^X5naW;#HyzXlac
zQ9Tt8*j{`!EtI5J$#$LvP5ovMxqUV!L~;0)BF2R=c}3Ul+&Fte!l}%bZP6bhJSogL
zd6`B^Ig&C)XCw?J=Na^EQbj@&C6Ia&<1cFG`w;5v(&!-R;V^pO^VkmDbyHV;2Kf;W
zqGrtX=<5@ewvcSW4{dGm9aeH!3RG2`$5@5Qkg4i&eq2^V%Dsq-Cup6q|6cYpF~|R5
z>n)?AT)?)`fdPhYq(efw8!4r`L^_m~l<rgk>F#dn?h>UN9J-{tYpC<E_x{%T&UxRz
z^JmtqHP8KA_jO-Ea&r>=XyDm*IN*td@qsvZL?vDLkI$=yy(qCq*-R2Vk8`C9-jO?{
zV7~H;Z)@W#u6%snD+iN98!e*)I3e7gtlt(cJpO}t{Y~&!JrR&V?us1B-G5-)V=TNJ
z$X?o35_3jf{kIqj@@O%iZ~8yO@Bf49qMK1?ujMI_NA)w>T`IfQv_K33ocN4Hutq>4
z-O<#G;`qkp>!2e;Q;FEgncfOy#Xh#gs3K`}J3c;#mARFw>!iyL?1RjiDG&Zs@YcG*
z@Vv83CHe&_!c1AE_{nNFW_E#3*3YnWUM_m$eDEDUvSF)Tx#;7))z{B%gG3QKnmTzs
zTQjmri1-|cmS|D9!&qZTJ%=-`%vXnhip%}GNKR3jh-SZd=AxWGAajs`sIqBJs3!v8
zcx#y7S#(kPa$thoi{QIKd9A#$WE^?5c}{;@^%{<dlX~Wc*8PnK!4S;pzVNa5vbl51
z_|>-HCwFqGuuw08NadR;sb6%T7*k112dY8R2$qN>QWn1b^zs~06XmKofk8OCG9Oty
z^>S@Ot1VH8bSm@(A?c3y0kn-abAMNLz%;~om}wuy$ijJ7aV?2<UQprc**y0|VQ<z0
zImDQc>BSQcaDqUOy*EVjFQxB9k`t2N@Q`%Av9T)nt)P8!8s8Sj6Hw}OWn(pw`}JLg
z{v2zJEA%H3?s=6tu64ss#m(^IaF{LMeRo55=0S-C#er@vW?CV$lWMSEc(?slZYD4H
zGDxF0x=$?E)ej&DMj?@c4y7XzBDmRX0|zE}StAse;W?Q?SHs=r9#??r$;EdyNy@sR
zSsP6hepnaZY_JgVT&?$2DraPU?Cexjv)r&5=_VcOr*a@gryP9qLLgbTWf-N-8Yddg
zTJTj_Fa{~$q}VbW<ModkMr^}W9QnM~!cdBX7AieV1XV4NPY~yZac2td4spT(`4a$$
zm@^P_#pF)15~ncwIVQGeV-jwFH5|YP8h;KC>oDKn|8N8k1Da|3SEq2^Q5oJ0>F+@w
zFa?j>q~FK0Uu>ns&`@9vPNaM%U>b;)p+x)Pw(l`s;**x0o{5gF+I+TIFf2zem&C>|
zjozN;)tIanv2I|*v&iSOhjz9%ob)`Z!hQC17}eipsYb_7dM<i;uJYBo75l8=p;})|
zIHKOp#JwUkB6E&HS}1!-k}F?M`LO<H#KvOE+I>EZU2o#>i7B5PWAx!BPFl1>%xq)*
zL@qCn&JVUrPqOP_>Q3lmz|63onT9=0zLzds;ECbk(AAawlw{=nQbm}Pg`qEvnCpVG
zM7vsD^7^>rLHU97<!iUY@M4v6?Dh_~Wlz0VibP4e*V&?EqhSzgOr%$4T<7z(&0GK|
zTRs=%uCtx1iKw$#nor!hlFUUMzqh^o5dy124PIZA8}fD6YnyqjzDOnZSsyqqo#_YU
z`Y$@ll5a`vJ2ctas^rFBJf;$m>!gh_J=`r(UPO%QyDec%9@Gp4?oD`d?`~)Ly@+SU
zduWl~I3N|OSHUx{ueLgLvYcjG#!{ZX?!(Lw+TZ?t|K_?x<JHi9WjjecYn+ZaM~7kt
z&h29gNxV(R?4vYdDLXp26nGw(_+1WdM(ik$dC5f?U}ST3R<(<c8eCLl%QM^U&kLu&
z7S%aH6{VdpcKWUE9r3?Qs3PK9qr5(w??qgWO^LBg!q{X{o*hyDb3~nJ;a43e2xH%C
zy}K}JhnLZYb7&rSgP=At-Z#p8P<flQJ;BiRM}8{-lZ3VD*C`1j&uR8WR<l0TW{$aX
z#ZZCdosj69M&IIBxNdQGOjIaas!@w;Ql0n5j&x6RJj6hV9NX6`&|lD1$4uX1<wDh)
zfOS;_4XWQ3SzgMCtanm0Z<pvX#)O6f>=7^2$~<DJUU!N1#-R_Qb^DNDXunx~Ao=}b
zA*W6Ho01~Z%UZZYMtsOGG<S$`xJb}m6<9l|7(^LGwNg=40}do8bi@fHXmgU=?h7iD
zi+<_w*)YPlZyqQqd<8`5y(<=c$tds8KQrFddE5yhAfu1H=zj1br+pqiMQP<BCV`1v
z(c&?nF!4%2GMNORi57;Ui_KZ>zc+A<H5S4!Cl(uFszSJGBoFvYcto(uWLC8et=oZs
zZwoQDTxJKfS5SHZkdqo9tOGC3e%=}V^<HoX{0I22neKl>N41QVM+u<cu!a$d<ayo$
zO^S0TUquh(cEmkK(*+$<exizJ+`!4ATaLO9ikEH7<sn*IV4hjN6-oUN#yf7_#ptn@
zj7NDIEQI?o$D$TRzQyA=Q2T;M3UBMzi}RZIXLzp^qboaLgLCl4h)0F&4L0Ru`zO`n
z#dT`IShKb3qn?(1_FYEz=Dwo@_qk#d{wY~IBb}Dc@@c{K#$lp2{!g=@Y&s^kma2)Y
z+hLWoFs`)S-pme#BsQ0c;xGc{R|yxd5U4c(eS$O43M#ZP9JaD!W?d9Ha`2aMf1T*B
z*gk~il{&{Z`Qgn^3UP`~Mw6h&hBZPePJRXB{e#*u*M?+LzmzBsZDuc<S&s<&S(%v=
z&tBs&K4>?mS%$DDs|;I&e>u*Sra`0mlgbt|Hv7F<rli>9ovJuTlz`vX+$o=aWqJE#
zhb=7?A&<0~d?Ev#h2^{JR9=;Y@1A%Pq7ma+x_^COMOlgYmXU5g!~qKwJ_n!SR2z8Y
zyLX-#smPhhF{zq#>*ESWcU^ejI<X4M<*<j{kcd#u*zPCBL>UyRcvAgvcR|bYnh#G}
za<O$eT&RPl<-JwgE06SPYsl+vcK2UxID9R8zLj&Wwv}3boJS*#PEQ(>8zln~p}*d1
zCT2G9oFf3@?lXc4Q@D*{tTf_i&><MX{lNQ26A44^HpDY>rmgvWvw)aApE!f`d?KnH
zqWtJPa2=eivoUX7i8e}T7&Y}hB)po&<1pns<#HbP*dvR09=G{wE_AGwK5$mZw)4}b
zyvODy;pO>?O{u(#pTH;(lPbge%gcvCp)y6wa87^T?Et^b^q~dgthX%XjbQ!oZ$kb*
zW3%*#BW{;%8d<0{lL;OxyLZM<*|z6}td8eOGtW$B=Og&**lFTX=QYKx$DBGd(p`94
z1!7PS*X{Y{Oi?D!bjVJTe8LZU8A$}p{jHkX3+{uBZF)&93*9fPK$`SG|AYzkR%?TV
zm)vYSb1vKaH6VX4;mGX*IrU?^;cqV`h%}EzvpNCsMgMp<(+f*79$5H)!^pJdKX_&E
zNi5)>&qB(@C&%QgNwEw_1@#r=2mp4i&b1@>e;Hmg{|&Dh=ZidGcxeWRv^L1a1m2p~
zN+VIX*sa|Q=Km&^D!BP9Xtuh~od0%W@odh=h0g72!?L0`8m_+C`^K>Kp~^g|jzrLC
zFLUV~5|*bn4FWSZI!75tFMB6T5&^TH%L!XHsd4|ooDmbUfC5`faj5g5V^Gl6*&bGv
z<V(ahL>m(}{;VHns+3;14ySM<coT#n*V*tt<K@B;L%_7d6*2KOyO~0`=L-!+-4O^8
z=xq|+BM68=*GF^v;wCn&@jRX2@IOeto63Rbm<$37Kwvg-)li}JQjX{-iTe0JPYdnv
z+I}%m=m^IE&z<UefFX$xi13c(U2$}&*ZBxP`GE(}0xaZ?Llk53`*dAkR=bY=b2^5;
zsmkkYTK~L}Hy7{DK>2H-EvrPYHdBIcXUoVLu6wY=oX_2k7Ioy4*baw5njcB45<TEt
zQhIDuWj<nvm)XqLi<Sj{skA)VOfr%Oj_dh=_`U+Ol@#9}g53LJo0?P<ES5$wEF;3V
zV_{8aKhIHVWzNASwi;K}Lv+<(m(~aDa71A%WnV=|f-B>yFH(4{V)Y<SNz7WK-IE)0
zWmu{|ZpF#3lCuQM*>z)w>F;aSKl#_+hOmxOcG>4LSHAP_gYJcYc?cRC?j{<|_)fsw
zBJz+DB$?^DWsZp}nmPgq@+aWBHVL>`G=IdWT>~#&SD%m&^x+XQGBF-Z$}ka|+CIWF
zGCy%M=bXs;F(6CbcSeSvn?et??SHl-Nm*yiBFYLSr32-cSOeuu@fu5Tvx4@!Lqe7&
zV;()Xrq-rF4wn-g!FrU{ulW>6mVadE$Af#QY`5U!2b>X|{p!@eUpt4NptcLU5ooOC
z?)}K!h-ZY++xQ{1_*mGBRcktvxn|akdE4e~yOyBtD0K2y1Q$Y$@x<aB;%fy-hHOcO
zpEV_a$)s^ZGiTELn6VdsXzE!_{LrLQ_#}Q(JYiBGIS~7%^LoWc1+anbX4|CLc;@|_
z8dDx0Bkt2lK=-pL?lAWuh@Xmk=E8wBPR!>JP3mtHMXTMRkjLd_(nhU{SR^qg&;0Su
z>1m=~y(LBM{zTK&aLll$Z73ndFpF(7<HyzP9Q87HHN8*2GLft8$2=v>+fO}HyEcqO
z+^AnE<zXLty#?0LVb76+`OB>khFvQb_L0JuK}dsb9!>^X`Y`^fbB&_rF*-iWlOC|y
z<GpI@pK5?h{1WczXd}5|{kqP{uk-6Q&68HZs(b>ILMilcb9(BN)G(oliu<iBxVzqZ
zCPwu78bg2e+-w2L8tAB-a<<9TKmH+x|8t$)=lU~5xi0~jk=Lo1Sw-Hr-?=WTKfFnR
z1cDj8dja+x;EM<l4}wXt5GV<5AM*bNLm+o<CaJR`Cl*V_lAqviV$JEO^Z!51<c|1P
zv#UevOx&UE`>n5GfQe!N7<GMXFp&Y^92o^`&0<hAjAAfIQW)*o5b>N$6IfeuH<yP7
z<&PBxzX@+EKsG%kP{jGm4yX~Vzn;aR`7OM(m1c`Z+BTpL!be^%Qu7vr-QWR5rM2Y9
zZ8vwnG360VX}FGCT&y=sik@hG^XhK<!#xx@tWjfD3>8&T`je~qz|DT71B0w+qLi*6
zSl^5_azDWL!X2AwQr4Pdyzz!6J<|G0F15Nv9lQf!$;JyuSAoO+P@qs&ZBk=0o4$26
z2GexjZs|2|ChFlkEVDPC6XrIOp1VCls02RTNq<Fil3nkO0QX1p&Yf~7fv`hK!YCyB
zGk`OuD8<cNM(rwNkS0(VjC>^RHYn*)fYn9U!cB34lQDO$MA#S37l}h<byH2FQnQYU
zZ}m`Y(sKm_xAOkjRB_x&u^0qq#1Zr@DTvOW<tji8j+J<<#fIey1Kms|H$t=wX#0jL
zI?n;t-@fvm+*P~zx`FcG$Kk$A-nem$)tS8#FzPE#$dwMBi8chq03@vQ`f=Pm^l{72
zUBri2C9Ry4^dbkdUG4&K!>7OYouz*3@aKmn`014J^-WjxN3yG7HZxciMVQ@?M?mjI
z4n}KNNmpAuoHk=z->V0I6G9g4)!f4x>8+52lPs5P;uzo4p*<U=y11%<;~S)VwBnIu
z;HSJM5BLJ-P~H7`qiJ#l8jN9+htr4Pml6~qc#;uuskW8=F%mHA4^hH)9D8-AEn!u@
zHmo`|zsloUfFzj~Yun4cKR<f~f9c=+@;;cW8flx&&%n^L0hp=Tyo`wI_z71aoVh~8
zx`8aVNc=<M<`j<VKRej~izU{b6e?i?92Qm#wUh~^-)Ni?DgV%SqokqT%e@w-zIzxw
zd^eD;5%V$%GmO|E-UX}$o~$&yOiM3O;jH>~xfQS)O;Q5aJ)y?1`|#_ek2<&BeCqn<
zwbw-~4EAWl_-19lQe&K*Ou4qf{Th_(w&YX^;1Rk%FZXBc;~|tyT70(4_!IOn&j?FJ
znU^HUqNy{P%^A;p&d;Ef0@nR?{gz#*-X_rO=XUJVuyrCba~}OB=t4UE>)Icj+fK(L
zNh0|?>~e|9*T>N-?<?gw|7ybrdR-sUT<&GX{Or4UkM3RE$)a0FMFh?3Gr*}V*MGvY
z+*olCi4^O|Mkl$qL^v54c?X8kgR2AHjF{ph13uWOtCrR%>Cj3%JGTDwmZ$Bk1+zbc
z1dh4V(d_RSE<7?ZWk`_i{$q;*>|eXl$!;qjK97!_{e%vK%1-6S#VZRAmKGIZei9EV
zf#@-df0m*y&K&;-hxLF}lfMq`^uR{}etE#Hj+LwJtba{c{>O>9!#BE1@PA9y^L6h(
zHYY%U;GZRltjM?{O=~q-T|968)xjc5(M$y+Yh{b#cd{%Q8eO(%`z_XZO20?VhC{_@
zGE@{lXM6GzokIT>idzB%Yd9XXCSc%n4-$;()f>!5YBN|EIh3H235dHMEYhinorinH
zJ90)u3;K0?&;2-|%O*b|;aII5i*N(2<w*o1`-Cv1YrPo|_Ba!28trP(CJ_>gCArDr
zi+}4y3L#Rg>3~Lw==CT0#Aaucb1WI=7QbRbFE)<9G;0ewA-h1nhvXMI6#jJe4+0LU
zF4-R{?&&Q%RX4PI?+vDWzvf=k+PK8%1?W!%T*fJCm4f*Y25ATP0s3?U2<?vpETOU<
z5nZU`D8}X>8n5hLAbF)opkX$T{VIUz&|R&sIgs^gxNrHu@qSpe4<3{tDH8Ku>}C}V
z@dc_4A~4?;`T$J=Y$S((eSgbep6Z>r0<Q0@e*8dOF@IJ+SQoeY^6t1ZiOXzI7RaFl
zyJLERat?IRe2Brws9m9*;zhJqb?cSoUps6r3P!f-g+(Xq9(r<A_jXm%tTtaw`i)1J
zI!%l@Z!G#rSN;JW7NIAgV^*v32sRbv!jajm&Cf?Pw2b>OY#)he)?3x*28*-g_Tu}t
z(*|mpHL5j_kj8)d{idZ&x=gQ8*}oJnVnq5TJsggM9+#b@){f^@bszn`vEiyiBw7`B
zOr;eVcS}FV9w;CHtESaYP;^vd@@-Ll7Oj23w`bX7F<Mlv*C<4F11NIiPzjitZf%6O
zAyixqq0ZhTyfaOwWoefSpSvppw#EBqrMS1uRK)nUq#<3ddpc+jb7@Av?&;RyK{ZR>
zLUX0kc9H~etK$@^e`braCY*S=9QW*el<qG&DS<|<k=XkEM-G0|MW;CG+=j;~|J54$
z1P!7aPPZk5Fz9fhQrhNH<4XLK?@fU3x4E^{vyD;axI#sYmd{I`R06azKt_9cyXO))
z+@1RMx{BCf<xt{zArr>sxs<!9@qAv+hdr*;5T^MCTQ3ONSqo8yyAhF)do+u-fS9GH
z<ADI<`!ZS8SA(0t${Xk?oN~C}+Mg#uiP=JNXgx+YP&Sk3zSccF4uzU~Rs3PDv|~%+
zX;nPi@iH#sS^sKvHdxBu`w4ZA%kc;y2rDM^T4W6v8}=OqX*?aPKaI`Wkj^|f+pWGV
z<6~p4ZTDwtNJn|-Dl-gYB;<TKwC{k)^Vuyj+@fww(I=#no(he4L6=0lB-@PUw6BN}
z1G9)Yb>;WBZ%@9kJ9VVd*tb3Yxc_C*klz`aXS5K>gRS3qMC^Fo?gOvo!D>D8>UIGB
zjYRlxsF`x?8jZAcU7hWppCaUaOzZ81<zik~2*IUm=l?*9)g5MIu|;>Pn;lBD<L6!F
zgk7`Cw{URvj3(InU$B8cjrG5Qjrae8jm6m8NC0fe1U%eb^#}O0=9}E{O|D+()>z;1
z>0B<z&vjZP-JQDZ?NiEa;(D06u5i<Og_NLmI3rUT8z{e^GRBRT!o?PL`|WDQ{V5=Q
zW&@QtTP?f6cI73FbfmMmLjqHR+2&wEjm;d_Tw_v50g0URm|cpPeFsq6Rm3Hk6OK#w
zomsUAN0uOVqfgdfj|vkkXhWGQaA9A(B=~o=#dM2iQ^0rDtk%@5ON<%}mO4_~!FIrY
zBJ)n3&SIzmQ&6xZG2D3kCeZqlo6Zyu`Em{0uT*$?eAx82lpJdth-z=}cr?5Vs<D{i
z6O3-^dlTm$w}Y?X6@(e;iKdTYiQ<fW;x%toBuK8~wL@g~dDWpry?~6zDs>#`A_O`N
zZnN~KG4tKny20*FKu|@QRuDOlo1IGXg;F}4l{YRsV(<RZGGYZXgj&umt`6ofb&-q<
zDfGy$$2qaO`!?imzA4>*z&u0pt=W<adm-qjS7*5f?Op6@0hNV!YhBrNrKB_ar_X*=
z5xFY1V1pS4d4{PgkowGO=arLZR7t#kV4ND2rr?;)R<oJsG&Z>SfKF;%AO;f!)-g6A
zR-aHq#e54~vjuKSYZ)}}oCx8|uBQAGz5{Nt#|8bmJUo}-pp0BkZjdUwsG7=!aU_}t
zbif+oBDqKx$hJ+g&XV%t=6!>Wj+<~<<mF%RIT#@h;*Mn6HwwgJt=e!BZnO49{1U)@
zO!X~`i}>PGS8Jl+2m3&|A_$oaao1PO%La=~C2_9!-jz@JyDaRZfH+S$R=Hgd$llP9
z28&Lc1mXLl6Zd>J^{tSB0?=lF&t-3VoKqD<-?-eiIu)b#3^>{Vz+vB&{ZhUB6K`7Y
zA$_=?^0L|u?|WDgxEq)aVIZVXf7y#cAmK3fEhZKMy#f%D_RmtH8uJ2MaT<C$rV=_X
zNJNydcIi~LEc*g;TiRv7fwSoCi4uGByVOQY#@n-RcD<Y?WY_ybuG6I5Z~33l$u2_f
z4onU;=*23tPR(^WCGPTk4pXL{`3-jAWa9bx`P^$5p+C=f{}eDf<J8UMW%w1cTD^wY
zhms14qbg*_n(;*V>K)sTQTlMPy+{6(=ex8vbjRK-PIs<6yt%D3^{<qP@?c`aTflGV
z+^%>{ll^xmfEX^Y(r#IOzAh@f>Mr52{bXY&28NJ4ZY^;mEJKPMiFoO1xgb<nx#k;J
zY1A2TvFD?rI<np0P_Bny#&v2qwH5@BrWN1Dyq;A$0eO}GLWev*mNp1547xhs1#Dzx
zanXuzIIz-bx>E^AIKtliGbR2n-~gzBg#M){(lIBzwJN)+bGwcX(+U)KaVO7Gw;bjF
zprU4%N0+DZD>MX!a@kMd-X0$`PaXzxaTQAyfI@27$rnk;NQ=elNm<IUQ{lRu-rK}A
z<h_tz537iW+=&%OQ7*AbP!R8R4LR}Rl8OC*2iY&z%)POeTu1CryPdb5Y`r#6FO$WI
zz%CPaI1<LB8pr`MTjylE?5bn`EQq$LxMy_xtR23G@bqEjig$y${l9Iv(H~68c0&jh
zM_;atq%cQekRE}4k7iWHl~%N=M>0F4n`-S~Mjr#Qa7pDYiNd#G#e9IW+Qu*H{>>k1
zK&In!U-J_m14#9r5|_D<WL6Ll^)E$4#dnBiprXcRn@|~hhYjwE{l$s!5dj~G<ToZ?
zNfDNZvC@99LAJskh)IwyogSLyQCz!j-Sx_4_U{dVvn4xjw@6FgmBhloEMK|@S~oJ<
z9<CPbFrM$*L2vo@o3SiOGJnp5C~fsndL!2T>Rj=AS_&uuB7+>QAr6S}h}yp`pjOuP
z^&AkPX!J}oj9C*3kg~Dr7QKo{8eH}?Hx`P~Ntlo`C#iql1!pn--LQ(-*}+8c<IYeU
zEewlNbdmh^;H=ejam)fYlEI;N4xH2c;zb|d;qz9ul^uC&*?6fo)*NJC)<b1-z?Jw|
zhZjLq9`bjHEZsWYNOBUf?G+O*jz_gjjnf9LPdfK@+U^Kh8R_dABS7HemJZa7Z1-~0
z<9sjGEZwqE?R^1T4ZAhHwBve!Ji)n^vp?vtKZ3T^%`qeCagyeqfSG$F{DF*v!$D~K
zB{qL09humc>C)`Sk&Q#)w=%IKQkk4(Q7(Vc9t6MLD7<Y2YTLg;V<hs@w-tP+>-Sfm
z26zyksf&PN)wJc~|C0sae^s+fdR3QXSk1WT`)j?2M;%7^tPAnu!q#tjN9^%&ddIj~
zpTGU6P2y4e&P$ar^HkiShGZ8maH0N~L5sIj$isoDS?p=?RTMf25n*=9_t2&vq0*lF
zwv7Wi7Fl=`e*dXo99={_7dNR<^@5w7wgzY<khD3M?o8I^xr?~h>k$`#wIf(hPj4pY
zD#_6Gt8>eh(6y+gPv`BPH8I}-4l{)#<yf<mER7ubUmq2LME_M_tJG>)nV`}BJ8FP3
z*{ne;PRdhA)1w3q`i7o>3d{c@Q9uBj+s%R84UQVTo;payp>m(zsaDT59q2lG5`9tx
z?EBOVG8U11*y#%PnHl##FOVCNc2<^v813-lFip#q>NtH5v-9lGnUxBDebV@WUtUVV
zSO9a-MDm{qCbHvS1~clh`h?<H)c2&07z<hsuMquxl7H+bf}O4=^&s%yHTnNK5K|c<
z9(Wa)QVGOPg|Ym$=501g^hQ+3ze%HSp4)yNI^j$XRG+gBmYb#6Y!+onGQ1k%nbfos
z*>2U|)EHnQ`>sEXZEO>inhlN=^%vBC|6*LTQ_8uE3gK|V37VsqLe9*?30(N}#TbGh
zc9U(R*=4)h6}*Z1)hz9k=@J-%)$jV1eS6F(yK2!D4jC!;m$D1usUu^T^gCmJW4=NE
z&%yGeNfIvddE`5o*irpJqU^%~sN;7S;l4@kOsO?MS?>#3eQDx1y*)ER9LHWgFR3=k
zw`q376d3*?W+?{LQv-M&AMwk%+?Bq^RPy1h-F#Y=#MR;4TG#L12vUgZ%Raaa3=SR+
z+^!he(ibroK)R(Xm0i2%rT#CiUJwJkYa*M0kUz5;TvyB~lIr9b3@lOuCxn|pyfftu
z`htE9)_ad6fOtapiJQX`aChg2i^3=OmsT>mV-^Fo5K310Rm?usO5}V!c%s#F`k+J`
z@gFaCTYzJ&oxw0hI7;#0HxXkMab@pbEO44m?H|%{IU^tqXkQAv1+Sim8KFqe^M)R_
zCKh^IJtQ2?E1u{ZZZf8Sa2h0fV`-8C(F2BM$%RP<Knu8y*X{N!4okHLOx(zj^I6eP
zWC^>bB#q$O`u_+wQM_pZIMFG8-Ze-zo6lSxS~e>cM@Q<`K}l`%INo@}+pnnI-fhtF
zVA*z1zwlA2b-KrCBT(}>D%!!7>GGG|DXnuuNn!ppYdsi)FP7Z;%0`l|kUd)1wd3Y5
znnkVa;XG!G1$h|?RdR&r@R-Y2pE_x7Tx)SW+y{oK8EUYG#rg@FpWF?wIGQGnWoj7d
zol_j2J!TDSJp%&a0d&hs^@2gJn;02eR1qWB!OIyJ<iTn#KR2qIdCWuF4~@PZAu)j5
z{iW?fBbIK*-PLOk=bdaoKJxthQ=h_j(|u2hS2O8F0vq|BN_pIs>!`OXlM5C|E4gI>
z0Yv+zYk{{ZnD7u~TC-l!%QAdMU4dd>YbZ<mhmUQ{SuW5yN0}(YH>8yr{4ULgS?)L<
z>#E~x*eTBwf$;yH2wK8-diMKl5hT2rEfvtQFMwj2B7S`&9}v=6(=1<qp}{~Xx=c+G
zGx8-CW4s{#2^BOQ?}1%Uk};cG`rQ&}$@MAEAem6^&CK{zlxkE~yen7Nd@^5Tvz~c)
zY2<fnmZ}y22B!`nV+-5%4jt9T&+U3jShVAOE+x=7SVs($33unBetVfbk+(UeBEe6Y
z&yo5L=lJqsxCsR&$bY+4VdmMh;Nx?oJW^H)>B{8r_^|=)BxK1sJXssa!YYoMfz);{
zgS*#0-L(C4$Pj@2D;!pS(AHn9OKH14S}1WlVf}Z{sARx?@X{5sEg;Ig$Z+ad|6WY@
z;Oo~Xy;QW5FskG2_CIGy7c+Lbzv!g_*qAAl`gP-}TW}%mGVMF$mw}06{lNDUtBpjR
zqW;S1TK;kvE3yx_R-Fsjvf|U{YWlCmSQ1(8cz@*EtsA-<xH5D#SUP|ibyWRWHio|K
z9KU$$t%J-%GlnJ(Y#soO%ZG}PwX*SD^~>tv>wLh5<p>-f<cpNaH&+9KP^%B!PUZoP
z&5p4ms6o9zUN-VTP~X(xN)lx>kAn<b-<6f}2w@dYTsD6ca1IEGWA)<^ea;F@44u!^
zoJoKnvoqIPxMUmRAmUO^A}dA-!;;fo=dB#IDh(a=)qiP2rz#9y`y5=r4QNmi^9U|>
zSQNJZYHu~O|CwcnO7#oK$7Xj<R}&BD-7$3mg@8Ii>CErTqOnA8x}<aw830oABd~Ai
zQ-Y*c6>u-ZIUVAi0!&Pz87^t}h-6YkyBfQaHZXqjP~l~t0Zojq6DFY!=v_+AYXCqW
z?~WtjMJ1j{m-A2dubMS8!K{^eeO1yU;|(thBtVyYmxyJqcpbN^tLKHnRl={rzp!6y
znz;S$XZiDXh(w3onDKHN&RM-LeYOyb)Jad|d_q~|;q<GiXfDdYUO+(gZ!(+0*FHN6
zX>b07zoFmysO$~TKrZB5JoN=eO;S!;l`1<p`!VC7T7nBiMp^wv#AB;4{OO|4s5H;U
zH;$f@ko19QOo-(px9hMN$gtu0c>Ni4Z#k%&$Zm8Lc?yKx>Tj6Oym{(=<qHDUQq-9)
zk;y=7EhlovF;M0SwKJT)x~!(%TEPC2x@^U5j`&^WJNPF%!5b%8_Rf~%QIUC!;!#}!
zFy*x$13-*II+MX(`WicLGEZ-MtGOt(vCgY=AeXeGgna(S&@q9o4Iq)e<%+DiPE-Xh
z>H5jE1OD`<(UzRKxEJ6@t?Xn=^75pYh~jHJL?d9KRS~_c%k&Z~mxnFS$oT5QOaPxk
z+y0PElkHv|G0x-F(Hv01sQbZA`XKK^g_e<rPN7N~$pn3yYMwOf?#xq8_IK-Ym!bF=
z`zf&6?@~RE67$@g`YT)AeT&HWsM@F**9(tRfZvesyu16Nl0r?%j!i~Eo;>rgBQsgV
z;Z4MJwi96*8hU5)3D@rN+rE8#SegOuJD-!sJFX)!m1Zs+ANu{~U;Bl0cG#rjos|Sr
z^-<6pOMR~`2lKWD<JZgQj}F#Di=fChb_%9X2PO5&ad&qj{n$xR#_;8bhP3kHtm`LO
zGak`v$ydw!=h~hlrg9SBL|*}Z7}WQT%pV$^+bi-8raCFPQz=Lvzr?fZjbZ?(@ax4<
z0@+uAJiffjW{LI+sjSXm&-TCRJ;z-1nM6%DuzhZ`y^Zal8Z#Ic8Ot9)4)pzO@`Ctm
zawsOoC#W}Hu}<vnVpr(!^7v|Jy2gyuszgN`Mdf<&kAkm3wQw5~H6@1e)a>@rGNavK
z$V{-qIt4POR?okBlCBA@E^v3SDAM!YRr;U1>j@!#$fF2rMxi>o3T%|W@^LGkPJ!>*
zS?0lvHsig||2mJN8{kRy)Xp~8%N7TG=jwelifg&}*BEQ?mvN1NfpogN;pKriSped&
z3tSfQ{+Ocfc&Vu+AF-!N`<Z=$IY}N0Mm;;6e`%7LRYK)}sUw`9gPk-3XFjnaPHV8%
z<w_z<xW`6}Y*>O5DD&ydDjK_*yScy3T!X~Xp;HzQ&|7WSvHQv_>{1MI;ilRpD$u@_
zKpmXCP_B0GKQB9n|Fb_uBWIuuwSE`tVvgXOlT$M^{GrDi)Frt`8^|iYecbtUw3Uxh
z1^6aWn?iC6<iD+U1Jw!x*DHRNVr3Q1kMB$Lb?lCpm6V06!`rydU7qW8HgDzd3fx0u
zG0EU&_ZORML3CS#Zh;jv2*~Ec>ol*wo7A{nyUHyV;aFUvy)y1QLp^^Fgn@x*F#I>t
zSKU=#Rr9OjFaVS1(LwzA#8FW5N!pM4FTB||iCiRAt`~<Owt$z_-9RdX_Pl`TupA|>
z$GkroMs|KgM|hf`Qz4j5@K~U8+4s&?3oG6mXg(IyPV$7of7H!4fCggV`l@ZU{nCPV
z=>q|F6+jk0Ih!NfD$_XqK0F(e@T)N*Z&NUOub+)ERwv^+yA#pLz%q2u9hS@&&h2$$
zF2vCb<6_^>&bsXWRt~pdQ^&nrXWrIIp$VZzz~dxLz5wq1F+c#TY{*A67VGm_lG!|z
z(9^Z^Xp8o;gb1$lk3r3+3wx(AU+gbTxQzzDOmWF!pMiz59W*ffq3e2#gxD4+=J7P>
zpikqY^AY$=6E`-2r!3GN(CuGCb`2ChcJGSw=SqVy^gb#T(z)DN@6+1rPJW|oz_eb!
ze`^9ouTspk4xFKaeg?>?rrRb%fvD5qk*xx(KFS4~VT)}9-)c2!m93vhp`N3Nxis9E
zq|+Z3s1dgN6N~~@?<+c==+6m42p_prxWMzJ`X%4dJxz<1UbbF(@66xo`cN+8P3si;
zJ|MBZW!hGD2h^!Po{wxOm5#UWGf8s}dd?f8Gv+`iyJAGRrPXMo?aG^gd+Ra=E2;P4
zzHLH5O`{^%WU=;FPmlC~W(2FQZkR?QSProru1~!&%|0H3lwbR_>e$J2h|MI^Lph5j
zMx!^9q9p6GL*6BlUOGH+(o^GGK`36|(1QJFP41$%0>71a_t!Tm=v^ylBxV_7)z!Gs
ztAg8^^hVx~ItWxAEWmWK|7SXpP;B^=7^Efg+5UQT_!RcRP;2jxn1p!;?E7%?)!QF^
zMdvOC8?i%d7~VQ{4l(Ft<6{X}+s$~2(b8MTH>m@Tdw)vV+mD<1KbmzlNFZTOTOQ<$
zQQ<_$eVwo0Z|ZD@mg}YE3f{j8{?DGk2+MDzZWrgc>UqdcC(+hxaVCDab2XMUHH3|M
zu4AO!-y_uE>_QjplB6R>vG(5g!imTjsQ}lj=gYYTz2f(qGSqyZr}lQUk<>rk>4|GM
zOD@+UI1l``^DK>v&Ot6HSEn#+^zm@OQt;>GUxBW}1p#olnePJ;-NY6q4Q9BxDzxU=
zU;cCPCDx?6(t>=}Q{dF^45r>3(UPq(9m?rkw@r9}yzMObZ9DCD@jp+)ZScXWRC-V{
zSpIIHqr;QvT)mS*abwM^|2e$6d?PsOEM{I<E$-+Gmae6!U*%7dY<ZQIjmy5(;rVoY
zZ0(z5W$(>kp~cEze<`dKK**bQVJ3m_l&vM;pQ3Qk|GcDiehLN$j#)c4UwEConQJpE
zT`U(9g_db5_|+Y6uJV8b@$f>ETlDfiGU1nr!5=HZ$JH=xAdM%!W*jt&Bx@$4B}(P!
z@C$GOZGb#GAFlMC#Usuc%w)n42Z*dzjpXMDdCm9A>Rm~cqAt~JTqm$gQq$_dKp>=3
zEty?ytp_iE_c!6tR}#j0@ql~OIkP0qQr|e>CZ7Pr7`HNHf#SQu{EL7zl&DX+?D4li
zBl%q3qIKt9hs8A?V!Z^8#b*e18PH{g*}=mw?636t3dz0(m}5&5q=%!z=ZX+Jcskra
zf2fg7vL3^G66e6_roy_hAfof_vEyumtzOK5`)qa-flS&kA~biDX?cYA#_FI6mwl+9
zkv|8V9Gpb}1F-_d>ze?jEx6uaVuLm}VFt#lSFq$;^O4kMh6c%mS3j8f1Xgy2nyp3Q
ze^(*l?&p$=%qjBQaDU@kXNXfI-6K+<+~Uk)G=X%2ic^N_vK2*8TEk5Y%Hl+*xP9h8
ziE=xqKzo*eJArWnAb2}lbQ%-P0+p8Z5aN2>ODMcfJkZISGXpXn#-#lQZ$epNY8JNU
zaW&;(yzsVDQEhZk{|fO+$vw9BWy!TD`a`?|pZ`j_iE8^TEO>YQwn--}#5-w`LhdE>
zrdz`@gG&Fj$2B{ckfwy%o55yp#WQ6$(&@|6JV!?WACUknXz-9MzjDqjN~w-xVVaXr
zmm_JU&m*$pf-VPZemv>d?XXahV#?n^L8txwWIIuE;(w@|v|;}%&~o9Z`#_<?9dD^t
zYjM-ct~DRdsr9swW~%=5yFF+r>BJanpAfe9%EQBE-F#7M>yfU{MNBtL_O7|&2>8py
zfITB{HU(bH_L@wsyko%M5j0x%RzD7hd4dQ2;6!=xuj_{aD4`^V1lwDo@yPM<HbRN(
zCH4NzcJBaiu5P`iGJMTifHbG;C49G2Jm&x1erM#(3OiKx#B+)`bj)+fuC)g)e~r(+
zxjM{dKHZxJWoAfY{ngHPV*iXB^kjI-WRu>9`iqn~n{Hh)k5FZ`{_;K3KzU_7w?zl_
zRN*&6>y&lvrYoEBl+*b@TOa;dV)o8YQ%yeq9iG1z=Q#+}M<9tc?yQhaY2E=AzQM%u
z9CpT&i2WwpU`(72VG;9i?~BvmiX(^2*En(c>LJ%6FKg{{Wyh=wSvQwOeV(O(Wjj}k
z#%BlIDnpBcD+7@ka{Qlx2&UH2-N^<YnQOOc)CV$Wx8qElbp~NU*L2@+3LV7zt@hjf
z!&-*ZMW1&@)M3rL{vA-=@7FHWur`5rUyKiAR#f4&?|x2iZ-xP$=7}P}6w3lc5m)Ft
z?iL)?Cf%CeP5ZAFCh^4W+wXi@T73L%HML1#K(o)NlN+D@?kYcolxPyXZa95``_SfV
z^2J9~K{-=cuH#{k*$qz`NbM+4%j<m>A5+6lMP1!0GdXE?i~1nkdjZB8Kac-8W_MNR
z_(KAxL@_ClmGvlB_MUY!NQkjd@dMG-_&srte1i!xS>wqxjR#X*Y<IZ4RbeXslgaki
zTIFDhrtz}dltpb4kM+WB_{zd8gPlpOu*Q123B2I4lsl5Ns0>gK<}Qm&1(O+sKf*5N
z>+y?+m`MrJ@7JR=Q4uJk3&hytbSOs?*&^fzP8u{<O=#55>}y_PkMc^xb)(@U+dbd4
z++yIneeQ;YzFK=-9PD;207iWQ6sC9BYHPgyts?&MD6OWAk0<g7w7A%Mn25`co0GED
zsBdc^Az}1zOK|z{0lq-(0cOW~uo|wve!+KweDes6{7(skm@jl&?ScXwz3_z=Uk+XN
z?NRz_Q~NQopcJeBcqi9fb&7~umwsF~Sm-N=%&zyIymm|~npvx&ES!W_zPmqg)ZVxg
zxT+2U<Q1JtKyIv5AK8%A$`N^u+t{e-iC%_Tgya{xk3RxJ8jvC}#Hix>!LQ&c)%%(V
zPz}b?_*FhJf(%R4=^zZa69hN7dKYG7tJEZ5lsJDiIFb>*XeMzEK8)E70rlQ*0a5<(
zNT#@Osgk5Vf}PK0X18kH<XfFPxnX1>14NN=5oW><)z%IyfSGh`dg2Mln~no^UlrZ`
zbq^i>a~v}gqPSDOqVkyPS-9SOv1m3QZ5mPa21%oAqpLzXAI2#{quF8!F&@r^=_v>x
z=2=>Exv(e?|BZEaP;DFId>T^?$cY_1;VQ1C_Y*B=p4)%V%K`b8dYk)ae#}l=AkZH7
zoC9(>`)UnxNv5F3|Hvt3R#(HTred_9jpgzBaf7%=d&_u)c9eZoYg7=l`3F_-QHADx
z&5Md2ZIn)y4{?&yYk)`^VY|4zXH+4L($7ZNWMF}$N`jo!+8o^#i16o!P)<cY0je6O
zXklw}mb8dkCx5=Pbo!ky<TkO5^(Ilbr=gFtRG)>3Wk~sw<E#$~lHQ72jxP4?LYlFW
zkC1NsxHJRY*Vvt?YqQ(og1*Vt|M+8*YCPs)vhA!&Oyg7r?$#`Q7YBGN^G_BlRG>||
zmA^AZ?2_~aod*1RRi=xuX*)3&#9<58$$zAdCx*e@FE!P{fuX2_5gMnjco13i+l+HM
z+&bycFKZ>+K*n|tK>yDmT1jS~B!$xSjBF+Xj!%W(*+3uH)qon~B8yf<8#*ye`^PqX
z$JXQw)Y2<mY{qDTk^1A_M8}oQXW$kV_)s!szH_H>7V&zz0O=zI8<6No!AvKgX!-*`
zbiLNPk4>;+^)qAS8u0!uxGU#xIcMe`&A=a()ckdq89gWN;AzNhiz0YQBz8M3@Nhr?
zySKY+*tTzG(RrJ7UOsvSrrcu>d%;?jyWrM-`l20YGdHBA4praiwd+AVa8XxZ_B&om
z=CB6Ten65oL))V0*7RwcOd%40kux<ivtVz(J7K3?3C4N1zGpRk>K<3Z-TnIc_;5<)
z<>5T1k4mZI<S&#nXqx@6gIGgKj=uqbOa><Z4^ibXjSnESy-8AZMJ&pf0{I#!4;9D5
z-1`dUB)m%)I?pCk(Yt%JYY~q<dDx4}E-|A3n|s^5m7ZSDmiPLlQ7~K93QoBUb@V@-
zq_Toen*^Eny&7WIM}JnFz0dwv_@)++E(p-h=^kb)6aqE*MG|}V2mhis8AFH{l>laj
zH({l?C%%CDYBue`EQ1v9ylrXXOn(WlO3c9=e&ocCK^lKWQW@kL=v!lr9_s`GF^zN#
zkL=#RA93Q9HW)o>g**hazbp$CmBR@HP9RL!i#varHv>8z@RRQ)jt(X?zT-1e1J!OJ
zZylt_&=sAHsrXiZEwx@-`bGuuYU5$Ej_WBSx`G0owlM=@C&s^)XHmZMd%U%X806E)
zyK5(w6hqu$EK*BS7A$B<cik&de@g=ozC1HIn|IkaE0@MIC^%UK7Dd`p-dx*{e|;hI
za6b(JQ9y~$d`X43s$ceIpDxdE?*6YR8xoPDQydzC<aFlBj<fIhQ|u}MPqNRA1e_!u
zEMCgF4iv59OUnierdhro_?hYEn}diP_Dx$G69JN9*^*rnXVZAQ7h&uj4&yroByZ57
z6C0udm3e0Mj--fJ7(Uvt<&~i5thoxU-X6wxgyG+8CIOv-R~vA2DOsN{5PcEMe^Yu3
zZ>Kxu=ZdzZ`=&b`R7ctBLB?rOK=G2T0X6nJdHyP*x28Z(Y-x~5sI(%F?$vA;7GJMA
zpU+7G*CU9o))4yLfNv|?#>q)3x{+ZZoL8(`?qfSr$=}yze6We&OU_a6Zg#+vB=&Sa
zby;g!ztex&OSI~m`x^Y|`gp}C=SIEaNFgF!?zNhS${*{{dWYe1OugZtr!9Khi*EkC
z(*(Z311kxz9@yt3#bp)COOM{9%EFpDN_u#p+SDc#mu}-1o{BS!Gqbpj+kDsoCn{xM
z6~$-|TD}jp^bvgFs(;!ys<9_~pyYLSBQ*zolfs$CZ~r1!E^hqfVoD_{8S*qNa}_Q_
zv(?AGSJgw2W<wjv=o>TMbuXc@H<yR!Ma_CnB6lWU6}J}hfCu;<FwI`nB>^<H$JX4o
zy0{mg{mo<N(}OB>4+9Gb`$zo|<w8XyLkVz2%l_}!P6UN|cuiL|BS`8mCXTVB+~m}@
zbV;5LYSlZtQ`GmTbt}kU1E@_dfdpG|A4tq&A~c+(o#xDV!p*6bxz-DktqdmdeVg-h
zviy!5Ciy)zc#ov6vmlF@UdfvcxQc}=qYQi9pH{E+?L5W@DBUgjRf@i(5&U}sOs(ND
zKuFx}%hM)Lu4-3wW!qmU8!Vxhi{Z92t&_^vO6zW<$f@@3_nDDzj4#$Ay;q#w+k8P_
zWEES{d_V1=m$Vi#=$_QFke2q0;wbwn^9?f&73MKBS&S34ucV%($N5`Sq%wssnUv}1
zc*f|5rh-RM=w;}#6PxhkY#y7ZlRIhG!8(n!+~)^UR+`XtkEeDw2nQ=47d!&D-3=bi
zrPGF->6BvUea&z?Jvzym>^M6wRWjxwkNlbDNF^q$cTjk`veNsh=i^K~4pF1ib_Gd$
zlMc%i<DUBy3Abmw_thLd<9r!4ji@`-?DV<Uzmv>{VKrcNIw}Yf7+23&zH+PN_n`)#
z{XI`J7t8g}I>LgduHc?e-caU~V^#l^s7%spN{k&<8OI&BAIul8mqf2G;{-j|9b43A
zXC}U)62#9v-D&$NqxlqtWh9ioANZZ5k27UDJFeR58%b|Alg8t;$ylt?HD3hh+VE}u
zzVm+vWsK2!Ps{zOO7`K?o&30mjdiqqzYAp_OM5>}R?l<;kT2M<qg0EE0uhtJzZEbN
zl;lNCb?p2^<59QsFmuNmWG5kT-ySWGRSH<e5_^!}dOE2MZ?8zLv)5)q0QWTQEse9C
zwu6mCK|RgvFJn7WK}cIt;vT<mncZYxBL=eDxYqlso%xr+Z0nsnA6yB2oW`@?u)SsG
zI1&9i1Bi6W-3SgeqgfFy4k5);jAR_eMhzS9u-T%1c3~nzYu-4#w0Ns#77Dui8^*qe
zHGEE<4w2L<aHK2Ix^^xpFt&H(5n!Q=f4(al`94Ij7`AD54(n`+%N-<4Bbz9t^27ix
zczyW<mK@QNsJpk(T-hrD;2h-4mqaRSk`Es(j~1J`-1}9D1&sZ}?95a*=j*Kv;#b@6
zaOsXeS9iXv=Orr_*_QYjIU?k<LsY|-TLv!)|KiMqvoByITV_ud$pN0E#vIq=IWQ5j
zX$X)@qc3d3Ez+&<CfUP+$S@4^v5aZPnOs288!1T$WGF-fZT|IJgwct&4TdxZQ&FPB
zQj$<D{OMPJDh%{;PBh>h;(fylD5*-N)PJk&&B@-#XCgOC=J>1z0O{$dmhz^?;_pWJ
z!JNcn_l1-u#d(yM!x9L3-h9YOLQor_>Y~w$pICe7*}M-nOLb|=&|dG26w-w{6D-oY
zlp`{+I&o{LoX8A=S?;6g<+O%6ATHpy`}-@D%XXfJkf2$+`XeSPV4m;_14W2LW(Aay
zvF}TW)xFGtJgyRY;F{fMhacaJEJH_^do@(VwtCpAm>+;}>`R+-9L{v>1krE>=Fh|0
z+!KKl<WE)B=ean(*(N+JiekOdif-pI&;EOT(r6cexXiGP<Q1*9<J04IA*0;N#tN04
zo~~t6C`=f!?gJP}&P<X0Du$WxOYtg3chjqhD9O%d>m+1tj`^_RFIV4RFfuh>?`)2C
z?|3je<qhw|&}?j*DO}cbbN#fAT4)_gUC}BcdT|W1`#);I`zDLb7$5<UpP_FspU`e7
zkvDB|s;Dx(Fw5m5T}94O<1+O=f0@%r(Ywl*ZWjj`pX!FBfN=BTn5cb=;Bs7wfmnv*
z!-WQAPAMKqDbxAUjQN5c8L76GuUMIU>t@#^rY^##AB;Zkxcu3h?XzyRTjJh0^14Hi
z*xpl8jzT9UiZ?OSt^dT#s#}km3Sh+BnEeh2MZCu4){pQ)K+rT0VNjtoa{_pFrR>^v
z%^3{}6@RP?_yTo@@qoF5{*NeBTyomlxt-8pQSoeZ#N-d-)jqUBqshI^`+A9=alTjp
zkYo$Sr&O{&3&mv!`p2@wvXr*3$QSD6cvC0WCKH?OJ1+SkLBX9e-(LT$f9f0)OQ65(
zEt;lQp*(V;_kKL_ZkySzzDXtSi0s`qVi>8kig`6WWW8!#*+y$W>M3!xzoI^|+XUY?
zaDtOJg}5ZMaHDSj==C@B!y6ZA!x^IC+u3FXt!AnNA100;#856NF|4QSyz8Z?8*W2i
zUdv1&vzoR?T}MGn*+KoKwt_k<%DZ-dHkJK|d`h4Doc)Z<>loT|JGW2eQ;SN%n}bPM
zm6&Jx;Pb7~q=B)hnY1VMjwA><ZyXNgv*IfI|5aQ;0!=7`9Eg%BWSHMpNs(h*bM@fJ
z_C(~<7)fRAU8OGDBpP(C%d?7{tb#mF3z9UfuP*&05I<&ktqrYmo7{}Vt=T>mdMAx$
zY#uF(P$#x2+DqHGdYp%}NWA#j@lCW^(dzc(p^>H|&9HsTt@$K(mjCK228L2z-#5vs
z)QuVU%<!b#qW$fs)Bg=*?rQmW@_%po(CTXA0LN|cGF&AmU9q$Ydhw7K1V}za2fXbo
zyIvB^rd1hG(#2C9&ez2Xp<3WGIk%Zk^f!vJ+%EsIn4+{Y^1G(F_4rNV@xzJN%FWeE
zR?@N)+rL+{e1#pGPU~snq(siE!^uCuNwunfQFEc7XXm(JPSZBuqSCPD<8S%qO{kv1
zm(|CIJL`?P@0f`TdE;w_U-zz<7$C{jM%|)dnE!%1SzHh*Id;0<%TB<1du>v<9Pt3v
zvmaQn?<|iV%^K|l%vG{MFpK`(dKD*!TsXLkm6l7Dh?a{ycn`GAJ329;;&{*8Y(C(q
z0@5B6SVxDf!fmeUy$uv~MR8Z}o&)R3_$7W~w*wla`E4C1c1DHvSw7f`$Ixya0YTDj
zSM%1f%=T|0@YBy?HY(QD?k%1SBZk|Uoe2e3*Q|;%UeTvJ1fDb83sl*~?#fX#Vawv2
z#7SnE4J8Wh;EIG&q4DfSW?ikhPX@PmcpiuXs&cn7AY)zspWKt+jE?!>=1^4h9V>vF
z*g^=|xG_$WG=fb~&f<{1xODyb1qJhOnV~_R#Qwbh8)5}YXrR)nz8={2rjH_x@A+c8
z4FiLdSoPlX?Q+rw+BHSZ)?Uu(o??;Gt}5~!taFdQa^m23*|DGS8o|0Kpyb;LG8jD2
z5qn5Z5^*904SHWxdx9NP!kXb?c7eVnP%GEUr-;M{pcoY>K+ABB4F_`k2NRgLondRi
zl%{7J180D4uC*D|mlFI-_XH*RMb@yzLE6}jg|#vILph~W+SZNvzKQTa?_@8@tZajF
zZ;di|khl*fKo~+a>>+{h87lK`JA#y7sI!WY`9spB)+D8j02?3u!^B`OXJtKS(QfxC
zwVF)pB?P$;J$sboG{$5MRz<o@NuH9%SNo=QuA$kA|Ik0O=fRlFDVzH$#Qfp$?)deJ
z<CdT@CA-^!G`pKJ?0I*_8%obtb>L;x%}w4IjnRYJYBM`^rsYkXKlM+0M8%)}q{mOx
z_%t0qnDC?j$fwn;?~1(U<E^7kSr+)9`d|xfb#DM>s8+3R=0ncB@ndF3iO$G}SI>3V
z0xoN^5|k<`u=-(5WOh>WtC^osyL4W4W;Q?Fm*qaIp&ykgZInqOC2e6{!~44KdoJ7L
zXKA7%)a{JVd}O1c&-HYmK1@{NU6xWB-yl1TX8G@Lv?=S+%Szo#Qy)JD=7I~PAMKt~
zL|G`lI<VR@?Ne*TSxzYJ(}s0a+6_QSvoOA|X~OT<5{KSbOD|82?Ny79TiRj<H!NbS
z0z{wVWT@GaV8L-$jYcKVai-0>;(KnZ=q@^sHJI}G=vV5t_78<IYxBAlIt9R3ulYl6
zV3LmfU8{k8$Gykg*jd=4ZFJS^%bD@@DE4AC51IWHliLhA(J^5@=a9Q_=f%&6bb43g
z+lnMkTm74M?@Ql5nEL#cDfoZ*ddsM|x@}uDI01qOg1fuByAvR|hQflo76gaj?ruqN
zcXxLvf(H-o4tHgL_w2LpJEy&$^{ZOdT64@X`sjj)tJW$;k+05=6nq8VNW|wV^a+-K
z7&>|esNu>w7h7l#l4(>2Rq-{}#NaQAuI*wN%Z0FTk)CRkg6&qejcb(NO_)3+nflMz
zbl}f;;MGyGw*s!&T%`c}1`dhqQ3i>GIjf!MpC-19Ar>XVmUqEGDF20sLG;W(=p>e)
zbq&4x#$r$<Q6^M~_+v_1a2ktBih9qBVFZ^}me)J8!3m=3bf49A4S(%D!z;BrV&_m_
zzcyun@;GBmzkcZ6Ga2RgVs!mHlu_B9@3*B9oh<!RqcSO<dHh>dWi}cv`k0UB1x|d~
zgN~mHU}DGYp_0ygC;h(?St_BIY7W#Vk|-RzsoZVlh>OeQJiajoH}=K-ZD*q;Xx94~
z&>NwV&QE?-e?+pJtGEFiQ8X>NLtlnkjG$^rJOmG*qEvs1o<-QVv6T86(F87Q#M|Mf
zq%baBg=!-_P`{Fvc1E@!b|d&-V7`aI{M`ChlH>MxvS{mctS%xS(XcqG#IsJR0B}1S
zzsyy9?vEH1x?S1Yh?UH8uY~^L&B@Pt-}j8PKzAe!tq+3=g*e<z5sPgpkn21#i`WHZ
zr8oNknarqv3hbL}XyjIBRTeF~T=gYY{=E6UP@z}pFo1M#c3+7E&72^@`MHuR7mHLQ
zA1cRlH|=E5%-VGF4jsL1RxD7G9llJUiy!C_zY}z<xjkl~-evGQ2Ecr&rH>R9dSeD)
zIad|OM}VGebE?U7fBhM$2AwS(7BQ0gZal@;rYq{`hiO41D&-qx?m)LUjC{;*Y5|RG
z$0M1D%ai!Dkv|C@GT}oHG7B#$rfAC6QZXPq<8gz6nj)#fXu{Ht2N@U46JW~;k?sSu
z5193@Bo<?-c`-+ZEP%csL4mos4@%%o+tnZoj6=1lHO1u06`3uhs=NGc&ev8bV<^8j
zIp;)1`vkVVKD{^%N)$)2Z$xaBeYjW?+x;^#FZY#1jvNVl#55j0=lC8SM2K7s!atu!
zv0np1zh^vaw{e=o*H!m*zWo$F|9Ze1h59eaj{C1U2yQrmY$_Mjlxb+6zRjB^(epVD
z8iJQ9o^ox3t)($En1kcYUYU#H_b(qCxIQ)ny?cNP(knCtx?)ivG<4Ys4$9x(|1+P(
z*C4*^Oo0^*W8GAMoP-BYJ*dTLLUd*7>q7Oh7+6;)SeW`gOh=!N-9F#0w`QQf*_A7s
z%{6+cPBR!tM;(i4pybR&JBCOZEvN`>rQtGtr>Wl4?WZBvo6Htkp1%}hZbb;l!g(P9
z-tUbw26Uo4XMnA-bG>Lm>_q;i`=e?0Oo;^Lx-8dAv*X2yfIW#*+38=k*;6}qSoGHw
zfS2*mxLhN_oZr$@@q8T;c;@nb=y4MaUi-Hu?G+vl@cX!+mFexe;?>0nFcnL)KbRf%
zx@w^*+DcPZm$r9!+7C=rQQ*sk67_ws`f&!T0(eTJaJXFKK}+q!1wTZ~oLPwdFs}us
zffyyJ2eim1LgGnCr)kdPNxNRf;T&1db@{{dIi5u})<^dt@e3`86R-b9=0lcUwEq2d
zW4q7;__aZzWmDk)v9bIw#heHBP|_jqa50oFK={n-=IDj)pbf<Q*RsHI+qDXC&Yl`}
z2MB4UZ(v2vEavHxwl7ARlYS;K&?y#^u4cpPJj`OgyDL@AkQPmU7+Jm;d{CM>{e$GR
zZ1$eYojGb|puc=WCpP}8anaWHhHo&9>uEepK<yAu=M&vxj2`vknnOh0>691_vp!|x
zx?^aMD^(#NN>nRd_)+7#${)Oki9NtXJBkf~12GsBC!#M|M?iab9&W`iJiWA*>DP}y
zr2@zQh?IAufxac=%cq|$EFaI_<=Q`oMAdwRnz(K$*XtyE^VWasgE}x|A-qDrSuE4x
z_<9(?6>KKnwMvYuWYzcw#zyAq^BY0T*A`sf`ghoZW`8(6cjmQrif}E4<dFJwDNT1z
zW{M(w@?xsTvrb{bn~KpPdniOZemB+{yQ=~`0xV%i-?-t~(ybHazJ}UR2J%7S$w_9K
zMG^KYu(Z!fg%`1yF1^8cX9N44^7lzUuF;X`(PnSxVL{QQLZjVkrU5y(9;K1X9)yiV
zl)~%?|4Bi}m~x|1Eb*!v2xUy>O|A93+_fV_rxm5{*x&)YIMc9CSPr#YTz*8jDP}u2
zd@PW*152hElsYs+r9}>+>Ct%G)GBYNK5?&Cy%(Y}X5V|yJw`KXn(<--;UF1@cTTI=
zPKyx=7rJy}=D^9I?9w{=jq7H)cb8@_8AIj8;kI0FP4oP4oxuJu<Z3gS#v$`}ti}Ua
zZh^i~W@!koX)wohxXk(x|B<o5wytLQO7;>1nX;^xNG?BGj)4U`>#pSa=|RqZoDTKk
z?B+5X>%EoT2aD+SYc4p%R6Z*n(R8*s7?jGHMZyW(UwqU+o8<O}&-vpZ|A7i|)_03u
zgg<f(%zws>CWt1w)j8Sq0mbdghXD=*>t32mqAW#{i@Rv1=)iFqzq<S=ulNITg6FCT
zqFqujV6uQ3N$poA%{<7H^Ou<2*$M5w?%XN8SAK}oW37hJj>p8$?);_n$k|9F>Oxn*
zGMn4%+t}Q`ps?p(IyfWTfJ$b*A3~6whi<)7(aQYcL=!Hr;|1q%2F?9|KXIe`VkeQ-
zpwQZXvk|&P44}|pO9XoW{AQsr*w={PV@hK9eY(Qb=>b8eXEr6_01d9B;s!F{f(R(y
z#_w4=o^<)wr{=%CLcmbZ?Z0bdL=b%?pp!{B?=aE?UA-O_GUY^ByIn4}k>PUXAk}hy
zl}K>BayiZ&jsMeFW8=N7rsx6BaDvFeX=GMLz}M`G&>G(ViJ-S39VtPW!@b?*E*UCg
zIS4X0i5D}u7-FVZiNEy~{zb-VI<Jz;mYZ}Q4AejV;t`gU$5FG4q3zzpZSsx7_=Z}B
z_IrM)Lo9KFlJqX3NN;=Kd~_#y*=uBeQJ=!d_d4n71l$PSW=2S=2QW-Mjq-XAW{c$j
z&Xn1ay2@|>95Rt4q74EsCIi#}R3zqV!uOtCtgbBEulABK<(lQ`b5n!Wn!sj{B;0Ub
z>}R#jz)zS$m@$Q^!Jtc8Epj{pbQ@OU%Q)K3mjTAKt0z#iRso5T+r1eoZ#`|dk?(!c
zibL<a2gH(0B)Cvw31aJsf{(b!h}<IDxLz<q_+fHHZ^#L3kEZ><mvlu-!dGZl=a=@P
zZoMHsu<*7iQ~%(z*5-M_iz$^h7>-4iYKl-cdd~AG$-kqGE|%<OY!b)?MK(;ZEiXd8
z0xg6Iho3Pv>LXft_XVB9^VbpYuNJyWAXZJRUo?3<ohyM@$cq;-Q6{o->ig^+=!`+w
zB(y$Wh6U4@+PWxP@Gwu&2(v?d^4<n~V0uW6&qzvROZn8(u++yKj@Z5ZgC?%ABN0ym
zPbrO{Q_fO~$QyGy;oL9XFyXJ5>=F&V<!{u-PYpW2gDrE~4KS8d%M*u#yDSZ==x5ct
z^C$YM<+BOV`|SIRH>57@^v+@r^Cj2+AS|YVyUS5w4i9$pgC4^3bfl1*;_`3&tjtBY
zEBO5e#Fi@)-+=-s?_azuxcjC_P$7I4AN2m3Eg^TL8I=XHjhSBRWG(f>SL*B!I@&|3
zOsc3KYIJ&-Z?s9$b8!jGGG^;)_-7##Xf7rwms?n#53G~cmF>xedN|Ll?g8F)nd8T|
z|Ino!=vg=KaVd?~R1;qf-nQ<vMB8q0zXHtclMprn*0a2q8p~;DhKKgQicK`tT-9#z
zi?Q0Rz@)JZ0hJIGV)Vq>k?qk86>32ds{I~|d~T-7X_D?<Ut2U?@INjS{}Od512-<A
z=L)dCCvRMJlK~Yazm#JHkTg}sxcouC=lMnWEV$6nTTjP%@g6wwpP{;avKuC69vC7X
zmD$Qap?UihKJ6{-&HTBDu@W%w8{`)YRPwnvu&9Yy@1Du%d6AT}4>B%BA|R#@{<J;p
z-R9e<uw9Y$u<D|{U2*lW|M)K*+F!S?|J0X#B9%b}vglM$De2d14ktlMg!s6>x4tV*
zP`S%#DZc|`X$If!Ck*}P-t&IP0K1<;z8mY=SuGaVXI6Y%bfP6qrWzGnDi+<TWbjL3
ze0*;?D-d4N@l;&4TBUPhZ77yL&p=mCj~&k_muv4}b(kV4e-xY#LqlIx@+JeFE0w|M
z(f8?@`heRrX~laT#>pfhVyFF9#34@FA5p-?lEqb}l3}^QJ^{$)lRKCx+8$x3h~+UK
zp9w3wB>aloj@iY%{Pj{knel*B>Za%#!$NSN44@?2q1{=0)vwFCO7uUyu>`?xbP3_(
zLA~+ptk4;5d$X&sl0rM`_x$OF<3vZNxN2WYDSZe?G}+7TwfV`yN^JDK-fmS_EV=*0
z?pv9zUl}Daoz$EqW-ete`EZ>%8fb_gLJRXA`e#jv9pHy?0fbTu@Lol7OgQ`^xO*EW
zD?%!}p~8LjCYy5R2(X1%Ws@Kom<l<$+WP=44Xv)GLNo|%nIOEo3?GFUMM6p5Ix%yJ
zsK=yR=b%d8RRt9f@1*N@iS}4$g7ruOuxo6VYNV8b?H2AkTv8la4?qKtF>Q7*seQCr
zSq^1%mIboTX9*X2n9kvY^3y@%h9rE4@hxH@<?x-EAohlsGYi0PLxHR1L`ERRB;Ei4
z9AKS`WjpRNJOUEfU;d?I^SMCk+$>Blw6^m~SneZWwACV5CA64Dq_z9m7xN9zp|Rbr
ziQR05;P68&D&}$BNA6YLmtCF)K=4X1gtL4n^%*6c4PwqA0NHf~$dhjz$>C;0P9@QI
zQ(2=yx>%m+VZ(s=OLto)vLt~y7&1uWV#;{zMtGLg*BqK7nYpVkHClr&mDy1i(F_^N
zn2ap2@%G_-r_B=1c1I#iOhUKpxR>6I28e1fVw*MPAfxKJ-#Z#Yqf<(+UjNlK`uBeC
z3d2y5|G{1a69MxeLJNqlP)2^3*|nYH0C-$Pz%KZKGZ0XcCW6EB2y_GBbN)hcFAGR#
z8mYMEZP-4$o4TEVQ~k9ZTVAJ<nw~yt`|w4zNsLTe2M{2}e&DQfIu~;1_3uOT#PF9Z
zIMRDU0ZU_jvHhK9J0F=vwqj~!pUu?On?HX7_r(*b4?1AoYmew)`Y_wL8ZL%~w*E^t
zIgkFj4*pyvu8(;ms*jOD>sp%T)ngqtBG};Ai_nggw^cZbT`N0)*+HeJLdnW=a~Wt8
z{=bLyFB~|O&{(x4b3<wKNtpS_T_?06=<a<a<sPaPyBh)*uv>!6-04<|w!G(!ZJPAY
zdC!oX!oU?^TmSPDB>`zFbhjQhCg4W-Dg9HbA_<riyem*+ehh!$D8<KDBK@&BSJSb5
zR@=Y*tTdg4z3#MIa-0?g7dqg5a#2ixx&8P$sr$G#LyQo&;-5_47UA7{S3F*aT#fm#
zeA{0QA4!{|dxkx?!!Zg79Ts1^eVzX5v_0%DcbSl;j@3GNvB@~JDppXVVY@gSCXJh2
zkmI7Ex;)>wwYr@+7_;V*uo62EEd!Z5+s)@&tE-!<cI`UFlO7)z6IHUkzLW*hIPZ?V
z|LQ9mESa_weXQ@bcT*jIW4*n#+S<VH{wCmXvGTM_ELVIXW}*y`ej}z@I*_}*X_4HP
zD*4;%Lghy0q2*Ez8yjD|$*;?Z9uqUll?ueOvS7Ua8YTH!L^$J9c{u11jc~@?MFsX}
zE>X!j83FJi*SNeNFmoVAQyashCBZv0>q0QFlKQKUM~DHC#6Y!1JA*wyqRnMKZs~tY
zd6W1~vmd@eN#wzJ-G@~bTlBpxL>9QJEYYqe(q)gv-7|1s$2+b|q6IIjN-FOIM7Wb3
zcae`RBX6!uMBI+F;TmvSo44)}UIB6?9T1@E=7wkb3lq5fqYZXBNg=y~Do+Cl*2qRF
z2Vxmg@1+U!kOxzQi_zSw%?<}}e<>mV`Y_pi>31^$Bl?s4V2esYnLIu)V4GA-beKMV
zJRsW(n*Mj3B)XJXmn3Fi7@vZgs%jhvHV!4=8@X5j=BJuIvy@6-A-&#=C7o2Mw#(j=
z)@<cZ^YgE_<{;}A^+_LNq6@AZ7UOZlyD`tHz&?cm&<S!_AEfK_bNX>6<Mt4HsL*A<
zjdS@DvIs7V;nDVxrrlynZQ#3LVec&gx2{<52M&8)lZ<bbZrlq8&i3Rn*-L#06aK<M
zZbRdVu<Xg!A;w06(8N$NT}HuOOpPwFI4KP%8GE&d<vi=LF(pb7awkl#%2rk-DjKv#
z6+YUb6V{a-jI+hc;i;D}F<)gi=0r&!LSekGhZ!e@p9^2W)ug*nhYRI2w#)S?Z5GnP
zu0=A90-&wpcWkatg)&_f8yIJZ9<VPz5Iw{lju_T=qEFO{HPX(0zuuyB_uU@Oms6OH
zCc2*IH>ZEy4BZ*+-BT#Via-~<n>M+4$e@^23s2p%LgV7vlwG<oGdm^m8yfjk%5@Hy
z-brlj`xR@<ZKJqy3TIJRa4QkkXzWg8vB*6TNtQX?=vc_r|J;)YxB;Nc<nq5bJnpQ^
zTfnBck58*!{ykN%X5xzcH-j3`4@Ujm>Qk&Clne)5cqQ(ShOYxmG*aJi;&(*KVk^xj
z<DSz!D6`|GI`w!fy|{i9sw_}c$k;pxfFB^5O2%gv@`6DdxzD55rw^OGA+RO-ojMVt
zT*G4z8kg17PP;>N?+6xB*ozdJDG7l{qLlS(fgg49R$%DOW_ej*1uO=ewYGVoVcYu)
zlG!%gnVQSabe7_`R9~`;)N_(`G&&3~qQ){ByZVEXu^CBgJMQ}0wZ<C(Hu^zKe$0Tf
z&6@5O7L8?DllZ-p8bDm*<1jMRX?1H?5UsWvRlbGg&7p#zUzY#-G5qVve+51|kRuX~
zqh@|z@-M(_<gLi{b}Wv$Q3lb>e}u_K_X&V_a>a;pLWka1Y0mc|aAKYAoM^4yCm!K=
zB@jE}8S>aZN$EtO2gD3LCWs_)iP$IV5#S~i&m+sP%HQuqX38s5Dpb8snjH$Z9MPwO
zVUW}0*rCT7Z+DEbbokv4r&sifu)G8Kt4&2_7J<f6t1tGa^3<w7!!-kYh@zHwzhT}M
zeVD}C>yrW<*-`nNwRWzlWIY)DG(sp;aoeyVoDs<gM_GI6Fb*wCvPn2(cE1K=3b{b=
zV-l!Qr885waC=FT>XwQ|;%<zTfZHxHl!Q1}$MtaNI^ETCZl8_abU@K_@3=ZzF_p@i
zHlhN9Nw5CP4z&A{)6T5XC)(}@dsS5HH}OX90K<Io=cm!Qx9=v66-Y42(=^CP1JFRL
zcpT=kz<X5)Fsdg|L6Q{&l5!M$<PpM!3PTC8E;=0f<b_fcrtAoOIC!9PQI{Znxo%=g
zg`sqa+0(QPNpo2xkY*nX`1bJY_?QssQ24W(qb(D7OJ7h%0E!gnRXiXKj+!fRY{GMz
zZ2tk!ngBCnHTWP9!NOSN<m1GE?^RqN=csSyTRw^*aegjnTI;KBC>`C3aFZ^)w2~s@
zP%f9VI5sZrF&WU5nWEHW*!MCMETgm>z(=gZXppycOlC0`e7HBBv4{c4B5#gY?xf&N
zkRYl{F|JQ}5KkQrkt%;C`pXrxyO8Kr@5pY*M4%E9H|^MLBe)5HwzwCc9owN-%LfMc
zWVQB60q$(@L>gR~@YWj`f|$K)Fapnu%3g-@g4SLe(3sr5?+QFG)mpT+^V#Q#2NN<6
zsg1ioxDh{bC|ZuIuyzxBZ!xs&Pmx=g+OQSx_zWqkV-jog>*+YlQ<rymzyj~9e<zYZ
zFhve;sR$S4XvMwS{=PiM9pCS?U3R<W%K?@`&+H1X<(|^n8Wle5;Fh+hnn~3pqz@vS
z7`#&GUpJPYD_YgFcE7%~dL#&EneI&(#PeC>3@34fZnLP$)*S9hRh@YP{HfmSP`%o~
z*^bkHm8*Zw3Hip`?rQtMnW9no#R~Tj+!Eys!jr*2Ple}Q^QBq?x)18k=ke?roOWfe
zYj`+ohiFvm*+wP)qTEF69$)KhmR5w|SQ&GPUZSp^B3OnKR740e-JXHJH)W;SNmf&-
z%fyilOMG&uE)<n0@e9|NWwj<-?au5K_jMsP-JGuX22-!PZ-Ly7(;VuLE<?FcPLad)
z_y6Su(7%%s@@a3}h_-Rftre4Kbkvz5J3e0uDRglk1)p7G&BI!wPyaDvSw0l?fufp&
z+>bH@y}HI~RwP*%Op+Mr6{5ZKXx|yl>pi=h(#-4E%Ke&5?C$3JRwVy=mqnkFXWdEf
zL(cy7#)o_-`~L6#pZl@!3r2;Nf-e48+ZU!q;XNae?9;e@vCcHCbav6H^ix42zDV_{
zV7tenJ74n_TP9J-qNKVCx9FZ}w_r(Qch&Wv$6u6=${58_syH+5?08s}I}EGs8)41V
zF-5q&Y0=X)a1MTH74e2txP~1lziz90g1XR`ni;OZA?4G|hOC4A?zYT2ri1g=3w+dR
zk6COKNgn!38v4tHOGOW+y-JwRYo?9^kt{`*L^2{G<k+rXmDh#a3#$fv%g;J;fmRd#
z0CJC-CTR7U*LVEs9I<=p>Xgi36P%#4)jdoH>ls1gcd?}Cxe>Q{(%SOu-54Q#&vqE`
zKP%@3Mi>E<(kGfFCrfs|okYU9p!m>&oL@gLyD|BYD*BeRfC5TLqiHxs;lKzRP5bev
zi)5KAHR)5u>tg-M;$t+gEUP#N>}zo+{d${K0sK48%OZGe;VeGAj%Sm4eOEEDd#&Ej
zYA0p0MT&9yC*vg5Xb*Hj#!(H;GFVoe5}2+J^>_q3NuI+OPtFvDs+;8UD84$`cx>W+
z27VQyk>zSdHL*g8q`RxPS86@0)SiEaX|^-f_Gmqs5`%#NdGuGtE|VY`L`PV4M1A<u
z`%u9{9Ea-rtGfNqd%2kVH(%TW4e%{>Yj<g`U2Erl>PX0C>m+V?%D#<47sCQgtax5P
z&IWgyEo5YiMv}PRB(28XFgEd<^uQi0R_0KG)Go}q`!DTPG0~pLLhIB>UE|;3`W481
z+ocCd*ZlbP02n<JPRAWhyypyr0ZCP0NJ`2k4Y6BDYRjg8*x>XKqaY@ztr{Sm<u=dS
z-fU~Mv<1XCX_WpPz#N*_iDEJAs2p?}JY~}dI*R+WP*eO%s4rW?#!2&Lxft(l6E4%T
zV~KKB;=aM+{eYmDylgJI#DQsq^UUYaZ>Ny@+Uc4JKH&5Xp^iQ)6sdIMSa9f#ZHjzQ
z(;kFBgcYfN%e*0BHm0N9_!!lGP>a_8WQ>|cO7=mAKG?1Q+xr^3RemayBbTPHP#(^1
zS4TEi)xmyA*V%i-`BgNJRW#dLx-PU33!9Fa5^@!(iHRTs8~-c=4&6&AMp`$V*%C7n
zn`$(00^2$yQ21sjdc3}inBRC(hm>O$0l{ZOn2h1N@*zzQ$Lz$ff}qcCO#oudB7p3z
zEruh`)&L1SL^w!oKaU&nsoEgvU&FnVH&YZFJRukus}*7A9`L&{epM0XOZO))eF<bH
z`&PJ@`1H@4%Nve}&7`Inf=W`6a~W5-v1Qx6w?|;#R=gBcLaZ`Z=?zra*GY`;fVqy#
zp|4hpO10^rvghYJ)#vWDbB>Lo<tDAa-P^y)VHe%kuQaeFV2lE}ZYw!)oNVFaN>5$6
zw!*Rfqq4qe=8nQ<z=6<`E>*-xx1!Z^C_R=t&};{79X{0R2F+UW=kMluiUks{s?HS$
zgTt_9?Lf(A?}}$zBD1vsxF5-$_>u_&Q9YLc8Bpxx6flLy+m#wl#hgT9`Lb8TP!X3T
zKT-@*2Ml`cJE`91XVY)t6c{#G6V~pSX}z^|2_JY9Sz*1Z`)7eqM3?h(+x6mlVYgI@
z<d_s10HsI|X9!UYRZatc)!KY{MZ{3z=ru97i>m&EN|c9kHuwaN1J|A4v>li8uBTQ-
zp&)_<Nm=gdWxA=MwJ6Y~wV+m*j{QQo2XQHrrSoCG-9>pg{$c_W=hQO58l#1J5QAWU
zJSB&-uZ|qJ6QNR4LY{cr{0imi{<|+%y9w>b%cGf*jPX02<*>8qQz7g<CT&_<dpnW_
zjH4?+23yyDFtCw$h_KZj>q+K`uoo?b$n2^thsSl{`s`mw?J65iKtT3^U~YSxLLQNr
zItP57L`g+FcWUBRa?!2we;>`?j_#j6`|pKmN)}6{V7C*!kF|m&M~k;*kF>K6tFTSm
zglVyk6|e<665$CO9Vn{yn{4nmi&jG&r~R5D{U=%y>PWhXMIrMqhr3GA=sxMudrbP|
z&bVNT`qAAuJFUcc!R8v-=aGA&VI{v0==9M7h-BI@Xt8T`@pP#*x2o|d*>?$J&*fj^
zeMnODA3Vx|lyzN0@b#yZ=K6WSR8O%R7`B`!fB$urr&fFt^|B7xkd9(@qm-4+2O&|z
zFfPe!mFw;xx&V^;SiqGeXxJJ3G*VF}$BFYp{1KvG_nQbT*}(`3%rCK4%h9&%4qc>a
zl`#gR`H~$b5}~qyGL_51(Ng5bu+=SV#rYKMB(uouw3DPIuRI=t3^g$1iGEwr@`qlh
z(XJh|$k_eIgI|#EJ|Ddw?PR$qtw3T46A7DkqatQ=I68!m={+Wej;};_F(`%0b$2XH
zt=-F229X=jMiidAhC)(d0R@@jo*d!eeGRp9*(}W^D@gSU62rBN=d48f!G5aD1f6>L
zj{xATGA;>@=CocI8x{`;>XYXprxngXJCZQ-L(Kkb+ulG%-e@%|&D^|=35Dk3w@`)*
z3JpdXeICkO@~`SMjI0ixlpaEfH`XZ;rI!j39~JWNcwe=#HmC*S6L2H*QmYPMhe!+z
zl@F;}o)0@nqT=~LOW3H|OxQp^cwXU|!U(z8h&Y5!A;BjT;U8&-uIQ=-Hr{<T(B0*O
zS?a1beXKIy%TqBEp}*9(aOg(;u!+!b!%kA>7L^s-;Q)U#kewA;eXJ7EVW3detuir4
zjP8AYk21~)&Gx~wLc}^V1K3-Lo`H|+7YW5ut!3Q4^hP{G0@;Ke;4A3vY-bp;Rusx=
zWq>}p$HJ5a$?MAMSeJEj&24fiEw&ry0w9R`is2ZMjY)XOD8pTG$coI)C$j)^DKKJI
zN|R;?v*me4C=_{)Dwvu>p`N@RF06xYGFi-e?#`{uosmW!JN`~FUr1v`{Ggg2{%ESb
z_8@cVtxo$9$mB%(4FWEan!;(^2ExxrTl;1rH~&?{zRHmPtzw~FU!MpVdhKg>nTn(?
z3(~&8Oa-_4$%wN~;Qe4dvcxBPIi5TFP0f5`Pd;6!lo4ZB@V0wea?SF7pAC?9aLY>#
zMKwsYF_D=DjA|3w20ABKYK$vMtYu#BSoEl)Z82G4coeXO;i}w#Wjjee2<;xHGGDcJ
z#?;;4Ub8KJR>DjvTRe+*XwZ`#h9N#7QQ#bJwp%?-wjwDxUGJw6M<jk;IAj)+pNjJj
zBuV0tiAGhC+G=syp$FIKrk#0JalEX)b@F>fSk*ZH+z)CoCk2WI+8@}*m1UlFuhy~o
z(=TN!o-()xGY2BvF2}zsQ-<F0)JLS&ijCro@5nv-n^eUbwCKgOu4;H8c7sn2sdyUO
z=`872+^ZpHv~zDKilh*Q56gaEOoyJz1yJWZUi7)tTWYLCr4@)Ht~G!|_1#Soq6#SG
zfBOr?e^)`e?*H%N^Y{7vQ;YfnMT;YKu7_tR>lBlp(=F$k_)H9BT#?SRQU!h?D-?DX
zNc)6rT=nj92}1us=WWvBP@|?9`J`pYJYT9g8<_=1_+#wtm#ME~C3+1uGoWsH>IBMr
zyQP?mgOtlcNSe;}bOwXm03%+JZ~s%gfJL!J!!SCdJgjhhsyL#ix4;caa;wY>tw4=d
zyh)7k&(m#`bUybciW_ml_T4|Fg&IH9dbTPNjTvWT?1b*lDAHH!i(djdQnu&2h__pS
z@Ke&`<wo~y!LYj606?_hEJH|*%t*;I<fs`1i;EN##GWl4ThNj#_vLgplkI}ozZu9?
zwu0YLn(2Ink;fnVQMksilZi=1X)3R&Zd1$CH-q|mK>L>p-RgCv%6@bZuTzUaLm7ma
zbjRj(W%(E51C8XTIoB5YUVTbO&Dw?=>UwI~iiHouCbS?@`wSrSL{J!td|3SxgM^ft
zVF_hyXw7kD1t3IWty&QTxe|1GGFbJS)AiGrUJS}!ai>C2-Jmz}$ZH#kG%Cav$mCRy
zYNWTn>O)lJx>6O(?EyUxg?)g4*NOnBw!hfGTL8wp2JJ;6AJoax`7{&P+WGq8O;yMf
zkHe(P>%_(%%e@qM8-@{i?$32OikJaG)%4-UyAg{9AGewJP9SQ=`i~1Y?5iJSbUY(`
z(9^I{@50G|a2QOekT6=>5@$%OaS`>d9Tkic2C3D!9%`bhQ0Pd^8I<GkuYqq3WD0}d
z7#7LDr?I!_5;=J*TYqF5?0WPo?F>q1q6`1B?oR35uYwqR>?_(k8(xU8`Rw-e=9tD!
zem&pKR*R~(MCfA}hhwKYuf%3ga28>XkUmRQDlqD{T`%a>c$|NhIoYXwOMpEQ#svJx
z_<DT5W*M@KK#H8u%+;rSsgPt(*22j&-W&t#hr0>Bqv!69%>K2AAvK_p{BvTqz(EO$
zw`u<U3Jpi}e_^v>(Tzw!izXVGvx1*xOErJ?K$=TGbc7pi9}O1%sDHRQS@vdcIOqO*
z5x<ro?swW1ef1T_rq`DB%hXb3|FdrLr1xd;#`b})+CZ~X_lKWv$P3Zk>s8pA?Z1!C
z(<1s=kTC|ubFtLXv6GBDojN_Y2^&*Zf-BS(mDvC}mGq-ATh+ejz_d<)-;=MEr1YFN
z{}_fvsYZQ>UdNwrqoDm*u^*CXgo30Dnia`oY3%Y=QMNiZ<FF}=&(bfhrUV2n-0A3q
z)gQR-l(0Af7CM_*->i!4>_Cd7To@)<<00D3VoTF1AC*FosT1`bWJ_gOp|b6Z#G*8o
z76ncWhin9BrO?sT^X6dC^oujt?cf%EiK`<;$23^8#pReeXWyMDF<<K25X~%233<P`
zreV>C(^-hu5_^$B+su{Ku%%vsxxx4nrhGBFzCtMp(0R=nwHYhZD%cud6gM<VgASC?
zDx^WeIMW%mr)%vrSFk;z`b+v7FQtpQaYxg4jKPd85xbMoO$Y(E)dxC{1ErOPBS>JS
z!$Y$rG!fo7?bCK`ynxYUCWZv+=orZ2&Bm|O1#Jf)#f5y$eM~Q03UMNKlk;AmgLrQe
z_uD%EJ$9BWzRGUvx6l3G<i(UMdpHk`e7RH}u1Jo?F2dF+pM|Gz|NV6Sqvrx9JWO`W
zfaW95OvE(*&DbLP=m*T-omFmiDe~+uZ@GTI?LP0_p%Q{-!{E&~N+njs@jF@JE1aKS
zlpV*PCz4}gEb9(HC-aDqMopwGDSJKcv`=XqXlF^oR8GKc(U=xhH>cBka-ma~BvHcl
zamQ+$G9ncaXI=6qgJTG{9X*k7dQMoE`*Fz}CqwKj3uEZL?T<i`craU{0AMkRsXj&6
zEQb1W4tq_a!y)eob}F*n1wJo_VNA-N=l4^#!aKCM9ON54**Qz<g}Lyoc@!vS3ohNS
zSDVVnh*Cu`7-6cDjeSJ?Dq38CzZv7pI`tbi=DepP5dNJLY|G<GtJZ|@qs>wY?3@I?
zWe;xco~##?!11zs><oS;fuLn>y!s`-IBQxo-4Pnz**9RV7$t8xp3JfCCnT|l(QY_A
z9J<QVpMXk&<c;df^<~Z>NcRE#9Ul#z`Z+;9eWCbJXmU4>ne3F2&v~#0KoIzsm}@#X
z644}Hl=XucqB*giMp$bs6&YI%8r*U$#dJXcn-}a!Rj84)^lFV+#ApM*-3sp>MUW$f
z=x5|kQWI%}{HVKd7D!-UILQz$5Or<lR-xZqLy?!@|KT^Acl>)CXc|1jsMK)VBS&Hz
zw#g66$yPXJse3351HPF{Cln_i!%8+r@o%(yQN4{bz6m#U1+zI}Td#^50sTz>c6Sew
zw=qwXh_Gs0FR{1kI|-jWCn4U9thYU!K{mQK+rp$<Ox$BKM-J^xx5K~3yu)iDLjC+V
zu_gUHz?b<pm^;;BZ`0jHMP_x|KnO4HCb(EVA2LZqtdv5lhw;`x$OBr!)`(~9#gi5v
zT4KHYrbN#jo~L07FD@rV*30uI`KqD}sv;{^PIo(pt3|*Qq3;+n{jEb;${d+>cMk&J
zGtJ+GBu+jCJbLE~6UVgErqyi6jxC8xTGXEE{crE~Kl6k#5v(BD9W7aEX*y0f50jdM
z?gh;uYIsT_UPPj$u&6R2+iy>qksww6^LBU2n1O%*GXQLNGAW?$1~^_)RYXtwte(%~
zaX&zv1~sIg;MY}zpY>Z@I~C+Y^LP!2!QvZ*Xf(3jPY)VxiQ<A~zdUh=e4|SA_;AQR
zK%c>&36dL)rT!41WTLeAG81dx`8W|5Ric<~Nv$7oOeR4Ran|TH|C9Ys`6Bu6?oR8-
zPP@Pe3YS^(3h^5vew!x6jGO9+r5K;fPd^OHzXUNqCYNIKg?7#KUs8HE%nggIWt??f
z9p4(KR*ha03Z9vyaRQ0f9i2vy8}F@wk>(_Z;6WE|n-xZ$r&cA&ki8Tm4`pT>Z4vQ`
z!PVQ5Z8~*|-Ds|`+cgdXAd)oJx}v2gqyjGV57!~DcnwowFhdQNNa}VK)qr889Z?#O
zUmoF1iLTq}f)u}d<k+7Gp_5AH)s_sagXNM&U<M31gYZu~%~Jc(qW1<Ctuhgjv%g*b
zRYQeLf%uD(<cDEtG?PNvts$fM83NXTLh!{-kJkc#s<m9rS(~25-88P1$$?se<<>XE
zf#P;Dvm-Ji<;aGo`}yMaz$29L$*bCz4E@*6I*&d}`^iDYxp9_i8m<u$6~$m%>H746
zdw@LB0<E9yRHxTJv;KcIasME&w6KYB<UpK>Pr7gt<vFQ-6K6a(AHHE&L}++HJ8j?r
z-cJk_L}fH%!vzX-82?^;2LTu3MvYRh3QikUBl=He=wj>?s#Tvja_yGdbXw&elC^%9
z!J}k@%@QdYJj-6+nH8?+lqgKtq!o5I!zKFQ)XT-g6L6lnQ+^CL55?LEGe<FOckNuc
zI&x}0YS9DK6!!0-?Qd5X^~@);nSgYXWCrF=#ae9Kcy=@SRvF^sd()VerS{Nx_{Nb@
zmUdb*`II<D`Onrfbw4uQ*F2*od7XC^?+;3H2-9u~Vua%dN&HsK5JUQq=un}FlElBl
zsu6DUAbLw<gVq9QyVY3{rm=d+g9Kz<fCXp@K)90w>@O4h^wrrE9D+6iztIE<9R(W5
zAN5}^z2?clH<dNBv|q)KD#m`|Sf`@>5yN#OcH6v{onn#gDa~#%Uak{R3vY0*@Hp&c
zfQ5FHRM_{7!Mi~KD^v4?&xa9D_CeH*vxh9msHRw)yO3M~JqD!}VAiG}d-hct@=#>v
zBUIx)>QfBGWs;~Bjyr-0lf9g_>Gnw#{I@MB^|!yHL()RS+RVrC-BldMNxz6!!CJ_+
zVLzZN26}G@2)_WzhQCPG5A~90f<P#+Y$-Zz^|)bdZ?y~;J7dFninHocXpiC8R_L`-
zG*~Glne9fqM5Q0cYb+4YBVCxkEQ8RSeU}k?0<mL^BUB&Ve)qT?y2E&qa51pwT5`?7
zJc>`Ay`=@$8j`z%4<t$qnPvCmq`8!S*&ynnKfIGhmcwa<h$Hkc_UTT@Nrily%uE8G
zXYoB~>;*<wM|DDwMyl*;?g9)J#{Fhx;9I5piel_DhmY7~#8Nyj6TDH#1#aJ_1>7I8
zfqfnT;cgLN6nY{wqg@-|AX1~;kK>zW;2=79rBf1s=lx5kEQWY7@|NVo*My~AMsot8
z36mi26Ot!`W~U+w*aC@761TT$uiiOAcIvOc{{!{^Pb>vkllr~$_v0sn)W9G>k+A)y
z1OJ*I*+>*-Dlc<6_Oj?(F;apzul0~itCkJl7vcKN=XukNyC0&^`*6LTl#-1Wa}X=m
zpd0lI!x`l_6>Ou;w0<_BFsHa*{lLDSp|5KnVIUGd$%}DMQ`kM=fH0(2Fc7piLk?SM
z&}gV@=w_BGh^IL<!J&ehVy;9XH*Vj?B@h2D{0cb>!0MBfUz>%#GuIy)&@OXL2PSFv
z&GR|q%04dJp<%hljpwT<KAI0dg^g8=8L8fiFI8WDZ!eC@pv~^p`9>Rq3f4CSZ$<ru
z;ecqnk>7A}X|`xqHcio(X-tph2XP;7Gb;CF&~^4E^hl5G+Q%iMmx)i;6s8~`x~Q1T
zcEyrtqC$tffFCvkBQJ!=TA!2LZ<=I^!B39#1d3zNUqXQ76EoywDI=CR0{btxnNH8z
zeW2ehpMK6G88zPUG|tngt`X%4Ja4INN1q5$?Ed_telpN0ME}`tMkb-iqH=As8R+3G
z#T~ex?JRy6qJ3`ZzBn(*kz2GA5?9}3iIt?+q&*FLWc>P$3Wv;N7dNNrsEb;{Tj4R9
z4lhj|rI_<Hl8A0+Bv~$;hDKo>A#`L+$N9RoU6QOfg$7O__4$9n_0dJ&usbB%G_NKU
zq0tb}brQM3X~L|Y<?wGt)4(EZoEyY+y`n-ro1OWC1vo8TC3PEH<VTX33(^=O_<D4v
z=wuMru*qQ=>OZb`4PQ(I#egE>$(Fh4smHC~YpPkp|M+yHIGjQwIfrtH<-uD<$uW-Z
zBgp~FP^yGexk}a8UZdQyx~iAXZCmW-n*>k^hh~ZtiaOw_S!|cohHEV3;og0vqy(uF
zJH}rfudD1%8j%9gs+knU;)S;JE%ky=XT8ja`_7X>G?i@^-~K{QX869F!MOU=YKWNt
z!k_#mJZ^^+$oFQ~XN?U&J^bqzGU}q+=?gwsYxhnC4f9Pa%%OFIy>IE_RKtDnW1Vl*
z1GrI<k8_H<Yf=n-r8*w|Fn9v~dHOgo6LB9&GR!*@zFr}8*GWYr<MXbh#Z%qwhnCb{
z<F>`VzuQ>L!be1k!?Z;X3kJEA=Zmopg>FFQ#n$M^{YF<O6K4iec`!)HoCqATP~86D
znFFeY#hL(4s~Jkg>^{_ODNvN^FrlQLjd(IhWa0i=DA;v(=;bR4tn3XdJ99^TxEtU(
zQllK+1~Rk#S?EYC5G{1mjU%Z*zlcWwfpbT?Ni!7$%xh&-8*TbB^ZqiV{f=tUC>?LM
zGtm>O@#=zw=zVL@gw>9SO`|!;d+{&FK1SAkt2CZyGnpioeyS6i%Cl!5TE=f^j;U7R
z!lTIgoiqFyA)gjX9ds;M2N6x?dKhDC_$IgqbqdgzfhgvVec4T8+1OMLGE+G4(>DIJ
zavFR8u)f=p*$Mv#>irEY_M>3p7d6XwS`%is$i5pCa6<H^KTWJVjAMk|cnNNCovxNx
znnF3gvkaLgh)1BDzJD4^VaaKA=fxE^L4fAd83&M2DqI7XIEvpjXp3DFz3rg}yEc9g
zD@IQn{<n(5@l-?u`>JPXL=!<BpLS!bt@~TD0&nSHZ3SS2!DasLHXm#Dn9qzRl~1^D
z{=wM(126t>$mU54m^(L;XY%ihFtjTltdayD#}a_bl|S6;=PrKMBNef;Zfh^+ib}2N
z^Qy#~-Oqb3Ta#F+5oISCo`Np;lEtQWy)uH)5(~^HgY?L|6W@l^2$cpR0XV7byd3!t
zr>vAO*W)zaxA5RkKXrSPDSiQ?>1d5Tj?|dz>5@XRVirzz1a-y9a--HytA=ImolBKs
zh3foZisWBwJ{e<rRiuKr$OYPI;k`&7vzW64MzRb9WX1p*nKk=S_}neMI4}>-*5W=?
zBX*As>NS;AG}Y9X%|Se?B)3L>A&~e|-mWat(BhorfERQwhU;Q_Ob<CbujF-V-OAtf
zGW8uuA$Q12O`#eZ$*!!h;LJ+lskug79)=uG;R(A`>HF$z?@3&NiO|UIb{lx)avr^;
zAn-ZJUw9G?yxmB$RNkiGvS?}uKYM)3ps`a3r-r5A0RN$E96)wr;9TmRFSkdWJSck<
z!2;QztXIY)2;_U8F4bzK8@XkHhQ6<td#E|Q;aI=^Z=mwO9+4=iEWGkU$;hclF31?j
zC@ke|Q4Hhgy_hy++~nO;i@ZbWcKp55F9=<YF00u?5VXNDIaHwI$&x~!#2{a>(o7Cb
zzAxsn0!s#o>raGy587bqOs7%k)T8E7*o$k`O^TaMY|`70v~e=TQ^F(mNx5v!)$tDu
z+ED3Srd}Piiz~??CNmq=a!AuA8xgB&t1^+Wnyv{p_a86n467)lY=o6lV?UQ29}sYw
zv!t4HO}5rEV(?7D_5z9p|BSxG{K0x>C&i_h<XDbK=hdJ2Q8Onh4koG(+hnrh!Hl?+
zV|df(@ia>&abyIHlKeHP;trI7Y(aCzV$q^ozVA>^7R!*(1Kw)<gtF*`$_Ed5z~Yj@
z`Eedd(B;Q`8U0h^Nj#1oi3Yj?is{?V%ZcT9zU71XbC$`uAAM&cZnP7j0fSD3y}(>A
z_cz9*K^g~EfgTnD7#p_;Z;v7~H+5l<M~y{{-5f6yO{0sm>3k&94=6Fi3=tfLRKWDf
z>~>-6JV>7fX}^7oLr&3f{16wM8u=5Q7T2=M6;O&s2YC)trN~a_OBqm``-Ey+EvZ>8
z;R;~i^a___aFS_?gZh~-K^6656(9{RaaLG6pN)>ZjmCp21h;c8Z3u40Q8(Ta7K&~5
z!jl-94nuM8v!qls4xa9}%}65p7gcQwlHS0_g@tjgg?-Z)*8y}bTeN`<+dGOuLemF*
zk_s%mbh3`Uv9wu}!HxzJCrw_FLMI!=4DRuJXJGTu;tk7p^qay-!zYh@uw6RmGT+|!
zE5=IzgH!i6p$QqWY_3@;1d?j2TPR^x6{+Op=h#|jR+(;*iBWK`g$&?YmKn1VQwdx%
zZ73wd`V%u>xleIzHqZ_M?-yNq;VNY+EUqBqo4~OM;hM-FkPYE3k*Y>-Xc3()M&r+i
zAjDngF^4U~Y#>vzc9_p8=c6`<1!24N*!}-cuk|CaOC$}QQ0eTQ;rv!yz$*dB_$gd!
zBva7!=heQa{ggp?XyOMA?FNvE<c;>ih-Mikw&Sx0K+<4u>Udo1)3~wuJ)@AJ&``Ey
zLu<sML%;aiYU@D=u*o)`(RMn7!M*I=sCbSkex01WJF*j4)IR8JxP)~ryY#pewaq5I
zIq@k*;Q0_tC4DMxgLX|D@w3O%_JVa24aCElx0tGUlWEt%+Yt}K{zv^Fw&;?+p6!S<
zqmhR7#(s^;Po*KE#r5%;IF@=bcBZS|)9hAJ;p%Sf1))9{_j^Ai^Bs2{6Y%Bh)+$x>
zBR_p!T^^+18Ehf0Y`Y0T0Uw>8;edWn>$z5OTKT4xEz*$b>afa$A9^Y`<{iyYQrCZ3
z1UkvS3l@Hfvs@@N1?%?pfSu4Ck&#d370AlL!>#A&0W9rx!6*dmtYv7s%U1%acpM!l
zgFhuqR#jJ;R5!)d9-nmcxC}P@QaIZ+PzmQwkrJ`TW<}A6AO%L7R3Wwx(f@DT`*#35
zo0KFa3#85){pnMNGSd0+1tLZTLsKFJ4^J-B$S;pB`0EktuIR&g(1wVAp4K%Y;jc=+
zeVUULFMt-Zu=-Q&$7eVh{0M3Io-Gyv?w;&fsy`T1CFM!Ovm!}?OB^E!M5VIHWq4HT
z1F%1|=yJBll5@qlWFzU4@4ikkcFH7PC40!$9#8zDR2dW89&(iWhV7chA>e*O3E=S&
z`ab9VGi^HRGCxbdzko(E<%XT)YK&ie@K_zH=1R2|G5nF=(;u<-3SUi0r1N=nP?U%V
z1a7-6+cq{w)^S-cxWEbtpn-UyDY11CUD3};N5%Fz1BjMF$f$uJ&n0%y5V{O2H$k<o
zjR}JInJ|?+@eHYEd~}-oW6@WrVS9iF!R`Vvy;upuh}J(s?52|xP8h^la%a(szaara
zG|KoU=g?LXE~fED!7^8CuY=sUPhxKf$+$Gjw5QG3`dKKLX7&ho8GOZ2nDv_g!yzFG
zQ}Rn7UTqXG9o((qmze731}TOmT*U>`ep6z9c8a1!cWWlr*rt^x59u2sywO?Di*bRe
z1qQ=WNVRDeSoZhd^p?G^q*kz+wZjnEJV-aSu;`yG4vXka?~`V=e95=&b`#M#f6dx%
zX`cV;_5-M4&DTg^L(bEB@TT&NXOX}|S#H$UO7MzfG`m%%w`C?>Yj+Wh7Usl62@)}1
z_VT2%`L^lA#92-CO8TP@IHVCo_+m^#QSUx#^Wa_LvNIk6URO<zY+^<7NrZe0LzVk!
zN>7ueG2mVrcK$$XphqbZ3xq%UwHas<g0hI2&*%{dXZo}wgz|Dlx5ChnleN0Qi=6uL
z9hM95{jqtUQ$Bm(Yet^K5FN4GJGl{^`%j`z48~xO0H7}V@UZWgcgQ3^Xv(6JG@3iq
zV4*94vEzw1u$_z`Au9EG+-Ua)L~`=v-BXX2jg$FW0f>3m=4yHqJm!tyomj><5gVka
zqrcwyA5iYU*XRGVLk@q)0P<Jdl1QKyFVl>Dia^WgpHB>C4|S^WlerVaCxhf>*(l;?
zGg8jiGKYNRE6*H38``j2h+BhrWrnrV!0eXDiWl+Z#du-ksAPVwBQHI_Ws|gfkwGyy
z)YUD~b2!~MZ;BBx80n?{C0k3VOo0Z#<B<zA7uQJFt)SyQM*7^>7fx;I2Pp8>sXv-#
zCH>6Ab!J)sm3gxy>tC%DkLztu5WA1^tostQZx0-FzYi8T-6uETf2QeKxFGRMWT*@$
zpM|H)_WjLvyQ*d^FZ^=Faqz2L#^dMpyw+&0KN^5-Nk{wY5##X=jlZ91I!H0{!K{8+
z3%V_GUw^@H1`3Li-!;|ks-CLjuPc>8y_oE7x(+*MDq`_7A_D=rz39f!t!bQ;0a4mK
zv|Vv{riBQU%|q1;Mu4WCa;jA}mFi;$_A;Y|&-`Av(bro&yhL{TRQf+_i~~JIEM37x
zQX+~XU#4ulF!<-N<8YU3D6e6j)_`A4;fD*Lx`Y>Kz3!2VI&5^U5yk6poLxY2Kc~yp
zyBw&QT$rJ!0puWho!h-cQkb|v&{C^?XIox3dkx%eYjtKKQ}!~(ggnj!+55W6HgTpr
z(ZI)8Rkc$LD!9`ncUAakJ*rDT7Sc(<=eo>_H2PuXrDkV~6o1?q%US9u1MYF8_ag%N
zq@6fMop$Z!&+Ut5ti=3RAID=o8@5MN*6%q1AW4Rra+DU&maHTm??a7V8MHs@1!<7D
zZp}(G0nfz2%j5d1TcKnC73eld18MqPJ6Kdctga+zqa8g!V(E(n6iz>blt^I1DCg8-
z<!j)~W5;9Rr&4SEkd4T<@*YZYn=O=9u0bO-*|Bl<?NoTR+Yb@7unA-yCBo$NiA6Y=
z6nL`3S4cYOpQ(8L2}~!<U^R3nCIlr_SwlS#ebG_LSSJ9nGe*F0g*BxVMV-?-2m+C8
z{E?XlIRRy04Q`OMY;KvD69`TB#`EtU|3~Uk&8`3w`<+U6!+ppkwyq6@M2N|e*g_xA
z!+w>;YKtpiWGbz^2c*Cx1NOho;NgJC9P9}(uK41pcN90(943oHQ)9IVOz(5XL?*ro
z*^u?NnFN*{i{*IEx}z4|fjXvZP~q#aeR_o<YE|7!=U7MIkHS00@&+?atSqE(jXX%i
z4T<s!-LJZ$nsW)gKZic{SBQXg5SKocYR;pefbh|>-nAa}r#^-}2C;z!5SX~>&_DCR
zEKWG|qAkP~u%l)N`c8>FP)87Z#BMI`#tkAYpdje7!on~d^%7eA{8$ijnMT5P=Goi)
zH+pi7#~j8RQd}bvENrp)LaEM2>Eh#W90|S*2iy3y(v0EO_CHITJ0XtjFYz}3VnZ``
zgC!32WWw|;!K)adfq(d^|2;naM>TQyLUyJ?1xvyp;BbZ%^Wi*kpiB$C<fZgkyKt<N
zg6vLad?G`v_A1-*UNc7&@?gXhGC!+;SWz0Tyrw#{lS4Nt_?Rhpd4z0&bwE}zAb}Vi
z{ISS+a`uTXZ~NV5)a<^`%{eEXVVNv`>0pj<?y$m74UyNo06NU-lXgq9&uM+(w+HT$
z$hb_&j;9?A9Gy?}x{RMQiS<7MFgJ#k>va+aw>g+g=GXcf+h=Cp{nbO_=AB*cZaSTs
zD}wvQD49J>PPfNZo(QS}z~shet>zQ6&0OER(}N`m{<_ZoWc}r`{+$}P=ZCOn55(^3
z8jQ||hm4E;s!fcB83{yU-VL%_F!AEo&*g_DeF;(MW9j7y^P|_U6+20bL%T|PnZEZ(
zNjoV~oh`ocz6XB$8zg^}X_=3y|2I^|L7pPFj1U|jOC4WJg8XM4HWc+l;3ch>vqhCg
zP_SdSno14DQ~a#j<f4?=pA%yv<}vWmjSi!!3ezD&_AQk^ATDQBL`SASS!$PApuK0~
z3ohFY>%iCd*jo+1cx+hTN%sma`t+PXqCZNi!)`If*nLkWv!F^k)lYRdFN#EVcWZ#K
z-C%L8_4~ebq{^h1aN4fu1^+(UZWRQipw37RcSR*(XL4DaQ(bF1z{=JfU+{j<7CMc~
zN*_)cs|S$hWE>{F5jb4^jUhjfRq#eKOO83MW;|JtD3T;EG?BEAL`Y=)-xXJ#?ec=z
z=@G!990hs5-0vy0x*hlQ$s#AiR)@{YFzb+%*BOO>i+w+gZu5Wmdh4ht|90&gB!*6<
zI|b>IZYe=R>4pJBK)Sm@x;rJLJBIEK0i^|mp=9Wx>%F}9eLv6sz0Y3zuUW8Wv4FY0
zah~V#ISvLfsNqLBi+6J-bJGX@^YZP#*k7+X1h0DTQYxWMRri+SMb1HKkhfl2wMlIQ
zjzC4aLFd8`I(K=|kRlnSTv2#9kS?qU<eow!!sOH#TU#7{OUp}#uwgY9@P;cCUt@H|
z3&zxrrAK#nKi*c1Z(xz06-IG5dF{z4Bhy1i^D*!fxrLwGO1m}s#<v_GN)hn9G><5Y
zFJ)Fvr+J&o<|u1aUs?}pPUz*R(j3Z;<aUDfKLYgXi-@lH*%&Tsr^TR-QL&)4mdt$w
z&uV<I(o~djC8^@v?P9*<Jd`3kM(DE9IiDO(>>V#&heDddtC21b>OM4pvy7Mx4>gYP
zPUk-Nk&Y9>U^n+MrG`f9jCCZ~ANt54%jJF%6T!R`q`v(s7vrR3_BVDZRwu6d#`f;S
z?+vQRhkM*yME&cJ2icLnRd42Pe}nuAWlSe8&2h;0HbFMehjt|H^6mY;OAovu^1TF4
z-E%9)@J*5J4x@&0r%3Odefn7rX)_8Q2J$7k@9>eDdq7wd%+S-Qx+N1%R#L^k`F9IW
zaneWp-HT~osOlG+#oeM`PCoSCk?7uUKW_VM4acRq-U_LX=Ent$q>AKSzFU@9$u|7o
zn$PP<f&Q$ttuFiZ8cJJZ)+w_VV@eqs7OQ7ZiO(sbl5gA@kU90+Mh2T^`_4Vi=Oi9w
zkM{id^gnr_19{Xbi7ZJ>RQ6fs)$7jo_BST8&{}1$hzj6n@76vm8+>J#l$vJDUg3W`
z8a8YzkuLa-HTjjla)vqkV~OfX#X{{&oh;q_X6F@M@+L_UNPA-Nj6PG6s`K!~R0g^5
zbFI(gAlCk3vA%=SP%LnZLFN%56sdAsL#a3JUdRx)NK9sPbkp%`7tg76>%{CgKNyff
z^E=!oF81pbF4<hZl1OLh^jfFpCXT|3M)0#+Y*i$CE#_6y?zLJFvaR3mXqDt#H56iK
zgX(I+ZR<V3xo-ZmBfo1Zd~<#>Q^0W@7sm(ABIKdaJ^Wpa5I3Qf5$9RJ%H;oaqkA&O
zA4z6u2Z{trrx+?)U7Vx!t$HNtD^YyD#P2j_e_ByvY2(dC2!rAR6O7N$iXsCZ>--&_
zI8@+S-=Hf|l#u31OVCsTulAlVRdK8Rx{+>^m&!|zd_=^McXMu2_c!&|2aHZ`fv_`$
z6^vUCTE-uY;CP-l&Po|{LOE6R$V7?Xls>)>`pwyWlw?DFr&T_0!vVyUxCKU~ywX;<
zIuctoKgi;@VI?+pDL@_Nd3D+n1lH~YTp}W4@s`eW|79V@Qoa;T%bJ+r2KY8QB@n34
zE+s^!V)X)rOfv73V1LdgV1eQe6&mqKVbyekwg4ho!^6t>KqQc`AzD!UCLmamBEZ6P
zi7b`eSg8?2LGRsbBjbUhb>e}6f{HbbuS=H7>!cTN|9xZ_EQgM0R^9NPOvJ5{{v9(|
zE75tU^0d`Sng?`slw8ygGMrZ*3Br3$OD0W)oCU;*j3hkoUE@h|61Xo3HTbw>G-FQH
zIhpl(yu<U{AXP`97g>Uq)r@-OgF+;pQAYTQLNC<<qJecCF;;e_xEEfad>j?~3)T<u
zKz_C03fRpOyPgS!y6#ON!Y5f(dX=NKPJQvmYjdkD!1CYqOfK0Xrr~Fev9VI}%ilbW
zpBHPTBA3a*;i$+7{jYuax|iYz7;H8hs+`}=(^zj3pD%Lx(}IGdmblijCAfOskMLoO
z;$cZQL54oPM9w3;a@6{jyz)_hca3<&S346_zR=U~PdtkQsJl|Bwv*t7;_18Cu?xxJ
z%iZYs-kE-!`fJI8Cf-1DVJV3TdzWv~rzw5ueK$d^+;P!43zvfePR*tJD@(N&T{OX>
zJUfI7So$CITZjz7y21B834U6?kwVUZ)LRHO-3gTmC#*K^a4`EY6q}XAVH&`r-QRV2
zoNj8UQJY&GH15%cS8H-Xc@t8{9-`w`0jM>h>N=d-FJ4vR;m7`l`#go`g|<n?{_X$L
zPGJe_kx0Sw=@=)Opy~Kis`=M5pGtL`Q#bBS*u4lr5b;Dtu_E2OxSo7qLRD}76q$ey
z+(MXE4$dsz0?F1<J*2cQ(Nh1lWe`tjM#J~5d!78(K^7fMtr4Xi*Y{|U>%K7j!mG>u
zSA^?NTxLgLY+%2bZ8!FE7!*)#qTu-`IUu0#|DZx<;G#HS;K22GIHS=t2I*z-bcT|U
z3VJ9E7!dj<{%%l}pyFP*3Jl-wbY~v98t;l7@d8AXr)L}eak3*k5#e~N$B*K(JL?Pb
zdsD`>YRjvu;$~CW@Pm-e!7pQ_)T-z;_$x6?$VvR3J@mL?=B;S{+~#2}kgaM2?DVDN
z<EGg23!;z>d8*kEp_S%wXU;AT<B9C3dO!DX+&i+q1eTkKO;BD`5w(BI=Kqi89T1~F
zmkfyRA?39u=u^H$c7Djp?CZY!H75-Rg^W2kIuHAxM}>%-ex#f$(ii>o4$w+mJ9whU
zNwOj*CgG0v0v$*ewk!k3n{5vAPr8%QfH2$kj99jbIwb;gX5t05tXi|}FV^FC9>zS3
z*-W@CESy%vV+G3ZCSA%0Hri6o6a^-UV4FBfs5tmRNzfJ7_Ts~cZ71LMSSP!K`9vQE
zU9BnuM)wOCi~i5G;#<rkFV_QM9%DvEWEn0#g3b7Xe(-!{4K(oafg-`-DKL2Un>xLG
zM6ipn%bpqlWdWuLKNJCuTaNfS<e<78oMYK(J5v}ciM)f=eNeOMezeMBmE)?F&No8!
zAtF#t4;qbZxXGe;8^Iaj3P#7VM8o+bGrv;x_-nZ<*b<|PRaNW;EC@skJztq@4!xIW
z+5%?tPsO@Hw8-bQs!Vf${rz+TDlNA(RS~1}Q6|4lb{rn&IAFY|5c*l#_#`j784r_|
zPlLuN@gf7(r)}t(5)UEv#*<2r8fLvBx#qQ;R49$6Rg*p{;wd4ij&}vFO>au)8m-^U
zbN%h2oX6NqH1P!$?Mr<a5)V<hG&=?oCLz8Y8huRS%f0~=k1`+as;*uk&jUjn;X>Y}
zz$K(RDV~?&X5{3H05wP4tvk#it2VT{wL|YUq8=}^Fclk}5VAB4qYIB-k_&TX4fVVS
zq8FqmEbQlg--mJYl#Kg5cd_Nv8yac&>_;DdoXVJa@Cc-ov|f=xVO|%1Lbp#rVpG0t
zsQq@-Q@v}~VeIGqwS2SU<``F)yVAJi*}-PJR+Qw~NkLTg*?D)#;>WsrK81_9utD9j
zy*gZ*Fz))wI*><toZF!?kr3>CJd1Hx$6d!J)#fl_JKvVj6<*3TSG}{$89$}%T#Iv%
zh_ep|n{n6bP0ua~*nDcVYbR;tgYn5yy-Ki9y#e$6?m2<yT2eB%`A~@B%{>8|^X2O2
zwg2hF{Fe&*ue$ng52UWfDjqL-;D>b*(Ea#|+_|X7>@Q%XVJTWPknjGMc=D%U!q5p)
zvF#vhp!zqF&3)#gGNwkf)ZRFpq=j_~((J@I@pKxCaal_PD#2@YM$_2X_$c>yBWW(T
z?x#ze(W1I`ld^>qf}6vu^`Q5TS93B3G2wX1sOCJRpz+M6gQA;aZRFBf*wvA1+^Umv
zR>Xy;604oJ^IZfa>96|c?Xe%w{a68Jy(x;v-C3Wq!iZlxuD^Z537#K7eM>a`)|C_f
zFB-$_58LcaM%FF>x6#YTrr@jM#&P*NZtc{ooBx_&%)MH3U1&~4#Jz}9`&Hw(TfUn^
z&Ap3CmKz(6XHX#RnZe~}E0`O@p=v1F{Z58=Yx(50%4O*LF<TcTT8|C-2mUT9B@S-)
zM>@}oChmI62ToJ<Tmdhgq)`S&%2~)336{;x|I}f<l0v{CRHSYAsL`rsChhZ9+(+St
z*_+>!;c31UnFLZ0xmaUb2UI%I?37QoJ@L%Q!?;;#aI_G71<{jm2C7x&U9IYuO`L-3
z3H?fG!ovwuebRwbri`%<Co&N}MCtPgJ*K1;-SNPPH_hOEP3=5g?K(V|A^5|~Tz#eI
z9};ze$TWH-4Dm|Wsk6h`-`jabPe^eJF`4`nEOr;=KW7itytl8`{gPhQbZ7v#-+iC5
zN`?s_s8E5fNQCh&hV-ua=qlFba8{9{{T^e~-BNtCY(SizTRM^coE2FX&Hp)?3$iTD
zfYfuoO==r>ncSxk5-SGD9b3vJ^B2(X^fD)pzIPW$=K=If8Q627i=dfWm3IB25OKFZ
zP1;5YFrj)DBicSXC!%-i<&}5*sNyQQqPkQb8&Vd}EfbV=`3&!j)o`r;xF1DQ2-Uwm
zTyCO-;60;X3?gTc<;hHZk>)JL7P5*~7aznHBI_Wa!C>{ENbM_kxg%h=ELhLoY)iRH
zBP<O?mKa(L{4qjtS35=4O#5XMbiN^dce9%}4ou)Fxhd*7mNaPjoqy5#Wo94t^4Ho#
z+u6q3y>MbIa=dR5I|;`c26U#*MX)ez8L1{$C9ZWqdr042AAW<41Fv$xnKBoz9a_r3
z%#9Rdsic2vK`C^PWOHAliimk+Pd?{F1Z5eSwVJ}{$_L@V%>8)mp+?ZMO4DE^YU7tX
z#Ajj5-t;n2?A3@%R{Q>d#Z_!&4AoK=?WZi&JqHf&Ji2Kz_JxepAY53S?<GGqsd?J7
zlIC}qkQd6dQ7ht>S$A=F1csMAOt;ZxCL!2Ih?j4usndBy<4tqPl6#54g>M~jp79|Y
z`5?&HK9uBn1C8|tz*F7osEba9zsO|%6y4XS@!=%Y6RuTlu)kB6A>r@G9Hr`Z{5`Wf
zjN7S0^`(!I#w76?CfKbcJC#<des^Nm5Bi(w|2;+jGs_fxR*Llu;3Mxe<OqWj$N)W!
zZl{-pZD{w$|7<By%vpG=k2}py_BHLn`mL>c518cRKq@r-&K7Al8m$LhzveCbLoTfj
zVAIGssb@r${iQvRYV#8S;o}^xjEjjKD>wNMPyK>APr}G5pg%(>z``ZZSw84k`iP6A
zEZViWCj#@&oKKI_?*_b&i{10!8=snqIn(JOeDf4+d489nE?xBexmR!)E#>k$!SkQT
zUlWTyHR&aOTQ`4`rfuvc1z3!b=dSsibWdb;bJ3BXA7|nf0m4IIw)9T)xO42qtFaLG
zb)0gD-vrjoZIg6qY|GoL&xU<x1HoT;ksDe)dToiHEOVsqE?cjl35dac>ztGiCFqFE
zMCZj2f*{aKfc8rNYS{R(&ZYgp=xT2RnGp;5ty3Zs#*CLNZ#ZM=ho2u3%xwwyHtznt
zPye^pb&qjGfO#ehG3r_h)5KRzaWZ}#4=<n10$)Tru8J}Uhg6P(gftspL^=j$t|YSw
zQ1qxGNYtE7%LT|kP%O5~__O3l={0}kcoX&94SAU^6f;!OV+IW$S*IjqqhBc(lW50k
zI^)&blxuAUdo9v@K+0x`Z2_Aow#&h=QeyJ(ZL@Nk#TRmTsXH{i#uhAoYnbbEhRy<{
zZcQ<dmjA3Mc0U&9IIyVDTG%tsDOVt3?9nVY7)9~H+3&&&vI5+^L>~v<b3~ok9onZn
zyTMeLS}hgnV=a0;VjsU2gxrzeJwI&!3QoHyRmiJB<GZ8N@ae2h5B%LV#Dp;dl^0ol
z<W(JR;cpeYWub}TXeySal#cXx?&O>K%f5E3(omj`+!E3>;8w$U$nT(#x??Leja6zF
zSNp&WiUf_=cF6OvhFu&ixDUKN32C$jD=9?(O{N7pkC5{q&%eCCLIT|p84d35L>tLB
zet?)fQN;aonjvvv=~7`ajn%dDuUf<#d_#<Mu3<7+)t$rJc+-ojmNh5Rm{TMt9(EF$
zXS<pC_Q*;@y?tc6v`AcFWBN~Iv?QJiRoM-H-MvbbNoikkWhBz(C0UcvS)AndGokn&
ziY{{VylRHQvd7Wt;AP-1Z`NGuLVc&EAa%hw=CA<J?pNH;CE+-s4=+bd@`A80xx{w%
z-p9+QbqYpZSkIVC?99jy>8%j=y&^4&iN7nd><u#+^OXww7*Tz#_#11Le2<41p67ar
zXzcUV{?R<j><Y0ehtLxyi81{8e8HtPFQM)rOr_QwS0rj_DE5~<3=vgI^aNe`L?VLm
zwvu*SuQnjcLLHTvb-?Io8wm6oPiA?aee}2Cb<)e>eZE#u%wu&9CJS?z76)cq%?-rx
zqz2MnvOE&{@viKgtH_)f*QvWv<~%{_Ymo8fsuIt<^Y#By(v*b)^ww}!E+FxEiel>p
z@cS)VMpRX=di3550-iDVbq=RG*oHVBi@o&|wQhlgB`(oO&cog1OzV>MY=idkM&dyp
z8f|Or(9D|8!}f<}BHvEg$GN&F04mU~jjy^Y0NsuyThCd*(|>>`;dt6xw8%-2%avkG
z4O3aR&pr9QJWg<R>Mt+YSvk9}v$NmVhcvdrSpO<WoF5wY-}6=Lv3Xz-r@?-<*C^-m
z@SBNCb!+cA=zCkw!w9T>4`ULGR6i=KMgsSiI2G_*aK+Nmf9Zcw$-`D&uaPkZhhbsI
z*#pR`*Sfc=hi%T1^X`G~Vs99}-QoFkTFaUTqgm_#U$5=lp^c;Sf4l(fV=3r?toX?I
zI;oE1&Ku{hWL}NL@^lW>N!W5zxX<k%@#il#mw@%_(VcKo-DMg!d9mYMDu9O3<4Vv}
z)j(Jo!^rhE{k+brX3hYe0SGL!uF2Q-t-xh}RWa!do{%>ma>PRTX|1ws9534M+ZVPE
z(hk5xOaxy6nIkHlAea}7HF%-2(DFa*M^DtqBdA#T>81WBTU{drqc)KSQDmWS`g1(W
z2GqmMu;MbGtD?mQ#^s%%QD6r41A+GiNbSG2!pRQIyPZDCEfOd(h&;gYxH;JkN4|k&
zVmP|(ez9&bb#P`R+jtlsXlPWExX}<<#xGl(kL@oJz!&<+l)tw*`zMO>d@i2Q%hII+
zqzg{3Jh>DbP@fvTQsDb5s-xE4(6)o>B#iBGmPq!j53zJW6Ya7SKBo-PEYGgU039U+
z-5y-80@(eCH{NP=2(ijQ)MeHN>LAdtZRXX;$3M0e(~}UCLp95%M?T;jrR6jSon7E#
zwpy!!@-B~8m=8ZgG|@dhEml{|8N&&X33*tAv=(~Mf?VpC$Mbbl33)yaeGnt;n#kmT
z>vh?opU9X59`ibDK&GCr90FY(J5m1trYqP<XtZ3Ludg*|pGy}qzT&(>N+)LhprDk-
zaflWjjqM!~3#O>juF3sSp*1;LkK;+G|6K1RIOJ_$Eku=jQ<!IZiPpIgGz3${EO5TR
zKK&eRch9C?7}8)GqIxe$E%N+!u^4zf-gW_Tl=51P^anR&2++*B*X$wVV&0b{fDwt|
z5H!oaYso@0)Ccm87g+{vt;@GP$%6XcoElEjfa|O0v*XhkU6wtHHoHeRPNIA|37(`%
zpD7Jh829WAgjK^ppZB(8zT?73a9}bh)JeSUJFnPnu1Q1*)9a{z!e~KSZin&1ob}Vv
z@NKq@t7V%Sh`6^D2A~cs5&?<7uQR_&JA4~uhgJ@UxMjy3^xrIDVkH#N1>1+E;TzS(
z_%F(XsN+jba4B6_;B~4tgWx)()J1L~aILlXTu{u5+dXwVTw9WYtmsj^Gys(a7v>7P
zmIK$<x!)RJ<*-Y`yOuC+ht?{k)WS(7sN$FF6cKs9<dCmUQ11Yh;Q0qQq-OL3?DB_+
zy}%^iL>z(7>Hn+E`WG1g*Az**hcL+8c>1IC$x{$kwAJ5ziIH*HT2+8nkli?gxvNnr
z53BW0>Cad!eWk6S;_+k*Lh~AH-%cjln_dIw!$`a!^?Q>|!7{aKpAdFbJW+q0$FJgp
zpJRr$&K34GiZ8qq=-$PW_yG<!8bIzOt|LE{G*{NI^*eFvg&nyTdpKr>H4wmBsQNU<
z40)gH6*1xETd0$?lO}YU$v;KNLklvGv$UGqVZVj9Q(Ii+{^GdQtG2Zs&19_5_d6}t
z245$sW_>iU>$oy97<wkX-~01NJ$Q=le0Sn|x-(7|M$1OC=eZWk2QL2!*XjpG6}=In
zhey_`v&n^X#w<VF6fJ89b@Qe2ND8wQk9F^=nl3$5Y@e5@=$)3{tAxy$&qt`8b4GPS
zHh|h;q%tG#lSa<hC2!Ae_3N$;kq0Wfts%f5u(;OG{=L!^FxdB&;CON@HgJDXc{gQ5
zgN#ddA}RPeni8!yr#%d<m#Osl;{(pyZsYIAm4ALzeU0>S8sDkv-gjpZfqRSjKKoVh
zmHXnWaM$kttLeUX$5&AFDZ5XCf(30dU5*?I8LW+Cd#ED^A0qhE!WQrg3#0}<kbQDg
z1x0&GJFI^5l!^=J>b_9%cUXUi-A0)(6vHu(ppMQsVv)*IJgqJbc(j%r%s;{E)AUSw
zPn0#zR<F?sDTU4w%dM2!<pvE+SZTMcHR^OYghcXCKhU&&qA@)<lC?e`Sa4#{M)!oz
z6malz6g6sQvgEHL;l5PA$+w*DROB_xEe2T7w-$__2v!w7NU!^0f3LdPXMT8b?i(8*
z{BZ+;<wI)(R7flitYt=1BuuX^M|eK5U_vem^1aWOMragg5MyP0N!|Dr^T;+b5@dL?
z1B|lL0|=?BrNsPHIsxmP{Y6L=>h;+;2@kRj*Q+FgAl3JMTno&K)W#{$OHq~Suex!(
z(t^qk3^TEmB4aJ<?C%qejMA3H`r;&n6f~Y7uTNUu<p{?vqQ}N_WPA<fL;Fprv90RG
zKJrmXP9I7`3mAO}WS<gYjaFllHUOI$$E)(Cej?w7ao1qvasGj3{1_FcQp;Eqd$3OU
zbBJDpQj*FGW7?ENyXBGMJ!i_pTNI??>kGj9XbkZF$?kO89)rMo;+al=^7IvAj-G+A
zmHv|RfL!`dL`wJlSrjVS>-NfOu=bm9=X_Q4HO_0*-v-I~6oO7i8)9$s8XVuvv&6e+
z?22ah+XjMsr^dwLy^&(k17j36i{M=8D3$rz@b&2Z21}g+t1d^m{=}}F7wsF7xlIPt
zM|P}kz|vv>;@DiTo(bpx{Q$s*HH|TgyAAecdyVUE2gqGBJi*qD=om>CyPY6}@!dm+
zgPMDyzD!>ak_k6nPm6jxh~L6cV&S^X6`VFBTyY%d2F#ZOCBL@=-t}g}M!-*@T)4Vv
zK~HX4JWLI8mKJF6R~HQ@+iAvbU{{C2<(t-d7$((5Se${pPssC$&QS{CYa1P!IBbzu
zMOOXf-iv)WR=+!?iosKvcbqq;fxJim#j5^;;`z^<`a17lwno3NLN@R?=yUy~Ge7Yp
zn2`P()aosBc<PVbD()E4oqIoDX~;au*-0n8EsNeO<P1#~GWMln>XRc88!~~XyF&{Q
zk?0v_frd>Q-URAgsd8c><5cY8fk$u`t|;5qQ1`*W(f*8~uuJQO2P^);0QPi+ruJwi
zh<+!I|5^k;==6M5DFyn=(cED5T*pto=06%>F-mT~+sI*LY1_*B|1$DOI1bD==m;@!
z+419-QG|E~|KYwH$ol%0O`40Ri7#V-yr%p45aT!UqYAM{`8tUH=fjs#U60F?r?Z8g
zylJ%Q;ygc4Flmw3M?aKH2W45m7k9bK6qUAIU#>M9%V_=tyEA?*o0!ng<LKr@Tt!?8
zUN%z|efTysCbPZ*|FfjM^^kBJ6Gr@VZem$G6kGJ>y5Y7HD*Rf!)J1WB?W?l~dlinV
zXlJ{3Uc`1d)jqw|OYW7ix11du<6R=R!4c7!j{B#~^bP7)t>;FJ_C=iiElaq~?XRbB
zaD3PQNzQLjM@j}*lRG{(?$C$C;`D9)j-@!Hd?8X`luWCNCQkdjb5`O7;y8{$tD2Pc
za%Ch`W7fd(;RSby37Y9J>-{W+nLeBv9!<<<@Dh_>!NKxKnWxbZWi*qN;J{h~8eOST
zCCd?m+Ji1mSJ6The-P%&{-R<b!RYEjee)HmBd*A^<zQU#$}I-#h31^QZ64VT)?F?2
zL@T%7xO)$GxG#SnT1_T;$3ee0naWV7(A}a{iI(Qk>L#0j%3?51u{E-Pn&*s8Nn?7(
zVl2feQP)$jA25;IaW)dsAycXKtw}LrQT<?>pe0u#`@yR*QXi>0?r%W*09cB?c%>Cz
zn&+ia?~MJ!9<3K)Fn8}yYNGmd;>J|+%p|8?qk^#eK3#ZHGFrNdqgW&(%V|78kbA4M
zQGT2*eH4oo?`A;)9xaD71-QdvoG1fOz1cXT<N%R5pPEB?DLfOKd~VJlmD6&<ArT||
zJfe_eLEc_Ph3t3^QhJ#;RE4kDNxc)0sBO29E=Lu{*GfP_ydkC$8(%0fz*B(Nn_xZT
z0T}i3_x!+y;Ml`Sek<yFa{7fXU+*+Vk~=(3PwIOho+TD*lESK&xSF%=d6v2D9k0Et
zvIu#r2@*wmKk9DL8zPB`)O|X8u=dW&5w2ms5}RX?-c&4>RnZ3LUEL6A*&dH7HMu3B
z=UfB-P7jt4tKY12+xBAs-o!-+p9<5Cwz02fa|zhoL^Wa&+%x#JaYHk129lVdo*I8-
zvdREB{E_<Zn+WkMq=ShDYClIKFkosF>WyhDh<W$B#&pmR7UPT7yl9rwN7mf>8LrE_
zz7($94if>4o7_L&L*TP-e|3&M?#LKnBd5Jo@7p)Sq^2prB^Q`j`exYP+&^=q+7D1}
zw{^H+(}+KK7pJ9(sACYE>*@3dL6A5v=qTFS&iEGdqJbh&B2RwFDaUix-(#ca{C{H&
zrttyRU@?tG0qxP)0yOlOq1vZqG`p%9!HfQ-j83{eNSv2+>uSRrT~RqNXfr+@OK_|v
ztS-&f7Ro30FV^6MWJxQbL3+ZrZveLlP^}4UFL!^zQx;fIx9?=qyx0#vP0q>W+mxVe
zA0tp{Gu@8mpe(l8eaA6x<vjdJG2dbE=fbDdCG25>D4nRQwJ5bO=J8YpUnhUgm)>=r
zZ8mUlE5r5R*R@09cdP5FYfmR%_liGkeR;t;0;qzMKIKLNVqwEDY=62PvZQ^_;}>jd
zl56A=S{NTE?sY8khCCuAb{CFCD~sNsS#}zA3ZJd=s(z%n{U}Ya18Fgw5l{f22-O3h
zjRJXSKQ43l{KX6DzuMkHD0n6mZ?z0FWaByDlaUJCI1<~ByWTb+hZ7`+T)n5g?dA3w
zD0*@=*H>X}jQNe8wmSF-jGaPWKlxX-dIvKjKS^}?thxRJ>19R?d|6_*Xr^~=8u%lp
zR;hIhy|+yLj2Eyd;CPlwnNHnp<TDd`>rt7gg!Wc#)8HM8<K<E;i5pv--+HqOAR$Tr
z6X*F1Ma1p!xt~fN<DB*ERokr7yFeJnOIOQkWsP=aDk~x**n-VdJbA7T)9XfS<|@4=
zw}D15_IIBan26_f0wM=6En5*tR7Ii(#P@$gc~}!TD=<kUn*mt6;xDcVR^wUSio;GS
z%zSYP7qt@Pp)3+C$Nv@W;$F#HXNicRH{uq*O(Qm|$Dg6oEbXNjtG0*MtAx7aXbuMa
z_dgAy^&YEu7|X>_(We>vWvmu={|RqQ(?t>>h4<kZ1=8fCdnAK1)u)s55jCff)N9_C
zzVla1-2kf)`kQcuY=F!Dvfvy}%`~xicz|#pqa+kTk!u%#s~3j5tDLU6jRA{_76I=|
zTluyoSQ{QL%i<tWGsH5UC1zuU%sKu=FEwcrzYtmjEW8sir54d(UcfO{p1$1h%P&0t
z8{gCkR8(*OD(I9mcs_GJ`-;a}7e^He0pcAXuqxm;hS1m4Q{PF4{4KIzYn?0m8}wdU
zq+23gYNvSw49+~3*jd*xSc?Uqn<W0B)X5i4ugq<0ajp7{q3OKQBr6#+rn&QIHG66w
z>xP9dVY#pSI0a5)l(=n$vJ&1Wyjk$c4>iHWPq%FaM~4|;D*kmfx-IUB!r_JeCcM(U
zIomdr*n2Iov``(MLrQu%Y_E4Dae~MT{x<P`L`UVf@EMg1Na$I4c7``XB8Nai!M2x%
zo&QucjsRqrv?1^J(9$AdN5Yn}NuLMsCvpS}>~4uKm*nN)eJ6kY8Fp`md%v4~JuHTs
zkb6h^aJn@-p3ZH)3Iy`~%=U+wrqlEbeIIteH=(3E1NQ7}ifd=~m)90;u))V{OkZ1d
zNOgndBt{O)d#%w#dic^I*7g5r#_(@oodp2a1uwVn+wp=#J_ZGOd&ybu{Rbcj*}^_p
zNYXa)5;yz278E*rxpRr{ED!;(OW^Make%`oSm*E<p6%rf<f{!ai(XN!O7W*rto!f%
zNEX%Nz8r0$!X5zzz826fpiPqkv}<0llR0PSOE?|7s;c^${rVYON%Hok?$)~VE_-s<
z166#?txLmR{pOv0AGh3m1f^DuCbQl|%v=)fBG&3`b<FBofo~?MdF1cTv*m-cf%o*v
zjD=N&+(V$-i-fThR=I1^=RwN%6A@Mx(7l%6Ime5w&Z|uxB0MGBYQ!doH0C$r!r%bD
z@7}qxtTUk=y9;kq$9#QnM{o1|V~yT9cYJ)b9j$WQ+|y`Z3#~Uaud+^ocU=+ih270!
zPAfflxxP1i?PGj9*)rQDBM)g=_~m4HVAHqq8BpSISkKal#vWxm%29bj3qWv|hzka(
z?&F3a6^!*O3gP6JgzI?>{V5wAs^-hR8UWu;dJ5k{YqS2?3;fgFj#BA}GI9UtJh@Hk
z_}W!e@Q3B}4`$irranaK`U9dNU%fqZCmKrK@?f{1hq<VqxHxf3sw)TP<vEE_?XP`Y
zm2$_a$NqUSqG3mlO>~`0{GOa@%~{+;P(VN?t6W@6eC(6VokuHZw9&CDL4i1F;wgz9
z2YOOFvv*`fHm;Pdv&A8-uOMR8=}8!iMVX~y9D6A06~<(c9q)pV**Gz<s6WnCw*Fwr
z8b;xl4l$t${<_4MBwNDqi{sb29(^zf+l`bhDfvFLs9VXX!=nz1L~sOu^U-$;n}eJ=
zL>$dUH@VhLAs7Wu!2M{EBd5*nz1hldJla+d?lf9KeT)K}!mI>E+EMjrnmttO4hJSo
zHOcZ|QF;DEN_NIuSV{O4E#ou&67_qrN>cZv3tKH3<l~hV<D(<jJlk1G^W(dtpTp|>
z&d|OIB?bnX0V@vSSmnw<vdR7Zsib^xCzjIM*1{ns5nDWmVVlw{J|mLlxb@DH3#R8y
z&)T8a5Ezhi7G*n637Nuzb_JXmNZ*&mv-V<Wa4o&rmx&I+YjZo)OVe%9s?v*fK)Z>@
z$aTx1;U_DYnTIV0zN-Il87djc3Eq8Bq2@*jOvLJS>jbQJh=S<7P5gr`CDQ?{hu$SI
zg(#7!Ss6F+C0Jo-Por+ycd76V=0mZsSSb?i4<2NhsW6H$imr?r1GM|sz<y#}Ni)7U
zC7VaX>8J61@b#QLPP85FPJ$FJrH>`{gi5%0k>+K|qEX{W7B);$4j5Jm;_^&@YA`*x
zth(qyMgsQri$m^5m<qqG4sfyEtWQWQN6JM3Ekg#kxttE}lSf?AWUBaOo#J?B&)sP4
zCPg!@%}5qj7wOUqp($k4=deH&H?%dGbc=~jB+rbCjf>s;Y;51#>=)j6HmBjf-*&#<
z3@nwo;lSnMs18pyI{#K+!a;mjgaFmK@mR3U22(Fmz-RgJE#CVW2o0RVFY84s<a*o)
zHk7!mf2fNz9x)*#5U^s`EKhE*@gsN3CfBu9t3?`pAfFWM(@TYU0%<~OL>9~&|4Vr$
zSp1j4Tuhq-8r<Wso;tC+Cw_ecLeC#%@AZ=sv*|tgaazo_KV2pF0uaak`)6@O6HjCB
zHGf`%FFt7&6%9dnZER1n?9+s(=RZ!|9;=P*$K6cVxaKAcmo|zcaz_nqcO}*E^$vx_
zkZ(D~!77Oj7u5*$vgrrmieIt>>{3Ich}xNjjuwtt-~E(!N*RhFSA^6T|AMsGK4=0{
zz_Nk4jC$tn{m=fp4KjMnhy#Pf{0@$ARq;FJu1tRU?&F!O!90_?vw^8F>_6=!@TFVI
z4Zv_7Jep_^&o!p$wqKzNf~qb`q#~j%^MA@_-pw-}XQa_<aqH~b)gHqg_y2KxahcON
zp3weLj96R38ubY=EaKvLZ4a<aMdE0ZDEtRP@P_7#dKN~~R#mA+L^fJQxXAD??%5tk
zIr&LpDWG1$G4flYM|cJ}&1?fmaw7j*OY6d3f@e;6v){lV@dx<o@PkaI#47sgDG2PM
zs6n^<tz~%hvC|tGh8kMzd2t`xqsL%RRHjAOLb&eBrAw95swIAXSsP7q8ZF*d5kTK8
zg#pB7#A1<&%8ojOZW}Kc?$)~#{iM+f#n?{%mO5jx8j6SIcr1}4+-@>-G90GFEhb-W
zQ2G`J+fQmEc$J7@bcyuqLkyKOQ$_q?G@oJ~hU3(HaN7h>5YXT!lBNsbOV=hMB_*X~
zD}4g90~0bpvz_Z_8G`EdE)8^dmG(s`WCDkj3v-|gj~iF|GXYeZ5p_#~G>Deh^1Ech
zJ3$_p9i{LHYbTMeb8dlK+~XgSJ$<jcReI262wLxk9^ih%g`VuJSAbiF*Vk;J8;YzH
zSb3j;S{uy}wGQ5_GU{xjmvf4tq0*pnG>hV9U%)nFSjc#WPH4+wfOILDdXaZQ{20$n
z>uNTvkl1?=!VcfDDM26U#G|LxH%ohH6<-W`87VIQ)m~uUI&1-$tc~+87;K^S#_PYf
zUxV==C%qvmeC4%Rfb4pjG)AEV$Z<6?w%GP&U-!MTdG3IqJyKD*#VN2S!vmPLq6)+8
zeJ_9KN`XWcEn^$%sLhjxaRg2JZR_QjEQS_k<Gx_q)=LOXxVQUFI2zT0V-K882Z=>G
zGWwa?@C-n>R4@l-kp>IsHr4N3UM!f8n@X#_AaOHGGqrhb{rT?}(-=`*-`>C=Hm7*7
z5N46Z)JR4~zv@&#$6=`dH8Sl=?Y8g<Rf|n9XJtWLWey_ws>E^EUA4Y^DX<EU#KDu`
znSR{M?QFc&^PS0qODL7kPKFg2u*E;3YV^j?hqLT$U|yaCi=(X5n#$zvt~K=;?QJ4i
zSsA-z&^zEn=J~(0oX#<p(3id{+P|Iu=h^pvXXjLb??H&bxWt!Tj8;&9!|(4KuQ_QQ
z;1%f-ou)-)$?8xj`jI1@+&fw3*-itLinn1C%$$nviZ0$eC;RN-E;YE0mU#;Lv;Lzv
zcv3(v)M;=ub)XYg59?>@%jr(Wnm7W6^sd<V-|6vU5JG+oAbInh!=xsMbakg{bo&!V
z;)9X3+CC^Uj)YRZqOKyRIM*rImUtv#%0^khc~xcyO|NrOQ|x~YNSAe+d_IW;e-M9_
z_FP+o3%Ozal4<m!KW!wiau5oLEHvrZLZ<O<E*qxB-9t72+-5vQ+u-*|uIN!0c$DDX
zYjyvbE@Si<|CfsO=A~2h-V2{61%wAICIP#>G^mCKjcm(AMuQ*^J%bqiY8j%u-&d6i
zl9_lS4N6%dy^46)Hz^_8CDC2gAJIJ@6v89*>V5;T9>b8`ihJvDycDb5Oksw>Q;omk
z>E>WcQOtS<<!KsQ&Oge*+tun{?D`Wx~Ho+3U0HFDqn+*4fVIYMQ*(&JOS(OxHE
zIiJ*X>t}S$C~w>s*5+LgJ3rsFce}c3!YmGT@aCUIV0`%!gdu>ej*pLAta$t~hwt%R
zi1XY79UU1>VKe(zmiMucv*nJ@v@a*O&l*$=a<h|FY|x<<sG|7llWzM@)oT6untA>m
zRKv36Pv1=|>G^1I1N8Hiran&dUjnf>m_LK+kOW{eU&H-)I^M56GQ8=1a|x1gL&kPl
z59nHwFnI?@iAM3_+rWQ75JXJPAVjeJIY6UgmI!i2(5?fK4W<rt<<pwOYNSd{*BkTX
zR)J1ONS(y}Z(Qk6^YZ3rbU;j^$bgl&^NIZDOEw3luEB<j4D7aA@g4nKfiTWn5@vay
ze0IkG9qUTm_@#TZV6n;DlW<Ds(eRrA^K5P>ll7C)PO)8suM*;Q{JtlHV&+i!-0NDK
zse#^HzuZuBAmgN`CZGpKEWQqa3y{a#0~rp0<iheRQOP2@#0Vf6$+jf>on)CAj}&u}
ziBp--x;SeE`99q%wl(qQbuM8pXegpTT})<Chu?CjEFE*g_C(~M1edZF#b-yzJSLS_
zfbVD~>Ccbz7qB;k`7U~}wnbu}MR9^OZ`Kwh&^d*MZU#ngKqvGqmhJaI5+cI&W~0k&
zh^RbNv1^ea9I^wNgyqu-oH%Ctq0u)<yRLdVqZlA+_q=fU|GxzClm{U7hT5}9avgTM
zud}T7cpLtG<6;^HOzbuJ<Y#&9<py)BAAVOHN)zgJ{UutT*%V*=sd#vdGlVhVa`giN
zb>peVJ5(mRp2F1uuQo7RpZ)9Qe*XC)&dkwMN}3vMgQ>gb-rXBgFP$xf*O8Wa3$L${
zjMb|6)pkQ1x?HZ1w-twJl37I-kSf8FQW?KkO@^@KK4&Fs+N|T9-z@dytv<#w;Wfj3
zQRF>derwe_rr4sTS>!`dYbKP@!u0m`myoWWyP)(@=dn?hM@5P;Vo*c91$@tad+O0$
zQ9d-~?sA`gyJ^#YB^WnVxXA{k7U#R$T*+j;x>Uz_O{>!UV~5t!(Yo=c`O4~_fv=GB
zAst$$%9<mKJ;FVL2!fJ=nK}I`w8jY6f&mu@FhL#OD>s3xy$o*KCTRyEtI*?T6xlg1
zZZo3TZ$-~nC987p3WEIjx3e3jXTRkADl!X2`<D6b4q=s;x<*qiC6IyYe9Zb{9YN?1
z$;}E`Dw{6d-_%q#-8KV_*)oETs}#|eeIwf`q@Y0jmHoUAG7@K8l)9?6R6S8pl_n$B
z4kuhL5s#A%uDH&<pA~6v*b;BRm+M~8Bp+COp)zS`8By~T{Ri3rdXEAxN#<%m*(i!P
z9OcgdZu2!A(fR)FgrAwJ&yi4T>@S-g=jp{3fWegfZXPQnr`PhC@=UkcRu_Q@Q5rEN
zGD<AQ11jAghu8r%cZ?kF?G(!kfbhBGmse~@O2DBLy_qL(Y;9+rQFmy;$VBev;x1Q{
zlB{J6q6P))>MX=#AeEF)&|aT;vo;g+h3oB1Ap_@HOEZLgDqr}Fbc#JIi}QEYrWNK~
z54w-&2orf|*)_Fne%}bP6B6)!aUxVDAP%*D<Lgt=&MLWla9WU4-R>w{9tm#IiO^M<
z1Znmc0C~^Lb_Xu>Y#{vEll^I!Z*mkF8Y>Foy9^T?usj}#6F;{;t);cP4UB{g5g$Ow
zM1~@wo@%-u^}=weIoS1^v4j?>@Pow|sDyaq<P7eg?V7Iuu@<$TVS*9n(^y`3Q4m7r
zcga9j!dq#La)we(jIR5r|NDIZ`!WCbOR@?I1saEsF(n#@0r9abib3E*ktBLUwMg4s
zE~Us@6UVy&>#mN?q}gJhDw*?(o5`sci?#PQqob>>&h*s4`~TbGd?|w=o1Q>msOFHd
zZvWU$5TO+z0}6U8sqL=r_5$H-wf@vfQ7JktSFG)=bEyB;bDk#DAM>@QNQ!DNZMCsC
zY?s~VkUX@$13ojFJmAF&#AlDg$Gk<F4;UJyO7)G?-$;7a?ez99vqJTuxL3;PlE<FA
zIpq0GXdY>d_8q4stFBjKPS6Cg?Y*^5B-@1o8Bm!{S>dyK$xK~D2TaM66m67`ht(p-
ze=|T(<2f{6Q6R;qYWEN+;Ot?4k3srADJeAGz9IG?=|TZTra;3RF}=zTj>&aChdDXd
zsgoqqOD13-hu@(wbg0;k`c5ofZ9@WsgKBuEMP>9pU6_~iBW)rgG4E(1#s()&jiW>e
zzdKj`@u%k$<7BWJY2*Yji%bFXWYrTjUa|J15$qgJrs>eM%Egd5jnIZ83*zSykz*qe
z&Gg=4*&=_p!1cR79Y)|R6!W!PX~xzJIyJAQ_d_5!?KdLrQ0nf@TP&0iAR>&R_Sis#
z!0N}P8MR?{c_d%)iSwW!k5R-$>+d$O+*vDcJDWb{+h?X4p{;=RbwT~B$Gz7*DPwgL
zEfg8k2C!C3N*L!fy_Hk#BJ`s<bb^BHv2`aJJN~8B4kFE0PMfXe`L`4}n`*!2$>LeL
zUJ7L}P0+s1ycwc~EK#LnXC{U3o7rqemjtW>k#6b{jzG3Ei0cJ4)VRS?1+l24oE?ut
zGt>Y2cevV5FCg*}u~tt1e)>oG)`#L^#0~+#c<7o2wX4rY))_h>2C}JlO<;D^1qmS3
zSFW5{QUIwZiHuAFCESiPu~*VACdQ;zHKT~%bGUsRRI9H|W3sDw1TH69zRX{P*Z0gh
zCiw<&Z{k~e2L_-fzKbiuOU#?+qBvxHFQGjKnPT+eR9+uFIE&&Q%pdju&Myyi7kttG
z;#!V=XCv!kC0E}Mp;zLma-CCyHC1QZ(dlgGKgYp8mrLt2Q0_AvWNHuZO;X6;^8)Yr
zOR45&2kmA3Ye{swo-XHHt*T;%lAmk^qT|h3l`5~mbAK`{yc4>F|9OaM=Hq2H7rCHU
zyTiN9r;U)=`ZADuy$i}z*;g<SW-aZ0(Lk2;i!{fBi}V*b5YrnpkwSk~>C1oG%PZdX
z(#A%J!{|k&%M^21CQj<clGk(USamnTEHf0+ZELKgdjS-EY__8@NmA78Nq1{{tka_B
z(a!>_p5dicoan`BE%;tEEo^t)9VM+(K8aL4U*`Wngp#hJ(Zh+*i&0~@+`%I0rETn7
z#irk;e7o-H{Y^GAJG)5IIJ1aVP+KZ+1AZo%gfEGAjg2-vZ)G+9>j=AcYeHC;zK6m}
zWUs}sIxx`L=^Gw}Zogam2*rGA)iANKa%%X~odN>3_a%(>*K;nr`9jDKjXk38uhA7$
zrzJgU7dl=av|bB_UNssom>tx1L_S?Cyob)d<xHu{SV~OP(zWh4JT92zgkg1bcs{Ti
znpb~VuzE(5l^qfKj-qmX>YD2pf@WDECbE$4tqUm+Sixido#5{f1kY#XWNc#;l8R(q
z5vIQItzaNjdzS{(Sio}taHUWn<r~W_AZ73K*7asS;+tht1g1x!+SlYOR#7sx`BREX
zOo~@Wzxvw(q)9;tDE9{KZgvPl8RJq71{wB`?8N!+&RV|op;j*&%p>Sv)Q<X;H=3yy
z8#Zp`wo2ygnV$=qt5Q3No<>k&BJq9(iF>A|%d;U#*ID6`%J2r;=yE!rM6xe)UrxSW
zAE60-50N+<p)UqBiM`C8wE|8%H;8D%!$AL9rfFH8%9G)`pUVHbP<Lvgbd%e8kKX=%
zCa$vzxAWs(;1P6EusM4)W3{%SX)Dfk>nmWqQ!vYEzM8}-Ui+K$D=uYvTs2I>944Y!
zIP;}xW|*wD2{OP4I`TZy!4yC>N#gv@efphJgv_QWj(@4`WLyscK5E?)fXL%{2F2r4
zp5?3zTsXj&r@-H=ms|0-jZ6W~x_J|?6$7UNe55CYfq;PzlyR!jAGQVbCEEY%8ukBQ
zH`S6$8a;s<^-XzQWWZ7Y&WdC%RsEv&j&<B)@9i%WCM`0<gN%wd!r_XL>yd7DSab0D
zNQj+~ZoTQg_U$olMt8!CJDz`C@&0`myk=*qb+^^2OVJ=IuGR9eH%%Rcz3MAK>K*(s
zJ?ZC-0R>yT{!r;wX!@jCe0&_cz?$^pJQ5*fxzSNBVC4+^xg%1m771R5)+?p1%Ugw|
zHj9SFZ&^$&+4IUcGh;m$<<HzUE3+#n*_i!30Y2MW=8flX|6rsI)aWo(gf`Qf4mw<k
zd*hpjQD(*ASju7`QV+2eDZW3JwO#*trGBXzbp7e{2>^kpp+}GI$R-5&0^E|pWr%G^
z81F_a!qB0pupv_ulaX%`uQ|*R5uM`Gq(WDd4lZR(`)xx5o1QgDP2!W!CtFoGm%Phi
zb^qmT{EZb8`Ir0^Vo$AWMJggZW=?b@p)=pfxkI|gahq>JRFab=@=I=Hfd<#jumH`B
zO*KTW#D`Z?V@!MI1|Lsg-qO7q^I7i)$~Uj)4b((j>Vvrv-m)ShIls#iP(fv3!`Sc`
zV<`>!(*~oLWRRrmp~L=|2&tq#!H-Dr&VM&Gfmi~~43nTS445EP73GG%_f2uUMEAxq
zi{}-`CSfW$WU<1@Jmj|8sbwO=WBhJoU#0a6SYfr|w{`SPnn6PHm!dUJF1buZdEE1I
zeh9hOEuuOikVN{0${5e=4EeQYrbd+6BE)K*AyL=}ac4keMwII1M1b1V<-Pg1pc@=N
zjpX;uoZnf4&*;+7DI$#u72gqHr#FQ#l?zy{%mUbBEr(AcwX-hs1MpF#0Q%ukK=uR$
zChPG9GU2FPDGRR;@)P0)o2<SV0Dds|E+vUvFPv1g^>OP)LWKh648Ee+6q$w_yU?N5
z5YLYron$||A_%vEn|DH$LJj8eFwq;_HjyyTZMjMTz?qil0ov1`G&S%IXym%!MyNIz
zMD#D);dq+KNI)7;eSnj<&jysYI-SlfGZaTnUCz<K3H&asUPw6RGB|K{gI2B&mX>~Z
zmxsarQE$XW<@q)pp8#*vFe~;ZAJ@n^Z~OmVlKl6zq~`X*fu<F9R8=zp6h%sqXN<$s
za-lC*EsX4c2hTw6p3HX985y(_;hCU=<I}B6|4+p<bZ`6xs?(X4^!-^-mb||F^GDw`
z_8sSrkiVHLBv$7Xxs(mRye~v6#X&xX6p1%ry{c6y_`y!@p9(EP-ggD7TF<s7JTt>r
zn@YtdS!h(;LI~DfpPCA=T=#u#NV}-;=B;hu@|vGj<3!d|5(D$lXv_nd;x182F;M>`
zlH^^L|9pCB+`*xJyDFgmhu@kWDUZ7HL>C#3l8a(Q&I3*ty}aIXn$NI8u05>n$I(=%
z`4Uu@P~Ir?so_oF*2Tg6_yevupb6^Yy!z#={Vf_@7Nk6!kX@)&t94uyWc9^}7j+Mn
z!YZGpmU?pPw_JBE5f0Lyk*HvdA-Fnrx-*CGE%gt4Ji%vaX2BdQXSN8Th~~#_cWVe#
z0_r)c;`<Ch3<zd``JkvnBE=@3yweuf%k*qQg2teVzQD$x6$>MUZ=%3`A?Q57DTaW#
z=5<iT<G3mNw}tRx?R`F9u}|%<IZl*76V{GGa-mGEy+Ap)=?sIwY+d5%AAmp`3S{qL
z;90JB`4&5F4VmJo(cJ}!Ei^M%lBXwOv|cy(O55B*Ksv}{KEOq4``g#p#OUbg+SjNd
z^_JtK^Y$lI+vA-Vj?E7{%kwB~iV`L-HSNkAlz}~X-4;<8Qo<eH<WRD7ZrL@G<4ERw
z5{ezeoB2Cyi2sse0O7hQ?gpyx71ukeUy$adF#ep$do#xvj%y@73mmt-IJZ>ZD?WXY
zbL$WhNk%7PCQ4$Cgn!qn(>S}SF;IBiB8=8E-EU3rBoIy`=feO(2WdbUDCH2)8~g{X
zR743o+}KrpW)P~&bTD<4FRX3ZjOQmroxbMX&xG<jt5!ozm+L;87}@TD@C58U+z?|C
zL$C>Ux`3ra>%L)chEIN-njPr8-{7%_sW2fZ>`*H{9}u?MVAXsDC!{upM#bFJukQ7S
zi_s5&bFL9S?`(+uK5SXXsmtQCrUNG47|R)91J}T`xBq+<u-L8rY?jC=jDT!zLvsb7
zyCi%{6*{~=FKGqOIsf_O|KG3FnEoy*<<AwIW5A*s`|?c0%FNw6<xTrIIm@z1i}_(3
zI=bS1qSggX<lD7&f8rHt$k8+j<W}4KbyWuAQU>{zl}_CDKdy{wTF*!N@4o~kf9+>%
zTFVi1p=m9Wb(64=3$%miscS!(bH4VDYMd!=G!$`9lntH2Xx8Jmu}&G!M8tX}sI@32
z33Hz-1qDnDExdYp-514)$z^?|l>*%~Cs+8z%HrfPr({XDGB!Bg$f#dz{KUC^HqMcR
z$=SvijW~ihWocy*K31TL?V<PRvIYS@FXAe^RjrD94O1QCheeiX5JijMgD@%oANHGL
z`nWNEZ6m4;)A`hN62y;?cS=fA!9nBlrXm}{I5dJjsNI>NIirICVhBR{LO7C8+Zf8K
z+lre)q#M~l6WAGo>23P!oADaySjnImGX5W9!^}3CGjKJ{<Sz{$P)l?<Rtik!rK-{E
z&9=u7?qex#<PcsUzDK0Q6@hU9>1D>>8rw{IpF#Etqrltc{E68_h~I*@#I6Z2k&&o}
zw9o|HOWyO@|0FcQ|5gt)eWkW)x^9(#I+$vsU)=Y0@0L7tKOi<B0fzWO3o?v*b&XO2
zjtdkFWU#|cSH?n6M%V*3YZPzWz?arAQojk}N84yfwDWZD8lv>(`aI#Ku>JAL)tssX
z3RmL&WNxPqfP*7J75V3Zg%?kJ$!CV3M-XR)y$(mTsAn2Fc_VQ;n&Rp--DM_&m9L7E
zua2NOls+uxsRvkzMOx**bQ>68UMLA4q@w~kD`Va#aC%F{BGhIt(cj~x1+#X*-ydFG
zuGr(&a!zl0RB3qw&1zH!vhK>Xj&J!kp7_*@&uK_LrYs;hp2V@oKtu^EqYOr<1Fit4
z(|7>e#gKgE%XhZnS-XozEjb>&g=EZUOCn?61BTNxlO4$GSCnHKL_JP0yN@HKXV~~~
zy)(ywY(=>u;E@YX`kc`dc}sCXLx(Q0c+$Lw_WQ$x;HKjSn=^}?^9YSm*xtQ9n+Yqe
zj$7a^>E#XymxFnBXq+)wSL+V{s7>Zgz>(zqBJbxmUIEJql3(4*iZurBt&XA0H5<RW
z|NG(ef0}5(HzlpLfcxHThj(r}(0oYtM7c!F*KZt8Pe>o1&3AMP^-BEz2z$%0DBpH(
zbb<k-mCiwtkdQ8E6_F5-mJX#mlx6?{kp}6Qp}R|@hVB*^LK*}?q&xQQf35Yd=Xuv&
zdw*mO=710PbzkTCOa08UPUgIXVAs<(kqvKjKfb-bCqeP2nravGZ*U)qfFqiixbFk0
zf$MVf*s??;CR810piojnY6g?{_Vs@$P4!Jk5iC+fwzS6K;dPPQB3ub+g`$h_&dKY+
zg|CqNKA=I{;eep9wFqH3`2a0wi%c;T9{c(=dmi&gyf)o=;hI-7P6wDx*ul})Njxkf
zpn!#F+&74s+!~64eWHD0n<Or^=h3j&j=%o0)RN#iO?fn(2c*>m$MUO5hvzxal)j!~
zQx?~sa@l(G2dUOz3aiz`Xy2c8hY^G4?j53*Y6M^q@`5>{`4?z8=pA{I+Y9E{sCE}=
zXYBQ${#Gyu`{7VANg57}mW03&hbJvAJ$rQdg@?o7CEwf4QP5W*hbg6tli#H1&d(`7
zWpHYvpO;=KDh>GaqaSYnsBwz(K0hV{lBBdX6L&z@@Bb`FAbb&C(h+p%fX!~V+s565
zT*U+h1rNm1l_shKo9s|ghLLJBK50sa)gz7rhY)d>7Tx>JZ5#X35ukaBn>O;3kPg?t
zHRlGiCl7$<ao1kLy=2X}cDQwyxK9Q}oGiry1*Re-A|!Vz+oZgDB(Bd`wdYhej01g3
zdc1Yu??H)iEU)lD)^l}s9TF#<`d=M0z0cPZ@7n{VA|0L$_pv?ZJoiHUoR?C31s(w5
z4|pO9&v1zJgmsOH_Xuq9YWh7(o|Mi6^<BWEI(ve3O8mXVHlMke(hv+L3wHeqgxmT%
zh7u|%Dxr;c>?Af1mja2gsmNa*cao}nF>Lk>ss-~@OB$;aO?<>G`d*fbpJ2?u56b}I
z(Vm?RBQcRFUx;{8hwdg)&_)Y`Q?yi7_SZC?rUTtJCvx%+04Lfx5Q<w6f$U07I?)M%
zHZ|Rm&FJ9_m5cp>o8*(V=ixy7A5L?Tb~(e*^Ky(Jis{f&e>FsBkX4w*W%HSz_xLDg
zYJ}R0=G<w>*LXyq(G6wgx+FM<k_lWQMwUSJuJ-l8-(6lQi_g^=n(l>%Gf3#VsE#(=
zldcf{cZlG>e_|WJ6Cu%0_%J>F7nXSU)ZYj6lj1j@`NNH>n$4G8OJ{4JFC5-p3AT^N
z9xtpH-eRG;QuvrHif`sZw6PY%czx>r75-~|2RpdFO8di7r0}2TDd?Z`q=nRcK@R$b
zg{>^F{3YA#G&UG71pJwNibkja&fZ8NXy`~JJrn-N;zg!l_q27_V4@*I5xIk`^0t;@
zQ6B5di6>jm&ON$n)%P?*2l{>u&8@vHC2A6_4AzRI&x?P|@dBhjM7~7a+ChfPAbF+P
zuoNIQ@LG<Zd9oH_5%AP{4I6{amY95pr0KrKmiN(E&szXt%MFA$Ch9v^Y82|fUKXm=
zHjebTgEz#?!UEePWJ~IAlXd_((pB1Yw{|TlDKD!g5uqZXJV|sS1=dZ3A|l+}#>Tc3
zT>1|KYaqY0jr>Ya8k{ki^lP7(zCF@O%9B$lK;d^%Hqx#sN+Nt5nvWwv6Odo@E`z*y
zo4LIQ<OA=%X}tr?E7k>rc&ZBaYbG90*^Nz~&sw;V>KJzwJril3z0A^7{%>H}SpI!c
zD4jE?4DtdnD5}4Rq@%w03qPnvd~veD7Mb-Og}Y9=EsqdwI7ZZ=(*RL>{9h(!hsh=n
zNoUL5H&ByFe4AETO(kwKKgR&Ia(>m3@Dm@{zks{cV#+}h{AkhZkHi~54D-E6QxR0#
z7eiNJ=CD7cOQ6c^M`L!hjO0H>*M#e3fRYE_*}d-;HfFbwHaN(q;W`yyd<W7Xnrhdl
z0kUzSpfAVElqB(j)Fq#}M#zQqNke|dcyH!E;XbdzSsMmF6ayCiJtf+-Fe%U*Z_>af
z(Y<FoKx73@G?g@+B{|p5`2+2mw~y=eUCa#tj&te+xXwa6=GAi(Egmy5F=^15KgKx`
zaAtLwW7@UaR5okY=eHNlBFA|`I#SkP@oH_r1+6>Q>)Js%>A7V=biU77fo({-GY#Bs
z?Gj$-ZxtqzPJ5w*Cuitjn}Z&>&patoKY64jT8unk(fe@77;5<g*ySqZN@7Im&diLY
zu8$^2;xNFB=U&l)?2<9+ie#=eb<6Ym-#McafHQjM?&4zw%zmmuWEeSP`!Rd`aI&vl
zv{@JI{|aXR12QnOk>Hn;FI2`Y+#7WaIXm}xLXu`g+<M8yfr_WE<|F4EnBn|QWY3W<
z=BBa9skTgx;gkc{DwRG-ZRCQ)O%?0u{hBU@2mN`^Y+!Dl;9Xw9>X<BOjJeCSs6l0)
ztTEn?4iPG2G#WAB-Va^Rd3~%Qn)Qxcv`JR5!DLiv%f}X}IwYhF7W9omAYTIM=B}GO
zFw@1@;<6?+pz!GddB0pySdkUT0eoFW-al7k6&Mh@{Vw!r^69)+E2Mu>5m5TAT}h>9
zGyZOS!Y!fuDCu*fblW35X2=eBq>Dp<j*>Vh`E)qz8|Wm9_#D&~tRspSS)?_idn^or
zLYGZxD`)biWz>gkfFjm|<+J_!x3xBYQ*`|UymD|ZAP(vdBcGFAoj4obyDa+X4BtBy
zaP;Czmm);G;qBHv*ysG-k0UI-zb1>JoK*M~FE$_o+nI+2xO9}|nvMfoZ%m9YPHMU!
zZPMXd_o)m-dS{H~rtAq(B&snA#Ts|=KJNl=%%^a2z&H^9HZ_Xgb9B$bSIN&<oyLhk
z)u6)IpMaY0p+*9X0w*gxJxt=14jpfTBzJ$v5^>$x+V(9?6v0VdjjfN*bEm+wW*5F>
zZEHp(#Gzdl-kvFhZ1Okii_lqvyuIVzN7rrHnM3SltaY@M0^R(A=`^8Viz0SKNBVXr
zt3dH!2LfjaqVuUz8>sAbF7Dm^SG#GVy@{V&&akhTEl%Q-*5q$C<_<Dxcy#$G^)^a$
zYuN|EHO%mfzPNKxHL>`f^rs1ca3DcmeQKKxwQIm+@Ft##>*<@_R{P?b0QszA)7Ugl
zOE@|y$EzV;2TVdO$zj-ZmffBW=JVZ219ThJ+8c?Iw!IUs#*bBb8peqq+TF~+O{;u|
zEjt(P;?rJO4)(w$KLweu**)Qj>TVt~d+ddK1yrj~qP78gpLQW+Zw!$Bq9|Q@so{gn
z!$9o{ozFE0YtAs1(gx&C>BB8ws>;=Q{J-x;{{}epM?>arALTu#)U26<Fv08<1@3(K
zpICWoB*de4{$xqa^<!qcSN+KBYO$%vdq(%D$>Y#>ul(nCN>u5;0_tpC`m+MIrmt`N
z)PlOS`pseUrv8G)l^;L47Zz0*Kuam+ORV_&EWfMDRL_Dxa}*F)=wjgx-_jzO@h-ry
zz;lL)oPZ-s9hvSCJ?^k6j<n<gG!pVvQJAH7HA;fT;G3)Fl9B`m3cCXPD%c3I6eV@8
zb8}MP8Z2J$OEKQaU1UiQrEe?jFvGb`uA`q_vC}DU)SDw8x27Is;X+<u^CPd8E<fH4
zXglGGFJ_}E;1N)*knxq5zv~!(`N`~f=(gYlKPxSf)N$biO2SQ?rqO7JhXp0Eu&Q0@
zD%#FR`m(^i&oTp|i`{HfYb?j~YyWV?lL=voD{Dnp0C`kkbF4vrG&j1*lNfasR%Vd~
z>0){jPC&x5y@oad`4V2ht|sTn2Q<Nxl(b}Li>6KLrj20~_*m*blL%uV^h;n-M>WQ#
z221rV9lFY-BN&`SUlJd?mH(7y+hTs{`GsACKJ?WJKI2`Vifp(}jCB)GGU$wGx!ntq
z!m_-#_dSDN`W4NoK%h}W<WREBRdsnD*R(Wpu#2_gA&)Ik#8*>wco&R%OLVTYduBp(
zy+KMymGAUQ%EOV6QAr&12BGAIO~vmXZ({?hUF*0I?Tz7|rRlXHVgI(AiUE}gtnkA1
z!h#|}$TL$PeHR|emy<i-?KhOColAo*#x8wuw!~mRTTxOZUOk<3<xc39((YO)oPCXm
zPJ{>4Y|!|gP{>lADPc?6u!(gEY9w6-q#6;~2%IJJ(pv1EUbKO{!F_y*-4gqKci}tu
zb!W!(`us$;;oMV$DWmvaG}D`(xToaIB*Lq;H(yB|?uAMTyyMcJ7)cH$u6fQK){`t=
zksZT9h&-C;6|0LO{svmi=J551094}40N%F`2=GEgDCSJP_u6pA+}^%@i=~6qe?#os
z9ZsDsUSXYKC@Pd=^uHqA)EdC%!}qnY<>6nX8$hCOj~zqH9DbIWy)b*MC;<L{IWd<;
z{@$P7w4{1BkV(Xj*pAqLUY_?~l8BqKi06eNMC<J@-f(o;$8}RjyzT1Oth$R)G2ug0
zp}#zO*=@sqRqtge^#NqA@f)TVq5X-x;&=4P?;Q1>j)zRymF*UHUlOW1T!jD0My1H(
zmWbJ3v4Sa-RX)e*MU`+&P88_sDeG#e#L+GoG2&Nq^xKp-vkQ_NXH%zzjFjrt_X6<g
z+qQrp=Ugq^GPT^I91fDS0;fJIJ%Hz*5@P#`(<HolNnK?-!}lgTUZE$Pn&a^2E!k2d
zkoNKt2;j(lH769)pM`e}ZU$4S^Ck;cZD1&lz(iV31z2=J2u*ENvue7|eTkxzVO2sF
z_D?{Ch!RYmDO%9cFpA+v?&}V08V-nAUS8fyK;p&BMGX0l0zb?Uv8wVGG6^^m+y96H
zVsWEzE7){F7v0-eU)@VNQ&5xI<k&>X35;j7jk}m_fMqowN*QnQxkTx$ori*&F>)tN
zkRoUL47ksGcl!ct0<sGr<}T>wFRpEg2;T7r$CgYQt6hL8D#6BUAonx?3j?zF#m^+R
zORC$cF>&r^CJes4K@S=$|0@f?-|NC(aEMsamX3C5s3P%6h&$aG6gxxQ!@0nAzUrOg
zU!-HN;|anzS&_fsJL4>-)`f7hFQs=;piK(LtTUT8SPKKm?vC8ohi0n55|4Q){V=@9
z1_9{nWJRQZP9C#`^9sSo&lCw^Z5@_S_s_(ps&-SZ4~e@A$s+s&+JhS~t8sJ{%NfCs
zH3;)Y4vYzssL!Y`?=ro>`qb)mx@*F4DPx$&yUl~1x*!;pg*tb_FO?((Oi4(+^q9^M
z4E@b9RoFY59q{YUybGR&N``~{S>coL>M6i15JZL8635?^VOab0Vy&HSrOLc}uj9tl
z!Sfz%E2g48f%aNp_jih01;Y^^VL*&;<+X*Be-0Q`NiA%j)^vR`*G4R=cAfZ>Jc6n|
z&<zlfv937+hbrV8<B00n9Lqj_hVv-)i*DP~i<y7h`u|1p(_a8ku8Ct2$L|2jReDC<
z7!GL=`(R*PgSML?oz-6ZH{1<?8cbjZX3pP6>7QhUaeF?ruKG#Y<+>}qm!Y`BKkylX
zS7H9nK4Fk+yZv*2{KV%xyq0b&**7S);k#raw*lm&6TcdDGx_8=@~z#L=hKv6%gzv2
zY<G(C3SDN{h9~>x?D<}#Zf-4LX+M4jnmq8j7qlqUr}!*bL0K#Bs^uNCXoIY#{3j09
zV~+e@>hh5oiV)X?pBX;NE}<YtbiVY5yL)zFO-JJcc)aCb2DlrQ*x6BXLB`T=4?qCQ
zI~>Cqw8lryuux&r{Irc$kVSRx^q@K*71SYhT_auG<of`i@$nC7tZHYU5m}X!2kPBH
z6#ECs<I%IQCuu)U3DY8)q{6-vs}78t7mKJ#d+om1T*bFz?Xr9y7MdIviuT}jp`myF
zCen#EnaP!g&oN3TWAD7aTlZ!n58R*4t?oa$zbX|Q<IwcTpwTrUJiPlLO-s?B(1yj(
zSpg7}u-g_gI@XoNH_t3`QQ%?=VNnTG#2wGpwgs(OY{Sgo4r$<GbJFn`OOF<)ASE-O
z@*Ms)mOM;?e!~6w5}JYKn&WV?Gs9>7y}<bJr_`;e2Ch(VoYT%8R3MalV<k#5(0M<!
zZmKto4k2tdqFCE57_Sa~q$0ZhWiQP*Ol3*gTes}YEZi%lG)QtKHgN{x5lg$j$;5Ix
zXhI0e$MgiG)-j-79}>Ro7pxon$*_nWGv2d+X_IKsVMt3>iQEV|6A)nLb~Xvu-y4{<
z>dab(QcahMLc3C=yt4^45pTG!*Pbz;>*z4vfJWe8Bh^9SZyxYrJKe-bn*&qH{k|~K
zGhRfB1;HjobYdD+{ZAY*Z<5q`9h}uQgo^j-#E~&!6D!7Ff<)weDMTmyF8*0!n#iV{
z@Ct|&inU643u@nq`z`7b4Xqnw#x`41K(2q3>JGK@nV+br?iM^Jh0?n>^IEjDAEKvR
zehw41oFgEWh}h65LKhJX{z<%>)6fDbY3rfig**kf0at3>^CC_?{r?ZfRsApHTA$zY
z;O{+@jc0pHzAyP^sq6=31)F1|O00AKe?#E^3Eipk;q8Eyc1L5lhlk}3lXquc@j^vN
znk)`3O89a>s(&^JZ5VqV-hZTdFLnYlU(27;y0^|jR?K7lJ|V!>b8X{=v4S)&>f19h
zx(D<`R{486?L-q`XSr6n_=WTF3bm}Od~F|jRUVJjr)}Ed1}q=uoh%BPX!;(hRq|=e
z)Y`&g>TMSubQpQPy1z*141{9gFp5Y>yfS0gFJz=8p;OgMm^EhyeUraGbnN*Y)%xn7
zV@DLc2JMGhX7F2-1%!~k8_VkQKp3QbFVobso-X8CuXSc6(QkryH1#Y|>P#<*f>ePV
z`-=UIAwB43k7=JjG`bvcWPqLRCW~@4id0|wJW|THnKWK5$kmLd?F6+00pvg-)4X)w
zX#bFfP41j9*(dKm&AecclCr$|=C_o4i5h{h!Qq%RyBLKku}@7=Vy6B}*n~7Mi?vDv
ze9<2Trij`44$(4FJ_4@G)ZmBMqkpr$Ixau~g|W7dOotfO4G43V)S)G&LU@s5?NzSY
z&an95psHJvjkLl^Xc8hq0BX5!CSADREpk1tmvMHV=&+(^krnBEPkIV)>PvR6P%}zx
zbOES@0r#}|GXk4Ilk3i9)J!rjjm4Cb_wX9_ONGa04}>pl8B%yc_+6;#lM<kw6*wgk
z{Ie-9Fe%(uqYj9YnF&BdN~qI?Q_j1gRjkET64un4>=8cJ>wmr${2t?CJU~_PNSa${
z=l4=uATzM*OJ59D&VOZ*DlQ3g@E#rg5_pAh-Iw=0V}+x%y2n15dxdN1n^{y=Fi~FY
z`KvgiBPCGFIG|ZmVDp$wlFOhQ?BI4RTZd^3Hd{R<(on{xs}tmj>Ntt{I$v$5SG{H7
zGo|9~Y(AvHV}5;>0Z4WW$O!bq35Pa5(q5ZhSDqeKN}UyJ6jluyebxB6MRV-alGft4
z&B=dS{jX5hzdqhy?*CP~JxkqEbOKavRpn^OV8^hZEeK8jxvJJXEl>X&Zu@8TN0B|M
zfc~m{)<YCFQ`<$P{=VEy7y_IGukmkg)S8UinKjOM1x{a-phUw{{T-<gI$KAYJslw7
zB-f><BPUqvN9~KCA6652eLYBT7V@~2^_$fiQ+sbwkJXUcgPEe|9zY`m(<G-Gq?PHD
z25zK=$&VuA<+CVBJY)NE!{!5ate@bv5;-3W4#%`~*>yu$fbb)dlF?m?bev8cwkG4Y
zr*Fzs^+8JqsBc|>0qrll*aNo+`J4eW5gBM+nwi3L)sea1z^+;R@>P&`;kOx-Z!-vA
zZA;{FWKl{?f67_jf#b7D>^YJ2M&BP#sP_h|`Ft)28aCVUfxeK7@!PUSa-EE9;|wjM
zGBth;?BV{;h_M+_JgghMcz?U=N@+&`;>{`462bO-PCP6CdQk?vJ7pYx<M`$vi?Y!{
z&w>f=pf^KVGuUwGT~!e}V1_X=1YaF5CHk%ra4=#4jM-qS@O^%UXOWh><U>R(C~mML
znEyoJ1kQL*BtA{#Q%7>Q;E*%y{X3%5G=FhGVZkBjI?@||wb>yxjiFMtk^D50w1w~s
z3nM&tj3V3@-IGI>`io8xyW+7~PkL6iP1SV6alX-@l;~*QulWaen)!r-^T&H6oGMm%
z(kt6CB)tJ5e)FZ2H0Lw|jjkA6Wz@Fak8(J{hY!NMnWegQpsQya8BV5;0oOm!;!JVj
z(PD|YH*oaa&sDgTQ|@4ek=S;>Z{{FNmz!p+_pY9o{hlln&J;RHu&ggWnEu-`4u(Q+
zs`Ky@OJ}x;%5WX)+EZ_1<BPB6gq``b{O3!l5?#c)%VADlEjp~zbovv$i4AF`yxsal
zro545h~J&Fslk7)D$g?Rjj;>mi(G@AnL2;-jWp>Y4%vC-jokjfW}g2;!d$9=0d532
z#nAV6n(}YfGQKSTbULf~n&>lS7H;u_Z(*O;umAN}{PWEUVluXSU%8waQ##AIvhuuq
zD`{oua2H&XeeyU|Ibk5#YI1_%*>CbDmAJ-t=%$)H__wBN6%pqCy$PHttmUoe89A(7
zeLv);6Q9GTF8t~=VvB{NKfGwoUdjlFrHNU@U*ebJ02X6See?p7JSWhf!>A?T%XCpA
zw!jOJI6Iblo4ScIZ2y7u-ix3uGTf<4x?>nwz2|Yt9_ydNCncdTrt*|s$XN`t%?1+6
zRgE1CK-^5D^pm=U0x4wZ)|whu*v`1Xd+S~%Srci4fbpQ1wDTgJ+)n|+U@WZy$~{U{
zMPB<DzzGplz-N_G1mqcfcAU268{+gm`<M@AK8~!n;lK%uO`Jb#t(NF;ZITo{yzOUn
zd|uF-VQbjRzQe2O!_UVDaqV58VY9T@7#+D8wLm<Gx1VX8u36zna75byV**6u&ht<%
zK;VXW0bgRXn<{yuD{(GS2t-BcJGQ}0j1a8J1163SU6LI3w|a0$Sf&Mr2P>~C*B4eG
zmSu0MUr4G^H9IV}nA}paIvmn&6C;J-xa6%n&Fdykz|!D2*<HB~g4A|PfY_G`{d=(w
zR*=C)-lk!7CFyirE#PMCZ>Eay)w4C*2FGsXZ>ZT>&d8NxH)S22fGeYU5FUAexpXN8
zFc&>Z!I2c%3-ueI)=BtPz1He|?o2J}{8j|&RgHtF%?tfa$!k`gtoYb6&|x4^+^#u%
z|7y&1I^>3KO|gTLkai$m@*s)F<Z18v=riJYV9CQmr&FDoUt{*gAM4d|4weEu%U2w#
z?qCti&Nkh#2+=j0ipTLGp#v$@0ABo=&?b{xNNQJf?-jw-%!LT_U0nUS#baMk3iyZF
z>0S87$Z*L(*&AA+wfbUgwlv)qYci^Z_~xkpZPP~k=K_E(&Xlja&_B=gj+(#0?d<!+
z$DhqquXtp2D8>xZF!rne<FGUqN@I1fzg3HYp4*05#5?q7{Ma#P{7WjDBiHeE>L7E@
zwNGsFo_^KyCtw<7M$9hja((q_tgCuitkH6Q(x_(WzvLBF$US3y;0G^{mbzYl+OXeE
zD`<$e%9iHgVT|TBrjw>4^t0Mpe|9{AdzFVSyy4bfHHrFR4#No9>cEHRp%vhXN6eH<
zO<iG>ee5vAGq`c;iA{T(-x{DWAjof8erZ0xF}bPfh5A}Cys4j#x+UhRfP4TA1G?_%
z{#L@LvZ~U}N~Naa?t6@Y0Hx4*GG1HZkYZ>ZxNxHH;>nn^e@{%)lAkUBnP-eNS@Jeq
zdnQ(r2k6z=QcuBjJ`q`3F+T8|*vu!UML!=#Bhgvea#2J)zvNldAO52_HlLA#5>^sk
zX8Z2l9rH{r(Qn`bWozU$KbNt-s_fA)to@43sjI(n556~smOtodm7v9#_J~{~qSm0#
zMLiDQo*yD_>AL-&R`PnKj?iuJhe+zxmj?3t03!v?Xq@OEvvBvGgDR`pU}Z4zhGRDc
zyfYh+s1P&_h?G-rtfU48@1lz<B|lNp_8fFC95BOad_{Gnd@NPGjSWqgkj)?ni?H+C
zc^aS22in`L*rM8nYRqSPnVL<Dp4(hLKHf|K`WIRTV-uW$J1L2IFQv{CfP`L!c2U{X
z@iz7_AoGZ?OTt9M$38uSn+YN5evTly!zj4Mtv4fbfN1<>x5&qsXkwJ0m$W{}2<^=N
zC_A~UllA=>E75h@Sd5JxykV(Fpd<Lj0)R^3$4`6QywXEiuscEN%?<%IK@c$wPe{_*
zJOH0W^ZSTH>CS|?HhYkQjT=h#C4t9IJW+wZ!=PTNo3m_X%^z`U%#XMrCaK)OATRr9
zv{>7r@U_H2B237Bf$>k%wbtvrh1Mu?k;@YP+>Dz^=<LNY?RsH8&d%zm-G%?LG7~)q
zrW{F<4_z+Kf3^9>l)%tmyZe~n)ZYEHeW%@%vcoH}aOC~J>GmCAzGir9_Z?)*Jrl9V
z3cKpVm1nBMByiV&omu{OwZ6ZE7Rd37bsL~_fofoXoI?5fSj`+TQuCkq6ef{zpVH4s
z=RICz;~p7~1-izp<1x=5B@}mP{2x}6S3s-yMM$OOGj$!TLF1rP#GjQF5Fs<j3e2eW
z)h;{WJuUfz!Fig(Dr(q|?>MToh-GKkCFmG5<4EGaaIo-Bq)<h0I#0xL?Wx@ZN9MY_
zUU_P-1tHDd>g4JixaxP4@Y19`LPPJO9D%X_U{Q`CMyOP`FWCZF8a?!+VLd@_ZO$Rz
ziY<s*okKpYY)jg%QkqB8=M8eJo!aqkdg;hiTl1C!daW~*^c|36JYH_ps%k~vdzbcv
z)`0L+C+q3i5^9`%GRR*QfKCrk+`b?VD{)eB?n)Ot!;ot&y|5ns&Ngw7+y&t%)<w?k
zM^a^6O`|PV;)9iNhaJ%gPKUC}%s1X>mFliYuVKtSoi8ATH}OFu)1SDFPb&_P1bQ6~
zT=nw9{awI3$ttbuZ%Inld-S(Eu#@6=r(~IkX(Ts)q9ea1G=foxMoeYY4(t*(8fJgS
ziyNPW{=P;zw-+IC2%tXmdx}!!ipKju!~+f^l?Vm=sM;Q_iPoKfF0S>Nc<6~wgnIWy
zq;W9_l@QX>T)!W+@Z>dT6g+$bU+wJSrr{yRrHF1QgSa9FK@Et8lCXJqdr+>heRvaV
z3UMPV5${+G@0|9<48C(0@oMKY9K&bmmT>a?<$9mXljRvxDXU7CzL@E|ULCWhJv%9w
zslA>ysuQ7*`30a|p(6NY{F1dUv&eyNMT75SAH1BroPMXCTjeKoQ?FTkZ<4)Hiv!hF
zOpc!NB`ku>udrLs)V`B14vdIyhi^6;?MT6ZCi{nfB7MbZcoY`{y%=UVJmFq<%cU-_
zZcbaL|E#n2@65QYHTXl{ZB^w~viSb~A20h{9bhC<+~4r{1>6yPbDAjk*2j-|ecnsW
z+Ye$0C+_J*i~Vy}{snPT2!qV+N0`2C((C@-KHq9b40%G*<X7LD-2izFt6TqtL@rjn
zuBsLakwkne#oH7rOM58%p`1g-ulcEOe;FfCgmaI*1)EWYiwQwJ$#Q;poLr?TBM1_e
zJ$a}M7Fd#85&=Ddo+jBC>zZ#&snSz@ir(f-cK{g)G>BIaZn~#Kg6X!&cjr<HdD7Z_
zr=BWf4mL=A&q26@mRM@APtY<&6&2!WYgrg}gEFIBDaoM7w!8YYi2b}s!`VvMdh|1*
zm`byr{tjX(I>xq-of`5=kNnWjTy}nL92dJ?H-Oo(JOzfvLVZk-1osHo3w1D~6=3_f
zS3rMBJRolP2@OcLsnegRsBL~nV0@R63J4=R8V8j0pQ@(ASK+8JMg>M$Z^yjl0b{i?
zLercmk24;f_(MRbo(sgPs2TacUs6dK>PcXl5{~8?d3fE)Ox!IxCn&l3jQbEs!6!Js
z*e>soxS<x)%XG?cslIPy)5*3;EJkC@byJxM_SEg*9<uElJ6K9FcWGc{Dc3Wt6e{`w
zse`<Q_M0kZJM&9cX0r=jng9_{6-aaq@R~LgxZ)4F#>!Z~`K$H?{=`dQgKDQi7>|9_
z(P)Q>tj}gpdU2zo&O4Wsq*@v*xaii}O>AlfO)14FX%E9B>6*&?y~h%HcL=j`t$7&v
z$-QWWY}tS~P6FM@G6OLTsRcmO-S;aCm225VUjP|8WWz_9!oHPe5uKTpMBRy8dMu<Y
zN}nX7!dHpCx+_;d*{ykDOhSTA8N9Gfd(6uFdW`=B_zn)Q+$E(w>6z-h+Q)N+evG4q
zyM9vn4C)nH9LZJjZ~W6>lp<h9^Xh7#robe_6-aW1Upy8sZRQ;vgmcs(n9-ab_&
zZ*r5?M2tl)WSDTlzI{2i`QbAT)~)94w+{I2S;*#r@YdzwSPva-Gxrds^qx02TgiS)
zy@}ac;LD&0FXaEV8v`0eK=xR&lT+RSTqM3Oe~F4c-#0f4LGz6>UAjxYxUWmZ=X?L{
zl3A)RMZe#%fd8uaDRbhzVaRDg90(i^%9KkDZPY_DRF!RHK=aHD9`?_-{jaIFoOO$T
zIrmr$<ZRtfe}_ioGcz!9>uw3_`G4gs-E9;Eq4+I^zr2wejD_J-VDCj2rJz&L&LAsk
zakM3<2+@V`0%{`?6v#O~_II8Q^}R+5Xv@enW2<FnIaqpBq^sHapAKmvXYlIREr-!=
zO@CB>+@ngq?co(hf52O^5;R_+iN+~OBPmDaWo-5Iyba0&Ryh`6zKNH*-ckWSZn(X<
zgzkNHv&n0BCMQo&WKnpCgr3=OlKj28QT#NOS~TCFHoDNH<qD^ZSH*C@tJkM4{zt#(
zgf-gVF_>ZIl0D9F%mrTFV>^!5HoPMQYTJ=O6lpfrHc$*m%Vv<L$RxZU5s47NPM@VR
zUIpUBn0+pe?x?czRF%Sv<GKNB)qzr}CNAIo`-X@)k%>J!T@a;-B0~blKImB?AHL<~
zm>fJvq3UP)2SYN|uwxk_y3ME6bnOwo;IrqHrq12M=l7ySJL^O@!uStG_+Mmf^wgLD
zf~o;9-9XEpF4m{qW#su_CfpChL%A96fym0kapBYgRGI<w@v;6k05L$ngVCEpQzOqT
z9KH&1ZFS_A;vn+`c`H^K{U#7;B1s)o76%(NMhU_$6;Mla!ZiQP%AQEU{fy^=Tgx3G
zAwJ?OpO~KJ8XvK$9NYqMDTHLur`hv3r?5S~6XM(rz^UCf{`31`egnw)zcz+NpHl;>
zY$Tog$ae0Y0D0pWu5?Dx%-MQ|1>Q?)v7NAqPeDjgmklg>cRT*Xz%(<r)dkm%`eyr$
z5hVO+7wbbsg>&}h+14-0u<?oU_4C{2ByNw4A$}Dx*;a>yL5FcaJI1qNG5f>?Ir?~q
z2$+M8i~0M6k||<oKz~L?ovYc_ntEd(Q?2ILDki<>r7Qn6ON%VhPI$pRPH7ZxBeyxi
z)9j-!I=5RnF{U{BY>F$n%5nec`PHHPL3gik)6)ZG@<W+_!-@RI^MC~;*RDt0=%3F`
z$=H&O=DI{U7vA-SaCt;^>4ob3;}iQAWh71&gn1w-zNG%gs2w*%jHHS7Nn;^L1vh!`
zY?h`>_0#}!$W%1Nq}p17igq7Y{k7ahhNCHH5kcX1zHV`Twi>k_#?2C9ohqG#1NU}3
zQ$LlqlXjp(x1wE~z$Zh5s%)TnywWF)8XT5@WJDIAzH<HAJ?nC8WJii7ixdc9Vt`?m
zJknZsOTaL*@i|Ib;-?MXSMUv_wToj3|H{0AZ_){z1`a$E#6t0yfxk@Hcoy;ze1Dk>
z$QX+HWho6FzDgCu=UJ3EozIT`p`V`Z_)b?gU7PWJ%X6X<T4+FFB*7joPbd*OtTIB9
z2E|Bd2g0^8#}_{b%CbTfiZqmj&=j;sc{AR_(#dK2*9QaKIE)9MIm&R+9D7V7cX&Sq
zac2<jGzj?#5n1*L;!I=5-J7@&g{mt9EfmTU$KTmLDtK2fr<@C{90-73XDM1+W2yBB
zhX@8L_C<88@C*z7KAtur-hOhv78hu=qXXUlWQKDsom2Dj%8}ZjafX+ezBf?v1YNd2
zAY*&cM@)NB@NwWmWH8bL1OCcK)Z6bl12qK&t_*nJOBLV8Pr?%kOJBFO!LC|IOGyiq
zBme5QIw8@yrd+eLp2;B&-uL2o!``8}M<07E#Rb|7Fdr=3^)GrQrYGDolp(qiW#bJX
z0sI;=FL17AB=>GQE{S;f8~)}4$z%icT<=O(Sl~!6k!;bmkoEVMk>UrvDCBxD_mR1z
z#lX9v6v5>;IrsPp#a5u?r<-F;=(CN+ha*j8c`8VTg|I@RS4}z+z0e=MiRK>M08YiS
z0rqd2&P^z%SvXYS6F#lIC42e(PvEVWhow8=8;y*S>JjlF`@{5N%~BR^qYuwE2j)|l
zqogjPuc~$vy@g;73Q!V#9*f;X&NrN=KW<S<X##~6%W5<Az-j5dTdq)=QhQi>ST#@{
zU3j4lQt;v+BGJdt<Zp&ZU7WV+QE(Y*U@A@lM@kV$^V?jl1Eu#t^XZ1)jZx^uqMn8D
zk0ato<?zv*X1=3$Ky=W>!ndRI|3;!Jkbnf=T?&79`5zS)n-$FWUBZbr5j=atKTcjr
z&3EhH2D`mfO=E60%)ReB+9Rgiq`)<X1;_pX?Cuee<kV?J?_u-v%e%F2ySh24g@omT
ziKy9uHg6&lo_M3eSiGgFTo;Qz%Xyswnxetv0CPHNL<|AJbLeOOBqE*&-*C`H6`2l%
z2OBT1e@_lz!>n`-NEz><0I@Ij_<qH+^}Wat4n#5?sIl`odzji?jm($Vq$_Q$TArFa
zDnHl>QnDEfZyZv!XjzbSyX1^mkq}4v%Nv}`BJ&U;`n50W$}t;5sUe?{DiX(E!f6B*
z+PVm1lk^Sm#i~JHHVJ#~{%OF*f|^vzVLy+>p}}OJNT<_gNQr2?OfO-oPkgW3t@2Pu
zPCfLL-55DrGoPT)iy&T<8Vz}(zjS%iLH{TYr<G=Qpug{ZqWw_$)f9=($11JhJZvM=
z9+{4x0PxBMxR9Md#)Y;v@6#%ov}t@pYh`|ZnYJ!MWY=KMGM}|#bO$LljY5OCj5*4|
zj8@X_DO(BzOM0fJir&!heHeOB#HQZuZrBUB%MOFyl~WWv%%5Iz-)zz@c|@?B_R5)%
zt$(Hni=P-SU5Rc(eB0q|SV1~TtL<_L?>4Y}C<8iR8EgSSm)3Y3$ngml2L+6=PQhK2
zqI4LOM2=iAhfkGut<pk+=+9F#!ZTqwPn;?kY(*xL21GoZ9V6f?B!SILDn$xVLFg3&
zAl6(C1cCO>Iw|NAw{a+S#H0lsCE(6zWGTMhjyuKQREwQZ6OTP_H$WDxG0nm)Q1_yx
z@^q>--(saIe@*7ypNr$|kgp{{I-OBN5rQb_Wv`%+d|~{N1ot}?^*s+91VmfkE#l~x
zn}$GK{fp*Dx3pK@N0KL5K$^4jKxw^fBZKFXWNF5e`<_M^Su0q89hXD%b>#d^YwM4M
zUx&M(HXva&Mc?nbcI+4k410d#{%dROa@@NzUz*1z&v`HX`cLeK1!{v7=Dm4Ee@ONV
zYi65k2j<x)*GpadKFT7fD&O_VyJOyx*K1}TYpukxf3DmAdmd8=`OAz)`W$fnNA^V_
zWX{j6Nxj-f!X1%QS)RCc^RI@<zko1Q*B|%V8I+>~2^Asn2JK|$FX6GpKGGAud9dzW
zuW(q@r*>b|a7xn><@l2$6T&>{E#~%%j1kC_FcwA04%2Diri*<j<23jtAngpYK$~MT
zs~ObT|M)hpbARR6WYHsATK_=*$))q9b!V3<XiW%mYr=vJb<{9;u^dt%3Pe)J5Wvo!
zxQaZVt+S(L_X30+g|`|Kv6+12n*#})r8kWphb+y*gwYGax_2TK+<}rG?K5FWeVyHe
z7RNnp{B!7+zuod+g@rmop0cb?j_3j+#UIa1q#f1NvRt){X&EaR-7WWWWI{o4l@ZrG
zBwyGob{7Bm-Cn9Le@DMqdYS<~Y?GKCT%`gqPfU*@ce4N}9sL=dg~%T4Aht;H|1ADY
zpPypRJs83LCZsKFeggCgEPQ#qO$pLLsF*Gd*xFuqn%w|XWNv`g(_-CRg}pl>iq#kj
zd;@}%+y^JI%!&bo+c^+BU<1jr!6iDv=N(Nmw<z;}_C_k=I0jx$?+tEp)@eCoq%>Bq
z{+Z!M#g<wo%|AV8!EhMbLudG5hnlw+DY@i%<xG{P=<RHpewO+AHPv+qZ?JhMEB2n$
z4d6QCI+rm@Y=TGQ2(96q*?H&<&%3;mtiu*qVpK`_%`ts6$KRKt6S%Iu7v74IT;V~U
z(g;{c+N><NzPlbYQz?wb#{g-O+e<ws0Zt2n70W&m!LJ(M$Kd&ugw{en1ONDw3w;u(
z1Y*<U8f+FfabvynC_b_<fZ*&0aGF4TJ-fU%tHx4)U5y4tPqW&mx8hH=ix@26k490x
z&#on>pXQC6DKF9{l2hl(MP)bxR&%)?MJAFa%dw{(heNMT2+5Bn%5r_b=F4PbtK}*P
z%8yT*nEXz4$m?Ifkcl5(c#nf?UV3#L1k`5@WCh``@n1I-mDB`C?*WRs2aCR9T%6^~
z>EFhckfGn)tQB+nFZ^*zvkY_qJI&9xOQ`m?^Y)$Q5ps+Hth?nj<AyViA&=e?cs@*H
zn?&B~xXKe@$>r|h|JM|U(s;Ba?N~VbSY_((vGUI%7Xew#LwRzujt}qt*Dw7iGJyKR
z?kF8=#r)+9F!CK`9@PxQLUiRdGg}6ST3^N~I61$4A$xB5Ixo#_#?5)^jYUupBnI3L
z{tl*B9+zq*<iQcC2aMUEgmr68Ly_65KZNskx07J)KKVYpM_PEs?|{j9O|^8&Yttk|
zUQpU(V>@w4@u%HF4X-p3sKg;4S%F-;Gy?llthHvb_4<nLc&(zg=ta^3-c7DzWSPl&
zfBeB{2eIOB-P+m*+HO`;HHF{5|H_!p&&%CtbDVi9I|_zke{=)A=w@Y?PKqr<Ib&&X
zMKsz-J6c;SkWFE|e6B)t65Tx`tzay(TS{Co)@?qRbk{ZO-eUyQH7HTK0OK?y4&`mY
zE~1n0bS=>FoOzcBV<c6jMBFnTyK?C!Ha6vS|Exj;eMFt_L@c7fM0Ab*89~nDFj=HY
zhP82?qsFs(R__M><cv&BGz;h!Mq)7E2$Th>;(fg#f~#>&#cWDS)$_J3TOCx494?it
zL?P>e5`ZaWet_ydU3g63x<Bzn1+U*3ws`I`X+=VZwB`;~ew0NjdwmI5I{xbsZ<Nj9
z00U@bC9pw;BchL{j}#7S8}tDZ$)JcIfc%SRu?D-Wn>FIfgTlQW%}OXGU`kzL<I>mR
z`Zm1#i4MoNBqDuE+dN`X(!i@XVO=t2yVOiXt7)xgEBNO-)gusb0)hD)c~YyfEZJT{
zy@L!%AI}Qtmlx2ft5RPyq95Ja6)CdTheKW<VyL;8%1P0n>kB(vpgb+Xr*a44FWN)y
zBicN!vmS}Q=^%1E1D<9)11Bfln1-f}(iAU_OT0A46?x|yB=@JsH3E>fxR#`c(*}NK
zu7s78r9{?+@FNe#CUdjP1_tpnn8&XzFsxB=@_HB2mTT?Q7-K8Lc(!o4n|SxaKc{`R
z?^^i_t;09@d&k#L>h^EE&&joei6gsCE^9ed)$qIpeD#l>;o;Db=vTks^4RIi&r)<_
z6k!iC`ad*cuEJl;Z1TNF)qn6R`u@Lf!|PlcjXY|;<eYO9uPy)I7t0l%ZNA{aDctb`
zb5a4o$;|J1K5cyjBU>379#?49o0fmtVCQUI%s!s|8rE<f=5}y&$o;Y-m=O9M=dJv^
zQDVt6X$tl)_*7J~e&hmS>d``vC3(}J8pS?WBQ&Eyw(2};QFgk0!orEqIGV@d08Wgj
zt3?#eL&6>ZW46Ygsh0dA$P9`rFv@Gl(fqDB%B{5|u4IQ323ODZJhlcu9n@swkuwoS
z)Z2mje~Ecdir7rw&=nCy(F!ZeY<N`3bKL2PpC~FT)F9Es<+b-}N%&y(B>QK=adGVf
zYY$Q2%7GTVys-omP~l@a4`pDe?aWLRjg@DCK;3{{)^t}jM6oTAnKV+s8-#>>fXMkC
zjmd!r^PciBvS@1glU3HAC*b>3qFGPZAoJAtVfR9OySIMQP+hNtaT8TA@ggF@AHdQ6
zqJ+w@;5C%Bz+pRorVS1OGqLyho=wXe;?=x6#>MNy$!_C#6A7XvsXE~Rxa`U-JQb3@
z6>RsgC(U?3#D{LJS4L?VJ#-WYx46=g+_bepEp~5q1bgqjs-73EW*NrlaXN1p6X?Ko
z65OFUL}ctX&`=i#uXlUgCsR}w4xfhnxoiM>`T_Su@Yl@_6Vc2&+iR#Oel8*G>q?(a
z69z)$4ootXvY1+TzsVT77p8(XL>N}*M_u_N&Osl$@P?1^D`_~sEaWOC@<e&1SOJ3b
z9gnt#Hb=P6@=U&`kTgFWvx$O#1L3m5iDm&i=U*@N@;80aQcRkm=E}hVar#Z}AiLwR
zhhJ=*%FQ!ZpLc|~<|g|WO1D3y>Vx~gjs^XKmG`&|OQ>uNA>nfdMP>B3k+##okTqCf
zSepVky_lA{4La@5x+7B8l2#+bejnIqqdLiw_O@8Z{xkv)ytistg0t6cW0uYT&jYXP
z|GQOpvDWTU6<hWIyR6t!;kSRwwfK?)$xY>)1NzCDcyIzfWYrQkKrS`FF!O3YVa1cF
zW3~LJO}72>EQxL<_pRjj59a5edjNjVr?4Tw!O{;Yeb``in4l_i&z<xBYjESowccj7
zw+*a3rQO;DuOXeO&6*rn=IkZej!1|Ycy*GWM9<SR<!M>kM6UAhS+zH9CWz*bAAd{#
zq<~!r+0LW(7Cd23ryniVGvft8F2Ot#A-A|>`8F>VrkQdFHM+2>7OH$-6|~Hk88m`8
z4z8%a;Nrr*SgNA@{f}G-o2+o8nI~oaTcv=N8T2v3vHcFXsFT%^*^$*EkkMZZ{FqfG
zgKonBV6nkhSS<BLHG{ct#7*_Q8(HKSUthV55-<qT7EMkSs<R>@L8<5n1UjuyL-Db6
zOi8}6n~o{}i!%MyI4`JBXqWg!1GZsT{(88>MPG#Ec29;4Li?x#hmq|>s9PjL5~|HL
zqC?-;b?^+ojL>;KC5=-E$Rj%T=knCEUqcuTuMLVs*w~!Oiftru?f*t6;C<6T%et_S
zNbaGb_lK85;0)gC{z+~Xj}KOrlslPO%4M#cMnoE%U%{PT!MjJJB!@fee0Y#0KWKRW
zO4-dK4OWph7kd$0Hfw_!e9BTjovX7%2dl<*;uAn?d{j4{zbO#bhjy*E|IzN1u=SE|
zg%pS0wv<=>bcVUog8~$o|2H&m#1Mb2^V`CN)H`LvdDdKw=#OhPJ_%7`l8$6wSBi>r
zwaXXAJ}N+PBd3XBwd2J5-%E{D*mE>hm)@6M@z|K3wa^jPP*Q$aaB4h~{8dm8lCFsx
zNwd}EHf_jdk>>ltHqpDV{AY1_qomQ|u)XzU3G?ro@%IxOLk|U+<u``XS@|ulQ9UK;
zuQ;Z3UR@hb?Jm6^|0-{GE&Vjb`*?C1NGPC;O(riaF-(dxg5oNFN7jFXJAD)Ybk^*@
zLLz}#&9Ft4e!9d!UFUP-PO*Apr0eeY*E9mQC`~WYcgZa(J~!u`KOnUqC~@m@41M>5
z_GE|}e_o-X#C^r(trT;$6Wh?=$r!7uOZN)-RhIS<2qEov{7In0D7pCdH;;_-nMX^s
zmSl62>+e}j-TEhNS0B27-1SF`%GY%-FQ4kKZ7V1!jU!>iul=}kt>cT9XVOHhvaU+t
z7mq^U>x4YZb=yw30C&ymYWig=jkiADn+QODUQZ!r@xIvVc|9iq4)B-)E&whrU51?U
zc#-pq;zxXd9sT_U!(GC!VPPG_e>nZFFQu}yyr5Xqg$CL*Le^}+8baK_^``0N#z-ow
zjh`XyaclYGBJJYLKbfy`e6O)D?oSb3B))A)48o^a^Lgm{C+nc8&UR9FT9aD@*kh9U
zEKcaIrLD*Qj0MSlztzR{tIRX$co8Em?C>S|B2h<yeWcxV*Ul)uUo*#z_PWI|zlBq`
zN&0Mn7hn-xV(cf5%Z~-DW|e3*U7}Hb9uF*!SEFKc;VZ}gX{4!e_zQ(B{@Pyn=aN0s
zBy;pU(T@2M`0uZvuaH(N*n_XHLKT1sHne|hSl@qz9mTVkFr-WE-Yih?g^`f`;efWH
zaG#yrWc(j(yO>bg;@*Ua?RS&?<gxdRl&5T8S11>6vgB*d=7W9<!G6|R<<8NSUZrM7
z?+FFzGdc2X<7ub03mSc}#H-tvgdx*PJbJd8Z!Q}k4iEII>iQ_w72|+3v%$0)mFdc7
zhL@Qgh$UdNc<EAFL9iwV4Hn?J_cFR8B?2sII+6@URRTuaag+?y0}wzyiys4`&-(7-
zVey)eGS^8*3T*HTxojvU=c2w_<)>4iRoHuIIIV>S+d_u&kxizV^1DNkP6$<^jn`e|
zsGLeIi)-M#KZTj1reJs=lBi?8L=Wr$h~2n_O=r}WzflS}EA17|)bnaVxgs;g?^5p*
zIHo(RYsZKQ2AbCcBYxvd3+z}XkWOPpmH4k>@p;6jH+oDVHGDX@WEcQ$Tt$lRJc{Pi
zRlT3+!)sT`Bx$zUW|%~DW}j8jC4)mxHU&nz09gSzqnAKT3BIK1v>bu=gawWhC$=$r
z%TQ~&U7GlVQNO1M<eR8-R>}#O7tP^Vx2dD~&=KukzaY&he4AL0CYsOYCnNSXM*Usl
zug$^wG|tDO)JL!2=p&$*k<QrjpfYV=Mc*}-*l7Mw)Qdqt_YopU8t3LTDrI=z0&S`L
z)b#VieC-AJqxc3YAO#~v&%T-KTN%KY49NP4aszNg7yk&M7DzziiR)bJEjeSJrJR4*
z;mB>+Rhh%$=z!$H#I17j#c$!)#RKI{x}GQEe4e+hZGmr(#2jS*lsE3au$s&(eYjnn
zo{|OM==0hgLj2^b<9bu2W8ZW$YpJbkokHNboV$5#?(-_cZ}$xZ_lkAsHwH+=EN?52
zSpYnP#cNZ3KRAoE$~i@9^iI71Z`4`@z1WLIxd(q}v1D6UBmYz@>NGekN;)sY{2~L4
zVWfFgI|Z*D`bkxYaQ#YAOJ~EoDq`yzqL(}TWPBy+1=KAe0FXB#DdiZl{{tMLa=rS<
z`I>O<)T#UE&$?;pf>DKLk&gU=hlNIs7g`;<=EvRgF!X|w+I~V|09aWPv6>%a5Z8|z
zcktez;0)}_(2|x_sd{;!c^O~uXZcIADff}9p2b_F_sRKBAZP#<kSc8R_%Gn|otP3(
zEq?Lk)vP`w?4GA980j>Ny3&3^H+w&2YpIR9cj6+mCA}7?d4D<iYcfDS!M9av^{D#o
z`R8>prAKE3>F;N$tKM#@Srz|bt-t-b7$n)DM{eo2n{2TjlxP@vvHIrQ@swW9^y}s$
zi^Ja2-A$BXxaYRrmf!S=b#0|tkb(OCd0wi0G=qc}*)MMO)}Cg-SmFG~=af=NV)k^3
zmMK@EwrJV6ABapVvUyORh(CNAmj=WlEkAqrdbJ7Pd+`P-wsuV{#U}DF<iieI{mo@U
zZ%Fvj&(P=BZy4*yPr?_SEc~b?E`I3ni~j00JUDH=6})nb^oDu}UvXYc%{lZj-TK(p
z8~>8@QTY;g^hRZjSUdM2YY_6%^qTU@5RGZDNYC{1VZJ@Zz3{lbHCQAKkh<wtG_hN5
zhXIJ>eLng7zhmuzoLM~b#qG)R)<BzupNX7?oF5k5@_l)%XNXp(oI3CRa2qMF)@xW9
z4}*3R5O}RmPRlo*{LV6~q!i~kU7Tpuso<bV&yPPRB{$^8^t$BwBI(ZNCoZOiTR25Z
zqJjQy{l%zKJ50sv$1Qu_ja)|nBTd<`8=RVD_NP_&MF#DeD*)WB#K<8(wZK)byaTRI
zmvK5SZ^*TcnB-jl+_j<c^_AETS3f*<ngEatQ58QTk(_6j^xd0hvbR|yaZysbn-_TL
zOX>d!S~r#g)K4Q<vdVwxg<aVy{CwT?pVaLA2N?Iyr~io@7%#Gu$e1gL2SeMK9~X+b
z!rtd10<84Nu@~<7`<FjyO1Szk&UY@Gx#)LX!V#EX7HeI&KVE77E&OJmvM_^zo0P&X
ze(m6bb^RFbcWN=0r}>fmRGo*)U6mu0osn+%g1Eqw^cC#u9W*K};A7fEzg^5?eF^6=
zyQSdx^WWN^&tL}AN18L=BH1r}=*OO)F3Xld==Frk#uRdga)HQ%W%#+j<!ErVO!(C*
zKTZU1AjKB6Q-F<Zvkr*Sssa+BJ(hzgAy*z1?cy4rVJQM%?=8i?fJYRy8~Gf^)A?QP
zgEw+Uq+gbG7_PVFcRqM5y3|uv$z+kTPUvnWs+`0lW8ZRaURtGTWImEXk5U3n1I<%d
z=(~QHxo`V2zG=VF!X7b!=h$a8`n_?Yh%5n+wsVd%pY)?8UNfOYk24lIW7Vti&HRxm
z(kF*4#vNbRtvowtm%^MFH3R)Cvys1g(*_c`;oXI6_y_{JS1kf3p>&nS8uI?W28p$R
zZSVz>xVvvcfQ6gJ#x&ge2dEq{$KpvY`rY~fRe*AVe}r^p!s&YPU-cz+ocwU@7Utox
z@H(krlH0g9FkI=A5LQYnwh=?=bGBmZ+m~uXWI8d}&Hj?V+uM6AX~cJ8M0e97%E)6q
zzT!nj?Qpu7+_b!}IF8H4;GGdMM<Pi+KE52IR^QAbKGE^LcOx=8Gu?r&@A%zk!P(wu
z08*BG3n&H;6?aPx@k?D_YTD@nS=1KF<wfu>m>cgejtcLl46=ODYq^;n2c>`VXv-#u
z*{;5nkJuwD7~IcV-_s78E%>NNdGBkqv|v)@;9d&WlV#+;FH!>>4}Xq?EiAfDNad&}
z4v$@C;{88#ePviwkGd}~l(f<kgQ6lelyrlDG=hS3mvncFfPf%~bT`tS10&rXL(S0L
z-FLb7f8TrVx#xc40YCT*tarWdFPB?HjNDJ}E4tICw!d&^T{Ja*s?ri4mVbD{&5Vr>
zdU?0kwX-%gcOyTTG@0!htb2I7aO}ss<8>Alj8FdCPC39JCEaZZ?$}AHu^J9~!DqDE
z<L%=r**Pl%_V_eg$3|_-DJXc-vH`fRCUL%n7ys_zLhkwJrx5{R94WN``qyyYNQLHa
zdENv<Pxm?3bObo_*@;6D`zihn>4UwjjA1ttCE$q`^H_(YqEXaU{VJIR+o@bySNf`$
zn3uSfWv`wK+A@<Y&clVM{z3aT_SDZwu)APt%0kfgds?U6qe_SIu7Zb|aL`>M#T)w!
zUxR$9H){Y_-5-RpXq*+~L2g_l;k_I31k!Yia~BP(!x$vd8GgW9a9>db`bk}aKR(bx
zTX)%?<*fj3VLSu=;k)n$suz<r&(DWut?zt27t@CjiLw+s^M$eVZip7aw%TAtoeZ(<
zm+?A~)?(&nqeHCg090Q{CJ@y7K}mGQ+GDpurpD22?$7+%4%Ou?olm4ta#@*jI%4Z)
z;bCoOZgSA)LYS_MIm2devFSh+TU0c{(imgd+daeYp=q`KXa$FW)YETkO`{JG1E_6&
zdY@{Z>bp%K#(scXhwxCYXf0ELUj}%EV~vo-g`Ay;M_HA%zHi*rH=X&oVqV&PdUp%h
zz*#3w3-o0A*EDoVX>O)P?WPDtJNgG7uH)~EtLfXQxF>L-%6fi#ag~~)2HKxM3BHF*
zGC4{MjluW_BfQ$bw?uA{ARxiXl|6mCTN!VL;KYp4+V4Bste};!=jqSiWi29~0};s&
z2t?LJ1^F<6x40ja4cxfCy>kHeYn2s6I(uE(wR{pRjo-pTEo~5ZxEMp6Z87^b94-gu
z1usUaZ$4a!U+J?2KlRN2w??JSmKiB_Xe+-?{BJr?7{{7fxX?52{}6`%F)YcE&V;y!
z{zYUH53A+N(BO&MFRV`3#tKxkbQT)a3v#>$n{abA<KAA$TzJMLrZQWG9aTPKmbpI}
zHPUR5g|(pvKduot445jwqQ2z5>ozPx1+~66<nvl#x-#y^ar|Ihf?3R??c})Tr>4<o
z9?oMGjO=^T8t%6$JTj%3;_Y}kJZ-yhStSvkiq_mq4PrzEp`xG?@sDq2!-dVS{h#uK
zGSI})WFS*a+CX^K=kkNR2NY!tBLlfxkj~TQNA5T|*A41NI{@6>1ELsclQAlnnbG!6
zF=`jL9-4tuQ{_iFh-vsE0S*HJvjwnJ!|ws*DZL=Td4?7J>kOI9;h3=$<$~fm+ag{(
zL*XxPeO>X=%{xJusBkc!P@5pUSI99lO2=rrQ}}K()Xr#@&v>;P#^=CK(OtJTNbUG;
z^0VD8>9kncrUW>e-JcyF|4;^+#|sVX6bIk)S-6@-xC3Ujay|nfp3s*GMYOm=GK9b|
z!fM=~t09`p$ugxk{3|Pv9c<`f-}OD=jrH#A?TGpLrcr~DvW`{74(RaZE1wyzbh8^-
zf?tG3B7ZT4j;cjKB`aJcdXf;u=8ZO(jWJByaJVt<k&0|LijH0DN#v{b9q)Hsoa5ry
zqlA&)^l|+aw<YHL{b>S>^O;(2%65RDx3BhVBs#KJq#~ykbymVE>!P=Z#;SF`Efxap
zA^5StGcSE$%%(Igmy*AILNce$qR*(I>mh5cahlYZ#D+gda6yKNzGp|5u<A|&-{DBI
zeoTJ5b=i7%_Vu~6+d>Pk82h5=1R;Be`Xfw&rY*aNnP==;QSNsi3-cx?-11R7@7LJK
z`=bN{(yTs|J!`L4HM6Ge3_DuxXX^)SS&z9{u@6)iYBqkfWUW+?V;BxyUBmpBQD7hL
z*Sus5KL!}z&2f|FDv$P6NY!vDiAt6>oo~~8oo38Q%svQ?WB&LZD!Om*bNYRZm_1F&
z!0olwoW9zZ`nw^)8oA?5nm_Sh&5itk@Qf;{kF}83w3GI14Xd0bMmP2(jjR@GhxfH}
zw()M=%^Kx`o`m){Wq$WnBO5QzZ>*gI^$z2SuT$)efX_jI412w%`n{jo(nj*~8@&q|
zuuqB!Q;y}HTQ^OaX!?D>ZMe&Kj6mEQ6p&JA=f(M-B4$6qJ;8?4%KmSpJ5NeBeFiwX
z$@-@vaL{1DJC&df;PW+;?aZOWx?X2%f^D5VdMR8F3vNKku57!JZ^0jLk<&JxYs4$!
zT^>&e@XqPvv7CJ)0R0{Qm|idT8C%Pz0(d0vy`q5IUSm52qMi6Oh~b>euo&jgkoJ>M
zgqnD7HeHPUhU+Rk%rVfnpro9~_crAC%b(+^%YF<gIN6yN%VxXx)jvjJg9AX_=6-N`
z0{_?0pgsho(A*cO=|v2i|Cf~D?;y!l2=KuMWq$$2$gansvwR&If1>tFr<38a;_V0X
z0|jJB5|j_R&E4!d7`xt(^CWjw+2Tc&3W*$}WFFpQ{I7V4lCr9d&m}mC6`45S_K?KA
z8FsQOez@MB7C4x{`Rb|YxqIiZ2yX}4w(kTt7Q9ZN<_q2uW=Nw7kJaC%+N*H8sdur*
z7&T?q<uDo?Oi=-^;M<C4y*_c?5oY2-I^m$8M+75Es9!E^sB%>2AzMC1nv5yRT*ccX
zDY@Dvr_C-gKbh5!JITfr5(?RoOO5%vU2#9lbzNT`*wZ~{r)$d;j}_CNKm{@0KAt6*
zjd)LOT~6iNfkkPGO25gla{wfzQV)2{TITa-jI_xm%Tpa50@?m#m0eHU`mRU)F3kqS
z-VKo~w_(|YhxxY2;)npMqBVn+mG6Q>0i~D^XbmyBaaS`{8Xz51Va=!td+?1Bt5Fv(
z3WEv*ki}gO>lo<91g9hh;aAMkZe|Zrf9qU&nhBnPyTHn>{-FCsI3U5`6ic;F$-5o3
zV2~d_7y0YtAZzG=DchwC{r2g5-bj2B>DI$pTaG)J0Lj!#OtFg3lSK^)dhb8kjOEDM
z7QfGy7LOQ!k<ZTFAHsa3ctoh^A=jb()t%p6tc6djTe5>JCBPwP98rP7_j?0Rfiet6
zL$BRk?6Qhaum(WZH`-|rptEwha&hxQ-i{~&E3pDMAe>h#kPCXxTAMlbBK4AOv5mu|
zVnrcpSG$?(^*M|Nu;}hRGD3N%xWayEb^Ps<|6~D3cmRykf=JJ~Zl#HAB9Bc{c#!*X
z7um1oD>bf{``yP6y@jce7M&qGH}Ucd(T7{f{fRQK;R2!KO=8uLetuc<8}fp3-V)ow
zPid_t3Mx(;e%p<7?(7JI#%A$$A7P6e_hjdY2TerOwe{%OG3)!C)v)MQk0k9kD}i4p
zaGs54un9=ovuBX*S0H>J6rm&2>#c9Bj(*haybJkG6NJ#LYN?r4JiZuvIW;il;TM3M
z*7K2K(kP`aZji3(O{Z$q<6*xH>psm)A}-z<3cL0N5JYWG)4n&Fb*`ys{;aE6KxQ`7
zY$2kT#CwQ;!}OZ;*pAr(?;Sbh5zf~ZVTUZ}S19w&v|aRiej3Y0npfIHiPulAe(Y*t
z5;1!|>Cyvzzq^-e`HJ!SepgaYX{J?X>+I4A6q+l&2(L7|vvKK81!Ko5(>bB8C1{7d
zr!lRr=A&lHLFwL{&-+;$MNg3#Z8UHzjn@&MP5n60S5{6a$DjLe^a5!spi}Ye%^2eS
zFv&;gA!qOkdOhg<H8Y@?>s77w*4%QH(zvsZx$?rk7(?^1xkcVZnZ!yo?m;Z#A;bqo
zlgwu|r&))b;w=$o6uxTW`|Jfn=J)a3^w(A^`tfH}Q@A|30{Rego#=DVh#;7<Fnw7I
zZDMcgJv)(tppJX$<#K<Sjw_t$BNO1z*T|VeTpq2g6`FrVAMergx;qm-b5bmxm}Y6O
z`8<W!RiBTTW+@z9i{wSb1UKmiWpnYCY1b)vUO**%ul6)}OOkv`>s4GN1(C?T>%_C>
zliA)W8|~}`vzb>_Z18f%{2F0N(GBuPyXuGbu_D-{x{C>iNxs8!+Z)d37ZW2(Tb%8&
z!sj%DjrYLtl}i!f18NrNE#2N@F@B;ut17=r;XZNl_<Tq_HE`ZwHBF1-mQKkLg{AbB
z&`Vu(<#vmfphPb_&x{Dl`rHeMLP=gL+Sh%)J{pP{*p7L0O?lAmA=(qKKk#!fnMYpD
zXN37_URU0ZY3d89gLeBcW(tPvZt1{3&C>)vX61TSd*8S>#)eTR*XB=#Vq=q1ck}Kq
z+oL!Sp{Rzuj;{ldp}{pU?z_zuLeqsLZq<zfPfl%cj%GQM*W7itB679V_XkoCL4CLz
zoo~8$fsj{q%=#&umEsJ|N`7NI#%Dih)mEc%HiDRR5l=63$7n{=LoI8&XGR7f@1{q*
z4srf|i(evO!td8wsESWC@Kb+{HfAL0zkl-g9~+j6J!P_20iB5*ipNb0Uf|>~MrR>q
zWB#<&$gjrjkYGZR^bI*^Xz%W{uDpB6_)DY>w?379U=Jv6Wb>}mT4xE5M+=r`5=+LR
z$HWY=k*aFgp04ZKpJfuJivQu6tG4uoHH`7NPuXfMnG{E&izHg;3g@0V1F0)W>Z>ry
zQZ2}1`K#qQjt{pz3Z0*G4I0rqRIwaH#@lVzFVAG#-qFnh8o{RGGL)2oyTf+EGb_Zy
z$gaKVS=4e#YUCi08f0N+@G>LkDwpu}51u0fbEm{^3OY6)l66(W^j_zimix>GAi>BM
z-(LYFjLLzk#aJw!9OQyOWE#P}36kinLv1U@Q0eEZU?1`p`*^P0jQLYFpS^p#SQfT8
zWq_woJz--v5f;E7@i>I^#Bw@<uN;=fL9jkL3=MsxO{Y6+fsPlU>v5N4bo%VoZi967
zQE+6ySVy~ft@a!j56Nx0h`IHlWS7o<<QUFk@p}~{;I#ayPl7H8q%zW&^a-qoG*s^y
zD0-_L0@2&%!UW@i!dhUSYF5nfcpt;|PtJgk*VHB`H8H%UWDx#skGPz$KHj67+9{&{
zQht6j0)J(fO{ZK6WS}^;o(9B3s8RC`3!V3z!3a6#d;&{o@<=y)7;AaQXQr4{b3&UK
z(mmEG$-y@pZV5YQYw`L_q4kTb@q(|)I=U?LhNw@pTG^OrQuqPXBUXl1J}9L=N>I=H
zePgG8p`OPbzT1Nop-4&eghFs`mb|lcH@QsIhm8Fe>?&bYnBhu(8tu~~()C1BCA{HY
zJZwyqMtRsq-0v|l#q~I54ZUX#nTF)Y_e}?V2^`taug_~MTEz~L4B+^@ZeILfKvZT^
z^%R!&pWLg${MY{12KDkhKrWSrj)N(B=r`2qBe;1;{l(nj7iH1p=XY3d(R3p&pl9kB
zBy+)vXDtkRnNVEQShL<p$VR%?cW3p2in%zA-Y!Kd`mcm9iSVr50V1deoW#wg^Le_6
z)mSg0`4`aG5jHP)2rW<ijc_|?8Ow9|osoW#QEQ$O_w4rmd*F0#|IbI(VDHUm9=ss`
zCqZ`@fuh$)pNo-LR-kuN2f)>+O16gh*U~N-{E@&&SFC!_qd{#0iKF?Q+>`72Bg$I$
zrLQdSl^;t+iQGnutj6KIofYd>w=oIv{T>A=i_|D@Rb9(SzBq&6P(yTU-)vU(JyJ~W
zi&Yk~Rm2)fn_540Mw&?jXKpXyX3NF>4H*5T(4@Mx7-fBmRlBz>-~v;mC)B5L@g^~j
zzK=SS5WATY4<wlGG;~GaOd#N<AxFaY%x%FXB;w=dDVC4BrG8)BLTSwSun>KMz{v?^
z(%@BZM(X>Q*~R52&~%0%TIvMIiQSJsQYItx%I^xtUefCb+ap>y4?+&;ug~+|SDCST
z*pJXZ&Li%!;<@MTk~tkka$l$2fG0xmzT<UeRUL3fQxXBj`~$}W|NF=A^a`x3{lz<`
zBJqYMKhZm&h|@yNa`O01L*qt`IJo>wkynqrx;?Hh?sxq~prK?)j`l%1T3|P`$-`7f
z56d>0lb(;5JJ9I%r0J$g=uQalxJ?-JT#s-7(6Pwp+;x&`t3j`>sXSJfumWrUzjIGI
zpjz}|H6hw3<A0iad16m#okl<>z}$<UVMCIt%y9Denqrn_vme&r^rC^(R8ON8@A4on
ziRnte^%S(!S(~*X!C+Es-{bJO<NoUxj4IebJco1L+-14oONOrg(l3gRW+hpUhN({=
zBAxQ4YTn<xYb~lIU~{HUF@HiDNEHTh?LXTN8YJHkL62$ZI$cq<xAkJ5)G`%Q&;w0{
zZsmCmSf4Xc=+JP{3LQrB*ljajy6klS5*T6748+INYjiG*eoTf<I#bcNU$$!s5qr_O
zj>erNdR<t>vr;UZ>f!%m!bYT)WZek`kaAyg_}zOC4$btLdZMqsB<SMf0(&9lr_g3{
z(rZ4oPj%LHTKO}G6dQzq!$&Lk$9TYi#;KKz>#n$$5-}R=D@b81JloN!wcfp+$hO@6
zy@tQI9J3AIi7_R>xxyR)ScI_Kbk|p+Kt#9;hn-2gkpi=`Pch$VTNelW5qNXte<)P7
zy#tDs8}GYmy%a<M4kJ@nkt==nX-AOKfbsBU2BFI2xl}7m@)RyG15ewkYd@EuqFOhW
zX(jD??V1{p9@dU?z6<y_j1{$US^WbV4*KGl8BE$=>4k^*o_9Z8vWg@WTVhnpL$}h5
zm}k2b<Mno2_e6EbW`HtY8i?vhj`tf4Z4U@g?*{L5c~VaV1n>j!D=Q$mak}X$RZ0~A
z;4XY}E@LI|*$)Q0;#C(y`NPJ96FuUpu`PqBNUt;QNg@66fz-N-U!vsqj{z}R8A1$m
z-l=S7<sM$|5DSIo`3m2q0O8c#;HWRD?9`m6SD^|a)2EwhkfudZRP=|tizi!d8>u+^
zxgw!UJfznS!#;!-d2@~8!y5WSKe}n<`!Ap3?Mkf$++fM|ld+=p^Xm`((Bnlst-kos
z&@df2mgy7H7NL-u&!c?O-8RF)CT((p-X(Z4;KYgUIykCr*SwE3w_@1ZkqcjE9TyK#
z6S@1~H$Bd2y4-XFls##R+T1Uu5Rwu#f1Z>JW-S|Veqf8Fq31s1?&!O~!O-*4^+eia
znK=VMT}omvE?dOUAK5Zkd-iMf(%rq$=4m*M?yS(Qb?rdc`buC{|6bAi1q3-_LdZAU
zl~TDu*7d7Dy_Qu#u;$^jy>wb{nWkjhdOb+PYD{^=HOknlhAgWKX9HnrO4I0lhe__O
zwk0MU#qWMDI$sbw073`7v$cJzU(aE5Y40;wLhg)DVIQS%zdN3x`0^?C5S~u0EU(2m
zLWxFDbKJ-G^W>}JB{Zr52$A>lBZf_{He()L@R-~KQi9zbh3N(jJ&J}`1Pxsm>YNBD
zm3{I?SBK*frhPTT{1iaLUm0fxA~kWS*BUw0g!!&r8b4@B_=-{O8k>@Hx1lX9qK<cQ
zgv&y$7aRLt;o!$o`*W~Gh3vJZd{=}Qw?vSk<W~#Kv*Ce`RJMcpk3;+y^BHVa7Z+`G
zv3<ZV*{^`^7BD7ohP@UhX_0&=ars!s{6f4n_;q%m8IWhDmH`!GpRc$J-dbb`64yWa
z*E*&bVEuPLvzA|H_}9V~kWwagEh@TtD||)s&j$BjcQh=G03EDpAL&J5qLd#@&|zkK
z6jBsSr7-|kjT>Or0BdM{dySWJ-2|0aw^od4%43PGoy3(-RmE6MpvPevO>A`cK8AQ4
z_oqBU&wugqU8R{MraiP-{PWZbO|Rfu$j7-H-^9R5R?Ga``p->fqKgpuS___WT^xY)
zEW?^z#p9!(;N$QOf5Bk+^%KS|5d6F^24^q8Ho$i70xuUjso>F73z&nR+eCPv1h<8g
zGJUW&I0PP58lvX+t=kQnRc5w|y92x#&*<obxsRk^Uj<x?jjcwz76B294V}`|&CNk8
zO~<F=PaHs2gx+Dz0ZOWW;w6eRH=?5r6^Z?+SF1w;@03G29krrZHeI}PCOG`c_`9Vs
z-1W%NYe`{#M&^JjJpyFO83Lk8Hoh*0++Ai2?`lSgfSCN%QDrIfXOi0HEYK2gtozQY
zIKm$(?)n;}B;aG`r8|tr@G+)@g*ddSPr)95EatUJbV3?|4_}$xB~x_hcPl!1y;d_4
z?rX_+%p*Mc)W<`7!xy?VL)`fkoW}pG!>P~BRQP>(hR=<yxTNO+Z&xaie%dGA2l(q;
zE<|^pU_pDbQr<7orf^#UCaf|F^8<?xA)^|v$5aGU%h!hO2V{vU^1oOL^<lbQ@G6GV
zAYELe!GalDey0r7=?Q|;$4HKwR*foWAXs9c0k#h~pWHY)Iy-xTt``%aI#h`Y&;62K
zTA%P_^`n7K6{Z(EAN|?*#o3Nu*&Dt*ad!6iT*7EHU*)4{r{5)yE4%5M;N8l*h>Ev<
zO_8Wwu+`96-#!mg@LqWX%8HAyrVyMEW53umjd$*OvdMo^Tt$l3JSGtzoMc)%OjC!k
zxBKCo9Q)PEK8@S_W0ptJUaD1Ufv%bL631b_+>Lii9PFmsAGWB@;x=Jl7UIkpQeQ`j
zJbC1RDAWAfo+y=_DV7Ixk-dA>LY272KkH_;Cy9!lJ<Q0!JA8btmkl>;a&8d9cG?<i
z<;FGX&ajEIKvsH1{WgJ`sSX!JPXc5TC2VB2#%eX?<T)4f9P%Cw7L@L;ki;Vlo9{hd
z>tFqIZmG%QG$!l-98?3PRgW}FK7aIhx$SZg!8JUlFulcPIF~}my~3Y<RBZB-(i7O@
zWOvkA2j8v_T&a34#GLKO3j5G41wS6fasq_iWr_VE=r&BF7aM7GD;Dhh*EKJ8g|6NF
zlqmzVeO7j^scd8HHh`vWueNPCMj#dUXBMCRZK{g<MU$Jo`P|<rK1xri`^}S>A+0Rq
zA+pcOW)^z#3Fn$m`!12(Pr(a-*ql|n&cuZF6yMuGCHf_wY}E(-S&lt7>TC--ce};>
zEW{3CB7|1Y>nzSdk!ke6uXv$EenTM>9@?APm5CWxXSIIKEU2HfX7zxCN#=NW;)wqQ
zY)s`hK6nD01v>8HSPk`Rvp4OEygCfb>MX-;V{RV*T!zrsz~u3HKREpFQS|TxgY#a$
z>mg?F%I1F>J#PaRZV{+Qaf%GI*h6^+i}TFUG#LH?u`9f?cd8z_UhQM5eCVK+jUWuF
zwLyK}zCFeMcRGs{g`eJ{N@Dc;2NJ)LJVchM_utlp@k1op#q5{Q@f|<MNsR5ya4J>q
z;h-yD+qArakTY=0k=W0l{OTYXBy0Y-&a&`Ip66xncM^;pqhm(A_=EDVL2kfD%YJBv
z1=^U}`3R(46zVqB29X8u^S{1@&1Wb~XNuy{=HRb}D%M9eOsy-pzP|+noI1g4YC+fH
z6GWaO6&434f?&#sfG+0@-dIa!bE2HeUmPYZ_KN5b_|u~KDXR~!G|dGn&m05Il(efY
zet;l}gr9o(oQ}jZ(~Ydg2~%XLUXPzkdyB=A2!gyg5!M4(wd+B`Dw|a`IwAKNgPyg@
zvxZdHi6MSC#$=-Avk`ON*P(+`Sj(#@I<M5PaY>n0t!r%;wx=))o?*^LEQQZh<RYfJ
z2!kE2M=|#TJ`|42%;C6r6VW>z;SXpvIGSQr|4mFd&XBP0a0QTNKG9;+LynWf-n2ty
z1u}9Uu`ZHx`Q)IP*R_7vhmy}Q*Q+oq48v19Ewn0M!DA{6Mb1+gXH*Bsk^ygV&!1r2
zg&82-WR-LC3Gsax)jQ$rKLUOhuCi@fI2XH$ybCY5t)`q^oKZPnCDUMyu<rpPu?DN&
z+1;?>76vA2IcZxQE5~&0+fp?@qN>h8p{CN)(RBkqlrBK+I#osjW(F+a*v>UxK|T({
zC|Cd|-mS!}9pnTFJ~7hiGVo~`*yF+ssp&0PY@D=ooUF0be|$f!AD(+r!Yh;Twd&6I
zx|iWNWYKB*OJ&h{^EH!ZldU3qzQfAO+PR2jA_-SNr+YyFGNP@BZgYXupkLc7U%VbD
zx{kLhQv!X--mCh2z(%CtYEX%;9rpDS!q=L5x}W;XAz}KFe`ztD^vT(xVC=kCW=-qW
zI#t6`p5D|?2C&};MC(0yb={66Rf$&Jqgi+fH4a^ZLU(@3tWf{Rkl=>()_A_ML3_|^
z8`9ed$SC{=umDKitMCa`aeA$9?4LzCptyrJv-d8@v1yM_)g0#?x-o3yA(7}w|DHq!
zw6t69ma9Ry0ijyGRIxIEoq%kA%zB>n<@<o1fxa)(dXsh(K(1Sq$Cjzbena&@Dc)Pj
zcDIE|<vgWyvVq=$C-@0~=at;?q@;yjAv*xc+;kD0?sxU_&#U<!3%~r7F`XFIF%hmr
zAJ+hbb)VANwfFcXhgzrSbFr&H6Qz0mSNL8(f0Ni@B<}*tppueTv=I<gI(9O<@1@fy
zW{v7`l<NRH;3iI^z5Vj%A^pIil=5wB`Yt0^#bDERQreinspnipyHrdi*BJtD<}C=;
zdY=amzsYOaNJ>9!$T!QgrR`%E)jep>%p6#s0aEiMX?@?Y&T;vejQObV`NJ=2sXx=X
zPZW@^W)m(BziCdG=Q!Tpu|r>(Pfvx|f-^1IDT>~<uX=$VhveN9{ew#FilY*uABfY5
z?*0p+y2r(FXTNN<kGrF7`3r6R*To2~Mn_uGyO;v9-U~p2SPI-WNZEnmq(<`8#{I3{
zR<Wid?uJIjFy>h^vuV5#yH)TDrq^DU3(Kkv_Qf6RAF-7qk^4_hqr8U)by*RmeI8=$
zUQs|F^LE_#II1X737pkl)^BKi)BUx*8vV6$A=gQfRT*Z`w^+g`L4KN5x=<~sB3ZF=
zH0vWA!fgv%j38s9H%{e$TpCWJGQKS_O7#}|)#hwYSH7~C+R#nvB+MYh9!HT!ilIp1
z_!Z>Zpgi-L*uuihQ8Fx@1R52SeK|wX(4C@7+*W&j5FmxlCe(C)eFAYES^Aa?!Ee#j
zwRDzhSoM(IYe^hVK!zv*kFai)1zKuMW<qh5{|_K8(?#W#ufO78>mJ9vnSQY%7=vot
z%y=Y+Y65IBmCGJ-S<F5>EB0$*%NVgfj8wg5ti^<85q1rNjR#OKb0|<0z#=`6aQu7C
zC{QYk`ni}m?z(Du=hv!$+F$R<^-bzAj=RW%U0!2S5>xqHzBS)AYxiDv7<NFW57hcs
zx-EL-gSrChP_<a4OQ{@YYp}kX;(NcRSP`f)pJT4A)d-K}ST@k#?Jf<n452Yz58`ro
z9MU=LIWhRP@k+DOB<wbeh{$K&&fh3c^t{d1;?Gl{IZNd3R4t!X<&1k;haQNGacp}-
z>B*==j9djqj)18DL2-BEDJsr5mb+i6@8BDDHjKNGfzzrPINS7mwG@`Mg_FI_<$`XN
zS)|ZW2XUqEooAiha-n)jQaCDAhV9hzuf4GhSksX%ua($*_WH98%KIr&Lhc?;$^szu
z?Ymf%QZkVqjG;JtkkPWvDFod#d9tW_*S1Eaw#VUpz;$%H1SN-KwM(zOad%JCK{HKt
zS<5~q;EgdI8N$mFpbkK4aa;9+f@leh5aov1It$rWBST820N)^Zu$kSeVU8t#>^0eJ
z`a8pC9DlkWkWW0RuCtkglqd_bT9|(f!<2ux-eGIV8PA20lv)k~nFT!TGijX3m|c_~
z2*~N`En`<q%O!l&|H5SXb;9FGF#f0WKD!kRtAk;77%NMFAnpg;G`s5jt4;QuNY>#(
zN8Pxu+n-v>Nkjs>9@Eb<3cS1P9lNo!KIR}-rA7t<209AVb`{<|0L)_(dT53oOm$Ag
zMQ~mzrSp6|-n&l;8r>xC?ipHrQ_kgLcAc)_dO+rU?Ca&wtt6f-_jdpdB=Ji=Fh-yA
zS4j0wJxM1TR(T62r@NfeYgx@YCzra+M9mS^ZVg6S4%#<+cYbqTxf%PROLv(TKq#ks
zXNJw3D4b!mvUGC77BM;;DHT{ct>^J^(R=4Cqb0x3BZ={LtX~kz?6*eA54XisifXRk
zDZZZCcNg+&2A8$ko?9EGt%2uI6d20U-mEUgWrDC%9+XUkwz}lWkdn1e3a`y9%fZ&o
zZ3xby8AhM67w|IC_F8!1$EN#djPjSGX@9?(<X22%?|s1AWim2U{HM8UNXd)P_ipm&
zxGUKb;TsJXLLB^qntSE@16gTG40db(o>9a&IrnTm4;|`vul}DQr5B(;!WW@JK!|Sc
z80lT7VSpf2!T!MIuqQYFoZ%PS>%AzZR}NPsZJ^~!eP4_?bvwlvk?~*hO;4qA4HG{x
zg0Z{{9;Q)<6rx@PCv@F4tLH)B&oFS}oyB&c-Od)~`(wMxM{_*yGKB=!DluQKT^<L&
zkiMv9Wt7rOF4N?Xb(OvGe3?@%0kiZQ(|G-1DKIygcx{eU&;*M1=Xc#pdGE?)o$HW?
zd7RF*SMqsg`&ntYmm`Dfri2_XQp$b)Rv0p;Bxpb7{tVOzqlh4->E7In^~2j#>7-{#
ztoh0}+AzzbMZTHRo8pxdwN-du9jlh=@MEz;ueW~_&{@ydSM-yF<CoK)Xol4Azb>})
z<#$3(@0J_-tb;5R6FEC!QFk{NZg5o~LuNfgscnE1M+}8`7MdUlOHVzLqM{nAt=(!%
z{8Qg);1misGLC3Sv9TMdFj}cjv>RcvISFDTz=0;%i6~%oRS;gRFwg$F8&_u8#83F9
zXBJL)ohTzzjZgH7ip6+_Q~KOM?EN*cDkXO>7C4n-LSK{7SD?g^L3C!eKp*71fVS6T
zfGldbsgMZ9LG8gA&?+~8(b@W&j8oDahOkXl)bn$Nc>QqybMd00oc!E;gwxl;*a|v|
z(?dxWzA)r^r@*$)h18iU)T$}!AM5u4gdHp0DCRqo;9KMhP|*UsxbNZcSQ_{FdWWRF
z@~pY!D?{Z=gNKer(|)qQ%{KjH1KiJ;&l!?9e(|9=&(+x-40Uu|r(|D**_G1!HmJ{J
zFwAm%9sX++gWev?lT%F>0r9E?ZPGG0UP#Xha47=tw(sq8oj=;O@!B}wfQ14)ivS;A
z{PwcEC&pKNaA9Mv1TtcAp*3A^{A%bhCpM{9kvHEga}8Qi?3vvSeeQsP%a^>l`$aO1
zCi6m^k+&;qDBg8|NJtPEW}A3n4=;#rcSoL$9nKhoXtI|kL%^OYN&x3zAjC|>%|5H!
za92A=LLex*i3t_mNpT7~_ljNo6?1J69v5LCLp7ItvV?}7&CsY7HZ^e#_D1?zjy5-N
zpSf5@rexdeORqJUhcsfPShHkDl=9TJim_8Rt}Npu30_I--`H-({TdZySRf7oGLZ2H
z_8(!>mcsq1sC7l_$tdr>dvjQsu|vy9E05EC_B|et6Y|m}AWK`$pKf`>O&>darSgu2
z9WD*`<6*qN$TuO!_BHEqa(oM?4}1xP<>6C4^wnpieq7580Z-cL7EmSt`Na90-k+X+
zdWvVFx;46zq)-)X&iS%^KZKT|Al+ph(-;7p+%`wvL$*hr9sZysQs7wtwCB1>Z-hn4
z@ii`WE<1NMi<X!xJqL>pRa8Xh{gK8|HZR=HcEBBVWu$t3>3+U5P^F8Le{psG8gz2N
z#v}7+Ir*RUCgXt~5&mBYy8o;^w;Lqyq+$tv+j!AkmN!z1B&3x3FI&c#n+Lw=vWxo_
zhuf>k{jGktzLw3jSqF9B^B^kncq&lQvCM3QHQ&IRHb|>t)U)#1(`{7R!wWV=4TLKB
z3CD1U+s2r^gJ`^#F6A$c_`sNi*z=jJec`bcQUe)12$qS9{w788>y4r710rTMwaLWE
z``azlH{`aF=Y19CLG;<|Vp>kdYUzg&VuK-5{GnW;tUnG7fmKta6O-?CqtZQjY;@6Y
z9_S6{q-B-9xfv`0WpM|U0Z#~{Db0~0K{Whod>}kDdbAH{<c=sxT42`!Zv6q&=jfQ2
z&bNTz$^=k1sFrAPWBGC-#MHKVqC_3F=avoegH$N%>OZA}+<&nA29oPyfqL_ID7+#M
zw@&dcWCmkxN^?{vnxG60YNz@k-`5>&i#8DnVX)Z<Vi1O(p-+POU1{Z9*LhzepS9>^
zE>KIwZX3*9#kBc_Z8xFYa2gB$P(H%HcA{bhrO1?!r`uWF=@#{yDvC@)-evXG>6}Zo
zRZtl_dN_V?g9#R<Kux{BK9Fp|1opkmY|{8Ha&18lK3ZmLUIbb+bZ<=<U-2xPrdUOk
z=u$0rir%n`7K5icXLo}<E&<}KveIrm#zVcE0n6(JGdJ9$&?&vn8a{SqNS(fk(M$!2
zs352SUHbm(oSI_jw*cC>7pS`wm8aI9F2(wmB7l0K1tI4={KNY$Dm!dSX+Wm`R19`W
zH^&joJ%BaB<{LKZD>{PL7Jmu7JJ+V<{`|9FVIT$Y?>BPH;W|~&<MLKK26<@$*DlvH
zZHFLCeCk~QE@sOAG3TZr(wi)*#63|wfpu9kXw+Z0v0298_t0`-G7w$}Ke27dtpgmp
zVYXKNZ|F}3TWsymMBL8frMtNuUG(e(bjKC}6I4GNTMOsn<P~6j(Q1I2M`h5Iy3_F$
zOJ83D=yho;Vl5~jSN`GGIk_9&>?qx~vglwut%g2Lg!#vY+cBlFD)ZqslkV^CmheWG
zk?)uUAwYVSvHqf9D8&9r(drwzdZXZP$JbV6jnhx(x+W~gbNpISW3mvA25Wt#x@R?9
ztdeYZx}}@1TG=ia6rK;=;G)ZzSERn#qM<zPp@%)?-vVlwfxhf-WaHLF2N=_4`plHD
z&C%As%gr;<ogjWq0EoI0GsCWRNltanI^CJ$T}Gv)syd0f7I3*c<K5-xFNVvcSK*?!
zvTwh<`x+(@ko*|OQThIK1(+zgZU=(&fHeRy6emuIKk!+u<I^cnf@J*$bI~j6_Hw1!
zpbLf`X!E1iJniLQL5z``A3@#yp~rkbTW?O?xVh5b$?=O-tDk#Xmz=;SeH*;h{uzkY
zo5^qRjrr$V%F$>8!M3=Mg#VcxM5=A=uxA|JlmC_B|2seq+0;;8?6E^=u|*=-z7w*V
zGos+>u$YBdYt--VZU?Wu82pwjYIebl@^F~n*pwJkDUUgzm1!^wX{dAHmz9GvUY($@
z7Qt+rNQ9MjYo+wAJz_h^Aeprujz8&|NKh11**!Im3HXaX6rWmr(E8T>`PYYq&PvuW
zPNhtw4bElS$KM6iPG8I>oNo{<Qm3k)2t@eabD`VGy>oE-WpR$o6>uvw(^!ltSL4Dt
z`1yA7iPIOg+M(3K)v@9~uuPN;(AO<Be+VgU7hla_@$OFxItq589-_7=Bcd$v=(Zmw
zGZ@t9_aN^#1w<&34gS7MATTvbC~zjYY8vzg3b<^4;8*7YO%;7)_J1Ehq)8<T#IK8X
z8lfDT;AsbuYZ4O0Qa~T>y|5(E-lF}CDLDlc!{cRB3nVC+GZo+WVrTgN+;lQ@o_8jZ
zXvdy04#1|2>i9zEs-L;y@R-?ofpBWL4~=VQ=90*8Yx6)Wr{moshvvcehdRq`-_JC0
z!8`=bmKb0_x#^;Kn!z4r1UEerPlu~^lcke^%%`3aZ2K2=SU?MmhlMKfVks%u>)nr*
zA-H?M|6<4J4)Jimv7W_`;WfqJTFL-T9QFwp^*6At;2PY_w?_~W2V1?x%R_b0O!XKr
zr?x3Kjo{fy)ZgX_8E9*3D^}#0Cu7xmy{p;*HxBYcF$>24pU#OV-~2@2;$)m6VL=Oe
zVFC4uT;ApS;fXw0M?}n8P9>pX2-K;y3luS0_UZF4gw-8vJ1d~b0uY2tJy(ttYo_&N
zNN|YU7?9#R-G`<&P^-^yCFX>Yzq`tg5^>ydh@7pqTq$Ks42LsV)z@&J(5Tp_H7Ci!
zC1I~}|KZT=MhJph4HLHS+z@db#?t&v7HxTU>4GLOaH|#12J!0Dq8mE&m6deM<3y8*
z6ES-_wMIGX`%j5NSM<Hv@VgT4%h7H}MB5vRy$Tu3N0ccgELUD(I^MDjR%RYhsaB)Z
zh(&exNDxZZG3@3*?#QUKgpnBGt4-^1T9J{uAg2ThgzM)k(X4%a9U3uRUk1IBPG{_4
zb%_#CZ4Jwi_(CGq?sm3EK1y!8OGq^Twsi@)m5&*+&}&n7_DfUW`|;^oj@L4R0KI!t
znA2%J0y(R)1WVlg)o|@gbJyfnj|Qu)Q&X~iC0y1r)l#Ode+dBgueJaVtaA0BwSB?s
z<1mDXI<><0k5yUkmq(U_B_=hSK7>LqT)r0*Cn%(gD1H?=`7pAm29&Cn#r`T8qpe0d
z^&GUC-<FH1Lor3~3yQT{A?*AlV(j4#gt3e_f#>8hCU=BrqkV)YzR@AH^~$QJ+P1~i
zwqo`xUETeAKKs>&^H+5U-*Afq#g)`LhHYNe0XUVK-O7LNnascUjKmAO<$u0Wh?8@7
zU{DtNe=CLl&XH&}(s!Mij&Dx^Jos^ZFP29=b2Rw?w=CDyx?D{74oPgbJkuLYI8`8Y
zo_0Q55_09#PC$8i_IXPsJ0V50q1>$HV~<j1MVs^v3Jg&;2T}H`(=%H6CciIKNVm3B
zD#ZuYy_T8$vX}fa>V<4LQ}8O<AU59R?*<9eT!|Lq^|JWR<R`hlTc7w_q~9}Ys~D;v
zdG6BbAr7fq-486IlEhf@fq%yRJE(|bOj85@?7VS0Ornvkd_PRJLi$8q%r4}6H#190
z20Monprhbl)*5d6(?D9(pPS)gixFpZ{2H&Yd~xyTWeL@bm;A5*f5l`T7jvwwLj57J
zK$0MQzsn`8X)Gj`_q#k5BiTp>8z}?vb%55OX(I|vSOJ>lKD;*0O9A}j66&8&B&_l8
zb7{}}uRDxaFlRXl5!9F#(BJ;lUeCr^)`SO(9~H~4e-bkb59jKf;y_$x5|xq8ft~P_
za-(=094HhlwK!}=jwDk-3j<*D6VR7$qH`gZ-8$p#*DS6(-CfrOYIx8ZZWgj#6mwL`
z!t6{q1zjIs+iPQz^%&T%nFPsXVJFrw*!g!>p3Mk9qjK)e{BklU3#al|n%Ss7dLg(Y
zv-!&4_}+6Mj>~}uv*Kw%IH8fG{Jzu)ZbY9a(9pP}@+XNnR#);|Y)PS27c|R*r9FpL
zOD4)gy?H#Tq2EvsZ!gSG+eR_p4GnJCgx$&LU($(m!NG?tUJU!O$|9Qk^(zEeOcl!4
z6^4*t{`GVoU+aNWhJ7F+wHIh>Ncq|^sZ|yEi%oyglE5FoE!@wWn4XSv8uTgN%l{6j
zNs{S#D*)&hrfq@vIFuJvWGABm5<1k?nqXabf0T3}aw5hH1x2^_i4Y*h(JX@7RIG5b
z=m$KHk>P?jPIGVUwcdd?H`b2I1cl$DDY9AmWs;0qaT={|ilyAUEiks;-T$`gCXI+4
zHP$ESTKpJ&lUtGfQef`T=VHD@bJh=g_YWx{ddOsG@kPrHgdfPBrWd$5-(yqDQ^dcv
z-J6t$eD-@kve;}|m9og=sKie3k@B{~m|(GXzm;@g$6i+Jd}+F?^*NwpuQj|7bY8&c
z#oXIfcYIDXKnqlavDR2k&Hmm~N+}pQHP)0IzX1VzNyPfa>4cj0X1hb-K`MG;?0%R9
z-Q^%J;%9f7JEwdJgB8!EM6fC%grj+VHjPtRlvz67BEbvb0mqKU`m+X~&yG?$qdp^!
zRRt4$W1nB3C`~l`dm&Lg74>ZvIva@2P+a>f70tLG(rw%hBF24geV*%34}#U^<0LIL
zZ@5g$ovh~zgf3q5%e1b4>8>m?2Vm{XHah;}9(quG)foa5ge6K_T~&lfC87#$W_p}p
zg7wO5ESTImI{XZV#w?WKJnRphn%_9dL<?+3ohr~%<C<_Av%|EY*mpg%(9H@k5NU$f
zVdo?_H?6G3D*vFeZ3O6fW1#$eXJ{_Swf>2(O4z;j8ESlMJmgXG+X?26#Vk>TN}z_7
zGcJn_dA6|fBm95xU%pcuce=|Ft9=dN3xL^rc#5I=Fn!o+Cg@B5-#}u$0KZ(c!UEav
z^GR5NPOGLT;$S75-T6cokJ#GKSFpIDGr4zh5?4Sk4X!QcHTbMapQY=zQYnvZ?iFFW
zijthwl+FNk)jHD~=OR~@k0UjR-ME-m1CFp>+|#&|zM<6@!GXN8nau$Dk}cnNM2cgX
zm-oSvr<0-or<AryR}5>CB7fZ*h_;y0n8TaiAi7P9r?Vb)=nbUQ-v^VmzpV|^V;CEg
zd{CKr-@Qyqv6zu@xZXhm&xk&31fY5+FQACcn5O$X2|OuBQ-PEMlloP^{jpN8$_c4T
zed!@B#$xUlhuhk-O0JirMb=|EVW11V{q}%KRI1)TGUvJ(igY5CjkGQk?+H9Rfbc&Z
zJa3bTARhl`-Dr2&$Gl0SWx&%2$u0`W#N?J9UL%|)X_GKAoHtOO?Fb@l>r#Gmvj$i>
zAb`30iGM7BmNv2E&m`zl=$JsS(7HMZZGu=Ta-)I*g@buq#<2yLvutXsk0?b#x~(Di
zGgLMN+R46he6(FQy5j*=ou(p*#x6$e4`O8`Z3+a{rXpB8{+a$YyIAS9Y}Xayk_M{h
z;ygNCta{s*^pYj0#h2xu5+qrwD~x^Cks-S^D24t7Ena{W2N2H&R8&`hnoUJrBSV9E
zPAX94YK2wngrBbV&(3g$G+KtH?#0#@57L&K(<FCO*vt{0)W?%UbT+Mf@O1JND9Pz-
zXDY}NMfS8t%ukLweNk3XZ5dI9l!1aV&>AWn&Z~unq0KU2ZsS}b5+43ZGj^wg79}w3
zF%1NIX=GVU$%-1#+hr}rYdr9bEU4&+km42)Qp!Et-|5}~4cyLR9L6)1A}$2y<~PqU
zr_7a2yy^Ay^m{H9V847gl*~-dyW8=E*kk0uwudi2287W1egMkAD0>_>_F8haYPKEY
z%sg`J2L*KJ^$=QPiyzXcMC9atvg~)oGpTs?5AycK2BrVNxkh4O><PNmzf+x$Wh!M}
z4#5hfU&VeJyo}QeyoHERM_z8<Au6SQW3vkCOy~jb(>w!OPhO2=fC}SEyIe>2;mb<l
zUK8|b-Sb#D6ZhKWQkDk}i@<XrykK?LX&4va!dBnX)hq7sI35Ut=B*UfZxq$(+$MV7
zb9xTU6c5bLK+#|(IzH|r8Q2d%Z$OMvye{o%JTS9<&`ZBtXq3S?QXaK)+?*@(8yPBy
z8TUtSy6d|e=0s2n3uKp={$|TZfz=lF#WD3p=cmVvT_?WO8R9#!hSysf*IPxM?V`bW
z5#GtS%HSuJPlo*Md?-_mPfuX|WzcmIJNRXlWZDk^`ugM)wPDfYGIvfhR&%mw>M-1Q
z1qgDqg}k%H>;`MK#YAzn;nkK^r}dTL+`6t;OKcH1vmXR>CLmcf3!zinVra0dGt}~U
zJxXxJ>f}OG@7GAG=hxot|6EQ4C1}8{RPA{)`EN;et9n57gW^@$LKY(7zpq7f-LK1&
zcltSw%$^ir1#&&^a`VDCmkuBqtgqp62%lj6Ap`kHQUCK#A%}fbPOi&scG^{Uvlnax
ze2s7oR<TQO(J3MuVy@$Po$W7ek!!CTFnuP=IA%VD15eD4UX5g>;2e;h)Qw3=pp!jH
z&Xvfd*n;Ood|*kz(a2J4-ai_4d33y(o@~;){x(dlr_QzFcC1(@<-@mr1`LwZNujjI
zhw2WK4RTAjs-MJ>p9c9-WDJ*eJU$S=GbVWZQQ9Fs?dL_@i{S7WQWB-HotT75`Px_e
z6ZBGK#fWF1Jl08;_UBi)Bp)|D-E=g2n&h8BFH3OHnXw6|-2qM--OmJTw+d~<<ZvB$
zf>x2j8H+%hwEz*ZV9+B})Do0O%OO`Jvk|c#zgSGfzM=fYq(gi8^tELzrpPi_6eYbw
zqE$R3#pZTc^uc)rh|_l|UjeEHvJ%<-08PfUV8)oyGujiF4vsG#&sqd)NM}bQ$s93<
zqsqW{0rn#Ja`F{sQIfEgCd*RGS0A`QN=0|n8ArTFHKUoaz^8#)%$o`kXM$m@(@t^@
zPH+!#8=2tAurJ>XRR+TaZaJet;npyv3Pn9}I(1%2=XcQ)Sv<_2j-nq+b>OHle;7&u
z06(~1yr8tHm@797nhP?8bk*%8bHhRG5Qi%AsTb;?Z~UN1RSIL#^`K9DoB1PAtTx`7
z151~hQT!%LFL5CmLPP>d?1b9Z{+|`GyyqxftV2PeG{Tg>0gO08<#qTO>LF_tx0NRB
zd*H*SQALt4ov3Ej6%DfS2V=s({NMAnqEb}M8foyx2)x;1HuzMt);h6Y!gE;o;&rIj
zpecHH7mh3S(%sUqfuX;?FILz^{mOS@f1_|hunsRL{Yl)OHCt^4)OAh%#BS$SV|Z_<
zRYgG0RkQr=XhrWwQccv)F2(OoKDcLRrGGU(D<3@d{DR)tEsmWz5Tf9PpcZxFuq-a#
z{0ik?l6Lh6uEmgdSKmkjw<Oa&q=5+DC)Hd<BrGZ_dft{g>_2nTg&}+H4#4vc0CxBu
zm!s7zWq?TZ=Wj3P!5-%*AHsQ26|L=??{WXA96t{#3`YrbzN^yV4X1e6%vN4q47iXw
zjbnPR>W6qGb=q<^_15D9Shcrk;<vVj9>tOOm)`Lt`02+%`_F5~@`AF%X~KX4`#*H~
zXkA@o3O2g(wDrK%Dfibu8=(*l=U6iwvNZ3$Uez4?6c+soRo}7c)F{zgKD3D;xmX|6
zz>{qd9x(%Si`MMX&A!jg9;egPu6_I}aNUiDfMd)Cl?awMw4aquMYJZ8Iw#!18Dd0F
z6Hn}iiEamw3}@WcvgNrhR?~g(jZ|>;MU5kS0Fo@9CmsvjEQ$??!1l(jtH%LSO5Gj*
z5_xy=d@-J@G2~*k6>yw5O278H2DGCiSSPf-&QC99B3qs#LiRU(l3BD)&GVcn_zrGy
zSI1r>p)z&MCgbahnnSpR$M)R?9Bjc&tC?8)(;>0Y$jyG+m2~vLuo~Ieys?|_BH}a6
z5Bl@>ff<8!1kD0VgBgms+VTCSJGCW`eU`fTH`3VR-S(e2)4Zdj$Zwa4m>SOQM0<!m
zt2zwb2*I%V-|9rkGT<B}Y+3h}`q#R3n65^*=V$k@QM=FkZ&Lmr;QFtPgwFzJRlp*R
zkg6M)me!D9!WS}(83vY)m1g$}vrG&hSzd2ULztwFEz}i)731>W1^WjCwo5(Z>D!Id
zHod$(b8JEDP?X!5#t6~3_~Qb!yfJrpUc@t-syWj3g5%G-Tg&HCR2Y8Sss`R4z3~W1
zDe!bD(pSY{y0k(%<3!t{`P()t+*^gSEF|SnVo3Fo4KR2A>S2qNC;u69W%NQCmEV6!
zIu}<~M+7OpAS{Z!b(VnCYXt>5Ao;Wn`c9c_-V<FdY4!sS!m~<dJHtUhLo$Jfmz@`L
z#OHe>4X@$qG^H<jpZzsRkONoJtIZcv6zvcdC8m=Eg+%avbHI@3)kz5<QFO!1QV37m
zI*@*9a&^2$fNe(GIm8oRJITM&zMP?mnujiu1HJ(qyK(?bOnr#0@`$e4c}o>b8!cp3
zC_LG{I7;A-dVPG#ly#e$C!{eTdOeEkrpk9{(<GSx=b@fWL<5O+LOTqqU`|!XWvsqg
z<@<Y1Yw8u*I*M}=*>12%SAp8d&&v@M?O7eSTZe^;DwffiWPJle1KoW>1A}!3gJDAl
zpbHCYrFgiR>0=RJJ&sCT*_H2FoW>h%GtEKuPt#X(%^p?Zxb8Dk24IxBaBku^4iqy=
zESQ+tVAo<8{9G=gLo7L{zL;WQK<Ac7v^IrtA}pD!jUUNk;FZi{^SqKdn<|41<ADd^
zvPn2=GSZ0^Tmu2>wi^_lsTlB9zNoUBsx)$_bTz}EBB)xrKmyQ~Q#8kPHNdrv)!Jxd
z>5P{az>TdYi`JIK=YXUiK?A>%KvffLUm*H_e$hV_|GZPQHm|VrPg=RSn!iCM^?3Ya
zqJb2^Pu@o}j|*w?uzo!FB*m3=;K1)lr_q^`Qo!21{0zK)M>l!q(x~#xr*)Fk@YafR
zDe{fMPbiSQB%j_i2EF$N#3?!2b^CY?$6Y&R{eUj{^Puy_E(+`d&s$~t^DlR1%1&cr
z*C9(W_QM&X!2z$;A2l|(`wEz|K!CYuyFyY~l;20-6D65p*lJlQ`bZ@^b}>KD2S~N$
zSbciB`jiHd^S2YfVsdsq_2!SPRTrj9HLLF_|3ao<qVo#hyHnn-62A(WcUNP((rUFd
z@RN59K+e{D?&ne#EhPLv68Xt<ay!n^w<-Mjb@30i{jg-Oh1WE*Zsq0Nv0hWit<4|w
zxk{<@ATOp6K_YMKAY+r6^32B^Q9f6udtQ(%wx-CSN9az&ksb~oh@O;*GNg|QS(txd
z)Gewm)@*u}of!(<yzy&WxaeC|W{{cLEqsi>ZHDoE8JF+u<=|<*IR-N>*)7E9pt(J1
zYiNKnmoWBA6%wLVt+Kz_vVkR#l`3V9KtSpBJarsAI(BSMQ-o^>UlHl#*gu9ho1Uae
zL{B3UC=7{HQQcEMr}3g6n4b|TM{aYk!9u`c?ybGsjZgqJ_fcdaDfY7}OI|(5l@D~4
zjsvdjALrMDq)U!-tSzUAP`}_N?}h&?Wto4MvM)wAx&PtLZg5QQTmMuY^bh}UL)(A&
zGHP2KccJI~%*z2tmbIfGy?|33l)6_8`_avUb^Tl1Bxb+WC&Y_9;)I!tP&6K41l7IB
z>nYm1t~q>vn7EvH+%`{I=^FB<K(Sxew<gL!rJd~)j+@Q&Rg`a&9GQ*!<^SUAtfQjt
zyR|<90y?D9jW^QWAW|xzbO?gf&>-CiGo*k@3QCux$ROR_APn7|Lw67L{&?a%an5@E
zXBI9Ovh-Vf@9X+pg=(*H>T@DlEssG1%(l~6l)f?9ikLw^ddQ<GuIV4`Qcw8jYDqOM
z?EIRAU<EYl)+?jlZ_e#>L*AgenMg?q?A>3=h~=1p#ma3T#?elI9j#CV*I<&~`R-9k
zP#~oy=IVYx%PkJ@U+HdrhNds!d%Y-&B&e(8HE@1j2Tc5&2cQ5jSHD9o@V=O4%R**z
z&@txuAWG>6!L#m3m`+;wa1ICr+Q8sX$x681Z<cAiXo?kPcmjP~#1O@93Av^rV*#;3
z*FEOpENAn+jip$Rm|Qrdv%$Z5iz$$iJO08qR(doDyJcaX8H*Wof=$SY6RJoIA!F>Y
zjT0XoKtERI*4o7Df(+S-gR8CQ>PT6_Tsm0VT}$edq^6T5mqMT7I6*^xR|xwF*?~01
zK!E*p)A&5r2Xdqn=!T@f9^4wlQNq2i5154G3Szeh_2usXA3Lxgq<mmTO^}_KPGET#
ze~$!c!m!Z?PELGKlDgxs<EK*{xowz1TM%x(#bkeKG2YIFklOE*0k0b%&ZulsawsqT
za;km8V!n@$2^+N9JiG*`4OG&tph`1&`+;=-OIq-KW-{1><TlN2E6eqIYl4aUi0&Ft
z=Eer$lGi*nUDv7iauYl16`*xBD1Wb&i{BVG0cN|sI_f7-LV0}J?(u7L+Z=K7N(fHY
zO$$(|khHl0gxQCHh`qKdLgG|sF&*0KZ=o+DxX{p@qWAdtdHabFCw_(p@lC6gTqIm}
z2}0%wY1`V<L%g?OVq9RBEB9V4f6(kUQRAiuA`;-q1Tqs`fX7zq_&h5zsq%i#?a8>w
z27C)CBc7?Cf)Q{xh?<ddOs`eVJma?-U`ROL^&Xu44Ue_>v+Xf%@X(aw?e77lPy>P9
z4o{C;Fl1fc;xbuaO>x7m$L^t|6(0R5!W({{@CwlWI0MQmg$xV52=3LM?=iX9Qa_AZ
z8+3oypf^7)S}}-nbQNjlMmV>+jbj~sKyG<%n9EGF4@&y~P#xUP(fuBbuGt6V0R9ga
zrZ?>R@usvlGABLy#rO1W{_L-X^n|J>NCr0BzRB?Kk{6^tX{(%9Spzc^16ItTa+|n?
zvz{<el{o86g>Ad@))&z=z)I5MPQGp<ZH5}Vx!#La&4rN_)AM5z4tp0H*4I3|79{Xs
zh^LV9yft7mM2Kp=t@4SKJp5UA-B&yIeOD=G4Tu!zp>~k9&=qP04!t#G%v%ekwD*eD
zE`>=BU&YYU%5qqK=k0@xvzAff=oz-7llo_w8X2As5(GE6uHB;rc`IXX40(p;_qM;~
zD62*R0@LQYx?7K3*VnOrJLTiE>4aDnVLBEiJ}Q)ae@Vn6TZzu*ZvA{3@+pmPSC%9H
zkQ?<ztWPJ&xe6PguF%tkhfxi4d!JO{pEww$faFbQLV@4!%K2yan=yb4LMyKEb(_5z
zhqXTfsuGW<D;yLng=tT=M54fFGt^-_1O0CdxVI?E@}7ynzI|g&aGx(6z!C7C^@O*H
zj6>fR+QT=*7wpe2QY*e=;@>0ZexqYZA;G+K;(CNC0Ni&Cx-D(r*|pv09r<q8(l`Zu
zPyb;%!OXgQ*hNLnh5vU2`=5?ruof^?#CfB#w>|&6iMy%lyx>usxcby68~bg(jt<18
zV~P>7^8F9i;cGCKsws*6EJYfp%eZZfne@1tZWYdl+MoYq0WitXox6vZ{UTyXc~9n{
z>lpeTHT|eKZ_?2JQzdgQ#%DZcHj$^+Uwz!J)22!8bAMg-FZ`Bu@AXXa>tAHujN>9~
zjM=6~UEH(whUNzl&@`J8{u4Zky4OPbxt%3;ulY^ewJ$zs1_TC%u0?*8gJ4zWzk8#?
zZKMNP)w)m6pbZz55qjas?FS_o<;~=5evtU#LocCC*8Iq7^jqVF_&Vz%opon(9p#CJ
zN$_IzsK}(aKfgcT4sTJUfbUE$MOP<fts|dRG+!Xs1}=FLArYRL=V3RCxDJtb2Z&9K
zdZCM|LKtpAZkXgVmH>D>dR)DZkRsyuF^HT1KP!RYJ?8cZ0T9Q+lOV}W_xSmJQFk(t
zE#6Lu8_JQl6E#gUR`T>R9Z7T4NrRpwUtqKAz-JW_KT@4OZYnI0Z!8ETB!DcV(rR{6
zPOMyb0XwjK((@#rD-cMt5<bi<SvFH<9g`mek2^1J7KtiA7P}q1F81UkL))eVVBrqA
zN~U`6imlNz#5-N_hm><k?mmXt+yZGcyQvtQ*p4{d9rI%adb16m!pp^|S(TEdk!1NP
z8>X~+p%U>q6KcI=yb<2v6J0eudk+u5YM4hF@is@+NxNpdSasRRWPpUPkgJk116K-$
zLUmn*y-jla5>66K$B}|R=C^fwAmi_s+CHl=ZZR@5m_dyepb#J{7NNWBYHD|-x!*%q
zJ!WPtw+ztlt8dohKSkCbxgAL(d(G+22r5X%atZ+*8FvhCV}3PBRcJWJ<7zirBMs83
zld<XSjoX_zm53)nQan2p3A+7Zsh)?{c@%%tY_4^Yd`ZB|&8}Zmv&LYuHK*oit1u!C
z=p)U7<yQa1#{JP^$92sA-im)8d*pgQQ&ry+Ks1hW)|Y2JZ$I3n>n}Jnm0M*jZ}eDz
zQ{rR60SzSVsZO+QzS-kz+dm{{b0bRhpEicFU23*lr%%e40U){-ubuotKRc*0hPj^W
z;`oG3|NNRx%(+Y{jn81Lz<}j0x=Xu2uUi*@1JcuLoIS+n!>sB{7GvC&`@KE)!e?xJ
zXx&*9)I6wWm(k!8NhhI@qk5}fTE-Jc0*|~OM-uexEC*0sn{lPx9`UG%l#Go3)HV3?
zohz5nJF7uT_HspN=LT?-1Bx(SFV>6{0Q``VcyiuKIOkG0N%rj0+j>Sc$V$pJEmuXV
zpxmNlkLDoVf6}?{fi!Od(g>)h+ay0<htT^*-w~Ow(g56k*1DzQHErJ8#?*j?w_OLy
z5gw<Nb6!ckW4#xHt5A$)gpl$NTgh6TMPot+-vt9dT_34CRSBHPKD+L0?#bhP#CO2%
zwRw5_1le)x2HF@CJACzFdr*GHlBskVUaOVV6+&#wnJ+N;DMa!N_VGcQ9kvATfW%Mf
z9Do1|7?awUOF@#zB!D~S?PK;*TbE|P0K=i-Ch_XoElYQP+D^nEptdn`%I?tpt3`_P
zXpi30<E4>16?}J_Cp^N2gfA$>-jL!ZxutUc9-#xMK-ktbSrX(_9cp}#A?xhD_sWWn
z1qbs!O2Tzt;6=dYxBg~_y3-oi^-1!5XsiSFdiI(5x&M#ClXp_+uE2+vTZ79~)-LFc
zhwyF7<DXw!su7aX&Nml3E57KtZ|Y(LK!8b^^{}?rO9@1aO`o1a{bNmLRe}<Im&kF+
zk_i2o;+O_Yx{Vv<f$}5s=&1N8^`C%u@9(;<Q}sKMd#0mL;{X33migO3tYx@&HJ|0z
z<5+82N;3YYDMhGtXV4s?&>iq0OXV{Lq~v`L@Em;-R3VtT^M&j4;j$O9rJ8!l`6=s+
z(CN4vKfK-jL%OwYo}p;k2$#0nmzCjazx;Pgq#q56oI((9h}`2!Sj9=-8<cRV?<SQi
zm>h16_pODxxr?24_8BA^c!aJfe2#N@Px@6LpPW=yH{0vSl?IcFz?aPq=REw$0FOMf
zuDIwrP4_1|-`o<#&c#Pvj{{Ch)J~8EUfSCDJbCI$;H|$jethbamzQvsp=j-3qfw&P
zp{VNnV{zhk#1d*gw5O+Uq0Dc)tNd8pwdE9_N;3l!?@n_Hl|WH}tb9OccrVTD2+%;+
zFQ_!!l+c!PS46x?mjBFtrb-=XH<F$In75sIdF@Yl!)v?GT7=;Sv20Ra(y4aN#(d0O
zwSZwgTT|X5)1z;pSrT!G<4R!CGKQj7vTo1`X-NpI2e@6OJA_i&w#j@)4(N}aMV86s
zpMyjxMDE8sP0{2$w)|3HV*?BeJ|nl+b0^Tr2c2Hn>n0AD9XNd8`gg@bEs~$VRu$tc
zw51A<2S`GEib^Xs>@JN78ra$bB%B6t?tg&;W4aWF;WaztK$qJp;Vq(*X3UcAW*@)k
zj}S^Hix>0e{rK;l5<FAP?f24lo_1G!Ds}FWi}R<}UV{}?y5t5eX#O<s1f`mZ6sHbK
zd%IImdMBkfN~4#&xU}PVV;IwlVqgt8+dU?wy6155l!A?yT2iae1(cC*J!ed^cwqPm
zt$Yr1&w>Qjs>&y+h0n7l^z{NIO`f|jSdL*fRcy)n0+A@Q#^Zr*Y{}r_MnDS_XBY2Q
zCDluQ*~+p5q;_<NQ3}j#fnC4>rq7M6mFIn{ul9Ud{vaz)Ralx;0ihS%<4kc}wKE&C
z1%&n0x|)LCoy`tQ8TeK)ic9lKk54!i-aD(jSTtOwTS(2A%WIV-_-%USh#A0zs+WlL
zaSD4TWzt56T!wT2+9wtZ$X5##sNTM+I1VO$Hr=a~<<_Ik@3>H(5Me0{lBU29M8-=h
zA8y*nRP9H-a6O%G1>cWA(sO7^Cea*Bkwu8tM8tO2$=Q(g0;P=+bKQY<aFm-M5zP)u
zzOe3hhuWP}C4utbH5BmbOlVeBSY}pk`C<8vrF6F?C^Rd_0#zAJ><2a3nJZ7i*q`Ox
zc3ry%U;oP&dr#Kp#6Q7>Br%K|hx-0*zHVo~_PR)oBjLMXBRcH`iJRS80pFB0H@|Td
z2G-E6_%?u0j0TEeqWU(&a(ejH>pYF@_fPdCfn23PXOCMS^#0gYQ_j25P5xH`&LL8T
z_X2g_OuXpNuT`w`8SZW%0}VfJm0P!r5_EjJ9g1V+`KsH5FcQD+jP4ry<A=rHff)BJ
z@9j@zz;0%;66SHq*eSpm0uiXn8P`mNetAppEak%O#n;TUcYAw{Nx9PQflW71Q1d<a
zOWNyWp|z?{It7c8xm!LhMWx~J^BWwrT370PByuk89~yROKQLtV?5FyG`yZ~G|21Fz
zpLSt8&Ce!aAd00cVk4*bl`dSN`zr)I&iRnz`<InC80e=o0)nBKfnf$I=`*S{h-ELU
z(QJmiCE1>eisJNuS8Kc{?`Js^;^M(qAam7qqHU;}#+$yEQVP|q;|zcMQ`3I|32B>?
zFs-&7aczci)n)3X3@2Zhj`x{;p080?_!V0(sOXse{30uM^FB#3H8%lQW`FI;>o<0l
zPqMq-j~*5<QLm;nR(7G!Nsx~a(x%0*p>lgRYYkx)g}nY(3_4mW*ZrR>)Ym+GE(tG8
zbnD*NoF&Bhw=7rMt66bO%EaJP2|D^c@%@Ig!e7+?8xI;zDvbewPhdiV7kSWPy@boB
zojx~3eOG{=z6*GPtpL+NJpR-KqnmRZpNmZ4qm4``ChU^~6xtW2JQx-_;(fZkA>FzP
z0fA`*ES#K$>Bq<;Lc@L^>(#ki5H#qLd&7d4n<E0N+iYy&9rWUS&{oTlV%s5@zGEQ<
zo)H(7LPe#b@rtuoQ<JcGT9=laja=l@bD{L%G2U6=@SJT038Zsj8M&hpqp-+mDJ+4O
z<OpS}lx4cfG{-)--_OaY?1z5E!2xoyV(}+py&(c)^w?N>rzXQeA5by%#g?cN<`8S>
z6mMkJB+g}qU9rGC0oqn_foFlk)H1~__7V=nD5mJ)&`%^pj3^i070=hjIOqvWKqis>
z@&Pg`zd^g;-RkjU;SRB%E^42eH`iZJFPYME^qM9I%sJGb#A1369+VBM#LW9#BH>uV
zmmT!Q7+czT8tv`RlP&`VZU!wHT7H`Gc6b26KC}~&eZWW-Y6<lINU44r<ZE-?3GI)X
zpTV3^ULanulqNub`&w5#gOhjmed~(w7WB^RVsw0nt!cd3cmKwF1HJK6y*}sJaaZO>
zhg>+#V|w_xOwEm>yt^M1<u-))yjEGuu>F_8^&I$GX!-r-Tko|u4Ds{h{^;)~jhlNt
zb7cIA5wOJ%dEaCzP+_qBTDN6oV7+ZbQsT=Wr)2470;HH`*MtDZu;=(bjk}xEswnHR
zT}R5CNwr9c(|E@?i({o|&7{gt>*6$iP>dRBnclg2hwx8!4%BtRv+#a6|HW|kL(NmH
z`yJ!klcg&+IM{#V*Ib#8c0D+IX<lz+<Ym20x5wo-X;ZknVR&2XR{Ph4y9zkq!Fh6N
zf3zfgcVKNtgI)(B{8e@p(0avj)MVp)CKM*Z>%G{mjTr)8Evk(p47t`ew+<el?JzO1
zk7JhF&nw4LanFuk1Y&pB?$tM1E-P^Y`elj@-!qAXupD>a{W<T$rBFsjTOfs+6DWAo
zeRe;EuJ<Dj0Pp7Nt`FS&GGfF5+SP0CfW8y^!f|F8f$qp8wTtBovPBlb(!;a){_uDg
zUjBQf()qEuuj4ps&F{C#-7Bgsw!0*#)-+<wG=`P}3ht2PuV5YfW%pD->CA7^=5n~C
zShyMZEN}lDD42BxN^uf6Q`ZH~I47f7>i8tRx+?#9NJ)|GOYi%9TFdqNyTkdP-M{~G
zGt&rSJtKk*WSvCZ(n7YQNv@aS0N_gNOB*YmzTA7V$nU|B6tZrdS2_FNZ=94DIy6W`
zHCa6^qr0|OlY%(Q(6ohlvPj7*n^L87m&_Rt6R{2b+_IIoKNW{>vs()Ne<a#8W;7jM
z#@^FSjA9iZx&65}-WAtFO7+H5$Yb}7j$`E-ji(0aP2-R_lT&^fLgN+pF9W4Nq+J~N
zitTyKHMC{-Aadfzi%Ll?uTRuD)!o-8##Tslt0dG@FF&Nf$}N(7vI}2*ouCjaf1d0r
zE?20PhoK=Yz$?IlchAMn{=%%d?)uW=GuO{V_OeQmAn(V<mvZ$h;@Lodoj^`-|Leuo
zkI@CmBb++<2WiEn6_b=%R!x7|El36a<&P`Ybpy$I)97;z5^n2TkV8?rzTe^}Yy_nv
z!mj}|;37ztzcrdRUJ?pjkZ*bkfs?UVh9;FZM~`(@O-|GRyRxs%+-EXok~f4eNp-ek
zU-<_iy|yI}b`_Ph&B1`f5ne}@ozuHnvFROZU*Y-FuoRi1Fumk4hof%n9tv+$ZcFq}
z7vAw>5$b82>k97T61oOI1f?n0Ft#|uyHI*@h%{RW(g;A`^rY(n@(s3JBhy~k@ICsr
zm(5aBP6M4Vm|m}wlhg11t4HET2c0sHu{#dRja!2mgvU(h&okqFCYIAK%zCePYxib!
zfVw=z;vCw08f>(UBwPbVGBw^LjR<9Tn<iM3l@HH;vqUe2%R$g@lB1qUSmMoMIVZMl
zJg%dt)6z>E;9t7is`puks7t*4_V=gl=z+k1v{48h_$tE^u#V5}(Sd|*esu3O-f{z2
z2PevJ2Uw1pKsQlD>MD@p&UuU@J)Fj31jfNyTaxG|&u#jLdH>;ieQzxf-AW$=0Elw%
z=lsF$+=DZNf=ONx+Zm!=g}05UsjV#Y{4tr^Pm8VQhbxhHZF1bH@;F8Aoo|CtTiz-^
zhS@Zw+)e;lv}c~pTJIV^a5z#O7Fm2PD*=Kzs%zxm+E{E|HC<z7n}?F=_B~#<FfoZn
z804qDZMf24R`yaQ<9-*vnvB5qcHQG9H*obQVM~6^tZ;puBw-Va=XL%tNKwRmmE8oP
zv@zs-xl{RCGw7D{h1ExYVLxx9G+vot0=TeOSGm8Gd?a0V)7#Bf3X72%<VK0zrLfJP
z1k2RN*O#aGQ&QK0QnTZA0y+pQ^^5&L!Jm$I(*C@?9-x`nNypJoK>H}(cCJKM#UV+O
zm>qlkq)wZ=_IRjCxR%r~?Wsrg^PBUde&{CPoBj@Pg|K$kzj$AdjCZ`ercp$lQl|9}
zcrVS``Zo<q60Ug%=qSdqb7hiP@MNFq$eDM~E3N<riCC@tx7oEK{Fnh}r*x1)5gSz4
zeVwxr6xT_r3Y>z?*79VrUxEcc;<tk`<=<p;N>lZucpm|%;oGm%_8Uy$RP^M<+Ffn+
zh1Yq6Sa?*&MUpf7E}pDEfh(r=A!t{Y+%3wSBNk_wQY+(ZJi~m8vvf`yp{7pHPw_jA
z_>0AgN`|jTjlrOn-vwZ9vanKRnRExj6?t45ZrC-G>S;lc22J{B3oeRstGMtK@5Ao0
zap%&<mmZxeaf(~R@3z*8M*1m*E!F^CYL9pf^B=%>YG;76JyRlUW9_jhduM9mKk4=!
zopw-(I-7&b-zFe#Uxl)VQ`7TQo>dF1r(EvnQyvdA0pPFf7a<YO>LCQp1KSA#=KBks
zffZVwygyyy?1wV6LX}RM-M==d&K6FFR@%;*XbL>51WMf+BR8#mU4Gkp`&WOe;#M+e
z3zq?}*kkiQ-<+9s0S26SSmDN?!I(qWm4Je$a{hRp%Qx2=giEZSaN65k8;eUPz$y!H
z9PNHddH?;eZUSrEbsAs2+Uxj7W&CfW<$oLKEcmel*a}ScT#r)+4QSl+pWUAmuLZ4>
zM!3GK)`+lkxharEWh#(<yW)df?x24A(do<SEoezB5xf6Em?tsG2wdi1AQFxFt#gkr
zOsXwN`dIeL^0|VJIC!x$b3lAsqT<Aau}T7%EF5RGRyG-&Beu=Hwn|YrlH-NENKLgv
zQdZkou`{KdSvzVb?tYc(gQ_8ow{CWb8nXUEUp$s!{<<F<CYC$yL8W{SzeZJpE-N@_
zDrNn*yMJ9;1qG5jD13u?g)5MSeYNk5jTRmaeZ87-!6awL_Tc?xi%0(I?nV!j!;L5s
zq1$z`w;``_r5&V4ayn>ZSZFB0Rxl7E6Fh_CPNDWmDqR|ljF7~9gij-Q>6j!nHzcg~
zkm&0PKxh4>hJ1n}jREH$AA?4;L$@Ysnu16cWSd$k1uUx27i(#SM%Q}1;4h$7zb~l3
z(&l7D^Sk3ouQD;#V<$CRI!DaqHlm1di3IEk;+S^JgCY557I@i#Vv6Lp^|Ht_i+zr*
zMAgtx$<PP$6=XiFWE`i*i*b@k4#H!RJeZ;b;Q{@;M7BqhrR}Qp#kw<OF&9GOS703K
zvYxtq3b!k&y3p%8#D-v~YR{a-Wpk?AV3+{kGBG`gNiMy(LU%Ni0sZNOlP^&wX>CL=
zrgjCqm=32R8R%y|J(aEn;CkgfVKXJ>ia0$b1ns9?bVWkGW=N*X;&2zBK|eFOlUClH
z9<J?I*}L3?<Aao+ka7{-x1>^AOP>&G-}6rV5g8AToG!B_?hQS)bP?0TOD-s)8@~^I
zWKboCOcZiyZMsSGLFd(?tUAvD3Q#uGQYeYeiCOU=4YDqlVtS}xtMAmE?R6RLLc&U<
zr?$E24bWnm0!v;j<^dX=E)SPAiw9M!$+Ww^S$>81k#?+FzqFhjH{^m!eQ&P`6LJV~
zp0ItaD`av|qO+c>s~-8Or5V9$&;gEVyg}#pCW|SKv5wT`J|CNMUrXa4CHcbjE~|*s
z@USwB=Agx=y)0Mg%={|WP^6l3Q`iH@QRH{uR@9J{QY86;3qKu<%UeS0rauolbUq%$
zKbDCZ*^U)<2*4Op#q;@-c)Nb#SkI#LEitjW0RWq5XbDAV(Z+G>vZrl`@NW|`I5ZGe
z3JjRzBEt;oErf7h?v3=1;~x79(4Ajs_Oqcuvx^#=qXk<H#+k6{!$&bJaz-|BHA<I*
zlucZ7K-#UMB0QWmpYUyUzZ^PJXfD^1-4A`l(-=Pq7VBJZO)WnL*P~CUUg<ABk4}z$
z!V$|o9#%8I^N=WfPziZ*;!%;|b0n<}uky1gfnD(HR_&|8&mEe<pLsY~R^Rkb0l?mB
z$m-0L9?5gV^eyLWkG4Huxh2Hd+;lOcP{S1ZL;jo38eXcKfe^H=6Y`f38ahfdS@vO%
zp7pV~bHS86<Yo!dS$($M9!lOl1GEu4_uNX1k3M9;s=sKc3COc-ya4G3N|9YPbcQ6J
zYRfyU{lok~c?ahTb33U2?@ISS=@YjIU>1F2d2*Idp99&}fC{NE_CKqAw3_wBX=r2p
z(GZXxj!}QX6dB$0NBLem7`ks-3&d(oN3SH2>M?aoYYU~K&&WPp#Ni*>PXBQ>v_rlM
z#Q~Wtyp`BP^^-7YO7WpFeF#`}R5?cHlS%bf8Yp|r+sA;MWQuhT(xTx-8og*@L1McW
zZLz%P;A({7YcUN0o^iIE1Qo4E*LrsBL}59fGH<a$b|`l7>lsR`nWt3VFfJ@)i$||a
zR_B|e=Jm`?pMPmvMFNNCYMf1k_;af7p)nd*huv4@)7i5&jXgP8`n57O64t+p&MK4>
z`JT@CgTtwWh6*>8gRDU}RfH{mKbrkM+C(w9q5X*qRHhjekBE0MpM$i+!o%HkKl|g5
z^B8ghYQB=dXneCaoCQGmsrwo!;-eFHddJ(o54O6Srqo`8ys2J&#`pd)@vQIIWg*E4
ztpfzrVLNJwfQZw=rW+Do%r2-NnKtOeROc|cZL^(crwN>nQ0D4vx5=el<l0M$CK1A%
z2bdeIfRfF3z+r1xepXr?H6+|vR!x_Kc}-$c{%E(AFl5rSH5Ej<ZmCLEXkgjFh6pv<
z#XSupMA^>PXf;N|D*_cFwW9h=Oo0%McYJa6i)l}9ii>sfFok34$56%&e1o0-zGJI5
zKNeVQ`$d6cCe`!vQGQ{A^Np(L;yrSlqhcXYqQqjqNvg2jyC_-;-@76?z(yV?5v)2b
zwAlM>TU67w5Fs;*7M*qz)}wAE+mD^6Jbi7kuc<0Ax)Dk!UQ}uGViw{Z!Hp1tqg^Y>
zq4uZEHr>EWho;x=UCC_?g!c}6G!--)9X99Jp69jdM7aVW;Z)e?7fH{7F~q+3MNFB}
zsM&daolBg=CKxK}b5->TuL%fU%Xb|{ARGRxB)a?38ffu|D&ra*{e43CpDX--*1st1
zuE<(+;etI03BrJUWny`~6oJ%u**#KfL;k(ghBU5Y75DYv737Tt$Rpd?91<tyskI`4
zrA%%Y_EwbB?ZtGAX4d>#Pd023cDTzV&z}6tks*cxhsyov7;!7sM9M%B5mkQNyZ;VL
zKLl2<5ezRCKFMFiHM=66dY@?ehntkuXBwN0B<3#>IwLtMtKbFZRmkhbXEhtM(vBeP
zO#Bd13ULBysE#5I)^MESqc_ubzb;DbK9{(Ae^JsaQ8&D>uD4a0V8S9PiRd9`M6$Pc
zSIfsnIZ6Hg-i=%NDzy&liIEIH&$8gM$-(Xj!azD6nAncsd088g+d~;F)1L<th*5`q
zwgk!8XyWML^=I3=APA(p6TctZ{Lw3a&jg$>aX^gFU3+iF-v}xTaba!xh%HtU49*6E
zc|4j}ZGgO&Np5l8gQ)9~C6k7WO#34)ZoqKo4Tvt}s4WQ^td=`ZWt1jLE81VDRAZYA
z_3MwN4^)W#W<199?d_anP#DXaNN@^N$XmuuJFoQeoEILydTLpF&DXyKEUi+Y^V3E$
z=Ku7v)u>DrMT{w&Ty5BtqK~WKN#Ij3plVEbj+#sFbCbqtNKLV=K_-cK+^n}&w)ev}
zfoWS`4X9i?C;6bALe256jFITP(ZMmwp%gCD4RksRm%5q~GT}n;M|y$-8i8pK5L{J-
zXw|>si+k!_3WOs?Gl=uT&B~d@d4&;?Qk!karzCyu;l;)V!@yQ%wO9r~_c`Mux1}C*
zpm$pGw{#OKd-a_43i4pwj^O7?z^{=f==LW$R`=9RKQo<D=yCG#CFbx^385n&78`@_
zv3+5v552DuS5lO6`)qBtdImn(p52Y%ayVO`3)qC#Ja%ilJwCV_B45@xul^wtPiPjm
zI+b6_Dxxo4whub5UIOS^RXqAtynY?$)}z0^(|B(eKkngAz!7nnqsjSUpo*mFS!<{R
ze0)l}#U`?!9t$Zq?;~o^ArH;RIUQ2Zsxf{yef`mdC3W6#b-WasiHxX$l_`x$+5c3!
z7`(k!<3<k>GHTw4uh#9srQUnD11Z{n*rmtz0m9q2o#WWQr@8n6A2g>BQKGt|Pa!Fi
z`cK_A>q<@OZOm$X-L~W5$4kTi6(<b-SM;_hKahra-t`Q~3KN5XU}U7WxNm#ju^sxt
zsk)=a+_LmC5%=1%U%qFLO2p82LcM3f#AaaSUyM<X*8BN=$X_JR;eqsKpk>)t2UlxW
zwx?ozS^E?VHqb5wnUW^w4MLsLp{GieGrUm;ll|P^R4d68EyBGtB!mi*4QSpO1fjJ`
zWH0p0tn`pA2;G27p?szS(&XO}G-hhT@HZeqTv&>ACcdn)`2`A=Q2SUl2cF7NI=1pB
z06)<{Yn8_$;Ks<m56Ppkudzj9#?<3d6EMDBW6;@EbtRh^%gUNs$tB-KhaZLelN^Tu
zAMf6IX${!#7<@y?V70J7E)&!iiVtOMG6N>fE4>2!c$6<3YBrd!*%v7v6O3Wn3pQ3n
zfaA;ZFcTXL63xr=ecX2WI%!%Tfv2$6%c?d?C-Ma7MZZdpfj{O%_B5#vV^j@+6g%*n
z1k*>QO;62jCMawkVw%n**t9RGz#atx?z$<b#xTA(F|ynXRA0?`F7!oGv@O69VVzK4
z7r69<A*{D1X}xVfKhz<m<~AvRdNb(Q6U(JOrh6Jl2*BX%U{1P9VarKJ(!N(KC=~Wj
zkLCcZp+?_Z-Ugr_QN(;SA>xirXX?OPb+JargJ?wqWgLD#gH5r=w3J6Gz3oqzwJ+qb
zM;soh=1r!lM$qNcooRV=JYBEID~fqy78N}7LX77faU<$+()nQMhY3x~$o25P^B?^n
z^QksfnqwCc<$a_m`6V>$gG1ecoS&<%>Hb19xTUg`Pu!Nxy>rZV2|mFqXB)$;40#G-
zUyieFh6RaHe)cc<9D~<o#uP!0Dl}>|Y~1vEC))Eq5h+k=aoxJqNW64;jBeIs5G&no
z4sCloM~sC{@2yXH)JX?_<E!c(iEi*26EQ<hm8*Mue8<^qRK>=lp-2b=qNRV=-UR<t
zHXmwxU_LeHh!tUmb+g~ac-R(m`z)GizrOaLk;3v>7zFoNB4{bj!-nOz&n%%UT}Im;
zX}be=ne_j*7yk8?Kcftg&>i_v^HgHj5S;xyG!!?B!6Eb;>pg9O`b5`XY1~)}QTFU=
z1IomO0bWl2*kelh%<#mqZ>2S3Z==d1MtVkiQ?jpUCjD3nCNhZLV+i+-UX0h5YfOzG
zqsSYEb>GL(R+T+D=S#8b+pzR+qGx7!x!RC{QH9PWl#HA1C>%mmZA7aF+D1Kq^721z
zV{a-qd%#S6wE80P^<IbWP@}9}_s1$Z@=pd?g5hPguYxW;cZ5HDu#UL$P>(>2ayA8d
zX@i>DlbI^C-$*~fGZ6Qkuu1^Z%Yxs(V`*wO$5x=0y_jwhz?d2TZ6FSqU6esM{zo84
zH6BJ*1g!^<w<R4sVizU}dJR$gLE2Fe?|>Qw{$Nw1UsQ^?N31-_Gtaw_(KP>%UaY@X
z?4zD+f&8KuU5kATMAILGHa<OM#PI79h4(I+DA)Gl9O!TY2}OJmq8w7axZ3u%lzM?Q
zxN|4Y(el<}Yezz>jy^d|E#Bsai#aq%*u@S%v>7!adc-z^uaRwkRHbQqd(PK5;WSCt
zI|kEBo~e$<c>_s@oOgSbRWEl+L(|{t&6^k#oOm{OjAa0?s;=}NO3cJ}u!HL)!lfL?
z$Z<QEhsV`uf!<pnAC>gfv}QTP@{_pmv%of48u#F`!9ek4V3*;NPx?~}S`ne+LnS<H
zcaHpbfJbD8C)m>WFedGzFqH4~!0mI;+9Tx+7J|)F#8kD;751xAk8LjZ-KHV4`zV!}
z7r}TBsCYYkKF5jMDb(4+jir5`RDO0jT<LBW8E^nxOf6K&Oyq0xxvFU(lTNr}$DU1W
zKcL|Vp0}e+aAVRs%jbwsm^bi;Ycv4}&FH;!WfklIhw2LpvDKBB3{S&hDf_B}j-(8C
z+3ybQqOjHPnLT($&Ku_Z*MS@6Xqx-nj3FWsj#xDJC0po0^9}#V`FfZSq$qyQ6k$03
zUd+?8BpZ5q@u6xZx+fqqgbrQL`K}C_c3qA6uj}AnTj1~eB0}))I}WMLoat$Uv0mXG
zx?~qIkVh+af*@R_nHWakB8@HuV;(gQD9?2srL7RIMLF$IiTke^5kvt^CJ~3O<y(7X
z++>=~*ff;ouwzL1@VJwDwOC-fyNKY#RYez?KZ3ATD%0W5i~BA$`Hg3-zUURIpg*qc
zI1x>HAVl2py5cf70fgfbZg%S_!h<zk`Ks8$;^zHY%^`jeB61wjd&2)H-F8W7L?hu9
zbn7koT373^RGh3BR&?Qt!^5Vc9L?XU(NxkvJvsd7gd_+Z5K#N;74!Ndtgnh+gv6~L
zsQto#>w8h;Z6tsp+z$O0)50O!gP=gb3`hWwGOLybn2UaZ6Pf~~{je#ilDp;-LbyC^
zTttk32J_ZP9^=l`hKr!BP8Ss#xIwxw37-*_WMKf)dq)npF=lUeqoaCYx_zI737g>s
z|2@rI5VHmg9rQ)umyJw2th8@{2;n8Aal#A0QjMRHO)pgu+#EMyV#$y_S*kjWPkkyq
zjT$D$VfSZ3;#9aN&>tCJw>@u8+X*aQk+cyAPATY4sh;_q;IvfgG&N#JyNO-46yxOg
z2EC7){{9kc9ZR9S;^O&>tAUF016g`<pDxx~;63H&o{W2gq_>$cOn9r_EYhzA_%A=M
zh2eT8R40iz!~*JgT-{){iD)*8sJN=4Mf-jtr%6dpi_o-doq6Cz)Jn5pGG^Y}fuu8f
z<_pAl6ILKp=K=8N6CmBnbz%)rZnby`r<Es|reTe>(!b-4^XVwg9dKBCo#X>^RNt2}
zZu#gaY4uXu&b8v=9My8Rt8gfKL@i=ZlWxdQ<YM7BXi($&U_p{d&{8_q5?xS~7AbWj
z3j6(;k1I3Bu>AOJes{d`!p8%PJrh{i-_`RrC!b(88&P^?%=laum}4*rT<q;Oywxr+
z)XGVdJF-Bo{^8&zr0iJ^1Q3QX^f&AB2fx)k7(B^e*Dc@I26h_b`96H>AF+4xWq-RT
zZpq^!zNyeYeE?9&O*^-b1e}0A3l2TOy}i<JyZ?wB{ofxEYIi&3IpJJoy(So{wxE`-
z(LUQEO<Be+_Mp(&1p1LFQLBp8H-AKV{;_KEs0_AXAsannj(y9Slx*anASe-FcjXQh
zsK-7#K}KkB#L|j#KDzwc^oW?&d@N#84a*Pi_B!IqwwHf0C)vVFI|WqCoUo%=TE!p*
z8nSwxr)?lpKjJznzo-(l@ykZfyLIB`Ts=e0{$?zEh@mu5KU+5dr~DU}0hJk66O}>N
zjkx=PT(xP7!iAZOan}rjEt+(@C+b^SFVWjijLE~P9oZb;Qdx4T7?zxyYG{9X-&D}B
zasMGyvjhe?7;RR(SsPG>OqqbNP8sRI$Hlqy>HU7PXj{6o6^xJZDJfhmX|R%_n|MCc
z6<{tB3xp~JZ#Vme3lla1l}ZB0U`RFTWOKZbUU~sYy29d(_DO%SOR_sbOx(of0@6Yj
z&Te!Dx6t`RH%gs$%QkRef?Y#RiXC7EJ4ugF{|`CT?#HFE8)i1t`_@}iuq0E<R?#2|
zPK&9D1S6F5q&~_qL3P`X7BwMBA<{Tf{6l%MPZk*d_VV|`rYIcQw={k(r%h0bq#3LE
z@&-#m&|LaeY5)d+u|Thq0P0!qg_g(3-dc_kDmI-3ek=H?BxNh1AOEC#_0M5d1WD)v
zZx}$)knsBz=Jb2E)+16{EA^qbJ*Uq!iydsr$J(@~^mX0NbR{8g$>ih>ryT!kM=2)e
zsv+#4{o})9<H(6e#2!=UMZ(@|y23lk^xl$1x%M>+B6O{QJJ#&aH#Ql}CUa>slk)zM
zN&bEaJck}mIvHh`(EnuN2BBNJa?~$HSkspz!UJlA3F8pZP`I`b7Gqkvkb&P5=pqTP
zl@7L%ilcXT$S*g#@8Qgp_f>{(4K7=7`xSv~0uQHRL*L4R{z1-VbYroGhGv%k4fmJZ
z1Apc7tD{lpn=|gH89Q`{%j<Ukg(os~A70+YL_UOHHGKH{72(gQ1H6lfLyUA8s!Tik
zhJKiKM#*}5B={0OA)5KAZn`m>uX;SvAhvt*bN4%ss=p*0{kj#q_U87N_oL=$rcm>Z
z5+-l{cDpkfuv96Ws6Y3=GuMHg=tu+v%bhcP+Et{Jghbhqsg)^Se*<Ch%*L}!hdy##
zwSnw5@bbu~Ub@R~%p)q=#D?|Db&GtG5CdV2HWj2jV^=1VS>qjbe@!CJW?CL~bE&;j
z23PiuY-;cbXibgwMD^hdWW%rVK725ac*buRUV_L=9IW^qQ1f{^_wpC#q!+G`Ug41K
zYL$ZDrzX2mQX&;)<Qs;!G6SIdai$G823U#k$|}cNSm9et%DLiHnq1w0QrCG7;k6zi
zh*o2{txMN^eF-LmQsd|pO=GQ9bs5jbuokhkRr@#h>v%x|65gkHO~x=gOa^>xK?b5v
zgcM&fUg^-$SXImv*f${Q)tHJ1K)hSNKz8ooglS}uurv#l@unI;S#S$j^xo&?Nw)+Z
z6Iq!Jj)exb?mB5Y%Rah2OKTB?ehRzT8W;>6ra;pQuO!RPCmvU@+oy`!wOh1dzbD?h
zRUZYFFD`%a!goT{g~C)hDN-2Kxn$XE0%X9O{%%L6^laPW>&4WD^QAd`u{Jr1*{g_6
zkpS6(M1?F&!l#J|PxbvO!<hE`g|CIl{akOZE*^W^0kspxOUSb?Jdg$@`l(}<LQ{9t
zIBJNV$6W<+aXRgwsG_1m!5qp9eR@Q}=ng2|`f=^JO*&&wx~%ZJ0HX5Me%MfCr04cC
z+!z*B0+5sAZ>eAcTB-%hBL}C<hfsbjqq3dq)?nQEUehqopGVcj62aZsQnq~n`)sxT
zY!0_!5HN|$ES5G?Vbf}^WlW?z-O`=jJ=U~M100gyfplW*_4u%6Pz$Kps%?!5L`jt3
z31Co}@5&uV5#Oe0_0rT`4zMFj9a{BoEBp_8)b|9YTOSnLB7OZ?nG(z)L*M1Z4IQHU
z`4+!4_h@#GR5Y3dP>596PS&ixnkv~F{Z|q3=5B99%9#5v{Fwq=kibvYd^o%3!{g;6
zA6fI}i^r3>RrwS{u?5H#8l9A_F6LWT!-Cr=@*(5uawGTD><_qjHS!m57e0ddqVs$d
zjRyN1rl+T|sD*54=9bAfY6nR<V)qJ?uAlbz+cy5$==(ov7tsZv4FGFmI>jRJz*0D7
zQf)q^sovq>$}%sw7hfxDY*>Oxi2Th(m^!EOo^>WM#^}kdUXglgTBS@5qIcA`@qzg_
zN?ax<0iw5yB^phfS=0nlj~pqXP6dL<l01S6a%(wNWOP!hY;4!PsESH2a+F<6z!g{Y
zul-b+Txlz_t~=GZ?L^UIkhNZg?N=@c2(_7F<?k{)L^`Ckt{FI&zp5yxD4-jVH2Uab
zG>XjGVh#In@t1z}@pto*r*CCOzTv&@N09Q9?Cnr_lj>|d!E6Kv)VlAm1GQ}Uf}9cv
zuYkhy{(gv$pP%0s0N<PTe0mqVx#L=`Q_=^F?Y=(n*zemNFu?a}nf|Uc21%MksxAya
zAZGq3&>E}s+e}M{A?{=cW2CI*X@#VZ9~*vA7Lvwxzct0AcoC=S5p`%%{WKjiRag=%
zRjhhyd{iJMW`RC1cA~haly)+mA{wtMP8V~5vJY}AHl?2_;EfdBXbm>uTS{t)--#5K
z><uo3hE-V88U^y9N(s@`Nk*u6`rY-<_|n`>tVG<r)@hRPmJ9x1+IDHJBVbQ9i@GCv
zZdlv=ebLp3G`^{GV;-|2tO)aDA+O{0$7a>59vH%?xY`11r{RkFzElbEUL4!X-Zm$E
z-8i8xXJs<8P#o#gT&Zj8Pwh)Bxe~d@iy`&=A)#yW6zj_-$vvlSDWQBOWi2$@6KCRk
zb;LergS)_$b$(?U=`gnP7r_xS<+&7-B-ztr9Q45llt(w<W@5if(LLuh#oew4IAKwg
zp6M3%I|z(`r(PW3nGca_=^B{7V6(pJJ6XER`E1%HeKpva{`7LY^n|{?kqa;tO%xmm
zUo(D=6f(W2Kf5-J^(}!_R!IJLDk#kcuu_vfG1xKScRi~<QTWGa#{+voVNKocVIJEf
zx^zDKH~f*&n9b%ZqMXzr#QI)nO2(CA<JMNO`lD05!<Nwgouh<sI=I`poG6V%R$8QN
zDEV$_KiqA>vZ4@zhW#H^O@lu0NV{=9IUOa?#5yFg*qKXD)OU6*1>Is?tGp}LGL$IH
z&&t(`ky5(Wzu|L9vE^b_FH!_QL+<KG1mPh75Zn`vdXi18mue46N}xLtkAnIX{Kg>J
zRX?Q_j;GWU>;0<11d9C=Hg1Zb8|QJHCcE?f#psk2TBsmM3@YX)&Tmb%fQ?t_wxtau
z^{SGnB=h8J!*ecQeeX>?Y4tf}Ch}W(jup+bIj#0?^mW|4>W#jz_0ZsP?-Yc(w6Y{|
z8%cG^pUWzx%GUnu&MnY25-OY%;_r7L>}Kot$X@~fk)Yo0#6(IBGP2Y9Gz@%-adF3I
z;kTO-yx8--rRI;tU@jr305FcxfH(!a76?=i5j$U|VZ&acx{9yMX%FL3cqTb@4z{?b
ze=qUguF!dOZyS)fh`$3Epz^g1S_EWa&t9BcNV<3i?>D1IxCk~UCVaN(B5|Z9Of3%*
zY58<JbYbefA{A}+*TO6Ww*2#`g?SWnCq<ZoFOl9eNl6auN2NIzopIJ75|TTUP=lpn
zp#<W>%y}Tv#r$M*)Y!1p0*O&Y$oYk5?1#?m5;s0ySf^>3Qz#Ne`~p@uF^Kx>1(zDT
zFO4)1=aO3HFfWM!A{3B?7p)Ob$!+-JEbpnM6c*>ERg)~0!k2A;_tfH<3dIP$WwMi8
zmjWJMH~|0l%AxjhIz2B6n>0IV??~00npnp49<xaH(x(rNE1w6Zs_EkHW`cCQP-&e&
zf!2r*y}4~^^k`&ozu(0QB`B+dytwXsDb!fX?0}h$!HSzdfROH)s2K$N5GM+C2KUmY
zeXZP&w{=1Iw*`3m(%%bRn+xb6q6>W0h7cb#uV-6tJ9=V9^T)dCE{<q0=7{-b$NqJT
z0H^u_fJXCQXk(1RLr(=7Uzd@y4@~5}V4-Fo_A%e?IozD!8;r+n{z?*Jw+hHWV{?#6
z-)kHFF(YH&Tzg<E$Qb)8-9q10yAyXd=KGp8X3P}xlpam5C3AEVh;eg@Ikk9xIIYe-
z`*0x&yX;~lv_AB!zT9>(qCHR8$q$g6|BoN#Z-tIO&s*SXYt*lYm$$wFL&s{^rdNZB
z6BT6+2riJ~Y2EA1$YYyW#g!j<Hcwb0w__lY*`xOv$cgqFNI;8A889~X32w6j<({99
ztrKND92DoYv98=ndhYr}Z4Z9pSlxdqAFQ+>29@>`#Uuw$vd&z1T^5^mvJb|cQ(e}7
zd2#kFHzC$W`>m*~5a(|d?S(0Ce2P6SyxOFfuxaOj-6l9F0g%Opm6Y<23jT=Db|0+3
zK)eEzna%7TC&26aZL3|F?<hk}%>ZSnr|mQGYP@O0XNH$!IM~dg>jOVtV7h+df$TqN
zZ<1elIc7>gl;Ix^`i`CVh+_>&!wm#10uXzlTbuFU_y-{Ip%6m;CX6r>#iWbgAAN}^
zk$X8(w(}LS8_lr%=|nPeQ*1YrR&<z?97$3Leml%qzWBVL?-`0H5NWKeH;$U7s5nng
zYgr4b1~`u9HVc^eRqK^i36?(big<1Ea)u=?)8;n9_A{bpF<3;EEva_On<Trv#V4F9
z+pJ`&R_lag?Wv)BrOSN@PT=gr8TBHZr)vq#sS|7?x}k2%#RJTjTs~c8dH`<++T)dz
zhP2!R3Sa!?W1;sWukO;bc;om219XYI;<lTw8ZwH6Z6;DA$0{U>={G0Z&a9RvI{WR9
zP{_q2i?qijA2I7pTjvg%=_c~6dnqitM6VI5w4bPm;;TMrcirpVQ{jiluu<HP@81Ii
z$<MLZO(P|Q5%@2afh(LNkCFfrhwm!nUlR)8vbY;m{O!Y$2$(vEK5p=D?1u7W3TqGY
zeHZEUU-&ZelppO-y`z$6Q0hLhjnEZXJ?OlBlPz-7N`LdR5n1T*$;lVoTsi9#H-b<X
zI7hHc@9z>c_uG1Gp2z?5d;jCFxck772bL{i#BRf;agKEHO}UrFfyG5RMzbpHCG&zw
zw}Rr=4_k*>KH7;ZZ}ZvO^SslVJ$!p)=}aK^P1Rrju$?cF5kS&0Hd!{kZ*pt0H9OL;
zv^M}f@?Tv7(MwbBQ-NqEMFH;ihsh#7`I7fSGd7<*<X;y@*;RYJ_hQ3?IhJDJd^M3$
z_#()$ajFb4W@(a7Z)8?ZeC6)$?&roQOSmAt>ohU2dEBX3XD5upK^8zeCr5r8=p_o<
zu>;v4<J-MQ7(}+x%(_YQ-g^=N{6ENbYm5uy;lT?flG-GrK*~wnfxkRL>7xd@d%Qv=
zgpc)Ty`@#t59lPkK3ZC!dJ`VUu%jth-zS2!F<wmhR44Ha2UhINZ*y8mtBi^00mRR-
z$HE+B;_enNQhcD=S30)6%{bSHPKuzXagztt>ETkl6?86O4g6%w-y1JeOd8f%2ts>0
zMCHe@ii}Dvlu2I1Bc$RxCo!@xLICu!RM<nkI%TQ$K45&YRP>xWrC5f1nj9{i_VjWM
zqYb_sF47{IfJ=d!9#(){?4y96mxo>e44hco>$-hBQ`0SD8>hju#Sr>n&K0sXv9)C4
z63E)h%EvWay;Md$Oe1%>Q(MQi>h@R)*0v5YV?`-)I0<Z^BEaFOeGQ+2O0SH?rSQU>
zjvRe-<rqPNw%vo-A7}yX3SI}Gzq=?P0JwQTT1VpK@r?x*J7%}A3jd9R2Q-LWL?f|~
zKv8RxjNa|y-&g0qt)RaxSsGj5)u58>C)2pvT;Hlf&uy73`Ip%}pOf!=C02tN#gZ0M
zz{}-@(G@4{{fK<0l~F>Ws^hpg1MZz^xBEEdjeZOBv+%~OZ05P6r$lwPQkXbPy{Eq4
zb_f5DlNPRd*Zv*ux2(mG0b>UAuj}aD%wH*MsJ;0sk8L#DJg}yug5kxZ3B%EcxD1{l
z0Zl;{(<EUWQ5MQcU6Yn+v?a3`>EJ0a5}fljJcctiw%}WD6>L_*aT-85W0u`NejPjk
z<gY4PAkmOxW<#AFWQ4zcXt!5#&ZKI7T#)5i$NWtyW|@9erPde75yP`U?<T4AF87@&
zEFB^%qWCDEO>9c%HIuNGD$+Z@)Rg8D95iVaId}Iw1e)0jckLm;`wOq+w4fSLS*RW6
zOEJYjx&s@h$*0F){-J(ZskI*2AA|#>;(l6z90`F&W6Yskls4UCkXHm%2?Yx*4R{T0
z<fquyLl(a0?F4|xqNr4dLPT%4)x<nZ66K<9DS;YhmgA<b6hA61E=Q(WcX)-lB=~Mx
zwalKrOsP7+TuIiqB}7G5Acd|eGW*sDSic=*w3)6x6L(!FN)-T}8#|m;%Sn8@V;wkl
z+z<~FRA2l~IJ^|612GSCK^+V9O#-!sGEi>QU4iq6$z3Qa-2iXu#tV_uucRE>_tFzA
zgUZ<|==GA;EP<v`GySsNRM}SmS<7?2T)k8+Z!=~VvEwhao;hH7vmt`4CT594mbxX_
z94rS4$EDyil%?=BNlezTZO5$9t&gV)!InaO%2xZTGgg6~*`s4dMqb^HgVw#b3|3Hw
zr9=TsmE-EMT=6Uam+xyVu?Ye$|Nf}>UzJ}vgmnRkzaonEUx=U;->Q6OppE(%ZET!m
zDu+wX^DP8m1_=Uceb}3R!y&nOYmK=iUKwGOZ4@4y#pRE6t~K*SLt@d7ij@uV)bg~#
z*tdo^X`BWXPbQ`!=jt#20R7#+@Tr7G&QzJu4Oapej%dLIe)E!q?bEqm<~AD>d8G}O
zy9_|g(b!o*LW#<JZK2M==LSL_`T5SmsT~-$zzN|W@8f3*HSSwKd>!W=p9468Bu>K;
z>55JIJeIhA?cXD38pAQQnBTmXKC|?w17e5kVEki=nTVn^bH%uOc0deCSx+*2X99>O
zahSik%R*8N>`;F4V!pG$;Ha9@s6szSB`E{VG-v(}#x|<Ca=gfhVB<K3&jKy$4EMUB
zj1P(%`SZK7i?d6vaNp@4rZ{=o31O;|CxUrjwHU+frb={k>ZI64b~-2cOtY$<eARD5
z|EaCCpB1iSY+L(Om`a(z`R0?)WJ$KV_fZZKO;bl(zWg1)XK%PXRU#HG8}WVdlkozb
zjI!0CpA%D|xV6t-`gECZd;LnH^v~w9`@gQf|2bS}@a`JM6u&MLLsBqgu^_pm_Fw-B
z>ivcln+Wk8&C`;vAYn^?+wP7#kk}Z`S^1!dIDTiwr5}INx0@HYPL52iL<8d*Ty@}f
z3Z&OS7}))2pzI)C=rr(B7m8`k02P6ovn}5<_lC787O_{HTvMqy{dhk7LGO(`bkv|3
z3X;bB3t#jJD3FAUA`tLOfJg^v*B?%llsBAXakh~+Jtn^{Y`pR6dI^wR(?DF#?!?DT
zLX(Q#XS=k04~e3yrNhWDZwk^%QA|0_-^cnBG(WK==T(3yi!tA~^>GKv7I(&qCPbz*
zf5$d5!PV)VEt4S}zUK|op|_)6w!hI0Jz)d=B4gR9BD68>`2g({J<w^koQbHiRo<>1
z=-S>lwc91RqFf2{g?MnI^qM1t8+t1@KzLUG!~-ilq0<tNsKU6l(5i**pDcjj$L^<1
zAJjh)QeRDoEkxFsBePXLr!m>-^`8dPmzpO_==P#wB*iUJU)j!fD(4BDqVVJ9@ezTv
zH#(SUGj@gRm<R$<LQrVRj=#7KUs^pJu!?}$b0gAlxvLn~{doMKK5P4&{DjmfXYMwu
z|3}wXM@8B7?at60(xQM;(%oqQ(jeU((jg@^10pC5(kZPVE!~ZDcZqa&!`VFV_nmdt
zd3@KJ|6I7%+_Ue!fBQ<Gc&WMa7eXCFsA9rt#N<~U<Hi{Z+q`j(*NE0^dNtg=)R}CH
zB0fVfM^Vr61SxXL^FIj|ccw$DXN-*owQhS9rA*67-iVOQeCVxLEW=p7HSbn|U{qA>
zx!gyE|8@?6fky8hVv;g+C<12@w7EM0wyfoM@FoVf80_o%>D|^ai_I>`%~gW9#^_%5
zL`La1*CvSFU4&nTYL+1gdv<42pUk9{w$A>cq}-xxygOkFmpKS)tL^%8z*@6fIUu0%
zaHF>AGsa%>?MV^68zu>#-RLVxgA=CiS${ERg9fjJS+|9~U(7SPieeYH$Rsi{Kiewp
zV#r1%BVQEyUL0j|TI_EB`RZ-8hpjtZF0E4ir&Rfkj?whzUy~Z0U6UI6tXy6@E{&0N
zq2vLg<@La`aGY}ek&~CZuyKj_ZC>}oXBWs9haJ{MF>u#bab&T=>Pw8N)XI9lp_I9}
z&9afNFLP5K6OB4muKaSD&{s1jgk0x}T?Lq0RI-gw+B@hg-Y)NPnslHZ?B2W)djmkS
zpf!bmZIw+#{Nnc@8SH~grBp0JKq5y4l^CCmph#v#R<_32c7+fPo7+nm96GHaa-zDF
zzXfP9ie1w^q(fv~Bsng;_)zFDbO~An%|iGIMMlgxYzbj*DXKrM$=aOfvKkejp@6iD
z@Sv9<Bt8_on;I#7S@x8W#BQQY1DlYu90Bb$-HK}>$0U_P2LyX3%$(5w2`J`s9R)(_
zS4u3}XQ1s>JP;BHY3_xhp^)xOmY6^Yv42tUI~YPL`zQxNRSS$pKn#(ngkvz;$GDxZ
z!ra7xX5fR~BzylOoj~3r0PIpp&#<x6Y#A!12${5*lq66l4Ll|vZ~G|dW}G#!?apfZ
zh;m#p#aJ{5)pD#KkunFH*PML8ZGDvToUbv&WPk$e*$P+FEwlOM6!?`^ou}UC#7yD$
zl$!Olh_M^uvIB)vCq|kw287vK$p+htJ-oL4gBXU}41Ecw9gO*?x;NIxIteF4nNMei
z>83zBX90vHa9!gxeO#c_4H>G4uTt6nX*VaRRpnq5w49e2hT+K-T5N*7dgK`(SA80S
zManMTa5+{aX|gp@gsa3}qUnXQaCn8DvOFl*An&=o%zI3bH1`SB^LKGo_0jC)?8I?^
znCP=){3}W8R5mKR{t);5fX8XFr!RR8y&#H}mP1e9i|+f+fe0PS->Yt%1IN~v7YfqS
zBVxsQnPd|L0}m?n|FTB@A;QzG{y9}2MZpc<!~Gaq`$<_-2%SO@8yyWvgWO9RguXHl
z%jJFXPkF+RgH$xyTV2;#;%5G&DT@+00NH86-aanPfb-46(fl}W?TU--GDUFtT<&qT
z+NwM9rINxGHjlggEVx^L=5~qWJH^^MWjn(_D)i>f32yHXNG356$qsR>Ug^6M;r%O5
z+t0~PhwK-d2?oK_wfUfOY{B&M_**U4RAz}tfUHpY-ZQbr<G5N_&uIf&!};i2m6bHb
zTb50$>8u1@=baPfT4DD0O|Z-r&xKm5(u=EwyQe2xJP}3SHwAh2ZudDa6XRLj6StQr
z-M>bC!@s}sxLAohULfjFZz(;bliEyB(|=O=?%!&e#h!blg3Z9$;DB8fyhc)=gE46Q
z<-#_|YFbmYp63s{${w>dA63|)?Qc#robufKDn5noCUKg5hD;BkO#TtPIUZ@9m^wNP
z!HR=@Z+ef?0Ih`XKnb0pO*cnrcV9L!O3cP(uG_uTrae7Mwh@q+7Ox~U9p05b!MDkf
z7+-0*wtb^othdyXV#rSQ#DSjVa{q7=@+z2q9`(=bSS8kUX^70by}{>=PZhjP&CHOg
z;<?E9>~y<0r?aG^9rPgquuu2Ib(M)pF`M;r(u+oDJSa_g8^D3l@Y|5)$TEp?8z8B;
z<BCbf`#;R2vcuhBj~OQMNvydhRud?iU;DC~FY|V!c%0MW1amduCJk`O7=^?SvU|vv
zt%TVl3V({L0{45zt>rM^-|2P%HSNaM9Ok^dlCy0CYqsEq)=YAc;{N*+lp7f(w?MyM
zP`sEp>7vAC+pfl;v*<_b++~%saut`k#ar*3%8O#&tzrX+I+aH0+;FEr)J2>{q~OuE
zO&|T5!m2?z2>Oi#_ro7p+;-Lx67ga(>3z3SVUNhDbbQVr5=T;KkYN;elTHCg^9thk
zrEJEA;j!59RY7U-8y2h<hVR+!Zf1W_4wCrlLYnU{wfj)4>ysj15lGWD4h@RUfo#Q^
zR^ml~+(I$~6}vBuxLkLDw|p``M+i3PG`^!+q}D2PO}RCa(EFBSV6c8KRQ&5(^*!~T
zWAD!rrkYg9uaj$nw5UgMp^n(Imq1(0YsGd!M@;OV&zWar{!k|C9Ic7{BQ)NZ^R#{E
z>n{@yZ~yE!tZ&<U)Bhs1=5?iC>hRnPjpMnzU9TeeC}Yr9Zf$ln&f?TsR8(R9PVBn{
zTlKmWNgyxm;Lq9o$XUzL$xH>Y^^2eir)@|2*8{0i5~s3pERhQfzKWwcEuOnVyEQ_;
zu#%IT<Cts2CYZ}ztm)_Z>}DF|Zx1Ikn>)b;%GBEKDcN(OK2Fc6uA#`imW&r3s~fq0
zGRY`E+W)ei_?mgWpFt@bTF}Oagz(4!^y_-Y*idWJs8118fomAw!h5NN?Y^SMgYR|O
zpRg)y2Z%~(?-u>QA1{{C+SRYn0h8Vjo|UA9^NM8l<F>q;xW;R(g^_-=oiA2nE8{}D
zpAB{TPeJewVfnUhqQvFa!nq`pAtIro$~wRPd=kI@=aU7ThCB$p+wQO$;Mdtej=hZO
z?Yt+!iwEdilivph11S|Mb97Jg4P-IBrQQZuY&WvqO5H=d1C}oZw9_t30v}nlF5NC7
zo^}7GMaOIGZPMor8|9jjt@cX%3%+9T8T^>O44hX_1IrLhKhkd5X-l&7h3U8$8TLaQ
zTs$Fu!H5xVK!%TsM+ytuE(17<>mAs85EfCnv6?IvAF-#v9mQQ8t8m=+z}PZuQ~Okl
z=On-HyVSZ(jIfV>)C1##Fk@s7%&b@N-3MdzkowCgJ~+yj`JylpP8JQ-^8kyVdU{+e
zsv4R_?`3LUctU<AzEy>9A@mXJz0t*kHM2|mLeML$Cs-{pxGmG4EL---nlY_o9HZ@{
z;mOqkiV!+Zcl6BR$r_Kxp(z=+rBX3<?KUt-zm&9SGQvnVd4y(;&6+NSVPWC28v?a`
zLofOJsX~8}pxd=_@lT&ice`Sa+7Ak!stZ~vf>0v}$uW2f{Mj~V8OC$$oIOyWFRDi@
zM2n4VgUP&MKGn=9_acX{Ok3IpUbdITM)tFx0)A??F6wQyete-j9!Pv%cAjU_S*5p{
zR()KOCg8mKVc@ZM8;YgOsTRcBiy4fSuq&XXGxqs5qL@@2Lcqi^7)V?$Pk&ibGPxaw
z%XB>Db717s@y$8%;4GAH9&I3_PeP|Ohudb7y{$#ptAy9(6kSfX-eMrNxgTgsj}dLw
z1e(p;g77&_yCRB7nzViR96Q4nG=w#J%Wm)}z1!f0#Bn>3{OiF6+sN|knPDs>q8lb5
zYZ$g0203Xwi+a~1pqX<G*@0}qdb|MrfPAobtpUJ|!yve(i;{zmB>nE}nDTwst@p4r
zeNP=ShJ<g;_v15}(w~+8O^}?<_|J(;$cW$<ZM68gzd-m|)zca8odt3#QmWHt)Lpjd
zNIr=L^aYOzk*L^2_fAX4P_iSj8<Rtg0<vAPyLPs0=Ui6h1<)b!b+4g9$~OP{oL&qQ
z@8C}VvIrqdV*K%3QQf8>u!YVQTyK8wp>3p!bcZ+atI8$GRX93)5rqsH7~Cc8hXtQ{
zC%$#Rpzq0(q{VUjeV0RCNRYnZ-aY7xSbcK3AbI7x6tK3E;?~hFe_BIf;5%NBaCpA#
z`+aaCfaLb|<?#l2D55l?EPdQiW>HxBq6g+`H|5>Fp((<#=aH?OOy9##_EtSiUC~>G
z4UFP-xhbw6u_$lH40}9VbnF_Gd2Mtl`?3#bYIli_fzyXwKh=A8Lup}#(v-5{AV()-
zBV70}qBl*9&#IH@<;O=%Yst>~qd#S$WoCW%^vqH*QLfG?pMh$hfXKPnSr(@oms-D#
z$Yu)luw$;7m({bg|K6S9Y!cvV(MXu!9oeb}f8fobDGwd8QhVg5_D<=r(pDY9s|fwM
zIh?Oi1W7_zICz8E6e^e?43$I0rFcZ8F3yi(qKjh28Q3BWTlBrzGI*n@%AA0Kq`|@x
zR7Qw}jATwZCPU+Pgfb_q<<4i5cO1AQ<Wni)Tq&p}oS&N|qg`YEV9c{b6gS`k1LbJq
zF8kq9rrli4FfhPD&@#!6pg7T(-mn~40PN$`)YKDMMt1gz?`ruiWZo-G2Ivknu&1|h
zdMNDyCMi1qTjZu8nAEtruzoynOmU&e{nFx^`2EN3N>Xa`RIY7ik}U5NZfQEgv9?j~
zcAr>7FXh=vPh4O<U8j{OW6d(j97JHK?zumT5zA?x8epUFlAv`Jh3&FQe#E-RBNmPs
z)BzVc99L#(1+sIe=I@s}FUeX-uAWk}QZX#A%X_W2t)UyHZ4ZhUi<cgkRivPEun+Xd
z{ERl~q~s0J`r3DSteo4nhM(4MwLGaQR?)QFR1c{$?W9FnH5}lYRDim_tEhKE^+Lvw
zEPH=R^!fUB$s>oI<nj5OKU?X>?H_tEbdFNDapOD7j?3Q6{`cqRY3Ga1FVosXA78b_
zia58QWG<v422=VHu4-Mc;^JMNOc>za7B7X<xi@r8%A4D7Pr7x6J$~6?I-Z}$j>0WR
zXH=;Deif)v)T!LR-BQe*Q2H<)F5mnGu=oeL-(LZeAcq%6YzTe^WLKqig03MnGg_W*
z;`_J##C5si>{IXes&0tA`6`X#P`CeQ&ZXP*J?w6@cAaEUo?+DEj@};das9-@)4Hu!
zYTSO9r#B_D)~~m+Cf3N!*?6@pv@)Wo@oI-l(o5}Q%6m!6=*Q=ud)R_Ie#bBs)$w{U
zQF#N~S5(8=Lvrj&>xt*AwcCezH>k)KB+tZk^gkgkte7#g+AEk{GGfLdm@T*rct^cq
zIoRDvsa%L9(f6vDrPcmv#iF4b2{DA$71bG=lGQ3;*xbEnwq;uGsQ)^!&Ezzb(imEL
z*Kl&mf8om}YEL(G1LDahbUic8nd~04JB@@+NcZO?=RGdEK9>@Up(tS<Ia_e6WY%fm
zwkw@Dp}y%o)#gw8{|RsK_?n=qU|L3eR#@wb{2fHqaQ6@NDX$kQ8C6;>6)oSx0?qIy
zSBUeyg5E$Gx!i(1c?Xre7P8ufhS4VVanX21r_72sFN(~Mh(Pr<_e(;zFDKSwBk=@-
zk3EZn>$M-J6B-Vb{u&+-g+GB4LZ1wM7TvXcBSI@b%w>(tUiG@{86mMHiq_a8(j)|=
z$yWxWkvBw*0G?<TQ+i6`o#QD?vEBU!L)Zg=aGMjpeVBM=3k}|gAJE#myu_tg0TI>K
z?FExB#hM}G?06Vr)LOHh;{8!1rlXyr<g2Eb%eZNXkOQp=B=OudybU^vLD;K(UL1Te
zSyI^E>AgE!Z4}lXj@{1vwO?>$?xn>xY6&+WrMgn(LUar48>*JmFm<jIagI6cctc90
zMh3>iJ0DcGhlfr*JS_lQo!B<Mr{N+HlpzhCfF>{uGWaKg;x9JMUjSSyv1Zj!{G6IK
zI9lkcm}?0O)ZoSU2=5*{=Yn@HuI8kDYch%LIukLS%^(34v^Vxg%5|DznR|N~;_fF!
zM-z;jHUjV($E1xHfVt_Y9LXSmd5OzUjMX2GJx}Z7#TkAw$u>adT|v2fY|=yOI3v8-
zOPy1dcJADK+c$5MBbV?Ls7^kohI0)FbG3<Ydlf<wx{rgsb;YccTtlD_2wK6)eZVa(
zJMbm(C%MemQxC_#Psh6O??3JZ+eaM56HN=}-=N1J5Si*-j0Fj0_&{d=ByAi``glMv
z$uAJYmu6Gixg&z?*IjivBV^CumJ;3I^xbP`%R<5=lkLu|i;>*ri@Mdsck0U7_fn%b
z;f;4{qUR3UqlIz-%oPBujZ}^^AWIPYpPQue75LI)rudx!r@Nd@QJ<=$&QhCqTgfQ9
z7Vb{n|1A4qvPCs`Uk04!uq3U3H0w_tQA|MV5n*t%Su<Ggctm&6hdn`;w5?WK>hRWS
zd?w$QNBi*bh*9@w*VC7>xjvI9R-wPeYe<5mM_K9w<H*C84`4;Fb8TlTyH6%=Wg6c)
zOtev;VxkpBs;SsDE*DxhmWid(`uc2#D+^T*=NXyw;drZzinvUxUaUp?22WqT5f~n@
zF(^N({>xVN=-EBCs`RVIKqDQ42`_!oHYqEMAKDF-MOcHvA67}`^Z}ci6d5RSG9%Tf
zBjpw{YC-aDuGM@qQbv<0nNlSk^9_}XpIV-`P=i$Sx%i^kZ&Vpz<#g%N#)wC6vYgVk
z9mv6iWSl6Ys_NFd+IHoI=%Z7qKX2haiBuCZY?AP(exn+nd*s@{jihSY7t5j}>0qvF
zGG5FBC5IAx`XpG)T+C{53dFG}R0kgj6wtKHrU;y&RPb1aUJfN-ed866;vvmU3w}X)
z05yKIZc(IrPERZ@IsR3iqd3Zg(1u|g1x=EP8v#pl`SN5-%9Bq%;pO=3*k#LO%HGb{
zkWyFP$v1;AmnnLe8G_~B(1j_2Bd98fQh%5(uQPHQ779)8trRIHuGl6bA20c78{#8#
zICnj0PvQ)!Y)Gk;E`jopLIgqX*TWDt&0;FkWC@E>WZZ|`&q78}usYZrP3*6@?`Ee^
z0~}dF&!^^q&07^q6EGtml&~vZwt6|PO)X{gAHA>%CSk)_>zs=CN^+iZga|WR5N-@P
z2t*QYZEG##@HqUFZoAf>0xmq)=0V;4v5u$x!lyl4&%esgwuwJB&;?Ri7tr~&){&a0
zVncbJc^~|e+)yR5ctmbrhu<IQ$O#Q6<#=jJYc8@~-HYmi;WqwMH1#HiN#mm!9Tf$)
zN#Vl)tmW(e{eP57|CfCJzX*I4f*OcR@guNMrC8UQ--uMMFri2OK*EYf=HF9R(!h^p
z<9&sQF`p*xz!{;9k0*D1ws2Q$`!dyIH7zk{xjs)%AKASux8++(t!re3?Qznw)#z;d
z_FetCU){+mxw5Zt>hH(xobN~bLn<R9)e9R|QQqe4Niyu!-Nc%Yd9#jQ;15vL=`Z+)
zdR#OPX*$ueu&6a$&Fuy3x=R`_uIPJTO70OwuMMSgU71X!#<}k$3+roDy=&8Gq{~g^
zWR|mNR1~>*RhrMav**3%w;vYPzcA+#Sa7{P!nvG4me4Z&_S+}7nS*Arn+@DcQD@gW
zrtcakXmqt)=tzu=K%lLA=WQfUT4+!NpLHKmK)Z>QqKLXUTHEF1skId%6WIKmcV}?-
z{zYTAt<xxLkyB@io2<I|@0n@9jnSRWoz)tu=d0V^sJ9lb$fJAL)h2)4cb8ak5H9<C
zy7{;9;Su9K>YA7QrE>#g+XC73izVHn-_D!(Mm1<f6r}QGcTNcAiGng6g;FuJii}4B
zBOhGi>;qJ#66Cklm<nx~xkx>I(~Benv)!7t>m31%wN=#D5m-5}Ku9Uf1BLHF(Q|L&
zS~z?=>4r<;IXSCgBOp3Af-BE5<*LTi!b2XqoFG5b(hbg{Qsnw$Wp0k>pU^q|SnwU1
z15J%{`%PIPG!*oBqiAuGL`S{@)Lvr!VjkoRLfu0u^w;RG-tMzG&ZNQ^$oLi<BVvC-
z-ar|KT2E~~f7bqJ<${S#7X*q}D+dL>xC1k5tFy87&;UP~8g%%eS+|sRAc2eiociPK
z%@wM{!>j#}Z{}@M$rU(>@#fo+Ra&T?{cY*8+ggZt2^Nnj3H#xKB+KKSkA1g8g*@9)
zIo{+YDSA!Lmt^CK1!z74{<@D-pw33Pe2P!2s{3J|7i$>^y-xAkZ$@1z2>Jo8v@hr^
zgHhAk+U6O$OUfEjRJ_7R8D<kqJX=Y;b+>yqLz3(_b9hAe2LkHb1F#238cFzN?`hjC
zaE>l%xr2z|)+xLN(8kibN5Kt6T1z-T2={%IYJU_uf6i?fr#aY~s(8)SZ{`TvlwBpq
zEv{rM+QTe@Z>Ap3?#zP8lIb3{-CE3)CApCz6Ctp%><s=1SWvQh_*V})hGXk0<tJtQ
zzOR+deBC4?-~U&fNa<bx<*WpB=B0}AoLF+JOI!++_&Iw_gmq%@MbSj*vldLY&lPG~
zROg_`c~tCk8ew0s#=d~u*|hFLoR6|JiXT*a?|MgMsQiy33J8;9%9Ju7n!1)RL+pG$
zurTWsIQpaB?USfv*tNudQh{u_X2IcqV2@y95uyB;09m#w@iMYAc~h==fm)}ZQbhZ-
zhz?Ey?-!{A_OAEhHuUqz3MqZo&&)1=hk{{P<#<7QxB3iz{zY%ozEMO0=>0DS?`877
zcksiTJp<B<n!Wjj?nA{`iJe16M^Z0;AOD#?K3Y!Uw7Ystvqc#EpSQ^QG0$ccMkmP4
z$alyT{eO0<|2^cIo@9XmA#l*hBd@Rtu9TjYr}Sj1uk<Bc%^#<%tnB4nI<G$>{2E3G
zCxZ(g9TAXy%-=A$&E1@s%gvckN@szpQUqz9jafK;HSg=2%VSSPf}Ej>oj<Qav_S}s
zswZ&Ar5Zf7bJO=CbARhdliu)ZRdWPQ4AA@GoLL$2K-)GZ$(6`RucP{<2+!4SkUWhL
z_F{2fAw@7iXieNmWRn=t<<h)AnG7afy8EW#FsA6kcD{M14?k0IoC_(nBr9TI-~4ZO
zPn&16wyY+jKf)cwrCAXbhj7xy2Oe?L>i1an)VVjOVxfbx7Sji`08#WKP{K-0Bg_`g
z&26caxhq5=3K*VrqQM}EhT^p8o4{p8^aY`~?lDT68B0H`hf4qV@6t86&$KDOxx8_6
z>Pb~n{ae#pO-!Bg^zea!>x-ie91g%S0BOV5m%j0e*HGspfh0i}t9U79(`;l6l&p@A
z##F4f;}&9syTrH$%SnE&>Xp0|=SJ8^MiCW1T2tyLW3J^UMK{)jV>c)<dw~^W8_q>X
z%{u{lCqLNK5}q!Um`HhSWXH7#JoY{wasoVJAjj`!k~OK4$sm6bJd5j=4&!VEqqO9>
z6sFV3$+{0}E&cDxEk0HEE<eR|7Zzf--~xDz!^duG?IfYJ`-mN+2+d5)M#_=nGgI(f
z%zDOcYlOYue@YFVum9&#_P2HN_3Qm0={$XZdSP8h_{9ekc7>enVG`=9!3|4?Z;ve+
z2ea@~ehFWj&fjd0#FV~Rux8b(c-7@(oh`iRHk!wD5<XGpkG|Ic0`qe-Y}$6FUC^ve
z_rtVh^`EEeI*$=u?zjrw8H0%Y-AFm_&c@t;pID^8_|mBB(2VQ0W$X)S7Q5IO$o8C|
zsMX8OXbz<G5x;W~JMiJPdr55VKk(yjY{DS&UTMJNR!zxFbzZfs5Ml4VC8R7|Iqwt=
zT4;H#;xx!W;x*v+a9>u>IIYxJ6F8jX`t18A_8N(MsJt+^_UhsK&U}BWXnA-Zi~dFN
zi^Fq2363iCF1sM(zz~EWEGM*v%5cB$i7cdsqlV&CjZXs(Wf1=47N-~Du1nJOjH>o+
zCdL-BC%wp5!!gH<l(Z_5GBo5oj?!}jT3-AQ80VeAEa_^T?g%KQzL$_o2*O)L3xsDG
z(siVeAQ6|<=qaN8=o(iUNpoB2zD1^LLdlThc{<w581ot>2h=Z9RgTLME`*DCzHP+E
z>XhR5_0nj(i{K(#_#~Ls!n_13j=(dVLkjs!d5L{%YEbYzWRf$S*X0uCF@%IRK5mk1
z%z;lyg4}qzjVD%u5WdW({6O5)#oKkiEVGT1We;uN`sNawJ9=~N`GQTraN|+R-Um%A
zul`@ZFg&53X{`%>$ks8b7od5!nO*(#9_;j)L{0cSMPhrpP^ecMQ9XW4$LcSiAoaCx
z9`YIfCLuWGhrPA2tk?jm$!x2r>{a~LK_{iu0HNW%qcxtGXmx2|wbbG_O)c|Ox(7;$
zQ7ZJ?v2uK8s#dh1Yn!dhbV!0|d9|fUE0;By_r1Ti^o$pvk&~dc?DG%&yGO-1yq2xi
z&gOd!S9b0`>y^gS)3Z63L;;Tp(Nc2;xzc)o-AT-p!2)N1@pgO41c$`hk;BfX*aCNU
zgIayp%dRhMEn?C`a)@xDg5JhfwB$`Ldp{2lPij>=nU(8Th^Bd+l5*+H<o^6bE<fal
z)wFRbL?y9@bBpr!=D#TuU*F>!zt2xe@E!&F>@-se-J1X{$7fU0b50WaQfKoS@$PRi
zTYOC?pDSLRj%yfrNat)&j*)EDzGnhsk<u~6cVVh{=4QUzRrT&)e;&WffDn<85Cy}V
zj)^UYLp=AYWeKzk7=Oyl{)hG6Lt>~y^;{AgphIa`q~Dv2WifbI(B&}0RS|cX<8$83
zJ(XDdv+l_^X5Gsa=YhE9PAqiM$$?DY>zCEHzqWJ%DNkq>^~L?kF1cNu!0<%J=aab`
zd%G%qpqVk%Gut&lLW)LNtXd9?O^BY=EOn2(9}oxirm&g;<`YGEv;Mnlj5=I6>yDU%
z54>-m()J$8`#4<L@*$UPSL|fDBvsrWOcLM6vZM)^9*NEN7qo<4{%w{Hi~wW+<%__T
zuQdp$+E7Se213B<=R*X|&iBAZ_5H1+GV;{-TuVB&0Mr=Ed_Tzk?${H8!_!&psP6}e
zhmoJY)E_uSZ)bxWIC=!tAYBCIAOjm0R1uB=CxWBE*>*V5hSU`-e-gAMbH9B95r^Zs
zaCCQlC+B2H5&=FG`?%jNJK5<*2v(-`IFAKCFlRIcx0xV!?YH8JVGYu11$5)s4APa5
z7kqkrK(^iO^&2tlkKI0-E2I?6E8(RJzXOABc8gjP$5e(93AIGP9_b>lzS-ipQ<}*S
zbw$Wj8N8iYxUDF+nc`f>2@wG4x)CDP28}+$z$vUGMSqR(n9ZO;7*bmfmzd)7H1j?F
zioDkC4HWIAHdCbzVUy-ev)yJeZfERcQ&z!c%+RX9qf!1oHV&>h-oymESuI?H0_;&)
zbKPs_2JpLtbQCX_{?tPB1zu#$)LIZTEd~-8np%W=)?cMyQi2qT;Ga7eUu_Qt0}VdU
zfh43y@8~4c=Yhk$+hZ+-By`5hOKDqS?iyb#5mB+sp!DS$0>{=K9yXc^i+C+M-aO3W
zl=t1b(#BAx)FjvYDYLD8xi>-n1IV@=gP%{nWeV8-E_Mf~=FMb$hvU_vrte@N#cDWj
zTDXRRH;<*?<K<2YPaAgyt<1U?HeL$d%*h$P{E^C;g}42)7XqyIVfV2ne_JAjO<(VA
zyPwLYDeq4uIpRfy>?x<^6K^>DQw1YJb5pI`tcTn2B4WNMpuDr=-7KV6f?<n^JXS#O
zu|UI9YDLpGJ2e|sE3sR>rO-X~1x!5U!~;~d0DnL>Dw=Cw6?ao5W)(RZ9WiSQ;>vU=
ztZ`C>q-2JP6ttBwA(~G7$oHKbxRPT@?)E;rDbx)IFGrlvTfUSSWWOXHYgP?|o2@Pt
z512c*ruN0$+!^Ln9s?%#(J3W2;@Rypsmp{NT<p2OZ5&rR;2wEanXx-S#IH;EOj_JG
z@Fj20<C-|XIu>XhaFN<|6=3X3L8+4Y?Dg{ylPc^N^nv-CP+T=#tLb%VCxSTwDgv4_
zRG8Cz(C86XTjld0Q)yZz7Uz7meAWb>E!mS{5_==%#n*kqN_kTW!I<5HNibtLF<84m
zZS)QuLS1oA<<FsI4t)fbfhIxK8Dg7btENauki`jK6Hq;v94WmuCPCHpKd|%t(h}Yw
z9xM9v6NA}9v%2EF(RY3Cl9bE5p1oNvp!0~zugNgko3H0#>QFYiYnmqfohs`6z6&X&
z0(^_{xO4v&Eoe-kP9-a>bn;<c->m@C=_h?ya#P3p37Erw-Mfs+A*&J=P1@s?M`ePd
zP<8o<Hm%)W$(|}`-YA*HPSu=6nm2K}SqHSLdsjA@a8bGc<4F**0ZOBG(&VS4wTPp%
z46+wp?!6B|)Ndpd5#@sgNm}oUF=cX5d$abb9Q#Mb4o&}-nzn;sSvK^8LoI=`S!aJe
z_Cd-vP5ly{D(4c>0c!TM#GhL<Ws)KyS4gk|<uB%23a0Dr6!QIoTLt@CT$HZ#bQrcW
z!mj->J~JfCIoUgbqTA<K#TKhv9TLs+t11@B#x-(Dye!vY#r)^Ght;hl?~5BYS{~O{
zJFji7`DmR}V~8FBfxGm7Jw_(~;jx~b5uqu3gj2qG?HJked3Ay!-a7z(ph5&+%naLP
zA<;V~n8}%SxcNzBo_X_>>bx{EGh5H~YH<s6{tny!m`-1a$o2I~OMQY#(l_x6Lb)Y0
z`g2ITI|jgvvI?RXqj^{TLiTgC!4BN+Fh+1?>9!Jb8YNOD1PYM4x|`Fgyn6bW+Z)th
zXN|r_+yUNhJJa$DYN?M;L@xe_nNF9VWmc%|)@@OA%MD=lZH(l06DVGfeLUUNFR~M<
z-r%d0aK1aO>@@2L!Of^pdvi>F4ldpeXxb<sVk&3L#y!q+q2Xr557USAWG{RmT0m%c
zp!eN=?O%9eHEHmA<PX1fX9nAX1B6gXTzRRt?gu&1F~P<{qc02>o0t1M9IFiYk}wRP
zftG<qj9Ju4G*fBGH|Z}7wW(A%eGyC%?#M{dR4rjtK4jFj>q+(vWQ(tP<DwD^r(Qsj
zdi-L<duS6GD%r&}_CEFIo<m$|iPIG^$U;96@xKEU=RGHhHi<+`r^8A`xAlOYisc5S
z{h=yZ^3EZ3q+0AQgrBi1sfvk)+|0clg`Xfl1<zqWpWQh_2--?_O=D<Snnkyl;3&gS
z**CBIMwjpu-3I*~It@nor_-i{ZGZPkOeJO|woAxF1<)Hc6-^?zm-%uVi%vs_Gw8ix
zVBb4;zd4y`6&SwH|A=5o<f+n(=0ZkU6(~Mh(IpEPdwF01^Ran0d5{bQtMtNR!m^!@
z-IBQnix$dU+zWeC-L*(43pyocb&tzPR-Fn>I>TZVMK5Tk-2i@uNYi)w`)I%Y7Vghy
zH%r>V%<BdGh>vyNEs?cQ)@VP`FUt<s971MK9cbn3tLa@sgi#nK@j(56x|J^Br~4`a
zgw+|d!X6t>8214O7CEmR;75qsVc6~CCbp-qzA8LXFQ>*i4o<^d7N++?fwf=E;*s-C
zA|@V9y&cYyhP8Rvty^Fp4NMD50TrA!|4T1UNn#Vu&pI~aio)y7YtFzaY*pY3NvC=@
zB?f7l4*tsm`RBBFw0Z9c<bRInc80=UfQHg>R6G*cLzWwk7Q7w0_v)RQuet=)`JZTo
z7_LTFb+j*TpjBG$4e$D}dZ~IhnUTsd?!jKe+U@=>qd_BdUqeGrzc6jiW&E3-hF!zT
zY1ap_!^WEm^32mXWiU(0FyFgKB8U>+)MaYgU7!3c<#DsN)Hp>g=C;ns%?@Os97v=M
z7rE_JYFx^h$%6a%Kg=%9Q!2bW;ki`s@U)x>C%13V+no4Dp15`5y~Dz1VE@w71@*Xo
zZ5}nFdQU#}87N@*1}GxkcSG%os+k(2C!omfSAiC#gl+zMl3n%E>P!azM&oH>zUj=V
zF4t7<Riuyk6-}z5>%XaiMF<1%;X@yc&jG)@xSBE*6v=*}RKIz+9E9%=a_GYZs$p-T
z7cgG1CQLWx>pdZ;TN}ZRz$A?tL|BE_L@?+8l1TBhFh*ZPYmhLIh>=+TNU*{d&kvSg
zK2E|4KvI$ALLCf?dwl8QAaOZdk!P6HkIFcQ51ZWH-o|SMf(XQ{$$Skqfz@~u1Ud99
zw5lqQB!VY4m}^!RdZjQ*l!JBG8IE)=gR<bT5xl&~V5+3%pt8JX_M}7b(e9^<nDcKA
zTz6lQD5dwEO9P`G^vz=w|L8f{nc;&JHD#e3KRiZnv(}1+D@+s_P%bXuie0nAQehR4
zvU?wItAImJGVLP0ML$^vHCeg<$-6{;M`M^eR070pGd&h^#d@E~V9}L`vOVqb(R-tc
zXuB%jgm;#qccs_eJji0P32v0a@AVn`K&jXW%lCL0wUM{K;S=R!NKCiB5IAEXwZ@oO
zAvmVO=6mNY^q!pyzuSXb%UZOB%PNR%$D2^CRn`=YytiRRw&B7CkZIEgsT?Mfu#Jr}
z<7q@plC7hNuBci9G!z6jhS7o^kLo2Z0k89YJVhr-li+ZdYG%6eC+Z{Z#<{q9=gEg!
zAji*z|7BSjxa{KM#SicedIN^Jh0EfqljM>W#K>88K1!86UU~Ez+4dr(SnjLk_-Jx-
zRHT;Fn`26%y8n9FU&_57tGMQLsQAeoe)cxGi{P=d`{X~xlS5euX1f(w3OH;d@Ex(2
zPO|FTw>v2)YoL9pD9o{$8HI&(ukkIsI#F;xtI+YKwx0OGz?I7xns$5rW@EY<WXQdn
zdT?=+c3XuhjPcqNSa6S17A-F2&7-NWynk$?>k7VG*Z4!eaIRkd2S^PLbH#+2(+YL*
zPn4H#j?<g{v$aNI@2$GAWVMTa!N=b38V5VCUUG8VPt^#N&s22B-m_3s03p?(@IJ;>
zPWqLntg&7@@2b3@rV$q9*W#B~&lgj>cT=Ag>oYRFOSQb(r_)vB^OK8-{orne&6gDs
zId_AP==QL5=!u7aJLlE1*5O*`gTb<sot`<s4~_nvA0oX+1=wq9Gyr6f_W*;2O15-w
z)xHNk!43WpdWm((H5eg;3>oF@MF;}732s;=$XdWwqH?f@JtCq)KBUQKhp_v=WfBy{
z+NmTAo8t_81U8FOqv*7LlIOK6<Z;Ud`8<pN=8SPzxmizj4xOh-Vo0YhaRv6Rrr_9v
zFLEWO&&_`9CvsJdQ(7fWX11h!#i>io7*j>|{#lrwJKU&U^epyS9-=zKcwAPpqPlv{
zBj4)-s3@(uzX|sBpI(?QOFq*wkM%g#KHK6dkTU+sidMkT@`Za7Xw$TyFt_sx2??1Z
z(D}0@B9u1(vnq7gJej!}k^wSH#8Xdg@K8w{2T2;sKBw^Us>8~=O+&mvk^@piQq^0N
zfw|4zCkoRQ7UULe$G}mGO%?CXunk@G0)}HK5~>rj4c*93vj}s=Ug#rKP2_o=rZ}F1
z0cUw516cLBk#~nyTyT6hiX5>~4^0S5yKy$f1gy6yA(5!IrawF`>M3$i@X_(s*#j*l
zcOQ7&@-07Vf3har@f!iEIIBrpM@qZ^Tl#GRmjxa4S9Tio=Tg~MhHoyELPo~MEx20#
z(9Z7L9zm}PdbxPK4L?2L?BY4<P;O4;tvT>m!zyNbHYkRolqV{pQl^qCfE6P7U!=Y8
zR^@x*C%1-Ae7_m?pUa0<g4R995qA+(K=-zNR$w?!+QhqaLK<ctEz615>;8y_)@0Y|
zru9T#ASp|!F|=RiwnF&Eyg0PfeCJ_8rlDm?19fm5mb|g!(T~bFt+LnA0?eB12E2tc
z>AvR%PvsMNu=fO1j>%WLl0A3EG(LLH4$P0AA+ef;_DF`sx=!u%Fr&8B8DG#}+Oeu_
zT8%H`qzGaNs_fRDxs_f=n|)3FLACc9`TdW&(@RaVqeIzotTW2%#k(wU*eNe$`d<3?
zCI|^xrFjj%O<cOzQWkR4DU?e&^l>+s%C>g%IRARZ!_fZGvW_!G)>lAAuzZg+0l03$
zoL75?Y4Agl_pbmM8PuU5w1Y(^dY!MFgfTGiU5$xWWg*wqa^cA@pWaE=J_oPN7Xw!q
zEXzHg(-Ih#-2Q^MeGdaDfJRE${%aur1m_k6Pgk`{52L~!$8gE84-K+yDNg6cilIbp
z_yk5tMZdoU3>_?Msh)OSH5gPFHW)#e$FIq|qJWS+6Z@H^Pj$2ekrIdUcWLz>C>XEl
zN-^SGcb%w%t(2dq5)%JmY<*p^n1vws{Z3k0%=DaPh@|TCH^$j~rEe|aV<*|nZd6@J
z`?7jEORoEnMZ8zrsAPUem8<K)!-QnO+}-8WBLI1y!BI@VCZ6Jhv1VcT%#e9n5oG&_
zCzvkjm0L#I3>LjzX6_>G@o<n#M)qN0Vs;asM#dyYS}-N0Q?UVoI+;9h39Y#5wx&5l
z!{EU9JT8Uik0;$Ya+GB61F^^+q^o!I(sL|fk^^s=<B`#ANhbS1D$jJAG@aSy<Q*!d
z7ar#srzG7H2yjGhA|hWjJPl+SV2NP4F(q29M%K^4!&G9m)}hli&cNNj21X7=$Vf?9
z88p3}!~)LZz~LZ#xwf)`D$dK3DY<VicIeC(AV7~Jq5xlYdx>>kkT<EFETpY<z5R*z
zJwY10uMO8LE$Vwsjsq<xVRZe&#fB<&gS*%1R9<%6>%}&Yu;{oPKwQf^ih}3rcH_$)
zAk$n0w%<*NgVt-o!Xy9OY>qzdIosba_F$|(XS@f_Y|c>7!Ym-SoScX=Dw;%aLt}E$
z-*N&wqa!T6PJ7nJxW^uyGg*$A?D`aVx)hJJ3(JNT#25JVedRkE4xPxj(nk!!YILn8
z3iNUsGdj|4&x?Cg_;NFrL^c;xs<=g1^n5OlWV5_$abmRBfTCxZxq0BALf5Wl#TEJE
z)&~z*X=B6ccRk44>xK7M_SAX2iVI@~zB^<15P6jOe+0hkNsros*+kg@NyA$0S-Im{
z6W7C9TlXR<$=BK6X0l53;oT}<0}DNt2#1x1DpbAUZoc-6(fOT(=*Ah>Op2iB>c35*
zP0h-HuJX^UE!qVCXpn&bMN`kKpt84yJ?|dIU`A&r4P-;_zJw4sJ3E7b3)n|fT-s&E
zsQ>_9AQGaHqR~i?>)SvSp$|ZNWL=w>Xt%DQd2hVs#72S(4NDm_6&ZF169yNFHF02u
zpDl)!)v3V>G2(W<)@zmH2cSwjMf8;H*Yn;}a@_humpPNSv4-y`fR+_v0p}VD7a~E%
zi!OVvgE5Ve;Uskj1e;Q2yvLZu&matIi1ELWXQg>HHch+QQF#fcQ8IsHo)dHtEyg-m
z^p=O<6DTnT2%KUq^>`I`0GT|Yu`z2x_&to<-sk0&AkqMdVL0v8^s1mU5!Pv{gLTYy
zCt@xtsOy}H$4)b-<h&XboQ^oDa@(7KQfqs*JBRp3)(h6Oj{Pje6|!}1>iy2dTL@7U
z({%slYT=IJovEJaOGp#&L2oDTH+wa`=R^mT)$m%1+#{jq;CoUb5E>LI*lIQIItQF~
zt0NTV50v!d);O`*26EW?8Y%1LZ%u4wXHSgEQ6;Wa9fw4(9e6;?*%*7Hjr-J-&%J1`
zons3qjR!v^L#O<^>v}B`#E7Yq9F2^WNoA$`B1S_BAZwjxAOz#Tic=T&|6wHsb}{kl
z91dQ1oHt+jXY$ir|C)?j87mQ5$lNWW2b7hM(^3G5#I9s`%{vmv@$WRfr*k#$FnRNj
zbt-&3*H|LG>)wzVnENhx;|82bm4j{o=>%bqC~S!{e1n@r;PQAInSyNtWasl<H!dE|
zv(|_I3;VtVmajQ(>YaA6n*jMA$2Vek9t!i`XFoVkVTBgnM>>hmmPx;+>bhG<=FF0$
z`YMe7Kvka?qs56+NE4M$b^l!y<0SlUUD^p4KGo1ToMZ1iZWl@&maZ4=_ZOcWrtBqC
zUie%eNSTcngaglHl-Kw_QuXV`J4rg0#7ZoPOOCmQ0&6r~BmIEz&A^{sHXB@0hmd67
z+cP&0ium)1M$w$T6fx%IOsVk9KU)^wOb8vz{-(jHg$spevyEx<MG0_QY%wmCmc74h
zBC3zUNLDClu@niW+$N}sI2RJhAKBZA<oySs1-bVYM=hOYJoCfDy2<i_Mp&$=GV-qQ
zW?trtjz!QgilRvv^gxLq=^iPajLas?i@GR)7lCtywOlK(AUh$EwyKmCdZm4;%6V%=
zXPBakE?inF`$$!&sdq=`WNU=G#}QnI5!}%Yt&|v>9qmjnk<BF(J0Mm91gumFhMMJ_
zs1D!t&W$P7ptI=0!H+GZ9`BPs<E=LA(QTRn3LI4N_@C=s@o}11)7jzHphjWI19DB<
z%H32r<q&Srn@ehH!=c&O{OuSq`Cbjs)ZT_0KMfSDkVgarS7wy=g1?IGIMJrn`>Z^y
zULa1wrDD4=Wwir$9L*@XO7TJzCPZi^*#PgL5IeizSL6gIIDCr9v4f|H?8?NJYI!VQ
zEbh3V2HKB}sdkJg&KEMJBCoS`yye`?6{X3hjO#sJ<S!V^bWlwtYj5>F)<^OIo`*!w
z&bG!~4e;qkNDJejBw<6i4SAHf!7eT^%shLE`}FPG%k7OdfyjUv^YgiXYli<55sG60
zemI5XLTGbSeK0ZWv$L+~C4GNiTZK-Alx&qi1*2WKAG`;<;Iqqk*LMaWxQHOWEM&9D
z^f`*Zjl3D3{Sou|0qHqC$(?XrG$O=%dq^z6&0OO0_KPX%mx2Phw{yHY)8+lKtC!es
z)w@K!05hRg)+-{>XjQ0pg)^M>mY{q14{;LrRLf_@SoA&oR?k|_an#14QVAyc&x0}x
zI^)C44aiG+s}@XRF~;6S?o^n9KW*kD1!F}!b(|}^eoJ7Q-F!?*@H%_vT}qJYeYDDg
z@TJ~$?qPzMePKjjRmO0YBZ2os5=-cD%HFB%%t`$=<Bcxs=#6zoB%?M?E?0iW15eF=
zEocWMa2)RAyRSExX)L~0g~YS7@kz;W&#)Fh9i(PA1wNftS%BvvvSZsJiDnI=?9yVg
zvr{FQdqlq9tzP?eZ{=@#y*LW=I6e1Jm!XmklraG?DbY=_$I9O~WLpZR6SJ%QwzHep
zUtfM5TmwAHl2>VIDbi$ONKG=-!X$#x77-3LW|&0WLTD=-Bbj8Y+xNpF<D~KXkbtXd
z&0d_swdN<*A7s;DT81rgg=mm?9=Se}b`Hfd`vF2KKAf+&hCi=`^wi<eGqG+R179Mn
zs(`>?Vs&x$^5D5qK}HLO==q{QguKjNd=5lO2lkGcZX%!Bf<$3=^*i7k>K^^3(#qBO
z&{DHVzaG-+wlOTBU2chAiip@5O&jl+s#uDFSb|uUdEY_6E!$OlSYuB8HLYyP!@P*N
zc8<kvx;G89UVnN0J<Gz1c<tt}01?eu7#)o?f)9!^LX7OJa>5LOGmW#8#$HiFQ2+y^
z!Ozb(O`g-VZaE<E=6h}y>N;t$@7*?2)d}UlexCnf%pHRMfoanPUALLzbe*Q`6m9=>
zm1<dIqba1mqiJpG*4}=5wP|e^VSecoet2%;8>K}#F#97IlkGb4_P}$&P$jE)ohWYa
z7Rzm`7npPZG7y6?I9&$7Hx4m^IJh0)CBlhEz(|g|;PSmP4^X%WK7XaI0Z}yU0vbUS
z7~!)A@k0<Ph`2xGQ>dWfeXa@ul^|eD?_ts|PE5S(aUJ_^^S&=lUWUpL8O~n_csg{`
zZ4~*^vF2!Wt$A@D5CS}OvZ)N<Z^v+yuI`nE=`1j2Z3G0wJ*QlVWd@revqca#nQeDl
z$hhe{+9Z~AmbG8A=Tp;U(NH(wT7Vv_Khzi=wnpi44iu#q=At!?pnCbE!wmVH6jGUO
zzHONfW4~n(|8@RUmTh1ZaKV(~X2A(-f$rPJ3K9_Zn+iG?#E%Cepf@LC$<M+X<bw~F
zStxEy|I9zW*LQ)nM!{t+S4GUCP1vMwjQBena_qW2sVo^nioa;iiH6v9l#GCch;sBO
zdcz$Q_Z$KT6z%p8z_URGE2_4`2HYS2u;`6{Vm)CSfz^kDmFJm9NVV*B>z<xf+?xtJ
z2VMdJG_SlzSwLg<SFq%fIM}S_8CYR#T0TsSxMJ?U2~Vhg8(Cnn0Tb@hAGsDYtUBed
z2tYpPv}V7DzFe0^elN(ewO#yQSJq%JaBbulJ+yrZQfU8banpsr)CIRo+ylhpeXu0b
zOEG9TgROkD7%<4hE19-65_eRf@|-Y)R}V?CbgkHn;bD*jNZuC^hOcuUwMAy42twE)
zE(l6?)8!1}apu7y4OLz77~ILv#%O>DPFlL>ne7$!Ij?=sM+a6&1q`5qE|^Mm7LZ<y
zb!!Kf2xiyh$Kvb}tN{fT1HwmgkdlOf>W%>}oN2qMQi*$Q4wZd>ZK8QxUx6|k)Qag9
z#cifIyApf4rL-e_oP}#Qtk`vi*A^)~mNX8eV2q;@iypKQAaaKo$Xp9>R`Fr2;~HnQ
z!Hs4tN`Fj2=MeUzq!VtAV*E_6vV~74O*lc$N-^7M*kd1vceg$^zx-YLbN?2u-bXf7
zgVFp|nP(r+2@w9s(HUQJu~kpbuje+rKd~BfiB*;Dj#3TSJ!3VoKV&q}uYHxq(_amM
z$X%%?cAN;g<{#ETUb(Nw8jw`{m0TQ~&GP);EC2*GwR^&0v-^>U<JfmCS-bk3%ApQW
z%*%JlVr8A->XfapQ{yyu!Y3p7{&)ScU%=4{F0NRF&8qF+UtnMve|2AzfG5I_I|E+f
zQvf~+cM}&(8NhEo2X{TxA;v-}wi(Kh=*qBSr)#1kVW%OPQm2<sBy9Sno=95(LKB{t
zu&~p_K~rbpAK>tAW-P;mXQ@xzCkST0CTJ1mvA)VgvY7!0Yj=Nt80Tgb5h;7TGe_t*
zzPH1#Hm!5?Vd|F#9xE}B(l>iUnStfDGrY&-rajXF0s@EN{v2?GK3F)NlRXhp9-@tb
zLJyhyLkjo%6l(E0?WwdHtm@^Jdg=Qyix)XYshCvzU|Ny^pkoH92VGFKi@Q%y59@e(
z820jLA8$j$MX?72RJMgQ=$guy`zithy!-s+=?;16HNw{-tungv3c2p}ATi^Wels5}
z@&)mJL{uE0d&)uDuK@@d{yTZyUWOtFBcfK3UK;gA!q1l#D~H=S0ir_o_}=r3?sPZ-
z-tHm)Z8t9V1rOQ%ZgXS)R33geFz?YMt!(OhZHr?n?T3!|6u~@PCB%aN?)@4WE)*Z}
z{c19G`Z|NL!ZXG^w2vx^Lqf|Qeip=t(#n2*rsxl1i}!uU${JHQ5_c0erV@-S&L(^o
zPx1=^N3J6x!gRCjxMlk?t2AR6z0`G1+vD({)AZM9x8rlbCfW-uwWYpM)?d;m_X@@c
zB0<IsnhO(t0)0UBuTK{y0wK~`J1>Xy11fkgK~Rt&pK5;7yPZvbqhfrShmPOAv05Xw
zNK&Cc$;FpTYz?B2r&V1}!uTPyTb0SQ&D|oW5;~@uuUBgNi5e-4NQsy@#xh{B?-^$~
z@A$U|b;h4C?DA8X%(V5!(F*0W4a(>x%RhUwBWO~m^B@?hL{6YNga(am$9%gM0-_fW
zP@VXAY4i4KZ||7n%Gig@v0_SW1lM>nBMO74_#uabsqc?bFFk5<*3s`HOtEaPP8=zq
zH;o?kt&3r_5Kc574)w40WJ@m5U8a$b&Sj#reCsBK2?jASF~a}}S`+2ru;@=_0K>g&
zTdjG$c>z8{(iPrVekj_sDk^VpuS@H&15dA9Lk=T*KRIYu{~RK(U>>F#CJ{{B{Q=!T
z`njW7*02+!|70N2YuH~thd~hJW{+|$Y^pIt9DdC(p<Sc_8Gr*&1Eo>y_c5mI5_M#|
zp^WM;v9E3ect(cM0x2nP^KOG(RfLz<BOvJi{`}#CV)z|--o=ZcM~I`K#WSXdvAgTV
zs9L*dt73gT9}S|BM^>lC;%!k`CV!Is4Fx>E1;H3NsJHc$N`A`-AusucFY%Crj<KX8
zM@v(a*(|2-S!_ta182Ka!@lokyP~8A`S^Daml%->a{ACTL!XUbb6y!UPCn!)#CJ?;
zz$9V)G9Y>-2gW4C+^E8DuGSxlC9`bXn#}L0dRbf<5&1A^Q6zuSEqqs#mG9Qg?e4Yx
z&<!p+PHnxbJ{+iw`-wcH%A6k>EcvWIi!3Jjtj6K*C$^R+k;*4>JFapZ<jN<}0V!~u
zvwfn=?_2J%_kBjI;#h4jJ-4q{9~}uIzPvRzz61IfPVbI^H@dMD0}(2vLVtNo;KBV#
z2G3qVsvkWXZ_>UI@z3P4Vnl{t291bBj*pmH>Z9BE0xg}GayFrVKjizrCb@sk){XHj
z;5ieclNuF&ldGM_N6{EVW2b(qNd4sl=@^=_Jdql88#jVV5Nlucw+5?MO_KX>DUp#G
z|1dMeMLGRQ{+?k-@f?X)<|l^MgzC3vRgy?s69g~R%h)8_tX{R6D~7nwsP@}}5VSHy
zfITaJy|bAI-SjIU*TMO;yF5XJfx()&J$vQtC%8P8^FYC^Z3%`QwV&RIIgWE$JmZKY
zbHkkLjDSaiZYWT5F?A#&A{cZIE%es(@{EKzFDH5aDqo7z%GEjoV{3{`mn0zw|K_6)
z*|1)1GWs3w$RCo{-5L}VN;)4@97^Rrw#oRTVzzB5vD<?*_%DkYtnf_)@Km;1SlLmN
z#FdRAuM0ihrpziuvOLO&waKa?Zv`^DYJP5+#@sR)kK}mM100~_Hs8&8=j*Zb-(HVR
z^!xv=ThfV)MjRo5y4cZQ-89B(D&6nbiM58%n7?gFF1~8VXU0%N0t7{&=pei*Ihk?{
zTOgmp#NcA;C|}E`Y*24gyS1JuP^wj!df#5rJ#N`n)ZX467BqwA92_j0OnP4@g*0RC
z1wUnAvHt#ar&N3A6Fy7Ph;aTy(U>PKV~a#sj<EyC7R&-V^Wkb|i`?OIe3T@_76WIT
zW>%Ympb0d)KDJr6^`kkr1p&1PA=mA7RT}+ozQy)P8+mjgo)4Cd_q4byY;m~&xSVea
zRQ9EY%?MJKwryR=+MhnC6<f>3E&u)NGv0sw&3<;azwE+bU$&e?dWL2<c{MN=4MC@&
zNq=fUjl*j!NA$kXAouqow)T{ocZ?I=qqnb`khLSfR+Ya%&dts^39zOWl;_tHX|U83
zx{j%x@(=yk_}QPj@f~gm-pqCYgA4v|cA`XCCRHq5)eM>0Y0Pr!vrpex>!<M}uh8Q|
zgC>HalephL71}QLf44r^jF0g$%epYhVBbWdPI8hQf0~%z&w%=p=jrVKVeYG=qFmc|
z1wm3$N;(9kLrE!>QbMJ>LAo1;lui)=DV1)9?oLHga)6<0=o)I^ytDWIzK!2+f9I@q
z*7@VC<sUe(;C-Lxx$pbBt~(yUPG|DP8UaB<xKO{*9jr|usD?`wacAEc(w?58qgJG`
zprXU?^qF-k?oyt_nxrLBV5EwC*lBwz_-7R2A6G<{4g$RL0KZ{3%l`;Ve+DYq5WuQ8
zUN4aYvFVO19RnW!GXuug#p4B4lm!#QYteM7VdP&;zhcWr^;Sw0juxmhqUJp0WfX{1
zuA6!ha4KMQ_d05faKYa2Yj~9^cVmuam1R)XYzcdjm&r+PWx0hKS|K5dQ<WO7UN*e<
z^XZw@4zY3*P~!{?%;5wusZ#-lx=NnA4jV?w1*VZ+#dJXdD^Efc(0;ysc@DT*s{QTH
zPpqgM%EF96$qp+kD<j{ea4dikTTXgf1xC&`F{0MuCtBr)$68fW%LfQJRD^UaG*h*V
zQs|kxTAQNu2Ou}|52kmJ47~MOqgQ|0KYSBumt4q`v^(c$3K){+gD*zP$`2<=a;2Hs
zxJlmdy>{R)%%6bFOVe#_`KdWZt2po{ctzPa)O)5m6>Ahu+#h!JS6lo!XSj10@qp3<
zale?nvE(Jf61ov7Sd*32Nw{m<e71_T4U6f@e8wZ)TKlh;K<57dR@x%mOt|z}A8ceO
zk{4!PfJ<ozJ{!w>!#HIW!C_MIlb@JTFuGX6I!0kR#Y5r2JTRbF7<I)3HZC%Y6A@m8
z?V4R;7dU;u?xgUMzBKNi;$5u74(4luRFU!2uz!AaSvnU0uH+7ci~hNC2Os>f-&5~b
zGiO+VtARlH&4lEzWUQc#RUVHBgA!blPh}m{D1D@@tGj&}9-5+nZmH~`<x6r;s(`YP
zR_O879TM!qhZ8C<TniXr?oOT9K?+-H#aeQ}!0s%ErS53Vss0VOFX3hRicif4sFHb%
zgNt;ng2pIQsls2es@~Gcd9I+y98iM|)|ao2li<Xvw4BoNJlWxZxK65R)!4wiN!5xq
z9`KnDe4OaHQf@|^z>0F5*6Bm6s&;<P2+g@KJ<+VQ%!c)(Q#lXOX1NsdD~^62V_S}z
z=;_v56~bB$k^r8>w1ozv*6C;JljmX=Tf`HCV|^tJTg(9diWiw(%kX98GgEZ)N&hXb
zN$Ao`NZRX8VXaD{0%znO{t>+L3z*lq|MV}*^JgdIRt;2;vXG%_w5^&B6%;I6ELGlC
z?`o0CCd#+gDO#d$j8b_fT|juo1yX-gMo3($59<fFsj#>PwNs{Hw@IT}gAx)GMG^vm
zQb7)6d}qZ>vFwueYXs^|0d+VW7``Q6NTe>}QWg>ZBdfOP86P);K|F?|BxxnnYXQuy
z20Q$^`EReN9Gdi{Gkj0p&o}^cU=w-A`7gtAtESzI1?Ei2^qIs5ulkN10A%}!F@pkK
zz0kijL9EHMUQ9{$OEntncedp{aT@xD-MU2Y%i)lN9msC4FalH-6NoSTVnFEHyT)VF
zO&MtZEO9_gr#o*=%3WQqWtui!p(m?fpM{4Xnx6(Y0=Ge~xV7x==uz@*YI<y}km-n@
z09!MDu$CDUSDjK5Uo&@^2;7BX4o>t?{B3D99{`K4w$Cg0&k!Y6;xpjx6p5)q{yO^-
z(`c5g7%BVG<Xe}HK@F^%s`U16-h|!z^ig<Go3YU)tLAF~rQPHE^Pf8~-z$(TSWcCJ
zng+6;E!>YQQ(RFa<X83o$;J4Z|J(dsO4W01jiLlURWu!qdwmQlcu5(b&>Ur2RqlY^
zO=e=Tc+WR`tpwuFDNW{9lPQy+sjI1c56yjqS;Ao#jnBLXhwOgbu7=KS@12=v6w-mp
zU`tFX0rT565J}qxW6T`Ktts=9MEykelS&E}RZ06e5SJ)oi#)enECAPQ-OvNxR5L&F
z;ig4Ps9^zytlEhC`x5<q5@VSGCpL=KWBAucv5!#WHrtp#6Yl0P-co!*998<vknh!z
z8wtLZ)IyZBWD%MCG4vS;leqvs3(A!=Dg}#uSHi^ixfTe77~Vtc8;gFp`YObxCPA%O
zyN@FGB);H@YPwjmD-d8Fzv+GzB9ZxB`e0dk&^`Eb%aOxKSPyJT>_EXUV(K26zGL4?
zxl#;G(syua(|N&D#IN{t{-rEd%sJod+o><-!6=~5PhN4hY%NYQrvt(HZ&Q;PN4l#g
zmALZ19fZH%@->oOO`y_*++3Vr)To&mUT@f}$?CA0cwCDj$@gnvYnwp<^Ez?18i%Rw
zi*h5`+5+ao6~5=1!T7#R^nM?{8F{=cT<-=kk6UG*&atGC3vdD(1j<dPmqBbOr3>kk
zAEq|$Es`sxIJ_l6+ii3rqu^dA9Xv(Oi}s@|J*;e-^4i^T{FM<C%y!$ZQB3jPw%#(<
zjaRval_deVgnM*goZmjZ@v;NREp=K>jlJQU=|<7M|M<R=|0Z*`EQe_Gk&kEJ=PIk2
zYMnITXW2&XS^>j;JS3*=>fTqZ>yvTCRb0DzzP+`U?)w#Rd2O~Wz>2dfMMakOrzl9;
zN33!ze>IG$YhMO}#>?wb#rQGR!kI?<4+V6SN51O|3tGnw4}!n{yp7QdP@L^^Fbgnt
zB<B+PMy6h&>B=)e#V*hFKRuxaumK?ty08A;li&Se9UWk_oDZGwZlE&%BBDu91NCyX
zNN}xFkp}p!qWH1N#NY}RdRtxAto^E|^QkOwQ+0mDyb5|-&Y_yNEeEy8&ck?SrH_Ez
zeTMoYhi+2-T>;51ctUSr2JmK@U&sX_=_b)2E{U^Qa-+-#D`fh;1!McD#^%ou+aF$W
zCi-|D`LW$YYk27X?8Z_0Pb2yL(ScX`Czm6^iAioa?;<d_toX!t&bw~@vO-rpkp*D+
zA6z?<Vfk;2vl@%~HSNhI?OB7$IWQF;V2rX9(Fu;#3gFdh*1K+Ry5`bNO0^N+T#?7f
zy=NB0WBe~jtrv-IE5Z}oZXy~-$yQRd!4wg7&c^u}9eHX24D>b!*~wTG)WN2`5BKif
z6O4O^iHC7C@D<)W4zXUs`}Y6p@A?H8_<ol{f6p4UMW=0D_rB6*RPhu0nJN&1tu$-j
zeZBVcQ)5vKu`w+yt{xFg`7vVp%5)$#!?gQoqrBeIr8Up~r__5Xt*)vR>)Ee?_h4sS
zPHVj};+GF2NHNyx$3AJl>WLQlZkAH@QB(Zq$K4#oxRn+Td;zf1Zg<rES7gNx8$23L
z%3Zg$lAk(!yF40YpUS(=c6w|v^FnxMQVu9jeE^g*CVCu#;&xlE^;QQn65k4T_#WY0
z+h43|5zOScXiw!knVavDvFp$gAJb@E!i)qm<kL(FpY1)z$4>-&T)o9xf~{}!H%<6I
z<I7D?^~cvH2>`Iv?D{c((-@|h?4byJInzw$x0;%q0GmqBFDNV&z1l#W*DsERgotti
zxjd&*eb3?dyy{Y)C1ot+@*}-hHQ@&{`k=U1Ty;ao#!8#d0MSRQ@*}b5$w%N0xz{fr
zyIp9sfSSC;Z9dP4IES)p)^|2<0T+5cP9Rp?dK5zCnrD{^Osx2>PTc%~XHbk031WKC
z(~=ODvpG>tXQMIVpBi?XM}>CB)=Yrny=$VHkk!RbpiHbp<cgC`t;GKPGgR1RlYK4S
zt+~<)I%m@nM)(7-c3(JIz?bv$qP3Jq_EVmNM>U9j8QKK5IiFYjb`V9*+EXJLlP$d>
zAs(wVku|b9#BL39qdNBhW@?PsIl0jC9wX31toH6igBZ#G;(BO21Qo3tJMgGi7GIUb
z9)x4(=RJ&CvV%gI_tM;EIQ6~vlSO)j)^zDGsO-PM#Gg0@UBaTkB{A{;0vxrxZ_tMV
z@66EYy6&)=XLvPN&Ndc%-DO#&0T9xM0gsd-&4xQa9mdUoTlQWG9Y%s25c1Cf!`x~z
z>DKcEgM!zj#XI10@GoMN_g`sxB!5gyNaoyG=-EjVfPUDgjgChNv~|5G9({5metb`}
z!L}Ge>RjGMs{K99ZFWiTN)a7;+qQQ6*yE;CdEEj8EuEH=_`-h_1nK<Gp8<j3ygXh9
z<L^lDSORsh<<#+e;f|XlEeTqw<9Up?S*6Oy#0F!ohEs+!j}xU5yNr(spZZ1zqa9MB
z$jjk!EcKwRz8q4t-M_G1R$ksieh#P;W2CpysXZX}`S$2SJ=QoKXYUGhW4&1t9)BE3
z^W>!-=&b9@4@EEblnk?<A7CYQFKzF;S8NS|joTd}$gWw*^zBO+pH_7hf^Pq;x1|u2
zU{*+9chh8LV>Rs@&785aYdOndKXVC7b$_e$=;1?q2trYQs|CMVs`+Y_t>uSN!5Pij
zTINbn%gND<adVp0{k8sd4gnpvD48Q9z5Ss&5k&lPt{8O}I1?Enss*UpDfxtGTxTwE
zTfVK5wnbm!O@Dm)QKha+qv0}b)}+`~<>PsLbT`qm*$laF-WPmSt5XKuF|=@hV3?KY
zLH{~Wy4O`$4{f~fHSF%_g9V4peDmHo-}89L+R`;bX{X*Q6m}SNBdC4>5q_bo1#Ppa
zKfe(SZaDwr_kbZEo3hm1h+6Ob(Aq<<?g!AF0yk=WAg<!IPs+6Xd0!}dP%fQb)N_l4
zOxH0vmxE-j<=RJ|rtx~NwFJzd$cU?3SN@XiiNM`0TCas;u(2wE&I6!w|CzPZ{8_*m
z&dTNCz(JF3go=;I1B*rlASy6>6HdT_DKX?~bnCmSSgcN$Gh<BFheT#<fw`)QIzHPj
zB^lr4a?slH`$-@@n9GAgg)P8fA@=Gip&HEzQ^`Fa_#B6Mx=S>b>*>OdaHPh?hX^iv
z#Fu!(7|}-@T94hhpw1n~yr$ooCf0uQZU_b-QX{67N`h}J)eZi<iG!rYKNKCQ|8{Rf
zx3I`jiiCvSwpn!>oE@-=v~(Yowwx<X2(WM=meBL(UT;^9^<cL(?3AbIxGgE9KcO^V
z%#u4;bjmb6j}d<f8@DluX*&6^q;y#b*q)FN#@$*uX2r{H>Iq<Oc-{5akR?`J-?Og7
z11KDt0GvGO>Nzt?B-B!rQfc_M;{%_00JNSvEp?@LVh0#Qex6lYK!059HnZT6_9yOK
z?68H<cqYwuEdfnXI$~6C{j<f0LDL__)gR|rG8Rj)s4-^To8;4}xV~3P6|CD8)wx~4
z7X;5<ur+dOHOkgIZ?MW-LgR#c)WEYQSB+<mZD;0Q(~-utIu2uFwhdwM4VLTpK4O->
zPP>)_ASd2?g+cSsSMbQbScR(iZIi>2w9w&^vgw)Kk2G-3$X>>kW8}wAAG>Fv(w&HD
zw$fUs`DK7KBm$tOEkT8CXPP8n_Lis7_}SNmuK_EIi$)vMHe^EQlS^4|Or@*^Ja%W@
zmg7Qbk18p8%+lB-_pUBz=~C?G=K6X_`>vm7pi_?9?JWzNem7Zj8md>d^4N=$5uJ#f
z^w=+r5VZj-ri|OH_=nIsq^PN@%C*FM)d95b=Kj(m_ZOP(DE0UL-mnR#*R)8#M(Y}9
z^>>!T|BhlSX~)1{5JZCYSb+d&eqm)y2Wh=jd3xU~()0Y$*_yb1w2k8c+jq7!?ADxs
z4RL*sJ|{#;!)^p|OEhSe!s9H#*ZrI#cQjh0PXX|^LEmaMbagp$;UZFM>c!9Etq^E!
zIoBKjD$VL6o&~LThT1EMFUc!WQi<<d{Do;fg8Hv1#r1aT%pV5Vjg#gtwg+*s^y<3J
zl_Z2teCY#Ar+WQ77U<(_*jco|C!)e{y3n(jC~0auYL7TL_`y~G>}awLP!$wyTSikL
zlv?N>ouNI(4MJ-t2n1~Lf#V5OF$QKX@Jo&0@^YQ$U{O51qT^*n&QFtGUARYqNQ%$X
z?T_)<mI?{EEkA|T1Lh~0wq7nGA@gp!L4WL5w;%ivXFoP$eJ|DY`)64&2n);c&QiV(
zBICM|1;{bC%tnd*9SdS5M3JT_IxWxn{=b+aA#$sR%^V;7y;Vc6u_gohf|)VJE<>;5
zuMmR=)-Cz#K=D0wdbNq7NO7L$?(I3&(rZt|U5|sl9@LQgZ}xuH%&peZFws>5FxzwI
ziMk%M)7sS{g<UEt!frWl*g@4d@Wp^xzZ981tLO;?nkpQUFYG=0M7_<WnB(meG8&IP
zNsnFe-CCbZMd_!a)5>G;5R1{}X{(Y*m?hc-W##=U4)$shz&pQp9FoLn_^F($m_S+D
z(tYe;1cgqKqNQMW-nOgN1EpTwej8fhs;V=(knP*}&{#U=;HXM-Es(BOCI&&(_LLNu
z0{2n~;EfC2Qy4U!^3#<TE7kfQXW6_?tGNH^#u$-q45C~T`d`-WHgfGcI34faSi9E0
z)~*@ejFGK-ak8UZX3)k^x8B$ycier~R-2W@Jk6(s%5&Y&cH+etXjakFh;`AnYHZv#
zKKc66X{qpHI$++aq><t4`q5v$yUsxzaY|fwIMCA2>@(7IvAa^v_6>Dj3Ww}R-P%!2
zLw;V(TQ*ji_l03E3c!I%B2_Jy(2Quult}xNk76u!pvib2_%=P6zGs~X`$PSUtAT1d
z_f0oe`DRYNq%CGGCr7v_{0FJF?FPS6I<M578T(>bN<4Rwa`8Ls#cBA+ztkL^aFKR3
z%oE~FeYc-uz%^gM1)mD0n}!`3_K-vlZBFy_;lclaFX8|d(GiCy6f*oH7xDLI0T#G<
zm+tVUs!X8GJr#@A27r3r^D{D0x3;nnnon*}uOFkI!Vi1PSWGHDam<teU_AZlQ7fW^
z*17y*$Lsr(3EkbgnHsp91BqitsGvgGA!n^D-qSrgft`@0p1vmd%*y#m-w9-!u4a~}
z(*}=dE0{39zU>IeF8o}%!k~?|`Jl%_L#yRJ>saxr{FtBG1ZXh()NyqxBcK<{J=NR-
z3#U6Bl%ZwxQ3?y!M+D6qYD|zwmQBS1{gIFg0ZEb?CBf$0%PMu1dsp3)U|yrnrJeMH
z-=P8#5-RMlsZ0GcR5()vz??T!a#iWZ_lLfqw{7#=alys*zN~QyW-D>!Ybmc-yy~KO
zaxV1f(Ic0J`#fcY=qw`NU;bF$Fz<1%KU1~7%Z9l#n_EidwB=wsV-jG{pk)=?${#5^
zme#o1S;FsiC1m~sC`8z{rSS!-9e>bx?PQNdyTujP%uRO)Rxbg)T-j@3!^ewSx`05@
zd_lvC)`DWODN3f#BZLd9XTr1{E3bO`c<YUu4bT*v*xcmV9oDkFIYXA}77a|#8>H^}
zjgX$pAwg<gsSe2v$8>}7EQ<hUbm)VTEPmtr5`h33t%lGz0`tV*n8jl9CqOz$8}xuV
z#|Itwqi-o#k-AKHc=$|n4b-&|De{%rDYjz=c%5u=02<RbO2%ZmTDc|WgVWI5nJY>5
z_E42sgC{K2@6M~+1bzTH;_2BemG@&Z)W_yRfLsF%;}hJe*MHuO6;Si8C40svqb9(4
zkT^O%>YO&3y9oAyZgSbTC$=H0qZ(rL$T34Lm!?#;z+n;&`Sw0yWya}zi5Eyn{`;jQ
zM46FpcTR^h>YrW5K@tE9JsLgaZzc}tp0$>I5w_dWsoM*1y1gIy7i^zE6in5V9e0-a
zSrxoL5qrd{61AODu>K_SH7|d&&s9huenQ2d$e@iL*eE*{wAojZu_^a239TM3UYx;x
zZBv)a(F>kHOftswLUtQBHf-T?-A$a>0oz_Zq+y@Y?Z92193j+hFFiDq%@OvIuRVaW
zQr?T)4ATr6(INITX3Xls_0R8*gz|HNSt;YX%1IZEC0GGoN0UmN^~=0&9OCjR%oBP}
z*|2NPt~np2jkR+wvFpaC*O%}9)2AYpSH!G#N#uW7n19Nsw9*g7qPKbN&gz!bZd$?>
z^GZrS>4_@YBUF^av9V17GQQ{Ba&Yj<bhV!%y_&A4Bvr(@cN>@mP3u)Zfg!o)#MQ`z
zj*h-lZ(G0M3EU?00cKa>f<bZ{KMp`fH9u3?^)3r9FQUK)J0f;J!V}n1tw>f9cn^}_
z*tU2Rqq%L@N6ZKs7_?s=Y7*$sq4PTadKXi6@vGU#WNcG);ByFWlXmq~PGG}T%dxob
zCwAS%^WO?M@>&2fxunJGN5X%}q=*rJp%ct-i>bS*SPG(9vSBt~jzp~FW|*Om6#XCx
zh`Qwh;1DmzU4YnW>XHz0cycm1q*EUT$n<WiBgVO2$h`qadhVbPW*2g{$eZ=2?pXYA
z`$MZUncQP}Y9+k8RbjI5?Y(V^uH>Z3?PibpTgk#M;Sda#Gfp7Z1C;t&)3?L%D829l
zhz0KG<Md%Lz##rQ**u*i1hF5p`b#L?WAl;6@mOMZR;@}pg=jZP$RJ{ctZu#iUAFB}
z?t>d%J}(3L(is=uRsYLNHzQvf>K1!;^QC1qB=<sdWeQ(|XC4T+4@sPzr<CeI#qxgy
z7-*|lI=0yCaqt?plb!H>IFG@jeFVrIE*A)^E!e?w=mHQ4Ml5>LmRGgy4s}k5AFMUd
zxkG)tdb<+!b~MdPiDMEsqbO6WIi`X6l~A`9FCWDDvEx)1S>KFDORWu<<z#L}`~7?b
zXS0guR!vJo7WyIC_p`OMmGf05D0*A5R`sWlVA0JItakkiJ-^qJ+r7UzIZp+^$$2(4
z=}_Hp1ON61K-~fd(#g5Pl734$U<Q$(iSNy4j^x-_;U>z^c)y;z7!(2Md8JK5-OTlT
zhiwI+=ZV<Hi-{OfIn|^4(hn&pp}RBbhlx{8%K-m?!#<a7FGg?y0Uk2AZCn6JFBl7+
zP%U+XTq@p~@h;q&sjKh;(wr-fs}u+wS{B!IY4(f5tqgmifs?H<?Pzha?`IwROUrX!
zJK?a9VCJZl-X+HL05<09KXNsSBc_0^9wQ6+31NtwOpOseLE9M1jqySp4vHm;*wSvD
zpU4#i%$Ml8#ZhA5I)`BFyNLWs)d8K29W+4Q+){cXJ=OF)r?mT~be^7mdA^)_m<j*!
zYd7b6)P(L*^q~k3Zie?JMa{F4jU^U3{0`wU@1Ht`JK1ac-cz^^F~Audx9l#|6`$&(
ze!lYo4`K^*z0kfMUFmO0WAWN<%7wUELdD80T}}&TY;XORR$C@PuC`@E68k^z#$$3o
zYZgc<UVZkr2>RuU2$Kzy=J6^2RQ{+UXRMOgxoj|AQwN}#MZP-}Be^YLMOvJyJ%QGS
zP!xS0eLk9DG^$wma<7`YIv%o1wHbE!7oI<?>=M?t{;KM*8>QCuWJ2$}CxX}PC~wks
zz=NDHm*RCITH9>>HmktQ<5o=!5asca^1-05bXQKIu4}e4)SOlaZ`lv8dPpGenLUtG
zT$#I|?c|nozOG9<Vp8?D5e}FiRT5W@7Ch*k+*tmGGZ0_r)HD_g3!roVwZ4{>mG$fA
zari5)I6&=mMwqa;KA9&=_fov_?&o={r?!flCS)9}<I$DvZ-|{G;W}&Mc6OGlS$;av
z<&SXpzu}VUe3AJQaj!1<zgOr6!;}3&j}$)WxA`Yt{*6|SKS}@w{4b23{RW_32qhQ`
zn|iS`q+brnuf~D&)h7;t!%7w+lj(00Y+NlWK$YkMg&mdl!{mo%GX{lUkqNwc#u!g6
zg+_=SHM_p=VL~qTz(NQuebdEBJY`AUcjauje+W%Hzm3+{6!N%DAFTv<2Yye3jo?(H
zjYyqM?`sPcO@HRxYfbZ1<{zK9oFMi_75Qu=0SX{wm~xvHdO^ye7wW7F0UNVWaKDR{
zQQ34GJlb?Br}Em`-w`A}1ZamdVlrOLM=7r5a%FOoIYf7mIOedDA~&y0R$Bb}TP~vB
zs^pW!X!Bv^lwy5=0r6Uz+uSFX5d1_J*u=D<DyH|xRFJ2y(nVvP(@Hzez%jtHn+F36
z_*0r)o2A_^+Hs8gvuhdqn~sJ$I<i$^pKK%5^+0mKxQt2|iwIA^TwJDf1FAs<TuMr6
zrwkA`U(A8l6aXhMWm6-%Ji=Du+yh8&i3f0qZS;1#(@pvRDH9N2YZcg7hcYs7BC=m!
zL#45?kM-{l>)$srmQOMP$xkS_Tk`TJFZ$7T8x?8cJ}17k*6KICE#rmS@P?TG+Bc|k
zA*6ylEnUj9m!Vh2OS<^#EOf5%ez{p-fOqA^^tyeJ+&l0sc^u#PNoQMmCM^t70%62w
zglkWmlEMBNH#}_Wx>2mmo*fm$5YfDU(Im-5vRFPXsNX@l$z5rOc`%%g65*Wc@gyD2
zeOE)KfRu2E79^%oL{`_XG%P$Q5~-T9SoRu0FxPE$u}=1#!4Nk9cu;E^4R)OTbCCX{
z$=BQWaUBrstKS2<oNj*&^selIM4fxH4y`GXN35xuP_6P03K7$WY-fsoL|4KM$fzFk
zAAo<n<18l5<3F=o`WgSzcEg|)Q+ymgU4Utqkqc&YhPDmucK%dnjYuAvW`7iH&&gPl
zDN@QTh1s}Y@f9i)K{SBY7Tm!CH@t}iH4}jvf%OZ|2|eFH^9O}$>U|yfGi>oJ3Lm~p
zM=j4k$BP3-M@xrCM2I3H<7FE!S_5NVrc@Wt0v-LLY+Oy30kEac#ur{YU5WF;{K*pI
zqf?Gsmi4ulr4!Itho!kh3h}FlQTGKt&ALLLM?c+EDxW=pi0G2CYcP?edVRWbNIbiJ
zD-I|O)7ojgph57_ABw|=mx_H`9s!8Gx<6?@6ItSLay~of__Aem@ifx?z`<kb7(DFH
zV{Z5&)hwwg2frsK-b*!=${CsMprPIW=p`iUZ5g4$(;Auqbw{|IWeo5kdT31mk?Ye=
z3sfc=7~m{Oqa?OpdkMR{D-54&Xh5o0m}?r!KAu~X6Uz;|IeGT=aa)Ln9mjs29=QvS
zn!O`F#n<l*oNNHWS5-&bRx!<ZV`Rk<VE(=B?{TuS@-*N}ZoJzU7BrF-9A$Uw$+ofE
zk~+MZ(??$p>ie8!BiovVcW0#VM7Hdwa%J$H9c+f0tSa!PiHX;XDh3mt<BRr32^}}&
zJ1)6Q)PlC;lDsyiVRzPjS_(yGFg<rqFNy)gkf^8)Ono;AtOiCgsno>yjI>-&Ii3>w
zR;Hwh!XOt+nhl(Kf;PfXo@LIBvhC`02g#zRX}=YE{;~if1`9MDH9_qjS>j8{H(^)T
zDn+>LXOpco1UX-BU%pnuz-YX7ZKtcg;&O<k<$n6mI`1TD!|IAlbcDzQksg-J^PH4@
z<oP-s?e^DVJU?!9()N208Lw0+#|4g&u3q5d<QhUr*P_?x0aAzN@^Ru5VKa~3$&~Da
zj>5fygNAR3$CHBN%wl&djg6d<CQ&3xKMgDI5{_fMydSYflg_;-s@9{`VY$MXkUHs1
zBxB@a-vXw}!fffb9r9swPB)&G9E~}jmV_*@R0{th6#mu%OK}JOVj}_Xbo4K4l+5i+
zeKQU}I@U{WQe!>?9*$>igP)_YQV-x1J5Cx*DKY$J2nQ%cLmw6P6mB#gW&bW9LoQ-c
z76+uopVrC!#vAoCHB%-w=0rzhnaCsEpy|mV?I8S93Cjb0Mqxw1$o-^H_iODRgz(p2
z^=9pLO!j9-XcF=OE@s<iZ?K}*{}Y-l9UrpJ3|B__X2N4K2n}F%3I!cBUT=Z6p7gil
zuRgISY#xu<CJes_m`4$SvWmFvY=vo8nMI|JtT6$Zb?GS3fU?VY<pUzg&#<s)`scf!
zY^pb6^CEVuE_R!=r8;P9CoWlA>&b{yy$_EC9Dn>2KtI7`Tzo9)$bpF`KU2@G+XdX~
z;Ziro`c_SgIYx}<8SD4Vc3tQ4!tdWi$C-)H;5(!0(L(&qo@I4p^jf}%stJ?jUY42I
zDiX8?{|~8+r<aEZmxq}?UhfIfuBG0O_$cnc!i<x2><Z|w_nLA=`<s6K3#~>9L{G)H
zKT}RCk}$iztkCi7d+*>gWbk4S|L&pM0{=vgqU!L$@zpm|@!=K<<K1|RrJJ=vvHHN0
z;mvU!I@vooB;O-V*zoc^{4VJDD-6CX%WO({kWeENOT_rP)tkN}n`!3x*1cQCp15J~
z{Q#PSH>ZZ|M<Im%tRn$kGkxAiKk|WeMSMHHsS9`Oxn^fc%B{yDOrJ`+P@N3g$ducZ
zAe$1H`vKN(#blXjZG`8`6jjE9^cm$<CrE$`OrY4U?*{$4wp_dPAu&fCo;=tf@(A$R
zJFwz1UQ734T?oeKB`f{4axq%q+IK69IBXj6y$Yk^W1}=I4x&D}fF$-O5i4KZQcLd+
zI4Ot-Zgk)qyRa|bk6^qlxR)w{G>`=j*6U}t@Wm$=F9;F><FwV#4!}BXe3|@asNO9P
z5MmX?xBTnP!NMkY#4S56sjRLqEidL`P#zlYn24R5P8h8up(7vZBzy?z)noCIXDvk6
zDEe>tP68DRD~l16e@us~<$zTNH|gQ2QiYktgYm-Ua<&qO!bo7}F;umi<{O<%t}Z>&
z^R3%*>d2XBPH=JU!;dobo7NX!t-vpKD2F;A)}5b9o6o}|Jyt35=iXgC<nTON2WRNy
zfwx|^4b#k3xXpRKqVYN+L^w$vV&GiK0N^kz_Lbz`W&x`{eQ6UBqi3_t9vzVQu+ewC
z{0n0rHIYKzb>=DI((b6x&6!T<roIY8YeTZt%RZJRv}G_4GDViC<LwVIf$Hb0VS=>b
z2l!g_4SBNHLQtlj^*5Qzz`!ruEfQ&hnQtCA6hP5dt%j2Llec=K7mrUcy|^9_|DZf+
z0%mc~tkJnDwpg~nExI=MwcZG?yZ=>7v39UsGs}w1sOCoD-HeFHT-c;<OE~tctlBIF
z2I2kPMVl@!i^_Jl;&h4H*nlVE6DhWYZQ;$W@Y7Eqxr>dJAxBJsr#W&);Kz|T2aMYq
zf}U;o#ysQcgxghRvbX60yb)4O{)HGg3+fRFrFvso&c-flax8H-e&KlC{fU#nT^*BB
z(uE;3@f1?0Y?ljD1|Fu^kZ}(>l+<b9yrg50pTp`q4A7Y6al~0j!;E-=^WJUy0o}l{
zN0`JtE*SYk!!KK&JhPZpQl=N2-dTbj+6CH{L6poDnIc~VXcBTWxKH!<i``~tuJEa3
zDNDlB1s=-0-H4M#7wrWj(o>FVhzHy9Mz}DboIcWex;sLZKH@|OwrQ-60e!U&hvCZp
zI-BX~4;d8wJa0Z~#ChRibfGBDP8RqSs*U}aLqCwdB%@2mW#s%pBqdv~5q&M5_#A_9
z3EJ7a!R9X9QwtK{#EuOCMM=Mc0T5F4wFi9jw7LYeRzqyLYVhkuf11wC)HyDouhoNw
z<a(%GKf+WSH`Is68U-(ReW8hl_+s;+XoF&FPf6rxHiKR=Ve)fX*ft^Xra%|ePe;$O
zFcijyMJfyI0Qv8!&&7$D+<1}hk_FDvR>ffR!9;qKNd!j?E|poq%$&;_fo7RK$ROh<
zq&i+%QB?P2#%fRkXhM;X@m#e?=3a<s6|CKBeI6s1!e2ZO^q2lokml-h!K5Bwz<6iJ
z*HT=l*w<I+1$<Ho4Vg~&SUBT3C>7|Qw&*@Xrr*hQJ*83!?oqcOR<-MP=Ne3aLS4sI
z&9z>`5ZWCbV8C|q(Z(3@?4tFLpIYDNA;G<79NL|_e0Os`976}5{%j)k8vNYd6MQ$m
z26|QFMGcU}W0AUp&36e9<@2Kt<>kC}%i)EK1-izOgtRg4iw;PcVQAUPMsn}FYT-(y
zvggIglc=WiRCZwYWaHZTb$3jn*AB&|1&$XN1^7~RVrD-4T(s>MPX-)kK$K-+t&Q}8
z@(sMNUSD$2p06iP1|g>?x{d2rkIX(Nn;$v-Ug@;V0+7=scyU&(4tDs<<Ll5ja%`$F
zpO%>36PO)DrbWT3qj9oY-Qc30D5&Gxy!i-2wP+I%n<Jn2qD*daMd#7V5rB*$Oc$^G
zGSa0uA7#aqRFzGJekLHOG+3GkVmqnf2)I{F0H@npqfARawWR9V>Ik}BKgDvU=z!(z
zppAU3{`XgVha=r6!>UXT_+_t;0%`5&O*#?;^>byiq1KxH)L}8l(rn?(`ds5!5us=A
zGGQ?$_~Na?gQ7*s6TACWq6Qkp)5bYYi>-s93M_{5sUa6JyBzE&pofKl#D>qUDPw@=
z<*=SPd~PgRyJ;85hMxJ%-ZAC5znEYk;bmnpUME~7R^iMeChMSQaZPQeRZ?u4k+iAe
z;?SB@jHaHa_Dz}0UWZ2HPsQL+q^o`{f-KI9rj@xV7A*^*Fy7l5GSuFvRc1lfa#wuT
z2c<L8`d-Erm1rfLY|5iAQa>?sFa#HARlS_^xKPk6cb3y>3_rjITApb}a&)yVM)Jad
zQ8qGj-b+zI3>~#}D0gijww!6g+f3Wl@3>5}O<Box8RA(KKPL0#uoMMZhVYG9D3Cw^
z*e%U^U-hNSvFDj7P;Sg?>Zmhj>}9QcWD{p;t-AUx;MtUINOU>Gw&7L8r<5?l=7G;b
z%0M=n`PbY2S0e)=yX+9FqE)T4aVjU!mF8~Ybzi~Q22`DSKn<u+({<fow$ZK`OQe6#
zYuENPnb+e(f2vT2&cOPcw<_!+ZX2v=uAA&DBrCjb16;f=oA;149TaIS{7HnHyVVyo
zKy^^Q@6)O`-9CH%01+^@POKb^%Bz1hVQaLSr=|XY4Wv!am#dT*1_i|*@i}zH$@FdH
z!rj)=_g2vAw#Ov_CCx}I1Y^rLHav=~_Y|l_6;^spRef{qfx^gpXkPGdFA7n~3djXv
z7<0<T44A5WMwFmug@I{;=ctek4Dq?eaz5RIonD3rer&pfb7~MdtVr4yg2uHM$NbhW
zqkJqn`ZfASM+{hl42@$?H=>Wv4vhN(?*NF7%-1ZX;8KFso{Qdr9tL_HY=AamMby2m
zr{)u)XC7clF+sTREMNs;B=NC7$LF3ehyOSkE>$CiNf97@yx9XuG^If!3i7)x-QV7F
zR}+H-DT`IMRG7!>=swE#FsNd(E|~XdN!()iD#ffhX_poFXx_Y^Ay#od3t!)69!>$A
z`(<m|ZI>ydrd~oMXt3nLRoJVr;8E8)<%=UH3avS9TzUzBU2Bbg8*y<eDEtD4Zfw!>
zSs`CgTWApX-Ae_d4klX`>x(M=Tji2Wr^ywk9;D*g?fBKb?~y>43UC4)`$l#*xH}-9
z`afkczzK*~UHy5u!i&Hqba$UzI#0aA@02;qe`;17iOBws`jZ6$Kt`>fkjB+{t?}(V
zLH2#odP0B8m+0<+aSA;bMzPC#9BA$qcuI1;ev|xqkO@%l{pa%-ka@EGN$4`aa4Ga@
zZx@TM&i6E_fFz!;LofIgH|p;^*Ab7X+srzCMJ_^O0w&N2$v}@dBDfElR>PP^b;9hi
zK}p}vq;(8CoW*fDMVpUh@b;xVV}XGO(OKD_kUYthN%fQO5KM5bdi7#YbtzNyE>3?Q
z0o58Kbru$M;=Giv3g7-E@##SQ#(l7!$t?gIo&{qhm6jS88&(~}y;QVkaFE9qkL;Qh
zeizUATx4DdK%nInW%}+QgK#7Yv^l_Tjb;8u#O(<7sSGKfq{aQ~bfh9)vV38=m8xJA
zC(4Wu9HZjp2wjD>HSOIcJSSjU{B|ZZr|Jz6UF;0QQhgnRiOhfD_JD3Hk&e`-2L<ej
zvwSDN`hMga6oaIBAgQa`HK=6pH|;lA3ebLgL5cSgUl}@RZl=V*N687-tO6NThVclv
zg9u8jRZ!w7R;fG}*OR@y<x}ob@}*_Q1JArumE7A)309*Skt8_Ptl;qn@4mjwwvMxI
zlycU=0#5whh&r1(sZJ&H?xfIkN<9c6p6(y<poy-MrBW6xZ9W7{o}z|I-WbL{uF2O_
zdP{lYy{mqqF(ETaM8Y_hPCfu)3<VZYV>#cJdFP^Xji}&=TdKz94OY3+Zi}g9ct!6`
zQ<$Sg<?T_DnDk&X#@#<h2Y^R$mEZe%2b5}33UedREJBkwni4N>rq`4aerNBVmrxFh
z%&<h4!tf}VRj!MS?k3j4xpYo_=k|pL6VPe;F`!@#n)_hicWyp5t%GiI#dn;#VHn>d
zdloLv+PmtF!1l|xk(;|r`ev9I#L2N5ZLQ>Nb}97?`-5aCPzsN1cbGX?wY~{+fUi@K
z8M74k+XvR?9~R$wcrPoz)gvVl{#Q}^f%OCV#GCr1G63#LAB_~WO63TbU9G7sj*wjt
zO4>%noCxBGhSYqs*K35jB|NB&|HjoA-?Cn<p2x%8$iG0quNqMYa8+zll8IQsOMBAH
z(F)m7Md-;eS0-ryskKgQ46wiyhEQd&hJ+$%XkUOeD;DD$jm~nP%C(_jMSTpxfCoQ^
z<!C{ulp7j+1M*3OA$?GGDvZk)q&`b<%68SG(8DK1c2b7a^O!^SqJgA!wIm_K^OG-N
zo#)mOx88+h-~&#qWKX$r;1JJvEJu)CMLeixe_HJPeYq@o;2%4VLHgraK{Hexn_s2j
zPh%}NSW0IR4)L&^Z#_1!LW2{`<ybbM`t+OPnAy-Go@wrN(w$mpQ@`_V>GJU%^Dd*C
z>2jH1NRITrMaa%ZnnXY)UNbE=ty~di=k^+_Jc)8*VXZqrmOP@LU!glG?SJd90J$;U
z&H!)JPGw5gw$|c{bq(TVrwFNsS@?LtG8|IGAOFTzhX}A9J4==kq9lG27%mpzdhg^e
zkreP~A*5Vba2`=Zd<X1eAqi^T`%?B5fEe&gTAAfzFJ`lDT+K3Be5BkLQZ0O|{hkIU
za8J{=18Lv;8d)+%;A8W-?(6u8xIu$TYS1qR$UQVFS@P$9SW8;;wg`fo=guG8!VOiY
zD3cWS!gJ4xJ>AQ_y%nxOZFRRWAx6c~XjG0WY^)8@?HJ2&dA~st{!@jZ`|5?y_LuEF
zVy&ocOqyZnu@x(62Y%V~7FD(1FmNa;c!x`v|1}GMRDu8r*TEEJNu*!r&3|^IDV|;6
z!iCsB{FI@rxT@W?DdO^XN%!J`Nee!18_bfj&O#UGNKrIOdMJj1nK8@=Xd#^Jj$u!g
z%JeSZ;~zUfbFH6zBbJ_sLC9!`N1!b_EWE_yAnN>x#74zUT}7eymNT19_|Ki#u8bam
zZ10}L>84FeFg<^T>XHtaiwh_siS7nNL;5vlWO=yU=VPvMpqS{D!y9l#*-uDS{I_om
zgABV(UU}Z93+_sk)HlMCf3Vb-uQ&m(!hZl$Y2~3Exd+b#9PO6ZV363-MtWKMPgH=o
z(8FjVh}l7;)v1WWozoNRPJ0nHaR5B#`qb-3_d%UTwj#O!v`y7Azm{iyf&r*yJ*Y()
zQr2E=08J9A0%0+NRc!ExrR$T3kWq%2nBf6Q0e!M}<%VB}@S8WpVyx!f8h3ZKQOLJ}
z#hooVwE{-iYH&#-x0IijV?1nTVM606d{4p&xRp+4e9gZ{#*2gFZQIfvkXlidUJ>6{
zDFz`qg7|DRFx64?VO5()vjql=&#7Tiw3LpqgUKxnw0uk?KyH*mpTCb%z{#X3WpK$9
z1nT8rLp{?dnNNO0$%oRs_5qYJh2<wPTcJVC8%SGa2#T)q1y%X%_T2i&?Z!)sD7OMT
z_M-ysO~Xs-9Wo)>iva+owGK`mnHwvL4D^uzSr#;Y2-E!n;8BXR{tADXCop^kS!;`-
zw}yV>r~QK^ztH0Z;HW$!%*RXhZ|e542nyKM67{#IM{jt8{xV1VMcFs5J<;ZD{SnaA
z5MSNsM3#T{SJB>>O5=rf^gkX(x^kkO;cgHhzSB$_`Tc=%I8Ma#{m=pPNxI9pur?rV
zj$INP>~pugSC6CpD;9{KWA&Nmo^pAzEPHm?rWwncKbpNIU}j!42J5A-Z~_ULxH&FU
zHJHNtkS?h~j?}M@x<PW3zukE6kH~wZ&G>N~@t7nab6c!g?3#Za%~m{(Gme`G%S@^@
zblw8OeSuq+)PFLZ-fAT5j0|=Fyi0W^B#1&DZUtimd3_)Ico^Dz?z{cQS5AUriC7#)
z5O<_Eo4Pka5&Pw^E+!d2!wayZoGzV{!_Jd5kOt=+kLH?t@3fk4Ko|kF*sf>x)S!RG
zRG$b6y221ZKYh|S5tCjCgqD3ER79J%lipZ!<PLetBU8GKbyYgkKsz5>qK@l(yN|gU
z_a6bRN8!6q_-{4}J!VI}t4Uy8aGUI%%Y3NVC@?HxkJR($w90&V<62LeNy}B0&k>}O
zzdypp3%$COO;V5@8^jE}&?rRgyh}qRNLu+<3=^g}xQkc0ur|0dfZegp<#Y<T#pm;S
z?LOE6@ITZM+#4F~?EfFpx_EV5>Fjxf|HrfrsG?b>@E`f`w(cZ2Wv0kCSrj?0*KlG@
zuH(Vb*N*CuLN|R2XmgWFsXmvgRe{NQ<i^241Xpjn6b>aPc}eOG5YYM@X*jQbd=_Rf
zz>n1ta#xBvqf=>%usOvl#&ca<$Fa_(y>yTGG2q<Sz!<?k{m`!$<_7qLiu(u~;>K2)
z&$1|>?`k5#&q%WH#k-Ak2`XFNIG6_;yLbtN09WmvqGKQ9bGL*$a?6{Ys689NrpaYV
zY}pW=cw(bP?{c~E7(kYnaQ74H;61u^o71bsnigSc3f4pOM`pCth+ga+v48R(1|ktF
zy0Hk5bz^<~%e}-;Yc1e4FLi_peO^!owG|3VXb@?#iD63|UXEV|PlSZ9f4rD?l|R&6
zgN6MAph``cMjSK9AX!gA7x$m$V6iax!bp~GZt*ah4WQN)hCDThOM7qVE|;H51PrTq
zfZz@zQTyXPfv~&rwP|JB6Cjk{J8|>o1B+{#m%p&ZC%>5=t!e*(k7JReGQ!sP?*AS~
zZj?6syX>ix;9Xw8{I>vxN1QfAyO2yS>p=Y>vnzC$eo~W-d!_Y+G@x)&)W*jlxlAS!
z)|92&R^ld6^m~Ce&iec9qK#1lFadnWeL1p3NAoy3Gx>*)ha;8iOWFt~28~LDEf7TA
zis+i`XcG(OZ49D8!N|N`bt_f7gSMaf#d?U&qBr~*wHS(E7A6!bebwi=<>Zh3N<r%9
zIw1?)D0ei0YQqaOeV%reyGw)xIqSFi&`KP{MkGJ)`4nFZD_`8oeeAzmlu|+nle&XM
z26pa#XXnD>_tn^F^Ow<Bh<bp81rT!s`8RkgZ>Jk?Xt9gnT)bby$U(Z)Ip)$^ks0Q1
zP{`{h#ipNYZsFfS!swtbodHlb@euK?0cLP7O+3cgyO=9qY}Y4g8Fo!EBK<bNB`-0c
zlyPY}KMBW(NZ4w4EH!ehg&+_zLYBJb{sRI3&;Q;{k_aS0BTJBTkn=bf0cb}k!T*1>
z12Yv&yO*hk9(Jx10UzEmKCWBCEKPHe9ty>7c?0CTxQX(=>H|c2Mhk~r;(d8luORX0
z5<hOaEdGS37*Sr7RI7I-{Y2Cn^$vc|gi8o6ae=QIIQZ4f1sUh1`0i=y+ILj^)xcd1
zcKoPG@ydo~{`s|rEVV$PrQ_SC-Aj82?*$`Wu!i8lA2#P0k++T|o=EB>Q_UjGcV$G6
z-beT16>1%_D$UlziU0QyaHF2-uR?YIr_4jI(c2z8NO-HEL39Wb%US%?JQ;)OIJW8Q
zjzVSkbuIL$!zPw&7tY8g^W8G@FK$83M@2Y_6;k%6@}^uisa`}05{ww$(9E*PwYykP
ze1jv2b0XR+(@;7V*}la`8XJ#pR8B|9>>y$Y!T-z{vHf*)0wvl&&dG5kB%}3NE#6mU
z(!_Yg(5>L)d6x2Z$`&X=$v2tQQbQj$Y}hRszhD?eWp7upVC0=1W-XR+b8R#UkxTC~
z4KBy`8Q)ye-N+01y9~dc1Fhl{0Eqo4)lQCv<YZ6FG)UhbBbwg=*!v0j;<;vj0y-u9
z>9A10(`}3r3~k2RkUf4?7|FUZr#AN=>G=SbJAb5wE-pBBE(%uzS3nsHfp;QIklINP
zDlu>SU~zTK$uH|g2(?N8`)aq#X&so3sGFfeA)dz!36L;lfGBI<IGJ+8Z{I95`S;gf
zP>7N4Wn_f;?Q3#2aPPjtEko>__q5+P=l$SNMe@#Z`0U@j!L8c^A>SVv`a5Zuq(i}(
zUSj`%V;9FMeFren#wfDsiHE8#2?UeR^H3tJfjR&lQmjm@KVtL7Wb-IKu`vNs<@W*R
zXbM|`6|*q@NM*6$ddG}`$IG<NWFN2q+0Qr)>KQwBj7ROIU`l7GJi6hQ(ys};X*}_-
zW0TSIga}=I$P?V4FiFz<1yA6t_iNpfRQW@vYBkad3dnduNj!N4inyTZK-g&inQ47g
zDqw~faN;tX#SCFSO|A@$dOV+NIx2@t+{JQhfzK0}Ab2mu8MlTr9?`P*Rcz<tW3jYz
z`}#Tf8WUz7C-Ib1r|&Bu>JT9bNmWe}NgR;4n3&7CI<!W*c6Anhg1(^-5^2a1>@+9?
zv+UnxJpa?tAU}Dnj`>(a(q2<p-9417vO0?Fp|mT9xIQ%4d*!ZVKm{-c4AmBx#7Bqw
z>K&m7dTSER^F^P=FFl;?_{Lw&pJ%^2C5))sb_Vd9qh%U`FZmbM-g8ZAoH7t8cpDu6
zK`Xz23`pnODj|9D4WpMxvYI3x`cWk>*yLb1=QbYfg_Oc+UMhw0lSVsqgG%#OBiDw-
z(ruY@!zOYh#GUl6)L?N8(Kp_o>A3xKzpB(pGXsN$cDt%l7CnaYR1-Yz2_6U{4O?cC
zl>hX(%W+6#VB*f&Sq^pT(LxAVnA9PvD-MN<AdA5S*q%L75<mLL5L)Z~cmh@oMgeW^
zm=mq3|6l>XEZ=KVM~)d1oxY)5UDLQ&Q-{DoxDr@SEQiBf4Ww*6?8t~wr5@y}1%OF!
zWb?Av7LgOv|8y$9f09RxcE5nGwy06l>};v&@wb0v&t~&bAB^4&cu;D$kyxqEe<Z(i
z^u)rz;vN3~IdR5nAPE#1n03gW)>RBA(^ZDh^_>jU*u^zz1^rq5lQ6!W7}gmpL8J8>
z%!lCx5+?mmm=9B#m%5MS0y1ofam;KNafSEu?;2uC2V3sew*e?$=>Hn!yT2Ti>a6}#
z?08hdNB3sUiI$I63=UKpC`8n4t%U(ZzDx)Az}xQ8P^I_X;93x=)0iAAk=wS2F5>;X
zFaYM(Yl#3FcR|WGpNq6GwRmsDx*SsHQv&>qJG1r8!h*lMkAB+%ebl=^Z=Ke7|Cp)t
zQL?mOVM4_bq6AiGV3B!+fnw|k<ZAHePhk50yIf6I^S4KvGDJZclSaw4O7pqqaj&p9
zGOak+`M)uv*?L=3T?VQ3Fvts&POX`>CEdkQiwGO7QtQ>JpN|p(R<=jeCiLn0+nOYt
zrTMk&sN3HPWnF0vzODnB`m^3(Hiu@#n3pY6<w+t$w6G|(dkW2ZMZ~0phr`knw0$%n
zKR{#9$Sr{`S$VaVX;t;euXXxo5T+=$Ckf)iX`$L0sK{~^miFLDej4B<v?goULb?O&
z$DnuAv8CV7FY||>`q<xLL>gh}Za!Vg!6A*@N=(;aajidc*V#SI;cHXu-cOy4?K2Hx
z{*a{7a0!tz(HB>MOO;TIM>GGnqW=(9-$@{kx!@8>K*t;(0L&c-3g)}2&l`5CBUIE>
zEMrj5R#WUuRti+l=d>|^TmG7sJBP_86-AJE-Lq@hzfI<TT}{%koJ=B$c%+LOv1TkE
z4G52Yq*G;cx7<p=;#VGcl=ot7>HsKr%@jsI0&>uT7kRVP2$V~5oHp!}hHj`$jc)e0
zkr^@usCO~E>wCh02ea?<&!K<F01BLyJ!vTPpvIVgV|#k*Hx6;m*Sc<5jKKVW52mjY
z4Vi01r{~>Bjh@Y5IE-`I+Nadnv9eJLQ8)7s#*?rGh?pZ@emGtd3Rw$S^G~?+2r<Os
z7}v<Wo-%{jWcysWD#8v-f0&MRhONh;02uxrGSFBN1#6Q5tUzaeLPG_+8`O$#o|zDy
z_PtY>Ea=0AMi#c@gUc-q983wO%3da%izsJq^vg(1v=J=8krh@o4}Qa!2aZDDlo+x$
z$P=gy0)FS15&0j<=aR}jb09-bV7KqllK`-lsj?&p2qf6N3n!B(=sFHkGsg@h#4@~p
zn$j68H={UtV%2iXBv5vb&wT%oJ>6_Cki%2jw^_;+Nt(lu^`W77|7AMRO?n`K>mSUD
z$q7vPy2rqkp2=lmL;HpII^cdB@l=W(4IPkVQ%nR#`24Uk)>ry9TOX`G8@HO~w!@A=
zQ`>?~<{K{n^?XIjrI$rk#z~8VLi3G52O!SI=XClI9*+7}{OUHYMKH9_##yh$BNk_b
zmU~ayLWPh}2P9+|5J@9?N0-;quFf>pOCPwmTCj<$Tbj5_9xI4h#BG}agWBD14(G?p
zPXXvhsR%NdyDoi@R>_zF2&X52NBz^*j@K45&~I8u>;v3Ka`2t)8ka};TPOGygyHG*
zf|rey)O+0fk9%#r&y#bh4XYus-?2uX>m#jZeJkaT^GFPqN<~J^jIiKp^O*$Dy7FY3
zY81b&b`ZUW9$&ExFAMtyQ4s(JrKd9kb1hv^*>#(B?%>}iCrPy=&mAezi^6QS^sdY`
z^rs*RSn_5^w`hk~UBQlaxKP^|Vz)D!IJJw&gaF{-p1yE(a_my{q)1KdZ6B5*Q?wiq
z+Q_vrY(`AqVZgm!`WyRpXdrnDItuH*d5g}W)R)1+-ov~9N9v+>&{dLicvuW~2&vnK
z0E)QX==4J@0$JNQhgluM^34AWFsG%C*?qC`*~=UTlo$d9-pYj{$VBeJu{w0!%ND`n
zr8;SZ6VUUFplG*-dNyJp_%YEGFt(vDN<eRSmEZ0PwGLL&@KqeAlH8z0vBu}<aQX!W
z{WD%zlm;9A1|8-l?sN*3q<xlSDIr=61tN7IhghQao~&@_?GMM(DaL4ROWpZ&r&Zt`
zAHQ_T9|ga>3|kchzNHAl+lRjHoPKctZDR&(H8n#qk8sO*2#@ZF1JhcvpNHTnE)^80
zI*vx&9-^<J6o2>mi|dOXm(x#Cm;o5|#cw3bC_*zo!Q5QYz`VwG6yC2?2&{Kf)b)SL
z8?a!HYZDW-Kb_J1Q_#uRFv&1!8RAIZcH7MVL?_64uE@`?v*_Aho#9=r1;3?_R{lrY
z=Izb2O|^6q`CmyJLUw6{tjOEvUVri@jXX*+1FJX(<{X*(lB638^*u7ERbb4d82;sY
z02lczp4RWg8a_K7WF5B;let2@Lv(Q6xa5@17Gcdz>)m7I@vigg>+EqAia7K^)%|{o
zQrd@nG$Ffdz|~XXUF~uBNM91K{X$CVw5~Eqq+E13d7ljHk?b9MEuvmze}mJHl!||D
z_qgE?mU)owfS)9Qk;`>oO#BZ5B@m#~czU;b$mw1$xaV35bltF1RZmQ6Me++`*DxDp
zh!fDEis{;s*IOKsIs!MTX)D?;C@g&gZQSf8^jS!|l&UE<7$PUvOR>jHDd^H!#}`MB
z2)B}@LUJrZD|JkoOp*Zqu0aL`5g&+*_~axo1&iRa06RcgwB7|)0Dq=m(@;lN(zt1<
z>u2^3jiZ+w^o(*l8t~R;U61!}Z)uumJfN<Dw$+_OzLW62Yo&vxYg>cgfBg8d7Z@mR
zGR&ZSCY;b=_rE%O%cwZlWm_0&+!`m)SP1S33GNVrli+T_-QC?oNN|VX8X!2NaS4*(
zZo#2xoS^q*t-aT`zdP<d=Zwp*mjMHs=BcOVteQ1T=7ZLUxSq<Al1WS`@{(+Ruu&uP
z4P)NK3ez(13*S@)uS(tQ3sGCcuqHUG@esP7uFBYn=3qh-mz$`$NF=5~9pUGdOcjz4
zMDi+&@uw7x>s;gz3Vn;KZJ*m~;k^CAkn^YffXHauC8*X~6+%)*-Su}tRQp-1_#@aH
zL5?w_ost@BDC|;PLO2lpo500HL(wS#Otef66%K7I)e)L`ddJ<!o(fbXvCN=^A*;o9
zZn<^U<l}#Cdq7?O{eJ(!;7r^G(ErsMYVi4C3{#ZElj@pP%=mxfZa}zygQb}!2x<V+
zT)LHOi-xr5Rrp-kEnb1TKV5E{j!)+I9kh@{;;7;G6y79B;y}VB!?!XHN_39=0T??`
z`R?Ek(0w(}8a(6Gr2!u!6X5B5a1b;f2$uGK{1f%<^ukuTb!hpvTClnhb4h8`f~3&^
zjcwd{IXIRlX%1*|Jn`LUhqZILY$<r{<V7s;aEox+9R}W2WW|v#(me-V6=ylM94uNf
zGJc^SP9CfbL7ORzNTY)tHa;wAD@!f<su$v8l{{JF00Rm&;?KZgSQV2>j-<KLo$)}F
z);+@}%>PR*uzX(dGA*tWe1Jaq0(d=h2U?8R(CS(+Jc#fg;`pU+x=Nykm~B*%(Fr8$
z(8*2yEw@Gs^Ze9M#mIlxBgktM{trNXll8q1=c{qZeVG9#1#iV?V9a1A!S9+>_FNQT
z9&?`56J}dCls_$Hb06obnmUfSW@P?5Lid6D5$8fG!4SWo7}Dk%alqTbV8tEQmgKrS
zKjmQvn6@yDr1Q8{`vG&fFt3Bb1W|<~48jigjOXgKvmo2)iqeDHZK`(--VMGNbEIGW
z?*#06<$P@`@@LOZuLO7~{W8XQviTU^y5t)6oZeARY?!nq_(}5ts607}^bSr(;zFn2
zDgn2w1ZT$4eZho+-vJsr>x`EURhL~bZ_bLuF_Am9X-&=j;7>H6165N{gnbKq3WP^h
zU_Ilxfb7MhDW1jTqSxtWRi30D9rhFFhz0*%V$JEy8~Ru&)dqX5F<I#_%wRMe=Y{9*
zXvub;vOH>!Trc0wl;2Qj($3<87}F63e-|j$b3EMPRe@uN(zrFcZ!{2I`=GLwED#6S
ziT=Xd?=2xWOwrNPW001nPrN})vHE8s##&hnrE7m$eefFaoR={_T^bGnlpVT{vQiT5
zzW*GD`{y6|pARJ-e?j00;$Z!?XE5+i-6XKvK(}Q&GEB45fF2obnSkbdEc#{ahcPw5
z1{A2NVZaixrNFgf)^HkX_o~I9iPeV*ls}2?2x6R%wS@T>`RybmRy0yTG9a=ABH^bF
z?JPv;nj4X3()IJ0R*oHA_u-0aDL8hHi^Lyh>sn+K)ZT7T9nga>Ge8?~6;c;^q|Wv*
zTaaMP58KXdtI!i=eCt$2hkg-Wx>haO{mt}MZ22)=@M=&KxgqUrGl71<Ra7O$Qkt~~
zfiCS;h||XJ23rmE@b3`3zQ<CyXD*_0`jxdNE!j=nv%g5f77|xm9|;MujoX!T`<;Ri
z@e9rBq`h++%2s2^2H21A^lYAgY7eDgrVkR#Y;3=xZ|JWnb@#L^GBHDDDzr;i>eTnv
zeIO)>K&|Exh?YJoV2I@o{x1eB|NKDUK`u8B^RXSEjl$F5TtU|pw^JNTLn_fXSy`^?
z`rfe#s<gY%4_M}?iNkXdd3~x1a_j(2pbg-(lG#8P>p0?{XLpnStc%w0u^wZm3>5B2
zO^=mt{y(Odh}q@-_YL&JIZ^)WnQ9q0)+mT1ZOS!}i||RevZWhaSD|U5?)Tu<hmO`v
z$J=A2YGu&}Jp)geSFEF5#w)wu(X1REca~v5>R5f26-pPCoTBL|HSnYq4EbPY^x~IH
z1n|}ZfcBh(8Cco;+7}*#84P$qTq<*l<!1jd;W!J)NqL2;5a+o4$-h_**fWzk^%tHL
zRL?cNG0sEeW#cG+`EH?0sv}$)kowI^s1j?1$!!4+kE+cz-XW!!W55yqyXHot3i?aR
zTmS2B^yNyU%}mt~HP1ePKSw@VR$^mk|7Qd2pC-Wn??LS8;}w&6j0we{xfGtOmZ-ty
zYIzO;Z;2b1-sfhZH6e9et~^xV?yoq=nMsG;uHm5##%H;IEK;P9pGt3d?g7*LBY~1c
z$f$%#WO=dkQ!<^$>fpx(u>E;(y|=S(s`~kE{fY_JpKd6c-0-wrq4a4HU<wxZBkME<
zP|T?UZ95lj;Cec0(wc+(cJ6~Mnpw<w?^kB3`<?t`{Q7?P9Wy6uQivN4u-Dpcrp9p%
z$!mYa1F#BC6JR0F({0S!%tgja-eS+NF&oBt?yxNM=epeCw~M~Rnb?CR)+jK3{(i*|
z=(z)Wy%Am;+As9<Uw!{zrWOAHrZ@v2?mHPjG&D4Zj3cO?F4%X5benIMO+DY<o_lU}
zBK60*ix-$}pOHH)Qq1BqR7#~W?E~!CX}DTCb?qBIYkU{hnz!v}1}1af%(11+)deJ%
zsxk~Wt|(0Mz1(+3NyQiaj0ugJ{<`9SBWt>dmE+6Od4FxA=aF=g?9B-QsLro4Hyf+v
z{4_QG%Pz>a!Ijie9!opv!RF!OmzcU0hSh#*zk>shTA27HtTUzka#=q8TO?eYFCfVG
za_RDfdI_1ZN7-{p_UQQDA`|xeVp{NMV8NliavMMIUMb7tBd}FtM^AS++vi~IjJq>U
zI8OM7pP<>$ryY^i{H&(UM!N+KT+stZtC@~=e|vJ~f-leai_=b;{ZY-wve_FS?v5gf
zfIFmxGA1TwGcW}ALzSS%luu2w>YdMWTk~_9t+An<0B_OzqS^}3BquX7Fy|vERZR?R
z(242swO8z<bl)k-$;$e&5uXLP^u7LSw2YL-?GmnV<t)*4!~abJ&Q}S(wf=|+ee^fI
z2xvWQOeq?9dh^Y9&N=NKaL9%E91RW;v+AMp?bfR@&e^vfW=>V;w`wf=Z0qZNwRLSr
zqrOFBE@$$9T^w)p4?BcMoD1<ZLoWKe3%g$}$kuHszCSN}c`}?i_uTIq`_E1Rp8A>2
zp}!uyw${$rDe-L9LlhX*TPl<uCK2dG1y)SP-|`*Ga0}hf*A@G4N~1tE=B-+_IFY_T
z%H3O_<9ensazphd#!}dAReQYJ+iI-!0zdyrAOmDU1eF7Z@0NR_G~27>%26JQM8l=-
zyK?Q0k+J4qB!iF>#e^RVxxy<(90~u9-+wCS|JwtN%U=b?`XA_vPrJ%?u(TJ@wtJA+
z&M?3FHApx%R_SLA7fHayfUG>^<PuAB#ZEjuqKR*uBhudR^}X%kpk*O&Wl0$LuJxv)
zqK`bax2^b_z4z~-RLEoOSgj-}Ps{b`=Ob3u;jrZ1TxK{72B>GYIfe8k;9gF=5SSU;
z321TMYbqez{X=S?LJRZdzges+tS|EZ@-i%zjQbr!d0?H^L-UQxD8KHvd29LBm<{E0
z9_?)Z>nD}o&9pReabIujTZd%Zl`wysA&sa(ci{aw<D{21Jn?tyA}tkwt({oB(8-(P
z=z2p5m+i3>bC&dq$-UYwuHe6N;t>-ot9su4lV5p~Xr04K3zq<{!B>v|<hH+F?tKkd
zoY;G)sbCnJ#kQNlN2<mb@xwccE+u}P2X{&Ef2nRJeR^48_;IuyUd_7+I7NGas&*zG
zD(+$aqL;TWEZ%prqx?q@Kv~S);(720PV&&G)oN@1FebOl*q*PDo^{-xO(-wnhB&m+
z!>ODFcLxh)3D2{=<;D=05~p-EW|ogWsj4|r-11-Tl~+UFGH=PM(R!xndzAk9L6X<n
zU$s(W@Y>p6m9gA%?po-j-Lisx)4g}`!`{nsvz;stK+2m#d$?c+i^AVe9h<cXPnuH(
zRp5VGao#ubSONTh<7xPcawtl~;`z5Ye@TXIM8&^}4e)L`C=WPZoi$BxTcDb3f1DBq
ztc5DoJ^eO`HJe5fgia!Fue$L7kB#{IVZ-+icbAvIl(T$*E(hLHKquhgCad6b(1Q6M
z2(+XZ*OxP$U@-nrpR219&I&!twf#y})`koSAVqSWTTa_*CsXBHyZhIc%H1YDDzto~
z9?yTSI2wMxY)CvO*}smi7pM`*H5=L6tiU`Nj*k0R2LIrNRHWmm9d`fl<vxI%6~!W(
zlkOwXn{Gq<PwT1w^D~X~UnSjrOep@H`X^^##3&xD9QMucjs>*Q(z#R;+@Xbk1h}E<
zaT~h+x~gMTR}pj@n&kUqYTK}O%!2OkcCcSH`eSD#o*zawSM1}VEJmln#_{N}YcX5X
z|GR&8Vq?A?2cO2`Omu`ea`cZ`6`eU7mmX4l!}Zw0ir<W%^YqH-Cz6qLl(T4_&f6hY
z9m+G)6_Ll4(^-419i)|gfPHGi`aZbQzimj9_d3NietIbXMyG(FRq1aWcOVr<Gr@Gj
z!paH^B5@`$d^QNGm~+U8!KYvL9$syVx@7^$Sjx0^UDkcey?RLu>c0?#U74O6T>0^&
zW}_@&;fX$1FyCo6>dPnq3>}(ogncd`m3&Jac{B^Lf3#Rv?l*c#e^`y=T}GTRF|#M?
z+DAohN8tFVl|x@2HA5SVSkSYd(Y=m8Thbgu6C+hAF<F)8XjcQQ8d0MP-xmNjRX5%R
z8Z&nx(E|^hU&zKp1mzeMu2@?9>E{)W9`<cO(5>JV;dRp6xPS-w`%~CMqX&bLwuTjT
z=NzfHqip3L9=V^gs>SJj^}QrBJnVI~RbuSp=CAGgoJ|c;#7ADf%u0W!dOO6XGTc6y
z{_e%hYf)7fc4;YTaWP|<OZK+N*og>DF8@l8Uz_h($K9xx!Rq=0psRmp=8nD`8Q;XO
zgbVf5l)<LX)63RJttEzBAA^7RySz%a<{hA1%AJ_#-$=7T+7V_N@W)$8Dill0Mpj)c
zR;H%EAU<-c{mH$~owsJRlXDNs8_}ILcN<CmY#4S{kKxF%!iG6LzqIs?9a}1~@$Qc^
zWiL}{hh)tkjOTXWPu|ZBTZym~`;M4++=9a*QZ9l**SlQUP^+H2hV_C{5eSWt6mt7O
zg-o-eS{IxgEP>^k`l4`+4QMkRVaX;)3#>QHiQtff!G*~1{a@c6_<#PSL?CFM1)T&J
znoh^I`||CFsE48B9B{nsG36#}tZZY^Io+PS*Nm7eIz!`Bx&UZm_KT*x@nuzejm-?l
zF4aQAFd>+LKw`>~fKszqDXr|}6IV=3B`y?!ifLV5az=~b2L|_I=A6qan}EHyXOraV
z*2vnfMRs`j`F?jiWvkK8^<F+US+VmcZ}4OY_q^&PYsw^Qx2yDhj215JcE0VR`Z*q;
zLgzWhN^yE6)UI&^va?0}$OYUEK!*#BUs#x$T=Cz1e20UWXFy0kj}(p_rFJN_US9ox
zv0}f3`-h3lc8-O}`y6KGR4MGV{!Ag`mA+uWgjd8j>@eCy{N&n;gE?fI@!DqiFZw3o
z-|joNZ!Aa|O%=hJ^vpl~z{hZWrf)pWR7axlfEwG~=L3R1Bzu#k$V)!1b&*bCJAcZn
z@2%2SICe%za66~a<L{0Y;79|fO3Lzei(zwh=G}8`LatQjp<5oy7-MJqXgCy+tu=&z
z;j~|fs67`!a}r&>m#j&SVCMoxb93`f)dCfj6r(m~mmMF207;czvxM|atfZu*I3Ie<
zsntYFgZ0C4zefLj5~FgLu}p+cOU>&=(kx5r=gsTUmw`Ar4uRF3_pe3h0Dr{@dnTU7
zR!WLsqXz6YQd%zGSuS;&>;=4^?H=2sOP0$zsI(r7h#{zWQZiNnbFcX(8G7gkE-Cla
zNKv4_!3t(iMS^^;QD^EM9z-k`OSoNqYv}6l5B1BU!2Nwv{j|!iDH;o`XrvLVnYI-(
zqgm_4+1{8`Ucd2&wOBQMF<U*3l078a0MCK)VuIV~@crrPkTDJavg^>WFi9UFQ~VyC
zzPPxLJ{mX*QB6IbB@{G^^N1Zw_w4W43621C7+lfnaVV!fAR0imY*>R358+43HZX8p
zX}|2M8xtvq?R8!}U@fOzezWEza6>|(c_lJ^0u5I!c3DeOPKL_*ZaLhH*g3BFb*7l6
z34WBU(Ri&~^D`ei$vnqBMaaa>m1z0~XpI{?lT2?pAyelFoIK%Z*F*TCsTKG>lcf0X
z=nBMG6hbn{?pWQVh+HxKEdKLL-HAm^2Cv{)56HhAh_KszVcq2?kAe7qiL8Hr#W4h9
zQbQc>CJ55pfOK`UIH4Cg*>(xhj=yNVjyB)M;`koB`ywxQHJ{^mw**mk9Qg}!d-0$m
zbcr554i=q>%RvHPabaC&=X__f<+dl3!7kVlt1I8EF*rMK2^zvZ?vFVR78(s*Uz~-e
z+Am#mXmfz#<Sa^Xj#5dH(<y_c4bbUU(uMKjsRX0>?NIStzbPomB5>ky{*($+x0&v0
zX|UmTsCYjxjvixb=_~P6uLD@?5!HTueO2ZJcwIaT`%#8KxV*d!2M~osfi8L3dIi0_
z(aptCeOm{#un+`4ozml#4g-?}v|&pZze0FiZF&~)Er)<nPTX;tK)%)Is1+@nnoDe?
zkzBghMzcEksfd@+wMgsbPTpc%n2oiBFTtnJ`n~?-Xp9j?FD;1)l<uqqD|H%zBO_C$
zm>fD!aS!@i#m<RV!k#YP-CX2hS*7i|!rK&ap(fxpw%dy~kJX3}H1@+#I=5mpfif@i
zk?gpxC2DR5^i!+O*9s%MB7sEk3+WVX%!2;dpC9X0%5r^CoE%lSdU~W(ZJs=AEP1Tm
zw69Q1Y}CW9EOKwo14sl`y;R3R&{k&Fg?`2!*0mbG?&F;^J+=28#hXm4XJMg*o^D5V
zqJu$-8NBO!^Y_7yinX;nspV+Lw%hMxUS-ru+4i8DD4J_-PhBlmXg3U51~S)4!WmrA
zN5AodX3913@(XZKyDEL=C#@W>C#{D0;xc%GG#><z+JxKHy`1GRiB{1tq`>C|1_An0
z?Ajkufc>h#WFKjma|y6VT}oQ|Euun(2u?h;V7M1AIyQFb)s?5Z$Jq{kD!&VZwT<J7
z>n$0t-MoTG|0EY39r9@Ap!(R-DwI<kC=-;BE9LMb6TWy6`cC_El+=Xz$m(a&_WWhK
z@*}YAlTlh#Xs?Uc*B^(LWb<5``lcSr)I<k9-ReSh>%-gn6pk4GoOs6x^vIkSy)&D?
zK1%#qxxQm(-<UUCDW&fR0%A1*!7VsLt24xc<-ZG$f90omkaaoDtRwm>P~;FT8L>qd
zbLuAxH6?`doBahxS9JTB(e$U2leAYBM4O5^BHcfw&!I|LxehDEmR`A0?_<;rp0T*2
zbD%LJy~GGE&fB@_Io_DR*ko!lW!8FyW3@`F5MMh-tA&ousGN!PXZz%{Q34kp8C)ht
z-a<ozB-+Izm0|KDyY9Epfj5#h0+ch}kQupQe2yxhW%KqfG~?(NaLM)h#s5yP)4-4D
zS-iTP^8MKhg|z1=%7%guf)Wy|oB@C8${uznnNv^thz7fEhu^f|MKQrDHX=B($U<p6
zkJs6zG@reWhhQ`=%}XU?r2LXiV$j}Wrh{atzDxR~;<{cq_=`4ePgOPPv*TM#!7NDd
zrdQPG-Jlb);(UtwgvNvlmAmt64JO=#ST0CnaX!si&mbYkHhs{<EC}H=Q4%M@=&)@?
zta!I>@?Ed^j=v2_E61M|`Wn0a#<GqwjJ2JG#%fuxkPa!RoI;$p;N)@P^>}mLT5PM+
z2Ezb8ZVN7SYzz<OVz8_a24;h_Mx-qUZI5PQq2WSQ4o9MZRXNP0i@<~={<80>VkLQs
zF7NCf_;&gBPmKjBW<pdWv%6%T^L*&>5Qb)x1tTNF?il+kqV4Qg23f6(IYb}|y=#%X
z`d(V??7`&9t<5sP@`)<&{_dvyHXMh-Xfv9aMU+JJ6OCS>G?-&$qG;X46ie7g7$ZUS
zqKS>YO%ENTHXH$X$;G*+1zBcU;LnVV^aaBPd3GRn!S$(5i8^ydGxN=%&o#z(-U=xp
zg8t()eiG@<FG#3gljVHGOyMy2c<%loL`6tJ38oQYG>K=5=W$zY(zCULps>kH)3^Jc
zhH*9eB!97=7ol+jwKr^Ar7&T1e1_QZ7-B6ZCiDUF@3gRLXy|l_1iTUZj5`E+p3Dh}
z0LXGgMz5i{LKXW>`|of2FOXNzym;<6%wUHm$(nJMv~#gf{d_`g1QA9_Dyrx$JZtQj
z?`ju0*7Z3+9@kA@DU_JMj%2K0RHsVSOsMer0{-YR_TvYy+Pnw_K%BggVBy8L3aQCu
zi*{I;oY2;zHpV3Z#RV0-(AgrUVxuveO&w(bRDoZ19`{jbDGJ9nozme+auT7xi;RvB
zD%T8StwNu~rJ<ogSl=*dF!60@eF%@pyK1r1RnHNjMLs!w8)%Dn-B(y(7o(z1K|zW~
zPfzb0GS<n30Bhf-Qs?zUjZR3|m9Tn2=I7OQ*btx7Y0F6&Oj;mWgRXV7zY+5E*E9Bn
z>KIba@S~1}DCUTunr`@7_oo4;wXU!ld35pf)!%S=H=>D>i#Dc4tY{Y%6@|kkIETU;
z<rhm~F>qkHOMbyAw;QG_xzc0&W?udtOsdJL`z}Jbq_@<Q)lWldr&$dps+8&}66;kf
z+@|&(7Y85IbL|<5LkKCbpl<s^KZjM?xZQv7r4Rbvy-#C6S9*8u9<f?e!)3YBkyX*@
zSc?E4NUlR6Cqkmg&ii?rua!i3`4b$9B~e9jts*|75WY~QVd5}2JZQWs%l&eAs9NVT
zFzW{{l;S5XU;h>ul9QUN7xzVsmm@E~)G^B5GXdMUxz@c>zF&zlZ{@|ETEJSWo|;yu
zR~B+dkTmV-HIykC3a4+O3b-BY_ims_o%w3oujCo9hSarAAo{bC^=xNaKmPRa;_yRQ
z{HjU1`{BZdk3$n1DW}bJWyn;Hf7!`JPcAgXF4#!&%+6syz4-JC`H&`KQHN^~v!U0)
z77QbM*<U3*czalSo5exT*pC0|8YQ?ff!cE|0%h@75(84El#AV|@j0K+Q`QMTTO84S
za(Sjq1gY`;UtlK4kOI-L)9BWF52aU{6mCI&EIzX5=l9TXyn4qKv`_y%cy*tC;4bYi
z7V=+$pCBE{$CKXf7aUp?ch>kWkhLc&T%^%t+lYX#rB4pVVCLW&g_<wP#jlJRvHH7*
zNM5+1uHRkU5jWa1OCkgnN9C4RPJP7Rh65tvs<kP-u49Vxgd7o|Qd-v#QGbHzDqZB2
zfKI&OtWdkj#Wm7JZx`UO6M>Xpi*vo??Y+FM5^jTcVe!xiT;|g>VWU8CC(O;2R1T9l
z?$A4cHM2GmUx4vb-pwx7rBuR9X}>N+oy;6Chsdd`;mc)UVdxs8D<;W#bvzlOV#a+!
z1tF51PLdO>UPuvc?SVcj5n-g`59CiHP_!>I+nwc;=zflJ@1OC(-+yfkGUidW>_i(y
znwd>Yk7peI23Ndv^KHNiHVbIEYRb>6#&&DMVl*0=Z-Cz|w|n|GNz7426yxkU{RVf_
zYGDS4VSU}r969VSE)H%iZqzH-8pzmaS{}k=bw{tNNGYk~5E7<SY~J6>9t`<`?bM%1
z3X8~hsB2n)fp2+TgYQS|8V6B+XN^Rt=Tz2@nE!z7ZsG*^!uaPj_|{$n(A(<xT`5g!
zvT`LiC&Vpmf*Xa_nWH%tiO7$ll<At$!g4cEVLRSwt0zh>x83K`-gP>=I;YNmnWx78
zo)a%BuvKS?UVd|4@u@W})63S=DxG%BX*p=)t2Z>!)f*c)GOO4`5jle+U!KsInuI%F
z5Sv^r`M8$~_~h#^xbI0K$RtpOJeepSWYBN%(1Z==8^PMV9E~3Q+XWGMOf(~mj+c!m
z_bIvaeT+ZNs{Veau*u;CNzM$Y=A8z$U0DpqaEe=%*2O%p?0(6S0_#F_+pk5RC02@)
z3+2075A$W}@WsE0Y3&O7oA6rGA#!pCz)wn%HRYn=-QnvtNN4~lu8Kgw3a*Zzx-|Q5
z0sME6HSr@!?pVWxeqKz6a{)m0z-SsXkt+dYncCQTy;Y%QMZB}yQcvSL7aLDruE7-n
zf)?s_^YQb)jY8xtps;X{UjwtHdwF_yt)`%g50hxTts$%5amM%UaH6xl_9fI4uT8Sj
z(y<FW9!}&GFCR~Kwo8|U6Sa$C9P(h>EiB;}b9OK-M3IirY7Oj^WZ~PGC|2&G$)|Kp
zvoD;vBRCz`4s8N>AjfE)M-fue;O;lI_&K61`f`giuwCLT+E{OrZ_~)TV-+b@SyA<H
z@@okwWqTc*8HNkJ{(2Z}v8VC*YM)(qtpHE7r-=Md86QaV6|CXfC%P4WV$_Be?(#g2
z@u-W`@H=UagOtp#@_J$7RsoQ5)oRBlU5I&@nA;!cH8orGW2??*-`z)$--tWrh|~*_
z37f|z7wt>DB;KrDT<WHL&Or9`^vL}nQ2K~7e^<{$G(hx?l3acw6b6Q*fYIELk<|U%
z2!PG4eOvSVXecO>wzjc*_Ix0l^D+tLdP&W7I9E5m2SC7gi2Nm9z7PaCNJOmKCP~($
zq>#3RQe67nh2y|?<$OC!pPh-r@I-HGthwC}w3t{4$0|q+e7UjxBP0Uw4{*DbT@Um1
z{Cev?r?d4m&Udt_JhL;1f#gPWTAYloYp;vI^>Tdfy{@{C0;;`VOUo26p)GYDUY*^Z
z^MlH*Sl*~PBTfZd8WZ>O@J!iwDLVu>x?BbV<(Vtm=y%p?VNH-d&@|cu!pIX{zD1G(
zL0=5alq!SvcVYL7q3E8Tp255=JU3S}iMYf0z%nP4CN)PA)%7;MzX5}o9o_00EX<HJ
z`1od%b%!b^!4N0&!Q{2wM%RrQ(#yxYH~r&=|Nj6~i&fI8=%PTEMI=C9Fv_d$uyo21
z%3D&NK`4V4mi-zJ81!v^(l)WI=~Q*_ggX+%MN!FUk3)j-jF-Vro8uewsu}arNj!Go
zXgl+jF$KAABd^UzGEufiH*&r-x|eeqmP&F}lBLX5+3BKVy}$?#ljOowVjg#W>fnxk
zzbZ+KzFd}^^fA3KbPNrTGL+wC>nX}1DO|~^pfAp7a=-c~4;&HGA?!Oai@QO%K{GBY
zHcct)4ly51&D+A?&l79xhJoA2D1(_@_a+C|r4%;Rqrw7jl5D$$XXe&OWuC`Vj3H~5
zWct>2eNv{($tROFE^#D#HKp2#ODQM@^e$Q2upCBHF}6q7^tr+Y@^EnhZ+VwrZSfRG
zU<KZ-`P%AgY5_|MrC;UK72>=LQ(Iqje);<|p(i70RL;V{wj|3s0tR$+dL{j_uf^;9
z^Y&2D#33!W?>+>tQsb6+TNn3kj^Agm<dulTrgxw1zF3|8Nw-H;SQMwZ&EX|4Uem`|
zW1rhw>*1w@>l@T{G}N`BpA(q9<Wt5_+cdpCoTA?0l*GVgJ<0SrC)ECDF<|7eC6hpb
z7DxW-(=H&;=(b=uu3Zw=!cht9DV=EMVt#?Fo80|fJmj-W&6-igVI%hbk|Kii{TC=F
zGouHyk&+UU^96gi{jWh%8TbAN7Uj*CkyhT$=<b6P{^vJh+CB#xF-LE&DoFKzbnBA^
z+xiIFEVH0?c*59-h>5i_9IIY~Zf}uj0rkhhaQ-Se?Qf;W0~Tb6g2;Ot59Q27^p}5!
z8kTb6Pwca<$QAVP43Px%z_@$5_&+#@-vj=>JnbWl6gAB=8|1053TX&wgcb*BQ}?n=
zX>sdgJX1Ig^F|_&xJy@hGE-lXp+J8!h}Srxi@5G^?GC@U^`IE-t9@g!Mf6y=<Iv9z
z{IKA_dlAV@TOlv^Cdg#1UfT-H>Jowu)T4OcH-B?B-Exn|g@)723Vkk@glnkVxu1`W
z42MLe5jF_e@t0+RA|@KGmdH_Y$V-N{M{WcmS8Hg^ZHY`o9mFWzPk-mZU(!+Pzqf)!
z%=XfHatnZBa6R#K8auE6Y2~wi0?t!XHZdo$L=D3=S<8{J%)u}$QtaC7q;5`jnf<rB
z&wr-zYGX)-(eMF_uqIcS0mt(%?xYeDmYz>yT0f+I0MYl-f9+(7g%B7!g=PzR5hRmu
z+Zt$Fm(eODBTa2S^X|KFg>EWbNnq7&QhUQ`0p5o9xyv#s_gk<PWlB<7Vo?9HX$<&z
zvV#$j0j5$fLLVV*Z#a$CJ~c66W#$*<Od%_$b@eO=fo7FnP=QRmQ5;z@By`*`(w3PF
z7pi6w*P6R;e`&v@ZY(E<xtxK;;y}XUK(uWSoEH}lG-zN~ilHA0HK*=t?f$D~L}WJH
zw)EE8Wwq=aidafg6dVf6^#O-(_F;G_Y>0+LYB3FO-zX}Eol0m`*-<Qx*YdxhODbC%
z=IjgwB&nr9sF3g6Np<ArA~-AOB&)aQ>>+0fisq*eo=3T<gR919Q#mZ%Omrfxkk!=U
zW`{Lh3OL$Qb$bmqX{37G_N{^sPQ8l1usRY8y410N!S+ybocd}?(vz`VmHVd`1lvFU
zo#hFG=C57c?F3Ah_ebb}TQZ|R-NNL5klOEuF(#)C)i5KBMz~4L1WG3Gk@PlcVo;KW
zrqTPg)T>VlRSQKC%k@!P+iYkAKr4O|l)-qq_C@-7nRUMW(-|moqY~e)&-cZpq(F<m
zz?4;IKm$EtT-pQ6tRb~UwKThWk~US$_+SUD7anXxK10;X2Pzm>`PSVWfpha>u_`82
zzUq^htq2RkGy(#MPgY7?%~hy!fMCK)WO<W&$C%)4k@7&`ZQY-fwy?lP#f<5%hEB5F
zEe#9<&Kp!(DHi|2q3*!F%C6LdMZzJKxM9!#$~YHg{!~q=R)0K$9pYb(54qV#Qfi<Z
z%2>a~As2i9zVMvG7fx$C7wsXwV)+}47GZP~es;^b5B6oJaec0n`ROD2eaHRRiJ%bC
z?~D8n#_1$VwXceDazq6{jHMXZ;x!sPzE@mrA+*owvdk6NHK$53qgt5I-JQ@yB5|Ql
zwNf}wjn~%3JNyJIsSITj#2bx`%~(?maXE0I{ByI)lcvbA6E7G8i(88i0^s9#To%bj
zMw8`1=RGxR-L%i1No~o=$<r{f%rAokL}oFrg(sAgV=S0n37`rH!4b}mRt%FjAE7VC
zF2~&un?LS1?gKjY17AiOFkwgIi1$~EE@j#}I^-e?7UylO-^GFJU&j<fC6123?8=Z2
zMb&X|10EmWHM{njA3Le822bEuw8~5Inps}4kk^XPrEcWeCtB-Q(gp*}P1sqmQzhz&
zZLmia^53PeNfM-n^X-Fq=Z?0q4EaD5C~peySl@r$W%;WXd`n7LQrTJ3W*@O?o$2MN
zMUM;RiI+{4K@x5)cNmTSOoB+gOB@mmuu5x49LPMvNIR0e@b_=2P0UuWQ}cn*(nZ=?
zjud%0B?LoiL;l6Q?g-=2%w`_Huv*K5J+P3pgF_Y+;K&096^BwC&m&f|g?+kA6Wo*c
zi8zl&3=w=TVd`E!PZ?g32P5qdnXGwI5K=PsuA0mnv}f1z#g6*#v-A1x)VvDa|N6a`
zmJf?E_}m?45Brdu9sN{X@imiF@#)t6l6SV$J5tLQ%y%!1^8x7PXZU$D>w3bygnBb;
z{nMvs6Z(807xPZ(h0w>_c(9&THx@~qG{T71_EqR*)lKo#6C}k}Nk>-&>`%$bEU-yQ
z_HipozQuvWYN%b~tHhCExUyh>Uyt}M@dRIyzyH1ehs;lf;nN^!dXp}ZNYv$4tqisL
zIWR;Kt}6Nv>s4!yS%hf!-f~4;9J&LBNK$?WDu@@#pA8HQXh732d#bNHYyz;N1Zw4}
z=dT1oSQa~vc+ryUq+x~_`8X&Nr~xyvvDL?lrv-i&i%f`7ts44^oV+MfZHNxr;Su(0
z)0xSrGZ!Dr7G50{gnhEpsL;d6ahNp{Lc11^^Ht33ulyPZCg|_)mDEO|2A3dEFZ#=%
zV^hD<t26`b@X}eovWm=YT|<JWc!-}>`7OJ`UMond*BG_8c;iAhcg7(IK~S7LqUP*j
z!po1{oYFK+;)L*%i=bc^i&f{J(wTj?RB-u`p^fK%HS)eckRom6)a@dN_06+9T-(=g
f5CLa0_<JYfK)F}|AZm6&06t`;m87a9jDr6c@z6VN

literal 0
HcmV?d00001

diff --git a/docs/assets/deployment/hf-inference-endpoints-configure-container.png b/docs/assets/deployment/hf-inference-endpoints-configure-container.png
new file mode 100644
index 0000000000000000000000000000000000000000..834d0dda65acccc1f011b77889dfc359ade2922a
GIT binary patch
literal 273739
zcma&N1z1$w+CNN(2qK6mAt52%3=M)P4N7+ilEctLH>jYb#Ly@q-8poKbTf2^)X-hu
z_Bro+j{2Pc^L}$(GkfpZYwfkxoxl6O*M6^}^aB4D*)0?l6nt5kXRlCD@NiI2(7)ke
z0smal>BXX;+*YuZl2VbClA=~|fV{D^F+)L-c^{*Rt)<#|KSlQy4F=9L3ArDNgpouN
zayV?hhqUkHWY7YMUQ4Q!d<nf(sQ;|^a~^dFC1HuN=KXf0&V4*)mQ9o9!a7`3rwPpl
z&>RSQebEo|=@W#m&I+RpOr5>5B*?{;D5O)qPrTJn7Wb)#))|d^0DH3Oq1G;@0}~@N
zGer~kz;%5c9GB3{qxWgfQUCRgPI(}04GId~twr8+y$HO$rzpD&ermDUC@*ih9pt#Z
zqBp=V3A-(XV;@6g{?#s;C_862Ml7-V0ehP=3U%JWS?O&Q-ddXeE>cqoN}&(;1!MzF
zaNE2IFP2x8?n{c0nvh$duVt_tO<0QmFuhdd0jos!_djUM)jGc=D8U-Hx|@BIx_&xG
z4|>7H`Iaw#16CUGz^sQ8qFl=OmZ?Ojjf&3lZX}^Ky6>WiacVsg4-W~=9<#^DbLzF0
zBvgjB*UN$>b>3pnzu&<L7$;nGl2v-<+Nfw;D<ETue(*N-{ei1J;pS64`Y7yg$5TlW
zieV4qPu|pi=w4q-JuveUdvessRJtU{?4=;A+O~=4pupo^BBIHXq=?{9dgrT!zKG-I
zVx!flDEE{BWYY9J>)p$5Ca5I}bhyWw>#sA{OVi@LFOqBa{l-g(VI~I8#2XUg9+H0U
zA~}B6v~xi9&EGkcF6k7NGSXA;RDxCVr9>LDOA>2TTSu;|o^rw()fckRDOtzQ=iBx^
zFO`a;Kmh_uDOAFo{Ni`mm14vU=z2p#RL|bWneRz`QM;b^cq%aOkJ5y8OKZ5vGy=1&
zK>tX8S80?O<5U8R+ZRXRkO%!S(S<wRE*ajfrc}cBzMghTK88g&%Tm{ygc_aiu?0s*
zQ8P|XnAA&~Ro^*2eem7yBt(q9GYuPe9@n((X7}BlJd|${=y|0#a|h^K&|q}fuJ>~;
z&c~r*MzXi*un48zJ$<G-jdIdlzia1u6fpYGeCZLoy=N7p2z~k8M|W)rCvl++@A1r}
z>L~Cg)4f%EyobDd?$~1T>D&8EljlmACA}v{!JfwKYi;&g=qZd?Ild_9xn=$Cc#igT
z0rzO?Wzv%;W)IrKO?aF#f|G+c(?Ylr;;S!KtS5~cY63*1*4C~gyl8A%gLO<oi_ymg
zx9D6@ty?xw@r1+pjM&Cs(m&F(S3cL6ZnEL>x;B+cPPbmYh*p2|3aPd<vVJH%8poIr
zn?3zux^rlq+y42RN1^DA4`}Zz)7nuqJGeNwU`m`_y{w;|eRkrdN%*E4YJ0td;!3r%
zy)C+*j3-LaBnCZ|6Szz+Gj3H5B|}-egLkjgljJQ62gd1YTI)>qoezG3#eRDN=%9Jb
zO9^Tm%t&eiI=}Y=7YfyVW=72MxT}7&Drm6*d}$OmXu3~H#_^8>+y^j}{LAKvs?ltH
z;dVz(zNBg7b?B*gF=%Lb1O0wHW_U+$5-#xArVShSSxe*tI$T+4ZbID85^rb^B8g1t
zUxnE`&5iW>ZoEwAfNCj)q`niWw9L1U+pglQhRr8gFcA5Kd?n4;f<g$jS0XzN^9Py}
zlTNV4XZV27A)PyJy<g=Qj)6zFjjSFJ^R!cN@_%cmEiq-Kj5aPSG0DG|*Jf4n{4}Y^
zcw39~_%7q(?W7>#CK3w&jwLkDTVmvf{&7p{u9V(njltq=@I43yS#yMu@-E#j&JxbU
zz??u@NhV|A1;T~f)AE#o&}X!fvgHi5t@ZKGdT9Ho*=cO4ku)jPm3OI#J!I&j#5z-!
z6+`IuWZg1ohlGaMhwO*cUtzDKYk#znbYZ}bjP4|IpsD#(7w!4MGv@NcCG4|oNrvky
zS|-UZr!MX;e!0gh+?fIUuw3biEO*tVui7JSBivSON4Jk29eqqlNPs20)hSQV0vGDQ
zCJibMtnQ48<yz-W<v5P2j*x7~k3zqusx*GN4u1Ycd+^etvs`5Il@8zby=~O(04%B2
zmjT%{Bk^BeroYU#S6`w}maNKf{6V~qdHCua_1w%ojzM}@E;_FhkyN0a?xuAR`zHLp
zl=UZ#42{AuqJm@{(()AR=<<Sc^opQKyz(lmR6s479<1JGmuiadAO9xM`eT4*Lu+%_
zsnki%$z`*A!)eoMv-StW52fLP0nyy4zP5M`g-1MZYd+MZx<#K^#t(A#aSj%@w_3f`
zr#v=*RHvk-$P{To!e{a8mCsqPB(7|(NY0PWPw?%~g##=Ca<Itp`yM#qBOW68^f>EW
zPp=mmAASyY3FZpsxm`t8`QZ4$Lvl=V*^grnlessz-;iBAG=EscFZO2IvW0Vx>uzE`
zzo6|twtQT>@k()*R<`y`R&W+g)~#W-tb(l6-u&Lh-dnxL@iU<8gtFe@Ud=>MB2+hC
z>qAAn<;&N5iS+GJV3=ji*nZNA2a9#yv%DaUBaQxoqkOk9%rU;P6B`Tu27Xl=W^myY
z5qP3<qLSREXguAe&;{l~;u5$0(gWmCa)otKc{lLxqsMfQnO{shs6gihmW4+IM4U{8
zf`#u3jR`kUSaNZ@Er&#|J@<BWaPG37Ty=teI{rHFGUyB0i+Yzz$NK`B0)|wI<dnSb
zeLsQ+i}beipRtqc+rqi^I%?USz%ExCt4IdNJm*cPDm!Io!yWI?g4Qq-4&&4lYS&Yb
zo;{2G(;w@ru(g`G0}c-CBAcRQgZ>V!@Vg%;_*YA+V4yjVP$>LPH{+;znKHa6hhwg4
z=p-_=CUpP;pW_K*V+<_|Js6tnG+g!hej|#A77q2G1waGA69NnT5rPkQSnqfen%@6(
zSB-dta*Isl@#!-h8ah@}>F;bQca@v+R-ND0zU{juN}2WOKDoxD<0sSXdiQ4q?o*Nr
zxr~l`+>N~(_3m7TurpMT#7(?Q$VzS`(!#_^%}M%jIQ}IU&+EQ+ZWG3K<OeU(HL5CB
zq-~vI9c_c4UrI!jO7gB47qz{a$whVK(wmR)Po@!cN>(xq^o(>6W#mID0q@?^uzQG4
zpFbrM=QAoK+8KXtZcBRqf^m>>kC9S_K7%0(sc_X2zO1?LG308wIb4gW*R0cwm!4`@
zQLMVmro-eOi%f3dzH$qOe#`yPr!dzu)WgoDsmJaeLlRZNwCUwydK|Vjo79#hTC+So
zGTll9maSYqG+pW(W~h?g&XgWHW=c^VQ&^7;>a6U(dxqgAl|pbi2zfdF#QT*<&q-&|
z_Zv<=;|)Jcong9RovbNELy;@(rz*`HJi8D5ANKMnn)fB1+1)oEi=FtsRX)+{*t5nO
zKg<PkwH+1NsM~UDye~vj$m%I9ZtuN>_65_CROFiJG&_OzBdzveL689+h^>Y6J!u8|
zqk7kwMM!(gVko^5eI~tOEKaQ6rQ1lqnfM92qTyt14|w9+O4~}*3P|&`@T*QvMXAxs
zlKN}S(SkPx>;_jZy%~I@a{6+hg3Lnod@u(dhqab@iS1b}#|mr(#C*weoDb4#biKO3
zZ^73DorCjdOv`gjhqD3ws;a_(<m8p-vd+j&Co~?dR|bODyp3;O)z27tbRHK8(+N-J
zndB;I!ZkH_c&BUfu?k*}I3eXGoXwz3$Y7nflWZRG9&*S2^&#~>Tk<ndN1yTQRrD?N
z3T(DJh2m`jYI<)+6pJ<s`|}|X87m863is-o!MweJyB&{(6BH7e!!{o2yL@oBX)c*v
z!tC%+l2LX_?h!bvc6)U&qq?M|FHY%Id!#T9J1`IEOA+c2gkIL2oMqvqkP;Z08s;}H
zyW|wMSF8*a6*fMya<(pjZ+X`&gmlDwtK<TA6rLN1y0OhqPHfg~#@RlbwtzqMIXEu(
zq`O@eRFyi{S#z*abvY+Cm+TR4S9IF2dNqU{e23Ym>dH$Qu6r@~7WIzqqjs^{3$5ML
zcH*;W4obX~p_EuL9yg7v=`%M~bCtCi@ozVSdy?mij+%q1IzELymIwRuhTc9EPT`wK
zS9*`p3-?a)E0FMPZ5<f-e#32-{bXkCq@C(eT+PeWN92TQZ@8>qwK1aMlUK#n<SE<M
zRQ>GqtO1kZx19@;Cf|LFXo99qN|b>p6r(1`$If*dp5vN?qp-?5em8;Y=HD9@u_V|o
zv%``8KA<X;aX3B-%U5M(RO%2ci6m@^7vYcc(amcb9J5Oa7bc7x+Ysf`yt|N)4TbZ7
zIVs&VHD^?*DIe4aK>@;?oQ2^)coAZzCHqEE5rr8z$3ekBB}2gk&QO7`7%KU{&!3|{
zK|%lPe>4=7x0Wav|I<bZIR5-Z0N<Z|{&hr;3P!;Ou84rIYZ}`Bw#LIrL;v4%^l!jD
zl&7jvva-NY^|gbUnXRJ*#Ho5g3J7gbaP4HY9Z^v3)BpUU%D$r81)h(vRMT?OQdAIn
z4FR(on?g*?*j>SPKc9ml;wl83g3X+asa?S~wvIxsqO^at5CYDB{>?#4{Z|twYf)M)
zMHOl(h=Un5KRYKoC#~2mYHDf`2h%q~ubw^spYFhwD6NH)lbsL;2NVirhw`vP9Lzbm
z1O){-IJr5vx!HggY>sZWPR6cmwvLbg^^pI4&NDN|*AA9;PL>c`>YvXwHi0-hiPF;k
z9O&Plf6dd()$%_h**gBuvVaA0{Jg`##m>p`?`H#DMSlJ(q+;o6W~2Sg5)9A`7(+~u
zpI_v!_J6zcpAmoQsr8?p+ydOZzjpoQ)}LL~9nBo1AYfojC$azV>wh}`dh>reig5f~
z`Y)vT7oGq57a+9QEfJ1?GfnK4n+^{Zz()$pXUb~85s<Q<AJiq_=gGg0z&RS$kE?z2
zFccIC6xnA_)m%}xW^g@8R_br|4DVC>v2F>M;=H2{{UrTKJ>CDEJjtd`T%|!CxafFN
z!{Y)mrU9;~)X=pq(qJiIsrI7{?JB&7DeYp4J<*a95k$9qbIBmq+LPoM6@5i_*0UMx
z_GT4k{$`eku|DOXcc+a6CL2#Efr5(h+m9a^;k(1iXA7OtQHhC+f`V>QsfH@(=HF=U
z{;lb+Jx#RJo(4RVRkEd%mHkLZBPO<$^R2x-NZ*i3<J(=r!aG$k>t}xqMO}$Oiy6Ro
zJIPt30~Z@^ZZlhDIZ_<SYZLzjpNN>Ai|grPZ=%TF-q8s@B_bFL4Tstn<^S=c(t)Xz
z!WtEwRju&!Y5Fqhz3=adF{7Zg%5AETG^JXY6r-f2S{Jg;AKYW0ra;OXQU2{YYA}gv
zJ3HeA*-nuZHo=J+q<wT$REE8S)LK!)ObqXDB>HvT|GL46b`JhDA;{QsIkG0-`7xTV
zLiV++3{Jrly*bGij6gTo-=;26fg6a2O$ADye+|<{8oFg?@WwK%_9g}f23iSo5Cs0e
zR{9qSRD>~a;o(V(L%O=U*c(s|=s#KJF!ik|HnZd^(-@<*G{gJ3|GvUniE5+bLSYBq
z?z2r>(KL<QO7dXV_wO+RSgx=*ssGmgmnj3}y>;uB;>!e^s?T<>UOl!<NTFSjY+e`}
z<$HwI;=CQ^Ao?eB+TsCv7B@U~JpIl!Skr*|1=2^y$k;v(a}@fs=`RBTtE*6?W@JP#
zz50^+($YBLjpA_2{jWKjKUY<;-MQlVrxbpbMq6lUW>i}4UiboYDBaEAwTO7IrwG$=
zf+aEk)0%uGZsU%d@SUAu5~UJy^bV<J8n<H6m}|vJ0SuF}1+n~%<!Rg){tHI>W1!ar
zu&!n@0^5<Vk-U&tvSaIH=B3jQe*ereAI!tD9I3ZF^c)=hxVWI3+9*5DdlY(wEG8I%
zn_bDvLVu3;j>gXp7!JBS@RE@(e_{T9@36^_4}v7WtLq=K=vVv1Zg+r-kuE7d-bgG}
z4jO{MkZNvTshyXQsAiv*E=2va!vmss_Xxz?x2l&{S7igR-Vc>Zt1@GE42UkN{W+sw
z4S-)Qb6ToCrGV?R{R2EYrku!(Y`z@QpKNkIdcRuxXV<T&entYP%bn4E+RMw!oh3a>
zeTi%ZI{d^}cwmNqToEcpu2foDnhG}o#r-Q*7PgA_bc`Se0&*&<9br%XTsj4baj3QS
zuT%SLg?{_DFj|{y^TmT0=<<DH*raKD6S5LOdQn{-ILA_dSfW2J)AY~;1#28mWwK<F
z1m;{|MlH=`I0V7|0o^M?TDP~JNeE!sqGkVSj3mIMIKctn6{GsX$1lR=4GdDwy0Yjj
zXIU#M4Vl-%|5-ZZF$pO9K21;SS^g9%MaZIow0{22wbj@E-S(u3pf%eShZ&={0CG=y
zLtm+ls8x5ARZw`+Pcx4F2ZR5(^t*+3@7}$x>km?W0_VMP_~iU{lg+-xh56etfw(xr
zRk1#QvQ7dRjy@>Bd1~;rj_7G%24JYlM^t@+^iy7!-1$chLqQ`U5r}ouD=jTmBv}ZK
zN*QazM?+LZaH1}Rh%s&bNfHUs`#4yE&J%?!Po6{sybTi+0_%X{0x@#25lb(E<X`;3
zrQa@1B-4tERgSkg3TdZ5yCs}q^*mdvD>tz#wz9JmWMHT6il(Nfpuacsx5YJa7zH%V
zRxm23INf*Fb#W;)rR<N)$oR>((W#I8|Hu0H80>!7WdWKaCl_sMIW5qMkA=u&1`LSx
z*4|>%pN4M4*3U>nE3RJrZMdl%;HPl0vtbc-Unadul0^S;Ac^F=-+OzbrQU|aHkxsV
z@-1_T2`fng1JnZox+^gKeC@zBs!5E0K7xyZ@HUP|9=0{7)|^_TK;$u4_y33eJ<>Ni
znY|rJYacRWp)!u;7oZ-veLlG=Em2)L!_`Onr#L+z1cbgmCZHlY5h}^eQ<nMi%k!bn
zZaTM<xc;Ugf2cqclOMokSwK-TviM^&p5t%okpT818_CD^H;eG@RTDX3C77IOOs+*+
zTTn?xfUn|xMiy_FgIX=kpPKmlI4YuOFztz~`CfZQilnG0RvkgDJj|((W|u<qC9r1y
zg!<(Zj6fFK?>K*B7YiymP9-TgpxLD!D=_>~chu#j<Ux$Wdeo<p0T;8d--r2g5)ukH
z%d0670MFzCuyCVNViz$2kJ@Zx1RmTXVDD&?{$xjl5h&keO#CO?Z~||QQy0%H;^SBg
zXvN*3>WzvHV$5{TTa5xtI-L6-)qqffngIiF)n-25Xx=Noi+i)qq{KO{D=qK<=l>Y=
z6tg8LpyDl7z_#8LAf5?n#WGX;Y`uoM9fDJ*|CdeCx+~yTDszk!Hu7)&X=jB<0{N)(
zqm!|Jx*n~XSi7~S5&}uLHvgu5)cF#!sKzr{3-gP<cClqX7cK=YVXbn1WB>2w-Ac#k
zB<1$ny#zi*d-N7EGzMzDVQBEu<G-<>;#MFY&Zf|Xlti@-1RMLG&Hh(ki45Q3;K1#0
zs4Fv$2cN~?pO<`h7b_5~E7dHt&W*Yt<d|1O_)k+!>%)6?3uiOvZ62+HM0KAykskG*
z%sx_W3idzR`1#DqO7WneAcy52_Sj#&;2KB7A$iY#vvGe?@0}YeIiYRB>@y-FqUqdb
zG7JFQ9#n-B|B16v{JIE>{fvZT^(#@0g%Q5HgRdu)Kxi!*p@M%-=QkCQ$j2S`wR6{b
z4WiC(o|i#27QLB#B`whB8LxTIdOqpzw!bY!VwVjAZWGWfR3(lP_<HBs{`qfD{F}yj
zqe3LK0-BHC`WDZ<r^nFq6TRSGKHXcidYLR#8T}leymrc>t)Z!;hjk*=en4<=wKqZb
z;EiR8&rlN0uX9(c@x{lOLSHXE=?D&RR+1QJ=K5znd8h6dh1NnwR4G1tknLZr8Q@Y+
z953dWLLuThUW43QdM*dAWZO)B3T~JuVL^0uaf}JZ4Sey?d?>cHHR&msB>daxQNAE*
zo2h1BJ7eQ?Rq0c$H(`z=$J;vULxT^o{xFz-T>5p96r(PbkC<k=+eu3L^Hen(kz-Xl
ziq=-?*O;r;d})W>*$-ic$~@0w^}`GmkGb@}j96G)TBK)VlLo{;=CEANa<I;_N7U|!
zo;sf+l>-Ec!#A{zW>w`9<ls;y<F%k>)8&mJ*q)NBVyDcscX;((^urMez?>@rd+%SE
zGxEXrgbibAtVZMZSSLV3n6F*$^y9FQzp?C>KGcNu5}ec&R8$;fL}Rj3{I_k^YG<d$
zR<x3Fa5^@Uxz>*QN#{O&j?P@GidH~5@_#7>n6dj@j(qAQgna^bGGqC3i*-%G`0I@L
ziVv!?vXbG)U3Jpk8O3STi%f0p9i8!!Ycgv}+qB0_{lP1#MUg%E6zk&+F-|*UH6l`<
zs_&pK5V?)N`_B|5>Pd>zjWCPBXe~#__VX=&1`EHM5kDOc01}VQwM@F9&idN<<F;6B
zOrOnH>}KE+kOu3G_<EanO<eWg);1(&$z`Ulv+9l8Uk_35qyI<+lANq4fEDHHSBxcf
z>@OY^H`wptMtz!=QCd#M!NtErIc?~EA~fStu<O~?J)HcS7o5Nlr%a~1u;-6XNJtP;
z{NX=SMnPjXl4_o<#K)Pc(YTZ4&)JXnt7!cm8v(SJ02AVn5?00lcDkrlmv4M3Y{fdm
z-|imNynhzG)L~R;q6{SUEu7p^GKcNUc;2FZ9qK|N<TMr{aW(IJ5jImg5~$`FW=;y>
zL0!x%s*{O|CObPHYm-#R42*+q>c4KO5gJvKa7CnCai3hZvs;_A20Ikyyzz8L3{N|E
z^onZNIR$Oa)*F_G?3xjC5aJ(bj2&J!&W$LqCUfE9XvQ)x{W@g{OEkdA5u5y`F26ST
zix3iEB5G>AM5G3NYF==Fd9VJDFftZYV-HEj{ezVl%bgk$>lfh^wEDu(@<eMJ19jAe
zGe8vzbfE$Wbz;<omKI4j`wayqUZfB`$dYxg_7u%>yx6ad;?lhLTrnyoftgac9M_il
zq*P<keWAT7=_-d>&-S^?uXfVU0f&%~9h(gPx5@p=Dx9`_6x4<IdOmdzlV-bJ-|L?u
z(w9FO;QpK=$G<o`u_via=6Ji?P6MB8T=V>RePL#+GMqw?!Q+I=$vccfltGb<QMUVj
zZ^nzNzNo07@omza$T+CvSm7M&L+m@U0Q}5I@S3ay)9VXW#4#{D*-ZY7ivyWykay^f
z7pmZ1OJ5_hoP1r#0Rkz<`ZOqUhnoq_xF-+Js0}FEL)UHkzSuiN!SnI2cHPTx@9m7&
zXmXc@$xE8lWn^Z^6{YBB0P5G!Fvyy(T_qdqbuMkMsaoQ;Z$|pujMQ@L@)B)gZ8{n~
z%6>j=d5u)A?9KX6y1xAS*ovC8$&9$L@C$-RV$2<3W;JUOriD<6Mg!z7(?@do>@e_*
znR#Q9-UJ-dcqaG+n}9N=Ezq^&yj*EJ1H8FATCAC`$H>yCwf157Ul!D6E`AoXKDdIM
zKXFrFUWD``8Q&+svUh2lr##x%b3G{o*B2%mZbug#Z}A~q^rE840pn62DT(-~fCJZ!
zQ*r^V{%VC(&;cQ{MoE^U{SyHE#yd3_z&qwIA7}img(&j52eAU@QUsL=C`Go6lqkd}
zF$@zgjG(aHl^5M&aZ3!;<hCK9;n7@=gXPwSC*MwO<?EIn@=TnrjO|V-s%S{%&h9!{
zqAsXgH-1u%D`I}szva^@y(S;Jy1vi>vQE7@NlZBYSgjBGAbcZYm^mxz!EK7X%*?8F
zu&<b#@6+*uwp8B*aO9I}rp5h4o>@|Soz0PoO-pX~)3kS9@{@Lp&l*^D8+00`>(~~Z
zD{N=<8r+)gEF<E7+^*<xE#R`HS7c&h;y&Al2<e9<P#;BQrotEY>@JShXQYBXzd*ic
zS)jM%jm2M_PHenG3{+UZc<4N9^q%KLV7lCXm|uH;FT^fUa*Q7E4|6r{ufDr${3`eo
zN4U?(3CAFYojqO7O8Ed98HM^&;Qrye{<!qx#sT1hm0T1Z9i5D)XWhXU7zjMIm6*Ia
zFzfP=Kz&<(spqW+eKvdE)hDZK-x5LsjUWrOmJ1$&PIwuq0BUdbDMrnDt-P1-CckZD
z=FQo3Ri8-mxz8)7A)n2n6p@!vt$}9ssHVaZ!69B3iKs=jmy%T`HUNIaNA|h<L{iFq
z`#{00F9fxVYvt=ABOKdkJ0N90z|RzumS*%a9>XARsNXMz1gkwd-ab9@_ihqh$*h`D
ze5@#N>O@S$-hWu6ITz_q+&&t;eeKR3go)`g2!n19y?h@2V6nWLh_J7xE7lUyxBoE{
zZx8pqL+OCehnJ7Bg49^T7^v&MV|ajIzD3YmP<)-cXQiPWyDpBCESiuAlGFlwM0Q4|
zTu6>pvi-cwxC&HC6?R&i$L?}5{F^`8Al+>UGMW++ciYc6z-JdiP@%Pq`alF||Jff*
zVB+A!&E$_E@3JfyVSczr*vHd6^tz+ev^8$ZY&aHdt8(&zM=8$n?cvG9T4K|BXi>u^
z#%tvrmxLteH+O(Aw|Bh^dV>n%gT9|=9MBf4*EN6WHVg8+@TuFv({415h8Ie`<>yX=
zaHwWh2OXsEY*Zwgo~>D%{+Rb3nxdFfibQMa2siH@samb=*qYl>csPEe0M~6h+uNd8
zYh8tvk%ok&5C4di%24lC9gQMqWE6bwwJkgv_!{h66NxKoXv&Of-EMR>@7`URTx!?p
z0D6+Y$&t#-zgV)3RX~wX61dHKw!in&TC&GlUU!C!mb&*om$gl@VLnZvPZlbV#=<9(
z-r4TB(Pq-^6%>lbH8AuTeFkKb(*Y|cFm<xk8_`Y$I{-xoTQPnR?YG<%f4|D{z(#tx
zYW7TmfJ%&6=e?`Zjo46@GhPQH&p~z1`R?ORZjxYUtD%e%y`zFXrKxLG9SK*!dG0Ux
zXI8=;Ka_mwk9p3}miN@xtQ&Efl4utbQr~~#)`}(9kJL}v<5k$5ot7^3xp`{t_C3ve
zXsri{EV1}a!FqAWRf<#mz{G@wH5bj1{{&P}F_;+uq+;S-@n*+Jpjw1ctSL~xpFbVZ
z6<>$iHS|sRB+1X=c{sZ<+%k>#CoGKTw6dGrUEx2oSifan5v*R+VB$X|jh=Jk?Ho*=
z0k&+Zj%N7aQZ*GE96=txQ8mk?2Vn5jqIyAH2L)fv>@doyu4=9|cPLAR=+SnKZLxD5
z?p38V`MG+<0jUqOZWYq*o1BadH9}9Y8F$Vdd#<csjVr}5H)QX$<W2sohGQ3m=7lNp
zt$dPkx&OW*LLW(4ssOGSFL6{J@9I2XIPV^QBWGZn!t<uMWv6gvRYdHGSa?)RFBwK(
zXRmY1baOPG#)Ip=ia4Q_L2%;`T1!#gb&3a-E(~SAoiwZxUVC8Ht=XMWK^_{XIB+J6
z&|7>Y)w;d|E3Q&1P#C{l-1`!8;dQn1{?e1!#;3#WxCJxbEBUtsp`R5o024*ieo~*`
z`~S+dcLLsp<sq-e+l#GG=l!!TXA-e`AV5f%x9YwXt{Mx3j8EPYAUTqSD_Dl@lc`r(
z7%*(I09!`vUOzH(6FN$6c4nTJyn;cD(%`cH49L>iRmF_}7%t_i*<_;Lqp>VeqoIB=
zs)PvQ|HTXj`1{7)Atym?t@+!+r{rEM`Lm)ek6Jv!bRM21uBGO-k=wqFY8hEL*EF4Z
zix<~*ybVvL@lQVh%zY-Mq15*p!5XD1c?JV&wuEdr{L?)`F{jh`x~sk%xvn@vZl#2*
z?AnXT;NZ0EI+50b`(Awms19%XZTnUMn!<K><CNe#+UDQW$}YxdrfbM0`TM{3BI3k9
zY!k?!|7z};Spm>06!DXQoGj?SO7?Fq_pcix5rE$%^DjcS2Io;z6iR|+*G97xyP0#S
zMJ$XAqvzSg9K4^VQ;4Uq>Cm{O=CoOf#W*Wl&ijfDHSRn_Iuxg;_j+9rbQOwTnEHG}
z1w4{HOS9Enq5>fga&rJlp~`l`qROYqSYH_0AUI_C;vgL4ndi4&pJlSM#^76^>M8j-
zM@__ljL+&puS$bhCT3uG;znB$Y@^bpc2G|_gK$5KZOUvgYDEc=u}r6Gc}fe{9Y2c&
z3!626R!#zw#gBzl$MCIRO`Ek0lckAy9>!C2_wY7PE?!I)0H)G;7Bnpt1ETf>()1Hx
z<OQ<+Vr9I<rn9Tdp+m%HL~!V={21vVi@H#;3F`I{(_TLWM-4qI1bi2?(dhN8zga1`
zgWcRYu8-2J=R1v(M+GjnkBMZ9(9zbQVxO?N@9^>U0f*|->iIU@HMg3*$*!{FM*+X3
zB|j+wDFkPZDIg2NFXjHXq{VLxX$u2*F<wKe?#<8~VOQ*K9h2(2hBAAr1vIzI)*q|d
z3t(w&3(3N%O47HSinW>yhA!zq!dGmxv;5ec;$A_-mPk*EL`hM!_AZvyT+&_xg`h*v
zI#EuSwVe-q3m@lXeP&oKbjAV%lWVtUp!STUqvvx#NKZXsqps_~h&1ojUcMa{G2RsD
z$|y~7-qhU6{d!fz+@sjtp*s0^Tl@)+Iforc-{**aDDCNIxZc=vKV0`B?MB(L{3$xO
z8n?U9oyjBKhoYVl@OoCj?>{Qisxjb)%&cqdJ7e$j{;&T>0AhcvaRZ)fsL*q5wgU*=
zDy)<@*1NKZ_d-~ocUo+_U_uF=jvHe5I#<;rVA?}*_o{vZFL@h0RT+i5^jrXZ{q&d2
zi(kUes8SRUpfD@9&$Z{;H&!jXjmC$`B=na&RwGXyin^B<b=05CveeYH&mAsK5o(<d
zr(WOFYBkX(9EU@T^0mvJ_lch9$to!o;>ES`eR?W!^VMgz&aKpCTW5_Ch|`6feo$YX
zA4TI5GsK^qzoHWs))hPd@z`8{bF847Q%Jv?w#mALRp(IpmudZ5AJdNU2nh?XPKp&Y
z30Y_s08Dk<G8=#0K*1Md?o7tJ%ep?5ojpUBr%*Ab+*mkfrMdC;*3YDXMnOV1W2(2Y
z<^^D5>$$pf)bhz+#NVo%QKX-;V1!5rOp5^o;Z5)V!9p~}C5MLtnX7prmUL4xELvk<
zic70p3=i%pb97i4wd4s!BpMy{W=-13Mi(`%pDGf6*fv5dU4iW@m`x+*Qa16htj$(p
z*@k+Q@dWL5Bep<(rpa9Z#8f$jla(G}v{bxu0HE_wu9>5DqkY~o8G3RT5#gA``5RR)
z?d(E*p{^fy+tvM&N&I}qz~i*?abC!L@FcGydn)hP_TD6US?_`Kw6^U`ZII`|<v~(Y
z1y+f<&u-+s`^&;p!T6%O?nhf2$QQqvFe{~>nYY_EiN3{WEvZF~@3UE<tD24HG1ERb
zR}K2M4QFr8*2HhtbxHLefNYa`U_6Y~2`f76b_jiF=Tf*hQcqe(C*goX&)cnYM|EUh
ze)Uik?c!u7PS>_Zde-YizkgD-7dq?K;Tf%!rRUhohwL)ETqNC}54cm?&CC447h$p@
zz<uk#g1ZV?Um&Mns~h7~SVBm|E-&G_&S>~uNcE$}Pg=kRR*kaj|ApdjWf$BWZVjqq
z9d6PqD!7g*%`UmJ;51$#-#YvlxSOqeb6sziHo-9o`1oq&okyj%tr~y17RT!!#zQr#
zaErH2=P~#H%ErvPK^lgu%5$5pty<q_P43cXrgVRb%TAoP+B>`RU_iGINnZb+Qe<xH
zrWV&}Eq<dx$TH$A>FJdxiKn=3jglCMB-NQ&S>kkH;Wf9{Dt4BYT_jI1mL0awm!fk1
zW+P!mkP`OCI3+V&9F7~$0?!hw`m)q2=HfEi-SDbOyJDhU05HPNS6NRelJ$?IoR!mR
z5_3{Sx>Q94IYmN$i}!lb`0wSvt=K+)M0kBv<ikdGJj$eXcU=470@XG-6E%e;MS&Ux
z3+h4u_MI;4qI!lr&7#=eL{N8MvT!CK(GHWA*@B}=91W)?meb=m+t2Sl*|@T*PzCMq
zy6zfjSK7d!>h-ppJ22_c`<+`8WoF&6Y<)c0bGeze=vcQS@(OF^`a}+TbSyIv{7yeq
z&X%K<X;T`p-o3p;#ZC@NIS*#v_MC4*wKTpSNXl`*aAng7d;I0U`bd>23>+LprLczV
zn(i=-F~sg<mApZHQJsxbUBAjxf3zYo=TNvy?Q(S8u&CiNW|mHYQfoiu6H%p|#q#<a
z*YG8LoJI)q9+H>D&3R)W{iEu_DBMtX+eo6i+Y<06UujAgx(oIPhx(KBiHXR+J8SCG
z;o{=b<F8C<=t!Klz4vt68-0irLnx#?0d{Rnn?YK2wQFRf85~Bd*bi+9rcxSRVKy_h
z-4kQqKX?>8Y|J07{g{=D^a;t^uo5^8k?)WVXnQutNrI2le`fdI^JrAeyk}U*IRfwb
zouiLMcq{lg9#U)g<b1p*yNeMe+aWN=`<)G55BnC^v!St(Yxl+DYE2HtC`;}3vimBl
zPX!EBw7~r$UlNmMid?*_*Yxh){6aPrY)qRcS{%KV&ffdWvgX=r=U<xZd-4|{td?_y
z>Xe@ZoMri`^V4VD4px&VRl;Hms6{M?=wM=AwU9vJojTR)%QbO?tAuNRis*h5`kn8?
z%HrF?jq{R#iCt+YHT+cax&sT;ez{K$siWx#qjc=!8N56>KSCH9X0GMaY&LjZoQI{W
z19c$L4P8w`Qr>rkMP(J%h*%lBVMS19w6Yk}d4YC?<q(jG{~FGVPa!aXdk17a*5kzv
zp5wC~li8WA-=;m_MANOZjlsmbU#%N_`ytWb2gK*@XTKSy|4sAzxzhu%-(be}rX5SF
zWvS!iCl|2pxv=_R6sTJFm4ueKtJl#-?WnlKwWQ88Kd($k>Z4aGDo<|Q&%ox%Se%er
z<bJXFhG-awx~>x=j1)FslFZ;^U6;Z8zVJL8L_J;Srds2)c;@l|c6_YYDH6NRik-Jq
zn@r0)%NYX=f5dhj!TxIgECw+bO`)2s!3fb35?Gd3opbK(6IgN*gv#6)#YLDwf=p({
zPx5(82PV8E&nHOS+!#%J&wIIxZ*tN$FQrqzkAa1g*{>8)#^Ak3%~wCEe;ammO`C0<
z5mAaT8j^mUVHWzv#R6&o<X}^9lNwF^*IdYWHYnB|bUffc`YI%Mtyc}k0X<z9D$%!w
zKT$PEG0x>$lgCpXJ&nTs(yM9qDDF!~X~xGKm+3S=an5bz@6@zX`)TIs05flAkGXJ8
zNO*lXtZcT}_Wtvz!k1)Z{fPnN^aQYV$pV_Q=e@qZ-awt@HI}#E*0A>x@;!tky8%^h
z=8^l4^js0sp77+<R1WBzSCz<K8}Z9j>nhtB(~Xgw&*_ts+!NxrcT;v=hl?_RW?jDk
z8B*Q-{e9Dcw5R(AsW*C$+?MZFk*jCvhY*qXi(TY<-dxN<FD_R&d?JOB)vfvj{H|<R
z(pvwu-jjy>>E16+s@qsbB6hpfH<QEwVR%vkF|$3yf<DF!EK|gBMAn6`45UA9e;XDW
z{a0F75mN)7K-n!vfI6R?quw<i*r>9a@)_%$xYlmTS@FUMw#Te*v4&TI3EDSl#?U0M
zq2XcEC|n1u)<oT^9ioD1kLTfq$nja<-P4lC8OhluBk8Rj%iGXd=mn50)6uE2LbAt=
z!~-GBi6>Zn(dZ^7kN<l}KjK~y|Dz?22T0)tTdhjZn0)PvO!($<x8kW_W(i#H)xQAm
z3wsjdZA2r4<Dozr^gBC{0fJHQm=OE3McC>qN55>v7WBFwpIf7=aHN;4Q)SCe%t5hT
zzAY{c-Hy3K${rmZgxQyC^zQt0&&I76qh;G^W;8m(cs^iEv*(y%SUKB|p=o*!16DsA
z60>Q#LfYP6UP#5`@YQL3x_NtXX13mg^dVQzP4lF1*_!;fYbhn40$R_rcGCEwFh!RW
zgt_@QkAs;t?h<3EnuV$C+ywyQD$FLmyu9rSo<{vWidVSh8W2^fC{gW=5lG6WL-+Va
z7%Rf@Z14qDXR&c>R|Uj*C&Rc0*iA5Jyj_OW)$YW*INpv%82ads73eaO@gt~Rc14)a
zBDh488j9>D%;GvfJj`yOXPzWZ;WYN|NfP9lMDoo-PInhdO*@HBMBI<Jn8^8U?Bc+W
z0fbmSx!V$im#Lg8=Fm=}DU+w+43~u0ABXgSW1zy%Em4gPLN!AEdx`Jp1pqLvY7kt`
znE;DX3M8ys3WZ3PNo6!NDsw6mm;hIHlzafIuk98LxTx98sx!$gPY7WVTGwPvnYp<w
zD=!~Y<gybzy2&r^mxHyLT!(6`-{`%hads-6TBFZ<d$Oqi;ZUiWs;VNRJU@8Cm>HYW
zsc-wI!_cwXLkOIswHW8JbMVHz2PNKW7otxzTCY-cUaT%E>KE0D|F++c=pxM<16IiF
z5IzhCk}BD<-~3vKN~FlwPS2ZXMnLAFSeDx(-D)_<k(}ftPO3xjsYBw{OrkMJwuq;;
zyO<`sXBz)58CkyfcCRW)Vnt#tP&3j7g5U4yt*}z)ocADMeljn$$CWy9vb7%Exa`t=
zLJltLo;o2_n_!2uKX@AMj^su)-nn-hXOn-YEHXBQ+5BXa{v#Pbx8Z_^9)KsAXQ`e2
z&xF)wW(&bA6F&11`E$ji1uZt=#J6!ETqI$n@p2tPnel68muG8oR#wDQ`lTPX%d6hN
z7wkp9p%8zv9nFPN2qrM)X+RFo!r}8GKxOMA{08?xp}`_W(VY9Feok9dF=lCXXyC)^
z>_9ABrS^?)o!58XY`grP{k}q*O#|}mdaa%=h2X1z(Vl$0HH;~bYoqe>{_2fzi&pdI
zTP?NT*OzDXDZWU@o2wJJmks?O;O09I*N110CaVwngjf1~uFF1<gOpZ#U`taPqj-P>
z#Cl(y!)^>jk2*?^<Ev&|5{cCSFi=5kHNv?I0AO2CH^k>c_iXOw$`C3zMm|*qiDTEV
zJyjYO+iZwoRm*Am=@Z4T_rj&Z(igM~GJpn#2OS%XrW2)R`;*p1okN-O$qnZe-p3Q>
zLk(U(K$JnZ?>}alEVo?B>$+;Cx>h+nhcUmHAJc`zn5VdXqs%Y&EuM<}e{2LDAx8zO
zeybWCV?pjxX_?8|dY=9t1Ws%OXVh|!l&r_VQD&*$3;HY8o8I^ega^+I>{SFF5RUbQ
ziW$%(@`DeyNlT3+Q@*^o&Hoe;)|Un3oybbPEH~gv&iXUyMLBlD-_>f_z(aEF91X`|
z-f>_VP5em$$`OQi5$Z;jx%UqPO_{YKO$)Qv1$KI4vgn1w=6!Jr#6#?0tHIAO1<sgk
z@QT@0+GVEYPEcT3{gOq+>X#Rx=-(F5T4sGKpyK$Eb51j63>lsZS&bKd5LLT$Svg`s
zTeNl|O!SsBhQR9`O(m}f1*r2odXDcQI0a7mBwxWnmUGYhC97|Jt36BB#-n@O8rUrl
zivso<cvKCW?lzUlt#`ipb%VlJD^!TeP$igiybl+LbS{YN^|xmvgef3MipLaCC%nG8
zfNxer!eH93f$E#VEb$Qasy`-PhGvn$?5NU3C`Us?XEb9s;4PQuZmywfK7{$gZ_LbO
zZEXwBzAVSmypDwiiG^bmP()-YCdx@2bigwe$$0TKge&{qEic@ws6^e>h<bhGL6#01
z;o$nIyj(Bf)vkkUDfELE4LK`fZF@@{^o)!zbjmI69@Vp~8$EpZFig7aO|RU>s;zFL
zcYTsu)|u2<(_vZal>*?DX=G(&cEL=XbJK^3bC=H_xz3|%H+a_E2B24!=#YPd_?Q0Y
z?(XiH8rEZSjpxMMj`<zpF8QaT)S{YKOa2!~ILDA>oOQh@V?FlMMhASYPT>iUbdt!W
zr6qZa`uw7TQ1)7xS&to2Xix5KoT<&P>*ihcT4cY5BL68k5yk+Sm9OzX)F#mAF#{{y
zZI_n6t)ds+1FG{dAkhxBG|e3kPK;$UWV0UgTE`pRxYl{;a`=vBKUG<yX4Df>d%a&w
zb!{_SE9I0lowRsMWp;@dGON}{B{-sKd^|IO7s7&<7)H$aA$E){(F1BfnW%udAe|Le
z%mXvpJknH-!b-VSN+ax9Z*oy6$_;5AiZHU$brdCQt59t?^R?J}!D2cUR^*8&oB|>N
z0d?n#<8@<roSXMh;3q@^%5iRmVX!k3(|GP^(3<CINlvLQ#Xto%!Yi0SNWRtyNyl+{
zp=j<Lj?_0hEiMC-nio<D^Z+#%F0p0ZB0QkBZJiRzJ5hPXqJ28(015;PTb;U&>^3Wr
z%->n_*~))p&5Qxv7#MT0Uu{O&IRf^n)QP`PBw5Fl7mEqV;<mRNy7RPO)ZDkop}4C5
zIkAwTNz2-x(t`icAW~lZHvy*jRe*Ip&|7qv#)T)kTAFiP7yPSdugdjjNCHo`CWtG^
zHe=azGprGX&BKmyd_VG@KEuy@o^S{ojM!6E7NsvU?>`Qr>lfY;Ih#FcVARxij^VYP
z78oMj|3Y;I)NrTPY!DKgbJxe9Y*Fhm*6gT~Fl$EqFa!H`5+%$@Bbis|FdZhhqm5CT
zW?Ot=k8C)ymWA$Fo$H>-8kt6+9@EWPzt40?F{QAJlmF1of%whi*0*;~2$rlpilji(
z4&7|r-j}Y1sf{;RJNwPp+1C%WSoo|nr-6W?i|Tq8+wJNIq2CH5G&;}LQaQp!_TN1t
z?it;@-ZZ>nhSco^dm!EI_~2K^Q!5G9g}5G6yq6vwl+fz6oc{7-gv7;{aIuZRN${z2
z+q=7^b_<eKkc{AS_dFGA@gujz_l&gLi}{G9jLgiK@fZCkL8Jx|YpFi7_GQU@yWT4?
znq59u2p_@G((Utky?#UVESK}<JKogiI*7CqjVrJ7^=#mMCdVHG>HF}xD<$_6Bp7PH
zs*|IW>M^rZvzBrI9=5LDZNW=+uAM9LK4QtHth<p4z8wkQX_%@if-cNJ=SaLLE!1~N
zSd{8-KA*@0R5t?~qY3u2#jiTG3sCof0BjH;y_1I|Pnz{SP;@(6iJKYK@zYHe-nr*g
z_8L4>JBll{Nkufy^dN%0-&#H#^!nTF!KTY{%i(E6&?Bk5^i=zA50C8@>uvQP_F50l
zOz@fjnWz+E@UNoupW54#L_l>*-3EoRF!vRL=IgU`tTk5c4`?I~iv4CRlyn0M-iA?d
z#h5C|9K2BkcCaMmh<rxX#_xE<MI}Jb(3a?E`Nn@}-I(KPK+6R;0gThOvJLh~aagt2
ztqNzVs*WZ6A)+;F5t0Q1Da!LLY{tG+H|^wXo|Jl9k*nhG#EUxf{G}Ste##dOx!E$H
zf-W>iJ7{Nr!Cx>f*FM>A-zBg$UFM`JD$_VwRW8Rmy9f2EP!5aVlmlM1(1$xkxe_lE
zfXou-T>*r&TJxQc1V+?TZ^6E9$+S=_v{`98M-Nm%9Vf}Q9_@ehjslB$4s8ysx4jnu
zHdH-x*_zxAF5(;U9(Ilso;v$&o1fM5pMlel%AeaGl_aW9XUBbuu{P?|{hjl$=6MfE
zr?Z~Q7c}S&jpV2@x~*r%$!)yKnd0R=2mJN`C<{wm{uaZz&<m{r&NXP`g+5~)X?kdx
zPC%h*w$eu}5)Dz8?a38_boF;Wd!dG(9x&7&4#_8T)i116<J{D55^P!iIJ1aXW5nOO
zKCWuS$0hNog)7#tkv$`T=FdA@R7?Z@=LFd>S$#C7y8<&$u}4_qI2^3@es12EQ3V2g
zGvss)kmk9DB$Zwrd7+E?h*m{0;Hz7aXyDU%Fyhy`tPi#8^8x7rMpMsD`nc2FN~^c;
zi5a_qJi*d2KH@uQZagCf3jV5fVKLyc^zEZk=A7NdGq@6Z8N$G$0J3Fwk$V+zN9>21
zD1j{kG3$)bUn|sr<FQva<-~7$5zG)6f(``-n<|rIS+!r87)>7!TUVi;&R-#RD>W1d
zl-!k%_y}*WV_gL4RyHE|<|%LMD#N&?ZL1f8BW8F}ymsnO&c~+gx4P1%enyml6{<=`
z90Beb3^Fe?hT@NCE?1BslRUBaSbtcXwg%%P6D$luD;-%yRgaV6|7!^#4Q;14g(I=j
zCYtJMKI>M1$XS(-&}+4CS|nmHW-=feAZg}iMZ+0U_RE3v$K=0;MHw;6&g^c7wt5TX
za>E!<M7Mjj*@r4L^(jhTRZhMC4TY(}d_jk1Q$h%p;$&h%_EipLiRvy}Jxr`e{5J8d
z`n4k<|6q`6FI9Rhbm+=iufUUhJHuG3K!QBU-&hR)p0)GRP?n~l*JzHC%|#I2_9VEu
z21qHvcsdFW$+n0s-Odl!KhsRk->VA)lG{4T)fp<eqQO{o6}8~%b>X?QuuH%!-l}3U
zO~zu<EYLB#<~$t%X#u#2Oh<Gr$uVi8x*3%>&=Wwu*qRryt+3~1sgMXxJRL5rJnk35
z>!L$l)y;Cl&1rd9t^ueByABn&^X6EMPq{v@(}<W+NnpXbAVoK&^V*<j1BjUo#^k1E
zyS^QJieK(Z4W?BWe6~Tv@t-tQ=02vTu<lp06tnqndk?>gqZ!)HGALgkrS@T-{20uX
zq%p?F_BmVOH_yi<4ZDAp6AJ8Qs&&<@0p5rBdKVQRuWolyx344-1YwR-5>bE3=qjmm
z^aj{aR>2F4zgIHtDGKZWf6n>~w^fqS_(ifh%E9EfD;?2V+MyYR7=Z!J6BfBmvBwHl
zm}7S85qw$+DJkq!K9}|~F`D=$Rs!m4vrG^2k8FosG6)ME$%ntr<_Av-^x7Hs&vT`E
zAO*9@Z2iu@eFlW@!oN?)`Ka!oFZw>4&i5BoUiXMJ#^mZ!y^dkz_bNK>7`)&`HHH@@
zzo^xi@!p+(YH8cB-64FnM0FFf<F(^4tFAPvg^zDdVu){NHEOhzq5kn`dJ71!rjBN7
z5-grflg}U8o>aD~=a2cG52Q=g&vcC#)Hr0`e!xj>N>yJZRH$K0K&s*MBmJ!;^AZ+%
zOY>9ks6GVKbm|3*U^u1ln6@5}x+TBIu@1AIsx0_%ws}txbAi;r^{H*`Izx8jmHGa1
z=g(}+bk4iWHe%&>VvV!10o9$IoqaC&jhkwtK)AODo)TjO0IZ$&9ku0(%>F_2J0jFI
zH8nJi@`tXo2qz%<XS%o8e#}dkfG}YdQ$=D9{Kt>{a@K^S_FSgAAu!;`FQ*&T_(~%D
z=jNHO8h&dxR~mzkss<eHNJGfI?HMTbR!J{*fi$GgwXr&N{bF`H$oQg!=-;&+px%?K
z+!W{&x)pvF&_H`Ncr!PnR>0cT-ObX~*~ugXfQU%k4ic{lkH!O4FLO<v7u=(Yy@tGU
zgFgnpcrm7RFN|4d%Uqmdz4ODY4|m6(r4l^}Q8-xZKlzybI<eSbkkrs~fgrDg5@f3<
z(+HTq;qBMt4EM-~lskAwMMJ|V1Q(rtB5%jrJI)rmsT1?2J0Ghc#o<slAW-bvJMvWg
zJ^;^oA}kF54!oz+w*w?qkB)|e=AGjSZDmq-d~PmiUaz~&I`)f73%hLDodY2NZ~jc3
z+kxj248`KR76Y&T;i#tJ+4<F8xX<Cy@WIF&std3IE)fDp^s2G5mm;hri~Dx4;f5J!
zK!uH*JLTFS=ewz4=&a)f&|~ZJx^$@lZ~`<Pqt|fgPNja*84#vCsGJMLB@R*Wohccd
z3tcE&LNs1iKv>~M{v{1ukB{(XeN+o32p0MR5boD!YZu5km%6ReZqE)LV;!i^6wb+H
zDz{n4%vK_x;jImOBWwcF4#U=<^aEOAUZ~4Njbk?4+N`efaAI#33cdl7c=q9U3-9(?
zbN$F)`ZmNvf~?hg`&-%dUs-IG8w`HiNu9$la3s__#dYJ18`Z)GzSE<9&{YlrZ`p_s
z51l+ea%A^{ycCxj=x;o9<h+2zUw!Dg5Od2nge0Y;xe-VIB}e>zCu?4GKt9Yl98n3D
z7c6+~0la)7>)>!ex72iZq89x2UNY<T(Wg&I%W7n{HmeH1#w;q1XtPy>Ho9x89|;u$
z1s%bOAUQf77KGp+uw{948dtM5QZZgx;j5a0k%9uwu;}M1|6<z%B?dZ{^DmnLQ*~F!
z#vAV)lZq-3c#=*>e^}VktZxd^I0MgB02kQisw>q;YfMrCh94TEdRFGR*0)$tm`n2f
z1Ua**CR~vmFe;{4t^Bh<HYis=yMD*#G~n_uTl}byh}f1yG#FZXG7Rq%+njZtJx<`W
z&H%Dov+B0GEV~9ygVM-SegmH?=d-b@h80~>z#9OiuFL&yhoe!=i*G|+jXE?F!Z6<~
zJ&)}QBs1~xr=LhtUqhF8h+uC3;W*de<wfFBky<#+^a^vK<B^Ag_kMJ0_0o$e95E_)
z1BOG2Z6wWAi)gD37j!INo5l;k7>(WFs+m>Yn;&1oy8z(2U5KaoRI4g6B45=H;lc}f
z6smE<2Vs~}H$iLI_qjRoL6(9oMr|PCURXQu9WnSs@(b0cS}evMhCJ>K2tCJ-!omE9
zlZt5*`q}+KVpOv^wahryD+UGCl$N<atmRp7tes7FOwn2#05I>Wc{Z6@f8V;5X9Z4u
zzl+|8<=ZD~a~H`!OTd0QG%5&jcrhqlBqnfEb;W4YbncFvqHI)PAjX<53J}fqlFoJr
zf-k_KE`=9vQ!YtbNyLO<?eG>s8sNpwL-cP@bB<5w*aR`|nKQM{v3Fbh2+qz&UqLg_
ze=Sa`)%t>-SWfXjuvx<h44nW=RMUc*$u=L5JuxUY^5fBS#(W#cVaOhUg}<-wk43@v
zLn}o#72oT1udrpr5s)rAE_9e8<30-Jac%`_YAZm%o;8(S&Y8M>y6~2&3zJmOh%~w8
z5$Hh%o3g|>=m!Fi>~zF#X|lq4#bfRwr6@F~iv>F490$?oMch@CP{aQJSbOhys^2$$
zJQblxLqk?&6oq6(Mq6Y=_O3*BX2vlh4P_*w%w+F94u?<)SsBM3iGyQhJJ$DlmGger
zTc5ta-{bfDPvUsp_v^Z^@w}eb^QPMW)ajew6(^EmX|95ccRmOAg_obq>pZfyP$3ST
ztPAeVbm_T`kev=xai&@CD<}2Xwv+J$odQ=~$lF+SN)gmfbMguet`_+QhLA1t+K#Hu
zAIR0?5R)#n9dpvt!URI!uZ?Rr7qb(96n9&aUv*RnctVR$I`Bk>m+Ud@jSn_Krf+#6
z4rTB~ih(0`JZ6wuw*nOqKDE&`mCOdCXtUL$9102?O@dY+RyiMg{?eARoW562Z&wh8
zNJqDwZ<shIx1lD9H{FbI`R8L!9PT3=pjJM*<V-`N*Q|@Yc#f;OJ*)1SMq`)HI0-3Q
zPECE@&-;`mgrn@_>)5MF$~7^ljux1{a$se6u1D-6A+aPfYIFCyMAHu4ANiT`92v}x
zJ>VZTj(d@-c5BSoJ*mA%Bcat>k#^dmPcFqI5vLG-HEGRgQ=`brpkRrg&gxVUoI*z^
zcg<qd3#TCC{!VK4mZD{(Sba9vWo^~=fI;fKUQ_(_Vw;w>!Y__YMR<%UYP`o~4b>nq
z2q?Awho`jNHO031y0_u|nM$bc+_wWKHu-ML)Y@v#npNEePDbPVZL)Olsg#9tJ7&}c
z%sLJC4<y8ezhGMK-BxRvZ@{9dbjuE>Kv!zqG(L#${47Y#&!t~C8M3xivZfJ!|0_k$
z$K_=wogAHsk4T4>Z<A@9u0+8Jl0MGV{PW%S`>8};UUV2EyMQ6=2+Vt6!Lz`S?3&Cz
z-Dy=<i4-XFMQn26C(<x;uM3l(kC2m3bQUOPf3>@-cu8AB2?p4yAhC=6b7JSRxxvE&
z55rm!o@jcSmb6X!8_p=nRw-JZb16rb6jfDKqs2){NiVU>h8`n^abCURBZ_?)LrFm=
zDx8Q~09{LA5enN<1{j=YlXPB*+q^uoXLVZZ3D+Zyw6G&%{avw34skE$zRx9n&h3^H
z-8oT5CD<uHe!&SMT5*PTCnP?HzupI%-!Ys<-CenL2MTp<p{20RG{mU5*xA8k4-G;A
zw3*Y+>e_c#Ouy=7RJf?4=d%fh@(uwdzYCsE2ZgT<-03+*MooW!*IP^PK}vBk8?%Yv
z8LNrKmpP{A<Hl7xa!schu2eYS!t6T7^i4gcbxNF3YLD(Mg*<&<JZ%hEap6hL3llQ+
z7j(ASI(+}I|3YpEWtnZ3xijLh31lu;T5C%k^*5K<`kOP>tOzzIpemX&W*OV=LJ4=t
zs2B6`5u?K=Gg}-%q_g8n2O;!P2&3~tpKo!gv;Mv5ag7EzQ$2dI57Osp4v&4&_JX5D
zS#az(Ci6dGSoinXYaj81tHboPLCv&j($4L3r%$5HZ;0c*%<r4E;$B&n7T=Z?@uaQp
zleM-6+ghAV&Oq{+KO9tBl8Hl1b2T(D^9&<WJ5_m#R27cpWN(`ScSlXJyO=PNw9Br#
zww8L>rA~Byfe^HBFe@zS2y=4UBM6wH-{?)#Goc%N32I8yPjj!S$?^6bRwwG9VGxm*
zEW5xbbotWeGCA=T>rVwrw~K%qwD7UfQQ^zl&dd=7)CLsM7GiF4T3V6E*roGhD?
z)B2DMZjqume3rn+M;~e=%&e)FmXZi015X2v`{HVUY%soqDLD%4yhVC@(}1f*sCK0N
z>EJ(by^mdgx3uqpDZbOAU}mRpSV6ALeO2Bp%dm|0JY%J=!8xe633JC|M-qZZB6-cb
z&(2$Ze0K0??0M5q4r4TTnI;5GHEvB1dhc0lD9J+7nNbAzYw?8>+C{3h0K)a44fkDR
zRUB^5NlL>bHLv($rJNIfv<#5sXpn#bF19!jEv683K?@6z!>Kotc5OFk0)GGjnWo8F
zh00JR-hvp?9RVY#i!E)A{aVAAo!ztCCCiz?o6_w9f=800aJn2PMNGTy1BeBz4vkJ{
z;B>`OroovvOzkH&8oKH{a`YFc2F5e<{GeE3`!<})OY8B$L#Jz?_dDQSCy{1IAtu_B
zLQ)FSnlLV6>jNDkk#;Rqs3DK5{UJn;N~mH`T@}v{v0Dv({+{AxTY94_z#szEg4J@l
z^5Me=c*ut#=EZ8OfEBi1G8o6Kabsp)XhN7P9s{f91M)zg?Ech(K{|Ut<vM5mv<pie
zW9oWQAipziaHyes&BD`m$Ao4?^TE@1KKUNLP?QvAd*@DUFi(a#CSmSm&tk2e6W+QH
z{99P3;{>L7R{M09{64`k9WV-*H3vRg%i*p{*v0iG^n<kLy%R6nC$EvFJ<;C~n2`FW
z=$|4M$~nifhi@;rjPz$a%6VF~B^<x{!q=Di`}gm)KE*-Frc2?OVa5jLBC$1}59R)r
zf&N6zB@#BPH#e-xpUV%f_HYk-`j%}OH{GZ|?J0lV0%Q9$+s7_s93LjtUeS@3*}>L|
z(|i=}v(iBMdf?SH)jEc9ZySI}uh1Jo1OD(zoJ`0dUdNx-Lq@XQ&RNuP?nFDrF>hko
z`dm^=JHFXoMun!uitf}+kBQK0kt!-d_PlS*dxRWNv<VAIB{~nZg=3W?xaw}}2x_m*
z;<1kyq<m85>pN6}Fp9~@Z=%Kva8B4>3}Z)&0oJ1s6EtXyR~c$6wq0H5_gNyeK77RF
zEEJvAbqA+^uMx$8&!J6ykiK|yi=(<8E@nkG0fI;C_FJsKrc?hATNp{qS^Jo}Y+M?k
z5IC!W*U92ip_y}Ozp*xcQsuWnu^&nNb;?$YbfkOpwk=(iha5PU#!M4(d>wo*abZUo
zDmvmg+GAfBN-oINjUnB+CyyML#`3&s&)`C%R+i?M2&C=_!hs2!M)9}yKR8@!fs)=n
z-If8_?jB19FuAVLTAA5CU+35t8HHT}GmF^i@2h8Ln-sxkGwvw*cwVCQ#-6#bLhTB`
zi^oMK4EJ$}FegK$=zXEK=7zNQLg<iK>{Igw(0TBB&{wxpe3|EVGQz#Fqj=Q~v^w8n
zaYBQS(@NEDYYaF?R6i+%05_Q!Z5?sNbFF4mH8KP0I^z5kvO3O-G0+R1?^KLV`+&3%
zFS)GXb-b?4P8?BG6VBIY)t|^p8DoN6@9+xLs0s*itLIdXxdn%phJJBw*>fA<<dDkM
z<!QG6u;)dt$E1I>=Og5;z80vR+c;sCkbEaa(gq@a<SGn?QDd-v4+;gg((h;s&~J0h
zmaO<bmyl?iPx;1yfiAp>G7Nx(*Cjyb=z16F>4ZVWUVHV`ENh>-pDJgdLmVI_e9=8I
zLE0l@U$c?@W{3jb7Oekp1qxc9V?5)_@1N{Bykb^3CSX@60KAc>NMYhJ<Mj~WriPqV
z+tg;uqYrcV$%~v8Eqi8%&ns>9IL*uZ6u1!#md<Fi;V&`8R`r|WmG{qirekQI**H!f
zY`}+|v5GYhg$9Jjjh!vdrN&&+^*L<N)!dppuZSB+DM}W?IL^;Kk2!Y-BWNoO8wiHQ
zC@2*0Ath5squby@olL~hm7YvV#Yy|cwmRoQy!xT=<2@8v|Mt9o`znU=XY|0>TfO{i
z^hn{`HTXHlbn}fDuLAJTnv1oPc2^{i9g@kBJJqLk%1!qb(vCcH>*KRsif>x9xa7*|
z@Wp=KisARF(Q@a`xmlqg0jDTTO4xe><1qUISbXP|lT~+p!EF;?a0?zm*AhlYP0lQh
zX6XZNTMRAiS$}+Lq3rHGdp>y3=|gk5cnlqhpH=Nn04VzA`4lJ=2lptFwrb@*hvth^
zgcxcx>NIu<A@=s5<-`^*0!{0yhQR|r=-K3bYR$MckX0w<Z=70iSr#I*!C3~Z$S_KH
zzSBw{aM&qGCm+u8km#KvF`O{lU1QVffKQqFe7Y`w=@n(>&CSW{AthEJxv=WS0Iec_
zt5(ZLB^51Jc$nFg#)sROoazfa@6^10k`R6ZdQ`UF#t-~!QPQ%qw)1Vps6uN5xNh;J
z7^(u3LE)>=JO;J&1<-9NAHTCXoY(T3WCQNY4XatLxUSM0UjoLv3PrrwUUDIvq^@tZ
z<|Qk(rw*&0dZTiRHsiyMLfgE%x4uMQ<wX&!d(c7J4wd$@7*3gE+D#ln!&XyJH{~a}
zmmD4S?8SUB7%E;G&kE_X=bP`@`ei`Qh2UT4!>Cx%h)dEd_Z%kx$)y2@KIcw0j@CWe
zIsK;YU4V-Aakc|o=9pP!i~V+OONG)Zfgfa+@Wwfr+8RNcmQOwhpStkKhJ8i!=H?Y7
za>PoZhbE4RT$)yYHfvC&z1`}MCzj^1EHeEccMB%Xri=Ap&}>LfQ!`WqON};RH}6RG
zsw}WC5B!q_D!EdYy}8(|)Ru?#-sAA_gK@S(vT`uLxmm#Ql_YPnq?}asoWyIlhE6fr
zfAdR^Q&!KBD^$#;^_V><s5h{?Zelnt!qyW5#w0bmzmj7g2RWY9Fb5Z@6K$1?XL1}p
zB|Y*vDe6JGs4Im-P&Ia|s+TvTsL`W)gFwuW&B(4w&QniiNInr@VGKV+;S@A149WRu
zQSLRGPVFd>HQ)tT@dctTTQi1MeT`jGh7dEB*TeN)c*gE!@%Y$YCz-9B<Q>i#%h%eh
zZvPMMi3W<M0a)Wi>t%!U+#7Z;-T)?9E|}l9A+<}w3%yafZ}i-gi@R_%b9cFIw{K*E
zg+?|cEs9(2t9$L|=K4Yto97apOLhrEB38$9m;@`SR}4cY!np}_8ei?T0Ai^<9)IO7
zHnPJ!zmKfveg^Qhy;{*W#(tg`kG5^YhDasV=5)9u@<M>%X@2a*_wL|XAIWMuUF!K{
zkO12I>S@OH=Wj{wDY~_4N11B}MjFd(^^oE3Jfg@Tn26s&H)8xnB%$9P7pC%66<`Ug
z<OlPgM7(pWzs9a`PUq-z$m}1Ui0Ykn2*Rdl#67Y><{go}G1mK^dqYFxUHe4)S19a<
z1CxIQ6LgQdJ4YzTm9h8Er`4Clrl+SPm;fu;L;k%>UOLNB0C0AcSm`2liEK>0Zhk%4
zJQuXAqI3;U@m#zP%uZBkNfkLc{?rWJ(Xb#-wy|iEHs~i2YR}c_%wqs*2;;yop=SKd
z9rIl+_^|h&Vj_HOsJ|6`{QmgPvy&3hsh8~S?JxO=uik$`8wFxCn%R~ERlcX@05lU}
z$JkQMDi222RhI7*r{7JMSNEhAl1i14tSH>f$3x~9cVI@WmcV}YF^D^#{W@HN;Gx*0
zfZ%c&7;<%YYtmUGVEa5dpAN1X8}i@ROjEpSidpTA-beR%XI{i=#yg<4hH5<^>FgEK
zzn8V7++r+UQC(HVfnFux%e5bAcK}{9ruTL=?55r04+d4?hyLfmjO5zp(f{&Y(XOgL
z=$E}b){EL+nrmbBpqxN;saCUt?IOo3wSrpJv5p*$d!O5j8$1@@d)VpE3^mlsDQQ6&
zG=0fsMs>c&#YKrB_FDgI-RNMNh*7A^uYJ1ln(ywBvGyE)XiG?+KYzaI)+?H*WNnOk
zu6fV+C^qWS_TjdyxNP$tv5`}WQMa6(i-RdYWje1ooVoYaBRVe5D<PPptI%%enNE;g
z>vBc{$?0053t#*DFAzRVQKG2KThq_kj<z1Y;!S^VJWl%xFq>FToyzzq*LCB8P53TU
zH#NNwvxCcwz2Zc!X-DAj@{IGakG6q=!i!+v)ZnVpQ}@F3(Y_J}d%gwUZHz52hL?Z+
zs*DV+qFU?XO7fv=@g4TcJwPqVi!dF+7XV0V+YmO<Q=)T?)~xc=CyS4#-R9C)IvF@J
zuD?n<i87m+H93#ly?;OMtT<56Ey8D?hFfZ(VmU_2RyWu)V$@A!Ze5PNp^evMu3C!4
z)z8n*Ug^1#Z8a8IZ9A1ahW-}-{4Io&Gt;;u)cUwPKVZJulR&5L0*=s)j;^OMt`<33
zeA~`%a#J9^mScJla_NqVaL4goiuP?lUq#5(UI|j88m5U_)xdpp!mIw$4*3nT96>|7
z9qs(6Kx~7DI;I3Y=bX1ca4Kw`Yr482tzH=43C#e1WokxK4%*X*)XzCL@#VgqQ!ruE
zq$R3fwYQ+p^HAr2Za?&6eSyPGP&T&dgBI38OU8c|_s>6@Y=A0evqEi!+OT=@iLO+n
z##cIWVPGN6hon!TZwUFd8yWAAq7>o&I=+OQq7ueIVt}(SF5I!O&L@U(Pv^p_1hFEZ
zTiCt&tv&iru20S^uY)lDgG6d<HVmsvTqHR}*+RYEa2GnlbO;bUH;z53*@k}4=+E%p
zUgk_IQXt!LfEj4YvdpSW50h+*At5{{WTE?MHTnPJc0=1Xz>gaCLn442VJ8Pcotk^?
zmhrI#0Q(NpYqIeR|I%svXDi|7wGi=!pm8?rgMYvl;(rh9hQX<>wspc;kXK+BvLvZp
z_n{R#;4L!l`}~k#ppZ7q(VPV+P`2m&`}ez-GI#yj{rUyPjIW0Hg`esgX#eG#KbOtS
zf$Uu^aql>!gb_<oV)F&Uc9L?+ixiDKVR2xSfutqpN%d@Bu#Zo@rS35RT|(v|uaA4T
zL9A>2rAe6Xg5_z9@5MdYuskI;n1XcJ^ut)#nKkv7cWkWJezh?9pQEHN`!+m(<lK*W
z;DU98HWf7=aQcr}4e=z6B*7sfIN%D*HXI@gWK2S(HJ6I4;|z&jkk|h*#h))p;u)~Z
zy}uuNKfFOkOQLx@3@I~KuD?E&6;$sAjjUfx8$K`KC`>F^(jO$<@CJ=C;9TKZ*Pp6S
z-O2ro&4wrc#e^fnDS-5DAQ)P`VdTwC9(mU%iSN4UIsdPFOf<cJzn5`bLPAJjV!Oe^
z4KJ|y81e!oi7)WEpvQ#`yYSmD-H-&P#KVQwgBun&@&H+24sn5Ki?{-^zb?=j>dI86
z`BzE5%8>l{Shw9<;SClNKWg`;wm(GEUpAgb5zfV}5nBu1e;2*}mHZyWpI3lz+7Ctm
z|2+dCwm+f}#NU*#2mcgw<vD7jiOM1-s{N8^qKbK;UcXLBZrqV<Fi~NYV}a0yeRzy;
zi*nM|Kg#>^3o+u~|82MbSz`t>yuy9sn{gZ8E<Yll<FK1ZQ@U)vYulgL7yp{pF?V<@
zUfl-TjSn1)yu#+TpC_jeZ9h@KvEkAG{UC`*E=qWXUUmV-8}NQNUSzYzZ?Ct@sxL|z
z{OyxAxzX(fFXO&IPq*QzZeBomSSBVNAk7x)YGKmJS-W||5B>VKBCR31#T;tbI8-!}
zk1SBXeSLw#t27q&f7^Ho2E?^LGGhz+gKI}d=)0f;@PkVnR2PW(^%;n6>fi4r>cGjF
z4Y9hoVILl!Le6tz=DLlZvTYP%*ziNYZ2Km+$6)VAzoh?H%9Ld5h!?WJS>gf-Q+yU-
ze_i0%epukr#9@_<hDEy<7Rd0C==^A2b#1_gep_Xt3@k9`x)t+=XMe1OEO0t&eSsMc
z^FkYov)>jN2__mzUcKSb<tGr&z}>n2P}stX2iyM|CX7<xlhhsYLiaX2Rs0F$slF5K
zO8@R@>c4viC1ecANblo@<K-5-AGS*L`nnqh4LZM#8g##z?1H+hE053S4S%o65uQnz
zoam1ynD%V?*Mc^F<))6ro0d)v*}cDgJhGRGQgCc+oQNN#M0n=)XWz2E$?|PrRGb<w
zzi;?6ku5)Bb3W1W+2jT6`Rk^SAe-*sh%d0%u<7ZDJFZ@LR;@<=H<3CdPt9<CB=j2x
z`iG^&TOx073(;3`lu*(CW{n$H@d6yX%5IkOf1E1Ox+KPs@pjB+;#N6MaDyQEhIjMt
z?==a+W6h3vTVaSF@y}1w906~PE?u|JN9h@VcU8=nq4cg8dfu14@p%b|srwkNd(fl_
zXA71M+xgp}d5UBV!Ay=D(o_is8f1Zci3{9j#uv2ly#KP6raj04zg@O^^~*PZuAfE?
ziCm9}k!!SK-`^jq6+9@t#=LvhhENGQ>&U6eCYqJoq4NKW#CjDn52|T0x-lEDxr)Sy
z*Tl1|h3?n<tBRa_9_%}IY^l0=L%Jie7co&S)Aew(*VlT(lmB+s9#g<xow|2Oh+@M=
z#9u{h)G8hEd(*lS`D}GTw>G?-e@y4c8=-kF@r!`e9w>NgZCtc+{qsz*AHJTgb#hhN
z>&5=@%*LlSp}603KHW6T_!u(UQqdyXZ?eIpemfvii04P|65a4qk=~R@o)iA#y=>c3
z2IxfMTRP2se>o6P1exw{#juwbYz39_6<N!TMY+5gvKJ)8H&kHX_P?r}pEe!&8s3n~
zX`x3OG)vuDe~8zdUbkj?$NA@{H{>6`y&`fDIut6}ZoDCWMKb<K=`x8XcxC6-puY+}
zHd(^U&RHh2By2bs^7oJh`VklSA?zTD+ge?B*t^9Wb8Ad%&sd**3J)8-nooOO@Gxrt
zi(t$N8}^4cUYMwDS9`${oq3z$<n61sy*`=ZFJH(VtqP=3n^<!Z!xg7Zi}b9BobH+U
zJTKCNwLfc}Y88gp#G%7+pAXbHrvBA76_6pv5h1Jn8!Yp&F3BFsmcy?zDab-Zq4DGF
zx`XPsE&J86Api01lB;X__HElXEStt_Guz%|D?$A|I|LlTSufn-`D>=fEDZ1U3eM_Q
z)5ecFk31BYOxsrXns8SO^3q|-zdjRlGDNKMDrwxtPohE|>K6a{Lp4mY96b70^L2$p
zc2M-ci{1o*o#&12L!R}|IkonB(_j7O#pe+C;_Ywj*cgt>Sar{rwwD|a(M@mLLqi=T
zwz2{L_{|e|K!#uue`$E<hAoJaedqDOrZ?8)LFpYi384{2&Mkk9#y6GWlRk?%)ICYl
zEKr!K0}Kae|3$6_*nFm8fD5D!F$w(FK%!)jztKtj8|~p7{Ts^AUmxtI3jB>xF-PM;
zU`S=n(e0paZb{P-AMPn}iATR>`tQe=alvLd990BWj4XC$`nigCR2$sTZ_esG3!LDK
zz6~wU$?k940aJ^5X{s3yXdjkyT>J0af3q82*;w668J^Zr3i3x%A<lpQ=(3aW(Vb<x
zT3w7h+-tHaC=OA~{l}pEPQc>|UnV|orJQfZ1_%7x%M$_{7vaAd8Tz_UcOV(I*ibU~
zzvs(MavwY>!`pR>@czdBsrBzq8VcqfMt4fy+sjLORxR_XMWVmeh2OW<jfFB8eD|Fy
zwgV<}TRr?AOZ^Y1dfn9B`1UX}hu)b<aOrQ-7H$3PtK{)~t0R0SvoO$wI*&mEE^w?P
z&&yMn<3>EQOo%`L@DZ<6Y(4N#E8lkqa%iQAhn82jVC%1jv0+8bGLVMFQ8<qD@THWM
z-iaLyNg51B#NT~iZ$@Ur{f=HCU<Tf~ZDF+=?{w~XUsjpd?H~<v-@`VE09fxAt@9*q
zb@UYyT!{wpFFQC*ef~q!>)$gi83Fs(h_jjvRsy*D_CQqt<7|SGUU9)|_4$6J{&rQ=
zg+7ZylJZG|fGdkYT~Ww3yzWC#O>9lqa|dc)`NT^=!8xGQ>C+<+`VVRmb^YDqgfh`M
zp34QE`fH5;fyR)97m~U2Gt+-oX4f%4&Zxs49BUhLciW+MeI3&28YLZEqt!|Pr^;<y
zZJ1^6JCdb3WH8iaby*==a@TRq{Pa#}3n`xw72(O7q|n4TG_TTrdV`jRF5vB|m&b2(
z#n^-Tw7cV0WKeEqtOIM_4-6|APilsdJSui#6m&D(Yq46`ynaxw^!w|7{*T@N_D=~D
z@R8nbxb6}cmxDaI67OE+aulmdy~k3w*0$-+R-Vh``0i7Z0uy_gH$PCi$b1<n05yP5
zz=S{=8c}Y&5*pAS{=sO3mV-2Kqqgwl&TbBT2js|sH;))83p|Ux{MlqE?Mv=9A13MR
z{nn9V%noxJ89g5n!vhx67xP21|9H)YW5}Vj{eQjhsaxp`8w1>p*;lWQ2n^vCT!Uut
zSUJ9Edd`kg_iZsiN8@#z8@(-4pq^udaAFJky+vNwi0-$igx2#VP#Qlg$I`Ncj!!aC
zC2f3GlkY|`bhoBPlF~e#;-R}JOGnE9tr7VdtK5<l)Y2TxHZm<3zhJ|`WH<|;y>s>x
zpw9w&UTUat+*V>xf~9citsh!@xebTrH(wY9q1Yn(Y{G5t)2+?!{t!&=%<3}CJs0dg
z1|}2ev^aIOz;Yn^@^d=Glq<tT?05}m3xZB+<X*G3sew*Q%za<<h!yntS%O{do|*^N
ziqzZHV>xPjoR?Dg4C|SVz<X_*A5uLhBoxOg9r!r)&bav!fcyjBE12f7EHbrYU4<%O
zXZ_RNxVng-g@t$GO<%LN$gUSi5@;l7hQ+TtHre?!lD}8OUy!J2J$(!##{&AP6O{Xl
z?0Vw_VA?K?>$RXc7Z5mJqHXX5quu<o1evdW<&UIc3gx`;AV^450||gtG4|TwF~LCL
z!u#K&ZdV7^;9gRYJI3je>P>KE$alob9C{^elZZ_aTj+I<;`|Ogu~PhEcCu#1&4*2C
zIz2cVa`L6<KH{rbhGCNjv-RtzVjBH#)%T~bE_%VE8`>*W(i`w3)v+1O_HNm)T%GN{
zs`6@w?I&O^W<%pb0XmtqqpZ8IsW3;*d;62GuTPSM+vZGY&M9NAxs3wtG}@#sQ_PW>
zc{I$^HQg>qHNLsN8ng-YVPGc{Zsjq)WW93E8zJn2``w=*o*voXTq5UWy43?!DNnpb
z<TCQ$t?Lhd=;VKc*l&k<(`G*|2zy^5<S9Sy9~~)8dCDEQ`+JVRb==ET#!=@ig%~L{
zPUUX!GUIVaR__D9#u7&IJoQ8I*tDRL=A=h46RN}3AY%YBbz34DS=S$YztK?@=K3Cc
zK&R&0PVxSXO-C*vxx`swE};;<um4}C{HL$TkznsDzc*s%-auYOyjI_X<761787rrH
zQ+Lx~R_T3e&=6`$QsHiu{!-MHR<g=5P#u(~+`7Y-2b{Wp)FrPf*m;%;AEtTxHt18O
z(2Af0dN0avhEcYch>n7R251i4B`0^Zdm~^;3XGUrE0IsqcI~E_W4%DUhvWbf)^4qP
z7nAJPzxs6Yi%3gP(&hZ|13H?Tn(vbE-|#1M_N=k!Z=W40t#!mz`d>i=Pk>!uqkP3=
z(QO-J`uUpD9g`rg6a=DN(r%kcM+d>}_`wMV)=AOV-Mr)2v<Sm@A~!lfuSFl5sukrn
z2tq89pkfgNM|(FDlV<%AI9H_WhOdioSv~%6`~KYXwRG0CuTC4pdme|ztskQQHBqu=
zwo>VP*!|^k#gCMFxT*k7wfSKfL@xUN@sL;=m6C)|&a+PTsksjG>ZG*d5p7c@{AmJ=
zB#id!Zg0yn2<j}b+Sbu&UI?5B^@*N07ak?cJC!~ljR6}`NLD>nf@K|u_8glP#flTk
z$&`|m13=ZntM~%?F7q1jNoPA^yyY+o=rA!<J36AcPS|ecKIe^i-y5l#YP>+Y{xUv>
zPtz)71Bz>o*d0)#JpnN`Q%s;)X>IG$cT>AyGE#;-XS0Tt<|LJY!4UJnr?i|>xh8Ed
z&b|f*t>)sgfcAAw=RP>H9@gHGLjuGY^0Tnfd;5X$@7c%~q#7aYks4fxGM&}M@qvAF
z125J}`O<BBz;=~;x$ArRXo`%QIXJ(KB&Cp1L^u=fHl!QDsO=?{odTto=Z*QU#c_T$
zI#7>toN2g{lAe*EgSJkf<<ri(^E@GQo~}$<QZn7AYx{mKP2W24HBCNOaAwN$jdS-P
z*+_9UdVBe~lXsihsB*n|CO&KRs~7j}$``Ct)!ZfdISVBhY@n%+23K%pJip(2O{7m*
zJ>TLDGRbNA^*u#HeX8fJm6WDrPGMu$MwD?|W{mYnQzfQ-K#2dDrrFQ{v%Ez9jRXZ{
z!<Oop%0vY$kck~IxsrZIcwwY}snc!Cw%eWg_mD6bw5jNBq~7e(M2XI2(7vLhlO2hj
zs1xjQItl|VyUi!^=XA2}$UxwC-OH_gR(AobBB9z-10UePpbhkoOFgJA$oRP-#AkII
zm_N5Ui;xq5eN_!{X(;8YybTPe1tO9w!KZE&p<m0+SY3s5FGZ>C^qtR!i7VqPqB>T6
z3*Y-wT=UKdIJ(FZ>=fV+C&v;xXKt;o%=hFuOO$C&bQ%YvrGvPlIMtTgX9y5p)tGRE
zQ>mQwOC2*>lY>0BKf$C)VQz`^8RGoesUwj(alth&ZPMN#wT6ku|HG49Nv{K0q7zx#
zwV+Bh(S>&pn|a4{FEn0iougYG0TNs*Vdtd^QHL2{I1q#}sS7D|bSJJydGy#iD3mmu
z1(8h7i*ZSLgm$r|(bIPuq8?%!WnT070ntGn1tn7T#KJWVbB4PTYVHpq$D6ioHx45+
z<qu8bTqSF_j*(}GBbyd5@1~D0s91#XpnguzJn5NHy#vGpMl4HC6sS7z-h59U5%jR*
z6YhDJY_zR}YWe7@a$7U4l?|y5mFq|r`5?oWRld%IB+6}t!$N%VMZi*v<ZAGF1X<3K
zDV~!#`P@CKGmaf#jdvbCvI!WGSP8-NA6u?ukN9-d=j_eI2krQ(_dr1n9m2Uro6zlE
zgA^b|seFsp{-MQ@S$G0ktrRS38W$~weo6o?VKS4&0;EBm-182}dPY>Pj@##qKDFyC
z^cX+V=D^j2up`-zr6;kY^q3#<u=eXGwNKTNGnkv04*jXfrolk^{&v1?k-;AF+@5I%
z-ZLb9A1bu{p2t;e8x@J6vd)pyLh&i&ajK+Bg0$!sPbM4EZXgmqw5D6#T!tPQ1iE{&
zl3*NAQ|F7(iAFFDr`4`m?4-uGunY|Rd{6|7EUlpBRQ`layv@ESStUrv%0-xwy04_{
z8=bwGCq>1A$58I)8ntBWB<Zs_RB(;$vAZOwf_CONP#WS#a<6s)`-Th7jMckpggZ0e
zWfws&<|L%s5zQwlE1~K_&a9HEnF(7L-C1R{G!Udi(0ty8Iju#Z;ljhrYSj|(TIYTr
z>G%2h3;8hjaQ3^$>;)!-67>Q%Ihs{h1tXoESCf^3A-zeLC*HPqoCc|P%huz5+@@e@
zVuJr?&!?aS>0_d0Tx|`gblhE$T9mMZ5PLq7jS(k)rd5JkOBH{8BIT>wp=!yj^R&@7
zy`3yszhg7amiyyBpMAlMmt&f3>3l1zQq;tw#$vX8-wE>kuip^uSA><iIJrXV!5^7a
z`WZ+;WJPJIy^E9OJ3Gd#m2^Z~0yGuTV?8B3_{7S_SQ&o^h;iADO9Wt2Ykz!x$biZC
za41P%6OZMqYc$*Z_R&z^{3I4~-!XjrIsbb{pq_5sfh*M6|M{LJT<<u8PpbjvvLzLb
zF=^v9*1zYnvej`M2$#E122Q4Zl;lfjo%C6xo_xV7jpj2T)!R=^y`EMxZ$-c%tyk;V
z7mY+C>EG<mRU#1@)v~mMO_-}|t1FjO9?j;l8qDgBnb+5SUq$ECJx{cbID36&-%_jE
zfg;D0XYEVe1_9V9gf4U1pmxTAD}@tSt4F}kPl-IUNM=kHoY_w^C&HZP?>Ijm08z9p
z2WAfuQcYXM@#B1^?KiA#Zp@ECS!4+u?yJX?SNKqcX~KtU;ckHguk1++;c8&LuxVh|
zvFH>#iN&qeU)Wg*KaC2Pt9+78PM&ApqYb(4mWXodE6h+hw|yzHw@RCT*5qn|2t!Qv
zmU7)<V;(IlC0Sp#hXf>OIh@2wYO^8wPg&W&-;<;T5Hz7I6fH=hA|cc_dg7Ji%&@Ef
zuu5^RHG0^#WK6p=_r1DItIk_sus!0F9GTF*Dmsr0kcOVITGqB5{Cu$T708JSRGvBb
z6mH(*TdrVokpz};^5GLY#hNf`5dLjP1&$vQjzE}^sq0^cA;uV}0U2j2Qw%%vGd_n1
z))k-C1Y_aLWZ!e~u)Kt7#O!wNBASbGYo-birh)=uy0~|+NsKtlD0p9acHpp9q3x{0
z)p(Ui+mfs5TRm)c6f1WYTMj&h4@MF*oLJLdrnTkiI)!2<dmrZq_Qh~U10cV!*X)2%
zn}Z^@$yZRvIA%n}Y)6BU5@X!kHC^T$vHyCW1?so<Fe0|MOQ7pdwZgyO^U#7L*!o0q
zjjVL5hX$?A3D&R1>~}4!d~yRkvLY5Sv8uVDnZx4-%ef8yOWdJ;bV+PvCOFRY{gY)p
zg7MeidYZJRm*TWWe&#CE_F}B;=V3w*aHeF{j55Z{0US!VLDX|DBkw#E)Zbt~{f}IF
z`U!${vXb0N%C~l)2fpGr4!oiQd8I!jgkGu3_+q6rZLJx(hm^F*o2DV>(}xsiyymQT
z*u+&B@zIBR-8KXid^$k!ax*FACq(h%o|L;cotS`z5#1|CvaFqZX{cj&8iWMtIIBVB
zz+ey{eI|HQLN)1=ZFJ*JWAKqJ-90XhAiS^$kpv@fTnn8Iv&-Dtb!RwdUkMo2OQdRJ
zIOy(B%}@s$hfVk;G@=w9qzS96EMO;BAg6SH4Yh074|b%6`T#<Ehp`Bk`%Q%^L!yWH
zjaURbE!;t9`Xjy~aETvOZUaE7t58Lnr%v!Ci5^P1H1$|GaIC?<XICU2)}J=v)+we>
zkAP~S9sByhDoq6#tCq5&AdZ+INQ_cIDp}jP?pZ6k9ZR46&9%B2(n6~%MXt6kAK#qB
z4q<4f@qD!1!|l#>jv{B4EKawr;EtHbjiT9~D!;fMFrMSHLQ9t%#-&lmIFG%E==eVI
zym!=eI}l$_*PT6z5GGYU!<t+tfo^Y1>R27X$-bXk`z6%zk|3%QZ9BF`_P$wF<@s!$
zOsLRxYkh58Y|jA~5Tdyayz*M3peZN_G?kb6*h>}%4{_GVSJ0V_b`|EG1v^)M*O1+S
zAv-(E=%&o7g>lGPUYT&Q(>4m=_oXwW#Q{sch0@<ab2MIZ`_YQAm3>FgFn0o+%h{Xw
zrZzuch;wTa$!(VoExRsO7;wd0@rScnIhMDi^GcH&!YXD~_D*eR+sK8UMo9RsLO#FQ
z(?${QBWd=TMb*4K?r$>z`U}z^Yj#nkkve<0&;bUS3i%po^JiCP^6s{}Ky~p#)X}!E
z4S19n-KX4g{n_QDAf#)(j=2m`R6-YgSX7-b#L^bZD#8|WH)qMxo{Ge2tEbf-^xFt$
zfyK(ezxSVarGg|H>g(=p)ac``zq|Wy2+q}M;6LhjmxjAOFw}MO^97mP6ZUI*IYH9R
zzS;xhl-7>;<y(hvpPu?Jt>iXGP9uZyc``;3O#vMIx_EOuP;Y5nr?G4WxEH%=R>un`
zqGiK`oz0uyT-bI{+_|VufV*h&LD77-qjp_{u#MEzKs9bQRN06};evO!fEItwwO71f
zQnf^aEZ#b5P|1!YeppqG2oo@UeHJDF$Ai?d9!Ho%l`k{ynNryG1XSQrE-><{9f2V$
zunEx62}wQXINEy3r*S<yb!ZadM8<;=A>gbkE_}rU&$}z8l~m+-C(sU%PCGXZ8MRtc
zH<|k4eJFVp5)@b+??Y(Hfh(*jxk;&3@RS|37U_3ea*S0Dp0SKRGlRxjl%#r(c9t>F
zv;@F((!wntp6t~8)FiQ`4w(EoV%nblz1_n#U1cA~`b%Jbg2db)V$5ZU`a=Kb?1UJj
zYY>$9AZo#k{xfCSPjq5U>zqKV-`1=L7D?}EJ+6=yJeb578+;1P3O^@-yMF}4ZQow;
zQFl|q33XK?z-JM#x5t|gpP?3DM#hF3>`HrLd%o2|C0xR03F<7zm6L<(1boB@@qiIj
z;O)&xE~ZgoZWuA&hs>~Lg+J19VN#DfWmRJq%1-qpnnJ;PF$Fpr@7qVi%vs1hR!GaQ
zJg3u78N{z9hgN_sW~lV>&jJz=1i|Ljg|sD5AK-k3ANvLgcC>Pedbezw4Q#rgQIllx
zD#5srX})Z-uY4c}t8JBLd!_}S!<2=AXt&!iM?a^D)(c~bNU4XIp({I%gX~fxr*d+-
zPYz8j#LFASpqg*Ye>W(EjZw4Ewx<78VctQw^?3&B3QW5&#P)!P#2X|fqg<WG%mox%
zFrE*fsg}O$CJ`?B4<5AsPnu!KvX8D%u-<ZlEUHelU3qt{^Pt^D)_$u>g0S3@>05Rm
z?X&DkD$aY;wIVHy-cgs;_rm_Y;8fu%5na--!A?9p7rFzU!JJhIcTzU|?D55EoSm}$
zOGw7>*Kx@Qge)Sb>tj0O<e0wOb+@UisA_?_3doG?jN-gv4$5Zs?dFTXxb^c9n{tYP
zu;$Hj)STQ8T0S)KX*}Zy?HEv$?%12y1bc7^W4BIjRX>P<+9vAobsY_LG7tVC?Zg|$
zbuMI$fQB_Eorj<X59cQQPR_j?H$G{8%_v!0T}n|Z5|v#}i!yA8ih5&++XtCdB(n{G
zTpxO*s*RAs3TH6};-?`Ghzy<RA1TuIbsrMCS(odt?JyciB_u_v3KJH@_mq@?fX};$
znh_!<BrPN&J;+E!zlxe3M1LuM-?MDHVpPVv_|121Q#{#L{$mH8Xhf!e1v>XJB)zV#
zcc&nS5?ccx*FBS~a72-iz0D-3lMGQ(z81_=iW`8)u$Sr?^+8^i-jQ@Mk*jC>IO*x0
zx>~3oS`5hx_sVshga|qST8^_KC+A%!0oNJuJY+WM_`GB?UOPCDqz@$Gr9jbU#k&NK
z{uBT=ZKj|?d6<wfZp<kk=}Ip$=t62sHH05&Ulm}`fNWrl?e0OizMw#iT_>c(04{0{
zqMKbeBHz7;$2GpT-pEzBc=zwrBi}%zGov7WZN8;h#fDbTMdQhW@R!8b^BSo{Er9%q
zW&xCz$Pn(nPMqdQg^IHT<4Mi#m|FUxEIZ7OHq1wQLMLdAUlUtfwu-<tPF;lQ<rOk@
zBxs7*jqj+YfjtZ{zq5@_g69od0<|ELcDO<<>yABNgZx(z3epELKg;EXdp^@wQ|jLh
zL(y=SYx^Y$p_FH5+4|oek(UqxI1K^$3Hj|=XouO6C{7HaU12wKvzYth@;64B?kocz
z2+b{6-(&*Zd2mJBc~L*Y^b5@XxK}~0JG3-pY}{Q`@Ht$xLrm-KWhw}5?x<1idR#Q8
z*-{6LhN2ppKd+b~qO*{ywaO?=If>Yeu%LHmrk$*(EVCJD@&f>D39b1XSnVMRt*2we
z#Qlf~`mb~V8uCIwDbx4Ftx`Rp=pBxCP|5fGR*K2X3k}6s3dQ3YPu@7UdOiO^=j+oY
znyYm#xBHn&s-BgLSK7r<li92wNjSiJ=W=AmE+dt#6U@~*n>&uR^CRfuk8HlmbrLiP
zqd`2Z^5A88EHXID3mS7lxd`~h9)ABkC<1T>5nj@JoMsN)cll}t`Cb|>rNozzmk1u$
zBAAA}*py&P{~5;)CR(yO%blQ>729)<l;GsoLeh8h!&69*P^RNa-t0M;JZBr5aj57W
zMD(#Bh^S-+Q+7*2taU-I={1tX#60Q-0zEGfp=T*3uJXUP%H<(37e)=;yLXSope1qP
z=J8!RBDx|5?kNVbRm(aNR>}`!G~?wDpK+KmR3%VfibD|oYvE_x%vB&a4PcXby<qAe
z>i=d3d0m9K4kFd?ZO74gW9v&QT5ZiHgc@tAX)c}O&KnPJGa=R7Ay!(JeVfYw8QZ57
z(9si{GyteUgMokc4szpQminFB;gW^ZQy`|@)}N*j^VIM@7Hf-Kz5x?K6ZmW;alNvw
z_Ty*PBGTq3dbnAoUZyV{W;RijU$4~M4(vtxFlb_fxpcq#@xP+j*Es-pmtxY4)WasJ
z)Tt*l>J;w&ZWFEa-F%t<yO3RPnb9lT^fy;f@tk}&68pYLc5QyhYtz}BsN@gGjuemH
zSoG)9kZLpN0KnyMxx|vg0NDaEuUX6%oMGILR1F|aWtc*jloSG<>LS3{`t$wT<OYC1
zKkvlt8xpE73}#fOS;eQ7u!xCub6<i$tpCoHM64rPUt$65?*+GxSj4TyJ%IV65%}6R
z<O-wx`w5N?xTqokrcv6)Ftkl?VWt5IwvczefLX;_F%a$e|6@}S_5>dby`gk1N0}mZ
zQ&71}%JwFk%sLP-bqRvQ$-YEr%7@I<oh!+VfX03O;57gfqtiCRYO|#tCN+XtTe_Ho
zd3p)6cvf&GZs;ioZIuVbFuOBq6(b!K2ov8Q#O9QPL3k_Mq)ma>pw=X!#rGZnL2lvK
zjSjW>Q)kj_C((<^hjkACP%5Sb)6XX(oTi@CO@k+<9_)sRVL!+-+xkJeCCf0ZWDLgE
zoW%t+5I4S9hK)V9e5=B{Ae4F#rBi5|(v+xFJs>Pv{~b||d)s}3Z#^-w8p=phjPvfP
zTY)?#VAs*h_ch~adz_}98?LS9imxpzW*XFur%~XDnc7Fv&^2#fB12~N1rO?XO2Y4X
z9`jR3?5;GFOO438s}%?UgxAcztupbwcwZ}DQH&m1DuCnR+a=#QdqB9oJf&Amk(MS>
zkErj$>WGNiK__h(ikM}nAg2I7lY%}fMte8-9e4p+pnq#7<Tz(?7d&mA;?+bExJd9@
zT}00WKh(1RfH65{Up13h0IY;$iyPq1>6<GV1y^(~8PP4$xt9=BDaf}``Xu_5yffiB
ztfl3rqB3aHqd@0`8hmAN8!k*3??TgqCgT<BX5B2RLju>(b`xgQm~sAVJ<wxJ!#z;T
z$p^S`3T71ZHJMUK`rxfTO=TH3?|_cEym)J0+RoZ_+K2=J;eLe05L=`@6PvO&@Z5gg
zxG(<Txo2khx(1^-$?;NUtGWN4Ob0UnqO|df>IH@kM;dxf`And)dI6Bi*<N{mi})ms
zZW!Da>o7Vdr&7bu$)0D_T%}Ictno<%Iji+sK;Lf!V!TRfC~`{^Qi>#9m7jIn{JLBD
zG(UsgQ2n`&K1}A+qCo1=%)I^N3P$<c=U0l*v_eW2q|*(mBmL7w;gTnhmbg#e<5dQD
z&cg(ehP;bS4O2;wkaf5&w7Cq4Y~aD|8T_-Rz<(iKr4FS-f@UwFo7hp&O^HZbC9CI1
zL4UOO9svrf0KgI2-gc|?jdl67xK4r~@rtu|vpw*B&X2UD;8`O788ymBT0Y9_TsFP^
zyhNbyx32lRxx)93sDhK<DjxchTBf{|ZZ~x{s{w7_-E9*=(7GiZ5gwWb2;>FKEMA4l
zdG}(rltUvU*>GLS%poxw@9X7WFe4wBsbAghRt)IgW3uP`kq(eJ7+4{#5rk_IBfIlF
z)J4rtL->sc?=cxXB-^$Bgeo(%<Sms8U(SzpumdLZ!ezOiDT<T5&>Z?gFA<R+OuJYM
z+@yCLKGXzz_i%9J+Y(m`xEB@?H|0VJ@0=+Xo?E!z^Jcz@*V3D_)iSa-iL8nL;_J{9
z=;l~<*<cGaUn9|T?`IsVmZ`9LcM;b-gP2o((OkPRmrXad^@njXD!TkoI$`U0;A51>
z)OMV++)~z#MQ(e6PL%%%waiv6{L>t;?3Zxz+ibci*E<#tq3E&Pj@xjC7-wrKsp^mv
z`s=dZ0|_SMK?ifrk=SpGvDPsI5=j^B#@dxGKRcl3Igz<GT_=wCIWC*=Z2%ACC>z+N
z;SLaOng=NdE7s$3t6|0lN<Hxhf5fuK$UukRs)vG*n1SJE6_rZ0OT>nZjuu;jwn|^K
z@2$SFhyK=DEPO5XCZK!Z&$pK<Ln%dFsWw8KiD!8pM%NvZ73fD?C*f4G0F#Eqy;gV}
z=}#dz?FX;@K~Qr)@uUFK(Q)7tWNhxHe8XuyA{90c`F2MU*`u&AzISn)A3%?}2HyTY
zq?mRBL8n?a?P};QfJ{O(pf2Tjn^*-EqvlN`GJ;*VYwki4`UQN0;{djam$(0Fl^7(F
z$591&GLn+M(8omIh+~mRWMBpDBoYE5)u(@=m>RSnjYSKe9X$P1Ogf7<FKsSXjFm)h
z?1D;1i>nj3y8&nhA~^x+a{d>55h~Oe0}3)wT;&YeH8LgF2Vm0xMMIEfXdJYfJBlvC
zT(tTdmwC_Q_QgoXZogIiq-F<_nn6XdKWWUHK_r=padOW6KzksOqjnP^LD&ou^QO7(
z?RWk;ZU4fU|9*858OAe2S)TLO0JRv2@RE}-csIr!lSD2KV~t-5tPD6?2hE-QoMlyV
zpox9E)w2Lf*aW4dz%G|~Fv5HB7h>r`TQ)^m5jh-cw3(SDQ0tDq4&4-)YM9b@Gb_f^
zuRuj%?hRwmbhqDLnwERB<6RnLpddhhQ?mLv6*;>BPmEN+ZmK#*jZy-*7i9?zl@{vR
z*d!_Z)4_2KzHJ`vi%YerVuxhT$3Z95zH}TP`6q^Ly>?7B&UBrCb89q47yak*_-A8E
zVlOf>`1R5L&-LzVDT+&Xm7FqOKAzv<wODv1J&9Zebm%Bc011$*3gYJGH)`?)9mmT9
zPfNScTHCaN8qDclqj%k@RI%eVf<4&}{9;YPKN4idK|@D%AD5<~nST@}H9E0RK})~2
zpbMOLCThvnKuNL+42_P^MC;>^#w>jGngU#@Jt!v74^_^*Jp=B!gvsu`$K;tMUquT_
zd%@o2rX-mywIeh>beYYuJdmci3bs*Xd$0yBD>2nnv49pYR+KRG_A2HXkuBm&O^R#<
zkwDnk=WZbN*R2o+&@)t)DcMTBG&wQ2Q^{l73jIV;0M@d^c_kV$G3`1~#-?h{fs{r$
zO`GA%aZ$h@dGCBa0FB_cUFNXz_C)|{2SBSQ#KS1(3rOb31Ifj}M`JsX8VcYFfX*1M
zz1v{v?JiKz>qEQxDms9y1GG24S;`n4DCp#Q?5;{l&iTk$3>gHb;k|19q8$`x7pMm@
z%V7H#J3Mb1H^uu6QT80<y*=3uGu$3PIJlFNUu2BsO0$|)f;&j<?C~jiPGPY`w!lqE
z<N#C=4}hmOdF)?#;TH?w03361E!`m=?3zC3AFAX5s_#0~nyLeK2hhT?sV`o2=OHCF
zlF@=t)!|o(o-NsFfTaelmeJC*gwP9FNQ660U4@$Td9|p&6|vuUmJ0=Pzb|qWGE(Us
zkpgu!8>-O-h>d=5d>t_@Is<^Oq%^06nJScjvM-SsP~A?hQ*^&UeaxmI>XMt`*;?Eu
zzY9pXzHZK;aGDtr{{4iorl4InIOjZ1$e01imPOM&LrBX&f3!8j642Ns6FM-GuqK2(
z!_+c)<{US>5jOQ?lJer3<L7Gq8^k<D_(zHHnwZBt+8KWQuguut8$SxH^xC^AKeOpy
z2$0Gl?oax9mDsl}nlf>c=((rE962KU#gdSu`Wg@T*RlQzpZ!!R_8n#5#+I}SEI+7!
zw}*tg+l(n)wj2%Z`rWAUZUHJi0RRF7Oj>)#vafU@AT{F9l|@k?qc2)(d@0g3J-4mM
zJ}bu|!}FngS4*lEXO2<xlp&+pQJ+JEgvU9q=?cq0%z<k{G#Y#!>gGX1w~?}>$GTBQ
zj2rStgitXBO-sU#^unHWXcY09wDLqGEuixRD>QOVGRhjR+CQqv=~kW*z=bXu?j*-+
ziml8jHf*w0$gK|ImIjo?-;%<Vh>S8Ij9u9pV*j>$TiwflbCr!>xmhDsT9}yX{9V$*
zr|C;JZ-fPUG^vza{JMQ=Rmx+~=i^r??jQz#7PPsP(@(<U#keW#Bw9P~1Bk>6mqr?Y
zxUR!F|2h|K-kzOcjc=(jj%;a@t)@$FZuVQ6#p9f-#9ErQ0e<90)Yzb#aDADy3-A-;
z3YX>Yk8&vSh#bb!0>{t_boFtkhmx@m8$V(5JMrZQX~Z06;t`~6AP~LTyf*ZV)=1}0
zC(@*xuo9dhp}?Z=0n$AKtOh@g=u?>V6n7bf7&RwW0`G(y?ug57@4VmtT+F=)kW#zR
z*6T3ruZu~7RDJSHAmr~F{j>Xo=k5JED74Nk0$C~3`LV>w6;r7GXc;u%4x4Dmg;rm;
z<9?ziw^7CEB37J3xO}J=+f(M&sPRn+N8uE%mQd!s@JyVwy2jH1l$;YjqI1D;u@ArQ
zG%)qll45c2nshbj*5ex_>pyt1>kN|6;vP4PS~KX0O#vTLL%gUx`syD0k%TxF;BWO6
zv7-J`WB;5r_uJ1LEUzte{Ij4+xxJ6%*b?k#ixH9`@1tTKVOn9+1%kug6RPsSH8_Em
zG6Nx&qn4Dw9Snd(s_ho`yK$K32=K9W$M_!yAHLwp;-lkUK{tL)Qj&&h2JGD?3e^Rw
zOUgW09eLqOK`YJ3Bn*5;BRZ~IW#Vnm5Oy+tHQ`3W3x00Y<x-PAKFYz>jP5(&T$R&j
z;A*Y_s1hr|{(m3}%6+Mt1(r|kH<Rkv<g^br#%au-u^N0fONGe9X`CBrjFXcF8sMdh
z>!8H2*XKi<8(GurEgV$Ab2!?S0~~6Z(fn(0^{{H61CBpK8HrIV8L6^_3_2zzbJTeA
zq$A)5?$mM>uNkI)LaNOBprAA(j&2-*Dt<TcFF=w!-FbmaF8r)Q(fxb)p6iv1c6!N0
z#)uH%tU2lFo`$zqq@g`nqlfOqSJXg~uD~a_;?}3TW*Q!K=-#RS-SQd!f%!Pa7stL-
zP9n#1WT1DSI0QdV^L(@0=CYk)3y~*O)0yewJ_i5OP})k5q_0Xpq61SkNgwFSRRcEz
z>AOXh*q5OindX{$CL4em6i;D2V$OYvM0rK85EATsIZl=eNQyI@545zYLDr3^!qz5Q
ztF*YV51T7otrV~sxp5bEL<-%j{=duUo5)1R4pBn3`lVp_0(1Kst()~Rnq$nJ@z;+o
z67Xq_eV<?LCN7yq19{pk0i;A<QiW>;LeD6w=b9XB+WtmdLh#<#i^t_7CFI8%GyPTr
zeIWB!yHL-J2Z8c3flv;m#81#3A6xBlz@HrM#uTDL8Mgye+pnlE`#-aS286!(I$W9j
zV<P7wHE7pw6(#L?xcJd%Ql%czb$?8cWb@M}4p98_gt9>7*ZM)^7u&a`jIc)Yf}r8X
z0UjSN>+EyVJUlGI#Z^0w1Nb@s;#O<L8!qU8p9B1eReWW}-|#USyzmP_^KSVbwkQHz
zLU7&3z4YJg^gmy{kAzr#z-cJq;O-Wkpo9_ue<baFtPD@pK=^h*koZ)-d<cr2^aI5f
zYuQ{ztkkwBY<Y*YmjOmVE>zWrzCos0mvCX&swdTo%pt#`74Qo$MC{BQANNs{cL+Xx
zQwEePeYl8*@pLgzl$}8DnQN9HHt_jXBNU5BYYxFVuZYtA&n*ROM2c43x7KY(_|KPl
zxHk?Yl}FP&J_FBuYW~wJp7m#bAMZ**il6zplYyJdKw{Sy(u8WDooRMIzSsW|;oPyp
zT{K*?ATCXSSqmvRUz)Xx!t!t-RCiF?Txk>jG-a$fm4HgTeCaqsvC^H;?_qgJn)9Wm
zVCtR%dPmGW94;2XnywaLy5^u5dBHBnxTN~yVn2jz(-bpzPAbCS7)sG`ymRC95;5gQ
zL6=oFqK<z^?cvd5$(&^Kc&tx=ySp<b-^EQZ8Uvm5O1Ve>j@i7~!_y}{)_~CX&ShaU
z$&S{o*f*f>^_^e5Am~bt9|oncK;!}q{Tp<f%>Z|h4x8@%<aZRAmw;godvI<oBN+&x
z1g2Rua7bGKQ2IDpo>ZtoD)?h>Ld!WSi7sReh)n)a306YJesO6D8h=RrtpE+B0$};a
zfDZ<~4sBy+J93DucMx#Uo3}bM56qE{3OZc|Xu_eAA0qAmo`n_Z)WH10bs+McIAi(E
zH&H1`3ZT&#D9#ijB}jsdKf5`Mw`En(OMybmx75P%Odq6n1Hyi;j}7S{QV#H469IWU
zHMrK{bA)&gr3vsgG!XT9`>`Bs@?yt+`{VR*r5JKk_98+Yg$z!4`)q@fJzO;~#7l-7
zsQn&zT=6p6c8mi-;6WC)5^$jt(DwD>p9l9O^@y4wG>Gg3I}o^6KYP(~-Vs&N5k#=J
zfw&0gOt})clt!6Gb4#DFZB{}~ss{!TrfMY=l=-aSq_Vm%X%)2g6dDq)rlu8y6PeTh
zIc~^5`#{`*UbgEPUZcDW4dShKEn>&l3ZUDWB9ZRt-Uc?|HiLK#QBj$}f0Py$5RA<9
z=TrogH^l>i8l#)iUK<A6z$R8|W0bd~BfKe4_PbCxU65nerEVSY6+)?Fc7rjPxiJ>$
znXz39W(L+u9=>zCj>}4pVQY&C^inbg^}JDIUi(gRzy@T>8mHUAh>vo5n~Gx!)?yNH
zu%gv>*6Tw;a{~xo6Bq7KC5AAD5OLbMjMR_GF36RpXPg$&wI)vRnY7kZo-n9<@j=Zr
zh<{TT@N1S@HO{Ssqvq6n6l=d5xr!V<d=8<jsLopntU^_id`}p^Ilv#-0l>6QewUgh
zH#@oSVu{mY=C|sgI{jv2)D^zo<T+vXtl_mSjgfg|anSgv`-IVwa_U<8`VWrsFDZ)%
z`dc7sosT$BKjvhjkt+d*2e0$)A_kLpY2YD@e@@={1Rw==5{VuzHmP0=S`D>{ECB#0
zUww7z7IbfhjEWHDAlMCbw%ty0W9E54ow-aqcUtFYY8?~+573ejP3AG%2JjY7FX}VO
z=29Q*ar4pM(H)&e8uOD0juNU%XY9s9hg)#Ypi<jn^nRR*FCVYDt8Jxd`aXm{#y59x
z_iav~EoY!A?l1bxk*1L+3q)sX9|srOtB`SukL%5X{?_AFks4H^lItNpLtPcTV>alR
z;af#Pi<?qDSky5WDH7i*NuflAqyP7~y&Dg*Gg~;ce(nsD8;n#{gTr!?m2?S9x1v2A
zL3M`6sRV!9fCNo<zMnx8ZtPY~m!K0g8=We$X2pVYKsS*(M(QX6JX#u4;OWQ&ckvlF
zYhognI11qW20}JcsM*g*V;kPYYyl{cKGb5hMoFWZm-2yZkqHEFqyZ?sN##O1-7)?U
zZ{*sL9BS}V_}!99k04)?goN$VQcH1Y$Kzc`kxSfaIgDr3sS;kFl$U7DKD`88gld4r
z2Qw41!r?8wHfhhU<ja~9E`gAp-<06<dax=$8YYu8g3@zqQSiZBNmIgG%D5O-CM2k=
zmGl@CK{qmwO$`5nj>dN0j?5)Y5UI5^&wnPY4u#rG@24pSdP)q8r9|mLmM<t$xK~S5
z%@ojCUF@SW?D#WcXZ#PRT@N|!mo?EFT5WDa2v?OM<wv<#AtkW@Q29#$b_>r6Y1Pa@
z-eQ-qeXtiACsBGDIHP=os&zgQ8EZh-Th+Yg&l(9ujd$e9Nd=y`t75;M+<0;p+;7%{
z%ytXN{1o1tCtadDxdR$Y4l_f23UNvGuP5Wf>wV+Xn05dGB(oEsyQrj{khmkA^jq`b
zMwIThroREsVP|UNWHMP|ScqdU%pF;P7ygD!X29y76uZ!6BX`ke88<XPI;~%I8!HNA
z1zsR{FXe+jodT)y!maj@o*o0ZIIH7Yh=7cBfI(J)54H*a^aCX9v#N*NLU-PY03sKV
zq!G#{mli&;o^FIc#QE7iZtYH1Lua^O;kbHseDiw^P>&j@isIaAoUSQ2+q|j3kp~4V
z2QIfo`2}^sZ{q(uL-0_81R>aMn22EfTR9%lL9mSIpV=xD*7K9`o))kRA<2*8`?}yJ
zqkPRI&hc*Nr7<oWFcg2d@Dklb1(bz>Je&M&9{jxtrEpdDG+Hz692R7@TWyHsrMZlK
zKyPZ9BaDV6eKHDb;~QOqOH>=_pQe6-Qb-MQf^oMF-OXjl44-sKyHDz!BobrrHQf7;
zE4)t>w*2;(;VHkV^UAEs&JG}i6>croaUA162mp1#`&&g0=T#WZ>LcB{*a{vZZbppQ
zYb_oC$?&@mb7Ve1`}d+tp;sI912_R6;CaLd&5_enxrB^7iNe%t%P`WSfqGblWjyd_
z?c*PNRCWvk&$E2%=fttne=NG;Ffw8IlQ{OnSDr{Zte16{ng8(NQhK(#J?qR+)bqS%
zo0>|v&+Uol%^KxGTT`_hqkuDe=Upuz1JFAEHdYVe4VQno(@1NMFs`f&$Nb^cX(vy(
zr|SM6*1j^T%B^j8s~`wcA|YLZpnym>2oloL-QArFqy<UoRw?Q3l8^;RNH>d+?v6#A
zx%S@f_k6?sz2p2izhnSDgEgNy?|ILwW&@~YgL)f4BxD4pct7puTQg^8ZVgPJ^8$9)
zhC-FXG=RtGGF@5Bf~yj3^8gQwUo;w<=4(~qQR+OjEx6I(erQrq4dlb+KnmRu2zN^X
z(U5?St{TYAiUR62z_u{+=u`kAtzUz2iUf;@txLmvl4O%%;zA&)4}z?(J*pwHK3Bb(
z?%8h~XR-=kB6E`~E~$aP`Q@Sbebxzm0lt}Fjo9n|OtZhgqS!!SsVFvoVyPe!m5kFS
z)d{fL%a4d~6M85x0V%GZB<RyTJ2Y+4ypnY{gk9dM8e!Q2?MScwk6R01Q6VIQTbqr6
zn!wyR2Qq)F9_)iYa~WW|E;n;%^+Q$w>)%#HOfD7d6MXD3%%#P}E$^yQ^I_UNPz#k;
z1zZz?yfJ4~`7zma1htX*;!@w1Hv8Z)D3$t6uG~eiPSZ9GeLN#g_joP8{cWwy$%CS`
z0hkfQ^~N7<O%6A!sOFDR)Y^PHsN&82H$%eTSTG@CBybXn|8qM0H4;2XskhYrQeFuF
zRt!YoM}s8nk>%DjKKC~VD}9@92zq@z?Hmz`>;)-P^7<ZIz}%%OyQpbC_16|Y`$dB7
z&}9R_wo3KRFwj9(!|y9e6uh-VT*L)LE51Ri_5wp7l~(Um-W4qBSM7~|Gi{TO9(%1Q
z#-Oo9tkZJ8J+ONt5*tsB`=8r?@!IaE|7W8A_I|O&K;NL>k!|^_ZTN>udxwcQ6b=4K
zwm}MklG=C-5O@uIwLnoM1sEdj4L|N$Fq4eHrstxFp$2&V4gnW@wzmia>9q3Br_o9@
zRKbHT>H~1;)#TEUUyvBW=Ic6RA6)gOv_Vw^IRJ3YG5~0ZgsN#XG?K(JD8B|e3KY0>
zRuM(v9bNz+EZf{QS4m6<ddNzf*(s&(fGf!Yny|mh5gE{z0YmRVb2DHYLA0SBX>iZ@
zPU`=U?MiJ`9ijd3zO234W1|64g&YXsi#CC@@ST?aI9GO~LVZJ9O|aGxnuU`*1gr)8
zR$EIzliz?M<@_AsjZ%36K(Pw;Y6NbQ&gZ^mZ$VjfyX{X#@cJ<0MD1@)cSWQ>qo{$9
z8g%Y&`zn7p(EWCSUO;ODJb)TtFqPA0tykPUs>m+piEeu%igMk+;J39AghAW`087LF
zj~^QYapME95{`Xtf*f?yF+HuCqPtd|01#>_n8<*I5P-)9nFAGz4Y{STs$X9MbB5F`
z!mgK-V)FqZ89yc(84=2veEA5Q3@GUl4mBr6gi{lAN>k9BJs>ud1kQxMPnCe0ejJuh
zM@3K3XwpY?4u{>?M5>~L9{qu~H7C6$*alkQJG^;7=+2J^p*tc4(ymlxMA$7t%?_D+
z=!b#o=^1}<z2W&$^NUws?Jp_!Z>1eHc(P!MFN|c{{yxRg5L3MMuPOcvIRLDxr@*MV
z@8$wNO9JAMnW>|CZ*0`hS@Ulh1p_&soBZq8C;D-HK003euiU{2r|(l0Ijc#S)6UFf
zwybLND4ty(K9DIO&V`7}Y}cozJkf_N-l?^Bm>@3e`ySe*AqcMDU7sk+G&k5Dwm{a0
zh>uP`svHvnM_ccwNiU2Y9%YiH3i{}joAfb&eb|YcAP>+SYK8Kj{I;g5z8g2L=z*z0
zHlRFEhZ5lUvx^c4b2DR^fXB%KGJ`nD9RU1f(pf{T#wKmX9!jdB{l!b$=IbvP$iGwr
zeMEK>ty=wWT1VeC97H2m_E#hKMo5hmVK{LID&(rQa-b3G)A&{eeCP+Ds|~s94h$(a
zHG_N007=RQ-bNK|V6Zd>DENsx<J!hoAQp}WO<Nb(0}us`X%$EjtdO~m8xiwmY&60a
zTnaE;RRv5|WdN&|LBnI9A+j2?I{+8RY~#F3=XEVcgdvQDwgaPUGjyi10u-3dCU&nY
zU@fp5oErfn5&fpg!x@+=-<$oRr8-3lDn!-m3IVKDd@z8dOTbW(1)B2yg{fr#@kjt~
z>6W3Q9TsZJg#hHD3lw2SaIIIh9}Hw+aO4&?HE$yJ55U|s2s~_dF@5;k4){;4M9l<1
z)APk4_Fst7Kf8!%FaoDB`wOQ5&=QZWHj67bAxV0?0~97Wl*CUIRHOrCc)m)}MtQ#V
zM@#^Q>lZ!Tv?2g=2;eVSptuRBejbfF1ZLl#06b6Nao*qx#!=#C1baaZ2+@}ZttH8b
z8v4U06yPu%gXk$BG$;W;>_ZF043$s|v>T9EybLbt;Rt5()CD=IVmg@DK*}Tq+#_23
z0d3>iBL785fr=2MJZ~Lh{Qa{<B0k%@e?D8M!P(xz5V&dKBbf=<AeIq5Ke0`1YxWfa
zdIu7N{YPEw;p~aLpry7{R#h}T0rEM^3{W5wfNDBvhyR4fMEmhMuqDQVS?`w0iAVIV
zKZUad;ek=gUPo)=d50*b2=WTF1t*D@cz-iG<td^LLTV`M+eu~=7l`cs)%j;MbQFaJ
zI)Wz?hW$2M4zD5G5l{YQ-v7NH{y*-5&+Z2F4Felxffv|s5ms8o<?`_;1XP3AZV{Q)
z4*evlysomKG}G=j!;8%(A)8>CgC;{U6rXX!yN8Digh?Za7=hf=1CDfX&ruh+FVeJT
zSnmMzJllq*`hfR805`4h7Hl1Wb@KBXzMFusP$1YuFuhN>8O;*wfE)IO-q$}Kfrjh*
z#EdGo_q;EPD4aFL^9%^X3qEi=nmA5PAu1J69<02{MFD$=)Bbd&d5jWRu$gJiC5T-J
z99-WE2%gG7Z-%6pCBd=kl`4*ljc@0sRmw<tkmcde?j?sw@Jre9pI$OKUt@wO4^!lR
z8RE3}#Y)>YX8jE)0SIsnu@;Zh5$>Lxq$<F+R^KP(8F~DCduZMVg?|5djNJLRp5vdz
z@&A^51aNo#Lm_6ZS_(i^5nz;DgC-ea8ll%|tW^ToCELB)767)=(9ozAY*{37A;MG2
z3|>7wBidVh&Q|NR{$UHiLx>P_#OiJ<2kmk7?XUgQ0OqqTH-uuI1O3XYJ2@9nRl+HE
zZJJncrMe-11*ie90U?5jYXHz<v;?6>dFLKL3IDt`!;<}Hp|F{53V=OC))2r_vZc@&
zz}sR0grf0OECKlMRXGJVhf_)hLLB~Apn@VFp^zJ0GAR9Rh_L@`zMB7BS|A{c>*qSI
zZ`QrFjozICX-m6lU5QzKio&O~<h(A=%sF#@FFXHCbp={*=IJ3LZ2!Ho|3C+H<cZba
zQV5Y<*+^6*>W}39^%{p@{uajh1Esl@?ik>_l0fN&Y!wL!O{Adx@2_(m;dS%yY3uzR
z3cihCJ~{q`SU_^vtw-i>g}RUt9x(TVpV451yFq8pe*pt`p(^Dobpt7wu+T)F@bAgP
zzxr(zFmTYG7?bqh25w#v9D%ER|E8%=x}o=w+GtCGj3*CVcrkvB$f0*%2qb7scT{<R
z?P4MS8*=eWj`R*;eJnf3N}~I%?wuj1aBIE42M%&zf7`e8UKqKc4v*8?{NN3+y=MVp
z4N(s4`<wjUmNuY5fBQRst%1Mde$!t#{u46v&o0w~z@@_fme!Z*zLcfH#`gtW+;?!L
z7^UezdK{?q2y$-*z^nkb&ilCQdU0fqcvrImfIS13o#4U~|4TQ#u7G%7Uitr$rSt(|
zbM%P*MfN|S5C84V^UvOgfFp+x%o@?6<G-9D{tS&8O#It|+vTPb_P?%&KOad^3bvcC
zVwJz+olb}-F&>#;&WwKD+d2RHu@&@zS=0zfbWQ&S-fxYcL^@*U8vP~uaIe<-Juv(K
zeq~V?z_y?WOXdA1ljzq^g#r-PLCo)elltNlB8FVQe)ccDD0uAx;1v0PrO^DdQc*iX
z5r34|uQgxTh|!DtYc~Ei8VDZC8+^XOoBK(>_jOtFh*d!RYp7ltG5vShodi30RGwI0
z_&<~H*N{<wD-fQjK~4Xj?9|8WEKI+C_CKb;KmXGeJZguE<Tq|ys24F(vj3PYXDnL-
z{@bkb{em!ARz*hm{{E;h2;>3I`nMGM(@@TDxpV*gIfy^j*AA$-Fl(M){r;p5L=nUs
z`StoP4UOLZ_t$p=V$^yIel6es{4NVKn4M_9lAR2%*>C;(@ccb^?})%KDI9(weDYg)
z36Mg(JfB})4<^XPZ?*e>ObgU1uwvxj50U@&B+)d)jQaX(Mvd^R-2JcOzK%lhq(sP(
z^zW9vFvOGoItAcjb7*Y+w>Jlbw}`DEOOUej_XVnth>U9bRa!9NhVys-Gl>886(!<m
zLM8FL;l+0i4?HUESFOjqKG&&tQg_*%G}X3)oVd}em#gg&K=q^`HJIe*G7;Av($`#$
zV#O`j9`qWuA7h{Bh%PQJ4k?L3T~=l?P6&&?$4Zvd2`F+P83@mx!Ukx(wXRKMs)T&K
z-cb0=sU>naic(l0rRv)L>`T!^!+VCUVCWhVSrYsbZiY$1N45H(MIhumHXUaIGc{13
zp>AWWF>0f8335>HJBrtLVmUa7M_kiRKk$yv6pwi9ooXs^d6}-84^w%(50jkC+<_$t
z?#?_#NIyD!CM2^%m;D~vS>uNaXnEeBjXqqW*SINmOcGh-RVf!8{Bdg#_qM{5(yP_k
zkPOSy?`2DLG(eB^rqN74Pdzgqkt%~`+8&iD^Yxs2a(dhx1&cHe^fT(i2+E*?t~t}{
z7tKtq@t^wh_g6wZe};PH{9XJpuOFWs*DSp-no!&H17{J58m57}KK5Z%e9jw{VOMtb
zsa)PehAZ0{=Jatk^t%cf$#}t-Hw^9K-g>Zdw?$4VT}WOUM4HkW3HV{C-X|1)xPyWv
zwcTJL5vOS@n?{_wsC}|E%M4?>(K%S@rp97xoJM<_wYc3hXR*BDe6XBqTj+?fTR@F9
zrwg;>Wq_b}v^8vco}}KZd3&wbr`Zlwuc3dF73H*hp;c>}ly!aX@kCNf(t^*Wjqc!Z
zpha!mX=g&EC%%qeay(beP~avz$l+iodS-z1!Wlj;rP2dL!dd$M4cTggFT08VP(8;x
zvpH`0`JVed-xS|e)~8rzU7p43v`1@AYX?)r4%-{-mI9gLC#Q+3&+$I3Q76J_a%DWu
z8v40|0sG!1m6k4xi9Ak$eSG`kMvzYKO4|GK)Fra+Xl+awji7!oGaU`-B_sCQW~Dv3
zYz!&yiCPV0Juo-RDeuE4vfEdbQA}WS$o&rO$@(Al3$ffO=n?I}_@5go<QY-`7Wuid
zO37s6L!JifPcP52ZMKug$_|OGK%9n7y;oIgi`^hu4gHLr2qwLg;VpVQLxFCHh^!*%
zSW~kiKO8Hj<@$&ua_+21cy`$9@qK^+LXiD-F5y+gMklN2+b1F@#}ZoIbOjKSZR9IH
z_|&Gz&mrA}qP!W1tBm>B&ug{}{96mLf__KWJ2_hK$lg%RU#{3Mbi|!{HePtWu17zw
zioQIS@1jfTAq8X<GjP#<f2AjsIN+0a`G#h}rTc1TzZE+Cm{PySIrlQ8Mg5~(B*6ze
z)#SU>b{D<s>zsO7Qo~_MFEnmV3pDZ26?b?tE&_YZ+<W-|Pm#f3bPH6hp>~*aKR2lB
z3*UuRDRF<ml1udl(F$5VJPws8;>`~%v^5n^@xGMIk-nNyk2}*OTBLD|?|tDV&z#_a
z`9@r?|MIcJeu>lr@(kr<J}29+Dc&c`<72S6ab0reaPnF@J-CDw;!OdsNXdnF6A8CR
zuZL(HLwua(Q{_E)ZTvIM$GNiLMp(8lKDj>!ptfHR(DD80Kp^wHh-uGng>0SyY!4ci
ze_`d=*mI4Kg=yu^d-3SHGPOc(P5WNeYZRry^xjv#wX2!)-^Tu2lDEz&ln>KUPUd%L
zG3p~~*8NoLGE1Ap?b-bO`4RDa(hJkrt;uq!n{izS?gV_4R)Cmk>=j*J!^y|63uZJF
z@~^hzD+z6qXAg4&(#oIOBhSomJ4!Uwy9RlYyl=UZ#lPMq_M39Q8E=qC=i>~x6fhtC
z<n0Z4Z0}qJ@PZq4ku%NF&;zFwe0}1G>*Q5;UFM3567{D1fw(9zM=x<iry7X2D!^yR
zYzemW(LoQC|7c4VyhujBPW_>U>~(h|)xwk+_|37^7Ccx{+^}iC<m8*jx9_4*Elj>@
zBm4lbGyIttQht-*KlZR(J3~1La|`F*u%xP?+F2i(dgD)COWE^-)wqc5j94%C!>-8=
zJFR|_aVZ*a9gHKL0IC_{P=ODJpOFsFA3w;De6zZdDnbL2Fzw|wNQN!pYUfjP=MnhQ
zTHk6^7cH6>CW2ZHKaub_b!=SND%(cKGm?Q|h2j{&0o^E)aZ@ZP<2vixw}*!}4YsE-
z0Pty1Z9IGJ1NU-JEvn&_$b9*+WY_=*CoX+DFPvASu1g-@Jz;f&F!T@LT-;QmV64#s
zZHK3|l<^iKP+-<{p!c`!aoz{9e1rd@=Fo2~@Q2)jvMlAeH4@NPn#!)-SUJHCXuOxI
zZ3p^Qst$dm#SDcedS%+{8I$=5t4GyoWz!$u%+<Hg$Q}_tw@&v`0=nwN+C```fP!Nn
zOhstm^{2rqzbL{n&&7wu%-Mgk)$L}<nP|2IDGG9kg|87Du&jj&lS`-4i$733SApe(
z@1mdc57mocEHPc0)cvfdOyC>cP@w-%OJr7C4f7EM_hEWLH?BXSY<`EFj_i9pz1^mx
z{z2)H`L0drfPiF-bZ&V2l{@1@E8k{!l2FgAtVoG#k0*~0Ljx=`DJfDlGH&WmA>S{o
z9|Ax%mVj3P?_MO`A~XsVUQh2yX2o0|desLlvOblP)OAf$ML2@vX2c&4VdCNB_2N54
zy3@vJ(P!@LKRg#MUEesgYkXR3M}E=euP4wVy2yIZ!NY}hm4u3tf+Vbg|BR5iqi6i2
z-<2&D=o_#`TBfp_9x|(Nb;3$3Gnx+%1#d0f2t<Na+;B5iHx_c!QhQ+?*VG&vlj}{J
z;v-$!KY9%(9l9KxxbP|0QTTF%4YC=9U;Z8x)RBy6fg1lpyYO$fHK)UyuTYlL262mq
zTamoeV2!9bO(pQ4%(-(6tnHglKjgyaJL@pH>4JoMSdF^D#PLptyvdiE8nLj1OmUxz
z28e)tU|}d;&lEIT9+j4&kerygh35yE4M3U1Bh#J%VztKm$^^*fIhX>YP)Ycll*AfY
zTfw~_b`lbqIWc+}kP+!8VRyoV1}wWV&I6<SvNypi=raDO;D(I>5_1e7=cBjA#!JDf
zAc#B~AZ;C>xvC=B-w}7%`>JngpsjP6JEK%y`<*6p|1h6*2G1HOz`*z}vD&-mJ-|wJ
zd>8Q6?)lD+<GazNzm`)FE5();gd_2}MPajR9=Gi(jIxyvca>Fo2gaSpEogg+cI2!9
zn4(dW<7AA3Ndk1noW}D5i54AZkEnI5$0s|SZN=nlrNmFYr->f^6>%K<+d`qBMI1Qj
zZ2vxR44VqMP0Xi%V7J8IY!Y-lNqu&+gQ8w$Q1l(@TZ{%5YbpLfy+1w`<gj_#DZvf7
zD4bnRxua9%?Od#lb1M)~(*4SwPF-b$*ko*0g(UE8E)aq4X6pZ_ZGiW*X96onLk3s@
zspGw;kl<Ux17R_OF=l6t_-iT9?hJ@ou~QH?)iz4bOV;+v&A_*NKHF)6S->lPcFHm&
z=!zs5b2L8m2zzI+$p0aeQ|7OMjGHM{d2(Urdw-E)Vt{$@OnN4FH&sLfm{OcwGeio>
zpnuI)cHjh=uAF-`MyH}%@GiOL@0pqm91g&=DdTZO%8+nfZza<_d}y8JRriKzcP;f?
zYU?HvVp=r4yuX4~m%94LEpRKyghc6Yr#s(7L~o4zE6%(d9hHDtK}iRar@h!?aua=p
zf+^V+!SAs5L!UlMu%(J>WP6kW*=rXh*FF<0ggpZyhiJip8+w2r$36&Y*#N{%k7WF_
z8;sMtTR(j;0OaU$H$aA*h=?$~wtlUuU|c$G#z9KmeJ6=-+wiolm>&+1>hbT<Fxjqb
zDIZCIqv5WqDs7DBJ$841%@28fuO@Xk7}+hK-&|%o{c#hWLM`4ndUEZ#8z1(_ZT?vE
zR~7*4)cE#XgRax#)%IZTI1%wk_2XA)1W|7uzkgh8qcxmeRQE(5S}b~aQ~Wg>n8foJ
za2&?!u4|WDT7qP!V_$1!Z?2#jSDIM^vKIxDtn5PYV$=Ryf0ouU<RO!myiJi(zd*6_
z5=VCobo8shdiKZNo|c-esM(N~&U4^FevrYKa$FoMb2&P>LwRd;x!&VPj?WDZkXk;x
z%2+!;ScwbeOpwuvs|)M+_KiDb${12p{dlW90#FQ0b+%pRO$8Q3yBnX{#l4yfE;h5V
z$ORZynYCi+hXreHf*~m?H>L1_C^wjePs2BXu{Pi$!iDoQfQwS&u0nzcn6*C`yh7`i
z;lxYOd;s0Fc8p*h#~7DN8hWgqyzVA<<*iZ<HLc3XxI0&~JHg2N;O0{NI^%d#xInom
zcI^XnS;H2E=t8GPzhVvki5%tI1Hrl1519>$?6&(3I=U4d=I2XPRDB8@Dvkv<8fsR8
zWgIRd1+(VEk+T+VOm`XPi=Q-~M2o$AQ%{V9q@W;aE{d&$q}1`p{fF6)vxr-TTC=Q>
zZ$49z`cb@=baj1Q19MGxPcq&C0j8&&#Eq%vS97kWrgRxe{EjF6tfm&q_EiR-r{7Ay
ze)v?ve5j)l-Q<etg^E;s@ka<s#PhmqB;)?rkm)!P#wa&)f(`e@4#^ACK3a`hv%H>q
ztE2}?)xF08ZJu%djPKj~bkFEy&h6_D#tSsVH%5y)cTXQrH5&64X}1Jk^Pe*>_s7M+
zi=N{>i<0~12q$1DwsBuKUFZ>SG=;0hZ_QOi-eCUN$A!8V!ereYOjX5m=%nJM2^L&2
zvdR6zwOJ4Crv1FNn;kGn`J7_=)A^;i9rPl)zU{uGd@Lw0_61@)hVDIoJTMi0DR3zc
z0uXW*zoAWLKCwJ1P_b27SZOeeto2&f7-R2Z$&g=epE^!iZwr+ANn^RSY_L=3b<Xfu
zE<Ls<o=M-QaHl=aQX;JWrfQ2k-V(m9>%BXCz?;fy%8~CTcm9sEWy{bK?!%}ngW^st
z*7LLb9I{jwx|}`rm30lG?Apse%hUAbQugL0<fgZ*U^N(+NryW7c+G}aterNF%zFlS
zWPQEdWA8hB2&YY=CKTpUx}-3SB!jE6vq$xga9P31-oy5XH>!<7Hg^NP$=1+F-Ih0w
zL8OCAx?zMO2>ozp>gs+`kNq7M7STPn=jpINgxBNZNgGectxVGUn3%)bc(P6;9KDzR
zbiY<2=|!L+8P6WtK!wkBQz(cwkVzcgvmszgOgL^aIGPNwHOKhwQ0u}hDDn!O;79k!
zs18<`wb})&>%jBo`p)ZwfOM5mXC&r&qbwe=%GI4=K71@vftTWu=^sm)&n2rKseB{L
zhkp$8Z<0Qu`#BJiM#w8pkGJ{b{P2Kq<@BB*_Y~&tcc!tv5x({dS%-AhgS|6)oyzBt
z;Up2?xYu#r2-?$JGbwp{Lz9nLkC9nrv$%o}Y;29S&tX0TUl!Bmw&hoq>FQh;f6^yI
ziJxGRa7jF}`7RW<Q}VGnA(PPulg!V?^+WTycYc*`xxPQqMhY6nhy&NdI-=Kb8ScFA
zFW`9BB3e*>xIuG!`Cg5T_cf+JItP=q0|9EA2ATDI9a8P$G)E#|`RXS$%st!He*VhT
zmR-z>u&<t&q|NfJmm5SBA#!$K4!&*0NVHtFkIHSoAjd#6-eH->en%1Jsy|&li}sYR
z>FL9(36woc&QFUrE57wt$EUB;VVH+C>)btwl>S7DuBuN8j7lDHDhYO;mg5zg9`2H?
z_Gc)<1kNySBUL@5FCJJryVhy4i76-!E2m7rBH_!=S4j3Tv`_X|FtOS=iSA$509rmL
z_4R;)kA{a@%H>81*_ny3vUe3{1ICrkaHeDJv=rye7p@PnxUlYSkUNI)-~`BUXSF~@
zk_0I^`&0SF$$d_$@^3qB<!bO*D6jUv_||<5A<QovguyQ~Uk@Z$j@it^M49qfG;37Y
z3#8o^H3?pkJ{K(1sEBqhHq00Jk%YEi({jc6sAH6AWEV57f8C<z#_T}=i^(4ESEg%z
zp@Dr6SC`BCJw9uCDAzGR^g`xEatm)@L2lqnY)t1=o+c@q7VB3Ga8loD<m48q<)=}>
zJk1x4cz0k?+Vxl}xgiv#J{b`aR|F9={>F<knlAa}<)+_z4`Av(uu6B{Gy%tmH#riW
zEyx6_`^&m*qC%)`_bPO=RQ%pjP@tmT{_P*^VAOeW)9p%f)o1eSPcPMuxF9Qjp~<Y`
zDrq!>y89y6UryVoQ3>cjWRMl>#t59beSY<k?bcJBMv5x;;y{>zf5e>^^EI#=tE-8;
zc6*sL4!kPM;UTJzi37LKo3I0-UFQ709WBYRLdqX?Kr2BqVkh0!GiG2c*iWbo_EEz6
zsRPNz!(%~BoAt!XWX&Bw4lQmIzrWs3Q~WbDk@a|W(&_Rn<n2Byi{xrHhun)tbnoR-
zC3R&!wImc(w`uSna>X%wrlE$QNZniqH(y?eKkbL$?S5X7A+O$<MQzjd=8cPYxIuE1
zD?JWHNxa<prf=_hsT#9>5coY}aJQ+3kAJR~j9HAfCf$(bm|CZ62#TYLRqQ?lix1MV
zxMEv2I7pmLLbsM7_ml|F9we99V^i6`14pI(fZ{myh7cdqr0>e#WI%n5D?M87k&c^X
zH@dwE9NT7WIK(K2K;lh~tgr~&HFK9%F7umIJY`;F`%B$vg7iv>4gsw5yAC^Wa-U4W
zGeQx%;8!;ZI%W&vbL<4qE{?qXuhp9(yi+&e*GLsnMbmE`rfV#--`zJM6|x}_Tt}%Y
zwFt5lL_G;78p#6N{5nO;rYCuXDiTWzikMK^l=3sbxJjlcB|xBv=pNR(Ivj5*Q^Wmo
zA_$m@c_1Gxxejm~r!stsvNCe}FrNeqy|6r89F9QxDi5cem>9K2&t;T=A69a+S)RO1
z3m?E+x{3~}%6pydX?`>jLV4UIC+2lW{l=t3pMmf^!sxw*<OiDl5EG5(?fy6-9%oJ8
zDGKgC5)jLNs!{pJ(q-5|Fg5v)gjo-)?8EV+597KJ4hjX*tQ=nvL3v~2?&PF7k3;3<
znj3WG;`O8V?lE1if|n2EtAQOpI+?8y*RCR{AL@-9VlmUPYqmYrcOt&g+@@`8_6Rq4
z;Wkb{J7V*g{u#~V6t}!2r)Zj2zIB6kcsIU!pk|M{G1;A~+a^tp>kJ}rt*KGv;otMw
zCM{p7Mb<ej4ScLD#Yo|?Mjj_UPF3zaT*GH!S4ZgL+`g_KUsZHE$pyaPsdpZwx!Y^n
zN9L)vE-@i(==#V;3R-^6-IF?*WEOV1o;lF$5PSZJH77T#`@`@cHB_lu7D-<_5_ES@
z9_^iHf%0`y*~qea>@sk8H>CH3As=qGPAGd-vf5;~vZL-uFf`E8YhPG_$@U%T+@Tj5
z^K3CYBC~{|gWdB|Ur_svAl9<S*2KN!i_K>mbrz7XMv01+0&0`Hb=<or8`lihv(--v
z-8qTM+e;is^u`882%Kij<}deGb=6-CY{%Z|s*aewtFikIGHl3om``7kyniYbv87&Q
zD>U1gtHHK#Vg0WD@==H5l5jfpox0o%uh^aD0w?)2wOp*KtC%y-HQQ?@zhN5HG=k!&
zY{=cP^0`kd;PMIhSpyQ&MD33Q)bfg1sevDKxXooNHgT<0K2hS^y51mg;_xO-c-8mI
z#dMoAx}Z~BS%!~HgUeQ#;G5Gpb#jl`Rn~@UgGiEmFBYgwE$ljaBbO+{Zk4P80}LKE
zBMJtw_3;h=X>4Y0GJE+)bY;Qn2Sn-e_Tq24e1%{Tw+NO~qeI$_*;dFC%=+~+X77*A
zo7G&j?Y1mM8RjO@G?Dweco3Avg2hG6&#tHAB*Pfw$05hl-6`5S)f^@pU1fRG;+C?|
z-Memb_Eh0@d0I8XnrBGo`)ODLt|Nj`;@R-sF-bq2K9&tpY>s95FNbt<EhnV#`Z0Zq
z8~pg4DO>%89-^XCy{-G})5_~f#2i)?J%RU0Mrz(Wlf&wttT<ivJ8iAm7s%$Ic#Itm
zupLj{C*N@mPAZu#Stf4F6vm$GOnFaxW1BOzWy6eqT1s~HW|J<@EZWaI(wRIcvmrU@
zRetWe2ZdZNECQQshl?GStp|1lk(12gR+2HQ`XeF($bj>*OxeY0pZno?&8B5b)8s1c
zPvVf7cFqk>*i~Wv>DN21!?=+GKh;LZd5#no4BTgM(vk3<AT1z`lD>H)EQF1Xgmmk-
zf8Jps?fKWbOhrERo*7j=3#5>?l4K)r_Rg#d`o3?$q{Agvip*iIm5^VCr`3?c;(6<e
z$2uJ^l~38BCzVApEKsez-Zrwhgo`Ol;~qw&s^9Yqc%MMK7ryPbAYX={kMG5OZzx@a
zLhSOl$gD4!)pi?k6pg;!EE(bOu^wpOQl*4bCQiU=|Be5(DYdS?!XZBGLK3=dQHG_7
zdiL8_t==MY72Z!!#3W*38C54FJ5NB%;#g=v$@*gvYq2fKkX?ytRucj<d0&xh_@e%V
z{JmlFOfI=no)<HJCym)~(y@~VN+0rrsGlc?21XRYr)FnwIj_2IMLF+ACe4d{?x51%
z7^!)|1bwzh-gftB=V#2Emgp@7>x(dCfp3Pl%+J2=2<V>>S74kpznCr=Ha2|PVmkS`
zR<fEC8WdrwLrsaAa{e{a{siVTzKR*ZO&Umgueggf3SCveyEUHn=E5>tu9^^6b#gIx
zGQF^I;iGDei@<){Itpv}@WiWI3)SDWN?!`B#Q;+feL=E@2}L1HlQePu`J|~8b@MED
zbW<<a)!i0boCj%LwJ^E!zH;esCu?{8Q5(D&t*@3tUoe#mJTe%lw9cPfck*pQ?x<HU
z$H??DXnM2iv<F+h>D!1aG|iz?stc-Yc`oUh6P~qAGcEMaJKI`nfJVQ!U1aXMEAn{|
zxAJL;x+|TZ9nEeAw@aVHyleiQcjIoR(o$_EWWJp~wP&r#AQd7~QMp|#@m3S>bV1%u
zpBpXxEXzUFSH@|VAvk$h&F6Xk9uH3y!6eHEKb?$Z4BpNJ4?`C=R#&Q!G<ALQjulO!
z4h+j?i*G(++U2Caxpg@ZPEokD_Vl1^)wi_9qjAS|QH0I;e(p8rYLooxj{G~L(vBI^
z`6oQi2ZcetMZ&qOWyvF^cQlq?pZ-{q+0e9a+y5GByxUBD^}&E|0_qnN#&&#<msS?C
z%C;*e;&R45uklu05T1&|m}-B!OFY9X`?XW@d*@jWtC^mxUFH$%GJ~j+fi-dcfr6ag
zw$6fVtLPCXThCJ~Il8(G&^>>a#KsgaskK|6I$q;!yYMzUAIaPhMaIa_bDUTuuCez$
z(qP(XJQ_8Ze(FAwwj8~EgvW|S=l2{{=uS}6?xD7?ZOTotPMJi}lbV^d$Lo{vGR}A;
zC7-$ojPxRiq4%wQS59NSABK2`^05gl^z)k#r=qrzADFC$6W0`Myi9ksx@kOSG|Cy>
zzPHNzSZRiGQ>^)>4o0g^NBZnX&V6lNI9^A+uk<^PmI`br({~vvJ2up|70;l9Jpoav
zn#h&Z2#hHk;#yzDLnzUpsDN=-vExVWDGWWSjP*Ne7Nhn@qa>!XEmw&SPe#shFUnQH
z%P$w(<X;<SP-YmqJeP7h966R1m|U$>k$d9fwfXr+2Fy@<V$SExhQr4+za!U)9l|E&
z8v3)L9R+ndJl+;HB9@}j>YGM#SBKB=C&8_jx`p%kYwb&ppiO}eM>v;A;`;5Yorf6w
zeTBhSHPj=NAM7of5nXT6ZkCNJSGjI3h6}q7^Qa?tXKI~(ty~GGSF<TqoM(<SzMoww
zSv^ZSy6{=&8eLxYzjw40s2x<d&lF^Mx1o4~S{qL<L1UdkasSQhrYYq-q3cF3l8aYF
z?J5hE&eU`U?<LKIVTtG=Ycb}mD}b+Ip%GOJ_E%P7?tdyw=$<6Vv(!wl*;Ztv)>b8m
zqW{IFh+zYDM@F++UFAy@e*D43@eV4p{;h}5lBF+}j;*)Ezhz6Ohkc-xd1;;D^CmjX
z<CNGu`gPeKs<nCo)zz-V<W-Hsky|HJnmA1Ajqe!l+!&-#+<%(&U8T^Z?Sv&G(Dd26
z<)uKyZHux%E)wC5m94ArOiprhHK{5Bm14c+pB49D`(-PE>*m#3cZ2Q!Ko^~QLAe)<
zEFO#OhwoiV-mU^+qbE4t7_ab;To%nGKW>Up?m{BTz!<L>nBEBeh8Kmy2tAg_U@EFl
zYezCu%jozlY-mFqk=?Ps;YRMgyx;gX(l$thOysUpCP<FR_q=4?d=zFBaMqRCP3?T{
z*7c@m2rGi0l=GUG?@hm~htPbOx^x$?t$Sb=>P>2DHU}Z+$w7VEp}o8E1AV7Bw^pb^
zL%-e#UFM(bJ+?8`;o0An6t}G8VJcpM8|nUJ2}vmBx!xL<De?|@HOAb0ElE0Tq0z!|
zICky0IxrmfUDa%?QIK#~P}#1JD9+8lt%(QiRPyyGGpe11sxqz9oR2NH@iv-q3$ID)
ztIk^ZPWh43VW*1Do~U1eoLFc06@&#&o#-{w9?usXd8x*@Cph%6nrD%NG*Y40_NLGT
zeJ-ZC=5=|@PTP90o+0Ol>cjwTHM^if$z-;?e8IwKpFU`;;DrRFzF>ybi^jnWV(Y8t
z=6zv|->3g{-p<8<u<ZiVW56`VcbF<!^7(qJ(HrY?eywx6(8#N;Nl&Cu)!nOU5l;=m
zFJCQhdh6?=abCt*rqo#F4jR&GylQoT#mMn}o|B7OUfFBNSw^Gc?^O{Ql+#HK;at2k
zupv!bn-)?VC0Vh`Sbg*dUkz?GHhwqUG(!6)GRgy?aEnv=f*RmGp*@<m9bPRkJv+Uu
zkdvPrdR*uUiq9k|y*F)HqX?V;Rh(>kwkF1>s<6!xJ@tfZ<q8<A^Tyvs<DcJ(|C0Q|
zTuHMU+Hm|xlR4<xug*ZCrC7kQpN54(cTF&|tSWDjk8|lNwI|@fea3Za5=xDK1T&Zw
zk9kl=zkIJ+^nN-2(C$=IB&`?sw^i+m?+ib!OHiB&q2zhFD`;Ka&YPT?+d^LOduW4W
zEU6c;)KmFj`4t-yy8BnR+`JCXIVFk<)2kO)zK}-TZaE$ssf?e#*w1ANP{fATH(!5v
zC4h8q3q^oiZ}(bcq{vV+qj}^!z=M?E<+k-)qdx`KUh`^qn*VfsfDqYrm@^J!(SMki
zI2_RsQ_H9HT}-a}nl0Stw$iv8bj-u6{_wcntI1%QM|o65?vS2x`8B-{4WcVnGP%S`
zAqO~|*m9DZ$7M%LEW1=#)wbDp@~~HHR9s1~Y@Ph^WYt)Lr1}iGxg*UhB4l@!X|{Fu
z2Y84CDaEjEmziVRHoh&!lnS1mBeLjz#mh2lt@Uxo#XYt~PbXg7c~oIm_5hVGhp!ty
zRK|2=K@{8j)Ze}`oYAIzd6D|7u3L3pwr4xq%39e{k<9Iri<ITB<e^@|UKMh7SgXgL
z473~yG#B&-&-Ys)UmPPR@A3+tjjta*gWPd^GhkCPRFtQfNx0lL80oBWNW`$C=#$n*
zH~g%;{A-P)@|;t6-2=z-0A{-3APmi-RZ<<#^n=v_!`TM+-u(c#t_H2Tq1gTEqe6e}
z&l%oHeYvBTGPW)Y;Zx(XETMOWxvHJuW&`U)4MW-Q^KeP@x^Y`n!^k#m6$o>s*(~JW
zA1wD}uWX&3X^$WcZ;bBdc4Cc>P1b?dnJA2+kQHsY;rO9#V-WgL!`)_red71r953V8
zU7ApqTg%<!P#ENc?$^*y`a1v!<(t=t=?~tqPTIAGJ~B%Q*S+0{v!Xu?A$*&kbLG-M
zk<IETIO0w{=ypXJLUG9P+8oGoaAf_gNOWcW&h+H`HjMdsz}vo7EES)(4CU#OwokcI
z$xix%Gc=bfI{mS}logQaz)g4C<(*X1<k*hbD#%V?5%RJ$OCzbn;3Vih9U8wiZj99M
zl3;xZQhFSYR4|vK1{(|5ZRknJF?Dl{aT$#Ae2G0~Mw?!M9e^vR`&#N>y5~PzY6@wj
zz4jzT3yp7fjOR^>8Z3_8*#@O<d}44NWnJ_9r2k#bLwBLmcKK?eT3gsHXX3T9Z>P|(
zTt?~Gz|GlA$XCOB<p9f@mz1df&-dYN*(wgh<pu82d{laaA5T-Z>9?y432-=!H|~=c
zJSnY>ODgI!8*jLgAU7y-x5|vTQ{EcJjh<)kpX@CTO%Y}7sEHW_J51pw*Ujl;wq+mI
zBgP~ybzfmV6CeNQa}}GG0!ZpKP<Sv)R^&I}E#n$f<jtjiEu6kSdSh*Azxv5zG*7lD
zpC<(7=fY)(m$XiOTq<<X|87p@ItS&2(P2EPQllCrtJ*oG=>?|OK)I+<O};4;Do-?J
zFX*#<bbQXaTb4BF4yeY;mkX5LPrgY!J961(nV>4<#X;#sz8A|<smobFdh#mP)BV%B
z<kE!p)6egrR{oG^C|{@w`Q*k2<safX?8-Gu4cpu0F*ou*U}5Vto%sFDYQ*%#42r=%
zEAR&qUP$z16u33QWEBm}EorZ%5{l(pPh7cEy-_(_sLkJd@5)a`w|nqZL+1oaAhvSB
zo-s}VGWWH4D$73WQ=a$fw2$z2QJ2=<MNflxYQvttJ#7>jzh$9-<rrkH%=_S6uOFE)
z!y}B5Y)*d^oh+tQzobS^bUM6qT&5U<<b;xRv5(M>LbB4kx{i^+fNGa2`Qp$DFQQTG
z{yI)&$=;5Ww_{XXLiGnDWUa%*!?$TxgzJbRK0-_!4d@K3lG~8OcIHaA{TFx<7!>?x
zwN~4`e5ppRS!YT3d1(=`ulVbm*+s1lgouMMHf(Sp&ZOI_hi10ee7a_%y<~wV1KJXb
zK1rEvDeREMof5YMJSYvz+t}&iKE+UJ{a1Q&1I_J>pOdw7Zq5#+-wTEDxUQd3E%!$E
zNf#d->NgGw$DsP-1W>LDE3qHT8`UOv_h;x(kAE%{wxXAbY3?lxtc~6PfQ4<p=R)u7
zmjwC*p_d-p%POcR_Ox|<0yl8cuptbmOUGxp$AeIlYL_b*Q$r@pt{4Mv@5R)W$<-Fp
zg4yCFJNas3K%{e!<B;NWQ?mywoyGL3)Jdu`NrC0Um^+=jALl6EKHoMFxu)2~+4Z)F
z?n*mS_`AxApC`{_3cj<9<jjK-E0$<(j_bP>r%l%iktj0VoqA%}L!I^L#m53F;LbK(
z(WmoDis$&`f3&_Iq??gMhlG@@X!yGR8us2x*a}or@|{zq+6(#~w*7mi0GZZ%5Ku-h
zX503)!Q_E~0+SZkg}wCa)f*i<s90XVEoSu#w=m8FCH<#+IsS9^NEK}NkXV{T8diIs
zM0h*$QMMUgVk#}Tw(c;o4E~74$Z0m$z^~3_-7g;~(l`|*f?w(lh{IBLb7LAs8$k{2
zs&MJ+8Tsgq;l{`b8S_d$nfBTwONmV0r*%}kdA|HAn(BOgG(kgsf0l2Bu*%1gDlLh5
zN94-p6%p4g%7hocg<44>=py>ca3Ts>j>(M9dxs<Q!czqT_hdjzZgT!b)AV}fdppeA
zB^V}NYLCn`w2SFEx6(up>$PL{hI{$4O=!i_FIgkKsGdzCHcpjgc@BS0GRsZ`bNf=E
zjs>?BkB(4;H#}UcVN{HtY%$%c72EV)NrkN^=&t5(l@3Cd1viUiVoqQknUtpi;OdZc
zDXw!=VXlRvz!A}ZhZC@o7Vq79mTs1NRco-Xth+$qXSar=uZFkYgWsK+YVO`s8Q~1j
zEn2DOf)BNfOiAK<)$YyQvkLi%iYx;9pRfZ~8P%i(ui1uQ+iEayFdk60RTL$^seAFb
zsCI8_rYb?~fU3sjgi8mtji+e%cz4+{F_CN11L=D{bB($AEDWF>na~JDL0YKAc+=+7
zSboj0s^_FDPFF@V<CP|Tw8vj&(z4HLXP{}H&!5F7#i!y-YMG&%7H-@=eo2HMaR(>B
zc}7UpQJR0MmQ3?)eKWQt0Cn%{GetFC9Iz^7+1+X}=v|`O?)alb@G?c^joAHLgU<pP
zpjx7>28;65Z>^XJ;mVzqUlG-8HDx#HZ4FJ(Ta*VRh51S7MVOOyciq(`#O|6jl>RZi
z_bJ)?Jh?-j*PiE%))m^)+lko7Cj&GuV;R1UO-?4)xhx#{PfvtbGD7Y)T1Ia)sfoSf
zZ9HkRsc;V@`|(N2=e>mO1A_P>we~SjgP-;>V$Nngax5vdcTcvB7@K#deWHRQ2n))c
zV$@BNrgmw`$82X_8cr@!rQ!<z;47aB5&HbSRM)?|s@;m;`|JE^k&*4OTX?xqztOBE
zmQyZMQ;^!&msE*fp5o@VmshG**5sH*8^VwVHS|3m%;FUjQeI)Mq0<5Dtz>5|ha<vc
zawk$0$MzUavca#rm*?n>b%yWqF^zWLwa!AGeN7H1<=uIb|ExX5+4aEkB}@9`JqsQI
z3E{MQ45ga5q^Kh<+?YyM$@{($!W@wwYH-8)4pR8u1m`Q)$(e3DvWM)qqPEHYL^Zlg
z+9Ea3I!621g}Ey0^D6^czIW9TIK+;eQ}clmCs-L&dy}=cINCS@4KD_f@%I+LC*k*b
zmi8y~{Wz!klS!MgW7#yNLlwt0JtS@m`B<U9q(XGKPmrIVBTKN}Xwmb`XbxC^dN#6g
zY0D^mK(m0fATb?zAZ)NZ?GwvB-m*XCc(k)-zd?35_;oJr*%iV5!b~S}dWr)JiTlH6
zk@mPPnQ;YU)I?R@#gF2eGiwi~Z_GCfZD8XjM9c@s`+fGf-KVkY)w8=f8C1m~_FRa@
zP6k_S;s=glVHx(jKky^Gt!y*gcacv6eJ*8ShxcyTQCMJZ4NvY*ca6kgyZ*76ec?nr
z!^@reU~gapV<Y-X^DBKb=KFt|Hs4O}cL}yFhar9)>#@)Ho*%bJH@Y`s*;1V@_9FT-
zl782MV*jz5G}N}}9->1}SU8FGhTs0D_sK1frhF0xxh6}Zy<H~`S$Ad5O@ci4QIZ{R
zXS3gHEX}$(`A8<9&?j(z)iu{_-Q0wKtA+Fxk8B_J>~>9&*>`X9k9TIi4tb5Ii!eTI
z<4Mj#-zYWf;xAd6lCfF4=wjEWpg>v(7{q#m{u==KH!Ar~9EpvdQ2B?q%>6M{N>ra>
zkFJn;y<Hy1{WeB{!j|pjrJV)o0utJNJQaI=$V9ikz42LB<Ons1=eb@LO6uqHfF!|_
zrPfkm+Y9yl(R<zthNY(cI$vzND@pV<a$g2O&(F4gb{iH3uOSig>Q=DJZf}Vn1-{1a
zjP}v2+5Xt4>H4IAyj0$t2X3$%{t}xb#Mz}F*#y4jJ$!q?a$7@T!S8%qVT9jXba!OC
z{&7#u<j|MuqX+A1qsSZN9U_#d89b1nY8zN~#GTGX#x9Br31_(4Jr%hc<OkZ&qG{J5
z&rE26CfqNTTSd?Mi<^SaQ>a9(-M()8;~&LoI+cZYlHWh!>N!%Nl?d9HnbOnn6>csy
z8~=Fi?_|3EApX_5e9z(Q2kg_vbhp<J_R@iNLUncuF8D^v`Oymd)B(=>x4bSp3WoLr
za}cBln|U#&%F!-u##~qPpc}G&KU<F*aa{<-Z<~#fJDEDAUC9x|rnkQx<DbAPNr-Qx
zJC8wqCpb){Tch-`HOVX*r|C8M(eQ|R&yCW1S_CK3vwOt+@cb>yMA50d@nd{<jKw7}
z8OxKLxGBmzlT@GVpH(YP@;pn_Vl6U7sgS<BiZ!pa8`Nd6q}zO7FAZTYGOfqalv#Wa
zX%xG-t_#=JmV>Z|++Q)jW#cZ2-ZGHXRk1-74Q<Bh=Ij0%&XzN652Umk`(t*_=-ks)
z{)cy&Mc2ljn%LK?mEAsiJ#FfQFF;cylog=sog&3*dR08cW+m@$QSPkE6=U}fo^IQ0
zLFyUiIgIQ<;7k%Djq`=<o#h8q>2e3HHA0)iberJmnQ$&00595&mwo>u?XmCP;71qd
z`kUs4#egSXYd>(Nstq~GTbkcvlJSTEHCx4o!H04j!u3XCj7fdv{?;Xx7PBR*h*p87
zIr*_`r?^hJi*%Jjty~+KA%iT$*>Vei(0Ou&J^4U<mG~YglP8-zy}Dm>GqtAIGTZH{
zzN=mJT5D0raviMQtLC}*3c+*2DRxgZM5Y_cl1QI<ZR#OFdQ(+SYdNmk$CZO<W4s(^
z0uHxr<MXaQt>sEAAukCzVhyEO{~=tveaQF)Ht#wbg6%d}t6-h4bL{PQ1$vq?U0SiX
z1T%dx`WEB)FEKXw&3?{rvU3_&TF?5uj(f5}-0ET)LFcGb`RcGC{Lkv)Ss_z)-q6~u
zn471XQG>^E5+ll{M|+Dk7AEkY%8~JB<)DpN=ps_wbq|qCwBt#lZgw7IEkt*1$w9w^
zt5`Bl$gNF%wPV+#7@Tx~5ntfW`PTcV+b9nQS^fG~w+L8W*(bZ{2<;6{Uy<NQ&D{3+
zI!JrqWUz|?(_(wwdhy`U@XQ9zIv4w@Qw^;8Gb7ya2l}<og><!&0Hj$?G}o3EH`s1D
z9XkM`C;O1|CARFt*(c%u%4>jc`buE`Q785%A{f5`4sn@se;&d^N$zdQ_?4P(%b!Y>
z77(;WGvq=kzP}+sP{*|9NcO}m_v$*?A2^)OwHG3b@EtC0;kz|H2+%h+yy%57N+tRB
zlxsrS3FxD8Mp+{j&&#vDJ}_Uw$uABz$%~$o_)n%rqK{){8OgMXsm*!S<tf4mjtrgC
zZg`nL-!OM-(B953U7m(c+%8r%J*k;RE7v3|aow;~cOv?cOPwv3!KCNpsF1CCs!DGe
z-^);3_hY5{BdOV+4T?r7vTKxhyn|1Fdc#DOV1aT&WHMW$Y&phXWk!7Xb95TT<y`QR
z`Q}&}PkyfD^qAbiZATouaV^n%l@yPj4eME#l23+SmVVLjC)j){Xor<8>1bI>Rk*4n
z`B`T=8~VBFhWguRe(3@WjDUJ#)G{G5aeS=exOLKzK>fu8{T(_7`7eLf6!fl}44JbC
z5MsNb2*D<{<UjiZ*Y5j;n&K;(63A}MC;LPA=j@~QSeO!O#1ETGJL~0fBn8qOW7(t^
z-;$osNPlCAWUPsC!=cnVe_LtN&|A0h5Esuwhnj&)oj`0#hzS%E_-^q*_Igq-8Afaz
z)_RH4y1~fB<jSq3#nwbQTKg6oMf=;N1mVFpV3URk)|3@6m|U_-PLwncg@!)tDM_zi
z#$mjarcxOEjQnNx{djl1hdyDsISn~(8ja+G%&}{o;l<J$#Z~MEXGQ)K9A0etRz7fZ
zEo#bD2u~!@b$sS4(VwJ@ex;J1i@#;P4=y1kC|>6231uXuo@fj%pIx!x<AlSuNrSWZ
zBL%N|hEk&N31Qj`viaTRy_JjaO{00N9Mnqf==*e!a*g?C=m!#}1!TUx*M`MD{IilQ
zD9MrH7kUqNoR6<Nn%~{LvCARp;4~Mno)4EXrtpj;oS5~Hldk)`NwQ_Jfok*OJ3YDM
z<tqjsr|W3!0BY-&;yXuK*Nua#Pi)0TWi{hQPgmF{YWJuJqBH0txA28#51uc_sWWr7
zxTC%N=w@<L-%U`mL_2Y+M01fxEKm>eT_NM+oQ^6HB75C=xLj@B;PfV6GnZksL~*vh
z#`EQ9<o0@>Cv$BIPk&4w@o<xC0(-^Yeu^Uo2fOMD#)M5jiQGz%d<~l$K8By2)%uA^
zih-pp%3a{b&b6_c#bv@4CVX*uEPJJtT1$(XDIXqq)u62W?#BEI7D7=tyiu!DoKwgG
zHK1@X|MMIpONeAqaV~o|)DVl)N3Klp&-R0ED|x?C_mpzy&idlSLq5+Paw~{;QKZe6
z!yl@LMh^qr*F`vI*)=?pHTkJXb6Z!O!ZC^mW3Nn_ZM>~stW6n~j@tS*7s-&c#Q_+{
zWiy2MFbO-rw%0pG1O0bF%%3V5p@%qM4PpU~18Rk#{A8IUXSfIR4r-g=)r<Eldy%7`
zxMX_J;%OhExA_M}e)6}PRBqs4uKdXRx>Ie2#V2cgz+ZcJC9oma{gzyV9+G}oi=4ns
z@>mh<bBvlQ_U&@xZVPq2PJiM!3agWvt1k`(tsGc$a@JLNkzyFT%b@*<G5heat#|1|
z-?#Y*T2$RyyXc@W!cCF;ouBns1p4`G(^IV!cHcUuT5912D3n|^N<0i@WgH7EfA`?a
z{hC)~X(pT1X-CwWdhA75i;wVkbxfX$0@>*g1?>{rq#>Hw30!yU1Rbw3=1Q^9f+m4l
zP8dP%s;s`tIoI`ja<gxtRVqpx8;b&mUGlih3M=7%G!fY2ff7{apIRb!j-ySOYf
zdUVC%m~MPdsBc%Af6Wl{nANzRk@oG4=eFll-#)_+<dw(8)Z&o}H^RFGi5Fi+BL%MB
zblX7Ko*Io2r@`|A`RLk&Xbx^6`-hEJoT4hD3@10%`BD@5iazGJUjJqcuN_n9y+*HQ
z>8O0TEB0c@Jq4*u2%i{doF;aP5nO}*t9v*OB$(!td<<Ztbi41=$!ATYr`8vzKh2fX
zTCW<uVBpenw4%<`lX891I|{}<D#|VJ#&R-J6hsq!jVe0y;#em4R5ZcYvJ$-7YrdG3
zKFz}NVvQ;)&95Z|94MWE5evq1j@0TOhd`H*Z-2QvQHINQJgzQ%SG~l)uwXofs}PBa
zEK0VtZmZ>{*hg2G3D0Oqdv1o?z5VMO9+#uq9?B^IfplRe<eXc%pjJ{cXmFA9yQE%V
zc*!Y4X%=ngF$4?+u3rYie0-2CPSoxc^yFxj-S&5rCT*25LGGc|0G)&FiGEE#vqC?~
z<Po*AbAe&j_BgVBe>H9Z^&ml0*Q?m=r;%QAKT%_YuTmsxC?`f`FC0R5m78miLy~Nt
z12XTzoWiU3;7%X^JHzT$X~PRoCrj~3n*oEn=Vu~=k&p*dHjVQ(8(ggtK{0Nud$2}&
z!hUO#r8)>-65Z~6T?(tSks?7=?jwN>+)d4$J|<>GOaVyy&gZ=8>FI|lEyOe?ex;=1
zo*BsXoW|h<O?1u93Kd>8_Exqf=dx3X@A}Bydx)}-;|0zpZrww80(5Dg?qA}^XN2GS
z*`1cwe6d1@L~nXRe!KDLQ_7A-|NesaQr##u(bCAKtq>Z;H38#f$>E{HXbU?<F>Zv*
zUyJx;h?rA_gc22|cJ;Ul@884>h)rKj=nuhkbAUgf33J`Wiz!_Y`#eIJjBaJKe~0lw
zGPK@LNi!j`@BYeAj-&|4yF<ed2b;U=&Xg22>}rHg@NlA9;LhAJrH6o03s1ImbQ@js
z6|L@^mJ)@J&QmTzVYidUS8PC`rsCx$)RwQZtkd&>8+S5N@V*$f&H0F-(x*#Of%C^m
z=xvAi&vM9plJho<Ys$A2)u+Sj<P9{Ct6wSBB>x}w-h!#FZQB|R0fGe&kl+?baCZp=
z3GQwIg1hU&-3ji&-Cb9Jpuyc2?(WVv*?XV+)w$>7z4rrN6;%`z%r)njWAxESZ>_iX
zGdQKKm0PxZeysTTOHWb1-xDm^m{ya0QpMXWge_uMo+0J<P%K(wH4rln>1r~uxw>t;
zT$M25*0dCo^I$BauW&!x9$^pzCPTIvY6}h94$mj|l;&j_Kr}fH6{-+gqrSUCnPDrA
ze79E1)qOTNHhOh;BI3)&no~^vXcqsYyqa&zt!lQb;z}7)ERPx!mSa?;4-v~b^aiRB
z+SJAAUkg6RV)SA}B`R-o;K>&dh|TnU<Kq5n`EW}0V(v=$6$+tUCsYt-XaY@sAAh$h
z)>NofDE5;S<l(qj9N7o+JXqJtGw1LCkAyT1wJC%`S00mYKzIiIa}zVv0w{gVWd&EV
zEa?HK*EV`+xMo+iP4lDa#rfK8^qK>}`AYiLAkFI*Yha+1ewUgm=2Htyd(hKDcUdc4
zp5<t+zD9o<bzsP9yeP{_3VX)ZXd&a7aZI;Eq54LMWO9ZKSSq7@cl2<>sGuMa`3*%n
zAWf8`qV3+lqzJwPB&g(X?M+Ip?JQB^h}{A1?CzpdPQOIVUTK&Gp<N4i?XU!I)P~U-
zxRz}zajJgsyfRncIq7QQ3w8k*hxFZQ5=xKLQ`<H@MKj$Ar&9JxC+lpo^?PR1-p5XJ
z8;9d#)HnwXaypGXn8{*=!N7Hs@3>h~Xb}PX)@C&-tuI`JppER#yr*<1-5HbO%T=?B
zOe|eLdwo>txCyY0Q7ifs=sEhGpUcc{2{Dcs-{j7LV8CNacjV;uViQy1wM%|R(n;F+
zSA}$#@1ecaQ9K>Y^*jSciBB;n-JI-BNJKJ`R()TGirr7REMJ1|vIzl}6~!xW2H;6k
zAM02YPYzF6>@EdimFUvvn@{nH23$rX7f+9UnhV!psu9iA*(^p&(3M*9Q#DTb^l9II
zoE!L%45OQ7Rb%gF=l*LdHG+%M(1&5pX!UJG$w}7LuX;Mucp^z0Sc<u%qi-DG{B8Ht
zGK#}!48JF}YHvQgt5PLNfR|W^sDUM8G+<%qGD-n2Dj{QsCt>)|`R;kkM&e1Kl%KWw
zJ#=xIJ?zYU+Vu7_#xVaKOdPFN2Yp-c=LTCD_zsVXrDG^Tw6>LIS=|51W_|u;H0ckq
z_FmCDe`0rnNg(M+;aA_HPfXydaXWN1AU#haC;Y~0K9ce*)&|x*!2UFr*Bl4%eZCP4
zThP^z*z9d3%k6N7+-<C3qlFPKIE}c)`?Id=Q_8`R!FxU|4%e&?ZzyA>eo^*(tR3qS
z?EQ;wDv35}IlKhjkC@sv{CoYkv}6ZM+6^>U#}PQPG>O+^F*)hobRXFE!W9>Q&M)AR
zDxqDS978s748PYvKYWM~>XAv!;d>BO+Zhy&Fs3mkTl*^1WME$EK&oNk54}@$wpW@|
zkf6D^=SdM^BZc<3d8d=O-XN*8@ee}Nq@G@8xR@4%uFYhlv5pW+2;z>9l$`!$c9yvR
z$pr22ujTIzRC<8LAMj;;ZMJ%A8vs5O>nfTS(!|Kss=r-+q<G^~A-z5Iyup)Oj2duj
z)muWu^k;mIHjok~*Xl|&WD7AEry#ADtqN^i1F@y$wPwP0n-7`T+mbiV_Z+{|pcrl8
z;yD3f9>eG$DWvLNX8D^Rdj{%pe!{)CwZ(E<>~MuWndWUHH?T2ghEK470IcPzQ~ad-
zUFA*_&)My7D?5|T5{Qy)F5F>eUgQ)zk%osIIz$>R;{3r5uUQ#(M!!u3ej3|-#p!vU
zPXh>Lk;w!;q+%N91RVRHx$KV_ycZbszB-vP16ltv1n^068F;NMBM^YcdQU5}Gq69<
zwJj^AKGG`nyR{PzEJjSs-DnKZzqMZfazL9|SrzO#W;*J6C7`+%Jcs~!JZ64qHLpeN
z|IW(Xda+r2Yoj_%KeM}_Q=-u^TROk{T0e#uA9*%&Z^!<k2q)2mtbLZITr8VQv2+(S
zQF-@?6}&S4O%_6DDEF;D&blpg;aj|nK(|!QdgKrjhL3g5fhfV(Xd>lkT_`+CP%OR1
z+-*7)K&sAA9hFy^Y)XDu&w+D`4(%NfCFJcqEie!JYk^C;Y&cZopT6E~K~stjoVLLX
zA~qk&UfIpJyxw*U5JVH<b+rfiSCCX4{dC&?6|6v&l6N1j5e#-{<zRo9p>4%kkRs@L
ze6SpD-qZNJeV>FxrJ7-{8>zpPvR1L75PAA)ZESPR%fl{4X1Au$*cfaXVbiLLR!148
z2pEe*&)hE(S7Q1};de%}YM-ZHPYDmF@yjf_zOD^e{^^nSQEQH63Pc=vBOP$&CjP@6
z-Lk*_3qnWU<P**{`v4OPST}hi37nQmr+qsj<rE&DzNsAfrN^X#lYpb4(b@p4k$!0e
z6!R%iR{D9z=j<D~B}S`h)7WozA;=6)5x7&owY3^$KEVT^1C&F6qVOL<2RJAxM3J32
zdYF|x5c)KXE`IG&uG?z?*xK!dOj;rb9R2Vk*V2wNSTcBhT{BXRO~Aw|K?dqFo7+>T
zCe|YnL!S`?UAMJfCGs*JOFH8hl;uDdyHF)PpYa$;Iw!irzH-C?wqO2mvdp+gO5}Qf
zoY7u;=}bt4W5p@+ep)0@C-9rcc?(eA2ea3rMGIgs?MRS!7Cl<J?G7lOSbVW*RI@Bu
zNyPb?%Qy9;0O!c2wc=roNHVRFsdq`B4I#jVx2TkRx8~NAPUsh_zzjLI&uhl0zT-?)
zT-Loqp|BAP`{pLv(}vtmxy{d_VM=mePpV{wFD*wWtKU`QjFgXWe)J@MiAm^ck#OkQ
z47>8hMhUCtAykMj`QoEo7DMaA9E8i514dVoQI@}<RX@6>>s2VE)Wmynp=P=E=z)pl
z<y09&l8Bj+00rqM^XwdVZ!f?e*AKm#ROEPcIN}W(O63y;OiX^T)aTW~SCIvrAI}n_
z6}peW3R>+<xfOihA&%gEG=?@i6aE4FHEn9AsE0M3vyav736_iEiY2Dh^_)-_>!jOk
z_(pZSp71T9-5DY_Zs3_=`nTy4O}tU#;iZR`;0=AOZ<O#UYrOc4n{1AQT#2F`om}qp
zd_J1o^*mYOkS%irr^#L9BI9kTPSI}F62};uru0oE%uw{He~MpcHnLzbD)>0!uz?FV
z=%-F(Q`u5D>dw8bB_if@KsT?jqqCN{#b%uC_BdNid1;e_9rAl-jIm|F&5|5RabW_s
zb;w)UcNThYlb{*7hUO84U}kVU7~haE4}#A>_r383|8a&KUi7o$%%0hj+a%He%W+_6
zbs^c-${IMsd7lKAkxFE9vP>-rccOenAy%u*?-qH3qS_s?YEekyk$C<K5RL1IHd2l@
z6ljxWfyqwQXn%75o+nS4ZI!OWCmf01c2tTm^L0IsqzhKiuP`1#2kni}f0q38KTAFk
zs7^Zoi7k>Am|x>NTdBqFeOj6Kxqf~F*8tKXg<-+?k4LTTsfj`d?5RoeK{7&nSxQj9
z_)o&|WaiDdC0^~b8ntaeaP3@V>rq+RQICW$mCGUd78L}k(k3!auV7;2iQc~4<i^mj
z<0>-k-~W`d#X!`uRG4A<?tFZuCHQwJGlV&x4JPJu)9X^mJXqtxjy)?QSf8V+JGT75
zCB`7r=f<IuPemai2vuuhp}^`1G?1Uw9sV357InXEY_V==0LaR3l``2LI%vg5OCjlM
zo;$bwT+~JTX#iWWya=*Sbp<8dbM*r{W0!b+zOKN+lEP2@7C`sw;7VSBoss?XUQL4@
zbkB29ow(j6m$Vn`EDAKeoGii0|0l)yUkHQMGs18&0uVHGj^dsR6YBtN?Q^k;m15k_
z4#h2Yb%kV>dhPNFRwC>qv~(5|d9aZ*l%o$rZ-Ll#qLM1fLj4hOsdlrRS{TzfHnp;s
zw#i-CJE02mmu8>}x?F-@vC?#pSfDSb$fx4^?CO-&ef>etbo%lmpuLtBQB($?SeH$!
z1s!*Xv@)vhcV|aR=bh_1p#FMHzd<61Lp#UZ<6(3Eh&F}N<N0q%GaG6CdU~(rf^8^Y
z2;e;NzBKcpSuH;H<SWpK#d6v@T*7huLPeE~({ttJd;Q-@j%JN~(KnmEkrX3&QrwCR
zG$;<PrL`Fb3KIsCyAF!YB3M{QBP-b~*1g8m)Rahl^VdDQPUR1(;X$-X#9H3LV{<^q
z3$gasRL;gvNON3eV#cOt?siStii{6mw4`3D0d>0_f8{~<bgRX>7{1$k>SBK2Wb)c&
zI(O@9vAZgqO8~9Nd$I4o^3xl<4JIU$EYA=kyGcXlNr(3vk#_pyiWQp;vA|qONDyMZ
zI=9g)t&76#+7$4N`YMi&l$=vi^|!30MIE~k?AYT>Ojvc}@HZ-H;0N3?cNQGy3TsaD
zpDBDukB(;S6^@I(rLWC!r1@dodO9qSD$<TOzESl|U8F`#u;4V|R>DGXCkbT-kLRwM
z2BlS0efNL)adCuY=!-^DgC7c<EW|L841jZ=;<pt*x==m=#X`~jfgZ?O&e|{Plg@VP
zcg~d1Hiy<)&|zS_>H{y&d1Q)y-P0#(er}QJ21%JsnahiP^4mTa(IBGMNGz}LYP4B%
z#OmRbDFkx&OU^p+4Y!@j?hAK4LN0s1r3dTO4lGoF5doAa?e;qmt(w_n?$A>*iCVc`
zQ(1B5#a<f{N`r``?j^OPu6V5xCOhVVnnd1_8rZ9IX6M=!uSZH9(6f`j?Jbq`U{3>L
zTOjfM-nk2l{^rZL_tr;KE5bye7Y~Sg`qgCwHxWU=92?9qE;y&GPOre=@)4VOO6Mu{
zIS@){7-3x4<keDP{|>wQgMb(L<>PVt;_R+1Vw$EFyVYVlwya8lQ*W6>2A^HLYYVGp
zmv0GfU)3u1ROrf7h4lTI)!8=Syn5~&<EmKYjE;49X*F`p7_an{Cuvw}|Fp<ADg}Z<
z-Otxg9A0F@hfRL&TXd%~Z?-AcY2cU-Id1-&z=xkr262<&RCgT|w3Dg3bm!Ip)iqmh
zDXr`G)3CSBXdBk7qn;xB6YrC&kePrRq2SNBX-wBZ3^Lr_nz$py*{IP=0LxA)PxG}X
z;p|z(Z{>kN=s*uI<9^<DWlJLK3R|R`8+uP}qZZoMh+WqUQk^JoAb4)OQOQ5NabRGq
zTl3wr)<)>?N8HH1Ea$<C*`9j>K-;Zw?Y#-D!tcTb2S_sN!=0m%rN2-J=^N%9@ZELz
zrmG5voyNot_g1pI$DWb3k5?7<&P8fuffyj)%R}x@ol6n3-~1@0Q_y7}ef$9ea0l!M
zoTpb=X|t$~OuW0y=Ld}OO93nt0JXR~-jWE%j%zMv2H_cirFTWO4ztp-KfLGP_Ea#+
zr0SoQ@f09F4}Vt@I#sG9Y*A7Nj>&vX$58lw=6Ti{;zw*wc`|<ij}`>Ju`F_^f-%Lk
z@UgBrXR)Jcy%eXW()<91)y`RCnMo}}LKMCHEaJ{@fUCPEru5hbI-aw7!zEL$0%S-4
zFl%?lvCH<uic%b41uG5G-iM#G&je4^SD^XP8e^1*0_}r!W;uHQ(Kq<d@e54_ez`~U
zxqT3g2OzxN|8TvXI|<{o`!*?t@i3`*eo>{0ze7s$qN_vo=rNln)bKj9(x#Kk+<=@u
zS2`{k1!$5b{;8KaMD7W@_nLc$P1QZhd=7kDvL;xB359dx?VP|REFNm_Q_*~FER9Ad
zg%kEau!bRq3OLQ#AwZ01u{@ej6B8Hp0A_`{<;%!QGGGObdtpdjn)D8jgNFR)>X{OS
zbu!8?QnUhSTKN>4NJ8$ipx$Kb@ET;oA_0HI^^LBC-!&fN%E|ov-Rj5x&`gwUV^jmZ
znvdutoD%3eLs|NaJM#{(`v6ZWY`1Ji<>)H_dl(Hso?lj)%GsML6uCLupg{9{hEixX
zD&r{_ljNFTp+@5({r;C00PmMv@izw4;zq`>k-AcsBg1RS#9_9BT`mj0Z$~Qxr25mC
z@gAHm_$lIuvKklQ0Kiedc!@Y{Lx^Rgg)VFRT3W>}x~JxYpK#z6f9j9#U&E$1g&TZ$
z=swx1UktlyCu)49W#R9J$)k!pbm(8Ae2w=qfFW3nn<i1E>4>f)I;${IRjJ|=-$k!k
z^Go!&C^7Pe-P_r6ptC#%K7i+>jYqbU$Ljl+tfk7NYL9wsr{e{3_`rG8_N7Yec|AfI
z^_(vr6i-Ua9=|{1I4g9B6XH}G>R3sj)@>(;(>8aw9Jpc4Ze+OdFl7lCh6AXHaLMOH
zG3_2+%|$MyLXWgvM)v7PeKIlf)AoS@%Tk=-{sii-6cs}DY?o8G7&Bri-5BX3s3X-=
zB0L`4sp7)*&K0sAlgkC+nhf?F<14P={M&~yUGFkS>TBY4#dRqrF_*QD_=DzHSQlO+
zVpMK{x4O|So|`km+SaQ3J?`nGF1B;sNX^WKkA!DlPrk&9%{_a3>-bT|++fZxUEYM_
zI~P-YLdnK!M$^;_5!ZE8mS>-i2)dP%t{4TrG~=T30dh(qC!0}W_UGG->h-$RgK1ZA
zSahinD}?|tJ@~*J*ny@CT+{H6%TrMo-l?2bnD+kfJxj9|n=f~Z3e6aN7)Sxxa9^C&
zBi+UK(7(Mq&wrnDPUXFA0k<x>hcg*PjGEbRR+j3+BwyLzG`u2%&jxeZ6MS8X%eYu?
zGFQ8tQY_q_364>$`2w}eyiH)Rfv@V*>r*jbZI~$~$<;-{Hn3-%E6%ucaPxKy@0{P<
zZ{#R(x{@WB9dbXIV!a%dC-<OkI<!=MMNIo>mjpo|04gro3qUD)eQo{a4s4=MXZvj7
zYqy!xI5U%u93pq0Md>|wCv9P<yoIyVK_g`<+*7z4;EV(pSFG#tS?^3H5?~TGe$6PC
zEZ(>TbZr_&t`lw1b&1(j3hkY~oEGp~h46HwkgcenRUUVRV4u!<-Hg*$8xJk;PuSfz
zuSH}jZg{(?CHxl8zj4!tv)c9>a*sxM^1ZV^5i@&V<>J$q(A?i;-gFL>tI&bUwv0oZ
zR9I({+W;E}h&i3tEkfq=TgyJ7RuUG?2i58Mon0)aalMbH?c5sKa}PWT20s?vF2^TK
zs!L8@>$yFp6ZEzf_7uANfo=w6_#pW+3?Q8@#903euSIv)&ZE#r<rIPA)}R>7^E`RG
zHO$Q^QNps)&8hH|`tgk4%0-R6G~?v(J$05u^FV}-10uAsK6zDl=#nqfGg<ivP|b-{
z#-o)Z;xMnFA58hFkhgC2;t?f@(J0duJOCLcy*Ui}*mVQ`2q7hbC%a1L8QzhCj(X={
zrlfqdjs3W2gW_4g6K>Z;0lX73i1D^bjA!x?#K*J9RJq)Pf6}Akd!#_{m+t4Iv3~&d
z-Qajw)UbwmCa=V%<Z-}y3(!@qn`4W*N37+BT)FxEygoNm1bMfpsZ6WBor^?Fg%E<9
z9dI#LZ!6{X*J;@?L{aRIr)6xY`xm8YmuploD{mE7eTl=q>pnP~&xm2~2wX)!?8eo2
z*#lHOq9PqF0*g|dmi>)YkGU`x7Et%gd{I7KRpM%*9TS}|L^I{pksHFz7lawFZ(h0N
zwXo)LNfQq5!|3`+UF$K?>Quhc7KN*tON9+B?c%cY{!Hn7_b_Zc9l?96tX0XNl}rm`
zW~5#^p?e#W?UG>-D$>3%=a8~JZUa$8D)(NUF4T%6EW-O-(a9a+-wX76!T??30y*2)
zb7y>^ubjWqy=q1$c}Z)$C#cJ6dCrPaj54mGiZ$3pKJNhyxzMm4wXyEfI|r~$MOk+=
zKe^+3NWw_$)1a(_HNXp3pb!0Ed9$MS1NJkGhbPyGhFRFFez<R;m*q99!rVH)gS}T#
z-!V=FHWaLRA79S>E}bZyc5FoVi<WC>C=!Rc#wl~hf9gW5@j=-0)>Nh#Bh-IM{6&{S
zfMdbq_%y<Q9D5v5^G6+V3lnCy?#-CJ_U%&G(Rw}oA*Wh$J&{9%dumCePY_P9d&Tro
zXC$RMw%f^m9F7K4biof^^^v=;wzL4`K!s}VcfFjwY*!n@DpxNKXdDDDJ$&^M*0v7`
z748Sx<_k}Nc2$vN>*w5(E6yT7S6?<zMdt^;xx@USq&!ag#ld2`(YPE?CGR=AiR2%w
zDe{6n>y{isnDlPo385u3+ncf68ASdZWc2-Q2Z;#@>bN@PVOpw5>pYUc%turL!+P6-
zPJN9Yc$TA`QyXLvG!cAmgqOP3BbaXXZgJfnw{gNWVJ@pr5WaxQo8oE#G?5TKUdS=G
zz|ZuUMfIcy&O=6>BLkmzn&trc;yt$_ti=-$g^0@|Z^-RaEoQlw=KAJ>-k95c<2a)_
zW!*?m(GF{H#G$>x3<I`E-@Zxfxu=I%i1A8RZjl;b1)e=M%ywl$Dy_E7eoU~(ox3PO
zn`BPJT>lCehYOk(=S13ctkuI1{OY?X#XCfk{rDh~@~<108IySXYPXB?<F~>LFBjHB
zm)>qTEHr>*{EIVoi%i38h=vvbh%A^m%-wVA<ODhrlcRS4%F02HI;vTJgS!jqu%L%$
zY5fF1rq1{}_EG$3RfW1YmC8}<eg>Az?^un0+BxQytdF4Aa2-r<g)`>R*g{?ZQ5;7j
zmk3A%<YXnntjtUu=(|aa`dYqv?y>_SN_LMlfP0HxyE(skLJ2r}&7P0|DV9FasmSuX
zThujJUS{0T$bnh;B!XgJIU^ax=3vTYvl@#S0)Xu-=QS62^&>Np;E74)6pjoF7tm*O
z^5>K<La_6}V*Ts{a$0CSy=Brm`^z*)6lln`2BOAfrN%^^%83VG<??ZKc7KCEn%}`T
zd5aqfJY@@CG%muQ0C9XWpsM~s`MIjziYfRW9uV&Kxn+8XK{xUeFFh&LZ*vtb-Q+I;
zlG8P-h|o0EZ>6dybamaTgIkHrKp6-Z&;e<wT1t<zt%}RlY^;*I;XXPx?}M5md%QX`
z7sbHzATCwTCB+P<zERsp0Or?&&BQ?iecKh8X#BE&EoBO?AoI-XR)?@>VICmbq5H5N
zTK=>piXpP_3UxBejVhMpjKerze?iyAZen|wrWpN0iN~U;V!b1)65ZnpD2YwKEwW4d
zfdS1#f}g!yH8t%X3@OQu9W)|_t~Eb_$Lh_Pey!|5GxNx0mo6MXh3>^aH&Nk%ES}6#
zh*DQJieKyvbaasNU?=fq9Q#Hpi73JxxR%)PQpuH|wE_i^BD|7ywt}l4Tdp46NXW@(
zF9fS74%OaO^pL;Py>FSg{diWn(PI-B^Ta-G!=umGVp&?$FK%`Et*?Z|lSWMh;_(#P
z6zH%%$6BO1+~T@0=Ovs2x$eCYmUz5;7ubt;WXb8FlVSQ8q)!A#MO3xXirRgLzC3^o
z2T*koIxLY$SC(-L4!L;nZ{TUbkB3J5NnVcA>tu9h%H_X$o;-4T$1k&+J9ps9k5oA<
zpwx`|Wx%6zwJG=T>~D)vC(EQKi<a_Ns>*=a6oUV=I<j;X#o&9RqZIC>4b5+IM%@xq
zrf})}^5|Z;w7|Ax(Hwor2>iM6o~p`-tqlOZ+u?~I;BU`KGO4j_eKJH=wFI?@X${Bw
zI;1z~StfP-N`OVuqv_o<`dKCD&s}H|bIWp{CbNw;Okimz#c`C8Mq_`aWiSz4;b?Xf
zl|PuwR@2Ma6mi@1bwxgTz%|U#LZe<5d;Nm9Y_#K<Q9M!GgGRmgsVNSty$f1?br?LD
z3u%13WFvd`<pi0iXmBda?s`4zg64dbo6Pl&XPlh^p+Ib{NwL&c_@TFHmEdkWhW>$V
z>Zkmf0zhcN;;a2S(4$juZ3&}00WFFubARf|7rz{ZhDVz2zPj>5pSjNdb-jxW^oqfu
zh>o{rz3YWY+CUSazfd%0BmjS7am&NcgN`mV!ZysF4M@6FkF_(K9SYt$%xOxrxh|T&
zKyqDcyI+!_>|__H?!g@qt2-`YS8AP#i1epRgix`opIO#?3skB!Bdov89I&>oOIWeD
zqLe{dCrclHC(6T}i(sUE!DYl92Lwa?^dCMaDXbEP;MJDiN!hu`hSs|X#f?vf=b&O=
z$emZ9-Sx~(Mi~LOm4{PfI8x5IEjk_}^`a*Zi0=fB|A9G?$A{+a#Zvy%-F6KWq5+T?
za$0Gp9bK2{cYY(|Bgiq|!3f&zgN>ozCMsX+KA7jnczA<6`ZkdJD$(Kt08X?n<mD3a
zIrn5v6Y$zf@{U8yR<?UQlICBwESJSB*9RSWrk2s%?lOP?BX5qquc(|6Mg){2SO;m$
zR?!9@C&S=Usn6IiJ1<PH)v_Ju&XGXpbbK56H*3ffJDf3XsaaLk8pB~oi+pvP_AI?M
z)+nG{t8x?y^L|v#d8hs2`<ZRFA5KPK4r!=7?POk2w%w(h_Zi0R>roN-`^`%HJ@pgE
z-ir=QU^Afn7`mj7{RWU@U~`jxgxK@F(~W!Y=J4<-2UMf0)s(T(wCE2MAcs3!P~(V8
z?$BH~ED{q3k1puJLnkJfOQWam@`&qQula&SHFD}Pzqg)e;w)kv36Mjaqnbg^;}I0r
za9nC6sW!V8TEOAjO3!SUC@ig@2}j>p^~sXtAt1M>t05SoHszM#c^UlU%(cN5btAJp
z)niX8<xu&8+v%d{>da~Cje4DX?Htb<1-t#j2CnCGuJ%|F8TZ{Guv>idd*OfUZvKhv
z{R!|`wF+{j$Pr(Kqklel@7GPMTnp6kJnQyQahUyD-3$@l0wju0PR1xdIuyNepRi}E
z(~BoDA5$=&z*Uw;IUOy(js`qfVq<xG4xkV|XU0bQN4MUgjGcJO*m~@IpvUA)?FCfF
zR#g>M&pGWbc{G~)kCJ3d&wlAmr-SZx0L>}c{x^LSHlrqE3q?d4(|}j)>F8qMHirhj
zSTs)(R~Z@ztEf}18ZPPBVgDMud%ehGZb7G16k9gCtOYAAnp6<K9<R|5ZZg4m)%TjT
z*zA>@bC7V(qPyZ%;kXe{a1F6#W~6Hk|LNV;3Jn(_i^!K=W!>&BFpuSL>K_N&ixG%Q
zkc-K4cwDye?RTQdcpd_ExiLkDYIkL$(Qw+96A2|z%%Keai8^8T>k@)Ph-YF_x8&4N
zqCoWGLP>zzAh&GG%uiPQn;_SHqnArJX9><^qDxT*N-THnzo=5{h<SqunrBE2Y?t6)
zAepoWDV&U68FEA4WRnmn-&aR;%Uo+?t$f4clb!YMXzgW9!(P)P8ivYOdnIUSG#u}5
z;4JdMu}^K!@U_|rLJ~*0^q`?S6u2ws@+3(bP=^v=V|P4)p1$^|w6Ucp;p`}%tB}S(
ze>m$FRZ;o!SGLA1Q$kGW8~z;6>S=~J2V%Vtg+@!=5fEcNA@?QyL(f6rV@h~%ZRReC
zr9lJl=M+aK#)yRckDf~l9+Xfp;%47JvT&}F@0k!2cKR3@rcbBR@WJ)dlWf2B-p%VA
z<%?n}(`*yp8OzUfzfaHkvSOz6G?x2&A>(d#Y}zIla3zmh<ige7($^j&i#-scV@_Wz
z?->-BBC9g&`-zue+cTTUxQ9VItGl_=MMO2EefpYRy5Y>UV52MG-lo`Br4d)<z^S-+
zyn0+R7Bc9H#K!$8;es^sIKoOlwAQ%?3Bb<3q)!>>qWD_c2N)P%nyV>2YRk-yxFo93
zpLT^2mGR3zuq@bS$Dtev)U+wc=F3_KzPIbubgy6IehXQahU{h5DGhs$fB-3OK^K7O
zoObboo%c0ZXMf%^D8eSWB#F7mO0WJ}+95=0QM>*lpC`Mu=~?(&YzwtDKkuoJs}eY{
z=x=VxJVGVAz$@z;3W_b;Pnqsc9JSnRoeb=U8*D4QolaPrKV%`J#uM}yyvS9SdzV^%
z5M8@to&<i+bT6fl0~_3s{ho%I!CTip4B?4--Jjy3Hv&1fGLi4Lv0Pkyjak}GvKNH<
zhM-?2%Opo2!z{ZIf<ddON8mP6JO#o;4^-h_8nGJAQ93${q4lP}EZUnsuhl7jl=^RH
zG-47G;$M>^Zk_iC0(UlDk#V<(U^KtaJ<9U`SIg_u0`ZHqT*&ej?Qg#{?wX70V_bID
z#uEufgpP`exts7Qgf=<I{V@`)c8la>wOpsVqHn1Wq+}?V*u7d0U91^=ze%ayKNYCE
zVGg5#(IST(L}pT*gNzCl&A+ljQ3&Jh=kvn;OY{jsE_)8)zY2k$&e2EQ<w@X0i8T7;
z{@a~Di_BP}!2mp_zfPCB;USu^{{zSnXOdNX+d;g&oi8j(zCm2ij40>J7%5Kuy5|IF
zz@VN*Z$T&GqXg>v1fp#38u7BV`w$>uVft8q`>~2=eEMWK(jhFNBodA{mA5;27)hfb
zmS&8Ob`xXVtc>f3Nm5}jFYWr|d%`Xknp^nS4gW%ZiFHIPLz`~=mfc_MqmLKTOMnRq
zB}(|GeD~*|w-*I$cI`8aoRWQ%8~3m0{uv(ja|r}@{b8r3#__@MHiEYI@k(bPFMnFw
zMA#o`100=#UG4xzhwp$xCCJpUl9B?XNb|&WWbza!hp7fkr%NP}cc+6??pK?wfzg|S
zUZe03rB*3bNdgEdeset2f;18$uS~KeXiq6e9ST{tDW1_R_L~<`n*dq$Qwa&sJ)`QY
z%!Gmt1#}m~Cko;GiT(B~@c9W0o}b{?^zazzzuIkx8A+^9CroxHw=BRElYeVaZsO2E
zEul96cm0nH+YL*RY^M9fVOM-CfPQ5hryPg?faS$?%T4G`Pa$)m>&0E+=x5fCfc96k
z!G}Ujf|sP87+MM9zLvHye#GuEs4q;~fDP;yE-=m!tj6!x(9qF*tb@G7?EiHe|67FU
zi#xorJcD}P13=|>f1sho_}6n`V7~OE*8$p5Q}v!dPon@^BN9|_=&PLQ-0_(>6Vp#7
zjqfwBTja5cW-x|-!A12TV4U!cZ-sp=9N<UqT>$9fNEZ^$M~gX@Xan*>%=gc?YEUnp
z4czMS-860ef^AGT@!((MNPG*g33zGeL0aB{6yNt)qX9R~Q6Pr<$D3AszG>Xt=bKj4
zq6r6(qQB=j2Ej|f;3nGvuWoFX+315#n`SJ(4q@f_yIk!@z;McVG8vhwe&8LmY+FlX
zR;-<URlDHXEwaY;_UKyddkG3E^&H|{$s|&)BuXDmHmg}_BY;mG`%xa?;0R*~gytal
zeCiPRv@X-JgH#y&zY>LISYT$j35c!!-w5&V+JB$2L_Wp%jD9%)Ix@2kZB0`D*9HD5
z?f>VuU|itJl)Hy<-G5p(UO3Ods!gp9e1~>a49C9~&A)&CfBOmHc{)@6(vIf()1^P9
zKJ&UhC;}%?{Cq89|3CfRe_mba`P!oBl6~TTj8l@&w_Q68;K7hY(8pTrf4#<k-sYdb
z5o7pNguVRJ^k~>YAIbUpA`_S%Z99SfFaC2#|N992L=N==80s@+F(H3ssMnwYmtM~Y
zE**j0^gZ(b>pS%Mq)7&ZkOmRWe#}2Sr8mr9kwfn}a==VW$&>u)@&2>hCK5<uXUJqR
z{_9@$yy7wFUnai^!!`vrF-$8@iQj)7*?+(Im;LATxbmu^M&?g1(dT)71Qh@Sf`XVL
z^zZ-v|Mb(BAJ3Qeb_`RL_|v6VQJy(P!OsKI(5WN-KcVUW_3ne{p5q@~`uCJSy`KfI
z=Lk|%_B=(PxaEsz{+meWf1Ni!fZ$Z|8s<+g=l`F3|NEu?``inhs|ru48wI@df-D>T
z4?n1}Osog<wJpbNH>=`)0Nw%#vGvL7`?)HIK=Ei!JCXkAhf6g19w9BT4boO+%rkNc
za0l{Q0OmlK+hGpCCJsnVAO~_DWta#;Zs{augKrlH@hMm@We%`i)(|Ly?UB8&r|z7N
zW@P}^4dvR8njiRc#owQ0y_Wu8uaNjHFlkT%qImwewF^Z)Z|#}S^HB(LkdAjPlJIDM
z(XWK{)EW)q$!}I8MdV|bkm>Q@uD6^QtKOv36I7un(#fX+^j9e^k>W63l3G6tOS0MV
zX|*^<?@pA6yV!2Qzh$o@B=_U;o2vul)kmXN^cAZ#8*OE$BP@80pceJ-bB;_liY`1%
znjAcWZ8v+LlLjDuEr<RrTfE!ul%X8GVaEAju={3Wvk_a-FW8U$yT<*Nt$LjvG8VmZ
zlqs(&r}CE}QY*_G^l0l{T*;%zgG%nr7<%K*fKtS$i1PY8cNe?&_|`cTe?`S#m@g}7
z-PQ`#<V*fuJU~+pupPf?k1hGrx?AoR0(Lezw}YMw@YAEhRm18Lz;3cn?t5hoK+;Mo
zHwoA1@O5bE*XY((nagVtkvtaxFTPnOr2Foy-bhdhOcr77jEXq4zK>U}^!X{80TSDr
zvXFBzYUM?`*qx$N?zj2PLNd`_>LEQW>0>>VI$NlbkCT?g89=Mk7*8R2+rFjtoxEQ5
zG`8<AxxkeZo99{(mlK@`Dq`)uAne(Db?SRS(wGvBxy}M2445S3C>Tl04Vljt$a=T<
zIpVCF^~Zh`^p{)>3<f^FYG0j*tT{>;aK|ZlpdJoL(paG6w%>+F#=rGeIu5l+&-vaJ
zs(LkgN^b9hS?VaxH!A#7>L@a_k{V`Z`!auhGxR554rJUn7FT2Pn~lr%T!+i;GHfnY
zDaYEQb~FdjLaVIO?X1VPrG)nj_@vppG-66#`A?FLK?+Pl>7Z6phd)I-Zw}$-!7jK&
z65x<-CKkZi1V;7;HKAynM9?)phjU{5eeL(}6k>t^?uDhN{HD7DSZl_+HJnuWAx@BY
z4ib4Yexu%{4o_E*r$VOwMYZqg7PBmftO+#x@XiOnqqF(*)8?Iu*9*t<vN9i<W~)Ok
z?)(4&DZF<G0?yY3GRDK{prT$|r+7f^7mw=3VRN5TJmCe6sna22FX>5Oh=eZ1bjzh}
zv22X+`^O9(BJ-KI`Zi1&bu{LgEv|~EUCrkQsNgaAA;{o+srcAAK8R0gJGN~o#jp?Y
zaxKwdIBYKyVA(v8`#FWUkutT1+vy-T8jvSZD!9Q!-f46Dt?}o9$M${UahJqs1|^lz
z`12OqrsEYJc&^S;;GLDk(K*LZ=d*?w0smt;RlWJncf~f%LXL9ZH*fL1XC5s`>AqPV
zD~rGWJ0^JhMF5EarYox0!=L6n@zisU@h0av5pbBXN_@G1-C>m|@=H$`la#Mw{d&-e
zzgYSAN$2R!{aTNVd<Imuq9HP&Yn1790Y+L_xaKDPeT+vMUjoxYytg{<q@V2xX-mU4
z*>WxYGXWgPx&;%GU}kgVc#CA)?9Zt&$$Nm8K&*7`hK~TSQ<oiGvynFjW5(&9u3t0k
z;h6HS#t@rh^k*3$;~kCO=~IqWX7})ZmTNXNFqH)dY+YlF;y{%@G=O^OTs;Sbnp`)i
z+Fv^DZKWsxnJtJ}V%Z6^Em5*qxjeta|5Sd@NJBQ{O<%UQ{uxL*=#*j?IsSFF&nJdf
z{<@yBk8nagk>UwU=Si9^&cS>s$H*274U3rAGw0)nUHLbDUiay%J%;3Gpc45TZJ<`)
zIzuCUih}9gaBV?aXJC~mmGJGK><a<@Ir;oC6jk)cl=+_cIr-FjPCofT(P$E^I7>@-
zvy>#tjM{s#XeUXmP9zWafNq!u3968hGoaF+Arf}0YJjZ)ti%aLTZ90wa{~rHQa3^b
zf$LfnP)P>_)a>NL-R-(ufw}{UVT|7`38~rwg3u;yu4G!r79solP%Pcz<;Xk#9^s!q
zR`j=*y+0Qf7^C^=ayCGII=u@W_m~W<JxHCc`nX#0;F29sTOd*kcR%*UiycOAM^rVJ
z-~Rf;Vmd4Hd#U6J4JdZC5<faC%c{c$-DEt7E0BI!C1%=oDxSyK=!_?`rrhtQ_-{o@
zz8l9pZvx;%wc*N>9JBm{52Bazr4`r5U(?-M75IydN#HeP$vGnL*`k-5gs8}$bCsV`
z!OyvBzh#2RpK?{NU|_o<lLQ9OoYda#Zq1E^Co?+(7&Rt`SA!W~ApuHYl)`>IZ^wZ|
zQu0Yat2|d?w+h`@LS?8sAZA%1%?{|_%#<3(+JXTUPKO=7nSSK;<rU~=jVpxq@rzOt
z`^N!Tr8r=8!1s<+v|3Fa`6jc8AI?{i20z;6g(-7X+*}6g7~h1jDz@Ddn7?~q+)Hv6
z6eXT}c<YLcp@Jxd))u`kwYuw#SIv4-diAU?iO-HuI|ZCOJM#@BFAKFdX_97a?=WMT
zMcJtDM>5G+He<@SuTL;1>KsC0bmNwI&|$E!d@3fj5QfOWQsfPE(TIN?P^=Y5fowaa
zYCd=Lzo+_M#9yEDR`_w??9oGP|9B6p-eit-u;>)@_;95Ibd)gz&{QBG6(zJYp3ACR
zb8j@1nyY1QVSkkls&TvG6Hljkx6zjp6M{o43GCq&t4ZlV*X3y0BAlXZW7YfET6X-a
zMwj1?>dhXZRjP^HD$?3v)RM4B>&!8(m!17XZ4ZHZyR};{2>5MMX@4&cIrK|o0kUV`
zG-W8a3`p)*yFzRH`ULM#@G~(fr5OZ1U=kr`_=aH7_9hzG_AC4Arj}~e2eX;aNsC4j
z<gWL{*rin!+^+X0@qTUkit4om&`Y+LGqde4_tpBN$+$Ou$4Fev1Cn)ck|+ZS_q9Hb
z2XmrEL+P3Ov(a>vadb+t@_CXwi9<+yUxMn&*4L`oZ8RbY_@x0i?HqR=I>3En{d0jW
zjUV)Ao`GZ)m-8`v8n<Tz10mw6DopoB`CqEVeg+eOQQ&Be8qzbnfT}ofS1Esh$Fi1M
zu7nt9aW8IjXa!6bgD>|tDqGz657sN)z3(_>%J3C`e9|Ti71kVo<+h#6d&wi40giv@
zbeJt)>Zw_XNad`S>vHRdb0>=KNv_4)S<R)6J-C$QS+XlK7tmX%FrfzPbHm@PuXwaY
zo{1%mO`lT!Z2}TVYeuVCqnJwzw1LIZDu~~l(5nE(%_YVpi<Tb4j+OWv*2}~O4Ybf#
zYK~3S=3-5>ATH|Co#&3@$Z!R!-X)p0DP~g^%EO2!(R;x5A>*7MZMYavx*&6Rz1Y`(
z`jH;Y@02*pb=&zaa@uB~<l8K;<L_MY$B)$=G=Fdz`=(fD{;{c8^SDYb(;5O=Hcf~N
zjKn94@~Ago6sWgef<;_k(cd}K0F^?)*U}GGrQTix4&Q5t7ITeesHK3b0c5;WvE_>Z
z;JcVuwOqL8#Zm0S^H}W)4Hyk18%VNIb)NvKv!dupW78zmy2Jpgb}EQxhlSheFmvOn
zB)c;(QkE*-25_2@7Zq8<9XJ5gh#uA3)N5Ja|337g!4a>}^fG9C^j%Wvv#Y{Cn%e35
zs)oL66JRjilL0DSC5?QxVaRQ+mb3wL?gFka=hF~slc&c{`^$xA&j{$qrv-Z_|0>g^
zS`0kG{44mI0gZ}Zt}@h%Isz+S$?YxzB+!-y)*ME&z{W(s&qHyB6#`zrQ+g;?X^f=3
zTr`Yxxjld9G5lC{xZ+Z=`w+|JK$TIkK|Ot%>NJB$t=`~OMeKHX?{d2_-Kfj~KQKw9
zQgg`oc--df@Uz$n63sXI+xm%Ty6WQ<2qVK9<m-gF);ak7V6s>x&RyqbSe@&a9lNIC
z6cI2&euNE2mi)6}TR<9NaDzjJqmVByhFayI*P^dccd&j;Ta#`;Rzk3)4}v)pvH_UY
znj8+Qbv}D;9Iu=P=nW1(4B4H#sJA~<#zG=7c_3sh2WK+s!bD$hDuOS#x8vQe2!Gg>
z<bNBEj@$Z<uh_Z^;yZhHtli@(|KY)S)kiSX2xg2RbL;VBi)pUHhMIuaHMP`{GPgvH
zxnfBnm66(L2S<6M++~0%%e$2q@N9`$utkcacLKEu^W<M~#NIIAyFilymI39m@hs)q
zjYamadi#LflS7@0-JpJI&wG|gB7Pj<F}*kaz_Cc77%^8OrQ4LN+p@qlYYJ~{Avwfh
zp@XVCCSUq&1|o=eeZ+suKh<L=4{!jiCwm;;%N~7g%8Mv2U)dhwvS^sLz7PmknPVx8
z<9V?el?GUDd?mR0{=FT@Bkf9+8CoG0`&{8j%Q*d4={P<NOIy`jdTjn2JM>N7BWud#
z;g$F)D|Izxc2M77&!rlGEseAPje8)CPHlVyKBst8{<S4tpR0fvVM_gR^Zq(RkHuV-
z0&jmhE%RRg5Trka&B~~C2Ontn4HK_UWlh5@YhPk#Ze1iQ^6=(7TraGqN;!3kw@*cy
z24u9hhO`uIY9uQX@IDan=5^deR3_+x+1b;V-?2%yOlG&<4psDYxi{HeX;W!3fQPeh
zke(DF8Ss+Pq@0r_+I{8Vlh#Np(gUhkYN^>OgUR|Shpv8ynve@GU(twh*r@~CV<+uL
z_eK{&>XNdchETBBDEJN)KkvOKUHzEg77eJ!0d(8uc9<oZRJNxO^mdRFRUg0VlE@<v
zXmII1=<8T({oqL!UvoUp)mP-nHqvx~cZ0`6yD^v&W2)o{$Or7<6_toMp95Yx5+Eyl
zgQRdKFFBIO@Ls75BnQpCA|a;7jvEWo1xSfKul{GN5!G$8f-}O^dGOjOQM9|~c2lp?
z-xZUe+`wVsG9vERn?IG5ghF0mW7Uj%Xr8RKv~@%ZM~zR@jBI=({jBF`d{y)A%%pn&
zHewLQrO+n3NwM~{b?QvNM|xyJ$7r-)X|I%_IUjJXQ9Nt!zx>+KF&9geUwo{+sFPbd
z?>IVbo;ln%S*{Z9L#v&#GZN4Lq%OuUlX76kQ}7Nh-e<1$x`s@Sbw==--;8bKT8tkJ
z9#i`8@s3J1`xWa$ucYeC-St`d%c(-^mHTtSV#@6)4QNc)wEjDnIs9Z+x6E-eVNJIj
zU5g_59c^%z23jik;n9fjY8nEUh7ciXH4Px*D`>;ME5016_;`0aI1v_Is-~kQjEf4H
zud{ABqsn_cPoOdVQiHt;H1>>=3t`)*xi1__z)2=|j-_v)MqXFn$!(T2dXDUKB0+D$
z393p^9P5&ByulH78*s-tdwJ|+9z0g)iB@hp88VThO8|y7;TZ?{ak0DY>)sx((I>^$
z5=FXe2F#Di-8l~5(9E=5tvJs$IpoXm+(`i~x7(Rbs71>bfb7)z)1dtT5qib(<Fnzw
zhnUm-A#%{n9fDs~dnccwSTf&b6mDoXfAS}sVVx?Y&p`iV4%=|;F`43S&`N}8xIQNZ
zKMSY^3K^em&PWo{g@>H(vddMdkYEHBIXz6NsshA@joUkN`?(5RUoTAm-T9=;i}<{&
z4De08Gv#3@Bec-WSOR&bR+Z#s?3snb5q*89DuI445}CBl!RDp)n=<7(T&JGvlOb#}
zrTy&f?QQY!ZInwz^w<3@9SuALdmd2f0MqHH=<ao&7!P;=Ci+=tt=3FGD2Xe)O}U}?
zHLboLc`6VTHVXjDhTZjuY3~Ov4I!>=GKf^V2+*N!7lxE{3)n{hgp=Hd^pqpH>O55D
zN`C5a*CV?OXPH`K3|YcEp%zC>DuK5%pI;p?1~FZ_>pVNue2mqBh0gHsh2-l?E=?S2
zQ&{rNmPEI`M=N=5Xj|+Y&#}>xC_i@j+T0!xxaCrIv70xXDl?upT%QGfB=FE2HNS~R
zZTkY1Ei3HNIm=*Uh7dVtv%aZSWXBw@+HhDyNWnARLYRo@2Q`T6ao&rm8E7ZRvgs55
z>fBM<xm}5Ae6~qIMY&Bo%s(D`iwqjhr!^U06!*P#l*^&m*5hiEYuV_+_kJ8nd8N$Y
z?RoEaRJ!HOW5_>e1C%KK5_6&d81zHOo%Q{4OGs0VOIf2Z4=Zy;0y@H_VcT5!2KC`n
zMk}*-bK&*Vb^X5E7gBP6aw>U5VFMMxSlOC;Dly?p5JW86QC{qRJK@VLR&D`WT-0S1
zW_0P3CtoMN-4O59(%FJrMo+c-=7noIVCI#ow#2-Z%6a9!$vqr)VC8c$)fN$R%M-TY
z!F-l>Q)Rnhs`73?8sUAv>$-RIXA14vtHa0E48<5hwtj9q?8NbN$78R2d`9PzVFPB%
zpR7!JvR4&XBAWTAyd(Yfv~r26J%*JLX<EeJ8!(5RM~*vYT&}$=UCkd4>NV0Z63r$N
zj!%SkQ-TP08W!pGKoDk!Pud>Eelz;eHExk~2O$4M4$tXBUMA~a=Hp$b9Jx+6|Fo~Z
zCsQ;Iv_EyjMp{fj2R&eDQ`>zcQ=j4C-Nm8djll$oaL{~#7+Piw|7iNSQA@r|v2tn1
z!fZ*V4hBZwYW*N<@5N?{H)5EB`zR1CS(A>}VZfB!OO%NvM%?go8M}NF2)oC<ylqEN
zc}L4j+>Sz4Mv}%I`Yw?+Ocy7gzTMW~HqVu1<9Z5VB+c1`gRi{gPNyGZUYhtJ6OGY+
zlRTcotJYk*xQp{&rKXBy7W;5=uKSK%x5`}Qh<ioz<}_CcY({=IdBnV=^!k3NvD$@<
zwSC)kOO`al<@02NeaBgOv6!hR*AAXc{JvU_XJpR>ObU*6(k3^B0G^Y%r_~o7MiamJ
z$3hy;HTCKqKgWetQ$dz)k~#*iDG!UW@cgIu8}-5K_k&dFHohxg>neG!_U|z-9(DUW
zX%V7cAVht#e)$F-&ZsMq{L{<-{Mw0q;St6@bY0oi15@qKpAGLPXB5PFfZDz6i^^FC
zk4>Zncez)>f7tmlXgZ5<s2$F&-0O(sJ<7SdPA$K=psazXxgejm+_x*b$cFd_A?=j~
zym3g}aNMUE$7^c`K{dtNapd~_hMNz5XJo-FlDDdc_f`g=E8yHr@rAJEh%TX)QnfDm
zd=+oV#`(VA5A_<<?C=_0yFt3faX)eZ{uQ_C_Ci^SesbOT!Bl<BdTmLAM}u+WfSYGw
z3`V~^gQs^4b_LCfUAbjsfcv+|UvLN=-&d+J^Eph&o&>kB5OpU`hvwIt%&0j}mc63}
zs5^uj>U9K`7t4)A#rj1#axjN32pB}vO8J(#!s-|#CQ_iqwE9^KFBoqIl(LRs2}kR7
zT>4`hzYv193AcQkI3YFY4ec)FVwkA&w*BH)WT<tHKHo{H{NMK#iVs+D*IcRf7v=2$
z9S;oe3(nMS>x7A-VLFVDtce1oZqeZ8lm(@nc^*csTV&O?dCLxozz>dNyNzOaL_Fo?
z>a+W|mTRq-2X49S&_}$uJ!XnvkzfSe?E*0qiPW!KSYpIs9uD_2!BK2eN$IyvRw>-E
z9Oi8jpLB@=!4@f-B=JmSaqZYpF5{<%R|-?hVYy83F0UfpryO{*WggsC8_2BNZ_s?|
z6_j-?0xN$WGt&2F^uMe>xSv^b&Vude_1v#64+x67KZNtZwB1KNPi#3&s`|9w%6505
zT!IKwzZ?I?n}KHfg6Og)v~_Uwx*c;EPv4tp>a?5Z;X7wZ{bH<vAz58=8HJ4dX`e|u
z%i&<Ic-)t&iitRZ#I#4>o@T$}i@nL%TL;sCU;^H^n6J7cJULB;!sJ|wDkClYXQ<_o
zr%?}nS;*xfMCQM)`^4e-*z%p$Eh1_UIxBC=lvFm7k4!2az24dKH9>*Uw5bnJ!0}7?
zSUg(|d0^1v9B6l&_=Q@+qT4J~SwCL$u<7Dk@kM_)hYyvp8<mR$$|fW2JXvA^7Rm%j
zI47B%>zM;YW|lo<8YvWKt}Nke_^+)SwRm|W@K|&5Q9`#G%_H$zj!?^9Poi|!Wxu+z
zj>ELkBS`6DcD#(I-S%i%6X-;mo<U|;j5GMn=U@QJO=hssiABJSzNNqjwO=^IS-KQV
z+P`AT*|=&m+Vxt~_O7_no_fq=lcUX#RKC(7+qcN3pi+{HalcO`D3{0&oDiywiTBX0
zbX`6+TA$(XNgbC>kW^!C?yw%=t`kmtIE;t)wyxPjcDZeI?#5v@8g^2CSE#Wi!fG<Y
zO9CB#sN-ys98(Ip!&EkS%XsTTkgwSoTKi)z_3N!7%@HF7GWbA4Jkdg9nKrLv(dpov
z2wZ^Pi9v!!$Zu0+u7sJB-N+rw@PK0g;xBx;66>+KGJEc6I(7myd2}ix*c?9+P6&)V
zgxyNDyJh@rU2J<SQfU^ETIabr#FPQEZG`+Cg<@|9sS4L#bwbUnX1Mj8JnANddSDPk
zVGw(Nh53Mn(j8p+#S7*?zs4A$++X|^gWzEQjzRpI1;4V+WI~0@<>GHm7p+UNSG}Nx
z)R>J1kt$`4g-9z76*SZkx&swx>XA>5sTB-4h;$xc6fWWP$FbRq4D!msmsAET$2_e$
zC)Z*z1afk5R4QLm;-w@ff;3dS@K`T}X+;`Z<p^5uSxb&Hd8bRCq}85yEt1N7tG+3S
z&`MZxpUJ`NYDWh=2)t32n6EWiQAK>zLg-y`-qRY)%*8;#g_8&b!G+rislmpg?TrR%
zNMza}?LGz=wCgCx(+>8~tFG_Ow3Tx5u3{@=I~^>PuKgTinrjaVuGnAKVBY#roQRxr
zs+7RJ<6KHP+aZ4LIse_>rFMdorec;3gGlxBF0*sV*(eIA&>w>ux48MkICcLV$!-YH
z?gQs&*B{E$LL^}YF0IqdjsG^7L0_(|cemIW8jCeJIhI|FK}UV^W+rQ(LfS-VGx9#a
zcDLC-jr4P@X(ER=;qa;f^~NG660F`41(ghqS~9JMvNxLLQsD1zjTqSN0xuZct)2SH
z;vG>}zpE4F1REq!N+$1;NA49*rq%Cx1ms!*7P31{+Ez-+O{0f()${Nx6~IBRO4iXN
zNj|v?|NSTJrgO}#*!G9G<EL0J{NGJP{EnK~MegzRI=O2LwssEh+juQ_c{J+GlTqVM
z4@W(7upy9~_=v94{Vgo2g5eusTC%5eyK*j2yK0;RlM<oE`3jcY3=#GqCz{Z-iXe<C
z)#rIhdF3LHxyw+#*Jc*JcMgnl7i>$9+Z#csV;5$S57Sx-V$ua}`gJ90tZ*uMQ_`em
zprcj{5Zcs2@du=Zim!;7<FV|9{drRJsi}b<sKXn!-sjTVRHdnqdsp<q6QycUnHf~H
z)ahu2UI!gv*?#^qwOcl?1Zh@{+agLbRwLpDf6=A&V%ZU<hNih8RK9v!{(l&I3#h8r
zZhicSC?HBIU6LXtAl(SkA>EBM2uQ<5y1N7krMo)?>6Grh-85`q)3w>~Uz~Hkd%yEt
zfB$>OU@-Pr1J+*ao$=23%xBJ5ApZ*XlYNZOr_2xU!%Pio`k9NnpUxn{&y|HtjF~w>
z!5tJ%V|Esv0M2MpCSZcC^ok9u%7vBw95eQFiffLx9YTP{1f0v;ka8H2zdX+=a~dpX
z{j8}&94$qdm4q$8)aLWvK^O!}_ztD-)D8Q#AQf$VatizND`fDgLlD5NX{>>}k!O?)
zV)-#8KY-M@Wq}Cz7*G#rC8=x;SEWh(XFTg1Vy`ccOXy}A26v`m>12*sU9_~Tt>P55
z`VFJlRzp#3SJ52fwdfxTo6p<|EubyVgoW$1F~M3)y=^~unUNsX5$pFnJ2OmYTg8Jo
z_A(ciVa5aN?QeSdO-Z}^K7UQFM$e*?dw;oBQ;}YUAML@y;3ZicdOzewRZrU$sjdw_
zfAqa=)~VI}m1#!;U(4;AsmGc*3)7xmy;D3E0yA~bt=Uv}sGENIcUf~xP-wTkZ-bd>
z^*H43+qt{a){(dAwGsp(Q8!<VsXt>)S+%ykn7(>4io73$GG?$W&{+P&fg=Av#@J!>
zaB*Rb6h1cz=T{s&ezk?{1yOz{dXjt@W$v&9H^}5z_L!M7m73}Ufj(auqfD^ysB4-Q
z<5jysKt7PD^QPUlf=|Aai?D$t&BR%a+1X-sVfqp`oYm`Y@EPa5!|W(7Tn2Cz=Y({z
zT(|qrAx!g6TuY==T%MzRm#E1GZOMae>ycADxI7b%9iX_WbD<WjdeI9uu6?3cwyn;4
zo`~EAiubn>72N$c)^tRT@zy3X40Z9rv&Pp`ZL{d)wlQpnqwLm8a-)Oj?)gGM>$ZwU
zRK?+NZyo=3&}@cGNMrQFv;DPJChATJ%s_>CWI2!XumkDXMc4k9%3llX18Dl%tz{sd
z%CcAl#+wvYM0XXyN@Lb&VISRBMVA}&ij?``0Bbv=!Kg)!@)#dJ3OwIkW<yRp-0y`7
zYm{u9?jZ9UubX^AylYoDg;-g13Gl_>(@ZpFmriY-uKTVEwr_5ml@EEa-~n3^1DC^Z
zve>feX%J=drh`D~F(RFkgW!jwNW|oZpjX8Cmzy_PuJldW<!;N4Uv%ug)_R@~(zhhx
zc!ZOflFe0UByQalnqmlMg6xiB{yUBZJKopoK3+N=5&@rMPYN%^13~N`7^n=Qejh$)
zM9Taoh^38H#Q3$E>DU`%_x36Jn->#hv#+GmAC)*@FT)7}{htMXdb?&dCx-4V?bFIm
zfRyL0H^BU1Ds`4ToXRQiu9Y&fZOEQ_#k$T60o(b3ot_mdPl<kvP01?9DCVD05O%e(
z=uE~W2qK8ujS)A9dno+qi}?hl&jke%cQlvOUchTKB)W$+bp7hon_5CGG%r~y#%o+A
zdvX<9T88c{Y-9MSCUn!BY<~%NkR-n<Fg&lg#L$qAcBdvGzkg#yWaq;o9s>&Xp@$NN
z5@BYwH>NS{z8!qRYVMYR<x*>7SidyD7PHhK!U-JH1MK7Nmb#bKJ@+@#Ep_z}5C`yv
zjmzWn;Ct45CZ@OpW7PGAS5-3>{r#Ki>+hM=UNB+T+YraMvZ!@Qt&dxWnYC0b+M&W4
z$P+C|C{^t&e3#B(LvY{5sj5Hb3ZV)rn;WFNljI`8;)MNKW12=Ly8b6Mb9NEJ*%*N~
z)6E9<4r+_$Ec0Gj9-bc!g=9LPvS!|dzP642MP@Z`olwxG&|T*MVKOeO`9X8uEMe1+
zjdc5YfDz5x@O}iAyKU!^k&S96C%{%wh!Zw1_$m%+TsQ2kK^M=x-$&^iS2fmZ;#$Y0
z&&=?+<ZJIdWn|~c_Be9*d0UjmL(Mf+0nYbrY)l%U@^h-AkZE;vmtVUuoO8%cTjpbr
z<oR>M#qd{|G5Vg5r?-D)`3z&IWx~1bk~R~m&{+#bwWKs|hlR*Y!X0T4pN-mrs4C=Q
zj1}j|t*d*U42sw8eem_%?<tD59Ak2=_E;74PKSdpp*Rm+)5fpG9&~+v&FMWw%fJ^Z
za8*QC=)5_)9ymXXj$&ui`wODVvTCOrh8RP#m>*+{G|}@e`DmI7@paPfl+{4m`nsd)
zPwVfk#E{HPo<0uwh3oSoy=83$GXrrvu`Y{qx{t!}vOEXNn%Qqa{e$J0@nCj#mDZE@
zy*n?X7tcYvKh!mn?R6Vk^&@(pXJ-{Ba~U?=EGD2$`@$u%+=qTK-~>PGbv=KL*~BCE
z{k$~oz^SI0L0@-WcC%Rm+PZ%5s6T!p+JM!-@1UE|z_}cEEeiH^2p^k2TS!puZIllH
z&j-4hr14<qCa9h9GNjkQE5KC+DU!@%Z`MdJL8~Cj1I6U;ms^JVURaaVAJI#t9`8mQ
z?d^K;ptP=>B~(eQ_^>XnK1_s$ot<xo1=0K1+8Og}aW&ONJI{gWsa|bqae}LAR6o(W
z<FQlJdOWw$I&WZj@{mz6w>|8bhWz|2LJNGp%m0~OnBJ$W`PP-LKL~Rcaw0Y+5}C^H
zM!6!Ne^66xAK?yLQh7td)u>%yA_B+#nPY>9y$P`}%MvpsGdBHkRhL_yruRNQ!<E+0
zIu|xQ#Km|j#n(DkpBv5gy~DYoa}<uY`u5aOp?8<ZvXr3OWXW7(?y#KJ1d@U{+u16m
zQk-xq|JN*lPe=1UFK5n)a#vlz&+c7o)Es86HaK*=fnFRuUp~nd64<xd(Z23UF%%GU
zg)~57aG*MM*@{ec)zOYyIa>^xn#EgbiOst-<`}oW1uRemGTQI8ZT+0m6esq2ceg0#
zbMLKw3`G$s;SWSikjdiIeeBQa9A+mHv$=&I&X*D_vThtim~a*(wLMwOdr1sJHdT^U
zJJ@>`D-;&OwtU5WzetxuO7Yn3LpPf?M?`Spl=(i5bU=804-Z}O6AJWKDN(|2!fR=&
z47^W&{NP>fBcL=LCb)?-5_4ZKuvyznb>_nIwxnD-XWXQTFn$Vi{r=N}tdk@ei%qXF
zHX#vdj6WmeVB;R)JnU}7*UPN5_l){8Z<Vca&sm;k0ZbK%I({bgyh7Tv+2l0L<RKcY
z@#3>Zpe6s$V{BxR4cvINuSS}ZdJp@TbW0tckfifj$SC)Ysb13HK3!GYCLG+R8K&O{
zGpZo!i?(5Vf+;q$zCOesLUXu1<JNeL`{Baqv}y|PVHzscfsd@u=a7<b-S#6%TTif(
zgQ5xtD)c|*zPj}X1!6jTP8luYY1Gi4COsIN)F|)DAd~Yky60S3{m3r;JfI1qudT=?
z3mW}lKXb;dFs8qtOk&aQHAr3rB5ciOV~ts-Kp`fXN8b*aA<*i&+W-8mO>cZxm{Nwy
zmN}$ZQMhi>?K@GQita5~>7`BjWxD0zi4?7gbE|^3b$gF#(fmMvUqYb`q+RnW%vE8A
zNm!eO^F}}k?kQO;w#cDlz#a1eIaps0oM%j!LNt|F=REdY5po*Nl9SY#Yh15ee^bap
z_yq|TqHr$NqOm=iB0id4a5#aY!CT~B>Vb;Fb{0r%cF%kqr#B4;YPaD#?l{(1<Ugm+
zFD)^R+jjL+FLovH{_tsas;dXbOj1=7Pjp1U>ufh;8tdl<5Psm$5*#)SLNzK|2v3}5
zOFhe4ad=8o^(iYhJnDE|lT=^hwiEgj5<>nC4;9*$C_3Z{=I^7y2@cx+Mnlg(fCyXY
zK-x#hdmcVvh@PG7h-qdkl6m^!tPvgYW{NAm4^N(ExPB!Z35*RD5Z9=XewN(5xU~Fq
zoUCE5FUx$1vw|N1#?UxS?qtI0y|9g~j<r%E_`nhK%g?>htz%sAafP%n<KEV~31;A4
zRqnvB1Kte3xyM=3fWwy;3*iT!aofnpzwpFp%?X4d+;<TrZo5`Bp{E|9%rwgm{^10B
zNw42x!?$Z&eBf_&qm@fo+!+Y6A0G;*>^c50wMLP(8hc6AZ#t4fny7q}8>9vAj@IgZ
zA4VjQqbK7SMuNT2Dx1Q}7$Y>n&DitPk>*rEBJ?hAuWE<SySy5ErR%LNu28spGUqcY
z5kd7V{d6B~^d&JU;a8@IeYoxXQI6sug=XvPOP0$km;(QGG1E{<819HqO$}_XE}HU0
zC*ot<!nRa1*c-C|1)sgWvg}a!%u=^+;leM#H=^nY8+zz#(NPg$+)-c>xg>)TX?zHV
zlSB4Zp}k+m!KT+c_5~5E`68D+QBMgfMCWXvgiIKMH(CO1CW^V<0qB7Vd#Rf>X$eR{
z(IzB)efu#OWj2=;o*VVybZ-Kv2O(sBy1^w*Y!dtS8LG}YB(Aw}#~d^cqe)kM_UA7H
ztV(A|M)PR?bRD4?e>~`_s##6_pWq;HWjpW>VOe5}>$&$5eg`mzwpHdsAM+k3C&NX7
zCuy_}4NT8RX6!_UG|ZRbV|y*+axKz@z}_#NI+2(DdJp>xRKmeBp-%w&=jKJ2Q+ju{
zJC({(KC`a<yLF&^3t0n>sQ;LpaE|XhPZ`uo{iI@@UF(h2)Gzv`YH>aY_N3PP>J++9
zhdR7<5$(pS^d5&v4IgnP_DTZn$J1w<v655DDoWMn<%SonN^e$d%#%ElvHYiBYMGrn
z<IqQvApC^`^HTQK=YAYkiJ<3PFY^nnrPN}<z!rfwFKm+)CBGu8rj;s5xY=E(a4Dg?
zC(rf7edn7`8T>A=sJUxw5hFb63BAUR^H$v|l#ABf%p9)jGx1$bsXGCPJ|^MWkSe{8
z&UJznj?jgEvOd@SYr1M9s1$#{(lv>insq^#*9&GV`{lEQ_KkY@+^Uw_8$q~~hVBWj
z4ApLfch!K~+8kkqxxF1s<?u`@*TI=Ar}Qf+raC=bdQn0jA-13NqAyd(x@o18A%*Eo
zhy2Mx^7v7;hdVqfSaJ+RLvG^;BACV*BY3euVCu-MLyXhMyR?YFB8JJ!S}rt}PqiNM
zJ8L=Y!Ej85OM&b#`b$PiL2DjM<ic25!~0f-te2SfA5shr-rhJvmg$>qY%o6}Ga1YK
zGc%-7s1_f+&sgA*&bi|87!_`_;q=++Y{~O(;<);X^aCr&d+`VTYX6F2ym&;U;s7rF
zW;WpDNp~+0%6FSwz2lG$K~57qPj!C}W8kfXMY@AfjJ4_zDlD9oqxv8ZZMzX1IW24=
zZzq+gFj!m6gJ<ZArX;yR?XH>;lLYq_t~!_^J`W}PSi9y0;E5&k(fOZ*tJys-<?FQ3
z7IJ9U<7hM_^x?%dKX?=fSDQgC(RZsG5Z)y?FI4!_F!-LX8DYH0R_y>0mfEsYtbR}+
zwlJPf7&f%QvbZ+CX~6mJROR$O!o~G03e7gsXe97dEn#s~gsX`~g@PVLdq%I=XqSs9
z8KF+z{5HTjf!sK?sxd!JJLP}LtZ$&RVd9)-gE(Z!8cIJW*sio!651`LHi5J_sGURK
z?|^n)!rWP<NO(S9*I$37kCy+O?bep9g-FHuSehDIRl}(J(=NL=fV)C!${KH-wT;#i
zH{BgT3#ldf?aw2$AV4JaE3;#-z|ibWfO6}|xRp~`LAgJUrbQJ@m8suy-Y;6mk4~mx
zLG-gA!8uK+X(aP?AiC@A_T0BJJ(c2I=gd7m&y&Km$9z*5)qSyH1n40x;Phc1!7w62
zX8nBTl`%dmT;L!w-+IrC)*_JMryoLXQnv|A_tct;TWjr{Rg{r12j6~a^Lr#%$#ZbK
zWqHI%hqTXNci0()=?ZX)?8oo}hQt>QQ<8)W?@%uHK%elhdt2&5$sKJmyXG1ghKwn(
z@XZ{G)D>8<CM*2W167YwH}x^Tk7XZ9F$t?uA6_yr72bH29Sfi_kBQN7z~|i(@mG8_
zKVZ2FhHcGCbKoM`k|FeXmtWLdSA*TNyj*X>JZ}$P^SH_U2^pf`d==&WgZAz7KYi96
zruc6^(hyWClvh9zV<Z&NN^zBh#U1Igv{};Ee)TvithX1O+Vv($rnnRE?lbJVIJu!r
z0#ejVqsWhuT(Y{g>nZI#kM}O4s&^VJ2OhB;olx)~K$OhcK2NWVpd22)HyjCp;FbHQ
zBRmFdT*dk{O-}0{qvz#je;hq$Rt^TDnx`T*C7?~{{S&5&kywY0<rV(Ne)e{BW^Efg
zOk^;((8>=3eMjJ>p7O?VSO0LOz2>)alVlA+y7^^}!vq<h8{_J$yaSK(L+E5hR0-Yy
z9pw^XEa#rs0tl{Ym2CwF%xCSqxQZSoMKR05Aj;uA!Cjkvn<_>f%D4QO1irM+n=Iop
zy-Ya4TcGjyq(K!}FivNR{`(41Fo93^OPu<i002q{--J4$K`m#;&K58Goc9*@$Q1Pg
zyp7eb23P~qspqJB6Q80l5@aAz@n3vxv-RvSh>`2`zszt#D`Qiv>>-3oIG?#}nc?+t
zYJ_!imaK;}w4F3JH`q^CA(<binZ?Ud*@|T8*4a|ezJ%F9(|uUPLUrFL{NY!V#RMe^
zlH=5KSN5x9A;3;a=2;r^Y|WA;+?+R|5g>0FMQ_OBq|dZ79}S$>rCB>P&<y4LYRHh1
z)bSMsij+-UD!3&Q_#z7O;@hX9o_-U8C3g;{Nw2l@`#?ST>ltuRm=^LYedI90sK^$4
zouiunfx>Iuk800yBCNZo9yR*HptDfszOJdvQsBJlthC4Hi@3QjywLi%OdjqC=~>6d
zJ2Q_Look1Dz8J5^7Mhb)c>AI(=RuR(;#iNR)t6N;Y_@&YqwmQE*&=^IL))H(_|K|*
zA#P3&iAB%8(eV|pm_?6XPKw7}Lth%)L{uOWOVWJ-Cz!d$3q5e3vGN~w4d4~@DMyOZ
zO)TPr#I@nL`z<m~XDx4LN3mt9FvGWw?HudR=N$&aLIV(P$*ms8fg_U}69t>5DqBnb
z{PsXuCayOa`pCi%UKPy->>_k;f|Y)1&n54S3_hVBuFVqi7-`P}FK%EJc~5VvE608v
zVO<KWwS=>STqtt~TU3)48)pVlZn*~Wd{y+RQM>B%oE>i5V;qV>DOH*WV(C->*6+Ph
zrd;xJgtrdw+2AGv&RH@;sOTI>!(Ee5R2Zs9eZ@7QC~;c@X9Fe7%ag~$cuL&+o}6*^
zCvq*!fc77Zi0GsVD*lPd;85Os6u7$DSM!&}{s+!Kaqk|@qqpjjl#7usa43YYJTCRa
z5WjAmeTQPP-(87*_QiS7H3%HokV&BTV?w1UB3ur`9QiR74+{>ilghG-V8)3J#qKo@
z&kHCh%nRyJlY2}Wf<0<Js7DK&+VVA7aFqENY*>ulLyglLrZsbu!H21@5sw=kqqUb5
z#9Fg<cs}T~9H^QMYo$i(Zpg4>>4V>IBA<mB7770xF|3@binNW+5u)(AFkn=s%EIz=
z+ZPAOx#=>F;5^YEKCf$FB(Hsr4~b^8stBT-?c{XDCLUekvg+yJv_f?%gE}u_^)<BH
zSl_i4T5pP&EnhjDZi}IIRn7F-Q+C9Zx?awDU)Je}BXYU6<X9OQ$rl@3utIET82pbU
z5S0{aYFFD9hRw{MsIk#M%NEmRMGy)Y<}3Kl4sg>w=mPQ$)n8O(3VQIFQISj=k*zko
zu?mJvlC7tvONGLtYoET_5wlcK3986awH_{x9CgV#>|CvY<{M`5Rj6(U5b1uu+OQPd
zYs<C^&V2Ip7YUrydxpG~6j=Q#k>2$|?x3Jb&HI%P6b26cgbPLI_Srz@XPC$M(R1E=
z&I{m0y_fp$z*rL?z*Y}hZu}nwI<_}ZfDa>yMW|Vqx_T&w5R}Z5plcXpQ)ZdxR;`5j
zF**A<2KG*ql(t5zj<!}{jimbAc?}hrOm12z2LMO6n$62zW|1&?keAO>OOB?9++0j@
z1<PakRr(md;cLaW-mQ)zIghu|vj|)X#b@&ppcLs?9&7dIZBb%KxwF-aq%pSL@ep`i
zwYlu}8}7{y{*s8Mt&~i|&%_LArf+RSk-3io+r|RFnksnNz8}Q3gOLkJMZksZH;KpG
zU!k)(fWb&<AACm|a_kAV*kD}nRom^Hi>O{j%g*4@#C~Q%vQ=9j^`7tL^xM><D|zw<
zCB;ic^t0dRFX!>aTakSf7Tfqjx3;)NEI9H{P>d0tF)rSIJFYN+CG8&LlLLbta)AgU
zrnZJ9J$-v1dxm9nq*M<YXla`_WYGY84XVhg0{L{nM(H!#d;rwxXxUAKS1dnLQB*W$
zxt_PjK|Eb3?1|&<CdL`mXwQ2GR$~UaxzBK4@D?`H^bVN9w;uQq7kzP-Oi_N+!T_j&
z?pXxQhBw^*0py{ejL;j4jyH3&9Sw5>r*~WFLj>^}i*ut7qKWYJ?FTFN^gjUtDt4eA
zr}$VZU;MXdYB0vH`&oaZsf(0@woER;N{xHb87<~>g_~>Lhxq)1&z=p*Ae*`JEaSRH
z8QEH|^KGx+*MQF-S?|VZLIY8G*(cCU8E9fGdP~pEdj`i`UN9em#~a)A^qaEH-Vr>9
z+WN_tq8MkyUZFuJ;@3;eM$+n7<KznZD1V~J=*~SId0A=4!XUN3%K^-ePf+;9!c5Gn
z;hzrgfNZ4SA3xeM7OK<wFn^?Ee%3;{V~S%ktvWO#<=o`F?!>Z8x}TG(Ka29<XebA}
zAv(F%Y$#dbXk(ykb$<J72Q2m|%gui3SRwE$B~;$q%L^DJ*m>z&Tpt+lxzr=!O6SCB
zM%!ZhRZ9o3$g8<pJEjdvx!BFpkow)#x?HQxy=Np)y+%vQnSfB)Ss!FsE63$t0!H!e
zMXXN%p7t8wbUv?9N)I~Q2u3~n52h20D`WQbo^E$UPQxygH?7&d!S&`)58(=l_*k*j
z=2h{Sh{J&J2U8`+L^3bCj)ALg@M;_$3iM3~wj2O(k(ZptC5JT(E#=sFnG^FSG!*F}
z8aKvRv_wM`GWk`td%%Urktrc)FUf54N*Z}fSp<QQVYA3-CErsQ(t+#(yUw}#N4qJ7
zc3gY=EhKW&HsurJ{svMYt6)sbmpJ<(?yWWxl0P2S(dy2WLgS~QgvpJftS_~@p7jxU
z&!HKmdVSR)pqR<DvzR4@f>5B8zE|p%-cG!ld(E<=?(cU4HP`znL9W@J3}(D&iXOXO
zO#YFg7eLH9k=OT1^CZ7Ps^P6+RhN16g^)p<HT9qoW{Yy_2ZBI5rt<uWN*w*o4H8At
zkkHbHZVBmpN;)V{CZg$=rS)3JicG9gbY~TB*$bNM!ABo=+&dDPwe|YK5<_HY<9Qdm
zF&gUN>fpOTy$QAJ4EgYUYQlQu-D^#%TfR|=M9VSkTyqGMDKP_el=SLDvXB}?=B$6^
z2;Y|0B*m8=epg}b>R-2ef~&;X524S>)VMhvAl*%I(P-O*(lir@OntQOpq9Gv5o<C;
z6&atm8r;p&w<57=4S=$)u;Ivz7VL3&HBmtn#f0iD!Ox~eBc$TyxnKj#TKB=((Bu?G
zpY1nCYaGBry-HUxr)+k<)R>PD!l2JuVVj!xb&=}OX!3<Yx;)vzQT-P4pFb^J(&?k7
zttG8{$bZnMUrcW7&ThtjMwXuHVn|wSU7mNM)IEyj@<ZDbc2aiR6y6A<aGgbz5^)!n
z*gSZiP9#BP%Q08!nBZNgA#`Q6$VT5kzu+SfD#}Zj<uO2qQ=j#09Q=(;dGIgiK)Ci7
zR|xDFfP5Uj4mbth7UUMgpRu&GAh3Vqk0mnxRdBiE4*lCtE<4KGr;#S4zHgtQcW|u=
zU4EP<Y<_@bJ`b{4;7L^fIVN%|OWA&NRkB_#KoTS&gpUI4xD}=qx{91K_j^@efESob
zr>}4ipAm=KYJa}PFw@r~jfR6uj@h$^7o-s{Pf|}egE_^~usr3|P{prBo0f~Z(09X^
zpWqH8pVJ&a&AV?bwW`%Hwx^)&v=+E`Hm-^Ov@dFh>8%kdZ30O4pur7p$X{&7&fec7
zCfpSy*JrTu%>R&8NwAQ`X#UX7?~StG2j<hNMFxOa!XX+4>Ef#iWQ+D<F$%Jw5h(l1
zr0v+Z?w>EyJ!9*b8Wl(ERp;jZ89a9_nqxC4qZb_%{UP9s+T*#m=)(rYjr#(dYeO`5
z31v7zE(<Q7j)9o_oKM$SHpvk&#}VKB%_f$6o?%5_o>AxZLX7YD;3r<Tc76qJ+Y1T<
zJL2|$>UfILd1`e|M;bjnhl{04IkV2Ln2#S$t!Jep-al!5chb&cc7Xr%GV|lhSMj3m
z%{uj$_~zsk`_08kd3ktyLC*EhI{Ffo2eqn{qOnhaN=3aT@j6I(ndari5>3}M2DCo*
z5yHLvOPI`DLs^nB<!CwQ*>j0q2*T0b)G4dXfWe{tG#a)f?K9BcutE#qevr`YUm>LI
zxh*y*qXRz=Zt<V1L^S}XG<4M;Jm5O=a`lwdIP>9P+#?DbV(Yjm*JyDc_X|H9=>H}(
z<qT%gxP?{RpJ=%yVxSNVKoeY-HwjM+;bUY0;5~%G9a3+<N2*YVVi&N~vbSl%yejdu
zn;^oIfgsiYEgpKG0C$ATuI(VfM;npJzfDtqJQMk+UG_tkQd;rTKMa@OKf9wvrSaHN
z)j#<40sk$INc@*PdIeU^1O})PE@=mv;CUC!6XIYJD+H7e&`XrmZVwFRe1G!RFr8h@
zf*=uQNZyGHsu!9Ce^A8uwDs|~i^dz4-M*z)O8ur<kwc%cF_0nmzKzrHXSC_t6W73o
z_mL{~yOK_Qdr!>z8Evk3z*_2QT;-dL`jv+b$kHb-alkcFbwj@<_xvM~3-hcv8W#ge
zOa-uvnf4f}av-YALW50h<@8GKu+d{_Sa`bZ_?mA<>(lpd!_g}j$q}=L1)u<{{hKHB
zf7xrV#P|KSw_n2-o)FJTp0m_Y+J7kok#A?dKZ>5Y%|>#^Ep=$mn-*%(6U>i&)ynh|
zJLVB=`l|*YO#u-77_c?-Wq-e^qZ7S*6>fV?tWI@(8Vp|pFnobBo<?7b0RUsIp&T{E
zY&A-%3dPg#Tu#M7|KY!%O9=TX$*8%H=dsqQ%v3+{9OrHDMIn#L$uYl!Zme0&5kBWO
z{*(wJ$2q{0E6*S!Z9`dJS9jP%n94IqU!PwH2+W_!s9ePfr_H-?X=MA;+ed_buQ05L
zE{~~-o2V-555_MJ7Jv|-y|z<PvYsg<!JEFJf-yKf;uCuSAZ`wbxgobj51<!E+4Gci
z4^?RXP`Hnp28E_Bj*oF6WCWX#CB*~IHa(7{zegqj(&Kj{FO7Lq%VTdwnNVwElhQ*V
zO%=~_b@0f?AEZ^g*d9^+NLx=k<n^B=%iU@Qb*jkYy=zl|aMw;KLnZieiq^v4-;M9c
z(k`sJOLB+_J!Xvn-S=?%p~v3o?aom)<jL+LW47h@_I9?m+Qi!1F`=s^s#}dBnOBoj
zW<<PeT(V)0+GebQoZggH1xSd;sOpJ}nWxr=9VeQB>6xQ9p)u}S8;gmYTP|i3kE(%*
zZ`JGlFLM&tB`Xk?Jr+lh`Qr>D^jX9UvBs(mI2rn?pD5}%9}W6jVf`%c{wfJeMOZ#F
zx8YZ29#S-RrLp#$;c_r=0LvTQQnv>Wm+ruyk9&N>b+Uh4{Qzi*@f>+_LAfRnUB{mU
z=p6^)I@-po14++5>=rYzCAgl~e&UI($%65IGgv0g6I<3Pcg_h@TV(-UWTlV8+k194
zt#eW$J6s=XIpZ*l0RZ97<S~2C^}Vp2nWLyFMc7l3!*A1_F`p&23sD4Uwg9;`@A%vo
zchI8r`Rv!(s*xpxphRXIY6!49&o0D*l!Aa65QBDI*+L@nf{3QiQ;yUVp|9;<c}U=)
z18Bs@((Sg*9u8M-bIj(`4PqD&rdL>+hfnc1+UKr{AtaUkUS+Pv2+s9-h!7p`GDS~M
ze_eHMX>W0b$N9a<92ZM^sb5~YWZ_IddZisy*Y|X@MBUlb)uUSxAcKhaV6wer&7f?7
z@SQE^mqnvDbqDpVG1l!w&KhTLa^mN28FjF`Dwl&lj<o;f5OnIdZdW4M5_jiob}Z5x
zMtjp(kF3AZKU31gPlR@z!lZp<vkGtK$8<Wpn!`4iqt)==g4FS)Z0{(UcdV{Ov4xn!
z>9yJS(ogFA16j=K5#-eM*7FkO>P*K(7ROx1Kt)z#x|i@NOZI1T&UYuSh_j67PbBxw
ztfg$)uXXa<*@wd5K8jFLS>a;<TZ#01Omr2w3$8;07bdKIq&*$mpit_#OUkqQKphHm
z<_gh}(iL(Z_bf3PA0Q)#)RH&+h2;;t0jh#)&_T7|XXH3{8F^e3r7km<b^SpWucJ5?
z*|pScsb!qFRbg;vgf&}5c+G($b~a&!IhS`gulGgh9a^ZkM37V0nDb4oqdlBS74d@(
z%V>UFZpdJ_yDCNsuTApGXqWcA$8JnH4sRsc(vQo~NJ|5`jx#Bq1o_+;@rYz^=DwJ$
zSpJ5kucb5@c8cS=y1DB4!;&VYIv}8qHJr|+)YsWp%rGUj62B8rxfi>i-V~AXRZO-p
zgDqT{)aSI0$6`QTGcg5VTRV?(Q6N@7t}a>+jc}E0zhP5KWrfZ979eq?K6)H=#+tu#
z#F;rUVrNv%m*+3PBn*pbD9_0HWW=fV$$PE;osUmyUU%GCMF;XZO<$`~^}9$L>70i=
z0*HgJqeCJFd1a;x{;!Uq#Ey~X>=yxzZeU$1xfD=#jz+0_k>JlW)>$i{fcJv!MMU0v
z;?=Jxfm*QRiM56`SOw2E$9L-`RaqRg2)$ltJF4HT8wB|^pmoLsm#8R8o_}1p)VKY8
zTPwR=ee`|<>Z`#+vlKCUzU{I=wM|B`Bu5+^r7U(SjgpU%a#nsH1d+JrSY6{&BMz_;
zk>tBtqqz4Yn_s|adl&OfeWy95&yh30XnO&+4ulg9#Q-Bt@T>NU>V6B<9J|HWZkaOq
zSl}{EOUHuhS`7tly<`3*-LoRE%n^dF6#KSdfiC5W0}?AL<l&e?asV3EHZ2gMy-l?>
zrrB3IXJjuz?#@>X3R(m6$7gRkTyAFdoRezXORCOR4V}Edo`*l|!U$};R;D<xTFg&P
zH@sN;{KzzR+R&RNBE^TAoWgo9?JEEk-p-xJ<VV3|M@TCY+%{Pgd*n2z`Sz${w<p^I
zVA>9WvGiD|S5KyLzYNRHMI5cpCqK2&O=}n{(JS(&;CZHcdew1@&}@gaDhMlU6ev(i
z>giHlBR43`x^jzL@tj=N!=0oiuc9wVmy%yZB)gv(ks0f*C<RJ$fjLm`>I+ZQh)Q(;
z8pSz;MdX^6t%F-1D~rUGl&W5o$XINVorG{Pym<f<-@m*iKR*59Jdj!YtjLsQiR?Vu
zE@$2Ec%oW#&a1=Ee9}vo$9dV|F{u`m832jqrx$@#1AiW&CqKxGYlVv2dKbp<bJrl8
zRr*GWjz>RpX>!|vU#29!Eb0jqqnD*M5hMysvHJ1>_`e$fC_IahhI_e^x6S~AG?!Qc
zLWE#Xmj!Mdu_O+N<g##9-jBx1#GD@rUti?xiH|OnGq+$73wL6i*9c=mH!oCI3?y0$
zPRX6>@F+<wl++|Y+ZB-^zBJe-gpDb=^ilxZ^_c;@Dw0iEgZKE$AA=sQ8#Sl7z)`ji
z@%%iH4;=ni4kB+3_w6*|h<J*X`n~8C!vS0(8>l_X3&LjvSYP)Yl1eqn4M{_f9~Flg
z`u6iceBfz6O=BnvS`Q5`kA|LXs13vmMNpXPd5;GjE$6cw-JlJnoA#Pw299)dylPR!
z$S)~$`~%!D&Ki+YmdFQZ;V6&++9B4zA#}Hql)l%Jy~4-g&W|Z_BcADD-5$r7jV5X%
zgA*iGc2ZN)QJ{3;KW;aeKki%|`05OprzE?cK|9^Ie@Ifw37NN%bm-F+8!}|yN+Rs2
zn|x~?@!vEA4THlZ4+YQt*J9Wwhv(r#*o&Ze(j@fTeAN#1CX!Tvznr2YE>KBe^%hM1
zEmcAY=X>A%)xS{6hiHq`G-uCcyC=GOSYJ@Lxb7uY%-F@cz&g~a{c3U@#u#c}d?(mn
z>(9_9;VERvV}1EexDZ*CjA}@u+i(+@OO~R70=+-zWW+Y)Wc18@q(Em{*6B>!Vu)ua
zfIK+@7_l+A2WP;c$Q8a$%M+@i^_=G*gvHoh7$J6@E4KN?62tP;-dUhW&6FeF`h3;d
z5ACKpYx;Io$Ip5-gHGp-)Ym5BE*C?lsc2|Z2$lxQW>px#bo^g$O^iBkvN@u%08Ph<
zu<|yYq=H5~5oFH7E~$3o)<=CW#zQse@#ysYZJvZHk~xlCSdqJ_tXxm8IB=~$^9=wq
zGghWwPA^26U`8m+|2XV)oO+g=3Q{#OT(xg6O1t`?t-*HOZZm5?f3ZiPUHvgn&q+o`
zO2TfXy{Oa$lz+sHB{y!Md1}q4iIM87F_S5*Q>CLT6J+$v{}oN5Zhp5~%``{nheD;j
zFC{}s&)8J6SNCKi9gRa{dvaq~x~(dhzSTKi6zaF@5!1yAzc76H(A5Knp-_~_(X<FV
za31+kWDkA#gU_<YErA`eTi>WqHBh$EH1u4laxGqFlW>ie>kb)#+|IH7NK)5Xr4lR!
z>6`nhkL}J^?+EU#L#w>4+7`HSfs9Oc=^zL1pe)u0f&F>%lsgZATF?5Z$n>9`?9#3*
zH1u#uQ=CI}xGFTMFXNkIysKOT<Z^#K3tdU4vI}!}H7I&Vb-kO*SnY8f^P<>Q!M?<_
z_4%U8PIE_P_XGYVrWbA3M;uOX>THtK>&2Z!^*0w2f1#YiY5JlEDsS{pkzm@3&Mxz#
zn``s;nuCTKI>iRMG8{!1)L)YNape*g#}XwT1;!QG89zoej@oMgv&Vn&9UZfE0JTR#
z{sclQW#XxpggJaRfA6nS%`%QaiY7f--(|ab@0}x-dC_>gl&I(<G3q7Y?DLnVeI2{$
z{ucmqd=iC3>tv71s8-cM;z$SEd!vc5T5>t$dI>=D29S2}6M?7fyQdA{xapEv$;eeV
zAaq=9)YLK?9r(hQvM=}6Hu_-3jVH;byxcNdI$NUnF!6bzsQb6Hi<3;Q!+|0R)EG@F
zvRd*S$IigyPHP!2)2LVCxF^rGPIs3MZvrD~Xx2%$J@8NXqiIjXz;8c9ImTyA`|4H(
zUJ%(V&ukGeYSdO<d#xB=o}TaN$RmLiGfY$Z>E5N^$*()AnaMl&;C%*XoG@CPx9OjI
z-#bQT0DS@)W}khXBp<H%Hl%gGQ;#ajZjy*Z3pfbZh?ZUjrIQxHAMOzXtCNxC{?nuW
zi__xRh4_wsfm?%={%m;|p*;d%!I%%iIQ2t-yh5l7hXJZzBbyg)y&J3DzI+nk-DuR5
zkev0CsDtMtjC08&7z&0oz7z5p4UU2opI11fA43mY3<8{7=+@@L+`NtBznpjCsc*&r
zvAHK48$5s?`gGKjBU*Atl^2V!M3iWA0smPgW%qoEvb(0yBd2y;bkoO^zWtM<4i7i<
zmK@Ia7U8Y8sR!I;X^i(AAGAdbq-c$Q&kPK_@6PjGYbx}!>Yu*Rc*^)^B}TQym_dNJ
z5=yypd#MgCb%d?D=>ayOZ)rsitXLyCnZ<tk5O2H!fBet1QF57W1v&Ckg%AIZKE{(n
zb-Bp2^!4zncsgg4MeDnjgXdrMnw2}6?e*hSlz)Ife*;0HBn+QoCVPoR>VYKkF@ZD0
zkQp=aL9#R!Wfq0!*QDxl=P<muW|kM18JeY9?<_FJ67kS;$e@92`H>gyt-2WMhtEfp
zs03ll*oj*<Nnxxk@K%K|2PUg;GefEnSC)`HiE6>Z^VOJob;^or{%@5>ysp=B)c~xc
z_&E!0Xc1f@jJiN@AGz{;_~sP}D^{1yi*HWObXxV~rMe34H>a`Kk*;JH&lSnpD_fX&
z$tdwL{DU3w>Cy03PGHE!r)n#Ps|V2ICPD*j+|OTD-$yvPz?Z;PXWJG<6WymeRUFXw
zUV7_%ANt)>lt;)ob-jP_WS{4v2bz{)GfOF|k+o8OQt%j_v4Q>!l)5sqT$w}mF_m*V
z2FHNFbZ@z#IBssX5bn~8vF-pPcDHCU#SSGazgL5}O1_VQ*o|w68*Bq1@CzLJ5oq|8
z-bHZyTLuhl8ZBuf*IjcgYlmX2djJgSveNA^P$;Tk?(Krk3w!Ly3yn*nNnBX$pVL1I
zBwJ-@r^o3Ia>h9qoeHy%y=&TXE~+j^jHW+;R?k9la5@*h&GP%iVxQpRpYeSL+O-tV
zYs@wiN(mYxDZp|OpU_@L#MXbFTx12Uq=VX~jwKY7KLv1A7i4AZrbNM=M|iT8zRoUm
zC_QCBx0}e;ej^0>fRePiHEwz|v1V0mHOVb7Hw)L#7fQn+2y+k8+R6fYFC6nIm5A@k
zLVG8~g52G*mHIgH(lvdO27VuYx<2lDpyAM`<lU2$rBARb0<=wdv?AM{Yvc#4;Rd!1
z^tD8tv|@OY_b~wxXDh*W+xlySroKmNtt!DtRK(f!tHa8u%_cI518WhsSAP3dQVR?7
za;2s<T79F(!dg3cQJ(Wnk2V3ryNjzBhGLg3S8t?!cq}_YrKlp$c7;CFI#+bAJ(tgY
zwDaoi){;-C&9IQQmJ+1u>4b#0mK(Uy(Yc%1Xqf{4$u;wgS6PlHezQT@$4b*pR-th^
z09x+n%sdQYtZ@^^9t7G#;jwP>_ugbV3eA#o7t*;nG>y})F1+1Qr8kK^C&Hg~Kuljb
ztZ{L1*D`oq_PimYZvoF75ELk0EEmS?IKMxA2=}-cS#zDnwz!3_t*Mjopcu>7dMjvC
z-2l^kz?0%<LrE<XWxG=g&xCzDIa1-K--zONz2syCkK<LTBCmGUI%Xri&XRE0xuWMs
znYd#b?!uo3z$5@Lq?9^|^WADN&~zns<m)oHSgk?){MEk5c|+n*(jV#3f0cY3?@B&o
za`_U!MTg#E+@V7b*TnjOVUxCB8t57?=Ox>m@@tJ)d2H@QQ{nd+TiG6c;mp9U-XIHQ
zgsTjh?`zJ~)2CNAE>^wKZ7VGgt2vtFIyxI}^5lvCH0k~748dzXab*8o*2AXP>j+@Y
zwqS{=c}D0oA0+EclSj1U9J>O2XqtlPn7u;B)yJJb3FfHxE(bZL!j&`ylCy>fE{NQx
zlTu)GwN>(kvtqHw`%9A5M+svYwF>D=9!|0VJ!$B45JgdCDYFfs{$(WP2`P6_E=EMe
z6WG**Ts0!E$?evV1Ceprp3OIvSNu{gpqY!#A#<sGlID;d_j$9Ak~Z(n*6NrZ<<f|w
z*2DHPV{-Fn4WSrL^^F8TlM__yffLpX>_PQ6EMgudCP8#+b`9EL*3Vhb!mX>!Y!|sl
z_6nbaygzxL*4;KUQ_|p-@-2_&wkI-qRS6zWiTY45OYs!@s!EeUQB2Cl?9JJ?JFMqN
zq9B2faHvr2z_kXU>qe@<tZl(NHy8#=G5Z$&`nrf8{K+~M+BwBAUe}*enW?-zr(%@Q
z`VVB;MNP*9EmxG~v$ED6M|Y#uhDs?JZMv8o(;_J+$1WSAk(yH>Vp<F#$2viacZDV8
zE<0WkOxvqZR~DGro*(VlB&Q~N3<z!RywR5w2uN_You$0US?-DX`dMSWj?HF(Yq`N5
zi8)4VG=b(qU!;h%?%NhNG^jDAXfXCRJztXO66|f1*8uL4XUYtgX0Wuln8VfFIewdO
z^$zCcuOH^^3HPYhtV)^94c>jzlXhwhwqWvOEq$<vwN%l5C2KWa>lf*HMb~ELs`8*~
zgE$0nTKHUOZ%rShRhe};inie24EwauIq|D;=4gFnRftxsA}1D~29*|o>2j5CZj0z@
zkbyIehEuKIil^F(n(IN=muaU*y|wd-7*y1I5QNMuFqNL6{UA-w%!chp6foL&m16bT
z?bqeEkGF9(u7jLunjllwf5@pBUaUl%KDSyG6dW5$YLiIgF5hH&%xU$*|2Z>qQ6q7L
zJ=7C6U0&3O+N&ZQJ%4_G7jb$_BNZ*1Lh;5?s|CdxPtli)xNodSC793vG<m9bq!V6y
zeCdo(^jNP;9d$a|AfmUfv+`&mQ!5c}y%^M`*J?#ECPSZy7HgzpS&D#s>Cn=6aR#nJ
zp|4%~2pqd$(ivr4>d2klq8BR|-vv%;TnPK<`^1x6%8TM*8{`*A0OpJ7U7@*DvQwn~
zwo>*j(6o|a9oXU~fGe1(l{FOC`-C1-mui=x@=fbq_kCo>^H7QkaLDiuEzY;|-J?)O
z`zbrY)lRC`>}OO9jQ~mI$pV`^<irb71N*7($W(mcu^b%rCEW{S|Bxo+?6HT^L8d8u
zEM3S@*x)b~>(Q*m?!|#`?#h^M<?A&eB9}(7wvwfpUmKOC948&;)9&5%+>x&jufNw+
z&P2@)0i9e!B&X?zq?D-Z;jeR=wE76?^{4Vw0Uo|k9ng`QR9F|qw`<!bek?r}4baPI
ziPnUAyPq^H*XfoGSD)Z(=k<nwOoOr|BhWR@7!AumO5=fH3liT?qc(NNsW%4_^dF`g
zd2DrRlz*%*9B8hY_Bqq66OW$#h7Bq1&2{HFzRAZahf_U)6TNN%>R&84Z!=zPq@Q+R
zo1LcBJ+}+obgfz3xx4}40RWoXZN%B4L~Dn(<V%a}-Y1p;cX0X<<OGS$ad=tOFa9%`
z2F(R~8-7J~8~0}+tXm#{(>{+MO8kR-_BRpD??n6$N{vWPkS%BR1LGg}bwlZZteyrf
z@jIbOiwR*m<yoI6^X&ydvK!1=bd&k!Joav=odA<`c9e$h`r`9p3*Hf#u(uk<W4Xre
zk#V5IWvpxwl)T!f*e^-PrtHE*<TMEJrJRs!z4h6uOnhOWHmZtJLxn{N10j&u^99NE
zB8bwODV6Zcb^q*5G(Ij9GVjn!86UIZ?Cya|>eN1(-6w8G&>y$`l)m;U0H07UdRO~2
z<Q(O}C<d<S{3aSS;3D657u=?Fqdu!OP92n6iTBV$#C5@nRHR(yq)f=`e1M%UoVol8
z>anvVJ(Cm%0V+V>cB+-wPIa~FWT0I^^6~E)DqWBJC<W+Bbed1%RS0FzcIUG*@n4HG
zpNcJPS#%()^z~zWVMhQ?q?a<i{`Int1baQW=K$gh`Sx@{_I1WB8Ov_{1GTL;9mO_J
zd~jw__DSOw7-y=xy$l4A?BG^M5HsMmWJ@&9-_k8q<W-ayf-d#3irf8!AAR$ww;e}V
z$JWbB2&sCJG>(pIcEY_~d_{fhSlUCFM0(MAf%!1?B|zfqBb0~W>t=Qbi-&&ZQDXJ!
zIIB@4D#x<mC-YAenMR@#q&Tnj({D1}Q@HW=NGQ{4+<30CoVS4JKJ?A|ghxuKd0t30
z_SG`T|GVR6xzG-Aogt=HEO+L*c1@;%5S0!IZ#((=VvSOPqhk9~vBH?9Z8abdW5@WK
z$BpnUZsk%ACNV33;Dpv}IG-f<Q6PKoRr_3%O@*0?$uIv0Z?bG$Z-}R398a)ZI_67~
z+xi+S3!61JMl+bc@s6H2^UYLgGn;OH%c0+vq4+#?D7x4ZKYS=3jTR7%NYE=%bL#ry
zFcvo^j8I9*|C{WCk~DmhrEjf53En=?V=br8S}`E(PCex8rJ<YB8Z}U->%R<(Oql5-
zJgofggAV8SnyR_@38mR-i0Sf!n7_*G7Epdq_qZchZ9sHYrlpifcZIk~U*Tu3fS`u>
zcZWygy^NL0h!#(gr5p{0!8E!W;V~t_nAV9OoY*Eh@;|%a&*rDSJj3t^FBBtd=DU3J
z5nNXqwGjH1%aK7{$l6j2P=+oOEJTc1JKdPe20AG5hr3e5B>dI&M+2lIuM{ICe;c$!
zWBf9`>-uAP&=vgXZ_K;M?-L77x$fpeD=oIh)14`0P_p0ONDl}9J^AL{X@}Zg9Q*0u
z$k8qNX-a&}D=e~-vV^WHI6x}N3FjPB(@tgkNAiP82RwtaN~F|ppTYhvaC&KZ{S>`m
zapQf@T^2<(f(JlMBi!Vee-YzEQGjtOa1Llsk<-O55l`Y%-1{vLfN2xn14>4JcYJ&V
z&I+7O^sKX?_st*v*Yp0Bk;SJ1{QQB(p9lV0k$<nr1D|t2cV+o_5|Ia8MIFmp;&-m8
z-x3J*MlD%Jul}m!=MthUHoy~~)6nnir2Cv{AGwFPI=vgf+s^Z}s-}>NCQAaWTPB$~
z)%-Giy4w4)KoJp1G@)N@K9o!k>k<FQ_kL3Ngkt>VA@VOQ?LU4K$A7|okaN_l<o6+X
z_fhHVyJgI^2C9+;I~&H(zX^d<%znVo!hThu;6c94wS@YzF9ShztmvdEXez<qi^n?R
zttKH)21@_#A`tH){^!^dt2kgetg5E9-v8DM2jacTHlno##KG{C9sjQm2kAfVhz)<l
z$^5-`--)R!fzZ%N5iEE|_R08$_e%H6_q(ktjcrCiOuO15&b92z(0WReW7pO{2*-Z4
zcYRj1V1H(jf2hdcHx^w&jeJ3bK@14P(bW8Jb-|!Nm^DN*8>-K8DJCRfdkIW=RQiA=
z|5sH0C%2j7q2Hc>>%c~t$Y9tiLt@Xbh}{0mP4md`n&f|9VB&D#&54Vfw6%Zt=J!PI
z6u}f&`$|g2;J-GkzaQ)0SRDU;CHKLdWP&tIh<{riicbQBNrS&yAj+#9$LaXn@BHUQ
zKQmguQaHNIC;t7h|Le0=z@2u~-f72zr9g80@9@|E7!N^}2)yz)d7|Ib)H?4f+QoK&
ztSu@Pzwi8(w({>U94pFC4Ll&fwY)~q@4lRh`)&zqqOwq+b6Q8t|9rWBqnrOX_1uqB
z3D5^l$V29Pzte~B#PmiIoiBn9RjIs#NrUG9VM+fFsr+w2#`jSFca(QRX{%+0iT%zc
z{nK8EWA3!3Vno~Yx9@{}R|BjB9&p#MTmQFz@z0BXukUJ#uP4=*U;OTkMV)W~`^$B>
zvp+(+e7XPq`DkO8?h;e`F8QqA%48ZJxZ%^O3q~Bp(~(}3|6Ry`U<5t~q)hbcG5zmk
z*3Wxqqg>peM}eG*h?@NWQqTYAhgdMWGF3WQC-L+jzTjUsm*xPLus7^Zt>f8`Q2)7H
z|N5i<RvF-mpPD$ZhH4Wy%nyIJhTl_Z?zG15PHQ$60{H$<S|bJA@#5mp_IF?J_fhmt
zYo6U{4f$*4l7A}5Z{M5v&hUt9q1t<qGQS|cw@FGONHwq*T&QU+UM|;hwO6H3`CBAL
zK;8dX<A^)2(GQ5L{*Uqhllb%RRyRM5X^+5lJX><2)=E|LL8kYS4Dl<YPfU>lH>e=Q
z9uK2tc{=RZUIT<xwLsA&NOF;w%R2Gn-okWPGJ_Jue3fa4*;uB22;ECchWnICvTM);
zmVm$aoBwhtRMdC6PJ6cs)EpGFzZK0tFG}~^sb)`9LT30`CmN+R^6FGy-Cx<II~2G4
z)&2$k#eNH19JNa!?RDIIjRhhLhrad$v`YuamNHY=r+LX^GlT!dyUV$4FC=4J2#?bK
ze@asH^_|0Uzf+yp)_=3;|Nn&(tAhcomX0ocMiNsQMqq(_Dm8F$P5b1d2C!#It<_}j
zypoktwnQB;)IFK4<9b5<8W_?meY`Q^qLqE*X#Q(nCQMLJ+bQKgO)dLw+mv_>7)6eW
z>HkfKW$$!&;njATmX!k4Qnn;!DxY)y<YSA41xMfk9NJEkmwe8b72AN>`81^5wz16G
z)mxPk>#JtJR)L4`t~ST{Pvw`O1@u1D4DcON61@Sx)yx05So9fC)1pSl3Dxn5G@wh;
zil+@daJ=B=VijAv-Zu3qql$#}RN?bf4s)kw9obMfRch=4@soe-34j|G6}=O~)}0tc
z-6P-rUwqciozm{4(fSZrcKSb1X|UJVTpz97no%bjQv|nqtbg~rueg=UT9Q>*uU+&0
z2y%Nf%V<h12)cZ2H6ihSEHfi?&4mQyK`W(?r(s0@ACO$^^Sh1hrOn+!*n9q9bYiCX
zi{bSTFY-@SrSju^^Q*LGl%JEhAYKn}mUK_z`b|m=I}GR*)3<0n_UdK_0dX*NAkV(E
z-dw?sW^^4eR?^+T9@W;<FPpZqBhniMTz6v!5*UU`wQEqt6+_L20LgLL%p_uw^GgRk
zdY0Y@%8U`Y(dvyNWnj`Qf10aaro&aFUXr}zz8a;{;%Ya`XfVF_RV-j_*3j1lz}#n*
z!U<SjRtjH3LnsFk@D4V>k+i9m>8Pg^I6&ItX{4|i+Gl}O3pbV1BD(c#!KT`NnLmSj
z$NO?UMGiJomgjN25ij6ozgZha$}=bcZ>3pma7e+xr{{$p=(*0DtF(E#Fg!Nz005l~
zANO|TnXbnT5H|r{<Y<HkBAqGdk^6CbVxrN})Z?HNt**yl7DHz45Pur%dy8yNpUhWC
z04k)9B<4b}DQCQudDgaB2lV*=H4DH6n3g!TUh~82bcc>kHu0wz=rRx={f;EFF_s0)
zp(u?7;6~oa&YeM~im6E0Y=wixGwv8}y9M+G=iRv~AdGezsZc9YX}%Raol;e)GU<u^
zNc2C9JB-#SLLUe?jCqWI^kAK0*2GLI{qOo`;r}U%caCjWK9MEw2w<q@Nf#Ii1Lj^W
zNA}2=RU#J$CT?WY(s6SohpCOr?Y6JigxGJ<Pj=pGJa~hnQ(++FP<ai=W1_{)ftcG?
ztH0{QJzzfBtTkJA=?i?+b`X|0GzgQhS)!euBCxzt7W11uFHq27xAP-Jv2Fy;R~c+O
z2a~ckGhI(AiA;;@p=R#`tyxLJK39z^a{@S+ZzOC28_%k!Kq64qg=Z%3L)(ygebMCR
z*B6K7Z_0G)CVV=v^jciY^c;Jh@%OV)R)`XH!5SbSU0@6}-bB{!N2tSMeHnp*#ZdAH
z-&#tD^Q%a-E@$1Z<n$x~{~4-My+^74ISq_26v&$IiW!JU!@9{iX4J`59=^=W!+(OE
zcsW<K>a@1?j?ZbWkxT@ncPu04Vyyk2xB0J4;$I(tn7n38SeL_MlzG0osH61%W9_};
zsqX*(@r%f+kZ2&JA|jP7vob0pvUe%jduOkPkqX%g*~f@ug^VIXS;q|7j@7W&_wjPo
z`;Bv5y+60x@Apr)it{?p=i~X<_xt1dQa^Du?4#Vf^A8oC<Lf7XXbA?)!mq6dY9!K2
zVQ6pP_Ds!!3C8<Ynt6Bi8Rq9Mjuku48OOxZ>(BOAP!i_aYYhgUq~QH_%#1}g@;JHZ
zYBoDuKNU69eDw@Ov#zr@`_u?4gN5hS?!VJ7Uxj<U6T2DVwoW&HX1{mG(k^@Hy07J<
zpPTNN_Yphv235Z9{M4Xz>U`4$W<3L~({|zve$-<>nne4K|GM*WOKy4mnFog#j~nwI
zUS#l!_jJ%v;gdug>ry1%!N;Eo{i=}u=vbaHK88!eKE$y5!<5El!*I$=l~6ZaYPvFT
z;SK(PWoMPfY?MXWDbdwgZ>@XZ-j#i3{MZ8l8GFd*9fi}K57yr$JVU>HAFeO?O3*3e
zBes}Z&-oM#TCkH|StS5fJdt)k%sZww`9ccwrFS+XA7ye02f$~3pm*qj3u$I9UUTh#
zi-*YpebxOWB4d|x-#Da(O8x@V;QK(E+^Zmu2Rz2D(jyH~qlvU1cI^}0SbZIB(<mUQ
zkztprS%A6+rXP~~_3X~X=zfF;W#uuvLB2}8*A3E8(^gcJlh;>x``^4%PxU|5Lz*$4
zqBce-nTC|sGrRLu*!L5;bdd5sxx*&I{zR-$Bj30=_x4qeX%6+=#MV?LDR{B#(EgB@
zN3!d>6QsybU4Q9wS|d-|7=xNh>s_A1CQ0~`3VxiqM+csik6<ZNyF^9MVLHRN*8Uh^
z*S*DdPfbuol8o<Tc+DbXeCFXb-`Aq>YvlMVrr~n`;a5@SPtKGrN<{LS9eMJ;`T<pv
z%+r&gnKbIzdY*5O<xWi(V>ylb%1Wth-%+bdLww5TI)ZQ1&6EjROXicai)i1o^|cit
ze@e9bhMUZU?1|_Uny+{Al%T0c80M^+sWCi6NIvn#@!L(7)7N2~`y@&&=j8!*m21xP
zlc(~H+nU>5Lk{vgT^=TuQtz*9OS;n#8Hp(xjb(?vIlO}D)!5>^C@~5y&M_nUjN{%&
znDhv8q(3eOa&?%Ve<;?0+JHAXK5OewAkqJLX=e`i+dTjK|BO5o9y|l9qeE7<_hj0B
zB>4#voZ3ZLDbAXd!#_Y!d8;NUlqK$7voft(k1t~j+LnwG8|S`$O2B5s_NzpE30SEi
z!&lw=vfn<>uKs8ur}QaXo=9&-X$!H4oGx$A((UW?hk?k&!C=uacxw^%$79TiaIO8v
zxc%(9;57_bez!0)rsk=Z<Y18?cZ%4q+ZPX2qab#9t7@hOs;E?JzP=L(QGigVrq>yp
z*|k51q@%zhZm21)Z*pP^ZPrcjbuy7(^g73Bfiv(r!bi3t?GR#F4{F<nu&Y;h7Tcv$
zg|T{a?O*-bBA;YETvs>btis}YnrEfsR`7?bXG({BDt39=ccabhp6hC-sbsP-xc&^e
z6?%lB_i8vNeRF%9>wE;wBdpJ2@Xm~Hzx3PtH$xJ?-Fmb@^}2x=U%zB}pt{15{9^=j
zl#Um>&B!$pQ^J$~*mv6=#U3zOt}c=Q|M)qb;Jr&`7Xx1y5QK0MRz4WNn#x8k3U`Js
zfw~+^jHU>dur(1P_KD&#xkF@B{|0^k5RIo)@KFwzh3QayLej#oH%H-ULQFez1qO0R
zeH#2_o<5HIs{?&!&(&fbY<?7<g?-z%{tEA|;w+gK(_jWsPDt!XPgBGS+NJfl%#@DU
zmcl!(1GL=N=1^Q&CwkzFiG8Z|h)fy>wBRmMgRxI9mb2qhXlR1rEs#^uK*x`BMZYE|
z@A{rqzHVK)A9#;1AvGv?v+%_Qu0p;7FRXmvn0YEHU}X+Fs;0P4@nAG2UG+@z`bm1t
zyQY=DuHN~t@ASMxk=-X6xH;h}SxQcKA@R%7zLHOO>TJ<N^-)r}hN8mPTd6&N@z8dp
zvfKXon3M#R@p|V522a51tFG!e96b}fNTfB)rzL?}pVUXYAx6Z0m7o&(ycxD*pO_N8
zvf*{Kd-;5Pq{!}eWWV?rBc!@o9jlX`FU<}XOKhAhA2-bwOG$jOKkCF)8qC>Av9+1K
z3sn0z)>mc}6Qx7MZeK2@n31TCyuo+p<Dv1^)Tij?fYnNY?z9{RLkQ60Lk&@U)kkct
ziG3<;hiXHXn`nak)5%V&R(bJgeJZ{d$t}}WU@>zg7xYe0UX{_|zZUwp%`)O4b+^o6
zcS$PZgtEmd(`8{7d3j#Kr>E7=U#(bOk~sP5>mmA`CBe>A9r}s(_*|r~U1r<_?0*)f
zrx1Q0ZA(8X0rfc&l}aK7T_+bwd|0kMXABluzAH_5kVE5mz6oX@NifZ)H%>MYXK(q5
zMZ16-EPUBrsba%;f}qlWAN><}qgur27!HDrBAZbl8h#@+q6FjQMc!Ge=V{qj=6d^6
zyf{CP%rtnlr&33qjyI6{1k($>;$U=N9PszV(mxV&{965h>7_k!I#c$mzx$3`H3R8l
zB$~iADhJ3a?PC@uh5I#($-=zJVxr={_Fr-keD#mr<*k<X_$9$?ui+@Fl=EsO#K%zl
zr62rX`+pwa|4NMia*1l40o>0Eokn*Kil1Fza5s_cSctV+H(8F}2!o25>@86xJ;2&8
z7z+h+PG<X8y(`2%A;EF84olyMIoUt_4&V2utsx&)sZYE^enTaC%y0mGC6ukqsQa+p
zWXE+>$+Tc+sY^jC_(hSS@4C+8N$2b)ZqU=TPM`|bzo757rG;LL;%x|R>dH5v4{>;W
zPsee9&<RAOZNwO7-dijKQF}OC*DYlC-Xn!UHODBXJ6|X7q2>J;+L&@ZVJI~@*4o#~
zAIDdTza=&Z3HxTq?a4LaaxJs*wabFr!DjqAYfE^AjkbQzKQ?CmD}JQsk|*6C=N^<6
zdZ4#Yf|TYXi~2dk_G4g4O;@NIoWqv0=iH56CX#R(C=yh<;rGFwKSc7F&|QXW5S=ck
z-Y<vBBz)F!eRYZH<!6+3N!@))=IEid=5M_E^<f;hmw%2o3e3KJXa!}Gt=e#1=rEAi
zZ0Q+<o%3v`dpb#6R;CJuL3q~l0|GN|ei*FGPYIfS`})qho}-{Ji0|*3aEcT>Tr9V7
zYb|wq($#~91*{X<Pg4qs`;^qy)N=_CRL)JbQDx2bL){?_XJ)6ows=CB@!r>J5(u#Y
zVsQPmTBhHevEa^3N17XNWvvA+#~`NhnOZ)&y7HLrf@4R;BlRDnX$<eib{gtGgxFGw
zj--GjI$`J5RJrLMf#VLS=%732O7Hs^iFX)%{W&P}Q0!2?A5TA0H2n4Uh-tao+Hrst
z<oF5l;4b!Nm76hQ!$l*JCI+wr`^T-BnyO^Rkm;R*g7Z_Db!lbq5DXkuo^H<9PE|}Y
zc=wPRJQAgVWxogN%!Gc4T#Vp{=Vx!(K8`zdkZ65<#X{UQpvrB!r>Ft-ItF?UVhYix
zluokj!S7mIS-1-6NOX20+$BE5q7kIZ_y(*P?@YHi*ZRAIy8PnVWs}s?l{dMoYYUA;
zzSlB;pGeOV{5J65B!y%wtjOxpdq{>_*P24_cR@!d7>U!gA6<7!^nR2F<%eTTgH4b(
zwo<#h%&(t-`o_UA_UV~m=Yx&YlPwqjcM)e4^Y+EXjoPv`qG)4-4^Pxdhnlcz6tBcO
z#Ge`q=P{b{H29EE4Skkk$d{0F>2n&TH|ok8AOEW!lc9dzjKmSj*K_dlWLJZ!u6%3o
zXZ$%|90&IrwY&;^ZE=AjKm`bRDkv=@FRgA6F5=~_D+mu3ey`Y9hfh{O%V*wtOy9!C
zqHIaB4#w5It4Q4SZy$<gY+r*`1q*0bOC=^b&aEpd8ZCVflovY%vGNsR2R{S8mZkxn
z_08uV!0lrYxz|x}kK$fJOq1|}mae$KrRuv_d6A_{W$=ZMH7-#RM^UBSNPX$s>SmO8
z_p^lFTErIE<8Q@#f}jG-W`i}n32GF)cD?y7acMus2_qWWZ-|{U6cNVb73erGyYmFL
z+4g29L|O(P87rX|THsfY1(3`5@;jTM$=6Nxmns`8xF=r_4siE44m^y#K~^bEgs)31
z=3NLrs@{u`EIOqom?0eUWk0xZ_?XYP<NjiY)MaA?m8YT1<tp;q9en8QvFeH07>6&X
z&fob+9C(k-V7xg=@%0^94qhZ%biJJ8#zIcZd#%`EX4--ErrH$}pX<bVNpWHe3Be*y
zj_?@Qdf@F!bl+H~tj7u;y1_Up-1No2uozC=o&pC+d(4G&qX+`~?%!#kxjBGfWuD#}
zWA`4>oO+hM+GHS+5|=s{6yu_OS>}wLt@6YFolYE%^`LAzLNQ8R2jGxbh)M=ai&yq|
zkumKDFRqsr#?#OjI(Yqn$rEoL9km0Tii!70o+ziQ7}e(z?Th9unWDQeT;VkTZD>C+
zb4duZ)RhAB-Zz(tJ7=1c9_?We(bDahub9JPN-~aj*Yry*^B*(^kBEP@o}VQWj6X61
zazBl{$AhOJyV7-<%&C#6n}w?P!!Gg*@f@pRr<5e^Cp#$j*ATqb$aTFCxmg}ksafqC
zMY_#Kttr<FtM>dopZwo5_ben4V>AJl$>)sDS5ltYsp&b-u6bsU6aKm@7B_47&;KME
z;=_eh_iyQ6KE#<xd>cr=skdT#I#0lWP_g;@E4iJ{*hrNLS<mdY@1F@OPfj3}?O;uC
zIJ`b8iqTLL>4L1GwM*=uoHvwX>2Y*h8a@aqfr|mWDd?oM1#Fm&BD^wp27+1iE!UO#
zw)VTSVo-2t<KOg&A`d+&_bXc5QMJ&YLPK{7#Wk6sRivnw;{d<KRHH{y02#3&IMBzp
zPU=D7hxEgB>uaaF3&I~zu|%d=L$c?zJf3{JIZ@_2Hmh84;Js4P73%Tck^-8dNZR`X
zGzPT5GnVLuPY9{!8Mj@5Hp9qd)oc4HjqpQ9XkIXlU5?Aq9&L=d{d4TIAThp`TFm_X
zQ@_2m#+*<?zT87E*eXDu(NI>vNzJa(ivI)gzR+5jiQYv{(01#6K!{0JX*+cz{Z5Pg
z9c6eb)lFMU#174M7n#J7ac~fqSX$x)^qnz>F@}QctGZH*#Axgw@m<O=6`$N!t8SV~
zQlvg>V+Q@%ac;{pZtF{iokcdu=mUEm<q(q5?71`qwSb1LGc*uW6<&CWB|4w%g|QMQ
zO}LmS%)(|EnXwOjvj4;t0=E4kyD!d?QGWlNAVqj=gzU^41;(&>8#QBl=!`GZsa=)S
zp*XWblD5_;FRR~=wi=Y=a1$Agwi!ZtdvkoZFKHK;b)TeI9jOnOXH!MdISA{2SO%eB
zoL)99k(A4><LI5(F@zS-%)K6Pj6zaaRvQ|!23a>Xwk7#nle^!4PX*AmDf0VaPcEN|
zktVvU>6<cWF(%9H`Nz*%A$jF-gH=gx6ZCkS7uSU0gtVt+kM@KALn4ibFL}Y_;T6wW
znf*rZtiP*I47P7XydMnPnSK3zSe2C7?h;&Xrc9)~nxsBepKtO1AHISE5azf{juQ!O
zrq{El<Qq7ycv>2p(}xBA!*?iBZjK`c^bvbEgaNeBs&|_7e}6@_IPeijeFn!wE`<KW
zL!}urDL_KcFq`cKI0g3157z%1LliTBg)1@A75UHpGt61c2v9{zz&Bd`>`q0-XwJyU
z(Eqxp9i93A{_}+xG!J!l|Kmv>_CV0_wD%T16?d+BTJ9br&N%kJwlC(#DCP;J_TiTa
zub=$GQy+guw2=Q$Ipyvs;K&><4bNWxhhO`xe1HFF+!rtvXz+!XeRTeh+uZt>OUT~u
z-&~bEWQqoa;;-6^|MQv0ANv7da?R87$OP&%+dpkfECVSIM`?d8HK%#l>HqN5;=i9d
zF%fcl?>{~@7dido=D*g;Lgsw(ABW?&OW+icJV2+E-n5*(xYNxcr|kKR1td`0`CF%!
z?Dd2G4~wM(FcE4sfo1BJe*_<;ZzCdjcMj>*f{7`qC*<(|@5fRw<B|HDq6o^t&T{|b
zV)HH`;P0KyMrV>3KSw@m{r^D*1AsHac`bgaVE)H7jQb(#D)C!gi;c`xeE!M)wpJ62
z-c<2m0Rwy7NV1pz;i-?$BDj~a$*<Eg3@Cf6@jq=f(S6fYqt{&oOr-xQ>+Zkr<>`e#
z&_e$b=9-fo#&*``|25Cw;`6kX*i?WP8Pz*HJ44mxhK?aDhw8I#w*(e9I!g{ZrjM*{
z4ECAVWj=^IcICifYudo>p(pP%jrRBjL|8rW6W?<VHK-VH6&3ho-Mai0#e<JNFDX7h
zeyF8*N>SQ(+Gc&FbYwxjd`81%s$KvR?Rk;W{G-9QTrpE6W!NQcmzd18FMYRcBq<tC
z*76cii2a54FMq_}BOoTGqTq}x2@N~u@fSWZ<CZ_fLJ3bF$RN!yt<a02qClNHLxl4y
zTR(B)gqYZK4@;Te$K1PdzRy_ltwcpyZyn7Zv;f{fWKOcmzpQ9;sqr271U@9h2UlVT
z?`>NW@_h<q_%x*LshPi)<r|b*d8$p<q0hBoWxm_OJ0VzTn!jKQ-K~=LDl#Pjs0Szj
z4^iUYyPfiHPqe0*_Y_(Ul$A^ur(?gAx)ff+!&&Qp<(0;{xuv$5qd}K;%Fr{HQh~Ac
zB)bVpA-jQuI7-2&Nfo6v-VVr1b_i+bQNR%ftVMhyQ!b9ia2q|rHYZ&bk+me{4W<(~
z*Rv3CzR?n}RKx#I-=D3JeZ=%O+3xOW4@)OoLs=geGRkvdUpfurrl4K&jLI6S4%FpG
zG$Cum#8Uife^3LBO?j(gcYoExITu!PJTk)cd=<1Fvd?fS-7sshLO@#00XIcK{iuGH
z;ohvc!}kv?Qu9oVbOU<-E>TZo5(<iwj9Qtr_q{21E+_s10jOKMMyFQ=FAJmAQCIak
zJbe;?pStL+swvgak_-P-NWT7P?SV&jmiXa+JvGmXzrUkY=zaq3cbrDP<NfdNpwS+`
zBFxzH+EAYFX7&Am=VUaeEzP>}WV+?V_yc{Yaa8ZOaqzIten__I>2Q~`>^3V1#Jb(Z
zctxk4oX9Y)Ld*#@QCek%^I-)^&|8(KzxB3gUksqwF3{?#qWU@A+no;`BP}_$3ky9q
z(@;}8WRD*#U-SiJKvRM9oyRORgC-Efn$LZGH9oNK-jBd;+ZNfUob`K;Ug(Gc{Hg+d
zRM?qcJNYDjCEl(L@tx}WTVAYB-o`U6lmv@LP{mH2adj?&#u62$DmvbBcFLiL;V9ab
z&GBBNdTHhG&4Zh+VP3dq>Ax27>u>Qih#ZwPf1Q;LeZt$xJ5gpdv0_Y}0PFhH%lHBb
zpb%OjL{Uf&&|y3&eD|>89%7SA{Yr8I@3d_ic*JREN@hf$L7o*)w;>M&MlS$g-fhrN
zu^o+Z&`~(aNEd$dU(Y%IB;k5<fv(1!@?MgfstT2FQw6W$s?cpeqdmC5!IagcF#O)~
ze-!PC7&sy0hoKyYOl|NhdAhF)yUg3lU-)*(@(HJQaUp<Uw=cZF&m(Q_`Z=B)S3Ez}
zP4p<~5WMW@jgzJD5g9cl3`)Cq@!Ozx?nWGRREy%)e<oL?F$Z60UR%bL+b74^Yh+&&
z>j-}tu+=YaRRo0={97A56@jk$5?w}YwEG(m?3;FTRK=`)LK)2+G$F*($FF=>jNvEW
z?up@XtuH-%z1j%aHMu%Q2z*S?-my+2haFn4OZl=yKo`&iAf3X=gMf~*In1@G5~Y9D
z{|e$xe^DHaK#6x6qYvk~G)4<RE7D%Pb3MVNIp4^6^;=CZ^j1F*SNc`a;YjQEQIFxb
z?Ij5}=2v^X>66z8-;v<j)gt1PBYx|4r`z>xhaU}m4p6<4$#FZ*>R|v+sD5fc_Nk&F
zR#>RR9!^*=5M`otiU{c`-EkQ3J-A!8^xJ#ds$7*Zk#6&nsY>iJ&_H^C7}MLgK3|~c
zE=jTP&?2s2enl*?5W=)0`#Fa#vx!NNi1z(z>QA}k>t;XkQe-(a(R)NPUf&+sdK8E)
zw-SPD!)pAFa7(cw*o@cF_~nsbnRj(}Cd<W40IF*G$Q*FZ5chP}Hji0o0rf%)sPekE
zLzfW?AJn(Af?u4m90dRY5!ENhI;WLDb+5ItzNQT|xtAS*&qX%UonQN(AbXi6#Z<bm
zwW{JPGvhU}!rC(l%|hDVyZ0Uo>;ho7_sNN?S_zVY$FS=EQQ_Z*5{-mrlk8kVZ!<Zu
z!Vwn)OqllAwU1by+v3Xw3}6wK>b~iy;yP{DxweX8a1DiLZ@s^S4!0Il+laLud*NRU
zk&)2M4GyB`sLLefGiWhmLG0-G3vR29n0yme{K}Bn+yCmz<9P|cgIZkVR|`Va0yBb5
zJ>E!9PMm%n4B8$TZl@m1e<t1;Oh}pZUg)*m{uQ&B5?^DO2I1xLMN2<MiG=onCz~5@
zVX;;Kgrx^A)A6<gOeSSzZN{CUQ)dEi!2hUoZH#TRjCj<U(w~YBy>^%)JGkSLqoAjm
zLnE&iI=OYO-`*Xp2!DN8oWD8$^nc{M^8i|N#ZZqei+sG_Nh2u>M|rgI#!s-Sa`L-)
z+bvJ5flQ56%`o@3pjX5V$1qvCT-K;M?P6Q2rzd3<&pv<kA4P$#j-2~cZ5%|EH$dpY
zzzx0eA0VPw0hVoN@#dRfw?#Q<g{qd-Wqyfsc>3jrr<i{Sm7R-x<|X#(vE@QlNpa4Z
zYtkk!+Z{ynOuCl4bi|Q0oAr6;ySd?4=6@mN-r?)xi8m9ZUs}y6A(bfi4cLf<G4@@j
zE_A|@w7^+-4}*5F?P-d&tR#_3`1U?o5zemkh<HaAkiD`>SYjP35dgX(>ErXW%x~a}
zzJ0m<@6PxD!8u=_K{NI?%j_;0WO=J@nGW^C`zhS!I}JAtX1&v<Ntl_L)R&fZ=dnCy
z1f?+hC1QR&l%I;xGrd5XjPW3$X-mTxI~9d5`u_AiQVgyKp49{#9(4XWM)_=Q<Jm>A
zMd;Dn`qNoUf13Q!C<GU5jU^yii8&BsECDu=a})skBmH;#J8|+c`*E$h0ln+{k+kII
znbfa*$y)f8E>rp8QRi-7A+`mGwD8fHGJdUBJC8|>7kq~a!!L*YnuNx_8`?{~0;ADX
zH@Y%4`4*sQSp?X82jF05)j$($3V;s*v`cJKOd%b9r3nUQr)ie2OhGz-Mhw#n{?U>e
zZ{V>P{&ofYZzK^TAvGW+33ujKdxltCc>mS3LRq$OkL>l<F?dhgMR+C?A>nq5^W4m-
zw14^K#$CB$CBV2jDDKgorgUgAr{<`Q`%=BGmofru({kT^Y!>vfo{2GIH}+8j-xtSQ
ziBm8ymDGLn5l1EB$^IlsHVX1hZ}9ip#;&G0Ho)2}-^393JaP!OJh^RM@tnk9RhXN<
z{D76qvTFHqD6Npasbw<}!@W;{Sbda@=0B^}eh>JES4|a)2z>gWy;}gZG=Gd`HKkM`
zbmsi)*(fN2EVFl>%zs3t@DiVt#QpmRI?P%&%DiM>_p`g~2@S`<)$%(_wN@oL&Z-dn
z_Ev`jp@m%pM3l>27sdE1D|Q@%*goX6`F@?Y4I_=?4`|g-tS{Dx?#@R*UUQ(WiWkX7
z@tOnBgwn6_dti7P&gMv8suBwyAVvLxk^zSXfd6v12r@LveKa^Z)qkv*_4!{&9za+U
zQJ4SHnwS{dWMN)397cKbpFU@eNU}uz??fzmSI*n0@H4v8k&qIoU;#LtMgfkNH-|oU
zl%joEB~znwBmf5P+<WY%x_CNtsO&PdOWJ`B#cJ*5>lNoT5}~*D>BYs~-L$3@osa|L
zh~Yn?1(_34F(N@rk58#cC6WB=PtR!4&@SRi2Dil*-Bva9YbOQ&FYDdSyD-sKFFgBp
zS4d<sbe@5x8D1;s&UC5=YteMW4aiu%4_IOknW7#DKEbby=(>r8T8qGDn>zhRa!8mY
zW#6pX^k-7`r%nMS&!)<s+yN>SPo=_nXwH+YCk_KrFg4$Ci+tfn+(u8nY3I4SQzKCp
z(=;3!2aKGQ@hg`p?0|YWjW`!*Bpb~pI2ZKVYZk1{cb5dw3l$Fr32~|gMW3#!1oIvX
zJFWgTj6-uo$9>IiAz5_oRPN|u!)VI&!_BpRtr8GbTO{e`7a~O6%V^Kv30N6=D(}T0
zFn;k3B=&GYP*)Lv+(j43g<JE@y4yuFB<q1GY6;}|JQr+c0e%UjnS^FfV%&aKq^xS>
z-MyY|pP`Xo7YIdB>C#A)Im}B|IDv_DzZG|Hw1dCcfS0sw6jACchg@oaXfnz)SH`kj
z{o<T>2}*WkrfdZTCN$Fnfqn#1n@Kr=;b$4Hx9zy3w#hJ!9SPI7ewn9TD7*V=`TE=$
zhYo#zU!v)}7CH0x0fz^y6<?gJER`9R(Fo@-(CYO-Xb-&*jGx$Qv@`vyQF@4-AlxjH
zhB%bEO4#?@L&7*jc2>iSMEmH*02!wu-~lS*;m&dhkgkh%3%w2{kPtSw{`@Qz;{1dr
z=)!ktBws9soc*}jzV=ghGaj2OC%a4+)x<bYq#F4HC1+t8=*o7g+IGra=tOFWAz?tc
z)jjk|t}D41d*F+T?&=`JhBWO5fz)YGk#23v3PSTJGqg+>ye0+#r6ElBLSe<9Wm6~4
z%nO10{ew9mBd>{n!thR)Z>&$Zsp{^fp)M0y8hY9bj5SjmgY`zC8G;vcwO6)Vw&xKF
zDAUu>zY>Vu{i*x^Ez?GhAcYVQzY;Q$0d#tV5-3~y+JtI(+Ku6r$=AVA7o4oS&Mxit
zIe12gF5s&WbTaY;tuqV9UqyMvn?TywY@hkSV;0g=FGk~gc|&<mYgAYdxU9`#N<=r7
znoyAN<z%*LMg#jvNl%0Mi0U21s95KTQx0Hcsw3HYx`Ylc^OF(0#<r-3+%L1eMxj=a
z?N%Nbf!KORE9>)19{gOC{0i{SF7(ix8FI;b7kq1bN|2HPMT%YYuL3Jn`L_GN+bM-u
zJoly|a5f0Nev;WtT!z$7CxYwVxQM)v4HV1}#nb4tOm}YwCY=az%zN(w-+jbc8u@I*
zX(xSOtj!y+BPuTEIUykn2y&tj7<9UFFR;m@B@Z+@G~cfPJVvgpgk?H8dq$Gh>_8_C
zIWha&3$Dwy1+X8(y+rI6GRp2qY}5OPNO~Gm|Eo)N^C!XR&cu7$uN&)lY!;j4^~Q^P
zkO78nAeEhu9WERUvWXFL*oQ8Ms-WV2#cRW+#=>&mAyVRv*(&miyKjJWcm1X?FjUKh
z!0~BAk>6V~Q-;-X8m106>H}(J347L?bBe)|D{BoFZi8iDvwE(IF4PickYEn+YZeap
z(Ry9CHgoEK>p2a?uYz}$Uw}`nH`EOtg;2a5x-tSz2y1;ngpJiFoy+{iD;Vn_80bt~
zw$&zWv>$JN$79r7z3D<KeMk;Vt-3;i9*ttgJTvhbe=0B1xi)DiY9m-a7ja=#CI~7T
zR5=@K&8|v~R1<}gHQ?~8nD@CZ*g>4O1rYG20)_{pH8>-&LmSQ_)fK_7#u4U_DD}VQ
zx=2cRnR+vxr0{9IkVoHqM~Vb{7C#H>BlPDC?sr25*esXcKSFp=s~__1NVF`wHK7kU
zN?ShDj_kZ!!1SL%xI>7SPBv2-n}4PxC!?7~O-jLF`4;a%cOEjpu(u046HhS<j(sw#
zPEBMi-n+RnEnLSr721K={lUms0k*p!ixy^ux*=Wd1!}A|@Fu7hGAHW*DLk8^#LQKb
zj1*HfM_o=6k1uz(qqJ!QR)uWG6x{6;RL17l7Wy0_4I_bF9B#$kr&H=I;A`8RXY|y5
zaqM$KF9}ODg-<dyH}D_|O@JWQ<tBrt@6M7h>$<qow;@7IWD+G}iy@i~Ji_zcA!&OT
zq4hapTll{l00D6iajNhw%IW!%bhFdeN{jl$qV#so!hJ<kBVUTn%7^ysO&^o?4D~Kv
z%^aBISiqF8w;??w72hAGc>2DNs0#z-5pUx%5@DFTTbajrlF6TLzi8_zwG2wX^S+nU
zsVH>H?iHCpQ)DQbG@~(2RP@jbzFa2sY?nz^kr}%4y;**nN)Csz?u|oyA~$o5g$4u8
zdtHAB6q4wi?|8d*7hdHoI&S6y@AK>Jb?A#he^I&1Jpu`6J55zl*XJzV^6F1nQ!p1L
z;egS0AY|q;u^mV}r75P?4v@Q*rbVe;^NWm&TegZv@bDyJwx52P?Mpi%mhEP}Bh@m#
zv1ztPN-K<Wtz8{cKP7pg))PbY3>zYcc{}uWx!b+BZoZ%0iC=ldYTlFRsC2po(&~ii
zW+Ut%`?<j5zba(R;&g?z9sJf_N2CkbS^`P|cYZpt<f0Cdflb?JninNK4HZ45wf3IY
zVln+(*!iV1+Qr-)#F<yPoh>2yH%|z`=#ls5hb_D}^e?~i$i{z%xRI4{d3Oz84FQ5}
zk%AR*uFC1ZoU1QS@}E2V=*`YPD$^yaYg9S@Co~f;YX~Pu1=}AH=kH5}(CVuIvj-t6
z`I7miQ1Z33vt%kP7MgXVjhNI4b)hv^mUvMMc6T-Gv{jUOv5`h;+`aD)u#g^hEk|m7
z`(A&hM0fprxKXkr%+P2rO!p#Bcn<U`EVS{uPWqzd1;-Qf<|e}HIZIBPm3j^P9yu(a
zB(~^BYi@Z^_nuW(k-F#BbdtE$4^eRQ-wK{!$j|a`r4aHt1;@=uN#?Ffo%)`PvyhRv
zaXA_8IxSrR>hqeiKz%3)F>n;CrmLysuciNhBF++Aq?~4)(Ywb?7q#L<T$_0}fTnE@
z@ljq=H^w8I4RpFlv+SNz;uoYHh$IwK*;V^O=6H%Mfk9CMN&RKH7oP+A+*ZuOTggM{
zOMM{~Yz(9mXx1F;0W0~sK9}Wwx!p*dX$(4_Qtd!aUNTycGw{E{d7RLP$2oiYQ6O(u
z%9H#Yp=~=;IFEFOr+z!i0O9;U0xj=oHXUWhf>uSN!>>-x<%t&Q9E^^OnSnOSH&HK5
za>)z`A6+k0b)1q)fJt`@3!!}+N)Sr*a1*AMlrn_(-3^nHE&H;};kxE)W-Q}<5RRtu
zTG*&9(YM%z`T$Ysg=qn1|6a)Er(sm=VMcvE*PV~g^RB<t%r_oJm`t@VV6f}j9xdQj
ze?dx$TnjrINYky`)+&9r9qzM-aJX$pe;w}Cq=LId+eEM<T~rX>Jlu2#qPDM}k1VNp
zYPhFenSFf@ZvZfx5{R-G(WDZXEbW=Y=rX8>H%T<7lx4m7{!pmjV^=e>BS&c2nFGnp
z_Qz<Ge0sOaU4tQ*erY*Xt*O-VJJ(MI#f@|5EpZ4&HijeypsI;eH01V85$9{npciJe
zlBxdsJ&$=0znQDDDx4t^`O#?pE4Io_72Es!Vs=PB&iQvE5p}NSkD)G!X|qN#>Up4i
z_p)O4LKV5FE$KehJ6F<Jj&kQOKau1(DrlRs0_BNm$&m0&PtofrK|5oEje#ovlD@TR
zhY&lB6mu~(yVE*vI@Z1gyI-TVQ}14t5&sH73qx=7@hl4JhV@s*q0q37;%9qZSr!9H
z-wlN0ZwH++X`vAyqc}iciUd;*V|3<FIFN-a-~DAg%-FONF|op8FS_8ZXZQ|DWE+3?
z?#?=U+3alOY&%4rGn;#C=)28h=?B5{vl(P9Mm#3AT~IB(%4|Zv1Rq4Gj%50&C^qK)
zG_POAbWRZiO<!+IbA#K)FDUTz+fpA-BbDs#J%=bnFLzl3XQ~H!?qBzbEcWM_DXV{j
zT)c<_4R?Wk0vBBr$oB<K3q>u%%!L$2aup^~l7UBt-B!B$x^8kIB(x}QBSiykJAgM-
zRUZ#-jiT{~kj`1r@6MSd+`I6{1a{=_N@l4fV|Qb=aa&sTXR}e5E9yd<X{Mf6Im!42
z>Xsr%#x74F%wD0d_nD7jzpL|4q$Ko!Hd1xk!LS!fK28MAll6vJ2U{#8AT6~u7yb5F
z)rX%cXnXJjAx~*re>kz(QRx1my#xx+;#UAW(=7OKGHOUuwoq5G9C(K=<`6CSE`(%7
zuNgriZ4Jc3Sykl{DA2onZfrZ4%g8y({XR!ZK`*60p5tYTO>aY7pxzLD6Y1$6IolC;
zQa*Na{)>x+yK<wo;wM|6>7oEVF{)Wda1eysY2f-w!NMTf$2alweTW+$@+d9r?!MSn
z*-q!{&2wcI()4CYNwh2X4A8lejHEoR`L=6E^nr73Q0~QeVL~Hl&ge{XS6ba$hDgJl
zZ~*Jp0S;-fM8LH_rgg?hXr#!?!!lN3(r>GZ=CeT}z*G4v5zv@ACKt5z$2&W$2d-@<
z0$#n>-k~5D+-FU7^4k6Ad4yDsl+l~6H2&@@kJ$*r*uw#Duoz@qln779T^p4v;wVd6
z53eu5KJaXhBqi1qYKsL46uGS}7XhTwsUkH3*npL=^UwPk>5~$_8rsbM!fQWUrfZpl
z0}z)3On3~;59IYi7KsJc=K&N(`U9wpS)r*fbi_+C(Oq>k>B0bpnn|#2twcPJ5sz)G
zndat>kP-s;n@w_dd;Pv6;i=Qy+-Gj7H%!h<AuLtt6^o)_8ccyjUv04#8AM850OY2D
zy%uo835tBU^3sthmlIP7^EK0GXj$g<imXhYFKFQHPRz_2_sEV>U?2dBam+LjX3@$6
zT1+~=PU+`Q_!e6f4(xV-4x?&X*QT@DSYHUa)s<&7I5Z)TbT(*Bvpu1dU?<2#A22?~
zsKqKXu@$QHj68ri8U0_K2if_*?EdIT-~HW#a&*x2Z2GxSzR{}<BcdT1o7fCE^zZ}A
zfs<n#$ETu<2nKR))fDSOIsN7H21n!bvsL3gOLC-#*-a<qVZ_uLfqr4ga9)*YIMHJ^
zAESfiESb#Bb0y2U37pbtusE~CG^G0jp7nCOvi-o5tDIK5cJH}Q_X-<}0C2EL16Q;!
zaAPsDu@?k#>%Y}7%mA{IQ!B_}JJI@~AzI*kZW$cFG(?@?jPyo)yn%@^tJ7P<;DM_E
zPzuKVO7Y%J>}~Y^lm515Y&HscT>RVgrjQv?p>NexEsb0duaKHPIa6Na1-Tf^(mzL^
zQWA4)h~$xDZsXL*W3~PWl}P_l=dl;H#n;GwXLwyBFd){d4Y-OCHveWvw*E9^Qo*J$
zNByJ6te}@hUA5L13Y(JQ`f#bVJo3lP?Cd%5v-2RQC-&8l%1?10vlV$Nxv@5U#ytX^
zUfJ!>;O5x13{AIAZN~v$Bdjjew+?Udh(L$xNbxI`uMZyD>RwsV9vd6BD(zY?5WWeg
zeU_!j)*o**03<Pvzw>v78zGcVoX>W*8=%cR3hZVYw$$W4LU&n>!8sO^ICF5aMwtx<
zDB6Q$68eqT;MRlvRaspl@-hiTCNAjf_n%5~ihyhGfeLLc?R*&Ak?<9aaR?d;!2v6a
zw9u#v=Y5hRxx5D4|J7cv?+6AsJ5Ytd)xFSJ7~&Spl3Z-ywu4EB4on~F(;V!3jJL<~
zqPv}j`shS^W>gfv)lCCU^yhFuxv}WZJ5jak8e<TNXhq%NjarbWp%+Pe*&iJ|V-Lb|
zx~BvvGJl9~=vIHFa1+T9U;hqGIdTaCTYtRG!^026sQ(U4Uo(}C_#0LCmak1&7zGL-
z?J79nVW@>m^UO4Ip!W&LEJHE~;gu=gz;C!>DjSKS#3v0&YbL7N%Qx0$<nRU-6BT|y
z7cgsa!g2{IbD?H70Y?SxvO9Y+yF{SJO%l|0_brf^?cm-E8)G1teqf2Sg`&vRARG>7
zHzaXM_$B`I_Rk^zTtB|jA}7?KOC84GG(?$989vwohczAx{nmovFwOUTg!Rbu|4J3Z
zdOy(fJM*TB$+_`uUX7<D1X(v-_;Ic4j&=*QhNcg2HFAHDPvDaWqa(Hg-Yu^gK$k|x
zGq&oB=YGVmMBe%3S4iyXWdB$qrZH|NFVyBy%>tLibpu7xXHD)Yj?DwXh`jO*v_1Cl
zBCV)HcB<l?;Hhf>`>1(W{^Ivt0Ivys@>`(F@ba*7^iXw#9K8qTGUyNQRUIw<`jEW`
z#5Xgw)c3No_=qt7DMw==tf2e%r*R!O`9(*b-|7LXJB2{FL=~V3cF@3m&|*jD*zYM`
z*tSpckP6-x=szR|?$2=LPMZ#qIvR0D(6axnUiIyCDH~rCI6+5uWi^#}zLxuMYv>)K
zX$7ne3bUwN!vPa}-VJ4TC3?KdXzAxf8@t(%K7Fz)&r3^~vC53hTY|=64?u3u?Pa^J
zkKTwo)xp6R)oO@@F~eA=SDDrkl4iik*nfSyU}+G+-u*3D2S(ZLwfT-v#P)aQd%`@t
zxo0j+)7;8^4Xb;eR}N1rkZ}can-U13C;ToA5{;4)W4)DpJ)TM?<ri}wGY1^pi_sd*
z^&Ob<Uh|z+5hL!)Epa`<3q4QK>UbFMeS)mSn~gH@Luv^J7H0bTdhNT-DpD$ph>}!T
zSu^6N;h&?tU3Zz2DW-r2e>A|0u20twN;D@8>80P!eCFusa_9~s0HSmc8s;tZZVZ}2
zF=%TA^*mW+g$$mha)$k8x&<Y_?1kWR#RRJKrd(N4T9|U^l8rcb;+Drf<hmD_7!5JT
zp<Q|Ir$)qO_)A<5?2k75Q4iTpZR+6(i-_iKR~QqU2A^by<X1_w$&V+Y<2<PY69u(7
zMfjCnPQdn>26&<I$o`-kk=b0P9bC!%79uU+?~s0fSQDxur5M4Wql8`TDJU9g3>uRw
zp(kAAO)kQ3hIzzUT-ytjBJllRGYh_0lgb!I0vtB%_9LpV5O8?b7EX0c`pkjlw%YO~
zx$h#7$o%LPHWMX$5(iy(ZZfdB8~=aVoRC3Vnlef?OUHb1cEE{m8me%cg+BLkrN{F~
zARa2bhhHfu#t;pd%iJ{Nhrx7lCNJ0qRN6YBeWYj5uQg|~0@>ohpv4t<FHbQrl5PkF
zq>D{La2^d37<pc;gv@eH`%uZjDZ}`%o=;zO;6{n!N;GU`8obs=v}PA?Am=Ld2aqg`
z%}f(TJz){ZT6*{MORW+~G_*Uqdo8Q>n!j$~eUyQLP|m$yWosG@U@hQsvaf%&{RxDE
zPW}NB`3qn9?<||NKz97-%j-ToX;U8~&Y$Pa1s5<4Td+qU3=^2s1yuTBHxvcORz_(l
z(B8IXFE08Q1Glj=t=b8&CT~jD4S*zz0m?c){nTU_jHMaB;oB|SK%_cuSu)jt@$wRA
zta{rUbAQ!(ik|}`a7{-lq0^rU8on8*5{sEG`V~Tbaz2-{#Y@Deow(7V$I8DY|8`Wd
z{nSJwAl!OG18}K}VK)z!H*kFwbdqo_bV}#?i6evnN?F(w(OHVU7bGDzOw`}CHNAQE
z7-<3=-)sWRF~M8K3a)Cub7!lJHEOd~!W3F1SVruCUAJdH3e)(2n%g|0ai`Uh^!D4^
zb0=#3c<nXbyPw{6$`@XYpgB!Y`c1L{;mmkpl{jx;3~jU{!_2<dqfrM&_bM{<ul2EL
zBz0737`MQcHC~@4pbs?wZ47o~L=H)A3t@Pr2)r*>A*Jz4BhuJ11Y-l%6ao_2Xtc8y
z2s%I}@5PvFUOXWO71}1Q*kWh=1%_@AWWNY_H@iLC>Fqn1u&0n4CUjh;cnb6?@E4$f
zEk<%Dgs%d3&0HX+X1`wo)q`PX6)&4(Mu<-vjdnNiou=pe+}*piQj5Cg0H-U4>R`7U
zDPw^NhI6(X@@;JtHm&u8q7ZiY$Bg?%w=1-zDg^A@WHn85e7k|J;q7wy)wOMTftWVM
z>;_3iT_pPf(;v$e6zk^W3+C|hRQ+)D;)nO<-g_f`>ksU3(%b&&X?<|<TTSS6Nm6}P
z{oUro9FuQP11mqB2Cl*@12O`it7wzEhqj(FVg^Ykpb*QiLkck`?Y+d<NISFTC6PJu
zo9v3ByyIjAQEN@|rXd15Kelz{3iJ57?yp-jbxH-_1kEXVCz(E5{>&K9TWeGlkVva@
zNy3xThe|=sce{$fch4b7bg}WKme~n2W?;2Son<FzfAmQSy0^%>Jz2(H#9nUC*_knI
zd(N|jw{@ZEy#-gpBqLFuy)l|u50qGe*5Z9%HkFgh%QAI-&(u!G9bb)bBJXTM@mY`X
z^h<O$j)ZfrR6q-fck%`FAd17H%=WK)s}*|wS<5Bymop5%VXpQR+ij3&_9n{QT6j7_
z>z6<TT$O{8<n4s#yevB)pWPaVHxuGA#OGivZj&{1y(uH`q28w=-4Pd=f$3P2H$JYv
z(*CAA@Z29oK7qd+JsQ<oTVbNI(Z_ho_;qCkDGByG#To?#pht@3;YJKNpT8l2)GXD1
zA2m7g3TCM)IK2m?cg*XE%pywzpM67Q=0WwQKkvB?9~y~rdxLT>oU_jE>dsJCDj3);
z+frE(z^GMMy3~i}k#@~izP{X$=(|-(HV;vu8-HDtNlo3x*UL;Nd{^c7g)Ak^@)|jN
z&qPPTSbiVa#VD^@xsmagYG~z2r$5J$+!i#!^T~d-5_|0ln;@R)8tQb#A8kfvnrG%P
zRD4~QYg}}uP%}tDsM9)80R4v#b|iao)PNgl1-7eq;=kt2N(VK#qn+%YS^R~;O)KKi
ze$ED+L}i>EY|%wAb39*fzMgn>4SuzX{^I@n!YU8ya_-~e{gM)40+py^Y4Q7Oo@3TU
zK*=hav6<hg1b=xx^YF^yRqw3K<;}w4>1&s3r#IL&u&bb~K*Hya;&33hMXgR!Zj<)b
z%)Sg69sSPS(%KC(e!Kze8F)Y4HuFF}(?+Af*nW~-Q@VY`PJl7P1Y@@>TC7ttZ--r{
zS|#CJ6X4v=`Pm}lO=ayNIKpQ>w0SPad;JE+ig+KQ0_n6k6Glf&<i+@PPtD^blAeO>
z@r)U=Drn1$2CTD~8fHefq;CF}{y;u>)wc9@!3NAJvDLT@oAaW7-liED_uY=SJjNZL
zc+6XCGckEqT&jQZE3p=$e7%R|#R}0g5{<Y!&gaytP~)kti`3*&L0oB&ZaJaPpiOsE
zM&8Hm-R`Y21;Ih{JCHPEUQNKry!&cWudgW)-hhO$;z1l+dY0tDV4I&iGIy3SW8crc
zrs~+qn)W4|(1<^3Y!^-TXOFcahJ7k4t7iGVUm^uXfdTy_Ne8ETW~Id=t4^y>X@66;
z+b47I9@*;$S+89q{@7wkI^OT^v6kC)w?3)$i$sC1hvkdQspQ*`DMSbB<lahT85f4~
zWX<5|_c3d#cmLVU6!*_wd>c{sKc86v&m<w1D*3FnnlFQ0oqD#lU%Nx6{_^ainB7%j
zzn*A^&g5(aR_Z&Q;Yb|W#Vg{weQK+VJnv<BN7AP54Us0!uWWg+XBSn9g=c>uH{L)Y
zaXpUdD$Ee9W~ajvF(us|WRhDxh$EtjfWPnt1Y1J2h;a`7hBD$rztj=<q^Et@4lUpq
zUOopj=g}@6KX8ssEE6HC?#%(1L}P~L$QG}H^ANz#E(64(>@&!Pqa`UqNEe)1J;KAX
zcU%{>9fjQCZ&EB^as;axY*UIOna2n!YnBa*;Xb)7H^yDevj-rVbK|U$4{(0Q!var<
zsQ}5CG)6`K>G1Igj8!~5EE|>;x1(!_7@m0|ndc35Xe)UKB|N}c>o!q6fGts}tKqI?
zP6o*=?!Z$}@(zDt9^x!^%X3>fK)iP8qD4n=<?Dq2ohhI*s(4Q>{z>=n2(C!LmSk*q
z1@4f$80b3E(&*B=4IJQ3=4e_Rb=&&jctO}xdO}UkmKFZ(q!d_?tmP4+GlHM<wFq!j
zbBixiI0H>3OuhN&OPq6fdk_}W4l0v<=F)Z+$j*hwM?>2#T*=}y?gUs0B@jl^tr7WB
z8na#glPyuOdV$IuW3(Z~5ihG5@{~}3U$nYhC9zw@fcwOAWKap4R?*-*C4~hsf?*9X
z0^#v{oK$}jZ;Cf!1bWHVGPvRuKsYe0$d;m+TyQLQn+81#f-N<VlWBNu`)}j`@{c1{
zfcOWK)bsote>x-&v3xis)u_j$I6IH;K~fVeVv^P~%Ks44w=BO^7xZ_oV5Z0#M>LDN
zuqTtxu$UrYobT8s;yPu}-lBQBDICA(=|uvriW(7bg<~r5pQI}mUkl=Ww5M?#=gZ=M
zBFY<vc&hO^Dvq70*tWG$)XKwR+~g*4D+W6?#I7$Phg3!1nDoa&-A)UhLO-L&i5mi~
z5%24QY{{GtH!s_^MOImmZc^u&Jko9djo8XVR^+IgLAsAR@S<^lzEueE@gNzpI+@#B
z4(^v(2O;g^?o7b{=v<!g{#o&)0Ulb|G57!~*y;l3OjZdi!LFI%;ppVn?^Hm;Lh8}j
zyZkt+dEg2NH?0YtLY8z@c<YC@Io-`4Aj}3WQ>#XQoG&|pgaMw9@RX~lsJj$6-?GI^
zd5FcrVt)AC<ipY2l#<QJh8$7vlm%)Jj_|h#Hw6n%!8()MxZ<q&u@Y>l3o!tj+?;J4
zj;+hs+=JKy;9+ro4tk-E^Av>(h-(Ny{L}^a#y=*Ij0$R?FTQh$xRf8(i|~~6apWm}
z^fFIz9P>6Cz=x;w5aX_72K>TlVnqKJ3JCwg`T3TE66-|v(~U|P!1*l&R%9h2@D$Ex
zoO3vm*mk4`0FkuJc_)BdPCko9A~hHClp^z&;yB;3Wi5Z<JHcWasUG%jIkvyUP5d-c
z3aj3Q;AmG+UUUve6ShR9cof6{6ju1-9FF0O$-$OPq+l_PAKvf#^IA@@L0Wc6$nOsB
zQ@$Zy>O7)#-&O^v{;a$D;JgpEKkdTZ(jLTlztV)K9JW6$i{nwZ=`u0ISQ}=XGY~69
z!Zc$Bc!e*0G=JgzeCrwA1|EH(X-SYDj_(kAf$V1)d5S`D>mLzHMg>z)xpy?9|1idF
zjd-Xk<S9eN4|d~7ZR=WyhoBG6FVAX^TM`x{RCVnaNCMuwK2nDxwk`VaSq$Ucg{TEC
z46c6>K!i&V?vkH{R_Kp%A%2zuVS4}6^P9XTz@0_GElqMikV!kZ(<tkC@|m$BphzKI
z#q{{bxQ*3O6pTs}X2#W>BRj2@{T47-_KpEV(Upj9gQv3RX0$$V{4_aH(NQ{vU%a4u
z@7raV6}g5<xz3Eqxg~{+cNW17(FaO7qO-q4J8Uf<W(Le0`w<4y5$?MboT|z3&dTMo
z@KhV%^<-Zj*<kljGU_3POQ39l<Vo^Hblmj@Q}TFAatX|V7s0JP#ehADI;zm*x=kSA
zlJwU=9(b3>Nq;1}AjK7UXWEGq_Kllp3z6n)q#yh~n8D)FZ649#XG#dJ#gMmzpa+1v
z8YXp%S`SGt0RN6(AlmBvVM4M8%Ee5#?cXA8csb#@*7!CUGD;|!tt2C}Csdxo@b%qm
z*$ejx!TpPkG4KS!y&MN8zow*25*~G1)OYy$faR68zYbNY^V}89riaZ`V}QU?OryhG
zf$(n*lUjN2j2lE3`*#%pvgm6^=QI>D4RgHv!cVQL{*~NZNOd4c^}gy;!a>ru+^2Ga
zAB2B?x+rc3S9un916V+&%(LmV2&rb{ToHH5rNj2;gn~5}NkP5CyT-XSvL(rb<VlIy
z88!bNTRY;3W_#-8Bs5)k%kr+WccT3lxOwwqzD3^`8t?v}Kq@`NsZ@KqpU8)3&!K+K
z;<1+>g;cGtDlg9gQ$HBt<@F--kFSwAX$0WN8j9$o_ngEhJIHAZEXJV8)->gGMm;{b
zs=HvWT~i9(_RbeL8x;sLHIQUhJpKxq(jW^zPrVNGutK=q-!F<>WKj>Hn^+b-_q8U4
zN$fdbXb2G+i>@!;DgY`yQ9=%zX%Q@wzt?@3pOS(zP=}dO>&TiIJ7Deeh{@Baf%BP~
zBQpH6^GS&XxlAmDu6<sQQ&449OCT{(<S%@lKs*Dq3S>@7`8yqq!eC*9%hFWYD{)<B
zbMOZMHOo**DiOflt8SA<5MJS6%n*g)@UL(cw6`Q&a?xoHl<9~w@%v2GOP%vepf~T$
zJ`O}nipQv3;i2F50~B_f&*{5C!8;mFp9EFIo+3ZqJ#_q^Vt|GzK83LDU4}xWkm1K(
zxQSOAW|K|EGLn?1;Eg`R({Fw>N+*nbjGzkWp;sU0U{!bnD2a<nbO~G*-@BKuheBO7
z!xtIGB0KHA{v)op&}uL@_pVPnl^j14RwT4{5pK*w7^1%Z2=0iwo*+43%|r@G&kMCR
zLCDAZvTqotSj>=Ic^6~<tQ;u-PasORzE(&5M|U%aq|mNYORaV*2}HVfZORq7_?5s@
zBEIoZ;9+*-3SfYVbAG-;X5Nxl0_2$`11u5NMRsv9p1yK3@Ov1C5Q^w-&lJG&-pPNk
z_7Y1a^l7_9IBXkd0pOK+?PDf$faIm`I`yh2T`vT#I+fOA{3yd{E6LuXLLYWOdu)1O
zu+f|HMmUFNShiF{)<jFPyrsqXHMqllFMc$Sdwa9sMMbei;5gfY4(h-6(}5wbX_z7n
zHf4ePAnu<YTlj7PFybs3c}O4$S*go{J=mK=WmsBf@y7Z}j9YnEV!u9&(wgQl!dyO~
zeun)Cs8(gw&QZ4(ED)U7C4aF_2g%SWkgQ<Ed>H?aUfvlATwm-<ZPv#s<_D4`r1N<m
zS}Lm2*|lDu1|k;;Zz)&|!VSIF#i6Bo-@{Vvu<sR;XE((P6%Q&9*~h|-uL#uQ%?@3z
z0fcQSr%UnaAdxXU<D_W9&lCQ_^BoEMdSpUNd=fn@;Tp$Yz>@Z}YZRErbi?(Wz3?i+
zW8KiP;;-~Y=oBB$iy(8!My(SF2NIc!-hZ?`r5(^Blhwy;XV^bxDip{P_{hGThRZcD
zF(R3uBNK8>Rwwc~^fq)e>=BbQTOb|%Bf*OzB@Ik2tuA!Q3P>&8CziSq<%sEvTNx0-
zuPnPZj)X_IxNFh;pXp&5Lj2+c%+7|FuO_)5Z%#PLn87#-N~^lUClR9g_yC0p)fb>R
zZ&K6R-#{Rne!GkOnkF=51FI1}tR0MxAV_!aw~e*(je`MWCJBpdwwaU};5$q)r7jM9
z&Oh%0oHtl|woN_zb8+TA{K}Kp7vS0gtXy0>oTy#$XyFs+T0;9mA8B9ovPa`y*0A-A
z<I^A)PiIpdsp%Z6fT^xfB}RUc&Uqk}2>SY%n54;xbx8hbWep{jxobNF(W4kRE^V84
zG60`l_Du%he4l~jRmTIEII+fwDP%@|0jO)mFgaB13IuR-pi0;R;a8I@@)lh2_H>_&
zX7Y801{J1aAeL5UY85q?0#9}t;(784aw`FhQ%|-MA;Wc!Z{`ofG=~c?BV!~qfHL+-
zXfnIXi`Pf!HtT7v!cP$9l%^4WFI?Fns~2yBmB;YGHJnw~Ket)mVEusri!cQox&oA?
zqj|`SAg0OP7cXZ2fD0gdE+5oBApA+wd8TwhLNsu_7(7x5tb@If#-bowtu5pQazjDc
z>i7EiSl!jH2Pvh}wHo0D^*xe8%H?Q)49Bic#f=}$xwTf*%LlZ=%x++YddU`x4kd}K
z#ceFb#l!og1>T!wSL|MYVKfZ6ifBdYixqnqDnv-}4)lVymT+}(;^yqle4LO2Dhj3;
zU64s3otDT(;NW0jp1`sXxdua=e&C^x7YYJ#A31s~R`IPRz^39Wc6*&UQ;;dBnb{*$
zX(TF{YB`m%aU#MgGr$+yE6LY3_P)5!R-Q#xCX1x^HT+)IO20R`*UA)N%6oO95WX@(
z^T20l<AJOyyUsML*D_g6oS9>Shr^;2)f!BiGf@-kzs}SpKY}nxs%BqFL^;deZI-Tt
zFgZ{DK@DZ<u6g;$3)O|^Cj(I^%G-laW1WyU0SNkcQ85g3=rB8*8*yt8>LE<A{=+|E
z{X}cXFt%fU$nZ710T?WJ+k5XvLx^jB{4%_5;t5&=Mo};?MqkG2lHSDHrHga{r=|x+
zRL2e&f8>Gd`>TN+bo!8)YS!W2VCQMz+0@fp*D~pgrXAH@f!T-WYDuxK%Mw2LpMY^l
ztTh*@D!jb5KhAch>%4gPPeC_8bO%dLaEbzxZ<9k}wn^&e)^$&qzSZjuN#3lg|Lxv0
zNY>Kg=DhC=Fu?65T2EzvvOxp;d7$hZ0}L;<n3zGRGzUuJ0Gig~&DlMSFjmqo*Tmx<
zdBG`n1&EUL7k1emm0i|O8m*CGi5WWGG0C8$&axzmOwdCVtgz8(GMP)ASSVeyS-dUW
z{ZmLySEM;O_O<aKP@v-GBQdUM7$#lzS1r;?F-%yNdcRDcQ1&^TY6vU3aGpnTM)Roq
z>bJLYP1?c-Z3CTyYOgo(%F+bX-;i&178acoRNfd{$Xb?|v&Xh`I8OE1VYDmsi^<PN
zsLVx-6-Z%{Fu`scV<MOtu~PXK-4C@tyV}3`I=Ux2PgJ_#Yx~R2mt4v+6W%pfc4IAV
z<z&mjTWMXvGBcNduC}|-t%-D-zHaa`L{Bqpl%{`~5rr(T!p1Nmke4*JW_g2nqv#HX
zDo%CY)o9f*3>)ULG5I=oq&V3Om0K45dUYkV;+;k3@`jsxJI7uW?mbr9yiyP01YD=V
z(0}#>aU#ACbt*02;&pW;w&PUmcLj_XGSAFEBUSV@lO=StjuoN)M7kjF+M#O&9@oDf
zFwta*RB9k)T)F9*`dHiXTJt`>UR$NY-mI1hS;87NMe&D;7n!k&;+fg8z@W?c3WU6r
z*`_H>%<_+K6*;MT7MFqUQ8l>gdPC~fDIU_>l4K?h#?>FL`4eH`jTS#1wn~RR7*#2e
z=O6H~)MR6fR>L4KOtFF)TK|=$Db*q<TOQcEm5<mkbbPR(4=1I&!>#IKyK!0*{V}ax
zu%HZ?+G4YfNqwyH)$Wy-8g=eR?(s5N!nFOt%27ZPD|`sY&uLxQ{*Gg?9tmbc&l7!#
zjyf`CNKNs>_g4)&x~BFUDpFIY>fL?^L&5vsy#HF$ksF}MRFpTkh5?EcGn*pQM&1vY
zrkOIrX6U%bsyO*kr^ajfZbW~>DhN<7W_-eOiX`DDsdtB9=M3hQlgg($ZgBCLUS#9G
zozDEDwf6OZh_i4ti%Xy__|0R~_Nn~9Z>(CgTPr?jBb&<QJap)MtBp$2QTHpZ6-<Mr
zA*94BC4R#<EV;2J5~C$BZcw@Ql+-yhUAUds{R>=snm1P*4E_NNLo>I#%G|VzMF*AG
z-X0N<T+l32TK#g3(28BrGw~id`NCB~X?8{3{`+}V76o<Aeo1Aklt-VE?l$c03&PAC
zmo0XWg`D%@4LvTbRaY$Oq1`o$8y_$-O`-xFOHW520YXXp)~-!354Rp9%{|JHg^)R1
zh8ELKADHM&>6=SEV{LHn%wy7zs)=Po&vG6(XI5u5h0QH5=&~GU|B%hZBk1_PFEy3R
z=<>u>;(;P1yn$+sv>(^<NR=x3YwbGbj8KN!Y>XBqk|Vy(?#WlMU^G=SzA@}iVxNvU
ze>f4IxF(k+C%QaySy6W+r4XV@)yn(E)S`enA*~kR{X8uU?#e_PM5Zm5aVxoIWYOX;
zyWSC9j!9=IC6ac<JLXt6A)Mh>GqyoVb1#Q=F_l)eQTdNKEOF~)yp?NL<1EH)I9<Oa
zX?colG>_`dM?80xeC1Shjlk#p&u6ZMD2i-ZG$&7Pa^}N(pN^tVTUU@v4O8vO&yGUX
zkQa5#E!p_){yM;;9qTKYXK_#Q?&qwFqtbzSa6DL~+FpENRPT1^oND|PywikP*4j$V
zPID6T^qFg<AJjTWQYjT$x>Bi0^OiZ$?#+T`SD{v`rW8%auOZ#5?iz_y7e;2YD?D*4
zZ`o??wTurm*E-ovw-WmsiC-eT^*!RFglp)jYBNl#{fYm_*I7nI8Ft~C?v(C95Cl}Z
zTa*wGNkMW1=|;L6rA4F#1O$|l#sH+HyK(4-p=)5~JmdF$Yn}7w_{*hBgn6HLKRfPy
z-I_$@b8=!+fsAl(N#607x*&VoyB2HMsd+V^Taai>)z*YHjFjW;MwsqYfN$)8p6{ZP
zFtR3PuoT1cC$jL>SK&DsQ7N|<n`)D4iX|6;=oC~RF;`KV1g7=g_ExhZ#yK2QtN0Ns
z=C_{-Oyyo%d^Y1o{z?XUSruPtaLVKzmP!vknVj0-dQUaXB_AKDvBN`$LGg=i>C$XQ
zLE-X+(&UwuA8RI)HMez*S9Uzvrs*hnnJ6YbyLb9(%cisfdb`zJ3~B;H+vIciI}7v5
zf`%>;Yq}2}fqu?V*M-Bq(i<W}F3qc3PXkbe8)bVbAjEj8-Bcpf<PCD=L6!UbJfoz(
z6MNY2<4#blxs5&bMNbj+(M=9-{c-9s2+%4z63+wer)&bZTb_S$mcPP;-UPqN;jpXV
zmm>j7^*eHYdv`P^e9bfU*mkxPLQv#vXNm0S>=5OC=l|DaQwRidf0H3UnX#VMv-}@y
z6s)<7`qPsL=<>^Vm%k@{6!=S7f*^WM&tuq6H=_7-g1sc@3GG2_SQ52EfJ`gPAfC-H
z#^pq%MHlj$oSrY@^Wr-!*Gr8c`q6B#Nqpj3t7BRTqn%TMK8wdIRVyI4f_4F^sNCLo
zsXQ)QlXax*2`PpqQCR1IPH=*>PP7~+SYq`rB+KCa`FRU07?wzY^|{+~DOha)EJkv!
z9at(4W&OATOs`0l?du%$e89sLLr2_iGYQAxI*e{3Y&;hLBSNH%(R?zhUj8Nf*vFhF
z>68EMQ=7qX#G^pVsbXK5{+uhS&19s3Z2(BAe*4lqeI_tT{$fk6N=;F2!h1k;Dq`bV
zi$l(h6_e)J_MwubeZj9Fy%sK9(wpQ@b&0ckTJ2G!#It!-rvMM%rY!^TAZGbVISeJv
z<;TT^QxRq!jPcLU%VbV6YaEVtsy#DzPCq(~2JR&ul_Al(^@Hr;Z}zclo4P%HEh?{3
zJ0@3QA$3X|fyUAzI?nZ_Qa4Vgv_cTask|mLCZeIOk8jQ^bLMgpn9z(%#TUQoum7-h
z8nC;eJ|^G?(2Sm9ci3m0$%C3QOsuQLByaC<qjKLA#b7s8Dz+_^D6t$<g>uYVKMXkt
zEKOdz+2b__`y9VZQqla4RjG01;P(dsVU^9vsVQwEhh8(yP3u5zPCCc0dzujxjixv(
z`TdZSRT0^mDMB70`p-s=yX)-=-8B84URE;T8ch^SX^p1Qp9CBf2V}pNH)3+E0I7$!
z>GI|Y+CeAy?IMG9_l(JqwX894l>AeB@a->R)94GVZX$>1#_@ei5F2mpXV@BY^P2He
zMsDlUYO1VB84512hH#sYAHVwTbp$7N?)21_<rM{&{UzoRC=03oSob|`<@dUeLL<e{
zBj9EpkM6@vTh%F5>dysjmlj9O>D^sLNKb6|Z)UGud~9V4HJi$VWo(Q4!@nZ50?RjI
zG$S{=FZ?NUj01~dm41VpvL&Yl@>6i?Uk!TZ@}Rs(4&3E;Gn5vs97O1}u=aXtDV!$(
z#a4y?O&`twx2<}r33>~%+itj~yWy`>Z~jbzr{;97vVU~WZ_p$KHiYx2k7Bigp7HWL
z+liK1?#@hESL2}SIv=WMCRh3kvSPa*-71fDE%e#+5Gibh5@474MpLn8z~vYeJj^o{
zxPch^(Q-75N5wuRss+1uG?AMH;L(DNl=81XQHpKJ(S=Ch)ro8F#oe}<u;xR*>ov#j
z%ipbqi!tU}a<5R$+RylSdWwfXoT^-BH|NH^!}`^ny!{3>vm1(yA9adeK)Mu>u1*Z*
z=LxXGd=<<cIdYws22MN?8INt2$kyLel|I(ot6O36o#s?Tj&~OLyyA>_lZ<Az(D;sW
zJuR8{6<5?2XDZ>7JA!hTLnVb$%ZNF5_NyNN(Q_D5UMD^`51<ioUq=SZT|^oz>ei80
z7dOo01l=kX;|{yvha}1RH0&eulaXAxYiIb9rv99JAv)-p5#plKeBl_mV?4KFt``H-
zLV5`0E`Eiv@^!0NO~7lvJS7_7tF0V1x%Tb>9XqBix?jyJy4P2)az*|a49VjXujtCm
z`>&-wSN8g|R@i(FXG`^zMN+fL8X)fK*@8@D9F7_MHkyd$(Y<lK9-9KJk*kG0t*hz;
zxF!43xo);o6R19J>q<&k7t(>fS$3=%g-g$pdvb4lrw8@$u?)l{#^w|1)n_!r;9HYl
zuGQ0^B-o^#*}}QE)HhTn&(t|ibMeRWL;llEDbL(e7bo6F=w#uwd}r>AR2o~%^W4r{
z+}ZA6a(Wao!$hF@m#d8JiV(2Z2Nu=55gB~wCcQhMMivqp8N?cRy=74$^#2S!-WOxQ
z;e9nQThafHLa3jDbGUR*y_riM!t7Fp%dreLLyH}aW%QUU3%EYq9GJ=^rM{MvC!rwE
zokkM1&WLt~m&|sPdrk|Aowvs`PSi@Jutn(+aM+EOL{3in91NU+tbV91a9l3f4`jUU
zPDFqo0<EuXlL3PJ8%jgeQCdsH+-jEHk&^XcNL6-uQ2duHyK2hoWlYf)^W!G+GNfa-
zDNxo!vqXBWxR}23P0hEs2u&0nr-!pa^e}#tf06?Q8iUq`xo*Jg{)c!G==v(o>DfVV
zg;Ho`uLcqB?6<>%98~78T$A!%tsgby%WmPw_dTC@Rq&sNKOvgv<VG>1QooIbSFSxg
z^#+@fhy3)Mb+UFjY!n9OcTI|$E@$bet`W)~h<?w>WdigD^4I{}EVGQ|qm@c)Xv%=&
z=ZD{rXBQ4#UgO6jupx4Sos2aXbw(o-c1cv`O`tojc{%A}ld}Bj&`u&FE384P&+ji{
zW2ELDIO*bhSv(MC`9bqZxCTn*aHPmX@^Z*=f(j)Ro5L3bBViQj5!0Usu`yX}K8=xK
zHrIV21=$?=U<2XUe-fm)H?q?kccXnpch8WbV(QFsh_|Kk_?L2UA-u8FJeuv+Ijn$Y
zIisYi($xQ2HUfr+3fu#$Wz^0`@T~3T7Tuy|OUY*Lba5B6O`hjBMbRd@>{r?w2f=WA
z9C)Fcc~~{F8O#Jyyh?}RtaB<H%?MpjSlX4Rc7;FI_q08gO7ok$1eLHrzr+Im%B}Or
z<_jxSy3RRu<83hJ%L^j9E8=R@f=Q#o?EhqvEi&r=5zpn-;`#)e&)z8gPZyHch;^3n
zK@K*$VRH3TJ=cHhm_LxrI`_?tja6n^-)e7Bey43Q8`)E$t6BU_a8_p56K|JUJQn1Z
z4@lDz7$?`Vo<#vcHwiYjTBwBlIAzNufF<zA7+6ce078KYcE9qKJP89^=P<8fqbt-$
zE`Bpp<T8{iQsd?i+x<(h0dpu`lzO8Ly$PE1-9uL8na}<%r2*&(WKYwT?y9}VXkxq-
zGkL)JSf!d%uUEFbUv`Dol2!bJt;C2lJ)6&-Gy6=^%7GRikhWfjNtX3ucZaP!O9qg7
zWg%5zHj_~ovKtL5uOi9UX2E8};*c-msW@0nv+_oX=3CfQ{F$X_F?VMv-b2ck+C2QM
zR^T}6D`MW{{>th(IGy)jZ?Nf=ARoL|xJZ3&c9@mnJwr~=r#c40F5UN;;{lY%J`n<a
z`7Oyw4T9r05Dl-WKGVv)9?n10t(xSLul?$TB<QG5Tn9hT;Rbr!o-NLxl#=g;4fXLT
z{J1HsGD!Nmy7|!})210;N8uE_Cz*rq1fiJU)0jNSz-BrbykPGy2eRUZAbx<zl^%HR
z*`bu(lzly-;TiCGqyi4OYcX?RU6-*so<&-$`aUb;HE17!3{3fqobRi3{+A(Tf7v@Z
z&A=i9im>TVr`%sQZ&1D*6uS(}agv{-Wn(Zgf6*&)S*b7oFDSApJfD`@l8u_YJkL<3
zZ{R^nfjd=tA|ug~r-j=GpbXpnd8XjL!uKA@e|aDe$=>RF0y>CR)6D>B(veA#fiT}6
zhN}l3<xc7Qnr}}%ZrUfjKpj9)^bZvp_fLhNqlf(I3eEYUg~L_x4;(%JpS9i4S(?S0
zz`ZLEum4V~@0y}TB6H%nP8n<zPrn#KnQj1rfQELUUbeLPVfk^pcLr7qvZ)&Pp;HT3
zGLM|noe8OWsEd^Bf2^n(f5nJO`Rg@U*u)mqPkk|xi>UXo0y|aM4s+bB%fm4#^-e%d
ztTsR}bvad(9PM<Z^k7E$^#Co!Q=&YhA3_5+@_?v&ACyD0A9o}osaH1A@|CkqfWe)9
z%GA7f@9S2u-qv<}iMa%3i_tqYdi`RT=bAE``rzE{d%!f82!nNE3<^50IE1bc#zw(!
z=X0+e`c5(r&Kvx`+@d&x|EX-g>a7$j-#y>Umh`wicVna13{<iILSd?}(<K2Q<Dg>c
zw~H@q-vbEYtH_5&lhK(VK|%FV&VDFQM1WhdbmRL@1#xDvK%RL^?_o%TsY-oF6`NPW
zRGQsPu+vrOqrF_0VQ(;`O+MT36PvEH%GAmbDtg#*EL1mRUI~*$uD0OSnuCAyaIDD;
z@r6U~w)cZ#AGS+O!<KTSKW)xNk`fuAI2zgFezVPuI<If;S(Lsg(2h>kD|j|Gq%0o+
zN7(9_|EMtG&_)F23>9rR*?8`FX6|K0WPpLH4;Nq{i#SHtaZi~Hk!2BGBA<G$uNd~i
z2?MlFjphCYy+7QLGJaMglr<4S3n*fj<gR4bw2=N7U%98|ga3Pk(5YNt@4r+o1BaS5
z20vIdtZH(nJGZt>p(<#(Ti{a_|KtBlbQd~Hi9Se;9{*F=0fIMH+uDfMgnbc+WQ?+g
zseI2Y<<+>qmTO0V%T;cv&Ls4isWE`PSPKVS9P|(r(((?+#2|A|>u*xlFC*B$g6i?^
zhe@$hmwL6}Pcvr|xz6=}CheL5;?y`tYzVB@M(+l(Tz<IGeto<(Rf|_-u<9`n*dct>
z%JB{AORT{W?S)r2o)d)FTQWeMo75c48azJXV_RL1)fQy<>|9lbxn%ehVDq%|5xwLo
zlLiVBL0VUsim=&Uq-ywK(oa-euQ<d6#G<v3s$D6sUHZRM%_)&BV9)Y&V|Pz9zlp7}
zF6dj6a{9^nuifgtFwMiOI<3z<ta3MCEZ1%-idAkNEca?bSZs}`c{T{#iqZ+WU%z0A
z#=mE*RPXbPvbFl_V_3n936-r8HY!B{ScT_)FJ8orO<6)>^yz>WoaWjgKDen1^(*hD
z)-?YJlytK0*@JYbqwt&p-s6`tOv1Pk0PT8qF#F)w$!OWYc}~s#MGF(nCoy;<fC++5
z@<SOaFzcnLZ=X$Z2m<Z(?kq#?m~-zhB5d90zx630o$%FK^yihx9nvfDntH7ufn<eD
z1-_iSIWM~OsnWVc3vXb}1#6Ks!{+3ph)0OhKP_d?N<QrL@lKizcmxW5dA4!iO7<#P
z7saTT&?3&idb#akdYD&<8-6VMhD}RV!d&wI*3{=6U>%-s{A}U>DJc41-i(4TkitBG
zBm2Idp8c+0&)~w1-s84oi&QWFXoA^QxbpS;AbD!44)9#v05?ME1z66dnC(%`r;r!0
zLv(F)5)hzS574=5?a&pck!tzbD&*@L&7d9^FjA<Oa{9;vDPy_Gi>vSlj7+0ok=YXY
z%g~B|eQfD^p>8zZj|Nm>+Ap4=2?aIV)q^(<{k4{#1(M{kEbAeK+ovj<y08mf&o+fG
z+_}#Z&Jcin)(*}KPbIL7qAwo{Hn7E!$Gz|92X^1vEgkqEW%U;~sXVr}PG{{YjF*$S
z*Z+$#rT7syAsGu)nP{gjNF2V;4P^w)@M)s9q^{u@%02vStY<Ov-9w8EIg=q;3iO19
z!)e6hF-NsEVr27!n7$~a490={RqQY($tTS-&e{OX61^kkr7GCMrkdTjQKz5w)LK>m
zQ>>!)*aQt=-W;*7L9O9UXwLvNZY=(lyUOSZ$WWDM(G6J@FTn0OL?$3MCCm7!XzY0>
zYXo%_41<?iE3^Z1osJMvb3yfcpua${GkA*N)BRUT{u0||Jk{tql~bAnb6M-OWHIzr
zrT^jIRdoOxTl;Q9Qb}=B^8Lt{UuS_b;s#mTi_rODz3!<ClI>daQ>1$6V^nvr3)_P9
z_d<(b!P&iQ5}lR5%?GDGF;^PHS9ZO>u3t4o>f~~1W>VYLpip0CW<S2pMcia-NgCgz
z&U`+fY5vjMgk08qwQU1K5p}d<AC80_d%jJ4rVNf+)AuHrjmP@)fa|U7w_4Ui<ymw+
z`six(Q~`o)<{xWO>E<~>;T~G<w4wNHF=Ej}b($*;8{p3HlRw^Drtc0%D+2Lu>#fv8
z5<l$&qQ9^mS>#(9zMb(pH^F~RqEqw_!UFe>4BBhQO%>Lx*Q!5oaf-XW8x21qj9RB6
zxZgq0=GF~FCBpPeqs$)hlV4Y2DJjmvoy5La|J<wJ#SaxF%GN}dB%*z+%AaN-pto?b
zZ~l;btuZy8CJq&w-`td&q^{6{B$u%1DmZL@TQd^@O)1=ak;X$pO|I0{?i&<{p0}Bg
zF>3bYzNMj<lqZ_`wI6*A=$KR$Z~zY24o)|?7$EK~LSK1mrdprX&cjW=t{+n3{O`Uy
zM+1ZFH8EQY?SL}kUqie2%TMKH&x?YGeLY;bm4VWH|EPfvKoT{}&YCcABCT+qH&K2G
zVvv)jDskA;bOHAHb-LwH?O>cGunwxcJ#_YCymG8pA1vPav?O{uF~%FCrnBuv<z@I{
zcC?TPj0sBebq5#-aDi;nY0AUr2t{+UgW_$x2r#j}P`zQ4l(N$qo_Fa+XKXWjMQLVl
z9na5GE0q-!f+-<7iZrxuPaXR~)c2?U@$^);o+lUf3VC>y*Ree*v-P*?2E;<*LyePQ
zel&{6tJi+$>k;xP_dxfz_b{qBkf`lG4}Nswm>0RJGGQJUQiWp8<Atl&NLH0!<DUE&
z4?2k(OZ<!CsVz>vK1CY9U!B~+Ms&YFYT538z9|27*Vo0ot2bagxS<1PzI6d)O>0tR
zh4l!Om&FuY?hdNpluihUB7VNrfQu3bYJW%Va?km<Z)Z2ifn^<YiMVq&xjxYDHS%n1
zw<IKprWQ3gXvb#Mzc*KiQFS&%12K?A7Y+wXsuD)8|8AHY$Q;l2(eP`gn;f<$ZlMg`
z2k7~h|AH?S^X>;8{8=pi`QoX=KhY&;(#c<WxdR0*o*M-2_(T*22A-bUBSk&SYuN&n
z%Xmft-^3|cOnrjz_WU77N|DE(vg1L;h4Vx)<ovvDjQFc=uI{g^S!o(n?yqCtH>)wr
zK1d!E&S5YGJNNGt6_>vqvH0Z6iX9Y5B|e1EKkO9Q?GLTgIPo|*@4dTsXpsa_P8#6(
zW3zY~gwWL28hSk>A&g)pnHV#bH`jmu{CVK^X<B9T&G}SA%P$Qs<!oL!zgRPB<;=OG
z^zli4=&*t<M1+Eo{uiF3W^5hqWRoHM<wC5a-Q;ga&Hl+A*W$-=&z_9ETcKPXGn;k&
z+HtLq*``qGd97b0yeS$9cXv(iGQ#&7qYDh-;P=cUV~axB%Tfw7<i=rBbYXp*V5nMH
zS+Nu{CYoH-lD8asSlp?7`eyLguU~Ds_z~h_Vs9NV9)>^3@zd;-bd>N?HqHoD-B!)<
zDj?q7RL9Mm9MuRso4@8Audb=FEdH^-zwb=heRbux^&&^!Gmm*WBR7|S6uLD1XeXml
zXB4OzFt*0Vba|V0B?tJ{{=9j3R!XS2SFnxMRyd&?=;G{5dy2vQ@!j6uUK{y&cp4N=
z8PAPRu%gnZhA=ZTdk}Vp9r4`2;O$Q;u?h1UyWjgv9yC?>)V0Tr81Kyt`={z7<Rh8C
zWmmYlYM@M?XJWJwdA(q@^&px3=}Ml*arJ3#Zf?2yVL^wRudk8GN{Fk*?u+ZjFG|-w
zAs4&5abtJ1S={?EbZ`l@#)b!QFLsKHS5{VZe2yHenu<JvgJHU9a+NP=%aX7jq@1<4
zhd&<s{`F?yE<(9{2mJcP?CtG+X94;~?heUO9jk7T&IUCGcFEA2hkw6Q5~60GlN^&2
zvN#|<J)L`}*zH{?y=RGag)w0>q0BhpG3LivA!V8TnKt6|BeS*1msbfZGh-o71E#H1
zG1_w9U*VugwCb<|Hztu*w3yKQY~8s?7dtv)M8U0=P{9VfFLqa$1Zi`>Ds52m7)zh;
zI|nS0u67Q*d5E{&LWI;;ZDf0vt?q3wbnJL@9b5Uf^K@`WT-azFBf_ToMZq(0#9CDf
zL+7PQj^p*)qGWTlYTTAZu-as5GSX^<^qSsZ9voCX5p}ySB0x*J=_8wF5eN6kWI$f8
zP4IVKu*RI-AcCV39Um&;L1gl2sAh;rBk&$#=ZEG4H}`|#FIm?i_M%BEVpj785j4&I
zb_(gZFD+)6IrAY)NMw+?XCgKQ*O1|(S~}klX%|cySJlwcy1F`@zY|zIhd$FpLjh*0
z+=?=gUCbXTDJeRPXVKT6X?1B{_6HjLU4Hhw{qhVukJuusy0NhJWO@0Ma)zuk5jG18
z3(aZ716|rZ>bB1hN~CGHa>^<YMsLPly~>^qwzWO1esChZUx=&W^r@BCX@J<XcyGj5
zsN6%#Hk+sjO7ofmiaGT<GApzH(?AJZS%}|=oIQm?WBirDw4bwcg~Q&{<6;G=H6KC+
z`d?qjq;sAocLs%2!Tn?K9Y{2KtKVQMXdqZB5MIRw0{7WEe*eO@iWS9S!$(q6aJA2q
z)3T;{mA(2+eu+DL@?kR2n8Wc4j6LCfSw+Q%QLeyQxk*IGy>EKm9px`V@#nt@`3z?s
z)ey%K!j6xRbtL!-@FPN3_81>zJua)P4^o9YU1xv%=rxvC5#s;rqpZoeme$bFkgS^k
zS5s5dR$C8<FR~x*_fQSdP~F3JkR&4`+tqPO+hEBe+O*txLCE|ZmX004!~B7?d^doh
z)z}BW{<GNtxwGj=JVD4D{BNp!sk-sp>@08R9_EtR)gz}J$Ipk8wdFDapN-+a>%ln|
zCbkSKDk}OkxM?2nOXumn@kdcEr}2V>$L_<%ARXFj9Pee?ceD?Y>kB#|zs922$Gzjp
z@#M>$DkJS&9<OUbjJEfwZse8=+C80}kJTFVnH(|;*+N`hel&PxyZdt0vqKddN$;<(
zJQIN6AAVtrB;A$3C#1@~+_K4#$Zg;H(I#Ade1+JD4<TCK;Vv3o%`D;Xd^Zo)Mb2sn
z4O4$4QSc$+yI;-BNB~adBWy{9X(qp9$b!;3k?u;n9ZrO&^L_o#<4xI1w<?P-*cj;}
z@m}w;t{~1tuG<sky}Qp{T!My_uNJa$pM)H&z`_~adX;4q>98n1=Jm#u{pXwyEATO<
zzf!o6$H2fqp?DLVKKze0vulbUqAxlr7lMnat+1t<{F$2g?WfysWAa`qnLPVezQ4>{
z@v7WG(Yy06)3%EeZV}PllGo2N!$Mvs|5Z#fdmk9wOv0U=<qh|DvHnY<J2=ALv~~F|
zE9+-~WWFJL8oEcU{OFAQ?DaL;Waz;F5N&Qqw4s@~eJ&tjQ9J$tSj6w5asl|0cnl!6
z8btsX0e)Sy0ZcO&=PBWR{4H@nKP7Yqe$!zF{J*Esl!I%4u)bFiHB0xvWU~!THxTKE
zx1jdh(EN>jDDwJPi|#X^)w@Bv5?FSwN7$040C&_92pc@g02M^AV<|`nsOspCPS$`p
z)*DK32ACaj`8Uafz;l=3ARGmz*el$W{y<EFy@Y1xPXjgDO8^dhi`HMC0Ww#20?2ge
zd#ivihr%^l`SidUFg+}@#GHsORAe8WMiWwTHJ&^Ld~ZWA<Ff=>ofx$AEj3(Fu}LSn
zB#2`L&4zdYLyIc>I?whOn0_pV5ogOE0V2tirEc-l_;?0kE-xS}>$t?dB|u(+oyN2d
zbkB5IKwcP+0;7YA-zy){avOz!6T8|wM{I&GADI|)1oDLAlaqA>1Ni$(AViDJCr4wP
zG3DQr->5#}g-4K}zy1%AkpwU|`9_~NfCO5eKY96HCwJaVp+^aTC>20rxRmoD2&lIR
zG?fyx>4|kxU)PFvF&HVwsRI^%L*T`iuN6cW?96}h%|HF6lsEabVeIltG%1bb$E!Zt
zjc9MCQ|p;3X!x<x<*-VC?_wxE7St**P<j*w2pzePb^#PjOOo`d2hh=mzD8HFt@J}n
z2Y)RcKdb};WtAm;nvoa$FH0s0Wa|>D4?TcRMX>OX@8_4FWay<KfQZ+lXHp0c#y@xv
zy%rmA@q=n|qiwm0>8}w_>0*QnS+`bawuIZK{@e8cq0@NL3XmH0XLB)dj%IJPLWX4J
z6ga72A8ISlOahn&DR^3|lhZM7Z{0Eg)+SG4lYAHdxL<fE4#@HO&w$EoM();RHx?nM
zj{;jNOko;8r2@0gfM$y}WrZ^h69(nkqNkcFH>P`@fEEJ=MISUT83P6S^VoJYlDk^#
z{F;nVUB*QD<DJSOLV&KM-Gpx<01_>M#rUASLp*!V1CY|{y|!#sB<Xws`A&9Rh;_{{
z1pX-9BH_<kyLWHeZom3X?Magbdx#__Dqm}b9OfCIbimRog}cJKF2VP_ye1fzIMl*v
z)vyyz-4DovBJ^N4NVvbx%BSA4Y*6cVu=Jvo#Q^x)=F{-Ildl1w?YYIzRaZ3YDM62>
zMah*_0L|cG{<8seXauX_b<fS{`W-mMF1(6v1HMax2TniLDh#bAR3*1l54JOJ2@2#j
zx<g7OW)8qFPNP1I5K)|2Q(sGx;9qj6+ahiKM#p9HZ8GC~8T22GD56)?z0aaEp3pNi
zL#D-DW*GfjY=RNuThSTG`k7*ZPj}n3@H_p^nHY_K>^JndUe2t9YvD=UJMxgN-F+K!
zJCA_c0H<vonT}c#uYD8-qg-Qtzh@}C%KaP3mu8v?e1{X!#!uhCGZBk|1+TdjT$oDi
zo?l$+x!iX^Du--rNVRCWNC%BOB;`zz(aXpPEji73cU%P=I+1uR3a+HU<yE-eN6X>`
ziuMk`(<%*9qSe1V*2SU5e5^qE3`a*P<h-`3B{J~At~V4$+@fa57I)s^lX#D2P~Tp1
zBj9fD<-H>>vI5dj-3P0qPDAmt>N<Zyxd>D!3j<7a7YH;WNixX71ZKCu>!m(Rr(lhl
zA)=v>kn-qd%b?GP)kA?W0X*tlRr(KP^H*nkOn31Jz6jkDTh>Xwd&HsoP&;c<h|Q7U
zrG>`hYIVGatdP6mj(7VgtnqoI?FG)%x|jhtmy=4ZcgaVai@;M(?7}DHgpLM(|6S_`
z)37Q|KZI`>My|#%Hwu6?x$g0gI-#-K<fiU%y(EhCuhdoi&4E`9VV}J1Fyy>oArwO3
zAqxiltk~>^Pk3>l8p^BwyA8tfD}h~!jnFVR&E{NYl}w3jNN!-5z-XtqJ`#hs9dU+6
zn?IvQCE>P(_vd`Ec*g}}k(a+D`Bc0cEA6!#6WYVue&H27e@NKoGerfBX%_-fQ!^dE
zDrN0}u&wnrO}5SrZTL?rE+mwgjTprse`F~{G6P;A6E@Yz%^YLPf?W<dMS7rnbGr6h
zW^m$!;dZF$D^QTC>wbqSMWVl#Bem}In5LJXntLzR-MzmA@=jc`Y~St+*$_xBltv9x
zv=w6~?)DQtivoV)U8lZX&oU+S+TSg>_cf_Ly%kX-%)j>ii;)0jl6=5HBKs!)6N*6z
zpMJR9y4iK$iGP^Z=&FQ(uo4B{KK_d~Rjf_oW(!@DL62usB}%P9CNe5e2HG<e5{{Zb
zr@pjGg=CYM=R%n4KlErcwQs*GBZ0aVX63fD$aTzfNefx^Bw<W$o*O0ik5k>KHw#x4
z$3o%`2fFX^oi0fjY4R<sEgo?S-|-dab*vVEkP7=s@RD-zKpde-`VNy#n#YfDmfAuh
zZ$%I*@j0;2U_Q=+a8QVyZ}?_hm+QX_foVv_xmZU*vNJ9}^~>j+p?xu)(OuU^!cGEz
zyX2SMy}f<zBTpu8)9`U7erQd#IAg!b$zWsJgd3?Do~tWblLZg8&9d_F9+x$u&w)js
zC!Na=N?d%1fiSbySTyk}Hd@pbPb!1g0=ylN_4j}8DmI3k;n|XY=+F#K&P=r_#Q&t{
z9K#7KdPwmBXS}4d)MPW-$z70A%u$$-vjmXPBHrDhfCFNfDg*7k3Wne$zqUunR*E7;
zdSdaX_#IVue_PLht^vHwojJXPih$(}PK2QC-PA)1m0$Th&z!9yDI+AElIlOH7D8SI
z0nIe?cm||VZS+=K(d{=^*rO3=63#A0{I#+oiZ|evF1503ca?(PL{TMMK`1QRaEe6~
z9zK++)~Lb`zdOoQj2qwoE~3*;RfszJR8y@Njc2t4u)^S#-Vk?ajfA5m^A=i>YrnD@
zF!Lxwz<Dtm%PV|RnWyw8m5|J?_NupSmxg|x+ca!gh2fBczLrE~f@bSD5lR4eVA8yU
z+N~GwiW$t2meyb}{>h=yYB`YSGZd(Hl5hbn`1p$P%~cB<8x{Ej{(b?{HfH?U!8Llw
zN~i!lB~g+!iyqb{5|Y1=&%(5lph2~Fi)*u>RXZxx%OVt;rdi>Kcp@b;60E}<hu;b4
zO7y>gO4>8y%e7Jjw$Z&W1wvl8wXSn!9Q!1UCKCbly9!Y4+N;x~nmI{evm}zWxwU~d
zA`fjH6VOJ`R=SKc&?->~>Ff8hty6ui0HL|fSKP@JBXMuI=U%r>Ql3uoJU!DLMf&KZ
zHk=pucYITK2;9Yj7SmRO46h$K57V=q1$JNKt|b2)3F+pR|FxU&MwJ|<DEYvR1^Q`^
z73@(-guRg3@V<-P0)Nxh@l%dlK^C&9{@gs!a}yEeBJIF8M38gn;x$Y8qPS@wL_57l
zknc%&)p&phfcZw>v0SJY;*ZzRkR`&w`kB#{6=3K9MZUevv!@_?7vUBotl^rT0<(l^
zJfi42XMwTzSNb|9xX`Y<qB(b)+02>Cg5oRk%s50@-Oz+KsD&JWx<el)dZe_lxSD>N
z#7m!Zqfdu=unb~|hyDbu+OsNfVIB^&GP7EK&?0!u7SUA!Jf#Hoy-1P_UM&Czrav<{
z8UZ^Y9L`gVO(d>eFR*slgO#Sa2{_0J*5z6g$<vpzqQ$c00{tK@Rrsr+P4qz<OP2(_
zVYRN)oHTou>4_^`OfxD;tU)OUE*h#QEM$DS@DKW70znQ6u#TUmlT<Lx`CIQdl{ruN
zXA&*W5!k(NE*l)Zr$;IS6o0Io<C;<3maS!I-g~qD?LszWOa&I6$3{jk0PzB&)E`Y`
zqn$tbGVop{*}KM4pL@T@_OZB+pDnn)UMt{6#~FGTilwNRu1A2wjCV<cXY|tw#FBH-
zT6923oRZ?jdaIzQ3~}5aIu>I7PENI}=t__NU<YFz*qVkyzenulJRxaYFBxU?x_%me
z!&K(sLmGA|xc=utmdoDh&e(6K#PlC87sB144~UC+$^w)Ijo0F#s@N@_N7=Mo>*dfe
zn8+)MT_&z~KZUxL83a}EX<H+vR9hMSF{k-jU9Pml0x`$4Rxr(X1?K^aJl~&Lh^1_y
zRlYU*;~cF6_T5!Q>4@^aSJ$tnJ%e(|s8_~Xzvs9RXopqVQzXFIw?7fw#R3^aQZD7)
z9>$2+JZOJ}!DGrEN}T@XcO-;w$Rt-Oq?RJ6HUR^)H#uN5r)1_Chte6O#_lnAWr~2H
zHvyOf^}MeUWTdtO78h0ozGBXRO|6^2ht1f=$nfwExIQxyWX}x0nEnt;y{r8Yk8oPs
zOzA8S7K9jx!d>6GRikJ#H%dWU3O2d)K)3Goot(ATA;(}s+2i<07q~zWN&v%B{-P6s
zlZ*kyOt20?>JlWwUQ<>4vh(eoI2W;$EwK000PT+wy#e%g&SPwB2F>@h=fKJFMSukt
z)rnvYp=xI=9e2%=deM{AC$x9^kjis>8EnD?d$vJwRi0=IJK<DT0bzNZ89BnAhjIn{
zi#LO$f1dgm1Vmw|D~I#Z@aRPJf96YlU@9g4HfP5-Ps?(?)h8q<{*W&f*@OF7=7c8B
zytVX6D(`M8&)9XN9gP2HE<VfaB$gC_KBPxfDBp?rDd?3s;DIm`u^Z*owXD>jv%|nY
zw&YCZ(T#d4wZ%Di{)!%!AeZ1aMWOH1qKwS=O}52O3UbzpbhgW$>pTY-)lctx>(Qn=
ziPicg&qDjj!)ZCrw5+Z1xK~5J;q4iHd-?c_ZgIkWT|L$)9L05fyA7wHvRbFmb8^pc
zJJnvRpjPgH6(fNMLBRd?T6J9|KnkeMcaN)I^_9G+vmfNoxFg=(_2|`-B+2YP@NogQ
z=0v#+@^PI$Ly!xDf<$YBYH6<9EnvfA_MG|#2L=gHIvljj*5HiOG|Pm&!Y4o3E9)l=
zh!a4yA-?&Y+JDh2y@fV8+iH-NUOPJ;+S=$JRQLEUlZgyf!hn+y&p{cFGH(o8J91|P
z^2_JEX7W<`UOE5$v$cUgW@}U&49uePAK%Qukjl!~eyu~yRfX<ry)%Lmi{Idw9^Ann
zonyMJ$kvi)#z|tA=c_&oh!0GAQc7oP1|Z6pY|^cT)B2T5JRTZD<-+P{VkJqQD631#
zD`y(QIV!08JpsnvV#{i8{TViTad42OG2^Sxg7Cd`eERA;P_lQb0^L_&&h>|Rz4~|3
zMt(GF=H0i)!c5gxWa3RWComucitg{K^dPQDk2e*<SKgatMuLwV?VCw#ubS^gmO;<}
zW&-adJJyy}iJLj5Ogu<4!hJ_2EyS6|M0}4{dnBvb-;Lf$Gr1MR!4|@FMNhmgX}Dse
z-~XFeC^OIWb(y>X-BZqVI8&QYM*KyO#a%R<e+z6&#uA5n_n3z>9zC{5h`p4#y0b2I
zuQd>`mP38T|I#U)EJE_RuA<oYyDrhIyb<11VSZUmIz35$IAFR;<5fWdfr6_pLLJ^P
z$%D9NBtVaM{Bj9Zm<ebsY}XWve9H2m=;?D)#>^LRx$qKinBs|51EN$r`~qe^Ew9Ze
zKlD)xwSN|;DbJfT++VX4bACP5*=IX*B)UFVoAZ`M@BNcBsqF2ka>cd82Xq-n@D`W+
zi5)RRlwY00^yzMwrm^kTTm4%5i5Jo?70;TP^-J|ac?}4V>u(yf8XOBAs~ZfzD`Idc
zKH_pL&qPcqtEBNMsbt9ayq(z5$X&4BoA|2#`BpSd!&z0ZL8Yk{G3|qzrSnV|XS-u2
zz0+-)QiFKQwlL!c+4Y4>Pq!|FQJwo^sh@g;h+k%PezNz4*5(@Rgjt}II5d1LkGm)0
z;l)BwrRT+-JHf&$f0SP|EQ!z72XeEx`S66lG77gF=z&ejUB8BOBGUvD8^0aX2&vWa
zp#x<e!74Vov@&t*cN0iE57tG~g?E1@w5w6I@V_*>dxyU=u<FC_%qU#XE|<fLJ!!tM
zx=hJkhKu+Kt!|3oKg?yZ?KDdQErPvVJ<KL21x+>{({WXaoiC}GwL#nCas)}62&*iF
zn40%5N!yQniuCCEj^%M6@Q2UC@jWR5+t3oddJTQ->1@~zCG8KBmG{_8iTlLuMI<_a
zsqrIv+5Z!pr771GM-Y7(dq4Y&?_f3`P+2QWw|Xh7@MJ36r+d(}_Vp$2i*N4nGh;JO
z>l-RMYj4*|uLM)E;eP>beM?-}=I_h(3*De>ySdWFjGEl(#%6~a9c%KI7ZY#Kj0RhZ
zeh}ZgXWX!tH{(G!`WY5nyzm1hfY6E7?mV(KGlLrncRhj|qmFiTuEwrE>#oO)I?GlE
zwJX1<cBCmctNDBV)LkG|{tL6HOmo6z4%eY!<Y`}~XUj|rOxz{^-JQ2{bx(3$Obocp
zFU?2%R#M6Ob*Nd-wb3Ax^2MMOVqawNuf#;>(kS*2*dIuA8n1IO42z#A*l?qYFt}+y
z+3R9WUpvgz%!%QC8v1#u;czNWqedWFw1&h*=<7~_i^6v7b38}UJg_zSkVi$kV4KQS
z@Tbi;lpgHD#*P@;2P<@v=UlMUQd!gd=f4XL3k{jSXC<w1hrp(mzxfTs?xBKv$LB5J
zk@aE84k<bd-D)G|e?6qE6ll>t&rPs0Oi30{#ETSXIE*teRVVsjw}^;qH>L>2rdx{&
z=EXMzMG+JS%Is=CS;hdR%I@UG$zxkmNa3t<pBA86>&Pcz-s~k)oVL}kXR3kvUO2mB
zgLDZ2ZU3lvyA^s1W$~pcC(KpiKBe7<F=CGIZSb#^&7Z)$Iz7C|3afpdlK@+u`R5b;
zt8=&(Bvn-n7&-4aNRT)>+vIU1NVMI-Jqi-ik-!%dzZnL@(Dua1_c&0Ai`5;4#Xxd7
zNtQuyIp0TXyP>~V<`q=MXA@TD$Ci>Fj5_mjM!a52wg2@zi|s5rG2@Xx>Y78OH(BMw
z=lTtCaeOTD_~TqL%LfDLl2hLs>?X3U2Qyq^ek0V*gdRF6L7e~YT5X89_7Jpj`QI+p
z{lS$pvCGNCnL6N^bgP*W$>KCuoqPRYjNh8frdARj_iXeSuf|Qj!*NmRsa$C&JJI_h
z7ZuGy)ZUFQ7j*AcAFCQ&gB_)~0W=%W4LTd=o9q+D=?2}Y*@_uGj9yHIFyq%r{U^Jr
zq&V0>y6=U*wP=o%lqV)@RVz|N&UTxVub$Q=HjTUihTR<#HC)v91Hko2?L}~pV%WcR
zNr?GC<1tXBs{v|%^m15K`SCKAFPWq!#UOYY^_Y5ntGb>%8hz!{U+!TgB6eKhWK-)c
z^qX<9I5+51Zz|u9yk{LDq5-^@%M`rSUaJv>4ud&#8|Pb@RJp??a!XYUWi!MNvoLld
zV&}3~V(N51BQ<I^u5U4ZV9AdtXkRPeE65I3_a-BzYAK3m6`x_YGP$2~K1a&1RjbQ1
zb{KV+nM<bSfqC=29RIVeleH;JyC0GiTYZYr%n#FQouKQR2$~t!bQ->?(FmR~r4@FK
z<WG+`=husk+C;jc!l|Mp(fYdosY(?nd&mjyDoV)LzWbn!{-aP61qH&kCX8z9eDJ>D
zlVI9TuCwtE=-XLU<PqPGWhSP?V5Cua7mD}r+SaK;tLCtu#usp`#UnrGC;W?%cd;(1
zFu8CGP8_34ahBrFBJlFS=J59}(dXMbpgFm440Nt4pa=3T5O0a%#n~l80_ava54#fG
z;wSEjXxzd~4+e@7w}@H5CLaMSv|Yam#ihq9&E@klh%!q62wOJ`PmEvj#j8*+Qwj!M
z%3RJ6iD`<+sOJ=tZeOugf1~S|5N48>yv_^<F58E7B*0X3YrNJ@SKT1$%+w>$InOZt
ztHog0PuF2WA^Y(X1$t(~uys?~h<3%h1XU_o7cVQa>azYoo*XL+&eFaJGrC0?p-2&8
z9YoO<NH}(zq}%`yF^F&?@$4Px!>tnho-B(HV5NI}TlB)J{YHW<PhqJ|*H~~*W@yEy
zNsXdwKy|Z0j*t<KDYmajfceLWs5hF_d%mROT?{1dTaO6~bL%a;#r3F6Q3v;1_54@j
z5Ap{N_CIMoG;VMtFASZtUESlAQ=Gozd=KIu(nvM{ZC=btdc<H$g7yz4j%xM;RsG!2
z@<M2rcrDZ4NH7xUveWXStg%bR3Hu!g8`86nk#;zf`D&ET!KEJl22ZkF(dXMpoV4{k
z^@9(hvDEjio6S+}D*a7#!kMUwpJkrelV)lZUZLkkRoa8It}~Tgg8EzYw3>UC-wE61
z;tak8g-2z{oV$BHd;Sv1&-hxn89MueQxTK%uc@-`i`$a<hi<Qr2!CVq!V<3j#vM9f
zkF*`glyyMIzXi@INXQ6;VtP$LNT~JxwF`U92`)T>Z7VuuayQb`)qep=UWJa~*B%(I
zn?u<6=r&aZr6BrF6)T~1tKsU6uWJMF2%2H8^;QbnMNa@I!CUW4cUe{@oWBhW?*azu
z()*76@YNJK9vmIvdN|A%V!As{zu@F1Y)k*Ko+>Fe*=nfLYwR9EL-0$YDz?4K(BFb3
z?(}x=AikAbcn=J?r(o1RdyjcbP=t8J+pVn0NI(l;@}p=sbRkBm<esguZEhDMW`l<!
zhsaU5^xx95zY2X@DjB$-xEhrFmS{SC&3e54^tqXB_~$H0oU!B;IV+|21-V1Yug{fg
zb`~NS;!d~5&q#wmn$z9?kk2Bqd%#w#J2-FR{wH$ds6ce%f#IVRE-muLS7n0z?sl*N
zw%wU;?T=rldza`Cw#6l6{`d95#l^fsK==N`xZi&QoF)z@&r?wX8!C<X3h>JMl3^wZ
zgZ0Yw-bl8+!*-#ddEBL!z^`5e&|$C+pA!+tK_s9Yi-7*$U<RRG!q=Z*y_c->1KgJ2
z&1FNsxm^EwbL(%wv}ey6k^*si^+2qd9ZVo<vO*Zx-zaoMM(H)VF)34Y)zwXFTmw(T
zS1olv-QK*WV9o0J$wS@%_SiZ1GiL<$s)38(w^dzR<V(y@s{Q6D<Fj+kT+T&Av}`yA
zp}TuJmys<N9`q83vpxr-5U_gZY&<bb#e@$y7LHvngKl@WbX@?!@$Gr%MdBkYZQYmA
znlDV6V!s9%J?jSEh7`38N1yqxK~Dyf5!O%2%x)`9;azmGMmWZb7iJFzP$spa4wHuO
zgwtrUrqKX#B>&HYusycH--Zg$FbKmdW$@gXn8x14y}erhfCqh#TZqq-F8)d5-rcO=
z&V8^(`*PzwGZ&>I{Udv>V2_K#mG16jZr25Vhbv_X+gErQEfGy*A8;e+<WBI!9aqD9
z25u=+C`*CSTJuE2fE#f9?bj|NB!xnPYI?B!T#rTJia$hD@utj!e~n!YxQ*GJ?F;u%
z2BakWziJj@{o%ds%H#Q+*T+->@$C=Jl3ts8c7NtveEmW*c8eF&Ty*BZE^+*43tOyq
zZ-<e0Ya;uI(uBJt=Y4Z~!SEz=X2od=cels`H%|wn`1Zzxi#cs7+p#W~>0yOX$Mm}>
z$Pb4pXa5CwqWr+8&e-RMD9glhR>%UYJ(=!-e#;-RDFn%Nm)$9r?^1S6rcV5}zT<ZY
zij3({_QtMDlz;$>Wv)T+IT72-+`~jpf*Q*VA(desZc&jJ@ZPbH3;vsZE?py&fwOP&
z<1fA^AX>;{YOMG07|-@3vXE+c(UuPSHJ+W!7*kAI=_gd&n)iq7ltEJOK2(Jc2zLmu
zasQKR9noPS=K-Vy&drPkfHl$O1nVCpNIW<58D3nj1rSCzDwzBNo6sgj?F4PUzI)+e
zmZZ^_cJCKM{(?!Q-G;M-2m_Y{2G^TWNcl2^6Lt_LAz_PmZFnsy=uCD<J_Ut88I(=t
za!rd?^mqr!PFtTw{?=V2Ae|gOi@OxZ*-@_r`lkEYVrVN~qg#TNKPbq=eJtV!92Cnq
zw5ME}FY*2wppCM6R^<M$Sh>u=li^@~WYwMv>cZ?tvzn4x{CAK2L*7$)EN^$~<#Tbf
zxYX?+p|czK1w1~;u+9q2L6L@t@p994W({PDSJs*NFKgLA@!w?}aqoEpCF-2&f&;yu
zeS5iYeM=HWHU^OyEIj<0p;RMcZ<r|1-31pkRJX_hn*kd&wQ}%#UtX^7>8xHe?hjK3
zT=9?+;?u>_@I6`KMp}_^><$&Q(>Rsr{khpO8$TZ#Y7yEgKxH)D2#y~#O6k>WbV*lR
zFW_DIU7YU=EPt!}GB#r)mOP_dEvf;jlKU4{{)Gb!5NS5Tl}B%bP8VntF`+XB@n@4V
zAbKw<utT~V^?DamY!zZK1nE2IlG4+Y-aUE2_`iO4Fr>B6;{AucClttN2N~O}NG`o3
zHKROC+N@?s!poW@+^h|V(nAE5I=v!&5XAg3%lG6LZzyTAT6OpY=OIYtJ0gAie}73Q
zwP>03$1vPfYTb$<Yl7iFQt78+6mx8ZX;0spn3#G<tL&<o3LzP-9N&+-eUY{O$<WOp
z7edm8-O~pwJcuJs>#)NciQBk|Yt{eQn9$4vV#=A<I*{{e9$3zR8S9vPWV^}m!%nPQ
zVzsX>AGw&18PW%3EAw&@9KN&Ir%IC~jiZD-QFq5$2EMK7;SyAjQo!tNQnnpynb2ib
zg)#!*E1U^eg<cx^huw{Le}bkZahz65*Cs%z(r~k`bW*Z7e?s~J)JOpwU1tkq?3}3U
zg1}z~+BnK#xvnrJFFpgSB$cIg2bK+2NhfRl_URV3;159`MTclBwcD@84|~-?Dek8h
zo5h5)BnZ2)jcMw0G<wVOx@zQlVlvsSDdg)^MR8>d%TVI@XMK+^dRw;V_Xyjf>8tl1
z1LHp&OS)FWyvv<qWP7&q-%Qa&!PNy_lO#B|W-)Hdz3QRvEYkC_r*^B?g?C2Quih2$
z?M<{ZBbVzphDTIV*Hj$B$_|WLD&N#aO;kS5$`p0lZBq@yVs^-Iucugxn42u0D}~V^
z{ydm6_b{4ou-U5C*Q<LH*?5S1s1o;4q3?NFXsZ2W$&(F{q2bStEdBEDTJvzA%8xbw
z)mBI3;C*L1e$iiiCz&R?O2Mr28t<5ywx7vOpu)JpdDn_uXIY_$|IH*ezWZML8j1A#
zt{}(dR>=A%QbrLAZky%Ll#={sb=V%QK>azFb^jpl<nz-32<J;@qx^@sWYz=dX3_~j
zCE?5;gj{}=xtF1fv-DG}8*g97Ux3X0Wlm6)Bu1*LYsfk1h`d&Gh0r*xTJ7+jxX4)%
z?X^G4{2g}68q=d8V11q~M!bA2x99QF;{u+&UaT{){ri-C)_OJlPp#wSlQ|9K9zCBy
zdC?Mwa8Ng)v{jE2-v&%h(P!wRJc*z;0lw&q&cxyrMqF~b_T$(}<)-$SqC|=8S#$U1
zSnSwrb2jIm-n4YjHuh*7gzwN$)UcVy&aKsX+G3_7*H;c3!3sWL7W7{BqTAVV5cTSf
zBu;w%v#xGT=&f?71gR*PYoSN4)S=fA3W{6=mP%TW|2uMejMM+eY+lh06^FM(ZD}X)
zzYl#~Wh<RMweed*w+u|=(c&~9)nU;Hzo2~?Rd&mD4F7+1Z)C_!S^QxxdrRkmjmTn0
z9BocIdsdg%{yc+l$M^J+Cyd5T_Bl6vh6FecmLgQR%^B8I64n(Sq>T*sb;aJXZ%TO=
z{Ob9h5pT8;<x)PgOKMGVgp(cr0hT_}%qYzCTd-z^LABlSWmL!8&bY1_1qsxgbFF4%
zm-?!$YANB^$#K$9)Na;YyPfD}YcY4r)>A-@dBZU9)$KCBMGdoFh|R-Q%}@FVy9iDj
z6lvL0JSd;hX`4>kA>Oeud{>#+3BueUi+{FZsvKSx82ya@(nh2Vca#AbBWu0{Hq)43
zYDZ*T)5JpHK+t9qcP}Ff<Cf|Wg^SXdAWpJ^#QPE3c_LDWT9@uf7T_jH9Q#eVo`1K5
zZu|BEX~t}4GOf}uX@u~LU~CEX{xyUh!KqM2debY8q^H#DLAjm&eBe7FE)18VUsmq7
zjjypRC&@}V%cxoJ1cU#An{Ziu-;z0DF|z)CRfD5mjVl7gQgQf8`1!62D(K@ch|pCY
zI3%vHxa$WL&f6!FgD%$*c9`;)0yi7J53<>b)hnmHse;{uQi9SM4pPXgnWL=ue!Wy`
zX5Aa5zuKD)$qh(a6MclSMPu9oEl^)MMw;VauVOC?I)ipws+rmz=%Bf|ks3iBT;u1G
zxFX#?Zll9JI>c{Kf@&EkKT=GIUy}743wRigOt#z7csZvRL&<E&!X(8by067DR*UKq
z@9|CEjhbgJA-9BRdc;PV3VX~~`F<NQV3J}J6}QA0?S@xSC@GURa>$n{ws$ZKkwkRL
z=)PqS#J^59NJk5kDF&HCNOAhqJsgz`$llX<3N>`#^fH|;R#Fc9?i{Wc6#t2H<a6|g
z+w|Q!#J-jM(o!=-$d&1PtE4SY%rWBi&>I8^fqBX&BfxCjT`x~(f{V6jR^2mi>bfMQ
zm&wjq(U3%)9cRjUpstn*%)&XQf_5fR>qieI>z#;^NcN4XiyKajs;;HWn|`B_oljMb
z>lB}25x=<)ExkU8Y8d)$fBw&B0@_HPI6hj$2;++!dW5NAiiK==puk_M71`<%xQkht
z4JCE2##8-&6%7zTC}0%VTo#InJkl?H=ayqhq%9irpWGS`Q~1vvB`Luvt^3u%AUUm`
z`nc5VVp|ygnYdK@K1@%8_{)DEf)mcF7J*~5T@b-H#z^Qgd8TlK^W3ZBulH&Nt$$$n
z-U|f?nAp7XH=Rj1<y<2*gHnBV>ye+$Y)5&GsyXosz`FK}z2D92&&$LU<osIBo+Mzz
zsU$F~fgP|fnz0M*8UbJ3L|xJqzEX<>M!sRE=(aN;CFWiTxc~AXoXgmxI94c&ZFE<(
zJ!;sol2!Spupihrnu*?9u!yebww(Y@R9f-MedW#Giwv`0@`_UL=##b$|CIrnhy-gF
z#n#l{rEe=0FZ>D^7@kjFEt|8G+_!6d%77L3Nkj>;burW^b`JdT>YPaTe(F?NM}81A
zCwq?vwT+bqyY<+ehjW^K4~?rF&w-h{HUMrpCV^@1aKycK4#*Y7dPVca-V#DZmV^An
zhSoe>paroD3Wo`yze}LSP~GtB>36%aybt<k9W)ceB_w+=F#ECDU=}v|3Qt+s*HR-E
zAZlZbkoIhRFJ($oi78N4rITf3eMF?r*Xx8x$QkdpJ$==Lob4+u8KI!%A|6QnvC=X$
z-1GdpYFT;gAo4-_IK-sbOH=CWjM|{qi+aZe<(rm^NhzB9UKFOmr*{UWSr{XVCMyl@
z59QhG^L{@mS|j(^JLJyYo9bU^8Y@!%>M6*?nT#i#5%sgaseB~e<XfBesI&#lQY0Dh
z(h>~PTVP^0Pr*CtG5hC9=GWLtq387K$&7<~;Z={6_x_cCtK>M>P4Yv*`82>Lh|N1y
zfN9IC9ITPK?sx&TLb7)KOBYJtrARsxiT*e3A_N-~b%}h9RThJ9L}}O8wZrC2UHgbR
z9nF|&hP=C_zJlp?hj^n}umvqwQ<0(s|G>9zv{GyDZyF>q=&rj=Ype$ZVz8W%^RkN>
zi<sgOi=Qb7CP}z+UcVa{OAHgmT|aM_caQz`s^?tm+(R)FhMhH^O*MDzNB;R&Fw!n-
z?X9};7^QOG15WU{klIZR79^W}^2EFLKWEx@=98S8$8axeB8<3`dRZq~rP^}O#IZm`
zqM1z8X*8ywJLCT__7+f4c5U0R^njG0(lC?=(m6CENJt4{&>`K8NH+*bN_Po@bV^Eh
zcXuNp((&)P>${)l``&-Oi?w7qL(N?K+WS0@^N2HHtG($3<F@UJa?5M<U$yfJ(<bAu
znfc-zK9Bl;BlRUA`TO9*!a_z<^(h8J+2?Fye>TN`ZD;@b#2?~0`~FW5_s#&_4`6;4
zX4!CVI6(?cIpX3)gGZw+u|4oU07J1|o-ZKD+((uzf*!Pf0q)JX{G=B7qrgW<qRao{
zoDK=K8J=03uMU`kP6(8q9^Xz64CgE8k$#o&M_6G_=t`*Lt|W>Kali7m20n|%)8!%g
zoDn%g5V<g+BaqL#YWEd&3Ai5lg~Ys#{RHsZC{BZJSYz*7F^N0;a}3usI8=lR6L>pO
zTKpPc9~BN;OcW;HwJh(r7r5Tw`g`on$ybvtOK#Ry&9R=Fn~EN2<Sd{%jthoBdk?cr
zxUbZd>lK^YAM`+<>%Vp_P^O1mO4z4DLu@_87J!W@40OZy_PN;$z)V(fEwD>}K@w+Y
zBr0q!R+&=nqz`+j$|)5-T5E;Q?_s@g`m&p$%nLDd(e@CWmwe(l_`_cF%k}lBqAY<C
z0FNa3G|EyplbGPd3r%4neb5_Pw;G!iT<-&Lth5Fps~_X~+pBknTV+Z_qOw{|e6-%<
zkQg6nTz;FwqjLb6uH*N?rh102RjyAWpIX!87j-yA>4;XsoJinH!uaRa?G!~oM2{e3
z7T>*mQ~``T4dPzot)bi6w--e8w2+Op3dM{V&Z>fY>(_s9QM^ekYW2DM)s!_S>tL);
zeNm_ixz)Tdclcr?b{c1CARF2Ij>PS6#mVgl;n=EKTSfP1Q9e*cLa~d0lc8GVRhCRt
zUHByx2p)UB&Kq@&%dhi9`j<;nRHB{U>S;W`b?542%m#1f_Nym9_*qbwyu>93_Zy9R
zYZ6nY<48xtw02|&K%^aS8X@Ue*;<omUT;w!%Oh^5`KM$IAED;l4@MNZHX`YtJtK#S
zA>aIvRjvG`o+9%qU#0kbQ}i!@=cAbWGl0RKSFDxK{{0YQ`t(m<hB&BsQRD81piUK{
zE_uLQ<DqpXBafKWD+}ymABGFSfBMqVLagTNrcC!wdG?oiqX4Z&y-xx}o>r0u!onoT
zTA_?Sb-Q=VYY}p$Z26ZY6AYM5Y#*W6jW^eq>ZM$}_>Bc3@dUcX>7Q&<9j8rRzqIC*
zFV7?Jb@OI`<VF^I))C4GK$>;+-{33Z0SiV6RrN;TG8&t<1cn-_ucP8ZbP9=a>7ytg
zd$U{S+~L>2y5QwT3y|@{dcYi%ay{?7K{3(M!oFhN5Y%8<*nkW3DPJP|G1L($12#fq
zfL5`_EqI*GIU${>UWrfuROLl@8$8GPXUzt(!^ZI-o3-?v)vY7~nb|(<CBCvXU3tU!
zA%UbRp%_+e`OJ3x@;AgvuX3v1ZLnU<8n2b=m18d$m+O@PwwdePSgZiDs~V)43U85S
z==X$1%!^;uqXpyZSL-Tydj793?C<$DQgWocF4EfXemAM0QrUZNeP7xRwhEOJfwTxe
zKyJD59s8>^2%kU<7v%6I`QdkP1qUB*Ty_Cq!fh|=xr-+;R_W&1AqmE3SU;fV?!x;3
zHcNn8DkEdS`tbmGx_$wifvH4Q>nO<GW!eSyE*3DhN_ZEbTjzfLL0~&~Q~e&XpvNb?
zQ<dor(7@2)S7k4X={LGxZvsFJi#+nPZkhw}HT{<?Xy3lq5JnA*LDD@H=Pbd|aslZ{
zg|R!+*jJ^#>5+7Jb(oAxt?cFfs1x^ZO}vDM167#~d;y+Z^M@;8`Ql%aOSMs~nSSl)
zqb{XxTs;+4xK>@2J~`>k?4~fWtY(rGy@HLLGr}j~=@0*E3qYL+wp!yB(~7@Jp8x9;
z)B&+LiOt`5TMNO7&#pj1vCTxta{L<L_+|pK_=w0OT8Mc5-n%g2cBOCpz$Vmm#PGIa
zufd<L29u5UV)exq#wCbdlmvY5+Wn-1DF#faHI275u~PKqP#niQ2wABzNU2rLcZ=mA
z2)I||W>Eu{W>M`=fo6wB=D~SX7KOa$V0m`-Ftq52UjlSdp@R4XYX;1}Xz)dta2oN>
z)ND|KvJS$(qA!6&UFBo}2V};h2VF=~zlz^=;DRzrzlr2r!+z-5ILkeFH894EVgC`K
zBx+oq56Ja`_X6u8xo1laWb;iX(WHl#qcBQk@z>3r_UGjRpS*H<!!shf*R&?a=4DA4
zua2+$=el56xFn7;EvszgQw0+|N#}8^Noj3dGL$FhYF^(m&lqwo&Y+nVX9OFGOz`)=
zV!m<fylCgyhW0*>v;nWfc17D1%@OUv!#vf!?w*;!rEJb}oG(65A=6!bweRNHeK^&;
z{9Eq@3N2aes<Yx8qMRSY-*SIc`=c>@3`OjqGWZDV2uwQ;ZLx$pfUteD1F?2m+Lvbz
z!5`Ymad(6m>(E=_A_Ws!IyZ^kNbpZSzZZeWb!XUkh?<XqAG8jr1_Xe&Bg)q04lFeq
zft~3Rudthg5&_u(%jIAq5Gn!y+*{nc38iG?wZ^wVvk-)i%U$&pf~4wtygAfNUq9~6
z-H5?i!w*&})o)U{+nGy-0{bO2mfWZ3w&RFXBP~7CWW_4c{6oWQot?)w5!3#P!r2@=
zLY9q{x<N9dI21vUX3)B%?=vXa)r@_68Kq#Zk@`Gl(!*GFJsnjS<FnddOA+fa@^gIF
zG@Se~<-du^|FuZHM(^oxGUydkJSu!+M0f%Y_u+AiTJvT=MKNZR6OO$iJOak*G{&fg
z5p?j>>R|T4r&y)>_r#$-U}pv4vkCrqAmNZ}DP8xt$m2RcwCDEh-1nYudOc(!`*|~U
zXA`gt6<~NLZ%m6Yr*2{y@=+uZo6PMqIfIL{1tKwbP<aUTr3lZ6T)bHWv6U4_$ZW`f
z1=_IvH9yyCp&<#)VQ>0#TE$rG&$-$Ti<1oI$1j;8S-p!F+LhMiRUR2H&wY2uziSI>
zz9BIB-AtLXO#>)6$yrtaAh8A_2A8Y}T%e2*_eN)BRHn7P4?hE8*XbZ_cfj&WcF$oG
z4`lJy$o6;Kp#;GA7f={{XU}_U`w`mfypmkMk>Y~vMl@Xp!nvE_wympXff4VS)O=OR
z*qgsRJzG1-BM6VMe60`Ajm?pPfa=_20S$?^V2mKvT}B>5uO#=e2Smk0+0XG~$aXL&
zY#|OeJ#DO^_V~Uozpp<!?oV5c2$fBBsZ=@Q#5R<hPkm3m@Hh;$izGXXtW*E0!nkei
zY(}J@hK@}MPvo;IQLs=?m4EO=-*_e}AqEs3Ph&OhDJh)wO-MfLQ$EMX70bl?<CMG)
z0i|&x9YkE*EH39&O@p)~{>et0v&EjzZ`O6A>OM4w4W8tMYFL`%tW5`6Qu;NKS!1%G
zlX4INJxD0yoM~{o^i<CX;I~_U;e(EY3>On>>wC}uE;pNcWysezMU;W)Ri<N{+}WiV
zxUap1dX@=&e+`oh?lvs}e=B(~Wn?509X_7OGTzC1`Ni-eCpj0pSfTAgq8o&_=E=o#
z4l{l`@#bvAcnt1<d6V_|)OdcFtW;SF%zWVk4F&2_#Cm0v!TLC%bcN~X+%f(k)RUBY
zj1jFe5#Ms|rLTzx%#n48phE3P^^o!SIrT0|a3>@xufK!`W@6MWw0ePzgie<6%jz<)
z|1ZMC;&R?!I1m`}hC%M@d$aQ%{5g30gOL0OX7m?yg!m-=(UbbN{cIrI^W7PjL}eVc
zUwg=UPu$c&h{ZyKFv9P4visG}uJ*9RFB?yU&fCy^)7HZux@(Fe7lQtBBfwhnNzAW+
zHgg#I6++^1z~{T{*(gVa)VFTbYp#INOzdq9#Sub~M!nc2$?`3vGP_`lmgSr6ZSt!+
zkPff2T-t4lM?m5oa(4#gF%XU7e?z&+jb#&=?;J43$3^8@ofH#jVwc0-;>O1{A+ac}
z+`m`~jVYW2d_UxVW7*cF#^NIy@33nip(d5?Ft4oThOvla;rT}3t#2Eg8}DtTdbn$l
z`Ug@%0^S=t^`ktxFmeP8b84?+>@HqT{!ArS{D;n&I9YM|5%1hnrKmo8-_Y;esih99
zhJuKPkY9YHfytun%+W7%bh(|{un#BwB4U7EW{N}M`;SjBPMq7h)dOQIlK$|qsh$MM
z#CQrKcFPMr?ohO4!>anL<CYYo{sba3r?t?N{dCI#Uo^~Wo40XYs9QGgSEELTYZnG5
zFNH5>8Ue;j96$HPt-*e&Ayr8DKM<fnz_%f?Jg)8<e!^?hjlIFAcbo;_9^&J%$3&Lr
zA9=vTA7<}w1k`2dw{BvxYAmod;GlA;eNNU+MOr|;S{1*Aw`f+6nT-n;J(G<Qbc*JY
z)2D1&h{Y2jSsXsNK34q;IozjR9JszdFQTqNUuTVDli^sM_Phng-qiIg>s~ik+hRp-
zz;oE<jeBo?A9b17`JrdcBkPD?qLXXn^W<mPXYW2$0gh&M`JyNPS5d{*veX8C>4z<K
zuRc;Ub?7opXhVW|>QcvnaGW+OC|>>b@*j&sPAl=<0?2u`F=(G|BN8_cBk``Zy8)BR
zmF0Lcx1>g^b6^<l_Jw%34v<gv{EaC#i2SRl=R5plzlekOb7MW}eeW67Y~5JuL?LIR
z!=V6*S<vGMyLTQpEF0td9zso5F_lla<IfwJ9i6Gk-94fryRXy=r5@eFMxNb*bbHNd
zX@=+elrDW%-pT-4)rbAf`vQ|uG^F{F=9`D>bCdhc<hYG8D}o`;Y&Y-2unpZKXddUr
zU*-S1JpZp^9UtkO5P3#7f$Aw}<>CG2dQnp$_QX$HqDNPmc+zQJaN>a2QCAMQIQ!l5
znUl>SpY5@HBc7n;?=SNn5HGpnG#i%jE1-;m-eeO5P0)(xWO4Pwe4?t>8B$%J0+OM8
z6U+9G2^xQEaE>{W#`H?UNRZjwz=4nYO}XLVRju`D#od;^aCGzY^?_7HkV=jY99WI4
zaUsJ+8a1VM;QX2BH1GUw^cJKbi_EYNPC5+2F;u^4Tb~~Kk+Hi2*NkuDY-MnB9{Jz<
z3#r(cp4db8;RRW;KE+d=UqBTXgUz25Rr#pfv%$WXqXVD26mB>6Qc?I>{+ps4kbyBw
zEh)>`1JbbzPBh&8O#;zhUovw)6*v10NXt?{>=zC<C;s)$sELIOuPGDE-dM5951x`)
z#igZQykW@<F@AHb+A8jG(z9tMes=_F9@vHy>VVjQfJVrrka*A<9Xp(A6<DOCgY`6W
z-h#ZR^ZreGHqjfV%)NAH;y0R?`#jBG#C_Pg^=P&0GMjMsT*g(6R9P&I-x;e?f?$`@
zvgK2_qhb|f5sl?&v54^bq+5jQ@lUS652q9oUEIiaFuG`FbA7}3<G90Lt_i%t;^H+*
zhf)^(g27DAq<dfFuHy{{&fBtQmyUQ<zK*(ob657U?uw+(-8=6CoXM@`7EX%`@`S@*
zLK}`si4Rq7HbZs-mS9HnMcn5BB;$=|x@~zQpNYN~4@XL0j$4uOjVu;PeqUrru_jL*
zh2_Ruw{=%=yN=%2oE(oRWUXwE+uCF~E)*E!Yn9s5lN^=F7a5oMY<^eRLrx$}uYbRJ
za9D14iAyHQ0}<RD`-9~z<^^v`y(FVyUOK^u`Qd{R#ZTTAW@DGDPwIPJ<E*82sS}FA
zQr?h+pvq)CyIbqulvED{fi^p3h|baJQ}7IH0<T4P*m$eZgR0s%9}h>Z;F?3=D%}|#
znfEIH^+Q<_q@SQ9iBj+_odv*%A?wTTLJDj3fI0(IFC6$};e@_~@!fV;mF`~yqKXfg
zRMLR5bp(Wju+<mLO+c|b5CnJC;(3d4W-ZzskO?lf{(_mp_27pi3pTdbz45jtJY@M^
zTU^{KVDdBw^ql4sOa4$js~<lso(>jZhYr0>6+f8i1i9Zom&Iv0E_kj=482~PH_nBp
zXv|Fc4qqw4;}^cTC}?CEbC`~mlDzt+BI0=l_@%~Y(p*LJQt2kMxs*KoHjU#y_Y50m
zjG87``*|p4hNyEC&m)a*LK}w5PVp}m=CS*l)_P*IE5E6~P%5+3ovO6Jz&W#}+q+)D
z+fivV-mtJJKYkuD?Z%Z4pA1jTH7dH^>62x%1cdqBM(Wi8(bM7162dP049%DzZb+5D
zDfZXb6&ZK)|7xuOu~C%fMK}-S2_R&hNVAmvSJVI3u3~)$Uq_j})bI~RBDcRH9ctb$
z1aCV<l90&@{|P+_yxQgTXAC#v3SHSH>QW=<zec|(QW4>h#h{>LTMvN7K5+#4Qg4JW
z{*2B`e<|BzqEM5?>+>847g9v%0!4GoFHm(ew_*_tMG|exkF>0Xx4-%NGiiJtyS6=e
z^L8IJ$q|#F6JuWDX3}1u$WqI+;a|kw_0%;)wMbS+)s5Z(XK)5+_XO8y=0Q$}K6e}%
zC>`;&$_zv4DS8~ysEN<Ti|=8T?t%N5P+D*sX&<?;BW3~)x|&%~KD`)rQQ-%{A|M7L
zvu<RY6|)|S=~Q>5Y&r_{ISY>u5tBSCSb$zQzee}st?K;on6^RQ4Z~f0vdJh<d;hJA
z-#(>yYus%Qfm)fNu#3|5hl)Jak@lY?4`uKxDGgh0CKEd1^6h$n8ov2i54MSi2dQr2
z$qui1R*`>b$<QHQGq*q?>)vdA4?ZTY&BVbY8VK$D<i2~>v*6etrf6HEJa6u-47Lof
z<s1KC3!V!81k2#ow2^soiY-gy?Trol6Wdx@6q^}0dfA30rMgcc=s3J_9Z-|jd3$zI
zkr#Mw)x{Zg`!woSga8d0sI)}64xJM0p+?C=zNRWgPcagY{yt9r0DK!2@zIA4H#5T=
z?aavi1&%stHP<5V`TjbZ#=xM2AOFVtUDN&SE&BpUQ<0p#KwZ_uS9tj#%ge`rxvBEQ
z?`>Q&M@7T#3jBaJFIXmhEY(X+1b@QdQ{RIoFWG`A<$F586@u%p5bS~!Q*|Gq-W`hq
z%^M(g{t}su^R8S*eb~DDUg^DJXz#w#wS9jO2|zT$GNvm&ar_$gG4Z2rx$$=16X9PS
z6yHT^%y<@D8pT7;QFVMTAhE^e_tu~|ZuYmC%9q#QNgAc-5<S?ozI(TaBrXr5)im0)
z2&h~fC<BC7GQkp8h|`N$fBn<m%!|Y2fbR#zowoWh(2z4>QL<%7XXkAe;kMG&Z~(B{
zF*6yT)!rHqcERrrQpBhHHFv-4wU+L+S-gYt$V<{8T`dw#{fd9i<MaQdG5qJ*{Kx;q
z`e^`HVYL}hQT7>3FHo2CzeR*V%?pRJL6AJqp#;-JdB-psOY3o(eG{?y+Y2BI^cp+&
zud;hVA7@&v$7lTA8(sYqo>MqJTvG0lhzwNq{h9bnCSHZ~nl2(^)}LefvHQCzW@BHU
z0b&BJ@thuzcv{~ggboOIe+<mH8^aTzGB&OdI#(-0jyMq(a~TIg1jebuGWe3->!#}Y
z@uu3ZF>z8?Lz@QQy8vtXL4=v#N`_UOnf08ZlO>@q$Ll*)DiFwE$`uGL8wL#Jhq;PC
znJVFl&Ko|ME#0RBedW1I&12tF+~5YB`jA-kx1f;BzJ1`G1q-!spMQUX3Deab-g_j2
zDlJ&Hs+E_={N!*%iOP76l-vIP-W0{`<jIJ?;Sw+4>GvO^E>+`SQaq1gmWizr95Bub
zW~h7G5=X~mS3n!aY_Y75?;Lf{x6jY-cnmO9eW=M92#gsUjx%CZn&Xrs@7;%)--i?5
zXonF~K_%?SdEr>R6SV3X*2M6)1Q7g<(MO@VONS1y?|<{&oXL?qex^>H%lwI4=-dPf
z_?nF3m<bdJroAHJt2#sGWPubwpM9YLgD%tA*@szcPm1a|i$BT6ye5XfAN%@B1;A&%
zTWS4+8A4!UlIYi%v+Vk-nLM#auh26G@WEpdnO2S;xov_wi*;Le)d;-?C(>nL09hnN
zdH6QiOM@R|$+#rSPww%Pr^pxd6+diCV6Msnx5WrQgMz=HWncBC_qx4G4W|vf!%g(F
zyJk6eKLuaxtaYEkNlvKB`hw^U_Y8SX5>@IaYewaAh~^;Y4ex!_E>`&alUYCRwT^h2
zs<a2Kt3G(F>*Fs0e*nSra=f}(FcPb@ba7wDbH}h7WB3z?0~DMl>NM0Plz{s6g8#sV
z|FyuKQ4xeb7(n6<+`SLL-Yz*fnfNuyVO*7t50B4k-n_gb8doAfau)ClT1^DeR8K(G
z4xKTDH?NAh@l!f@H6Y<SMnw{a48QQrw=Vg?W^lCHW%Fj?xyPhir00H^Q8b~%CSVUt
z=f8sMg-)Z+HMrHzJ@x?Nc@!CHA?e2I=R|L6^fF`VL!cpjI>xIX*5i#}Z<~C19~<+%
zLz1}wmZF)I!XJDsL&Tqq0?&9^ARJnJ>}%#^z;9Xq`?ajG13-XXS(K|C&jHMF;4@`p
zY}w9J4kCKAay@`!gGIgA1*;w}r5iYj6UUf$qiVgVAXU<2Zb8@Z@%G<ss-M{!uOg=_
z%r-K58aBwqnSsiT##r8Gs|Q$EnA@N^Q_BrjRujC%D%@#nue<Ln-WcU;q8-e~o$51+
z*WA_{f0&rjw1)^HqJMX`rTu=%?`N`jgVKIO5&a~C)9!3d6aa5{X4Vl!?5kqO)!<X4
ztuwX!W#kP{A4M9mhfpkWQr=vuK_={{>=LHfmALDvy^+EES^~YIa@uE>&D@!5js{{a
zEW@mZ<-YKlH<{>5bg%N@)sB0l<r5lZwUg%F7_D`|JfV+f*ClB!OZ3{1wXTXCb{sE`
z5=+YOuBuYEg~WW{5zy4rY~Z}v8NW8%v*^wFKwnlv`DnzjKU1}gD6UjrL#kI-j67Gh
zo)nPovj%O==Sx4MV|PP;`<f81+k>k-=eL0lxd$?27(z+;7_Ix*m(wW+qaC-qaFWN@
zBeS0mzlzmv>Qb|-7@EBL9k{O{IGU^VxnH=}1RC-;TWnPmpf4VySA1X5VRYyg70lIr
z>A*4K%DAtt?qtc^J1+QKb=2a1T;tM<B~aht52p1VW(S?Kk3Xo3iE=MqS$s5XGMMJI
zZ;%R?YZFi?WL)xcW*+B*(kuX-7ON%Th^7467^n)sxjuiqJ^)J1OyF3e+E?vbi?JQZ
z|2}TjkH3<cXq@?NkKbIS_XnN6_j3*tZG9CsBi+CoMQ0*VciPuk_!BRamh0^g<|`3z
zGMB+ZSSQ(|w-d{T55hm%sbe)?QN|fKC@{;^#t}~NR|?1{iv;W42BRfpBvGTKx}2EU
zzt1B;a&m8~^=q-)8E>PSZ$T0xN0oE9skc8jO*m`8o@TTZS#s@;Ws_y;H#fa_{+?fC
zn+GP|Q>+>_`+jeYoJB|BLibT$a@FAX<iRtTz`5@V^3BVf{){O*4;wrC_j(pedCNog
z3cqqdV~|Qga)BNdaK(bW<1>HlA79Z$#Vb$#de?r<&+GU%{Le-mKs$<m@b@cXVqX3I
z(0{`_wuoJT)~1rk(A)ZxCwb&!cK?$M5R|EEOUE0S59E3Tr8=-BHADm%0i+0;ysT*X
zG+Rv;ztD?h7{#Ut$nRd$mMOBY9gB@iGz>lpIp`p_3+cNY6!)2UZ+n)+nchdThJH?B
z@QmMdqLAW?JRj4o@H**>(RW+J*_ElDkArt?e<dKYZcJyM3IZW$vsS&v7X_FS*Owk#
zTi$LInmdKflKi%p6ymi52|PWKEHBVC$TYzu2xZ<8defgE90nS(=q*EI(40Bc9Sz@!
zfQ<xYF(L;xoAte_A6&ir;W}cSY4J!ZRyOWC9c1F$%iw;YYYF5ngWm}_<#rPaE}_<b
zM{AqFU{)ax*Tp;hV5WVc@7+BY2Wvm9wOnJ!RB8(Y=S0Dbjx@%Mx#sg|X8310{tQTW
z&~Vqsh1Z$!&T|(y<sJCQUtbpz%OpW$$<&hH6lxh^%6`V#y0eP;mrw|RXf)y4<05f<
z%j~3`nQ>G)BI<d{^e*bMhK*gI6|VfHXS~>!&Tf3%roleOFSH)PW!TG}aP#IRFmjo@
z=n@?zeuj^JliLFF5;5s?3*eyTB6WKIs`4e%NgaE~x~-mt?}hFj5;6~a`vrUa;v)4l
zi5XWx8Iww`&Wc_`iX1-Wj=*YYB}mB2(VR&yB9~?abX1+VDgF{VNGu?jI#eIK&fK@g
zNGEC(j28W>K}S7d#n%hMv)YL9X~W+=c>|lS6IE4rxovRHSAAlh0Rr{R#&6pC)Uuf=
zUJE(72Txj9YN(do@J$=y@={tHv3RJcHhzs5fMT*~*L-x`os>8DB;@^71($L@G$fbu
z@7bjor34sfIu|RI1Bmhe-O_~DLf9FJYf32|@e)q?QcSB<TJ{V^zn#*UEBsrfe0vWv
z0(<y6zfJ-h_lfpb%g8^t82QP3W7VVz|62K8D4}=CSDvD9fLfeAK&i}{`o-k>DUx^b
z&?4y1(;oh69=lLe|N9ITyLWK!g?DjSpvYemzkjO6zyDORba79aAGxrZc;en1F!<7}
z8pHx$D@HBh$rF~ojYBr-1mQM)F);P3_8A!3)}vKi{qwC$lHi5=)n0R{UpBKhf^nFk
z3lOUOJ(9p8LQE+%_P$lT`um~(o>Jh0K^it&B^O7WJUt}f&KHHhe)Ksmf|*<UXaxCR
ze>Ot6gN$9lgp3ZJG~@d}yMUJjVvD#Zu>IwKsuTQ>5p_bTxse`wBKVu`Yr>!8A--13
zOA7o@w1%Jx?|)vD7ve>seRr;~RYm+p)jRT;|Ga5_5b&#sGTQrPUnL8>@P5;*9e=n5
zded~^BD9gcycSg2n<|<r8A1%VTklN=2%!?#$+t>-STn%{g7V-97)AvHDyJ0SVP~)R
zCC(gC96Vi9M&dP}6chKyrq)4B=f1xFMp|Jq;*YS4(qQs3%!I6ZpuR5DkRe`y0-LG~
zQXbQ{E|xbwr%uCJGQ2%t_Zq@vND5D!nyG8J{3$qHW`u`Ob@vOO&T0&3bE%*L{z%t4
z{YBw}=$LUpAK?$X6XhL2_}BHeYoOr%n-H0Vcr*CJO4k2XVetomX{a5px;(!J4XDPh
zrYzM=|6W|sD*PAT)|S+oVn^{p&YZsium|P{3J3!%#6Upx>l7&OrK#M{(nAFey6+1B
z22@$Jf_q3bmOpUz#dP>N%U}3`%Jl%rVRte@%j4PsIBcbE0?GRq@E&#e^_T?g6xMzc
z0g1ASeIRZoSGCNLKiMEf+5<$<jaFKy%YKSMdn%YFdb&3gd+~cm3IxI6BH|<?ZveEp
zF9rR4s^ei?K><OvEe!=u4JI9IqdUO%D6978_a_tiXCRD6d2hPHq5=Gq2|%Nb4<ul#
zS!^eKM7{Qbnp^x?+8t=PxmL!$8j`X8H*cD7SxDzT$KUT;9tStspKpX0`7@oF6N+-%
zF@Z!W&<+pX%a&a;c2B7O_g=6iaR*DfShPzS)aXyk-gG&<et9n(vUvJc+g;Nz`8k!=
zN2XUo&p+gA{-0YNiyv|StWrR^#yVO{6_N$YjfZH+_CTgDo-lB&h?i;hV<`Ya3U-Y$
zL!4J%Rl0Q1WY3S*Sc1&Kx#aj`ChsM~Mk6rc5&&O3XJ`2~@}7-tCU#9S1_Wu)5hs%U
zZj~&M<!%AQwJhPqlog=CA+Rxbm6y=)ZWpNchTsmK=#>}>25$M9C76)#0D1qy81<JK
zY0PF4&8ITK=Rd~=kvEi3Bl~2JHG48~zO*T$9zl`iuq1~j`&)H*ITWXBo!BhqDtpG$
zY_l_e>B#@j8|1%M+}}6iod^Qo3Zkr#CNRm9K{zrX6#6hQG8aUoXL_B1^x`ZLw+o;r
zXv;O5C{)Ri2=Wvaz5m+Vnu!=;vaFD32rB3;z=Y2>9s4>27RVMr7;->Jw2!B758y21
z0*1m>+!I4i8im69G_hRgfN_?bV}@S}$b=@T@Ih9sI#^#KUzh@H3H1$=F=4||_meq0
z-I6R$^sFPwRinBzdD3^}tAMYNfyk;W6c|Kr0R8~7%%Z^1YxxSVTwI|_={ux(>W2~!
zglbbO=bQ)?6*Sz>0BI@%{QhBiKtyf&8V!~hXmiH76G~{p_Yu$+R=?vT^fI6>be$+r
z)A{>u`|o+y|JnZ#)2$b%SS*O;QZAob@ex$I9i!jW`MxS;qSpgwIh7)<da<X_XIdcf
zcN{S$$^ktM`qg<lAeAZI>J!g{8Wf})?+s;QTm!?KfUz#{{3d9zbAkvNhJp4(2E+`d
z{pw+n1@D#RXIj2r5pHB|z(_zetmg(`>Xp7f!5upS@G!HW78@_DYM)ldA>!~|;m!ee
zF!gPptkL;_EU4xGJG<`1ZIXE=fY-`=G6{TtJ!Ko=Ty;XVCf-HpwfIODn|i$>^?wo2
zL#T3NhFl+bT?K&6O3C)G6Jn#$ag5+!C&IsPu)mkhKPT{ux8UTn*0ne%|9U!O)hMs|
z-M%D`fd=Cts1i9h*=lz=LFjon4zI(uiU3IZi+a}OaH}toq`~%rRUcw8<uq#((1+=m
z*Tzp&I>4uzC4jz~h-HwTmWS^P_!1TsB~lT6W#JYLAHmq#+R<9Y+qz+!Q*Bb{W0UsH
z5s`}>D)$b6Im37(AIgG@!|4ZJ$GxCEIc&q1n9cFtDk%Tkmyre`7ekGPy59N07N`m+
z7|A!_3e9|Fgu~2OfDEGX>geuRp{Af2=9*4HvoyXt2>K~#H*C59jqV^2WrX`cHWsp8
zQlK1J;Y7s>k-*OeL~pZz<<jJ%EL7bLFqVlxIE$|~eV{H42A4!w?6=arPGsbbWGBi{
zQl95Pc!wkyiYQW?|B$`f|8<7;Ct7^T{-4+fe=f*>ANGNWqvbGe)hrh9QHHP1e_2p~
z%ytzf?FLs3H^YGxdD$4|lAnVLprFjIX6H<Psle}N&BLV+cKUK~Pnn4VOOIS|ri_2$
z_PE^R`v7t;O%|KH#&O;#fPDLw>BBH=HXcY>%q-~1hJcdI1ng$0%Wpv8xwRb3mIF3`
z8g2qr$uLTJ;6auK5HDpQ_aj8h2F@(^cpc%xX5gIGm;}k@i2d0Z*rJsi4N$7bfIMz5
zwQ^(lvyb<K?lziFaUxTb+WtTz0^=hJ2`;1lEI{KO0*T^z?$;N`VIEgLKpRaIv;=;>
zaofiS2<k*Ia3#S=d{|!cI#0Q6y5`#psnG|vqe@Z;>966Q?k$vgo5StGUair+o&{su
z1~9;s!DOW+1I9P%(&UMB490fTyue*@1=H;-*aYoCuK5rc1HEej%r-Bes$E~sHbpWV
zjK(H72BOGZ@Or=)jZgrX7H$={;NF!7LESu+a>hi*e8)JgHLH=bn}gzbIH4#V_h=;t
z0r?^ie1Y!=vB8d^iH6%7ml@WkY!HG5HdD-<f!j1~Z)wOd!vsl!Z_Pql7@zTA6Z(cL
z!S5en4o5H_+ZDwyBZ`lM80Ph?oqmf_5C~#=Q)s?`kri4kMQ($d3~(5YI?o^{s^8v8
z!0*$GH|82W?p49t2+s{L8&L$tZxz?O31)@qU{|c+uF)O<Ol&{6AR=PjQf{#+o&qJK
zoj@T>zV6HBJ~7$Br!*^am)#P3kQuBt3rn)Hom%SOr(+lMK#R8k@K@!)lI9)Ct^2^T
z#wPqr%7>4X?-!BGq*9-0H=o%eV12&hQ{de+IDM#C>O`vBJZ%f+0+nnYKw@0(cIgP#
z$mcy2AxT=wW>+vhtXx>SmQ+Vc1fy8od7DU6vUDvV_DlzW(bP@A{xhJkV9|Z?NDc5g
z1pS-kP4V3Ub2Sf~LzP-!mR`Px5;8c^Jk6j9d+yDCF#>Kg-42=%%uTEJryM_1-Y*9^
zYBakfOAo&Bx&^#Kqs9`@a$@Uhn9SGJkab+2HDR5L#rgU=y$5lFycDin8SRfmS$_V?
zt1CJaS(-tGQvqWl+UwO>uIYyhc#v)6Z+*(8%2p()duKm4T44e99v52-g7ca4Fnb^8
zK48_@sw$NbpGVg48T^42CWpj340Z1h^%A&@J~<SsReZHj7qXuD(ZBLw-DETPtfdOc
zp#3zZQ5Ql+KXraWE8p8Q7^{S?<9T|=Vfh@r;S2FE0IkV^$wnDP;vb%@zPj|=f^o^E
z21Z&0CxyCl<ovc-ELNo@PCMh@xGiU4WDiZ!g%Q+@G##3zg?FQ$_SiWnOECr4*MQeX
zDO9D<-u?%wxY-{L7XR$u|BsU3pXb8&fu|FyuKD5v0cT)fpqKMzT2%Zy*0)CL_utt;
z_@cdW92o4?vil2dHWPo#>z@nvPpYj^o363DX<%&WvB!>QJUM8=3uu@6?*Dl0D5x|}
ze)=tF$N_tzfb0Rcp)?DSp(vp@lh7#b4oOit+_+O<2QgRLth9@f3%P=MG3zJl^L7wK
zEqvN*LQD`B%CN)A!I9Nd4I?L72l@6EuHuw-O8}QMnrpt{XkC1(QVY)GiDmqUc$WUC
zgj}n(v0=;s)R-OEGQH;{%?2u*=|91S6ny==$iv~#V7fTd+~1fu@Dk9dBu?(N!i7mv
z#ai9)G-3gcIeEg>T0D4#gUMtlZRbUY{ez2}Irb80hisPksm_4l!LofY0A|TKf}d-_
zx%rZOJp8;lveI%BkGvnh2xUpX5oGKr_To2by#4eJ63L5uVQ^m(68wRbKp%RY+t6;(
z5`8VaEgT-CXU?u)U2SWdAbDxId%EBetCXbK5CzV@&?UFU_YEevT-EQliivSXSlN!L
zVgSksb85uCO4>|bx7Sw(9=3vp(iIW=PpYD*$1vKZ`|%zPL!wlsJHsJS<3YbT14J}<
zOWk_mfo~TY+-OG*XBZf)cY!VMF4*usk#h}A9Nb8Dfli<1l4%~tz3S>r$Pn5KsuG%o
z+TxO+k?!ux4?QeZu)2j0J1h!J{jHNd1`>j#k@`@%*E<x_`U~RUJNS>ydeK&AJuhkG
zdhM`>cnThmvy?g1f}uJ^4)KN?heRoHL#hUPhz#?QTT`_Ww`r|4c}gFsj#4uH62QVI
z8+OHBAnxzs;}A(t_6*%8I@u*+7c}VkStoJwjy0Cru=c|u1-Gy6$ww{@5o-$I`EUsH
zZ~$eQm$%QI@y}NQC1f6NX%ob;PHIc+HWUOICIO|=eC?~lNzvk{mf2s8|Nq}I|LeII
zgZPWWEW1`-m)_T`2lU0aet+t7IOEQrHIsZe&puXV{xVd)1;N&p;Ns>aB-gn>Rn-rc
zG^9b3V^s1j*$qdDYU5Em(StJ56XNq$TPg}2O6VT|KY&Ko+1u-d+ZyX!K53mKbh&Us
zuLx$^*{dUI+pwVwa%q$;&$LzoKV1RLX27bDOv7%%-?FQ<r3jUL%^Jhi0`bUgZ1r4e
z>BR<iE?BtqL+7ZhGTv=s_a(ogMZAqcam2@I@!bh^y{fz79u!d?eughOM}LTAVGF1m
z9fhEbul`^iAHplC9&Jy!A=YUm2V;xt#BhGjH#u~oyQIVrlY2uwg77BAK+)Hj^omc#
zyMS{JHw<->NcSkBm|Xgr7QT7i3oKy}9vEKV&*Rb?@jyrtE}v-9kSpn%vD}i6DBhlo
zBR^bB%gq8BRv;L*biw3Y2BgIdW~oU~$fW^fXaBuN%Og0{xaaJ#DDLvvs$+PXTf}*q
zM~}U0ttc<`w}OTu+d_O^yhYpYQ~Y<IqjyKub6QU9!|ZJ9ewVBo9k;M|J)aXxiLrnI
zs+HI<Ebhm-o?K+)rdzn1?+Vxe<t3d?c3m$+(N_nZ6vr{oMNcN*snS4<zL;;t#Y&S?
z=(N*p5V<~<x+v51=Tb|XQbkBdAA3R;)dxJT-UR|gMn~N2^S^7U|1SLh{oG?Z0EJY0
z@^BN+%R#-i2vq~{s3;Glh>KgY#YX79AjuagXF%SqUmOxc3?l<E^zO}`DaJg@@u?Hb
z^>*Yno@(>o1*0JilEr;O3;p;>)*hT;ooMOdhuplSVzTrTWLX0EzHifhzb4>!0oI3F
z<Jh#PX`iG~exn}-JsZ~~cm%IJ=I}jHY!Bm^k=aYvrLzuqt)^r*Q1wDY_N`u7ecyTn
zd^x-V=!Wh*!MC$Ey<?L;HOQc8;19)SNiH>q8iP({dL8FTAW&-aF5vS!u6+P!@yhZd
zDhlfKJNgu9my6>qR#tWWWPJ2#*dc3Ne!s=#8J!L=Jh5Fm2d#0~lMaMk_w+N<(dct)
zS6+IPazJ6@IA(lkT%)f{*WLd6-7Q#b)i`OGqzSPRsWs2%4FfoQgQ}afD$%5sBAL<2
z-<EQrcb?waqGk!AmoC;2!RG<x$=bnFO|jim`rYK#r8{+^;b?aszO@(&K`Zyjk=0k1
z#cAHO+LW~=N8buru!&P5jWC#6C2m?nOg|sC5JQks2t;vFfMrmUNlV&5S7r2CIa06a
z(cIAtWW}o&Wd-$admXUN9;;^q3<e!GBf~Flwggh-+)Ia~`^emfT<+}f${6pHNZ356
z7EZDr1dwp(`R?SO6`t)^w&HIY8Ja((RCUva+ebRvCD+WFdmr@uj&&HYtmk(#Ss#Tt
zf!buo3E4ri28@er-!SBjCG<ole@CKizk7`g3W$b<($q5yf~!-n4GBO=tvs}WJne^v
zW3<aKf_?Da4K?0C6Ydee$Cp9gCY*O1+ulw|9V~@x-MyCV=i{i+9D)Y26JS$x3QDA#
zs<K+p`oJ$Z?X^QPZlocG7*mURiQTayzj^6x?PaX|&G-MeYx~!B=tqhG+nRvkUvv;Q
z=$Wxb54<oai`^sXp2&zou!kRYoED`hN)U@{<muv|mOqZz^6c%&5+*@(q>gJ4+M=#v
z^VkWefHhH<6Z6<dovh5zLv}c!!)ccw1Vb5{P|g*(RPkpGV2kr_!CsEfG0agHx3U+I
zN0Jju;-jB)f4#0|2gC+@-556Q{(cUbXf#UQb02;BphbjGBs2u-8-NM1Vumu<XzI8F
z9p~<vocW^cvI_B!fEgT<w7K}>RRWHO;qEXt{4%$Qgmm~F9K!gpeY{B0FKjYZ<Uaxb
z-1<f&haaAV!v9vUZw(a69So@@jdV?ZCX}DA`F1H*?Fs5JfRT7s3-Y@MQM)i!x!aE}
z;S<?s`&qzE3uYX=%IoF7XODS-@r8`nQKnRbxQ1Vqf0fwN6_FTU{rIQ}rCI1~(dXp(
z9g-J%z8pVdB`i=&VH1alq{z%^-W86qiI|T~oK{&;pHE~MK0V$6&i2dONCCj$q;+g;
z{}(VDO8T_}z)fRUV_u_zv}dnBl5>>`@EZJfdzQLr3t~#uOW%&;5<HH@J6lYH$U5%y
zZAo)6wAX;nLOn9J*9es5h4Z<h+l=(J4pHxfAshJT*E)RhUtFo!!<JC)abh>rA9>>b
zxz2h7PzZZJH~Zo-$%y_G-=tNFOfJnf(`t4jS^G?L$$v#x65k@TH=w)167UjX?}UYp
zEQjk4U=r`49JRauYnX%!0h4%sy9Mxuz|mc4D&;s-%wcS^;99^6*AKrlMIb@S7zB9-
ziG5(3rsxlR1724F_#io%FyRPmhau%X4J$KuAZPqDty9)6DqxLhtRduhrzBuSJeWS1
z?$pzl;8~r-S+5SU<lyI3G2qlt$`*?!k?}ZUq9=@;e;5trFn&cULg!vJ=zdr=R4!{I
zPF1rcm9)7ksA5uGes8ZGAt~KYJk~`{s-6XAy<v3d&$5yFQj`1@m&H>e7a#bA_I9u_
zMA2tTs|;56ou6(F(c%j;1lk34)_V2UV}v`@Bn<{`$-ZvCBNL55;?wbHbp)78iQYYB
zUZ5{ey??Iol+ZR#><Pm}8^d*gpW+w`A7(Rj-Vbv+cIRRCA%TPgE=pfogS4vw8Fdm}
z{qhT$I6z?^&Y>FL7#R}TqJvz%%PYX^Ob8*AlX?94-6QS+f6N99@<w21;03kq?cAQc
zFFoiYeca%!G5`we0cpukGB<p%+TSN1O{hkM`=8a5bz&zZ)covx^W1R<{o9$)JZ%_Y
zM1403v9SHwbl!cs1Rz@d4H#iSW%X?2`_wtBMsmAM-2K)EhN&pA47<Wo;kz;Nl~SWs
zMCWvgv7JshOWB=d$jzNcu+AU9u>}`tNB(g80iby_H0gHch1tKhl>ZAP`p@Tzslbl2
z-;vQYY27D8NCL=XpnLA8NFaa@OTfa}-WF4Lw?4$@bdv#_&g5<+ih+9+gQDXa&WI&r
zODRPwd0}k<(WPu(m+})v>0xrb1m-28lT#2MRc+lA|18o)?5P4>{15gr)Fps6*B*Io
zlE22Nmf1^{`#Do;5FC7$nIJ+3fV9oq1FQB~6p~Fi!L$|9;w_dm5eX0Ao-vVu#H~wN
z=-S~_Zh%qoHZrL>&{LVKC`|EtkR8-AhY2d~Eqw;|zV<Zg&oZf34QCErKZ)=3wI%V&
z8TW+{gwOCZbJNI1?CalO!d;>02&1X$;(l4N@dyt4ILXxEVoZla7=otZfsg7Y!~NQ;
zy3gj&(iby|y=7QI>T>lVoY*01pUq5j0fafU+_`2mt@9HMgAY2g`ptP6MAMNa>euyx
zQb|Lr#x`4y36WJ%eIfI0dn?xon(2nOMY)kNkE8E2^o*$HyNpH6*4IRGlrv#3AdV_7
z{))kEDi!)B@G(c^{wv3Z>!UQ(?oGlR@w?3AHSS99j2*jU`kiGmoGhkF4GKliR<g+%
z2r23a!gCQ5;Ufe}-oJs9+xE}k>E8v>|Fc+vK*1>E4msKeQi5=N`HweGWm#&hqflAG
zX`zv@55R=711U0)-M?vy9-|xEs6T0II~-_058+tL-(^|yphzWx+tklY16J6(<Yb<H
ze*1{#6gtqW6Q}CU&OPwxN!9+qM6xVP9rQxSPUv~*Q+&f^{-fB{?OdTn))@nUS_OHd
zTl=l+G6n_0$rViJ`!T((0TQ7(<B7c++<ITai81niOkf(_Wy69Kfk{e?a|wloJy62b
zprE)nE*YgZCC+i^02w0gmtt`&4UxD~g$CXgl?9ofu}Z7F@!DS<WpG_V6#R0=8hXit
zY4e&;*Jd&zh((7k-BkEBVd$$t)&ZM{h6TLUDpZM=+QUO4HD0u_>I5sQX5V-7L!NPt
zOpGReD#0}9-M;*|{~%V?Q~_-$uE*a=mJ(H3s-EPH$@)5MB3&Hgjg<_(!kf8+YgCh@
z62Bm!OuDgCq&=FERmZOWD(!I+ixkzRBZ<)TDModH4f@$srFr&<g+efd{|*HL6x+BS
zr&hEV!Jrzr4+FQV#$tlXldS(~fcIZFu2}jXL%Q;F8wywyFW_}rnPKjwTCbQ@fkcxx
zME*t5F{HNXG83^9z8t=vQSZw1_n8YoQeS}(gr}k)Yn#=~_{2cYACKzitgcs%!HMix
zH0gtv^rz6GUY*S-p?lhqG;TOS146&#a&~^8N^1D@JA~2Pr|}4+E8|pUZDF|5HZQlE
zW{)qYr2NpBZ%!oBIZvh6xCa0M2j?@o6#Z6cR^$k(?lDpOowcP?pxpz$iPPusov&;)
zGD+g|0AX`jTjI<t@{*fx^tkm*RmAT5N$h#k>U^R9oQf##e3;=&_JslyJdSxjo*t6P
za=@}w`5hd#-_SLyeKZ&<Dm(xHYK<!`FwFqAZ_u(f<nK(DytB~M*ES%JjF*;rF3_H{
zTUVrP_tkabg;Ze=ZI}>EFuAN$JqqSem(D&L){oGn!ta2YdA%Rm3LQKB!2sExD(iR@
zm2A~mV3&dNxU_D#|GJgRhhOf`yRXzq-t@2o2b<Zpf1PT6iQN=o4*ugQKy}gbg)4af
z>-ziy)coiE3NE!H;!=ybc#ggw2Tn!mvg1r4JKd^cSSU3pzKWedX|yK|2WQEePJgsS
z5aY`nm{X;GEP3ZvQ!h{s0*Is#R~dzoa9m6esY|jO3=Q^|J$35rw}!Jk<a*%(d66#o
zyj;YFF;HfnSZ^@v6}I-{lQ2d7T~RW9XF0W(!1vy(NIT$h#jG4$+3k2(fqYq#RjC{P
zHoLPfyS99T8&2#j3<Q;hsY~_mY?%lP4n+KQqY_*B$*~uYnp^?!sJAmw6#D{gnsW|S
zH;;o;RWv$*4WL|PkKcXWr>lbBuVD!{{)l%ZtdHCfl0eovo-_^(xk%IQbb3;t`0G?^
zoa)5BT+wo|b8X#<e!Fw}nSr)2aGZEaY6T=k9WrV!mx&JW@q)m`YbffJj7&YG@Dy`_
zg`u21l$DXHH~3&a@b|Ury6J=Ig&fYL?tu09-A@Nh{t7i$<LEn*dfhKUl=|YZ9PhfV
zb2j4+!`xH~sHE()B6l@g>cU&@U>F<ulX=iu>&PGkR9F~@f{1*tphD$;7}NhZoS#;V
z*guh{he5!Rt#4Q`>-Wc%U^ID(t^DAw87Vp=a$-94nddGw52o$gxOnO+%Evg(k2k=y
zYjyi>GoEy;oF39)S8M>4`{a4!&BacG)9{8$m$39>F5-;c2D)J=bC({-aXHO=<cdz>
z&*6=k;SjCw2gUx@nsftlqBA0Kt9u*~uphGf4GJV9Nrao`x$ZFDRVLj%OgtL|$1zp}
zqNp4BI2GimcBJ_c8R#_MizPZl01lG?GH;H=39oXaDF|uWqSb8Nr`zV^#4%=Hw>?j&
z<WDLv0!EOLi($5&o22y0c1&iH8^w7IQL_&t%{xr=$D)0!y#Wt}$25B9NvUGmoLHPe
z-?1(%C)3R~7|PuErBt!I;p2@D2X`5bP4LG=WApBxmmh^due>!K(ZQQ?w^N)~qrrYO
zaU?Q_&S(7?M)V9{L26D6dEExB)z-E4z1&*M+tT^sFBc-6R&}GiY;#<fdkb~WWlyNO
zYjj)C8{cE5)>!^?Br@$M)R`cw-FAeMZ4}FJr_iHH3j<LsbOAw}be+)u-wzM(d!ZsY
z6iBf1xqQH!ikZAKj2@+^6YJXm+*SmRP&z&3jv=%aNMZV`uVuam(GcZC;x_BQ@?l^8
zM9k4VhBkfn;dpZ?g+V^S7m5@yk>@j5_O9cTr$;G9JJA{a@J)byr0(Mi_Ded&Rz-<p
z-*F>L@i;({fJaCBRWQ@CvIj>3f9CJ5uAG)CNgySxw++b|KXJcHqVnzqYoMGi4W={%
zgR?MNB@iAY{a*S>EvoK$VY+6z*9QOx#MH6%kQ$yAeU9B{56}h?L~^G5zb_Rs+*?d`
zrz?6Y?y(0G1bxwtu@6CFQLnUL3nUGG!Fx>mbHAwmL@livT-{AJX%xfnbR_WiAZxX7
zHdow`{&Qt74o<U>)}k0XDypJ!3_vMehMBU#bw-g=K~)Q{Nj(oR($_{fR!5D`;6WGY
z7s66A+jH#eiaNzl9*}c}C)9w!wKJ<^Q?F$`O3<E5=QkVNsV*B+kY4PytY2k$M0N`*
z-PS<`TXRYQdt<1mP}YTrw8a1b=X_-uY8P%0O7h=_`T;f?IhV{r{>v1YwazrP1}iq`
zTSi7&k=?bGU?3IHf(R*d0hY3JT)0@dh;DlcL0j?5Os<IeU+>Bf5xcUdI%%uGBOZ=(
zlq_P#!TX?IV0;uJ5&S;#44Ed5?MUqiB!ryL|KwK{fW%RF7uPY7Iv6SANDJt;su<@*
zp{4+jn(6#(O)o#RiL}c|rW%aH$T49-RNbtFY+0g-94M9LZ1uf<8|0^q){#fUvTQZg
zgU}lLE#)nX65#2+p+S6{tb*AL+9I6RyR<3k7Gi}-d{!xa6IMi{eGFMocPzm)PjecC
zfM}=nzL)kRzW=Owr4=aCWA-Akydr-Yyd3|*5Ql^!lkv0`v0V&vhGDR$JF8;_TAt3@
zDMCXQD7T1FfLvhh=*~H|#0%|t_e%>Rbc5d&Y+o)EIBQr!px8-ph~Ky()!jy+BYqM%
zF{vbdfBYVvvlsBP_1d|EY+*=Gu@|L4&M_~aEWlGpYP}-jeQ`mj(^w=)(Je+6VA2w^
z@1U`MNuKe?LP**edvh!5;)F~m<*;CL)mS#Mn>}XwhTuC|BsOx;OU}R+X(V&jcVuKf
z9F@Tu4>qio*RpoAlCo@LR-U)5eaw&i3VSevkBjnXSp)~7k1DNWi684bSRZiGkX`2y
z?2-S)$<fi#$<Zk1a^~bn>-5<E^wNHRSLnCZyvBa&z`pB-pu1c7j(h1|<+XoLT8Bz~
z|CR_y(`6W`T+E%mm~WZ4LVyDed0J*5eUecg??%LRoh$XQ`GoOFb^PMaN3Gx!r{VFt
zH=!i^3pc4(s|+`XTa|#hBQsN=y}j8DLg(-#T|Jr3sx|;~;&cM<^&>m;nh)9pb(P*7
z4-02p*fkgCiToD?XY7tA?ddl5-A`+2HOwiVqvAgn0U7cuqDFA8?ST5mTi9X~&wqZr
zV4i3?bGdWqCRvj7@>A3VRUy)UeRxGoh`G9ON~tS|!J6NAqQ7TpGRXGdZXN+smzU!s
z>?$yr=>W--SyJp`<Lam4pGj3lm5#lCOqWz<UM9+ky-lUU=2yME{keamK=oV@aR@Ww
zlKvce5r)2m2+5-b>ulj3g{D%~14<iq;-6g`kmhN2oIW%kcC|)8si<d<NI{|a{03!k
z`qS-2(e3k+L45VI8q&a#qUnac%9&4Zt=okvdU>G*f>^0hWR}%Sf&NYQt=$Ne56?Eg
z9!=3F6S8x2OulKS1v0&9Nmonngo)(*$kzxsz&0*L(yc$~m2Y`3&|K+{$8+^nbUFn<
zQ6U$#r<aYlmp8wDJE?d~*k_sJESuF@%)C~hgBDoe_<tKyJ1qglCGExUZBpOTJ#~|f
zt|Z$-(zGAeI9*dB<yVJc9=pya)_dv;7vq5)=C`j6F9l7O6j^+t{Mq(6=5DEOmZ;FF
z`rqP_W|1MOE`*?Y3^bgzv3>9oqEJ%PHfm46qJ|a}J#cg%mC<H6u4pPWV)^}@WDf-^
zN?6o1T2{&|SWEq)Hm^wVLd~+LVzlw|Qe)_cZ(5F128=t`J&jkvPTx$8HE(gva+O1m
zPep{#ihK^<@rtU6y`@Us-Ot|>FRIm1uP9u2%0A6K<rr2uxAh^p=RSUl@yrJomzOt`
z^#{#&8T+t5)fG*sT4UXa<koAkeW2LdNp3*jF|PdaE9$2Yd(`<%(S(DwgyUT7jm6OE
zvkRx^3xd-NY80>dU~Vg93kPBHw~|-OM2!cxhMW7j3Q_!(8ue^LcrJ12H=lOSpYv^9
z-c=vy1|%`F)~^?&Mqy@odxlT%co{=bZ-?Y=A8m#;ER3D{U$D?$T%;GtU+Ch2JZa-{
zq085(p#_$&qos;S$gLMi|MTOqzgg4#07lQQ3;K{Y*QVZYJy;PrZIP%3%71_4O?cL)
z;>8T@4`o#j{xsRTW~m>@KCL}&h@HP3zSME-yPv5P#5*=u9=5ltkiyN)9eDY{XrU<-
z#sILX4AG(oM9BAuw2otI7DKAjd_<`VX5X)b9*v~ljH<7CD=s6y{1MQmDZvTcbE4g*
zv2G8kZmBKr^IJI<>}@`0WoKl)TK%@~&9jW0r6oLbTYcb<&`dJs*D9H>Wko4GSACc?
zRJm0W%5x3AvE&LY#@fc|0goFy8)_1(dB5(~(2Q--hlL?yC*Z+fr8X;)`zEZbjKG6I
zajF$aP&U}?kQ9I_!bO>Kf`mve5-3=dH69zazWafede+LYx>vP;%Nhwh9;7uESqxO)
zx1+r`04%O~JtC}VK<)5*BO|!4rO_JN&II^5Qqvt4>6Ec|H@j>)C^lGZm&DJL7tSeM
zU=~~6j>}I)Z+HkbOn%PRG_)DB-TmP99Y6P!o5-JlNae2OQ}^Rcs-U|j&OI7;R5Ut;
z*KCrz%Bkv4W~GB^QwX&dy>;g+R+05f_1ds*mr7Fhkt=KgbP;s-lk)(kw&0Wo-$g56
zJE<1}C5}hq(#N~BE{!W6Lbq0LUPzmm<Ta`lYN5<RCNd_f_Bs~exfvT09vjb}KUb#g
zI&rcEHOBnT=kK+mzBjxe+mdDab>eY?6Wlqm?=8Bvl!n;b+097Wai?^p|Bt=*j;Ff)
z1BbIhGD0cy6d4ijvge5+$%wLN5i+w!$FYirk(p#?&&XaOS=oCYLiXN{b3E4(rEmB5
z{@u^>dOfe_kLUZ3*TLs}uIqYV?>!&8Z=Y&h7tpHHCV&1Jkn1(R$(*t>Z4gD67QLaH
zw7xDRGL7)b$+=?rfoSi!1;2prx<*0;<AUVz%B1%hB{3;aP_w$5uHN$^avQt7e%2Go
zSq$MiTwRl|rRiUTWRkv2lu~q3#np|sQ{n-M-^AXZ2X!7x4E1Yo_1O)b&EH}uvbt<K
zC^0cHxMIlJ0>0@0?@>8-M?P_gk#A$!0}v;2C9Gm@kItH5>)dj`$m@I*h$fcp&Lhwn
zJ>;mN)(XZ-la?saVI--GLSh!nPH~*_(&qWCceZvY<P(r$bj!|e-N&0{wEzJ-dy5mq
zCLYJ@`S)5_xg%o&3Q1wxFEMR!1cCTQZR_1Y)Pe|ogC<Y-gT@+UAbhtL9$bN*t=J${
zARh9*y6coSh2TNa5tq|XA@Z^d%Kh7B>zH9&=97rfI~Uxbk5AwtPpI^?qda}oQtV(1
zU431Xyw>Q_zM8(?$MktlQys_gz276s;8TkXD?2!ks=SV26F}S!e$-ry**l)GC#I!7
z?Rx3b`_kR1iqod-bBM<;({2<AYV3#=JvLzf^*90Li(@c`*P<?@&Pnl^eA9-do!8+X
z7mX4!$>xZT&px&0?4XmL!>M`^r+=H@Ieju7i<NljDGTxaOx=oM-FKX{CZvztl&WtD
z6`gW51T&{L0(33<a&GWI$xo_Ic~U!e1|-P$nX#ND>*h{;cBNK0(z=1owYSFCjKzYf
z^e_GocC#vNF)g5eT=>2=@$;g#Rgs>ChFg2fz>%%Z^Eo|;X8un3c9Z3f|5Nq{d8mHV
ztaY4z>R$Cy$HxuKJbD;o&Qd**dvmzVWdb7-c2`di`aC1!RhyO~5ADm99&YV!&8C@G
z(s{C6GtyBCEsT=n?~l;}<wL^{#s~>!Db^TNc^tn>NmKG)v1!;?FXS27nS`S!18*}c
z(|3>sKC|S(rH$fo%p9d99!QAb=}bbN@P>NM9+z~q;F0EPJ^Mrp&c!j3sc$EYsI<E>
zFJ0Xhre*!S@YFd^g>!kC6<HS7)wy1ovKM7#Q4t4de!3kt>%4=E9cAJFmbY1w)QD*e
zvnSNHZI(r&t=iI3P=T61g>37gu<JG*tjeJFYZX6J$)=ix1%tujuv+1$9=M#~nW3;}
z8S83m4v?YX`Nj8mUL9p(kJRMl?5HnOMp+>GaJ_f~wv*sHNh{HN+tG}CuNOAO3Y7pw
zCM8Kfdi1C?$@dIdH^lpC$$ItKo!A#6Jl&=t#~<>(iJD(i*jrOrQH8Io4$l+`h!@9d
z31X(s4d<`rX~H~%(5@z}17g`^PrlAL(^B8v8zqGce6x(s9FvmW>@T;TxaIOf^`Uc9
z_UYOKl9U$j{U&v*KwZ#rDTa!AgX(?C?T<qyd=p%6{d$V@puN6zk$hXCQTfw|f$h~v
z7xUJNt2<b}ws3#fm7wUlMbz-3(<~k$2p6Yn$2lnrhCmK)KB35%vfum0g|0$=y5{8M
z)bOA(ync6nab{)(9Xe(DWNGo0g|0YvY>#7c&tRL_X9|*0`R~2V$nwuHWp^qAFt8SX
z4E@~_&3tpR$5Vf?Z5Tdd&vVmkK$ePUlm8|j7Ve8%5J$$|8I3QZ5VJGXCl}^s>?%jl
zaY9+N97m{(;MHYCb@lUhd0noGg=!YZ{fBbqdSVuX%1)bJIHW`Zh+;bS<2fW58E1D|
z-Y0)eocBWHBf$0;O!8+hTWSKTsP2e#q_g9~>}c63Uf#PI@fT+6s)a7te2}BoY18xd
z^U=`Mob`od#D<!oA17sGG?5ZVfgW&z<`u&RJ!9>r*FDv!zv~p+PQR&5m^F=&#R&ji
zpvZ{_`);N@b+%Yz2(jfE1nFxCA}3Lhmp8ol)bCbukcM#yk8Req>k;iwmAW2*K_J6B
zAf<7+Kf0;tqxnP48M}CQ7Gm3Jf&ihwb;pgM#-3xujnm1YJFz&#jHV^kjIl-onak-(
zlQ(ddsN<qjQPZ<8UC&CCt*zgHx1^?~ezAGur0xKc&d}btYt;<YoL#H&?vEqa`nzW*
zGfNg$B$uZpdW(d%w1gIVKS<hsgo%>w6i0JT3HCppor>QnP>}rMjG8i@+9_y}dPG0(
z6r?TIhv=za5bv3f%IqmJ>yMnxPZ%)bhNPc2M=iN6sKUK9G&D-HE6PbUr^JW&sv4Ow
zOghrXfo>Lg93|RH>gl`g5;J-q72sZO*~*>k>ccpMAFw9CVq+HMq#Kt-u~W%XR^BWy
z_UaVFrz?^uNH3Tz4YO1cXR-!fw0=ppgmTih*D-dQ@p-%xgkK?U&^rXZO?skgX{IUg
zo{UasEil-J+IDlTsAnl26&5EDPRn!@Q*Pgk$;^~`lp2Iaxh)S;y=f&O8j)Fpofu)V
zA~?c_Z|6ea?TF!eC2fDZ??3<{6UU+}at1*io$B?pK0A={oQSbXhNl{K3ZDg|x1;x*
zKHgLJgAU``GR^wZ@W1dA*#(xW@7WvuB)7$lV;QouQ{v;RiAeiJE@Bh-01^_qm34d}
ze1$QF!M2t3v$2o5cxR0M-fc#{$w}5ec5H&%32sA_-7q!nMuFpAp7Y|J!xK`4Mx7%m
zr5n9`M-KFqDd4tB!`GdDH7~DeBxQR@?T4SjhXBG|hW&UNpnTNu?2EGVZqSo>u1lT_
zbq?jLbXgNZJBuKjT<YFdo4+d)e8UL-T{Kg772Ra%YSU@wbj<w;!Bk!1nK#J(p7QTc
zX{3co=u&c1QtF8Yrjz5S$uO$zU0{u+&~Lv(28nM|Y-5ZBI*(BJnlwDPrCJ|B013dy
zD)}qDB)>THF%bd&fS86rVO*R<YTBiQxVS->ri2N7^O=(C$FOk8pg(@N*Atv1CN8nm
zpbm~2c3q?is~UJw?Q6XwHk#Wka^%!)6fuj85>Nr>9^T7fAJ`Oyz{x!UDnK^<W`K<n
zI;C2dgw)6cS@?~ZIj{^Ukku!RI$;aHc!^;AnjR=!AFg{#y#oWIS~2P=^<zqEl5#Nq
zc>)vQrtcU*lESyDPtATf=3YodM%Iit-P+N?2%1OOjpm<NtR}&*zEaP&9zJayW#ym>
z&j&5wtW;Pfg6YBq;H)PJOiN0NT@upLSSGZBLz&;ZN<}gSon~tczjpMj-%d}>(gbYy
z$)BSad)MyM-~T8jBV}d5=zU4j>m2J-&Bhhp<qD^w1W3*u0TAJd&v}cIP)84{lM0gH
zZ8@iV%UlZ5wTjwlZrqE`wV&7623nN)qUqPhhKACZ2~f?$h)GGWsE@EHmI3DEad^}T
z?59jiVesv+6_65+5ND#Zv#EYY+}_*EIzK<Z0-)%kKLW}(9A~w_yeo_@Zenb_6fFtZ
zvEK;{G(xO^k=qD-?xNq0MLB&xCkW~mq&SSQunDf~LM>0ewAgxk*b895!0z%GC0X~z
zOv}hfz{ijIG~TMAs=+c3B+Hn{p9fC>0{*2gL6?b)E0Pj2w2$LIQ=;w=NE?R5YpIV*
zRIS03<gZ>mLY|+cAQmtN(GR#@4{V$|6miMwlHB}qoI!mx^89F<-vk)F9t`@r^$}6}
z=aV#^sw?=^+8VH1$*}9by9wXheB&K=?VBYWIk1qH)c8d!>@=BA{4uQ2-AFr_`Az{G
z$-j5(45!wVFH<^$qaMI7#}iY;_ao9X4YjbVD)|cX?Gm3fW&6>Jl%%*@Wotu%kL>Ka
zA`~fxA2FaLMc!?x^R`QI63%{~Qi?ork)rZt81wmG$K@t*FI<DY@^Z_TQN&0oWscT?
zfmz?UoliKVb-=6nJ|Uq7xw8V=Sj&Q@o0pT`S-(ivENDiiuCj?y^7%vMafd+;V_RFM
zE^Pf?Uy)6cv6Ul89=8U?P>rB!3=@LR0RfJ8b1!`%WcRS>Ok6-1L}wL~KChmwckOP3
zhShv~MU7^@*|JW_+TtQ;@q1$7tRMuJ?2QgqiA=gn9zf+21g0+dLoUUkp`C4>Mn$hZ
zgX&*Qi=Lk&{)LiQxQW`(3hRO{Unbgj)HFk^RTjqxi1DQ_LT)2i9G|5y{yH+5xVyj_
zY%ZOgjE@j_a}J39@Krt;ZcjZ<e*(h(JcQQFQq{rV)^2^L$KCI2_c%7z?IS>jkdeAS
z+;p#WcgL#uke7E)NmF^=+w-L$(``hpc*fl$FZL;e1|!8PgJhus$=B!(SNgf|eKtM*
z7kSGnJy$rf^v%=IAM@?%0G`5$zouse&CI+PR{%)=>veIL0Uu!T?iWT$g@%RIr$0M~
zCa9{RCrex$i`KYwWP_hIAPunSk>?j7w4E`2zcBpZ(+A4dh|hfLfVbm$<z+No_STB<
zSN|F=Dhrft-)H1Um%PBq&BMciPm;frahvJZV8M&8!PhU0dV8VpU#8z5)!PxfVgF4)
z>&PAxp_rv1R9K@i$L)^%{l_VM5&(?Bf&Cvqw?0+o2d|35hv$Nw9{xHb85FXEZI9EZ
zA!KAPIgSlzZ*ETMh!#br>z=#;^Dye{S5u7$Zf{r0vNU2imZ#K1>Z*A=n|@Fwwo7)<
zxAcMJFlB$+W0503`9bQ6+}M?HiR|LgI}F!)`yb7ZGdopk1=126;qFcp*)(<b$EeA=
zX+ArzswLeoQa7v3x(JK@j}s}nvu?nujJo@8LIpUgkIIK1tA3XHWO2sSGb1wr&nT}m
zdURBOdTwS_D~`K3Gq0=PA$wb~LC{}<Mw$Ba$s?;1yaGrOU|!QFcNKLf(N_HfzE|F!
zB%-#N6Nv7g>}vV6&wT{T6TS>zT(9aYUymU94|Io`;c~F15$8JtmeDV7%FbW^z@{F<
zsea;~)M;?ad=ES?-m_-n8)_edyBA{@l{t)FjUADQdNX)&y_<w->NJD|-iB|akI0XG
zEOGB8n34mm$%5Z6<JAmsHHw)sV(FKhU_JG79WtLRw;?DW5Y^1ro*zZUJLLOEa83X3
zN8o{&26bKLF};YTPZ4)yTgTj4iF%0*Flz<H{Qh^s>mL>=#KgO$u&eaXeLu2|9~*-3
zVV^nCeOz<Mqf&*O%&%zzDtY7?pFGS~asQuem4h;!IKLRrGlK~NI+wUVJBqTVSS9Xe
z1h`&u9>39691~ehxx&`2+J6VG8mk(OnH|w_O&O>FUl<PYjb9f4>Bf)=8392A?oq@b
zxGn>E0gGPR{=i30M$*Xbe-z~V`19dZwqiD4@64H#`GIa$W}NucFMd4(O~;!%o^zh;
zKRKjNAe0g*HoE%29GovypZ+M1*vF~+jC!$p=Gk4B&zfDt8tv60;i3HXjJq1<x+EbG
zGxDRt3PN^qpM)lB|AB-gD*N@)G`V|kVOM=9qBUkcLIfYq02F=(h4wNX#WyJA7WSPv
zq*sf7-fK52wP#L8kp6%R`C_<GrAmQbb_hm<3$`95jQf`X{Smt#%Ed#Pg9hVbNFka5
zVBKi;$<@QZ|AZYG4Hgj|Aa{#OJ$6C@&=(*k_Q*4zH9lEDXt4i>u>V8Y|NkNE5^fX>
zZP<oziB#dxy<qe9q0@TGj{kybW4Edy0`1w}*Tr~o0bXzLltV{Aw^_Z!In`cxblx@l
zLD*bh&zvZ{@^P-=bo*0^;WG*c+}^#493!Of?lV<);}fl$^-pvnH2cTr9qb+1ySh~x
zP15AQ?&8uPa7_2OQy6LU%JN_Huh-^N(k>f~L|o;}I4I8?=dKfi+n)_zo11b{Z;11w
z+7Vy-d6ODaLmE-rTB^>@$nm`eWXRg)x^J(o(~YNtR`Vf@p_49^@d~>dAlWwB;cQ-B
zo^=zISmdJQ{k;Rm5Wt9$3=xbNzF2bsiZFU&^rBqhVO9ZR8|qp%aS@(CQ(>Q{o8)o8
zWNI$&ON>|lQewcvJpB@P+Sx5{$<CgiURVf;t-K}^94d1!N9hdLTb48h_48f#>UZh%
zUe9fRA6N{kbjR8=uCQ)8ZQ<2_3m$bV^^@%|6MVP+^2%tYXbS$)^5C-UnT8z&*p>MQ
z+gd>DiQbu``Jo4->}wNLKyv=I4m72~vmKk~q8VY)Uv+T3t|FHXxONT4{{El*yZt-v
zaCt{X>1=l;PL7XMc7GM-Vtc*XEGQ}V;fcxj^%HY<%C^CD1FXg5hrFG#$`7i8=|)Ex
zrN@o<5s^74SxzB^GtJQvIj_PWV0YLBJux;`vjFXhD#i@%g*;hUSyuucJLCqxEb5g|
zTh@omAK3=nmdbIO+S}SD=+ISowWq#weWa*g{-JRN096h$APKPT{>&}lHP200yy_~u
zBNpD2LrkDx#2~(UYV}Yu8L(pxSvddiRFJ6Q#!;wEn#fk&Rcl8_)>%3(brFQ`N9TMd
zExp3CiB!5yvLH2xcu`S7K>vf5<M3NH(K&B=7mbYt(W&|PkEL4Wu0uviw(y$r<>_J>
z*H-P>P0_9QEp~0s>~b7OMd0O%?0v_*7VXSU?aez)Jdr4^VuNe3e9y-uey9@e{uqJp
z4g~)56t-#P_;5&h%hv5_q`^i5A4Fsbw)<7ODgF>$efO0Bd(D5PusH5;dWUw~7frhB
zPS-CvXnd2XXbijj`Ua7IQ2$$M6BF~GAwXZvq?=ol=}dPn>7rInE9vNb7tab{uW((s
z=;VULA3iTH4OMekdwrFLnl`ZJ<#(A2uUQSEN*M-hhnV1-sK}MI@8+&9mW2zcafQ!v
zi3t!NmhVi@Os(}xLwm)W4lFTNV+@ty%K$yWTDN_(zAVN3b-BOHD{b)EEZ7_>z<@br
z^WiDEL-$X~_b*TB%!$8VKA-9RKC7Syq5t54r<Q#^o{40T_K>Lco@B&(;AiJVt>Im<
zTrk^ndaC2}EoIW6*1M#v`dy}*Rcr)h`?6e*+zNj|1(#+N(igF|Pw`yixAL(@H5VMA
zJII~VMBp?YzuNHOhxKlC8-t7FfYe?O1ePmUi1zh=#+yPK<Tvs`ZZnAIGW!3}Jr#ZS
z)u70KFcH?iq|2%FC`n>;VZPXu%es!sc24u_1*k}4fvw!I3@W;7jvuG9g;mYX>DmR-
zTtD7BVZDvxZx)C`MwC5ZglIV?`9zF|x5$9aMh`jr)6!F~@JT@ha@h{|z=}~){k(xP
zHJ<-|F-TJ(pYJgipqqI>HyyPtb9Dz$r;Nh@UEk>6DOU<D6HBWD3n8PGmGQzhu_LqP
zwncX@vfJdW=5NSvH#J(;mE&ZzBg9AKH}q3(Gbf~c(2>`L1%9=78}b-*xhPP!U+i1V
zu<1_?dLOI*>?8?EePfn+*yiw_qBC-*toBiAnnCm2aly@ZSKpVWa~MWApJbTZy}7e<
zd|Z2z*3|T#T^=nzi{0L=m{ajx6_xiQ@X1Wk90%Q(JO%lMind`VNr`Xeq~4-_*xgXi
z!WjlIURGUPfI<ZQl<0fI3PmU`!^RA?($vC&{W`fiyi&tb-N>lG4B0fBW2BpVa&1#q
z#w6uya@y;QFRALnlcIR;(@dX9-pmg}1Zy+Q2MrI$$Jcikne*^<HnOpY`92b#@<@n?
zhP4eCpuV27ekQCSRJQTGWTl^G(V0<><=rxQ&jL}4xO3_73H4p0mSLO~AQ5g3#Bw^&
z<44*h5QVn{7}j#Fn4u@Xm#pJe4zwT0HR++$a<S6w4dhC<u<&*1Jh3Yx9QPJVd5TSE
zy%LCqTH;Q%psady94_bAm80+z5)!~zN5_J4xkh<4j+bZNM|IR|;nX%~)dk*I9pB=q
zO+a?fI<JPtFFe04(Y!rwqI5^c!h0el9J{K-elZBOu$kWCOS{`#BD^~ZCNRi8GEGHo
zzel2kjpkF(BBu{@c-E5`QkIs)kg{g`rr>uOL~R*<(xP%UEc!OqX#K{rKkAGk#xV&r
zec(aH7=!j7|CJ@Q)Tv7X{2UD^Qqk$fsm~N)^+lX-1o~v8&$`Y`Pa4)X51r%Z1+5v2
z462KiX0WrT6ZIe~W)505S}|Mh($UM3<)f3qs(0%qIS~+Que|9l{^8dd13GzquO_I(
z_e`ihXRLQSO_tHE?B@5BxmhH#M3!1VeOLC-uK%7#t*)jfd(V^64#w`1>3pPtaqH8h
zA=`N>t{{Ic2mo5xZj9L$p-|OoNSF>Q^#wX}XHz8p%G_$jIXjx2QeLBs&@Ps&vmc&|
zQ5Bc3`ytCFW}K??R2!=O#Ti{TXm6@JG{2K7`gWBnk%PwkVeeB12In~w!4d5AcsURv
z3hwTfL|21*z<;Yb5i8B_qHn%O7~624>PuIfji>yk$kzLhg_958f*$3J(M3~FEJL)k
zaQG3f(I-i0MJuSU>%c2nIu^=npB7qHtYYnbIFP)vEv6Sc)+uQP*(YRT&k;Mo$JkY$
zhF*Djpvr7xY&UyaAW<(k0EOW$5T@V6w4@P9ibyfA7mE3@B=m7^@586}eFbJF|4w^L
zsi2KQuk$(e__mvNOlFp<JuJH8%yM;l8#z(tFDvaLtrF4J=2$W3kvlC>H3~Hd^ZSTg
zCdiF9f3h&hT(sK}y}}Sx*Hq2IC(8e@un*y$_GD(4*Mf4ert*f4=#$+CcwR=uZ7|Zj
zJpW#K$4cW-9c`}Ny!v6Ap}N-R*HdWe>2LLQrdZtlp4%)SXsEu#?DX8FnazR{(W3(w
zHl&LbobL>={%*o9%|Xi5iWn1KaJ}yA>|8}^_>SQ+B%N_WY~yn-V<ryB2(V{#!($;<
z)}6o};~SdAu4+<0?qy>~41_i8(0^ISgz*;9VWdF`kOrv<cwRQ^<zeOi1V9Ue2>=U!
zW|7_IhXDV-=NiBe#HRS}d+}7$OsO-l?|oDgkq!=9_*v&WR(m2jUs5%Nft-|~GM5T7
z>)Df}Bs;Sl*70RJrLK|UmLVf@4>iB@U8v<!AHlPxp)qp4HawYM9!P$+>$PKAT3Tt6
zt;1$r<#)a;bSIGDH|?9>sarS5q%cl#YB;{5x;tF57bCJ(*D-8kOF7h)lpf$@V<fAr
z>}hLnU#~gfP)B1~KE|K~_^{SyjV#J34cA{h;*{6ClQXBhmTRf$7<Ni}dT^L7jQwJr
z_Gl<<y-~Gy#<gg`S8TU#ECRLNzGB^HRjILO`k?DuWi6kqk#tglUzC5A4pN<si)%HS
z;v@l*NIN0DRH8e|>BZN`Ay)7H0mJ5Z%qiQw0);w-<@HZn5ky|CcG1*UVkR}q)}K+9
z2=v3go%UHqkG5&-DijLGdO(|Wdr~p$DX&rHio{n!RR(J6P@_S#Snu|0_}OTC#%0be
zN2Xy<PTIktA$Er1fX7R3Y~SlgJTgs7sK<K=uKBhqw6G{auDICQ;1f#6+`dAWFT=KH
z>+ym{LCV+2*`>PA8)pw)KjR7*rQj4sjT;PEgH0h@H%~2Us>~In2K=C>=`qa+wgXoe
zWN%+Hxc3j5!4Y?s$T~11=K8z3Cgzjvr6RRfi)5MeI+~j;idOgNHwx}(sBr3T&D~I%
zlnASokxUk9u!8GGS8TnI<q8($d_w)s14~moiuH0(Bc~uD!+~Qdxlz|;jLu1aAWdUE
zk*HZ%HZ(f>^F!21;=n>sY$cW@+Kb{$<I~BEWd<VEC|CQ4ueQu-@;ak<5!L?Q{_`^}
zFpU|b&cyUHS}X%@R&wUPT6TTTGR*AC`RgO`5eA6zhwwh)9_<kFxh{MU{kz2Y@Cn&4
znIa+@?<Am4eJa@VBASVEXg-I&1n!C24INm*2i)GM^_&#j;!iV?4&uQ%Gc^@<nG9+q
zVoN)kiw&z>g)y78%EfL=4-~}MOYG<K?v3YK*y<6lK1*VWvSx(B3kNjcEfl-jAdxu}
zMTjkhl4Vm><htHPsvhXlJK74{*z}5#pi1qn^{8R7B2+W}?zXH}wjk|z(|6|+meSQN
zvf43Gga_WT6PlQdyaV*HUl++1TCR}jX0>!rUj(*0vYLG0?S-QEJyNC`|4tpB;qo47
z`q*a?+{P}R>#8I?R623758aH9=4%$;<WT=$W}v95+MB!SCbHXm6<sV;wRB^)WqC4>
z{N(kS<YH>Q{MYWD>?EY5jV+daQ(Qvx9|03fVaE{PfUpX*H|nZJU-vNEo<mDKx_a8<
zP32e%GejgeR!3}7BJ26}Dn#Zz`-OhS3TNw=O%3-{wU~T!XHeT^$id`Ve|oxgH7XtF
zdb}%(g?;F;$_8PJ>$-F%s!2<aeF+FkUOQzW+b5JxpWwhR;MagP5@j_+Sklp$ICZhH
zILDLu=cD%q*JSr%t)RWawFSdt{*<tlhSSy?Z@bVtmA3?#XvztrfSO;}WV>#b2^`VW
z<7&?i1dBdKpJ*f`h`7Gcpr`8wY#*&$Cxk2lgg!ZuAOK&xDcsQigL_g2?W?Hpf2pFP
zCYG*J6^e-PjL#b%h?TdU@}7(xp+HF>?$HT<>{5BB)Yf*yQVV{sVW)4<AfE+y;EKi;
z|Jf5~&FKbo60KXq^YZf>aY)4{vh2IhrHyyqi(Z<{3v61(_cy6oNw7v2UscZ6ze;Ce
z`@IA^{;D@ly@Hu_{PzVBp+^>mSJ=Sp?;=sV>wV(fkb*(i=mIUz9>i9|Uz=7?$8aJ?
zcmrM;%atMLNzeA40hhHDPU9zI#JY8b;Xset6x&kd6V2^{m%EBu-MCRC&X9>~DGy&>
zjedR3ju(BYh=9Pzg&5c06BJ@8Ll0wA5*S_o4CvGWFt-wo4U3-B&V?O;W$qrGq1+Ee
z?uFdGlUgwQU#n)7$BfEo$~I=$xd0U5&Z|S{ZLPv30gN_wu3&R5cVK+T!C`0iNj2V0
z3eKC4l==9>&4=_fLpjwU)G@>gmD~%C*j1M~PnK5uj+9s;Tum(Imn6F?=d(miir(dJ
zbdJQmJML8-&jbgeK4)&L294$$-eafI5F2kYg>J1WE37fdsyZ!fhoNe&0SIp0cOaoE
zvJreeowQeS$B&kNBZ`_nMPO*-3ZB=Y6$M6bYBL&nr&kZSxXzlQ%lWk&{W!Em5W0pJ
zutuNj;1re0L^Ul+I<Add1q@2Z96EXME&_=@9|QcP7@UN=m$yu1Qos-qO)gz}aE=ad
z#%aLZ&qG9Z7FqodVp?-Q9Ny3Wox?i`ZC!{guboiTEGdZpAQeeBYh1<uSV5;qqFE<b
zXskmAHb&Q1Jbw=!$psr#N=eJun9MDzH)BWG_ei!6bc{89zXT~o4biPcs3JlaGA#z0
zk|*xsd#!Iu;Pmo6#i^?N<e3p<?li=!dh=dRyQZir*67l*pS`?C?He}8?s($lgl8lJ
zo@z^R`NG`Q@%IX}i&^4PZc7GPfHcK~4^{m-2u86veW2L1ynXd12mnD2aT##^Lau8F
zma!CBC+<ry2J9-fq>ytz@an?FeFqcnKgFwv#X%@N;h9GU6U0nHSygOz>uQcs3l<!o
zU&|pRI4o>?bu49VW4+PbVQ^7=;%kS(>kbto`Wh8W2}{?F8+(G$WlubLc=@(gF(eye
zbB>H22zGo1n8w=(P4iWqaMsHd#HKvF&4GfsM)edCQ5{|-n`-3%ED`f;_>nbViFF@O
zmd#B$wcLZM5nEzhQk(aZ-m#jth}1+YsMb@Gk?0UjM@5+Q;Y~(fY*bMDmK7)m6;SOt
zhNT}JdEy}aVL*n7-kkv9ggR{*1Pcs2u;}8s*dvYH2+)hZ*g;UWV~HIuMtg3s*)fZ3
zM@-cp(%8it&{$52HF_%PIo^RnD78<9_5Utbgi#2yicUSzC3rRBGF*Ihf}$}@-m$jQ
zZIY0MBb2B`7EaM`zf|?oJxkt>C<_d@PDxMB_P!Vq@ipI?6Q{~wblJ3Ty-jT3V`pb~
z-P^13p%kH<D`6%RhZGb#Aq;s^JLG>;RW;0kBk$^rLG^a{eA($C_^n&y!2K}%@S-Y~
z{!q+tX8~eyEOKavsCx$~qe`eFZrbziQkn|qrmD*qyn4iAcWcW_Y_D5%^3lekFZY_$
zqt6=}CZOMfTu7i*jju2}@l}wDmcgu%k)&JZLrW>SH>52=KG6@Ov1;Ei2|hGT)=-{W
zWs6PU%N}v}3WvLK!=l^ZTygFD1St6Z)B!uw{=v@v368BXhcPz{9C2_wS1Jk+vx~+b
zUq|hp{*t^q7wR&;v=mUFqTG@Gm*hKt(d~3l2DUk+qCK_xg{C|p$J@-}$^eD+X)=-s
zW8uugH3^x*F(QShlw{?5qe<hR+|MkMu?NW%q2D%Edq;FV0T3@3Ty_H<X(wdlyp&e?
zO8fdb|MSYwt&pDl#{4jy)#$x0Q*rjwrzg<6j+cN@W8*{&GQ)_d=vl(d1o-D;pLv#r
zY1u|`yc6d)95Qods2VsAc_&eK5Uj>y$FQkmKSbw}i^z`H1$~MgvB`!Dn^CX}6d;XQ
zYXe3=pfG-ET<}1EdhZKRr++CxfsdyVNguY6Zx1)3dgl<zA+G;iTwEieAPeEUp~(qU
z3f+k){HTD?P(C=ipG$|itLq;6N%j>1f$^t7^SiUGWxD7pBagJ((*#v7&ol+S?8%bt
zi*BCVwesJcNx6((G0iN$yYFVuO9;TO;ws-wEZuF0K#yvVO7%vLRW*%8TAw2up33xA
zDWTW;w3BAxHT7bpO|lG_r%e{Zo5k~ew*4mT6JM28`{xQ9K44cBl^*wqkKpCwtGgFw
zdDA65!<;T>xx99_mKo#{AQ}f23K58A18KZX{_BS_Gx07)-IK>KdkbI!r$iM!0i52u
z&zjc*pjzkZ8<R{mq!<Mufq!>x%XsyJACQD_qxL!e>3`JVQx5~uBBEi{uKY7|I2LQ_
zaO-Q$Ero5elPwWrTqjiR=eBM}J^7Aj^61gcbEh}TNX3HXTFll}bxV!QwLYS0;bLk|
z8{4Ym83l-Ssti%nymTR_r{Y;5`?#0`+Hz7kh;s~S4-G3z(HL&#@gqX0^2_f>gzS4U
zNmVxJi~(zO(%{mwTy6*oZ4@+BAkGZzTArL?b`t1~NKXySdNQ38JXZgZxis?SkWT>x
z-Hq9zjI4SZON&hhmqRV?N%qPQO`O(7x8(a>^*n1QtJ8#j4Hp-Lx}Z)?tfTY6EYBW(
zDVB+9G#zo5jspHkf4@1cK-Q2fU3iyITQdG}{2QL1aZo7qYk3|}3KT6~wrv3ymJQ<|
zqr36u?{x1_kn|;Lvt7;~QBDJkjz_P-zAPXOXvmrq{iB_`uKsjPoWX>Z%pUza$Ha6A
zEuZ=DrNuH(oIzK-G*Qoz5s)jd%Z6c3D<IV2G#yf4fD~rfY6NkzOOsi`9T7b?n-vv>
zy2tU4@79KKX<ndu=MoCwZ_ZVAKC5&iw1VS~3NuF03of}LU}zK6*A298+LNX;tC@Q%
zAt1(~AF<Sc@v}4fTW*A92qRAlPE*t(S2dhQYkDT~dJyvJp^I+W^j{x<IF&u@V~coZ
zIPtnpZ%Of`X|9fjrKM~K`n>rx$=Erq<6hp+o|R>Vi&{JOBH+a%i$MzFTnvS+PFA-H
zh6fhs0(32%+H^C3(ahOr<wwh3P_O$i!~ua|E7_zCAZpPyeYtC$?q<cA<(?Eh#JpHu
z(t&UgU>a)g=Oh)|v29p<mHCbnvfCTf(vYd`QfBUZ#;OM&Zr=!&b2R?CUV3_q^g#Ae
zdVwsBe9!YBYF5NGjikNWG=Us8+p#DD*<wUfNLpck5dJrVJ9wM9Zm1y^pUq|luB>#z
zxfI>acD8EYCm$riLC^ni59a+l9du2b<WbqOJIlDDrb~motd?S7VxrWgpwre<ib=rX
z>*u&zz$qdP;%bvzmKG*KE@0e+@(sg;ui-<Gix#7mq4v|W^Tc8t!0<oA^#*X%@MZ&W
zT~Wbu&@JDB;h;$!$G)fw2@?}JyIwVMSlvS|qzyMRFJGN`q?Np`12@pqF3QhWIm7XW
zU0Yi_XAzoqvgDL*weopPe!t6XBxytI$OpIlsOln4sBl_rCEdy?6Jgt%8}pXy{ps;b
zuD}MCy`nzN&k_bC=#&c8aX2s8@gBo_U0uyQ(|*_9*JyKXP{;W91#?2u{Y~E3Bg#GV
z->UNQ@!cFt4-d5M0pkZsOm$x}6at^19p%snj|$Y$%8J#f2P$n8Hn<M=$93T1&Er*4
z)tq;wB1tF<wVklV8r2ow%PB=|xS;cSp1{ADuqW{Gyja=yN@@x8Cl;Tx%Q3Ee+zxVE
zo6PB~n<hCwcpoNm#6WRDSc;AWqu{_~fH~%`eQynR{Y2j4>TBf4LcBZa0=<J)&^zab
z=ZxqfNQ9W{Sh}<D#9?-c;<0`HsQwT9(Zd~jkXF(G7Zh3Uw8<H(9#WrIljcUvB~aap
zB<g&Y6j`$2W6{`bzV#SBjCZ$1*Wp>ZT7IW4W%{@fB)uotPs1=i?f7QGdRLl!Ft5?O
z3tYu_0(D)teV3})R=YR_BGWm-fOB<tMS_4}*4@^Ay$(hy%6q{p(t61~e06B5nO&>3
zGf@k{q`InW?%d3<-MvA<x$fM~o%^&_nuuU_s#Yk_g8LZFu!<FW>mrdMDoN~|788)v
zb`x6KIK>(G^nFaoO@32e)ObH^83g<$wpB~XiZj6_mX1lH%K8Iyd~<uEzDpr>LUZQy
zY|;idM}pWIJ+7*1<?DRsX*$6fcbFXLw6FD?Jq&PSJV>-C)TPhmEuTKcAnoIjN@9h=
za5U{EvEXD<DXYOit%4KzVM=U(>V6te%s)gtD@T$KQiFE2NL)7P1I#O&B;RV+aSy#e
z-+b}qWMfjZCL@R;Osg!1+S%JTexK9{F0(Kgwp9)yVvTayIA<~5(<Z%oP64{*=j(q<
z6*%nJ>D1S;sh-I3=jAyRFO4g+#n1ISW4w|tyQ9aNEL^tboF=*olq_z};22Jvwq9v4
zv<{^yvYVC7DrtL+*yxU)am!v9hg<9<6mX$hEQ`jpzWMPFy{`~%F^ApDuP9I^Atg@G
ztf9H*IMm;f5UVfMFjiD9V?opNIx-5e)8NzUC=+)#lrw5lTR~yZIihs0l5>%5GRh|L
zUE%!{QP}mA^9V%gN<ITCNmfj}STykTH%xWs%in_bYPawYFX6ecCVZ{ojiC{FGVUXi
zH@*FF6bVApS~;V%Cf4x~#NJYn^(SA&4B&Xm=Bz-Xb?amOC8vepRm(5Ot5$m+@fz;v
z)p9zmgl8~j>S~*C3<MMZ<$2)M=(vEfos2NI`3PtgYcPwlG1t8dC63iaImV-p(Yx2#
z*I?Ein@$$9rYm0}22dR_i0d{(R9x$m8G+^ui0-7rG>hF6m=MaDf5#)OT)Di_Xe^V*
z*FJCfah|h2-+?Le`#7?_`u%3r(@VLLw!$t$Qz?<!Lvbys8JU5CHWBZOFNM!DTbD=a
zJZQRXp0fviS%SWPY3SxBn@JuS)T{nr*mUv@mrVxS_~MP5PEO$^>LLoMfgx<Olq;|D
zZ4mAcr>CYuK^|^T^NH{w0n_WOjzVA%yT_QzCLJXmp=0x$x(>Jf6{Mx<Y(Tf9_xpkZ
zUGnE%1H-qegrdX$Diw=DO{`E)&ChO1kuS_GyjEINqY?33ruENEW3)9r2JgkI<n0_*
z)D5$zcvRYgTFCpDFDnyw9h7h6=z(H&p_@qDGY5%&p!Nd8uz-;k^d>5>+`kax0MXJl
zUxN)+;M~qxv>DM$>v3S9r43YHsICF=F;Xj|f!daJ!G|t~I-To26`lA8Dso=^!VC&c
zVlfG35oCwH-+d>*b#<UfVnWvcO9%Y_ARX}b>*fK%%k9;Z*+;TTF&U@U5N?p+Olx*g
zCjw+$=Jy|DU6y7NY8*zw!1Y75@TxY!-PNw&iWxdU2TUICb<KUd@?7q|ib6SE8rgb5
z^a;t2oSOrOF-Vxk#|Dl{f8$s^SmFVbT`pNU`NK5*k@3hX=DvgiDX}#UB!c&k{^RWa
z3RY?VASjQ70{)lT`oGN9|7EuRFBSWLso4MT)DFCo1QFjnZ9iJEZ_%5;eJrD{p7KWx
z&|yK2FNaL<&5m?u876WiC8ckBTkMoFH;{H4@i1XfmSg=*;Pw$lpLi3J3XA3jWjWad
zf0Mc{j8%5WET}85lcrV$ls`R5E|Udq1zt%!?Cz1Vvult3nSr`5oZ8MzO-~0&&PTd3
zHa0eDRmAXFW9jdRq1h4-V;C5j#(@{t5Ax-2gF=i`e^ZEIk151>wqJ-L#S7ZNbmvbi
zgc0Ga6*EL!0<8*CJ`6uRj92e_W+C6On=a2^;pQGG$Z3G-Wp|^dfRj5u$d5_OENFdo
z3Q0K-KIV8t{Jx>aR0>sTfC8Bde^VechdcN11K%J<AYYjQ)mM|i(4o1U&OWi*@+djX
zAm@VNxkLMAzodpt)V;hM%f#GN!Q_n}z1E#O3r{`b$wBQ^koAkBg_RI{>^locF9qiR
z4(e<BpjONdxdTcyBl2LCeEANxjiB)BG3de}@sOW)EB@&=sp4<dnso%m@JT(Jh?ArY
z8v}QBbePw#KH6>bv>P9}Pb=C>eH~HzTM>j$7L;~JtTOk%7M{iMzc9}!e)=%ul`K@P
zx{{ilM1JD5Vf&O6dH$(t5C1zyOMTqGooOwXe@P?gXf@J{kC%6Ynxs1*djn^U<q_uI
zYhXjxYe%$}SE>+BP%K6C&m~}(;)^?^pe(m<sDldzL$UREfU6Xbmk+Fe@ke3ii7C}t
z0HefLwCNcj)}N4AY<*oo-~=N<$0i$SO2T+#w|a5dk7tm$Aa0D$dl)G{FpGX*<=XKN
zaw-K8UsR+70osw~D-ZN{4YA|Ip89NC_Tt5fl+09H!=m7jkeLh2M+k_F^@4kBtp27B
zToELDYYTFJt79MJ_v!4uyFIE$BdVs#vEi1T?_TbIiTg;AB^k`U5L2xd>Sm?rDRiWC
z<p;PvD?u&EK#gjNiJ9SDoT`2c^LUi8@O)B95|{bS-t<Ff$PfJ2z@{e2Op*5^z&GVC
zd{bR%ADWJ!n42`&1I`gb&?@BTAwhLw@+NGK<G+?U4%6n>&)8S@HY9`EGE}z;dtOr+
z41|GuEJY3-C_hmCj=MpQQflCYtAH9#<(+e)z4GB3cD6ZU{vgHVw$G7bCif|#&#{XS
zj9&j|)y)2;pk{b;%pb7ThAb#G&rP^x=V=Z+67SbBMJ_GrFV1?e&lbM<p{5?xXlY;r
zhp3YFJ+_1dLUA&)N<A7uffMog1M0ayRz6yy=x$8(Ib$*2D9Fv~W0r}=p<nhFI;s;)
z`RZeeXP2ZNcLErr^#<}R#J_X%h;ZPbB;zKskNc1^*jyDqOsLx51FM;P;PvOh%;ZWc
z8kbIo80ws(y(~a`!cR${xA`QD;kTkQNHO*r2y{qq&LkTCTK3>m0H`RV?PgKamL>Y~
z=$tnQU7{WZEYx;iWsfvEh&cTSJAEU|K9)_N(bW;M;rRIDqg`neRJbjSUNcdXxVyH3
zD$4!m^@6L}CeL>DTR_ZA-*OSrtrZMG8sd(obQ%u)vAiNBw*3P&(r!@H`WJ+jFWaev
zjehMz?MH*()~=#zjTjZeYaAh7S$Z(sa0;zZj3$Of6GU6RJ<O8;JqT#r^`fO|=;k)x
zyKtm(<9fwAKQy8G1Emc>_0-dKLY1B?nOORsL>h189K$nYe=Gc}VI(U(PoHi|WLEB|
zadn%Kc+<vKtki79MW5*C0l0^-yDQqRsP&9xZ%>OQP7g9*jZSwy)IIvlKAI{9VB3$W
zk~Z(R>7ZS!yW3Oy8$QK2;(G8`NvBaMm|EMs@22X^@KtGPit0U#rS99$x5GXeqasIE
zriDVE%z=9n>+ECs<8YM0(Bg;+TrXvXJFRu}G6i4h<A19@tfIW>z$h}5Qzf#KBA#lC
zdS~01h`!m2bM!^Gr6AhkEJHc<bMdXwve3fT7P8tuu~wOrthCS6?lS1@XzOf44I`%i
zO&Um?_8E{{u78KWBNo&)R&)d;<EoGaOiX;c4Babyblv?^Qo2Exo@I6AF+sGBv3N`V
zptm1^&!6Vx&tK0LfTHxrLCd&D+2H<HeBNRT=(JT>Ahdb8w_T1B@6T@^yxV<?fQ-zq
zr6@7s$R>ZJEpWd8Z&}w*qadTlds*|xzke|_@ClC#3N0K_IEC+Xln(a4qkI`u9uE0;
z5fUim2@M>P1Yj$8>`Zlsy#W4mmv1hCd;{f+jrK=$h98@bF~$W(FTR-_cGV4=9f708
zf&cjukYyYIphQNH`^Wx4(+*G%*q8wt{kisFU6%S!$Q%WD+yy99;F3|G{SU|-Ir=9r
zJg^s<Y$2>sLYtNAe_X}UD|8pZbc<Le)Z6@HGXZe0nc3HBk#1J#79!~*3;Y33(6-|*
z02vCKG4(%QLv|i>rl53iCJB}|iGS?&=*#}1fIw(-DdcVbfUn+r%*CI=T>SKB@_#<k
zH!=uBi+1w)Z-n-PWwKEMm&!ub3}}-=_D=4P66m9QA-J6aZi#KeaO{sGDW1eAq7U)_
zfbR>~&@%o(Ge-{z6~d&C-Tj$9_UmmQ$iZg#`oU%%*b%m>{nMc!O2A*kXeVUyTiN&i
zGPkdPlBnF#0+5OFVQM)_@<*}d2NJU4g1tPoIwNrWkHzZJFaU;Nt|=?YEAsyU8VNVI
zC8j0EOMjgFx+K_5KQ-8m-<P6<)4vY;=O-vF9sxn^a(c(ZKQ?m{Q*X@q5x|%7!f%EC
ze-gxtn{IAary@B>PJ`q6q`BeoeCv1Z_dU4Drxz80p`(WXxo!M9WGkuzz}iNlQR+{U
zJPNB72%s#|skwb+1ybgQ_gA}kgVNz9W3urGNT@cp&&^JGEZzX5>d3)M|2qr$&)2hJ
zy3Raxeki~RUIICeeWsLv-%d|Y@!7LyhK{``TCur?cyZ}*pF;J`$d(<3pE{)8TijdZ
zfj51E3->}onf=g(cp%)Nq@r>OBw(13dVR9e2=&lD`^54Q;5v9N#RA-id;AkjU`y_Q
z;Svz|V|}jPzlx&M+1WR&(m>X6T<nN@<@v0WVp2c5O|TxvA|_M~4s+5UZD@FL%KNsO
zBd$#4WrA|RF0n>Egym?-{<!(ya6S~EYp&OQUd)Ev>j~BBBnslz(dcW_vx{NF<*o$~
zy8$6`-6EpC;F3Grx3tSTeOtq<;@2+@PQj=%AMgFra}wn~mDw#1SJ2uc?pvu<^g$~|
zKfwknW03itmHrjmkO{p(mylG01SWR&gq)l~m%aP`6qJ0=tJtd-Ro4j!38;phzWMy;
zeH>+gpdSrjI`1MWO!sy0+lr90AJ5WK2bK@JPCt&-Bkt+FyC5|nTl{*X^!26|_nVPd
z_4~a~01%;n5lkWJ76-_*)CyZ*SF2(`U(AR#N%=17GnuKuD>+v*zar^$<E$=KZf2<T
ztYi~;X{M~}Q=MD{EgeXnfPQ>WJC6C`9>u&rH|p*Nn9#A~_x1rfNT`-9QIPB&4w8bW
z?MC$?cqp~*g#;VqNHh%Ito+$-1bP?unU>qfEXz-2o71v{M5;vrR(URa@eD6=o|8(2
zUq?5NAXN_nncLzDw4e*l(aZad34&AFWA4)C{^k8GaNu#=j!m2OsT>+AW2+oVow=0q
zc=U}PH*=$0F7@Gi6m7A0uBBLPo=+K$(%I|fWz|wvuJNfVzo~!MWAVX3wL8_9qHnB!
z9{4CYzMO$TMDkCW?(fckP4C(XVtHfk!bVi@T}{o)yqvUJGvyB>4pTA6d?G$AWxK#Z
z_Z@9*QP&Pr?VD<zRnI@SZA!mlp6eJ-xW8y<H+fLOziR!cm+f%Be=FKP;R13|IOdzQ
zzxw+VxHyz3lxKTe-{tCsv^=}^R#|g7-pY}?SH2${0+NVLO}Q|$uq<{v0T&SJmH14l
zOYDs`*i|ZDf>|w_@;5&^A3I#$-nsX$e_mbya7TZNS6%y}Pzldt^tnCN$%XmpRh8uA
zWGnr!M=8my3NUP&Uw3zfJBA^3=JAAE(w%#e!Om2a`BvE>igM9zWm#RK8b8`sM3t{r
zM*TC?nOUGvM{8FROvnJ!;D(t}&&v2_|3Ha>l~vv9o4?|_eW|rhYtm3327(C;*js@)
zOh>0ZJToz2sHCgQK4EBx?jSsYq*T@+EU(D>(d0s8BFUZZA21Cd-Z+Mv`$76JVvdZ(
zT~9Br0<PFkV&~Y@quBU$N2o3E=WRnF!dR$)uGkIvy=oQWt422s4F%%~jcUVk^X5b|
zEm{x4Ce4L?|IDjCQ34Gp>b@QyrtQUbImp>i;Hk3F^&Oh${g7IGi+a$<;U{Gs!=|7x
zwn5aj4s^_lI!S5!-c@BGBvg21Ezy#*S+rwtKvWcQ6EeT9<?lW@0TtyPzO6mR$e~Pw
za<jH|busRQ^a`1{CFJK9t3}j2{waa+7-JSc%;Biz@!lJDNe>JpU))OPc;o5Y>)z|4
zZ610MzVV5)eR~+o{ks(juB!pidMR+qVM^Vs*~m`H*xHp?S@pD8Eqx8QQ_>FkI+59X
z<`5^zOx*#K5wuP2xSE_{cYgHkBPsHzXY5tOi!+(&KiX9&R6p0F`rD;`-m%~*a7+p*
zK8%kK1g6dg5cts!wsK2?aBQ1}NX9|Y9Tu3S-a6331u8~|qt3}VI?KD2O?H*3A7E^h
zO{LEN0b_xt@3`{J3=4y?AEDf|Z5<tx@Cn}0k(<%>)Q6T59)#>9VGF2{oS9)_Bvcr6
z`mkA6OmuK%%8uB*Jcoz>TYdnQ2Lw489OR3U6K&)K#~Crjor=h|tl}uaT=~?rz_v#m
z89()}6N)iO1qvi|J6ob^FibBsFR!F2kv<pQq0)mJW2-Xy(*pQyX+bIgJ{u)Ii~)09
z8tO^5b5($c>GI`yood^);{N`bDW1U4pTNfBZ0+hAgTIt~@SrR>EX3*jXkcI<w)o07
zArTk?G{wp51nxr+-#_YvIm&GhU>ws5&Pla%?%NjlgS!Z!8mojP8AwY6Ns>(Wy6&|r
z>P93n-Y+=3c<2+n{{E8p1xcz6jg1B>)hB^(ng00s(LrsB4YX>3@j)jVhhei{l>2w;
ziQXfytU?BtCPtNdp#(YWW4t(LuOBSN_3BDVN-XO@^|hZAafeKxcW`6bJ3mlqvAnCY
zs!~NN)_2>?vkbrcLG}+`^RDIU=kh<Sh~F0e!U(WNL?ay&RQ(KvoPCDrZ3jHmI%&ML
z>5Scf?dt>k&>feCR<vD{tP*MhJ+=&TJOZpp6rPrmcFP?w)#md85l6ive?s+*63_sZ
z8ydfWExCWAXkGF|@f3V)1i5lw-`rsblwH$v*6-}$_k7+!RUNWyZEa;hhh-k#ZWk<l
zx@&Llc(K6a)<v^_m0zF#%>nhhR)e`b34lLZQ${{x7(z?D13Bw8H8&T!5G9t9oV--U
z(&2b^?!@7mP>83StB<Lk9u%Z1D5<KBd3zEP8bKSsop<3%Pdhv)cHq5#CdCuLGO)V#
z?l=iHcrhrwB^H}%8EFmpSUB=rUe5Qb_RYdlZjylbUwgG09l2&=Avi9>Q+&s(v9V$I
zwby8Pp<6jA@Hc8)@yJd&)V9Da{Y3R6pD2TXf^=U<Q`t7%e(Y+;_jAuL1(EolCnLsk
zx!ii}dI_?Brd*8wlD1q(XG^lL6pjhr;d_8#3ajV_g>;~a$foP%*EbzA;urargUlAa
z?TA!*0^OEA%Q-P0KK&bE9<C3{sQ^!C5wmp3r-=*_JZ2%JAmu-KLGcatPJfIz(5>6;
zlRJd#ifpJ8KCT(}zUTIT8~+ngzOiwOJW<<VFkYrcaOcWjVrM^l!!a;SB0I~>?lSO9
zkcTGy#Q4Jne*?n!4FGGM-ql>?lFD;~F2#nGwVvy?u_LyP9xbszIM<wy$->)s5Rcyj
zdYil|e*4Y%nDkGt+GoX>_*_j;D7bsaD-Zrq{IBshwn3h#2Wh4<P{;O<X1|fjA9oHR
z1xn$no7hmvN1BLy#K^9(ohJX;WAquBv&R{7Cqef$=rX~SsXO}QNs?Qprrr)CujsWz
zCjA)?d#gB}z?D7~#cTTPZg3c|Tt6oSWWv)M0SCYiNjl<}{u`)|%Yjo5PbC@E#t)5j
zmd!qhwD_13HLP=PYBp#z_Pn6=RyOTp{}2|xn<nZh!6h_b>r*db3i{)68c4A<A-%VT
zbh0y7fk;=R#oiE#t;DBu&n!t&NKH+9A6uR;K>g{LU;M8##-@vbK!;69k$>TebN#~W
zC7!8h-@Ul(&6=It`;giV6~XyQLVpJ{P&f%71t&=yCzyMfXfZgWG1C%5bN*vd(LEs{
zAwx&UIy{#f<eX=;W^NUDs50AzBNd)&s?Dgd+8H{jhclVZFsToWgoY)&x_!EIn>JlR
zW~>)<4H>`tNr&d6NU!xx5>kfH#4q7WckV=WptAq^X#u(q5}iC*h>mn24P%w7Guxz>
zM?TmHLYCcddAZ}-3sQnWZ;QLXMGOAi{R<fY>c1j0IQ+XT3}$9D3Y;!)&h;_klhTV&
z6Kv!=eC`^Ws<7@w@sIlQ-LoFgCc<S{_Nb<&?#4>KHPrNw_+-hor)Akz)?c(zY{kzU
zCqcNO;Tz>R@-HqR_dYzoXoMRa<K}_8eA4H>%Jt<>$1XV^f0ZO|BXx4C;%ZD()HKOr
zvzvEJ97OK|;R_~(JHZ?tSoPr-z0nnxm$Onbr^BcFBDL+qHn&b{YZsLdUDeDQF3^!F
zHIdj;27{@|U%H`?*@lgL8WrdLMZJygME3LEGK<c8@cX2gYq%<z8jUp99F+1>LsBH3
zu3(8?extldejZ};VEi?A<}EULueXV8*uQ`4zyB6|7c*Z*33L`fUX;2`DXk_(!)F##
zQ?YwXli!lr5&xM%aO0+*0q3qRv&*Sx{Q3bNjmx4w)#2~@23Lto360KWRfXTC9BvxE
z!LGdBPs}D<@Zv8hyG-w=)IBzAJSn~D_5>dLIki<-@rVae^8K0@c$w^vu5J5%Iz2v;
zp;@4Ok2&;i=H2s;PG4k3^ytFnz%bb>sFXYL$F(2VoW7W7+5dX&e75-j-wdLnB8B^<
z=m2QN*>&6N5^T|Qhpg@G&v}AzrE;2EUT;JinwtJ%(r;_B9eeo5694<>3*=w!5mtG;
z&;i4jpkSod&oBJ<-)>Q0rf$h8uuJHgGcs3grE7f%{N55CvB-9o-aQ=eWFR-eC$a$d
zaQUye`i|reCAeKEq-c$nvn0qLa-IomeE*e$nasvOF!TK_&og&pHMAukQA+Yq@#cu1
zeeW>ee*+9|r7hb-BW=GuXK4q$V<qioI!_U-r4n418tF5NP5{#_8por>;bNc@gNSvX
z$HQO*VF0~K_M{-1EvDGcbcOlY?uB5^%FQJ(zLF<WY^_z&WVqBR!Sq=Fz)ga5-HNDG
z)vSd{)J$5|)SCx>%Zt1}C%w)26U-Sz8q~btRh&xZjK+OkS^KH5xDV|koBH4kjCz9U
zRT{aM@(ra`_J5B*xETB)kCLE9LJY)<I5mr3J#^jlJdYRl;5&m)B{wCJ%$tUJz6?)}
zS1p-C^yVPxdL`d1URO1PpWf5KrXeTfHmyO5YA!aNQUP^W$~|}MH;}o%Qmi`iwL9m0
z9;AH7!rzuMK7YKii;^>b54KXzV%sb@xfSoS)+RkY>dmmRNP(BA5G}u0j^uPdxznK_
z-Uhm?ChL?rcNRW=Ff&+m)oyV(vi_|d#l6ua^P%DpFk$XCX#XAis4Mjj=nRpplyJ+{
z`4U#AC;FzYwT+E3TU352m>L)Vl!ywn>H*`#I(<llrXU`*tsZq?evQfZui<yoR4za2
z|Hu}?rCSc^qBIEytz@Z53u|szoNmV<AO$^Olk8?!S%rmP&Tyx^=XpWyB|D}pTh;<-
zlkV!}*dK!wv*D2JKz^6`-VZ^ks$)Sq4U=aBxuwd*rwpc@tFDMk!S)e%T0(91&c8w0
zeY|Fs$6UrcV=76_`-NVoY`Rjrc$QaF67RJP+%WAnk6Vw(zk|mt6&kM{929abjo*UV
zp0B1;e|JF6l;13lSku1Up82FjUlk#Q(uVkE&0hGhMQU)wjjpYr*LV#dYNd?*XTK)y
zm24<6TXiEAZ&tO4?}-e#BInT^^I*;%3{1L0!_@S?eSY3q;$SIxoLIJCZ1~BlT=DKo
z<9ssI5%h#!>jZJ7Jv0huxlnLCK$5^~qLH(NgY7T9&pxNt06w>ZQHg!X-WO19Fs1Ze
zN|JJty!%!%KUewIg|fAFS=S9$)J~hzWaK2G#2w7}R*V*dopkD#a{(jgrohx-zw7Ug
zvz;}VZ;O|vA<x&Q`m$C<#1(wDB_2#U;rB9ITdu@scwezQ!Da98lIazKaNBIK@HyY=
z7q?3x>`Eb*@EAj>WLT7wKNf<)yK7+7&}O1HByucX>HlKvEyJR0x3FOagh9GNYCsw!
zrH5`o5J5nCNRjTLyE_z+4hca*8iwvJX&5@ByW_ik_I~#9)sOeD2O)Fc*R|FeYn^9*
zquaN+rilN0eY{~rN*=KuoL3@ZP2@in#0}U`6OvQEYwBLml5VdH&xm3b6_7DAMrb5d
zOL&Qh$Z}2;|DQ%{hl}_9jc%mhbt7!x=TvX^4cnb~B$Wnk<-EN?CGBQ+tXCf^gQ8Lz
zXXMk`)R#R++CULwbrhx!q*Q_YWVY?Ivw*PQ)HA?BE`cRS`p7k#Tv;K<@?duz{)M~H
zQ<-7%=f@B#`03~V^@}^9SthJDua930eC{V<cVCXN$obf4u8E`(<hF3tUvdrl&XXU`
zP6jyCfThRC*NjTZ;(CoP-+|@psH=;qz}Do5U~I}4YE;+aHH|>7(x+D6r#2PIw?LeH
zA}TgT^7v_*hzDQw=Sh}#nzZ9Qpb_w41D$Cj670jnY6Qo2c?Wi7F7gVH#FoNo12b2q
z12R1^7oDf|!hR7d&iOpv8Z@kivnuHTIllSWltP4VjaNT$+dJl*$)kGewRwxlVjN`<
zFud3A7EqwKDS!9<2cH?Bbd0l50*7GlNlxv*MX!|##g4Xfhj(`<443zZCKpwp42N25
z4vlYpMQEUDGn*zo2t(5S!~gjy`}6m0$P>#ZysdTIQeGSTv^-jIHheTvs4FWthZQ3i
zJd=8eJ~KZgJEC;K(Dlfjyb*yD+75nrcvxe*@mjg8ir6jEtrz08xJLWoyiB7+YUa<e
z1I1}a9Hc8@2Ae}ieye_W!1gHY&;G#5KjF5OrbLqA@$G}HC|4aDLEv$yxYq5`<AXV<
z7<gWhx4$!BtLW~_erQO4dMF$*7u|P%I$f=Vr~%8VEr!zs^Gj<H?yTZA&+Kay5*WN^
zHTB(s9`3fpZZAPq*7IML#qOQ_`RC$Z%AtmKTrT;DWqau?KPB4d(1*`N=d<fIyaO&n
zbnE8ZgGRq9#!Sz6AjP;@To+CbkLjWIfs@6gGg3)h0pD1Vpez*jccr&^4=E7DsRF!H
z)no~D>P7Fn44r}h-J3)oy<aBily2*BqJ5-phfSCIYuT>A4?hFqh!VtgiBtHjUr>7N
zRX8-Nl#=M$J@wO#Zf-y23cZkd1r`L2LA&~^^XqTUKLfsfjvdkb_dfOnfh%O>OM0O|
z&2oDmG*FDP(!Nsg{lA62pB*WA`juWyKW4d2`U{|-x8|Y-)8c=<{-yf`%m(`NH=y|c
zpcw$ZBrESFkl7gj5cqzN8kC}#RF+e0b68tT=W%%6I>Boq9virFpY-x7q0NFUMG1d%
zclBCqG|g6)jGGhG)+k`?qU`qBZSarND9z8ef-xfK9th<NFs2a={JF=qbC$OYYg$)c
z_ZD?y>dxd4BiS5PaleoPjAMC)1~*g>pQX1}#QhBPs@!6NVa<Y6|BYPK3z>8w=abV{
zdJTy$UVmC%%JjOJJ&W<V3;3pmViaq_(YVL$p9IB=H3HU-GuL)coB>gWN{20v&0!uu
zyu)@dxlL9{37gmm-0c+8V)|mc(d*XbLh0-NRu~Bk$R?KT>pTXvlddIm87n!XQ98w<
z*M1snFY~^;I{y7rhd=Ym^L$csqPVPir$8~wcB%PnJ2&Q=4z3N5#jFtZf;Zk|?w2VB
zbOEd?r7XBXD7kq1hR+tE^o8XE_fP;X7LucC1TK}h-AuC=T3djf2C)ZHnObFGD*LaS
zh*WT-E9T(~Y4mo~V54gl^!6^KO1_-`RLgg7@U$u%u=W?~BbFtAJgxcIK(54lJ(7qU
z0n_NnJA7iJa^SI25WO8L`1=j5&2q~jA5WDS&4#}z{?yqh<EXYEdVKxEYsq-u@Bil}
z4w4gh&Tcm@<ORO>KLNR>=s@0h()WTs<JlT(@_Wl=JNLtmW2J*3LzUJIrdlKHNs%n#
zR}aoXG=WCFz;>@3w!7lkw;yMfP!aV}&6JmTrZzgVA-si>MEywx@O|lsuVuMEQ>wRT
zCPvI@?TN`1TvazdPkvha<{V6+w3nJ(-?jXrqlc3`r+AFH=h2US*E{;y_uFAQDf4Zu
zs(Vi~W%tX&yX#Xd;wzla#RL`6*_Id*t#ZSsyp~gJ4A%o3EqMegkhs#82X}WMe;7GW
zzwZu66nYj~aU>LZR|CSk24WYu5P|!z(F5e?t1UI_zXPvC#$1)f+EU0fv!QRM-E0;>
zwpZaHo?s+6(jItby1yoX6RrdnZ9D<`ta0kcD><<j>q{CxwXZKhPJ1(P3~#@gtcs`o
z4Rt{NQ+Ev{{ubG<b$dg4&%0Ktr)@`{djdV0(?R{#H_}KPs<a4gal6=&%^@8NV}#j{
zcU(!I)r;T%eoON4{@*qt-y3cVt|j@tER6hK1b7W(!ko%&lE9HeBy!YVPMisd|G}DD
zW+cmL+q_qh+T!>1v>(>%)2(LI{q3qqkWP*9(AS>7|NA!ld&vFb!=7NS*tYPec_$0<
zL(x1gwq->)cD{1PFaSx(|L;8HciOn`^a`sW%=-oZz9{eR{$BW3TpZ)XwKj`yeBgU#
z+AS`WUj}9rK5o>g^|+vou708V**D*Aviv+Tt~%ny@8KNNVt%#s&nbIvc>}(d&b|@z
z=KT_FwXAx+BUoi>N&IuEKX7ePu*zMBkJ3W}rym+qv1gSmqH3yYqY+&{GCZ6|5nU3S
z(6`=?*+1N$)lbA)o;2+kS<8aU-o+H<N0J0}-{}8>g0vq=#<RU!*1~|>`+2(btsJFu
zB2Ak=olb_rDD-44MhqWvD=EJGY?hEpe`WF<$Ro`LLcZSv3x2kNKy2PTWy1#`foW(x
zL~{|ya!83fCK_tG<99#%B(z&nx&GDt^1vDt<SqRa`3T?210TD1Gbe&Qhej$mnJ$)b
z#gzAh-{mqgwm>UK@J)m3;lWbl(^%^mu?JXy@OWwc<_jdeYald^?_&q3Jpc_SALt8y
z=P}Z{wsYd#NxTm}+npYPU^rH8iJg6bP<8NdLQq1`L%WWCU_O<ox0uL>&W1y<Q8pid
zJ&Z2C3AYb~GHAZJu@ooC6mYizz8~7(@jsYxD<}|o;-Fzu$iI}0%o23mEZ<t&{|yA7
z3mw$0ZT~1P&B>Mu83%d_^M=fA%J}1rjSW16Fz&JhgMO_|I!#o-UG$B3tLw8okJwv@
z_xC^!&VEaXd4^m5ah3H}3((Vms7hpf`Qgqu)S?SjA$&N(dz_z_nwzez+g*9nN1DNF
z3C#_fhFEDw<W~UnNIAr?6WUBR9^|P5(5?|5b0nqk*L>yl&p-aQGJ|G8OFob3%O5E$
ziZy<6ZycwZ*kaqwyBzBIb9!$9s6lZi(f4p{y)WVIqwgzk)>8P%8=;jzf`!jU2ND;4
zwHE+BUi=;O@VA8K#~htS^95s(n~lG_iWWXN67gyLvU1o?V&EyU<aL>TEsR3pOY?x5
ztqd>d^KM)eI@kZV-i7)<*>oo7JMsJ_>Bdu*fR)<yJw)b@vBGe`^*5j&8veicLs{!!
z+(}%jDP!EA6+JBxjF9YH`~UBWiN^y@44oL|e(L{Dj05gFf4e?6Vv9e0kNJ<{98DK|
zADCMbUQi|~{KP5lM?^b(>M1>0H?{iy`NL<fxM|}P_OXWZ`9jYN_PH9Kh^dk}i4KH&
z2=U-Uh6X23-P^UD*O!-XmB6LSAyuCg(nne%Su{%9P*xlghk{h)h<BK`Dz=svDPrsd
zqZ#|@Vz4b82`7K3EyV@`r{yVeHS|RwI}8tq+<W|ntAhJn!a-y^E5PXFUpSe31%yUr
zQn{_;39Uu)c*az{e_}En!O=W}`>a^AjD7432x1|VOrdV`190US&>TZ^#7T7<oGf&W
zQuNp<p^;DNv_X(Vf8CTHhDu<ra5~yW+7aNAwvZnM8N<PPOLiSt!K7hzoc^5h0YI<|
zbv(MX0xsSfdhZ<nqEmtbY8ZhuL?>Ec6_i;Q=6+beMI}6o!*4Yc3xHLt1Bn_SdagNB
zL)TBQ@d~v4g7*`Uw(A7s>X64<+E-!u2gFiL+0OJLdR!gEe!K_PGOv2tpE0YFtK}<Y
zpAHL;FnTw-0ezNb=nwFcWISG=gv&jUIr$e+*cG1~O0c2%)d7E&H-$I<k+&=!TnCK`
zmeu#XT}ZxabylbZ;vMrh=})SeW6#!9qK9OP<BZIUWZX-O3fJy$EQ%EDtCMHu@qIw+
zO94<LxThgGz=`rghwZ#hGYO0tFV@Z4LT%%{5aOm%d%D6;W=tqqna;5C7lUmc23skM
zlie<gi^lps0xj)0G7cmbmjhk~jxa_J5C8XNid9Cbv09Y1oVHmWiv6hm^D|Ly3{+or
zrd~$qRx5tD{SLrf+~!{a>f#wq6ARKU>eCYY-ZTo4R@rUkbfITL1oSFd;!kbLx#mPI
z&_5Uw6m9!HEBqxcGgYc*$tSpKLc2{eleJi=nu|2~K^vnDj3}^uXh@38e!ENTq;TnZ
z*vfZI;$}YFf5`@c$v@oqC91}>`v?9%2qh-bf0AO_<<`$8R0;qFN73f|2hfP11GR+d
zsld0q|8y~biI}GVI-&5*JzI*r^?cza?9oi~r1EWY)14W&ebQ{J(%Rx66;|c1UltRa
zuhfGSd_hvN&Ca(B-vsV>=c?`TOu1%jjg(7|h0;_-lYVIYl$A^OWS=bciKPK;ZJIbz
zu_v{48un-DHP))}dEl5Cw5hX4tj#>}dbie5s1Q-3M2gszs4K*p;0*s=@^K=Px!(uc
z`984{y<OA5i`TDJ(6H4vnPo-hG*${*;SDaL!Whj%Z}@niBlUZ1(0wm0=FIxK*yHs`
zH-W>CArXLidOFSv_w7FQ2CiNue{<D1i2zhpAXTymh>GqOW?ThsexM!*od22VAq=Qh
zK3-)zpV7o6wl<=SJmdSb0;C)An#d&jO{>6SYcij%lDyJ3$)IirGy3P%aiDZ+!gPX{
zMFI*YS8;JE0@ur37G>uuj2S0OKcw6DKk6|>i%MG?FVxuw=TY;DozT;QS^$c`Y2a0@
z^bc(5VW5Pl0&JqvgFkNIvG?jdHIG^362nf{AzJTGK4=ZV{{$Xt0!8#5UWEFbN3`};
ztX>B~;cVi7zrU?m;0Uh*9oUz0m2<t17qb|TCctLUtZVa954fu{&VfcO;cJwfG-@1q
zMxkk?_;~n*3Fsv#(`j7cwf$;m;fK+k$zrveMxuJ7p~C+>`tl{(a<5x#?P_;QQ*(3G
zs2zX|I+tnv@4LJEAdcIum5oLsYw{|K)A`fv705U3g-XBBML~x955Y;9?id1bJEX{0
zswXqo82B#J?(fj}<oGS8O2CsTz*3COBm-|QA$&egV-aK_HQEaPpqB<ftFj${BPy?+
zr}Q1m+f`sz+JFXiK5tnX*=2xLK>$ztR&Fjh%B{+1<1^39H+XgngKfU%f4Qa^F<iT?
znU5c>Orl<nVjSb)-6n3wg@&BcdB&qVaWv}YxFk#lRXfhGR}e>^d!*HbT{BzZ(SKM@
zUi(YQHEJ&Kskf}qJ-tj(bb)wm8{QUg-?TM*oRqTXHjFlV5SxDA_&%U{5;mGTWQYCv
zU5tZbp<2Z+|JrD&zeUP#RTdyXx}soswftB2F@Ji3T2y7s&^j#D`B>@6QZ_zq4eME%
zTz%P@67*$B95MU;dMSc%_Z7vaas{Q+Tpjdm0L~HSVm3bhVZPAlJH-#(?~uvD`NZKJ
zcf1cj-bXRFHr6R8uAJyHMGPEX2(V+E8OAtpUwx}j{V^%zt4-+~uj<_;K>z%gZUj;|
zz)nSq%LknuET#?%?Xvmv&%XJ>LN*c$BsqT{5xpI>y#ZS9NI`c51L&4a@JU&=z<VmH
zms`W>mLMN_*S^oCXwcZ<<suE>WyUp(kSZ^Ka<b4Kgz?r<MeP3dqSxhOTxz#JsJHD1
z#1<cFf{9E9=TXTNT{Ni;YwiQJAN69=a?w$_&C{LufH!AROk+E&Ifen&GH2?ij-tzH
z<VxJk#d-i`@6ptAzuJ)=Dv!YtgS4k?o`z3R@MQ(q!kc@I2#8<f>NlAM&^!U)TY^YH
zQb|xG02<y6e0_zC(2`i_@jxGEZ#Fpk<aIj4j|M6Rz#kutPI-_7nSO`m<PX#4d2sQ-
zA?T!4_#hCS0H!8G{1Zq*W6bpzU|o9U$*~+a^VK+7up4)x<>6-6SJVCu+YdA5#`h6N
z?9Q+`35>gTiQc{E{|4G)UW-wtdv#y+%&SMMq8!8q1Z_&KRj~5&Cz%Z<;~f=R5(MrG
z9qlc9QRaEU=uw-CLT^)9O@R;DO3EyFYYPsCtlckqN8^ZIWj*R8aJRN7Cb63thjwO*
z0V!ik+W-vZJ0$cTIRJ=-N7uI}L0$%r!1|}rzs=t-U57sU&Gb*xrRmpA?T6zn59b_6
zAGJ{qUp#0O{SWf}ku+o+dDJY?GLBTM{;a{9y4?x>nCPz6aMMz@8|TJ-Lj%<{MX;et
zY=0y_t@(DqS7=~v;3~YoZyX&mVgCH(%%{!a7!0+{uUNFcSRMjF3>m&!b2%~?r){YE
zum)%Tp>9^4@wMDopWJokJ%I@YT-0n5p`6BSe6P-6vl8q3mdDFSq+Rg1PulNQo8$!m
zMw6d7&?}}iHJ~2%+#uvs!`k?mN~d4Zqt9=nbO^)J?RGSmPKCy`h2S!3LRB9V41>At
z_`SL*z8&9F@WgKpVdqCvMzbO3j??`2Z={oYVtJM<HSa&M`m55I@<%IGP_=OdRu<+S
zo<J9LZ>GYVNUI=tpEgc>DR5{^v<b&@P=JV*sI3q7c-12|_{RmhVOZPIS9~<AGoDw4
z8@QkFRu8kH2&aIt{cDix)6>gUTGNi`i0c+m+6dv+O-v~@=%mZzgI*!*Sl043fc^FA
z+VS4Zr=L$R2Pc%X0<a;#TIng`{}MLgm;mA?A*;I0U-f|tg??qz@9spfC>^~T>C{7H
z_p=!?rEnUx>u@@{7f}#+wqc-3kcK0rLM;B+Mr?oI%E&^UWE~x*++bql58$iN9AhWZ
zRj{6;inG<-<laaTOYX~C!@PKb>2Fu>kijJ$pb1iGFXZ8`rLEq#%cp52VwAYr%Jj)6
z(TDjRz)y!qU+%7?5Ip}zI&RbOhv6Scjl&uV#(cl<G6sU*%gE3Eaflw|0~{H%3h|SU
z)K|nf;Zm}Zq)>Q|ybdQH^zPVXvBCMZ`7ni)`@_Y&Eqb2b?e_3r1hj0LV87pB#nJlV
zic+`S(C=`cflPu_U%Nt{CcgJ{7(mgs(Fcietx&<M<$#STU3<DX>sVQzBTNbQ`>VB>
z``4uN;#a6)o(7?$r{Zr=piKhOz1Wg=T0=eW4iVL<JCyI{V;>`Oaa8B)fGqFr6!VPZ
z$^a+qU$u>`Pk-%fBpDod6h+J7qOMGO7gX3yHG6rqc%%4Ygq{JqR2uaopc;L1?TJ}#
zRh6UMNRTDK6H&$SP5^VRbLiAWvZxmt9_&9Jc`--UGXMTEeEgTM>%OfyJ1#27poQRQ
zdfx*{x~dJ#o3-?jV94j+g~@9^i#PF$jV<-PF-xCtV}hOp3Bb2zn830Z<%h|Qupk*>
z+y=|?B(RR*9a_o~f(=g=x7&y!gV)=`H<MMq2NeW&#jQe%!Djgvc8E9N&NR*Enht1^
z>HQ@3fLDqT*Pj+RRe$`t1Dw%rIw*kr({9u>{Oxv<zrUv?lbHF5;m+ao4QK`H6}}&c
zKELLFlhKY1p+te+H3JxwV?1A?#KQLsTIOhod9i7}AV-q}Hn1R>2V<*zj1h6LU7+!M
z0&$$u{k-@?MiR+BQ!X=y+H9EjoJm1|Vwj9)YwXO{{5mX2--%tgaK_{Fx6F6p$N=5g
zg`?6~`nUFr14P~%+~9N~M!vs<h~JbUNgBlMmwi5zv2_z*Q+S10aJ%Q60Z52sZ`ZjJ
z{{@+>guH}*O&VPQ9!hKXHK6*8bJa2NL?*6)4L7jE&JFk>Q6lt%#Drg4vh4rzsIAOj
zEOXgEHK`8N^L;Jc*z;`gHq4EKlr+3^hzzIgdC0<GmZ)PwQ2bQ;r@Y1o_yUU5aHYJW
zO2%!^lam=H%r#qvO4lH8WWQ_W%F_)0lorczo-5RD(A|8K2MGa+>$px?izKUes?>&y
z`MZtJ^;Pzk42u&592+KE?-)GL%pN#QO<|k8b8J%FvO2oVio^-Q$9}FWO2e?TKD|ra
zkl6@(fL{J2*kVmEBloxn#NPjI@$s1ua<K;@><j!d>QGjAMj#2Yz?R%z<E1(iUd?NV
zU7e~=c)S+lou%!868Ok&0>J*vs}Qj}8hr;P`0fyYc-;2=<x;`HVq?$mXHtal5`7@#
zn#%%z#hsi|)U)pRJ>4Imgo3R*I?7^ekFCT}s!3D;TFZ)9>jB8*RIJ{7j_*RsSEIQq
z?kB=eN&@K!{(?1-c_4r*naXc#^P>wXI#zySF<K`xmNF0wcQ{9Vu%3B)zB{>cSd{9q
zv}kOPq3>l+NQ|=dG?xE(p}mt~H5e~Y@0TbjQ!5XhV6U$GQr+bs0FHeKuaTw)%?l4e
zd*#wM29j!v-zW;CuQ|4ifDLd+Ia?noW5%HXRKj_76#hZW-p3J2*K_Ee+-fNVf0Pst
zZyozw)5>!fOCxnxC>>E&%DBzxUv8l4-@4oufS&qF`Y7XYL@pK``(FV=9tY{&^;dSC
zzBihvlSSWAR@7C$xN-L@kODGCK{y@R$OrZ~u5;}wX$Z=DdXS>X3|mA3|C>r_nn&3_
zH7(3>3EZ0Lf}D%3L!U?CMVEPNZx^e;9{2V-`?WzcrxMmWIs!3Avgc0w_SItF@TBxl
zJ6u}%(&mrDdRzDu>awW9_G{j#U8NqHRk+^0asmcIfA7V1XX|CQBLcRDb(RbCVET*z
zck|1~fcUS<j-jI3^N&0&z5@b2r8RZ5>6B5+vL@Lk_j7J+$4<mc5nqB#>4Hl5e_MO`
zi&0)Hu`zTjK*|O5LdcRucml=c1#rdU2*`z{RwU#1vq+F0wMl^XSSW>E*tlQY8?F4T
zMeIydyEv3)YN7lsGEWN?eyHm)p^HD0*U)34ehvK7^2QkLKUYj5?OzQwoJu3H^kH8{
zpU^y*y0;FzYjz?RTF-=YK;2W$xU$G#6`8&#=+qPa^L0YZXv$IFe3kROnRYFd@k4Q%
z)E8EboafFj#=esnNLE`;^Pxb0r=&moWru1Xi&fBw#VimI*8XuL88fXqb!|ZPc4GKc
z1e8SR&)Hi5e%79agno+H#&@sSt(6MFX7HKu`KQ!0HuA4*01sg%=z<>s>tLe|to9Sw
zL-Gbp1grEtosAeos)_9|6sUUi%cx}$LMmH5`@UXHJ?Aepg!9(`=#L|ziYjfo&~72k
z7$MTsl{nv>=0`Z&@8#o$-YZdnP9x#&=bxosRQ36|kOe*h`Ve_cZ_TtSzlthC?D6jO
zA=&|E(~Vc&MRSE1Kr;#XQaqJnrZ{)pOTefMr27i>h0x88X#?j?tFGfx5=DAZ$a$yN
zdhi@DH1Hyl>7K5?k5!V%!4H&ps1-pr9>d1)0e2RtjSGt67OW_UqnKRezfJA8&MSV4
zi|PkGUhT5)Ta05_NMN3|E!87wegr>_m@(01%bIJvlrU^lK8M9)`*Yqz%Rui+!|D#d
zbngC7&0%6f%2}T-(py|AL{A@`!objW{m2m__$xHfesKxZE<n>R+9k!=cGtI9;<oWc
z^P3tsU5su8O}{9O?CSY9DimG+BTCl=D4+VOo?i85A}G)NXtvZnR?Ild8ChDZT0A6J
zVJS!dpC&GBP9N?WL=Q3!fXx)WoJsbYvnWVW)6NPojCwOAQ7-E*aM_sv^I|JL<~!!6
z3Y#7#2$q7xbHcGM|ICjNDr}|*lpw|_E;pC)sv`KyfdJYs!;foZ*;2DrZWvyWO~tvy
zBsnyG8+k@owhV%CNnthVIN-$48dhun<6U_pfTRj)FWtwL@{dBtmXt16RaCB$S{UMA
zQUcp`CpZoZ_6%OqQSu3-t&_+Y@^o4dmI7I|T~^OKi&E@Z{NMVIJ_Xw~`&R_dGA+7?
z?>1NA2mWP=l#%?BK0zD>s8hszyfLkM`2iP7hVh3O1x2~QTPo>_X9c->MN-o^C}FGh
zbMDbQl7BjMowGgJfU4W<`o{A8Ur{ZKjuu?g!Scm13RzgtkFcf#mNq<Yq{-G33~!oh
ziVyY1JNt8NuD{x~u&?wmZz{UJzpSym!Ji;fF_pJ>LR6H7X4~8t+4GJm$Ur4k7T^-H
zt9P%Mv@dWM@}Wfi+39;uED6oGZZECZ?$CZ0DQ=}rq|8w}6K<T0*{2-g54vGJP1)V*
zR+=qQV!$@HPZrUr7CVO+JNcVSyJd5(ue$pgk|MVqosNhV0Jf1~Ci5H=jI(#aUBX43
z^>4g?O*4^w#G?8PO~Vf>Nc)}uhFFZ}wMMJMzWXH&nIPeV<?CA40c9i)fF^9+S)lgH
zT?Nt%32OIk8Z|G7DgSc`(jK1ky;+{+v59@23^F)Dhatl+lRkVY+OHn4Q9n(?<A>+|
z%Vg$h(9o5ORm_tPwPQe2CI9^U>rMC$i|hbrj=O4gnESEvKmi>=pu|*FSR(s1qKgS=
z6P?kY5+0%v_u%)vez2}mz&bGVD@1`-`MpI2j1pL{L%O6q0TwY-9KNtj2EBBqeOjao
z$Io;0bkPG-m*_Q4DLuzO?|KW+JxB3RjI5G@Olxjba{kPHQ<}dAZR-C1S&<B!-?*|H
z@JZ~Mt88{Pf>EGwW7xsfBF?Rd%-Ye^LjGIw7U~!O(@vj9_%dDpHMS_|Tqbaq-jYiQ
zP&p(MOqG1(iKRFUOcQ6=LUlK2P=421$-Esr(teR!zG1DkE)o$Qp@>T*<_%f-4b~Ai
z?8<KeKGKEgd_agEuiwfb4|TL1=dCGRd$S=JPW8&G+d^(8&q^^7;^Hk#QOyCIx-}=F
z+gZa`&u#*mn2GM&Z&2Y##)~<5+t{$uE5frz^EJKLa@b(_o0FzI5B|>+EIySUKTywM
zvX}m6jd@9KUdx=7&8eYa-SM8-=m%yA0ZOLNl>aFJqA0+9xq`CZ`!eQ?-v$~8sOpgw
z68-KxtGYcR(1JM{Y7|B@|4vJcsY(^mYZGCX*O-k3!jB>Qm?nnPI<J%!;ec2k6~&q1
z#a$BT^arJHbDCX()X`(`*jhm&B%PlvExKZcQ6>j#8AoK0cp1Z7kzG}QOm(3Yc}4vu
zVuBiwGqyG3`gy)e7F98t#_LT~d&icft50CuvKO%@vaEi8*|H;fJ)(f#{(a4BQvV+f
z>)kt)PM1QI6@OZ-_I{C@ZLh>y3m#KWX8wf5TmN#5vbO8Tjd#`BScRT0^fwne3~XMa
z-@cY<bv@rFKA9=(9=OfAd4Jyjp~#Hh?2#KCb{rm6l|XWD;VN2Dt3Ao0lq?(^4avc(
zhLk+}&^yEpN?eNvW0^a804=6X&~v9j1-%P&3DUe#{w2?ey*X#}w*1N|pDqd93}ILH
zYOC3CTcVx;0|0|RG@$@mqs+Sp>$WlJi2@aVRaFs?@!<Yk^(hI9xTp-}<c|-P#nFVp
zIXs_#GdX&G|2Ya+7$(Gi;iIyoE{7VwvOXz&O&A1bb6YtlSgX#Yjx+_M8=>*G*FfhO
z?g4YzViivOYZMeEm}O8l(VD~~kj5S?z6eO@S*{4Tf|=gkZ4&u7QnWnRL&VdLtT49r
zM`^z<qW+`j7vRXHu$%K8PE?s0yYLUj1rYgs+EhO4oNyx6e(OPA07vlQucdUfev=o6
z)HdBUtY4`E-Q{9O;|tJLX&P)b3?;?@K#<;G^br8iJ)uJSOGK!#r>|A+3Y`w}Se$K-
z`8CVbhXGJPm7@Dt+TZm99g#mLaffeN=)De?X+NP5U}2%}!-a7j!0^9-;ehF}{SbnX
zyAx$dh&NhSnNoSH`5(su6D4R_Wpmt=HA-JoQv_6SH@YVn@{e*eIA#c$Pp+N(Z7{C9
zBJVcJOvqH|hm#Bi<YFJ6b_z@(VJCYlmw*E3U_u8Zr+pwk?IFNsbw+)AigVa_VjD1D
zMb*Cg9h4yV4rlZF7^OhL@aHlh;W4Bw`xCGmmiMILI(norjb%v$z`EYHs8YG3oO!~W
zW!$zqIFSOJ$VYg}go!D3BPQI+Q!wd}tki=kysuUmu#Ml)0i}v5=8||9`2tSJ_+9)F
z_bEFVKZ~OmZKMV!`&W2oj=-utV1P2~jM_shsWNCnNte8De}1fNO&-(4eU+sc+RSF%
zH#zkIHwh^H-B<x)eCK_0Xc=8Vhw=8Wh$86qW-iGRivCvuvlnM<VhIG%Sg(Ye;|HVj
zeenh`llRoc{yf1BzMou~x^iy&<x@Ij%`ECQb?P(-{UO0rYIzYcX}VoIx=kEyeJy(P
z%V0S1oa`@%7nN5ypc^OQyMc)D9daPqQAy+Scgi?0R-YzG^mfNj-ItDo308<b!=0Ix
z-uE}^)${*_szu<~P%tJf2Ze7h1?b%9;CZTkM=%!hkYNX~<`Ye1Ps$Y}oI+5;B2a@T
zkq%I~T#S`(bm6Q{I3C!co=1j&AUF?`8SLhnN356yiu#H|)9e}o-MBV0lQRP_J?5=z
zyCz-t8hq&~XeA5?2H&BHj=rk;ZK?Y2E&yGmDn(r4vcd9WF92h8%c4_0b5t?BZAHdG
zv5I$@$M5C|K!kW3vW+fs5^vi~>$y^{B=*1>Qh%@L=i&ycqFy|m;qHkfBPc|=GAgBF
zC^Cu>6qRo)|6&+9N+iw6QA-)$N*3w$#s+#OX7RG0_sco5W<lHK^AW)eIN<j~5v~Ry
z-j;9}TGcK%L`W0tjRSlLk2|9kAJ_@m60X>aP6hASJNJI(f%F5TJ~Z*C$7Iljs0uyk
zuuD?vKliW<N<X&*X>jbla)w7~=4I=BtvimWUE}nYpKz0?*TL}(q&G9<;Mo1LeyOqG
z@*Y8Op8?>SPdk%8^$^9n%+mwCy=OBkWj&qZ*ygYjLO0LfVLftX9w{I9u#>Id?43_P
zsu#xYPL}G-H$G;}H?<)foFd528m>K$hIbKm50T3wNo%4fS}P~XksB3boofn$j<K$(
zDypJ{7o>X?@#Z&?-UA^-Ph!3(#bCWd0KCv@Ph~sh1SMbO^&h58rK_uCaqkO<7fkIv
z9;oBg08=9Fo<n{yxSM3!Zk1EQ5JiFm;aj~n9re-ZPWY<$6?%QL@l<zKev@P+$WPp(
z_4VG%5y{f{keI^rT?b@0H#aJdLRiW6GX$l^HnR2HhL*zR#Eh_AR@!<;V;`!n81+qO
zu)YHOS5}W-=kw<H#uZh}KnzH49_ne6iDY%H$?TiMOL|rTn_3fQJk1N24dYJKqdYGo
zsoG5HC1lMR%ks?O2yq*SK@o(Qn}Izgr=d7FMvpo{7uf>J-|9J<C6S>wT$+iFPBlj;
z;Vmq}2DqR5s0wS#*D7ykiZwY}qSTR;bT4j4FpTUYR{6QCtX$Ic1c0_8oy3P=&;5vB
zAu#IE@3ns6m%LF{4oTFL(~2RkYrs6pA44L9d_5}4!RK~`<+J;<7IKkCA-^Rvp6vcw
z@?X&!XzP<lp!y-#l$&m&9h?QNcPjLPNI8}Lp0gP|m2o4+BZ^eE+NZG7q&70GLlq>i
zi3}YY_@}X)KwNR^VExUnm4{re=4((Tk+q%}oWu^@Z&6u(0*zFG)Lv&}$?mvq`dT6k
zo(yaeCjc>D6=J^sJb^ahYZt{g{`v-)p(bJC-)JJE`#v)-WVC{M&68yAk2@#5QYfr`
zt@0ze7c~YOPP0N8(%h{~Vk~GU?T-~?sGNw3_z^_ALdV_fr4pPH0{I52Ct0{t#mSLr
zRbpC6cF(Tr?|ZIto+o@p-k6oQz9FcFuN(WjWo59I!QaOZPU?x--|it!QOCsH7C4zj
zM}u`xFCTBFTa5aNWICxEFHerh&W6$Ki{-R)AUJ3H=HvEJjPYpagavFLYuZzfHl`81
zDhx1c&$E=v*+2_~N`$w<Opx^*`*6l(!nM^*UElg*m0LtT_5CcJt-v&o#g3Eh*hqx&
zCNfa;F1+>Nzf%Qo<qm;u_xza>QlcljQcW!nHJX>z^S};iq0nZf>(9ZL$J--K(3d^#
z+XI(8TgM*5rA+v}chAI9FWfp3GA+CMClQ)UcZS_3e`dlEXNP8|5c7~sDvl=<zSP}f
zcWcK8xm?l9e6RbaTBmD7!{V<cyG8%5&c2C7lcs+wT`tHlYASuruo<oGuK#TWzh)5o
zpE;(KLDKMV!Z=MgJH=9`^>IoXk$*-yaK!e^B0OU%46(PP$C`Q?_-)T3bU2($MTcHn
zh>WUO35N=2n%Xu}WoE^dQ_a|~p%Z);LG-4SLu}QfQb@XrRaUPPr^M4o1y|7%dXU}x
z=*#WDXU*iM-FmJrN^J$?Nj*B=W^RiD_nc@Gj~N7>&0pody;~~E=AK-fTcJjUvlIoJ
z0aG24pS8ns8s0%n#;MC1Vz<7lk!Ux%H1V4wByI0HAKf}cDa_9*{_vRb_%IrnV|w_H
zQp%9rSRel?XM6FFcg>gfT{xbv2nO{`EvIWp6NV$}V0PzMrVHtcFJHc{e3g=ObEq}w
zYpq4(F{>4nUm9G1)8gK4aB~mF`D}3iDx~lr+$?w_HvAaJ5P6%}Z*Dr8|8w5r*2M*9
z5UI|=!J!bK98qkOKpn=6EtpR+D=T@JQzzysNLF@Bo4z@4j}ePr&o28_jkUckGTjwR
zPA@(34KqedF|p$A<$Y)I!p3fo7LE>OWC|ogX&;`*5b;2Tml!62;e-lQk(0!*gSJwM
zIFm9}LffxDwX1VxE6r0`R)SC)%@W*DWy~0c#{fz4Q$PJFIMTc;SQCGwo@w13!b?PS
zBt~I@9+OOa*I}5!>LMBuLaCs*aRc~-@uQ~|WXgrr`^)jE1iE`J+B@EG(}-l~+O<7<
zZAD6*-HT+aTEf&b@a+P&ml#}N0xwW?4Js%mfE8?Xi0xIG?aQt``)RZIt$P>NFvn~q
zas(tL>CzsJ0^83Ht94iREV*&o0ar6`&z~I3X4V<64Ebd&jK*l0<+qIhrgE@^M}~#i
z!rFouw+oR*YRUjl&hj>6VppkYUfA+2W?AiV9w0RT&Ql;rNE<$$r2;MEQDh*$|58X5
zxWb$kMvq=Bc7HZ;f5y~OA5W&$eG1+aUHa>0kJa3X{rjtD(xYq2k@ZkAR+f)jFK~|m
zIq_-)^ZMwr6*0zP`j3g=pK3^m;+GDQGpI0%8sq&uRk*qf9c>GLgTpE>rudocALy0L
zGe890mfVpLcw{!Bnl>5n{Owf=uNW9i*-wBjKpb#Xe!}BeIG1|Rg)h)?j;>5RWaEDw
z5K#rM;K`$mVC$>yyM4>6*W5NAwcVX8-eTlB9!ry4lcNJ=K_II}88#8Z#4xGgEuD`o
zv2eWxCmNW_8wQ|z&&~L&ktXZzYcgA6lr`V5=y~i{dwc$Ra`tM_)>^?-_oZC)>pEGt
z;7`a}C;9MX<D`i{5~RB_M{Hk}jt*Ap=cw|tGmRDpiTRY&0A+Kpunt-kabfKz`V`0T
z;?}YtBuFpDQpu3ZSzaF&A7H*&xY`^rs*^n-9cN<6sk$ToRSt4{u{RdwuK)Yh>qZ!^
zcgdmG@BB$9mm8gkDy7)qH#x7H3m((8Ndh%{8d`t=mZXlljz8gBFSBU)U}|Qrwlxt`
z(BS;JUZLvqx%P|eV;F&tbSiOG#G~?18m|}wHSIFx)xvN=c@O-qnuuX>yku4^c=Jnd
z{})!ZnA6i~$-SCASYHI|gL3qv(F-oWnP>$0rl7*D@!a@I$TJ^C`VMkithIy#i2lG&
zg@Ozx3a_g_TUE@q33Rv9Y!464BDW^(7Otfw<`j%?@1wtR82n+lzWj-8tK361+1--V
zdPcS*p;bQmpZS4X0;FRIs4{^3rseUr<q0A5)JPavdAD3e(tb-be!7O77P|naecpl_
zeL`i`jagZPq<@w%i(vp~q;7Ox*RMx^W_9@wf66i;G0Y%X8QFfTvakOo<*Dhmb!qyf
zUWbZ0$zE9){C9(Ct~>5m2Z27qkvAw;hRtm6N%!<bly)#1+Yiuh&4tcd%5T=XzOMp=
zMBNfv8s@I|W$ef~9BbtFULA%4VSa8(Al>7NG~rCTo~mA`+jDy-7Lwxjg<|$9k|w8Z
z$p{|<<%E_ScJ&ZR#f>ZJBQ+H(l_+xFnfarPSa;lLKk1kM7_*twK#8U}?YHz2u({uT
zXFI87YAzbs1pbaQ;53!tA;b5SWi8{%4Bwgr4WC%gr}emTr-0#6BzggduM@dRV<a%U
zi8|GEe%0wJV<*JaH_zKPrD$_X5TZcysZ#|ysV5&$erP^|bJK`OB$At=@I5fN^@3>7
zpW}NRRW#bP-}-|i*C?!I2s%gqN(^U1QGkkr>W3@0>f6eMWQzLcZ39XVk>6{k_6+VJ
z`yb%-Re@9!q#%RHOsyxaXh_H}cjRTPXz4s)IRLpc&tXIUX7<$Hm*T*Dj-b46c^ju&
zouXZs>+eKdJ~OVNy^^{8bIkP<zZJ8^8;C}l>-&A}$syN9f!p}PSDIrg(xT!b0K0l6
zYKVu1zu^`jj+x^h>LE=MO~cM4p|t}DiBBu|OP^Fwql5z&tky5-=6pv_c<Lg>)2MDJ
zra_HW%C!e>Jx>}Ji-f=zp*Vg$6eydv#t-#ATYcjGI}qbCJG+00A%Wb&B~c&_L`M^t
zprFmU{4bFCBkkMthfDQSI?aQ6nZ`%-c4q&Ge;Cyd{&u1)MK7*&jaWX{1M>e+zQFcp
zV2ne__Xs1MOsHI*HkZ-q0ho@$k3MonFGvm%y<SgvAC*#Rd|-p&Q9*ANh#Z#Eq;gG;
zE-@VR)BxqwtCnq?9eyMUD2H*g3tKPRDzMwAVhcU5Pu@p;%q;I4_HNI3;&IH|lkLCI
zM-{!Wp6sD>C}RXMVwiF?gw%5Vof4#h7>i;yNsV(JiUGf^$a!}Pkf$0FUSkj1SFy<Z
z(S~K<oz$%vmFYZvd1&85DF?VF*d_~AJ0NHzitv}Ni_S@}%}f8#f<o|EXB=OgZ;y3A
zFhot6#98DFj&)5dWs;8tiTulpNoE2%gN>}hyM@{JXaBg&(5u&>K)2JtjDhHxKkx~x
zZPPl<WGOnVFc6Fs^8<`ADaHxbCxVDLz$x`EC%1UN;XPJCL=}0ENm^-5P9ztHEl(4_
zCuZ5m!CY!OiRQpc9lvn2+6ZJHMQFPf`C@Y|_U#-N-4Rw~3wVAmUWX>h-9@ZN`g<yP
zaEoa4_GNcBZu)hg&|FvQXX`MzQKDR!teI$-+hwVtU}Lm)_2+lfj>^@!Fl3xHK{gjD
zfgQ(Pq3h1vKd}r^NE?7}-dD=@pCdP8iwpRejHCC5R~7}Kq~giOv)CN5XpXj`)srK`
z2-PBJNAQCPQhDaA<Gy%~a|h!k-kwnnonxudmUGAIpzP|3?lU2*Gs6=5h-UDg8Q3f!
zFW2*G&eSg-brD@GzZpv9=SNZA#*PJQCK+Yx!jaE`r^c#%*8;&Xzu|!6Gxs#>mZ#n`
zq~^Boy6y;vW6Hx~R9NUm<G9{o?Ev0?M=(3$?GF^F)!o_z+5JwItprXD(4%!|Fr<ns
z3W{V<Ztl>I#;ja1P~K$zCfoS7bK_UcI@f8?C^DTgiNOIkJR?{~pBT$yvunE~ArH6K
zX~^psw)SECK+^wMO2{jr<xJy-d|DPX8MHZQAg@;7MN;y6`|BRl=okjapRpj8^#i?H
zNg8?(TK0tSKOB7j3nbGNFecK1H=}_2eYCL6Md|e^F9Ha=*<5t!(L?OJE*&n~+u9zM
zBAS{MuRtCbo4cl_Ur$*!zh1(!XBJ*Yhru@!($n`Vl9XejK2ovbc?*%#Lp)<Oir$wd
zrKYakXY1)42DOMC+_%UboIjk8kiZ|CAHpvY^R}>UH1Zq>#nv!^!=sjt22;ddN;z#P
zk?m>ROP-Dw9Tj=;F<&~8*-F%J{`4j(acUIdXd;S8)llT7=iTh8n01{P696AfnYSQ?
z3N?e>Wt8#zy_+@4;umF}T5$3$s@z`=rgv*s3%}}WW4@S5>1chGw=YS2)*Zg)Z&hJ$
z7__7uj$VmRTFA;Eg(q{A6R^a7Si_#9v8owyNFxeEJANq9ZtAX!UxJ%j-bvnqpY<Tk
zjwD2NpnDweRgT<T+bfl_!oh0=xd<-f?z)dimwV8;kr7nbn$gm5E5>tgp#-wMyu@|^
zWsLIytu;!)uO;J7(J>0U-aexo7y7X!*U3)$g=f2lBS>6-o<)V8q_R4zqzQ~2B6s_>
zDAXL~q-73E;|en~44OO><Jd9sw*%vFu;2W-ii%+r2!5NvTYB|Y?SF%n<3Ue09R+AX
zr^17$oJ$Gy1`Tse1Lq)(x>Y86Pm|%u+^=@)_-DElZFD_cUrZqj72h4C3x!?V;XUa-
z#-h*CbvI?<VH~4$<m>mZ`vO><)F9*_TdLDJU~;54WX;~%KE^-DX6L!>#mUU_uB=CL
z&zyB`i|3o5Oq|2#nRNKQ0e8q~*k`9;TwAt1niBC-33C3bkQ===kN%7tqnqx$&tkj2
zPmv*f4IXty``yHbMlqDoOR{_+cF&kmD%-r%tixIVi<BzLPYGCcF2n?8BRYN%C2e^@
zoaO=cU@f_}Q$h)YeP_%_A7BDA-pbop&vSw6I%N%I=B1t?n~m2fYjUquw0neF&=ytS
zAj%5tBl0n{he|4>vdinS;vjfQT*o(c(e`q&_LP|K?tZWy0pL&WO!ZyKS&2i><s><g
zKIu8h*_=ezVDBC3wVRvPY(!4xB~=03Ve-Y{P_5j}A6qzY+WDNd-vKy=0-1H%o*>_S
zcgmLYy5`i?a{TunKgg-KZenJQS4b_FZGvFGMt}2d+b4n$m}iZarHqTtAvPt^HkyrS
z=9zO=`s3ToKV?2SRJXm_RXvEGMmtYX$4PX#9<DKnk6qb)yxiK8+W1E0G=rlkEO)Ms
zCXNyD-&yZk$jJHD-AFTkKMvn!*2y&4HmB|vsH8ze81(+rZoEV3XFw`lL_Z~WZDw+$
za(SJAi!%6f@t1K=G*%+ioXAg*@XWukoiPu!pF58G^Vq0oxj{}#^0dTOWf1yLE@L-f
z26c~(%F4+<N*9_b(NuF}kwMkHA1<6JLpe%j)znp8L5m}7_FTOS+XU&pbxzE-A7kDA
zoCG28LSDsbZRg9VB7WFB@eSsD@T;IMDrfXfhwAeWjjsYRiXZFG=^Io`@1LBPXjikC
zvF*_djiQ|KmXP;q*;lv3XrWb3;C44+HMYDeZ6d#h8UIM9H+uz4G(CY>G^*+`flQ&!
zG~3=~ICrfc`z=yYHZ|@;?k#?R1#`2YBKn!vw&PT>ZpC@^5;2Ek!oPz8S&1*fe6MD(
z%DW?Y9k$tx6bVyFH+4^#Ur8ws@3FmlsgRusi$&J=8f)Cy(MP<kT{>9w+*(BZbX_!-
zZ+AUESW8C~@g(^3z%dy>0U%7Ha!=UhkFbHEAyXtf`ZD*)9sPanY9)%^4n7Ieb;HhT
zi^cKAhi_tT>B?erjTb)-5C%7hwWtTDJg(#u8|hQ-wybcHqCx{OQyTa27G*$oVK&EJ
zP}c}rSL>G?Fen#GG=9vM<Q|1==tIq7Gu=y2hi|vA67so`r)rSv!wb`J5yCD~WWZo}
zXNBZKYUA=yUT&?WD2;2T@*Udsmcl!E&%OM}@3NnGUf>Q8er6Q7ps_+5>F6&Ly9wph
zP(0kv=bs5y)yXtRNV;eNc%DYUYJt>Jo%x`7c7Mff9z{7&&%a>3$F+}-Aw)za7H!>a
z&AlC+@k*AqNUju^$j}3Gc*w`oJ%%5a|L&1%yE(Rb;-j_L#mOIYuU|R+nqP3-OQ>gy
zy}Ok&s!sxf?h&JiEHR^}6jfXFq{Z)Y!7=6$e!KvfkEsdv3mCOWtNDwvsOUjG9>uT!
zJJ^v01{sQ?(NmuatL~T{XvW@L)N=b1mHr~7bu=3cN(95ZGY@+qusE6IswI-aOnRJB
z@K`W<WP^*SjvO{mVFS6eDkCV-g|d`=dAKD@E_ldb@u31OTfFHLvg{UT1wRgLW-)bO
z)H765PZbQ>(Y}2yV=1mPD^kx)_Z?;&p@LMjYrT`#bKSR84578>T!}rhk~+`1**$Al
z(LE?JB3Z5WX(&-vE)gCaqu8OnSEY?eYYkC69?2J#%d@i<pn^BJvZj0YukxvC_2CA`
zPDDxX>;ZlL#w(IUd}+~@c!|7ZEv#I#G1<Fb2=`>Q(d2TPo=nl}Pu(2KlKM{N0Qw&i
z`#!oa@V=e!By8^T*bnx46%NiyQ$O!6(K-$L_}#Saa^Y|1f@okXBP)5|E7l5boH4yQ
z<m0dQFHODYM)8jM)#k11QC6(yYi^yh$|hPe33!O5F>meCG7p<pa*a=BWRGc-Hf5Sh
zF-alqWyWJ1EscF}_Vle+1{Ev}RCwgDQaY{G9q&t^oqC=s`yW+q6Ax&o<{c@7BY8JW
z`~_3=f}844!|TYe+xeQFJ=fwN<=tzzel5;gZP+I5cm`m9$SBo~O+*tr`~4eJ{k>sx
z=vshRJCW<FrRpFfQP%yn=W-%Yq;&Zcs4~R|z`lcwY#~=#E?f`bGu5QuucoC@pz9ow
z4<RS2^dI~=ce-TXlcANC$IY+K?d!(7Bu95s74Ng$l{b>%AEt-yNM^KDaEBx4>b|=J
z9?efqG*+>L^HrL)wV4A8*Abq2y_4v1z!)Z<_6v=FRQ){~U=Ei1Lg^YrWV;gM2xsN^
zv!{2tMc$NZ+cE*eduW+IJUTE7Sg5c%^PM)NxqU83dU<4+lKuq>YV(YY(yTOli=!DE
z1o+JEdNB^$LDNMa7I*Eebjsci$Rgsb$vyUCM1QA>*_MWQx5Azyu@Y-%FL$a5jh}<8
zI2ynY^}&35v`$zG(C+*kT2KId>%gj$U5m-Gw18@v7k0Gl%Qbusj^r+t^z5Tg>SVL(
z=^z>DV4$bP{N6(ZkxSi1`;PhC=Z8@(Q4AO}fFuLGJIJ+{c&}t5R}{IQhT7D`oC``S
zW&MmhV@qv%RFf2^oGV=(*Uy|)c1oJA9pwX|5c&ueHH|Q^VPgzeVX9={l3i^ZbzIAD
zR~0>i|A5_+t*S0UjGbA$VZC`^vC%c=*cZjt{3LQ+@A=ECIceMV4%8@4JcrIj*ConR
z{g*9`?_QhsCzgMv?fUNMd619F25CTr!bkp@IT)_TP;oJM^8*b!ZAt8%i)W6Ju?uWH
zAi2_OJ9Vjm0du@}kSmWJcShd|5vvMy;2F*R=NXCPF|h$mxkO*j9rg|GrU&;WtJUJI
zlv~?#%|XYbIKfK%K#|I}51Ty>dW0e1z2Ol?l?<!R#hDZvpR6(ky*lsXE|Q00K5x&_
z0M5;AD3YzN3nggY-z_yY+KpNn+?GEJ!{7W68l!+Ubm0C(%Hsl6*p*GbR>UYs;~SVe
z@^1Gp_39of9O9hX+VBj5_7{R7faxhpDQ=ghAR-stt5S*S_7_hfe9%`t`?b3jQ+m_r
zFV*M<jBP38JhbG>mlV;Bkt-LeJ$TIj0xjCWC=t%q8{b6@Em9QcJNDUCe3l&CK)te-
zPrJKi0f>NwO9O}*I^V@41G({<jjDo#2uN(SHq&-lR^W%+@+ue<bLRxN&ANx3ZP{m6
zDii}gb4A+m(sZ2E5G$iS_J@bCya4ds;-%yL4I1VPJXcCmx=)SNZqaClz&P?!C?^^3
zfnrPaq4_Y*Ks=|-Xl%^gNwEf+$n~sNG1^KX=jWV%rj$&d`vGcjvar{K+g;226SM8n
zY`^++uT_do#{*B%S;!*ld^!)Kkm@8m2`{DyD&u#fCUQR98Ls{MB9H!%;@h^;*l_9e
zk#?HcMVy&HnRZY*Fs<aMf!-J`zAE@Vu3_UFiv$c%!u=j{4omkXcD`Ev0GR10^!Czp
z*&Xc0{2z}&lXx7ZfLY^GT7G)iTzIlw3o2GcPeeJiC?9zvtxm#1<zK!dd3YK;pS4z+
zGZj>GtX;8fbo6=;*iND+efCcg@%t4d{*eKc)RDW2zUWP_Bu>i^JzfZX%vL36&MO(z
z?PrrqjFU+0^Q$1pA5C);<6)qvmrFhxpo#gRQ7WBU2bUuY6kvE_EHrp2T~cmjW+nO_
zdz$47%liZdXN%h!$Xv4*qn_9PkkjcaS3D2K%?s`!wDa}awx8c>_FjyWn3b`12EJ~Q
z)X)y=^XUv0Gcrv__&j=vy+tYsBuHpkpVD>HWKIWsP2Re{rbCICe&{zfWM&eX8^uUJ
zG*KENXBDMJ#ky3XSH6GymwKjG{EB;0@1}K}E$VfX4BsXo_X>@Q^>d$LlG<wuI-)A4
zC6rG{?Z6g}oY{T@?^T}Gb;N1{W|`wnO84TD-{F*BUvFiGh4pv#S7)NZe%U9z;IrE9
zkwJGlSV)nLdSUwO*KrJN+CGca&ct+tnxEV!49f(S;A{<e+vzp7@44aI5>}(<hxEQ%
zebTb4&nUxa8HfoIqKg0{a%aSoK=V6b+H_H+C;4b$XS(dLhv>tT{VLlfg!%{~u28c~
zUuIH$!F?mWo9OVVhjI2fIiISA2C%$CjmM_mE6(?_4nWX;uDFNYfLTUSP*AWlSp6F(
zR8ndBh#dgg91IyGTHAnKyx`A7!L7yBPea>Q^;}u3Z@@y13VvoWEI(kZb^?ok0XMW`
z=xC)QEG*X>a>&Ub8sC41TB(|zEMR%l8mumca}!;2<Ry00iX27~7#cPBaEMEwXmP&t
zf06f<VNq~hyHYZUz#!cS3Mi>aw;&-c2uLH+-5o<ngNSr0tu#otgmei*NlJG&oIO7J
z==*->oFC`!xh{Ti!OYHk#a?@@dk>#8m7G7!MFk0b?$dx3M*@?GWxvMza@K7OFcj^b
zd2f|vpxC)@Iim!1^l9S;Vr|fY>q628Fa31n^^kMV7k6LAod~=+bT01ON^RLGuzv~O
zEifxMo`4y(`dxe39CYQrE>mkP4SL#3j~lg^Vh*~d0&?@;pSXD+Va+>v!6S*{KAQ}Q
z2mj%5V8BOaR4I6$%;%&CsIiW%w8IBh#L%P6-jg!S`x~T$>OECk?6z$^Cpq0|tIfY2
zcKu-OosIG#c0@;U3t7;SxOE^#b1hx}9VmKUx9ekS&T%X<tsnv2`0ltR;Ns+ZigfoK
z2WnhtBg>eF4m2&CNKr0ViN3xWInfx6HQGW}m1EEq19M&u?dN+kw?Zu0p0pWA8~!G5
z@rFP-D2t~fcVL3uxHYL;V6xVZQIc?n(`N|OXH$MO(hcvvuJ981+Kyp|-}48>Bg;H*
zbJOO1rqDcAK;G(8-f%?GFkpJ1mQ8SK9zlwymWdmh@HwJWOexT+8T=Ya3+gqR)ikcD
zK=bNE=s){oG=tJUcE0<WY}PJ-3IJo;*V)H``fz-a{%V2M>$V_4XG6PsWKHipz3sKW
z<5B&H&*_0uBrQL-gp<xL(Qn~R`sJ72{hIP@5T|reF}40eCLU3IVxdk!nCt#4`8|^}
zU!z|?VqJ?%My1j$;**jk<BMcV-Y5?fq6X<V>~ef5q?DDa?PYtLfZgbNeVuA{eXS8!
z>1$v9Pb!6(kyH^}V`Bp-2iy%&T92TfcH5Bg&vw~CHEA03DXhwzv#ruGLvc1yGL^0e
zAMG!x`XKM362&YYn8d;#?ZNpHx%lFE9l4(cw`z`Q5LkSFd*!sB5iX%L<V$wqGUaSW
z>{7EAyYHsu38S(?uTR=#zNplV3^H|aw&Oj_Y2oFd%9oaoVadMRrBdYCFqW76)FV6D
zot(q6?1;<oG?eGj{231&&lq<GHmD{28329fi3+k<(3?*^<0ip<^*+crK{J>8ipi&4
z>)<|``|<fF!W?Wz&QVm&?=Xx8KZo_4xm8Y?cX#RTNH9|-;GE)_le+Vo4Z4(kBC0aO
z+H~hA6JdO~>OPX3+AP;ZCMPSa$NPR*tXcQl!HL)9UTTY<NdwE&JIPwT!3HOkbcqN$
z$0Yo~*B&JxR1B+Z){O|(Jl|oNO%A5_AGn$uCLyG9xM*a-WCE!VB6~}HN9jA}5xlDm
zb`hT}CVcDA9Cad<?aKi5iy|PA$jqrKSuzD9jwz;^FhhdLU|1>>J-sF;`F8cO*pqxr
zJuJJE-Qlu0hxY`Gsyph7gySVHAy<zIPKQol({FI|R0|9*ZrLuH(D#d=Q_d_6{~}Ki
zUXjr47>qWAKEKZ%@$Mw4Xcm&HRPa@|k9EU3NZgzL?OAf;1Y<45+;Mb(WkYw(;owjm
zSs`~<&1Y4jt%OaAT3!yulPTX5k<(eGLvqdH#|5!b(I&NMU-Ye8gR8W^^F9|)v6dxo
zfO>k~(<pw4R;U4&(_V|gsw>cv<J$P(v5&$>VX@W3k8y8s327^I)W3_>U=j!15frF)
z_`0bEcls8Up~$zDI}xl%e_&)xL1KL{x{|=)_2H4qR3_u%4J*E&-3gP?_?tMqXpyhL
z%^fbuRN(sIoPY5bu7NYZ<fd|o73TwL%9><M-YlP){t7D{uTb-4CP@O5dno5cN)(mz
zHTP?t+?q{@d5x)n!P?)l{tU-0tGr$PNT4DSZF7_5tmqVqF8^$Y4asqH)1`)zJfaKr
zI*x?<*v?L~jPrJLcwEUD<=v!$o%i{vo~IpO2A=Mm0tc4;n&;V*^(Dn;;GV7U*bT!<
z?NF_``Ou1Z@JlUkW0$(x3%*T|1%FdF_(<c)?_3E<bmX|wuSwV-n)RG*I)p1$N+Qu9
zA6xe>m2N<UD|G7YUApTvpI9xo%c!Su9g&{C^R%we*GozjSPgFlkld*z@g7b-G>^k}
z*Rj4?l#HGo--6eTwNVS1kcbzjkgh%b?wn^(xiNOsA7K4ZzQOYXSv&r_Yd`DqZO1V&
zy(8jj<#vAuGP*r+OB@fI14GUh^iHA{U+a%%4}CD?IBrR`@<qQ3a@DG`%{-d%#kt;g
z&!cg##0#G8swq05Cf!_f+hO(w6C0uG<k2)s6a#sA@8XD7oZHSS*)S&C_${2~T=EDr
zH%7V4eC77Taj$?=$|O$Ssr1QebE{|D*O_h&`?BrM6TjFYKG?I8&bYx!LFpF|PCO46
zu<MQR{H}*I!A`)BGx0KFD7@l}QhmZ~1;@skbu#HxWqsU!7<!-D!^I-TaL)240+0z~
zW3`_JGZ*Mcc>}L|Y|>DKW389!zGBvB(KIDgYSGJ4z((l@Zd1@FX3)r}VSfubIBSN;
zHS1?fz<4)2YxE`#Z)Ke!eNw)&>K=p93=^C~#f}7Zk!)`k4|xVI0Ch)3f*)L20MfAA
z$p{lHPX7>his@UYyco_LiLS?=*u3mDX!y?T+W|@i3s3R0Hncia<caE*+0Jn1$q(X%
z#e3A`TknXb@S!<4F7a{ZtIAr&1zyM@tB>7uO2u4NrH1@Lisym{uj2=!wM4z@Hy$5v
zikq&PG%&LeQ@vt+N%}Ka8=M$SAb}UqB)L31%tAb~FU=eHi62Hgo{kgG9iUTs9r86P
zGC02hso{I|7p^5v-|uF-a9yq7ZyicU?69oa7sVz<SxDB$Etlx%u<GMTaWnFDbup*T
z8?ciQ`{^d$>`pP^KZKA6in_e<Q>-5%$#$-o`qq`mzk)f$GA<#M_NYtx6&Y*r?)&r8
zwL(fa^U(NjUxb?|%>*(;#gJ~WYl5&m@y0x68)cXPya-Km0cGy?O`~-O$P;Ab(7QSx
zRf)YcVKk`odbQPQ+rH}oOX>>69S-a7IV?H2DLGS$v0rH)Hj`B3C3`zX2;6DS$J9qw
z#JS!%hkv_RpXuz`c5+JuUwt<9o1zLHQ3l|=Ow_NdOqLhNUDG!o<qM{jDGu~4mgFTY
zyM@u#t=%rb)G0}F7JM`;IK{24bu1fnR6pLnHFvDbq&9o>%~GP-*h(>JK7RglGJ~Mj
zyeQdmT@!BEZp}T97{(%O4g32TsCuzXK2CRJw%w3+JxBMNkQu}Mz7#h+G}Hv8@{Ox7
zbV|sNsE2AYZ3E-bbAh+ccOd}+xM6@F6v1A}06~sx7ins*mBVO86Y1aUXnLp$>fE61
zIoIpi=I+>Ab<;<A9KXYEP=rGwO7!M>PuTi`>A6e3aeV8ly$RQ_tZHRlrPN7~Z1)}*
z0F}vy*Vo_#4ose~J4iDo6#))6nbv3Vo?E5zI+&(m=i<CpAufI3R0r<$P+V?ELto3?
z+4xG(M_^~n?{;WO7Nw1kI$QKP?$s9EU@Lc6JKkYRJG&sgOOj1gaeTbIWN;Iz1Vf0}
zU1e&a@KnOd1=EJ?XY>Ws-O`j*;!Qa@a9+Rl5Hn@m607@d7H@+5L&-lU`}`;kD?3h%
zlDvMCau!c3mPu>YNcL6EA^Qf#P0uU52GGtzVI<8x5Jz%CcDS13q^LBq`r;{+b;&BZ
zEsHKfeBB04ENJ{yf^s}rP`^B&NVgDmwlRHx?B`w0p$2L*q`8PfcRnW2%&jFUNg(d2
zZ8rh7*egnZ#u2~Un@PlLy}4iQ`UHq_h#Y*4)uAwE5<C8yREWMT`61ru8lr3rebB<k
zdNgTtWaY#Dy;XNkT#-0=9E^Qj{lJG#PbdY4Ii7OWf#dk*88X=$5XIGAwN2HE%fIe2
z^!`dJQL#V~jx$-kom|p>r^OVyzHtob5~`jk4GxSlI;RPKW1cn|_E#nfcB$f~iJW@=
z*8csLQO}VB#emBc1#jos`ku)YPN~<;43Mq9E@hVV&&iVrRw4ss321M_tG;-uMncPJ
zxLaJp*JBgFULP+es&mF@usJTdb`1G;8_zRaR-=6H5gfD9zqh+PO~#R`4v=be>Z%Sh
zu=>#A#Vey>CZ0(07X<R{`03~BG-T(t&RPTpwJb_fRHnX`Hmyu-L#I)-Q);=I{d(rI
zw}{I=wE|fD*d_cw$lq187P}vHGssCOVY9eIREFj*Ii}iVbDLOmWDIwVzZ6<a=L1j+
z#j?ndF}F;F=d=RYsTSrjV&e`$zS+}bd@%(gJjo!ekjpshJ7zYRZu$oiWCnd@e)`%+
z(O-{9RL>26ELdbQ1IF0sPJ-O0(NE7lYDi7Ay72)1E4z0O!cUt9ayBDnq!^1I&QydG
zT?G>LcW;renorg8aF~`IIZHFT8AFd}xdQ60NSOesiySy2K5X}|Li6SdCvA%~fNIOI
zZ_FN*Fx;V-kMf+|x^^0t-oH)0tuYKLlRS1c?s_~udY*FE)2%a>Ri1*^emf$kdEmM2
zJA!coAGYC7M4so2o}vpCW#EFe<&LeAPW9QRgMaC&IFZS?Ea%eaIF<Y-$uG||2ZTt!
zj&!V_lZHRJX2*ex(dGW4AdZzSD5SVoh_p`RqOSeL)3Fj)*@eJ<1ijL7v`;HYEtjKD
zwtqV*UR@FyD<^QEEX2C6wA@!PV?3Q6A;=45?qh|Td}mTC@;*J<l1G%p=Z&6ITb(}S
zZ3BcgBA}jbcPRdvuz3r|G_#Pc{I&L-6q_~@nDGqS_iMNQIhzQlE=1X#lgkKaDIEt+
zD5LiIVhnlWF4L{MbS=~0>hM$Z*}UJ3s`oNN&NgwdQuC$)#%fz+kD9cPU!8vcJlP{-
z-N7BIDU5G-n<@QP0Qu5e4LjMGrC`PaYH|;z=2zCML)j5v{Evm2UE`T$pob2geD!R4
z%bz63ZN$=UoQ=-pNIVRf?fY@d*DGyTfU7ZDUUDbOS-*hCaXeyF0@k#Jo!un*I&p+*
z&5i1_iGy0?eui1ZdGXOd*+2P`<HDKXo+-5U`-ztuqLk`95!Wk!^#Jyz+m)r$L8zhh
zMT3Yl0TmM8TW}wz%Us-kk}Si$-hkvQ-oL4JVphMD<nWL}p(3WE+_}S+l-=?zMmo;2
zble?NGwvh3o|JjxtNsE4iUGRIQW8#ErmGZ7Hd%5zdkxd?CGpcqVN!)%tlRS&*P?<=
zdMDB7J`T_Jtc<3QA9t9ISf=4pMeNz+cj@!L9$FhISXm<3=|EMlGYzW}I><Qumazl#
z9N#DTCzsq~&k$Xy9b4km<ad<~Lk&dtd!ke^4C!%SV|4+<{8~X+usqHky6~qljRfWS
zC^(a6T-Q%g_emyFU_9LB@wpItl2JDErX*6k8fE{Es(o;yff|fpJNi~-XC$-<0P_Lp
zIe3H9+4`zy?s)x&UL(N6dD1u;9W=5JYJcK9^(ezV$B=7u{cjMg=REcw(|`2cen{4n
zqQ4<6z`r9yDk=xui^1+3kz}H{J(?Mxve0VU6z1I*s;Pf9%l17y`G*4FUU^G!S5?Q?
z;|LU?V=P+(R!DkyZ(?xx;_BHl{)lViT?H*khxbLXWsjC0?-8BLL}kew)p!~2`Q~a(
z5Gv=+O-(=6n6BQHU&7-<+24!MO}0FsOy2xO9ndI0^gmA@OQeGIivq{Gg7;Kk6)nX&
zR^Fj4(g9V6*T0~u2vXndJ9VT9bH5N#uW}@-W4|OCuTCcNaoHL3e8V&LViBz|;nB^M
zII)S9-83y)vQTbcbgYahd7d6(abepioX)OxkDv@e1j7&>vb!crQ`!xr4g#@lkGsb#
zUFg#%;NoEDby(sUTjCQ3Q~0Rr_d!Pj!0LU?EsOS$bm@o{S7fv=17XI0)=s4n<EmAe
zGOyY2<(ftZ*FL!0uDWcIoJU-vbU(4=Knr6&_$N_iZLF?;0C`^{JXeXH6cE^4Q5G3#
zyUzL(ou4rv#rDU^`4pAm=<_c+bB@K-?F=G{ArQ1rAhMuclCTCijUf7VXksskiJwf?
zi&KQWlXqlh65;N)?o8?GzHU~tVSmdn)qPiL^?OZ)&PD3wezrG^2t!Z&2e?wJ@jxO0
z&msycc5UgD2ot}~1vEN|wxCXcgr+lERhy*xdVt_eRhjwN!+r{LIf6lJ{KsgaOMugx
zGf^Ou=1|5Qg0;i>>2)M&Q85MClcUUYHZ#ftQ2A(o`@Rd20kvXB3nzw4%Nw}N*oV^y
zfw95z{0W%@di!G(it#)tV<j?Yy#6z)(A^<(QA--p&pO^H8kNZvRRWRHuJ*ICPZoMC
zcp=U6bTaRCyfjQ#%|?p^lWm@&o7`VKMHEz;Mc4%oaqH;!vc4qC!+Z>-1ZmEW(4t9Y
zc+M=${`B5Prs)+(B%!*2^@|!~U4$CYJDhzqe}$J;lp88v@J_?dA*jWXM)E_PY7qa~
zdT9&2Mkn*mJwMbB#vhT}@426fr;R4@*yTJ4A%t<Cy_WA_50{-$mTDQE0EhUieh#=M
zZO39lDE0aX?1V<L+qx0=$%k$uMR^(@wxlOxEoMKKqGW>Vj%nfuK}}HGWTHG?sEc4h
z{lc6Ibo~LFD%VXir?}0zLv)9`LsxI;Kl-gW?u_6}@)kE8<J0Me%upchXzm||uv7<5
zxhzpg9Tw`%hi0c&P0N~JZ*(F73CNePWrqFFRl87ct!Ui^DaKoTRD*Jt6KE^W=Ttc^
zLv(cJS4L|Z<=R2~Pod?JgGK+i6F3NW;x&?010Eg3jUS0q;^|zDor+lP^G_-+?3YLW
zPSXcQZVO#TF6PvnREsdTTE?$_cD5yTfELHO`^M2I_1n~5y~%mshqlqX=Aql8Ge)Zt
ze8xBuFTg3?SE}<8H~;LrZ$A<v@@+^_J4Mz^l+)MS0e%^TR`_^i-A6;0J;%urIer=^
z6z3PuL4F2|8hO*ET?UG62*PT=L`Rp3#``3Zhca-<u3V1JuHIwx^RwZy8Gpw87w&92
zZN<6nK0fW@66r^~9gHW=dy_6+Z<WI#4iQ&=lzs;w7{-C7I!YEbkg7mPMfbh>MYn*}
zj~hQkwKcZM0VSrV)$WfD$1*Czd5biDGEZ63DU@Z)LBRq99d&GM>{9HL8Nhvd<A+Fn
zy~o-0T`>yjGzA|rawGF2%!6zi_xqA*{Ht?#R>;rUNWSUQnov_&Ib;0*S+MICj0!|i
zFHsz3+XTvqE)WSRRAj*@2Qy#wRo^Z&sac#u4f{+iIW7gluN=@CFfA!$I;~4v>%2ha
z(#0;wx83osV03nZMNNcXcm&zrVRu6g&;8;trDwrjMXP{a`Lc&qX1lI&%fRL<ipQCY
z*ZNeKdwpvBxuj)Bh#7w5x$o2o_0z-03nW*qs+YKhzSCECEVcC8<q!9;PIT?5bv~q9
zZiM2|UG^2~Z@W=VNV%6C-VoZzcM`gpF~$`%u712{<w;R^;lyy&Gige6@CD>+;D24J
z=PJY@U(G)APilNuXn5=blKDNT3G}1V?FXjW^sL%FQ=SO1V!t|BtQqqh2bujSCa&p_
zpAx6wh&!W1hP+4F-M}_&hqlMIeE0Bt-49QWt(=gHb@Qa<t*~|tc{8G{l`-bgCb%>U
z%O&D%1{G@hosVPd4n{O&J(s!MPm@#Ihn=*&E*ylgkPe&4*r^QU>tOs0^Wh;uSr6i_
z$u9@76eup18gBzW1GhAaLu&G6bi72Al|~d-`8ZuU%tXigbF25`$ZDFWV)dtRboaKu
z;MBa(x9{=Mjd(hStEfA<KFphyZ@=R8fPg+w(%_;o|9Um|6#G%#+cV(nRXyqU0N1L1
zD{-}Y(^Q8F>r1|rS=Db=A75e?(<=-*yayZvr>-~cKRUl$)2KPFG3?ro5Zqfkw%B>d
zC-vo5ex<=RBz@5z9Ks;spXhZRW;ODnf?DbqatPIgoQnGEIvrQ&B08FM+zvI9s^^<F
zTDF3|%MBCP(|98nYzlm5to*n{DKf4NwyDTF1XEdJ3aMW$D!z-G>#|QhFY+bSR+(`?
zJz2PK0DeF^Id}pfPrEJwkcC>j4%e#ORx2w+n>KOZu7Tl%XH1n_pl@*($V4+fABBG(
zIt2F1-`f?+q8K5{_iNu~sNYnWU|Nj6X{U58>4}`Ltzw@M8SN;juz?miX#eBMa_!Mz
z^d(m$sFQvx#LF%(AxaKLr>4V9n0FdGCcox`m2N-$Tvah$Jj@u-ueFKx0p?l}?qnp&
zLQtM?ey&)z+1%APAVIYeD=G}w;LIhn_%<t1M5;Hd*C11#vmOL}xZ2@bh0n}0vJW@*
z1mrFOt>XtW%gUyA(N}TcXicsH`1zX^v$<79qY>=lq+FKk5)u?4I@D5)2e&v<BFYU=
z9Ns>2i+bP)*Vw!ptN9pkN>R@)>(dd&&AYXVM!jnZ;znG<PCmOo|I!u}LDS{=0@eBs
zTkWGSQS5S)E@vARfbrHw0P;oS8-kd_om-u_uQJF%+2S4lQnC{z7FEg?iPZhIf%Jf;
zYudxkHs6xYQRMYxUa_UPTUePf%nJs9tkX~gAA=A2ir7QvZQW|XZ=qi@^PLx5nD&^6
z9(&fFEGD+RiWaU1SpkzR(ytyym;sJcYTZ|ua_n!n{3uxU=<pL8ZWqLIW_+1=$Uoh*
z$64F_U|`gF%V&v?jw5cX;+vAP>O_cj;t2C{vBakAs4|>V^=zf1R`<YV|K6$IqGr@p
zasAPgL*8|+H!pP$5)K~CrQ3MsI!csf&`y-^Z{ezSPg%DYscJ^fk5{C}1W?jcymBkK
z9~&uUlr#dv{z&DHPQ<DuqTgmi;WpwpQO*+@ZVK-#)E~;~+28D!zc}k+IiX$Hb}eLd
z)QDzO&7xe|I>-s1{?3ISk@3Ce_y=zcxGNeQOP0eXf05X}CMPOHE`j*-SD5=N3wpuo
z5yFY|=OX-&hMxJ+=6Trp>{k_gv9&twTe!bTu2930T%Wm_4jv0vVPya|JU_WteZ9Y#
zf()o&pa=tox@fGrivcaaNzVO-1#n~Yb^1N%3tJi{vJ+nx>7T}=0rjE}9t=FlT7F@a
zY_K@muL=%);@oJhBVBR*GJsq=exR;b;7HRaKo_?g@9b#HN{(<g?2Y)A%~HC|<fA>O
zdtXpdOu+*jX;>M_z=syUGVM=;4J4-Fq_NPwOo)1v;a+l*_rq=}D{lUADikJR;H*-P
zR^0=*pkDExB3mT|B54J1tqmaf02T`!FU9oWzHF<n(T(YvN$Y08DH$ti^tMA&`ok#{
z_!k@AA_=krZC}r(E{;{5GUG^>E4D-XWv_=>3~=QUoaWWi181(}pf%<9kMppif~H{{
zX!p>+W73c6*6D#~85U2Z6Ex$+dhCYk>>eL^hzbt-qvr2xJ|}uw$l~Xa!iBz}HNWh*
zNupdT{`^W0LAKrIA?WXHmqQi%)pwgDn^GPN=i}1fVgEEHH|UfVMzb@s|8_v@3mM2Z
zk_d6Cj^{}$gMb3Lh`Qg8AFrM<)1k5Gl)}0;?;_L6Lh1qg+#O<RT?X&>n4Nx5Uw?e2
z*TywT?<A6fX^I+Xu8A4}0?D3j8~$D?`sA{{_l;Y=?%RpQ4r`90x7uFAct4x1?_HXp
z<HO$iA$W`ihx+S(`EZqxJk8HBT>hJne#}fxCSBuEJ9t2pe|!{279vTk+8w>{5p^~J
zIkKvG#u$%%LoAlxG~3@_1Zu!q>iJfKQoIL{^PH{Rk`x2}59zC!oMy_h&>fY~Z0Aij
z^BS>1u>=1|ln>!|73&-mq-A8IsY9y~<oTjEi`HZbS#E+#)lr}2CKi!nz^t5^o$ATk
z|D3o<L<So4)@ZE6VDWoV$E|0A>%j+XvEDGJuDddR3wCQ{0<Mo>%VeJ|?nT)6yz>MP
zXh`GVrBU|&p_wg5amAqBpz!wE&9!4}UFOI-GO}k<Z)xaArWMcWDt`np7%25b-H>wL
zuK8lJ{bu%CsRY-mi{cw5iwedQXe?8qRzcBhU&DC<A<OA-;q{C$(L~M%eKWDsG5zOM
zL?<So&^{BhI%Rg6RyWG=?tAUJaX{1~{w_IMHe~GD`Mgh^!;g1;?^C|_1>L3{Ynl8w
z{E<zu3N5<tUf-HnVovM(ldYuhG15@+i4e~hGI;gJPpd_~4wXCD0dAj%`D#_K>(BI3
z<f*U6pS;E7Q?j(&KDMc$Lc0x#AU(>o+VA~wL_D9PQ;40f_WAW<uZGwfeCr}#SOVm?
zxjoM6qhF*N)2=clSal!YskQm=R*3Gmm;O!`_1SHZpN>kiy1z2y!N!K84k*;d%$FoK
zF?6HG059ivW80;X2PALB8tX$&01HQH)Q_8V`knz;PSk2XlEFO@xq)ERFS@NnWWw*4
zQ^p$$n!%TDae|(AUw)zF6c8uq&KEfirC|}_eo6u@C?0zwZy3~(!m@5Lp)W&AzSGHA
z*bg|`QVB0u^Ddoj01<`gQK2epOcEr#890Wd<L3N6*2ad6Z|g+c&Cj1}G1O1J5>Z`F
z13W3i{!{L584V<O)uWLT<ZWb$pZd4JO=mZc&_M6T1WI4`U5NbgF5}1wQ6hf;`D9?Y
zKsDBL>;2EdX#YA*9}%?5xvrWWe3<hDg3#DIOs{2b-<YSY5j%;KO<+GmS8p&y>(SWf
zvzV$4njs*blG7viwMC6!$xe1mc)?#D)I^QS$isbNH$WcT7(nG|?D*0*Z3n!OLM+->
zFW!2Q-)Pl5e&AxBHzxbp?D<j{O7YaoLx<GQ9#3?25XoO2{<Y<w{&C>m+=OjRII-~<
zQy9E5R0uPT4(lZ>w_$%FkU+W5%V=ky`9MDA)ABH)94)LEt441NO0{IdNg9w@WkWp&
z-t+ht5&ra}tQhn<Mj0Su*atzX;{&=I-s@vP{R$HbijO)&LLT3G?W9F~sujdbSfN>a
zW)JlPuMCi|t5gU$&wZ9EW(m4IY}52<9MBO=8lJo5i8Kw7)OrO0GBLJ3-LIHdy4$^I
zL2uDdgi&Gb`QSaDInMXq`$$$*Y$ZYbAf?hCnCi~_s+TuGdb}=MfW!h^+l~2!N>upa
zES6fWhV*+ezZ<nR!=F@R^CAl$L&cHy@m?8DlxltmE@~SEyy9Xn24f8ITxX?@-)?@t
z@neVR)qKS?*`^ydi<~W6<BX`*O1ivI_H!9s**jGPwz(RyLpd}$7R6FEj_zvQwCo|(
zNe(oHCoPsYu3ipu?GH8UybRgl9eEy`Y(y?OYT=LTr+B<(W%M9s@8w$Y%T9xL>7{aO
zk_V!-+e9(c>#j7V2?xH>_f<d0%DBG<r6=Z<q{oL4Ay&yY)&2F=X*1#U=as#`xd48}
z9L#Cn0CpOPJ4g#aygqfku`%}(H$`i-1f`4LrI4EwvQ@_mIL1}g*<c0S-bsa;?AGJa
z7E~9Jpm4S}7?IDz7Brc6E+TX@UDU|&xCU=Tz}vdMfxeJnTJAKA`^1V#X}6kC<Mh}u
zp~$b&huo$;)^e{__?JeijwUy2rc2#J`a1TMlX;)_?d4bZ<SI4nB^`hEKT!%@KU+8I
z3u_a)I?3#AXRSD2@4GbbaXXBvV?iz(=;b%H32h;T3(>m?o#z<|Ft!%v{m>!GC4z=~
zv=QB%_n6Pka@IK`^4cL99`KYu^enH<&jfGJe<Nv7$D5tVl(8w?j4pIvc%~xTg#~G^
zg2Hbs=ycrMGR|M0Pq~_>JgTg|y+5jRiT3t$<t1aqmGZ&xbwB;Hg90k~L#NWW-qz<O
zPeV<Uujo22Y?+lu)KaU>-mAlhwJ|*w4hu6igw9&W!(tZaq!R=Lv`lR0#1x!8g)7eu
zI-Fm)@9YN~SzLM>WwPYlq89dUypM|NrwW4yvNBJ%gdVoK^Ur-?nC=gCo%|LW@|t0<
zr?=K}Qx%nDk9Jx&+}ipZEk3yce=16|VuXojd`0#h;j|sp-D!`@3f+ujm(}8zcV=Nt
zu&0d~JL-8)P&p;2#r>Q+l~SI4cX9U>5bS=03%a}p>mdwebq)&)C!pos2jTPU_u(cd
z>dZQc7LH_z23I>%-11eF2K9!$Tk-P=>cYo<-vFnc4r*<0x4A<XvD6yea|2FDu|RK`
z*UlhsGhgN2+a|kg+izVwV-Olgz$MnDB<Sh#!Y^>%=oM{$f|dEw(udH*ESsUrNxME~
z)`F4wQHeL~;syC!r*ON}v&qh{8hc+7T~MSqq_wY<7tX!6vxP2J_Uoq4>atzOe3q^*
zx2^=W?0Psbk&$AxT}^^huZ6RQEDgMyZ{0&_?%IHV{VKWe`T{6mouL?F5-#!2!TR`I
zQ#xnkaFx_lDrh*p=Ygu%=Uuz{;ppI}=gQWh!AaSfd3bAWU%w2%kMAwG(w?@t5Z&H8
zmKwjj9M?76r|(S$;qeDs<<Hu7Gs8cSrRV!gOfDC2wQ@+1r$cPNVV<@1te3$1E++dj
ziIEtyAQa|fCFhay^LyZ7I97R^%Z4qFtxxV_E|-BF#d72gsaGedg?@~jr=+>$x5CSr
zxF$6ygPiXcM!@ri_fJ@-BJ0niYX)Uzby8?#+@{hgBU5(D=;7qCwQ@XVWVAPhPJJXY
z`z}&hv*-6bZ*P{-;FIf(=8O8CWO5jsdx6LA=BR=jeEmfh7*o$gTTd#ODR^9&zHb|O
zDY<CX4TSDpZ#daNAI!EodrV43(i8G=VXCfXkUiD&1#WrabhyxQV`?g~LFIAMNkVFM
z$!WFi0(*tWgYTa0@cSVt$A0ZuTb^_JUGmv(^)5Q6XI|%%$X&*J?5Q>;q%7kH4T2{t
zoo1dn#J7)ejo{&OM*}oP7yY92o(`-kr@1uLlS=M%mNW>^jS%DzL0P;^K5F-^`4i1w
zygK(0b*Tntb|Uu<#uO?tGL7xalJn}!k@<1@Dd{%1M#$7iVhV^ps!o~3PO~l@fJZ}8
z_IG0&+?&n@&IP%Vzdl&q1}rbiE*&qCW}P3B&yQObv!ZE(V!i02kp<T8$?F&9miq6u
zJdbLIy0i~VRzJAXLYC<Dt@B1LE$y^Zx}2@3whEVYBo>#}qUkX~-uw)`&`C%1hQMKQ
zgsjjuiqIPt@MME)V(yD_l|$g<%d@(4NUt7pg?pfm>#J`Z=*Z5?KTu+&u6@^s)0r3s
zw5(09lBQG3*Rcm*U)1Gl3v+u8a1>x&En3Od2J{q$?47B4E~v_pm^v}PYaOYuXSQ#4
zVlMEvyqJs~QnkD?_4E6P&RlSBUiCT4Rejf>(D%d4RU*+smV%1T)Gw{EcZH7Wxd`Bj
zO40DPSmk-RkqjyXO5IP2jNF`WLvH38Y2_E)mD8R$dIBEZ{H7o5u$u@YzZrgVa!||E
zS$lb2lBH(|ff{qej@|kqj=6L{R^mDwZ(C<3XKxAQSDt(uv$hzaMozp9<?7h$*@j59
zET7ULBf2OWLuPMf6>>M44!YJAP9Yk-{gj71sj!c;Cb_5N%2_8VTQkD;(!s9gx?gF}
z(=N#36eyv*hn#97x)mAW{;GPr8Iw`SqGr&7<;cN?X`XH!JUJ3Sx2PA&?FPb>naO-a
z;aM-NCTs-7s9usqwaT-L>+TIic-kZ08(Gbt!tZLneY&4-<?-p3LZG!Z>KnLSaAdMo
z!^I&!ZOW5IYRayQqt(RebHjzDck|rl)Ae<?ssmG{SmdQ&&=*o|9nqRoE*Y8c0TO<B
zA}xEx?+TWlvhQr<p6JXa5mQkWCc&ro1g1;ZFU1si4yoS19W_J^rFEwglGemti#e(z
zIe?tESKZp^S-Jv&^g0sR+)X=AN$!-uG;5hy{>={wivF}vawV6RnNFWMp)M?<C3wEW
z$xQvl6Q~n+E89(9jo`hs-LY;>UAN22PNdoQb4&U<$F)Y!Re~09m%|$J>uTgR9=+l7
za{KZneFe7F;^NHTiZxp*H?4G@SXW}bK1<s^2=fgH_Odbx_F6j|ni8ntT&Fjkzxs3}
zV9!9o@6K((+I+`|Af2GyEhAIzXzD20{`l*_hwmOMwRTjIyqFSrNQiATwueCs+6rr1
z3e8&Fyq$HZ;F>3~oP=gxnoBJV%{E$4xG8RuR*zdP#HNjik+zcb>WXaZQy+7EXw|@$
z8I|)4th3O~Puj9Qo$??jfmMXXutc#7J}7uf2Cp8NKK`J)fAAo}MMhSYbN;k23#ltE
z{wlMNc!NjWL)-i#FwA?r1t)+H?>&CQEs~~lZld{1xs$G<5R1~<$<GQe^gUJ!{72dx
zJ^)41G=~}SrCmIjHGlnn0lE{j%NN{RmxmrlL^|9ll6+3)@<yo!X&HCtUqoI*LdIgD
zrk<QZH_q${!3^eqBG4xhZ)LgYn#bjp?5<DOsmVHR+<V|`;gZZxl^Jvm)<*R8inFBw
z^W=eMC=LIE2hXcq$}HA)CCE(Awasq-TqtVcG!E2oLaKf7H`#@S^jOj2IN@ub<90u5
zn(aGYxJ6ErwWrt$bh=|DPqSh|3a^Tb(82mLNl^PV=v;PEtoTx0mM+xhm2A$lRxxND
z==XiXxW(#5n|SP#;Jw|i;5r-q=`43wc0E`N4`Gde_L&1|A>vv>pO_Dc$K}*Ptk>nL
zYJ)mP2kT*iirS|7@?xi6Xk>>L=I3UTe4L*`sSV_Q?e4_2i5{*;>G!I%S>_iF>z3|g
zQeDc|zfbBqX_`@E7UF8S+@`}vg*>VhKCgjBkUPgEB|VjhNIoW!OownCHx2RslyKoR
z3$)I3bgK#8I9E3}Q_q7;_vDds$*y(hdhPJo1y|41q%P+^ChA%lwNGHsx+rL?VGNp9
zM?I7`dp&MJdv87crx~E;4G9DLwB}0lCM;{1F9umJo}B`gaP5uWy_BQceV`69cy$T~
z3y@|@{LOCb#4x4etRiM3oW=xR`5rMIaIG&U`QCM)856s(xx_W&BG|dxv!L0xaK6-4
zs6-FE9ke+sK_Od7?g*ONOyVHRv-0<CTYiKHR|>I`<1*Bqp6(gP3jrtT=<N>bo@FE*
zA8RzWczI%4-F|4^fD|T-T}P-iJ!F?h`J=OUBNE9h)^{R4UF0rcnf3FoOA0$vC|JDx
zXIH>XMbWadvxg8#wT+F!;}urZJ|12x(mGFL0eig9!U7s{vq9K9P0V4}INF~h*g(LM
z&Pez~+{pe!dCwrm7RnuyYFdA;?tqL+szZI{rhqLVLqIey5gw{c+Hh7z5skY-+CZ-^
z`3nigII!c^fD3eNRbKE2Tg<ni?^^7x*8C5ys`CY2sldC=>$%I{uAK<jvY`2?8m$li
z#6mg1g4vph+0Ug!G(^U_?a%6dTVO>>{$tI&Q|&y(3V2r||4h^6y|?v?bO9i2<MZ5W
zcM;&r3-k8g9_QxlQQ4L4b;T+;n(VN=pSoV<I#Ce{1co56;p+TrIwT@IJiB<OgNA%E
z(J{5W&W5be;8%ArPP|dC8OemCBpH;8Iuq-n20C(bxJkjVisR#Vg+X=#PiY~A-9w)c
z`>cC`Hi@s}rSJAH^wo4=(<jN(QbI>|LKV974F?(x(b_w~s!S_(EJ(9x?#vC1pB1{O
zUQ*maco7`<P^h+Ox8a0x{cKf|W6eM<IrG{rV@lZhmI$`+k2l-1bJ?GajKZ@mCSDKr
z$G{d>-o*R{hq|(^^D8C_=BacCM~4iGR=2X=-riMOox+8ZCm7)IgcAXqb!zzD*}NvH
zi1YVji#P-dRH&g>4g14|UY~Y5Ei?iK<Bis}n^bE3ej~)YaS>w@Jg>MSf3+_k(pM8s
zsN+W^1K=U$y2zdy-z#)=Zosh`ak(6EUni%J^)x8;IOrQ39%~fMOgE#R(~6z536{mX
zvHAuCQpi{s2E;4P1(jz14HXYH&`;4cez%5FzVj)`%RBAaOG;xPJ`DP1reovaNTwY3
z${GB0ysM(4BQML%?bFoU#3;19qy5u?ujT4B_-15iI9NQp)A`XTxr)9)OzIcP{$2gQ
zeo1=|jv{2M*2Xu%v^nK<Js~vcw_i)N4Yjnqx=T)eTkjt`f*9-~M2wsJakGa<U27rV
zzG`!$3+gQS&EAE@vZAV^glQZJR$BpdU%PwMlauXgYrn_*FFODIW#bNz7C8wG9q<wB
z8!(9AJ1Si7!1e+CbQ4!sI;@-68Oaj?a>WGl|7yy-&yDYCznGZYGdVapWm;&UuZ5E{
zk=ODbI8!0qkcVD2EDc<oKGrJFe(yR0b^kT%M<w7%a9Sz~3m~(NbdYbD5P4bo>~skU
z#{98z2We7L(n-IVv7f>LzMLk2_Buc!gw;GunYY1WLU(m#vw#e0DWCj#%>f&&ozPB8
z*m=X<BIsX4{EuIB_0drMxJD+Xz*zdXk@vnpU0TY5f^r}6KU6Wf3a8K*ni2N;a`Xh{
z_e%A!u<>%HU{eXIth50T1H44N%$Naa?WBz$P3kh-+A=H`YQPES{88<_ZAgiGM)%)S
z{4;4agm|0o*Tx`Fa~~=axJ!GLv^zTbij*uhXWw<H*TN*Nq3{WseaNqI7o8yQ)UWlw
zPmg}xa#jF?O(p1B`}yqY?`ce&Gk<+Qvn*905#PWTJB`=Z-JPNTWj-1^)nPGZajTN@
zPp|)D&C4>tnoCovB!k01<0{%Bx}P2QOLOxN5Da-0N9sGZu0|Tazw-?*2Mhg(aCWAC
zHL&S{t2Op@GM>tmsm_=M1?yT~_@3L0rnsb<u(LtE_LKkG*}n!*R1B0N*_wqFK$|fs
z%$DH;d0?O`s>;hpvvH2=qY2m1PZP6rNT2>{0k}s4#XI)L+r>}W^}o#!3vl~1;@)Hl
z@YP2{n*Gd|aB^W~{s1V48H5o@u3-Lol18Y{zq<Uj33-KJ#ZOPidBMLE)YHgA83JfN
zXj4i#PmC~|7#kPmo_*Z;^*xw4l$erIRw5!yIpJZy*UKNevom2l4^Qf>)|r1!^ajML
zySRwxf7{Q`o?*k7Kygg<6C$uRh#cZi`_d(phCCgk{Sh1Y8%IkjQxnYOe{2&__1V9q
zC$A)gn1fp!r+0S7mV}X*$9W?{%yXJdqxXP;7C%WE%-E^o$^WI(16-hnsZ=%Y3VRDn
zV=xiE30%O#Q!;sFUpqLRlCoK*e>Q>-+^t{hqice!q%^d$9jSk>Gp_vRVRn5z<?Kx6
zPX3tsiGY<k8$2B!s?GkA3~^5U-!Cb2R2T_q7OSP45e({4Y2(Y=L27~m>`~(4ZA0DN
z=9wWA<ye{TnNfNswJhj=wPGIFxcya)*VVqVq_Ci%x6DA=Yjtz=7WNeMVm$fBQBCn9
zM85?N4<-JOy;Ap+0}%DtB$XjN0<7B#*iXB0q+8rW@9^`uy!=r!H8lmiN8Qzp4U@of
zGt^&WPm4sQqt6}$TCCMAyW?r8t6L2tExMDveFl)=1aE7mkbAMwBv&u&VCULgoJnhY
z(|h7-&RNH{lf|=m;Q5A;c(;*S3eMji!Edqn8)&-BKv%;b4{#!OT^xC#NQ{Rqat#+s
znHVQo%HGa+Un4luFQEKp7BOz0*l&b80nfsJHgaGNPSkcEKUs^yB(1RU_}OzO4q{Dg
zj3otYmWl6H0%xhyOKpO-0uAjwncmy3lt>eQD;ME;NDD=H?o0l6D|6cI_B-=It;F|M
zTC5m2<;Xt&F^bn<t!Olv`1;%SMA4gbo|^Jb4;qeFna@JKt-C1IDG+-16yqHVo?;&?
z2pk^G&1u5qWuB8gc=SjuG?<H;L6bo7_CMP=E=BFrM4PT};_O^DzHwQf@`$Zpm4t*F
zxpB|8i3dNaYZdeP$P?<RFN^o!>7if_Xnv({{`KDwQ_rVY(7eoy?3gzxbAD%ORi-U*
z5cn_5gcEPzS1b<dT1kvQ;}53VHxH2#u4Kk8l>_EOcLS~SeNav;6_3~ht@HC;v7LMB
zq4$%rVKjGYGa=3UhlE#!X1_681_;1^D3ji+=jKrH^WDQwM>`@&6}ESB7{)?dDzeUF
zB~Kb2Y3Sav(nkc>JgvyU;+|5W|M7#sHaCi6wm_OB+QYMFcdA&!E$zwHBmN!fHCPw{
z@#>c3#C6{Lv^TBRQ@9+h{wTP6Fk5RHUc$Wv=#!Mx6c(T6C)`=&_?!3IHmQi0<u5Mk
zqOE15o0bu#9RZmU<ej^@J3Ae7L<DU^%IB0TUzF|=Yr0E)tT_{7<3@+^g%mO@x#lH^
zHdS>OsumOqg8{pB9PGMjAk7{eQ~+Q0kKQwXEsW}m6LI6Z)$2NsKUUWm6-MDp@6#OC
zA9G;r3y_pEP6v7)mq{Z}3p{-p0qK$<NXL*Tgw2l48I|wh>&;%)Pj%)rKPV|;lZjFM
z)ld&Lbjt(SKIc$*nGru9z8YR7D_qFtJ#nmF+UrYf)^!h0*XsHg$q&v`I1f|S6oKbv
z7amaeXBc1`1<>XQTVav&ChpI;oduFD68~LOVRp#=kz>YCxqZf5xptQ<ax=4&qyqvS
zi6DPQQ4I6t<*SI?TpA{REkA#K<vN$thSnTcfhP);*~eoW1s|rKhkhiQP3R5hubx`m
zAJG2Ce!~v&8Ky>*r{LX`srl|5CWeljJ@`7#2_M~0OzyW9-u)&+aqoao$9r{!g;L;i
zI$G*|d?s>D+N$^LCl}`HKedwfIoqr3R`~X>{rV{iVfXuc;i;|MbSv-mTR&e+a?{ZZ
z$P{?Ub<Ruu*$yn`qHkuY5cI7vQk1Jl_D(V1xshfKqFj&=8=oXY?WLf?lCHglI{~5(
zA9MMG<>v`e&E?A3`+nOqQZefKnQvO|whH$`TrZ1mceYXv?C-i_4Mvw+h<jd<UaO)6
z$ep|wskIo>{USOx_g~ixz-kovM7?aX)3vL!ui~jdbJH2{hOeb?SxZ%U9Ta$U_8|_B
zzm;u&Ei!%0;R@4rr16^k&ySmdo^>lQ<pJX)RY^OaeNiCs!c%O1t*3oA{;7g<xwD{P
zMu<Y&m!{CUsvM##FZ17mXC5a!$-d4ch#PoBoxIa^{YhQvt@AKpYok@y<D=KR=r<G>
zB_2J5+r`H|AyH!DvZxpKoF--NIAB2YTjFmv{CJG^Ca9z1(SrwC?p0RRb9h~{e_{Jk
zgs|p>BT<9v5L}ht)h$G)A)bupQ*@!Ce#;Dc1e2hxbv<DyEf22^{{|UPN;rOmKHfc9
zxzsy~ll%eN|2pfakg{lDD<_HZ@z}vbW(pIl9pd%G8v2US&+?OpeEM!SSA`53dbgmK
z{^>c0!@aQrY&XE9igMxQ!Ls;C)ntAxQy=4R-!So>!et{hd@XvxV8PYWO*>{OI+0Pq
zvoC&4vD{6VTSJWPcywD0xGtNaiGPF?YJ3k?Uq4mmU|d9sZ#ld+>;bgQPRFUpwEG78
zGgRNLDWOEl`y(8`VSrE)>d0>8jv0GSPFc)2=>9}tv$mL#TU)F1*)Sj#&5GX;VGj^k
zxYT7%;Au!%B4V_I@9w#1|2|`k-h`b{;r}>sHP9y9(9EkR@hIv$MP4{c1o{tz3cIe;
zrq8d87Dt|1|9e71^!gB4qry^3<NDbrc+rB{nBmrsf#Ug<?d9fvtNO#B%kOs9oZssT
zi48}8+cf|wVQI{yh6?uN8Z*nl8CSR<-*vvha@Zmc1}3CpKR3?~v8GJ0U380ql3n+L
zCELrrgGK%L-~LIFBJ!RPIYZx)D@(fUf@|GLm}$iYlWf}5S-;vyIMS>+?!qiMbGT3D
zG)eP?fVY2t>yNY(w9~V*!SD^yVYBfQczMt0mlc{lx2yO5O<-B^JgP66;`bY8{gLJj
z*9$rS!oIaBjNQ>bBcyNnV}aV%_)=bSa;_VTgr-(S{Cyw?_GM+!pbzFd3YRm?PG*-S
zCwn3Jv9bR`VC}ZT77A>%?|flzX)V8$a-+28GcH5JQTGAE1T(ef=Gn{H8Q_{c;_i<H
z;hbkqN0R|YW_EYX{eKS}9Hb8j<5E(jqN0>c?9D$g&=ai}3_os0mq3`F@omIP_p%aV
z3+hW4@ots%+8Zibu5B?0qN@oT{M01Bd=aes3X^kE5+Q5e=-7Q(R^)NAID`x5E6TS)
zn3Go*9<x{vg+f!jzV#sH-uN2xolxMXiajL(oh^=--$)ygPSb`~))s=lYOB`SpmuKY
z*a>tx-h@ar1W2?EZf_g+Ag!*h%1l&P$O1dY(be;pBLtMl{Cw2P*8zPK!>mKYlm32P
z((#81C${G7I!nET->Z-Aq@z#&1DWzIjZ@x1gC&P-J14Fa1-%|O^`GkIA0dHp5LFso
znO7f>4Vk?9aM<O$w6!6#w8^_O)iCwBkEfNPIa$`-gqpf`G5akR!n`!9Lw+c<shf8p
ze6XKdZSAhYmaosjc<cr+m?sxT1rlR&NVCgU{8?F9Loi<n(?&PfnjsUu3L+{Wj-6~>
z4uOZF|6<8om@sfH1tlOnBe!FvHs@JNxtZJQ%8KRco9*J4Ek&ZOkmiMZI(t|VL`X0<
z(=SbK6%JWc?&eOU%O;zO&7Bv|f4jY4Ff)FQqu+M+8!S`h&ca8u(KQ_{jYwAuscucZ
z2&Jz5Oe|ITf*xtsP{4Lv_D}ymv5^-qTrWaSh5*uC0HnPp(RNc$LvC^GsZzIW>+OVO
z3(h}c2d*CH#+Tk-1el87+T7TXt#P!>NA*i@?K!?XwuR4iNuRY?yZ2e1>157>-Q=pc
zYTG)L{CtxB0D|6Ully!7fn@T)AQ)GzSMeW7q@0gN!uS13Yd(4~>zwT$WZ1jzJZUye
zM)gZP_-exSkMr`c1t~H_UPx>K+Jq0yFTFu&sCBss-Bbbx7-jOw>FFB7k-x_3Ev$bd
zG(tYhw^g!vVWn&+SkbR0(GGt$@Y3^4c;l<?i7Tt8%5iG_1Eo#VQ&@=WU{y`xQJa^n
zQTJbHE6QmUI5QgRae7xTrIvT{ZLj*7y9ryCtuXf@m5sWQ>Bs{=G{1RB!f!zQG9<8a
z!mnIGD7WG1<^kT;RSjQg(}6de=gQI&s8<sr?EPC0fr-Hmp`$wPde*kKCF5i7-@_i2
z85Fttx?hIvt_EYN#V5(FG|}22%>v~jTemc0UhOtLX=k*)ETgLV>?W4sZ<7dyoW_i5
zdAh6Yy1hNg(RAX*H&j)#SkI<bf5@ZnX0*CtDMyGjyU1^;{yzZl9)vD!0CGX>ZP|<;
zo02ynD=WBW8AqP4+)CEh_rgWxw|+<H-4M)B5ElF*5&qn5Y-lLiabr>i1JaJQyDPi9
z`V>o@gjpP8N{D<Ok{Z_uch#wM;-nytciS`}vd<3bO*)gBJtzGgWkCQj|DJU_3j4~C
zPHGKRiJ7#7>l{z3WK*kyyi8T->E`?JN5{YnJeZb=^0sEDV735<&p!$cU;`WjrWwM+
zmR#R$;6uafH-)S#m-i-RckA37GdC@{I^YW#rHX&KN(^iQ0#Szo_C@0*y}jXcs!trj
z0S%9<vx}?a6C;Q5!t&^jy|ex1X_kAwQy1K5=*Rw~9jo(Gt8u~pJR#D_G<4z8KRf-X
zs4;TRb@p{%&xPw#VC!8^(GF0We;OjXI&CP_awbY)=+DQ0q6!v<`;{wL->PZ~SQ!r-
zijPP_Yuy4Id*GVxAB}>rTOKfX6rLmdt(0V05~$!aKi~N*uN1JFT+=*JM5>*iQm0fy
zp(>?c|8^CbnG`~Cqdc!-f)Xe%8}+L{(xS&Ukdx@pO=|o3CE9etoiqYYl~h$#7sgq<
zkRHVj6xw=q9f)t*N!UbkIkm#SG7oe9S*V{d)>T65q`LjX^<BQ8kM*Y6X14csR?2Hf
zxqr7H?KbKz){n_J2-yF*N*8ja(n%&kWmLZi0di<BT(ByM3R=HN;!#!e?_B}dvT?B)
zk5qMHXn4VrS&F75GjcPKWwOmYuwIp-A4Gl$&@Z`9dw{kpJ7=r~!cV@Xif#IahIABU
zl!f*m2*lw%9z7Rs##gfmDBo^)<gL6R`D^%c_t=D}YmJV=R~eLc=G>#s-;s^~ARxqo
z5Fu8PLt}^+X_ge5{ZD7(k99?ak86TipAhPVcf<Ls@S&F7Ln6YJ4<bTT{wOZQ9>HGY
zeH9rqRx7BG7Un*UKf6yoX`P*Q{m+L+tzoUm%{F%YLY%dVjHB<pw{P_S6+IRv!+=1X
zSRkV9vwcm=;z9%<1bYE7q54l%XAFgr-w0p);fmd}Sn^x~8h*JTcmu-q6(g7A&!{;S
zg@v8*b~Y0J2n7ra4+<rOP8CJ<g#U%9p9Al~3-mSz7g+&@AWoa)|L#vikTOJkl#xoy
z<9FN$z>yk+nJ^(sb|Qa?|Id!fiiEMzB#7*O1$>+7y$k-#o?3wb3N3h+^9Rq={mmex
z0uEa4u4|<KIZNs{XtoU8i@#b*`uzXRkhuLD2ht_vi`!0x>OjTV!L(E{I*4}ZmE-+|
zV$K)B!XW4wB`;F*m#P0Lew>e~1AO##s#1KL092;}Y4xc7>?Wy_u<&t9*nD_6IGz~B
zVTV!5x3`6>CaBl<GP0Zw_Bi#7*v}>y?GJY+{tCGukdk%)Le^-08dpqk(Z2@q^IxPl
zu!DEQ<{@a95I&K=V1<C%q3T~sS=bDK8@S*jB>7x_2K4hA!deJK)BoIS6V%yi`+u+S
zfXc%}LefK;E$1F^_!G$aDJY<=ft7+!|JhcW2Ld*zzi%AsmjY7$xZ3}(W4cGJ8Qc5#
z&&(}uQ&TfhPZH8sBO*h;l%6r|&w+CCf|Qd#LWcl#Ss@UL0O5iqT|_`?;^@5J?oV3?
z_+Q@mYvGKUf3`Ein||>6Kih%kFuoCO+IjV>p|!ymf1-lG#3Qz7VonVHR{+2QT&aM8
zif7jp{2Ay^fj=Yw!F%Y}18`B3>1}<MLgo5Lc_W}Ts`IyNpMUpfJL*PdQ-2BX&zU<Q
z);p#9S3_F7n7@yvVBY@T-bLQl8cEB%fAmCJ*gpeZwue9evkHh!?5{`W!6!%l1zgMN
zJ<+~DZRK%NyU&MlWr4R(Y@fdYFCS?Puf?9uol!aG7!C{6IA!z#@0t|<FTD+URQI#{
zq0|=M-+T0Xvy#*iGSZ{j*Mx}Rr;ZPh{y~xYb6pOk*^2su{FQLNO-V$Si0c=!siK!O
zNV5wA6r=(v;b9bowK?v|s+#+miCYQzW1}2>%b()8{`TM3erm{y%NGR!f13UW>>T*y
z_zPt1xHkx)jy``aXVIXyH8#3Y)36`d$kMsNr%1DzJTHD<!~p-Q2HXk)(63b$PXA|{
zY5AyN6L^!?c!-mvX(1KE_uiNO`GhH|$}MOL6?QL~rU|$y;l^ai2NCv!sLy{uSN7@W
zQq`oKo&J{(IQ|r@RQk~GP5Gqs*yzuue1kA?{j)6*?muWbCK&qouTJ{pRkd9VTn6r~
zAvb5=`S{{J2}<+Nv@4Jhd;em2d0Dd1rN`_U@Hb=|{==W<{Amiz?C8dB{Ff={??)gb
z>=($k7s;FZ01wg%-0K29WF&Mp_7p|?VpTOew&8psafsOMUsupr1Ga$bCr^Og8`y;f
zj{ingnbAFj(96S$hGfc<uM#8nn^CFfuMl^$FG|g64K1q{Vjeww_-t&rH1%RVY&6s3
z&-RR3{}f9sq5nnNn?OVT{eQq;A|qu<rLsm@B9dfZA`~IXzKqCHWXZlxLdu%#JIR)P
z%f2UN-}haXF?M4g=D9Npzy8nv`~RKiIcJVD$IN{0z3=<p@9X`(@c9paiDjQ1Mtup*
zI1rzlc`Rx-=_fOUhelNHBakcpFhL2?BEj;h8)gqcVXT&Y0OlO%fbg!?6sj*o?NZ0b
zhQ_9_dp^+7U_b;x_n7S|J4~@c)jEs8MYng#C#jcG)V`8&`P+SC=qTSD(dbvwB&s+1
zegMeA@^%IzRzP3O<nJF%`GDK4F}xAe@LNEsi>%eHs_`j4gF6RG7klvC5xJ^|S|qy#
zSB4P6!9x`lS=RLdi0%aq^?nna@noTe=Wwpr?T4~66JfNx=5*k=wU-UL6#j}17@_il
zm$82+qLYV}ZXU!?9`w&Te=iu|M8HIB!m&(>Gwv%u2NKqXFXayzRfb$uTGZ~jhWfTT
zZcSsJankE$q0ON{(7mWknt-Dm+0ivP7>U`U2Gr>O!e|mLs+v|)dqyQ^V{6Oq^2LiO
zrobtaju-pmgtqA(_!c(O2;xJcAG~=a54d`=__zG`25Q9WGcYi)l&vA>4Mj@%KZcOG
z=Xo8P8yyB<{^W;v{Q~qG6B<o_ajGs>M6l2~0hDQSZ`m|=Fna}D)=b*j*%`i`1#{Nl
z2VK<c9ePVg3WgT5?Dlq-Dn+85H~PDKi6AO0PyR^VOQz+5tkFQzoh_zL4~m$`OuLOK
z;|}zC-?TI(BhcDq9hUWoKVSaCGK^<|+BSOi+XC<`y>>xw!eBd|uq{vN6W~~RiMNmI
z_gdqku|~Uh4OKax+t>jr{*?RcMD`~|lyPh1?Hd%YuW`OYf+l|eOdvnZ`0(Mw&uCOE
z+H$=(b|*Df8r%$TYF(jOyw)Pn39i&0Z}<ekfdbfVcd}UtJjn|5D^4t3EJ-tPG;>*t
zOheqeHeg+MUZso8I~)#&WBJ~B>;&z7=>BS`qK}tT3*XFVZ;lGya)3m6h!I{^1_lnh
zc>Kf7Kf}80H@d$Euoc6KFGth%7rNm!L@gOD9EE4c$Iu%sqgfU6?Gnpd!C6Hm{FUwJ
zF+PE>@XYZe5$wAA@G!Ed^+y)TiJNLmffpp`=y-T=#f!DxW!f+zD7Y@mo2;Kb-9)&i
z3S6prKRP-Z-o(}VaCc)Njm>}TB|vtUv$QlX3>K=y?vz&UmY(Z<w4UVef=qxHw>q1y
zr#kIX649)M)jz4J?q;G$)dV-&z^Rw)q?+?=hb*KVM%H3%J9?#5x872k-p9a|n~jeW
zR<|>&()Ne5*o=mx#cS4TtL<yi3p*aWKUy<vSup!QG849N<hvXQ^BKBF6)X|IMW|We
z5pGSSp;_x86`8Qo*NZT_B8lFsgQDshruFWPZdPoT2k)e5uYY+#x|zt~{CsD4bZ@vs
zwr~FR@{Piwk1;DghFvc;$~|D)p)fUDya@+{y5t`z$}Yy`*;{Aol!dMT#P?M-y>FLe
zzI<N9$-ZQwKa`_yU-AYvs7SGFcKMrGWzS)lRqT*i{~?5!#gq#jt|<!S122$jXH|MI
z39r0|dqYvW`fId6FJEU^`QC*29}>X%({cqRFZi{)@9ykeUz<XwD~WD_>UpQjl$0`L
zTh7A>ZI$7=Wa0JH7edz!qbwv##@-NJZ`9471ngGC-(kV#lf8xk{95gA&m@~UBQ)SA
zXtzW$7X6W$$UeFAc7saAN8Nizcoxw~qVzjghf>DJK2U(^nW8F1Z(z_y$5n{(4d967
z#Q)YGSrPVil;8-QGn(Si%SsQxSk&dq(bC+JSRs<2(0ZZ;pawa&Z{L0r9vc>Re{XNE
zd*%YAy=?|=jlC4@ZeM+eWz1TXVB~~)Q9?ojKQyxp6lTd)u25DgXdyFg%UR1&Qyf_>
zGYz0E=LZ+06zq0u5=G@!9UQbBf>~=HCUoO+@Rcv0HT`97{*DMZ3_Kgqn4V)%7<Mhj
z^q3Xo{8<6vy4M|gx-$AZ9EWKmRdKAr;}(qm66t`@7>&pT0^fkbK=;luKthvaQ9onT
zeX1xMGb?uHkbuRqP*#Z*YB=MNn@hu`JX4jv807x*eWTi`?~<atZ))uMK^5x&XfG0@
zbV#P#MOClFYkX;liA^yQeG;Ab2ZVS?aB#W}?8evN-%MZdLA(DBsFIkTRyt&RW2O({
zAB+p@rp%rL&#)2JeoET{eS)OB>_zJ$b!wiXXwgZ1UjtCcQJ)CgpMhnX+^DG}!)2GJ
z-D&ge@YY6tn)}q=-hTV$%}3Gx4F>q`A}jCZKN|`m)Vja2-KnwA9{)OMDif+@qZT7e
ziy9;7R8rAWidH!ckc^yM6W_W=UZJ8Iz<Be%Xq9A-!?_*2srrI3es_X?FG7hc%kBhj
z4QtZcVN~JDeHJSX35uyD;gFM3qP+4Xg3F@(lRjLlCW(SpvyVU*RTb-gO!+|ajPPc0
z_jZbjvglU%lC#-Pf9ziW3k?7fiu!6csvR8*eQ!LMnVC5^0o^Tt%49hXBfhL%Kb%tY
z74t72%=6sc#5I7YU&OaRheb3Teh%KK27{2LUh;PsRd#(ssT^2(B`58NfA%H&<bk_p
ze!1IZqS?&F(qWQvR8`9cbe>j5OiBBcMJ6BeW=uv<<ayG4fAoq-5_EqGnwft^vQYTd
zulus4bIpR&oc<30PG4mzRi%7R3C;ss<3VH?T>2w#qHaWN7tU5pcyh?|>;Wa4FB}40
znQx?E8=VJ$OP~Oqi3ddfeEGMOX5(NS#?s$T&+<vCcM>*N=*l2Ib%%=tHWs5~dzdu%
z*h-^b`uq5NuCA`0lexo6N0orC*jq5m%Abs~Y<VyW+{Lt)>glig^+OY>>?)=sj34`m
znH<WAk(_ItSk0PaC(sy1$rzzWt#u3jHKDdQm<ee$9(ZBP)6{l2<IQ=6hJSn{SMmdD
zZWk^C1<fKfPAIS1&S(biCbj}S?v<gXK&}v3mBQuI+*zq#^<KQV4qPym8H5rjFhzo<
zz!eRO828elQDfw>8F%BMCXTo_2F_n3i3tdDFrio=D)l+$-2L!#@Fx2*#$vt%=_IW8
z%3YJ@nDKgf4pnxTI?`FkPA*Nvd;05g5>GkHUPBg2TEDuE0vc7Z8l2T6q?W8qW4{R+
zI!R;XBh47}G++a{iwu5rD6lDT(BLVhC6x70#m#+k+SAZ_^kh1Vytjs$ntDp<`Z~rl
zk;DAa)^gb#woL|(M;5<G<t>pPs21A_uJVcVSz(nC_J8K?%1Extc6DfWd`#y8MoZ_4
z6b3EA#^RHV^G+Tb7>p}iHE=2l0MZJEbtp|ToD^^OTHfRh1zclG5BYz!MvavoMC?U$
z5^;BuAg9o)9O%^tJm{~5<u}T~RXACh<nd$i@$n5#nt3)hHp;P%qq`%a7zH@zRJ<y(
zUyr`e;j-eL=DoUZW_?#7oR*Y*DXnaz7hI!b1zPebQ<Sgxnmr_Q(l+rDT`uU=)^Og5
z-G|3M#)~~VXKv=WDROn_^!V5#tobRa6vi1(5_op`Q1XEO2Io`2-UvV6PBO}rx)hHI
zVmU^wGqeGZD}VfY7>8y*#;Wk(7=bnD=5{MgSZInxK9zkRIJp{JQ0Gri-jluMDE{?v
z?jwowtT-Higr8bhQ1OD&GI#eGc_@gfIyaqKH$SfyM`ghp5hEC6YpT5S3+wh~p3x}w
zO4KS?_Tvg=@2S!47Tb=Ia>vHBCv(7d1-E-_E)1%KqcfLwGBH(@?5eG}hg&y&{@sV=
z-U=J}k_o7G413wwP}1x>40|d@rCdJB6dY)pbh)^rT}$KAZcc0Di5^`IDg2DcEH&kh
zTvPw^TpZlS3(TI^L-!`Q9jd|A$UR0fOruRGoc9~^BMO(|za}IwOx6D^Y`fS>^E-&Y
zodkk-C!*WKPQ50w3|aP)&}NiF3knNV?}qMmH?RZ0H40m8GU4#WIYhilWJ6CRL>M(r
zq5@rwnh{LCwQ8ol3|v8W=S^FfZH#Oz>K9Wd#-aqBDA|5L|8XXvY^h@RaXza&6Xp0;
zQlzQ0$SQ-#M-^Gj9n^``ST9>`ehr_)?rzCch{l)35%m6Mug^10XR$+b{<`WUHt;ta
zgBz&)hv)+CHXsZ#^O|-Dk|Z6;8~40w%1+B~m10mCyWM2?WsUQ4H|S6fjrN!JiCKRq
zCHTo8{8%d7m?b;t^|CL|NSN?yfIpjKA;vH71dW^Q8+r*Lu^&?mJS0IqWI-b)<a~}u
z1N>kGLZ04y$DHuq@<nU-f*H(l9S&}9{Olz6t(fA<&?<6*qLO!gb2AyTGQC%~{)F!;
zhH<jI_2nHp0y{AFU~a<5&>g0Cb+T_Jas-()X9+HPN$U_8S@D~55=58H2ysZn@zu1_
z?#)UWZ`gw_Ac-U{%WmE4N=GWoBn0bP8ALm7$o#QJzx^|lI8m%fu+WvQ;EV&ey%+Us
z;jx_CR_YMA+{>ILP2Ka*kE`;+3pq>bcZP%KYFU@Lxru=1-GqvmKr;7UMV@Y-3r=gz
zJjtN5hSLK9R9CWaaK+MYMOMiof$*{`auVpN;B8Ex^NmTEb8k%qgiYJq!ApB1OR}&H
zLs$q#E6*uz?-Z7djW^KlkJBcFmi@Z6Mxipz@C*fd+A8mI^6`b!i=qZA_Xe$dIXHaG
zmmNW{kPkY9uj(EHR7KKbtrQDWO!T48^gF<(WW|O8xHT-%*3;h!+#5wAOS|&uBy0IW
zE2_|vlJz5sv1#a};*9q#KNhcPBqXS}!FLyb3Rg_<qZ?{(SAgH6Y6X`|eO_E#yk>n}
ztO^u@tFIFUi>z^p1iCD3x@7GPxDk*ffzow;Oh_SNt(IAaOyrQQ+>WdaKS@Bq%CI{E
z`kw?R1D&UxrCG5Sz4Q>&Nx!sLNTgY)07ClW&G(gW7&VtvSibNQ4tyz%<%o;UTLoFp
zFL&VJgBRI$)zTM^@)mtM2dNg}sd>M{?K*e^U?i)u?V1#%BT)eBOa<FL^32VzW0F03
z8p)>!K?Z|r@Ej?zN20v%Wm0Vi66LScV2Yupm@+ZfabTT3*Ng10U_w33_V3{K!H^0N
zmwpC;dga-9kaMu?42(g3?&|E!o86e8(5~1h$V#+(>2uBrQ=wKbypi*!+S|+i&7Zmb
zH%SkSr$T9WYT*1I>x*$~c<88x?J=(PV$q}@zEJ7xC+`l*k>$7ejq(K`Pya-$ptaCg
zv`D#{>d&vhklxrdI){y^>QTn_Kn(IfU=CkGUuj{yIuAJutwRr0HL*$>w<f1?`^tFm
zTQ@xo+?x1o<O5MVxN^@C0o(krW`4nL1o0<_@LRl$1TZdw-%JTcNe}K_nZ5aEK2@J^
zS%Ho?X?fp{dwi_V@3lEI8>j)&E(zv7N)zTMV6%$?F`GNbjTm^wfE*^fI9be&$x_?E
zApD1)gVXgFV8-p3(pxS2sbFtY7>hgv!Xfe8lp1H8kBIw7>*HO(sz(k%R<^?h|4#I(
zW1p{g@cdUyCB%neP`av40nYgOr6Qyl&iL8yXTRXq$cW}1B_3VxT)?>Frjwn}-lLUZ
zcvN&3Kt0TnyuJ9CeESTCsQlsQav)9aH1XX+N=nL0it8Z&@0bVWW9rflv^FRX!6b0a
zM*0npLiXPuy(I(>oxh2FD9=1zKEt2&xxNLa9!z8_@X29C0QimSffCG>yU6+<?hY8N
znFWM)?K?n7z|UIp)Y1;;*CUQSH4<uJ9X#50QJpoAH3%r9?)uXU03YO$=JO7H)8EtA
zsl~)$Hen#G3s~6(cYy5Ax<qTS$!;FhgD<Yf>=T;|b~H66pWwq89Oxw1X>4Y|ITIV6
z&h)2a3zx7u9C47Gp_vJOc}(GD+hbWX(srZ&FV@5qZvoF*pvf8&Kb{f5SvZ9A#*JeW
zV3hk;yG8#{6HGY-dzMj_PX4{&*krLgYk3N6LcTC|6C&44dS3kbnd|yNs=|M*;m)zO
z^a)}WRkOhEeE8umAH3<ii4hs<X^hA$zm0xvbBL4yH6IuXo`HRQLHCD(;5Us2;a?A-
zp8lUve}5Xshlw54W3hy9w!dS{efTriZo(mSl{hzLU!J4X+&loV-{m~?{s60X9&F6s
zgY*-Bt+gr@^U$6HvMI*$_579?ut9AOV1gO8503$(|8e!ePMWCol+2M?!D?*R5OPcz
zh$?n33y0okiXV*>LI)sHcvsVoR6AW868j)o*jdD16r%$;I6yLPP(h<Ay47Xq$9*(X
zehfH+Mo=pX9Y$RM$s3P#18VYW&i+lXDeQ4b2$o<sY(F7Lj|g@R0+a~O&!b=%pcen{
zb0Ul=39pCiojDpQg9%hCIn+P#Kbj?}Dl^tvFQ;c81HWU(2CycK2A#rc(8lOl{zG;U
z)gc5F`48QLgDcB{P3I$-a)^)74l5wZ7XZ0cxv)Gc?>w#Qc1T811W+%9Bb?obx&sXT
z|3x>Fs=fg=D`!8XAEwg(f3Q-<SyJI!4uaH|1hn}?rx0ZmpExk?cC%~g4%|64A;BQv
zm`jSMt{PXwcE1wVcu$rDHU{wBnis7Eoh&{yE}Wo#zN=%Yee)NhG(&tZH7$+R8U$c8
z?S&~b!qc}z8`dw!os5Jtvm@m+SGZMcZyz~&2L!@EKBXW4Mms-ma_uJQn_+NJ3@1I=
z%5N#JXRV8$@m_dZ3TcL}W`J+a57o0cZq7>&4{NdZ<%S;Hgf<`C&Q7l9qv8Z<vP-k`
z_e*VGW{vRrQPwrT%G)v`BNo<lch|cPoskgT3MmCJA*+H&IKDhw)}nLtXwP4ZIzqmM
z5}IudJuAp7A7&BSL+#*<Q%msLX#{F>Kp-k4IY*}GfO*?8akmXDkRkv#R`_}u13`W9
zVv&8@ZvoVc>A*^3E*v|#i(9~xl&bFp#o}M~7U6I?fv+Uo`l5DL6Lte4nj&;44@duG
zHxf_Jggp7uH~}rIBn~NMlCq-_T`y1+O}d67;aRQ2B>hV6uVd}xRuZc_Lh08+8Ei?c
zKUY^wqr^b*sCVp-lD`XP{+z9vg}ydN^7(%d)O5%B?j;oiz^9#yonL3vj)S~zuxF#I
z0&es1@p$!!u6R_(PXxf;-YJPS`^dvD;X{fV3+R{TYV5V=e6uV>;Gb+ZAG^CA1kkcc
ztnBdTNcR7L#u#5U?+i`uaPySc<oL$eIyfBAGOQ#*=k$G}<s8Flp2@3pLq1Znk;n8m
zM(4S5pZ~$*t(Q<dVhTWROQ39nQ@zjJcOf%+P!R?*Yrb{-NI5^IYHRBmzuoM8*?L_h
zfYruGGlSAcPHuqrnW!8Ue#Atl$wqrAR<_W^lAVrf?>Bf*9?3a<6ySq{@uc6-!H3;e
zi@8$PpKt6H^a^ed%#bBpCrwj{@Lt0ikEk{I`}p5T3Zq0SW*h|Y+$~|2P`#_;3{p}Z
zU0p-1FRZPtlfW^!vgB#wdQ0)xqebSsiE0uF=A$1)gojh!O-oJ|cscqtk>A05h^m$6
zM`YbE0V%`IZ?&6yjlB+>Udy420x=u@O&;!r=R_`{(88%q>zlU`8E6B(>jOujIdB=i
zC;KIfphZBLm+qpv&Sr=oaw`wvPcx)~YWo2njM(&c$0S)Y|A)P9qr(N5!rM%}mPU6%
zEoz;9<F@j5(z!No-$$tQ`piO${mF>^KA79jvA75z@<AILL0#2tzGGn#UW5i+rZw?7
z1_F867H5T<4(G<lAcXbSqJj~ebWSEHJAR}&gg4Vs_e+q3a}fk@=#JUB@$x!fG;F2M
z^vbwb5c)`>jc&L?2+#`)ozI~FUb<@aoYP_X5n#oMPsuxpKTuOYq9yF?jA3go?;nX4
zIeqRvA}#hAu3ygq*j~aKK%NdUx9X>XKx~idQuO`FNpkKPF`uht&VxN&qoW#mL&q_B
z&8#<th1HzyE~_^GsBVwk->(4JPP4nbyrWmmLTD&Lt>7c#Os4yxS?gXz<qZWRJS5ce
zqkYi9$cqoQa@R@#fHTrID0_e={1_-}EM_kc-edN#*N2Mg`pkkHTtR@A_#`Hj&*Q4N
z*<a>@DXN&yk2*9M2X9mvT%8hl?}Q@wZbmjL6GLWPq-fXlKy9>a3*}w59t6Phx}9*A
z=npI@E!7P;4o_t~3sB=MBMAA#_MG>hqBPr9M<yulz5ROn2{_C`j;ZGK<JPoKy8*Cr
zEdbhXt8;`X&5?Mzn~mBEI?vo^%ZP62YY%S`$l!`r3mWtytMy9%5A-V|8S}_uazdST
z)d^3-P9EZ>Bm(bO`&K&}K{TbdPkDKJyp3Zq$Z{3VH|AXOU~x{!{OG?INA8Nx<K>+(
z4WKs~+~6AX_IlJ0oN;C;$$G?F_g=hV$z$dlbVGp<m|dEOk`ntxPBvd8CLV*+6PTkP
zNRs&(#|zL%TZ`A6v3-5}(8I)N53+aW%My-qc&@Cy{E5afP79XGpi0%2+@FRDoX#1)
zD(Qn9dLO?vc@wUMIJPL;{h4L|9MC$jMPv4aR=r8Z=T1)aYs|+u%t*l%@W$=7QN=R^
z^|C7lv_ibJUlR0yZf~!X0<(%Uqn3kH?yj-^2R!aem3^tA!!N&`@v&J;O`?U1^Po^H
z!Vx((>kR_5uwzTcYQV1--bGg1gJk)~W_?xy_k^YP*3|?mznJjw3>3;7buQ=lruUqk
zU0jp~905#l-epKj^;i*S3~loW;-H44_=CA7`bknpLEDdKWM_pxbhri>EM;sQi&1Vu
z$MSEmMBA!MYd9F!R_ADIZvM)xEM!<19zcQl`oA`x%HARQn`SMz-ITTXVxSI)_~%y#
zQC>e-@sdKT|NKo*_sPhVq!`4-S+Y8>nOzdyO6z<CiEDd^OC3#}nwAGLK$)3cgS}cT
zlLlM5@ncR2W#K!jSs8VkG@Wiz2HwWu#m2F!98iMu!7rSjVGLzNN5F(dI^>MJZ13Qw
zKiv&5)4H82D!=*u=5kAQkPU_Z4QI<MWAtR2&mFcMnC9v>89Ofx3b5)kY`#o=NlvQ$
zCFocl=0IVDoKG1cWp@ZeC`{{^1TBz~`kl~Rgmoc=Rvqkz!*~uuRN#qI;aYSGjN-Mf
zJLn@BvwEq71gu$^yyKQC66)5qR<!C@*B=&WYo4fk5*@3OB?uQea=jt9eMPq;lGLGB
zsWhEJZ!HY>ggbcaSfqiVG~?CP^&_wGw-U$^Esw0sNvA$h;~FN^px?EYFv8FJee>{m
z3M~B2L%LB?j!-~#qx;*%XN>z!E;5VNkWg#zel)**1$qKd&ihN_7nwtZ1DK7`1y?6$
z#ph<xI_7Nt*1EsOgfui*si>UENr~~v|K8&s+$qY6gL<H~pO3!2)8`a{scEYmnVr|7
zYmi@&zZ60c?QVjjg5_#1GKL0<{5M|-`pUCYaq@l*$#T4|!S3M^TFI1k6wrtQxH1jM
zj8INP5x=(gNBpb?LddU-%f3YL&uji?i;q7E4|dnp=21=m+~E^77U%Nnf6g^q=NDj#
z=6_Sz)rmpy>V>pIw+?JQlF{A=^F`Qp1T%-?v8WYn-xMPHmG{~zwHx*GK~bsg)Q~R#
zz|}S0b=>F0h@;N6gSCTdx+nviaE-^5H0&HIM|><AXMw-!yZnj>af4N4v|$|%3fCd0
zNc>|3nTHxq?i`-hi^gf;troOCLciBBw>320)D$f$@Xs1K##7iJLWY#t6AA*YtzYK-
z@L$IE$5$o^>{%UU&dbQ|q<(s4!CUr%z8C!8rxq(0ZG`7NI<hxyCb(0^u@x~vCmjVk
zLMGb#C#uJsqVU}F+z){>f2gV9x_SmsvjbA|(ouSr_mGM>xG&jA^$6u<lWz-I3f4ht
z>!zMwKXsfhWa&w_NB#VQblt}mGyS?cwVHSy4EE-R1I?QHT;mwKV?;|-5fi`P#>DTD
ztB+pXJ~qzZ-vn8P`P;`h1Uu6KZIF#RK@WaDxS#(ImQa8F?tlS|)N#O(jF8pkzY}oj
z*i+LDkbtwxuzLA-1afRRodl4Y;87pi|63IU06Bn6V1j9$p{E^mf7tDRuEg~kNP2OQ
zHN5z1hN1`z4Um{blE$VT;_wvph;@HIE3O+%L1Pbs_zPW5XD*HLGS6eUBgjPg*rb2&
z=HY*g9sx3(6uKF4R0DVL6_Y5;;V})S6~-iL;h6FGdl@<}!5n&fI(z;m10yy+<bWZ=
zxNFz5e<6bxNCJ?%{<S(IN3aCqcOV01y4#8S*N2Dm2e{_vVEo99w&%xL5<}2zWlU0O
zu+bXyKIkZ*{+IE6L7H&H$YS?ME)MwSGB)%06l5NU%sn5t{k6d3ga`pigR*<fX@ART
z1_tcgUW-}8@MMPJU;BKtC|6~WAT(WPNQeFPl`0lYibolwc*YfT)&8c@aWdQmWS~S=
z8C^I&FANzhFl2DVJi&LZkm+B@Pymqq+8Xj2f0H5N5hlS4$B@CD;BnwF&*s?pSgyGa
zvLJGJe+?10fLQ_^5U8RBd7^**THrAnB!Tfw2gH-d|N2UmIwr4b!U4pgSGw2cU$)_n
zIw+V(s9QKzV~?c<a0-DqyakyX^IB@gGshB8f6IgFCrs8PKK)1;AABP}6O)!F0pd_(
z?Oz!4_dXxZSY1n0w5Z#EnSQTy7ewDgOME3`{WBuvBIUmb2rjS{{xx8JF6OzknCAxj
z7ghYrb2Y$o3;dTpmG2HXbHTZn_;Sa#X9TV3_9AHk{^}pSyAoqReyrS%^i!GBq6U^q
zr{3!sCcbmrZ0;%Bh$@dxtu)jhOzZ!TLK;ZAC<a8C2==xN_ddtpsrO@~Hi7^}@s{^A
z<tPL&5|7!2kg%22opNL)O{R@r>(@+VjEY%S3rF&+-NK|!#HfnEn{`EwIho#aqsCWv
z^t6ui1Sm-as^ug`wKUtkJm!f1#krz7Zh)tGE|w|SFwqS$OMS8*Sec29xnH^2%g}ui
z{X>5buCH=hc_vg5w27^lB@=?b6v?yZi_Bp^{-B<RV1;^am=zk79j_le;=F^eXIBI6
zr93^tTuM%A8pO~pxL~)iL@i@GETHsq8MXs|3AdQBQ30cok!t&eSYyN>?mS+_mM<Jx
z=a}@kjG%O>>LI_C$sO5dDl?Bv_z4_b1YKKacYuxQ!b8K@o?v#tQdXhyp%|q5n)1eo
zBXvY?Ze$ZkyXs_eTqdQt#Gxz=_vy4v29;|e-0hslDTehq4;KY8?_tqGF*K-_{U9$5
zHH|`KGQbH<R45xx0R)u7jRafH*yLA29LC>r6N&<utQBT{oc5=c=W%fm-1|A|f5UDg
zYIqoKxIZQ8u!=AAJY&(qPnJeLcBkW62?DTeTYNt#lDo6MZuNP1kiS!{w6tSWB$G)<
zSHAbnSCgJMkVRCdN^(bqI2U{j)N$W$A6amVh6gx$OSO*}Are~Qaze&kzxqaR*gi~J
zqKc9wp}tWg)>+@#65o<<D`i-+r7#SCPO<)ZWU*MJs@eR#o?W*FiIVNGV*X5R?*iNY
z(-d}fWeHI`HBDs<+|!luJTJ&SI?wmKM;4+T=@&%!J3p5L#|7`Qgw7^lJdT*5(EV<G
z=eqTur$*oLNE=?xr=IdB1r7cB`}?JJcpL1RKv$#j_V-q0TaWaYVzg3A9evq}DZ3<&
z75n`sg#oD}<aI#9ss+bcojK+=apG>yAU3syg!WEw3<*W=|5BWUdyj?*P7yKuv$N;F
zBqM_SHX?n0J%}SEPt09+WWBu|2_Iyd6Vxc3ZPFTspKrZ1l&_FuV4zqx&4A_&kz|sK
zW~H4++|ROG3_&{kBQh3#+?w7WXAOkgnq8KWl9Z#lICp(t6qW+PMK$FSJccbz<KgUQ
zLhPWhTJr*1c}Ekd!(Qdc<7lWUAXTw$55~=OH6VYtsR={<%)w8<qvd!TInTULv2<qw
z-90nCwyNn6<G)rrTK^tKGL7D)NFah*Z;S5a7$RF?4XEoF9epPd;f?PuRnO=Zx4e>X
zJhRa?TDgj-QM%LL_%BKy(slkKZR|q=5^9z=)zr_;fu3T2oW_PqkoQX_*&CkqDp~9D
z-sv!gnKb4~HtjV<E5a*LKh5=T4^7P@J!6KTgr{t+*=Ll}G&T{Nt)B}~E9U&>^S|y6
zJ2>*8n_`ee9DN^KM#_;V>y66H(98FCP`z^0UF=Ji2vL=tO_i4q{GES&N9QkRxtQ|~
z+w^KWLU(K8kv`rkF66*-c6x?Q_QVC_Ejk-9?rqddcB)kHbxRL-fEG-bAB|b~&ppW6
zQgMSvo!sFLIr&UoIS^1nI|#9kTf^yPj_017Y}g4}$#wL^SL-j-|9#x_A4;T0W2|r4
zh~LKK^A>kgi?nD_ULMyJI7gI9q|tv^90ko1?2kjknN5F1J23a1e2G%$PP=%Ge=ix$
z7bU#eU2Hxh{nfeW`7pd$L@3C{Ovsw_PEEDh-lQIDzw8wE=-TWElGa5x<<^%GFP_|Q
z6fUKZ6>v?jR4DZ`b~BgVkWA!a>}bf2qnuF5(l6u+vSgDuxs+B_&4^i&++`3HMJBZN
z7kx1I$wbu@Qb}{wwa!e#VcLb35B8c7tsJ0thIbg2iIhp-L5=MOJ^d2{R>;w@e4C@>
zdgIfauEB!3COR{&YdYLBcYW^BbcXEvAxkJsW#t87lbIyf1x(w~K_X&5K))$cO?FI|
zx~*@|KnKAG7)X7-)}Z>6dxgjB$=|L+gwj}5b;5I9UHbJ6n?%q!24oB~rAa|z76_ih
zlbM2DahOQV{_J$HFO{H~Vrpd}BzeE-tJNZ0Yc2Lm%jil59ITi+qa`bUbv_xH4BL%b
zr}lVWcJb$CVx`4xYD$g$AJuES>&~IbMCexgjWr66Fm&Q3Niv6vp7qlO2w~;gsHwc+
zBEPk&<J}X=*<(bbVRB|p=poMXqKm2X87gL4)gjZ`^mKxT@mS{|;|l5c7<9ijA-K;F
zX|!m}ozX5*4ot!dp4>fm`FqWy$cdL?HOA)eFoG3~n9?!lV-^H}k?-G=Sqa9{xi-?P
zM_wMn5B_osFzTpk0Gtbsf!@3|qA**svx^yi7XjAM=6hsGVnRZFXLqGbk-@Lt?mNu5
zH55Xh_Gh1PR?W+x5dl_XeRC%Y+gl2?6z35E>zf4wF5eJlMf!q!)l5B%g4BbKwMrVD
zo5D#<U#ycWcY)U5e>+~%dc$^H!he>fW+06S&TbvMgqk(lLA3g+sKENqYjpT)_NYWd
z9{^o*?S(e>bkg^_x!H<0Ugg$ELU4c^YxS6J{?FB|?BZc>-_W^jaChFEKNA9F?&4mh
z3!`0W9<gJWJnQ0UkzvykQ&-t!FV+E*X9Ui1j$CHwiJD@XyW;?gbDLi{*pGsurqt#_
zC39zGiSg&af=0_D=jwm*PY46Z!3JQ8+WEbz?-T5T-WayF*XW{Zt0jSzHgL<_9i*j{
zrA33Rl4U`&)0CxW2Z^)o(x=Gc725jFC3N!uzG>@Fcl3z$!dG2hgoJJJ1QUJ!8hND+
zv#;C}T|w)@&d%Wg7bN@yJiU{@)6LVsTXaR$OTm*OvI4#04Cm%Z5%F5y0=*eJ(NoJ0
zpp|_#6dL;_uyXD_5q~Yg4`qFbkWy6gh|6b#psCGr1E~S-{E~K{WkVg$rORV>-IvXL
zc!^d9x;_0Q@qL~I@76udrF-{yKh;>8>GON>wXTJGJMfF3oYU(nNi0@qIw!rLJ6rN;
zs6_vUw*y-uz_-UMjsbLJdsDs5$;B1;ohb>ZZxb@&MGmnV$~F8JBhP<{-d<Pz!~@g|
z`Ceb|tphsjEFm6fX=!!82H-)xhNt5xGmd_12+q+IMJWpgvz6P1311z~46dX13K`%6
zo^rwwOH=Z*GNb6NkuDYYr<D$9tDRM$PB;wa{GvLg7QGYh24~_}g63OaaaJNL5>k6@
zgHhVHBK%=7PIu+`1#d;VY;x3h+&~NF%-)%Nk6tF%=uGt2-X)zEmooHj_aosbS*ot^
zLzaqEGMqWnG@MI&NhHQ)T&TWdkH9N70A!u52i}WXMkjYjp`X+5Ekb>}9KV#ztBnrF
zX1er<4m_UU<+7Da94)fg`W(YF2(?Z~OCMSrd$_ZWcKKWqTriOQ+C2CP7Nr-VIVLa6
z9kah|Chv6j#T^&9YH-x&DoZ-cR<TXl>5Z<_0k)FOW%w(htnnAE5Ui$KWAJpd<m2ND
zW@MDtw2ZB=Rhe=NPMXX9ek_6XcM2juO7yhVTC_6(>)sq<LAtzL2!L*=PG_Rj;k9mL
zgdkXczWj!VR-F`i!*+5MwH$(sN@ho0>VmXZOu5y<DM?}=H8Cd7hRVu0ob>q1SN5dV
zOomsfMGA$4UYRY(kL-JjT$F>B80IeS<SeIBtS2J0pTM4sNI>)5ndl*VOK6>yjfx$7
zari1duMlkKAeaazYHES)Gnfr2*?yZuqbq4M99m$qO(J^}6-aN6^o5z|(U?q>rhWPP
zTJEU*l%LgfX1DKjWT8?Psy4E|BNnx%x}K_tUzf%j^XV}M9m;*pp)(SC>xuJ}l|}5{
zG{?iF)*;UD4eD^&UH_)ft|Kj0`{C%&^0n7yU*<-)vSd3L;p~(OI2LhqS#OrV6y3c`
zMnQazbUgS9eaifmQxiJxQsUk))6qA25D|DeHbV7N-o17kF7IG`j-IhKlV5CZE`P4B
zUJ^6u8DrnN6%%-yyVW_<ci?uRV(DaEWypr8<5kgr@GviMC(w@uj`(VS{g1sIb$U{c
zCohs<K6rwQvK2tLFJ?=$e{}rF@-t(279try{^65Og;<h)(<dFdHT0tZ+^4avOn5cI
z0Zd;0wu-u9%cE8S{yrge|KR@LuSa}%xt6QUJUq~MZ{F+b&DTiu(U3y&0&l{yn6=y!
zZ>oM5JmFmO%HRoid6zN4c&*qk0bU<*b_SU2J2e^KBr%)U)UMEhC!&rd6rEwh79k72
zJS??;CbWK4EydZK{q=cVrAU8Gw2Y%X?5)uAg<r<x<eJ=^;kxd%7W!}f-IuNQ5yc@|
zEwmx`ZbagFhwD!Yb8-DZaM?mMtyFGtKOnp?FPTfh`aSW{o0be!zxB2`!JTOp<ILb|
zeZiBLCZEb1bXHh3bMjG9Ocso<8sLs|4Ss9O*LdQ(EHHYZV~zHg#;Xu#XixhCaSq$S
z8yAbyB~SmRiITL=6eCH-{#7XCdslsnxBpLF!F`|C7pcsNm-%^jmQKvmH;Ii?)^$Qn
ziPw;!*PZp!r=n#zZ*qty>9gV2Jf>>m^!D&B6JB-j5L0#k?)$h7t;2~Hc>Me|?f*@5
zurZH3@SJLb*T$}N3-yh^OS<T(Wq*p1=*^S}#68XYgr73Nbx$R%aHtCWS{2leWgIeP
zeJ-|Vpsyh3x?`l2$3AoB!Q&`s^PD8xk0cneG5r(0$nZi&<r2mDnL#h34RvGJ<$M=H
zt7$^w$tOWhqf)n+E88^bOc;@S%k}gQtFnlkfkK~n0<-QY%XK%G%32vN<>^`PHys&~
zd`2T5+~aZ^8a_{*>!cg^ViteXD9QT$+Ru5iIzZsO!S5Zj#zV-ywC$%7?cZHBxC=TN
z+|K@hr=)k9P~q5<{)2;g-DJ9Hr+tCC#enI74e1>-x5t=&@~Y#hQZ><!zkPp4{gv&M
zlc|WhWfsfiea`GCk{SK*a}Y~yFE_pr_L^(g6n<Ipvv4QA*cT486#KJh|4vwCybi8c
zKPFcodhs9WHg#->4P0+}yZPciP0-8cG~-sb4($aDTuHJGZ}Cujx;X|5t!ocP`<@wO
z{3tE2KsdZ*{#IYn(;ThE!&jHP??G~EcAbNW4M70CELGkrylOv3uw@w=yQuxFIk}M~
z=Qe1VTVFfvAUzu*)!f@)TAw9%Mr-Di?HYhC3+;@%b&PM^h3vpf2$UpXZ4!y$xqT5@
z<j?yxM$dIjoUwPER%UN=JvnthjL=<eJ}Ow_;d8zoG0U_oUnYE1eLY_NrlJn6$kJ+i
z*Hph3)I2AaR-o0tU#I@Tx3SljuY2#Vmy`6(Pxw2m&~WRC(npUp`0>oYItwn-vkz~w
zWb>%L6+-{ihHPWUNsKvNJNRRiD0`@)jq63MzB$l3|NCFRQ?74tN%Wt6G5Bn=q7*NV
z(s`PFjzGpW+b5A!_4})j-^<vto?Db(fH;<k<?ntd{-9K;P+n3r+hZ!{MMgj3^)`3N
ztABibCH{TLFbt_k)(jgSc)E$&$gx@~h}YF>BxXoqmg#EJLh`jr?6KS67qh`uWdh8L
zxMPh6C#jG>UdEd$=!O1jTSD92FjVRZ-PAAUsx&vdmH1ssV*}dmwbDA%mIX6jb9uze
zS7@fjM}LCLHM?K1zo01kB3CuF1dJNl=?8QEMZxa-y=p<5D)KWV&&T?Q+dq)k;3cX=
zs=8u<ld+fo+Dq+rlCYZgrMDh>J0y)i+z49SHf&F7lPIAbvir9(p`Q?~6tG6kUthcm
zEBS|+VilY}*!ykAT9Jitdb{=C4O`RBG7q9)uR%qab=~xsw~4G^{e1U-r|WNZ555rB
z0NHXUhsW1mYOqyruK`Nn5w+VwBK^~SVwqEJ`fQbrAvsY|oE(kD>Y7>jHD#A-W15nj
z;fZ%7pV~07v`8jo+9=lF@w=Iko;I>u@!>*624C}K4Q)GcA&awbL6vR2i16jStAloG
zbTB7!0U^#NbsZ`r)s}DR1@_3guQk~!)V+Ojwoq!RjL80X5_N?_ArH1as-c$~iD_uU
z?kCgGUXNSYz5jNK+i9VL^Jmam!yC)dMYlb_F0{Lsyb`=5zZ83)THVu+6~TIz62EKS
zugp~X)ccgjVrsZgZ6qu5Y^k)`*ctC59eGQ`lGqx#g?cB=?#EdUD9@i(Y53Gec(4!U
z^yX+U&4IGKcPN*Im9<m<?1#mno!<-EjR_hpov{;ovW>VR?W9xK|7q5TTz7WgW#zKt
zXL?3DiE1a;hcd1=Lvt?nZOMDNdzU%Y-w)cNWw&|JN5?n&maO6e&VR+{*CYRdg<A98
zP`o&ht(@<!OV#dmF|4kd?c|;P$rUv`Hjk=XAyZVnZyzn;*HD73O&-m;uy~m#M?zd+
zcwkr}TK;<Mk5>zZH0mn~6*;A%75?T~bF|;fuir=xJ4ra6p=9(yCt+skLGG7K^X*Yj
zl+{d4`nyb#R1ddTt1=HgQirPhU+O)tIWtW^Yi#%|tYoCYbu=vGdSKE@l*;OC-i;oy
zX-?+}cv+|J!>kOWaYGGnqZa;VmSU{_kz89>dgfye=p9wD6k;c%^6Y}qW@PZCnxNrq
zvn8C+e6M+eOdPB>W)^WBoH1;#eppEgp&-Ih+s>*#k5Q(N&g1n7g=x7{G7TE7q%@!@
zzg(Zz?A!_Zq!SbR5TOUBY0{skW2>uSJF86PvFD_JuI~Hy$8KE>mF>ZfQU{9u|N8rY
z?uJn0DIztfsu=2nOk^`-j7{o$H$D#h>JFi>tl%1*ONd5ZtxoZB3P_&n6pl^dZeEI}
zWA{}F-cv-IJ)P>3)6%6TdN}1f_O4SGfvV_SpW(ZKSQETvwU%%xWPP!Z*}-1SOMfrm
ziPLUrs6j=P<y9?GZ$qY27B^v+%uc6Ml<c@#=~>XVwv+)4UHKK?Y^rlt#16OjA~}OY
zU3((6o^PF05X{J$#(6D`Q99FvEH_wm%cqC)_SCf9l<)N+-06x4so4Eb&HjTn!h9i&
zqfhMVr_Co5h<`KKj$qhb?Qxp<^QHki{{P&(udfz$q3VR7IgQ^wqMCgXVgsRg>VgXq
z+a?5duI%wNUkLj1eN|xRl)qJrT}}V&z5OeVe!MHly$Y=v;7orKyJ7zaRb3gbRgG#T
z8verjR{eGM<7>;C-fz}hs@ZTuCUjUXOs}j@=;WaST5_&uWo_a<eTyJpl$eZZjgNLL
zpE799EUI-Z2CgJpT_iu!aP()gZAIRN?2!=$KL_ia3)!nwS&qv;?&Zhld6j*e4WZl)
z{$jbjg=ns;9`a94aW{49Q%B8bdvh!@d7>v=R^H+|ASjJ-HmVj)OQxxeact~+YF~PL
zeDsu%caaNv+fA<c;}ZEk)sL?M-+=dEkZR+w({fKSz92`Q>!~fmfH;EZYIWbaKW;<H
zSzMLik$-+E(l9}<iN`5o>|hEh&IO1iGvdLu^K)f1npg3wU!~sSsH>&|=IEhi47EF-
zGG5I*n`X@}sRXfS^y81@by@=xHZSph8_|EKWeOgy@RgFLA59mM420VwNl!|hXKkr|
zd@kLVG~|sA#GMt#Np}8|=({KNY%TFH;<cyDP#w>~2jJp2MM}>p4+GQ8o$mp>L(&1h
z`~1!&Un+;R(Mnft*o(-EJi7<a{Z<SwuCp2(de~S&Zz09r7{8rFG}N_O(?AYE=MG9K
zhUgPaJ2m7GJ6JuMI%U?3S2K0Vuvb{bS3Br@7z5MC36p%M(=-WGc=(sFi*dcqKqpda
z=N)ADQ>CAG7Hi8JWU9y#PAR1An5C??q<zf~eWSw%4ezage34DB{AO6R`!+PEXgs&*
zs`Su5mokRzqodBrv#U()4KvPo{x{A*oC_H<^YSADWm9-3hqniBShQQhIoF#41ff$j
zP5GZKvwg1J)zc2?{dSSKrbO#0S07KsYMVDD(VM8J*0OAYY-eM*nF9u>^cL-q-*%h^
ziuwoc+HIY;=t>AIaJ#wNrL8qrW61sf3+mPGlDJDm8Cz)X>UG9tzDj2{-wJ*|lP?M?
zZD(`WWKz&3z<axoS0f|B7S~&mZ9`hIP0urI=Q8EojzSJ@=Z`zS6lr|*npoZ3J)Ge@
z#PHYo&MLm@8pQpfFor0a2-n}HKOFB3evLz@^ZqlpvXi7hOqU&a2eJsHPE)yaPoI~0
z0Ay4hBcrP4Odc9fj7>Za$TmNxe6MD1v_mdA@GSX|IeCZ<*>6YU;F<r+-+K>VYq{lF
zuKt`<C~&@ZZU3=_xs~WS5Ie9Ty9G`nIv?Y)>G9!UNY`}{_i14CQ>j6Gv9{ekKl(s*
z1pNgldlAF?h|lg{bSTW2;|eQ)XcEuSNU22Y-5}ktlbQYQnJ$s9#DYS-Dh-`ZZ@f`x
zG;sfmlA?f6n~3YjAqO1106W<ZYmy|&NP^XX^o4%lnMRv&SDTJabllS?vfFKL_!NaJ
z%eIFS`q@Qy#cI@djah#GK7P%<?k8hIJWF49ef#NmUw^yYq<*i@K`73@sN||GkfO#I
zZ>k%(oH^#8PhihuQnuXyd*`O-<@Z&s&nQdOI>cwsv9mdNeSJSD)m2F`IXQf8#^yRY
zLDKKP^gf#)%eM0N+cXW$%_?6!63-~)kP;9*pe2HB$0}TGvcG^@6)EQp6ZjyebE%Qj
z*IrFqQ4iu?JKxk&?&7ex=QQxOo-#?vTq*Dz<&6?nmZC?$v<H60bH}E5a(sS#4q4tN
z%cG^UV6G9;Xo?MOJp7FBDBCyG@U7(<uZF**LJltl5T)A3wED_jHGG(TU-i_x^l9Y~
zfmdq8%?X))$=(9rRIQ<zt3m{OR=u5SuEr6G1Mu*G_pVO**ZiK)u~m2{rzMNiX{znI
zx*Rxs4f3M<E-Lsns8T5Z)C*3SopRl?6av}>%@n_yYYntoytMI}RZ`BCydO9H!&G@8
zp=d23<SCYu)0g!k)>dP+ucmvsDg|V>&M4x2d(5lJMuQ-)qaSBp_$fHgJa1F?q4T-3
z_{-U*N4Wn@z)uUY6Z8mzK00T9dYU`W*!(>`v9d=c8=e79_OL0*JJ<C$I?fT5Ze8B5
zGdc=9Zs66B&39$Nwv8&x&y7S*d&hCNClp@mV5#qS8>rYw^bB#)xj|a7Lq##%Gko64
zSJ;v+A?&SSKq|*6X$`_ax68p?YoK_~!A{9<N=eaFE-p{b>XEVwVflWr=Ll**T$`5Y
zVvVQpOmPajuG+ZVMp9DMbE0=q=DhM~&z^8DqkqMKwo$)MjW40q1`BcH&gzqkbtBF#
z6o_JGJE19f>lZLV<!6tGu`7S10lDvL9$!CjSJmn31=^Mj6?cc_>g_5-tyfh*naDT(
zaXOQ_0>LQ<g_}^OwVgictLg9Gc%Ki*K1Xa>O#jAzLZH|hrs6$Hk;9pDj$Dt)b1Rm|
zrgTT-)u-CMc-5G?xEol%^?wm~OlSdKqQ2LvB)L$|A6sWAE=$m!Kfj%leSa3;+QDr?
zH-3qY<$^J@!q6MFEn^f@UCm>N$vFb9e^^e1<hbiLHLgZbiPKSyFK*Qpt5xK@)<);X
zHL*HaTXZZ44c%Q39#p?)*)w%A7|s<f=M$gGQ;z^4JLrUwu&dofe7)09PH5yV3CY7Y
z3TlOjUI7q*>;H-%a>$&W|9nNrt@nr6I3Hqlc1CNQ+N0mzZoBW9m+cF$(YyZo3hI8_
zs%0PW89t^+h&M|#6cv@m{7e!eNXH+tJjvAY{)QElol<~V%4JKj|E})Jws>HQz9OPH
zH~|rtL<%7o7d?q}hT<-qZ6k6|{6NA<G`mG|3KOS3iq3KiQw3%e(d%{YMC1N5?Ne^W
znoD#|Q;$!ZoF^D~_f<iRxyi4ly+-Zgf9J9z@w_|~vnMXHxmUMO5Z!0l;y&f(YtKSD
z9fsijaVuQ;lnks((jq&Tc%?2<PCNs8w!;9=W#F27Nn?gbiIZ=5-zKm#C6-S^)Iz1z
z67Eq7+1h^8-;0D&bXYD;sr78mO`QGotHCm7xMWZ&FhniOa^%C+7sE{`qJhE+md|yR
z=`#)9VZw9){P`VtrJX9%9V7zj9(4!Njk>@;o8jSPJ>_=IpU-(&8@+iZ^FjZ~=a~zg
zFD<#5X7ECNm3{I?3U8GVX`FF2R~1ab!+Luu_;{a1`vRB9{e5OeYf(8|x7ihFSZLMR
z2NSd*zp6-P2(n_Oozbt|va8e{RBu(Dd!|im8G#Nb^eEOWAw&$`U&&@uTuOgL3qMzf
z4t(oTixQAP$y4s1dGlXo0C@<RaaHy!-dA#+7aKb}ezj@zio&@W8L@lSkCCi;HfKVf
z`%Q_kFoxJC)jxMme`Ymx3#y^Z3sKQYj?s*jr#0PB)$T6|cbh&#XtOr8X19*CYBVmI
z=uS<2rdT(7Wg&)C&-66cbV}MJe1e$sO0QDBPVJ@#5;-_c54HKnMgN6#AIDQeNcGa@
zQ@l!X$M5Y^(RwF39iIn!_Bef{{Xt3Y++wSM_HM#&>#r#;LeHO`yyoikILbG~Kb4AX
z36tl`TY90%zA*clto%)M(1{bYPjPX_8SvgU9t7fFqA|A1AwBl&qlLh47)G7Dh66a#
zY%mzTtvf3h0@ssUt2C#7s#k8($VqUiv4WS~EaeCH6!nRP|0a~LA^#vYw4CwAIPrsu
zHfuC2u}$T>CP!!R72;{NADnK6Pu46+A>Kj_H<;sx2~b^`iPJ`urig}DKZK@K3558W
zRq2}c&N$wR+(_JID~&PN!;N;9PLW}UP1&z8Tnd63?M=;~o<8WxeP5iAC2#a<WH0l>
zSM)-Hn_8XKLpP(jwt>48gm-g-J3(G)8`;AHV#(YgKYLfnD;XB;<t4lxlR1p(dmFYK
z%}#vveQY1hKI$e&*oJ#M@w_V#+Vf)^IHUO_f;YkX^zf+2h^l5h>RTdT{!4!z^9AI7
z4PmkMvl&Kn1$RP-I|H7F0dNO!a5=mqZzy{d_tUqvUFBTs`SuP*5~1lwPkQqj9e&L`
zoe!4jxZl6-%y4-N(^G#T8=;&L?X6&y)@rFftskMsvR@!=S$+<WQqNgLxvl67?ti0H
z7wAdl-ZfgU(q>6>kcQZ^oDShEER=4{K{~$@$&Koy^06<-w?Vm!s?K-1am;ksR#K1=
zIZAEVD0;u07SkwBY^{joz{{SVP&4h^d&o3wpUCJE+?%mg^t#7Ioi6W6PVk5I&|%?-
zTsDEv<!txO`;F>&Em!6%kh&3U_cEUI#kV*!(M-k>?9?enaXn!y8_RHVKocOiD{P?G
zS>#JX0&jjZ7Flca@=vFB^~D{hhY}7W%^A1r7`|t`35M(}O7J0Pgk|%M%PMk*f`vxT
zmaJT9P7R9=>Xnnrv2woCl2B$3ac`74jp4Y@7xT0l+ahHfK6P&5QsC9--xYH%Cj7yb
zddhu!?Ib!z>NIh|CKXbc$4?UJr>ISYKQUdNwj`iA*=n7i;m$77c*FDwvXf-Oj3!EC
z9mO|1H|j(RVXfbO2Mc>|p&zc+q>qy4I6M8|N7?8S$vZFo@OddO4}DtYz|e(^IfVmD
z`tOS4(Hg{^d~(jC>@gKvBhtRy_-59lQOP8}5Nm^+$7(y`U%NxQL##kZAIaCdF*osP
zpF-g0CGzW0`pM%8t<OA$N2^1>D=g*di4SC}+V%y8Uzyr@^PcBg8%(~(U5hP>`j$xK
ztykjs6{{s_EjI0OGFrDN-)*M>Q2w*dm=isj&NDF=WF~h~=sl}E=vM|pY1DUI3#v9F
zEVXWDYs`iX5%@dGU-~qBMQCEyi@n;%AhRLC495D4{h_$`TN{T}zi)I;S3N~8v<I3^
zM|=(SNMlM0TTD#%zrC*;8ETNxt?Adw&+;}2nL%Z!o5v?gXCjHO4;X(Ol6^6-uA0m2
zjCBr)E%lse+!qKQUX6WEti+cW^IjVW^Lq+2fqJP*mI5HRCMj&;)>bK|TC6a{TLAqA
z36`Scz7nB}zjWWN7b@mi*Lm{`7qXbn&$Lo(Z(j4N-+FK$vGR-+{bk4D6TZyViLdsN
zp<)r+x?7d{^mF;dw_km)zFU-A*#7VXYh#lx`y}k~KTT`xp+5z^J@nOk8q0*0F9+|B
z*+70f?Ekud1%a=_=~OU!ud(bL{+idiUv<>Xot<0uzDiBKKj;R3IKA{n6o~dIJ`uy_
z1#9*i*>1}ebf(r1!ap0-Xh}OISFCf;u7u9%d%*X|Q^k$fi464y$%t~{v9&$)muwOj
zVDG(4zIw;Ii9JFEnXe8<8Vtwm!gTG<Qgh(3eP7-q=4e(;B~<razg1~u1<rZALe#GL
z{TgtgD1{GLM&Bhaaf$C&-FS*qz7kxZc#C8?&MpYtQCaOne<{zJi(uHI*!%3{CwM}v
zmr*xU54{1+Ow%3C+Y2ELWGe?QW99-{sP}s({(_!e*mXiuhzg;y)hS%-h=1^EtQ{PU
zrzTzmiiXvFsm+q3tFUjlfXZR6+K&}?xm?MdFd*^8m9TsDTSMxZRM#=>n42%|p4=;`
z-}y;41y7@YX&edeDc76NH-GX%C)Go2dBkxwUbI4(iH<ZgVwmTY<+^=%Pkj_nQ0GGI
z{nkyZ1@+2RRWn6LwL`A_H>sTzO5h5pd@s8mZlI7Y%pp;g>oW+C_Tb~l;{LvRIkC2b
zHrKZz{c9rFo~`%m+xZrG$&WYF@4oR384CO?C^(ot8Ed<3G`DJ!_vKWuHQ%)m#^H-|
z|1?Es?0ggFFgwK&H)V6+s=Uao)BHZ+s$ro2QHA%SClMh#<(`Trf>a$E|1zods~rm~
zM_DNiG|$Q8@dxs3Dm`Rgf4(uy?ry#b<pWd~^#d!Dghwk@S9|9MvvIoDN%ZknRIf$7
z*J5Pv+(GzVJ>$9@&{kVO_eg}Wi^6r85_+LSBvCHYnS<mK)!RS40IVLraI$k99|T7t
zrdQ^D$STuL+SmrxE*p=#(Vl{DI!{-Yo*h!KGC4s>J=i9B<FbSXe+MS4Z}9JKJ;y{e
z({F01JbdPA0o+Q))%-3y5r2PmkcdiGS&=v;fe@<lTrOqH+e^k3mtIVJvF&IUKTkKv
zWIEeo)?||I<oA?fNSmDGNn=Hs6LcHDCNQS)(-Lg5SA9JyL73uO=LhWwH}kCb^K_b)
zt#|XcUhi+z`kwf-IXqEr`a{n%&1V!PK>0|+!tI*p70XVeO&1rljBqE-l{vxDuq48i
z;P;dDWaJ;-XgN#eHnH`DTBxJ_cW*W}R`}xTs<H0|*?;@5q}21ZLKy4X<M~F`0DY=P
zSgz)@emY0!^SrReXJf_)v6MpG@t2NHw=JGe5n4|@y-7aUz<+5Jt;_y$KkvQ)D^=d$
z@<jWCkQQV4Q#eRZGDzIPNtWN4@OopYgAtrSp9mb}vL)yg*|Ayr%f(Nw=$E=1Jw<+M
zu%EZ^my^5f;!*0;e^0sGy3n8TMrTXogBw)09nHm_QK)2}$E!Jy=h-M4M?(%_A|0V0
zslU#U&s9{ZA{jfiAP(dDiS<|>*eT8YKa{<7SX67<J}e~zC>;t&N+TiN4GI#{ozmS6
zA|NFtF?32ucZZCG(mgZ`-AD{I#JAjgzsIw`_&u-RKXc5%V%Ds=<BIb-&+85$aj`-e
zm8@->!qS#!R?_ajDKww0QO4gI9tK9FSM2RRYR22H3=SZ@s=G$)UDA8_m};APgEbiD
zZINO90)ZMx0Q{ZFts#6XL8*<}=H3XtBZ8cK{5jUmR^~%32)!U5fsD?PEu~Ls-^5F=
z6I>4sFsP5{o*~18l`)<Ta**uqF^RRk)C*TCJrb@Cb}AOv7W<wCKJ;>7HE_*}Ize08
zTI$aYPF;PV^;TOj7m0_2Ps8bnD0`;IVR=V8vuy+}2rRSxV>cSvz~8VCUM)IA>$=2v
zmt_C09dM+7WNzJ~-V^STni&>U4{p=2&Oe#|*;clt{m?&?wY1#1od^`zQV_n`@mcRH
zV!GsOCIuxaD+ebT6;MJr)Q^+73f(W%ICj!H@@iRsWE%$I$@bYUh#erlRBB@iy7P6Z
z3g#GzM5Fy(EXzhPA8`&J#CVQ=(j$1Y7)%!d=JmE3VlW@kYv7AY|1v}9oLu{vJRsYj
zFMH`q(>1*TUn6~}AkQ4IkBQ_JC_&c>-{h%;y>+nd@l5;rF}WNSzw8oXY88m51UmBD
zmC#me6^o0=<aU-S3-?M)I7Aeof;}3aph7l_6fi?hUAfUs?x@Nm+tkr#b_ZJxr1uJW
zG_yjew0@1nhH`t_6B9A9r{ZtKVq`fMsbz5c8-E`6I7}m-`(+>0BwY%QX_#uxIvLyw
z7Eny2JKbu}TH`^7<qO<vOmL&a9<RDiFYxFfE%796!AU*}f}n|~`dPP?%pJCej?zp8
z6^Gv`6bJ(4E^P<*7Ju|*K0r6Q>d?}tHXLQ?i!*<@>5{ssojnbG+5_nYQc%i)jx+OD
ze}dsn+9BU$)@yJ~|7>$3PWJXMQyvHy>i^{a(rA9ohXr>t8ll$&5joclC;%A)rx@ol
z`LD53iZ}=}3ZE}V)%@JUBBFRYpSI!HJfp~$vBh1AnRweaAg2blt!NCwlv=&={rtip
zT;~Y@=5%6HG$WuGL(k5(b3)?eTFDCY-_g2@@wW1InddXeJy(&}zmywJH?Y;<HC7@v
z->|Om7+K7G6OGSO8CdH~jmw+=;U(^aAScv801PJ=*5S`-wB4cVc)j-OJF_zi`UQ{L
z!v0%>TxK-LL}-Ft*mQ~2n+nH3Sx)=Q+&DwT2ee$9?WvyEjTfW(yVSVJ?>?9*QthiP
z*o2;!%J#T^EE?S@uZQ+1keyo3e$=N{;mWqmyR;j-O4PnyL3|*s$1c6nO=7@8+9IVM
z-pIiW!O<M>Im3n=VFdlk;F+CziNm5~vEk3=G%?DuM&u#0y5?LNf&OA7Y8HOeXlK9{
zc$zC4)EV|sB$@4Q_+)AZ4w29n=+(IU{^m<5d%{kQX;yJZ^qT>+C#N;!oPU%pFi@ej
zyU=BTfw>n<Wn-CcO!C)F+S#);Yca$M+4$&xX@)0q>R=e!(*pMN7{{f?$D}m`OQH1u
zaCI|t?0JD4TSvW&+}LQALra;Oor;m>(_6Etp*j74<b;og6&M+Vb6#z9kcb(nz0UEF
zw-yJGq(!Q3LOx81T9F&I6%>OiJ0Ca$g^#z|RYr)i4J_xFulw!ykbZ)r6Vb(H6@NQn
z<+#NNlEoy#6k82CAa-D`*(O2VWeajbhNX8SoR+b^FKgptJgw!VX|8xVPi`Mnm4QG=
zJ_qs+VY&gO??A}<gV~ujI$Kt>{H}t(Bf`MB8b^J4ErbxXW$tU6@oVA*c@9);hQCTE
zFiNEDVC*|l)>b0Y&+ZG(8mf~59G9O@$z(i@z^^Pb@oC4$60;79<P3-N%3IqcKKx`E
z_L$%?Se)diOPguCcGBcLAoMT0<&SMR!Wb#f#O2F|F3H%()~iMJdPEX!y?imC+=_E)
zJ(fP(Z99&o+S=ebZe339R%SIXGpO)UIe<-lb2z)x>+wiug48{Q#TL{!*KLH&q2*k7
zQJ<?v{{mqZowDZ`h*qf}R#8ovYUFN2Yop@xok$2YqBDdI*&rA-bSng+NrLRC9`~r_
z!CaK50XB@+`%Fz)6THbW_NHnX-!3BItiJ5vfXjBqcLpw^FGX{kGd~(7z3PjwUCSIx
zOl6pE*4qDBsBg3MP2yrHXNjr{8OB0S4%)5M;1YuGv7vUGilzsgjc(})uac4(O!34F
z+pXnnM(-!?F%^n@m?!ywAT!!TH*l;ESZWLs!QZ|t+|BU2!>@++oQ>T_j0{k2e&!Hv
z+~1m}IPTBF`flrUG4FSM2hF1zuIW$_UVPUugR<##;*7oPoE#;XMK1L?!ERMnfO88)
zG>v5!C&C{(a@uXS?{*ic-#_FHj_8bfcj+vLw?Pb&n;Cb7A6s;-k;HBY)7|G2wGvFG
zqbvbc;-XJYk)V_aPq?{-wGO>mR+^}NGI)ZoAz>r@Phblh93-X_p5Ynoijjdj&P~yG
zshlqmQ0PES3od|Nw?s8(;a{I^(Of%(fdlYjP1px!!J#c%8KhDoLcQbGFM=~44!Ck$
z4&2mddvBLJVlowpyB728t(7I15;j8UCB^ZrUyZydL^m2H$on`dH{gkf?R8<eSE!Ay
zAkmNQI}vFOFG4%3$0bS;aao)R)&rRh6MTr?8+ONhYrpO~eNk)MnVsCGMRoq=l@a-8
z2cV8FYLMyXz4aqxg8EqqleRf7v(fyNOrs%9)@#EaSU4KQGypm>2ofB?_9ZM&FT<EC
z@xs`q0H}401RMlM^60QMHryq!;hXgCBUoo>I6Gfwh%R5_7?b4LB_(WgkNYO8ge{2U
zez?O!*2h>2s`&bG(<*?)e#1{J{)r6J3kg4Mpl}Yl!p=-D3>Sw(`c6PZVj1(&J5gf3
z@O0-CO+{Pjh{Kf;ZO=jFqGy4nl5-Z4+}D%E>hhSU-N6N9C);$?cihAI3Ah(AExZwc
zd^)gW_4N8jzunwfAX?B~HYHRABs0*VXFE5}daVl5+i3E0orH{i?Z)ocG}-a>u3Nob
zpn?^*EiqR-3i^c-{CQ_#Vsa$VRdY+_)1|iP$sDRVg@voZi9-eM<fhK>>D~Nijjrn1
zo;<rwugcF0Ky7hRu*C{86wyDGe$S{nte$;Z?%0dCQf80#7Bn!i?~RaIb`2{SWilaO
zX_qV(wzq!h-zuVg$%4@H52TeRsu&}mj!ZwwB9gSZ6@UV9SK#~J#l$xxnI?CsY0rxK
zMAMb@y4%d}Jq^-dX=SOMTdu|Ok&H{Rn?I~bfNE(y3aWB>9y5o-HC9pmCL3)1bRZ%*
z34DP2M_yP2Sr)HS!_cTgnG4Tssidr8G+2D*9mDK~&4s9#|F6K%vj!(Fu8+eEedA4g
zYsh(2X8tm#^XHe_&_F*o{#NZ9mRv8G9rP7{4v!<QqJfeJDg{(;>CRik$o^vdyc6IF
zIhe6gFC0+m|4?$&;56a7xM<zpi){~(Cvh;{5y(?Ek=!EsfE4h~J@}GQ@GXC3CRMjV
z5>ZX4_I~SfTOHqoGI~$`k`8E$kx3WkI(M8Tl<YiAn>|cC9G5n5+D83)vPEa3e2Aao
z<agk&@)o)NEtS5Cx+DPRk6l2l$622@*>Owoe{Y;v{G?`pY?5U}xfo5t9;1i>5(ixS
zya-LZ_)MD&Jc$j@bapLNiZ#p+mNDl$-bI`Ci4b(EsP5Y{fv$_CrQvUk_wIrdJu%OW
zbS}K7g?F(Jqw|uyrxN|{rU-`>-;kO-!koV-Gof&q`1&~tF={PJwdk)DEoG5c-jJT8
z?^tWJB%na*3_}6(pZZDIkQ?n6(vwK&FvpPKU!(^Sk4@OHO2)B5T)Ve=P=gtTimQKc
zBrK_6s|Ga*j6T_1OqD<Av0Q(Jf)&C}@<G?XNg5Qwkc=4u-++w^-NVO5`^F{HekJf3
z60;336|5T0ezU7=cG!%xyY_P3CJ>tz&cO(Qf`We0P~%Rc`}=>yZ6fQNXxunMI@Y;K
zM#n*ml*1_62P%|YTJIiKlpad!(~yV6o>M&OX?O86YZk3kc16^j)F}T^a^)WT{_O%8
z8)b!(a_@|ikrv4~E-38x83yo)_K{FbBB17i!LVFoPy=y`F42{wVyO&yIQSDZm~0Sl
zl=T38=>hI@07$kW44R|I9mdP+0kDsr{Jr33XIJgXXz4G1qa|Fl8gfc(rGQUQ#-+qg
zDZf)%VZdk;)Ij(@2&!5rUumMp3NgwY<EQ#{ci2di*7OSDPuUjv!$p;<%<*=Bja}qQ
zzQN^Gi;Vio-La<zsFI|&X67`N&t<26<TO!X_TYXjm&wh?R-^3)pNxUP&Vy>#(npnI
zGun9gTanPw{%G$y>)J5v$n;{>?r8I1-{&f^Y)Z3<O9XtaLx$x6S@vT;3Y#8e2eu?!
z>*uu0)o@%LhNf}x8a3H=vQy=Vj5j}|H~l<%(VmNs3UL7uV^+>4${qRTw=gKT@}vr8
z<X{9s{XZ*@l;IHnJQwX#^fUldwc_$k;kDn%1UW4X6>vMB8ioO=%wg|yn=)T!*)Pa2
z<l}&b%X0nel|E!<LYiOqS-W4p-X{FWorqh$k`}yeVYrN-#KC!;TdPFu2{e<u-3ds$
z(WgHUSfK@TMLM+c$6OoaH5;F1ATVJLEh&|v+i2g+F+w)nThFhpqF1^<tO2Xu`urIa
z5{aq9cZZqI`+{Nch(WD-dQDdIcQtd8v+aS|vm=uOdZDaNXNREPskryzO{6(d)X~UB
zx2&Js%{RUqlvYZS{#DHS?<Bq)4<PYf<(W=Of+lb@OhKoTxKSY{9{9*G4yWDMQy-78
zc6J&yy0F=s=btK(&dy(Rj=@o}k}-hYFNHD58}#cp%C5)|PBycsxK$sU`w`=JLOZ}q
zJnFmZfB6&kS~90lCtnjRei;OI+36Eg5885$J}@;*vwDhba!L{k#CaB+d>*~#FwdcI
zzCjyOT&oHa$<ZsxAHL5|=P$L@0CMKiZQ3*E*%v%s?fz_^ieT+)D39gXUlkd7d_3{?
zwpn}s1Wred9B^mvfv0(uImP>Nj@xr|fUKFdDR8)xBbWLaRJ)#G7+=}9NwW#GH*erx
zLI2Slc5H5Tfj%|he67Dt>^db~yQ{B5NZJ<5u5AA$-L@lzrS?%K__&4V!WJ8{`k~6?
zB0%hMR!>EJ*R2v|qU2UX)MNbt$g~iJGA;4ZZl5nAo<69^*>3rOj(B}{Zy6t6@#IkN
zaRT_=7*uaIn$N2Zz1zz`p^xPxNoB-&P;<@swH%*fi;S=1%uN`W{)IeFDo&IGSkaD=
z!YDtcPkHN!=#i6go5kb(I#U;^dexitizkMG&d$I5*luFe3$aIg5jJ{wirz8M!g{>{
z;0gVc0ArPHK-ngC?c;Dd4MyX3H2AgG#h<;kJd_U>HIA?6#m344#usA1XtKTVy*p5O
z=W2Ui%hTHrpFBjNu|$_9|58gSuWiFGbBgB=ZBKo+I6r5lhJp8htysY*kvJ83|8o`O
zAg2d1?TT-RSL<I09?$(IZx;>+RV;nzf&kH+&GVqS=eSD%When${Xp^Y-(@nM_-t18
zvt*UBe02#eU9UPI^V|2~FHP~lG+8ZC#w3I)2~>XNV^Ap~;E_`Wh0vw0XcK_Yh4Odx
zUVG<uyveR8xsHytmXy`l|6w{mio0`peK+nJxpQsJYB9AQSF=UJ!1HDEvBvS?mLBHL
z-4+*-_t!G;ae-yCm7kHuWwQ)FUaZe&ne5yyy8u26t=aiX6`3C;4=%+=LvxW~D?YO`
z{7`Gtir#N)o;X}uwO2ny`)P6Sw&JoK{8P~Cx=gNf*58X?8q0FRGjm<Q<?EL?ckH3V
zq8jdNi{Q<o0IsQyrjG9soZOyGo1hAeUa5<t>!?+$nIvYt9tp37pq$&*FZnD~xEALk
zy$_)S-p;~-@0jat3p!$}5Jv@h<&Ov)mGT@ixf!-4VhhpQ(SLdf-*5F{Nq7;!-#ooY
z-y=eYQ3X|PX4#c3Uj~O!_`G({*yL==+87}>%p42<ysDndDI{9URo{`dSP86vGG1b_
zuwljg%=>F(C_1wn#x1;MRlJ6Ij~W--xS~N?2eRY@hwYZwOFa1#TGdK1ZWaFB$qH<j
z=BpSp7Jp<gunr#b0!CzIGMJgTVDVSnd6RQM#?9PMrgsx>Soe_7Sn&YbFfU%QA~H;F
zdVNf59*d|gGlbu9cc^5A4Sz|42{-25&48fbPK;rf!wD`ZJpl_8!lkigeyTa8*5aJC
zdD-eF#nyhA)hy0GKD&ePbu;H}zc=XEDY*8y09~wP%Nu-+jwYj*o7lB3nQ;kh$#&ob
z8ATtMg(41Siv+$(?LDzso|7m~!xDmyj~-;*LQK>)!z*@4<vb0F1W{N%jC1Z&k&~9#
zRJeTM!Qn1^7_p1aLj2>zlD)J_W1)%%mZ}necGi^^%+ZQ|@90q+o`N8EH^7G<?y3Sh
zKgQfrdTY}KXa9ulnqiw~e8znnW%|xx?_aB+LJBJSBZI4yCI^Oyf}A>^Z}dCaHFxz`
zwph6Y*1y<lU2ZkvM|A~i0k_d#-+u1jtV9WDIfyrg)y~P^dIzABD3TS!xl9d7Z?D1h
z{YFCV&Q-y`$mWKgE=cLXUCK!4xiLZUo%ikGy<*SWC?mza8tB_71;d_&5V2U!%0x%5
zC1`YAl1-@EPPXmNzoQ|#mYu8UIR5VQCs|fMF`9y`c|@3bYYQQeO<3^No+w!DyUwZ)
zD)&x>-Yx381$m(gN-om>+VEf(X_0l+-eW|yyGWAyrrEe-><)yBJn;`&Ph6~^sss<^
zi<Z*aoYa=Fc=-AwhnL@k=*M?F93IO1qz@<A&um{U_U%)-FfI)!RiIkP%guDae>5WW
z;*1L@dTh25vEo{=t31^P>9$`zu1)`(e^zjE4n{kh(QUV?xjCJPveq#9a)<I|&Zx%8
z+27oU79(i9W=N*ECWvsvCsKYp@)+H`I(+Ib#?~&MT8mEA7bZz|G=4hCL-g9C8ouk6
zrseLQ4hn%o!745v4nUjztMe;&gD3lTEYM>9@ruvG_3@|KqS~&wnrIMfBvH~({M}{R
zpofOUMTB3GO`^B<g;clS91FyvxbAW$qfKm{0(2<=gIAWJDjU)w0+kMrl!&M3Siyxq
z4mR3Y6m9kLs6=&-%v%<XWlOFP!X3rtLNX-JhF}xfSUW)^XNN;ww>=p4r`KWJCWqf4
zNSEJ_MEdJ*%*y#)zxtq?0Cz2~Eb|dqM$0D~W$G(sPowlC9GeL}kri|oEfLq=q7r5(
zSEnKuHkvgu{y^+k(gL*9b9ekGu1#x@`85*sp2bDcy#mkdPqG(sfuP86KNgpv_>nq`
zGXSC+nn54Tdx)P>&lcM;Q_`Y$awco^Oqs+TL=-yp?W>vm?;HV_N<|F~0v-NA704OY
z8@`F7ke94z7bE~qYVv)HecP<;-sk7{3cucl_-?LR!Dag*aPs^wJW&3b!UjK1TcUzk
za!Zqk$ctoMZgs@G>nNp@fCb4_62a%6JEPL>Cq6MikUcRvu1b}mhVm@LD0?;qf3ZYr
zk3G=GdNP5PwcP9S)z&Lv>86>xT#!gGLdc*AAu3vP<4~}#K0ssiR5fJAb@-RM^Lc$b
z(z|CuXs!tDMV)rLPq-k&6qKy7^;#cBwIJt;+cDV<lr1-zx6FwvrvyNq2zR6*!xv}}
zi}Im?8HpxaA^1ZSVh~P)6E205j_~9CTufgbss+6*s<wCf-yaMFVqaN*lbUvD=hG*Y
z`|gGfx%P)W_1N3ado74=!qwnH=U_?L4zHr$&pelW=uhAMjht6>T3z^B*1p-rj6&oh
z*<&J2m-I$$IpB8&?H4>9kU1>j1uyjTnO>pN*K8-Z?kavb*-*e-aw~xcA|ns6e|xq>
zZZD!)i85>C-iP6YTXFcJikuQ+q`+PL--*P3Uk#5F_a{c%!;_#YD+=NUZG+BIQ>pdW
zxjBdWkC_M=LdgHB7^tL!CZ&ToI%^GY-_x_|2?>On?#Fj_Dj8%ch#fJjHkkCjmlkZ-
zD1N2dDfhSTqr`uAH-ZUCOKDb?9XD%944@xrBFt`2a{9Q7*8VP%hiVkPelI?Q8p&7!
z02Xv+p^SCSEzr;<{9OShf|ayNdOz#u$S_{hHW^d>r|0_@OiN#1Iuaczo=zlgsW(n{
zH(BYr2Il8L-^6(B_5ie+(T|m<)+0!iPy4=xi_gr+$!yxxQvh5`REQ63Z|Qr$F5l@k
z=r3^7@^FegL~d9)zr1xS{pnKnMB;wIg=pD*+k1*Yx;8J}z`HDiY=u&>;iQzWtVm8e
z@ETeX1|S|G>ehJuKoVB+C930px1~7_`0qLRy^H{NyBS0dLIt(mOHrF+c0CRwr0(4b
zpkD|^af<s*7w18>$rDe3?KncT`Ds#PtcwMkWsyA&OTEu_*h>aB7opt~p+#YVfgQ)N
zM<;||kG3pgKR4ooPW3yMVFgcFco>E)W$D#wCr6tlsq8vjfgO_hmT^HPKYY=CmMBTa
zXezU_Sr2(}Nx?mFV|KZgBa`>uP#t#Vf8$mAAY|V1Sz#t3<PutC7}jM1&qCWd3xu?{
z2n%n1dQ}j^U}JgrRm*idN!c~nD+@RbnFLEq|0!F$r`T0wYHR;}iR&VFiE^Im!6|`z
zr>D^<TsT|Xm)m}{xeK6!)!y=AhFF&OGxOa)y~hH&Fsymo#)jacoBT98dGXWjHA4|3
zcrmmxqe(0zEaN_!Buo&r*SELCG%2BNR4H~ZBG_uJZ{$wt^=l~sTh&3L+J$0TY%&pl
zVK<sUEZkM#eCO=j-BW}u+fst&8~d`s?7%kxY?&Q%{af;jj`<HRQ=zG~=RT~ZhB20e
zpjf;utxk$oC*8onicPArcI=XSc!g1=J`Q;Zid>;4o!33?f22<TC6juO@$2F}2!;W~
zK3O<6|15$WO@iXD$gumNfjp^M$y7#&2($+%<#TtL>3jnRs*6|pY36VXRT{8HH?s|&
zd~Uby;lBC$ra%-Zln||bmYn-Y0CHW!U|%0S?^M?snb7MQ{e+ZOtnTqJsOmW$pc-&e
z`sn1hIkHi<S3+IQ!W+31piaO=G00e$PQkAYOyrr@#JANj0EnOj7C^(&#g@%*)lq<f
zc&!$e<&2Ay_g*~xI-7r9SGp15Xq$U3v=I*(CL<X1%lv|Zie1kX90MG5=<KGIjcVQz
zAVbx*?6&AbqGw(q`Ashs0gT;9h4}r1B9K&PUVDkhUg8E-l^rdMWI43z`x+PpE=$M{
zn8>(qd$)H<13&<D2zaf8o~Db{Ak{k_a4d$=ncjc-?k-`1VZbTDub(~`h9H|0ig#%H
z@r*yP_lgYd+ek;&v$|MwAV&j;NY#>5Wk#`5ppfMWjF7OA*ZIqLL`Rv#rxk}TAYiH<
zV*HUv;z5w0JV1aEY^l~J{-^xH5tPP^8*skp=d-03Tk~2`)$VNH;C19M>t_SRfg@$K
zuOVnbx(Y*Lt_Dz#t-S1Hv5SAQbujMCCh+~WCwyAk&84gc6%t5!GLeZD%2C7pW)CcG
znUxcH{q89$<g>IBz>}ZdfgCq~1O>xSz3ik>1f{lm5y`j<!v-v<8^j-aEmq5hDHr3G
zZfLR%{fzh(_U8PBjkc(67_mZzLgQ<Xti&^wG|`UjLS{X$B?RNx)LZaQ#$vfFOh~I+
z%K|7CMgo<i3&O&_Jmg&)_dQ3)2w}g8O(=Z)24k`|=ZpjE+<gxgV1dIor~xX*dH1n_
z%aFu6VDXH8lIpGdx&_in85j)#68Pc4<)B<pu_}v%{TqZBEt8_&Te)JyhKOk3Rk>j#
zp9;6TKN{*Rm3ZIRC+1^yee!4`fF7<;cxc(2*dWt^-vW3{t-U7qz4gMMw^L+zUxaEq
z42N5FP{_*LlwEIcH%4e$Yy)(SZ`(t|5r<^lp0J|jAGth~8xMEQ#m11ATWix*KV^2|
zJsbQr5q*J<wP=(&7NSa^J`5P!e9K43u$tYC8<NOcpe^(DQs0)tAhLaji|F-f^W_k^
zZu8qgoj$pSQVeI)NFRs6j18icOQb(wkpIOks?Pwz%6dN(PXB*a5J)bk5HrN{;9_Fi
zl4s05`&57O-c-Yl0s1|yrm=(V%X#@ez+qG*X3?!pr~H}Y2P^p*WZ-|)N|!~hOHgn#
zzueA!YEHe%`k3qC^T-B|)W_Wbw$lt#bKIOjm*oCIO}8YgaHxd8`i`#j=DoPKS*|h~
zR)_{tzUoN7_HDjs2@@rQeuz=}YzTRa+3{3^q|ar~n|>yh5pc#)sAZFNByPZ*{K)Jl
zbDgs>i>aS!-8XQ^k9ne?Dkt1ziN=nGJ^?G3NZJz~1OBNc_@&9UR+9m`q%|TdbFohB
zyIgvpWl(+p5lSY?acTDEL_#HIbz8-K0JwL;IFpR+0$}E$v`;uk+tt~*<coK4N&59e
z#>5#9M*J$Q0l=x6_xl}uAHQhW9UUu~cHYRN;xRs`Hkcy}RJm2i^#~gh9O7F$3(rM1
zf&E|!e&PtfRV;RnJkQIjf0@2?%WGs$y_?@N1QMPWDEgYGTA>24EcZ*x8};P0#Hj}D
z8xGFL*L!vnQ;RZ-=zor#EnLbHR<>5d3}L+p+S)Z0!KH`PH%XQg>@j_bTQ9e5okcgi
zu=NN<d>w<|PjDDrPnHUt^)s+OpEh)?9JDGU0BvCfRjug9_y{aP#vTJ|8LZG?4)n$A
zS$EyxE3jC*8<ap&x~!D1p>o*IG?IBTOk8^w?dDH{qu<^+7!{~?2B$~T{UgYE|NM8L
zE8NKd-I@qX*BE=TB?QVnD#$b~)~SiU!&S<03^aP>i+x$FQ<6!%l=@0Cn*?NJcRF5H
zpLWRySbVl3{_RP#gF3O&lmKE#ozXopc11yuOgGoV;=|mUH@)$okXdK9Zy9e+NJ?os
zkro%+7Mqo3(RR=v`d(K$x&}G%Y|hg^V{l1K4cs$d%Lh3T3xU87mt+;0ncO0$GCFgD
z6Amd8^9H4c<KdrL&#yvOrj++d{p<*YX5Eq9vhHcw&BuHt#hJG{UjxQRj2LvJF_K*d
z_IC}~SN!RAHJe72)rau$rM|7H4UY_wJzHPfKU<#2NL-1@+ix@76?siiTahuBlEybl
ze;VdAdFK}umR2}dyv9^L$@rR}xu3JOHn_^DV0f*T_w2TL2-()OXudvs{cX&Xy|RYt
zy0b;{>m3}8GC{+^dP{*#pQMyh!Owy%v)AUgf-t-Js!53%7Vf@gip*EKN=vwbm;OjE
zycFGWw@T3O8OTHCOY;`RdJw%UayY3mBgn9MAi{2^2W=VQt>4VJU&ZI9?Y)HF9>>Od
z-0c+*cGYEi;W%SSG>bAK!+bB$qoM8jK-``q2pVW$JzS(A|KNGEm#;arKM4y-dEo1C
zy67mwt=S~u8g~i<gff|DE5<`Rsm=BzAJ(3&w!dH!O%sf2cM+-=I3PT|UEUvscb*sn
znfV03x+1;Y1uR#9h`%TBhjxGsAZB#vvJ)aZsap2-V{E{$(FPGi8+LtY>J}!f?FC|u
zw|6hrLX?RJ8{(4vM<pdds4=OCj0=Je`S+Ck6RL<)t0VyGtcvso8ZEro(0MlEdr?v0
zAX0i%EJ|>jmiS&Lo4eEF2?;<nF!U_#)oV#RYhoHa(5ZW+|4wcJWpPX%Z?0wlY-wFQ
zTNY5G^IzAThUOeE*{+?*xW6nX0m)%78An`J()Y3&`q@bbQ;ii)eI)czu&Q&CxrMVE
zjrx2-hGj~Ykvg=;V%v%v%#~mlYMT8#fw|(K_ac<jwSD~FRmEvEBpg#ye^w?!R^9O!
zL^dHt+S}r4Ho|mo#H|TrU8pHyA9z$3_)a@ArF1icrH?b}C?#EX{*F1)DjSMvsmFxN
zyEjm_KW`LewJ^c@Mq@;+Sp3q-c<CCBO^6H&0-~5C0_`8<eiRH#pQXVb(;@Q~YexzM
zdB+b+#Px_k=oe=6z#Zh0Z(T=~gF}i_(Z+kPoC3a?OU|&8=MF8mzhjq1U?Yf}ojRJf
zATuK@I1hzDVlT);=)__MO2D@-+Jt5#w1N9{R*cwheMxP!&9kuoC>_?*+;-OyOnsVg
zOL@T02~6Ylt;C<e@V|xhhj;*re|W&8iTaQ4LPF-zp&Cqh$M922^ddYEEzzj>BI&s)
z-XT$D=H!tnLyzF#hO?2w#W<i+v~o;Sfj<54ok9le{;42nadCb0k=En#a2g^|E!Osm
zw@zX_OJXw3+3xC>dEchrAV22EI7%QVNZovk8c~CER2Lvuz)>Z*r?zU(y}B#iQk*}a
z&N%3Lr`XgO<1d(5gB2;Y*|`(38B~*AMERv%vWh8q>bhcwR1T#wyy#1l@o{ULLzojf
zVCoYB?zM;(`cGJfWAewK44<XAY&1$RqvU~X;dEyfK3nIbYi6U%{I1>V%#fLBI{Z}E
z&h&?XB%%LiL@tfFN8U5xy*P3uJU7F69?`t!L)@6w_`@USMRJtjr1;Bos3fc*ox)he
zTpZJV?~9<vJ#&Ul7zStk>?NOmia2eBqKc2D+%Lm54RjN>(W4Rb%th`7N7Wxsjf3E=
zs~<y}OSyKwdzT<wg1km{1(KhIXykHUOqD037bXgVYTsYNh*I-9*KsdQJffE_+ruby
z<0S&(O>!$9^<HH=tA1J)Ecc8_wx9Cei1If7nHLAI49MZ+!Bd(cPwq%pU<ZX+*>mRs
zJN|leaq9iBRelzjGJrkLH(S*p*1SFA+qbN=Cwj@wgRTc27aeg|Pb>K<I!ksFNWV#F
zcZ&THk?Z$<7x}&4+eLaJ|Jm<U;qM8p9}-bWZ2l$6mDGsyL|sHR=r?U%MBLV~*QT`H
z;S1(|jgGOl!osgcGcf)^jys%qk11hc;ea7vmRIa-%3bf^K%2`cTP%xwvTt5Mq`Ai0
z&*xT$JKP{LEWuD8o;&%Dj40~+6_`KW=uTA}P4c}SQSJ~Yw#~BqGj`?h*ud-jxB$ce
zOK$_k3t7;LP&TOo1Gi_KToY;FnH18q{z>Vd(^?Oq+=}&Yq33M!ijjp2e(w9_k|28`
z=9gNf9X2jk)zSNI!#hf*!$ywBxLDb=7(PK&gxx3Z3(IJhO^m}tGD3H3d6f->$p~R*
zO3MsFh3Jr(##j4Sl=p;VeDj#!vl3oy>J!=H>jQm8xEbngEEux+e+YGZ-?@~AMfOA!
z^U#S?>8p7lpZ=+bX9k8@i%91T>!0n&6Y^~!UARt$-&Rv|+czj`uAW;Ptf{%RU8IB;
zhYTD1PEpOKX{+F<(!KJQZ$#=s$(eg&`uT?YATmrr_UL<aWo{*6{i74ECN^`xKN7qD
zF2Dn(TIcsv&zAQ<{*#5~_+VHen+!>4_e*XJ#%Y;PtmNVsA8h6NGI+*`H>Kl(_M&ra
z5!bupHvs?bNbrw1G{D_=nE@@)-tMre!GActDnkH?n}011{jSTDeI;H0!asriU_Fls
zMJ-V)Yn4jahW*@NG!C+wM##YD!i+fUty8D##rd;L3<#lYe}_=ELXq(QjE4AQYCwCF
zDoI5i2a?5zFpf}SjuQ5o%sm~wEo-7ehbe>va}4_q`L#3fMQSWDQR7xncXDt%{<E(P
zl4k%=%K}=Nu>btT2gq;4F+;epF@vg7-HW@wOyE4Mmui=P;Ab;*wG)sWRk%wY!cL40
zNhXHyFHiY&sI5@3DpQ&M;TQhDvQ6NZs`CW_VZSo~$juu2;THQK9{`E{KHlTRAZ*L4
zugjl;HN+TYfnEWCvMb~<$v@HM|GH3UelL`~A&B~a04Siu0xZij6f_8urX{sL4XblJ
ziJp$l<3|+yI9?*;aHy1xS<#8db#L9|+*w0p^N0WKOa7TA@or$=VxAC@{`&)oVdCOc
zexp)?-c^Y`G{hWTbW{nw-rv0WODe+%0Y%WMN6i0du>Y&11DKimxZfF>(*%e4e@40Z
zF)A|9AOu(T_vQ^Em8PnXP)L1D9%4IMXw3ZY+59i>lYXcE@;wp5|Jh3qP@f|K{Lpxr
zzjjHEEbc4&RrO7zAgAaV>^I1NP(J_dw=qG0VL?+Fqx(0ZGoBDsbPxtCRun);J47>@
z!vs9+bc`|Ye|f-vUrJI09=4x8@=iPl8+WD|s%+id(=V?iGOTnwTr60{%!>5a(*ga~
zwoi>8df(C|2IRb#mybE${=4DYAck~AY{OSY{dJ(_S_>1?X0!_C|KF5&Z|w}{9pOZY
zvPj|<Q*OtW&{qvEJ^yZ%0^5L<0{!dbSQ_(BVd(VZfSe|{7qJp1Id`Uj=g!|H0nOfe
z{v#~-7Zu81U#TL$a(<=b#xbFs8YaAcq01POFJlJJB6M{CwBs2#r_hJsRruRnXxI>*
z%+KhIN&Z>cC^<TvQ<=yA9?}2ye$w>!@?RY)tyIgdehKba&W+U4<F1?dfENKLl1VBT
z$`HTI{vJSDO~t}-KB<RatVSkB6^r`MEngvDRQ@O!5{hDE$PbUiye)}S#w5iHM#l<t
z#&*IkfsuDN*(b)4OIc>%N?lw;fgN@J)ToN*DE$uVl<X~UwFm!J5Ez<Q0}_?;C+N`1
z{-rB`Cj0FE(rWPY{<k>V%1=cOmc6Jaum0I+@1Iw#t|99ptdWS;uNm1D+MDI7Gok4i
zau}4?_y$Px<9juK$-?8<nIL;bE=!cFpG|)dITr1Wc)sn7(kC_g^6!=Y-`?k7|9(tt
zdkcS^{%Jrxc%e%{gh31G647^)5DHgg@jd#E5#n9eT)7EUYomZX^%-}wBY96`A2;p)
zJZt>7kybx$cW>S+f4W5H(R|Fnf(K7Hy{d4@w;pWekPb`86EMu~zvceB#g~KMo+Q9&
z{4a>=zb@^f{&r2>yry_mD$S_<_#mxAtL?{seL9DY;E6DM6t*RTiKRR)QaE5+qQ^oj
zm;!&H>)Do42GVr?d?v5F1Fphj0{gmk2jK{5Dv3Y!|M|b&Q$AUgdC<3bT%f@JY8$5e
zw?z^ON&*6b>jXa;@{AYKkg89i=4{W$<HEJJ5aOo6Pk_#0Ffw+hi6Ig}xTDsehIQ}7
zGig+S4p~O`n*}tE81+`h`O`yo>dz?xZwDMGkJqX^4^AhJ746+zu*lr))~K`|MF~K{
zf^~Y%x;AO%T)!!c24ZB6E+{cPGs{<E5F~75UYkOUM_Kn7W~=%ge&u`@ML!2*z`Qrw
z(&$`KJ59a3EihpQx*na_+r4GcRp&K>x4+x$^*r65cp-B(<iSovm=u0Bzf*{nvCd9^
zeXUg)u7GSGeG0odybZYCt1|j3xc6nn-B&tr`R-6-7m(~LJtoLY3J4@{y*$KWKe&M^
z15&36roOqI8xKx-p*5UZ9@ox$hLroN?+Rf(EqXkSV>%za=hp@)FG`Q{3yixn&bpc^
z^&7WxjCQgw_{N^eFhsWRc*s5y7?^<q;CP*RBRBy6bby61xA*JVq$Wo_8qVv!FLT`i
zWSH;-d}~0FP`f;MacXaP4RAB`t4$AA-_(mON!Ux<5wE9)yUH?Ig6S9o!(Hoj%1jUx
zlm+yWBKWr3P9HK!86u=C@qvY<(EE1PD$6tN%5cD;@qQz}vU_$ueX|Ik^QmY;QDnP4
zblfkn2d_Y6mHfokEX?Z}1#V@68JXM!#?Zc77QYtusrdlxpR|3F16k*aj{CCu%}L~l
zY-E&E(6vDRM@51Opp#WGI;yEYuRQ)?7l2>AXl6+L+`WwUM-rUhE<!~MW70OrDLeJ)
zI#J$A3`6fIQKp&oaEpFF`#S-1r&p1+W3-KQDyI)OP34KX*#drxWQGa+Oso&T5M!s!
z@fqS3?vk~^6{%k=#T600pvZh<WDf^=Ocs039)|iRF!3z;={wMdW?-xi9Fp|Wjhztz
zLZ@LG?`B+*d8@0G=Ymwy-BJ`I>iy~ev<u<A?oQcqvFhtA0sUrtNvzIyhKj?1=7jR6
zFs<&lWYjYm*QO0jwOqP=qwDEwQr#KXJYrlgQyVb4b_w=e;cB2S2*Yj7?xCO$;~^cf
z|Clcc#q|ykK=>!CzoYr&V4<|)^>P)U52PSQ%subPIQo2nWp%5CcCElVL6SwG;Auo)
zsWU=!?JZZcJS(Zf<Ep`Sd+oWs(A;TgkimWVl23-r?eWPQ{{6RS-Br)i=!W4Hw<Wll
zl?h$+Y#B~w!tTV9PG)ibPFLSi2qMs6*HlkkX921NTqB4(8=P8t62bu-J>cNB%85<t
z>8~&TWpEW1dsi8rY|olgChU6rBzqD4VYeCqmWive)APUW8bGRa&-UH!iN0DV$!>j#
zO~}aiX|fo@^d&Hf?pY6(XOhReWq6ODHs8}Z>`o9JcDV;kREz&7=J_vns(1^qO~jH!
zX2!7RLI=AjU=bna2vUp-4gVEQwdBpwWRbM+1es<G$e5>5i`Xa*xZO$l^C~`TB@|26
z5jVEUfR>`O9LE7hj5rA)^nd$G7gNAHfc1(0cPcB9R(n>(ChCfD0706p!w=|x4Rq8}
z8f4P6NYd`y)Kol>fM{?XDud!rjvs~@`%}VDA%n5OsoQ#Aam9x12&4cx6?j%$*w&uH
zzdD*SxZ<Hh--mfhfT%6KQKR3xIP5h3W62?vCmMdrX4_eNB5&3G!LEO-nf0Y>Hh*PU
z4bSm@b5Sodjo$71lQ-J~@8&)ohma9$@2h=~fn19+)8JY_SAGt-Aa5DPjKmD>KY8(e
zBQuk`uBiXuFBPe4)sL)s-_Q>2dmp>8Q6((d6s!gF&VSss4MouF)zfj!WAC2{M@9SG
z0iDog7^IUd4(jpvuLerR`%tMoCv1-vd$%+%{5~lZg1W<a<UeU-_B$&59qgNA0w)3i
z-tkLVIzY;28ukEeV}XvX3(9KuKZGWl(Wz`7tBt;rDlppD1V{NCj~5z^Q^?dIe%k!S
zcXbNxXFQk|@DFdjJG8@n0EpMdHzN~!ix9k%SVH2`FRIPBP^-quLuk5*?1)j&Eu+;U
zt{vm<Q~G4rHz+{~?{w%Qar6_Ir*A&di|j=^-)mkC(^{Sj(Rmqg7M@feZ_U^tN&wIt
zfRE}^`=yu?sk;V;>tA!|V(fw0aqGgD>HNXKJL8uNOa*ZbPUET?E4cbw)VP~Cn70Bn
zOxaHPSi+GJ+Iqp(j~(uo-N7|GuA>{nZg$&do;nqvOh{8=Uyye?Jwy)K;bU_mo=NrG
zJ<;#~p%Ds^#j8JlQ^oK9#n?;M7Jb%Ux~+q0)n{jX{&|mV)FI{)gFod45on7raWw8K
z70HCRlkKqSWsG3vHWe86rY0S3R=FN=MKYo0`CRpr@gQu(KcL0;EwM9VzNK}Cm0EYR
zb`Nk<F23=rzg{#CJ&Ai&)QIW9lkEOKlTRNM*nL##JYuPqb=js8x0j#s=pX`}$F(<w
z2nf*)sN>@Br7FCHdIa*VrgNlisP7KN|H}^izg-GyQ39fMRe;hJ)njHc;`-1Vdb}A3
zF9lQRWaej}co-Ro@}{o#kPMK|V8A!!xKNNy^Hmb&2_x>BqqVyK3I~fYIHNy|z0$X8
zR`wso5@_~&lkFvVRQJT6fNm&nkUG|q+1ew|-{MO%%HBV=mh2<}(tg38>C29#cBEg7
zY1y1#I^sO`?XZH%BCIyb`j@afxx?x1q`Ct1T?J*J6msSS?@YVL1iK9P(Ug8g;ad94
zPJ~I9>y#^t0@YyN5dzV}0#X01%tqO=KtpYqKrpC=O{dMAC9w<F-AHMiiPTw=8!QRT
zpn2~(P%7#sm!G)}HGh!c19#XC)CDXp{IKb448LOlpO36A_2lC-P3L;X)6M~@%LS|E
z1!SA1OpM@nx1VbN)$mL&I5ll$%ERHYb8FpBRKZhJd&)EaL@lben|x%S4KBs^B8~tl
z$bpy{vI6}`h(6GKTQ?wAgjwB8TPGj_w-ELJmA}ieP#P8GaD?~NbC&P#ggj`M;nzgA
zXxh0cZ#8hF$}&Sn2v$;hO-Z0d3exX6evV5gid;I}<+0(IjQ%JavA3F5P5(y*7ntri
zz~r(KfjT)~XuQOT)cNKDbTvWZo7{mk*GYYK-9Z;4#u&>3P|X`whQ~x~^%f?_AN_!q
zf*LbTKB|}k3O!jqU5r9g9o%dJ(jc4Z?2b3=>vqd8KT@>u7#cl$rPUywVqm}Zm@|<3
zD5tN6@r9gwqk*tsDk;O)!&c#^w`r9JyLo!-7)0I{TVR#@*{A&r(Rnszlt69KsFOWO
z`-$-*<+72Y==3R(=F@(!-GD;+5)1S-BahOGkNXr0HP%(SQw+%-i@`hc;Dc`3NK4tv
zaMRnl?*|uuH&T@>xQ~FuUw1OtLJV#NKZ+$O`cC-0BlO!F2}y0zIzRrqVYNGX{%CWV
z==I>BiuBO}__%&T>%!;hIBiVDHa=@r@*0@$?wYUCX<f7Dn$<7Mr}j#R-LcaO=dUc#
z$ql3G)#X^dKx9IdvLE)q5Nn<!H8H(RM_+c^B?+IY(>H-{dn-Sd&`lS|2(!r*JdQny
zh0tR=MX9$7zvUx_!^ZwFT@YW{CIGUTM?oBp5r$RXmX-XwOK*vUhkakf^4^wVvd&^$
z3=(jY=-z5}+!~mCi`Qi5pTd&$%|6KM0)LD&hu@|Yz$J$f4zF`!><4?kB)z~DJ$`~d
zbd}vKewo!H0D)<`Q}ed;?LzJ74>x#f2v<-BYWN>KAYOkhEup@Pu8zdk%G)W(Lua*P
z4#!h!V;1r`2C}$|ue&bu_xLc1#VMvzt7$>%(Z!O(Js?n1)q`1;;xwbtxec&teDm{|
z*G_Yi%IKJTS)T3LbUWQj#!i_)BfYk1AX>*98!)HwoIEY~>CT8We^8a-ii5tKj=whN
zF#hTxQo*W2797x=IOY+Ar&o5jB|d9uygkS-54_qQ3B0Y_doQ+fz3{g%d!N;Q2}}NO
zsK|x}FpO###2uN+dKbmnB$%hSiP?JvdC1NrF-dIdY^d<fmbbs&VyyU0B2Mwv>f(i#
zB&r?Y^qmvkkNrLMVTHue9~`d}*q?USM~T12xUUcY-vFM!aSlmC<4tl*4vF7jk~r1P
z4Fc_~SF0rDtmRand&N}ahmf~5wmlP31M1ty38_A=$nJt~HT-tb@-<CoISiOI%rOKu
z;BsnI!f%~sHTw%_0I|_&J=e=0M*8?P0UIqfO*#=;SGrH9{Wf#KqWxMmvO&Lkhh)yW
zeWsqa{3T@&ntAGTs})+eek;5&_g1TKqURa+g~@EEj{bDp29L|ZOUl<kFJNW?c^;hj
ztO!a^pPeA0657f!yp}T2vL{Cidquv)mP~3E;C1(e;GRYE^3cx1dy_D*;T42{U&;bX
z4)i5f#tsvo`SiH|_sRv}IPHt(Fim@As!Agwzbn5U^+fhNqN|@;>Th~zj3ALF#35)Q
z*}q#iqZs0>X2!$@HN9oiy{YY!ReSU4a;t$Qrt3y@8-Q~ZNm@QQpq42f#ip=y!b>~J
zzWo_gMML*s%!z{u=zxR^>ii{v)P7gMjC*)%1UvIhWyYnrwc|aQ8;R|X5q@)&{lu%z
z{>z6kr*<&idLmSkiuHA|Gk*|A>k4)j`1R6wt+Op3pMh(I+L(!7Lw)#Wds<OAxVfmn
z>@yP`n_!b`l>T$XkWrAr#k(knH&I5d>`5WKk{Iz>7y;b~e|8HNXq}Z+5gILbmp!n2
zF+u{DHuAp?Oo{%TQRrqD67UfYd(*{=&gZr8xe~R~W-pCPl*d-btAS#SuC<BWrKs#4
zgt7j{Zvg1$#`ogD5zBgQQ&KPkDAC<_w)-Nvl(ro4-z`re+UMZ&!lq_YoQcyP<4}>g
z=(^)b8P^`zJHO88I!AR%Q*Fgn-fbyYI3VQ93ehroCHa(!=dlX@=R~;#rHtf9)w#Hs
z_FgmM`txO4b4hh9*6^7u*CWH7T^j3+8N}VvQ$)vz$VGlFMdev*ASd<v2grR?9JITi
zm096GBVGORv9Ryaub#}UO;(dw5k6uA!%?2gz<qVcQo#LmWAh&;gA3k(sDMxXA79k;
zzOhnFR-C+J(-8jgf}(LgrLhq@a)?LB+lPV#BSwbIQyze~jQFIY1X){DLuKG+S~%wG
zJ&g~eH{jr~jX|8|=nad&p-=TuzD?t{EJ0%y_B;NxXaeP@7$80T%{CozZOY@_yF9-u
z%AuT6L#Tv?$WBS`blnaP&B@rrpv~xXgT<+)k)!YB`7oK8O&d23@3#Do>*`eCw(c{6
zk^P|o1Lf4DxDnlzr1ESGtrjs=vU5?<=7L(6rMvHRSF2(vL?O3JytDOR;h2z%J16mg
zUy{RC3fZmapX2nslI7Z%pOh6{OhU&hJLm1v-&aXMjDWHDmPjy)lh#(#N##hv_%kT$
z^Ye)fd3P9-XYB$mGKjqPeFZ*wY~8>O8<<rUCvgXTU|5&q<mg?Wp9v}dA#${27ah@q
z;f<5eLz@LE{4HUwvAzt}xJak~neYGfVhq9X5_Z5q^;^9_sP|T;<<@$-35JDYfEs~Q
z8*6KoTf$i8?Aw@GNitwOy(5dulyOBDDM7uqfeehDfw@n~8*nNt2Ff4Grq^?-#!U!b
zyehF%@0r?*f3HB%LT7PMlIqwd_QH{z@yYyQ6E!`<5UCPZ>5KFCo2yq8v(@yft`+q)
zJ3)1A=P|Rr!|t3q{Ec(6r59~3w&S3+UE{;GbX%!H+WIlZHXFF|h#V$pzEpNkbSAh9
zYqLqii-*y&4j0sD<oYE*udf2(lTEIaMnveTPnp!iKyL6OcZ$>bLe1vpkf-mcN8$D)
zl;wjaiR_~+zL&%6AKy)BeNOVASa<@~F82PWLz$sEMO)drC_Ivn+~u=BbWnDSJ}-I)
z0%?Wo{A=)x$1%AvAMSBD6^hx01heoJ1(g5t_D^DfEbji)yOs7r{Q91ew5I*9PyBxj
ze2NRQxyFoIVC%bT?GnGWcL6Fy{^ipMZb=ACMcmD*X^Hz;Fa$M34g~7F)RfS`RMP4l
zXzU~e=ZriOKJ>4p3cRgqR(3>8f5blamBp6QjjktsQXf;v=g9L&mpQ6zA+4DExZB7r
z^3-)wx{#G`ah3ta`?ScS<zYx{u}vs6upU~a>udc=)32N1sH5`E<ZbE}8uR{s$xylG
z8#!GoIQ*`cOXuqFR42c=0IU534Ao#k#JD|f?@Z#%4Q|VBZg0f*Tk^A)9@fz>|0t|V
z7L5$KzRvEXr9&sMaIaJtJ|Bn%YXtZC1h)UYtF5z(*J>!cUJ)U{tzhWm{nt{YFA{He
za(aEcns!JTxBvc%D!+rPbD6#CJ=9Ce(q)OM9VmMI>)-#MYxv0vq+9z$lvxQ4ufppq
zRjO_9D@Mi&L5a>CVtjfkVRGC%$c9O?SE|m_8PZRJ9IeM4b!T6OY$}GUHskuo3`<K2
zbc5zjM}GbMn3UUsG=72Tf61bm&T7xYVFNE(^7}$nbW84Ad^%ErJ<tbMKWdZ<HFfOZ
zd*Oe(*}i*PXe)kcbg{mXb#y`Irgz6kGobYKq2)oAT<gN_-fbx@UGq*whx{p@0rBSz
zO9b=Y^aqN-Yxi`#@@HD-oVhG0l?ZilzlN0->?oj%VSM(z%czyS*8XBWlOdPGf&Iey
zY;nd;ak3qyg0jO-UCX<{?8}i1;a~gW=JT5x%zkaf(;Pzl@6?^AH5%QEmngcSCI~r)
zXod6_w#((r#*Y5aX^+TxgZtERD}L4d%gBEFLQqVCeW;bYqAsZB-7iFrE&r<Bd(B0o
zGu~o+k@4C8GT;P3s$ZX9pBBEc;BPFfu^f9fbJ_NDHfV?N@9~}vHiqfP>Q|KX4692l
zdE$WAb18AuA)Ra*4i{N)&eUg>kIm+Sqg$ezGaZ@_36OO7`^?oX7mMb+Pp;b9fHQi8
zpgog3C6o>gq)(;}c+>VJhV4u9Yu4AVH>%-Rjkju@ZNEB8${NznZp%9O8EXaSH<B8$
zP8{!(z!{kKb45F(xOV`5_9|U&uz%D54}9!1d}u|Y3@;$)#H`+RUcH!8E%Rs-9FRNp
z5&NaDnRSU%8(HPB`@P6#!*c}w^EH>jIQZ%3d+$odR*$XcMvMc&WI{H`-+=iViAL3T
z8A1!ViX%-BJgewin@86WSch4EFZ%8ROP#7}TDplY(jZ#PPK9=!w7u7dJHypwa(pU>
zkRgKa{enxR{rPnsr&sbr*|#!w<8v@kI<FnxQXs6SFK2Ztm>(^FVSaQ0FOBRK`m70F
z&s#npI4Lm9?}ukKP9C?`CfW2|Qz1i$n2G<j15&t=;UBtu^c;<3MW*cUDoR)$%F#+V
zx7v5US4<Q7lK+2ntAAZsV^U#FR)3ooBrjvqxy<max{6s-XQ)HxwzP3*j!$C~HN+kX
zX2D)kyIOHOb9Bqfej#SBnNjcP$(G&O&Csa-ti(<<?VHuc^S%!vj|5f4y_UN^-~9BS
z>aU9_eAh+Z$f}WKNT~%=6j6k}cdFoczSogl^0jcku4WpXu^+#TNHG%i(X|iNx9#)~
z;I8!4F|WTr%tmZnL5FaD9vtw4Gp8yK%pl%nuD3O@m*xir5?dCtrxp?oqIMs@z?BT1
zA(Bf=%o=}t@Ia2Y$$FhSdhxoBo=QboEAjJ{u}{)Hg{RqDjqLq883vt7JrrbBQr=go
zeRltsF`;h&Y)@4{F#T*gz6jLu+cuviGSYo_2cA#Ze~C#zR2(q0n%RuEUt|Mi3$P}-
zh4S37Cf~s0IFL+;aHpr-91(WX9(M|Xic@MLk?xFdwfOBdQ?)2B=7eOfHvg}_u05RT
zzKx?~4k_f35bfn@CZo{EA)!oWj$;dp*eJ&&=Nz&prKg0Dr-Tb(4l|O|Fx91OQXVfG
zLVL3}=V+Mb^!_~0`^VDz+TXux_vib$@B8z)@89*iu5TT-$f*X`V1EW3v^*s#5|&Fs
z&0KfOocQl7(eW>|g6KUcd6|0wJG$X-V8!PJT&net=R$3D)@s#;Bk@;Alo*$M*qUAb
z$3`&Z^o<~g2(#+80kj=&<7!Gb1&uU&a*WYT<{erM*NqsyqQ|-%ShHRaxa&7vt$&V2
z`yf#+=#Z-N{#aa-!R19q-mLM(`|hPm-1MQ9SF<)nr>f#TRmVJHtNT9`k@$13PM=`h
zA-C%LQcn(;nYMp!+4b$Ct<mbUXN-jSAS*L!V>BYFIG));tJ9IDH*A_}nND6Yz)d$s
zdlKrWxF~XKwW(U%w1G@C!5)W;iT!Zu-J|K_-<$0B;J**H{V_X`s;6E>zW$zHR_}h{
z_~Ezv6tiw8tcA4^sFUZyIUIu=;&>*5ly!H>;46PLacx|o{)o4y@OL^l?%O1HJ&b!p
zb1<?DQrgXZ>&6^VO~^tC3Z0OMoJ9f7Fe<c0t*h<%!+y61Q6_V@Lg>ibN(FK|_eLg)
z26c6Y94Hy-hb>^NsG~!bd2Qw8%3B)eab~4UJFin{&L#&x#?E-i0AE8J4jc{+!V^^;
zzo<^YD$M<`1gl}r_#o_#Xhq>C*P(;6J`&IXeotYB@|0E=wbAyM?(1Ezr`Z0I`XQSg
zs(21%gdopRawU$#QK7cK!quBe<fpQ^wbT;Q@zcCZJs|LO5aX9<JcCq&Q_h-foy$;m
z5uQaxAW$<-pTn{lpuvHbN2Y4j^=pns>*@`@VkzTGywuLd`=Ud>Y?B6wPNs27vvz4u
zG+K0Q^@Jr9G6pNno2Z^MN!3tU8zFZNvqx)JTy&!rOmf1{9=hnUDK+c-#t%)yh;jY&
zjg}$J9fg8?=}L?Agx27gA)V?j94{5=<?nHSDyAVP;keGEJX^4U*ZkZ@5aIPf7jSNN
zoLLBwXq=)YZfx1nvs8Z5+MFe`|0z`G7;j-(yzG5B=Z|)S3WaGBUCH&<p_9*7+r{v2
zBD=3J^on3joBzhV@_7@M0-QMLdid)prq3X}`ZvK?ebzwYF(K17i;73QRix*pD&w8I
z7Sq`%nH`6+PN#yS=_f2+1~)*12Nm^FnTA{7C^KXJo_7;<h1tD_+%s!O+?M6>++@w7
zuS}hNUGl1218N#`Oq-t5hCkdg?wc0qu5vkQ1~aFoW|BSRAt^Y$Oo{7Di1AAJ8aa%+
zZ;INqiz|}p9ZU19TY}gHnf{B)P!G{XKR4@`m=Xs_>e$yzjK03M1uz<lgH)NS#a*MU
z4lAr#f;IW7Qr&0RU=s{_Bw<)AxWX8ny_Z)~LcW-#?AoV5mSUW3=d9DNex@WP&PSD9
zvl9@){WZIvus?-01<ue3+>G-)rH~ihPh=F<i6`a$|8DjdPM;%yi4?CQoEH7Cy$FPe
za9xytY;5d1PN|cIw+H|-U=Lgi91yW=6G@la;I{_Vt_8L~IW?wn=Hg>@XUlKjHf{o4
z{avCT7|m-pQVZgA&v_X6A{9WOG)=gIrQq!MI8jfzlDU+hAt63pT8l@hkIFcPG_C~s
zQGj<YKanO-gtQ4s-#R0k<!5J8))yN*n_UbsVmI>&y}s}#c!A;7=H`zQ=O=!zwE1`i
z?3{g%bSl(-NJ<>uET7h5w-JuV^cauyO+2_dh%%4zU^PJmLiOQjiqbEjVgZjv+v2;v
zaHq5$uWdC#td@{~OaG6G>$Fx&N7}-2<bWIhR45K5a?X^D`RCH0b}AV%8HinbdeX>m
z;k87x>p2z4&)|a83tgjd2|#$0!ywoUs~E&bQpU=fBFqT?l&{Cs04{Yx95ZyB+T)hH
ztP1TS%Mu!~X#u8fxj%qN>OBy8D|xBDGI9QsS4W(zd(dNpI_HnUO#g`AUhLc!`~4w6
zmdDrUh?I*7+!AI0!8%Xa`v%RItZq`Z>*Zc+A>$uHZIyh1MiPPT)k@YWsSw+D-cb3W
ze=+|+gzdd+zy`bH%KrwdmNl1yB$%URmd_tMMB1HHdI14s=;~oZ{q43)3zrSuLtJXE
zufiNVZx6<Yc0cXcgemkVm-ewf;dVMy(jABcG;4f*l_1Zq?kVH%K{oW-c^+qB4OmTP
zGG9v_^FbhZhPUxgVD;r|Zqk;M>6}^$iMLm3T)i(}9@tm%7H+TWX73acAmt!D$?Al5
zlLzW$VdC!Ojq|!uP_zu-D8aApN&=sf{18jGN%V=ZcWdxw=8T;!1>?m2R3;(5`YZ3<
zpRt0C`%`fxY5wB@gQJm-ET8It-HEjNJ+TIT=I>)+_k%$8*>0)v+Z9^3V>b{hcF9Xc
zY9NG!c>I=Xq<0kaep31eMB4x+(!v#1+AT-GmX{8+^q%q70?kx{1B3Ddal45}hqcZn
zY$xN9(3WeohSlJDIAR)khxY@;@0r&t{=uht`(OV^1#r_FAj=tXW;*Ezhc&aW4=cb(
z^G5!KI^wqHghaF@Si4>h)XK{aWD)gpD`jNwTUp48i@678z51y_1+@jpjZ#uL!Cam?
z34hta4mA(wczJ5GNCyMoT@RUI`1G~-w9_|t(Iq%&)&gx(2>98YMOjr_c-{ODXAId4

literal 0
HcmV?d00001

diff --git a/docs/assets/deployment/hf-inference-endpoints-create-endpoint.png b/docs/assets/deployment/hf-inference-endpoints-create-endpoint.png
new file mode 100644
index 0000000000000000000000000000000000000000..e1b0d12d1caf01b1d1b07cc174fa6538164b8815
GIT binary patch
literal 362703
zcmbrl2UL?y_b(cxi3+HwfCvE*QL1!l35ay*9f44#6MBb;h=^20Kzi@JOO1+BrS}?I
z=%IufNV)NSzqaoG+;zWmPG&vKJhNxdJk$2xzdb{Qrn(~amAh8}006bJ(sOM9;OY<n
zK=$o21u-Y*p88h+;Mxm&IXO*bIXPBMcjzm7CmR4jDI&pu(j;Dy3GQS4?DF;ZucNAx
zSOrPDFI$kuNt0<&DZhSV`QkE{OP=BPW_dD2`BK&orI)l#iuAbUze`7w-p;?{=*Eo*
z0~nu2BYZIP^I$^2E^P3y^)!a`^}??t6%Q>n0Qv!@W-1OavATNePBCR%2#EDtCMkq9
z$vr2R9l+CpL-cJs0<=z&m_Hj6?hz{GRUdu23XsWRQ>X7G_q$HG3|P1y*NY}$RbhjI
zxFID!w^=7X%2KjbXf40E?V`2pdAnWMjt<xtc6I|`?FE7)QoU9Ht{RcQc~K-6K75HY
zLX#(C3TTOFZDoA+o?h08)Oj(*Gan?0<4*q#w=ambLt~QJ4R80Evr&FPj+o%n2tv$+
zmQ^IzyUD6|deW+Q?v_R|uA#IBqFg!j!_UeeNDE%EbOvae@Z762uzZzxUs%>AcINV`
z$rqt-Z+&y5#A3vLc3r`QEL~@Mmd4f-9mP=dxc53Gx3f8Z=!zSNpT$!8z2kFq)>pPv
zx*Epnj%~BPI5%-QtWLYr5M@5zR$l#*Vt%Z>ZG^Af`4=k-{lJ?)b>EX-{TcD`x}(g!
z$Ab}9fi=p!zn2wgX1i}y_ZsrBCPqA9BjE}vlajl0PtqDLsR6nt>3v`IcjUbv=@_Gf
z>=F};STd|E!GgyyQ|X5?!^DjqPQ`0o_ivF?6kB%n+*f{<_Mz)I4?|L2()2Z5Sj@kh
zh4wn~-6KDt_bW(pw+@f1=%qE?%@vLj?1pbbrmu}Cn8z4N+YWpV;JZx5ll5AJ`8Qx%
zW^Q42>MEgF;SC9}Tjt?)l5n<Hz6v9Y@5vh6vaVxkK3?utTqD00^FfAW6&!7ukmmbV
zr=Et@%I-z+CsG!<G|C^ceAr3`-A_@zahF+S6|l6iXH{3suQgS1brGb&zk@BF#zin#
z-s<44+2~08$!f_e@R{L7-7jia$Q)Db>vC|}z*DBvdoe4K(n|u_q5H306Nco!ikq4|
zU_v4v43Qs)hNI*0Ucs*1MVs#^7eSiLTq`f;08bYyT$yQhDGj_sd3?H|Hu{FSb%Z<L
z4GiqMW0s%GKDK&<zm+;HB(ftsr=a_}2`>TWf{ZGn`<WRT+d!wKJ6A1$pqZN&cO>7Y
z|5CSHuf9`uqpE7fkZ$4~v)=MY=2JV@F6zoVk{cQ{V~lOK?IuPx50UC#>eA{!Ju6Jk
zG^RK8qokaK;=_U8y|!+POmaV$mC0gO3<uN)TmX*{;F7M{(l6gnul#Vj_`!>z24t>~
zl9GahmVU&Lx_%=C-HZuba+=y7&!PC%#C|EPOy<{8?>j)|Jx|}$O;Rg!8Ygq9fp5&d
zq_FE`KV)vbr|dDmdjz_=>%sVid@bZx7TM<zJ#*<IvX|ezHAzq2gl65SdmX=M>q=sB
z$>6*5*MR2l9z&F7p|qFZ#9hDpL+0oP-OroVifK1Qmm|s8ZYc45ippb4eov;wdKkx{
z#8^X7{Jep!zMEwAvinW(SWi~5j~7a`XihZCFHJ99N|9&fLkEwTkXcK1QWCfOpWEhy
z*$FgXDwio8mbN4HzuETMOul7k-40CgL?kLA*^-8VX~j~@@JeDxPZhc0WBnLCt7Ai<
z)`6sIzB2lNa5^`Nfgj9^G&H~HTuDH5kk|ZO+y{4CNx;#N&b^hOGuuni=1NtZzBhc|
z_Pl-ZgXbAlc3M@u>lasw1=abtlh5yeRIYpI|1Cfu`HNbbs)_pCi#bIp*&SBUgOhlr
z2SJ~td%|zYFUO;mIr5_Or1Mtt)V0Mnd5xl-o_Rl{jMwSD>3*Xrtu-|;YEC)$8D3^M
z&rrMdk=89X8yXu98_N7-_m3lL7@6@LW1XO)gE6NqO9%4$4F7lj;pZx9YW*+zb$Auj
z${Li)pE<*4#Op5{_QvYRQDaS8#ama7Z*R4XX%r!JVe+}dWp?<wTgD(~^72IQ58kmS
z`k~oNMc+rSJMfGZjo1xsjQPqI4)Jc@I~Vq6YfB4$AN+BlRC%~=WYqyJLT{&U&obOv
zF<tp<C?)H5enMfriDTo0UwPro17~g&t8=z@^@%r1XNH!Mp(E|P&1D8v21y26hIxtS
z%#O?%>J94217_*o=^#^QQ-k^E^V7|G&5B+vUl>L|^jNJ48VJ$~Rtg|u1@3k*vfr(B
zdV%{gAOJn;+`?=}9H|_iY?_V-R1S{NjtmY%$`M7dNq|_D(0hR|HdVhCqh$9C)2kP(
z$gNbnSndV%T^FeniV{h4{5oINUxnzNdh}Dtp>BBNvsR_R=oI4VtZ({(zzPf9yNJq&
zDeLqew|H9~(>vh_eI@4Uua1-Nro2nxdeNBNkQ)4?R#f!~x8SU;_hg#Gfau^8i0y*I
zf~|$6K#ygHeEKh5)ejuAf_?6xNTWV6{Rw?#ebw^2<r&7?Mu%lr%eTw+riPrbPOoNk
zXHBX(W@?;0oWy3$YUEIJJ2g8cJA5;_C%Y$>7yT#9E0<TKx|BQhVq12zcE7njaxL=s
zy4UR)<;vsk<QXWiU>VqZHoh_#L)cke`@CJ(v3Wv<qOzd-@K9LeY;=0SXwd{2_$zGf
z=1$E}eh)Igw5_z;D{`A!?A`2x#(bA@m&`foIh)<%U1^p(EcPs^QWdpcQ^PyR9ghsM
zLBL>G25-h*>s%YUjm96hgj!5rX`8*+e7+r#6CwE!bR=-Nbm4TkiMGKMV1oB%k+xf1
zr==$Wi_l&EBg7`*tyN#o+RjqzW!Ecl<o9TNJC2tJ)-x{uyd-x?m2@_=F7)ObuFzfb
zRB~I2N%GUMuVKHb#c!xwrlvJz_D{F{Nw@Fd7i7U=aoC|AUK-vNX7CRDzA7?KURdK9
zXPBC?<feL_P2PhVfh*4sawZh!qZ?u}7;!q+1RhEhaILxRyq)r^wq0Rx8(s14YKx(L
z4`GB!et#(YaVSMe<Aqw8T44OGFLe)#9noh!hnx^4QKdVaV)=2}H+8%Vjx?xJYJydK
zN?tlBZ`Bu1=-6sVgZs^mck6OTH%Bp}wD~tiK8<)62CXU{lwxq3tw(B`L6<7bLl>Kd
zAYav|*wHu2Z%Fs-_ZY?>2#<1lIKR?Jgy{R}SAOBHxCQ@B)4z~{d&tRUYcL?=qP^QL
z<!)xYa3iAOfug(ryMw4{A&I<`k(>6DFDjF_ZBKfB*hnJZ2bQ!xhEN7?G(L8^g?O|}
ze|AUrc58aV)9oRr^65|0&K^5!JgJ9yPrmMlH=UV$pPTS2IJ`610?rhI&0eyWJ%2M1
zwstj=-kbl5k#6mm=BKs?mGbKHjvw&GpX&0Oriy&E4mzOE+Kah|AAL+Pfo!#TZa1Da
zE<<ONns{cv?sybe9VH1C)}U)*`^fuX7?&SDw-MB3-G;;MBSFYSy`OrY^d|K$$}5a=
z>kC}_JL=;nM9ZwoxlK<e&o{RRlUfp?^D^^UQ$u<;w1(@3EmumSf!wuRmHOnms9Ec;
z_R|GosbQ&-jc3qeghO4u)Aq&QF9c%hPEC3COi6Q~q+7uElP<}dK54iRoE%C$G~GrL
zjQX^*RT5DyZn~}YvSrrwv{#}|U2C$I(`zulEhHdyi+QUNWwpyaOMAk70+x*PUYz;9
zA6gzh6}|<l!@7-HbS{lh<XNc8L9Fzx40POex;|F1m-jF9hr`^l_6Cvms^ePox!kc@
zvA2OtPtAN=32%>{@AdqSr+r!2xBwEtj3tZ;6wVI5%@jZN*dHt$a35d+uX|J=TPHE>
z@G6*n>tb+rc7Hi)ztRQH;^G5^e%)}Z-u$$lzZMh0+$DjN&@iKE#U9>XNVsaiUg>S3
z`qg{If9tq{=?9YrbZsHfuXJ%Dd^U3T`tIk2@z$5YgZpO3&;~ea+kH>MAG{wt8~T;9
z5qO0K1bYBGs%|+GK)GS);yLRz(lZ;5$WBfCMUh6Q9-D`>Z5(h%T>EBNe<YBwPslBY
zx<gJ?r~5*{N$?R^{Wkw3-1s8*Vy|r=0Jo&J`4ZPCvNyFi(5~T6SnVi_&5OOA=>!&m
z(GUV{S)t}Ky-5d@VDcwfQZv?o{dGQoT@T>NV$(+nc`wjCp7&cXB;S97{U{MyHFu-T
zVhJAYI{HzWx((Ptki5P<R#<rHx*93#0$mm#AG_BXkC^YS?w$KmOo8BI9e*>4GckFu
zhq&IoVQI~h<~PGQIDpY4lyUiU&mj?Be6TT8ex;@c;3B3k1IS430?3Ie65<0QVft5E
zf#eZ@^soF&06@4sfb1V-)QRz*UmWrI!}E7c`sp2jlK6I$`1odB`e*5@Ls_K%Op|>h
z(g3nLa>~lYSjWoU#>U0N4(ds-H%Ej%04i4{BM$)J4#%H|L|Oa6KC%8OdtF0ML$wzY
zR#0a?3u~yQ4WF;G>z{f6Qoa(zq_d5u1*@;KlZ%Ihuk`)DN=OjXf3o@Sv;I}Y(^2}q
zp_(SE9Ms*0Rg~`u-;?{GE3B-nQtsBTB($F^{DYnNCVk(|)6-RgpWnyFhtEfd59)5q
zFCZ>1&i_P^Ur>;jSc2EX&&AWim)FIE{qIWtS<iDD4=Z<jS5JGW3+tbHEi9p4p3?X4
z|7qx7zrVlJ#@GJeExCC7qg%ud^8cam3-CSR|5x2aR;fR^5}NkDHcm#*?VX8ZMr;El
zASfUz^%ukcApN_^|6n!zH>=PSLE-;o{SVUrn^n)l#$68TOl;H>^zRA#2lIat|G_B5
z|EKT&F&2Lh^k2Eekp^9n;{VsIfv&Vv$k`Dm@}B*34P9bPTxNfMm&}QO9{n8?)0Y~%
zv3n(B0DufY`MIpFFUgK6rMbzkVHOcp_e%E;dA_Mz7hUErd~)C2Re3%1^4plq>mlj_
zic3^&WY4InuCpGwtUMEFu-`SGbNlGrW2!$1Mzp8;1ZeEdr{_s-S`WT)LA1}OPp7A+
z&mRU!rZ%`P{n)Cj6E3N!co?lmQ$i_0J4RE)tmGxBSyk}<I$ENB)Jt^|IuGB#tD#=U
zGHXgE-@Op8H9SzXDlaYm0k5863*>OwaJ$}q6IzK4J?GrxP}e7fZuA92B*5HvEaL)^
zZ9nT1V6De*dVBulp*q24P2>sjr#A~fU{{=JdzTRMB_$;}yF#HG!~*$*g}T<$&PVi-
zFn|B%X-HNXB&aos6|+!x+P2ERka0GP`%!!J(h>?9iP(XwAz~}i`3HlMJ16&n_GEss
zQxjLSZMuRzQGtFZ+?;`$oooDF4Py8W+BZkDyAZh}@HEzD4r{rYxj}Mt<wWyH6^&|c
z2;4b6sU4EL$9p;GF)$Kts=i8bF3Q}R<o-T4EX#iZKZ|t2Ty~a(w`22zHBEr{kpVjt
z%`*4i3NjYGkcHhQNIt*6%D<wSWQYkz<!<=I-Q$2PXSvt=L6|U;?<#)p8CIiXVc2+H
zg7r{k{~0&oeD=@~eX=%tSShf&=Nwz$c)G{O#h;KgF#E1CRbtO`VY7AAuh3ftB_k{u
z*I?cADTUz9fmjsLrz#@Ty~IV5AoD?4=5==Z;Y^`nU!C}$3@#-Z(e~)^MBPPrbJmb2
zc-UJoqy3joL4_3^Ey}l7n2gZez;4`T=QqOncqN(xtbb3JcJIc1?A75njqQ24<JE_G
ztv^473qQ-jTpUyrNb=c;BmL>*?3cH=eUjKoDW_n(R13`ln{S_zkz_+(vPuSRYNF|&
z>TJcU$?pMBX-VE=>%h1>GrkS>e%s2-aI`3MONObUovM*C<?talXWhqeR^fdf&%7u|
zl>6loK0i@@Oh*ByA6k9O*Q%I%kHdNLv@hPhJD#=mf%9a%ZA5<5&)_{|`cLhNn2(%n
zEO>3v48t>(9Rtq0u$DmKyWZj#Mq5fw>(hfH6i`B&O%8I_25EGr!n4<QaMFvI9nA8q
zIS2mKK$Mbc>s_i65Cq=Mjh+=E_@3X<NN$c%m8x5LJbE3wJriShoP$)(%!?9B#2UJ3
zO1CP$7inxg=3xFgnaXb;k<T)6nYte`^YI1V8}1amQJUV+w=~T^g+!e{;`Z~FZk4;<
zq{0ZF;<M%Q134KloIm2)+i~z_Zi)I_Z&l2RduBYt>xE2j%osc1=J$I0&U8Xmv3I#m
zDwPr+=kw`~gtoe!a=WS742KQYvUok8d(YWlRD;+x6&|lPd$<I#_gWgyoX=F5BbYwG
z_aiwIMU{zTU`#-vhwY}2JGRB_)#<iiRi;+-X<|eoG%3M$iMyJ(fqK^Vkn3ukk?<sq
zI!`IVl5%YB!KhTiYZV!etecwuTt}}}%)8=bW@>Eu&R&Y)N$z8jFGsm($0^fkE$E64
zW!L2#`ol#Wna%CYH~|}aU_G#oD%eZPQ%c(cXHu*0vQ<TUSN!BA`2JI{uW$@b7eAYc
zO&17T>&hVXFc45-;3p(#D{JQyF)tK6DN~Gj(ARQoyAQI(P3UAK%=AKfBZGZMhay;U
zUcEom^Qsq~;u6k3iH_&)?B%y6!K99TtnqQQZ^{Vw`9BusrE7n`AbkvZiJ1(C8Q+yE
zH%Km^g4tJ!F^>f!_mmzk9MEHO^sTxfXI6n0{98hJJNSm9^Tl2lxVxRa93goh7SK+9
z3~UYq+{=n;JbdULv>yYLLTlLI8>AdYVT$xx9SG3uIej^Sx(CuZngNr=G8+ND?))}5
zQe4X%I~}PV4aPMdwjHInR^j~)eLV5^Gg*TU*CJc3K>>%MBi?@D3R7m1Uf5%47XO1W
zs1v>+kZu^3Y9@ti?Bga>;iyLVUz*h?R3?U#If!M}xAt;p93zrnmOvyRp6wff5x9W2
zGgm*p9-vR>mw;G{Zk!jN$e==INWlSd4em%4cE&*S6s4iMUb$o0SD{uQJr*w7kFRIC
zI_qP}myMb{D1{zKutZC;aKRGb6|prEc>}?+JJu|-%FLPXfIt9fpWV}HS`i7+!N)1z
zj#ZZXO$o+u6K49rZ;L!QU0V+yYoQStn6BK|>T}>{U@SHPwu8C;0OIouz(%!d@TePG
z6pI~|b4+4ml!2U)*YhW1SL`A8F;;EgjALGFAo(c)Mhqn9S_YWV3|=TyLJ4mcti(RG
zExjPGntJ69OfDWWgNo=xtQow-zoYjoqrs+Uq)fEnRBz+slBPK89xLHT%s$imF(n(?
z%Y6X19`YL#LeH*(?PK%8z`krs5;Iun6>L6i0q;LL0x3L=*oNt>Lp?**IahV)aivg#
zPBgquap(5P<>2$Tn9L1)Xi{=KTR?>HkC*}AxqaVk>Pc@`DoqN3X1WTmIwMK^yanMi
z3%rt@0~Uop-^|R!?i>_B33UAkNl-9~HdfzPI_^OAx!+4rM3%wq$?gW$k(-~Fe<m{x
zlZDp9d?35q!BT>cIPwZE#fuYI*zRVdHT{Z$K2K+zXraEx*wc>ammB}GqSayL%Bub|
zY3rdgB=w}lj+9p>p0aF6u1~XU=rp!DXpChPNe^SDhrC%6b{<GkNo2?|DbhC3<GoOd
zrrUlfebddc`V4ez8vlL8h&D8p%49<zk3@aG!7Tb1`Dc$)4#yswZ7AK-T}a(iqa2U?
zA1^z+{CgaUfl%XxNzpqJHv_hbx|su!ns{0t9TxL*;T&yd*>hTe405*0X0L8+Z%r~p
zx7qtaW(_x#cFO<B%1)7Z<?E8+1v{k&(wCJshp6Z8oWBn}0sbJWI&WW0Zd&8~4};}q
zbmO*az|DTh`F8YoenxB?8jVh<1H$SQS6{n*_H<r_7~t*bI|bguAuZ0B>0{K1iZpZw
z1viBpP3^+RlKj0TopBu(Gy6$s>hIvhKr5sw{5jwK!YsV1_*i5i%nQjMnAhHzE_oOB
zG4!X`CVZo@JkzY{O}jJa+f1>TUx=3rsfp*&zaTTCx){|9)YA;N+P+8@){_A-Xp`?q
zFSxb6lb!z~d@^P^sP!1-?v(&X$IcZNVf6?*ezz+@8(5u-r1xIJW<jIwUbQ-0VhJxz
zcUrchi9ziQap(!!2pqy>9cDLpvpV;uh<p*>1$!(q$`-`OkJR;c2=JHC#*pa(b%DR3
zCD~Nj=R;NJRT8Tq?UDXjVt0$qC#%j2(fWQ}HH3!n=FTDdeMr53dNpl&kkk-oOHlPj
zS8pr_!VvRULLRIi%yV9iwi=F207eFvVGWNsfM(>sLQU)>t=qw!IY4g6M(C?LOuPzq
z_>OO$T!7UvzkaakIYRf0wE7)>n#FVlRcQd+If!i}h{9SxcI?kb#h~q`FvT_6Akmr#
zIYK-ep<n=P7GS>3w931Aeu9XFmk$bp!-$glCvhMjMTihMAQ(x<a9*HPpZ{_~qgc8U
zrVs06hyMXpT!UJF0}8fNi{lrg%`0KUXI8uSr&zr5TYuXoBOXQAuJ)ZRPq)gkTn>AK
zrtOnkeT+WnrMvHFhp`IuW$m95AtKNDDp6qZAVN41yn3M(bPR96ovuKicLC$9o!22&
z`-%b17&higd^XP;2+sEcsEe3@fde?UtH&BgwLvTx)u1{tCHym5n_p&ASf>l~-q-p?
zWy3w1cl|DlO6TEL3vslwz?Wum@G@u|^E0_VFeBDE=ou_G8rF)HrTCth37OFdmc_1=
z)8dk@N5Ub&&Sw|n2Kf89sg*rWcxNIks7qse5{lIe<^q3wof)KwyS_Qr-(G^%4Zcs3
z4jDM*NC;;q8K)elGzA(`PE?piHf72FOS`H)yF~8z;e{kK?U7ne&y3Pvs&|N}dnJ<@
z+){zb2OW0o<Va}9RVIsTmOaGD4obZj860$IRbSbDWHlb!3G}*g?Fn0!`JY8V+MP1l
z3-&|D+M0ZNOwe7~o6LB(15bkQcRt@A0JoIkcEpn2Z1`?t^25w{@UqB#&@eVEqfU8b
zkz;S4hwTw?4}}i4&tBpUKSlGsZy%%XJze1x))F(8&W=VexD)MVG<wINqWCbW{nsol
zR2*u&!Imfm_M1iS)cBro(;5%2LMLy`NM3?{G_^Vg4`bVKRbBH?EK>@6UyjE)L3BBt
zc`FC@OlRY=bHu@d>f}JYzc%0d3{&;q`!rm8NQ*+0ZE6J~0PZu(4SRW~I)jb=?ekvn
z9SuqF?X!T3n3IThB_8L7(UaQMNl}^{HllE8CgOlf$9vEDH-bztWaC$t>5f3})lCtU
z2UPwL1CZ?Tn=`UD+8mw9Q`x{b3zG@46FUF4YW~B>2|+<F*@uP6kDmqIg>YdYDQ9fA
z?2VDx=UIocs1U0=<17WArA<t)qs!7JwYn7lK%Jr>mB$yKxh^&@O{#lqVjh@-nb4`}
zo&lki8EfmXLA)x4^miZ2LcG)7&Bufz&yyjDo?a;?=`!Aab5qw;PwfDmg#Pl7XhzI5
zvhSa!!l|cWNXTgLm^@zgumgW8G;Et4%g+_@3086_M)CGyyB@4?Ns6pN`WEJW>vA=?
z`aJU*-Y&D{kq{~T*r*f!_^`{@Jm~nOGW#6y1#5%7TS|yn<VT0L6{E1Fyad*OhZnWa
z50WseTsC(2@dUVZdjpPY3nq-OGB69cQ%dLsJ3$<{VcjoR>FY8c=-}&@_|M63*Dn}#
z5&Xbo6o%(05B7;>1T2Y&ZSNjb)mSaX#&g2fffaI)t3mC9z2~WA2Z)Tbt`P$`CaD`=
zc!^+$D^_hULj<2>^Bw(U`K4M}jhSp{GX_m%h`enl%2Ip{Tsx>k!RT1__&cUOk7!7S
z&XCrJJJ61^bY9?8QSzPv9~**k{)c<QYryx%a{t;ikNHC0h=dh{r5`ddl>BoqIVj1X
ztf@Z=pI!A05rP;prPX$5VhRheD~w6Ly+5@}S?|gct>%Nz)qNMzl*5<(p`-5$qf8g}
z#NR6n1*9rS+3cW$2W5rdEX)coKekFb4WP-nakNlyLxZuU72$C`I_p$4+P8NKiOUGJ
zBWt6-+pSm>jXKHQJf-mrU0|n`#gt;RDXWh(j>v3ov?4=~csAPPID&DiB6u@KvSXo*
zpjKSc`2xQ1KCDH}yCs|ZQ(~|x4-UN*pU!_w1Tfyr{LD-1(fJiW7yOB;wxzu_{^@(T
z+GqtdiT<v)ksoJuI_Kag&g!Ahfq89%X!YJ4zTWPDJd{-4jaJXJ#*dlWgOz1NNem(=
z^htoE#?!Om&r%W2{?9sI4z5`xH6m0^e-=TBIH<cZRBTXvc2Jvg?|Q4$KHsCkSejmT
z-@~0c+|FljQ0T(!(T?Crty&i!{~oG_xYI7i5Bh4iX9m5Ez{cK27t<B=#8IIyk5cQq
zaGI>mM7hiE5v`#$d$8gPKXUmoyA4sB`bThC9VV<lAC3u+*{@si-Qp;T>Nm)slb2+X
z_%Rx@Z9G^IvfeyW?AZ4F;FK6iXyJ;uVdaJY2|50~IjQ+W>Y|y%!lZ_TJg{cS48yU%
z%-eO+V9jsflwxVkfH;X0^KpkR(x9Y)<q)%Dons-dBOO%!K$q^9*iv4}<SQuUpTWHc
zhVS{gqJ<DT39!3TT{T??)_aq0&Jkm0ll5%}N5EeDKqmzZs2sapP)W@T;|D{H*HWc3
zBJTZ3N@!tGC$ksye{wOzE#Qn9x51*$)nxGtCo}eNylVSKY##22GXtO7zQb8kwQIBu
z;lV#cnDL{|Khd6#m`y{KX4d$TVP@BfXrxhUr1&=w)#3k;B~pGt7AH$MfOpHC)9ad{
z^ILhr-7UpvMOgIevz6H)Tx=3t+N_~f3!y&gja^ydKaz($;Jx6KOt-@auUH(adJ|H)
zV80ckk{}lrgYubiKs7?!G0L;<ppqBXB3-j^R{zH%0T%_cKX`KZF{ytr6*~K}5_feA
zb|2H_5Gw{5`C}{}^g=eq8(N9*%k-sxJ?|fjaWc`&xi0|YH%hc35$Im9HIJh>VY`H|
zaG;G5tH8FcWZO@4zsAYc9Y4`Jltose4R9U}8xjcLmjl~1TcKN_75r<Z%>$J6ln%6B
zFyn1lCAv1#CLgJ*Wh9HVNqAVXn#ynh#Xf!Obcw(H>~!K<`@EPCcYKYY&{^zCS=rlt
zjT8Js=fk!B?2M<lVU2%*(!3fneR`s8+~TQEdsHl?J|jvbWgR@o@~%0su1wSW<N5d>
z0QTRj>HnK5tViX<{WxEnVj$^rVwiftcsA#?vcVn~h3RRd&#CdIl$WS=IGp<ud9P*B
zGDlB-$#-Fv*77To(k1HkF;J1I5^u}bW*Mm=Qkly0;`3zV^Wv54m5*1v?G@|eD-1p=
z%)n9av7;j+7;C=-qgbX~LNB}kyDdc1AhlvNxPvCz#lBkssC+g4jB{_lC2lvV<J2p#
zmP~K>&glp=0_DCCOp)*G?~U_axC)6to&Vr}uU>}D@;?b!;y#G^0mQxapxtczdAted
zH5fW5Kpkk~xd_c0nVA_MGL)URlXrxif}S@uZ$V7YR9ki!u=(i?_jXP{@gK*zDB*t?
zSf;|~X?l{TW?lTCUEbi(b7)eM+pYGSp)n9~_~|3t!vt@C%q;So!G_{Cd?>-2i_q<M
z19SE(A`vbf9E`P|<Iu<RP#qM|r)b=7Y~Fy~NAja&oMP!_xL0huM$B3=()UiyHgZhr
z&b8Go!Og>47YU6Q_0s#N@lZ`TvW<7p4ju1)Qx$jKDcWX-4U08x=fmBWxH)_D8D6{a
z@L9!ugrS==5*TR~gkE7JoDaovOfsj#crbRsX922$$C}78cYU08>zhCD$$|2ZcXA4}
zBV(h-;XJGV>}8~CRJb3OTRrEJ%bN4BRJgl`$Fz?0+Ka8<sddZCmQh(0|5`J`R8&Q_
z$cF+i{<6lhZg3D6){U^rvj2;PMM9-}_!wFKvT^th-tqlVjXYodB3!s@^qE{$R4=>p
zY=iT)EDh%8@C>DCkb2(6)2*i^rdlm2Jd#zp{`%^PQVA6^j`fqXnQi)##fQf0$0uTy
zUTwq!aALat-~H8;%py7iU;lR*5jCW<D!q1xiM+acRLSSzy}jC8+_Nw8IZ~(Of&>zh
z4j_J1dU^&aR~R>wKPM;15n+ri?P338$wCnu5yxK{YpEEz)y7Rm`>_(6tG)d_OS&sD
zoTMA7CCC&-I*<6M<Rx$U)}*?%(!i{S9NGoLW4S+JJ$#Z+NkaBS_K#aqLZL#3DyQ;9
zZ4x$5I4e7pfTxU|n{}vforx45lvdMho^760(~J#8lI>M~Zr_D@5>|u;$M7XMy^GTA
z*s{h2LsaMtWj(C}u+>|3!~sa$gF%`XtS8@?N{MmSi7YCV*qZS_3;ksAwfa-|PqF<O
za^*jT;s6&_7Nh!H(`$QP?Ik5|J~US3Q*U3jb97_tV|wq7&Di>x{Wby%(k!uwq!}x4
zX0Z|5Q`)p=4F2_qQ!Htw&SALd3|==fqMc!U_b-?0AHg#u{GiI=SYmXj!c;;un!=I$
zuazT1s!B9aNUxeq7ys>@{XdXVN^VrT`uZd1)Tz^vf%4Ib`uYjO1=M}^$6N9gJkZyN
zQSTJ*U6lfU+{>O5ucWWH8;>3dY8|n)vC(d6*r^6}0Im1f685c)?Tw5?t`jP{#DgdP
zs8Y7o5Y4}Auh_?ppvzC{u99wewT&FBOmdr6Ms=B(R<iG8J90{fyKHG<o_A9ghI`?L
zj^!q4O~IZxbIGg|%}LS;lD`eN66vvH88~p`l--op3!HU9GEch^EOScQ3>?C}-lg>X
zUu9L{_9(fyxQgsL9+s4pEkoYl?<k1w+nhum-pi6=A_FY<1L;diVrY@_+EqH8Ia#mH
zIJgZPU2w&IeY;CO*@Z_@o(_`*A|j57(~EFOK|)fJ6}8jY6F;<dim?4BOk^P&yFygf
zOP3~&j2vTye^`+XLR7?_J`TvL?5v2Fi>B`M7S*3&{-a6U9#lzB^>ltrbJzP{LWTcE
zyHo`!16bCtPD1mxN|e6(8cpjPx4DCy7fcu^`bk+c`2gqFFS8V)%FLfY-OqddV-<A-
z)da<V#nR|kq!`yZX{4jiwO_qDd~dusnQhASM)CaJwQE_GMcyVZVa9wYm)B=;a<tjX
zbet1SaCU{5yc-?iqr6sK#)>3N?Lea29@%F#5AZK>*B39%$WJsiZS!XqdtY=lKwteB
zW8~}&s80fll9%|@C%r7$4sD3-(w#(6RKHZ~QQvAE^2_#?os|5i4E^7dDSwMyP06@>
zlA1<(%3<<Mj=mX)8XIa}voq5Nt{EZd&CN}k*DRzrFAW$7L_5!_6xHRW_4f4@eQKMs
zwYAmhOKkd_J{lG27qSPq%$9cu1lQIYtw$eD=dQE%_Si#Jx+$fGNuOtaOdd8r%MteO
z<L6EA{=&fDul)Lb<I?jW^pacf9IA1WxCdOQhTl@r**zuQL}_N8gv3l}ES!}F>cKsO
zH?bvy=QsOm-MKdC?*u`wR}v8(9rVb%y|vbU8gmlhHxZZ)IZlR@fM>(;WYfyb2$WUe
zuY~|BW(YH+p0HqaLwy@NgvmZ+mjbqGNPs<qH?aEyA6$*s!v|>7flHXhpb;XKDC>Om
z-;VxGzdT5}7ypMU0dB3mpEmIqUC|fhoB4-(2(y%ad#Ubk`j5l!7kR|G!4tP#%!dNx
z-@c!q=grMmU3+54lCj44WU%+=SHJaSME(l%y>IT1me2c=a4L~WJOYE;6SuY84)nLi
z9>;pK427Q`Z7O3hm}`N9?t?N<e`^9^Qg_Go*Z@I~`k^g8Ofvm1y}duY11*KLTZK1J
zzeBtN1lfcJWDWkL3L&HL%>fdoeGMk=dqf*`TT%(@<F3!<Ru4ozbfMLruB}12EtvSR
z2LNhsn5XV22T1qN+Am~$MWRj}COh13`8kwrw+%#g`+e;7)?P0iFi5Zbc&LXYx;|Tq
zytV#Y4fW5}^tVzAv7QQvPHh-zSa#-_bA7~Rq7r#$KycB|H&u*fokYj#R?sR$q}-(b
z9dnvS4&&%6Z6hP`i_hf+BO`((C6=G>SzUkG@Vj84%_oOF=ILAS*&x<{+(8S47cZm+
z3?$9P$4IS*$#k#fH}46@8Q1OH>~+nVTWcCC(7Q@6mUOMDJ5aUsnMU9xvz$%Y><Y|E
zXEZyOLt@T<yZkMf%F8)(!skI2S~Uh=8eAMKdr1PmB?f;Z#Vxjmy}5_Ble^82ezhqU
zDV^--c;%|Wa6z=AU0-5!Ys8dFg5E%J`|l{8g{O6^{m&g8<|Se!JU4z69-J976|gU?
zb5J--mEy-VV7kFvaO)kY0QiQsJp9d$bxGaeNBw>c=gfgYW{cp7vB34{EjTg2hIW+F
zk41{YBw$|nEi82kvjlAXFTI#`!lrcTZ|!$Eg}E8_4-GjJ&Pw%1Z4$|L-WzzL&iq@Y
zzIpIRff6qzJa(R{5`QKy>SCgHxUQZXb*<|#P~jb5gW2)^Q<0zK<c^!UwBT&UQCn?g
zWyX9D=B)lc)xK#{=}BAHz=r`*8tXM}{yy34!9pn~ETW%lYTOww)&M)D(}z;}j^8#+
zF1L|qDX#dR+<hV5gkqnWZgA!%S`#t8wwyQf5%viQJ0S}p=K?{OWtBKV8N&90(Ja!v
zyNb^;xw)AwI9q@!;3oeZqNDxcC{1y&ND$80v}&M?*;K-3@$13G3eS<c<Znyp9lY>N
zYtwuE3PTxk$Hb?FhhNKI#fRh+%oi~6X)Y+=@EX`wPH#D~(hOqKi8*C3dAHY1RX(Ux
z_za#eeU~#Bp0~37n=?Uf9vSE0t&Ms+LzO=0l{qK@^TcmphcUVTz0vjWC7orl^DR%A
zj+(D8B0?dG!D576;Tlximv?b`;*LueS7`BCfyX1>>1T+bi{$SmHctSc^zVl>uR-iL
z;hm%9B{iQG0#0?#1Aow)RKBfAwb4G@A?m=I{7`?Z!Q*@zn>u^d$K?p^XPe3PpAm(W
z>9B?5v05K~MN{&pgU)VJLsr+seE~<l2?!qs(!JD`VY0e%opA3tz6bGQgi)?((l$2!
zbB>))aqYO1Ro~3;_ry<BrUPZZR#Y@mwu3J+GpU$GEE|~W$!Egw;{EB8No&7TyEtW3
zieEPF3j6M}f{qWE9Db=ddyYIx?X4`1hUz%)VKdi8o4vN@Ff)<Vwy`YIbDlXz;AHe;
zKE8rV`1uD4>bo!e(htY*!g09UgT1EBo=%=YAqT=)exxq8B(9g}Td?T9)4JtJa<aJq
z2^iohkYcc7;L`O$Hfx{s=TE6p=9`c67cikOvV|AwSQme?pdX~az)^tnfityXoytV%
z^9>vCm)d(?<zIhKcx&pxOzDXN%9(4Bb6n$3FeMOal_x5wgc<I71Bc3#&Qp>4Nr%dD
zv(h&Gfbx^($JmRU3WH{|P5=DugufGE<3!WPl-5&v=$O^|@)(QL=~;G9{KH}A#%Oku
zek<zztBni(rGC**$Je{o`hV5gIJ!L-TN}K1GeIxz+b>M<O>z+<9K#Hdu5t!6*B)DS
zRsT8~w8hKAf4`JzYp%<0_2w<MQKukYs1-u4TDwPhaxF9`=vT}u9qO0mBOS$b!cR~e
zZ|P#PKISUA^92rd#9Vs0{#2n-u&!UVBNRM0lp`OowP011+9}tU*xwHkoXn*-mZ6oU
z3|nG`=7gT{>wk3&KKmSEdWTc`;fu30i0qDn_1)Tg6J?LH4hP|{L1&9WFHLq2TlU&j
z6<Pdl73#T^h*3*ITTd3-FLrZFE8ClUe$N^}f)dmvQNlia^R6Ayp6ls8!pSFMHbEN1
zX<YVW5t#7#nJVg>g*hxBswWE4FB<Fp6zV?(0zq|b-wIw|CDk09c~j~<GAhU{trE(-
z_N{AXb<8w!&AAu~m-ZDJx}$eSYaV#(5-TENJb3$j{PTM47S#PnOm8PI2I}5vfGly>
zYl&5h+Y0#;21x(+O_z}7*%0OUhofKJ8U<W~Z^{_fUjYoqG6!%^7E2PW`yo$ZrnL=^
za=?z0Jb92izugfeJefCs)QijbcQNujaV&yVHNVCm?ups!$daIhsyL4~CP+5Kw!WDy
z)z*42%qr-bX}@3+gJx$YmF4gU8_Oc~?CbVGp_`|+Y0sLPc%$szkQ}+_%!OCXpX-!P
z%+Cq45HHl^9(gVf#Ivtc9Lj)QOsY;XzTXdZCg$biF@yYhHI(N*2*2=<9mly>r#sW}
zG}1>;6bYDeffd1asuw~p;!kFMASs}r=Dyhr&2Ol!vFcncyU{o@w1Iz2UA#d1p08)G
zWQFV|TfnYzzya`@p;avHwMyn|ukk64pG1K-ry)EyTXvhT;;@H<-t@jpMykw`o=Q}h
zhc)oxEPij8_IFb0ol>f7HPVr=ZT->Tz{359IiKiVC^}QY6hnuvazA`OuC*P=-xLbY
z@^ZXt-|>!mtUZWw#;RN9u86|}oAuSV8*D1J%q6#IT8-=#NWB?VoM*iSSvCaxev!8M
z<~1VY9ahGtP|0FY5bhLSIqcGcQs`m{;IVo2N~9U5iag+YWN5XTkesZ{nHeZp?>K3O
z3=2z>6P!4-?x#JL$xJ(F#+}UCkF5460L=oI$USm(O8VCmO7&AlmrT#bd}@wLi~A{^
zp*xr-7Fgfri`{@1--!qzOaZ;*Ii4A}L@Uolo1j=S9pFq`7T|O-@%aQg17y}99{ga~
z$?<L4s8WGSg=-Ql*<lKkOyiUjB<ZvgK+hm^=F7z)1L1M3x-8A0Dw@BJ0k=uFWt6Br
zL2t>j(L=`}UNY;U1Am<bJ#&cLI{Y4KOMyR|m~|0Bo#M@|&>quqs^>-A(^xiqLozHB
z2O7r*`Sjg60S&@#_HwJ(b&3I%N1{XQ`+om6k0QC(bg7SOUy2cco16C7?4SkZi*D-G
z*%H!=Jj@hNq%!+qO`ns=ZL2qlJ~#E*sp*|wJxBZAIr*c$Ew#G7fws*f5B0)bNiRxq
zD+Wj3ET5O=(hOn61?`f1&?@&&r2I$aXZ%Lzx6m^DI}b$VxTrF}o?rlJGMm_E_W?)q
zEk1>^p%hw4e5Q8Yacsi=M|KoncelD?5aaE*k8d3eV5{99g>8CoCH;iLE?)YtM2pRN
z_J_|5)0PmvQv!zsy6))+Ngln@pwPYu-KOgR$GMUA!Cy(H1QQfu?%l}N5xLkPtntGz
zS4{&@nc_lZ_+#FQC+G-N$U>tVw#H(H{wFh*ByRVc3`Q+gRQ^_~h~u5v^!YPW^lFRm
z!OavYzfXNWdu^vDQ_Y=88iE(J7)5`5Z}}VkO2LG5dFE}&jx{+Llh~c%Iw;6uzGyi*
zj5I~@rJFJB)|2B@`=gPom2?*+#2d*fC66kf0J`ROobG}wA7!>)FpKm#?AkRR*wHG1
z46ZrTj4(cjUu5BUHICS3<{UdZZp)!BGItKt9^i<c9f5E4sgeen0lVT7+hw&T_Tzz?
z7-pZj>Z65#J;vd*pp)sNo!UWTOKr>pZ7}cmcPw<Ah;j0;cdwELn0Z7aa-lcsS+*77
zMRwAoAE3D3y}dca3j;>22Zmt$!5A3%Iezna5+WAp_Pzp&XxC@@G)O!S&j>_QH6M+r
zs--&2v~)rtWhY|w*h?ULxcT=>#?79^Mx)`>ObS8gN7bG`f?qge!1%KjPYg0Cl>&Y;
z<LJ2@!8sGXzCPvx({TXeP01{Frm7!$gLK=~obfM1yJ97RC4vu7ko(69+9lvWL6FIz
z^KYC}B+kDY{Wp%W79ET7`U~7>d6;!G{eeE7!QD<pjDLft+_ly?vA>z(rZt5oFvFkM
zyEcX?YbP-guM8EdJOltsH^Sxi&wBTQ-h?T%QPDkoTbfe1c&`3^b&Z}V4jsI&^H?A&
z5ACLF$SKwz?p-IHpa4jx{k#NQ^UdTeDJxqGy%cZPIc6_h<q@zo%NsjWZ!ag#>rQms
zbUh8WnXEA>Oi^iY%Jz~E6Sl(NOldF|S*ep4*|g1g*0R&kqIKi@ga8j>8R(Ka%VNI&
z^kdRw{7n6z52T~VX<dB>D|G*XdhoR@TV<-Y2c52`z*{bN89=D(x)ghRDF`WJ@90+C
zDI#;XWv{Xhfxi$x6p6qI<<iR_u6la|j-c;gw$w!i2siOP?BPb(dS+}~AF;TGtpKYF
z@<W2IvA&Aj>D`ng@3BUpac21SiSHwHY3?<&HqWoQe|}3cL`Wt%V)2jucycTQI~KWt
zbBgkwc8}>KoHJDv!WVopxt#&ih3dG6n<&CMI5Ybyf9nwPqMJQ-h$HEV;lN0&9cqE4
zcYMEW?%TPOC<71l=RQxYZ|`RxyU|YSS2{~hJXOlB6gG!zmd)!Ga2=zAI}Qkm@MfP?
zZs(`amBjKo-(w1{m2<1kH2DBpre3B`*F0oMzxlmJ-H@b9eAMXo^28AQCOoc@H87Oa
zavjFGu+Y`Uhf5WMv7iPr);Ua`zPcuTFts8%7Fb+9H&gGt&GHm*-Shh!h_2ayu8X$2
zos*=|%QiW`y>^+ka!BBmMfhkqFlcJ=B3VZr6h?AH5K%i%4jB!)c=8$)c4UPJI&q`z
zidiIWrRzLQIwEVV%&U9b+t-U(`|Jcd8|PU%qMKi^9!eDmq9D4P;lqxVt=e+ZhiLT1
zXC3wYmc6Fbly$VvBv}tUr{+z=ZD{T_d{^Z2k%SXz{F&89z<Ip7!#+ljzJ(11<vMr(
zB9rtVdz33i_b^bM{Y>*HW@xWK5HzE%uNHW$6gRIe!KE?InXd6~Q~&?ZB^&p_+x)0#
zn9p~?Hx3x!m>vvlN>7hyVLg9<13~C92~OPk)J$TvXz}b%Z9g?={W2-PNZ%`AETkw?
zcy~3U@>N$g^0r<lDNYd>^g<POp6rd9NJh^z=1=e%Yo~hiJ{A*8<!ZVYtlhgB>&(GX
z=XdxjrO8!12;cF{0g=s{?l;jR?Ax8O*2qaRBpG8J@=lH^4cv*4Bw=W|{+b2p!{W-?
zNNu*8KJ*8fS#Z{SeN^O;{G$@!aa4Uj3*u2hX2#67Vwrp-=K~Mb^t~-F=vf#oZYYBr
zD9^jm)f>N3!GUM4=jcBEe66~}0m;!;zr&~L_k#J@^9OU{rm2e`m@O>GF<MM3!qBHO
znP(@zMhR!qLt^R|KRz9;LrhFwd_`KIS0C5Sy0nZ?ai+<nOL(dD`p%+TS7IbL8fINQ
zQr7_+{BEN?Lt?2guA$f?nLRMbBIJQ6Vp?%uJ4Qa0P{M!(*`A2i`5pu=yr}X#lSnNq
zyVkqfPj1EvTjG!0XyVK)ywS3*b0OLkIKnsR1o|Kb&7Y18&ZnwP9Lbu$82zHkpSQDP
zLMb!I40wv@UJ&FoZC=v}#_zT&y8_PLgJMW06f5aw5k%FrzeL&OxU`<B@gT257Kuzp
ztaQ#RxEr4k#eKeG#Zsu6i>99+GNEMiOlqib!q@+lykZ6;b<cas;%F)StJ!bCIBIjk
zed!^g*X>YXsaG`r;7cg8s?UO7p*`KnmBu-D)gQCOw?LWGFnYUNgxnvtnL#P8=N50G
z`8B{e|E=P}v&EdYy(^7V!9UdOzLuMRdrgu(dAv<)O*75D2n42xLBDH6j1p2<HW+0x
zWzJ_ig74ozfB9)3v0NZUwhmnRc{K=kB!?_TtG*4s`%4(erIBE}JV9TtA(80`+6){y
zmM3}!{<?CQOx+CD4EV<j@sc6wpOZe~l|=ks)ITrJFFDZO{lPNzbS(?9y`Rc5!MSMr
z`a+)JYFyjkUg5!z5ZPV8AS>!6+~R6NVxoi-rnbnH5r-X(O+(2{eq>X(xKSJGLo<Hu
z!#ccI1#bnACa9$xk(V1ayq!T>3()YT8&`$41-G@-`kXafOW`jVFO6i7g{X-q8=16y
zxFY6MFxZZZ7^z7eHCj)57J52G`qngx+12||xc(R00im*VZM%#fxf;b-(;}O`frpg9
z>1!F#$%gz?^;LYftkh5}=!=H)i!?hgR_xQ(6*bT6gkM+ck3oC+;oO_RzzsGfaUO8B
zq;gD~`T9Gw45HqV-njNvH1`Kp{+1|~;Eg4UJ-8$xo@bpoB6gBgy4CcGc`vhTW;k15
zjqPAt+Ng9iFMnm>^u<)_#kg8GX^>UVUXB3$u#g5A6;t7#WveBeWhxf=6w2_x3~s?3
zB!H3jk*cch?(OxIe!QZRItXIaxEg%+QDJ8|2`%BBx5jH+MLEsGwenKtiau5a3X@J%
zDH++=+OEvuGi}ipfht_T2WV4G0e;Q>9dP=+qu49;r0fkASTRKPi~2F;tLZHFN?P#T
z^(xolXIp8L$;S0A<JL3tUsjqdkymmJ=9_(V{6w;XieobZj`N9*bLf1th%{z3zTu$s
zV6GAZn{nJQqprv--VI@aSQZX`8GyKs+HWk#^-HPenaK{uh@UW=FXB#%vt1UHJukN9
z_DI@$wg<oVJibLi%kn#5vebUk)F-zFEqJ~=3*EF|$n8%PAN~BTA7X&p)Swz3h2u~p
z%|!czdY+m|^kJa14($=o3`Nyx1Ev2Vt$W~YYq|aM*agQ6L$Q>hc7ra}F4g0Di=C!k
zBV^f$KC1k`I2H>ju%&d0J&?^<CnC=sy^H{c8*hRUwVUc^Y0zvIP>vQ1B1l6YqCgv#
zxfY}*FYm}<Z@D<TPsfnfQBW&eYHc2HJ0PJ82sk>sSZV<l#kn~rV_%*nF7u8>IeHFm
z%SfK~6@IF5uCwc@tgEj}YhJ4tTUcsLaLKjzNF43_Al&TwyJ?IYUf2<zs!e?^`Z}Z9
zWPmo`<;EfFw{v~oS)JI7(DWC9?vgD}_N;%m)Ll_H<+wPNS&0yvOMhRON^wUq4|nr#
zh*;UaL^M4Lzz`o(!Bqw?(|f--wF+J&FN*>J=aUHE+zC|CBmTl4Irn?5_$Tf6LBDTh
ztH`=tc%$q_3)J`^zB#SQ(pnS=r|taw+(K9hfkh#9A)#I3e^7l|sB>da*x$TU2UOwR
z!&x5D`HwcMr4}J`ju8bd32kA}6*$ct{RQ#bWd0n*E@@0lo&9XXgy)1u=17x<bCbri
z%8G-_6UF>e62}zVx~7}*rIbyw!9$^T$ebQ8Qwz3w>mgTf^%!okN>jjVyvDU>9~8P`
z3C;D6n5|fv&)+?M@Pk?W^UJmwGGoe8?F@+5Uh~bIkpV|qio=S)@7oo0fGqeI>Fmx?
zjk?MY-=`fX%Y{~`f}$GDxDx0Fd($O-?1oOP*uw9nku!7dmDsJ(LPjh5=<lX~f1h_S
zFPNM>FfIxZTsBT!&j<>U$kQ9Cz(^O-L3BoQ^gQkr<qG4cs@zC}q`dCn>fD)4eLBX+
z3L%hM#*p;yYau~%LV9aV+I&v8B)sP$ptq(+%Sbn!RDWftn9xhV$UhiAIgCrunlwaS
z56Yxh14Y|#ZVSO|AVY;3z;nOvZ$76{7N)s>IN+iQARG>Ybu!z7bZXL%8N==T$(t!z
zTmfq7661gk_}Wu_42lCburqxGBb>q*{OQ!eI8XnKwjWl^4M@}8$<d{?7~&QgisWz8
zWrtUwzk2N$HgEH-U%1{Fbr~(uBSSQgB=~Dc;h!#j6aP_K*`~mm?rZsM^J*rubcT~(
z7O-#8FRHX0EZH1bNAQB2>cx5@$_^FRWB-dS^smGB_b!xz44mQDk0j@x<9YWMhnz<q
ziCO-<yb=;T_ti})<%z`)vbzI&ZHLsyi%l$EogR$PV7dIhK5hn{!Ltd?N0pDV84-b(
z7*d$7`GVfgi%=u)k-AovSpU8okY!uO)H*z9N$LJ;`%00e<KqO~M6JG8)1P~eDfUt{
zkWp4<T2&c$DtPi}cs+`2Pfv6QV(_m9APSq)O`bF4wmRDl%wPCS#su-vn|cNYDF}uB
z+QZcbWfn3SjVL>W-(qmoiqk_QqQioSYt)_T%GY;7GUitlt|jkZv(#(B+7${eAA<;+
zDUSBW!&X1OnjJJsRR!z_ytRK&02A3%I{b0umJmuWLt9nLdrEXo4A~@!XOU|%2v|Nf
zb??d7)zVTQ1YPh*AN-`N5R+R4dJf5YA`=X5emfIQx9Lk9S&0S9ZcmiwuV)0%$j<{}
zGs2m@zbfw$r!deN>x{kU!nsjqT>k-&8MNIXr+CX_T-RNG^~tD_ZMyt=CXB>uyOYIU
z`Z%tA`2$#6RyL$~wAzZ&f2X>ufAtbC0Q8onH6M05?=x2K_=V;n;_P5$lelwod*V5p
zzQOAJ2sm1EnJyd8vn9nRpj&HXY;(Ik@r6$+6*1}YJ_o<7q7IB3E8;e#pJ_-Rf8LG&
zwuV#BhVM45yR7hz6tEvtW3J<tm&=b%W}&0RMXW&-C;ty)ZypWx|Ns3DvSpdPRraM+
zLP%l=GfJfm^=_eL7nSVWU=~Z!Vok`d6e3&pb;z1+i0o$U`xs-!jM>cf>ht}5f9G81
zI@faigL52a#=M@7$Nhf0-(S8{yg|Zp7oyFf^b;5M_r$+b^{Ot`yj9-cBW3eao}qdE
z)n{$D)mf}H?-IO4YKA{4z>C7lY8J(>n;z8LiTJK%ehHs2b2=9$`7S>z__t{Qt!y)3
z?gA>$=oY#&+H<WG-4q9<FN#}wglyF*%OSRp`L&6R4Y!2x*i05I0Z8?U3@Up;!J=GP
zd0R%AU4vowuj11^n=cX@$r{7^<Ab4Dn+-(N`R60o>emZlQsCM0N!qXlOneoy&)A@B
zlwzby_Qr!&GS{ND2XcG|^i%5Fm_C<bU#)b;*il0de<|p`__%NpfB5=$gqArVI6yVM
zu24E<N*i_#sKH@Z(lY}N5i0Kn2G54^UwW1=SEh+(Z?J)BPhoJn&i79LOCHGs{NNvd
zbu2;!ws|MbDc`o=>g{=t{q=DFykj<!#+o}R`v&T_%$a?kHCh5(?))4ZLQqu{9t#rA
zwL@EPrHb$>JSaF_`lW_L(|D5NF;{1M1xa^_XW1GI&40!G`|yc=)$=T~UdtoDS1OJU
zXL~w>ka&bExn&knq3>|0Nk-VyrB67LfUK>{;-m7gGRDipbh^wIk9{~HCzWz`)pPCl
z*UE4UaKOfBCPV8ZOnhv!mT~AYrWP)v{<t<i$E_@`DR@_x;L~|!@4%R;{)>|3fy}O)
zw&Uw~w5x}SWr_WiR6Z2mm#W=GLAQj4HC}u!p(>Htyco$;BD^10DR*cKe)Pjx<;c;J
z+=0vnFZ9m0Ao9_<^%BD`S?&K`{{5#h((?D_M8(sMQAce{Ypq$Wqi6$k$J?Yz`&R78
zClga`toO-;Oro*^h6UJtX<ANvOWVitYyzYt*DY!@MKjX~aZ%94O0T)&S>UPh65^$x
zAjCBd$LW_AW{h}jhJHnidt27uK^Yn>{uuM+%ZIM#TE&m+-ao4GFaaFYGeuNya@-5o
zeyYwAD=pyME;A(|jD1K-=0_+O<xM=ygRw`QBEmHu3<4^p%Y@L7+8YtKeXrkB)knms
zg1o#%-#qcCJhL^#ZDO>xc|M1=0?XUR!Zc?ap`QY-j!Im3{V9KMKkO{vn>_zhr~?zU
zdt(+5L+ee^%<XuWQieRUVD!rz8lWG{KC6IcyvI0p9IVCw7dC8G9!5{#=n2j~o0)FZ
z1YB947i7SYo4F1a<s~h#4xEpPiM_AB&iun11E;vLSSF(SFQFXSkbhl?yB!jC|Gqog
zuYb}_)8`8eCmAG=KqMhWm_H~K;p+Z|%T;y~b_hYDQD(XnXdrGxDXKmNx(ExQ%1$;0
ziI*PZ>66#m35lwV+G8#_X@u_U@C|0e=dV8qar<r8%(5Kqzv4m&@T<tyH<tVcabSq@
zUbiIsqj=A|joz~D_3fM9Y>9GcB7pPVcH$O?{dSbi(r)FN#+?%hXnJ&wY{V!xqQZQp
zF9X#)@2Q<>#A_{T64#3m_n`5is}Ya~?AyQx;F(tmy?^jun9n4CIsgAV4HPx<16+eg
z83-PNvJ5g;i^Qk&Rs_Yz6Ac#vmuSU9xnP%2)@2mrJ?Jwnwv=s<b2spS#G5Y)=23;p
z$Ix!xf*fe$eaXR25#IBz)O&noQK+$HfjwQlx7u25=Vz}S%~~nq%5jZ1m|bjX(y-4M
z>inrQqH2)nQ&Az=mvzNj*F6tsRR6I#$v5?9jP+^dA}Jm0uh0LOYd)?{+iCF6+i#=h
zSI>k<Z>GOPM<_i!`i7@4>czH%RN;_lW1+dL@Zi=+BQMG{;8M{8^@1zDvmz&QPB4~Y
z+)}drz?58*e6=qR0}xlSao;S-5u29H*uZ{%y<@@M{oUtztM5O!tPVdM;)w!0n&+?k
z)jBWdnZ|q<%%KJ6*ww#~+I5&sd3h)I>d-sQ=BJ^JdYS(m-fCWvuiwI=1DNEc6uaNs
za~~UrctRIJy;E!iaVF3tlr>uqQpM14A(b#5&!+XU2Fp?b#d8V+ISu0*94l%tQDpma
zc84vY72U?z6@CEi8r)5;7zS;_e%bGBy7V8PWFO>71;LZOy5s`So^?3idb2<zIvMc>
z#@y7F{^diZn*1J?ItwPg=Vqk@<Mvi_<MO)bp(cS)E5)5N^UzEg*KE)>b{;B-htFRQ
z%HcqIw{G1GsHxcWI<A_$34JmV<1%p_O^{69GKZe^mI=8pe9!>68po8A$j0cQE5N#i
zHC%WfmVuw+5vk@6fM`=dq2i1`pO7JVYU?15oPya~|C%z2u|=h#(Cgot{W{^3k!@VV
zc@}Y!U6+5+G-<e-kQsPxO;Gc*(6yC;^p)xbC+Y(Z6VHKi`w=ZkfVz7snqxlGz@$Rt
zn<{q|Q<r4gD$Y@)*(T93JQP5_v>WF!YKf4&BqJ0$QGT{<|Nc(!y#WwIQ#m@HQf%Gt
zuS@VvALbBn*(jU3v<Jmgw~Xqm^7}i!p7$SctY6P_D=;&FBD*S!`trEa#a{>uyB^YI
zC9IDHg4cgn<<|vqHFofnv{xl?q?<eDJhCck`&(p04K~k)o5@}9D|q%QMFZf8gs}Pi
z3W&3xRY%_fPss4%lCJ00dhQ5p2ZGU(k9H_3m;b4>!7K6jkb|dXv8}tunTu#ODc0NF
z15|n2Yy!v@7uuXLP%XkjiO;_}x1H9gZ9K^mt_OhSI9M8$TW?iF!WMqa2Hhqy@~-tO
zF8G=WiiSsHzEy{}PQQ~-|6IO#|7f}k^VCP1z?mfZ;JrCx<{J`fp&zn#1q!DE7pu!7
zyxy{D%&uVz=44I3b@gqmywNQgkNUM!^=U?m=p9lQ<t&*z*$2!V_)4V|u3g-I3kr5<
zU1&Y4b>V66^&V`RPVZ`@ui{{tj>5RzY;Wfkr_Q}m6Se|+FKqCtX9KI#=WGZf>%6z)
zWrMMjhfa&^^SwWlHKn~46HI>t5<9WMg0vAuaSeGV(`G(u*}O|Kj$_Y#MaT&G2}JcT
za{!I8+xKV)%D~>Jy}3vq|8`-_cKVEuLTTN2;&?r8{h-^bk?8&7aHB!2vrKpsh?}}l
zS66pc!aIIY6qJRbl%nr&Q0(KBNe^&|f18dcmFw|f3#&fXbGV-JqjwrvX=AY%`UAzB
z4)`?nO@5Z=O^UWiJC=0OW~$_KDTjhl?fUO7fTgxqQL>1#Dd@C-*K~Q;xz!;5mycUa
zxvBHp-Lcfeo>N!R3vGz_RLHD>=%Ua=our_e7j&N<;>;A`AVqC*@5;v5V<;$cmwO|E
z7SeNjG-k{enH0Pes46warp}DXdRVswU^R`EAM6BPPysXd22H?HGc{l{AdoN*5@<HP
z7W8Ie*BF-IPu3kZW1c$mDJC74V>#rZ5yC3(>dQJdN>f8vTK$Y-d_hj#{4T%hwuSlJ
zpF(&tU8Qhgt8gU&-*68ItyaBzF7XF|c>nJJ+S8{7UZw)Z3jHRC^Wa@75pg71knDz;
z{nE;V;fF+Kc{&>#WU#L9`O^&_)l2HBUG0hD4kdGEVXv*oj7jlZIy7Pp^mIbk!ZNMu
zW+fgqAl{J9;=h@>E!29MwLV(M>0nQLy*sKdSTa=<7PqitJwC;*R-Y=k*=0WRB(6!N
zp=u#a{wUbWfUlJ+pbNeE#`dLB%=|cLBUO}pr@@bKMb2P3{XEpi=f^kq^kl&lHDG^P
z#R%daoIItDJ0T~ZkPQ(z0~DYoPChPwE5HA>)FPJrJUd`!H4Vl5{aUoC@7?uRy{ln%
zdA~<?)wnlW+B8rf0&gW8zIhA%N*bJd6OXsvlktGAxA-DZD0mA=R541i?7+^+mI|jh
zd2_TZ2)St@nA7z9&+}ugxb<wE*(<aw(NWowdcOh9rs$qdh-~bE!M_gB<`vFAMbTsd
zB3)ccn4j)BUHir;3j7YVHBw;TRJ;9CYcmG6sU`Q2L&sv2KonAsi1C8H@9eG^-*H3R
z96B)Z4+$!_R3H!z)Xj-aeILuawI0ZyB0^`2|2aOj;GT^!Z&FFpkF~Yi5mz!O6CpRy
zm(ydS&_!C_MvS1GKoG^E>pouNK<VaosHRZ*OtUZ6C<UC~XfF}RKxp!;l{hFC1|l@-
zp9)7X+uV5$y<kwJjy;Ms{O2S-gvb_}u@VBY4fzIho3>{Syk<iS*cIAbSB-!fpMD>1
zn8_Ns5oM$nD69jc6SRdOC)&WVfpk?qF7%b&6!mlNp{8SgxO>jdUsCS|CDs0pgb37*
zE=OTc-8QdKUGL6%Uh^ZLT4GZ>bIaBGnSS;_Z;sApW}{JdXD`hDMAhm?S99{*Jq0-T
zHDYws@coq=>CbVBl-Y7QM?YDFT-*=Cb-q>wjNxoY0ESJCc^2W#Y*XOCzYf2SN40Fp
z`Hv*%fI>fAI`#8$`zJMczDU&bY9@0Bkvf2T9jIg9%yEjZlq<WcX;a_V7_PipfrWNW
zH`}MYp~{XvakOPh+Mb5FjlS666Zv%8jN^D#O*G-M5Gbj6chq{h{$#09?OI;C6apRh
zO;l!~iL3Lb1jK6gs)VxMf(`)4{&fkDd%W2mHIe>7-)Aa}C+Zp&E9vb*JaM=FnwOr&
zGR$y5c<=whhJrfL3nJfT5*R+iW{|Xq0|n&8M2p`F``i4ew~w>EeECHmT@k`?*w6T$
z%2J&PA0qi(W&PeljJJSvq}MxO<*Y%Fdr5b8MPGS~cO_Zcc332^r|$fAFi?T`zZSS_
zDZi7+RbzE#R@2e^b!k&I?FDGD94&Bg(5x>A#u&3h%i+g&#&Qb9h)wdV=-G&4A%rE+
zYWdi1IG)fmxB-T-y2q7?te>b=K0c1Akf|(5CO9c<RNZ<$AbOisxikwGgJ~VNa~4j2
zWM$P&rOz1aYP$|NVrR#v@`mDI1I{f>`LHJmVb&#H!y=;^vN=EHPd{pD4Udre;#mW`
zzoP6>UqAm=?N(r{5mk?Y=j=<YKSD56eDs)`6=!A=YZA2lcxuZ12yd;e3a^VAT~2;`
zi$n_|bK?^<oIoMpL)&gf$p=eH2-RTnwniw%XgrcOdI@5Eb+8Ne<8cT<M~r{V5$W3I
z(4Lp0;1CqGwANUZT5V+U(#TriRoYTb&AuD@Cv_4i9AJFj`8Vi||83+QX2E|6@&8-x
zeMG*%D1IV``5$He?-z#z3xK%PtS5M}W~Up!`jf%UKlXR<etQCgncQ&uj=1+SDmZji
zOjg=~vHW$H`QpcKfa0B)aC>Ev1w&^+Vu1W=hlK;k=v-KejvfT%&a+BtC?Q?N!dRX&
zWm(C6sn^{r&V9SvP+b|&|LA%0M0C9$HW#p+Zk50P;cI=nV)I2O$n(ptweDSwl>UuW
zi_CzDclX6+5uwWy{@+<*oND*1p@WU4n+H@P4zE`|OY9n02>>ts^F)gvN|>sDHe&Iz
zIsg8>ZGF&c%-~J0Gq@AQ$?0AH4Ksag+%ix5vE_kxG?@zc3Z@$Ufe;J6mHwuPs3FO-
za-`^Ctk+`7>^|d{_hLbUm@NbJD1`0LH)!o+*J<1eMeZP{)HEZE`9Npz0aJP=VB6t1
zgDt(g9bg1lS^$s^KM~P;xM=3zRW#1%dAQ^3S6^VA1#G3`!C_Baq5!Zo92df23pB0G
z82n@GnNpKoTEDK!r#$0186wJav`z6;{^3x<Do+cRh~aSY$h%JdiLt~XX*1X)JlggR
z<+J>qkK&-uisM<A`-S%R_MG^LvOj0#Zh}z^I$+6P%tSeK#~X>97PF1M(rm#cAUNp#
z)DWw$d^H<73+<<@4Wp)&i{vh0HRbig{ny{Ac!+DsbDY7SFYfyO@GTGtO_FDD=zj;~
zEFrFAg_|J6{KoZ7D)Pt@-vPMnOk<D`&s09sry+&Q$&$0SE)Z<1NesAB3Gkl|=M$f(
zI617e743S)G2IU|xn`jvJEOk|7Dfz+$m$Kk^QpPJ`XN(>0uTeM9Ui$UgZ)FG)qHRK
zrQlG#J3C0=;9nasAkK<Ao@@?2LzZR}$1t!Ea@LDUZ|x9xWT2NpOYUBGLhe%@O`mKO
zLyE^6qdie}lfx!%eCV`)0c4=i|1KdfUi|dTccoEOY{%S%87%>qM=wZaVKeWa)!Xm=
zrSQ?j__*B*jdR*k#@KgyhItF^#|+<=+Wz=h{r&MJqYF!7hSh<D$&S$N3cB;-XAkv@
z@%0H8s@IHXXj10Sq!4Y96NWDv2emcZ4BFe_UseJZm#baQE?oTZE1f42dpDRb;QX1`
zN3r;RNR<D9V835qQ>07VYOnCrNEmizIf^a!W!~foke}^oC@YBPBQ!S{(9TAAG?GqD
z2CeM#?V)H!feitoEq<lQ$&`ysZAs%ekg;Clb~p#nl}!87YwU@G{cATs)Q57MmaH}2
zcu{+Tlc7T7meB{W=9yd=S>(+2kLXYagcK~GFB>vlKH{WI?Ht&p%|r#g+8nq=m2XlL
zH6Voyr2wG-t=GPlpTfYDC0V{!+KP!|#Y*2P_)-<&CyR~<{f>s!Kv&0o4qtk@@kTl8
zS_D5wAtDT|YwwpX+ERmLP`%e02gt;cyK=WLFv9igR%}B^yC&*;&g*bXzMQzJ;~tG+
zo?put<<Aye`2I}ET**IaRrA-|d5$kJife<-cwa2ZHhj@QIsl?boDIdzYwvE9uC?%h
z{a%xm4V&#+<Qe1(0p}?tuHg0`ILGM$L-LuLeN7?sr!WLh=u5TI#`hW+*1?`7wPain
zGgE+x5W?FIm)}+X$?)IjZS4G!VJY!F&nQaRyNhR|<?Hu~G7NBnD{t~&E^S#@LUYp1
z^;4fbud?ej%Gyi0a&v9LLixJy!do!R?*RVLP_Nt=d~c)*Ikc`5nHfEr1z((%tyaW=
zX>%q<LeF(PtdvV@=XYLfT}U>{Q$Vu>U$Rv^Zonx+rZX%%)Wd5{<Pg*7;Y16g>nY{X
z>n;7_1^B}IH~HGotu1pKCwtprBzH+9lj1)`Ux)(@l2eS;>`}A2(Khh7uqg*GwM00M
zIt6KDk50XSn0u)hW4x_+>-U!|?W8oB@87gtupl>gCO4=@S<-c5#4Yr+j^mk4!qt3H
zB3}Knn~XnbMq-E_Z%w!%eerG{>W+gLvSoJ9$F^dBJ4)!5xP8N4Ju?M0=3&#{yq)fu
z_nQlG_Xu~-?9t3NQKM*GcU*goBjTqmy)^fjVH|83>3quLP|*VGMR%}7xdw}z%{h<!
zNjUD*g?p4AVAoQEHsr9#E{3I!51o+fLlyi}#ZrENY+M&L;T1X`Yd}2Dp!XD&-sa`-
z@RtZ3o@uRJTwJbYsNvo0f=MSY(58KF8GJHmi;By!p&x3Wzw$2VOm+@<&p_bk;HQw`
zd-BR5w$OoDrkY0J@?cTvkFAXM`nCYeMHbcId-~|yyub|Wy?-J&^!nNQH!@$oGgiB#
z5ET+Xb1p^*KHF5&CBZ&F?#GKf$&A8f224I%HlDr6Pr@|_u13vZtq7UtQ)#lF(B~uM
zW19S5yv%U?GlqDec(e5HUIDOrVT3;O=V(9MjYc3s_x}WM8-FH*#t2Dcv*t{<i3O<O
z0A}qJU6&}<Os~OvH`HCpGL14Sw`7dQrC5Asx(-`g*Jc%75*;5LCAvoEt6Nvk4vBaT
z95gMK0x-Hn4(M@|GQCGN;Bc=ML@&9cVdw3+Gzgo&M|I+|dPVx3*0kNq^4br4%e0*0
zbcnQa_S(a>=x<LuX6fpc-)cWHw67|94$6NRt`;A*PiFBydSAdTIsnfxb<xwa(qGgk
z9$Hzf%*o{6Bpl_|D7~8>AjoNoHyX@k>Y%;3?7=yWim{|co_76U%IO+$s!1b=fmUaV
zsH<l=Tl#0);Wldgp5`MU?l44kfL11zU`<t{(btPgPlft#Okv;~akBd7ehPi%8q|*O
zDj}|f$&2v47Rd4gwt4jP(KG2`VB#<U_AO9(!JsD4W7jyP&U|D;fW~W)rP((}L(hMx
z=px3Oh@OPMOajFZ<Y%Lvw;VaQZ--{zKVUEVgbUh(CH7myW&vxmZ=~S%d%@eo04jLt
z$&;_kX|DqaQ>0JfngUrPgtIPvl2mCXguCqUj*7bar;33K>0nvbn0ml~{>pD{4x)20
z7YQsX=;MZiH!p6#TG^Tjn95YPJVHZ$-#BK~qj%0>mU}n>CF?&j1iZTyZitDuy*md`
zw1i%J)5>>DZv~!k5CgIP4ZUrUzyCocvCcxtOpY$8z3jL(%r^YyYgPv+&0E8%w}}2K
zmsT=-MR|O)bm%xzLcoMp^sdC+yxLtSBl}x&;AV4!C#)v<->*bLbU-D`CK(=#@at9I
zE|C>%uim}R0N|L5FRc%4g5ti+4p*zooJ|&QykY0_tK-Z<+@|9qJO`78f3-{g{7xep
z^eva0vGY$ztkHURuGj5fA23O+%7NTZoq4;I3_<m=DDFm0Txzi+1z>HopB~}&&bVs<
z!6R;p7=@+0fR`krE}@(dMuP^d_b2i1-@A`|z9Q5>rvO;kOOIeLp!~?wlTQjw%jAhS
z{hDZg;f>K~b7yhjrol3=;Rtu%?oKbqWm~=T^cnP8DI}SJqrEo|K$&5C=IH6)sRnL!
zzDdy}4Q%?SI4C^Ef{>I>^3pxJhL}{(>}W|Bz(w0Dh5h*Ywc~tXkL8D6nb0GRsgi?k
z%6#J~cOJZZ(epI<O42i_^Ls6GAKY}ohOwgB6~|ihE^~MGPFy?0vzuPNvS*?<a88-K
zRe{Xq?Y;<mI;c3dpbyFepa7EC?kCz6;llO{PI1Jbm8=!qq8IR*l4a4a!iZ(wvHLHa
zESRRU-nDMv7g*v`Jn9&j@*6VP)vr+es48|gPCQl4Ai!(v9Q^A5F%kP%7OClUR@o4W
zeG&@$d5-T+;0CV0-!!CAel>8yUjm{qc64cl7Qi);do?D{(k>*);!J@3^H^I4By_zX
z_pv-v`>bD&^Ekc?2Q)Y7M})mhN!?Y3)YMsv`pvor4Sl|H+OhEfj565f0qvB?iisj<
zN0&Ha*Br3FMHS$+m^a`K#TL<{M~<YDk^^42cs-x0P5=dipykcRqNgqU7Py1heJyq`
z0XF+x>vs^Z0sVD^(V!(++SZ)Sr1^4H1G;uYog7cFGQp~cJsshB81!0x_ThGq%OS%Z
zK%o~LGdMRIA{!YW{Ms&P>Bt4617!zl<(XUn=FZoKAw^aMaPPe{F$Q>lnH29yjJvfU
zO(KLZUwH9ly55DI-P@P)b;&$_Foxf8B!zUMM8QDTd+*u>)@`VO`182R-dML@yGeEL
z#@&cb=f+*2A;{c?y<Mzzd3$zC;;f8E!|nrs{yq$QwL419iU|hw+99++O>;p9&$0}J
zxv#=W9TE@62E54LA4i%6d1_A2<w-R_shVYO=g<HVWjPG&c&ouV{9yP`e#vo<mA6T1
zPftf|E}az-1+{L4f|o5<27*eOB9vJ$t?tPZ4vzw=>LR1IZa$R9E2m>^#R)j|!gG{>
zcK}^V>SK|43skV?xgO-D9vv_P+GNcy3-;MfPd*{zJDKsxpOD?S5N&~U@P|qIU>t@V
zb8^f!MEx2db{Vz%%ICa@g6@n-6hqdi$(dE;yFf!&$O-83$6T9jeM62D><P`frz1_F
z7j0wC30^x{;psNaN1aR%nkP0hv&uY8wzsAdU>RVa9(kFXF8ij+ja(zW=|JpEU^?*%
zosK-dQx1-7Y7dk+0IyRxYwwEkSr+r#-#HYD8<L|8JyU4L_-{>5<fe~TL`@O@aDFwK
z%X_u#Yapk+C_ja;zG+YQS@g!_(3-oL&!01x%{BUm-w~V3rhaP}#Gb_8>xM*Gsn@}$
z;)>+DVr2NWKFYXzH0|o5d=_WNP{e(;BP*tr)DUJV0bFW*9P)<UX}2VioYIrO&w&<^
zHNRV&Bc1?~_U!+J95=%t|Gx)QY7<}iU*WM4=xd|x&i_ti&;Bn)jY->hlp=PU)PpY}
z!przaM-=RoYoi3kq4{%4((<q$!DeDbQYf_FPl-g_lNZ(xPj`qun$S`UUFBOz{-p=u
z$#LB_9Mgj9?e|ZFu1dAFbB5<%2|Xid!iFQmb?*JNstYKV9KjVS8{EM;|9+MJR<i3)
zM7G-L3V*<BlY8i@byYyJy5~lx^2@Vcc~@AQ_V|xy`FXxWFiB}2u1CF1X9)*%*Gz4-
zn7rg3-h4lnAl`~89bKYTeF@H~v9P@cI|0pI=^81jgXvxEQABzCx>)&R(VCeQWbUd`
z3T5?36A2PFFw~%M30oBFTBh6$xbm&ZDcw3M-Zn;q3O?P(_(mqfS|g~$?XDln4@ruz
z_d&BioPYh6W^+kCXl(f`3&Mi<t>H?Kx)tI4hGGAh!xLN2cggoFA|G5xCj!#ZtBn}R
zlL}9;?I5w6`Y<r13&?hcyhL`4wJq{)-Z|Q0BWNO}$93EBD9;V|W>ESfZA-mFxWJh(
z>Hi@i)uD$Tl+$(WO@pMdV@UOZ)%=he53zGvI320k6Rg=!Vzb5upfCLK_ij>+RhPmY
zNoQ1c=jOZ*hP=f(#us%9Y8fsquh5bm&9g_n|1v%Db<D4TB4cyuj{L01)RYGdymmDp
zuzYj8qUr;`WVJ!WzwXE%Mv0$gjT4bl6i5D0dlzh~N&k<uKdUM5w4@ypJg3VFLGFhj
zgp9G$6j3PryxpsF*Sk|C7f#7%*}+M?%__5vuUWt~DQX`vlRbmFfwp+!S<2n=;h<gl
z%9ukN)tf&0hX-l1BxH2j!K;9$FzJDqkub=}I2;<R?HqSZ459}b3;>H>(%ZO}81vVB
z(KY*X%yU~0xR1*u2M15U?{tQb<qG5Mon2gZ?D+EOmB&)l)iiZ%SBv0V{q!yC!euq@
zp6aAwjRs0?%m(DP_cImu!jhaBs={?P|5oRR@sK9{XZ*IHjRma!pD3}e&Q^Nc;Qir?
z{PIthpIwMZnG3?P_?N3B?WQ~y$~x@%pk0NSNXV6$@!_-F#weiTB!9r>!dL->M1JEZ
z;ITLBr5rjrrghukOFjU%^|`@aJcQ1EGL6GH)y?Gz9snJ+bC~^HgS04Dwk07p0?C)p
zgDIZ-M6(O@K#VqpRQ^JrXS*SwXh;-ZhEKW3`3JQ($Io|M)Tb9Xl5&GS0Hqt@qYt3S
z)c&Z2MmF_k8`)RGP&DdiPg2q8xYp|9;8K2uAmVwz-fJ<B<_{sW`~0gH#*IV)Ls(1U
zXVCd@H1O+)O&odrrgz3SA&|D=H4{!Fp((<%PqHgS^Z*Fqy$WJk=*_|T&SIQ!3)Fa<
zK&R~nQ@f>Y1yPMwljg<J$K~&XshbY#^9$<K5#;%ZM?e$qd~rvk=K5BNWgN68B<WpH
z>HOT?bV^sY*;~QSu=z4EKRwQ$$P!DBH@6^>ncqE`O-$~<G9&P~<^I-*teWJeGNV%d
z;&)UODJx|E(%63LMclEb+E<>XwE#vVtUTQUD4m?QIhsqG?2EwPzdgVnY(p4#ni9QC
zfK0j4<A8}L6vc?XI|EsEwSrEgn-k5<OS01Ka}o!L(9vWQ;77_DFxwI{%X*7Wzr+Y-
zW4xh^rAYA)6|`gHH5TmP=P?W_su%9I!UIP6Z10#YRW@bsG}I~GVNa!FAP7#A@3yy+
z!lj=gCyq<777ls@UplQiX<R&2Sy=Vh+oT(y|2>}~y7?c1mrO=3!P58{G~AOZj&&DR
zW@fR?f5+(7x>9pe6WMgtWtER-Gke>Jo8L6rJ^NSnOm5&`#5i!9pej)Gpg7MwDD(LY
z=5maQ&032RugAe_&XT=k*E0&-w4R&8XPzi93w`d?71)-E!Z(ZZ{B2kNllcF?G3tLa
z*e$Uh{F`_ZYdi7c&PAip6?a3&?~L$}r{D4PgQJIk{ETYbv#@iuM;zgq40Gk_ES?0d
za+yc*KzRyQX!oP97ddB0Z+j&PN3N*K7K+?PQ7gZVXcWKK{jT~&S8nRx?0sY%;)wg>
zJH}7i{Uwjq2jA7&opDl-t|sos{+h$@goZigSPN`)9teBWhK_!vJ))1L4`B~4&|;me
z7fIsB17`Jm+INQPd{4w)5TmMplV2s;W53Khm|ZyL4eU5wN4IXs^rT$Vfs}wl<>i&R
zwm{>9QZLiA_|)#ux357vc8<ye|Mr1+WJ;{z&NUAwXXY&FkJ{Ld4__?^;r^jZf9|;A
zc`<1a#THBfL-zu?b1cIb+<m0(RbA!a(HtZ-Hst$Z9r=?A!K)X6FeI654AzXY;kqhZ
zb<;7!>REEq((j*bKoH~5&Ivp6%Ypb~A(Evp|8>wG)=@Og+gJ%hsYeV=)wp3hv{HZW
zkb|#9<?qt)oEG({eLWoXm3X=9-ZgM@&Wf_aEykJ9f#O-p+AWm$gy;y~w>$ndl+D;U
zn0#MCW5WW!W$F%Wd)K!Y&k*9N%%B`Q0N0wVcIzz`=oQ(0flUGCCk|2j<G+);ecITv
zn$dUhOMIpQD?aru9Bu8K(z!!%{J~vCEaAKdcVTvpaaq7}WBySQ#$~LUB@?H=Y~>pf
zVFNPG5|#U@ocJYkI1kx|Yob-W`z->Q?zY|H+Vt+sFOgr}P_^4GF6L(d^i=F@>!_&Z
z57!L<i~hiX8z%PX-QYAXWZ$4)%u0H~Vo`FN30-OGLRA$H3l>d|Vr7Q7jW<E7+R>(a
zw{Z6M<U2jedtUC~^^%88Z&CYHw@DSHsL86QZI*wW@7{T+#jb^)%<SY(cqC&{*?4U3
zrh~A8gmGLySMY)TKaF*>W+E`B+_S6}B@x(*r(WmcY1*es%s8CAF13lfWTiX>&})D+
z@I|ou2l|wJ_NR8*L=+`#;Ge!Nzy;Bv*=<X&V1_*|uG)GTZS)m8W6mDG!h?CA?i!;(
zSY(?O;%*dvkNwUw{jUjdF}z)=ZZKuXvuPK00bu*gq*j^tH_InH{$4KuvQsr~0c~aj
z$04^{qi!)b89!Gb82xalLyKN`Q`T`j)tJ)`_$jZ@p@_539qJTCz}v-Ml4^&&x=lTF
z6LxU>b4HuA8`Q^003)l%MdX{McV-ntojVy72c!;2w!)g&1XcpyHCpZ9Bh-0?<cJk?
z!(-qVyJmRj)!jMJj|NWIwb}(#FW|adW)fsvURdC%&`&uzia)g*2c^zG4IG=oG<jS^
zgZ4~8ATlsfM32+1A-B6kv>-Tmu8NSwGLTH1cg@d4?Nl*=?%#fKBSWl0Yu3s|<pLBE
zX!b+JXWmMpUPo_QnL9eodVz-JB^qQ$%Xz?yCQ`|$Dfv~lVQKFEi4B+UMJ4rb!`jPi
zVr|DE)dvWeRw59@2>=6(T`3_<rUlN76rAIsV_mjM@*&#}Cq-*p7YH@p1z#pNyA%+I
zn9n~ePsFlXyJB<pOMB5eih&<^4$0d)eNrgp4-U=o-n+hjU6{ci2OVcAfmTCk*MSMc
zt|KZWm@+Q-$Lz0>iFms5$io+Ux3msj(WP~t?9ToOMe-5qRt{}hn=v1yP&KWqqh0zw
zwn9SKj-smkL9c6Qa~FXJu(!ZhNGGpIl@iC*dSP4kcoaZB*0WzPhwZNyaoRU>i__6w
z8xuZO)d;C2+E#zi=k%gI!6+WJAPiypRD^X?GiN`9Y)cW<Y9U)$izP3d1@iK&d%j4L
zb@tZ`I}U+*(g1y&voO(`Ynl!{v96TN|1NUV?#EI-B|Q&$D~X=Z$Ymt<Y(%W*10Sya
z$chq$T_#O1DZ2-Z=kY@h?Oqv^u(5OgKMvm!lTmW5&=$dDdv|x)8|T?IB;Gv&7}&2H
z#AO`^X}+ySvw_Xl<6I9-dISA0o(SC^w%B*ucDXE^>}oFsqI5D1o%#=4&Tf@obC6M$
zOnhMbP#%c<!rGjjorh|)n?L{dFDkhE=;#yAZ!Y}bic_y1dE)>4%8|9C%1}~D@95EC
zQhxT;8A-L4Gap?ET$ChXoaxk|a1h1jLX>ybP^aco1Pf*7Z#XDZ{f5&59MlI167#%+
z9JdLv%1ZbT1;OAatEBVwPM-Ki?3nteyDls&gjiU#e~;(hy7k$Mnp`=Y@TT~iXa92U
z@n7C>Wvvb?!{%oUhytO|c^$4<uZ|-rrj2J*RGuh4IRQ5q<Y~Gu9{M_Jmj3%7Kw$nz
zItb(5Je4EV$ZJpfV`=9rG%l}3^6C4iCESPT>#tET7RnMJlyUa?B}>bx20{C;n@&vP
zur@@@V-Sb|kTWK4(<J5Br+_F3N%Re#y>$X`3V#M`g*TC76=1FEf&Ds`4Ir_ghgMdX
z-6ty(ob5BZp}gk=pTPYOmU=r~ydCP%NW(F8eu%3WO!<B}`=}9KzMyVvYgL|6``!}J
zkL=nVL>o)zmXO_9=aCG*Z~usK_7=dxr)JdV<vh|_V#Edh#<uY%wky)X#9x4ylA2D1
z!dK!p5_IpK&8j~6Z?nDizw--W`wmoNv|vaMO)yc};`0!fv3w}?ukN0h-6`aJ_n^<C
z5?|XWzGu3j8v@++UH5g4ASSm6HFkM7_<rS+u5#CyI)5Rr8D_ajA(})&x0aGXgSi@-
z6ZfA{s4}JhVyOMk@*6ci;J&9dr?Q3opUz~&>eK%1>04fagL)Pya@qc^$CSQ!{{)8y
zA25^w8O2G!2@Tk%PPB5mPsx~fXSwbI9eDQB+O#4suJY82GLbD@{F9|KD>5FnI2#i#
zAAjQ!kAU_z{gn*&-?r95WzfcYr9NkiO3-EID}7&=VNR<Wlz;V1V{Awp5BQ}~VOv&2
ziri<?WV+GmcQyDiTc&2nHCStjG>IkA+{Bf&EH-dq<BadP@xgKV)oeI-i)E+~yX_Fv
zPzL}O6Q4D<gX3Okp1VO02q!Ic4Fg_u2mf~S>v0o-KNe8>c}JAzWM%4Pji=iWt{hF(
zN19iZ=D*#==o%v$+v`byx@fv+y75k3b9{3klfKNA4FVN(9}K<b%M?j5*d5s>$luL3
zKRNx|k-x7fLw04bBaEMW4?5Iey(=0ex4$3A-?w(OO#Vd^UyCG;Aua~p|6nwPKBp4?
zfn<n&+OHLTdPLw&WOd@3)z6zkULhhaYgK|&oMgyd{d-Qs0GKLOiG?B(h52Q>y+IUn
z!H|BtMz|o+CRk4@%fdPe%~*4Vf`-S`9f&5;u0hcF1&OzB-%9S`emU3SYV~=&_GLWv
z@L(v1<$GaOQMP9rd|YiYIXRhBpXhL~^L@k!Pbg|@I;gpQ?is6z=4E_tQLr&__`w$f
zQeatgx!kTc1zbLRHdbz%z4H5}rqZT^TZQ?=dFhRbX7<J_3EM9KXWe9LmI_5mE2uL0
z6)q$3vj1)?xp=&i+We00<`0#x7HNe8QKKG1Ch|Lg<a%m_q-KR|O}uU@wK-Z7*Zt{4
zV_crWn?W<C!T9g5y?Y^wpdIs;{ex~0hJ+d9D?+tPZ&hCHbxJU0g3hnYkv2!I7i;bp
z|Ec-k*FgS%H_!N=>e<3ZK7__NL@JHI!);tQt(tYxTDM6D=w>)D=CB2uk*s26E$}f-
zrV~x&a~hMJ>I4O|%)y76-V6^%50CnFX159<rE_s}XR5hD!2vshroUO*8ct%rr4nyn
z%tr1VtHPf7+IY0M_AyZPp%ho{cK=?>UR0`3%AJbMWIsNGj=oOy4N$Z9%=3lIqb+!0
zsz@zlST{D4Q~OjvJc^G;+ZjX=Mz?u(w_FsSocUQoVh&{f6L;j+f*WrkS6#(oC-==;
zlc)a$!7D7ubAA9DI!G&U_+4+X`p%!WmpoBp6Bz8OfG(qX5AWZ!lVGn~6YEy8a<!#c
zr;goWi+qN>4LgpKUnT6^<jTQfQ!G!Rlo!KrQ_X-0JQ*rO_<2&eS{&5$fd&ATWc8ZM
z(ZuV*;pmOxniv0i!`cj>lc!n1wDqOnPTmB!(x&7shn7!^LJnWJLTTZdCt+E8K#Ry{
zhhv9E)P!>+;wwj9@dtAaPO&VU>`xme-T<BD0$m+Kmm0ReD_zXZGQ*m4KITAqhf;Kv
z&<8}H>`gznuj$fI7(wxDi*ogSWnD<NvEJAYtL(A}Sa=xlo)aacVV^VLd#SU1u=fn#
zVI~PcT`@E$zp*C8*j_lKGAinppb2$4(FL$7<8W_}s1;aZv;G}vuc?6arjHA0^@Pw{
zt=Za$hR}X+(g}Ct5^cG7HJrlJMo9}lGJBHG3o~MxdAUb|BJ5Sndo;}p4&Z{TjzY$s
zWYce5^2iVSdtI<dHFy>X7xJ>#UPBSSk?;7(ym#(Va^%zOhb<3vtul)GU0S&Y(bQko
zmEH?iE6PEyp@|lguS9>6u71u?^;#1C5NG-DGVE4rch;)qU80BFx0hkGIzvcszzb73
zKH`<kVCsU|je4%Z2>z0Kt=S;dRht)*C;Ej|Ao)i^T4u0)rG7%j;2=f2ONKjiz#3Tl
zl4xGYH80a{>!^h`XUq^^W+Xsb7C_5?PK6#d9Jmo8TwvrU>9YL&Y^d$dD_!Sfwr-?>
z&=M(%hQmUnNM)}^L#;bd>L#?bxO}5}t_Iw~IA&Y%aZKZ=72Z}ELtmER^8@=Y%6+!4
zSpg`YPuiDquKR*kDzMZ0(}-cS1EEIThJ!+(xRN--FL4*vPxBQUFcskAu%xk*g4Vj8
zd6<e6yz*X-tRc))C>z1}M)Gr`L<o7z*Au25ff&0RGgLvjZBy7^!-?DjT7`-7tR|on
z|46`Fn_Dgj+xOml+WA)Gb}Cq3(Xc=C4%dtMt1_}r6RAp^RtzVzq;6T-@Vz@G0Xp@&
zftf15%J?NgNhW8h!e9!2Zp9n@dpk%)!eZYPG=w(%bx(hOTg<PPH!Ci`c?R#CtSOMG
z8kzYa{uXNXjveENxeSOM&Rg}_wFQGH<DR>ZTj4S$x?^iLm!|jz7q&$@d8*|?jtDOI
z=$OMdl#o3tb0&&<AI7=>-h^q~#be}ADZu~9wRCAYv`cj*G>VOM7?`d*@6`grGjeKu
zIs27QhmM;xhPv}^o>+xNnp7Xtx5tEBS`83Ae7PA!01D&Dh&2vX4^YkA9^?a2?cJI=
zMZ2d8;XFEa)}Y`u1^BUBvnIxtWJJ~z!q;tiT`6j%vckXHiQpbZ_?nK3bWO?ZgOe|T
z1ubi<aiioyRcYn-=(6l;OvqeAXPHA=pF_DI!fT#MY}Q5yheG{Ag*C694VB-}xg=JK
zbbnN}lceC`S5JzRxus8+>~Yfh08TBjX&5#7LOM-kcfR!4HP-)bpqKG7RR1OM@;Rs;
zMG<e1lg?uWiRf&zfLtU$*|?h8CTh^PsWe&T=_$(hmxJ+>39&bh*HL=itkSMvri0(7
ziTS!attw2WJx8Z8;7^%yf(85fb`yW^ouK%i$`xl$?tfLZ|4knc;EV~MCQbgkiSqD&
zU?(7->=LmB{!2goC#-y8@WW;pTSl%dwxzq{ImbCbR>R!wj_Zjr;HFaIb1w{ECh3am
zm{=KhpE-)Tyi{salT|1Q(wuvzLL5$3myv>I55#zZC~JU|YZN2baSnGTrj-mDRJ!-z
zz8)IX%wvot-qz68eg|dlAt!HdtBFj06EdJ}UhB6$pL@Jh#VnmElyoFz7#c#!bui7m
zF`+Is_Oykzxt1j;@Kjz;&%Q-6t2Od)r5vNB?HH(rE2>&I6bi}b<>(rXEG{Tzwz4uM
zU8CYp2T46b6#kUAZc|K9@G1OxQ`;8AUVeLovaQK(`ZGhhC>K2F&!*-&2<Mr8tVZ$9
zFnjN%{af3ozJPqad}PX6SL_+jg}vk6z_jB6Vs}Wyy?OfRuQrYJlkAqbcs90u!Zo|!
z{=MtWdqD2sGe*bpoc0rXCErYUQ4N7WTbLKNC@ebc4u<1Ogo2g|3i&{IziXj~ZiQ2B
ze+}g2;yv?PgzJu2**nGKZyh_rKRZgWj(kx${nk<9vhkgZho9Xb+6bIHByjQ=8{<ly
zK~^wvH^V-pY(nDuwgxsocy49X5tsT>cSnnsv$Iw4Ov0FU7<6k-#iXGNaH6xe01xF{
zQ0xM4orUk?J6U>~?$14XU#|)M)=)JwJ@*v(aoEP1P(D}pAP2+TYVb{8Ejb`FMf$3V
zth?b?_<kYMPr0k3^4fg#dOA{M2)ghw`BT&H_3#p7SWUIm)SXh+qw0+Y-vVR1<u}eV
zafrojXi<D80$2`i1dlb~?l=D~?RuB{!zam5L1Mc^C}4Uwpks-14FDcY|FlZR8wgjB
zUm>WQ&+ebI;??uA|DzH#|0{p^B&YF=I*k0Sa$nWy_j*yxb(6@;{7$#GF5kN0%3+RH
zQj@2?&IE=8{aGuxaI7xk_Q@gBD~xr{>g7eOkL&Tsm0}93awyVzk)At`+#2+oIkxwr
zhyl$?B+awf%Mi?vkJ7#G8%D$+3)HzT?`IPw?G$RY^qY^qGS$;Qy_AaV%!v$l^ZRq@
z+Wt*?fHvX#XTJ09(c?qgwF}MZ$Gx>Z(tr#ecty1b^1!#+@|9+9>Tvz~{rm;KkHtH8
zH5k$;daqqxO|w7#xlf2cMgP9Lr=4xn+ifg*|K0lXtB=Zs)x_#4HS2+4LiJR0p<iRi
z(exD=UR`rBSF90j`gwwcVedgoiXAT57^ZM!b;H&hDGNownOnPX^x#E)i06FJ8RcEi
znwfWLZ!igqEK(fW5J<3|`TNkW@Afo}J@z%5bWSu&?=7lnc*>)&*TSDRJZX0ia<90`
zg}eX+6u*2jA>WlhI(R5))u})ktC@2}v#jGxtRDR_q?sag)RdQT-_qu5&~Q)2WN&zZ
zvBDdo%!|RjiBpc|K|cndOh5dHG^~ZTdpO=p;{mCDU%Mrv@bwr5lCO#v`pk{|UL*`C
zMjdNFr~}3LQ;NC|y&=|H+RR9+beW2Y>z86oysJ%J9W;^A%C8UG1G{2rM?1kxQu}uw
zB~OalLgc40%>M3u;b>lYxIL}E0Gr3n2AVA56KBE2)#@Gtuk+FEi5*wt<ZX~g$LKrG
zA6I!&WYQexGbRVZpQe|`GO!1S_~u>KUym&b-f{2=Xx49-t`x&RoQzyg@wKs7P0zk@
z<YsyV`<QVkh>QDxz#+x|^^>yGygit5)2yc|=L~9gQ;2;kobu-A?jRM5+^jL;2nM5Q
zYk_$2FVGow)%T7iXXP_xFk->i!}`Ra>09d)Lo17PE}Ntka+lVzojI5Ofj=v*{e5-M
z63nw)ORn-1HdbzwHlDFzXS)rnsujnN_PugavLuu+75eb$slIcadF8p5w~AggyGxhv
zNY{0HTgJMWd%K+&gzOLs8*56Y8(1CBNxnC7?7SCO&wEUt>PJew_k~$X>-?ajE;d;e
z99eZzS}1wD7d4NI<QX-D73;80Hkm!AZ%)+|XXW)}jPE>TrXPtqa~Db3qqt5gS2d#l
zY&GQj0<T&p*J|2(Fzpi3uJp82(KJAn50|3Y8zohi{p#u^2PsYWMPOUCI5n4K5e?gP
z_v(kea{A=EVf!W50!r=^qMw)^p%=tkCF7f$8O*>Y=1hNk6Ys;YW=Pz%NAiZw*B&CX
zrz}r;(SBGYtV)r-2qOvjh6d`l(zRV8t?MA=j{eR~JI22gea~6lKy>L&-EkjJrk!ek
zvZmqKK?<kmzP^%H6*Pm<rjQr7EMw%zCJ@N}r6D%JScb;0kRJOdZ8_Ilx#)ZLk{<r6
zI+#L;Y2Uc^h2sImaNeuA(sUoE7qxr*_;spDzVsaWA#NUlDNq|UWvU2Lytzu{A0~>g
z66?vyet(j@6FWjx%aO~`DmHQDsY&8m%6UNFnbC|tmgA$d$@%(iI4}Q>QdGX2?n8rO
z5^H5?uj)nG_ITnN27*uZVB?jZ4bFagw&AX85z_1s_gLRRdH;c2;%dgCsL9st_67IC
zu^7m+8GqdyMc;p1y|1HRh)+4dfRC7au2`Qr7Fj2UNe#jbU}nP$(}FYZKH2Nh>bm!4
zfW*GG$22cFEZ-K0Vb1tnQ%?x;=+zuvsp3YaqG^^*h1dX@DY3D*MDnm|<g(RFGsm~k
z7_<Ap`s-7g7V8u&W=TXpp`6WJVnZ<We#$Qk#OE|xab5Vfh0k%viDvpYW6TZpY8IP_
zF3s`~6Pi&fZ8*_o%I$q(vnz)G37bGZ6MK;2UwVx(a{+ebOEa<~_fijfm%0zEs%8d+
zdm-)rrq;R1UQe1UW52VT-eJf6nVgwcJ#3d;<d~99aSRgooks~bxno%#ocHH22PtIR
zFzDn}e<#PWM5M>Bq@}Tbb{+0N7aTMSwch4NzMJ8A8kqn`!cm2n4DX+cgkKtH0BY}p
z-2fu{?XKIRjFn@7Wmz17U~y!1itW*~luV&cE2~)?2&x{7d)`I1BlOyRBu-`f9ELcV
z?w~!p@=FQK1^tyTkj3?Vt;@XB+GhpqH!8$pqyA?owLw@~wqn&zkD6s~T!2`4K(Y5i
zA&q3Y*Y2;z=+Nr3;AK#&=>yZcA!K>H=~VRY6^<i^bvT6)bC?t)HD51n;q}m?ZmBRX
z*m|D@r;QOU1u1lzk`{0@YTZNcjxF4;9;B*I<5NgW4d>efNuQ6+A_AZW**DKyRl-W!
zA7!EkU@O_=Qi0d}^I`DY1AJqqBxA!v;P!~)it@nsF6zrrz!!|<Kgcd$%ZhuuBh;p(
zI@*Qd@5Jz+ps+W=-Wlk`Q%3iX%&Dn!Vy8;X0;f?<xMZ&T9uIqd0jZ9jR2O>1_|Ma;
zX?9DnXT~TSWHKx((|2yibU4r4EHU5042%oD8GHdoLUcwydj|BInML@NOg_iTB-m+Y
zM+(bkxR|GBoEnh+=n^ZPqC4YQao!Ogc#`phbuA}u?5ir$NycerX6kmIWApt7HfqI&
zE{~n6S+sM#!Z(#nHTKXJ@`E;E&<6@;xxzxr>|WnjRn7mbu2dalKcj8F-^%t0nkZX2
z4}|d5d|yoz@0>f@x9{(H3*TGx-baIO>N~0`R#W(MoPY!Z<6o|QECQpu|A^%FI5@4^
zqKHRUecuP79$%uJHGpY2e5JIDTbzeo0QjQ98!va4<dBr1H6c5_LVb(IkLQ+BAIs@)
z9azIP2a%*99*=J>&5s_W%uFe4z?V~1`VYK;E3^T}Pt4<!Or;nI*&7jD`WbpGM!M?X
zu^)~jR_La1cf=#!4k6BDhAl??bY7R&uahZXu2D16P49thG~`Y0$kfxm`Ez=yen92z
zaNxv~mFEpTG#U3oW?poV4T=~L=iG3F{MkB=g90YC?`cvSgz9&J6~l2Tzeo4=wQ)(u
z-Ur(5{gha$F`{Xzx{gHwe_jloS+axk4FYV2OBXiFz@rkWz^3dwT;wzF{vDlS6VUH6
zv*K_<VkTWYU1n;izLB&*B;Gl)8==6mH<yN1yU{EDf`J+4zXThe6j&yxGaD3<3vkMV
zu;x2&=<$tG#a(XZM9=!Q&ciFNCq~AiUj4CsXG*Jo)U*;9jP2>cx(AVe?5`?+5Mq2s
z)Ywd`>`{g-^2z&@^o&`kLH|d6rMUbDfh3#V><x0vBlJKiIWvgVp~?k?-Ei^R3SI2N
zEv9ep3`u7g9Jq4_<>K<@;7&zRwVqE$g8oHz1U<McU>{+hyAYp(Uo}2|LD>6(d&RD3
z-Er3Tx<Pp#{H59T&)F&L)Vs{r#IBi_c8uRc{cmUQ2(q(n1b4d>IBZ0T+yl7*pc_z`
z4TQz9r7KPBj-49(e#csmT4_PDnBb<2=QOg*o=MI29hmqdaz=~1ML$(*K<tCaEgl%t
zi&|hX-dZ*ux2!^1Ru_A`>+`Lujw00HHA**nO8jk7#;We1X2x;B_h&3nJBfeps!d|-
zaAPY*JKaj;D)PHO=bRX>P;%;eUc{cFDo6o7%dF4qC<qDJs$Ga>!9R(l4NF_JKU9Kg
ztgTf#La9$)k5{f276mjB_V?vO{FEmGEpt3?p@AMjvOml*u&~g;B4hlTbZIFpZ}+>g
zf_DycZ})p12e(XtG(F3vOyT!+k0z?!P{<a&u$sdv3}F@u`odv4f#2=uJ(gd9wgkIB
zq^W=@_jHKJWtot*n|AN#*K}n(B)bZPW0uB>lxm=2Usf0!V-djgsZle7PI|TEjiqle
zF_pK7v57+x>(FL)5T|Ems`$w23IYCSs!J2){orlB%=ySIqMiSrB)Xu$)O`g@hy#Lb
zP4{<Vgy6_qevGwz%i-V+O-ORmZ)@DnGG(JA-QKhA<UfR5B5u2BIjyMZ?W7j*Q<VH8
zqq^KP7z7Mw`WsQV|KR#!6e1^0cI82alh%vsiDi|43dq2XVxAhIyek}EI0+|oBYITw
zACxYX1|vN5HZx&_eU#Q#i7}oqY}LJ~ipxq&Y;t<-%+_-1)IGI?$+yTJMMz&?P%#T!
zv1mxaPwkK91NoF<`ZMVmvcdaq8Hh+fleSX*KiGTku%^<rUw9AdIF1T-6ojatC@NT}
z0tt#zL_w4yH7X)fBZN+hj0z|vBGM!f6p)@My(ShQQiHT;C{bEyA*K*WLXvMe^X~VY
zGka#wyT9xE=ey2a>jJ_`LKf?J?*6-f_sRo(AcSs!O+50UXLw2)spDHkiq!e_oUYq!
z+oW1B`I2<kI2JCs>Pn&2)OfBDc4ZP5aRAA#I1y1Gt~D$ZEsL2jbjg^H<kjrB(iNjM
zrI8T`RO>EC5$!^wzikdgkL10)gp$=J(j$lBSydVk;l?t*lft%yN%F<(lZP}yhXXu4
zf|ym*Jng}&x!$a%Me<M@Nvn}G{UYwl?v9<{G_=<ayXl4)drJOwbO#$YpDP~!7`v8c
z@{=A2E7u)kdgKlmFbvPb4k|y2Irp2b2-KMd{c1q=C~y1WSNqZaIS2jSfUG~DZ2JIT
zFUeYXhdoRyJVW|Ib3h74tY5g@>3}uguhWEaCW>a-u=i}E&D4g|;@(RtglP|#*Djc6
zVXlXueu<bU>*}^+jMHmM_DcK=;FJ$7AG0F@&p+ce=efA>7lMXdrIxud`IStePo77h
z6<fXT&irGSFF_w3yR@Nt?rNzp$O-6c2;tJj@xF~qM$bYb2Nt{v()`o1bpve`^lo3O
zS~2Z*RbiFc80+Zl8&o(X5}ZphNh@GjkHwM=fefjmlmFRJ35(OQk?`|iYmI_QhN!Ly
zrrJYx>fr47w)}zw?O!n)D=%7PCn;LtNzBDXqhx7PcdhP|Yq+6J>(p>769o$G>%$<7
ziJA_4L!M=Qu~VzER&til!qO-l=J4+35?Hbq@=l^n=w8RG65KFS!vzLLpshyB<dPbV
z^qv58SyjE~b0e&C2uE4(NG|DH<3md{)s=9`(oy*~bd_MXgE_|y7$2N9iXvhr=WF{C
z4;443?%nbd-^hV@JxJ=PnKy&Z9me4V+>?Dnfs0>-$F85TlA(xz@!_J$*=WzKV0-vr
zpo2{Yiz2_G-y|Gp&@CXxnRgok-3p90cd`-(>^fL&t^b4fgGml}@#{BVFx`VO{L;Ja
zi(TfU`*<1~mo}L#sPJ8?)@g8g8`%HoGu|&!)F{aDA(A9af>(_LvAjh?-AnSNd26IE
zwSU;nEPm(c37B1!L<QvM2*aqeoc*%!v3Wz)Vr&u!n1~fIS6xZE8rGz=J1aSY*pqU{
z-hQP6Dp6-vEx8$`F12VPo@eN}Oo`9=>%xW&)Fy(NFwBI+<)PqF2e*1)ct;-WNa$dv
zqt|qgFyTbec^#w0eo%F3%}4=ZiODSVo~t|I59KbUQ8H6f$Y7QubE)DprnTjiMvvge
zNXjt~a{=Pu`fPzX$9D-w-5MyWW%48YD3q1p2u_<CToO4<NYign{~-4v>z4)9CDRV?
zpiK&G+@yafqgxY|l1Ihat9lP)`adPn&0k=M=M4|25mePIFc%elUs)`E$cz=)E#11b
z&^!_T<HSv&X9YT8W7m+a4=EX!jotbhK0m7fu)`Kr`r@%@%E(gC{sf%^-?2|#nb@C<
zAaf&<mLc7eP0&a`D{uPEaWIL5v?@)!DN_H;u|^k9Wg2<}DrCd<6vAN8IZZmItchRW
zh)>|u*YhjHLiQb^b6|e0pm=IiN7He7P<c3N_WUkM7Qr>C*>!3zDM&(G6*+=4kqt+m
z0+P_hEw&b40-8Q_5Y(z_plP!rJL@l{Tc&g2I1*@x-JIvPWqOFOGSy%RA}ED?dQOWT
z#lwt>fp~;vNe!HJ3t093qAne4ihsOS8tG{L882L>pxdaQ5L?e~80hk<Ye!(sK32zU
z>}q1_A1P=W5d+--77avS>XamHv3b#hSw)^KFgDy>VnJVS)$RKV(r+XqJS6$Sje27f
z*hG4xUfRUMEgA7{nu&;$NYM>?nmJ7)P(2zVRC~~K&Rrn^qd+6@Lnfh&cEPaf3s8bi
z9!ylssP881#DxgGW}1LxjJEZPon0~1bL3V-nOYC)vFM(sm{ZDINx{*v%0uiSdXQQh
z`NTq-SUO-2EpwvudtKqmJ)^+*Be~C3PP006i~4u_6KAFn5@M~swdzHZYBsU2Dhm!j
zXe}+;G7YOQ5;SqdJArbI;^j~o@jb5#!~+A5K@oxf<N_!l)O#;&jacZW-W#A^ZSsg{
zo{Q6zn4RL?i<v6;WrN>mNeQRx!sLPILQ|A*2I8OL2DL_#MDH0)YLwhW0Rb`ROkZGg
zsaLEaDd@yguY}>b^~dKrpm+pW^qG?9&gpZxu{`TQN=;n;wE3t%19}G)F-H{XV3<Jp
zHcMwj3mRIVC^eu960!e4n=XoR5}xPGQ4ukJQna|NpqrVMjH|T|Z2(5=^`c-SngG?e
zv?!I`#6m-q5It|ZCIR;l9K-2)aeQTkK{6LLckOm%s*la8m-N$a4I2mF@y~Sab4PHG
z*7;4PyZMjeX;YSgL%u^2PdJK7y^>m!m#A5<C-tB35YVz>X5~F`QkS^#C-u;315gi5
z@aA3&|M8G<ne-j-V2{S5RbzMc_Q=Nm$q!?6>?$@ZC}|p8(1<P1f*K0r4sq7H7j9XA
zzaH1G8W*nEJgqw7X@e<XOe{Uzs%AH&ga(MI_lv~@8)L$XyFLC04jy!?JN+3ssV6&`
z7I*_Wp$ZoB`gvhi&(POa?r%Hy5zq<?E}Mb^pCuh8C+@03(7Y;wd%bhbCL4>l2R;yZ
zz(;9!wX_Mace$7XOFVJEE1LS=%U-e+wYekS+}W?mv3nQ2u02K>j5yn!<)cbTGpze?
zFAkEg?uT&O{yYH<jooWK6qd~7oC@qdO?}l{nB?`LXK-bD%~$6VW2k-A7xLnxaHb{X
zS{Jv^={>Yp5`bBP67|*Ejbgq6Z95hKqCsjDv)@oeSSYvDZ0jZogF9qcO*KHQp9%yW
z6*xqoRSp_$6;`;>PDcD?*x1_y2N<64vBV^8s!MLhZTkbR2zHD9X-_hzT0imUnxviF
zay)t&X7xc+cp-;Cv5gexg2aVpEdcR|pzF|+C?FR2Ov5ImIk*Ib<3BVwIr&v#Z`&#g
z@tmyWH$&0j<Tnjda~&$h>(TrQTt{fv25$`j0lLukP!3lHh5}fuVv2k}SlgkO92f3&
z1&OGd9AD$58!*<a&aUxTBj~~fUZx%PdAJB*`mQ}1Um>8y6&{1%BNPj!#cWc4NUwz&
zF!$Lp+S~;^7K@oW|E!D=$~8^F@5=4v3g>hauL%5YtpN{JI>_P0#KCV^0&{8?!QbB8
z^ZN7(`{lECCCu4pjj;8?`rew-(0dyP3F>#!mXewyq~h_C=6R0eF0%(ipSlaNB&wUh
zG^+Y}wyJz`vFy7CXur%7X%iD)irqRb|8bN2>`n#wc}Kf<h~_we=vP&|_zuo}01nmQ
z;6Pa+ruamZC-odLczmBeG256vawt6u7Ju92+giX3Ox;{gF(Y7QA!Cnsv+UbC61}VS
zqreVz7#6JZ>y#i#E4O%-yE(Z%(B1Di(k(_Wl;5>3%o)~nQ8;Y|p$$iK#I+V`H!f}%
z8F*AuQ{=V|2@ttk0j#rDPCjK-3R`{9bO1Fu(4a@1H8C7e!S6qAyN(yWt7#(!A_-G4
zst>@9KRm*|nJQ44s>FvqdZVB(s8C&L3E#3V>wQe<lD=}A?)Ijy8)3IccMlBJxmo96
z&d&y9$)*V}5r~R7>6f)?FKgQlMrXqJ314RVUv82u0j{lVGVDUOp+0hD9MnM<oc^w7
z_xDioEl42nK;=i+SP#Mu^iXdVu{zeNt?Ypoz-5rso`uE18lrX<z*BY9&11CiNF(40
z)Lanp3Lq&s9qyuc>eR)bCf9S1;ei};asaZZra?~)XgPU5aOEHEV@|;6Uh6aodn`7Y
zVpj#YXxd93R3Im*EiK8%#_&@+BM8|e^|8w9cy?=q3*m0hwtlpvtK!Q7xGlFb{hVB-
zlv8u^T|X~QDkl8Q(~lzh6sq-*&0d3&_9$B0$A&2~7vrG5D|eOpAW}hYAc#}JF4wOl
zKaB1A=;@?EkKM(%P|4atko};G$qu2-bg^3F>h!mb^V8j+=1nkwPx82XpbXM4tjovE
z)y@Hfc|izn-fWha!cCC*s5uIt>$%z<C9~13u~8pGQ6J;nY>%p-s+Zdxh`m~gR~0RI
zmc4fXf<Sv@cX?OR2FX`BkXwtW*3C6yhE!Y-)SP_zMxnn}yRK0@(ER66$|8DcgE49z
z&0QC4QXu{dVwBZwf*gDGFI~Fy7lMyeBEJgZhNzDKSsz?Rpyr{US`h)r_&LAv8SMlD
zf)z=(CLozUy?GYN#fni7L7TN!+ICHa?bCGn$~=$<bX|awUPqvpzs4}mbD$q|8xn6@
zq47YRG5b~Cq*4^N<^6}G!#bj)0rzh6{AP6*v>k}snx>mL&6g|hg*^Dv1i0~CW61V&
z9J-_ga=o$P1%hRu1L5+C_t%JKOtvcfO>~4F<&zvFMi;|W(Ww=^Dh@|Elv`ccRH)hI
z$n#eMPgg}QG--|m_GRg-v9o#8&1P`f;Zk*7qa8LLos)>l%^e#oO5)x2COG+j*1AzQ
z$>BN9yfwp}4}~n>u`@iG|5iWdC};4NgMKxDe)PthN;$kSrRpwyxx*6}ckyv=Uo-dN
zt0vrvu*{grG{uZKPaRHSu^i`ygL1_k&gw|}9Kv9_^pO#4-g<7?@dClY=`d7tyegWc
zrSxhle9{j$jyB{>1_emCzR{G))%Sp}#3`GE2S?tBeFD@KuR2R)%8YSopoif|;7^s2
zsH=rf3a<<ildZsqlsJ-w)sM<!mzr2eeGAS;eJ^B+7HVbH3<vuLH6Kd6vVXw^-lbi4
ziu3YlA`+0RAsfdqH?-~T;fRtlrzcVFfvUNP*(<p2wu5!TK(N5SiCG=gYK?j#;iQpl
zEzUwZ)*W0NcOb+%?|>2v-5_9ii7|*yc!H@{KbAV#5>}Abn0KBZySk|%@J44*LAKLH
zeDOY9X30K=80f&%pYJQ+g8lldto8Ld@h81SPY=JPSc`lKyOkBUv|WNL-pHnlB}*4c
zYh3q=r*k9i!!dr3sw=ze=Uz%D70>Pap}_V>JPZg2z-o`|OdNnW0+l^F5T@l(C-QP;
zfV6jEtt0xKNk&2VR`W9Pxyes`Rt9CAmlIST9@=u&q1z4$Ygimqez<)6O2sb$f?K0R
zK*(*PB#%tb-0{M#r|H_0Jgp{<rd;osI{VJw*V>S;s*W=|_fbTq<8(S0w=F8;LWD1|
z_iHA1IOi2zDR{YFvcj0k3iQx7Qwp{fUTBVWLKNa49>f--CLlBAu}c0O-(mYSms7Gn
z1aAyVna&O5SI+eHRyjaZhPpS-yo~`_NSB(n1~y<F{VXC+M5;E(?cAhDEmQ}cJZE^w
z;+x$*#De+RE#fax_qbVM4KKxVVephaAf;IIH}R@1+V)VjjY>L|#m1mEzD*Rd*btZI
zPzG0ClBN@OCntYWuqaNN4!c8?J$u1zufsOd7m9pdGN(_)zl(8p14#6V+<P1<2Bupk
zN~Mxe7;RroelPLHI|q0mJw!i4bIU?2<eTv+2>ngK8Pp4liY@-*Lw2HBAfN9S;T8Io
z=(KPtC7u0M4z1U;++vWo-E1<iA^ngPv^^yaiW2aC*{JKQ>Qlp%V%2-dOO&=YY0@#L
z=)w)?J4B14>SpxdCD$1Px+J6{xcIzxr^pQ=H*3N0&<BWBZqot^vWmxpzCJ*ES)k||
zbmL9d(}%1RGr;Z<P9Yf{?G7d0A{bg^aM{HHpq1$0B$$klUv%06R^xCF1CGw$?ofKb
zY;2+VAx0a2xFvTk4v-Vpvr!;Tf}deX*u%3wKEl@wXp24|l0UEKEPC7_Cb0n4$3i?T
zV3l=c21befdTR0L7_8`vlHbBBIpo1IB5l?#QlmpL8<rCn*2u4|iu6Sf`|dnmTG<dw
z2T7OJdVkdXw1>rNz6E`LWUkqTDK%nsZ-37X@Rx1LMY`O&Ep2RszI(Y8n{4@ppEf(~
zafP9i4Wxnv_$lm{Obo1vH3)bXjjtjWxv~4{rFJ=(V6m>+J`%r*;MbZtItXGvA71IZ
z90jHzF5-6*yL5(l{3>M}^EFv{hCy0B7y5vI!ptAmWOTgXg2s65SEepW?6<UaPyGQN
zP~Y;2IF8>kJ-2<j;}@<l5~u>M5uTWsA&HPyl_+<WkM)S%<FN*SQ|3YRXVMYx%#jh|
zV4ej^Py*G)K;cgMbQ;+snosEvozoNdgR-CDHhd$Nw}Q!R_<JDM4Ua(Khm}o+?^X_^
zI#;_`(?|dWrQu~EaPDLj@h~a@1Ob=TwJI>7GugW2*3d>VbEW_y_9AebW0G#80o1j9
zpA@hp9T4j&oU}d_MEz{%;FvEM(VcQ%iGyMXu*zE#B{vor=&yxShD}X{v|Fg&cOSN!
zg+SG~@$CNBN}==N@DS07YUJ1TeMH!2T_sMGNrVxkn0b`k6yI^CUBnN7JadyanODdl
zAvEIt5h|b2+K(9`jgK$i#?@_X4z9r#2t2f(E-~Hv1ow?28xFFn<d`O+JE*5&J>VUn
z=C$n8h})R;lTFKez_D^;CJ)y#-GNh^K+Q4y+DoHxa%1l=D}ZKG#xkXD4m9L029ofE
z2?vObkJG>?($E}d2Uoyd9=Eoui}E<BTr0%~y<e1;1&-`nDm{<IZC}T$=zDsIk~asd
z)dpyVJpjdU;3**p1CJ8!{BgpYyZM+3<Y-z{m%uAYlnUvnYg%>L?N+CjfqX)jKI{;q
zbz^6r`)G=Ta<UuyQChxI2u*{bHF@Jxcx!s7y~7ryoB0Y(8e~_9nVh&@rcI@+`BV?z
z{$iT_NClu0&2Bnw>3(`~e9QX8C69xwA+lfJ+KF;;xWkPaPU6u#ppVxTyY&Y}jJoC=
z0fQO76Dam05Lg*2n4s1s!fdb;6y%?^)rpjn?C$mi1R@<<g8BP5ER_5B-<00=zh&za
zpO++DTBuvfuJpIsO^~zkS{kTpcSjOGVSoW3`M_2@L@`W`-k{uDj-xnx<==YZctrP!
zyGmObGF)J3w|xu>5QeLxkj^xy*}xkhW?4Eq=Nvg)TP(bup}R$c6xey(XwU&FO>uC|
zsHXcja8kk*%+_@KRgYBH4Vznq4-LuQ7A(BqdSHTluC%`#`FfP74p=?%Ja)HYo5}vS
zc^+?(jSurAx}=$|0igswVCU5!7%s5nf}4)1c?{I#F7!(T8iLn*(p&;9K+b(jWW~w*
zEpzxLd|fs!OHje%*8m>u`T*`}3#&3hs8q}^QNNj*F)qVSTd(P>9P??kc9oadC4r=>
zn;OpW*u8xk!ug1)Ji^MsZbQu;D(LK>I!`^!>x7}_hPuQ@0HDDY>z7RUFEERr{RNjn
zuzjDWYwFY)IZ^kVQss4DV=oU?7oJzr%>cIVFZ=|to=A?7*R(WRfhqF?X5Dh8bL|3$
z03NRxFk{Z|jP2XRM;}{CNQssnlds(!yxDG_h7>Khy9#D6HS0ae9^b5UrQqU4w7wJ@
z#0OC<7+L7+&x}+kX$GsA>v##xEw$>pr`87yBqmyHNIFY5e?_5=57+I~x^{_%63OS^
zlSNr4G83wG4?<FJjVI_(FuA)f@Ar^v$C<^bXuj0P*O2PMv5OrQy)oRn%TM}BHqJ~E
z{NRlVb05>OXC0vu07#?CWDBX3K7sP~0jirPb7~3ND2~gtC<Gd`{fO7SlfgqHK*6hu
zH-lK!+ql7Iv)DxcI8Z&P_S1lgm^B@9_2t3{+XnhU|L%6_0CL|9&jfVJ7hkfxNI)m^
z!`>?!5v89Ieq!&sx7Rc*9U*GZaA}8a2z7(cj&|ttKe236up(iEYMhz2IM5B~>|HZ6
zsTmm#ha8wBA8ZMRM4R74YN<V~VR<%^<~bd`iFLC98vuX7TK{7cm|g&Z-xNkriD%ac
zmz0-BQ)j-0+`wm}r=NogQ;!#rUObbyhSEn?Bqnm;r%TrxQi*4vbj;j<M8w2_pOx&O
zige|r<72a?FX~)9!N`du!GY(RI>=da1CeAo$A~*@1(v7qQ9e+=Tm;ywcdOTO>{mMx
zz`D&UC^QF|sEQZFtxcIs{BD*atoC_5TW#v09=psXiinIHpQ>2JP2Q{Vf#HDsq)vAU
z8V(>&W<qdQgz&|Z5(^;4vv%@Z9C$WYr$cvf+A{4f2-s?FSX4M_KR&!NZH6%iNt?;e
zv|v%l%1k39UvuK;FZ&%yzLw2V?`1`oFx(diw7+b=46^xorhj7*SwapRt!EKu90ZJ~
zJI8JnzIJb|?o6Xk04_gXJtvK+K0X8tVSo&{cg-Gnw!CY;RS|Y1xj0~6IuuCa&e4}m
z6?B5Gb_8|=IBjXAPN?}JbZcV1gULOlV;5~>07}57UNwlIX!bynPy#@px&$w~mb6R0
zrD>8Wb|2+Xs*r(Oj1|@UJN;|Fw$4uF2$#mEs*!X~YO2n5ZYs`186c}f^!08&<ZoXr
z7oa3PlNh7f0l}nYR#|mJtchG#mTxuvs<m%uU2F5ku7G57r1&Ga8^T&yIXTJ5qz;s4
zn+_Qsfs(<gFVMY`rbEdE6RU+vy}?vh2jU4b+hCNP7<8WKSclZN6pDnbbKs>qik)@Q
zK?Z^SPK4}#GV1S(_911hm1AFS+_tv)hXCW<oBqv@FpYpcoOG4b;Ary~QeR1^*t4QB
zOa^I-!#uAsY;PH`!nHjJR=XHcOv5kx2;;qGUaY5BRNU$+<@75Ij20Bk0F{lSH6uv?
z4^YbtzysJ02V~=1yYn`9*P%f60XeqUqN8dD19H4sbk(X6c0`l&Rl#H%J$~kRGw-9j
zX@P5KxJATFx2BcNCc`Zw3Kra?=rmFqy|Z0VpL7;va>Oh7qT5rr_F4zlI3Y<T%^H{o
z7;aDY@+UtBT+q7W2TLzTztO0HZ=Nv<fS4vvJg&^5)P^nvQ6}Od5z3&mEkj}PV)eQ}
zH`^AZBXO1L7AMjBR{#>3XPzS+AUGut06C0P`gO0sXW!jWWmU@oLAZ-j4cIUll)ou~
z0OmPGNlxO*D7^@yaL$B!IDj7(+HfoMn_?#(e=je3eReriy#es}G*9x56PL&00%fE`
z_{Fg!Q0YgERml@ryXYjG6A>wcw2MO7V(*lhK-clg;Q82e&Q1I?$>=Q^8xc<^GT*5$
z=79<vh@6xz3~mmrE#FU$<LeBNeT~40k4Q<zPSFppFR{?jXIt;^v&Y#RDr(>ESKpSl
zcS{V|Nxdf&`N?gvsnei<{lnVbk4v<1*l1ZL+MF-Ix&$RA-5@EqSvGa;ZmUf)u6IGr
zn~Qpgew$&>wof<Qa@$Evx}#)K33#?>nr@K*;H`&!NSVeJKH*6Kt)>IP^~Ig!CLDxC
z^kq(IS&}mBx0pC6iyF_>UkrGQdG508IY}NkyGAg5$?(M2ufRM4mW8xQSU+14OV01>
zS-#xf_GELe`>r~Z;|JB-85*Vw|7b?+j{=h(w$*JtrrP97&FUMXzlK(v5!Y4?cBBlN
zz1(Z^qXV1R1n(^;dgsHX-=lrOy7f>>TcRh=+&l3sxrt9Z3`zMKnb5w_bYwvyVp&6h
zaFL@QdRg<zmG3~y6fpat^_1etL7xma*4DFuNY&Xz?X%A4>v(emf{E`EKu7)2h0%zg
z!wI7AhCMPhWac4%iZKVr@1zY~A{a~WVO=Buw@u!1DKfSo0CC*mo03sPkSMP>S=a?b
zom2{+C~$t+BAF*iB?CfD(h6rq^(oc9ujFT59pOs!p(`&Z_#b2KHoK3v9dFv0#sH+(
zdmWE4dGmwtTfU}JRw4k$n9b$S`5}oN8luos2k5F)$=UdHwQ7M1NO1eq#AA~{Mom&b
z2xqoJLrcX|Gc*M*c~i;?#)x0rnu#anQnuMWj<j@3`1xzn(@)OQB9Fb6g3OlfYH2$L
z!(Q}M>03lNp?bT3>``j=QezzyhOc|sAR`8{;TH6EUCy~o0BWCEtah?_YnIOEn|<JM
zFIY&@V-$e5obYKW)zYCiSAH~AT>4C!VT#rRd4<{c0E@AM5%Wfhi-!?PXD5Ka>`>30
zjp*c>qjtMAQv$|YtK1Zwr`$NB&6M>(t68XoOH!AZLSNN@-I0{BtD~tnd@#V$JrPoM
zd6DZ4MGgv=+UJ%tfTFwq#eh|2E2T@n$or-bwSGELr(g!v_1}>oIX~S0`UbVn!s*uR
z<VBv>*vo{q%3;UoKfR846h@;SgZQ0H6%{)$?ZsQv@j&ih4C2&jYa1oQ{(;&15~y)A
z51~*(01P_pG8w-sA#+0}=*WJ}cFm7tP9A>%ar|GP$7>(g_ro9VdkBsW7cVuK6EPEl
zC->>4mr2v1xfE^i%7<p`Kj<IeaTyD>%;+GIpRT<HFQKs}qwdYnI51B_99hpP_EE7U
z9^c>_A2{oj@^uGmj9zPL^XW;ZeXB>rE;3?&jQ&)S1gNkb&n4%%!j*?DLq{~qYTtcm
zoX4JpmYv+fP>CY?8n@fcIas>4mTrzKjV`<i2?+{aun{0mC&*i@5!RZFv*g7_O=FXq
ztl$Q!f}}U-&9jk*l}+7GA=oS1g}s{?A>=n>=@Oxf-K*?_yVnsRr<j%I&pQ*I2blHT
zlQT-Uhx%2ex}x#hr>Wf*>Pf~n(dMypWim*l0ZP<Bf5{TlrP|itI3p(#^BM{ZYeglY
z1a;*!CWgHu6E=F;E6@!96tXbiE7&9!N*73sJ~S#;Z>?9^#mc!Sdp-vB?VeYaor6z(
z%aZhQ^0CqM!wG{ijLT8Pu!(a8Cs7fmLdg=5o-1?Pk-E9AT~YuEzUhQ|FzJ-&=}Wz*
zFPNxhDW_RIdk=2XWc6JK86GKnl3d&#0r<1)o-XRxReSo67a9uyZ8*pijj+%TcIpH)
ztIjq@lUzag8UH$4m&i_-`Q%c?<#cGk^!@1_-8KP4qLjIPI&>tMiggiY@FXUqIRB1^
zrx*9CE19Lt7S3nL_m*SJT>+Q*eeM`9fUGnWnD}(^T>fV{^zye#s1>giW-UO)=e}bA
zQLr=d@_yqghaBitqP3COR%mQ>0hly}rn#WSEp=$&6&f?8!7im2oqYHfTDRtX?brO8
z>wqq{hKgy_-k17C1R@&A3`H+Dszz(f{>=NjRZ2bl5eQBS&q7YBg}Xk3DeF%o*S;i!
za8HwmxvsFJ4bbS7CR1SL*K2AXuzn=_Cf=nCyydIAWNIW-AX`6u0pN<y)^`*R49pEU
zI3FfwU=49Ntt~08YvmMx`w+24$cR`uV0dCLq?{4GZM&~7<>6zS<KR??W(Sh<u%NfA
zX87p>i6yD*EbqvZ_x<)u@w*6LMk9hm2nimkq5=~!KIhkKGz-2XbL_0^)4@j}=MN5b
zx3?7~-47ElQfsgn@^0=xP%}Akn!CdEL9)XQH&1mNEL`~dx}A%|4LYO6hHf5-A{&A+
zNOx-^uxv%NmWy>l4)DpBk9xjO&?!E3AI^<c3m<-h`!PVe%=W6ds9U1Gi82?E-iPY)
zYodfixR6+#<UQ(k1jCTY`6@TeT+nBH;XKl5LE8K+uA;l$+V+#45qO3@e5f09qaAm#
zonfVV)a)`^+-4Mzd=0ie0hGCXwf>Nr8is^MDAbL8sO+ZA<poonmmHOrJR79q#mKmm
zR;lA7UgN+WlbcY4BzEYccvSxN1_cN@;HsAFcPzIcZEu79Yw35S=g?H<SVWxMNqEb>
zuwOcZsguy2iM^0R1gc<n%{ln69(;jmIG|Cvp7}zwRNK9lagX~}@aJX1?<K?|p9A(h
z`C`c~Szc=U02vKuxCZ9)(q6i9YEg)Bi$1nw+9iOf+D#74wp=3;a^!;y!-X@44oRL~
zr&W3e<_jv|<+M)x{Y5M+n9(!?<YinnVs(#G22=Fuiw`2YohNFl<in44BzPS^D}!j%
zSjS`6t5VElR^GUHg;Zfd4P?a-YfYMeCU!|j6|KgZEkEOS)|O1z@|7dns7tGVrreQm
zy*bvSFHj}gL9(89D3uxs)TpYpt8;2dxJlky{TTw`Ykn@~f@T|fN{46nfT-HzKu4zz
zQC(_S1=7j$j{p($#P0(?_x=RrZLFNo;*AR18S*bE{VP8`RD?C|h3vS2c;sF0-WuOF
z=L#vaC)HisizgBITkUq_j``URxr8j2d%bsI1~9AOfnHV!=J85DC<fWS{VWwq@Wain
z_Y$Fymlq?}JyRwhQ^%NkbQfCHU$lC(tGe@5ED|YKCH5h3hybZy0owH3;))nx2Qr|4
zy5q4OF+Q^q818c}<vw<tW~d2Ke?NNX{o(+>rP}mCcYqJ3B+(kDs0Zp`1@Bt_O=L4E
zOm+6ht3PNxrxsuHDX>H9#&WE3N#blaFu2{aUJQ(@ti;CG4?6iwLB=C&k7j{L%7-7y
z?f4>DtXcumj+M{)fgId}M#*%et&~v`>N20ZY7_II<U)tVi0;JlA{*h})usQ#sZ(pZ
z_M(q&nJ(!*4Yp6Z4>?A{fsql~&`w2m-lIdS*5*GqiGKMWB7Dnx=T~Dvfrc;6rkg&X
zneS76S^%ID9A77fxo%t^E|qU#myu&u$su6s)}|SHY<A@tl&Uo{!o5HdO~rL{5<?qR
zvLa^X=8_c&@=vUrWRQkcV*vT;eBHwG&Anx$x^h(GO6=#k$qD|>v1lTN$3Kh3GcnwK
zH~QbpL0rDGMAT?yAMC*_5okTAO62}1;(jZBF0-VOCUtsOLvV{C)~KlkaRhXFH-`Vx
zQ&j%ujG=UFMgzM1&SpCtYQ6689DP4s%fUa#8vtK#s-du<wPc(oJrL#K_q>LLr6VPX
z@s$9H9y(AlolFPucepLH`%n=^Clx^Tl1G|jK6JHM?t8)4l{+Zj{@)U3P*3t1u{f~m
zG5{u~2pB7Kmc~F9ZHF-;cD2wv4@ch{n4%I6Zf%l{t3#T)(eAIqRQb}3Lg~-^8zm4s
z58<IJI12}t;NVkB7)E|ZpGvq9<IU9Br6(wR=?#l`j90=+<)^ygmHI%&Sj7j+_~Du`
zSB_Un015=i6?EHmAVXMV6}hk|#IA4jUKB4YxlN3nlelguAykKG<mkVQaFr;WjIf1g
zOjfKBi0H*KNch|Jf^)Vx1bWo#Jr42-Y)yH$+CB1Kj;nt<ax3bd99S<aqWw@;S#0~a
zG-$v%Zj*f0p>N;b2QZx5+obDR>?80e39`l;00+Bu|3k2Pu31aJd!qgU@dO#-uW_JW
zHs2c&wByH#)yvCnMp39s_*0;)n5b1Td7C>nT0``{iUtxaO*jmbec|9xt=X&u(}KJp
zt7j!n#cqbM{1l+p%jU&@r&iWq7+MF|CSVlEEAMP;)a;c*TlhN$Hd%)XgbpO9vW5Fw
zt;|`>!%-+3ze^AoN?Y9t>0UwGuH#rP8S>JhY1R(u?-5k$plnbrIQz_u+vUSnRe0aH
z{>Xx!KFhhD*BRcWO`VwiJY;LI4QTnXE^>_E_hxTOM@OCP)>CPk%VL!hmp`toE|^wH
z0bg)*;>C=mU4eG>-S`A_3HLgZRy;C%FZ_8w3*hWUJvgu_WzxOSA&=$fk(9ggnS#W#
zngyf8%5<;~;S4A<pd}xDQO-K-pi%mICjeE+fDvb^@icDTV;`#^!j`_s&!eV9r#kn&
zYD0{@oY8%hqk&WBWmdjm$9I?@+{Br8jz)n!oAZMQUDcWdU6BO|x}T4wUg{e9(2$t|
zs11RO?@2IA`GpX%;+Sp%fVSm(6;#3{lbYzyXPhG1Lr*l1Z2D1Vb?S~N{?9yTzpCK+
zGcw}dz%bk*is$4gaMbjZkao&1?7ZP3z4ByQMW8Eb?$ZKh`H=yQF9;quzVoTUT6R~j
zMY=xRRDxQFoRBrQ#bWY=QFZkz%8~OKvY(`7b}h{5tIfCw4kG0)NGX0rE&2q0^oR%A
zuaRvkXj@lfAGy7)DATvxix3$G)a_paY`L#9?jV5-Z2<tPdQA<NZ;j!)M4_&iBGx%h
zX~OqSIMeH4RaNZ!cayEb`KRP*x{&Uo_j1xZ0OKdo;UdkiW~8@{At^%Yuo(MZ)s9cN
z=)j7w-<w%1C*6h)$-w1zLQn`=P~XL8)aeA>Q9Wh@%en8F58hFHViEvmSV304%Jl(2
zRfnTT@O01Y@LO|RKTHu7;D6M#^uIj%FZ%1B%6#>3Deg>T!`<HQb26Tw8*-+{yC(Qo
znSItq-!m7W-tQ?46gv)@Z(fes`($Wb%HLgiwe<}aw<FvqVebjL!uCl|x!bBe)|om@
zLbp!Eb2qq|xBOjHCn$*m_g$-g%wHUYYBmWjM&>8zM4X0)+eD#mb&K54_quu?@9hXe
zj(#90iW|2_`d)!Yui@QDvd_WzB{pbJg%q?_e6FEP8W@Z%$gcW9#u9TExF3|)E{`L7
zLF$Le=OEELsnVya!V`%G^UCNIHjlb;|7opY9N0w`OF$<xFt=BYt8(X7-bLN3Y6-iI
z4wO|-)q4%e`(GJ(t`|7*p;*P{$yA5lsjZ8U*AjlBC8AnuquIpyDzZ|fZ<VD@)Cv%D
znn#G0BPR;v;>(^ayyE~F&|o3IhBz?Hd=KV5=atb!Q}-V%pIIZU8#k4ibkcV$-;lHu
zeFtw&61>cuQqwq+b^t8AT|Y(hDRBn|6g${gv;+{3;S3c0D{TbN0NPq!jGjIwv%bF*
z=w7=FKgj%WW>f7U`ZT{4$+xHp9@$2vs*f$L28ou*C7EkQ&&Z5FZbbX<H9Zy@1(ZYc
zEt0dnGuTAYf)!NMp4JPMN|vxLxZ>5KgFia|{BF=Q5nFqD)sIuFg{A|76J_lV9iVe=
z!<`ukyX&9y?Fjd0pGtMOSoHG{W0FD9rQLbYdx_+?w{hlD&z<AAIw8BN`o4LXg`iWR
z3A^iD6m)!VcX+NJ@7h;p3=O&V?MtB98Noyy#tw&Gh)y-mA+0MkrqdJ6rJu4TmmTW}
zs>12rPa!rBiH(T?8$4XJa^G(<nTc=KEAFP!)2vK)kyqFeUZ4Zk*;xK(M#9W5>owBn
z@TR|r0b=#1qr8{8UBRPkjP3z_K?foLCorGdv{1#>;sR2TkqD98pS|@kT=+|d(`un5
z*7tK^{z_MW(Um?RG4IUuXwC(C=fe-t-5boVNmjq0^C)PyClY=QiIKUERpNgvo~xRz
zQPFllk)ggyu^`3X$xE`s+y75`|NeQ)r>}f@SdeXX<p8Abgm@mZasX*4uM@YI^XYt|
zQ>2EIQ50AThiRX!chZJh{eVk~Bg-misb0j57M=m&<aV9Nd!|enKfEeXMsgRsUjE^t
zvtQl0i1AUFxeva|)cv}EHDK?0awF*V4KA|rYRK{luLqN+m5AzBqZ<HvB~#lrjFTYT
zN4{(MMV#h&LYSaK{u9`4fC0%Yp=iEf)?}aSv(kfumvip*0T_VZ`0aqkw5vCCV7onK
zpEsCCGhaD6hF`EMcj^p)D68}>lOhcx?Gd!F#tZR4E8@Dv<K39dhs>-j1Lc6W1d>A5
zBdjqF0!jzjoxF32xQZ~VH(^HI&>1?h(btfFpmkuyZ@i^R8h1n7#~FF-iGzm-zZMnn
z&GVq>dm958-W`=dcBMeP1ldzYY@JQ%d+`ZByC<ZIG);B6Bf*uBcQu9Mbn}k}#t^_r
z8<;iPjjmKf&$coU^L|A>0K<2Qw-A{7<FRa@%gzocPAm1fMJ`l*qOc_MdNuq3+}OmE
zc|BdvKJKC6?Q0Vhsll?lo7V)K{<m4)-)De@S9Yf_FK@Lgj|8iCeFbI<TAQKS>+Al3
zumVxm`P$5Dw=V8|xiN92Y9%~l+jtlR9+LamSJm>I3{v$&8f2uSjov}WtQMaR7Z@;W
zku*4kI{C|e_mV|?`FX2s(5O>5>f7VDUimhMkCZo-{LtswnXWVwZnxzcHKU<$6eMoR
z?UU!84y%3-jCR0|Q5fJQK})%Kzxz#_a7U<$NzBriK2+XJB<ijqr2uUvCj(<+gT{aG
z0;b0ljcO)_Rq62|eCJ5k=h5FPO|$agielN*D&TWhj<P(-41u`Q@#MJINdcv_l|L2G
z{hB}v26E7HC442N_$P+Y5o8*j%qB=Mf_j=s2C0!%$^H7846?L_80iD;O*a&dBhK2d
z>og7`9`Rz|xJ4|QcpIa9!6Zi3GS>`3@RlYre(|CJ_^#VvwafS~paE<aXzbo{ZC;Dn
z&`^bxA$)ZWFZaC_ff%bfRuneNSOo#i$W8wbjv#yVwZYEMUSsab#ok=I6Bbk`z(E-z
z{1ziyvSmzkJ_qzPnO=gZ#%~aMZ(GOH2Wb#bsxTy-z#z&DLr@zBaQvPy6t_>W1)7?p
zUs4<Sb~B5SjR%f4be^c=tki1xUiC>4EH4yd4Iz4J<C?{i_8UdU^c3<HJb7k1mvmL>
zNt{M~Aqp|IEUc&-Tj_3?-_35U!}2F1aDL0TK?x|(T3O4BhSQjol#;j*heiOA79h^(
ztL=oUcam2=>Sy)ojfEGT1#us;@KRb7H;16t0~*ic7dP<-+>i?q2fmlH{~c2HU!ObD
zsCUd=7|;8Zr=}?I4cGRl1$aVw<r9U7df{wIiRv;ZJU$oLmOW&gdeKqI!udRk<Kn=a
zc{TuSGp+aqY5N=#uJDj&b5%#}i=0BbY5dOYUp4N=$b}?R2y7Co3emFvxO<<PfB&Nn
z24$_TeN`+cTONqb$_o~5&y*TC?S_#fZASKP+to@N>ZOhfo!1B>A``n2;q+2H5U%-L
z)1Y#PsMdtg3F@0;<&tb@u;By;DRItoT=ti-_xEDBxr-46GRTq`{@eG9H)iJK21VA1
zgz*xiAnA`E1z!+%z<Qt+#5}_tB3%}kp^g9Y$f=PS+r|ODfLf&O3ruNsvh}IGN|E!S
zV;=ByZ6ABPjeuvb3NeTod}0V1U*5WopJWK)o_mL|&BL&B-rAf7Pa4)@FF@|x(Pn*m
zo!h4ipzbQ)uGjI`AT`FaN^8dg1tJrUSsZ`G4@jvw-}udy7S_E1%G&nMdLf<X#UYlt
z_j<rQz9TZbw=I3hb8*IP>mK7A-KhP0t@za=V3mK`jenDCy{abzOi?<YoQ+UFcTULv
z3N+<ifC$)feO?7wgBQv*w@<5-H3><F!@->4eE}$1rB_$`q74%KWV&Rv$R!wMtlCp>
zdgksbJ_S9RYMP)hKy23v`|w38P%z0k@uGJA1*rIE-eh-0_IUZ}1cQnTu+T4kn{J05
zVhO&ji|SRTk!dk}_B_oDmXZ=#T_O2MJfANRj1U)Y3i;fZjVzFe3MctOhu3{J+J@l=
zWaNsuoKar1G5a=%n~_O*FBdv;TT91ZYmBO=8F!C=vWD*-@zYa&FW7%NeRSdSDA(&J
z;C;tI;JrPg8tst)yrTz<1?^X^#I$^ecWeUD#?ORnewT-P%a_JZi>`i$cdTVUH_~{z
z1f2RFzy8aMkCd^$emBFE3#ga7zofGBEHDLtQ@k`|&5#^-g?A0uok3*m4Wzxefrtls
zzn<OdY`+q?Ao@})BYteCY`ec7_Ih$~W_trOH3VpK_nP=w1%Lyzc5HwiD0?;hZN<?G
z#vDHpDPl~D;W)eu^0?LkU>&3OpSk8$Sn5*zF;uNxb2Crp32^G{H7@{M^ix%r>R+$)
zkpLNhrp(eBtX=2mN32nbE#^5$mx_Z%7O5|XU=2n<<!R|9fK1l9m~mpi5x4WC*TBcz
zKC2<$)KsWfkb<Fi5Y2bIt8WL;i(?Ojj5RHGxN|ZRj(z~@)2rvm?ux<#oj`H8tzXx_
z%%$y~neEO&*~(SSYXR7`T>Gd|!OTh!N+XebrC|=lw8GAV$ZrK-^kUx&-Ty;H6uU~S
zE!&xGbogR7P#;4@wC`(k1RcNeSqrgTUiS;K)Sq1w2MqV5q&F?==8|;eh9)@!Age3P
zO9uV2bJU{Cj^Ul@DZ;lN{l8w(AjO*b99_9Kpd7s$$P13|0ne&E{FC;9e^rYA)o8$5
z(mMtpEOoI#c|S9p%+QLo_htT~_~VA%k5e5(GPG`FT=z1@gXy^Lm>>E895adbLNa>U
z7kAhRed=D78T0k3q4D=})}{C!ceqT`oWsjaYb)=`#;>9w!Ap!g!!2$4qT3L}RFLF0
z2#}Sep}UgF-GmB6^SXdD*xx%8e_Usd%GZ{?kfn1}t<T!>IGz>`?&lg!U{kM~#Ju!~
z-gxnS>Mj~gDz;f8MBHRNMyqzSKY{}lA4B$9@e1^c%FFqmaJ1azLL)wzf6&T1P5j#R
zQ5r2jWQL*s7e(#gUtKCz@0g!3UJFPn0^En4TJXV6EuX1UEgybqtL#~OBshK5+6@<0
zt=)Lx-jA~9O`<0t_tqA?HTh9<b9jw<Puz!n<*|(uXKyk}xY{^^`r(EOuZPpuA3BT;
z+?a>PCXeOmWenZbJ0h#us#hw0_<rma@c7SqLH>0yc`UuhhkL9kMQaw(j@^nb8<8Hn
z)4SDHS7HXaFT?a8SWq|SffDGzh4ic16@XEjd_Ct-6FNRWhk}k>-jzAJ>7X*x9gH}W
z)8zVe$<kgly-O{vl*tO;?Ta?asU-h@tb_g!g|)*KaT~A^e%<N6f~R@#sF;Q=)8s_Q
zA{?x!3$Oxj#x`$KlgBhvZTUBr;Ga(&*(FmaBaW|qpdvSEmDp;)3fEFM@R8g21M_rb
z?0JSqkMa)B$Z343%a&;+OiQ>SPreeuBuHIB_2W0gFUQO|n7k3pBA94~kG_Gcbr!DM
zno$sTX?61|p!f5j=RHYO*l*+kn*kz$RqPz>M&WmMf$!)3q+v8&8kQr2)JMm!15ymv
z9&Wni82(W2!gmGOa&V88hAE=tyMp{P-jshnHN7OW>gB~uu))R;8A}yhrJY@?S7@Ty
z)_9u8JI$MQk>al{2X@SvdXBse>Xu^%{{V$POGz<fw71jJ_*Hj@94a6a!pRk<U&cFt
z1f`u(?{Pb9soN}W1{VU=Y}RG_txJR@tYr+KMoZ7QFq`;gNFVwLdsOgTnk(%?f@^<0
zf^c&9Uyl*Sy}9p)$&%oU@cYs8S1)<B%@y?Hg-oz}h=egUOMhNcJ)+k*D!)Pb<8akl
z=JP{2MtYzz#xEz1B=Rq*AI9vec(VLdu6YcsJP7TMUg5qNe{K|_8`DBlex|E1spt43
z^Gf43LdWMlZgIce{@?ZHekXkRAFo+zYS`ng)9^Jyb9Rw>ZR$&=5$5&|nu$uk{;yrZ
zl5KMJTTS3=BB+{Fm{^|bBTm`9e%vg1L2@3b^QZ+^UWDQ3B72Ck;VdJWpJQ}eZiFiT
zYnA2;;+yFC?zJl`AIBMT)V2THK?crB$|jeR4S4{c_y2aR<^A`OdS3#haS}iby9-^i
z9tTJCSc)=+3L{RyM*b;Eat93XV05=i0u0B<#1p(2{`JWAk3Ha1bw)Z{r|oiJ*_*P4
zm1W*a<|y@Go%d1Py;p9_(M&eqL4I#>p7ia3Zu!1{fjuqr>-K$Gaa#Io!!xj_|C=yF
z{QU+0O_*V6X}I&4pA+5~>Qot!>jD3=$+I>jN9p!jF~>0d*w@#^5S^FBrC8`GD=|k;
zUjwg#&yCXrKTHN#IOt;rQWq)qS3-_|)8h88Y7MZL5LsIQj($twS6ZPrTlV%idra=X
z@!n4r5SblGclGLGbIPLsQhvUR-nL6oZj(1s;_RL|ymj7v^~KoT_Vzl`UjK*AW2xM0
zvH`}}ZECJ+fr^{d0ISt(!88GWZ?X6ftVB-5IIv=ZWySB;daZ3UAnI-U_SH`TQC9&(
zT{+Ze|3BsVpX%xl(vDY8to{+OcgX5@zCUkM?<q9S{a(^L6madG3dYXi)5l!1y3Jaa
zM-Gv@Lh8F~yN}d!?XW>aefo|O!IW?c0S6xbu_66a6xUVGm@&XVW`t`H^mHZKFgHa|
zOd_YPE(QZZ1y)Wxg#h%Wp*k#iE^V$x5+})&_;Af0<G*kJDaC|JIc9DXGK{`ha#$S6
zJ}o8Ed8|cG;BeqM@T_^(D=0Fn=6~(#fB$GlFxq&H&{UZJGjX?V`GOVhdt4)26y%f#
zF1qJ(`@?AjN*^A|x?K=gl=Uci>?V`!&G>rblw8Yc#&hl~!Q9aR^WD9$F26UyZ@(Ym
z|GrTAPZx-w2dHR)+L7%)!8=MH+*UTMj9EaBg@Ab_+~+{rC;n%iUD_GZyaTgO>0@09
zOZfT|0o0{eB-6y7Mz{b$7uUfUPwh5i<Z?f<aDj>+NTFNgT1?oN47UM4sH><Z;vfF<
zh(h&%3e|fUvA)0U4a@s)R4|72evE1J4cgzgiLu-d0p)8S%Kag~*6;U~)*3+D>L5dg
zd#?D;d&gUzD+Ivsk$sBWD;}AN(&cc4Z-)LmqR8$Ld~|ZG!#a4(uLPp>Nx<*<;v-5-
z&v*A*6HMKK2xu%92Mbh;HK-{uShkG34a)5HoQXvPZ9E5=E}}tV6-@koiyV#oUm*uG
z;CZ9`Zvgaz>>T8g-{O-VW%+hse|(QnV*cHWj}$K-`yye>F;0H`{Xg{w!t#4LO7;I?
z9nW%!T^0Hl>ED0-+dcb_T?<jZ{Xh7S->pDYzN;}%SwY=rg8s^k|Ne4+vX$8~t-bm$
z5~u(2u1(WF0sp2_Ksxig7X01i{KXmb9O{q%**kzclB2R(wI{UsdUf)D_-UK=?1^$y
z{MUcrFU~|IZhCA?-yHMV>VM+%{U1wqcXfo{U;9(P|NK*DjAf8!yKfm-{KxOzGF|l-
zxBUOOzTZsM{~Zg+OuuyIpIiWcFXkVK&fn7bNBZk;Y5Y@%_HT9iN5<>_4t4ss3jJG!
z{;6X4okRP#3jNbN^|uQBTZR7V=J=f${d%YV4k>;gE`7f(f5(J>Bu2m8slQ{wKM=6L
zgZe)bqu=rkf5(A;$AN!jdj3F+eoHp}|Hz4fKsvW7XQXGNBF>**^<!Ru51vM;sfOzi
z!d*BT7-yfV?#}^{=l`R;+qHE&fczjuZnRE*Ma78MbKm<geX+VpBp3uYbY*HshA5=N
zHeG!ZZKbDS*~@-a_D6BUA7thJOFpO0<*00()@<O^Ye}MFB9=EOXdNtjwG!ynU%0(j
zodQa3O>`?F8^#Im<sY{ZJygS4If$2{wIpw2`YOHpuC%Y?0icA`)_CQVLD$HH%I;e2
z9ok$30p?|>!A<zG{y)2z)MHVJ7jhsXYqT}S@I(MU#ydgV-ok*j{7&oUhc9*A4X<up
z?RiKG9f3pZ$BGquzdXO!H%f>Uyra#7(-d_zhr{~(kXD#=B?QR|kCRnny=tv2b{xSy
z!Nzhm&L^uulB++>ubEjhhsjJMboLpp7uI(6o$osPAFapTH}Eafy6bpyhRf#lQ}vm>
z?T0Z|&SFU9(htycDNE>;v@`4O@A#?dUhnFs2h`0spOtTz26&=fsjeQ<63PyP7YoEe
zWDu2H-cl8M&Uo|seM;N5UwU;{Yi2+1{-*Qo(iPe6V<&4SqK8#=C*b_;FSGRFQ%3L#
zO*jeu(k$(AmTiDR<SL$8kgsQne1=Vr+-}1?krnX$Y6fJ#eNFyKb@T7OE(C^Cnhgq@
zdg50ki@NkU)%|UY4z4cv0xrAM+T(rn(S_rE-uV`BQy2407iY_nWLa*7^P`{R=K21v
z){jw54GqDV;HkPawa=Ru8gTs<LToSdYUaAnnxoYH6aOeR{>KliH~oj-qH5Qxp1te#
zo(r<dbhpMk_Fd5TTz*rFE37#UyDJfvXtMpwx%&EbC%oE&4t=21bmVF(9s*`U{#4|k
z3=G`t&pwGxDs`*C53k}Kb|55&<BkNj3HdX7)q-cHHRdjiM&09#_Uk`^UfPoe4GJkT
z%b~{X%clOL>Co!wqpPHQ?*2pOr~mBRrTjJOhQ_Rol(`f=&*hBXQm@<-O$S@nOfP<c
zqH8Yi&=Au2xwv(aq3iEAH7OY)^q|$uPx}wGS@hQ0MCaw@h3T4MAwkQp=4n+9vd_G>
zRzPbXqZ(K7`fj22DeC$s=o>??UOm{bH1UCmtb3AbZ*oGRKdrz2Q#VDQeP-)TG<%@!
zR**oZq1d${^+cF4#1sCZ^3Ce$++E(dpvs6~if_NMcYmRBZ#2HgSTZ+GuNb<qv4=&+
zsSSlLB=KlfoppoSs}|KB_%*0f&xu~cm)ziz2bW21u0_dihkY}@+AA9dnOEOpKAk;O
z^duw0=7#8wU%Bl6i-j##zx4bE;iI1@a}N^t8<T`Fizhrs&qPA8G(tfTv;S=<X8Pdb
z`W+fcN1a2TCC$o-s<lsCUxr6-eC$1N89A5rU>=J+;j<uL4rlm#rewX$vri^A)mx-l
zF-I0Z{z4N7)^G+Vyq<WTp*uy(>AN~r-yU0-%M!ea|AwnVVz%wry~~d7&%OWNxyD!B
zb0fH`Ar8U$oK}8gz-jA>#;N+z`CRf&!&f+4%Z+H1*<nzIb4AF#P8~)`en^C0U1z)o
z=ukT9CZ-3ieT4L_gLRWBObFb=x=T3IRrxFs&&ESZcvq6gTu6ovJZjsHsTkhKXEw*O
zJBe1+o7hh;cLhUNs*so7tP>b4p30m<J*$(v-NLNb3$Exi*?wvaZ55JO(QZ{m5{vkc
zL;ReCgOTz?-G%k?Xq6aQWe&bt4jkqXG#B^_Zw~n+bUXJy+@!y5>rJO~-pTN`Z_jp!
zxhliEQb0-W%B(mtG~Hn;G>wr4ww(}o&y@d^XJ%iJvAL6QY%lX#o6cKNO~D1-=aJTr
zjV=`tcCjUSAhSlyj(!wu_DEYh&0`7t+}&W;9onI&)I<%Uen9cW)ReO8=5(LY#@F$B
zK6e{Jgn%Xy1DYi8&Vlb*XQJ`BjoG76zTg_o<+Jx0rjw92t1;4$^~Lv*SABqGD#Fm6
z2-yG{?prNFN6ge+?zrDa^&8%I@)k;=^s96A4-xQ$(acjrI~RC<>;E6l-aH=a_5B}5
zvLq=gQAmo)R`#99lC@IVLXs_O_H8UFDk8FE8HA!NlYJdRh3xBKm?7IR7@4unSbq1M
z_xpU#DbDA7zQ2EZ5a#u|ulu^M<#|1?`w}W~Myt_4!H{;DVUO+?vTcn=^c7N$m3D@7
z&a+Bfts5LM*OFT^c(^hb1DfkkTc6#zH~WBUJ3EYiofcad@&A0(ffTLfuxIqYpFDFS
zRk6~B)oxfy^u3dq{qXtszTFp94|MT=?J)Iw&~1RO8u#J2ytN#zzMkYpHGHk*LQkn1
ztzCb{hX-Og{3j(GFK3nsKWhA`Lc5Y6k)K>mn#);vEjPXqYMn(afDT`4oz}6!mT`!n
zBi2(>QXHZZVq)&Eg&*zP_U}e4FL?1gLfhIxT~X2@BNI=OZ{YXQGBszX2}g&}9vZ&L
zKIW;J89{S1Ti3B#3K>yT_buWxOjZ4>BA#H@lV|jPez?+LT5$d5>H^ZHT)a6)n052P
zv$K9`Mdc@{c4`#H_j$!`x^*h(CrMlw5|_J2Bn_M3kQ6>9q7VH@p7~kVtV8E7A?A98
z<G<H(se5}pUNjDDEn5K2fzz_2VfFnZOUu#9OsJkjnWM2pG2TtlR3Nv_7AJGjf6a+c
zvzRyWX0e*MQK@x^fW%s`;PhsJ7}JfuoEuxsMH`Ym9^D80bOL$dvW-t>7#y}%7mT$!
zU+b1QpEWG>h5B1jE$gyL5ZwKCq*^O0NmK35xrS94JIq}cPk*rCyd&knS+U+M*EcSA
z>Crbkc$>U|-oxZDik^o9E}k|o{{QUu4eE<$m3Bt7STfx|tm`1mA=iG!W%Mo4U|#Fr
zbZpPac>Jon;pCg3<xln5*L;1!kgYp!x;(1O1m79YMQ=e5DCQy07f<^;v6_@RTx<+Y
zS#*eL!F9$$tsl4wvN4`)e#+~=DERd0Q`dEufWj*arC5oUHtDn>Q{Z!3tXQEOy&6kZ
zjqBIAIOsnoUtb5Fd0xH-indm>3`9qKFHm(1@NJ<(V@ShI<)}p7N>XHmHI73Ny?Asw
zjnzDPUg4HYdmQVx5d&v^VwbYomhVkI7s1sTj#rY}O6KY|Fej=-#p+Etukx44Wi4W&
zu3!!<pGS;Bw!2%ov?#mwj>UqSbfKk*O`I%Le2t;lF~n2>9w<EP-q0=6O+_Gv29H*+
z4R2L>$X_9@EH0LP5XBBS$Fmi)4tfxS8pJa@y~+bEIbW<d$ens?wf>2+r^v|CD|vM#
zP7+nRW|w=XeI7pR^nm97-H}jIzc`lTPD!-Z5uHjI-xn@lXnU-Nl4uM1v!m-erB;q!
zXvtZ7%G<ov(E8e;ctx9HCkEe9g!eqU@)I}Y!%?|ylMq$H6QeF$>%>4)x;EcZmN{sD
z@9w_EOrcZO>fFKw95#NBD2Z%t$D6A>k{wr4<*PMeoKUFg=<GK^Bawv(A5ZDg6Q-Wy
zE?y=Ti8FnT1j(;*4leB&hKAc0`l}@QbmK<uvS66xjvm$uQWy?~N;29)?;Td~Hcj!Y
zK^Vb0`wdcT&=<!XyxtQJD|bZk%rGfp58{tM=Jo8Q?VbKUkdIv0^q8g$%leGjo@ft{
z`4O-%Jl#$=Jx+7r|1~%v+x;&>*SRT)z^OKe^-fp7<^E&0dQBrG^kXjhWqAVGy;aeD
z{oq>BZ4e`#C#}x3Ot&M?wnltejP-OhX&DQKKvmI%uD6Xv7QM%ZDlTXhwPBWhtaqqH
zZ&t)7*@;^ba?%EUoZrauWY*r5a?LR{A5lc5uiiGedm5&<d3~9Qqo^7xy4lA3l;n~9
zgNm@|slR5UC~yAJ0A?L^Y;)$R0iTw|mD;oC_*y&^88}){COaDjsLPq}SqE>wgZKq0
zq<`{pi+2!1*xC;qYUyZ+d)yc{+UTQRv6iIH9*i38ZUZyt%m<RA7bTsCcx63pT7zrk
z*7B(xktMO*Hmh#Aez5Shl$s_7N44jQtu^(h?-~)?4;T@qBt7*zIZd+?HV)b*{wHkg
z=!mLy$Z{qGnr;BAmmI+H>c4i@L4NznZ_#Xe-u@SDfl>PZ7U8BpWT2)EEy!a(#++`D
zckkJ@VZ&I{i$%sRzs63~s;l-Tzn<7xrxV*XZnRp~nFq@?Bk4^7mxu1Nlu2YhRbOWw
zI+<?1y2Wm^v|-@6!=h))XG2i@>c~GFA(@k3Pcp4ut>~Banme7nf}Is=5}BZx+?QD@
zOR6P&i{+u*qC-M`os&)nIxPlNdoOef9gzKArN4Gtba}geAML`Ar!$PNBWOIJI+yhr
z4jgz;&kFj!=2o0eD2{X(BpzAJO^jYF^=_O8=RH~b^bTHCOI3X>>eg_X1SRpxS6WOR
zDWKGUb%PnHU1C{){G@8#M(i7~M;DYHWbbO~@I!dnqSZR&GRu+Ya2o`Lsk5_>dY&&z
zSpP1u^Z69q8$Ab#6#qrNZyThGJjL=0D8b6rRi9!k>AUQAYE5f36(rv}3c__4dF89U
zitv@zu^aR_e}{$@bu|UO4|jBA%A5rSlf>hB6WNxhvpz_8<ACguFOKJx(JpOHfUoaV
z7qg}*YR@5}<X@TH4MMSv*HlDLt(<aOn;H)AR)=`WPAB>x<(_@=TQjSkCTzpAdg&eI
zO~TXqZ_M!3De8OftS<$v=HCvV?s@N_Z<jKpF%79QEOQiP5_xm8hXO7cTR=h-n3~9V
zI`Fi&(c${-ZzZ(gbP)Z_Zb1Q+^j(3E&MKiZ{cL6-t_IbCOKFTJ%fB~?Di-F#ou#_m
zAlQYdyU06&$w_zzZok#(W=V8@36ni$!`$<y^v&u!#-EJhkNlQposXt?yTSbE2HU@x
z*ZYSx2$vvFX)yh;Gs=WQ8jQz-<*4_a#R-*`VPzsq1T#+*eIi!5BKotrzoV;05K6Yl
z8+)gHGOs>+sO$xa??k$DPgXQN-YbsjeMe#S`|RxGODjWP#V4GEg_L%tud+mR$}>mQ
z%^eU;@+;-ZtgL3-l$uDfe00Sxe|rkiIt3<;7yC&#qYTwj#K)TM+)r*x!B^&)mUoW^
zuD|Mq@Syx&YBHyzZPdEBoH?nxB<V0d5hrAnlEhoxW#b%C%9q9+i$`M(_YtrXNzqd_
zoNPu46;a4fi5tUD##uq?RWN74*@kiC>~i`3ALGrl1}*MLeE+6<Mfj4l%J~)*mX2EO
z-^F)5*yZiU<HyR<ATK+m5Gx$k9z<Dn*U<22nb3=Wi@dLw?iV|q=1^3A;X=zz!P2B#
zxv3ZX+k+;nP6<3e@gBBB0YBrTLTFF2{x01}OSAB!>XdyD>g1-v(31hZ%RDb|owBE$
zYgTF(^s+8hun4V1Dy7*s3_I&?b}eReV{!w0Q-!HHXQ|=iE*u<?KGnvB0Ip8rEeVIg
z`(D`I+-i56r*amrKenk(RA<#{=GmK*Ys6fkRma|^cGkBDFRk6(1-FQVS5Brf!#+4g
zBc#`NKdz3l+!DP6bCHH>=?4n9&sTgPn|_PLU>kx2&uaOjgb>j%rWw*>k}&+TDzN1-
zNAZ-^)`X4vxgX-o`!SNvukCtgkVL4gM{F-~Woe<>;VZCJLk6CsA0U33hz<^aWE4pE
z&^6Gpm-JkNo`iO4gJkTf#gLs2KhXz>D4sbcaVGte%S^XzyN_VZeHTnG2s9_eTN8X%
zMhh(y`mVtQ1=|{F9gQUu*!y#lRhuEdMRH1cRO8Bc5Jtr$cwHydAy?|YUii073R1G8
zb{|_TNfJLRn6EaN;$ETcXcy^~N8$z8gDi}jc+Omyg~MVimeVwH#sB`Wa6H9Us{GJ0
z7z^~SIil>nRTkSy^`p##LrJBL99#0hW<+upyme%GvPy#~eJR;)J3|h~7E$lq)MwEM
zF3f-oQpZrH_f*pbl*>9uxHNU#^zEeGF`sH=wjsTBRI<Lrse}~%(w>Jh)v77Jom+Bl
zx+u$8U6V401SZ8)`!xi`I!3E=<>`<|<ChD)R=7oYnJ!Gf>RRV(nV}8aowgK5wP^Fe
z2S<Gvapu0`E+0(z<R2smCkVZU#S0}|*+<kMmF3T`&X}b>kS|q4+#P4?!k%AdS5tIf
zdX<j_c)&=h0dKN>&bdsBeU(dmD)Tk?&YAGqXy-Z;3)aT{7*>#EB)sXymr|?0UNcL;
z!fL+^JlamY<dgIOC(d-?4Rc2m>9dBb=Eu8!Q~Ns#en9lElt@xk$X?pDSx19i>Nhqw
zsfOxyf+mx~K0`ACb3Qt84i?;Kj5rjXbf5FSq+&~p1=j(uRf~U(*>CGB)rARM+UI%f
z4UUs3IW2^iDcJ$fjXqgmkI;N=T>4P+<Hq7;!;3N+X_qL8r?riQ{8T0t*)D6~N6ID>
z4|^`wZt;GpxmK2>RHt7vj&0o7SYEb&9pxY*dx*=mii1tAX})|i8E4i1v9!Yp1X1}&
z?e%~p`t0OnH7%rs;Jb4A^z3Xzj3e)xou~BfxRFYeP)2!E<5Js)*sBZ=1Izt^cl^q1
zA}m_`HpQ#sv@F*`+7O<#B}p9X5clon$?u6a1o5|<b1})ud@I=gLM%M93#&pALc1FG
z{^iLQGnNBs@_}z<U44ChtM0ni8%=vKyp{C)!~~jFa;+z~sqix1g4d=?8BN<&s2xqp
zFL6cO8mh5M&fB&KL6%7xZdb8&%j24aSNvAzFUnV?-ZMLAewrVVm+&;a&Xdcv%M(uN
zn~(pIi^DvW{jnX?>zf#jGifat9qLIB;5dm%llOW%nm6OK+9jH0p(fvbWL42*y_92P
z)JbfI8sJkl5MFFMBx8yhe@O{mr9SU&#P!(QdCsBSd{jHo&t0}#W>z|YSjo1s-Q;(#
zO9^s4y>!vK^`e{Obdr76J2>0BI%k;E>a~;?+o~3_Ule~kvT>THPoyHOKo8^A$xwZO
zU~!k)_q%WndJTxG{uYSs{#Ns%%jcRc8LyoyEIEppMdPN)EPI4516xh*nc~9R3Q9OL
zD4poSa9M0{_S)*xFWLT5CS}R5JhC#zaSe|*Us1pZ&=q#c+Q}AbIZ-!_OKk5qju@Xa
z4l*nEQ!ix-E%fmFglQ&%xnEKh!y|7>Cjrd!2;monEg-aIC1xuN!S8uDV+g4ixr=3r
zMkm*7z6aOr<3`r--)w*8rO2kx6*}axm0*2z9oA;M6#XJn8%K>NZ^aI(&nPCYl>Y(Z
zZ3r>E_R3i4Pp&uF=8;c`A#pJ=`q~}vuF%mCO5(BUE6+F5ggm|2oEp{y+dbSgmn`UQ
z;9kDIJNh6pS*XdKeC6|btY0#_V%!h?jf<7A{jfVPI^}`#2Jzm${lA9<Fr`aUFeIT)
za?N^1b9>z1M7%u$c!+JJnfY6d--F)Wvi@<wWzb)^vU4&N-<Dihnw5k*hwaZ7?AMu=
zG`x65LoZ0d<=D-exz|QzO0#O&-qz@cc>)x|Iz9AF_L)O1eY5xl+n=bH9_@6CDm1AV
z0c6?}xm=K$6ves1;(ScD&Z+TuV%@#MQ(}5X-r+Q5erY4BRmt~C^xx~I@g+;z3?1o%
z)y>_vDU}_yP|FKMJn1R5MZ?%2wbg<>5s|TV>#fdP$?dj8)apv>s*zjWrOcA#8v}u-
z1V@M7-pD*CP0H(i7fN51P=e7QglnG&*m%J;uR?>`(r?os=&;)~cZrh1{DT!|UaJ=Q
zu0%)Up^%4tdE6k@1^{l0h~+9(wakfhL|1L?qt9&hsG)Kb1j{>f+-s0M9pCxcrniM?
zFf6$=PORTYY(eV3Pww7W4U15Mt$jXQ+-_HH6D8D>Yr~rDBRl$_0GXn9JXG#d`pgi_
z%WKv@Ls1SlzZvcG`TlF4u8hI^M4!c>ee~U|466Ho!PL{|=%^d<RVfKxT~B7#jHn^<
z_u*BuH#5~*c9Lu7&bz+<?Og5p_AnD=J95q|E{SU(1AY7byZ)S|ZcOfjAO%j=Tgbs=
zD34#8s*c2!>1iENNM>J?YlLZau~jDuzRGJG+pRR$_kp9;>CuNwo=(T1DwRVVGG}Fy
z{ENRaHm;hdQ4CotPqQC|In~~Ec4)xc@m81(XPA%SM(sD-^rAP+C)z@%<9^!RNNyKp
zI`zP6A$BtML5ss+`c+s0y3!stk1AG=dHp);M&m*JtE*Lh0t>CH9Mx8J(oJIcE)^Eb
zBlbhq#MjW*mIZ;9vM&NFw%q#yXXNY=AFVpXdG3l=JCW0wq2=4F!OtyJbXgcBj!q`u
zSkh_f>`dUOUTyv;jvXBfaCzWw5*_$kM)EO*d?qNWbh!jNTZWwF38l}7v={z8`@Wt^
z#h%gG-d-G*XGtT2XmhEEo@vbI4-a5Y7iPFUe0A)^{?x!JjtdtBUi}wqVL-l6sJQ$S
zYUgR9rUt2Wne6(sV)*>m2<N&ub;Hvc1_lPJKoq5<oH>GerdKB@_3^L2wMXUR)|1Z)
zEa{!wKih}cGhkLUa9v&9L$jJbPcZadVV{brf?piz%C_gN#YfAp|2J4`@O;o3zpy;s
z<hD@u-{ik>!1CO$iP`6$!iO)&1&)1=HsJoK1o!o5qdO!X6?m}Y@b9+e7gYtegW34B
z*AC@SwPe%k4Roq$vGvLU`fiqVJq+?m$8GUo5TBgAdFyP;g%2XON?dkB;70%V?<)?H
z3ppDM$CGc&h0j-M3A1y1VEa7FMSqJeu6t0Qc{;;1!`fV6>L*Ce(`f)D1^=6~NEe~=
zR?p~c&f)9V)-9`1&)`!sXInf<G_;~V4q1T;Z24B={OywrZh=aTh8gM#h)v6pz?`)h
zh3Li|Z$C+zEBa0F;58mo5*r$n{g!2QycN(-Fu?V&aFhoB`+l8``HY%}fM~#mHqpse
znPB{wn+TpOf)$}8ie$dCppMkJ_w{4xa(~a%G;8DbD;hCvbjc$gHWy>z4|fE`AIS3m
zuE(KDSxYtB(bv=+y2=y9JKA#CPo(^|nY*><mP~NoLiPOTd$ZQ}E^(aF*7A7@6vm(m
z`Sg&%v0xBmJy)<OR>TF7LvuF9IZY!49sS#PrS*Q<?DQfAvR%qk+}OV#RBX)rd}TCM
zz-1Erqz^rTzx?KImvUH2cfS~4t}|kw=aYr}HJxjP(nI&|NK~9+Iz&bIc|D79_ur?d
zP}flU^2x!%P{~k!+C!&eON_<eU4hF?^_@KQo1*--VdQU5C4XLoOUIP&1oh<^sm%4~
zJD%+RTq7xlgDRF~K3P-^Qs{dkzRPq5DJdWDZp07QgWX1Uf_!nP&@Bo|uDE@?tyPNO
zm8t9&_1TY~#~U{QcJ73Pt1)7=G&PH$db$cC9z+h@VR=el_4o_F9zF6$y!uR4zf>bi
ztkGQqXfA}boCR*_=(&{XM3uJRRAmow{t6C69+)4A6QpJ0j3p4nKE&PWja1+|_0-J1
zN%X2-&~}cZ+aBv|IN-gHfLf~Y^hPW?v~&u;0-(_XmXT%kEat@S7yM1YV@IT1#?rTH
zMa9Lx2B1GArvO9*NOo;LK)aY46ZQNh^f$Ey-v%$UEQQXj<e(@Z0RgoeAvYtpcy1QI
zfB7Aze~SL!tjytOA)n*(W#_%pfqH5@eE4vX0?x^6#_dZ*cvN947QA~OV&4TxD&g8#
zkAoiP=_!ub6bR|ve}!t~8B+E;KJcqR$*)_%@TX8^W=la%8S1DgEj^?Qf9r$ux0AUN
zR4e8?AHK(P3xinRcpaMHfS9Qeq)E$dT(1vZ8?Bm+F_Ufo@a^coE;Q#T70DHUR@N_#
zO)Rg9zB~JQ=#01kZqr-u3@3THW;dpHzk4t>3n*bgeQXFm(8Zx@y=6Q@8wS5J&lSs@
zM{=kA*M~m4n7%J`0c4Cf_4Ts?;O-~W5ggwi9tDrPAxwL6kLSHO=Aw)rX0R~}!OOsU
zNBvyeN;KFdJ6`q0#=ck(P*?v~mDN1|3KZ;(jH<QoDO_XkgH1##=>^q3d39@#KaHfN
z<P(F<WZ+R;<h&N@DDeyw=$dOAmb|5GIw=2bbsr;x0%)tOu!o}0Mu#%aRZ#*9e3rzK
zqYM23^%{tC|4v6ZcPvw3x6)tNC7(*p0a;>=6S`EkY4yENahvPhv9SL`2+jY=r_~dA
zPc1}7LJXGKX>V97p!Swei3@G7ZokKA9HD-}&}IK7U@aB0>P?NA_@=9}`?r2ow(A{K
zx<R#9w%ku90T0)~8q~=B+bIR#J_lSMg(KjCnqB(+o794fj-OUCA806v`t>Q~kGw?{
zd@sl>0h;#sF%<xG*5=zwZ5rqZabu5rRCn9$U$>r)e~cP~MdUiFr|Vt277Zkijw;S9
z5Z1XSVqSGT?mgw|Ub)}1x}Y^ZiH;gwaWR}WeOD72dVIGM{<?zn&HcbhPfk8Knd<d^
zn8(=#C2QV;0#VwB6Dzy_HrVwrP+;HlHYoZIS$!(Plnb{M^==LLRiLqz6u@iqO;haN
z8m0RTQg3}0-ihL<XP|aht_07wqn!1!fWCZD;PwsMEz{o^DOV4>P!U$<24Z4kk3LcZ
zE2v8L>H~)62`^89H8t^>n8O|$cv1H=eY-tViVvR@SxN>YE91?(U+vdtA6BFU4!1b#
z-0qD_zj=VXh8pr3JU)(Z02ip14vRHN(B=764!^zo>7XEk&%k2bnDIF3%VCvz1OwM>
z+v87~fMrZV==b^97^&camzZGa{IG}0{(S}4_wUcxkBL)hBoHT#;%bV82JB)s8cNR(
zeDB-KE1u_~#HBg7ql^Y9;A=L{s{zQj)9oUy*_NkvrO3OM|EyT)k`j!kQ&!RUJa8&B
z+0wgyMd@@jb;_rjUOp;9B(?tTAOEWPQk?rW+0zX|EIFP6kwi7gK66w4^*4Z%(G*k)
zs=aBhAhXA@`&G>6j)L>4eCgv}f_<%&MFB4m77#dUV|@Mk=^<&K)xKoOR=HF<Db{~`
z%^YR28F7M&T?5Ax93R<+8qxml=@6a{+62p~`_x3kcR73LZ|rMu7F-`sU;6uY?WHEK
z4pUKMSbm6f(eHkf^!wCwT?P@d>U-IMzbiaQYryI+FP=K~>!ByhQ-cm@H2ots%)g)C
ze|~4BGY1Z*M+MxDiHUJ|n*O@j;1Q^@?J6St{gucsa{4lOf4*-X>8!h@p!AfEI%K?R
ze)A}ZKzyLbj~><V)J<Km#9JpG>p{GbvVBCk@uSS(YML}J72W!Ng4ZB%1q)!w+c9Zr
z!tKeD2?eIrnhzg-%+Eot6wmvoZuu1-%?;Y#xvHtDnb-eek1hGHz9>DVKb#J`<a=lj
zHq5OWuxl8^XZk)GXbSuVa<R{n-8>kK;?y}VU^pg01lN;mAj=#_t*j5bP%EsD?W_Fp
zg8!_nEYip-`{hZ=ct>Pei~QOMkDmNW>@Ap?>Gpb);`cX~E&W#v&zs%r&QNs)qf43r
zJ9IK5Tqq`tE5K039dms%vhR1v{dEx1ACq<9uw2+4I>3D8^ofIBYH5fIJYC_kXFR%E
zDm|YcO-I*4ss)USzRV_pC#mU5jZ=F`OSz4Grc9J{POYvA*dq31>v4HWN82Qc*_|;m
zGIC-?<QefS441kkBwm09p|rRH*5Bq}t30stIX?tV%3`mC(6oFG-pAj5eu9Np`_+w1
zwWnWC$hhZ>fSEEP_dZjgR~b)AJWJ(2=NatQA+7#i7dp4-(kfWqJQ1b1DD->U`nO}C
zlmRwFuY_OucRYd|VY(irqiM`_4GI{@GZJwck?OXy`#x45Vl_Wln9;i|z)mwTAu|Oo
zIgJP7Ts|8eOa#~WR=d{kXRW}hN1U)w>0Nw5oyx6bF2Snaxa`X%Pns`2!qf$ZjQK2-
zBC^cu0*+wMHiT|&`p*vJC+8U!o^kNv^k2F{>iXIluqujPo$bvI55-<M^O{#D2Bd(-
z2TJEra6iNNJNd>f0LmV9Bz85d|C}Hz!#{4Hh8Q?}&plN!OuL=u^+<5?qwbUMwCx-B
z$rfkq>`amFH4;ep5W0h_#wn~B0!k&HUaA1AnfF_hoe{UrIB-id+EjOv4Y;T}8Mo=S
zXnd!lc~Nn(<-^VKFs^tollnG*k1Ri$qvDPWn+d@E)>b)I!9})3JUuWoxN(xCv(W79
z>`j=Ne7Ww#x0hDE?{#95lI99>KZ+75luIA>kMttYf+$+|5k_m?^`#ECPI*3rsTZ{T
z!2d$OI~xlQ&6BEA?t3s>&YOevtHWQ%#LO#qP1?R3yeoga^v}BhrhoM7I;hJUhf_eR
zGf%X|Y1~_#A37IcsoWYbI7PzMC4h299L8|!wok(odI<sCDclzpy^<}Dc&Oc-JMj>g
zv**rzt&Offnd3Eg>+9@vd-6Ng@Z*ag)ET-!R`Y#x15d8C#(;Tj@{{%Z%a8nT+jN+0
zBVD;MG<$5*5vux66+*I#>@WKMvQziTcB;EyMA5qDG4AKX>?}U*pi~OTH5^-ho!^?%
zY<Fgu!$?JUIjP^kT(AzzD9Q3$TLgQ<!@w#OOUvbdeYyi`j}-)`ba4iGA^3Qz|MIoU
zsd$qS&Mh#n_$WtkDs!@u3-yjIC2`O=>-g^1`tuMy2UnvhJSx~Pzemvh-86_|>&CM8
ze)L3tM|bL12?I__UygjgjpZrNv$)|>d##xc=z?C!jppLw;;E(a#?`ZP1Nr>G$QI+Z
z5`^M_IG;yuLcsL-Ye0RJbqQElUA%MchFZx>r%_OeOO=183zg~lc$?pR%&$F3yr*C^
znqq5vi*!yH*WAcCd~b`mvT(WPC6|nQb7%w9!&eB<mfeq!&UQd$M>l{owd+a`uAXnh
z?Bm5EU<p>O@h#w`-ud9C2eQBwxn$M6#gOQW>}YO240k46i35CZLo~bi!)9QN-dQ$9
za+Bsfu2*|t2d)_#CzUvj8tclh0F%wQy|Y!f!v}_3y}_Memjl<EHbJoN+=`0i>0Wh%
z_8#CK?57TE1zq=Qd)2q(Ga-HUBRMyCoJ(JAXsm?~+uE9kY$hfqN({ojb<DIQUk!j6
zhw77hfyCF<<nixCOca;{r8;_g<;a?*-ZFymRes<6m6|e#q5Gt_Gg)hfpD++(fDzi4
zdEv~wicvd6X}Wj_X|<(3gm$!lSaBh{+?!+^(-{-64Q$CdbO0$In6yTezRa1rfXFi&
zI!R*JgsSI7)|LXnXnEDZl#Defz7j!d@QaLA(Ces`>F=zotyjWX!Bc(H(p<k^upmv$
z&&Wpxl+`#hbm4o#WC?El@3dG+E@5W-{t?0rYX07DKlS90qn7HCC<)E}U@6?)RG=P(
z5qrUQuau~GH%%tDF4y;-VYw+F65M)*Wm-VSWlSlW{w!<ak(_V|$BrUJ`o6839$z=1
z`R7NX%DY{VjrrkLT+Yy<H<CP8NgXr5SV#K4@k04D8IbK6qe&p}rmAZrZhAL>IfATk
z(6USl`mXdFG%ngV<kdn@-V=;|=85+ToPqcjAf#j$$8O*OARZ|bTMN#C{By&lxz5S-
zUDc$u1tg-}5n%I+5;otczd<|}D<%%vyp|m;v3m{cV6#aXcj{$hnHLtxEFsNFLHa(>
zpJz=>FLma!xk8%Ew^s`k7O9_qg%^42Y{M!$3Y<i@aKKLnbgizeFNe16h(TS&eti0s
z=*5|mxBBvWTk~A@-S$pY>$MW_1++^eqbjdIXW7QsR>oS~_V#6-@i2lu^48AC$X#<2
zpr$Xq9kRK=V9@+gK5x0wXSd9JXWu<bqs%tN5lRte#X5=C%VCQ3q-JRp7|l47yY?eo
zSSER1Y!LB7L5t{TiYwMg<5|FN%%qu@cwq0KAB8e;En>p}!3$3$eY*g}neEIaN~|ls
z@PG&;d^}N-bA3*BVb12;BZi^wyd}=24X6dD)CCcy%TG$O5w6p1iQ`EY9RFZbuD_#3
z?YLNXzcFb#K1(pvk{gy9uuSL==vYf7a^wWCzC}NuTjL>ed<Zc3h)(paQ|aHZ6a<d!
zcI4J>KNu{+Ot(EAMgiZ^Gt~W5T=8LT`RYe(zW#B%)sgfaeA><_X6={m0Zj6Q>&<p{
zQV5eBaBKbf9*R;gXooo%0I*mqYTZUR#F@u+7w`<k9Tr9x8HqBql}il_5D&4SlLF3l
zTV=2ga9zE9E{5y6`b+jH<g~n*i`l-udJ&5TYV>xoP3NJL7X#)#WRIANe?k{oX`ut^
zEoYa3YnxfrA8GsYoJD20_tH+`anS~!Xqx24mDXxqu5as`_)e8WEH&n0w>X7PEjVha
z5K#Bkt_iQM>jo)!*SJvnZt+w~RxHSSmiX||al$AdpJ3ezTKonD0tXZ{m_NXL1;tWu
zM;X`EKVnUBTX**>x{U)0>5h0gI>1lcafgVgD>K)Xg1Ek~pLkQweH5AMBl@IR_Mft*
zbj<@&<7<|T-3gvMS5<{ODIhUt-Y6FB$;4y6dU}0^-PAKcd#t+y+eeK(C(GBlS_N`#
z>RE_?b#!d(gOh}$CnhuU4=WbN2Yl8p<Zghud(Y`htJ;%~V5Wj;Ib8q+<~5(*ah9`Q
z2IT+RT0?s!cua!<iL9a-<<6!hPdQ{gHNgDL(TmmuU%TOw57iD--(#TA1tD2c>q+-Y
zFplrblPB-MWxW<yDUU`Soggz{*=;1jy}YVz&BIQmZ&kv+6J~oytyrFwK@P4qK6!SI
zho>=r4b0cR)@Hl5xZK1QC}0Eih&SaFdGM?au%AYcJAR{%u|n1O)L!JR5K1uf{ZK6w
z6HcEPPOsbw0<*8wEvlWpCfbIkfac8yqFPk{eP!ey(P@<n!^7>Uz|F?dtc83t_^_!^
zOWWdT^*g;Z1#U=0Unsp(Ys@(<|26fcfafL7E^s!uIS4(h3}|5{p9+MMDd2KDn|Nlq
zR5RMr)p+n?cLPXBw6DQ)AG)i?<xYauPyCGv?>}`;F1|-aaQ%ABV9;I>7)G1YC)Hf;
z6JX$>Gimac7zojQq(GR8M2yMj#jO-S-~_D~VJ^r~8hKHoU*kp!79twB?cX`DRLleh
z5R3p*;5m_Bj=C77K+G}erp8Qxfh;ep^F((xXB4NVlbu)d!^_g^stI0i%BiC!MvvQ}
zY8bB&*l+GWg?}W4!5;;d>idi`6pcGLE)Q-GKE1y!J+Sq{PJ$bd(TYY_GylqQyK(C&
zA39{w8`2zygk-Vd$p9wOeYUVi5+}{z-T1@T7E~bsNc3adLI5*)mv@HA3I!BPdZpEs
z{a}~<3B$lM#~2a5`^vxxVDDJ$dK<!M8^tE7)~4~ZCsUp2gHiGOH_<;F=|+&>K!PQ(
zgIC;{;1oG=-BZH0PV9+47!#xA<W%53+oL*M=Ez^SIVC(bo1NzQap(ihy`7~n#X%R6
zO&Y|yu?-DbgTf*umFnyfLgvrR`8j3WH9p?XwO%u-@h&7Rjv~wJglv}rCYz%diGL<_
zLb<9S@mVOML4u_17S<1pu6#CZw`8s;YW=_^EqF0~YY_oUL*BWhgmdVkAd$U7ch?R`
zjV8gMjZXvYW2>Q{<zwL@d)I*d+bLj(UgJAtJMF%OE|x}pjcXOIyZbGQ3wNg%OZv_a
zt7tu!*zHmhngv%S<vGsTC`aLQ&9}Z+57D%($fYpP2CymkSB!ueIT8*#4Gh9hMtI1>
zRP&R|itT!NyTiB%ay3j!7?oq}!~t>;ZwKP{!Rx*Nm#Oy`y;wJ@w{zK<*M&>&GR(d7
zipLBk4IH+z4x;*^z<UTHap|fNHKx>2Fj_$?aEF9mfaI*bpc&Ou+;aEpAf|_y<s!@j
zw>0)CZe#t`$Z?6U+0I(v4qvANDbGY5mZ^|3c619q=Fj=Ke)V1uAZV8^?i1?RCMrGi
zF?npeQ@gY6=jTivLINLBn&RGbtwV@eF0!~j;;Jx6o{r;bs5j6%TjppL#yOUn_Z<QM
z1Rex`JbS(8lK(ZVfrJ(nA#UMCxA|^h<a8tzYOGu$x3z<blK7n?U3k`!Sx5=y=ue!@
z?#WPPkp1ELNr%IVXud;Cs5Wjyvs-&=Rw$Lw7%Of}vXIj~{dQgP5-hbVlu>fj{WT0?
z3cG@CYtuGgM+2ZvrhbXUYVL2Lu8wdVS38PWsRO&<xPE6Q1kz1GNRf7Pe{Die{!d2e
z>gjnQK<j|eYUFY96u*|+2BuRE@xVK9*qNzU8gMyxj|D(wJZf?skR8uR9W;!~vXqZZ
zXQ(rv3*+zWyT6hB08zPTe3iajh>wpi3(Y<@@VU5L4qRRC)HP~U=YzMl8^}vEJ?K@3
zX=Gu4rK_Xk;Ta8P4r`-)v4UPk>UwLnkSmh5&rG;#UB2T2)@0GPq$=Q`?hVR#o3XDB
zyeccFR<A*Pu89=E#TFgxQYQ+`7UGwe=T(GeQrsdrq?=}=bR``I4=?)wKMj~50=n{y
zqq)`kHJN>~*c7`<gPaGuXweVeI&*bJlUA<KWMga!Kq^z)sk4-{KdKk_Q_|8i{ORXq
z@80_1iVAwmdV6}@<8M+?&a`GS&nw^Fy?FrJh~y8R`1!J}F!YCIzCogJ1zz$xfKuBG
zqHFhp@6Ia)ZJ)ne5k1kEFI%O)9t3$r@&;4X{9UMtF=ZSVl(-5wIKKLVq-J@!RhXp4
zfr#z}SJp2sG9NsTrNP;bJE@9h1{2aYC;3pfB`~?%L-*`@vYvAsLmP2{wF$c4^5*a`
zX;o!4J&UWsM?w*&%S5TFL!A-?jP4^kp|S=Ya(Hc7*p96qm`4k%K4qt-&ShTd`fdcw
zkNUx(V-m8!t^w4G0!~vbp3WigUx1`CcjfJV#`Cn{k*?^vz(6k#7lM;lh>e<hJK}V)
zz8PfYHk-U}N%0B%t;YF>vqu>{?Jp^;D?JG%dR+Cg`Qn)mb3V1c(HZFE#fTEFSE}x<
zjf^Z9f0&Iy9t3fP;7__P><R%DD8sxBuDhR<*KUT8z;N<sk@J7<vUJlS-IcfJ;fgDG
zvP)X$RPLs|TEjEdB&x(!(|JZd=Vzb3-UjOC;hODw3dp4#TnY>?J7{!hJHTZ?^rg_4
zzt2(lag*JZ0pLrd0`^BXQNYdee>D93>ZoW|K;AzpLR0IpDY@OwCzzS;aJu4)sV72k
z-thsBQJ%tmgau@IIggAV2@6F86-Tx$#@bT)iYLnZmD#>A2`K}qr-vtAM^EnO)eR7G
zjC#~7l{h^U6R8Rfb_Ns0ywGNF-<Ay3@DVGV_9IH)1uRGjMoq;=wt!RA1hrE!hruq!
zL)d3H5TLkW?E*dA=fRXj4X3&-Pp_>!qv8i$=~otuMBSFguGlXFrT^ZRC~5`rj}Bh+
zEp=r?G!DuP4oYz#Nc!e6>m9Z17!WL!7h`lwaSX==ToOQFdaQE!JOAjEizx9`kb=P2
zQTYKdl5ASwn;hfn4X&GS#O!VkZi&xtgB+(4Nw5eZ15`q^xP*H_!$a4&Mk>I#5vZzP
zs&6fdIf?>amK_{8Q#A*Fn^|rEGaHq^b*T+Txf01CTZL>DQR12{p5z>90~w+UfsxKP
zaBk)d0354_poq?}HSTBLpzYR6-PN_o?-aDVvoxSKL^WiQxJu*PEqO_b>HZh?^ffb4
zM=Tfx^jgTY$~)PL^N(m?_dhv3RME=I(F0sjhEr_m2t?rC!KKFM2#vdwTNlosKQF>P
zk<l2&#G2^h(jB~y_Qfg=Z65pjwSI}6Tm06w^u?x9{^_VdRpNx;_`tDpcm<?})a14e
zP`ctRuSn;|EjN-SGe42$k`DuH7lireMKX&?b23eIx;nOK#J7Qb69_3$sl>V3i+eCo
zbgs&)*cnBg2w6xP%XjuOGfQ=@9zYbij4OM==`)a|5x+ycgHBjz;P!@-{AfX1@V$*0
z#T}!g^I_$JxEeNbRC%?};d(?siJLf2K55Pu`BK7JZFG%8bmTGpAZd6Tq?0ELj0>@k
zArS+*OETtQwx|=S5G4$QuO`9JzMS<LGq{y*1sW}ZCeh$Pb6Ij~zJSwkY^@Pb*TC7$
zNcrmR5BE{3A1zqvkeZ0NcdR<^kglu@dB`0EjB3gC3L6<2$r$taS;mzj$ur~UC0qpp
z1;|!6_V@?tC`(Q=m)xXs#`WRu38$f=ucM1l`T(cW0-w|M`OFJaPUl23>%wYgY^VsR
z_PuIH{|U`b1g|Nk7>P{}6t1ezgtRuv#^B-E0kj{{`)0i|h@&|H>L1Z@b6)RJxa%I<
zhT%KNCQHYsdt_~t)IWF+Z#L@PKG5a2FCOJ1T;K&M*)UxFIdCC-<K87{PD<j>i6+wH
zoXFtNAaVqD6oB6y<!~`dB7nBK5O+$h`&_C3jw2VQaCnShkZq4B5cHidY#Q+}F!hLo
z9|T$h{3f@(^LbxP*IVuc{u7fPk(u>=@I&M*8TsCcUnd9^QMF*-Dt+gXK4T)Q0fF5Y
zIg2cJepLNr)JZLWtrRHCn@=n5Q-g(;5Dyl4B^ad>ZY$l)H!WH6)Ov>sB8(x?05ID_
zFusCt#GRQHIYMpV`goX1S;B4b(Lr22O!(FCPitWTSB}i%L6A67Ro@Af%)#9e5v9h!
z+5b_<(fe!Og3d36WzMF~<G|>3mQHH#W%L+;(G!`gkt~^2B@{$SaJ4F+WUMZ8;V8C1
zuA=g|5rDcD-OE$0ql;L&5wnCIYS0KUd(PZsi?rqy#gg*;oYD>$9KSxCEMleEeJ<hd
zj{;I>;I?HlWGt9=#6zZM8<ayvt>nuUcQ!g}8v~bH_-Yr7!Gx#93q8?g&<saEQ%#n1
z#HZqNK}ID2-c=29aRk>?h<ME1GDrHR7!_L|D>rFgO)pi@IQ)TH-M9|;w$YD;kws>y
zJYDuP1jl_S`@>FVxYsV3oq+lr&3TiqDi%~)fgwGgRX3bUgN6R#R_0=F2bt+SHZ%AC
z`Lvf2eT(Z3-M|W}i5dgBEAVT9?yv0O(UGN4j7ROqqf~_3Q<`q6fBodouar&%e>|1W
z<SJF)K1PfYYRZMia7v;meHm}c&SdB_ZqM2C!_TEs67O{xM$Iz5^NTvE6%+u<E4ABb
zP?4ymrK$y!osbWf<iu^~<#7N{^kFj1TJSE%VzBkhofKP7=vn-mu>H9PgXw@=UMPTF
zIT%?`z_W<Wy~cA4^7Mnk)iJ?8kcFtZVvtJ!RxXSuf;I{ORh^Y9%$GqOG~JIh&oN|*
z{*wN7F-mcJP(Ey|t>GyHL;{pc4&EtjCAz#=tG%cbq#z};J=yYFCDQ0_kQvv3pR4Mf
zqBk!H4Wdfz4a`l()#eaoToA$ybNQ_lKdnbikLE<E;5_yJM1y&zqZER_eL)U(ks4!J
zEt&K5*Wxu96F!wdt}2+_;S=z6Z!c{BN*0|wS#%OWbiE*Q6v)!*l*32BbnVpA(PVT?
zP<|R5B9%xsr#=F}XP@--9<GpF&&zC;oyo+49=Ul1nTFD0vuv4VxR=qs36v`+pAgGH
z2C=j1RK~;x29>YW%DiI>4ghth+OiVoKVa84?~J;RjKRT}6ZYwjj*dfip1>Iwbb^A^
z$ihQR>3~GT)2tAletS3o5-JwX-VfRa$dxCAz({jWaD368amue11n&lGCpt>c11YWt
zJy*c|5PZ0}C5O2j!qcVr^9xI@f*qX#S(coqj+o=(fZ*4Ykd<yW(F%9RQtEVZ001<H
z{)n8o#jAwVxU@(4>_5l$8JIhy5OWZ_JJboj2-qRp7*)^5$?Awx$h$Se7iPOBIMSI|
zZy~w|J^Gg8_zjM~WE1_y>e-JM0uV>%+FUN|ke&X%HW}lZ$n#us>P<3W+mQ^BMGJjg
z;tyk;JhfcDIAx<MXHu~PkE|DK@Ve$);?HXCe?5R*9<oV0_S8OCjM7(r(K(Q0g1%fD
zNX|UM%N&u`)$f@037C}SVZcbuQbsje^wBYb{Kzf!r%aKD3l^}YeV}PBzx)Nk;>Ag)
zih9-<#9@LL8ZslX5vI7wofXC2f$&q^H^C&gq}1%`*lR-8;mkJKwGf)#a%c47f@>k3
zcsi`OPP9M0BC@Q&nUzlA)p*|pV1;EhYs<2k+%fPBCK+uoRq1R_fd?RxfDe}h*~&+B
zv5j6gfOf(qoJKIIevj%`U6_tww!|Ss_mf$Oa-}ELv@58e@n9SJ&i%_aTn7jG?81``
zOS!$+2&b=5KMpMDwwh^rf?cT5)lo7ia$9zQfik}KD^yeYNtMupM_48!v@&_G3W8x^
z5n3jN66B)cWlFd5D*DuLdco?}`oxykeBo?%Bc_fGKbApgS>2i}=^TGt(72+tu<gy*
z$2<TI<v&!e?kTa;_ZoUqV1+}$!8H!k<YE-4S<o7=0-TG`14_@Ye93w7CV*m?jCLkp
z>%E{at;XW&b^<PEj#jsJw4t|GB`?>z*mUdi>86|~gH_I^j~ILf<lpN*c6_5$7r~{7
z8agG?-qI4S03kl3p9^!)*B3Reaoz&;Dvs3}NSqu4xda2^s?d^&56qqe5z4~g2o)o>
z51VVdm}uuHIE;>IvYcU+cM73l9MK_%Ds|gc5uEbFqc{LH#DdA4Urh(tR%*#rB@bSI
z!5vVH9<hQxpYoPOd1r2})$Ob-WUu*vPMhiikne+=PA>4MMZAjUQP(8bxE*CIspgjf
z3`zpQ8vwTMbDn>c`?bd)dzlPM@uuShzKMxb`c`f(w~kg-d*R|EA`XH&^TgH`vz*xy
z{vD|n{G=97U&eY@!U9qWCRsvqEu|v?{G&qKji%S__A3Gl>^SpJkS9nJAK>E`?!5gA
zm%65@>6$GAQ$#V}U3ChVajx}$x0jDO`-+06iwk~&cZt)J;DV=xy^4O5ncsV)xio)S
zsJ?s1V{+AY3hIUW2{owb9td%y=_HX0i#&0%SdU2?=jR?*AK?_pC488<E)r!2yr;j%
znU}!mr}?e9O@p-XhkO>?tV06lUjKN1t#4I&COqt<6{<ST*f&8-mI}^kpgwU(QnP$b
zs>8p+{)6LH{^@#JSzmasTFD19FB}H1Tdlacq@wMJ*_OE<@ac<hUCrvSy@EMQI+Mih
ztju?QombR_nc@v2*IM|})`x$VvDqoC50QXv$tZiv(^CgT`G>(Z>(oLYKKvoD3iV_Q
zf&^AEH?H=|>6<5IMC$bKbFh)~`N+Z4HK}Qf_%mBO@9#Zdk%~~_inaX57TMG1uLJLo
zeP(rZkE}hI8eGE9wRK<WZHGqb3nZsqU6CQz!RqAhnM_Vz&@2cL-4~#KUjM2qH`EOn
z-^eqfbKcRRjT~W|^1kblY+6b~<&9Ac_~~~1emr!woo)t{7X>dKSe3sSWR~3PQdC?A
z60D7ljoQZP>1pDe)XK_cV_aTd-Wf(m*_D(JG+yT3<NK?_CBOI~9m_Y85-(Xib~YEK
zf;;<V?O(|D=~eophD4HWLeMe*bR_>3KD^J&1zzT?28%lJ7=a}Lk5$_o@r-Mv-*iBN
zV0MsoY`}vI$4C1x1e>5`S+HBoHQNBA^yQ2U*9B03F7EBTzd#cb7=vh<ZMfrC5k<>y
z2hl%4{e)%UDh$qPN%nY_vAjw!+JUgEkC~Ee>qu)ja{@pok2`|uua_KN?SOfp#}%&Q
z^lKXkPXedAW?ntW?b8<Sd82>!(dxIEFs4|myf5Tb$LVM5K-EZFhg}cf*-NSa_`h59
z!OI7`_&(%pgoyuNjO44Ee>0K^5XlsS%YfLz!&*N2!C)vGz?Lx}%DDpw1mt4seX6hA
zuzZ1VH?b=oMpf<~Ag0#j3a>?DsMVu4mQHS<m|Nt(;fhogm8lVPMs2=9UTle+rljz@
z%kua*i**9%gwe>>g=Tp!44<>(eK`6DB?L{z*+ISzs+8FppsTMBQgf1tQ_dF0wvf5K
zZQJ|)B^lT4>FKHIXZA(O9X!qZM2P=R-lwfo(ym!|-P*;AY&tppbgORSZfrS_ji#5-
zH0ANjJl&*$S&!bbHVlc3_W`O#6zH2E&V6yaGTNTZ@BpBbpdpCSuSUjWE_VGe?}#%_
zlI1GvC|WM|jBg#5-!ZBb1F=9I=AP!JA%j70Xm#i1UGo+Sx&EOl212WIM+R%Gs`Jgt
zb(6OIyg<giwb+_C=M~hk7NlEUZ)F2{1TgTg^o1O|bL;aq!S^nW(05{EDc}`>Cm3X;
z6IwP@jItJV<w3X7^$qG&-?<AL{jh*3&$}U$AlN=3Y8@d5VjL$^QR6C*Y3{frB<@k*
z|1<Fj{sQ=4X;O&Cse7o-l+fXW0oWqE3Ynl#iGFqJFgVKVE3iO8Fy*?=F^XLBm-SkV
zkh)(}Ua+{7wzH}3RP*y2wam$?y(+<f5)UFN09pU>9%Ow$N(79h`tXhmJV8p@R6w)h
zfd542%eqc#bVpBt*31i_xLyPyd2Rs5`2cV`mH~8HxgzGUL*`ehsfAWYvh87j{uHam
zDL~eE?k0$#-@RAY7eVyf3QgH}CP?Yr5yPSf&r|%DTh7hpht8M-$gTU6{9ecAPqr1a
zeh>xZz8S0U9&vSSIGNCAF?|~B*R}l$L<|ob*dst2$`}+q0YW=DA|?~4V)%XR&Hs&Y
zeNh)Y;_HyxgWU^EZy?KU{apG!(C{!u6?TXt1|*4B$V8r816Vv@M+|YU%@65=+5@j?
zwPzeSSz5q1F>h*PICo3p&uya10sFMLZ;!_v04XZ0fi+Ek4@&u;iba-r`T@ZGgFR-2
z>Z|=JsK0(p-i!YO*)!(=*q7Xf+ta7^2(#(H&v-t6V*hi4|A|c%sRbU^G-WlF_1E+N
z{3>`5(Bzt?uL|y7=&vs=r9l1B{SQi6h9am93w8IO60?0Z0^-?o!(re5OhEt2tNvg<
z>V3&oPW$sw|MZ&adDI_4w7(Azpv2<(jh>7{oN|VAy$N@sw{|T${S0}pvlN>45a}<^
z30^*)a}$&k#KHZ5KZV${(xlz2Ym(o|?_Oql8~Dfs>C3eLB)&gC7o7ea&|bx@68Z&9
z5Y<39k@<9#kUfYZ*AvOy!}qzW=DQZ~t5B8FOQ>$2Q8K^7(@Fc2%yNFYSFhf!<6!^d
zrZl^M?VI}TqsZSr3sZ^%%u&GaYWz4TAtndo_Wk4alpLtSn7HCgL9aVtfRPD5pjDZ>
zrKP2CLHn1Te?~s76_<MG{+EOCACJl$JfWauZkE|8i%7nK;h+ch`0&xeDvw;o7qkeh
zE8KS_OD9=kT!Nz<Yv%t`mCVsP%g5Iw-vp9?@1mV@JY>KIaru{qD=U7$T6Tcg?coW2
z-5h4Ev5G@o30~f2!h)2<FIDxkj8xChb^$`wP{kw5K_OGWg;H_|9yaPJSCArN^&$np
zn-+TcfOS>mFeD<&4jDX<clB=q46Y#abou#S{tIzDNa-=dtqlrDvayY3vhhC4T5arV
zXPgIV=4u|-W{>p!uM_tg#~Z^OPk58PzC|NVx0^GlLy0*K-vW%)({^@tP4z~u2k5@&
zr2{5dZTA3N(4drJYd`DV)3{nvLBeOrok7c}7Bck}Yxwsy2NxZo+ZI#-%@Tk<FAM7h
zEfe5=qhhEnN}$+5MkROm0sQMI{_&L(8^b9CxkV)_$KOVxN{c2b%`hBTcQeH^4_C$#
zI&SbAG`s}1v*;~?FV$Pwx;^RG&x7vNfRLx&3aWGG_R)UZ4pRO?Gj#pJe!|Oxp!}yl
zLJR=#S?fvXnj___->bO+WASU|%WtsK0DLmK`L&*ck2~%3pQq;!i`WKo(N>oRyv#Wz
zbL)ArJ($G5`r%_|T}EgyWKt)aq|@D71G&a}g54Oro7bk%^qVx>bL;QiN~+@QOhEBM
zZn>Ff8RTZBMMXuLeJc#YHP<--Kx79}vgfP0-{WvqSRtcIS1Y<;g^25kYEuJ8zIkN*
z^p2~AkiO5P1#-fszr#7e3R-9no;Z!4=~S#bbLkIO#WpB4(hS^b`vFLNLM(i`2c;{_
zI<wOPWFE->y@@i%fvUdF3K)C`gIC*U{>O{_x}HCGN$DDOB$8t56}L)8<f{S=FAtPC
zGyevD+4u$)R5DBf-|?KhyeU~@fEv9%!lTyQ9L<xtn1DH1?lgK)ku=o#;9CUSySX{Q
zqqPE8;=OyA`Eh<E>)Pv2Oc(D$R{EC#6Y35-4HaQqOBFQgHG%RvKfo|PcOMI`{Ggxx
z9Y7`=h9;N8LFM`njs`ca^GHRZ1F}qT*P^H~{K#XOb$`D3Z(8*~-(F`Ao{&&V18pY#
zQ*CNqElPM6`{!1K4GqUqXSA79^@0RBljXU6ZEz(mfcW9Ad$+1Z<49A_ESZ(zI`LAH
zv$f#1bsD%`SHsxYco2V1sgsUi;T)k^;kvWECE~qwZv(7J**EaN>}bxS+Kf9XKGTUJ
zUW+5I8bJ!kZL$A<jF!^5V}RFxP59L4zxoMFW+|b4gtbwxw1|_ELKih^)YGDTKXFMu
zq{EY|;O+~<;_-9G%xnNn(-mmD7HEtfAuhLxb~ZCgjvOvujcf`f7ybECT$Bg(c|fz7
z!u-n{*9@j-z@;dO$|?l*!4J1{;}3EvjL=|NW@FF5k36P;oH0E|{3}Mh&JOJRyKc)p
z3if|9QQ!ap9c!`*s;%grLH5b$7d+guXhVDy%j~3O0#`V4BuYKXICxS*pyI;YcqY(Y
zzmMi1ovaL@(9^x`&E;iaRyeSWx2@|y%&%UfNY}-Z4in*eLM`20QzLhBo(TbzfBcr=
zU;O{;Y-CsaEmtk=-<;T(;r_^Kia#oZ&9As`$agrnCma-0ER6T2!K}OiXmP?&v5gkk
zM#}}|N<{V6Dst*=80W>+3ii`*pcD%^M6z?*&v3k%OkN_BQJl>=ZW94{3fx|M3+;Pc
zc|T}hGui-UUCyfdJZTgafeg3+6ZKRc;lhtBwdVsUymN(4+<nv0Di5C8?(t!JSR6Rj
zwKr4LZ_iBv`nNDt*6WbpcWO*y(I@8riA2(w$syVk)|Wzi)X#rW`OlXbPI*xh0aIQN
zaM)RoO%`;JGM$*5Ho>8-zx~c^vFBYl=pDEUDk690%6^P0m3+=wGyH>)<cV~QiI1N)
zb({ed50A>9-%dIjRsdcmxdsP_yjL{fWR5E+039weGq9~N-q)nteQ%rWBEwmQ;{iN7
zII#*iIA%Cts$}|=-?xI>dH_hJTD!Gs((Q))WD!#GuwRpGEZCcCCu6k8Wm<01*P{E_
zfqbB`Y0V>*ZdS8B?=o6tJ?B4FKSb-w%%1JGmj_g<SpZ-U^5XG$GNT>zUh59Q{mSK5
z`t+AUNjNk=*ZI=*ea_us%pHn5oA<eN2SI~G4M3+>jq~nS-t0RkD%$IDLeBfsUBJs+
zrDSp@y-N%PCus^We4Y({0o7sED3jp~CMS#sV?3alx030k1s(0}ai9v;3ebJ4mAU?9
zkh=`}DdE!eb)~<e+@cF!BQ@TzF(zw6W%_GPmAN>({jT5&$*dzHVb&6TK7C<Mz8q}*
zCBbJ`4|FxTI{7lSzqzbJX1s0yq~|IO79g}zoZW=Leq8f@<UB)%yj*+}iNN=U-Rsj<
zRQFY!otb&UqWfuW9q^L%{p!>o@>G~{04Ve5UB?7a+Ta6}D9`3H+dAQr+Qpfpa2ldg
zLxOq0h1@&&%#hsB0N#~sV4_!RwXa=!^pW(QjDv!tVyH7KpbS?z!-@99DOYrUMD-Gf
zGX7@!uN#pg!gzjF#eX|Yr#Y#bOu-osvQ>>zz`<?FtS%lV#m!G%x0TzlbZ9aZ-B()!
zh@7tN;)tvH#hwesvc~JCUZdv#Vdj8|K}bIPXGR0D3K`H}GF0Z6eAjcxN+OH100oLS
z4s;3?3&ouZuL~`khR2*;Ok9limCF3s{$$bkIJrT{UdjMAswE6R>giVz7YMj|lLIEs
zjPzC5eU$8Tf;v6`DR<D2xqA|z;$fQG02T^G&YNWOJjAZ-v^xj5wOQCZhfEzyuiGYK
z9Sw*59H5A$%^Dy4{6ofs9Y7$DkfN$7hADJC>X4q13jeCR;>b)q{oJg{c8Y9iAwd?~
zn;RCn;BH)XnR0-A4TiY@?YC}R12r<$K~HELpthGX+1Nf)9LR8vTL+JK3Ixvn#i$N^
zWt*NgfN3#r+*7_>LzT;WmdtN<D?zgYwJuIGXI#aeJVii--w~=^zfao82OFkQ`eQrr
z?1Qk+FD_etYqpG%KW^B1=70PLXmI5xw+Fx&<@f3b{Qn61?s%%(|NkNlLfsi<Hf}BH
zR8~loqNwZ@j#2g=$2dX~Dxqa$kH|juK7=Hj>`k&c6vx4F_`Tlu_jBKO-SvC)pZh+%
zd!Orly|3%_damn-!fb_(Lw)NS5QDYIc78HQKytHLaKMlh+o9NZs!^J=u?XBv38sfL
z$kW%__-^MuGtuvH_K}LGF~Bgnavr$1vM{n&X0G$4ZkEB-YddwT>e#4IrY?k{i7&-7
z8GeP~K5K#|n}e?NSJU=cdPM~WXw2cqLB>)J&?mwqKIFJf7K6~Eq%Quu$8s(YaV-Ei
z;Pa4D)#0C?5l6iwYEWLrEXl353bheudTN<v^}vo>hMcXN@Ul3v$O-b9-bXVgGCpD=
zeW15~+b+d@s<q%SlRBsfjOR~qZY_T^w%lhO0zibsG`kR(iD%eFmkw>Ue!NWn43gta
zqMTj%j2Ax$heCi@b!AkZ_LZ?Jo;un(bm@CA^d!<()Y&CW9{X;Le^_Aut|Z<|4Hwe3
z3_)L6?Q?y8y0rX?l?NJ~+P#KRHvi~v=~}zc;HV^=SDe;UE_2js6@AnKtu|Z6cE7{@
znC$9geBj;pkM`~@iQlSC-zj9$a?l|1g~cP5N0fTqjlT>@pQSrHTRdcCpSX61TbF5W
zz@AcE&lBkaa)T<LxKZX{F2K)#uc@9>(*%Xc)`w94meib>dK&PVveYIY;vlR`dBV_Q
zZhSl6;sk`QFA-A<X^uJTrmB5uF87(WE*$as9QMS8oCQRqRll<0(78-3(d@dsJSmOX
zJk8FsG{-0+BC<ixqw#5n?$V`~W*sTs1H8a9;*DxP>2m7p4(%S{O8^_o7QFgPmw&od
z&pM#g%Fb!?tUdaBpuSsOeyBFT{sE2e+KYgT5_~iA-&Qkf;%_^pk~e!w7&A|#cu_WG
zs<$8R+?jPy_Rq^#;<NnX6d!wBjkiv#cqHwSCG!}s$hQ)Al;zA(mf5Try~mG^?|hI|
z{X}ESr36!^OPPB8oBfO9H-MOIXd*OSY`$1BWUq5RN4Y6t^+wOud6AN`1FLO=MlU=1
zm`^#Cv&Kk_5s%R(mh5Y<%EsQ#2>OK6l>lh6>%GtfFv5cB+O}6`*OiR_q?v4M&zs38
z2?LsGho8}2GqpYHb4o4Ue2C2N24JIgv{S`IlXbv{8Ql3|*|x3;58Z3C$m>uWX$)T1
z#M{q<9e@XCtPaF3-cl~P>J55Q0)&Q}+Q;*n-i(Exl*9>5vPq0S<v$$0Sk0=tpV)8_
zTwotp6K<$9Zvs2yr_D37#qEo<(v5aHmNlMdP|?xIK}~sl|G(g&3F394w~Ohy`Oj1N
zr;hlsOk04$=~%?h_;D`7LG-#!<sTm|<kjPDk^~pMItjE=L(yg#*i9EFrHYkf(f15s
ziN!ydYCJoVS;fE)m5Rq~;<1}yUr0ANOC%rjpQLZ$-DW|(sp<V8kIq*7T55rr_XA!&
z+T*Fl6lQhp*1McBx_~)z-*<<Nm)A0}$H0%T0odYi*cDX5CxfkPUJRliEdZ9hnrZ=y
z;b%Yg8ZOr~#e-t?ad(zL_9vrO1dV4H=-96|@j4kOL&awI=<=wd_$+J5j#tGV$j;Mh
z%MfyVS4*nS+SQ$ua}U9^kiJdopF!}H1`KuRxJ(%3`-b|LL$j-0^?sSgWLERhJ2z`O
z#g({M_wtv7H<!6dIIeD5do_&<;Yh1*vX@H665Eu!j`10QEJGv*xc5I#x2f<ub?fht
z=;kcIkJX1v5ZgHlw0oz<woMB6S@6e)Fa(3@upeCs_iJMhC1kZ#u}mPB5!9oJz?K<}
zRC;d|3*F<+`=qYxW~ioRnOCYAmZ-1_B0#1a>Vd@am1@*_%UZCOl_}6~a$s^Gg~C9c
z(l}~%#d8x{^;L1VXiTSO#bLy9afXXaaX}ML@byFg*$rw&N-e?+icGzES?RYex??nd
z*>xh)NeEH&x`2UVopt*In#)I~M<mR`W2+BKu+X*0WH6mo`~dY`K<J{!OW9p5PIJ8-
z7O;3EQ!OY?xc0JgLA5iwN&61Gu9MLrq7yG<6SiU_hs0f%1*R`;z;-}v{`zK)p8I0y
z@P$^KzC})>(Dl^S@`i;O-OXN)ua{WB-D3Rt+c$UEvuT5q9q*$j8g7Zr-34mG@(KQi
z-Rf9KIOwQQCZo?~xJ(h*$7T+p`Fagu*o%>&Gv^4HKIJ{rBWu3PY4W^{SjGKhyoG)X
zlH_e;J1OZg5*QNn#kuNfhEeM`MuV=RVVROJexad5j%AUp_H~>_y`SahY95RL*l}Zi
zu=djWgP;@veJ^^UNA!Ltozu_Q1oK$lN9%Wk`zw6kt@DQ_1znpWM2sRaooCI{vV2}k
zc$7^6DQW?!G;1dO0Fv)>uQhmgf2+~(JJ07c6cB)uyuOaS20>bg;`!T_#glP<4T#dW
z4G^dWgG3GaK@gx6_5hPZ+o=W15+#J1*2sBZE;qt$wWsOz!kcM{29?Hej#%76Ikv1z
zsQ;Y%x^oUR8znCvd<75b5K>%KOejg4osdM80F$?UqPEYv+|se%wnoEz?k)P2LiZpa
ztG11&;;?9Pk`uN|8KpWoMsF#R@d^afE-UY-8TS*PSl2_9v~Dj<xX@w;ZyrJ~2qS{7
z^hCX+5OwH%dM@l6D31dNn0gd|S(}wUV(GWHVqGR_f`KAhMUmH`7!tx(d|8_r)x9eU
z^gtstr^7<1{qn^D#LM*$Xy_go9{6`DlZ;7#zQ;OQCcyD`eUGFFfXw^atwOUBSYx6&
zOWu2H%^JCv_bg{E&OH@>+iyB}d;Kv*<4ju67Cg2OZ5X6V+iQHxqMWik?#+tM<mNw+
zxT}SC4;l8(@My}caaNy7;52|5ei685GfxljugADKdp1jK_A`$7zMWYVnTXhTz*+5}
z)6!(CyJP_%h>EFeZBfpjAAh`Gs&go1hfQPZpOQG6QunI|GfF`YD!rAQl-*}lvRdx5
zCyJFhmjShpRHR0=1h09X2&lp7!Zc5v$yn5x!1IB`36C^9gQz{-E{;hD^Qn3id8WF9
z;Xw%ILLbU%k<ncgGgCL$;n9<Am<UbTV-(Z-NC^Ncg+VHC(!?t=hE*3SZpf|NYDXl8
z@UBjqz5NbtHy85-0fi`S@ff@@?}gU;<aRy<&_pGDwttEpNjzenFE~=S@&DVl|1O3k
zUr6fEOd{4ke*Maa-ITeUT8*|WOknrw$bln9j>6GyWOrw~g(4?1_v`Qik%KE7g5QEz
z^9N^>XBx`wi;{Xaa$y$@hkiiN(OtO_sGRGUn!gb8nQys){;2;tbKu)uErD!;bsWGs
zKkgI#@=U5hicy@Y=xJpMZFfzOj$;o`cFppUfb*5}wW3z|g(aYyUxN^%)}wZKz-dSj
zc9BI_S4NbvM6@fRX#5FpMkcqHzS75H4aTKuLvn80ExKttnI$?Zs0p2pjrpevQzSON
z2D-E@9pcD6t#MHQayoS3`g{8BlFg}>?VXdBxozHg;JzAMve2CB+5^TQ&WyUv2nUOL
z`j(oxaG~yWE#b`zPc5Dbe}&G4-yDa}mmmkJqt61Ht<xX(T)eZ-oA^K$apcxKh;?5b
z28BXxINE;;zG)MBN*-&m<tmVPbC5qveZs^4Wxo4w38m0XHBzoVnL~+ZeJq#}i$1Pf
z`h_?8voB{S&iIdI`d@Bh|7?6)w@qsRDOFkFW<yXkTKnv~FZhg6Wk&f~oxTkAk_JJ3
z^qG)ylJ@MqMvY88Pes&Jo`RZ&zIV5g${%k6Qgb!#qwyY_KvAB#KBqK5yK!<$gyB?A
z&Rf8=jQ>bg>0_#lI&W)mcc+Bu7(AbLglVDi`_ntkk7lx2Y`*j(dXY{@>GMOd6(9ZD
zwd-?ADshWjmhLX+g^C^i=%&o8sAtHguzaT?6YN^!0b+#Xp;pKK<m@xsHi>vw><2Ji
zJ&mlp^CV~kQ!gxc-*G|FJ!C~pV~9zx>ZMonnxPlqgW@Y3T)TGIg^5bybd3~n>xw)l
zhpj`7NLusk{}<(K&yiel8St5~v>9aB)zY=7`L66Ydqm55DhzWB_ZhwW2hQ8*&9=^T
zW1ZTJUmi1<@HH;YTH)e1B3M_wT)epHkiI<L6wPJQshf9m(7|m#|E9S8dTJoc4X0yZ
zOprJW%61>IWX&3=2<`cysOuI=3LyfOUfqPkNM~)qSC+qx!kV?3y?ju6RXsrS;AxfA
z;dihKP-3v3P+ad-*l!HN4$uIB3tac|k6b4!osvWZ>|w6+Ab$<&Q4q&Dfz<ZP+7p_|
z4&Jim0*zLb0P@af`Ek0=W=VU_7RKFSQC*s06vw{bJbCrJB%*2xgJt=u>X>{R-EP1R
zTxQqb+|lyiLNN@{3Eq$OSZbAN1QFGIfqEI@a5v~fHt8@xcRn;pEWD%k4{*}9buH;S
zcat*)>4O>zZATA>vpS`l>r*W~zkB0~<=(M}e`f*wQ+X!wdoB#UUh3J1-LWPr);-Jc
z&)W0<X&6F_;SidJQjoqL<?5vKC_QEC?mV8*rsaE#`QAoFN_ykGsFm?Dy8NZ4`Iu_s
zQ^V+RMf;(%PVOof_ItEmWql3XGHZK}_CEKG#prMZ4|iO&#uI~~^)^R}dM3ISsDFs#
zuas|HPgBFk<MMmW9@oF(S0*P@F!dndZQOM%LQgt?W9rsv^HM13VQm?>5hjqFw)|&$
zE<j^BfFc~@`$Gf=FN*kj>f23OIc1tjL|zgfvj1}(RQ%>p(Bu~OY}8Z91)q8xp$j7n
z+upMkswYjOL+j(h?ylSE+3v29=DB->ZaP#gE7F~~7rpeN3jC8dLr&{FP~FwCgX!sa
z3v$aWY<A(4JuO?ld&$2iF#Z{BlgpkybS<QwyJ=J1qGdHxnUsas5@(}5*oTg|I<G28
zAhO^@`-!H647I$mjw%PG^Xn<88RuZ*tG6J7ovfTp5X%88gmLFlt>;*Ab;hy$q%Lt{
zHU(hXp6kr?se5DOrwvP9d~gR-w;}$Gg7wxlNDq0vxf;FsIDrEqL|~`1H<%E{FfM_D
z?=0A^Y%N@Y6S#vV5$2l9Azq~ce9zn^Y0DI-=mH{jX9r_-^C#Prl`}7HUAzBa?|0uY
z4B`&la=5A3e&{3r-jKeZJ~xjmsDpGZJ+qSb@jXthd8;*xZ&yB_BQzLGa2gzS!@d?f
zk@FRVcmwNG@*Z_*Wv5OmZCNQ@Z1PK=-XXE#`C8CC*mR)Sxp_S+=sbV+&X&|-f8oLI
zd+<WsY77d5<d7ODoH#FCg*K>MWHz(vL9^l!Ku-jrPs;9rx90|lFyN0}QnxvuqH;tM
z$tMVhE?&gU-cY{nA|JZ6FpW6FCy6-9Ue6T_UF^J!3Yp}2S@@}a>)Oj(qP2)a(6;d`
zxN8Mr=Dd_B*O*@eNxg6iDuanke6k?7A0pEJd>!!bSC(v}d$ljddQC0+w~1tu2emu}
z`!cN5ZkzJt!1%8na1c}B5|6mf=y9v>1#{`<p>Vkpo1*$T5V0D8c;j)Z?#ig)<Hdp3
zIUzUCIW<j<-Kx8LZ?REW7_m+u7R94PL)FKXgJxPv2hJKi6aiVwOP1^6sMIYK;8TpC
zH!Au#mvYR-8zaX@D>mc3Rjb%x%3#oqq(jcqOX4b(hwoS#LU*_4)z-DG)Z0Tr63LR=
zcuRpShri!Z;!zX8Y01n(593v?S3%VV%Z~;%aXbS(Fe<COWAbGNU0&-P^TuoAsIx$(
zs%y73LLQ1)MhT(#<LVmoBY4qTPH7jOv2$-nM(s#)=)b$_eaW1i4>yaXqvyCOY~ddS
z5y_+_3u-k*v-hL)@9@tpo@q4GpbT3my}Wci;eVat3zph&r-=yN(4P9J#&ET%9eMVk
zmQKnIOG(q6<=N(~-?0HcA|YFHw8ut~2yABlmup~?%hd!fj4rqtdJ&jn?8F#O)pm5=
zAv3aKz06Hz##vB1`Gt+iE8D<Eyg{>=!_YDhCB`^l=BK&?B4Y+8I_TWAT{c!H8e#j~
zFD$k=MP!LlH@RZX$`b_Q_-dco@N<$lR)_o^qwqJ0VW2dj>AIR_uGrOzH1=vbn2rac
zm|M%!%$sq~u|?|EBrDSsK*75DEgOUDE)l2#LdMzeXPe)?mLW{PLDizrd23&*`x{V*
zIH~J%{H_k!V{(?te!}f@L7o-WQg67y)`fs{Ct)`sm&3$Mb=j;~;y9&6it#lNDiXxy
zaO@?TR%SLnwOnq*5`2W!l|t-ltk}WLu~g>Xt|+s*m1HwNQGK}tAqPdqUMU|g7`b&1
z+!GBz+DzZ7WAEB{${~{dWw6VV2Uq&-Ne@iM*_sFX?R0ywo|57PD9!9QdM-D+|F^56
z&sZb9Fm166Gx5<TNGros)iim`@>f?z0~@8;Ety2*_kp0!?5KQ{MJL*IuG=s>LeY9F
zw#Q+nv++i_5MS_hl+vX46Ppu`I-K?mXQgAm*|f?XS8SWJgT}s*+(CU)J!x#AicuIL
zTXfR&l4k6I5p`+vo9lzc#l)RdGBlPRKRCg7es~MN<7{{76u}p?d9NkbM;HlzdPL`1
z+g?R&ahM+zw|3+q`9VA1g)o7*i)4L2zWg(YwUH7kT)OhvuMq&=Z;3_R4!AzE)b#%A
zPrqxPT0R57Ur;C|?e)6}9z*3>yt{?B6f!{GT?rna^mZrD6$k^Nb#1r7F`?qeM()s?
z8v)HJfEXNF`A+7R0W`Ko&IN7eYY1`)1xs2VW2&!ur|mA%C-n7$o#~rEO$*V6)OdH~
z&BCra9L>rp>R_WztYPlNPp70d0Kzop+eM7?(n6#dIaLf|g)hH-05`)8d)Qufv@vCZ
zCdz4n>e8921CQxi5Y%m%KJx0KGz!0@WDm(uUvAn<a5xWpN>>mI<3<GmvwmQc9ULv@
zl;IID2*uDitZDqfumz+Z?N|cP3BTN1KMSOD@^m&Gr|tW_iLm4@$4i`IImhUGX|@jg
zIz}dNMK@jnC~zr;EI+aozU5H)o47me01)Q%nx!7lk@uj?==wK3f1_k|AC0;(>72a7
znHYd$6}|=TMg-vDv22RwcAvUJR-N@`#_x=|lle)Oca@wdiO*Pl^G647IhxjF7YKmF
z2E;x;$*|X)(fHn%XOawsKmSw?Wf5Kq@+jLUYBxFY%3Su}y=mIWvr84WAzqGFanzl^
z+*U<?nSWz#Nog^S^fn^yU4CUQgfFOxqzc!IBHK*KY_{BZpIXZ@c#?KcHv$kzJC?fV
zUe>1qYu!y6Pa(_RP>{ogf?lnH(XWrV^umkkqm^c^iDE0dkNDu>#_^}P1(&QpSYyh8
z*lPg4=05d#=n+<7dz~)-vH<ey{UXyeR6z!@7_BUKnoB5}G+<xc#j!4W&_O%qBbz9q
zsV^9|7dc|urzATtS`#QtJ6Mu%f_jM?QoAnQAF`Ay8Xem{IWU)J*(das=MN`MyhZj0
zHuJ)l>kAaonY5R}eA8a}@h_GtpXi_n7tCM@gOa*#7M4m!r^CL}6=>8Muvj#dZ!BG|
zy0n9nsp!<c?_PqWtALy4IjflL`&~t<A{PTxd?m=5FRc}R$|4dHn~%!BZw!cVpIYjC
z-ZuB1Sxuv2J}4b>i;Q5OBvsWSuw4Vroyc2q&5w<NU8o@fu#(pWn)rx5^l;AZ77u{+
zji67wIZG68Y&y=7Hc09MacpTd;B})a_-_;GuNDrSmW&>!d1jM`nEU;k1es~L+ohbd
zxIR{4uDBs^OOMM$WV}&Am|7rsW>;Wym?gDG(;gbT40W8cRo#5n#SC?#LB(=zUyEIF
z@RIrNX&wpfCzdj(xW5*aJXr!O(8f4K!Gd;M_M%$&-;&Z^&mV4)eLW?FX7&lfRTs@>
z*U!rMd{=k1Be8m65?2JiL*afsL(efK^=)wr+hZ4f^Fvrby6c<qQu`)U!>nQR(bKqS
zeqGyY=6xZiC-{krv(xDm*v&qs)fz{+Bo4`yqJ<Qa|J=jgaopRg0QRvYO`e;|s09#W
zG-ypg>BbMN8*I6?zF^dz?uT7giD+P5AOX~hJq&JNpwZXQ)$WW$u#W6b4C2p5Q2gsJ
zj~;L>l}(RFQ!jy3P$=B0*fg2ralJ5D-pbK2==GNb<#Na&YUC^Ef6+ZCz|X8P1nt%l
zR?8D$XD)-iSh`E2_wXp(;L*9yr~Z{BKw$yeOY3DRN$Ou#<=^pgF}rA{g(Oi`2C+j*
zuCdX0ix)-qw{Y*P_H9HrJ*F#o_WEzc_N3JuIN0xQXXJ`dm+#z)Ro#FR{PmH*3)yeD
z;uqP7(TpQ^U_sVhD?gQKGg6sUEf*Ec6ypKp*VFO0e2SQ4nK>y2k@xdkFIb8z*5d(^
zGJ<X{AWYTaHXcs+8TD9ei*5koTe1D%9M#ReG3xR&h()3mcjC_=C>T~z%}5yFbw8e_
z62PDuq5Nenxgkf}G7~nW=S6Qo;xYRG&C*SvpW}?qeuqeShV9$ANl}Ly3$Kl{rSC9(
z_nAj`b#7DNmuPM!VY26UFWbRq(lHs-OHf3<Rg_=4Zb%}YUNW}+geASHe&F)*B3>Yi
zb!}nOfkDk;<Opm7FBIQ7_2!!L%-0%)TN-7+BJ)wwS&(YUY#4+K!@iSHc&)zZa|N_J
z4B1$pi$6_Op91dTxa#?G1c-<15O>CYMezz5@4<l&3?PSz0BJknP4`!DX@vpA#JqGe
z;~?SyuwpVgoi|&)xiJm`KH+KavVNuJt=QLytZAd@#RtR_I}Ww)R}US%+7~=DsQ{#I
zRxrBjeJX8_9X*d-GRYwn&#+jCnLQvFitfOOzfy9*^E#J9vd+<r&KFQ0J%7CKSQzYq
zr-Jf=yKwsOlIp~N&sCbC53XAuShLs!#BQ}phWfj;?7Io}Pb(-HbH%fmp@sJXZjYNX
z3r!m6w0mB`i)}gO5hV{qV!vHI-$t|n`=IID$Q#iY-PX}b08SD=R;Mz@bbSC<x7Z?-
zLS#!-oAb%X?`NQwnT3#Ktd}f;NSfp-_^Ztk#Ys`bG#dzRMdotb8f1CX?;@bLJycdK
zr&6a7z`DZ0=>b~%{Q5%GO_ePWb{IQ`7@2a-yP6_7p3YpQvNQ)`v?8}~ulGYBH~QnY
zP8Jderr^g2?)^@0RYf;|3}VflgUK&Qd$%UYX8-%sBw&8oY5GQG!)7!I*pb6ihLN!5
z_wD95-!duM4amfiX3mbY7TuW-691eFr|N~Rh18q}Z*qa2&dqL<c>jj`TdCL0Z97!e
z{k4ypen#M4)-y|g+)!B<%1C`znh}ejjA>aP*c|O<Gn1*8$~TC(M!*3$d$<O2Fll~4
ztBVt4@x?$+F(F&U0qP~W{n*Do|LUghOUmupxfxjtLFRBO-X8%6Eq}*Ac`9w27L`Oj
z62P~FP^nq;2zd4xU~(U>(tav~hJ8Ff@ZvY>G0WcEvj8NWg&OJ%1TF|mP^RQ5!&d3D
zf1&h)ixL|vcgpdgdd%X^oCn#@UzFS0OvrNEBJJMe8fjds%#~^i=n<2S0-%sW0jd;f
z(?Mz_7og}UmZoC8+#;!@uj%={br#vRN0ajl9Hx{O!KB<KVI}G~?XTVD4$cKK1FaUW
z@bi=8X@l5%TU~C23Dg$o0Kl>yRfj-b5@*WcaHMgRcI8{h=ndEeh=09ziEbP1;!GDS
zNZ&0wZ=3Ti#&c6X&Vr=~X*GB(&SF~uE&MR)&48DTvrM{0^9@755c-iyn-5zp8gX(4
zv|;3~FSNXAdZ4f|6zbNa-V8joq_n+Dk(0~W@t-vPq&u*sWA54X2!4km{BlJ;z9)&i
z#Z8%XnH$z!n$I_o7f5!`HQJWcxAxv+KOVj&$wM{bQQu-r_T`%7eQv1pyK5(1^(<y=
zp>z8m<)ccPA1W^|PfxLaM1SzUWYtcfmA&^c6btO$E%w9lV6S&Q+(heFEwcR))BN=H
zlV9HVcQ1O3^ftD`lBgMYY1)#6*UXqJ7du`gptrGU0cvuG+hh5=U<l8|J-~%B)mc#g
zdYk_D-!i)z185!<&PaY~WV1(`cSoor+;lyJr4MBXa;JZ1Er{WPX8NWSEcDnI>s>O>
zg#LwHzk{y6gKi{GP|-8Tu-*thv=$}q%0|3^i?c;k;Lq})nn=5v%=rDiRRZEwb@<+I
zWs+DH6DR;&&m6lEs<&kP`Tb+Um$*>?Kz+GGj|u3$dO`z!hs!W4n5nWwzu$V85FzHP
zNAU5#3+AtWiV4`pCJKiQ*F4v`w8c{t`Kz}(f(O1!wvO?E4y&uBBId_g^DkEO&rb>%
zxDnN3M&JjzFS$w;qHXsWGGiR>(jZV0#IprN)Li*tave;Ek;zs1zS8*TV&4ty7Ahj5
z!r%%xO#b2j{$IuR>I8gt<Gk8$1w$;zFJ9#mV)Os`AGwR9lCsN~eaF@PYP7a^1|Ncp
z7;+rD{ht$nkQ-CE3NuqxBl-X5hX3bLn5n=o`g83M`-N{uz#GOSQNf7)yL$AO^G$&l
zrjYsAwHAgS#`Le-jyV9&Oqg0U{I?6U(LR{@7E2cUzn`4{H)%}V;c+&4>^9l@{lxm!
zy$D1i_nc!S_wzkVHX;OEk<?|c-_FD*@O@Gr$#wkVBI$_rhX|3Jzq`mm#B!r)ro{U5
zEw@x6NI@pGwEb@ji^IqZ^)>6<FD{Y|8k2(AQJG)Z?|&S@7$iwK!6i%J=Zh$)!#ACo
zw#nxI`K$goH5IPFMA>`L=sUpU?>B&W3MOJy;AyhYkAL#_=l@<>A8tf{@5NtSgC3#;
z$~+l_N`6?U|NYB<fAZNPe(V?1pyeHW6ZVzioSA=r^_M>h#J~*MeqnO<7h|diL#nmw
z`~K@!bL?OXV!L7=Ii3^v^S>bZ6fVDi|IuH3#~*%KQU}o;*H_iu`UOok1@q&ry}^l}
zU#B0Jf+R*5P@*kI58cnd8FLCgGtA2R<L9UT<AcdnfM4WWde>_4^F<EQ!DpJsm3I90
zB236d#;&#A`uQR;e>vFh%Le^00Kb?k3OO*Y=F2TDXMS;!HTW#mx`E|)?_G=|vPm>$
z!KV4s!;^f8G>>+6Lf;|Pzqk(=pGHVdD?9MD=NIoxOF!I6IC*EL+s}9T<Kr=rg+aNQ
z+?fCKJ$tgjYNvZ=$HVcTZt_1jB&mvs@Pk6?eqJj)d!bm+?W^(a{KXvl;oD2*!#(E^
z-w6GD%Q07BS+rL4_51MKs=^yC!n^G*<`);?K?b%~CNTfE^FA3aBFB8^Ut!}vixm_A
z@Z?%6?yCPhUjO{k|7|MZ%v_7Ra_Yy4{MSgf<KUw;@%-5Xznij5@B*R)^nYRAYdHh=
z$Ud%+6aT{?{^!9U|2Yg}HzDxPZu;+ivmv?wYVLcEzcI3TZU;rx(ES~eI=`sD(!hVp
zTk%`uhwT#lTSqtym-qfSO2|+>0%aaIb=5CCvp-JNBxJY3xM=kJV$C^-?5Pg7PI*fP
zQz5_=gbS-TfE?HwX)xL#EjtHka=;-bSl`%gsDltNs{jqIyUjpeDUf}b6v{e~-HnhR
zw{D0iKHI>6q%zav-A`0Un6jzF@LtW`e@$<torR=UJ3`e7p^C%59Q!vg<D<i#(EQ?M
zSVP_@kD6EFW?Y`$bgW^3xHW?<qK?C{TOW~(oiKTnQGh7PAZ4AkfgLQ!Qvi8aEMdbk
zf&E$pj&!XALD*MsB@l*y+|q+YbQO<0KU7)wZZ?7As?0z!pEb`YN-R(FLG<VqSdh1n
z0`<X<)d0c2CTeJxF}(v$6z=um9n$2>f7Nf-P{V^VqlBs{^LnFNfuVsOi{!Ir6**@E
z_+9^7wMpV3><<@mq}KfxD}o_>)+`eadN(BcaEN~eoE4yqvTOi0&djmb^jN$?dSxrq
zwzzFfh3=qTSl0yYl3>9g*1W=iwwBwW<q}Ps;0O{6ba(Qi-3W{5SGeOdkVus@gw;`p
zg7~zHeE${-Fv@p)7&yaH0t_k|ab;_Dxz<C2r_iO{xcU4(EB+b|`x^=cB?x=$jj+cD
z^X|KHrw0M*I8SI7`}km^-ncr-TkpGy{qIR;hSa0!9J_jdah#ff7fi2BDRr9-$ZZuU
z=(m%bRa7u>1O~@F=AvUPTj*KKUV(Tn$qv{2%XN7ge+fb%Od+RYJ9{X=huJLQ8g}6z
zIbeN=LxiCGcRoCQAPSBf;dnQ7aJjjy4^DRMBLhaIhv*boPw86k<8qxnYyWQRj+K%G
z3X=aNH&|^(GYM((mTh2=jS&a?V;m5!R~CBc-8*mJFXPc(-1_H{*E`!s#Rc|-p5y(C
zxdN190*40_DHN3QA)5PAd3M3%HQO=SHptp`&*|9QzQu1eW<C6KBG1cZ?qyT0X#P}L
z5Rs}UD&Q#jJ4EB}Rpu4!K!c%(%6S&R9R!$=O>hGJRu~vz_&Ty1v!2b}%<H^dmQfAO
z`ml!z<Iwa}30EE9Ee#OyPtieQ78~LFM;2%mcdBXIR_pZw^-s|i+Idvq-A8Z@HiCq7
zZr&7fdi=3pP<bl6k~qgg)cG3`=UZn1le)CnKWv<?qs2E8#(3~R?Ufj=`PkR*UTM|}
zc4^-Mq5lLf{h%92uIkescf8ovPd3S;UNW8ct1c^fx$NuWO_ewMdO6~FKX2l-EfP)t
zG0}Ts5glouOpx0z=86)n02cHf9)NUoUTPjO5Cc(d!`B*a>-=s5Iz+o2ib&D=fhQja
z;p$ga2zfTK2LkOalhs<a#m+()6Ey=wz6USJMh%v>#oV{uFY7@%0!q#iwpRfw+>THr
z6%z;)l9pX}vSLDd|6hw5%$kXLGl(W>grJ_=->lU6C2{0fcM%93Y5|b4G{2~#`F2UZ
z86~XQ>x)!174aTp`u?{Kv>-6C2BFCp+)e2J-ZP~Z{WTBdicm-0oZfcxvFzH_o??7r
z;)+Sg%H*!$8q@#mTMB`&-^_eX%9j6m&6AY%lm@fGkSlT85J12Q^Ain3;Cw<s;#MRn
zU!UUJ3;N)0-9%tSXzJVR9ySUO^*6v_DDAgDcC8)P$ZM5mU*!gd-<ovRY?43%=yrTZ
zUVL!sgy~w4FCx7ds{UKW$}?{zNWFC3-_|QS&(X4DO)&aPUFj#9e%I?q2BhRdWXnIC
zcpG7WB<SOyMa63+%N76iJ&RDmSchp3m!`*c0cYKVR<neD+<GM~ky5vD^m6LI`{Um~
zc^=(s@?{H!n(=}jgZNU*JLJ3)BOvy7UJMcYHt(_72Mb-zW*gYLb83%<Z;KtVn^ut@
zo2Kyq<v+icRZ+qTmO<;TjL4yQ_vAym-sgZ8)X6~>ar`{4cshkgkc21(5g1ibenw)g
zHE^90kTMK|Bme^NAc<79%ILL(trWHj03K0oMfMZj`7(3zy{1-^c}3JqNa7AjeIgib
z)D0A;e^ZB92yoh+-HX#;%;85=WwS?NCYf*YcmYny?wv2{I6FxqY(jiyPXs7dH?Sbl
z2{<6?U}C{Zcq;1^PFPDoYgviS7B&eI9XH{Clhv-g=~D%-TpNX}U1BVOY!UlQ-K<mW
zuq&Xv1UIdy!ve>iG>CN)&RriZ&POmgL|w8uh|qI?@}WCi#t8L*!x}F=sGaS}q3BLd
zBI+xA85>DqfG$x!+Unxwy8Y&P%w)?U{<pb9^sg-!B$$KjbR`g45SY(-oTlvki}mK$
zNDn|k)LPy(<<6>_D-T~YzjZZk!V|L8h0U_s+hj%ND}#a;(?$nnQXw^(RJMPxdBNBf
z?FP#yB9xULny8Mduf!BaW89ETrVUirWXWm2c>_0(>DSUEX%PoFVPe+)YRwH2M-Zs#
z4{#Qky@J%Q!J($l)qZlK1#@4oEv~B(L=>kMvxq5QG-ftp=6&ITunj~LBO=GOlf8}U
zOE!ac69?81pmdU~Ln>49sJK3a!`^DaiUx)+ip2i0qw_yubsy0&Ky!W|b7y~#@BcIV
z*#20c;uRqUvOcPF@l5Fln#CR+b9%zt#tv<AXoAMXj=NcBax*!0T)q7jasrCTe01Ns
z1Xu<fu3}6LUn3y{BB&e8?dCJEjJgs4Ee{;<xrbMHu{i-jVoM=Na8eY=!6~%Uq8lrt
z_ULCvaT)OE0tG-ujF+Bq82pxhOKhp~V+B^U6R=@jt4#`tRAAm`=KJmI1L2Bqwnrc=
z&4Li)#ZcFmG2J563<0STtUlk=IYBeoMCZ+7QJ;Ua3X%F+@w>D^y7XLEJf`%W{@?|2
z1)ceh`j0#*&as)-?sT|<tZJ<E-OYBh=WW1raadRbA5(D-eY`_L2rVhv{E<+QSYs(O
z@v7G<#0|{Y53uplh;Htb7<Os$!BsAoFMEf&x$cOmu(xj{$c3<^-8pvGFvG3YadWw#
zyeDPRr<mn*(U(6wBrM1R?N|^?*HIuRhn@q!#ci<oI=2H?@0yCb%2)U2hZovx?fpv1
zO5^IFhKzP9E!8bJt}zQ)|IL(X^>W%?gT6PSc&<#k;J|Q&CPC|&lrI-DF%Nx#T40<7
ziO8&nQ-n?BE*Ek#*;A|Z-8}*ru^Y5LaGB4KJ$b*VNQC|CY!`5j4~PgSvRP&W+7`0q
zCvnZ8J65f3^=Ne&4%>%fyw>X;kkRfnRvIGwZM=xPZh+OT8H;+k(w8~$fOFbas_SuC
zylQr-Z_35_t2pg)cZywaz(68r-3Pi?=2_Wtz4O~kJktngP3LFO`vu?H^Q=c&Hq(i<
z6aP3Jq%F04F@FAL5OVm`u$Ti#NEYU69ZRq*ZImW1Zn1VJqkfVvyj2=?F0APC7si~V
zizkO{THSAx3dw1mt>Pa}Ph2byve$h|CNLB<(iKfO;4+s9Ew0JD6EvMwsoSCl$fIEN
zx5I9H!r&I0(`7~z?lEp-Uupgb6o4HfKKMep(u}q9<0aTng0FME+JO<%_tv=3AR*Lv
zWu1iXZy*B9AJZsWfC+rUYl>U6YkDjj6_|6ea}XsvcI)Emm(o$az{i9`gZ0MGuiT`h
z#gY|Rnp2n8TUJxfL3r%PiB6Drz}<YN7{1tucg3`0674mc_x$vV&2Ey~%l#*Zo)PDj
z*9!P4?4cXF$s3XHC>}}6LuU2Qk4WkUu+99U-c@DVxmgvsaW-i$97~IO=A!@VgmR+F
zo3w?yD$m+{v}Y9##o9bmW_Oe_r2WWy+_dX4+sS?cSa*teY+bZ`yX+In!!9484eXw>
zmGajAe0fRK=}De4F@=GK#BAr+7Z3^O7lp;?1?d>WqVzoVxTJMR>lvWti5;b@glvMd
z(r`oiB5;q4)AnBZv@0dVtNyOyv?Z!z{=A{aT_Vr~A#=vz!d=S{)${EvlsmY}dPj7>
z!lmBAJ$fwTW`XoG*zy&<aMs<-?>_k*w4I}qZx)rD_en#-)natmY;mngdT%#82k?mj
z;>+EoMB*h>+C$Qz_0^>KfNz_&WqM;R50!8(=~2}#d(5O46jAHlZZ06}w(s>I_b?z4
zae6NJ-Jhdyjt88Q?0HUeq&<UkMA{3f@*Rr_t5%91TbtVaWNoYQHI%P`9#6H?UbwY>
z&7XV3-W!8aBPmeiV+2Ulc`_*Ppxd$(t4yM?ZQzNqvW#J?h$688x911_%s&nqGxc}T
z{XxjD9EJU*V3RXq>0T^Z@l(BgXBTI%-C)s-;cD7GATaAaGdxQyoz_7oxGOlP%Xd8F
zuc_-;@Rs%9fa6tvbC33nq|bxgn0Y(h;ioBbBWp_a$l(r4Q7M)>FyzlwONMNVB_^-F
zv*}y9cRP(~(V^MHJA8ob;OuHU;dr9UC3)gXLUWBK*Nnl%PTutk9oo%onip`ri&7I;
zv*s`G?ISsDq38%rCmb<1@*UGQug=&y{vQ}37XicgW}I7Z|BPK6RQ8kxi`~IHRr_f5
zjx(uSDPEHjKh(P>pfW#3>vyuy{^KFvFO5hQN-H$BJ)|GYbd(E3>)Zyp6?epj=vPkO
zPk;B4YR$3CCv1EJiKtk&EE!>=dBub+g3i_sF&_;%76d?O5L2%DKBl9X5M}Xc!P}ni
zcrywQPj;x2af>(b_fz<UIN~wPp-z2HAalKH#e3nbUra(DgFkP3V$^+Rja>1~`U{q4
z&Yl)Xlq_Cu6&Dhn=%+*pTce#>y_(HlVuEe^i`GE(N>fjqY(1i(d&Fv|1_m*D7XeLq
z)(KeNmAOo!d6FB$W~Jx!$4YHtDe#>l-b0lc#R2`6NqnN4M8Dk#uUO%dyqfn%OqZXG
z74F+N^=mzR*y}YIwfU5_pe;AMvRXv+Cx)O<CZs$cO+YWE{OPxNF#GJ_6=8wN<;ip#
z==r56u3mF|%OC=7oYKxGr;_herGUSu)ML|T9s{KUU-uVK-+N(HeP@}v)j5lGi%{pf
zEusI=tt~4wGJ8wdwbnu9Z3B{nPs0%{Zkjx)u1SPL8P5qj)}j;@v`Knhx?r!1AC`Q7
z<2bRTLTwbiX&d{|03{7&%_eZz6xT=nb1reQO(LX?G`(y-O>HSF_Blrk{p9{hR>n$H
zaADU=ss!PF8>vBxG-i_PMgA-7U=KFOy|cB5`E=0s$@(JH2REm_{3&d1&2=eGUh&b%
ztA{xGN$AAYwE()1%%XI8yrnLtLv_Qgp2DCIDcaS>A}&=pr=SBquS*1Itrwy@Dkmb!
z$W_&D449cuq)cp3$jjw;jT7Ssto%+nG(iB$R1t)_FqLY@7`NHj&a^mxTGaaAJm)lb
z<L+I2&p@QxiM`lDw9-v^9!ZWfx4&q9_iO1imsZIT$a<9t@J&hOqg5pH0q*!HKjN%O
zSC_&J9O9<DL7IUsDMDBtrL6dOrSm^zh)o^(@KG+;<zEO&kFQKsNKbhV&Jk5dNV2kp
z$L@MtR~mL_>bvOEd!O(BygkHXSZc(z;J8iNaBw6yvyi%VqhlGBg6&mLM;hlH^lYz`
zn|ns$iY>)y4NP4Mjz7CQVV?9Z)4lT(U+=Mwa+B7>PIl<P5(GpTEY0OUNq_saM&>~r
zMG>zJeEMh+sNmjMzTiHcbJU7)DW8heeSAS#)|NV*wp%(#?sU<g-N&5Bpo_kJMrTfJ
zCM{<@niDglAlX7cPn;hbiku5nH$yAvn>?V>@071fVijI`ai4u1zzKY%cm5o0&eXb{
zUk1G}Q|ee%*DG{xW{qUM5A}+b8==q@&7-rZ8M%XyKkzlFWjIMOzW?e2TOCqos?+=+
z4N7?uJrQM1sJ~3xT|9Ej-&a@id1RA*2|YcCH*j}#`wzx^sJc4w96h;<l|)YMhpBpG
zjo`ON3|f%eN}&ANAG|OjTgKjh2MuT8z91Kq2iTbJce)#4=)I}q5dGC=y+o%HS%02p
znWNK5`uvyV!FO}_yiMDJ?V3x{qA|IFBTA<C2RlQS%aX=kQVore{WA^-r=<~z<|qQ`
zMboIwt|4yB&{~be#`A)1@HKdiCXa?KcUh}ECR2q>cj62Rua@6)n2hz^PORU6L?&C-
zT5=GxD|$*y4R!04(u)hK@+<3IbP*#VH2vfh^n$HiQI|`vecY#s(Nh6=7y6C2bK(|o
z)Kl~3*dj?1kCxepX8el@)j64!^_6<v4Ff0C{^@yzWsZ&(O3)rYrVTDEoFwCgnR|rR
z%f(ExiX8t>PwUSMn1^kkxa)VS=f5!z0gL-!`M@=wIzO`gEnp0+u4*Tan^m#ViWTv2
z#Hh!Jq$D}r)~W#ko_6N7-uns_PhxkCpxv1@?EIG7@}&+%Ll;((v#%y+r-vF_uF9U;
zeBFvSNrSxmoDLfpWwnI5TFAmmFL}2wmFrRb6ZS2bzz{4ZZ{}n-6N6P>aXVdx&aI;(
zl3EGlj$*b_!VU@MS4T3FKBG(W_QW8LAS&TiB&~*~5xhw^GM`d~+L99opU$1V#vbL+
z%u91@R90=`k~U?eC5E7?SWPc6eZjB9>G*;XUw??Vwp^pUUG|K*hW{3~1hQS_u4CKC
zNsFSEwV%0eTWDF$;}u6X3W>a{R!K`-%C&9-c#jV>lR3pc{r8jHBM+rak_V#7i-n6x
z4ke}TwN<C%=SOlA`WH{n7<1}ujwqRL#S(|D`~}xRM^trlS)xST+Pny{Zdt<`m^AO<
zO^APjw#e;k!$c(}-E`!n#{@n-i9LIL+))$1XC!#RKB>%iG>WyKSUCy^UjO0{zMzCy
zh{yRxht%Pl+T7KP=N_@4mhVMWXEAs*Bj>>?-aHXHp3wzcanJ>vnQ#B%o%NNkG-Q)w
zlht&tr+sy^ZOVO@w3*eHzTwi3_?7Q?Z|OVrpP7({oKT$~$e8{MzC7h*jLlQ>TSaV4
z`O+sjua@_qic`<es>~L;7aL0@YJ2sPypyK)YYSU1ImOs>B@yhMs)Z-Cvv=-HE@%aX
z^cSLga#Z=iXP?YCtgk}|eW3B)jWhw1WT7I@>ygwWXv3<x)5}E~CJo|3Ba#|f#pR&w
zF14459{3#POFLXtEv`mO{ed~si;z9SC6;q0urHq~m5{fWAl{{e3#M8EXGXnwfqULT
zn2*XOh(q3{{qTl>_m^2ar+!<RSv$gRQmHI$OG!=si^X>X`C<g0?Hvq6XAaeV8y%%H
zTKYofu~GS!$f*oxbi_{{V=gK4=>V3e7&R@}m9J=Y?uK%9q3=;k8PWq#Q=T^I15NF#
zT<5_Hqzk;nl0$y3H;PCYCp^e8O01#Xu##-2U}#vsLF5trx;#YtIH{e<&<)I*2=p;^
zrA1AY+LzzSO*a#tX}^7ca4t^=rSNAE*wbigj&Ss1<^!Q2x?&-?=Dpwb24KF^-DCX+
z2)Ket9^XRN+}tJ*K616=7BaQ^ClvB3=6d>dGP<3!jAI2R%A;!1ynIGJqj9FuL!aE$
zeG10hZ!IEo#4-AS>=fsK4z4Il@T3bm2ots_RbS-smR5pXNSX$4-t6ngI9<`~i5}nt
z4u|M}AG-pRM3RD#?3;HQxPC!NWl>o<qeuP!h;i}?On69L^^CTmcfp%V{CYM0Lo-g{
zHxt`KnARWhDkt86{A_});>@dkd)8o4u}5%10^|~XEW)4drF>cdGYf4P6GIK6>#ryk
zIHLJbB4_9AV*IK(_n7-~kMRU&hyeLc$O#rU`@oyYTd|f^bC!z$gXe@3eXVwWq(`G}
z=N><=n;QryQN0#w{nErMaRLIl56+%ySUl-)5%CaoXXHn>?=u0vD>L-HxoF$+-7y3G
zP(FE$ISdYf?*F+*J3B7j8Vu_J3hPO(Xm6>zj_IeGskMxqLxlvAbm=q6&QO3}5!K)>
z(S}fAug0PYeeL-HNBw{1jOb}mBP+2yk75~j&_p{5)B0%kOAW{pbp#CFKZ<D5C*CFG
z%Z!>Shbc`tdAV9Zm<C%>t<8M%h<6<xSK_HnD(UHr9us_Z^dJ^aET*XeIW#W6s77{Z
z%v4rnLPz=k<_+HI7+&Cz6KTV(;cU$p&L_E~8l-?dpNMVcziB%!RegEmdhBR!b8L05
z%B<$`##LN-VBv)0O2U1+j75Q=pb<A-;;P1sv2B`8d@f4Kq>r%L%hAkc<|QlAoVr<H
zw6=u;7Q!&6fbRK*1$^&C`787TtlvJnuh!@L9r_QTNI?L_p*!_azu-Nu(y$3iN<f!-
z&^h)U91M)}pqMMjs{}5LU<cmK!I_m_J*HlAP><fr#LH4I^(JDk)9*Mx(DH)QiFyeb
z9md|6Ra^0!JH%MoY7ei!zS^SHXy<B`M^1?i7=uW`J!UT7Y7An}3YV(hx{sdAvUH%X
zHd6&tnwJYLW6vKK)rtpSK4HhQU2wJ;jMIEQp}H2$NGsIi)(6_pIF?<B9kPIJQ~HF=
zlUUC<JdJ<S$DUGh>(dG}PX|<0D+EZT5U^wH!o?&oEV1vC&vx?C)XRzByLuB->-p96
z&Y*+rycNLFOB76#zF+pqO)(zg(5oVvTnf_Jy0TOb3ZG<(tQJ@4i#nr!84hh)=IwSY
z<TIsS8d*$hhxU_jcC5b(+{0C5wOV{Tea#1=B&_D7Z8b>t$@h<%)m3u=PL*H?=m9?t
z&v?umyhL$@jn1a&6Ibq&EcqZRb8L~;nIP1gnMO<b<t2CLD1<HQ_Swu!DRyZkce#Yk
z%a&M=UF0^WKn>wK81%=iW0yVU#fO}Gotf@q(7R#UqPRtm^;6b>c3VGLNiuVK{pKqK
z?erZz^B<v*$r)(f=pEnn{6Y=*j#*(#1*Pq{cuUC$1I<YQF7}1+5LcohQSjiquTY(2
zPhzdEHPctWp+9ZN48E;4OTXPrpH<Gge0p<TgqSh6{o%kCJe7yl&V<QZzAPW%d8@W4
z-3%A8PaIk-Es=LbqM2elYdlWDB2c9TQ6qVV1x~Gy^t9@)XkD9+M;J7T#*Me_cQBxP
z-j10Xqb;~=O6W|r6_&&;o=$GRe18z@>pQI|o>CYqMDq?a$4p*?QtfO?$^%n^3o~m>
z^S2AfP2PDNeM3*r1vZ%qk)!1X3}HBog)Q|`G51ks(hArdb*IX@^LgK60UVUsK84YZ
z;x`V^Y3DYwW#kmH&=|CB5lNZR#ar;+pIlan6q3}Pb_p&}9`rpme>P#T3lr6|$dj^T
zO^L)eg$_G<@b=sm{H&bFeAu+++hFP?RQbBy%Bx25EIMROkh=h$bnw0yr+F#l@bZ$L
z2eu^g<%yEHJT1CJHwL~W0fE^6d)BJGGm2G7Tkydr#zdV+;)D_<jM}$*X~dlKodo_W
zNDzBtrp)YwA9wDwVb`2qOwkdZTa9JS?YI8|KI`SwokOW@7w(uGaGUt4MM09J?{GOS
z|02|Qfu?_<^aDGOByKpAU7!f|#yZg>{ZX?6=oj%Pf$yFFR>=imt7E1{@34~ER;(}w
z?hFY|GH1)J4k)ZI+=|6p4Ev~!H%D8mUl(+cGD3Qh6ig*u(WQF8mmV6Eqv4(DD|M7U
z{pCjcSp`&ym83fPfO>gOip1?x0^>dfb@VNpV<?YZ%ckH6-*6m|T!nVwTNn{U>)Y$i
zb)Vpme_obOw=7Cv8_#zqKD2C3hNO|++UHVE9?d|mel(0bnppJV#RDzET7J4{0PVtw
zr^au^;T5I{ck(zCqp>qbZ|v~C{>780nL@{0_H;$$##Xpf)@anKE29+qKH*RrGYhL+
z=)u!(^_A|IK?>c7s#h}@HFoE-x+lkea@!^J`RVafJ#a9IUbvZSp<B?P)WH1S4mcn@
z__WS+?%@#okn8L*xTTU<Hd1IVi3momQ@GeS<fr00!I)6c_bId6rAwt*bYzR0w#{wS
z!QL4%K+kqg)!g#-y1BeOZcZg6f`PaSoZ}XBDLg=Q`nVQe;)biosbiA!gT7CQM=xTg
z+hhE(+a3MLoUBn3r`0Vk)GE&;ifraZh?lW_h}?1e7EdE4YB|Ct+D*>wqMBAV%oi6D
ztO6;$D%CnTkto4_>EN|ev#y)2?uDqpX^yP&#NokI4A;zj-cR`A3lNMPn>zD@ob~@Y
z-Xwbj)S1aF7Jq;8!rOP4<f|3-!e8QtrL}jVQr`vg!4_bZWE<_aoRzwxN?>a&k6iGV
zyq@LW{VLz0_X=P6vV9WMR7lo7rNWZYMehMIvaKUM$rsIsEZLEtKVqPd=#wo&s>VSQ
zs(A9S7_Y4c%n+_{JL)B~@BwRf0VlrpBX6}TYh)`j3gd?3$V#;UdMvVF3SQ<FU7mC-
z7jVG&mr6TxoAF4ZQUPJ>vW}v%%BRp~A!P-wXZrPE6E{%MgQc<(g%hgUz|kxo%)pyU
zc@e(SZ5mwG9w01@28f-`+`aF)h{)er0GqN8N+Ld_7x|2A!MmGQHL1%N+47t~){pm=
z%54}*4@}%BWtbHh`5a6Qjn%+>Snk%f1sAnxCn>@Cv(<zdtNVlKF2dJc^IANlPXb$8
z6B%0i-2BDnE1OXr*iOZrol)Uz(_J=kvf#ug)?dySUki{w31#wx4-^D;R7(W6YZGcp
zwjmujtwNqT`=pXv?f<J5r}GGG(`$0dFa9bAf-Z8W`fGBS<CzRd5(F;JvDW@(Hmh)1
zH+0@iqPPU40vy<1)Z8wr-f!FkMx83P#{cSIJg>pV@ch(`|Lhlt7>7+t@)9*kK7I*~
z>Pa0uU@3XE3S=DTzs5iuL6?Yk90J4YiS(Q()StOd>yRR&RH6<1jhCpv3!%a<K5WcF
zyIH*(XN3fI`%34PYWZUA19+`MTj^WOU5Fgk1@T-cxv3Gw5%UtOtW0(7zJ9K-QEZl)
z^*2W`wqT{)a>s$(k=DOTgfSmCS<{eUaqw+><=>3DAhKTqoXJO0MMoa)dtmrtc`Py9
ziZ)nz<(en9K&9=%dbZbPciU=u0bygtCCC|WFpukVEk`%m`niu(M#<9_@oEICUbk;F
z*8;f0cJ3BCTZEvwn%<$8z}%h9sQWmDh-)&-PE}1L>zv?txO<2WInyhKD{?-cbQ{XW
zX~luLR^fhXXh1((@tXC|Js-gDP{%T2bOV(3h@=#v_WwB`TsfomZ9t*X^=a>G2i-0?
zre!uaFxgj?jCnLov&rt;W0|o9?<g=`YF-DeXV<dE6=Gbv?xJmTP!boSe8?-mJ~TkU
zYgs;_Tbe0q$=5`VYrCYngJ+JC6|u!_<)VQ5`ifo&;Zc;nPG4$9ab0BOnuvgP!Xw7(
zQMWHZ)i|atAL(H#*N=%BkNEg`^}OF5<anm>xlQ1?L(ND7i+Rvg^!vaXk%DQ9;4a=#
zh!UTQu=jJt1r$pZ)*tl``Q{Y<1{?aFXAFTC6#9T;Hz%*Oi2jTK$E5sUPr($!nnqP<
zbqz7S)${2T=f2Y(F=jv62R;_NH48s>XC)oQkp!Ug#I3~wFMNBXGr(;GRfQp8<Du)`
zu65v>#5API-+)~<u~W$1JQnGol=*bpzAF6o0&EaX;W(~yRa;de<!Q5ccYX<8@T0qq
z_b-_#8U=a!^-MP!?W#TysBCgH6mSvNkftJ;)PWp-3GN-n1LywK*n|Wn#>8X(OmzN8
zF*DpvcuD>y-JYf9Iv^R^sk}u*+u=q(msm3xHWv;T$u`oR+<o&rwCY|Ir3K!UE(My6
z*)sEP?XB26ls0HT@TK`vW81YL?5zHRF8;<oOmyov1YeuIprz|P8Ky$Mu+zHF9VS`(
zH>>+v<!{c^({;!&dvC9*r~q1aTx4cVCA5hzrJ260{uoD0NcoH-lqV&sUsz6QC@9FB
zm&7rj>|xdMqm5{emXNUSTZ;)f)o-puwv<aCDUb{^fUK!jW8V!~bL_c%5C&fBB$Yr4
zl_ktv$NOr9rV$cMsp2|zw}iM33U=fKxOILay7Zd9)pYkrn#YoO==t`sKEvSV3(0XO
zZ>|v-hDtiBoK^<YSuK|?=ohdO{a8%r12euNaVrJ$aBe91*@Nm4*OY#Q+=}rxGhgZQ
z{dCdyXr9#KiwlAh$h1p)>th87-AsQv|MdSR9w!4Ci4`nL(sgU`yG2;My>iboz?hy>
zObeE&4lDr*8pBF*`n)S8vPwJ{)Fg=mZzOgPLBX*$U26aFbXxhMS&vO?p3VEcGAn)8
z&h5t482>o?JcCcPKsE#Ol`oWp{F8=+Qu!1mRM1ad?>i3~_ila4rn_F+>1~yp+VRcH
zfvg%|YXp}rZ#Vk-0=Mp#@pe%UG%p`!ya${Q1r9r7D=sbe4Q+HffVs!HLVA=&-=Fo-
zu5s5`=~3@5jm_@M{2pPfH_oAld2tLV$-B_jiXkG4MMPSH5C$4Uba(dSLOu@XNS6-2
z@Sj#~ZK0E28y(q1PE<LAR;Z7jCGN3~f)hd(4v&M}q3G-7ryCBakA|f!Ss?k#do7Ad
z5rK0(ZbJBa<H^*tKhnBV)ls7~pBiAvGb=s#c&HQhJmFB>UX<i~*UYU~&socMAFWj+
zI>%a#dOvFb4?b&d6&))%>UKBX%8F$sZ_3TL5q3|$VqXZMQ5hSBk*vZFoVia~PoG0G
z&VHcdd<`1J2I#mm^i*9l%qNK~R;3HC%Ac}c;74k7k5UJY(m~%wBr>LSi@$_!bl$xz
zJFvBf0u$A*+d#JvzDe5L&>cL9)@XD_omy$TD*!sO($$1}Ek#72^0%c<Mtr?2Z3NOs
zhQy*H=<@?e&UWY*8n36U+m@QCQAt*%y1F~ZlP%GY`Vc=`g@C_`L6o{;!wyuYMQ?#M
zcSFa;<bmEU#J&%Abo{)L;~|u!HK^^(Bv?4DGAp+Kl~8DhL>RORzL}{A=5*{nR2YCc
zjUBNP<DF;g5WhS}&x&)pH%g)Pme8D;-k%Nvmkr~{kR2R0l9^8;#s)!(xp{Gf_{fR?
z2l#EG<J~@$CGb^etU_vG4eliHG#NLGn|o%iOoXs*3D9bnhyo3as*S&C1uw4j(_bbr
zkW77`^COcQ;RFLRW}3~x&o$k&INueH{|pBuNSCwc<xMUloNh@JYm6|G!$p~7#9VOD
zwkQIWjzaE&)WnIQ^4TJT3D>RIMG!v>x-a>P3fK39fDo?}jxptO=M?Qi&OHr<l(Fh^
z#u;?FeZ^pn12^gNVud3w-nVWIazW|y2ap&5AgIV)K4mi?yeQw+_vumD(2{s){wwl;
zLalh>CvtHBo<zsLaeCVMqh#}zVu|UM>HSG}ZRvRijMx30H;drU8$ls9<*|e|;V)*1
zs{^6jo*T>9{fq?RiuWzocqVjMnnlfSWsx(>QomUEb@}D>z!zwQ?98X6I6sNpMS&%%
zrEv(Xa6Gm;3feY+^QTMtTt`}wAcRX4^t-Of&`EL~T?)Bb193l(&yd?(J&&!VJ<lb{
zI1S;q;9GO<hMjX=w(tmFE_*wFeBN7O)O*UG;6|WaAx^Dd1lnUU<rbMEtU&3#uR)Y)
zlZWa|RNtEGql@a;NLI09+0GZ6rZr|lDdWQByB-qPlP0JJ0!#lNW8WQ*<=?&^5s{Ud
zSrKJMk?k%GBU#DF49Sk{k(E)BjL0Sl*?SX0wq#^w@4Yv_^Xl_S<LUc6zt^ijZd_gW
zb-l;=KF4t$M=<uzJk~s>g3}(-DA~&a8F~5#*_Y%X%Cdi)K)cPFzuIv(3}MuJpfS5#
zG*%;oWl*?&<r&$ccO>!3`V)}AI5A(PHS9jOtLNCK`0i%NJu9G!EJ`Q<P|A+(EQV0?
zM8U63mfz3MD0Cj{()&H_jY#V$;0dqo_n(@P*=HQw6L2S~i271T7%k0GW&THw7rQM1
zC4?Do7?@uhrYl-yRS8YC7q2+0Z>JEJxb~}?js%^uN{|V3Rl(8BubMv7Wh3-;%ssSk
z(@GT$A9I)l+f1^1z@O^;bKDlsO7%Ib>pqma_`(~S2!$+#JLB-P3Pqd%M7U3b0f-d{
z<JFI}toc7%Tm5{4j$6oX1)EG>sco8wYh&ic+1JUl<SaOCQm@aSvdVyd^jd<NZpZZT
z!lr4!15>31Z+^9$J%+gsfLeZ$0i*aTJa6}EP<`(QoT2UDrL<sm5p0r99(VU!yn`4b
zSIP69zhh}jS!nkKHRDfJb=<zmtoPoi7s?RwC!S^1_tjT@$ZWC;4tmqq4<SKEJ>T>W
z+~GsB>ysog$<nF=6f#zfs<A2b<5o{&D#bp%cA2kFzBTA#XYo|sl%SV^Vs}flnxczQ
zN%6hIQC4<sG8|zOz1i1J@kcQ6Xqv<qiJq`4+akRA44TCEVjl6Qp1mmape1^s$`c~;
z4mLfF6?6Ag@%3x36Ralo61UT?6qzKB&@y`iT$alw<YP+bi|HyxOkM?uVidvIoBO_-
z&=dbbNRHzH$mrO<fIM+lzK8$Z1*^(-oEAm9Zwgz<vAZl*bRC<Cddd0rZmCE6OjjzN
zN<e5b>zMJ?Ixp7@ylX1QW-=B#;oJ5Vh{x9p65Zpw=1=HWd>>^Qw|bx6GQkOk9O2+<
zMU=NKgoO(6+ahm_A(b^P*oZ*C%z|K6&T-7lJch3!mo?U()5Gh*$CGqaw`?ZJi%c-v
zEs=ED0^nSU<{J20hAYSBg_lWLSE7y<G9^ajKIvOEPgWO;`2$kY7LP(`ZACQx+BnF~
zFyJn`6P1%Ex*NU=r&92;9c82K<&5yoSbcz4jTLK3HSGmz;c<&(y?anr^ZZ1>vYl)v
z$62zSMfAIT99M&ZbxD7QhkM>%lD$^H>miN$>kH%V9F9E+I66k1ixtDN-Wy+vX@>x8
zbjWeW94S1fho>l3Li)4<+8w{*J|SU^&9z7C5AO`HZ<=1^dp(cIOP_b<l5st5-jVvk
zp5+P_zBEAiS>}|fqb``!q<Qwbj>a;wLZCQ~*^V={U^mfh>*DA{nij0&RJz8ZT1;E^
z=o{{#jGB5C_fGHa8B7z`T!gVllao)0D$RPy6=;ta9><(akhHWbF^N~{!#zG)Osl`#
zkz?GtnKB%Co0(hseNWS}-F%}h$9s}&+53gp`wXjaTYB2%@Jcl9e@g0{MiVv_THji~
z(qp^aJ3Hmz%Q9z4e|KJyb%|`%j=Xtwu1_G1W{qM(a237hny;w3`~IfPOsI8d;)>wI
z>C9n-c_v+2og>Z4e5eICf84@1eVdNfE+#j8eVWwIazdaE*Y$d8(rPiG$*py{yYa#|
zNF(G2?Q?~Jg817qdgWyr_4zhgg^e$DUF3b9B`xZ=#&eD11==<#gb9ofGnaVUad?ds
zYdVx$l|(;&xZjrF9Xl$)Hv0I|Z9Ct@k<!#hybkOS_DeMM&wbsMNJTOreJ|JjWgZ%>
z2$3oFu1$rC$uslK-*!6F%&$`R)lsS5rtBW^rdphR{5me53WLquf}O{j$c<g5#_vl%
zMX^82Zq7VSR$y-TjpVJ)+p6OBPAhf|_*3h4(Y{ISR*1Uy%W0_h$aoq@dCcX|D7b9X
z1g}t2=A;Uwyw-!{>1u&-XTNN(T&<=0OnAb|ChxTN>}qc0vO219Ih}`}u7tKtEmX6Z
zERwtJwOo|q?D~tf&-Q$5OAZ~5(#;c)OjQ3Myc8n0I&HfFFhq_7J)jS^{q{}L&xM8l
z52L)wq`6-fzsIJuFZ^bo>HYqt_hr^o{YO{k!`Jqsy0r>$6lPt%ZP&B^P4F%HD%w1q
z-BJfMY1eGmoODtZou_-+fDljAcWiSI*|;cPfb*^lYXbT~+L88wc?CPb>egpH+aB0G
z940&8{$3lLC>{_mzNn7kQs5XfvkbbRR&ucn!M-BwzQ9VkYEOy~AS}O^lTK5YX>5oP
z=<KgyS1TM@-3rNjSb-HmuRidxKZrc_0(6%ktV8UD&E0cAfi$;%G3lFAdu18<bMdco
zgRHAFsg5$uAEvmSkOmOdvs%xZtZ9-EP(6bCMrb;CsEpDtS5P*J)Z-S0!MWLN>SZ^r
zIA6OZ{`umyZ5EE%tQYOT9Xdmo#@(Sr-#E3$^(r*J>t&M^$4%3=upB#v#;Ml{Sffr5
zxm9mtJ<RH}>Isp$)OS(p5tqjGng(37t(sdkEx6`YYt9i?!}_VVcNNLTT~d--W9)=G
z_!4P{+XIs4L<>!)m>zkP&O6<s;Lw@xe`Lvu5U~uDB1FZ}<c1N_;A>gwSQhHp$EfZ<
zP8^QbAQH0|a%W++)+pZR(?+B(_G#bmDiSPi?VY{DT;MrXnz9=d)oU5?%5I;nqtv{N
zin*jF&|X6^t!j(?rFRqE?vhK>(Y#AWMa?-DcwIcN_*vJBzgRKbc8EWs>v%Md^y=7)
zg7faPZXPbaO+CgRXs%(==}pyX9siiL(*9hNlW^N+%=kwY=C!U{ou5?<Q%0j|>=={s
z<mQmbJ>3HmJbJowCDel&1W^u4Pxo>0L^f-sPur^#n5Gp(aYF=UX&>F$&$8l}upJoL
zW5K#&6zymV^J$|<EHZ5?*_qlM%fBKiSy)p;O5-$t=1JzBI*}sNmp?jx4CJHF*+(;>
zG{VLYrTj-Xfy)sxnT?NZ;B=hbcxQ%3bq+Oecm4&64aY_(J`5098&XsN<(lj-b7JEO
z;5pTjjBYZ)cMjE`?4vXM&!%ZhL?t#SAq-UX)0jH{(Ja=EG%`r3P5q^N%Rn`n=<te3
zLS{7qL1Pk;%VB)p4~Rq+_h-u0E8Wln70rfA#(I9LJRG_|HqqxwKx48L?_aIFgm)+?
zi$TYu?bU=oD5*|LK!Q9F=gS|^9{ADa2*SgD5-YSXSu7gh>-9lw7gFx#@m#pyaNcoi
zg%bf`m5Jzun|Txfa|Cnur90Q7)uFqvbJ|b0?ECEuWTRWh6~2=->HkjFB-4-dC~R+J
zTK{28;78OO=-|0Zd;jzR?nOQ4J%ox3V&Fn$@X{Iq-0eo6365nb!WfkdxY6>9*9lPr
zWpKNF!*Ys$DtqlDpN4Fqk%-%u(DD!H-c@L^`;AEX2Uz4}%Sm(}ifGf9qV*>C&!!_S
zK?t3ulJ?engh>uy%YJ!RI#bmeLG`2o3cyj9A_%ZgE@(j3a6d=$*mp#fivbQ`swA9C
zLvMH${;{&&Kyvv;;`v_)cYd_j9q0fwlCdm6XImKJPBw&HYDNg_W+2AAUecTgvJO>q
z#CSKN&tV+Fr+$F&t2@a<qAp`!5??AqE%%>JC{*lGcmO-#dZTEMH3!L$P#~`5rljBY
zK6uUV%_1!yVZ6d9!W;im@ytQGh=N`mG5(*F0R~82J@@?TA480IOWa5kw+8{f)L+0D
zzpXSEL@ZJ7mW2CX)<He8{>)#Hvi*U=|BnVqmpY`W)kF;MFE{Z9=7;`!1T=WRFkt-X
zBm4bHxL}5YU8<S?a+CkoO!wR6C`5TnKTzq&kIDV{tO@e)CrdlcuHW<#fByaFCoix9
zbhQ<~Q%Zb)=4eiM#!J;^_c{JpUBA5v^4$abaOES$KRj3DM?7R|TnL1V{(_kL^>Wl<
zD2tnZaBKRTl+_*QLnW^?|7YK`4?=H2^nz>qFIRqqCPZHst-tim|K88k76;~_P%wFh
z<oB{YvZ7xiBCh;QLH}W?{}_IkEuc}+psVpK`8mo5pXxwPTZ4>><u7~T_qoMImeLgh
z>c+pA=S=v5DEHHrzmDMVd+wjNLP;WvTJ8nO>|Y8E?~&ocNx1!IGv|NYh?@m2yib6K
z_m}PUo&)~2Rc-X&#BaYZ7lRuxc(c^FDt~DgyjTE(&d8+a_S*>j$8%txY<Z4Y5~3)n
zzZii=1d&zXd#LAsZoPL%+j3yH5$+%J20tcn!nWbILOuAO{L{A;;C&Qq6aNB6O)!R=
z<TyG!p!v@=^!sYlfsqxyD{b(XfmI2FF(I?ef57^`ZgLxG_rHR=^OyHl$%LB(IjlSo
z_+K{(WQLpE<_!AFO{T=)O=)OuTK&zX{>`{OgFVb4@$oO;h5B!(m)~X`6$6iah4|fH
zmNp)+%am&2bN|kV^xOabcg;jX^ZBhm`Zkftj&=dleQBXwuk(Lcv<E1dLOh$6F5TaA
z-pEZpz+2`W|EK5sKP=(T@rWiutY?MneY*erE*A>8J?HtGf7#l<-O;5GanXW3Uq$@I
z=Cp!yAwB+4?r#I|>+fXf5btN0H<SF=-~MYLl;Lmn_q5Oa=WG6a6Xer_7`X86giCDK
zUv5GMf6J12`xgeCKW=gkxk;Vhn~1;MgcOEL5$zT8e~uP1=s#~1eIN1qW@2Krz#-bt
zvZfu7BkAf9(P965^Sm>W4AHgnaQgdd!_163MMoM6r$RZSQ<IY3oP6e$yc8mH+k%{w
z-rMygBgUDt&(0n($6s#0JExyyU#MqS5iwa%yejx8sjzS;Z5zVi631s4V$Og5dmnWO
zbEUocHTTOyNB@8RF?hoDwFP8GNB@3#U^x8!%#9`-@&EX$|NL_JO`VuC`W9D(UONK{
z{V)GyOwdVMg12$fA0I!7_W$wEMecaCb7^3<GWp*hkKs8y-qE6yM)-gK`=3LAg6<3F
zQkBKbhkyTaF&;FWi2z5(ul#@i`=1Z(GKAbOUr?Fy@85r$1n$Q&WuB4om%;ek2w@`k
zLpe9x`rGKC&|lqz;gu-0GZOgw_x;EFred6pZhl4aCE%~i0fl!Oh32?YrCQ8-Mw>D1
zWpkPGsV|RJ&xkZi)mEHIdUIjn*w617K}Cxz(CBB}Ve3lPr2+9np~>#l$cqLtES|^x
zqe!$Hp?9&qb+lf0wC+`=LA!ynv9QI@x0X4Eo-^GR#6KpVXQHOBR91S?NJ+z>eaPlL
zg^}`+AK&sJ^s=TDh4eKwah!?RPv;~5T;BhzxsF4yisCg!OrI<5y~?N`SzVO;BF*LT
z^Wyh@A6z1+>IT&)#qQF-Pt(b}S0$mGZ}XH@xnc448I2pc5&vGx?1xf_^=N%7`>HKT
zG4FWTd``&lIRebX2hV+mQAWO6zAIf873D+N{C|xiBMPl#e+ZvC<ElD!$w#_c`k$-k
zET>DXb&CH5g7?g3DOHIkd#=|&nsjK0q+0Ih20AH?E){yw|GpH}ct}xk7jGmphf~MF
z5?By$k)V~XD)1m_sfqb`@!;8h`yeBFR0g%b?Y=t}uVB8PevQkrqmI%pu8Zx*qqs=W
zr`smknSYk`d28%lmwvtM-l#-~fN4y!Qt6vknXHn7+i?e?O14&YQpTj-s`tT#&5O73
zN{9~bl%R?JiYKxTlN)oTpyi&*kNf|=ofEWR;gN@I%t{o@>T92~tbL!IRP@=-Qa2cX
zRi`L-RVRQfM|ZY5=S%B(*PrvYbn3j`XM>Q%F9w?{VWdmt!7L-&8m$^5hH?rwQiU=y
zjQSY6-lUCQzbK+N=b)TpU`hF`&~jQ#LE&(sMp-FQTDxC&4qv2%+ehplPvugKovdD>
zawl2!45I7`SfpABV*EmW%La!gmBt38x9SVG-@JhT(>AK9{qKZm`kaypsFp8KzlbyO
z=uGv>!NC0XLB<U`c@o`DDYDF}rQ+hE;FD#hnRc1AIi<2AYQ|RXKVIr&EylM^hXTRn
zrq+w6gs!gSMSNq(2%6A32R*c7aZkrjg`0L~XWZsCdZ{yGMD=4Iz{X71ndDMV*OU!?
zNqc(BvO_;oNpgi+x;;AVrP`@~#@YpkNhWbP(IH(P6-B^3_U~_hpNEq!lvgyR$Xhfz
zoLp{3<WyL56Le?9s6Moz*Ptf&xd5YYW6(P2W<00JYg6nSOPQ(@8o#()b!K#6Tw}Zr
zN89C_r4N;&`0{<J-m@M*Pl9M2jIl<Iv)*KEi|vZdO3@lleK`(h;(P-(%;ywcXAg{}
z46<Nat;UDoL2=pMo%!Pt|9u<E>zYzzEd<{;(X7TzA(Lk2$x;mkyrR091M7~8Bcc#A
ze=4{h=@f3hlB!@ncDa@^zTpy?Iyt-QOl42DKD~bT+YF8uSU=}V#sD3cjGe1vVs|)@
zQHoOhLYC+)f9e`}@j^-?+#dt(EEz3VEpHO`=;;4^M$#6i<zeQ6jX~SeB=P!XVQRsH
z7d?By<-Fv|`fgl7wy|=21KW1V7Aeb}y5_Qm#T@sbaYtU81Dh{%A6+X*zEi{0I8iap
zB;@Xz{VKKenIW!pqJt+tfz9A3_$p>nSsJVlDG~9X#{D0Yj%qxU{tjniySP|Movy5{
zD4i-rQIWPdI>fr+7n{%E@&S{eDR|yVd6IkdLla)yIFV2Bu=$a(hPx*v$@V!T-`~x9
zVU)hdKWcP*n(<(QTrQ$#IqgZ^NmU)KQsg!`Yk0|YiYEBNhsE1`lUXJQn=Bv0Uoi4n
zk7v3CNsFhf7WI!&{pA7R;ge5cbX-N-9nw9=w~1et(^kLNc6IGr?jEIidzaL~y(CU8
zH0jlkM#kVeHqw}{cDE*6X46njBslL8zB<fNYS5`(6aw32z<U_&=hp;=eejQ~*8!!>
z()-y41(9v<s}=(ZaDG|gCtXo;HS$D_J~UEjjz+g%`4JKa0Sv(pk$(rJ8wO~YFKbI{
zuIjJLw=+8P^Ueo@9vJx{^lY@#_Loufd0Z##&kr0+SJr6^8GekFm-NX8?t87;p`V0%
zURlrT)gGt68n*38=+iMitRemG;JULyF4666Ih|Y_dkU}Ct3+PJOE}S`Uq5*Noudq9
zg0GxRA2*AmImTcR2bG!jmzsl2hJ6Y@Xl&|0JHt25p9j>zYC%2>99JU7Tya!aVMuc-
zZm4|N8>!IhSjIg6`o}}UN)<cqQcfTI>CrsfVyMLcKHl4LKcA9ebBuph0>|omlkRN4
zi^g)_cx-*NesTKHG00d|86d5?b}xyNJ1{5g(&~$Pq5+%t)NRU4KgJ7His8>2S(nEV
zns)u@M8<$UuoLU|Cp!UxyAEN1@vba~u6Z3GAX0Y#j-?Uk8CiJ2!rhW6&$I~;EXPKT
z{D(0YO;q>9>k(w4O7%K7dnKAW#sf%~dytHZtU?o3Jv16TGV!u6L%_XU0E%tl0xdzI
zE}Z}=ol3k*fiGwT>L6!M8v4TTx54>m>%HV~;g&@?DerH>2`NFKoHp0^_RD?C673^D
zt>H;=4B?PmITMN<&z$wfyX~*+oAmE=Fz)S4Q!8ie_%5~qMadbwsZJKdFeSbpuYTz0
zRU)Na2lt(=Y1Mg)k}XT!UCYk3|2jm~M<;-9JH;_e_+u@?X2OAw6|80z(hC4G^&Oy-
zAv<?(?YIJJ05Ed_09CeS>jSu)4iul{@=P|#U7%MTAIUZs=j!4XLw?r$tCpv(<eiRX
z!0RL<8rFPyTF`<Jh#+9c1SX>0Mi3?lmFv)AH43$Of9PNqAnLqe=oa$JH2*sa(WkMK
zpQ3Nc&xJDK1}872HV-Q%pE10&)_l&E>BND(JL$qj{5tDFPPo}RoogDSg5^kU84rhH
z(&O;mq-6D+ZbQ*}vT2EjK1~9(znFr+kPlPsNuxDUk5^S>i*6a~7nB!%Gvh<2mVV{N
zKYg%KJ_VzW*T`?KU0aq#?TZ}ezJ}U|=dX_oR%ZrTA&{6V6iZVt0fjyM&(msmqR_WQ
z7RKqLJ9~kzDC$F~Q;JH?#b?4lXXjuek4R}sk+jfRE}IIgSDL8SST`L0vH4(kP`bSJ
z(Xeol<;yY2DLpdz)8j*(KFVOc<Db38u=FNF_F!c_JuUO4nxi}FzEsj%K!0@bVptTM
zKaQp$GI#BhV&2_))=%$xU7yihU%Wg`W*CZTrwcMda{6D>V`v#G;+^+=>(haS<P&I!
z=+alPwp4cS0MW$WCqnGYC?ILy#=2)K_LoSYfEfE$=YWz(I-|?^9bliX-NBSJ!hFU4
zQX=#a+j>$p^}*vA{&=4>(Kug%9J-Z*)7yX@c~k$6$WZ&yt_wd#z~vrMg8nf1ECJ?9
zm@y-WY^=@^KN)Wf8>dOj=}<vuS)Bp_74i^HZ4X)%Cr=tH>>L~r`@M;5-dU_SYe2g#
zp_2Vzu-@BkZMH`;_PUS5V!>Dh^i%*jdml^e`}Y$3783(BPB2MJP|Pru9E}t$1?{a`
zs3g1v2H_4nN6@P&b|^nY)>Mu?30l1jY<F`50bL;%%569%2?B;{h$fDastk(2Zvz0M
zvy$_)&X@9&!hi!j1^3R{=NjM)!|leF+%{7udkqQ`pu~u^1aKa4U`{bA$_3^UW#GTc
z#)<MZ<hkEKu?Zj~9Vm?ESYF<EA)JW&jmfJFHj^%JxP)Hix1M7~;HcKmKOCVlI!R@m
z?dOAwGl4V$o&YgFQbq@mc;T4`F_!6izyq(>gDmI7Zzt2wWhd&4ZbzgN-8|l;MSC#Z
z{}JD!q!^;n&&}Q~&^UBc#Xb<%@yDfT$G!epYIHaghtanx2}D#8zNkJd=(Ko#jE28W
zfR^`RbT|OgzHy=>zOLQsl&x9%Nu=Md{z9|haFs3&q6L--$eC`2&9M>yr;Z|2|L?m1
zvONkQ?u8cumQy<JJ6_JtyESx9BqNiZX;Hz~4<op_a8Mwyo7g0LLuc70%Vjonm4jU#
zMLtxCv9dhg+#J{*>GpCLnnZ#Ce&hMB3il|CwLc<uxv~T0&XG2G>D8y*eNWDAzwu^Y
zO6`Mc87pB%(P<kg0@;1!KmZky_JoW3Pl#{5M9^&B{m^PM0$|^j7j7<R(MsM`mJm8{
z4np_;OX!a>IKFkTzJGprc?oT|FBKDZMK&t!_QWq6*A^lp4fVa`A3>j3^wQA;l!W~i
zv=aYl>7Uzc5u3qSkTk9Rb7Hm#Nej6$ia>In@Oq`IjcPpl)|Dl7P@^4EVIjbofC4gA
z)B??&7G#TlVthe$sYykq6NAuoSQp)^aF}1stNF%vr9zcO`|v`|SF|0=YU}VepP-<{
z0oM0XtfN-3m~(MD7lGssKn$Iq(}{cwt`<6UAskWl>wCbVYJ?_~JOE@UP3oK2AC^Sa
zJ)-G<Im7=oz%EygPRv`e-Kbh#I2WzR{Bv)MMHfT(#qnzpDYJ=j`(&I@jI+9U3)8`^
zTx>A>c_N>6PEFkIj-q6V23>DA2;<rHF(U1z&P63q230{%<5V0=8~QHv(VasyeHCfZ
z0r~9v!OlKVQw?(kFs}-zc|*-l<<Nygk0@FTWtopkbOEc^mu@FGl4?OxiR#?@PWKH5
zj1|J{JpC_>nMQfFKoA)WWPlakp@O!VNM#QJ^Kr1VE<lS}P3g=b!wte_M4Ny$go8am
zVe<;+O1?BA538JO6hgYz50J@HdrQzWCRA!qQ!C0%lltj~|8hP#V8aMCO8zm^wWlEM
zVV;V4_sWmimkB|JCnf&B50CF$;r`7G%$3Ga?&YVYz#Df4k?~4a$&o-%zEPw$UYn;v
z)xo;Fg&trzv2XCg>2k1h#_NG=Ee<#jgwF$_f=nsKa~mjd;<RgClrAH5V2GL%4+m>j
z5dyRbVw4IMgZi?ug$&A9>><G;kRbF!dY$Bf#VShGy!MPafSx}A{~+6gdGLisLk&|G
z&92^CP|&iK`SfBL5gj3ozhwGN72(bcK?p^7b=lV4qNbt0MixO1>w^DfJ{cFh^<)M}
z-6AlypBI<gU3fa{M=L;D3@icI_bmqyWUiPeK27F3UG$$O=wM{M5NqbAbt#n?i}cHZ
zjeCje!iK%Zvy%M!NBkS@K`7%AXyu7+cjj``k6$`t3=xTS+c2vq#mehD!AgCDxmD#&
zE;(H7<Jbm*CTyVW<n2=gaxbGz0`n_Pl@$W4C6%Q9<eQI3TSR5{pc~tEwgfz!I8a|b
zTUQ8tggC5Ol_iVSROX<i)}6lRqOiqpIrX)Y#=2Lw+LtaZegq6$`aNqOY~q&bf@lKo
zwFgwxtQn%u5$O`U+Q+-AikpD7J_k+4N#vd%U>TnT2g0AuY3K9SoH+J8!pyHB_i&iI
zxRIx417kCF)$y&%nGNW&kO-)Uiaax*E0$ky%S52t^@<)oa%{n@-R>9X;lTSr3B$&W
zcNUJ?_OLy0I3*+@tJk`8-}u0qar-*syv^1lX<<3~i>)K{MYUGTFRIW)NNkIuITB&6
zd_YJOwv%6pt~hik>vgf1K|k{+0L;+MzyGkcfrdprKtt|-NfAwmwFnUbQtu;-t86Wt
zwm9VoYL>0<q^Q;dK^0USc<q>gg4GW&pqovNP;FQF()q~&bLA63%pUX`>Rg+KH67%e
z5=5{M=T3IeG&H|BN;{{GV-e7@0{GxP?bZ$ix?-Tf>1YP1AD7v%>wDl5ECHHuGNu=L
zu{&@|$rsB|mN*kRsUU_}2a;w<p1&BZ0}u41Df(8C2JVN9$9K}yjVl*2rh5?QCexhb
zyusb&)c{6ReI8xIjUW3qeT-17d*d28#VXG2tqqy&pKC07>^S`8jQ(t5fnuc4f%QB~
z<`T;D`14+y5}MG}=~P}d(<hhRj%;3?2_scT(PfX60;{9)^a7z)QOEe_NRZCi{5bAD
z!gd?g53p&3o{A)3wa?wcYgCPB6AnCfXsj;GxwjAesy3T&($cxK^jT`5+j+HB_I~oC
z$0QpZ{N}JMWf<cG`aW9Xj%EnUFJkSMV0h}qnIc96E`bv=2}&m%w+Kr2_w2hsMsxLi
z5Wy`1p%odGZm@edXe<K<_?-ok_YqUl3Sj^5v63ZNAxV{7qsjln-;nsQ3y5asNKa`r
z$JC1<zvNQiBT4`E%2#pzKh|Y3-}lpjeI3_X+|buN=9g1Z7Q+Arcw1f@a|JQ(q#9Tp
z4`d#w8=>tYn*_9yvrw-iYA+8EOs}M}Fqo!mfG?Zl0P0ohi-d8~z<4Tv4^9tbv?q#Y
zXv1jkDO2Q2(8JsI$HZI#NPG^unZ}zB<rAM{b@TeHa6djX0z_L!-9CV_#suKl1?etz
z5Y*!B=TnOF91v-^{QMha{L<z9%s^_)C+7;?O_>B|+KPPyaP$lsOikm!i7d?r4Il-$
zZtVXWntzQ~01MB%Uk*cmB>Da}U-`t3r~!rd-5I0AT#<17C6xF`|1x{=cJZAX@vVC@
zD7y6Tn#Og|?l9vg020HxfIa@U2u!h<L)M*a8l|cb?TlYj1IO7M!ZDkg@<YkbG=Sbv
z4m{m~bG4UDEpaD4*8o|WX!Q%4u#WpzQ6&4|G1Y=&8fhg=hqimllX|G<+##}Qu*U}O
z3&1HH1m5-blq}jV^vD_s^aTJOKW)I><-Diy#B@i>v;gKQL94@F<{-9nG)F~)27L<-
zbqNK9S83<+u@DIIZ^^%(druMa>X84M7OMQ2^o(PIvvM*d>t}`{^co6NuA2pC;uXfP
z-sz2#`ooDfDKBot?Z!9@pNyXW9P5clU(@noSHi;8({G7(S=Dmy%Ncp`B-Qybw0{c|
zZGw=jNlHp=I9TCZxd8CH=sl#Oe9AWIF3Jf~2erVys2ldIbY-sZE)Z_A69!ZkI)X!j
z`0MSd8#{2m!X^m7#3i#C%@@FV@^nN2C8F0vt*l2=w#u7r4Xx;rakkhP!0yU~XwtIL
zaU6-hX(=WGw8uygaItQSMKSdzaZl0F_oAqM0Gx}a<`3cIQEuNW2VRho|FV1_HC&?i
z`e0K<uOJSW(4&rna7`u)8*wtP{o#82?qp(NtX%4|2tXKjh0T%Z0$@&39(YuYz_Pd&
zQRxC68Awv;EDV&ZhaM$nRC2LxsVfNnaFoP9uMl&EO(lC_tF-;j-C9J0@@Q)W`;#Ny
zr=sCZ?;C~VI}n=bYY}4VsC?R2@11D}L9o3_rSgUn4eQrR97izLfEHEv1FZMmZ(z?2
zKMNZvx*+Vlh1T=z(DI$es+!-TQdVQR3lJ|%)(X`abh|d>lvF;c`9YHEK|e4Ze|eAY
z7Q}Y<UDbtO()b4ln>qMdLQp2?<+v&N!(z+OA|*gi0mFkdaKb;v=gt4^d;Jsg_|e~}
z0}q-`ihblc49s%Fg;C%xmX^d!8hfaqpwN-I2|BB+2nQu%VCCX((b%WHERG{->8akE
z_gzZ@QCU}VycQ-0gi7{I{SA~8P&d^fmgbco+W^jlUQ@V!LB%r%Mo$_v&8M_;V4<an
z`#eVxM`IMem_Xo+JI;hCF5Xpj@Y2B!r=eI04&v#9mliu|{m(YqR;&COh{r*V$T9J0
zmhcZ}$|dwVvW+<Y*EXsdS_J2k1$tJG#aV-b?9r=hkc3-kDnj3aPNI4+5_1vtWMDu&
z5d@@M(jB&Q42VU6PC0`D0RBQVvH&6|=yJ_5ANC7`<o;l4Dp@!voFDd=97%Pi)rT;~
zz6;!gGhtrpDJ^NL1#(UN)2#h-XyyE?HhVjpZ#eKDQ148Uw8R2=b&+%v7!dok{8g@-
zKj!oxtBpe6B#d^BMBj3lqxxBpILiiAP|5nR9KRpuO`9M(^UKyqSyURsuaTM{x;T||
zm7%2tGm?NnLlb&g?z+iYLro8!@+$U~4-U{)_6c$Ur*F{OzHR2;dPd6f76@;7X8q4d
z>cmG_JtG;g$K*#-x;)=okOg~025lG2aEf!Ueo#K{BxEyQvE_cP5Q^YDrVjGqufXjY
zKNEdp5Hc{y1DJ;u&z8Yn65rq3#jIEd0)!^RO5|LEl-%MAqSuh}P=(g~CE!He7&2=~
zxqE37ny}b=jIw;J@lS67N3A62&*^|Zow^|UL^IIDu?pF*1(LC;Y&1<?hM)n6hcjk-
zkXRd3+x;L(VW{vo2Pj$-eQy3SiHG(s6t22G2GbzA7~@d7H_ft+t{oF`EA&uG%iejB
zgCnYu2@WG~_Vdh}5_EJ1B0q<-O%+D7j3Gs6G=GUjc)umds!C5gPQ8YGE&p4tfc@gJ
z1Gk;Q6D37e_Q1*DiF0Y82{Cp$BA~7eCsZ6z3f?&unaGYk07(E%TS#;mW#aLCMWq%_
zF@un*pPGe7v_r#dPW0)iR5zPlXmM;1;7ImYj1Pmv3qo}sncx7t4*{T6C<bQYeo_R8
zls~87Jl)v64WUy+z=Uuzfj2ov5U5&q1>^Eu;1B>^0cKX^>U`+t!&X0pQud*`MCP?{
z%FEZBur;>1Y-h>4!~{U0iAMQ@9@#szn9mmvyyk-sq~dVEt3;=Lq6+r;x0vC=jX(un
zJt`O3G50f`X`-Q2ycOFe_wR00I*b_WB9%GvLjfJMqjC|#7|Y)K{cgF>Mx%Udl@xZ3
zi!Qy+{rrOqK%&IBp~h?KTtc(gGp2tn02IT%J4%RSZhFe=)2V1hEXlESm3e-zCMq7I
ziR-lxft&?9Wjii3l@RMNO1eD&am*`7VfC@B0ehSuoPkXO*AI~muJ=BY)}T(#PXhw%
zQeN7FdHVGOgB!dKNek2PEghBv)5Ap+?JP_jF%s@(^LXZ?d+W0FU=amVeB1%LBiZ)5
zpNE9Gx69HhHjUnFCInp+&WIOkpBU-iO|W==;0`6IBb$-5`!2E--Tf_=pi%nj-p;s)
zJtyJ!pfVF8Au-7FAgm)n2m<+W@m0nJ_@NFQ-{q#BH`i8gRqq0&haYr-*-Hrn%jZb=
zqb5Im8vaie?zp2syYFANzdO(Mc*llA3i7$hIgT8z2dRl)Ke$|l7XzzuweO|T0U`l)
z7OaYB1_N_u^Rh_oVNt#M5hek~_i8_{_%M&Wt>D>c#pCVc<jmm&xyP>9J)3a5ZS%u&
z#eMhWVuU)ukJC6S&V(ray@g}**3Gp6h;)pqCLq0`E~$0y8weP5K_dMTGsc@O2r4<_
z1#kYi$-%NiKFIKYH~t!hMLygI=57QD@EmGiF-AQb=K#-4C5i*jyyHjmfsYs><oj=t
zIq@yC5u;OHv4}D_7k*{SpuFzNzpLvc3uJ5KGkJI=(UJL3MvdCpeQ-uYqIevP#SrS`
zFCr@~qM2Zx?Q3yrr%C1TT-uWqC4to{4$4Q$k_ZiC3ilRBBI`)iWBm5SKaBS%{rAIq
zv}jxD!hv;Bg}13Wqp)SsXBxt&&B&HX`en;ua`V6&^pb=_EHo0Lds&Av{;K8f?qGI`
zb3*t=DZfN_5-7wqyi$}5j$x^c|EWzU$RR^#Kp7GyaDgv|xPfmW)<VGS65!;%RV%W}
z1kDI>h^oJsLj;?We)<NmPs@T500X4Ra&AWOD*){ZbC_vqff0xqw3a&BPqrlnSU@24
zDJPTn$07UMBAPn+{RP|2G%{}fxZnqX$6L1BQ-j@KxOsQv>A1dQDaGvrP|9sOG*U5r
zJcz}g4sFE|Hft1p&RMdp#BUuQ=pgw_zP^-k@!z|B5<}kexsQ*T91@=&Q@Z(MivJjJ
zZlCX)w=>&5boWOwKNLYu>8L4qjY}6<hNj70o?dp0+!rr2>bq(+*YY*^my-7ADM%5g
zK&s)4tYBH-kgc(0)N;2tWa+0)9XRAJ1`J4$5~J4s&(a<{*w_a-9OQ!w4g>flqemx1
zsJAl&zs{T4=lPsi&sZ&*%XhPw%`90FT))|`=9R5oBb9De{>ZDridKJXg$i4`a3;TG
zrdJn>s+#Vj?+Jm+uErk<(hCWtZ=f5ZBTKIy_%e+Zp}fTg#(FZe#dysRLo7NJNyRog
zKRQcWv4Q2$v^I*JCEPz3*!<RTyP9ibtI<K<7KI*nGTmnJ-X=&CuxLEqjBAJz(cpo`
zzAo_8bg~+4M1ovJrs3Je7?F9IMs|1AqN2lIOhd`sN-<7SnXzJ+>E^gL*O+4ca`{z~
z&sa}ye>0PMEm^){*paME_845Cw@@^BWqk^r4WWD5fv}N>Z1-}R#H7ES#?44UWylzD
z0Lz^plsqJn+z9wac^9DzG|)zg{Ai#%l7(@<((?Z?u)0Slq^Hd?n3Q}A`;G{iM=@Dg
ze~}JdFi{Cw>zN;|D%iYu{Io4;%e1Z6ob-N~H@A2~n!czsmp_I9uM0#qVp;bajW`CI
z!!D(HtmkhPtwW)+7D8@%;I4>9j@NdLQ-&v9Fd%LfK0$uwrXU@ozx5X(v%dS;SLlY9
zfM?^jy3HWw_VI2AyU)UAv3;(3^Z0d5h>MouMRvs*Z-q|?lt9=8w4V+`|3*8>;)vCB
zd<XW3q-K9}Vl4yLRkQRP&)Am?@3tN*Jq=-O7;c_BWI}y4<aB2uZ@g)`doe(G++<X;
z*{$xh4Dp!U-tN4UB#8I0ZUo%o7xy@JLQa|d)Y}}Skgzh-^(C?Zl8kXcv2-f&JqNS?
zI%bEQNx>*t0i^G~@b3cCaxKvfYCp1O?BfagNPe0*Fm25fQt;wj2X4;~NAjN|@%Bjs
zW+#avC>Ka>tW<kAccMcP7kC0|Hkpp}>NOXjZ$&2voqb}x+|@AV8>WG|kvc&eG^Q0o
z+hpwdE{Ey(mL6c%?!1lLKP)hl?q*al8g$f{EesQ#usua7qoRU$!1=Habh#bHT!us8
z6F>z_n~gK7$XbD{qs79DTG$~U8b-xJd5ovn%&#-Puzl0!Z4VYV)&b~UfYqI18pc8e
z3V-*u!B*XsEU{a?mn#@j3*kPCTG5_~4<Q>=jngnYU%kNSxQK*D`_HV)bVHwqWS>nr
zCEGFH_aq={W`g#P(O1XnH^erHM}r!(_`HTsot4GH^@-rOY!#jEhxU4Nkkam1xK3rv
z0Ik(NAW2gb?19yF^n(Obbq>%X>#Gbwrc%XjeJ+Ab;{irZyZdn+z+t+`5yAP>aRUO?
zv%MOEZ>2*Agx<GRGpz+)XWD1~<RcNgsA9snSo|(Uhh+s6GXfDYi@k4EFRaox`rcf_
z-R@ZjUE`dNl$<E;c8*n537!|P4NveGz0Nr=47OdrH$Q`BdoHt{{ky|}SoCKJljvJz
zAV+Kt63g#a1z6FCD`P}GJt8ufZ-ch;)4mh>pvHqQ73(Kn#IX=I2F&fPW1Bl*__@tf
zTZ3O>F~|&lUl%0t|8rfC5*U6lOQ!SUAoM5$&oZP;^QqLGIn3+EhNX{NF&-4G9DcJN
zQMAJzO)&PTYK}R``q~m<(QxdolzLHKk^8+hcV4Ge*h|IUvuzAZ6l|0~w+H?j8xkCM
z_J-a&Q8z7vcTCeojxF(?7N0@+6y5%YC+Go@1|4Dz@&z|Huo@y0hr80+W@!{xO61t*
zAaS8)4w()2H3C1vlfpnLojD$9fBl{K)>DXSt~T+FQ>TSYG{b(Jp}BxUH^lk39KETC
zWH*V%oHj;JPcHXLXH+exuG+G3+|)@MXRfWeunII^YoQJh(Bnj2>r$0@aGbG}4+4#u
z3zGGr5V{x@FIL-$i7>h#u!^~_Z))jm2GID%UTb4iaA3cJ+@!X(W%<0|bK+-<a+Edg
z5@C?;Lbd)|@g_0f9a4(&Y~Q@jr1tW@neg3`;du6!k&aAyl6U;>OmI3K^8U8Fy&en{
z!8g_xA#4s7cH9yRV3a!j<@VN7xu!Usdzgbe5R<cj{EU(g5<z@;R_P`%0)>4nu3{2&
zZPG4kD-%KRU`ByG=M|DrIKxrp2tv^}x0i63J<&WNGaZ*BN)PEIf)m^ZfkGd{>61UF
zLAHKvv>&8aGy*;|xll?)Gx}&ej6te*ofADl5eG@%-;cb9=!CcOZ&fWbhbu;*+Xc&U
zRi@@cA?rcnvjI1<F*kI(x0Y-*)3zTw0jvb|+y~@zpG7Q{0uyV!{koeaR+|Op1(C|A
z@g6jzk`$_O-J*TGG1!q=y!L2us7g*jA<i>W#H5$E3uq~4%ot-zf=}I#Ch@k1nk@Ok
zr|jry9`Y+yJtjqLZC66W*q;u9yD7fCHk<PLkaru5nZFTPo&Q&Y+@}~gXW(d#!C0;*
zSlrRiyXD=m^U*S_79yAJraXbs3;h|iPvY7iy&A&8T-i|f7+`2XkMD^mzQubv(s50h
zgZU<EAL0w;#bd{T?nDbp+G#eEC%mKw;MfQN((jM=CpuEXilN3*+5pw20LVIZ=ci8(
zNK!954^O?0e*GNI>lx%Iz&rPETDZ1dk!A6dqTcWkIj6j_T<j<9DO)BXcs#wkMu|nW
z`jj+1zASIj7+6+p3TD0NUo0HM)N#vzkh&{kGyRLIlttWY$=d2!&_v2BB7O|j@-F}G
z<@J82GEM5YFTj~ObzBjZ#&_~9A{#av9$8%uO8{+g4+8M}NsZalr#i$9I#Xx4O;;v9
zyV4w;5Yv>R2XHQjT^};xEJVK)N`APsh})HZgy_S^wCRV*bSlx-wG1LNI1>sBFYXit
zO{%#R<4m8*bxQ9a?!YNwDYnL3F%ixa%!?c$-imckzgP-V_wSU~?Z!g%MgVuTPk&1E
z>FGlmHomk%Mq%lnjv3}&#?rENJL1IJIxLv{W)6yY<!`wj4xspeL)~ZxcDi25^|&*2
z^vH4W;56%@N(lkh`o~bk<I<|YI3Z}0-e*ERE&vb%rLRdEWy1I@O@oD3R1dKfbX^T4
z?d0Qmjd2e-*%=c~Gva13%#+dGR}hwuOr52wADF)M$U7nbAyf$Qk&2x;D6U;y(}f=I
zOi0~qG~GCw2M~)(A%KZ6%2n2Vv}Bq45sPpig@IvRLu37R_V(eV_fX%;9FI+P6FRX>
zP}9zNnG@39sMAOsOeKn(1r46gk4LTD;=Y+Q-Xp(l8ZgI)JBd}i=XPwPnc&3qMDeu?
zlaJ=^ocO{p$PigG+nuxAC`khZe&(OAksrlaO7GnTBlZc>CL<nHCJU{|!Iue%7KRwy
zYo?;-#^kuTx4<Fs1I&zVvLBfTZWD;{l-J_|IadJC35y*$MsX7OGc(!VgYwQ2Bo=I{
z<WTc5V#F=d5&Z3uAMFlT?}+U0WFhDdt9AFTEIs=ZoSmM0B9?La945t!*NccTrWzQc
z_km<t2goxz-yK!InbKy<lSX{(C5jd~KI&p|OIf=ix9F(!6PNkx(gFK>1RRTN9(@z!
zD-64JqGv^{dNEF1uyXBeOI6Fw)AIT@sH#=Ol5CB+#2oF(tA1_Kq%@s3a299U?3kxR
zswu(oopBHXBUGaHobD^iQ-!Ww9tThh+Dwk^7TXg)hQ^9;YR<3ovwlO$W%|Z$Vh&IS
zS*}8;QLM_l$o28l&+mRXOz?FA&c`~)gc0BL?=(9{w$1};5-ewL9IpIm*8Pxm<eTky
z#1a(FZ}4<Kp!azP<r^6nBq2R}t)AgYXVA^ZnXyNNMC!JR851m6R<zK!E;R90mIl6a
zJhlZ9{PDMDYMf7cOl*(sU;dDD<a_Y}CU2)koVel^I}N`@x>;2|KDFZZ!V=U9P7WeQ
zp%IB!N9NPQ7oQ}*=H#76Hz#dfpILwPJc>(1+ffMLgbjkg2u`U2>3e&FkPKT1<uv+w
zo)1!#CEAyq`yK=4@**FQ_sx1Q&lQA{uve){kZ?5k(!qSLRmr?{;kNJ^1bvUrY*sPv
zU{bT)m+t^2q)v%5Aw;5&zBNGk<lV<qKbvzpGhZ`!aLD>N^WsxU)~hhdRZl|Q>}3j9
zfHUpBH-DZ7`Qz2NL&hwQ$Ccy}c!$DS>woeYi0AWbbok?Q0t&sn){uJIlWZcu`f}yR
zX{{6s_XXaxd$vBE<||6q*3_(fFGo^5jAG+@U6XQSxyX#NgKL%dsW7Y9>U3u_4_*(K
zwx2l=wy#l;#ih#xCAp2h<tW{_0y*5Gi!4bhWMnG93UnH>TDfFZz1Mi8h)0nOA5z_b
zUh<a^po;<4F%GtcY_0ckUw&CS;q)!M=`mmqGyA4HEP&ag1*C8NIC<%~D0Y*oXQaaQ
zxALv1O!8yWu)S(m-LY8>PBj9o=iGehb}9!AemWtJq2fbL+;_5bkZ{Yv)rLB6hOwu!
zNS&@qubTo}FO%les$7*EgKMP3C+M;>>8ek0J@OzfSmAt6p&AQ2uvLZF%{{jxrJi2J
znfrp$kf&ujWMEsDUKnImSGuyZHVr<mS#{_B0C1zp$>+kQmtK+|(>g=f8T<m{nG}Sy
z_lSMiIbPTZD^4$~+>N^%16Fn;^|qlOc#_$}RI~BZh=k^y=OgbpJRVY6Y8tuE+bcQ2
ztZI)?G#LAO3=2aH6slV`EQ?i5M#1s14-d1MOfViHlMSzN+I&%&d355259JyAnGDY=
zndj3oG{XiZ*W=bWZ`I^fC{Yb(L;M!cjdq&DEAHX^u>1A5je3H?ch1v8&P?J8<StZB
zKymN1NSVxHaYv}P*W;Zw%+{=Vokq$@CgrOl4jT{o0A*T|E9&J4xp&(d_aiIo=f)DD
z?5ZE7U(g^DgD7@&FA`L%K-oMP9D=sFk=KSj=>gQjUws~g8Rv@kaJH~<d{KQC)`Ul{
zO?!A$2(o*nH0NTixGbjeaRIT&p_6=~!^2_tVIyaC`5g8f#W>{jgTS5dBnzwmN>oOW
z9^hIC3%<ItM)0_mx{Rk;;fuWG0*(a{=gk`pVQ+ekmW!FfAG+$v#C?S<Q_V_U#cDbF
zu50DKeC}g~b=9069*<7e@5wv~jcs`xG$AsL$%B;PA0Lii{eZ0^KUZ^e>fQ4edR@l%
z^4A&sxdO(|(H|EJIojRUKzF}K+BGyvQT|2oWM|-ZZPH6F9lPjx?L@1Hwd|-lJ+;6s
z%?6wP8X@2G>6f&&gO&O!Ql6RFM(ct@Tzn&)nHNPI0)uaRZg;buf7|fUpw6q$_<||G
zdhDO`YA0UEoZJvWsXM^I%N~Y53Hdf_4w1SKi{LWMztVo9b}oxFj{~nY1T!I!NXLHC
z6)o#)U?Di;^4AYV29a+<zSM5JjIu#5cV(?Ran@%E;cL{ix;q9QViZ?JOtxKlgA%uN
z{qS{)B(>bfS%-{b%fSC>1G;*H;TDr!=Kvy>BIPU(HL~jWb}DvRS<Y;9x>2@cA?j+H
zll%@f`T`#q>l{IY<6PDSm*6|g6hxYJO7S?2_tgm(TIp#@<$dC|1C_Ivhh*`mF!v#!
z<sL*#I+;r|is%8!ifdPmf4M=D+<9W1hkCAPKu9~e)o%R_QQKWI9<z^h+WHOeur6iE
zn93LITc4#5xWFOt_F?~|r5s%{N5P0cNvc$f3)7r+TjFH<4LYBf?60c?cyNOgq5Kgy
z`o+-jYJj@R5wU0)^trE?gXRJ><nJ}+)=0AUQucQAnR}R$OO0$-cCd(do8P8q`cr!9
zr9HlJk2-cRVUf5LiyJS}mXc>EESnvu6vDn;IIMevZ^x=!=`9pV)NNJRBSn$yKTesx
zD*1SbF2-k*pf)IWhx1g63fZXln%A?Pi0Y>>9qRHOcgdA<d>$7GvF0{agW}*m{z?If
z!@JW?@60G(5Ah|gez>u#6_s!iuwMj*ayqJ~hNnQ}l{MQ~Yc_({?2Yl^$6-^ps-9=p
zq1t9YS+VtGI)2nS&-N(0E^E}**AtwvX*RudAW@pg;lnitM}GBoxgsF~@~@LX)v!$k
z=WxC=H}>2bHIZgtP1~@NF<7+6BAInt8p=15AB(ptaWG15j-`LRFLffmSMD7j<U~ux
zpYBDnU*EmoS=xr6F<#9I&vWKhEVGAQ5ZH}Fiox6A7R&U{^)5wbbcNgc30cDQd+t?t
zjHhkQnL1gsV~$@aa2V%&Q)e+gQ&EjCyXm?JOrN1Obe*RI>aCNNlNVp+;yq$Vn5nwC
zYq%#MH8uqlYO7l$uq(}7h3hQmV+L&3DVFb>s94i7&N(i^?tk}i_DyvQP$-Aojf<Fu
zoTj9TUCE{P8cQw#-mZSya$9;Sw~c`v=~8XGi>(n@mBr^(q4wnP{Co}e_&c^L)tr<-
zrw$u*eiPZUR+k4N3;R!UWE`4@^4Rx$7k8g*Vp`*o4m!|au59{iAJij%9Dx6viV2M9
z<xjyiN;+ym^h|+B5Mzqjfq*RO^xD8?G)nzT!4>OEx2`Rgo4c+S)P!P<Cdl*)MFpm_
z?6^LpZ89RBVY`wrA&^`$_Xh8(rV_6?xs9uqcFtLM%!UDU@31*Y7vLo^x0gBXXIHUY
zit?x=yNlo+pU<`yFJwHN=J#@QML&J1#N(7#%@gz2mFOg`TAy)nrIch^9WK)unG?M%
zYVgUi)mXJTak(DZ!1C1+LDt7k<xQV-=*ULuzxH*wNO@SDQi^H?2<t`SOFj;KV-llt
zC_k-q#3oUxH%U<P5N@XmK1T2Bf##ago*Qj(ohQ7ll)T#35=@g<y00Bs-}C$+R9B!o
z@J)7n>0=4W*aB-2Y>qG8(Z;fL##|k3#iyU=6b6=B#OS*UPdPv$qgasgHE08LY{}fA
zc5w+3kHYx395WPQKTtrI^=#aaabjph9!+RR!g7w+pe6e9w+pn*apyhB16S<ZmDW}&
zw1&cXUFo%@xK`q>rikup+7Ah4W$!96)JQ6-+zBM$v=1c28+J=@prqp&W7VPdSbQE7
zk>*R@Wo|aN`*J#;(z42!soMDAoDzX;EVcU7m&{7uu)b%-%M@u?8s=BOfij_emG*O2
z&L=@9#)cnb<HQ%EQy`htV~|Nr)R^<o7ii<Kwjb)yFj_3eSsd<gy4+uz0iexp(T7nC
zm#pVh`<F4Alkf2st5U2vm=7=X@W?v?X0Lv$Skx9NTImFE^5B%VjOU(WJ!ZzG8s5Jr
zrua$l$P!jWS9w#-98`Nu&x_9t^A2}isR^y3B#4oxD0)&7NNE*8NY3No>*{99oEM&8
z;Z<YzB&>tRQ@4oYVRID?R#7KewQw(gYz0!NHT}lR9Fg&6-ZJAQrx1?W_VfNT8-1k7
z>mZAsyIKIv(y86kCl4D6qS53fXiTEA>EZ}mI?-8|38W4{W54_O3@-`M%O@$Rr)#i}
z8&i~qd<xpc4f=W~*xq~k%4ZsA6DU3H(U<>Xo;MK-$`tj6-EWW1+iBsgOkR>%aGAE9
z3t5XD7l!P4_?{DaPvvFb-f{On^IMSheGZBAfgQJ9+PpzcJ{9%AG~I#XyH>Zi%s;MA
zd=^E7vhS`!eDo3fJ;u6C(w&r#tPj81WZ5txgj6ca4GaboYx&n7vft0R-f$&>!aGP^
zm_C~*i$d4e$4lw?>pBxRBQl;UueB13uaC*^&KJ%B28~2p?bG!WvcA-I6ET@!TCuy&
zgV)XJZLV%kFF~dq(kHM7=H;W(+06Yi^^tvaaJO9sVw)Ph_m`0pEl`6e##gbHeu5kU
z%Y7GVkX<JQiQNS2IY1&4YrFRebfAFt$8lFwQ0a9r=37xu{CgkoxU$u?hXiAe?C;I*
zubhuHB}>J)%Tjq_vFx?GJcrO$CLDe}+UKuC2+ZZj3h{Jgf5c8M$p%nsM(1Io{QHO)
zf;GMi2vpPqu79lR#HmQA67pq2RO_8#!Fd0(OvC9{Li-SaduODM#rYIUw>T}NC?o~F
z4yK+V8w{;gs$ZXz^r;`AO3FoIPh0Vaz5}6j=ATaGI?P}7K%H{DnlWeDVNbKpw^u`X
z$%OUm>2FE~ugZ33O<RksO?!@KEil0onm$N+u6qGVLC^B7hvo}5x|V6O%tZrsc^gAF
zNmSrr)WCiPYcb9orxBH}p>s-?8Qwy2<^Jr#V5KonpwE^y(0tk(W8qUz7!Mj_?A{|=
zjROp@ihJ7r25mWaFXV!B>H^Pk*(_*oix_;gSW`#G<v)Hl5K0Lgg;hCgNv$=W-M&`w
z4)4mvoR$J;zBE<Uj^8g__zL}5Q7ZYeq(row_nuG~&gG_TL|(kYVp{CFh*d40TKUKZ
zVhyWecQd?F?ZE}=5<q<Py+!1m?>0zk@iZyTkO(HJdCnU<_!ennJ2X#i3_*pKY}q`b
z(RKW72F{$W?{>qLBkQ(Lw3pw!+L@Gg@*isq^Ug3jhuBRbW16WOs+Asi+;yD<SBEyA
zm|cbZZIzdmQ5mO)4WwyGGO$}o`SB|$j*f=)9V+HzOC_yVPp#y=USoIt{2BY%)f&_1
zpzd8)MZUimR^CWV%C4ho`~-DR{W>mNx9)Rc&0cT4ybKJaEUr%5ORO~qJ1lotG5i9$
zUB8eUueFh@o?tch!)pGtfv?yZA7^wlha2jxT+M>^Zk>OF5-@pUnjBkaoY!~1#zV}Z
z`h*_#9>)Z@1OAdwhzow3!!-Bm?$Vx%SwQuz&gkJjxgy(mrAhm>ZHa2>&E0jI@MHTW
z_VK*668_c2nzN1l1D6sqI_9<`LZs<?$7z>_Pq-I^Bb_G=lA2cEu19I}nyS+V0D=Vl
za&riIV;tZ~zAfV$S1RFXV>TFS^$s;@YlV9(hEAW)>i}r2DebZ5huTDUdA`|bhmk)L
z+iIv<-gG{UpWel(m<w5&ubb>`xL6`Hc}_9Q6uAo@=&ad~u7VR~c2}6a$A(OojK71m
z!v<Shx*^7glDlr2IrUQNG<2RB4qNWsCVt{GxT@N6N#L>sG!&FfB$!bh*QCW<PvRe`
zDn727%XjK|4^N+ke4{~+FCS&EH$}X5L*n{AAaR-Qcd~?aP%Ni+-rHOnEnO6<eq@-E
z6QmfKVPI;j>F{j7(`k2FV~u)_bSEmYXzG2^TiyB~Oy5b_$R520Q~hl-#}|BK6r4w-
zW+-SMIh&{$<L*qoPO_@kvuR|6cI4oMq<6de9oZ5f|4N@@*qK`<(q3aK>!3<5Xw|HH
zEQ~|+|DslK!5}*CO;tLJ)i_d+LvhTI_v<^t9@2`s?2zZHxk0yNmX{4AT3Pd}XP>Be
zdD4w#Dmz=Vef3m++PPy=m~O{arB4-L;6i&Rv;iF}kf(!LaL(HD`g5aUGyI^Uig3er
ztjPsVZ;#TqS{?mbn56rnQwt)aDuqu*XQJI+8D*XK=kgBhI38e63wlYXS`AHejbpeu
z_M-ai(u$WPgmfM0J=W{4_G`AYOr%?;uhBei$rNZ!dZj4knNrc{8klz0Xgp<H3r#RJ
z4A{AYo4s-!yV7&AgY>UDbZ`~ZVzIq{GjE4aR-x)SFC3UM?(@3mv2>xn=Agv<nYWmC
zEz7qt#?@F9Lz}Qui}_{9>z+?9(9D`}rW#kRa#y4z-`T~TrSCpb+;rcpNu?HN4Xx<>
zgYAZjD937yF9Tn5<gg?)r&J>~X)V&1;zlbky|LZiG5->Ctd}l*EgnDoB3-Iq(Y5?{
z1v8oT#TSuort9(PDJ5g>Aab(?0Bxzk$8q$~_l4l7*(?$@k{<_Uh4bDS@z!!wXZ!4Q
z-b{<HC`_?0wQ3Q7+udqBE88vDBaXTip$U-}?v1qFt*&@a>#3a9a6jYA?ziiFUyT_j
z7D^1CY?e<HM=B=_KVwN1qw<WQ<3EC;TwZ#WCam<d?eS@93mXp#Kl}6i3dv@#iHdAj
zJ=-s6emFGm@YPbxQ0eN`nBgg}du&vrSWS=>S@0*TA9`=-LTjnz@TSAGq;8M=VNG(n
z31u(e(V96EQ4NR1Yw6gu(DK9J<qYiG9M)g5X{LgUgv_SW@TZrP#%_7Z=L9p7<F2G%
z@m&!&OI@|t@nCNo?D86aEiB-J;&qScQ1$FDoKq!?yn7jB=4xzpqXlP5hxi+`wXj4}
zu$m{Loc6k;?pbTLEhi8x<ELIYt<NFSgr%0-zgP9T2D{_wFyO$u4aql1hcbQi`ZkHu
z>+}%cUk22ziyz0bA=+gsog!Nk^!+6P5Y#V6+lhSeHGdseRh;+^uZie>5r+)>n1auO
zkcIjz<dK)_uG45~b6X4J6cJzJYuJ4t&=*16w^Bv%rO2^k>%(IxSDGmBPzU7}j=lfF
ztoM;p5{Z8l`LSoQO7j+qD+NU&`CdEK?9-ISyG|!;uJLX4obNv#;`_4!<F~j!`s6>}
zK5m6_N{E`4z{fed=O;|3-R2|ZiR{xknO}A;^IFl=eSWl1d3E8F+lJ<DIS)p?)$}>N
zuSzoOWc<(Ftu^FT2L;GXDpViJRwyOnNRAPsi(0tVc0{{<x=DW7qNh(Y^kz-<R8X*p
z(I6*lS_TLtln)UyK2aNIPq@NMJ=&Y%m+^_xA~k&rs__Joxi!@|rJX_lkGA)Y=lXBo
zha+27X0louHd&cvq*M~wTgc8{y%8B@M<^LdBzteNg?N*__g>lCeZEwm?{$5D_jUbo
zKknZ@J$zF7czQn1ah%6_9ABi8GX1w(tffqssyL})D=AP4)9h7e<_&10tKz?`#sZs+
zI_Mj$C`?34+}M&L<R1kHX5urC(nP63<z9{Xr-%kDH1)b>KUu!YY$Azw*3;M6w|*?|
z>b%@6LfNlT_uUSg)G}htEE%&cV1GI2!m@CL<G0r58a96;;_@z~ZF&R!EyvR5r|Zw8
zRBA<&N_Y!u2$@He`1(cAUuQ5U*kdGN39`EQ5D!pd!jBOmmgQqkVW}S58V3q4kB4OW
z(%lcClid<&@)#aovN=8cV@ZYO-t*A=&n8?g$9EW*nO+sQTg9p_5x)IG(mKbv1q9^k
zExKpg6xU1U9H%`vC||z)Y_*h=9c-nNjJ56+n36Y~P9pzCsD-e+Lyfgk1>k=x<47Cr
zNQsj8I-0up3Wpz`>dJK|c>-Z}vyQ;DuCwYR8S?!f%a6>sgQzMT#ILm&%^F2~X7aDc
zjo-U6ib@}IdU%H4z;&*TjAs!Sb4MUH0c|_&;Xk>7HXL>G74*&w>b+AJQNNHmCE~eq
z)^4i#UHO``j=j$MXPc&*3<oGe#x-nRVvc~KR%1LbO(RxYmr3yt^ivvSqA@w?O`H7{
zG;1^#DB3`q``69+#QGicY4m^S1^5hP@lNf;PnBzk>gsP_VeZ9RFC5xNjkL6m9#)Gi
z7MpE(Me$uTvoBg*x}TF{sFtlqFyqIS=&*N+xlmNTLe|5$dTIczTM*RAs~n9JPR1LK
zJp7FHKohYmV8X=mee-`70RNRM0LVY*&YUZV;+)ibm5qhHl-@%>8s|%2pH4VM5_4Ov
zpqZ2GdFCl-KC54DSqL?rv1gOf3#qfqWF2G2dT;JD_>*se{VtPv7>~NV3n9<V6tVa9
zlyQ~spR*I2+hNbB-1|PIgF!#Lev;);I<n(cW+OvxD6jrgpG>*w1!Hc_?CXvyR-un{
z%8~xu)>i56!)A{ya^i{lnDOd64uCbWHI@~O@3Sme)<vp;OHY-Rmx>tBIQ9wE#fK%H
zg^>|8<Cf@6Z(y6c7>J*W4XVzw)uur6Rr+KOnn#6eKV_5;bcyyPoK_3kU24JB?Q+y*
zyVp-oan^7=x%>2vCd)51hsb5MwE8ha<|MzON|##A=hyq~lT>$_6q#E?j<=Iqebn}a
zt!kEayQbw&zFe_d_4%B9on?J#8ynMEU`t3N&2fCotNfz(G@r&fOy@0^v%^~gEw!~M
z!=l!(ILG=ll2&GZHmr_0WD2?b&U-pDP;C8qq;~V)JM2mKthI3b%t9`?ZS84);AUh-
z+|1MRXR&>L8WwYG9YY@coLtjO4VQp*vAA7iQ}bXhgUg1fk9dP8iT$Ye3fc3A4;e4L
zzFi78M3Y^_D_AtpogsejqJYEYVpuKl;ltNwMWtgM#BDe#2NPS_Gfyu)@ujBkEDCS<
zwI^^_CSZMu4#(cjhTfIh)WwJB>{QHZ)zSkI(v1@Ke#;}hX8pnq<DN3+8Hsc3QSL+Z
zVpBq0taXlfN?jXjl_X07BivWQ-5Dx~*2k@%^<z{s-i%l*$4ew(0Ir?T<dBeK+l85d
zo#<PvXlm1Y%bRDOXWHBhv-#;^8kVwDH21~%j5ZJcOrg}l-Q~}lo*?E_@y6^wuv#W=
zexq!?a1R5;Kq~tIyUJcUmAJB)#oHmR8aK+@Muzc{b*nwY<T)bIKAa8DMZ7M}C4Cij
z2WkVRTO`E_aw46wJkLhHjm#<zNa1&{J`Hns1yo&2vr?*Fr?!V`4+cE<Zjw%_`C9Lh
z=Q1ycXFVIeC0FAuOj?XR2sDwoJY2%t?>?}czU5R|dr3Kg>QY?&RzUyZJ;L0|{BMs+
zrXFYUzFepESuE&8frW+E@woF7vMgE~ZQFk5ea9LMHW#9OPB3=KRf}eFezhyUH$HUv
z3py`OX=ZbglugeF+dOn0S8CmBlgvEGCOU-J0(R20N|=~WsS(*zvv^XiasPVhg(`^M
zu6R8@ut!f=sN1bPKHyqBe0Hhn%+r%p*Pt|O%suiESk$FGjVvVY3WTl7D)??Vb>NXb
zj}#Dnpz&GtBMCXW1d|TMFgD44;OYvq+y$?zlH$v*mY)VjY%YRSM@7@8I_91`QvIjI
z3MKAm5-;3~pB=Qi&{&!CptaJchiIJK>?GsVz#;TGEMD&AG~;tjKDQZB9s1rzCXsnt
zdU$mYGg#u>;1E3T{|eMKc$_f~W*kvgrE#+a^sP>BfyQz1A=_~<&Qp9N@e%H^O@mr^
zf)&=fOz8Jy-*TEUr!-vHjXJ+exci`M!eC=CA}4;z!<r0TQnAQ`pWSBcKzx#;D%mF1
zp;vM{{U)}*gGP6OrS@{st3l_g4|~}fXc~#c;lnFUi>9JByt<1wKe*gy;%2WgI1P6&
zRn`Ajun>Da4fD@*=i1Zgd6lcp^?9|j)R8Qwj>9a&j;{Cw>{w+g^;f^#1%Ak<s9Ntq
z!Q>ITq$rv?>D+@zS%PA{fLWVan}OWgm=xm8=z3GC-|$LVw<{3(W|iM8{s(%YFrJQH
z@4-XySlk+3VLz53Ic@^hnwj&s&so>8#g=wBQ&y~~FTswda7OwSjDtd}@zU$^eu==n
zyHi9+XR+rodJofCSusE=d9o=YN%NX=ZbG=;&(nfrDp%V10Fw}EdAD6<@&lN<A<fEP
zY(`#hbu=ci7#_lAUTMcnO4p|kz#uf>U^kQJH+ylv$#<2bZ2eJ2OW_tiH)3sJDvPcv
zQq~E?z-t-6erBGdhAnLc*U_Mc?85oz8?dOfS*U)uy8T@~SND<7`kl3^)^)eIMfc^Q
zWs5^I-O}c<8{Lm$qo|K0Zkjq<h<e{)Vg&Nmv;>=0jKHlevrClckJ%7QJSuExPa>?b
zZ3e|(TcBZK8T6}E-YSfxqtfQu3^#t@z_K|i26xTqM&MdAfv7@u!2K4HEsf<fwxC_S
z{k2}@39^FFGS7plFX!7mK%E`jwy6DaJo6DAq{MXl7qCY6quvBu6PJuRG)`605csjg
zIcTSMnnwPpZ%Rir*uGx^!stfR;G^H*c>ZpLtNpuHk5be745MaaPHYvC@C!NS&b{-y
z33xMuJHBxzH1|B{$-s+{a@lh_UewKlYG!bFvsdd1BIQzQy|Skfy;oWS)TQe;I*y=X
zE8|8pD?2W#4NDKNRF%wYoW!*_c+cFg@w#7mGUSKDv`KDE+%hfSw-2i4*nc|at3VCl
z@1w&h-mBaE{yQZw_gGeTD~bIPn0yXikL>7Y|9j(0W?R^Ofg7hv(XZ(#a<%1MVSUt(
zH!<j^QJJCDPb$-NwfWB#hU91~zumVFB=&A%pgwEg$^Vxv<9{u3SD8j$Pm?9Oi<0;@
zKO(~#SakkGCGYV|>|i}K!}7C6m?J3Gw@bEUJ{JU{Cq>QH&8ArSs!@b4Rp3ZrU`N@-
zpLYb$J~v}n7dPFGIk(f!O439oW23S)S7j<ZfHU21s<ZZf=1q-A>?_?>XRu6{HU}~_
z7;Ts0StS=|O!I?Eux$tSur`npi<Y*cEsdF6dHsdkf$NPpXMM{$DWMc4-@0KMjjY&r
zGnn<K6L-DdaMmN^pW*&hbCBvZT5q>>5cs?|JtL<6mL2-$I&RaNh0yhVv;+xu=vpM!
zDzacSG{bGk+Ob=z?)V`)zGl}#@DA~9{F%M2<z*C!-iLUOzMD_d(@8PP_R6Az4A26t
zsT#3Y(;prrMp?95IE!K#0KjVYC79vXrG=LG7UYs~7HE<-Vh_4woGdk^+&nMAiR!W9
zs_Rr^w<mY+v`5(&Q(5r_?ADU{e@rdJbY4(QSoFvke{s*XXGyxx6=CE|UjBXc&i}o7
zo*p|RRvH+neCJic*dGL_M_B7i7B3z1zg=_Un_j|<ydxgOrNZnp_-wsssyui`beRDh
zf$m8qXb=uuX&ThTUAqC=6s5|zHO(|fC?GsuZN@EJBVAe&QPYJOC^J6QYLqTLkH71<
zqgnKgq+EdUUhJ$usC)VEE2n`WGS$poq=!Gl(-|_Wk-vv|1ZKHky2-Y1r{1shV{_yW
z0dHrBH~j$yDywe2cXwg+byPU8#AvI%P9qo1D_nVLzYjzpnoyTi{zKvpdja(BitraV
zQdoI0R75+aD7HzLrBO`2ZMm6r6UC3%?tZ&VooZ(+#6*Gk;r3IU?OIy_DGeBEM`e8A
zG@V!bVrs<_HF*y&dZ0LqX0BM^Ja2+SQ-hQ^?DIBDoXO<QDAmaln^`K~v&cw?+1$5+
zxU=~x0f(mj*=*vt^Ho-G(Tua6rrLR_>PWo5HLx=syZn}fP<xJG@j~M(m*~6)4kgwa
z9Hp7q)A^ScoS%%n@-m;qW$fA-7ua$Qx}fN<z})w0`4nqMv3b?zsO?1%Zv;UM&-e=e
zLJtSG^yb@EO{WNELo!Zlgt;?>KiVi+29C;l)e<|e7v7Af-!!TI<Q$AH21MgHdTSH_
zGF;o;X}A#d#H<}&P*|0X%9%<B2TiM3S+BtAuj=C3saAQI)v~^g*yEnsZUKiVDhhw8
z0LEX|N#SQUtE4nA4uAtT^)~eW!!HNOYI3j{Y>z#v7)a~1{{mCaCn;iAB1ssOeGGQY
z%-h$XmB@S$i-nt&(V{(~imhwO7jZ{?`7ox=@oK1zRE^`A2N1fN46_CYrARzB<EoeS
zlxNag^}Cl5%lIgfmi2x{{DJZ*9%XX1<X2eQ1wZ6Ocb+J=r~Z0}wO&hWN~JH1rGMJ_
zes(}wD0`g4^gcQX!XUdB*eVp2C@Cc&Hw{b?2rY)k5<j~SeXe`<5zBTU-u2_;TcHZ1
z;<MJq@A{Yh>VI7gFn|pORId1^QxTu^QZ#m|3p?VKIWl9Nf)?kzA_BJv(M_E<Sz~6Z
z9`ZHaB^5XBi;F8#^gEp{K;*%JS5y5VpWHRleTdSevRLIA#&<TGs+ag$74i&JoADZ)
zY=wpFfigt1gPXVU;|8n;pMkG-**+`@ex+uBwj!$8d(gb<oNIf;#StIDZtKS#RTe6u
z0e&vAOo;HuY~EmAdx`<&T*+1rO9xAC&{O4s`Gw8OJQcrrZq%-A#!;ps^%Mju)cDZt
zUaXU9hX|p3vig=FRkPpZ3Z{R_d?maq<<xl97TO0;sf`VvxJl;HV<lR(`CMw9@t%gt
z{sXEaNe6#x;05m86$6{K(q*OR{NrBdQK|&^gk)$5_a)ciqm^os^5Pu&8Ye^S*sG-C
zQi6C98XqYOYpmGC)^BUm5eB9aobj1FA6HL&tq6*i6nR7;1JzBrCBr;TfLF<J*G!ug
zql|^dk2dLv2}dhz=v+jk7639L%sYmRdgruvdkvD~o(_rB?N}GxzTJH9=Ec}qh4g&v
zc`w)r?$!~`dZs(Y6}Pufs1{dGII2daMcOnmkh`?3xaH)-rNBI$SQ~ib=JZmFw-YW(
z^~4%S<XXdeYAal;4GMjR3q4vQ_Vsd4O*@1?BnGWQFW|@9WxMS2yk4T`j@<Iu?Mf$+
z0=FgJR)ekcc=Cfc2DokTjbIMOXd)tSbE^n%1{ruZOce=nzFc%yP31!6i<S`i|9=Tl
z%*%r$lI*0tdfW{CE1;&;L14q>lt6yR;HjZ}$~_R0QlDnJCHI<Cq(>>2&|~LbtWJzI
zU5UC32@NNcKKVc`DeJdF%rppQg@i&q)&kAg)Xg54&fSk#cDX>5EmN;l;5kX5(jY?a
zSk~Yic^wxdFy=cl+f!wtIpPttYh$&98B>BMJcyU=NlX~4M%|a9>)TyTml|M9%er}s
zG};d?UtF3R$^N}tA_cC`8TH#rK|$q=_G@tl2eKZ@83eqczwPg9o9+U%=TcF`*5+zy
zT-+(0WR_-waVHqmyBK^sAI;KriiO0ga!=$6W<Vn~{~-|aR{AI?1ZvnkXJwd>l^tqe
zOE8*Qwg-*B9#~tfPcBPLtisxPHx_((wuRCiw?fEMKWIcHo)kmGHTKI1!d4=@R%<K3
zZF;^-$I8AduR!waXU`QPkKIDzNfUZUt#8<|vN!E5dVA}1mvWAPUSgfomnnpUceehs
z0iGm<sYXCns*5IiNuZ^Sq$;&_Ov_69JX;MW>RBqEy%~2Zb^YkE%<JfJ;BfrfUTXq_
zS<N3ior>QvktU%f<7a1Z6YAqxear<qpJ}}?n`t+Xaq_LA!0dP}_PsGbj?!Pa?Ez<a
z>QdOZOI_A}@R!+GoUo}`vJoh3I%j{ggR2F0*hUR%mw2r-0K>G<UVE4Fy#vSpYVP6+
zvUPax`{Hv!ty?FQyP=1;pqW+oe#x%ENO+<p^kYS&zMpkugd*P^a<u;8?S33a(=)nD
zKyO=X9|Y+N<2#_41$|#g;Fal?Gd{@mPHf$*7|G|bP$QVpG&x0mOx2)P(<)js1+0c+
z>#fegN36^hA0LGk9#CXNulxTa0r#&Ay@r4j%=Uw@`&RUe<*|v1gO7}e@hy;Ft-m~@
zp^IA4NDdnG!eUJ<^w|EAU#J&@=;eJM$Yu(EZSBQ=w@|5C*H~l*aSCCHv!{LqDMe1~
zU?S%=L5MQlG{Kg<eNX%>xt#DQ+qH8)5N?Z7ZWBjg<P5WYf6($rjRCi#J#B5Fhg7VC
z(t_RR3%kx5XfkvSYouh8ewAX|)*BUaY$=m_*bUsS(0rOesYTRgZ~gp9DzQ&gy91&(
zDR9n30%(8nIZ%HsPID|+&;taKcP%&Q%f%(TP1+}zGoP}(9v7S>5k_xb3f)Fep4oKc
zx1Nv*!rgtvHtjifazGm>u}@7v`cccqV`~pKfX1V3PU>uc22hcFG7!i=>r9?fa;zSJ
z?ftpDSrFMGkgXCp-S7_T5Wx#gk>^5#HCre3QA26h8Oc!XX=tO<XbHv7!@ssgW3C&&
z@%zL?xPApM-WqjS$q2G$8PDlP-XY3nNtsQr=Ep>HM7KvyYSX80%Qkt+d|#ZVRMz;I
zlo}-LSTql{*m~{w369Akr$H;@m7=g^0oEw@Lm1<2Zg6ck-!si69~BL?A{y8f`u_Z8
zM43=}`DD0yslB*+*pJ<Gs=0FaXQN)!Cb=81NLPC!Hw)evfn9wt=o#3VI5#xCm+|?f
z(h+%T8X>H`xe0tdfb}0k2i-InW42*Lj;^LXcx{Pmz>+vKJ+2aa`~AhDkwTn`0Hf9z
z`aVhJFnS6!u3LZgU6*HpV<07xU!iSBhn@8dUDPVHuS6ocyyEYL)^2havq^+mmk?7O
zZ_y2h4`iGDVm;j&(<a$@xMR->+-MYVRO3(iez6nwaJoX5Vv|8>Zv-8&Kd*dZSJ38^
z5QDV?;kOTp&xTHJj9kKxxYLfc{`8YjKCxO*y+*KUAqEN`AP8^4fx$Bm%jbcv7y=OJ
zafJ{ymdIwC-j^1tdt6$+eIU6fPk@19`v(42wiijG+{qecK_#=j{b*kM=nbehTw;qM
z``3EmpO1^kehUH`zUlQIJ*!*RtesgyHB{WWTlDx%X2<Qp{iqD7W39sv9i9e^B*6yc
zI6YImJ>@>vdp_Qde_w3U<(T~QYmPa2mEYl@!d(6WYe4bFRZ}4#znwu?y5?t_F+)p1
z?M$`b2B<EtRj=gC`ZuV8**Du+zR)jvREB0W<zzR#!VRb>Ygy4fHqrx^5RYcH;$P$S
zO#m)D9Y^>fPVfNAu7A266b?IQKZN-F==7*;jyL!RVdw#jgBqbAcQUjrD3t{8gx{>i
zb17ScWvMs7;dH6Dh=W07`=|Qltv9Nql$_jMyk!>+37_>p=m6aGNZo(syO0qTORdTY
z&|yO7nJQ<Tx)4Wwfv;Ubv_dIOZHTMfXh45iQu4%sIcy{?r)Ke8lV)1<`*|{F=Cbri
zqE8n;VMI0{3VUPgI-pHr4S3G{M;hG-8p0>->6$_=^ayR&6PJW4N8nnacJul8h^{iZ
z>+LGi5f%HB9NDvpQLlTisrz?oaS^&Wt2N)sK^%*O0tskXbgdEjQ&8KSm(`>CW&rfC
zH$d<G{z1^DMr9|@{HG)s*kz_wmyr<6UT6$}>YQi}CR(-mN6x2)RqD46jRqWFYR1SP
zITZRZ0%?SU<<K&~y+x}4$hnVJL|~M$xewG{Hg&TsuMt;Vo&nrB{~k?Z!3k31ws@~e
z-y^A<ZDYB!@*fV4>UmCgH~Pw$my*%q9Zs(t`R9+RjqT1IJsmJjF$XC;d7#C+?&x;4
zmM1E;Z)g75tKRElwCCLU9;n-vH7*L<^B?Tzb9-h(GXLysS~n^*)?ASGClyv0S<y7Y
z5-OjAZ&8hlqrZ1Lq}Q&-p+!ZV`T}u|m7~Sj&g>0;o^@5<Eb_XC>D4)ig5-*b7|=9X
z_sYtE_1Osh!9_%72-Tvu@FGhIk!&O@63+3DlsRs8Omb^|+Y%tQ>%Ek+7mmBkCCbV1
z6SM>Fn^Dx+AX}P5<L~T{EjTVsU{PbYQux!a_<L99^!xrYr*V7DOI*#%r6g%yREJsi
z0SuP4=<#UCqG>|HsC}%Mcb{stljrD%&@_D+D$<El88>mD^S`k&APU=m9-U702*(y#
z4cw&ZX3AIL{i_9l(=9_^M~ZBO!GdyIV9-cO3*O8mFy3uHO<20^MMXwGH=|p62b7k2
zhar(~YIgO3^kvgGT98dJ`%|y7zBs-578t_lJaf+FXsihKXD<f-6>jKFADDBBZOCrj
zuSlt0?dVS^=@^{I%~X&IIxA-PVtqkK(6s0;)1Fr|`SeJENS(;85aov6g1Z%#tNMBW
z;fN_IOYQd~`(&%{A|@xH2a`nKSX+HRvJ<$&aN#9&vyTqLE&4k4$WPA(5zo)@bqCfu
zf=Fr}J!h`)Nt8a#1dli41W>E&{Ydw_q@4wF8C%u;zti%XOnk2HF@r5VM2SciRuD@a
ziAD+vokG4bh#u{)*)R0u8Y_sfd9~;}VtZk6cGX1IM3bMyZRXb@t}LZ9o~Ga;NgzJB
z&LPqWivUkPeRF~ur9gM0mgWiYfjTF;fE1mKO{p*Z#NV>VMY2g!8_hT1MstLy+76Za
zB;uc~1{F6;El1L=KJ0ELk69jiqhbzXP|UJCB-~=0`tVGIlX>6mX!+>#MkU@%ZRxkM
zlopjQ)E7P!SdF;vo$aR6ck@5VW#Pla5#Z}&T;=^s=!E`s97|oKXp3-U*I9n^k2alZ
zjHuHmUfexf@ubA$Sm1Rb2Y+o^CFvpK=t!~Dihw%(kkguh%xz3TGEUFju%Z|3qSE5A
z3WERd!T_WXPK2urkg%bBZ0_DoHSN`8YmfMOtxPSBM6IFQK0L?V`G*F}txPP2dhCLH
zCDTWrv*$dI?sPXg_UzN7I#roO#_$lL@=c{#7iwpV%*vavgv5#`r6+j_%er2FjZ&^o
z|J*j0Egn?tv1ps-XR6*&zd2D^eud{g`Fa59H8#1-Q*^j&!zEkzEnbsW;}!rl=ya+E
z1u(T388oqR(C~3kNvajJ76d)j8JMSAxYx6UF?H#!4)=1;q%jqDnIpdr)hPv_R!S;$
zHCWaJXesSmmK@+^+XQ9pVbaBfX39*(_z|3y*M86YJi{7ChUqqDu6XQ)Oy7yjYZ+8i
zJUd=$vE6gJ@}deNy3=pWyhKB>ofmDwEMJZfIT%H5-0jv&BD3|OI+^k&^EK^8S;{YI
zim9ByCD(2v+NiikD(&^e;s^mUWtPUFh`4Lkb38P2-;qJr?6hqyjgLW&c+ia>ez+kA
zO;7O4;oYkE6OEsyG}6Lbd8kXxxZ-!$&t^&G(?i1bFWZo2npBedsV*d}_BFy_P<$2d
zi<dl<6SscjQy+H6L7nl^Zp39#OR-QRxqGz-{!!dwZ=0q)%0m@Ov_$#3E<YH)8;v8B
zJIeoQkM27K-`I{Kx+*_^2h>S@9|w}znucFzEa`aSTxZhHtvXYu5t0bpG%Ke$u&~W4
zDJdcn1ZFB~r`n$G+7pKAG#1uVeruU@vB`_h#N+obM9Q(?pnhIo@f7Ny0Fr6rYc7Uc
zs!*!tW~5n^@Gi8-c?XQ<-M`7Wc3ll;|CUDL-ub7U!)XfDk<>q*MPfTId`+146kSrV
zvtmVGF#o8(E3l^1msn_Q{6gzh8wbuYXz$P6r0TtSa#&r3<J;Etn6@deND6z;T8+#S
z@7K@D(=#orpPL3W;Og=*<f>ffv3%J3igZmHMW7wlQ(j$4&)||$=zEPu6AM9vFwXn^
zYl;5n;}@r}Jjh`s&&d64umWjXia7mw=L4p63Xcuws?)T|jQ7?HKa`iO=%(t{S`bLe
zzgPCki4^Y?VD*(Mf>C~lEOmYlY)_#FRjlu`5cug<VxR8_us<WKV2?@Nf5+5C@l+sN
z1TT9!V=5h?H-Z??R9(dyMfhrq6IPtD3}^i`wa#+C@*UWm<oUHgQ1ehJao!K#vOv_g
ze@sB1jqg!pfR};(pqQ8G<c%#+E~>i<kU;Jh-OHt~JFR~0=UAS)p$ZM5b>z=LwUIiJ
z*J+<}vVJ55Jq_wly4Nk(W1m}paCA#3i-v4cBj(-V^2)w5te~L`SU|9p88me{j5}FX
zvoG2KoSgVDKT4~*PR*L&mPZ^<326e;iBqsg7z#wl3z1&+7ax)$yn(7|1JS(hj#Q6L
zy;swD?aw9G-}4)bmXmDkWw{+43i6V0a2jjrZ*Z}3XeG9<(VUbjg0=I$yur+6?V2+z
zDaITelWWaYeopdwC_H12RyT8w7-LYNlo=JwIIu$HUixX1gSLw7wW?2XfEhs_Yb?pf
z0GJ~7`$U`owg&54;{nR%Wzj9JbUvX1M|0cxK!OrX=db`P+n&72CfjSQ9XG1A>Iwn1
zF5AT=qNOminBl@wcqbX?c=a4L^T)TGZ(vN@cRZ#w$>5a5hT=TuqFl`^<uLKxn@q8@
zHr-A2Ni9xG9UsK3YFCO9U2JQbB{Tg@u<FF$N%lLEp%-wTVn3HRU}E5SKDuSvv(~YY
z7}~gb`ds7oRFvhT^qw9z!bMJ@Q|D9@sx7Vg<?=bF3|FEwqO%&7n=I`yI}}94hMi7n
zpCiMKRCfe9l;<`K7Gj)3H7ca~`J6_n@Ah`xBV?*I%JuKFrJ#QWhwIy4lo>TRQ4oZu
z&q_$V^x+;mrn81}!M!vNMzMaBuDvc^^v}v3v`Tydj(9E`+RIyTpV9lE{Mob_S5m^H
zyBxD}L*$S_j4{Khjr#lQ{zY^54kn9u{eIIAhD^ooo{P)CR+;ikFl%{k?7Kr|RzS(X
zYoeHHuQUJHjL@N(tNx`0BY6rbb7PddD%4x%eF>BNR5OSu)Ez$(X&sl_W|!z~4ci(m
z3h4Yf>axx}>`RNRZshj7Qc2ZcYi;Op+1&IDTmPv*16Za;SATeJCbAAPX#M86S=a&Z
z{BzZ}bW+Zl@fb5lFXZ19q*SY_+15s2v&Bupr(*ezCPSq~=KT5Jr5Qm=J37Bin*DyW
zZS<$c%1ueoo-Nm5X+xZPhdg_j2lmmK=1ndxL0<^Y{2zEF7amrUDeTl<u+G)pHvA=y
zC{)Rs4VoO#T)NEvU7r7F%5)&}Z1*pE<;KeFAl#lr_NbK-Ml%P`MVFp0#cU42H_}{(
zP52_2`+t2^9WT4s#4OCr0)Fo*avkQqs<dWq;TeHDCmndKL=q~AD++G@Y;TQr&r-Yu
z+J{ul4mxKiiTDRNw{ERA>!zmps_IahO=@Oni3rIVQTZbMgj2XmQ7`O`U6STxTlq2e
zb}*c7O}0qD%;gYvFYpWXT!~n-D9t_+_e(^1DU?JD%zY~*&o^n!+t*vqLYGrq5Q|Zb
zJgObYR?Q4E&+o0XD2rY!=k>T<Qp<lh?f>?iOF))^1JGi5_y}9??FT&vS<Xilt|&x-
zM#sepc)fhbYx{nti$<6HN%n+~LWMbP^Z5kZD}EDtU+=lm6<C-n+U4GCO1~;vC+&E6
zMmL8(%66ego)3%+;_XR>e|<SQyylpQEbea>fnZ0d%0^tk)TH#@J=lVdww*y&1}2X^
zVXqZ9wc!7>F_4EVy%*S>pRLC0tllecUf)LD09@7um3f%o#9s0QWk~(0O<Hku&;h8n
z_Gu)hy@1hOmHx%*39tA4pFRJY+KPp>CWDOuIf>A%cP07vRJ)kgHS!x;rL{k>-O-vp
za@l&|G|6I@2ugarT)3{GV_U|sxsFX6ZB}96xmZ(JTbg=VdckxWr&-phizKnh*1rhb
z|3zGZDlkkJ=x|&ajjYk*XMUC4*E=QZ>ohuSVz<)lUEPCI(fQ*6m!5rRj@7p3IA}h0
z3P~S*RIbv%ovMsmer4S$5`?ix;TV6Pi1vCW9oJMdpPc(I#@*LhRa!2Km!u=<`@E2S
z0y>h>_xc)7?Jv9mwPa=stqc9A7kf><lZ$0R!&r#0NAxFrY(}you(K5^(AR2MzizmF
zbXBtH@oO%Wqyx=;%ueaJNA(=?;<;i+v1NPiq3@fI1P=RK*qf^El2MS6WmUg&V@<-N
zGD~vgqo}k$zbRBZL@9^euPRVhjrqFFfuf{mV+E@g=Q0CRnfdZwE5`s&RP#k410#DQ
zBhl6--tVCkcUB)HvhMu|jeoGSxoo$)ys=x%FF{Y@%7_=UX)07$e*ffpSM)7zP!Gsr
zh&^4ZO?F@1LH$*ydf5VK^pUZ(-ugxM)Y#n>h!WQAcP@J^_`5!x6MJ+ieug(uTd(Z(
z;mMY-k5d*nl(g19CI1w|niXr95wmcjOra)41Ub4{TW=g-9zr?)dg#LnBBIPbp4uVy
zO;v>F)ka}V;r_?gUi;K>WGO&JM7cqNM1&$AUxZqT<g(rd)j4czY~2VFt+=8!x>B=?
zKX*SjId{B8RR_BM`d@B{X_w-T9xk)qFn7g63mLp|(C}Q}XsXyeRe-yk=RJ7;d$z|$
zrBpvxEeosV)GV4sAY;SOjez)Fd?>{qCp}+J#24~{g^;0EkM!v?8bN%LM-7h;o@_1l
z-;NYyWhMOWz8H*!$;@P6|2fU_#J&6jF7{E7Fene1bE5WQ?Rv9P$`|f?;=mZ!oH;4L
zcWG)X_~fVasqTmB+1}y26;DLWZ(sk^t#L-gIahdRB6Rb-lH9_J5tPk5Ckf)`$0Uf=
zH@`(KCSoIel|HV3fu9xX4A0n`iW_}Vz#JcDR2bp=N|cq!7HopyEb;|b((b_SMDG|+
zsz~#E^lR5k?@yEsp`3vsFPk7|_{`#`bHW>yAf`8-B%(d4gI~w{`l}ITi3+|?gPEH&
zh9V~Fsr4_U?Y4AFPp%tQ*tw<Nb|_iO<XxjV|8I_*ufSN<@*sWaflC}oIYZTk3}fl@
z)Ss@EPCvD3n{6bV6Zrr68{%eQW~gt&V=7oZUt-=(ad#Ny6UhC<Cvm8ToL)ujm-kTv
zwOClxpo#sLJ;Cug*B|WF_x>Kg#y6~lW?HP70Lk_0;v>=Xc}LM?Dp{XLoy@NcVK`T<
zz4#frLWXi4MOrt@X()Lj5JA3Pa|Wl05PNoMYG-KXCSf9IX76Np{0&?T63<4(nk4%R
z#)J`}5$$%w(59f{d){I2If)76C_3vemDn={FhAlFcU#D+Z~Q4IHaM2!2#f9C!>%5R
z6iLy>!HQckJ%i;evGMZkuVVR2?@@>jvH`G~xWqK8%uGRccawTu#^sZoqWjQ-T&YDa
z=OUNn|5!7^NBiL7nDoGX$SH9AOd@|-*Yv@X+?&pnWL%f&O`1REqAzN|K~pZ(GG6^?
ze=iZef5$Cg-?(@ER_qLq#NM$p<m^Qq%tup^_~^5*dc2t>8G}|zmu?E5Tz@&OFO-y(
zo(B#ev#{=8wo5Fuz{H4J522u@cHv8MN(SqNmKbG4#f$F==Ru)zI$QDg@x=Z<o?tkh
zQ)pzhIsT(cMLU?{AX+DgzFBrHm3ogKq9r`l63xP6czy8dY@TcBEwq-oLifes*Ki4o
zfo#9)s%mz_`6%oCd)iqL_juYm?|MnY-L>=UV{2HB=;8O=&LcBF0C1L_ocW%weO_dE
zMp|0lvKj)t=&22xeg=6X4J}~IWT>9AbH&)jIEmBn(T9OHdw+Lh-T;=(<0}Ma_L>{t
zvPgvEr*8wd)u3cCpD^8!_TNk}eN*85cAP@vYF}i2n6UwmpSU?)U9_Ho|C|%gg_LRb
zH|7VVk^JXR{WjBlst$Ie=JUe?UD2c49MciKey*Z!`Z}WRLsJKRNz~3_XXbwYL0>K8
zV!lT%=0Y_imFQKsy)Dx${t*=(E#z7fcPP;fTGi7VfMn?=6)(RHsLM5>KS~&c-scNh
zUA0yPZ=wBh#v{aHf-h59PGlo2x}Q*y^Vsq?cpdZmChF^Fohiph+~O6m5!3|OHl1EV
z<qk`F;Vnd+qOGL2^sb#<-m%vXDD^nvXm0%CaqgzOl!cj08;7XLs&&lo!TJ^`$l9yq
zY>#5D@8Tr@_q!>F2o>Oemj3|+iK}22A5vN>tXk@rwGa1~+i7*;TZC4|+hb9@{(_9|
z)WR-s1H7}|Cg&<;8F+@r(0_({4F+^Q8RMV{1{jX;`M#18?Y0ul4V-t+YB|Kk?B)~&
z57vKHr?DfdQ^K&<y2*j(s_QI*bKv#j-yMxFJ_5U3XRH}=C!#jKKUTOGwcz*00uJ(Z
zFjs#O*YBBg6vk-HcuGb7Hh^W~!ypglHYJbaKh4HizI(8?+PF`x*6~pG<T}>0dd=|I
zTV4qsSTj@2esZTL|GH(8(>st<_tFf<J~l>$Wt`q}xje;sI=M#d89?UQ5c`OvR)Fg+
zgOShH2WpMvGTT_NEr|c9rU25qc7kB)(|oZSiy*<oT`NPZj98zI_Ea}V=#RJ0Fm}N^
zL<3}if`XaX>)ybe;4uLK!L2D{DNW62`dv|wR~Mevb{zGx21^mA7C)m&5Z^Wc*qQp^
z^b)Hx?mVbYn&2KqZ?ybE)R93^W4zb%2t;BhL5#$TeMxYr{Y06uVl4AYz1X3=At(ZW
z)u?84-M$Ip)auIg<p1UjD=rLPujFw-(;JfNe?Ae6Sm(a7GEaX@{=w4X-LtiOGol05
zqf@ai>xrXOx}twh{3RJD#?>4e4Cf1E6(4bC@9$W3Zms_O%Gms*M>iK^xAK7BK5{pS
ztnA53S9Dc=E9NU|l@j|jVL;;J>E&9Yg}U=9!D+?sZ~^v#tdT6^>RN6p`uqQGQR4S`
z|2RHx1d4qpV5R5V3KlqQu9d^VUi6f}Xh=XjM=aKWqU_MDdp!iXz{)u)E+!mTuZF-s
z;A22S9oLN$1NeXUc<}i}lxBC?db=#lZY<j5m67N+<J8p9@T~K)-Ypj^7#hhi;bn-l
z&(Dhr2?;Gsy`QhuW~A@T(5^7-_f>Y+;(w&1#Ecj-JqK|1Tz^NsG9ndoZbR|keUyKJ
z`?#FDs8;vs#Xp}AAA^W}xg|XOkMAy%2-ZFEMmjb)xk}O(+l1GzU-z~5S5;SMffQsc
zDHyZ8jLmi&RBP0ak70eg`BwtOKoAXz|F|`h4Y9e`Ea!(u%7ypo85t3&sj0r<1|PTa
z67ITdNlaD-U2R|40q~ZNw?jWjgc)>)?b5nG-6l~jvi_XH{^mqkI;U~_MJMPpCqiyB
zgdoj9r?d?@6xExnmGz(JXF|_{?tIt4oK;j(y;GlY5@auhcvtS1!+S5C{pkd=dr|&I
za31S0qiuw*a3=eQN=9g~_m_XM5QaSU9KLJvxUHh=U;cP7zqklT6DxVyQ}gEUg!aPz
zDkLGpX-Go&-hXeU_!A_EUCS=p)NVZf>2HK^*i1EB(HD99E2pZAewFpcCpwSlhb)C?
zR5$dMY*VS5oue)861OolG?XkUGW<b{_#sKUv<_wJdaf@IYuoo3UoMH3+`vf}F**W~
zy6mTI=S#Y+4nFO{RX}1{mXDOwS;lu1Z5WQMVb?I6i5w9Vne+>EoI37LN#@$Zp^Q|7
zhcv6Ui0B@}4syxdc_MU)(raryP!3*&#ZI5p&)sW4B4m6NYeq>TyyE`Bb$9k$$>*TZ
z)vpfhG|MN-L_@x%bnoS~+>iy8C9UbiGyiS`J_h#SF(*(O99L-nc$L3+i3dp>k0szw
z0VPh0AL$+@_yluZ+T+}xN619_4#~T(%`y%mxa&i$F?JzreIF>Y(Y!qbx%cYTt5%(t
zOvd2d<hg9x=eq&g-3Sc_<(GDb>g9?f*LPrC6BZthGZ%f~Brb87X?l_L;dZ^)?xt&n
zP9<iW*4I3?jQDyKV#zUlbhuTxPLS@Vas)zc3lEnOL#Dj%;)8J5>_8t%r+fAdgKQX&
zRHc{p&gT;-Cnu){1u{^`bNfD0=^5=au&|wN&~z&%?pYQ7<(_V+|9Ld#^QGMnGu#eR
zG*BCz>5FqUFyLf|bgV9e%6>d!C;WVSC3vtHiU|YY0iD}udF_Zhvtc)Bm*ZdVx>PjH
z@PF+T5uJ9HjMCHA6Ky!*612XVW56{Jg9YD`@Gkc~;P@^S1Ie+6IByRdw%*jp;gRLJ
z(6lx-5;T8>CkcVLm**RuN&{ECNM8j69eM10`jq}ph#bOG%elU4$LmrqU9OOApY&wv
zwxx!1W9&jseDpwML$PhXU6s9P;`AO4fsv-ocpv!=m=cYvO@IhgIE-jG5|nql@X(0Z
zfHlltiZ*XwrsB{t6Wd{WBK_v^OaMDbJGwP!&CYKXjt3GZJ1Er%iB~|xkjnw}p8M>j
zE4Tiy9U4p?<zT`Hht}7>j+7A4Zk<~jQyry@iv?*6di(B}DzF_(_`<)1DDWc+DK2Fo
zCed%+{6Uas&R&m5X`blBczsZivr7wQ?q%~ud7<_<*F@0EFxT0%Lt<F>PaIn{&!4@$
zy<{N^V89a3&lMRjM~%LG<|)aMvx0X{jdM)2`OC9n3z^jm;{;miA3xsY=H~WD3AIpj
zd0#OT?{{l+9##Y1K!?toFr-Qb53`&j+31-QT&D>TX(aeR3c)CFy2o6%Dv5lG_oqTU
z%`EONs+)V=|HSWCXnY>2rJw!xFa`-7dl)?nPeE#WYxZZocA}R}Ddsxjy<)rA_ZSS5
zC~W5YJYB&LaN(P6ZrQh}08p7$6y0Bu;5pNVUiN<Jt3<3O<C59U>3R`kUJ)O?3?$>#
z*`(M$ex{i$p(dy!3}WSsqPw?20Qw2Y_E`OBH#LD3R&G$vM^w~Iwc<~%BYI<}XgI&+
z-H)aLngpU=d~V~rlDx9=Wp(qsw+QU}q`NCan*&Uqh>_dFBd-1U@g=0(LGoV9{ho0|
zX)i{^#k)h{#h(NC9lL8}-A{;M>^f@7=6e45#4B=$_yX!`e>1>3Dbx%$xlsLLN&M;5
z#F@BXJlPYa?A6-iFbKRniMgJamxpY%mpE8tRCmXeK=UDAQa|0?d@n;vO>vqsZp-vx
zbtj@8J25fQQ0lZM>GGC?jcr3iqx#6ez+e@+F0W=WD6bIJ`;a$pPPfIC;p7~=_Aat3
z2?_IIaF)5gzN8Ftg1Bul2YC**Y_u_l5YTR64z_G8mn@4SvyJG-G2_Xn;~2q>4phwe
zSAmO<*fuQR=mG|V6j(J)eO-HB2=np@h!VCxoPkdu=~6HZ!uV1r2V34WoIn{Ed`1Ke
z;`{N~omrjleb-{I*tc$tQhfkK%y*(F=bphJ$f4TWyEh2g)sCRi#8T!7`1j*{e0-dR
zS`V*#|M>(y85}3660Ovq{CWK}a-0qS{WzT)z_H~6olP^>;cd$wZ7W-kl{F1Gk}x(M
z-^yUF7cW8$s|={aRA1_*K$`A064o9s^K;oRs1%KQpG^Si?Q|(bzKStInMS+c4Jc`v
zO)mFAQHmrR0<+7H?0KZZ($+5{6PM_MYM-hHgaY;r`#0bKmqBBaRip4>Za19bu<%43
zaoN>)h?PIo%pl6ApS|q7K64Jd+TJcKm?3U!5`Fg+p<I?*+&KiPO~PL7GI<>k1bp-M
zEhRUH>b2a0Ezl5?KiuuEa9(O3tMyxqvJ^JDaZQ~zE+ZqOz%m?0+v<pYL11{4G-3d-
zC-ODfo9pjQJ3ck0LjV=<(e+1P<E8$B1qIOSIr_CT{7I?_QSSIM@5Y(MEie8LcoBks
zv41PMVYAQeDgY{H;<~F{VP;}5P-u0Cc@*_YcfyaoxM4}K1f>1|Vk!_XJaGWtB9qAY
zoPvVFk?*mlra7*Wrwb*CmVk!kFm3!0NJDul=Opod>(^M`+r?c!+N(IqIoVc8^pxa~
zHh35UsE1JzNc%n~Y6Cxu_Qx6I&L>}Z&qVe6z~i6a$kVGO=pO;4VM?O=LVj8tAd2`Q
zr;#^3(3$;%RR25RL}|Va2^sxh5L6Et0J6CgP&gLOKDfna_;`l*qsSPD;n$ejM|CGx
z3@KXIQYtrq&a3d25k!p59~dz_p4Seb_j}?svPFktOVcb-3g^&fN9f%LpZJ-sZ|!!)
zOh>t_N}!iGU;X>NWj!urnyE=x{uVAN_@r@`ye51v|NOzL*N}j@g7;tQKAf2iH18Kt
z5SeuIiW8)D7Xdv=Ntd62dDp4qfZR8aIL6`kuLA|}9JQ9?$7O2-@dH#)w0!M{Km4xz
zRBNmy^GOM!HIvp!*JGi6kRNnzIfQ}C`OO_*lN*5ce9R&uYsC!`X{}Cb?~uwbA|foT
zr#{)fVsCI+qki8<Z2zVfYU8nTv`rO@?GZxKLG;^cZC8r%&vl(B!})<M=crb=mZho}
zv=F<@|2VD1e=`!*aTe=XZXYxa?>~+r>Kun6DSt~dNEdL7_zcR7Zg-o@8?R37KJk|E
z({>ka-#7^W+5KAdogPq!x71%c|NE6q|9xdQJmUY}Wf@<%vM)2+ul&8TA;^`L_-|L1
z9<FS+_#9G9aEx-@_8bH|mUW^Km(<f=RteF!X=A#*uV*e$KSKsB7lt@0^!YIszCFMV
zn7NO21SO$|i4>ys46E#T$(HF=8EIk%vvQjXnEPG#YfqFhq;%gW`kNRYc64@rhjU&c
z$TVF(K<xR-%p@c{pBNZ;rBa)^mlvJAe2Y)-u|F;ET^QoqBb`|Hf>OrX+Dd;2w1iF2
zZajgQwXR;1BT9y`i?~W524q*SU0WSse*3pkIKE5b=a0J#xf(mEs6U?|)rR)<*G2;G
zpEHyZLt6jafSAc}{)42QCzr`zRtQ<lJ9-3QiKuu67OhML2&YU!q~E0e75S;`(J;iL
z_6j$*prWD2fFr@rS!#E4alY)$?KB)?Sy@?4n-8PL-KSz-fo#fcV$jzPF6tXE+I+tB
z_}aB=2@vG8awb4%Iq&313=irWHLD5};<GZXvG`8Y<>}TnXjZqJi`~5o%PdyWTDx2Q
zmSWUFI9)#!DEBeP)5zl7VE8JW!Pec9zxp!Pr`rP2bZ0N$*8ASju=0M;O!GYEx}hg9
z)U!2g+oZC8J`j3$?Vld%_t8}SKAN6dsp`K+!w*Me^(o=p-=k4Lj>bpsKOar|d2ve`
z*Zp6&g=84bIp!iXtY2w>q~)8~Sj+dT^mQ!ah%L`?aUs-(GXwJdm!XZY&HG4>7}Y=~
z7D>=zfyU`7q}`_t!e#G9pk5(P4oVnH2z{`+P;>}wYS@K9fvTKWibQA*)ojW99zDWt
zF2tv!e0z*gIr;(g_*$U4<f?oC@&2Sp`5tzi`UUX}Av@3|Zvyft{V#Gd4cs^G_+lg#
z_lcllLacodO#F$V;Vv81qu7QMWxYKBT3^`>!y)+FHXTFK!7^|h2#kdK2S%#74KUJk
zI%DiVrCz)8H>?DIr~si=|BDa$-b1=_sr>Fk*>~f2QcjeOsubHM3xjJ~e3=vO)~ZD~
zK0_efZ3ee}tMAYe#7w>q1pGi^f!5F={OQSc#Ml;ebp)d_>!Zseaa&>Ne{|I-#>wzm
zUhYNo-pr?<Mv%IvX;0K{oiEn;3X!mf7;&zF6l!<<A+(j3mE{gPJ3HIUTpYSLoX|IM
zze83eQ>o|R98$w@&bfdXdLlkQy4q(AcO;1pgsaTuEXN`NdIoQaO9Szn&nuwnwE#yk
z>UM9OM@Y4|>#UKb=XJ1#1h`!4qp8>Vke#-83-H#C@vpzXyr6<eep!4tp3wL0A2cKG
zF<i3(0-m#fn|cZ=q$u(IFGUI4$#w6~+1ZZ}f7T)x)goYLVxNNm1bZRd<q~(^3tAYv
zT>5oAFHqC@@kHqPUzEUghvSMOM4QU((fSgzA3Ki1JgKsi>^`!#%5Bz@8En8&vcO#g
zQ+|oLyz_5QuETIS(w|<a%WeQMDANG*x)(Qy8WCBg7sm8$XUW!!IcqsM8BE=^`qRFA
z35HVfDho@F#IV@@iYGAZF0aB;r?2-ul#Y8Fc^ySIMy*I8G}+r!K3x^q2-Y#IUt@Yq
zO-vRJy3gvb8@0ttA?0}ELT}C_2o%}pE-)-Y{ewWQ@fleN$T>U^N?+R7VX9%-*p_ta
zX_S_fWqjLN_ACGYhqU$^;+Br<Bz4GgjD}t3V{Q;WQ&<#4)=k09X2)+@IL(X%V;5K)
z66}Q|n63I~hTOb@osm_LsgwoxC{Mtax=7cQ)XgcgQ#bD(0b={I!&K@T?hJ2_rlR7+
zjU@zEhgy;5%ULnkQu<V4MU@N1TDrQran~SZi;pv0&_->%Md*aY?_HYnV>L#)^^1p|
zuNG7s{4mWkoCiaN(+Vp?DQ%Zz!+ZF@&6xJ2%m_yETgFUGO*#J{?x<xEx1?p|;GizU
zsAL(*s62$9xYFv{+K;h6i2EO~=|$o3jbtqFd*%J-mNMx=x+IsD{TuaynUNVAam0zT
z5FOvYrHUkTu-S0Z`F_)*&&|I`;~Z#=nN(dqiUPw|syg4*0Q3suMf6?XZZgDm52Yhg
z#=#OlhZclvXGkA0-jOmlPcypW1Qgp<(0X^`3u%Pm#R%-HKL!olr5pBTPWsRhP;Jch
z<)zR^@)LfrZoG<k#PArCs0)c(@*NJ?v?92zKC`9-s_z@%`<iw)LQcWkRRCAgvYEUB
za35Bnq#1%`1f(*<N-UEegZym{xBMo6Ok(eNj2<*F8#PCgt=4!1d;KruO%FzF06}^;
zc|ZPhByn#6<t^YAi24gHg^?qVROdfGQlArLK5c;4On?Y_Fe0I=pDtrlhA!ATaexS`
zA=puaRd;u{EP!q@sEd@lxK0^%TYaV+I}pEwqhvNt93U<Oz^Q#kzlX@?BN}OrKU^TI
zO@M&ZGqzzR4Cg`o3R2WFxm`n_(5vDZdkJ!iJup|(<i8q;0=a8##2MF+`$?qli82ex
z>a}9I%1N+b2nBFOu<*U{zm-UFwZ|n=!S?z1zhPRY5Gj$!bN=~ntK(#M=RYSqJoFyT
z+lYuJz%;MYY7n#2K9AuwReF{uGB|W{9o9NRV45O4(UW`o5NT!-MBjjSo01G@CP+|0
zjiNt!oZGrzE0UnQJ3D)0TC~u68}paJ=`I+Uv$vtLD0i0y;dRMa=iumQ`Y%62@=u}X
zH@CoX^__@IeqeDU+;L{$id%OYFYf@K%eqsF+X@Nq0N>GnkC*4*0n_rfC@PO8sB>9>
zW^DV+PUnU^hI1LSwY4>7Ki36ko>p+^ddhs}Pv!mRwp)?Q)SozrROgdXH9&oPwkxHX
zP^fQ4kAp?4i}la(1b-`D#Sxs$-+0kQxRx`KC3^!mv0v}WP9tyo!(q}M+t&Lf&i3&X
zD(+-|Pd<(a`?_-0^V;{{7@im!+-+shJo(d{t7<Db|Dn-8)mVx+w`=U{4V7jX*aS%O
zR3q=$9!8?Um-d}|yRiFR+z+9Ld8=+wbZH_oFUfI{OEetu-2Dzy)mutsBOZjvVn1H;
z@wv`(!DMgp+{aZw|0S<q*HTma>eo}7fxDVdjIID)tu+W7zZ*Pt3XFn9&WJvD)VZO0
zd*5OKt#bfhaj~TT6#;r4r!3~gM}8$}OVJK)k^c+AxE36Uv5T)D`(!k`_(X3Fx!;qA
zVp~M>FW&k8gYuiRuKaMDn|Ocb(u=a5V&(h+uJS9KgH#t%x>7^?-X|_AfbmmE=>WP#
zw@+`lhxu>CLCX42Q-Q^_>-u1DWM~xIU<nm2N7vV%&tpv<Tk!pD@YyJ2>XsGQgfE^G
zXZ$z<PC0C}kwom3Zcq5ukb_DuS$YEjdYJBk&Nj%&HvngfF*49_0=k*4g|<ET^KX$Z
zG$+{>58WCqqztXf#EnC+PPhr((DK(ksL7we0#5pk=%@214j_78feDjlgDYG&r2ddW
zaVt?!QWjY#p;2@&wG{?ykMfeJh7$*XeQ+RR+@}4zSeQh63V-W?<ID5Hkr3;s-}^xn
z<3Y4Sy`74-HpivUZ#Sp<cgechcq3P>i%K`_?Bd?(drvjJ+MC2pJoBeiz`%NQN2jjj
z?drlpz;Lx~h4jLk%hQ1iJ&7fS781#dN{ZN<9~F`?XBB($_b7VKNdNs;UogFB&$ebE
ze@OP_2geLkZL|<J+|-xL3g#bM`2G%AlwLg97p0ufirj!U^A%?`>@_Kf0*n>>+2g3e
zjOyt!#x8u%b;P7m<6PD7XnJytoOvpWMtQq6E+B-=hVyVfg`lu-14`KTbK)8G$<Q9Q
z?@<!9n7R+8<l4ErLc-4mYY4A}K7dpvoysMs?s>chZM|FJtg2&up-A5%da$klz2kX!
zq$084o`{dXJ|D`sj!*iRC-OUuF%4l>9_8y+tuYH&dM8uFxw%;c>@Rv{pD<Xq=w02i
z>C30?{?_t)%8Qh)Soj~-woa>N7bh2N5eBk`jh?je3^y5sYSToupgdW5e_?@jwha~9
zHHe@8_io`yUdgoXR7*}tAz{@V_$&j-6!X75S0Iga>j3(L`jJ&9+#yEcurwfe5q(4F
z+ljWJg0j0VBxnxsW&$UkMZ2fj&KoAPknE;~D;lAUDk*DkZx5D29LZr;A}3R(lpyOq
zlu_^IiMZu7Y9Fpr^UTub!x4g+l{G}TqRl&(k>v=)och*WXxgoeJBu$w3+b$C$W~#>
zgrkg`NKP52ovHHz=3aa+79&Ic;BbcjXQ)HFZ9Suk<`df$N(!9ke2ckG*%`p?+<s$P
zx9R040)w6w^RtpRi=_XILESH{R2J}B*W29ZKfKyV9ziL4Q%gE(cgCT{ph>x8^J8HT
zLA>45ex~=PK9T=SxL98_UYoD0utWaN-He#Qix)hX6*QRs7INYjF~9GkuDwCQ{1n(C
zQ4Ad%0K6l^7HEQbr_l?gUWC+lq0W*BN3_`|0ox~r2!~V~`ZR*p2}sR&W9}M~Gc~}&
zGQId2IpXTBVg3EmIX~l-UD*G`OXjDXJsoGc<c*z&9%|zUGll9g+B({}?hRzVgt!!-
z`t8jdjP!tbhqx;FG<SA;mrI{kMeMX@J5wT_TK>ukhfA)q2}MkB=SJB$Y(NsimqnuF
zeOwSQ;flgPb@{=ED_})!r}O@wxc?hR)54^6wWcDE;jeV!x%U|$faNgdYZGaLk6%b6
zQSY9>zVPQTf+aC4%UXkI25z>9lrml2d^YI)C^_}%uBa3T=-8?C;QvV{c&G7}*mx`A
zJmIEM<SO>xTSa{}ALzaICxA*`4sIS!iWfS))eh(z32_aG&t}=T{-77Kw`D|ODeT@x
zR6(^sw|h4DGjH?Pk4hPD2rzz|Z;S5E1Xs@kv+-%huiDz$b8Ds78k?FHgL9OZ*XC>y
zt-LhD?$5IBS|pnwMe!D@D{mD#XcJapSm@Ic^;+fRvBfdcQ?<hoqV4Ph#3udclbUKU
z_`46MRuY`V^YkR*#~ST0Bsi8IuekyYs|YYL?$%m_o~q;nY*V)J>59aswJeDoK|Uu^
zRkmao08s1J+<htN<zd26f^_nR<msbeE5(6WtE2?}J)1vKf&p{alCdTJ=hSVt=?*LU
zL^X&(tIj)3V*COmn#2Qno*!&ftg+fPgzB*V;zFOl4Qr<bs~(vUd||25G_nmZ7tvq7
zek~?AFV8O9ByTTSlwN2`b~?Vw(ZW0bp8y+)%@-DS$I0ol>A}+A>r0m}_do7dB8ObX
z;*{_Ar>F=axVX2KEE801S`<cz=1|G}M*I%PClByXHb6v@jF<)p>pF}{Izap@>zysp
zUusB7%e{nK?&V*<HWDl2s?TvPL2($5;X<U%uMB>&m+R?l{2j5wczr8?;&}DS%29Q$
z_AyzI8}@Og_{>{>PCkGUQt%{XG!CdRQ8FmuYo#8Y&Z(C!E#3COwrpB{?=<%6@&c$(
zNAUm5!kU2}k@*=Ao;9vw7y@Pu!rHpMAIVMhfDS}CVy5i@28^#`b6WK@o%UePt#=i1
zYcXAe>>38cHo5pBd1*`cUoP)&*<@G_(r2utZu~(uG;d#Er=+CZbf(sL_G0?R50S+x
z8|-U;vd<rU{t8w*uXu*!Ps7KJezC<zzRu0)=Ym!h`&Y13DgM@7z7^m69atuNdzY54
zx()DXKM>(8Do+Xv3zt<@^&*Tr&VMwhB&Bre|A{_oS01V<Sr`xu3@Z>25+;06utv#^
z?kN(=T~E32n`|duh1J)zm8^pCh+W*RN7v^&pvhD7T!<G0(&D&mSg;q0SPlsz5dT6<
zQ5mh!=u7em7$~j1H|XB+`dIB{?Rl0CXgdfICw&enA)xFRQr5H~fBW`rO#Rmv#ueYv
zjpf)nJ5tucGi2%iA?zxkqTISR4Wg6?NP_`N3&PN#C?Tb&l%z<PNXO6;l9JLO2nYj1
zD~+I_bPqi!%}@eE4E3M!Uhn<<^k3g%-F4A9&U@Yy`|Pv#^E{g#3S0?vGH)0yZ;Z_0
zR|=QtF>60C_4gu0zmdRo{Axg+PZ{Vn;18JPR8O6B35wgO<9e*VZ7dO}&`KyPD>IY(
z3L;48Ttc$<5-kg@HiP;1o`K849e|iqiC@?VX7!E+)x+I(UctE~fyqpV@VSZ5{;0LZ
zi^&O{ehrVX9LW6w<d<nBJA~^22mq^t{3HBcIHiKUfVoJRjai?M!Z`xy8y;+ip80TB
zoYkxro0G-XAvBBmC#n8p3@NqzoXC5*X9M3}E_<qz))AM!sL!PG6Vt(c+6^t)=nS{1
zHu1X0y{_~m<x!<s{owFm4Q(!`2OaUx<E6J9&p_(U{Or8qZn3_uyZVK3CUEU^e0=q9
zt7jqQw*%k~v`JtOS;G;;%udnR92_ioN4v=H(Q4Y%c2F_yE;igTO4-170B%Jcz|C8&
zjlkvraINl+@ms)XLFL+l!{gn?cXA!{^z@tHG-(HUMJwWfqnjT*sIjik49eVWk@dTf
zkWkkXqkP;AY{4!EhthL2`zHaVhQ0<p?v9YV1R{f-pJ%_s&H)Walh0=jJ}fJGWFmsF
zWp3O-sv6Js7^|%en4SUxtHNi2xy)e8JXq4IXxjp%e|4%x%^0z;logy4K)>h01QI*j
zuT3mP&|t5$;8u?jMt;LQg|wexk<{*%+)~+}T=zC#Z=4GJ4z}?ZY&Bhwmo01A@<!yY
z>0MI4vLW76vj$L2tBeXx6FS?v29;LvM^icLLRh&Y$Ex)`Fc$m>J;#W3FSCD~^B-pp
zFO4F&roN^@KbvbY)zH*gf4wrv`$(P)#n$3-XJY+bF`3{`x8IU~<3k;TJEnz8r)&)B
zXlU%6FyZzrYkTrK_tgk1)bf+nF)|H9<n&l0@TgGh_RN<X<<bk&|FO$#_weE$4r!YE
z&uM5a9J{8&U@8Fn-W?O0mX@#jE?*yj#zLZghRWC?@mA3X4|oW!(q(D|#&c`6-&0_o
z8<lhBQT%}FOqY68LA)}5hl_Bru%O@xSeB&$-@BL{bGEKez=B>9jiBWT8%y314M1#0
z*cc{uxx8^b;HKF{o&d#j%f6X}4?AD@+s?x>f{0-ebbm~2?8Q-IZ@(}RaJ8<r85KPE
zf(L*!r>2f*RZ$LBDWKY&{XL1Vnwr^IelsX_+QQ3#K2%H(&y4U$TgZpdnmxaIKld}p
z7f_pBHT&DH{B8Srslf=>FL#|(s@ZuJNM5=H-@2~Y*tR1kSYjW!J$n8A3yGkqMR>=(
ze@+w&!r^$xXCJNWpC@itZjSC&vVU;5Rd3nSVnG1m0zt7BgZWq1FqTC`5&x-EeJC%o
z{)L5wQReko?HL1R&Lo$A6LEbc76z|}NjngOgNml6&WcYB#``zC91<^}Y8BP4tG>gO
zfpg0FnaIyjPl7BL0LbhF=05Q?pt`<YBo$}~BG`S&dwlS()8G>Q000`7YQvLW-T^*(
z?u!?swF>rRIqz~ndZK;pUVTZ4z&A5K5Li6W!xUvoWn**qjxL_3dp%ihy=vFS+a7zO
zq!fDO<o8r+B6!rxsH#DF%I5^y$9PFM+oDM>BOEIZ&}!>wl~sSNpm7!?4mo)&_)kFo
z+UQbkv*1sU@yEc*hJjeB{p>*c;=1=+Jz74;-Mz63dYXS{&v6NK*-C)L+25jKj;&hQ
zpOza)zmKrL606ItqW<rd>IPdIX_xDg-m40!9%9DtP%iC2%b&)^`iHS$fCHbDG4N9u
zT?e@B417y30CeT2)!>5n1jLvjst^g4N}PHz?NzD+5HJ*qy+?))3c_BI-o0~cYz5We
zFJYkqNE>WK8XC|_uo%2wlSB^+tEU5eX!pBBpK?9N7HkneV2wq9r>W%_cKOK^c89~t
zyJLVO%RRp%yzK*0T?#bE>bHEoKS#6gsFH!BUuA@o;-gmy?C0G5H97<!#OE5IlJf8>
zzqjsE@e|UYXQzd!pUheke;&&#Wc#Ctp7}d>iZ~DA9)8Tbru)x$JU(}YhbQ{A8ncOB
zt*zF~!Gm#3x%1!SF><9hy;1%4GxGb=vi6kNG>1EwtXUuy^b(YAf3;j9w;BO5)P2~}
zbb<QA)lFE{it27a<$v@3{YbS%`3%4ymw1l4@PYbIKcetoVOB16AheAIbSCsoZMTKf
zQ){pme*^AaEcSc?o*yr_R<VtX!)m-<)D7k%k5Kz6zmqPkQpIh#u{Uqtu!mXm&jJ{f
zH@G$B53mO_eG`Mfi5D{OjsrOi(VQe<>tRJuid7H2oGI17`P!m43&2s?7aoHcIyN7#
zQ1NAX*{W}*&-xpH$Anoh>nrwr0SS35a?$W3>eAyI!h5r^>bLCm+(Fn}3Qi4QjXZy?
zSvsiHq)nb#dsn>2V0@zhTj>p2eghk<@=Rd`wPDXNi(fC;C4#%W{X2sA_Y^z^hy>Px
zDhv1eI*e&$op2tP6Nm86H7$!rD1T;+Etu>}Y=cz!+4u1uA^MLVahlS^Yv_E~ef!b6
zobd07cuG1;=M>%S@Ac)&7Z=TUwGO~;*4}R=|I6w`3*x=qgmO)sQcA(8r@rYKd5ma0
zzRW;iSY?wW#lyoBhrxLKIC%s%v4B26YKlEP+!?J6-g2WBHUPNFa`PVARoufwL+?`r
z?`vJx?RL*2;f6A!0Q&F-)PHaoC7cY}5tIi0(A#nr`~nD(4XBK}ql$x#j_6h0xOf3T
zcLi!1q(KJUj-tG*3^w(+eFYJ`BZvg~!BLPYk+Sc!u$HT*p9av}vrtSRD6}>>ID!b9
z8p%9>BO-#1g`3p=S&=_%V!ysGPW=hZ-FuT)3=g%rk$eU5C)!yU8WiIjSlN^h;ru^G
z+C7qU^X6Z2^#yY>XcCZb?ITyJY$MOjn%?TWxyfIE6fP{V%4x^AdK`_bL7@THwPpSZ
zEwHiRCFvx^m>xYbH&+gx(BsaC;ijke%6JjXYx~oW@gT`**;Pkgz3@{D;A*2#QUb1r
z%$dId>;GJNLAU*!uy`Ij^VFHY5hy=5;(s>6{vBIAh&Si$?k_C<;t>D%s0;hiK4H_>
zUyqcZi{|eWhJ-EJ41{zCRstR0|Mrou?|m?O_X8aMUOxZ*_`lq5@H9ndkl}ml9V90G
zd&^9E@LAWi!0G?*C4PR3h8oBTwx?;3|HOa&Jk-EH4ABFh&1&-e3W4}%?*8rhsv&52
zAQQ}l`!gW;m!pn-UCMG0seZMjP4&NeGL{7zy14a^nEw7cYzAPsW-cp9{QJy5|JKWb
zP1psOf0X_;Nc^MqDJ(>nO*{F2%rA~#&N<L9F7J8T&7Z^c@2Kcvlc*@sa+=?J`D<fE
zaxev799Tw9|K2iF72C~I5{&<|D<YuJNcjyL+TVvykqG;Mr?ex)zdzvDu2}GbmPMDl
zT>gEHpTGHC!oF)D=X3o(yz9?KKc4Lu2u>>X^Soq#SlVCs0cdc)hsyKUv+WN{<vZA9
ztTM{Fe|Xwh8g>D=wvQP9&-d{IEorAqe}+%~<2k)k*ksVI(C6bnbn}-rBYPdJsqDVT
zI=?@S?Gu=uypdCLPk$MK-={z}QwO`xHU+4E|4h*qeDoITEhhf^1Ad*Jr>B7n;3@F@
zAM5bX?#YP<FIpi!$;9*f#`>ob_U$dP6R^sUi}PED+0w8kX=`+0<Tq>eYcBwl1aEuE
zwOj1*@BL+C179!uf#iSmf+Pn!G1o=EFkSe)<us?P@05Dbujrp&yYR!*Dc;78o13N>
z#~=D}6MRN>v-JG$U;oQ+kmLk{j>L&ZF#U`b{l^la1fW;U$b|O)w2fnVpy7`D)QI&T
zdcudbNX?2r1A)Ij{y(19tA^d`vDBaJ{$P=?e8CKohhzUhcYd3`zXr(f2@PlnGY>lY
z!@kkI0W1<XTlqitwm%H&Un9!^Mo-C+Yvk8p=a1%@Xzade5PS4LyHW*qFw$kmhW_^@
zZ{Y|YVCzjf^7}{sb&6SFC%Gu3EBE&o_IrXohi%LQkA8J3{?PIkmI#=`XZwe(uEYmc
z>=$*)+Th=J)ql(mm^KG6w5(ccKZyzd+4ZqR>;iCZ7<u&j0{C^1Es{XXg#FT=jIIB8
zL~k*6WKjcc-GAujuNEl|Ymo>{{&4cM#bYf}|LCkX7zV#tn*74T#IYLjzN}+Fuu;^9
z)+=T!LR(smH`f4m`Ntc}M#}~%YMLd42zPe3#{huwm+tN|pJ!#|tH!+yD!;8o*|S*d
z{yO$U@qcvv=b|p+mGy0?{4|QikVdoMp*2MtYHBnKtgUits?-=@y^?<+iu|0YK36nv
zyNiv+B&Kk?yNkt`K3}=|%PV5L7A*;0Gj>6*g!8wLd}RxPEwumpf|~=Am6OYUp!rbg
zVLVMTyjW>;X13|CWe}pt#?P-M?({kSkenGdwOnL}`u#z@x!^(LaTyVR7<gN5@JhBv
zqvF^Ok>Uw!Qf$p(UH5zOq`@uM{u+bmyMBlM<o%^=hR=#vmjCemBG~V5O)L6sG;#2h
z*una{s)jFt4aQU``z0sqUM=_EdKf=syeo6@q8!L+UxGj$m6exW;vUC*>8$YlI^>R#
z`)kQ(){`u*-@|098@{!-h{n`-ye)($CMS!(1!T~L=Mo9z`|cX~H!u^aPs0RR|8v3q
z7@Thaqbl8<dHoM7zk(BNyVWI|QaBiT*=HmcvLzK2H@Ub|)*YnVNIMo>KgZSqS6Wh?
zzxIp6&R?F3-!Nr<WqP-U{{4#}8l++Ud^v@Cf1f!A1aA+B%I6bIej<ziT{s`rfkisx
zu{`x#-zY6yv12xQ)g%}kM}8tSSGeJEF)@Nj=;tbr1pX_FM#Kx{u=M%A2Ro-$w%&Or
ziD-$Nt01R)`Rx=Oq;T&Tw|O;=4*oW&vP@v3wNb_X$)@Z8RzpL5+O-`z&?O5-T(U#k
z6928CA>nk1Xlt|}JgbqM`I*$h{hzMxg@+G?UqiBowCe{v<Lm15mTU-@&_UOKh1g-Y
z$0e-){LRMl57to80}OVk#BBzVqPInro=LExqC^Zv+|t4#E~u60W$Q=VM8KM3yW@A}
zWoNj`m(I>;7|aIT5zFMPtHs0u5yuK|jT<XbB5uv|+8_2`H+%IpvHpbaU7+q|?7!2_
z^=6n;u~Esv-0n_Tc+8vsHjyDppmQoVu%FQ6|JZLiLBL?`r72Xx%KQZ|_idl6GBUt2
zu^V};Qr65YcUDKLz_q0LD<<}(@tf5Fm<50JWzC+g54Y__uPi^fLP*H$Z+`73rk{%R
z!Gi}%N|s5`Y}*a4+nVaz7$>^l$Lb^YnsBIU`G>231q3XMN8SY$iTj%`tlq+4PG}zZ
zhjAFs>X7&V`J^th9!SfxeIZ;SzNHOmStJucqsi77jbSTZfLQ6o^O<@zO`5r#h+EXq
zj&LzRxq&8med2BQ(J`%Ll;z*HJ48*k(beV(Z{i(p6;?fQU0h7JW_0?m<Xh|#{*FBl
z4ApgijRpJ|+A*v<HlnUoIW*w)mWHROG$<F`K6SG8VP^PSnt5HCN{t4v2r4;(81*L7
zPKd{P{HZ}Kj7VP}YLul{2*IdnX7cth<UTG9@VcxS4Hvxr8S%!E(<4p&Q*8G&cI<kp
zsP^5FZ}gV4{Omou@CZ^&<1nL3a)#zVX70x}tB?gld3r;e<_|k;9Smi*OaRD%X=v!O
z11#lEI|!V|#HL(K8txtKs8jQ#(Z{~`m&=rg1{OQTAC@Dg&XEnEoNQH#Ud?T7Zi1YP
z-|Xy@luu(vcU!hl!-=}<4yq91r5j6RH$UmW&{)<UKl<|RFIQ7TP1XmY{jTAo^GrHR
z&Qyig#2adLAEj!cZrmU5^RH2;zz$wjjCt*UzYDNLXGvaB=8w{V#5Tigko&V*@4$jA
z9;cv}?P%3&jV*Pm<8;5e^D+eX3{87!-e;SlPo^Mmx9{wN@TR!9F$v%)@n^34tfe_M
zD2TUglc6ItW=Q&7%WiI`kxJBP+2!45NT*nHmxe&JM6PmFAk@^a*8W(#z1;-cyYNcX
zouYMywUp5cP7kuaU-2K<@y(pWE>1he(|_oBEzQ#)IW(J!+Z4e<m%t?c_89dnhV0F2
zIbH^iuJ(%Njih0pNR~NOi>WiK&x=k7)l)ozzSEF2q|c0dj90W)4q(<kAYLYk$W309
zP_aiV8X_}qU?RSXtUhm0UQk=D3Em;QY^q_<@ZId{#S8?ydJQdIlG0BsbnhKJ>*07s
z=b_d-gCtd#l~?>}VWeG`{$U^e<D-P!1Is1+DeND(#J|&$<L@g(S<sd}Fdxja2uc6?
zqMb{}9{m}1nVWlnv~6B7=%T1SUbk6($9@D#vhmyJuLrz0q0zD%XvXW~4G96L80eV$
zs@tmd`+Wn{UBo5Ii59N`rrlRtW19>RXNDa63V$r;X*gCKMpfuk>Jh|S;t^tN|E80)
zJ5d|g!<=1meb9*M$13(4rrRLxqtn5~+~ijLH|G1(sQHax&AVM&@}FjbPJsQcBij!}
zld!mihl-Y#)m<jL;u&dFiw;u+Nk>67F-hiLX)O_c?uB%ocOKw<K){NbK+QwuA)=Tk
zU#G1(-E>_C3i*^=8q-#S8j$<z1zX~RGv0D!{Ro6GS|0iKzQWQ2?P;W2OxN3jf|tN7
zzu&oo+^TV2T`4fZ`+FDa8XBRK$^1B{UKQDEOy~gjL^$?WL?^Z(+Z}K&-19FL{rwUX
zeFu-@j8&vkUYB|e@uD(p+AE1B6A_b`$epCa*s{e@!DN?@N-}kle19D+svaUe(rP`1
z(jA&psi#kN4#-o5dY&gTgqVrDSwwysOtB1lNn)eY-Nr2oN2CNTGA=W|si|q5^1I0`
zYxsn4DYhO^89Le@TI<&)rKOoZU#L|y%SFE@`)Rl<-ufOJRC#oH^!3=71HcV6`2Ww(
z{#`$}us2T+q2d2>@Uef?kY^Kp0vnj;OvB&q-tY=0cLxsPLZ!vs(ZKjLIU&1*Qo3X0
zrdg`74PLkPV7NrEc!P&rwpU}$jpOpy_Yz=Lc=DPGW0z?(qpSI<Y^&yU-A6CnCZzB0
zTHdR5eW$YY&N9dbDKU^d<+hq+&FhwbV6!~-?Bu@X_`LXl2`LL?pgW5m{_f`X!-qp6
zw>?Sv;5xPJlo-eY-1FVzFJDUe<bS@+rRTD?wrMck`tC}8k63$zs+(^3>F1~ZJ~;k)
zvkM?p!peRw?7s{fb}ZgrF~ZB3A8{Hx%mEyb!DVOgAJiaB%WWz!&Uuju5|rDmg6b{o
z7Rzw3$905?2b+1xxd(Xd>DPOGzhBRzS5*peSl86Zc0n1?myP@KjGDLcEKN9=z^4rm
zYzW<so_E!)sk~yS&iCX2ZCw>Yw~$|!pEtw~F+v3s$~Nx+DzxLOZen*@PG)AnzsL#;
zPrny0xO5t`1}iV#zWrQd<Qno}+wV8xKsxYVQz4gs?zF#GGx(!l9F2gnx}z@#WkHM6
znO?02x><2(M!BmTlJ<CCIAAO3n$@{eOA*;Rttvv{22FY?^T~s>PF{009`37#=*?jS
zx(||k!8&~8vhs0>b;9<QZqkWV<6?EGTg8og=@yQ>R)wlF4C(gCB8az1a5?jk24y<#
zxbzIYtnC_%2jKJ<o#sZ8cGEq=_4sG5@|wiK`n4onN_(RarFuz%yF=&G?^`Jl8@ne8
z8U2H?;5z-PBu`A<oaFi>9<WUSDS{SHX{Jwy7(b!D>!OBg2K#5i?(=t<!WNH0n=|7Q
z1@vTREowMY@Y?5Vymn@E-H&5yGKKqHH}jF^9oIbPMi52==(j9c5a%4Y#&v~;@5x(_
zvX{o3h!>pQ9V3!WJF)Xs|ELt4sRzQyWi$$w@|>$ECFqCG$1(|d+1VMPE-HZjX)4&<
z3ASA;;tPj$ArcTNzpKa^CHP2<PSo$d%FEL^&c4S0jq~nJ5Ctns^?Bt#Tt%*4GHOnr
zk5*Z{AG}1HiP)$MT6A=DEQ+?yy%+}*r;l9feOe}T%bw>{Cu8X6;CYV;(LsT7gWw1N
z45(M}$s1-6A$)$pUbr%GqDCtywah2dW|F&uRNB5ytqWbCu;y%=Tcs!&)h%(?zWDxR
z3_T)iztpPed+uGRt!=;{$P|19N+z6gZ{NO+AF>{<b$JsuwB_YDgfI2emyLOp*}UxM
zT|Y!!4>Xy_K4GLd+Ws`9*Dpp_;bKt5wQ9wU#~vy3Kp%@H&5ptp)Y`=IVn=Ih00BUG
zp*wB7#qM1g^blalixev0?~bG6F9LY7r{2y!mK<GBz;z(GwEvoo(%uii`P=~*`-dP6
zt0nQ7^K78t&ul&WRPVhiEq#4n54#ErxGliEMwAh*e?kBVkFztQr!F=vb9m^rPB@TR
z1%q`iUxxQf_XEioK;pU+kZo5lr-#*!0r;vNB9M(myw|f1wJ1m58aazs#9so)iaHHm
z)%9P2)M+i+l`XVt4?tWy0G!0Qksl2Tj|09c?YnhUAB))qZ}SirR&5r)TO_YG@+`**
zWSw8B;bH(j^eS%=xGktG^|B+V613<~HtMuQM+>|61h?q~5U;lw2ES9x54Fo6GZF4S
z)e(-}qN0z2R+%Okp^IHCU&o9a-uYHbr#Y&oIp)tW=1sC=3JMtB!tJBg(nxde8!MO#
z*$OteKtmrq)FiG-Gno_}tmi%%X2SU!Q0;e#PP@`9U{DvbnAFcMqb{=4+!)J9@zX28
zy0Jgbhd^q@4xD-+Nqb*_!IQG2km{2G^kYG*!7HBcu%%W<0dA+0J&@U|_bGt!x!|1m
zpXQ4O!sEOv;!71xK-Y*1WCqWX&B3%wFYpC7tX7SWO##e(G{AQ}w{-*nRUpmt1cWsb
zfPkKg2;ec4ph{#hq!uM>nE~W6SiMocKrEJe2Pm5ZX_zAJjUUW>Ag$n;{oO;oZ}$yg
zdJ~b)0swF#kmV!H9k6`@h^7_xOno!be?x|pA^w3Z>p-@j3ri2Hj{tRMbuhc@$ZxBc
zUw6^2pCe<7mh}TT&<;?Pz{bZF$otG>PxS+4Bqx9vmLdi=thk7-UEDvqW$!`WFsjq|
zLm}CAvsM*5x0r86gal{VjQlflEvb(OjcW)ND-rIiPy^+Lp@V0`Cm!ELq&}k#O7{Cq
zI}gg}t<n;vmm(?;WzOO{GK<3-TU&|T=fcF@zu`A;y*$4xm>q1|@wL|U5m*4HNCOuy
zqQjnuITj_Gc2zi96q}f<Z=;7}&v6w^J+8Fi-xd=a%?;IL9oAlVFFe^zHy4?52GEYg
zL~9Oe=?UkPrBlct1W|50a_u3r^JG)c{Ox*j?!QibN_D^GWd@ycmw>`AcEhgW6C#I^
zU&rV<{`>e)eCAhirZ+{#%&KP#OJK#y)4RAC$Zd!6F%*Q0qypKjM;)LX?2~m}WxVYl
zk~g5_o1HmGn7i;thDuNEfI7s@0suIL)gRvndOybH`dFUR)>JyvC}NmebpDmeEJy^G
zLq>ocNZ*tt9iQG6EF%+2Est7Ndi*X&Dnk900DB2l{fAiqFE7iWrOH3UkOV3~FH*Cq
z^kuqRPhEEc!doG00SRt|i-~;tT=ky2BEgpcvJQnpt){rM0DgWSixU>#H)>T_gaxj=
z#A<~+`$(mr9c9H&VskM`VY|F<Lh`1s^szY?mGSPa3i^|adAA9^UEBaI0fhcphpdS;
zqB#EBw{J~Omo6?*W>V}PU}a29doyp~76az)9e4L?D1MSh)u(ll(7iPFr@rBAy+L>!
z+m<dL2xOdJ@!?{Gt(9+OT#C1TuHaZU`N8DKH7A$#VgFKuoQc_S(HC&~YBo*Ye^<R@
za1^uQRS{DIj64NnjI9h+(b5=My`70=igPl-#CjSd+}PY`YTv-B)f&Z+(@I*q6gyaB
z*Y6_rv3UG01IZSOYEHMl$JKgn3Mkh=^p(T^a&{;So2&}yFboR(+a5ws9TwC|McO?6
z`)tjLmmMQqtlYi1`sr>M5m?Im03!+!V4kSWlDZgq;z)FS!B!JLHjIwHiq2li*T7Q?
z(G*N8wKn|TxM@mTV&Cwu*%rPIS3lJ&2<RZypp?#dsKMSOmXN<{f|X>$N-TZVvfxw(
zlw>s^vtqJdGzBU=sb^@8ZUK19(ul*%Oan1F)0GTwjAiX9X@%1jSoro-eXVsRpbq|!
z-PcM>>g^5VGt||!DwqYPiKhO>o60+aM2kKEBq6q(pN&^v<*5TiHpn-D{#V$}8cUQQ
zsP@q}-AH?MxQu`sN+ws1KlM&On;FGuotbqjaFV*u%qV!^>7|D<TKDH35c#;+0xr{w
z7s+@UFTH#egK?nmk?N_9wM)AS=IX~^hgAnF<3f=1XDi_qVIU2)Mww4@QsKWf&&iCp
zox31U#z1#&R;+omd)n*%o~S4ft0Z%TR7ZiYkQ)qQyXX|)B>-1D-Y1gkY4eCkb$D8J
zX58IGeLLyI^R+*si?y_>$AgiuZc3(0*mg=GAee?`XvfpWdUwyRJE@^H0j_P!vHF$c
zQyKsV45Oe15G%ax0OFlEF~`JOAh&Y%p*qDj``}-?PZcJ9;9$_H?Vdah1q>M-h=!dP
z-aQHF>n_ay`iMV%^9wwkqwhO)c<(;ArSQN3`0=@c@&>EaO1tRsI#vV6f+DWF49n98
zrGQqrRv&&pIbJ_WEnl7DQjM;;jEkwM5yw*aXR%lkAnc@xWh0NN)u>;(aE98}*P!JA
zmas4>_bR9??MC5_w>OK|#*Nx{cUQ00=j7znv#J@L2*=fdvtx7sOK@Bivyb>Tv35C8
z?*b5{wTtMg`Xb^l7g9srMVM>oxhgCMCRgtuc@2;r#tK5Wa`EWy_I?C}up9t4xl!4t
zp4_9S@AwmRf(+?lAXtPNeS44=QsQ}GEPUW=Rfm}d+ObkU{Y*yMFsJ^~!8$H66B|%S
z%d@_^u<#za8w^M)!3RgPfC(G}1mZ?qKGg38KSB_)w1wU}?51p+%)UzSn3m-D9i{n*
z5SaBsgl@gaF<fCWm1%tn)Ng4-iZ{;a#_ATHWLL;G>G?3iYl(o+!Sp-v>iN<!+KTo9
zE&&IX$Ze#G=WB$u>r7=4x*MgPca@h$0ODt3(^eO}97pd;Zf(tor(U;MrL>S>C%KI7
z;N~)I2`X#y7#-E=&pzPrTN-BQ0~(y1<YnG2FNw{)Y>&LCN1QI8WRjfk7)kKbf9bIL
zG6wq#6fJv5pjoWT?d**9Ba(3Ci;E=O_p|(mw(`$<XnMp}gty%d)R&`Zb1mE&ggvt$
z<HB-eJ=Xm7x(1*Syx6ypi=D7&V_@^yBkp}Yt9a`?#~4n%b+CrbH-K<?2^7X3Xz<Fy
zr2qpKpgwyN3~~6V@;0%q8@pW4h$@)hme;uD4|sv5pwuuLg$R@GV|%~Y#p!YJMR|^+
zufb7;!al$s5-9?7lku*+4^Xlgk8*_qJlE}(_qyBiaG-r8SYiXa=pon3k#hYA7bsJ~
zVr<I|E;O$JKh4%D#-#8qraGCaCKMT_*dUW5=PR9BaU7Y`$i1{M3}|u9yi;6T)ZZoK
z3RgrKZ?J{?ZXp$&?wR)r4dHJKS5^YPh=;`8iBc0{PYeG|vwRN5w$*D#8N!p-?X)%;
zUlDXxniq@JPc5TRb7O7Rb21$%$E$p~tvX5=bZ0b5{qsv0jHk9dXxf_LwHv9Z+%{ud
z0Nma&4OLQC*X|8p9WDx+ouB>asL)(h*;-?%m{DhZ=iWVqt1H?@9FJ@*@V0BUrFwmA
z(Xy;end%RKW{sxACz~JWj?8$1_I7SqWMMo0qmGUa8fZV+Papi>vpbni5wO0GUn+)`
z@4B}PB-i(**d`lG;%(2(%?Sb!5mwOP$Yd<iG(W2i>te;29DSGf9PaMwig=UMBt9lF
z+jw$h4?LnMX75v-Ps1(vQ!9sAi-2!U`F$q=oUmB)&jL4KgC6We6ufiM-v#aA+si}B
z;G|SOp!hl_QNE+c%$J$nRt}`hbO10GD|1%ky1piQcGm*12{3I>R+)8o4R@Uji>k^_
zNS3FbIo<bA!4ecAnI&HAET;kj;ywJn)BxZYcCKBP0t=<yU^^LMfB}?6x>CQIC2y4Y
z4>`IvOInRQfQB1EbOE6?V=W0!3GBf%K8(`IpzJGp1UX3V?&uIoA*UAykv$>QNT~@B
z*3_a}6=|uYTlL~shl?EIZ5u$y7YE4dZlb^9ZF}%89T)(8oFf)-w+*9%`cKwA{;2Ib
zYf(M?Q=nK%8S*~1bZnok)v4X|GEmWZA2^?@Q(w_imO#+wyChM)9a?HC4#->~y$b@8
zb{HcWA$*jP2-9uo4ge{VjJCpb%4Y#XCK}+1C%x6Tt<+_#x7~b>_ss#TH|&VscuFoH
z5rJq2?hZr#a7n(qZa{-Qu}_tSudE^dSi_DWY#m<Xg{3l+Eht`>>P4XpdR`hRTh#%P
zh1-W1!?Gu#Uf@Qg`95pHTYveWW?$NPM*$fuh{aZi1z8WnUV?-5i#ML{nEd$K=3K{W
z&y~p@;Ms)i+_snRL)}F>4(iF^gX)0f)qt|Nibi{(_Cs<jD!MGB4gGhOd$s`G_OVay
z5}IXAh*w8iD;ugFiC8GG+XaU+O})$Z!64xAv8XI3N4m)9b4ze+R~9d{u8;Mvi(@bY
z)*6ixw=`Z$?Y^u?$~V2Re>@HR%Z>OobsqSZ8*}hla5~+QgLhP91r&O=9U#}tWlA|?
zcCS!pB6?(w!b2)SmLfzNU6`9I4-}GuLu6*q^;d?G^p7XChUGGg2vXODYA8SqQA0|$
zv3vP>b^mgNjvR-Wn9h!?6t$oW`OqgXicU63IFrNGd2u0N(qwj((&{!W?^7f@jNWAc
z6~WSVo^7v}uOfBQ5Ea$w1Ftx6gQv~`1FaiYT@?^qS&4QDkwPvrSB)%RuBv>|(5eY@
zl3{ipU`ZK4C|Iusj7AbI26Py4tH`vG4iG204O!RnGiy;zc&QB3w`DL7c>JBok*y<)
zS=y4CYLoZ;Zy)TEMy4?SHikGrgj>_X;Ka)K<W-s*K(8{O6~f57y!5Mtu{RZ_k*Xnl
zXn6|Y6XoG|0G~QBLKFTW0t=(eREzpR`s%vw*Rg09n2}vJjcl3E8bHcM@7Ht#alJV!
z<#9$pKAi#T9B0eww4M)LteQLqmD&0%2s;_o#pcd=j*Tp1>m5xR43QcMtEEd;_mK+L
zR#`rWFc!)5dJ5YkmabV#<f;l`*%ypOMz!l6;xmBwNg*aLT<Y&1(Z=Elo6MzgLEFkr
zIyH>uk`EnVDWH07q-&!cSU9Jn_tQ7&K8}%C!sGO4gvYV7XZI><56DW4SUgAGOrR)!
zYJjh)UDii>d#tT!+^Ncvuq;5!SyjQ29JZnLSxlrYzooFarhTXi5m;U9)Cg<R&ql`)
zA&#viu+Y?Onir%x`tZvrj`&tNa<PxjyvdH{Q~3T`b+a+bD|5~#Xx(~HMnWHjbQ!me
z@bFG^>7MCFXyjnkRmiK0D|idrj^(*~SFKt}(}l^IM0+dsrD)4n0SdXdvJQFc`uLy-
zY&r?Ly5v&afU)W^8~V5sJTzWyo%A%_gBL>s<##a1Fw;XG_=7k}-9nk>D=D{oo*qE=
zsVdKM;0#(6mOhdK<?lztHdJ+qn~6Ft-bDy6@20<A*D^p^OJJ#TpO1BoZzHN;IMC06
zA80f~Mk^z$ir`rmFPzKoWH;oYoXsQq#0Gmv77n7egu1Fz9S_xgF!zn<V2pGO;Hm|S
zwjSfbO4jylO&_j^f{QTTs+hvy3Wd*Jz=AjGAlJF&xuXMO4`{N@?R#7AbchXFXI;kX
zvz8*;>Zg!-DoNi)E8JCeAl4(&m}GKk1rMl>l!#|BJiZ1w+y!Bm1}b>=bwFSY58YKS
z9l&UBnbPOgKw$p}z6$h>B}<U=Oc4yi1${MFFS<E+ies&WyLx2XLIF#ix7o6*0kly_
zQ+#lj=g2!3el&fy%RAXQ4N*`f25t-pYh}X@O?!;lcljf}bBE9ehHxO8=4a}!@K|iO
zTO=L0XiW<UEYcZBN1<E^xAt?9_XEP510q&)J4BI<UAu_@<tkqC!aFf^`yim9p{u%Y
zT?ktmZ4mBQZj8Em(a*$Ut+p9d*rU?s+jGu__e}57OPQgr8m1${#IRLW`@Q-5cdZ;H
z=gaRQg~E%rcB$)!Q`fg@(sk4f7jzGYh1+0q&<q43e6*N;xd96HT=#AL8Q!C`4@2jv
zNh+vup&1Ux+PG&9cG;lo#l^*Tu!4dzAI@H+Lc(!X|FI=!@bHS=@-=?_s_$;Y_E&6q
zuJT&*@N(N%cs#Y?f#=)6@?lmmSV5IfL4h?xm%4MrT(f!@S$H0UmUiPo!GZrt!u7~H
zJ2Dvuk-J*xhvsOJ9lf^iKD>;Nn3H!Yp!|Ki=cI@+EZOVAm~@lI4Bhn`7=uCGH+6M_
z8`8z&hSg&Su5X4%GCmxrT00#dLdQ~D3u;>BnK@ohRqS`INeH*j<Ozq55d9SbdP%xy
zUbC;S8jMN$Lqcbsuyeg11G(F!u#CKgw$H{uG`hl<kt%6Ea<*R@7t9xnwX>d!T+P*b
z0|G^wu;^fH1mSgkw{_{wYmW(WRzZNRaq6MD`lUUe(j8g*=L)wFXzsB9c)7WP`T8f#
z_X-sY8uu&Ar+{KspNa>0QRdqf5OYi4QhBrFFiHA3ga+rGr<2H5XD?~vNWI%5TxR$A
zBy*KYYf+$PQQEu<nB-4)hUo<d3QGJ%ULSyZ6)Dd<hfOBH^<>2$UCvCL3nm+-?I)+u
z)q1bq1=g#jSpW7FP$tv%GY4825y3Q%&#g|1>D{B?UNq<50d*}xY1mG~Ue||bIQ1*}
zElpE74>`i*8o$*MIT=<4+pL}%EY!voEX8YQFMlmX3`B+UvC5G-%=aBW5YmlEF{fC<
zvm6Fl<j|5Bnn}aSgr(6j((%zYqe+`@?_TKJ6Mp$fDpi|M+N}AQQ0um#d5u1|%K2CD
zR?QGS*j=McKDS$lJ{HXu8rwEfs{=l>Ngks{we3(!-3l%91(dkk?JaLwz4g>cmz0{~
za`Rn4M;ob+lNcX#kRrEz6t)wITKOuIn#Yo8s6O7!vN&Xrfyo5UO`kz5dWkky6b|8L
z;+&uGM9ZE4-hMDteSqbC5hK3JmS5J6d~pVQ?ord3C@T2wxm6t<q<WWw8;s+Jjx12G
z_0#D_z%}Lj@sGgH<I>!?-W!BCcwm&<7J@cyS}W4`yk%d!c<uNxdap>T;}PUsC=IQx
zokL$w2skKIfTBH>7^n}BqOWPbZ2djevD<-{u9(=Po+y}%(QJ2qO}Fn_7Tgos)0<~6
z+97kYul|<;VprrNcC}j0c{94rBzM4f?EsOA1tC`x=MD3!;bcUdH17@GLuqxi<1HC=
z|FDK#lq)M#L-zeyONwn?TcNQYx&`k?ketuJ<nw_dg5Aqa@0}g}kLo{;)_RnA70Vx_
zuXtsgX38|V6w~t%Y8wR#z3$fZ%^w4QxdVuE(pZR%9bM-Zhd*2`)$1wODs3KpJgM^S
zV6*^v8hv2=G<0r)_+6GdZeNcr?{Eb4SqmBDJ#96hO@FF+`>}Xnm+WY2nx`Ad4NI}d
z>W!3`r>ygLulr$=o&m*62`$$MiAI_868f@@6m>wJwb-;P5Q&=TL}WR~`q==HJD2z>
zYr?^_@>K^Eozy|SilIU`bT|nUcot>$G1^(>dABDZZ0Kjq&F>AV_0)Q=CBM#~28HKg
zN0Sc?Gjvneo##)THgjL-O~qeWc<rcP4nv0(Sy1eFs2#pQ>`o>ecTd0LU8YiW@tgK3
z?z7y=UZ)T*mRlVy$*Jg<PVMs8mx<sVjY6zs(AdR0qwc`+UO!O^Ca?CJT0px}4|LQm
zm5#$qj-l9~mVT3-31cvshL#pTMdKrG`;*$P<9&gh0HsY~iaq_H)H=gRXp#AoMRXd~
zp3<hiePV4Mq5?Q)@79Pbrj$Q<^9wrzAkU7op`PBQedfcAn-*g)+MZ5g&Z3q)hx`B^
zN*sWR{F|JtBMEk8ea1oqp3oH%W8k2=2nwgXKy+Mg-E`?T!2_N~LeB$Rs*4sprA8}+
zr?0i1KPSvpN~A1%#CwH<E5DRGbn?pUpnOHVJJk0m37%NiHt}_cBy9Pt>ott7cS<cx
zJX_Ouac)?scI{4*Mkcw;*KLts>y`Q5$rBr|H|iKj-M%*0p*?RfF#nO1mG*p|x3TSI
z>JJi%d1`5br!@GF9`h!Cc6FL6Av%vHZzgQI8s^3yIIWMno_53EC3s-Bg#0F>8G7l3
zn?mzaXkFE});+c^F^N3fJinmVxMTSWNQZV6mq(RWS)}4sklnRr%clSLhfN3H`HO60
z7tS_Lr;tFpjFDny7(wdhg{!irCGgW<XhDH{V|IGB3?RgO_3_yuBTk|`P<!|2g?6<n
z)oWP}97}1i8OQibkE|#mIL|-cf%~c8q*CFRhH|g?`w6b7bymH2Wkb^xkCQ<yab3ca
z8b|B#jwVo5d+-sj5dKxRGu7&YKcRG^8_StR`RY)m`}lEyH=W0!mTJ+YhQk5{vS<ZB
zQIkWmoqR*Gl*(G-vBYp@KPWf(76e)Hu}&S1PC!#JPIM{XJr3WyS+Q@F6Rn~z<9{sG
zM!vH*jO9bM5V6x!4BtNI+W_=;#80kBl$I}3;Ndjk_68o}ZwLbpF}M6l5e$C?k5aVh
zHjYGgH;%;_+^4Cpaz;}`%H4?o$&g*PS-id)Cxwg6O_~Q3@*+7Z`QWV`<wfz7Elo6Y
zZy)zTTc#4uh410oYNB5W$j1CxeF;Ow9)2|mhY5lDq{AMw0s@yU$aX=sLxso(8>geM
zq!Xt@(&?M(DShogzDNs72EBm1hgU);5+i%pp2{1z@59biJ+Y9_nUbIFfp*Sf%d**R
z&YO!nepQ6*LAtj&uPmZ~t9t9&h`}RmpV6GqE6)fs7gk0vaVfV)C{oVKQb^bwPm_@W
znV-HM!W|ryEd?M8d6UtUc?`$HOAmiUlT^Ch*b%S!bHwGv?DL|hPTYvF+PxH?KeM7K
zBM<N+$Jg$^c=2M8N`dL?_!)ocQ)qgeen6mndKX*bc&Xtut;>Nbv24^18FQ(k5$E_D
z!I$p<@zUBJN9@8n5HT2RQm}J<I(v;cg%qdmdCCNvZxykx)GVkHFf=1LfqQKBAy};f
zw}RK(<!OL->5?qoWH!#Wla(J)a0eMApE`um=vg&8&J1b)x4J&Nn}*^RDfx~#;aNwY
zOK?WB>#00NaEo=HT@w@x?b1a6eSRA?&@1QzP+@ckFn-bU_<S<yGTTj$cklJ`%T_Pq
zZ`?S~$ho&aorJC0!}P#-1?PMsimUaCWH~7Dd^h-0o&O}|6=odhglIXv;d@z&gI?BU
zYNtR495%<!{ScjrMJnj!Yi^DLlTjuHz5?S`dR@8dkrKtPDO%h@-028b$$MB+{7d{O
zp+wt3PHt+ks?s`rF8ZG)C`?$FdHPEs*;zdwgLr1mfm2U91KIrov?cGKsgge&mG<mT
zxqi(qyNk`|{KXucyX=q@BbB&SDn~t=ia?_Pnq5vwpO;&*oy-GiG9xt|IcXh-Tf&L>
z?rrkpK)1InR%EWV4DhAfZ6@M&7L~6ZXTqBuZ%j7To%a``YE_`+lR?V8yFxvG^lHFp
ztC(q=lFokPwhR$uyK(1`iqX^+$l>>vC{m!AQYxc4Nj5_wwB1D98Z7V^g?ihv)7fPx
zbLbb+ZYX>^P9<W<CvqzaERXU$K6-__jS`6~*i@yto@jkztA>N<u1!Fgdr^q$@cjmr
z3)#7<N)ekh(E5->6qCx}wZq}~;e4dDroQ=pzzd}z8G3g&H=&2U#i3Ih2_u(c@=cr{
z!hHl^OzGa$X*2!=Ex2A-X#IfDcGhyJ<_*{4-Ghcib^Ri}`>?8BGn#~AebW4st)A1P
zyhslG#of!jhbnko<1zdP2=B@-YFvc}t9%ElnqM^tn`_>9Ar<FX*NmTBUkdDc!wPGe
zt|zs=e9szcY}xL7fpTuTo-JO_W9dzDAl`9Fg8%xZDx)Ie^@KxjquLo3l-!<l^ZJJy
z-l_U6y|SjJ@w$7HyW-_iwXWG+mzf#lTlM+Uh#p&I)_9cbmb;{dzPV<5cCD}St9`K`
z;WIil{QvLAy;oKrZ}EGUQ3}ZtSw@Q_Ue&AZQ~7UJjiRh+_l!^a(<ir#&nk}QDB%=;
zzC^O}<nZk0iHmnrdSrOH7+vuq_9jR!nN5&nesh%5y8=;pw0JRBI<l#XqGrL3k`9*?
zYVh<UF7I)QB<0p6W_IoQExG9@GisUEGxAN6Q8*7<BhKH6U^Jx69DYwt8D3PWBztp4
zK5SVUGQq}5K+^9W9eHl?6^g(w?oDiiymmKZ>BEBw9aeB0j0R7BUQlLJpNSZWP-P*(
zu~^y1!zd{{VU|q_>1(44Z<1%h9dOch)71DTjgL1=+{!&bQfnr4L7f0cZBxFpR9<Ey
zOuXYJY{cL$)Q=S-@VFV|OZ);Xs6FNvA{Uf>AsG@#N{f-bi!NGKYL@Mi1H|l6=SQH%
znd^p!-{?5(@aQoUrzou_NO+bVPuGUVa%{I?*rM%?&JxrJdy@<<Zp9W$L;b3zD9?|5
z43o?xe`-LoXXa0-I5l#DJUPlxz!7z%fLxuJ5@UJXCEQJrzD3Dj`{5GXTZdr7C89=)
zM?4^wI0U_VP<n6<j~LV3QA*U-KpBmEPhAq1J!JVbRp3;U#Y8io0QqNuE01#h%ldK!
zqh#kBs-Bzk%;ZvJH{{>re<K0Cg|6NrvwgNjvbUO*5qmRJ$<Xcbsf2EpF|s!MC|4Kl
zF#_Y}elww-;nUZe7+uFc8hyKcSn;y+ecwDyMv4>>V-&q!Tw<c9qL3oVEt~%G1MAUT
zH4tBk@`W{A$vL((N$rUc$xL#)=d)UR{^;Vh8Ah3<I3cxEhc-G4iQVR%ly6?9pUC{?
zBP4cJ(Z+fa1Dx4<qmhLK;Ubu(SC&yeAt@q!A9~M1GRle{vzQ_vV#Dk*=ij~gyq~sG
z_?0uooPQ<(QNiB2c)R<C<$b@>h5htN7E5aXodEae=h7Pqy6^{*WE3Y&$GT0W_mV{p
zlgfI{9#@HQ%$H8U%gARZC>?K&Ng5q)5pD)OCD<_Mwtcq$m56!zmC&Qvi9v4}Kf~e$
z#qosv5&||s)6xZ;5Mn4{BF*|^9)~G<QF3!}vg;4Xj1CiJI+go~jZ)<gJ~=#h%WF#w
zh!V8PH;v!t)2r4@G(QT`faf@6Yt@u?a*sb)v*pU$?2kIXTn{jeTZOO-(AlqAH<ucA
zKRj5EtYzKt_E}w>ioa<0y_nHCad(8e$AeWhO@2TB&Yj&=AMeG<-Hli!nZTs&R?jKU
z0W-Ib1UioAGlw!8p9z?EBHqc6pz#}1+PPI3SXGZC`}y0_B9nTp-wX>mHDu)sdb->x
zb?q;@?S4SUtiMt(SUJHxrHIlKt`s)5Rf>Sv-iUXd35;o~VD+r+d{m#sv81J~H`Ar7
zw_1O#sJV7wF2c|FUit|itlv1X=<O+V%UrtLclM$s<byZc9mf5_S%!;AC^y0}k)d^`
zbS-gjkj0zh-E%43U44C7$-yqi{0!uf*5^bnrZ${)_2rS>mC?m5?iphl<N263AC}m>
zXK5ORZ=;-;<CYedb$6H-mERls9rqzJdu|x?=Dp@GIL&U9w$$>H4|+a7?1|jK$nN5)
zsrRRZ>R)uFi#YT&dW~JI*E_s<nsxx!gtzD6fbg}GB8uiMS5ID^$+|E0jM}?O3fQU+
z+5C9DoP-}d@ondYy<a<xH9$S1)KpYnwCG&tA>+Z=g{CVTOQXLkWQf2zYbV6XJ`Uov
zx_BD~gq9*h2YmnEAKCXrdr}OjvOU@t_OJIuUfAdCX}++}-DKn{E|0gx%WRxW(3P$0
z6vYXv(|%!n)rO+UNMErE$K&yL@=lfjQd<F&bDw9!g}MbWBzPHw9OsO_$kH>)el!UE
zKAeM3navC2jD^>>=DUQt&k88p?6(>iWa0^xoRYOBTB5X$3Z-7#pu2QNw~}seX&aB4
zMf}WJqK{*9W>5m$JpXT}@O!hbZO-HSGSlOnKc^6v2E)fOBMK#mR?`3EPNWztlR46K
zm?=5pvb1;)Zv)3gSs}y}A^AuLNvY{S{2FI@31`}W^BKrZrBt+hOPuDbV7@wvvpAEJ
zq>KaAb~oLhtt89j6yYN4pJ~8=!0q5v-$E&K>A3^hjkA&pD&?)Lhxk0^VPvm~*iz;I
zd}ibMyEe+b>;c?x*3mqpr*l=|6#=bDK-zI4Fdq8CrjaCt+?VBhxmuZ}r`|jpH8sJu
zEmI>8=b<tV<S-C-G2mMeb5j}<MCHIlAj<h^ERM&cHXQwCHPWUJf_66fMp*-_;VJqY
zaXQkC2m{ZEfVodO)Fdhfi-Dwu3}sPe9mG*sJ(N>n)zRk$x%p(q<f4tJnGTeQWm!3a
za`EY=x>WVWONviUJ~`%L1d3aiV()d^v^^y9l(XL%q04D}zpwI83qVC~Y@G?f+<(jp
zSu10Ha<CH6PEreM$R{~nx_c6@Wze^?s7_zP4~hBWo?GvJ-Rd}|`;a|;?e&=ZU9q`V
zs>lAj?l(??q$$uh?aqG^`YICSZWV1LhkNjH%ac!Lq8URaRyB84wg=7RE<5TUc;mVx
zXF|`}n&>Sfdg+z48yE+K8a~-Q{GDcsvF<2l*&bO994&gu#!{PDTsr&>F5K;EyrHr0
zokz=z_{qe*+>5S=R|@sQ)?rZDZwkj4l}tm4!;TX-g~S%M#3Lz1S&wnmsYKfXfhEb4
zO~#krrtcR~A9D$aXyn#WkT|zS)(n}A!$rC~(9Hc37tH(ujZzc(U7l8;`|c=Q*KkIE
zvk8;4fwNMcgI8-`ptv{rp!)LF^asZGtK}Mdg|>MiArJa7dfQuf>}N=Pw}i~Q24o}}
z`Xf@p84qE+2CT{Rx_Fh2lD9uGdL6I0jTlDn4<SxNjp_Jx=AmNd4WTJ5O?IE!hol=_
zj?3%KDW!HfdnItT-H6V-UWkx%#(gS>IlP85pIqrJNL-xfY%1t`JV4Klhr7LB)<fvV
z;xMahgCixfm51qj3*B#5lmEUsmRg@4V|QsEr+2GXXi6C;x{ZOIghSQ>r=JD}QMy1T
z{#;~oMcfDd0KfdL;evZ4elKDmc(yDaLS|%>Xd>0>&H4X%O4z^u$}qjVScB6GxhZ0i
zRn{G-ZA;^q;p{=ca{s+KyHPr3w8uNw{?z%`B<EVx##n>PC&TlY3@8iXKvOH$Dg2`>
zd?xc{3=R&2N$J*&2P9V*86+a<FPGH1a0YEQW#6TcSP?*jN;p?^_Z||23p(^Qmt0`W
zYT)#JaiRB}L+tnFn5K*uBj!UuwkIOPiO*%!lnxEFQm^1WEC4$D{8v8%X`<rRC|3CD
zl1ZIae@<vm5At{ia@$DLR)Ljh5U5?ehM#(pLjuczpBgEMl-kiY6m7VX9;&2`<O5|S
zRzXRd7fpV-OudsJ)AxA_Iu9aga3ChieEam_3!ITwvL2$I5ZPE#G`r%{I&R(u&gZIc
zC?xpynN}8*WjSwmW{Hz*-VE=u0!4QUT-T>uu4nDubN0p0Dw+UwXE6!Bm;xYQh7s=;
zk|ofHBJdb+$UR7mWI0ulOEL?~zBFBZLDoiNn_x-<K-{V?+%0%bajC}c?n2(tsIC5T
zO4Hi{%Yo?`Sm=^o#QAGC+islMCUsX;&<54pvy;XvEUC|*aX#NhH;#_cE~UY3bUKg6
zRp{6w1reyL2#@7R*9j&Mow4hq1y@-E`pO0loMa3r^p_7eo%Fk1gBkQIlEITG1XW=f
z9xd(z8IgzEH<ZWORmb*>$MDjgWKHV0ZUpXx9uxaZPj?FS3?lX}PG?*YNUd%o4C0PU
zL=jJXrSSKrIwJk(%{LZv44|;ZA?QcQJ2C|49)Jp1#`YLDi&~kM?}G%92=CtEQ-_5N
z!d5v?4xV2;r0hrt<zD<2NUe6)z8;<6aDgq(YT|uqb<eE7G|#g1*_n>PxA$pmzbTTc
zH7P+=AWTnuB0ZUA>VYiYSHZi}kq-D!8NXEYOJx7Ww5ORQ6LzrKt;;y|7lH&<%~0n}
zm|G<u39x+52H2SjzZ+lo>}hopSKs%MV-@jt7{))2v_Q{cu5I5J#W4B1pTbR2Whhgn
znpQ<n%_!2j85BKwH>_#Fz1X62H-jzT(D>+@t$>CTp8rm8gJWKrOFzQc$KhMJP{Zd2
z${9N7d5X?&Ae#(d4Tb8bfs8Olclqg~@InX7lXJc;3Q`LCcfSWWL>%CZLQe53C8m-y
zmC?g<(gT*4PxIGhb_0lA+8S1z?{<^9Axp?hgT5eoTLqi#T!U8kodyEnOwWijqo$OQ
z#*xq62?G}r76SwpnkT|!N3kKBF=%_-RV#pJ!+2n}m&|N}ZVw(_PTQB`n!H`<n3m-$
z!$No0{zX_=*C7#9Vv3#3=i~r61hl%9p}bq64wUFt+HK@SvD-13jGlL$`SY%<xe>F*
z3^wv&AGhGFE{77qv$UGSj$=laQ^cxGMRc#|jCisms9wkll_Kd^_9p8GWaS2Y>-7RW
zkF!o%g;hF}?%e5c{_cT>rDa1ZHZL?1aNI*768jG;-&&29Ri~>PtC^g<w~<7CJ<xk4
z)R>x=?s>e<Q9xUiTzIt0oG<RWoJo2bkq>Xw$-krAUg3Gdd{Ds6rwmJM`WBjJaCfUw
zH-C~`=8)~S7@~)G2Hie%+iIx&qvTl@ao44sV&-e9n4>Y_S1%DKO2NzmnHdb;N_z*h
z^IgKr6p+jF1HmjcjpFE8c5%H_nPU4ggCedeSaH%_YR<9V5>A#04Shk;YY;PaBo7jn
zKxcc8dF;Bzk>~Y?X=5DopP#ZGSS2Nkzl*6aFl0r_GrP*3hBo>)!^ULSA3o3;tF*}(
zyZ@eV)e2df|297*<Lbk5I<1rqY6aSSygS6tHf=w(N-utUE^{tllb7M`CYO4eJEDe-
zzjS4-K0kDM>g`*DsFu2DlyHi}1;d&Z;@g=|nLn-7uC9a?6cp$}Yb{Dkt>vwGBq$U+
zzlYBahxPYISS@YRV2bTCRzbL>vPZ3TpiW0<sOBNJ#QSRd(E`HCH+av*!|UR;9-Mzi
z+m(!xE~+srFGUSy*K%D^gn6Ftctxj&pdu>{@TQ@8_@Zg6z@*LPL3+Zq`{CqjjFc8>
z7r%#3Q`guc`P`(q#B(R!uR$yxYuq|m8<OivtrxW4330orvze@^;cuzEB5bS1&>*<$
z@6EL3Osf+$QrwVSry09;kgHD)^SeM!GKF6%pKzxnD4>#w<XUgauFyn>E78O_YPBR_
zdU6>k&kZ3pHlzo`F?5_{TKE}iDOm<?OJw@K_tjZok>Y~iBi?>Z_&hgZ$p$5h>lJN$
z+3K0#a=rT<wd2()*WCZtd-WZVy@~IXoYG){ERJ6vKjkC$VVC-V@dY%aiqEq2of=_y
zVVu}eIW-4mFtO{Qf1odmI8&#Wa@CpbifP7I!rc<D?&st@b|Wa{M1`rAK+bB*%Tv2|
zsl*zGqX-BDEq%MXY4PsSy9%I6^c=f{TfG5n%_i;1*^>6Xi@td-i7NdfLiyor;i_jl
zKf<D%ROrpQpo)#}$xSkY86$(EVZ*6(cxs;D!uvciE~bE-4G%9QY4c9*foKoTcfoNA
zC{DAjd<-}y&RK4%GO~DmA80)nMIWtgU$y^%n02pNaaarQ#ooj$8Lo_K4Z%u++Dn8U
zTw^JqX_~|Pi(ncVJ~Z|E<$&@hQ}NHw6iRG>i@B+nm#t85Hbt~Ey~?bS$%6TvCR^qQ
zf^o`37$8d7vv>Pd$xaK#pLI0jTatsWu}Pp!;dWni*f*;8{eg3$8c8ExiC&t@zj8Xi
zI2U@BM2?kQ)j+U1lZ;w=9$g}-Ts7rHzu0H@{)8-yZfD1hHv|5Ee4TYvlyAT82M`cp
zKt(zg1wl%>K|ujYrMtU3hf+bLyBq0lsR2Qd?i?79t|5mSV$Q?6*Y7=R?|t60<{$Wj
z1#7sUd%kg9*T*!w(M>+B0W<8o3bv{D!qQXm@l1&|eJ!mNX}T)Wc~+AJWul;->W=PD
znk!GRy&i|lXH{-XR&XS$+C8|z4oTRvDpIl~Y74>Zkvo$Hp*S7p#q86addQIH=_9W4
zlV*u_q7}|`aR`Cvp{5T3R(Tv>l%!WSxYhK`f;~jUfriKokLmki?QfB&7sIui0=99R
z4}jF$B&TP~4T^MLaW`1AOHa4bqQym|1r@v4{;6hv%?pkb#sPW+_!cn}q{>lPO3>6m
zF%2)=-;eMkqaEhTONN1w%(dCXS2*5UBYDUD_5#1}KR(Y099WYF=KduZttWq$lmY|&
zB>UbE4c`ym{gk>p#d~#KGG)_NTJdv=Ghgu<_DWX%Xq`k2j$heYOtFKnQE~Lz6!<rM
z?>7y0yr6U2)g(sa()q36j|`T<f&#@l`}K;oMsv==FMhzOvYu?FJJE#iC5bj=?zr0x
z+>^VW^I$4;+pYbf&&#GVq@|k?Pt+$Nz8_KZ{QRW1>^!leLiA`Yq@Gty{Pb%eEh->0
z$H6?OGTTJvNTkM0GwCmvQ8w<?717sH%n600K)>x8lEA-anT}xpK|ZMIHc>OYI*T_5
zK`W0m{BF^xn=;0Vq!LBGF>HF174N{Tud!nCgYDI;5s%oIqtAi*w>=8U+kta5=3;w-
z!&<nAzw0YxT217U$23$f)4F&Y@H&jyE?HMkIz<ft5prO(h-p)JP5XqDl;Ge`tu8+P
z36-f*fY-@wpj(#fmp?D$$uUQ-g8oc^Cn843-e9#9=imBX5`Cp5pG{&jc;ro~k#20n
zwiiP3s!h-ZdY0%51?Z90EZUXYt)9gp#Gc=09At!FC8rth^Elk{!*dT3m1!ynz*i%E
zbZM7SCfP)4aV{4z)*usM?#<5b*@N!?xS;8<qSwW`rj2mZGJH|xt}VNy7|`3HO+Ni&
zjeqhbwUs9eUXqYmHm=G2+CRiq@3_B>u9Pcvyd`=H%I8}*cp}+`ObWB9O8cz$C>9^b
zn{$@|ox(ZlA_!!9=Ta<mt|%r1mGfQ+Yl?SiHq9|`D+IqDMeln+Rft59(PxSztf7JW
zT#|CY59)LK*gpw-tywJ{NnN~(`}qji4CGKmbjpA+80t((rxSJ1zsR>z#^~V66)&w|
z4dto8V*Duf16|MRbl6KA?=$=}B#^bK99XUPU^a6^aFg09!Ie$RBS=&15q<bO5uiwI
z9i;!zQKsBua)BS~iu@*opQw3X@i95q^Um+mRFXWxg1tV#wsW`jF5dLPUj3kyB3&R4
zmB5wUZ&d&7bM99dyW{5Bo8AfEV?tAmV=_(869-$ixkh_sxswQxJkie)gT@e?6h16b
zjIAj^Emx9nuUy$Q5)|6-r%dCU3fJg>1x_O%4J-nZ&asljFlsLbQ@HCh_LQ7huxf)$
zuJ0R9flacLMuw6!yTRa`d9?-u&HOG24jA{ZR)Es-z_vBz+n$CX^(@Tk?fqmQ0G}+_
zpw1JcT;9M1D(I3R>T%=zJRz-1jEkW-#ax)4n{wO9I$|8Peth`>2k5%Ds2tx0vH@H0
zrk<eIY|*!CR?K_$X#z(pz{<IyoVz`Q5ZIqf5EB;CWQ*Keo(gwC25Phz>0{AU<?rNi
z_Hdb`nr0`-yMJ<^=12qP8&gaf%lcd&YFl_#0l$N<7l2A7P~n@mDpAq8A8os#s~c>`
zd)JT0oZI%OA@zJ~2o$fq0CAWWILCa!x1a=2-=a!{0ED$03aI?I=q}a>>$Jouo|28g
z*?|nfydhb#Q4&QE1;CU&d(R<T;&rl7A{|BRO%Sl3Ejg_;$}IiygiMh1>k!?iZT7MZ
z*m~@FP1`fSLFU)&=X-N1N%$wGVsEhjnqGA$_uhODSJ5|tPXY0Bb|h+kgbck6**}?Q
zPUOkAtX4C&N5(1(g+AgJ(k}B*r3XFU{J&RTri=5f(}*~dxGDJ3#5kLSh5ch4s6e~k
zsyKCQ+jEfqslv4MwESc0HvyLyUp6NJjas2z^Z8am#m}9`E}y~?Gz9apqO|+5fqsLF
zc`woKFMm7;{dx<(B4#o{)C>^rj2qRT?Ai@UaO{%x)D<#nloB0FY+N5Y2o;Ix5f5I~
zjYxo79NOkJV?29nc&Br<7}V-1+?EcWQEbt9xx}G1!?hV*&gNRJ7*2nIu}fr4vh@;B
z>xg>!lhe>ZztPMOdXDnkZS7>gGk>l3cgrUQwlmi^4(TXKQ&pLu^P4l+u^?o|Ne6Jz
zQ(5vN8}YK2lT5B|EL+K{`3aMX->1uG&V-S$Ot_T}<7KExAX2LdE?1lC`cYp!N4pMW
z;^%XgN*33FnmkZTX%hC>FVf~&a+inkVcq=R1gl;>#JVBtmOyuN*UF2zn2kKTRVCkg
zZNCb^XR7}D{LR%pp>&~BAU8TWu1QnecEwaDefX=JI`h5QnFB|G&L;=U0+$b&HvZCl
zs5t1zdXla^aF92yufLfZNLzSK<9pc2i1$o}v+$H+z|Qjsr4u(5Pb5AjC}4m1(fV*C
ziePYP7ME6IVEZ}v&p~CY=IL%r#)tu4#=`4ux`Uz=gTa%z)dG!5+MV!;NEKn^LE2hk
zDE3Cc0fbYnjo+)JB*!cCNxsw3S4p)Q_KY9(KlOD~%iur|wsmJ?m}+0}yb9-Xj??P<
z9Sun()e!1<-&EFx*V4%%>q|R}=VApvE$#dtG@jAS7p>ybm3J9e@NL{eOX_#OtF9M(
z$TG<9bRG@7Dybd5FV+@)BQRl={nRFa4^)zy+ue$@ZaJ3wQ*5#1X;R<%;(xre>9Z({
zfR9x>oa`hz7R{7x&>F=zTAb*$rj^uFJc$vrPUB;Mc~aWBMeyN;`g^y%>fV|p32qW)
zMjcSwz2i9vi<C!rJil^9B$PlfOjX=!jASlb@_<YP#wd0)OB~T=G4km|ubU9an-Htx
zk%UtB<3V-T>uc|+9LWo(iDHQl-()cDLu2NAXTO~gJmkR2KE}>YGMoiA<}Zy0)w)Ye
zBN6X}dp3fDf-p^`@vGq_fFo(grbWN6`3sSv(TFGwXkmKI7iZ>`=7-Vh5#mKhnwr3~
z$IsK*1H=?lA4^2JUju~CSuJq6@L_U=SlqK0VVs~gTMp`dU>*rHHHwpsj}6%{knT<N
z%7S7Kaw;6rxTAvCZ^&6gcL9&?UKa>i1O7!PaR@|Pc9~^o!<`oKAIP!l1pb{J$FU%8
zsS&G4T~tXCn5XP`OImkl)GMygBc{g&{c&jei{pMaweAW+lB?Y1(gMTT_oDAoUb|zB
zb{d~A0aqz~Q#n(B-3#T+RbhblK@z!c-pRd*1d&^evbM+((<_0tF6U$#<tvVyyzUz6
zQvy5cW{_j1+3)WpI1e*lfkan&q-`e=MJP`5L2@irMjRlkV^|}a;%=NdP-iuPG$&kR
zwyl*?_WQi2?6Ko~w`O5L&xMzgkEA{{#KU}u!AF!I3(PgA&=&aFBkQ#mG=Buf=yD=*
zqk4Ksg<@oVB%%1xcpWF8Fd+9-8-{CVz4BVb(!@&WBt*4&07oKfP#*}+_b!uys%UB!
zaXPF-h$IXDrTO-*VWbLdu{Xn)*FWNCmX+}e)K<3nhKfqS4i<hjY}mWGpMgV}inHfN
zjJGe<@=J7(jyS;YG}Rc>Y^sRQZd>Mks>ktyPO4`lo}o9}Aq&|EDQG&)Ua@t6-)dfJ
z(e=i`Dsq}VuV?~el;PK|J$d;XQ@{nQJ`>ftkY9}eA@Kr)W{TN#tc&#RK6<q4{%F_F
z)Ddm8nUc9dG<Q>iI0qSSwR1_y?D>Rb&Y#f$Z=?6hPGpH(OSkY~<-T^|76>Cl3W7O$
z@F8S(L7+}>2#;#wN{RS}Fuv&IkG056A%6A&yu4JqUdZXWHAcD7>CTkiZYbIroW1GU
zC2zc{vBaTZyR$EwrWGV{W@I!`Te%qj^h&+GBB#CH*5oH#X0+U<5ScqTKEtwe{``<+
zdoInTCS0i0kRW?0N#cYXkH<l-eNP;6@K(6EY+vWOetFFUDiRrc@2}#M3G&!!ac>Ag
z&r)A@HUkKc+E@u>6%0sI%?q;TFQYO7i&@)+F?3Sm^6kHut-wHbKmNi0)+H5$GJ(9<
z_a^KmoALD;hgt7H3wJI3{09H-bg$xKzxV20Br4@Cow06QGVqEaB7j<{{A@<-<Emcv
ztPSaL)ja(i^}Nap(UR#Z=cf1mW(_M!<cB(G#e>ra(WpbY;g2nd=C~sjh2`^2eNTm<
z<P`6a1t-bKPrWog@puDdL{a|VcV>;-!90zHU~C2}hLvx-`-i7aZ!*v4d_3I7E<+D6
z-s}$#TV?0ifDZUQM~pgK-k*z%a0svgt2TlE@ZymIU%$jaYTi=_fn;_*H6+4mnoe|;
zICD?7-QQ&h$Q*bY_}tLW?99`>aY$7n#TEl;*o+Z?|18DT45j%HSA~On5m;cBCbH?U
zT#o$(glftYg-oPB%rtemB?fU=u&Dc4yFjV3)0D!5S7Hfbw&=&RVMGr>`~{Ce4R@i`
z2=L#O-@Gq%S)w2R0+ti2B3Rw{>I_xCH?Sm#KoqVKQLGQm>2W&}_{nA5tq`HN&KTLa
z(bR5_gQDafUze~+-acQZ>+s{Whus;^hUy4?@Zen#J`hU4>O-_XIXR+-%0U$beY3WK
zzfg#Y@k=Qg_$Adx*$QcV?S>$FIshs>uZUUpB0ztKgcjq0|Mrh0-=jZ%6oiHa*tMiz
z0z**2x1dkBVa-prrO%i_)W9K?`^@#1&W^g!j5AxU$H-vd48M`Ss(=QEP77mnqXFYi
zRapc~+eXhyuKMrrbhTh^hFO5BQEcD5&A6I$rPlBbb9CUA;1;2vDew`4z=ze)?>&w2
z8#u)%VT&sUvLP}D4M>_$<Cum|MgreqhQ_cf3UuHaA~ihsU8R1SPxtmvUni4fc3Id2
z{QxsDO9Uxq_mKtAN@z{$+)qwzaox_XTsJ5H-U6o{3IjmVBY%tV`;^EOx7$pqv5M?_
zsnoE_GTQ{W;L6p4+5_i)b-6y_&niZtf&cBL=Nb8~klRlF=A*51CoW>XVqj1UvF`r%
zNc)`t#uku%Jx;J`*?6a0Z6KPre9TKEZ*d#_!Nb{>FpUmZbfzzkDNQAz$_g~N3yRH#
zc55;yrN<(OZ!oivPo7lTk*WEez3Oey#n^hpe=fV#8-p{b3iPv2)vkvZt+Lx~I&e1s
zX8Mb(gKqlO-g&D?w78e^Ml04ht$Mv~iX74v>q1|9BzhmM^Sj1lozE*|cnn)nNM`}t
zF8OlMsATgam2)=@BK~b#;7*_6O>Sk*1Ed<w?r$Tsb*yWW;=)|~rnNJiq=FQDFX!2I
zzB|?1rl&lQW)INETn~xVFPz(piL4X9Y|xfaQKr?ukPNh*%8g-RI=o4__iLoyHRq|*
z;5&sa)szC1X#B3|c&N_I1or6p_M(d2OJ+4g`QSa7vOjD()9qB#yaBWwqc3zYkZnF^
z$~3|#ty(umliNP;sG_~w`a0J*KQv;j&1En?_j9GT0?1oC$?%Q$aa$T<xBp%M?cOn2
zRwL2tVgHzJp)8K8EX)A?iax_kqQ@9z7KSw7=g;n3)Lw&{_=z^+j?0%k71f!MZtP`{
zKu6GljHglu<;&^*>W!eG-<nXY6ioceq+`+cnb|VrUXM9&lYL8C$`FjW!yOpi*Z_=L
z(^5P04NM92wVXrINWsvk8A$o83N0#u_<6<dx+0O1%6<Oo^mkII!jqY(>-rr9`J<Ev
zs8^gV90u)gaj}(Y4bd3FXL<GA&Zh?>x00vEq3$+gB|n?5&US}{n0hWhHb$sX6-RwW
zZq4b1z$!dE>SOut4JHc?aE>#;g%6q(>*3xtFRuMxU%lcrGDf5#fJQIpY|)2^2F;I8
zHj%nx;T^X;I^mZ?Sm+Er-49VE3Y$uL63LJMbO<im@>GaTm}rZx-+ja{{c>U|;F>W#
zl=KiHxD`Jyzw#%+pia1Tvue3T^4$J%F}v4FaN<9fZ`n_+v)M6_7Xr#mZ^KBk&5rKd
zk_n4O;+wax0hETB%XgW0--uHP0!1PWFg0;e>mtOv%_A8B>x`@zs=oGsU8-0^S9h<r
z3;cR4jdL^8$3C{jt{RA{ut9g%SqX3ZU}C0R+(*W(g-FQu(0Ca?&Hf?XK?VqMPWMa)
z0TCV5xd9qA(?d&EH|ntPO>1H^IPDHum=}dNPbANL?>nE-w&drK*8Eq+NTXijQ(rva
zoiRoX;cwE?hpE@1fX7C5fBabqVU;*4z;K1(A&<_kbFUZ99k?bmNy3~F?#iwiHR}KF
z-MdfG(Cc*$#(nM)k%=baSM}9NW`VdO((|5%3)`zPcp>=noW={5V`H0)4qJIKN75ap
z+fTgMc1a+P$M*^LPoj7}k|OahMA6qLVjh@KO8&K{G@)q)whZoi&kOY9=+<VYJ(^Jj
zEVvlH5T}VA+EoQH$u*^oFo|JCYK$!fa@~iHi%n0VpF#l2%CV_t6LIqVm!uJD`+MzY
zTMRi)OzK7k3+`EO4OO$QfMEYsHFfpW!=_|mj|%CqeKFzuK;(tA#QQ9tSuli$*GOQm
z=wqG;689nUqzJt*tV~-Gb=YfU*xwL#?UZ3CPEB}Z9B%BBTo?FY`n_dd*hq%NO%K>B
z7J~B&W+DU#bd)-*h)K!r-Q%@CJV{%+?pb|}>ogIHDdvH4wEblwvh0}?CjV6v-U_HB
z=XDzG_4>1G4jxdV#|j<wEnTuX+JV`jU0~O^w2gr#Fnsd-`^ZkQ;nC#+<WXoEaP`ux
zDgoFL6?Gvsi8U6Kvrbg0)0OGm`*E-LWnkkc{HR|7k|0WVF2+Dod4Eda{@r1*Gv~g1
zb5(6NS7X+bp%`~4XmPa%iP7X2@en|5<tflf6CirX0;?7L*xQhwAPQv>J$m|%P)Z(-
zL=)NB|JsiK91MX(I4=0-Wo_QZEACabF%F?gIrP)lm<FGfTvIbnEg*pgk6_A4br#^!
z%!)A0Uw8EV;8|_u&JSPka-=NUr0lo~xi<3cxW<FvY?OEsb?FkhG|{P-O+&r)^W*2P
zayUOmjz^f$zE<`zOY3h_SSQi<diUd2O;z3NLQOq}(D~ZOY8-Ya!5M>kz|k*DFX%3J
zxfvtB_b-bKr=iP_P5@C3YWy#f&et>u7%TvSrw7EnfMf8{_6#AF>xeg7p%8WkarFEv
z7M8Q%+u}dM+tUlT=IkYU(94;H{<2knA8&+EcN2d<=IYO__S1r4yMpZmR=J~|d0uQQ
zI@h-1XMa6Z)=3Sh-}u#5e+K4{TQsO%mt~8`$X2fEEBCR-4jW}&D2tF+i%oq^<=T2{
z37^tTpeJOk$5W;C?{>p=J|5v@rG;Anqe(G-;UU+9Bz6v-?eZn%)Hne|omTGxG`kYe
z)tqM&jo+}G%3hN0pEuD(X&>}^=s!faODi4T4J9E$CSU(cRKww8o1PSA(C%tlnY7#{
zx+mR@6FApV`+FWY26L+#b|&=&&%9ke+g%jbP+aP*@j_Ka$FB4qVVvUDag`tAyWtT;
zJ?A#Z4yDtvHqP|M_#>eggI{une#yQ$B($hJc?#ab-Nk%!&@CIY*0=IQV~NXTZ`a|)
zW=34wO+`pJ^xYDhk&PYP@kF%8ZXU@2v2W5kzHxTg*Qno3m8Jcp>3cC&$aq`oa1qz&
zt$?6>i3>r^X+&i8(V?JPL#f<LR}-SEt=LO`z3>QGs^Zoq1D_VWt6SV#-oVh2R^tUm
zk&_y{UNS1acuy7a8=@u3lfFWIp1;xlz=l7?5@Z8kAo^jlaRPH<yflYyp}o>8OE0kt
z5%Pd+{r~+63@*a(i|T1+ZU4HG_Od-<g^Ia7!T3hmPcovm0)GENE_O&Oe)4+f6Hv}?
ze7l}YN!@QDq>3w2#FXk>G`O!v`vYP{8N+kZ2b4hGynvCJSS0-KBk7+2nQuSUEjA!4
zb-NiDl%+nUI3Ike5Fp_OY~E8Yg4jR3Rxlrsh^ouaw0xv53Rn(zfGmocvc5ksfVx>;
zD}}%Epm*|Ye-UQ-XfPF!ck`W(GVB+xyy66Le-;*@x35Z&!@ws>PJU{*__V5BtcR3U
z!EoLWh&tf$A)57g9*4Zs1$68If^lp<v}zg9aFeaK0ANram4}+jL_%BiLlsH^f&k@M
z!)lstEkcY-ii;s+3ge3z9<agjNw<*5=Eo-0xgYruXM%Z$Vm9guxt)jTx^2?$q-mCF
z69LTjPcV#lYad}myD5vb0C*@}z%sA2^jYElwnT^bm)!<CnDv?aB$)^mX%)vK%}9p{
zb9poX(U>#}p(*GJRG<!*Ye6)mJqt*|#PW`ppc}=P3Vu<QZ7#y(nBmTFn2aguP-{Mf
z6uqr6%9d^tunH>w-ckJRJ@--2-z<q=-}x|@b>-f)7?Qfo78;Kw7$J5!al9`ib;JRL
zpWDN=K&7yNcjQ>23#0tGkX$0eH!vJxvM4%R2k!mx<t^bO&~1lpSYCOjJrqdsAS_X6
zQ3@RHh!uC)kY6RbA%!$eux=Xo9(~1(6I+o=``Y&mhPi?*$%Vl>CpdX;RRqPX^RRIe
zqXh^X%KOguY}+r9PpP_opKi<}H*(%Ph$&TOi))#3{a#${ld6osMVj?@S5mM-qOu<R
z750}emFvcsWuqDwoWpX7dU`6Ul?+3<9^Y4MNs5o(64P&R$`>^30Ab(sTYQ<Iy9+j$
zXg7tuHT^@JJTq$WW|R=XDQEX$*10jqPEj=f)*S!9X(0=33MRbdp$@n3e7^<l@Qd<3
zzniJizZ7=uh%Hgb$#l*#;#SGKu7Rv*JtWsTkFr!5Ef=W=nSd3!zQs1()$Gw4bryaV
zqcp(y7&i7roqOdk&tp_kMargfB#P^9f?G?YF}8sVrZiQ2DnTWoyTv`$Fh)C?1&l{-
zHohbX+$pST&9Zx41~=vybmJWt4aF@7wno;j2~W%iv$QxXJ7t*~9J7GRbLg0T5s-N1
zkL#%lCs|?Ztx}vYi|$3<v8vBjbxisvxH!*7gB9+^RXcH_9rKE5TRd{&06Y*-n<z9D
z9oH7Bx=h3=3dxR$Tg3%cWKk2Et7?WzCyN`21RByt2(qu_kZCWDh+QmyZqAB!328bY
z5PE&S$ula!YsfLPoat}L-xMqxCe=-;S0Oi7YB7VOJulS&&Xc<0OZB4KgB|yN4IAhm
zI+8g_u`p1pH6NK#@8S@Z2G15lT@`nQNU(0WjK9;MFP2ozyb>Z0R>Fo=TM*j9g|KM?
zWT<!jJ3F{;-llCA?eRE^2V*8JIsDD(?wAxV1^SHfbl9JT3(x+#z&QJ0qP)0ywbi{O
z+m3<8d^mQ<dQ#;Dqc6lbTe={#wI;?-!}5dtZ@{j~XQSq{>)lL%Z2Jao$~M7OYjUn<
z(N7W}0hJ*UFeW%;!YtbXUPsZ!ai#Rb<VWMd=y0#`;8{axyIm)Lm@4?xL4k@thqsW%
znEME3wM@HR<+#M6!1+${c(KwM+UwQl;hnCSj0cPnp8|HFA=w%qg|xUh&pny7KADCz
zNYptTOvN`l&3tfFvC!(}vZ|E15UO%f#fS0cTHr=5^V1I+%-gl=1$}({Lt4wP9wPcm
zzl8{=n^o}aY^M)i9)`G4v>wa{P5gF@P1a>H7T2`t3H_#tjy-_vWh!x#5g=z41hmyO
zRCjIlAyY3(43-eisp~)m|C;p(c-M6h?XY3lBZmde0{d34@CMw~tB4u>OrW$_0hF`K
z2TGYG8Rsw$CAZF>g%p+k8HcT@+!lfDK%`6FWONpt*+MSh>A8tDf{UN7b?y`~5QQG^
zFQntd^3c!N#!-KLCkCYoGv#V8+dYCSa;y@xfc}$846Ka>^Ue^gIKF6WfV8N4L!y=T
z&ElXm{jN1PnV&2`-T{M-&n?-1<Ls|<+2c{dNI~Az<<?lM80<0G?*nM7L106Z_<YQM
znGOaC@v~eW37ziXk~n%CZ}7Lc?MISr`g@7)$CP0wn)eTu#4lI5N&6m&$u|ue;a`Jv
zvE&(l<76qO^2lO*>%nw<)gcs34<fxX;U<t!+Ut7|pw9e<=`*$wM`zx6R%;?1SJi9G
z00Es`5b`h$!5vL!V44al1U`&f##y#gchzD)n_(P^1XQqsxUtHp7>i~IjE4dHRn#qL
z4D-+$A0aco%mvFlII4bP7o_=Vj-~Hj5nTrl)t6Uq+ClSj(Jr5!|9YmFO6PxF4VQnO
z%birT1h|cOKugV-qmt;>pH@+#XNQ47fX(L5#ok=)=|%`WNRZ4H*yW%YD3@xP1IKNd
z6z2Hvoie|n_om3Kr1&#@UPJViCUSt$-O`<q_sHl8l>)8zR*tgx9!TQFwehn61r`~}
zpyD|?`F;L5Ma(TDi_N5)zpKyZnO;|w{_P5>b&F-b67-=?%+?|NHbj~s>@nTAy+xiz
z`cMg|_yrzd9zJ)7=8T-i?hiB>sm8zw8d3v|*JRtTNPbApjsj__VLJUV*dn9*^-<ad
zFI$?@UEi#^sVBtRZ+{!K^@!0veJ+wihUyeA&Ct{*@f6o@t>@Q&-H5B<r637I25rs7
z&+VM=AD;-Z^DZ;Nj#x<U>o%C#E_aweW=@VeelHBV34Ng_WO2O*3B<Aol1fT|3?ds{
zV9-m@R@|XE`gK7W<OAvr1siye&4~EpVU8AZ`^)@j5de7)`ajpqyjstHYg->Z5_&Uh
zHwZ5yR`ZKwm|Eb`0fwKrhn7I7*@H9^&9#d`_aYPLRl5ZboXD9JKxwLgMIM(A+;(``
zCrZQ;O3B`jZ<wZtue=uwGCziqK`K`%+`1C#v}z@LoIZeV{)W&={j`;$U#1lG*R3!4
z##c&~BH#i432k<rof9)WY``AP6Puc5ZmnFyl0aX4i!8CZ>d_{GLh7X0blT>&?vX|5
z&3$y+k9JHVRM}K7#=Wf`)073>e9vXGo(iUPw#gT2$Teu`!4Zf8O|7~9ZUS3R30=s_
zK(I$m6bKI>5mb4ROnlLfnYFL)1{{0v2tFMTd0XqNvzB|F8OJpz0rxyb^*|6++7?%q
z?9;%>G~egnpgxW4C2|&M#={~WE*HtH)cc)~QXZNBF>bq_(;F4sQ4{V3AXaA*Nc^*&
zMk9vmM3O=(0RL_Q|0V1>-kD3Z%T;zgC(M5o(hfq(;M)-%@M;=7@Fwd)k@4Z1*yU6_
zCj+7Il%Vp4M_xh$8AS&zuCtY@2l}GUpT4Y%KPeGkx=M~LwQHH)8HQaSta8PS`TI$g
z=SF-S(&ke+hkM1jK4@d-s8ps?$|!*QoiiXTd@#{b`3fM`EQpwjD0*cV)qrP*63Xg0
zz1lk!-=nq`0zrzb(<N~zWw3L5Q#t&T{?N}09re@Q3Re4KQS2cF^#0>m^_qt#`rv%n
z*CuAk#$OfW{Sq8Tb+P`o>S2&UyA&7A_)%dhh8Sx(Ag>;(Dpbr86LoxZez6)g6TbHN
zW$;A@GUB(*ea%7XaPpkWBV1C_fVM}_ds&^}j;E}&SdOtDl4FR&qYQsEybEHk){G)@
z`_y3%PPCDE7(jalVh-eu3xrgC27S8$Ha3>#TVEp3bYW{i)vJK1kHL9QnYqIh@Xa;g
zfN`o}^dbQ|hPjPy_p+ZN0VvESd5=Lpq2u^yj--M<kh5p0>3aQBZsDD%LApQy&z|>C
zhgs8)`NhX-xB}va`(}=*;2?AHIkC_5j?a&Y0xVVGmw7_~ptkT|mPp;Wk$|kHv&wdz
z#h_VTdVZ>9FN|v(A9I}=45V|{y-Y|v=o^^6V!;&?4friTg50F>I$qA!1vE1ceBm_w
zf&&xNJh6)bp_25yWoNiyO0$p#t7l@IzN=j+PmocoJrNU#6pEj~#5`2YY@sRAIJ@zt
z-)BF{5ZBxg&(_=@l*QmMs624C^{V<2KI@)Q&}JA|{5X$lha07ie9`KKMQ>Rp1Pc<w
zwF84}bwIjp07n)XO#O50zEx10{<KAa!nhHpB;{-wW{+MSz7FW{-fE&KJjZv|^mm%V
zL&9|_ae}J+GC(&HVWo12D<O)4^yL%!+~4upoi0Bu#t>MSd;qGO)eHig=e>^@S3EPv
zK~h<IJSMlw8pNbA;g)!KC6-ByIsxY9{rRW7J&)trXad=lmw@p~HOPl6k3um&nkoI>
zZ(K(d5RBsRtAl7oYOzaNFTi<Q=IA*HQo{H3b>i+<u=TpH;ccMBt6kz9u}roeV|X}D
zc7tic#^D=tz}QG*5KWfO8n_9D%mv-j-iY-OC;q#D%)tUND)U!)DLvSsLowQZk3}%R
z?nD5OlWzcHWii0&(=?aPS{uy+u+;v*(aPk801{D5`?ZU}2r)yR_-C8@Rnk;D^Sl(<
zzmL8Qg{k~&?VsV!eqv{Ea{b`UozCX!x9CPOIn!DbuFoXJWYVjOreC(kL6DN;E~S#6
z%vf8WXPH#KzPsL?shsh`rwrkQ8{M)h(Z5Xws>E+yp@7_TGT>$ykb4>tbnwa}Ma3y`
zPzg3gW1sc-(*wl}K;C$M(Btp;YD)-ii?9TzFH?e`JR(6)f46bG-sg|VCpkcngywVs
zES8&#vnt~scIZDOG-?Ozp>BoZVtOU!9EzMs=X)I2ITH2OF|BWmJ8On^nwjKg(@>{J
zc9TxHllINLgwxm^r{}FTAKA3FIb?ukR-<LfWM187qgL%ku&kL5##T<d+b(|*$=A|4
z#uhh3ZnOJ#{)f;$azkI4B{A5Tu!RjI0$NgHeTvBajcS*T>nWkA9>v8Y-^Un_img#t
zx9&R+^*B{W>NiQE=i^*+f0=D2;sj)t7+2Evx%BUi;}g~!+dz9OM15RCb)!uDFS&ZJ
z_bV^I3vt0~&koPAV=@`28(a4HA63i=&k-O&1tECT)0YtDL857EiF<+dXT>UoJ6VVs
zbNgPQbpTXt(;65G;L|i$?+fQtv}0}k<OFP@5E>hC&)%3I=eJ6pNyYem*a5dx^WTt%
zc}iC`VG%C9*L$4xyX?ZKJwWsFHB8MY2YpY$-3H#8B6QIKab4m(3G=dE;SS~fe5b7?
z4kj>mkll!n63dx@JvP~F^QV1x!wnWl%!X!NO<~qMjy<lo?BnW6AAt)^kUI`UKv#9N
zHCQ$H7lqWPMy+^R4^K|=&>A#NXo=eW-}bgbAW@rNDNeir?LkUJ2~I|$IqgB4W4$C5
zx;kl#Ldgb`j2ji{IREKInTg|92SNp(zub|ItZu6DJTk_v(giTi+gmFcl4Q>s%_5Kf
z(%RMv=#zHXa4KNsr$#P+76*lW{rZ(sW~Nl5(lv-eTun_a)s8xw1~dSQjWFJj)~}w+
z0eB(YS26`A#8x<Dpn>5maRaPd48~a2VhSl@m`%e7C_p<PvC|g30VG*1Of+uOzce8@
zG;Z(~>8ga@Y6rd`%~lk_!sBXK1r2cT;EPEB4f{whm-W@q8SMx*6~|%qeF<$}%TDPe
zS8VS$DS)b)m!86GXZAJ9#G%<K<Z^&d;R}{0p_?}#wpX-qQP8B_2@~ZLU%t%Ix0pZA
z;gEphRdLOhkk_T#&w-vxXWi>T64D55`QaIMbG{M9iKZRF2vEpRDF$gq`q5ee9%Yq6
zimBkyjVg@$r&O$M<W#wQZL^neyaj$>AnpbD)Dg{*J)<M|BjuIb&#{Vg#q|rLb-qA>
zYABg))eQQLZd-C@t8%P;SzKnVm=m;Rvic4{%Ho7QMbEaLF1U=OM11_#1wZ@^Q7=(&
zN*CLq*#Yf*0+LvfCx4`%)JhGEe4g32dF-Yr+ph6&VvB}V{7vi*$2!?TtI^ErNAx9n
z(@9ReidpH~P5sS5p$Z?0{I@1v7Y4NNfg{KL8!qFW)^>#^EV3$nO&>cfTuL%pt^eYf
zCqd!cQU@Kjmat!y+4cu2XcTQ0L6Z$Ike@HL<GUdi-@e0s3W6u4!PyYGPEj-`-zp{J
zd`}d%1T<E2{$qh92*TB*y~7OK)nIJPD}ZDQY_Cto;ZA6GVo*rGz(4|?1HQk2DIy0D
zl9x5RF)RBV)D~J#G$%O4kr8AcG<KcsG<J<7DYoxEz|@ay1{x;ey(+9J4kdYb(>{Lm
z3ggEaTO1UN+oDuzQhdSv^qdntvIY(G1V6^I&vBdc>Ab~yJGq~eq1+VIhpppa^NMd~
z|04(m$hp;2U*r~798EUIvXwaAke-fEB<z$Pe17wjxPn<35RmVT_cfAS9UCsSx|#%9
zkCnx+lpapbotM>Sm@IkZXbg!PX!?VYFGqiUl~XlyOUV38I9r`nQdag!E|Go4ECQ%`
z2e>L3YHq6<&KFmHq~6fF801r(4jW>R?C^a&Cr&$U@;4(UKvLdc6m`ngR>#YKWI45C
zycktGLmRI@xsY|UK2TQnyL;nRXloBFSJp4L5d*2~!KDDUp{F0iDE_h_K=&jHoE<_J
zjd|~poZ)9qzTA0v#81%ZK-~1WSvBr!kmBrD(4IGdh2Gh9y{&3@2ds0i(jN>4IS|lO
zeb;6(fjSN8g0^Bpu$O!bd&F<ch%5=O{t@>Oih7DKP<k1!gjr7m7Z$v|36WT;_9o=)
zLH31z>uozC{n!s_$6#ewnfP#{v=XZ3(8~LDngpMr3&=_EWM|PXq|F6m{{DUY`cXJi
zdK6EDiQ2>UvE~xS7Q@sYHTPryI2Xu+@_GXP*NXj(!E~DrQ@h*$PZ}QZ0|Pg^@yUvP
z25?R7WZ{s9KM1z1Y8P^%bOc_1l5hYwg^6Mu=)Q=h3m{N$`=QjeEE3>!pH7M1aA(N@
z+8xrzscwxJyAk|vJN!uo@a(b(j@z&6YRoN-N@n#m{uxVm8%`|~?&#~kM{72pM?>iR
zOW@u<-z$LRQcmTY9V9V#1^BUq_{RRn_?f}nroS6Ls%~bycKwL53Od>NwWpZN^LqZY
zg?dp`&heB|;SEmDfl~^C)Hho^e)Qrx+UV&gQ`2r{yQz;pFC>mspe3J74B+Gx#^ZFt
z%q0(49!Q}7q@~?wHF!i3g%F5LK5T^be-U>@3aQo4L5<#_Hbu(V7IWF#9ok&``%c;0
zMBQ$RyBFYPT5X2e(m5TRt)8!lML=l)cWBB(E^!BNTmr%)G_Zj#-AV11#ekje7Yo%D
zW?*}f?pv6lzwf4|vPoT3g@UdXR2wTUv75?s{gk)_8AS72%DVxdBX1TyNc7t?957{m
z-#r16^fR~ppPMCtShy_dx?vNCRqYr+f7eBuHbDmjKz}8cv#VC}8N?0{ORFKG;Ob77
z!j<qXnUFv@FT>3jvV=YCGpa^6A4o)TWpmtIEM=AU-Se)jICR*WH;Kxa`ns8EuNdLG
z@l$q39Gwwi82Af>>QgBwnOVB-xUibyyL=+O`jUO0+ztFALE!1ykViq$IUJqj^t+hp
zZj+5@*ab~lv}8)v)b??1;R5^dhg1TEXpcnH=9NlZ05U^}q-aUsFLP)7X9L<5<eg{l
z5yJrH{MO$7dGn+0pvz%qSI`jS;)w`!xh{R1XZb(8Mj!GjCxK9CTo4G2ZWa=}{|_^F
zZxJ_Lb!x8nC<Fo7zMq>-ZZq2b(m0ftw5s=U%lo{i?UXk0-TKB+udU0fseH(&j1PFf
zliVYb+NrTUXgSH;3<so0b192+bA0O_H>{0~2cj;OwO8Vsgb$Jxw}9NyK>G(}05+S;
zV_$d9Ycs=aV=!e=H|_Tw9&GlWwzl?jVPTlg#aA-@Xg&A2-&8Y!)6?pLz*=)12#Y-`
zsMM@}3;4a*qr^}}cWEB(sCQ&~&+odJMgpvV!Vx8&;eSClzwcdC($PtynQp&@DyzA*
zi6*?xlYV~8?B-?rYM?Z~y87b-{1X6sqXL|YCqO$eY6Tf%GpPPl(X{ivWqW+wSkML)
z8XFTcR<5_`K7(~Um2|Qvq@nNLAUJJb&Q50FU4BQwDiAy$V9%sI)rDT{Q2ksT#zpj;
zFFAOmh-@b<!amN9SCnB7sHN4_)qQYrsa?4FP}+*}Iw$zWw`k<LSUu;w{`$AOw@uog
zH%S$-1&LeGRNuYyoLDPDqhTU8=N^O_{H#EMEuJ}TbN-0Re6kOpj@R?Vn4;-=>#>%9
z1Z&F{Ho80}YLoY!Zh4(y^ukTjQ+N3JfcAQR8VdvaOk5}o-Kr2d`*gzZ059>1pmOiD
zu9f5ZuXJ%maeYYR7|w1mwYiE)tuHrPSlA9(6vO4ZwH$qU>o%in;x^`l=qZ1#4uovC
zn%%%C#9Y6HQ%<#AMJKj6K=ocm40YOY+Ws-rva64QpIte3BtSeI+#ojulhf03_VyJ7
zRNCW7A@r{XUJXGi+pd9GrKYpXJQVAEdziu2_iQcnQ32yfe#FvEnG#_G5YYKO?DIMM
zV&E%b;NZ~u>^&V3ISJP@17ypIcd=i5bEa|83KvNLFg$UuZbI?t$qfSlx;h?}B<cft
zB96NivUwXo46gxB$@~#81^d_&Nn;ZNsMVQ)u$7a<-QfVVem;zv+g!e|6v&A0^sRu_
z4|Lb~)<s-4x&RP>KOd!ONbJV+({2w<M*687+8r7jCn9wQ;68iQPB1b(_qH-kee=x>
z-<1R4uj+ZHtH`ti+4s-#W9H8E(Na%L@ELGxfH>q-1rmv&<o7QR^4xct>ZhY86h#<q
zLx-g|htT>JH|H7fw@|n_{+!Ku#^4QmZ`y`|`RrkiGkocGZzzoC5aEHp_EpQ_kA?v@
znocGOkZkg%_@Q_lj)eF9WNy#<lH9KweGXV)4rHu(a7+UFhanw+QXBXl3Zb?+J79^}
zK>t*)C_8j7$!au`lxuUs0Uo%2M>YTJD|%JKqgWF6x3W&{rsn4J(3Gu%m!}8r^B&^2
z_1DlYq|$-4XY{3+0}}elt)A}$0M^+79Hv6VkIn8!TONT7kpgdltCQ9N+OpqVDxb>J
zcaQsh=&jMkc3~FjO;`0Ud+Xs_!Oe7+{ECX<FO?4vrr;SmpS^1PN2q^4oxlEhIytwf
zs{+eZAB<|K&3sT$$XHunPodXHJjdrmbNpJl!PaCYyN(^GjB_S7pRzA4=Zjm~Z_}Ba
zqD)Jb|5Gn&TY!JYBT*UHq-5c5b}oo$>N3s1TSYith@ZpHlYNbYJm)jK$Ez9h`B;2o
z>?2xgNblFBaFK8VC}FGD7^oRBhZtdlzP;%NW37uoC}GTXx*;NHQ_M0xEfb8>%1{o|
zz(D1>vqwW3`)gaSE%j@4FP6>@h;LT~j0-X69MYDZIsE6JqrG!`#9K6iqvmte8m_z&
zO;dpQ11+r$vJTY1lHu>KnTa0$_uE@AyvwCtd+2i-8boJtxSe)>7iy!(o;g0dITx3K
zm{eg(S;<z1>p@&An|f+u&T5wY{HLrUBG|@9M-5*+h<}0$Rq3f|^GwuI`^a{BiXf4|
zNqZoIjorybHge|OOo)N{6C?^A4XLDKQ-x=M+Jwge>WSc5v}CJeJ0Ep6_`c<g4hAZM
zZ(gSTn(Ja=Y-xlVNW`^2r$JGs&n&m>BK3368$6pOi9}TazkyiG&W|L0mWe{8C=2dI
z?aiY?i+&(O+ioVsl%<HqeH8v^=0Gt3ZYOcTK_q^b-g>FdnJqr4DkOy7i(A-BMlEq@
zKG#6+io0t;^mQS>1@(WFYVsX+baAgCJjCk4?9WOg*1t*m!;I?pakdt5#BTOp{X|3>
zVvA=07rsU6l~#KOf@t)h<($2y%U$Q^)D}bZF{Yav_|wO^TXgE>r5Bf}qtB1Bc--ZC
z|C4dNRRBQe?El5uLPCKrZ}}~v?&p_wNYg={s}w3GtPdo4e8?{E)B`M8&OlK)UzNaq
z9p!&5*|6xYGv|9UB&?T|^6!J1i`QgWD9lddAzn<GUCI4)`~flJ5ML)U=sNu+hBwK!
z`NTe9byz#p%tH_Phk+<Ql&S(|RDK}8e4Yq9h%0AwVDwR3>`Pmk0Nq#^3@5bgd;hWL
z5a!n@$U0+UW&_*Zpl*o7VnS$BjFS2|2IInpMHgZItymRhRt5u!>iw4X_AzFqsir8=
zHoELAA!empfgc^h3%zjb=oa%SuhrW?rePZE{x=7W65?ggRqVxow5^X&WfjM5irW&s
z-hFLb;~uH&=^5i8z_h6QVu{1<sK>`<xu#3UY%-d90u!PxBgfKw6G$++dz+LpoiL!@
z(3n^@;SJ!!))6fSWU>%R&SV2sP5Sw9h|-8w)awStgW}E?i)~Y<yE|$5bE>fvw!iGK
z8P}$h^y-UwRP9)Zek$smAMB2{!!+{6Fi<iq#w;GEW!NadF0aI>lxfRfQT_r7#2P;G
z$ah${bMqitE3~uE9hQOP7Q1x4!S6l}6uoQ??Uw~K>>M0PMqR;PVLKPmPdgi}J&8@o
zn}9vJt=xI@RzaFQi?`U=+asn7*VvoIaQ4zSKK`HY3nA`O;~{5r(sxn2b3n$U+ox{D
ztanrnt<_`;GxRrrg^}864xSEtR3G%4M2S1_Q<Q)8uyfMWahmxcG4D2o*`~Ku=#Pvb
z_P^YH0naaGze-#CqW0&+{5|>T)g*<50dU2N{aB1&Y)E2mv2_SBx!n9->hRiuRnwO2
zX0<w`|2+`I&}D5flET5i;2V`eD~FG~1?xKY)$6~y>ZOH5%U@rj+|SyGM3@htXmR1z
z-=t~%IZ)UDl(Or7eqBK6^F76yS=HfJXKh2h3WZVspmqMuUwZ?v<l^t$dnn@>2!t?y
z+!)DnKwr23H!|b(k#oR(`sf8r0KdmaaJMoCMl=qsoNc#%-B-FpbIWsR{4W01%v+bf
zI1hD3{&UDXlrSlyk3HCDi*HoHqm6ZS{l_Hh4KJovR)YM9MoZ5Z(GV%~k=yyaCFAh|
zE~}G>A5Bev>egE1c~sBfS9CrnBLa4*;nac)k>@-TOY`%LNd~75l_b}nCLW(E!W>@M
zl#33x>J{s^b6xqJP8pUqHFquTx1@oOd~k`+B{*gF`qg!GO7X@TQ`DQN)()ZwVh@sV
zbtI#FP9CYZqGms(a2ANBqr1MVdpRi9`f@?FfUU5fn3&udH(U4SCeACl!ONU?!%c1d
zu<^R$uUuv)y25^4;X+=2^KcyW%dj+PRi5oe+BuM1MsTFAAvn^0R14C>Y~vYV3WG6&
zS&BCyBzDffz$Df7LL2KnQMPflXGF>T>}x59zQN2_h{|VE-?2o?S;yl@x7-dW32%V6
zbcok#>Lcv*eSrQzYD4axcKysuMI=pa>XshIp$h$J;o_YB8>4p9-npQ9f8m_2F)ZZN
zl-rq@uyeOE@nd_A!kpdnVNHl+UYYikegm(Ju&<`idL(>KZcoR`7CKp7880EXaW=NT
zV-;`<1l}fs`DQylM9>IN-zrYgrB3s2WdJGO&Z`mp-l?~soADoVW&i@GeqawEX~4Pc
zmk<2WEtUf(^Ea0x{)zrKy9V~^GC$(U^gZA3<S#Am1ICkDBlpJ4eMu_T`$S{Fk1jTR
z#A;knQ4)P|$FrbHFdInhGf%TK$6N^8tGg42-X;C?@jLuH^q|a~;m5ZwJ*m*CF_nd0
z4{z3vKofNw{5ufp!@|4IRq%4!#yeXbph>$9O#}ENyFs@ASwMWAmw$oTCW7jfkK$bQ
z=NR$yOoMo)Bm;p(m_`{EcP2#EeAv57=UQo_oR_K$8p*$pLrFztwq3(T(YUc=AFJy>
zp$9Yz9_}Ka<PHrWq9dx0TMe{_&~a8|wAud7Jz+JTeV+u^Jg&aA^L8(7i{3bF>i(V6
zb%YmltrdO`7#Z<Z%Y@vjwRnoK9bBDvaRMMa<%XJ1sq()?X22Amo?Uu%qNCg<w*EI?
zxCQtCamNq-r-TY5#6<O)-I%ys(AfyH{sA7s|EjI%WwCh-cMe<^Zt|@I^hZ3lYZCaH
zv_E~a{EVEZtiN)ih0MLJpNF4!5Fhsy8Z<Ay+p{nwh-HWp;LKm2&cxYrlLm$@Nj4QN
zL--Z%7JjBQbq4SLc`Z%*#Lm63u%+e)gxAu_s`^cqg}8k}FWibK#lxrTqdKSW@i~K>
zX_u3pgATXvjL64V4!-a$yK;U^<U6m=YvP3ji9kUkvjp>;4X_F~xb?LAQC7BpV|wJ!
zXd6?UX70UY$0M`f@8b}E0{jgLxivM~q-^>t#mM&ocUIh*8sCJ*p$eRyND4c6&qK<|
zJ?o5$4I3>FJ<rR^l9KxKtf}|)jSGlG1fsoEV6CBa27<Ki{2*wr?SF<hDm_g|GzzrR
zV=-h%g+==o#M(E8$SRf8v@}U=iY2!hJ-bog>x-jfpxEfYBSO6$a)H={HG$d^M}U;c
zZ^29T6Y4M`fo0I;RHdI8Twj^(E|1pksI7!W^O0n)o7W5i=mL(92RL9K?Y>BSKETGt
zJ{}f6m<_%kOh~gsim3DNXD<A6ryFI<Bf)SL_ofCGOONcZ{ekf&+!s774#bu|#kj@B
zC;bD2+>_L#S5&P=3ePv<R@6^x^XdA}=usZqpEq5sgslTY_v41eB&_+j*C`fyJ6}6$
zPioBihhehn<^{g?@F%OkHg8Q1akuFFy$ig$B&uq3Vu}fx5PWf_zqD7Mk9;w+@E4QT
z_rDS?uEbME%^Qz%tdD*^J9A(uFe*269Q!eo_P_&iKBnORGp2a0DhIEOERCOWvTxxM
ze+@j5+U}mD>l*Bp_P#3im&(XstQJR`RpBmrz_xAb`JCyBcTImQhUM9&LBB=TQ1!`z
zIPk;;?>e-u>pLvkHDo^Dy|rbdc<oy>c(WnwwYwN)wjFEcerxDLO_u4A3JWg}*aEJv
zP+>$<z3uhM>7b4x3j*z7TYbq0uOXn1w#Jl8Oq@G#+HXbW1!cm>Apacse|n18JI*YZ
zK5yjz1Bbo!0>i&ag`a}<aMB4ZWb>`0q#3^NHn{but?oP!HpoIeU0!JueH|pyH`I6b
ztJ_<OU3m`$@rp-Zt>I5J@9x$Z|L%`oG)<i@n&Bz$r@ep`GjftrRv;okZTn?4H6Jp$
z*jk4(&>536!3||%&Xf03M68I3|D;hn>x$CgCGxYWAl5%%WtEnsuGO{F_%vS@?H-6R
zE1jX;+6mZp$c<-~uV)I@FXiaU5>tcEs%q`afJdh}Lxeap>$c_DTt}T$W!G&*wU+7a
z3hCt)7R~vAK?PG6TA)TNIDSpW-MzsoP;3^}ibGkyehGiM+4d-V=H%)O_VtqkTqb+*
zg17gBkx?Mcw0~-9>N=H*dOg)$2hC+xS888e{IbSbZI2CA`Pw}^KDki>X}-B%ecMjR
zpL*hSP7lsKlWv@B^~ysOPG`FLGXxX8Hp|`Ze*tl_4YU85!@&o0fKmG_96@R-4?z%C
z;j!$ia0>3$cWB_o?=LRQ+=&Pw0zQyG-SJhZgl4?hB`QZyfc{*GM+&aS4`iMH+;84}
zOG)Jk_<ijxMaP=~X-Kl&96&TYw3?6Z48)~<33T7`7iEO2l#?^-&)Qxn>%5zB30?Pf
z?V4wSW@`AmM~Pjwww`Ho`qElKsq8MeDNNw0M=MI@9amUL2k2Fd$n|Wkp8A&w(jq0{
zZB1r8o8O}2x6c$NKFG}6UPVUpYf5P=79!9v<_$DeLshMf&F<PB{_WWIQ91N>{`hoe
zX@30%19i}D@X}-9v`RG@t+87+u{j&sOUFz+O-olZJ4dF=td>y!bi!5Y6{W6oCk0Ib
zH%6f9LrXs1*BbHl8t#3ZOE1*99h!3f7uGv)>yDQV<HY^%eevCqmhr+M+i_(oS>2cJ
zaurJdj)6i2zo){P;0KeCtP^Plz<=5#L(IIsZaG=umoi9y3Eo(AhD=pfR3!YCOOn;M
zj|4ina6BywWM74@*GbYV@HG!Vf1ker{vR8IGrMFDP1%BL+f!BwUI9rKYuH+xm%=A4
zGRoA0IO21=IsyM^d2R9D#Ggc)JZY<2H>8`8mN*2TZH#0im1)p8W%kH1CX!v?0Cnp|
zzAuX5pE6Uv({u{}H(~somQB1%b>xe5izVM#0Is8d7hvYe`=cS7BOcj_Faf45_MFUD
zRM0D}ENTzQ&&9K+D){i~eR>gzN)mWQ>+y%nT>~^_O(=lJyd!0;<%Y4x-qq{{iW%0M
zEuc0XPatH(87MO6mD>Rc@zBKdvJwz=d>5_0m>+!$1_DIU=l*CiE(K}8$5m6b>#8{`
zKZ-tR0xD2DIpi(r%3_T+-ZCI-NCH4Xz<6jgD+?F_%CSSQoyP+F^A#m8C~M9e3+SwV
zwkH>y2T9ZV>%%=y+M<Ux$=3V$;`oz93-(@8#`_=sHN*~urhBJbzN4F&nwlAiQyPgS
z5>H_p0vGTlR!%rxdhaSk=MCxDIuF&hF=eP5rXF1nYzQnxk$*F=L%y7|7+Lxgyo+Wv
z<rinwW^G)$`BujIiYTSxyiL?&=^Y;ox#<jlrvXFLo#1Y{8L?qiw%t~=Ui7DZQqd!;
zX^#vi7u1csxj8Vczn@U79$y~6dke7$0kx;<x=eY|H2l7I@6(&?9#!ozepnN`xVT0z
z0lQNk@_#m|67)epWpV$d{M&!-(SJ$|jC<qnI=%`oUN$=xo~Z~*RBkq!YNg25ez!`f
zSLWj4YJJ#-|AeRp{57P3bU%Ho_f_`azh@7t6RQ&wNhg{;<I0LG6QQ?_7Ehs`Q7j2F
zEyz(uiq`@<&d$!ZHe)$vdL!vvaE}>rO}N|D-*a^;XKrMkH25H)5!CHW=(bT#bxWF2
z>+*jH`|?02yY~MmMY5D4vZlzslYL5|vOFo<*b=hu#@ZNCD1{dLnzb-?Gj>H~-<Pot
zD#kvt#u$EQ^i=Qr^t`|Ce>Zc_+~+>$I@h_j&*v(({7}eMls7!zN}q~{_0XOX1g;q1
z1Go;*1A+kGD``HrUa31!+9qsJ2vOSGarfIBw0x=AmcXG38`S>(P&ZevIZ@W#a<cxB
zxWk~RA%eJW1qkNp%mk;u0oP6ycp*nf9Z`?5$=z0sU>7>$RQ?)y?BuFy+XE=`1j*zD
zCTQG~bL(kbI{*(elCtEGEfU>7FpMy+?$gUiDBLJ7=kM0l$22|QV7%ezSd&-r$>xlp
z*Pe2(QDa_|gug-Q2lnh*#d~XZ+>6@bJ}<RPwOXGikG#mV%6egn(uft+I$CLX4FrIj
z7rcsWO{zwhoSzk?S5@zB?5(yLse|wLu@8q%23aNglsv9|^oTa__DO>xw<t-OGVg5Z
z!RoQBch$CGw14Q2G-~?P2&V?tf1Z+{1^5&&5x?%6h;G0{^wG6?)`#i8k!(wp6%iRc
zTOQoL6DYA)IR1F@JH-PlEdiTDt?`FvjG$0Qfi>+Kj!0&Xb#V2K!)FCq(O3YrEV%Z5
z09R5h4m#zvmZIu&-}`{}N2a&-i2Y;wW#e64mi{c~>p0DVUooyPUiyy8pTt<Tsu(?B
zmvWm4ICPz9%q<At^upO?!L^Zh{F3{JeP57|FH*g8^VOm0jNj6@f2E@b4*3>SsMfJR
z-k5#{`i^6{FO$gCd7G|FCT`$XYYV?aX!(bS1`_uteV7D2iTURZ&+3usPnQ;0X&@xO
zrz5-2k}}Pi5!S5_PB9lbg-@kXK0VXTgBU{_78koa%y$pZ<)f7F&{RzSh4GuqzP816
zdGkDuaWYf2Ew{1VlapCjza}os2+3^rm_Ky5XXTS=W8abAE8}wV6k~a}|GW%pV<dmu
zQmsPr?ig>r!%5PZQwii!(?X0J?b6CfV1sfu1V?)!RPqA<;ax-GspwO+OQ<_$&;IIZ
z`^)k6Cu3Un=p`BXzF-9_+8$m@(1?|+<J5L@FLq2dQ2DrfrwB19+l`M45U_afpWqmX
zExWAjd@aoQ+ZCry&v(OapOl^zcgzSjOOtKinO}{|GPb@V_{C+tHXzy&v(@TnajV2<
z^=i=9SeKDyGD>uRJlg4Y{DHdpQirFkVtvmxj8YE3>u#2ClcX!~B$GjH+URawseHT6
zEwS>h>Z#yA<xvjw`5v#JbN@sCfIi=h%OMKuSBRH7LE}RE8*Rg9OM<_aou5`mx-+EW
zi4g$;Uhh}3kX=VKma{+ZNG3$jBupU-4!U*P%huF=ksSIwIU?0OFi$5g)M=ftT)k@<
zSByNR@_@|OD%E(?(R?|^b?jyMyrQmAXur85vz}4tB3?_`{zgpHqXo~INS)@^`EiRl
zMW4G(V&_JhKH>eN9YWf^?az8fDnv!)<*S06W3navsx;`maVGKS$N$(;Gn|ls+JjUK
z|BzME+^ijU;nMc{B)8<>!v!>GO>y;g;81GDO6eax`amefzI>2Fbc0S_U|W&FWvXr6
z$jB)3Dk451v!deKJ%4d^c0?UQrAARc{eywu_%+SqRuS^|(YO*#ZzYLa;_VRvz4<Ap
z)e_>>URw>r^6$@ko0z0~6);Peeh})x6Lq8dQK#;sza+Buvg{V>$PA0X$=8VWZCd-|
z)G<zV$n;6jyY&)e^YoBhnIEwie<iJc2_wA;*l!+Zrhkdv&rr<)az2p>I^VhG%EIi8
z-t&<0(b2O4EqX)tCdS4#(0SV6XRrs<9aXg^p$Olr@1hjJrmG&Jhlf#hlh#i&a`&S)
zRkzm>qlQ&^=d?*5%*uUH1w1xyqNQlw%X&ocOjSUg!#q?Dd$$D!gCWP7LMK()q*|W9
zgKDZRUsm9vh#sBp2}^j!Z&Y3KK7WVvKk!aqGp5Y^%C`_t6UlZE$M%XupZ<E4AKM5*
zQjFSb0w2EpXfFF-n+twn;z6<#lW<!e(SxdMzCs_<7w=-9<oLEKBcsdBrfHBv5-gU;
z{$hz3EDdYKQ6ExS8$JrZ5k|#^ZW?jFvIJNBeh<)N2$f-!97a@!>=ea76SH$8JC<?u
zH7JFY=dY(OHVCx7`cf-&Bwu6R^ud(eAPZbq7b!II@gs$f@yY7OwZ-Qiwd*TS_-)@f
zuQ9erBfBDIaC$Q}NfJNDI>u;V4oz|1C{s#_NfA&vLN|KGsS-|}_w)0gYxM2_cvp@I
z>UT^3vg-m*E{7<tUo@V$MVLLAigCy2&6G)PkB+kPU1$nBeUayWo=(jWg+^TOA_xE{
zZj_zhmL4ImIXttD8_7hjEX!9ErwW$HcqN}0VUelUr5!B3IbbT(8;o-dzy{-_BvZcK
z3h<AV)u-v1=Nm!jd>&<3Jh!uXOD2z4S$Viy?`~PYk0V^^cx6`BJw7AD<8Bv%ZiFq?
zh*+NG{(JP1F67&LjHjadxf-SJ58i2RZl;a<MEQ4j@89Bh1?Uxyv0&Ms@BDkYAuZJ9
zk=gP$LB#xL>-n-)k*1jH(FIyAU-G8>jJ12pr_;Qqv<T3Rwd{|jSH^pW&mwuQjF0y4
z1K=)SC;YPgniir(gvDwu3z_wCOQX3@4<``>)QqK#i_+j+wca-6?hN!HF3AMH88l^p
z&b1m`Kf{ucS(}dyx8LtJ-Gj_|6TQ8C81J&?NWraktjwx0q3P!s&%FxRRbC;5I6uFY
zFWlKtU=}YQeAc7(PfIND^dZWw#(+LdST(SOR{+mu>jMgE%dbt(i$T}fX3#yd8&hRP
zpgdOo4xlG5(9qE6K%xA=I$A(~iIZ_o7Bs2sTXIftM9sz!h0SV>r#q7DH#2cLIE@fU
zCFN~h-DXgQzc{NED|!joK#NIoDKrreex0v(-W@XT>Scp?hYmf8BPpmHxzprq621?O
z6sEReJQ`5*%bCNcPMsPowD<lVOAp7JdFs;=r#j27jNg5*3g#0JO*gyQ&m+>_@j?cd
z;T-9ou+CzY{mjVn%C%t3-2E&dF6t@F4nDPt7dei#&tEh#qbd!-1v%fM44x^|(E_=+
zvDrHeb^@Z4s4H{OHaL81WhGLjMaFsj^j&CL_TNrb;D?h2R?y@E8KEvh)pPEU_$RNb
z-!?nfi~dt&Ou)g4zy2lyXXf&r!fkg87qVc5G4YB5MAgP5=7%%oic_y{S%R+cT&)>j
znn1js3$QiS&_F@cma$z|Q8u>2bBXxsRjvJ=!JwG=RS>P*8+}>}&{Mp`>OL;XD>_cX
zdZR_!VyNjcZ?aA63*lTL*jgh;B!~ZZbNg%p$n3~i%_GqRm*fuhT%G_F49}6M;g;li
z&?}5fjScq73wvK$;pne)X&@Pc%X=%Y1G@)G{H=Rj7qf2!n6l+)PLx$v4!k&dDuKSn
zc4*|$^CSi?U*2v%xIQD%>aUQpg)&sx^@Lgb*jmkoHKe1CE`|pWf62E;P`beweO@aU
zTf=*zGE*u9-6Yb8Zemonk9tAQkSKF$>uJj6Rc0R1sJPdYTN(v<+pP|Woh9xyn_k;C
zj%2#SxUx~{1T;_I?IR7VA3r|Qap3=Y?ymkVBN5Q-h$}>T@X!pkMr86&1K`As)Q&?q
z0gV9cc+{(t*KV5EB2F~?u~+GXfDdvya@+2><1??9n$q8-_ka@!wX?UMA~pUy#w>n?
zR_Xg4d1o+lXrVqo>a5uS6m(}1Jw9B50Ir}Vdd&02^~a!YUDFBh^7t+2o4}&-iaxPW
zA=s&zgkJ&P9-l@-Q&XqbH!@ruAZy`TU&KOwjRz8-)GT~D<VTO;1LU^66PH_;J`g9T
zJZQRduSQXIRYj)*#h1uRV?#Ih7eIFu3&_^=dQFK9V(t{{O;GB6rquh|)xs)-(g~sN
zv47{E*}T_b6wgPkXW3NTqQO_t5g8wRsi!agJ~AI?c{t;O2&YQeh~;hDT#}hNpEtnY
z@Z`hcuO==^+}sUMt%n$Ku#4Znw7i*5(7DmNT660nx5LLMeVNv%k*utZXx#el&Aa4l
zk4KS$1+PAR%8FEB6}uk_Kd9DpMfGpf1MJncc4=@9KUz?hkx>h#nR?d9b>Zo6b@}6p
zKAkk*uea}tIr^9yrDB$VN};puH#+zk<R!~iQRDu8`@OPVa&}iiqq`Bt%^NpvAg^Yu
z_UV0B{yuR~{)S@TdFCp>OQR2%XkGkfo<q-KT!<j@v#^x}kb+dMPeA8G@w*==@do??
z0+|^ZAI?O0rDl_DgTSU1qY(7maN5o*zFT*djzLo+;+|04Qoqxmqw6;FI%HU)5;SMD
zY?s0;pi8(R<Ia5x`~8DSIx+MHr_O=f*|XYmM`lj-a-?+vZN5|OAfX%7EQeN%)r1%-
z`WD!WynG*BW8%|S8$1;RH;cqpb6sl9sjD7N?{;(8y@Bd@C8}97(lGE>b#%c-z<tpR
z_y?<U1s1uhm3A)hmV4tS#0|F`0%f%BB1T5?2Hd1(%vJm$ZXL4TPTQ*gYQ(~G&(g}O
zW!XH)amf8wp#I%E%9%Y}G%~NS(_!y8$wsa&lJ8Z1Z2pI>7)pv#KK%<`GzeG=xj=Kr
zh%pcEFs#t@sX98P@2P^O)dsX6*37Kzf8UJta=pVUYQ(8T2+zdCl%RiD|EfYhV7F`L
zj!-x|e1Zs8Eu|D`4Lg;Jaj6k@2W@42rnt|lD{J>fua>1XIQy@j8FFhC^0UH&e7t>V
zU1cS7cQs|NNvx5TVO8w-&zbK?lr7%fo*$9e25Ws)8A0qno{AT--3a=5PJQ5|XCasR
z)|pbjI=p%0g;cq*F59t3;ml*E&2qIhJe|;fDcE$CHBxb6bkrD_59|KC$Jw=LIkb~Y
zG(K>{0>5sEGautaqty$nO3TXHUl}qbW6X;{zTtVamB?UXC~ojutOmPjuFXS=8JOhh
zM2!EvEalsHXguA933K0KIX%3wMl_R`{P|K`rDBq)KE?*>=3JT}B8}`|N*KVs%(S<$
zd9k7!#T5cji58dFO6|@(sQ=qkILNu5V2Qsx&M4ub{uWeq9DCPYc;lbzqN5UUfOx>P
zv1ViVMza65Ewij!hM*D3;Xs7tgctndDgCB6>twzpikTz37yNLPl}EeqU}0A3sYT8i
z2h@6XD0v7dQh_;EF*4{42LK%b3(6}emO}<X`r*V~mY+vZWG(sg`cyeh1ZCHe)~hD)
zAW*b5a-1j(HHfu_`nDB+5iVR1x%5113n#&v3$Y0`#kg7Z(o~7hwG>hJRVmt(V^2<H
z%sK>MAAU8#k*~_-PhCeC=dSJAI$az@@69QD)LfWoiAB70ikA-7F&eou9+|p&gibj6
z!H&XS+BGrbTSm?-GH<D52S%%nnWZyu&S}SnF8nmO=u6(U=<4<i(&we(^!WMsUZmCE
zm$}aI%MSQym3*dGp9QHjvM=Dke04R9vANK^!J&0(`$$%YoXIXQKtz#`Pc?b>&Q+mY
z#>SjLYv>i?=J?0}JmeVj2^fqil|$Y$Z_K)nqAK?0ty|nA#&^YgH0SK?ZHWE0^Wy+g
zeYMZsq}=6o&0)}b6ZMouihs^rGeyY+MCevbsk=6Du&2H{H}83zO5Fn)ne(8)%C&%E
zrtJQVRQyHPG$HQEkW9n`0l>&DXS!aa+Pv18smzq`SIbXzQ_PTBocVw=zebbPlO1KX
z1u~kDl~wLN^1`&V%cHnlUNYa!5Us_|BzX+#L>AJ+p4zC$1Gpe*&T3uJ%F?4Q4WXYZ
zlfYXV&;kz3s%Fsh_7)23YcFqXWF(LR--w%mLlAdo*WzcD`k^#spRbw0Dn)8ikf2m>
zz|fkFS?unFQQT8Zo^oe;Ma7V*K0J7aC^FEgn>WR`<2&!`>%V=NjyU=%+S7q;35eWt
zzyR8i&vGL`32Sd=W+no1q)Ak?eIT{(XsOHq()P6uMIRYG$Gt{fLs(&bH?e$I2oB!V
zqQ6~%E*$xi-}8~@pbHI?)_{K{3W7I|PcX_zD~6U9Bn4lmUP(u*7PQ9ZmF(v3b*)3*
znW>Hy){QH%9&4>~MYk@y$|xQuOh$=3c<m!}<Ndg8C4CKhmC?XDvG>Hc(HE<+!ve0~
zBgUin7BT$^dN{<<GAnEA=82xW-TuX%Q9KYc`v+^g;q*0TL4WJQZEa2+@7k_IxEq=Q
zzs!W+p0h7cR|=Ug@r!*OjMVw|&KL~SzmZwZ!5~h<3P`a6S5{VN8_l6Rv<|hPh`QLR
z1{hx#?p%J%7LB2@PIOg;pndA8cn`I4yf_HV0mnNaH%&YA38dp#MUkx`c?GR;5UVD)
zN;cvU=n$}2Olk=KMQ$<PKA*~P{FwrH<nf3h$JTY{iYdmbC${jxk!g^no|k6m83(7`
zqBzg!8F3S}J~i|fF#HDH<w#{s?xM(<k*WUor8yk2;#N;g24wBV9|j#Ps9t$u(m{0p
z{Fqm@tP7q5N<o}%b{b{R`=5moeb~4cm7{H;(n(=dI)1qh;LsarYVWPB3LcK|Y#%+m
zV|5RNxycxw(8b=VM2n0in=&zIp>t<&6Qp*@O|TwfTf9`Oqj&~Be-B{ZnZ(DQd7u^M
ze3vA0rm%+)2eT91u0vX1j8F94(x!<OEgsQ)_ptpS&l{|{Y+V$UpI@sQOIK&!NXSS*
zK0ZrUK<e4RtS{7`I6qS;7k5;MP0tS;#no2etPcu^?kDxIO~{&`v;GQNBrg=^Yl)K0
zz610_99^CFzAM3?-{EsJ=@BT5o}y-#(r0N{T7E9B78F2w8K~kFCow7!--;U9=L;Q5
zsi3AF1i<rOz%87XLgux2uPyd?aT}-|F~`lW4`{WoT_obh<KjjP@^G&2$c_vWXJr#w
zPCCH~5JOfmK8-nzpXD}(x;jx*Sx45C=9E<x>p)F_>>Yl?a$UK#Dx>7l!x|Jt0aWQB
z3)-8=d%hwA9g1}87e`%X-51p=#~baY!&L~|vWlQ0Fz@+D#70?SLS!}CnIUzvfN>ci
zJ*wD!sAPe7DMA}>(On55$3x;dtx2E|p_|b{?xzY5fH0A7vyJSf?<wEozdgLyXz$=~
zOj1&E5PvS~1bm|LW9y<eQ-a3qkZ!+Ja?sXCXliwu+#T}L!0q4(Z54}KoWt7bTc%xu
zeQnx_hhOI}PEXU2O|wWIvYVfSE5icghrbfvO4S`%PKl6j+;F?6lu%o&S}}+0)LrW=
z@Rdgp+vcs!@MKH1Z#IK(&$j66`rxKIoUa;Qg{07V{B2ivZIW-d^;;MC(N@(erO*D}
zTYq1rdL0_wbR?d6GcB?1oVJa=+5UcZ{Q5efV$b<aw_9rwt7aX=3@L%<dr1)y+DT(?
zgBiEA>1_||!xUE8c8}IQVe{lNrcttA7VoK)6H-X@2Ca)#O$HumNS&NTc>$_A&%sU5
zX?Cg|GqrYF5;8OJZL^?iNv^8)aN*b*=u%zWAPs^;*_H2d5L`^2wV<`R+(U1vbGeVy
zgEE{ry0-xmsS<5S<Dq7xm2ICo4C^q;R^tyP!r8`LVQ3B^$aq{(N3W=>by8j18>7-i
zTOUbejNjzCdh6ArbXD^OQJ3qhyj#+p8XRvaTR2_p`IZP8QecJ4&Z=iv?es>Am@Nr$
z*uFE1mJC=l!zkyimWp5YwuTPUz6nAMEl&bmC!eJhLft^%*h3LK2VKF}RnR^eMp;aV
z!I%?w2$-t%0iznY0^ktgYW%D!xv+>zPq9a2n_J3==$JKpE%I1OPK^pX3nQ@>qf?ge
z)Q&HZnj=Mrc_{3<Z{oA%ag!oOldm1&hs%j}oTCUjH!FR7f>WG2+(etBaMDC!>KgiW
z<JS!~TZG&qcr=YMu*H+u^}iEq<?rpf$4NUvvk9(^r-2uU_8WC=^citKh1enVP7?5S
z<3`f}Oh=v4e(|@wJ|&;5`_2U!mok1y6%d2WTO$`@Ni#7twIUx`H+?t2;dHNj^)ELs
zxN+#vxEGl_W;3MoC2TM$Y@X1Gq4C0mPkj*x>o8LOvTe9|1h;OQy7}<-+?p(~sw`}r
zhgPEayz<|Aj9p~f4+ZzpckLB)S?3eDYv<=n3{$#)%H)5XNAl!L@?I^6W~2m{F8i|h
z*O2mZt!>ndf|SOtA5VEE*F}AaG4mfXGClZ)Ww4JkEBId7c@wk{&FNsY-6GxOoEr;$
zze{QG%QDzqL~Hx-=hAtP+QURp(zoDf*0|pI=n&C-W*Jl-1dX}cx{&OV!h`|(Eai7^
z8dC{9jJ{>_$OAPa=))Fxz<2NtaA?hymDd2~gAt2f#^)sCV?+mDo~axw=eM!&hH-Av
znQRolNLMgdLGuCDNBq=#mAcFRBe|k=U4a18Fos1q3AQW#1@-#1g_Qs1n3sGt+ohOp
zH02B^rh-od9`PmU%`bOQz#0y&eT!Bbs~yRb$AU5^nbed{@O)txQt4D<dWxpkZd6p%
zM(ld~Q71*A&5r9TT_&*I;*60lx7;aR<u7)brwm6?Wr75Gq{-I;(ez7hHGy*?La_0r
z#S^}rT~PJ>)sXkF5nrw07BuQj0hteSaAM<aRKQMBa*1%k>Uum$9g`(xA^QnN@|z*U
ztt~Cpi?e0V`es+0QkJmkt+TEbvmtDr29VZhPhXC8eP1f)b*%8o4Q*$NnRV|<i>#32
zojx`<zAcTG^?P7uM_5MJNJMa&DB`kP-YEmDA70UKua}U&XPBCTKrlJ`^!TMC>b5_T
zAxm%Gym{Okyr+W|kI*faLCkzs3LT;XW1UWDo5794zQxW~k~*>|auAP^ngyXoZMKv^
zMNPGj-D&#(Q<|hL0Kb@_70bXYh1o6aRX-B^@H+|!i2?cZs&h{&Awjk<|EmT~9z!cD
zkgHZO^;pve^r4t9)WTj<fOD{WTljvm2GIuhIm^qcekVCb${Go$X`i=-DvvD1%noBZ
zYq1A)%6i9PSM45~cGe8UcKsb5hTy4ZBnI~O&NvyQG(W`ojVB2GBO#N44j^EYPLTQ1
z1XLC#ZAcBWVQt^^!B~vfj-25ZLTpXN_>JrUw`)PK430Q`GpO##41VX5Ee#>qEB}-o
z&31^_uBeB1fT__-Pu$!0Mu==KUoR~LVPt%##8(PZz%{2X#Am-O`yzc;%+$!tvk^II
zhQJ9*a-Ko1`hgOMgK)NVHs{jWUAJ$b9?;XEjoH?vLY|}=zX1N&%X*t3H(?yRg=NA9
zw{CrTR9bdd)f-n|IZ3wd-J0$+?szK#_c=_27C8Sn66vUE92K3AedbB)^_0CGHKvG)
z)tK`%xrEl2P8lfF0CoMml4QVw9L-)O5$n=G<5Y~nbY>*%0VBhwmq_NT=#02y!qoGG
z$4L=6NRPF>h-iLse)6T`BMzo~OkrhRuZ&8$<J>w8zO*Nz1Jk0AzdEiamB@;H`>d+b
zMzk_FA5FeCCKa}+u!jBGp-u3uCGjiaPWzknuX;@x6a?vkfI{u|oPaajWWWsjSx6gN
z)L=3KykYVCF&k3iy1K6m+}7)oK61o+2{hVIBVGow-}-K?i{1mqns?(FAWj%}tJ^6r
z{biD}t%jLr5==-Spuatw&rDr=n3X*nQ5As;bKrbjDku=>yWYO-N4FW4@qIHo-d<W-
zilRl}Y3GZn<mXT!Lnx!cO+9m*t}Z5?)5#<i)!{uL<15rp2&z1`IeI?s!AcRkz*HJ;
zDosFzs4-`KOF4bpu)nj!-*a7JVaX5Wtn@`rTX}W1$95`^{-C>a@3)ns5AM(E9KNW%
zuS;v03Qu9$N~C%u^iw|miykEayWSgdXy(Z5WI~})3M}gpR2GCK7dABKE8W1k0Q?RH
zQAUQtsMgrj{8)OYkSR@06VM_|BrD2MY*Jl}>^_L87qupNe}3#nT*r)<uc}!!x3nBJ
zM39o@PNNs)H6!MCRy*n9Nd5Mjd$pB?curr)I<*z)qrCe)Jt?0-Gr%-UJ7uX|8MHY2
zI&5E1_GOxhAApo5+j|2^h0n?NSFVW(T@AA(4kiH0y0aOyvsx_gzz{>c0OmBPdV4PS
zF0_-8frTcn2J1WDJX+ztD9KRz3N~QKYw54gO^V_HR!Brq*enXhk?+oE=Wsd2$xVG6
z@3>ni5_FiRc=gD(TrjKUF>VkSFJJ}9e9vnPsZ71sJ({3P)fxe&8iPufrq<lM;uiHY
zZovP78H_sm5f;%g`ldda4LiWOQc3oiW;PmVC<v<B-HwZsb<aXORZrcNnLyd{>xbGZ
zj*MiT5q)hW3oPNqH>S8G&*A3w6TRD&u`Vb!OlQ7-u*G6p)cL*bz3+|6U)OrI(JujF
zNK7osa$y++2n4boIg4Gg5qm#Fo1$!D17gZ|$#*~3(Pl}xiwV6Sag2?wyNYJOYJ$i+
z(9lLkJf#jFhG%h5<?+ds6y9X-dU>Z?-Ip{{u_IqeRSaO6&|k972E;NBEEeu5+3{O7
z&E*y>A-^2n-Nw{Cc^kmhou6Q&Md+wM^!nrN{BNDb4R)`mZpzn{gl~Sx<Hea{A8=;r
zM6f@AXWd_E=G{on*|cL|jH$1`EZ<4|(&GBvx}hCYOK_N7F1Bj@@NgB@6&<t`%}aEM
zj*cE)Uyog@O-xB~Zj>i9mI{kx!R}XuCWo-2>%uT?rAi_s+}qfzI>9ZpBY!}Xo{^&!
zZ`^^J*rNxq4tp@#I$p5CNNkC55^Ct)8D~Yr)<EY7DD9nYxA?gML2ld+*edzmuAAxO
zbua_MwtQ&LoNv`P0G0D_=Cv&@g~kokEoxh+yoB9&c?&0bT-}h2IA-r;8vb?aFk%#s
z(b;&&ofvETXndywmDP~=^ywuX9piHp6h3UzVq|}B^Scaha_vROOYGXbLc$TMBKv`k
ze8e8dNV37vKY|@Q<Y6&+h3V%%ZoP<$vn@&8mN`JI3fLHnKqPtZsdnMWe3|M8f}WkE
zT}ydLn=s%#1yo_#OEd3D3gEGr)H4;4q9oO$;QaIS##Z~Jap^Bs9-XxNUYnZwPS_8u
z!3c5adCIP9<H*<n;wgP&uB<YXswjYS6H%W<A;}s@l}V&-ePTl6Rn5|OM$Uj^rb_jw
znV<Z&EktD_tKYqQBIB?%AWas^$_h@(ouBtK#tGIReCJfVk?upc23zB>5NseGPo*pH
zm<(^FC{3qG*;@`#ZgNDA-DAQiZxgC)xF$(Qf&8%an7`ERJrd(+cyLHAK@Nha+p$|V
z5IFkgac*HTFp*j*n2aZAr7{Z4J!sbK)D0TyhhdB-JO!#coidIJIx*Aa-QW4v=t=N>
zx?R!3fr%U7s=2P@O9%Shy&{g<dhY?mgGbn7pQ>PevBpvdkz6DyJ_)xcs7gp22M2!|
zI1>ZyPgj?aPJzkycIZx<dy2q+>#?84x1FJ=zEgwn)t@qmSx0EK86EvlJ;k-O@>PTY
zWyXQZ-3<<{zR7&@wQuo@0EoE)+|gm8KZx@bcdMR(T|B&pdn-@oyQ+GCS;4z-3=7Ef
ztF4Q)E&_r=hx6&cVm4|!!z#D%lInM6qKNt-Vz1YAQzbyjvr+v93ScH*+In0fw6`O(
zPFxP7`4lU?*G@<{i+nG6i2gJ^S+ADbr_^JsekqrxW4;=`NJ_G0xzYS8alv7PBhun}
zVUl$0^-EK^{M_uiC|j4Tj0<LNn&%J7{T+r3)lBWaU5(6n8#A4i6)JFyO^4qn>jVee
zFC+eEBzEl?1OZa85e4w!IL7dG?T8IEGbyYtsd>6jYeIBJy0FuOEUa4=g|Tx5gVx3O
z2~NAI3z}XBw{zUR6nG$b9zS?*eNmD#`5IPI<_^?<V?fH>MrLRO%)g^^GJ8Uu-yU(Z
z#wTmtX)iCp_8B(88k$NMhf~#fGbU_7UhVV(BO~NA;*%9+<qXXr>*aTOSDLf5*vkB!
zz;l|dIHv^Q*&=6mpW9%8RYGh$-CAg?i!Bj*Jwcm$kr#k`LVS`mXY$(0*GHu!$$Vw_
zGMpcbV~ZZOiE=xQEzff}`}8fUjbx3Wea<}iG2D?_syBYC8q{lCtCcK|^`dv?<66YA
z8)Z*z^-WEeG~F?8OKPcx{1Wby!WA%X6EBm(l1{UiK2qgx1y6Jlu38f$U;8+x$lbZz
zh+UDAlENx@)k!+%EQ9<Jm8V~;7m7nh#Bz#~ds>Lh)335l-NYJG&P$TIRlP|1BYS1X
zlq2$6iiAN4wwKR{gfn|lLMU2ccDuu@^-5ln@ce*8RGVBLV?kWir%Ffo($%>gz_Ol7
zXPA*YztB>s!~qgmi<Quhv5MH}RTWg@f7q>?6l-2AyBxP%Wm4<(yZ7oOqC5_Qylr4*
zWo1BZZC6c8A;Hg_X5S95WCGYLs#nOo<z$MbxQT6n7Jl;e^=Hlg@vO=}1O(2X+Iby*
zuM%hNZI)8D-In=xO7yoj3#>imGTyxIoVtzvi<t0c*YWnAY7Ro6zb<ZjFPMdomwo>D
zhEIU0$~em#3FO&E4-F7MdcyRM0E*hv^W6der%x-0jN4<~Odh!q_#p*Mstt+43Ks#_
z#5>S0^mI9Ji4U@fdK?ze%UcfDJ+jRWLG)_M_%voVy0(cm9+J!}Ft?;xtFl;XKR|?-
zHPU}Qt*Rpg0SkURC;vfX(j$_#afZS+Tjoh!OZ}{3fRnD-OL(fsGqcdhv9QR0E>Av`
zF;(9J`PZb9awXoqLzY+6ejx8%g!1m`<?*okgKNH>Zu5%3Dc?{4>Fs$<3Fj+?y`TiW
zMI<RHp<@KF#gEzDBnTUijgxIBCx<96=llCQrYRn%;%|In0bST^BQ;5yKjrM>3shJQ
zDDhIgQbw23ts9_ZD&h4^KKFnX0EdMeIucFvQ)pIs7@SR3^$t|!?D-5BQe52gKdt)f
z6blum-wop+U+YH3?q^WwDQ{!?uF?=^Ias5G%xt6ImLcxEqyBqs$T#BNbgIHtE0sF{
zsf0xI&%EhxvvgbS9b88H@qrpt#=?WN-RS7_o2DQjfL)mkblQ{Kb;&ubZGuZ-=Q9}6
zC-WWK1K`51Y*q5s7>p<m6bX!)`@#_u%OH%fo<%s4M&S*M%fFmvHxqsdosJYB$kQlQ
zZcSnpZ3F#N3)1&kEts{+4%8&OD@@(Q%;#v(SO)liddh6-Qv<5B*IXQ*oz)K}wSJNp
z8bDMYrJDClgYOELPmtpcv=rC-Xp#2`_^XrPgsLsqn;$cxApzf<{Qyf1SN6nGI!kc4
zhZ(iu#o*&i`2+TBZ|4_S_KlJvhoR!g7WJigHR@b1-SG8lQo(npv9ieUY}rPUT>4Kg
z0N0TvEuR(iwExDC^@!ug6>R{C^=_w?{YsBlDCIHD=s>i2d6ZE2jwSn9)B}gqQ3l^~
zzw`<7^YB31-+H|p0EpGl=Cq`p1F;Oe*E^xIm6M~T60qGEGG#R-tufwratjH2j_$bq
zLpi@NgQUP&;xX2*2|@QuYn5)T4_y!WsgHjpR*Ae5wb|KM0(JouWcBj>&2a=G=E*K(
z3$*lQb=}I!;t{!@b4d+xv7h3*hi^uztr<vINX>zhXCyf{SX^q<ukWTBg`_0`B$NjA
zbJXPGWU$^1tKHF`xnaT!ImoRLFOx@CIsqM^Gl2y{gO>wAhzmMw^7ij9#&3cRwY<7u
zr!a7U2#!%qf7az`5ol@CYTa7T4VCGN<6bl%JD>)%?OwJrv3W$b>6palf&S=5q6si`
z(Z?MVoCshCD(@_-;0-|N%@=(gc*<7Ibt^z>79GtZ8emHjX;xAS_m`p{_u;Rdz7Mu`
zS>uUW_qT+Vl!!g{sc;peT(3)x@b*yZIpC>Q_sT%at;+hBlRcrPas&r^`voTisOvXq
zTJpU+@N%__@K*kw<K+0(ycDL>&>N#GJ767HWj*h?9ynj=-SV<-%6AOyq#V5jqVnJJ
zltJS!+T0KJS<W^tn7>jkJ+A~1AyRnWnPc1Y6r4I}X_aH|yIRJW7|kzzmzqEd3s8Of
zyua?r5DSZ2ccyY$go6UNLqb2^&^x5}O7{?dt{s3Ut_L12adLMj*t^s`6aNvVf}Eh7
z*}UL*K`q5<Tcg)HLFvnyVRom&rrP(8?d@az)_nhRF4qMRI<OpM+n0QOd6oyP$3U`x
z_a(13YDC8T>K3Rq&nzvKv_$0UAy2GQ(=bar#Kv~LUQBq2Zf#4D(dN;Jr7zxTml+rA
z&C)FCEk%%`LaW*e->!(gH<8aDVU@Irl+iw-QD{(HQUW}rE~egX=cb*Xxk@plN-Lf6
z4!wBiL+M42B%AuKyAPgW?=#p%k;+QK69)XxD=UvDV20iSSl)b63ROo7Dc}<Mu@m&&
ztpL&21xbd!D3RLlXDxSujn11z;V%|w09>JaO$uzXYh5Z+AW~M+3wV+E0cYGw^i6w)
zl~W84N_)Y%eE0Gwc1L+<lI||l3-x9E{^~OTQIf+d$k4a@aTcUA&XQ^}z}Mxw=ig4{
z<Sv1I83mFEqrw{?SkVFiwrs^MEcSU^JQ)H!ocvj5FE>?psLBaQI4OG3^qUr3^7aDi
z*w0E~=gZsxP2DajhUQi3SouZAh+zYj&SNYD%+i8{^Q6x2c>pctxzofQ@k$<F-J5{v
z52zCqGAzCVJdv_UT~cj$97qo)WnnHkmJ}B+e6QOhIvYj9zP`Gpb-XveDhb=KoJIaP
zR`1i|-RJpL9Uz;|_Tl0B`JGjL9i6kjDdI@SFe;^xg_ehJt$;8`f^7XeEg3T3=GInf
zLsjKgWe_n3y!wF+0*I_AI0^5o5}l;zhjJ)x=JAZD3U95#*UpbMUS@pi`Zd-f{5jxB
z7!xJ}9`9z5b;l#$ZW;^i`O*$QGW(Jo`_Ye`ls)ot7I#KR0>|5A$I7@hl|8%8eafIl
z<1b@3cXwjR6qvmzP*2gJB|noI^x^jM%5<Yq@>;wyKtg!R%Z$1N#kPoGrN;ucxAB>~
zei615rW#kt&~FwS?eFnlY9jgK(rc@7_5*^=ZEb5PWanjKUOCR{d#y!9M^^EZO$Chg
z<B@2rUt<IZeo-LVuNW<U@TVSyu>5Tvr`O@T%oh_}LT~G0jNSrAEu-jkb~s5r(hGO>
zjh-!ot?QU!=#|1;|2B0g8Ja|zUe-SV!3WyiMLq}V^q;@^OQ&|xk!O)tkKF*Q5bae~
zmX?F8<@5GD3JOf@O6>FIBs+!f1IJS-q1EAuEZa$aU}QPI(GK!5a;nHw`1XNeqg?7;
z{(I|1$qTu!S4izEbU>CFod4)V-?_J*$%j|W5JZ?Ee7%3MeD}+^KCq|F{I{%zY_pRV
zT#Z3vb?Ml*rzl1rxx(=f1dAwgwsm>3!I55{7i1z$Hb$lTaspLpd@6+%-sSe1s7oq9
z76&S3(!#!i_(oYe)Ep8L_T<Tj(vwbXQlaye%Lj;{G5eD4i7w7J`SRY&cf^Ef!Vb5T
z&A0ib=BMkO8w9_(_|4Ykb^{v3d+F^nIM)F{ktgevbrmzx#RbUVW4%{hbW@RBDrrvs
zsldO9R#SYQ-*VfU%vY#W_>BYfF#7d9<mp0}$;(DtA1JWgfm^LF@^iVoYv^oz`itL2
zT{8a2vKo9a4kRYg%r%T8SnZ6DefA^~*lmMLx9|s{&7{!HDVmyjTraHX;lp%_nK6&C
z=))5v$Yb{^0wCiZU4|*TVE!2gYP3ihcPoKYvxT0%*zGO1;P-FeBZyJ9pacPHz*YDC
zqlg1@UyGP8{x4n{EkaPwu4B150%D9uvSeYdD{mW$In#WrU#-0F43MUNV~TWTy-yB9
zhtvh6XUjZJy;`fypdBXJaCfov<{|4G`r$Bx6#1-7uOZJ7$3=HFWxQ|l@T`QYfbZ79
z@o&-DqzJU$Y4@qV>cA_dXJ6<UlL}aXmdP)Uy6%B^$)j0JK!7?sOHlb()Btt8BoOLY
z`2H}8JTg~dz(is!Hu!C+PE1v!{rMn30eN}A*j;lAIF46RXrOw=0MCngSEHm~>Ib6u
zU%l!GNk)<x_`1V#DxH_`uXlyPen7y3f7aCodYtOo%U<;oRshvRfHNOk@L|915OR*J
z_jEy@jHEiKBadZ-aSPQ0caaow?9t(rk!h3+c*VVybv)zg(=OGao)ZsW{x&0j#3k<p
zQ0M^69HI>XeGtwnS=|m&7juL(?8~*~X%<M$4Z9i9uhnP{R}SQlJ=mpp0@5ty^0x6a
zU3;a48=Pjx-X5dI>iUpIy>gaijg<HtwNW=SLSyfS2{}Y6B_AMyu+n8{4DC=kbN4{p
zI`Y8qqa!m+f(G;__{*r{5R!?zAObkjonL+Avz%R*S;Ommdr<`IlauP6t7YTBI3D(~
zIZbGj=v;H=xAX?`smK>0?9GbQQ3V33xU~#H9(;UT>^(?qgSb$32%WtEW*?lTG^AJ9
z{e+f9-7^WRZyY<M*(*a;eqDxCLi3RwseT;U+nJAI&o?POKm<F47XiwaYBXm?4oi-*
zBYRs^CY{?Ul^d7e`DHkQRxHCUqR*#iC24%^1@Oa<oC|pGc?M0VEG0IA#K8qnj+tz-
z4$QDMe*M`)aKGkq*DniF1Dw^teI}0>^}`pRB<*~mD<LrT9yJ;h(ypx4)9N`&n*;;3
z1i>~G=NH#xGXs5)r|Gd<c#|<P_mOVvub@b@XHsHfdS2q10FMn2lub0qv6SW6S)rG;
z#)~KT56&ncyOtZ3cf~A=yqB7}&fGcl(=<`P1*#8ieJ5odff%Gl055R;*|YW@8<qz)
zl0tpxveJ!j>_ZAa+`7lyk<X*}DzYAJjV7|Lq8k>3&z!rS$c<C~?Hv5LQl|@iMcp-T
zWp8Wy98@b9ff~qQTJu`cIU7s`I-#<;Ju16uPQzOjkdpA0Y>5QKM?Er^X<sLDH7qMj
z&x>y#A;%m=p_<s)Rr?tW%0T%eBVdjkcO2L#v$CPFwaZ3Yq`0;4c@7fOUpE2vm7Zs+
zi}n+`DhVv{eOgAyfq_V=(+l{%t14kE1|X(tab73DKmD2X3CDE<qj6HdiJe@(hT)cF
z60gyTCCqAq61*}g*~0%?h6zY~WM4fRKL5@BfWA>bzQqXLJ&x(-nCUx8O{#}uSIss7
zevMEalySY1P^CgE`=OTWy>h$qsBT=hl}VQu$hncIiN5Qj8=xJf>kf<ctsd4GW$en}
zko5X#&_{!9q_~VWBqSFGH8hNKL=Kl7F6b@ojV6?_s?8f4#!EZKJ35-GltWP_*;86Z
zYqWc#6<fmvZ{8HX$B#HwwJQ(N&W})*raeK0;^k;8@nC*E*FZf}#OeFVa<Cl7xAHwW
zZDsu20-i)Fg0~(%T5WHr01d#Jy}yip?cCSJIGGOfB}#e2o6pC1lt;{2Lp!yN<~ln%
z!ckPtmDr#)e_X*@I_}LW-_kNSN2Hkm$3tKO#Ltp_@MZUP7@n*4+<hYNS+Bh}gCnE{
z(H2|ya`Z3Pc`mtUI`a=&L?|v0JIvxP8)ae$xrf`*VL*nR<hPl-R~DcMuikazHTE=T
zfn_gf_hschXhp*~h|61}*5OHvxrX1%Ft}Jf)m}nc9q0%5B`?a<eGCs?4KG_cwX?|%
z54LGi(!nh;%W01XrwT0*s(>u-t~38qQ9ZhxJA@QaSA-0G+c2C>vF#zml_&#bw@aQ}
zhzBz6;J^76PVBb65w^uv8O!v#6h%R(Dd9yu*gxqZ%9OFHUnL~OuWBf_?j)&>pG&g3
zyt@4|DawjKbUC>|{&UOxPSBiGZ$3~{(iL4)7Inu_)*EzxL%}?lCOlie6Sk@S9IwJb
zha%}hMf3VYB7e=AIi-e_-3>rJL2`{7mfX8$ZvNU4293C3bbP?QD{=#nv)IwC1Ld{}
z)kQJ1DYGc(opBT*GSz**s=;M|cG8D?9UIPB`Tp%o4P$u~R2w%hMF8RbOcY8Fp!)ZV
z>o<zlH(|!bmXAqAoBms^X2WLTAKj9R1k(e(;kO>>v3DKiV5#q)yfW{buCVbnQL^c^
zvuIa~$aZUU3UR@DjNjd9oMoXux<aZAd1)MUK$Xeut<_up4lHAbAvO@GB$?7;1tYV;
z+--f4>!53vxiSNQB-SbpP=>9~okM!03q#pg+w8Bx>hh=7mlo6og5SIhPA(Iyir%U!
zd6q0VVuU+Bd)hbvOM#cVow12|M9nlTlk_G|&n+}F46OhM!M+Xm)J;m_v4{F6R`FG!
zB290&=lUsVht#Y5DW&Q#j7CZYl<R5=dd#PG27ViJ#yR=Sw(L>-T1kF1l)bFD9&Cp*
zwV`bITtBxDNn*!;u9^CAG9p3<kqyAhbr$o5fQ5k&^&cUUUrYL5nk>-r6sRnO7n{E7
z2shfZshN(qAJ)5HHZ`9fp(OYDGs|I9i)T^`3XUebAmAHb&dP9n=JA24B3|FT1b%X1
zNF9Kcw}L*|x28%@EGewf@NH+&E!L0gMY<emCHn>TxyF+^zPOVFq?UZmpZV7T{&V2}
z92w^+0KMQH((PjmY6K*15!;}mKeA>MEB~3fEm_eBaKSOigZ3UG(O{_rKD%jLN#!Mf
z)tEd}<dj1RU<L$%x6YD7cY<gfro`YufvDRY_PM)ogvY|qYy`c!KR6JY5j3&~|2B~S
zIfCDDB@z^CL652^WA|oNY3c2p++4u^hCvCnI)jwTi-ZLG2yGn6=O>j>x2#OHE=tnK
zMleh8aD}G?sSA;{SlF3pckn2I=Y6YymFel~Mi~P*?2DKfUQonX(grFX^GSj87H5!r
z&eyY6`f&=8;v_O)61)zEUHxh9{Lk5%1<@7W$@A4<DW*2-_TWv=odGIB92mY^AW`)d
z_&jB+poUVV0u(<~N6)C}-8mF!dLmT;wDe851_dL7yU*V1NaO>2ZuU)|NJT@klMfj#
zXNmpL86?Hg<qmFBl(D4#!*BRqW3qo0sQ`iiFLBUEtZxrfgJK*zpUFo|m$T+WgJ->l
zteC)l-95XtwZ%3K!1`E5Fb33xksCZenT$k$_Z|&O1ZCoA6<<f_;spR}&1*~GjNsyf
zXMrD0c&K!b_E)q{U5~VizEc;S{?AoZ1FNWDM^&l?gO!mKM@vhKWm~KmDdBoXS|e5E
z>t8+U0V}bpObNHH{#tv0Bz$$86Otkx^Mc{hfBg5~7UFNT(1){sP7oyLC;-3p3$*(D
z+7Ex;^g}zJ126Rac5Lu3uk6?CW;_Pq0m+K4M4n#)^5;$afiVN{8z+BJ)BGMb=Q9$E
z-?xvrzW+m@)K$PQ*m`%%TKze#?*NR)>%^aU_TP`$zv5&AvYXwYJI(s%vjQ&w2}yq^
z`Y(hb|Gf)!bikrrH`UYnGeJlnstG=G&=P#~KPKT<i0~~JfSX9=b6fut>I=U3;XL?E
zSX%F2K=}WyBF~)yQjozE-tg-b{{6Wxs9}dYUnt&B8~mGO{QRFfBS~7_GB0ZVIjyO5
zV7@lV_!F-DV<P|gXW&E9Pzqy$5B`yDAUm{e3WhR%rsT+<5BTrjQD+51dF(E9@x-5Z
zrj7$K*_4-+|38O9c9IjK9PoXC<>wpzUcS>d-~k8W6oY@~O8$qugEd&o26DaIchBt4
zTObceVC+Kb`pI9b`R7gh>kml*I}CrzRC+%K@@voRf9)I!Jm5pE66>Gw!+-qjT0XcF
zyKZU!=Tjg$q@m=retiFrGNga}1kl=ar0JuN?Ee?Rw`2rs*QOs~@dwuMA2S%ZM0%h6
z)2)9nQUL()IUux;gn6=mE9d`y;a@{CA^pgUP>SEO`tvHVk0eEvm}rTAk)oeB?T;xi
z9Bfwkcu|Ufj1c^(euktb+~3OH{8NbjTiis!Z}1)dmsw>Yp@P4Jb-w+V_x#V>BZI*&
z^e(5lxBTaSf4p`811AK3?oaNne<%is9Iy<uLvq_>|78Vlg59SUXfFPLsn(1PAR(`+
z^Ab<~c_)1W_-ruoU#c1YYeLBmkw7nSJ7cwuKW%M*wE~|RJLEn5$LRm~^BO;pf@>nI
zA<zE!h;l8MB*%YQp80dK{`=-gK`^Z^r>?su{&^>a1I$+h9bgjFjgN<BR8(Azhe9)u
znYzQn!x=*Kq0T{h`?^<jf}A<%@HJJ{U`tD@>sorzme$tSw6vlDvn=iRqVx4+g1HVa
zMVLyPsy`x&T?}&tkq%Kg@zS<7(?c<om=Ft+&iH)1sg?cQ`K!#uP}{6LS^irC%rE)Q
zgtxx9naTXkL3nCl($B2LL`RDRNu#gbgqc!$1NQC)V<2~&%oN@mSL^KlKYTvqYei<C
z^%x?ZZERj`Z>usSJBP!sM(=Akb-TdCM2F_i&M45pp;?lQ;4#N<Kk~JIsC{KRMpNAD
zcxSCg<wl|aIb{a=U8O~dRRWE>CE-~~W~pdRGW<UN2EMp+h&uqXeKccrQz;ofYqTWm
z4t9ofpojlPg#d_1UF-Unz25T|SY-^8iIHgz(lIiAxH6yV9u;X50aAtw{DP77_0_MO
zqfCtw5OYbYao<eg*UhxG_N|^&`#?ohQ%nu2O>;|cb_<Jv8Qvj%lhfo-&y*hr7%pFT
zA}<imt};la0-^pqWmia;=)Y*ijORc`Iz&8Snn}0yF`l*bKPV!4v{K8<|9TR3RA;4{
z!y9>N2@!SOg3rfQmJd86^$7V9XEV+tjxm@Zp>s<);QdGK8=jMlnuC0iE#n054I0bl
zyW>EZAfJzBtdxknkRwrmYW$0m>A3=?;4AeQ;4g^MmFns1WA!1EkmBW4b8{~_FE4+i
zSX@HW{sXhPO;_rhR*8co?Za6_u@*N7=p}`w+qt({Z5$k=I|H-c96=Vy3JdWScLu(p
zKHvRxE6ivr3pZ!Els3~@`|OidYw(w1%Oo+w;_a?u%%(56wki||FJ{Eu-;hQb3V~Zd
zT5^WJHm*p=q06t<8h4#F6AayDHSlskX(Z@yGJLWOcHlKs`;Lvt(+~ebI{rU1sc+)p
z3WU!h@_CQJema*6sZ=J&RXG7Y*=x@Jr(%fwOj4ny6F~L=cW=LIaNLWyD85G&TQ5>#
z><_LUXS#cq^d(3OWhtucu@V!&BxIIlN`3aBVKxS)a>a4n`PL8m_hg!-A~07JM!Oq|
zEpcYkO`d0PP0OF3hPI0C`+uCULoGQYU!_)!y}uzei!H5gd|;6G89zJpUV-UF#TP#_
zaWlnmHZYGfCV?JX*v66quT~l((#pIr<TOc!o0xEuubEJZ{fRuIS2qWW{xy^S!52|c
zYzH4QGc$wwt_z^P>$QOBzNH!|z0b|7Ya-ytbDIMj70ozwRBy8PrTI>?7t7Q}Tp1fJ
zO#Nooj?;)jT(OUvKJARlU5$NXA=Gf9f{tbCJ?4z1u4dzPOEtXC1wZGw#7@fE&5y>1
z4CqPcjC|m2A{em9;uCRR60yVw!N{D>T7v@souBqW{9jbp6L9c3*A;f}M!s@}CUO|-
zTmV&zc4o0$`+KbPWEbw<Rb6CX!cqN66Y=1g^hY=^tfY4M(8p@m^D)+D-(mMyNzauD
z-2N0WDqUh~x>NqT;VrL4XfhtoCd~bVaiso`&LU~Y6;iid*k8XRfw%oOU>DzCVEA8$
zNhB?hgdly{VS%SdVi<ep?#tb$zo<sqSqbFB;<rEnbx0ZDi+aAZ^VR0rX4H_TTl*Kb
z@k((=J1%60S9$S|IqMpjarQ-hIdek`i&pm>yvWNJ0L1fT%;O-EPCKE>d8&5v+ro|5
z&mRIwroc6>$fKRLOAtWn63*EAFNYr=0A!nz6g*(Fnsc!Vp%sd%9{o!Bz~iDf&%Q0O
zRsm75c=;+u-*d1N5P|@9{@jMOEAgTT*W5&3`$mhs`AZ+geQFl2$lVU#w-Y!64`Gvf
z1!I)DipYoh8>3quip5cRWU$da0`sRCyKlGv1tpHae;LB8uUq}lec|NII}7vP(n;C?
zHu1kWYd9eyI;i5yfKg8+Ut)5Lp7sX@JB{+nc94#i7U~#>^u-pI$6{L|Xx-M)tFJqi
z>Q^7TI$k_VQXt(FXCKXA*b;;QC2V3>NXKUF!&(JaR<L@JUF6N%H4)Zkmzf0i{Y!P5
zKuh=rj4A2>-0PzOI}nH8#_j%<I#-|vT^FD#xdwwdf>u(-P(iRGxOz|ja1=S?AsPB-
z0Dkzo>&;80x`#cs4;Dx@5eo($u{Qi5sU3~9{Tm@puerYovaD6=)Yz)wfvlw_cl{$i
z`<ayrG<)oetO3P~eOWUo5NzG|A+Io~qpZzJS7#i6hVAf({j)TJGNT*<0Na2$!U`1U
zM+zjGMT)3g5BufRL-fgW`Ry}m^OY=%ZgPiQzjyCmQ)wW(q23Trqsgt~Zl~p)<9T@(
z;$qGBA`e>aN76Z8AIe8mYJuIr^)=Q>)~E0(e>-KIbQkx1{Fxbnce}vi4eUFv9!=7Y
zI@xWmJYZ|SgHWGqEfF#01>ujDqJPtl<m9ugsen&3Dt>r_(OW`X{7OSO*sj+D1zP!j
zh+lSql6IL6;0R7YkEGR;^YQVmePS@57{JY2eezqpw8wQd&g~1;`4=hRLC5py8cBBH
zxtAo>zUu*x%FD4`r}c{vTA3OgTdDbW<@AJ~*;!+Xa8fKtohHzdqzgr)TF&e{i02+a
zih*h`I}70`V4eRLcb$(jGM{W)kHN(l<zUrxiuIq%t{13YAjK|a7i$@R6#BSJcL3FV
zT>lYDN!iivwZ@Qw%yHU?eUpb?{c_+BqIo2Z>`Ik3hhXNT$KMu!o^HxC-=FPNrb8!)
zBn4wy-sG@vDso=o>`sAm9T{mq4hr@US^P}y{)c38Mjh&rf|wcUi$q09VKdv>T3+4c
z4)*<W?1xi8AMvjE)Kt%K5B7vJ$Xc9aJg0i2TD!LQ0=m<IPBxr9`aB@;!u^e1n|b_B
zviB(QMU)VhCmfsk*9KNxjNkfOO=p$hkDpshgPh&p!eLDDn)`F*P5yXiVU<=q92^*~
zsYOTs<uK$YpJhoEF*4-R)NIFE3GUYcf1teRd*tH*a^eMgf03El{3A3heZ886O61r0
z{@SOwSUgqg=2mR=z3@Git1zMh37r<ULu{~pO8_MNp!3)ZdZv&d(k#3%nCM2cd|fhx
zVVU#frH%3xvIfs^G?CSA(qt$RNT;`sKIii~l6o9-YmEEba%t+UO)dwn(qs1de^HOu
zgz4Gi`&~DC2L|qilmU8ce%=1{4Tr|3?9cnGk+@<9AD<>!0GHMfmk=lIE=UeY((jIK
zsU|E<tIexXx2q+vJIZUQamG<VjYire?pZbQJ!O%-EiNIUlC{1G7%QY@m*Ss9j$u9L
z?l7CSm53aAv`=;w=tTWW7u_tTAEIR8B)hdYBu{rhAg2VufqK`I8T!Pa>jV4kyEhh0
zEKU%2a>b(GJZ4e0IB$27n&p(eq!{DE_qaDV1>bZJ+Mj&Ja@8TV=TJt&Qn8@X;9hkQ
zUetXlX~YZPw&1?z1_FQEZ3}RG+-ic?fT;btP{A{EY|Q4{j01-_50FuQRp-oERdO&3
z=Z$or4*>s*lnHz@Tw8tQ?kNbwnarGteE+}TPRM~@mmWOisK4|+uAbo4h1A{OI$Gj=
z4e1qM<+(WLePn5Vv4kwJ1M+SU&4DtZJW^+%<WLpq%XcvF;&FpQm$$3YFL?@Di32kh
zm0tMi#Tbh(QI9pJJ0l7<p4Lqr?!UM8t$Uf)n3lbiYX6a$=SAHdlC~_j=g^6X>&i84
z$qkj!sOJjy7T6eG(P9<SpdhA)(k|i~Hl|=ln~&{(%jZOB+G49aCEw8Tu53;&vR@<r
z&zE2)_n*vr3f)+Ld7BLGxF~+BF7Lg3bB*7oWR2hY^2SgAq=#x|9FDqZM#~@D$%r!&
z+2W#?A&0HgWaT@>VHQml{bH5izP^O1!SYqJ*7ja}p6|=2rHJoNW9?#oo+4`cHVpd@
zKA}G0Tp%bDQC&OSvE$LWG@Ws<#oju0^ZfE<3(&{&z@f8OIG>Of;h`{nB{_HjaKNV7
z5T1N|8c=KS;8n<vmHLmNgG(`<RB|ZWgD1H2S~&s!@6R?$EI;W_4kT>i?d>X~F!E_D
zyulDZhORmvqEXDoJz-;8)7U--rGzoP7t=BvqaPQlbju8#A&-nwDCZn+!mqKUouIt(
z3X*PN!6=JTRnc$!bj-s+Q?}vbW`DwCK-FAJ9lqe`Ib2$qXp-i*FAM7QfmCLa3AyY!
ztE!R?4f)e6UwnPQT-?Fx)6VU$Ug|1+=;vy>5zPOi?XBaYOxylp83qASDFvldKw?Cs
zYbcQp1Cf$8KqRD7L_ktOkVev?VdxM+kS?hqly0PEBnIB|8gzH>`?sI>eSXjG`_HbQ
z*;(hh&hzNw_<j$!T-nRVz<Z@K;NNT7_y6_1%%JzWhkviJDy6K<lIwvsM{|b80i}}r
zt__mqEqrs;$b6gr;4@|C_@=yL<?-!MulMZ~%8DjB1-GssPP~0pV?>v!OQPtDR8xB&
zC+hQjAnIL<s?Z&6AG=xxdalvpzBYrZVa%xKJ(Hrb_`w>7M6%&0knAhMgl0?Qdmk9#
zehj91zntk1YT5m9W}}9~_--gEBxz10iuPlH%OM?Ga$1o3a6CtzvNb74r0k+qi(LO3
zRY9_RhF`n#ULn#8$8jBbuv|*krfQu?*RSuv^4K^)F7Xa*2fK1WUyBX1+Heb&>O}t#
zag^##$-iI1o7zNHtr3XhppL995D(Ak*8W}<U~1dcA1$<JwrSQo2;M;2$y>I!+91}!
zIT*zX=_rdFJSOjskg{?0Aia*pBifCK=eR1IgUy9iUgAgickFUIe1%1+0cQ39@Y32R
zVLHWLjSfhp37=dGUZMU=;QY=|N75Vbv+VAuyz@1-3z{z@&MV4#K&8Oa4d1jgn7lEo
zahz7Frzh9EX5q*AtMjhoHwdafFAsCSRA7O@)2!~Ftg$Ik_WUU1ea%gJLiyV%FfIy7
zGq<4Mo1yqOLlab!SrYh9f{x%n+2Vp_2MOQ>9vMu^(cVAjy0f{ml55_KcCtL7FzK{-
z_Qj1Wa}#`Ra6Jn$uoK|#4*m#?ll}I1u8wI=1Ie7))3|3W6r?cBI6#pqhu^mys0ow#
zaPi@!_~?mQ=j9_W6;jpVPHRdD2<)d@I@H4FY0VCW{N%4koJzcV8B)z7Fjba&sB`yl
zI+_jmUyWpdsT2uIFu^y!lwUqeiZ`nGC;#&ho8yka+|66~@3n1PJg0;yQFPTlI^7-O
zT9cXCIC9Xhy3tq~;HLhiKS^WYfl$+aS^c%^MAcnt<?_|V7WbnjDT0m>7<qQ@N2B`{
zHTvEd1|8nCICQdURv}T2S-*ak`|$9T#VHTXq5}#3=*$qQ1AZK{y5=1J$1(ZMQF535
z<aJk^7-v8Ib>Yf2Lta6qxtGTT;S*ZOgZ?c$L!!-bJ{w_kKqC`NkX*Q{DrAA=gzY%L
zR?F1kx}B#Vy(@aHPcckK)@PF(Z|l~%D1;5Dg$)vAbyN>8u#Z%+y<ag$_OIWGykw9*
zDThosC_$3q&l&POzkLicn_c_CnqD^H7y;o8og9(OiCe*xUA(8wNI3j`ao8NTowH=|
z?eC*_+hRA~sb1__J#kOa!=|w3gKYjVb*J97Yh}i>jT=&9vucmyRM|9<v?j#~)B7h*
z3+tpius(%;$Zv`wC_X1Ro?o*g&g$?~Qt_wR&pfSo=s~`);-4|N+E+$A_6)n<U!L!e
zKQe;aPqpAQjj;2`P*!G#W*s6m)|RqsF&lJz!8)+A-F?sU3s-fj8eYD9FV&%^r&ozC
zL@@gRQ7PBv)EXh3n+OR{9|6LYc6nO<_s{-1zC@w+EBF&Z{yM&v;4}CGexbl}7j?PG
zA3WCp_uoI4I5iR(;VUy65)fLzmFly4J~FmcJ;>MCoU*GG1rKv%EOvbr%VG~&mAvub
zfjf7rJJrBL$@@h*!76^HO)4VuIDQG)TR24**H+s_0sJkIuv3({ne^>Ye-3lPe-MQ5
z%NU|#B!}(%G>+P2z(3$0_jq_tr__-|CAa*J-RGns$ob4xn3H3$V#QlZqP=_T&Ii$k
zV$YGL^huVdND*KNa|;ga3{j6v7M?GAK0Y?5#DGBWbbGy33)rBWy(;Sld0(9(VW6I$
zmpyw-@K4aJiC0IIn53M;p}dWd9Lk%$WXk4Y^ioKDB|fKnjU~0yd*urOUWxxp6R4Dt
z0mTv*h6W;@-Q~QD%zF~VN?`}v5zX_Ny+}9IU+Z$P=6U&DnrrZMy76r0NsZoR&jn5d
zd_olxu7hdso4o)29cmYRpwZUJG0_h3HJ+zXU^xrio{T}_>Kz=LI}bf7#jbiP5Xk@u
z5r&bV`UT6OWM@zzktuybt!4OYU<pO`&3Nf7YMl}7IkXxz@E2D1ouo+SCOtHI9RCm9
z19zr<f#7u4J)*)q=B+DXhd(V2-}BiuMF)i5P}<NH`4!HUQFej#KB6#pPPs$bRpIpY
zm3eC&V=spf%Fg(`Y2QujPr2|Q<Io&=9$IpWt|n}J#_WIH0RC}PZ$ly3wX_L0pzySz
zFCS9`5fSXJnn*In<TiaWtGzvz!o@e55@<`p5#}pUGgn5@#Y_6jP@gA&Z>mTag_7Zg
zu%1NGc8s=U|A{?2BmRR4wclz}Gr%GJw;>e~b$&o0cy0J5k$ENy+)TM{Ux3^BNYG3O
z=aua;YVfv<#Q*Z!qV7OZG<z!I3@;J>eo~{L-)Z#qHCCZGJT+ZXmQ<~UI7>tPfl*v$
zxwldCW{WG7e*W+Sli%)Vt@_-&_@7qv4=Y8%{py$d;rltILxDdHHZ@3a{ijioGX49$
z4!$XF!e;?RR7d<0Aqk~H{<|jS2!S+g=P`omm^@z8xFP>|oMi4LTo8W%950W+b~2Ln
zKNI1V-4vcCvKn&Br@rj@N&E+EoWC3p^Z5N2$@p{r^SJP?$nP;Yc4ef=k46Q#L(|8Z
z8iI%?_?Hz8zDY7iR^!S|f`6>nPy`~xlB!4bE3~)<BbkeGw>nFUf2${yLBmyudpOd`
z%M$nx8e)+>Heun!1YVwbD(;7`_Frms?3}MJ6M@%9TJl5rVu=QNbLS|0Q}yvLccOZP
zz)QE2Z}Ktzwl2VQ60k}+vZf<f@H*o6lj@i4j93*`>BP$@bmV_IF62kxBY+71oOsQ0
z_?%Qggxmjp5e9l`B6aFes<a_Tb@pFYf5>ard<zMDe5hHFalb_PFKax>9I$MjYubl;
zC=V%z)&F10ars4E%S&DjB_*XwY)(nZ*K0R!pgbfm9q}uJZfIE+|7w0c)D-A}Of_2U
z)tzB~VY7qBQiJ}!DZpgNo<Olis;06pUsrA?yQ-{m3@$<Y%cgfc6235O1D9wK5wvb~
zJ|}k4Z{jf4r0Ak`G18{{PYF2`mWCJL?}Tp_R6U$`I_5{r?AZk|(}1zO8bJWBD=uIA
zOs`S;U{rVAQtb@j2`pcD_rA&og4DEw0oUne#LfJ=&@+PdBR&T>tL!A_i-69id<ekf
zt0rxL<9|;APICS5B(-nBz*t{FIe>Af59AuPgB`TingH?inC@qHgtr9%27P;(1jbB<
z0NF-07|rw<Hw2`$Ghnd!LLh@fP&uG&Z2wGex5Q{o2&1@glt5aK0A5cTU2p6KNDiz3
zPD>cHO&=&E*c1kDgDEvwSj;`+GjF09LHZT_%inT~opd@6%PiDr8<O~H`RO*h`fvAB
zPs?cJ{}=W7<B!W=FbP;SOa<zNp`Dsqh#T0bP|f;m01XgHynP$C3JU&iVD7$Z58y)u
zA*P2?lcmdEUe)@5eNUP-pbz`w6L|udPL^7I2d(Z9a$dTbH*$a*KZpbKto`U(zzbnS
z@cLZPoym<(S#rk88D5e7rJ~L@z-MwS*9r`jIX0dn(nHFTOsPQ5;S3}l4A!uX*-lZg
z=jplV6K~v39P|E<z_FTY)^YSYE=LYNKfXJLbt;|vIexHT3SskMTWyKry?|PlBQmD7
z<JSEg%bE6sSxX#%5VUu_R;b1io)oKt2;s)|0W`!4B3N+WU9M)G@Gij8ff;A=tJkk*
zRyI%sfg0)NbFmXn^{f{xTTTgi?KnjQNd1^P(8QkfEET-l!@)k`bmCJWxhQTIJ209y
zsXGK_Pj}AWR&E>%9_`g`aeLjbuU_T4X2wpQy6wN|R@5%C!S!em11K0qO5c3#>pRt#
z<$B2*jQX_!?kuw@ImvCKOAo&xg}_uDdo8v14}a!U*AM{{8o&JQn6+qfb;NLDPBbc5
z++cse0_^(L2P-a~dvtFfEl&Z*ygvYd1H>!JHa`JH#iF;x1CUCRCPn==(X&;_XNB?h
z@jtV}q(r=0B<*RXrhX4`_3o6$9*_0{^mc8~D#I(ijFjKEtNWhKEx*(=?*63I1i)-+
zlur!Z=QFMP-srduBxxXh0OLUdfM*G5=kYz=S{f3Hys?lZ)G5_F;?%1_qzBL`v+;oR
zQN-MBEeH@hiUDGgwoY%1kPj7_qB$6H2v(3o5bJ>N1HO%{!5H<&kK9NW%O=A&p7KpM
z65743CnT5pR`aOQWLynVJtfmOqt$9DnQ%sdso_Ow)g3XgQKk*>#iUg((}@ZTXI5R$
zI)!op8wqE?nwevpUSRp|B{1k`$`Zy%G6ngY+>GXdF*tyqh;9Hqb8SCPFVc3}8-Nbn
z@9u{|;G!9TXxn;WQBw+lXdb(b529O)EvdU=9gJ@-y~^B!SQa2?Eb{s~O%a$Hl#GnA
zRUUgRV%2tL0}Qdc>odF0vG%4bliSJKC_GsKY!B~wJr6p4_9v~-z!r>x%|<0wU8!=W
zO4Ux3%q<Fz>oKASb_9q|F7(jKTWE|@cV@;}1{0<9>-P1nC7IHL@wfk0sAFjAJEB|<
zJvcaL<h#!DN=%cKjLnlafs@?p3w<94L>;*zrN8ikm`I4oo?#<UcJCt~xIFQCC_`p@
z`I;)R;Oj7Z7Kh()IJ?W+Zq~nx!@KtJe%0>aJ)awY26dNRarfn1F3iHhLNq~Xsjo5J
zDY@EBHGkKDad69zL}$eke8-q7U9)NZEIa}+G+iM_oB*?l*4fVh0ttr3E5|c4qK^34
zKrzM!D->hcpL+;Y_N*JSm08ir6^#7vMpZ3?|8bzdKfcCm*L^vdM6+s)b|OwX;mjwR
zw4j^NdLQiYgU&DvMOO&-1b|``=m@^X97HOd6a<j*vK1-?76b@cHtLmToH=fj&1LfJ
zw%^*HK^q`V&U?JnKqAb~f3523%<i(SMBM5G#KxgguVQ$Dw2hb~AVw!byDPmH>x*4h
z$0`y;VoGPAg@=BkZ9j!t7>t>!s1X&Wa%1X0z=Y|=3j-%xdFLm-V=-tuQDr7Ki!2)k
zHHu%(37)htc%1W|qX>aD+FyQEAFT6E$fpiuf%wL4jy|r=N++fjFr1TceO@~LgoyGh
zgg&@SKJfKxIr&@Jt-h;wBhbOLh7bK95U2WUJC}k*b6KX}*EMO6>sI@_>(bVRVcKsD
z4RivRJ8By|ef?|6qt;PWD?f~n#&?XO*L^~UiILd8i85blYIvQ$bmYZ^saE)-C%(qU
zO%T@S6(D^rXY+%YQ!8KUC4$3x=><??xm`#&F~Gf+s$jd2#$hv&+rVavK+qk><~SKO
z5%Nv8GYo*%Sk)B1$#dmO^K)dMjRvU5h?{X3G>~Lan_r<-N<BB`wcIrZbH8f`*iv$F
z)Oqy~u9EPvd!=j~rYKl&3Y#B9Ap@YwdanDQnD;MSeZ(o<&jfQ{%kcPo);eR8n!xKA
z71cV+ui6B$Y9WmZOOmfKQz4bz)O=M8B#uw79`kq^;#+fVqn=I64{)`I16GiS!}scE
z+V|TocAi@EyxDv%HFo?Q+NMb3rai(am(1-I-{_~li$FgYbA;TJu;<rpPfb{k>m|0o
zqJ-)*w|vZ;C8)bcxjTkbEfXZri5g2+Uj@2&fE`rEl(lw%p4@7E>WhBfG>8KF86MUV
z@N9D|m(M1vsdPp|USp$r)eCWzCY&?$w-K%vxb~C~A8Y?d2zvzXz<PV!=K5L{C>1)g
zUP<n_!lI5ujLl4aZNTkpk=>prA@EB5$mZ+-f;Sznk4gZwyHHrd3;JyUwE8O6vxO)7
z%=Vz^w>m#70B9_U8pQ!}^f<^FFAKsq?-oS9B7{<u4}Vk&7!WX1vrqtM9gsTM+u-qs
zen2&y=$r+$`Kg<>D$ictLLzFf1589b%8q2N*NjzA8DIJ+YJ@J96kKeVT1mQcgvbQX
z*OQE_sikN>3t3tMFV-!T@>w^@b}&%?3bg>y+-?b^V7|EoHy)dd5St*`07za}jpNKR
zBVG?b6cluiyjF?h`ppFZ?8pqj#cqWMNZZ&Buo5XgL?rtH9rV!S;}*FN52rP9dcOOu
zis9g!Ke_yDvT?c%$5Xtx?L@tzW=!|HV9ne4<@{D+4yb>f{-l*CCb;aoB+U4Q!w$JN
zPJKFIb9ek;%&WIW8aqNw@j1lE6CfoBA7xW7wI(S0Y`r%rCx4DGt{S}JGi7Q+`Ay9g
zU<5}*OW^0txYmBFAGOc?MdaV9U!-bX&CoMnnU|D26#1l2Nar|HNG>YA`c57P-{j}#
zzufSh4)mLn`+3tCVr#Y59%sK+ixtT7IoMx$00Jw@2u->j%<}zr@7_6yawY@5s>*y>
zfZ=6No@y)_lUV#<t|_x^;Rs-F?%PUx+##I%EO~_eT_yMRdMjP*Mm2(`<q`p2>J`{w
z*><`vgtoq21l?v+wf6b!Zmh1(m3k0bp84hlI6UKZ(k};0X=>0UgSfYRk@Di!8$oct
zI;{M(P)6eh>YSt#V$>wm=FP8q-11vFQh{GVsre6574XbI4kB*o{czMx+OsoRdelfI
zc9Lq(xm)APMkk;{vN@*_Kh<A49b-^|(Hb@e2mu(ARipE+(hRCP1|w9RRZ~+l<_XAq
za&b}nwtyLTMVV=?MKt<W=vq|DUIVq%pqCudj@nd~8M5H7mBug}6hL1^8ijTMl9lm}
zOq8#2Re1|G|7e^~aJ35UlDK}JakV;#*hfBW5Aqg>Q=e1605HFq=onYsSn-feuTLjL
zH{+QuS_D0JOOhS*Y8FB8Wmd0aKdpXr4&g^#*j*}$;58hODzff$o=vH+YXam9>AY8B
zoxTeK23ur|I@6rx{=5%6`dos|M2FW_=_kOv5xRFYvJ`eDlK8u&G2g7(C%{yD7g}O4
z`e+h_$*rf4wJ5kaQ-og>eOX@Qdcf(#^edlDnpF+zxRNer-8vxhs4r1t=C0X&upyM1
z9VJ)wCZs*G-1Jorxnyr<a*>f^yYLJ|(00G0T6sy98*4IM`gnY|DpbuTA1=P%o3elD
z0y(s7q8-p5FI_h$`!OAM9-Q`#TQua-n~@&1Sb)>mXesJ;JIshA<dF!UD)`^Y>=8c_
z%7+h<QQNXPIXSi+6BY@Mgypu4&raKhyX1<@o^wekx-%kjA0vgOe!W85cbYNqGtqVV
z*P0sNKrDFI@j-B)H`w1t_ifVk*zu`HQY&svjGdl-=EO{{sV;3}52Xl+)+LNrtN03+
zSEDvs+*e=ue4?x^W%Suw^Q*cAuxa6H;xj?axJGp1z|W&COkiKU-(<yP5H*@%4at&+
zVlOCS`Fd`WM+B^zyx8@WJ+<?_Y7?(n>Yl!J(&<4L_@>)eWh)YHf)YWx`|jlvDJB*9
z?FT%1vUfzs;8T+Q2SzI-9aUb|reiqV9P@Wz>t-2a9XbpYsy?B@9>QT`f*zmN9@4&1
zuG!@b(kR+BkNxV^bk#Uv(8R}kv<C3vpfe6C5C!b118EOz&<OyD&iT;LIWZ76oEX?;
zNI#p`TD$D}#@4anG>@eaXS1Dy4`bmn$=1cwq|(m7un;d4E+@06lJmC`kXW#PD-|j<
zT1geTIq856#7KtM<yNlH{mk9)2~2h#zRSaCKURObc~$Dd^2~D&&TwphouKlS7+quP
zDapR^n6@O2Df2ugu<TZ3mS7est((1RzBE|i=cJ6x)9|nt*r>-8>J0~PZ_E<!@StXZ
z?Ip<wu5J?!8r^h!X{(H6zBS^ODiJwOIi5XL;?p~b+aBulrg@{_z0vF?2!q?e?wMag
zMYwF%U=$|9AEaPfwCeV~d9jHaK~rW4945+bLk*}9uagP%&%!9_e}MfQs<93yGZTw6
z;x2OD_Ge)ANMLs&&lqBa_N@~(C4mK?`oqTF+tbM8^l*vuk+Xnrh@1h8z|o3zoP<aF
z4xb4Vmd-5*SMXl^a_h~9;Fj^?56@d}z5NikGoWo**#)|@+78iwpQ9?))vWpZ)+8aX
z+NO~V!rTo!&!r)KnmJNaKqvgRy*$l5hKSAmi7`}l<Ql|_B56f-0J`Xz{FJ%q34irn
zl&>+Iaeoi|>%j%Jcv-EiWr&i6UV)V!l?rAPtG$>k*Oun9Q%-I&0%v9&a8VvA!U%}I
z1mh2_?fw`t_S+$XHoIKp0ow}a2&y;UVe7CtL9qJAlWW3}AcP%%RP^l4M>}&xh8F^Z
z@?eE#zO4b$F5)Xq7ewH|!`7N#AtcQgn|qK+We%`erR|8+=eA9gX1=Vj9VctwVne9g
z^5#Up*noW`VjsQ-bC2VKxX=7nC1#gz`pG>7j-{6;JCTYTI&9*Wg$|HV!nUU*Z_He#
zawySTN9w&=z7m_PiA=FI9!$ol>JMUkz#e4VaO?59!F9^%Y2MV>3S3o|Mnaa+hFQ}m
zAC`y>8rbS9ubPZp1H0<4k{w6kd+@%`ca~&tgxf9$ex9Bqw2g@cWd$2~_5|A(QjCJu
z)TR~uGgvg)0ZOXu9C_U|ovN^PR0*BOJ})`u1hb6P?b0Q0aXW<*44`;&@W9%>v2I^*
zxR!m%BkhG=4+(IOZ^F6<Wtd96Ks|e>EJ=Ka?C(M%(7q$URZ(eYJnOhzM`Jv0-^9oh
zLJu)mOYs4x`r-@XM`U9#v;@WyM~^Z4axEo$*Cs?~{h|7~Rn>i>QwPp9F!y;ondKnj
zOf&h{Fn7wb!DL2=5GS_UXOCnqL|ihd@&iad4Ij{fDs)T&@iHy=A#<@jPjZq%C5vy^
zj(cQtdrWhUjvo$oZ=e7hUs8{t!9%W)y@lmgnzBsluFg0it}f-u_I#Wt(I&>uKi^##
zml<oUdiMTJ`L_*cPy;@cgvXedqd-*msRK4&4t4!>=s(yCn6qeIB>6e3XGRZpLzmRK
zj6%8gnL9wDa5w>Sj%+g2ocfqkCM&H6r}M`Huf$dqzh@Mtu$^pq&Eh^6vq$D+Np&eg
zzpz2t!lN@u6j8b>xP5F6+}4(hKSs-JKFVilKM<|>V^#JX+AM^W;)*iTHuUrSx|2mb
zq~kUTs5ChikfFSO(T;aV@U`{Iy8Uo+G;K`zQ{DC<kg+Et5BltbZP82KU+A6pCL=u(
z=O267>95e<&mU(=-(m!`vbL+$*kmjAr^u<qr>8tr`>fbf5iuOoe_NzI4(i#RwjV{F
zX2%GWvJ)6MJp|>YY*$q(%JQc+;BLMxraftZSQTlu%+Ob>m*0w_&H6xXjQNhjFr{g5
z6_eZc`n2stfw7|FzIU@TP#2dmx27CrnoM9xD^My?=gN)4Ed*7nX3(}*_T?48eOHcf
z#u`pIe}{;KQhh+7TUsc(w~;oiRfFSR+GmH2R9rpDpjjxCp0{g)rLwJ6EkZ!OqN*;A
z*-@`lV~z7ZJQz$~z$N=QQgS@=?H+$>6H<m;ddC;u@_xmZ{=D1z=`J;&>la+R<cLc^
zOzCKQ{&=F4n}aI-3$6j}V}egNn>yvZ34?A<fLMz(1Ng7450MB)&?KiT`AC<&D0KG=
z$2Z!pR+p3!Y<{nWW;Sb-Z%ui*`1A?(iI4p!QQ147Xz{W2MZ57AYys|J-X_@nZ0Axv
zuIg6s95t6mK~U}Vu6pTZU-g~tG+(2&&Je&Z(^6MZVBVzq`~#~ALG}3933?H}VsBZk
zZT?hK07vxmwtA<~O5tJ*S$qLeQb@g5$d_HD2t2%RtcWL2<j)#l41^>dI<l~wnOYN>
zMu}0)t8mHzX1A&5eyctOTxR|bq?xaZ+T(?JZ!b1#&MVAdR^gRe7-=In3TdPKak}%h
zf_to^<=U0!$?L!D8LqHXONc@qx+&>tI3a=8NGAvG@0(u~`0BTBYgR8U7{otcgHk%H
zCA}5hs%m^TFXRN(t`hu(>B>mC-((?@P5y)r#oCkFlLmuHwt_9*VbwuLdiY%#+~;2V
zIUl3!QmajIn~C$KH9NSuq{K{#rKPiB^%NL;-9Q$VlId!%O9ROQb#xI_{Qitt3m=P!
ze^Zd&q~(#x3aq;#12@@*H$l8-?K5tJ$0SsH<E7r@n+|(`ZQ?jXsWeQD$)MpIHX~Le
zlG~1ctrUS~dsyrr#JD7QiY=9PO=(cU6i^)8PDRWsMmX0x)!r0*$_G>P@TOr~hy^_f
z9_rY~AZH01z8$6}czGd+n83sM9HuV$Q!w$3tqS)Z6)vJ0b`!v3Q-@RzJwqwx4a&Vl
z;ibjJa7B#S)xF1+HkgGl(J_)f#P|T4c9B2HN!<AKyp0OV?RDRfF-CO(#q1eH{7$&p
zV0aJLxn)}D3ExCnZ>!r$MTySd@d0BbX8>_$tU%M(-8`n)n;mf(fnHApUprE0)2G{)
zE9c<4%0_Unap7DPB|sjUEfOT$JNmo2y3W~!QKD@FL6QNlIcPjOwc};Hl&G=e@bh~h
z@i2BAQL>sj>{Tk=+A7vdWIvpS(lXmMJz7w1mV$FzvMoq~Xs;?3R2DfP*TR4`T@(Xt
zSe$x~&)>zR+F+0pYD|^cNO(~ic-jMs-*WZ7jS2z2pbG{xOiOy-hGFhJHVDnZv=eTb
zRsFnc03c2{%i3!e&CeFOKKVI}EP8;^gEdo|pt^rHLMel5NwMJ@b1PtC{oWY^&?qo>
zw+p7AmQG%L094AumMs;lov*_IrO0K?3(o|Ygmuij3DX`IQsg(Dfii3~`PM}C_%fSf
z^aby|pTOnwr^W`x+I+7d;l6Z9MC52oh|yM{&0|HkS8BT%1-7y!GPOaP>ojbs0~LD(
zp>m1`z*t$Un(R%e`keKs1R}w|w;6JlvI|{2gn&|5NE|}W(pyd{)zNgd61Gx-w;hJN
zb*a^Z4g=%QaMY|BNN-3ON@pD}rgTYg%78M_sQXq55C$k!h>k5!dbV3~G8pXAX+_q^
z6K(EGJgPheq@hq6-9q1asri*nC4y<OC;&)<SuJi>o{58;40T3lDd!1DxTUp~D*{)S
z+|p|`hA_2$EFZjjqU0clG0pT6xC?y5nv9PCSbC*fxj{H6;{_#hLKJAtYS63@Piiom
zwZVLv#wb{!+6yHuWiRmGmzl3W*k3(3YLhsUUE)7D3M~lX5kaFKIgsnGh*L{2A6f<9
z|FKng-bi$i=2ta#;}f*$O3WElb<4)uaoe^Z1ENpo$?r?eCVS-G7(zMC_tXheJ{bh!
z&<7R)&~YP{pYT77)<q)Nj#Fkbcq|q0B-`Q4r2!lL()X#Vlsw=4r}Pg<^2Gp;4$O8)
zo&??N!y+U}(Ts#bzmCWfg_BAeeS@t2S<hck19@1W)Ozv*^B4!p_C1&$H3U(Oqb)GS
zUEWGnu7rIo6GFAskr*6n0*j7Ker=WOG#OdusjiTp6QEP`pol1Ozor=jS|0Tk)K?If
zLrrBzxX7Pxk2`>Q8sGRNwqN02S@U-tsmt)CRg*0yUeuQZBR-Vc3?Is?h-lMcyn!b7
zi$V|GR2U$3vlYB0;sG`UDHFA%02#aWh((~px26xHs;KOJ(#*h?V4RdIk)k=Oqu2X(
zSBItyYzMGK99`)AN?5&V;O`|p$aeXQbtgS;GR78^;DxpeKycnFZT6>Q*p>V+;wZuz
zIiGA<K4W9nG|lu{%FsGw1~)zr*y$c>auvK1PZ&urnN6QKG0wa+&bn`2XzP(W0Fr=h
z8_6Y~PYFqSXN-V7<MG<qc<#N;{J3=Swrt#?8PHkypPK<Bv^;RwoNeOxf&Am3i%Uw;
zPB3@0S`{Dij_YQ(GU21}vqG22-R!d(xhrc6FPx%L<xH&w45mT?`9IGNG0}b6i4l;7
zBK!v#<e+uuhSm@ro$^`|C17x9W*sYVGG^)B3cf@_f;R#q*V4}2;}azxMuhtEfBsRM
z*+BE+%crX-<uNDN4(RO(-k#huHl99#@b&<`pbTVF5h>O3{xiLi{M%$S$JUSt=g*i2
zORKfj{1aP-k8zUn3vcuCI&WQjvi|Am39<{PBv(s4*m^dxYTjCN_6EhzOXMy(xkClE
zd;Y>Jn_O?G2}r2B$Y60EKWniofM^c|wNE0gKt+4xjZQkuZLi+$z)*cD_&|=6C!yVV
z2v-g2E*UpfxnKI$fRLbSx~=mD%5r7?V6e%u<|Y3WI|%ysY=an&lX-v4IN%q>7?|$?
zw(qqod|m?){DxrQD&qz7`>^h^5%zxXJBBO!UEWR9`LoFB<RVgn+N9{!xd@q^W<qmp
zY4xlP8wNES=Ur)P*D56%t38*fv49%)WD`-EwV*@edNx5k)w-N4P5zR&r6&L?LEh$q
zLT3R37LBDJ{^T-)=P+F>flCog(h`v=NmJC2;~7!@Fo{GmV}(=>{x*69SPH1c|E+L-
zQ^`iI!UTzU*dcqcSNFJnu)v(qY#oRKk2S)~6VTwi7&*7KOUvEE|G?r_=!-@#pKZ`m
z2;^7%ViwL93U(gZ`|UeLgHqDvZSko}TQbv;s86yKB&=Y%f-cZvF@FjqdXhHZE?v`w
zp~^lYK1T+IHdK}$R9>(8vWx8{otv)winvYv{k2T~6!sp%x#Q#zJXp`rUMUraIb|M1
zYjPmwG_sCNlsfeg_!r_GwkFVgKrpS8Fb6cu!!t1Ax0zwyzb+bseYtEwoli8+c4mOZ
zk>|iA%~K0K-aTJ)AhZ8-5-Gk$hmd0`TOZ(ZWR<ii(gTTtUg}A=GvY?v0lqcT%P*Hz
z#ydHCoo#JxE55tm1@ZrM;yn*jM-w*+jg2c+po!$ZJXC8k^%D^AS5MB1fX-A6(hDl~
zsanP3)m-%tH3yxGp(n^Jj~GUAYwEluOyc#L$;KPa^h$s^bSHWe6nM$0vv!xS4Wc><
zmWkohE@~C|y_%9lOV_~)$qJjhy%sA1c624XY_*jnNg+^%KPlsm&+bxGcF6xOyF12$
z9}FRg)yPJ?0L=zt?>#mN{W>gyCV+G<1#B;<V`~77qorpgIAePp+3r5|_dFAti+f{<
zJ#NP29@P&DKw`G>ygJeW<iVxw38g!B?KE##Qn4v2sHnrF9b5K?5+lzEKJB|Bo6l*i
zj}wuj#V+?R6X#6{udh?Y)h<EBEZWwEZY;DfvyauxFaKL<Nza2Cra8chTZc4YdmK4V
zwr*hHe^BaI?B{Fzg@P;Km(Px>kF&Snic~=&G8?mg+J@TZLB)ndpAOFPc{Yxs>X)@(
zs^En%MIq@Nh=3Z9J^~eUX-KzG9&m#|PumbU^^Ktz;v}H}D1js-T}Q?-j)4IKqz}|W
zN3^CXg}|CD_@Hi(i`3{*P$Re|p?r9G_x|(pe8;_8T;3fdTPk-9<(ALHN3XiLaT`9_
zq6-H*jgZM@By-az61>p~9jKO(z7*w|x&XMF(7RfuZ4Jda!$WJ_{r?@5y;rIx`j&o$
zi!%~j*-gd06%+Lzc7ddG^mKGEOT`fuHhG^RAZC*MTk0V?Y)d}|SkVyg@38x`(_JBA
zJ>&gBl<d00Jh8sUPcDGPMn0b-+I49Biq&O|<8+T|$Y--dY8Xq81P!F=8M)m6%I0&Q
zBX5DaW|uGH5A>4@AV2=`74YjOm?<}!=Q0+OQYkge*_ohl<WAd*yqA&VgM+VnG%HFQ
zor(b{;W1J2iK_-yO{nH;XYMl9<~Mdevn2sjOovJM%~};LCW76{_EkUQ%e-cGyB_0q
zh<Xq$|5yPft_K?-tC^Z!A<t6oiFjC&?F5oDuOL=zX?auav^*?5Y{x+(7Y+7qq+rZt
zFR++3szV7^n;dTTYD1iJ86Z}Mxjg_yZX}HXl4q;^l^}a$Q?0-6m{z)@E#A(i5By<g
zgN73|NCvUPdmEwQ@kJ`KQ{ErOWu&&JqFykNV6Z;Q;Og4bC5XvFaJU%T_H4U=sDhsx
zK{+L#o{&<*-0&-O)e;6bK=>oTIhw+PjmFusreb^N8PFih3*UY7hyhGndY_w@{hRJT
z1-CE0{ZC{ll2mg=0Jd|Q_eSxy3FE5CO~?b?)W5VgTS8k?|HLPbCOyM=_fcIBF=hYm
zCp{Cdmp#@-LEWCfG2BV@0b7P%F*!_vi5G!~hE-JC{>40FxIObFZt~52?<cmc^{;B}
z)>+^LumB1$`V&U>Ha*%B($49@H}5A&21UN0D0`y5L~#+<DC5T8n!?<-r6nwyDe@9s
z!?!$|8AWVv4$E0lb3AL(_t`C!zSs9Ax<ZlV_H1htAr5Sug-t6VZ_7Ff+fOtgneOIQ
zOLt`-zohYa^P{XY<zp%qZD=qZ%DHJJ1X>y+kRk-tp?9DH>Z<I4i|H$0;~BMm&sakT
zmD>l2jvXpwyb0BGq7MvHneI+D(wZFa<3#m%-_*CsX1v%=hVC^UA~zccvjffpRbJ@b
z%23gz6L)pF!R_N{=-mjz#sxyMO+CD&eD*!_d<soFw=*NweH(!PrfJTWgcenPW2pI2
zPv#y36ddG2hAZFi$zBq0@wrnwNvdeuaSncQC<`wJOM$a8phKX7c`W72=crYivr0lx
zJ>Yko9wTif`F_N%q{&*g&vrZl;(jCiS_KwvjSXr^%x9oD)nee`t>Jr2&pkeRUtX^a
z=_)4y6*sY!^Z|R8)QH`<jD!E`J{}Ig0$3w79QJU?X@?DCRuMGTOJrb^8$t$(ZG~OA
z+e<eao|r;8Rx~IMdFU>j)>44>Whc09o$kb-tPSsu(<l#{7ZPo<D~BI1W+&5P%Zd(Q
zxZ8@saM-e>l1skNXo`boJq%Y00F2<~1Eyk=Gk%5*XLL89dVW69y-uKfx-%e5)-<@>
z@=STh35uax@B#alu~WB_E#UsVM@^6-eQx=_49s2M;;RGQIM{@ndq#Wb4CY3>8GN&6
zwL4uo(0hL$Tbr#A^Wv$m3=t`*((kexr9%3hHj*ijrpuM^zvx~40qn_b3PIFNk@?z{
z6anC4*MF28$X(3QQ`~2BkKG?+vgg#Q0V7d`dJ{uq$!gC^_wreccWj@hxV|4?!EE~x
zGyRac$aVc3UF%+dN|U#kCs^cpBKo;_<)AaA+Hies{`THk>qN>o3g{R|)>@4Q!o0Q!
z(4t$4_9U6xvN<Pv1D|t$_#@}O-D$V9>pq+g-M`1sioSCLNU;mRk}u+#JSA-zmlZ>o
zv2)1-y+ae=T{FR##z75(GXi&+-i<!AYFWcOaBv`?Z`P+weF<gTYI*P`J^Wr&d5+W|
z*T4%Ly_(G=w2Qo*T7nXvdwI=CoP=-M%SLT7|J}UYDNug}^I$N61WgkTJ%Z{zuP<f+
z0>$?efwv<&z&s9!Av4%~LH)v3P_+t^X+Y9b@yV>R9n|u6U2j(JJHa=T_O;GGKLW-*
zCLPEx{#kJgSwV$$-BNlI*%4z&)#U?XcOHzcZGh{Z1}(7XnW0h~SzA-ovmj)3wvkL!
zGiW54EBcD4|7Zw<?HF=D=hFKXK6N}|m<o|4Fc=Yjw9r@Vf6T*G9JB}(E#_<dEps_H
zYMns!^bx2~X61+)8N|or`5N!^Ghtf1qe6n#3j@G<O2G@pZc%Yh0jn9}p?XsSPi{`m
z*NF!<Se~o;+b3QKfc1|Sp10YqCLyXfbt}%RsIfq&7V8l-Odi%c$~?U43VM4WJVs*%
z$153yt;sy@u=HZx1YtYsTP+2Kvo`e?XbGxa6SYLiwFV-<c+}N*TlHX)La)oq{H*_=
zn*1zVs>tQZvIyfQKVO*@>lgcfI|vLguFxQGon`NQ$kh2%TJ4E|F5@?#;}Lt&G<k(a
zz>qtz7ZfISbgxvM97^6_su^NBZEK&wA6Y8h6(ai4$#@309K_{y08+o=?C6G9(0n&Y
z@e==NXhgn0qi~P5^TYnC`%nk;*Mhl171gtARA*=$C^=O1*Mh9EjbqF*o~|rF8Qdvb
zh92!;m6~tMUJLY<S!#R1^!q}>dG&UZWc>_@Hg$`nMW3&(sKa&uM`I?gCRWrwAi!|x
zrPLMv<SrcQ(^yP-;=$`VdHCkCX`ZI|bTqQIQ+zh@!YSh&K;#OuwD>Ub#aNyPn1fD`
zFudw{+P(=0mt#J>mfLXxOHnLylowBXAROoN19{}>Cy+K!L!oShu=_t<>XbugAv?%f
zBZ^4dz>wuZor`xOe6xOMGD5b)eH9CM=%0V!k!$$0EoJc#@R65(F>oSDiogf2n#lk0
zoq#5kzINxSsne?!sRC<q#Ej8A9%xYTJ==`11itxOsHKB`=!;_j20MfTwCS0Bh=~xW
zLuv~)!TOnls68_bEdMUg`?(dNk7_jN0ewm?eOPkT<<K+Vvrex^1PS6m{Q@?9tCTNv
zd$Dpcx6*-MRfYr(&6|Gq^S2xf2F1(cBzFqoa2vtTAm3uR_1^XMM#$b&<yOUFE?GN*
z_%a}i{dqFxqUfm8)jM&9@ZeiFZQd`JXf4qCfsnU$Tm;m#kZ9;p7~PurM*Z)B^@^?u
zLDRPM>>{GEENSps+ZIbnJ-eqU;vMsF@pG{P&xv7oe|M^EvsKhN2tbyThRtV@7uxlB
zRR4t3bZFFRJG`Vdh@X^fd+@!W`R9z&*kJzW?j16_HhIh7=6jlS(Y$C(_0NeAQ|>A!
zH?a{bZq%*EIFC;qu@A;E$h;HMpkrnW@@2KVYD=|JOUd^mYl5{e7@=RB+gJltt7?t0
zdWFN-)o`Wz{vS?saQrotw)z=@$tz$#tH#mfTCLbJu~U?lw>u-i_OdUDnr0pyLm7no
z<sYQrkv!_4jk#QH@^%trNFCSuq%mM7une2~$tJmPV^;PcF0irih5Cb|P!ZcJLn1t!
zqRWNyW(PCv-=cbvENt*4v@n2iC>yRmP+M|+DFV%58Iv1Zw+C(3<UeRj7LwJzurf({
z{3)15ymA|`n_7WUMJupV&kA()Md=@unTB&Zc8ZvPK0aCXbO<aHKVx0ccAQB{3|l|-
z1lb0iJA>y?+L7+H^c`Z%kRQ^T^_$ex^ssD!2I%0GoV{=xsS;S@x$Uq48kzCpjx(<S
zhkmOKm_W?}i)b=zwa>!S4nc${v3Ij!-bxX^BT--hX}mrBVU`DW#j0`{<v6K}DJ~k~
zRnE6#=*|G!zC&7zz+4>BcPA!_OTF1zq8$ont-8~ctiVzO=h<Fq_f76MGRGQI4##n*
z4}{uCTI5nev7oSnRpf?^Ef~{yR!BDeE$V)P*<up$Ug%&hSYvR0b+>S9Yinhs-|Yvw
z*=tI8z_2&R98|p9OUS0wxbfI7t(37*4NJ?+${5z#v(q)t8+O)GG*x&xSW*#B=q&M(
z%YOp`BmoA=?l?dRR@J?MM!}I>5O_jj&jB3|tlmqqUm%S@{KMMVJ9J$7g=6D{2FyzK
zxw-xTU;aXuO&O+#!vD@mPO0OaWFms*;vp2I1DbCn`zIKRR3nl>ws_~ePgMU>3Xy^Z
z)U33>_dP*!>Pp@IGGcc}zuY0SlE0v8xES@I9IaZe<V$q&D{q!)!zI?0$!_~!=pBF;
z2H;1HzB5TeN_fC9GWFUo+@@M%oIC#bSR@XyhbeQ3Jnn}W(@eHs02PyWyif4oQcU#a
z4-a;AnP>Vli||!C^17Pn$!Hqspd<Wrry78Z->JHG2%}7bfF5%{T5<U|Kr+`7@CSGh
z0<WUP#I56><L8ilsSYRYqN)G5m0y?=hg=;z;*|wiNAs!qV@%AA-jSY(&pA2orBqPQ
ztiQYrM`qb(3flUeAN&hCa*i8j6#8~f*R<lAli<tKr?UzRd$zB=diPHCs?qi7&(3-j
zeQ3qO&RAb*YXDS3$gTf!y1Gy^h)M1rz=V*uVBVDKA?z`B_Z(!}+p`MZ4i$^1xxxNC
zFXSGHlYPUcu+e*sfqS#P*Wp{&$5<$OJh%s&qkMf<Sd=KcW=SKL4uf;QOOPay<0obD
zpG5v&qjBokztPqNS#N(n&8u#19>tz)hgomF95C5lJWOeHT~DvVSp7XiXV!}w-(4k6
ze?L9({)m9{9}0yGq}2YtuIeTfx$!hLroaEX9r-=yF_tN*<2-lwyS`HP4)i$*3y)Tm
zCogQBshy36+Y7+=Hb}nY4ZLn}XumtMU>E@zzVl!JwawBnZhh{AU^_K-ZBFbLvhz^r
z&fN>`h)d(bzo7Q{Un7Q@6YA3VPbe7ipDb!Qb)1sMU$UPr<&{G$CF1L8dHlCpkaY;x
zyZ0Ulo@k|SUw``ftMt5?q0V)U(%kUuo_l(iYIj%+4v!RHhq7nw>gidKVHhe)`{H%8
zr#NTD4a+2)rHrL(l9V={*Sl)UOAFiIeliv7g##_?02a4jNAecBkBI19)0}^1MCKIX
zd-Akv7fniS%I`WfT%)THPrl-@IX4qDTRCyv`1PUYLa+?KClrz6kJ&Qp?%XuJA!f(a
z)Ae<Gd7#qT1^ZD&;}bi;Txu%U$>v2)o==WFL*ON0mVrk;9)TA^L0)_C{~pBGr9%3q
zIkP;ov2Oq&8WuJloW)?bQSFX-SRDZvhMjdKj?@2P4V?sF6LH34^49=;g^p|<ori{o
zXzzPHm#ao4E$q^4I~|WSri5-K8QcK?(%+~r7Hu)8&QA9a08|oZ2~L+@srvA`yYDOi
z2Fd2i*H4>HRbe--U30w)0djs{IT*p4;P;H%xRF-ju6*UdXl}GJdwwYWvj;n+ygR4D
z2e?!C_i;T+=|kB0p+S^|W+5~G$-_|+oJL&|Eq!%MS!}$oZz;T{l09f)GH8~UcTH?O
zSb+E`L`QM>kn*I(C{+9{WyRVNw{N=g1G!(bBG@zXazE31aTjZPB4^J&L*hZ2dgl*e
zc}M)f^vXm?jQs!JSk1xV*Sgs3fl<&eEbd@@WO+Sv9-STgcD}!aTKjg;@3R9>xJ`A(
zu-gLYe?ouEjnX+fFOP)y_*~cYPFjoljYUs|K%U(lU^TBDYBl&igv#X)_}`0O<U`nb
ztLJ6jLk?G0U8!Dn6<NCsgxmoG&s3Ve-+#$BbW5icklxBI=#UukT29VQhcUyx)@}Z`
zwd}$IStnXPC-`=VJDtLVX;pvu9+pUENal3^0ZfzhT&g@xaI8dH_VkIcl{<}&cOsaC
zNtwhI{xYn_E$nx6wlt&W%bUs#gF?I2<e)jV6XIE0^HmC!d3azk#3X>fd!#pHQq=x|
ziRXy+eRfkZztCd-Vv$+nv8y^draRb0^9tu2&AB&cY5wARJgDy6yC)JtGf<H>_h7Ul
zPIw37<YTUy;F@Nqwced;Fv~Qo_OI$E)fFTW-}{D*t#H?xFMv8lVq&}IL1G=N5XW!9
z2L|pW8)S@w=3?oBD<3U_KX|aFt+HTrY%k9;56k|$&vO~s$V-K|WoQk^-P9jFdO1H{
zoA=g9s*Cy$mj`UFHlN>(S$^dZ8h+vScK!}@ScL@nJq$*wYcjazX2lwBo+HJw_@9tW
z3hqRxq;=w-$P`;@{psLXz8qj@c?}~r2#<d7bCr>sjeGrv5%c4wprFLn2dEipZ334I
z{&_xmK<pSUgM3*FIm<ds_3u6qYiio*;Kf*e(JjC<RKF%B+eO)_cm4V~i|FG3kN6vU
z%c2Uub?a6;4A`w6%3kaOFuw~!j9QyI5^{`vv`Ha%9REBNWa>l6q6+_mu$beC@3U($
z2oqCaiYn8o);xioBt6Ue>G$IRTN=dXmz8Cur-<-c1h#B`tU7@=t%=O*ROgM|P0~Z6
z3{+=a<_*03adSb&K<0nTX#!X&X6Y;ebqDe|=^IyLY2Ox#{y8*yb54i)Q+Jo;Uqrl&
z^3I(*m(*hV%SZb~S%Q6;D7{8HEKG4q5ZE`LH&7RUqLFwQ93a8??IB<MU*e+uUQufo
zJZk_7PPcYs7&4l>)@^~8v46=S%oLGhkBe=F9Iz*@;C8px8a9IF%$=ynmfm%!6qhY6
zT2HsUTtPK}S@0~7QY7SzupyW4zb*jSp>=!ah;aYI5I#)-Pk52``LEf+Auz}Ad`I6Q
zx}}@-Fq2Z8Rqv)gJnz%LnL2chSn=Ot(Sn^<f9ukq3W-_ayPo58gPqiT)B21<e|csW
zZ3=>IBMG~YX1&8b_uRJ@Ox?xFA58?*utXQ|a?Fk~JB70e0;urWL;9g3uyQE$;n!IS
zECKC>YXZN3><qsm%P-=+zw$T$lm$4Yo%F<C;i&j;gh!NP*hMOUq`eHk_Nr&X)xj|T
zb})KlAGaGH|G>!n(y@v^JvU3_DOeb9d|R55+UWP=3}sK>zWbo4m=Yb8U<z6;VLYX8
z1V7Dxr@&j`20ZW`+iH9NA3oPP__YkSwHKLNSq1h1^JD3sHy6>8=h#yd{?JUo$;pxL
zdN)abtP9wDys2Lw3*{J_BmKgW>PXF)w6sV}zWI;c;(Q;>-H7}0af)$Sb@!8gVpQ64
zs#mWT=@*yvGuGeo-$_tyYUTQm8p$+U*FqKJ-IXe(2OB^D1&u0iOa{~#a;5tZf8Avp
zPVBhO0k}{8X(*Ab3E)VyPaLa{Q})lQKJx@RnhW3Dz0$xP!nnGj!5go>YAmh3IwtLy
z^BDZcKk&~KcL2BAqgHhzFaP=Boc9|~GmNv+(&}wPw(Tof5%(J<WV<z+YrH{J_)q;e
zS2xVvgY~9Bt<&B8){9BpEJpFQ$I;NEIB=$#MV}7GZZ}SN)r1J%C#U;H8s(4^_@B>7
z4r7bocOH|sUbj(~1r|=Us;iWErn&F#ID7Z@Gcat-?ifEuawvA8kbf$LU_Jj=JS9<A
z2&#Pu#B2-%l%%c5rf`6LWvx0I;`h)7O~NF0`RL4&R(12qW4*0wGULRn8`Bb;#eW&&
zj(m#D0e3sLCU0`Jw|#TDx7TB^S5{W@YG}q8sxI+o&PJFme_!Lb6biS6{lG|40#<f!
zuq~l>kk7EJ`BG_d{5}XYxB8iFoJYJ3ti8wYKeD>NIH{5%Y4`J{Ri;GeSC@ISot*B0
z<8+t0f_KYydEz`tSG_KLxg?zP@Tzy&GP%0wY#3`?{fHY`o1Tf5OVI~OSKFeGJBwB=
zOlb4<(ai8;AW$+Wv~R9Xa2eliZi|x~7oR0#+#S3Fa9Hz+dBW`{Wf`oV+`aiq1V=CA
z(J@jSc)#MS*rQER|9*zs70&IRCwp%o%`%{}fio3E%Ms2_U}G}h89(@8xWc{2(=A=!
z@wU%ZeSQ6%%g^3WqV?canuezcytrhxNf{(id7E6P(M?r(n|jx`?}y@fHFyrrrV(#b
z)M2I--kWc<l)uf*y$G=O0(U>P?W#U2>b({Nu~w;o;T3P!`(3tS2?+^pkBN#jmV4Z+
zh6*#SlzJU{dwQm<@^V*Z_(ZlYNPA%H8wmW{d<hm`y<50WMth#3>*lear6tmMQ5Yg=
z#y<DFl}LmkB8x2>BE~b^DJ>p#L)kz43zHJd5PS-|P_-R0B6pG@|LLyB^_h=t0Z}ev
zTgk!U>a%=+Jq9Eu_G~|L*c|{Vxn6sy-Avi2%*vcX`&0VkJnkfHkD0JPi)LC8*_I#f
z*Lt}K5i{mn53jcB#E$2yeoHDiYJODW@q&5yUir|SxubU-lfA~Kv%YR8$2|NJVExLE
za3{MxJ2<a)JNGPhP-taEKyvkV_)j0%ZiVN;vIi5q8zUiLRjAtHh>VfL$N9Twvlf4V
z3l}=r8+h;Mcy)fnddM|>t6j!p#Y_b4H0jh>m=*lSeuTO+9y^{g=gFK~GiyUT0ydns
zlQuDZmvORU_W1EVyA4e}RvL8`^Zx$3_Rf=otxGkFn&J_XnN(D4N)S20RVcQx_W*a5
zsT=lgdDp6+p~<S+24M75Q+uo3u@@u{?szzU^RDzDM-X4M7<60pk4Ta*v3CT4aGa2q
zbcg+LuaH9U4~4;+hawDLGyx{v`SKJuBaoo;YBtO$#MV2O%xcgNhB$<ZMGrb|$b!#8
zmA_&#F@0z3A3E%glDmf|M@TJY13m~5)!45ZyK|GBZTIb}%(FBT=0}Nh-^`hb4BsJi
zocb>7$msBdro+M4&4dQY0HCE1e^=BQpy1tlw4T$U{rv(Li>x$69A`BhX;~6E53Z9@
z8cn^~jj+k!(**lhpIRk75^;ENX=@{Vw-L5)D@u3(g{IB&$l8P$VLs7Ek4|*>OOCer
z?t2wRPh9vj={N$HNUp0_DzO5PvaC|}nYp3#-FMr?>}gyaA-)I3&q5EyN2|YFbN$YY
zr)1~e?lQJLJH_WNO`FM?GYfBPrBSyDN^V^0USsg-9Q3g`rE}jnc)-BU$Z_F|vShe~
z`_CwiT$nq5@ociJ2r+Z9*0V?f9?+s{53$B}a{1g{Nb=y={}C%2rdqDID4UC(O!59$
zwYgsVNYu6pYb=?NBFV5(9?Ki@LUh#KPPMj2<Qs?c>UDEX$!$HWYF2+jeTUOs_g|L`
z=(i^BEt*((am#N|E5||>l^hS0)TOM$G_HOxI1nSZ7(Ku?T{MQ>7qcr7$6~Wzjfo%o
z))<20jK%T%pr3xcp((uhL7LlKa{i>*ZV$j){)Rcqlic3T_i`A$y?bnX@wK|gFOr?R
zh?S(b#x^E<HYOE|SNm_}R(OYQ_hVyP6v&6hmkQ7kJ(i+~s=cRf3-hr(OuY@`i9g7S
zw#Y>WMib3vyu{Pl%t;Q*=WOuJif@Y%mL4t9<n5wDwHJ)ehrWHd|2%-orC_R3_(0&Z
zILpVLBXhY|1I|{hVB5N0%ic7)QRu@(*EN{q?*k=A7A!2|Dm(gB869q;?nUzhc@gu*
zz5EJ1C;yU;BU7c|F`~H-r8!-eZ`lIVj832yA{Xe~zLR%jOXgXBo+AyOL~r5^wd;Q7
zKzr|jr?{<X$muSv9jC(b$y{RCql1S($=e=O+Sv8qy00-n*fkK&m8z1WDF~(v{1UXP
zQcN7a$7Pv}e<K9b`8Yvk#(VuHc8pk=kH=<roxz5W1mRtSjs7Rt#8PX4jbStxP@K8R
zl_$%gggl5fSP?ey5+0SkWG6{WfSc5kwgcPN`Sa9MYNV3_(sK;6Ow_lB+gzk1RU$Xm
zn$#{&@m)5oD(*LQ-VP%WoH(j5Ahf$${hmG2q^VD=gCeUl(XwXmUcB3Wz(BQUt@J#1
z(ezA$EAIJ;T3_!0Bj*bq%LVsLKa@Pm1XG_b;}|w_%Aeyl`86A#pE!0%32Ku|u0exN
z!;Vn6Uv>?i@3lsyJ1C;YR5fh%o`2M>Kh{J`6l|*65(wij-K*JNwhPB#glzY=Pz4<l
zbH&IQ&^{ZiIU?_Tj00fhkPlC_#vMVCqq%6wP>5OCvlpEKi)A}ReRfieDA*2$rbVD>
zo#krgNG4K>;cKR_ozg^6eVM7MZe4$|n?nv8tMv9gI~9}9jaM^Ua2>5lyGh$sUZHL&
zx|{+}@yK;93<&j>wh-&j2DUq8JO=pQn@k9-1E#}Q&s3F>t9!GZvkXop8>e4}N7tx*
zeYcq2>XJ8QyDN})*Rked|Ap~!SA*UnEFDi8K?7mqp1uwZY?>?IX6RyXSAGk<XNt_n
z#${cMW~~QEDBB(fsErc4^y}YG-A&SMael*l1=+C-_L+_}FiE?M+0p28Man74UCqwD
zl}ceC=rq?=XYZ^_$_Lna_>2||KWUy3dzd<pF15RNPWN|WA0$n%jgzp>WtVZvY9=J!
z6uy4_`k1E}#^3x16M=Z=e(DA!o4a4~87*PdW4JuG{Y=qn0fAd(&D6rQ?5QTG4<8L3
zro*zz3x;wkE3$?|#g;{_MnB&7u-z6t=Og|#wEBS3abm6Z0{w~6I-llI4B1?#1nx<(
z8^`2eZI}?V=Y=o4vO5v8M`;vZu%-Ik8R@lJkG{TPfA+({GQkjhvxqT5L(jw|p=qv;
z5OaZesnX*cQ!BcI@C3Q+j+W!h+opsQqK2KV3AU43KGkUT6p7we=cVqz_+=llHZ<0b
z&#-tfw0u#nXwq30pqfkGA4FCz({?fEAFRx9?XJeXP^L0=-x{~ti$b_I<vMk^<&Fhb
z%iAbEgA7?VROOt&8#3i9thMhEwL4aw9k_K`Sy9<xd)IHeuGs3}89Q>Rnar?<Oc}#n
zZmH+5Qb=OI$tJ6R(GButLdQOS{sbCQKpde{T4(cJ{)92zUEhgfbtI-Z<O`eky&C!R
z91!vXFH_n{!&&}VJ!40;mhTq`a2loITMV{|5BDgo(59gMUN`WY3jp3Swp_)zl^&c@
zem8DK_~<dO(oa<g#?w9Phumo@PkhH}>nb09H{AH{)3~b@vhmDZ`OK;}13@)=sNoQ*
zM?L=M+wD#d<_gjGF?{-FJ6Pu1s3B*eA~3u3>VdHE`&=>?Tv<IOy7bwNx)ax58nw?D
z*sPKe4QwhBg6hi8$`6V}6krF)B`~-7gx5lPB8a^W^o0$P{7Km)RjMwz&?4mxupT-t
zN>k#?2mmK$z8}<!@>Eu#AW&6MNPqj@?t*am?Dl>*vAg^()z5+2ean;o4_EIUPxb%*
z|7R4EmAyrUgzUXTR!EUeA$#vV6GD>gy?10g9D8IPd+%}VW6y)%L$BBC{ry~i|K{ST
zJRi@;{eHXO?$?{}o_KW>0M!f$pDhIV-P_vS{3^=-sO)|#TKohS{(sb|nTp#K@gy*)
z_FLZmPXq#(SJ2xh$aHeq-?lG6cie?&$#hcj3&7vQp9#|6ToHq}Nf3ytD`{B71%u?@
zv)16*y_uF;?yHaB*KciSQ0BA1rAn)J>#PM<VH?CLTz|v8I#y<z1H2+_(1bs>W$V2G
z);OQ$Po30NJhHTIzci}i!cUVhNUsOnd?f-P%mx^6);mF;Zyg>tnsA*pku$p!awxA9
zpAHme!VCuDK;+T=J42feyHmyf>g1Sjo@bfHqeE%N7*5?waD!lMen1UjbSMx)c)_--
zPp$t}FVl55eb0lh2T)8RbzS5Wl^<GIZ1q0zfi(Z7l=}SO#QSmuu!v8BKCFqS03SFU
z>+7~OVbjT7f)AJX?)n)`w4NCIwx&b=B`&VqjqViy_wrp1>AsV@9`Lgqd&du%)EIOQ
z&}1NT+Ja)RqV!YE^alD7P&(F5eQH{g;oXV6rDRSey4gacko6(4+Koh;Ymq}JBX#t5
zMqSjZ+vo27|A4G|q>ig$pSr&XttDd(2<bm9j&Omz%W$(h+-BPqx){YmKrD8lHc6Tr
zT}z1x+DZxzVfjTx+_T9Vh~277=e5{QD(gD+Q`?52YJm?PE{pFUAC;U{_H|E>S{?@^
zE7=GSk{<B=DC-4VUZ%GukTr6EFt{DhdsuUlY_?%6zDtOP0<aYPQNlZA)?2Ii8UWxh
zE48b$dK3H^nsS#795K2Tqlh1AYEH6p`0-<}uhzwbaNcFJU$I*o4Q-~7O`w7Hf~BcG
zfL5?_KiS^M4!-s1F-ZLb_7kUbLtj}O09AETuvk5S@wjITE2cmQTp9_wZC?BA4d@<u
zhqc)sR^94El|U!*@xh)Pqx_)7`*-wQ`cx&f{c-KuK&?Rq<A<9NSN?gh0v%5DE2hv_
zuizwd@k=W%XFbx@qqM!BEzQPOPt)^Sdb~!s&F)W3Z1PsGv4^W?=;WS<+myk&``T&l
zO-|gVBJeLoWtQ+9JK<P+Fx>13{XWsMAQ|Ni>QVStk2*+6HmcgKraTGIsEr_-j%CR|
z={{Xz0WlM)?t{givYk>_gAutGz}&6jfvEf)F9O$w7tiR|P974&F1K1vf(RHzNdMJ|
zYF|87_6GN|gq|uX!99<9b3D+ivCldY<W}4gqmLP1!#UZ!+E4Bdyag7_L-q#ilxuj8
zbuNaG4fm|sWpUrf<y42;bpcXVJ#)4Oq|B)+u$kf(5JvD|;Bb?s`XnTZO^fwjmJ=+w
zmi(hUh2X=sGIqC0MOIz$^j5&6Xg1O{S$~zhv~NTJ8(%}9RM*-(575R&;+&`>RqZX!
zt~j}lr=R4Q87Be*m45t=%S8WvfyPGYo-{xE2M=OcPy5jCPhy=PuL?9!OG{|+JZrBX
z1+5BQtY`M!(zK{kI6i*Xv}u^pFWn~IeoVRdtS`iSB}(=yWM5p;%BuL#RuM7u)^aq1
zp6I+J0cx6WW}$0#i$T9iDK9VA{(x#n2;<}Cjsw=7I6yX<1-qv#yH3on+JvrCJa*04
zYF8d|d7kZMFoziE&DHDy&RzmA4UZPu0PvNJ@bT@o(k-jzc<71}bNz~Y;x9fH0L>Hs
zW2SGs(KH;}o*zFJXFptjcerg7+3@=-F3@oSlhUO!_5;TT&;tN=%&jZHVfGzqoOJ|R
z#0N?6m~2@?hTULpKc{C5gK12ir;TMxH^6h|^WQ~wFkxP()Y}ae{qs?+_p^Q+`!Vt)
zE3@xsq7O9gnF9%oT~EtGM%OuDTD^K#x6er<;(3AY{n*so+fw<@fBIcEgYOP@`PaH{
z^b^zXJW3lmnuSl!pfkxk$<?V;Tadd?bX_l#@p=PpT!%zP3SICVCfgZ$tz3|Op69FF
ze5|x6BH*oJICTH7<%CCDhe_j4(CtfY(%{nmP&{%6TaRy>SoR;(H**AA_VDd1E&t`@
ziI<Q|Be_=}t6uPc*r`unmNIk?{TRH=%GDj#5bTG4vOFk3w~pOMtZ_Bk2Yv(UYiA#E
z4-bN^3@%%`zUlqj6>Q%<S|XNunV+iYKJIxun%ghg_+^qs(W#Ol!v)f#&>}BObu${P
zpXkx~m8af@XXFSmJqs*IUB|X_D%HJ;7Z;R=2c5%xcvTmT0;?{JLf9W>HL%u`S&Xxn
zL*`Ur^*38Vzxx-$`(!AsV(4kaU#0~fM5cP3XdXtV7P*J70h^priuc6^l4axNlLhcX
z^V%-!On_eP*yJ>n3J}Biglrn#uLI-zVq)d^GbC6pCHI2oJ$a3K0d{MfkO#3)Zcrch
zyV?V5n-yElg8x@HPHIn(klPDlZnc$@Xn&pp!=SVD<%u2o5ih~Xzlw7A)4iRUpxq=7
zUxu{Ok`nv&!(OjwhkgRETcq4S3UPm&{a(=>nGa76PMEi6(e(*<w3fuBtTQX_r+s^8
zBJ2YX>*mzqkDg*NUR}I`r>vUj6(;M7i=Egk_hQg0+Ph86or}D>Yw3C2uCX>Yjc`#2
z{d6g&>!3Pl)7jgO21YnxePGoboAkN;bidPnq3@$NS!lNk67SzxeKjfQ|G!!O2qJ1u
zDVe+cdvznO$Cb`DBs}7;PUftRn-NuD{t>SV?nd3iA6dT#&ML|47BANRs|)*LB0)uV
zO8q|LJJ_ezfB5z7cMR~E_#{>Ae78@W>+CNLs(+h<rS&(0w}Qhr`L|Z7Gt&(%1Oo%9
z)lECU`VrU1Ero0GpY)xE!8*%olkP`aPC`cS-8D^*<jP(%s7QxhRqYf(5i}w*LU>}k
zqP5C;PVvUzl5=qJ{l9$YGEx}WS&nNDBPH7xEtMcSG&Y0|?SE%XudM8YoFNrV{shy;
z&sI-PJfPr*9j#9ezg2&in3F?nvRh=+dsfXD-w~tRix?1_E^6o(j0j$T7xuOg{YdL~
zTSVL(!3y5A2_9UbAeE8k8!rLDnZPQv;r2q*VRNQ=J;8L-lKcxD5-PNzq@-k$cBreO
zq45bUWUw73&J&$#?f#m}qm!mN(wqa;A1k{<!x+x`JYx~&#*@eRpf?15NE^UU6tY=a
z!n$rk!{Y`a>Y17#4%{Q$8{q8b?A*Sr`J&<OojA<afStQuv)p3u@ZnoTkSL_0okW{o
zFSL;x_&kd>Vq6<;R-%=Azde$Ia8H8mwx(v>f3y+0eRLAG0v;CiBHJ~nh|+0-^=@k#
zr|BBBoBvo)e{c|}%tux}55o@qr|MR%tL($>RF(#HxJxPabb1L3;x3J%%a_GDB5p)1
zuP+yKt+T<#P4u}B2Jk9s&1Sy4eN<DC@UXS^*tw%neV5T!a8XGO8>kLgs<4h*z`T6w
zjf|gkpCB>m+^J^HXXOWl-yGS^L9S}L)6MEn4{F9|!?O^0#98s-XDG^AYe;Imve;#d
zqElNyLvro*H>Yvu3%*`UZb!7zeoIR4$i{OBs(@Mp=*ho53h3Lj;&u7WCxj>aTuaAd
ztzX|D$4jKOFyppsLSE&YH2He#QBdwb{yQ*I{U|(OUf~hGgPoH428(%W`oyeMqsWxg
zr)KY&GMU)Y*ZDZm_$cFfl+EAUE$fWzO&6P=7g5gxk2pNtI1~LpBb#sBv*)N2jdb{y
z`qrrKmil{jhNb-fI*05WnUf=KYtbhKRft+reXbkNHR9^u^#0I=B(<5#B=3C>a5K{+
z(0E<3nz(soYBz#W6mscTY65lD^ps+v=rHoU^t5gRE%`DX+}m2~S88I+mZ_=trrZA^
z6SwJ!&(F+QieBu^n{*tNzMR_q%%(e~7<2f99{YktTO(oZXAHne?sB2kRV1)}F8MSD
zRMd?P$dpP_kBi;4X1QaCn{`X)TG%9ZFD=_y!{oXLWjzhp!21ZliFw^n2!RQW3f`r{
zYKU%JOV~<O;-iiry+FhfO3+!Ox7D8jQ00#E<t@Y(ID@V0A4s$_J{%wAi~Iap2AFX0
zhI3s8oXsNT1JIYi+Jov4yZ1ge7YL<x0K~XBU^Q)aM9j@n0(V&Eqz&|{m(m8Zm_rRX
z3TuP1w8s(fx-x@iRE;0(ACS}5^?g=7`py?e8zvLK3{zY#z|WjS?z%t^KS_wwrv2~P
zK1VlCuC5vtf`0Tk%HwEAo-e!D<43(PO7e)$Jqz%;_6JK)pLh5PnA$&l*Z*>In7Z@v
zWYQs)2%QTW{}Bv$j}1b+e(6ISP5S(r`3As-0G|-9q=~?>$m!5le?YGqWb?C4eYU{$
zL~DcBBvY)f_fT$hAGM3f!trXw%~j0g%4N2Le^jCG^+BP{i7<b%(*@QV4cstzD!T{b
zea`3X2zhaJ@Fmp^&*waHa{5}jNQsx+{I$?3zfjnrdULysa7QloY@HJqWf3i;dW960
z%d)IYxQ}%Elwx_SOZjk4bKJT~r>^Y9ivEdoVEg+PHO>zt+OfK<7#|S5DR4W{FRiNw
zXjraTJ;xlHgQe=H5E~kI*BFK}K(UQekV)BSU~a#ue?p6QG$D$|PWj|twxJGc+groi
ztKJXP0fexRm;U289_|0q2tzX!HXLuO(q|wr#i23zQ%T*4dUfW(=N@e8sQNjElj$_D
z(L(fBxpHYGQ_~+`z<Iw*$;-!Ee@R~;HemOxynhP(IDATKnZF`1p$7^GW-NAFJhv;!
z(=EBD+vZYn7=hV1di;HCXvVxl?E1$>RmPk^<B%n!f6659@M1N87|Nkk+?V4LX>GEW
z6tor-nVWDZBZztt9$a@^Dc~<d0K<U5>NDIw`AwP`bW)!HAnPm|DykK<p+r%$H$}*$
zWLed$fB<p1#N*oJyWp>rQzgyx+!%y6nODu&E68?Dv#6a^bguQre{4Kk!XAeD_`o0e
zE9u%yId^>ieD81`fNodC9M@HT&$;K%ac*;-Z->P>PF0whj1_6-*vvP|OmzhZ%#I<?
z5Bsv@qG!BAF_595?`+tA9cE9H+I&s*xvt$3(RVFchBT*rqgz7XkOI~2Bp|AVQAEx*
z>aes}bbKY35!O}^D=aMBu}r`Glbe&%VOce4lA{kr3LAFwFzjHn?3*+!ex?+}t9=_(
zHBNv58Z|>}$iB>Pu&g6gD&ti>oA4GTG-*CN;?!;b>F*AT2BpYdo}Dq1Mq<*-hK!wV
zCwiJ5X<ycPybXV3Uuf=OO24-F%4MN!B+W*7wi3$<qEY1TQ8rDfr%fZ+>?%<arM@Fj
z1&(-K@CxF+rNko%;H&}8X*YQd@1ym>wH9o4N4#WPe+HQvK<?p%VqAcGt2N1SNN(5e
zJSCprF5}Xraa3J9ey%|SD*sGHB1(u}g&_TAd-C@zVj2N3*Ty%Z%=WK{{)Mx=Ob~B9
zkb#HuJC&R+H%5@U$Ft;r5gnq=br2x<R_iOaj+Fj@e&o$**%>0vOcE^v)T?vn{sMvV
z8!AZZq{As~E?vzvyNdv>NTZxwY@n{oWHXibx-x1fAX;gP=kHc+HYy&5nhY!#L7TMt
z>APw_C9ll1V$VUrZs;`vFPsm-PqWUGMVU#%^0@z<xS0J&<s9mFTb&IE^V=4%*03z7
z6u*`f4LVc^8*)3>Bhl+rizoKv;jpFf^~m8`jK-XOB>0udtc^tb#C-2zx2?d#C7YQ4
zO5r9$Cjck_Bt(%d!AQq>$gYyP=F<A@QsNH5t&L_z@AiO|XFq&XQN0tbH{k4TqqBqD
zh3zF0dK*?<Hy7~zG)=%{Vyj2W46I!>?;F(YE>s@>Vtxy1_Cx$~RaCG<r*J3g*{u?W
zz0`8D`jo!y<ZdbDN$9`XC2CZ<^0~Lo!<&$Vo#^8qEY$l*q#O23#5MFr00st45qh}}
zKo&o@FCcdqKua;0D_p1#Po?@5EMNc?*<OKpS?V)U;1Y@dcY?1p^u5hRk%;NS*ZB<Q
z`jy|<>#a&$>nkhUxrI<Ke4xnh`R~_U`z=88SbzFL+veEouy5O@FX^t6Nkj9Ml5XpL
zuEps5wQcMH4zEibTgY(f!~S}j^<=9~(yPrLnU_cXbEmv>W12~mbkgE5J^G7V_^ZrI
zC@8@7W=TIOpm*n{xEBa)75zq~3A>61Wxd%UK=TeFK|Qk1SdXf{F9`v+$K4@gSz$+7
z09&xW0Ki*|+ak*W&|S$06wUboi&0m(yY2=ig%=M+uCkke6_SLNj*Y+{pHkd%Y5~<`
zcKNz00<4;jbJ?f)Bb))%`%?+@+MNq9m(?_?-8mF-X&qq_YyQ}5FTkpmLtRFRf#cpn
z^DYNL@U_oL37Y61dN1g=KqC3|hEv?3ckTq(UozfHH18%SrKIc#Pv0CJ9ldT4YWVG<
zN}&3K9(Bk=)g3|o=9Q#-%QZZH^(t=GQlVU~aTapeW8&^%(&*-L;<1(t$iFYEiC17&
z(^Z;ou(3qzx{x{7Wt`HLIY0*Af*h{(4F{^S{I;jN0fhON<GL=%<d(JUP^7(9*@wG0
z)Pg@6Z>~M28a%3L5&>AJ<_PQR46yP<XhboI*zvVE8rdOxs3=0ifPeTV(iniZ`wV)*
zA?%H3^nkpV-IR35opN)9@G%2?H+66R7YM-IGu8r3a0UJ@Xq-ZvSkNPtdZITE@Ve;M
z`EY-vc>zYUD~J4Hats#JS^1BwFS2g6Zf~_`{THuMXIz+{kZxJ%*4|uS9+Sl<z$73h
zR#!gfJ^JgQ5*R%^Dz2WhC;!x|U!(#1fs0nesGL#+hfGqMYIjQ9qw3!?dEo+}MejuP
z?V8%SuTw6U9<KLfKuvBG`Ec15?_g8*7Jq+1>$!&lI)2@{b+Dv44Co;XZ^Gr$I<<n!
zya8_96jT;$8@A$001X_ex1~cLy579VUUc)`Vg{^Ff2?@kf|3VtRxnUbJAS`7-rAC)
zZp7WDV?8jyU0NVrLFc}Tq~MW{wOftR*c8~+V?>(b^>FkK0{D2R8YdPZIy#DkI6gkQ
zBn61%){%cDEET01^;V4<ofy^Y72YSmj(VTml`Cw^M=(-f1yo6NKLd!O`{9oAh|Qx*
zr$~$=L}AyS2GM$hoVr8g(M!P2I@;Y(605)rr{eJa`~dQjR*!RefsF<As-tguBOtP|
zD#2l1r20+giPdu-J8Hj&>$K;GVQlQ*z+&+$ycsbG=4W3<m6|Siu7Xp|K<k2Nr<;VH
zAu~7Wpa?W1HVJDkxmfS8@dCxlr<5d}G==s@Fnv*bd|iQ|S`F!D6;8V~#b?xS`0$=<
zmi@%t6|)?Ln_a(;TEfIaKU>A-Q^!2|8aVMJ$hS*W!ze&Hi^*&<Hac30{rXBNJE{9T
z(WTy*b^Y{oZg+}&)nlg*Z=<PEN^piyvjzG34H?c6{pEdeR+M&eam=IkJIduGSSV3m
zCBH(pvA>G5mk&72eJORtoUoezRDD8(r`x^r_se+`N+<E?=O(NPFotM^quDQVgc91-
zvuub_=$j9ygw)z09eQ2@#kx>AW@eGJ)-!!tr>(WK#ExI%xvb>_jKU8!U!k`sjoJE0
zrieq`M<ug&%t~qc?-M^Oh&?ABsSJXNIz}8+-n$U~Gaw`j?Yjy3@GLoVYSUQGT_&gQ
zPe#?!gb<UOnOo@BFKKEU<ZrnO9#+;kzIa!nt6`Qrpz+xKSQYs)_ud8eOX=Vt%fMI;
zr!C%hMjc^CJRyqo;!^Vd;y0j@K7X?2_X=+Zn&Z5OM0ys>oq>z7et;S8`|_<~_PyhA
zia!|^XGQ(fr2(;<ByrbZ6t}&yP8tX1)>sUqEwI_E$jAW}|Eb&TT+sX(UVW!qy5OW+
zUV7nIkFwaPRcS6rrqyXUgGaR9ba?aaUYjcZi^+vml2;dbt*Pgy(3@hc*4+(o3^KRw
z4iX0ASl6zSkS;;uX<j;flbMxU^IM2XN>T*8N(R3bM4vBaq@9zPI10|dErA}q)A{Dg
zNiYFB;&h{5C|UoGcw?u|UN9kd4BE0uUji{x>0>lr>zP-x^)BP@7UIE1mqN(9PIRIo
zxsVWMb6r7Mr>&8<6u%kdi~7Z}aUFG0^omsHJR<<56}LdQp0@$0dwPX!C<LbJv>YE^
z`bkkGVLiSCEyK?SHs`c~E3n_5(|yerAJaMi`@;#wmXy4Fr~-kBr`geXwmn~@oMq?l
z06S(ZF2fe|mMPo-Df}C7J?Iv2U>(tQCt`fld6;sGtrhZKjm`BmAsb`vqBun(GNGs;
zW!1{6Jd$D&;ofQOO%X{fsmY+5yleMfzl@}{sbdH8+aiA!x8=kO>Ieu^YjksS1we7D
z%Pzu*aX*I;{CDPCaQq+;PeCWa5c(f$=USCZLE^L~XkV{F&0KF#wK0#LaxURMLHFP1
z-1yB7RfEp*pXyKxR%BcvQdI7sntolSeNRy9Fs`Q{RnLf8A(v*8SJ9!Kzx3F%ko8NQ
zZdu($aoXppkK-Br)KeG2jy4awQeBU{%_q|I{Ho$npiCdmPT?Vo0r!qGw>osJWiYlo
z5`KL+zBkqQk<aOk6{N-{GVS^v1(V-(Jp9JYEY7CDn#^nOl#uz)&QGZ#!-4C03-vk=
zM5A=|q{gRls|m$a?_H!7YA~6e&*}zh_i%qsq1~KK(6Y-o`-qO;ey-nKvbYVg{Tv4(
zHv4F~_pbWhZy&dB=A%W1=j{Yqm~j?pT5RYSFbb%OWpS72xGMJDNes>7F`-l~jFXHH
z8SAx-v~TYx=-7noRoPQ3U76(U8d%1VxgRxq<bAk1?t*PoVE^zn<0dy0ir_8CY*c=$
zf{?Rl6PgdM&2VUDEJvV{EIkuNl}uw7{rpC95g&gN9va&v3SJ;wlAhUqzOyG@&KAmM
zUnSfMrHoRyzD&!VP>b1x>b;qQPa^m6TvR+OT~EwCc9Bmi>_^>qXxt{n>uQvhcOoK7
zGu(26BdIbq^c|jYm%QPLxIS8F2+du6zU(MT?{&0M9m?+3`|PlQB^cJV81Nj*7rcE5
zdBm_NEkQS9gmcQcf^{S|ko=nYQ~&#q_vt;1vglz#M1Fcvu7@LG4@{%Q><q+`MVx&T
zM)C{2UkNIKj9?A+fJ0`%rwQdTG7T$7L<Q9PVHC&IdEV~}vM>+iw;&g3R7!Dt+^|ex
z$j1_$T8iUsfmfrX`TAt()^P@e>k@$`2haY{@>wTcbDIqX^4iQ5@hnJ!M|s{q&y>Qn
zGw8D^FYF8_ypLcLb_dhHNPu*o2`x*C_vt=So8(gl|2Ew4)?i%fA+4E2KAV#6pLDwA
zC>*Dog{5O{n)uyH^gORV=Rw~Us*~go7WEMNUAKi0judP2h52GH@l|M^Zcj$1;arEY
zH`+dGl_C`FTF&7J`DJnj=qU=Zy3X-W{d-fz=7YF#CHcQBT8clA6^eUt|Bda<^;N!F
z?rW`R;V(CIMy+Y#beCLasXYd$BA15CduXrPs0AI<Ko1q)c-en`fMW+c^8wh~Rx@%R
z*Tqf^(}>T`c4QT+=kQd<5ggP_0Q6J@pEhboHcc($tn&8lkCSC!(+McT4sbOslhylr
zo_c-681@6t|7KWONT2D0p26!D1HIeL->Gn)CM=5cLXFZA8^$Io12p=*&Cx<Hb2@lM
zbNS6lHFP83NfY&9?qi$|R9eVeB}Mts$3HHP%{R`~zaL+)2r)Cu5u}-GcHdTs4JG1S
z(ApA%-T3O)t{xHh@MwzQGvt*tiCgzytVyxQvGc$1{{;R9Voq)*)s~YPsSJe@e-^K2
zmNi=>Qi1JYopUzTL)hoNnBp=*ljCwZQrzaJ_QNZl9v7E-+Q+Vdt6nkYa_ZQAj3)J!
zAknzzCvnYa>tmRMU=d-Q)O*@T3cpO^s`VD=q_@V31>Djti|_!|-=RCeuEUB37z6{4
zY1-U+c|^DU(1>e{(eGU~>+BoZehI<TxuuGdkn3R{rNF+w_*=iA`yGVd!Hi~n{d5yi
zT4}C6>>;r27SMoTEj|0`1TE9xz(MF6VEfIzl$l8n6n~-jwC}>~QQwtY*{*Xq#pwEZ
zF6{|+^9i-bx(`ASkKvL5CdTddu+nm{*CsyYVcbiknDC1zt!m3%=6GV>k88qOdp-6$
zv`(Wcb(Zg&wV8_BjMp)Lh~FHD&E<UDR9B7bym6%Ec@s<^93SuCot_G39aJ6H5%K?w
z+c=`e$znNw9dOj)BU+ARhwjz9F<lg1F}PbN@awhcQSQxfdixVt<~O+B8R?TJPqq%8
zz9y3uVcX1_Jzzh=Ux;O&v3~^PdiWuh2$lX)Ckp58<mqTd{ASLQlX|PfFVjKDf>m>*
z=rP}){@${oyPLk{WqjBBMFT7Jm!2&QQ9&<3@e+it_??vUws^r0-DWtR&Ia#0%}0&j
zWtyxnMe8ebv-a5|SHrd)sGWqm8}Y=h6TGJ@W-I+rE@<4=t<A?Oq67`Duy$r@_2KSE
ziyrxM%lFuxEF||SACe3wrIKha`dmU~W4{0V^K(90>clHWCF)lOJ-&7M=S#u^^oxyQ
z(d?uoOA!#DK}(>jO5n$0zH?A}4rk(Hm$k?k=<iRnQqWK-8hY+?^p>+yjUx2mozB};
z)6hI3>2vvyQsdWX%vJ8x($2+chXGIUzKe)ja_8$=q%le-m1cbjiZw$Ou}EXbqHhK%
zChGuYFsS5PrH`+qRE}EWhVF;ob}?}{PRzjZYLL$8H_9X1u5XXFM|mrJ0?r;Rzvko)
z$rbdw!1%yd9n@+t53*rM_Gbv)t^f=m7ZelPpZ4E=){JFDZO{~bRfA3PJgq-jNL$Ib
z<0yoXQ7g+9zeD0I*x8czsVa#fopwes{{sUGd^HJtW3(ZD!d8NN-$jNXfN<joz+4WT
zR*X-dKJ54sl9|HIUQf7=s7HvlJVJ|Zif9D>2F5zYZvzqqeBojc@o%ZzX5ah$z1j2|
zlf=LB;(XaF(xkwk5l;w48KkTxyTcv_lCiZY5*9l>>(?{Filor#WckcTFjc1(?x4J?
zu(b7Ez8(2I`WmnuibkS?!Ob54(bBqy!7l#lUNcFsqWsW{eRTGB%8UiAqPRnR25|$n
za$|_%ZSgVUZ~6P%@mryn4uJ==AzQ98FKm<o0)$-W3f|h8!<xCK3pLm+Xcm2g-PTdv
z$^bc=SBZ3ar<TtKtZ2|2j(YB1iLjXXpgw`czV%Up>`_TligITS#B+5D=J|8OzTk#m
zt<}W2VK4Xhy~F4lc?1GTt2ZenL@(A+HJhd#HeRRQfXox|n$^copLP^nEHnpj19fX_
zVHDwgDg=^As*BFVsZD9S&OI^FJ_ho1Kq^rONN|xyJJYeYbQo(Z-O+5-!3#}a+=Q^l
zBhgge(;E7sjM<Pqf?1HQq|(u0Vxs!{(xnkJolY(@J{*y=%Mh$A*g_mbZiv4~(xQAV
zHCup3;;$<iwNcAsqAwc{rMGsj)0RRloIJ{h?B{acIrJd9RkhGBH1vIxnbG(Q5^WE|
zH7u0&Ql?rB5kAP6DcK!Nei1l}m5>VRl@P*5Lc4lrtS`}a>;2~Ja4nvr4Z=RV>~!mp
z!h^k`f^XJ!_T8?W4)XmWjoXs+u}9gV%K||w25g-rxHik~lur2t*3sJgy9LsJ8kCl*
zF;I~QLD~%H?lO|w-zCM3Qd!E^+$p{kIrixuG-`@nW#DeImOZQ6_&n$+Czg96!LkQw
zg}8Ny^v8<fKTPiu)yI_AF(kl8^)e)gK5Cb~{Q!UZOH>9JIQ7YVODr^~&eNxp#Ukxe
z8ulK4KmVEYcQ1rzns@2UCbD6uGUnP#G3{pgqt7T*VXQ<gEXB>feEe&q*deEJO5f1F
z%e)<-)5gr4h1Sb2+lN?@FG(Ky*+%osq<&+B`J8Or5Yblp*OmYBuY1$z|Ma(PfrWES
z^a0VJ2qT}iMY>pS*B5QRBF4^*<sZ@Ug<n>SnV+0LFgE(6R=^M`sLL5QRe{Koe>1hk
zBca#8t<EkX9_PX|Bm#ZAM%wM#S@Z_BAd#t%ByMAl{<-RCV>lOs+e^v6g3<mNDJKXL
z)2egKKk+ZZ48M2*3JP!haLr71q-9zRHN}C%%e!{e6#cU}U>&y3aj+TYkGIp5!?9)0
z2%{Bp?hQ)A84{}~tWW&<^?_2H(VG*X4(g-YrH0G>kdEV%e9}Rd@Lh9Rv?2xsSVZf5
z)t?@@K;)M`^_xp1F;iRS?8>COo7h3B_X-15$f8BR#`ckfc2zxx4etxNi>>j}@ivnz
z3^$O+26Y}Nz>|7WwTnSd<GCl{MRzA&+~f+N*K}|_Z4GN;78Zk(DP~^S*q${Bziis@
zw^|lQkG5$rB<vOBNZkuUPaVeUpXU5?kxhQV2f}vh0PE99!;Yx~a@?eGGn<+TFjz2O
z6tw$BX5%HvV=p5xzs=Z1qm{BIkp-HY{s?YH!KGR;P>X{%N(9^+t6RRFx%5!)y+#L>
zYyP!8bh4wE#B=y=aPvKx8gd3Qj2E`BT)hT&ll`f19*kgH;c%9Rap>-97WEzyIopy{
zxJq%4Jx-5OkYd+onWC1hc5{1h*WnIihj8#Y$i*v`l1^F!vd0A-G4g$3T0=@W{yI5U
z+1-CM33L=jR3w^Y@|0v6UbR3o)X5gghFp6@u})4{CWUvaL`at2Ah%f@d0C~<U^RA9
z?%RtVp8mIoQd#uo=a|hz(ezNQgLWM}Lff;d=kc6K9`{(a`Q*%}i}KJ10Ip-Y@hstb
zR=F<T>+&Q`d-M^ivPsEM7q>;fB(>Az7eDUJ(Dan=wSiv9bM9<g!!TU5{XGP`sKnsl
zAe)&Yp7$0O_~nk2h`lDb#$Z~4#=&0tLWS(MdM>KP>!T>hNy`F)Z<U7UJI^mko@>44
z@{aq&GcmvOLdbbH`|&Z`aI9ai!fWTo*m}<ux&oTW#8&!z8w7S}1Z0(T5{^TT#r_=C
zIhw~gx;>~}ZRk?=_LR!dU%ou4?Z@1Yx%c;L|NoXj$oo4kmGIJ(INv-FT+A*{L<B1=
z#!p7dyeM~e$Fc*~Dn+km#44ehVNZ{`R)l8l_4mBFyl`1{tF$oCGwz^c8PB_*h}jY2
z{lDXiEK|$0k~U2pN58<79{QT`Dmz3}zoD(Gzb{=lTL3fgRE;rWxa626-|ppu(L5?;
zj?qkJX2t;CT``&J84ucbVWlM|A@ne~)N%rSe<AWUs)!|QH9c<b{GsOlp<K|=f?p;#
zGdDfGBq4=@BwB+|)DduarGatA>D{ipT{S8rm8a1GOq#i`sZSqI;rXAbDT`#!!klLy
zZVo%VA-S+?&xIzGNQy{;xeRIS<j&;4JhV}<=sYZ?5w1`DD@<02PPK&V>Fv~7Q-*2O
zu0VTao9cCHJNJS4gLEBbaDk-KX_s?^l+S&+P8xfTF}0vn+?&)99WIzA;C)~OH+x}v
z3dBEz?)L=nTrZc!cRj9Vm`NU4z-B*OLs<wCgv1-Rel}C;fxYoL+cQkw1}ToYScFea
z`7n2jvge+od9@hglC^OW(0Dt{Nhq8EFe`yh(;XJm61c$T#^*rPcz^soK-d{-IGroR
z^Z0SkEOq=rJ;8cdT}j+P6l0439>J?~m_6QdNm=snf=N&mgRD8bWv>NqklU_ZD+;Z>
zozJe92uog%z7Mk9!6R&1pDox*8Qpy$TuK0T79pk3&a<mERV$3YPV0lTs{<rL;XmZj
z;)so(IBXcf3C}bdZFNU>XX}p_A4lM|@yhM(R%e~{L?*JGjS<gqmjgF)?DI7$50FZL
z72H38>6a3PuMPCVzp|k%eUlg+rk^O%B=Ay?(EHi|ul16A=G%{ipZO?E77q>VWc}b=
zv4opfi{4+nQ2Y!U6cbK+-dxzNp%yM|b?V8XU7nU9cO!=AVK$RhVRK&dZtuygT-Wl&
zRCcsdPQMh6A?4K??RWbaezZi5Uth<jQFS>ZJYFDyY)BaWedC<;I=c|P`^v`0>+8~2
zN`YF|8}}`S>~BkHCv*10WSiq~`iKMbW$AH?8~6E8#9Sqs62vNLeEv~@T$-5cI@8r*
zICkh=)Y{`F^E`gbVBcAz@Yz@4Rg}M8n11VO#11h1G+AvlNs++oRW&*RED%FAWg73V
zGX$^CQ}Napyy2J0jI@`@btu)=P0~OGBzq>ej)79&O;O+dL2OUXkpMLLE-2hlUi6o2
zz4z>5p8j`YBc$E(6^!PCqN;vx*TdvB#zEygxGfOoxG-TM^Q>{BT^*H)&HJp3v_kCJ
z(@;IHMY&R_tarNimTs~4VbHz{oi^i}8>9KoS6_5>{wEIJoWl_+darrk<zb?F1zx;-
z6F8JcLx7@m04i%*bay2$jli?}+{@FY`A&WO<~r4)?}}E^Mzv2=ip}k~-M`ak$!egg
zX=bZ!3`Ef{z%6bBu241aGNJMPxvNU!r0d>o8zyd}_mTF&PSaWzHIF$Fh&t%GkJ?P|
z_zxIjgah)VVbE`eCr^S3G&=q6<ld&?O=vdh{W9<y<Nb=M#!xM`#7v4VtU^kduEcth
z)G?B`D@WN_S||PmBc1x5*Y!9wiM_kVa#*j?Q{WgeuaDt(gy+vh8I8FGno4t#&nM0c
zOWj~97rZu*stg<=FtZ3MI}z2jkP324KbpsPdl`A@SmM0(UHjs>f=eI=^2x-9=&l}I
z;57m@+nK5q6l7shuo&gE!S>DZF-5xY(e-gnjwEsI9`2s)FJGwNIYn+mLDq%ooN#Ux
zG1Z$U!=UfHP4~zoSOhC9W3!t1TNcQh;f@(YM4A2+Bc)bhq+@eq#8hc}GBDm$27UC4
zTS0w@2@x(1wVoB+oUO0!=t@4rMLlIHg=8#;9?o34tE<#Nug}89ao*m9-k#DOFv66f
zH5ag33e?m8RaMsP7d!d;lXkT`9TgvDl8DF8=$Z*oRA+;GxHhmEEqw1A&ZqvQL5wUq
zZ0DUR<LuTxqTAVmUoAe9AI)92Ivlh%cdC+olV37R_t3~38ru4v@QdT;HFJ&UC{b?l
z5)_RWYgLw)AEMBs#|3vTkfMsH;4}PF2Ge2k6EwL@fkN1JENOG3F3pdota<MA{#thA
z9fW3$$=P`TLd~|71XYCLu`?4Leo?Gk+$DSCfxe)Ze6b%~$tJt|_$OtFI#fu;_FL8d
zSH)Bg4YM1~%qujaLGL8`nZ&h8;9M{Z_A)(qY(AM0Pfq=d(&=iW8@j>b6_u~PlW?@R
zBJ?A}_Zge<_O#Ep>#MQOO>*aJ-obhejRf1UPfsw|$a}g7!N0Tb^3+ExN5lhn{iohY
z1A|i1i+<^+J2RD$bMBXF)R8{0$F!7`AJ4r68dck5Xk@br=hJ9JZ0FGn);_Z@dCyja
zi(a@sOLC`5xjLk+NWAe9IF{9_HE%ePWY~*g2)6xU{4sg9+=<caY=dtsPCcwt(Z_2|
zna!)5^9#e{zuoslxoD9w-y4Qydgr}c6|Zfmzuac>j}!NCB6est+vZ%z(|jqd<`-Zx
zk?9@f)l7Dmxz)P7!@B&v$*Vnr+i!SlM5}6u7l|SOzUuR|=VQq2C2yhZmPGhu_EVJC
z>p)O1c=n;_qr0zoT-)5_v;{ua4Xkb*%O!lc(H=Wr;f+W})=%dvZILt<R4%<d(Ny`8
zNroAiShRQ@DD3BbaWufRsu=2>e&?Z=Q4o`Kj!VQ*twZe(_#G_0b86y><LM!3dBQ6!
z^SNKV#>_iMWucby70x&Xqm_)KW>X1i-8AU#rm14N6)=kfVLgh>SFNSbvL<Q@M(R7W
zvnA6oYRMlDozB&#g>+3SWXxafx@ZM>0vesb7w6p>xt;0iYNVfF8V5)<PS&8kWJpOc
z2BW`lZl{97AOh|cF<|gFsbC|_awIbi!q6P!ZrntTC)FA>)bqJ=0{)ud-XgYLsbE~y
z-zKDb;t59He_sGl^U-H@XCL5Z>}o<n8dbp4rnHGcFdfVM%#X%6!H5V_!E@EPcLCxL
z*Foyd!RYfyyIkeeoT*9+3;RGfx)0!8Mbb@9F7e%Fx~jPG-5u|5h93tkF6>iXc6Vgl
zhi{{+k3itXR@!Z_OdVFUBB5fn+}>$6wb*;7r6)`eY?~N4nBPqwZ;jdu;1d*G+}Fkh
zm*da9>r2v#LOb%5G2*uPfhcxVk%JpB85wSOV}RLA{PF_^^8Dc%!u39|k8d|M?ts|R
z#L5!O9@WS32M=nBH<(Qj(hfCq0k)$|Xo%gzJK_)Kt8G#{AATbl$Po)T4?Vs`?^S(&
zoxmM(n*!Q{Cu@j#<Y{pCTzrgH%p0;R1<0@XD}x5Fmu&GAJw1i9b8^h9-QLS$pzq;1
zz@ubo2AOXVH`kH3v*#UN8|nRu*VuldcWj@8{L}x6*Gk-(|EQd#I5MwqF<O*kB|2lV
ztNI6r&Tve1?ze6A0vxY{#(F|B?NeY|6(y>xVY$hbNvuinjT52qr?vH8Cp+48RQGpF
zO4_XEcUzjZV!zS|g9&I(?9F+Vw57~LQxx;T3JxB#8I_x-u1}wY^IFZy#DDr-^ia5A
z1(U>&CZ<TUIz%*;bG864VM4pYRNiX3LM6D6%WOR5%JHC$nT2KwuJ3w6;H2<AiCFz-
zL`)$cthu#Q2Mh|@1$%tD+Z&FWS#ilkS00kGUXsO<-dvN&7Pb!cnXadW#e9!)ohoy{
zyE2%eS_rSPHg<LpUml*<_ZYt`wlJNiDrG)b#L?c~o`<%fS>aI4(owlJlJP0Uaqd;O
zbOQRtQzZ)3;1f7JMN50Q-$dmg-e{_{V(!p$)$?@Di^XXZ_POChFx_n%p2+sM4L6{p
zD<25?z|`GHy!m2OV^bx@>>@8w)jr1lSJI3Q*Mz;x)(}V9wA#1y8g%z4FOuygrhB*J
zfP1drN7;dtmxLd(UH{_U%M;xuNgZQQjQkx4Ool7Ejyx|P5Qs>Be2MH6_Cdes({_e=
z(0Usa4_8@XQ#iH1I8HS3`qSN?-Y1XJ$u~ccGxHoyQ=U@iw$1E>rkN&l;^jyGWW)2(
z{}i|&C^Cy1zKb&b{!03rl$oJDzx@%mo=95gTOYQYq&joq<e#kiO79K_-Xz|0%CpN9
zBqAnG*K?Fsc`bAQs>YnOa(ynA4Qd&8Kg|C7I*%bun})RisE@1L_T!d}?Yc_JH^I2G
z&rwCX(2)B)@u7s(_N(%!63N}0IwTdv%89&v^f}-dh6_4vwhboiS-N@hi~m56$M2xs
zA9-#9^xu)fSod0|x!W*uZjhD!r@uc3<Wfuy@jeJ&H`R7@<YpYL0(ApL5Q$OT?X>I&
zxKT~3bA5nC=n4MZWZJcS%t#;VpSYLrebC*bg*RS{@?ga?ks3=Ro`V@V_Zk)!)=v^o
z<u*mN%!9FF?fj3O5llJ09NkQG&u{C81`uuS2=KUCtLayMWYJ%--w1W>yjY(H2+3@@
zBRa&AEqVujhi+K?CB%X8<GNyp7{2km=b;ky(uN5tgPBSaU7x<s)p6bPZyOSK*v(o4
z3BMYC2kj3_y>)Ve`wsI)9U3d`)_vSu@vU03nep2<hpODe^?>8s3ITOP+3a|{Z8nke
zrG3$sVg{d$)eD}6dUz*AK;=`FfXXz0p;SKrvr09fn6vtTw?Pd-U?u#c_u_f0A$2dS
zO$WrT=`n1%169;^k+syLM(#&2(vQTwD7(h%!*@ZdI{^VSU@VcUpssdL$F7}NYZ<EG
ze@OG~;MRk_bLi;Wt48yGJOTgB2jym))K#NY*zwo<uH^EL<)%DPP)<cCkw^m6tGh{U
z#`@?ateSGe&{RrWG<Hf3l?GQb3S0Nbim&CeeXigPmAT5eO#0&`J25{mI6_USx4w%4
zjerQ*cO)RMc3~bXDD1YEvEgz$D`SN=BD0eJ)gbr^(J)|k>3r;A?YoADr<gUynpmGT
zSK}t+wKq7<X1GhE%!g8wyT8(jogFEbDwD{&vqz*$_h99`{^^`JPE3{iF!%{vGl`T_
zy9kIE)o7viwDv<RJc7SA0FA#kfM#)VBmMR6MlsP7jo4OKzuth?)YGsAmsyHeLmvp&
zRYSTOebauv6vf9!ZNRgATrh$8Wt(skE*cW5kS6O!e>tN{>|;pqYr1j3dWZRW%J(^9
zps1%aUh2sHN*kc{qY>a`es~p3>$9_xPx8FwzFEN!PepY;lR5|XVst$!`b)?ihGrCo
z|DDQWZQh}&%AQeibz5`ko}RY}gGrB1)pEc87@HN5j~*}-^jv>o3}1N@e#T#yrG{<(
z2Kv)G%1KZl+<Uex(wX{o+Ltc*k<3pTbtb)|S{Bjn7DYTTp-R}tl05t4o)ri8r3$mr
z5DH$)46Gwq69y`ZkE8!XqzmX+QQf|Wc<8({G07Qwl@u43R~f=Ug}x4YXCkfTN>H_r
zcb|Z8`79p7-}AG(Q<a5JSNTj~O(K67HE)!CE(os<Q*TDxXuQu1dvw$Ai4DvnTo}6(
zU%o%(KP^|ZUxlShnSsCo!EP|5%GZZ_tJ{BT9Bizq!KQ%pavMve1?TuQN-uzQtL%+o
zcGJhdDQJ9`%X`=|0sGfY2@7WtrcO;vY@E#jr$*H*Y=~*<Gc?cb*tst~n1oQzQbvH;
z-Ui5;eWV}wKJ_lqqoKzz#@wWA$c%6{PjQ{#gdIvXJ&`uO=C6_kd>q`SxX<Inf&ZMh
zbRMeUcLvvIonl(n)C(sAp1ZTtD>l@J<Fr2eGe4HhXW;h8N&cpmsYyFZ3|!G4fj}*z
z27QDA=@m%d8wSpsBJ=xFX{8#aDNfo!xzn;mk`4U50VvW9JWFHRHrdQ-IqMYaMeoyX
zNSmj=csGMA@TAT0($ZPvz++e>FfR2lMQ~X?f+d=M`L~^>(;?_my<87$<02v_&OaG`
z_Z;U42w#x|pipOSu}Iz{>$RT>TV)v^9G~xfP;;uGD-bAyOG{+y{`yNS_HD0xNb)>;
z#R$%-NrgfA__*$Pb7)ipC$pbggoX30uukvvC?7p}C%rp5&p6D)gh1L}ifizc3$DFd
zM>>?RMoHna!{l`5*_=p$;uUQksRSjT6<!TkwRMdhyWUMfnX1Y077C7_7Fv85v`@x)
z_K<?hJW#>aP(-^Lk#i1xp4s4m=iaN8DZ{hrV`f7kngtD8!hVh1`I>6Fzw~aK)j$Ij
z)5oI_Ggz7^j~d0Mhu%o{M}fPX^1eF+w^J=x`A;5a1|Ckf52QH%93)9U@qyo}Mzjo%
zoWVIuEGkQU&i3Cq1Ea4`FZXTqIeG{uKV>}HZJ{&Z)BFgGH}@3ewDJG>{`(Ob7O&_)
z6%Fn;ex>sZ*<%m*KI+ShiDw)mg&ur$y9rT2YrYA^1pj`*|Bhl?8+yX|GIueDD7%>Q
z<m8V+%z`aG%k;_LYs@Zet1LtHON|z49OeGr`NRY$f4s8j+X5_8OPA<Ju<r*yZSB;E
z)W}-z9w|4*Ce~B6&<`MSR|<T$ag1&9&M0;6ikX+UL=h912fvNwVE4g`qFh0GANms4
z6lPxoollG993)=QWw&<{wfu@exli(BcUIvx-@Bv~+;8_|-z#jr==uYbeBf_(ygAxu
z`Ey!B7v|ls1qT;{lEqk2*+H#PZv|bQ)NkH@dS@SavWq!A$AKgl2RBix@YT`q5%9#C
zR`YTCXcDf2G^&?$$t`KAa&mI+5u3huZsH$%ex>aoHPSK-@9^_qYz?;9>Eq}BK+!A2
zW!ax3;CQ|on<)3(MP2<TTO^!mK$k`08})l^^U;EA_&P8cN`YHj`J2U_PLdwqk1;n>
z8%3oam1@qFJb2o(_Vy0feuDrN(~Xmgk~Fh5hn3gre2IEGlC|g0N#V7pl~w3NsY9Ek
zA<67~xCwhR)F5lZZ~B$zDyw3WoS@4%j0W_7Tc7i5ufa=Y1bCQRxC20>3q=B0*y~?L
z&;?cd-`Zl}TuXNAcY+(}G7TV6%dxE5CbR3P@t?KTg~=bmJS3%C{&l<o_siGb=T3A&
zN@nGGFGmYHHV~JdzQQvXS~QoLKJzaGam9RIqBWp=<-d!9hGLqftf-g~7-&>k{Uu!n
zXDdJ8fG3<N8=)xwS~WP9km+18^a6(|)O;+jz<S;?Z+v&iMrmW*b<>ePS=cS1yxbwC
zsGz9pB>aA{U$;gf7boYa)$@=Gaq_Va864sbUEOHQ>w9Y~(6$({+bil+=kFDj9_riG
zs6t(vQLSyHKUl_6Di9>DuO}<&dC6MN?%6q}J@E3xO-iPv;gLbLSL*E4G7cYB^=&b^
z&BN=e>>znH=eDvgSMWyQXF~qG&~pEwj{oQz&~-|dBYzP7H;@H6-$QjgET%Wtv+{?Y
zjqZbq3iYQ{8KsTLF*%xG6IUK(VuWtI!&?as_-tj{Vb5Y$*Q>AxD%IB1b<6$xBl!*(
zG4pa68Wx1B0hXmyl@_C!&O3q@A2<)v6}`>gOeLJ9u~H<!4AY`$yyF1oKX%URRCnj|
ziNRP^AsXr#Jkr&iWPe0Wd2s&vgimQg6sRF%T`9@QN(A?97M2Ij3bva3&^Bf6P?^|L
zm<C{kOwXn@f?1>1R783MMW6!jQ-U#4zqtm{XmnBY5vBwli=S-vi!DLiu6qV-bLC1)
z#+s&Sou2p1oaP(7>XcyWB5nspg<gLAw|+8f=l5HZY<*o_wu2RjVk(C@w@ooPS4b0C
zBrs=eOcU~pPE^Tdu-=cV&f8f$zPmL%d8GKKw>Rh6yQL%S*^Hl>6z7m)mNkdB-_hMq
z;V)otn(B88w%C;V7T7~)Tai%LlH3}Md%wIJK-$p}$o$poi+rYIiE{bhKsk8%Bn&Kn
zR*F;Tqck1EQ+;y4%93^utFjq~#&ngHMe!qkQ1nGArJ=k3F22T<u$|n+k!gPa9}A$$
zjS_RoRzVU3JI+R*A0=AQ<D#T1&Um8)P%>KsSUKvs(t+5Tfc3a-tTCv1Z~b5`=}*YM
z(pqEwKj9~k5;fm!!|}xOGku867VXBbPKSB5VC~c%HJ?4*Zf=N=A1k^$A-Ns)?YQ)I
zYU;<(#IDaD{C@{EEyO5~V8L5m^3Z?J7Ucgtkfi@;#hAMPNR{#d;&?m8PfUpX=E{6-
zygLCvWWyDa>?1G-99<EOULO2FOWakN>c{ppA1m5W(aNK)v=|?wtszj)l);g0a6dlE
z^$xff@j0AQ0H`gk`x|hC5XtkT)i|g@)yFyHWJK!P^+Md`VPph@EUu7B^-#u+N<uMp
zsO`E6d+ageMDn|rR>Ab<LcsO6US=x&w3E{2>Kt_c#oUGJ#pNvoH(&<mVM#j`QL!sS
z&{>QG=>X9l6=C{O3{D`O!#OKAx4!M}(!R#{I}KgqN@)V2<G94t4-bg^M&$#pfhlH0
zap{$kl2eEVx`*uR*AWU7*~Pja`&^%uXG;-i7jsw7*oVFA07(L-K_FgbsU3G^5g97p
zullp^{i8n6j}+UwV8o(OI`nW~?_B`DxM3yA`5>F}J%{(RuNNLVt@V<#u-md1*`>OG
z@#8!;QF?`d&<l;4$lJUjKkjB+SFo$>=p~=%_$%y0lcocAfNagwd`h!(@MA6&RtU4`
z;SU)j!?75%;T%mR&Qu2J=T$AU)S<#w;Rw)WZO{~7#bF3z+<QQ#LZ|d1#p6)376e&h
zk1UpoT`$!(EuCo0mZz7kPn2bXwuxG&C``m=P8geg!KCDr4XeR*<PjOhn%Dtq*bkzC
zLlx>2+kDws+od;4phPokFH97r0#CI=NH82sIje@!M4jRa#S_F)iR@;xsk(%ub=bc-
z0RtwkQ(BrhKZZdAymqYISfMAJXFl4GYWe6F^n8sn)(8j;j*dH1qff%=Vf9%Ak^hbI
z@!2pJ>RB3Fm+FgZPjO<eV@|#I5M-7g5#M8Db2}+K43TSoh^S42{1l8h>~w1w#vvF?
zM4kNmTu<PksP#`sIO|>MWV9kD@Hot({?$nG7!3Z9*Yr$HD3QeS(7b{E`^S5KOA>7l
z|HzsjO#i5;Dr5hsa0}E-b3seVOmpE&Ui@=037)pzky;}hdA?smebwooa&bk!%`|Jh
z;HmH!R~Jk#VYwbiyvdxQ%4XIhcd^=gZRKVfp;jn7l!t4fv;m_lEzKx>@Ar(!#i;#N
zwyrbgtl;%M>Igk1gFL<23wZ{2%FxizAqq1mnry$6tq+vOq~qc&E`SUCym%94FYI|{
zOI_u0YJCBeB+LZJBoilHe(Rm>Y~Vmk0<0h69-nq%4H(G3k?2e0V>A_>17(YZR4u*u
zP$)4A*uZ748oC&sv3&9t*L3d+i29D-=o^NB>0N%)*1v<;uL)BtCXvTN26kuL8ae8;
zw;(b5$u!`z1bJwioYhoC`pSyY#nG^`T$Dob2fuDzms#WU#TPts4uRkY027x~s7ih%
zD_WRty|W#6AMmmIl2e*`c!Q<q3R11%bQB7TFUqN+N}+icW=Qx^3iq$y&MsN1=<aU<
zHDB+3NIZNc5;%sGqz4|mc)+)zW9F=Xw?=!thfxPMBjl)w2IC&Rj+%CY(04toc;32T
zR}A*&c;IR6v{zpuBde!;;h48X9E2*1$O}%MkA-Mtj=+b%@#&t!F1ycpSPAxxZ-XG!
zlG;{PObuDYQ>6s_i*xWl@{rp!_9sfpnZW}Ghr<!4O|uKPJpEF2GoEyD5g-NjeiX)g
zuaTpi`WgYfX^g>}svebK*x^fM=tYrksTzupSTZ+~)pXq*d@B86Tza|I2blaToE?jt
z-a8;gPHRHafpt;cd#25>#NkU57mA_*5pyzFqe{0K_Jwj^giTWeSu+>TxEV+;;$GqX
zxlAt&2Q+IH+ye|WHF;>5cPla&`V%ECz))Uuu*qSiD~j6`MtAibI2aUr2nmOSY23ez
zEV8iRQRUooj}RAJxX-$C2p`D3-I$<~4mDB^UC_&`(uxQEXiM{u;Ct>x9N)q_BWcGS
z7BVA6hct5(<0bj#J%7jR)^jwHeH#8sEu<b<O>R=xM=6URQHi!Sda&AKwmFhNmb56G
z@qfmJbTjz;cATm{vBjzl1s9?SNF|O3u><s>wHKT6mEBG4=Tmk_upuQhC@aU<-1LuD
zn6+JJFps>gK>8f*Zt%pvx6g@0)2*7W<+sE2X6WI+)<1(sx79zNCe`z#Y^s0$4CV6Q
zj$q<bR@Re$zqwiRU&|{Gj0Lq}488Q#NCdOK=XTBc+7=a$`Ln)5c`i<FnAC5`d44AM
zz<9o{g4ZVh=7{R9pi{*?chmG>ZGvEGoFDftE^sLSKla`#uBx}&A0-7u>5%S{Qc@bE
zJET+T?uJFENQ1O=F6r(@Q5xy)?(RNw0sh|o{@;CZ&OYbjTx>5ExIV18<{Zy>#`uo!
zh=&`W-F#6YORv4}$e0I*DQWB6XhA-VsvCz}0hi4s)A|e(VROY^;d#Y$7y&0rh<7uI
zC@F&ir<^G5&xW}M+PgnIdybtp=GLd#zQp){V9h871wWOLli<`9i3a1;nlhfLrjnb~
zNB0uHi>jz@Fg^!@@Lw8?1d~D78^b1gG&0}b|Bj1!;?DL$GgH>;%y@2kCMeDP1RcdR
z)J1-&7q#%(VywuiGaQqP8fEtIE#~p*&Xmq!>}M08Uq;p23pj-{GUum7{2SlTn3C%B
z`@F<F@oAMrFIgJLc&Uhdo#6318iAvicbkALw4$U%8Ul*zu44EEwY;@WA77WPw=pUS
zf5`i8nFO{@u;)7iFS8Tegi-ADDKJsWW#B8PoOa(t@*w>*Mq<s~#u%$F0zly5zFRkD
zV4l_<N@`5(Qk_j8Jl&1_Yp)1<u95f@Fzt!D!2|%QEv+?E*;Q}yi}AU35e>oQ^~jGW
z^r5C{F5(K;kE^)g1JzW%c+A(-dKl=zZ$*M~6UG0gAn{n;0j5ojt-rhHF*}V07vv9R
z!K`2J3dR<wo~eMrZ5CJh_~<TX(13{Y171(n%zotQeJL0z;%9ys27_^?En+(!;Pq7E
z=I<B!Lv_EX5^nULMg@;o{bKJIzOoODPf8-3fd<1*l$!Kex6l88WwX;Y<6)LaE7omQ
zR6}3edWpfe4GiXeV@}V)*Ks7JRY$Gyk#|loVvT^!eBE?9D_+>F(WysoKgwVs!!3+T
z8s`lP3IDR7j>1%U-OR{IoU*vkG6An^iRdtErzffK$L-y2AGAC+9FHE<j}(Z*q~{53
zl&Bv+?{!mBQoa%V!ZEed$7eOkmfs<`#cez9V*nhUL%ap8L1-vu(?<F8qXIHHJL2x{
z4qS?qbY-<Zp_D~KyQlGujP{vG8fUxR-fW}p*6S&FmQQ9dzmffUqequv;Pjca%qB<S
zjLI!*V!m&})YuZsR}Hr9DI|2y1l##|?u5S2XPe@&B~530h9aCcBjr#@9S|*+tc`%V
zUaI=OS3*K&lrro1SVm6C*jaHDy8y(Cuutg5`a)061Y@xG_zmw5vuJ8Z)~??=No&OL
z3wZPH@9Cd!F|FJI-Cj%wq+#WBy|?;Bw7qw_NV~4FDZt_NFc$39><R=3Ezvk`#al3=
z%;3%$3p=3eq`?n2!0`^Cb9jmEYk)Ie2{)ZlidV2W^nvI)3>x-{x>KS-P~|g!SWi4K
z-W-*UyL(;nGWRZk!)W_C3D*VZ_TiuUzpfzyhU$gQ9a8%KgDT7s=XvP8cw1c5&u(mT
zPDCfS@Sv&xlmno+?~P>6-#=4$0SVit{5rKT%yz`g83OsG;vcogC>SU#c;5ZKsvCzW
zSLdO0f|L;bJzlG`##zMF4`+>P@y)*=SpZJGt%PWkZ`mvQiEk53ixONp#_OPHsZDt1
z(nesCeI39~OPU3$jdhFH>e3f$qT`{bPbrpW=qsu!kc?C`G&m?L!jtj=<UBS79Sch&
zQ00w}&%XIINNJZ^R#V|*lb!Z$jPILqPba=9ZU>}WVF8z&NzouzDJd;}r>)V@;Sat(
z7SrV>s6@Q3U$N}s6F97-fSg|T`T4oek%v@Hz($rtXjX-16!~x@`H_VsmgGAcgf_rE
zWCQSF2si;+=<0N5XhABN1@Pum?;^ZfUo{0WNCH@KXh&@sWIj_@+2?6q7Ddj#$riLP
zYswiy?ixuR5=H(Qtqbt$7R2jt#J6<zzQhQk_}Sy*>YGE^;VM=B%SObX-C!HACf=Qu
z11WL*;&0!+!C1AvIo+E}^@*!v^Z}Zb_>?9~o%kumG+qdYKmexoiZ{^n25Hl)yxwj(
zH)ztI1tda;!2=wNm#c6T+x;>x^gvPbP%@%!11SEdH-9bK)!t3A`iwt5e!`K1FG^oO
zBiH!(nkR$O522o4TTfR5xJ8uLou~q24>Yhw8GFE);^BFfHFaLPH+*N>q^ny1Id*&m
z?7bG4KKhhUAPW#PEJVIJQBK2dGn-T%8(4@kw!VhFMLX*11Qj&=p*XDyehGzlBoxkE
z*VsHB=sdz@=R__-zJ2+HP)y^S@K;%NalnS}Fl$9Dj`%*EZ1!%}tp~DXLdiTXqf48`
zCBPwabZ-1oH1$Ap^#*Wy+i9F=dp-gCv3oNxvQ)|c1>%bX7eAk;Uqv1@@uMIj#n<R0
zDPa7SGT6Q#vU))CNg3fUVs)8yik2(vU8L*lAGh$<<L6CrKm|_}yQPAElz&#Q8jJms
zaHGI9>fgG&?N5M4_kLT8(r$@Au(b6yu&2}Jef*9UjE4%CMSCu~tfBiiKXW}6zI;P%
zc9e%~0AKq+!J1C|UHQtq(uA!LmwDH_-YOb?SH-#TIDq3}w!1K5nkE%^`F!CRC=#?N
zqm<Z<<&sZZ`;+WIyVwvUPMp<>0A>1C@Hb)}mP+95d57WVOg0UB-kfs8lRVSN#`xIo
zw?v}w9p-ug-28Xf4hgS5e6(&HG?o2?fO<NK`ITNM<qPx#@vq)NmRZDOu!?uiumjMA
zI)FgpnU)wV{N#=0d~d^J9%yqNsP2v&e6z=B7Vr1T^7$Y?FkBe<INfK^Iz&?NhkKN#
z7!i}AXXcX=^SCLe%!+owP5L>+dAwgj#Vg%$7No<4uxy4MUk{%L9qazBo7(>bwY+u^
zg|s=$r5L*Tr?KSXlW*!a1`#>p`y|;`4_qMQ${B%P{nxmly@BKz9imS@Fh0~3KGsM6
ze5^KF+{ZK9cueU+Q9KZ#ujKR}Bb(2tFbmWcH3DSvY3;~5Ub)CHd~BPGu#ua{%ngF6
zUYEJ-$mt}^EaXa<YU~F(5i18u<COj4w7rLN7$7W_A`J1ph8vtpn=v8GwRET1Vcx!F
zXk`W6&ZG4!piWN$AWHnA(im&)SGp#5Hs;zw3334{k~<GL6s^Lz7hk?piV|QueSbV<
zylHv)^}r3N+g=CG2knQyyXf=&4mmQuL`v#4HVW*#0u%}i;K~%hQZZ7c&L%1{Zx>EB
zWz4x(R#p|CgMIl`%`$Ky<tkLcP=;8B*fOLRTAfv5QjeAs=wOBQl>xi)YnY{lhXiG9
zj=a?J@9h;{P9MND12e;wKsrEl-XGa8mWaYO21eHWQ)4=ZxZjN{M+HgZT0Y`QTT!4(
zVu8DC5U4G_Uo)G>zE0Ox*`JRee2e=~B3VM(pUCWbpcE%S+9piECvglU14F$QNT3HB
z68vSn`uh6bQM!xz6srqaBo(JE(!bm}8q;=Qlzrh%UuiwlCA!61(Z~A1$4X}FP$n&v
z*NvqSfI^oWw}9fC4Q5GB?%bkI_K1fON&@V}pd!#D&B6zaw%hHL>S2bvY)P|vOiR$r
zHn_1m?M_b^h)q-X7wZYgR*8QEI&KEQak`tYtu&s5;j;$;4UeKr?cv!#M`nRcf_{-A
zX=+k$M^;aWWl&hycTM*E7|FyeB_Yxz^cIKMsHn`;QUHn$$a2nzWXmNF>ZI_4xOITz
z))%Hh8;SoYCl(w=loA~ePon-(My`~0L8U*(*$<&yiKle$AW{##nuYfQ@*IeP|C9~x
zheI`cE<^)m1(d&V9@!x^xX*$lMHKWm7!Pmke|gA&hjUI-YCk$nM|4C^jn*3^H<-o?
z`?wjIH2+ZCM$*Ag4Sc|%!kR$u?#_7Wr!Zo^ynyE1=;8`N7qh9z#jWA=wqDJ5#j}m3
zK;OHvtXY0oP>_A(F18uaTtwFA;pJn}^DP~PP}@Ls)@2Ul*v(k2&>hQI*>(#w@((Wl
z4n7Hml6n96$@{PPON)yIo>V(P+5CG%f$RO&V}L2z`qe*qyPg?72xNqEfCFSMZM%R9
z&GjjpW-w%|+splQf8w%3bzcr!Ln9+aOUnXlBsPU`0?r~CO}|Q{CtDFwp7vpp(H!#M
z>YU8;)+pcBuRxj;;1Hk**MSoYp%%oRcX)Hugf1q#%np<#xBe9v#EO1ITwYlj${mvA
z&iG!(PDc)d(3?yG7rO?#3_tL62W>XrmigQTdwjgUBy>(qX^6$Ctc)7kUMtxA2vt8x
zVEC%_=5Hxy3qRtx?C5ytuxV;UWb7jxhC_Zd<?k05RvzCQe=s?f?feu}jE{|^h&T@h
z=7UgLJ82@b+Xeg{d|6(UMBit3ISV<I(F_D7sDQ)oy&}+ZtsIBQb}fO64t;#$5YUE{
zt9AwqJ&=~?JBj8`n`c)<5&_CdUnv0mIOHH|HsEC6W<0@?JD{?sE9Bd5weL%4l<t;!
zC@7TQ(J>27{$t?bif3Rlp13^az;_7FFXL3ovvh?>8PFlUXX}05x8>4v)H2@$NkGRD
zu?I}(i~sb#!ui4=W_<?_O_bv)=PE^C7U7#jto1h9`pRISMIydW)yJQ$Zoz?R3=H|l
zQuww&5>-i=1*jGip~D?D0gMl{588w9WO4laB&6jZ8PFH^va9sB!}y!t^F;fry?oza
zH1D%pd2JvMHe3bkE&m99KjcG+3QLd$RW(!jhvIqE>V(+07v!eb@bUPQokFT6u#5Hp
zeVwaSZO!I>YzlxPRPmU+<hVF-@0%^XlTf%y^N|c-=t7qA7Am;Q-rjy4pm(y)W<83b
zBAS3948xh?sC+4qoe$V&f2Famg2D#s1NZ2{j-%Y%4Rax~JiY2zU5Bm$JEc-mG-E{I
zuz{}tfl*{MKozI`7ML}f&S5qAS%VqO^AD2fB=u=L415=8o+-P@5!Z!PC~@2%fCB^S
ze6Je|*7w%OKLa7}=>hqZ|8GsLfo422=)#ZL{|H%6enG+@5^CHE18#b#grw?4AEIFJ
zMLerXblXoU<$7nUzCcPgLo^9VNkx3xKBZ86c3LJTCc{aq>Mw`*a7q}6v~*JCCc4)A
zDk_@m`9V1D_0Quf#Q(bJN0gFq8J6(9qEB2*RH5NAtc$baK(|)=BSu?t8}V<p1`}UK
zd`O4Tqapy?HVk6f2>-{HjR1!4d+fzx+)R^Y7;7MuZL4c}@0(<WTO<hijz$Wj?ywJy
z4xdVBnl9hnU%NF@nA<4{jYHM>sC0jS_@+_#2&d4<Q*GGitAxHo$Vi@Cn?e1C(5O#W
z(t|cXCt3sDV6p&0o&xw8^uG!!i1z>1F4M#C$ul3pmvC|p+7m{ta5Zn7t*%x);1D!g
zn1<C?zQoRx6Ed<{;i19l_y;Pmj8cR5kM`J&1^FQ)PRd0U%EDU4X4hmMqYh)2B9PNF
zO@h#9Pgf#?HqZA|4am!t==l;<0T~FgzmOCT`tIJ1)BTU#IA#A4n}auch^_pGB;qQX
zw?5ggSi>LoJ|Y%$R0s^Yl(jA~I4f&wo86-Aos1(`FgVij?|yhljeHdBN9*YNlb)4@
zrK9WVX%rL`QqgfVj@jMx##CV{kMwL#!nGOFSzm?!(k$e`g9;*&0r`}g&i}E_SO8Mz
zJj4A-xZ8*G(MRAjB?M+Z4TdTfC(Yca;iE_d#*)&JvwYkfEh1aa`uXwY#y`;K9^C}_
zK{aKjNJ)IZZtx5W4E)|@H-O_tjKBWD&|8}!z$!8RjAmN!`~uQ!Ci)1FpoP+GA>#h?
zKSoXVLTP6lJLjUMXwVI0lna0u6)+HAk-<BAc{NcFW`8$UNU>KdB9uND$%_`LRQmoG
zZ9FQ<Ji2f6aCvk}iev;jx^kgr5_O+AE$3<1^}#nq7-3@QTb<85`nxKh1^aUTT4_>5
zEEH(3i=VZ?n-YKDL@PoB{EfD_>Lt~KEuVi5UB7d+JxXj-BU$sfK<f|9tM7`Cj?;OF
zz$=ig*oF8?5}v~%y|1@7GkVx@rf~B>g^r1dI=Y_L>K{aUza0_L;aFJ8)@7s;tgSpN
zyMS6cGqcpS)>TV?iMXtIKS7@}>Lk(oZ0|=wz^Doz2TIZb4HVx|7*tfM`$vw|(Y@$x
zIXx)?JZd)9JevleM7A-MH`MydAI7su$;yH|a%j!fn^6`N;%Qpd6YT8wdqgs?>n>K1
zDS*-kpgr&~0O&!w3a^8_DAHCaARec`k{WCq1iJe4%*b?(-9=8ZiFi8QpdTJQ1z936
zpBGZgc$*2-9o`yXJ!O0bL0#xDAle>&vrIrJpNU|0e_?rQbpH7RE|)r@k=fB4$yEa9
zlx$TyO8gfC3M~ZSisj{HrMHWCGifh3sk7GCX>ku5zC!J=s#1+$ko9B6u;-R$wW)TU
zgtgql`kU?fQaExiJX={^QCz7}2P(yZc_hQC#lEu+IDFJRH2$gu*D)xB{9;)sLt0`p
z$BM<)jQIS^`gvI$la@^vyC&Qorwks9Ja56dN>pLo6;|o|jD@yuoOiecyVa~ootzM5
z@x2SBlQu5SkM@)?3E4`#nE}t4i)Td7iGpuA-Jlb$*teTJyhq9Yw1SzLITeRNSA#SO
z)@S3ZFKA+GNKAu%>{iU<jEJng)-$f+b!n-i+1&1Mg(Pg8t<941YZfIsu>f$`j;2EP
zX`#+xK(;3-WN%j+F<NYknHy^VVseA4+8q}b4@=qCQXFb~o-53wR=da<l?q3Gbq!@G
zk}4;WvBPsV(D~W0tD_@p{F~{`O`1&~6ISMQN>3B4ziE3BY;@YPk)`D`_5!uU%bepk
zXhb>a6S%ZWkxXcC+te1@)WNVn6b9i)e0vHkHP5zixZStegqT!RJaV6$Y$_EK6VXY5
zOi-(U&%DV1T0Yx>MoQcVtkT{@f$PN>1xj_0*||;3?r7TgIPEeBzn?zySx}GIr2JR|
zSY1nBsHk<Jlr?!VV-6#umG!t&(gATX_fdP}U=#_8zb@!;st^wJS1Q4j_Ot$P-=wf`
z39KU4(reW_j>vc_{LE|6)`4<{93;%eKs!^@+YD^SL&J>r6dy`ZYh|3<2*>X0cTm2a
zo3Y^}YYZ9J)7tdxh@&Xr(3I340Ufk;w+ZOxjLx%SCg|nZcunLLsq}wtYOi_e1qcBi
zE35m<X?1`-j<4=-*@Rc4RD~O*SKV17TO32PH~w@y^xfth68pW0>}A*660*|SHqEKs
zvoOwnLFjA;qp#tA&cOaj=}jXUei83v&XrRlkd2~I0-T#ip)(BT^XMeZ4nU-VMp*i_
z6!dvyF@IouptVA~k|l^@`@WD#@u5AR1I7WD0mzcdT@+RYa+9)o?*H~0f=>W;U77@X
zp=N!2)!z8dYgog9Zv(BlU+PLn*$Aq)vz|9wvwy1KVPXm^YIOhBo!$Tw_y+-Kq5Tr_
z85fdd$HnIAR8vAs;!c(*_tsUNw`JH24#^WSD8iQ+$x}trJOP%}U&&B!UR_ekgW{no
z#9(g#xp=g*sgEng`L_3+p`I(B!%8jZJt+VbAorDPUNQmJ&nO70S;4Ot&VAfus2q{`
zR4AnwEOCq;)IurtZ+lu04FLQXn>;2N<b9t+!nMNll*8x*Q^a*hEd!8j;9TW@HhxYO
z7*E{Sg;y*2{+-LF`=td2X?0}|#~o?g#RHLaLt#5Vuc%pLSSdH&q+<aFHAW1+{U$vX
z?W{|UTV*zrbg4Jp>iq%wdyB*IN(EPRRC1w1+I5%|g<CKFNX1?M!cv9phGw3o3i_;=
z4ygv~>w1l$FKmtq0{I+hZDaJ$gVvE{iiwkRg9npPF@gH*`IwjuZ5zk-VF4SsOU!Hx
z(?8Qx+!{a$3s<d?nv$j~kIQ}`H1XE7+T5+-2vQGEg$<bP-RQuIp`mfETX~RNvQ$R5
z__MSpC&>!|#~gAU<>tLMj{9Hh>;&T%gqhQ+LpLp|ujxr1gD7==V_!aZxAP7p?&ReL
zyRJsjY<U{>!@Z#HCrTjj58fAIzyi^})s?w%4!iv`lcUIIUThur;{$icadQ3X*2g^M
z+_y`^&;lIUax?=4sW@iLhsQf3vP2<r8C2b4TUyrm90k%8{wHh8#8wd?;tvrm`s5D@
zFl`xEDi1RB7M@YMcP5)B*#0q7`2-CK`Fj_gCQ7C;+$F(t_0~13EXCEHSY_NdVQN5e
zcsg|%^Q$CE71PIr+2=OeFXHq@b8Cd+^%(1-r+)1Y)Qz?eJ`ex_@epTCiWp4>BO~`g
z|7nym5LmLMBdHaQ7T_^cUa}BU<ZAvGeetz@3$=U!0HUtm-XR2ze7ZquUBb6p4Y_W*
z9Y+gno3mFRK>=pdXEY7+=s>g;StE?+TR3&5FvHEBE4P!tG;@C3O+qKY9G9n>FEtj9
zw}7EW*q2wC7_B<NR~Hb=m^hdw?SW0pL{G0}(b#^Q8p^59(Jq_`dixe*MD^wc==Xaf
zLI#+diQ{Kdike5j)D*FpCH>kirE*^cL+ob~ey;!m5CKaFw6LfmCGAZ)<JCRFZS~=<
zaHb@t%5o;RoZVVGRqR>qF9UQlDQO^{w_~!qZQBUWEk9le#OcK!n)d~19|qAh+;9Ev
zfAt1UkhdVj0;8?OV3{}YD%t|J=?SC7!;-UPoNNnZ^H-Vhyc3$E!$<@QTdBjEN4ckY
zy%(Os2z|GY>DpXPicn3N@j&e_!zQqOn$R})X0k55P3rv{kyE_)0j#F?S|*Ew@Z6M+
zmK4s`7T-V2j$-7wfw(3oh|Iy+8D)VptcG;gN#qosjX{+h=rzDvM6|ni4x=e(B(o)E
zP1{#Y&x|x~SLw?3e!dByuXrF<02goCCvDaUaq-YFyOh{p*AJF@ftn}L41w%GS$2zG
z7Cg`D=ym?duiYDaS_-%{JAOJYQIg@1kb)exzIOA$?_bxtO$99#3enaByAp;?Kbeur
zDj@dUy1h>3jhEQf)Rnbmqtjp0t>g^PK;jH#$*drl{M^JZe@>jv7RG6<9?pMdP7M%$
zrjb)`zzeVXTP1G;Cbqn0#1gBw`#*mTtPUGE!Hp9{wc3!zIzZVmg8eDE7FL)meio*z
zh<+$F<#{~er~~GNx%o45W%fHy513Z;#Tw7WC?etPVvLoJlg3|P-(W*bw8&TH+3-0*
zwvBO5W_hmJa7Hb8KPtfQq}6;8<_5qbh|U7YE8jPJO^}tiZCPtpe_&M!3j3Z|-28KE
zlBTTq*odSrs8`D+_w{5(WAzM+*xuCs%*_&W(^$f)$I13v9qy`yWzFtGnwKbM?k5U%
z$xOdA0{`#;P23dZx9{(_9FVtu76J}wK|ena##??9Cl8F-O(WLfflE;YV@=SM^?`nN
zH1!doAFw{~=%`DS&J$#$SNt@m&ey$BCVtyjFOW)w;qUoK5}**P>shq(Q<#r}<K!(_
z*yHCug5JI&sbC~ISKnazS$dVAr&@$r2LB$pQ29d@70XG<jm)u9P*7mG@wZX95i=r2
z&uiEh#zaaZL(c}=f*NQRKu8ZUBM%|EPuo#(b|2W`!fm+H!DG`+Q9OKx*Y2h7YL8CF
z5);X5AD~TgDbl+2J5hz*5=ZcGO2O##p2?pvvpPp>@kXZ2<;dB%_BrHB0DJZC@*xz|
zDX7{Z9)Cq;HD>Jp%xhXy_?_(lHZEz~a;68pm1zV4#<Q}Pa`75{ozr?&lE7<9>Oe~C
z7Vy2uGjI+e+|H)LAP*-xWxS@gjo}T-gp(n1o!R~$H#r(nU;JKbVfb@EICKxP`}mND
z)Ccq<I+yiiufKJ~w-_+r9#*j(P42p-be)Kv2zS<_%+VPr0%Lh9pNg971B#e*W-wTt
zF6AddtxjrKHFT@~6UcP0Ur((4V2l7!aoMlb1M?B%_71Aw?a3$0DbKayZc)#;-o!9X
zuECmRL#BM~9*LZSb^`)Z9~%ZfB>iF{fHRyMQ--w}o8ujLGjSHvTTWJq^U!z?tRk+B
zu7ve{fcEhtR1@KkS3-VPXd6SU!_pQf`mo>KJyo0v--kGN3p`TPe}9mo{f#%|f?(rg
zmNF`1B?$-NG*YZ6(GERH1HQ=P&-&Yj1Fc=B<PFT|_Z^)zq+b&g#gQaCqrXMJ-HPFG
z`MO3gCNfxKA(q4EQZQy+CU&vfi;rHBk=S+vzVw9^H(eNH=k6@|f%|TV`gzYX|IDsY
ze4vB91JW3CYIk?$CVT!+rP}k60iX$zS+CO9c}MlLCl#i3qaB;5sOTn3dOF>KOy1z+
z_^jnedCt)=z~I01eLI{B0y3JRARK%CK@wlDl?2%egEiur-5j8y$A*S$(^j2wBu^uT
zyV63oH)hpEuZ=L1?9-*<(RV+J+M_orDhMdtPNv|op5tQ%r}vEUKsFAX&lF_rp=T9a
z(=X_w*JNwq2Z{Zx5a3h`ZeyHxCyOil=G<FVyb>wP`j|y7zuMawku1|#BTMr~y(Qq-
z%?deo)G2jC?mmdh-pEdk+uWDLY{M}fzxJbF-;cmlF4ncGJ1p~sUqlDOB?<<N7jO^~
z8x9Q|kVaYp8spcjyyOg0;PjtyJ~HKYJ%6zyU>jZLP&UFdx(N(qkj~Sj`eUL4nah+(
z@u_qV=q({Jk^Eo-w_UYYuH~`K=e{t<J#of`bnJWuL2c&(9t*RrkSQvVJ$}^_17U>(
zJ4joWv8i)QLYWogHMpd%5|8jtx?&7+HAlMMT0f1Ci1`9of=6}&2(md4=dTRSHMzmr
zCYw)w{Zh_QKY{*`B6(y<;R~2-<D{-K)!9$B1Q6{Y``hnZL)!8gaThgUT`g=~ejw=c
zPIrNNc?8hyDUD4*v2mJMToq|-Xgn}BWNdM_5(jjYo^1BVTGgBFT=sHr#}bGsI#%qJ
z75<F=6gUAub7jqedal5U%~#4F2Vd4(wexrNIS`j|O3p!aMYk#JbcaVILNUhlr)*}=
zcdW@?&4q|kwLYd{utDP6xF2}H{>ROQeR?$_1aEchTY?CB@$u+vGktS!xzWoZ#G2Rz
z`}Z#q2UTv*W4Hs<b;1|81chA|-MSV@1yGy_C`KWT?lpQJ!?ZXKz5pK1K^*b;!>gPR
z!+y-){|s`594l~UI=<t~I%fsKF)|UXXA_+A5p&_RhdhY^Ika_B5%U%!A#0?Q^>=8D
z8dWF+oC$2Vn)FFT(y9g7K>Gs*inES@F&skuIMALjk0y@>nXrTQBRV6<ujNbVl-bhv
z9V{Zu%w~TYO3K>U?9qPdD;*IlEl!u`oSx)Y&t5gW5k1v`0vh&kOK5GF?s<rmLk^Pd
zQN4fE0B8#IP|D)-6TL5F0&d?g87cBUujq>*;)BE>qx^bjds`bE$}c@ejE*M+@Fxl~
zWV$VJ@5{lae@(<gPAie@YfQ2*U9JgsCyQQnL0R2zT5fKssO5OJJ`M~-w^?IYb*bKk
z8w5230q=Vvg(wVB=IR46IJr4q_)I>6mb=PExY5J$IQKP?e`M2*SJ5B)3q;ZAVm<MC
zPRmK4f5e*N>x^~1Sp~{e83?sdr&_Y!MrnCl{ZmpQEa=(*rm>n*z1-tuT_*Xty*ps~
zA@IlzId*F^?e)!~u1-hlsk4ohR+T;M&a8u=c(u(~5Yz5Zua;8t!Y$%4U9MS$<%+xc
zKtUjWvua&Kxe2T3p9Ukx(`}8N=G%k_WfeNIeZ!vD_})V!v8$l08?##_Zm;VKX$}WZ
z^dC!b_Ht2eCytZ6PW3|W#?(|va-&;xFu}o}nAC6mupq920I2W)=#w%rsIApwydy`}
zw){`;6*mRH2~d>vk-W_^R6H<BWfG2<i`g%EX*pffMDBK)R-?WaTEP?Jsgu6>^UNoZ
z81cA3rxd_+j;)mxh4wQ39sHQj?GP}5Kn?*@mM;GdB7@#Zew~g*vx-Qj*h!96w{f%!
zQ|f5JoYaJdhC5N?!6kj;?f}r@z3=7}unmOfW1Wg&<PQd-Ye2a~N6lz%ELgMB7Gr(q
zG%<Vo%JQs6;?vWI>^d;L3YiO?vi6?Fq6&qIQkPkL8l`62>uGF^va-Sx2po)#s3NPw
z{sJ9caj-Y?@ZWjCw@}c9blMRJtbHU6A<A=@1_tzIN~8fez~BTsh{f<1Jj)6c67xAD
z)@IlfdVfSL!q(5qt?y3(V-|#VHx)}%VG>SWK=&?R^?BW87a4#3<;ihvbVQ0A5O-&g
z!Cq}v$Yfb(R=hZEuJK3VNn^`oR>mLvAR~Lg-O?w(RQ&cgqBOmG7Po|6r4++Rkw#RV
zv-Q^7Q!zV_Q=%*|5C%ok$iCRB{1VQ8Cl__}<oUWRV<KniV4-fcUzOFI(S;Ds-gG*<
z&Tu6t9Yq6dVu-=kN*^Ko3E{X>!dvx+pY1tCzX$zGdiunsU!hRuj9Wwb^iE1Q5S6Lh
z4Emv5?JP?_vD=8Se%>jvBQGtT3AEyAqezf`Y|niRHR+iN*OX_ZV+$+Umct2WQ}H=+
zwj#xN7lI)v0OF^R%E$TwboEB-a?LFlOcd!E&l_xLPI1Fjo1BkySGM`RzMsU+Lb*Tt
z?=AP6dvw>(S59+wlB5{kFbAs*{19%>sfskojL|+a1bRGxu9c6zK4|Nod^4iapTVgX
z&d5x;Y>$ebtQT2pZP+hVVQ=4kPZmJi*`vmZ05ypNBSbMtCeAKWXcmYq?ps4Jcb9C|
zZUGYDw%M(#sqc^c*NR@;hrHd}v@`Zi3>pXlDu_qcB7#F*@@*OWvyt%%hAv`xZl1((
z41N3MaCE!b@5gNIV*r3C0Jjf%&Bqrth~<_d8#3rjNU)@_#S3JwR(bW~nBiRKel)J$
zAXqw}W}q5p8EqOG$-*pG;f$=3{CeY^bLM|V=6rxQUS`D!j6c@EwLej5%~9=jErz$A
zE{o#0u8Vp3vaqq5ey7oO;efqkvP+xQ{LM&?qHKLs<U6yro{Pzu+IKwQnWiXbgu_1E
z*Hc=zt>W_i*Lte!>sr<?z}7^$%A|C<yWTJ`jV#}vfaC%=itntDiMZSc2Ys}_nkx7X
zEAN4cr6*vkAgMHQo@~13-DXll_N`x>%$7@Ti4#)_F0XDbUT+R*q3=vxQBQgd3GM|7
z_F;Qn|9)mqYZXVNJaMB;q~C>b56daoW5YGx_vy0Wl}JWCfzUnBoB$Eiq5#iGW{sK1
zzht7L3lI*u{@nem8IprLt5}ptH%A!UZY;hD9A*-&PwI)c7rz8<8&Lj2;kdtI)bAf{
zT3ttBEvtp~W;0)U;Zd6H!vIH>0bpYDfre7<{VD%X$bheTDyXywO@1XssGm#PaUUHP
z@(F#>3ZjRDDch^JwV-V^uAbwq1)#=%A1Blb`*bp-NH8D*t!k#3{;KX)(azN`W0oqM
zIZeM~LTWDlg&@#wAxUS8!_^5#(Il5QR|MGDxs`u}uXqs;&%bG|0nWquJd={|_zTn?
z*PGd)S>XqxzzV~~ReSt<Okk5qH;=8OS|wq*F@8IVFyZh-h6wb#!`Bfw?v~orb#V1+
zLrp-*%erXv*kj2l?wx3k5o!yTpP&uKVuM+OfY&114Vz7_^$(}9kSuc*dJjw4F!Q6X
zk>-J>8-FLy;uM`6>2?m{p;*KBuMm%KB{EV$>`{mI4mnDWY%>7VBd%|qbPs-;cBkDN
zqs?xjS#2!_%e1>u>WTF1q4BEVpX{#ACE|WMv0k-<t9eWZzkE)#=Zh#_jo1Z+t?YNk
z>p^zNDAuj7pLbV;5lt%0>FV^*;&NsK7!D@bH7M|Yl#rp_>xGzYKf#uU!lf#$HmsT-
z9+%-qbSpA14<<JYO(Q_FU+E@nfdC@7IGR}dF+QKqU<6}7fu1;<xZ{*};1xZMHw~ED
zedsGd^qt*hm7j#{)D?Va>WY$HP0|GuPKkH%6I`2qHcfsi748QFxVW;frIwP=G8xo=
zk^Pso6I3Vl+54!md8H>N#$iNXs9{N-NlvQ@x@-L)<ub^Nc>L;m=Bw2odglufpEJB^
zkMoPxtLFfh37B+ln0_qpO-BrNo5>PEHJQVU7zzZ%#=6R<S+8M@dvqlv13QQFR9L0t
z<bc!{>#}6`br3s&+1j5*Zj0bm+2}8=v&OF{lOrM|uTY7>azsp~0?bc+iTyw<D+t_i
zsp1Fhi)Pz7AK*6=E{4cO&*jT1)^H`}aaxum>zphGRVWbZf5$eA;rbF=jHFYv=f)3~
zZCTqI%*EAU3xa`ZNctm_vK63qVjYpQU80Q)rk$DK%nZncD5Z6O4P-|*iZ41+p#-D!
z3RQ5Qfq`;B6iD;n+C`w|Hux_VJ!U><6i5R5$N1QJcUFF9vVvCO&GK}%-fhl`dv=&r
zu6*Ag?&saBZJ}F30c3IN7d?9{kYTRoztk!hr-^`0aCCI<S3sLM=#@e=%ST_R(Y|o9
zz37=t51P$UaIy-+Y_``a_=r?#j(;Y{pk7rqi3R`y@;O)nGKP8wucI-xAICq3^NHnN
zSH3+3{UH#(3FY0(m)ZjGC+Jp8Wbwa=?rX)M1kPJpI0R(Oh182K7if5R&OVB{8!B||
z=wkuH(J!T9GT7pu{?PwFD0yV)hUHIR4AIug1rr2{t%w_a+Ae^+Oc1wxk_$~=Yu{(L
zD&hRI!O6(CfEs8wWjB5S60Jm~!bHBgbG_i>@{M85h}o;tUEuN=j&X7{lmpDtqe^1#
z+$uRQgfMN0ma6mXPYKgj=s6Wc46#<|e{y%=aq7DGad!}JMdBvtXM3`WTf7m6tN7|-
zIu&U?mY0tDn}pjj1cy;iKFr}FPd2D!U{-RT_NA}az+h#?ozFW9PgW;|_bpV76(JqH
z-I>_=UX^TJpUwsLBatWjahWs<tyw#>07S8&wbQT4dzDJJv$3W;%OOSK?G27^t_Wp@
zxj9rJFdf^49WMExgYRf&1LQeJdtu$YM*F1c*r`;mY-;VWMAh<^D>v5H;)Yfg{#?MC
z^(Jy;c!BEQ0rTFOpQc99VA3i)KYnqRoM&a>J(G9vX*>DNt!A;+*MNOtNNm}6pI6k0
zMWoEm8aM+EDUhu(9=6R>%+yRzpeQR=u!WCy-RL^0FaZX;7NInSzVLjll8cdj1kP`D
zqF1|<@()kyzkO}qV4gz4OpGA%jKm#@-Aq}pd)th4bz_e!CSUnGK@m~zk=qr(2obPg
z=n?|KrXJxjrA-O?JP7^NC6kFH=S(lh;HG%WbSRdnu8yEhS1x9xaJK1Lac$Y&k)P56
zFf0fgg;~<-zs8tTK#V!D2hp>ItA?2N6hFuuAw=IM-ap10<q#&25=O@Qwbk{wRiySj
zzsnz?i6CwG&||kvaG_b68=F)FTt>9Bk|}j)NC4?)m4bCj6{Peo5$WlFxeS0TCWg6A
zMwwgLCqkWD5=`h*ncJ{;aB%uIf$tgqsqMnlNn-Gt$$!t`e4dBcyV{|;*Z!AI6Z(83
zd}hm0e{HetF8eDIp(nDk-NT(-32+@&jCs8R0d}_vd#Go^mUoB@nss6k-Qns;nFjj9
z)2drm)?wJA`6jrVgQcM>XR9p^2OH6N?gC+KD)}nlt@e=pZ-km1CVzAa0*8~*^hL5p
zX}fPba-`VImj#1+)RkfQmY;OY8>g~OP%y{kXV8jLH(y-R)4uIQ|5j1qm~eWdZPE})
zLK@){g7W;zJyhXCX7LNl2)QIA>D4=KQPYVsr)-s)N-?3TWYnF}!cU_Z&2~p}llxPu
z^o*}U0z<!-o0**WJ`sV-P{G(xQW{$Kp9t2mZGEAl&>XW&kJs~Ew^7q^#pu(xG_Rc0
zywdL@SMFhVvq~*6oSDf!m@n7us7;mM?z6xn>iBZ^ti%KrHAh$r8Mk;awEm=RKyyOs
zgXYV!;#a2du{fHDY6Z8wky>9T-Vi2(Q7TJ+2$e>(UY5uG$(_5)zI&BA7`^>5Fkf4P
zq@>N4vm>(`E4N7ziZdl(yPOnT{41nQ0%*KP!RS$v@j+Z(T^#^&B+J)c#iMQKn<K}w
zd)pV4<-%8^!}3IVrzRq&7s5IF2LL1qk6$ife&8#^LE=meTGUtkS2qCR%-oP#dpKJE
z$YaD+$1?yYG{gCR75CBm_4D*ZNL<LVvsdLaF1VLT4IP$nlj7gAPo&3aIcVu9Z}a3o
zlP`*j(p~W?h9e!#S{_FO+4(UGGdoF&77yg2_G!I&(bv}{0O5leNVJK#&0`xdYCSH8
zhlhuw@f`Hg*v{0@rl_I{!F-iTU93GUd9c%iei39s^6N?lj7@|;R7tIIqFwsqaym_j
z2tSXl`O~ZRCz^&rA)jzA(m!3=*$O&4%b_fkv;;;;GEsuier}EBOA0?ZW)w{L?3@Q=
zY0L&2G>~lZUe}PY=jgRRV|slSiM?gEH~WdddvCH5_C%S|{oA|jDAV|#>?)OW+I_YX
z^N~$Dxkg9d`MX&t9IzC<z~rwNzxrw54EiL^m3ts;eS!MZzVyqhO30@`i7FO2xIpg4
z-ASeTm+P2MpW81K=KH?!ynn%$Iz-E<(m2)PnH>6LwhxvOFL5W-D91gGrKIG*zv)L6
zrR;-(uYW)npzLTW&gmv2FSolKX*k3wWN>e{J+b#%Pvh65;PbyI7X{W-Vi6fq^Bp>4
zX!oHcy5ffrlt+nMbAhb}eQ8yd%@jH5A#e3tU{V7*FVLvIUlJYJh4YY8&bAcKz8+<|
z;$I8R<b~Zn1k%d<#OM%b@|VcE?1_f-U<%fXw0OoNb9zHPsh3S`O&`FTlu0*2wMO9Y
zD8@)~ptZm8J3H?n|953bt3Xr8bD~#O&|FdhB|HNLG`%hN{7l}<WAohJJXYL+H)3U`
zb-^F~umKa{Vh;~`8(zj>m+Z5k4LQZGtuU0sjpN(MrVXH99bZ`z{kL?h&wgwcqP>O&
z7f@1S6r`50B|VrV+n4q$i#4G`N7O9#%!G|8C?pQtLG5HQHk`12vr;PUSw>F!oj$bD
z$$W$s=L3<&TzqtSbb42iLUrwM;kzO33gfsYDW2{7lGoT<0gp3i8d0}9yK9%~F?w-q
zky6n>_S0EW2K5qOMRZZP`V2I54~m!XTVX^5MSp*J9uoi`+NQ35YtH5@f+Ra%qw8|f
zx4jZS#o|z1?P0VU-*>Bb(bvOjl)85FjQ`oyj0qBOY<;X3*86SghOzE0`cOSkUi5C8
zOy?@|&x%v?SH{VDmF|TH;6hJ2I=S0DtPoJ4WVrx3G|X`zt(}Y-qO!`EMErr@)Uzez
z?p0PflZF>p7;47b($hf{Gc@y6Yy8zC?I1p}P;MokQf51ywx(Z&Zw5gyb)oEed~oYC
zF2#xzaA<<0AACDnf;BngHoaH<^v6`<-7%d~CXEB3U=T@tATRxuFcIl4mBh6nI^ol*
z>}p2liBvGoFr|Gkn-f2@G196rGoL{N7lQH~g&+23-jskjmikBq`Ls_F4BWcYj>e=P
z<T~?|kN4CWY7hBy=)I@w9HTj>XlZA=e3HHBz&p~UEaw@cm^yjEIZGoP()WLLf8{^e
z0nZ!rcSPchtwu_dwH#)9^MM<HTCKVyfp#xGeR(1V1>C~AIrPawa2^7*JJk;i$Snz~
z0m7;~W!M4u5jZqk4BIJ()Tzy-WihV%+jD_;B(PBSK<xK8OUYV=+;E|wA!3{LOi|D2
zTP*VXr-!^a#tRyv=@#aLHR!TWnDSrQY)krfn821pKYYKuGhNL6_uKmVT<(ji_(3&B
zzQ31WT0RuCyN*Y!GnvoGvry*0vjBigzCo(lsqM2mv9r%4gxqOM{oi$I^pIC_0NzOx
z^&Ni|;%1v+#Hjl%`Ef0PyCHgsh8L!06KxvLok9f@i1>@2Bxk>&mQpY^fVBN##n713
z_&pVY=K|F0{)2T-(bC2$P0VobA3MrtD&=Zgm4t?~3nFy52Kuxq^~_0OpV|5|N_KJJ
zok>bGf-tk8PQnn#!aZog3XC(^B~vjL_I`!nHY*IYySxic4CIf|Yy<Bf+yB3N?Eia@
zDh#JD%tmxbt&Ihd1>~B7Ef}OPY!pidJ7G$_&u9eaI*D4Q$RKxON(XtkPzu3fO7;6C
zT7N0%qdS%Y*15k^IT&k?T?Z{t(lqV;&FvTYSQ~_zqe8py%|;F1%liKM|GY?O`am^G
zsQKeZ?efZr+&@p@{qvOMx8qm);m069=phJhnq#!aieWT6+YISmj(|F;FI8RA(mV+H
z67f-;$JU6!RR3DAzrP9o1a<>bKaFR(Eh*&l!2dT}ah(83{tvbFpS8JPARocOhwFom
zY{~EMFB9?@M1XK4OYWbmUj=y5B0lN*dl4tWO`lG$Rb9TRRSbh%X<i3<rVW3D80L7k
zktX+kgZ%p!e60YK8Rl4WjyEab{sXj-g+M?{Q^R1m*CR)4Qo&-2zCot@HKc*A<~yq`
z<d?IKrhwd_tD0bSsaPeTB`$lC=J#LuaNmEwg_2RwCj|;L$cajGzpihd=Ah~gL&L4d
zz&)&h4m@K2)?|4F^1XgYwpjIntn<U82v+VTJd53LRiL;-Cb&1_5t(rRl@FTx_gf^9
z(b8xHQ;&OF1Mfc&b}xS5nf_P&5E1>a`2Sb?{~x%@zq|HvkNvOl`TvXY(f3F4ycpqB
z($S$vJlUhUxjfw{Ia~M%;5a*o!8<{DFsR$`FRr$AXhmD30k6?GtTjAh0TUW3bg|al
zgsA4xPE-|j-N0MS?t4j|27bf~j6BI=V9FK;Jt@zm5FdKDNAOg?c$$In*U9}$Ed<v9
z&;dB^S{K5-*npM*#kg)%>A21sX|ZlP;c&@iEUPdit7%%J73_smEbL`zQZ%%3%ilpN
z3uP4*Y!el8)RPr)U)Jd%K8BI<-r2urZW(VMH}N)6*rWn*o$e;%<|eyuP>>X!=TD6V
za{-Pm>j~p6M(q)}lqKyEBIWOx@DDD|QD1Fel^A`#Hhhggd^%6L9R9DXV|3(x@P?15
z;}I1=JPl^r*vagvef{<Ihe$5Wk#Ew}U+VWRXiOyLWZnHumIU-WNLr2D+-eV3f6_Eg
zHxAFxK*T$u{eXT?VM0J5pi`G8U|kGS!9DP7Mv*S2t%py_+MD7T#o_A4NAFt^$2vA3
z?z6_9a&=srcr%6Z=!0(?v(5g~2cN6^K=DDllg!-~SzY3-X}^??yLpKlibrPhj9}9G
z<k^!?W#%U~3kvSQzj~c&KIY?nJ>t0b6m3#1lyRAqZw`9rgCisCZ+)8hVro@Q5FrlM
z1O48Cm*DPij;pBwrv!}^#?3Z*NEwTL0WE3L8Esp@2h60P0}l~jl#xM<MaxJZXW*Yg
zRCG~*u=|zBtGO^=^N0Fs-fkL8GVKGx&&I6(SbZ2ED9(50<ap$^yJh;JXpicz%ysLK
zbLk-f<zKo2`K@2>9==o$0q1imVVPP!>uSix=?E@nh-9}I(^4a-nHjY|C%fuCXnz*@
z^CwJx10#L#oR>UK<3*9@d3fK??D+DUz1k@``)x(>4(O|$iCAe-B9E!$p_RCmyU>^A
zQ?KT>8X{y_JEnHR83;HQ$uFEPp5n3Ve+$9q;%x|q0%f6X>7px;H04}k+)Kn1XMb_r
zWOSA=ju^D4aj|{m-3=TcWW#P+etTp1i$p#$6M=+!!^}+8&4L~X&5%mx=pkEa@ZIo`
zGz=KLa`^RtYN>kehLra<r*5x#k9cA27X_+-gwln*qmfZeL(Ts4i}_Z0s*2Z?!r=rA
z;?KE78fAY<x0QX)eWSqoh@KLhIC~|P(kN1|dR|tJspCxXrd;WZj*F#9KB6f;mpA_@
z%Xwj7f55GST&L=bIxRw5u745S5n}%gE;MXzYBbth-ZE@iy)kg9threpV(vV~b07+@
z^;$HNgs1F5PH~;g$th_bO583RIz8-ftmfLO>WaH5)0QJ~lXSg`K-i0%L!G8>kn@=(
z*Z(aHQF;}l2c?&V(IvVXEuxP(z_f|5@mAj)kMY<$K!|6#&_sfR32V<G3IR!d1fu|A
za#|OioTv6JZn~ADmZ{T`>h2=UH+r&RljP{Pytcwcj9K3bjJI<d;5qDUzLlT7n~%zw
zF%U~8GfB0RQr55_2r&W#u4nQnCGImmD`}au%#^E14~Af?=Y613a!ZPShR3+3sWx0g
z_#eRk5MKcQ^`w9R&PE$+XI#$Xy2Rbc>e-uml~zpuXR%FU?{Blg&0X!O*WFKLqOowh
z^O<`p!z`?fesp`s(4FyG5;-47_;>A9Pl+|1pN$=^@{p*nRL`*qp>WyiS?~<R+@KJc
z6Pf?1+d7`~ny<2NWsif%G1Yz5sP=AwOTX$U2Hv4y!UL&aOQgV6LJ)MGktcJH)YBwe
zf(?M9R96>F^ayXkSmoF}J8u-klDr~;vWCJvFYTA8J+8wEMCTs|Ogc5%nnraWl<yxq
zz5`R~<iv7afLzGTkl0M_+!ZJeoLp1odD45ffVZSV5XQG@8_%|&UpcXP*q-VYTmGm1
z=V^^0%yEcORW#P6$Rn<nw}wra_z2m<m1pWW6L2Y4<m~F=q`HrK2lCW=_wnC%Fl0lU
zGT+Pel(V**;02dfs>a9!>I@ZZ=+}Dpk>Sy<<RRk@y*X|2p}i&*=P4tE%KYC(uU<qi
z$>SOM?G-m2zU8_d7aHXX=eua&y^eER*x9L?P+ILtGTxCk{C$0~@+r(RA^uhT(ax+v
z4;XW$+uNH$SpJP>o1Sx%6C$*G@JDP^B*3UC$J|pZhykun+gD~AEL;x5D+^3)tw*T%
zOZLkQN8NYzN^-0}!!}QDwU7&#KjoH<QyJ(LAWrGx0CsL=Hgne+({-hi)95f7;pYg8
zcc|r`)_35Nl9s$xZ?%F*3!8>_Qk>D91qgf5x_ln$SDIR{+w-S(ldOrV>{njW=cLN`
zq?Gn#82<Kuj7B|OrTdo=eZ$;$S?4ku+sgvX2{3`FnYbH2xM52FM*apK308l@-+yT<
zF#i`4HeSthxHw_PHJqhu8^DqDjLlP^*d^tHes_%w7TctLo;o}Wzok=?ZD9Aj{(-Pf
z6=jq1!lmdb_ctD60bbE3*7Z))ujSyuMl1H){pGFoXLBy7wOdt^a{koHO-&UtUy^uP
zJhz8C$2yxl_KcIqlzf`f(}jR89r4btu1M%a8~l`r0qzKFxH^S<RecC51%Krm%nkK1
zMthKWQcnAMH?5d+ncg)n)g3h<m~>yS=_17m9G!m}^d4%mYtMmc<EQ$egbQJ0jwyF+
zKebeBct@<^G~gF?u`e;ll8KWLs}<JOx#t$-MH0_QFP>I{=R33YA~#r9zsQ?e01_==
z93;%od_*HeS4kXHO#O;|AZK<7BZlBc;)h+2#`w7F`Rh_A?s=boHvGMl_awX5P-bgK
zTu%ER-NA-ke5^m&3GI*3?R(FIC&5*i#i<N?O?P(Zn$^1AF@(+?w{~NoUB5BI$(!<@
zD>SLDA=+*m>oo>RPrY=S-hK%+&D*jAd{Uqqdtc3#qnz|gFb;D>BF!8D|8nwJYV7tl
z!`6NW6iCvpwBhon_QiUXcPA?|Lp18$LA+B^t^Vk5OL0|IV`VM^M8_&f#NNpK5R#%7
zhk=H6Ie&&Qv-#oeHJspcy>I4Qs$(s)LY;QV->xe^Vs3wR`ujj}-VTr{@t$Db-b-H#
zo4R+iUT3Yg$=2Uo<DU^bO8Ad3$MlmKX!tuJ<DLdQ3NPG|Vq}{XAh9w}uQ}!GH@~yQ
z{?-j&Yf?wALJz=s45UeB`Yi7$mw$KFO=zTo@;<Y;oOQtj7b|LW9p9uAjQ#t%yJJL|
z`I+$We4{NqxBDZMG*xk${ty)NlEGiN*^RN8R0^zwlr9|lPFXRQlO$lcguMH~Id@CC
zru&M&;VP+IE@oiudSIjfbC=5eUCF1j7%iJ`Xijp5K20utyJ8Zzh;GZJCK+LY)3ynA
z0*5a~(br8OY@a*HgYO{+Tu+MoDPUdGxfYmsZ^tQCHtCrIw*GX!BaT+n)gollJHOW6
z&{ZOI33>T``yB>@6M$)orR4`vI1zbomyZtn^;Z4z2M78%b3dctbx+$?EBF^-Jurqt
zF`!ltmqv&&oTy}oDP=fy=RNx!R1zv!@yIS+u6r5Z^Ai8sxRBrW{q8xFrkVkr>5ea7
zo^ZMDo2fqUg}MMV9-UPtb(<dRX(zOJ5+VQ0v!v$p9*VHI$-R>F1(3P1OFOKAv*-23
zn*GIRf>!Vn6CNV~5!7!j;0`S;ER6CQIpTi){P>MEiPK_hbGanb-ygMR0pGy+Hw8){
z_Zt>Ll3Ig$t133*yBX=H!B34A@`G3W!QBNj@;yyzRcxC-kbR3VAZQ05*C0$9>EcK!
z^I@=wvB0e34mQhr$)^G)_V)59|8OL4U#o8D#7<0y-SX4lMS#i$l@xvgo{Pvmf}=*1
zl*Q3>)NI?$q$@r<l@h>1JG#FOh5bW}c4o1)`#(JzK;Ch%axD=&_hM~du6t*gk@MJ6
zZJ(SU3tYlq4wm!mwZ(scLLVO+I0zI!>+RiL{PM?b+bo{lrAei=_wp<%xGm%>Y^bfP
zCI)oi3D}5bc{yTXtCFMKb6MtOulb?@82+hsVrsUsLq*b2$;s2FZd3JPuhBUMSv-}B
zYhr>?M~eS^9}`bt<8=RZanpVd;N?Y$Y;e<30pG}Vn$udi)U)3<k=fo^+^zPxyT_+9
zK!5`j*uouv4acnrv4XRa_l&1tln-t@fB9-(<9>ony?5+L=&H;yfK$pW2ead*ZMT%&
zj*?M-UhOt+QBOFWB^NH~tG$3=xKSa1jzejbAebiaAAb>jFgE>?1a#@G8gn|kglg}5
z;90q|S5?+EX+Sjr*}op^4$q5`A6Vl9_dBJ#Vfe`_K$>EJH02=Dl>A~3C-NARIk@~c
z1Q<Wo{l@jLZlq7V?k{LxKFHP$$V=pEz5I=vL{Yz2_fFZ(f<OR|wKSD$^Kk#e)pl*Z
zO#PC3`#Z50Kqbc%F28_UT^tq<F+uGT*w3beXoxt7p-gAatlgJorAm_VkA(MHh5yQL
zKkt|s=LyB{b0FzyCw<ssz}b(yarUoSA{SsFaQ`{La$9z^6qXL<`{zLcAE?}ZhWW};
z`4P`YlRRwfYUX7p0}9+K81l!5Zbw(VGT{6_<VN}4OVaiF*VJ<A-I<YcB?_M@iGkQ<
z`7c6`$tCOyLU!X}yf)lcImz|15F@15c3)Q?m62`FD<LjT(1ZVstI?>;Ab#ki$3Eps
zbMQlI>R)ZVx+wa-^B?Lsul0bdJ&x*27D&7=Yh@a3zGJt%Q{mm72d#8Tw@XP%9`|gU
zdv6~eF*nB|GbLg%@n6s1EXNYGwG-=GCAP=6Cl+U~&N9Pt?Ah#Cn5`T!-%+T^HHh}u
zUVY6B{|bo@E{}J~Vq!)PZ~aNSliE`&<>rjLp;<iIlsh{R)s4)l0E-dPo{HD>#|Sqp
z@<aAB#rgsxLmz%-X0=)E^Q=l{`<0t!Z*t5ctAtLkJJ8wJ`jB~kX1F@3dzDRnP}vHf
zxHdp#ot#cs98NJ0hs&A8IhVb)sDA%GJZ?Y$lM3`XH*0i^uSv9`gafqcnJa=4NbM=y
zCn2|u5zdt#@!?-m<H_mW{%B-()lz(sBt^SR!gkZP*y@CsPR(~l&3cdV?fD9ST5=(B
z#h63t5Dyh=ESF9<!&+@I718O1&R;%wZqITu{6C;%(}T9gaW(}L%mDjC4Y!esmBdX6
z2o(wvP^PUd;`vW-Uc)XIHhP_JnBdvXVlT9w&X{n<yI(nlWsCd)4tOpv2b+Xrv>O<>
z{9o+7cTiLB8U_dv6ahg6=~d|nC<sVL5m1ocYgBrdCN&UjsDL0XASFoeNbdnbdX?S-
z(tGcO>`BmjulMKfo!!~Lc6Nqgh$i1T=k4$FKHrz{$Oy&Zw@$;)q`enT3%hDU1M<oS
zL}&M6*qWIytl8LQMPND+Iq*r^#$0c(#1pZAXNkB+%{HsWqr6UC;k5muUmqm&V#ixS
zXQkzLB6qVD0U2^iut$#f?(Y7STr8xqMco!}ZeD6TF<Y;4!diDdetdRKEDy$0O7$c{
zHuu3toj}MZ{%kKJ!0`vYLXIl+5)u>D8Q?Y2a}6if!`;&#LpOB-A7w0I#i)LL-Zbc!
z7%lty@1)S<jR0<*LDLclI6M$YF%JLvHwxqI|9|Q6?4J!aG`RPr?&ugB9_VBtayr=Z
zNDM1;H9t!2j%}n;SHV%;<i*_f9zf>SRz*7mz!g3A>Y9biP`MXOr<NVw1}M|<>#_yX
z(w2)=N!oOVO${#zFC$gjFMk>5{(*xUM0)eh8{K90z6jcR5gP8AimhbW&ng+9O$&y6
znjX1E862shBFZ*K<@{o@!2zw5IwscpnZ68+oZz3I%23zUy*&7&5pnk_;T=qFek9*R
ztV5KoUoDqgY4%~)jJL2r$4F9JS=8rw&#p3?OS5j|9btBBwlmN{zHlv7WR)eP)fujF
zEtI+~Hn+hU9!5M%aOdK$xy(EXb|Um&<sb*P93*w{QW5l6tFkbgTVc-;tvPNi42}Nu
z)NV8<>K@|Ug}AE|X6Fy$y`H@te>znF^ma7HkyHW;2%w;AnhqV_92AB%E0qEzpDSF#
zEyBvpkkKvr=?&gcFf1>`xl>e24!+$~hBC*+^)#R$G~&g8TK#9BR(A!Iwh3WYa}(Ap
zZ+tcPWU`(#l$K2p)uU)?qn&NYqXQPx^U<xiY3Mz$C^P%=$BpZx7xM)68a}Beya#fy
zl4z)TnQ=l%u5xaTYi1St8~ap6>e1|!>3tvr=hi5tKVknhX<SUUpR^O_3TX%AqY*~k
zwt|sQ9HAM(1EOE@30|`(`4b1jb|YW{434)Bcwv3eo%)SeDtFsH|9G({<JMBUT4Gf!
z`$?d!26g1!($e`+%wlz9*XhJ6scv@Et}vxNT7+jUN|R9XXa?-m0JkRrKTD&(&>DEm
zCU4Y9+!^zYXj^dEPt4RG=|Ecyw!==6s#!3?ab?36C1=7Jq^Ra8o$&B2+uB#DmVJSA
zl^=b3(_>wxe6CTf{+R06_B}@*0E|^P#wqq1vTuy<OSLrL*3sWpm>v8+LL)jO()r8+
zAJ-8(`>p4BDXj=<k=!3PD$Fs79v5uqk3Wtz<&aO%``y?&GZw!6M>HZhki$Z6$gvd$
z`-R=o$Df3ehfHHHm)VWkfU+#Pe;`oc<udvfXk~7>(;)BDxxG<=wOCBdDjgS*FqE8G
zxH0p2Q|akm*}1Trx*J>9qn%WGSN7!@UL=gUua>2AOQ6Q?m+ya*XTijAcaM0WdXZn%
zp~Zr=eAu2g?kw=I0QR20K5@akt+%TNFc_1<wMe^?iMkTzx$IhhdWo@-{nMB(`5=ct
z2*o9C8qDPPtA<sm4Su_C8@0<A^#ElKJZ?Y4cElkpd1-V2Q(CCE$0ld|>I{@B<IIbb
zr1^oi$^ki$-@Zm;PTd7j<`4hB0jI!(`iMtz^a_=QklApPOYGzB{#Dx(Qgz4c<=b+@
zHo-=8!CGRGRmX1SbE%beG0Ia1n_>20q>?9hyxV2=CwMDYcD!6GiixSe1@08xu^BbA
zva}2-g?Tf*B9Y?YBB$~Q5eeuUYGZ2!@Hj?Z1_`IKSb=A{Gt5rk%)(|ci5COmT%2x{
zTMZavl4i{KR-uCjFcUHnXVCY9s=Ip~kQ3@?k@<}0`%0gm=hJ!hO_dnwsi{$)&Qdw2
z9pdK;Q%X|1(wTtCFVKFz2#7FS#!4ARm~C9BT~JV%oLtsi!jO;anFgjWln_b%n)5}b
zv4Bci2*UG=;xH(DA!z;UyrkGj$w#v}!IjgFFyMtz>*fDD&6Nl8RiW9bb6#_lnniPT
zy}ts}<#(B@z)@UWzT*4pSt|``7LV4AC35W2t_jTe>~t6AP+v58wZBe<d+<nD<suxR
zhxXw||5yyAxDt*AP>}NJHUHTrc;uU9!L4?UoKkhy35zbH*@`SaSZL^is{bKwU#$Fm
z+l^oelQ=T58_%rt%IR$Sy1d6-M+FPeh)sc+tT3z%8e{7=Q8Fw{dRcAy9jp-%EQK=U
zg+DhbJ68A*F#AKVH`$_V&2jv2vR&S6;)Jq(cJ8jo>c{0A6RP8zgxYs7qhhP3o@`}G
z4AQ$m)YO*8t=+P#17^EG|JBWq-q>KLWXy9OHMQjf@oIBcxr5r$8S}eHUc`zC`#2o_
z2MWJ%syzGiG_>p(9Kg}Rl)T97rp+Q!++(e<H-*^G@;B!E1JzFP7nqdjtekU9sx0~>
z#b?0lD?WcU>xFp;YVzEEB)xA<oXfH{3(}`l)4V<2;>~2R<d*7<uM>2srOGb4(RQzg
z&|3?=Q`K`f%S<{YG)frDf^IJ#`<fmFmJjGn=TUJ3u&%9L40q}2p^wLEP-#v9zDh^9
z($P+6YbNkbqC+0qaqY_tU%MCzwmZd|2Mp|aYfvTH#@@4+FkrL6e7tYxBL7x)Z?>KD
zY+eA6V8Yff!HR_puHznYhzf~c$7T^$OrSh6!eEBO7IVmGzN(Xv4ZgIfQS*1FJw)=Y
z@m?!j4YK%K$ZJ`%Ef&V1FfgQkjNWHlYL{XdGDzRgW&&sZ_Te{Cr+*lfSGAY=IDQMd
zTT+RB%03J!jSI9Wx2vzg+1pHm>wyRONh@B|u{yP@`Rg^67O86+Gk1xj75bRL-iJXa
z+h_zaY!v{G3q~1VeBF!bN(X}D_mMe~&crA9eqVpZ7<)1_q05XjI1?znYdk(z1Bu9Y
zT~9y0>~}N$eI55Bma_0?t}X(q0u`unOw4f7rQ7ES+{VRv36sSH>xp^ApYP}N6w1Hv
zWp<pMd%WTH81m5A!_IL`QtSC1H9Kt~5}qNHGaIGI-U>sXHjczQqD_ab{Qag@1p#Cs
zvSnY7nP{0QCc+UG7^(4=fvj|XBxWrf!0uH^B%km_dvAX)Lw&->Teu;pyZ-@G+4RHC
z>gZlrdX>;#G)mh*$HM#D%EZP&zrK`mw0F)*>HeCU|Lr|l$FE<$0D1b7SOlBvdub!1
z>h`$(K=GsR+c^mICx3d5L6wU8JvV%mvQxs&;H0wj6q&@m)ygh={@uOhZ2m@m0M*2+
z`_;OXDV^|itD)zjmvjeu0NF`2I>T$$4fK%}SlI>7pWDe~&T(Uw{}ZzTIvME#kP-c<
zLditz{7r1hvpxPTzVoUsPy+(E39HAx17qul2%E$S;4FB^*W1&`hWX%-v9Z{6$a~u;
z<|BXfR@qH=D>coB$XJp6B8|7r!xpj6yrP?<@k{BxMvF@xPo%5Lagc}3gAG|!q|oYy
zaUDc^%cBOobQ1ST#7xm;%Q1c-GQkWKyfwh6K}~?Bk=~a40fWQ9aX;nU2t6Cvce^^)
zZR+&~qWZ<C>{_%_(yAl*^=@iVK3vab7x`t3!g?i8a#CW9XR;x`i(Ig&-$RAxmU)=3
zP9*QKAmK1wp_>rG_Qh1xm4Xg!g9obtbZu0}iIzj%4{PmAf<_yk1yy`bbqTE%Mxr>n
zc-^%oAZSLlE~mNC7?Vyx9V64@s($s|c0L*SU0WAL{|BpLn3isU_H%qbRU5F3G}BEW
z?>5@)P6^#hxDkJ>PTkhdV6}=A?=W#+6S(Hi{Dki}iwaT0Df=f31aRXB{BlWrWi{XQ
zzX0ZeDo{k6Ju7doGHC9m0xYmnc_7<}&mvw@vr}rG7-;j7y<NAvj=JQ!9WeMV0H5+d
z**?uNc0Tmgd0W3(iF(>ZvHW!fHv7znNn2Z+S46J4#sMB*&;adV?RZM@omA@Rac-=;
z;sNSc%U-HaNg`cqgPql^=bnm%kKPYzeZvY$#Ud9Ib9~9(=;<zXV>M<2s_CUvfGvFI
z+$|G0XQQGUZfTI9J#B#Ny6?!KBWMl=L+>8yIJHC!`Xgsbmh(bik&MZM{QBTzqv|$|
z1tpe_*+A<D5T$Y?eacBKEuMkscgJ8umGX=c3xK&=Y>rXdHBp=)-tnZ}&NlyM+5OvM
zi+~160{5r{DH!|X2k3^J5wFxuBQ^{ImPRa*nuN^l&GQ|s7MOhlGls>zpyLo&iy2#7
z@1n(63ueS^e3s|`HsZc^ErS2xbzxn<kL|#CLC1iBizk`;$7L6%iSBd1p{njTn)zY)
z?rY1Y&nHOyNG|_^Ly@?`M6ka^r7>QtJB_ZZNe!sXlZLg!r6t#ros)~QAM=(^(utt@
zrcpx;MZ*`c^I^?@&xiMT!>>>N$0R$Kq<fogzF6$-(Tm8lND1#;x-iis1`^-*NXtv-
z1S$U>6~uYQo^dGum={Q!VDp(EqFQ3KsD{`0I=4;^P>CWHONOn9x=QMEf1(fPE>OEp
z9c<+O1|i(2%n00#G1vgjeeC?H))<=KHStCruZl$)I-yuCYgEm4nfN>=iJO{muwd|S
zataC;YmC@5?I+r0ev7RyLbEsw4-gxR<-~bE67t_-^Ao-V!_p)F4CZ41Z4a2f8LTTU
zrKHu4d33e55397AqmEmE20X#yhSfFDTTG~ZdPXqYfa93J(MMx>JZ#eIgYjwOK9`@|
z+?L_%Z8ZJWBeR&aiV(PKLGydEB;>0{xqc7-a@;^of9Z{Bux(A=H@nAV;w-8_a~z?i
z6&e@EBO51fljt9no_QXtFY+^eosvCS*#^UpiyQD3P$Sz#qoklfGoJ;sk*L65sxo~n
zasfAw@Rqh`@qD_Q!EYd`bXR%O{SPf+Lxc3WGgXxZS%HAUWKtB%T&4Q|$!KSo+y75S
z`~Nr@?claF@I~SJ00YP}dUrfIEjcAcZ#4TX1%!Nnij?HuX{6az5N?c83d~RC2G`s3
zMU1?i%Xc{KXAO<%7#fU#)OlgNTJ&OHpI!KrFK_YZ@UUn$6|lxLJGTbHE{M^WPA^Py
zIlc0H+L_S=?z<+X{{iUhUEW{-7fpJC?li9E!+$`$P^drt2~`5P(7gK2`B&O`yKDVM
z{QRH+A?~xcCS$>R!J3>>-cMHu9<EP}=d9-HQbWMe*_?I^$Ejf5n=!l3R+c{?CM7Ve
zSbBUP6b}cbl&-m8j@u(?b0dA*|5xs>67hIxc`3(ud7@g^sh}|1PWueHc_^DOKxHyO
zYZByXMs4y~#Uy*Nb<j0fyOmN(I2c0aPuVItYWBh`!rcKIl!EY1H|<_Mjt4(2ww&iF
zn29VT$_AcisyvUo&qD=xORW^h-h0htWxER{uLwMlU+(4S(?hV#bGS#E_#%uLD(;`P
z&c;_L<GG#LSuJ%vExTR)r%w^&6f^&!TWMLdVogm=Js3xGS6E`Aw@oFtwmDDcr#FoK
zx(<+~d*x1ZU&{YO+_%=_Xgv0+=N!$OC(8Mc(sSu8+}9LS<V7ek*G>?`6_(t;y;nS7
zvw}tU9?I4RnSi-gZ+Edu!!w!Y{}TBbC^k%>h}2YNV1{o{9T{QPPCS-mV{yKOtDX?k
zBtqx$2XX~`7LySkCHtZFvY|0C<0-42^8uda^KTTgNW_Sn!$;*Q^#5(IwSvyvGg)Sr
z23UC+^_l$F#)@mUfTpIO{>-9Xpio*k091)4B$cyZufRIlnBSFY7|M;e5cYcd&Od}G
zEqwu3>ioj1ZwUb8AeniLnF;twdumeCo>^g$784aA@HM^5iOS2pm6f*}@e*4_y-Zy7
z9(LAP$n=d$^5@3v+%#PYxc~GVR!kir8}9r3*7`eC0^3{mJ!xe&O;i9|W-KBWOT!9D
zfEr-#@al>*36?2iSqL>~LI?@7%;AA{ZZp~brA+g=3W#xH1zEf-L{)fBxGO|gQ<Dk*
zu-s?Ka|GjPOx?Jk2rWT%;|cLzFKzAAO>Xva(aE?GpO(#F&1Sc@m?p#(`I(lM<M|@g
z{a8ON<R<;PcAK%U)x<&DfOT}QE4)&!d|F4@eXX$K%{7dW{9ceh-v+!HEcW6K3_INa
ziZ>>{rx)?~*&7_lRm<4FP*N7IPY&Whv|NM2BLpwdoukHG?9Hm=9aj*;T5iR|C%X>I
ztV2{q6V+v9(p%eOoA@~}$?ULU2TeWK<<T2542ZJk5p#U3rTdxUH7fJLB9>`#G`b}C
z!OBCzqa$mr*W!;W)ZzP>Dre^!_6FgIeR>{@BrDWwI{<s+#aqz$F>UxyMb}P)d@gm5
zqQ*>1f8K9tGhs6hM)qi8{Az*UZ)r(?SXKMV?kVJGCq&xQQ&UgJE?n!4>G$wUY7SC+
zQQjiJE{xZ7NnDNRv1Y}NXN*o(X7I^5Y|}GOVXVxIA)l`_SplX7WTjUkFtw{V>*U_N
zWTT|YxUwb%aFLDI&`}^7UcT6!me^GOmuT38e?pTWT$xi<rNEVynZxi{81xb1=>`Kx
znpuHZo#5hKy>hFmx8G(!k%PQ|gzuMIk6z*~r08$13%1VA3@68%VK$*S8nbPbB>JVv
z*Lc=TLaq3XE88g%9W_<_rt5~(kZ>^{4_U#N^8ix>yMc#E3pY<3aPO3n-dOC2C;_jE
ze=p;x#Ptyrk@Jl1pJO8eOP0xb9LOyyVt@J@l>)+iItm|%t_SFzLH`L_emw;W85#B@
zsWI$P;8sFBP)_`4^o49*qL#z`2VM82EKBLi56Y@Kv(K+%cP%CO)$ZtInr&JXtMNp8
zcnB|Qtb81v*J^NI11JR8Z4c_#Hd-+znJLk6mQECExlQ1i4hAs1g;B1?&A$j$4&+19
z9W$=0rpI&bnwFZxNKTpR)|OLZ>(E&+t$kFxW)Vn4w4L&`Htx&L;rc+UhT>;mzXsdE
zA(O4y1&PAA&kujmL)AcezUu6xH54d1*CS>R{*xzelJY>C)eo`7rc)N?$znj`2o}+3
z4Xni{;sKC_td``rOQ4;L_Z_J)mh&gxosa}Yp4%~p=NgsXTUw?~tSI%`e+J<DAGl1g
z(FDg&*Kef4Q?CYbGxIJtw}$850)^IGNzj>JCp977*Atn+SNX@awU%CCmY(GI^YtEO
z3Y*t?&~H6@8tpWgUYE{aYPSJwKw<bI3ETkG4X^5GtZ8UI&MWXUCfL}M0esX!ZF$g+
z-L>hz70@?;0{Z%;OF>(sBRyrttPdFF@8e<~Mfx>#{KBKTHDd`y76E}9KOgSroR(eZ
zm^PQafbP)0n&<`wWB0w)DuG^1c@+Be%2Borpg{JS)`mvzYXLU^v<C1}CR|)TDZubp
zyT8$4W6EXr$=Q6q+}k<imlGTSM(jU?28DJ4M6DRl(zC?U<m!rb=(hLVY1kEOk)Rh+
zPi;ShyKsk&joGS9R&C2xk8R&KGc;;q2;-AqUknoZt`!f$hB*>4cT||D$3bys*)mwN
zNSb7Pn6_r3!5M70uZC4t_e&^A7r-#)ak+IyVE&2cLUsI;rvE-J?h(cFA*}8Gsn!Lc
zPeqjbXJy(XXWx{37!?EK9{;e#%EOa$_+$WU8Qz>vKE}|tW+gXL2|NQgG~kCi1X3G&
zR_{EGYxlV!Nh|_52eqqd?u@y>o=1ihmc`qB1tjQ7JNrr4+7$2+N0`)pv$x1oumfcA
z!#twQKKV?Va?+(38;l|`C&Nlt85p+k<@%8Tm>T^Pj=yw=Crr{%$qHDUq^g373M{eC
z+dL_F?iq$*vk?ImIj7+v8}a)7m$DaLx5e{lrpOcdI0>4+zH*8RGQO9OiF4i@PdY`>
zJ6^@=`qY6o)s*$ynODU3Ie+bk11NWxqM>2$&L~!o3eto5D#dvzthh&!E<^r*dILs^
zmVoRe5wGHWMux=sL#_~X@y5o)@ZjFi?81_Mq#gX8++q<dc768t(#xRDse6UHtm7ZP
z(@|EP{3;s`z)x?F_La)NB_0t}B$*IV^rYb5^C*XBhygYm@~(E|Lr9fPAW;BXi;sIy
za3tR8up1=OM+GbZ40_wD<;O9l*WR^_HcX^Bo)9*?gb_sn6bukRkKW-xZ0?_xKYtcu
zcK|x01F{_O5&);=+}*vjcY!KJPfri%b2+1<sY8JRmMMhS%F60vQz6!~YsW!zQI<aL
zeN@CBL`eGj1*xW`t4&f03;0vY(wW3b?lR1Lp_j@fXsyrFX>)6fYeLYUH*MWJ$8Q?r
zLtS9C@3N>D&Rael2w_+<&%_h~53uEV@htP<`ccTq*F-gh@c;*y$C=?m$ts-FB)Bsy
z=NLaRce?*l{BhNYb0016SPzYB*D<!;f)tCzY@>A7s$Dk$E289}2!J>67e?A=fTG|~
z{)(F`D<v^8bN1Cx07iq8Vt#dX-kdj^dke<5kvS1*k(xHcLNr*<2&t-F^q*<jc;y^g
z0}be!Der2Clj+A47`)`&hvmWfc|;C3Cuo41d7cmLG=bBL;d+W)YsGrWpTFP$jNnk6
z^s4dkcP*`Abv@arudX~FF>2VMz*M*=Cv?*~@;gx;gBhjTus1Waq|2sL@`B3#s%N|I
z$o!bS=36(9%@yH4U2+V7>FmI`;xy(?gf1S;V(vt#6#oLIiq$7NFk1;&eE{0QkemPX
zZA=801b{`jyTt_==8T-2u+N`GGx8iBo;>)7g{**0n?MORGiR=-tPFg0`z{G-;|ona
zt%s4`KbY2ijrfo}7Apa}Pch=})_Q^o(Y1SePR*Us>apv2`M|yjqjhWSHr}F}lk*r?
zj$FUAhl$e_ga;lg8W4ql?K1q+0=<Fpx@5Vsu!Uu2o<sQCw{jT{w&AKKs`uq;C5s$Q
zoG52*Vgnv8<wF(4Fqa!l@c1hs*@46@?d>7i*~F_BF)HK}u@R@sW<gu^9}-RqL^-lr
zU#c5hd6#GV<@2e@e8d!4V{9Qn?<b4DSn$YET4<dt#O?^+^ca_Vq)P~HDYY>MODAu_
z*v$m62PAJ6@odFr*uNT+btr*dFtJ`iIMs!hy#CZHwo+RK_JP<S8}3{N#Pa8J{nyLu
z0835&$yaRI`=@3Olz_=J(lZt-tbZmAjG<ybFzEo~v(q(S{ePA;l9T``d7BnG_ZOxA
z=Zcd8z!H+n&p%_$|Igca0L+1d`<~GMuLp4fu9fFS+AI0b2Ts5TmgkxL`WKqxpRy?;
z1J*Et^)UT&4JHg#^}T^3whQ{#v;TRkSb4aE0kQ2LhfthJ=Z|+_Hgc+b{z!(czWz%Q
z|M{}^6_Ai6hO9KH|M}FGe87#YvbMPX=LfL4>c4)~5&?@;cPsW?`R5`FOu!=acx`6?
z^G+gwMT~}dGztH*2pzCU+;n^8U!L?owF`xc0Y+At#F&o%+h+bPm2Otx0+p}hg#R&k
z_^%84@d8l-DZ5d{^Up;l&jWX2zkt8=?{)uA{)%G-N{PZ`58(XNKUELl1#d8qI>f1Y
z@xQM8kC&p4p*Rr#A5KsIvIq)TWE?5q_dgwPL<LynSkH;|FN-(>i%1NbX;S^;(*JeW
z>Hwn|4q{0AOOtDi@x5J!<kLS?@fXYOrT~Oz_v5GTKW{`D<CmXZIXdqBvaQT#j&r}y
z0{G|K&)(!m0mPot=6dCSzCjujDm?f3a<HBHe=FcW>=&4SgLZx}{FTIw*_D>HmYV-R
zp6kFE@WXWnT%7+B8KCGcK)k52<D&l+Q_ui^Vjm3eefG~M0XF$d1DpK+(zO5S43dC?
z)?X>7o^9Oz<CdXez;u<J`s^fwf86B1g&{2u$U=0F%kD2*0<Hp7LpT$;|6fXrKd(gr
zJaX}Z9L*V6@rM<#umg!sM7Z-W%l~;-4ul81(lstxs*!m_a=Qba2IdNm#`^z4cK-9h
zp^SjXAAf;a-T0@o{^^+<xJdj3m5LP2mtTT1QB$)Wz(KLR24)W;^8a$H2N>cpqi3|x
zU+n$Q=e@dN1U-EnGmuqcpa|Nbc(cbHfYxJYgbZG`pD&3qZ??KHTU6cw_eL_Q@Bk+Z
za(60)(RSYaTB7&c(toS`U%O1N{ZC&6m>~`XR})lrg|<2mZ=^*&vNF46ICUx^Fyj~S
zVZ`t-gD7*Rnr}IKn_r-3ru-4>zo0@Oo!f)7ifL!brWN0zfihDnhp=^NH%Q$od=t>h
zIwAQ?@+0^fbwNKH?y#fu+m&*=)EQc{suNCN&ILy)XZ?>TzJWQ+BWWJkiZi_j&gW&J
ze2jb|xL5RQdnQn3MDiT4FEb$I7a(%E+i=q2#?6|IFj2h|z3sep%L&uZ{?I)9^Q)0J
zWcJ!4c>+}>_<S*rq2t@D|65A`w$?xXI^mtn!a?;!+$;As*E58}%fPv@o=-kT32dYs
z>4T|5Rch=)w9J?f?PMPEgRFWA?-~iM#`AjF!8kpJGiu}uT*oXQUp<0@X=eSe-P5z^
zbB4%1bSmsIEsVz<u5yzWT8-e9AnFaPu5vXts+T()iu&Sm=)kOJzz}-W7}S%*VdP1R
z9<9H%VCU}AupC{}-%947W8eTm;y3WuTDlp4|A09rW&K0~Y-Sp21|MjR$2w1(jIPK{
zqk96;0Z8pxYih45E*-@^c`q)?;_nyW%~B3a2-UW|3aQVzWQYFa-g1%_s`jQ=mN6Cm
zVAU%thW};w4=!3VCJ5J$bwO0w9U$85%Umzjf`Z3~9Hmp~5H=+%rI6Ga(-NMA)9s}M
z@g3`8?`<2I6|<z0{R5*&!{>&^m3aM0ykm88uH$kZCpk2FCwZb)x9V1Ss!N24d1*q~
zQ9-H@1MoFLTC+x*{;mDIWmYODA2^S2OGv)_d`oSIz{n8=C%x}spp#xj=56nwx-n>b
zjB0G(E<rbYL*t`g?lgG?cYD2fzgm+=D%bXKy_ms@r2heq9}9lTS_~&FK7`$1$LhH7
zX{bYsl@U-dBZxLVZ2pH)TwZX&%{jMILtO|5?^~v18zRX+D{GeCm0~K5Gh&L_Rk+D<
zS**~*W}WPzN?6<5xwda&=EW~8TaTqsh<j_Ex$4%-apzWFH~_dCoydB6)dq3Wi(`|v
z(?gk8k9{f%`k_8E9!=|E-18)zN(U0xyX=-LsMn;nJJpwqlJ=TE5q<0^EEz2Tb`taG
z)BUbDjjtYf>LrZ{)!gT@i8)=f?7WjVS7vW7-y1vGF>7r=|E0tPw&HO0ovYgD!K4Xc
zI&h}!aQVLfAraYJ+et*pBLFoz#*I6kwdmK6j055+VmsS|{eQ~A6W8wCj-t+avy+uA
zA^eIPmG#8sV2Nz$y%8aSg1h#R)5_wlzR;zztp|j;qAAiOV_&B4?|@Nb9E0Ne@ej3Z
zgGEpw;?zFRKdvI0>-ZvtT3v%#_a$Gsb$ucVqFxs}Dn2Omj6PLJ*%bmL%OYm~$&lbR
zPIW^wc2)r7085r9o#Ikf_8t%1jguOGkmFspER@!Gjo^IXJKB8RJkg;rp;Q@2FowSP
zukHao*?)FHUqW6BmDpW<H8T-ch)ols_n9PklzMu5StV{T=}}XMMn^O2=}})LU=bQt
zmhWp(8Z=#T)^Jdz1jLd6!J|6Xe_{GZH>1BM2sCF9YzyqJ28{B{2a7IsgLkCMZ-Pfl
zqUTqm*y4;As1kkGk-Pl6hjXeW<A*sBN)maxCBsE1^k#KMXRIUS6`o86#8S*m^V3Og
zjdQoRmeoVvSmVf^<3Le<@JFO@rC?_G9vH2g;*BVh^uDy+cBRY6;Ckcr3`*Ri<e|I2
zYd=HYTlVH}PRa_H#pk_kLwaVl(ma8=z&((a9JJlrcBH}~^|4sZ*H;s7+A8ib?bRFu
z2P(m-34{kbQVypcdB`f2wF2iCILY*jRg>JS|58$-Y;C<1xZy36RwLzrJ%pxP5TvIU
z4NPcwL_~(K-U99Uc;4PS%qX?O>@e@X2^<*U4Bj5Er2$?|lHxW3$hYs<Vi5*g2DW!^
z52cY85qI+)78tJ?hv<JD$7^j-2)n?`8yWv*6U}67P@~ovUvaP9j4KbwKc+{rvQw(}
zxdz`$>@V(H&$hVf$5SJTLrW>X3NP<N)uhq}i-9>COiCEPH}0cV&RBNSjp+|5EK(EY
z#m;2I$jju^FT67P2dV+;u3-HZnMnU06=<jA=I?{1fWhP3&D>9v=n3+7#246tN}|5#
zZ97z$dk?%*le5ioDmImp9AoV8HSU8G74MwFNpHw7`ov+9fdEIT)hl#f9P|)*+6*J?
z%9^awKN694D5=iO)aJ_4KP`=XC_jKrZ#(3_K#5h06pNMK?b8%3AVx{^1IHD#q&t#e
z!YvdAG{se8UVYfYj)@w#CJ>S@q<?;)X#&j4Jy<G!?2TM&?8>F_uuIch>QLP;+K%&0
z^;wG%+^V~v#GIt7=`1F2Ly2UZ)nJKMs1+F)y<|X`3HEvB=V%)_ZWhW*dpqTEYi8g~
zSx1)2BWbo+!^`o9h|YB6OVTCN)5=ap9KNz#uOY5IbvU|@V^GSN!GNx~dVRexC7G$?
zmSxBXn&YD=cDf>s5<?I5tuK4&!a>6a2bJf`S2GB+b}}^xXKLv~_t}8Lvfy`NNkec_
z#l->Z;2<hxF+I<bBoIzh6v75Pw*p8GI&q>Wwe7kd^=$ZA*d7|cIDDz8W%W7`easp^
zv|4ARr&}K~optXA$_Za@feDGWifn~V;F04BNr2D#g#+SJXPY_8R16rNh_1hy5hiQ_
z|K-APyz(5dF}RE3w(WF&5N{`GGrWs4+(+WGxfm%m?iWV%C<kekK98b~p#Pc!gBnYv
zZS)l{PxsMw@=I{TrMt&fhYX}Ng(Z|TLT`u%!r#o)Et>UoTf*f=D!{3aX^kw8ja$e+
z+tGM#dyZ;!@SSfj%hvV0Cfl{gAhK+^@?M$wy#YKkTm|7A5AkVDzkX<hW~=v1TJ`;G
z#3_|ig!XVQG*&ShS1J%d3s*n2WmO;gc&SQCBA?}C8PsCTzvnr}cP(l#&^srOnA+}A
zYvyjFN+m5=eF&%<N|tE9q6A+xZ~vOD05yxK!ILBI{(^(Tk>~b4Nr#k=j4{R)DE)b}
z%3Lzz(g=?{ucR_CD100SDSZT;K(x`)(4=HnsV^<BqIv4Yxw*L&3kn5T1q5XHLAWMD
zKV2SaNR2=7)l<OQuHnrmAK!m_@{lG7%y7HOucG3-3ElHk;pf{H9|Hmi>!zUrF%i%E
zfgxt<Pia8>(zJlT#~&A!M_Um9$_YupF#)jCm!*W*I)8-V0J36}aif^1J1>WzCEbda
zZq$4C>-}N3C+1^5&IKJFiq<pb`_?o3CUOV$`cYR-ky65~$?|a)#x>Ki*Qv`qTn<jh
z`IgN_UbdF)YvDWRuCR?0CCaQ?gAHI=LA9rc`$M#M-|TYR2)9zZg^wWmQ<^B7rz+*T
zhU_~HeUIS6cRRDCPA0{H>=T>5Ts$B=9jLcSI&u35lE@qK{Vg?az)3-UZ3qACM`w-W
zg8Q~m#4TZ_Z8ma$o6^3hZ@agr2QNw<|2UPowhg;@>Z0$ra#(rbb?g0{<L|u06cQ>O
zvFTPTb-KO|{ifRdbk9RTXjJ`cJnG=N?_Ko0zL_rnAA!=Iz1vG+zFeP9=n9RhT&~_i
zPu<)yv(G}m3Ecc<C=9!I<FT&sj~yFtAP|2Lm#y3dfJM&nCuj#Lzd$H(RD*)O@{7B-
z@{FdfE@M1EIvjeKZTgW&t6%V{Z4o-6|7?Cv?;1ZS1VohqlRnJYe&H^lnrY-cfGk!<
z8_12pwRp*&teC7gPuV?+z<3S`0Cf)y(j>mXJsPN6b%TTH;xCR}Y>efUXd@6Q-TA!f
zSzNW}n6t_(L3obe%TOaqbPLC%hel*qXg+$A?=Bno<47Uo)DMz!d--tac=g<lfqf|R
zejw+E?9atMbxM1M17L9$@cC5+qtaiKDc$+T+`ACwCqKss4?Uw%?RG!`%@g)^zR8#?
zW!1sgF8pF)jMN4LL=!<gELOo|2YEFFZ0f!zJ!h<EJ4WWpKfU|irw4Usn&`a6ckgcr
zIlKR+eKBeIv4Z>B#`!egPH%pB;^NNVZ{sWpB3NJzVX*xC=JdlCd;n@)J#Mh5POciJ
z0eW_n`FWPM)}QS69ttBKs%u8^d3gLFJO2RQfn~7+lcxUu;zn3YW*rzf?!v;+@!kQE
zcK)pKkon5?eLgjLOmScX6bBWJac)>dXh9UW5s_OsABT0M3OQij!FNSz6|{roa|q7@
z%F)M7*Xe3hasz2%X${6wSI;JSt1^>3M(9*_uGvDy6$>`TB7={H-iF38OH(disRyJM
zDUNSdd34^Gu6Wc{w=le>6Y<ux9kTc3c(jW*l)mI$yc+sFYw=clWq*m*0#ZPRp{!Xl
zxn?6tG`hH1(sUw=gUPr2`f1yR5{J+yQ!B#OGbyAo=1l@B(RM}E@{dQ!s={5PjG#V~
z=G0qLzDwCASM|!L4X0s*f!pr?>eP)`Z=oWrfhH^G%IPf&3N~q^7OM96`Xs*J&d#0N
z=)w4|Tw}{p@X|wI^pzF|dR^WaxQ(59<;*^!{G9h4Qy5^*shle-|5Bx39mr?cfT*HM
z1i<iB*%GX<o&n(<bK(l7CF?eV=Bw;8q(XoX;b0GLfaI?_j|>0}J%XQQ{&6wsOYYa-
zyk?rq<>wTX&7BxM<Da#&AfL2rI_y`hd<TixQXUT<FhH{8D5@CI!Ao<lB}*}!fOT8C
zwIsL7J?0E6;5vqft!i8i;hewrNX^*!*x<7SszoZ|p^x%*zWEz_p91yM!)g=^mt=_9
zpb`E|D(nO(I9iK?MSZ_L{pLE(dO2=YB@?xj?3@<SQt^S!A2BX4Go`rl3bl0bAQITJ
zQtAA7Iwx@WbeTq|bsv36K~~8dyi(#CIriM#Z+tQQUxJOhe#>4PDBTk8y#z+|a_7Ih
zN29w=yciYf%195KFQbsS0s?fm%)cP9X=vQ1D|gP<!`-zSdKmod6Q8pIijSP|&0q&`
zy2l;!al0e8AYdPdY<yyar;<`!xcxh{aDaWon|9GWS<+qtY%Po59vv+d-hfuHc~pA6
zr9){|M|HF`wNnQO3MEfTv9YBJ#{^t;@$6_tPoi6Ui{mv#Bp5&eIF-adpAVtc$vT3+
z(2-g~&Y(l?F>K}3auL4(xh|lkcE4?@BFO0ou1Fso2YhpwZJ|}|3v?*o((D@LPhZfO
z_+6l2iI35I=4H(PrmISaTcyfGN~X%A8hYD#(&N>(=?25Fx=E4MOwpwhFyXBl+vijH
zn*!5tH@D~$Z3ad{;XKIPQxB&lzdb37i4jV=GZt9EzChl1<Y4PAGqsoRHjGnQf<vcM
z{7x~L@fNZs1qTvb2L&n^pT0npIq_5F_QwaA^uFbZF*{t=O%BBAM1|PF4F=x3din13
zNA-;CagLx%jVe?aGy_lnN^|pL7-+h!Uxf->FqZ-Yz===5eC5#2?xbelW!?Cu$nYK+
z>w+s~Hw_>m9DuoEy}V?GIw~mB@Y=oksr|7V`iR2>Y*>0WP!53t!Ua7%8+Io|0AyS3
z@kb`W2Qio5*cyUKZzq!c;Fm`CAeT+|erBe>6}8*pB5WRRwB5O|5^^oxrg!nK7NX)N
z%RI7|t`+F@MZ64!7u75o-<^6}B^jc1Pac~ujlt{}a<wl^bsor6@Xs1F<#Bf|Rc
z6nf`4datw*zd{NKd8T^01|G74(rila5Y-&=vQHEl8?o7YG?mNpKQG)nd@@zOZ!^1D
z`nl%8^Rue0ul`UO_o%w0Eiy~FGtAZ>EL7&H{N`jH_BLHeh0d7c*mkgl&+&l~^b$rA
zScAd$BRk#S=LhX@GC6SpqqAG*cIL7q;6{+|^Gm5$6Daj6?O*i`%1afJ#k=j=Db8X(
zH%Kr9NeGXK;FR!kaaN*V<*FO9NV`vsHO=cl0S%nWON<RC%D@ZJT{b%`3ij|pZI%i6
zx?O;{TpLa`bq``SL*a0y@~F9_q|E;OViUE1zk^i5?8aVK)+?vs`b~k>^Z+TV_U|x<
z_GXLyqq#x3!(Q8Y9MsF@3R;2s(YR>CXpwWrvjVN(dFhZN*E%*%#!WsX-$f#L(#Eu{
z#Z0O_#xJH(w4RQN`PXTww&jut$LeuZ+O2x$j*BRp>9l8uz_o=S2S!n}As%EO;z;Z?
z$^np%!zA^T$ku!*xN1WRVHeV}o#fl&wxf2)Z|dN166;`U@UJ3I0<RC*Mzhobrr<|U
zSez({cIes{=@l?Cu8|_qht2KQNB8-0JtZ2U&DsYN(qJsb<p<eq7jEA0D)D3RU_g<{
zFT_}*b}cOkOLAd49W)weY8;w>Yn(uW3CN|G7G&JFj{&2sgjGPEcEZ!dSnW9wx!bKM
z${7H{ym*E9y`ezqeZ--l=ib+WkUb<26B)vQGn@CmZK6+lICQ!m@#3Mkxo&tn;Elu?
zt58h=-?+O`-7At4fi7SJI3W>YZ^u_VyV@Uy$>%PxHISU26XCKob31jlAa7+Dz3V>-
zV5)r!jN3LOn|YhSab&ooX{Wsl5rVX{fnqVfo~Y(==b1$2)$OOUw$O<kPkZ%8-X_l!
zxNL$%$A1{IJMX_go^2I*<z({F6w7<S*xmvi?yg(K+oKQ@`w31Jm2%WR@$+vDYsc&r
zW0cW)?b1jQwCmc5+om&Al8U%>N$^KaI1Hd_ur}bwA+J<nkzi;VzCs&UN@@jL<|T+H
zZP*;1I$EnQJs`F0+YszJQyO+os0#><0{@J)DtQIyN*>AgKE_H=5yMZ?ni9&jq)iZ}
zw+4DN6rWbxF}T0@eM4-{iC;j_@Sq)N27J>le3`+Sq`UME8Jya@W`-HC!dULgNBb{d
z#J-%cbmcGHjL~IZvB9ehZokweVC|n)r~TsC9^1n#iii0s77l`M1KgEikzE{=0Xh?Q
zY@Az^IjA3(eU41`k&v{5vFLyudbKc!`gohnU5Dgfpz#P;8a1Ab=#2G4ET+6f*iJts
zd@gkd!VHxnRRZY^w@c@(;g3fG6e<`@=aHFKaevC<;^MQn^u6t9oUJneKH(B*&fVIF
zlbf91eE$%c#e|H?PHQ$opSBI9dHQ2dr<TqHB$Pqu1QcR`#SH@G((m$A8bdn+8sZX-
zWt{5!w=II;N8S-9+7ood>c_E>C@=HoqHQ8pF@d9Vy=R4C+_{}D8i7w1)B>TS)js;v
z;oRn;7Z&DKZhjiOdF;HJJE*Uxgpw<V_(XW;7a@ve?Dp4-WFrl|JP|WPeUIMctSHC2
zcz#(awsR8bMlTlKA70<@oFA!%8x1RMV~Ves5&DNJWQAbR>dyFUU<XM(8%!bR2j5ch
zd`ar<!Vyl=vlEB`#G@RvwC-XKoggOsOe%HLaZ+-!%dgk>0ztRins1WW_ISJ0J~lgd
z5#xSdp6iLtFR4njG9Sk#=btUR2|rT%vj%1Rs|_5#0AC&Sula#=B0yfU8B0?kokpgP
zE;6Q(<-DtR41|!}BF7pV3s3D3><<0e!M*O90PK`RFJFwUpF$~~9}mG?>I2CjR}zH%
z?l)R|3y{nRYeMEmE>$d$zKz3i8|PBA7v~lo8ymT~wapg(@M$iD05kFDcg%G@IBlQ}
zr0$I6>TTQt`x4Oz%<3punf(OQeDw-oc!L}L%=;753-gmm^G`KP;UJOc7v}Y5fUviQ
z8Zk*dkV|Sw8#m^<SJ)e*<K^F{aj_fjVG*s_cW1xFc+{*dd1~#mUvn;)<M$v<0w0KN
zOV%AY5NFyBI@VEl4&1d1r{d{o24EA4FV~L2k)SkK%jkxgSx1dAWi!D;xbgVz@)P~n
zm{Cx71}MwdfbZTmV+MMki<dX#q{^^(I7P7$!8<#TJ>J|7h-yWv`ZU<><&#XcL-RN?
zx3Sh&0<vc~R=>Be1T|)kM%$xW<%_qziwX904|#^1PUJTf$ih?M8Nzw_CE_eeYZD2)
zl%*$a*T$1|KA~*+;iw@d;f}0#Vof)1Sv&$iH+sK{D53ZazD#x7?3LYd`|yl~@rcrZ
z&g&TrY*ml$EA~7@xiv>#Oncy8W%6qB6J_~K8A#-r@G(wxv=yW0_EB?v(m+}uS159~
z>m8TPa$_1&xS2;qNGw>aT$*I!2SU=Wy2L{q_sF#G?gdPQ2IATn$0T_|aE^^F^fT%Q
z=-|PH_9WNuQRSaeTu=rZ6ML@~;NWK?(j~RIK^)YGD{V3Y@onjQVj_sM*-gIoM<)4M
zpo%9;&(8d`wKd0QX=Y}o(8Vxr_=BWTQpe?71m+?|0J_qftN5$c<OcjV2PYrHS&^0&
z!v*N=8BdORrSrZH=)9fjw8)x~s=4E<nz<*->%Ru)z7cGBx=}PiFb?-Lu$p03TRuZ`
zpEBZrcdX)o*??Bxru7XzF{Sv53J7SYkV32N{<I?KMPAE|0Dw!<v1?E+$x<q1#95PV
zRU|gX731?X-*zDDFaVEILY22|a0Kq$>R0YG@U+8xKsNB&HmY%A{RIDYG|VkbvSAM_
z{jN$`aoMd#l~oa8dHSsO<UMPsjkjY$HLzK2R55h<*W6E9hbSEfV&|HaObuSRlUUV=
z?lDc;%#knIob;LOl3DR3EpYxE&kE-EkqCkrgM5g)FTA>^SIu@rgy9I^V!Qir70I$w
zAz*n4V^;vK_w7kDupK})ZY0gk?IPZ1G(^JMg5B=cp6k^+4j69cfhypv{&C7-7-xk8
zMfKsy`2-A)6-tUfCJGR5uOTjVbC<~@Ge6<452kmN&7OJA`!0m!+=91=dEQFdauhxf
z{%9#<2xpi)#Yp_%KwX$UXGDTXzgK&f{8MT3VD68c*KU(Sb~<Q0HrG2zl0LS>ruXga
z2aUS4T8_bj{(U$2Dw@^{W-6p89#H5l!>J1Eku<l(s*3A%t@88^{FQhkMvhYV97d%y
z)@b@Ab2D?#cKDrDa~l;<!tTL-8mZpz7;cKCEEDkka67V4#5E4mwY~qK`bR_nTz?We
zv;*4!?ytQj-RJ#^ms<nDA{nKf9E;j4<>eh{g#GHm_iK#^<?nMjm@6<60#f<fYsC*j
zcTGgs4r`wJo`@YwnwV#2WM3<IfQsNTQ<3#zHhBL*^Xjl!(7R-o4?gc+UpELy)Kmx$
zC4aM0IlLc@-j=Y4ckU8#UgLMRDBnL4uilE?Ug<iHEk}B-9f~6_;7L#Nv*V1qMI&*d
zBnhB61cq<%#DDCSdr|Xx;Yze+Gy3xQb+YRPyv@y^c_45^jXz{^3VU2bUw}HusUcXU
z@$V5Zs@r`uvZ)vly5d>2?xaX1G4W%>rg8vEbb(UCDWi+nhIIX7W1|wOkJzV=u_b$4
z$jww$&m-m0ssV2p?}Pn}$QuRhee-pUK4Hp?-gZXoty_LObG4RjLPkpB?&AK&x={(&
zgo)6_#KI&@32x^YGGF3gZj?N_cA|bjXhiMR-iroD%?lndN?gta3(_3|CL9pcWT3R=
zUGZ))lbM`DSQ1q7_U$*J8n!hm4`gLkHIrA}NFAypsf01>K%o|w9|B)^lFTw{U-aq9
z6gj<}OP|KbjW?^@c0U(L@uYF^c=<qIA+W*SM%#NhnAh)~96zVTd=wCu{h7Efd236f
z{Vzwerp~Jsir!PE4$_T%aQx9!FVaT$Miko~zo!QH$dv}N6I5Kf*Zo9F|MvCBlgBwJ
z7lRjq3Az^c>bfsn&*<O%7CC$zY~Gu>y1296LPtpM`DR25v^X{JMKkBwHy-dleM{<<
z06T`hol6r)u0YS?e7+vH8D?brH#MoT`LQ&Ug-k;HCgF{a2cj=J^%G_vPv*e`s;6ba
zR1%9d$KE1bj7C+Xc{0)t!IC{^kD~CQHhn+La{cM@I@jJ&Hdx{v+rAJls7Qxm5ypp`
z1T{uqiiAb~9D88_mA4ur-EAlwY^(0aFFrnPOT4|_@+LpNp(cOGaTz}S(?dW|7)`O6
zy?G^K%>91-l;6Z&`J{n7ApO%Z{3+_Y^>cL0yu5Gk%Vhh)HgmFqhR-Aze%{aJsR=KE
z!3~+OUvJO8$>D6n8P$p0`GM8Wfh6vbB(kP4iup`epKxs9pDuI)N&tSm;ZXJwNw<vS
zWT>Pb!TfQ1)dRg@50}-5dv|o*Uzc8W7N~lxmO7sW<1iu^%c(OG_U|E!3uI_M6$_K;
zYA-|`*yReJeBrP*9^@DUA4ASp@4xAo4lM8VzwgrZ)6042#QA*3=o6#$6#pc`o0o^s
zV4+K3Q=Wu89iDfod-;6HF<VawQDsu~;&`(sY|K}wd&f&cm{cY`XCeY#l)F}`xo6k3
zHLrGO(0SS;AogUQvKmP=nesAi_sT+s9JE1kN}6tD>EyK1>%_dLu&bB5E1xr~;$a?4
zI$?<5>-?eGI{Q_kpUXrBYu1*k5~_WUUAYw_l&v0oxJuISXVtYo$jr5K)NusUuiWqF
zzMxvt&Fz4UQT9UfjJ>?75+$z}%zV8)II+$Utn10l3F9x!hJRA9=IzKOP1!sI9Zk<W
zE#xoGD`sY0FRe7y^vI-2a-!ptjPX6VQQd6kVbah|;GVGGxIEVy#V3!8iWZ>c5Nj%-
zecC|iSZ8(bo;*(Oh79#(99+!LEwbj$&MyKMe3mVKxVW16&thK~Q(X88F}p_(!MJPf
ztPD=c`d0Zs6z7>96>v&O-9XsCYiH$Z$?V{jgSG7VJH1j0U)J}i-%Q5Y6Q)Gg)gKG$
z;91_^eH||T8TE*8Rnl_%uKD>R&3S^Q9be`-(;lMYj_7-SK0B!!wZ@#<*R;RRAABJq
z<76MyhxR1DxD~Yglq{`nuajk_C(QZk%D}YGgzpzR+1Del_a9k#>@2t($FISw*+WO}
za4o2<&b%?CIY>nz*6gmxK}M*n2fI*rA`nA%;9LBe2IPX(+SiUY%i?{-)W}NPL|UWf
zw|+dFDn|-ki=K7z*56o?Iu6yIh;D-9JYgnfO5kI;MScM*oaX^h@@}af(b$S{iY0A>
zbYhS>DE?+b&FWiK&y|l4SH+5bR;r@5yIX8Mt-i4;Jp5!_yUQxRAN6L1`DZ2Hx@tt^
zQ<S&r)g;Do?zj5=d<TXmd3kzSp_bb!1C{o}S=06vX+#TcL{lgH%n7h5*ekuA9<e=m
zwP|_X_Y-k)+C>%bVDRI;Dlb|PaB!5;I+vFS;etw>sC@ZJQzT=iCNG~)*z;-mi^G?n
z{nF-TyrGhK@)Ei8zE4fKhzv9$aZB=UE+#o({(A!g#6pB`&~2HsH{SsK^9CufkqV<r
zz*|*{AZzOTBDknE--3nNlt(1x-{sD$CUlo5s?2^Q?7DW}oqK(E*|$9bKPE?_-q{QH
z)Td9?{lhL9>h9GA=ix_nZP&ft3;L_LnReH8t?YlB&8Zr9Ba5HXpnvB$LU6lBCg*;J
zQ*6!86m(Nff#vDjI|>Sg9>xN}X5Vk9xwN^;<(2xY%y$<$jP7%E+1<&$lKu4*^)Rvr
zR&M0s18%#uG(N!54fDutWb}nA2h=?5|IoF@C?l9jUbBCfU_tQv-7|aUzy~3?5|Aar
zVUm<$tIw%`PF|~Zf5G<6PQZ9{(QYX*;g!nWz%`0TKW!o@d?-Kz!KIXj-A$mo#_jHA
z9-F>za4No-U&hz-<~djxbve@V_MM4??o_T?(jOf7k$0!D7RtNP>pr{pbT}?}fkLTN
z*b(uBMe%MYW941H7pR7P>ER%qW)s6T-ya+9nfj8@&<0TNabx_o-MeMRHR-cWJ6!TP
zG~~+CHH-3`34Di}o4Yoh3=78(xHU{kcOYqxNOw|tYg!}G#Yp5x%QcRhzVly82UvUA
zkz3pTs4eT5+<D<l`UiO=@3b;IP<NvTAmFN1$`|5uTTef2NayiyR{I`a;Dby8M?cux
z=Q_1Je%u&}k4p9tGE@UP;}3)MZH(V%YO5iVP7LqP@`$)UG;Nqhg*JHJkTdXC3@amW
z|D3Z~v`J2BQFIQ3&B`Kp;vEC-Bktn!3Qt)u|AGT*kgXlG4T@E9(WJtEXY>GtLS6GW
z;5T3WG>i*79MdZC`8k`l8I+wRXmk@6AHgnO&n`;-vT`U~ePvFR`Oel9K^xb~V+48y
z5BA_7^3n{u&{fd(#cD!N`233SKuQm+hMfHM;;7d{_oUUQTXL0q$HboNL``*G5Zca<
z(@CI(apv3SABARbAB|`pE$K9wgqy84+|)frb~}+@O{SC>=C+f9G{0myn#T*Mc~>WM
zVtJ^Tx$)g6C~;O=8hpnd;KgE|L-h{EV8A7UaoYA8l!$6crni|oC90+KHw?atL=2$Q
zeUQ4GFS395S_~a%obN!+oOqG?!l}7moMafc40U}c4PBf+w`BhS9vDz~g3u`9o~JLi
z1$lmXuphGFgmmi5j<;({etf&A%PqAx-j|<K*BflBFRVM`uloG-sCOORoV*!eS9#f^
z`OXT-biL#3HPY$Dx^obin!2<@se8Uz;8W6_Ly+g*MAt;`D!z}k!I2q%3c)8|tMkX8
zqaM09(}?T!sPuZJr!E`r6eu<dBsuWan=FBE1LCUg-n>dw0&{RYJ=7jEdEUo>xASqq
z-7Wrbo`y4io(kl-jwqp$z(#WE;VU70;2DBe&-}==AbF>I#AjL;`=xd7c?A=;Gp&dI
zGMAaxRM>=9>qc<!Ip@>%=0#i-tWIo^7S2XFI=;6jFq{5iqsN}_#PM#790G31H)<v7
zl>ry#klXxdt#uHmlu<Or-t==P-mZSpFH&wjcDU}7w-obQO_VJ%sY=UtuSd=;I1ydh
zxBxMZRJxk@*{6{23K8@J&07g7S)L`m(sk<?&P9(t$cSu?du8L7oyV}}t5tU~@mu+`
zCDGZvQR8}nj%ESYk<Q9S!Twh-P^bL&XI1v84ep(dnskS(%n1(aVo|xd>4Y=A-|d0Z
zoSYX+Wg3m1H}1SkjCt*ELCus<laTOG$!T3ORD3)rW{@-mcKqG4Beo($raCpAEIzoH
zWtIuZ)#g(4@?V%wucK}KyiKgSL=A*f5`TV+t&u`XY(37nWdC^G$;Ac%_30?Jy5nH?
z18$;V-F>v&1$cgyQ*Ls_*3b(^d$M~d(JZ2DJ!!O`Zu8_LW^o17i6J)y9rFPNF2Tb4
zR{g#O12=N>Gl#6jn`xtbl$323^#5F663f;?7x|Kjq!d%=UR(ixudUnrLi#{`yF$n@
zqB<2Z67~q#DtJe&zEARpW}ZG``EdY=q2A?NYd<)w)w3q=cCpU(IB$oJ?KMhm<Pt1B
zH+k2vVEYIY#6#S!27Dj0#)amX4F)492A`I!i4INw^bFWjyf5tlzvOgQ1%7}-C2*^E
z=!|PTzpdlue!Tx-oqhjf>QVoyFS}!LbzL|&U{kN-fApoNIx>iqKWHmS{b9{aHTPWB
zJ3+UWD(BKQkY_bC-tFAa^=>mtU-5j9ETN<Lg*|a3q(@KT;oR+V;oR0|YPN;TGMq9i
zy2aaF#G)~^L`p&1RmLmCTJuXxKN~2;(2pt243~xPHpA`H=^qwno$p09@xRg8vTbd@
zDjc5y@j!U!v*zzoauTU(;Z{4+6~sy+5ON7r2G382vYYbw92&9`ppq?ixnnA;nfF{Y
z;+{->l8|4y8gfssRiAi%aCs!_Wjf+XJZJ0r5KL|!ZylXQ_CVt(qw?V}-cILX-<2*+
z;XaZt5PyM%ec!@{mxS{ufxKF%xV0{KxV6z0=_-Q5yrk&FOA|rgijQ(5iO81Y41|f3
zm>kF5P9q+r@jho9*!Ik{xidb<^>`+WVL|F3RHB=5-F?i86y!PEb1?INu=bWwQT5>-
zs33@fl(ck7Gona0A|28>qaYH}-6<^~N;gP%D2OmLg47IM(!vbgH85~D_`c_yb?&+!
z&benTKEYa>nZ2L*#q<2PBoSOzYUi_{z@wXrXRadE>=V}!5CHxp^-r3YV!b-|IqEe9
z|4s4ZyRFAl%)u^yaRP*O!Kw~sGUy~B0icw}4>S)f=TO=x>2Nb#YMEekc*xeX(xN$K
zlVTVXs$oOZnEazN{TI53+)$aj%j{LHh&_V{H@RKzTi)+p@t;*6w=-3RUmnG3g&@XM
zqKvy07a9EyRrDsvi5--=lT)h1QXXg;pLop|`U=g?{6>n;?-gw#)J_>v+-Nlrzwj6&
z9+D|z919Xw&40ub27vdidvgB-Q*;0`hIkYLh#*cU$Yz&cSDp6Ii#=Q<iRM1?kLO;7
zl#l%4j&@rhc1u}&VgR_^b3gjINO8DsgajS6{L)6y1BPrp>_d(S^PRv;Lq@RwhC!O%
zMvgrs4|32l|7!!O)MVp=Z5~!wd#_>Cw%y?2NGZ)XyEjHeUYlh@wVp|<i-(=Fagll+
zzUSNvSwHv#o6*pP7>z}lKUbU3p;2QG7ebQxt%1cEC>8(fJ=TGzexKh3lfCxH4wk=v
znYJd}g>;0nn>~${%Z%MJJCwQ_XA3!yx?1U1QqmHu|8>>)eEIz6u&OC|RTx?;k)rE2
zkZZpI&y{A!_hnDbZIAx_scTS|t63?>&%I=BA~tGcbmmVW7(9dbt6|i6U)Za`Uf7!3
zE%UMe&ehqD%EP@ux#$*8mWvDiCZqeaezHY1$<kRc(c3=XpCu&vyoD+l#sqG-WO>94
z8rO(leb^+HwM{L832udD>XMT;ojTm_lB1$mQ8Veumv$Z;Vclzb)G-6=){5rB#Os$^
zbrxHn#X>nk+Rk4>3i4u^a~A`f^Qe+^&aWd8qI*Jz!oJ4WkVg!V<{n`gDUc$=og2Wt
zt8<M}z0CPQe`C)Z2+YkmX_3Fwqw>Kn{|tiHLYO}50bH5={Hm|O*8k1$Alkr1VCa#}
z$1{|Wz>|P!JoOECG~{mAbIL9nl+$sHI$q%51%7dA_)G~6UZXw9QbxDP`<HKu-uYHN
z_Pwb2gUN(CExMJ;g5|8&N!>-Mi@x-E9HncoUg#^Ij`xN0ISza)S{8Xp&Pe+3&orfZ
z)|$+2%Nyl~zIDnTnf-4;5#u?2-xwakh0`l4kW$ibOvauhi1$edo#oaAEdG2KWM$*7
z<6&mdHt^gX>rj0_HID=_wVd}b6->cIuJyb}tMhNtF=zw?2;M__mhIT6<ue!B*2S=C
zmuoVJPdsa{lB)iSeOOthGDNP&>y<;(C08<^!;oEn4|$fBwS+J%iZW0zm`0d+;|03Q
z>LC53??%zn`PV5dpE>woM^Xf>@H4)jJ2d;TI$(6^Xgif5t(9b=x$54{v&jEPx;si^
z?kc@&RPkXf?*Oyq0yK^wWbpUIPFM}{tbwA_R8P{{K=S?1qlh@!st+VxObh2f(_i*J
zy&B|=<_Ssk%Ul{hdV+^U+{5sFT~SX8ueCURyvNOa6<YS_=_(X!dQaXf@VK&)>UnKu
zOl{*W{rN;v_)|$w$qGug3fr%!`o5@WSsJm*-5@OT1;onK`hgE~2ij^eYEN6Dh1NF<
zwG3TCi6{A^-&`3(<{-v(^QDL`gh`A*^U#m3hmgy3wJp1v7X4(o!&o(mQj?t(GcJt~
z%5Iq3Qwfz^m|KArnrszCHZlJc>k!r0Ss!yIF@YnIbcI-5<?N<G{Q09{s(D$#tHX&b
z^_Z=`kX9jRDwB(LqWK3K`}~WIcZ{w2|6*e)AO?+=t(N1`iGu$!Cjt!h+Gm*pbn^|v
z$@l&SD$ByVx)+1p04v_lb?gVP`Jb^xy)EZJDmuVTh$B6~kmjQ9Vk*zC2U6r2<U!&5
zjO#t*C_eH(5Cg^lyE5A6(sJ+*wG^E@SN*xm6iy0Fl?CfE9&@>1Y5Um0pZ!}GUhHXu
zCcUi3YCE7qDgzlU2=A~uF_nqCIfG7wGxxN^I1ZvV8=d4|i$tc-h$JP;=d`h`ZpkO~
zo@sr47sUSakL_@R0Byn)EBRd&{lq*nPw?GTyLap&!0gZ8yrXAW;K4-AE_sjlDcc@T
z;-W9wR*Ia;P$pl1K$N9;G!(eJZrc9LY>9slxU(g|CJUq1-OdoW{)L|IUTzYnB_8+5
z#b-rO6Ngwh#cMIHZoSdx<NFdSDg*hIT}<kdj_1C6&Z+wPsT`fC*LPl?>opFCAokwu
zp=V?1nt0MhW@!qvEmW;0h6*`!kaC`4f|1xCM{qhhJ-H9(+wk13db5ij`>zj+eXx$&
z8GUk?>6I9hHIT2gBznwj%amY&F~#d|G51}TEXV2W^HSqw7=)GU!YFd5X8F9x*I|yF
zuP(tzD_*XIaF(3oX8~@lr_IR+3E5v(4QiD$LPMFx*;T7)+Fl!<^JMmB_YKYIBFVqo
zlc(5Ui3gj8P@>z$7pLdP{AIK+C;1t{6j#5_*RGY%?cM#<Zm;9rtB&UTfDM0t(NjF&
zM`XsWL-3k`)V%WU=Oba=&W%TlqTXp&s3aF$5>u3#YV-vK9%x@#k_7L*%W|@0Uen@3
zUpBFIe~#18u+tHf0h!_o{Y|cp!ui6XjZ%-CKwCQ0dFlM2v&(5b5gdVt-KJ$GSD}_W
z@QL*SQPPT}sJaW_eMxQaYq}2`6j%4ZNGl(0Y0+UZ(NPpbM3~^`b)#AUl@cOv8<j12
zDG-uezFEn=)I)hB{BBEV#*WxYA{?4_3+r$fcq^v+;}?Y2EFe?y8ZUg|+UPO_qWl*&
z-`^PDA^MvLdl_8ODSrh)1<cI1@5F4yK9T&RN6a(+O#}px2;`fn8qNow5H#vYD%EJ~
z>G$_hVl>_ofj3l7hM&1(Kgl%YR)NFZfw{@QC2_$Dt4Ug_MV=c@ectjM--LqkfvtgH
zIA=EwyC?<}$`N9S_Yw)n*x#Pyb7Uh-B0@o$-4wu{=M}Z}0TuxUloW1p&$EW7ihgNW
z0`e>evukzd{_f(qwqey^9mAK$%Y0E~g4+s(DO@D?5ANX}eu*C8w9bUH@hIk%w@h|!
z{)WsC#vNLUx)w5!SE-vMW@9`Y=Lx+;fuhF!l1lQ{y6a^;T9f7mB+ofAz$S4FSTIgl
z_+v>!(S}^jFpB!Qqu~_Hqu{Pd0pw2sgAZF=d;;hrB+t+Br~WqF7g^jt3t&lTj_4@=
zQy*jcw6H6iYGJ(s{mpk|lO%qzirmKa*t`uZ-;@k7z5V^&2C+pvjAw0w4rcfXzPwy&
zh`bFVKnfjxb?U!zxWqBz)X2ZU=5G&tc9iY}^lWYSd&@r61{BZ>5AJ6acp<{<bjZR?
ztr+2~?k_EM#cQ7YHkWeKAh)ScXT~1WTGgGRnvM!2QE5ALjxYM`#~zPXSuTA`P&6f$
zElGsAhDy+U;n7$)!1<YxA0>kY@<evS?NOeL*%la0BF%iJ6d~iL-F#Gam!G6RCmIj$
z3;VA0k?{v!{MZ?`99+N1xV6tUKtm}XZC%WCdD3Ztz=5z(uRHTiLHrUl#bd)?cHhB(
z=Iw~`VI2~|&j)8e+=NpAg6Nu(hBIU*vHV+VIRVKE0<B4=_#1-a09ZKgVW9oX_4Mv}
zq;5GU)ut0(U#HO<lwg3it2AagzJM*JmPqq|foP{hW7Gbv+5u9IB)cvcz7>z#Y@!VA
z_b=`d5Rc}ks7m!({gOdGB;PFbEL{Eii5y;t7r2uW)$mo-1Lw-a`v=is$uhNrJeI4S
zH8njJK+I9fDJ7W6d}sHHA2(81bUAQj+IxL_Q0<Z4Q4~U96}GDej=$7vwmFdUSMqS(
z;ZqE+QaxB3k_e(}WY%1Zf)+`NB76eRYU)t~BV1f`BV%rZKln2<Gjfa6<#jwNzoJ85
zrO*36FQP9`%f%f!vtJ!tlzC&fH2Xz1o-)nV_gC-<?&L)YjS=rrGW+{ewTg-F%>smn
zy`5VZ9ZSaqvg%}(_I=!Ax5d?0E~_or8Rd%psGf8qo^rnPM{LPaH<ZOv94u$BCEmk;
z-Z!H#$=i9a=jMziKa#a<H!DH-cHKskwi$QJ@1W5Uda$7uw)X*$B-mEhPb@fRb-45$
z@&<Ylj;8N;5(k+e^$Bo3Z@L7_`Z0-Z^2Wg#N{^E>%i#CV?)ieD-_K0<o=ZT`=q@@W
z;XT5`eN;^V*eiSf2V2G?-e&D=wDd_A99lj)i+@T-|4k!)Xf~@7KN7$<f{#XOKw9_D
zbeG2_Kx-F0PP<Z|9Ue#&V|G};+{Ct3KVXC1!V(J%@Hu1Z#>9ZK1pXsR=-q2QK3h-d
zYWhnKHi-kaYUS^&{e@c1O06R{S&iu{J`C5_ne{GKS-<jr5|-)Ty^4Rx#~8Xk{rgcQ
z*JtS*t-tM%i2Vg-CU5rD+75SWlkpMhT(;L^)%EhoPZ^Btz^$v5nBqE0wu_5w)=mrw
z0OKNc0;@SK$z4cayR7}BF4W8W$e<%7`Et{;>PT;qxcTn#E5iA`AsIApdtVd@GHt$7
zO|HOgl`x`kTCYUL`dH%X$Zja<kyQP_dGJvCJFoPX8mT{O$K>|b@|p7YVEa4|Lx=F6
z1tU=prCsFCZslKnMmQsfesM2Q6z2NsNZA9ihH!xHnryjW;uTa^TlhrzNm7=2x#)$Q
zV$blwEQ}#(I9|sLS@A!k$?q%vYLL;dfM_uEhUXf+EpGQe23L9{)h~3-9Wi6$5s2-4
zMm&G*I9)5ta<rDmi@VS)N?1#0ABD=10j6q*a&VCb3l+z(Jtf8uNfWwcKWhW#5<$Y{
zlzM@jokb_D@#Ya<S1gWDcA4OapnX9)>LWYMtx2wJ{3z7zorr>SI~}?0?!i?J`$Zl|
z;>bLtm-0Q1*Hk5EwqBN;u1`iwR8TSc+%7sh@T4T`vp@YnLE+nb<3Bderx`MEP|+MR
zQdu@VNz3e|LNzpE@B{Q#6b7c(U8L_`^Uw6_2cKPbuO|uQL_-8ue(*1(O8|VRO0Yry
zKMD~YP*S|#d?fg*ca;Kq*KtFi!644{b!MSSy?K}CM#Gi^Zj9l-2=Owx<jD@Yo;<<-
z+XHXi^>~Uw4hPLAzBnqyepx>w^R3v$_Y8BalJ5CuZwg;T!iv#|)eR5*YRLuBDLGo0
z4g}wYB!}3byebL9bJi1d+NyOb@dOHoQS>2jo%adMX3yfDW!YbF1h3jZpi8BF&$V>B
z_<Sp8bRYFf&bb7Hivi`#RyQR)G^f#3FH@+FD?xgepZcAktY?^hwcp=j2JTCDVRe`T
zqk}*QAppCu#tkAbrwmni#h09q1YmfTn?E#~(<Sl0bET%@Rj$2eEc?VuIr!+$aL00p
zzL;cHz~xAB2~kGKPR7)2C<kfxq>3tM;bvg7tE|p%sNuzI%b8-X4qu}cWW^gO|InqJ
zx!gY`_sBSSm7t-}_a`3YS<aM~3in-`49N26i6_2Pe&^K<6o;$(7#~T&TpRFx9~&DT
zU;5Q7d|TN+$c!r7=(KngMp%~zZ$DaRq8G+dYjN(hQX*+I(+`=kyZfaYs>A4SYRx<Q
zwAT$E-|X=$#LOEgAkkwmD{^>CZ3V-!fNHy?i~6^%;O?5@D;4G_gUA5z(f%c`clMRc
zU8Fes^S0Yi9FyoJTHNclK(Rv`GXA$FBwrT|E2;l6`ONBjA=R?+ihL#2<$){UMjbzl
zSn$O{!4$JcD0E({g&=Pko;Gp5*lSLC^)HUm5W>u4%J%oQ<@7x&<+RJ1W=mbyaaIj)
zF*Oq5nNKZI@%p(u<f7Uv=)i?*U#^}Hb1U{Oqau;VD3Q?PD4~F#*ifrYtkl;Yhq=ry
zhQR(k3t;-Jo)dS+&s#{`r_^>Yu$k~K(iYR}^OsFccL(TcKCX)^t1DwybBDoU{|4eH
zron_RR(gT^`FL1Jk0D~g$SO>3b5W)roDA2!i!>KK!2>O+&%ZNnYH#1KO>$!Acotg$
zRYHrt!ay?v6n(=n>n#Q}<s8NIA-W5_>ei1~4hgu_%?P;U0c4?NC)UIzXO3*adKiL!
z4eJmZa*8e@YI8=#Upl%to9K{U4%k!i`whwU?d_Xl-MIbYa?~h4-F0&LLz0POh@<V%
znG;<Jh5NS_RncMO7$Hgg#(<4E9HMTZ{u2=8hA(nf5^__fJV)2MMhqomwk!F_F})5>
zr*SdR>=^-m0YvaVKVbnpq$Clhmv3_ebXX!R06Zt%Od%^phymT19ZM#@Mh)@e7-#!(
zF<6*hikSZ(*~$k2TL)uYQJ#OTuu0}yGZwM;|FPM95&*qh!d<xU%vb=^%RMls89^kJ
zmaL3^YchPt#Xjos`iR<*O)=}zjjs(vmQQ>@;a#Lfg<_7qA54S2<uY%VB?}bb7HR_W
zp&wz6v@0q1imEFST<IW1Ir@hZ4W19B@|Cz-8>r0>UTdA~{(3oBjHcV72M<=l6FwWq
zQcQKNcnc=E3Wo;FJ<6VN=7?J66Ym?^QXLH;p!n>(cF8ADIUhm=JX)K5BHo#yB!es8
zhqS<}Rel*Ksw?(=!51CHrl-9ErH8u5CK_~_Udg3>vedf_ioOH%kRywwgo|8{Y<CNr
z>1=KSrP<r)H;aLn=|AAE$PT{IGx8&E)b{NZ{zIOl=BI?U8g$4lV<Wo*e`Zd20@+v>
zWt3nc{7Qlg8Q44mABj)t7(NVI9Dnhezd82D<0OjbF0|$|98&(i{h~CaQ8=hT$I&7I
zF*rpNrvir+=8YIMd_p;WZMFvX#a-tk0zmEm^Cs?|#Il|w5;#KPY_(lj@-afxzsW4Q
zFBhsw&n<%Wm(m8BK3d?wM4i;<4W({b^=^hrlFAKiOjERP5c^zNkgFOMM;dz9;}xD8
z>U)PHME>eDwOujN7++nI9qXyQF}*74_tRVqkH4WzatvmPyw-B=stI5LB}QJ#KYDOO
z5Rz925mg6<K&UE`xY%N_25T-c7fqTHk+B_11HWWmWpLM~|4f6FKW_`%JV~=`L%lI<
z?$Vzy!GMaIIrE>^08VrE!KA;6N8%2vSf5eI(gV1Cx^9F_@Yp+kD@9D-Z${`3D4!SR
zxZ18qhf7U()44bY`Y88^0{PBCGMfHnR~LV2Df>qe&h|{VFvPJA=UiG$%dP>>0?)Nq
zAPfffhwlATk(vP)AEsByz53S!dld^bMe!#Je_d}tgv)$;{(FTRaT^2L$nui@24COA
zw^H17aMz<V6)VeMVs{Eo+{=k0q#!LedM%vsQ5kJfD*9`*h(@6nXHv{-qc4kiC9?-K
zQS{=mDw3=i_DCKRWwUtk1J;iPh?>w>>fYR`>&E$!1?J2|@KQ`vXVf|`<|k!?u8jii
zf+7c<Q=e5+0@pN$(9TDgiPARQQnNF1LpYE}RKN?pG$NM1pc6!5p-zbe8JtLy=6RE$
z(JvWZl{NL}=Pzc&J{Y+rW>L~Es=s5?(;R$KvtKk4RftP!ukkc_^?sdaw!dY1`4*f(
za{AEPJYP+X_hlm^8{Q~reG-@djS}U&V4|U*CPhivT%wY*q}t;I2OreYCZ`g{Wux_#
zOq-+g>Uu;1JFk-Y{JUWTk<^{3Eb$T;UEY&LC&Fk+Sqo6Hf07TcY~P(6{yj(6q<iEQ
zC+Rl7Ls}Ew^@(CNjds+*3zp$p@hRnV&+$TavjNnXg@Mz#^x^U;>{kW;UZECX1}A&b
z`=LxYp~rF2319d=Y|tv#KhveEJmm~otyJd!+Q(*__I?BjUOy$E>nmV;OG!b}?;(<D
z*Q9$S)nez(IbdkM(I{nR{*j25I`{C0o3Sy~VGOVGCxF`%!IS==L+Y;G-vuYuYX$a9
z_J7<2=>c@a8iD#py1cegBeBHfq+m=-0OiU}_enVT(EVjC)hDo|vrT4Ei^8ec+EYiL
zYb48uIZh3%(KT>VkNX8|+x{l;L7~O!P_`h+noTa}SK8mKpQZ(LL-K2~0Wm-6%nm}X
zdZlpW;xFgJ0DZ=us%=m<jfr*Wg#pd{z`|`t&XDAD$#W!QY3;8gH6Tte5~r$;tA3a=
zwe)ECh@R{D^g(89p^_uU*Bu9P{PY1COIM%LN7|$JkgydzWb|_E-MueI?aB@J)7<ig
z4#~!4%(pj8AIt~)b#}jdq#Hk0v{CdlKDpgYYX(HWTp5li?JTt$ghgUA5JsC3e=onP
ze5>=Q#V7vu+w{Vg*y<!-qvoSYk7`Bf%k@bcbd-#n3|;gNH5;Ihof?qAH@ar)F3YKV
zn7;(fH91I?w-{FO;UdRcO#EBKrXQErtdjX%#c_LCk9(Tvd782nGkCpI5DSTT*C9;?
zS9WZeZoZtZAQ6R3cCJ`UfYSA!lmv~3a%v#FWe0$9l*bPzx*t_!oi^{PUEz5b>K!!9
z2cA41xm{m8hd8?kthPWl?Nj}^xO_O#n63t#b4&uCnYN!{>1WBVkB&X3z6NYR<j~w=
zK2Oq6YEM_4Q-a#Y{o2ITIGQhz`bSRzulU{YTsrPeS@F3t-MlF)#W!U|;{U9yc=l%P
z^kxfA6tdS664|w7ZPKU>R1y|2<S@>8v!t#1rYa?AI$Q01bV}8;;Jp}_Q%P+wJOaZI
z*8@id6WA~17-cRuED6d1H6|uq7yFox7~|{0lqD`PUDHupN<d~Gfx*Y;SLv_fYKXe$
z$fRlQwB<T|Dk$KDz6_cq0?wJj{FT%yo51TQFz4lI9`L?l-?!nY<>~V<Z4t5_Yjulu
zdVlA9W`1}rR@Q)&8Ef;3t;u=f$CGeOooJDjh&BoK=j#X(C(@M1-qJ~cud61m92SD(
zReI)PZGEVHIlo3@*d!e1C;m|}!Sr^KXYk`6Ev`b?;jZ-V_eJGAWeNwkY*KXO6wU0e
za09P$RTW*-JhWP5zfLrGeiz^!)WbS7Q>R8j1oIzMvw0I-8`aPwMVCXHx=C8bWQpm-
zGUG6U+;U<O(7IUNN!O%XRJ9JV*}F$Sj{_*vS}Y4{DXBr4i$){XnNQFw-8OVcb(5Z#
zKevl6VE%96-7{KW-Rhg|4y0h22j-0^k0X{ZIH;@6rZ;}|b#eUJ%JEO^FA<X|G=@-~
z5Z?Sh8d0d%F5aItqDw!4#Nd)5Yaev8X3i9hXZFt;@f@h;#9s}JYl}FDeO`~C<)pJB
zk!}k#*2ITC!ULUJe3$?xV{o;Xac9&>A=@g2AooJf+;d(Y=A!D|L{M-|mFXGlZ9Vyu
ziSH6G2oLQmRrx<;dDfc|9zu19uL8eJjY2%KCm>;ssd8|*{3xxkknhH}OLd>jlV>Gl
zDvg(eRo;@ygRHdOodE1_lJwyT4WPsHf;1NL(O*;fT`bJ~l_(lKtiw-O|7esD)>|`(
zQa$nm%p0IkB@c8)I;y;X#C=Xc-1psfN<0V*m^1lQbR&rVEqeJ1t)H<D#kQW!=Z~C2
z3Pe~Q|7ljRo^5@kw$ff%shVHur|PaBD|e=K{(Q()Z|ZqvO%N9*N|wzT+2F3dvm`BJ
z-1w)<iIlu7(&h-$YpMWx+7VYxYW-k$hHHao?F9x@)hmsS1?nfVW^a|%GAbS_GH3HU
zt~Jui+KUdKly03cV{rIqqY_)Tzsg-CVTS2z=#kI16_pxHq9`(<d^*YMKte4y!N@aC
zfewEM93vu3X=M0<E(8~}uA)T-&*D3r->I-%ACiy}unnJ)^#4@jjE>(wsrx``R(o#{
zAKR5ptd6k0W_NDy$oq^B5DZLQ8^gT2f<i3z#m}F%1Yx3r(B+wL_N72rhum997ZkDV
z>SLS~7ov&5J^h0tSi6xpUX0lj6A)Ih-+f)gH8D_q=-Vc#?r}*-i)A&X#a_=oDYeya
z;*Q^g^H=600V$gp^ZN5c=w}tNziy)qFMsom+n18S=}9qBY;V&?PIpf)x{k5Z-f9mE
zA-j*h5sj#OWMQMnPil>2UVb_oB7$##BGhSbu)g{%Jo)}L*7vx3jr9otF8@Ep`chIm
zyo#fL;n1}w5~#_tV1?<Gi7FI*V!1X^9H05i@3U==k}-q$%(L`$uq{uzIpHz2{~(c!
z#n?<!85QsIo}&taT)&L=Vx{zNlVfBU;`M@NuDHI9g0fbqK;74)wb7h|ydMJm#*ji?
zrOh;1pw85Q%ckC+pI1jwz<A-(w&jl+ndVZ@*#&*e0nD8^dr0;n_cFRp$wN8`+<UI}
z8Uwo5JpAknjhhv*w7Oe#?yd&;d+OVGhx1q5DH6X;XE*}g8IylY#-y6qAAEv+s|hK*
z0H%$yBcgbRQ-39}bN-H1OYh6sCeg>T!vhW&7};|fasAoFVr&X8J1_;O7%sNQsFqqf
zK3*Sk8f`8<kh@p2KIdO+`H?AGPpfWl$TOQl#=mrTv5$;w2c16QoV$BjaTgiQ8s^F+
z@6L}$QsZQ_z~!-PNsgc59jL2TROAsXdEH*Zv58RGEp<;5*@ka9&L-DNu;i}}^%H`I
z#vz-a{>53mpT|1xB1B%UvON##`#2Y={F`^_?8y$z9?wIT0Zn2z5BB<ud_%xc;BLO6
zdMBs(<ZU!b<wHadm1-w1-bhxY;O5)bwJSPUL3aTeH_S7i%ybE`pTFuSx!nvxK&DS<
zP`7Uw$Bk@=03?<F9pm^%Nd{a%DUJspF;S?opvd1FbIb-`PaMcqw`o<6N{yms@Mb(J
zG}`Hi=~`f{2u`~AcY61-@8Z3#(P=b3nI{o;;dqv0txb@9%KmPsNyj9QEINP<54rMT
za@k{cy-mB(nuwKUWq4fN%H?He7wvjv*F)D5Y%ODzTeM<{iY+ufd7Y%^XzfV+?6mdw
znjub?hqLx;E(;#IIicFZya9%zg!%eI^Ft$3UzcNDl&VG`ue)`N0^_A$gP&`(ynQ@I
zGI8|h%m%f6;$n^wRGWkB+VFjpmERFGL$-%8x*qx%m&kU1DR};}nn%iE99%USw?tk|
zv=q4?*nS{76liAf)w#uj`_bz-|IhDai=@kml$2pShriPYphahZ*piTrm<YZuz_1o&
zKAD>WEOAqSh5t_q@T;?N7sG0vu`Rj{J;Dc=DE9gp>DzOPQn*M^hME2BW@MUgAoCp@
zSQDWx9_-S|9nk9NMY^KM9a<7s(S{XG>#zN{z6-U{wI$t^x)upQv#?~mo5F#6BNF^y
z6pkkhRVNO0Mo{u3glGMoz+Uqgt&g(nJ!k9K<P(FRH-9sx^3ld*_4G$#ANm4%%DmQ8
zst?_Ta;D^oMukuKFfrC4r#%EkaU*N4`TaD$)~;H$?q189V*e{y(_Jz5W?kg3Wp`aA
zsW3RQTRa3zNSJ0wq?l(7g$Q}`yUmZ{dqoHjEs*n{1u(=bWY>(tCUF5<(478&m+<D}
zm^2$`5dF1Y%&#A6*{%Qoi3H?QKoap|JmlEo`OD1HSnOXy7MKf*94EmBQvM2ek&eDf
zCzsqf7*JF-GWbg7`k@idjVC|2QFerHs{Q{$+4=9){u&5?n6m+zkXK94;9{)*h2CM1
z<iwD8JNVgK!b89XX}-G^e#BU$_uQ_U3|N=wlUOyO<Grz+d}^~_MUeFT`jrz95b$6p
zOtfcUfYsmsN^=b_0~n@Pxb{+=0cGlX_Nq%g`>Tzi)%4m@;d^rF>_32KksxMvcnkB>
ztr-bPNy!!e6kSceO^9NgTw}8ofJ-PUm{v7DVZEwU`oueZC$NU`W-<#{Nd^2a<p)Q9
z2YUain^LWPKv08t^@&3|i`XU;YKYK)2}Vl7`rI#fUi|8frf#B8>k-%32JqC9e0wNN
zzu(9);WOBB%HgdI&Irq%kBnd6{Ce<XCDF)osWW1<!lY5=q|R#O(faR(THT%E!pz+I
zIWJ{VMDR*q(ny}-XXIqH+2|K}!qjK)$V1-0r|ew-MkZQ)uVcgJ-rpWfN*}mXW5p~V
zlUJ-&XnotL&W6f$XU;?v#4B3<Ec`an?n}VZlkj@Y#}mu^_-#L>7b3%*T}UW76rcJ9
zOzc1<?&oBg!PDt#voPHgc#f<#)XR0tXQIM{-?Z~CYAFhY%=F&Qp?dmOqulV@S05T6
zx{2D37kO`CoC7y)vsRkmTCu-IbT#q+Z$t;+I`E6@;*qXKBJ(Ea`JkEf6H|v)-+-3e
z8?eCdO0Rnhe@{C)f{(4j7DbqEG?u|_Vo1NF!@@0EVW;P552J2bj~3-*q!Au(&ng$H
zWek5x<F}G=bnH6uJniMGWN*isYWp?;Rz5%30euy0JDK;-LLII#r{#3hd4HJmJu%r5
z6BbS>(Jfbsh=?$p?oHrYYr~-*9aKJ8Sn7)E%)RgXeZQBhSS>>Ym8U7%?68R0)!9kv
zNfA(1#;v5R`~`_bYEnNH**Cr^vWz!H)}HlaMuw_Uz1>(S3~WF1)yix_H@~1@82IOv
z2?*HF0@XBY#5Nsiq3Xs=J%|U~q)$D3b$KGWK2=-j1~zsxd<X9emb|+7978X;ZMqiJ
zRq<n;^T+m&4cxa3*jP&8w`?Hy0_AGWl@>OqYQI{*=xpy-S690%M+;gbR&QVaUWM6H
z>3;+_y4iZJyIst>&%f+T<iX#f5%-Ee6)vgD(acwJS?#APpKiIjeCNTtJz7lSdpu=f
zc$qC7jEokXgAXdB0=m#PJLccF>Sov<Ki0@(x`PqR0HAi_B#dAp;K4R^gSTet0XQR+
zGh2TF4QheJyDXeYUCdbc`1r&%I-S&yFu8w-q?5a`{T%)Pw%@g4_@DjzZ`rB3ha7pP
zKBp-O68By<HqpC9x3oIGw%)e9|A$zQL;EZ~H~`4>O%uw$neLEwY8+=|4^3!B9~;?%
z@u>y!W*gmS$kb|ye1~%73_Zz->g;9>Mcq%b{jV;+zG}mieacN59v=QUPgvCPQMRPd
zX_Yil+g3EaWaiIkYDC%EgI`&K_H^Rt!;#RssoPhCk{7QOoZa>(ApS$Y8=Sw%5l<L9
z;}4_@j~F~-^`EJ;{pzx&iCQnM498~X-u?3q_>Iv+A%|?Oz&m))r=le5J2I(+M@#k8
zi4$rVK2sPm7-!xvcJCX;KBp95JHJ&wZ%28_mgOU3(&+Xq?-$9X%9wYt`OpmTKY40r
zW1>b1gh}8ONg2GGd0D>42B}Xi)Lxfbtw4PC<WePkf4JGXwt_Ft{Cz!^BG{1IjXUFP
zi<DT#Ou)l=@Q8H(2`0%S753exKMGZYQB__i+vNkFHfnL^mT>8Pb^~iZCpSZRjOy57
z^eBG4m<(X}jgfrE_)*7gLNO_N-@`aDo*|*9PitG%tmHgj2oUbq&-;BD`XW#L$-epQ
z?Zao*@r?Lv3=7vo0eXr##)>2X(0w}Zv7(pErrs>KL1GA#*EHCEiQw-JjI6Az99`Qj
zSAHEQ`0}ov)u%u~K_0*)_0mhU%k<+!+%^?{he8pazTVrHZYB13-ObWBv7&u#5&wV0
z3PA3$t|5(s%q==3FypXfa~H{&eX=xD-y<uChiqW1tvB#pX64BijCwG&!4q3pbuB{7
znC&s2u-*3l0pi;Ex?0`ChXxX{(-dDm&>ee$LMTnZRuhc5)^|C7g{B7rK^?`?x6G=X
zs8I=qavuoAL71wgSjEJC*YuwqAQGNzVh@8~z4UE#+uAf|o(;QkJ0ovk0W=|CN_S7p
zdc3T7Gx-52srD;F;G-Z22Hf(B1O`$9=EP2Nr`Iq)rnAI<4amgK)`R%E2EN?Q<p)0p
z*3ClzQmm(M%D#h-1@=2LHy^6@D_hNIKJ>i4#%!m@1UHpFRyTMjYAIzFxEA-%KXNN5
zTG$^-B_`f`7~(qxBTb&p(+$pruX|2@I}`d|>~)9orw0UF4;mY@hB&dR-a77GrRf~m
zO5nounp@fLruWw-&pBv!b-TzVWPb4>n?tJr`5E_mL=Wx^6E75^<@lJA_1JU&%|l_Q
zJg5zj(^`%A%pIjSLmw0c*FzuMpPu_(Kal_U*?ocu@aQbNL(e5jgaE@r;5mjr;l;@<
z!oxasY=~&kKhl6nN^C+vW(ZCg0c{PbauRSmy8FSSQ_c)g#8c-D36w)qzm19Eh57kI
zK$<4-c#FCqrN&BhoX2e<{$z=HeyaGsgxgm)?{hGKnYng^ZE(5}9t(V{<L1sFMT;Dr
zQr+IZl7N6)vM-NMT}D&|hvxmSY!&K70MHDyh_afGs~tCKDfdrWwsJEi9aNp9m^{Qp
z0nKs{5E&+xszyGgl<ol$t6pmXbNl8I=rkw>uYKjPHT?~HU0Moq>)r!n79i`G*hvpK
zF?EBUXSQaFdxyI}c^U=`u{ir%45q)#Tsx)8S5D%+BMtQwix~v+&Dq&Gf&%XfwNV+l
zd-0Rn-euIddNtvFz$H+3v)h7kC@2B-68j@V4p3#!aWU}Zl;dx0CY(%i0df@ZeWN>O
z)lG=u2f2cm<&y@KqHf%KXfpyJgRJcc5zVqU8T95qGDzwk@uWLT+HmawyU1vkwcfMl
zBCZ_XA?|DJcKy?8E(0`QSQZf-5>2Zjq6cipN-*rUp&e5$d^`0Bv@Qw8W1?!WP6B8u
zS#Fvy*mL=Zuq79UxZtl$?^Epe!tsDZ_S@p+An=(e@@GF49RLMMv&9e1oz@Jr4$`3?
z<^>8adQvdc`^OHjb`mP!&k|mTL-Gkc@euE=XXeUgDfND6uOGncwO5KCz_KK>GJW<H
zd7>#^HSM<JU4sp;9q0+N7A7&Wp9(Z~Ank?+9UVMx29<087nFs_o9lYx1c|g1@i~3m
z_4DV$0^Nt0Ub10!>ED^M-M^eM>8UCxXiTP3zlv>rH(oaMX^L*m_ESGQq*+X-+)yX;
z;SvxpL&1a+mI|NQZW0+!`Bq(JRj0-r_1#GlmOA_SOo^+D157P;d<@?}wW#C;6)8yP
z+o*g)M?B<Nqf+$4XWZBGRIKDIKNJASD5t@$yL62hX{ya}<f`@Z8M6@?qSXABuPC2-
zf3Ya!p%$>o1`6xUM|aer)zZ9xIeW~!nz>Q9Z|sfnd9Uy6FFdYisXEW%HbmQsjFml5
z@SP5O8NmEH!W>V*$HfbiHGf6pn^GV@;+G`=;+`$E{vCt`o~jh%y~AX;xKASo$o3SM
z-ad2C#?6}dE7exmeC!fusOFm@dLC*!(x3VhQYC`K0oO@s{{s^BuIw1=@VA8bi%R2$
znj9{9AfcWQg2>*4M@2CM*x1uLTuVzU0=m*mL`9{@$jI2c22@1zC)hYRTH4z2Zgvt1
zDk^!jqHgST2MsMi;&Nqf=#}Y9i+dfyBM-hC6jcze@^yB0YP@=t-5kD{EVl}PGCi@K
z7tfz-WQe%NUv+eJ;IH6%x6@7K_cVc_UI6|T1=?TCcz*;5Tai)%=XAqmfH<SX`DU%*
zFwm9o>0B~Avmp&mtl}5D9foKi{T|?%ym<wR0$N;r;b^s){B)CNt=k}aqTFa=!S^y&
z@{%DF2WPNlqoOff9M)Imd+ugElp7)@=R<W9QQH3*QC^v`2`8e!JpkYBT5_OjZ*S*z
z4_NfMtngZF$2QQeuC_TBA{{TNhE77g1!*PyjH}bQjb9m!wD|iQR=o-w$C<&Z!$)aQ
ziVnCf066OlfakP`TMuHmY$V@}m8`&5*Uz0@#H>fz&4;qMpZZ;RJQTD`7ju31RK3m&
z74in91n6s43*R4KmjPKkb7)9_xHMDjymcW5@R|I`-^{SymOR+2&C==V?R~<%j*pMe
z>PNTS3JXq$1!jron`l4azB~guT||hB@eWXK*y{X$3xYT$+%}VSgKg`<Z|v$OeoMx7
zfECo#bTetEF859=8n;DO{K0UYNexoz+%FO$?%OsV5+g~#fR*~~?tdE;L=%W@8(7ld
zCfQ6;Fb?5^t3>zh-@+v(jRGd#Ti+s0zMiC2KsR(ry;mXwE?Wa{ht4YkH^6(vKsTmi
zoyvICQOsdM%4?&%{ws^yan5{%^ZIBpztbNDo-7!|YmIg5_w2mdw@`<L&o`4ncsG+l
z0EKR54Frs?ywUqQAD(Ttv0J|c_0-Tj*dlRY$;N@4|Ni)QN$c8tO>g~(t#}BF;8qgK
zQZqQ4pVD7XV7ojZx!S82@~ohn8jK^9_%3PVPngs(FRu|U+0_}QQO*^F{KmG4Cz9d6
zpZ%Wg!A(-AH-VJBRAR6WgYV!o%}txoZvylGJ7HbNUKkHs;FjZMDa}9Je1HNq4B)xk
zjM{)E*)W1ggbcY=-)`$|LbyD=FN^v&AvU%!u;&WdHF}d)X~Wj%9|T<*XtM<;1T<TX
z6nu3?s2RLJ-kg#J@a*W|SpcGAN%**?A}fu%b1rmB>t(&&>>JG-Q$Jyy92x9#0&gkP
z$^$V!D*YZym@Jf=*{rr`1VA}md)%Lr0=rnaS%z>9#M_yO$R(X7Ys{mVPLo!qf<Z0%
z!(o*zm#NcVt-i1V1TZ6!$EYA<x%K1*z!dxoV9sjC#bSXk!O`f@<8mEno>!;Kv3<EN
z-L&p-Af>-KqcQO2?3?yp@F-qU?L?|BM{-jlOk_OpyquA<jrB|tqlgsj!_C)|WTFF@
zAAqkn^odouf0iA=-K*d1BfK}rvW?}AeW)(Bhs9(3U4t5PW^t<4;vIqr{*K*2LjmBT
zAy}bHVChzFg+CUI<hjlZ*k3Qi@*y8L6{O}%^+3VVuhRHzCLb#kTo_#RKZRL(ayzAo
zdDfVYEG;j8bD@j%dzqTZNT4qy>9PCDl-iEqLgg1w!JB;z6AgglmIVPE`{)|(8+uA8
zsH+zO&3U-Ave{byRT+ri>(KHc&{46mvDZG+(ox8Lw5*h-%kq1jKD7<l{IN8{CX7J8
z$7PM@z{jl8)8g;fJ&yG6Km#N=JY-4NEsks6_hh!W-FhykYfR%N{O5j4?#L8C__q|K
zV6Ya{4(_HwCPmyvOXaRRm0Jl@aKnejmW*CE;`2v06j}3M)5Bgdd%g@yBrW;NpXfC@
zIYE<Ulx&=NaMJ5sz@t3{hYDg9{M{o1R)Q5?Z5I|Fc5S;TDfZ+Z#@l4P0`~@v4cf?9
zaZtW!o-5=&rQE^$B|BHL|C@$+zVWhIh8dHC=~4K!;Jtil_eO-HKG?f6Q}))i-X)H(
z<A%l|yN0;EUctPFsYPOCK#8l)z$C_?_j+;R{h7HKs;8l+`Juv9h0<$$9}o1AtxGP)
zQY~)>9{#wxJpab23&ad#2YBQN)2BQr<2C>l@Vbte?$rkP^~Q7DA#TnnNO&V3L@0mM
zpZn?Cy9v&@siVw$GxheB+}sYMG5yOF5TG+Qis_J(TmVq~y5K|E*F&iFz@Dtt@}|zo
zd}eo`r%O?WHDDF1<KfPB5AvRk;8HYlV_~xXMxxXGFQLpW@pNZ(5xDnrQ>8kkZ>8Fn
zB<rGAA6pHxn9gu^^rt+v0u-0t;-_gpL%xIRIQ*~B^)~HRWmo-(_Q6e;7ccIJqmW;|
zT90uS+Byf?x1h(XMk16GTtfPTeztpL3qs_<tpYAc4RZwP6!taqUup;Dnz*?6;!o~i
zzLm}eYHAGR;x}vXnL$_<em?E8oHhy(YGl_C;&-};V=zWkZ#$FNj9Ta7iO#b3Af8$q
zDa02om?D9vQ5;(13kw0FT$cZ(X9p%%Ekm66?#bFnx6{zK25R}Jm45THCibA`rEaGw
z=c(^1hRDSqgTU$CbD`!pONPdzKqATIgo?0A1E{}_VbZ2@az<<h0+l89o(Kr}bJ18;
zJ8SX=ojX|yVAVAD@juw3J52{MG&ST0+bIA(fe)_adH^rJa5<bQ9%m=;xn4n*aA*8a
zWa98gg~0b4+vkc8gxPMYL1csliP&+LN!JU3r_)`b_y2<uP~5da^L&2mo6g+?Luj@)
zxKLPU-@QKMLW!ZkhrOBth1iMCn|Wwx&*R%rvlrrd<0pZBcZXyIgQZ{~xFq^e%X;?5
zw{aCfbi$W$1&UHFQ8cvg@@N8LXtW;yQP_>TM>W|f;%$IfP)Y7K?+3LD4H&RT0x!ND
z>M@|-R0Z#h^%!^#?hNNgwHqfwUDiG=9rbL^hIbKosUOue2@61OL)}fCr%2e;GyszE
z?TxqTJ@R0e?cWAmg%Ix6Oa=pE_70$SDqZaN(M*~>iF*2Gffnlmjb7m}rDwaI=CHci
zr#sfgT!k6>VYHZb;Rb(?#l9yv>+<=D9Poj8v+KKj2A7=CrcczCUtMx1fR2P=DFG6K
zf=T)TJ!T*k_A-E`u7(&_9FOG6;Y~ODdcO{R!)~OFAr4x72hYaX`xX~yONpoCv6p%O
zzeCjItd7%zv@DW53NP|$G{9F#si=xoy5j;QI5>)1P5JyJiZ$~iF}eV(rr7d5nF75Z
z^cX;MNmz#f7s>^YkQ()u97i0s5Hfh}><H+M8~p31E>X`l_cbT&=Ia<c?gwAZdu{M6
zWh@@{Z;6u_ehcFV4lxPXdP>sfX+RtRtpR0Q#BM&b9(9=FC4U>}^m0>25fAC9HxfqY
zrO-&WB|eW&FJU~jqD>y(SVG=yUs$8s*{pcORpS3ER{=UX=)chu23GOdAL@-o{l`lH
zl>OC9*1c&oyU9g^SO_{_a=L81dw0KZGBT&vq6??PjDtzL1t<8^2mhw@o1q);Galo-
z#WXo@?kY13aqssDf#S#2db$KaL*GmY!=B<kPFw`=$(>lYbh~41*vy^!cN1#GODa<K
z<cv<N<knS)gVljFF5g;&?D23Zp&T)sjg3tU&^hA;4A=+hQXdM~DCFeiL@Iphiq_<A
z_pPqap#XbG&zE;BM^S(tHVN^Wy&Y)VMEmV6b&WQ<+lOsA78rcLu17&`<Yv9C;15%2
z)xsB-=R3Vk<|5vy>CfIJI`szOq1A33lM{=bE(G7P@8o{N(Juh6vF`+2mg}XU8zFnM
z9IHR;TV>Ne?larzQHJ*;{sn2aNfNPCyG%8g=<|0%lfhfLa#3HMB_4a12zsx(KFWst
zaNz(3(|s++O313^WsYC;f!DgDsVz=b5H-LztF>52vu`#aeo<5S`uJ<#lH6rXTM%|_
zIUpm@llh^l8@!CQF`x}|fZ&{f?Zu^6q3zZXhn^wP@A2tm_;;A?<SkJ4n4<asy5wx?
zm~r1YR8mV==mFf>FP2Um2~eyBS=Op8GwLG3x9UeIlR@J>VEo}N1+Q_D{ii$l5A!yw
zy69Y|?%>mjO;$anqTmIxVxy;P$bHVUaQN-=&*%g>_=QS;y9;{T!uTy3b!0qX#U9Bp
z^qU=07(**+{p*4@paqr==mQ=vgZ}18lng-S*he)AS?;!irzqf0cP7Bzs-BOQGZfAm
z!u{1(OomR~djoIda7J|;O@wTH^utm1&AgoK1+UqDXf6}GhRb5wrX0qCEU9Y!1nMt7
zQ0833SaTMn?;p@y6>xR@aNW2T;SviC#q8(AyijX}-wwt~^+o_BP$+cU5ztJ^U(%ei
z+_ZO@#DhI63|}{bp|<5I(nsKZhzX-qS-&g(Ojo?Ih$nB7Ofb60F#i@Vd!BQ)zdCNL
zOm1Z<CwcSsT2zAzA4gIN;A6rWC~!8XzkbyemZ5iD&=&{^Jsr{sQhtqaKXoC<w^)67
z)Y~Qc)7f;ca1g=y+qB&zO>{z-w}LDQ@ovSC2R~#5<6sIno2je&RBL52h$0K&r|mHb
zdvKzs+N`!D!J%?JXj=#hf5&|)Cqk4>niL?x$QrAbNfAue@n`Q2jtCtHwzFGIgZp5m
zf?OpS6ZffT{LNzVb-mvu$8?rd%?G&^Y8g5SutItd6JML90~&w60z-}Q;}E$!n&*#l
z_>tSYnwwN63D-v~FlK|wy$3#{`0$WgnwsGu_Fg-ls;T@h>yFK17rA#o&n<b<T@0J-
zRA<ULUNF4~6?R^w1Z!6z_P8p(%aBafPI!}>^il8uip|^C!Y3VI0)XLjG-{iYW7RyC
z3C+EWY}f`g-E3~$?|^D+u4UK{(mlnFy6>fqdNT0RhCH|l_%%P!!t;A!l2<C+eo1XQ
zf!Gj2^fzagY(eiti^V+f1=IQ4W&o-r7Diftj~6=IHt|!$QK2CrR^}_x0I-ap!04$0
zMEGEKNCES)>a`D$PWz7!@anQGVd-71>WYbpM|T2X!e|_=k9}K9#XfA>RcR>-w`KPJ
zjer0C=z3MsImYcfmWa2n>z`uy0<u^*McJ=bymo#5o~ZW2K#H(xp2Qq>U?8?nAhgSK
z7_ZtU)(o8fv;8?$BDaA|tOTk^j7QssyuFsz%zKr+3jfDqDD_vSCNqLUK0M&49&RCr
z&%nHC+O3zf%=eP9BW(2aSq5RIsE{u1(B+UZ?ih=>ru*C;W*ANPZP*N4c!NDpo~rGP
zm#0bh6wdGU0`wwFm5GVz&4JRzpU>(KGZ%&8u>G56lKcpO(m^lbqwhJmBIml=Dmu1n
z{N|PPB0$bpiaREiKK4XG2b^ms?k1HR)$^{&MK(FaP{0AUOoQp=z3>rid5!m9gyOP3
z2VhEdfCLYZs^k6PVl6h@yN_`fCIwRbZ;$QxtRg=dOmWGtl<!9xN!cHBU#%oTI7Mqy
z&i$^?C-_mPr|#yLv-LuLqR&o3oadQt9J(LC*$K?qJAzz+yetUKmY7BDopmWMXIW0P
zFSqhCDFf-&zy|h+^T~6K?7agGu8wvG@&~j+cBS1Zz+TBvRTvXlT%E2y%{6veEmO@w
zI`|u2$lSLDwnQW*Q`Ho$WXibPmuZ=blxvArCNE&ZjJexaUO}J4PSz;p_^*x&v{5@M
zb)UxbbRS21^M6W=IM($~E6C&V$}tY)tC~D-`&DuRcLR3Z*BWhd@A%SJN>ZtMdOkl8
zC>Vyw*K)AwrT+=TaDT3WD8TOKNI7m{PPelqQn_AKpgn)e!8N0MQWweyoWByJf+$nY
zFZX^DPp2Cj@$Bx5`5cdH&{`J`vt>x~vPI()q-jlWG?z{(slsyC#WE8f?xe8)FFmUu
zcai+JlRw+nd@_z+8_u);SXG*dtw4!MjQ`XWOb(r+mp<t9tzAjF9}P<{G%ZTizuOil
z{;ipV(&r>h1jPFCLW@x(;Ds2C;<t*&bNc(2cM10jPr`n}BkhN+&@ucS$!1KLmXo)M
zwSjX+_(UGS`y3A_`+ZivAJYvMxC6U4aU<*EtRpE~&L+&Hd{C8TZ}W!l1fo}ix$jA5
zTo*3VDu^c(KU7!YVZWLAXNw5%Sj9fy0wsI9HKTkFho@Y6dx;?2_<=2YR4wnQYM#X&
z{nVbJS`Vh*rk|M)KI=KSk_hSy+HfM%cKo$*+cX}#b=6?u_xZh>v4fNOu8^!igUxOx
ztYaiE6!D9EszcQKl?7;J_+03kz;gdItNi{XSuRM_Z8Q7rK<Y1>6?3eX_>b3qLf2hU
z_wD#DGMFC#3V*oq683{6A~~~@w${v!d%pT#`I*``H*G=h+fIMY0feX?t-|Ulu5*As
zyug3Rud!a8G&eb^9~>TBZ?MWQ-^RV}!jf&#W(v3sUspXGF}-b{;E)>{yN>A?KEY#Z
zIa{S(Ngp|qxldQ06*577V0s%}amTPjXxHGT&@lX$LL=&|0NZc^bNA0Rx`S9*SlHXe
zQtaxY(+6eF0cD|w348M$VlX2i>7?cs9`)he1<gHV!<ExY@2?W2CV=CZRyPSJQ;3lP
z>uh#OFoV2qu!npsohra-Gj!j(N55wDc`5T6C|pJa-uk2dNef+0`;EX<pIifOk(nGI
zdq(08H)RAEeC&bQH8Cd~zTpDi%Q5e{Na5{i{<7)*TMS<>uOBr5Dj;J7_Uz(fNi#Du
zb4L|CYHJ<hk7i9{wg7NFGMX!OtI*~HMa`PKCKs?(RF@y?NpP{*;}+I{yp4yyBID%y
z;|wS(`ji+@&$vdvMFF7jPYbz+0mV)9P@`VxUMpCb9Bx#-I)89#5WO|e94lseD*nm;
z_Mdso3~Vm%m9iM&mhaeyfD$MKJ(=@16a=_uAvuqsC1Ss|39ic9&wH)K(uezgzF|BZ
zeP^d10>F{c1|Mz6Z*9CbG2#0N-k>*WEj_-sc;>S^bMKDh_h!1Nuz4bxlgM_ihWn7s
zLDHb}H!FuB=gd~C)<^oQFb}cm3XgLY8D4R|^G}*Ca1)vDJny%>UV5L*bgV5J$&yJ+
zdf!>8@~{++jIKI@Spmo0*)L&B<mn#Ck`jM+V!9kU8LDt(_vOLbLP@+4j*)kb$}O0<
zv-VlxiLLR|<V&(ByiG@FtrdH95178dKVD{jODkj*I34RLuw(@G(Y~b<c>tWO@d1zg
zji}BN=GvA;E+Doa_&`h&WF#+&>jr|(oPvIxv3x-q>86egrmlx$lN|@q^gYuFCe67>
zYAGsf5UYoJeI>fWvsHefO9wr*)5PHW(QNWm7L9IWI<JiwH~S+HDnX=JUO_l6Sh#1=
zc1}}$ONRc>cj1Blq!G8P&vGD;>XK~Z>&peF$T0Mg<Xd>q0Eb(jW9S$qjjq(Ae+`KM
zJtF->xre^{z7NgKBTPQ3?VT`?iz&YbneMit9fYsMJ9P=jK;JIbGFM-Z*857set`EF
z!=y!6Z`=tr`v>&gugKxbl`>6Gv8cT_uj1waOJyxV56tKn!2k@j!2IPm%Z+yo0JW`F
zyV=JxAJ;p?eDVGLw~XI_wyUD@VUcwZP`TD(M7KW<SUEc4B0bdrkC%C_ISKNx8a~UJ
zj7_U+{^lVbU2bmfpW+(J#nED|JA1-WmlQmPc?quxW4tOu3`4hD|7La0BRm1~kD#zW
z4Ij=7YwBN7Z8sq3P=KJ8pj8X(gPNKjzwO5!a31oGiQi&6Ho3{@e@6%a=rFb;HC$_<
zZXTGBPK|e0ShYno3~<dT%pHZP!2h_xPQC3ib^cF~6i<Hf1G^sALj&t$rEF20dw{Za
z-?q1Zi4+bD5ZWRDA``I%^=nJmj5V9%TfKJq*&2L|^#O*7`KK%3$?hPCn<XCD<y6G1
zZUi*v->l)NOa(xNix&;ABFcoOY)B#iDUfgpkyd9rW32@MHsN5o6+8;w(cUshOQy#O
z55XpDo$vXvVdj}<7f>eM)s|^T-z;Q|xou6es^eeZOoKl#JowppJ0S7AL(2QNFS*WT
z3>Z{BVEMtBEeP6PM#z%0^_tiL{_hL=vk*XR)1x$GH@cp_G5&wpd#|V_+iqQ05TvOT
zDIx;WlpYlY>Ag#DQlnJq3eu|u5s)sucd3ysEm05<BE8qp0|W>q5PJS6yzjgJwZ6T_
zSl`-5`(T|o&<vA@+_PTSHRpY!e=jQA34UZ88H61My&M9w1}a(JyVLtFp~W&y&^gNB
z3@FiV#YLFPNCW6#+a8O!)C&^sl^+zHegFr~1!qQtFaB#SE=tfs<nH*MYJHgVL&+Bg
z!cAP2{Xr*B>Jw;C5ozO|ZCdBPyJ`dGPa0Xc9Uw2Hq@QgtC4V3USFGFUrCRVbFq_V`
zAiZ{jWyq$VBH!i~c1j16mYSk0GJ2hc-6_TD^ZtToik_BtBXDV+cKG$Zyl%N?7E+V2
zaUx7rbe)_E!o)is#4umveLG3+4Sh`Cs-0h0`*K0B#b~*^0o4rG_YvB6Tfjn+`~q+R
zukoLa_etG4FR3ERhUZk~%KH`vD`N>T&*9n*&xB&4GT{YdqnwUo4h~r_ON@H%1|tsq
z3gi0rU1&20Cj7)fF3&SL5bC-L>k^raXTR9Vbjo$hq=`u;JKFa#KP3|H=p1aB$`v1Z
z$S&NXc}!zvIdHy;<Fc2-`I&wg0Jcc-JjI-J#yX`ov#U0EdGB07E8J-`dUteA%D{5_
zq>i$vV~j}0O^qd>M$+8W`iGBtX#1@#hAxC!a|LU?u?!5UEgX3U&K2$v>}maKGjpfp
zHmi&{)^1=bP4}1N4{?&O5iH|+XJ4^5=%OfRZYf2Ukmw|M2OXRLao(ELcUBG|YsoFv
zxi(eXFZP4r{|^;6ZtiN*oVh=Y7}Rs;-f3=B87RH?;U^$5`L1zCOzMMN+vTr@33n<l
z%^aq$dM>{Fk@uJ6P<bY%;L%M0(%cH1`|<V)B?=8a5zLSd$~;_tf0dv7C4e<a7+BH^
zZ^L;RF|DpGKcXdP_9*<$B4`05r<CD=-@!%>pk?T;sQLb#2y;pkCP^`MqsNgs{5_z;
z8U#ErPpiuB&%0I<7VjT1tiXcgn=b-i7cf*X@vdwB$<+kB6ae*7o`A1Zf6^|j##*m2
zW({TftT5u4t~lq};$U?2_wP@P4I)^5SJ?pkF}h|Ck4z=-8q~PoJ`~0)?s{o1{Is6t
ze$eQ;m#8Q}d;%H_`LtUg8LKHO8cRPCJ1(Go2^*WDt#<Z5*{rw!5lmph>YrT?@vo?l
zUfHQ?nLjU+drh{A>`7BT4Uj?ijFm`hE}E-hng+)C>=G=1{CYI`$`AP9NBo?J8`XVR
z#R<M`CJ<7bTP&enkz7S1b1|OA00z`l27>iz&ho1aqjfDUf`3J{9`2dLPLlETz7s%|
z4<$<;Eye#5{?PUplRl*od}@{pUfKju78a0n&{~#ijb^*-Ytq$;-m5GU$x;B^7ck@*
z?ekL>z~VMn;8#nL&jIec8AT5A9+ie4tPO>Fv%S44ai!sT^pN*YX7J_fPM7z^V|l_3
zNr-M!1#h}vA~7yd`*C_i>9=3=Hps!Dr0R0=Y{xC~WKF5lZTSVnetHOidn!fVV%*RN
z7~CF;uM<kBjIiILJ3<F~T9RB^322JbmK>m;7`fH{R_m_~Sk}M>tQ-B+-p4>`U2M#p
zC$cYJ<hI&yv`%TQ^Matp`q}3dy0c}Qu9}l<ZS{!zn-AtIPkHlHyxZ&Eun8NrFQBjS
zDDUX3Q!3fM#e7oEU8QGh_T)+?#u!>mH)J$q73#kB&PLWHtHXVTLC6Nn5Se--LET2G
z6QTOYR-aAT)d@t#Y^V>cm|Gv&rVH=9w>~}!?soRX-7L}J3XV^>hzM3X=igake-XMd
z3X?{!qL=&>&?AEBTdvf+)h`>jrEoK>jB>X@L`V?%0F<f{zTFpg`&N}qOGg`Pc<zea
zqb>f`&Q|AMx~8l8^tpZkhi{ax2%J7OR~X3C_|Bd=hD0+^JOZ}85ToR`BJ}CGUqR2$
zUjpm8EquA(vCBCxE<apM;v53uO0JT4h2_^pI*%#uf`HN~NTcDbQ(WPbquohP>JUIm
z)9%0mUw2}IY{Q6I-_quq68*ICV*Zm$2G`d**i8E{nB8PBAc<uATcQB$$-VNn&9W#*
zC*no|nskk4;!6xD7kguBJ2@obn303k|5ea-oFi(kCy4a{e`YjkzRJ$VLu3Az6&76w
z>2{K)`MyE~dx!^FaGVd5p47^dd&>M(z$|2;$tb&wmk+R;)mnU3idB^IR|TF)l=j)p
z|H;7;arBXr)rD%)m~6G@9cpW)iI3%Qyh*a2?J~vCk>W=wpfT``l{Yk`CnlK+<XiCN
zztSJkWMkUSmJP0TNGJ&9nq9B=*;@gSSk(<3@RgQvox+I-Kg_CZ^SA78Zx#1_`}S9k
zZDaE}2wEnl?)b%9&PRy)pC2Ldl(m2lz?9(CmCMu3zZU?hQql1~%F$+-fWppmW1LMZ
zto=3t!MEaDRIJi}uLIhFqvMB!fKWh;k$7?bd5PK7`dPDgW!2%+@UC(qjM-@O_$SHE
zv0}Z@KU2M?0&;FZ!-1{`<bB-s1TDtf+$Sw3TTOIqtU;{L#RcT;$ySXYt%YyPN5OCJ
zVX4k?rQM}^Wo5JgycWOsvX8uTR{lrqo!B702E0xcXelN?jHfkQ<lAy(Ba!b8550R(
z0-&lDq_)MkUklD_BbgyH8zUC1>13<-v@)OODMyc%tY!(+{yM!35P=&Wcn)+@!usU&
z^LUOtiNo~w%6ZY$J#`bAJ_Lgq^(wqF)vDAkz@0JueQ+jFljHa1X3|BeCjzn<=N(3n
z{t8ln(R=J>pz!dNWACD!f@j?8wre6(6f65jv;06=vAwA1>z0#j-MRyiM=uBSRZRvD
zHmAaZZ~{Q3U#s*Q;F<k<Mt>h2rU%ceIq{=^vr&BT>bYUuy_U<+tz(uiT|oNaHP)UX
z;Zb#{Pp`+u&Of^VjH8J=C3oSUH>nG}6Oj@vGRJr4uLV5Csu;K1mofC4`miQl0|2y4
z;_YY(f@aaDNB2Vlry;(#&R$uU{fua)eFX-ZiCORNRqF7miPP%sUYIOhVj2VGYRH-`
z<=SyGu<Prp#aP2kJcHX>mx$mFn}^FSwaZ)I!s?cj9muslRr5=*c?KN4(?vrQUko=n
z|2*PNX$-<xJwQLb6CwFnBvv!M@2<^!dxYhDh|XmQElPw>b|(;mEQ3kk#n8@9g^2jM
z$IK!`GrU0F^HNjSN!%(7u{D9yzEJ7248{1Q(s$S^Bk%2XUB}R>d*g@c#79_7?G$=t
zKf{1K*Zvt$&fXx~fFle-VOU$6W!=H{r`^5J=kuMNPMJUT^;Gh|&`d)9HX>7DS-I)|
zBa|!|P2ppaidBC8Nm{Y}ik@~1j6IW;i~bYJ>vFu6?1m{3upNfP7txq!o)!r(N%cQ0
z?GLtiFZ<=30I<^%&xBub1;g%+`ptu<y@ajzGQH(W;qRaTlkI@?p95g^BVTIbtm>j?
z^qk4>n+SdBOWeV}plv{BS%4>^J;uz7-qgDyq~4P#0Ba{V)_B-k57Lr+HUMFkbD9&q
z2Y^$gF>smzB8FeBl<srR5fiB9tAFZ@AQs&`FtdfErw^Y+MoXLSv-la)wplWKfQRDe
z=k3f!BWm$0xF{^qY(Ulim|_)V_C4D>CrS9jru@s7+?6wP&$VRwrpBr>65dJ&O;E6)
z$JyGkfPVI##klo#-zK<^FD1q>a|}R0xh19#Dpc!`6(q;3frqlj)_12ClQ)T`V#(=v
zxx4TbovZ>WFp5hb1&l8I<qQxrB;1)LiYV+)Yx8sX>BdXI4SiQaj9}--rB&|gGmRdi
zreypdSpg9rP}kTI9s`{LjbCfhTjF!4qOx~QgvY%Z;zNKYxu)=F!r}b%sN2PP<Jkv!
zd^dCi6dKnUuKR!Z`?I3WY$3^4HWC5=!J$}duMXy|B&J&LTA=N6f4QlMNu_0o;jc8}
z3!&Nz<go1fD+5ff%{e_9EYp7ImXC-g9|qCDDA51vuptw-M6=*(GO$DVqvJ#I5v$1>
zXzS4F$lG6*In=F-cS-0S5xy-0rSZ)f;BM^wa|NI*N7;_#)mz+=R3b&WmTXQhHaKa4
zve9l4RP|mp^nMIU!RLSVhCiiNT%Q(1iVr2cSZhJKzvCbfL81@&A_^<C+b8>GZ>T!o
zni!wB;q5M|?313AnV?LmrNi*Jri4{a9$nw^+|MPDomq^_&{mna-%sB1`*-^B`13Zs
z5#P&OpQy(4S~N`vA}*gjEBkd?#@KWZ`~{2(zvJ85>yg?Z20)@B#mr^i!^jE@HWXO5
zYmprYT(f{#U(}i8X5JZ#HU<5&{Mt+1yDWgn!+9(H?P$&ul^a)sq|-HmKEWaaTC2~y
z_T*%e67y&q*rj4tuJL}4kpr`K{xt~+{5h*0EIH6;oTi3L*JnsCylbQ9pi93@D%(PH
z=;fM`Z84Ebimao!4hUVEF=#d!(v`NncfWA!?+_-ImAi8l^V<@xC#Zupjtd3t8q;*|
z5)hz`H_Y>tu4#O?bLq$gZe5o97(&i3m9*g3VkaAr27v7Ri8w&*P{Z5y@tWS`2+c0#
zG+n>zRGkL(lWtGrPrXy5D9Jv00~y$hwkz-NDIL80wfBv@xpuoXgrc@gnZ@TrA_!ao
zX!S43VBZSIS>BWuLcqOd`uY7Lmma{sIgSZB4CaTqbuU^`8a%|H#-i!@pWV?)IK+!p
zn{~PsEI!>qUrzZrUVkB5N&Jsoe>T#mvPe2m)RhiU=?o1HUd=ra-}?T(P&1>%o8Zf4
zGmztcou#}7!ipdE8u>#gWa|5Cj@KtEa}~jXz_7(5&y8p06KwJy`vF}*t-BOAAYGX9
zTv_7=Wb^u_t3Q^#sqdh3Ti-gfd1~os&#^K98+#joRk+Pj!9ud^TB`tyXGE`Ps?iI4
zam|O}SzJD`NwZN~2pHJ(H~*C9T_ELF0@Pt#dqOfpeiyO%@l`J(3?n0B>Z*2~eXZ$J
zdw?;e76-s??(ID(kbgf(!^ur>D9~uESHHSScpVs25&iZ4k1ppWKO3-25Kz<KknZdL
z<}xF;kkN|y39z{<Xmb8=K=qRSYN0^TWznbFDDa%+4#ST<p*cWdQ){k0bGE79N8brm
zzF=NIEc*-c5u6>f3cdVkJ7RSlbHY*VarS%?SmSSDnz8Y)kHqC#US@r%+#4gJ!Gl|)
z6swzIQw=Tvv5Pq4j~w09W}u@5u5rO_WRUoe=$~}5zEn3BsKT;T(JD^g3BOEh#_d9l
zM2#A~o|kEt#BH_IvqO0WX%+Pq3abFzjaE&)6PG@G!_C!ot7UUjrBx(wL$$Zt9eQu6
zK{e3lq5V%6#sk?didFXnrBd9tcVCh7gvVY=cHN&46dNr;+2QN6Zd&?YMc$_)C~WNU
zW4^}u`n{PCtA(wj8AlJdcL;T$T@i^6v1fWo44>u}C8c`(UsZ4Pb|s~b#4l~8VVh~S
zZxfsesbLQG5X2w_2?=h=txvH`b;vHib>eu$Ff7!pd_DTxqp}2k5I8hgittv|ol69y
zGM5P7vTu(@r|iOB6T|8;KdP$TxYS#;>&3;j+zj-OC73^2;LPs7d#&sJO5$)GA+P9>
z$FHiGrd6!3qg%?US}@Fca+`j0a=7A`S~lsOY-JhNub0JofBvHBN4d1Nul82#%O?Rc
zMzQL$eZ>fRRn%ztroTYp&^xkfpgDTR5_I~y+P<ig2qQB6>b(S@gY*nI)3yR)b}sRe
z?SPKQejAIxmasbKYpX|<IZ=ra#SgXvvB_`Vcp!II(p<X>k}MqT+L_);nWe7+w{*_z
zeBses%6@;n3Y%jzoqGlKP?GidMY6Fa*=p?*#F0TT;6H80>%sOAR^D3YsZl32?;w*e
z6W?Di#xU@=wzH?60kar3*c=WapeyT~wdFb_`qRcBq)UYPNK_0a`;g_xag@BV;WQBI
zUMqbSJWYgY%sk+mge5P}`l0F0V8+uQf(HCkT}ok@4*~LYC~`k8IgqXA$TGRkK>54Z
zWLX}ySRS@xcL<Q*RRxM9Gq(T=47P!lTEzE-a6Y+HIb+3a5n)C3T8K38Rc!Je^IZbQ
zH6mMj$cYxXg3%F4wEL$DcUWX|p~6E0V;ll5z?vdZp>efsE=Lur0Ejz=M7}o$%p<<<
zCmFORz0ygC3QsqBl$vXRlU5z+kPqLi_EW)1;Fu)y&o8HkN1)m;6_><q?xSNx(M=eJ
zCa@=evmc!I8v5ojaIu%1C1x;6#?>i0vBIoD7tktO8V!K20a7K<hO^-vZCb)ZXl{S5
zi#^Q`a0A6^8~A3LsC(g?jq!oZ>u0+O2W>zGuHHMn{nmm~4)*k5K9qHGkqibZhWLOQ
zSJ|5+PG?`{Vl_9TjLA3&AV*LIwzQoM1HxmipeZiaQ!}cJlTiYDH|tJXMj-*y%=28}
zx`jNGxD7pXzToMkb7jNCJZ!18!6&0T%*7%^7-M>RJItFlp48w#J*7;u{b|F2ft7e(
z!<fBc_*ISdyIuNRE4V=2x38KL!jlg%bbjm&X@MLCfZh29F-SMGJEX>$$=({7<q!-T
zMg$7ze>s*?^!u5M`__~Avc<(WuK67C3s}4yHO^*L#PBU(rTf-v#mMPq4lNgN`zEIu
z9V&YZildV^>IqTn6xYgc-R(-~bE(el=g5wJw74XDiI6Jz645)==Uu60jG_<J19Xb!
zum<;)yS@T0C_i^tkx+p6Sv;64i$O8#Wj%TVT>8wBP1!qe8>g~B-4E;;Hlgm!pw#-q
zf;TubWha1cY%abPx6b`Ol-cu{O6Ke*u0LtwUKKS!DVU!@UjYLKyhe*W?EWOP9m}TB
zXNo7OEOflIY*S$;Xa2d}FHe~OOoKdQKi}3m@8HND8z8G4M<_fV6n6L-vS)L-XvW9K
zXYkvLHmbMBN#H<x<p4kjhql>Uk^CuW+m|UIb__AD(V&#r4xacjS?d@Pwcwig`SVqE
z{e>E3W%5zN-@sU2c+~BUbnGj(f-PiDC`+6;x_Rggk611=P*e_WN^vivRV$;2I9>BW
z*i1~q51RXw;6InB`<ZC+1G%W8gDs*3ri)T`ly3Cn0L5J5r<q}oLNUwcsN1aeVJky#
z0?ydu4?=nsgQ%?mv0E<3!a1Pm$ZdbC8I+Csn1yZYe6x~b*KL;-VCz+S_V$3nb|ANN
zzAe<0U12lLwP{m$;540r(D&Z8(f4wf5DZ^ZtZ!=)?vT=WoV}`SSZmXefx!1E#(GgV
zhm?xMXpRNyrx*TIjareddK3Vvif*9nV;DRDgvB&xHlP6KLU5y}1td8fD3MT(B{enL
z0w3wefuDd{*fg-8Q3J8TK~2z7*PvTK7#X$Jmm=&sYt}1{masGY<w1m@u8c8$3iy%b
zyFBBt8y9{=DY`_J^5k`Hj~U64_fo8KzVH6}E*u2=4PgHEuzp+KgreX;?AA;o>*Kmr
zeK2?(rCYs9dMp+bZj6C1uE0~oK&KIpj-h1-L&xV|&*fHtCV|0?`Sv+eHs@BxttplF
z%0C>TAe~lQ3BQEk^9G1#x0W7-f=skUoZx2KUHE4%Q8%Rc6n`cIriAyhuYOdTvoVk%
zzuU7G$J5_3kW3wyV2Ony*!xjkua#0Mv&ydb=q^DiO4J?HFbr%@o1PK+GC$w1Iibj%
z_j1W(r@T(ya`Vxdg4&{}RGr-loH&|J0^^8yq{z}@t%Yk3lR<y(51KNzcT))M@B5-u
zwO4|y?<$EDH5_<+R?<aAQt(k<$n#D%<<HhDL>Kw$IpoeaD<kOB^m<cU{+?JxHGP<;
zUX=A$33^hQA26a4ql!EGBVz?7JeB^)l`gkeO|->@yUz|Z2}xI}`_Ylgff9tiJ?$F(
zMT)OtfnP!x1U<C;^|f5Ab*9P&E+>^#ib8QE-q#u<i=M04vlLLI>sJmpyy?igL%P})
za<o%3K)v8m!%@BZRYgn=YVqdH@pck%8DWz2JoS>tW9E>7Bacf-g@)F00)Y_Sf;-PX
z7T5dkJD>_az8Wat@hXJ09Hg3gPT2JFk75Z4SLP!ad4b7}cf$~(8nk=hCP!TKfYlI8
z0035Agbig_MFP9ps3-T~nz6mb^Ol}=SwO%t@y-s23fn?CF*!^6XH}lQ@%E{KYB1v8
z=8+1~c7SZEMu#QoFFuuFu=)VFk{oL@0PHO<m=QE@Og0b62l$N||7R+Nlb?W8y+*vT
z9mwt+8i8yDlfP2R9@}g?dzCNMwnszVABv@emczL7Ad*%Bq^nlcxy{_byDR1>&J1z}
z!`vA9Lr<!`S8^nXF~{(SK(^A7u$}a1<@k+y2cSy~je_+|PYf||JN%FyN73`g1Aavz
zVw@cJiJDhVXowv<^nlHK0YhcONqej_aY5ZJOnVSNd&ge^%S$WBtiA2KrBN02Rz{fy
zuIfse8D5KgQ|xsf@Y|0?;VviG))|)(_7%uXoMU}}`*80kk2i&aLkH_PhO$3A`XCPX
z=(A|bK2n}&J61>#tO$2)ik7pJCSvW^(L|kd9<JA|=1*S`X6R~DSuiGZ;iXMuVkV!^
z%Ju^Ri+HP~YdA?E+&-)43gYDa;1nCw^(U*&yMDy8FVhkNT#1T(wWdehIl6{*?H+4h
zG+z*vg0jHiEPbVj5Ehbw!=?#I+sRC;-Jj9&(V;4yt`n8WL!X7c-}{lwI3M9%Sh>ns
z9LYu1h0h3o7htpZve_k(;y5Fn`n`ltJYce@T?6Z?Q=rRVMo%{gffcFX;0A|`eHd1m
zZbnY%db|=u!=8$a`$bkDQ~!Aopv9|b(~ouC^ev2}p>7;CqFkgH8QavaF&z`et8G=7
z=qBp4&AD9qjO4ase1XfVKPK_Lw#o?{z85Zke2B~nl3V}!HIQw&&^5je=vTmD)SF_y
zlB2ooq7(Zb(!fAO)Ceb7(U9CeZ)$BX)<R#QK+dKEs#3f{16_5W0f@JowXBk(KokB^
zq_)0DD=QPi{zP$eaX^{17FAv4MSWkYBY#=a*D6#MKE-l?mL}wV2>yK}7#IB@PZw-P
zR$SWGqbB1T&QS;qj0WTgH_iZrCCBJkN~M2lg^<hi_hh8QzDIIQ03Sh%ivy_gwB~@v
z*FV-jri%h6nL~u}#3`B&z<8d*#73avv5H~xa>srE@_1t{s?P5L!J^eulUeT1%y$J`
z{l;O^WFNq+At$8BulmD>F?+>Q%D|getL1nE^vp{Xq4rhAK!x)F>mj#ZR8*9f8-p1!
z0$(d;fKs+F2bvcUVb}sbfI&P20V+qU19^E{@>7M-VLDx9vQ_!xS5y7iJobs(0$OCN
zGmR8oW5Q2PL^o@O<hmz<WpqeyvRV!1)(Av4c3h87?2uX=N+a4f^4r?`c)|x<0jK4b
zdD1op5PQtJ6_D5kWA-CHx)w<Xz5Vv8n1D4$LnIKK5@U8>nQ}PeADF^10I04)PG5PO
zZeA7=5~8RbVdQ#^eq`BceViG*^Wg6ON${U17$NO5etqfp{kXb)A>FeweVpklDftmp
zyLq?1Owdle>29?rgRo&lc_jBqZ+(5}=jA$)`UxB9P_m!$ydRx^al~AAv~=y@a2ZR;
zAVl?z+)P)uHO$;^4Q4d@J}!|NaHs*?FcMAt4i`t`-b6N#kuH7i(O0>6_o3IQ2&#9H
z<COTaxpKr#2FQcojPCf|2kHuCU!Gq*Tjmo!M<%PTQDHuC3fOoKSo>Kebj~JB(IKnQ
zCBL%AqHbynlAp{ZmH!`n<l;wdC{e5H>1vuR=_=eybKGz31}Q_o<3Q6?uHxW4B|}Fv
zE81|TdyI0cZR%;J#6+zI|BFofudFX${xtVS9JBSCd(9+dWn^Ta{Yh`APTy2_`g-C$
z_m+fxOJ4f(fJkhH@akE+Nvq-tZ&gs)-Nfe){nOX?+6<evk0>AvP-czb-R(9?WGUn_
z?JdYLts6A(2fbs8bWmU*pmZUx9Rtxf?{qL#rs}ag$47QmxZhX&S=UQ$AcBZmi7|jq
z(|K4n-Mv?o4cP$=I8iEx^zF<e(Evm9*dgtiRL>&|fWZIdUMqzQI-CzZLXANvC%nEt
zdB`GN&JKL;?*O*5)t#3?+d%#Btndj~rfID(?X!=fX6?<PF5ZEpTHrI*Def!Qg<YZQ
zC;A-yz}`pifoF0}^X3cOIVY8%3V!~;oFo^L&<YX2H(q1MjdMVCMlM=}+B*RT5>b<P
zEeKk+WKIl=&<~*UVAeI%5D0eq&>8_`K~%s?R>r`VBCOE!AHn_t`jprQlgN&01scv<
zCo_W!z{Z2`bML&L=3Xaar@=csHDAJu!pgRMo9~XE2EBl-ZxQ-RJ{AjBIgGHH%vwz<
z-lv$G2N?zIj~Kn~dC3{Hd{;$;Sqwenzy$mnfJTXQr_Uv@FNIZA27)bWKLr{lUJT(|
zXi^#Y%MjuGGj*VMu-eyZz~LQB7Z-VF*itB}imKnJzsV5it?tn<S6N;qDKs{zY?8p)
zPz9zF{i+deZHt79+^Dub9DiEM&(-iw!q4WKy?#@!bKmZM!!E+8zH2L;P^fQJNAZ|d
z#~4$z>8_uI<DV5^J*`sLl;SjqTGQ=v!7hGr@;OIcbv!wz7%EUNwQk}c?QSghaXZ2}
zSC(XWD$q3?9`<Vyq#d{eNO8HVOSN$ArhIR)U^&y>i10c=R^Bv2=RXe&3Y3xhjQ&cG
z{lqf^ns?+2{U1Yvd(uQUIckRvUOjl4Hl}6xXK*vHr#qjx$!45ns=S9uvsAF<wiC;V
zQ|RdfJ~%IMOPz`C&quoUH4n`NM6~j8-!u#(wjZ<{oM|#1jR}@+98?c2U21Q3D|k1X
zaq^A#*Ur5}fyM~)^_z{$k(*Uc<^-sUa=xyFfKs)yRJsv38@u}GO7}f0FV)8$&1PO|
z27Zv<MR~gevFs|b3f+;)Bu-xoRwk&tupRB~>U+2KjVspbi^?m4+N(`%Hdo9BI`{nQ
zhqbegMjMFLA2lVs0$bc{Xe&w9uY70bqiZ0VtH-6PN|RFgNZI1px5#NC<(_Nlk)}@Q
zhB2jc9ZKr{eGRck>WSB;_Lfdm*AYFg#GM~2`o9@gHT#>-FaB`&!-@wh{$ohkW`4Up
z_1Jgn6!L3-v{5tRn?;>7=)08D@V5$d$J(QD|G0srqW}rp+xdQ!1p9Fje=;Ra0cicM
zMw)N}u>L|-H?DC_?_ET=E~k)P?-%E(I#pnDUO`bwA6sx+q)-ib{#A#rI4=4jpv!^3
zC1K&_;o(tys4jW?2A3Q)S86PPGOOn)MTQS&cK_s<dkkKD?DtM&@$+v=qAygk0Q`KH
zH#ZCDxMfXhUg|8^IwB<OdT$p$tIXwoD}A2*i)<(-iOjoa%)19rAT!qyrv>|V!FPiu
zMLgC96)}&sR0WSsfPp;YDxiKW2E(AYU;Q9Zgl6)p`mItB+Nc6We23$~mu0hWAlwaZ
z=b(Zt*RL`+bI}Bag@tOsfE}lRKo4$i;pSVGCTL%&g&^o4U{(R0(edK0fxq0Hm(Y&S
z_aw{1_dhG*Y)AWKpO%cZWkq~&?G*R05zLOZ9hYY)P%okn3E5H~UFz0=IO{EJN}2=-
zJQK<Fow18_P~F{{yXA@1eES9<*Y<lWd|srLjek?-c4f*oY^*8cbgWx4kwd+z^r0fg
zR3|O}-gKpF)}C9MGlQgMa!OKu<qV+IOfVV2HdD=&S&inA4QMcDZ0Uo^o7P4)t9$|V
zK>xxU<W4TC#dA?g7ozl2Dx))0(A`u_L@Sm=P>q86H>wd7SgjYBtiN3qJUh1C<Pfe_
z#+5k3aX!w4KCP+Fu7V@dj*XHsPYmKnq`G6m_NvSs!t^!DpGUG1wD7T$|6O|hV@`*0
zz_b`O5e6#p=D{t%$byT=l0!iqzjqHFTU2+xVhh0+Yj5YMwo@THsggfa?3D;Fs<@BA
zWB!q28xPV|*zjQ5ohL-^RviC$6W+@PF2GQ{?wZBUic4i=cNx`bhDaGJE^N)Q$iAE}
zG4t6%F;@X6A6p~(p{cHzlY!Yt(PS8LW5E7Tjg!xD#5+<9C8b(YR1XEkp2o@c8$76S
zYAs82OrUHKOA!?YpeprK-vqR_0!27DC!6W9SVJ8+2xYFg<pYve%<mJVeJcfo6(KP_
zrBfDB!m}Uu>bggn8wTrMhfBORo)>`>g1TaxW_hTpLzT0G+<skW6mPjhc$UOV*y0{$
zScqElx~U11b|X5T;eCGc7(}aJ>vh0r-(tJZ$!FOZrp;Qc$#0tOjBn_00hRK1dqDic
zuDbV(1$DvHPx5Cn7vVhFxW2HFrA}D2&A|Fhui)~WXF?g|ibB=vsBqn&tnh6}`-!j5
z`TDKF8ke6t4AC>-=)O2?(1g8Wzt@&N#k}j2+7dc@3nY3x0i@**l`rHcWi|@6<#9XX
z8L=K7=0949e#+i2&Q^8(KUdRtF8u|b{CM$)3V+7lQNcckmREsGuT^5?@Zm#7n{4jn
zomll}ii=n>O*(fn{X2&8;$399<{l%Gxb1{8e~_)33acdIPP7`iS}mHzj0{UxH?Cn-
z;}WmMZ>-K#&XpUz+c#huzSlic1ot3v7ckKbXZbB*m_(N3NVcD<;Zx;iRWWQRytcCu
z31@b7O)^&ZQa?*ob;CA{*d);;IqI}n)bX$#$~{Jc&r<9oI?xg#0t&+x+Cr5uMl}_f
zlX->pR&Nrfn=aqJg)@vZ*o%BM^xD&;Gt;|pJRa<&7{yt-HUzTz6&?e*E}PQuNZAue
zZUp6V1#!NwbGah|8DA71H@05cZ~f>prNk^U@}(y>u{Leb`fOBUpkOogu6p;Z&nHDW
zd6s{=kiT5vtqhHfOmwhR42kgjcYx7r_u>&yt1I~SlJ?>od#47VCc`N<W*7fqPU#W?
zsr1qRA~uuqULbj*X*)!kGKl8DDj>o7=K8-x%M!xJklnQ)ms);506Sv?Uw)M;?%<Z#
zeBUiJ!DEeVWa&$rUPil3-4<;>BIrfq8y!M#pr8NG;XXLn=mKCyCs<L7<Ik2T41cyA
zAA)CN?)>GT*)%_}#2&Vc3>UxDcj_P5hFCV%zaRSo_UN^hAYHw|rF!y^V>^$gLmCIU
zf4=$iM5V_eR+?gaZQOkKCrDhNX-iaE<GMq<uC1_`7x4b7?>+wYX|`_>5MfAHTRfjy
zQsQI79V$GE^^6LSVqJVQRQdq0lika|i2oWd5r_~TN{KvN0;W<gY|y(0%hf&cnS>x9
zm(w0>OGFRpN?-!>e3C&l>V%tlxf$@02ZWFl-?c_A!HpKHms$ph7mga&RCgyMAOHH2
zl#+wnA|(hgzF`;iPYC<x+X8@DJk-Ik?42Wc@iqKX{vqN2p!Nb^`@eXy-I2^K+#SFH
zf7fACfL#8lG>Nmphn-JksYHK_#vXujT*OOLhf7#Q)mmm`c`AUrQx(6zx%Qvk@)9B0
zjSIV)fB)(FMeNO{BG}t*r@fOc!ufaX{E7!JGK@QjFaE0w@HZFh-=P<QH=AZV6|MfI
zno;XH5hgmIPTtV9H$JK-ZfRG_;Ks7NUo=hs@nK&Of(wjG;4<}E`uME49n*ul2d^~e
zRfWmx$#-{KSslmS_HoxQtVJ<tmGbr^^k)%Y7{<lZ{B3D-bQj;9-}19x*YO7~%l@1N
zn*4z6zyFY7ggGrZQm5|U@fxOkHp-sRM-_TH>-h=b8Xw$1o8`Y+)A$q_o;!in<CvbG
z;txsfJ>IsDmHvBi3%H#(EG}R2;@JPOhrdW3s%^Fldkyd&w|t0yz3&EKub*>BSFe%j
zUOWxpy#8QqyTsQQaCI;ffqxbg<L+N+?dt_<v+UIIK3Ga8uIA!U{`G*RIDriVz$!gT
z)2APSL!0x#H$e|*30l}>$^VY7!Dx#0KMw^jKJFDqFxs6%Uh3jmi4uT33eHXM@uup(
zrxthcuQrYU9e#vfM0V`_i-<1#>k?Xcv;N5b-#Z&h!ea&1L6-mR<bh8(i~(u@B8-%T
z(*s7}^<d;h380PVet7<V%1cntS0VWK3zPW~c?sGVdG+WYm$KLk2y+u&l$FWiR-L?X
z^9#TK4=2rf5n5+MLj~^QU*DF%d%#U#toOekzWn~f+y1W~=j1P}_hkE9yEXnFGw%V`
zdsF`Z%JKh7i2rg9{wjbfozRz+r7rm@{zUdJasx2L_20@3ce1s<aBf~0*1raL$_p<*
zx3$s7<6rmAyhz@P|KkMzfQA3#1ORpMPY(YdC&2sX|G9$wpG@#yl@k9?WCG`g)aKWV
zwkfCBH^%jW)lSpjRXveQYUQ`=2WyNuL@{%hxg^UQO9O`N{={xFijyZ8ebttA*wT{+
zW@7RN-waF*B&zD!s(5-P8Z2jD#>Nj1s|}RECq0;~=W`1TGddz~sqEQC=8b|NtykOc
zx{nDK>oplZy%OtW278gWkVPM_oL@Jv>$%w-M;3n`JK{K2DvID{WNgY;iga**u6MJM
zY=TmYr>d;i$c<}#oqsKK7bh67*5+HxOzIZvVnjcW6QpF`#itpLi!@`wrEP+2tXW_8
zFYa~s7{Sr;8GaT!C8kK?#x)L<4Ap5+6q^=#4j&sE8$a|}zgik~0Lu{HWU7TC$bmg_
zHt&yTau^NEP1=Q4l15!~0vz(yGsGSjc$TL=h^FiN@gs%`sHv%LI~@iCxmP^?OMHA@
zMXj*<GH*hGlCMeSH9i4E7@F_k3lWqJ3fk6dHoEq$rq^S7kJbYe>zC;_B3&3vIf`dL
zr~hsP{)-S2>9Bi?%k6wC^g)$VyF=-$A`+WK-;<``d_yaTUX~KKAa4Bax$5xxz1u-w
zFq`gA6$lRdUubo$^i1W}jfHr8`Mv$lT{G5DAWgaK1YsJgT0yggTFw-Q)Dt18`Oecs
z53pnp{eRVu8e%ypW2<|g@R;mB6c{pt9i7`5fAcQ3=6%s<>@Zf$WtTNzG>M*?v{rmt
zJH8v56_@~gr4vurOBkpdS^9M}*O`4-*ga|4goNCauHq104}EqYb;04$+Ie?M<wHl^
zc0%k_m%EEY*8MSSW4p-1u8`d}Azj|0-(3N|s(mb>iV~i!sOrrCe92aMQL>rP5Z%>C
zsp!psJu~OJcMpEe2+TQ>@VoJex^X6|q{txQhSn1$-`hT~6!gG8XO~k%9iaxEqrriL
zXWK5+sFbGybwP9U$TE#hk&o9KW@(Rvd*JZ+u=pZ4R{ETmNyMqDGiRdK5JsW7=4JMW
zfnr0+VY!+b(N!i&{FG@JB7kea_}jgX9fj}KYxktCxt)s^sW#P>hg)+bz>_XPA^t}s
z0q8^MJI3p&Xwzovl*Zn3SwM<s&)N!DT#Vp}*B9u$gDQ*GY6>$$wMj2AulH#8!RL}R
zK#9xAy95mCZ~4&Qg-iCeK3(YIfuCHO-urB)bZXFvw+-Ka&o%_Cch?`ImZGKa@x2`<
zoY;0<GSORG$C=&K`{2CZSTLl&bSQ#2=Pda&IRPv@?r__uL#o$07-US)K!Rr<iLE4a
zEDb|D>B3uY(Gr|B6Gtq!Cm|xcYwh~lmOks9+~j0i`!lh(oG>Ou+U4%D0SoeLu%0sx
zITS^GFGq#O^+694t(_2ShFqL5wf%0lO}fhk_VG$=N5EzE8hKZ)q2P2$>CAftq<UGy
zO&4Vv+XX|cLpW7u_gfMx$>_G#yf|7~@Z!C%;#OmGuLm&Nq7P!Z#=Ue8>j|uM@T`--
zcKcPm*>M|d7zR{=$SfXn%8ezHPTH6Ar*O#DPP}TD>Mq90D{X<jV0qtEC3>&9T1yY?
zpvn{1qA$n_IO^^^RAhq=QE!*{o--SqZ;^WrL(WbLegF1&bFZRtL2jZx;{>kHwJDx)
zckU$p(KD~VT7p1T>bXq2@~_-2yxGW1yLtP?OuH9%1ABJxEnptwzZJJBQY0KO&lrz-
z`a*U+lyV7=8LL;iN+Cfv2eGo|*!a9gR{nj|SZ!`5$fU~5_UosHptHyAB}K#z*lC~l
z!)387gT25$^SS2p!7_XK0o;{pPn#}7u1{tS4w0Xkq*d#jXI|8cf1f&c%PB#by}OeQ
zE+ty0lsbMVS*DpWsfOjaUY85eN|Q3`I1}v>Y&s};8^YfIF+yOSZ+`Wyx!CW?TBfBe
z`)a2b#hIlMf=}AE_%aiEOzXP>+A`}-`khnjop@WKH*<(~uNAmCl<*r+(|BM`bflwd
zQD?~Ay?nh;PqwC4<g0#fq!oOb1HKz%rll20A=24UqptWsPIgo!E41JK;irfh{U9aN
zIR`#K!!H7K7>)N<LA}lSDHq!et+EUlh}Ikc6`B_<He3Y~_p5g@LN@O6#vOxioW~~c
zQ9!TfQDBQ>?_y`%^?n<P9M}@HoJ(%6#zTJd?wkJL*BDke25@t27)2et%x7;CRQt$b
zSjL6bzo3}@!AwD*>9pjAYFGE4I(P&huonX%_g?VUot`xMX79r2gwLOutK^tDtZ>P+
zGyyOzbmpj$&Bohr3&sFa(x(}TzSf4_Oli#~T}=`+<<XKpX$%l3fV^$=*yIQ3p)X<a
zg>V34-;_lJ!VLyhT3+6UeyKsfIf%Y+^jm<VKN9<rKm<7YF(6f!)Y|e%`~?dDVdwD(
zAD_^_RUgqm^f~=d{Lle|_B=0)OxqyY2_s$IZ#(g0@i*~APde|HON;sq)h4M~ahXNb
ztggzr!muf3!mCd9BUL^*yqW}Okz?k!E2CU62PbVd-Cr0zPeQj~iX}!6TUQcU8MOZ;
z@52`)T@7{_PSIMBQ-I6P@)sWLj^N}Dnosbu-kNSVJc6Fo=~LrKCfWaNe`=zf_N&e>
zDl+z1Jlb1wcm1G%YuP?MciWadQFdz7ArrR<JmV0pnF@3>gRq3GKOx2p5C!LTp0a@h
z_w#1XWgjE$qeSZ|p6y(_=sZ8;J5P-dKeE;p%cG@^O0*f;sr!>U8#GT)l+x#eb+{_^
z-q<to`ucjTEx}nbq67X31g$qV^Jpg?%n4uuhA=@|QjF)3f6^tDw{H3aJ0;FM+k=c|
zeX&9*$JjqH8w&tWyI3CsmGW7u#aj2KD<+<;Jud0GEbmIjNWnDA8I0arX+E6c^#`wB
zy`m@+glp@Y07r{s`YYTr8(GS<bKX53Pfx$?vsoT(bFe`?>Y0y{HP;@54o#*Uzefvk
zsw}brqR3Dh4;r=~l3F-m`X9;Y`^&vg=!-H{9bRW*<M3}G7E{T0r4NQnt1R1jOD))e
z3;q&*yS}42Nm<@v8&jPTtL?Fk9r7l|m~eXSZBm*HZ0>8ec2W@$oZaYa7KA5Oe7h;-
zjd-rAUTX0P8Iu#O+HsIUBX~Gfn7fa7j3FxxY!9bfsto<8QlQ4ewkdsfYI<}QO=f6;
zzTvBekm~&KrOElJE=aJs)Z+R5h;!W^Z0mfN+RYaL%Jtm!wtv>yLT3;JreIR{(r|ia
zu=nysFek?c^P2BOz~r(Zb{h93AhUm<D-yz25)75-^XP+}M*T@M+9n(xSTDVOrnTnG
z!J|QN)|-)1<uY@nOB>WV0s-G+3vyvHljAcso^U&viJlA$>JPb`k9wOCK63(Oo~48_
za%g5A$C;h2opJ1H+nK$DI5z|#2RAB9?9B3Q7v7mD+NvEh-Vp?VA}?eIBys+Pyw6OB
z2xGAy;5a<?o8=hmXnoAJABt|N?cX>1?%I6R0Wa{W?huaI-c<-FnyEDTi50c~#u5Rb
zD)emK>ZzBo67peDX94f7vhI{8Oq~6eUn&#QBrn&#ZaTfke>KA|GbH6u^dd(m{(Ct(
z(%wx~;%RqJPr^?x3G0Xn&2{%0jOhGo@=25-8=mWK6a84-yTLaT{bYPgjFj+rYRgCA
zp^&Gsm9O`BIW@<c)LyG;)vI~k(%zwHgn+85>gX|6Ix5x`#$;8_`Ynj0K|%495}e5W
z`dm*fACkm7!Uxa8B3LZA77nUGPyq^h{>pBAG#3GT+5ht0v84yF42zrn0hA4!x9qiH
zF3n9jnIsoD(<402WdEA%NuO5dftapgxkVm(wO~ynaHO*nM#fnvr9f=;=i}F9HrVr%
zdLyv2Xs41cu-(}PZWJcP0PMG&oQ<{^06q6u?N_>zKC9(0QbMh3ILd^3nkC@cydPFO
zb$o5TE2G}R-023s-WNv)wVwO-)*4;YADEW@7T8B?AOp^Xg`|VvbR%1qZFw(R0R)ze
zBmez<Ld~EMG+*$I=-^otv~LZ2T_QWrOk%t2TMB6W_R;1`#{D7JQ6=<^C|!^uwhASB
zqB86?nNdRLpA~-vwL|p-+b$m_#-;kh2X<d#PO15Xr_Vj3Zb0<PmQVPrKA~BTBwq`*
z3*v?0-wVqfk0y@p6n>|SFYHU^fV3P{wm>>rq4K(VdYhXIWweSixWgex*X}Z3`Aqr*
zPC>NfB<DczJurhG<@$p$prA9>&w}dy<rbgc?-MV5^EEN>S%sQv)X@+^AqsgEWt-|C
zDbvP{v7dtO70Cx;=m8SfBwhnv@d%1?6lr8VV*hIfE(_k5q{%!vIn{0)W+VgiK?yVZ
zBJ@TDbxZZ*I$3Y)rq2v?$X_@rFm41m>Jy^#Q^#<BOqY?NUVvsZdMj<Izz9(fKI93%
za9H0<2!CAl>HQKJ8AP$3=}}(+a!N(bL<VNv<>s?KA+m8kV_4DPmc21mkzo3|7zx`u
zM?UoFe&Z-@cOb2LbSfX-(pNuwreAn233qU{(7r!#9?q)(>O;ugxT_J5mA*~=Fv?Os
z=S2#@h$Jwsw^%A4LVpk4R+mAOAVdzZF#Vc2bQ!^c_E^K^;eD5Uo1HkDT}-vBiDD#^
z$d@UX^Jw#OPQYV}|Mpl)AiGL@`KlL3^c~5lHWWdP54>W^(|cE!sXqwd#oQ^WJO2*M
zCtTRYwR3+h0;1dnf_<(&7%B6)!RX&+^8m|KD%VWtdxqXEoMQQwhX4n5iB^G;2cB42
zs(#!#lJf{t9XpzgZ((YU%(w+iA60j*(gwcSoHV{-{;JUY;P(v>yu`q<Y_loU?4Ac|
zxDKAq*Gpo!^GO}~$DA7k-OU^ciF$gvl;<^}gU&dkw~=HaIO~W^TlT3%L^25*n}<f%
zbD!i@c#-0HVD<~=)FE@4sWbmLi~F*)ylkq0^E=}jJ=*O;&c+l(B$@i`q%Zyngrm&t
z4se5x=!w|9Xnl}YM!7}qLv>)rBqOliw&#uL?kAVQMjIjH7SH#m4_vC~5~Ny`9ygpE
zFb%7_C46SI$rOXh(DXpsA3AlE`RuNvSWQN1Tm$B|(#n%MD`0CDe2}k%$GgV@HLnI}
ze74%XHmuH@-8B>1u8ZCu-R8kw0)jEgUA8+wK|Ou%VPfzsCDb+5*Z6Ed2y7^=kbwYc
zBac+n4Grt2bD`u#N!yU{gfHl;2oMyMPC8WyaG{of&NH73aLX@W8Hh2{d(%R|u}-(K
zt2pBE?W)KB7QXHLG+uq-MV!z($G*(aF2<sRum;34x^&BrOpvB$Cbdp1m0d=NQ%>o~
z^BF<E(|I<wR_HD;FS6HuNTz2qiJ2I*!9}^P{v=TeA*XW^kEn`EO1cN+v<hZP<9f;Y
z!@T^lflzfQP1r1MwK^`PQoSZ7V08wUkotIVb1TC#Oqr!wqr|Y-GD*}ZJ$4<^;*eeA
z$RyeLO{m*u#@FLZ_O6MYSGx(or~((OaGFzce@cXj-!l?+p1tch<{HBlkvI|H_;WEP
z4Uz~5KPG+34&(7KbeS?9hNe&WAp~mX0#vlMsm$d-c?2Zaat0$A@FcQPs>QEcwIw?2
z$)AQj`Ywv~Y1hQ<-)JtLY($}j#CO!}y`GAt*`{;8T8EKu_50mliiHYv@_Yxg17~7R
zy+s}hd38Zx(MEEowQd-lP&JgHz=HEF-9Cj+V^U~b=1pEPIfQgj-<P%OmF{B?rUHvI
zvF_e0ZcqE#<WF;|Z#cuv+cImQ)46+)MqndOKQz*y;5*^*;JLu?X7*WoI+Ku>4Nx$f
zTCeRIRJ}M;@_RYyHS6D2Kn7^ay?(0|1I%dx?`%tnyMNZn8|54QC+*mBi)u}lzzs#m
zm}AAd7uc&&-sYknll(rYO|5d@4&_@9x#q<+z`e8xWd2WI2_ReSXy<CG(g4jHcTXI!
zBM~qnM+qQxe-72XkHQn4YX1<P{{_47KtnJrR8{lE0?$3xd!5WfE&YK>kY@rZDJl4F
zt|#>|xuR0^-E2fgJO`gako0F3K0v@zf3o5G{2t?*`AdGLkS|HWvy2mlQ`FJi=40-r
zZtm`i5!1*XQzxT=)=%Vge3JuM5{p+K-=G?^%qxsOKa+z<?=AIzvZOFS*dpPu9$d2b
zHCPC<I5~^9TAD(4JlmhDb>tbd@QJP6I<0;^WIHer&n{40Ts+upycoldY|D>%N6KU(
z5rn#Cq;h6SF3Ryn)ld{a*YKH4iPNDDF1DX4X(Jg3+j5;g?AqNa0-LU&NY}Af8-CK$
zh@a`}u=gh&Gzgl>K)}h9*}ZA7b75J<fUM`rbdXF#1D0lNVvM`DD*5V|>o|8Ci*K)G
zQGmLtzX9jzlVhh}Ub|E1poxijQ1b+_j$sYx6fMwJb}O}u7@6s!7%Kw4{YrRb@yQ}4
zK0h>knibl7bZ~DMTQgyJ@RP(Vmcl^VmZu_k*5`9Vhbx;^mT3v>(wmtChLR*wy_u32
z^aDbRJ-h_QYG~QmeLG+#w^!p4a2<v}qGvtAv12S_8vRTZY7`yw8kICX8;Gusk#OHM
z(uE4;?*)l$2gH7jVTk-oA`{jTRkeU`?78bNY(wvZUuI4xz3J9piW%VYsXkGzf8m=h
zc(yy={!(--{4}SbjA!vZ<ub1JEe}Cr^t7~fz|q_v*2C;9l5EtCXuHQ4B^z1UFCS;o
z>aNiCJ5rmeIfNTP#U1MfSY8Q#MPz4AyDcsQxTUP5o}mTdF{RYG?zt}YY7dS5=R*EW
zed%PMqy1>>@^G1(_VxoMDbwEjcj!W(x#ndd$s*UGh{@5b9{Cpa?L1Brn_m_S#s-ud
z4Qh8`hrVBcDXu4uEdeKn0LpWjVg%<heDi4Q<N@AVH^pkLS7T7}-QfUJdClX)+R!mG
z>q8ekrFGT|v<=ux!X|qQM8F(!3Voq9bv|GB(@4#VE@YZt^Q{q3P20S#P%qc*dMIS)
zRdFWwrP8zrz+K!<=1TLS$CIJ%JgPtyi>>oxsf60*j){9X@G+#jH|m!f8n`C@cIyk!
z>P{@5+Jsho$C#~6+k*kIVL~~t?)glV%28qD!E2y-k6FsMPN{zx#%yfy!}*2cKf3^u
z5M_Z(Pr&1;QdUvT2P>V1L-^wMTa$|}jG25z#*Q8z^I#$T@2yS;ZVNtv1mz^HSw719
zo(?3DZZiL1&j>W?-V7xO8f?Kz9=IJa+4}%?&cgvcm4%o@1io$1JE^M*=+s1o+((Y7
zJZ0v{29Y7`kFRR&1k5XpM=1gtlL)G1E{$NoN)*)9@Ett$md{5PQ>TU-fEK{L{t=W0
zUoGzJ<kDY|v;RVOlhR($-IqONaN@~v-pQC#IC?yG06<Li!{)X4KXmh0Tm^mR6a=zB
z8%n&s_S-k?j^t8uUX-?u5telBX$Fvxa6$of%{!y_I<7YChVK>R(TLL88J8>UMN93(
z30xfk@svHQHN0E;Y3D9Y&Xy5O;nk2wl1c(^!sg6Pw(MT-gJQqU)9nPT)Un)M&C||q
zDeQ*c(zbllM<cQc7ReRLquo;0@@6p)N4TVy8G~+x2#rrNElYwZAD?=i)5Kl)a1u#J
zR2sKB1E?O$uy$BUVZ1|p(YHt7`}WABA9{T-9(8(w>XNKs<jXbp)&Vw+45_c&K+u;O
z3%SYoLS9)JJyn!6tP6G^0|V8h^zPKa!}TJ>#>~qHp7kyyzbn@j3qE$kI2-*>CsY`*
zNY17-W!7fNUtoM78LgPQLn*cEuX63IDG#<A0W?2`fwn7xKJz2k&7=bWd#2oio|%+7
z6&=&`&a`D#5g&+HcvaRoOi1KQFN*A=BZ^p?#Pj(lmF#i!Zj&VtRnM(I`XElHc+oxj
z?s3F<Tu)m4#0nj9nW*UjpADcRGP3=8xrxIcyg=wHeJB-h3AJ~w4r#gPzQXS&nYnND
zONvoy(3i1qt&L_sqe5Jt_z?Q?4R?eBU@BqcJ_V|HQ+e~3so*We*hvu(Wg-}QM!mcL
z0J?%s`3SN9V|;o3S9}>~bG}x@$#Pe;eT-SGCb3iy_Km8<fLE@i;b#d2lJ{p)SU-#E
zrA^v?5nY`RrA83TedC;WDv`HNR9YGz7XYx|V1s;<oDOg?3JmBh>a@2GOe^A)uA%Ua
z1Fr1DJnqEk=4>_cg<D5)0QpGRJ$dCIR_qvUiliO%jjphRtS_;%KQ)8EZ5TSoj??Ny
zlg_3E(9IqZ4+bJe4M8THPZmmbc9SNfjZNxZ1jkBMFt*^{ui?>>Z$kAe(j7`Z=4-O8
zjNlsjXO&gBIy>@thL&fr()DiXgx8emCNeAKd-g2F`9wsFq_pJ%T7HGgumU^0#gDv}
zJF|k~A<9v8)uFQ<?}sZ4hGuQs!9?lEE6$>XzCk@;AJda28k?Y!UlYCq)a|Yf^W??P
za%7%5JNca_c(p6owXAf%)ipYbCRe4)w~c(G$7N{()IykBBl)stk_#9IgHp8?-`es$
z<IV$TPDx3DTywF#+Ip$DwIQU*@|o7AfHGEMy0${_8Gx<&GNNosqxAH*oM;1G9@_vy
zT|@T$#R88~`n#pSi|PGw4-d4Aixjqje*M{GoxSmrl;>BKCa>wU<e9DSR!wl8favP_
zp75w{2@JI8Poc!oxOrS$IzI$<R{1ndxU+jq=YS-Awy(m<a4TTW-qGNsuE`a2sH;|>
z*0t`X^7!J}ffktX_|;{M>ve&$bn*HhNJBs_L^<Q-=>51(60dfvB-=?5J(SW3v`23T
z^vdhu1drB`($<@e`-$2XxUIEmXa?rVE)~j=Ph{FZ%fK85^?tr8FzTBN9csXBd-#K&
zP}f-jjaWOof{*GAd`8sys}sf~KQF}ql3*;CnB{-j2`_^jF!L`Keejj`pa=rTF8%p<
z<d!3zEJ4hOwBN>Vh*B(Z(XknVDv2-y3Rab#OSB8%pv^n>H{?&T%fDG|YG}At3&02q
zx7JGK_DRL!L~&M^4A1VJLDVV-#ir}Z#?kI16YJ!_Dv9|cnMThw>k+@zoh0i>UmsZz
z0F$>27n{RPC~<qggdkG`zKcEs&j%I?c7ys_Y`pe<U#?djDIo@lj;FlfGnw;RoI5H1
z|JZx)s3zBKeRPSqP*D*SSW;D*bOizFC?HKhdM8SiE?o#AR-_0>7Z4)7g%Vn52`U|=
z_ZpQ>fJjMzgpm6M_Zj!>z0bI3{qDH`-TjAgFbH4XeBXTMeC9KsIo}zzQ@afbVD4x4
zr9GzH@iHs-q?S(7x4S$3>M%Rbm2V$cD7a{lGY9V-9GyChq;g|I1y=#=%NEay{_)1w
zrcT$1l%wCAtlXhrE3JR$=*DWGow(8ETN%hl2nC=TXKIlyEecO5y>4RN7=Sw5@41tD
z^Ra8z&uu~!5n0Db*Pf=lj7y*X6Xb$Y34m?0w^?LwNsyEFysnWAXFURy?7qc4JFK)x
zP4WSVMPb(U7n6c$eFv{Ch$o$gscAqb>%^{E4;2!Z1fRqY?O()i*V!^{Wkiogtq-ys
zGtTPQ0Y*~oP16wX_a^>ujXRuO$=gcf>Xls!-u(&S%q8=yc(G%Vq*m(xL5A!yxoxuD
zI$S<QYS>J>J5=jW50)R&24*>NLy1xr=#V_eul3F_JN1{b4zXRn_Y0y6&@N_{tAO_u
zuW}ZzXn_8Vlefv)XeQ4&OE|7QD4C1X;1U6fisP2ht<gY7fSDa5CYgN{=bT2?jI~hi
z@QilwGz{DAr+YyMB0~yEa=;uepKYy<ut4@on<1LuWox|R>R+o6>;Cs-#E<_DWEf5?
zr`-Qp<h9ny^avYlduRL#xW%a8{ru;Xa@}nw`_Gm$Rc^d9<<N(Sb{_2jBu#JOEkcU5
z-`jCpNL;n>{oVbG_DmD|xY8DP%+7bnD?ZWE;MTdhXQWF9&QtCs>)Seg261F;=c`x+
zZiFZN+cSV}+!tNAJTm9k;y9EYlwhu!)5HNNe7hM#{|Jc2U5e;PIn}n;=Gz%#01CRY
z)yxeq{sA%+F2l`~`;rP9+xOJlR3Fm<#j4W}JB3VW01BfG+Z5Zb*#A(vPgHz{?r9(M
zo<c^|e6v55);RNjLThN@96AR&sIJ@%3QPcxxAJPZzJ>;d!%+H2upS3|5f}v=$)HzO
zx6o7=Alr6BrZ5~|YOe;5ow7J{S*~7*G=eHq?E9#wZyU6sS^~%f!hEKCDTuM=qk!te
zeSmT!9s~G(Mbty?664oI4ddKkRIagJoB(%2)x!+UD_+gY*7*-oA2YjLTgzdXE6cu`
zf4|suF{%3bQJjEnvPsF9IfUV%__^JO;uk9Zdy?C(`lxT_O{L3Da-j)yf6HvLDJb2f
z0I1MZ>PP!&X=^8|jt1QtGn`wNlOgdxNaM#r?|c=CS)L(xW4SxOS?rV&QTlhZiG&C)
z#N2wIvs1nTWe7}V*M+g+Esb5WCyA*)CG<1qpN4w#&Aczjgc>D_SUNdk#RsZAC$0JQ
zGR0(N8(T`k+@bL6B&<5Arm9cmFXs(QDMw5|>Af}esi(yC$|KRl^mJhg%JGB8*sN+<
zLW95S^fdfgET9Yk`~DP&0@6_%<Q+&D3<6T<$lqx=3dY|9vv<&M=v`3X%0Qs!@;AQj
zwMoj4+yXLJfO@rHe45D~#s0!}+A?#w;R(EMxl6JCNe7+d+|^@plKFpi$){HUb!GeQ
z`dlu4^8Sw3HokL^aMZUBjprC8Uj)mC<iTloC7pT`%s}E7lik=i>vw{wa*R6JF#<q*
zEVjfpSC1vcCoB|c;NpSlNNR8^)6^E@>KQy%+PtxmoLrJ?&_ZMkR0M<*LCdHgrWV+-
z-o-FCvDz^i&nb~T#b57g%1$NgE8NK)_<#l^1P6~t%uD)!HcYW&mZF1L1;{vp)>6ke
zT<O*^cmF)k@k#A1^M=B*Hjr8#7uk+5ZUK8+A^6W_-y)ZfnXjA2%$FA9v+a5rht;2p
zrh$Po!8NztABu05_3T))_G)roJF1oEMwD1T3x&$=e<E*qEO$5H*%x2Dg;iB~vWMi|
z_8j><7gHkvX$LAfy|JaPHQ15(EY-5u(cF>lj%b+3{e?M|gVt-^GGXGAlaoHvHnCH2
zYdH4cgb`zL-PS5==rGDuiY)(qwPQ1;Ai}0V0ZK2+!{GMn2p0jiCL=s<3NHehbhEPk
zy~vDt(#v_09cP8_vS>W3ZRmJ$K6yN0t;ey?t#W8LV;^l^rCOf=n26RZeC5^8iv5a-
z^~-`^f&V*Bx;Y+q#t+7&|838Vzo`|K!yU4&Zna(-2<OR!1&#>{b$c0xbINJ2g^NSq
zV?tq%7WW?BBc0HGin9*80Pc=q37Pk2)e&Zvt-TX9H~w9ot5V(1azBuoJ6Kxc-*2*r
z+6wiff7Mbs#sj**X^@ygIaD)adt!fK#|w}f@LM*PmD9okZw%%boy(%%{p+pbVUxR|
zT@Z>R&^=H#59dABaJ2K9sb1X3E)ey)YHV<s8@%lZo>7lBCryTXZ3K;w-EPg-nAzS~
zeH`LHIpR{aP>NI@En(7neh?Q)Bo#2-UsKlzS1Q`OHP!$mI}H6FWX<M6_9Vf2!*0e2
z01+g%Yxlg06FYY-{1HB`EAy#eWn|2%&4Ty)Z^e*OS?A*4(5G0A);!t_E1}bhV$oGi
z1I8-ZWCjy-r!`i5m#8(sqAGwm4_c~6=Eg=ofKFVa3rk#$W(1M1+P5FNECwo8B%Et_
zs*)w=m=u?kB&xazwhq7vh4VsdBg3G%k&!rS^gmK>;Sx`joX_6IxLj0DnZWf=;<1=}
zX&pGIUZQw2agb}ATJoos*#Tq=blpPcKBio?c!Q%)#({y#;=;bI;#mlzBR<W4d%~!E
zV*I}I$I$HEb?+ygS=MRjOBmLdY0-ZHe|GB+1M8mv<8ARg5uAByFSvf$;wPnb<>m!|
zB7t~+;HZhDY7+`S+<5)3!e6Qw_seg2G$z)a{Mq5_!s@k_4+{Qi0L-xp0%k?TTh<WN
zoRuFnU!cPMYxo=wxJ{!imx0~-%t!0Sw3y(zN{dS_Q@L@xfEEYH=pCoNSpdvuPuXw|
zDN9=gnvE(o)7DlgC#BtVNo%6~IE``@r7B^PMbiP@j3^%ukI|B-xrkfRug@ZuulGL>
zq~}@I6!VwN7>c?!c})!0entW8^p&Ugm0e2L^|gy{=os@7VwKqi*^T`kqgD{-jcVmV
z7oXn0Fy?>3;Af{NT|lxFb}TAJ$!n=uH=V@?#ROt;?CR=@(|`p_y@u6hdC%Vm!ttdd
z%bLoS8(qH3Zzal%khL?u9sbuEeE{ZF+CzkMiUM9296Thv%cu<Mak7Bh(%vMbwNvU3
zLsmz!N+)^o*Qn|4hZt(QD=J765qVk%YrRaUeAqO9Ay%Y(dX+U55JhPl3g>ll_;1>j
z^`$Q@-n8L5YP&!t5e5Z7aX^Gyv2)2j#9yPsiHoMoFmrZ6wntJWj>@|NxGfdR)pr-`
z54V6~g4%&n6^FN)jI8EC&1L-8Ij>^(pRLdban|5bl|`J@<TSz*n23Ny>tK-&$ICJ{
z#8*~WmurhLMph$UuhpZHr+jnvV3v9D=j!oObv&C`X^}-$z#}Qm?B%0=lFqjJ1ox5G
zN!75>wF8+A@zs@-Tsi+4vtnbdq|~aVo;!G^q^%typCcric~#goZ&iK^0v=A~Lm+;V
znC3OGD^#QV{1%)EP^m}aZ-y%QsR3za|L>{g+3mJJAfVmh6!OJ*R*(7D^Re-v0)$A@
zyoad~c5c~Oti>0T5tO41lSHCX(m;c@rWOzl{5xRL`+Dly6k!MMIO*M2`6cDXc8$`a
zJj^LNnJl~tJ3p=B5fJAQvRRR>g=Z6y$))i6=v#67P<C-1^uCh9^xW9Xp7io&V?!h1
z$)K&WCy!UBaSSOg!%MBBYEjGL?0(6&4M~1tdM8kl7!RB2kX7}Qx#&o-Z$G`Ltk{)P
z$7QqJ)4W30M*<St>%|O!Au4X$BUiTjz%6*!Z;Oec9o^nS!KJ=~&0flY27&3ju8)(3
z^|%trj_(r#rSd^*cizV<v7qMNpH+EL!B;A7=w#CbqsoW&MKAaNRo!_sb3#BEl*y*=
zzm_Nol(S^@KigJ-LqK16Nwa&ar*U$`!*8iOIb1cC3d;LoJ=thlTT8SNdl)WCPVw@Q
z&L5bLtcPj9bLmplN6trqGl5nWaeAsFh=}={B=<G`w;CDrg6}E@_j2uX_q-K(64m;L
zuD5Jm%I}WNfhGX#2y-!9eGR`ho?t}e63&pX6*exD3{%{0f`gD>gc`RRqVi07mKd?j
zd`22}6ig><J+x&yU~R;dTK`r5QO;;<yg4l&=+sT(hF<eEsXm--40t<{!?T2aLS)SZ
zHyD@OispW+zXhlexAB3>%#q*AniZa|sxM#GQNXQ3sR`h4e{;{*H#!-Ugoc<*47u~w
zVx4`1#=FS<gA`0pd2<XB`?frHypaF=i1%>C<C89B*GIT>uV2-OEc<IN#shcUW0FVh
zF&T=#{*dYVJ$oIkOsw`jmGTYCQgrtA0R^29w8O$KsX7GAe9)#02kT6aiQe1JV9$>|
zMV~wo=dN3Sl=jU)gX4MuL4M95=sKrNXl2O3M(j0E&0yH-jrHY^L6OW!=)$n%*UxQn
zRk=`lbvBJsODUkT(lAtKpgM`P(Qz3rR?l@^2ucLve$J&!SF3(OzHCF9$+rydAKh$t
z-#<J)rU>Q|6Ucb#XFcwl_d~u{nLPw{?e5y|-nPSd04M<ZA)o##-Xp$24J|4GspA*&
z_aq3SfeHS+4L}{WE9`vwsPmGraGV*03j6A(YFu_qEecu>(vj{-3k#QvOeBFc!Siy;
z_fOX6DS^vrtCfzzrKS10Y=WdH{(VfHca?|@LVIYqSgU7AS4Sbff`wFW)odW`K9jBX
zA;`5aX~jmptsH1DX8rZ})qhhJ6ajt4Th>TPNh3g7E1W*k<5piUYuGrZwAPl>5TBXJ
zBBM<P2a>~dE8P!-0Gclukhp3_U$2e@Yw#HxkW!OezfIwcA5un*l~6%d{F&Rbwuhp|
z_x4x$PXLJ%?f1cIss_FLJPI|xF)it^HN;%$W>z~=V%0+|HUmU20YM7Fjz0jWw)L%b
z&WsL&-0KY*&{%Kt<=j&M3dg(9z)*G=wg2ak%G3R)|L1SCFa9sO<^S~m{HF=-xaaPF
z?xOr#659VX!MXe|W$OPl!TqNb^tdzi|9vNDX}NA6piYcVukEhgnC4Sd)Lk1bV)j-5
zCNRF)7B+>O-w;=5sg5$0$&~v+uH4X5*_ml_Y;*?(6vrDG<{G?eh)+zsjCk=FCqh-r
zu23vqs#CjSbM8^KDx1+j*7_wKs5tyus^-1_8Yg@va+i@hxAW7tg-q}7Btpd_4?xR>
z;bMW`1*&LG_S6?y(Fn#MY7K(_?-5=NY4A6zRFz?)ug}7#lX6-aQ&KkAwU>N4X5CG1
zbkr#FD-id+LjOym-@5yfy`g$Ze1K$e>PO~g;?ssu)RfQ6t+zUSd}!$&XVANNV2~s*
z4_2#K55H!Tr`njjMllUQ+omEPMF5G~Wdm3D`u&%~s@)&iy_zX+q?U3T0u#nW(`BO+
zYHUXiZnx{hWc5u;Eu1~Lrgxrd>CN#t^>=k84K^RS6tigKIXHYrvfga-IIf_NKJFt$
ztgG*B@A#+|8<!cX$0+Rn;WAeJSQ9<nWcolax!9ycvjbwKT|n@-H&yXN|F~EW^fzC-
zYiUWFok9Ah1PE%na*HG#7K`!OWW%&=f%Dk$1Wy}z?MOL>q}`V|VY$I)5KP}U8wto#
zh()bWG$82C3(<63RJGKi!$WgZDuEK~jU868q)|8NaHR{tCtmMOij`Y=9>a)jw1}a$
zN2B?l<L2+&aHH`=do6uDRe3Li+g`Lc?RI5fI%17Ej{{?N+47YCJRZ_Om^p}Y{PA;f
zEpOLjEpIUrpla8Ao*=~x8%?9%bNbG*zI+vJ2q><Ff#!S<#v5z6{WhKCp09ku4&*S=
zG4i16nypbuvTm+UK>(BJ#Qp1a09+du?hauYPjML}y|bWqC~G(x9*-<4O3Dq*Nb~uA
zf-^Vl>=IM|SAReYNSKqO=01I||89H6;dt)qnCdRTa;!^;zVsYyLZCcMcW)`L0hP4g
z2Hp6A*952f{jWz(HLb%yXGG69COU3rws8Yp^GFV)o+Cr~Ga=q+;oERb3Q(i9@^{aw
zVQMiO8T^*Cq$C~~i)t_gYK{x9ZD;xT@>F)8(65+SRBt`AQ2`|$R6mkEf?FW(qDhb8
z8NPFqWZoJ>J}`KizzL)yp%us$Ga=&#@pqSDY?(Gs<az81Lh_bIg1%YAEsR>r#+IB+
zyt(z6JT<+Mv6Gf)eA6q~w%7ZUaQ?Vv%8>xK74O{~)JanXRq7`E^LT84&MOtTFKiCz
zs$gH7HfUxI{-Ke=S701(MB)-%bs5DwMTh`%bRUaE;->Rxf3-9p8U&Q2T>Y9Nx7H&K
z0dq57k4csAs6E{2U;kA+7LZhIvIrm6KV8I)$nI{XPPf1S`r0c@xsG?Qrr}7BcX5@j
zCST}l2HjnXZF%K3S6XsR1P!mC%QfqAZ=m(}6r9#+Et>q)TQfL@=P$YpW=Ghx`@^DN
zCK&>TChYhb9JHr?zzNGhS%tDm>W!7n{uP&YVfPbsuMu+VmR-&ri7kk?3K6Mouw*17
z7$e@(-JL9c{|NqiN1mQNfAbdiF!}pMs6`#qI3(`Fdsc1g$c>SPY%gl9OI%Lg@?S(6
zzq^_-m!3vS;~(wT9)L822eERaut&4Cio<MPK~aBPdgJLCo*H_n#3dPnk|jUc53Cff
z`o4dg1DJ$Md=|R=ijwLYz^41u(@dy6at>B2E-&2UIt#QJt`=T@H(s3T=^<`~whTS+
z$j;3(Ng5_?FzT{r`2#JHxn}(>>x$U70tqI&k2n=U;<F6_$z<cpf+$+`V=MXd2*=$^
zZ0SdzXS^H+$T#n$i`mG@rCVW>MtV+X$X5#{;=T<mx5X+`=9HFpIsBhsEY-cs+)RcI
zUO=zN+m02b+$M5hRN16&bdJCA+$o-Z2m6H-vB^h2{FFQ&%y~_hU8Z8}U|#<p`YKq}
znr_Lw?4HZ5wzsgD>d^63*4n9(@(<Mym&<ysYP+A|nbJZ}tiXr$-ghS%={URxjK&@?
z8q#hQw}VFe1#H{f`50Ma*J9Rkr;_j{C`GYn%9{k4?)>p~-K!LP1D}xp06CT}B^q80
zZ+6JpSuT<eo;2fR(BKIERI^E-J09X908}Q~$|vU?+Jfz9?GDh3!egC8U90Px4rJo_
z+Pb6GOEK|(;<0LQvylfOAcKeq{|pYCe^cf#EcA-=My^puz)+sAyhXEj72j7(t$%v(
zs)B`>!k$A>Vd(J68>|xjNoe=;-*Pa)SAwV4#UhFFwitm!$8``314MD4!O<Q+ikOwq
zfh4sx8Rz4)0+gHFB5t+pwZ&Ez?i7K=V#G;@B``ITx_?|bT4BI=s*n<h>x+w6v%F;w
z4%?M219w8Ye=$CtWz~DVq4{6RGL1Bk?PDp~zl<AD0jB(<XZNXlrBm>_Pf=w?w7YuR
zaB%eVnAS8vg@6hn9t4`M0V7!7$Oo{5Z={r(i_TMs)5Rc58sgTaf-ZM_g|;}rH6&ze
z1XPV>KeG>H+s<vla6$MQ2`o&bji@DIj0=__qL5pK){X5-5Tbel3uL1B;~b?90>
zJSDrY0O7UHod7iJI>sl)+i8#(SO>%nXz-v=POmc}Vsg04!_}Irt%8z{?ceH6)A@DT
zI=4DF7!l+E<~$|ch|3u|@F4Q{VJ~=!sHL>mbq#L+@G3#9(s936RS(Hgw0zRO?mfTW
z)l6R)i{X>IZ;ra#Ey&<$ko+KcoN;Xz*Hp~+4BfHE46&ugkU0$)#D3#@;pS}O&HPkU
zm6nln*X|Wx5k%`}UwuTV)xyF;w~X?k5UJL~1$F1KnW^yoaF}I%<wu$Cyv_z$0MNL`
z>!1dd%c!H!u3zOT`9S*<sGZxSvnEqTD;k{M@2zUCFVB-A-#z#VeBLr>v}W$Qe`x{F
z4H$SSg3z}sHU0}|F{;&9TKx;)Nb+m?0Ou4AIH%v2)V>1!)F|GE+fS`x1ynaRxn&Jz
zE7o)56}PV5Nl}+o7oVk~4*4i1%MQR|%J1x07=vn`Zb@7rk$8Iwe|_d4Ug=L3oz7co
zK4CK>vfMzO-l0cxcSnlK<YZKRllz~9WD`24SJDgm+QOHkpU&k1?@Kh_lX!ugV}G2=
zs;lC)4r&NVI#h6Ks<{HRM+D!z9hk*ivVvmG9PanCFOZAe7oeQok2Pa#O}||%j)N!|
z`UE)Z)U1s<JdfNg$vJGVYGtxykNe1?dO?n2T+#zbB;<$(6W&I^@e$Dtls?XB&GD0R
zQ-g;OEG%-j`j*#fu!|&vW($7KqHGs3fQZ}_tyPrG)TaSnthkkj#g83Bg1xKGo^ji1
zpVSTq&M#3%7QflH@5MTUj&59;uGQ&b(N@8nJOR1(T&bI?Pwo26&hcKv)#El8(20jl
z)~iE#ul#14RpTB2B9&!i6s^?##V2U5qpy71joYJg+27TdGuVE<+Qk8+AyFG@sD1GM
zRg$<1o4<YnB~^4dzqgjy0HCy-u{LUT{YNu^LOIR?0m>G`+Qo8-Tw~~3%=a~b#2Jg*
zNyZKP9<;1rN>6v6XB&yT6ss)c5Zo)ZcWbT3gGetQ{G&mfmXSSA6Cl$gpRP_NsThQI
zVD-?P_!0m)7yylQVkh;Kuh}*4qbv6yPS<CastVEW3w!o}!y0%b?8Lp5Z@t&1<BBU=
zrZVR4AO5$>9;=|2K@I~0yM8){t{;o%GlNsRefrA;S+qu${+wQ_w8qhab29S}v#2Q<
zuQ`4S`$0m@G+7QOJbPjNvgb=|fJhb|r+rlk`h^J$YRFNe-Azv{1%*mZG0nOd*fvCJ
z=kd@uIXhZNb3xbR#^_I!{h4BTS7E29IezPhGsZHTa6fuYYp<oDyMX6x_C+A<P*Ro5
z@(&e_Tnkr-WPPQwPE+~iYWugf0J0-Tj%ZW|*%Wa3KytVORslKcTdke^Q$HDmUn!%H
zJwQv(G<CXQ%bV(b+MkMhr2to$VHH{v;73Rmc%uf3bp|@9iCd3^2IU4rFqiqBQ8dnA
zg!%b|Pe6W%7kywwOjWyxDPD->vIuI2A4qs_@4m+{#r^s6Sl^-vOayXka?<B@T40V=
zX+nz|mQPMLF1F}vSb`?$W4qaGxiQP4n1W^Jqpx{urz*R~=vPnb;Y3G)wxCtFy-kiF
ziamb&gJqw52`o3?v~sL|v+Cxrf^(;jCn9D_e0YiSVcj~48GpKqLh0W>yc$$5TM1nz
z_zb+@<dJCEOG4o!Fa3~)spB1~nE+mXIlSdUHCn}q7%Q{bAZ}|oLZ4QC3+PtpNBr9;
zDyj;QaPN3l4&6pYEWaE*w;S-F8&DCR<Jm#>g9e)!I(2t~yW*L*d%P~eg*vz(b+_H7
z1}qfUf}er<x+fb0do)^_6PiA9OcsnO`2=HZO}&A(LFIP+xS*Y+tDuPGer1vaz@*j^
zM+{bFJSX$7vmgW0F8bThTRHXF7G9r<^mE0?@ydCQgfX6-PwfX$KJZ4dh$cjKb@^m6
zy>)VSZalj}`FK-z>6^`?XvsW7z7o%PrfXwmN&FcE4<1qDg}o<HzIqvq7jkO6lT(96
zVZECpSvB}aZXGc;fNsM{I6J${>SHIN4^pvt{y25{^Eh=eq#8nRCQ`GVf=BWel^2`?
z!t)^7Yb!n}J}HBbG%}$fSL?;+GD@%Z#IyDXFdA>YOI#SUysKJ(m)CP0dw`4{Xl76{
z`T1eCn?c%RNF_#o>2#yWP&X^)P{c~wBjUg?)fcvp*5vJy1hzdOt8ifqAKz1-qSQ6#
zch3YxscXQLDR6XL@#}>jq<c@*W^M>$3IfZTE4P6SU;)w@25HIv91t5S)1^Py?7%qm
zrr`~nLpfzvUn|C~)^A4Ladb$g0qQk^DtSF0Xzj=`<KnCy6V(>do>M{z1$~vRJH%5n
zCki;lO-f9?Hvk)qY!|zsg>jbiPw&s(m%x@3wlvo?a11oZIuw`Zidi=eHDJtDXJ5JJ
zZ3araKOA3|u<P~*sfjq;r>Z_!zqDR=JO-~!(n9~!Os5x*E*_6H`%7ax)1Z~7PP!(F
z=M%Tg5AIa?z%0Ho^vaB494Lc9i1_hS_V9SQF#pT<b1+G^%t>hV$mvq-Xh~l7$3Vf0
zmbe){c4^OK3ttwkO$suQ`@4a$+sO{hWv0`*4WCX27*|{kKXnRmHS!d@^uzMt(uu7|
zAH)xJMtZ`wjhcvg#mmT-XV0=St1}uHUp7!vxypa-wF*<S>?`Mq*>(4HcL`rYGthIF
zD!K6yliHI$8MODHjUT)>pe8MTW>@YCAJR7SoLngsUfgC=prL8V9x#oJ@|%P#*OBTx
zE|x1pk@0-_mRgtAa-g{nEgR;fUWA6>Uxo3FF|e=4;_Y9!3m@Ez{+g#e+hB>GZ9$>4
zAi+ez4ox!gAlU2xk7Uknemef<)cNhw`HgH=^}Q0Ki??#Po@73o`Qe>l!4qIV_?9Ma
zoaW4~(t7S6W`e0u(vn3^Qa|#(Xn#2fbA)unuhskzMIMPNbh2gX@nzLR!Xcg#R^4vG
zgh{AZ(_t;S{X=OfZ8&<2-LA5#%5k;<FEJTB{5h;rqS0^-_tu_Bm^1tmUXMvGPYlGQ
zd!!H)o`NQWIxa9;xm)lOJP?n>YX3lp*D|=F&hTC$WoN8TvSO++Wuv3P!V|V*(_el9
zAGq~e%~hDNnpXH%VdxElnMs~aZs=htde~4o^3K6N&&R>#QSD7qHQTTs{YBD{=(jDN
zQ%nc)wgO+VkkRk#8r*|M+odmf?SLyG{G`iEx+V%@{wh&Uh;UpZ{p|9BJTmh^>dAK@
zqgcGko_0b5CmzeM`aeXzkN;({N&2d2?!)@aYTdWo#m>zStocd*TU6;ql|N3<{_{%?
zt>!0z7juR5Q?3u1USkIc`SB_sYeOONW<m@EkhWJaEmF8p&U0o_4o8Pxyakz3UvVxS
zQ&>PyhWJKa7X}~Q7M^Ult6Ay)L@~R!L#Nubi-wvO^<C>)wPjjKv54>+KGMrI0xW!>
zG^&+7TG0|^G6|R6S$Nx~JY6Ec(U8MYfw3io2vH(NVOcpB118Ecc2{efA(7^1cGcVX
zOvy?q8}il2`!;ifbGCe(Xho0Yq>#EkTcv~7=%G6Amcr5V8^cw4@_ko|KpqPIM2&3{
z4*Gh7HCVBbxdCKy-HqfS)6CWImF)_AMEjXFStBdskL=o=wfvYb1)isNTUc%AnO16O
zjml}dj;3Wu^Wt!scOu?;jlI$y4k?^+ns1Uq2&>EVc_A%-l1e#FmdZS<YZJ7CwJggS
zSt0aIzR%Z#WX~|J;ZEQKUPS7$Z!{Dk5rr}%)o$Zc+GV&aHE5v|25mg}la=|sY26WI
zhNy-NF<yepnfxtUs)?Axid8BR;@b*qT;G$%3ntr~EtFrDIg_of;8fS61dPFZkYaw<
zRt&NLa-+nwv<CXk)-hVsYgS=0$#~DSV^`69<a8sk1p-Tcl;(ND4%F~QHndPB8`_~C
zY@e2RImvx;w841-HQYCZ!fxKeFlnt%-&>M4OW1>K5hYX2^Z&$uI69(ybj8YmSZ)`J
z)3bz%Lk|%LZ+F)kjqseV)eL)(LE{@y{NIritfetsiK~S7DzJBK)7PK>L38@*KfQ#V
zey^fWgSwVdIsDH2%y{2@Xn$_JN_ha}3me`O;!@<dUJ=a^tjR!nB6lm;*^L&HN#|G7
z)6_&X<<>`K+Q#|-BPr~oxn@*=yhIEfFvlknWR>xBOJ8R(XA(BOtQ0s9LAX5y%?w#G
zk)QlD{$;k*Y`->8`e31|d@<dtIWXB|J8*e6ARa<kcMvd>6aM)vu}r*5<FG2TUkmpN
z93E_*uqI#%?fWQY7HYX&VuQR?%1Gzy<Fh`Tn4H{|Zsa_%)3K*Kv)vPA^%gkV*fBeJ
z6p{2A0YWM|GL*~?Dgi#~LGv8Yis|cI#T|NR5elkrw-pl<L?p=1Fs-OwI>MhQhWkRF
z)M&-N$L#&e94hm0L#4TVrllI0$Nz0)ds{Q7Oe^sW1eeB5kLZSJ$DYDQzOmS^{A6-Y
z#WS95CX(HrwMUzhO_Uc4`NrA?O}eyY#E$7_kEv=z(#7G)U{dcMpp0~#oQuSvO7CzV
z7(hw-!5(SkoLhLA_96iSa1=rWBrZ~<@ytcijKhsRq4)0VQ3@CVm}teOZ|Ft5>W^Xl
zP1gD;|I~?PZTs@V-U*qFSClTGbe#L?vFeql?%brq9rWSY!QE8iiOJ6=AQ@n1WSTE#
znO`-in5GqNyf`6l@xu5h#%vD^3PowMh}*it%G9Hrd}apUwkt>>#Q9@KjMsJYl>K|N
z+bRcS@YOEEhD3{3=t6EQY`@VZOa=4_Csx;SX3s?w*awF!q@SZQbHTG*Oe^zR2(Ev1
zQnVLuK739a%(SB02nWVyXw*uL(h?6qP=Ot^`IFd?z*?!7S!}mfP9=qSK=dk@YSX3M
z?E1?^MUux09w3+Hafp(niQ2b{uuiBS4WwGl4M|qjV3(U8IeJ`PF-|Jv-6$}oLE+DE
z-UXGL`5yt3Y8)rMgfke)Y!*BRoKQcnt}3QAH`1jNWqgC$n%`G%4NXbm`kQ0U@lryL
z5mIuFa04*CC~W*_bC}#<6+swti_3uk=*NL+1@GMs3?Vsmj6PRtTi?{|e?jTX<pBne
z--gzwai#~Tv%DlPn6@;@eePw2Oz!KkA3zjIj9y$c{fe&z{)J|hd|irwJmzq*8Gyh;
za|=S@tk|5RWV3mk6D5P=miN$f<(J?Rt(3k-Z6u_aGP`y3E!J^Wyk|qTm=>J$g!|Zq
zv<8c+tPe9iaI;jQG=Avx&LPj1C!Cl@dI`VXQ@R@0GBJIT#FW3?l(jkk1fh?*wVr2I
zFtr>WVl}ZQ^+sZG;|d|YX(m*G#X@$IbY0z?a9w46C%XgPbvk!Duu17?9CLWpR~ht3
zoGb9#V?e)Ugesm&oG^>#6+LB3G%~p%k<6R|ubTTnEVCJZA%IVK`SQ=l_)xEQj)TQ<
zjQ!Dv_ayX92^PE4`=W%lLf3mG$H6K*D*B(})N$CV`W>v`!j`;aul71?^V3v7p3wy2
z4875M3myv&$Ft4clb5|U6&`je6DE?BE<MR`<IhaL#DwoG7Ac*J#=tJ+_Tz9x#Ut$#
z&9=j0H2sFoK=QQa!{Q2RQ)DdtGk3aD2&ZwypQh0^xjmcm8ne<FZxF<tgOq})2&TAY
zGfG*K*Tf^%<?(W_*gC&=qxzm6qa^HG{VgW9%+SzCWA~{WK?es^N?~QTB_9ZYFhrTC
zRQ4}DdH?sX7$#)a>qKZZRFp#orTAai>fFQ&y<cyJtlcG6?>S8uaE7#R^-at9DcYtg
z*hC(QBtN4N7)jOU!~%pJ2ws(vVg-dY)g9mxj>y3}CGU~Bg=DARQ~_m?qe-P!u14H-
z(#G^;rv8F*D_SjaB5a~V>b=+t2Yb*0hD@X@M$Fx2F5PTJKM`6LjAACC$(sTP`@`bu
zv(p*g-Gie-7v<#0D%f73EkJ?RcF7JR0c>=K>IrF+6XMX05?|m<6|GFj<4Oqe6&&fb
zX@^oA-cVilO(?4ODJK`XGF|B@E-qduTDC>fsmhKJABSjQ>9(`D$xaQyK|wxapO2`v
zT#uulfAmHDvlpU2FYOE~mKsZLUSa<qV#(6)SR!k-vy|K#{EKUH%=psEsJAT?d(y%!
zIsiEz!<k!Ap*dDYHp-5cpfu|*_XJ|dPhe9XYE5`-k3-iG#vyjL_MKCvHVsOy%c$R?
ze4!Nn{vR>8s-K+*6Et!*KSOcL7~D}ES5F_0NJ7|dv3oS93F+i3<7IVp#(Sd5-MO-U
zox^55MB|@oLPnYcn?*=Aa@Af1GXD8l<;pR8H@ATBPlaI9q)pV`W~F|LUZ3~wgW@y0
zZeuK6>|SVR?j<0}jQ5zX8GP%&cJl=Jm%3RxZLsK<+cq?aqYZY-x*OruZW$PN4eUQT
zT69lcJx@V#Fu2nb61<K~Sw~}I`Wl`{QlFX>C|P^msOEz#N%CN|0F>RnKQK|#LfFVN
z>)+HeQSgJ>feihw)Z9Xd=QK>SM*BxWvXZJUbsKY3D-|6=bl2%eA7Db@6MOUVpoJC-
zn3kTW;*}60VpQlBfO!^3+{v1ETf(xLR_bvj_toyQoeGDzv@Q<Rs;ppsAOKJA)nV-j
z!LWMVj2<{46SFz3Gga-$Xp}O+n$R)atwxeeGADE=?&Wq8V;W4bOGC|GxQbx({+hgD
zL)q;mE1A&?S@?Oh_`COSE}m#^L%%Q1yInG^N(0djS%3X+K;ks5)v>#O1vzC_4uR9*
z;;g`0pD1%|U;JyO;!A?VK`wl7EB#fzDPbRBVd2I4l(||B5wm5poJd@4&xN5%bxDIR
zj^;yPOxL#~>!af0M6TJ=g*LtP1Xd&6Pq3{)Ym4oj@&F@wbDjb2kVi5_X5wbjCdQo<
zc<W18vb${o6NN$cY0t_McgTJOTwFLom0=QemTd&NXNCt)v7JYCPX#)=`4wl5-7u*k
zYvn8Z&(1KpI6)Qqwc-1dq2?plPn$pnibh3gXF_*oV{_{YCu}e1HjH<i%MeP5NSI3o
ze0+d+$3|@&8N4of{$9);da>ST(Y33{nJ?&LEninlDQMJxJHrH74-%<HRaI6le60HO
zb!PIx^D`@N#T%x02i(r&uQEL)A@wu#JHp`W9IMcgYXRpB7h%w?=ny>qx|DE1=Cj1x
z?&gpB8_91cmidjU7Pss$FW+E#Di?);o>GRy;QD$3<`R7~c`%ecrdVs?bPu3_Pb_B*
zbvCQCX&f8ctH{(c`!JDm+v5JF%6d<yXZi5`jz~y@-5Yg2pv`M|z3mc_TMTHeA1q-?
zV<IuxZ8sUfCki%`_#cF{pqJ+ymp2wak@vj&%#54#Y%>lsA<8JLf(!@BCiv_g<N||a
z%~h54l2Z%kl+-1l9a!4c3^<MyY))ZWvcPB*^>deu11iM6Bz#_8_9k7w?9P5&b}PD0
zP0-{0186=|&+a3xVxO#6ui!-c=q6eJe4FI~TxO2cOA@eI64lQF@kD)0eA1B$DiV_H
z!T*x@06%{I;{?-+)+Yv{<6&yjVL`%IW2=vDQ`#zh#71x6`0I2@?K-v>5d7Lba4#r5
zuwvQdYvmD#udz5VsjJ@hotz27Wq$MW_R(dxnOwxjkV8fTq)ASsevos1#$Tl}oqY(V
zIpd#X3~VMiXlzC0?VU56o)KfgU}O=St~p<znfug=yPd#+nY&N&C^lGMxgG{k<r9uT
z@lj&6CQ!N@$ze>Br!8j2vp&61)g7}jKCM;fcOfw>)qx~w$qd-rlK8&f5~O}$Qau$I
zK_QOS9-Hj?%T@h4&&`sJ$Vi=qXrxn^Y>85DcVB$Bt`&T`+U1%C_oU8-9n`Nm(lL#U
zq<~ECg`;Ce?ytRY!o4CSb&iXADbY~QM?MeT&&KM|pn#M@>;w`@8aa^mD1N^T%4|5m
zh+r|Wd@CtL=%EQ877pzh(Gd7JNq_4INLF6VKQ@s-lz$@*j_)MQO>rRMXyaQ}coehd
zI$L%1QK-Q!D<})4+E}SFv~W2D4%w~MOO+ZfG~khS{2Z61J_<mcQOz6S7q1f3pI3Yc
zcwvsvhaEa&>3X=o9ZuLP_<l#kryyms9+t<-@DbWBX?s8<5c(NE0KIAQ8%&573?BOG
z&!K!1NnycVeT(L~$QNT8<fjL@_6$|?*Y_aOXDCH{K!PNC*ZI3kJXt=pT?1x$(pAJa
zcN;s7#2wsg=3cM$VqL8y_4P@6O13J=q>l6?Z1fx3Pg>#ns{h<Iw>PVPoD()?C5!E{
zbTbb2XQ)fU*AC6cuJTN-W!`LmOG5v32VQv!K(kE&QJxHEc5V44x&Ix@p8llrWGKHF
zZ8=6U0wtFONty73GN&X?io&tHD!|>NzXkdD38{hPF)H9b!ucL-b>!VjZ(h!9>_VF|
zp@>bty5$LlI*5Qf1R&?oW`QoFEC6|{5b5D;>Dz}H_6n~J&v?1+egdVGp4PE8iXZ{~
z`teF*ojBLrXXMmf;%z|$6Z`0mZAkD&dDNw}WUrYg(b9)SaPxX;5iJnkGq2hFdXC_y
zv91w3t`6-C&QK?T-nW@*eAhV!!BCe*|B`{9)x84Kut6cFG)><zmyS2}#p4$JmBg$G
zzOoV2f6W4L^;&6$u4$a2BTN_ttkl_5tKJu#e!|z?f3ToKI^np27-<)hg<?>FzH>J|
zF?=GKh+~V0ajL+<+qvpHr4AHNuy$x@rfu8pPc)%XQlTaKDvhJ#qcM0dSaDsX>hK%|
z21kT)<SDPw$!7#i&T*BRq_m|ok$#@xYgU?^*ds+MFQ8Iko&3Uc^4wTlL`J}jUhpPn
zlo&mh{5pI9dG5~i{ZxZ4=7I|=?2fw67!l$#ukxM(p^2?|RKPkaFYRJDD``X)ZLymZ
zA`ys&H2BhGd>C?xfCwVmW&|fE3NGZ|S37#PNmF$0z`Kt4*vA*kwN}`|P#I5)oKf}0
zuqMEgq;7min$IJNBUk;~Ifas%=b^*{)>L`ibg!})kwjN}Ru6(Kn7cPQNQ}8P$bb+x
zC~B<*awa1x!PAvmrIf&@Q_5|$;`TW*snkjeY3Hc#d^71;%@SHX^Py9@jOf@36+cam
zOO<N;E3fn79CP>sqHzxq$~)k^qJFn(Sm;yeyX^Z%lNFD1Zo3RUOta(}FW9N-V@nF?
zol@RtUB5qeqh?EKjY5H%1E)&B)q2LpZq&N+1{*2AdDCWSY06(}d3z_ZqU@;ju<A($
z92t|8kl~@6IFv(5chzY8Ne_gj;GTvfL^5VA$L7NrT4j|eAy^rzmgq))qC=Jkv2)vj
zf)h>PwjOQ!A3wSaCrhQw%=CICYxPfljn!VK-+Saz^&Ddtjah5)kGBA@=Po`l=-@sn
z(<HihdZ;0Vp8UhSy2=N`s{5ugjp>&ae9H>r+MPPjEAR-4L<W}@B8`Cw2oJX5w8W`>
zfKDs;=q_S(<`>lbRd^vzz+^k577uY0;@%_~8c0I9hwY-N8*~ZOSbg!|cW5F1C-g%G
z^2$Px6yFOa<FKILv4e>fNZoe1j$`jJ^^t$}BI&_~#nc-rg89y`0>I%c4(jDT8v~Z4
zRNmL1$U6W|a)ADO?78}!hIb%p#NW{V4{`S5chn19JWdSKNByZ^t(xBG_>X*n<k;=d
zl-oBrE%}&jdGgyvHRNxpQy=<GjnCEQIRKJE$&TL;z5B0raDtYJ<?4$}TH<SQ7HKu=
zZ#B)S>4*G#m2$oh$GH20kjlDbjk60YmCkvd{s*F8H_YewvyF~jnH&|R<4oeojQ_?S
zzWC!TmGOc6A#Qd274~hZ*JkFUrZ&G<XYzc)*|mR2?D%>zC+uM9=NA8Q>wx$i<Uh7?
z?ZsRPFNx=$h@|6poVa|v@IP#8jjsUf{)M7OC1C)~CqIg$-mXW*z*0vt^K6da?MVYT
z>?_^JYka^A5T841aOzz#(<1!a<~Tu1b3=tj@yzatCifx<>Z1c6<MKo*E(d0S96vuh
zSdpSm<8cx?0}yqd5{bua{2&AnVauZy$hWk?<?-vW{{wdYO;wzHHfiWcz0@8J@kdnI
zjWfHJF9nZpaS^aoBXDxSHR^Y+`%Tdtukoe{H8Cow`hN-?f1KIn9iaPFnb%EyTDW8W
z(%_g{`o|*+hvXAPHtta$_0vmN3H4nMV}9Q)U~|FDoT+FCrCq5^UCBSM{i4cmH1yq3
zCy9C+G1M*Hkp2IiwI`@>f9^>ZqTWU{btn0$ACn;ecw|=zsZ&+e^v8E!_c?%9Rb~Hi
zw?d;Jwi*5ag}o=#b@Xq`ey;MzDJq4n^gKn><Ua7VL&QIEqgNsU;_*KQ{vQMXZ&v;v
z1OJZ)2VCC&A3V5QND`}vH7|BNMGJucKsT?)J1_C`YM<4paSj>%JI>)~n3<Ed4_HBy
zbZbo=WkVI8K9las($JiK#&VSq#J}*z75>i<P?-OnUMWK$j5{EQ3U32|XDGZUi?NXJ
z7~u5&t@zz;7W6B~totXQ&f?lN*3PbzG16#M)_FJ)D=sJ`hKNeL?RrC2RyG^Zg@PWZ
zI669ZNpI9%n0*sO8zM;c<=t_|zWlq*r(B1OUB%G%kWXjyXN2W9CI(4&-F}^Jtz>Im
zc=&?pD&bUdV<DV@whlLs?x#z+X7cL>z*V2_+`J;7vd%+roKg3B^ok6mXH0(!)6AEA
z>|#h5(KKegaK&kFtEXR)-vjCC5!()ZMv+{v1c+=2NVji0=;ZC2`_v%sdFFSJpF4G!
zsiH5kGuOd!?E`>h9}(DV%H&UMlIn0JjU};?<B5MD%JX?;_3}?&B!xp#eM-}3^r(1o
z?0><F#}RaFUkDboxd<GuQSP()=GEf27bjhFQHzW0KsS1g;Xs8-nv{njPsf9fyIkbv
z0>`hu<(&l1sh%qRIWL$UnJ97Xg%al!hhzqI#Y%Mlwc@i;k&7QrI8W0B|ICtijGYbG
z3I+5I6;2*m#wI2}FMcoIbTC#+h}+IW$aUTRB>=r%+vc9H5quv*QZk{Wg*zfRc2SPl
zG0{9*Pfxh6%{Zg5jf*+sO(5a^Ecb40tX`$T4wNAy@&d3RCKbB`6)N8!q(1z2@ZWvY
z`s{4O%+&qJCh4GJxFu@L#lFBMFtH_=o411#^7^*tOsAl}!+pL#^g`Vlnhw{jDxY;3
zI<rbeg2y3pJ$%ay$uXR@{@n=~^^o0H+dY+-pPOSSH&$87$6lV!j_GILzw0cHJN7I#
zeL1-ZOh&De0pLU?8<u>7YJCmAt?zw<%Hzif1v~P<8acIU1DUYG!|A6YBX7zTG;u9H
zBcl|^rHh;2VA5~tIQ6FrfI<#TYW@l#ToLHGrU=$FW$M~(t$e*Q*{K46;1?O%39i;x
zIrku|;f`_V&GsDh6-n{m(kV3}hf8$M{=lB?`Yx%L7z!cr;#(x`@>Dw?d<F>F6F8M(
zkTA_E07sd*_eOSrIkGz&qnuM-!ZPPjBOb#a7DJY=B)m<!B1Q$NHS*L_%KrwMO1({N
zJ@~#cG#<oMsJ-sIU+Xq)xygn1TCK3LJA=b&kM{rvYm953J`~x0__(K~3}qanNc>e%
zsm7{z2j5horivsJ)+!qnBnSb>QN4p9P;%Gm@;O8bh4jm&5@7q*gP2x0uRGE3Qtzcu
z!tqXipZ58y7di#&c^G?{g}I(fg>MKGGH*ilK>q0i%x?5i3o&4>c#Ep#Fc!0P<wuk<
z31TffFvg%@s-cs{&La18Pbx3KNaoJvmlmDQ1$bpngh-`F$@t~&fyc<Mz^D|pGM{9y
z-?UZxJ2pMIpW276%YY%~@7~^cU~-ic(O)VC3aNQ0hVrSaYOom2-(D)2&scPD+V7LR
zB3j#f``EV~{jJSdCqyA7Hv&`x#dpg89tAx#ru~89(pA2_IwStk;fosgp$KUsu-<7x
z6U-Y38L(B{OMvW6>O@9HmKv-Uyx~LZb5K;iMjQ~IxduOio#@ME3mVv{0vFgU<g=GO
zwc1G357{~&^nFl3y~cN2SYM9kuXq*Q#aoxI9%n46$DaJf!YS#*lpdE?V%~Ns!3o`6
z0=o&sgM-SagA9+AS>%@rTNc`}Vo~7u?d@ovpDq+XJNOiEY$>kF*}1DUMVLEu7opf)
zrZh0=oXN|Y8JKMAm%-Fy?P4Bx0&rgERvgj*k~AMj8e;Cb$6kb%l-pSE`3UY2%aHH-
zKCGWu3J2HXpw`zJ6bXqtrXQlj|KfcG_uo=#?S6I-&JYi%WHeFgHrRWg@_|XA?A_hc
zou78f-!C?o`$%i;f{mTuzQ2OrIrrre%Zt;%eMg6{@u3Q-m4P9@^?%7ws6Wzzepd#d
z%yf;XvUo;|liz_C#8#`ZOL60)K9gbRC5V|F3mL1D3tzw*+T$p~!?s(>FmtUvGcwi`
zoK9}o<m2(;5{hP%@*@b^G}|8e&)*QZRiR&g(qTb&To!vN)u0@tw9uKbp&K~s0uI{V
z0y9mDE=jZ6Dm`EcL23TUfzc1M-O_iq0?hjCznFE?=LKYbPvI?wN%>-#N`-@!SwNt|
zv#ioA3cA+f#U=U%%F=a-AvW1m)ank_uJ=JOUbKGsg@790$vL0-(Mtbx)5qz`hpn_h
zPCrWmQnjaG(gzk@-Q8!W`F&oPvj~3m;Rmusi6W$nTP4kE9nQ#KQ$vK_V_IJ)x!Ypd
z#)Y-$*+GTBJ{$2q3x0mXsFb^YwI9A`>m7Q!wC8$3Yqut2@+%RQb$TD1!JZ#|t}sEp
zWKWUd5XO87bIvNsl|~U06n3lfxr!9^Ik+-Es8j*6Tq5s}iDORVpQ(kLcYhb;>tbHb
zgk9n8i(`l9D&tqd&%DOtrcx+q!>JmNgr`Q%A-6S_`mC;+*%BFwQqrwFnt|zKlWeK0
zLX8SZblPvmGzlF56*mWpo&b+;$e7A&NSp$;e=bF9d7^PfaSh|65?j`{iC|ih@tER`
zLQ@R3x3}R2yGVovPe6dfpD*N&%jwLT)N(qbrtSAkx>AR5Gid?UnVY*3s~B8`E1f~k
zuQFlLB%ndv#EP}#5#eL~P!8CvtGBnPHZ}4VikP{U*u49Vr&71EG-I*z%5V1qkU2fo
zTm>kg%8f<qk7n`PTR5cKez>jPu5<`$+>e<qOHsYB##kRQL-}<lD0Il7@vyCcJJ|#2
zV&%bZqXHjcdZ5b)<g`Nx)jXUutM4FLc=BOXxnrjkr8a8hDmUL4B#SLVDG4V(dKYjz
z#wkIx#q>Z(G%0`V!$<Wz0?X}V|DNnVX9Q@Y1QoB=HyprJ{Oxw*E4~=}0D9t{ytU_F
z!7imWOTUhs!?pFyV1cCu{_IjBn)@@&Vpd`&>AcFY2o3IQEoHM3YmdItotb>PR(-_>
zTZjngqVsCLdT<cbH#I;TO#Y=4T}k;_V&u@*vGZ|b<Xv%(R0`-3-^e(<u=9x*Q!G>p
zEa-RQu4(&dUo>Ztoa(#I>BScCW>+ygaGOrcJ9fZac60F7kV^`uO{|)TZ{B0|FaYUD
z<mR|IY14$(<Dyu5uCuesW#d-jWHkFvHfnfY&+-7TpyMk0GdI0-c}z{`bFO{|oX_*X
ztE2iQDo;W*#{)AR9oZLltHhH`O2(%=g4SOc_>h0e!+H0!6ECeC^huVcoT8Iap)x4K
zMSq7ukt*({XAz61e|xTK+W6ssN<Nz4H)8N~cyPu3&yV)X4-GpqiNxWdT<@IM`c*59
zZQHR?Z>OeV@++6?zt2cA&B;uKwcLLf5Ad|WJoXFk<78}DYqg%xK(NWZrMw3%i_Mp8
z&rS3DWtsJp9Y#vibya&(H9kpG2^)ysZ^9;?^%=1~WigHdZl6O)Q=&n{9tm0U$7_0T
z=G(OGQdQd?gaK$tqI%vX;2w>?KPJUpB+C6;Ys%bvI<BB0F{RB9Jc~p(v6vaP`_Vz>
z{LNCmVzBM)XD)Maml_Yh69_|{n^Nika@W=$it#%=a(}&%bR@8_I6hZd0tG^q&+I5`
z#1UgP*K3~1+N})dN;`L$3qZC*Y{`FzZ7DS{nX7h5*j)n`5A!FfgtiP^%LWE?9ta9r
z2tZ=F9boq|+=z+G@p7{Tu-+8m^2W)zWh(qP(AbT~gn|UwrQP3i%6SSzCup`~9@>gQ
zh#5}Y*nD<)+#3d*M?aSGntuQ*A!SnTxEb_4bf`|tK6QKPwndXeQ5A90+ujje!WD9{
zP?#DAVX*&-gZD0pkIb=VK$AcE6C>g?l9CR;FwNvtRG53#lerH3=0d=+T(g8^um)zK
zK?d<HDUA6F6-a#Q%P-QRA8CVtDiI=<ImuRg&jesWaaC){Kg_xqAs4)pO%CN(tLZnm
zoxCtvC<W32xvv3m6^;NB;Rj6n!HW76ptbPpK=(JBUsWx;^4JV?zHVz~pKb$Z#IP>;
zSxiUjMJ7&R*kAprwGmbC)YP!{cWBl5;=_g4tP2ra{qh^G%^vdgyI;TfR3vd^Cgm@D
zUKY?zCUJ8)!z7acF+S{;RTxIDy~uarovUgrnGmNV_7^XHXNSk^t!RIyq*>V9K6m4K
zuNkb;7BR!?4ymRkvX?hLh>=~p=`5f0&YN(`EGoFSl32LV{l)p?0^Iq}f8Fh$02CfJ
zchgYmU|q-AIcXpi!E7He8AMm`t>+yvy$<gF3T|t315gkOGbj_PcaoC>Jgk5@#WTFq
zHD1fXXYEpj&kIXvKA%Xro1trD#H6_gfsLCljTLH@qxtp}e!Z@;j8=mJeFj})9+q9Y
zJh<dl?r*i@(I_m-DjJvB7Z4|T9K&>h0%7VvRQ0tCn$<|iTH{yAzWN8i*(YvhlsE*k
z$JQnQxs2i;*vW8~D?c6M@$#7XH2OQlr<+3(caYsn1;wq=irON^G4aNI>&ZZv*yBZ8
z))CcwqrRpIt#eI#eT+cWLrII1fEUDdXY4630dE1o(1&TSce2;XD`2jq@%$zpo4qv=
zhB>fRjs1Q80p({nO}A;qVvoHU`tqJvvC+sLy5C5m-*x)oa}^J2S)Um4n{3VH{}g&d
z%5P$0`yhq>>xHK)*GN{%X>7b}Z>?;V)-)W~IvnF*F9bM+Su>$dGu*Ejd#*2<_o)F0
zm!BZ#p=WwEV-I3$Zvn6UuK@8ly>Oxg`dMLR_rw^(^q+4_W38{6-jA$s|F1l5l|@ry
zz0qxb9ymS1YuZHF_xskE3h(lr-d|}d{ehVm_#{uOQAzbE%P!utROg^i6RrF2Y|;s%
z-vX^fx5?K5g=VxE2xVT6>7}O;%$BYb2qV0`X>Ve`m5mF?qvkg?7NTV^HGxKFHe=tB
zV;ux!hscMgFx^ruo|lql=9)1-d=?(R)l44~b)br~-TDf)7ly@UN2gp!7bG?jjeIgP
z9fHG>CMG663*OF?9rZuscO1TVk?}&#Y=A6`>d^Ir`Yc%GB(YH6#fBg08kNc`&pmxo
zlIr^DUNkUK<JiGJ;+V~+%1T39sBeS9;l5G8%xT4;`d4~!&~sb>Eir1ZyAt5JW6#Yd
zAl_uH_`){25<I0v&a>|zcs8E>?Lw$vq2fY8y&ydR7W#EWqDDUeP<wm7&e`#&j+fdj
zoSI{Nm1NM#2|HylUUJVa57-GbVgM9-MrTO2yj0jVA+xtrz7UxuGwE-pyp;B<6%`MI
zEmya>Q9+qp;<u|8skH%dSH6TBBS6Zmbmq47ae?KZOEM1_sU?&DtGz1^r*doi*@gxx
zDwGrwj-kvX(=IY)o@Ygy$dEb1#%_{~VVfdkW*ak)4I)F5dDbBF6zwfG`PTF3ocDBi
z-*etSzw3Ja;j*vCe%5;Kb+3E)-M@Q1o?3Y*tpN=U4NeDDwA#td1?RRsU$gBJ+=ewy
zRue@u_KulK2};GYiVjH(h}A#)JRdP9?shXOB9@bfE9$9qV48)$UCx|{!;gy<v)Lb2
zSAFd(R6Uuz{hr~h=zNxIjBobW&Az5*mpI}|_EGlmq)cduS#Ql)Ex+hYC*P%{9@xW~
zZ+W<C%E(AuL`I_Tr6&QmoLl@XLc^2wOkz6rYE!LRzBlJQdp63UcJsoxw*>F(IaYaN
zZnP)U5#4n9i=Ph`D(CRM{X?fg)&_LiJl05DdubijOBH=@bp48h6EGHvTHIHE01ztz
zgazlTO2Ap5^Cu)<;zz>ur_}i^VgOK4a3D?0nl>|_PY)a&5bx1O%|Q|D<r3sFfNCu8
z^ioOE+x=Pm9iJv0^`65(#VK=)_fbLtScYHY+3f)svVE)CFxgv>h3Dl4$DK<En3_Ib
z3hAtW<$2<_vSFbv164Q6_bbxP(q}7s`t9Dlo@k!RV4UFT{nqL`@2QYpEjcVTyLW@w
z?5by`J$FP+Vl^Ic;u-jr*iOh1PsbrQ-#%p;Tfdz5?BE3iT1c_kMhhycO`L{{YDwc{
zx;SID&04#lh^~wf?>Q`eQ$Qmg?;TFdy%{#R;Ej~pbiz2}0zNZ^9T?Qve1EjCmBpO>
z6#x&8`H-})N0N0oj%IL&EAw;`WmRPsrt&Ih5n^BJQ|45<jIO5FY(5G)Ml1(u9Avs9
zLPySkL#Q4~1W|M6JW{{%00=WIB=uMc*9SI2aP5S~M3p99u9dP)GS_f8R2uJHrCh^;
zT0iVQxD5PGN<)T?IEOwp0}}|&E(nPT%E7T2?w`bFZ!@_<eaG26yoa1sA6wND!@FAE
zx<(yN&``WTVd9b?n7#4Q|K#a1syex%qM}2RvK@mpg6R80ONoU9AENuH{CtJ8Y>5RG
zqj%PNrENt#h}mY6dyjSZ<RA`BrWC19I>Xs>#8%W0N81O&4_3L6GtVsFl^isVkWR`5
z(Bv`48Iz?Stzv}2P^qF&syZKq5(?^;>__Th$xvE6cPq|>6(Q_8N^cM=Yhf_vW8(pc
zw_`3hBF#V=)W_n~8LZd8oV;o9gQ!&D^Zhp{a4~@_u+vxaJ2Ik$69HI2cHxr+@tJ~r
zN6>j11rfqVp=a>q*!OGPv##plZ<aw!1|uDC#nJSiR2(g}vE6TcK=d^hG%Y&+s4BHH
zPn-=^;Hi>q?6Qh4T3^v2_`r6c(mhou(@Z++^XaOu9L{xNIX_%;YK)@W62=ON^7l?$
zWNXWj-G}%1i3RR8%BP1jEbvZFfa09rLUGiW5u=-n5%JC+h1)RFaUzONPEPSCUcujO
zi&Xtj+>y!coVmf#-IT|G#cNrl^c(j&lo>#jD%)2dh_WZv2;<Sm#MVf>@TBge?8Ny_
zvFY^W#)(>9E}DB3pfQGO-Z(DG4e(eK*WULuS?T&#p-$1}PLX-mE-T9>*!?%fUctO(
zR{P_uozgLOWnT3K++&%no*cI7#zm@UYu70ZioWT2B@zZpBN~~iW#UAv;}`ighZnJ;
z>CG|3lh53xi{8C(T3*a~bpZb|l~aK5aZ~BS1yYZdV5`&O;^MY7rp(Y5-5(CKr<CD3
zHS#TGW}Q{&IfC*;qb0B8@&nsW`xyqY_wS@PxvbVdI}!D{OjQz#zU1;{hw1CGwldaJ
z19*_-greZI^79t78BVDY5>W{HdVKZb(lsyqU5<Hdg4^s-S1r6qjMRpzbI;qjA5MKW
zCki`~uQvRFE$T4G_GOG@3)~=NXliKCJPUc{aKa*AZ^c2>xXR;02sqMBAzJeM>mlA)
ztoKB05Zz!L)Za1Dt@lrqj6ny5wJoseX6VmDi}$(>-&#&sdg0GBIJ0mZ{cN_^j<?rN
zMh|DC#}$3BMv)G^l43H1v(`Gc(s$Ilvl2CF$v@HkDr**pE3gA+x}RQn7js6Q(M>_$
zTy|2<=15jx-cfeSy44qFYd^$yjt#val@Waum|v~|*lu#Fli<YOssS_^=b_10efoPI
zK%&lpiE0m#O9*bg+^Fhx32-8dVpjs|;mJ{7qDNL@B9rT2`^(;p>Kno7gO^H&)9tQ1
z_N{+gkq)O}T_|jE8>qdb{Cxp^btV9Hm67LKIRLC)@$QOa(qcAQK?~EgXunPwUJ3SH
zyX3Ln6yR26Up+4%1|YSkrG@ot?@K*z#I4B^3y&2Fa2>w~Ww}&S3UQC<FfOlaZ($`1
z-tF=_jF+5zoFC#oEMYkNSzJx;tS<8h2>ceKz3eCl0W3#I`u9U+?_U9yJw;ok{?#?%
z<oOk83DqZwLf~M81!b|BVv_KPh{HX&_V<YHhrOn^E*h3SOx#tM=Tc*g&wrdi=7xQ<
z=zB020=@T(*ABjf@S%hiDK6<B#a(&5Vpa*CY_n&oeOJ(9qrGOFASUAw%HFN6CWWtF
zcYhh!CiN(Vgr1JJg`c#ow0G2%xZkOrWH`Z&)k+~L^vG2)@Ww;HXW-r{95n6K*4Az&
zkEX(!Mdydn^qR5wf1A~q+vT8wHj@kSd4ATRx3omr(`|WBE!*y><{}0!Q*b=@(Ow<z
z>MspBPaBeTd~s3En;y9U2k!SeATgz1@u|c2oIFdE*pXJ|D`5MVQ&ZohZ(mUt_88SW
zT*%Xd9{oL?w2xG}=sg|am5OQ^?`BwC{H)d__^!?}I>)QtYo76=tqjiPw-|nHU|_E|
zcHkIjK!|%e)%@$BNej?gV+C1{I6DEDa&bc%Vp9Dr$HgLheYpeW)KDQ4PbeNOP55@c
z+}~xyPOsl4hka>y<?>je<GTk+%zBAF@+WQBaAxzi3nD3{b<=A`s29C~@hXIw%IMjG
zS8hdDU&&<^$oYq^ceUhjM4Oz`XXwgz$Y=0qBwgyMS`dF+Bk<L+zfy%;BVd(-N@6rC
zLP=t_!dJB4`JLpoMo@Z?#$9{W%U;L5JnlO;OMK_77VS)tFwK(_>z@8L%t$V{q~%la
z5oHAW=m|;^8i;A(`ZLf~y|QG~iRy~+k53>BR|U=vmITg@Skn{F{Fdk=@=kF;>-hdU
z`v;6@Z6+(PvRIn3;71?@bJKO78d9t@Y8<vGQ`O8jl{EN1=f3o<Uhn0nVXe?n*1_Vz
zfqsAeado~sexTFj^F<_cC9-m!Xmcv6Vt6GhDsv(5Y=u+#Mh{;JE_{-=Zj5ni#EuC%
zn0UR^J56Hc)67!C<Av;Q!UU$u;n~Q1hXJqC=!62F#qR_kQ}Pa4;-M_PYBJBVzDD;a
z0h2}h5vL%af++h>4VJfiZ(m~qnPgc**4Uc={0UC*`akEvdQM;B@WHWC@p*R;UF<!<
z_Ty!X|2?)3(uC)~O%=&=5Y=sDM+W7Fc@uprnCFx8PdZ`ZB|c2r4DPQ(6<13;hkTo^
zNDQiU)i1#(lb>$)x8Y*~FXmpn)EoU1kRWSr5pDi%Wg40B1T8inB2N(0m(x#ava&+G
z9xlz!R$`YBS3K$KWIklqok_5;XF7XAy!7B;ls;X<3k0I}a_XWH&-kGxTa3%lO1CUe
zpzCOcr>%@fMNqW`4!uB^zq>Jr;VfWSirNaAqkxB{0IcVp@3~SGZel7*7eS?i_fco#
z<)lzrBET4Fu9h~rko;u6#rmK+eYP2$HwrKZ=-nI2QLA9nnsjyc+HaMu>(@iDw~D!N
zZZ>yUYURI0wfwLSJ}`P^d2;dUaan`R0J61q4cD@TcGD*(MMZd6G}vxbuMcQ@eEiaz
z(`}%m$adV+>BW_)PGXXcuy#|JKjHZG=+L8X_ZU$nygeK)Uc%EKfqe|ETon!U30vl^
zXfw@_8>(|?eXCKHLX8=qhBCE^p8&7Q6)3X4oL|i;XoWVOlegm19l1G|reUF4{p{`I
zI(2r5jd1Vt4n8F+I<5WrL@B2)sLcYo0XxQ0DIpP>mY3J{-&_HCGKIU8ikbpc)cB^T
z6^ydkytRV1dCYa=^qLi}tf*ShE}h3<Er-iVii={wdZT^q(2Sj>_+0yYPCWoY@ExF|
zqGcu=8z>aYX&?itX|BU(ia=LGs#)k_;J=HtJ?929HwJV3sR_414{3kh)7&Jg?G_%H
zWKVXgE>8oHG^bn4h4a&~SgfY8rlnp{Uc{~%rPaBQQN4tMIs*g*;L7CvC<B#G-L~^+
zzjg42MUehxs4`T{mW|Gheb4i94>9mhtK&J0N8&Ow^{0&#f7lHcM*;`nym88-jbnK%
z?rK@TUEEJ}Frhd!;#8O_fcYV|YXX6B(3S-6K1HwFK@7Vg*SEh0U0>q#<^}PxYDk%W
z1*iez^uPM!IC&!1R`I##N`s5-yE|wj^v9K6J*1-BqGAes??{@`fU*mKQg(JLeXCWo
z%O5#FcoiybG<p!L0D2v;cBR(G2{Jd(%ED~A_igwbvbXr27B+RAd0k{3G(^pu0EMT8
zp$igPw3gBl<jR4<m6Ab7hb5iMgMW38z+2J-T|I^w`O=Y8et?`J(LIgFv`9Pe=N3JW
zQ}k3tgFXMHyLU7Sf@dsNLY3Yrp5sEe@<2hXO&31&9UxZDy*z@^CR0-CQ5^leyT3~H
z)+f_`>&B2Q#)eL*dI2@>S=-E?)4X2R$#W1fwBqsHLXXV*)E2k*d+OuN`=Nj!C^b!$
zeH-}@k^Y(if||6dnfv~;S1*}omsZX$8nJPl4VX~6s_}@b;=8ffM&xJZIk^GsN65=s
z!V%@A=T%4(j`qVX)hjIWd|JStS=M!Af7^R=G+N3iBnV(f)I^)hamz8FF;6g!!&;sl
zDkON!QT`*y%NsiyD<b1#R;c88vN&<JSVlf&fH?Q`wbKZj%$$e{<EEcWpS@AafV>5D
zJ2WR#xN!}d6AG0kvAmwMq^E<8cX|09Ds?UFR`~?z7^e&Rgi?S^j&%<Ul~MpYMh=PW
z0Sxj4aOczIr038dz%|T_09Vj|S!%MDxk=U_y&NtfH7{lj&`^)7FJ)e2ofE#qtO!}%
z1-Y%Ddy)JB>cxVLVc1Eq)jf^HxDXePFzZqj_GUVBfz(aAt8X`nAjpU<3Ea8aP^nz6
z=6(|vCR4{BH`;-UD!0{)Mnf+Uye9~0&`)8YXUMg>y4sN%B~NvL>JY8)MJPuPW`T2b
z=I@C5q7N%9XB0v~EGe1CNQ+_KN6mew??#sxEtnA?P~7p01td^GB34%iYSPa!eKn>8
z_dT`+=k5Tjv2MX?4=7{hAU>PaVaTVKY?(wTY*Ys3=zr|V|Ivf@B>lgo2gk-B>p)9;
z764u{$_DI*H36^_kFwk{`-`WN%x4yKaqkmtxf^WlUdL6g152Wr=nU=EabQ(i7c2}P
zKy+qm2vl9UvKOWidy_~vNaarh3O?<Q6#VCiY0CWeP|$~ylbu~O(OnEs;D?u+XH{lA
zj|{i3r3=*AbQ@+B45Ubd_6yLhz*zGJW{2-0QG=*+Mbn`rZTwEoPN}Xl<84kRtzb?U
z6PzJZeJm?LI^t{7(_jGcF|akpd*MH0**`P_X3jx~m-A*PGP57K06)eDKX9sFzxMr9
z$@tsHN*n7ER<XynVzuf$wgu*`hTJ`qYENh_3=Ip@&w_5>%C3naaC^U1U{scgF?2Am
z|1OXVI0Xb|g7cX@4+YHf^PnY(e8-lg0wg<oJ3W1Lb7co!HDB0%NS#5H>t<B!Rztz_
zKx9)TUQ<(Zn(?W|D};4NYVtE<deD_xsXh@821brU<=u>YYnb5v+>*qcNe}P{!G-j_
z-}!+nA_b)LeLIrQuV9pwlX$tgqhCq~CYZLgJd>la*C=Bp6~|tsfEJN?5s}lY?{L1q
z{EG_5+ftiT`x(Z1t*aiOU7O!EL8kIE5N?Az|9-f+;b-p{tO{4E{g^Bg^<4h*(D^uA
zBsQn#KHd;i8UVvc92Z2sCF*e6Ok8$2mb>@vTu-{IGk3$-U2Hc2QJ7!)T8s%iT$mW}
zC9P984B>8s0t3IkMl8foVGaXD)L@XCU_gh!?HxM=^qCJIp44&AHC@gSKEKGGF%bt|
zDjm!q@`u2gX)&&8C{5$)wtivW{3rORh}`%umGLZu?lh?hh~(Z1S^UAWVmPd1t^|Ij
zl5$Jg#`k>}BY0?lGhG5t5@AL769pQ~kA(hB7ui||9;K;W%=UtxLsWjC*yiNoNa`A_
zpsr^MmO@K34K${-Q>;7XItrdMNw=ROhz-A_f){i@s7TvTN65g<3uG7l`sg3nKMjY!
z3fi3}`X<t1!G3#hVYV%|K!S>XY#fql&NaeF*p7#s98Wruq7C=QCFPOz<c~7@(qZo=
z)Ph&TghwQt(ACwW1PT^DQ4MbHR{=EJnHUuX4=YO#It1O5w>mY9N$MJ<c$fb3p!t=#
z<>lHv*gSVnzCop%ww;v~*H9=iRO^;(!XEfN%mC;SHanZkYFTbSWvXJt{k9?|%Lizm
zN%CoERbyB{aFxPjO%6-p6IlBC+`dDwnW4fYfuN#9F-c7)WMhXom6WV2+ANu=1h<(H
zzN@=BPFGh~$x$)3#=5FB_oDmW*=m~zB{!-Kq2I1Ezl{^wcgB3{{0mGu;@+j1RNIa5
zb6KLg(#_3HP45G1V-69$-|yE(fRXut^sQt?JN7`L#+(K*mEx7ctrim+#DxHK7GPN>
zW-}6Dnf<B+6nm~YA!?>;!(C_6Qd5O+9A!2G`up}x`(q1X6$X7k$l~6kqCf4xV47-6
zz#lt~6^tb3!Ws+%RtjJe(PVUwVNE;ALS5V!y$_g~tjxlLkffmf@ULH29w5^>+H>rU
zYsS_3%N@1!Lq!}$w5KN~?)^S4GWGfWrQjkrI}LqDQ&UOne)F6Hfx0u)#PuH5uHE3F
z_k;jlKZm}wReiLP^Xt<S3}GaPO~pCHg<y2kKJe7Iqk}tyaTI&Qki13KTKCoqD+>(s
z!)48a?;>E~QDd$j4DXuO1#dp8@vLAmT62i%o2ZjYmIJd#QiJEcFv&IzTNU*Pu=H_V
zWBTxOU7+6MG<&%xnr!Xb>%N_iEm80zTYH;epsRZpaKH3s`g7w%qHf<_>u%<RrT4}b
zb3LC=_ta0rwj1I9$A0p20K?W!?c=%)$x!_=7}oIixDY&SEe#(Ff$feW0xe)@8~Ce?
zA!#3FM<O<&4xBMDW50B1ru4|VWN%Uu#<n{(8ECzZkvs{k#Fl$A%U7)&vmy=nS(iGC
zty!(FzYbysr%hd$J~Is&wXR^mQ??%x<A(oz7^E4~ZBGPY!FC1vS%ZefONS;8W6j04
z@Ac<M5`3Eer2LtgO;DljU$!wcFyMU6_Beuku*8nGGEigLKHx5RaT}o5$jGILW|vt*
z<|QoNj{%cao~o^F9JEfx?_pYo>C5=p#Ul$04>)}UGJe#2CP4E&4|Ynyi>E-MWnp$r
zJmn0aN2}Zu*ghF%84y3`kGw~rzG!~8a>Uc>g2N9&Br9*;p;!&KVC!Cny&Rtrr~)fB
zi$n%03FPB4g9iF6jf81v>2I&I5XdW5GR2`~cn0hcK(+`EKV1ha;kOB#PrcNpSy~s=
zMVM)TQ4T<V?E*L{N4@9vc|5-YGS(FL`E(UpP0$f9Vn1{QO`0Rb%d57uJOe3S_~Qsx
zF|qz|EcQ#KBsXkI*3TrFKlQw&eYM8*(re7pl8P>4-=yJGb+u<lu_CMZfpYsJNwoE~
zyIkpXpn|XspjR}a&GwrpF+%QhPtdNy&_4Q@K<q<kg9@Jxn=0g`W8M3$&_&;W2faC)
zRC|tcBNMez2P~nNsS0=QwU?j51-v>zIq=@R`8V&aFu=y;xHTiJ6iWzDAdGAX-WNW~
zzsrl7h-g>Trh!C33KE?YNzO{}3Y`bus+&`q1MYGImm)08ga8LBB}@JO_DNiO0D{=B
z;)WZyl8RmK;J8hgd@V}h-NI*>1VtZx1-1B|M~o?hinD^1UhqW10HdCl^Q_30b|8Uv
zAUQh7;IUK51lS0do`xZrIA21&e*dyY@LypU0HKa!q#xU(uzp-5^0I+Jh3!x|=hqYc
zuyJQ@M|gPPQ!m`{&N7oWb1Hg9IvjP4TW$8TZqOVQeF%b0I<yk&$kw?JjK=H;BA-Iu
zuQ~V5Y+V!(BTSv#s@y_)3qQplzXU*|;9A#tli=1WM~i#51KKRdxw%rapK4~~$cWi>
zKa}SDX5r3K^$A43fkC((+Z(HiaRpQRysn&RZV!)&hES2j-z2~`<Sdl|x4#X7&cI>4
z`r1Az9Ha}kLGwf4@Qq(SJ1+<ynjE&%zq4KLM|qKmny)6xq&p;_zf7H37R;NP%5wYv
zVU!OuW28Dg;|V(i9)A{nSU-@ul^b|>(=T_1Wc21H*d&7Mh@{m&f8j5y27SC11N7ur
z&qpEpZIY$lLks4iedlN2?qB5or;ospka>1`#SnJzk^I1DgkoNCZJXgA3%GS7K2>m!
z&y|rBJKQ6H5;SO+(;EGaIQ)={fK_nNhp7X0N54J~GYSYqE8Rl=?<N9ge<ZU)TiwLJ
zN~|jq2uql)$?;DQ|Ci_3`pCQotjzA@=uFlf_6j?gNhev$)$J?)>y)2IBTjRYrzP#$
zMPi{SdqKOMSY(uWWcv-(#lc{`A%a#r^ez87QD1<-EQI<b(QQ`>WCFNm#xWcJGdKJ9
zVw#4$@%h^m#oKS<#{^b;MTS>>_rL%8){HXG03qA}aNA!k2@tpxXjvZdPq>Kvb@JP9
z$!rH6JR>-YbcZPA2R*pSCR%p?-$@y8L2LvuKQ>7$zE&j}r$mYE0zZnERAuunUb+2$
Dso@`U

literal 0
HcmV?d00001

diff --git a/docs/assets/deployment/hf-inference-endpoints-locate-deploy-button.png b/docs/assets/deployment/hf-inference-endpoints-locate-deploy-button.png
new file mode 100644
index 0000000000000000000000000000000000000000..4fc6fe8eebefdd3bb7c64cc1ee1b10e9c8e9d981
GIT binary patch
literal 799424
zcmce82Ut_t+AfHIf(WR9Nben#-iwGRz4tCfdhd{cD4-}^dKCfb9i#@N_ufm8-a7;m
zlH7nZ=bSs|-v607|2!u<VXy4H*4kvhUwglACGS;~Wbtqw;h>?R;k|tEObrbUrwt7a
zi})56>Ify5(IFbz9R+J?X_c4K($p$0j+WMT7HDWM-hbA{)=}>!PSaPTxq0iEq}+xg
zLDW4-xmz3oC$yn*FK)cO_v)!iSymWMvEj4QF9p;eC<w|-wTavJ^oVg;*|yDEiW_dD
zyG?6134jGW5wO8T;DC_l+JXq$(Cmep_1*m2lEw7O#P@dwAH~P^(YoK@9>Sh!Ce=B>
zbYWp)WhHOs9zrxW)ZZqs@a>n%I~_zI^(x=e)}o=&<1F!J8bsnAN}(Mv25Q7%qp9L}
zALn_iF&N>Mh2Igr<^1`c)i<Y@d%1ZBpT(2EKjdsvMx!n`z9_$g##=`-*h6A2Ng@1^
zSn%arv)gR|0@%u$67f?}5;L;b80%lzPN%IUHq0*-dF)kU1_vLu<?BFkge2MH*A8-#
z>6_<Z1_9Y8k3;whw-U=EA6oQ1c2q8B3SlV|Zlj{NCX6Dm#Ryn3Gfi*2$HPNJbI9sD
z_MCeCM+!P)+p86!vIc<o^Dg{bK~n@vZZDOdd4Uv7>jYm|V;qOXy+8JHCfJrTV2H-<
zIGat0R17CgfLPXj?A=^XKeq4}XFdh7lrIah`YVX2w{1^$lH+nO-=oQSN*>9j6dIs|
zv2@GZ!%hdJC?~}zVAlLRCseh=482T&{`Q&n=Bw<@@{9xkEVcG1aH{NnqM6Y%iKe7@
zQj#w{L}$;M_m8PM-nfU+r<|ixMEMz<OR_&zmCRuENMVm|>&*8uP)=H>%6b$w`_lCb
zbk`ZEs#F>+5G1ISMkVr?Ujm;~>9e>IeSg>o^^5oMR)^AA8i++-DZ#}zXw5fpbVi%a
zBQe{G3{MRYl*aGhJeS1c4!9+F!h=C~59ULE@CX;DIi28rfS*$e(75E*iZo)IK&$&b
zw$S)E`d0{qMYFs`J=9g|VOJpJgE&KX2KMd6+vaV^gHZeew2nxOf^sDI7-PpX7$flj
z@chYRx-fB*mv`u~2&6-$p6Sn_L0TFQoV-qh#!0P~DKVV=YM4YBDhVkG9SCM_dosSq
zwUBNg$DPRpr~m;YfIfT&Og=+r;2c@Lv_;B$GBoTt%z@Sx|DS!uk*jC0qCOnk&@(XY
z`On*@v#Ke~%oY#ZBg}Z*z6PfTZ)beqo|IUVUA3JtX{rqplU`p(MEcX%wFc{%g_UAV
z3GL8(pxge~LdO*e=QH7$Qe~hta8`zD%{ALS@kf|Tr)Ju&!D2Km)%G-&$2L!7#^afi
z;&SIc&UKG$ayvh_qzuCVJ)|X8rgb83aq)2Rz?8gzt2QnyJcIaa6Ik|oIw1DZyr}kf
zcg2oUamDU7i+i5S30|gFn6@g1JwjW@$9+)lM-;-wb@O~Jqjf$P|6`y~Y2cwChQK1`
zr6lz&%qZ%+^nve(U<%&{EKFDvZm$K>s@#YR;>#enyP+>dG=+B-<TG?r=}pDrz3(?1
z0_vSk-2zB5$Qm%x32)NS@V*V)pkoYWFpChRvune?{p?57L;Bk<Ww;4$f04ALJ&w9(
z&Y%`<CzT)N-(|W&?}BbEy+@57rL@9#bh}-}T?3o%Y0*#=Gudi}>1%Rf^nS_Q49txi
zZY+AiT3_migiq*wZZ`&2XK@Wt-Z8Oxc%P@8{4sw=J8hXcJ4K9XMVVRQgMv1jvghY1
zC8oPNBxi(7OLtP<i8K?Dzv*1Q;fEtmX8b08S<{OG@CXzv(N=%xc=J(9q>1tY{lTr}
zTcmIE-qJp0F%|hq@bk``JjGkjXS7i-D;eur8xx-O(GE~^(l}7>(WFsV6H?vxeL){B
z-kr9h_<{cLrT16b5#bTe5$6$2HSA3c-A{H;Js7d0V!H3S(A35@#Q1&m`+WKFGV#mH
zvaeohv@B11+<Lfs_~qzUxwC_g67yxMa(vX6zv+&7k8#^@oZdO5JpGiEl$4khqF0%u
zV_&S7IAc_GY=b{8o^M+)o98;NK1Q@9KkoT0T?Led2!5WWJAC=NyHa#UO^<K)!7lo4
z5SDbSYEUlCSVER+rfROU<}yR-)0(fY8}~OcPt>63Pz#@UMwwB$n1b%flp@_sZ=K^f
z%Lrm=+gPoyTE!Fhic<ARD${IZDvK&Hs@~1uR@T_0qtv4L;o2Qe>E?vNsSd%`jUk#X
zo$Uj+ayL0QkL}7Ww{4s4x(&t+rO~1xvHaPAwgfE&N}iC~kG1LEF&EYe!;c3Z50|#L
z+JqQVoEbTOPfJgGQKI7*v4Gd83}uH)!tLNh&{HS`&j~{$=ygyY78%~aLpQuh(mg(d
z#|>WRh@T+RFTozcPl9>w)I6$wc=nK#43q5TrwP(j?k#T1M=(+=(h`1g%Q@>Gj}M;^
zCKvJxIUHfj$G4lVmiFl6>dxl`=g{QfjB?}@<)rr)_AmA0^q(cn3*;tM^pEyyCkrHd
z>L=)YtV*y}eRY`3&>n4{Xk9yTl(Oo}W?S&A;GNc~)?m?Tq4xyl1m6V2?lpfCzq%c(
zeevu)`|0ZGYBIZ$sZ5Vzk3<h5kN90xUjg4TI2Np$@GT)F9X%bZ?3{~==c3?>$e5t0
zo4IhX2(j>lNE5mB6K?O74^ivS0j@6YJ<c<0Zl1Ac--cA*Wj&H@^r&_v7St9rrcxxM
z;Pn~U2p%pm*fD&@NoMF!&u!3I$LVJ80pD8NV{|QW-*&5UQg%1q2ZR;1hMRGjrbDQ`
z&VBn1Umu-sY_27)*Mg6^xUfs?N>YsmJ9Q!mKTY$mmDMB)fPKR}>+yS;#;q!p>r3*u
zz%?U~sPx+OA;)?!PdEotSVh?J2)NsL4cLVgn~V_&^QA?@y>*xQ?rXfUyC3n{@%;$Q
ziDL;h?vGLIJQAfle|C$8p50ugizAItxw&A?J)|yV07r}>hmx2~i}H+lj?;j6L6De&
zOxR<5%9k*XFgg_af}lIhfXG{-N7zPgEb6tHn}(ar$!LP=6P{NC?c8Qe?Ry{nN!F=q
z*!LV76dP!pgaXqdqg7H5#Gg<*TbRMVM=e`^s*g2~q*t<e!N|Zw@2I>-N+k&BKM#K}
z8T%zR`F<gjLb8+TmzK7a_p(gGOovPqFBrZu=IklJe?+WkANh`WS#OWlVH&jPwcuu^
zJ5`mcuW;zG_{8m{HgUtfgFQR)KMp8>`$qaWpJ*F!0zMN(SFvpSdzhbv?<}OWrHIw8
z%#F>p-m`yMy>eo{+&#)z^Kv&^X5@?|O?^UPGwxk?buZz?O>gP6yO+a`s#DAWHPJpu
zcS#rWF`wyHptas8{it5ftfH|fTvtk^g^TBa^bKi0kD}E;@`V$z)kNHM*G}bhziZz*
zd&1}w0WXJf(XECZZxFFCQ8Bxph=em>`9>C|D~TwA<vcfu_7kn{aM3#>Tmg<BB=1S8
zI4K*w=9e7Xe=LPDC^2L+7{}d;Gr05~8?=ysa4H(l)b-g<cdWLpMz0EJpBI1A%d09k
zSzXqAr9EC`S;T1s_vru1M<Qn^Cs34KtXXK!h0A5DV^!vGQOC8KxGKPU$#zyKU;y%h
z!|;CKX$wH@3+K%%^UOzcQTkO=bJH=epfaC*UT!W4bh=sn)_xseid1WyH}UO0D-od=
znJF;KSJJN6*52oxt1ZMTQXO;Klbd$8@NC`-)(e^8@J;ZQJA2dkp%J(vKkw-ZoI<Q&
z>|j)3bKn<Cv<Ye$gp4VcY!?p}Iy%0vc`ZWj^SySs;BbhrlTIW_A(=INi_*~JqmNxn
z*}^hrr?1irWw+Em!He(SYRB{H%Swh46#jLm3R8*4RzU-4!kt2%mkp4M9NaXLyT<0m
zg`gFWyyEt%)uEDN5T%W~ZBhLWp!Vm7&d(jyPwYF3p+;if9E&s4+YQ_C4$tOZ*OLN|
z&x&I8cWd6&q=UO_kGE<r!Q$Xl-w3CY^QJZU2zD?&E3gLcuUxMW8xBFo*Qab3uY>6v
zoVVY<h~c8ZO&dvz6X)^Pg3n!et6Qn8f0pP#4j(>+F1czCr|SWWf!4=Ii^c$8m0QI2
zo)?4fILxP;3@#wDP}g9;_kPR!fD<ym4r!-4k<jor2Z};i4o52n)j^R>vHn%?nRAYv
z*~W#r1tS*Yj(r$WbHLH-n7hr}6lg=yXeQ0BbnXpXepA{6<B8SyfylR-R$Wa?Sdtu<
zxe<GBfC4pWQ}uXgY~PfX(WyURNv2>+%0^HYVp!ESx#pG={G2v%ZJVr|<2`Wvu%!SE
z0!!;>Xt<+G&jQgOz6%n0{J1y*MK3;B=)AO4R77J%wQr%_M1O>aiE5#vUgGFv|7br)
zXGX)gK7IoYEyNn_=5KwJQ2VP#B<giF=GPu0Iv5Qb_3j?(<&|;c_ue>d85qB}v4~OU
z(4^F*U%o``)nB<-SU9-8c60+I+-XN0xb5^p*A)$onBnS${!)$p05$)VwT6zHj-rC_
zD@S`yQ*%c%3r;V4r>l9;M7@MjO?wMBQ)(}JI|o-`FEQHd9>S>h)nP7L>gz6Uwqmq8
ziYnC7jxH9|{G5+DAJdBCP*YQjx|mxEt37-E+i=u7G1}K|Zcf5nT%MkuoSr<KjxJVQ
zPlSYoxE^zJadUH^dT_XUJGhy8aX7fr{hH+Wd7fFgzH+g4a<g`HpuU>d)XdS{O^lZI
z>O%i`{Q5sFysZCuB?s5vJ{IZ&a$TL_dcygb>mPHYhKgPt6;`qKvar*AW^IqUXQ*q4
zKjGsO6ulnsZ>Row$$uHD^UtB&0(|`cI`m&o{c)(KtA&fSqdn@PZsPw0?6<-Hdh)k{
zqFh&>{a^0IuN!@R6m_S?aYVWPftonZm!;J!D9Np#DQlqiC^5TwVBn(uF#p=4+Beh8
zYE(!bqoGNny?iF6;f21FitYD6b23Ev-i^0!Ime4{eF!y?Ayl<vCbpXr_t)GZVrwKp
zS1t3D!9>UX@-4tnCCRXbGvf_yqvsFLJ-fXf)WcF>n%66sDzQ<0Z|-7HY%nEN45Fat
z@wsmH-EB-2wEz6s^X-Q9^!S#8@@Pl$H=VT&Nr~pWi)iEl7*1$+o6!Z)u>b0t!19hj
zUM6X~y63HHK2LpEvasPab_7!xX8~d+_*&>*X!whPRak^O=)TRArPu{%q5;?k&3YIR
z*{d_?qNO;^7^qeu-y+p@V=+(@jS|%|DMCkHH&Ewp99*?*@y@YXR;2X8EkpUrc4kkF
zlbB@LElx5d-gXL_;9p;G>WRd4SJZ@0U!nb^5q%qSKtTCJI*sX26c32@r?(8=3yjP=
zWj}RZiD#nWWc<fZ$wW134t<`s;N>y<hH8oyvtESIwltl=W!)4vG$Vo(-5eGKR6=F|
zha^hzB}nW@#hbCu(Wuz*FI`c)MGU_K*Os`S7=8ix2Q5d<5+V2p=%^llv13T|Pif{W
zeD+p-Zg~G!@FD8AApP*-ZfBu7KVi>?>8rC%{1faQbQFk<hAyBsV-?KBYiuH6=wPY~
zKpULkPeb!Nh#4n;H$-l`=R|9n&g>fjcP&Nn;Q@gEm1<-sUP;jAqr>>^+bh{0DNjO5
zrGArA9ZZzm2VhS;dRB_MDJZr0hk(yf{k%GJ(9HTvHzopr*Np(|e<;!=#=q&!*GOz@
zp(L7#Hg?BJpmmx-LhNu5f*{<Y6Qysc`Ac6lTwf2R8E-rMen@-W!oSuGQROA?M+me(
zy-8XhVLv4`Yc1>Wdy4)*@;`nCa%W5GRa=JQb>_`_*^9hskAu5TggpO#?p|hbB1Oe>
zqw5SCnSzi)sf7s@fOCrbO8n8qbtuo*uf_j-as3TPEB2Lw1g!=F?_TLi0RCU?$j}<1
z5<KPhX|DJ5=8@WSe5mvk^&jD&{i7Azi$LAPE8|3j0tt;$$F^DGy3vgB54(myzXA|-
z?st$6@YTA4D#`l^*phm=A4HLd>*m_g#tyf3?2J-vpv)GkyHEWJ;5{e<r}-B)5R4{?
zBX}r`=1)WOJBX5-$A2?Kn=^-OebUQ1L+BKJUX)ODlv)H(G@}dtbw6=6Mvmv|-y7vy
z;+nkQB~L20fo~dg<rS`^^mjiH`bRDKF7X57O6LDZ$MA2syr97!ap9FNe6PDuj2scI
zeSB^B$a}+4UI_)ONvBuK^{nWkw?19G{pBW5n&F++cFcQ;{-?LVkrn*6+-<?HP?OwX
z4*1WX7IJ}=cKrlo;p#PqGafg?IAH6A_@A5(x6OJtg2XLvM(*Mxgy2CawP+T<G$^(B
z<sV8#4+ekp4}+Nc!N2@NF9woa{MwQH)sAw(_}50O_P=Jdw0Pq!m}!N`E0m_6F=vH*
zn$DFNqAJBk;eF!K4ZjDJA`1A0%^tQNa0NyPk^a-r{0?H^$ok(5(P-7Oc0x!;Sq6r1
z!lCF121+f^L<0WP2rAa{E=q!OY}<^BnIhx4eTJxhU<LjrrN7%5f|fsMi4*Ycm6iFQ
z4bLyL|1ZuY@+sxl)z`r~_bVC<k=foZrq_l~FplCnHrr_lKYa6RRxg4_$G3mE2~+@e
zB>H~c`W)lWZ`s{cw=7Tw9yQ5-9;u?D+@4reu$n}}PoC?rT(x_PSpRHLm+H~arOEcV
zVQl}tThy~um#$E3lv)J(pVyl79-v>zy@~f?`fvUr9k=?<FaHpSjS%|fNd9Wa*gI6$
zM$6^DXS7~(_NqK{5wuJ#f3NZ!pR7U|m?2?;kHULnHyXx(c!LTLu3h*X{yCxxLbn(4
z=b`z%XZGOV4UuhU$z%LaucWZu9xr=uU|*?)$A9J~7SYI=`^ixfq&OK0GEk=Gx{mVk
zZu};tzXwOuZ~mYqi-=oSl;VGmmQe2d|8^$S??hkp4&NzbwDhh=$RDr#_<9wsIkAge
zGnlC$ie=1SvmQ|MuHC2n@mm13;(c#$^Z@(MZ*nmb1U)DN&$o8}e?ckGaAH|7N6Pu6
z?F5zPJ8WkO*{gTbE5vz!w3mc&WZ^>-2qmi}&eu=yQEGt!`#bmp_Wz5KFq4X38?6<i
z|C-SnHi*j%U2*CYwz!}9k&@ps9U%#9rbOXAG|K>yzr;lG#%pY9sSe;#`?7QRhkpT_
zUogt0|J@Kxh8vqwKI(jPcf+LPcnJSWEq2iEHlw40A(WK=MW3OPB!rTn<YGc#ZJMM}
z&xRE67TL|;r1W>zEOqk_TG9+Bq`a2-f3S@6-)#K<6vay6ct^%%k(w#?9eKdx*Sg=m
zyo%O->UjLd<3&1ff6clm^}3Hq^!EU&>zF<*_b2}1pWb2_fz+`m18>{M^uM4K=nt6H
zalTsE22VMq)P0()rqi*Tmay`F{Wi>)ME^O}$rHK&JK(|KCe@W%oc;Ve_yfw-{2L=t
z;r6>WT3wC*HKX;VmR*{#`)7iC593o(F}pr-cpxG`425?_jr?BxIc`4MFKk>S7GZSY
zi0@QOe;S(KL5vmuyCEv30R0f<4acMyYWcXHNp+<bQ|NzH8Gcuw3|`kO2{NQZxQGQd
zTvK2ETfa%^@2o87)*rMa5Jrb`6DWuJFEs7ibNr9gJLtg?HHR!uTT;U6E|jZ31~=w9
zS}WW6jVF41B>6RKbI?$N^6xzRAaebssB$Y+^Pk?B6%mrCjE&$#g7W`{QZTFJJb2MN
zfy!eEx|5aI%a%@+0|%f(w@5&o)gQ$-UOh*fMl7a}N^GFiVyE@*;17!!e*eZuGR@Dg
zjaHQJf6ZvgxatPeMz=oMj#Yfi?K73&55<6^`=aocbc~<lIwa9R|Aoy8pcx|DMCB~e
z_NSrw9YkjTzZ)V$5x_g|*W|du89}6j(h?acwJ609{9VfbqR)`DUb~W@y62bwwVWT{
zliur`ED7UvwDxMc>{oJY=ONcsz=e*|jLawL*Xh{nyFVD?l@=@!@TWJGq{~25#>T1e
zN&5dL|E-dtz!Di(gvw(%Z}A(=hMSaGAX82=2{{3VcBKA8ogdN4;VlxmsEq6e)l|se
z!5^CcAB;r0`+(-!XhHsKM(e{``5hVhkXI8d$+s*{N}s?^u%Q@dC}aW`IBSiUxW3)^
zg-sVcU_Zi7VhIrXr=j^BL>1`Y4N;xPCC>4XAhDYyHcwgzDkGagWrF=5S1LyOt|Z9q
z)A?V>`2}<P0{fV?rMP=6<b0kBy;L3?V)E`NO;j<#);94iURiU9nX}ion4RD#=kQd|
zTl0RNGh>bAQ5OV}Q^LO{zZr$Bix9Tzd}C9_Ca!oJ<cIAn|JeQG@H}B)sWu9N0I`2M
zA*-KKiL1X#9DhljdinADD;ho?eg0}-DRaZ5HNxwnl7}rLkX^spE_SY;jF+?d@<{b)
zP`-b)t4+ys&8WLJ>$<8DtBE;QGL;W#=Rak0JI4coj$jpME9G!_)R`+>t`$O;CVMQJ
zv_32vv4%?1hr(35B}&-YAj_!xSPp#`?eS}tf3J|xX9slO(x+kT#CzL6pELcW#$iGs
zQ9tEl;w;_BO$JRqvUpld*3~f=y$Zl?wAxty$Y?CD;%!TA+FaX-@sBR6skNiRcqY@8
zrbRQ)j4W&J*|;c(jN4V$&en9F893HO-?O0)k-1JmGdp9lYIfIyOV$9!(Ij*nhVT!(
zr)(!hxY@%c%rET)`Tt0^9@P9wDu{+RcZ|-4nq4OqK6st|mT7w%_vbQgG(zI$af5L#
zNzNk*jJG_t*G{4N=Nw9j5+ZRoZniOcit&u_P|QA-Vz->hC!ObaG}5OX^lb1*D)6Y2
z+2z&V<&DL@i3o99M0CQrYGG7ouZ}jFBPgP%&Hx}O?B<=&b&|arivr|x7}554iB7IZ
z7d#9`0x5Z2&#8Z=2-`h98vIG-7vy-*@_#w*hK(z4Yr7D$uE;8R6|%3@L=3&X;>kf(
zSi?7kuaq9%!g?JdniK`XuF}ufVUU~<evfwFZ~%xsw@RPCIEq7GU?z?Sj80UF&TSs5
zxVK~(SHPS|#3mvlBvnQ>8O+Me2n#PC?f3T3Q|R;@U-CK^I2R}uIuKRJ&X9<mK@fbV
zAqK?fBa(C%*0ncG$aYxlln#iR%uxSG0UCsB5C1&5SjY*ug6M)jvAc^3pj1?RuW7iY
zof9*y7<r7s^s{fMgkXQp?+L-DLd3tSMpqTRCW%8hA*yJU!4AbpOd^`-zO&tM7r>`$
zDmJL;ITmrVjrg)BsnCI_Jb!~jV!r!9ef!Ol2d&4WFGLKpJn9nHV?@)(n?jI=<Yytk
z5TG_OT%<LmFhy?w&#`qT``}CL5w}>Q!CPa(9?8LDzCFh|a4qQA4-bipEGUE;AK(I7
zxXv*_a!5#`O0drQHaGD9=aM{lF}Zs*BXK_Sepk*_+}6H#r#{PY@!`6(q}?6Udj>l<
z+qLr7>>8~bv7#L3V;9pfXW4%!P3EOK%&L`sn8Lj_ASStL)U47wO73SC>*hS%Zl#JI
zhZjT^vZQ(+{+Msh)BdgA=&|c1iYjJ#Ulp_b{(r?R=4A56MFTy>nH6r+<<6h%rjsDh
z(=mxxUpmxs(9p}?fv6K#kBnUHxY<hdIcIr~4OHjwgLW#J!!bI089Qqo3<SIas3;>a
zP$Fx(8{KgEZG%X;B)T%!rF}&^cH%hKaBfg;1hD};k$_Smeh=^iQ^T$+W6%J>$>Yd`
zf6sR|cLw1k5}C&v+VmW)_FA+u;&C1p<=TCcU7x~-XT?rqpN09?;WRUyYxJDQ+8}9o
zc=Wm1G)8vfk}XC%G#w__Tf<8N@FI0f(76>bwKJZ!=SQm+H`q-#7zOoAzGIX738$-g
z)2TGMK5dP&?fFR2e{SF70A`rKpFT#?K>=RZ3{$g{P$f0{>7UnRM8vv!L6nR#kzWCr
zlLZ>aT*b<pYgCgV+v-XCgD1*RCb&8*AoalWz*FuJ!s1mFTo+`NepT(UH4CT_A-((K
z$ziNw2lh$ntD76Y)j(0)fCd!-v1xWio3>*0I(JgAt#WhkObT5%9^UglAMRWo*EXKC
zIEkki28n+4=GmM$b$}%KN;I6!c#*<;bS`Bz7c;SgU&0NyeOF(eA2$a|uO#m`jqir7
z!ET?0NnoVcN)Qnl%N;`)k|{h!ef%+fIZI5G&vPm<>|RLP*>IXYuWMTR9^JI0Q_)sz
zTvPbsQmiC(ZOvgkxOF=<YEsm3(OcU3jA<i1y9Q{9ve6D+WD}gL2vw}T^v%uH@se*_
z=R{;<C5r%U-a+6Z%OLO|_d*=q_$M2}cJtJ@OnK)%tW7+u)fnF*)V+!G7#mZCI_-vL
zzQ*UI`kf_*a?@5H-IINgLn1zk+*l|F_Vp>`X|mZ(A~~SSK{p$uO?noDhL^r*FSe7U
ze<qeCr#zNStv`ztSny(7^U;bm#Poq|amE|?NiE*KJUJe8(SqF#-1ew`2f92-{hFPK
zz2B{DSa%xfy!>GRPzqitd8s=~M<-^uHC99??-uzZu81+?b!Yn4)<v;V<MW9UW6*Ls
zyH!Hv4boNC4g5V#de2$n>F=f%Bd`kTX{~^OsWC&)2i<XcF*<erBIBazIDzb9vmzFh
zmYU|W5XJXgX}$@Q%C&|%4OqY*uvwC%8mmrJWy1eR-Xd{+W$wIE5-7MV=tk_Xk`&Bl
z^H-TWW!>RikKH<G{<h)DdO9H1p#OyM5f_OcJa_>X5Ie}eKQqtmFXn*+i1G1+Htu;)
zHUPauCgMLM2)FRh>Siv&o#AJ;Ln{1^3+zBRpF|0GUuT`9TEN%HgVG!B(0IXEd+@`_
zX;vCvf;Fr2<L%PzMR-=keO-y|A_tGAR~yI2DUJ+c{S9C`FX-tcc;)159qS}(Wf1x1
zF2%}}7Dv|IN`II~?Pi>kNEJNpt^euPFb6<#M~LD^F)Vx>ndKfK4oY8tAWB_bfYsI{
zjwnK-h^a~Mf_c40E>(gvmYKd7uK<Rj<qIFF@He9~*_)1f*uJ($$#zlt?yy$bPDU4g
z(B<S2aGaqJi|5n^u5%?GFGn2p@eKBU&}5s3+lyJ!+lV4hE-MD3mS-zHwiVk$Ku9C%
zppXSJ2rLBTUu829J1aa-i$}J{<i0f)m9NPr-;P5xzh*aI-GBRoVV!v%`{lZ^_i=yC
zN|EQnctscxVCkPKT-E-VbKzu3KFhqLP`9pXH{OG?7}-S^9@)#;NN>pp20$7`;e8cz
zAdSq@a8vk)A5CnrCG4cDY{Dh4=F8t@Y$l|-VjD_H+HG;#Sz0o57e=BSr(+~X@+4#X
zercn=!;E(qf-QDXRir<<2s*RUZ<G6TH!KeS{T$WOJk@miwlwlFsbQfQ>?&g`dw7cP
z3j&vVyp-ElK5+yY&bs{Etv9gL3NVhUgO-7oDnPGASp1NSP-plT7?IyCF|L*-6z2}W
zj|=%{bt41RVy>N6Z>XRUB0xiFal&i@{MN8utCnX(mZy@HXs%JHzhO*SZErxI90z3E
zM#5iATv{7R6{+Jutxj$Dcq2FX^K`R<)mOFrDdyiEF0YO%i-+qXG4RFjMeX+84&5E)
zSvyl|XR+Zr+suEz@NNf*&1cUVZ*V4&_f6tMvh_UF{irWSxvRn3RhpKh9HB8~<$MNl
zUN(yIIo*0UV2Ctw`q_RonGUR9E%y+w)aEio-!~qRQO-bW4-7<=G$j!4(V?fumFUoL
zgpV}m-Q4OeY0NV6GrB9WGZc^&%4;`Q*)=EtI@`6|_JzElmA1nv2I`IrFp!#sNrIND
z!R0>id#k1|)4@dXhODW=^A8Bo$Zp9GKE3}KI#)qwK6QW{v$Q_-gzM$8CAO~(>!mDD
zY34AxxBJ>Cczd#h2?Gj=ij%DgJr|FD!Pe&)Ck46l`S$$<JV#2WhBa&|_E)l?2Mdgg
zF+7XQeXh$3;03_8JClikiKo@@ocD3IeLYXihy)R2G<vUu!TZwbEblXv@hwLgCtk0o
z3Z`8^pATN7DQn6N(#^yq`&vEb+4BCSN6n*erhMO~I-E{ff7tRIOo4t!J~)J|zBvIx
zt<r8xF`en&f_>~EkO#7!!dd7P;W+*Gwwu~B2`1C`<$F|5Tpe?-$s7UyFUnntt&M*9
z>XPA7W|G_^2lncE$yDvjr-aKt6HI#;-;j&h-EjxNGu7bgUoA(|SZ=?;(>GgTx=&tz
z2}6|crFXyEE1}@5(+L+o+6cw48>XVDoAXXyCc{kK$G|_wFw^b|0EkuI-C=scwUg_1
zlqFk&{^*vG*q8mmR7i;E<swEMJ8y@JRc)Fs5nB&7m4XL`yjF=Wo&9Vz8?UhkG2EjX
zVK!JJx7u^m-Zw~V*JZ3z>++f0+l|f8;2hT4MUoyyN-+EFu;oNsGedA+;JrmCN9v`r
z3{WA~krCHcFKL+OBG0zQh+7Gpg-FIXY!+~Ty!Ytc?){4OHEe;;OzD0a`C56=e%QUU
zug15=T{=@!Ew-#I1Edj%L6Q3lkyx-j{l#U>-PbqFAQGjzO`V|AHL?}xb}>t-;`A#n
z-8zk#DiM9HBHiq;FZ;^<8k3hd%oLL&?1tsGb?$p1^NgzM`V!7w&Q&J`OsUVN5`70c
zANg68*A(s~`E-w3w9Z)M*F(C~cPaWj%`tC<D$b89j^?)O3fU+_Ju>mO<80e6z!Gn~
z$lB87ygllycU`7)kc%`3H&z%4{5|3sP>!NRzCg_4ch9T13D2ucbNm9C9GL^S-ZcWz
zc1bYz@8&kX7Xt-=M8tufHz`dAr+6S_O<Yc(B|tlz9SXU(7a`ICe}c*}xDSTpSu<&5
zJdY9iYST*gVYg2k4ozTB_czWA7kJ&(sK!#Dra=)QeiV6mw#}v5+y5qk)C{A>k_IPM
z9Mgq2(y_U@B@l1ht@l%4ujk4;5<|btITzRS1_`*^2e-`;e_3&h0S+0Qm3a6_H^4LB
z5+vWkYh#{rrwk^b*h2V?mK5c$<xpD6O|)+^yJkgqs8l0gL&@zhr+>)LGFEpv6DJ4b
z(2$-MQVGPuJNqoq31UrL?ZGTowlpoq;!Sls+B|}QagXMAN0k@iecZQK>J7Qco|%V!
zDqDVUA0FRHIcitUl7zV2=2}k)%C}t*Mcyg11X-o~N(JA+LvT(s`jT9Lvq`Wu_c_^c
z$V5P`??%ou826q;!w;76D^Rgk2YtPM;`BoQ!{@<6+^+p<(<(R2)bnye3)Z*BEa%*J
zdD~BO&UW(fev$b~)@J{&l}3r@yGwQLlOa`q^zkYWfAjHkL7$LTl#j3j?p|!FG&&z*
zwayGUyfM?h^fERQ4__%!&z;?i7K6<7YON2zAlnSR@yUHcmgLXO8;42F;^k3}KCAk8
zUsgy>_JmnTY=n<zED}Z;>9QFmMNcN+7+dTKCY;*eJr&;kT0K&Dk?8;gy7w_BA}9T7
z>}uHLkJr<El^*fU3|1kN9royrfpAR&ik^`ROy`ehxgCfFpJk$H&@jRQd<cB#0S-DE
zs~F5_6Mx?HP=vZ#bvfrmn+PNbb1$L1xY?FAnyE9ZuD9EuSGDErp1^y^k*8Ia4|Yp&
z(Z&n)_rKJ4hH&+HljOpQb5h%<OM2x*Y$uC3_LTwptXkh5PI=;#AAn_$FSq%bR%gLY
z35U9w+#^_39I-SL=Fq!qQ^oartT9YVFJ2y$K+f+oDaI+)fQj7aEU}r032ZAeu&YD}
zQxzn4@^%M43IkO9-%qu8uNyP38#@I;9>gF-tp><9XX|B~;M7rP4^BisxJU>DI5Odd
z&U>a~sg(f4a*g|vMU;sVF+hR_(0z-z-m#r7j+FLf0mmra3d?f=ma5fMI5ZdfLq|;D
zn^^XULs<Soc@M`-YSMm@OwlVPc(s~0xHsFZzg6AdM#(=p&Yz|L@sMU4nHa0)%VuNv
z4P<u$rq~sBreaBkhi_}~m&}HD;17fV5_<OePMDzg;VkDuTy+_^es3e3GRy_9bK!%D
z4UPj@A1QC2gzOm3%I(roaYTotz1OJoTKiP)@RNSHW`e=LF^O_ap?Js3z0H)EQ->LH
zm*PQ16G}I6o&0wC>BOK6^FZ8DAZODFx6sl7ofwJa3LL`JD{}v+{ILByWz7O0WT$ab
zd=D^cr4&<^^}M~3#IyC`>E{#Z#}l^;^B!3>PP$g>p0y(VZ1;lYuw6gS`W>@cXnwd_
zqn@UJP!S=EXpw%sQuxp$p@=%m_@Mo+(oEAMzWiSQ*5DphSqe_Zp*bbS@0+L2%h~#n
zg-jWiAuElPfT`d|1o{stAFLp1E2v650qAABB2#-RcB0Ps32zWu29ur>AM?}{FGzT6
zQ4V{<@53k{OkP>G^Tw8D+@5T@^2H0A-Ew)A8kVv0_~+qKh@cY@$&`HwFi?OkJMeo>
z3n9ul6@zD&jpKvyS}{D|D2<GjT``JUn@<{rI#R6bD=#c9Er)Uldk2K}pC*dIIuE$T
z0LM2m%=(qq(|}Qz2dycgaD4j-gXf^jr(U`rm6d{Z@IpW3dU8W@7vR`kf!LJHCE=uO
z5(q(&4%K60QLAbzaKLs{{+Tcb%NlgPPhI9Af$sp~lldgHz6YQ$Ae?)yU;E+cK$dEi
ztzmjlp>up<a%lUcd&z=(Z+%gqT9E9);$YPzm>!!~xOw^*EE8tlwTMuy;<X;p2zPXS
zQ>a%Zx8QH}hTZT{BD})pv&~2iSke=8#SPzJqJpH6%N8uXLara%#z}(`<Mytnm5B!G
z=7WSDkJbUGwJE8t%BnB}ikL!2FxI0;BQ7p#e<LHwy8X+P4EKG0Tv4g*my{)io9c11
z`dQtn(CX6d`C`>rDlItldlQS@LvTrHNbE&Kc3?zaH4q{my#$M~ofYvyimVK^epSn6
zUv~pRkL0IIt)<IO1R!;!68)aQuRCYr=b)fj<9zQI{x%{9^mhn$LQrMLf3EiqPVE6H
zT`#I2_PkzH@eEb6zc>vMn*nf=5^V?L<t9kj&whV_NE=g&&?`mM4=%uZoIBI0#|tJS
z6Cce9*mm5RE_ZkBgMQ&@D~?2m`?Sr8OTcxgC~+|yKST&@T9c0KL`r|P=zUcQa{Qc^
z4q$a%yNtAI%q(M(n#_`)G*YWkI@fIBu~dpL%aV<oMgV^}+nYBxH+ipf9PN67yYU3(
zG}zZ&*C|q0w!*c)cb);K8oVpW$NJ25-usI!%5E;oDtTB~k9;k|QZ9^BOy=*oya0Ar
z@6M`iDSvt-^z^RC*IH1r;Og^Fik2-)%d%4YH6m)j-SMns0~co}#vkbbgzkU~cUxRI
zLN}>ovd>!G46Ds!cS6476IF?Sg9*a$3%p2hr>1h&O1F+G6)=-0Oknzg8h7`H`}Rb4
z2$laAKtK5t48uo!HuSqnV(qu@Rn6Y)|0FT?brY4=5nc~*oRi{R5T3AoY$KIx(W}+-
zo+&-Q9vi%G1%z14Eo!+I&-<Rl5wU5%rZDvt%9_s`sj#Z~PHLYHfC|+@0)G-h3M{b&
zG{Jk>Z<W?ZS<<`5C+7*ukjI1K9I{mI&zfK%+-+$@+K&4dZ6lpC+9gf!)PSj`Mjso=
z!rLQw6Qd3wp5notyj6qvFSkPdHm0&x$J}%9v6Syu6!dba=g1T_)GCtIT8x8Kdw1XH
zz@|^T`;Ku#`@08*_c2YIZesRBG0gVs9lu?|A?e+`S#8zs7=mGf)cgfzaT*0ihQzi*
zht<0aOnn#Wb=}SN@<n=PSXjkI6|6{#CA%{De!X&wUSi!UAB&VCoTi?wTGL&%B6|0R
z!-;yj!=5QHA}!z~GYI?HAu?&(@gt6&@>sh38X&4?`?E3ZZVzs`aUzL1$j;gZCJ*T3
z+By|FRsO6eE2`!s&DxwMZ)vUe7RV@jnoiMeBxeic+(KwXpC%W3T{<(#9ZTbX1_NL+
zjLJ#OC?7JCoww}koSJ?LQS%3~7N5ntAwgCf{%U1@8;bNXOdz%x#wLCChH2G(B!j=0
z5a9emQg?-PGGaRf*tstz5{5+IU!-UV@;oTs04k&MB^=E`%pTLVL|25Zyf;%?-r#Mv
z@jQnu!mm+hhLA_vu8cf2C_}QFb;xs3Os&d=sD{uXSjY3_H1uF72-5pgHX&nlXbjja
z*^kB7O&sPXZgn>4Yz(x!VV2A*R`_C8a@9gM&=X9`g?Bd3RN8_EnY>e`(4H^3Z#2J*
z-R8s7Mr_;LGtqLdhd{qtDNmugnteVZN9jUkYwRxODdu~4$9WB}h$q){H3#>tUh}v6
zU{Fnp=ianbeQj^Jt?P%&W96O224f&%VSWNIRcD{fEB@H4`OSPz#xWG?15p-FB6o#!
zrg^Ca;{$oupmLvCyHBjC!fvbJCN;qT)hXbgOQD+m$y6y$C@G_L$ZzVYo{L-{CEYw~
zg&1RE;mMLe!&M5NQb(<R`oNe>GjX%+xw*HZDqQ3#A7Nsyn%h&xitYYWkEnSquECm)
z#Cm~9B$-6Z{ND1iK4YbE{u?ut2-?qRfGJ&9#~ok_Ypb&kJQ%A#?xUBPax|oGjTO^b
zRZGa8Ni3pu4+X}1=ry@y_oc(?8xS*W<qmM+dO@3o{BdU&7k&TLy1U#JF~dMa`my=k
zb_oNyo1fh5Xza`WY==f+2N4CaUhTq2?T#jP(B)A~QPYqs+4u4V%SAS~PnkFdA{^$8
zq@=4W-<QLc>ojqRIU|h$N~ucK=#vW@y+fkR!qTp^vs2KXAEL4qRrn8AaLe%p_sg9)
z%Vu;+P9Ns!@LY;AOnBrOG&xU`9PQ_l<b3UcKjM!T^8mNz*{<e)J{pfVel~9V<^+EN
zCS8ak<W=GO-#5TO-hdH$?Jl73QWvqX3R_=2DNoLO(xJ~?8ja8KguY&6?&Xxt>^elY
zVP|#HgitV6ou(9Mmavena+}X@Rh4^n1CK7oSdL)(AO=<a>6tNe%*Gv{_V-VSlbDFr
zPtGN^tK}y&nvkdr*J72-H)G#))h7yd>1<Dds>*932A`7ZH=2(X%YEE`V)f9^OtiF$
zqL=L}#=dt1rEV0zn<-{4(a(I;G4RKLx)g)?w|Z@jM?=D=uA1w5ZKywL5ktfBwz@tK
zx<)>@x=qmpE)ip1W_kP8r&&%tcot6^XFLM#V`EA0YajwXEI|$|AU!*dskl!7c`8kB
zY>#<(3yu<ovwG~1$c-Qf0~;If5%^MPrp}#gy4=1XX0wpF#F4{419mYMVL%adwc3qx
zZTXSkZD+vxlC4F*4*x4?Yy$e&r$+*(r!lGW>CxYjjBzv*GX=nb(=xwQA$uDX2NGLx
z$8%tRzim59vZ+0@{r#08NDmscwyrL5w+^qimv!4nZe=@Z&;IdZGU5P`2Qk<6%V
z=-PNR^pUxGlFbFN&{ktnA|@S(kAN%IdZq_*LqC@V!s4}&C=ZZ@!N6}fm!S)Z=v#KO
zIjvm+#>-6(cw+L6-#!q|x7hZ(08S+4_71fK-PqPCLAU9@E7IfIWF4&#tfOunVFX_p
zpEPovac;LjG8xv-QFyT<f1v7mJjeFHuM`~<HQHeGv^!-L{--kl0$*fm3&;uMTrGjd
zZOxkL<tL<Q2_MAxwXwI<=SMD=o$2ylT1q`U>(e<%%+rh|?VkGxk@|q)4%Dj+7p|)<
zKOr*Y9|ERs38nma$yEK>BR8F}@kfREaa{k=iMq0&E<`jeHDdj>7W`F&{jM>&DgZKH
zvnqxs_nyz<t5p}CzydpLuim&&F=Z9(2dip$yfpoNmcDLeW)!O`SL2ATZsE;gLG<0X
z4|%<GzT_@DKq|2CBo5E%(qK<p!uLV=#w4F<szDK>*7s6q`1v{o68V=duw}{+83EL=
zS-vjuqb4nn!NHWyg<Yf*OvxFLAOSE=567%;q7X4+!=`xf$e`|N&@S|JYpp<grHfd$
z`yC0w_-Ss9#WwN9*{tL0=O<YwiVFIo9uKCQ0)v9(JhJU-1|Sj%?E4KACyh*XKm)gK
z3zxQ^vURYeKx{bdgjoaW;C=GMrN=r~o=7>e*cWXu#G*I8Hwzy>o`@~(!tH~o1PD&@
z&R=Fm^=AZdm?8f8M%_U=(0pnr(0iS<SVBL&e=J{fR@I{A4d}So)yv<!{!59mb74eN
z#Dil0@qCSV534kW{v^IpE44(2h{ujHdbMVsKaNUqxdJX*M!~z@v)(S9gD>Rc<BIfp
zZ!@KmM@6=r-$QP>Unm4sfX-cV*1dj0m4&KO$pK!tHJ>j0A5Zu6dm8S;O-lu&cVPD|
zMnv|X6>{YxDE#Mfa*S20xay2%NXplpkZgBh;Z1kR!M31{SGywvs6}@XQ-iX-Z-5=A
z%TO6til(2y1izj+@ZzhM^M_Z<8IA8tcN;zhldxpTio;DKs?+74x7S^W88aW9&hm3c
zgBYvW<F<)-q}k8Z*rD~Qw;Sc3?ZYVjy5Lb$2Dk#!cBBoIpCA&FY5r#{HS+!G$Xo+A
z)dhTtcY^8Fxhd?qsUGD!dFTSCTN5!mDRxYe!{(~`jXqWE2Imn8RQJLi{R@3}GVs?j
z3sDYbG;LJLmMw(*OX9}Ibz3G_KlSsA`h8FgDgjt!D|58f%dV|-S7b*;XsN4}SNbK9
zC;T9Ua>5SZcD{Um!7#E07=#7u`6OUKr-(27B44A3_H%jp*OZCGxH!gSzM$3*<F@9*
zpq_OQQmx2%Nc-Ws1=&$bgt}FVOT)4M-UVT%0-z3P*ss9%+C*X+hzuUs&g9|YX*b{1
zul9R)c?dJ`_FSU(Uj5u~hsrs8-9Dn5{yP!@Bf}SAY3x5+dnAFFilOPgCupQOj?76u
zHWEqo6pgViNwfSeyta|`wZU>Jl&?|H#qH@XZ0C4zB}O@?ZW3I?r3Bj=%i}<LcE593
zde0<i{{-C>Rgh}C8R<AK-l$q~%mqR)F7qwVdf^%I!uhp;FIT(<_?>6eHMa3zSAq<H
z^O_@H+M}XVDav(S!^s5fW3%P8yQa!YdeoKIF;!l}e6F*!H`ZTyxplXbyy%USl|S9m
zY&SQ0IZ5@VaDa^8Ar_UNFzf&cNiF!<zOkEmZ3IpbU{C>yA`y$0imP96g}YFMbCbN@
z@8W2n%=MJ7lkt9U&*y?w5E2oSn@&oz4?;@Gl{li7>En6<+O0ua;OLdlyLXLXY+JA>
z*S;G@=^1Bh+QuCHTI1Tl14sXzCuR@#Q$H5*OMI2tIGuBD0#%B@HM~u91oe|^?jB#H
zzQ4~$XTE-5Hh7T;gTi96cy1OM)XIgw9%ikKu=2H%qUoKl_l!as`Z#|VOH&@r8I0}~
zG5TC0@fu6h?^NcbU`tW6LqMpso93rpRbxNClBjgy^dUrIt;c$IM#SCk98q76GHCC%
z!;ZVV31*de+B#~D77#lcM6!d;cgoUs@$E+Fm27dUZ3ZGL)F%*^16)MgDCWt66YBpf
z)MmqBG(tZ+vPw{_{&1C^M5(-%>kXC(M;)dL%K@hwh7FxG)Ds24UAnu2<Jt-}?{!|^
z(3-HHq8>jfqFoaSOjTIyo3HW2aTa#`nYXJHudXCK?y$50AN=tyItw;2#vZz`nOeit
z1*5tN>i&&SQFtD=%g6Ol0Wb5xisgK^y9h!I;m&XhhS6MXp5Y?uKzx3u_I`rxpPwpx
z(R&F!^lph;YW76?;t&wPVzAo8FE;2{P9YyDRi}-yZG&~d7c$e|1d?sgPu;jIZttW=
z<w%`DU~hKz2XV`}0?*D*m1Mm4UF8_5J<_n+a=ySRN=5>va=g*Y3bbB=)8?NVcDVZM
zk!Pcqoe4$FW-bAzzI$gi9L%{MjYhbB+2X;)x*L8c)Ue93>SS+$&meF8eBi0F_l7_I
zi;KRay=q44YUA`h%#l`eaDxF)mOkE`+_K+ecA)o){Fc5C)_d=nbw@{Cmi-DylS^+=
zO}&-)&;G-spCS7pJ!!|bv&E^EVynDXwaGFQ6-~S;CB9T;i5<AZO;|9#*lmXf)t=3a
zOs~<1naOm(mh*I40X{3Pa|5epeov}l-5Oa69PSC;M2lZPDWcY=3-?^+sObUVJ?gNv
zX{+N*-5;|OC!^hAVwEnu+w&6BaSo$%sI$?bLm4tp#Ztc|W8i3IeMf9wOh*~`BhA2-
z`A&M7fF@d6^L?)y%Kup8ZLx(&xL&~BCd>R~>Nx=QJ(ByT6!j82;|PdT2-i>L<4ytQ
zI0RWNjYoiG=;_Sh9<-;Z5waj_V?+Gnm~IHiUk1F?j@)b=nvO0&=l8fH&kBwAW-z70
zo0_RY?5P!5y8GJ?+vt{im7x-B+B~uxVZQM4a@Lo0csKHEY{k0sBRO!97xHU1i&N3r
zNSPF6)>*O=3GdS>_en8xh?qybp+_DA5u28qQD>!jx7mgB0QvNHXaAmA?My$J>5`}>
zPWwTz?5CEP7sn+RM=(dwYGZV_LB(sz99zbuU_7#y{f0I#Q1z<pFP4woE7JwE5xS+4
z)hof=pK{bdA66^Anq~z<>lS^~ik|aPd@3o)9NUor4y1D>*EodxHa0@BQk4PQnm4^o
zz9R(J5-s~uic7{R^5nmqc9)3PH+?`XTDz6#mo!=86mo_k^}kA(ATsHYBwy!@8sH^X
zgOn~dvoZ4(-g-gvX;g=A;(|(Q>>UeFi^7HULcaR&{r+136*7=v>ZyZ>GKbX*zXWdg
zBnMMb=Ixic1r(glMz9@;1p#BF7`Ze%+6#@{LImn3+g928o6HB1C!?reNAvfwA+S?g
z+{@iy`?wAl0?#i1{RgeVMtcnv>SOrhfuFsJ0mxRn&AIIQ<D`|#lgjPo)csR|Ia(_J
zqxV=ZPNQ)LBm|aZJqJzaBS1EbYZmdw3~VQ|bowA;V@K~15yx(E-~H9S^u7?4=Q798
zt~TgsEB-telkJeTsuC6OD9^yNwcjW7a<|H||4|a5MJT!d7~yS!?wel|siMSFkG!8k
zXAlW5eDBp7Vdj;*!2*g4`XykwRt`W!6^XmTwGFw9{o$YJ<7oJ+k>-QzDtHc5E`tGY
zF}f7!6v10_MY#>I;@dbc3xU(i-ZhTi8n}40`{@rVw5(N-uOcK^20;gE3gYyxVpdAY
z_fS7Dz(pzmXh?g7fb(r!qOyj&hw{<d3kYKa2%RJFh!VV|8oNE4?j3C4zPeft2H=sO
zMNl5+pKRu~@Lin5>(!6N4d%Qy@%*?MGVQuDcb5e7Y`^ucJ!h8DBf_e6FfJnMzA`_$
zA!bdd4m1_G;LV+3T=MNz5~ib~m+an_9d}|ovdMA+$-Q3R?7Jd|hY(!)rbW0;#wJ~O
zdkBJ6<4rccv@sE#jevGiDV}k9h$pwOSW>?O;#h==v1Oihj&%Aq`kwCYcN5s&Q28;r
ze0j_jd(8E{8T>Xj7IwCkhXJ6Ch=1YRxXV_&Tj63OwB8^tgI)%r@R5|`Rmh1R*mkj)
z8wAl;gw@+?l&0S9l6Rq{=4YQmRnHk}z<~IAlhHLrZkv^`BRB*s+^YcMFUe>+M{>Gj
zX*3=Da6Rf5Fs_{yuyG48DAASPHRnDOKkJfqAUNXWv+dsXTqu$%`kbP8C+KQrMZx5=
zChl6@3h9-jUXdA_l~hk&r!%<IV&QG_`ir>P@yVI_Y0CnDEa>=5e|{Gi+Je>Qpi{3=
zaO*gy^lYa{fUv1k*hs5gE{W#M2y(L450fU|<jK>S)lVCM?|NRS@$65#0A`u$7EoCl
zpZ@-n{Vy^}wSJNhkU>0cYx~N%YRG4UOsf9*+C`ip*8GEbkIW_1gLe7@evHg5m=A(h
zP+yf?yKw9bpR^913Q7Tx_7D^VW{dlZm&=5O-YIkZ1e8vndzcI^#;EMs_Dr-X54$^K
zQwjzU26ZZCV_=_*w|oveRbPQ5qBo)HM6)!~SX(Abz*BX*G+vu;a}6|oiWSD@!BZ<c
zt9$kJ@^I*>BHv!6<@}=ymkAQ6s6*!0>|CMsD#!w!If;M4+tfaOG4~;@a(H&7BPe%a
z^6nVoV7=kOn^ZaLR1{Teayc396jbv=Olx@WRy~0V9YN#VrlG#?8YQa4&%A_SDaSh&
zo@;AH4PM>%@(hGJ8zpA(7JPx_3S(BUF~yLN#%(rS!zl@abQI<bCX1b;@0eS!x$d7F
zc2afgJ2n-E{eXhqJ!`&+@6LB3Yi&vJLdRP=7ht<$DBiY@x<Bvtr|y&u!)ekQ8E3)j
z?nua1RL>cMuehCYB^=X#m;@HS%VkP6g?$$2zli@1{_6T`6F<&SHHvMd)(cY1Bh`$r
z<>)#AzNl2!T+@Qt)AatX<$?LSu<l?>rsJ(t0q{esFjZGzu+A~{YZavUfCp2GQ*?^c
zQMW4oJ3EH8mf;kk3X79(@#gb&?jFv4wIKfjzF9LMo*7RJX}6=1?%3AU1YrsLk=EJv
zKB(t4MJ?zl50MX3416!;Son2Zw=@QDik}Vv_JZ@_Jxo}dFY1y=b`_S9ovpE(W?ecp
zMPMXrN3<uuDgH^}={_9LTes)n?+Y2blVD3up=>v+r6ithKh|nnacJo27R{kg8)3!$
ztkTB4VGLXa$N-#Cv+;H<viQ$ucxS8As>56dKF4)dx(N8Y?>uDUiPANpEKm1cz#Mr-
zHPC_cT<5z<rYN*4$jk_s3?4gg##sFjt}SbK)~BxA!zF=yP}XPO_bn?hpQwWM1#0OD
zEw^d{o?`lf&GQv(1+h90k8)hBLKosh1q`dSaig=TSA)%p3iFKW9R;tR_ohrs+;mV+
zc(<>Vk`dT9KF2y!EoP{-$tUl@4fmM){=_Aqn_jPZGotqRYb$2_>qW?npY8eC_9iAO
zp9O9)oey14C%!*+-%&Vwmy}zXXAR2K+QXFYrJ+aZ{}rgIwyMe%@wo|(#aOA_aNMYb
zVWv;zS!nQoxO&T|rvLYUTtY%g5d>+G5RsIQfe478s7OgE(%rowASFtOG>lRjCekqm
zg7jz@JrK#!umQ{e-k<OJ-}&9$**V)e+w=9j9(hd*o(KXvK7CQQ4ZNH=A)C(n7e_1<
zUF_B<?Uor}mwfvF5=8kj6zHiPL|&MTJkyY+s6%9bn7f$L7tI%A20R=Yym32Xc(w5m
zN-A<R?-(9b<LuDcG0*uC&AF0`Phyg$yGkcKDb6+*u;akHaTZvn!et$e@u3`_Svko)
zXf1=~g<&i%JvjUb41}VS1vjs0{yD|IC6U=rar_-d&y_d6n^&D$YlNKOd{1kF$ht3x
z`z~3~hCQ{bCS#VyXJYy`*$Ow$2?O9D{n0AZisJcYsg#M5{!jFCqh7Mv6I&xma1yfy
z-rTmGmq*M&_6jpB!g*ToM&o5UFPr)J3n~y2%z}sh%d`ch%Z(0^h?(xZ@LXD_czKJG
zt<n7daio<SQeSw4l$F!}?O~jBYj7u3UX%nTQSxNgr9X2sOVISbV)nZ*)$Yj(l~?xa
ze*QmgY<cZXI7;J3jAPureVpPN;lcv5;;Hy0nm6CY1=^e-#Di6(G<FPFix41ibW$Fh
z-8GACKiH)iT3{Rz5Kl`TGZe|SJ0A_wu}_vCes(ncAuP59ITdlS76wH1ra7joS{H!`
z-Pqesa>`?lG#DR^Fw#Hg(!EY9npSjH6R|lsH7M;npgnYfAzUB9(h==e7E`TgfL!t!
zOL=#orK?7&4#&X}o~<o_#}4r`ZmR`1=KEmG8(&Qdzk}&-{k!x^c_ky)8>)bDiieg=
z!GAqK<T8mg_~_~?xBeZf%5w?~JolR3w0W_3YD6SIK?x%kQ|QYYE_c4LHf#=R8bW{d
zXrYEoeW{oW%<nYFji#g-xuOmn!7%9AU%E?dmDIAs3UeGU=%dw1M5c?hcP#_&!|{;l
z_#ndQ$>mTIHuf$sH!54BK*hucI78i=QG1X5oR#h0a)}fFdGG9w-{wS#?vN2SH+G-&
z<?MkXFQl^%_}m@)0>E3%_wRZO`=3kiMc$yD+$M}~voz)uTlL;ye_`Bjl81L3d7R_s
za0tar;0Uj{iqBceKVy5`lQE5VNc&1+sf^#|!?A_!WRk0CXqZNz$LrX+W@J;<Cx7rK
zl<9ZI@4o+UKvAsc|1yV1Eveou@5DTFWL2^*j<-QS&2WG_ZNN7R3d>^JiVB~08kX%<
zrxBuwA&p6wdj%scSbxT&sknqu$w2N0&b(L&9ntochAzBfy+_-qC-<9&wzk<03e2uf
z)f>3IDb4zrC5}pg!$St3xvb+^c^3LYu9sLPbWs4@)NkEv<Nnd4A^p@|)<Pc)`s)LP
zpN+{RzaQ;EYMgrSU=}?mKUY}zR?%>W*k0#EwQTnP&?4Ym3YW$83dmjxeNp(oS6a4V
z`N*^7X5>(!lo|>zo&LGD?kuUfqm#zkrYie-m21=Z@8?tK+nvRT@h~+~0C(WwThaAy
zc=L)#*iKJF;h-}DeW1D&$^__$$qT?J`$Pv2&{=K@jw4S*f6gp|1=J4@CXMCLG0}kl
z>^8Y^ca}Sc6?3H(yMQ_Y>ZB_-k(Hr=9_FDa7|DN;*MAAKKbF3p<i<9!<kY}FmQ4Wm
zg0y2-3SQVIl#4;eEgBcAZ)20aWKlML%Z!ud@BUJJH!cgW)GC9x!X1}DzJYuVK;Fig
z<MsYlxJ{dX1x<P$FM=<6R|awXat7DSmK1~%-;Vn+oZ<2TM}N7nsA$U}Enq6wn-q+3
zfnQ`tNTcqRxoYkeMCfk6vq2Ik;?mNFM7WF+xxIGp@`s<j>_o_|Ty|m?l$1#wet&sI
zyz?ip&Wx_izqAhnB*S9|drs5=VIBSa_pu+$(*$R|6;?uQgV(N3HeUghU&h#!0N&(<
zE?E3Bm*eeM1*?<3W*LEkqR2`;m{_`Hxzgd1)=`no^&SoN*4<2TWAi6Uxn?v7F#{x!
z?>Cww2ZzG`q$7sRkl|@RN7rrn?|)$y3pWL%-8(NP;cS2RGfuwSY^d;&?Zu=Z`e7!k
z*u*K22kC*n4HqyG2eKb)mw+>?{$l~cQSn)&@_R(ujS43)<6aP{eUJ3rGPAt|ldthU
zqtg>psk!3h>iv=aE_|jdA!_?u(fP_D3^zIW=^x;T11=lnj$*T)|HK}--`L+CG@$Og
z$+eGfSKYW}!?V-Tgm5c>pXm|nN^CzZtXwoe&-6Blz!JIHoVWi@HstbG<qwk_FTdS0
z-uOIKlFUEE66P4`f82xsJ3%_B)VS=N+R+N0JWTP>)sFh*jX+q`=-BYEiW{XJ4t<dN
zEA;vT_%X(hOhu;%2HNA~{tdt)&TS6tE;|aJGAa|-$FBQVKbGxn@?6&SeTd4=b~MCU
zWjwIu@Tq=GPHt9zcPy+vCVxGY6l}l?cGaoLV+H?0S(jF4w%o)L`TA>x7tf^;l6YJe
ze!L-ZX$hP9;res~?e+5z<U0k=Un>1#>X@~cIcRv!#C^cD2Q;vKMwsY7q&)y7f#Q@+
zX(@8=iM6Bhg96i+0~g^IfYU^-(be~5t2n<*$45)@Qf$SSAdUBZ{z#5N_8KtvH26jx
zOu+N%er9Fp{T;ayt>_+#I;qdWrk$4<RLgl{A?EJF0lukSQe4}eB(_{T;lXrdpUPWo
zk#|~^iLQfr-P}Mov}Ib62i5`-&CW#KdSi}YQ^k8cxyD806!h=3RLGKtJyj5swCEWa
zu1X3l%_~xGLKX@h$o1%u2%^!4JGW+%X=&`^<*BZ#AOkF?kN15>2=?2Ap5-o(K{Z(p
zIFLE7$AxWewt8<#u63)4-1~imI~+b&wtH|&BL!c`N1o~~0s?z4;oxo_5$(My^5-|?
zJ5?SCZD!YztHo(@mjLcRMbzR!o$VwF+FgNVZug*X2-^q~ja;n$E5gKf(A%_9-*gfC
zpHnx1H2A(2GfI>)w!CD+4M?ohN3O2#BTB)M=SwJ&dtAyVSK+}L_jgcoWTG?hmt%bX
z+34cS{$qYc_Knxp&6BhIE=GeZWfS}a<8DzbD<K|q^OA5yeVj`2w~o>ah5yp?Zs3_P
zT4iJ1<Zx^>Y0W8r;Z7WX%9@&(w6yfpSN7Ilp4vHk(5hCQj|{yd&wiqc9V|D>T6ccE
zBLph9n#9uJv*pFxYjJO}3h<GN#WJtVo*c&~`;|05H)Cj9Ptb>p|Bx{u+;M@aA-7p_
z-AT)e0s^zt#!0;L;`q&z4s3p~%}h^$;B2)5fTe$E!6oQ?46ebv1TZ9G{XotpAD~wo
z$EbZ*f=_E+0+ev5^9+yDZ?U+2NcRiH$LgABPZUXQtwwR9hj}HjBCZ{%iDQHE$-7Q}
z^Mr;9-#psklNzPnx=oho&o785%ye4v;5`qcL{8uV<RrNjHr&(0pQ4UgGN_&WFfFc}
zPRPA$1+u8896KRC;Vd+Bvem5SVk99W62I3p$z{6`V$qW|C~MX&FC3(%-@fDvnS8|R
zXV+K+<=uk-wPV@u2w-Ye^Jq&~u!ghimR_(axQP8?+Q3rB8=tw=$f5}x1vUiIObRD#
zaC^1c5D&j5F86dE_XTrRGOI7&>&8mSc1HtG#`;)M0o@13CmLBJIf~2GT3DYXekrOV
zn1-bSMX1QO!%-nc;LD{}HWt;xu_J{Aa9KgH;T!%i!(a<RK(=8`KTlY(W3qYb$?3E2
zF4~7cO>hY2a=cXL?72nkASb$ge;RFcQ(KeF?knhq8J7OpnF26|H#RQL-qi>{Coubh
z;tc-U*p{_%?)xyCP@`0BK&}3rxWIFkL6Edo-G;nd;P}n-2a^aQ)2;3M<5ZMGQM*s=
zvrmUkg?i@ytRJuMR;dhG2hlje4F8!EJ$O_@ZT7|ZBV=Z=WW^ABmKX$jjyq}kZ(iLp
zW6{9LGm4A;uKL=-AA$~CwC+NgSmA<Dfz4L6ku`Ot*CpFt+wKsogB!QPNA5R4T1(#t
zTd$NQq=^jI<WC<?x@5kQ|6v5-^X+AgO9&B)9(>{^vYtz*KeCkx&pN`ipA3o`=WisO
zZM7e?JgYqj)^QF)A^{|<!E?a+lD96%C=6ceu?Uu6W@M&)91?^i8(tm)8e%}mh1)jO
zIK^aE7B>Zz)h<UFD*vAJj{ve%(7?1>Rl_y#oK9*4_s>4wBgirGa_#lHGLp<vw-Ggs
zG~H<#;~O!%NWlEB5Ql@yU0PlHcyxp4JoeN3FvZi?*C_1(8l6A(nnGKr_Wt6Hrzz@I
z1mcYVm*y*+q&K}g!naw%7CnM?&qtukK-*B4kDd9e*PGonrYo%VJSV%e)9c?y^yfXi
zw9bBboF7lP_U30KN5ufkVo{II!TpkFvn>Zhv-Tovdl5(~=Js~Ai&cWGm(9PoZtauy
z3DADFxez2!TZl5ot7FG>9-^h~bQ*(o%m|BPYG~ITfg&6AlEPm`+dJx38#S%&y2!Pb
z4iJU*8a@!yl{2fKrnY?<|1jqTBdUbw=r<{9A3D{%;k^&fQOtD3;!8VdymA#evk{dr
z(#qY-Eo6+(<?VEWNwhUVE$P}D{_l%(_X?ru^;H82qWO0iZ|{kkRGRrTSwZa@@wHx0
zLrKwtzf2dmo`VUC4a)kze9vYUu}eM&{1F32fKhsUr=5)v@-2*zCvIBvhU=0>*a&EX
zu8|}E*Q<>S+O1cxv;A%<P)GTPtQK+_2!Sx(tR2G;6r9`q`D8PDHhTEswtL^%i^9NV
zEc(oYsci6|{qWv=P9#|+nAz3C*NknhWX4?Qpl(7`IiYXMKO8@O>+;>JZeGai%G)Qo
zNU|>btcbQglo*I5;tv0L@v@+vgHQc3{)mOi^_K1^XANd&19Af2x2NH|)cR+xj>-z9
z@y+oqTDY51KS0E^4XLRrq~+(1T@4|kX8N(V|KW*IMQQEo3W->tO%NGWM69eH%A;nV
zjMZ8f*Jdh`Ni^r0)bq{ae*Un#XR{(>$MDM>4BsSPx|QrOQ2LWzWu`9=Y;qJKPwXKg
z>?P`>x}8{Jkb|Df${veT`sMp5&N2`-!LkY4ay=YJTO(yF36VlQH^`LC$ez-UzH8_>
zzrL6!HskghVOW6LFyL)DS_xxY#+X){zr4Nk77oOC3WT}X)|iwfozmRw$v}b#IwMe}
z?cmLDV;8^*Cb#)5Q2J6`5m#PUMy8&hCaplAUNLfB4LJ@pW?7PX2qRG_u9nHy47m_Q
zc42rJDPR6;8s%;gHyfSZdV4=VY(BZ(X*dWO!PW?kAlVNc0PkKs7ws|gi&$xb`#tI;
zj(d&2JrB7Yu~3oT*vR~<!GEZ}(8#?=0qjql;UC#NcO4IQY&CQm)8o5cdmfFn!|+=|
zVV&h<md7>Ld~9cNKiLD=@w&EHBhQAkkz@Z3+tA_Opx=OS(O$tE1jvCxyN>M|5lwOE
zkZU(zM4V{@^eC{*_(+%}Q!A|eCOJG1ZSn#4UmCnx{w{$~`Ec3jf8}|XG){bm%FLB{
zUMJrsgg_B<RfNNLRO3bgyPj#<w=)oiVhi~vzD!a!t=3d_ehy>UjXaG4L}MPoFl7#}
zvvY#$sPX;%a^tRCkDAUkbv^8+8Dl6Rs9j^=Nv3IBnStr$kz6SxVqTIYc`~VIPrRVf
zKSu&F^NIr6d;aiG4_{fbE|Cb?y7@FXVwOa{0f*E?>Z!%^Rom*f^Z%*kA3)HPQ6+4!
z*8VB)(7hbP(p&|PKt9bsDjD>(?kj5euBqAgpe|WsvK-$oX4k2uXBC9<Et5?2v=!eI
z(hk!ph>WI;pu_KE7W`B7IClkpA&||;lKqV?Y;(^`nuBs=H`qeX_vu*)YeZVU1iCji
zg@8MAhO#TbXR}--?{we98s?oPbtt+NKlBVQv;xA>EATrSxdOCoEv}{3LCbKU^|zps
z88^fe2%q)e6SOCMe3dMZEhBOBR&r_V)xR92WcL|zY&ehe96wx&Zyt}jMv$d0KK?p4
zG3`C(wh^^KM(e{Ua@{QjGRQ43v1Z}9rES~p0yHS%{2lCkRfM~bY!Dp|{1S`&6_B`B
zX#t7?@qqLoD01Y&chPJdH{%BR!k(5s_dL_eH+v)>AXRE(%1k=m3@0^m@7bY#`Mp;K
z;uxnTU|wztLhzV;a4EnwUxEsU4vezj3tVZP*iY#pM{u~(b_B9u$Z+Ln;(vacd0DTF
ziCl3?UJgnQu{vzpJiUj#wjL5OnmoR~rHs^_ONl6mA>r>wNSTYdA*xeVZsYAhBjxTO
ze4-ps!z0!zWJbPC$G!7zXr~AjGDqGG9cuq1!|_4FpGS*4Y;^uF>U$bF4-Sba9OeRn
zj!Pa-E)0Y{-b$E0R9{(7R=?|!<d*M@zPd2lu}REW9C15{MuRXFqCaM2^!`*YdT*U0
zBQk{zGE}<{aC`NcMDNBRs~SifRwWyId6q>`1`}<7cJta==cKhosXYF1JFxr8wfAY<
z-;T3$b{-f<To~E=QreB}u)G5_5k!Jl6D<n#$z<MpQ->rM**!^YP%7~XSg0{@qL7ME
zr?zr-k!Cb_M9V+(%<g<^uiBl^?fLZ4*1NsI?ScYcF2F&SsmEEId0NpV@doD-ENXTv
zPeGV$V6&0+#0RUF^`cI}5k3nLXs7Vt|IGwUZJj?nfXYzjh|`&otnR%&Ob(BKy!+rX
z$6Ns|<M#b6@RY{T&1d6Vngqd%T2&SO{`*p62v5VSfDy0|!dc<R2KIf+KA`SQmN+%S
zW&Gpm#%iImT$laGeaLVb*(3`f;d7^#e#AahF08{Jo{-XFaq{u55NqkzNXnzV_*=zE
z$i3ClNG>}#=*w+>3Gzi<&a=47Y58m^B(cPDn1y%b=EFjfZ-SWW^7XAUy=pWRi#fNC
zpII$c<GT&$41&FQF>^J?L}Qj1h<l7E2qIqfC0;H1Fb9H$we=hLlkAf-KmAYNK-_1i
zNTu$LZR-RmO-ZP?6D}vQE$ffCw~@&J;)|7VzdTC?{*f*Ow`ZsDZhPKZ3TXxRC)0MI
zJXPopM(Rm7<Eo*Srhfq_dg*Po#cgx!FPbb7xon0u$DeWeu}oYyua!4k5BEC^dUeVR
zJoz59{D6G6YIzPrPW6)y@*Vcu8V^EGyQx>1+DU?Di(vJ(N=T!MU9SCg(=kT3%-z~L
z0>u6>c_s9EPg?b-^oQDe&;yr^^Kbz$%;6WOt?#_UOTtWz6<{P6U`BhPUhEYw;}!pD
zwuid?;Bb(r;(zo(jL+7O@P&fQE}AgxH`=O+to5yKrhi%ROkg>fpt0p;)O-N^ZdzlV
zx1T9tAs$VGnH`%TIwB6BLMxO3i2VFJV6Qop-`|9?C+$;X-n;b{8XiERKv+arrAdV(
z5X<O|k=J?)Z3{}5L&N3!`6Ht0M@aqBc4xyv8;Memx;svbQ)jD=zLy)k%fthSP`UfQ
z_&jm<+1HfpY!NhS8!Zdq*p)D=Pa<!N5t*qhH3*H}VRM|kNqgJ;{4k=;##Y+2%(D#?
z!CWIl&&u&&vN_VF&Ntn^;-EKdH(+qNc(H6a170fiu{27J)QAnnY5%9ktR87S|3L<x
zx6OA^Fuf*c))c|nX%2kHCPr1oP2lw4dA{R|^A~LReU$BgF#lP`L`IJAk|Ds=8#863
z&d~^+Cy~P+i6JH(*`;F_R!OcClb1YX#3nmK+uR?av3bJ4hxxF}hxK%ea)Wc*-B?E2
z7Cgx9KHR*_%r-1^J_K8Dd>V#iMCZ!;Wy}NoKzR?w)X*Pak9YrY$_r^?s&(dShU7#t
zC2O30s7AKfm`DS=&QemKrIVnJeMJx8zqPfKe*R6x<o(G~_~629{m9>N(NlbQk8Ya2
zyuZ5m_W6aISIZzYP>VgQxu5G<$C%MRape?U5K;Z>fBxT30Ugh=H0}RodXyV4L#2Yf
zF9-*hqLW15+lK0AE4XElwBv{v{IAA?-OzrO&V6P_0zqZ25BrjUo=2T*Z1VBK&x5fm
z>w_#fFd5ojjH<re^7~4oSP;0dbFhKOqNFx{+|qMaUIMVWK!R|umq}^rwoOL05rwxx
z|E&Mlf~iG%GQy8uA$^6~{sMjneCFGZRA*lz^??F4aP;IfHmvWM;_40Ku3W~hy}Cmi
z7vF`6jqkriEXR>~4*R;P0FHk{PYLS9AtnA5mBW7W=7BSB7?q~Wyd716(dBAqLo}`5
zJ+4;RSn$X0YQLsBy2J|jPcOFmYDW7jmj%RLYOJYATSK+%|2Du+aN+gV!8wYaNN>Sz
zBb<UW3p)$SG5*WTIKWhSkQ^JQ^6rmY=*Cl#a%naBIY^OJ(E681t{42ke}YcaVZo@Q
zvO-J@B372-^Gw_t43AH1zaVqT;}V8B@9q@rAdsL`v;NN$U8R3UGdACSA5?4a=L^%_
z-?4v@EidO9BF>Q&H%v~dxjZ)66eLYyrH}fR>xD9$?Cl4B<ggZ5)Nis5_a^}@O5K{i
z1RHmt95J~i{h|9ab-x}(e}lg^vMp<QC1>V2-t|~6;9yqnj(I?BQc8iEPw_}DPH!by
zW7Kg0(g*`DYQ1T?rasQ}fRO-vZfiy&n>s>o>4anWh3tNC7``~QTt|)@QWh!XpljsI
z(R+TQr(WWu2R0Jt4BOm|OOgX*@7hW%`$OmZaL)SYw0v`qC82x1TlIufvKBK`1^Ha3
z6V&;PYRm9LY>)~m>iQ3dVQ1^oXE;Nf2nTnu(<&$0wEc}UxzRHTR#EdN%dPg}-K06O
zf~Y~w;|aaPR%U%fjiuD4UbTIh?w8v`9~Et{FTwM06AzMaomRdjeM>ia**V^oVLmU+
zA96-+idgF>w6|_>=<yW=w#8XC@sFxhk<EW|MNOPCid=WAOaeeJKbiAYc|Tp0JJW*$
zgiM=NHl0KMCg>GYejsJ38bybCPVaGCztf}`gYs%IRap*?u4;^k{*fctzkSndNNT-!
z0!t1lWc2ez48h-|7Aa<}og=F#21Nf<y@}p4N{x7!qBuKU*xi|vApBKv#p8VGy<#hN
z_dYanX>7B9Rpc47-|!{S+4t>xWlgz@-W(dHJvO&=|3kj8{GhUX1;Em7oZx0yX71SL
z#kx&$lS4b1(gsTLLfS^@RhowPKx69X_9I00bm(-uA3e}B2wQQ|^;6I%*%P}-Hcf~l
zcS06j$nQx3<;<hYIrQdqB2UQ!Hn`@1SLMm5iX6Tt!72T8Vs47vj7;LvkZ#ot*#|<`
zlX92Mr1Yw%qv#FQcgtrZN9q<eFx%0-f9dP?;r3A8;4$g!@AKYyBk;EMqBy=g<aqIH
zS3cB3{^jZa8Q~SXTLz8Dhx1wI8>i&I4YrHDU;mouFDLJXWTuAz2rtimGi~*`AAGj3
z9dO7D_}sd}V5L+9_j!qmTRtzGt}-)|Y`uso4>;!FZ0FU$vxe;MIIVkZR#(|T+YG~l
zI;O`%#7mvPyleO)p4Volo3#B5@g9LsuFo4qyW8@r$~q(B9bhCGv*&II8=LTB3m2c>
zHCB{i_aI9ZmG>+8tB&zALu5BvFJt_^H+l2Ivk9{3rJxgV%j7@DJ-H+@b$={Hh?K;`
zV>uwswg9vX3}|&2YWUcM_PUu4oTPvCX=#YRBf~w`+=~Wad^&dfpWO=OYW@g$tsvDw
z0_S6wUlt(zTAYfQXFk)%iW-Y65Pz!5k<R}@*gu9JzBd;X;dXvG_rdwJ>w>}|GapRW
zJQz=yaRwp-;%1jk&u9_7xv|TnLR@&SZCnJbUG<z?DTvPdQ-BKUH?!s1_q3zIFmWpN
z5<1_}4CgrgSB-#NE)75__+sV-iMgu~4QN{{>Ke9tW{Paich>17{Lh?kp`wHX3-&B6
z=&3=t?9d^Peoa-B6-bulg}Xj#&)#}R9+6YYF&!Nb{&d0FT!Oq8>T#3In25@<qpb8H
zd%)+ytC$+VO2Fo2LP(NbnW|^|44m2}Gdt4zd_{4IBmeSrOkD^G#69bkHEuy;RC{T}
ziPh0<1;G#9`Bx01pU>|2q>eEg23l}Gb_Pci&|Bg2evmm(vod(T)@@7Gp@e4nvaE1R
zTV#AT&*;wyJ0Z7yqgk{=n7;!s|3DPmP2R`n%MLt6q;7nFR2mYVyQzk}#GG5X{0eG2
zk+jbI2&$BeAX$`-t&+>Dgl?A^H1YtIs_!d$4yEhMH6<jSXTE0|Ou;t#^AkMWrZTLu
z)!w%|-c<nj$NcZQ$AxbFPawQD!s5nfPiq*EZk*rl9~5E_4uHyvjNETeB;)x(yO5~|
z`FSRb592Qm7QLp3EpX4>5%}tWU<gIDBMa$%iQe#^Osm~$KiOVaO}FAHiZ9&5jfmxK
zPmN1;#)~kVN3+#9^Gc^XWe>7IZJzPw`K&SsuXMSIf_yhaf_$R)pg3}L2<eN2Mne<x
z##Y{Q%z`=svWJ%Uim~(d=^FLGu&u01f=rW3flzL<j{nYtoa;}ROBLfn1G;A1DG(UO
zL0qvX@5KZ5Ha&oaG=qUl-Bk7Ha~8Ix+>vR+v>+>x&V}mSa?lFLai01_o2=}R3+9q`
z8GhKZpCM-HYu0zUx)GQH<SC5auZ14aG{?qVC#AkSXY#$F)^h#&QBe!Tk|Jk7^8bx9
zyl`ayUne7G?RBuH-q}aKH!+!uvgD;8plUwiWfCMApzWU1$#lQ!RczkuE4j0s`q}eR
zuXIvI7Onan<@Bk4QE9Sgf=)R!ZJu9wc#k893E9t2J}7F;OAMR3BP8lJ917a{k|rOs
zfmN8blK~Re;%2hR#?8Z@8r$68)M~snt3gwI4axz4kR3iP7?pnzk_L|2AwFN^y>9a4
z`qe}J{~S$G@{pp%%J~P+hVeK=t%>D9N4r}uvu!Ei`Yp+CVd!rC6d;+X2A@g*;nQ=O
zdM>juR>+V<$8Soap1KKUHX-vN?3OP``xEsAd#~zC)j!KALX5(Qt!3f;^s}Pjd<iwo
zD&P=K64_0;b376+8>X&(%3wWdT+cLzh|Z?Tq5U1S<L0j2wzw~p%#UizCj7??h7)FP
z`J5wbh@PWp%W6m+xB9M5He~*B^n%mkA~eia5f!f-n?2GP$oF-}DS{-8TV58H-Jach
zFXBgj^b@|}FQ#~s`PNQVOUVhIgVwD$1q^<FdPjE*W12bM0UTkdLvHP`)FO97|I;I8
zOc0?-g%Con%f9e05b1Ki2!d@VByF3yXpnOScA$s9+G4hf))keH1Z22GplO%gN_iA>
z5muH-o-p;~(=k<B&neoHz#Lh$+|J|=w<Q$6r&$Zp4bu746SnVY`K%ZJC(|Z_;+%m=
z2{KMpL<U2%NLo`)Ir1}jX*Nj2C0c$THB%DyyIToBj@LNyUs`k$4rnckAls(}$Ztkv
zyUa$p#TkdtEwJoCql{;%h4EPHmi5i9qMyWbq~ha+{M&e;N_raC@E51$>%n7(xl(2Q
zBk^vSL+@^3*{yzlDhP5llCY6i|K90j`#bPtIU(&Y9}<&05VDPDnm{~F<|4crckt(1
z<)7Y@wr&4S5S>TihLhJcsYn#u@}9e@&&^2#f&CgpT5RRia!}PFWZ|Asfs6q$Xv2gr
z{|;(w_H&2GPZ?91nK=FsLq5=6LKY5(D>%oBE)WOy?<{UXNb<aoC(a5*BDY*Qo);X)
zfFX`1lVhpq*rA}^<V}PXFR{DN_N9`x`#)ls^Cs$C6vl>L&s>gJILr18>90b!bnhb#
zsMbV{@?I1Y;P?4NFKlq`$!?pcX!Z&xx6+yb?nl`{c!J*}vMKaSu7a!PNRRB_n9OjM
ztIdFFr(gm(k-2Ukzb^<$j<~<7^6{LxO{4DYlpiLxrzm4X_#Uc*Q%pD&$KoMS?C#wI
zy;K}Bd_5o(aE(;BwSTJ!Hz9wuvooeuV-3abqL*M}OCs)%Ig4t?Ev>6V<Ht6`{>aoA
zO`CN{GInT`c4q2z3dHf<P=E6G8JwD5YFz!VCdE}hshslj;uM=yM1L5cNc_QZKVM+f
z2?0<{`<lCDfcky_YNFq-!x^~l5bsgJRg@`VDPCV%wZADhUaAKHo$R_n2D374ClM!n
zJTu_`ay!PeuuwGb>L82iVokHpy0@mgl6Ezz!$Y}=NJROqT;2+m?adi+?<NAj^WL?I
z_y-znmU50z{2+Ce>(SUeER|tUA!PGYkT{&8E&$~!@OsNz;9CgyNFfFAp_qj1&z+ND
z$S2O#%he-X-d+w!_^_oUk^3h1O>-1d1Lj*<8}a<P1DCV_Pu8>nRWL)^NLArELLfCq
z-c{+DjMuPv!?taR!=5wnbPVtkj#~Cgc|8`kah?ny0m5u4%>NwY0r~>LDI8H855BG*
zyjiMgNuRu<6J<bmBX9NF9i2qCqZglU1qIzdxLKxoF}4I<ZZ0!Ap~MrBiy3))<ds>~
zOHk+-X!D_A!PDya1x@!hUe&9|@oAz)T_f337xMWm(Jt4iSrgZ;$U4{d2gKZMX_{#D
zGvkv7S#frrTWuf?z|vuzeaCl`6~{h%)mWYPMJ&zvkO3@He4|{iY{+hjDalLDDF(Bj
z4hu?vf3>m$gy89Z*)wXUn0p+E=ep~IgMa^ybz4C$xN_QQU#h|P%EnlR&%U9nOsXV9
z+wKkLe!21yWeSNj7ENBiyBFhL&|2vFW%pX)azU<8%9<B%hA1rJ$E66b|NcVsaF&M0
zwLEnLnCSkYlk&?^=9-AVF54d!#Kv+}*^DQ`$Id7@*&Tx>pyBg&7h&g;d=Q%XxOH4h
z79iF3j(t4u)4%MIn$>a4d>_+Vic~ra_@{B5k(95S15ma<9pU0OOi+Fx8jWE2JQmCm
zf9!uv)=eY$;>vrdKp2MS!g5`YY(nX|OXGG80kP4E4L{5HxK#|oxOtEY{mDfh_=_v-
z*ZM!)w519q{YFFLoa;~d1rW^|DI)ito+N#=WbR<e!m)l`4L$n9{o3a4_op1jZ%%(S
z!sXlVtkF~2a+`g=N8#pTeSzs=KH4HaIeV;~Gt`|=E)D})K;JYIxp0Qh^~*<C7R`)F
zk75$HrF+E@?*>mzIw`LfJtttVtsZMqS84!tQ4gNt7}+`PT%K2wfI?>q=}#x$3wA2<
z_R5GfX%F6T@LmV1-y>ceuX`W=wJ0}(6#3WK#|JEdHiqsgf~R5=^)5WiocJ9@8;KZP
zwVKomx$37wYy9*)xGj<3kB4&&-Kg=RXgW{OwQj*8e25mqRDTj*jKQr@gO#r*n{Zlo
zag$i{&blnl@MQkjv9Ffb+Jk-Z<>*W<JE^A|m!bwt+4c76eR^LO8ZRA_P;_t0u<@Ar
zFYACC1-NOD7NwuK$;VlZ%r&`VnbCsdzklL}2BgKm(n$0-Ho<(7X6hmL_e+3DVmRB^
z8;O@tDDdrcmQOhOQQ?LVThMPvo`YoP(J<z&9_ALmvK$7VVeg-?WfiEc*PShtSiySf
z*}6YyorFJy?GLom$~fZI`*hx@c7z`nKNdT=Vev0LRBT^pbTKzYP$5dLm-4Ru3H#YT
z-~%F4ttEzu=K~fRSYBZ2g}W%i%rxc7uDk@@2hSS-UpGN!pPP2vKTUK1R7GUN3rtBr
zv2iniUSz`T>7UTfImE5%%ZVKRn#<$iEPjVrb1YcU)3>SiL737u^WVQ^4Ze{Pe|rgZ
z8`lM>G$p*|Kw>xeG;{@9Y5+F)<QGt--&{V^5ubbWi35A9G17bFN`RguszV<{?X7Pk
zsOuF3z@74kH|%=jDVV{q=(}`3bta!#nIA>nf&jW~<Hmu<_q`YeFyfSU*88yC<omB_
zM_Js)Ni&8e4FkV|C&G71K9rnL{c_L~(Ro0Z)K2$$-qHv#DPuQ96F=9o^0V{bbKthO
zs=>95BF(nvgnhH@m$QW+R}9sV=zbr6G(Yq;HstRc52H8#c9)^KdyeqJjw|-!CW}7Q
zZA<O<Wz{Qp%OvA=bp*p_uFZ9NRJnw_dh{(*0L=eONFz;B_-=C~=$pX3w$FzMuMc^%
zm`sgpn4Nj+&R08nC!sr6>=M>Q-2c&0^9xj!Xod7XRrTFd>J%Hk#(03R^tF|;t{U<i
zV5xd)gmqwktm)28HWW?-ziVsg3*XbGYHtohNSep;e?B{7+g}t7zH%XI(DzIKdJ#0t
zj$h_yoKQ%8%Dk{;lZ2H`rsVQlQa6?4uuzKcv0Y3n&+&K0Usw0$h|PqIA+WOF#)l09
zj=A-ida`b&&F;^;<w~GYqKF56uI~3(XoySO{xoKCDFF<}Pc{axS=m>FMoBOMhH|QQ
zMVt6#{_+7nVdUv<7~BU*IGy~kk5ZHC`%|;nq`eqO=gBddcv-QhO?&Qa?vX7n=Q!HO
zNWac-TJNuW0yjUq$xugwRsJf~XDdz7>!_<)ol3aN#WZ9D{>>lgxj2%@W)vUU>|OWj
z2+wu!<eiqD4L5ZPW_u<3#|s{McZ(vs0GxV0{(D4yDWf3g^2avrTGDB<RZ?WQ$ocjf
zlxG@#P$x8_7}0GvuzM1_Jh{)03p|vzcb%5*T{z=Xu@{)u3tA41)EK`hZuQ7<RemDk
z;^;-W+m(~j<N=HNjoF!?J0Rzp*L6`g6O-*)*}my}?t>~DqMr|G+k-s1gWAm}`@dhk
zp4k=8T5`0^$o*UtT2Gj`7dt05kSXq-0#NBY+{%G;e%zWUyA3-yYYrb!X?RPN(2jN3
z6?L1fjXO~HCdzC}eREvSVNX#$ZT8=t(A*ojn)ofs3}Ta=A;ta)Yf|x=zHiNu%}lGV
z`AEH$DM}Qq2C_rgmUV`B*Z1FuhVyOQH;G0eh}}U;E91o$@7sB1=2g#brm$H|0#@x=
zI_>DG?T1UBzIz{E^G4|Dm{c9qpUbWe6iE@Nxp$7Xih#-HjFDdn*mL=2D?1?id@Q?6
z?Ml2bp*j5?O+|tFY=ejY$_3`<vfQVtjmP99hC4Ms6DQ}V+^F>@uB=z$%{Of0=_EfN
zzogI$bVo8({m$Gm6%N>aI1UZ-x_7|q*(Myc|B{};nbjnA?%TarT4OfAR&h4b&oP0#
zD!%87YLArOt*Wnalt*^Mgr@fHMY?26-e{>4?tG687Hk{kxZ7t$eOaMhYZX$+j`Ju^
zYOp>HxEUR6=IIwED`Lj{#p#by!0EZ<jL>r{`*`*%b#91{J<8qnDK^$#f?4Ub)yx}C
zz?=i}&B?8Jga2#V+^zvQwhgmga{-kM;Z$j`m4Ug<*(MZOm;m6Mys<9kT_-n0pWgW*
z7ns;LpEV)0#@F`aRsn7A<a}e8(H}>DN>6|`jV{OUzD2H2=f!RZ!rR4`({XBS8^f6e
z!kJ0b;k$^%ra^>hgm_g@!CSCoi<cD7`9=F6hm<U%IH#S*v8(CR8~!vARbzQFCZMq<
z{iGNhPhEj^sW1$((~nk{k^lGbkCWT-p4VcoaikthEFcRhx{q!u!k%`Ug13tjx_XyY
z*1cS=H3eV(zI00!%!p@6iRW<5NQitJ^r3Z)pT$1$JH66_rt(;~?o}$k+0Iyd+y0NY
z|JZf?usnRn_EqfWFgM$Y!`J?cc~t7r7~x6z3xQZ_$@WX>8>U{#)Js)~x!yZ$UwM`+
zNbHN5Gl&#H)1PsnU(SC2xZcnre(zCk`d^`+$T6u-JN2YJ*f%wc{duAL5(6dNceMAs
zj77Bn-c3;2HuWNyoQdchY|GgX(9O6_f3r7WsG~|1G?fQ`u0<(2e-s$``^siguKZNW
zvl({xBk?Wa#+{bjI^KF5=`VKYXLq!By*#nWbVm=h9IzYC{CLirP~etxVaO%dBgMOq
zy8iDgXeDp{mvgQ<xm9Bto5)aC4STUB)YIo%C}}(Ox>4%KSOJXXp~r&N>@AY#XLIIU
z1@{z4%-NmmiZyZPsCn(s2-C&kbT=Z;@zH65neMnP9IWcw`=Z6~ys1<je&#jRlz-Ow
z{KSQrs{y?BZ_JG4TCra1*^b<k!&?t+)qy9F$BwLZ@AB<H_WNlnjGc;Wrvonw8KYo=
zY3E-eYKQe>u;YwAD;b=2b!w9Z3Lnn-Zw@I&rabS_);?~(C3{hYZB|8eEN`nXQ=PQ%
zzDB>t{QB#`@pJDzTG6fJc&96efBdFt#7`_${RedT&%S7R{+|=8smR1xysKgvx<kh@
zy!3d3ouA8&-d9Wrvu_@N%3;B0sB;F|F7r<_)IH2w|Dzo{dBdi~`+$lY(-GGmzb<ss
zJ&Kwxup&M&=f*9Wl}Giue_=hhR(c}e-{qR8W|7WSj#12mvD0%I>qQ}G4U;7(6}?%f
z0WTSXW89qGh{P)`*=AJnP!90m2GJlf{>~!Z4$O;WgQrs~_%@qf=6D<Ukv~0-q4cUZ
z;cS;E=lczK{CTM4r(=MUtQ`KwJtHI7REyG?sw9)LIK-@g<;lUJ)Sy!YU3iPrIWky(
zb{3JTq40%EG1Vb8sUcpO1t3tq2&hE(q?mZm9liYY%Q=p4;Zwqh77FX@OP1`>OM3aw
zve8$0Z?2W`J-Qz?=aY8XPnB^@jE<8I-`4DS*c6wlCWK4aaWQKhaMnzO%a)XbLe#@(
zwLkqE%nqIOdHY1VtxIGz3KUj%vT(=GfWzLKl}hGWiaL7Ntlm`J-t?Z32rZUQUqUc+
zrvk5Oe{+J2o|11(O3_dT>d}3scr7LaW?(pQ!<83#G0(z&Ib7Gg;vW`MyWHmgjU&N=
zz&o$^8JR%18=H*p-T+X$f0NV+lx~LD;9~>UVm*8Bmn5zZn?VX+6Np)2@9gGaL2<>;
z_oA-ccYsy>I|;t76_(TLmT^Tf#^5)q8M0g{<;Gk>e8&;7d+|;iGw!(@*4@U~`?-wN
zp&sg-EJ${TQWX94pO>A&;<@TLChydj+RW9RdR^%I25g4n(mF#@J?xH)Lqdx^80xM{
zk9I_;az_vue(`aAl%Qy3*x&k$R{#*{mfIIJVk?IPW+zPtlI*873_BG)eU-y@v&5Uj
z?@`E8`Ee)FDs;YScBhAiE^u}D$7C;s$M9F2{wquF>f7g{LaTWciYC}J1atj*$mnBk
zi+y6<k%jNJsQH>NXsS$9)T@@;OUxxMG32-T>%H70#BA0Yi!!-^oebj~;SnFG;+Wjd
zkge~pUx*TNgpGNcJ&+WDb-7;WPCJamt8$iU%?$Xv9z6rUmXfp4-a};l)JH)DYSY-b
zlG?ugodFxi;|UoM01=KBR!i3Sb0P0$R6;bZw5MNUP#C<)fIF;rdQtg0ByOy~CPGKE
z^4q<e>;2nNE0>(kf5g577i3k?pE=AThchH&K4Z2;7FM%GhU8R4q0hl8UpzG;BKwW#
z2FiJD9U1BxQ}nS6l$BraK4l0C@=~lWxd;~ybX6Cq8)30Dma|n3UE%x_w@SO))uqXK
zbJ7-@HHtO3B5TUT$s?ZKJIYd(SMUX!3<jECqIVTpIPGvH;is24gZN}NK!tr=IprN;
z!HX^9`d-}_-VFcQ5Bqc}W!LW9&!V<5uB)n|kbB?vIVx9?sAY5q=mUCkPrt-Rfkq3Z
z=(X}fpO$)#{evU?%?S<~7NE_n(lYRl<#*qLR@m~m&=9S?x4)wI6{njN6BfVhqXP#p
zgHcMz3CGbmW`03VImuDB1oIm^7mHqLYihsN>sSCb;hYccvncnT8n*PVX3$ws?=+Wf
zv&U{sy&py&pXfUF(Y&ZGXE?EQ`Lk|pKg__(c|(}{(@B=PEll&aA#+m1OUYcXrBr@V
zh1$l?g#qka+KOkOJJC#l-_1zJNDS{DjCsIqT;lBZcSYM9sP}Y4$@gos9{&95*Ov9x
zBP7(nz^dnh#Fn(Kpv0EOCHkhqtHxN|3LtKX3TCpw!|qSlouv++w*X47fIZvqPh`&S
z+96x&9EKgu+ZFOqrw08316eX@cMTlxGQ8ZDqq9gMq%dY{HX9WXhnFLnw~@?Xb<vax
zJYK@K^Tz8MaW8y{d=iU`UjZSc5N!N=0u@#6bqCfv>BX$iiq~f7=)E!cPYzeHukC>D
zhu^acM|eV&s?Ox?mw1x*rtH+}gE-r6ItlnuLY9S(a%wa}cXWU=$F5(g-#AvhW>8EM
zs_Xs)V_``&Hr;DUebM}xx%W!~xNAjFVz&P}R6yr<pF01M^*^D1<ZYg<ve>SY2q7P~
zHpLDQ8~yQmh<-?c8i|gz9q^m>n>Mz7brdUA1v4+0ty#Qtq!D-5)G=P?ZAB%3HNNFt
zPieJtSyEMx+3!)_#f#uqi$U>SECvjJZjBY_Wx$W|&`PgEz82zxu!BOz!6F4y&jowr
zE#%evugfLs62HnmjWx#wPgF@Yl5H4`8>`y8NN6Z^(an9_TT`nz1F;aQ6r5cBbyaY$
zvev?gLw#n>yL2#P1NdIjtpJjbKUr|o)WFb*8Lq^cU%mzyCGj^BWwrN&bwa*FT1MRz
zZ2p`_wVxk!$FD`pG&ce5R&}%AmHfUa{mR<Hy1GILGgrmoD-arv$9urBsWCD#@01A_
z^q-^aJRn>_%*8SC7A_WyobBI{-r?(o->kFi({)5xiRl5x6+aEK^{wIhs0;<pjlOz4
zepD<PgB4|swQA8k6doc1cn~KE=^4KZ23XpC2%#0~@g5pL?B_`!R{L!r6z>``Y7@45
zdFURpi)pBBTsPjc%>YW^%n98Z$T#cVx0z>y$u}^%vnV{GVej31&)#{`44^ZQC@9x^
zQs6(E;6Sk@A@GahCy$T!+Al*5`|t6Q40Zj0LX_|)typubxoT4$+e}s#gDx*A>cL63
zp6If}w+O8_Ea=F;mmL%7vwBM5tO9<wtsZ|tvrb{V>I_m@vY1xksvq|CQUo!=PkaAd
zm$9;TvHiw!n49l3^4%Y%=c2s+LrYhFO6&nRj_G@H;b=@7x-;&^?>ibB3-wNl64o6r
zgt~YMSt(60|Buz;AO0Q6r375HW>C3y$CBnpI;TrppwBn>MzDM?4ZRX*k8=bp-%}(J
zpvpO)LjS6)3<rA-rn@yEY~~-cLTD(oALT4IE+4>l6}S8Ec0GTV{3T~$Ueo;dWyFY1
z;0V>;D<6L{K7I1Q)?UxdH<ldz+L^DxUrisO^S8Crext9c+uw~q+*)QyGQP`mTZN8K
ztp(DuHKMaKDg5r@s7P%mA&u@@H#6nI$E&AK+L3sr`JIoF)?vSCs6%eY+=;o~y`+pK
zgd-!P$2&sYN~&YeX$w^~<TTwC?Vp;r&-OieCng+vhiOkSux6><OS;;sweRO!GWcxT
zSM4Sr5ysP3y&WNPMc!JJrLH|%)JzI43s1S%{_&P^iR6EC%Gmp@yxywnH=E~Z!P`eT
z?w1gIEdcXu<C1gicE&4h87leUuXviL0C>u$%qmQ|;|X&T4a6d4N;~?SyEX!v?gt%M
z0TU6Ku(wyLt+e>F(a|M!!@i7<`+oF&>2&&dLht$icL8L6Dv1@G<p|q6d&$&iX5W=q
zw=UW<T`@J&8~{n?Uxd6x-C$$&tIEla`#V;kJ_`8xX=g{xeS|to<9#U>Bib7HNl+o@
zVM5X|u646YYAxjKULT~&x+oMaPB);{3~#tTCcwf{6CUI0eF$C;x>oPRl_09Hch9)A
z8;fSWIKcDKb)|>~J>QPX4feHXemLF*Y7d2n(s5|d%9z9_*vMr(uq+(@Rrz%HOt>zq
z8NVj#e;WEYt>4}Kq4P9@weB$YLxpO~tJ$(UBx0o{B$c{Dc#V}Cp&5I&v;CTtj>WRV
zm+=p@+-h64x45fok5bz`f8pi5N2z9+f~Ki|hudFB8-+Z9CI}}!+Q@7OkqXs*-Tm{s
zwLgVjB8L={&NcQ88uR8rMtq|K8;rxK(zJ?V16C!re8;ga=9I)zBER)4w`tXH&N*+)
zbGfrZe|?XUrXgNjK*b0gK3@EX`I8;Jy9yiPw&zmI=pil5<_CU|drxFgZ>>HoX2V24
z+2Z)GaLb|>_+`MO)gi@}E8k?+n_rEjmc*r2_;VQPyq&WFYAZQ^x?&R+bg1Rn`Y7jI
zn3DB5k0OWlfGYSjgn~wN3H&*7Od!9i`BLdi@siS$VPzgJ9c%i@Qe$fISI%f{?tyew
z#W4*!L<e|vA@im4VmDLpkB87u|Cr{152I1Bf*e}5yQ^Z)wvSlpvJ3?rgkoXjI>mCG
zBe#<$@;q9O4AW=S^Y3WaM7%hjeiLUT%gaug<Mm-F4MnM*y@`5!nY#Ku|Aq)mnC@bQ
zpXed>Vc|ldVa{oG#mesnQr6;}5+3xAOSP_QS3j_Udsn>uVIMP>)QFmne%160el5_<
zGTeLM?FE)BpH{u^Px_r_0js(@kZFIb50C5bQ1<4u?ri6tcKfZN!Cz!2<8>sYxtDSN
zVN{V^-7>)x4>aN~_4&ezv*@+4lIrW%Bj#zOs75P3=J^dD3QmHkd+!c~Jt>f->F9-a
z<YFFEezm{9$rLmjf!=i<V7Y&noUXg}vb2oaCSNw>YkthDCl6$MZwO#UcBUqEtrvQ=
zwL+8JGYW**t6oPArB^;Z4?38OggInBig}t|^pxC(s-7Uofr!du%#UjO8<veH>gIBW
z1|X0r;uul&`Catu0NcQZrdm<sj$7PYKLhtwj*fK%1}JW<E`gs~JHGBquKz`5H}=K#
zoxZEesMN1I=OvsD<ju>i&Ar^mDW`3WOc;-`>N!mG?O0KI2P{nA^Tv$0=*>So2I821
zJGBrut+AUYn=@`lMmvzV?>b4V6b#pS%TqRzso9o8&%VxeyCf|oa7XADI9()tRSUT$
zX57T{{aJ3(R?*?pv=krWki&*bx{?<e0i$NM;0pnThS|PqkjF!HKyDbOcd*P=(P-Os
z@TbIEi>_ZE94Lk<Gp<TpH|O}j7rIFD*MrGe&K&z%?9lCJQU)&_<e-KBd({uChlOfB
z>k%Kt2hMJbHYvI<+@e1}oQT5e;l(~nc93rl#v6tBIzGS++*&|u*6Ie;&+z-QRBA*z
zBs)6t?4HJNWIQh96saeciM)OQAkc-em|NCKZxWaR<WetsDO<rDtE>OPy@?HCE`{|&
z7cRSVfpsKh57v##j+I5V1@<nqk=M_DjJ{!8oW{2mz4(v*Heq=pIUUiW?<Zznm}36<
z3&q*TQl5Z_Tl3eRT$yik8<%1_t=Ld%6G40}<_3r-w$i>wkE`}2uo?A87_>JjR@*ww
zG3^G1#U9+(j!Jmh;{ynK&HTwI`;M?Z{5BmI3{I_|CZZ=2Lmi%}Hj{YO&I1}qsPt@A
z4?9Ol_tFIHtbSX*Z&Lf|;AhoOyYK6jCMW&3)d_Ahm1KIrfqjQeNv{)G<AG+wEN&V$
z1D)~#LwA~D3^Jv57qpCQ?H)Kvh<rb*&YoK9)u#?#Yqbe2!L9elY6;pa+rR4_Nc|c5
z#Rn$yRr@@SQ9jVRGjKU{d$vBg2t<YBj@}U=s9Y5xsm%NcP1O+W?)zZw+s~IGlw73Y
zh<;e_<&HE@5qwYcBvbN1c-kg6KJyx$KoBgI!altj#VU~gl|>-X<l=S@mQTHb%(paI
z<DUO?z>!zC#C+kSn5h!)r!js;*{k5?kb|ryhWH#u92Wz!l>Vf4=_>nfDOP7@TR|~O
z5q+F2xxxZY--Z&*A<U-5*CzTm5s>5V{l`zD_Fm|A)$>QV(zX*<JSv?~8GKiI?`T(p
z30Y8s3<)N=BkeCQ#VktIDA(gt|KQaJ+&kvU2j(<QF-m?Etl{`tqQP^DgQ$BHTjF~U
zbRWd?EMGjPwz}qGqKx+!^po!m;UjH~gk2nh8E#3W!!hwlH|C0sjda$QF2ZQLPZDnI
ziqFz+#j-0Y2LDof3ESp`6}WX`Z-Dg*?C_uVx5{n(cjhP-nvFZXs#I@Bn!3%@GT%BD
zDi;d5$=~UFk5W@kFq-X-{Ofm{d#%#G4`u4+`=RAte-4Lwdg%kr`YZP)H;R7@zgz9<
z{&YM%1kaGKvf%(FZ|;Vj^IZY*Bqj2%rLEN~aYfmE-n1Wja(MnMr!h)fFG=id^vhV2
zFwIy~?3bMG)b$gb8B`_U?RHA!-KVVJJKN<iQg3wdaWjHtWVPKH!Ot5qQ+eSBh$<ut
zB@4bSe9+E5Uj5Go4fPyF9pmoI=DGSy8v+gE>cc2=nst$c@*&*KOXUwzpBRch(ex*7
z)BFjgWH3<CqZJ55)aJh^eyks(PuHa!`VB}0=A19qaT`bzg#-`p_|ZQMm<=eTzu)!$
z(e>9cakk+WFN{NryE9NI?oiw*R;&~+K3FO4?v&yK#i1~zXz{__y|}x(yUX|V-FtsI
zIm!8l011#G@Z9&cerv5u{Rm3Rzf{xfj!D#aFd%Q%@_=&}xU}BOo!i>E668jGA4`L1
z8)YZ*s%0W4t_jyCkuLm+J`*?Puy0Me+-DAN7cb<OG<lfJybftgRK9Ka30J-IPFyL|
zNC9r=YQH*ZU8=CV;g`{JF4PybHwfEU?@vi=@1s8$U;9LF^v7?^s5@<}fBsvJ>n1@|
z;@{+Wsv_>QOU)aOp?f@539=MTY9AC;KKO&e51|souv@C{hH}`x!+>Rxd5W8)*&sw7
z%9}Y7?f8xzKr&!jFZGId^N*8MByFd@o8FgUW2t`?0}jigT;uQC59eAt&o<<8Z#(+f
z7utH*8|{X^UV6DEmj&y0RW}+r9>wgvtq>ULh+bk)rBI(#{EO45j|)Xx8pNisfpQE^
zD||rT2+v%Ttds4%{AKEF;#co_KomtKs)VchG>Li=5}n?)f;~9koM!|)2C81rL?fh+
zPMW9{f=D>MuY^f)$aiQTb?{d*-ZY!^%)hj~SaTGpzoFNc7%{GD(G!6ZZ~i?*zToo<
z85a=s`zDULUE+@(&C(lW$pNQjOC!OG$AV_vc3k|jKb7x#0F9&JV{nC!B?b5MB%Qk(
zXLZN`bi+3`i_qwIj?1!+mAF}_$`658IST1S5!4Q!&1&-8UQ>#|Wr}#_#0qP4<9HM8
zTn{2VTuYlJk>HWNsWx(uXDq+ta`}iB6b6!%!IZWU|K<ZTDma*^$i+LPn%p8ThUtU2
zj9Q=3%AY@==*0U@uFV)RbmT_vc-H&PCU-}ta(C{_P?b$fH^uB7A?o5_{A9C+GwZu#
zYw4xeEPhd&iyG1z-045tD1N3zDzopxX~ZDSkZFwb+iOukHE5WJe*hGb_k13Yzf5on
zwaU7IRV%W^-^FS91kCwe>ksFFvy)!+Bn2H>#->-Z{Z7dJnN>-e-UH@)dA`?;O(CMh
zWhcM8-OAT)l>R1G^Ip8ah0F9_DjmAeUYp8&!A;DOiT!YWq&d4nJi~}i%=G%<>{)N|
zwt)Ra__9Z{`m-y0FrTQ>dp=vP3;}!l4tva6`{f|55<iX2RBA2<a&iCnp2PEN>Q(8&
zUV=rfiNlpo?G^dvs@6@+E4{4VI@jgfGS-Gw+wj&@<^SG<?Tb+Jbgi@7hBw4NbyWgz
z5+^AUIpdj{-S1O{(u#-l6<7>Moc)*eCzr^W5FBkg*^UkExVkn{#K-kMiD`c$*$-#0
zPSYYtS}!SiO9=2=B2K=6Qk#uCTihMi!E{xnRQMh4FW=Ge#YS%%N&1c@K%8$(Ix`^-
z&xHjPZJJ134fFmy`*7epcDIcCA3neY2h@$oj|`&L+$Q|_heq5iUPmz021$p8e7SU&
z6W7Y@qiR29A^|G{gm$!L^@HaexN*J(sX_T0sQf49!Az;_cCb3oNPPFzd;E<hlxk@e
zk&vDb_RHSxF>JOX(RVExX&5SwjYUcA?pZ^flP|pQ<k3i)V|mp5duqlp?p=;jy;H2H
zH~Uie=S)>ssm2iwBdJ<F=BM2TZF@HAB%ZGQ9O5JOLM74ygT~C?yxlRbnttCgV1<`C
zM%NPfp*k6tO0A&ScM?a(5sP%P^Rt!&AISANiE~)Jo*Jsl??wQ@*;-YrC7~~GC8;DG
zm+=jc&Zky(%|Z&loOVbS{e9$}XJAUEM3O0v%^zZUx2b*C!>E*?$H_nHz#q&Ed4qkD
z&QzFY`>z-BJ)Sls97T{u1QCm=w&rNBe5UT*-TBTps-*_%3j_9Nt|9itY98RKC}}Ud
zCD>i}<r9?4q%+IwU8<T)2`TVv?zgu9@eqk3bXkm~8nKTn-{~6-`mYVX^7|v!9~GcO
z`=DS&nb7)hQWAT4P&Ne?^-{**QN%qo&x7=m&@1ojHM(IU*<x@Nr+3v@|A6k<^DXmY
zz!*owt+;2aH#j<-ShNbUw95>VH-PUV<iq60I*Hm#Dej23&u{a47kdt&qT?&lIqA2E
zMA%_bO$Ae2@VO}I34yc??;bwo#*Ookwo%8$u6mTwA8g?<kY9!X6)DMIGFQ(%u|N|&
z>ad8mU!}uP$1zOT(w~B-l$^q5_k5x@^OwmPC5!J{<94YU+)Btoy$oJ<K#WFz(xjk;
zQ_P)poKDz9AT%^#8yyl>gS-r*czWg68Wv|@nM<CHB~)yX6l^`H<l~D7eSl6J&2;Yq
zxeA4N*edZBeTv}4cD73PCbwGVSRQ&fO%3yWXZH=I_5|wdfY}pVoP)1^*_RDK%fJx_
z=_XIF^EMMUBKVKp7;?lF0ZEce6qW>Q{}j3+?xPfy(&Sox4ccg@a>6kZ0?6R~X<TC<
zJlk(zpAoBdvp1^qJG$+U<Zy{ART((m*0ZzWk2eU2l!X&x)f_<v<Eto*WpQth*8wNU
z2Lq>fbZ;pMgedUVQ9!TXAePk`O0~B3nf6rfynNW3g{E+U-(=fb_t`l|s@%N29u&Mk
zOl5^;)7CPWI$e$4YDG;j4niE)nfZZQk>KLs%R$rjz?R@K%o<RTEYqSC=jd*^N#2EJ
z-eBrlvXKza9w$D3d1e<T0qd7pBizHnOrv+EE+ly{<Q1LWcNUidZcKr>(`D@|v8=n3
z`EDimeFdM>a^d3Olb0>K{akT$KM_;wF(X_3oKF$@PK~(MstR?2kS==TZL6kA)z`?i
zLUOB-@xT*uW@H)wi(bdnWwJe^`|#SspyEAgfx5QgMcnkR5Ps|!5vQ2ZGQw!Fr=lC`
z3Vi5?!<uo-^rmyd1mp7M<_6l2WL7$^1M0Pq<?22ha?p%33*mJrfsuE%Hby`?gm!KA
z?k1LeCP<wjvH9DQ-zB^cE_r&_2s!)WV}JzTC0^1X`g-?ukl?|xR1Yr~wI`n0x1|@V
zG|g+76I#&Pv2>Gc#kZZ2y@~Jth~U)3%6~jCjYex<j&9J{Cy7~|Xl8q#TXXHcx`@-x
zC*@6ZC`}Td@Gp@#--PW-NF2!I6o<l_B*%55oo2i~l*WykyNhg>)*NR)+mL13xsKVt
z9pM{|;<U{tw`&F?v4wk-<&T_QzaK-sO0c#-j2c|jhM5yMmdXtt?%sxc=nK#*cQ8SI
zU|>-d8UO4!Vki09Gm}Dmc%P$Y?AQP;%%Dbx$M2l54K`bxThKDG<9+=YeLx@i(@s^P
ze4yn~aD8nDzv%rwuhlQT8^gyr6<g`_=YCU2rdZ5&a?2B{Q<D3DYC5{guNwg>o2%><
zs?OLoA)+8dCVkl--xTmi)8h)CV@e;8u;E_J`sql=^&`^JyUqYB&1Fk0i?*Gi_Q3m*
zz~??K)}aiS&hGQ*@e8-?8<#1Ms?z?^npGNa9!J?DlWx81Bvxa9^NCe#n~G6>zIdC~
zv5&3gZ%kC4`A=%xM&u(Cx%Li2kLvkf#HXj?9psq$`fmbP&2+UncI9(yDG|a$NG$6d
zYG3>mG4X2~{<G|^&R)>!mL5nxo#L&+4NP0jzBBR$wA^{sDCTg-+|VQCHk(pcC%HD5
z2yxiB_P(XB=3jg-VT&MchJkh(q$9SB_woGJ)85Pq$CBJdo$MdwOQ(^Rr3{^I?u+0B
zRgZ$Ozvhj}L7;81?U$1B;?47ZFyAp(JoeSFz(tL#<2mK*R^fZt`Pb<})Lh%+NgZ8o
z#9f6ZUeF4XJ{SWjA(<$w0R?yCr;|v*1k5QahTC+{?MK*)nYU{jgnk{%en8QtjC`hS
zCP8isUvYOetCPlX(IX+@`=}&hEYljzhbd_5dp_KO_eVq#M-~a0d-*Xh^va(Lf*SiP
zsd-{Z4~VptT&38X*p0GeOl<x4!a+ppzakm9IBQUvFTvgkthxFw45VJy7FUk>{zw)h
z?Wt-hF%Q@25Mt&sV3*jf<AmobZ@jJBVod3uj?U!9Nk0IRgw6#mNFV^sfRhA~up2oG
zkleM!SufU!bO75i+~_M_JFU{sn1G9;_uG6?ERD2~i>o&7oW(v_kjWn6=WG4Dk7+gj
zVMiszAiPE5G+w)3*{=dJV4wVbcKat-IF|UWOvXCuBkm+?C5Y|t&^HH8s~a{l<~Me;
zMDs9UdbRew<55S1d|y+TsB4%2__)P?0P=J+0c>2J4b_Q2*Rk=>hbP5D$j->DIAam|
zAYSa>QNQ5?|IJmy{&xkROBu@K)}8IAe~K#|jWw7n?oL$}Ep(5grik?6SWjoNrSk`h
zHG7jKN!m18+@*>dP}&PR;aIOBbUM9C@H)B|CpoEW#Zk<~rM^B-WVwxcgYy32qCuk{
zkJER*jNW`EplGJ7o);Q%o&if%yMOX_OXKVcU0uXE*6=3j=dZMMiCP&EH1a(Lj4vdu
z7Doyf=B!3WW_bEYsc|JMtW7?5cwc91(Pm!iscfGVf41trL<Ke?t7eLTZ?R4f@0=Mw
z7Sw?s(_mQm58ij@nrqWb3wayv>vfz3I<TfJ1=%+fQ^kVLT!xwcPCElu9XJaVq+rO|
zdDyE$mp?!B`I;XHm_NUMmPyi~x8Jy*+D+r9RP9s&iXGD;?q$uzOt!eZE3Lt(6r2JY
z%r%nDLR2he!1QKp8FmCYryN-sQxkXf9V*@EQe~c_DGZRG4&BermxN^^b^a(NE2o4%
z*N`+rj&HNR^_Ir?+J+ICJ(N^t)EordS`=%;qPcT`S2|xCC~fnKocAjNAZ{j>qDgQs
zg;ZzuTl5~>7RS6UVnTJ0#l=xBotEL?h>v5tz^kwz`!<^8#(&f0Q~N6QME@1c$F#Fg
z&D4Vk)-+$Y-LBsUlI5Ede@+>i_@nA)vy>DJ4p-0udulK^t)<OfTt$9Q`Rlx4lwi%5
zNjb#e=y1_fj+^Zny*-?YEC-?7zNpQ9>>S&Mja?Ij5xNd+h64xP`6iQNFh|h2jmg<M
za^GU@_hh*Zj-s|_q1XI21qV0y4RSNwT?4H~Pk7W1X1gEhsis$j*Qbxt>wTK<eY9KN
zXq0@lL^zBd%(U+}Pb_IB<Fk7G4d+sBZLiX@k3xycu*sp>E()m*eBhEGCSZp4jH1Gt
z`xcw7)@~_bahgZ_8atNBb9WS;%y-iHgU9Xb1d|hv@JBpa>0;l?<xK^AhogX=`0E?n
z@E^HZDwOazEL>d!*IAb>w^Z*pqT99z3ZSa#=PWHJ`iYx_9BLm1My6rI1_IyD;<<)P
zA<GYux=r#waKzi?3O=HRV}P?%ZeJd5;vCk;<<OK)XakL#o5bGyWs&i0FOdVS9VW{6
zfk<A3uhU2ob%rj1Ry*aIVooq`9GYvLUeW1E{5m90s3g5<5%;Hm8~<Ea`CN2t@3KU;
z^NoV9ylD_e(O1U`B84_>GaEY{y*Y|GBO6|#rAk$4R0MKR_ZZgygyOWcELu?crg=9p
za<+9OQ<S!wzb!gi=Jnr^FmZmlHdLP(Q(v2*eTUhaBaVb{w`tBUJoRQ^H;&<p$r-QZ
zk6uQiuJhDq*}GQ>!}rPmexPOzaiCr`1}xb_gaw+LytqJH@Pm&nY>f+H)PAK7{&Mhd
z!kwPgQR4bu>Rb_O3E}KQZ~R8D?$g|(gb=Rup_5sd=0cIj*^iI4na}eSTRiB(?l#HO
zPE*%TTWQTFp7(d}pE|Mm^Dog!`ySw@%pdEx>XIB~$QHm40{g10E$Yd3v0?@&{j3$J
zq8mHPL!Vtw_2hJ!jwUQ$I)25rc$8*v3>|8g+8`HbW#`caKVP2AkY~2~3||pL{YB#T
zH+j9XZ+-7InygPC#bTxVo#Oz38`+f61hKR}-F=;gvU)f2J+pf2URU(QJD*r*`n2d=
z)W3u3J@o@0O?v>JeV6%c4`E29(Yo3gZm42i?L&A&4wtJOLvC|nanU1#BshAogs8vk
zb4Nt&`=NoMSDvE<)VxYnf%vlp<rGENh=m}M35GUW6BMrvXSeu>c3XnH{6-hPv}jF=
ziT$+aG-*4{G+DguNY9D%@MJ2HbneeYZ`AH}l_|plma`r^U@xWarkN;^6mwhXWk87{
z<qtIYAUDjNRfoPB<EIoNjq)++<4(a}9F_{z+4F*ly|7P<pE#4|!I%5;po#FI>q{nt
zllfo>1iR`!3-cwm8*H}<{)4N|pol-^b|Hl$olQUV%Q#R<Dd#v&%x_sPx%%dKIWVA2
zqQyDm?KTGNFx262Y9@q6OFrNIL*#tdB{hnuccq8>y_}oN+Z)q#Xe!#??w6*IZ?qr6
zf5Qc%J3(`eL%8G_ma$~pzDyM+-j$@bj)bmQ4zJG~|8&_MB@%MCIZ@GC63Gy9{~o67
zzuzO+pn&lvFJSibiZGrD8FX|68?g78p{cwZvcY5G>MGSYP3d6jk?CB7Q{n1L+vJaQ
zN;4T(3X69n9?sxYVuGcS^$5iXxH$0p&Bl`cqR4mSK!yif4yReBrKaHYMp4<N^{}2#
zmo$FFGFVOhMz2iP5%7FD_Fi1TT2Z@~9R7T!R4eG~drUw;0f!9NlS&^Vn`snjbv_5i
zR}iyn;A{^)8OZ(c`I}gQ`K^w0jX=6My@Jv_65wNkJ4GW;BKHIvGsVjB3^#HPgHF-`
z@BS*Ln|z(ILgO%OGOiWdb6i=b+||-XnJhrp;*2yk8%SU>ewbF?H+#IV{WB5g7!|;}
z9XOj116smvftm3EhQ<vB70IU)@{0uvQ)#oXTnxbq)Q*U)NRMT7Vh+i7W_`rcT|MtY
z17<%Y0xD3NG&T1fH{h>y{pwxJYY?gfQGifMzTW<`%hX}21j|I}{N$RAj`OhH%8w(&
z`JT*_rVf@6JT&Tis(}<8ndReYW=R0&CF+f&Kn>zjcFExR^^E~;><#0G^TjjmkgWMP
z)LQqLwZpf~Mym49kH}e86GWd9&{(s{MZK;Ow-rKk?%ht7a~Y%>lF39DTu#Q)d-180
z;DV1)>{NT&c1o!=#l%#y8TnNxkk}zr_Fb7g<iPp)8W`-Irjpm~Zy(UEDTst5GTu98
z&|0cc*C-R^Jqo>I|0&+fF4>90Qr=qe-ok2Em(SvnE{Q;Zhqg6a)M}Cdz6{x_@+U>z
z4dsGsO#s|&y)7zHv~i<d9jQ1x(hZ1liI#X(-9NF{;Rz-Bmkw-w+_#1Zcd`T(pd~5|
za?~}6EJ+GG>!3KRkL@_tie`NdOs`=X$*krbz(*ID`}mX9!qD%#eDL1Bu@&z^YcWJ}
z0bI8fPqMqx(%n7Jh~%i8g0>OvGKLzC!5Az3%OBb-=Vl2y?YZLpjFqR#09x@4@y5ob
zh}@kuQ-~vhzwq>w={ORWPdj}^%sXw*0nvEAUc@;$3TFKScLS0|5Heo-7fi_172pD#
zrQ-nE6gqW#PdzUio$kogMSrI+aS4PyRH1-hRlW+l6#Wym@$Q5B$(XE>A|0}C*pN1Y
zOE6MT>8D&WReq9x0IOe}`tLte=p#XC<3O93-``WSNfLORNb0*t;^B*`(#x%!UC~_a
zR=)_b`j<AbTk8pWkJDALWZir_Uq;=+Di`Gd9pJg6xb`76=6|tPeb0Hg*OANgAnECA
z{!Kyr<CRwI5u9Dp#MM7LVV_aGN-r@<;a;uJ&BSP}Hr1l<v=$&aQj9P1f_IIj9g)!q
zLwoA@R0F418r}D7Ql=T-P;&}DUOEd?DW_A|t-B)=b$O;QWmm*dh!x+`pOV`#3iuzh
zD&lRKx>V~W5LP1nAEx?$ajVrA#Q&jILCgbnhHhrUNwd}WU%LMar%k$<%)GoT$o1ny
zo@y_iK@^k5*WX4*LS~Dan#5-B39mS>vAxqK=NN%tfA%1FRi^181@ikya@if85!xa5
zJMHaPcp825kuNO0^q<Fraw@H_#?VR0uSoufPL03bvbq2O6^M4?i+_gG<wd>(ad0yd
zaj*vRd^kmr@Q=6g4!%nhkg3`v8tKDVdV=@&YR{{&ACVDr25}xDWyQ5g!8=14m~s%R
z@dTqvErXWM^uzX!{&<E}YW4^*xlyTojX$H&HiXADkld_|kh41Sr+LC?Kk$RqLNr%b
z;RAA`)_lGkq$T#X>nOVW@$xt6f*qKt+$x}OH~F!R5!#n7))VT|t5TpQm+Frn8HsvZ
z!^0#EgbMa^%Z!*F1wJ*piOT2#t{J|i$Ky*#+aX#Qp_r4J$-{N!S;r+<uJNe>9mJd(
zRF$IqG_X|evxg_(@uhXRZX#)<XR4vPh(_TDT~ptHW+83xoVvjSNwhy-OV@2G+A^QB
z+#tG(Lxs)V2MTXQ&llW>vS$5_`)^3Xa9z`PhULl4zA3&5a^@oS!b>f-JPm~Lsohb9
zQnvS4ts2ce*w)|&yp*Is#7WOrIE~Cc(S?+UTj@aEr1i?H8k-gNNkwaDxmu?(DL9>4
zx|rvBs#4X^g{9eJ47AUzFarP-Kh5T<d!{Y2UZ}V!M%Y^|^<0X^r-YlUt&`aX;Ankv
zJ&=sD9Eq#`NSe}};C`e%-~q1Ln=1nS?7;S|5G&p5&6$H7@097+<3)i?owsbYQ=sO5
zGxhET4!%4J_Tv0K#KaNz^AYed#^#Xo1$I7AnyoZ!CiqU5e#Sy7pF)4YrV85LCDNG`
zU*cbBgW?`s{!qLD<ZMi04kMzTz=vzsYTuiaIde2)y6as4RLw4A%uVpz%k<v5+O=>`
zuhicS2>4%$KvI_G#_D{u7gkd5`ctn*(iyM^Geo7qvOI^oBrxZh6*Ql{utU?$-^o*Q
zzER8fCA!rZq~{g8g?GnK-hG)oAW-YOLhWy3wBHZ%a?@S+--S$AhN&q%e>1mu!L-(v
z%!|5DN43i2_}s(`_5W!aR=uE1(ff3d8Dd_f#eCT4*vv&;<1|I4vS)A4F|)ux-S%HR
zZT`x=$IojEKvN%$!`@o(eMOzQa<26;7t;b=oc|AlntU0Q(ntkoBVs7t%c4>zZO5y1
zet(m`CfZN;&U!kK+kC+BLJ9gz{!@~Oi)cJo8QUPJp;GbE1BOszzcNskebE(v#8ICx
zLdN*#;dG1^U=!eihFf8uv-P_^vW6MX62tfYCbsL$&)fMc&#YmN>2w@CJtxA?{g1d`
zEM}Z1`%KUPpjBZJlp(<VFK4&ee^!=wuz0IABJSwue)o?u6=%>S^{aytFXV{L4izm;
z4^0Q7)*o_x4HLEs+LyC-=bvy(qsv|XgG_06Mo^lhy*=dY-k2RYA#lkP;aqsCkL%N(
zpQR=xT7aD@#Bk}9-|nB9=)OO=l27w%0#rCt@b(H0>_>+p|8-^XKM$gi!j1h>3ns8C
zq(eTC&3Qcp=CD<GE5>$EVjgBtTHyZ1g-6`s^rHg%Q>w_Tr9q>Xg3<UZ4&P9nM&AP8
zFmsstPHB^hez}8`T~GcS<2!?#Td^D)|1p(fpXO^~QZN%Xlgi&}f-j;v*V*zV!IBXY
zOmrVBf?V)781a`OIgQ1<A2^;M2dy5E>9Aa%gzq9D^)1gu`Thsf;<VDNo@oC-(!)G&
z>^r(<bVByuojBxwKIB&!Wd(hZC|=4=WOd&yS6e(t{E<aSZFb5juT+d9W$X;vleQ=T
zd>7U;dNp*7TKf!k8o$6O*oP3f#okZCOczWSk?AzRBz)1-eMzdtaqcnp?CNM+_`d&>
zMpcy^ukXD5?$mA-aNJiX2Fw}?gvvaL2>Sh;@<;O03fm%A9M9PPZZ4o&umiekXf3+n
zu(o_qoAbMV7`QgMsUE?dIp-0)&K{IlLWgE4;Jy8^ui{^0yMR!nJ>l&?xruLT?MiOS
zf*X2yxGXa^{QJ@84t<S2b^8a_CDt@sLHyq>Vy$Q^*B9a)TjsE7J}bKxw=HfA67HY=
z$-k7}wflOn-Qy0S&Y#Hre)<_cQ<LuZFu(Qr?A!;Z`kCRH!_g16F!$p`>7{xh@=DRI
z>d<nIWB($1s&&@m6R70OJetGWNB1Jw%g}gc`q6j@d;0Mgzjz-21;fdSe|ePuUs8?X
zgx@Zs9Qu=$=OAzYfj~7lC67DRHDIeQ0{wUC^-2_}5(yadzV+YT-zyKA!#>ZWeJs-F
zbWhu=%z#utp}<bAdF>`APCrY7SP<Uwh8(RwyBkXF(wjHUp*5(p`b~-Qld&?r(VSN4
z95NNx^AJm5pp2$pa_KcTyA=EPd=_oi?-{~1Ycm*1g%wZ_+gZC}r1(d`9J6LOpyMR;
z99-%K)UC)_aE|t`6q=J`{tu)%$wds?Vx<?_>%LE9&PEI~sHY$m9pfX=xLeu-%^@n2
zfHlv%&*xW%A0!q7IZ&>!e7KquhTmrjp8-o+2#fU;OKZ1I(Zm<Eis=1!e;mJuHLX}G
z1^#$z)<dEdS}8|nq*r6ti*18Y8AyJQ;eZrIND4McFskF^RvPBANTKU#R-^6h*k;q)
z`dYLpY!>)_G<_D@{k%%B@w-rjt5qEU1$RUD-$^4ggZ4(0@0zepp3&(8W(U#2-c>+T
zpOu~)s#!1%qEypFkm;3E$==?9y#=yWUGm(!l0Ks@6+oqu6JrkdhCO&p?|@nX>|(=8
zLpwawC-alcqX=b|V#>Wbs|kx;l1b&PR(n<>0oTXa6eY*yTs_s<a<LA-5y`tu8_;)W
zM3|ghycl2-Zw<NISM;C~Booh!Dl^DOsX+Udh9JHxDC{>*aBDlj3%OzddK&uzwh?Q`
zXaiWT<^qp1qWP#t<)-vK(H%Y8`{<{ebZH-EH8K>Urd47f3iv$|-4R=wc$<m{>nIi@
zEJnYYMC#^D!`m&e-$}DZkBEtSOB5vytpaPqVtL%*T~1h<VoiNQUQyTJ0f|KzRQN*j
z7hKp=3l(?Q>-~CK$kq%{*Hj_uA?>q%`O}j*4IZW;?k))%Lk@kL@f#86p%>)5db$=&
zXZX4*oYiGkK8&29)J6Fa_VjR#g5Xh3jgW;l$OYG|)8ug%1gy)5gJ%<I$4Tcfg8wpI
z{B|ZWK#iDVJ{3V1sXn@tp)Q(A$R#%D2{H@X=!%XkUfLhht_T5le~|D+f>v@mZ@UP1
zo(nXF0ESAb=|SCGYlItYNgVnTg1v7}=6{`k(RSZRv_;RddwC8XJO2MOS<xLngbeJ!
z%L$kjbOzi=eYoC<6uWxO7Ho{#!_SMcHvWrt-dB%;4t<>RW{79F@rIC6v@dvkFd&WP
zI^D_(pqA1&SipTmRNJKu1NFFKPeVbWD#Bu{pnwaBzj&SB6Im2FPnyEU38JXide6?}
zd5<MHLphTfc~po3c^<Aeg)ICkA<**Ap(J9k$tpEz--nGl?~j%;zNx<dW0X@ilGgg5
z=__y8k4KLIBT@a8sb;c4M|_#Haj4rW4K~Yt;d3T3llDX0IpZG|d}M%a9`sp`@c%hi
z=>ePspIR87vSeiTFI@<N-3(@dIidMJd@w=vS?1<oFh1;~KQQy*S#XP`SARjiJKx$#
zMB5KSLhSGu<?PCo3Drq&ijYV8SpPvYGg)POI0IQOF5}0y*NM!*LH{9=wB62o+P_AP
zD!z=G4ZMwAo>xetJwj9=_lh?*Gl0dG1d7wX6#U-d<~@?TQ3GS7M*qQrKQ;HtKzfNP
zR1BHN;xVtNl}5T)Ig_CmQh6U~dVjhmT}LmHKEg2Q$7>WN1=k8mhPWIch=KBz()xbC
z+nYMVpZXVv8ogl3vsc;;B>$<Kt|sHLv?n#yQfkQXA&MN)=7K4lHujd3+?v}U^8D*$
zA*T6XKZYg0t9u|nJSB}=rc&m<l;f$$7~2{^Amcx|p>AUuVN`dDEl_R`%8<%aTIt}(
zXprBzw7fZPHJPiBX?RLza2gl;F9-GQjCEd)d7}SZe`@4|ePw{TQIY@Wjd)em>Br!_
z^84T^PzrMKPVhUb;=6!ol;o9>lAZ7?kvokM^|ISO9K}c#Zg3hAbQ783AgwJqNi^y{
z_y^6j*o<#XrS)2>{&DL)2F&}6_SC01=-C5@RHYyjLM7gg&9Q0sLA<%)B|*-8ShGko
zzgT2+eb&Bj^cR)=@ow)xkyRg#H{RcOpp~!N+Mkt9$R^dYp`TX@^lPPSFu_X>e4}#T
z%@v8-{jAgmn#43#U>o!o5E>1XYCXmp^2%i0hi}p8ZN%KEehjLaA*nq1Y1=cFVU*a(
zWuw2#Yg#YgZ?6*UzEQ@g;@l}{W^6J0Q_+W`r#<)@xc<BS@AY5Mg#<j*i$0eu7DU8i
zD3!I4HnmnxNGg{BYvs9`smz}R`9JSjei{4CG-HB^FcJ!(Sc9EU_{9^^E0JK%RrG<(
zJSDMIu&9KhqQ;(9r;miysEmfWv>I+i4r~z{cQto<h88|%fi=lDGFyD&L{->=b*QyN
z%ia~gj7fV_+bw$R+l;$5US}8|TpxLqQmPg|b;@G$0F@LG!152^k#4lCUmr)~mYEZI
z4*_J!$itW&2Fn3)f7x5O5@uFK33llRLG|adc=|T?t$~7^fn;H~XH4-d7Bvf1%S}Ob
z=*U}+x5KanCH+|J4#*wQFXO1Ql9h#+WoUq;wHH#kGc2iW)~q&S-wQeXF3>lfOKdT6
zhbSBMx|6Z@X=^f^_BKm6G?T<<S~<vy$8Tm=HDES{%XEJ`RnVKATR(biw`dw#>Z{h{
zkLGou@o@CNk)a)w`95QjmVe~p8E~T+b^I3@5}6XGsJ0(DmK?qRp49M^wnP_84{zgk
zk_AbL=}lJi$L*Eg8X$}#wG(JK_C@~|nSg@O6n<uLCGL3`OB2rqV<loyOM;Z)q9GL;
zpu=aQWXS`W<=a<WOTy314PTx``jYu;OX<8uM#$tHD}4Xm?!`~=>6OqPZVm&Egx%f<
zl*G$IqYt#D0ZTQnxlz3rCbM?QAB7Vo-=Ed|)s_+x)EFeJ!G(tyFt?{Awtu_=Fj@QC
ziMwxcJ;+%;3!IsshBLs$rJ+pKuQ4<72?73U!*r-aJQYF?6OPA^rlx}6zSs1DGabn+
zKMH^xQLO88PxL_q?_33P$B20C&doJw7Cn+^{62_cGE=lqZ?KA~wPQ$+A4mnsKm82Q
z>3>qs;{RqIA>hs~5HKMfup8J1?t_c%q89SANeObC64!OwU9PM}8m9HVN-+y>zeumL
z%2m$Ww3Wg5%6T}H&QHT?Q<s9|v@?wU&nk2iLnVrEu`|@O@^(ELO@f2?d9+eh{5joF
zm6*M&AKzkRhJy->H6mj4<uTGJn;X;>P6=G8<u2xDNndBAzdYhm*Rg4!`24`}T#Ae)
zHTQMi$U7mD5~dLJ(m@Chzn`cSuuii1Ay!4>GZ{wn-@q_k%2A(XKRf!I?)TE}TkZiL
z&6X?XvQ(9d7c0LU5%a6|&DDjp**x9$OwMlRGJhV2yhM?hD8XLi&2DEi%F$9SY6Jm0
z^VIjYnvLFXR{PRd+9OO|ui5s~`#89`yRhOmN1^?<jfdx3=pK2#FH@Gl_{P9fDpMsb
ztR4&Jfu^B7Gcz%hNvjY$>2?nhK4=B|n_b&3H2`kt?brbT=;7)V?yK(m%>ej-_H0Q(
zm1>S(uLjPg*UleB#5Yu8A=WSAQW}F4+#D;&$No_S9f|W~s-y_qoEro@>6^t#_T;W2
zqc1v*AD75^LZ5DEM2nKx^}|-OzC2G}i~q<s56f*~hKT!yPAQ5QPRf~S(<fa{tpRR<
ztn+5aP9(0ve1&*fZe-I!i>){jAiQIF1q%3ObbT1l4<2nQsGj-PLUP!t0pEkfx(^gL
z^=-m#L{&wgU}IsI?xDu@&sTToI}X`vbj8&`_35GX;libgpYe;Bl^@{)VmCHkiuTD;
zD|Y91%<(>kfV0>&+Pky?AT;eTOu;Y*^@CjQ<6{7M0$QscH)VhD)>|2BK3F#ow$`N>
zC$CGuo2OGXQ|cOfo3DJAPVPwCG}IYe`PUC;`Pa8%q>SAYpz~eFgJI?9meSepn*d5E
zn*qr@m3SO^R3C15h_+8X+vK|Y`BmLRr(TNBz|qO7XMSHqUrKgbubN<){L>dGY&atj
zIG9#B>uMTu%byBzA218NPpQJG(muBRafdj0L_I63DLr6#LbSq4mBl=VE%*kZuA-)z
z9exsGPI(hT;(lp5N68&f5h5gK5IQ@2-qE0P&bWf7ODaziXdvG7LhT#&5#2v>74g2U
z!tqFGcsffZ+x^I{@vU+i#{CuO7Y-BKFeYhEUB3I+KI%VX6$a3)tIf*&2@gmN#v3+i
z7V>g;P5)t74$@>n4%Lyt2oQdv6>j+P02>;4t>Arg68ILKi1GLj$A_c}p49R>=be$?
z=`H<--1CqsQ*qb*$)=wGFK<g^(Y~#2Waz5nw!G%;OVWH5;`_Xg%#HSf*pKV8b8vtz
zwrqI%*v$fbJr=_6vW`3FowYKyh1KmLy<?)1ettOd3SO&431_ICJe(*H=;lv68zTHm
zEE#injcmlVHG39svOl@E&Ng({j_6No8V21KTiOL=OK>1BnhF;?*=Fv-|BDt_9R9{r
z{1xwX`D3co08tjJ)<2AJqRHzD@0^e^&+HK&zhD>;@xPB{f0uSRl>qL2AkD*MM^7L|
z6SlUIT{O5xE0?9VLDb;5J~Xwa_--S!n>@NUS8*E=e&{ktjmmW%81<!U4ifhl9vjT|
z&K+(_4{K6ay5e1}wIsF&S0ZX}@1n{1v-IznALn;N1`I1L1Vtp_40qU<*4hH4Wfd}7
z0Fzen#JIj9$v>Ocu(r|oMPGH21IHDhD@cW}bK`W&BlzZ&8srBar*IBz>^@7lFfG)X
z_+}oCu4RvstT6q2mB_3W5RTu05kF3!O0TSUb~~IQEb-lK0I2Q>XSf`5pJE2;lvCUQ
zBoT|WqI=olZ@(gSt?!mZR|(5939EjU0~u5IOOGjC8~GXm^p*7B{1>-T_EKFz8_di=
z1h<xDx5l++aJ!O%mvAp%T`;EPi>cKQ2Z6K6F%+kO_Cr&~&$BHS<v>>ul8Q~6`=#X~
z+1Jx~W_~yrU9o8|dn{M>Q+*N2Fdj~VetKk}K6s_godNJuQJVyX#Nt95ZD@z;VA*T;
z;xk>F>`;J3<im}vtXoWD@e!ZrU_6D2d*5T|x4L2ecoXRs_=qgH8nWI4)a9hZ**i6d
z-z7?vv5x*!CYO5~>o*No75G$(xCP>JK@;)tfWF=7r4o%@<I!aHd%{~WsI{GYlL%~u
zW$h!vfkQ?o*lvh@{G;yw?c&y(mpO1Dp6gUbCM7l*GQl_yjgJZ(2lG%tXA3|qLGadp
zW$O>)IsGJd9?N6ZArOxHv!4cAo=vY>Yu0^swEYwgUKxzj+#?_0;*(hzoXsnC`^+Ac
z#V8)Q*P)HqH%T>ln2cn1w31KkBT+lO|EqRc+A4;Y{Mg2fj!62g*->%GVa9&B-_qyV
zN6V1=8W%Qh%>9xFQf~cydHfm80ubt->D{og<P=|~QHu<}x<8s_!$QB8TDEjUb#|ue
z8o0AB!j(ToSjW8%)uDl~OBYKT73x=$ZT80}Ls0Q}K>Tkhh02X$(SDhP5zcXPnY$xV
zS6uxU)uAwZAPffLLo-48n1W8*LDS;TIeoImSGujL6HzNb!BOW8CYiL#<(sySviLaC
z$Dj<-#l#jRIt-(1Vusg9Bv_cQv@WLznAD{nVlt>Dn~;hH78CA3mxn}MWqVzT+?3HE
zOLJt`BP^?l+#Rn`6w!H%5-bhW`Nv@d(O#mp`9BRDA4Om>Nz4XBGerKquF2S}kqdIF
zqH<q`kLI)ab2=Kz9nfbudqbl?RuM<?2ql#nGoWPETLYS(11djt7>(+(PaSL>)zA7R
z(6{`{Gw3l*h3uW}zj}+c8<O~9;?mk{bgHh0NnM{7j(@^N=k_1?aq2k9Myyr`BL9fb
zQ6Y>E*T;mP;KMGi^Thc(dRz|(&VbIO;P%eY3uQjp5ndU326mAtI~4-+x3K@O7|l=Q
zrgh+$B-Tp*2%8?O2(Emh)@?VUu^adR^=)fvpoG7{#tF`_e&Ux#VWV~fAv_Xsd^Q%q
zs=|PAH%9Sngo;Hx1%Y}e1NBkGd>oAad7ZdKzfKjR=Q>I%W3+B`Z11Tv@NN|x5mDe3
zI`k@`YZ(NOb`!rgJr{Ky%&B<AhKD6LQwyOIYoi3TPb2QIV0H$mm~RlMjjC;e0kSmS
zx#Y(3IVYv+lx5!0w9D(32OKOd`nhHj0SwsQ|APh9rX$OrC2T$t@7!0XS%qB!H-_51
z{XLbJzCy6@Z*G;<@4s~`^AD!KUnS4>g)uf*=lBrF#!$R=KUtif8c~0W-0XTEntZhI
zybgM6*y4q`^;i2;zWy%}M}WSdxh(FVPq#aG2)0F9MO(OcrL#12v+&ef;9{4PyBhmi
zu2}j4Z;sh=lWY^;=H{lg!9UrH&x0z5@&U7&Yt|SSARxH{tdd3tY)W(CI**0gMFSD)
z6mL&)|M`|IpL9-Ah{e&^40H5zERg}l?GE!GmtjN+a$%{$IhJOc6!24xnSp8;CWnph
z{o8N0oC~4B<zR1A1s)B<DB}85<`f>jxNxc%eFlfbPK!hPXf^y&xQ48el>yynrJRXE
z*s<fIz4#+_9dU06?ndFivVrCKs;|hRUX0@F;Y9Xhg_ws+tt;jF6{cOG)qro|GZ(pd
zKIEzXf@T%*q~K^0bE)omGVh&gk(eVdmT7MUruXwQ%H`R2WHRwqmwjeY=+u^=_feRr
z7xFNs*OjAIi*Cce6pM4q{f|sJ3pWU0zV@kh>c;DIY`bR&Tu86|f_Wm|G!upDewpn=
z%<&TyFq2uxoNi<`qyEx704e_s-@`}z;*92;J<Nm7(2j_b{dZ_fUuA0`(fBb%P3ra5
z9wkz1vMljx%>IV_aPW8REDr^6UgFAy^G2m@czb1uNw$Rp(#n&*Rd4h`G(0S^XnJ+4
z;#|}hLqhhWu(XXWBvBi?-RFv&H(&w{Oe#V>Yw9Fw;IBr7dg>WQqcKMtT}BZI7DpyY
zs`?v`+D^oFXpG)a>p;`cE;EXZo{7+PPxC8LUycWbyGKMm3WFdlu)_Ai2#58UqCgQ+
zlC*bt$R#x2YTVv2TIa~4PWXk*q~n&$;pkpdrU7_ze@JJO36+vTSm<uNIib7O#Z_X-
zyJ%k_<6YSqC>aT2%X^zA<D}=iwQqg~)K(8>mN|-qZww~hsc}H_H+#BQRy$>ZP>u7>
zU`Tdf$3cW2?DWb0<1QzlK1VKu@i7|pTt&ItKO?>nFvYdcLVL%;m++&`eXHOR#v^y(
z#*L_{Gv>0y^3;N-`Dwm9k>;6r<twHef};u0-%2b+AI#+Ht>h@?!>LaUaU$6-HFyRm
zcMh1!#bL(wXNdc=QwX^PBr9$`FsQ;ej}<|LFerl#Jkh2t&bzX`R9?x&Hj_a6unoR#
z=(l%lD(qT3pUcS9v-*brs2iKDdG#5gYn_a;5}h*M)caDZcANF1o<XA<p`nO>U{oH+
zqu$=IxqWDBB=+u<Q^bp)`uX9G1k7`O&-qa2Y_oI^crlnpCVbyH{S*6*>4BsnO>HAT
z!r6LHG$IV#yS^%5;V(p1l8iY8Xh>QK>9pP|1)oat=)SH6c{<>y_H_dSR1X9y_H8t<
zOXA?(t7N%>n()Ix1@P1f)aHOnu9vl-wBEkDy-@n}`X#D6nvCBe8--;C`+-~ZM(0<H
z59tGUBr!xejoDxtfA(r|uJZJ7#h*rfn>Eezo7n&c?ElQRMm2z~$57gid_0oRgyMZ0
zPYI@3KN(!B3f0I=$(2agQnNdD@0Pj8%{66L_saC%xaI1>iND=48u@hD#*-q&%I_zN
zrJFA2km<7qH#trl=7&)HLXHwaj|Y#9Jbw^1b)lh$!wXFm1@6EBu8>Oz!lKXVsH6_3
zKNiIDYHzL*lta)~+qLXP)?C@_7kNNY59}c61`w_B^q|!z|FCZ-8otsfR@;8#iF{6v
z-$#nxhvT>N0~{66G}CgcGW%bSgfF~}Pi>)9DfRqgXAOLy*?3P_>vP0tj`|Ky<MsQ-
z)PBpW%9w#0{J&I5qQ#CI_YcAE?1~*tqsgrobuI$lVgL8$(dZ|t8PII~h|FM@Qu{yn
z;MMr#x3UXT{{li{vfmevYipUOk0=#V0;AfLP&HJXzoZ=hhYk$wqfW-MLG1K%?po@L
zts~I(06$+im-EJK5X%UF4pck`#Q=kS-R$ssF1ONoBi>4#uCtj9Q`cmYn2It5zt#+u
z8q-Sol1@L$)gRqPEMTExOzw}Ei<dSC?RV^yd0IfmGjrW7GC|A?37GwxJZhVw;@Rv1
z2m48*#nAi(^2r>C8rHm$E@o~Oe(DteBYwF@{JR{PjXeglQ&8fqkuT*WrY^zhMj{D8
z<1Xc<_Fw0%2D>GpQA%BMo!MsZ+RYaADk#f2onV3e*>4%TYYh5i%C|j}dwuj9>plci
zmxvVbU_j_3K590R7BCx#4b)U~)Q53X+#{K`au(R%l%jP#^izb@;sJS$y9}^C?;ps2
zm>_q6tScS1i%ZStJ^WZvf^qIFErjcTe983-g6BoUg8+^`WXN@wde(6Hqg$h7C3-gA
zyv3p=>HpYwx`xPC71M+#6WLK^)ykZr{fa=ZTGpV>Zv)DBKs<FHekT`0flzHd%~{Oi
zD`2(MK#B89<+YS=xRniJ!;4D%=Q~#7Z&tI0ws*cw&1<JwOQCS~;G|ORGF<&`PtD2X
zxkl9!s?ow+u3fXu0vM<BG{w^OS@atEcdTbjB%3Mpleln;-SW6{<94vJ-+fyncu&e8
zRCnNJVbY4zYTRh~@ag}$05lqP+6~8*<E`_7WY4+q4|^ie|3*OOFXYQ!&av>iuX#;b
zEzOG!YN>i?yz2>OIh=|1x~{UnLsqX2_?@uQTja1$G~qf@1>EQyzH)j6&Q@DOEFOv2
zKjQTE=}70f{J;%AZg$>cN3vgO-n#QWHNDtVm&4fc8>sa@@%yrHP3#eQQ9__`&GxyN
zb1;Pu8Qzj>(<7smMXMwfD95;X^i+a_k%j7LdfK$CcN_m7s>rTvjTH+-puT?a0tn-2
z%bUH!_r5xQfYwcX-uO9_VcdE9k1D|Tm!c(L(AO9&bJ#Bh{`N=D-o&hWF(YDnIFdMC
z)RQ61ZIHCP#QrQ(8M7b7`u#0T*8M+_%iTGKaithF3t4@%vw{#9-@HeJU6ts=2-pop
zIF{WGegY7q8|QBVb>8g#3V)E<Zm13=U@649*dFAY6!&Yo9VL^5Avu|?n$QQs`7<~K
zj~6B?uI;s|&e?XF3L-HjGV5s}*!{uB#kpS2@W%7l9@~)H|5968FG?C;^u4DQ{8QGX
zB_fzw)KPt(0;!7%=mRs<X1KbNgD_+SH>BF_8cWswhcZhNI5f{MHYeb7I3y&58b*>3
z@<xIK7~*JRk2%b&kUZ-zHosZ0>Fp!nn46p%AzTfm3gW9|3Y2=b5<<1bYpl@coEiD+
zuaBoNm&@JZ@hn;Vfp*W=s<KEzM^nu#ke#iC@kpg$U{KI&qG8GXXrw@In9OQ&(?kmo
z7TzGEM6bCtXmAU5+2by6#DY{&)w_&I3HWa3=#BJ_^x%+Zj<NaHOWIs>n}t<(t9t?X
zDcQtHYIR6FHtW;AcY;c+TryecY-PSdAq1Ez;9-YPA)7^ic^cVu3OK#wtqN0v-wF!(
z7mSR^^z8AxDPo&eee(G!g4@27%szmpaRrIKm@r0KnApb2mhgRSYxn($n_x3Q3bsA}
z4--QJ$~xt~OJdkRxgVTrvKT+alr)L{FDkIqQ115i+J;aN?SFbuK+w3}8i`{Rfv$Ib
zs)%ACaCK;Jb)Fr^1QGU-p6n6X4yOoP=NUvO`+v6H3q9EF|KVo~nGkFYIC)=H{|$BU
zWMd0a`Sd|*xvA!z0M#FVC!pGrBshI1cjY7VL-<7v5M(r=v{zL~WAjBrXp5)&K)3Y!
zSqP24PgEwLVa@~p!g<K%+@o>K+lwIc<v6Kqy0@W5S7J(>_2IWc@pJ$8?^B@SXX9wp
z2Zw+4YgEN&!25Ra2T%Q8M)y)H#Ler#&}oty4(m{y&9*YoyLOlawfw09bR&kHi^Y7g
zyVGs<#W2Ru?uKRme<gU7!gGO6IS(yQ-f@IhEm<N!@^9<T*%{~sbHgCNNtRVkQz*S>
zY$kcbXB(hQKC{7A@(cio`67!F;2%v-mi0Ao(CF{h9O?3rt!%dJ7ttwr7=E7JBb(&<
zyp3Aj*vDh3(iyd<?s8<3Q<i=I@e$}lBSdck7)Rh}dpp)nqtv$uiELTrdbVA&lNQl(
zmoq78@0<^bWb-fM3OCufY_H>4<eRUL!)<7pPJ`n~f*MBUusqA6b)OX1dnf0s4<dAd
z=CB3Vi^d7@Cfvby7RBYeVL$e0)lcjU)_m!>Vn}XYC<L84u}c;hFSF5|f~yHgQ)yw4
z)GY?@vEDkl8<4T?30J;b6Ui2o%a;rZ#bU$U{a_hUT=v9WCo@iDnhHt9dQN|izaZBA
zWVsy}^Jvk>U2k{pF&9wvOIqxgo4UKl{c)*%aSt}@o|T|`yX!pfg3e~KShcvo>M8+)
ziL!wy)~`^zf`ncU>o4L`vG|E*=_=26y(qXRH6`<enkA?+r^RbzJ`Rg@d%Q`$TpG*G
zAPs<Q9tk_(7#tZO+?SsN1z~HiDkLM1ye~(oq~T2dmwH58e*J$i53ncr8Hl7%`?rXY
zj2wT+e-u(VtlJe+5wtjBg6q8}^!rnDldG7VrJj6Da^m3=?}tR8w7b*070#d$^SNdD
zDs76~cpd}E`XCAfeqL+^HkW+aC#-;mlo?_(#71u%)}!zG3FB_|Wg_m=wlONFP5%Dy
zsBaNb@?8lwL--_pXykSO-qPpm&+J;8<u+Gdp}A&D5O7Pwd6txA0?#oUHlb-0d^Ci=
zpZaTU8D`!m{BR3+rhYSR(2Cj<bLe6LVHIiFEc{p!XtzuxK@cEAfsGWiw0{C?RJaKf
zSv9dnq94?=PsrP-?{&W70c|Sbpn{lAU9;UYNgP|OpTd8WSWM?R?3No4&Hrjo+OC`?
zDz?qc%#{1*sX~Ww4&|aaU*0I<AZtJHTtP?vr;M#WQ?A(jw{uhB4k~Sp+MjHXUF<+5
z|1VGYC!QLuOTx8M<7GqQ!=KJB^;=yZh!$IXiJK|t68SoOpArx8rj>xhy(7!$1xE=C
z<>+gPBz_Kr%hI>dU0Zs%!NG;S3N&R{J6=NFwOc~1_*HZjAz)<Q7rV^MA){5SPr0J|
z+|J{fvo)LuG{w~ja(7WpP@b^1Hi+AFDI<}N=S$xWIBe~|E6}f|Px|`!Tu}2}cm^Im
z5Wp&wzyMX|hZsnc1lQej!SUd`9rK)7rTX)h+jwjuK;HZ>nb99f7?cb{F%38Ui-fV8
zd?Gz&)60n{g}5UD)vx@d5z0@wO3@cGUy+u3d%2!K`n@Z-wf0Nzle<77d1OHN1D|?c
zJXO4bR@P0$$LI;$AA70IUHlzOv6}gpsGJWOWc(lV;`vS%Tb#*D4Vn?kR+{(*z#c28
zk{?L9Ekf+ab7Zz#b{y6okv$%}c&K$?AOGVe>$W4&{%Up_J+1bGI-E|II;H1}f|aL~
zC*_J4{4C-`Eq|xFZ~B_<&JTh<f>ynE3lsmY4$i6PolhN5BFP)I_=I=(dHuTD!uw)y
z=c5#n?n=&UgS7cgfkVH=N8$YO@{|T4lA=mgtXO-(f~}qe{F5?-eOLFX`|(KFC1?;0
z!E$Y|o`)0BA4)!S@-^1iqwf614QNs8!x0V%5AKhrr!Lw?Ht>A=Aqg<BSJ6w6t4@t1
zlfC<ix&o8hyXpPcwz_>pPUiXbZvP<REs=C_*=tTU=;rP9m}FgLQJmdF!IiViQn4<}
zuj~A_l&0?MyhotZK=PNH^+dy%{?+Z6sSj!s6ATwLTZ^sBW<);k+_t(F+jqU-Hy#3$
z$B<~<$?ymL9wMl=Iq*k1B#$xd)$cDmE_($7X%%R^dQHS`gLavtoSm-<4Ka@-RyfJr
zKYx5Qvv9FsOr^QTGu$76^sDCp)k3$VKMLC*lOU^&r>6SKSgR|hC{l(pNnk`WApCa>
z>W_(=M@)`#F`|JVdMu{4<eIP6S#=S9$(9Jk;vEzdhnc%=gjSc|oGgXWhIP>m+zn4z
zU$+n^?%>1w%SBV==a+VR<5Ac6gO*=_J`)r`58b}&35gCN=kJe?b!(<Wv0JCzUhn9R
z_?pQ-$sYp}XAT^)V*AYD@1_qe49tv}e2O4cIf$w9q(x}$+}+B5X08auw?65)I&kgP
z{_L~!YJWaByeB$}!BN?n*|2fOFVpL}QLiOVl-2XN8c5F{-ST-+6+juLt1nIvr*Erz
z^4}Q(*hJL6cqjVGXX>TdY6vp@Simn1yy8cOpRQotHc#{}Ma@?~2!A85j^H1koWOC|
z%hYLl^eCnB{^wbyRvY3S_z|~IO!$|m^Um3Fj%`m~BGwJ4C%Y74#T+pd`7YV+dnQfH
z=3x~KNNY@3q!PMP8QJX8HkN_DQVfvB+B9D6hJiPNKasl(vV`s?kMfKerW8i(aM3DN
zjqdwOFeXm3d*^s83HbXB{(tPfXH-;Ovo6}?R#GF9LxZTGWRWBdG&DgaiGn1_C|QD}
zCTEb0WXTdmvIs~<G6+r1Ip@%1Xy7h<-|su;?!Cty-wtQoKWD5TxTYOe&zeuwQ#Gq<
z4m!@L`sNMgv2O=c0p3oHsmPAsQZCkCo{!VF+uo@_7eUtPU*Rviywsl_cvoK-9*pkM
zR>W32GJn5y<R+VLxWZKh%}-&P{W$tyhndb>r`;d!KW@Jvmyf_@3U6q63N+Z$o)C%;
zhO;#1&wqsLEjd`;;2}SRLthkXSCgb8WYWxKynf2cmeJs(E86B*MV{{if&aB^tKl-{
zgSMZY900PZdKL(b#p`h)bTs$)JkAT!<&Z4GERn(n%lXJ4lkaEc_u!kuTR{iwgn*kc
zlwdJJMt3*`qr2<4Cg7C~tkyZZ6kx}LS!+07F=s@s(*B&p=+<T~)x9b6U?7^0`%6%M
z{&n*@|3(_YBRAJ)b0`J#$WRW;vfNDlK-HMi_gl~Dp$RIE84hE)HiRM>1s`)cS6fjb
zQ^R+^y}#`iou^&FoFts#daVBul`1{5u2aS{cRHIZ?(tU#GSndq?fUIWEOqi$=kpQZ
z1Pi5YZmhMnh2k8XTAbS)D*Zj^hqvKN?`O(8AVOSs?KkWQ#So?+K2rZ4jRN|F7|8g1
z$Pi$GTV!?e6WJoS9rTVi=^@n?yjVpra%@|pHexj|Fo`g+&l!P>jLBm;WgaEz4;nJ_
zG;Bv7JoQ8E&UAmGJSkHNAs1JP$pC}LNey_|-u5+M$yrj=8UI~-{Ee4Px$F)}Lc0(z
zr;#G<540+Z)3>m#6%}J>vDS7V5n&D41jjL+cE<gI_8(K3u-;#`gD)>TvUcD=NrBfl
zHLfPYgPPrXN+4?#Z>f%*TQzZ*)>!_6_||=Swp!hjv4*&2?*swuCr?u!WOyqeM|v2F
z4NhOiDI5t8`(%{jZ`$HrwLR)R*>BrZSm+=<C%Fi#_D{63N^6TFg~BQ%5Rc7i?F_FJ
z#;r1mnSt(%aRM)0n~4{6otd<<p6?SIm3pCdYh1Z39Xxy!pM*-zH$ThVlbzN2taRf<
zE>U*625A`GQgE(2|G`(F)~F|mf`oCBlsiS-QJwoN_7mgEk<sNPq)U(z=6nFDuSmif
z&)kw{I?@|AiozA7Zu>|@l`>bgzok`?wc^8fDlYq(yJSi%fFb`8=RX@y{l7B$Aq<qe
zK|tGwgP)qM%HLTg^qUHYWZ89O;=gVED!g*sj1o$tyZd`m?8#a7*WVu8@?NaQt+{6f
z`$r?jdQ&XC&mgvMirj!4ed&Am99<oE5O=vKTa{J`KH8*rv4t>*&{EYG(yZ@<xm(bW
z0B(z@KD$!Ad$hRFU6lalBdVB`*3%_q^UsqcVcRkF%IMc$v?szNTMkcyjdw3EM5OO>
zhSfPA((2SYeT3?6-+`<U!6b&MzMslXy?5|eAJ!d|)$o9B5@fV0^lr+t`T?W{i;61=
zQQi;_5p;*O`*FSNe&ep3(m~$Vn8hBKnY_AwIrP1P5<)ka<&&o)uaxB`7b6L`u%uve
z7_uGxX_)xl-SJ#j&ZxCLS%h0vnrwTznjnt*PSg#DG@?o-`G)Cq1b$;v0C1jjU3&_T
zQ#+3-@2ki$2MMOP29j0C4gBWtM9|ASgl0hbB@<BN3==K^0qIlZmra-H<*7R7aq!n(
z${8|fOpao*mw@<HzPU#&#sX#<uJfYug@hf2pikG)V8@}yrB?*d^Vjjp{Sj*gbYN#S
zz1BbEt8$+g2;Lm~FfL<L*B#gzN~y1qlMmmHmMF}OI%oX=4v7Ml0KFQ<+w$vh=f}K>
zN;E~r4oMM$CPUxGriOyf<kDF4zbm`52%^3aIihYrv~o>uD4eg4r5>=q%;c%UByGR9
zd0A%(4!rp3ChO;>QEwn?W*o^3dyZ%D&VcJ;yZZSmK1RH;=jcd(>0x*uG!<xRU;J+9
zQGi>2?j;r1n`Y7{XCW$pShh~GoU@z4-4h`eTMyFMN;m}DevVCthi=7jY6*aK=Y-*-
zXo_zUL$;oI(1|W_$0ui?lB3J~^6zghSE%cIy44)c+0I2hKkUZ{c+5%qiOual)v7CH
z?4yGM`lz)UjWpTO&3Yc=Y5FRfkwBf%F}%4{Cr5|nV~j?5#;`l5)?**B+RaVGc5GJ9
z@ks}{-JB+wPOV!;y!fB2`xfPMx{@=%1Ov(T{`&zhx!9G=p>LmDoMd&Wef_pmvhh|f
zw!wCi`rV*=&+5u=%+`%l`UWZmqVyixABw{q#pp?-ag^2?%*cy7>q1l|8O7y4w$C5N
zsuZGBewi6V_v3WuRX4Z1hYM2P%3&}yb!)A_$#__B^T@y<CY(2t200kN*S|wJUQBsw
z^15s?-Kj1Z{gE?q(v4MqmNhhMW2C6D(k8?2;Q8shtwf<TkwSus^Sg%V8N&L;1wQ>J
z&YBmp7P^+=C7b*8M$oMf&1P3ugj+?Hf&!#kTgM*h7iIf}L+&ZA;^muNXHjP+*SXMe
zBF}aA#=?S2{X^1k9_kA|-303y{Nn2SO;^hpplOctLe#6fd1XMDv$7ZZ$>^#qO&z;Q
zOpL#^ZgpM8qdUIQmw6bT^4WB-(9_)b8zjHda6-W4elmKpFZ_mGJ1FlJBi$7c&y;9~
zY)E>5$WK3ol{<}7K%cn!7Jhs1n#wo~Wg~d$|HE8wCq>lOR`qn<VSuMOuRr*Vit8mV
zt$^8j2yM_~+*=A^)nhFUz-a}Yuc`?$UH=3#M;Ws^S3%d&MpXcsZ6nX3B(1N!3}T2-
zBl<3wAIK<rD|T`I(nh<@TSnj@{@eGZEMyXZIkd?W_YbAH(Go<t^b@G~!C_bP_Zh8w
znb|4U(;85uiH!y3*|%fzl<(G@kqh}|cJZ4Uobe^Vn@p*VajDCVpk9%7<29N1j}1_=
zh=XT?CujfzJPzATejV`VX;FC`5YNOv4OQQgXP-05^kyDTbLHx!thZRhZja$3sNY(@
zVLbTw0r#^{%{(sG$r$&{EXp$Je%1gU+kH$h9bNNj=h$A$hVhr8=+^EN9noru4XEa>
zL6RtQ!$u@aTl%vF{3;Eg2hEc+iU;ao_rynHowG;cf>x1}2epV;PDZ;<@-5ve`Hxp^
z)ApXvlppt1(RWB-@dg`U^XidM^Dwd9iT@yphjU5&f|uY09HNXX-RS$}E_q-Ojk3z^
zkMFSV-Jp*f(B*gG7ZFKxG~N-YnOksnt_Iq}+K+5}PFbg=6<xPkh-zNuCrhfix_m=x
z-IV6(stIImU6fTYFIF(0<}oj`7>=Ga&d|Rk$!ROq{n6vK+;kzbCHqPziTVeoy|%p6
zF%t{NDx16hO<KhfyONqVQkb|3nP%vJP^yvMW@>!0xPs&4Gh$vO?=aF~yS&6K;Cp#!
z+-%_#_|`|AUA)E2U8s6T_%5S%vY7kj8msdKf0x=V$%YKEar5$l*U*7|6&$+e&xcLV
zYVV}^Q|>}Gh&J!1tal9Ew~9n31SGZUU9?!#A`YdI_Ta}nDZn{~%wshiZJL+po{aEG
zsGWQ5)=_o$VP0w+XZoI!sOktc$uA3~MiSOn3sYR_lavJ2UDmt#77LQ&Rc4>gH}v#}
zxhId9#2pz=+C;s{Eou_>1Dp1vZanp#i)2Gv93`%<MTmc>y!ZSnfx_Qa4<qTWVB?8-
zbeo!#nluQsOwf*V0?%UJJjDOa8n2Y}S!v+r7$U#&=!1q-wdFDy6`|>Dx(k7KXaJ^s
z>TAoTqp}Q_M<Iudto@jHnd#nzO3m^`Zre92(tKUC-0XulE;DGo<Hu*WJ=SaKJYp@1
zL=k*J<W|H{DXH*asw+s@W#phzn>lwqqk+d_`OhPhvkjEUP93TVkv4d`oQRKGP*jih
zo+{E9cxN}#drpt+xY~BH8b~^x-dnFHV-Xc~{wdn*e}6{pxL#~gtk5XDyr>ra$nAVf
zl2&;A8R;`8+XJ?<rI8q&!>B!hlX4MaRNgS*B42ysZqz|W_*yHY0jgBzxq;n92PWK2
z2ikqI>eBPmZZuuiX|hXgv0}#KZ3a7U+5x>4^5;)G20G6&^NHb+w^$xpJ&ed1y(S-G
zIzivZj6kto6TUH0CgD+7xabjXUVh$erPb-{(;KW8L2}&bbQ)r%kN9wgMJJ_rqlM?&
z->WEVY%9;~)SccjV|k)$Z-Z>E4vB)DchS~gO{Wj;SfFf{zj16>k%}FFYlW65%sNv!
z&JQw#qm!cy6@Vs-KsRdV_x*P-yQjpx#@QJS#EnQxhB3ou&ppHhHq$*B4O-X>>o+cF
z_IB}<p<JXTvLA#m_sYZDWbi^wHb<51R+%GfO>T#O9w`n`_t^R|z2m)q-nUgT)yY`Q
zcgO6T6G?6G$|u^Rb^6YWJIUg|8d2k7wKKid{=LYRBjTT-^;dfY$-^0fQ#R+b4frLs
z=jc^JSpA~WQg4)@Oh2zIlm>mlpW$lY*5H}AI)Hjh9;l@w*}@XHWKHi<1;Z30%G!&6
zl`N#B_Zco`A!qlhEjo_Fes9%1q_Ths`eFp`>UKDN+c{-ZziPWPm0F>!Yk0SR#=AS<
zQEDx02{~>#qRmp}x61NL$32vB{<Op&6%+0~HxygDBaUhJff3N(?sHqZbNYLA0kh=u
zfV;MpcLq)OIbgH_^KPl$aVABgdb^Zw2DNXE4BVoyJ--+dRKZxgae6!|$5WzNQ>jv@
z%h%Wbc(_T|{D~ZEz>^%mPubC$wy1T5q7=4wzqNl};Z2H_Sg3DmS?co&zoQ!SrHQB8
z0UL-^)I7~hVF07zO45fq-tr}LImc;%_=o0s7_soppDWXL#8#R^hGz$YYYX8kr`^zw
zeHqw--;wVXCh$@|=@^0ZD<JBNMK*Vw-q@G6SRwp<RnkJWKy~6xn(U(E1(Qf&Qi@=O
zDa|2oq5?kdyMmGSUEjJ8`GvmBxY){fdQEb^v(+mIcA8F)ku9k6dUMVkh{oh!L<C*N
zQ@-7rjN2)90g;w$TQC|sC}sG(uky<K_APfGOM5kGA9cL3rlRA1Rq4dr9WNFtP&!ic
zBJAmU&JyFu7VZ%bGFv8ecdyOAPuJseZZEMYa0+38=dtd*o0jPM)_$>K+BmrzKe_G6
z%h=oK&66C{4kdBtXyYA0ZqgD)fS`rJ*4fruWO6hTG{pE!p!I09(L+v7el+ZC6ijNB
zn;oDIy*KIHrmcfta{ceq0w7P&6{PJvMlqba%K0roJ^c2UG)4nUpyq~!IvCg%!h3A@
zNUZw!#QHqz9j3vD<eecp%A2<JW?|PT<f!}WE7OZJ`{lz%MTZ$T!Ot+{r-ZGd`pfJ(
zHx&PZViLXm;@o4CUgANUqFQVNvbEY28gVa1DDU_Jx`@j4xkBROy_4>b?HDDo4ECZb
z0TX4HovFwaYW^gLaho<zB;L+Bqf_8A>gxCJkz8eFVq=^kL^Y#45_zf<PfTM=S}V4t
zz*nDyYgV+zJiKrd)qZv9NUn`M%}Nm;Zt?zsY(4lYGjmoW)Cs*h*;jh9m&r&LV>|zm
zwby<`=b7b1Sr*X$N+n}xWX37Ve-f$Gery3GM$;*TrC%IPB=(Pa-XB#~)=^A#J;D>^
zb<UrtwkZytXSygxRQE50i%W8973=$?X5>|U7JXGO=QwF2NH?U`$0;}iSJPfX|1zp?
z1{RE{4=2|J^2*IodH-Fv#e-?(pT{|=Zi<4F)`T&9(|wFNDbA0kJ{&^?)Jc0D*zO?r
z#WH0X-I9j$HR$>aJao|7?F)RF*qjME$xlMJ>&|t$xKnb7nd^x=)QEYZ$U8dXB_le?
z@&tC<w+9mO66p?>8IDGi-&b#W*qzL2Bj%s(UDmmt-mE&RqBA{Q=hu`UO<xsk3J`tD
zAhJ!-@3w?*06yPrrgD1KG9a;2(L}Pf+C(~im{2rvBd2%9qv$AMc}Lcx^knK-{6+l-
zt^-FJ_i!xipLhxnL|KA6<pf^YE4(Gz_Pnz|gT-Iw88Eu)@_<D&*cP4mQo;US424x#
z9bE3lX()&P20zc63b@Yz2n=*qir@Cw)#nRvEm%GMxUi;sL}@O%NT@KS2#ZwQcF#NI
z(0QpT={V)ijv}PCdYx}gf_sYsYhWPPIZ$EHKl4THK>rk-<?|p(7vpHj-L$W85Ez8T
z1j6+MK|t8oH(t49PucYV^to|X)#Id_rxI9$NDRcG<3giu6{4d~x#U3oYf|UKu3RH6
zUb?XS>@0Ea^e>ju%yH!F7q>)Hso5CaD<?!!sKx8f)^F#r6{X$Z6fXZ#6GHo)l}ofA
z8Tpj*JW<d}ab991&Ssr-#zQIUzNpqp&b=~sLW;J@P5N;k@q5!Lp;!|?OpR6Kh?3Nb
zPJ=1k&N)>}97k0m<0dCz<8R}%zg{ScC{Junls0{}8!tujT~xp4yf|qx7=KxIFLMuY
z_X)={5CmpZ&MszSr4(=98TZ$lUorFMUPN74omstlx-@E2zg0ewyRw$E)|<Y<TKg0w
zwlP^reYx7ixU>=4ylTYY5hT>h+?qE3vs_tUKh2^{Z%)u|t|d--&|QR4u}#D}mBH=>
z)wttM?N<gmRQ|am1D%KQKvDgb%ubz1Kxn*L^V{0wR%VLME<MB1j4(0pFyVER*n!uB
zU!*?>6h6E+XLx#d<@3<DwSX3JTK~@<L)zX~Z~jV&IqT~Y*)p-Pn_CMkx0rg)j^wCE
zkJHukrQglQOnVa>xEyaQ0LwH~v)rsD)d-bMbktj&a=HkOEg}_*m(}G`hmij?Ydzln
z5IgDOxI7md-E<s_2sygcE2`{L!$?Bi4#-r|_-QXz<Q6}?z5@Fi=b>bYyG6$G=^Um#
z#K%7rk!<oi2o94??8i}le#yJP=#ePUS7lFUa>=^CHlS3m7hcRChJO0}zJlqM;(7n&
z`L-OxlTH2hBI=^6qm7-i#g#0KbWlr~?b5@x9Xb=3fSt$e<z=eYhf=}^EF$3#yMn)#
zmflSx32I(MfbdIt4ozRb7JIvN`-Q6X1J&0SAEHM-?8Ash8Y>QSl<u8jY+6(=OjB!*
z52;tRki@oK9*JLrLM!M5-vj!OKRx8}F%^7Kc;RbKN?Lc#@~71;*^3L*)okS8JX!LN
z+!zaN@ec3eovG5k>>4}1vrywlyRXgmD9`9FLQikj5HNyBJqa3cX0dkR`N)PP=GRFc
z8iKwoBrqPv$>5F%g0`i(G@q(|JgPT~t?{Uo#1jtA%Q=_%B8b0T{Ri$!&niaScv%|%
zW3{7l0<rH6x9+4YQ#_0CIQmWFKbKOzRyN?=cV9rBH;ip!q(T?!JUd<e!-Vh6IjY|7
z<uRj*PDctIVpfS)lCF(At%|;PjHAi<j^Sx>Q#i2(<8Si}3*B6F!1)j}s0Km1L(NSM
zoTL;%CA);TPZpjBS=QPmJt4p#q9bDv!pKl<9nRCYB4LA)aAKobW`Q$zN4kRdS?hUE
z!Y@eH1jl}24hi_*a92<lim23$IY-AupEXIxy?L%(MQ`NrAuZ}Bv_{Dam9*CBy%!O^
z(75SwVD<d4C@w(#z+>{b-abPC&#J6(zo0`$oiqUGP+2^^bRV}JXAuhxLcYLlAehD3
z^?HtTu*7r1R1hKB9JGbxypsFA*@&Qb(t}kV--R<K#RLFcIb76)U+|gBSkT*p->;Nx
zCw~wysni67Q%fhTCA<@k+03%v<rMTny^KdC3YtrNH&zmCYi<oq%#}sygmqhem`+p>
zDT&iN-|KA(?<b7Xolk8_REoQ*8P$m<n*ktiFN(=6?jk(CY=`Q2U~$h<tYdC(yZU41
zy003(#qvPC!W(3J#8U5yq#*Gyn=L6bU2+2ZD<$l1>!~Na!epKj`Ft0jl~-CqM;9EQ
z?a8#Ia37xDVP^>_1yrzlc$4#+$}`|#qtNB}_fteghd>hiLMTKyx>5Itjf*SmOF`mV
z4wP!3Vum9VILGmcm^-fyuTB#~QTq;N-%3ZH-S8Lt)P3DT+d9|eBBq_54i`lo^5>}b
zFP;4bn|;;TJA5xs-0&9(H$*z>7`=}4FK(Xsd^p2dyn)6=dc)?B+%+rOfIy6g1C(!G
z>uRRExH4jUceAoOe3za~JMR;JzS@(eB^GwYeC%UPb(^TMC!G4Q!oaK>9?}ue5Tm9e
z5vT1?GFGhdeL6jW(RnmP)&)H<Z^b4uarn%}T!TeM^qG>l==9mE-u<K``m?<NKe7D+
zo$s+>8^cq^wC=cntOFL4=PB6m+DuqOB2YEPON-ytx^6z?p19SM)t)#DZeSWtAo<;~
zq|{^l?$tdPs{#&ghwK+x4^BfhD~U#e$E=gZ?Za{YHaYNIuoE(n_)v1u9D@636e5t5
z_MpCNIaENJjxLj=^1<I03G1KciD~RF+w@+<><8;Gg9dFyz*EPqhT?@UHnTXcMgc)#
z1TOL83oMDccZgjqG6^c`jxR+HE~~9Zwsc8}Q)@-G5o+3Q1+v2Hrj!fZ_H8r3`Qq{-
z<yKZ<!NJ^hA+Pf_O(WZSTjRt}wb4x#(J?V^V~bd0R8<Ezet%z!({(SH=(CD*39a7N
zZJ5@2r|97`UNIvP3{-)~ACqZ|%;L+{iWVKKiI36v@1<5PKrh1gNKcg*PD#a}7cX<v
z@KVGjQ^T2bBZ>wixvfOm_uA^&KCj;^FU=2p_^lIWrzG`>3X8f~W~M?T;b(NrL?G)R
z?L+QqsUcWX74ny`d;9NqO@|h7bIy2lh1D1aA+@@1upz?7Qm64V1q&K&e*V<Z>+5};
z+Rt8|x<$mwdB5cbugC5nbZ5ixXHDPz<e5kn)#w+}(k0SGfvCMDPJ%uDOJ#8eLE0}K
zJRXLZN6UEa1S#ALy5fP37kGzFn4nXNee*j#MSx$nhKW`;)VM422he!f=-Emb4AX8H
z9hYcq@CINUq*ET;mJ{WnY`8TOJH_NvLM9Obj_MCACSNJ_qbcMVinveuHuECRa?*Ei
zA%;%(R}!WJ<eqn}o{%fr*};A%^CbeLRhEz`CFh&_sb4II#&eG%9R+|W2#^n)lK<fR
zESR%ZJ`?uDVKVq=)J^bv%Dekr9lb7$nQA(2oP~P=d34@20)tNQ3u>%`@C-C53@I-m
z{y6s@;|ZWHTUi$SIKyUFdKZ~l_yTOvbaV|dam56kv`%SdAzv~@RdEt-2}CrKiDA>M
zZ8mbIidOC^>y*YUWy9W`z0h?2obzYS5vk!c(=s{Oy0gJ6bcowbq#<zceXqEHQCusf
zFUPWJXU1=<1;?Y&GKu4~0?Lve`eMIaeNUf~fuNqG4FnH~<Dre$iW2Jt4h%{CCNTBe
zWPW`lRmo8`B~Tj}>?gR}EBfj>vZ2`76r*;SQ+qru`(P5>!gloY#==<B^22)9=%{1_
ztAlt#*w%1&7xhuNxO<K=OTY(>+3zYbBRZlky#*B{0&PQTx^B{fq_mrkFzH`bq@vc)
z<e_t-eZ~@@u}V{N2KPmqH)ZCicX>yw<KdSCsfJ=WSEnQ5yif@-Cg|l7&VGQ$DP$)q
z0W-5}r}41WjVCD7PYkN`_7{@?dYUIhe}6PENl@^$YV^yucviEad(Mb=_;ekMC4!n_
z&DOQq*`0kWW9lQ&rSlbC*v$MXB^v8AFzYf!ZL~99<aveVECfwigpQ3&>87*%Ozo!H
zQ{|*!k9S765Yq-a;f=+BU3u$x>WbZ$Gu?1n$*-@?mED>cbyOm-3|m>KFG1G|VV%IM
z_INCyu<A@RRgk=CG}ZkqQsDh$19x)X3Em50eq+?<f^u^O7rWKjw_tWZiwEP+o1n<R
zatex54s!8qd~C;QBtf#n_=9(bR<(x$XNys&?n-jj0?i*^!o^*~o9Qe$!h+DY>r*Rl
zG)rt%If7&p{-VkecfopM&p(Ap@p-~=m?Dz3+GR=#i|kcmDU{z*xTH5nmH|poptP{N
zGk<@&H7=OfLOOxEX&4om{0g2RZ12A@A5%{2zj5dT+s4KPSohO6xHYim`|n?UDqp6d
znYXWdpP_)fp&CuaYN^%7^H0_H51I~#F-5#?U^JL=m^4F$^u8S-qWARKgf<HWwg?F=
z&LY-o_PIko6O80*Ae2I!Lmoct+&Ci7s5j`-jlemsTpulAsTDHC=6}D4o+LkHDrDDd
z35vO9wF4en0zQrn)w6tzII|3bJDwxFjIJFx%Pb*;x(nE@UN&T%mF=DHd_?wccgfnT
z;?ZGZ8np7gWY8C05*AKw4|VjV1s*;69!e-J@bF>KhBkM12UjLh@SHORU7^oR<4*dn
zNb3#YdS)gjyWy%^WhuH$n9{hQK(a|^*}MTed2)I7V7irfJ?gV-n7eGfp?d=c^iOuS
z;skIrf#lR%<{ZJzfjFcg1Ql>NqrrXBWYSeh<HIev(3`&mIXF1kvjns2WM;TDslT7m
z_<$}*T`zX$0BR^7r{hevRk1T2-ILlEvItn~?43GY`6ejcGvMfEmS0XyPWyb*4YDDi
zMI2zYS}XBWA{$(B-9h4LYLNKJBEf<zp|1J@O@eTAlv+D`$R{smBkpJedUkyU1^)WX
z3U4!`##CG>fO<V2h2sYZVw=jRt*y~S_vlPCgI`N7<QAl(`z<Zlbf)z%2F^iCH);Gg
zHWdo1VryG8r3b=Yf%N|;yT6=xTd>Y<A-wh?$`%^C5F97sT&>kkeiTJJ%QAF_M8TII
zgD-h+U|o1!HegJGa1QRR%JouB&4ZAhFgPO<>3!^8D)QI5^6Wr_&A?E*>#Co_g_Vqe
zk(%`VgiAZZVo85Q+cAT@I#pg|r<8EXXz7LKXFXKx)eqO1st+HjD5&~Mv&07k390(?
zmbx@ZBUx2<salOK+KhQz2L=XKdkX`K^*7ziHVQ>v>FYButx&y?kYIdkY^<!R%I`vv
zm)76^XuQgv@B+P2ROWiheb6m9)9aBaXn5&&iFHAEmh;;w9>tR?D+<*UGgEhCim&su
zJ5Yj&>2_)A;JY;a{@uw>Y<S8_4`;F`(?g7Qc0S7c$`%@Y=>I$9O=l-3&(eTprA`ZB
zpXwXg1nq{Rz4oHsojq5d!{_-U!>r;f6y=YWxBD&WgnTjl(U`X{@U4~=S$TaGDy+&L
zOtjLW9`=e;r^4_X!Vf#b8|W5@7l={8PCCA|ga?K&C>;7!+YMM^!%lBnq1TXuyD~*Y
zMacoRaG9Sz-RkV={L-CR@dAm|a8)7s0mA;bPV-$F?0H@RmMGn6V<TEdzM&5mpZLkU
zv9MFX#aQ`HQiWd&4Y>2??<I)-Y8{JgrQ_lIj()&S=f7by%%4m055Kzs+%A(C^e8Wn
zBYm8fSE>Q)T08uk?>h8@Yht+s+V2p)ICuI18LkwSsxp_2WS|PgfzGms6xzW?5h0}4
zS9?G*)ngK11$#mpNIMCRAQ;e}o6VXun_Zj}Ea3KqSaHB?fYE$FKGEfuFsEdnIcK+m
z#09Z`{5nb5G(Z<w+ViWH2#$VUM*}&oy{I?t9k&Tqb2>6poy7yvJ^Jd^Q+HztcT>$7
z|N5#~f+d6t82GAYf9M-VgC!9pddWr<a=i>65@QnR#PAp!5M&Kbo-j{R721aIKL!!x
zng+hMk+V24_^W@}$p6|<+h6|2t@Bbl4f<-!eqam0Xg0n4^xCRM5CEpP;YR?OD_9H{
z>P^}hFpGeR&z+K;fex@%ae4{TNa0XVF_0VRUme)XA+3ZpS6LR=;Qt4*`o}c>dnx{h
z|8wi6R~hyZWTSjw=z<-reXj0_V;yk;qb9h%B5-y=P9WI-(un{0TL=m^i-sijP<rrF
zB6OO)2wHu#n3#ZB0o*u=e{vM5KlfPZ|0R##|8)_Opd~b!T>>c*mozWq-tGB)6xwZY
zvYseK0NM)p9-r+!>_61#+Iuudv7SKwDH(O8U(U4uIjKOD&OCvL;lwbt@qakK|DqWF
zdKptX<WCUny@>sfkzodozZ?zglD{1df(XFT2;B1mF09kyeec#r(pdrkRT8HSj6i|n
z^^MQJ2EXffVPW)E@Irn5ejnOP6!#BkX9+~OP3Qrfnozp~@qY#5u3Fk)X72e0oP|bC
z$iI`*oqy+!FUtZ89^?uV``<kDYx?;w3=y3E@#FvC=x(*;Fo2`Cv*`lo|HP4Jj@<9K
zUMgy=UFJVxYj*Wqk%d9^#eDxW0Qv{!ARhlmWT!n<@7?<&98U;DFoyE6@dPfA@INCy
z|7Ae!{l>X=h%ENh40#u&|KSk*WrlBK{h8pjemL&mW;qD-*MyrkV8CL3xdQ(j@^lCN
zOGC3v&`gTb0QC}$!X*z=O5OOsI1s1Ep8$*}Y?YDwZ@Ge?l}E0B>9#+T2|T=;pCj>~
zRBM@kskPAmQML9;&Bb!6@r#X1pxp=wl?WFtfmnmA18B{uIN&e8HG=f-^?q$gqDeQI
z{}?Hd_$X3h;Saj7Flj)y%D<u3*h5H5@HbADaQ;}FYfI;#(<}7%``DnPh`%k}-w+M(
zpCbU=HM{c3Zza^|JAa~l*jWEoPE6i^=u`xO^fgdG(A>v*?zn&JsecZ^#s3oJEYAP;
zkaYxUKd>jwQNk@3CtW)6j=`qn1wNzM_wYT>JrMHxGn}fLU2nK~0UG!(vHd1+a&O)z
zTSol1Ow#|X?EbGwY7F?lCh6L){r_%~K9TCiauL4064-o7Mfh$uL*U{FvVgMyxNYwL
z#|<$+YN6tP7~lUSyx3zq9fIvcClJ+sBK_L2+d(+H`T<R`dzqCcU{_Dl)__DSRj$Xr
zu5cha6G8f~>bn0D9VuD<OF!!8&s~ANa9Xhz|9hPCpM2E|cfqUdSGHyIT?T@G>(l(_
z+1k^mxWE=iBS-vPN8A#T2x;*?$d>Sbz_8C^5t23_EF{NyGy4DYPxWtHwIH~r#DKsL
zQ~Ga!$;K4LqC%aB+XgsoGI5}QcSZmhDYkvQWrE+~y`+=-SO+Ytvc2JxXwOrueVk>2
z3YZ=c0P#F+<Rp!U@`&rXTXzAYzk!?o;!E6@34jc+1upvk_V4-_4E!*|BS_-=y%V)2
zMguZO7dS59-Tfi-Z2z!|0HG&%_`ebQQWoew)-uj-f_PFMAOO(d>Uj$Jm)tBbp?(5D
z*fyaF<fY3A31iU-F$y#Z8qq0{64w!y*x1+zONlJ6Yfrhu7j9|EIW(y9N&)a$)l^@q
zzQt2jRlO@u&Rc(1UM>9#oM{>Ci83JJeGkI*^u)um4#Oi#!uGl=3qq$XGK4I*P+&(?
zRIZb#+y`S*7fFC5A3>f<;xZjS8~ti>3lhkO+rVct%$%$EoH=3@9rrTXuNB)11U}&p
zELaN0PIz#K;l%feSo11Bt6*xWtt~OmC}@G~*<TY5kp%~OS-eHk#Kgr=x0b&A;q>{6
zx4yYgPeRobp2WiB`nu8ewf-EROAOto8DCVXhHj64oy87ivlm?Qj^0Q*?I&Ga`1wUT
z;@)DhWY)rMtm>MHZ>DkeXNmze6J)ZmNV4KCEksw`#brc=6r*;}$ds7QmSb^v>X~Aj
z(+`#~AxI#jm!55rqY2w-z@#}T6D~F&NS+i^Hg{#IM!q22Uq(_)(@RC^OVHzh3%%SU
zpSly~*9$p4Ot15@E8wfNc@4~(^!)?CCQW?<k3T;Fzl%@7(vI1%%1E(|Mb#REKteBN
zQIG-rzKE<f2n&dz+`{t;36ampqe&>_VHau3SU0$>rSnpr|Hlx<rD>g5Y=x>&)!v?B
z-|DA^)yD+@JWPiWP->P=YDNn@jhPJGBb=3wpeP}^hYBD*Urg*lEeM~6p3sP*a2~C`
zV6<k!#>LzLA&&`(Z+UtyfZ@~h0k`p5Ay^?J)ZW2gyx>W9KtIC=!X$op!f!EyQl5S3
zk$QED#7pW^y}yoC>jj-dE%bz-6$+$Y_7?qGW*u`4^|PA+8@*k5>8?*cF#E$lR1dH0
zu{&1W%>e4AAY}^*4+r``s*6dP45H*`n`@JAt<_P^siL90T=A?VMSN>NnAW=CWXLLx
z2@BZYl3}_n7R>K4)<ux2Z-VW$D9v=cr=)zkhjjR{u;U%kiK7q_hR(1@^Khm|xZWMr
z<Y+pRd);cMy}Wle<lazRfpMb*T?kz}0{Fwp*Wz^x0_P`#;Kh6E%_mJ5J!$$Cc-kBp
z`2MkG(^<5~s$b9(Nu~&TFz!Oa*&>znZCJ)rCV2<kdF9Lecpyn_;qpDMXMI=lXF4*}
zcmH2)0Rid-@vl1=?@al5UPq2n-y8`=CB|8SnEi_j{b(-PS#Q1y@>Qi+!XR}jDkK>g
zz<=QN(brSEgPWZ*z4TMTBrbc2c`$~|^<ZuI6i<deh*c60`7enE!BmPN3Nn#P+o=X^
z_xJ9GuXOQK{RVv632|=`Vp;V(c*kHyCn$LepUALrS(SHw@6P-|(My?HNS0R`jGH9g
zpf$ae@XU^=`i=RUogy0-YK<q0+BS&z-w1?d?LT?}fStPNmPd@XcciQmkDXdD5vy)N
zXE<JZz<6!XE9Wfjoq@{lYrTXNO1^NWQ^@Wz%_>#LNSBFn%^e6gdPT?TWu{7MF|c#U
ztk)*J(7>9ox3|Ikx|)F*0w(an{L0QIDEv%&bhC?5UwirG5Bh8k9h^+X8vokn*ti&f
z92PY8_41y-g{6!h(z3vFY2+F!|2e&GnymXUv>X4jc5qlL%bMjH0hCy~8owME9s(&i
zx3H`gB^~G<664;H1fdzpEGofZDPPbc=bce&WgKSDy>WQMLODDQi_CLUkm;n7AM%t8
zP&W_y`%K=wxzihgri$}SdkJSEA=C32E&s9hhF3uQu5SbLXPXG!(Pjf8t?u&TM_;VL
z*h4%)E%0kJJ%jAN-mPeU<5Aqh{q|nV-IVUXaQOvrSSUHYD;fXn;TC^T94qJK)eY$Q
z0n0!H+{~$npaM$;fEGocV66Fp3BhXD5;9@7La+dj*emLJj^lME3$oR{ieCtWGYvsN
zs7%f9jM_b4IHFzm@zI-N0$)+Ryill9U?^*={A^XFnBf-CzXAx8S4d%goe3WhPPl*C
zc++_%XYY|dp&KT|S)W(x-TaN21eh>S_!pLl$jE0uPq})y*<+N%)>c}RtrG0ry_f^`
zPrgVoMXUq*`=uLh+66q#oeZ=x$UR+22Qhhy%d|uMQEWTe4A28F3);x5YpIJqPI=^t
zLIQEI+THHv&e8r^o*)=Gi6*cXlcdwcmQZ7#GafTVV8BjJfkVrAZ-wT$a6JRMUQW+A
zwfFR7VPq6S7RSdmNz9*lKNgUWiPujJs`QeT)}T=>sZjr8N4=zE8}eqUs4Vq;t{x4%
z$}i^}KOJ~d-|p`ngnq<H%Y4mr8hCLVjKd^8dINzaFcy}`ipqDAdm`Tt17CZ5+Tc5(
zsZHCaVR#aKCl~@A6vvJ@K5L_Ql-I^(vidr4{BhJaWJGF{e~<<ciKq7VTTX2f)|9IQ
z<Re0q7jTkbAwKqvFwbP;;_2vFhM;xU+t`Q99#3Wnc@)=4*+`x4?>jvrGSIg8k{w(a
zKM_r4Gs^-#VT7)kt_|jD$O#<DXM8q0B4U4CEQGnkgx|EZsh}*``1>t<Q$(cS3*eo*
zVLLczGAKGd)jOg@^I!%)?<<A<<gx4Ac1Lf2!G7>m1kME%da<+p3dMIodd5n&!o8c2
zLvK!mCPFGoAr*c1HoAq6it>H4xlOeS&Zz9zV2H{#zZDvxT74k~^tLbwzyIDS&jRn*
zUO<g0sf&L^#Ywbah#JZ!k2hrGguZAMN`>7QreyU~Z6LNi_391(x2%IQqJ3@7;ePw(
zCj(Y}M?e`z(a_5HXF-%+?X!50Em%08R5&CH^YdNV>LFenJ3`HL_|Pbt8w{E;qK7gv
z8VsSS(z{q5T7$z7iV}vM9o-puoj0GaD4Ea&%-tHc4-#V0Ys&a6+Wf04{jKZlZ2%*_
zGE9Q?o<=KLNR0<ER95`3Bw=2Ub&P>-gPck63*@ybpapRL#*y?P0q!Rftfi!z!|Bh}
z18gNdK8<`m#e}4EqgH#<KfP~HlehtFFo}AJkg6&P0TRA3^7etYe#l7lw)<l-X#n^+
zCT$sG@H9p;5NeQRw2}f+%nV^a{a`jly@Xrg5p`%k8x0fEfHjY2QYbS)aJ>!=h|GRZ
z>o4VgwL#(;v3mJOsr!1_umLJs6X!b<6AR6Co&{tDtS*jIqFU2D+#WWtO0t2$HVj)W
zZXN=NiEkL_gu^aBf*kmrs{o#)!kM3gus?bOPpRyD^H3fic*>66;I9MtAtQrp=4H3R
zY}gSl(%9E4yF?N|6T6Wz7X%yz=UC)E(T=>%>+rZv=@<&R<VcO&mIR$ZmX@eqD(Xli
zJB||J%V?+Hv8x_@Ju;q>?lefj!u=PDjNov`nwU7sSEd~TsUkUL$?3mSpVT){zg9+o
z0iEE+JR6KUm`>k~b6a6Mk?*@6^yJ3PPkPn!Bs$snfcAWcwjyU`P!!N#FO4ABUMCU_
zTsxY4F~%;`91Q3}FpzUR4IW+Md~@1=>+nf?;vH`uO7Ljgw`oLMswh!x*k0cCOZI{R
zgsJxYXa!=um;KDgK}6Rk?KYMOYIVm!r_ZU_Za3tPF9eJ$+hBS+Ad*)zj>xQr{7F5D
z8b4`3<Ua@fDkd|T%%{l8$)TGDwXkr6^^)Zl6r|f8-3tDb@)AJ=UJVo6qpUluKU5Zc
zwn9byL5ld^&1-Ef4`>N}Z2wI_C{lhPA=ZZ{*1V9XY=C0BF{GVq;mra<%I%WKm#iDs
zWUB{c{DgY~>&1}zTE6ChohXr^Uc$k;0t<0^T<-YZ1|Hm-IbyidRO_@|bmbLktn<g#
zE#`i0@Tg6nli6%kWQ;UkXd+E0zgW1Xc^!3oc1LkP&Kei*w<g5yS2pgf&+Dt=oP`jU
zKRG{-?_%SHex|PAo<4)Bs=Y@4yjAb7DFXPbYE|~`54gs^Pyw?CJog|S_OxquMfrYg
zt6Po_>Nb@xFo-MJ5cT1qkh#$YAC1P?GT#%sTzDW0G59e(b_$vcC2yN6rcbK<wXUCe
zCx}>*X%>p5glxjBLmy-|<6x&OQ0yaM2RGJ1xCWt~Ig=Z(EXN-kezeDm0Xn(y0ELA&
zgn6=};Pu4|J^;bJhppI=8sMdjyCGXS9oP7IU6pqIY47zG86g%BZw$9`on?M~PN1(2
zUR<Vl!Q~NF0+^ouQ8|vVU9wyQAKpgNzX%=;q*n<Zy|?1t^*os6{ih!8T@pH8-%1Do
z5;ihWs`L#eE&@Pg9Jmd_`i*|S;Y{gdo;9p?$LZ)B{(wbqe8SQ4EqL$qJPxQ^=^5ZY
zJQ&+Dc?`)_1LSmgQ}8`LE(~J*{1SFk8W;G)Vlp7tcB|Pgj?{y)rced&4mU`=VMn;}
zG0BJ_)tU@81tJ3qs4rKN_X5+jK6_`EN(1B%0l7tsb%E<kT^j4`<e(}xxQrJDAlpa1
zh431jhoPX8{5rC>3s1Ni%WUEY><zi?6|0uQSTrp^e@b6E;=z5e7aYS3LWb9iNrVD<
zN9|hZBg;qSL<{^hE)<s7*j{A2(dXSsV{rt0oK08z%)|W@EY|`ZCEH!3xuDJP5VO(V
zNe(-_FH#za<24Hwy5|wOPEbhe+{M=!EI)&t;te+lV{Jm@$MX&EdH_si(B?&N8QzV^
zL`DO93=7c^W2~9E`PZ6!snMpD$k^C-i+c&};(!a)PK|cdbJcSlJU)4`R996M6eMUB
zqF&T{nw6g!pUI(1&??yK=oW6ZA=G>#cexjrlG3Ov$;KlDc8$ec5Q}+<nJzhPAl>$A
z*I)4GA6vX-c-U{B&<d#Go@+JClU=Yd>a3${IPR>pA-tU`lV=E@F3HA22G)k%Kz`uk
zY1P_n(<(#VrUuekgFuV?mrMMb$dQdb`rHggXXZsQ`^9O|^(o_$O^;pqi&+lGk8j1l
zV49mp9-Ic-B~y<yZgZ<t*BhaX_aGZ7x2^F39QNiS*$r)vjq`7BI%o1>V^X+2qk?b{
z07gCGFy^$*T8?!JOHHWFke&Mtqu*pUbJr^kz%@4Z>~{!Uk`j0!Jpz=pKpo8n1~-cW
z9HDaOjtb95h-b|`W#er4D;}L!X;FPrOnL~AtrZTg^7R{JL9hj(Og0GEH^lQ5nhH%E
zNd|mqDtHjsNHSD<|6}tbF0(b*lK%1gzH#aos;V*cLFT4=zr1<g(09rO6VvYzTt5S#
zux>v#Gk9#c(P~e&LGh&iHq{#I8(NYC7SbKFNz85&X%-8qc(c&eW^hsWO=6eL8~gOE
zz#_Rzh27C=+%Y6#LJWB-h8z7szzQQcZ=aCOS<dJAk$~ahsWX@p8@mTse~u(_(YU}Y
zfslm$kp6`mfCJ~WPCSSQ9wfz%I6rHoam2#@8Uk{<AL9bGv@*d>iVz>&X>=z$3Qiy6
zK5M$cXh8S*2Km9IS+R=t(pl1v&rN0@3>fO)@7#G(rs_A%wZ8l9aP0BXip)FVlEV5}
zQqq$9i$Yicd~ZNrEa?y#u!!2Zn?5xp;q_&3?Sel+2O_?nrAn*RZW9zO8<lNK(M&j|
zqr|R)nx9g(mgqp{2$&*z!FLH$@7b}Yq2Ww^5YS5I3*(Hh55nQ4Kt|_8YxG3<jU|hj
z(G07ut1+|Yu3?LGG=JfTaH2qvmouDcY_Wimsfm;J+Ec~Hg;wBW69aBQotI~ur5F6>
zwWpfiBlBv31dDZ%dz;qpCYBd2qTz91!CX*|*28e2UGQVZLA?$jRpF8K`rN@;ZAD*0
zm~`08*QPRousE9h26X=?J&gzwT!3yqrN(uAa6Gq8{-pk~uS7oeuO8Qpw@u)3*S)(W
z^@KrgiYr}gE?07)uHi&b;-=BGz<V<Oq9U6TE2$nNTcuq+D(dR+mX?+>v!SAcP2ZL4
z3W$$=;K4@^ac?D~zL>$dNP-%&;@(JUSJ`DdSeEB}9@o^Y*Jp9#*+G03uypP<kHi9>
zNH+8c&#fzcsyCfddqXQ3fF8P!Sq_C4rHJO54rI&xQj&B3VpV@JEkf@8%o+ES^mHQq
z;53hSx9N&0c%ulX!u?#(@^qQoqvK=>3)l98ZLV(p_s~xd+1XctEH}Y}+XO)*KLhzt
ztItB|s#}{Uc4}nl1T4U(<LXB8lt@B?M4;kD(q((Bu~KR`&OPwZ2D8`J|6ocf^GKvT
zC;vAGkg>wfsd>N<>T!g8$j%*pxD}O+QK2t-Hh?q%LjoaKG3VWzfCF|u3J2m4KVup7
zzuVAUE7(9!bjXvE8_ldQId#|e%BF#2QR$WB36zxe_9U|G-IgX_7&#L}2`t2Xtrxw0
zxREl*Z8B`vmracQj|1%;MSDEq*0=}Eazq9LC%T+h--@h3bj>7ycgHJ7*Eg~`7IV_m
zd>sBb$@M@cqmjzJ{}W|CDzCx;tg{O-hlh(_qwEH@!;;vicWaoJGp+P|Gp-*=CO8uZ
zAp*6^vC0=A0?6oLwt;UChRo$cXYxiWCHX`Al=G=nZX7oOwQ*VB3Ts08`=#o4VXYwy
zvQ{-%K7vXrpZH?iT`6;ANyJt`RfSioGO>O$uI9dmZ3<w!8~q&M$EN+h_d`5BX;!?q
zJRP#HDyZ~T+_1?W**U=i`+CD4St|;l5>MAmqoYz3HDG@4Y+zA{)3P{5^xBt)?si2+
z2=vVx=4K{Z3I${%unzjV^CP=X6pHV2r8Q7n(KXB5G5Myfn-u#a*Ny>r;-rBAQ^s|I
z;t3%RQ_d6~FE>RL)xbJxFh|UYH6UO2(SmJ1P)k8;?dGvw-1h$9GKqA}k1EG0Q<g4a
zf10DSBl3sl7h$ODQ&O=LlQL-;d$%v`6AxHZr7q4=q!R@!zmzD2=IFX#aLzk~(};Q>
z%~(Mf&NwaN$G^vQJ$*8d?ej)xvyUKmgPGv`_t1VwU35YM*#Pg#e(Q}h!#g1(ZbxfR
z)pU`<OH_*kiw}zWF{i0_*~W7PAc3T~w<NX~a2^a|gQddYc_{6URz8J9fpi)x1%86&
zKr%y<*8H(|fTm<hfmlmk&VLonC4@Yc!tKAASpJPd&f0^r_pI7~{3*b({-T(BMvbz>
zv3a8lp44CRB=TvqTOWxnjVjnZ?Yc?ZjbEa~^&s%<lKl*0XxHVpuSJbtayXWPE**6W
z?C$BwX6LF`51{LIKNmgQS8|%?!TOpLC9uiA`I}EMeEt0oOsUi40FTPYo6S62GO2!8
zvElizmvmM{iTSHrx6-pWFfUW_OALryo@QjJTwZ**>tB2sqW2^0=tYR(5RbrBChKaK
z?!#Q;o&Bvb1KRrK^{xlW#4o-G1MRJn(bc9}<rdGZ<df$Is9zV0{*bk5(z19gv@qTb
zZ|F4EG!(Hioz!(k>?RDiFy=9DN)RyWDLtBBNJ)V2Sx`^d6p60wvXEr;BtPj36WN9@
zExiSbO8z94^%<vnNNkLZgddl{xiM6(wGsF;&N)i1dn^#Jzo%`OGyct1?z(=uUxoqk
zRpmXMY42!g2H99_MKg1&{4c*1X4}UMwZ0zFbGm2tgvfyW$4XK`MQ8OCBE0j5zq4AX
zR+E2(<5#5(#`70E;l)eeDx4Qf+Op_REvGi`*=p_txYcqD-sI4(N)kI0sw1x7#4kbk
zPa;y?_OfKjWno7=3{HAf`+~a2-_2mfe0-oWubUJpZ1*W{mXPDePAwR!2u<{4>oD%O
zOp#VaSkJa&It}S@rWjD#ljLyoVkef)?X}H*EazY_v4NrJvg<S~2soAyZE`&2kfrN!
zUOSz7VPDg_kKu7yP8`gQtO=hx{#f(Qt@A<cES^x%p1+)zXD1K{3kp=-Aw0UQOFxh-
zV3%Zq?0_@RCbMAVs55CHLoj~HT$*1Eai}Lb+F09?SXLaIEzZPn6!|1YMe*@_QgTrS
zMuQ&&Wd44hb+biz`5}Y6=FKAt!VVcNOy#{+!rEGDy^RGAO_*IGwTr`Q$=fHM97!6I
zsvX$;?62P?7YHPdK)ENA@1grgshcI4iOhxCIKI0++T0eg3a`Q#hHWs~)AUg?afd!}
zoJO%NhtFJn@j!Zsjk8d`mC<57(69rK$DBWXK5&{<M`TdYT1;cPPh>dybe(fVrGV|r
z=P%E1S(WHg+2^ZejGjVkp{75&HyE9qsJoN-P$4<<9XQ8R(y|QpnPYaywToZD+>z7^
zKg@<YZAhOlhg#oq1mC@rIwnE%4%ZyTZNnQ9!=e*nNO<$6$^3W2uf#4eLOTx41JNn>
zwkcjW8m)*_pfbjN;Bh=RCwtEMwnt!4Ib~mZ0E1+zD_WRSx9-jheuQGMEW?AvP8LHc
z@ZE<icE7u_f3XQJs$)&GG8)Fkc4kkU3Actr<q9;*d8{1P-l`1%r$hX%9AG^(g;ZZ%
zp1*wmp2UT2QvTcPi+Q_O^My6q4r2-SKPXi?%vEOGDulMzjSF7f>Aa>FgJ*VeZO<&b
zsx;(sUAteCvS=J$nspbo7S+MJ%xE;<x%nO)mcH2e37lG5b@q7!(LK#{D#;s|%<J}$
z|84lOvyf#OZ4rKn87OUwgf--l)^93TMW7Wrv9)NOw;EXiEW#Pr1&XGPViowh=;heT
z>W1G;zXV1#C^YesZ<xwJbQwkq)n9Cm3d>0mRm{+Km<HHY^p`xR?>(BAxI2d7q7pM#
zkn^ASrdJ4nBJ=Z04$|m=6P}vmcF(83$wuGCoeX>3+8QgbvtM<Jb75#$m6gWUuVE_g
z;!3xHE^~d6noD@m7JGptVKhKUb0N|9`jZxYG53^E>G$Ai`VdbEi>BF>UB{u8hUY-C
zTw71HhZ?FxZ0iM!qDRL(vjdS!;Gv_3W1S@J_sm{dF|~`=pBW7j2h=QJ8(iE1hZV8V
zc0|5wo(3iP1%p>VLK%#s&3!E8ym-Ry4s^FA=kpmo+fMCCKFVR0Ar|z{aQX(+*h`az
zE4AbdT%IGNO%FYlXSVogTRoB<1;)ftMRpd=lW!dodliubkmL3uGDxO{`dIz+dcQs0
zzDq<`z?&b&d`L;x{wn{~;fTxg)l3Ns4nUaZu(+$vF4U_D0n5<!APM;*zH`lQ?~~d-
zTx5CY>K^P@>{@-<OR!J#2MSEPD`q0atx7awsoTU351R24Q4Z6lvd-&Y`&3>WBW()e
z>Wj<DLbmHx#Lmt(thzZAI}vd>Px{))ntqo;kq0);I~PBB8`}yUHSF(x$9A1JI?rEP
z7w&ZQSGuj_V$ve0EWDDx>~~;{j2V0E?)x@@Cqsv|vEQ+?`-`9eB~m*_T%C7dCSPA@
z4d*m!&N$iL|Il{54JCAiIWKCn8h$FYq*XMquZLgK7i(2}nL#>}aZtsN$Dd!CZJwO3
ze<!CNwj^veQkdLF@6jr}*Iy?UeSD+_eMdsUZ%qNCgI4<N>E0Tme$7`d=BC?eI?*1e
zNvu2NUs5<!QlGMSpqDq&mRG;I@z%LsFMWzh;Pv5vv(!s>HvAIDN#6LXRHvG0|H9f!
z8O>6ouQVf3Pq(>8{LLVArl)hm++>RiI;(Y8)ABywv)nu|d#u`a9Wmo7EJOs{x`6t7
zvtzSR6<EJvUl?hj>v~FI^@48Q9?53dqkF2Up5Na>x0w+RdzyT7{P<+#Tod836$Miq
z;wEd|7#z{b+|sl%hQHEKRbaK>k>IaM?{F6K3-}?wA>4WFDpRrnPyNmzQ=PrJcz9&2
z#X9{!NJD&M^wWnW{+|Ksy~8lY@Or5T7gLXw9?W}_%=4)Tx6ogvZ}Q{2kd;dl=e&~}
z8MWet$5Kp`Coa}A$;Y(1;pm!gB9s=}LDCnKj-(zK&7zonlZ`kw7`d6q7U~1=i`New
zT=~N`L=OpDq???6wH0c$C*4*$eD(YPA?nS;p={u<@k*salw`|N!c+DbvQAQjn4&CU
zgzQ^(W6aDWvhVvYd)apx%OoQEK4VvQ#u$tl>x|$1e1G5fegAb`u4}HD`~EEFoX<J;
zJ)hFbR{q`ru!f!g$OE2DsNoC#h&Vs~>q@6FAzfncIOz(*nJmp7Z}^5G9{;jrIl0f>
zxk;^DC{DfXEt<!$R$GiC8-ExQ-Uw-USj?bun^|((uR;>|51c)WeB<(?P|&&Pofz<E
z$)AfKjf1XiHQ>cPf3c+;w)lnccz@xUA-*pXJKm-TW_Hk$Uk#F~&L!nur_L>^MDuNI
zoB^)rUK3T;)Xh?i5;>g<hiymht{ZIQOs?s*P2^nY_5zk-mQumztX)4j4Dk8cmcRb-
zK3pEM<AAe<k$3;lsXdqr32E5s7gbpQLpLxJaVl>9m(X67uAIZjtrFhgGUu?W^DDu}
z22%X#lT!Z1LX~ZXY9R5&bB<vfb^f@+mkOe{1dMuwgR88%ql$rHSNJtB_p*(jZHh#C
zpio>t9m_b}T1kV9y;j6vzgz4nqbJ0nTyqpPYnm_|OqugBU-Bq|!J5*4?fmf^gr%gq
z2}6#_1RWd&GcCH;xm~RP{Ie2+JgPH4df8v(bsif)f?X|>Xv(pzPkeXHT0d^p`(X>R
zS*Wh2EdHAGs4}BfhZq>F9OXUOv*<o*w}q)D4VRE_W}y~?+`2wB(S$6_q0f94wK=el
z%GcU~)(Fd2Zgfcw50Qv|Hk17xhmntJy(R1F@}YTco_^_gj1ne9EQfEY$rHFT%-)0i
zy|^21PBEDvU||za%W&TU%8Py})K#WX0s9_DY}r-68CT3n_Pj5({L2y7BQ@YP%d^Vz
z-h5Cej5@EjU&4oaw`iB71`74sFFJos`xeX*S0R?=WdoV6DGY^X9IL-ESKhH^;Xaoa
zn!qLJ^0L;Z#RUqsT;@oZ@@N2FPoo(5R>=3<_bP5b$9RXh_0%uHxz30fo$>E(`jvHS
z!aBK{5-+bG7~EZh1noXF-&w~IMSBN&a)GGQ&Nr^tIKST-;vg!#%2S@fHeM$r!;iRf
z&JL>Evd?5th_b?bKK)F)#j2yfAI*W8+a-I%$2+Wge%W<$Draq+A8U?0&Gx@?|9|?)
zhCgw$XJ>^Sr%_~n-c^-fzKa_Wa;r<zg2Vo8b1F?t`SDZWAv2jpSKfuy%h^~pKc!|3
zmve341Wz1Iyu@7-r8F(-IE$R?tv!>fF_Xl|iy5UjCmZq+N_H&Hee;SI3VO-`<X(6X
z<Xe0v&(cf#Gs4(^8X>dCT3!bUuVs#fFxi;$J_LG5)bq3(vJwS-!?x`f?ji>@q3lz+
zB<(ULOF8NZ16!-_twOopy#DLrL(k(TCQnMH^B$I%Rwq4b0ROuO;nEpsoEcEmSEgE`
zG|BykVf%X``uL6QFrSPj4;y`NgXGt{|7ZPK1YH1mUkrHmxAqmI1wp;4?cB`{Bl)LN
z(L9PSpDOR&p$@qCqnFpLJqccNzH@4_7Z^F+MY4toMkQZM@<@Ztso2VeKS@JjeBzi>
zOZ56DQe@sKEW&M3MNd6%<ArX$Vp5+bKyV+7csa3@YAAr8xLQIixJw-ViNIZ%Y)D!H
zK`XsVCuj5``WcrnnR06+E-Tgcw|WSU&UfJ5GIENfF{5S1&f2i;p6v+v#ic-_(rULw
zj?S(#>4b@oZ@UwMEja-5n3XE79tU)gfz>;yR5pPrA+u>X$E21D3a6burtzpU<+CLV
zUM8Eew}|7HrL7D^TNmseKMHjo;-(hA%(gQi{oloL7pVt~b(Ijr)GW(M$D-i=dR4a_
z*`YDu^nX_4O7yIg7MtsR6<Uz~05GP7l`tzr(e*Mg1I~y6H#epl?s~32i-Yf5`MQVA
zR%`IjH%U;g1R+EI8(vHj`-ePoEn_#2Zrba*Kc(rlVn&esEMgaKGgpt?{*2eZdVbE!
zs0W~;cnxOw@Q2!fk%(-lnclh^YWJE*R}JmDR4^jG@<y|nvH=zr3SzXx*}@ZrVU|<8
z9Gwml1<+Kxt|YpO=HTOf`LXqXiWx1fUfYOj+&mV2jCNUp`ea<jbY-ipr5JH_1~2kZ
zPF6tUupv)4S!pp~?@gsx;U=iiiRI)X;z;`vc?;3jT~B8F?}F=v2{8GgP`t|fzpHkx
zJ=rc$<)1%#$!Nr^vi?M2{RiEtC2#oMvdRcGG8eaY$D~D!$`dnY`N^-@968w^^_WX6
z0}WB#v=gHC$_g8B{&NjwoJVT~rb$*Ejc_j0TYtJmynKI*hg`R=jGN%cX5Y3~!d|YH
zoBzm@1yhIQ`+@o;7MpZqK1hYm)pqd8(9(qKjT5h3uIB4Ugw#xae;3^;6&gjf6>6`c
zPK0Q_zhgjWMAcE--Frui!E3WxJI+G0J!WL3qHF|XCdSI3rMYt*WwdS2)P9Lq7A$z>
zcZ+7l2NiDnm`J4MMXzZTU;Y=d(@Uw@t%K2RulNKfnJisf3F5~N?Kl<pE+Ry6dosIA
z8I%t7+hD_RhlI={=)DxTIcjgPoBGOA$p;HIvpop_N~F7(QeyoJNRoIl)WDRhCLBHs
z)Sx7b#m2eaLBwv5Y2MDuuc=dV5`d`e>u*6w+q3k9%vj9whJ4+{D>951ynu&bnc1Qh
ztpL&yV`cV1Oc@xz9u&ZtQ@vg(W~i)uKLajkP`3joFT|WMPug-b&B8PO-ZdEQT*Cj0
z2#;DQkY(?8?ZWgF8_o$;iww~W;~(oNb%q;0F0b6J6|BHGav=Pk!_saq+Hv$=z-$F!
zqNDDt9A>cZja&VBt#L<}-Q4}WGiHvG*dvh`9^Sx}Gr>bze*B-|4SuTRtv33o3m-L9
z23&d#Cl8$M3Ok|lg}Wm2Q8YIT2OEmpJ%(ZpKEy>r<ATb6M`7GKc@L-2pJ}H{5`M%$
zn2gV$5}zTAb|2af?Cy37o4*C@h^+@Qz5m$0JUd)+&DY6p3e(covg@BLCV;tjrTxeS
zP-RHrZNL}C=Z6yjB+`|?BQp%7lV$%K9&&KcNLDgkNzT(w5S$sD&1=0%5#%x+q%}3R
z16cj&M4*ntpuT?vOO}V=#xdIBZLt7EWqn$gB!xWYY^0}mY*UZArrd%Z%#@FytkCSI
z>mGP1QtbX4OykU;cQ7a0ckqQ>wj)oap7!+h<&Wv&dEchZ)Vt^a_u}$|v5|>2y|{7{
zxiQF=@^+f7P-nliX$d7wLxVod_u)ZY6C>_OF!^%zCXZ~sGp}`B56NL-ASP+-K%_Kk
zL1Q)(KPE}}Y@D?J(<!Cws84^FAk?9~mG_Bsvx^_AAa{C%%h}&7b>(=xzu|G2yn(pf
z=OX>kLY%rhHe@%>YNfN)xkE|Kk1iNAQ+OSs>|JaiX2LaF2jr;Mt)CF>7CYJdTPUn}
z<#N)<JkLR%NagoL?`fDuJj}-A^$pTVj?Bidl=W^tR1N#mjTHIK-~im{pd#_vKzfr(
zPO~@R-Ma=SLDI3)yEe<hG;@`V@j%$O=MlF(DO0v-!BX+45ub<we*ulC-9<x9C351n
z=W1H(SL?pj#FUgF59_N#ceyvp<!pzWi7@v<W23n+(`I5@MM_d-)fyC5Ep*2R|0l!F
zr%OsiIs#j64p9r4hwRD!2cFsaFTN2!i*F_RA0M%+BZjPpK+1lZF9BC0fg(G~<F+uH
zy;Jh0<Cv05(*p8jPk5m+kLQpSo0gW=pMtmFjRAX@M_;vbvJ<;MdbAfVBA&ZC%RaI7
zc5U|tgyXrl{1;X;9|X#wLqP*jnNcag*RT_uF)(9Y-8k=9*%S}p4ms(KcDnLY@^u#Z
z{X>|&;#hFu5eY0sQb61s@)v?y<g7suCkppKpU7_wBrB`kE49UmMEvMi6x{n%zh6+C
zIIRn_yxF?@&+0e2X3wJNehKG>h3wHoX@cX~QHVi>(etHjWHR|`id0Pf`H(yQ{P;BZ
zSeyp0I(%!pB%uI99XzpVaAg<E18j?Am;Bs+oIe?}PJuopOgH5EuX2qTBF_lS$NOUv
z_ShMsoveW8Q;lne8spav7jJ7S?smFtl{ZLuptZsCb@l?~$18HcSnWA1!R@(S2R8HH
zy)@oHpo|x|vC0~W7lY4^Gmx|+TfdbFTp%<jD{BCk1JS6>mOy{qX>V|z`5uW`KUx!}
zr*?XLKP@o|&0W?M&iY|G+q*6eQ#s0N(meKkh<eyuRHR<3z=f9AP@3Ez+4x!@U{j5<
zN+XPxKDM0Ml1S0Q3C?!ioL$+h5xh*T<_K43!=EOHb3=|iNAl0R5LfXRF=yhB&Mvir
z5JCgX5N$b&EY0Z8447P#%gj<lXK>gu?C3vW!P|M7Yp4tT?MZL_UQ#FK<S%{Y8o|y}
z9?0wYxG#ZY%SNq``T*xcPA`HV3*J?X5ylz~ZE%vWG;C3K#G%`^^9{pztC>k2wKh5%
zWwnFDIreOo+M?#G^Za+SJ92XN^U}nHN3aw5RgwZ>_lO3>Dg)*U>_UeVI?XK7s!{Z~
zFSJo*u8_fmXkioCuK5q%I(HtMf}DxZ39MKphtv7;ii(OBxI=*%jR=xiqcYoF28Uc!
ze0JNKrd)<^uj}T8zq;P{SqUX(Ui}HYv@I)(bvLNGE{*7VDZmx3TIMxqUh5~O13O|9
z>lKOopj+n`iU`3)@$yg}gKa^!FDt%?XDPzo@9`GTkndJ%Jv&m%`<)RjXum!F&6Q&a
zNlO=37y%xX-+qJ}r~WI8TCix-7GEhH|Lx~~>jAl*JMHwGDIu0D+!eI%BwfYPIE_21
zii8@0EYGKMwdo7U=1|&^PwS1dg9WespAq_zq>o*hru^J*{m2Sgy2|7ayov*n_5T8{
zvfPe!IS7jN58JI5U1hI(&Y_l#-yc?m^xpxh0myprbR;+78Aqi754_#be9RxpUBgSm
z`rO<=1lDO}TLV?!NZ|_!*-|v0j?*rIQ9tmAnY6{@OlOHnbp+O&jAx5aej=Ztk(LtO
zyfNzZqctB8>owZq1r&nMm!IlUFWN3P!ALgw5Oe=s>ylUrHFe*|yH4B{P+x$;*{eme
z*LFcjiWkg>4&wjzibxdNw6r}4iCo%h$qe<f%a8qs)>#X5V}y^B3_88O^W&O%D^{U$
zbGoYFc`Y*ETBFyvq&ui~mAi+_tYDViX?v97$iW0Y&Y;hS4ds%<Wg=~}cX2{=5>W2R
zFgb}HzmoM&B8C-tY0_py{MrEEt|F7F>Qsl1SdBWoe^dGGidyf{W?$t-!jO`eu$Xza
zfJF2Dy{OScTVcQQtasftZQAawI7~W^wrB3ApXy4elrgjyJ_?Va9h=lD$;(sg^uI00
z+j0)E?1|ejRaX1&k7z)Nu}b1K&wgfQkoAO@?@h};xIJ`ry6s6W>mK`tf>Z^As~L~4
zpaj4NafcShuCkv88SUA#h)ASFem)QW#A=P6<8N@pYo)tKu6^pT>o97F#S<U>PIu2N
zUYi6~n2k>{>D(KDk=<)-%tFQISz5SzW574_DuEYQtOFL%ub`%;TFScMgkbP7KTjtE
zqV0OA;j7o^%V$I(((^nJN>GAjPI+GilhYHQ65Dv4_XC%_QDuELiuNnTb1my2p2PfD
z;n@)kx%k*&tSGATLk{NX(bw24jDQBC95`+T|C6)qLtg|+IOau^2oa6<UaI{;+pO_&
zyurlbTid;O1VFgf9RIF^th%D}<>pf>UQ7G0x5L*%JLY)b^YX}kI@z?5Rvy;;nq#p5
zxGb(Wg|$V+6IM<hk^nd9btBn9CeQw?gB!{_KLi45o+T!iAZ}kba#@)t-@Kpc2&x>E
zsD2cxyth-akNs})^}`_32SCLwR+5+QoD>}3)L5!rr?5OUIpH7!cZ(54AMT6RB;URC
zztFRT=ScB5sh_l7D{(t@1&a$49UZV-Vo>()Nh;E`%i<0X5C5hyG%w?@EQ!22+>;))
zPg>Dy^PN?WXG$Lb-YH;Zw#+AM^BsNmq%y=;vteF;HD4c|sp>N;n~L@U&l|q(>I-p$
z#1!L-+BT%AT*&hXT}&+<b}hs8_DJgi*hw_HFCrSiCl8F1$=&+!{i4N1OOmj0D$MCn
z;QU&Q^DjY9(m<dx<Hvyuhs$ZjIR&kh*^a}FFe%7LyrA~RhFiW)zUjaWaW*1yKqv+3
ze#7kNWlMK}&5x1UpQpFK$4&WdbKSiAKchXLd9R$fTUW+_>-Udmj90$r3Qix59=o@k
z^eBJxAwqd`auT(Ylat1JiuYwU;rE9$d}`&gGc%n8w(&#h^^QhszQaZ=q$J(}*WG?w
z03Ge#)#j7W+?juP&=k$|l?uyEg3G({nN#;MCN7q0<b;8OGp4q{Ht2d&sIAat`MBp4
z?J2t_zIQX2uAK5LT2PYP8*8NkircAu`q|QQmyVhZWFd2%H5DNo(=ptN;og>k=TY6^
zNtmkhhx{HL#&rsM_Z9N61A}6X3vP1oKEI!?)JvtRXU%hKs~3&$@Pano#-!8cJGjD;
zXRCD^GL&z&{+q`&FXUt8Kt{?w?<!L~ruawB(A>(tQ|ZE{NVcW#wp~$Dk=|u1Mnl?K
zTJ{%R`L9?nWs}jb2A9%2E=+)dUbv7+xmIr{jz8CFRh&4u4d-noQA})D^QA%wr~$U|
zN>@J2aW@7}1IbFSuB>n!kZf7F2S|IS$Onl7+|W-v5hznjC21`cVW8m&n^Ltas(D-e
zC||f?9p&Jr6x$=f;4pG^kUHG51w&TMCgn&3^4x1K&RmsEjcTZ9-)0w8e!V=m$%9Qf
zz+#mtSJ!tZ*stSl#H5ho=Cu<qvF@EOyyu(@(P<ok39qnyPg~31VwAI5Kk^P-4iCIM
z_s8cBYInuZ^Mpr@dRt=eY&;?V!X}0i@ry-I$)MK)Q4xO_d-q^RdOgM6ffp-p9*K@7
ztYRBw^kqEq*b*9xhVsmP1!e{UFRMp}VIPc2zFr;(H~9h*gQ;`*5wnm@(Cp$)i*`!O
zu68tl8ON>11iG{Z_+=v<eu$5(`SslDO&$9gt+Mw5jo+TRu(`Fz=u7%Cqb#fWOxlJ#
zPkRb;X|?!KZ?iY&vp}@I=pdvHi@&loQDXIfh%}ATa;3yjB6oq*!Ok?vO%<E1%ry{)
zr=Q)bwvd=6v%-%kz6A=gi2~?_NhyIBO7~9`pAosJo%(m3mv`Q(*9|qqt$(&;^j+g=
zOrJ2WTZg0VV-+i|3j2TqTrdO_SE2pbeBRj96|gDKv?zaXf^RZ>Ki_9fy|mOmEUq8p
zSMCK(s{d<;b*<~SlkY3(zGy;<vWXJc+h&mUd2n5KCm+EZNl^~Lils|t!@B0h-Tp{9
zEPtE^BIgL2Hm0%`|1pQsyubOeVdUqnuM7M(;l#m$7E`xz_50q;K0DIsl^wL`&63i}
z1Ha-AJbin}mziyh+?1*X`K`Yi!DH|iDSbv`;g`PQAC~GXm%4M1ve>V5^5;W8xM1P(
zciH0xHLLw~hbfn?WyNBitN=p1bAWaWSWmOs3%GRe-C9xu2bU!;OuX0hPQN%r5G|1a
z<fhR!5>+7$6##a8rlfvyv~`u@NV#5G-jv<iIsYTuiu{qYvxXf+vq;*w+rWwVg&Vhp
zbB(H%y*(fId<S(##hFUJ&D{FiZ%iCEpm4z3VQZ5KN{a@8w;ezEI&=Q!^?0gmGk}cY
zh5Hv6dQUw7#U(Ws>7=LHTZW48zPFZ31m}zPc>E08em>K|3{K?r|HE7P8P?tb4aTr1
z+g$po6xR9O{Q^92#;VaQa9%T#QM_$g3t+lay4iMlr5smf^fxO0K(6PsOE`veN+?fP
zH~vTw0^2s2ME=U=l2duO^j2(!OTDD7H)4d{JoAsC1(0Jsh&mzopqFb(31AI2$b<?5
zy$oap%K5nE6@aU7c82e+4$N`CJ~|kBO$iVWydw3X-1M*C0})JEwPUgJ*f;$U#+-SJ
zO9{jj+%U6936n&%gNz8T#meu^;nYzsYp%;RdM-3g$nZ{2&PY|aDO4)zC3#=tw);I$
zC|gA;$f_ZvTdcgncOxByH>1`4Awlnyz_$Kw0#=bN4C1wCTf2(}hX<7y!?9=r0-TBe
z6<@i=iD+$6&UD|?^qeUVl*zbpO}KZ~WsUs5@ZZ<JM*^mSMlkt%Il6Tz8~^bh<79DJ
z0OG2kbf81;ddy!HzGLfNznX-6yxTbz`PFMgpE0?%w)Rt-BnI*Ol|s%M0WsC=^hGTy
z6S3lE*;XeW-P;w3uWapNz$9T#wG2&17C2ZFgdqj}k&LwppYp51=3aH-v>%i5{?T2`
z8tQ~Qq9}E2>!IWCL8*7kX2&!kb#2r9P(Jl&4jZAcJF~s&)p5QAAnB|mWYF&R=F&6h
zX_osYC-3~npTL(QVV7X;JJ@Fg?W)R>E>pi2xA|f;@`cy4&p&#_YMQiee<6`bGE=tS
zH!x@G{qyrf7b#Ij?$v)Bl5E93{$_Di%QCq<_pG?K8~-XAaH&x^`>Boav$_^y{@D<K
zx~(OwjLgZ&@+$?~#V7k5yjoe*6*rGTg~6LstPhkrkJWJG6CJth`#YCKf+-?XuN;pv
zD%0830nVkjNSP$$CES)Rk&l30$MG9rFJ=y}+#A7^`5J+JY^ig&CMSNsgw~zD8$Apo
zcKFRw-M_TtD|^{v4N{j#vkr0}k{tbcbkKEjjJ8zH76*Cva*qCYQPzkgc7iJ~pP03|
zvk{uQw^d6IespyByOgm=Br=2jG2Q+T934RuAgID;vd|veRpYa`4)ma~n>h(sE!gKe
zU0ApYnRXLL)^s{w2AuUY<WDUYwW79N@BPlG8xGF^2Tt-9XFYAKYOgoTVGN3Wi>q6U
zc!P>eQr%ifF@MQ!_A$FPU1h08YBLY*#z#mc!|3{AAW?`<t#L$an)_uu=B%3cPK3aX
zuF|*N6tbwx%H6-I&-@nnt?c{P<4)Q54yMEEa=+Sfuk5B!Y97tuSt+zeuJXs#z^K2#
z8}p1l{?T&8Gl>?-cE`CMXj|9wwVQJyvjXY1GcU+bzb*OBOS)u5SdWz;nEn!`TwhzL
zwvF6}Q3zgLQ-H*03K<nv=G^G=u$IO<08{EyJ|3yH%^IF4=zOteULN%}CBmDk-s}0P
zw#@Hk6==Z@yMAw_?Y&3JpFg+2(`)T^^Byl+GaoOe*_IJltu}B_So==D3srft2^?rt
zjAdV;#ch6bcP?YJT)_v|TooU#4Ja!%?+C6JP*>vebUu}*jdlXYlkpGXJR|)Bda11L
zH+nK};nyxoeDOd16Lk6<ts9BIXJSt8(i4&a*pXnozx}y4*ZAD_+S1r}m`FYuaE`e4
zj2h(4T<wmlaJnVZeNNV&FkSO${Lfotf($5?ZK&G3(gzm&?nhUp`*-C|Spn+6i?1Qz
zT}u{6=Mvwr4Cw<pTF_FXXTOvN+;^>Jm33*fvh6rLsi~<B(M*`?n_=T+pl@r54Zn-$
z)-UF`mM;1aqI<sXwm%hwpdDRsz_vU<Z6CeaL@w^GIzKa3TuFpNbKDw`>V}W{)`ZDp
zbCxWM@jkJ}Od3S^AB%?)V#O%mwd0bv7><>QxJelb%ZEAY2}RLked_8ECqqWf45<ws
z?CX1xl}=l#&U5h!?)xb1f)5~H+5e*!GYZ&A?FyqwU*%90CW-EEktirS^VnQ*xU7W3
zwdcBz@@>(>^vet0DeB6%BMV%urCuoArQl~WnC@NM*dK#PwLS>jZFkgH26s?LH2C1Y
zg&+os+fB_hKyI_S`#@Go-Iq|0gS9*GT35A?hdDjNHoEdLt9_et#b|W!kz~J8UKhq9
zwN_LZuJR8q8*Jm1I@P~`*H3S12TlfL8N7Dhg(Obp#!c02){Do?aXMe%K9|OR_&DxS
z=XdP83XYyt&$h@m@y!>?@Mb0W@pl;;@N+8`$MVFTT_;MiSWdIcn2ln(3PKj8XDv41
z8^JV?j+Pbvt^Ex$DX{UW@-|oY`_FQNA6#nuKGeYnV&O)7q2&j+T<_(ejsy{pi2@E&
zd4gmjDyh5gkIzDeqwlp^D5;1;W&)<omi^s!oi6y`HtcZDb^)>ePTb0s7FpfGv4y}k
zb)DWLgGrH4bt!h!kI_dr-$BIzcDvYSH=(%2X*s27Yr+t^@5_15qhmP*n)^Hg`6Y0&
zboKLE4*sw4>m9|DEmDip@;mnBe(v2cj$q`^gZUb35sYt-6xhVdY`<<b1>FWPK6S^$
zde3bb^^^+}-aQSZ##OT)NJL#4lAdG;9^}@`mQdp_Ue(4ge#M%3p5INZUvDNpkW-97
zo>6@|A|_f7W;MHcJrZq}D44;VS|6ASn}iVXaVw;RLj$&~Q_PnpXPxF_Aum;CI{j_x
z@wk_FcTCETUY6VouBPYn{9-Oq5ik6vvU>OZ6%q182QKx<V)rJOyo09^g0`b}F#0!y
z$KjU9@fZMWsxx4qFSJu6idmz<$;Vl9-OEfpGEvGY(Mb19gFv)fcGfiUcg@@{wFaTq
zKhXQ8Xis2BK_}hOpG=)WFF{pGk0iM<p_$iEvyZDVA#1d?>>MYgp6pGY2k&@ZZ*Iky
zbT%Id=OA6`%30xKZLv|ef*|C>h4QT?+}@Gc5#v<mflYeLJyXSxfB5qW@!l6*)ww0V
zU~=`tHGs?gCbNh~Phk`m>Wp9i*|IdigWh)CKhB7jr~HH7UySHyPmPDP1ZBbJ3$fY&
z5OX+DAsoSrV1WN%Gc#Jfa#S$+d@IXjRhpCgk$R@e%fYGNnF1^(FpVWY{ivCrMy?M>
zXG}Vt?Xon}bAMAl=}%alJoTj&%j{><Gp1!y&?d=<fj}(fSfMe7uSdXCa43me&Z$7{
zx_s*K{>Dl>Lwt7%0AdXF-BSZ{20Wg$#ls~`8Y0`4hdO%y28pwW(X3}P&+fQiL4_Z`
zJ}CaWV!Xd$+coAi@B8+(v8IM3s;~BoAC`@-T^~ZQ_Dz}h7`lEL<JxHEsIaokTL0oW
zQtmE*;b(9H6z{<5T6zArQseiD!YV6feRVzcJ@gIxMt$&vz-j#@Iy3I^Q_gQC^v0;*
zig(tf?WGcs+FXtW2V>nJpbt)<dpKycX5u;>GWda5sicatL{2JhiEln~o|qXS;}G<y
zu{S~w#GAy#X%O>!u^zt*#LY1MxulLXP8g|N6t${+0*Hbok&R$O!1o?9$!kf-yuF>d
zu8oSg$jbb0UMO&O)|_d7L|MQuRwv6fwX(?p0+C1H7RqMCYHf*WEs}b<V}=Gum2G&u
zTonl8+y7x~n(?qh>Ch;3RH8(oC&BN^RMSCz4A_F1hT=Q`AX!$tYi*QAY4(F5l(&FW
z&wX|Ej*zCc3r9L_MUu$Vi^pM@JOJ^{THjJ>)s!9R@o1a4`lQavV0#50%VfDHSTAm-
zkkO-83>f=kBNY*g9xa<Xr;!jH?9n~!e+v)2bSMblB^<WX_7}jurLgXG^V%sDUsM}s
z9TXC)xUnx`M{nPuKX4``Ca0>W=$7Z$@tl5+TYsX51>`Fq@+%4bmex`0N177DfNnLe
z|81)u`AhyG!z-+stTAf$mmxOisY1;1lq^^4tA`V1#?tfahw(j0d#4K#a$|V6DQotT
zU+id{4Ov?zZhiQjO<gXe$q<J7336e^k6JxASl3|xt-Ikc(vMNNQ${KQbPL~s5bh}b
zOzR1&0#o_Z@+0+Hb@m4bmol0Q+H`mG&G=GkRzjDRL-4)pXUEH&V%R|uuExUdc-wsg
zZ)U=y;CbLuKqu??vNdp6V^N06_RuwtIZ$&imk2Zx#<Ay*=ocb^Cnc$7g(b5SYblH2
z)>`vf!9hI)L2F0DxVzUK=dClM&5<WjgDUu!%*uwIpT_($H@uANJZf*PCz=K+3jf-a
zZ)Yet2L=?|C2JYE^N^K^|92vt*wJmx;wWRX@O}NCC$nUsYrfxEcJ45joPK9iNK$pm
zZ4q4wn<R3#UKul2aFO<Meya+pa>J+Qe2^<XX``deb!ESgs2{UyKXwwRq<y4yJM8z8
zOPWzQY?69S9|u-%;R@asD;$Iu>FcX=faY?14ZXKSypqV<djZwl;Jjf?*|Jq`JE76j
z>PY2Xi+RbYB_>>TZY-YkE8Xx`erW|d+Mv=n9~{RKtLu+#wepq1T)gwKW55QT9U3yJ
zd@wyGxoTQ#Q%-XVra%;8?trlVFu}BIz8VeW+T_KaH!4#O${&QMwv1ifp(z$KfQ%l}
z5gb!xllxlWko8YXY)J_9b6dm0CR;yx=i7!~D{wZ49F#{)*3KlYTDJ~v;Vu5LZf(=a
zAZ$#em`jqvRi_2FuI8ePx=wX;uiL0abq9l;Xx^6&Mzkn;c_DM9?I0@s=%{sHYm2~U
z@$d4bA%~zAw<RHk2&U$;4L@e4ax!kAEVm#AWh3e}X(hL0`=Hh*$74Vgi~n_K|A+|1
zsWJ9l-YNc?>^4`fp}}jIf0O_*5U{28e+T7cn)EdmA89jp^8>_&?0&CyLVsT2ka*kS
zHB#*lKNJd4w1GS+lSVCOF=5EDDsVEWF|Njx?_t}!V9@x9392^xMEl^?_5eeoAvxrS
zTbB6+&d%dz%>3O~$Nh5VdE&n$;GCVC^|~Q|GL>!uvQ7Me7Im6Z?rhuJ#3NU5xQ=hW
z_mmG#BN!_=D91hGdjU9ewU`(V9fq_R!iENq+ha@_kHe`rDyY`gBF4#pw&MkX?S7>G
z$WW4f_B%KPc-17MjF-nc5GPIMLJS8e8KM~pN>fo4xLoRJaAw7^pPq)-T@5!3MMFw3
zXEY_h^*9TP=!X<-DKv-sTC0r;0gS(pbAMBK0%V4)75}Yi8vVb@8t>;$D1?~bG)enN
z;*sri>sEN2^BIkf=_T8lNM*}-2ma){ZT8B*<uRpWjTX<|2o2@S3$j7Lh^C%zv+mk9
z&Pe(78WsoZh-&mjWJ5Q>1B>5Awm<9bvJR~RRH=2F@92pgx{F}(btCMD?WnAC3`cG6
z1+(u^D`xrc5!J7}hXd#*a~~}Qw6t$h2l^Wl>_(qA`lo{}h<&Uv{=B{bk@+HW+EZ!9
z#rfF^?ephL`?D8iE&V;v-KGyX@3(3ube)cFv5{0BNAqi(JNM+A<}=kdixx}!P((kz
z-oI4t+>s7+b!G;)wk2(U4i3gzU3R_C@t@ReVEFja+m_-i(Jr&wt%Lu+5Ryg3O>1H2
zmzchJPM0}@FP6^y<Y}JYG*-b&k!Hl@S8O7IIcwKg4`fyu{UDt<^ad$Ov?{R)<ojiK
zvpk~nCLhQ~w3WR2QXUlZ>C**2w^84Y*w?5#r17!Y5Lf&0D~R3Fi9@4D_GiYe(^`me
zx~3v+=uyk$4S@Y4eV_L;8Y9a&a_FMv)-GaG4plQ;1&7-G#`XT;we0woknF@nz`?mY
zwXzCaXwiQ*tj^}Ph?ccOr`A<C2&uJ)`>u(MtIM<Jl^Za1KDE`(AHN+~MARKD%T|dy
zZ)tF1zho3>ML}w@4Zco=KF=KDHmGP>)XQgzU+?2L=w%<`-fKBM*Ecj>f99Jgu+g}1
z4Bnil`jUL`q#Eo{uVMUd>Jpm!2sGD{3MoTp?zFxY63me>8$3ScDWQ4&3CP;WsmCi}
zSqe@8Rh^u<UD)}pDa6o$uXwW3y#whYjLTk~)6;ZGi}?GTAx=+Y2d?<ddJqHe2OCq=
zWc84T?TV{I-e#|N<Iojmq{@_vuNyY!8xmfPv8v9SU9KiHeLf`zpVj*CeAK&TeAZsm
z{NrZi#n+Jj?7zVAtZio|3;AU#+nd-gUpZJ<EuRRcOWu8$%BK3dU*59wqa|88>+ef`
z3jy=iY=rUzXij-fS-Eyh@oaiQ*UM)G1vI(0<jsk3TvU7!6sKSf??a3zE{x=mFatXR
zzP?vG!xia0St};yr0*H><)Jh1)-7#S>&&ib{e@S=RF4<X$5dE4iwMe=cX3%i#0X(H
zw9vu)kgGuEcdgsfUCNxTMB!Cb(8?fqw(>|abe_-n)kd_v+>Fe#Am6Pgo9&r~QCw_L
zeyrom@v*;BZXrC4K0Hf0+2-BPVmg>u=ghhxXW~Pua|y!>-(M=YxLl~lnahp1Nk%Z6
zp6ZWiXX{trQ1Xqk2Zra#pA+|3M7Fo&DnRN9l<fTLbA9KfbTuLeZM9C=<*L_ID!MKZ
zygwajX?CPJ%sq)*&Vh}frxm&hBC69)8Q60BlQTTw&(eLD26-e@@h?bgmC5fbY{I+M
zZ)%D4#Nzz2YB5uz6A~A-3^^+T(|bXl!Y5!`UoKQ1Bk7iY`ZDs#PI_T1{`_d)H~0Dn
zvYykl@FOHTI0soo5P#f<q$5GVv_t)1cmwrvv<CQoXI(_n^A~&xo<a~V$l0W&K0XOl
z%QJH3>sI6BLG7G%eGf6EafZ8YV9PVu)E8V?d>&v{+7Cx&5~i5b==ahEYA@TY-uU&A
z%7a?`hQ0gbsEYzVn}Y1-2W~+`JAWA>BSywjT+z<x3=b2G@@Ia33qaIhhZQ)0?|ts(
zMI=77^(&9Pl;YZCoes*$AWe2q+Rir?T6E1Pu`?44Rpz2{2KH<{AO|No@^!0O8}O<F
z|H?v-BA3@ENbV94m+Y#_b<|iN!63%}kGU&O2qi)8bgPz{!S}<r3%|+1arxP8Cd!-J
z-)?1Mre+Ujd|bI;6i#n`#Pu#d`O}4Q-sHj3-Mc1;@)qrsK~A`Tjd?*avBA7k3waTY
zFim0v7^)7>IVSy;iJAd&1`JZ_wcVG6pH;QHt&xmRuY{^V7vym3o<6G+10Zx;IIs4R
zJeaf2wSQ&*)I*{sp|nTVJI%ABASND6QfJSNSsV<@IDL#d**AB{v9kM)xPDz&J;uCk
z!&~-1ChIkQl^APgTj-g8rCgd<?*`OuWnzE1#a7Sw6~<IIdn~4D`9ghkbr#j^qNUfJ
zM_6{@>dXKSB%3GVb+LWs*Pdc6b#Fqg^u$}7!r>e5F_LA4>I<WWMj48~7lE`jxU%H6
z7bQ3Suen$UJ@b(KfxjO>1Uf79%XO*bV!!nR7^ls^>+oL{315;CrFjHynNe@r4}31F
zq~kt%q>s;QpsU`T;{;`@0_`}MJ{!a1mc@MMOnp*L>C=RN`w>0DgV#OP7g=V+kZx8p
zeag|aVoO~7wFT4--orxfSN08j#lc3Zfistu?p`MT=&)nX+bt<7n!eZ3LM!Te2saVW
zAxe8w=SDB|O+$rIrq;z^r&>XoEh0*@lw22sbhGwbDh~g&g4<N#J-n3=Jjp&DJo4OO
zq*JE<*5KQSOO}Vve9rPAzl}sKe9UITQyPTAy8Bj{K=TEbs{sRB@*YWFChpIi7??Qc
z1{sfi`Zw@0b1@{*KzuAx2_96)6M#XH1{yshZ>rzwVEn63TAk#o$cAlS;*u5;d-0Gq
zIj?8m5no!D)-;QVL3pkG9<m4$AwO5d-g2M(tI-T)>Ps7`k5}Fw7SM{A(DCL~^xk^W
z!YOKq4Y#>T-OqpUUMOIW<E2}K1AWw(66fy=CI|B;UmR=7lHwry5r0{O45OM2pdK}^
zZKwYBz26qtVSdzhc(v1JD6EnBb||$w#a4fc%lV%S*~tU2;}<bGhYe0+S)c1hjUT1z
zzfMQamv830V5(NSs+4!;h7JBC%wl|Jzd8VtO93B0)41aCbW8BX&w%|)qQ;)_zl{R>
zY9V0p%4KhkpWgevzlB)(SeJ!!e8+k7`;}5hHlIFfiL->(mZyYt)cmLt|6ti=EA9s^
zlKBj#?t2u;70w~}6i&*<2t;DriAt8+sywAxsj5reEF=G$vEtya-oo<A{=hG*9@d%T
z%S|&v3EOh!Lz-V~q1LwL)v6b*YVDKBtU+Wg#cg7S$iSeXsY(|%)TV1Fq|T-7NY;cd
zX@hs)46~hivRR=uIU#dgbZtysj$lyMRI0s}*u^t1W2<^et^*MxN3(X@1M2*!ZH`!7
z>*bZW#l;&s)0W~2Go1R&e&)14ftO@nUTuijsLjyl_deXP9XsLk|7Wm`G6>wNr9ji$
zT7NhP>fMuM)~*&x?1)j)%@k8)L`<;1XrdiVdZ4-k7&SU!es05=S58?Woq<k4U0GB*
zKw<zAdH0KpKnBaRFL*@xcXD>D|7bgz8d;y-)CriZ;<AK`FbNu(rQJrZG>zZTxRY{M
z>24S}_ZTsw9>6CTV6?ktYnvhAVUz{kZNAdE=W%PPyKm(uD(%qBch{&eS5!YXiB#sO
zKU&#qBj-Wt*XEZ^X>nI@OS`}CV-}hO`hiaCb>Z0>f+9Nu56OGQ&1a{R-8V%g8XmB4
z-@j3*QV<i?;)d+6rn7^2d8sF^K8F7Y2zmH-N~Ypil@m&ua`rj!Du&z6=LT^$zuRp#
zvvM9RRgdb`;g{`A<zN@$<X1n94We~DA9ItwWH}(uS*gQ2b!KGP{xaIJcX_w&*Xn}+
z<r|?ZM9alRKAmaqxBTAC^U52&BL6Lwf+}Br5+p*yB4RxBue5If!H85HjOx7?ZFz^9
z|FtNmic&RZaM$ZM3D*U!F#!y_ryh`L_$3#aWa>_C+OC$B9CrdV15wX%!ej&9UkrGR
z@xKxYGnZ<?kf;at*1~&P&iYpt2rR+d3q<+#Sy@0uNXjF6eN-mvhrbBE&f~Q3^7q0a
z_8<LqVHe(MW_CA^efSZFyNXdL?EN>K)t#1irc0GQhU#XRumqb8e?~bg49MJm73tjo
zLQB@gi~*(kmnPqUo8+cS2%n0@+#OG$`v}de@0U@nnnXTR71FsjsEvn;@P+C{;X(2*
z)1x<o`tJjbbZ!T9q+O^!)p70fuObyB=+-auP3p)kRiGpNzRiSpexF<Kb1C|B$|<0(
zkQmbmlI@<8_!O<_Ho$tZ`ycN+)FE9t%d_W)>KFet@99-^;Ibra{|lV4vz<@-u%i8C
zOoGmysrs#!no|<N>+8)>YeH3miY7vi+5^|pc533$MZIv0@bbY?yLL@WFNTvWYNUcP
zi+cY3E|#c0pKWkKJ<n?lVx)mf?@srj5aCtNZcN(fTmsTHGP34@#3v1bK_%RE4A6)H
z(fHU?<&$lnScF#`K~s6X_=V2fvsFzM59y~dAvrm3FQD%|Lw7^zU+L&XZ3yneIsW!`
z^T9jYxUiiaFOAH9c+Gqupq4E>dwYbZ+UNZo+t5WdAygNKB({(*j75jcmh@5j;D9be
zx|-V{2`i}iQo|vUO?Jj-+*mfKPNeGyy%4J2mEwP`^YREw-_HtxE{WnL3M7iYn<uvB
z=!BjDZ+~o6Z*VmyV;b97;KF5zpzGXPFS_f!s(b)1vW#Z(&!WQC%$GO78FUPb=EX8{
z5e<5c)$K3GT$Rv&K6%*3%z4+xd$GP7V{e^8l%Op~wEvwKBTikkJbIVh9;jO#SmXT&
ztG8<1kDu(n#D%yKC^v1Sf7$Wf&ZFbJ;*=-6A!e>~+ny)R8+1323~|SKk+9FO%%#G%
z$GstrM$+gM`LokFiu$FKzdCh&iMIpa70Oq<>Z&%nAvNMZCXI2b?wYjM5^;Fru{3V7
zam+n7J(b_ZYWRIAS~)%Xjnc~uY*NMRnw^cNHS@0(ziFcrb3_3KG|+}<CxxHi&mC$b
zJo?Meq*^nSMRd%Cb(-3zl@7E{#D5X5Im_6qz2bc!&MWng^WPe!j|*nw-}Hq`jTRp0
zv}*7qtcn;<ZgCdcn_O?$%?%h~H*>OoxbsuB4U+lA#dY#gc~m-c?QX8Dga>H=H>S>A
z=Bh|+K5LJrgIlbZHvJgbh<=PWg{ZPBj&ShBYk8>5pSsGRdfffAscV+#>R09QaEp`g
zl`WvUV4c89&K$q7Tg^J@A=d6}p{+KvM&0D`;+V%KW^dQTF7k#vacVevWK}RGf;_mn
zYSri@bVY(a=`8&t;Vp#?;i8n6-KZls7v%Da>*iFdM~ftP-fL3HnjmiNzuLzyi`xsn
zI&`5{lPwhVnS<<3{362<#RIRV+OO|O^EBR%Y~8vytvXlM-bMV8)wa6o{YUI~%fp$}
z9DM3m(rMFs%fO^1wVTJ>>?6#Lbj*|HbE}|nb<063$S4S>TeUC{;&h?fZ8t`U5cQCy
zH0F|Na=V&taSWI?E}FasuW&ZFhsEiyaL@D~puYcM_2MBuJ3c_QjbvG(bpL1k=D$#l
z#4G-)TlkT5v`8XtDR?ypeB#lWcOxQBMry44%09YP<V<q*?7gR`Nd!zLO-%IE^0wik
z2?7({y84KLK2KuXbsz@!&CHZ@OuKjg9*d_->DVXJ!>5C~2iy2znR+21(kKc+k$3+7
z_qgFlEzILehy|-Kb5^+2iR;Z{<&?Z}ywr6l5Vj=8Em7R4fFWl*woe}H{$N6yAgxjE
ze25bNhmdec?W*{`Va0+p-Ai)LQ9E665DpmZNA92B{8~q@b(<lLNc|Q%V_7@SQ;~J!
z{kiw;j`{+8cY=jmj~^SwytF^bsNi*u$L%op8#}qVS>ce_P&sN`PMojA!hXGclkUlv
z1~P$aN}$B8JZ7o))>Cicl-e)f|EYF|D)F@D$_2n0D)>o$u#w=+a-jo<;B(xMFFMfk
z7-(h*>0IqB@lL=pWn6catMi?+-9PFWWfA#Q`A}7n3e9p@A25Gd<}G@mDj`v5>H%N%
z4?Tv_Il>kw*w$i_v-#8ovHCdL4_T-#v2j@Lt_7|Z2;I)U6)@Rt19oy;-D3@HwcPqe
zd3$N<B0Hx_w$oNU&Sku|Tefcg7;ns2Df;G0i@86!-m6!0UgvMc4cn|GbdQSPKCBL&
zV^;QF$m;RlmUI$jQdvySrlQz%O+xY~PF%Asm{BnSKwo}eYbFgUesd%mG-S^qfj^|G
zoSibr3IB@Z%}X6kaF)BxxY(1IF#`EY0_jV%o|a_D;b+7Z2`|nLyH~N&=EDAULIwN*
zp5^!UqMR{f;i??{fOkfe_w4T3{y#iJ<a+Y{dS>^QtLoy1A&IZ7$Dc4c4U%DpUED%r
z3vyGx{Xh_W{@}&J(@9y6vzfDdB-Tf5w<4aD@#$qG*ME5+SGP-gs>vS81A3@m8fzGE
z^x<e*%gC#l07M^hyS^wbZ$r0Eidq~lZ}P$m>g#q7Bv}{rA@X6-O7{d`YzW25e*AOQ
z)ALN=zI@+m>9)-`5e;ICM-jf${2)_@pOP78JKA<q(8YXx%{wZRm(M)JYeCs(I;X$X
z{`B_p){|+q;pY&jQszNHgKutySr*yu*epWNOam!Vp4Vk1%ZDhCeI8sS_k58{Lf!@8
zHty<?Nv%0IHlSa*q%rex2BvAIhR8?%q@vFBWrT)=uI~2-{rmYnyacaYYmWqV9JSWI
z7tOG|5p5mtuT`{seCnDcllhEi-RKi)!swf2TMmI$dLs{m6cBnkq-tNXJID7Lf(p2M
zL81qw<c_VNjy^NaV;hx)+IQU6CAxXwx5^8G?56tt_T36qt!fB&5;ejjG#Ir^9tSpl
zi~2=Q8dl~`=w5YQ^)fk)st;U%;a+yXwLLYHJD8KsLVIplBHjV)6`|G~JSV?&^jPpd
zV)3ed)EhJwLb;RNwz;3v;lU$uxX$|A!^OKb>Jzoo-YLB!B>Y1g=cvoIyQjsn+v;<@
zV_cTTj}7_{>b>?}Ea1kCe^yZF$v^(0WgSwI9zXUsy-@A{YWuF2VsNAzhDOOKys9-6
z_+XsHK&=d^NZ**IqE%|8rWTkTv?O2l#3}LUkuZmsH2C3vg?4nU5JROY&UrN++!a`L
zUVdLJ-_1~amkU%G9p1kyc$I3#9?FzAF~NLugw~7v)cMvfz=$_+!57Hlx%ah#;K!sy
zf2DW9o49>TRKa!p`Tn%yh791{@r0}5`dZcQ%sJ!^jZ>C+xeG#{W_XE{<iW|h^t1DV
zKyc3eeL3+WJ{NSb69q50)8*n+bG5VU7dX96uH;FX%I)vFli&1?&Q?cl1Xp>IUL9M6
zoQ>(dsM>TWoqo!>IEWxkI|`3j#enbTST-gMLu+>@Ro7$B8NNJW$`n=xuikywBi)$L
zH-7iBtPMQMk$S&>x_*keb)9Y~ppw_8=~m#Wi#aO<eJ-Z0JGPRH%DTP$lU<8OK8|&D
zBHi_Ddp9-kY$bPY@!GN2RcdzMP0y%%56Hh8UH0GNwZ$f;+frcLP3&7#^kd)p?_CT0
zEt!cuu2glRK+{&7`#Yq6<nph+=o)qQM2coQ(#kM%KW>ac`nt``TI}iCf3;Pq^g-b<
z8HE{b*Rl^y=@DY#25PJBSijqX2x`>_p(K|0q)fN=F&KKGdaH=<3VJ13aeX^&!;7=^
zv?+4H?I7Zd)y))%XxN2r)``xMv%CscflRI?n5yvdvBIewc=pR(*@u@zc0blk8MOMR
z<uQnrUHbRwl=R7|W~)JEwM@G%bQmj5waAbtobO%W*7`m%#JAR5yeH>@1K+9deOgV;
z!LM_o?yTs9KPf{h^g;M3quT0YK*a6)zw5#*%@YPD!{3TC%PvB(jXPfFTw79s&siq%
zs;Q~bek|B#2swQFW9k`2(R1}TiICcD4i|K;B^yxSsq{_R>2eIlbjdlp&44NM6Va5F
zo~GK<_+3wrnSJXa{He2ZI<i|V`s2g|NGqRsH+$MOP%^bB_`b%4&0m?47sF~xoK3t6
zcLcoO#0(+AyMSCs>Ne#IgIev0i`HR<?p3|q!CCf`S;@%bf%aLA$Y;Rlc(pTH$?-AM
zNjLkOvnBX=4MH9yT2WX7nto-BOMH(H|K&BFhtR6B>I6;f)7Hoanns7@rDL}HvZxP)
z>N5G{j;g;OPfgDjtPNUjqE?cHM-O2U_OqY_QPk&CDdrn5-x@}QjIby^{P&3{1L8W5
z`$O{fTpzZG@V3kJlBHKvsgO>b41`Z5==!G5zb(_U43HM`s)>x-C{y+YkK>E5`4-!a
zJ(2FIzelQIHhiOTIsNG8<ApaHF-kslgsnz?TlgsNCvm^MpWCFNBDu{|nNF3{KgydQ
zyB``n6g>rfSm*Q(cZ*E9X*~IBM5USVG=GqLW4h=zk|t<|qUr=xTBaxkRVO?dDo_%=
z0-yep@U2^RzGdLlXI}qlxtz&`+B+`859rGNoKgu#M5Cd-0YA5+2SVl5{o2_e%g5zS
ztLf31wB6!Sm01b>6G;X=raK=m5Ne0!-@IKx#RdpO-eYkTmsNO_yt0yHXrBL?-PH2r
z+E0OBJpz{t#WGdRq)RiNh*~LI_g<X-7)ajQ`%O2*ygG=`bN(@(?)F3#m%O)dMoWoa
zN3~q^s3#BDQ6#rFukL>jH+gAv+<Us~r7tuca!!!9!I(~pVN+RQCg%Xx5rojaIWW@a
z{cbIKytV{Hes$Kwb^8lq{{XXooI~peJrrp{mJ5;?g_$^>nIp;d0^7h3!G~BzE)H<W
z`k!0-m+ovMbix1XLzWD@zx<XBvZCcqiuAR!!Xdm)Sxqbcook0nsCtiM!)cHk<S7bw
z$r6)wjCS0`Dp)Jx;j-lwJn*vTJPn#rxT(c=`-49FYyPf;KNXx;kECWUJEX3E+H0Ic
zm#az>vu!k-uXUz-G{Co8b6nE>G6*?*4fC6PG8X=RE{~8u6C>Ro{8qP$l>(<oNr}I_
z^LgkmP;a9m)<R~I3{ACWzBM&)G-fb%Mmd86CLbSZBv91ZLMOUEeSNp$ZeOe5eJo9?
z3mhj%B2Km)`Sz`mix<5><*<*s%qe{yH>VwCc@?kl+>8u&#;BT~?YtAlI3AbRQKlV@
zpG(5P$}NdfUwOPR?OP#0ktq`TT|1}(DW_|}XDCxyf>nkFyN|)P&x$X#aeBCoA3b$j
z^{Vb(Q+nw<qp)^{oTmQV8;&;+_x^9fl=#hc=|o#gIei)@Pb?ZasyBtzKkojYn)u6=
zDs(+vaN}@SYEh%n!z`ac>*T%;rdmYz`1i(VPWr$tj~ATo)e%{PsV5xBM^_@%8jege
z@ev9-5xvE-pP!UzE`7SzIq%;`kg-}tczcZXxuO^kzr_4+1+)e6k%InZF`8doM_G&p
zngbqsk8b=MY*Zhcdw-ArF7HkHkv}P;EE!W(dq;xhNA+6v$nswK2WHZu8eQqOA!o{k
z13lj!$gUMUy7$lXfXO)9m{-%r2k!6N8NxBAdkhFtj;nnDx@K)yjk!U0xmH*%z|eyZ
zUyp+t;;NxGSC#i{=DiZSXWmIajy^A(vpPKPH^!uIm!Kp2p?KJ4e_d*SRHX9O%kS}(
zoh?4A`@=`e=UQNALmkn*R~#KAt(XDu3Nu==YW+zv6$eFJ`u~V}%djZBFJ4#?1f)>`
zX+%H-M5J>-1eBDL1_8-o7`lg%25BkjlI|Lsp}V^gknZl8_vZPZbKXy0mmg5}z4zK{
z|7x9WmQ`syi^Mb<IIf4_$K#fpJ|~kUVWgzSV<HBxYaNrczja8)>QSWt@!1>vp)_)y
zZXypA0aHM#^|3f$mNn`;B-+n)dUcu%u`MranfAD>1w$coqh!9%y{7$Oz3hgXWS&K6
z!+6XJ2w8c|!Cp8lUf=bMfQeWb_;XKTPKklGAFI9w%ZPu*g;DM>uR%RNQ=mZ;1$afr
zT8G3k2dbxA$wJ=vinE)2zu9vid&l%=t_rLn({$;FWz1Q>E9-{xi+ev0+~V7-0Xkam
zU#iiaJ{_ccGq5Zf5L()J#nC;JQW=mIoU;BwMa@gIu|b;;L$ue0HKpxsn4N(BUy+R@
zZVPTlh4*wH-w#L<4P^9aRW>9VdN+{^i>}%w@tKQ%g_OR;xjDbRz<8d#ivN<LFY>w1
zq^AB~;nfg^uyfmf+ed*V4di2uH$t+*w%!9ey%#2Z1zW-$X!hG(yq&0d+Gb8=Orvnn
zK84WoWhT@0mvj3e<fk~@gvsfrz6U>}mT+WsYQA_<y>Uwq7u^0NbbBbNhb4bicQU3Z
z?4vmrL6Iz7bA(<|+C@UkxfWa`uhW7AoBXm$sG(9oG%K~Bx05oZ?|^OS0_f_Lo6_@I
zD+RlIT1m}#EXmg*(8NoVYatq;F>-2Y>G>RFwUb~hmB|i{c>Xj%oE`iX_R%6>qAP5+
zZk&PTa{z=^TRSGpl|pP+#UOR`Q0QB8o>qx;%FQ&pPPhJ4QdUkn2%97@)VPV-lp92-
zuh>fwiypmcY$s{wBa-r4AYS8XUFZGO<bC}as9%1X@RSoSb#&?LOqZ8Di3;>zZ*4IF
zrYZ*Pkfw-jW!Yhnk5Q)UqPluoRIONDb#l5t5!D$|8}Vkm#fpzTx9UO+#sMjx4CqXy
zrwWzmy3IAtSS(qnoR;;hz{L$l>h9fla+!42Q7rn#OPD5>-A-*?O7wh+sF6R7%2-Bc
z<rQhHC(Fw6<9vx6MH~}nRUT)>htEWY{$5Fo$^XAPwY%~xFw_UWJ)>%&-1tV6<>n|S
zb=+&2Wb#_5gw=rS+-TNmj`kO<4%{i~uv6qbePCOd>Z@1Jcat6`UMQ&Hn0PRYW#KXG
z2S1|{IW9vDecrBY?hjt7?;-!Wl%M|wkY#)77(RiUQPwSaVviheTOO^KwjB<K{Sa(;
zmA+(u<Xxy-iu^NfjC^!6`XVQ_Q|p|kPMqDn*H0tZ{+6J(&o<?561tM6mGqdZaq;dF
zbUxSUz7KYgu%OH7>V)q8j1sfcHtcL+20qJcq9`RMzI9ZLYa8uqej)%NxViT`!j!|=
z-lQgc2e$sL8_jojzOMC}8>wNg&&Tm4uHNkjW?fu^I>B)aYc**vo*%=_`7K9~WlQ3c
zg>*6Ai7Xhcx268m9}?qXs4tX8V2jZ%b)KtCgdo#UYiXV7G-{~iBNU~pczwYSXVpkB
z(&%NSDQR}B;?-9agbj5P+x;`7h^QgUy{2>h4I5zC@bU{<7ZVH5Uf^12^7KXSutYRc
zOj=YgeB3FXOK#Nhe^Iz*shXy+BYX9IhW&LL26tWU%CVgJ&7PZ1ssK^kYs1+zQ<U(5
zb}+LC)`qR@VarhI5*D7A-5IHxWFhM~U{T~`dyXEe>$LE^mC|Fqn`s@QNflfQA9VX6
z<Y0bqImoGDz&&!ZT|$q~Y`|H*m7Nz_7}7lvAmkXs#Yy%Pmo!HUMLyv;L$1#woncd@
zu=m1_l)%yH51YQNr^CAo62{mgCOS$ZGmwan8v-4jzl2;E)a&3Y(A3rglV|g}Y7xi!
z>CRNnzMD|8T%S<g(;!eon>>msn);=Epk+F<o3oz0#7<DbF&7g>iwzDo;pZx3Ixp%-
z{IcZ3?Kj?`BxYqV(ejMq{TMzsUm+6ZW+`FuQ!>JrH*K+y53}iVMNW7-_^n9l^=@6o
z**^0}O6Gx5JSi%xQZWKCM|wye&l@g+;m|p02|h1P*zMmM-=@u@?V<ZQ#b&9V^QcpA
z($>b!UuEa@OWsL)pWSilHZ4X6bAf&0ni&@N3kG}0G`EuLOOkk%psGkKUVk>@2L$o_
zt1uaI*S0ur6e;59TmIc9S2k7=zNlnS0Vd-vBrbfBvZVDcHZ;}7s?0n@v<@A~WApdu
ztLIe!Ka=0mUoipqNgqTrWj*|CVu}YcyD<5X#nY@}j8OQsMAQg?+w34Da-m`Ic<$6T
zsf`zZ>|-8OQ>+)DE*D%M`PIaqlLOPK0fsp0PVh;1G+sDGG{WZb9iQ4RhB*-+LyRJQ
zCgzXI<|*Cw=V!d3b$QL9^-Cx)7d(4f->I@P?VQ@UNzK&oX1z7IYc!ZMn@GqvtAvzj
zZr(af=-6i4dH7-FPtwBi0VNRnPw|-OSM;+!`?4|Wk`LP$W%{12p5c=82zTd=vwwys
z&8Pv%7;D>k_)_wCt*TjHP)WG(=3mD7hMA@N_am>t<koYR{f?6Mj=mWzD-WDr_|{zt
zucU$Vf*SXmsSC=gu;bV|ENS^^0%hDTr{RWeLpzw_2RPBoKX1H?UlR8j&dYZdO=SRd
z%BS0SPj8&11VcMlqH=vQ9#q;bgm_sgrFsFrv=GM2LCZ!(NoggaIY@r;uPyq=WDfe8
zoiR~jUEQ$LLy>;>Hw6px3#^bshWn0gEnx0yBOLJbO%J@iD~6p968j@)CVWzX%B9rr
z2j{VX0yiRz{jhFJmeT;SQ3~PH@z^akXzatba#}K8qHp<d1CS*HoyOSdk{I$_`~3K{
zJQ0MT{=B19A{E5f9pabI2CmH3s5e6EG=Cb+{J+vTCq!;Gm{j0)HHP<ZGjaB8;z|>}
z;c#|pw~UvCzgkl3jhHb7yH-I?)|uxdL^0RW&)(IFu>j@ph0p)WA>&2zg7ZNePz>#9
z6XnpVH((>X<%tz)c-x_!=MKN^Fndd9csL2j>V$%(i&F2)EQ`fWsGjYpj3Q^h0EJVk
zWbe~SMU3PT=(M|fXxRppaiRXY)rnv-;aXkOX5dcs(&k@Dpo=Hn6zl<Z|CRlV#MOOr
ziLO@_-p5=@@5bIOt!~0ilU(kjyQwiagbEvCNhAFqVk{Gv^0t?Y7xo3cTzrKf!=+>@
zk;2f~)tv_rLRH-MNzDY^9QH35Wh7$<3$<aUyT|pJf7!naOWhGIIN%a!psh5G3*!~v
zUTxgUUaE`{7l4PCJN`sPPbMD#0wQJX+g}RwvE%{P^=Hxn;)O48!56h^7PEF^56mrz
z2b>muzi_5Lkiaq$<j|}CI|m)gsgMr)ndHZ<NGE+qI6w4cD3MJrj=jpy*wr{Iwa!!%
z^XciwjQ79YsMqa>1<sD$aX;<Y?yyWR_#QYQ4O0MicceVteUg}Jr2CSz8fXRrlJC0Z
zwLLb%+GoFMeT(6(DQBK4FP2RNXJ%{YiO2dG&!omhz9S95>DoTpvZz|HC#B)pOz^f0
z8psjfWg-vF(2GucN<};Mmd2e)^kNrpvK}=SjZyY1JRbqE*qsixDBwUdq?)(Lq`rpG
znN1(uMkvrvQiJAw*H3X22>iJZYQwV^lgPTybt1-ABRBqQ*}%XCt!StXiIX6g$tu)8
zA0AU=Y8sT~%e;JY-gqH8+~@x9phJELu~+t7LDeH7(a>;uRf+Q7`m-&n9LN7XJ9SKa
z!-b1NFflyeZOtb_8x<IbYMY<HE)B8AzBx|h{qCZLtI#}1pf5qt0INQ;)D^Cw@nXoe
zUy-q2@)<2F`F~W#`%6gfWlUsAE+u>*rt%&QT0AYNX+4HA!-V!Py$B&GhFb;6tgBvF
zZd$}rmB(c#h5>Yvpu5|OW$x-JqijJ>Cbq9$nv3-Dt``n(G_=8Y^1);rG_yZk_rDcs
z<%&PTCUmM~t#;A8IbBb@Td>Pl4nUs+%r8Imy!xIC7>M(+UhlduE<Cj5M+R<4vw;!z
zS9Be|3&f6cj5_)Ytsn1VqfypR8WPr?JD=1q)h9llu2P&CBwWdsm~;x+Vz_@Jeh1!&
z5|~CBdXCQ%Y^QhtvvrjjSuDGj^dqGgyLDlmUfxzb{x41jLNEciti4?x)a$Ntok(Xb
za|TLMr2XAA((}(%UiTK$Xr`p8GZqhRKDr3p9(A3KHGT>{m0C|h)fXgY_?eGxvL{t$
zMB`k`bZ(D1aQAqr!fAX7KfA7y28IU1S3C&rVf%FJ+C%P&js7ffR}M6v7`cA?%3$x~
zsPP=|GW0H9*X8Xduo@B(om!6qp^w=p-_g$sNe<USbUheWjTXbYK8RcssF)?gXd6Y*
zdgt5kBwWp9(x?r74Ik77=E`IMk3j$+d)JV(bghuY(-$5-QvXT!zHLhVv&Zk$p+MIb
z;)6vV$k8e)oR`V6A!a$`Bc}25>*L%r3eG5qSWY;L#CgC#Q`*U_?O|S>_%4uBqGXoj
z8U`M@{ObMrX$fLMQOx9%e=8djVTG+m<dHcWNFuqXR9{e)uU%!jW~%SunR2IPkh2yp
z6kA(3)BYdJ>eQl3yOO|C^KtL;S(m^;ATcM9%<L<jrYy-0?jKz<Is#Jm<|G5uH7Y1|
zRCwFBDZkay7h=U$4JHiPnx|L2Ji9y^BkuF2W&ifi<aWM-%a_`$ns+iSo;!PHB%IQ*
zjC9m(!E<WWSto6DfoV7^E+jkIdA7xk7fVfB<LhVxi&?Nn9c)&Q=Weim&-soaQGB<Q
z!H3<Dg0SN7gmY{0W?v(r5fxsSTTq5REAcz+Wh)`(jy;o&@=sij>emRDGw^b_=y%_W
z)fv^ap{PFIvR&KuY$rjhX-_?#Ri<?rHYDVzb-S%&#%Q91A|DZE3sq@RAz+6ekBWt%
zReph*?{)ysn7uCl&AvO`Fu*{YMjNDxaB5fnzCIV`akzFeq&i9#Iun{T_c<#XqTYCj
zovrj&xEFqqJf3AQdqNs_6(M;u1_XfbCwOisCU1(ZrM6WZ)zztmFCClT*3<@&1UeRQ
z!&;ZgkSSQUM5<<{muZ*V%m1`S<DAFN?W*J5oA#&PFJIxlFaWl2<7k{mU2TQ<E+c=6
zlw2xh3Iiq^Mv)^Pxei7t`*80NK`^*S>GkBZA8V&l6iyv0LOV004UlID2z<BCVQnI6
zYa7f`k1#;q22;&hubtTOV|8ds?uuTB{f+mG=*jzoK77OtX~_-;U6B)rL26<MY~w@#
zX5Kv?w?+~9ezf5)>3zV;tC}{#@-N@BOJr<T38J<R60N?&>~x3$XcinsXPv-wdOA?>
z@1ENcyWTVgsHI>EHy6=^Tk7v4QEeyalOZufYyc=4xTNzuqy;O-iB?1$4jVG=-o~%3
z9sR0;Zl9R}z~Q$}&V8VMHnz%%?0W8U$&3WC0PITYAF`g0Y_<`H62}Jpr~OKw)NM%j
zij<FV5;_U^7s&ENKZ!LSSI=4&u!c4ZkK7T7{NhC+AhWqt*tC(aKTnB^?B{ch7nmva
zg%TMbowe3Qo;G3{btJcKCK}KCJ1NiBIyj4&4Dx)eR6fDjZ;n#xOMq9On;+{5h5y+A
zz4dGhMr^J{Ih-}z75aW4Qg2Py@8oD`BEF5OBfIeJ1ltb1aAn@BA4+jjTP;ozw@>}O
z5ww&fLsv=Uc*Ia5dOkgr&M^?$G#kk;R<ovb!MG1DX^gGHVYj|mK+`YSta5~1lk+dc
z9$xd`X*oNOCLP{BEiu3xDKE*%+mK3Wt1|--G9ZGnV{qT|PH8bArfpqG<@p@`Q000$
zwrL<Yjc0pV`_!u23+~(6jif9d>peqvGY;m$f%d+8DO7(P6d9Gh6f;QG#k%D_5Z9r%
z5hpOecypd<(iaP0s#H`_al(-9tzy{VzqJ}<?TgP#4ks(feov73q0RNbF?f8-o^#2i
zf??ay({V4~nRsl{hE_R@UC*|&C=u5V`sD@lI$BUYOBT|3w~WtmIy*52rWX;z+mc<`
z<fLZJ_Q&Nd!Wq7CsTPcAbp|vPY=tS0;emKiHoHAQ{iZd1x*^In*VHJ!0qQ?ArCMWi
z0a7RxWZ?BDVLDcjZ6eU^YZ!VJZcz`Z&XVoeXt+S#oVK2Dj>H+jAaU&ksUfa08K19(
z=&;WzPxb<-=;l|<SW38*Td~)!rgSS3NgpWEJ^L=N@6G{x<gIc2OYzIapHl$-?+4GP
zx~&U3PM^H-YAtsZnFo}C&ip8@ZAwNw+`ynW#KQlF#(YKDVXTk^<RedeZeWX|2?ILG
zLC#3NKJ3q0cohaNibmtP_U1|oQE9Ad5gZ<0E?!kmS&29i3%zow+2en=xH33o)qm#?
zJKr%IQ{qQ$4c42@?&ndcAoXvfE@wO{6t?PESBo^ne%P$VOnnK5RA+}yP>vGGrg!y~
zG~{oNCjy~!c2k!NlS=)7>~x+z^$({Lg|oefA+7m&QWy8JhQ7X{(m<l|kUIMEL`moi
zYljVY63PokWTVRh+8ODxXl?I_y?A%E`r!I@1gg~X4^N4Pr(d1Q4RPA1hD<r@zB|{A
z^mD~#qdh5`A(}BhH;{`ReF!5eyGDk2krNf&^u&5<I-4QmqUC9O(T&6>;uW+5yiZuG
zHAH{bM-NvjIO}VSKn451hP$~`yPa-V{~{7?@EC(QrHbvDvXq=J(U}WZE&l5$h+jTP
zcExtw8tu4dzgLSsdj*R(t2wgMUp{l=o`QOhvJaMO+^R@}#H5Kp`?6KiQ*8F3gCR@0
znZnC|REy?PUNy?kIwvQf2S_&X=b*b!KG2=ro(Y#iAH$LaEPg6DFLVNNJ@7WCDejzV
z^<o2kGY4+BYvuW5htAZL+}W?6H|-n7-J7=X54L(~-?7!NNHR6}r&G1GfW=t$nQ2ze
zI=VK*wr0ZaCdqvc^M1*EHdyTNbeO!WRFO#$j&j^gz_MQG2k4z#my~F4Y$tx8w?!pd
zCw-uTR(d_3-yL(i2Jj;N+a}<_5|lMH-Tz{AtonWKUCkMueaf5V#%sSC`${3m(;18f
zJ-Jy=2m6aemg$GUc5U79Y?udH_$`O|8<u&jhksY4kytdG*ZNQPhlvx5O+@^}#d$87
zl<6m*`R}1`Wlz_K)_5w0=n!AnB_pARnu={o^sx(>l$`!w!Z~psy+k#V<+kft*?Y-O
zO?OUlEjslPti%k8LU|fdojQQx@bLROA#d$74tZ-ziL=mpluYX1JQ~Rrhl;a-Po||r
zqPyl@&tF>`uH2GI*Nip@odDNhI^J9Ar$WNq;~&lvWM9V)jAr$jBkzdHF|muAEZNU?
zXWGIJFqlHl%NasUuV;))9_40dcM?8bV=zxLy;{H=esu?qNwX(nI%GFp`LnYXsbwKy
zbw%4DoopgAV7ecCSh>|*;XfAGIIDVglc&H>;=QI)maV}DAP=g0tx~bX?8p;tunVNh
z(B0FKg5)<ZZ!h1ix*R(`n_)X0wkbhb30zAOMkLltq9JAgoMW>^d!*Sf!%qL4RL`V0
z(GMu7O29j8Z{BQ%%|SD)7gQ3rtUu%$j-DnE%XuMYE%B~TqlN(0UzLa5be$7TwO=;S
z#8StLdD>8;Pbon15AQmH<AzZ%BBy^{P>I3ivZD^j$k>2^E~Sy6b>n@%KSL&SW>?DG
zlaQc&En#tF!%Z{sa@4Bo_p8p}9O8@DPF!Q$tV0$)k6#b4%+**zpM%&b`le)&qG-{p
ze_(79Uz35-sU;WtzXGtQ4z}Oxj(*g=|9v$BZMur}Cj^bzns?)8fRSd^tW!(C$OnPG
zW4=8^;w}}|ZE+pH-|T!Ps2&%%A4af<r-A7vB^khPJ$M>>Ci*7)S<HVN{OWZ^X6<F~
ze&fV?Cl%E6_;R;XdMY<>>T}%N<O#=0=WLO@rF&(&9td6|*{x1Zv|GSKlN34Wa0tZd
zjRsZ>J~itjlr+%d{#UnCB!@@l@h?ykK2oLb66#uqE(Ij2g4QOz&jKA!p6}0{f$m<s
z6(?-Emvqj;ofmDf9oc%!g|YPmj;7o0)A{0b9h#~>Hy>nwZ4%h%!``jtOwMvK;EL1Z
zQpDW_u>lVo@_Wkt{S7Q)2Y;_0Ow<r`6(STt-+Az}BiA*iX0<eGe93XI2sCt6qfCsD
ze2hP_#F?>8M?P{)mvqO^B#^iTV#GL0C!RGFT%g}EvA(juA&W-x^6x1uE3Ly)RIs~U
zpK=5uEUFt0tLabjt&Ba3jg54FyTowq{_kd}QKWU>HPnd+t;*fcwC*Nmprm<f4X$4F
zcvJ<M>%890?&;Ar4(<gd%+6#yX+NHa){)|nw>=@#9PTah*v*06I90kF8LT8{AhbHS
z2e+z6>n*MA!?ZI^TQvFGjPdcNstPQ@g7rlfHGaYW|BC~cuLH4U)6+pd{8sqD++;|>
z)&JkzP#E~Gos(dJ1E1*opt_X!r||GpEn?ePZRplCgQ(|)@FmXm-NlkZiPxgfAY^p~
zPa$+LV{7PN_{M;H>|3N=QYL;j9VhK9$?LATSEuf8jsCBi6UwKr2>mq!ptTuV02QB-
zS~I!XIxMCLnwx&k0>l50haWEMTNA`}kOukonZUkJQYQ#(2~8QLih1DBj2}Fh8)!)H
zqgJxhGU$&{T9aRN+<;V`Yv;jS*BLKVdW~GdrT828cu)2%&RYna07>kX4g%5dIbDO>
z?shckiBZNJt2|}3at~zu$vyFX_Vehra|FH8gKP8<BP;mFC~<vk)b_0Ap;_#o^Y=EK
zCLSMs49?24Ja#2<lM2qi(7Uf&!?nE&Vw<-ys+!4PF6b9by>6L0#ektVgx>6xKL3ge
zfHZ~pL+jct52M7a<)T3Oz3#QLpMfemXj@PDH_a1fF<shn{*qI}KT*7}$+jz}30e=S
zBTqlREym+5Wf8lA?O%}(2ha)ex4M$#q9bL#T%1j&a~T&OhHw^2QY_1+{2frv`8`)z
zTp8sG&^ntcF?9AVu`e7t4-s=Y_Xcjun~j|;t%_m_*hoQsey{c>X$xO<$HrJdYBuu=
z7?XgW>qOOQdz8}5fikUk=hjzG{!of_3(>b-P3)&TWw|tbL%9{ZfiwMgCFql*-62r-
z<w_32B#WI=&J58|T2Wm8pKH3M3QT=1n<`X*2_dAca6z4)eHzdv)E%<dS3D@9jYXCj
zj6Ci;`lLyg`@E=(BcCtRx!{_g%4<4+P9;G~L(4B%$%FJHO){*sQbUJsd?-87I)hBU
zBrQLmr`S4C##SM)dfJFPLF9;1F2e5C_w&7};uRYLHq>unndw5XlUyP%oPj<<P=PQ>
z0%_j;brD+6W!$qVbUfzCqS2U|ZvVi+ewsA~nJjdh3US}Hxg~ZWk;K5#JLT!p)srl2
zXF}vLICT$mxA&B<QgZsd4LknOAxX3#SH#9<KACB6e*BN>Jy{T7ZN;C3BggYx^~Gl)
z)v))s0#8VmJCakb#yF*L)nvD>RGT*AwW!HLOt?3rqak%C!gys(qG%eXZa1*MJr_>P
zcD&J^M<NPleDicHbZcxsn<dq4*48D6x13PSF%1TOfc@>^!%2+3oW&VkzV#2Y$_p=>
z{jsLQLCfE}o^P`2ikgh_B4Ua9GOvNo5KtWY?=Z{qe64TLx2SddVo}FCKsX1@sZ^$w
zWgJ)6TF?0YRzyXUHuB_oG@{f1Nf4u|D5iWg5HQAxybaf!-Z&XT{-sA4GW@}gcCuX-
zq)WYd7FvI;J*S5}{t5EDSa9a~`;URJh`8ai>w0_}dpg5;+nLZ8Jx0^)=l)HLZabls
zUZjC{_d0#c(+)xgJVoRGqa_a*X(*olj#Lg69vCsUA0=O4I-{1Cv@)%kZ;A$(n#?Xr
zQ`eIZ{T_~Y+wt3!Ul;JHT`*`C&^ULh{s7GCwDI16&te2D%Q)Z)=z%|_8m#<Xvs(jR
z0_aq<hh*CjMLdH;i~Z!Xq*7){(>j$AZSU(~Pb^lb%Mk&4b`NifsfY3s_l^5Gs_29~
z$vWL7BusQtMcZh~f#VI>;W<Cx$G9pB=e`AUidFM>V@Y!jy)?qYLw%zjWIJhIr4ZFq
zU>PZRx!j%myrVeuYPdP5?<2IEs5y#7INtcUb@Q!n2r)liy8;-s9oNA%!3t!2naKfM
zg2yPn%pW%7Ki5GX`m$+K6(1^Hfv5z<#L95>mxR2qFN1Xm!kwQ6I_ek)w}LvEi2JU_
zi4ISM$BtAV6J*iBZ-W3|&y{JB)*N&y(P4S+HRPOzm*4H*@(ue#*RZ4`YR~JLNe<P#
zaTTOTvrDV5Z6&I1VQ=W5;U;BeX{c&x)uY?0WM<ARy(<7{{C}S%3t$?p{!4X`;Ao1p
z{@ddtsR7m9VKF2nY<*<w!3^&{$t@^}H@6swI-Px8^sjost`U}-jD-I=C%+`~%4Oc1
zk6j&#;pBk=lRhmsH4N<CvP&a_BFTvc3|HUB-{~6>E~4>T$Yb3^J6j4mcu}USYk#oH
z_NqPG_H9QBtvv8^I+zD}>(T&S{s3U1f`Q1dDNL!^Ys3p1&B&9Q-g#ObE13P>FjC03
z+ab$w?c;DBUf>>cXKf%9F}xL+H9Aq4nc>S8XBYmx`uXinaP47U61l2N6!cL%4^xpy
z2+^Lt?UhLw>=mI|nDQ-$jt(FcT_FuztC45V{J+?d@;WZGfVWXVVO@Z(2`zZybGUws
zeYuH~2CJzeG7p@X!%2C>81a#yOh3V}cDRjCCm*-%E34u3c-}$tkB_ICvKVFfkxj!L
z2ZbEa7H^^;79T1|Wh5+ypgzd<Y2bvCS{bNm@;HYMo^7eX_)Sl*Nc-|GSWI2x?Xe@y
zOA3ag@*;!JEKBk6#_8F|$6qZC9ZXhwig9>4YOiRdYkr*|AmK$@2?Zq)R@!`E*Sje*
zycqff(rGsE=N%`5F8$JLAnrR4J;I`mlJ}aT8+Uvwa}H`DA;+tK|CF_JoVcu~lPYhA
zLPdkIjE+p)4G3zn=rQOs59UBwTNv_|@I=)#?7p*2(5SIVV*hagRX4DzE2#(@B~AC8
z=4}g}Ie;IgpEFg<jB7dFTCF$X+=KL1L+7d5ltzvZHAV=*PugTHq%MK?^UpljjcR-b
zEnDNnwo-BSF4hm_?BY7LYeA=zD+&pr;=8=7oui1k^U~nK58%RNAif)}+G>?Jyj_sv
zC)utl21u*+U`e#l4A|9L+-XYyoz90^_r2PH#^sKEB2fUxZrW$|tW+TO(mb~clazl7
zghjhwOX<-q=Gn7ot6H?15GWZnsjNPMY9=smzV!FS11LD_Cu;x$WYNW?|5%TDqDsbY
zmfhy|YzqDLwiScvnTCS!ZcU@H<gczhW6@&Dl|y9(p!Y?-FS993{l*?(QdGuHp=0G;
zs`7TS#-(M`es2!rpYWVV(Y(^ng90l(iGsrN1mm{Ug@Fzg`-c%X+x)USyJmPGmUYQV
zwW+i1;38`5L;%F4jwPZ$l6bXH`eSp$z(a!f4SFy7%T(P?iCjTpL;0G?|IwxoH|n_J
z^*XP$GRkI1Sm51U%zoKggwd=hd`~{-3P;VDr2?XjrZnDYvSQKmU1Pj9JKgoO&4vf4
zVISFVUk3=<OS2m|k(b&d-X@i?`JDDvwHHm;o1Ka8u^N3wHT3KSa<nuIl$O}sn*L@g
zZFZqipAw-cXUC{kgj22NrrU++dCYEyDNF3S!#)MoV^ZZ`JneQVS~W0$USPV39l$<8
z-5o%qox<(Fo?r6_U4H|6t8X7b&*O=H=M;B5U$zfRoZ}fo67XrJqAvP|WX<o4e)`1q
z#h{H8;6w#J@7$0Zo|jjxoLgqVNb&h@euBc1P3AH1zK=&okt=M4rdla$e_=|QNg*C6
za*>O!7mv2{E0vtLW_uFQ>j@e`!WzOBfOOSzt$e4oppFV0QG_y#d_+6)t{}jWs19f_
z-W4%sP#DO2X|5A^Q)d)uK%hg7V+nx*auQc_^sTAa*-eLRK+-FlZJkl<TRmA&-c=_Y
zb;2>=z8xRp_;#Oh2z2qsrP}w_bkP~P`YmkfH(l2~<>w?}=kiGw-sewMvLnj3!GOKg
zdm1r?a)CtnHTUy!`40fh60)lW)X56iS?0OT7A1;$dj;HMBL&a-mpqIYoH~ppTnnP>
z=iMCtMFx!YJW>UxQonvp*M;$%d%tO+DS<!cB?(=^o$P>U+-v#zqB4K&g2m=Y7X2Xs
z{Q*%V8ikEZT9E8}o)Fqa$at7`B5IBO6H^ySwKW}1ON5kJfWGr%Lw&*6Sc0PswCnzH
z%8}!DH5y4h;<yIm!Y=kMwjUf=O(n{&Xo8k2y%Xp~BHB%2BatV%XTXq=OoWJ%UP-+V
z{NLGc$?@e2Cd=C(%hp2lMlbpH2RV60qFv`)74KgvKiaM~j$AtRs^{#5$^1c=sauZ@
zBwROhHEaCjJ|H(deop*D|KBWtOxmE8zY{AI@H-d5icr_0rA-tdvY5G~_{<3u`gfI_
zbJHDH!NFqwFR=0666^T7JB{*90~w&yv-THa*DTix7A$Dxy}N3###$}VxZDeAjnu?q
zT($V%OW%#_j{HA|+1(ugN^z5$C=}vc8}U_>tbKAyEm#Whj+DjY(K;h>-ZNKOs?%De
z{LRg!&|jh0Fz$Yw@c@G<^hdb=^si1Vzaj4*NsqM$DUI-~_ASPVg(ItK-r_LV%+{+y
z{7t9%JryC9gmWIO$xRmd)P^e|nbT*o=G=6hx__OGaoXO|U$?5f#Z#MuE+rOIxCcQa
zUB_;A;OGE86)Hz7;6?8`c2wT?*6v+^XXN|Us~#3~#@LX+T)J0q)$l?Zh4N%RWxL4T
z?#Y`4HXoOPZI(hCCYhS0Ciem$ZpWGZhdWcd$s!!>Q-oE3JEbqB18vOOb8PO(F)<%8
zk~xXyF;Ff9_cv;AC_3-WPK3$8FK>f6Et;DTSvK0*d!~S_^Xmv;SU|afagxo{3FX-f
z$5<M{#M)}5L{lQ;>xd&JYl1SyiK;Tjb4w_0du+*)k0tUq6t4=QmY_owD^MjV*Yt4=
zeC1EWzWmj73hR4E$@H!arr}y*mNKI6>wqjksC@MRjNId<zv7mIL=2J}^$zr7@BLim
z>ywP(0{vx%YcVB6<R0>E&qJg9aF58<=wta`<t*~d%(_IE>hs}Ql@G_wJ^m1ZB`CTG
zFp;)+?VbPCXA{Hj$c-cmgU@+!OCIY4`B9JYoy-Y%?>@pfP2I@;$V*gqx^*zleqVCC
zp~+G|7v+Sy-VMTbw{7Euc{)txY|fKv9rj!{Fc<?ycqQFCTD(sZt?SAZKz4wUk!MhJ
zgMHTQK(yhPy$4zg7eVcI$rT2@CH0s2+57(&Ttgu)ZQS>Gjd3-NyIal!X}}TTZgb5H
z<@@vbX>m3mMBA(;o^HOl_8CZGi*4u;psDI^YLaiQpJD%QyXcx3bR#{_oX3MrX{5^0
z0y*ioVr*bVC(i!Zp3kdT`v+|0DUbN46t3s-mZ+MXc!C|h;_u-;alt<570FycYqe9O
z-psoiO2=8d`^0U3hMZd8?PB}0hMr*Okpg^q$If{vQ)#dvgVt<(<JGw{iPhTsoz|lN
zX}<pOoc{JMsv9n#l_t+vyVSI|VhF7TBo2_2sohaCXu!q2)WK_--r=KCQr90KM$F_;
z%$^oDY&)F<m7H}(pGwdmxj<oDT#E9i$I>uGSva0I6*#aFFw{XjC-9<%khi^~9z*;0
z^7U9YG)0a$`$mAD?^_MZD*%C<rb~q9J<<TI))kl4x|cO4Lo}b=_o{T>jItv={>EZG
z)qE{#!2BOunf&kW@#H1Enl$!V2ZhA;RZc2ABa)G`^f{l+Z-GfA?>`)#-iP8DU%cCX
zPpQa>WDj_6H1Hq#X`c*D_{Pskui*{M9c3@r@-J}R6^9fiYCx8p(LN497Rofr`*0Ys
zK|u@flv%&C^uukBENjD%o()OkG1K}x{40Y_)I4lBbc`0ARnp}C=O$G3ub{TWUGG-E
zwO|<q+YBj|n$>4yco)}Odvj2w)o%?o(0$QTwkV;h>j9ObYbMDBi(h->dv1=Z6}Q@M
z`(NZr>)CLH(mKAaf+W^K$}};J1XGo}Oj(V^uB8xMK_-HB@hqPf?W<NPHtYu;wLbDv
zk$FIAB-e=bksVpYfB+CuwdSOui}+BCvM3&}X{#-Q319si&{U)*MeG@(?A`96wBhu-
zBNI8!TwyTRK)~|n{`sykjfy%hUqcFFJ^FJ%o~;@ZU;m|`>1s&Z_I&Z8Ib@~m%W4Ee
zju20CDa#`L?V%5m`Kh0=c}}v^7jH~6ZNmkiIB_qB30vb<e#$rdK`yT(=opCVaa&ht
z@VPlVng3xd;m4|)Jt|ky@QZ|R8(X!;Zt0HD?s@F{)eVB5CxcX<sUS5?1>*0ZKN}8L
z`gm+tp6%3473<Z%_WHTy#8ZMiVg^Fg{Lbr9%@CvY5DTY<b;p$kL${N0))$n|1PI0Q
zoQHupmk}&CLMj$8j}Usk!d!2!?!73(WUIjW&jMqu!m-sgv+?+#PwVvq^W@7Gs{90H
zGnH+2xKe-$jhO8q{`H@x(l6{(WFgNPW{rl4g*{uJxjCF0=gHUI`oEwO5HMinS^tG+
zF`+(2>2M_srGV#DPUxm}21BE>gEmrO-XPT^j57HHr@4i^tZ=15eU}#3$}Azwzlg}r
zEznK>iNl)ul;#x|+`(%a$Vo^KiYn%A6j%&MaeA{?jczKYVlMn_e7-9f=I1E$?Tpkx
zLb3H8AHXu=tiOHZcD=RniZTGU)aX3xkX+S8@WRc%O%L8<(tuwf&^ueCD7f}&+r1fe
z{xTwkNdMLKN^psJZtsqrf^fq=%hZNZwwYlc*+(#YSC9995Ni}}OI=KGl?=7}Ze-X_
zw*tHn%VwVU>1ML?B7btBGnq%N$8J_}YgI$pz+F;F5bQMa2Es84SX~!3!{Y_;IPg^{
z-K8!E95x6#-4EO&_Eo&ovu(s~2>KZP)=187F|#-T+uxU~b0E`g(^zpdvz+WRr&=o|
zn3V(Dde+%B?46b#0pCTCYnaV79^OX-kL9az<2i`#>Nf>3e#OR)sA5}P!!2;?f>Sz!
zk5U=W#Wv*&fw#0{o<MA`(8=xzd+5Y1hjo-%!dQhKcovcWo=;#=Uqu0WS0#eDESGBc
zXfv*$D{rL9_8rT7Qny>_GinWM5kxo<1x3#d@yl}W0AOxr6YL^uHB7MA&h02mW3x5*
zJ(j@gZ%(<{xbVi`C?y(ZUV@E0D6*|EQTl(+e*w6M)Il!btXOPxpQC(m=3$?5FWz;m
zI=~$Ayd07w%3uIYz#A2Am*C>~kM^{w1w60UJK45vfvRT&SOW~Q=3oBH$E*1ntI2Pu
zSuN0xY}dk>)8)iVV6JYd!88iM7gk;H{3{aCvpOtgN&9s2H@3WH_llKcgf?BDle%|9
zD;V=XQ<Tr~ZFWQ{6|-TP%}HuBitHJGN{IpgmA1BHl{)v&K99YuI6Z5Nkp$NZp1y@~
zPxHsUe(>+hEdjK@4P^wsZ{lQy-WuQN(Rx=39`)@!$$U;%y9PqoR2tf%!96OD4?Mj)
z>ihT+_7)W$^!D8ms<~04Dm$i^#619%mq7^87w6^WwbnPfiTz*aSdpz}bwi+^;8UUg
zZU}l!<Dl6&`|<4#%giXxg3qD2+waDUSv?B{VOC>~@Vi5oqw~3wtzU9)i7GYHyLQf~
zovf++ILDzF-`rf%@}Kgz*^g^&Yww3`JCX9~>g(%_W5og0*V<O*D%RJNbM4KUTS%~m
zv55T(cw0yTfZP7Do*DEr#ac5KNCu!=f#S6Px<K2Yo|yYK&=I(pc0zu2l{)>}#E*j<
zrg=GRrU!g4#C|Ugebd244$OSEuCw^bA>e+*WX$a%+44H<Oe%=&O=|D*RqTAw_95ET
zl5>DZ#57dIEZQ+~rj4k-^6D0#iXv>;B!&@Imd1;Y)iCPSq?7>iaRSEo&J9<wa~7Tb
zHx6bug1yu1UMC~>PW{^cr?1ep)4+Ht-BB4$z<Lm!BpnblsUlSK{MpMEY@Kurk#b-b
zFOUZuQbNtj{_SEH5$IN=FUJZg_E2GVzs|rqA28_M>NdO5?s_gu;S?WiI^F8@!^0v_
z9gE$vjiu4;V)t{RHKNQhc>=)Ho@xGw#1hF-s_$4dZ$NtmYyv|C{>0|fIP52kB2@Jk
zWpP8SKkcxl_f$=oHoUWM@EYmT{5$M5>v1wLeuhOg+PnQ^Zmka-?KDnQRKNtDSTQSm
z(R7@yQ9@feC<L!ye!K*`c+_~ac(d(RLU)p)E=GVz9&K)mngXT@v4x1KSimDx>kL=_
z?bx~J?SQBDn!;qAv0zsd$gP3u^$jVxZ;DuB82r^jV?RwnLcebU|EYDx)$q3Om%=y`
z?$vD9<L~m(N1}4V>}Cyx;O+J-J)G5a>t!QLO<nMf+45IU=uA_RHe`D7aL>a8$^HfG
zr!i|dw=Wo9+~8JDI^R3~Z4*Dfp}Gh$>y4PUve$NviP@~0T1vZuBEir)K6MM1NN?Wf
z#Z_PV!Kx8N4u|SCSMNk)h9^6zARm*3oU>D-Z5GY&$k(NOzKI>vG7WwRivw`jybZ+M
z=wqrP8Ao2n(|k(<Tl3dFU-yB^I&-|gHt1b8cRua!W>pc>Cdc)pRp@=L{%`)B1+dO`
zoisVqkHv)i3DZ+J{4!D>w&yqnelu`*J4i(+idaYhUK&f|+2>uSD{>{Ky0v>`Z>OMz
zqTrn(#2<AHgO1)C89cG{3$e>#(vNtg&YHA&tXBjTA|b8^dv4l^p@l`e15-;+s`7g8
z;P;l?YpOz-y}2q4Z1$$~izR~y4a#P!KZ%eg)_ZnRsQF@D2Ri0{0Nbp!v5FPku2-<v
zG?qEvD%!bLXsX;bV|$9%QQjl<?p#=EX@kvh`XDCRp>1lbEPHA&StCbD3>5;{KdOfJ
zSmLhAgXo455lh9@b^100J8oydn4dHaeb|Dn{gZ&8;QQD4ilpcq8!D7Y904|v0u>Zs
zl6xFRI<^JjoW`4sFKJCj-W>REKVSuiE*Go;^I1)%%3e-2Y;XCyD%t@?1cR*p!WW2g
z9obx8Wc<O3Qndo4yiSKz>|zE&UiZb~(MlDY^+sH1<EVCQQ9*I$gm8(e#AtDTve0}5
ziQ_?2n550Y6#7mUn{IaLA=S-{<5aTwTFlpMbZ*&63-&1XIt^__1JA_o-%L8`Nm27l
zw@-Q#ZyMbS1V`O=wCxwnQeca=95n`-{MAM)bb|1P<-rD!!IFNl^`EO_aMk)n=bYBn
zhVCqTc$_F=CSh`OQazOJ`RN}2QUTYk<Fy{^gV)g(#d}p>F4uZNTM3<-d7TQX(ClKp
zI&J$-_3`UpFGnmDXOj8m&0$rv1CWaTx3hla;aTJc9zC8@bWf^0N&T^Z-IlEc!EcSZ
zvmmYz?MfFCSRNrQ@_Lra^(l%_xOyOlGulqN%;$Jmd1bQgRoPOUk!a^Y!Dp)1h@-d@
z_16i{rzrKF&9YqH%=l%8d%E^aa0EH{_w_pt>+C&@(}-o0n694C-p`3l544AI0VOZ~
zU^I*SOy!0e?68w@8EjeAdG)ZdWHK=7dxD*nQyc5%@8~{}7LJ9qCBQ@V%r==~S&c&~
zT2)-YPmkNuIo4m3>=pP6FCO5?hhXmkj{J`X#XRj~b)fmNT!vUb9Ruk2spV+JXS`XV
zV<vzy#s>%NE#ys-=C3^r=50$r4O||drEn6I=@zeBN{5SuI~`O6tBZgjIVzrFOacyv
zdB^!YOSNG3QqjK;fvE=FI5_s`DJW8Uo$b3vkPdw;9`AACvcvvNTkd+Bh1wlz&q=Uv
z@)K?c!b-y$zKX5)JI2p^CYrV7E8ltjlO3|KyFhxYHL|V(8y$WfL(R8r_{8ScIM0Md
z`>+lm?p9g8A=PERz__o}3`lKzKq(;l`xo|OI7v#j&vV={-h<}N6V*EF=S6|&4hIe;
zyeHlK2(*q46c5RV&7j$6<?<L~hWL{ke5wj*%2tqAZyxJt&o%)iS_D$a5B&$!S37Sk
zmCZm;JHu52AgGq`Ne26qN&LQtATo^42hiNk(GL&ys<yV>yU=qfZ|iqovOV&^n`H=~
z-g56w#M0ic-%u28ldz^J7hQdbV~&%y1pfByh|#6$Wij=44mON5ZY>6HAOVIS6Zlff
zQ$Zwzc5sO`R6;$-Ja8cHk1=<+2H#vPrwKusA8(`Z)M&q0u*Xxq3)+nd<ygMyfml=D
z_)BG-gob7V;cwDu6rk}bcW|@e0CC~Scwcn>4WQ`yLr9~d{o?A)eq2l^h@bKDa3aRI
zGX&8{J%SdH3(l{ZBkX)MKY|)Yw~o;z*M_@!%K~a4uW8-u9GnijII|W_K1bPUbxhqN
zqEHa~?VHxZYiG}5^pRc`#Hr?L#*I8(3-_kC0Q$P9G%Cg^lAq&3_jrheUS#v>rmD;J
zcgH5;I~Lqi{L=@g#H$h~FNmxXqRa@&%((}02D)pq=W>_613>^=2Y~rffd;Xa%`dU4
z6*iPp+4&V+6NpMe7wuv1@lNP#aZdxkN~w(@Ej&)lT?c65bRB?3)NCr50}hyqD}f2S
z(>1+51}^8SZ}tbWkTJ5b&o{h#Dy*PcaQ=E?MpFrmb8Vf%cPh3=N^GHhae7W!Gx&SX
zgLG)nMZa#JX@G_Eyn?elvhR58*;O@n4sC?z`%8&D?$euRq#g6tjV`=-l8AxZ#D-b@
zo6`<`&hxr6=2aKIx$w4;ESR4ocJgP2SZERnyu5R%^zOCg9Y73IQ$BFjk&o5>Ci#ec
zRx%Bh#?xNhn31(D3_$NHl%Ed?MLrsry1Nq-c*crbJtdwuOytPii~d#^CwTnAQ7<u;
za}r0`<HUsUpis~0I6#)->j}B~4>rr1YaytYri|&45#!;%d6|g`tvs;cLF2*0x}$6z
z2>*$f`o&PgjnnpQRl%B?s*ardZY^?)-~c!j?Y=+WU9b|A?XSupj@1AA$O7ek-evcy
zd27w#7y__^iSd&PZMuo@x0=9>qR@I&p`q#I^AJNkt%l?isVJNEt4Lv>CGw`H=P`>M
zEvIu7W$sSTpm+761OE0nSloW+;2w#X1UpoU7wl$CuJE*dDD8t^M&-i~LF2_(thHT$
z$2^qQ?VG>eKH#mCPKBfV?ySWe_GbO|lRVkfqjRkJul@&RwPf=*@V^|MzovSFaAo{)
zKI?Giz7UODd1VT(et!srW{lyoWI+?{`z8b#hyK7WX2zU)rRyQ#E)OssV{CbH^85K3
zC>;#DB$_o%jfNJ+^|QHD{mR=m)fwhVZgEqsDEj`a(3~VN6P?A==)XafQOwCGI?0aL
zkf?g2j8O(=oiSu0>CUm&d^h~w1)CPNmwwk<pqaDyQIZ{VxUFx(P6K>6LY%lAe922v
zgQ^RvoXJj{PCZC*<y=TtG@N>4sIg!*XAGtU@(1q|dTvhk#`ZI|oEITTpbR|lx+H$h
z29_$C`>K_bOpZo@joSg;EX?C*EQ7{iP?c*B=&xoyZx)>@OB&Dp&)Bu~AlR!CnBc1l
z-{lRf<!K^(;s+QVLE@uZTDBQKbss*Y|LZ5tJb*g{I=Yr}uOjKC#B&ML|3uqcpnFM(
z`9qu;WAh;X_g}n7&%=6Ynk3{(Z^2frnL+oD^$5x9k>-aiDnKL=V(zmn#W^0+GrXvv
z2iH2x%$F(+IBAW1kOgY{@kpL;%|}km>qGFkw;Gj~QwHz~<WU=?>{jQDS+e3iK6!T+
zr3A{9@JSBXgUE<Hcu0pyeWy<o5>f|R@-*px1p5}&f!m<X{_f>3X7OeTvqDkfLVjKe
zUiuzVDf(g*c?{^stpSf4c0*PhAKk5X;U9o`DEm07^)v7y`XB${Cx&l`00fOjMy!d+
zq-o+eOks8mwsC0_*t9s)0lc6Hk#;l{mKkeVp&{=x`vA2!Wngi%f@I$-qY-lWgMh@G
zFG;se4T>KAZF9II;O}FZzCRElz=0t6S<G>FLL}^Df7^Xt9L`C+UTWC>2v}aMj}J}@
ze|%$P1@?A#==%57xcT`x3wwvdFXo!!X#ynTaLz$Di*4Oxmz6Syc`g~j@)myTyYo3{
zr9+R(_HeqWqoxH@zWGG&d7F0y@KF7k0$*mjp`uN~Nka-AHS5^kZ|cgkHjRuWZhIj>
zV6)TR4Mn0A;dyudz~t30GF3~>r<(k99;H8|Q@DS|YG~}F9^qqRFr;1FAjh?Zz$>Jy
zd`l;GUD|bNu^_4jZB(gL|CN+@4tKd3xqp+*{xoPZ@mNPGu+jA;u?G5t68)m;_1%l3
ztU0PfHUigfGMcX{K>SFlJWsoJz8Ij5r{rySs|-Nw&8imsd?H8hgvF{93z8E5hW+(<
zUrmwuHx<06WL^-&%&*R{+ICXU0kZQUso>4s$jr@(Au`jGC(gh^*@>rRl=H@DsHx~F
z5OCbd=>=_Zd48udI6J~>r504f@y2*aPyFKHa7Fhp13j?FB*ZquNgY1}e%6SMAz;|<
zVT81AK1k8y5Wju^Y+0-ag6W^B;qzP$^R_aAgmCxgCd(TJqk-Hq+5xSNw||96uBo&o
zei4hiL#}7FEwaKK0E`Lnk8Kpj=c)ESV3z;=AzT#o@hkH10cHbn_wGfnneUlH|D#6Y
zunS?ADwm^=R(=xnQG*|&&<~SY<zWml>we<8cSEC^lwP2~x~7m*HDS!f$P1RAWp|aE
zKmjj*RTGC<=|QgZDY7AvZ(bGWcTKmueM?S*0#&}%SnT$;CC4%g*}hde>Kk^Kp_I=D
zFjh7G?_8YSx;{mRFUY3xyfMr1Vm)ljner@0(alj4xh)VHMI?%9A3Hsk<9rH^@B^wX
zJrZb`42rG|_R3B83`m@AqmKNr1TT9HD1a6IA)Ze1ZY%x|=V^as<GjQW=8OBSe94eD
zmSou>DW#X1XO)!c6L2g^Wi6g&K{9+JJQP3u+rzIxPH|1IdSnSJdEF!~E^cf&02Spl
zzlAoBi4j&&S9b>|S1DQq>y`iGytZj!;c-7VKJCdtTk2yCsal+({Ev8*=ox3HiHGOd
zIs>M^g+3dR2L6Grf=5rl#Z_dE=1VEPeQfO74OUw!0RCmLS-WA71|ZBM<(;-7Dlc&`
zF`r?$A>(Xie~er;S)E88`gv=kAcvM$T@<YC!9Ntunhn~6IgB0wtyo|Iy4J#h_X@Ko
z_)2eaIpu@+;XBCRv4*2EOrxw{hL60`aH6Z;<h*f=!A~@?R3>8<!60DA$CDU1Y-Yd&
zwv<$mxcW`l*QVIlMg3>nr61KY!#U;1&@Xr?eIH=}OZ8Fu!72ND2OJz=DKRm{?O*=z
zrx&MB2TmnR<x0ff$Cp1)vE7zzGxC{@u~rkAf0;raT*GiR#C{TDKJk69Dev_|`n`BF
zmRHSns@(V`Ch${mF#ju8{)a>*;?2@&mRT`*exuzzl(%0?zvYZpmW1`S5(Y|2N;ZZv
z(f)V<{1-n<i!0U@nVY9E!EaOSl~0ebG*IjKEH57b-yRbq&5WVhTjTyPNk8CWF~cEw
zNc;&OI1NF0Z@yQ)p#OoI#D7!f`}4=S_J^3z3=A)6%;AHPXTT5c<_FrzD`|?OM-QQx
zEBo+8))p+_uCc-qm$c&Z{ktC|zJq||WjIph7Zjx@Bv>lYBK#af<+a~FJ79bEl2Alb
zxbS@}eHnHuhxY4v51#H;n#(kpOX`L=`n46Bc)iK=>b>J9qdaVNJd{=^c?la_8R=JK
zP_h04bO;?>CEARy=*mQ9BKbE^`uKbG4H>^K=|t3io<EaJP8%=|TcgGugVrLH4k;|y
zuUIuiNN7cV(ltuMCE;Tvubtey&hw|pIs=TLCEW%htDM)O*NtHhuGK~EWV_VhZ`C~{
zfawDdP#J1BUX|V-;z0W-mbD)Qz~Z}L0(I+WZpz0W7t#5ue<MFMH;PuiX3NYEW7E=)
z<+ze-wycy=FZAeimvyv$LS!Bg<MfaUSd~AF^dX{g#yzR<(Vy2sMW2AKXx68`UaYB<
z%+5SWfzh7@_yWfP4>q;#>ngBszQ6qYM-cv+R@R!>b|ZY0%cb5YKsM8th5m~?uy@E+
zA@rOBG!IX!*Y(>53Ovk91`5QKDd~wZz4|?edhJgoEf!B2)o$bWIeN8c-K#X^h*a<n
zA7Li&W5hc=-ccB+?^Lcc`an;2$En`be+1G%JzTb5MgA~&e^|lOj!<h1)Uuv#X0Q^@
z&CP$wyqm!ky8)3c%Nw=Ir;HvpX?yGF%pB&ajj!TE>FIU9#d^fWf8Qi*uc=jh|7>;Z
z8^WotZ4~82Xom|d*)QS;qH-z_h7xi5D;%7GJav)r_Z^ZQRkUN$Kmf}GHI0bc@f?oq
zum`a?94h7*^y?W2V-wn8Ak%F~`LJ?|hs*^7Bg-2&6?x-4y||bOgb#<~v)gD{A9;D4
zA!{Z>Nr?VEZ0mi*ynq}fzTv-ndl5}v!PNZvSLjch7Z{;=&NVr&KyuWnWFE(*nT``$
zfJQQU)Z-0-^kdP69TrSV%HLMa4;})m|112*yL0w`L$ih!ei=}Ym;WDYZy8i)(5#EX
z!WQoC76_W4!50?X-2;JO!QI_mf_rcc!QCN1a0~9i-Tl1e+ox{b`{P!feRj>CNmW=i
z@66LZPs?<7^WNnQ(QU07A~??VCoiN~82Rb^M<upn*cO>G)X`tc#PLXc7_aeEBi?`m
zg^70xJK((~3$N?x?-F|dWOxK2Rers|!>p)&xw4B;)O3{bsE|Cu-FvWG(9%omf{m}a
zBdhETBV0EmC~De_JVVJ%dcm;a$bN@U`rC6G*f5pZ2L}o%2zVMM)ZCDqFpOXFrc~qj
zsU7~K97+{b^Z67&QUE|@VxJ>U&jwj{AMsD+!n$zn9{htf#f2$>dX_YvZsKrt=5s4V
z5lPQ=jdrr<`LILF!i3WM0tJLg)qa5bhXT_OLmM78;SA#(RaKOPdGXH-;OpKb9$xz|
z!T1>g>Z?4(62T1yG=dJD@OPS#EIdZGzllYuaAcxOl(T~?5Q`Q8`toLL8rMF}6Lx$x
z-XNqv6;wN?Txykw3(m)YbV$g&YMNEB@8}k>VJ|vtD<-|zON7T0!C7Am89ILiwgOPS
zd9R16D)a^i)JaV{e>6qLuuxkNK3nn4s1vu=bI%~jA99AKgQ01-PHpq!AL69MbIQwc
z>#TK5Ogg^Y*_UcHbEqZqM<%ni+k!B5CA%VD3%P8F0?JpA2@@ND=sc!v0gu~Swq#~k
zxmkMJcZbSOQIjg-TPP4fjh@N4^Fq<VuE6YX6sm4GIsm+lGVCodc#9Z%&YLx?pP#&!
zU(q)R6;>J<T7wsx-3!ypG>5%lre1O35RCKlWxi=p<>ljJ6c}o?{M@hg<x@IUzYJn;
zWyMbh9@$0IQrPlb8k5OY@g3$RznFPJhOz}EHxrZZiicPxH6;8f)ScX+d?oN5J^z7X
zi0|m1Idu({tN0F8%1KWV!CM$Y0|I8<r}S2?021I>#5?m%hj9eh?-m>PbkaY1r@n_4
zV4O|z^Mv+$r1&(Mu}>?bD#EYyHJ79Juc=q=&(a~_i^Cue1aJftiUhE1|L*Dh9XY!j
zpWms<;LV0hfUwvQ7|2xN(iHWk9^r0^+FPLWz=0-SiHyuS*9-PD)<vh8Q;;Hrq6BO_
zNqCAcRUxy*=LY5wf04;e?6{)s9RoudtTXnF&OM8_Z@O57j+ARikvm&tBYiOL%2hT;
zG0xTG8cr?=)AMR$?4oC;P%~G-s>Wlv{SOLpp`V5jWC)x~7R-j&SbDc#+3~KV1+qxH
zALNVz%3Yn`$u9%SPZ^-|4i?jXc^x?DYB^WQL(Ue_`f+Ih31JAD4QAuw1nw?5Js8Q3
zL_nV~7A(knYfb1U7=+M6V}K(7Euz`GMh+<C9{?N!#ZjL9Af8|jlNZM6X0}PCqXLLM
zhNOgHX2?@K6OmDyimVh=&vF?;BAXztG<|)Zlcgm`iGI5*V&ANiD2z(DGRMlc^+aA!
zRSpwys@W8r3kVAml#2-2wwpa@Uu#OV+A}OP31)-X2X}6ZVpy5R4Yv#2n@kRbcFA|i
zgAU2v7dK67J2tF+Dzv}7(qIkuB!&CFOXV2yOQsozaf9%djvR0Ms_Z1@VH7fp)Q#Mv
z60|j4si{3t!P~O)daL4}PQ+!Kej(i?0^)w`J`+0*2N$XQA4@xST71&aG>V_~{hraX
zT2rfd+^+ytlUkeE;oH9Ran+%3tgJ2Vl5h10e^a#7XG=R9yjuJ8_U)}{WdR>h)?@!=
z_h$EI4JM71d<$q`CvFgE1Dy$QR&ibxrYD8_+&@9bFY%RsB(rUN10M5h5vHt5uc1+^
zN4@B4^iRn!vwxl=SyWV-ZXq(H?{CX|`&4f67Zug|!D9q%Cs9Q6B#H|e=kXuV!%3hM
zN=zwxw)fpv?-$bEd|&)~yFoXtv~^150ca*141l|X{G;*#y743M_^L+?54`{ldq#ti
zY{)~8sp?Tpt03)rSx*_81Oj?cFcR#BaObxHh))cHZZ8NH1<*z)kW=kxz^ue`x}tD^
zP_P0Xu^l*dF{IaOp-{V#@bF}Q5I;=%{^vQ>gWr-Gob93Zj^LsnjBC%5(iHWby`aHw
zU=Xv8vPn8u(npfFb^%zS6>1BQfAp*UU;6r@j6%~jV(8Uf2JycF>c$s9&!><2ku05*
zs}^N5SM9@zAK3-}j8FHQc&;;reUk9f%ly{kUXV)y4<K+7P)_BS`y{mRAh|FoGkKM~
zm|8!G;j5*`v?5ti3rrY~?iIB60QjnZ{>6&%3%Ktemfnk@06TL_4aK_|gRbib5yX^K
zeHo_12qgy7koe&-R-ALwhS7sUl!;o4#G3siko=YwU<|P5rS<CcDl3bC67?yc{?S4R
z1tIu{`pH5XQK?Gz4^-4EhN-3~1iO%d+xST5KwXfZ5d>Hufd#Z16sRD;cbr5}(RexD
zi1aDxoLfMs@4{XXDu}0f8u2Ry2C%T3-9MBx|0GNYkg$%on1GceeHq7vVMYX-@su?;
zInVL*sBqn)Q{1Ng8%Cwh-+&@k6*j{$_}ko{w1H`dsVU-eZrVB%%2i<u`s-(nua{7F
zZ&~hjORoT62^SMT_69?S)hmk2TXpp)wLUV>2(f>(H~IWEjDqTQ=b<pbQBVfk!@oU6
zf&L#CK32?}92VNBq*~apowt*)In+`ViuqvQEL`(G3LQvJDiu`Plq@4&9|*(((5V(*
ze+3AI0x;V~)D%m{haK0y05MX*fyAQ#jiIE0&V~S+1_#jHkvt-$&_Jr#%jaapKXFzR
z7<?e0gtn)P7cvh|-q!=Y$%I$BQ3Qv+mH-$MkO#=aS_0Z6*|^ZS5COC~dd|PG_Y8Fp
z21d#;Isy4R!B3u&Hwcmcruh#r{r{$uPtcqHrhCu6XRp%`N1x8y*Qsc;&?nE=DdqCN
zzwNw@{r~)ow52CdzHIN}Kldbn6)5Qc><|>_|L`AJVXx0j&?0*Ob1VG^HUG`u^An?j
zLah!f=Q1Yx?=R>-D}Z1C-zN;>0xtFc!w>p@e*uIFQ_?)tYQo>F4~gneC-f226O`ls
z+@LUY1d?yC-ws5|!a)BwPvCzq7z}zQGLkZnrX?S#wnY#$BVVBteg)O*XqA`t6ZHMB
z(U_eN>-GN(M?UlDfB5+?fPM1(l@CKe{$9|?^Y<Y>n|_YZe+F3Koz*zPe?|h!FTP!v
ze<NTVW(wX*lEe$xa5a;6|5v;H&rA@9n1||_27%dh>J!D^20M8s1M-4_!7mH&F!GO`
zU-8eQul-)fGv#GxtuQ&{-;iylIQft0<e-b7%MxEg{~KNT$meMHQ2z$SfA7Di#R_s*
zgj(hP{8TU7+9CrBgTLng404C&h58>Fin5LrDxysLMJf9Tm!KoeBTP@2U8w(|0m0)1
zWNJLJtQICf*;m;(7iX7lmo5i;JRj|UVEKx@jyXyc>NA+H-rxVrqnD%r0oN&CS#aP#
zt_SshB@ba@uX3ejH8|p^Ri@ti!hF|ZB4g3@!mLfx0Fg_)z-3e)4-ba7SbJ&aEme8>
zN(XchY7pU*ly>S%Q)oMy<*wJMPcRDf*5WeLET1WCh@zRSQzl%E*H<9$F*>TRmI%Ja
z<;xF?QMAF9+9nQk>0F{a8^MHw0%>86o8w*7$Tq}t%t2=-)`epq2-~Dfkt#HK8IfiE
zd1GdxYZD@sAJ;vVOZujT^bPZkdk6HBy!O$yP=^`$tMloVzCwy<rIwPzlqHylhnRSR
z*i33N{M)_^#0h_)M9K%lz)BNCCoL+0|NP{W_BIvwYO8zmC+F*{;R#s2W}#NRhca(W
zzR>8XsVlpQH}z>I$#x;@Dv}vnT3VD;HZNc$GTWYOC5ZC<LQ)!Zhb%JBmyT)M)<%_M
z;07T~t0<|8){MX|Xw+0J{DKor4@Dsb0Y1`kSg`LGPUu}pHVlwiy5A@NB7SOL=M+<4
zOs^U-sHZ|Lb<3|oA`hXc(qgc%(nNknMYM*DA-E28%4|p`+xrHjwE=mRKfv8W08*4N
z*F+I!{qD4Bd%kbE-jcpjoo>o;Akxd}XulJHO0r>zz^t95ByLFyE(<htQZX=)sFOBR
zLFwoT6a{R$Z@9jME?nEV@{xqAY1=dVG)URJ<_q3Y&Y#pUy@@cvv(Cw7^_H0h7L(VD
zc_zr>J=y`mxW!lSmc%)haHVKt#)=AA<DHc7u;cAUP}Qm8nB{W5HfCRDqBo%YdZ{oX
zzxZX#eTAd@u-Ucnrhf`n!;b1_v~x<Rg~*!-6zI!zs<K$BVYCH_I5qH37+9=u$UALi
zl8Zk-9+oSH7!$i$uBu=Sov7^*%bS#}o#Jeoh4}v|_il>LOI2f+4;gPedRF%}->DCt
zP0#%FRQ0siGTftn<gR$cIb|hz24dl}&(?_FxeFs)*5WKZ)>PELSuHLUm5YJ#P-xMe
z?%v~mtEdPyvE9agGb59%+(xA7P%&1#?iTOo9GiV_Enn?krziM!Ms*W28&7=E>R$ct
zJQt4MrkjXLEqbI)>QQ%D*1Kn8qafCGOvnRLjFtoX`s^DEoUvhU+Fv|BL}JiAu|LB7
z6&z{X%k_j%V1cYTB6jv#q0qd!u=2q;*dS{w>`imoHLA2uaATcl#783m`gg&nn(pAn
zE8_8!NlOHM+K&&XBJit#5e^RUC1y6?fBO6GV#l5qc6g{+JL%heA07|fGn5t_F&+?=
zp-_Z^O(|p(h=&1Z&>(Ns__r*irM=N1k7Rhk4kqKC@s`WI35nG|8`97QRhM|PVC_yG
zoMkO2!I2p*N|+EAC@Gn%8B?RYNg2io54z=~W2hTWR=N6V!eE}{il6ZEtT$hXy5QG|
z%7+0uwsL7gN`JX7y+I%U0hv)#R9LYJs8MRX_N!kvI6A%xJR2bAY=jqwI%1?(F4!Dv
zlY6&HQTPtvR`6ZKuUx_#d^=U%J<d2vZkA-g{H-wEXVF*|X-aT{OQz;Ys-$hv&~PDp
z3+6~M);ALtw)G)utNq;*!qdl778c^8?~VH~P0%1I@y^U79Pc)R)sBnw>>qi=?N>_p
zffW@c@_HK4ixvqBC~-Cv<K-Bini+<U8b1MVeZCvJX-cJ#d&&4I5<Clj!+W7>%h^QV
zFLGUsP!auFS~y8GcWO=fNyZT-rrfo*(n6+!fq}{AxACm%LHcAAR5t?{bnmNOB%jP=
z@N-(a0plo@(=v|~CqFISgi7Bk89Dvr8ktCaNp9#Xu_wbkZ`W+fk!L-6ZPc1oPdQzr
zP*-)p*dg%j%w(W=+Ox4P%rhDxvZ^<xI(J%|cnBHRUZOK!Yt7VQ0Ox&gfbTq4YDn^#
zyz;L(zJ3*9f_fc39M$ugXBzKXQDKntB!=w)_uVlome9T2Sp!~e%tjUU76zCG8k$?X
z`!4AWGBmDw!mLxT%FSIz*<P23n&>1I)d>%Tdo?k~_ZW8KY~legP9zZ#Q8^Pgt^jUp
zY&#ah7q_*KF#PcmA%&FcrPy2;p~1fGP(MBQuylDaQ2RAS_X0{-aEL9bJ{p@Lz*D$J
z1wt)Y)BKU9!dUpoR!Vr480ju;!7|YvukCO*%)KD?U(VIu7$`IK#}ul5R}9EvB!Wb5
zJTb^Dq-i~5ya0$r%9+o4j4OZlf)z)41_;=xXwF-+Faz)2sJiZYz~97p7Vwir82%M9
zQh+kAD3ASSQm(vUlo0E&g$V|nmr+DUI`oJ;xcfBd1|?a_UQ8#2s4i<gx&`wr4B8sX
zP0hi+sDXye1mS;+%FER(*mCSu%Tz1pn5ssLg-XVBAGjBUCsaLZeudT?F+@!bt7ue9
zdT<`;F4zD@Xn3%icB5Y~uFr*CeH4z~aKZD_E%|ue?on4o)^Bgdlcrhn{kQG{w45{x
z8p@U|K6lRbVHTzO^-MMwI;W_2WfHw8u+nhQbR+iJMLR>}Qm&^`1(T&4Z;NWI3I|ly
z7yFW~X-^7Cd)x9j|E`}+YhOgr>hPgVwlB?A6=d$Ocg=BjT&tAQ4$ayuEeKVG47yZb
zJ+E)0-DkF{2Vcjv@`^_LLEZzdYuZt_ud!#;^ge$%pHtSI1ktn&BdYr-6aXFpD-OYr
ztWY}VuS?@sP#M?AM5Fflg^;#s6Tg7K(F<Q7a=H`d>vUf#o!PDoPglinXrYYY75~#y
z%3D4uhm^w{mwT~y!a3b)=CAI%+NcalCP~=hBL7a^pJ6#(-@eXx;E`B$V-tONRX%~h
zwT5e0Kp}$%Tx(|FK3}K>!}rsm^H>hpahrJc&p{)s3lfHBA1xp`O;n0t?RZo^yxx*>
zK*)xMnX6*uegzXO0g6r%1Zr0Ns%OQl#;RpOsxKq55+^~SSPnKe3;mXm^FxKm!7o4v
zP5KC{?r3~vvfY?1gNpEY=5{@c*H4e$(->o$tIcu3$SLKsct7H4@e%2fuR?GmaqY#@
zqMKXLB&6cG$%{p&HHB!Om?;gru5Eu^JE<<8>qxj~N!tc%p>l-_GB;VL`PC`pj82dH
zUZr{_Aq#jfB>g<z{yR;kjjrH%$st?kVQLZfHkhNkVCfA3T%wRmR)(7yD~#v&&9W(`
z)0#cJU@qJ?x%c6AYei#q@3Qi&kU(~|74J5~<f$jn3h*}eHVyYFGwt_F#*d)(_%MG3
z3*ARyv$_oj>y$Kp_mYgTT_{j~8C5P?ReUboX-nW@IjE&Mc4PWXX*D_W*M<p2XSVd)
zOz0Icd7n?S6JPdPbbVHBdtt+;+SN(3j{Dqzdw`1p(!GCh;I(JO)r{!!Vh4B2VdI%Y
zsZK6+N<!o}RKM?DGbC*mj2fjo1#7lkAMQ#~QK3G!QUcAv65x!1A0Ik^3|*_oYJ5s+
zMNMc0^*<!s6b7}utRqRxIt+%Ibz{q=vWTHGn8-cd|2S$IHAv+1!NLBw!auar<KyEb
z5n*i5ey!BwMnKB`mHI{8%~l*F9`jRwP1GdXaQ`$~`j$QCPU}IDbkbYqYCDuHGlY?*
zJ{*Plap#C4mT+b|GvYpV>f<|Mfu>FWsxu1TYh3i`k+*oYVSiQA>5(zao?nUB3$MHd
z;sjTMw!;YHs#(ZuXeX_k!q;1cAR{3SX+c8S673Ei)E5L11oRT3)5s5u;44uiYe2R*
z@L?xKs-2|iolBe&tR3DG4?)8s1p#ew{@^hP=&|6PbW(eG6q`*2GiZzQea+>y)ZP2F
zrd89LW|35#^k?awZ$Vg>Gr;vHW$e5&kJ#mPM14By*;ZpqL)7jOj1{$zQ?{1E!~^RN
z##LfApjpe!45TWW9=8|g-z1d<{v5NJY#Pj0z_rr;e4GFeeie2g=>cen*3e`;`JLht
z#Z&n=u4?xL&mzFQu&j~fv>i?PaEJ(_1nq?()akXnajt$Cw$}jB0Ci=h7>^5Lsi^&;
z$Dp@>&8VfhdHT}v)INJuTCC>A!_kB16ao1QXy;I3=-ir@u@#3-86`deX&-c0SlnI^
zQl1g(pH7jJHkX1Mw8<6@Xv{r|HvBzO9AQ;OMI{XJOV(@o6VKJ(E9tr{4IT|G4L6M*
ztanex@ym&FZxW2zQh)2VJ0gx|C)F9XtfD{c7hf!{SKU9T^f2nL7jX98S8Illh)_V+
z_2`Fa8`U{$hWNJh58lnLyyRM3)fCfmDHoklD1-MOohftd=2-HT4S1u7&n9-7vp2qH
zZ`36bb!^n_<Z0MMVNV29uxN=wL_0meyF9}lDf?J$e!l&3HfzN)VJILXbn1ZY(M(>-
zoB_H0Lzk9{*;_+=W!}tSpw$sQ*i|4|(~HroKQa~#*D;RIVLwof?MWZ_F^DLIxCq62
z8TIda$&&NSZq2)euYcmJ2hIup)AAg%of;J5_aX|%yFn;J?ZvyHHBjV!tDF6X*?1`4
zY%TST;1OEGAE^Q49iTSu+Wz)%<-pCAIVV}Kd{tp|+PmW{iKVv4M#fp%ukF?H^SarS
zRL5VY9W=v5i26~d+(w|icdwY6%`ksve~mUEx^aIBvli;J-230(+>h8S;B^;|xa^x<
zFDjHT7vczGkw;N<BM47$nf>}<I24@@>QDj)zJf;WnS}{?<2)s;lKmsV(|FOx>4#I*
zXh}>iAuu}W2Kf=SdDgTmfuY3ip&guGj$J@qL(NN*JfVU6Qm<OWVr6+h`eM!`A}1^d
ztO&$+2kSGr2i#b?U9Mp><1dX_e7-aD$)bSBFvO3jquBzV%|cO?NJ$GQbAS=MLD89v
zUTnBCmJu|J&k8qI!}3?-FLm=g`JdDdr@Kk_;)el;`%V^b!29>sT3R*>enO6^Ij*3t
z=M8#m+cQ#`Mv)GUV|s7Jl<OLvJ#V%S*lfuOxhXMQVe_NsW%Y5<?QW54ML~a+>rvD0
zjLxRm<)<>4S&VUvQ!<eI=s8(ovzQG<j@=aThka$L0N?(eUu#7UMe^WXy9C~cW$Q9d
z?>|9_@<qT(F_1v|BeY*u8_6oBzld1YZPoJo69!)Lp+ckjO@sU{2^CeG-Lnf19n7Hb
z8MOUp<zLak4+{eFo$Ql#XU7D=X0Er^Xv4R$ln$VLxnz0l9F)Wl7k6(4w`G#oy7y}O
zM{KSAu|3C%&wRTIpN#!|BU^SbT{71g)#9csm*fi3WctU78!2zNH3A-lrfc+933w;Y
zw!J406dXTgq{+<OeoOOMZ9R&_)`<Np030?S-vRXUJCkHY^A!&Flb*Hl_SZvC1P&eV
zXv(}wbac;Ce2-JW(pUb)4Gi5c*OuiDR@F=V41Py;PO|sKo915rB7h`7-!$|y__T52
z!iB`e2&b&_j5@q?M%)sdPX#{J#oBXY_meF+;aE-z$B^Pyd;Ml6*jtbY$6p<%=b5pt
zbGvi5xL}3HP6^9URKB`h*e@8r5^0fjv;Vq-O|sT_Yb!2%jETFt_iil_$X9Z7+w5@x
zF*KPFT{p1g??g@Ozc41<A#!=zRNmBIBPq3`7PJ+;QSrRQo?#=~A&4>{>L36`b`a4K
zP@VA<KGn@#nPwyzQiV8qQs~k51b3f-$OTOAJXrMae;aIeDoU4i^vn6Y0M!7m8h+!4
zZ(p19U*4!Q-C)ls&#^l1VhLDZHX4FcqGY1TQAh=BQrCf+J4Av+g1K{bwdPa8!Lo=L
zdu}z64mfWLbP2JrBj-%zGv9eG<L5qz^hoqb3~%RuZOT8WQh=eskvZ;8t%3MgFPH<_
z!GXb@PV+Xc2QRxrsDsRTy2%QO8bX$?fn6bi<=h0nD}dU^xk?HH`ZC~mH38u7HFWaL
z{Vq`mb3gG_b{b%8Z#ohhZJTsDuxj>rm<kLPp{&<hzZADS`;oirN3eV;e%eZUo_@kv
z_70z$<n->d922ivVUy1gZtgnr<`$kpoj9P;`}wMue0}*%Cj|ATYCs&kwo#N6n}zxc
zRd%NN8)L(+uId*7%J1Lo7V`P|@>^d%9>Lm|P*?QFOizq8e<K1-1pD$Qi`lP~AN#PI
z3`T}GO`6HnO&mk?{-H`&n8GVKGM2>)zBSMmZZwPk=)Se5!ZT>`0{2P4<(!FV<paOe
z=yFgi!Z10Fd1xP2BhCA*1ZljJyHxDcn*9S;a#+>IQ->j6bi{<XO&zTzhNA&=Sgaaj
zP6nCZ?;17@HiaKAU8GA($X)i-i(9T3-|JvK(=9W}Nu5fKSe<PK^H=fc_*}K(d7-eK
z&^@!<B<~~iA9x$Nni&N7_Os$r-OtBhGc0#rp!9@htC2&-cu=U1EP;~|BL+S5MC@ug
z@3;1j{XKIZHEJ|ll>y({CCsU?WS%Kq1#DgkW*FvqHDH`>QjWzjtemm?_+>w}_lpKc
zU8^9&K5l*-TP-OV%dAz|48b<rt0e*vfz&Zh$7sLou*rtlS$nH{`FJi|?oo=0yx9y&
z68+R@X7KOo=tO{?#F9zIWXTXfNM;?<Hkxt!mQ85?SbopDf&h)n@>sr(J$5=lWR!54
zLK~>{tRWOKOHiH~!hhCRb+Ve1VOv3|4s6S{5C5F*+HuFPUruh+G!D+p7{p^AKB>9*
z5x-DcH|nllwSIxqJ6Rb9K(aFVw58{hUmMTiT~JFF)hZB)T@+_+>+zjSX$m#YC6GlJ
zSXd_>tm`Q6_dPA0)5)-SbWmivyMUZv$^k2!sPCE5x42y>C<v64n6T<;<X;3h7>SMv
zj32&GF~kBsI#BfAI%aR<hA<)A2BMwRfPN5p&}?}0zT>A`hp!-={a!iIX9jF~J_P*Z
zi}fUy$MLlJ+|IiG?>Xx+ouwg{-4jZYmP8-PiYLIbJ9!gpUPQSD25E0fzH2;RaYJZ5
z?Y^Kg8eO`hB8h;0fe)%<_)ukHzaiY^fdqNFccL(8Z;j<~pvvHJfR82<fS)q`?GGd(
z_qlC5p}~Oe&bNbhBJkdKcRb!Be_d|w0S}xTw60eYYpPc$BU(3h6@_^`1<RcR8L&-n
z-^^@Fp*F^0@p6*gzx^DHqS)dr2eXvSq8A9%-|JFaU^c_Qzz9WnY{r9lUe6chLY^P{
zi*CqoQP9X9C!ILYw<A~=C=1rbT90^isnbS_DPyH6V<-QX4}D{R)PJ3iTzNb%V_lz8
z5Q>=38cAktpKaKJH<s=h*$U2n&f>-xcilxLae7;V3<B;~d7lBQDydD0!?lpguwdUg
z49QWRfrzHS#q2kF+P_j#KJi-|{XoI}hh{S{tcdT<@`dSW_cxhj80xEpe^L(xbma*u
zdQfM${*W2X-7%TyzMhcbAB(cBd2=vR0mrPvfji?_;;Pl?epTukT?fUQX!<Pbr#Zz4
zt^4`lEL)f89$e3y*5R++_Jbun{hb{flR>+*TN(M0$lCUss2r)y`;X@@qWrGanuIM{
zRa(44$8S>a?fp8cEBCC13+rMjMcrZgb?T3N4SPQ7v%3yVg}~SaSXc}A+%4deRLwQ)
z-ZXY(8@W6+ak^M**4oxXeXJ6M`81Xl(_4eq%L2Or-BAg5St##@e9Wxbd3y<z5P{~j
z<aX4Ha{W#UD^FvNb-~H+`g}9dgOb#FyOrm5caZz&y66yS5fMEFT=n2!-;^4&Y%<&J
z>?!zB1#kB`a&no=!~Ux>3d+Ih?RKwhNCTNyW8V9nMXgo)twzj+220c%oJL|Un|bJJ
zZ_EW53gjh@S(RQ<{98hqgOcPQVRb*1*|L!MX_yy`I>rPryuE4MS!eHrmxzu$5d40c
zNDCin&#VLB^9xHT>~a}szo|U^Kra;u2#LYPO1QXwLVt{9G+r}EDG-t?aw9zaSB?@o
zh;e7c0EN$`oxHEAPk&;NXD75tEQ6b!|8T<er&JM2SSp28v!m_a23(`-IzK)R?#pq@
z3D?j_@)qCSuX<*k3>pPB^AlFpUy2mYpfkgZq><AGbs$Io-hi9SjUrZ1^rK|5AdD{X
z@Eo~VZ1m_^Gs{ObGiLYPO<?nR+w@ZJbl~xH`tCcbkf<nAfY!d?_r=Q^bP$oCAV=aE
zC1tvTLvDL!pCWW<Ly!4NPKLO@>a5!i>}tYh4l~fS;D_g)r;4GbzjqVT42o6tbJjQ|
z9mWrb-JSf_Ey>|VneHX|({KCzdkHWu)P6xs7%ff@E$<w6LnXsyINeN^ay~lvutOd4
zA6!M{;tFIxyiJ-T|7Q57XbkeFZKr1!T0HrX@D&IAmgNEdwGbv>J47bLFV3?tse;k8
z&6F$GBxvKRbThzVL%^rJ{SHY}cj1!*SOV#juto#zf+S=<kMI4;O2R&>+9mj|;Rt;;
z7r@O-0l~Z_R50Op4EM><-!w!LyT_2DYCjJ*K^6;_WJL(~-=L?6A+F?#L1-CsUwW5M
zb@4fFF8_@Br{GM}XJXL7Y<VD)7FLvW{C3q(6ULr9WPGERNwQfMo*j}b8LIUgm8mL;
z0?E{$U*6|nSltC+6-W!0V9`?h-zHh<2qX8y`@ehto*jkY9i;W~=tk(%VamkDoi-e}
z;e2Z_z(M58?cc@kws+@sbH!3gc0MA=jmDT7d=D6ndxaUnw0S4d-a8AWn^$uNF+-xq
ze%U^Exbhh}!%1g5llj6{3yAHU$A@7m^uMosD!09gujFqKc)fl+W_V`huVeF_HnBWJ
z0fB;AmJN!D_TT_L{&CsZwV?MaXhm)TSUHrl>-@1KuJ0Ueh3K_wL!oY4PTFF$HSs#V
zZtwzux*KoR%#AUD^j(ZOP<8oyC*{f{KmGxcuyQ!$P!wGNije&agqZ~B%&?Rpw%9k^
zif8qq*ZuBnTw!qVUF6ksc)qvet?Qhg3z4|z*<JErw_`NIBb6@=_gCOxk$MX;{+(ys
zZ%W=O9@xnu1@svH^Bl~(4)W-plj19_mP8moSFM3V5&i-o>r1~5=cmaCLt1tk3oFu+
zEagGTZZ8hOkBA~b-;1|vqcuA2VUc_|71xD`Z05FEOQY8M>pfN|wlg`N%t}GA=$C&E
zL-N2F-|UB>2&V5IbdC5Yn;4m8-;J<9&UfY<Tn*Ox#N)w&UdqYc0b3aky}DE!z0C;?
zlIfH%#*)9l8kM@i7pC7CX+Bsaa*L#C({p`F>4HHQ1V<5ZVX=l?@6XqSxXK?x0ELj_
zJVF#pZ5r*Xkj>`<jYiIk@`Qlqr&1)3&^w6U7v2FrTC9&Z2trXv`2gqq)n|-NZu28*
zj%?~iETe|CC{zYk7QY)(JI^^P%14=8`9SuF&&z4;OJFuy8iLgWp-=QA{I><$4a*;K
z#JVP;Nf$(pml_Df%k|sHzKo@sYAs!wC!8K`ejIi!17o3BkB{4gX~}Ce8Nn56*HLXX
zF{9^8piUl+W(goz&Q*j+B@|sS%De;<Tl==RwTMFFh>d13rz`e4-wom30-(z^c%eLf
zx)FliK3OQB#(8@#JMO{9%Imz3CiLvOB(JPtE=iFD`<a!3gvFpWfBQ-ISA^M}q|1R5
zf7i%3#(_oPo@@yb$QhP$uvGw)SDmGxuPkJ$PdZUF?<rjEA}Z)wyPNJ)fRWblIOd=q
zg7MEZF6*sl(FC(^WwS`ds?t5*ef!r%YZq^Z7^8CRdhYv8M^d^cp4-#UH{o2CYoi`k
zqaj~uwx?X;sb8Xxh@<56?AO&TI-|DsTg)mI04O>W1P{Is&YMRcRC-~_<bxE1Z%3BM
z;Sz++-fTj5fGK(<tNrCT`kNRqbjswZ=Ny|ehdCzp4Pa7F$E5Dg{IQ)E^N)G-8T9cg
z_1pHrZ%`!W8y>uPVn}B15^PQ$e)XVt-Ew;(aF=h(_6Xgrv2F^4v<3P|r`MDN74!oM
zZvqZm-mZ?`&$hUr)9d|gyj4wi&Ri?2LW?j(YrGTOp%ucrDB@U3TxSmXjCn18FjuDG
zBE$b}vBCCvF*u2aAsbF?%k{2>q<!{`2;EBnvyz<54c0u!&aW19LwUD;J|Oz&@5UZ*
zn!HFqmkpc8Wur|Ei}rleL7say%&dD7w1MgEzI6Lev>&-2cix5A=41NswtdRbSSBO>
zxE2CmmdD=w(M=Om!yTvhEyXULcU-r@jtiO(yLXz}3$q>@zID?)U8mFDIWE0gvwxS6
zVPlQWH=&iyqf?;8u70f$r9-@$7SOb!(?n9%w{~x`yC4F8Z6oMHnAS~6W1|6hyS_aB
zvq0h3+4nZ`u9X<UYp)30UvCX6^(%rYLyKC`Tr+r`kVyEPnbal-prJYu_Q@w(c@FCg
zB|Qq>=lR^OBcyPc=V4x#zD%E-*XVjL)S9o4oPEw2f4Z@+Em3gj`C&-yn`k$9$75HP
zB$sQQ32B0jX1}0Q$V7|4XXTFQ7SK?bme&2v5v`xa>jY24WsUUm{7_|{=133LZdOHf
zJqx0;eR&F^c>i7n(%k+8-&46v4%?bQ{(Hd`_vKP0C|7LI=ybOSohV#j%W=`U6+tu@
zCE0+`kmY5WG#&PcG?Bg+c|QV+*2`4N{wHA0LcR@cZ)*szcf8yo5OG?g6)B`6bMFi~
zFvjLs1G(Y9xBShlQ#d`mW2x%Jkxg?mhAQlp7uWGB7J4vooZk$bRu3J%$*SwsZ+9eQ
z$>6b6tM#s;j4h?ifiqHZx@oa#B^8#uDHt%7FYDRUw34%b&qrnT66{n4t8_Eiu8?aP
zvl53_av}429n;aqgnepVv!?0%NsU1)bvO9UWv3;*uSnmuq!ui}7)xYJt^Gr0)P6HJ
z`;ZMK0o(fQwjx*bUUY(Lj8JX$?%8@*=#%7hIwtxpPyyKb4^RN_m543lpMB)(MV9|_
z6bsO<KUT@|rsSYLB^a@n_O?hApO+_e)iR|y?=P8be_v@Z6QkcB%|kHX0dcAplR+gD
zj#va|I=78qfPpt|gj|?(rZSQBM>xs%%Efy8dQC={Ta6P%O{Qx(hW(VbksMt=iHOjd
zg|RW>h|J*VZe<YGX3Eq>qI8Nr4Nh(k8a2`6h*q8jka15OLD6k8<GINZ3FSqQH#?qC
zt_5Z%rKEs?E{GwK#ZHcW;WH(p&C>RxJo>+B1DO%EY6wI=o63vN1vUZv#C{v;cCRQ~
zgzCVmVHtj=R1G~fm`aKsD5sKV^Y;B$@k%@Yax=B<>H+eQi=EM)b}x_h^X=h5?eFQ<
zLx?IxvKStu&$p@UJF#f|2=g_j=oo)!gnyULSfpBnd)1k8)9Vz{;A74<V1<&7cW~o)
z>;?Hg()6an)g={5tm`?e4!ENd5hHcql0F0>Eh8kXxCf92JhpowbXB5X!?w9x7(LXZ
z#&Sg|6l;yx0A)n?mXLb0KKhNG<CfaL53cHt;&|{5@+443vs35-LF0M0Kc2s<wK{1)
z>4KZk{a|_=3H9N{H+d`i<(7KMKg}I^t7ACDg<b%$51_ng?N8VArUS#W$8biL>x8l#
z%pTPcrkMw(W2f5xqSKTZ5#hFem#!8DJzXqhG{!Q`N4O?=90VqxZ{%7@<uBm3nO6SP
zES^|2Z*>M#=*%Ks-2n8zGhLhdGd|+Rk1x(>Pev75ku9beF3XiV)hyH5Sg=OsQ!Vgv
z;Xh^M0d!=~5xgmx*?CVg{FIo1(vuj8U=vM_j4q`5%go3gs42$gjR}b-=F+CXqbL|h
zJ*(f59CTQ!v(U-p<;-y!{@cG(2RW?U58CzOCflW<t57fpRm(4AO-`~|7baeD6kNrm
zU;o-<Cj$hCLFkv9L8+TEOa(^FZP~Soy}-d8UvsQ8+ltXYve$f@D|15z8XQr$Xonlr
zFaqEL_(8g3+R%bd*i582pl~cf)v6_Eq`V9J{LDC($g)auVrh_*x3&$p{Xp>~!-dHC
zZbz>|+0;*4p@thv{#eICr#z0wlcHPeouTUi>#0TAY-BzUN8AL0Mko@g_XF)O(DGR*
z(}|wLBiuccv=?Ic33Lj%<CfTzzKbQFb&9nM;zL(ko%mX>7wFG^`#s*B1gB2Xoqdiy
zDS#Z#Rvf^<N^ZvlVTXF1`iaE$i=?Qt6zSfvK_|)GUlM{_ZanGZw|?1CmuuE5g3HMG
zt_5QIfdmMaFpkpMWqG~k9zPg^P*<c@K??%@yDjW~J}i=>nHC|>+X?-+zsD`-U0YH%
zBEcwoQ7$wT1|5bfnAta@d=xtMUpM9%Y!|KEay+;@Ajkc3I)=T!<|^Vnt_44fP<8V$
zXGoy-7&k2(32N<3+54B0XiB@y5*Z1kTPte_SF^}EGrNm^@gBdK_uQ*1j>xn*hYvzy
zUjpC*qebC-@r4E?0gLTteNc4)-P-~wUlf!@TXNFj9!dsqgS?^wRVe2r<4ef{XY|=i
z9~&Z7;ODC86Q5w15<l^2^l%S?0%Jc2_(cvbAoe{Uk$dlfB1+K>nt8+<R%7dUe|fVx
zVHX;#;5aRAIo<&M(k(yqS<3Q{OUZv?L}of#yg_sXnpa3&8_N;Lcx-OLD!v-(fqLcM
zmW#8fu`Cq|2MYX1z0E<EOcPGlix?~h7CE>Zm_9vMI<*^DkEG1M?uVTIf6xRdAM>fA
z5EMkh^~pYD+q3SwV$e`Yux4o_UTBm>va9w7bKgv%6RTetDNyP}I(q?($=~}>aGGgc
z*1N^&)e7@4lV0BBeVj#5WM^!8dJqa2)$<sdsPAs`xWVwx&X1}W?nz#6SoKE#_0Zp_
zbh=B8PJB|nFA|qe%LNVRKDZp|UoX(?!qt7b1HgyWWeKfe$uoi8qc=2H<nz}LewuM_
z#em~2|KT}LRZYI!a)Z6Q!X9g&+M>>BHq~69G^B=OT%p<&j6szY;cdEY)QI_zu@sJb
z(wS}}7x!JbUhHwj<D>_wHaf34z93w5RbSB0Z2vnJ?Qn@yw;(IPB@CS-;*LA8>2fS)
z79dyA^`HIzAe)Z$Y)9aKf8qhWi;yK@3MtV;r((+U7eyo8D=jQ-udy-S6*|I^Q^lu5
z<m|w&S}4Xb*UZdhN(zE!1k+_22-X9OxT)->!45lPUFfSX=r(SiXb}_B6MY!ij{)d{
zP*oh}U|>s#jYs3*!uBGHEuMw`gmL@-9n~XXWA({?Vk?kYTmQ^S;q*W_Y3d6!B!Fq>
zz2y9D@B^IXdiZ{KvOs_il@TMI&xOTou@G*_LBYF`5(omx4fs4Fw%?x1q_CR`ccS7e
z6^B3rrt;HC;=vg?GitT*P`=3Bq-5w{-!#rL<SDq<f~6~y=c|W=H~oPW9|{KKR5tss
z*4;QJWVxLu3uF+A6taWKW5`3aYW@asnrl{mHFt%wVU5$NHG4}kkPdP5C^L;2jqQMV
z(~M4bk^4L&!i*oXmrT=bB*?yrf3O{s2<8E?DQGlUGZ!o7qLdztMKfGO+Z~f@);J3=
z>HqAO9QFy!w$g6!T^#q+(B_CZrAvD1>k>WfzeP;?LNk=~7A`SnX-wz^1sRWJeZ&6|
z?MPd=Uly_d0mv@tGR=Nimtf5#yBD||hjAsYe23Hg;@$WZy-1<bFMA490PebRJ+SKP
zF0j2lpcZyIy@%VZRA7(dJvn#Sz2oLVhk&!wDdYv8R1JTHi+SHW?)5EIyIsuY2vWKN
z-35ucto`D?_Y)A;Br&IVeQtc4=XMHWgZIAQ!~YX_W;tgAM*d4Ye%X&K9??l1BM{j@
zebFPw<3MyV$}02%{~*K%#cn!U%|!j45_%!;6t0Op<^}x9{<=9WRQ-r%O4l@p(M-p(
zf^O{epY~7ZV(D%w0L}-uUec{Vw6|;X6g)yD>j#tVgQnB)72Oqo4`ws?<qg|rz`o9=
zgngBbex*{w_r0tyBWVy}Z4K*RUw$9eR(f8|X#DWpW&jMNRS@Jb-(ZzM=skrE4f?Zp
zc-vLT;&!5;<PV?cyB%9=7Fd_%Z*#scB?)wE123c@a*Oo{>%1d3db}=cV_hD6F5N3_
z+2N)&otrU2puPxP_Pl5>ACx3k1Ct~aGtx5cI<~FfZq&xzcP~p#HK#j3vl%`{jUGVl
z%3hqxu+HN9_c@4Xaiw5<V^HtpHRcEx3gT8ZkB(g?-dwd83mJ5)=&p`5i0gh6L2
zLO;4$&2`TF7)s5Pt6X5OcpFByKFVivGchOhh%P9qZTZ~Y7raNw{(-N6v^bLC8>6tv
zqk41(Po&f7SjV&fcZrUGI!WRQ)JHSkenj%+PXaFw*FAsF2Bo+$m|B+{#H5Lby+k>z
zw})_Zb(`2ElZ``QTm8H@dVM|`9Irg(?vaQdOh(On{oaldTtYrMLCZjB^z0tc(6{c5
zd1rP1o8scr7f1Ibrqo=gvLs0de)zD|nzamj=)H2GsK@<Q?P^b+-lu)dY!cVc&uowW
z2OB`wIbyNw2x)p~wwgbAcZ{dgDhfGnbtL@+cer(;o>7-4-QqI-vs$Cp^#(bO@w5@b
znY?weZ!Ul?d(U^o(cU)#k)$_Y6c?pD#NC$2C!P!cM2v|7#&_gKSama|x$u02ehpeQ
z$=ye9TrQ@$xQDO>9lW_jsxd*-ySREu2QTf<HjcYxqWxr#fb1aYSkqkKZK9cT6R<nC
zo>dHxc@ZqsTcS4E44Pc7-v~W|NqL<yuX5T9($z=S<0Q!ZiO&=Rt`B|I^|yB?KARzV
z;vX*EwM$y!x?WC%VBn`ivUD6oL6c{63eTpeWX?zT<9H)hYL&}3{HAaxQzJWcLgZuQ
z*%_Biq-1pif=wsw{;^lV<+gZx(d4$w^L0QQlNt-ua;-L$)dwb&d7uGuV6>9qVPcH2
zsaL|l5FkC_2isIvHShxR7g>=l90PS<=W)oqZgYLxmXbymKV2<237ZtNRswByUH1xh
za_P@`%(BI6pW*mvo>yPI**H(!&~Cn9zkw$Mm6-5)eOcmI4S6_Y#qr_cnN!JYkxpWO
zSI8+DZFN~O=Sc3q&<Kg?gyX0wZnl!FVV9%2VZU%Q6FB;l%glc<oe=B$aQ5>2gfPOw
zf};75ag4ado8pzQky(zbo28o+Uc?cDB}C_O{Z+Be9d{HY5#xm}(SBV;$}upOCZN$f
z?Dr@4z%|<j{l&FiR-T`xkw;G>jl()LWU;+xC!w(@gUzWB#T)Z_0>a#Tk;ZAc4!sn^
zTYziqY3F|ucbXzrkN|Stv23^<=796Eew#&&A;g^+Va&`HK<70)qKT#^L1%aN&S&`X
z?c`7$hTHj8xZn*FhxH_sJ>^j{9^9=$CNJWHAP*GwN?K%Vv;zpmQGKdFg^%9VMtGHM
zyTiw?HZ&^x9gpOim~lKve#fSvwrR+6f8{&(;quK}941%vT8jys<KG@3N-tAI^6Nw|
z)W5S@pnwR2a%ss;mun|_-ORKBN9EDE(DtL_=oHBOr-)<=mVkKlZUF09q|N>`p(_`*
zdrZ$om=13h)cKYPvv2Ke@WY$4)srEYWF-y8=iJ4%QvU1ivqzJacTr7%%Lua4>Ov*A
zzIZY<zYGLIB0R~KV!SUZlniQw@+^VIo1hq>Yw$7UanMqeeV5am0YYuV^L6_7cWy(M
z6i4CHJJzmIZ0PHsr{N_{yK{AEZYg_|vj&a_xVUVte;%BX4!W0(@_60DS{R_fAs5;4
zC*R&wkM6SPO--5%LG3Auer`qXwVtoXt+ztln)(n_q;;<oho1OS*@BsT-d#a|5*zy-
z=J9Dx$o6q(^M~mT+3nL!XAOB%q(~6bx?81!d7lKix7jbr*jBNE@NX0+dM@ic?nJj2
zfN%9+w!+rs`H|`X-!=GVn6)F+lt*#b4?*#G!+CQCD6WnAaD9wBAs&t+?iTsG|6(OZ
zC>T%$17M+x!x~5u?Vyqu`k~OLz=~(^OSacB5A}U_5b}?Uwj0px3`e$ZoBIq0A7bB%
zw+Gqn2J(SZ;@`PzE1if(S{V%#-m;VkB%xzj<=g82xV*t}E7lOflc(Fww(-pwZ(%K|
z5-{Rp4Kcsthp(&8WI}28P4>$m8N9ojulh*6rQ}PscBn%z#_#k!C@~l<&jehK`Bh7m
z*}>P#ElwY`;@JARr8;ZvziC_4Mebw?G;gG8zNLQb>#EA}LJ-Q1)o*Y4oDj=S$mvd!
zrDnr6S?Y6Q*nALsBUdS1$9oF&&n=Z=%1-C9LWv@pX5WxPwmRS<O%T`j7fgAL7lb^H
z4bxA1K^yMPT@F2%%(w^&A)LE8K2I}{6YM`m-Z58)`e=)mZ%-FciwILRrG&UCO4@c4
zR}qKos9)s<#d8pP28sn9hAO6gFk~8M#$$9LM4wwB5qf(F4U37JKo^D2EjxW~X2%yO
zdnIzS%9tl&9(puag`Y@&ohMlaFR3TU{AZoO(L#`JtW`Kn9MvLbjdJ3a`(uceJP>DC
z`<=>8Mfx6_ckN>a+Cc@$`vmQVBb-<Tc}C>O$n1BBaD!+)iGw!q-?Un+sRMG~kf(V)
z-wAJinfPsv&1~m9cZ{B6)6vyW=g|?~&@GLhEX3OV^5g>2uD7-ss->QJx}ly5UJ{aw
zRTJ<2Jv11&a=v{6OBz0SMaS=5of6ZiI_!anzOvY0gUVxl`ToPSt9#+2N}+rMv+5`H
z;7ph5$QFyI#ae5$I>qAjFf-1qETPBU&%1LzlD@VLt-|i6GupRk=w~gCM;L)2x+_`e
zLL%(wFt_hJi<*8&G(;=HqAQ5b1pM}@{klvk2^D~pkV;20t)8pQ8EeCIj<DwsfyPOZ
zjOq4X&zSG0(ao|wI}0QRSc&6@hx=Vj=r{VRnsJ@K59cq=#+`w;mXlRh3(h!qRH(h8
zLW4hYudk~=5yYnwE!Ymfas9n^(UpZBMcjNIrI;Fa`as?xTCw0Q{H})0_%HJNVaw@K
z^4Lg%@<4>Juy*2Z=r}3#qOpv=VLkyS!YTc7R*sXIO0}ND3*i$6jS3Uq9avh&Q>rAu
z(fGAhGr;6Nm}TngQX{Uu@W&|JkxOnQC2p&U*~GKY$<8^})K=@8{n2P)$z^lp+^|rj
zjy2!&t0S>3L|a!JT!o1pNV8d$VfVgiDCO{wb|9Vm++E@4Yq-OKgNGbQM}pey1UVfT
zo>ucrT5_7C`!@$w3JK4?e?)D_=L?P@Kuzbef#D^|c>ftozp{1YaLU#27z0Voxz0FG
zrSLTnOUG~AK*U~KMZ>PC({K#F59a@3)&VJOGP4;(apHtA_upM;)9761PCaq=C=^()
zFPZv+L<y?<T4vf5EjGriUyJfk8uH1x?2bjhJ@QMZd#e6nUakIb9X0{oW?9-|^$NCH
zF=6QWOwrtWHWRNe+u{5VD3>RzIw>C#rtDH|YhQc~PmdZT?!KMwVJ&Wj*=PbanjZfy
zo}lQ)!MziMCWG5BAGKI6O|AZ`bM!v6J$Janljlt$q#WN7#l=rYFrFW+{JP(H@>ioy
zwY{8c`>w-you$O^9rd(+^n#cOcg+|1;H4%92kf4E4mw;`C6=$ebch>>+<PD~jU^$S
z^+K%{^HsUzx?h7&k8jB)ulw7se-<Ds+V&Tb_+E4Xtr%0-ZJ@<|(yjg6vT4?1{5_;>
z=Z05F>$0APHJT~lfi{$MgZx|BU2ZNYK>JhcqLaz)ns;yxMlzS-hVj&JY!xaocx-)P
zz<R5=x{(`||8e`nOtLu~;mzS%3qJpw%9yFU1?K0W3wwHDc-C1e!mPMxlVFv6Z~ot_
zZ0LV~r#dL+8mSQo*c0%dZEY5gBv;VHb`qOQu%};0^=Q062N(k3VcB6jKA)C?k!@$?
zparL0BwWTMZ0*fy=}8j#hb%z(mMUcl48VBXeqKHo;(5t|_F5C?-vn=qj9?}zWGO6-
zyS*j_%-bjw<e@ZtIfA#li&-5MMD(y)trs4T`ywJ4cc^BPfiiGmx?;<SLtm-VQn;70
z+3a&Z=uN<3?CSf8v2J@inV85;^bFTbXsJS?3W}1e;gKUX1Tqw5F>C!x4dtA=51lZH
zBj#I~BAiI(OAzs@etCm^W^tGL;}OLtAdcIo8;@D%Rw$Ls^##rdS?CFeU+;GB$M~5x
z#dVg)u^)q4nW%hgq{TKEc$%(*l<j#QW*%QSk}li@YG>aDioNFK(Qd3dbv5;wGW)Yf
zk@CUwIvvxjWb--@1*4ID&3LjWI>%P@8})^T>El1`K^N-Gm+}r`5DiA-WT97C&}(td
z&3Pn361hlX&h1<l^jjR(U=_{QZwnaW!g}-cjadWjPKK3GVY(kExJ-zzuqU3`?4<O4
z|GVwkq_}2-HL2%g+?{r|YGR25e(IZCcui-TURN;g^Dk?jW0*ZGD4u2%A*Y2!d&fVv
zhWRERW8CHP55l^Cl=34>RO-}V{WO;1APeIjxL_G5^KM1zjo(PFu8P4KajVl1;-^DT
zJj<2Tw%O04g0^?8RR5_8ry_3Tb$=PCOdC$Pw;OM1%Ks9-3^=^tPW}vGy+8AC`MOGP
z+l+;@ngyZM<%_-@J(z8yt_2*79f%)01V`o76(;kg67VEt4uRx|b^fduAio62>jV28
zSpSa8R_*yo-*D|kwM>L&xE32bGXNW17_8Y$%2M_TU2M6NPR)yFc`F@oDr`gRf3jAM
zh|!*syq)+xQIWC7{wAVtk|}DQ4{&S~YO4FScyaTNoS*S&FA;N_zXrrI4BYksrzjAR
ztvnOZcFiFR)#22|3q6{xV^<Z6Dt9J9RGO1WfbHd1$!wL<Z?VQsq(4)}Ae(@;9gN?O
zDrftikOIFqRfOyYmPvKLB80k9+I*j`rFhUerVd+$50ZIAZF;WFeTN-N%4u)rTc|K<
zx$Uwyi!Jzc$zHY_x{AE?gl;#tegBO_JHc3mXq~9dsE>hT^PLt=LaJpi?2s?_=bonA
z9tk+}T$;iGf4CahDJES)8XC2#E=J)&<G+aOFAFmVpxQxO_yvqv2=tmI;7p6SAnFPA
zWSyfoie`pfu<oyyKML?H73$H6j%Tm%>}eDcd)=j5XhyCR==wBPvVGmvBggjBoGhM(
z=FFRSsx534?C-$z{*Nm>|JNu!b1(8+2+>KswLT-)7Q;mlYz%x3M(jLvtZF1?ep5TS
z{_j6mU1Xd{aJ5t&w!+=-dkGpg^WMI$!<YDvYaRUXWmIN+E=TS2bonwx=-uZK=bXo}
zJoQ0CQ3Uu3;lKcf%3!Scyq{EdMx$YN&0PlqAsV&syY$<)$tqcQ&$XzRdVWMCL72?5
z2gTEjMRWtH(+Y5rW}`{@uqwEWw;59JnWl~L-lhw4M*J_TzJa^WHrlp9W2Z?Pn~iO!
zvF*mTZQC{*H@0otw%O>u{m!{#-1`sq7<=#etTnY#wq~;9ACqenhTyb4NoaPUp%+sy
zD5~90CNA>Yv|{A+TB3~&=Beq5h<9|7%q|w%N$2`V;O48O%X2?I9@`8`amyM6=EgJF
z6jN;q{wlnOR_4JlWZ(wIC(pS#Y$Bj+vIPu;C6LcZWpp@A!ddTZhH?A|J|Qs=$O1EH
zs8n(2P<4d!qC?@0=R_F)pBKObJg6ErpRC4q(vnWpO|0%*>f3S35&f=D9E92|f*A{B
z8F#JiRud|nEz{tVVjW9FAc|PsuTrlDPd~LwliAF4T4^jrJ-6Kzp6K>5u}5$?kCzPV
zC78NeQ@jMbl}i4+;<N9qk8fg&XsfT4+I520L}A&#{m&*bah}e_ViTXga6`s!&lHZ#
zX=!K2+0o&2>bAR%pyHu6^i6nPp!*!Stw=0SlsAY4n-m(Py>cn=;T_tfK?>b1UYRZg
zn!d|LgG0;a4=zIt8z3I+!z$Ugin(%Hn>n;(DPeF*{_4SKv9?d$77)ZFkAsK`j(~j2
zbr$XYEPU@?Z(*XQ6DzZQ|9HjE9r;1Curyf5ozq-&XE--`+9~^P8gy%PL!?iBlWvNr
z9wt-hp^Qo1ck>p;CY4;IbFrd49|GzaEiTI3PG+~CY{m6!nZB!g?o?S4%v3|h<Z$kw
zs`j7^%F56B*-WWw9F}PfQUR;_S}2$_YHg429nK{eeM)Z9+*46qC+9?t=WptDlhDGH
zcxI|3(ejY-cqY_RNekXT!?RkT-K|%N*;VJOb^Z3t=x`$-E-98{8yl@6hd(F~G&*N-
zmP)U@*@vpX1KoCChGu#TP7VE*FSr`}97_Fo41)PP=Lg0x@@%enzpH{*3Mr$DSPE4B
zS!;waZ?DwtBIJ$?uN+3k>v~+R`SS56iU0iF^mo2^LW&3=JWcrvg&>5PuuPZB>JDf3
zPrV)<v(X!*%LbfUx$blbg+vp*6#YnvY*p0GY{t-W#e+aRC$0tLIyN!uUl*qbyXRKt
z&CvWRX_?Kd4P|*rYFp_jm%FFedSG!mmu=U^qJ9zpaMP-DV>Enj>H9Jy?vm81aOpoI
zfmm}2mDD*d&}cFu(paurwv$PgIvml#i4hH<UMT;zcQUw$N1Y*k)r0b}SE(;RHoGO)
z_0EkbI{2XkPqjsoVN$I|@OYY3Zi}~eq+%_2)JK~~85oLnQ9{9P3jZftn(cRauBk<6
z5&UKN0W26Z(#)alVB|`0%f{L?Gk*}w!L*W>nLz=IGc^ifd|FG9<Y9hyoDD-!Her-$
zo$-_aYFOKh(kialxH7%e#7M_a!EocIAXRG3UpRuc8X8bX`N2F2%07_kk>q!HjtQzf
zrc9`z7wf;l7#Y0$6P56OyW&5tiai@{c?+G1vM}38jeBfz$1kodT5(>N@H_w}ng}fY
zI-{}hVgpZbmjDQ-{vI-`$1Nenl=DMEc?V3)KB^gs8?LRbsK67AZxkQUI<9{x+Si+r
z4F|D<&&9apHr%~?Gq%Pu4828paT_~hws`G!Nem^13F>o4BV{;v7M%Kmqpt5{yLMg7
zHDS6?tgSa%aqX^zglr38((?{JN^Z?}Di^kH9?Q<#k<@l?_y5ir3-D6xFgwm=H%K8F
z7(P`Y{=!dp`0IMb>-v2nPNiDmE1v5%uZ(r7WBgY_;XqM8wLxub{h>!II2x5VsTwc*
z9afV`&pt;tKnoU37<_;y$~tU3WjXz7N(#IpS`fJA-p<=!EZ070QT8!r5-o%bc!4He
zzlo{yYH!FiY4+mbxY*IxHooq)_*b~fNMKfDkt!c+s$FZi@=u@b+&vGbV{+Vw>J4!!
zUAY?C<I5Y&*Zj3m2JrrkU()SHVP&^_a;fimJSIUoex%F&<rMQJBJhg{aqWgTPfoFz
z=Wc%^v=A)eB}DbLP^o77E=C&O0S=G7$b{e{j(t<!@fUWO^JGa^?t1tK2I6~RZ*dHC
zUo7~yWV$Sy@fGGl#O;f@m>K42NPJJY6`OJ6Y04r=bc|mGos^o5wao((FJXhffV+n1
z-&x$@_#mDO5B?|)HSXe?<!$#NQJLK2x9mbtkrExgw||ZJ_4zSnN6iZZf3^hA-e1x>
zU!hJX##N4S25T0rKN!^>j4xUjvetC<%__IsvtqAEG6i%~<S)|L^8o~_PGyhrJv_sX
z^Ui9$+nov+Mz-4{WvObD%oo};GyFe7T;J>8!bLzZNT7yFrd-#iIVICwLwAOaw|;M(
zbcfk4SzwH@6E-c3@r0z*|0x^sJ(bd6ERoIt(ak3f62<rWZoXIwVc5HPE~r}%u8--=
z{aGc{`s)5o&3vw`rAQfZG5T%eX-jD0RC$Mid1g4;)Lvh$tjbnzexH7}dc^Pe52a#B
zPiq6VJnR6e>t$NWjoj~&X<u=V0s8|gNP6A_2I3Ui)t4|{k_jZo*y$R94qqOlr)*O}
zr>hboScVx?6vn;Hx{8`revJ2IYHh+<x$O;?Em(FE_|SUSnzB9Mf?g0tRU@I*a}nXa
zGX4__2T267F`Rq#Aq|sz>feldGeA4VG?dDL7K0tR<iYRF_4C>pzz7dtq|vE`YcQLj
z&kmC@pU$nyqw#-Et7f)BV_q5;)zeT9xLy+N4BByBiF|adpL9N*=H%DhTB|$!YPx}e
z|44v@=ztCl50A6W$DD7BS~ZO$i!}&~;f-QGUyAcZQNn->>5LQ?l@ebZ4>Hig*u#L!
zY}|I~LPv&`Sd8A&WC3elpEJ%snE$-lt^kZyD?xn#_K3FIW>|>b{ho_BOV#JbH>1oK
z1-i!NaviLb>#+j_B0Z<I0A1j4YlgGYbO(j_a?dLVs#WRI1k>AaB*Znw=k259&ruN=
zNAC{s8f$efuw_-DDgC27#|)ES)wSBJTMiC=$K2X(YS(89c-iGK0Rszug~r9)e&GqH
ze<%~iNo)ROU76W}nQ2;h(1n@z??|$rBmT)it?D2~OOo-k%#F@<>iXo8^>xZA_0*U#
za4)_}MCIC%Df#!MPP1!jmogq)Q^vLJ*rF8#e)=Q3C2PvwN{QVyvU%`YV6vS3!AOwG
z*YvOFA`{FsqMSZ$m^LaGg%Q~JxzK00Yg;1lz8rZ@XXqdp4XoCy=4u7okM1YHCMM@W
zyyG*PzE?`U+C<y)-g`*1MhJgND48#qsL@~!_1AY+&CDg?2vtIKk}_*4Py2@w^UjvX
zV&xKe#d8%SUC1DqHnqvofX)I8`Go6-(ooVEI?Pxo_>do1aPOpc8~iewdoB`;R|7pY
zHVV8-rMq?ySP>_pk5#NdfL!XN$d-o<Te{j7WJnB-AIgAk;3|tnXf0(_1%E$0U({&q
zjtME!8Jf3R&+NtXqkf0-+5Avom$dC|uNy;3EGQW#c2qGDt#!GkpW37>Xxh1T2Myx7
z_t`}(q?bLw)S*);L1D33>nBQrmV4ZI9sweRQ1;-H?dwHT-`o^;M6$&d+wMt>D@kp!
zN^~r6g&Ox|3zrKf$LEnFb09*sFerm%-1%Y=%!t~WF@Dxtf4L@amwFetg51laj3^HW
zy==W%FV3ylEkTg{*M$ORs#r2%Qq1RhSg$@<zsioq<MDhNmSwm$gU5sw=kKVCwR*lG
zC53V=i74jBa2&B*>cf?<%MRY~t!_(gQKTVrNr$1nfO7WJh{g>r)KlBt*4MC7(v(0B
zmp!*1S8NlVq9&Y<jY82Zb{RzlF1LSw4U{C_4HocIs}o=|7Ur1#EMLUk2L4t3by%@S
zg1sUNrUbC<yrC9Tnx-`AI0H*na};95f`^I<oVA_HFbyD|fM@XDls)a~7J8J=@nUC)
zN5<eVK{?jRLKO;2u+!8cnOEb=6ruPLTS7no0a?2$m_JjHKu(C7&7U;q;hzr~k5}9k
z8vooBg0wf7O!o%{mG}Cx{9qo{Q4zdCRQkhLhxARwk9N1Ke(8C|8iFuC=_~9V0V3$6
z+JY#V1XT^pNC9tA?<g$gT(7moU9^lp+ZamTUf*C$H`}4RKv8f^r?1ia;7YZ8W*?sp
zGpZx7X%h3kr<b((pR62AX2GJ<W%k9mN}iFM&Nr)f>rsl#!oMtuB4V7R=e1}sB}Cso
ziRe=z(Ppzz2nJvsIr&~W*INdci#9+1bHDVMGATbM`s@WS2s(hW1R#VS=Z4~>$O@0F
zugrl4W{^vz`};4IgI+6bl3;(`)-45_Qq?g7kHTI&Dh%ecc=Sx=G08?gyqe13Vmkgw
z0lm^Fkbky25JBW~cSr}hZkfaA#0gaNYV|92!}^iZ%2n}2sXk1{obj3Mx;~#gPhJ0A
zW&=GPySa^`rOIe{vgh`Zec0%ST~A_}v+ZHMVM}i=w-zilH)dNZy@<kQ@ui_K%w_D@
zmqtGzuSB8IXn>^`ka|%?LZuo}3Saes)12KG#Qx1-uodW4$`Xh>gfXy|3(T0?OU)-6
zHmN5EuHkZN<oD66Hcn@3f}hMh5FE-(Q?PVN2x7!3_(*a0+hn|7*h+CSo(Vc*P6|3Y
zSJVqiF93rT!Zb5UwLDw~7E8IH$9(c&H0wnn>BV=L#E~;Pt4UqA7G$YR<^?qe_AceF
zMT_a>ZVp=22ac}4**Sd!5#GDldql(#hP8ykpCS%$icU()_a{u#NX<KC@v;{r(r{m|
zXrP2bqM*L#;B1wfxKL=X(tYE)j0)TRm3BLo#v%<>HtIG0(t>{g&tYM2%s%&~b^PH$
z8L@Lr-zK{yp#Q%2#JHEX8TZA8e84j@<qUSg2G+d6$j_s-bk?UEsY*ufU07JbcdexJ
z$fW$)wVTd7Kx(VBCeO9S%h;j@$EFbil{n!hWK{7aqbv4i4neyA^Y59>HyW)@PdE8#
zyL@(TlGP^9monRr-mh^#dH0o<@MP{GW^YL-Mr6>=_x{plel{Y7lM;>{(yV@0XV1PX
z?@Vy@LltJLfo16WE}r;oI>iBhy3nxh5K6U|+KQPrd72$Sw=+T?7bHi?H#1nSQVrh?
z{bSYjrPk#+A-GF#qs+HY?MLyp<baOv7zXWEvz+9!TM!u9$HABRaUTDaiot?k7;WgK
zD-XkLTek%aWW`e1U!KsZ2{vbX45m~)u#=&i-wTza9wAQTP;<`>6_?+<2k*t@z68~+
zq^0%6ugQYeuvjc0wo38WXmyyUJ(FpR<wj(l?=$pWCDUs9o!v5fGp~w*X4S^-7`HP&
zty&aBGOzQx$1Z`_x(Z-X@4L#EeuKiGyMm^`Zg86J*3-Y(dozTv<TWoeaIi~kR7|<N
zUNM0LyOzvqV&^L&FPYRl_@NRqR{~}xk%ULaSz=IP4N}bHRg^c7au5M7ZCPv-*6DLr
z*%AeY%a}vPm6WZ~;La22u_w(D2C`M9%?TYrQYg>{2hFS7VP2@Xh7pU2pV<#Np+4$q
z7}6QV%F`D1xRu5jZmdyh@Nl~5e>kDTx+)uH<fj%Kmf{$R%Zsu=3<Qt{_1^r0B2MJl
z-6}LHZJcLIo6nr-Qer7lE!D1a65Mirq8UGH#}u24ROsvH%eGDZh0nP0Ur<A)!zux1
z@4D6CP9K2WAuDnY&6&}W6@|lxo64nBw4V=oi1QIW<TnB)LHK#R&2?8J=VNgzo7v_(
zJ3r+~(cU_%nblxSOEDqpD`?<C+mr80>}V{@;B;L(d9H~)qxH+?wuppLW$sh`Cc^m<
zUuMD*Ot|V<^)BO54lPLRG#MA?y4O?3lk{3iG)+>~9%IEZXEb?E7hP9E-_9=B^)%rJ
zL+4Ly#10MB;nUdmsl7h^g);OsMcsCiYx{A>Lc2@xe7jVY8vi=XORopCbW^J(`AMQ)
zh?w6zx2c2Rx2f!YXfa`XBdSj@R9iVW1iHNG)nG3li8;)d$T>;4dvtsb-rmVaMkt}A
zQ9;bC%j%UPI8&XiC9F&%<`A+@)Qa!tvtDmjE2?YcL-J}-h~L>Vmv^4S9-HOe=#?hG
zD01hDBxUWK1ussQ^P-Tbc8X)W#qJKRwpH6L2j3+y=uLLne~Dta0QPjM-IorGyCzJl
z$%8T81wNN5EmvfN#y2bk{0|6#Lbl8#wtE+c<u)rU;NCw*(YWA@3OJ?1D12<g5!L(m
zzeaS@G5RQ>_7%P$UKKy|QD{4{2l}sTi3O&dFF5<+h_|kP^mTo9dg#4n7=Y6S>Wn65
ze)qoh6f{enR9y0L^AUWPcy+$iMY+{zn3WBQZ`}K{xB2ZxiIyY(uF+<VAkb3jM~cq5
z^2A^^=2XtAY?n)u&Al?h=fOKqUkK62x5w(PH$2--ftxfY^4>KjxwfrQWq~vF0h0-L
zFlyaKvGa21MzkMG^qu4>HiNPWdr@%WK8$qZQUr^VZ`bagV<wzAp6&!teCHKS=AVxY
zJ2t4L7288K^{6?qFA&6T6*+7Un$%zQkui{$*YAIA5oLoLmMfQA7a{^4(=9~W<)=aF
zkAvds?wqc7XlynsdRHXw6kAN-V%I=jq}Cgh*Xu)21PXo%(KxvNmihyNXR}Gnuqem}
zFLa0V+2V$4@za*K%eP|LEOYKAt2G@8Qx2y`W;kqal2A4jptj6<!~J@gxD)m?rCKML
zm*RfZYWHf6Z7lf*Bwfcd%2z*@ZiUoY<0)@qn6bxv(LQ;eU^qBl#2weigIlxc4Ji{0
zvpKApLa9<fdlJ@WpK9Y`4RcG~`ptVYbu_8|3(DMHlRc{9Aqkwmyr3c?iFmA*M((FC
z&JDL@A~i;=QWc*_smYAj2o(X$u?7cAS30dy`}h`%Vy=Ku(CE~Su*;T@uE5?L75Dfp
z21P7>Q2S7XcYfr&>K?h2@Xqy>-pTGuFA7{`iNRnr+o;N?4$yU!EjimMX$QXLbhZd)
z#%Hs#izc9pk|kHEVKwJqQ}=fUlaI2RNYqQWQ?TL77~W6e*&KE6>fMgqBiAnK)4;jB
zjXMqE7@6uFQo0<5K*Zo+H4-D_oRJEF+!)0aKj1cz_u|cO3|{9{0{vdc@41>{8Elov
z;1Dzt@YC%)R#X@4%54fA5Ok0X-7Po^g>EiD*FJ`gca0+AsS*Ts32_dBheo3*mCnr$
zb5|_pwlL0uAZmSoBC|s+nIGDZO#!`DO5+hCcXGOD>meWgM(Urq`ECZXo7?Ho{hf04
zP;hwbvfcjQwf@;xrtJAQwr4NiR-LfN#Qnj4?hBRp28tt66*y3sziqTSiOMM~v`>7z
z=Lj5C@dV5wf7l4Tk@tpXu2>n;eNEo~i~6S+rXNCidN-&ntipht`}^k`Y{YzAhw(b;
z#b7($Z|~*@%5;q?kEctJS{1SK2>}X<;c*uIMP|!+YX0wGccbs3SB8~wnS;@ETbIUq
zTpT&0+=N=c6|3!r-8eG&E3`UQ_4uq~rxoe7`&?0A`0`si<+(bv3Y4Vl3X#L>Q`VfU
z|1Mas<jvagWr^(6t7-cH^8+A}2Ah))AR8D#GFH3EsInc9N}>xn@P0J-28JWxKxJ|%
zLp<M~)aiZniVT*B)0@o=F64VE1Ik|xb+;fSRFQ-#T(jl=!C%3x<Rx1sJ<JAg9d2L?
za)Za_vZ(Qd;)k3}Dt~SWFSWhetaR`_#BJp#ffXOMh{3$z2Mr^En^;{EtPHsI>%=UO
zt<1<U8HCPJ26uUFGM$B=C!>49(U~1AGo#8EKQ88(z<16Xr%ys0pMPVdmCK|;lDsnH
zCWA0ioWFnBiy5M%>W;$V_?9gQpL9OXEGVB@=2gk0gAyA=n&VwYABn>d7~%IpLD1@O
z^t!8#Fr3UE%J4%|GIj{=0Fzgr*>bgAdXl!65&rq*2r>^0#<y(pGOsP2ZoW=qNRFA*
z42*1t!dc}NE1K=@0+2tcOW~M67-=<mZ9jmaKTgJ~S6<J{?JX`j6pP~C^3XJ=QSY6~
zj(;s*`87AdvCdOw>n5{kRy^-mHNRy4*>tw<w3z@TijyK&kA==sIF*#-IgkZ-X8j{l
z9Hk09Ny=il5yltU+RO~sqYUYujtda;rc*!j`7PR|JdUrIl%l>Y6?kCuxubLxa{M9G
zX^##zSZ7`f8GFVE?~HkLr-C&M_7CzbHG@#a#DGdJJg9(~l~HlUL)hGT1W(j`Hzu(N
z(n?07)r9UZvkEh6ot*s8$-+P3Sam&KXpKjk=&KTrfHjl%AmnI-A-Mw?XKql`Ag}k2
zq)TK|@GM~zyh&|Ot-jc$TL{YJrYi@kt+gVKHL19XF~^j$F=zqaI|=d*59Sz=U%+c&
zMx-A8OeK7&kRf5xTTH0-)R4Qr_FKuJe9p!Amds$r>ZF_}irW=x^isj%+K2=9b_n;C
z{95KU-$^gw#p|;4&jaEJv;$%s(ZwXdzSJ92qqm3tox?oRwb++CM_BM^ggIg*i1%-@
zdp1eNt%{j_lZP@IxzNqqT>kX(W98Xz^WeP*wYT#iKB(8Tfx-`>)-fr~0#uy>?&#7k
z^L&<{D{f)<RMZIuo?~~JSxmT1Z&sMbDtg(HuJ{%%KHc{?FEi^yWe<(tLX}ZDT`#A5
zT+%22eL7&*lAJ~^_lpjk8R2XU{wKt!@EdhDWiCv=_v4C5jqQ%VFY~ET5DePR%Tdvb
z!>HjNccXH-3egF0Pzf%oVOK=q-;SFv?wYD6GWEX%wmg0J!|5DGEisSOr31HxPR%bJ
z{x^dd9vG4E_AeN;*#Qp}%g?A9B@Vl*jb<PX=6?fIDYpo?HP`g)8yoL7CK@AH+J5mE
z&4M>yb$UcH3SP)l3Z%`F<}Q_Q3_K~33K0=eB9S0PNGLex)g}UKY8Q6+68`C$qe>0h
z67uF&sR@FL+X%{d;%}R;Py=OVBb<7~+@gpLCivW?`0dx8alRGxmp3c8L6C6n6Y)>j
zu?#1AAUcdjQ8UIV2jjQGd$?0QahX2Xp6A9N$uInzU2S*d@IE=2=FHdRazYi=KF?gM
zOV`)pwHe(#(SyiMsO}G^%AobTBV;?hNxwI%4B-(}0Ihlqwr(q%D*pfsE2&4nF%Joo
z0ZE3y`MuSJz(L<X?qKd6GFNg*_23*tPd%tptHf6rnfH2^!umYzzRt1Am=j+Z6|vdv
z7Gg<?;4#Xs)bBhlgrmjo*}$28656m%|2~=}&Az=|oNTv*Gd-~pMXQ(_5FTeWp%crB
zUj=cGM*|N^axOz?H{RGbjx%&%_H6A2|8Exn^-3k5*U~7m!?hhV#}5luJU%^?>B<9B
zcE7g5lZmgJC_17J4m2@NDBg6@tNB@+X)VQ!X9u<6+fj{reGuWQ7xHUcz~x2C><jSY
z*dQs1*kE{jV`DC*V1%@?iv<t<;oa&Ye#?qU3&7zrZ)2fCgXVR;catM$+xpwJ5!H6C
z+IbW{<!7YcBGQ>Yj;P1Gyxts;9nK@A(|X-^okifoU|G7BHmG~x`!&gyhxpIfT>W@%
z{!Q{sDy=pt$d^0q*a9%KKa-e|kW2)s$SizecRmO2JO5GgWbc*7c)-H_jX1UIDhMC(
z`GC~&ysC%M%fK0mpf8&_Cczf7?E$+nw~^zMP>y|7py)sddU1wLY!8~LS0X>Qv4SJ#
z3@MDxmgwgRMD>4|y*C&cI21c*umr)f=M{u?o5}7LeWyUc`VFtidI9cqzKXI;Jzpv4
z%Z^Vp!4G`NlxNJ-+9YTR;-;-g-d+1)I;CUY)WG!h;Wz^EqS2455NxKO#f4o)YB?Ey
zboN8jfKbNu>gE14&+p}$>;z5)y;@eH63|lTBbqckm5G2dcm=w`IHUo&`6>@+mW^P0
zDjqazL}JZ%xut2jEjtwQ!;0@k2|D;JaM_->&@&`;W86e2V0l1nvCv??VF(&O?99Rh
zXIY$h&zi)8<6&2cV}98if~C7$rjcK7s3Jdo>$0wU;=8u&Z(I`Y)V)FMD6$~V$oM5P
zCJS17K1Ds^pV0zQQks$W8*eKssKZ-u1Dg3)A(}tV6OB}J<#09At6-x*bgF+)Rl8kn
z%I4bYed1UeDUU-}670b?&?<N$4jCxejZS!4VfeH(2~LawwB<d|f9{bgpa0w=GOqL_
zVm;i+a^cj56J0x|Za==SrFCURvXNh$uRSSKsK1dGn5+2vsXRE}@-E&8WvONX4oa^v
z;HnY)4@8w~LIK=-WJW_V8xr{^r+dbEPofm;XcJvXmc=HSSvA?0(?tuET=}HU5l@`X
zZvs~%fLTG=juB@{7hQ&|J(JTaxXAZUb@AipiNE0MqZKHvX~s;K4B(4|n{b8F*$sgi
zlWRAm8+2)YNG7-{lzH?R<t|E<)OW-$U*s%;>PPVj3cOiuu%JtCHk|=gYQ9NxE#{v)
zoXGv<=Re4mFAD*W1!bsBomf!&dVd9}j>3pNB9qM<q`^Wb6m7W@b<`)?8LZCqj`ey_
zD+t}M&<gVW-Y*p<et<J*znNTD0I_^t3bJT}X0TfrcHM>V4JC#;0+zKjB^<Rt4JFR_
z#qosSsh+l?o98e}4d1@7!+WjKWoNBmOCWpAI;gft0%H0w@n@0M0W4A>TBkC$kFLD?
z%I|RKaccFElRasIMztFZJ$~Jsb}&j#im10$InauAl~vRR(~t0DI`1jo9cD^0C{pZr
zCKH)@DOLrjYI~g(7xx`LRP*AkP!+H5G5Jn*I#mVAYU4e~*B0xen#Z2YKfHOqRvoA?
z;}k%ORuZB!B$8Gs=P;-M8Ia!`yy?A$KzK#u0==j|bF+Nv%W~Zj@eK}@-1Eqg-hJtk
zaJ(EFFGt)sR0%c-d^`d!zUMWFE9^vJjfc$<?RR=x3O<Mzssx1vz*w0}kbm;7jSrsG
zL#N}}Nx}Vg9WYp+MIQasn}Q+wau|&I7X20ek0knpK;0K!2P7am5Kwzi9taNfOnE;%
zB-UuZ(%N2+RSRd^W*ElNQ~pYs5yy6)^&F>7<Ui*!WekBnr|S}~^St1)W9@rV_%&kv
zegLySmVzOXr_v{i@AggFYm1ioW7rIxMkk!Dahy%ao|8>)P@8Fj*%@Hyumtx1SPz>1
znKN!1Z}5Bp4f@*$ToK(U0%ugr5lC=&+VDW!7oH=p=!rQK!H$b39lI;oY17NrlJr|<
z625QK+A3)2bZhy^^U`ksB6tjB@#x1tzB+29LbAPM6^m)ka0kB(vd3sXUQDab==iL6
z2Y+WNlEet<mE}foIqJf$-Lwr@hGY5_jrY1aZ8|))-?dtYok*iN>nb96Pa1|CYv`Y*
zGrD>nqxX>_PfXMX_)rB~YQ57(C=-NP2rq#N*vYZC@Q_vH6c~R+Kr=jF)+>8tPOx8M
z<Bk_)vOGeophdZc>$w>k$l6)d_gP?L(<F>>8qTKC5bzwG|MXQzz2NQ%ldu&Qh_ktN
z99_q=>a^Rk?oVc|eKBbU^TIr|SKG88P2sm}Fi*-O#w+|&hZ0)ksy-J`;g_+y|Cq3t
z?RNL>zx$1jEB|3dBh;OcYCSb>ERDkfW?yuWo8t%P>}1}nG}}R7zDQ0&1Ok+9izDf_
zU?6~=0(CXnE~E=gnS*7(hn~=MKG7?a1qx@nndi|7x$@1ne0<oXvbk}G;WE+`PksY|
z&+d~tlks@0D=fA$#FcpF#8k77n(<=-|0C)onOY%yhIedfca=tCp*ul__BZl58goS<
z=ze$cp<xTe1;X`Cu}X5DHB3n7+2w%^&lka~18aT_`-@W}C6+#?|13Ss*S`{o{yv<2
z1q4npfibtf(8%i;yE#jIYYe`EmTZN)!Dvjs6eoNZ4Rg{8+1D*x)5{dI7+x}rt@Haj
zH1>^4=uA(hbq&1|>Ne1z+vRYU*2$5NxT7IJOph9DC7L5<+ze{9H4RbOu07v|Em8Jj
z<0iu_DdlFnYtVi>_#2#_@^7T|klDtxrgnHIe%RCdaPAFIZ!#t|9N9(9hbBeh@?7S3
zWgTI*W)~0xj&i@Ojkr3@PO8vk2ySpTL|(eIVble1{fWjuZ9h%?e8Ed^J!IiaG!h6-
z8plw4a!Mqd_v|%_&7spZ<&<4WuGB~*5@2rS9`}50+RBD?IHbwVhbOOw2fTS%+azAi
z9O<{#zGNLnF1P!XY7NFTRN!jg9|iL>W1ja7Irj4)VFju*9bg4qIHUm)p!aF(lc3AK
z-vVw3_6~(FvwQaB*|}~LWjb@7^2;zSo-6H+SH;FV$ehEzr~`gEE2Yj?eTV&Fkf2LC
z@E2Hg-!+>qZK$Nt3(YQT+;dN#k~b=Tg2$$<&u*`|V_(<ukoK3`JVpdQpQt(Q_pTrG
zuG7CH^Hyy^|DgR)^3SJ$6u7)y7@LL+(lx6zP;J!Wn7@3Fzj6KO<v8A|<`We;PiQ<t
z8$%atwB)_0Q~Jd&@H75%`Dw)a`Ejj4U`uuCZ5UMJx57bCZiy86n=g71R>5|0k|Nze
zeDb**Xu%B`((561HS9`CfG(ckOXQ?VF49#9!U>{C#PdsrBS^OEN#V4RGk6Ju!C=9{
zM%1kZaV8Mm{52R!*}FTp<?{}|h5L$^-R%^*q&_K(VUx~kVI`?2nzgzB#BR`ks&Lhl
z`4D6A{y&54L8RlySxrR48{uBUsV?l>G?sotKkHr=F<*N6iXj9m4U7!4$nU1{Hm55i
zB+5MWlmkhOFSy_16QqZee`sR4KOPg+2BZ8c6b7b?ljPxI_;O)&8Bm|k0JelO$So;*
zg<y3J9UKGY1fnH%^kRlN0HycpIj^^Chw1*V*8%M@UvA9jkL_x_`^au^tP`kF$iAL4
za)yQ7(Bie$zy`_Ij>t0Q%NdWWrOoeL4fm#vrF4OzlF95)^fhVvNNBYvd^MHpYMj<U
zlZ(BL#R2_O-{S0HK&Fvl;ZzaQrd;VO&An<=bpXWlsWbT`_v<*ta--y5oh!G2SU8Ht
zvoINHERa4maMHQ6k5UNoS~s;5mnlw-G`^|%VE2PhtFv0D{R*?Uk0IsU(qX?WMUZS=
zQl)liVm^j-WGY0P5r@fzz|vZ!P9C1fA~;>VHJ+F%mia9<tpneu9mBnSRhHxim^}r7
z*>m2nveXyS4-ggDYQh}hoh7y^1VC_5PRU9%#GypFO6%L@LnpfOs-uK6xAd4AIt)R{
z^<%Ab(Op}Pa&OxUqYnBGZLv5{){HMTp!!v+)IeGtZ!ENGejssK{avg1wSzJP*Ydtw
zG~sKxNDbg(L}I17FcDI@`AuS%fZl`LhBz+e=lAwNiAV!`l{4AGyJT(m<x=nuv>zWt
zc=`AAMNVBWk6fvtuenpx<Jsp*?h?_k7@JYX$A5D<IIFW#>-3fCCQn_G!vlyp->TGF
zeu^OlqJ%!gN6Rnak$aL@`)1kwB9GEuZ>UR2I3i@?jDO6rSfs`P1<yHu{nq+;Z85vk
z=(Yp99y#-nxLO)*#x!y0sOLZXhpA1@xFm;z?=|lKgS6A--N)4%MPlue-CSIDJFIf2
zAOzc^@$AVFxX<382)R53r?CKym+cLSJv0ncNL_ZCS0L=8lxfeTyEdR(WmD?5GS(2<
zc?6!lGsw8a_n%h{Af()?u_OpoSR=3{#0Y2q2hwC#dSfKoM8i?-Kh%Z*V%VwoQ%XwA
z7rwM5D$D#mcx$ZFb0%~XL$nAv<t87uP3{i5gm4QXi#%gSWy+N*kq&mF?Ip2L?lVP1
z669zy3*cbQgl}ez`8Ufsd&Frw6^ESV8YD!#zwtsNU5W7SVegUmT=~2aZjOPpimkS<
zjL9`xVv0$PlZd7T7f>Rdv3Rrl6>a=W*+_nIQXrp0u)S6oCq+ItVA_aX*{;mtaO&+z
z*&vN#^IHzVbBB^hq=s*?ZsD*D==c^|6vN_nVATA%`3lx)@d(c$00e)P!OqWD>b9rz
zgz`gmy#5M47LE<$d%qF3*Xb99Mlcghbto+Y^2H3}>T+l}E_*H_%r!6F=y61QzV<K^
z5u15GlI!X3-k;Av2F@R=;S^i1j!)gAd8G)BMYbKff0hHo;w7icmO(1#l5b6A?dMc&
zH)Ul|UvLb{5kw648<IKlWw606dR)?MJ-HEfJPLEGuOR3&+j{JPn5e|Dj(1U#onOEr
z$t<^IJ%ny{p70Ly%Ppjl5lA6Rv-;hy9XlCpE8YKRjBL}`oNj2BvEPo7B~Upf$BSLJ
z`MUxM0*{D~$HXfvnHo8o5{BF=u9$Dg@nNafCB7Ft>}pOhn`V_NY^d;SGZWKx2)7Aa
zwl-MaEw4ySIl)xHc_#?aEABWWFeZ`BvcP+h#bid~=SCw6G~c4h@NBh>^st!x)Y72!
zoca3?YJ5Juo_hDi_g;`ETE_!}B9i~+l(c_++P&bkR|%OWVt@dkYfqgZ8DWL2gGI*F
zZ}$;Z;A5@2Ygf7qe>)-oG7pfgalVd_Aw}pq26WBL(*BNqC>m4g?iZf}*E)wVY)3FM
zo<nfB==6Z?4TRq7zhJ8Z)BeKl{burfIE?Iy#5NB!nyrOOAcOu9z9;7>c}AXan;2t}
z0B&O_5%u+q%L3T-_7246&wGnSpJ+=LI_uZDg@%uTZ!Zx4(**}1-|PlREejm>gA+$B
zaI#<^vS0NF$k>1OW%L^E2H`L$0D<vn@MtlQit*4CGqSor7KTb6hIjY6IBzg%;2&dr
zloAB!M<6A8Idh^8c-xn;CmC|Ry@26K=Bxfvl@9H9k<*|8+xnQuly#jp?=Ekl?e~qg
z3$mu9=p&q2Jeenl6+53bw`ek%f3Vg#%pACo*=I$@_sxnrMMOj0)aGD*ppL&{-JASE
z1+k(p3bVzM%OBYpVPhx~4?#AU)$Ip{IPPz$7Efh@#d0^vU>^#1HEUw%;rsIyG&~AN
z-7icTa}{cTV1~Il0c~*i$@vZU>M~FuK({VoULGsEE^^FAoFi*oHIX#kA=y%8KAI&1
zXzjdpN2bIjPB}=7>BluRsaO>^z;L-ZKTz@u;PK!M^acyYx+lQ(?szy<v+K!N-7%K!
zzCb);vK~Bjmw1qsk_uEVPYxGq1bmUX5F38G`P>h>dp{rg-}rlPCp5wFHC9ecFm-g!
z|Nn_Ce$A2`N4hooNUY?JxF`mlFZ35ml#|FpwAhwBUBwL7%1Ry@dk3!PPW`^<s6o8l
z=*54_@@C$lQ44R}zjc}X8jdZw<s<Gd5MNw7=mA2y-$EbsKY-4Q%=)>iZY_!b&`j{G
z)YF~o2yKUUGB90szq3Z@2(1s+%aSww_MaoiyQdD_o)PhA`47K^{5QI#fb0uSC;Ve@
z@&g<0*Ymk)kR+QL5loKg$;e;?T#&1LbiS1XVBgv7Wr8`3v&WgS;Cq)c`NlgDQTrfQ
zcc<O<#!RIfT;RTV^dF98-Qb?MOJ2ArkW1i)?KKRR5VFc;chhzxBRBZy0_CynF)Er>
zS~sxyq6&27?Keb7lB<3htQHV12W>xcDGQY!nsmJb@O}Owd%x{KmMWHHhq9rnSgp2W
zexsI~7TW{Py&D}*=NZJNz1Zyyg5E?_Y5|Bhy3{dLZmT$n^Aj1c2>p~4w!zj@R(pI{
z62&%o_-PpE19U3*&XPt%DC|3Y2NDpu{C;or2CKqx4uJKP-lm6WuSN0*q11BJB#vpl
zXt&WygTFF;A<A>7f<Zpt6<A4}44&yfi*9Wh*$PKo){>p{uV{b7F?>n97fn7g^ix5z
zw$GVMb6qfZ@~^;|`P%=-KvXaq+vb~yY%25DWV$=uGGt_NkOuEE(w{6|^*L?`(Sf=`
zPW4>64jzu~E@xT6If$SmL3~RasZ4y{5z!DY2>`1I6@v(^&V-$c6$R9<1S1BU$VCvg
zrG%%zYh<#^Jd7n%1{H_2g)f0Y!o#k*h7A|`R_p}M7pj(@5aZ;ywbDm^=M^Twmtd1^
zw8WS)Cjj_eD!7-;No~Th_^}Vv2`;>sL(P{Yay=cKsciPBgBI+knSL<q!uB2()KK{2
zt}giu>!{Yug?ZHm+XsAhIOofIn@J(7_z9T$v127Wf^6n~nQkFgM(w`n(4YDQG`gKs
z{PdEGoTec?{RbQm@6D2eF*`>;nBJn3lPwx@Dw#b4E$YVSVMxCqMYkm5Pc+JAF%t4C
zqMHR~24mM2xEe%l_<nTcElbjUk1>Y)Vx3AZoxvLX6aEd`?&XogXUSqK2Kx_3HLwf+
zc1Xj%-~wcy2;PVX?|jx(zo^#Bx#g7_Z>I5d9!RkSA})2*jwD-+n_W7=e?>;r{h747
ze>nfuiw^!*DY#BPeZP=bohQ8(tyQrD*vyc)U&rTmwVUmJVn1BCqNd=crDFQlqqKb^
zMZy-nm!|Mjt6uz7avw#_?sa^PY`RelRv^ACq=QLkrUfV1gWGnQAp7*MM(`X!y-B{K
ze!LBS_-p$qfde;jY{<leS#uF?*#6NA@}HlYHqxX>Ax;={+JPOVMR8dh@1R9Z#NYLf
zrn96P(Wv%IwpwV<bvqr!>5opbfHn57n}bO&ZqwFJfn2b0Mx!5?dVlZCH)|ykBM>G1
zELUm;$IvHoUH@PZ3I*RQz;z#1uI)4|{lvUdTD81Cv+4Hv{J@CaJl#3|V{i@ZK$;?L
z-d8zw`U%<Et%kJg_I0vgA!Q?@6*IsffAHXc`%`d8xL0)7{r~Q<wjLZ+DHTqEo5+=}
zcnw0vqp5xg-+`c2!n8|$CO(^i1J8joP_jWxQO_rclR5Jm!G1KO!()}soCyciQ|_f`
zerIlSP5V|eH<dY5&f}M06a0VqLcEgnsy&^i#||CUVg2D#<*|MdmY1=5<FqvJB4%gP
zue4(bowgcuu2Mk9tn*FE8LqibvR&q^Xf3+D_kSq(o10Dxh@3gQ(!;@410-kq|1gF1
z#Pmb-Vf`^qZ=r#ozi&^3Zgjo}pW+lvLgyW#(gt|8Ic}<mYi^b;oawD&+h84LG!+yH
zu<li8MC9Lgtp1zd{#KoeK~+eXA6^d^AV&PP$9l0$evSi}Ys6_7N&n6|;|av(Z||OQ
zMD&KCTk*=wU-df%5y@-d*g8AZY<}Zs&WF8DR9@vsu3s52kr)RuhyKtYSloh*!e;xq
zISIBq(B;b7<}^mO9P>6;u38=bL@XMO@`_LQRUhB$9=TMLO|1YpLH`a(taFz`85&OV
z^&G0d^ZE@|u2b+UF(mZ!<H^F>@>w#iB7_?UZ{7lGiA-+|p*IKo1D8y82AdBi)_gf}
zZS1z;gvP`6_)6U_z_d&(8CE83q&Hyy8duBFr%l_W=khq<-bWN1pr9i&OK&KkrpX4^
zH|kM(un&d<L%?u*#Qe@`nS1kHCbrqTV>P%~by5=u;`UT)HX3HvxLY)4+v91VE>>$p
zLqqdk92lF}WhQ$j<$Rh~dtdK}dK{39U_DOtT)wbaAJ91Ry4X`;S&u+Aoz)%<fBK9(
zaWMTM+1R*&`ZP7ik!Sf;Z@Pd7G%^e>_U4(h*Agc-S)D=Taont3MGMp!^U|a^!kR6N
z4(zt=%r}h*!y74lbu;Sm_j={^v*z){+Ukdl=O92A6%R;P{IhJj3lcyKXvP&gY&Z<!
zMrBQ&*ahgF_;T3zTqU5y&X`%J5NkltYtCeHw>XbVm2a4wC^L=xzvXgTsr0;eAqOEL
ztfyComAw0ES=QQ5t@C96n+>HGGmHPQ!Nvu=P<5)sEkrmgW<W@kFJPA4qeb-&M-7dd
z`8SW9_CUhyRJwOjru<XjqfGqvG#zV12sqO8?a_Ai-v5AMs|#U4gRxjG!mvEN5wR^m
zts#dN1=db4XS%^|Uo;){0&6s(VsYe8j(}hUM69mUbmKt^Rz~vo-|Wq{Gbr<kmu+6s
z;y}7YYzc!(R;TX*hg&XNOq+WfqhSWYvRx}6Ynn~H)-c$~LM60Hj?N{p09UD<I;8l$
z{TFRG3<n&&Oh47e_Ct1`<f`jOdm29|<o>$(b^KA||5gvBKN6(1Vto#pA}{^R<x2WF
z-!$6~z)TlOddRCl&sTXt2jz{gPr9&0EX@^n!2`uI$Wx5evYFh_NmNVU>|{W91|zkS
zaeJW1LoV%C@_J=X#SSWTpQ5MF@0v)cFAmy`Qt%KKXu~bG8qt)hbwqFwM#vl%oMt5U
zgqv+#F{d1oE7XThyvfsF9cNGPx51vUrO60|W_9pKfoWZNDMIWxRqR<z%ZF>PTL!DG
z*+Nv#|M8Z|L<*sHvDb+#r=A({r`13iIxR;OhTh<Wnzn39R1hp*v@vB!7{k<+Q4TnL
z=#psz>+*>S?bQE|MY#X4D4XpGz#>kU(=W<Yugns0gB^9lV1^Dk{a}>}MajSAnou=*
z07$av*k*8J_;2BKDRomHxDi_<`kRgF8jL-r^(poa_^&Une|<;L0hmD+A1+KAnN>`g
zU(q|rzwytWktshF59c(s6;kvlu0SRx(*-BU?Kzx}xh3c_W{r(_=-RKj;qZ>RxC&cx
zj;++Mqi#nYA`Pog!O2hBRA?Cpdyur;@8d#5;{WkP<r!H~M?kViAY+k6WWDtv<JbM!
zUOy9Lydptz=LspWQW`biTnqrCn8W{!Vl5=`UY4y=m;|^wrX7wqpjz#=yz!@j6WEAY
z`XhfQa|HrKG^6qP5E96wg)drE`?(N=g$P)A(i5)ua``m2uC*CIUQ%=krYf6m$@Rt-
zD{HLI&~K<A0eCVVPep$E<E^&@BprKzcBY7Q1CRW}<;<UUYc7@{6B%#*#kXvkfy#d3
zyGG2`>sqEj>^E6`6^Fw*Flo#SOOMj~@-2wo;Sh(|Z00Ciq;dsJxKX8&t9z$92B>?e
zu^%AHE1Dlo56k2QU<&M*G%SXqNfhDfd<JbaiN>fMhCEXu%uqcPXg=+YFZvPHUb`;%
zkp8ekrzB`{U})7@R;<n<TW2httM}fz>qN0xC-!aN3&4h5TkOi~Oi*?ymB?n<r+LHw
z8Ri$UCPWw@QJS8@!Xv!yi8h`-qvwPErOr|An#9h2y>c}D+aV@bfBZJ##g`^y2?m6J
z)=(WYEx<VXR<%kAnbXDmNB#>sSx4@(%MBUX%f3<q*6EY7-?BdG=vSoTe-gyQLrY{W
zZ7ypJOi~$Oe#M9~spD(#WRWhsX=lg6($|iD0zj-u75zIvn!TD&S<5v_iOV1q{EP{B
zz<vX-g&|)7r)T&kK`68n?wBCMV_L0TA}_{`(ByV-1^6E9+fBbfgxZpUre}_`)9Y;K
zj8j09X2v43QD?ALp|e|(Az@d29E>IT;ca+D!v6Kna*vw%HfW=TR$z&D#HcsYdu)7x
zn#QnAwi(kV&X%RMU7aPQ&*oInIMQo#uT|YMRxD_rH`>&vRq)odnU0M<nIn?Jp!L6%
z-;wkK)oQI@>`Bsa<=NnGpC*8j!j<W81QOr-o4sWzmi|~`IVixENS6I>>%>T7AXtjo
zdbJa34Le8T%jc+G(JpAVQl?U6)Gnadq_CL7V(2`8$2u};F6AA{csK(>Bk8>=v;lWx
zSNpcj&%WOF%Y31Z^Djsf-uaDcJ;7_@cW1_dd|W6xq=YIf3^@B70>+&V+(&V2FI}HE
zT=yqjYN@LX8E2GyX;U~nr!2IfVqlIjs$S{e=5HzEEO*nh*MJ;4B%-&tK%ZMn=kybs
zjTSNUotOVAO55Y{L{2zX_5heSGSa@AP7wS6>YEs9_yShNV|6P;LM~JFlu|b8-=Cd-
zq}@a#alo+IUNAFv5ZuI>iXu~tQ%2|i&bb&K8MSvqw^Iw;g=D-};ZEGf&8uJXIZgH0
z?%Xc$K<f7Hxw_HjwM$_;aHkA)N?@l@t8XGz<v)ABy9<Qr(<w~bG780Q{jpL0FlW}z
zqOnjR#?%%p7&A4#1j_Myw*|aJ5&`effovK#$iJ?2v4URlkIppybE9uqaYNuf|Lh%r
zfGK71@~Xx9x-$q@wD+dskBlR0cEDUgDiB@5Tn3AQZ!Jr3q&ks#A&_3<lH&*AS^0=y
z?_HG<`4o{t9WbJ3Y@4_<c4tTt0iC#9;n_mJFmFD0Xa#2hUHCinF~igE`k&s&6sf4)
zeA^L;0pR(`I$_5*X-@GCpRrd&OlvsQAAV}#Pw~;vhs0ifo`sk8Nua%2d@n^=f6U3F
zaMz2jLe|D+GDQwQ#d0%na6^G?(6?;5Tb%vTEbPvYzu3zi9&Da}Pe2%K96ZKXhwS#-
z!Z4aK`_3q%4rnwNu~Rmoy{ls|5u5f~G4VY1<<}#!{bC+3g<u8R;4f+zx%cUNf)69f
zqRz0Ze`jJuBq56%E~i~UA79T|cKlgIwe4}XjhLN%Dv|MmmCin7t4*&AaXzhvIjw2L
zY4N%TNvhIpHf7K$y}Kiblo0bV_of_$`iVt%eJyNx8_=$$YCV<!$x=H-|2NZDGzHV;
zVl^P;yVq**@x}*Oj?fWp54Qu8hTm*m!fOxQ)4uDZ(8s6|ERCC#Jtq?$>Ja4AQje!k
z`IQ4^(?&8R`uLshx#8P^D@zwA9U?ZXLZl+vkeTd8ovIJ=lu<44Jy}7>PLA;|$zGDX
zQ9E##sCt#$=&$!*zu`th3ej&n|HA_AK8x#IZ{YHRNTg^hl5(Rb+Dx_1<d!`jqt&ES
ztXG+?H8-{f(An?00cmEs+ZU&JRy})Ef5oJ!+f2{G*JZLr1&Hj#Kx}`QkKxG2er>qP
zd@FvyfpCe2_Y4BO>(mtY)~24ZlylVQPMQs*sDz$F0d6)|Pmy^1p!{xRI*%B1HwyAi
zaY=oZ&MS6)DKpqpdArGeL8FxP59Bx6x4^i_so>|=Ox2C@M(a6b1l*7Gf&fnzKJpr-
zM~X^iZ`zQ(gNVmk{+rS`q3z$jK~ei<LC7thz%Ph4XLi)9`;D1n^I2>*XB4(vy)6&N
z>b^<!dFS9+WofPPf-^1pQ|^q0W&Z2~{!8{f|F!I}XTS|v{M}*w$(*3O5}e(^sF9Fl
z#XU4~{i%h_FSbnug5*KINwj2IVb2f*-Z5*<#=P8PbUu7#+A-^Q3fVkJJm0}6tcY_U
zF7dDTJ8idDEQYy%^r2k03xxZvMt1le6owKJhyII>*&-aw`o&tvbS9^MKh*P+?q}xc
zOC`8IM>h6Cl{RGaUi4bj&=l`0oJy4zG69LC6>k{E{L1f_7oJz+n^R2ek+1bV9CPE0
z)#~1~8J@tygGl*<m2l<XdjmaSsq#jntmmKh_4~uC0O+6pDL5WhMt~}R0V5KskC`2T
zL2SHmMQm_GRIStO4M7>b&oGaQhK)aaTCMTB#xV~geY%_C+v9lsK{%F@wAE2(PSeit
zK@+e<ZgE-Ug?f=wfumhoEniTEEbXd*bKq%6zGQPhtfyaj=p-GTa%ab$exoz(5W3U(
zGL;)(iZ?$s=$^ad*Nn9FY`gKVmmV_zkp=u*usfPQZKHO4b|eEU{0QtvU42+sm@R_x
zYJv)!eOcH~UT~E=lmbsQylLZ(9??=o&m?oFSl3rok|fN<`&zG|s_Ov^?;d0sF@JHU
zVp;!om(8APf9C$Okfk=~i{Q@p_of`-K|>gD>S)?7Oe^kObD%U;8Jd?-QM*CI$`8?g
zj!IR~N<Qm-HJ?|c4n@25AwB^dI<hol-?#tySICUG8&KxGaC;2+OD#*Ht@6y1B#12P
z(5-F`*X3`dKzgrQhS^Ojb?zsn2w1iLrwPbnA@_Xnrz9^FqYl~oZ#XOT(4;w6v}mXG
zB+TS_;~%@(I|Av?GFhAxF~M|Gek#}`5~Ykw^I#{H@hhY&+!b#O`qY!&9x%yCL#{MT
z<?LD7htMVDUHUKf)0G)9(EL+EAu+u-?OFcv4u7Jt=WT&<hO`qIqb?o`yzw-y9Djjm
zgu`LsQp@ml=`IMg^IZ|{dqwu;*psrf=F2*dhLjfZZ&(F&Cei`-V&t(2U-dcYUO5~N
z0|8C)ni$XdGB{tvD})W8>%VBXc2e!``%;?<MwVhVV5M$4b{rgLfPH^0k;&>A<5<|w
z?;d*yf=R~2bsndJR2n=G;@(ctUUqGP7z_F0_^enN{0UJ9XReW;l4tD7N+~stug)Jo
z8(e@(5fzytT(DH%Eh&L*1yIa82mcn0)JIkaV_6JsVaO4{++H(ZYVs4PPvAnmY<_1g
zfXio)NN~<5^uorFy2IDLj+0(12mO<%GH9S~>N}>VYa|@fT7(a1H$g_FfBLpq?=B)S
zC&{ZXRIC!ysuHUWPr?c5G=NRRvmsikIO(t-h>G{pu)QKA{g!fzIsb3pDCR_}(g7L`
z6xu{pzK!Yxc=$NqwpPv>3+ZA*1Jyy>g(H_ke={FIXUPH}Uun0HYz+lK(9{Yy%%^=f
z2lKuTT&!VOQi|%(5fvF2X69XS>=4VlJK>~WcwH36ogt6tM4yu22Wx8A7dnpY=;N|M
zL(t{9jrf6iVl7mFuU~YJ%J3<2=v+dddna^aTUXX7qTety?F4;sCMgu^<usQ0M}jZ~
z$Zc~~FD890{r%ZUBK;2dQ<y4*kl&O!b8WT+YR&?9K$89sYi|Kn*R%8sVnKpC1b25k
zxO;Gi;F{nB2=3(IF2UUb!QEYhySuwPc{~4m-<vfvYrZ%0-C50IowLv0=X7;fSN*EG
zt4et~C>I;p)5kr-j+V`&DX}TKuETsO0Mc5ejE=BJNjKy0`dc<ueRR3+?(6xh11Ne#
z_c*+ObT<b}f-w!_p8*WYzDxf#q3F6H{&FurgWWgfVk&|e9XSjLp?x5W#{TjX^R38(
zn#Pb)tBV_!C0*Db*K4tj&4;|TX4n@$a}AuP1hNNZ3Kmfq*0+l$pIXnBL8h=<u*TgS
z^T4bPAS(a7{_@vQDM5)AdO{-<a;Eg_V4PQ&>!#g4ElW`g>VsB=QZ99+;7x-sO+No!
z>pJpP1Y}?eA`VD?*n~;i>~GLI{uR#`s_1}!VZz)*JkI=<)pqRnHTR+WoLTEYGR){5
zq)I1q*c%hAq)4wpCo?%b`TO@%qUg$ybgCy|ex&f^u98(0#heVPwxsXF;OEcZ&TZ|u
zThbJ&Wx1Ou??+MXmQT#?(s<TA`JeX`f`29k@byY*3wA6+@%29KI{S2oikDqag^UR{
zaOu0{d@F!BR0@QBR0@c@iWny!sOY%+;QcTOt}ZP)6SUh!a8an+&hS0SmBsXC;5<x0
z;+H0Lgjsb2pX)t!OCo;0{i)HaD$4bN&-uq&)E|C0rPP-LiJpwLRS}e`xd@sJFASHq
z!ZcUibi0DHWPR5r*O!5EAm%R!{Hx($fH)~RUWqsO?(G`YcBN58*nZ{E%UHVkKC|UU
zEnwTv^L$&j!20&9zw1ugoBXw5wxQ2s;u#TVf>~~xK1R#UtQL-HfgE<-$Q1#*>z9{3
zexH?BXQ|TZx?}eGrQJA&*Z#}1wtc%Jubgk>g)q{eef@o%9gffST>Mu({cnkRg*p_h
ze-5mN8R#~GHooedf89c}ZX0m3iP(609A-HX%Jjow#D``c;#Y34wr78L%)Yi9L=!G_
z+w1(A;23O>7cI+5AY#XT^wTIlo$|bucl=;|rjJFEx;DYwDKK!P`t8A%6iprmBxZvt
z4A#E8pL_9weq}9(&I+3?wc4ukU0)M1!I*V7)pnwjN%&J7i+aFep|Qzh;LEh?e0_TZ
z#NK_~0ZZ3SkEW5xa}cMMRa+@~MSuKZ6ZU~#9$DaZ$5~%TcF(^3HPfsxgH1>HPDbzv
z70=2k3>z+<2E-T0i2C^>y>2`ojnpK&fsba}?_qbHsWYEUNmKnR388~kcT0PZr<DCe
zy>czaxN^d}L5_Aq_#$8aP=Rd*-fF?TDid5XO*yXbOUc`Y?ssRu8di<Nr0B-np<!1_
z2#!n=?hf3+Srng(lg;SXf25;0Hy@%|yKp90>G7;jsU_#}xqO+frNb;1l8$7f<_BvZ
zieEvM$GOC`A`|pee1C++`BgL3d+B;m`TTLRC%>!_)T?Wz<uhOM(y!`j9-6I{#Jp1=
z!JaRt8@ITEku&%(MajYtt@uHy?s#T5xwTY*MaB-f96xyh4f<_rq=Ic$^x-NN+^@1b
zyq3&WQl^JerOBLhU>pdJxPijR>+p9|cumKA45{;}*&_dhRT5P##U8s~d+b?lbMTrc
zHIXUUQkRnOKH3c>tYkgGHrv%{N@&<B(wroTFU-#Oa~EQDX#toxQ^LOWv7YZHZO5nq
zsqy0{G<{})5>-~P_7FvsW&aS@QM)G`a*jr6yDGTw^jAY_vSloO34kl}M)m5C9(PRJ
z7#(eDMKe8)cs-2I!aax=9o0Hy+@+*Jyio%fr9-5KidBwka0I6WkKT_EY;G4a@#%w<
zABHSv5KKy=KD=hH<Q6H{2byuB=nhp$RJGd=vc@Ab?HBkuAA2Bk+01mhS~Ts1a=(j1
zFm1|tpqWeG-s1-gB&XF^P2!6WCyBOaHry9v@c)SsXBzU1lK3Wg9ihn?lBZs=GpI|i
zBaFsk(3(*A@mhg42K5V&^N#H@ekBbarAif*A!&K>>};Sk8IMLqPADaRvBI8Ysak^^
z)XrFRvvcDuYRBqxg1m!fozZF(xmEVZ0gu0*Z`d|ho?0>0#tA9W)dvWJc@;0*i7)6k
z8)8db*<mWWt6W%P=@7`GznBWEVAPjVD;m4_+RW{v9pit)O=v7%A6HhNlAbj-Qp%*;
zC?S~CE*PGt_Q`uRQGlA2HoK=Xlee3Q!7_M@rscS5k1?f_BI<;GkvH$=z>!0L{`5nl
z<nj`4Z}aB?363aAZ0Fqd2ye*~H~xLBqUz&bmF@?&mBy1?gar_hwz-<moZ?%=Y?VQD
zoy~`gD|2&dN1y7b2K-}Ot94oak+wO<Osh47^tZwnJ6iqCTE=bmt}dZ1s-OCni7Z|H
zKcMuZ>j;~3v?zgGdLf!acqgJZC<qtX{plyvjKQW1phVn~a6QwHlUH>!eI+k)Ys#%B
zh0O2a#+AKwj?SdyVBb(Iy@n5vEG+|Re+K|v9$MeLX>iEoNa#uT7_({^A|;uO@Llqb
z_uOy0mnD}Zh<9<p+5}D{vfS2Ch+T%#Plsj{U7@sogV0|XYGJI6$S7vR*O_V|Qldpp
zSaH)rmZpvtZhxncAt0I-0y><eyO~=)f7Cebb02q7pAxUV=65~Wn1!{Ux*HH+4H(<g
zK%opp_MRSXi1nIQm8E7KzAvLdh6L}VW{BH>Oe6cNSX=I`d4PxxM)6zwh8x@BOWWWM
z0=+&e-j`9u$o1t!f<YlQcLvSUGVh*I!Airg5gPleYacRXsOU?))S|eXPSKWcewY?N
zGp*6isy5*6kLPg_a*9)ha=WYShaZ&HjB6Iv+SUSWcQ&!vQ=*&rQ`g;dVbl3Vdws!S
z`R=sDd)f8Lp4r_T!TT-6-6=^8tUWnkIuN;gX&kM&)(-tgWmeAMPrR0)ccPZWqxK)7
z?I=)Bl+T7wJ-DWJ8VCq91Iw%j`S31QiF-ENPe5$jnnkR9X*T+56rtRloHv6)%-%h2
zDBj+ulz9^)6si!W)3K>{<Z0=v7CIN2AZ)uP*06R|a~p}tzuT`ImG<*OhR`H(J*)QH
zUX=dLB^!|BnEL}*8)2>{J&>p5X6e}el1HUNDVoo6^?f}e?(a!&KG*X_@doGff=GFS
z>){_8;jLmd?|o?a_O|3J3fo!(YAKJ+l2d9jF9;eEz2-jwDc#nNxff@rXaqJLXq5zz
z5+WFKU)#689W9;iiRf%Q88}wr6!3SleBUzs1pZ^l`NSW)3x{q39RsBZCrwHmD;gQg
zs&2beV17Jjt6uPh>&wE1%ydLrnhyFfm+YKBJn#K}mhWc{clyiDO_j(GN6=s=1)&H1
zu_%*g-l;M!CNuDl<`cZUINE99Mq=OBCh*a0X^;H!{1kTeFoj;Jcv*Tp6(o%SyQ1qY
zWzCE4gJT}f-TJm{QQimc2_hE_JU79baQ<eegxxsukC!pfG$>W<45z!2*EjH9S0Hwy
zO803^yJf<tI1k#;OS6xzBTmD&$}B_u>}KnSB1JCQqag7iU5jG)D%H7VdlrtN%E8HT
z0kvN~uYoQ-O2gRhiMV*Ot|(QfOAR^3tw_;w7^63j`}+q`NLvSO2^4+!@izr^$2?Z@
z<(!|V27_9LE%y_O$|YMAU>9xY&%8cxo5dWe?CzQ@j|+2rdl{<Xj-DbsQ(rFLjh;aU
z6pVt~gXovVD|L;sy%YMHMsxi5z0s)KW8An&Ca^X?Z{q&T<G!Jc#mVdKKJy0w=L7>D
z9@jWg?j7FM8I?R~<h;54R5-z%ciz`~ztn%n678BVgN(OBX|i&fu5qj!z#Pi^QqRTg
zaXA^ivg3{EVG{4s2jpiyWSB;f81F1nZXJC`K9+@51Crkka}>4(N*y(s6AY8pD-c{$
z!Zb+(wb;SoW;{mKD6rui;}somQohw~s`neslq0tE?Xkci%|$sA9-Vmoj!5+mnMH4p
z_5N6<)|%#B?cumx2!`ru)tbFgx7<#VNX(s7Jv#gy`OH}a?rO>eJ-!92b=tB-g%<01
zL-iU9m(e$%80!f52Xpc#<5U^4`|s66>W?*xUCU2w;^_!|I{X|QflVca{VKyM&%{wD
zHK`OYjTv#0)GJ>54%6I8sI=F6f<@BENp~uQ*Br}S7)>8@e_L9(!BrGw8PbxVq<|^8
z`0wzhr`nwq(`oNt+LEJo%qP{=wev>l-7)&eG;`OOEiC1+5A}|yW8;078dF@Wm?)w&
zuU;YvND6q}Mqq}+n?Kp5{@4d}(Xi_lp5qCd!sof)C2{)l0k@XFe?9*h$=Qy!FO+1{
zy_hm_S)82Hmfl9*BBeqXHoIsR4W#%8l1X#fhxFQpLE>2_N?+<>-`sA*8NK;3($W@z
zXtPl1zf2Y_jFKT68U3Z$5SO@lvyk|y>I5&jKnr&#V;{(0M4NT%fQ>J{!7Ws5p>TRt
zJ-;?Zv-9)C&Nkk^rkCxZ3r;$PSSKB}-u5}=*|~6zMtz;zqWWt{;<4Q#o2n+~wv6IU
zT2+M%Nl2Y|8FpHR?~ADK$x7dyai&0d(tAWiD<BW@<bCVMvt#?#-J%AK_P?4TO;cI|
z9~YzPC0TfjzKs$@xKY)y+VX9h{SB?CA3gE`^w~0T{nxhu2Oo}vatGbHuj2xW$OPQV
z(cSU-u2Wiu728y8sD&Q4$EiX`UFFlpPPLek2335mOWsC_L&@yr*>Nt|)ebiAimu2z
zcIWWo6R?pDM_xAvD=^c#hZ~01knc122nED%&D|AwRM{`SfwtA8)*@%fG#$8-C<bDq
z4uhuGyWPi>QNF5L0yhkT1uQwYvs_W?FhF9wX52Otem^yT*#y+A>)%f;xg0C(?{p$$
z$+SBVnjFtpNMG*@vNWWq7Q=hkwU&OTh_`R6N}#`Tx}zUz+1eXT`@H&O&qcF_xYWQA
zDcbRJg^~KSz{u3%f{nYW{U}8$pCnJh7tyhfKae+Lzrfqehp!Z0O@%+ueL`qL6|HxL
zj*^t~)S&k?H}p_%v?1jbD4$QfNZ8odWBT18gzC&5`}57gv%)BaiW(14TVu9dFU=bv
zD)*$!X4-`}WR9#}{~57Zf4SbHY1;B*5l|KHaNsJ^c(Bq~J>!*=5<3}d@&{c11W;G1
zXy5S&je%#yZF=<O*A!17#r}>yP`PBY@ZNy8VydJlQ%+0YrH*f=K2Dg2M{7A5zL?_s
zn&lHQIj-4?*v?3leJ#P`cyFj$Z71zq6?GG{sZYnBJA&7mZzRt}>J#nPA4cNt$IAuK
zMfwGQ9hMYXsA9e`mrV(uR5sbI!ty0NR;cvAdgz<~uHyG?P~nr?6+UakxtVBWJ5pYD
zQakWrcM>}r9T}a!9&EA8YHt^D*rFjTO~9Ydmz}mcte%f3vKrcYWYiOCPY(Z5{e75r
z9a(*NbR@^RqNR@$=V$rQ+;H@`5Dz%h^X;7}&ho1$G@No#)EWXsoT&4_)xFk4GuQE<
z$QdNxWe{eu=>Xyl+vlO{CxY{dp6HJW`b?qIl?#vkj{5E$9>>3SKlI-|w%rG~+A75V
z*(GqFFXvgR&!eBWLiPIdDs?p5QqinVt=9l*{74^7@(zkkN+cX@#OrfvRiNpH@eM>n
zJXl+L0<$SOghJ^8+^$<^9ee_Nbv1il?)ee6dk|gx;N^M@*}cN6Hqo4z$9Bmk?H>M3
znLk6gdXcvt&mJxK+ewx5aS^~CyIa8-d>8Cn-`;UGs*~le0QF9P&#7qbhB}uf<hk@`
z>U+Y)0l%dYV+ojy43DY6)?uN*Q^;Y#r?KS%kys0=iuhzR(-cKGzP_P@z+L;J2B~c{
zhTsL>nZw}Zvyf?f4xd=iTjSmmK0kOtw+@Bev6G9Mt^0iEEkBMeHx7UbXK&U#V6dzy
z++|>`yrW~t?qcEQV5$1Y-DvQMTu@FLZ$RB7!f03;;mF7;gS=thkQ(tc3qj=PmfaQg
ze&s-G_7;y=P<Rcdcs6AROYF)_9FZMw@9;UkWuu<2p#e(Zs8hq<H>WZ;h0y@D(_d#U
zPK2nh)VGfE(g+PQH*IR}-IB$Ww){RX6t!ND@0m((C7ll@RD5C=#1rv{TxJzR%YBoW
z^v$MTuj1BAuBo0VvfM2gKHP6uy)M{E?|2>8pSDt}n4UV(0+x|kx-G*%R}xF&aokSc
z;dV{o6%5*W_0C$&oo^rd!QI*`)Dn)}A@1Yt`^81VKHt!x*fH%=-s`>TcqJig0qk3!
z>cM0+o0X|9sb?vn8^Fxf_D_cFHXwXA!}mb_n7)7#r(|I@{)4TL`>5(uL!r^rSSnAt
zDHWz1&tRM4jsN6ZBzSe>jvuU7U$sFM|I{DlNm?vO_DK19v90u*?OQ7Op*9gxE3dcj
zZieMSr3z;{Tq#2$Gg}fZfI#I_KC!!8Npy4>u4DeVFGHtEZ)cIAQzW9;tBJ36;eyu)
zmq|k4nNvx`v|+g0egIQ1NWF6kZvfN>hOs-T^lPzdlWHZs_54nt_`ROzGRhad<b5Pf
z?d<51t}{oE(P5p<tHhmXu;6j8K}@uy=iN&mCM4<{v2cudS(@v||D_Xz|LOz~Ni;qO
z`wo9W98i@RNYg2*myz#xs>~Cw!Ci3Tu**UGbQ8RvMLt=g7{4GHt&nBB#X)mgHVhoO
zBTZjNDqu)YnmxLiKFGO5EtbAqUK@;uOJMpD;tK3w6#=yvQQrNQxgE~KB*_JaUBy0H
z&;EG3p*itW`gQko;k_{avO&ii!K+YFeSn&KY{2RV)41x~P3tCM!bcYqwZ?+*?k)~>
z!=!y@3Myz{Fo%%2vsq+6*&Neb61UURzg2+U;P-@Bq${%92#XiBvyMi2%jV;9eleeT
zOua7w=5?}7hEz0O<nH2;i=|gHnuG~ukoso_%URrB*T05MS|acCxd>Adtd{gEn&>z1
zvZ?|w$f`(=sk+ptOmDPZ#+tGBm-a@ZCw+Uy$mR~+QWI<m5fSfD_P=`t1)3MXofftu
zbG6&r2FgTZCrfYumS;vvqHGFwP2EA|78XHi0us8(?jpbQfeZkKeU$OuX3|-vixo>)
zBso#4xW3G6VE27LIL{KcdGXJ5Kl<FUF8p#qQEYFR1-+5<OV4fV?xUa~2&D=*`c$}V
zcU-d0z`r%~wqV*Gx=|SJHStq}!N6r2H%PoZ`U970+5_$LbfMx@NBD>%=<`*=;gZDH
zCh4am<aw9rOL)yFFHeHbQUv@{M^m3kQ;dw;kRE8?4s`Hb%X69*ou)acN>AOOE)ijy
z2n1Cor<oadJzY4yV?S5{WUO=Td$#BGu-I16`sDHp=f{|v;;CL>AHG(HvOAP*WW7ta
zz|l)9F7Cv(l0Y8H?XT8v0zkCg6XmzpfYB%zf}_d2XdJxpy=ou1fJ0hKt0Hvo+ceY4
zJP;`LoaD$`M+0@>0{2G8aWnc4Rosh1&;m7~P>iG=l3I!!snU1T4RkT$EiN}&*lt1S
zvqIO?F^<tSWiv(+Z5$Q@F%FAV@y*g>B4#W3hTDU3{=<^%>cnKWM^X-tn*~2bGWre)
z&$M3XxZx`0jO1T<SYP*Bi<$UsyvT&kUr-8hg|-E&39pQzh8J%R`s<~F@dO!!UVcz3
zWm@P;t!hivK2z`F<+edziVN&?9-y`CB$`tfi88>lyYYq*<tW*@huMYTUCRV@q(lpU
z)_t0G)4$7Tr!0Mr=-19hHHp(QTRcGHw>S}pJgzc&v-$b0@;)zz%c=NDfAK>yG-oC*
zT-kuz-6?>W@+K+3s>gHtR>@hOKFos8D>kN@w(CbfXh8a|l3Hp)jy5MVRT){WVLiXA
z=M9PuIWjkP?WC>ccZVYZG5)&W5pt^`kV}AwQjK)s_xAdcgl?x*uG%?9Lbgt-fXzvk
z6^`t9V~OY+%7&G8J1XfFKL*vl|0KnWoAS=BR^})uBH26Upj%F8)j1?_orjr;e1LxF
z{9DrwJriF&AMWYgZ|hIGFn1pX+!O?h^!Vh4<EgOi8`}wHjcBZ_G0HmjcAdXR6ZVWG
zJ;TP8v2=>-;81y3mc=(^kk<%rPb#we?;2!wnmB)HIC8~jZQG7A@Zk<ypgErZmA6Sj
zoc(o-SKcslAXNOM()eDbg?s;Slyt0g-LaR2ro=wWfH0*hetl}&sbYblqP>|hd(@0^
zo#~a_oOnK$S0SC%AR6lP3sI;QUX9G8z-RK9SBxWX8saN#6mGi%qdad8uLtOa{!)w;
zp306hui_=ihpjaGjw0h8=|?8f{Hwva(9`Uz5$X65W}ti~M~+v*5AIXPr-OK<8K!bO
zm$65%mSo6<cY`YOxs(3$y?e5rQ(eIK?iHVXhaPUtSxo6Fc{cv<|1%fB=5HmMOo!G`
z+}YbdcO)CA;OHqh1|ij=n_mL+W|@t10k#;{aiNjGf#X^79z2R*mzFb&r_+XYg~doG
z!W+{$$&3<T-}O$f?9edPM#q?WJjvCY9xu{Z-tQ<)S_IBolMa#Y`R9Xjh}ApEv*ll(
z+DUiui70$Fsh-PQ+FLFyZ@eEx?s~VUZ@$64LY<#HKHE3nR9i<BiJcJ~)1D8t*>%MC
zuL!Tys)o@^ki!ds&SL!nU*g7**POnfj+_sXI*(_rmLN8?IsHt!rXS+4U8)ThURY6R
z`aYO?)Vwsz?gE@mDn08g87uwuu`r{<2)*s1d&TekiQYb6FQbN2u)lz^5=c|4V|m%q
zODasn@+vB1blYLc>T)<0YL=Uwk1G5WBo%>l;<cYdggFXQrG2$HVYo`S<Lg~&8yR|D
z`}#7;xBw%K{Aq+FC4Hi1o+znilIW;9W#fsHkVYanq}F`h=l<Y)N^wbNl|heZ4WavS
zRJoZvy}G>dO0{|WF0;PbyE}-EQ1TvmJMU^LGt^|B>dh?%0=L|tN(uo9he&yCe}B|l
z)1DvSP*q-S#GbznyE_(_ZXWO@(@CpxdNJMeC$2l#gju<$fZV<xja)_8<(qAs1C=2n
zP^!9;YPgP|@jK2Y4o!qXs~h%oGoO7C_jw~xzFz$*R#;Z_x&5{+0hl9~ycGC<)bB^a
z%*D@I2C&{K>c^h~H4N(R(?$HhQbq&IncaeAw`8X6IWl!Rk*{8HSZn{Ze)1n{<Z2ls
z(Y3d-%b8qhrLsn8x25~)UTA_^N%xq(G&I8d!Y2yGJ>oWw`;D?o%uGO3Q%<!sV-Wyh
zqlyC`GNQ<2QYMF`LE3zW>vo5FG~3HpFO$?6^0|1?iI+>YH=IAUM}afoNh&6hC{+wv
zzas7~4==<~=E=R~M9*9AncIM<NR{N0_Xi6lm=$OXx($yrkAzV%k3fdi2{41^1h$sG
zWKqVFY717Rco~~+X)A>w>mKBjJxO%YQhxbr^Q0_IX1<~ON!4col#3cy!YJ{w6{FuQ
z1J}5%GKRj`ZrE(m1LF5zSJ?$q;xfumngH}Dx2O<p*S+lzT_>B|e=gyq5EsGoYdd6%
z;$b<h><))9^pxLrn9_jv98Z`8*0Gn6+snDLiaQkTd0{5BE9}0-!X+dT>8rbHM%f*e
zEU3kFApBJ`Mdxje;HejeDKAjCi_paU1gLlP{kY(!!xGK=c2@TlG&9z;pDF%&)~f&2
zs;=ID@Nm7A{5Mc;&OCMJ3zJ%Zp*g!%_}=Jie<fwbgT~86k5qHARwW|0UGXqi6ivrl
z|1x2sYusO}AtNvkuOig!g>CBGKBs+rlP_EaX1mJ@)zcSREl3+#E10F;fEOC29@I;*
z1ut$dSCrxUo@n*K>ZfMg`|;lo@j`!25DnTL!E{R5(C#U`n?X1N*L(0!-$+=fMoD^v
zUTvs$_n*ZE;F{;%43feG4tuxjiqo9lGQO?n5w!-H<;x~<2)^E^l>n{=uI+uGZdFmm
zd|Bkrk3}wk%VcyRJpWH}Fd@iYD22+SAHPU#n>w=iOXAOylY5R|`YmKeSVlDF)L)44
zgFv?l@rT7y$Xwtu65pj>k~?9fXXsyy$X}m6GY$2yx9=U--E0oLDbjJdhfZ+lW=Kh2
zBX*7nyH0tY|Ei2E$FeR<I2ry}B(sw=OV&5CC~HhMf-Da+9(X*vTR>fHh0JnzF*|QP
zcv>uYbbnI6mG0>kzFoX0%5_jPt~Hfh+JT~{crxtbq-fEY<u1kGGs!36*|gN?i0OTG
zxL+>Z5f^E;&DG$XP#fHu-LO$SQMc$w$5P>^`Ahe7A!SNduQ`?`WvK*6r{cWkzOSrc
zu;k5u94CpG{2&_B=iNN}xk%+2XTWM?%Il&_TIDbeZXhDR=IvYI9seeh9{~e(y3fby
zLiJ=Ct(UGSd11R1nNm$(^WPXwf7OgIWuRcUXi=Sj#`9{&qK@_M@T^B~NlYRFg*f|A
zvOtoWjY&bEdFNaD*RdU0%({d9(~c=i2CXZMZcjq8vtCzL97^bKqi$U9+><^Tw10km
zx+Of_;h%T$zvMAD9FkyPM7Hbr+W47ZWT0NNsA0xt{9`=<kNv8Yp@T09*8zhq*@$|^
zS~V4sla-(?-E*Dw{35eBojWF%Y?ffn?BSC141H_a9&=Q0mGLT%?hZFTO!T+75D`m<
zAmK+N+7TbShdlzHtWUVETu{9BGEKk61(TEgt!04nn~2_zyC0TX%}evHO#Ae5d_L{G
zawgSKD-fs{`;d7LyV_SqFS+i@_TI)T@x^|b<qe@pQO~yL_L8=KfCgjoHZZWHe+{dN
z8_G=lMii>)bkXH<&|>eqgP@s}k}Cneeu<k$=9dC;N^Q$*9`W4j+1dB8ojqD+%?Qu6
z)?S$F0%bT0uJtauZrd=eI5;>K-h@*>5Y0~9_$vy%&lr#5=<Dk%*N`8wAU{^yjtgT~
zF<rQb6>!WZCfe}U(NtH}_u)yTJyJ;JWRpxX=t9AxkQT;cGqCHxl=u`2Z<laT0jxCo
z=v&UYB>mO)S6pJuC(ywT?SjiDq<)e|ACq3!Q?Fe#n`HOAD!{b!PmHbuc1PqbSKIE)
z_z(P<KrG;h!dsMvZ_V7|=(bs6v{k>bdAe?UAmMB!q_|G^InRq?%h3q?<JhK!UjMVc
z2KDH0*jF%#5AEqnQ~1D>Fd`n&#6vm;<H1Z4&2+3Zq3pWPGm}#4Gv@~Ta{qJLv*N&X
z*?lmdBIl!n_&T=@o`)Ad7IRKH19Rw}pr(}ij;A3GizLg)67J5vijRR^aaPoWM}<L~
zn@y2Q?>$_z<3^_^w0_uw7ghZ{0k@6JEh=w<?Tz5g>o;MC4a`hZ&8T>8SC6Y9U5Fp&
zK!%kJ$^(&7O{POuyFfkx*lM6YsTDy5(!(Y=E9lgk+(mFV0rSywD75yuLhxqo>fRKG
za1<rk^>kU;+hEA@O+K9bXN!KyC5R?|GwtgI_GRec@No9HR{7RtvwhFo7?Wwn)vLmZ
z-!HueYteumPYrgOzOKoLd5I%?|7WC2DV-2M>8(xUD6~?p*e`VE9vce`O`Sc<!EIM)
z_Ll5#8kEWCtn|{h{UR{0!UmJopM0FLl6T+_0NjE`Q25f%AZ8OMp5Z*pGxUANphlo)
zdVRva%HFjtV<zH~^|^x6=I0Sf3T=(qrI$CX9r<tO$To?_XT%tmZ<il~r<_w_@Tbr(
zB8_5xrpLcO4YzcF^9PO)oFzo5c8hin=oFAN7>$32Hk8{X67piL6YQwF``DE$@e`aR
z6YA}GuL|BVOVJms2_(w0p)M3k3}HEMZ~GXYPKnY5SVH>B12~SkZnue&gonQg{OPsT
z?cgp*<<rqFhRD8}!MxCJXW^lSshMtCV!%QgcF2BwQ^d<2{wzsKvRk`(xggSM4&%%m
zYSL<0in07H6A9H^tGt+~-=m<g{&ZRGx&HK%sOd=3Xe<3e3y=`sLTgx@OauZR0<sAH
zfRM27K3ZnIg5q^8V10XT_Yz@)2AaQswHF>$B1GfC<an0|3<8BB(HoDLqwy(s-&XfY
z(+yZzoQR@mD~OJ5uZ<_3NO4RLg-%l})!XpWW4t8V_|0RqoK7ejj0`IF1GNMra0<kn
zWb(VlaP`Yao$6}}PR@At7%Jw;3=QaLD^4q({4O68KX%&5*sL1aaLh*aGnEh2zedP&
z5A(OW;Ja;*=)FWf(2oTO5(xi}{FHYWX`4HS-*DOZcEo^KqFeWKX&i-sJ5^|}SdV`3
zwcQ23+q!ub&*7G=<ym8~x~`?%j6>zNgwb>L&sqDD>B&-EczNrS$2P^`bHAnD&D5tj
zTBEr3KRy(<N2~L9i??a+18yCctxE&93wNs$$>M|lxR5u23wMDImy#X+pWZ|H@4#L`
zKEhLz7&t?Xpq7jKB)kBn1QnnuQt!2QaVVGHYtXAS(_}cIo)qQgim^<*@Sr7^AT?%c
zbBBDvt&@Dt_TJ#Z%2-$b#RoTS*z%%P?%I<%y_fcW{K}VtWE;<ovPA%oyjQGyvL}Nh
z9n+GX8JW%>VCw-HE`l9We*#c&Y2ipYF<BA`_s4Lg*fmu(5$DAT3vw_EF1hqZ-NFd$
z(h%|X*KtAc83~tq$HSpz)^tox-i_%ANF3s77pdqfK|UE_0eQD%@v_XA+z-CW7z(H7
zgwL`oGm>n0NaaS)p0OYdo53m(K;>kk>9^{gVe+*=O`XgfAYY2L`xWB*V*Tea$ZKgQ
z(d1E>*`j&ZmQ=fA$MCn84CdB^_jq8D!`8X|iQ-tHWzVtJ$D5t_aoFLgYlHxi+!5n|
z&Y&+4keE;hJk%fuBT<MeV@Mb<z>5+=eq&TBtpguA)GW;`RW<u;M)5V%O=A5Z&>*08
ziTnZIdn~B;?ctP9nARC3%A}S0lQ81WzJ-jd(xj8>pIY6zw2Qp&hq6I0y9V9B)-I)5
z)r*DYBO9wCB_$NG60AmX??|`fO;)-uss!VBOkj}BT0(h(j_a-@i2YTg>cfaIh_S$|
zkC9-bPQvz6ZG4lt#pn;IV1bb~&0im!WnRT^!XJZ!XX=h4MU&lUIZUOcA+8F<{WDZy
zezQZiKn6g<K#@U!7eoeo?^{!9jK=$MUwfbH4x<$caYmzO8K_ax#szr>#)oQlOK7G$
zJ<ki9U5=03v)u3AdHCEBzJivBYW|7^!5>+F3f{3CL_Yyep2>;Lyu$$!o}+!UB9p$b
znNmyC=0<rMrtXCFk)fdiV1K<}Ys-XJLQWYbP80<bi%-3jkiySLEs9{hD^FaA&@YG)
z7}+3+&fiqA9Rs?8;nk(;Gr7Gu|55~l9;DE~*ou&9pev76UU>oNmP+nhz7J+23%f7o
zM$$tgnV1dlrI+inxZs4-yON()s;5meh;oi9Y`bp*EVSr%(1W5sWu>-+qnTS?fDo?q
zCW@IF?1d7;+ym|8PqJPx$~_{0?1eNygi#Som*#&=&5?>cs&yWcZ^ta~43?CfX&Kk|
zAvu3#-wGmuieV9!8Gc33r#9kA@YI2T=tB1sw{h^=a?#jlT&TGW5XkY}&ySBPlEow`
zbj}<sQDsy5vR32C15}pJ!V#?3tvgaLQI&K_*%wHj=#~us{1icR^VRO;;IGB!+<!wi
z)4Ir3DE(&t2Xg6od|h2zTSB8$qu>MAmmjRFZJwyBv%aLSFV`%E&kiwe@RZ?%)WlB3
zD(+GcuZ02)J_nXyub_T-UVt0nBmXjL`+#nTnkPFuZA<mHJ|wRJ#8s3*NEknnFXTqf
z-xFz&_Ru^b&`l`r2tsGpVeYGxr4B4{DxN`NCzGm@;tFlj?Wx-f;eKCaH^|`4G=`~_
zEMU`z5<rxT+zc&H<`$PunC~PLd_^qgB&pYR66q@m-ALhN=iY`s>H97w79kk=)I8*o
znen7hb#<HxEz+79jBuF2D+y(<BTe)f&Ce@N2;&;gq&(f9m*z2|An|`Y%ZD3K$VMh;
zpBy(G;04BdUpp~5-6CahbKs5_JJ?jXbB~DyL(L}(6QwG2@=gelwP|=vs&{oDK%XCW
z!AV(<RpflB0kr+$n!mUyd&w|Onn@2$y->!(Ac!w9Z;wy5qT>=p@MTbfMkkgA5{-2v
zCkz8;?YVuy7Y|j=uU`Ut>$_jmIwiO705aA~Occb9I2elm@4EN*OOYr4vvyJ%Fy5}V
z{w2&Un9DIt5(*0VEP)254B*TYfHS?(O|a#Jgl;pt9P`(~ep#e3=~wZt%BR#+Z;*FW
z4~}vHAkJ+M_W>FT{&;o<GxP{$mRG7}!`lGWm^7te_eVZ&_s_rG|BMZe1rSo|ZPU1W
zM^@`~Ruh!G4F{c2H&H%lt<w^`wHE%aop^zL-HZN}W*N|+c5tV1r}guI#L)?qzeZO3
z?Y!e=$TG_~WsWu&`3jrLkIt<{h5F<a*76C`Rs8*XIO3rok<nDH64~v%+OLv*lEC>t
zYlV47G!mGI^xYcEjAiLB+Uy!9`48EdgdI)>$6pVo<eQaOo9jyC62B~cp<yTfM!F9H
z6i&=A@V(Z5dH~Mvkq`Eh<C{;HDfPsUyB(@+)}A%2^iG<jsooyV(zS@aW1_cFR76=`
z_58exTY8YFWsoQAdK&ib6D@}n{KJT`+f`A2^cEGEEda6)%D)or;+$t}&3DSJS0l0`
z#6q+K0r4(>2<cHKwNOmbUqp<;XeX|_6)OHs`7YVsdXA<2`tC_q)4fc&F7EE--J^R#
zRuQ!%6(?me;Xjh&3(QHnalwQUN)_DQo8>l-@pwhf1MWPw-4}w)Hz=R?JatU`FM!)R
z?<|=%n~*Ffb8|A8exbu2Z~$M;xXlb}lv<<4H3%n%xi2=#VD6Br?l>6c!;835NHX7^
z2ij0d6Xa#Y0e^K#F%@REO$)OG?CAV9D(t|IpHV=JIgzL(9H2nOD138}pqnIv;Eg~L
zUeOmq7wMqOIz787AtO<Y6%!(bfC(Vmz)6OALe@D{(X@-BR539(A;tKIf<$!q9VCWv
z!rx@vmMr9-i>g0uERu_7bBdMCQ)pr5Som!%ghO0ZCP#;9FsSKzd_Yp3Rf#hzwKz`1
zN>(0ge-%*cZTFtt4r)f>RhBU(u!bqCX6V3`6AIJ^pY%8PZE3Y<*ho;2#6&LCX4GW_
z+$zzWf?dND_^GT*{!P*{EoRd*iWNHjOoe2(Fh(rYxzKx28-EBi2Leb6%OTHZx!8+D
z3Fp9!e6(I}U6_b!1n&<_sg1&_FcD70Aa+%s1U^3s3R{Gg<d5)p&&Ut_DZ0!;F2P>C
zaF#Fc(PUg;B0g>P-|vasWt3?%Ob%0#$!PtQ$Ie8BPq2px;O%+O{#WjcmC5-(V9mF|
zLu4Ji^u!?u1JJLHc)1cC4O%@ZDQQugona((YO0aqolZIO{0J<`Z2-Bv7S_(5UK-Ph
z>7eLhZQhsStC?uhmY=h2%U3gZdo=gHK7-%!b0iXxYt@`;<A0jx4y$B8iMC_0uh~}D
zWi{OiZ1x4;hx{(HiThLOPKFuaN5CHZZMjpv3VQuu9idCdLIENr%%E^(i*Z3aMu7s#
ze3pj{+^^}Uucql#tV^cjL-HzB_v2d{<Ece?-TC0@lem!A!f@vDL#n*=V<(TJjc2Ki
z6vH38uc7*{Gfic3i#tQV;Sb``PHQ%N9IzYdU7F~1p1uJfEdB*G2{_e8E@s2J<M6AM
zJe$9FxG0hn`aKAiIA@1UP%wjD{a3LpauOY@b0*B11`Ca9--<V{y6UI0S?<)gOjw}!
zIF3@rPkeJ8uz9kaxmG5t>SORp;dd`Qb8)v{Kg=l--rl<qJ&k%VR@P(QL_gyt?_-b|
z?l#??X00kxlh@(i7#gKDkgs_=gDRn6{QNxOwRsWm$~+fx^AFG}hYJ@jCW<DF!&-Wz
zJ88jqsP9RHS5$=1S?>sLks)66h0MFo09JP`-uSyHH_43#s8pqDpQtBZx5|FdDOTZU
zW-C^03c+1LLjp?y1JYkP)>wlmkhhn3fq_B%S(Q{sgV%xR&2LxKpcSR+Dxdt4eiP3P
zlmPx6Mo7iY;E<qArMf^33w89afHf<x2gqCrcFF0mRxu%i3!NOK(?!%<Otg$t_31Jm
zVqv9Tj47T+xlO*?5#52S-YmEIv4rq6pzomaLA0F|Mib`6j2wR5`kt>9Wz|UX!vG-U
z8~y!40ld@<NjL0(02yx+hJ3DUcqB|hDtuECh2}~~x<Laz$^^g`GdNCbFeeJjRTT}g
z!w1vcSLGGqm6|K)-Bs*|(~u$vDDy}^l4P0SPg6WkH9Euc*ZFEV&s6!I8(5{LK|}!Q
zam0{CfI7(r7+wM0gy{v}+DGbf1;qSFV+9p?_Z3-5B4n0wIJ{^Oh(M_TX<EVbOIw(I
zRxxqci^-CH1mY0WDwCDri<2?w>ByLJq3kunG}qh}@a=mU2mJ%E^l;Hxhs$vw6U^tC
zd~i@k_N?ry-+`MJtQ_fw=?SVCt!ljr&%i!kE6^iPVP3b1%V~$gA$Absj3h;df)0WN
zbkK8V_B39~ucV#Q$L^rkys-inpdd*%V4=clb_DgqH()*IkhN95Bf`@z1_`-9e#Am&
zgOWqRmd4?bHW8pT0XdrTii+G4TzupGe8EbBd4*1GG>8Il6BAUJyvb!7?~EJK<$J{~
zEQVMUD&u#0%hcVne+LD|-yz+2H};<e!1(gK@__|i2eBYJe%Ir3koNb&8}S^0bWp>l
zc4{RjWOVk`#^zwQiI-f!rVc#^Lj9znVxz$$;cQ+AMeorN)#II+g)$C{78!z5c3yY}
zEjsJanZE!%J>&af>DU7ncgOE1Qj5yw4lP+WSXj+=9U>i)>y?GB0dJwi$_Ykd5Le~_
z&~OocvednHXse_{RGwO40iz7Gq>%rNLw))#xuGnP@p$v3>TU&+-Xa#>rv#;g=_?wo
zO`)nRLSPg=!N+zGl5fo0UkItA6p&s}hzmiP1~LF_29oaVrDFSVK5vb=@hTpWA~WOU
zUKA5##KUK@011HLP&D{?d`)7eAL3=aVvH}Z8|U!8(uW)#LE5|`P*AbtF*;=7?A07~
z%bQ5}bYWFZ<J&{o?-S{*gK_t;mHipJ@bX}IL(nUCYqf!@y|!*}(a4Jq5UNmSqWn}M
z6!{L=q=s}rT|%J`X5?ZU4g|nLH4lIQm3}lDh~^W4s6K?CGz$fAS<esg2of1lm<fB;
zN)@0g>L57WD3_L0ISM_5CK=?<8|aP6F7J)GfprYSw)3~!Drh0S_?ky&3uN3X#8|h$
z*G53__i{5$(k#dz>APa}JAQ@`+dxkekO`7hD*P4-g_mi*QX}uX_TZ$dt}O9LNXIbu
z%AdANO5_xS2Nly>$2w#OMBLdKXnW=V%E2uZ8u{5tnDh=s-noixSc>ghm-t$j@{}m5
z4f++QT^(;3;fcoU#X;HuhSad@k}g_HfxXLB9C8_X35u4@D{CZZRhd{4c^nDmlW6Cl
zPNk*3KUQ#Kke>>7c(#(h7<OM!xSs|J8!;Ahz@Q;9dgUEKD{7)N9sJAhnCQ-hjrYJX
zjiIwT%BHvT@IPi|*l9zmX2QN9j4fmF0t!+F83rhoUM?szwg%1i$AI|w{E{{+js4>v
zoE_A&^)UFVlCG}^*H}8(eK|<-Sd?Occ*(zLhgtGp2wgvfs|67DA{=17;t$$|ahD-R
zzgu*G>;+-@yM{pz?mp0v8tyh;LJRPjkwdV8kO5#XMh-D1H)tVRfCo89-Ajs&=0`{^
z#*mFN^c~_!p}J1n>lpDdgk|l4i!|mZd;(Q6sEd<HFav<1P7}-(z5y%H1KKo$WT*f|
zC4PS6WUjvS0w|e~@Qq=9IAogcx~3xw)dO4(At>OF2DzjZ%llXi7-?C_3<PR&+a>x`
zx(C$LpI;&7DSD(W4$UoUOxf+Ju=lW?63Sj0N4R!68HQs__nmAQTHG019QSsA+c^A?
zu_qrY{{^^WS}9Gh8_JeYPR;Bhs=vT#gsVS$4<>)nIp>~TntyQ~b5{0f9$4QCUNs6<
z75@Gk)FA6JfyCd5`XI^gYCHl=8gkq3)^H)*4k1fxQ_-x{cT)~9ixH7FVkpRB{Vg#y
z3xg?Qyc!ph9V$#mtA%ncsaeC{u+FYU0c|{F(D;yY-v8QJ@p449iQ)KN;oeP4ld<%C
zRPmMD?A>5Q*~fDG=C#PksH&LVD~6GYcN69%D}TIEs@mbJ6x}f&e-Le*fCJV|f6HsR
zMhw(*irEnQqB9Y$<1kaS3Z@Vb|NKF<q+x?(OPyqMN@%((pn3zZ4aaMivG9`a6<6?c
zBy5NbZnDAJowm!s6;az2@!@hrO4yy9Bc+GE%h;UJ?+&m|8MZAhpWSQYNhm>^<bY{}
z+x0Ov_rx5^RXmK7g%}z>pAhOU{hcTG?gu^ul0gIR9Hsb5y7=bdn4Ww)A@%kMGyrZ=
zY{c(al99+xDHl_t$vD8AH09f@oAx}8F)3C7q05tO^~J?8Vc}sLMKK%I;3Ghup$S0=
zfwe=?^tgSnAM`hfqcWq4TJvXrPS?VW#utyquiVO6T52n~QjhmvF{zMZG1pX4Vq@cY
zG}r`@2ZQ}uBZ|!;U`xla_i$BJ3?Q*<)NFL_?Faq8VB5U&SFYCU{cGJYpsbn;l1URj
z0rc+lE&k{<mf~DlMx`Ry;JUAjDx|Dc<2=}0Q-&957b8=DD+kB@^$ICbU-XKQ#-hXb
z0aK6JbgSB8mt%(c#96m2tdfc1^n;ek--Gh6|7K`L_p*XvhvMzWHm<)2JvmyKJjS6Q
z_saQdCQ|gBw^IFFe*5*1`=u5dScekOG=3uNf1%ZzXZG*cfbQMTJ4$xGon}@5)MWaa
zTw3k=81{NzR8VBCSe5x3Nlrf5&L0aAMlMVqlxsmYG$JeO$o5CVL<Mb!6z5mw2lG^O
zEfC#ZE0*FPv^9(Y9|!H1-O<0!n}-I!8bb+w-X4S|a=_h%jc-@tm8=6e74n_*wio?G
z=t+(C0DnTsL}AGlk_Dhi6%t()>i2=wtQVfs9_k0IX7XCGtvSf6*hbsHR7ig_F~EHi
zdQVI+b}#t2_9H22Z2f+UPB1X9-y;8-%?mqDmRLm#ATOOPrUn<?q-Pd&FiZQ*tja37
z6Wzp}QT@c<&rY@x#fv;9niG{ELjY4gonl(>vq2u__aY7^i{Dg}9FM+i{9Q>{*w-g@
z<hG^v^DyUG&4iT#`872;cUO?Sto05@XUW6mcVeT}dfmX>>cuxJ7(L!r{w{QP(=2J_
z6n9-sRO_>r{B3<Qb3S1GVx5{!S?qPtnsoG}PzM0cmaFKgR$!J%5j0^UT*b+jky~q1
zvQ|6qDS!G*oWO=kk=;R`z*-+~;lbw<L;2rm2P{>5V#4%2x?^0MR@3CRUGIq(5vsel
zKbYQ0me12K>JMCKmrpuJtvrr1go(dGIC+ZvApOpl#yq}R_wyjQ)FGFZRM`$4{)TwO
z???M`$u{MLaL$SR>8qIMxdP4BCEueWlN24H`G_q`XCSnHf(WT4i*$%N-}J!qL&-;h
zOsJR0eevh-4C{ns^(8BTFfjjk0Rb%z@fX7WcizNd_}4DE^pef(5R9P)Y?HRncEVkC
zv7=4g69T?mKd)?GKe$fl4af@!HwXa;VhGg#?{ED<*AV2r)q`Zf>i+L_@_!OW$pRIE
zMqr6*CV?YqrXgV@1@q-U=-2;2Q{xD<ZqNc}QYi-We6t36_^<t0w(=U9T4cM<0S2WQ
z)Iqo>uy92HNhfNqeOL5`^aaI($|3YI&I^POgs>k;S!;Gw7wQJw1@wdHrN0Z}KNmYu
zH4T&p{<#SGlKs%x{0_LY6S#|krPvg>6B2k>*~@74@3#VX1t#LoumKlitX_cS5sf}i
z_>XA#>*W3KPj5^DJWM27DI6sVnkdeE9YmE+tV<%Czy+j`E~(57$uj)R0m<LyZyA&0
zoBdBaxXYi7+R#E7gxi6>>U#C#4<JD~AlZORf)s927I+VEgox0DFcyh+!@o&0+I{DO
z^lys8P|NiGO<Ltu03YnXDei-tWBP|)2w`n^QKCSSPy28ZA?7(^|2VTCApiSZA!7hD
z^<~~pmz;TliqM2cL98T!`n8esCdwz`_yZIlai=t5SKjttK4yh#7Whk{NXNqy^aJ_}
zywA-o+`&K1(AUrBZ@c*a=>piPfCP=KULDd1uv!1Z2~39vRG;@p1f>{OH;L;&yeN61
ze8&v`3G#y^2$Df?MMt);6(;;Y9F$imlS7gXH1!~d1L*_lR>Ow}zl%4&d-+zw<8#Cb
z)PJ>MgCL*YXNolvZ!d^fc%U5||NE2nH;C82ZR5YZU^Issf;RHv_aDoim{#~sGH&-}
z6fU^`fW;yH4zUpoCwPG~itJOai7apkp%eN_xw)PRm}iI=cz__<J*YomZ-{63JM<HZ
z1?dg(1Ly<s1?WmRBh*e}KS2mjh&zZA$p3d2Fy@Ixg0vqb|M408C$me*1$BbvX%jkc
zZ#cT4e2wRDA_?V|Q0JBJIYl=bFLij>s$luY<Bg^3{q$76h0I?e;D3QmOJ__(^C!&x
z&BBold!%0G4VQp?E8tJCd9d&F53n~OBh4cr2;|k(Lj*i<0Pp6m4O-~z``y*|yDu)t
z_u<Q-!J`n49!S4YyC$&hj@8CE7UQp+8Rmx)O3So$o1^KonGaVm{G{GH;WmJnt(2`~
ztkjtaMdF7lX(&b_@_%aG|M#(@6}}SztYiCl`Tcup!f^NpjEfK&;?JL7CWYhwSmwur
zi6D9}-y{50S7^8}Kc2!LpgkPP_|37gVjo8P<NqWe9C^+?9Fyd%+<a7`gY%qe$*GWA
zfd0!Ly%><xYvhg*v+ml9JD2-C)my$P4jbFX3*A*%JPCg-kuY+jDXJ4nhP7%Bdf}(u
z=Rvo%>Z$!sLo~k^(YFL9RCf_y2!N1IID=&fFL)ssk^s~$@P>FW!~=vEgphI@<Q?Qc
zuR`9D<j-!xSFsDxDGH~q=WLWk&9eM7okazdf+xDN8w3f95}iPI0xBwhmj@>eqiZL7
zKCqv8DwErah3#=a%PY=(0yrojV7kRRw}(iTq`vzoS!mX`SGa~Dh8MGD5t%OX%D<zZ
zxhWXVeqet0U`USUQQeD<Ls*uIs|P%067Hu)%xpr;oCLpi)t>t^LF}dUCR}2B3<9+j
zryu9<;BCM|(lqCX*gly|QVA@Ik(|pxKI<PwtItQfwa?W1PPALCtJj~Ct;g68ek<Wk
z4mdwQ0DOmk+Xtu(o`>Yl4%j!zT(k|t0({uYXd{v?p#bj$t2=b^-k&&=oEjy5U$T}Y
zzn0{4;zzZ?H->|0I0D(L1zV9Ar90^rwk~vIl8cDC9yM|Tm;n8BDMAWt&afz)Zo<zB
zSuSE2_|&mRXI$}qDZ3w)n(fsWx=9_roE2tAha@ap!u(4i1|*~>F|#o-vl;Q7ViY}M
zdj$3$PuoqT`rzA5sHiwZJrKGXx(ftg#=E0e&QlE+YBft_vOJzXY9G?rA48LD5Uk&;
zZ6LRLr^3AizWD(y8|`0H`;%wm^&K#qf8Sw2Z9rc@K8W1HF2Dh=`~^uW#ZRiJ<OC{j
z!w?)oP*DtM7_SHZ1iT0^y=P1}@;*ZJ1o$k02<nP#6_2+*f8jVr<9Ae5u4cTB;h@tB
z{^G_)bv*OSUnjdF8U!l8D1!UH1OO=>l)rQ6M^||ZPoc$iY2`mVK3NjaIj@~rm-xbP
zW1aY3i0$wGAApm{gFrTKFYL2}pS4J*Eez$8hSWQqpDQhl4Pk!oXtWz*rQCr|H3s|L
zQZzHR=>E`?*&<D|K_E=GVfy|Aa2YAQAD9ddxCP(}G$yE$eEHlysQdrDbdu44nL2U^
z(hlm~*bA2T{`Bc+TJSJIhfe-n2?L#5m_<vtALTFh01Tc=9|@Mhp`xvTt;UNY0uOq@
zc-}^G5Gd9h$pu)Mq#&q`&5ef*`hOvnAgNBJWJ05~_7Gc-2t=w;Pvm|!oiVbC7_A^!
zQQ`j`d|bE!kmC0@%>Y7XGE(`kKu+wC_s1B;w6K8iV;AjwKyPEMh}rSYrEze`Z9qGM
z16Dl<7=Rv8M0ddN0d%($#oug(%5~iT>%WEs0_MMv(SE4@Q}9(M>;~P;J)h^8EN28l
z|3QAxB!AHk+laKT2Ood82d&_Ao-A>0_ZQZUzitZID8EZUY8kU(?_pWdca<tVZemFI
zvQwx@^?j5ZmzhU{gQIEM$aw-fZ~(t>%^GhXa8cpW0fl<3@cpm1)la0G3=mZBBn2ja
zg~)}Ozk}y0&#C`(3p33kH%__q3~n;$L_O^xl8zv|At5jj{UZXjzc4e0L>u<yMDbss
z<$wK`Hb?!xV6n=pKpe89&CARI91y&3Gc8;~X8*|78j7TW<B&v8qYfORB;Npc`p9)_
zbBPt9O}-0%0Oc>#h;Lnh2jWGs={4ql(v6gbso6L>hL#G@tD@1d6mh^=k5z6M39AG|
z`2$TBnFyL#G1B!0$c5<brq$Vkv4(xx{M{AhwMU=7|EK)>g+iM8!@Q~<in?`2l71Sp
zZ?PSJa{pxi)BOHRg908kf3{@#qZuRud}EYIDyT<uFrQN?bq|JNtny!4P+dYK-DFqX
zLskU=d&enX`_0ebe^B<G@o@g_w`fF5B1$5O=tM-KCWu}mh-eYLN3WxgK8BDWQKF7c
z2%<;tCZdJW`{=z5MjwnB`}TXD|33Tdea`bg=i`mxh1>mY>ssG+tu=m=!DyT(a2`Ms
zEE&LrSPmBoAiG);-%@To&gNADoC~%7`w3wlDl>Sae9MN=XK=ZJhG1b?x=rSfmW|GV
z!e<^%&c`Bcg>(OGcm-bq&jWd5%*iNzX>u#R<l@4yXte!qE#S2C<^=}$I_rm(#aC;K
z=JZTDn9dZyaywMu0~uFcIq`Mi86J~gS1^7g)XY6$pSJbD0T*<D>w*Qs%dj$1EX>2q
z#co-T+kH(KuO8r2D45JYFq-8<0vY)B|3~CaWg76NNHdhJoz5?N>ysy&W2`#6QLXc{
zg&bCv7_$+9kvp_H-Gnv3gT#{&9Z_z4GRdE;7%oc@a3m3_GrGaZbQgGS)Yoeyirw1x
zal{hEGF|_iIN$tlBzY)BiF6zYJnZTlE%y}!JI*cv56Q*5_3-o>v#d;aFqrJ$5BdM6
zAbN(N1aJ_y*O?#_^d4Mq{)Ti^km8SnZ!zgg8II8kX;{pTHYd^5sSzksFO%gqwl(Gc
zVD<icGZT%O<Dxxh1<%hqq%JP?RH71(fz|nd=pH2vKPAlz$|B)<@8)^S=ahcG+Y)tJ
zS+BMSmU^mp4X=;h$eIvzBA%Q4y}pezzsu)$9ZuTx!Xz4fe}UdVGyDj9`;_p40Dlb{
zD7}CV#N2FB|G&Y+)mbLs6~oxt9}y71sNSrHg(Tk>s2&DnO%spW8?*$!0Q@sB&cs*h
z8YQh~O2iBrg-JObom@e|%bx@TNP)fVwZb)tw7(_64gZwHv4lYtqwL*5RQ5NC{=;_l
z&j!cx;tqg6UweP(_OSV^;_EABrQJRJxS2&d`ry!wT60T->z_9jap!MOsZ6pya;j_v
z2UGlU*52u<U~eGyg47R6&A_lsqOgDUj1t!snEGw5j^e1}2wQWeeiBNKCdaIg!0)a!
za7kb#Db(E;TeGy%vLPg|ZJ(m=(CuB6GcsRm`Au_v>s)Lc4S&jfr|ZMOpNvn<1b&1k
zB-`ZwD~@J~*&%ox20mveI(zj9n1AeItPJI^UVXZKHU9{S9=|Pqofvzg{O&U$U<ETc
zglI?sqXaO=-XchY+sFS}FHG0>$JxU}ui5|i6$dc93pdL9EVn+o&2)~Vev>o&X>YAl
z!Qdf&)h6E(I|Xvy{$Rm|pa6;^2yZq(ArbwU_>@g@R_=hnI98<n0gcP+f`^;aN4*|*
zL-mvvK9GNo|HkU_SY(*14-eH0Vq0dN4?q|PhpPS|68*@-6dhoDSFDX-h4KK#eXyRd
z>|J5F`ATl`v#1l%OcIgBkyMx)t>Is`6*3$d?mv?!S@EP*z-#C+_$1ghPCvyU5)vwB
zy{ht7SzXRUuT9b9UwCqqzlgnqJsvKdSq*YL0_m)ByF70vzuM+L1Yh%>B)OONuYwwo
zGd$ml{fHxeC~ZMxeryu#W^veZ!zhTWv%b~vKT|oY;iOFfS9g9duvg}HL?FkA9PNF9
zsyI&m@1mqp|IE!*8iMLxdowlG`}gnFQxJ(vg5PMc0HgNoYScRD?nM(`&EcnnMCK*R
zJqs~=asSMvt4aCK{QU>0{BIxL-z5Nq{P)H6eTbGP>6K}{y=~qS#ge{$qN3#VTMk$v
z3wN*ECu@h_Eqe5pcxmL#5&0vJ#?g2Gpn`b$-+$ZA7?A4Yx57i5t=5Vep*Ci@A@K=}
z5)ZFdybSAyarQHRx@CDMlxF;TDdf6DP=4wO@5;>sBA;7$2+`@aOqpfk1@%3Se<+Gy
z%<9C_ADREn^4wW2dT1I|Ex8a$h3e4nrmy)ex6&WOa8;vKzRx>}yfI`pmd}4BO1O62
z`kzae^rwHHWi5R)SG?E?2^|qg4(9q8+-JLd<7$)^qGdP_T@ae;!_3~tFoz?^Ht@r5
zNjC%?Cj<LMvD_tYaP(>V90Y@FFMevj8X8!tOz}(Av|XsV&6Rq^;^~Wi5+7OUe~+R9
zNtfCQ?Z7A@Smtoo`dAqJ9Kzst=NglVNllNOLdR_YrQ`#sw`TyM4YQ~KjsA?$acUa|
ziAW#JiK9c}nvGUL<4vOJe!HSom`v#Aj@Mk?EEK0*n!!v-Mzj<pqvJ{3)7z7`^v9g@
z@3YYs(xUlD1$bca{V&~(CAx5_YKQ44POZW>TyxOOfb-4#70AO;h8vHc1A7es_!IAu
zUlw8omTk!#5`-@9C{9WNu>tuROYULmXQ!HikTuQEM%{3-3>CakJ9W~Xy0bj`jXe6Y
zF}1|__;;v7@g#wTr)GD4jj+Gh7d{G)AS?<w*zU><jHV&DqOAPCPhPtq`v?C2CcQ-f
z!2fIhS-ynZSB1boRo;!O0&szFjQ#_2ysp&KNGgPJkaYX$BcX+d-XV#hK>JQlVQg;s
zo8p|d8qj>kRAt*c!Oe8c9J@$o%AI1P`dg6<qVJ{a52K9*?UvZiUG;Y?t*ze&lPJD7
zGh+qKHk1?>e!nao%~x7hIBJWgFQ`jmBar{bsZ;zWlAclC@YLr7J<lwAv#x`jh(hv+
zDz;{_%C3^WLzGvJr<_xG1&vsbUh6Hth#r14QCpGrMn~J_*RsN!!H716h%9^ULi=hi
z-e=ina-nuJy5nO&e~HjonU~9G+StNhwkkzr4Q~A>lhV19hQ^(pnKMPL)%NAJ*F&_M
zy?m;vOsY_Pbt?XgONBCUY%qeg<jApr_km`46W{A^cV$V>51&iFiAPKGCsFY+3H@<e
zzv0ltiw$3TX!y1Mhy39K-(#r@mrpHd4-O5VVLMz5<qf?%Z(fG#)jE=JsR7dd4ZTLU
z^bCPbAXF}o&${{HCrRcV?6uwXL_)mAw7}4mT%D<Rpw){WjNeQ&{<hRtfB)M!(tmxO
z+}OS|Y4J<Z?0@HDichYXW0g0<ojlErBA#KPp|Gv~pWj;5?tY5*W2vDCpp@Q@ihGh~
zPX4ODkta$#%Bc=dg8T9MDV?BgRsh35dT}v#L!~pby*s{ME1ZqJ@G)4-g#|X}gE3B#
zuxbzkHA(_Ta$D2+u$`BUaX>F_HU?JqtMN50E$w!aP*@aTzQm|i`DA*?&QUR8aCf$G
z^Dx15I3zrJYR*OiSqh=w8a{hvKbb|KU1FdQ*ZQkw3^+1n-K5SN1Z26#hfdp7X15#W
z{Ry>;wUoG=+W)?&GHVkyyKkJM0B&fUXY{zZ*=2_TA*()-+-A625kY{%4(Z#Z-{H^f
zahW}y1+On$Ik6SfYCfG^)_^fOPn2DLR*0gbeh&ZOW*BX_vCsgn_Kc5M8m&%EZ`Uco
zf0=f3Yme$DfR3)c`t&wINh+IW?ZJE3pn-C+_qaF;iW*tbdNm)txvofh=fb06{YqOz
z;;EQp(XF)cgL_-ZB2vI$NCwU2R+9COLBnhC=a7Y*Se$N=PULP~4h`dcHtpD=6wGX6
zL{#+8D#C8cLZBckO9toodk1+b9_Q4wDJB-1ZeQtb{_#iJjKow8SiCRkSVU=_GJa;1
zG$^3WTS~*@v&e5x_?fT$Ox+7ck8iqON|N%>omng&(2mRCYqeR_Svb9$iBR^z?7GvB
ziJyKLIhKT8ssb_HIqYR2ygA$+Sp^kBq&iGd@lfrd{S~t_RgS1%g--T{<5A^2>f({5
zO-paJ85__ovSynzua}i@vVd|ZTZZL6gZb<)+O$_2pQFI%hH3};;P4sh5~)_43G~$`
z>Ah=Ac5fdJ!hiE|6MiE#4ZSA)ifNE}koo_j5SpTc{@FP8f?i$iBiERJ&RxS^^IupE
zt`Y;Ml0A4M!{SKvisw!d!wtgw+ef}R3Xwl;)XU<Qd$hTLXb8S0`NB6WiOh8u6<iyG
zZ4}jMFPWwAbs`L)A%@qzy8eo4sP)FSCfIF^@=7gfm(-h0I}?s}&~(jE1g%N_i1#=g
zu-HC2Ew<B2XDs-b3&kUqo6&V&1F$<@v$A7JaNU93(c_e&i2RSc1O69EDbmmwQ>Ji<
zqd(gmqGIL{xWiUEM%wYmTr;{VGLa)@kBRA$MSMg^7fI+OjrC_IXW}15H)vk061s+x
zO=+Oq2ePgEQZ!e4q-@Nec})HqI@-_A{KO5vqj;_9mnNxwH-#(Eh?CS!y9?xZWpkAt
z@S+NDRTRySs1Ia!8bytauErKk$~u%K;#T6+vJ^Qaw~ur*TXq<H4nC*)CiN@f+QY2@
ziys3I(-C<@>#n5VPjot=VEud8c80of9O&_c_UnSH<K?Mw>9n489d_YES)4D+%p*HC
z3;q3u%UuG@JKX#HwvXA@>H6=Ov)=_b1(-^@qo@4_$8?RqQ-ErhwCcV0->39Ylz1MC
zmmP}=hH%`qe8ESoe8zxlRL=~ka$U{~M2dOXs$<BvotGY2Si9OY3)=o%8+DQ>J8?#X
zxs2Vb2X3mTQ&v@P5jL(1%sDibZbq!@+l*3X3$)mz4|U}W0FLAR-eKU*n`RrgmvMzA
zUKMNyRxsncR00X=*&UvZyAOI02+e$zX*EW^EZGRiug63Ejq|>ZB^DME;15}1Q;Tdq
zaS5Spt|8Ut7V8h`Z*YLi=qJ=cNd7Fj;*kUDPaOAo?NL>DPB{20R#Pt8a9W#@)WH;R
z;cDH5%|At;7N>6CqFx@i!?6vOmv?r7jLqALvHv~Z3Y0mzu>pur`EIet3lmio?!BLt
z==*RfRVHUxoG}ly;Ct^Qj!<QA5?nzWg?I$xD_+VJMcyx(+iQJR)Svh)SC^8$0}1jT
z2hZ}~@ha{bHv4MNz_z4zsx)o4gDKxxe-`Ec`T9Fz!8S#^Nauwp=Hg$DXV!)xyYwEE
z;O)WwlayJdBEtBUI~<F|d{XLQ(TeYHm%NWLyOJL7N`h6u$kP$)EmuS51l8%DiaB-Z
zmtQ$`{tBfJtlNe`FPlRPwTl+LR3Dv4VlK$?F4QPfgryU$C4@vjoLpI#(wijV1Q}bS
zetC8SeiFR%AI~ar**B+FHP>g{!f@xPY7b1HY@r^AYv*)n#-_le**EX-?)QqYbn+st
z6NN!-8ZZ1lsWBvy&!9pKy`}?^fKl<CHMQGU0VN90$8cAuj;D|!#IZm=7r%un+kiu`
zO9n4Cxu`iJI9%TfKXEm{0jTMxK_p!OMQQLZy&4x>&#JedBA)Q4X4grc`;rV+7{+RN
z-_FoV#Dyiaw621FN7_XueYn<>A{l$KGjWRCIAZR7Hck%7(tY|@Eqf#4s>MW(@})Y-
z`<P#q`klbPZ}0mBjg+m`MYrU+ySePvuMcj-$axrZfND_##*VwW8bDZ@_w`8UfK8!{
z2$viy{#Q-lta-u^k(daHne`LH&6AAU&))p&FhCuWKF=7?Z_C!+!<YC{{qyB$9pMck
z#oys_j(c}|)(Q=Uf=8wli!9RdYISEb<LrxgsecJ3|KIWaKfeJIw&la*dySlXjXu%r
z-S`5KX>?ZFC%mR<wiM;VAzpJx^=ivOo;35|Kh&_V=$6BjmU}fK=%(j3Ogsihw{TcA
zd<reRkXyl_>KkScoE0XSb^_Kz*`IVQyWOr`lewn!T2@Q>$f8={zpP{1(#5@o>-MR~
z*r!Wg*J;9Y_>CZAR-@RHjID3u&Zmjz$Mjk99}{eg2P9r<8nzf()j99EocrevyeM|d
zeOtAc>*M=l9E^frnT3A%A~jWl(jGmm*)6=m$<3K91QOruTHFSLLBcWu+!THrriryn
zA%={jZ&A&T707K5v-1H4d}GxO#ix4~1{IG_W2aEU{yB;?#lI;GyBJ0U7u+B6-DdKS
z-u32Et~YhH(v96{?exGHdkwSGnEuR+wRs4+)SKGttDO=(YbL<V$nQ*Nlr2K1K@i)+
z#1db;-p)^UokPld@04Pm(y86qNUgfPw(xf017F}NJ^A(8IbUjHC`h+CEE9T`zy$H&
zgfv^H2b8L#r#A|@Ak?ZS=z;G*U(8S$qCZmDNU?Utzu8kQ%`RUpLk+N@jgsolHfavF
z+lp5NKm{oZ!{cK`tD13;6j1Cr=e=`3T~3~F28m{x`t8rUSu8M+^}<47iy{@eeI8ue
zFg2e%3(VCmYRA;4Viy1IC^67x-#W%&qI0TI<0x%spRH~|&uv^oO9GkK(N39rHUokv
zUKhqYoNkhvjy-DrT2oOP|G4RFR8wHXCBys2aL7$fTO`W)r`(rXiczRY1S2&->kwf5
z{o9t71=SsWCP9jNT(9@tBEW5|;|5*~gh7^yEc%S*vlX;yHKtW!<D2N$u>(Jp+w-D-
zXGCjV+8%eH<%{7#%xu@rf-YX${=-HFO6!pfLIpYhb$0;V5qyuP7y^#{t1l0ty%usm
zS~QujS71O$fC>>V>_&MDZ+P=_sy72F`4P8hwf?1kHJhOg7<ai^KEQRRe;Q&dYQ!Mp
z6{X}+)>`}|{E}sMvs*7S<)y>$63lco-6P<1pJNM&qOf=Xf{H1=1-0JMWJk)AkMV|_
z9u9v*Hnb&*XqbTejvGeuW>OLo<iFDN*>rvHF;Mc<IEfNja!C=j;OtAsKI-$^2l_Y|
zM9pucL+9$xt5KzBHF!u^K(S5D_M7<0w@oWGkHa0s_vRXp8PpifJ7TJDicb_iw)*+B
z9{4!#Yw=9GSWlMAeCjAU#iEjPpkznXCS9IV;<*u@)9??wDi5RsV3IdlpqXl7@LUlF
zGj8;>Lj=>f#G5$8+J^Z}`lyIb>z6e`ils9C0hzL{?H$3vY@aEF4XD0_WeV7+<yfQ$
zT^Z{B0E~63SN52q>Y*a(kQ4p$>e5-K?0K*4!DuU+qn~EIY>FDDo*!oWG^$IKysf*J
zh<)d)zE(g0J80XBI?^LU#b{bZG@t2rW<=DO?AkfKb8aRS-x1$M4*9_O{I_iO#_i-^
zFKkXUtH9HqbYhNGO3np^hG*_V>M}m(o9km%0KTU&cJ0VL-v>#evzUePKbVWsVKn`@
zQ`HU*p?5cHmp@srZ+N3*wE6O<Ef*FO^D|x#91x}H<v-x4`EsmI#b9nh@gjib=AAb>
zp?bm~5{|w#07f2&$E>(2!(Jau*8!X!!GEMUfGzPx)Rm%<VQegf*s+<KCQ#0WK?2Ei
zVCfS($9e)(n7Noa9}aK6@P#ebCP&xh9J-+xa=Jm*rrVI*TgZRfh7r#2L7Pl}1?WY&
zz=wjqRN?%#XpvWqEeD4Kq6e$efI+DCmYW8Rz00UZeDdaZ>B~v^BAqhx(0DOlQ7);|
zKsWcD^f(~YfuYc-1NFNe$eFes$x}Ut*rbDnV5aioCdVB#DehSeX|8L@TFni@Q~9G_
zeG?8xe%qeFk)vRPM?<G_o0=rfT{>>X$whJd==Um*P3PvRMvp(L-krSj5T?i>^_nBo
zKid;4?S~oefElgoj&84KjONs~G+q!!JrbGYQ~yPMH}b@XS1vb{*(crvy37Oq>D=fA
zk8!FiP4(nPD4BW>tyV!V18@y-jIKlhD~sj6<BFmwOI*sqidtg=q{x`35o9K5CF?F*
zR7Lae8rUeB0b5T6NAMOEcCOJGfFFunW`O0{RY#KH*T^lsv>0|@Gx=Th*z2MSl=Pm=
z)ei0%c*7wPdeo=7s<;H>ApXjVf~WAXTZdn&!e7K}q~3OM8GKNnkwfxQ^xW2d@E0qi
z=j5VRrNYa#VMvulmvfb8AKf_~izb{iEen8%?Z4)mxTtbv1I;xhOE6Ia_5m4D;&|^q
z+5pTh-0tiEQ|D;<qt_Jq9hXW@?}#WFu*!I6V9l!d62E|3)oPFV&Q2>j|91cglFa?w
zdlq}(eb7ycn4dTa#@UUO@?d10R~81OaHD+JJz1C@kisel&Y2;=CPMHPw(-5J`Me@P
zl1h4u_WCxr_r6b|Zdr!s@jMhWBu`^%)+6fBDJXU_nN#f^RA<6Vm-7{R(VZ{oc#6w&
z%N`@m`*WS)aZbP9KHkvRW0ntokwP*ft_Kxkvo@@8%uQ{?442V*Sw3pT<$T`CcS6rb
zw_x$4xXEs{Vvnr2d9?>jc<Y_F9MRO;8J4bL<n3`mOeP+`>q`tZgGtB>=nmmc8~Bsy
zvMMXYgY$Dl*+t!uUeshIXu8^hzJ+z{r%3|E%GwZ`LDUa5UIO^OW^T@aniNlVJVMi?
z*ODyidDq|b)F3M>`A;DW&gW+nJ4Yv}&KhcJQI<E8C{{7yhy4z6fT8$zAT?M+%}Hu!
zVSTa&M6doq@BTr6YrJ$S7UkL(owG$cmKD2ncdFi<6f}<)fV83?j%(j7zJK$FK=D}`
zgR(w<!P32&)o96+hlK;aGCB;%RxUAMG^v69UdzGrH<rV}_Dt>QyX=ByOF2{OOb9MA
zBNtiml3uZhp*bjKSX~;FedV|_2NAC7kFSw}p*)tlIR=MR=`<NVj|RH?zRyFal}yWw
zEmEFSZPBvd@~U;3a3R`}13KF{4MeAFobq2XfFOVYz*A}Id9Bwhp_4)&1I>w2T}|VR
znS_Mo4zyLH-N;&rU^rW?p|0HX`?ex=D@(i{t}r!j_v$Ks`~`|H05h$ENNjfcf_JK8
zFP`;A-rgTAHzRnLg8ZrcWil_iJ)=v6p_7$WxV4Khh;olW{Ub-~f7J9nS|y00ntrvr
z`s2$U6VUYHT`*?C#Lo#_g|bPSF`BD8fW@lCN)ihFf0s;Clq*&ej<dr|)T$jA@9hb9
z1i3B#fo&l8;8lGi&0Qs<RZ5yWQ(yV|S1C{7nwJDP(d>+gp?9-_P`pIL8eN%YUYcQ-
zGTT5p_G3e_bLvY61>sqb%7BYCL+1*CL^Rtzp+)B&sc%{EViz;Cmsz=4Em_j{<j0dp
zItR@C2Q<Tjt#WU+n4W^SN5lIaAQ_(e2jsN;dhT>TwF>Ue`Z`edxo$gqTBZy53E>V9
z13_PIdgDt2AXg2Bwi9H?nBpr>As?D%LEWzuoHT3Ab%9LKC0e*dtJ-Zkkw7u9W0_Tq
zRl{^Ox|k0GYEsW;;5A<Qdck?;<ngeH$YuqCH!lF<hpLTuxG(e0Mo`isEWN@b?4_8&
zthXlRR3`<EQy#$Tlv~u*&RQv*Ao$SsC<)e~5C_JUonQbUDnroQXzQ2RoCrWE68==X
z7vVv(b}upUeoIUD&!ldKG!lxMs?V=WnpP^5H#a&>Lf;~+aC=|1O<hJeVIa{Rs7*!(
z1%}4KXQISVk?cWlzHBh5=5gV+mem{OMDFjE-W9Tpo+2@in}h={M9u+BO<v#B82tJ6
zcY~Mq_M}TQV!oqK(+wli;Bg${Dk-O7iRw@IjXZ|ref2f-RIDL;sR53&qDx_H8&Trt
zTlvgT|HQRkE{>ICG0)vM$r&mJ$E%#aK8ue413huXyk9W?q^RETQirl#PZjOrOzA3Q
zXRO0FWCuQ}w0^)<_A<e2C8l=XM9rd0+OeUO;)yE5fZ96_yHL^XU*q3%bftfyhPDW`
z)qa60Hg6}d9Bgq(%^tUYiMAcxAU#&R*ZkyM_5Jhh)pPo?=2r<^er$2@lXJtPzeHuh
zDMs$G=DCFF7d6SDWTy{&5_GynnQgRs!=6!M>Tx>S1xb#&06nGyt$*^wik=M2_R0~6
z2F6EiBUU~+lr<+BREhNaDoOJK+-j}_!RFzB)W|>qW3s>JIMSv_4!$!7xg74@969c`
z=)A2kTOP!r*qeFz=y=1GUVK&Px%CJ}o~AeLMR33+&I^||rKGH!1C-BFEACClC(}oZ
zq+E_*<i12u&UE$c#T@gfa~Mb(TaP?yqr_9cw&Yi;btucB+kSoyESW*T!tsvFa5^X7
zpbmqXbIX};!`c=XQglSztc};%#6)UVz~y;~>1E`smG63qReXASu5nzr+JT7+r}%f0
zw?(>8CBXQMt$e*iiNTC?ZX~*YDV*gaIIAiy9qcz3VDnCKRE|<IBu_OXOEi;&lY@gp
zcX=wow0OAkA*1<fa~`5Yx580%oa1DZR@sY)Ir%r0qkM3lqVRWs!^w89tiCO3a=wL1
zaW9#DSvw%_AkeParEsuqeRZMjj$6b@t^iQ`x-{TkKzR0Ii|;St3c<m`82N(Y2I(H_
zDHWi)()wQr_<vFH|1fIrn9hK<aDDtIl7v$W)a~fro@4{9%o#!~a#KST{EXk#Yx<`K
z+ZJ+!KG$)738s|2C#s~DW)4{CHJ_(AOp31G<Io;CP)QZ)8-Fo+Is_F}ymK*s+5h7f
z(j=c++dIHaikzN5z5%n*+FvQvRaT&xf4V5(zw)Ng07*}vBefE3MXHx$;lL8ASH!jh
zSVSn#Lon%uALl*y2F<i81+%w1Rp~biIGSQ~{_Qi_l3|){(3kYWSlY8ez<1@H{p>jd
zPouxym2Vl`5axO`Xg^kHzs?~k7Abw+vIgUr4DXJXQsGGV{+KAAIG<=$N0`h0b>003
zXIb#{G`eDBT+c7RL<TdEB=sppSX=?_-)%K9DK@-G%di`tAXog_8G_ld^5vPX5O9?Z
z5}~V)<J2wf9WtZY>i3S8-WL>?#4<FFmW9Q&@%QKd&+4g-f4(q!{cbJ~6e`<(&Oyeo
zJ(0*!?ry2u_Lu;EJCXWNnKOKqnP6&Tw91D}F;o>ZDJB?xSoC_naXrKDIJU#pcB-lX
zC<D@ZkNMS1lEl3zfb%tf{e@f05UY^5c<L_vl3-SU{p*-15!mwO7K>{Yos?tJ3H?%p
zp!Ifed`!mo%eD4!>R<)V2?09K$B$;Pi1|^}Az*wll;*=n=N2+28N#;OB7zo`Tu!M*
zZIm{WZgq|0>A4SV0UmOA0oyeBRm}ksK-$cJ4A)^!x<%&l%~5Q*6IGUL=u|HYO`#QF
z&L`&M8ILxFf^KRT7%7Pd;38``7ZsmuP85r)OT7qY;}jZJyZqysEb{YH+|?d2%1Y}q
z+3n75pW!XquJiL<5F-itIJJrD223ehEjwM@a|7mgvZWLmWnaupI&~*>DzsC2#io)L
z96C8o%kTp3CXe2_9n>?08<;;DoGcH3@ikxYi!C1ssH}Gcjs0ETS^|i5k%Jv;@K2Co
zCX@-hHQ4RJI~b(WVpwTivgrm7@QM@hEwoHm$?q3O@>+3R(B+~@zaM<Hu<cTVoyuz_
zU;!Vzr4>%GXIfJYVES1PWpz!VAvyPTDbz+ly~dMl4}e+Jq}`Iq{sSbTD%7fu`80wE
z6hob-`zM|#0Jgn+)Z(MJZg^r4^^y{cYwrV0e<|B!Aipp%2=t)qUrQUL2XyG4W(3LY
zd~w}LqZg8s06RXWbQ)zRb{w%_=thd%b-Awg5ZZAn@ZU=QsVJGAzYdFB5xBPdtn7xR
zj#;Q);vf!t(#i1g4WqesM})Eg^B;sBQ^4OvkEhP;^_x^&i26D2WmSXvrC$y9t2724
zQu^k{du^2YIyPzD6yN%)PzM~}EPf7&z8&ZlPpx&#25(DvEc_<8yDk_0oNGuoH1c67
zlm&L9c$tYIXZ{3!>H4GXD<mo>S```*FxO%X=M@hET%eZ=L^J?`NNN7^R8kUK1!*5k
z*?uUN#P+xFXy$NW$P2JoWIWmN%Rjl;N^x7$?ozAmw5sv?McDRo*6E;e?6lk{dycWS
zPT1c6p0;(`<M$gtRnsHlblj+(?rnB5;y++EwFr2yFaB-96etH6E)NfzLYotJnV$dU
zi=Msdn&r3hofN6m-}tz3<-fSh#%;4qF0N2L*R&+zb^Vf-gMH(~solx%jNNYeOAC9e
zx(*vT(NgT;H)xgU{_T_GS@b%zdEw(%Z{&<QJUc?o&8?hJT<0O|@q?}@92SF}r5T`3
zDAKXX_sITu`N-=b2`RQ#&&u<H`GtAN+9@l4T>y^cJjTZXsPeSJr?0s9JirH35w1~Z
z+x}}Yz|GRbepukJKLd*Y9xZ+G&M>xKZC324^#D_iFm7;p-CF5?hu8-GJhf$UBQUm|
z7CgG4asK18DHIo(r<Pu9tO<=sa|X;zQO$ms?<C}Ow)*aeZno`vccxlqnb}}v=WZ`~
zd^g#73?ZKQdaRRs{K|x>UnDFZKUkU+xL&M0Gv5}or2{<!|GpR}D^Zh<JnnnbV@{#9
zSz`jJj}$7Dv!A=rOW9AN%p?=@_&(DlfopKhw;RdX4A&ny(!BE2IjIcLdS(F0>bY5?
z`Xrq->X)$5gsN9WtZi_*m}#LRXX5&m33Ag+tuARmzfdnEm=H1jjg@c{@F^GczRL1|
zxwboTJR27qRAPLrUa|jcWc_Ws|Grz;&PYC`;)G+C91FuGP<D)@R67WAv|1oZ&@=Uw
zHJpF8%36MWB73mmGhO4X4&0)SM0aFlbj8uMTR%vaJd4-ds8Hq`!46=g@xO)kM|=a2
zH-Cr+*rbB{Qp)TQYdnu*n)tSclTph<==A=$_L@V>7YUDhb|%Z0kLJ(U=b?5F){$*E
zmC|m%7=uXjovCU;=Q$&AQH^9QSb=$*k@Nn&`+JsOKBcJLYb;<@gf=gB(oddM#3ssn
zApYKAQ;l2g><OW4dweUI;Xp)uP9e54l2O$rW9V(;F>@!l<BPiOapBm7$v#^(Xe6by
z<=~d4#~92s;8UKI&<Hv|BCV8ncRo`N-GpUQtO|e?>J+_N&-BW$_A5kHFiLnlhMXYZ
zE<Xb$klrWv6ECygy8~zTFL$ecaPuVltJrWZ%*64FwV&cVzG{&k?H9@U=7~#FlWoSc
zOp#)#<5Bmcp{~q9vrwj<gYj_QZI7Vw#JDH>ubZt}!hHdDMZ5HME^cF4T`9Xe!{yJu
zhvZ?+&>3b<R?c>;uuRJnR5bQUSMmAQ#KgRJXomk5ZJ%qS>#~B!<<IZiE8CFEgw%Eo
zJ%-N~3E9=OKTP%q%ZH@k^bL=v#1;bnJAURGpdMu=@C*a>JBix)e-fU&P8#a=O?wRW
zn6?+-Z8$rgJ$vWoE14z74J-3WAjT6+qn23wkXA4UFJkvFuz~dQ!2AsE!MXc-<`Gc4
z*sAG_uftKh1b|19?>SG~XUZJ^ua(ij#%5)7&~q1_YpjhksJ73Qj$SdXaioP@>?_81
zBVwa06^n~+qYtv@{VRj42Qo^&j7s&t#YL!TF+(q2%wHBJD)ykKs_E0cvnO0NA8C?X
z<?9}+Y+=~lyVTM*0DCDrOn0bPxCxiiL59!T<wmSB?@-igG&dXex_AUFdV-J6Gh(77
zO8ubRf9goz*LW1f+;o`;NHxWrXTG?vZLhBnZ;KvY><TMDs(IN#+;S((sV7evC;p%o
zxS2<s>k2}jeJzA@Yw&0sSw6#P8fN^t16LE~vHHiBX$Nv1;~1$l>nve2L+LSFAm^Bc
z9dibdaY72?w3c{$gR$#a^;T?6^&IpOv?`My**MzxEN4|F8%x0?mNs5GyATS0QB)1Y
zHv4Nwr?G<s&hh0nn6GUUmq>BSy{Cnx1evO@WK#6rwSNv{xh~Xxey0EQOBiFv$DfnL
zjV#S%Ujn}vKhx3r^_AQY{e^M5%v^3%o%r6XZs>qx|Ms?H_Y-9NCog}?^X=Y7Obf<(
zy*F73;_DYW99YIn>Pgf54C*+LlM6<HtkS_--dG;oy6M@{SH4--&L@!jPN#>#>v<#h
z^~;0@z)uZ~eki(K!kTeBj#MQRA|fr3$g*WTFN?jh&xaFSh4=na2)~<4?e4)m1YdO8
z%$ioBP4k4z{`}}r-Kw){b13~SzM4NvwoERR@=$=l-gEp8uRtvc)6RTB4jG-q?`b)R
zNWg_RP1-@Iurro4o%wdy*ztJ}YI)Y72vm2zRn+7N7IVg;sz~&Ycc#@jnq>u;c|Bxb
zuA#El!NEX!P4_Un^2PB`^U@_blj(#?rf-g*b4x;PjCF(f@39i?{`>-x<CD%vVYgOY
z!yYEyhlOBNB0kU8WNX20#2ge`dYiNgU1=Jh4!8JVjys-!ks4q7MsCwEVE{cj^G{8v
zs3NVMy~F%2kMyP~9J&yD)A%wF>yNm{<RtJ18#)~^$B~&451+Rd^aOSC7EDI~&Ww_q
zcwgTsyo1ZWZzNs4XJI5l5Z)+gcNgXNlRh;1ArD}aq%&i+*+$p6+wiqkrSd-0=+3W@
zKv&}e%GMb#G-CkEq;!A2@oY_NYw0{ZgVUaHhhh5=Bqh=RlG1C^ildBY1XZ{D*${^)
zM-^}QUIu=@DIQ>3E}hzaZY<{UjY;u%4^w|MOb}4tV+lQ$7gOIlPoG9}OGbwiTRA+K
zxJg|aFC7qF#$h0QGKG~sSUTkMK30^5%LbG1w@WgZ1-Gy+G@$ZMQGGdP18PYwpD^E|
zOVr0bCGe-qyw{F=#H)mzkQKRUzV^ifr^Cv8-4@Xu{M)tmV?D<fYR8ylF;HRe<%K(R
z?#YoV#i8*#yU8{=#X4cR(a08B^Rq9jyM0s^%S^Y2ab(6M2a8VPej7V6icGGQk<E^w
ziJEFVY|}Ln%^eFZ*xh5M_Cw*P$$wX{K&)?uO5-s}{bf+-N`@agT0CSIzS}@<byA%C
z9$_^)wupw)C}ZTJ5AuS$C`sG5+H46)C{+JGncm4F%)Ml%@y4R0&#hyY<!Fmvrf$_k
z2JS&p+YOz&NP*j2KXi3|ge#@X<X)8D>GC5C(7l}`v3U!VrFv9yx4|eF620Z>KQn#j
z=pyyy^e{0I`ia*pBiZlqojBt5Ibl>l{qA`xxLSAvkKL`TMQOgiEFJ#TTKoQC=3c$t
zU~x$_lj=;c!^lOJ9^@hVNT6Q{8MPs`h}#hnQmd7kvDt9@-5St5U<sYgtAZmwW->cj
z9HT21e6hU?0B?&Lciv#Eu-(5UJT7H-c7D7~D%?YPOiH;xAQ4CkXgPipdSClLK72E#
zd@a!azVxZC6}RpuUb$k5&5z|x<Q04BJ%N+A7_c+$1BWMSG*pH`ZTU0cR8URKh?@AU
zDf4ZoichVn_y%tM6OQTeP8uVRa>t7O&beZe(kKS0S7KhfOEz+&Ryhh0@m7dLBrjg%
z;nVxTdL<Y1p48jCh@c%=9Z{Da>#j3fSYWL%=|;U<@52r@e>tLnHd|Lt!8JLMEwdE6
zc}Ez2n|=oUrR!ro{Jlw@ab$(|YdhINq_Yjo$%2UWuLIJnptx>nN=XUDC#Lr=?GG3F
zPDq)&^-43`AU$%C^x}VrvAc^U>M%w$5S9|tMk)SyQN)+=oVL5-1G}TqXX0d%_C(LW
z!`IE*uwL7BWr!MDW^Ssv&b8yI(C8)=6aRg7!+6go+zH64XN(#LijvBMabFzkLZw7p
z@jehn^zPgvay9RjAyE^Z_64C<JMwQC+t(j4r5?U^am`ihx?Vohcj#6FPnL-PR`OLZ
zj-j}<Xt^^I^YL-~z>H01Ouc%C9~;By59FEPVGXe)`|?z_Jeer&NZ>-7uVpV=;&9st
z{hbI=K||qN5gFW1Nz%UMD{0y{3hMGc+z~d;gClE-q^0s~)a~Hze$D~=!|eRND{r9b
zYPKvesk(QKziNuS`2IHe94?K+ghon@4eL)*^cek-R&aWLM~|u549MF4kFpp%4kO+4
zJKHjOQ*CP&L3~r5FtFOmbKB!x&%j`W58aV{+s_xvD@YsDU-~qA4=$U}xnflw18!W7
ziNAj4)zB`gG`3P_Viq}gbFkm)92;uzKbb<6;gthb`Y`#^`?Nw5c)vO8)CX?ID_qM=
z+c)61W~2jCe{KmqKSgflxp%j%r-2L8zzW<l2P>KbZph?$3}0E*F&($~Eb-$hs=4_@
z-SIk3exM_$)fZ6uyoocm*pt1v!xv5aa>|cht^yS7Ea?p}%xS?Hhr(pFj0NYt4RXKG
zAj&Vupg#oV-FTf}ptfZ|yyKJH0XpNUo#6(OS9AM1BZKu_+nh@VBXUT=sI`wA!Z07^
z0G0vCLzP$0EoNFdMFfV4{dXIkkIWLrN~7!M@uW`}UTjPY8-GUP2|qt}v>>ydlbn?d
zoE)__4g^us*kWs?GrQXfD|b%>CV)LK+HK}${%Pa=2M>BQ)uooCL-HvkzE5-?Ao$2|
zptq?vNZX_6rDXxcmi(iUxC}Da6umNY$ahjZ!h+7v^c|Ik*<|?1Dnv7_mr<$_F`Fo_
z?<`2ICiALivLe@s%ES$!Fm`O(7w*I9yAYHdEmYmiPq8HpN?M+2q3Dxy@ecZv^#5VW
z|JP=~QbPLPI*i8?{!3x_Vz~FbI+e0j&k7FC3sR-~K-aq@?7n8a`?8R^oss(?LoR_H
zn_|=(AB#E9nGeC_KcJTc0pBJr_|_3ZyfO%r?iB8};vM>?XUr5~V<16<V>5WmCl$J8
zA}s~k5}Y2RcgU*?;&m@3U(|(99UMgYF}eRp16y;4iRcGLF&PHu>{42y{4Rri4tfO!
z5HM2+PpZ?nR)go}woOZ=yU*Tt#g)RMvPxuK#K#evnP&n{Ux`o7=@V3lOli`&#WO&e
zybm|pqNNg);!0zkfzfd!AG=Rggk&je_N>@I8N5s~+Z7n-E-Gtbh4UIc<uP<(lQhao
zX#QeYrj0oHE!%dN|K5}3=hma|kkeKkBeKC8M=#3?K5MXr_DEeuI?>Nr?=R)@-f#>r
zo^~<j(=0BTI2@aRTn;pE)o_wruK9eqU7lQ3RxR+CDz(HxKkmBu%fI<>gqm$~<;&+<
zmF*;<Az69T)_?Oe+u@v|b<L`n-PviYRYz2x{Tcq^>p(8JXngJhj=;yn?0zTeqoZf~
z*nf30)o^5ZXIFuy`=?b+L6VLezxG&{J{Ac+^y*(OpWx?kH0mTiZ`ccEPGLVrjUAti
zo)0f?P&f64ZBis~vYY@Sv{+JRU%>)XzJ@&s(I0+-H^%uT^05&#Ml!|L-Xn{jQ=MY`
zcEd@?Y;q*uVCrjllRnivsixh$ZcbC@7+yOgVQk_d+t*Ff=i3;BXmMzBhU1<%w;X4r
z@;o3fp0Uk|bWD)uH7Ex*d(p{EN;NGo{lklGkC6h2v~cJSI!A>coG%`#GLi6L&tUvm
zc*euQC=sbLkkd4+?J47!E(W%YCo`{>6=*W?16>fR*YF~}e<C(!vrHh)+7&{qb?ROH
z=@-TG=;q6e83Fe^xY(qpE&cNkGEk_o_tKxQyfIJc6;ZL)&zsj$ig2obD4n=Haf!5=
z`G}9ixtRMvL?~=~f&T=xhl%art@Db9&g{L8Qx%FK<EtAqET#-F5_;14ya{C0KjDhB
z#~zCtQtUn;`zZNydhw<#wsqle{eTpjzb;DM$6#>*PsYc@f^MO|#OU;-&)({DgzUsC
zRdlSS`lQ-j?k~ti0XA9(f7^^cBP%b?_U5VaUj(UJ1NC_LuupDYubH)}kC<7TbLpJk
ztB-$hLGPF<&O9i|+Exm&_UT&P5qOMk>an$mgQ&?Tc1*?IFHJCNgfcIkpW#cO@!K@E
zJ*2C_2QlXq?8m|9vbd~(9}U6L%zK0ZfaeaYPY7i|d-UlY=_SRBzi9PvrYwlcoK)Tb
zm4g@QT^|L>w)3Y!)!!&-%}e(3nH;{^r|wL>`KmMhcP-U<mo$L{lXN&~!Am&(wN?I^
zDH(mOMl5X~zIMI^%U-O%Vp1fr_+?Z$Qkg7lCt#1Y0t3aIL=`1hk~A*pHoH2=?YV0b
zJ0NSU7@f;I*4(Be3@?fm&u^{ohBDA%#D@1?M2nx;!bEo@VRukPdz@%+8+B=2uW2bV
zrom%#jo4-DPrbVI8vMHN$u_A~4_Nqo`ZGso6fN(iYnj&AA|=fmpVK>%ZK>Xe=Tl=j
z(V{(MPo_V#ksCd?J{n7@DJOxcrg?+M`QvqTWr|JIn|+Ue0BTsv@nX_A>!sm|5hkCN
zMbFKHbTXoG-IPS&{F#&s5c-qqoSe8fg<QY`vNZQH+Ii8sH%HaK+CE3eUTG&xnQk|Y
zd}4-N6ddi)_;r-R&Dd3loHO$MciW|e<*|R{ZjwAbu5+4gs4!05`LQZgVu>iJiB%}w
z)!+NEb9^jpicl5qoH(o?dWm%PD3;Z~Dq~D#8I54PhGupI<%TbvcbRU55zmEG5`Q*b
zmK?XL#38H{`^Q~6RxK=Rjm1wx8+W1_EvKrcac5f8bZIRb%aN9|3dgyw%aOPVv*{Cq
z%K<TLQ(aa*P@rLH(*?RsXnL=wayOdDPZ5d_cr2$(SqnNfeZNgNX}UF0#)o=opey77
zQm@-4HEm>UQs~?E8e8FtwZ>HM2<n}UO_;!NnCULVdlU~UcRY;7Kp*xhM^y8Vf9)jw
zf!8z?N-$7(lap5Icr+WUTSan-vj}bfhMD^6GeNdvBKT}BR+n+4e+3Ouzy)NI+k6eE
z7BFtlrhLk+_e&;ErM`2%h8xsHYm@N|h|ivy7DfhB<)^!TcB}-GT~3Paw^2$rkTz$i
zo#&BE?=>CreN#<U5Xiyf*DqH#Ihbm-Z!Ui{_%yuylWERvXP&Y_u#)@oCMoCgM`Q6S
z806%v%+LKbz1^?}HCncCkM*cE-{rx61yQ@xtUp(>(97`}^?JNQ^3Hi4uzCHODp(Gv
z=wfPALV*l>K1b4Hp<a_G@?5$N!p<I*`kT;h`Qe=`Ui`)H*0$B^iMhRXf#j#kGTT~S
zJUlZmH}{JC<X%x?@`&g^u4h9vRqBNj$){>=M!oztF%{ghZt|EJa#UVx0FNUV(&MYM
zn>kWshQuB@7u7}1sQ6%SFD`HRTUC{JOXWX8T-3Dlw@<acwUh3dzN~GlgtNtLdqD|_
zpr`Mo?xM*wq_c_sy{xwhF2a}-Wa^A2C4jXrdzKZDMES?!BJgV2-|%Z)+rL`<FMBA5
z0`-cLB3Qq%1{oYX)Ti1#Ql_!t+jugjxNhM2X9u`c6a!2B9=M3#YVhz8A~b)Q6Hj8H
zFQki|QHtZ}=99j3th~8=1$}8hw3P)iig<?=uk%0K+&fP#Lj+@_zwObk>JMhgLh8NN
z(gRq2Fj@Tl7ISb=RF<&rf|p{OanQ$b`S3WLCQ(XzWD0WDC)#8v<9ak^(J4h7-4xTc
z`%y)-7`2VDu2kL~=DrZ{xW3I_)=-9(d6$W6%W>GWWS2vDl?A(@X*vMW`Z=1m@%mo%
z3&rHk9l2KR!;weFGqrOJh^6Ui;=w$`PkR5I(%mvy!(fu=!R`>&haadYJl{-;d?mX`
zUH>|Z(ng3bEQ~G)Qey~=DdQ7)49;bl3u^kUWr_n7u*Oq}7m8h^T^!hmg|qkvR7KMy
zlDM^L=N?>TcJe#$><dZ1x7hS))Q|X+Yaz87w0Kd#$T-)lY#ApR;0aP1SXMh&NAQ;)
zs)^UJWRqD^!x9ERQyK@V!rl3*^l3hLWYtFUKJBASX+_^zccec*X&fZ3fn{`0)J(WG
zoUqgx7j7Ea2?$#3eh>A838<l|VT{<k)cl@V0gKx^V#1RjAoczi4`FsvbiZs6x}^r}
z^FTzLk(f(Z+9ZldbbHV?a57sS-mRh7)e{cNbTmSOK2!i{9o#SpqoKfw;S=>vj#LDv
zIEyC`JrQpa9hm^9rL{gDcNqQfx7@;l@@>Lu0~Cv+q`9E+dkN9MZjMd!OsSg6%f+~M
z15gFArj(zyU2U=GJ{+;k*L0c<T&o9_xq<mbZqo{>(2YA&8O85=T;gGtO(1>YQD5j(
z0f(~ggwRA$ty)2&t{{sJe8Of%&Phn(U}Krzb$Cn&6<H0R8Ib&0jood`g<O*nroi0c
zP-Q?*&8A;0Cvc3|1JB^>iCfSql`fVOVG;7@#Vc7of3a49u-ctjZ}O#DNpPIVpG{@%
zjB1uZazgcmu(y2&3vDfMaeV8qg{ETN0t6dnuU)4Kyhg-wjo^mN|M~5=&oY)dk<$+x
z>|Mzv1|3-w-@<&ne{fL}gAdtbX=1D{xxvB~x_Qsc@0%uY5tRELRu2^9zdbBT=`yae
zHa=g?H(kLpx4_VF+_=@CM89cfU*O~`uS%aJvao91AXMmv4JAFlmQF*jLc!+`Sz`#k
z#$to$C)Q&PKQ42JC#{l37Awy(yN?P+nl@d2Z71le?KzG5a&hfNlVJLr{63R$&P_`9
z07cj1iTK##zw;t}uSI?zj2qhgW%QCa_3@iv)RYh2^ziPoN^ahW4SE(WXfdT)F{abk
zbbPo5dAyzhEf-GTlooH$ow9!*g&6)(cDgf$9aZsCuQyhu43k{n9$DRBQaoRWT1GFA
zwD>~y76^uONAPnebU-e=<`H-cPw<L5<?O8~bCDbn@q;>-^qkl3jHWM%n|qfLNHSf^
zZE?9)k9eXzcT%g<e4QbU=sd`{v7tC&=)k<FTDo#?LY`M{FZy7%c0Ro2V9F#qom;P(
zTUPaiR%mxL_bXRfI%u3;8aq>YFdC=c$wSs}d6&xXG)D0+Q{&F!&V&ATMvv1pQTLS&
z8q*t0Ei)rnuNmFXl;NW9DnFixtcBdN$!tDOL@i(E!KQn~_@9~y%FUik*CssERX-Z2
z*MtRYS`$$=HdRf$#*&h&ghbzQq`aP*o7P(`l=B@C>pw5)bt+rF$i2BpHkQ>iUQ!E2
z?izLjWd$RqXJ1J-D(+;*>%?;?^xl!#r;6JNV<gtT6fL2%!8bS08#nPxh1#|D5=I6x
z4)PN=J;ndv)$I(wUG`AM2O!Kb1BXi8s|P#=@k5*T=?|CAyH{zejFY`r@8e6Y?8M&!
z6C`-I2D>|qtmf+eXmojjb*{%xJv#s#`lr@hDb-KO1d;~bq&~=8-mc-sJ~0H1sg$Pk
zBmFdAxi~{mz`2NjYT6qOTqP&DR%a8G(*<Hj<I3SSYZCY>qZh2>HC1yp35Z>BQC9b}
zOy0)xkHo%ehq>u~zspyJhC;6c)vmCKbVvOQy1_Ihp~D66v`5W#^Wb&!u6_>*j}2R&
z%>><wyHtj>kk5sV76Mie=K2B1sjPG0M+fIfY?RiRgOehrp^Jy7IC104#H+K%-$gp?
z<P$b$hB>Om{yy`PoPQYQKC9FUnhh_NEiD5L#LMhrNdHpNw-mMdD-hipfA+2EI`B7t
z`C@i?fFQSH8r;CF7NBR2JD6)kcLQPTxK)@b6WPaJYng4=E=E3appoiQRA~RC5#3Yl
zhb~8kxIRzf)Rx(nx|~&PVD$f0TSkJUU=sP;xasvfi1ck2PTUu9X>d^+!N^F)t8$vf
z&wa!C)$lA3TGirLeNt~F@@h-<rRLn>K*z_CkNP=zMgrY_pNe*IW5Sml5To&Ntu~-S
zPb7c)F+>^hBz5Z{uq1&zAG@UzUNrgfUb%y>jN>{lqg9w+LM{1vIyBt>Ia)4N_2Il1
zdZ%JvVd(e9Cpd3BfJtANr7m2D$TwKaj>?J`Vt1h*T);C`)~o^BF<6{ct8Ujh8JF1~
zrwkfx7CCMTwF~n<vbyqIUss4>vS@9ZjY}W_`&`_}!xgHVN9T8lyd8Gcb$Z*wX|&(f
zMbEhDEw4N6jZ4o~<?hca*Ujl0bwy0wl!}2XuQAIrK&IMs4G(BC27q8>GdU|{g%#f4
zhhwUCUgL?{L$vAF@!WuQ<88P>eN)#M?g)&eE)BD?Oq0aQCcDi>&au)1*pMmUd1ASs
z{=0ZcP0O6mXjto<qaAqm<Yx3pHR&QKu5aBu^+ndDyxY48Ui@lWfP!iAWd{uJpGO@n
zC1FS>6k(lRtOWXyx1OoYRBHR%!4CV+V)-=dznM$8bl#E7Ae_!IU1i7C?3cO1Y&}(F
zcL3-a&ki@A91#@nFI(vInL>87&w#ppcxS21u)@-HM(#tx9V!Rr@d_*D%@w8^+wtOL
zo`cRQ4(1pBA@_Jpcl%7mY=0G_ryel|c!1h-qT4^dYX0;LufNIUbb)U~zc1#wG$${F
zu6#$j>YKq`aj4A^^wISfJAW^615nGO4ZRO;{1|E6O3wR6&+oMefPjO&u;`rLy}1m?
z3mZQy7G124<ju3z&IaTQ&u4dxyNyI@E>-+#Ia@PyJ1h}c;i5TpZrd{po*@*%dRHz6
zPVO%&)Q1*&R;pUTql^(od6oC6#CI!VD%P1AvFoC4rw=ci-llqY;UXJ)6Bt2cewf_^
zPxslAoak)IvJm0oVktT8+VVwIkEIknNa;yto6vta(tv|5J~EJo3MDVp_<^)Dh=Xw<
zrbc4r{+dz?7AimF=0#nz)GECB1;lF^W(=s8Em!_(;H|FUcqts;5TcvBMFPCt#*PPu
zZ{}NY7XuTi3#me&tpQUM{~O394uki1c@!5oDF)v9`%|O*!vvru(QmmpP_F-Rc?~A&
zDTj8+wUWIZVBN6U9al;PsjeYE|FXNRCX(ALoC3Ps(=#Q;{ob}!&@=V|_H4vxL9I_J
zIiuJ+u^o7sa5}GyHXO~dCb2>Kl{k8FCv8!h#>AzR!S~Hk!bk%`c9sH`dwCJJIM*#)
zv`J9j#q1T47BKY;-<>&F6wQ6QND7sbcrnp@P%~&{I=+~oYZ})or|?-gJas}Qw1Af|
zmpnfcslGOF`Nw*>6Noy9>tgo%ZR)w$LAb=va?VvDai_`0WX`iTORZ&P>`!ZJne|54
z;&7G|#5u-VBi(zo{RdKoi;Jbk6z*<y*e8sUGGz|at2KkrSjM9J98#ZK^}K8yInEy;
z_C2Go4-X0s{p*V=Me+C^kLj*1hBC(j>M@m*DF;4hB&GDl(+MMLvTL_?4HNCi9}hbQ
z(6LzjPxkbGu=W*TQEuD&bO<;gDk3o;DXA#kpaOz`K}n;4(x7w>-618QgoGkFbax}&
zAkEMXGr+*W{~J8#-h1vn$8-Pw?(;nl&foz1+k35dz3W|T?{Dlv7(4|>_|$pJm5xH|
zZk_ldk;O;cE1x@w#q7RW9rfrqI~_*@35K}Cs~g(Rq~mv2%(wt~m7^-&QCl$9kN}@c
z*Gk{raSP>WDCk{kZde3~OT5SBSXSgQ9GKe^rQukbweB(ch;Qs3SJ{lz*?ywKF5$t<
zz?)N-*W|GwU>00Q+$p0Uiprf~84mO58Ds~se{qk7I|@EI!K%1-JXPT`ysoi}(6n?+
z0G=!-SO5ba1ogTLsOi2}pPtlIZ$6`bvrlG&&@etsLXLi5F>HvAL^&q3*-2#A+?1HU
zrq}qslPk9TO{$^6!ghVZR?Qh)b*1rgYD;MB(z_x{KwRn(&&#8BQ@0ncN?S8UQu#0!
zTp@MVsV#*0GhBp+C5F^8op>4EdK?EtD2o?&%D#I)%H|B{B<<XieeEvO@1!<W>pmJb
z&3;pS5d4$Eh6g?m9D~w;+`=@UjvVW{e>$c{mezw5fcQPC2nt|bd02XD0Dcq5iPT#s
zmE{D}G%P9MiEc)@B76G-a-fKnqm^#+@sj8%76c;fPRpc+PL%^RHl<%zohKs4LtR*$
z26Ub0-mrOZ@3D7Y?a@PvYM3hJZJV?~uIvp?&8oKnvDLiqGlvmMS4d6QHcpNaqG~0h
zH?FV4>+!*D*r4xV3dXDv>Te#`rlvz*%)eY~4WXfT-lTNpEVDRhJv(J-rJb1Q)OmS4
zCNOqdqS%@_3?4`6m2WqwZ*R*|EF1DSG*YJHfoSRTst``w`BVFkMK8v>8Mgv??%2G;
z5s><wY}}oH|4{u*iFf&kgxVp1y0<*FR&E<Uli5AZr&ugD;4%8_cw)!0?DYCrt}VNz
zUEinag)gaLr7BZpMX0AawY!1P{**?pQz+sMrIs4YY})aN4J7{!AWKj4y`N<t+OeJ2
zy9#|KSybWfcTu?0yYodH8%X%m=aZgjL7IM=+D~g6i;nksn&xH>w`2=@we7|PwkikQ
zX<fD@9p^(vB8ThEaGUUeXMPE9ENflKVjyQxj8f%FovxpJfqCcPyYN8gH4B#4$Dc3w
z7sE?j0WI(Y_r-0aGrKrKUWQV<c0QZDlVSR6m(%xVQMMXZvL$Y7i<<3^__ZkxuCLr2
znWQT;X2DZnp3t2%-cTrjBaZ5mNBF0mG?Acd23ZTC6Bh7^c%WxT#fdsn#B_504edK8
z+mRgv5&qC>!`mdwHIQJLW(R^U5>+~3F;T|hUC+l*=3c-z4?NW7pwl=!!Cvxaw|j5$
z>CK7Y?c1J7maT(3w3S<I^R3OE3(Q)M(IR|H0W-`~Z@;2!4R0~%7x>A1EhH%-lCwXp
zc*N!CKoJXdMCS01rpryxq>j<qLUfGpkHikEWiJ1tFxw;kp1!1Lt9|(MURn%4yw)PC
zan3!aZJCUr`t`(gg4}LcuK3moQCcR^*CG9K=U&UE?b%ao^SE_Omv^{L8RNA*uRqIW
znLl?*I_hlDHSBL9oO*kh^z1n7y6D5z!BFH@!rAcyiz@o(VimM+!`Dl<+)nkGAH}oQ
zp6mvRgA-+KT_$ort>u-u6s?!6<xb6>YL{qTTzB%P8K;`qd5YUK?ldVdT3Sd9t%uiR
z<4<!XPb-yf%5?On_tmO-Svnjp4D`U(-*gjgt}1;d@}Ha#4ZhtX8l~TO4E`3m$L()u
zT?)(WRvIzBL~44BKmCEsjKbE{Pg_fuFWeT@UAYyZX%V;i(R0IciJVsLt!q$DLT3oS
zPC`MCa^HNZdF4l~CE8vn{b<W7kFZ+-pXwP`A-u%h;X?@Ac1`A3@5;)6Ur&(ZpQVQX
zOc>b|>42K$#uFJcm6JnieG(?p_8?iw$$d=dSjB!6CiKdo2SB_!Z4QCn9<>VFAS2`;
zRUS4T<J9G$dEC7FOG_e%_f?1eK|(8_Obg^Ol{YgWg-Zz8uP$)Y@LPN!T0NEqHdC=w
zJAGW{c3%ND{`AUol=Z5np-q}^>h;pch0(-T$HMEkl9$|?$Yh-Mh}^Xo3U2G@Col&C
z+dtN@`0OHjmfUF%oW^E+8DxkfTo1-3bc^1u)Y`1?R7V;)?DMn5_3HT_Z<b46<v5h&
zqP(T9nyW=Q)s!%T(J4b4&txm_`DMRy)ouAPmxE(KZFNnqX5sY8_KNWyEW5A=J~Gzy
zt@3l_OhCre`oZQM=Z~YUs_hvGe9;ry5+lxAHQYdD9PZV4Lh_J#UyIfzNu^dt+fwe(
zHoF9MN^=m+Ol8h^(B(u2vmGlD>b^_ISEf|30_aIz$IHA*)$j)t;r6vj=KN(-8Kq+x
zKHqHyirsoUw%kvEL&hDma{!uJG=Q)fN>dMSgQ+RJYfW-s)34n2Y$xZA{b)bcr<q+}
z;^$rSV&b%A?X&FKaGyuivlH_PvrtY_`9is9`?~s_1-`d&Uymz;hxoMI8{xYfXQ-qu
z<h-r6?@$nTd6T>P%$jA5U7li1pKcy`yJ!3yA3@jU;aqgvQDlRslw}vtzj&i`lCLr0
zqLHmO)Wj#)F0Lt-GpOflV&>jZD#Jt1s{NUfa*l<i53ZpHf~y5U-vd%oYpS7FJm-1w
zJKs&@wCmExG#!%?*j1Y#q6&5nf1`(klUs?7dEeje74=5E>(Sw}^QKsLTdAXeeTVa4
z-7)HeZOiLZ$<1oZ5@5)jrzeuypm0poi!oZIl{XnKs7ELEnV1r4ivG9~2OIV&F8ezy
zQ@0DoXqPcHi%nL>GtLC?#h3BF9kZ-4n@A<3jEFc7YZo{TnF!8jyX_utx#K9^wm|-_
zzs14@H`dEWyw@(+BE!T_7c9v?ys9>5FP}wbxrVJ}wH)gT4Nfyom?yi>a40Rr`|%QG
zU$m@7<yN7(j|uOxRfx@cXlN;qQ5wLXd0}P<oy|ytI@a>4Ga?DShAB|f$iUe>XH?e+
zto|4*JDOL73#7lEO9>owB^rfByFd)eIBA=zR(i*0{t14#<U?e*+r(aNPE~===t~?h
z)Ox=bwdu*!`dLJ=;tExH%~DBDNwocxtIX-mr3s=8rRvA=mH3=*)eqOC1d;DYr<v+|
zYTnj0_rvSDPd`N}3QC`Doz=jXY;Rm6J>KoiYYW$h)}7AyI&YR&22%<5>+X9w6V>l*
zn&a?&`zYLMxs(`xoK2LWcygScpRa7BP}x^*_0+QTrEAm7(ei_KEt8~7OUA>I+r(lR
zF>(^w8%b<*!^7gUw4~5l^Zh$c)UHzBy_`z4`C6}R+!-x@W=Cb3^i*TstcWSv)`FVi
zXHrx?A32@$`uNF)+V(inTII-lnWj$CtT+R9Qv$pQ6V)fxP>nwN2~22C$)qas!==hG
zp}oXP80x?PlPDgNaa=zM6L)UK5`$l7yH1Mk_m4Gv8xDTI`&+iWvxB2Mn?saWWg{ge
zVUhs|1|n8tWt}H#9;SF)&Z0*QVInv3s&)&`%IgC-OGc%Th!De<uIqg=u=H5n3l=x(
z)eKfIxT4?z)k@Jx?us9W*c>oOn#Qvj3)giwuRwu)6Ts$+BaX5FbY+1kw@Qm|!t9Rw
zkssLg2C6#*S7#;gj-vSeP+`P1_k_5E?=1XNcZZU|Z!<f4?ImQ~PXh@f4ZG)+oc53x
zw(-GbBcLxs$!UAtwfC-icVy#nC?vZ06tNOs>isxv3xfegJ$P6ad1+VK{e9oUi=D9)
zj&a4F`~%fjQry1^(W&M+BGxMnu@A26(ue^MJ|w2)xiS0Tq+57{E;fXQX)XI{tN46^
zMdB*f=H}i~BRRhP8e6QEOHHl7z=(}yfgE|9;|OuB&a0R&fcShRw*D|*8Wcg)9fn7~
zil5fOxaRI~m1P~^EQNBjGo!Je+^&nC+PK$OIf6U1?I&k@)|x_vH|a#fM2GF)b9FwD
zSl?+)q7z=v_oD6YJQN%^?9`d#@m?cEOdD^ec&t2qA=YQkLjqL8c_U{t9;MbFO5(fk
z3{lvubwQJ#O!5hQ0D?+?w#HpnIq<7%d~d%beSB6rus;2i_u4S->cn<a<Qu~iSRWm`
zW{io;GCkKG0{3x`sa3Ai(>sGcu0!SWGL$YWOm35d^E4YgbzE=b^t>9se+KXMz@~Fo
zPZ7VL1>hdr-Y4pO1h;=dk!HK3J%IAa5I;l8Uld(`<$hpRf?u!pc+K|Xz?P?XNjh^8
zrJ9yli=qDd%<bN~oIZxucKN)jxjTJ?w(z5+gGg!6$|ARJl|v@AOB>l~mEtI`_}+IS
z9;de)%jzS=_Hhrn!R~QMB+7-2v`*?E@jZi*2?^A<j_WpEjnU01Y@t*a1xSqiyY~0w
z_ZF^dTHJK)S)sBo1B{U~fj9E0qM(M`*@nAK7q6P*#M07I=Qdd*DmbfRdq_<;LPpzt
zh(~7vGNNheD%fVI?}{ilhQ%himo!faXktRoCXZ`%?5tf!*AWvLouBRp&4~dC@Nh)E
zw4VU}18{@Gsm~HDpcQ;jDhS^nNHYwIIjzDQ?tXt;l>UnfcyYNuGw7sX+t{&Hl$DGc
zu{HSk;<`<8sq7^G(bsmu5vuQEL;LUh8eeXmt;4{;V<nYhEo+abrnSIN;%wm21%`6E
zBdX_Bh1W*g`V9La)KI^1#Kb`@kJ%_)kG)+s8AEHw9(U8}ro+r>oLdqcXh7?nl|k%#
zrP_jBHJiLUTji>q`iQH5ZYqg&ABqoDOHbjm{<Ep%QyhJjBRe+z?bR>4KYU*32#ADR
zO@#weG*AHS3}Cqjem>~6ChZe@@%jz0+oAP-<HJ)G8L+*X(wNDb5usbyM1E9UAcAsz
zdwA-+422Mk7VK8ld=j_R2BrTe5Bg6H-IM`STsk`=z!n;ES|=j%5G|bVGUd@pNn~g7
zI=yj9>pY>L-hY6g;5vNW7{V8|sL6Y9=MrA2oLyl}QNn3GiZ_1*ON94$MmAP7|J9L=
zJ9%}V$g5sG@k3UPj4uk<2Jqx+B_WM*v(k_5E+2cT-Z%P^*kUF?dq^yjHB5Llb4c7P
zJcc^8>fV!JBXt?^Z8r=Gr_?RkOc!%cu+&<<cTGH#9`U*u`RUV*^5JU5!jH~5MpnHq
zPWI=+c9(R6w1?A#xP&eD%3i$g-GH`!j3O=5=rPo<Iy-fK`BA7C)rbOGP60Jaw<2L-
zqN9b%e4YDjPl>|c)`5dmUU$N6<l{hEdkfV3?R=7UZxjF7K@JDd_R9S}M<vTVtqxaj
zG?{-~Nob|0EZF6Go$zr@r5U-U$m{;gj)#4%Cx$?0dUR)N$j*|jl(j|->qp&klV}cI
z)wIZ|WXjU+6$&CApk2Fs=6eiN-e!metfT0~)t7nvBj&6z2C<noMV(I$5}gelwaX6@
zh0`U0pfgToN;+}CMd}b&xd>Dld$>QBMDU0r$|BAARs^nbBvb8+<l47L_RpHVxUQTn
z`EJ_1R$^SpVxnTJ4v)lNVADHt&Xdhd+c0=zvE0y~)6zL1%xk_TQId;Yhk?S(qH$XO
zYNv6M>#FC0N&7J8^R@~SgEg~+K)fbjuY5rE7IfTgXIbB#IxL$HwXZMh3vRB^1H`;;
zmZYPJsOF=}jgkav$A!nIHGI|+=6AG`jqXZ+<t(%Yo;Uw7)o&u3zh<vnSS$IP-&9cz
zn@h`nLb~0?E30Vp!?3JM+~NyW3V|gYB5v@Z5pBEgef`xFk~V$!myqTm7N2#Fzlpxz
z4kEHMAIyg=>2)noQNP30UPa#N0qRWeTEBm-Io<XGG4(hWP9io=JQODFc2!2&r9tAK
zA^|5s%<Qz%1`-820jEJN%$<5|q*hr!dUeM$4^a|1;3r-4{><lOr&YIq6fS+Y&~zJu
zGih-GBZmdBB$a3{)L{#?OHkySc{!bA<<&-rYY!ipKeveNEt#~M@3QHsKA2d1*TvT>
z{)*|*d%qy9j7>f6)NHX_HjvsSUp7HA0XjR_>Nna?R4`;w%wu74C0eIZ{mt1gueQ^*
z-y;NT&k({CqZJPUfm31F9`tVPmMMb6@i?cnYHYiasKRQcRvxy-T^rFXe|nW9e$s59
zOIz3IspT=?<9(nn@T))~3J7`icvKE!-Ec`EDmNRDpX>1?|88ODcvX#NZ7k8PVm<Xq
zqq(Ml0xSJ>%z|;QUR!_X<rF*pY;e}MTI4GGl9zbesNp+{s+|Y@25ULm;@rCXTYhA@
zA?mXtrj5!JbY`IHm4bsQccslZ!2wlc5wW65XZ5*;QE6*rxHqD4(S0X<i4jJ*ZaNOR
zLkL8<;;`e?W3E#>Noc~|G1&(5Z!%zaHrGin;`-SR_7<nHZ{~3$s;)xQ&Xo@mHl90!
zddGyQScv?GY(d{_K;GtM5c9<lcU$vBMDbdsSgUGR$^P*I@}R$+YrZ^pfPS=f$o6;>
zOd^3$^*z1GDV=TMR_W}|MXi4Fkw|Qqc&%7VbLvZ<Q$L{Do=)>q=<@Wgwfc#D9UL>;
zr(Bn2s|*3kd*7hNOyi%qO^@plCsSANR3ATTzVdAGMe!BdDEw7ycs;=kwu=WSo3B^5
z4j(wXcLtlm1K1TVmOl<0G!481{x4X94O~VH-FW+v3M=7NyEVVj6IJ@*#@6Vts^>>f
zlv#SJKRKpTT+T}W!sDyeMw&I^Is?%*1f*4^AiaprXPNM?*6m#bfjCW@MSF@|daN-d
z%PD@e??!Z-d1v>8Z8vXd3)v%Ld*bfM0DY&p?ll~kP)>k<16u#=Ru;L_i{o+Aya3Is
z9|X&LZuVEGn7a4PrORs}Dk4r@wt16I8;Dtiz`c{eq;@F@!tQYkKe^>kH>AJcg1ApX
zBHQ-i<%Fqk-^zdm!t(mW?u>fjC4|t<GjUUWD{X-wGb?R}=UygC;;EKWzW1tUMfNr+
ztrL{WH}PUa;PmbqhsF8mrlvD4%}v925(}QSDdBs%A(}DztAi5@2;nV+T_&vHVQ8&c
z)OtZ@Hzm!S{lSH49WD%qmHzbCrCUFmEY$P&-DoPAUz*C>dsy`XZJWHk2ZuT=EUs6a
z3N{L%-+)R9X9;k4p0lPef;Uf<_TohsdZ25D%lM<Cs-E0jnvo0&V7+N7au^Qxu?&WI
zy|jBDHzG-@K+j7~bYp2O?nzM&A#b}Z5Quxo_2@^vNyY^mURpL(`-JKDqE+WAg~L~f
zq8I+fz|KRHi8Xa_@HG(!S*wWe^98_BaqpT>%3g%o#X*moa(dn_PTEgL0!?4b=2IQG
z3W|w$>A5`aPFimQn}4{2%)Xj)op;n7OJ=G%cY4uYuy~(?m}zIB4KT&O%P@<ZyFmcr
zP3h`QULev|wken?*gjgtW{~y^4Ii2I$HN|X>O%6vRs-B(-e@M8x$JQcEaX;hJt}!v
z(1*t?YIT*OMI>9&gKg^FW6HDB_N*(`wB318HCBGwcJJPF3yC^eXq*DM;Z*dRMHz3W
z%p<olD+#mRoJ+A6!D0%hD1PKEMdrjog;`N&TB-vKskz6g@`0*X+i6Ot>G#CXzE7t;
znkebd8X?pP|5AIaxoOov&F{PPwMFYm4k}FOxDK^l6Ip)>itDDBpc}ePXWg(cM3+rR
zZ&|~&CxFO=1V|#2gy5=i;_fxIz#jC+)|77|4Yd#WxeN^!CkN73m>&&T@NP9KRrz(V
z>qCK1KS1+ry4z|s)3~#s7u$K9c{PFLg0^$KNiW6_|CEb7V$_x2GV&R^(&@ZMGQx<{
z%q*OXIOq{RGZ2@yC;_O#Y%s8IeB8b8Ucnmzu7u<DJszWPhclmoGYW@{dqG)W`S?<a
z*q0u-Y0hC89HBV24}x3o+|u=}wKUMhJyuI|Z`i7g0(U4K9UlyWS3z(;<UCwvxwf~K
zbAC&@2>kmMim|~0T*h+uw}WR+Q(V)4Yu`kgw*=(otDY4DblKd-RI@T23Yt>TLi9Z0
zzD76i+L^C^iw+S|I>p+U*v>y$wX#_7TF&?L=cG9H9ub<(&={AnZ?Sf^d5<UUlU(OL
zqu*}1$D$Z|L=UQ}4jYJU2K!_>b1U!ZnrlUPj7FqBsF3(rG1ZRRSxVxfvo`A|A4<-F
za9!)*VOf22BFW{@p@Xd%<Dri7m_Z1+_f+43iBepSHbEE3KDgSg5ABDEAC*<jsE>vN
z0<~x&-b)hN!D(ldeL<aimqI!}+>Zntc{hBhTdwu`Od3QoK9g5q`Oz*|dvUC=yPR(0
zHe&2pyuWmd@+S5p-uYQT8ev1>6YqFAc_pO|*iYUb>dF4fKVNAldUvxpH=Z6ScQE_f
z%L^xQ&><8L1QRSvG{#X4?2)*iXa?aJg2g>@Tny{T*{*8G>P4W9^*Qq+MH&g3@3-H>
zm1`?e{V#hiY*Ks>%e3dFpc`P|`qDLgR$!I#!FjWpu)eLNrl7@c?>kRZ%<&s5E3681
zCzF#vE8d;?l?U;dTajU65gLV?Z{oN#JLIaBb`d$U5@rILYv!fX%t<aMQ2X!O;!Zj&
zA9_1=sa=|FnISr-p%ynzgw}!LjO=FB9%6=>aG>67?m7YAH(VPHs_?Fvn1%)^ipwIh
zLhIx7uk$02dwI2|F<H4ae4AH>30brXBy>N!<P!yQzLhknmlU-d`FIBwTKUA7<J$vg
z(u*CUTPN}h*dxA-RA^0xc4WlIa^RDrl=!_Kjl!E;Col?1tCd@QdeE0%cvn_UyX_}!
zN6HkcN^*=2YLKf`ReHBIW6VB;@ZB1-E-dDt5INbwzp}NLF%Jh+&`vqme(`(Z7H0}0
zKB(9gH!pn9F1BLloSduPdR^}1OHqo$YqW!sdy8F>V+TE<&Z(Z}rKiX>Aibca=hQ4x
z(DD0@O<-B}ZB$7V^{gR*tb>ZQQm-B>j)$p6Hw_X4G^+)hL1Bw>*l*!mfybNG+=fP0
z)wCqJ8*Xj%{cf>{C+y-=DHS>zE~m{)yKT~-PM~I;8+4Mghlww{6#DVx2<WNqSUW}%
zb=>Ov(pO<KHu`vzgnWW|JzetCFs;bRjH}x%H=y}3tjn>Voyw2a$*MsbW3~KqlA9{C
z!h6PXdj-Ct*8}6CANV;^YQHMDS-GCjOF!s1AaV;|N^)(O5LJ=L&V6RA<I;!QU%ux?
zXdazAf=^28Fe6!h>Z|#77!2G{)}~mB+Nz(rq9~kEu)$D1SIv^<tk9D@zTU1QDq$gA
zO^1-H+d(MdN6SM^9goHP;*zxBq|U{kS6kCqNP&iKH|b$1I!cJA?RWMKq8kMbhE?p(
zYdFT3H8kuN<BT8fEovIW)a$+Wx4_Q4R#uMpGuA4IMK#Tfqs{u?K0Vs&5nm`&61R`L
z75i)<T(H&>g-4QxQWWl_&~=;DaXfpIu8VG7eR(h`+-9^X{A!&i=@fpDw438>xEaJ<
z^N#26?vUJTj}fus6PXf=nrIiqQ7jkvh^e(?W+tK#c3rtr{`h11N=8B%UA2_PHY#kl
z!!*zMLqyS=*wBLZ2UMM+2jw#%pKb`7h0vPXO`vtvAqaDUMdO2lwn>+fk$IDnoYiZ0
zU(9jQ*xAJemPR|l*E+yw$4SnQb}Oe$UuMm_0FnrYwAoP)7CuYCfSP8O7jP2IQ;K~J
zjwDw^=E<VrlHzwe^XL5)wx-;g>l2o>8?<^FDl4%yrhbS`=g}wE@0zj3!?!~Cr|dM!
z#UD~8M{Rn?o0t2n7mv_#)n)bK3W+j^N2kzazH&|m(XJOSS=gLmgMcJH9wv%Xo;3GO
z)CRhC_C*n+UDb20Pg`qiPEaG49AQIhsBhjYd2}ViW&CEN5^l&Hii7ce&=b7=7DQmu
z*H={6+>6$`hTeiq?M7Ehr^2g=6s^-rgf|ln9&K_De>*^8Xn8r2ROxL4uKxTg*9lW9
zQP$JXp?6J7qMcd4LSsi~4$e@sNXzNZuB2?K*s(7dNczodY~N(A(RykEqT~_KLwzDK
zt8no%W`YwZmHD8$$w)3kQ0xh(c$r?${h+Jq-#Btxf&Q0FqTJ~RQ?6Uu8U<-{?yX;x
zinsy2Sknno#a*-iH3?H7a?JtRE;D&V;gkSu1unE1J7llY8{H_iWN{XfamK7ka;ML$
zK|E+d!9LoJ>y%hdC=P4ZMpOYCAa=VawxY8_3ihULM-V!<Y#VLYDz{7`s!qof3{CRZ
z1;(zKP84ge#S~0At+f{z-p@s$l*N#T13b|m%|6JyZUuJWloajVTtk|bFd3rEO8ow^
zpAIb+(D7pOG-Vhy#uF2~x&^e_sAON1r#OqQr-e<YJq1oJOn<tx3#Q9o;-7Zme6!Sj
zrCP8X{bR{&gri-17mWRFSwg(Bb`$0c=`bL?J`!9G4lRRJ-?4dxRj%(+SyZUxR?ZGT
z6c)qxmEa@9!8TYDJFW_*yd#$2x1>(WN&x}J2ou7z^ZfZ3Z(?#wn>AJ2X-u=WUAqXo
ziC?@5lV{|<(Rr$|TF{-dPZVEMpi>A>yRHrbci_WcJVG?$h49BryFL2$z?i>>SK5qk
zeA2T*KtMzAQ%K7BHD;B{EVwbNt^J^@gRRxFcCW_NYx|zz&X65p%^15b&_g+!AX>AZ
zdWjIHQ>~!n-pEMKbnnDtunl|97VFrdutyKfUZI1mc76`?rv>XvqBA^A7D;m!<y>|V
z1vl}B8(E%<?V6NxK#TXP^wdcL4blCMz(e7Csg|yj3ZF$f60&m8*)_j=mY2h=c^v3P
zPFjfWg!G8&X*Ar+({E{f;CUN|%}=7hW3=OlG4uk&0V}SQ31%v8kkoQ|Qq!`P2St)5
zesWV5{{o(UPL}Zb{MG;8_XeAglD_I{Tmeyv!BJdm<Tx=YRzNe#O#macj^oe<l|M|H
zPqpM!50w53qv=&$&EqPpx1T@#Rt7vumW~8d1UStpi!R&?hrqw9p4*&60H!c;iKj{R
z<RGo!^t1_a65761HYohlnd^6?d*nOHJ97~)R@o3|_kvc;sF35-((9N}l`K`&G2=Z+
zG}4<~fXsxv5&irY6PkIaDF$U?Wi=KD#Ro=cbg8b<bn&1=C1(;ChIVD`*($J~*hK#8
z{PQD)pVbiS;vdxEHkAxeXF_|eZ_2?;QwG0PZc&T9lXPs;WzoIMD(|Jw%Nm0TtV-SZ
zJvx_ptvpdziEJ@}@M^?;@WZ-#)29LR&*?EBw;(*u4$!@PF`@VAwf5UqhgABsSYz}O
z5@vP+Hc{UQqRKfn3IeAGcn+&s6E@75Yn65!$JVCnDi?+fG*-DA$P*6<#SPcClw3TO
zwh6`RS(@&=+&jGl3)sEqXtQyl*77CXjZkDIuU|L4_W2}=h^NWOPRTomhmO>m(12)l
z(OGkMe3RG%N(jtG3#qK#ycRbXFwjcJ#AZx<V=`tx!0l{8F=)HX^Mc8JC0cNR!Y2FL
zVCIJT8Ojs95UYFDsEV6PDwzYvL`w5X%$}j<&!!D{*cstHzNt1t|DkWPnTZbhFusf8
zWR{)g-<)Iw>juh39Y~fMO)JUSDdo{vks$FEFrcB=*an<;^si3%Re6f^5&H<e%CP7f
z?LtG0-Xj)eeULHKJyDGal(zy4S@Xic8CJl8S;%_=dtY=d=Q&Eat!pQ&PZlWUgM&h5
zx7gOkkB?tU;ay;-;LC7P7W)E*9!sinn<)SrY|!qo=(T-Kd<GwAxo^<Pcl^<Le+%s0
zdWebsE-AvZORWIhM!L4&7_N<V<g-~k=@Wmd@p5IZw!qmc6b}u1cx1Bn^IA%G%q6m?
zMDn~b@zt=NT_nUL7*xk{C~I-!{csIvUWR<2S0<l$_W{xxAoZVJ%>R^VO|D^L8JLbz
z6l8o*gmfxjyXo&RM#w9#UqC;{Lr!73U>^v9Z>P8@i$7VeXOjJTiiAqehul9?;(sP1
zk(~&-IGpx)NcVx&wTtpF{0?KgRpZx~3LRk3Q&6T~JK;>qx&y1AHj=*lSxv`4%rblk
z0I*}E+OvLXi_DIzoj;X|NoAGli2Os!E;l!Cinmy`Js0%9T<MYR60jgYo;<qW99ews
zd(038iw|pYu~+?7UT@@9$|dQx(uj(qya;(Cxr}kq^Ys>(mbVYgFoD+?SSy4tQ#m!t
zU-H&|-f_NB`+2vL=g&7V|Gt|s8PCy!7`n0*mS2K}bHnk*Q88g)4u+JS58(H75CzK*
zYnicENj2kQ{k+&CxmtZOaK1)j(B>*4UHH(;!0RQETf}6FXP%4ovs#|AElwM$yth;O
zgD>(rQ1IofW~VW6`RZV(idxeVBYNOt49YQ7OUTT0+$PoMzN7D0EO&Qryi*g7zp2`T
zkI#;a2Y_BI;moYoDMG*={R6;X=0gMCZbo``_3MCX7Iyf7Tn)<<vD#Q|t(D6-wuqPU
zHpZXa{2(<boW8{9dzeOH&y5>Tl!cXU;94}0um{G-_w5>*B6#1}0;qFcCOMnG`-%j>
z!Bwyb@zn^8#Bi`kzqkOCy-T@Ah+doFw^)J`G1)7+#3T6Ulm8dAxa|@|HZsJ%m(<)k
zfWZ4UHCrL|tC)tW=QzzqnVUA(fF-;@7`4<=o~Tpdq29%;61|a&<j*6;SJQ{irUG-!
z0idjgcY6xD+>o7)!<Npev5MS3NmNaDAE}#A(Q|7}pPHpv#r%_do%t<t%C0~zQyPS*
zf30N94!h)|WP_F2DU;ZFDM6Q|XF9|TDt3Vx_(R3s64iKXPHGhf?Oz$yK8z>zg|L^1
z<<a#Bs)v!$Smj6P5d$N5g!9h1%)l)K)%-E=<^JKm&(j@!L9{J=zd>p$5A2boNQqlL
z$;xn*gRjJuD6J<2VoZZ!np+&{*IB_)pbnX@<C4c-KX&3}5}aejlc9@9&<}_R55xfW
z=p53kY{-td`vV*DWC%uB7U$O}MA(`b-f`<>jQSIW7DJLb80xQKk*W`%ITD~P+V!dQ
z*4+DU{3=78+N_sS8UxFe3L*fSXjX%`bLz0oC6Y8Y;w9cbA132WDN_t^mV4@j3Gyw5
zqpAxiF_`gl*m2OMWRb^-o(F2IpeXzfui}dV2P0p=gP>J>c;i1rPMtYyK+)WWke!R2
z>gHdDPa&P8mD125nU+2$Lcg!G$&>|EdLHTx>V$YL53~kVt*v`6LxobGX8VC)UPv-a
zpHZzx2(L*IUFgeV_p@T5aT*f;=K8@D^_+mDukE(7JyCn9Ams=#4BF6P`&Badmm6^Z
zUFjo@iB6?SB#CI;s<g#;YIf+UND`5KhxX8k8=<klyrxUgUz}9{`MxXR;;U|Qi?{5$
ziIom#Y^L%V2&X0YdGQm~yyr~!J7e!}jqY)uJF~Y3u0gY*e@+WR4Xg+RS=m{j4-^9u
zOfWMWd<#kjd<K&sjsAT4O0FO8-CL;OzHoYys6kR|{A5#W(o6WXzIG5><accO!?6j;
zcusV{ISHs?%cXXgC=8KLr@8C9Gq{FV%GBB_X0o@F<6fAn7u%%2s^h>$4@QeokH5!@
z(qKdAYhm?Hft@hE>Eh_Nhgajh_W(PxiIeDUw4)hX(G|r<xxg*GYw}&0g3*9G_zG({
zM%`Ckcr3m*ae1qU&q_>X&-rRqDh{h<6#vN!KL1JlLZ%<9YJv^N{!OCB5Cayp&IB8E
zzPy-Xx3CWBoW<y*v*Vi|UY>u|{?+0l*Hbf{8X|%=d)*K!=jpH^x0Z7hAjRTkk~Wii
zK+!tlEP;uiN6!?}382Fhvbx61wtVVySma^Ke@6`EowrY0J*5fi`Aofi%u|~;|C@LI
z$q5sX>+_IT64}S;)2qM<Mm;V?i46=7lZ85^n{e9#@!Be^@4+ILGHkQY?f_6o+V&Vr
zhb~6=V0Az16Z^(q`T{*J&HM~Cr`ZPpq{E{;3|C8{(~t5ihMisYTxE$t6Kc(X^LR*v
z(Cbkec!?`LQ*+i=K0G;03Yx(Lt$rR$*{?mz<Q}A0C4x8q!}8t!&GM7o0Y8xBI;87Q
zYY%;{8c95RgL=vvzH^^iYzGJM^sr>Cd3hNF3J81$=L^tux~k;zk)ZoAKoSPS^g{fT
zGR_IZj_nNrnRD{s$$P^s{(Pry(@4M!_4%${f?@x|*MR>4exu9c`R07p7}Oc&K4+r+
zQs(b|q15MgQcWqwZ2ZM}TTGAx4qVPLSwxxEpz9_af|PJg7Q2Rd?#x5JO|40P>+0t>
zj0xDu0}Qm$=oLdw(eDm1z}FxOuHiz`W`_iJFR2Q}rUY7=Tecxey=|&oW(vSg5M{A!
zKE}`=V>YPH|K0ke=iZ;+FXJ$grquZy{4YPom<eX0G_VbcCT;0^hlMYo%)O2ElMwMI
zMu_>Zo($32_K2nDQ?V`9GZ|*d>)sBygubzND~Z58C}W|~+po#V1H8lFrjSiBtb=BQ
zz#91-(TTL2W4m8Ig&D2*Io^N6pS_Jnc}#KdYQ4Q5z^^Ap5O%&l^N@ZWH=*@MIM|bP
z2nL%Z0*q1KNK1{aQ6>6lf!@ptB45xe)`1K2w2>6{{0rRs!{Gnp&DRNRYf6Jgvd(X<
zGPfGBX&=@V-9NXDFQ7xZ@sN7ILsIY@ddCiYiH7P&JQ%_o$46VsIW}Mb7LY}<kA8>7
zjej_a__;m&YYi;<hL{zlfjtL;;bdJlIMo+|O+8o?h24P(^Kkl8p!@@B{>7UweYC9Y
zq*M_G2fB=;N5*@z(CFoDn*?Lmq9&@a?Q3G&j~To>eY&2Cp(F19Vhy&jf%Veo9u@hq
zY`<-*Wg7tPP#SQq<=!v217^Yq`{IY5DkijNy{a_BhCy~E9P`HkoA}#VLeD2Kxxs$|
z!|4A)Pc_?&R~z#qyWPNd_YJ627CB#7L=lM0kaZ<1I4WZeqDzsInp4Z@zpV@gRuKct
zhB=P?hf5lXy^p^P>IEmCZ@<DoVgBSB%GD^yAu-g=@hy2Xm!j$tuNI#GqB|CyEi?@g
zWw8u~eYv$QQ^kK1{FoMP=Yiya1L)OW5}%Xd1Wf^3jv3r_w-0<GA;m;|Euc^gx8Kei
z825YiX68*Yx=!L=w<V936HI|G(_skv!jKhkuXwV%#F@t_CJGygzYogR)q8>dcX;j;
zl0-k8g@1zmGpdOeI{umb{NW{pnnC#;J>Lgw@1sLv#%&KjXYU60Prkqk0gwpRGTjo@
z@cGT0F~Ai(q$#4wf4I{Ai#bDYYCE6Rp-C_hI@!I5|AG?#WSr->S1yl^DvHgUN8YdW
zxLyd9@c_dVD_c@w#RnYo31}OG_V4ft^IyU1w>NE+0QDcfq6#DvKT8__FmL}d-H`80
z0Lo{}lTlh{N<B3Sd@1U}3Sit)O&X=o59q=apOI0+yM&A=0->(}c!P`Ff1Mf6<DUR#
z<MkJSX-xu`mID+co2Tx!v-0|4j{ZbiGg6`r3=V&R5&z8ueXYl4!i0v3q8Zn}+~|M*
z(k9#k=us~p1vM2D<$FWF$q?2t#7n#ftm@n+z2qG?(PSDMR-bqAurCE2eS<MJu;G|s
zb@Sx2;2#F}pYim!u#AVq2mBZvYjMtjR+VZQ{Z3gC98S-dL6-5$gO<1}ZFVtH;4_fV
z{E{VLG6B9cY(sn}bn&_`Huc>l9+-!XgkUo54CbGh-G8$ZHucy#zN7wGdCi;02E_Os
znDGC@vI6eW#tU-5gfeyldHgTUl0@z$VDn|1bvv<w?@OM0KcT9Bd&h0B0k7jzla3R#
z{KeT0lSo@(-q2PkqzaUmN~oq>oRxIkmYU22J;pkeWCd-Kv7%$N9|5fXD>e!jNmPV}
z|0vQQND9e2N77{gTDN^9j%9&sSq*<&=EtQ=P!xu~+-%Pw8C|^ovk$?{!0n`K<S&1!
za{RRm(NPfIi{}Fv2XFo;?)y8w*#DQ{e{N0-@%UB5P%<@}AZ+7q5fN4pl)xGYfoNKr
z&+_2hTYx#Zmz37{Pb$-H@`rGUJ^uFr5fVQL_P;yXWaxh`qW|?B{xzOTgkJLRBsGnw
z;JYZZJz)dzW3h(mvQdDf5Q<^y!x~xuO#mOpfbb3;BBFZwKVyyC*Z@`eow1~tpd@@p
zsY6~a7X4h5`^&)e3FpS6grX5rEs}eoBo;NJU26uGdT9JtrK$>)L;++r0s%qvk^Lij
zGt9V1ocW)Up;F&nkUY1#S2@`3;sav+;xh*-Zn}I7{pX?nJm*A*c(j4u`uR7deUSJ7
zr_XtCJ9L;spiYuRS}>Vf`QlHHEBh&o0Hhv(!fYZ`VP0p0SzMT#>$X3jf+*7#X_TVL
zTe1iM)2Jr=a}@s1zOJ9JwI3GvM`BDzg-)o!7tB-wt&2?RF)x0-hNi(b5~BYNLIR-n
z?;lHEbf$}^FIh}t5vyl8^mYpTrCi|mU(5*i0F)eg>#s<C!Z?kjs?$1_haSLAe%VDe
zAO)2soWVcw0AE_eL^HYDP#tw=^r=$+o#_4Z(0<$Pi=!LB=hte!8c-Bm(*Iw;KPM=y
zi*zlpu&h%qZZ_<P#{K(^{!);FtRm2xsF`w$?*te@LtO8mV?B$B84%kg3DJyu+za}<
z$<&3N8_d6j?SGZcev(W7Gxo#wC0`Cava_x<kt<-pX>9?>H(?ABJ18oQ6?2}9wh>?K
zA)OYNS>pL=3(DgEe_7@Bzv2U?_@5jUbXe~~N~=~41{}Z4V|3f`R+7l+6)r2es}u_5
z$y&->PfFJS;*S<5AirRD%DA-KcbcwN5<?>-UUKYhCyO+h(ETP$sP|k(^BlCkvd^vZ
z<J^cQze8pB^3*?Y@?_D!XXRgRq9C#ZkF<Q%f06ZK5-hM{#?qHyV?qUyFzfMOr1V^B
z)&<1Sm^R@nbi*>_u8k~$m}uD7juJgTs!4WJQTyR<{`5~(cw7l^Ibfw^?_-Dq?ic>m
zuGjrsH<<Bz_T$i}OcUU-&wu)%l!_Ao^9OYdNPdw4T_gn(cj3#L_ew&|dkH3I(D`+g
z#|}Z*EH;>ll#7B->0H|RZ;D=j=l|#T^dDNt7e#U4kXhy+7n0a#i;*$}jksKcNrRjs
zza41zOKyxQ0vMhwpr@3lepit!myeT--jz8@J?T5E$Ntq!0#e`vz_4oeaug#+XxWj0
zXcS3y*wvg%wC9yIg^L!!;BD#TY5*0`2ks>S{2#cavxT+~uDI*stzx5$)p)T)mc{$s
z)6SOpDNbA;oso(6iycb+pk(`5*c%MzS1LEo57t&I)GOA1ej)$xq156qAfJI0)HD9t
znghbJKRTf)9(C7CW>kKE^bQ};zHt?w(z1f4u$cgr!OOY#BHA}+oE*<3qH*jcOu#{3
zgS05?&`hhJ_LbCCWb0u#!s8!T_>ZLcFSLg*^eCV|q+)u5@|TD@FyvTZ!@i>wgypgW
z`in^$`GuFGHXy|(;LNZ=nMArpLW4xQ40lCm+27OizZl8SWD(dhDC(s@=h%RAYux<<
zyoXWM$H8#C){xox5rGaFfG3avRa7xgo#I`IBmYacXlHM`%%tKpz#0~BqKiI22?YSt
zA8sH$O2qfuNsNDAF8*`Rd6ogbk-$5tB6mE?qW>L;L}_fH+mJ9ok-XQan+ZazL1Msi
zD1-6ye~(GYu66k5QR$ax%*$15K>WN;YAVbFlt6!Jp(MD-wy_KtxS}dXeR@|%@e)8`
z8UT(g8tkD*p1(^<`<q-R^M9Wo04qJf{}B(LeFlV7Q{HfN8SEDlUkSxa{$|5(`D3Y6
z@o8|MH1U8y9bT%z?;uDBcsmu4M~To8>;F?8#rP5E{!RFkEO7;}``Y9GLxxX>&hSNl
zHN(#zCg0|1dT@j6CKuP$7At^d|ElKngR?@k_5ddxLB4+lJZ$)9mGZw>7|3^Kpvh@d
zmD+kldHpn~>@0BdE}AnagMkT814zN&6M>(3_dfxFP7R6u(!XoN!>F6~7sd(Hhv7Ik
z63U68OgHs8qdr>SO{2MJ)!Xa#e<S)Bpg}7%{-mcpd1C4y$HWuergh^$n=(1Ezc8&j
z<JV*t$V*y4;(*=ID6gZ4BI>|J;r*g^vkk~ClpvrAT}d%<0P6=iVej>Afq?BXKa}v=
z7Ce9?Lw5CwF~$F^hK4EjXC<Y7(%^H{`U98tT0a8Xr#2T?W9SX3?-St*yo&r^WP&f>
z#L}z2$k|vcC^KD5)dh=u!a?i#=ELUbl#msqO7%+oe<I}rHrwV4x{+W$2l&|cltAr>
z|6cNH^Tbz`QLXgm$VwZfs$7wU#wIh_RhA+@?;B~R2>|W=if5e%8GGLa)HV}x5Jy7Y
z$fVW^WVsC<DJuwb^@ZaXC<tem8tXCsE9dob!#wluSP}m2Xo0Kdk!n}+NNJom3P;xZ
zdbxg(Wq%e@)SCR+X8+k9LvfXL?qT9y_K|f)L>EA(H`LX=d0&hqdE&$BqcJ-$b?W^7
zs`mYR4lXe!l0WX_ksX>HrLuVzPjPzPor-Vh1I2YsExMyk_r7H61ItHj_@DIo1iJ;U
zILAoSDR>~SF*k_d40B;EdWeiLFO{E}JaNuOVQ(B{bLecIa@#DGIBg(p%ATX8H4VmO
zko4ty7bee&P1CkapC30KrJa3jAoA}rI9gEtTjFj?4~dR|=_F@pJLx2Lmd9@uoGw(7
z#)wd;uP(yH-DR)5Hlcb}kDMFQ(NWQ;?(iupJ5$TC(U|<sLv@#xueR*gDR3_Il`y!1
z+Wo*MckDihHpI_r__58z-sQQ8TyYUQiIjQw`6gJ$_3c=uTAq&AYU-YjmZ;nt)RZ02
zm6Ckg6iYP^^^FZPP&<R4X<2!=UAf<U=1`xHD1N2OQme|Dx0Q-Y@<+I4KPm~i2DEqp
zEt^Y7gOTZh+Ulw^wX*ebizz&kz?>@@pC6o%7%epkloH(Iv!^t8dUoGLl)a_h`GXaN
z==Q-O_J2Ii;ok~z!xkW5jow{}Fm&Tklgz=&RGHx^zfv|ry`%^4O@Oios&;flvsYKT
zAvcEEa_4m>vMFC=EqUHuv!H&_TB@4zV%^jH30_U^Wb-91)3yU8*KEFxXR(`y-&bE7
znQ$Bov1=!+kIzT5H<;VhWKj<>RH!twztq_2f7h{sB=GUsbf+L#8#nr4f~;VON;e$%
zlVxW?4=<8N2t_!(182e(vsw>aEH-UefEM#rdgq^?>It;=B-XJ}e94T{w`FB*qag7e
z3eF$8%pX70qpiKJ<5l%tJE>DEP1?<x^QP69L6(#HilLA8tg9KMQ$S65;&v!0L8q&=
z8sqS%I>FWXak%T#+M}9Aw*ijL>z6BS40%i2n>(w&<&U#clwpiEjBgH2jc-BU(`%;y
zK*-1T5F3EP4ll%*S+YnPCkT1#SziI{v@xLghHaG@)Hm!l4i7y#xRGVs#jXF{QEq^h
zn+ig%aFN=nFkb(np+12dRH3IX?$JD|UZ-=h$24Q~N~fAbY=$JXIM8%r=owM~0yRn+
zNLc2}#&jvCJ?5Ewzg0N6t4+R|s#^biRb=%=<}?L70l7im_HOzvYe~iU0xT=GP4ac~
z&EL-gco<;Bm970b^m3WP#?=){YoF>-6a{Ue*!3fdALPx>EnCF9H7cyQ(q)-SI538D
zFP`k+5Hi@EwZ(r^K_dAs79j2CKYOn<r2!$*dS`2J6CH2vuPU<rO(v(;weMlXIdsMl
z;Xh~x(buuNYp>QZr`_<PQvZsM#U8I~wNVDUjU+THC<vthjo#qzBu-emW?Bd3;nSJ5
zezeqjbf3_>mOsHyY3wlD2L2d(?rWBq$t^RtWU*aT^u}?ajpd8OdL=@2M}n}(=rDsN
z4;V5zaD<tn3}0on48>krtMcq5FWc(O8I>p$e}!*aG2{n#e0B*kwE2jpQ@cbRUX9zV
zTCyeR1}pij(##(Zu;gbJ_3+@?h>BLqO$d*YYf6o>E)XJr5FyMzjj^WD_#D@Ui3YQu
zvN}3G#~41*hp!sMrhjQ8YG7yO+PCP)2%gDIrr^c?XrnW6E$=AZpZ(ia0L@EeZKw$r
zm?1d$Wp-novRd^BevL|<XD4AqzS>twe6?F~8y8_P=DXe3(d{l5FR53Li{k890_&`r
z7JB)?s%rcedlt=XS?-LA)bWQ<c1i>GBe|5Xfo6+uhJy)gYh-F#JGxoxcG}xKjkk&a
z@)jiSi{w97l>-g|oyr*;x78Z%FXmuvs-&+p^RY+ya4~472~1D=b>^xCGK5+)BAt4R
zBdjk@eO`*n3c!Fv<LmaIq+jT9JTLZgK#!VnxsVK%s4A6$Cowsv6P0sP2c+RfexZ2q
zvXW^-j<<5(;|@GO%t!+D&>63ey;-){o2p=i!4$i+#LM?gj3*DqEW`zL>?Y<5c7uCJ
z*RIeUgz=7_*X70oQh_iYg#n06$?k)r=Y?O|Y`z(pzoYF7E@#OCb3ADeVw|k$e0*@<
z>E_$ja5)S;w3jY<m45KXady?oBKy-D>8mcE>o4DTycLQC(<O*f^gyZ$F_d`J#VgQd
zVi)w%ni|V^S)OX3J~ygy6kjkccMCJ}4JkS53+q+n+IwCzL&nJ+g|6eL?7HNez)UnA
zr-7Isq*>@N9OSWEK0abaEZ2$DibtQEUMBG`_C)vp{iR(0TY@7;kR8ks8y#^)$FAr(
z7agC7_m+5W`<fb{=K&q=@{-n^2ksl&=`qe?H1ov)mOLI>?kA{?TdBoyN-Bdgt^{<4
zF8C+&gxOs%B{?h9(Awt?o4Vb(^nwD1@>r5uRr8T8=%HE*RLasP={C&ENwWG27ARZ2
z=E+^*G9&*X1t>A8?EPd$pb{Rv8Ss=lsWNt0G`{=$V&lAj=U%qb7vI<kk+oUr|2(H$
zn(MIM_9omFEQf@+xVP8T4vBFeGR~9l(Ywq@pV6s;8xqscrRTx0^RAi`ac4EmYt4N=
zy2O{>k$&ftoyEV<e4#l<BIxQ(PDQ!ixlQHg$r34L&YFSIbI-McOoM!9E|cK+hcCEW
zB8)Z=T=uhEEyN2(t;SQ|sy<Gl7O7Ie-fpBw$QpJv=e}1jsJkC@`}SkfO=P^Q<*vdC
z=1kxRkrQ4_<XrZ>QbzY9%~w1Z!$LzL+g1jw4KIXWgfsE^F6>y$gYH0Xy__+0{1mJ`
z$toVj?o?&D8$E97M8Y)AjRd!1B<XgzD7X0axjefZmFDl@R4s15))+u0taS&hJ$7K7
zy4!qGG$k%2CMD+LCTMyZ{*HKF=C#b{hSwp)h_74Ms$9gT;U$k9-hR_`Ag7TkeJKmk
zQx9Ya4)-{}BpM!iB-%2NUY2j^90GmUvTA(yaC+j?^fdgGu7Cc~$o`GG<<mIz1%_(|
z<aW7%{XRI}|8iY|;uLW^6y@I2+PL?G*QqaycTsHIYWC74(!aQ5t1k8O#9r#fSqtPQ
zIy`7S=%b;egek|UhXji%w``TW+&`Y)Ix@683p!$L={$B3FR-s+Y(0!13$136X{z#V
zdw=VtpDiXoNbNGE#glsXhO0KD^Ag{%Q}8dTg6`daz#wl%>`>+)bs_dyzyap-K@LeK
z50BB^+srdu&iNS>R~tA*Z}mzkw@C-%-v&3iB;&tI0eOpEKESpXcc|UOZ+i8~6~b2D
zH=weNov@D?5Ks+?Ubufi26OY|Cc0~JyVhG|a31}$v`r4m`{{QUv1<xKN8r^>%S?$Z
zP00ETxR*M(Y47ARlFtpE5?&h4KSiY6L+H9341aXem1h;Jyxwpv`9)(uc@#48VC~pM
zW`2R$_Xd(Rk!O7AW70vR_9LDL%tC5T0z6$*`tnHWHp#a7_$jiz$H5@edFkb_1#z)Y
zsoROv^plaIFI=XMj&@ZB?@&K+;NXYouOxE(V^u$eW4OAz1|_RgoV?oDh(UaWS3Br>
zO`14uDkx4bDG)>F0-jfulUe32P<9(v<Ud{uu%>VEDHHd1q}#7MPRCysd@w%3S~}6}
z?O}Lu-^<Fn_HLzaf2*XNTOTvk<bvTYKQV<(6s!@(XeJiw&AG;KTd7GT0-lw#Czb9;
zK6IGk?5S={Bx<=PaCN82g$yaROq7D}O)E?7gdyla*8u0me(jWYZ}AB<F=AvXVm879
z=YIH&aU${diq2ESYThe{ARad_9=vVY6|yClbxyS=3MW3nF5}zaW(P&Zd5vY`<JLDX
z9WGBrTJI^oWvgNtC=DsgN&RFnC8hq2NC8CPpDyA}_L~jLDqM1)k~<*4P>LO#S(NJ0
zvmQ9Op}iZOAfLMq8)KdAB;+&LmMKfu=U$+flRz)-pu8)3g-Pcj(=<(}C(B+7X`p2X
zq5zDT;tMPlgS9x}(ZN}jRBqwc#;w@p75$xQ3xjS`I+;29ragxlW$WBR*O$M9%D(gq
zaH3)ocYDm*8Rn)i@~z9Iy{BgPo(nzq>y!MHMmKNGWro}=A2;O^nr+GkJ*dLjLoq@g
z-Fz<x@axXl%~}zK{iNQl@g4dF`h}F`iz$G?lI}@<^Yhl>z9)%uufp4_GJ)Nhn+{F@
zjtk^8FI4%CbZEbQVxIQ)UZIS_L+{3n@WittgUjYzB%6lqAy(?lFZiRNmH3cQM}=m^
z(A}q{Pm7d<+*HLa%QV|q?2hgUS&LmbYUOf=1!(nY8l3dgXbI|k=#;h$+JU{_xgQL9
z{J2lz;3a<*ORFvFG8qc*hJg<Djt}qv?d^%O{NIt`5(H=a4M)?AF5rVRv#VE(U6mfq
zW?h})n2k}rDW^^ANv}#f?jlR1S&Knou_AdNFmcK9D;GrR7rowt48$1uMI{Qy@8&)V
z&VTz22VR(!K$Z6J<0TPS(fY<nu@-_CSvWTuKhdol3RJo6;4POizhgla95r&aJ+e{C
zCiZPN{}6=mKQ1kEXE{4A{iGyUTj4areaW=EccW9Kzb?&(yy@P&-$&MUi0mNpkY(C_
z%+<q$vBh{7oHQrK*i!y}$smzPlx|<5e;7N0OP>_BdsW1$kV8{9?y8CtM%Y};4OWXx
zRG{#YH~IGB#>6YDAZr<nPzpW{i#^eP7)d0wQrKp^JfbSiHubt*3^j~p{BtlxUoACh
ztFO4TMS;DGfU(%aExG$=RnBL!D9VG=D=Tuk1V<4#QAc02b$gv1V2SJP1}(4}>Z>#t
ziYVJ~r&;=T`Wgrbe_V`QgmjbwSO(goi}*@v;Oq}?#Ys!Tv1_;3iJ=1OgZyu<i!|gY
zyrKsI_6rybL|$SU8;x)?g_yDA2G!xj!}9y9{>0V2X-7F_uKnp)NpBDP+wLx>T31dc
zjO5YXAQtz$U)_BA`EnG&nL_NhoHIwI201$mi#FW(6+)fND(j`Prcd(ZO#82a$l@v7
zp?zqoSwvQvZXI;g<aeD)QmVG?sZtv@6J3kfHPG;gZbvI2pX#<ZqZ;?KuY@F?L(`yg
zD&4{RezUHz9#Ds{XDy{~WmLaE!J54~KaD)3*d^PY?YN(#<b6s<NPxPD4y&O<AhO&%
zD`DfiX|j;Y5Ua5U2x~)2F^$-a%!7M{sc}zR99lKbyenmS5V8;t_3!x#mZaV;Oc;sb
zUg2IjfWOG3@O#%d)WUIHKl}Up8yqZL?whi9n?4a*70h+o#t|5K)m2G#8cc7tqJhR+
zNtDG?GziQ&ivXtbhFr>^TI>H&^_D?xc2T=965Ik5_u|DJ3M5Di6fMPzdvSLQ9*P%-
zVnvI)yHniV-QDfvIrDzsoOgD9W|BRV?0c_E*0rX3wARA!qzCU_NMOkU^~m~PSCgSE
zH1Pjx`I|7ndy2}0_zW6RY3(o4=Aqo1-X@Y5O6s>kV$79ju1#gQt=gT^wziH?d@ZK@
zqwOr!fn0qdBHl=`8&HT*X01KRsQM<l%xohcUL(f;{l)2|(U{74_w!ib4RuvM_=Yw1
zPHdoNxCh=D9hg}c74^j?7jqmk&{6;Y>pbHN_3{n9SCA=0(=|`8e*E$1#Z{V`I*~4h
zdr@GNRx*~$royLvhZ$B}=%>is9udKwsrMd97qr((lT=^;G*7){Nc2JNT4fmi2B&HZ
zgZ6(uI!1;b!stBiv$Vvg`@S@*P+dZ{qX#G_hwv&!V{MVmvQ52By&F7^A%TMmJ3f$c
z#6c~bhD}<8S{!f{wG}fZ>&R?w#%e|kgVl#?C;#&bf%E+hA9sRBZkoB`FKyO#RQdzS
zLM*x0J;wOBr8m#7ET~=t{wF`pL^}$N$9oMcjaGZlT3FHrkQJAKk9rZ!_Y`gtt5NX+
zD-2%)`_|Kk@x@WU05Iih8So{uG)=<k6CEsc#$V=RFE<|0wFlH9ST4L-{@d1n`#ZPw
zT#pRDw(TGW%CV5uZfq%>6tpS&ZUEY7wg@ECj69x>tJfM@3_NnhLNqN}xC=UQ#^$J@
z9%1%0;MB83`AaG)0F-_!`2kuoPa5~U!?-*4B<lA|@{Q%rWHA@7{zmD?H2&1^9K{(e
z6Q^=6lL`$A4GI@_kBAJWC!9!f*{y>dmAMbq+*6PYQT>yZ_rH-CnnaBy=OlsZPYu@}
zyX83<aA-1fnW>b@;|Df(QE=_L7LJPc#v-)NKfN)GyzX47U1#otJ#|e7p%*lL{ZBlg
z;S|F`#$Y#DnWU9ah1i(AvGvXs?Zo`>^XNc8mB|>Auf=3lywX{S#C@@S3j;AL!Y_yO
zFB<QxL3qKw+`rKA>7Ob!KzUaP-rD$C5$(TFbVr^s3})F&sTz+*^fLox&gNh7FK1-e
zUnuo!vJvZvvKF0h#LP79oL>GWsBb!dZkPCKotw&>_?<rGuGug6mEeWrlxnsnm6*!N
z8+y@smbhD&Of{N9WeAg1`?|XqkttWHcqKfP3QxAlC`p({WI0Trkw?#}Ci2`WLy<!~
z5C4=b%YS6j!LP!Cl?VFOAI=~4{~BBGR{xayW>?%jvPT<TdPa0gxbX|nAaY$76CH!|
zMGVZ|uvEE4%l!?Zx7Y>Z>3cOfT?cwrs{ueGqrwc_Ok8wsYTJ+wIhzPK7KK}4qSX=p
z+njh)|1aDv+S`kb!(RbmV@nBem3>m>Yd4jj8k|<C?1dO}y<=(W5JqSXg8-}AXzreP
zKz=@VPtVjr>g@-N3P1#3IIGBS27mMfS;>BOHok{U@EwjkDOhQ153@h_FD<pP6k1Eq
zRVKeF?r#y_4B=p#Pyk*P$4Oy6G&O=QhDPNhH0ozafl>xp-G?MU*B?_Gaze+OjedqJ
zMWt239(pp-8plL#_Oj!eMD|W@q1Qq_oii&)8DJj-oU^qr86!&T>ZYTqh?BW;I1_fp
z>w_mrz?;M<9d2<$2Z6jQPK`3WhJRnm+!2}+JKLjQjMvYoi3EKSW8l>-q=*1ruEn-m
zZ9Hzx9oC3nOMV45;Ni(E;tiw-lU4bF{VO;Tb{I`*M~oMtik{OWL>xM7V<(?hCVvn?
zJ-@h_8Gp6@Q`TJg`+u;+e~6;Pix!^G%OYYJIf#W=rw`Q)(;hCPM~0-{u+#K-!(YNQ
zK*9TxP4|zWSGaPKi35|`C2eCiqf)wmT)}APUmo*bci<ImXaCs~H`SWj+oU%(<`3F2
zV_)$rkJYXniT3a(?O!u{v80JVK(JUR$sEdRzy#Muh_>oJ*1Oh0+`5=RViY4vRM8lF
z&yE>-`l%U^ElDz)ZxCP_&j7R1nU|`y!a({ug>t$<+s^pYEp^V_o-Ho>wxp7bx5)lU
z4=<>tMTCYA!LSvGN){+hC@1}SDvC>ELE)7nBeW|`!0vqhhsdI4#2X;x?FHE-sAy)W
z*oA1h$%UxNnYinkkji{?Ka-Da*Po~grFf)fFx;@e&c|$PnPi7i;APp)-u!q-X?inA
zyVEV(YW*t=PWU<$`ervymFlC&q=iKNMRY%3=Nisz8@68E9ZbXj?)HNrdQgt2tYeWN
zZFrNu{2@}FU2s)L=fXF1h){z_!-UbrpLfBVIxiX}sLdPR%?@dh8<!|5N$ghVb$u(1
zv`bG)Vjxgs9!D9X3*j%7h91Ps?raktIeBF&HTnK@T7x^5rJmCgHtzV=(3TXAtvp+8
z{f92#rZlaY%;ZxHcw}i$Ns>5uLhqq)j=;#f)$fW$u1<cuOvOoNgXSa^<a&*HJP)ZE
z2s7}$x+ttK9Rq(+GD7U=r6tu-+1QrpVtB-=>IpH{)>*)UYyRA%&$#j$yGV0bzN~ai
zwkF{Vo7eu|!99GY^LoSE(ui2g751&Q4*TN1v6EX=4DbH<1aj-=f8~Q{GS2XnEhI{;
z>-0nFzFy`SRhn`6ZEz>o|IjMA_ynMVH~-S{1JuX=cD)hi0cs0hwoV^1qHGV3|GXHK
z2sa1c10<WfE8v#2o+h)#F55tR{LorMWcxo=(j#^3zNCf#$M0yk9w1AbUrKxEY`NWo
z6LWo>SAzl6bV~BM#SU-aH(w47Z3&+c9k2HB`i3rz`RQ@$hc<Mqz}MEkAI~L1Rh!c1
z8*4Yb;f`C2Y$n?2R=b&+B9B;yCfI*IiCNFV0hB*3l<0xy$brI0u!((lLXF$oDLxXn
zrkC+QE-lsS$WyY#r^Xh9gBxlhASG|2?mfQ}SyeC(`6WnY5*}Ozzc)DWY3?A#FzU1a
zcu`PUh(<IrjW%(kx#+AS61>Njc5H+cL^I|NrlSAJ$)VX_Y(MAc=3b~3;o=)u=|+6M
zB0|sr(1Y9GNW0E`6*;Df!K~d*4*8n9GV*Fl(=K6=4>#^W?*2!swDrRyc=mgu!1e7P
z&s+H`2t-)Ltas5GWP3j@etpi8NT`ZoDCKBqY_j+n{WB_{_zk(!UsQU%Q}oN7#e3Ay
z7>FXm$P#Y=4*Gkas=;x&XewzXX$BUfB1KE7$!GwO@#TwwCQ)>5DUb1cT;LNaBWNXk
z&`7FnowAGYe~|_<oM?0!_Q^Sbf1Lu@#!wg4Uh;Sx|NY(J`!A!B9gd7jnMjw6Dn--M
zq!q`1dG@kY>Oqd)4m5PYOgx#>E3UGt<9h`%)Z;AEpu9#|v(<pS;oS~5uFw?0&Fd@E
zIH~o$y`jmnwFZJ$FFLNsK4zX+CPh5^AnX_tBNA$U#Tk3eKj;Mix;lJYDH1blBd{qy
z{tIA~e_Z&^i@OUzd-p*VNIG5I?TC%uhE%Lk?j*tdUQYT;7A*g0yyA7w(G{OTA)%bY
z0|u&HEF8s344}2_1$TU^M$ldy_UnaoG2G!@;p0YayKsAeZ1FbzcAQCHG!=JO{+FZB
zn*?IREhBv6<LZL3$~l*-kmht=F#oA$0ITmV)u;ZbRP0df^sk4;dCwUy2<uae1S8ig
zag1YGCmOBzC(maB^AH+Bt<TK>m~fjUTwhuPW`7)cFUblU$L2ZpWk<N#=OW$DPY$yZ
z)iz4*t;Y=({qnh`{iZIkf33NWLupkfM%d1EzWu0Bs?9<fXZLc<zt-IAI{}#}s;1HI
z*p^|(l{pR2d#g;P&oA%LH2b@P6NPDh4XZn=ehqTx?@moWqQY-i_=P3Lw5xR%9M3-Y
zbQpVA0!kpnkomP38rXp6;%9tw&rR|EC!*Ut7UNHhA({d*X)7q-avl3=YtFi-`rk-o
zlB3ZBsdwqS@)k^*y(div03<x-!2@&3=i8?k^3WV?5~D#G{!*SFtw!JN=(u0r&#}Z#
zkE!o!Fc?flYuBl+hlttRzE}LfQDFYMgW$IobKT)kwWak+FH02o5vwR5v>By5L(S{$
zl(xcc&d{{w+;_uOWDZ;z8GV1+-n00Mt*b5Wy6pXje~N(}Zt=druT3F|25b9`n&Xg0
ztizh_H^`SgHj?8D*ip(xKz}+@rZ6>Ep$4O+cL`p&u_w4(a-40qeBpk&WGcuz$h+sM
z@l$?g<Ll428x^D0x6~QAlCk|k>E*Rw`!C@<Jx$Gw2Wm-EAKqqb#v<S<A8%?)kCFt+
zu6^OCEB`g9hD95k%A>vWI=mLzpC2LrJ%!fk>QAxw&+&A+lmo$hY{1sRFb!}xQ;JpE
zW{W(QAsRZUV%|ApC15SbWW<FwaK%NsN4w&-Y5%5hd^NFJR_9`S>7KaT(7MwWeSvef
zg3kO+rr^qYsSP6}lJXAplSX`L*aglQ8rl8K*xE^AwASX6kYz(M-7bJhInKCx#A(}Q
zLJW40ZAp3p5eb?YfB_)69<!Q6`8Z~c-@UQ)P7K6%-9PRNHI?suX1?Dm!~Nc3m6JpB
zayvuFk;04(oH89mR9055T2dy8A}5L}QZf41zp|317RuG*=u=)Fw}0iPGh3eO!jaVN
zwd~soOiMN^E)1WdTR%v_L&ZEgI5?=_-b~|i?Y`{|fz11{>(-~xyY4hCte>z=gcKun
z!d2?0wYPlh|1xkCWI{lISs8Wm5OgfpUq^Sbr=AyrfT~+(&ljL+H<ZAxSH(FMRu!5~
zw5O;mVNh}%usWKno}*E6dm)TyWT)5O`|ter3z82IGJ+*4qDahx|Gta1fv9?oBSaIS
zR2E|XCnLu%h*CCo5^-|p(x2EQwDs`}>2@OI^Yk-nM{z4eBl14E1Wi4k7(tMLN%dWH
zpKEYIy@Z1`p0EY4*O%yY2*1ETf;-&0M!@xP1^F>)FlLMLon9I}j5dMeqgFprn)|OX
zJJ$8o-)lJHErB-$B@(+HGjEKRK8eZCdy1MXQNFjmOcdj4c@waHUy1ouE)#_1p8{s%
zwRYYi-N}-@xnzx)hxTK;jbgiXciCKi5*?hTed&Ru>0gc~DAPE%C%m5X8#Xa$6aQ}{
z8<YfR4pm?^7<nIz!JVzs;w-cg9LTr6PA1LS!$3$vh6d|hwU+QdO!b|Bt1=%mn+Bx4
zyn-C?qR2&UoxG(#565#MT5Gj`8$IpJk^Wk~p;4u+)5Gq6XA0_LM`K1tY5c`fCp5U#
zM>sZHHFNR3)*AU>Dqq8^@~GmRv%&s=O3-Onq{Y+pm2!+#{QccHoRQlzQnys3!Zx3x
z?~GFr_Bv*z9W6c~u=!vt;p<-`4?+8LPM{Y{E4*=eg#60x54T?Qo$bp*KFiaJPUY7)
z?(+xpNw2~2@vp?-PW}p;5v5|u8Ce2N(c5EDIKPwCql%C8brHnpmF?)jG_F&~{Ed}{
z*vtoXc;)cfwT|6VVSMelIA<SXYS&!Y8y3PKnkbRsbZqt*32t{WaFqcxvjLD*C%Yt_
zg%9Jif(K;n6~W~9Ma(Jlqi|hCE>frnT^V4Uuq20S!%!~jM9o-IKT0?|i~g_#Ulvt5
zu>7M(a?|5wEo@lQFA&X5&}X1&X!c~$TG)+Vt08Q*Mqa$>XQC+vju48aTdf2)iGM?j
zf-?J_H)P9bMTeTgb~H<Nb7IGGjJL)T^};m&?C{U&x1|U*xjO~UI;uR1w;#T>yhAXW
z%1vCko#nXS)kSTKg40GRC;Om22lLv!r==c<a&)y>2tCdp+wsgBiXjAjc%g|ZB^LBJ
zW(^9WhH40mLO<8LgyzdDUOOFh5ok6W#c7H7H02&hp|aMl5eQ>58==K~VRZ&sv~~zf
z%9@~hBjcRPLX5PiH@p7g4Wx<^<toMz>WN~9j_=tKGYN%!49jkjH{jUqvlMi1qpyEv
zkI3m{BN3gSLETUNql!$KzK{s1PL<hb`WUo}qbK+m+-5n4icZZ^unM%l_y?ZbxX58_
zV7~yoJvUN&jh4hr_V9OZ+3D2dkCKDWY957(SKjL%i!(;C)OsJZX;l1xNA<u%C{X+z
z2<2R6GUCiQ;uSM+)j~@ifvfBW0<C}?ZHJ|7q1U-|-1!{JN(^LT$4>9KX$%iQ3K8|z
zIx%GB_>s>ZtwC&$pCjbBID#pGo?`p{cM3QI)?v1j45LBcGw$<lgO$5cBzJ!9*aHy|
zK1Fpwxwh7K!jsTGvgQ1dc@KvPB<sH+L!oHSj=+~~YgwKgK-PxgpX7S`zbQH-Os=yg
zv#TlvV-f~)t7bQO*G>u!`%JDm-kVGe)sMtG)lNfHG3+*^>irF`$HMl2N9?S)kxe(D
z)j~s2VtyGz#N5bN(|>c&JI@}sW(qAm$Fyi~y}sU4Xv7Ew;$oErC)M62?B<xg+_<o?
zb?a$78SoWqFz0diNR7KK+}qdw#2wP&4qrU`jD|t<wmE)TTDuf`B2s0S)&-P<#fO6F
z23>oST7D~!YWpflCH^QzT$Sw)m69t6`~0az6=%Y|eYM4xugv3L_a0Vi2RxwX;}VeU
zB*x#z5R71d#BaS@v6-)w0(Y`lWAgBsRw!J*?>GOB&&{L-b)5>gcHIeNmu+b&p1tzZ
zrF;tB2lW^k*etR}g!;4PTFu(*z(;s4gt%-kzeCJP0ljdv62NkcC*@>;9Am#`<0B60
z{<5xXc(_}VSSF>e;k8VUK(hRIlWS9Viqj41rP!@5aWz@hg<P49p~J1MpKH&*9V9Cq
zGl4tV`}mFC#FDI?H2VZ0tGl#PXJaexbyAgeC}Dg9qv4LEbwx_GSxsSRLw;Q@(FvNL
z{TmpyKYH-cV|)L#9>#p#=y2W%Xtui+%v?%G9RyR=f;UGd=K)ZgI~S_r1AIsCJBsNE
z@=qQZ;_>j3BiDrG1v%SxDKxI&f8#oKADg^0GFM$ypROMq>#Hx%z=il#kv@M&{OT(>
znvpQ&YPOU_%hTDYq<7aCDoD0RyWuO{3>TggF1@o~N74mQazB49X+3EsaVA?ZJV1hM
z_50;nnr2&$pkLk#R_qmS;I2oJXEt8#1kJAP!&j!IPlBXx?UuLgBxb3*LQZ`EAugRq
zyjnig!S!Uz?M@haK_YQG9PGb2{HJ{_Xsn`ifEORoB~IG|3X|(g#)(aS(v!1Z^vWK+
zGi?)cd|ncMWA-&-ZFd?W-d9gQWFQfxzCB3*LVZaF1I4Kn;bBujqfr{go*w9s`oUly
z%}YPhTg4&`O?N@W0~FoX-s@VuS3YntLZ&L~XXTB@+O+efO&9mP2qGWRn}g2{byUIL
z@q6`s`g6fupTP#ka)wZ~E_`*rai)Hu=q%-Yj>^O`--(j4+h^~u)Kt^2HKg&K(a%Cv
zrojS+8}?_fKJyJ8jMnp2EBPgde(D&he1CCLxJ>~#ZUPNnXYjw9?a>n7>X0d4?*{Tk
zremQriKk<^6FRuWEQ2Y_VJdG${r<_|FjL=ihn(8a|8=JwAy$GW%byyw_ffK`jwf))
zOAew8MuK=twfRCbRz6x3RoD-5aC)7-kJR@T7QAOri_rf)XIHKp<Bg~wF_e5bjwbHx
zkNSreZbb($eh^9dPOd|!b;BdZub|9lefxmtkx9|%%$}Nh)*_)MhKr)s7Z|NmV2;2o
zE)bZ#Fn7Y%L%1r1H$EoqyS7!wcGoTt_5(y(J3$D(A+O<0x_KB*<3o~7WU_TQJ=$8@
z0vRAutEW?m8v89(x2wUWeDpPH1X;tuE^`+z{liWdIGb-9R~bun!+zhX9AM3~_A?e?
zlatE0#v%;@<@z}YJ(Sr+%zbD(IH%DNO@Ns!MDy8oH|sM0O+*<3N?%ccb<=)3Ml$gG
z3lh|3V)XBco2r)<eWee<P*Pwi*_*+rFlxw)ekC{I5!jg%-Y5@?3y+%L>-P@W?w0qy
zsqylpTI%FcZ1^t9cJ1l6er5&$O2Kevz9=tr(Su4?vDFuHVH5sLOik#2Xfod*6TKA>
z5qO!zE!XsrClf|SH7<i$`Ri*#+uV}Q4^KZB`8TNK3zL%`%6j_iD;h85H(kX|KHXf)
z8zR_piSEZ|4r_5&=JdPSF3_^Q|4k<V!#vZ4UT#!k{kMT7iEsUhNHJaAD_@ZVXb5|a
zvey8TtpED_J->1Gd{oa!>|=Y-Hip(Fj>f*&*a>-t%)fX=b+o15L+lKFKX$$Om_l6)
zF)MAEBs63)`-zrCbf{sF+kM)zVZ*0Oeau=*R`T!W3h%@jSOlAKba?WfMCfo%&wAJA
z@>ss%ZapZ)&+!5#X9T`n5d{<u5WC|=$n!VweC(tDDLVb@()3ehP=resrE5>i7welw
z&O|^ivFKAV%v;YwJUcTNXu2QZI^8-ayX&sz%=v*H<tR@Tq&JQs0N2>qG-x`3>)=$t
z7O25d>CLjUGm=RLD$~SMXVb>1X$Do^L>J<?{!Mt5E4j45pC=cXmEoBCMJsunjEk7v
zbU4rHv6;ed3qX?WKYdvrN#pbZI^j=ES0VA(JH=)i3Rc2Lkbp^CPx2L<>(ZED#W~%c
zoKbrJA3edlUs*8Hm*G(%LYo|M^MP^VkYf~hv}^fhMz^H#sj~k!-xed2c2h3HW+i?>
z)=|9=pYO#9^k;tL0JafS!GJ_XSdnr?l91<$kk!8tHDV@hl0FQ{75&OgzEaooAgAMb
z0nB5co@ZYTz`opHt)<-_IkHP8qgXmVWf1j~eowX&o6~oe;rnpnCg^ckVn{i9JDfr*
z%==cw)zX2Fp7c_O-qjV6sqkAjIyco1c0WG)W;GI}(S+<p!JlaI$~nz5;ehT=z8J?x
z$F6m@YMX@2_bX*~ZP4}u?@!Q$>|6E*VzDN36|qiF7tfLbuMY=%S`|h+q&ckkd26vR
zO9UbFC(Q;-+&$>{?RYUR5JY05?(W=?4;M=ac{OZgK%n+t1aI|ruBy$gJ8s6b&H-#W
zxRw_bY#NqQghKB*BlBkww8dJR!K!Sx`M*Mi9ElO-`k-Psqk7v=jv2_j<|ISNx|srL
z_a+jLmKvpqH|hh1*6dn0@?EI-hxHu0CTj=VfV5(k8k;M=_~$~vbCVH0xsa>Ks7F{(
zAKv~{F`0J(LeC@3fbdU6XV(gc?FM`M8NAP~%%XXBSFrzovt$bjpI2rOW+eeGp5ZRX
zs&LrFukAg#1k#;(LEnpGB#~~gbhHyf7a@llOivi;h<~{Zwp!nfT*BrEo%8Cx{d^f^
zpq_PFpjJ(JF0!3x_(0|N4Iw1@G+QoPFjK@M3bV3~!si!!G<Ern7X3hiu&~KMGQ3{9
zFQS_r7{XJ)(N#%XfHhRVBkCHdG$c7;^cG0&{(Lq>#Ie4d;<wJUdw2e7d|&70RrsQ1
zn%Cw2x#W*-tXlj~|1X8+!s59i)Zp-UkmH4F&a8nzl<11`0K=jD)^q;LQZ=7?&lhr$
zRKdLbV+)nU4j6PQ$*)$WYV|vu2Ax}^%f_I<qokY<pnSyM&6Lwv-@d>&=b(&~|4}%<
zy%%Dw`o{7b2gIs}icUC;^4Gg%gOJj~?_$$b(Cv}R{rNscO=zOBM99f>q9%5mk`i}t
z(!<zS-&Yssl3)OlStTDL>~`AO=h7S##y-!vW;vhKTfuR_WPUhQJ)h)ftiReX(yYBN
z7e=GLTyV3srMp~;*dFiC+9^nxIHGSluU{EievetMdSVRYPG}WN>xCqb)$WaZ^ELM<
zlH?YzEvV({BE)W|q{kp8FS|2jX;W9;Ek3O@PKlT?AY;#IxmbIadv=kBv%f13=g-47
z0d13>ICqT`9TG&X*3R$(1Ic4#jF}iZjn1Qhp6NowW{N!UA$s0V3-L<Ev5^||pOJE;
z%`Cg?fP<+5M13l%#G@(mu??g{VXsJxe=mVuy~$;M-V`K87gT?YVoB7Epb4jN({|HN
zCK#fBlO#1vLQgD%DH0#)Hn)wdk|zR9Ba;npvb6ZJ61gqvI|vk4?XCTIt<}kX`lxCa
z(Y;O%y)tj@bsmk+DIVPM4gfRIl)h!T=(_i4yI=03Ew|rMeWI4kr|r|aB~Q7?4H;fP
zNI=Ng{CM@6jsnEPvlNWdJ>St`|Bhlhh^pKW_{d*&K`H7z47c(4TGyXWa1;Z3;T@f0
z9@!Heo#P!DOoKedlM#<%7F0upHA6!+LwkNoD<!dGRmqtL)Eqq9U#(#@;CoYLfZdL-
z6#Fx5VsCgU$l~xMk9oUad43g$zPziyW;lU{(Z3K!Vphhh9QO?k;S;V`mU=ku#M6cb
zhjvmd8ziG;+I)MG^-M>IP8Y=TL5_;qx(Mg>{TtipLF1l(y{&gFSi<PeF#r+M5||2g
z@r3_gt7wc?$lhP$o6XsC`NVhNWAym$aqVI2U!|w+w8ntSuy%HR5Db7&3mw9bChqTs
zKs0YIhbAF=a#SdxcV|n8ZI-u4W9bX+<$5Uij7n43B9z^oJ3|=8y07Hkv|K%X3OJ4-
znppdS8HXJ87(=w`U$AqxM&dgiT0r@5usGRX8h)*rdrrij!^z^I8CGwPPLZ}%-_Uc!
zW&z0$<*KZq)q5OW0{&~MZu7$1<+gqjHA?Z(jPNONhuCS+*yMg^i(sj%I2;XHZ5|E}
zVfRm`{0r$Z1gT>$-*$>p#xN+?Bs@J@v{5w>jiR4@0xH`rcSU#gOC6Djh0TI6nes~h
zT!?Cwj*)d&?~U<2erAuJ3tuAqm$W4;w2TQ9Mu)FF4EB#3+FKYp*>T+9kM3CU6ebCB
zqF4_uIeFY&IK+<h?4iS@4B29bA4$ZrQh>~JY~li!)?iinW<??l%BZt~(STND^H+~M
zP9MdrwL@o^LEMKkIV|4b@1E^U@J8X<tm+6LS+bV>Cx~5B3E|dHNKg_4R;I9P^l(VJ
zG9noDHpC#6Hp?8Oggo3gXn};5)mu3>Es|IU#VJvtr4YG_?eTXvvfpYLAF$M(9t9M>
z>ociWp?(0<>!MO#C{RUE82(K9fY~ee_4TI~jKEqas~_(c+OmVuS?chWM{o0JS9{Nv
zny=AdtdRFqveFqJ_|(hjLgqpH*#mNGQ7sRSl4tPn>u2TOBI=GYWqR${fsuZvkR3Vb
z;~KvZujMzg?{yZ|$RBq+^xMb*bLFc+V@GORdc%oum6D~2Q+ZxifHd{Gfruym52V<~
zqUdpq!{%8SIk)97X`;k-DxWokLObkau&Tw#%CA%6VSP#Ogc|3c3POQJYCn1GJ?=|=
z-jTu0SsLcjLg8S+_;K+gj7hi3(A=qZyTiRdkhY|4E8*Wyaz@S9ynPxgdIvXEz#4p_
zeJ6J08hIg@|7d1xcULAUZ+rM$2x42}<%%O3(>xq9I36lm4qqT&erCT^os-<AjU3|l
z9{~cxrK7T9;VM}!{?&P;e7*Rf&Vn&xscztsp9w3+y4rL@w{*_LbDD>;;<W|NIxmrm
zxj0T*M&dXaYhI-mc06Hh1)$NIKfFLm<Bz;@q0SaQmOU~)*A@RE+iyWvN>|&}a9bM>
zPq$Z`OR>QG+Ri0yPc)7l>X%8xv#tIy!>gtfd*ORZ&o;R?WlMP_Eo$OKRw5!d{(7F>
zIOl<#@F?RJ>bg1W6mWi*i80!{w0E5q(}ij*NgLtG!zDgRu=b58isnI^+PyypxCclB
zIY-&|j!E-|vGj!SmBSTQhit|#rBq61Y0b{7#F}_wPV!u{aOIv^#gv$GB^9<>D)5zE
zMUf!AW+Zm|P2`*Kn+F@E`wr!`O;7q@o#W2deuJ@5$$eLAA^Lys0@2mLQtCs~j#`Hp
zP5RHZHdMB*p3v3Ar6e9V{vUy491RZ+)AGyH_-Mfnty%@*F6WA-WmC4uEB*uxWi;bp
zJB>zJQ+wJ^LL!!WEKZYt!ga@i?Kqirn$f=-s}B!311Y|!-giH1hLWluo}<jdckboi
zCKRhK%2M1KQ=Bs~W4x?KAGfeAGE;4iZ82nFS=DJroSkmKBT9d0+FT2tJI^p~8?C0(
zzbv0?;78;(rXj@-yVS4TRzk&YihS+clFB@5Yme&a6z$)>hsj4>SPEL_IdP#{nV+g%
za=+2pY^HKqaPiu$0IST#=upN*;}?5(tOnTw$!;xYN?8lEua+1ZybnA}4sxIOiTW9r
z7Udqfke96iJ?dp&vHN_a$AEBvppykVL7j$c4yP%lCBl&`<52#pW*0Gm2Ha0$?mttw
zOv&S!)Z;x`#1r$CjTyQ+bNq&IrEtjL_=?nm40HOrR}pKXDpx*nP2%FK@Pg=MzG_;?
zh3EMaz_zbD@Oj|#B#{KR1a{&akAxERfo3=K<!b9cm&wWu!Q7OHkp5v$j<A5OZ7Pow
zx=A0Ff(a$a6EnT}CS+Z^hLAtSy#$8^cPKn6cGdyVrVQv|F-jW|?=N%r#MGW;{Oa}5
z?FR}4;u1Xk!GJx4ym2pv$_^U?iTdkti`L}R&aa&!%dU|wrbu=l?`E9Sg+B;AdXQUq
z2C<UAq8GZb^fmMhTe)RH18=&5heArK!-t+;(-AW#*H^r>9k0WEy~K2pxxpRC>-vk=
zk2CcY8rZ{P#q*kHI8)~PF71<Zb^uky<M>#Zig}jtoL<O<$17_U;t|>0a}?z~4Wef~
zjpT7m>{@lnW~#oCmHxLvC1>7t#wp?PhElKpBzktQt4HQtF}okcD>5xh+5#^yj^5=E
zkNUP^YKSpp-cS;mQ|#FMhE%wuB}D~hwa~R<P=OVzxg$n#I(9ljI4QATe-6VaqKh;a
zD;O+L^*b0!=k&#NKAMc3dFu=ejj3M`g#k|Qb1`BO8F<iR?%*cp!_g7_@);=e>3Sb|
zEt+KTG12#V(kyUbzn<_(pv?1A1jf<h9E;k=Srm}%wKcJT562|Eeq-adREQ?OL{D^#
z822x+)SADzK<)X8&orn%BUw24<Dv-Eb>X;rkZC1Ls)s!(Bw0_Obhj$D8KM~e{392J
zU(I!5FDy@XAKU>zADM&*5Sux4XT!7EHzyT1o)?@i;zM35e7{RUJZ{Bm9If_rRE~mu
zgh0Sz1+Vfbn79o1L#M7xyA@titYQ{nz^X5`;n^-+e<nW0o<og5qI_eP055rb%`685
zHY-uhn7J)sD`XEQxv(J^-jIlXl3IfBBPI(}qVe0j3h}-aQRd3#ReU>`+Fw!11cgS~
zph&p82Z2zbrq%~%D!i{&>b4=%1HNh)3s#ZC@nKhncZxfR?bVNyh1MG=Fa=PN0om#!
z?9?=qlNdE-UpKx~I~C~iAB-CS_<Gf%zq6G5fo-Nu*8z-Rwtv@ZpYg@>^5$rc^C7g+
ztQViUE&&<H!qt=dnb)Jit3h(;RskaRxiaOA5)`aYSQaohKx}0Kl3w{<H5@7>Zssdc
zhSI&LFF-PCSUnIziHRL<<yrNG;r?hd#B&9U8z{+2Dve;o45s~h+(%)vu^Nc~Za4y$
z_;$6s-EiynRz&tsZN2p)zW=aZiLXZa8UzAicPL^(>A{mM0YH1B^^W;a*e5RZIM}9p
z9am%;!V!#N7N_@QqU(ISrgWe54EMP!2&FuZx;;D&MH<#ZCFA)B?!1VEll-uM;E&6X
z20%i$q~+_w)xIfOZv?<au_@2t&QB0lQwdBRza16!7J9A-J?-VWJ4z@s>Hm%I<$WiX
zhW#qmksDr&!D}@G2VzQ|vwW_0N9gS16UN-43;DRsv5%uq1C3Af<IoM{Yq#B2<XJ*I
zqd}B*NqVus0(o5;EsStPEGD*p)pIR^i#8tAYd2&04K9TfnYp-r&}+(S-Mb-Q#!V^D
z^9uNwo_EwZmDq{$HiR()DrJ&xbUFgDraUzt*EvsAqHvF!CF-dw|4v~-F}kcBNp_}9
zd%ZRmhV}HmnNA^(ABTqk=Sy+8k7Pee=$=kKOwstQiVRz=c9~XO*UvcG8$J^Y_{}N}
zD~zcsXgfnf-$Z|PKOk{Uw0Yq7rSmUM&^SjkPz2Up>o?U2q2MaZi2XmS!vpW@yqp6M
zBcUWqQc%@FZWyUr9+tY-9Tni?Er{l*TRo5A9E<B)-;6y8{=Oj15|7=jDwEnDLByWX
z&v4cSaDahLDiZAYskvyxgO4-@CxQrb?(QUjp;0w|(?&muMU-oZrU|rGJ=0bfff^Ck
z+5;d1N2K-iz4YhFN@T9CP)pyI3?LI?&Dkvn*?s)*F#d&Z#vvl{rQzK>W*t<e@}a&q
zl;u`0Dt7%=bd~(kKKwV<%<Bub#4iQ-%B_hnP3QpuwwAlv7dRM_IUzTi_n>8Hz1x~N
z;j2gb_wjr+r-6WV8c(A0{RtKI)q6A*h@xQC>}XKx*eFv{;Kr|RZ`GmDv1%BpzbVk1
zfqkNMBf=5f;p);DMJnJac3h7NtyRT7c#!m}+x#2MoN}6-dF!vcar_`hxOB2}fVSp(
z1R(gA&^gj`aK7>#6Shwr_E#qoLXH=L)0JjB&5Y=Jf$QD}`4h~p5rUz_QiBUi^>PHh
zVvS%tDgs1(k&Tnrm(Yg4w|LKuzC6D{UY$mwQKvA$C-gn_>^I>-uvOylc#gI-)AwA|
z+}^V#ll|?ft38g6=@h38u=iP(lK#^a>DMxA=3S}~M$n6(MN#kL`RmbKfv_$0ozca<
zPyfpk&hX_-Qk?3FGIj%FJ1<uc9(5uayIkwZ@Of$4>|eObP|T;{*c}|oc_k$1OF+UN
z^x0hDWe^U?Qc7RC<G1w>2~n)X6-)MjMU4qZ5|$qICu=!|OVTq$x#8z02I=U`AZD;q
zXund1=5N|~P(lGw#DlHibdgqig7n>OT4$&I<+ep~Pyukc#bwCS^Iu>z#+vHtc)kLQ
zE2-L69~QN~o*%l|*;CS6Re<hQ=EFdV-{COHE;+~@4#CJF2afc8#QB%Fl)-k7IEL|p
zvHBQMZT|CXc{D%?eaMqu>r*$aHIYDzcNLgjg><pjVldzb7MEd_Da8bH1!B#85y|#&
zEX9|GZ#gCQC-x8MFz$gWf8=*y$<g(QtVL!M`6TXgOnZ4W$Ftz6@UF|rqs#rl9?5Z&
z-pUw+*xqUHAJTQy^Wc<uh1Z?lKG>c(sLi)`^XsGaeBa+Vzo2jQa$<+mZO5%gd2(-J
zYp;^)vnNaZk#Fcb|GLI$5VOVnTVQg~cT|k<j+=463g2!*VgW-uU-OxaU;XI)R6flE
zE1Si;<1b5!^0(J*cef|a=XV$QoQ9KQUt7PMCVw=2uM`EDFF}R!>33hD!m^m#s=50D
z93n^#bmX=I=92ctV8E&|)Jd#_1IB34(q$z<<jSmJ)=dLk)uQ2DE|_~R-2MxKXQO?6
zjMASNrBoPR*Diu`m$|&)2dpbMJp{L+?TMPrj9Me14&lpURx*gOawyqd4Zv92I=nW+
z&_tTs)z;7krkLad_bOY8(D(S;q6*DcK6(V6*S7sR6-oT%68aXJp9w-VRe1HNYRG7u
z48;n{cdqO7M7&55Y}!vpqPV#xIed_jC0q#bb4wpC-6Pa$5UYd_u8G+GKu_W+6;HU#
z6?Fp)1LeaB)t)r$I1OOln_J<!levKf^_K;rCEZdf53iySoCBO}<7RPI1xqm1z0Hkt
z^W@cla2*B2B916!Mp*Z|2~_uiC%W&r+3i&FmRyU^*HSv%Y-OYODoOs;Cr0Q#{gL~g
z-5E>OKTYj&?vA6l+lx{!PfDmz=LMeu9f6grqY&--Zz7I=u_Nuk&xjtN6++LS=MQr|
z*PcRE$@l*m5Y+?^Qr3^^hj*#MyS9#O)I1g1FWre1A(}iepMf4(%~(kW@&nFOwg5w3
z9=L-A8@jWTax8+1Z5v7LVrvqjsVjnBfQ7vBSc~%UgO<&H=k-mRz_IxBh}xpZaQ8v)
z?KK)kqe`OP#3oe-5o&}68A9ho>}Ey=vwcAe;klxrik}W#Hity5<KE3Si9`KrpR~{y
zy!d5;Bk>alX|TpX@>*zK9qdb^zqU}fo*?Wvx_3_qYl7nj6Z3ed%WLC>JE1gnDrw=4
zg6-phX7q3KL*|j2Dai{_N^f&zYz+&a4$tP{D-(zIAoJ3w(8$h}oQWRf@E0~*s$ZqD
z#b+9)yC*xgt?8KE&EDwarA?Pj!SlK+;BjB)2tnqP&4S%x_;Syf;*SyGKdnW1SRW{G
z9Q|*v&I2BUhf)v*?CVz(CD=j)eteg6y6iYH0K6NO6r&kqOuQD+j2fFtv37HF+vmy(
z{LElk#<=4xPh_sB2Z?k?@V8cd*d5H2>n?jaoU!VD-l-`HuVvx?)5Z}^mNZ%H&8DxI
zS@U%<DEmX^cKO_z>kRzD9g8|!sLOysqk$S~F=Ckw-%HdDGlW`Al-l)%gRJJl9Ynl_
z2$sU0gf}vG5GyJ2@qB1=C$Sum8Ld`dGQ5|t+jOhO?2iWNBlO5()+Qq+u35=2Hp5jq
z0fBO4rpOT;(Ngjn%KTiM4#TW4rIAZsuf?(GHm`@MK0buZa&6i{uyXq9Xa8PoL)yYO
zArUBCWgU0V2Mbnxq&hpSlkYx*?~jGu-=*mI#?azFS&djGBzs|0wLEhg7Lo5l!<o7O
zTV@2exA^{B&M0Cyv*5ZRX@bnWeyYglPYtX%G*n+;X6X5Bzn*8@E9n++y|drkazT)<
zLfzv{<PpX!zeZAh2$hwxT-)3$7uTsgD1wGR>P`bj@dt1#%6N=s@<hTL?TzYV!a4{F
z&e#Dzv8=}y3vc&sM0~8NFj%zeel7?KnxbQTs$hkeV*+Qe(;Np5d`tPqLQs6R;6#+A
zn*|7}RxQs#as6i<y;D3Lva8P@l7ZT!l4dXB|3_zMQA})Jkzz@5NnL;I3+Lk0*Xaw|
z_wTdh?m+gB!yb|z<SGe`1eu~CQN%f6bG2In!1-*pq08%qt9z^;)U3L^WS8%O0|Q?@
z(kokd2>&@bgST()`lt8<@JceV_GpPBBCmL0$-E%;hn8G3;t?K74t7`Tt0m>Ft@Ab;
z*sPUPAHJ>c`ijl`Y`jj9kPeEEcbw!JBdNRr{x4oybhjSijNDO=wj$Q6b=|B!ihvTk
zdr5@96FRR&YH-89U-3;Ovx?|>d}eh33$JFHZ}Yq5P3c?xQ32oiinKn2Jm3!<8%)C=
zI;SHnZI}h$IyRm9Aa`X;N@E>K9=zVQ2b>?_dH!Wi@eK^=JQYP@?Ta1~{5HoC-40&<
zL~&mB(8K2g!&}l@_2g5+EVGVedtlMKASt=CMEy{Z`d|hR!6jex)rz)2dEkcx7KxKF
zvM%^#IPs+(0xjXTXPQ7XpfK=uBP3@G2FYf*c1C`KkQR%Hjapy04TX)${l;s<KZqUk
z(?we5S%7glj^~@;Kg4tNht{VkMATI84Tt&%N^{mhU-19GECBlgJ>QxG^M6YC^8#Yk
zJ^L58HtztguY~GlI>vD#AlC1IS5Va$6AMqfA+2=x_TUtkJ_J`1We}qIfk*lj$KdR=
zl(f#;1sQPs+~SKb=omES^EsnC1UrZ(@UeRTx{Y7W@}r_2TEV5G$rv`u?J0y+-FXG(
z!OW5_e?4D1D;}Oax}tT<5NTYWe26PqhPi$Qev5Kg>(rwcX_Wtaz6M9|)r;ZIzPgrb
zca@}ox8n0CCsPLo>d)1}T`NqN_*r}1U-OibC|?&F(a?Rrilu4pyl=cc5P(C4TC4hj
zR-JZ6k)GV_LgiB;#1rYJwip$;*SW@4iL{~*RQYlqkrp}oKDwS_v#9_2U3)_2?<1r+
zle9XY^vibowxIS_kmnTz3B4<!IH~mCRLV}lWo+BUeZwCGW9jle50rzKM(rRuy!FfR
zr7t?50GdR%tcth<KnYh*5t${1_Hltrv3O!hr5|gwUC8{EIfrES`-gKum4nY@wMXOr
zTbz_&vEq^I#x-%ux8GHBpP$duaiZPmI|u|4iH*>HaJt<7V8MxTF5&TA7Jv_M_gx10
z9%Fh7EI-p;y#3q`MN<I|TXq697YImfRHz$fepU7Wh0VPE?gt<g$(jhLJw(B-qdE(*
zx_o(Bvw=^Mff##bKb|RI10*OGsy*+{vIg}}pdGzB0Pcpzdl`-`rijCp*CP<>FUj-2
zgAtT-II?)_+UBd&9Z!7h@;<mF=5)e~ovT%Y^=8AZQka!ZC48gj=Q2OOx6@uZndw`i
z6JTp0B&b0&FX<|ZQ(qFKYx;oN<a^Leivq4_yJ!k>=Q-wx`LJ}FI>YM4^9|`>Q{@T7
zu~psB_48MJsDAE_2<L4t;To@hJo7t>W<r0Bx8Lm_3Ub1uL}N)f;<_T-E}l*M0%UOH
zOrT-6_$J>=R9ndp4NM;S2LeCWJcLpPkFR$_oOk|R(kE&z5gR?wCOi0x4w?E>n(}nk
z7~>coDu1-p<tBe;)$?fCLu~~}O>pF9UmF?<KhfODRF(ijo{>8TEw{p05iIP93a?So
zA}TrP0RA?lTL?%Pgb+unq)sni!e#g;Vs_nUl&Aq|1FIpW@Q0U&&@PBOMhYS_<~PVo
zk6>YGD1U3y4{RuX$b51#)3QteOqq9^cuAmK&W)viDVk~>o71)I6Vo6dPBhtob$1g1
zdL6F_Qw(!rX%Zty&x=sH52r4!r3^GFXMO!yem8XLp4rx;J>xm<46>Wo*i7jOI&9Y*
z`_6^uvmHrhcRlbeEO&YJkFt4fytckU;HqCA9K{i*9XvT-Elq@5BT5Q9bIeKALf@P&
zNPi1CP}-ub1wJEPiFKQ~oCjvPR>MUrZM_^1hTC7xYq>vc62w2>OBViF68!Y&uyUsD
zj<=wQ=>mmWC>tl-#aT~?Mqk745?I#b7RfB<ihsT&X;UD*isiq_HSw{19v_k)1E%pP
z@l&_T=35MT9)rZ^rj@K>@^tJ1%8(FSBdk};a8DcVk^<irec__kTPJ=o>y`ng|LUt@
zgBtFLkJZves8KXqI1i*eg}NhrFe?eG`H*V*actpj+Re&dLZddM3(j`v(%$aXR*A2A
zHBL6bA{leBQijl8odwY}#{w@Xrv$?PyU;k`Q(E73rgkOEK?3c_yJS*2xOY36<4{2u
zpUz1H(l3lbD81k22k{Hm0gLHCCb@{J$NTs)=f8NI(L6oxHTk)SMXBpV5sXSn_^4ec
z<4MNrld70w3Yr60o%L%E;k<y*jnD|QI%0%<wUX~BN@d}k;brV`6pc{^g0%-QVz2E}
zM_6-n8YZu5zluKC>y_Mc+P3hv>Y&N<hIAl69gC3tJ5;__yfXjd?k*I2%~`Bsh0?_D
ziDmYF6dLn;mv&HE^zP&Pie~`A5QXWq$CxDWnH<n5JVee7*VCt-_;Cc$ME0e{SEZWn
z#q&;#u${r|Rf-bdFBSGcE1dxBe1$h+hO9o3!B_EyjaM4Yd{4fg;%yb^;rC;P7hZAN
z;Wm*|ZCgt<&An`J6-90P#7Qi`eE!sJX!2)=F$}L^EtQ>2zzi^5rWQya4UGtLB(S<H
zF{)kDpy(hm(r;H?eX%bgAo}jzP;dJRBLRJ33Q6Dqa7aJYkp8za$e#&Ko*CYVOsJ$q
zi^mx<KaC3Q)zGV~W!zt+XQRFyQrCHAeK~7q3r4=F-R1#!=05#d<+WNR<+oY=;HC0_
z@AnMf<Z?pyq}5EFIH^@lV9=QN$Rl<<;WJzHt2-o;7z<28oj43NL_d#RzK#rQFQ%`L
zr9nPe_IT?Ln7$#2^00ubY(s^r4W`)>&v9f5Aa;`uM#1$S@a#hDb;^5Y^*!v3u~B+{
zv19ewnR@_rEJs*%THa-B4jR5Z-P9094$|sMeKs#zisLcI7W6ulDY@K48cu13^REoV
zT)JwPK-$>fXpOMQ?62>=RY)UQm694%_IP1Xs4$MW>E_~>CN&mmRo4GTBl4SQAJr{=
z?67;!<*1w2#JMemdT#zv7#v{eb$yJX&2JZEqb<-!3a)$J#LM`n(dB>^q6xwaDoupp
zxMKnm_=LmNK~Ozv{d<NMf#eR<Uzzrdz8=8w;$*aU7IJ<Q6Kl`+c9iYzf4fNQ*iAnX
z>pO&KW@Pj`#{XZXKM-q&!utwa#ODz~wy+};KxZ?X6(^#nk}nT$6|)g<3t5gJ<H1M9
zJ}MdvhpX(_m6g(6^9b)3uRGRq|F-aYmq{kJuKWn6cu`EVWODXO!MAfh(ApdsQmkR;
z$Qa&k@Bq+hNj)p188>gIT-)HHnCwP^kClEK?~nN#4`W|3r>5(FRN@#s=XN@3J#WJN
z0fyJ-%*TZe4CwC$m`tKr)gC1&gBJjVl+)%Vtl&$XR$pxPjGFZYnEt<RTkXRd`CV_@
za8Lnf%+ETb0G_iN^L+1MYL7GP4whfIq;R0JfxArGeufx~D=1>N%`2FX(EHWh60EP;
zX8GZ$d#=2D{Z9Wahz&J^rq5XK70%?oC}P;$^XjSmXd@}l@89Y>uuT*1K#}n0+bMk!
zk7rE6VQu(+>`Za>&4?HwE3-yLjM8gU{o|p~d4{IU`N<?z_HuA}pnclWk`Ah>U5*j&
zPStw~=c5p39l!%_$A@|}gI*G&nakWrL`#9Z%9+x+r1->$(u2JD-3t~PNozF%r|az2
ze#5tn9FeBp=Ys}pgxtd+s#_n9X}N6}39I;ESZ3y{B6I3J01WSkI^~!Rsq9JjNBB)?
zA@qOM@r+3WZxOlQi`{SsJzqpS+pQU<o5B&B7bIMDhZ`ElH*xWUmxtE_!fuYrRZ(Nc
zPBJN|sLNApl}4jK1obtgH5hRD#fM%iA@ty3==OQ9vbMT}XcG3G7wBM9-PeB66DrwR
zBqPnApQLgL#y77?;~OYf<vQs{9x~7rvZ@Y81N%lxk0r#uP=S3h6;f;CSDY*DH^@aE
z7xizKYP~pMQ+gF$r@Bv)&!oiqA|@r{$RR}KdaeHAk|CW!-q|wwy>t5Shon(lZBF*;
z30MqITRzYJ88EaIv*txGGKNwlY8qW6^`-DK4ENXHyhhoG(5;+L3Qi{iV!YqwAh-M~
zr@T)66F*u1n=g^rbfqeP67nN*@<SezMi1W8i1(sTakAS%beT_Er!nwldpMCz6RRG0
zy$^kMB3tHBqyXb+zb>05`k|Yg9FN!L<+I1y(HcG%l9)XXQn{GJ5^Zw-O}Xm^!!5GB
z>CEltlq~Rw!|fIe;Kt%s*w3Q7Kd-4McrV^7_x1!ST0s51F7KR%4~ys4-X+a#e3%ty
zYq!=!u}oV%|0vS=v2d$+VV)UlW`nT=QJ|$A<K4A@IrKBhxxJ6~$H5LLjXKrZFYmeX
z1>`*k-QsAf`BuKR7S%o>f9Ts+f2fByLJ#T6m3u=|TVVfn%$c!sCWWxhLq|?@CgNG_
ziQ3(O`Ivr3L>PvLE6jb|mId0_-MhG2-x<<awjk8kryK$0Bgxwh=#1|i7MzL;6$|Rh
zKOLYj-6(S<x?Wr+R2U3$9H)Y~Ddubab=%P}0#jYm1|Oz&F`6>li^I^fn`?@BDPh;?
zb?w$Q*36hrhI7Ai1S-)ba7%m`g&qFCfCAtnWDMEiZTnHoOb&q1QzQ+2&vNjyVEoDH
zt~pfT;SZ&1k*2??%z8}i5&z}zgzw$+)+8u5(!hmUtmOO0$3;yi7Vaq3T4}$(W1SZp
z7`yVlIhNo6SW~GO1RW?x?;>^10&fs0PffYuySYt*`He0sN`G_fAMx(<WATtcc>xCb
zVu3LfYrp8HnO?gwirXM&rO10xzf)m*)P>H`^}E1#_9s%n<0UsJ#g%sBCL`<jf$*dX
zr#VVN_ia?2mU|9w^*xmzQ<p3QF(8UDWOx_93S&1@oH*}kQ`?m`{1D7Nh~{5kU13~F
zYhn77gF{NngEq2gL6G}C>aC#zAir+H8{=@+7>*oN)MCdsBsK@;vjh^?HIdtNN+9&E
z#;iPI_`S6N$HhI|%qZ7%+7?B~@lRVG_LCnimSCB1d*vCDurAtQp(`RS_@2}PjlHr=
zzr&WW2anNbdScy__Qjg*Dh@xN$L^>4p^g(;X(h2aN*`zC;Vb=zqxbh&keZ3KjxAFc
zvC&I+-rHdd{2gzoz0toKq4WMsGUE9b$DK<tgRf)p8LZe`9f{@NLMe1d@o}kLw>}0x
zL!Q=J@8I}t7cqt37W;`w+ih2ge-bLA^88W8Q7uxJ{wzT|1Fn0Jdx)ms!2}iSh7<KF
zF6rD3$<DW!k~Pqv;U0v~vZYz=o@J8pckiG1#ZL`qiYELY04PD%zHK@n52{Pq3N?|P
z(D?pwV9!?Y@s_>=96ov+y7lNQ=c8Ph%ilg7-~#^s{#JB=dHzb-bmh2kt^*iryQvU;
z?y<Q;qaLx8uU`IV${}H_?OQf5Ky0ng8o>So2c2Gtp@Rp&aAYbaKy2;L8#t`I*)x7d
zhS)YNKLS{$O0B%hv{p#)^?zkR?4~VSq3M^(J6<n*pZ)aFJ^4G})2C0NMy<N=&%c*Z
z*QA7cbw7hi6UMXjd-m>w&+2`lDXP||)nUUr1t3qjhrvTf!lETh7^dL!&+EX_g>#W)
zD-}ye0M+zaazZo`P{n3?_UOho$aHAmPOkrJJjwFsX)`oQSFc&e>Pwy@h7Cdx>i|tS
zIc^3A!-kDpVB7W`P^m(B7&xG>hRwFY7foTu&fS`H>bz*p;^muO6Hct!%a<;a{fO<f
zUV|nO^5O+#$dCa7+P8thI2MTfhk(E{XDjc<<wOP-{{DH8$l;V($m7RP7|ZO=UAv%3
zqejrq#1^cNNPVz%`*v8id<FRD$pb%(8L0uL_8Tx1X3UzcPX<>morPSg4F)e?zJ$?Z
z#>2Yx>*0TeKEMrK9iTzIx|(#2o3(%~TeoTa$Z_M!MZ`m7mHnyTe;79bR<2%)?6diy
zQNsrC4UT2n*q}Dvei<POH#@0~BgR;4eW@<*U9LYv7V5ePhUI4J)QNEQ%4O~}vkQDs
z5PJ6PFZ;(9UykVD3vXZPJA;o~Mmgu$^t%YxuJ)3%Jdh!_l4)g27B!U{;TG~py5k{D
zT3;Cu%SW^=HZjJgz=xvZ$i8U{E37(Ci6Qom$;<KcXT1&(`|#l-m^F1dj2^3fU>rSc
zDxCP6UOKrzv#;wyoAyoQY7*OM<Ig+7#vRH6hXN&rSam)zkTFvRSoDkX5Xm#ScI_7Q
z?m7~k+VN4cOfdwnN}yUEm+X@Wx)?QdvK(JxBPF-iynOi@+PCP#7MPL>R`MS+zMmQE
ztHcmH+?0tV?;j=%fMOpN(qw%9-b3ivZV>t@`SJW$t)Hy{yK?#PaLPy@hy12bAwcYY
zx-^;C`@3Gln$W46vPkDCsU6)rj=+a+%7YszKi||o$d(q0p62;CY*LFYwAQWOZWvDO
z{bTEVGxpvihfc!S(X`lB<dH6&A1t*1h`o9>82WS@rHRk$V_RQhQdRvW2488X8ikP2
z_9gk4w^v<X5iZH6bzn0Y@JdpXm||DU@>7Q^VH7j*%C};*G8#ZE)z%hs070|+cJUXv
zO8bU>-&1}NrU%W*KhUl^C7klklP`w`)FrXyZB`X4#c$TSJ`^mJPxjxv;~*T~cLLqo
z{J6W?rxl<=)iQGYS(BHr9gY<4=H?EAzw0iC5rAgWcl-g)I6pbEh4Nw#CpZln{2`zX
z`$Ohg7yPr0Ayz3te|5cQF})Y$n|jX7k9#-@3`_Z?N#h4=*Q@|{6;t`_x%1)o-=&ur
z1a_S>dm1kqBJe&~zg}Y*wDc+NiXVzQo;h$@j;Okz9rIteXa@wgZHq^?e1jhnVl#0A
z#J)x_A09i2FDD4<#h|bZ97{b%<ARK{#)p)9Qpo@O*l1o^X6wPQJdhY($+-G>$e>rw
z`buC}cVv`R8v@Z%IA@h*X)zwL&Qc!wFoh*nxu3>Wetm~`)-bcqM1AoLH!H<8Kc!tU
z(4u`~$crZfa6_A^X8pw1f#&1M$JYmX4GQGZnZ5S+%_f#>CBDQos;n{JM!kh4bAE>h
z_moWn>iT~>;2W7$lQMnrG87ih_!VA-su`W7{8Oaxfc_)8%JY)gNyiSOd90LAdFb`G
zREL#Vhes5QMjPL_4!>a?q_LuoZ(N6|n5VYC^B2sEfY^qtH2V4X(sg7~-Dq-a%cuN3
z@VLx@qrR2n(;9p>_P1n|_(t+wK7Tdbz5P&5tFG_=J}dxDzN#yS-MMuimdvFOIokT>
zK_=i<-zfd2z2_<AQ$~Zwbk_i4$1y;xHa~U#JqHJZuaCD}hnbTX<2VkH-Mqd83LY?0
zVN+6Mpe>)rS29qClZHe$c`-wPSgmg0A@<tzacJxM74iqCrY!^D{sT$w88f7ZKUXec
zSq9&_1A*Q8!q9=eq2xzJvF$#rPGJa?J&Ygqz8g209g$^k`OzWtB9;EIade+%8PKn~
z{p2a!>hUM!A;yCk50>?_m>*((i1{Jr2U||CpLd@RoFUf53=qrLE4(!4x|@7aABGK9
zKE6_^-;bN90>wJFd}&^hJh_p|<KUZAF=;R$Zt{NZLeGL!f*Q~i|LrMV>LVba6`2wr
zSHWLxdpifVV<0R7&5|MD>>LEsNvxIH`l<nUMu1sM@?;saA8me)h;JVt)&-6o+^GS?
z67Vb#kF`B@n%;kD>z6upYFPQ(Vg!AxhULHT=Q2fpbn4KK&1>0dEz~?>cdcCgbJkMn
zN6IfYK%EgF_LtvQ!%sicyMLv;+BIvy_^~79{I}q7@k3RoVCd^_<PHev0RDOW<vg??
zSEc=WFl^AxAXu<~HcKk?G0NW=;mK(}a)7$r0jdiE$euWPip@XCTj`IFiWh}5XD?cm
zzj|&;VA#bNS4pqW&k=5OKx|)&_2cDDp7=dft5QjF;%}*PRaIbCEx?`L<JPIy1fD&U
zbSZC-55BM1vty$??-t_5*BP_uTY=PGJs_6e&n{Z}E5@0RakS%CU!S$>HsC#IlBs@D
zezDD8e`HYnW7Tp~8agR5654g>2ABRJ;E_^Z(IWqYMe}DM(T;K|R^3Kl!aW4)lKHS`
zVOX|E0jW)%Hp`@USTO!b^~vj>2i77REjPq6d>k3Rc{umC<PHc30An2><<HX_>wpD3
z*yi$-1ls&9)z2utq66q1Fy+Gy$=5db%P0v5`|1V07s5@;_~Jf6?Co3DBOtaC)T&b-
z_TwfXXV*gk#2!FEEWY=2P`hU{hS;{OBN!l-0Gc+))eI1eAV!|9`Ik*#>0)J!wQC;;
zzY_zrF5i|dTfnN-s~ORkx;>8{-o{f~eOR5s@dVd=1&hMtNBC}8mEO<S7w+7;j_-Bd
zS-c-7PKJ@AzqeT~#}4g<;>D$JXb<omW1f74H2JIRGh+B)GeGRL8MCC*303{jtmzjT
zFe`nJ`X->WCf^YVY94}sRx%6_>yu6szVf$a(6B*0IXru={P6VIGflfvd8dK~2rB-4
z^&c94wS3g|Cx6m!|6DlD^5s7S<gSBbiPld%{?y46&B$j6#QO0kl_BV6upF=WheeU3
zOTlCuI(&qIo_RiG4<6VLMvfTDi-X&@??CB~D?kY5r;gXHYZv%w;#fIeD6YXWWX`FP
z%fNoUVDzXFava)ZQS_rSa5LzpCSJ}Q*<sg?&B*edOODF`u^3-1pT`ewDPs&bb>u5h
z1W%}ZqN$gkpC8-_zNQ^xqsGYjsK<p2ZdQ#4b$ROc#>Kx!ul~3RrJ&rVsXrqq7MWu8
z`4+%9JuxmfS1`^rjH{0qA8zl|nOQX?hFIJ5yHs!6?*}42Ng!#;OT!RL!-F?N*r;QK
zJd*5qAcj~v5<D*BSj|X9Q`=TUfY_VJ&giUhqi2Zatgd<n)AMI9!{GkoSv}@18IL<y
zq?-V><HX<RVDzvl2#8&*X_f?t?X8hl&psXC(>fJ3@yOA$%SgC>{gz=n=Nd4|M&eGG
zFFp&9;|Fy58X6&(Q*Q`lx*b_pjpWyNP)De$VhW?Q1fuM!Vu*FaT{!EuE|5Q7^ZWzb
z_GgT<M)`KfHrCR$F`!L<cz}$LJicDOlrJ&F?!>y<Grs0yUu0GF1?59)6{?@QJYKFN
z>`Bu{;1S^dRFrH8(A*0F&FcIuF~k!4>{nlOWeZeweBSPFurI$b=u2zz>5qM>pJNgr
zc9>oAG^!7;*ZX3(Rx!Zx4*q`V6j_eya6Ln8VwInsA(po*Hk$ykdv_htjB6SPmKb8y
z?bkC5O5mVPvK%QNH#|CI(CF@{UkIQA>{yTqqi33xr_R?4nV$O&!3R*2S^XOxJC4VQ
z^YJ+Z!MZ#@in4Rt0XTNxgdEP}InGuXVkLMDF~qvz^U%8iVtba$3_Z#!_Zi;azwf?+
zuh(4XPT4jB!`^%NH*DPAUXEk$MVnSFphJhYaxyjObuqHT=2fx7s=>0^vSx)}e_gD(
zZ$#ozI*%Xy2Y!BOaM!PwoF}~qXog4eG;Pulx^(U+`&+tLv}hSDUH+@3V2wX#h<$SX
z73y0A!Xis-G~+%*xEI|h&=BxTJ-!?_E|S)Iw{y)H=vG~l3CYC>*h>DE41rqJ09hW7
z17*3}h&@)%I!l1q<2M{5KQ$94)nNiMMn{B&zq3AYMWFa#)Lm-8_o`nvz-0t&S{qMI
zTh@m{h4XW9z-<IqE=6#qdfe$5Oi6dHU9rhxzRh%bZr`*Q{ze9TOZDhGw3EE^o+>ha
z<aGQvAe~IW>tT!jR_Cv8*EX!f39JLpPjC0eI(VCQ|5F{tVI88d4(fQZF~q9Nr*tXs
z#p%FN%7zG9gU>?Xs6L*(^7TPB@!o@#qrIMoynyKw7QR!y>T$^#V)gY@yUXJykm{c*
z&knRHZmWrjSRJo;>7r2oi%&_U%>1?e036wG@BL3=h;>07DfNfr7-A><Faj!+lQy*6
z#3Q|0w(rWT3PlSSg1OW2#U7elckUsp6W%MlQpw@!3u2IM+M)wcU)W>R46%Ifa)wy7
z9M$7c_>1>gVmvtJek|lD<S6v1(5FHV#I6Tq_R^S0T!)dwBx62*h~eIO;ZrC72vsVT
z=fyL7FMeq6-DfZ>Ra!qeuY61SgG&ll7tRoCE|=Kn83!FhOoZG%^L(5uU*5ijbEh+w
zSULe`HiBK1de~q70#jbpsKCxW;Wz^LxKZ-u^07aE?fi{B{h|Ha<h48<Gv2mC7pv_%
zcIYn+Aa?wODH1pY8xfcK|2S?m)T&vHiGaW%C6PH-$w#XH->NbhL+r5cG~>H#rw-6D
zpdA+@3?DTXHg4XE`Ixs~UH{W(&S{QSSIV_6|G+>3#O0OCTd;5e+_-T=u6N$N#0(oC
zhX>uf0rTfCki(U7%<E@w|JkHp96TT6z5XUi@^ZTbwujQCOEO;$M3;q)7bVJ6(u@yc
zup?l~x^?Rr>nqQPj}OYPQ^#*u7Bt5R&@T0ZbNlDWfgLhKEMqC{-p5p~<?+|GOCSWQ
z2nxPx)dBv!e1+A$V);*C#?%S2C<Y832|IS}mfcFb0fr9l2TdCzxDU;ZpkQc>?|ON7
zPGX4tbETYa%-9KRlLZe~Y!`6DW7v-(YcwZlc=h@fR7A#Ewfth6zZ1ry4nSr~Zl+A1
z1xuH$!1|cWKcGV!=+-%qM}-ZWw!nzd(&=YZufKL|fOH77Cv)reJ!sIlIlHDGUhnTl
z4w9J>X(MmBO45579<JEt<@5O&V4wqnPzUgEe*+z`0CfNlSIdW2P$}1P|HnDKNe2)^
zta&-SJnJ@Rhz$*qHcIn)$G5#>8!^OI!f*EVVE_I@PA`7g5M+oQHW(RV58yZS1`aE4
z&MabxZOif_K&+P!0%C12w}LLq46B>)KG%c*u_n{}%f_&532nTP%%`>MB8%=}?zC#x
zsa+G+uUjq0Y0;`3to>uX>{egQnD!F{21q)S^iS~;W!1q}ua6$t2PIU1*xY#$5NpAV
z7(NJf)j&D4Ltq#9<=5Y3xB4RF=>zaY7F;q14<434qN)h$yy!cVr*}G4C=!DGzFY>x
zQh%gQn^^)3Yhu~&@b}LR|6V*JCtS039kgsM$ximf3%}I9@E?LjxgkQD!bM9WLoI?>
zb>`;ve;{ktEX+3ufvJUxl+eTox^_v!=vw&0l89vq(!}A8{d=}U*|HyVC)8`$7<TU5
zBfGEsa~5*vRzR+;+O&t&YyOnO)ffHx_CyBTQL<Mm1bIiP*n=H4#$xMBxdINl=-G!r
zvC268dCCM0Q!FvV_UbKxt*OW>SO3Km5~O$L4yuA(+4%TL->8WpHm>?!q_ciMOv>_6
zF~r(6u0&)ZfkZ6<Itsj4$^XTvj+J%5OItJ1GQ`@N%Jz8cw=dLyc0xj4LaSyyq5qIh
zP`RqI@FD<e<Ie)wk=?5|%wd~9cq#pQe2+U=?!cOj%8o$_lK`=Ocr<2DojnTjB8!yT
zJbC;S+O_DX_R?I_NATYL%@;Lozv=@|pGrG2$4(pw9~LjDNf#Ct0nHjHz%flAI{G0~
znK6iRxEwWS?yN9t{tvR7F6d>_pgz)rp(eoOs8*vq9*<B}6Et$jWH@!=g6wC^5W5r^
zV)w~$Y`Ivwc^(5nsN<f+BX5TdP#)IRVfJ39&yW@>RxSl4OBV<Kyg9%pwKwh>m3FJC
z^P+yB{!klBOs{kBIQY#Ql$QtUG<5B(zSNf^+~yKcv%m6Cy$({x(K5tJDM(Mo#XLtQ
zZD*OdGQ{rLc?b^eJ#JPlV}@95G(8KSmMu?;n<-0r=!nNrb94RbO<1wS_yLH=AzNMk
z-d%^`;GVzb;MM_6A-8`H*-aP!;gQ`tH}8cY1g<;Y(CaibxI<I=N9?d}43wKbp9JQ)
zeDSPZ#g@zA1HU%OYcWmBwKw4Cols49r#8e&pfxAY&4d$YW@$a`bgfzSD`d==K~A;v
zuRREM{T-Gpnk)M~!6RAd2o!GS&zpr0b@{jxU!-2e<30My?6Kp=eFvZ5kz3ph8#Wpa
z9Fkt9)TmJvkFOcbgW&4*8xRoCMRwbBp#Wl$ozw(~RTyIVEB+XJvP_n7yC4|0YxQVN
z+ftNL`dkxWhvV&)5SbO$2nfrw(t~CthFCVMc$7HX14eblHG=fvlrot<aS?>zk@N3r
zGH1;If#0^0vx$g|fC-~wpKDq1DEkgwmARs2v6iy4MR&>t<3+9d)!^fD#bvMUoA$wR
z1fyCqoqDy!IW4`+r#LevEdu@hCo$9^KW;p-%n)ndI${#A%n+-@x3_Ji;As;GH%5I%
zVfN%}&Ja7DXK!fhS#`s4$NR+5=Hsnhr{<6&S5`TXNn>V17y`iUGbY`LYkkQ$h9S0c
zg>o?NJBdwzo+Dbc>kPLM_{vSSDiz@S5reps*<pCpA~C{V!lT&oA_GF5S~cWnwln80
zLbu-9_?pB94uv5W1KB;BA~{Ca7!)VGgam{Hgam{Hgam{Hgaqu8fSSFOKCII!g;r#=
zk%zlkhAOu+!hf~`h>ef(X`RN~t8SkHh)u()5tkn>V*<n`lze&n%9JVr^XE)s%?Rk+
z15TbaJ;PaOzr1R-5Y7R%lp)VgEx*{(J2L#xK4U;EYpg;2)ohQn>8)zbx^eCwPcJVR
z*smuvYEYLIM?V#+;*smGUP*3K`9^>`7QqzWty2dC=d@#9G#&|5s}5I>pRJqLLY7P!
zS@11nO>5Bj>p0cl5D*s>1pfYXM7kCXD+A$F^0ZVxKA#*J?u_~9$oi@KC$8-;g>#hV
z>2aK!>iJm!-*-+&Fl=UgS9<@!fADS3eh6L;V%6vK`^@nJ%uUR&vk?&M$oa+FV>G`H
z>jAMn`pWv$l6>2={t9|`?<&<Ff4h9!7mgnLo85mFppGhyG9VKg`U)yl|4hzLUw*M-
zMeyiz>D%ZFWDO){W`6(D17dsi8w`8*9hAfM@=@zEdVf$#H~(Urzr>WwH`o$D^%E07
zmG_T&d{7;a9#B}SsqR&<?!0}SP!DuAftyJVH9u<v^d6jtQ-AE;wOKy7X~(WTFmUh)
zO}M^&>hgJiQr-c9f#9FVpDvjpw&)u-t|K9Z1wecP&3{&Z85AG)dopK;4Gp=E?RCY!
zXq+pqC_8#b9e?iaG9b1t9N2%@>E#bq0b*+-Al6asH3!6|wMm}ALH{BkRsy_9fY`5O
z`O`b~7tjA=a}_;N4}?OquUf+H-TTpHy}yWgw`x`C-Wd`S0-3VrvRI#TWy`|8Jv*of
z#5+8NtU2hrlJ)#~_>m)eK<o#Y)_DAk96khDT?bMzOqY2fh}Dw(uU$S5Ide+i7_VKs
z4n>NU)YRV`M43ht{uu&-|5O2jFJHL=pVw^!ckbS`SU+3Fe;)r_2#8g_H4=cC`i;v&
z-JX}vALE824{9##-m@3W|H81n`}gjGvL8zX22x+;!4#7G>BQsPH?L9_%pAk}L*;6<
z@!Gh53M1jcsS`&`u>p4dwHxZzZ^GiIN$m#@RUqB#_}#DYhjfoI?yvrRd&Bo*M#*`3
zBOsPevE%W#Z`r6BW0|w&F>D{jFIToSj<KCAFKLYV%l$P1#{~yUlTMbv&BpCh%h#6v
zvJ~GO6#FAw!!eTogAWi4D~(aAtOAC0Zhb8EC)MA_Px{v2>z0YhPy7f8s3m}a*owF&
zl9x6Z#+FFJ7IMHbkaWjInzX(Mh%Kxh>o#A%8zA<!)8w{(`y%<{DmCT>0%BV>>j61(
zW`)@c$7<R)VeBj*kYhk+1<dgB<!flsq#I+~TKVTpO?(9qtIYo;E2cntWIa-wa|qxZ
z$^e{7JoPxqjG(av%glFx3?DQB&Yb!evx<S)i^f8Z9Lh&<%KzbmM-b44Zl1>ZS_Z@p
z!!*)3tysAX3>>CB6jQ!&F|(#FgRPtQU{WdHRqN+~msd(nR>WqzV=FDDjq7XVzhOJ>
zqNglXX2tS9;kV@*(8u<Cc)iH>@Nk0`ZN5NIZ#D2nHcDGeC>{&^b>nUrRhi%E()q#C
z-=~-*uV1UZCZ4{Yvlsnfp)UtmOxMpMLo9)t<0gmqEnVdrW$|UrCvtxg*meJ3M<5s(
zs@45!4v1YPhv&|l6Tz6-<vi@YICttF1SW;Z`Kil&m;R_&?PGkQTtTi59r=8Czd6uV
zj$pdDcI75S<7NPTJ%%DUh+Y_xdHwn|O#WdWUTMdf{>W_w5Ua#1h)jvZZpaNia2V}U
z<l)>-<EMa*FP!}s{#>;UgQR@@()dC^_m-Mt(s??n>yiB@5iE8Vk6VsJZ)Lvn^!D47
z3+BWA6GtpQ3c0xBY0R#WK5r^kw7q~>O0=SBKKMAhH%qVnvBVIYElX*rUu&s4D!eO0
zEM-=pKz>*-Pr0{IA6>f<1O@WtmCK^zJI<Uv$K1YnEd0jxYgFUo4b*SgRCBy_=1iGj
z)ym~^`af`Y@KoHbPo_o<Cjeq^yoQ))WQQeCEJU%9f*xpNr{P1LW5$6pu9I4RU21{`
z5bKsL6}V-U#xC_qT#OnFYb`%L7?#TVaEKfJI!2z|2X<gPqInzWsQWv&9=vn@g^J`u
zhDt?uJ%0QQ=1igaXT9F;xV{*qVlk!p^uw^Jnsj+^(^RW(=tYraIJ>r`aaE<}Cs3(c
zIUXG(K<p`W)A%;8Px~${AbXC?a{L*S7UO;AxhB3X`dgiUm73*rb=Zq~_Kacql&*c3
zuXT0cpj@TC`3vSX0L0ST&bVD39v%jO*u`e??UgT;r{07i0b)sCY3pH6zUF{f`Vg+o
zPw#Htwh<Kgz#rpD=9fil;U=Ce!Q;8Pxg+EHx3ccNfB(_{*}Dz^sfjN9u6K^3caDx-
zDgFpb6%kO8W<jKPumIA#QY;{%^bS%LMCmBKS7}O@-a7}^+yCBVC!1umce{Iq<L(XI
zPNrt^W#%QBeE9}u;0IVT-Ep6K4W0)&72+om+=IzZy6y_(&kGA?PgXxDn>ckA%wPPQ
zuEOf5LN;P(KQ-?5oxAWs%Z?Bk8KuUREmI0+O#EIA*K63!p?d~dAmIUFY_Tt>;!fHu
z$|NfJN#oDyjE|W;<$l5ag8K#APqqVW2U61x=+sN`IYF81w2ZTK3^#804h%xFhSo_n
zKlOOiu{~m((f-_(Ib{Dtnp1bp{-}i5gy_eHuX;Q<r=}%+DN3<3mHSc`@zvHxq*z+&
zUAsROHy7)7w7iy#b_f+>TeU&44l##l-k*)+wtfSKC7B;tENXh?N|jIvvIe~H{IfvI
zveR>+(KUI$g_y_Ewtw%=jjAdwDa7_eg;;HRmrm_eg;;uSe@PJX%-jFVg4yav;n#28
z!exsas_nxKtk&Az<ihO*A<jDAwqfH&s8zG3dPqVUcIq^j>rZa~4yR|r@u)rj_WEn-
z(xr4{*iX9mf-|T8vpFA!_HP&GOpL?*I1ZEO|IYM}<j&77BzF4wD(|vLA+`%D#3on&
zP*hCR63DC9st@<W!o+x3h4Z@w3*-~Wa_|0qm^OW`h!^cJ*kNy9FZjHhB4`kY?-D9h
zs)l)${$B`}zFw(Oh*b!&+thR;KHWd-1}%}OE8VL#>LL;Ep_)Ir@p}*n$@0C$p~FX^
zRl6=&)_nXDKJ(^I!&PgZ61!8{UR}-agEnOsDoVSHa|rP3(%)gk*JIT5f(7!!sz2!6
zkm5f0s12Mrbs7Wq_h&p_ZMc0qREsXAwE-K@2Go+(!?|;)4n2Lk%k?MM9~@3s39-T0
z7T4|vAI9Gj$Mx|3HTC$68?t6&ybPyC`k!l8LbYnB5R2-kTed1=H#O_0o}hID2lPQP
zkp8e`3n|3DC3=cBUAyhf@lBpM4%)PCC5n?Gsc!%gVwIk#ty8;A=@-wR(hy=-L!%}i
zs#z#~@1E^=jeSmyqYWZ5ju`cg5KS>2pUg-~prN6mB6#!WO&ImfcQQ%!W&4Q0K4SPV
z5g&&uh>;Q~Ihig3CO?$Ed-pbtLhN-YQml-c(^!7Upnfo*e_xSK*LGk3>~`@#ux}?k
z_v|ww?<M@$r9^3ETUKtY%LnT+x`+2~34t{kPy5`tYd7@iI{^0XJK)gq8Sy2B*ptVO
z$SP6M_d{5L%GPG?7LrecgK3N+A$H?tc(Z;3T{el&vZafle!aRPEgavUhUCmIwkf?f
zs%@`azDzCGum2zzGnVGD?Vq3fsIKdeA1IMKefkWNiOY-aDwQk2rVZ=FHvKI9Z5e#{
zQ7biU-00QwbG2VknqOduP9ZkAJ|>Tk%9`~tnQre~%5*Ak=2DvedCxvNrPx&~|A6{$
zS<exXVSgC&joGe6TuS%vX!)S*N`DAKg;?uZm!;WPulMr0pT&GdA(s0=R__Oy?)bB3
ze~b#TX*8aU3b6_y_A_DEXD|3(M_xU8_#_0OLTIQ)eQ?dHEiiH19Pmft<l<#k(hyyd
z1R=H=J$PEL6K2Y&>;Kvg<4~bXn@_zPvK;q{KWS1-@1{(ck2fP5M7g<($3jR*ur9;D
zM^8iFFGks|_lrJBD8yR!+w{Zw(4w`Kn4#N&6M>(QC?eEfE%ln=Ao8r;Vz<3Ud~$?j
zN5ZM~#kg$F@FC-2&u*M-(BN*w(_Xmo`*opttH!u2i@U7OAzvZHcGKMt*lXY0Z?w_n
zGq!Usl4xztB`%pPRCz7<8QcFwKRlN;UeUGn;>9b_wf!KMa4^=N6~d${`f=MP0z*~#
z)dcU4+ckxvp#@Fz5vevM?!vh%NWi_EWdAVs7e~TIh1hMIcEgtSyItOomK-Dqu_KWX
zYZz~#NDj6kbuC(@%lC4Xa_~mIswsgCj{i%`iR<h2_Vvc4m>cT|SK6HrG4jy<e_`#4
zO-T4na2W?>Tp$IO`UwVTvdt~g9o*eLa64s$SgO&C6kB4P^?{f2XkCRDyFmHpyK19S
zg%mq<$N;Ee`Jz`>IR*~n#Nwx)f1yU#ulFYO?$uolQ~KC(<JGX-m^AT6oTOD=XdOF#
z5;}MJR3z1^l~#n<1f;$q8J38!ZrE89kn$zQH*TAZb7Ozb%;BRWiS({GQgZbyt-qI$
zX^#4m<eHQ!Y~sUMpnM7FYu&_+?l5Tso)CjQaW&iq$)5#Kl~uYGOV`2SgU3@`|I3y2
zwo9m6&-vY<dbMOoYS*`4PJozb#KF=JZInjQ#{IScZJeEcYC}fF`_g?o58BOdLq;8g
zgxI_IA%>=YN9?yYf3;dhLM*mnH@3mfd2HRuNQlKY+{ZR(@|P@&3b7wIkf#n#ocIrx
z{JcWfPHlcKZ&ZjKg7;w-NB7{9zMpNA-&uU=I0t<7nXvCvwW<)S!He4AOuhZS`~*Dk
zIzcWT$@-%P{bbWlExuHL!6Nyfbw}$9q0^_%!Qwf8sO6q{p)@pnub!xrepcg31b^?r
z>xH46$%oN4(s`hrlJABJvDxrC>7w)V^Mz%LXG2gxfT-c*sWZ@~v-KJwt9`mmX_z*V
zUMivD1gbZ^-J}J?pc1ap&6@m!`m(vtfUjWt?!Cq=cEds;7O&0XxZLS_jalgeE_~c(
z--Z6dxN*Osam4+A`vLa@9tUg(Qo|0YWKC2rwceQErf~8`C4It;8@>&%;Rj3Pw&Bva
zOP4LjEi(AhrEhx#9&XC~fj=POK<?g2KLYM62ap(z{$oBK%l@U3BsEMS#m>Sld0-Sv
z&hfA<DHfm0oG34Lm%{uugxI#UdYyf|Z3wZricnJdX$j*`x^#ku@77aQAeDBT|2Fvm
z39-7ReG_5t4l_cmERU<`bTlKxTGO@dTQqMvlr5tWa0DS171*@t&f?$RuynfIt02ST
z66wy?mnQi$>3CGIHXm=LOP91I!=5>7dOi;A(-2}MF<qX>6ppW?&gU+JLaZRfCbPfU
z(<j1<FDPU;Qe!Rm@@v>qWxQ_Rv=#ybm1lXi`3`QpSdr=>mxyF_GeWE+9@^sFwDG$z
zps#hVxn0L@u>bGFN_ALYQsXxuz#mt;vl6cUSh)&@4Ex$rR%wqsJ|!{{z8NtT>b&u~
zny11mH8jEwi7;)_k5I8fIgu{aZ)N6weR{zAO=!#mJVf=(*J`|pTlVc;Qs+-pg2!hh
z#w+mviVc{S;`&qCK2csJ#NsuX4p*K=Cw!?8`|#csWoib?iYc0O_WxYF3JI}Qq4pc~
zVC%MRDkqrc#?qoa1N!#^Ql#9nWh)Y5>!;fO#{V=9mCf<JGo21>ypLZthuVMj@_FPy
z<P_zWuUH99kYK4jZXyzHMD^B}UU)&|(f-hT!CABCLjM5+@q_kgUAddrFRNrsZ5c<l
zef)wP#%1^J?P}YuUq?c0XenJgwC8ci-~k3gY&N_5*|l>!lzT}zW<iK8^^~sO!GrX5
znc+=psarO!H^t!!D#d>D?P!=hWxB3jZF{xnLB@xMhQi6?M^zXbH+dfwVpp3U$Mvfh
zP~a_x$h&dlCa7B<6^Tvy^`eFIpix6*4xR|HIdbMz^L6dg8NMI$t-8PZZ@r7EuN%~K
zv--~ccLEBc-6wbF&K)RFC{*Nc)$(JQI)y|g6!&@e9x!pzG`q*&>x=G4i2YJ#2Y)2Q
z5@A~6a_ffceazc8NUg`2eqnaJvOTW&pY`mgBgM*t70R$<MkR@}EBkY${XrqhxfBYq
zF4}unuM=DjdjyWzjEsXqh?PB;eMTUYAV5ojKVMGyTF%)+(kd@HQ`Wd#xie)Q$!nJo
zi-lXDLRZrd>Z{en;@6EHsQM?r2&9D8&3XbUgZcX-A=a)!tXc(_5kWVt-vQr$JHwjE
zWXp^YI~kRqR^bb8azqRz^;)eHgxH=)h_&PFE5r^`OAtY{RokX&*wu|eeZNCBTO^@a
zoEZ)(X;x-R#;4;oBgBpxHUW0-IFL+f+vIMaw}LuJkn^IEuyX6xZM^olA<-_Mt^$=1
ztBJMOK0%1p<TGxj)wwk8hr_lAR7FzHg>#n`QmSpTh_O|O{Z-9bw0I$x6=EOU3xmU&
zF``zQ3LAC_u`bqaLx>d$vHHqv$U#Wz{*8#M8dtem1*rMPtC|?+H;)`V2FsWHX<D%C
zvn8Qwt;&!mkMiJW%ybWzPM<S*F+6%0ZcK6_OcnthK7lCz=o*29Sces2<x_<1E-MuZ
zg!zq&s|g=1Jqx=pKT^X)fZcy+5{BunSaD{g*aJr<U_R@^rp&AO_V+K-X({p*%a^JI
zR#~1VN*gt92KVmWl~K?MmzDeQgZI?1BO647YtT?BQ>&J<gjoCSFY}BtX>ms=#3CU!
zk<?*H85Z%vwkxPvv2&!YnJrI+;)yV;ot5mCl$xtE$4-P-Hzd~@ojoF~%(w5H8?>2*
zgtb(1O+S7c%9Jgk)^_UTS@>lxz06ISGup0`Snsb6*4y{XZurrSr`mw;a9R6k&9e56
z*iN-DZrBiFS0Wj8*FkL--L?%ORw%?i(B;VpZ75j=39&7d$vA4<iDO8JoxeiYPHlkf
zRG*<Hgjj7R+;;ZZsJQl;rxIdQP_LF0trB7l^_c}f!;hbWEH9(z!;Wu;Ou#SW<3-kw
z@R_ApiNa!=CceMLd*RsFIJ0V!iL=;7njsSo39&9J#Cm#q!lF4-Ab-9*qNeERXn3b-
zOF?+GRIYm2vj@YfrSnAi9$pjPYTR5+({A+c-US-GrKlFnn7a^W&RL*MPI6liVsV))
z;lwqYw&)tdjuBu47y(9r5nu!ufya-4B*Z3?dZ~C?mCw5D6CQ5vzTzY)3bC%8FDu4T
zSV6|Xm6l}hjO5Gm<z7?|YVuTiN8lzDUiTe1gv+)oX|#0tBwTGFx&AS8>Ugz2B9hUP
z@9BBGM9L!q4Y@-{jzUXPh)n|TeFnAGz5|BZ&0n%a379);5(N0`NqSMyQE>6XWjKEF
zB$fqe@V51RPUH7Kwh&_J8Amzq`*v>9D8&8=eFqTX!kXSyD8#m=s&M)!5fpNtHC@(2
z{^I#FbcEPC_1?u&DeGVD+joHC8kNYiqzXB0YKrSkX}e_k%sL+B@fm$mh8;idJII?m
zH(a}Z6Fxy<fYWFGvwJ=c@85xG0O>vcc5h#=Q;6-{tvj~Dyx+?BH7k|^t?ELK$evb0
zXCi)VZ5<~fgM&ZHn4$T8WgHM8R;!}=*%y6b^X6@8y38m258i76{d!Z|71z0I57@b9
z4+fGSzXc2Cht+>r-_^{Ty8wRpk><qh<IuNvPx$b?MwY$NJR7Ryq9U%`AE`vnn@!_S
zam`zGfTREXivc&-ux>fz%Bj3}_<cE&Z@;7!M^iTbsXUQlZEXONVeKDBYV6n1`rULY
z(F!ik{z^h@*xk!2F)h6aUfTWqxo$O7M?&oDwd<w}A$H&ZBE$}W%|wW;Q!mvBZ$z{u
zVxM%r{=txdAK}yVp7wZ+;rn-Q32p<Gn>KwWbm{u3Y5u-_dO^<~pPQ09X$ksQtJZ`w
zXU?em3%h>@=mQpKokHeyoDjQb*A95eLR=+6Y~i9MP1{e$O`<P^6S?H}vwP<@C|B+!
zk@wQ2OHjO|Eg_c9rL0R!u+-x1<Kv4Y&<W6_aU)X|`@MVjp*nG0T!k~rZo9Sh6$>o}
zCr?-jv5guNA$FCDyY~FvxOPz`#BLx$Y`wQl^DSOD9~w1M=HSD_Ng+0mns4BM{(`_Q
z4itZ0EcY@TJ9bP>*X~cY^PeMsLm3o4Aou7|IONEs5Nvz&_zb=oHA2MGPxTtLVaLv0
zc8|MvuO2!=tY1Jd5@O@k{0|?v-p91(%b9**cD(YqUG=;7B2uiCcXjIYaTxpEDD^m9
ztv9vGWy?`WoHId)RnH!8Fain!dWBetio6fvumvUb=>APQ#wWw$ks%afQ@Ov`CB$NX
z3_z0W!rvx{3y<8b*1vi4HneTtTSVDai2bmKQpD1~XD=8HIddrwNwThgj-G;kU*MOD
zcE&^g0=Z%8>~Cat)gRF78#schwdBT58VV(GnO&{BdgVHFY~5dpG8tcvD8yENtvvJ_
z)Ky!p*xtNxmrYz!5mP5Egoh8TM6P5Bu_o;`!^ey$ym-NKm?xFmWTTR)uk6z$;JY8J
z4-B#x5xx%WJp!|4`~sKGUlY*{o4f&SI#^Y@DAI-yi~Dm(Ay)24)4s72@m!Wn;#^W0
zO@0d6Rfugjh>~sc8_RPTF|srMjQE)nVh!gbqv4q>A=b(EYso=6g;)WW(%(!K1|=cZ
zvcIRFF9nU>w@y-%%HoQpe>v4(W1?dqCN?(7^Oq-oPMpwt1!$bhC6i=RW8-3BEGpaz
zg+>|a6dp)}rTlo(RYI&&3bDqW$wnytXO;57r~k_XKkm5!<96Rr6D9HW>W#gyVqI%B
zo;KdDGYbmjeOVW`;?I_F_4<BYoDxWS|MFxkUNjf-<y9s~WhH<AeF(bu?2AF`;OXDD
zH`J+9OJ;G%zk^F-%jI}#)k+6KtW<~<t;4n(A;>~uBO%rc)nUzutPY(>JDJQ#uu?sC
z?^!n}?-#C9ihXW?hqg<l=={7?@j0mfuC+hL#Ks^|5GTT|UDl=gpMFknyKdgN3sZlb
zt00g>|8Yn4`Tk!jYRHtCCf`O38mDWI4PjF%#7cY(_1h3)r9!No{5FJGsSvBl?}+`D
z*=hWkD#S`suA#k@-&7&?-UFpdOMbhASd;qbeA*?%8uB}fFSXZHAyxulso$nv`4Na=
z|5Tr;Lad=a8KnHOzgDSU0czBymr9CT@!MbcAq~BR(bswT;x(8(WwDY;Q(i<Q8@4FK
z(hMIt7ZqaZ<H4V2PJqxN3Q3oi9c<n4Q#gC>qEfHP@8)&Ozza#VbnpGz>+hK40O*B;
z*mo_2*r_w-!kh)x7hR?WG?6-mSZp6bq0BC7G9`--=1rmf;PQ;OiU9XF9#3pf)Zw7L
z-ib&aA3Q#?;P{YaO+Z4d@`;i%5a_Oj!x}=YREU)p#0h&LF-}ad5@It7zMVU?g-#vX
z$fL6BAHaE-HXUf5KI#53bLs>GDfSSSK^)VeKkZC{5No!7<MQWPLaa8wr>6&O+q6a{
z+Y(4bN}PxU;*A@(s>fHOW>pybEs@d`rzOP7`m{v9HS4T|Seb5*5G&KQ_%BL=5Nnp-
z(eW$^aS9oB8XipgoIgj}rxIc_>3Gzh-%_PZAQ^VFfed>#$@5{45Sx<z;K=zm5@Nd`
zAvUS=Sv)ipmMxiY87Y9o@v}hVMIQf_4Qn8Ka5j-*jV*it06+jqL_t)3<?1!~?)z~`
z)+diICMphg?%u818+(LUnP2WthWn#BtW;g4o!5P*DO|mJRjn_n@#}`G!5rL6WLw4k
zwP7=S(PtnA?2n(Hei#i^UwuUuffp*!yo)~nroUF;yS@;SXA3H)f7-nlgk;YSo7Y>#
zKi+Ea9$Z4zN8|Ch8t#C^_+m(mmxOqUkE`{iW_eRWtP|H`0@6x|y(Dm@A9`;?bEVRy
zN7zb;eG>_>+tYmiwuIQ!Io?(+TfnrbB%GqSGG(7dRpIl=9#2$67_N5cE(#4D_9cuM
zY2_i9;or1LV;D5BKa?$7M(#@Zq}-XmU=d{nFpRl&<pSi&l}n_Z$9DAS+1sJ>8x<7=
zfBv;zlr!7Ev47YSVoQj!^kXbPbjUyxLaaIddv>8htd0;{R#)GU!2>~0hz-=G8~5+!
z<qdt1eBZfK2NdtgqqdPYE?&F{C4>TP^8LRU+U=7k{!z;}YWyCoKqYK)#^b$l?UD&0
z*7kTwA+~X&hN2E4#AeTtTdnWo=FMQnbn6EJA2n|Yzx=vHO*fto3Tw~(wQJW<wYQ|m
zPb*9QzHF)3rk~br+QGc}3)Qf({k?njG$F*ssrj}0p+460i$2NrcWNIAHc%gv`!hS2
zv=f;wcbJyp&%fvoWlBE<Cr=%RA4V(puxYtJXO1sh4rOj%M~HRO-s1(FE~{3@;Y@=E
zE5us6HE(4i1RjS%?C=3Uq$z@S39**F{xs!F2*st;&D`8sOW{`w!OKyFSTnNYJzT1`
z#RuKZb|K>4YETP0cKygE{iCLzLYReQ+J8t_c%@2tT^{<X=>2!Q=;E{iM-*ZU70w5f
zW>_bYWcg-IK81&2R)VXHchpao5bIz?OIJ+=Z&U@-y5y8`wRz?C$nW~Vb1&#`;$u)*
zt4G&iaN#^X$XcC4gjme(szPj9olENx@K#C?FeSvMq{4J4n=B#L$u`&!VqH{-&5ui&
zx9!qQ-MhNPwHlMU8{R(N(C~x0P^xq>UBx>#?}JT$?a;+J9-!$Ybb?$%+wQpOfhw`?
zkh6rMh;j1Y!;V*Hl9QBTwaTys@>PJh-<YH3G%COv(`82cq*$55+;8yqThOD&CpL*h
zTKWK&p1X1Lrkd6fU*I(R@O?ELjfCa1XV0r)vyEfN{)HdMPZmkFYB@`YHLFpHQx#(W
zi$H=ED#NlutPNOcO^A)Z76I{BBh>v85!Mq)w_0b+(|Wo)>_?((YB*0)4aNH-nm~|l
z>7rF|{OD;Jbjdf`E_<q>#>#W&%?TYprI!ne69nC%NYK?dyTnRO9_^+LAvTjL#GXHU
z8RpGUCfu~gFSqRyVr2%4?<~GlOnc3<cdnhO*HwjBZ*MQ?HMon~pRZiG39}|H08*#_
zxNQ^lNPquz4g7OR`Cv|sba+E~U4{nJQo=Qb*qM{Y;zXV@;YrtuZr%IB;iJcrY{iU;
z-=nfpDUoL)DqqcC{F_bwX%j}n)0Rp1CLgs!bsp=7A~u-~5v&kv0EB~#03*N%FanGK
zBaopGP|2F{MAm$~&dbXSYE-W(8nI#HW_4A9$Jr`3k5p8M%>WqN!?JV7Hb{(ZYcE;E
z3sP)*Tk#5Gp_$VRq}ctW6r1*L*Y>|u(yCC1ZA}WX_T9c+Ru#%MYl)mX%rtY0<{v`O
z?$%X7mi@63hJHE9CU4D})lgZ>`YuBdV#U(-)~w0xQxIa?w-yD6Jn^C+$XUy4w-zs$
zsaJ@tOA4{6<6eKgHmqO&SL#%jinU~w@mLz4X~+MlA;W$qm0^<x^Y8&>j#((grqj5i
z7VX|)P>AjNd6EsCH+L#L_slbDo_YAe>33tS?_z&nx&VrW78U72J+}IrYF=kH3Kc4V
z3bEFYSwHL92Nhzs+pS_cs$7$LwsbF5d<~T@6J!uqMM~Oc9N4=RS7!1M`A?lbgDZfx
zRLh!eXpb`%MK>x`s&1356WV6_aDiM*Obk?fr3Nlf-x9iY?jYjsph9NN+HZ^P)cncJ
zHb4?$AKbD3;dE+ZX|JyJf2|b?v9)Ty30qLLHLV?yNr`|*3bC)_K2yt8uU-w-|G7r3
zZrGQ@;j7`+YoVH;*{D*bGHltTkWVSPRqM7of}$p?&F0fjJq7F5u7v#g^Q&nC1`dXA
zz8x*X{~kT0s)W+`$eYicW1$vyabw?}T{?x>LPd((t!e0xK{^tvmrsD*ynA==&=F#b
zmC$nsoT<yWllPi7fmt)Bfsc=mnp7O?zlch-$+_aiiovOqiZ}x0ZP>UetXN?s=4;E}
zxPBRO=1|1hHf-1gb?VmFCac?v7tPlZVuM2zA~R)p`Q?hRbNd!G@95FrL*M=b)v(z{
zWcUMB4fhDH6i}|h|3tRDdGo-POXt-h-+c2O3>Y*-4I4Lz5Ib_jS8BA6Uy$yZB(?fj
zO3tO)xK!A9>+Qy{5>?wXnhVaUh_~qou^FwA+@8mV01{%WCepiCdY8mL<B*y9!3*V|
zhT!Z$P7kiCH7hw?hKPvsrY}j;arDQ!=}26{!D?|~4<5otO+Q!1?dx@3h0l7nmdUD5
z=d|fNoy7wXZ3hJS!J=j3)pXh*a#!nSJ$3Ex{7G}D_jV0kJ__{hIST$gdPd!^)^5!F
z`CG`9C#S9qku@9F@2KYgxb?g6-iNjiUBd>BgZ-#*s;y7<$DV!KLp8&BxpeUgbZIwO
z&F_w1RTAmc6IIQ$ZY?U1O&B*<&1Y7>+>e?6%O4ZL&(C_pM|J-+b`JctcB>Ar<m#O^
zcNFBaEXAsAU+1>{;PR!L4!3X4qA`NNs;y(@v|r%&CF^Y3^KN5Oh_w>FsEncz`-yIU
zAtAvqXVLfCD#iBOZ?x6rGvd>{C7#P>w&!x_fN}8m{v$T+q4J7CtbUAL#B<rL{b1Al
z$>GZB_ODyb+cklrp#{acBpdbfv?WQNPviN09ASkJTUqUk+cxcnE$jEV-0lIxY3UTj
zZjwUm*pbt0`dQK9g`s(yM(RF~p<3RuMXPoByuCej<Q|%29y@9pL`FpF@}+ivtlzLE
zyj0;iwQU#AUxm5TesvKKq`)E+^xe3)mL$51uWH@E0|~KyVjn3b#HtOoY&fC-YetGS
zQ<F8;Z4CS3gZT=45c9?tVrK5bg^SRlReLpwzVz(f%ld)G*|X=Mb=#z0eyD|UqgE|F
zA@<z4^U$hIM{O2|w^c&y*+{WO5I}+;#sVtDCMM7gI*oHYbHdNM_v=ST#;KT^5mwbi
z7dB!J+!m#zBCMJEtjr^;e|~^xs*eBGoj!nqh4aelfxa{!LnMAY_xRtX^G{2`_a0&;
zCQ{{d(1u(>Tar|Ns^72{yjcEOwJq1K-G-SH=Ih!)%ie#av7N_JA$IA4)pqNx_WJ)&
z0o!{0U$<&2E^BwtZvNJt5syMvJSLz*?7h2Ty8MpVZ|!kbtz~G#%B`?}_d(rpY4f+D
zbE0X(_|dcA!Tm5@{sM*aK%34Vs#x8;i7LF~e%7^9d;WZU6tbu+pnPC4$0onC_)@$3
ze`USqDTLU`DXO>cm)*bvmBh&rS%2ifpKR*W;-x*#_glWB`>5l)uO>n5dR4JsDKD|8
zzOM&QKrHDa09X2VBDRUlqcT1eh1hrrt3&?O@uT6Hr<93eqSp=_G72_t-<53H*HOu7
z*nnOlUu0Ayy!&2jcoZJ4mMdDMAS{?QS%m3p{+jiyBw#gD5*rB*JP>Dh1sCPQjbTz>
za0Ms(_laB|<7sdFay*Y4whwF{*bcBANXiaGxZM+XGKr6wtQlIg2uzv$Bjn4ITeRo;
z&0Em1)2DDApZy=FlLWi~2yyxTEgUii#*X4xv4WKlwhu{lTC%LOq*zDuJKDCS@}(6a
zcEXQi;MFS1vu{*%6#TDpEz@RXCPJ*~0cL>6tS}yvBg4w^Xg0Q<1VZc!&p!imXW`tK
z#nG60<<;6c;^|kz2EaRS)stD^qn7RApMR46&{fT>*>Hvs8yFA(+qSGz-`C!M5QgtB
z>uPF)WC^irR{jPB@+<RRH1Avc%?5Dm_8navGLS!CURbkoshAs}xbqh;L4$@L$Yj;`
z@%Dz@J2$HB>h@VL`0SHTP^x4Jk;h0TRtsj*4QT`X6GI%H&obTzKa5vCaLy=%*z`VC
zsZEIWKoU3+5vAJeX(WR`_00209+s8}Nf~qI&Ib>0%sJ!2?%x3t3nTZ>KmWpu<tmEp
z>C>h_tCm(#h*zpqg?;<>i?r1I(Gpkh-n$2R@+$9b&Gz98@ljjvB_yh*CLxyER<=wT
z_~)qgL!~jOz}=^BKeJ}*;?kQCOQhY05ALY_>h_&GkT1WY7^-WSCD5gFNBD8vST$+N
z)alT*+ox(cHac9jw`RDi8F3>yLTqaFF=zUPwtZP;+e(Pd>$1H!+J6pbo_P^gh|MaN
zAPXL+t17WoYrf(%T0f%_)CE+8N=uiVLM*)~UAlTIcv-$Glx;b4<^pu@GE4@=P2b|*
zC#YfCpqKHjKJ1~33l0u~dB2X+#ZlnK^;^)PRX^QBC&j;B=QUG8?#}J|VbqsaRk4@w
zMfjJadQuUcyKw{SZE0KYi{+kz!Na?YrAf5~h(y`7-5_lg4F9$_yzpXKT^t4aeepH?
zbL5mwydx223bB)Z`WaTQ*yKoYHBZB)b)ZdqJvo&UuV1?fUE2>r!g8#dS8kNA_&oRr
z_`o()g_Lf|iYfR-mY(o6WWZSXd*4x+Mfko*;{E=oK~T6z0bRU8i0!6}b5$WWEzhN{
zfgErNfus~-$vze>X8)lpsU6<G|1iz$T}D-iB|KWRe-D?<u#TtXQ~;C0(9yJP!GZ8;
z?{;eTTet4Plpp4(Vdpl?6k-*X*j%Zk5UXuZg%`U(`RBW8qrj*TD-+G~I!lTj{?%Z3
z?bRx>N|=I6(Y0vN9Q=H(A2j?hZUQX(eYwaJfD@OikU%R5(-hggM{oH1;9<3nq&CWz
ze-XYP{f(L>GAbJ0tox1{c4k8oVsE2DtWbv~f*6uwiJ(Pq(C`<X^6N~!nJw?pk$SS5
zcX{hqz$rb}#D}r47u8<>_kyQQRg@Nc>VYnP;zoCvv>q9VspyK8ECL_3wvzLyY9i?W
zW>NT0YF9qk&zoV{ySMMcAHS~CWo?Nc#uP4^UyZwV?H0@!KVJ<SH>j>J26obojg`yR
z!=e5E=(0MaG)e_Ct3s?V;WenUicM@>EPOLWe{{WNR9juQHjEZ`C{Q3li$j581%g{C
z?(R@16u06Y+@UR2q{X$kyB2qM*C4^eo8I?%zVn<P-{40eJA*N@_gZtVIWL*nWv@5;
z9@r`N!MRZ4{><JqXu=|9RcrhQMNaj63J^Yt4&_^ERHvO6v|bAJ?!8updPkN%xT?g1
zW1E+QLAt{h)mUx4e1!Uv0(-<}jL)|?EPsT{PH(z?mN;&1%b#CgPhI<d3ru}w@GvJs
z9@6VlAf6L+C-rrpaxIz)&-(@tqRpZi0BZ%Qi;m9MxG`c=^1Wx@8+gIm^Dc;R&-B0g
z?V$l0U`240kAWio!^u)J+S>=Q=Z%RVX@&J82Yb<5<*~3PZx#!z=bmGZGrl~N;|oNS
zPL9mQV$A9XJjxzHr>DpGs?W4DqhE`KWou8yNx(Ykv#}a1Pfy8vNs{4l5>c~MNy|I1
zmGsV~3!j?r#AXk8yd&+~Y1uh7p+4>>_lkw;XNFTg-R+cxbP(Pz6@nRDOg*pb$I3I8
z#QUN4QcqHa-Z?F9Mt>Tnda<lK)#dDHJgBr)zHBL8x|0u!3~u}Z0V3ctEgTwNDQt8#
zuna2hLv@t}eD6h9n3K$h?I;0v-US2cM&?R<c4MPB0>&ltLz&G`2}U8zsxp24@UdpM
zS&_UrvTG_fn5Jl&%3s=Gl!fYn+)h>Bk;CARZoeD}RMYDV<C#a_2fV<UPtR)Ii!tz_
zlE@M4a`oHwqU*yOvtDMA%AX%6A#Tt4QKd+AC-XRlq7&_TDG}<gW4rIdBDvA?&h_f?
zE4-{ezhaq#Rlu>_8i(gK6@aGQ&vCVwMTd>%^=7MHZc78(d4wW-?`J3~3Eg*s)ZePa
z-vArMGsRtf*Y|?Pwc<7nG{gq&uM&#;A8ueG=UrH1C1tP%X;z&|$EsJeoAQ_yvbaE%
z69jfa<LYU3z7wzCr|FeeBYLXgb;8mro=2%MDvi}$PYs@s-1n3?(ryROO7NkJ`+JMm
zM=A}DT<Q1fU)r=Q^l%+oRP|Ss#Z<uf-9OOHy~7hE*jTO-^FB4F)wi!ekC%R{!(+qF
ztXZ$Z(IFinL($VvlW-Ns39Q<3_{Es$4V&FsjsYH1HeY6!)N5RHmD9A{5o3fhz1rF(
zfNq;km6_vx@^yDeSj_jX3ldi5g<r7rxeBq-3_+>IFdT}U(e!J@qi4$rq>sxDIRm5s
z0OCS5>!w|Gt3JO2f*Mh3xncO|n@_WL=}%q_&E2&nY16)H@KZ@7oOi%4ty+Bcc*i4f
z_Q}`ZsI~8?(*6OL*AR*Z1R4wcWln`YX}kljiGic)+xlryFL}O$+^HUP#E;D<2ce9l
zd_rj&eG?ahGtc=2)?=C)lt`>SLp+0RFA=rC(j~pv4o!ttMwAjxUZb>1`0W|0V1}7q
zdkS}Cg1pHlAVUGZ!UOPKF4|C&XdczpoBJc?O3N*yTHjcf9yQ;s*Eqctg<VbeOk(t-
zolkx1irx0&qjneKBDd>#9(EV1QfcnU>yy1lhp?hmU97(Kk+72<>ID0C%163*OtaHv
znscSRcjG@)?Nw)W8dYgh4}EtVC*Rn*0?oBF;@?Z5&WM`6WGPYuEv&ihVh6%8+W==d
z;U`!+bER%@(jWfkIUqGfVsLG&T$^#;WJ+m2K{oMg(r2zgna<Qh94xGG)o#Bo&N8Ja
zC<&`7$|7yxju-t+UoWFr3EmfztZ*}bcp@SlH4X!<w1>g%AXQ-u8g55Ig;6op>?f?e
z@P2KBHD`@KM>x(s0f%u*<lZ}!S8wb5Idp0G?2jGP-~b-WM|B{r$M(8YgM-SUiv{I?
zljYbLI%ZY>vj`pf$G$CQ%{qaWxkr0cgyFOAJL&5k02j+ossPlI;2@+8(|NkgR>vF1
z;5tK45Zv>*6W+HMXX7xnSO$hh1T5wHs=H<HjcuqcPet_D)S6rE{F%DOtcobaSHSa!
zSK5t{50Ofqhh)q`Te0f<f6&XJ1C`F&<;e+_!^s?|>IKnh;-*+ft=AlHJ@?r6C!UCS
zL3|v5SA1Xa03aXw&0mU{=sy*hjR(}FJ{V9&lZ(8ZE&t8YsZPL%-@LJX6oQdtde(+)
zYxq{TQsQ^?O9r3kC*^ZA(EJn@VOK(G#rshLn)<6L0mP8Ivy3Q0%&H*lsC*qQ@XXES
zXa%EK+IMhNuNUz-THNE1MRc@+Vm7!EGDk~|=$q$V-d+&3^~T0~ZNK~eR?|m*<y47M
zGQH*_PBCgatIaNJJk~xky1c=1AaKI&{!_tX8@DoP_%Gmr{al#alIcwyGM{@t)r^>^
zj2lEknm8B8E5+nR+d0+XZ%y(6p0(H(^vk$eO`*drB#!qzx*}~KKd*`J!1j!4l;Txa
zqf7CZio97{!m)l?Ve&idI^2r?VR&+4a1yz%aS%es#KyM-f-tq~nav<$!vuLQwxaN<
z2@JeOSD00wKVz(?j=Wo7a<|<pkf~*P<Kt*7RJ1#><bK-geN-_mrDlES)#vFG5k99Z
zbb33eK3*PmA{*ddT{2OMpFZt1XH1%L#&56+d5{6&Ew_8NoO_xIb+~sd<I083hj`NW
z*cRZOx2c50w6zR#^$k}>9jF&PqNl*8)cy=@_dfI6AHP%g6|%r>6wS*XI!N?MdWBi_
zZnCOsg*#*DM0>5cK;p^povmDzKOJ)&Ric??>*QRG|7$`sR%#~&{F`{<^x3CR@WPws
zW!jMa1e_^TZ3zE>!*e;DLdPw7FB%PdWjkBQ@_uqzCGXeBM!U=2v>!QP29?#wSM=Vf
z(4oapPV}nhOwG#)$P)hH3+$Pna6pAsW8!BC{7bMK#iP(@P5G?|q>>2d929{7F#;9{
zK9RY4&|6@8Fu?dK{4X3V_?(EZpy=BsOc*-wSwB{ip~qc{@E$~;Q!oWtz&C65Ew3y2
zm_Vy?;J=gO)cvCHgN`08+apE&XUUUyx43F`>c7lx(@=lA-Hl}l#huMHF>fn>13q;G
zi0!Y{3uOp<z1)4YyVF@tG%AEcj=V0dS4vJ3n?KL5J=RK2=pJ9-?Bgg>=ws|i`Ovy)
z({9>AR+>N2-O}ntF3;LGpNr6s;(a{7fkJ~$3b|P?RoXN^&5E}Nb|?D~2c9mecCU}T
z)1oybF4s_(FG(yB1QkCw?q!ADx%^@c<!#rlSP9@iqWkt?H_e9I?utjesRpqq=Wp8c
z3Q;Om&%fM}|2bASMb~OuJLmeqwe;L~?H~DD)?&6yzkaiB^3+zdqzm4Thojx>a_az^
zLoQa%IP;@admXKVnj$Zsv-UaSmw%php>Hy*KZL-LUv$QaDg_jN^yyc8cI>4e;&<tL
zdu>k4GT!Q~d~5S4WtS4fU+b_9-WYGbA$8mtBKdg!*<8SNzmh}5<8;|^<I&$%1m4jN
ztUGbi)PI!Sxj9)u=4`zRTFfG1R1zDRTMI~Mf)})~W6vkpMmU$_)qv<5t7DzomLBcR
zU)Pp**?#wk?>wsgJg1uMg>Jn#7O3@o!g0v$B*469#@@UkI%?cF>_+cv6gKHJq}@Vv
zh><${xu4FEz1Q#dvcv6{>Ll~}6a%L})gD~O-?l&E9m%4*9krtRKh=t}JIwmA7?<iW
z5t_wqL72-;^IkVJZL!p5EQ_YJJ7o%>$Vil4Kfd?z*R4^J1>?L7(P8zg&?rV(s<%&V
zCVncG>{pVD%q%(ON7yThh&RlY!r)yyUGe@g^l8Sm|LJqLhv^_E){O8~Rt1#8ErGb%
za71>lL<H=AYS1|CQ<H;lwj~9M7;9^7w!haYn>(V$xOtIUnH6W(xnQ!4x7JN?Y!2^%
z2iVMRQAF=Kp+j*FkWh=hgH&o#(;D6z>l=9+@tA*s8ss2-r^eF)?|5M!-wC+Z2%t-p
zQVJjQAbleV%$19D)4-V^kYFP)t*0g6E7LTs-RlO>Xr=ERSSxh#uidEUnI$Yw6=q$(
zjw1Z18_?UXA0bIxz|^zYRymT%i1y*zWo^tMTM7*$P9$OVlVQCTMKn-o>2=P<r=1^b
z)EV>d1J#Mm%1HfnXT~?O#qZLx)5J4@QFsNWH(lq$B_GiT6R4^x+j{(N-ynVGts^Y3
z=p5vcU3YGT4_1thi;N^FZjzF4o96v^^{(dVDre<5gmDEtz{zLXx77~|Ud@gp?o3#_
z4%;(gqDyjx1*740ijJ?H-sS#D#4ln0N+<i~k8TJa^u-O7!XAgKuCqost<HOk%o?A%
z`NnCfFLz)zrg_5ZL^Y~i<<tfp7elRk^s|A02ZQ2qwunUO?~|lEH0*i~AQb@t;#%C-
z*GU?p#(~S@<)3(X*#_lpL*S#8iu6)+-qR)?I$&u_hV;E0PvqPg$JH!(5`FyGLD9GA
zM@N@8{e4wJpE@ljHYzUIjkT_;JzRM|ITv2hBbL46ok_6gD_wcfT=!HqyS4m6<l;wn
zvzX;Dm3>SuetI65v%$Nuvyo^1g~6&IL%CQRrV0#I|Dnyy@W`TsLCp@<GF!1y)DhTC
z1Xr8prxo3~LB`@4l>xP|?AITH7!>?SH+rLXCE8lNW@_kUpF@>FCp2Am@#Am(SJ@s_
zIwchgV#s_te6RKiP+p)0@^c6(pF&TT#v2Y~&GccVy4TGOzlPr2Ni|(xIfiHNafXod
z?0!u8P~Yk#m}bT>EFob>yWC0^Iyd7fE++LVw*fF7nhNkv3D=%tsn*z@NN{S}x@Mum
z{w!|P)R6olk+w^1rL4fa!%rhg5lc2{Bm2f7{4jB~>2Of#c)1!Fn`d^Msec2J%oJnN
ztV2m=Q%8wRV~gxwTm*cVdVGaZ3i-~NpzrRfTtKLh0u*tjoUK^E-H4;@X}j1S#(?v^
z&?Ks@r%v=$!=JQCWf7%2YZ6{n6fTr&b@$;=NE{E9HTY1rIaY1ydB70P+Dpwn9`|(}
zfoB^v9CS5-i&KrV3M=785DduqQH!SI?zEsOU6x-Pyz{?<Y6$S6gq91A0w`t*T6d*$
z*nv+w7L61$9=}#^^mD%37pc@9w?3G@c`87~kGYxH-hb!ze2Q#ntj@C~vtzrHvrAE7
zo7cm4ZGD*ca?2{|R41gDZ*t_fV?O>784a{{DCNAn4l(wmFY#0NuKk<a5(hWSkJV6$
z(mm#Gg?C@b-SJ6&eYpa#frh3?oT<e^bP(=MP%|5>qHqYdf&VhQ{v~(;_>oxP6AH8h
zs#-pF$xIMotb99oeEZ?KMnU%DS~<z-#9`m#8^ql|nb!8QuTG6A3*?^wSwphvQf*E%
z^3hx7bjhS%ItjSi<a`V59L6u?&KAGPRh^&^M@m?dHt!Yi6c4%gwb-`3{rr4NMd1o(
zV%MMk=wGOOerm2SwD>;rX-+)bPf~GAdFmIAsY?6m;Q^!CiXi<Sm8cV8me(#bHBzY4
zX*M@2X4Uh-xnQMiyRzEPUMuF4o|w;uixk9WtVff*Q6>s7cqMv7Z1!o+#$?gY{%P^T
zw#Dk1Tx6x2m873;u_c<XjUG0gU6}o?wgRb`b4*Gc!P#EOHL$g??ZcgwQaTg*KJl|p
zqju@ji|$;2@J6+tVQW!*o5!AvCQa&YC2hjGe5{ro7X?MKJCdlt$^0EpgZFcr%|lQ%
z>PG)Y$@Gj~A+|_*c8{}mg<&`faVE1~&6{KyRn$dU$~J!A+ItFofcUo1&b_7%JPH<<
z%Sg*264)^t=LCg@+@j8KuHeayrgL3d*8(EeQe!?*%gVVY#0+ToQ<K|~6%P!#cGX|7
zrkGrWR8_NVB*l08TaQJY5Hds_fjE8*@SO<dMM87v$HsQAOK4<qpWHrjb6|i>FR)i&
z_I<pw74~aMS*KZ;bKBt%DIMene+5BC+W1cY&8=jw=I^z(-Kp$SU`+$K;)c6<gHs$_
z78)|ve^5v@4ajTudwMb6VjK8)R~4u3P}AfOyF=3kvpd9elv!u{zQCobVHr@{yu%`0
zhkHdjo{!ToMVJ@r{<b>2PM>7e_QQc5uPCH<g@%N5qzsdui)6(`6Y_1YcLqB`HW|3i
zbc;3QHEMkk_gjH6dj?(?oph8Xu}x{LS|NtbbtMZ#Dz|1kLz?I7oyeZowc4uDmb8S_
z{Sj9=l4yCwCEO13e3MhdL*^>1m3GHV%~&L6!x8Z+V0JCFG=`$4`>O+nfu3rFg<d!>
ztz$H^d42irQst+!Wuf{W&b9Ek)5AUL(6Rh|Z&Z@RF$TPa7ZwADUwJ31oi6)$sc4`v
z@7!W^rEb%D;kRa0I%Lb%a3RQLew*TXDsH^dMb_}qlKy?RpzkYt4}8Bj=NaXk<3d|O
zg}4+ifBEl;kz@#YyomgP)a>fY!SSQ%ytZWS2fAOh*{m#cMSWcRh=G^wRn_iDdS}MM
zZwnX4pVh7BJKA&_mKMA;QJ*cw3_nl`5|}M;A<3XDOJHgK^nT?YEtV?w<73tKj9C(0
z&*!Cl#?+srj_nnh<=)iTk{9NeH=z23r+^$ohzzw(4^Y^V_+`%flvx5A_X%!&3A-b!
zx)2=}?Xte%@!u7&7ZUo}ttTbg<&p(_P-8yj><8ZM!Sp2~h{YD13-QTYUxIBVepK(x
zD+vi=?8Gv;B-7DohRUln-tS}q0N+LN>+co&n-(V1+C(OE?t23^-R%bq$;OscvG>04
zL8CvD#yS*svI9-&yan|Byap1O#q_M<)An%GF!Z#kGkQs|oluvJ{#4u&?6N^Ap1lVW
zYA3Wr<}2pWd6QA*GJ?o2zlIi-qrFf|)CFm87Hd?X&lvYt%&>F(gld&6%Hr{x%PJ*l
zmb4iF3}QNB3JaNZxcyUbK1+Rm%2(Fcj8N4NOC7}Z#t$40zg<Vkg3(+9>6?cv|2!c-
z{_t+cUCcdnx3Hk+@B+MOgMs*Ziau&2Pzjk8k8~&N2`u2y(WDZai<}3}B3JKRqH_B4
zH@M%?0=io*J`Kr{fA_rwxE`C-YTh^z=5#in6)Ca>;;r%gQdR>lGn<~TSD0Y=UB53s
zEUD;<&v~+!tD>DapTZ@1uaphS>#MW9<Er^QV}SFCKbA@qBeU73IEH&=^d%+I9TrL8
zJXi|7nFFIr>X5dYbTxM?xXw9mwEhUiq(JXWicX{gj+&h_z0Tqo%;obNr#$cP38pr{
z?fvh|zlPEH+@<6d@6%perLyT@6vSrFSkepK*ktqZN$C$sVODN~sU2Jk62|X_mv{O;
z65#fdpnz<r<P?QqXEqS0fLEsTKaM6o@v;<E9ckHzKFQ;o>AOu5nK4Fl(ezja@Qovi
zgaY$<?|-y?v6HtSucf7-QEiRIr*XfS7vz)9=uKl8H@bwQw7VsLAtm%x#sR!f7ShxG
zawjumV`weHttJbbGmhBW0&iTT&S7TpeqNG8vfBriQO8LIBZt*7Ng+D#X&%6sRe|$q
zD^qJ)yQ3*YEUEqk&UE6?^$q{^f%bm;^rMd-ko;zz!F{w(8$In8#tZH>xTF35au)uf
zE{MIN#m61W5JyVv1{CCJ>WBFYq8Dpxf;tvk+=Q@utbKozE*>l>$+yvj>S!Cvbk5H}
zDTdv|b4wD4KmCz3l^>^@oRy-t|5?jJXr>S6Y%yEIl>~w_S^BMJ%!GTG^9nB^Xn4TD
zz4!q-(aBUecRObrx={O@okmOFsM(&rr!6ot_1g->Q)Bczq1___hqfm%-IQiv()~*e
z|6-b}_uCL1a_cchHP*5LUgh5zO|32YOhVqf^eOwFIkThBmi*C6jY^no)C_2Z;B>FG
zKa7b-KWMr~5>1A-v)5D7SobH3XG*bd;-^d8&gdfAjMt2sJlYps8x`~SOpRlLEZdLP
zZiZaT){5YULX$<UucTcBHH&A%WaVgw-*fQViRn-hnN8)6p==gMdb^(lz#D?^G(-|a
zShY&&r4(vV_x&7UEsZJ_S%ML2>1lQ0abyuJ>D|#2=d_82{0^%hB|Ym0KStaZdSSu6
zz^Ym;rfzwxl_aXhRi<jX!|@~=FF2!W^5shVx|nHtKu=fdm9B%Fw>e@q=CypLw8L$e
zqs^74W9@d6e`o=ua4bpUu=}jt!B_O-EGUvrJi~Uzwu`1`^-l`B{);;M6|+mHK(4bk
z--k*EEseYp^s3~qlb}>le-M0TZBP?%k=k<Ykk|HLv)UF;q4@2^O~Y3L4a|>CCoxNs
z2%q9+N0MjmTcqnrWH}z2vTMixz!^`e3U<q9A7z3w`;7c{81{u4ToQ-!xH<38o<T1p
zAL4pRVVHvw>96bIE$fvAm<skF_F$v0H*R+nN!HBCT9yRcjI<jOq=t=y=(sQ{A||+K
zi?pMOSKn1yPQ;BbQ5pxB7a=^HRu*oP^z!gRh;V<RnSFXZ9+t@JLY7wWd|whFv66Cu
zOEycw(yGSMXy$0LrkX=ZnoA?{t4@NAmzI6ZvKnoWoSOtGP7*#&_OZr6e;^ERL$97H
zjcP4=IF^EnK+neOV!4sZztL1fiA_g<v*kftgn~h4tIa|HyPYqS%P*&Rn`tZa(jFc{
z!Wh&_{lWaVd*=a_4>#+JDN*jlZr!)}V3|0^rwUQ+!!{W3ogIqZVvD8+HZmGCbP=BU
zolH&fHcnnBPQMZPfJ?!L{yvQ@hi-HTyJma-E0<{Q_wefyt#8l;M#CSfbW3UI@De;!
zMiG>}FwWo4XxvGQpCN)md)g=2(@I9q*oT#(^Sa0O2anyT9T1Ns>fj+)7SaEFpn}Pt
ztUCQg1cCwwOb>-#r%sW_Y#T(|^;yoFw$%OE)zE$c;``{x6wdc<(4JNdc7OSvg0`KF
zH~{lP!#b8S))(FBcAZP7ikPwSN@e&^hek_UVqt$dkHl{P-wr&3*4<5K@`|ODPvU`d
zrjMsuf~|J7(62<4Ho!kFLqe?-X3lM&1;@AH3|Z1Cna<?{g>_n%k%B+WR77hBKk|U|
zJ@;GLX_>g`)tNu_4|;Uydt~s*Q(@;#ifOnT(>Uavp#Sis{>Gd*RK$`mHht7HaM|w^
zQh44or8k==naAM<33aZTEDfKziJh>Fc9-G1+Tc;DrHI^ogrz1!YeU|}D|vNzyfjS9
zdWlH8bN9e}i7w=ECV4Htl(JRxAW~^vQq1y;sRwuB^--NXhFw=&9_of>S^(mGymwFG
znaN4hb*25~yMfOHd^RB^gb@s9yr_vw*7c)Q=X4OhToi&;xr3>!2g?mgPs~B8?NQ?f
zbcau%*Y(=F@^O2R!i-K`CSsMGM+FJrZ$1aaKPQ5@zkY^|mK~iWj+&|9Z|;@}Il>-M
zZ*SJjD{tr4)?bz{?iA*EWYdM?h1ynVA}T8@r<=W1f^~ig$EL91Sq0-azZg88bUT|N
z1>K+f7OIR!e)|vww-<5}RSH3kI&SCW&|)J_-7K~;GMY^(`*Kai)Yn!jd;gX%+@DwH
zkK(XEnLp;<FEnh**U8Sc5NKU%Yil6-wVLTA+vdWLjR$D8_2TVxC88Rf**x;wEH-R6
z=VQ6dHG#<YD%EasY7rWcOoqA|c%=pPA@HZ~Oo=v}%g3xp*>C>&8BAa-o;I2p2rjdV
zm4cfv86!{$xlL?wIMvl;PwPjZ>%JPyr2lT|n$L89V4dAvs_Sxftur)rhc)yP9o|?9
ztB*G*p{lRus0QY<EmfH_3PhIRzl$<HU2ZfPJ2k|ArKh1)bkF~JIRvRtO!0(_&kih3
zGu!|9d9m4pKe?W%CrgH88qSEFpjsQxxo;8{_H{jI5W0m6mrVccPsH;(06t8OiB57Q
z**awMALS~-=IW?)jG&x>Xj*b`znxx{l<WL2K9Lf~m{S+^pAEF(97UZrq_tY!y4|U1
z(NDXs9~Y`a3)NM@I0QUhRu2vkCl@k7XZmq((LB1<p=|%Ma6D1F7kDb<v!%kBXzy_K
zR-B%)Kfw=$EPb{C_q&A^?VV52T{m@1&K3mn7Z*@zRl1D4zKf8GIvBhg`BliHj@ohQ
z$UOgXu}zW@)j{$O^>XiEplwbCu~lV*R;z{WB=v;<)Ho*X4*Obk@PNiEGRma~vkK`2
zjEmYt75r1x=HSWM(^;p=JsQpZ+n)u|poIOeBHsAK%vvh^Y|$Y)@O{5jNrCa=YID~4
z&J%lU>&6YPjCRxjGh7Sqjp7+vq?J#z%1jL3&W^OnUEDfvR2LeGIv{e=aLuevGSoY)
z2HuHQ1mGOi2@3nY^S$6|(QW^3lSx3J`o?WjV*Yl|{cGz->_mZN2ATa3T@tesp#MsJ
zv1HQCk;JL6U=g?|DmpqW#osRA&c#m_iL>ZpVOINLWUi-*BJN>-BMCm?#Dil&nU=iX
zb`IS^>)4;&Zx1SR>%MJaKub=7ad0X>^{iL-2?-~?%_fq9o%xZdIOb%@1-<Rb6d~F7
zeIo%i!s%)&UKvP?*F@1525aLh?o8HJ1=sd=uU_X)F^(h&reT@T5n@|&QrbIngs%gD
zYqyh|rf0VezBc}TaQ(c0`Ra=Y_s6oMiqQ;UnO;^deiYH+YiKjvZt~nO%EM7u7nu4i
z<O_H?B5o;_^!Sy4MVlS(xkOEgEnIP{_m82lKgn#_JUYL_a<7H{qfzlWWeXh6uDVKq
zm?j<O?U-_8HDk8_nDn6JkT<i+{;*U)zBcR1qUat{>_n;`gddep!3pFX&>FxZgqWUR
zMfg{u*Us$c<8b#4pC@Glh=~z)jC=^v<e3q;3O79;=P?9g-&YLvQ$gc6sl}LY9<j#2
z70JrkFgzH@QwPZ$Vm~}3$f*g{6{b4HcNctNX1>|$#zYWdc*RJWl_cc^VvctEdM!J3
zX}`3_t#F6Qpd$FoJ_A*|bq}zO`uWy+mmY&p5UG@nmDn@_-8=TUYpe6OR8g)<nY-nH
zF?GFNY7CHw0y!L)GCbx}ousf|S?2V0bQ30Xtybw{VzG*C>G^0TTBXy9mVn!_LE;lT
zu&&5H&B_+C^_&&B_Oi6P`MJ23B}d};dHQiUtvoo-pKfqj>Dhj^iGY~Z^y#DRaiI-<
zAj{3-<K4wxNS&dm+L3VVP+mJbt@E$DyW&WAX`<HbgHgAEuQ>W`5ANNLSeH|%_dK7V
z?o`b>^tQb@9PRCWB|u47@2qh;sKM#<m_dizfuX0Tr>psFCeS)d+enIVHK~8JkMbUJ
z0_Oy`J!@xE3tN0b*q4mVZj;euKyJIk{GL%C>bZ*jkY>uM;q_E#Z(bASCEePWtw37d
zxop!u&u+|ALtSI%@PrU}f8^2qdSS%DuHxy9Rv=VGmsqVTEg}oD9-BYUxWFKl>nxOL
zhD!6Y`6tDy1Je`H3I39QI?S%!f4@KJcr3#h%Gej)Pee|3iU%!!UKVZeKfje*1cfxO
z5Y_8Ls=kGne*1nCm*_);aO;#8b>pxh<{~G+m^}DqHqq$d7JU1@+${9saPs6pI*dd}
zDIBO*Tj>1rSsX&x>v*tB2Oq*K<MS)}L%7H#2Rb4k?!9Pyh|U7*AGrf=_TRTs;1aD9
zP4PE4*w{gEY`N3V0QT4uq3$m26CE<ovGS#(j!Gz$47(^n+ozFsxzU9JcWda4kjIG=
zIty)o`;(Rkld3TBDRtG&9%_3>tM`!GbSV;TeyiRN36o|uy^#dr1~G?mn|VJ+L&S+k
z9|4!=4K&76L2}MD;7leixbZTR6zXJ^P0m$ei%ckK;0LRM6Sqge;Y^EfJ;%iim%^~g
z*}A&Je2bzgw8~!LGrPk9k4n^tYQ1{PBffM2`!9M9L`A>3p-*tKp%^YDe?iq5aNZxG
z?reVJs$BlA=JU!IxoYe{I@#DR_%ziFJ@F3YJ<p@L60|XqXG#=0)tjN2l1i!+0X)Dv
zi#b1mDLFOFGVON2_Gk*$>1s2UP~BNbOgf*Sy7c#LhGt!OLxaA(jYjL+1JR5Lzx`@P
z5DDv4{x>Dfd&0IO@3O;Bx8f?g4K6pa`*_1?6+I*pna!khMv5_qGdYB-Qwa}VtHJ^v
zr!DjDJB$pzrK1!M9qA6U1VEdzwMxWP_J@^}*A`9O3ofi@7S&$cZVRiIk6f!f4Y!Zq
zC-&w-BucHmOSa)!02L9pa^2THtN<mVNGB7_7---Q5&8+}-jL&+55AA1P!|VI<-#jl
zK_<8&17(v`9cA=qRNBURpgCOGshQTV$kg_xLgxT=AWam{pv?!TjvDH526Ai!oj4H`
zt^d3jlj!WagRoKoJ+IzSDpA{P4kQra695jz??y6NQ3f42#W!eCJAr9Z?Y>6<JA-yC
zjx8=a6ps3&L*JrJ7nS^v;^&fPwgPo0=o}SF3Z=5r{q(vHDvs1}dKR1TwX2O2o!`YR
z`F!ounZ@u=_)0N2nNdd>+Zp!cxZG@nqvp;$S;O9*949+_o^uazbbG-NH|#aL+d!#<
zg7*^C#Y~e}mFoS<-7^aOi6`}56K&g^@o3e1=z$@(It~73G|-15$D>(8N6B-l&NV6w
zPOr<o7fpb>^|X+ibGlHMXG6FU4<M+qTIIL?`f3*}oc|}Z5ew-}@0SK|2^Bww^DCEN
zeg5*!l_h?j6=YQz;UAQZ7h>>%HZ&aE1YPC5)HH&)@q|&CuMzzrtZEbfg=ngxY9Ebb
zuNeF9gUz>S^G+*#AW~mvVnJr|zOqvD7;+&ZjxSSQRozDi6o@YV^!Z5VyxuP#Sg3Zg
zyMc>$zLiEX_qi)23O*>&TJ@2d&0}@><E2l6>t5g%3}DdZ{i<4&e5WD1#~r__&1Ayo
zR@0Zm@#dU(@8D|C<(!F)_r&Y|X85>aQH+T&S@L}AEv?O}EbW;W{oU(1<M(vpx2<t&
zT4;v^8UUlV?FtPtZ3~i#jW{zPga;|35;73RH*J_-_~2v4N4QK)gB?-fnefZs;yMDa
zBsw_SJT4hJ;9fQ6ncprlgg$2pI`dg=1Xe$d4Y`YHf@4%q9d=q%DM@ujjt|O8LBs*u
z6xt6F^i=&ceUp|ieVW~0|D1<jRJwu^uJme8=r_5CAw$U9TdL(02Qg@IvZzic4e4(!
zUwz1UYdBwU1p<=$`b&Wgn=kkmKHP3!uFAbw${jTx2w^l8_7|}wo342H_0ieDN4Vwj
zz1yRhzABC{;iB@K@`2i<kqxq3t>Nrese>k1Bv{e8&UJCG!l;bJZn;6cYp2@yw-via
z(n{oxVXOCsGkKN&`Q5hPH_dxXxva!4Sb~JzqP`J8S9x(jB6Qw%+UjrfPZr+%lfb7W
z3{e;sj)|=FKIRZi-w8BB_#cgSmI?~kEO=C+&Iwr~H_x6Q?;PVisG|iCWZ-}L2P2C1
zgy_pxWwGBPkdjF_0u#yL16Tov@1N^D-f|fEJY|Dxbi}VEoYS0>M(YouN;U<07~?;!
zhQL))0Sx?3d1%M7gls}^$Usg6WzpR}%;MC*Hgu|QEIb{~b2pviXPZ^^ypn_x`i_M#
zYBBK9APrVJ<*zHb%iXDiOlXql`3NwN|05<xlv#(+{U}b;L$7j8lkhM<W)+aTh*1H%
zL0sjdBk<F8ofv|QdND~fLS8F<$Mn8=&a{c+|DDwz?PnkiD1&;<Mi0t`>^P-PUl+p>
z^0|-bRoQUEq`WZv^ofUNJ7YuxTA!7}wcZR-@&z~l^6;!yGz<BMLmE*vni+ReL!D(e
z)r-}UXaz8puxEUftTj7yC(W3PhEE|jF~2mohUHkl;#ah`jPGGm$h=+FU1?ZMJsBbv
z(#udCHA;f-retN<Rt#*C8Kbw3&niYr7q>s6sFu*m)UtcJzo-w~z5&gyc02`FWRoA<
zM_5oatr1~UG!@f8`eKsJL?B~07*(t5B<o=;i>8I|ykZ?vr|<)Vq$9;mRQSL+$|17+
zW~vME1C<!~*<_66)flc>=c$snxl}&S3DZxq1#=O^N4xlfspys75Qk@74<}I<1mC-!
z?m34xzsqa=*s$ca_GBg^Okj<tY;8WgZxd>><=5vVo5#Czo%g!5P@ZjvPKHbG!()8M
z2&sHkTTL2cKZ8upJ3C^-I1JLA`wTECVs1Z+(q_t+z3{U!;(Uf&yXOVi@29jp@kI(&
zT49i<kB&F;4PKky>mUtqOqAd4_Ojhia|IFKpq^DELKpC!qIREh!;+yYnt4VnW2{FC
zGeIR)+$_Pt{!>ix{2x9}btu7!I7aBa=J0f(GU$kb*lY&OXwprpouz*<ER4>sCsmWW
zD_1<@Nt9;UeuGj2x=v@Z56Hzodb}<8#-K?9eL-NxuB6p#ii+4L>GgFN*6|dGzYaOq
z>64T*;tAEsYG1#@vV>*B{U%T&eg7Nd;^svfDxew&>dniyf0PZ;5s$t`z*EK>&>AO7
zGe>Lizrp3`_Y+jlgEZiBIKU+0MP!x4aM?l(BZ6-QXuJF9YNG}Wqym2)@I9J`>ZB>F
zhHif0retkz!e$_~KrxU+;N)3(s73Sl7p;Bl5^V2Ym?E8V9O6%Qiv2}M^%Q^I<4?8`
zo3FzUY^9RBgH8Sl>-iXp%}Tt~TUxa9N-@jvFf7_6`~O%jgav4}5@S@kHcQvD9GAfN
zh+;8Q4<TY4WCzx}HN4~0v6XQ0n`f>-A{47@G3AxS@tz!brKWcWmSzNf$gDpUU#erL
zp`}F{f>WthS62^3x`3=&odM$A)umL|S9L!5iE#3b6!_<-YS&3V7aj2c$U3ZZOHvQH
zWF&=47&PhQBPYQI=h-Rs!+Cb~<3Teu*-iRrMU)xG*0&U^S4~yBPwV3wkdCdu&xZ{_
zN6~e^j;-~G8svGWs+AzTC{ni^;&ia9j>qJWOZ>L_Y*LhM^(-Ucay!~wMgD6qd2g)m
zy!DqPY)G98l0BW_#>ydI(KW&uXzhX|z`Z!snqtY((#A#(Zyu$f{0n~2yGK)?$^*|$
z_@8;8aI3t{GL@N`8MQamZk#y9^m4n3L;i;Pm?rw!N{i(N`E9hTF5QFNkHk1=5_**c
z^DI_Gl^@vw2e-<v=pDj%bczV$;(nGn^LsgIgC9kWr(}fv!Aq`O>kxCn_7F4}7a$t>
zUlXOj;sZ}Rcd_EMKFnGv5J4Z&#!eEBgBAh`&8)O1{Q;cS9_`?B+lTiM5JeR+j2I`|
zX6kJ9NX(*vK5Ij4)(l_iBjl^NV_AZzEUBE~C)3ST%}}v$rIk0_M^I$W7~AHOHzB>o
zq#diRPI{<1v@CQ2rO|KuB*g<BkZ;hMT#{lRB=4`nDZLah27Y^O4-ch@Sbz4eCRUQ5
zNi}L)|3vp_neFuV#s{1rEFu1NP@KoLFcJz7hDV-mMlSwk+P&Ds%IUq8fqqe-Ki>Hm
z9k-aP2K{oA6HXTp;tWP&BlSl@3a0j0eO%v)vW>WvqV(e-Fry=+264TVSB}7sdj`))
zZ|gwfqkDATNfLKM!6&M_wX#0#3A%kA*Nd7z-q&6X>?q^+=#&-ZH|P?Pc3*$0pX|s=
zkeAMjB;_q>rJu1^_-aMnIuZLNM_T&&vR^4ynvkt1Sdz`}248Z{(2MF9RLy}pyL@<C
zJ-WF!%@n!-s9yQQ=AIN6d_um&Q)jJQOa%_`-h|O}+!NeCwiJuT1)#K0J1N8Wuy#Kj
zB`ab}h)qe`7dE;Q-~mL3)7=mV0~)ghCY4K}`F|6HEj&R`!yWZ@N4kDB+m21;EtlI<
z(CG6?V~`XOQFC(>@;R)$X#IlcdiO3FaH8}8JHX8X1#UjxNrH#>Ag0SWfm=`M&l?6r
zBXhsa|D|XT$f1uvet`-zgk<7f{DG?%lpl@~U2Yhbv!=ThRKX*1t*J|0|AkJ#g_Sbs
z<MuVZG#fG)8=TysDy%Ox%}~wJjW?;8`AF5Ae3Dz@0AZcM-X0qh-DuS{o!UlIWVF1U
zrQZN##MqrQg4A#1R3qfUFTf3ooONJ=&@1gIZo6C)xd~S~f@UzTG(G1LT#4{6sL#!W
zWZ%pi>~rU`P!pT1XRUmPT5i;2nw0v5pvze=`j?sDVB2J>nUd46nRbfrkZ{o)QopTQ
zMccsWPx~h5B&T2~8LNbCMj~zEUHE@TB<vuu{3Ya;sYo<&Fv(bz>zKri_Azo>^tHrA
zj8J*URvOvy1$h!#KkdO+tprn_Mt{hyb7$MRr$zJew%g#;6c+5J{Q^uOlFit$(f!<!
zC;Krxvy`#*a&I(~qFAE{J1YxNiKS@@*S$vCTQ$p{y#wQ?Pky?{yIq>6fJ4S7Sopv=
zqK8R&uwW^5hbNO{_TN1s5zsH$6pMz32Sgv$BtB_nMENq`mL1=n_*5Dd5Ft_8V))yS
zT-pNTh*UhIT-c8bbni#=H_$x=mtR+llKGwj|E+D`ETWQIJ;eJ#17Ab&Ju)bNS@Y0#
zMH+YhaYDx9S2pbxkz?m;rnnvVrnIGO3JF00N27;-Eo90-iIj{bm<dp_X{ok{rb|z*
z;7j7+DW5~HQAM8-=*jful+e}xAoGJ;;^^6Za-_dkZZoc9Nd?6xyAdCOF@?x}QQpI-
zX;Qa(_g$LWW_>XK;{^cV?34A+9(@XakX>B$zb2n07oLFH7|wUgp7-av{jHjUMHEgT
z^4Ge@zcj*n$)u~IHzzQJqVC4m7gxi7&fRuAfsZ)qkSj>0C8QBk>!gXKh3%P(ra6XE
zj82jsc<)>M>wq?&M9GZ%=4Lq*gnFRi{b+G<(E^~{4T4DtGineYA>pR^v=E7)+3)JJ
z*qd&E5$u*_mcoZ-V7qOK>)|CT9y^&Vb)VCPQiAVDrjypGwFUXz?F=JR^H$e8K&zv$
z)l{@>L>6V7jBz#q)l>jrKCuh&OdhDr_IciNy1zY1hR-TBN_y(yT|guLsq?8Mddn!x
z@+@^j3Jh+?bBa*KhpoSA!=nkRseSn^-4{T#%;{+W563?49ZUT9NI{pu1?il(-WK(L
z3iM9|#wso!P~k?D==fKBMkghdR>BRU=brI5P&>SNK&6O@cL!AL+tC0UG(HyD;b9*Z
zM@irkFC}HHq#jL?C~$COqi4KGWxg!3+)1Hrbb%?hSX$52DT+%QA8>|d-kpH`5I@i(
zHzpyi<EWl&ipq|K(HBAXvd0X`IAo&#GH;%$uHDYx(*K9k@KfM}WZyAf-~v*P+(*Cj
z3usWoyg-B36CXV2&YATOWc_q|W-u5p#uR%0px$K#!l7FLBp4GZoxm74ey83?M1Lv+
zil*X2rj=~t9#y1?W_Of7JvR8&RV=~=;r|=H<V#w2|7P9(U?<_8CTUu#m+-^(gdBcU
zS30RXAtD~9vE$7Z;+d4_x$~vR-5on00hde$xp@TJLv+9;`njhofQO?K-QqQh1_c6a
zJ!QWHK3D7%271RunM(wa(C85Xqc{Hyl>4yjs3RQ!QF-?bB?Mw3JU&|p&qaDrv}e1<
z&N)#OpXK0=ejH;nqAMilz2jCN<BlC3px@_SOw9t0&j0p~LX@E%rWRZ4)ukjblLq@G
zAhCAIjf$@s#=FK-v-;5YeA(<Gg0l&4x>{aB)OB$lFp+9<P2mKw9vX5!8l{g!xrA(Y
z`RGxgggQCo+0Cgb@+TtBbgndK^U?af<?Mfo3P)VTm}?Ei!X{I-ln+U5@~OnqgC(U`
zBP_r3bF4=!SGZX_o&Hzj-hnQxgtDp1%tc5-MC4SPB#@JAWrMTQ_0gfE+GKu;f@FVL
zqyuk;Nu*<VXDZ(;8aUl2o%D*Ti4AP6b*Aj|_<qi#_W9ED1G(SwGnpt!Ami2j)<M#{
zx$TA?GW59iV3$WO$LCQmrwU1+Xq3a(LD?TDQioxlKf4aV;T;i>4OpOWKwnf#+76@}
zN>_Vg?KrC9<8Xq52oO|dNF~X1tf}ImHc<i381?SVMEbJQWk9M{d!5?X{W{^#9QofY
zpJgW$u&oWbqDeUzC+&VUV>-c1uS4HPdr30(7F3gK#`X)DWuW-C2ytA|`!BO6co9M8
zEO9^@0_8ioz@MJ{`OUe?;~QVX<Hbxc7<8g@JPBT}7k%9nU3hxG*#XLyJsexcYXIh3
zi&oAXAA59Vv4qV`;tc|<LttS0<P*pKqk?x>asm_AydsbxbkB20@sl_d3+hE#NmaQh
z55N-!cnVt#K=3hc_Fa_0(h_zO5|pdU<4-uS4NJp&&-CE2?qn0EZ^D_W);AItIA!%)
zX<tQp_t+;-+5lT0VzZC=C&z4`WC8V8cem<RqQZ{CgybAE{d9!WM4MZVZEr14wl1QL
zwVFWhn_oX&?LV)F%~`<3w(|(+@{p&i?gk3as3Zha501@ZxdcyhI?kcKbV^)S^f#a(
zMXnpPQ@jv_xbPZEyeuPFJiE22)B;tI@a3=h)yo#2-HZb3P#rH3v;T7xXA2Jq{qr8r
zYEx9?#{>|DNz3+AJ&2Gq#Z3Bz&wz<_7(!7ei;`+sZ#cS7LJ5p$Tlc-TS&xEbRap-+
z!(H0HDYU~4rRErGq$VA-cztNdUSwdzuB~g&kcwhY?7;Kadf`6~4B`afKy<KprjD9I
zR9p;xkG8zyU~wB<;G^>TLdI9e!5~ZUr&5%Y-G`9(9mB=97f!4w5`CRql%B%x!ia7d
z`y#-N->QI~)Z&rTNa{!5DO2!YOkix_Q<1#bxT(10FB1suT`Og-7$!sO3vA!;ZGlo#
zdxOp)BQHRwi0emL>_6j73_wY=>o4^RoA7_-dPrWq3iIs?d_ast{`Y)YNo67wpK^>4
z<2el3B+5vkjl%RMbM6<|(06Xs?UG->NZ`eKoCh+3$wt9CuBIeSC85L$9|<i}ebnC2
zQ_fU^tsl&RbER)N8vhmzu&imfzABhF5MW_JdGJ0yVX5C8Jcf5Omb^p*kQI*gq=X0z
z`M6U9HWP5YfoEn2nr7W9417j*)-ym44?K-rb)$}ZNq3*V8~m|5<|_XPuoH@ThGsJ{
z&;t`*7=A@MZ(yQ}$G{(7L=bIx?Y-WfY!G(<;sbHv0(#d7_k|mL0h?R7Jcw#O=>I$f
z;RSS0&wDY)aup~1KtN+B@=T|??O7vyWwgV4F|S-dD`p7qyq2epoJ!&7y!}cCFZLhM
zL|Eos{vIP7pDX#_l~%kz-dTrqZ!xm>#pQRJJ?Ao{hbB1<!9FfvSa_LXhFX44oVsV7
zD&x8@`;%R+VsIcZky9{koDv{0Ldg8}2i&dm;+FC4WUjyd8*N~O<^297jNJd!zfaW^
z$2tsRD)MTn>`DOS<y*TVwDf${k=<XfJEp!#=HCW`+^$1R@eu#YrvIEsz7-DA0e9_m
zn^W_>TQ)))B7_)$5Z6yPaE#WmK=_4%yU8)YJ{@ER2W})>S`&ZaSFDboec%(VH~URx
zsLg5Dzv4K4ew<2>=@Sk3+T#e0_<|mHYTQkxi}o<o%DvSgFwO(7l1|YM=J1ey@1Z%Y
zQJ=eGA&ADAaL?>p05v4)+B339_W0rawOk1{sNxsKG0;}WQ$RoBe+rdKs)1s6gp|W`
zzxdSmgzgCZ#NJ{A&IZ&3TEDQ2F-peBZ9(5eFCTi=Y8DmqyT6CnV6gDh6Gi!;zr34u
zPW3cw{1cZBU<4WUNeaa_h&uYO!%SMs&pp@wNsj*$DB<Ohu#gyVSf)edOA`s)EuO77
zbvJfMN~$eKIqZp0GMU6(&BllxQOFNISHkXrHr<>I(FMg*`1@8@RkWCvxY#G;M;a7|
zA2DZK2JP9o4_TEB6zG<;A)*b46A6)Oep;QWaY_GJBu0k>#2LGzqmM=@ItSZj?HA;>
z?%fr@1zyP^5_U3&v&%34yBk3kSR;#|`)xnjczAUmLu_wf6R$ZRpSq1zG5&zEwYOH_
zH~Y7~|3f$UuMjao01p2M4hhfwR+V5HACI3lk)Ba};^J|G!r5+@t7NPZb}bb;Kkcqd
zwKd(BbTr%o&-#B__EO`b2^>)n%W%$vsn5kmpwsSE7zy|Zj>;Mo?t8R7y)qko5$5rQ
z=p)c63L;z{z%tNNxKcz;!Fzw>0BgbdB|+W%ng~kE@>37r^BW{6zL<oa8)eFn^mpGr
zaT<p=xY5DaW+U$K92JKKz_UZE&ZYXHFT2w~a$iD;Mx03kiSIuPi8E$EqAwKKbS3*d
zd@<`8!SkT!L$7q~0#9$IwG@97$3G9y{lDv3HX;1rcU4?+QK3C38VXq5vg@8crz1$C
zR7HGJVQwyH4(HwN2*Ud{<k?&S3U95YqkoI>Z%Te(fIr4xgz*MAbmt+oCg#YG5V6T!
zKV}vfjT9rOYbjH})ANkG$67V?k+G)0@i#fVFNq=BfvmlUj>(L23dmaDdWqf!5cia_
zF+Xcu{S#aQw@ecj_BIciN;$yk>!(EgTRMEaAIsYMTTMKKw@#S0wpOPF_v6K7Ujap@
zkBF^T61l!)KNQ$MPiJwW0`0N43Zw%b;_RPIeM-?CpVwigYhNy&h~n`68lIKTVQszq
z_t)sWu2;K|&MmsyKH0a$J$<=)Yzb!Oc>v5r@NInR^rVHX`dn5INKVKvs9Pd*l++mR
z$URF`R9UEML8X(*?lsSc!SQR!<U`Nahsd*}Rndm0`N1hCpY)jiX@Gy9)1NH@0;`84
z<_ZVp+$ZOob0p3+F(*Z+gr<(MMz~_x1I5;S!JCD&^ILEHbTZ~s55P)$<ol{yQ~bXT
z;J<F5Z>2k?hT)r@6yHLJlV9}w27Tg$v+V4-!EcAl2(9ULd;)}vp~rS{H2r@U?LX-)
z02Q&R%yLfvNnWv2&<JbK;{Q`T|Bun=zc1V@NG#&m6l4_F=$j#CdTL|c<aa6LId-cc
zWlrPs3-L{yceJZNWD@3;;(%0r6B~p0j(?UM>=_G08!KE7*e>q!F4LU)=oW>mT$?CO
zef&IqEZdH<k5|YCVV;}S3viiVjKbL`=MZ>aYJl(LK$g3kGJMF(e^annG41+R8Wp_0
zh<rCPP+8Q(Q_eO;LycZlL;RT*#&dts*GI<L4X-8V<%FX_Tiv(g!P!;D18;8d{;mg4
zA31N6s|8S{ugOCPwDTjW#n%($CA7a0IbY<>J>1UXpGzh+SloZ0f&X5b1d#du{eapq
zNUEC-j3~{(4&r#R8DH})9{m1S7qh@H%<6jQp)NX8i6uE})lY2LHIdFx$AQ|+?jD-0
zgD%T%6yfx?r&mf0si;?P(ez0D)1alDPouAo-vI6c6nVnSe)A-z|EjI6cippQQTSC{
zA=x+l0-Fl2hqC^`15Bjl=gfoWW&h=lOyWh~N8ULL(MK@`m42550rHa|_&A0y8jr|e
zB_H}GCv28&Sx^%)WHXprux`Qn-^VA1fpm4eL;97d#l{WS74$i9{fHo1U$~vF!dga@
zx7^_yj<FV)q&wXIe-VIx*3tiY=KuGafjBkb;Jd0^Gy{ah8B+M2jFcjVzDfs2Rl4n0
z5+^s$=lSjx3QZ<oxP6J~-~^VeG5v}s_4Tfkpf_1RV-FarYZFQiG~Pk|+$Zw93?ft;
z64(pxH}87~-)FZz`Srez9ydddbKCPFa^MdQ6{|N=vNZC1kK)`cr*TKPK{vyHdp8|P
zfdK`ie*5_N*q}BkKh3Pp$K~I_Y0Ya%P6*3G*r5UX5DDIc!TCpI`dDj&QjeO8!8Bh0
zsW8XiD%AuoDEzM&_W%1vz$h;L>({xqxtf9rt6>bek<3MXulxF$F(V@|;!S8qtdi?3
zPp=ZOHTUFvCr7%8QubQ7_H+2gC>}eOMu5wND{lQIrr5vqeR3(xGH$m`OM?a}qQ$u3
z0sq4bY9%WaZb2m61q5^ie*PAB(cOnisg{C>59q;PLmc4_EbAi5A3g}M$jV~Oz{Q)7
zZ_qER{-?n;PPZ;IW(;_?J_B{+70wDo`_s_pq#;a7C9I}vH>u^9Fu5NGWpV_8shPkU
z;*me#93&J~jqhqHui{@zi=!m4pikz9FAEawTDVuIAHPnoO!vJ3z1#aBa+$usx&P!%
zXgYeIDL8q{PMNU4kOUbson_=!cOU%DoThpf<Nu<0=sN3&LYV>m`DreN+)N~9`OD1w
zDU2daxdq`2?JT@GTg*rF){hDC5cxXrKK|BQ%r_sT1|;(5EX^kUd*%FT{lRnwc`xx^
z%=ZUK1(@O1d8iI7#G6Jt4A#WUP&n+KDaK3NNrZ^PM+chE>X7*3^u<B^$KG3+^UeQ}
zA=9cQ@*gX0c5d^~61A^4PM!b359iO*#%G9ap5?iPT>H9kOnEdHyQFQ~smuv0L^B`-
zGT|E|SAP{v;~{sc?f1`E^Dc2%37qlZcxr!gUY6bx)e<yEF&}&Ntw`qxiH$%E0TIQA
z7@fz~C!dR=^gfP&CsdkDcFE<%>|lo5%HeMjqmBzl4#_b_zc8Jnwz8i)X4jbtb^ZQl
z85~+bppS+j^lIa29sYBEbs~3rGn55gf9SpmKZ`4HKwAU;b6doG&*}gD_QJkGx0iqK
z)Zafn3IE=ZLcFXtD$w&CjTXnN3AlVw1Iz;_8SycjjHM}+upiF(hkvV@bKH6k;<aLK
zx=33(LN)QN^qJvSiCNLBCPd^%lJ^55pFiw5WA)vd#h7GVXKp|IKknW;D#~T)8&yC-
zRKS1;2#f-<$p`|HhEbFtl5>_US;;x51SJPSvIvMU1c}3t6(kQRIS0uM8HO~3ug9(D
zp0nZXd*1VY>;7>U3)V0_(@%9(^{=X{tGZ|3ixHm8BM|QKhHM|ehkDXW*X#8tf;8V9
zlo_2inrMZ^s3F>Ai6GvvMxwf2w~6HHFF~W<E?i-bMODAQIO-MFby$aAUEsH>SL{`7
z)JisZr)|xY^6=Wzn!EexJ0tkGpDMzxlk+DWyai!2??~hcKjQz-|ApL{hwYuq*RNOO
zYjZYYdp0IA=JwzB_Aivc!n#kI1Q_3xH@U|<a`NI{eY?#yXVQ=U?xg<>q5ssi4<rY_
z{#-tye)aq`bu0fJ$?DGxE>dd|MmN99{@0B7-G3cX9Uos6v84Qk%z*zjrN5;^)Fw!#
z`o1scSr6KxHQdZ|wxPPsc?J5%$tqHJI%O9Gw1O1((}VEYl@xhLD^L27F!}_>+Z87A
zsp|aR4(<i+UAB|+C&9aqJ*c<WaW8Q1s^fLxgLi9o`Br9dFMfWB;3FY;*9T)Y)(&1A
zcH<lR^=U1R=Db7%UBLr7cjABc=Pu;&X@lA?Ul=&r8oy?J%wIjjbC7{G=N-HxyaFa3
zHhkqLuI%iDt$2*h;EU32|9|?*Qk3rP^`7mMp9xPAkm0c8KmP-9KK13{6$=BSw4MJk
zSBM~F33zHI0q1$d^KA3~?@pbkxT$l#4Z@Qu{y!QI?!%=w9s{^w;AkbXZJ@k6a$nkz
ziD$IM(cKxCf;;FF0QsI&;J@;;R$o2?%m?@xC56-8i2>FChl*p_XH}Db8H#MzF>S?P
zhN6%|-QyRMewz2Ollm#~kECs7k1?4zOM;L2oJH8i_zPF>pr3bV{6yBfDs;KvW>ohV
z6M8z)cRuEEEuX~wjN<<<feSZZiQ)vwM8zz>or~$q6)@y%52WMSdpq86?tg`dzk$G>
zhRY<tDvLYX{XbWyf5?jHq0gs?UcOh6pSTR?Rp=>NE)xD<f$KksBhaAXG7aGU@yWGW
zomVHj8*!sbbrfmjR^i?Gb$;SS=*3SXgfkIaFK|E0{{OAyx(NSswYXl1esN38QVBQ^
z69t<LY#zeSbi#*eKd_$x1wg_6*TN=~cNl91c1oO9b;>~F$Jnsj%9^)n&IwUzFxw$w
z#OIcTe3AqAklvznt21K%{p0Q`61Kv!V~q+TnpLx3dAi$DhB}{Yz<#r+v5P+U>scRR
z**nj=L?>p1MCrP`#!Wm{#yrM608*bhoJuYB!;QC!4q*8*;eU?Ne**g%9P)SJqX%n}
zf4-RaX~#gamGe#J;kAS(lL-LKF>yGGpYVZPzS^->3Ax5A_8;Q|<o2mA#M)Z1Fv}-U
ztnx7CozK3KgD@dIFa|yx-^%3<VRSbp#Qved|8F?z!-_{>;6kp*0E6&7u)Oy21m0cT
z%K+LdVh{eqPKaE5J}tNq1HEaiK7Hai{57)ou@oSFi*TOa2oLgv577a;6~=+r)orgo
zedDMd^X>&SRems#IMxC@SMwfIU4aUThky|?!*tHK&V2cJWNt(3PZ8DmEfvnR{d7zJ
z(tb}8^g$$IX-$5TpyPpeSsX{JHo;MYv!dw@%kEWP2sqBr!d8gMhKNT@8yYXbAY7+D
z!hLqMuaY0J$S-qG`1F1A*c=i#(gd7FqBEe66n|9C4R2T(k-S=`Z*1T(9MnBa7J!L+
zO>^8>$cS`LKG*t;UAPLKK=9#&120$d+0=V~6`s#GatIl9891Ot;;&6$;6&F!AJ;cN
zAyo*-Bq>hLo0oCfT{z1A8jF*7`MOH^^v8_l1m0&>*i%;LWEy&j6FxPU-{qd3w$oQW
zB3`mGAYHMoe!H0?O+bgQGk`u`((-}h^YP|xz;t9NOgNq&Wxq2!4ANu4;&}g<vA}>g
zKxBPtxzKPD*!H(T&1&2^f{2fZ_nw+J%yJg$wsh@C6TqUE1Vq-p-)g5-fpm2UKEmg|
zv_ANY7UBNQ18U|f^EKqSu@DjDo%ozH=HVCwo`9$1T}Jh`-B;oIU)?s?EHPQY`C-%c
zMBF6)Yez4`Kp$kTeM2mGL}`IQx;k%>L`Oaa87n^Fqn?-9cj1_^obVYVhm?|6w1<S#
zd&3?R%d6q9Be__Ph?htQNH+z$fV4Z(1UunFb`kV(k2GHE!3iJx3-5A2oaLdodzAeZ
zS0H3)UUH!u$BYF+R)I%=c)rzt%ND5IBcNuFp%mi2M+Tk33LwZnS;PrU@xSr|LUs@I
zac@@N4*vfS5HYG7Q=K7cM-y_p4ml5h@Bu?k^M{FN!{^59d5>zGPtipPS-fgN0>!bC
zK5?<}$>*G=WcNRct#^~J&{_}}ocU@_LIrq5f=8K?`vIRa<`|pMp$z6i+?p+r%Q3BZ
zVi5XMhy{Ih@|TOw#vl5EXkS}l$M7S-VXy1Hnh4L-Z0%w}F5TR7(ASLtk}jLEj=LPD
z9z0r`OM@BM19PL`<{NS%n3pbPb~7B!{&b!U`OjkZ9d_S|%4J3{rW*%-*oD>y#lIU=
zgNKLD&v$cAmK~A0x3?&mX}e01c1Pw9PDjYz;ZZV{8k5#Scb(l{X_Tu9Qv3AD6MePT
zMraloqfDywThy{69OXpOYbE53da&J%C1!G#s2H2-cy=GMtM-(S!yMnQPrvDA_3TRZ
z$~lC^@_CdkVc`l30~W^LN$oImNp2~HY`SI2TVj=~_SnsiR5uEge3c^at4enV{94NN
zTytf><i9FCEDRv``8C4Em1CiMMI1s;fEe=C&vBDmmbdJ@DU&9S$?BP^)D58&(ghbt
zPhbu<X(G?oc?!?rXKH19fKK|7=opPhFqX;D8{?_5lC`YcdFT=t=!nc7#}@`L8RPq2
z@*X7&FwN+W&tuZMo8*4Qw9z7$El{);R_j}~15t9pFiYNKIX8<!)dHtcXmY3$Ap=E#
zPN8}1WK*J6GPYd6F5N9ux6FpOIf{kRmzX^2EComNJg-G|H=76%FjOZZ+u&#FKJeU$
zImQopE)O(~40_uy=$N_f?VX4B`C34+zkatzL-xJ~tw%+o)^nOc&s)9z1`x;XFhm-L
z24NOMH~?j#=CkVXfagCxutXk|p<6i$!!%ivVh9XG2GeG);N{O{qKc2|vd`FMU<DJ}
zgB6a$TF6)=?9*w3Mg6|~iF)Y<lJ@wmMUKlBqliboEYO|pvO*8PzQ7ocrh+Nf3c;@}
zoYgE$vWXk!dNZ<3C^Bl=XsIRSmUX5kGQu5$;V-bRJw3zRdXP0G&8TNz)W0-PnbDfa
zKf36d9Yg_$xN3vv(^un65`=ejA`=+_B=*^}ze;@+|A2~lUL>lAWs8iNqqa5CAL5PH
zm?9sMyZzBKT;=)R&W*|qvRT&@X{)rjYrVBT(>#fnKcd^>NsE`?1iug<GxCSXCeRAn
zW^Mdq9&8OB{CR)xs>rbq);&X@1>wu|hVxv8pD-WZ5bgX-+~(>V@jCIj09iRE26Hi7
zpwMNDz#!7=%-VDl>n&EVE}^O(uXm5)p*map-G4YP78lI=BX{jN?PqVCjbZz~FK;7^
znT+fxl;Hn8oiw)c#OeD04siX5JF2)aS70q=<g9X!nho&b8kLJgAI4M__0<F0X<rxj
zq^n(3)!}5v%RjY75eBVv1BIe041$882?BPijthOvXDPr%c1j<b2D)1qopQCO7diCu
z9}bA@XFH&$3tYRiY!5xQ-Y$x`Z8pDrbqTX6SZpq(V(50Tw=<b9F))uAL@bA~Ya!+i
zQmPN5o$7-+_tU6`%N_aJV)Qub>zgh1b@`pxRSME72FhcU+4N)!jDjN$4}|E!_o6)W
zs;|2p>`EtdaNkgLt=M>f+rkw-iHg^fO+Ju2=quK`DVx9`%C48PC7q>^Ca*vDJr%B;
zsjag1V2000#C74N<xr7=-+4ObdEJVAW!_f3`4N?e(WQ57CmT5=LJwF6OZHhhtKM?J
z)$+n~;(O6bE|&s4wo?ex7x%ZMKHodV$jyC^gmzEM6T8U2W3c;3gZxrzyRpr-5Sd#o
zrne=qo+nE_|NY!03Z?>!t>gmh{nI=4YnS^GUe)_+Wi(05k+-cn?$3ASuy<!EM_2^E
zv;OdjtH0bP*%IqeevXz~J0$r|?v@kZP$k9uK6)7Lf0<QPnd7T&^r+V;vlX4okjuv+
zB)nL7b(>zX&$&cFA-v$Q=I+i^3_G{y7p!82qm@gl7oEpBA9b0#$0#an>@{$BbWa^?
zukOJh>OkpV>gO~}wN&-oI?&t|A{*=^@-OjPdv=EBx&IQBkc5`|MXE-j5ifuF**eF$
zuDgQ5baWBHJRPCNtg77^aUvEUqL`I5w?udW4AXa8XD^x+w(PP~_dGOGjzZ>|Bx+55
zCS2mjdrPCUnJ*YK!67}NrPb^sMwtF6Q<2+n_j3Ny*MSC2a5ZnrIckCC`7)glS^;g%
z+cwjV@x^PuFjTd7k^6>lp*!CWeWot^=Vs(Yvx-HUbz+>WgQ8F0Lvofz(`4BQ%l-oN
zeqwNDXLXe4{^--(D_*AzQg5VAPLPhqP+KU=*`K%Yb)}scNrV{I%Y0IOMf}BaY2*1S
zEmZ%dGd;%DbmGg-`dXb*dviPb;=M1M9t+D4y61VP!X;><X@|@EoWkv9+NH=1<1x&d
zX#uSXw^V>7ELKIbbz}EhqH`3BZ5b<*VA&tu;aroyTDYeVykTs4ct;xmOkIbN0rBbK
z<yI}kUkU9^_EER_lGx@(R0LZHp{Zt~E>+>FBe`~4y*`whKDM?t5i!|e;~+uZztcd+
zfmUV`W{Yf1Tn`?S-`l-EIF!?;-+JE_o9I+NXmlDz!MQi`Hn`~B;9`=hD{&p4b)WnQ
z4S(}n8Q#d26qeSxbAsh=o(DvA(@lvIR}Q!&Y^Pf1xKGO^{xTfg{COJ1kJctblFfQM
z4|;Z`>$7XRgU2>@&d%hhxSEmHkx&UM>$)H%-eV7~u#RTK)6n&+yzmu%J(-w*03r_(
z8!E6uRWP7Cs(z3n0<iGxS)aB(&f?!whJ3@%uOiU)=;zO&MO5SE=V+FMDbV|som1L>
zh#j}724@n`MQd4Sa)wg!SPJ65Tf%!Ig(A~J8ayxqClp_1R#YDt>etk>0XGj8cr=g<
zAI{7w#IEh!9+u0}CxvQabxNP!y~3f%R#>$!`!I%uUZ>nXETA<u2gT6>&J=G7qST8`
zX-*Q+ivV}rqZi@5*>4(>p5$Rw4eP!kCPM~o3d`P`2qtcfGp(WcN2N-iB??*FFfJy!
zw=zcUPPOKxJB@noUWKo=4c4X^2TrT1DL=))^Qyz8=sXPC!Uo=bW?x%Sl4FQl?AC#(
zo>EZTD{5ry66n0s8-S2_#m%mln-E0HtDRfDB<N8&s5Qzi<ha!3;YDCDgE|n$p;z+y
zkFSAi-y4#fXOuFeKdd~m#abbx8fKFDOgDAbCgj!@*3a<l$~rp*-L~$l5#HQ>b&1<)
zgtWlD-?qQVC9tTfGQG%R>*eLf<dq=kzGc>hr=HS!E#{?eoKcHE7)2kp#_>ilvcMN^
zFS!9PYWjMMr}o0yLia+xVSN>oT@a<GbkrXlGV#1`2$#wSr((14&(vxD_;YLPFWv+j
zu$0jRxLDHBMG*HV7=+Nk<4oypfsH0q)(xVnGqX&8$l!wHtWIEF4x)^Ck}QKZWUz?N
zcHQ3+WebzlDMwdzJ5OhBc2sJaigbR+^HE0&^J{xmx{EFg!C7_6w{AZVU3VCb@#EQc
zUKsV73K3d<Lw|Vfdj>LJ{Cw<ge?wUw6-(Vfv6fuyVJ)evhx3O=1!g)ylwHcK?Kl7n
zqLf@rzQ{iW0T<uv=Y$fwLASpd7Pz2QE#4rr6_EulGT5Nh;JBi&eL|Ai{R9&8+LlUe
zV{c(qH}<3WeP<I&o?R=mp^quL%N%4DUYy+_aw6*$dqwWP(0X&Wx1w6$)aLy~e&qTR
zHb*960JabrDr(+VZ=NVGFxo%u8B<d@5KZq!GB-4Lijv!?w2lg^o;)OA*Mt~tjgk{h
zyb%dK=+n%J`R=mbTtFB6ZTXG&dXrMdq*w9$+@fmjj_${2!fWb6J1)bn78I54OLG}h
zU#%1E^-#it*<Tk6Yz{puWqDs;W?@qb+WPqM!fXkYz<~Ws^bxoMs1yzChV*mBV-br|
z9U_mPzX=&n4MoJfEw&JWp3>XIIA0XCdV1O*QfTqHZ(zFEOfE+`FPDi|;+=7w%B7mm
zVz%%LLq-0VG2*HD&xXyLqIu(yEZ^|*%@<HwBl>Nd=5&STf5J_hRj%rIBNl9RdiGcJ
zBjbZ81@6W1+hlFAs^!PEK-(yF{7I;p>D)KMTcD~lNYkWnit?MSp1W@@*e@Cr=;pM4
z`ut+Dtp}l{vtzw^ZEj?pd>Fy6OlFUHO^0DIh42AK!n40ry#2AD>4@-L&%SYGb)~|(
z*I{HkbpM;S!)ga(rh2;HNCFT~#{*Hx@Grg_J7rt5jH8r=*}LmJu9HvAzE{M$JjAdi
zwoBrMtVegJaU#1``ikfBMOzt`cl*CqJ|02@2E3=vAEW!f;)%yi3NoUTKCp9jyBD8g
zj7K+|697DW-dPpN)XNK@T{4stW`qapF)z<uYV=VjuTVbu$SJwM(Bxq(cRETY$%I^m
zTBu?r!G3Q0IrOLXTG+8Gt6rT^iD1`qEcDtO(#X_IjUJh{eCbcg(?(UeEH3^aHeNPC
zn3=yjH_u6{+!YCG&07}Sh#fVBm?#1~_P+a1b*o*(`^1YLy3rta4M8GTG*sg9!ia>F
zzgI2SF_Pp$#!a$#emUJ&8nI*p!^K!Rvu9f9`@OQL*VzghX*S7flOt{evz=X~nYjrE
z%SB6YKM^vwz3nrZ8e1kYi>gfEaGwHe)I&Hc&dZCVDy((g1&bqwTGwOPc2XKd8W}%d
zJnE5y$jdo4vL`-$Z8S+SA@zFmmmcxdYUTxiXH74Ff=mNai^#z#aFA|mO|r+tmR)ru
z^=mzw+}DADk;HG{(hE~B_4I8<)rw#6l3|<t=_C^ecu|8=EM$Yzxjo!Q-(Vht7;B_T
z$e!K(EriW5gTB7LiP!M%`Hs!-1`MB5FlY6)c9wFkk#*T+YKvV>Y`<8h#KDfl{BTF#
zK-801ZOCR0KVhSY)za-yrSXBgHs@vRNwCD^NySU4i}Z4hWf(LHm3gMFCr?WPx;G}`
z5u0XG(JjQ-S&G!vG3$SiRL;|t$z^rSxqtsYgW!+N9;cR&L?NA?LHvBFQ|UI@3Su8T
zH}j#J*kuaI4C`Ts(S8tJx||Yvj3<Iy+5MX)Z`kR}!0X87oj~_Jn=md~jmZctP98|o
ze%jM1&|y$1LWWN8=o&=lXdr=8&}6lgq%7YhsE1n$@{HefNdD7CU;L8hU}Md2cumB7
z#4}_;z-WKqW&eFs&;8(vHFLed`bFExfa|teEzz!8Uz>R+4Hg*Bv`0yK4i_lo>E*MC
zCs`gAEeTOKoibST(VNL{!njrJy>?$8zGjE$A~2wHo4h{PDWvZ=q6=VGt*}aFY3)@B
zT;p-M1Db7XbWps#KK=>Q;A`;FWvfo{)0I1A&_OglVN+Cl##~k5T}Th}J-TDGr-m5>
zN{?>>iuDIskWU}%d~H^5EuBwauxMUKO6{=MQuuVvlH?ld>=bOF_(5Rvk5lVK?R8Rg
zO`k5%JB;e2F2gIQzWdX4#hZ6qK@MpT)z&84=q*(D(|Wz24rLp3VO%^pBTv)AwIPnv
z8<~no#RoI`x)>pQPlYRN+E13^<6xFEA@xBmoOSJ`*|LtkBBYHadR`dwb3L-g58p&^
zevpk`=r7cQw@x9~XC~z)_J_(A`3r4OesDpcN+n)D&bT0F0;dJKM+cyLrP+g@?rtTX
z$IF+!uzMWd%K|(7Z<>gVU_Ot})}6M!s#-}4;D|$K<HcoW?MC;(kbP`kS8gw)iJvnH
zKfg^wr}|Le$9{f5L@IBqKJ<<FdF$`ks7(0>h=0r(aGv>^dqbORd?9Y!U&;;Bp4D!f
zI<5YAFxP=$oM9H;RLj<8G!3rF+)cX)^v$Xpx}MztZW_D)(lomGR*OAM%W5Eh!pX&S
z!I`E{1s%s{c4I=kIwx+LiPxvk@4R*NRzql^ETf1UCR$^(t;fUk1uR?XCG;3O=B)(4
z<oKo&c$D&xw;;Aa>!*_EFN&A1=ML4#QiGdUSy6Ckhdt~*h?$J1X!cP*RcN(-y6GCN
zHI>z9mDth~JDUjIbrUaoM(Lr)OR3MZ$l)U&w?>Pg;sqv6=9^x_2k}F|%vYlNB{{(0
zUX|3#I81GLWh7=ul_bZ(7J|FsEnUpXvli~$J9aMXIiJgtwNpWsC}m-BRhkplcDlEt
z+(vX5L3MDhZn`~2PL)H;AW?H9`HqxdsJq1fLcFl^bvGaE&rU2dnk){aIU>ym_bvp`
zto6Xm>`W~@NZTvFX<Xsd$-=hz0cP~-IVIwJndGujYMbURGrid=&fs55K9@!(yXl8p
zw3S1&2jg{HX`YpW(<PA^vQ3BP-FD@A@Mw0Uu7DI*t>Jj;CQ*sd`GW}GQR(kDd{Lg-
z+6i4Y-|pie)&{|kb5f+QfU?V)r31Ur+cpmVBVRppTb{+F*B{O|#}=AyIJ(gzVGAhC
zd~@2XOB>glP6=T`Ld4DS@)g1r)>`~{cRkw^cI2}5IY)+`Q6h$4T^f0F8qvj%NaQie
z&QYxVFu1=*8K6S(slCf><=be-yJt#>UKQ3eb*^dp_{V5V4LO(~6~xC)9io@suurE9
z@CDAnbt!<89?xsWVki;%%_f<rD3kwc@D)^ClMucCT+PH9IXrE+vwgrRoFh?C(tl>6
zH?!tR|LfI4@Yd^~fGGBO&mQ;{c3qZsr-f{6)$I-;GW5Co2iu*tF1tvIA(EY1(vg^5
z2Me?n{>U|k$c#sw9^@4&C$-V*J6&@fUNtZ{x?o`x5h~opr+>P?cb7EEtTUs0!H|>{
z?rrr#95uOI>#wsZl^Yoc%NE?qj@6U&U7Nxf*9W<&)dxuv&Cj0~rw0pdqqYQ%HmY$o
zOzfY_`vFV3JI<0+BLl6LLWk4mo{f&|TKDJMWwcn2R8h>oGnS^1`fNcwJ3;5VaR%pm
z0tKC~OvH3kC}tT+S-gqLQ<gE{)a%)Ye<vy`bLBl(dh;lQ$t1yk7yg_X*OlY!K0${h
z<lA$tV(T*ICZY3PvHCf8vGio{w&I0`uZo{wp6H?i1C=1*{sXgNwcwaChj7y*>*WHD
zbRTtx2&;I0$?27+>+TJq$zgF0HjV-a1dYv$(1W<^s=hb8bPKf$?i+s>+xzV+ss)GB
z`!!mzYt1`=%_d$G@0^K?Nv)AWq1n1fWo}>N4s4}}ZP25)cNDf%p4hKt&^-hP>TC#h
zKcxs*>`6}*K3w2&73CE}E44dHUS2xKpS!i8w3u#*RP4yXwzztA%NGuC=<HSM_F}s|
z*QR>)(4MyEXC4)sAHIr&M(ERvmtAv}-go6T*%-9lUb$d4@Wat=u=IOsnptGMiI#7s
z4bSsjp~G!4x)|Ve#jf>BC}!P11KfH=>Hr77FPyq%456YsQGxNcv6ycArbs44OYxby
zvZvpU*@PnF0*ml9s=o#+en#iX@bG-D1e|xY1*@{*mh?XLJZrQ0BFgtBti@0nD&7dE
zhDt*RR66lfa3-Gg`y2G>+n8P{5c6qq?3R*&IBxRmNyT=gZwPEHivDry)-A=2f%l3<
zPxX<-F07U8nc}X52HomIzEHU&L1X8y{`}I^TW@$INMiIw!TLpG-R?_vX;1wHvC#-2
z>uS_|T#Mo10V{TMG3Hvmz-x-?HbyRs#aRwAcnK;|gjM0O{Y<V-fgzUU71x)Fo%NZ>
zwW*eQm`!;`(wiw(HH{2%^5}gBwD_MvfbGxzYu}k7F=dlfhT<V%;2`F*1xIj$*AD7x
zZMt;6V!pdT%;UKg#Ax`I=vxNT5wGfs@71ADS(I(LMXz;#$s&KIa^`!9z^>B<-KV^?
zD`3PFEFbf7@Q~)w1K?aI$?+QxCaG%K+1MW0AVB!zzg%A7<<G0-Cf|9+J)FKi*+dV_
z+2)`_A_xu1?V%8b>Hdb-_IE2-NJTeb5gGD4rnCZUp*WK~#0jh*fVmg|cNphNRi~n7
zu{2$sA!=Z<)OT!tCQQ>CRU7hCSu|8hX{+)W4WrcaFxJZ%#9`*wF1hr3J8Q0q<@KwV
zm>5`C6mdq&dh>DsDqO_>Q8J&#!#8YmOSfP3c<`I%+An`^G2U;##mb=8mf)HgXI2t-
zt2_shyz(e^^2MuVsY=1(2$4w;rRab==_yReCqEc%e`D}9S7xo$0nIPjou#sIt`;~G
z(WT?3YZrN9u#WrzD6Nu*#`Fmm9z=DT7yp}R!aD+k>U~$gC{``L;dHOTDjiJ(vfZY4
z9~``x?m0XFO>PI_mP9a<ZgSi9X}vOep;Bmkkne^N?q8y$Cvr`$SQ#pu=KbZw3{UOq
z2s(t3v^UtOHN44D?=~*4T%Vi>eVCWTiA;1Ul&j`9+704dEHAgpU?6kb=)0AvRGl)o
zKCD=s<i2v?T$!_k3cinum|p_7<B0`7bpUI$VXJ5wAy5A24SCIZ)%(+q<sMTlB4sU+
za>8+cJcgU>@2@r(cjVit#R?c^k+eB3jwnsH#oLJbN|(F!wyn+5TQO>tEO4N6+CGbU
zwba}dGy43+w}+*&VtJ|Dc+A_AqdndItNBHXmu?<A!Uwap9pk<;4020DuSk@Z>$AEo
z(v@OzZRa=4Dn$fsbX{z|+`;X_=$i6|(1~8(C#*0V*@}D9vcXme<dS7^pNePJb9a?c
zG1Zk99pUP-v?t)=v`5H2zQ6VLpe?=bL2?(^1IvVameI(*IJ(jxs00}u@4Q|P9c{t^
zPSaU}hfghrW)*A)u6&X9oIL2K*Xqgc$c(q}?h-ZKT-LyO0Em$R7%^oFIP$CoXcFUQ
zfsMYTjYOKs?aHrj*-H$Nwik`J7lwBH_dY%LxrW`+vypq&y~V2h>D`d+I?9Ag^^}N{
z<>+;=JHX*Z2VGe2Q*KmEWR;F4q9-cX=Cd4_To+g%98yp9Q-&)_y<eY-To?anw>W@#
zZ=zoLboIFh;{GCc`a>zWDk^wltz}84d@@z;CeuK}Ao&{><uGcSY>wVZPRI;rQVgA!
z=Jj~b9mb~G?sEtXx;y-0y=|@E`L+G6vs118JW{k1dBGRPW7Ac0;?rC)+gw{9Vif6t
z-NK?bJVoW+b*WU3US;~7rIB;-f!*)30RG7sKF4i7he7Z71s}&zZ%(k^@BZCD4}1gS
z0&)h{#21c<M5ko{scdvjYaZ*!XfuNR7PT`;Eg;XvkNjP(NuNYZ@R1!;SQsu7ql2*F
z({Zs|vXuwkW6_+N3xR-422PNhG6GiNN1}f|8(<+CpERI-_L$|^2_HB}a6z+tw$mUW
zYy1RqQ_f+ZAaDH>Gyd$5ND(+?cX!9G@*Q<3fR0rWkqxaq2=oAC`b>h<qbBNn!lNGy
zO9Gxpr&7Gdk%8j){PYb$fpI(M#Va>W<qqke)gNyEG?!_zKp69Tcc_k1zk&dvGp|5f
z=n-;pOu&<eSd=_D({h<(<`Ao9Fu`$ZjEM3gco3O3Amatv<(B4=?=^0NCY}SHX_8|Z
z9`=z9$slYOr7i5H$Wfmp@iRpW@&<fI=}hDJQ9*kr<8lNjqdJcrFj)ZJg$w-*H(1KG
z%bu!oXy2g;5HorNdV$HG0b<W;`1<$=6%YbkG`~h{`pS_eT-2AS{ql8%{x!*=DRlw2
z>8p^RBxT~{{}4uUOrF&q8(59Eze^xF%3L5x7<pqHd-6-;W`>#eYcYK-6!;ErgK%0z
zM2yph)wfp}jtCi~2l@2<N)I~X?!ca$y)SMO(;D8-u=ztk!0SNyiQ&^N+=y8Kqd*;D
z?J=Vg#pRmu{E>0Y-aVLr@~6Jkeqm&BD-x(!Kip>pi5z$iAO9rM84!8$FyJcWD3Nb*
zM7oU)aU5v^wBU%G3TwTf!MNGsBH*=T^baBd?>~Uk!;cc_bDIqC`1Hqw;{#?ea-zsb
z5h|#Q)K_j&v?oRc#<ZQ9m#3t_DdRVwJ@~t;Tz8HrBhg(jfa}}ekj6)vfN;KD2_OoM
z2*^f0dbw^I0^(|cDd)co<FW{takSvwCOO6r?Z72FQ2nqqKc+`8V^qLNJ>^Crtv8>=
zaJKjsGBNNiDZV3l^9-lHCqdwb4?=hL#nDVYGLY3l{e?7H>lh6qBeL@O2>3!9&IrBi
zw#2~m)o&AB1L*V)1q1gWFmyUf3M3e(4Y#;5j_VHw2|INoDAs@;{C3a$Kq}d;b|7K2
z9ELdkz!L}Ks}UwXeN2kpTkt%W3rF!0r_aw$y8Xciq>Z#c2&${sA$~?~jSF5$f_zKM
z4yffZnWr6Epvg7RPUI;0Ke4BV_O(iFV5PGx2c_3n-KwkJsm78((QCRvs)ZXS`6T@j
zoIXjg04Q9fDmtoOf0Ag*#kXXeU8h?Hd6rKxRq(y)8U^cbm`vdS(&-vKv2--%h9?6k
zeJ66E{utK*X!{AGJ1_E2axwS;850qt)x>s6;Mr=QJDQ$IM#KyBF=ew3iL-n-wE5RR
z?w94q)iGyCL%CvNbJ<WNUO0i=(*_R@s6H`tG%iFC1SX-k%jI*&B)a~i=jRU~S|NDT
z@@MK!w_Gwz_=#u#{3q-?P!*F6rq=yqAr?0#h`0AB4u%t>E*+Btn2F0?V}X+VO}?{_
zJT6D)wOpdxkq`O6aH`)Z=b!&KkB7l<R=ly{%e%jD48Ye*K$+i4?M%<HLjRKu5M!Vh
zO4IcU|2%LovJ}>*I`&qXYGr{7B4y3@)vN66XAPdtnB4%XAfqn8d<?ezWC!?Tgv;ll
z+?lhr`AeS%SDt8DWL*x-ow6NxQyqHoUOoqdy&`Vvzwy3yT=wIi90tTNfzNCt2{`>F
zjVg@WXE$9?dbmSpm{yp5`uYyK&m1wR{t6^kf$2|f==E1M`X?R{x!?fskod&!hx{UT
zEFIP!T`mlgo796I1)HIt2~p#GAz1b=U+9S4`918bI0!iZPfz&CU`bs_CfI^Zjb-eK
zcpR$<o|#EL>HK$e3E=43YDDV)>xX<U6O|^@@U`AiN`O)q)|nGi{f+7UO@+_5OF)HO
z+Y^NTqFpO8HH!<MSP0>3pGru5)TvLSl!03yLr(WIxBf43`~5HM51g)j&1e((*L<?i
z%->3Sl<mgcLUXxeTAV^;W2m2r3T0!Z<pNzK4+KjF_QiW{jHLsAiZi9}{E@l+n^@5B
z2^hhnYeqbkv9j5LwZ}Q_m(JTvEvGW%h~+2cCO+X(Q%!4lE36Zbp_BkfQ122wbmnjL
zGA$Bdg8lPp?%(72B{}9RlIDIrMM>eso|$cm2zxbBLsFie2BhVn8=Lrt`XUDn3Br?l
zxLM9pfAE*@{`0?NYd{0U4#-dZD|`_>@kztaTot1e%)1{qEcTu&x4BwVKpoq`_q^y@
z=py%Ro=<?Tb9+yby#Ffke_@m)HBbw)iDr$z%;i1$F%YK#OflMN`+k6Yx5zf4Jy=q1
z{Q;9*ynF99cQ&r?W4-Qwz#y3<E3R+G7MH*FeLd`npDHPnOrVB_5>>$PpX|VJDXP+k
zRe*jcgZqw4R{F>ApI!i)RA27?rNRy3O^_Ry%TC&}JH+>%E0x9+&2+odK((h%Uwa0V
zxWBy$^w623Nbx3^^TyWKj?H}gCAsUs!{mEO2SxlVco39&4^nEX(DpQ^WKF#Ztrq)e
zotKk4RZ-QAIBjbjd*!4~1LLg8V=!pS?QvU+f0p52z#xndh_thwSGk=kT;QI0cdpgQ
zLArDdg9*lb;*ix*)J=(t>cI?(iJV3Co0wjed#rVaL#jCDP^x4>1Jz<V^y#kbp_5<^
zXVcCL`FBRI6ctM)_3b9hoff0_2{%uT>u?$U7CGc@jo}}>`V=wIqGBJLble6H^3v{o
zFW1SnS>Co|+g$G;IS=SfSxrD5pM>$}Bw9%YlT6gWmZd3?HMHWOK3>zHbvAshAvdv%
zZXtM}7~S}S6#CvK)eRwgk=jXPtFz#i^DI%*#n`VEbsgz}#y#1wW-bD4G--J4&{2iv
z7<QYGgRvAbZle`%Nadw}ELo+_XjABD&A(ZC@5FpXM;eji7su|f{9VPw2`FLD{5!2p
zOJqyNEv#L1-(;?c2a4X-3)L<h(w=O%>U@FENFB%d&F{8`f5&-MycF61RC2Yqa*iU3
zefhhggfY0(^*;NKGt=0)x)2(khmHrU<xYfzpLKmM2JAnZySU@p6LS|*PuBUb-cyGh
z45g~crbqLP!V_b1nbnJq@$=On8IGv=r4j!&)^Y1%IdnxVjbk9F=}BFyOoz3-9KA7K
z5g=OsLzrp*8}N6jsoG=9e=qBQ3+x|S4(5?4@k>`o59L#P32F)ori}K4=t{SP2s5RO
z#wI1Ep~ZSZF#t~km8Ul;4e)u%;z4Q%v-}v<CH>K=O5k9AEy6#O!h`+s5a_b*Ib4+v
zu-!%k5ob+y@h(`V^hJ$ei{AQA<{830QlyG(Y<qRr&=3K4Tex!BCT*tr#?t);E!MqT
zSJ2vQVqj<8@`;Ge(v^P!kN;<?<6iASV33j!;q5VcUFrJzug&~=UhJa#MRjPydu9><
z2)2q|TqhfRKV{YN-i7tjb$PLJv#pmMORZI<7XxI<XKG^qgo#orJSz(snbn|AN%ho^
zQq;Fny0|8Kepn)A7J$!ig<i>UU|@5#a?ZtMU>og`Kdo<f^^~1jl;4!=Ajg<s(&M#~
zVFJ_%9D7fY`dt6FW)*mmPl0K2IA6!1Sp?%~(22IxD3l6+|A5iU2QPxht?fQ3rsnet
zZiBwZAUmD;dx^a6T?pS|k|!6~JT9-!>4IyG-dE3ek8Rzy)g177`7PGt86z3>J<ij(
zsvA%#Fn(&t|1J$8$2LXvfIBmN;?v{U;@b+4J4kHtu&Mdd_tgD2Xq#bvrILkYvwB-{
zEIzNOlLtx3vuzOK6rw?aN)gc8&q|Sh&+|i&DGo;9xZERU5Dd%Szm&vWD7-gosF=DN
zyxCpPmM_|@rYGa1K`~E*6ToQ#F-VC{xoO(NH(59FeAEvs&*GSmNft8wbAdEwPV9Wn
zXxB_W^Gx8b8If*c{W@FD4GCH6NIWEqv#^}`^N+8dmxjRIFRX{P#MMt>83dwJ)*qHG
z$Pu2j0XEh(wGR3>lh4~5=hm<Js0YID?Y!<-nloi6ybz|6Tv~d^rP7N|!1G6Gv2-IR
zk1M1^HD{osWHEJDp!}>nI@r@1N4Z@LMS9(NMwAc}8M>OHhC&T5|G;hr7kmH=*Ou`~
zd;ad=s+#$i_Xnj_{4=E-WhKJuEpJ`AYfaGyoaqMN-9#*d^%6TE=86X_0p(8yVKJ2Y
zc}*I3snljCp0Rzt2-|eVw=87=(40psL~+de>9<GW^B8#0Xb*_0$V|MA^&eY9cFCTT
zUVE$ML6kfXw}yFNUqPzI-L~NHJxlQh+(OX=F2S7K&QC4SuRX0%wZQaKpY(gLu-{aH
ztM#I1+7k^IDBxICdXTJHRJ!O0XBEwR6<$qxn1kIEN5z{<`#kS`3tzxK5WoMhbDF&s
zBXKBj17sv~4}!XZ=xKIMseFT8>CJ`y$+}mOwvP{WHHx14EQo$;_cR}tm4fgwLU*65
zQ8lL+&2cNfH<DuZ6gyK}7Vy&7w+URAX}p{yQZVMfV+#VfGy2w8a#q#o)90zB4)9Jf
zN-L-B?QdQ0$28CtEM%llBa@xqS3)^5VV1%3hmnWF%ALY;Z3+ET+pCvAkppc%($GI!
ztNiBoM|Hbtv{Y3D2J6$Wq6?;)o6j>oq-xJA1&P@W6$d{1Sfk;x;sUF|E2L^t>K=>5
zU(=)_rxnNIo=>luwkPo<9YXsnEn>1Yi?!R5ge;b_b5%ZAQZ|K)WDE@y#TvE5p|rhz
zbV+Gkx^&2)VVWrFlsmXJJYdbvs+M)5mz>kuQH?{7<B(SLrb4(z(6R!L;pu_-2v#*&
z0aN$TkgM$`BMJQl*mj+sl<5NV?)i?=XO~{JCCeEYa<+VaL1<K4mTZiQ>*m0^%zxBK
zv8kH6lBt?gHu<WJDg43(+qFq%0q4inI~+83N=G|Wrd^#TNZT)SIG~5wip{&jhg|I9
zu{2P7Nlz?>U!!!zZK8KEYqUCkMJf|6LRNlQbCQy8Lq?%DR|%2Sm8;VZw_pl-{`(jL
z?eji$g|&W^wVw_(uBYUEiS3zLVTRLGi(F@m`&3<=r}^PFo4KfjX2~TXb+y3i<ge8v
zQOysQ`Akf5o>+dus$*ZJF$BbIm*skDfm8BOSd*LDbx(8*Tb1D^uYwOtm-2c}iJjPK
z9@8Me#k)?pUOji}-$M(*b6{MuZG8H;&P4jW@RQuM?8o3Qb)y*toEWctRHF)JQ_z@1
z&In1a{z&o?nP#LvhwaZuZmbVRFZw^+u_d4EpAnpOm}m%nvpDG0?EzOPv2<}c*a=Zp
zQ_az3)_WBH9=lopX*`wThTTi#e7uHUOGNrvREbEP>wL9R$5ywl?M$MRbgDRFfV9_&
zmuIP~T{M!{;*$T_#TiAyAl@%ugo3|)Dwi{N&tA`jSng|4Nx}!0xbPwsdgkx9*ip1K
z^*M<*LFvDt=OS56t>-!x8Jj3*79A-ZMh88IS;$$HI|heO8Q4uWGAEW-F!Ww-%-gc#
zI}ln=ezdcol=nQdCx3*%;Ou0z_!9E)B(vIw1c$eSQ_bD1M)gIRukO7yH^qdA_Ai;y
zJ8O0?=9?Q^YG=2`i%48y-~D_pY2^DZM<{lHzrw&>EgO>KQCVn3>fm{>V?_VWRbJ3x
z$(%rmKCwJ*|J5a?#-5yb)K<A+My~BX=Iihh!g$?eXSQ}L@*F)JvR)f1a&ugN+`2tQ
zHS5IEOQ!~^@y&JXt!E)#TT40}NOWLCC(-$G>@}_>n~jg-94U)h)ckLvN(b^PP1}>#
zcB16c4P&gKI)lSkHT-}1wsTBjcf!oHwWdV!CfPz02FwY#tGNj`5bR{=Yx;M2()!it
zOlfTfnHlvJ2FJ}t9<}M4KhnCjod5h;C?6fx;{!v$09cd(_pAkTU^%1K>#${}<(8$_
zFup{UeU=^POJXXJTE}@azusGU0es0(y!_V{j#j;fV3XHwx{<LGTX7TA5n$$-QL*cZ
zZ0cNk%kbw(wWG9FZMIpex#~!5lSljqq^b=w2iU=f!(|xEfR|iS7}y@q!K$W?@%m1_
z8L2;1aGzRtJ*=9}j?c0n&CmKaqvy46MnG)y$<d))8Jqbu)viYci|q1Qvh3RJ+Wlzv
zvE5>SG-_7Z<%dwyo{n#*o@ZwHAmzi<_322EK<0c-+f}fbhYbEDEw5rgQ~?yh2o>H!
zf80;Kmo8H7WGA$q=OGGD1lfD_)HV?kbRJ&@MEa+;&Q8Y`!Udfwma7QUlWs+3?oU|n
znU}j(_3Ef;YmUY``t<E%x1_^wtnwTTG#J_Fl{(+`BcWvAv|or@z;YSZ-`2=Ch~0lW
zY;D$BGE`wE4RX?-fh0v2JD8WkxXDZd?Ze@6r@YI^63K{@S`HP&%yP-mE37`${N`~t
z)Ud_fLeWjz$#LugnW5_gQj0Bozt}G6=99#(V_J>STWxI0DR?qibALxpOSiKbb@Sze
zMW#>1N*Avb(<DvHAU=1osuc^}&ipph%$C38KWVYTpMKC3O#jVv(jl*501g5xo96R&
zR(~U7qK7~ca>rFoYrYSQp-lIPF;#h$Dg3Ae0kLRytt@QT_w^~LV%k&v%B9IUrM1QE
zyh+5UC$9+v#l#ydZzZA?rm}d)WJ7YtuvgaOQ7CO?`jhYPO%9V&CBQyr?*<=yoP%uM
zx_;n;jAo-1VpN~@gUPJ2zAAd+T)rl{+cF>Bllw-G&nhYbY1>p;-<rBf$w9%X`^Ts!
zwz#+)X`j@h1nHrJ&OawD@=%}e%CgYK_N`7_G<->XxV`UWDE=K^G2g)0tRvg^f-L)E
zYc;QUo<Sm7&PPPFTGYC8!*ayBcER1ernmM@dLH$c8N=^W^VCP@sVl_sStR|@HS4aI
zz_V#RSfT>magGp({75XJ2G<o^GPesAh+mv+qH8I0u)y#}T7ZH;+}`=Qt9Sa&iDuQT
z)yq&%s!i-xFZW&VFEovzw#i}+rsC^~QMlfr=1O&PytKttr}V-A4b&itL_W(K)2Bc`
zIh&vQzT^#yj^+~2y}li=Nr|EEY05};e^N>w#a;jC>%5(5JfGk;+=OX=$Fvu#Wk#T2
z$k{NDb}{c0OYDL6h~&J|unJjDa-&<h6Q4(%lB<n;L~^)~5P0zvW6qo18L-Py)sqpk
zq!r9vpIydT@vRA@TadTJNVUdw+qRY-+SX^Ia+b~MkwKK+Iql$TR-^3|L^e28p1OKq
z8-A;0y&fY<Jt4@(YrZFE&1b@20%fTffJ-<b!CiGomh{|%(h}aAzf;V^4)A&(^hOg}
zFz!ikw_UL8=dXQB<M;s_o8@`QaI*{epk>3fvp#)k&odqU)0Py5x0^>Ln${9ihpFzU
zl_kFEDT&-KE9o}j@hlmrJ8U&soU!2Q6$~-{+uHD7D+CxZE)qi<pi<}^a*bCtFz>dB
zO`>&tWihyv%l2@ebZ(K5lqN#KhE!$)-JQtensvf_RPEApS5#balxmK3@66n)q8d%K
z5^L&>!p5)^`VB|;Er)rdSGVrH*p%zd9Zq*%y*QnPiuVeaiX7>TPrR;LtUqX@W!&L*
zN&8F0yz2}9bG`af7>f~q63UP5sZ?!t$g_33EfP9%!I|hl5u>IbrwZzcI0QvmUhdY{
zAby(7xzY<O3(IfsB4iWG)@txc(PG_}A8j_=WMq>BQ+hM~;<`5l=(#ky-sW`e-T^83
z{VF1;_wahfEPKiwOm9w)S%v0JiU1WRh0il!1HFYp?~%-H&*J?yq2*}tU~3hb_4QX5
zo(w-G(8`f>q2Jh9u%pS&t=JkVw{FP%QeRD}ujTeumFBk5?4U`XTCvJo`}&wp<<6N<
zp03P$?+wL6xlK7sWUnMKYe&7pSmt2tX4<0ZJl~o+pr+2!2ujCx7-IyTQdSYCNu6T9
z?{vyRx$jkrq79YlS-2nSx@X2nJMR{@LwTQ9-{QauG~|tBo>>lwOcZh|U2qz$thcPd
zTr!!U*>4*Jm34F+*pDHcxd&B_?>~R~T?*QvT;l;zLT%<wdy`ACgqbakZELx!7e(ar
z9XL0boaqYt!1;M>^7+Rq0<Yorhw)>g4wx6R_lCD-?rcbzy(|JQQkdu7knrC{{_X=8
zY1v18%98YBriM=ULT*okz~GZZ&%EZ<OAWYcp^Ri#Sr*l-?A~B10qujK!oh`^c3k1~
zTpmJZcTA+eVv1rIL1>P!?$2&7bQru6yA3i!lFiR~VQEC{GI(lc&gI`EH!AX9OgO3Q
zKr@3JI%Tjwm6|()nn@~O?&W!wrE#a+3B6#e9-5R__ENhcl#X>UI97Pr!<?E23k6GY
zS0zP|<(8Ag=_qrVs+$now*vC<hnQ<?xha>wJfSg9I^5Te6}1V0wo(SrK;1tr3?kHQ
z<Z|^7br~?Uj83#zw+|)-9v0tD?0|b;Uy*<lUmMb<Wr{a;+o9MxqKw?{9`Nx5q*Gl$
zN`ccdtwmuJ-<JZKpl{h2P=qM6HtxTyr4wU3Qt`bbZ}dc^^`Q?wx8-a+sIqBWC3UfQ
zC(x4HA}ijo<FT{1-emn^xT<s)JJ5Ek^Vc4lPZ9Z3x&YqX%(ZNBj`ejF((T*c&yme7
zIpkRMM9#W8)0r-qr7cNd$!1Ko+|9k%N-5vo$+)5VN2O{B+1SG9k&%oB4YS~NT4=G#
z6>FJond?2s#g?@CacQnzPuYRLJt5(D#Eu!a5p7@d{SrF<h2KNq1*1^dt>qZ7l#5*i
z5rdX@2*3GSWqF4mgqQ3``x}$ni7Gc2^VITqJ-_ZnwL^P6+=#eM7R_S?jSEJ4a))^o
z(;uo7idxQUb)?R)nqY@~?K<G5PL+D&Umi??`=+}0bvd14KrP{16;IR*N1gfN&~&a_
z`rTS_lU|+D+eo{e!3L_BjPy8>BD3`?9oc4QE2Z0MhwuBcbxWYOGr#!tm@bc0avRh=
zhR5S73rfI(IUOvVG0(gXkkUXSJOn&;qjY0B{PuOWe+9Ro$t-GZLme~42Nx+Xn9-K&
z*ShXZMoR4px7B15i^$zJAwEFoiDIBqyzXbLZ#vMreN;ky5;l5z??kt!_Jp`hIwsL+
zPGwkcfh|AA&|%d4W4{OCRi0B?bTbQia?sTx<s4Pi09#)5NUzn2-hpwjXn2S$n99km
z7+QZ2L;0?frdsfGW4NKn>8PBu+dt-)Ewl_DzxwU2(vRH&?&`rx6RXc7`m694$*L!A
zznT(rs9L$R4Lfh<dah0vd5Pz$rQIKI*B`F*)+V~zB{%6Pq1v!5x)beVC1}Cq7nA`g
zV*)!7_lon=u6Gi;uj4|%b+mU7xEz#!7a+<6d!F$Hu!Vr|R7PR8A@>vUeAZE+(4;3N
zfqGsq>=!p9Jh_xIWTW4{?Jipe^F?LRZFA3zVA5}HcmUz0%A%HQuz4ura!=PQ2Qk7o
zo1-7WZo#KeEnC$ft&_fNfzJTS*^wS&H3w_$q7to+;M%uz75E@(Gk>CCD)`{cxOy=+
zk__%L_NJQGyzl-}1w6Pv5R{`>4+{?PGr4hiVN11#W<Rd0eN>hL_c+l%c&!U~v$=no
zgv&Cde(*B8Z4SvrxCgkWQOcxk<Jwh_Q4Vj@C*{nlvK=rWNS$fjQ6-@f{HU5fJ7ED)
z^$lfJ%VaZdQ3?AYF3)eXG$iP3c7ALtQOIbh&nY_>>HhgGb8*lu!>s+(=U>)m+QW0S
z_y^UP%m<f;^?1PP2LZ+H5!t6Fm_f>AFcq&XduuzeCE+S?RZX1<8p*ee+toaWP4G&$
zd8;KV40@DpYb1UJZ3`?N10l&$Z~5-UhctqgX`XU196D@;CaA8Ne5#*N&~sJ&*Y+oD
zmxzHpV7S1>)g97#_4OOCV(~Z1)ly$QZDlTAM}ZiWdd8Wz#)>2?S1TT)(Iy<-RG-QY
z{n3vQW!5oG!={6pO6ltMUu@`}CQYuZY@t<>D$Y)4k%`jhjdT`+x{vM`x*Z_y6S=9+
z`tMZ&1ob3;0)8KxMnUt~=i1`*{oXbqd{_EW+M8|>u{wplta(x?&rhM&1@Pf*>l!=?
zxYF6(YT84Kfy3<yCrTcZs6H=`y@dYJrsuxvC_6`Vk63PXRcXI2($)7-@+Pvs<X~DF
zvKg&K)imrhYC#(p0n1+ZR79tqesAJq_3d5$?I%N$wkGXn!_f`tBA}vGk=*RCtI%~+
z4!R@HXQ`e6a`5?m`erM3(pmyJrIr$q3H~j(y84}UlNPWxzhotC?Thf~1F4oVs)*6+
zQ_WG*m%SZyYeD9tONrOCz`FCyfoWS(IAh?IrXOF=4z<<IOF!*&v346Bls7Fl=be1T
zG=LVXJYOdpzZsjYTltV~tG?!Q1gpeexnc6E#`4&cC>9lQLC1yny|Qr|RhA<aQd_tQ
zUUQ(`3DVV3#Tc3Izrw~ow<%VH#mx4i(l)^^=!;Cn1!$)Iq6aPMnYu6&P`SMwt7*zm
zmi%%okJlHD=4cwun6dDqEL^t^_Z27NN6NWFR2MUD6uuH2X;qHj{-ft*7BJcJ9&1DV
ze<Q*)^*<#@9n{ZPZttQH55jf~G*7ej4zCzaHxh2}xos=v+21a6T;%u~*wEfQnUKiM
z!rh$ktV^(t*pkn(PkpHjO>0*ir=WOhZehHw`e1<Grdp(H2)eiE#9;TK)dW<p<rjEh
z^Lpl5ja^S0>@P-&>Ybb$$|)z|(d2goHFluBKMxe%A&^;Sk<&dl^F<@$cr9AQNJX*`
z0;aoN)Va4S&eUb;)Sh4N$yts7#b5D0Ix{XMR)Z{&Q0GyiH@ddgYkdfR3NP)l`&CKC
zdu3o%Tr#K?xUbu7LawcPcL*Q5)wDG1C0TeSrzoZzmhI3i=rAvJ*3d-X>9a1c*6J+6
zzooh%RHHn;<?;Et0jo&veCrbVlrJ4{H99zJn>RZ+E<o(}4xBsLQ|f@?4>x$Dl~k!y
zR43XU>%B0Oodu7VUU#HDztC};MEZ7dcE0(qtwLzfZ7V04HvM%^!w*B%LH&<uNWk<{
z)K^CIDkEIJdaaLePR4lDCs$Xl*l1=}YeyDFXf3DJhm~X{h+G98_~{8H!&aiw3$vYA
za^&(zIRkuEuMg~iX&gY^@9QpMva)px>ro@wYY!gxhXyhT+Kk-y54t8G4&9zjy^rSU
zcx|mC*sQcT$XJ%%*C(x*?uxpP&LN*_c@z0P)ld5S`v(km&L+sG2NmwsPg7Po%XXU|
zOsF3pvnD9V1uF3K7Y9XI->|BE4?RHf>&4JZki_pltPe_+>o>XPKmqF})HU1iu=1V^
z4B>P054{$C*JjhHKYa_H*TQ>hEgs#Icc=l~-=LrC%7jO;X$)v@fe3{Omx3>sf9O@?
zHexDj3RX@B^bHUz4o~9T;@eXC+!&(^OzE>2ownp8kSn<R(%(4Z0G|-qN(?t?Nfh-;
z+B?8HdW3=v!#4oK(NzEkz7X*{mH5VwdU;h?4wgJvMq4@qsf8#RX6qo5ZdVn@de--p
z;1iNIf4h#KV_hKa_M}q>(j!oEmV&eK{e!cUO!UHVye~ZsQ2KoS@%94a7U{s~oJl{{
z6f3lFOb{0+R&#CsS=VpktmRwUZTfZ1n0und%r&0#ybXRjsFmo!2yKV1(k#SGK3yEQ
zE1oD{4haXj%$*I+LY@xZ`$%rF?3-zSW}Lz#iHmZ0RbD^nU2|SmQq9!R&11Ojp$*k$
zS`EtT@x^0Lo4b|ZYFr~Fa66|@F1N|}rGkjNFzRA_MddC#<>vkTnVD}z@4+D~pRWp^
zi|zi$W^K|lf?bS@3a#fK<JAd>rAMa><8N2XY%Y%4<QT-_`G5m(p1E~xZ;ix+F9$i4
zv!`ZnY*=S{ozyNdP(dIv58zv1Su1ID|Ni^Mz?g$SKv5I(cURS8-2*a9U@JV%)=dYt
zF?r~@iHVw!3%aM9I?-@Dv|ZalW#<_;b@;k^IR)$2O3Z28cUl;_z8vDwV2t2%8fHCD
z#mC)CBjWhzbj5cyKN4!Qz48`Gp4sh(c`+LYc^gYir}B{X3)MX4FF*EMYK^+Y^pARt
zd7q=+{V>vNo@NT^Nrv*;aGN-J+|hUJrMuD^gS4wEw3g<KB(5`QiPJe<NiG_hD_9d}
zrAD{#<c?UzaJfTA`$)dU`&{Da5{ttkbsvRdu~BGVV`eAQrA4&0ugIM_4l<!J)MvqK
z*?6DCMyUP(mArEHEPD9)J!iVg4;R)GgPuB`v`~2;tMJ0XPaVsKnim=dXU%woE>X$E
zmxK*kmy6j@t<+oCZuBV(Gm*iWpZsE*Hz}To*3w!jLO^V8gi`z*Ut55&-%iDCQ+Amf
zX#)1Tdp6lCcf9R~!YuDNOjXh@iz2Zbmjh&)fxE}PRvYc9TTY?Kv!?oJ+w}j?^_5X^
ztx2>IAV^4X4HDelHAvIJ-66QUI|O$K5Zr>hGz7Qc?(XjH4)5gN`{upL%=~QDS*x3K
z>QwE$Ygc_D<f(a#9M@Tqz&pA05{l{TuP%ooQuQfw%VYh$3;G-_uVH?M1^f;%Oh9=G
zZl4l`)=hUQY+_Uw#KaUT$`YL0q*AP`|F2U6NU*={GtIzADRX6E;1dACd(Jlbcee=u
z<{A)zMF|M7TlIR~k^Q)jT9fmsz&MZ9_ih5KJmukJesFU-zw))>di{O~P;ajorVG6C
zIQ4sy@20D)SPhv|jR#CkJ$_dVlbLeJtY(Eh1UZ710-Z{M<sJdUlitqI%j~c)eiu9F
zGEZ8a_^o<BY-eF4{MR|(*1N4R5rDc?Ed$7SP}M>4{_lSIi%I)?V1h;|mBDJscz2q9
z^<mkATO1e)Te(sjiUs~_VkU49ypno4Hgj%o2zq~UX+IM%=d@2^g@|wY6vscQ%zPGs
z9b>I|k2PI#uSzEU)WbE9ms8^{=QW7r){W=XTT;U|sh7gC>oMEt5(CWIJ}zUCxY%w!
z@w*wlB<LJ{Iwd%Q@*!>A%u)I518wI0qZQ9bJ{!%+i2{X$0}YX`leShIh0rHHvlRi#
z2Q~Y6z@OLA%IKJ`w=@0L>t=X>d3eU@n$F|e^FC~7fOzxW-m)@z-?xVWP5$e6=J60D
z>TAZ%$uT=|x6Bk+q?bgWpn_f?2dTZPEAG$CIp+!&MOhttM6A8}3UV=ccKiC+P2Hcs
z5VyHCRhdg4wg>WhaLQj5hKObtVC0EKslKF>;&nDC-g>HpcqlPfNXxQl$RnH3^UnDF
z`Vnq;K9q~n@ub4PO{eC&dijG3c?Ie-lKAyY<e)cDPt7R#UOW1=cvj1H#?u)w8HszV
zgr9t7PT+L&q*KH0F87R4=w$18mYUs)W~C74pqw{Cs!P-}L}LPal2{P{me)z7O#+RH
z)8cZE5sA;M4^CR_+M=CbIovPe{r1Bje04Zk6!?SGJy$+YdUeL;^tImTXXvwSaQqP7
zsa+@h=X5sOXj19Ydp?B63%KDgP{b5Fd{QYK-Uew!!i&8kzi$iSE8(yIx<`M1@Wvwk
z<fC#91u+@V2C-w{F@qyM+?ieOIly*B;Fp$(`%9&I`Zjsk6u{Hk;6)y=xIPf{+-RzF
zbH62E!#d_~9KVi*A2%8j8S4;rnEd*}i-U`6w-1-C*t_OhwHL82(Ybor>GUA0J5t9W
z7T-iJZ?sC<E<G$T5`V`dN6;Q#_ckSNjTn>sys2I~mBK<aYPxJ0mX2=nqB<D0Ywb4F
z=&oLaurGW(Pf~|`YH_+o9GY(HaJ1<C86>|!jwuYOKi$KyH(Ierb&uKPjK#wmiB4?^
z;t@Kb&k`R>gh<?B*qee*ED|w#ozCn=X1QFK1N=vCm9QDiJB&TP&v~f`uie5R2fHY&
za{DxoVWo0A2r;_3X-<B-$09?EJu;$9f=tl!)YWB5iNooR=T)}dz{OmMZ<wX`WHz6{
zng{e+OYuJ=s8re3wGA#@o=ctW7m@}czE>6>E}6kn{MQ}#rXbc9`|fgbM#1CZLE3h1
zB(8-v87is$N{!7gdwApa8ckg|DXDGccz-L(_Vp~kUV#YYv?r-lWrhzrB4ABRM_4Tw
zb-!gxLa&vgOOjQ^Z>Ctu9MK0&T?HXdBv(b`D-;BB;4@+y^hp?2<Ki0BheqkI>2x&b
z>n#)jH(zTr`oNj5(wvgX%RvIwqVRP3O?))r1vN<!Vme{9a-`+XWLCq86eEVJ(u{W)
z*DFyJ(k?Vd3FW5xswfT{-OBtF&VAo69(TKb6<hWcs+mwzWv49Nllj9@dflTXZuD7v
zjiX$8A~fn1NT5(O#@&9r8{Y}w`t=8B{>q2m;6EbnpI4Odm8>N2yXSmV@Ew4lOX-O(
zdja^G2EXh{<<@>cz!>NZ$DKxJ`vR$|YXA0;KeO#@JGeidURF3|L+|p4`30xl*2Hy-
z?JY_ijb?UPKZ5OP-U1!U$k0hbR-_E|t>@DjwlB<8Y+=Ykw9kya$+%uyNAKNfJnbWD
zJe}6Wv`ed;dlIXYkpCIFgPvU%DtVaf2laF&1FDCq5^i9LT3*7k43Zg^KwM?gA*0a8
zkj?wOe!s57;u3T{Y<S&<>jPgOXm}z91|*<!(3Uq63GYRhdpMZ(UaVJdi)8_!o?0<{
z>#V1kuh|IVxro!m?{&r1u2<T8M6ePVo7R8f@P%Sk0ls9uN`3)1z-Oi}wkT7lz03LR
zf-(-`b~;<>g|3&aE78rkN`d)wrjO-NtJUJ&lgeGzJiH?Ch;+xPpv7LJU79~Glfw1G
z%gX)nN|9r*SoQqUQRpM5)yl9h0y<6hH5`0>V4WS$uj4nAoE#h(uMw6qL%X`d9-5O`
zOd3OC>h`zSlZgKgSK7l=+rLvMkQN9{;b1|D6_mt8ecv6X(dWM}n;MTz>xF(E&t|xR
zM}-N*!h|`8E$PZ!#W_;Mi&BaNVMbm3+8pJ7YZzyrxp1K?Kts?b^WAK#d?W4`>^DL-
zZ%ykt%LkJ3AYLB(0u9mHIzw7@;*&K}9b9&N12C^aO{L<`z<_|v1U*WB+K<Ygk#PA0
z%pJM8Kk$_+Q!F$(KH}i8C`HD9JEoU+bE2?}%sJR$E4tW~tSg)o;`cHfMHJC{gW8oW
z##*S@-N?x-QI}}W4o2$ltSM5a1C5c0N=6v%lshhpgeBhu0(tpAlHmWX8ji0>f)wF(
zmmA%(8en>(Nrn10)?U2RAgpm5q=I4?1$wHo?dVlz(~2y1QLF3S@1vqq6Tb6nc{b&L
z<Mz0@d8sFYIF0uH>A}vxaZQf7)46Q9xpgN>2#Dg{d8Zd=SV5l<Bdg<`DzXXVz)hD4
ztkV1sEx@5qzn+>nyq3UL>(JsSjA%lhkH^$Ui%p?!*GCYFQkN)VWjg;Gd9|+@gmLqM
zZ}FhjadCS=<n|k*(poSrpW=#Vzp;vAG{MRpcfi{U09(uY+;;nG=xYhkI;7g`Tf5*y
z(%f%la=%x4e$XQ_xcwmKGO+{aDnN&sh|g&Yd*A5E!yF4n-t-V$YV4Y%j*t2tT=uM7
zPRP_lge<Pt2MtMNHW&pZ#&)DFY_Dd4Yu)ZKPyw$Sm%O1up#sQeSt^kUSvrj;E<i{z
z9w%S9#k=|G=#e|+{PN{9&!a*<Y^Vq~0=*W@{(KeuRtOj3v3C!wuFEeBx+}>j9)C~O
zbV2^rsl#O0M=W?;GW(j|ILYNM1a2qu?x?Icz<pzMdR&<PAYkrXtLAFiEF$)=NB3z0
zm4U9W(eE)nfg%QMA4?Q3LRe-poEew<KJ<cqE~+8^48#;AtuQYEr>mT9sgDs@y;*~;
zS@=^~{#<hcl)Z>#dBj#9)QHMD4b(qLmI=b&brAb46^eJQ*w+@>M%zx5?=;Ac6R68?
zFx%>+lf4zqrmz>|p6e<<$B-S&koQJGK~RFrQ=lNGFN+F3msM$+>A<@+sN>h&bcK73
zR0|n3x?jq{C732b6*knCv+o+gcXlSFzQt*FfApbJG+W(m=?j8_v9vaueYGy~9Mr5c
zV`;hgosf;)Euq<Hn(gXD85_N0;j~WcK0?!a3VbW{$@wmZ{=e1m-{DIm03=f}<Sfcu
z4V8NHU6jV>lcDd_IP9hYT2zW`yWJq)N<*pc%I&$~=CNGKz+luoiY^qq$sxSLdIh7*
zjsW;&i}~u6n^R)=WCaKipOKu74<!CK(V=1Ba2W(A+E$~LUph1)R_{!x+aA_BKcP`7
zp^2gfHqFqXbQlg8hx5_Y7kp-+BDmPQq^6L|&tD?J>`*fr@Vmm}q9V%P!$XAEpy9T<
zqFHEi>iz+0m@Cx;f2YWJ`-;ha=aaj>u4&p?<>#&@*XwcouT|FG+o{|&vO9TgT>N!}
zanB;-*{XIN@v>=Md8{jd{lR9fLl(pw>CQ9jQJ+?o8Kqclwd|wU-Ep0<Fs&h*M+yyb
ze==9KnDJnEQ6QfaM-NuvbG=}2JU{}gGCMuGYuiCVR##1T>->|+iT`y!wPpW?jFlRw
z#FSd?xpf`Fi7&6&g_YhT;A(Ct(2XfX&|8qP1+jES*?JW_T_%d$O^PeY;$vheqCAV?
zk4bq68&^%Z6M3Aymo0VmY^SK=R}vv50?Z3=x?bf!P>_Spp`szip@~dJx>mI023C0d
zEN1-5^tT0>EYXBY!4bfZ!t4-(x>a8eo{f@!sC9e#^)31q3WvQove!#u1kB6Ok~eq0
zRid7+8QFAdKytY^irD08&%UPfC5BSq;0RA$=EUoH{6kpi?dc(IblwfJ<gbz2$G~d}
z`76x9e1d={1@iyIe}AREPYOt%cYIWY1X5ENBROzT&S0d|`MP}XX~wq0acgbX>lZrp
z>x^aHSd3@BgRlmR&o<Y!IK1$a*)16Mu}7WBf+UCiAaZ9H8f0N|{r-tr-C^+y_P1D9
zC@www%0NH`=M%<-a=p1aCPvH}K0L%b*)P*X8-}{SJnZ#RJxvderL1t5%aQPBJLLLd
zjC^U6{orzx8@_*Xy*y1ASxSY{ai&NrngWH#<rn}!(M=-NaPY}uogVH`8gB^_L&%k4
z0!YwetT=}*sfcHeis1Vj6X&Z3Xbk$KKwy}*V2jakC36vA)|5m)f%!w}8vX);mh?rn
zDp_I9O$#2J!yIu;h|VGo+Cu>nm(!EvG>9%JwyP(alUl9HBvhl$4uSaKY&&Uxy0j~&
zA2Ww8WMPPn+x2>%KCIk*>i#X8rApBWrs4p)1CFQX<|~7C8(yBR-Q!+F+^Jvl_r)2Z
zr9;FWY$i*uNX6q&j?%%rOU(|brC%C|4u-?GO4ILw6#M1=O8dFFX`xtb%QifuPBHZ3
z>;FG4+bD9F{5M;viBC8-LR1B1RM}%&N~DnPyWjKDOq=w{nIoAL5^eUe*`Kz;KtUyv
zza8qjQp>`cFDh<%*K_?S=Elml+)_rbv%D!w6%pMysqm#}#;-i6(H87`Yj9KW8A<`5
zF-3xcFht+1VM#<&u%_wW<g-cmsF0$dbckpm6_JQmogk?++cQ$d(NiCsg~N$Ne&B^6
zShlNw6Lm!+CN#J=85Z)nTQbG3YJVmQ3ddw3Xw`VWK1ZbJcB?ZqUgxfOw(T9jRl2`m
z;3<6<{L*45i*?sNKdn5S5`tIB>h<(N5(eLHOK&xkA0!kN{=Wd@s32hmf^HTxQ!<Ho
zTrrKUF~0s#G&I4I*9ac7*Lk|vNo=s#x?W!jB|-=qZNP+y+&U*JQX0S2Lw0u0S+9O7
zoXh#<^l1|Tnjfy0)^zYE;x;xogotm%MsynkvGUW8x+|bYPgInn3=~NEP^HnZ_XG4(
z_bXSDR(|&9Rw1(Dr@Q4E>qt_El~>wy978Fr2un>K2wDVIsVd5*+b$>=aO?zb0g23D
zI(NOyed>66Tp%kRo2hJRAe8@lQ6QJoI!+#Gvp*$S*)gA@<JeXH>8bq3D=XFSE9&OY
z^gdcxQpjfeJXB`Q5763XW})8;<RJGq*Z>m1)rpInF?L@ug?q;W^G{%S--vvo2#U3^
zy~K9BdyVO6N-An?BH|`VH}*4{D36N!Gm&f#>z(P|=eoW+`U;9VZwaI#F`RoVb)AMj
zMaz}@L6buocFMlHTb8bAZnK}bdV}{}0YQy-yfPn^PzVLgiyLWvQV=2WLY-|6hI+U;
z=93W%6r;ew>53v1H4<m$bwTep%s^y;hbk}OyxzrcJX;S0wp&s8IdI5Z>6alQE;QMh
z901oUkLDLtuT1K7DNNWn#4cRkX0(GDbSF4G78O=Ei{g{$)H2oa(W?bJsbF2s)h3<p
zCVKOM-E@7PXA{`K>L*D9^8fcP{Kf76=B>Z;R%R%WTeCu028I5E+{&QJfGA_@co6FV
zgaGcNiK3pOVMCr}fr7YiB%qljp}-K-@_dk1$=0xoDQHT<F`C?k$<+v}p5MuwkQ%!P
z7M)58%?wZh5q3dAs!Z9xTCmL<`>$?R#WZm~P^fK7<i`M@wY?1QR+iiU8)XbDP*X#%
zkNJsiHW6;_(z-|Wx{-1EB0AZkpL8<I-ly~J@!D?ncmr<Vz5T|M01#TE-EmsmRI`Pd
zLXi@Bo$Z!zg}&&i4_=1d-hiq^`fBSEmU0Vk3XQ0oLYXXL=|OsUDlL<W>h9G2o+7N}
zQe$s~WIfcf-L~~^$gS6h;#n@c^2@&Qnlde$M7XgHO1$;4$Lr-4nFajWidjN~z71z!
z^UJFl^>HJrT`}<&FFw5x6&6q!O6%-J%^P%GS7jkc2eag{cy+zSPV6aW6M2hElz733
znO9{xE}#{US*qC-Fsvon;-WQQg#qA&SD1^2gGuP={9Za%&wTB^Z{AxU%)lMYRDt=-
z!@eJyn~&z4mr<yczi^x9X|P1}s?2I|_i$Ie7+k+|+droEzFYsgfuMP_t?N9HM$Vo{
zbADgz(NNtJPfuSlKTGIwcd>Fkmj#Y=xSkJ*Ejk7KUNP$l`!aQ7!}+RNF!wwg+Se*<
z*;1)uPLa2_x9bzT%m>EAT3OR}13iHGgzCX(rp+H7GOWck$wUCTzpv{`KFH)Fde)*+
z`l{Z))zey<$a?ST^8CbGs`ZS!O@FgGvYO?5L$S7ePMVrBk}E0RMU7cpQW8Z3vTbx}
zk8r%d#*U~wE;$dw<xUi5#=ajgabz0PrU>EnTqCKs-_MvOcB$AnIp?JfL%XLUfimcO
zES`0mT?5_J>AEQ1!w)Ma9PnuxL<R{^@0CC}Z=8NULtBwZr)e;5W_3%;)R`jsOBN>F
zUuR<6o3ohBVL3iD@cW{FscfN?PJ0NAA(z(k-xeD@*7DS>x8L(SL+`5?wsGv@#`Zaa
z{`iak1-W$kB)BeiN{I7cCF9>-6C{2(fPr~_QJzEp^8y>+uZ#jTk#aalKbLfIg9nKu
zEd<O}V5d&t6}%1<iT#R@3**+7N?*M{B2VMbB|gKM<zwwcdBsQ+<X}&ONS+rx8u4rS
z`4uXATIiJv>X=`SSlq7x?4xp>S3NzsmWyudJrKP+ovXvy-i}xofbxDrXry|SL#{NG
z5K3Y(LF1FlNf4s!v|+gdh3c;PjZ$35f6SPX-6P)=xF-1FF#k>h>$*&TY@kZm@12x^
zJ&_jOiCV4pJJfVV2Ci!%vS{;(Z0PxI>cKi^-zoQJ#?2*Z5Z;AH-HYp#Yf2JB-O`}k
zq|(a^LD_c3n<(bTy9+@xG75<pHFvyhK0vtY-kaQK(3|?ui)P`nv{1+BG6u!L$%VD)
z^?2Me+N`IX!sn8J*Z*Cis`&&~x2U03``6dzLN^sw3g#2oA4lUxYaIpSnT9ddKTXDT
zPgb7tmAfZ599FJ_rkfwJSe$ERu*{B{3~KX>;vf75fW<4mFMR{C>-YCE`SONue&}t}
z)jQH1rFLcdt1%)&l-BMO*Z2^rl}bl#k>~2ZHG8!zt#liL$gn-Ph?wIh;zQ|`%QPaW
zmCM#6d*w+g4f%dpSv^cuRTeHz%stK3V!XTBBgQ9_v<ciUJULa6d|E7bns!v|P+yv;
zyngY4!(OHc*U@UZ&2L`^>?bOvQL8l|@UV=M*@9V?SYG$t4qEfN!k|xkN#lLCbi5Rf
zRBWK<ou3XdSZ^Ai9;9AFr#VvDZAIl>y0E)fRb;$6g%7Z{-a!Sj{|+bDuwSBdbX6jV
z&42vk0>UAr5j5|!7s?V~?4FMDhjgB$*o;Od9tYea-Fy>%xcZkaU|+NtB1!h`%N~<M
z^YYB{y>aFE^5ZjDO;Vow5`$;3itxfQkH0TMSV|p<@VjAmcZ#}}g4@NW@8pN@ae}!}
z5`-d95H>bPYljkok{JSik1!9nNpL%OpJ?q?zcK+S4h&tTzyyc`(BhpbVp*!|T@nji
zBJvA2tLtw#zQf+1(E|ckS2(t}&$E0;(SYjpHoX>u>4l2<V)J-@LtId~zq)!OpwI$n
zkcDb5=KWI?sMlh3>fLmyR(vwLLCNh~Xlte2vGtT;O3?C&(oZM|kJ#bVAg+#)8EWZA
zV4c>$)wBp!6T8Oi#N7e^afIz*<PcVn(1}?ZjftEr>HvDj&}l-18f#}1jsI&ec3?r&
z>voYarmaj<>g|Ite$2t&;+~>K*V_kXCgYROu@s{VZvEEgQMIx6e#%I0_d}W!h4NbR
z7Zx043d`%8{+_P`J}VCLI22CIR2#eogsrSy)HIm(VGZXywZ8b}*VM{1$nTV!lr$F*
z;8Chgf)(8^4nlpw5wQ1u)3pZUt}~d_g?nuFH=nbXi@2*Tg;xdr(H{kcgk%RG-`mI(
zg?(n|X(}9$?@?CPwpWGTm_0Rp>ssM#Nqb<X@Yo(UNZ(8{^o$cy`8f-Nn7ld~(|z`_
zK;l2D^<O2ugBVa>!oip^)q;Oq@F|7p2W8M>b7*Ydejpr8;tytIc{Q<msVh`#zx}EZ
z56ocr&z;$XQ$RIOWw`N7U{E3FV6}Umt$k68h590pxrC>)R{g7!BysU=G~3NjL78$V
z4rTBWod2gVSY1^31;3xe*hew4WtMoMma`uOXfUa(j%T2Yc;azVlfetXrb{>_I;{{}
zgMO?_);x&iV^^)sd2Vh|T+qn`w$*o|^FVgNA`<wCBpEY4A)7A>aJnu(7cb3t{JVde
zm8e>_*j>|^PDQvzxu54sGU_Z)RQg$;U7Ey7!s*I0%I+=ka?eEVRjUal{Ip|p*k{EM
zv0^>o$=4#V-yQ26F?W0f%-hyfno_G)M@>099aM1u8~WT9sgk|%>h>I0N~hvzD)%+r
z&8^AZX-`q$J7>_|9o9R`n?z>w$Ox{;uZ_!Q@z#Z|h{<cmxa@uw-H{*sN+j77)qT4L
z!{N^q@xrhSCG@<g_wt{WtXuih!PL+iCoq`w{p0K8(z3ld^$Xebp-_-Uo3iO<>z3M9
z|DP=ig%RlePaV?y=o7;_QmcT-`%^cnlM?waCix#dhSL}Tqpfc{<Y@kR0n$AjR%l3{
za?6<lZ>SX!jj4&vppBkjc4B`$jT%?kxQ4t+hti?rU_^0-2MBWXsYqIXi|NC7S05h@
zQJGHrwW~z=lnQ*J-pAkBrY#g@I&LCg$3r5OWpt;a#p52s5;>pKM}?0v(%fV(;k<>-
zsuLDt_Hx+&Tqb9XUS!%-YW**8Y9cPFOpBah_=XwBblS`>xyBNXw`z+SZ5!kdkXF9o
zG|pU<A~;ObjvYoLJ`B3M@gVR<5`a@yPrRE}o8N~Inu;M6IY2c*7(o_BLw7%f^5`<j
zng&ybGnQ1d2t%Mufil36odX34SP#e>%6iXkF)CKs-{w*&JDC$=$ZfTfo+12jNy;3v
zYBV%piQ!;2&>WLz>`snJx0R0_K6`y2s$X6qSJDa5SGCruAdQApi7t-^oa^_dK<7z+
zU}IVD8P(gF%BtxbLR9ln$*@DixqXybHNxb1?}_YRIWqDu#q8f6%_j+D0OU(V<+%j^
z+uvUxf8K%Wkd?i)x_=g+A9!2z^a;JUUJ{0EOhH&u@f{W_k>q-mEvn9Qj*c^mEoGRu
zZ5@q5>AQHcbhWFPZ{cwARWY_-KVby3t)xk~7n!qhrmworDKA)*|019c?hR_>R}#pX
z5&PY*xa{l5a7g8|fl_5M!YG~DUU0eC<$lphuf>!OECZc>9r13hhSbMbi|C@?=#c|Z
zhJ;o+kG1*+aIn4QkDFgZj(@!*yXt#!Jl@R$iYi-fY>nxb{x-@*%%rMrc6SP5GxVA1
zm%ySHQzH_LqOVCLu3sND@H$*j<nWtv4_M>D*NFnFg-I0ds=aqQS{#25(K)30Zf!d;
zjfeoCj}@Hti*UGhcnq4Lhubrp`kg%<c)hx_Smd*<s&d{6KpJr*1`aL}34{Z-ep)Rz
zg6c1JzX1t6tGRJBfv_5UZMidE*)R$KkK@*|FReg#ghV=SApf{SRKDCa{DA+1{?hH)
zR_BuDeArUiLhA8xXQ;M{YK}ZyLXG)+1~<+Zw&GG_AaG{r*<f{VAGIKItUPW{1J*7p
zYu4$N<bDIrEwM$@x?KaaH)wZo?>Y}pw|!j74VMuzFE*CFF1Mr!_%mHg>hD}7(0B|b
zKzPc^lM@e~)LSZI2JvsbJ^9+=5o%SMzTheA_eNs_%=Fa^!aJ+wCZpy3Ru1PK1|{dx
z)}n99V+>?=&vr&pWRf@;1d&^d3ne9jU;B?O+F@HCa1;yF5F*ofFd|SBTQJ*RvWB_i
z<wA|SH8ze|{Xz;y?)hI?-r#qZ?^lkTlKL~tYmgF#h1?O$4?4XxTzPaj*>022Ol3VG
zRJptAndDZ`CK^0G-?7E+NC4yxD9D{h!08E3uatH8%2VBoS|vzt(*2}`CR_TpNp7rm
zO9t4UuYG@0Ed|bYoH;!4tCK`|oTe#Nm+kMb-^8S-rZ1~);$^eapw`%WdVDidwERhN
z{wya{7UHfN>+$UEyVKcGsn+|!8#sw2mB#_+9P=R<ID}{yDuIqJ78v3s=X1Zy$8~+E
z9W|aUF7U*m`(>NXhYCzwD+)_(AcJbm)ygP+m@%s4#f9_JzoP@12TWwp&9s)f{VRDo
zQ;kYfP9~#15~uO_I<MUd^h*a90W-d#^}Nh?w#p!v!$Ncl&BE-qF6vxAJGsC;I=TdY
zt2hP4jf`|Yot1CMTpueMGeoNPP7*j3DL6EL5p@jdu5pX!1zhg8dGwJC>fCxZJWRbd
z@^HW4gGNC6wZ@P6YiLTuikZe3PPgu4=6C@+V<tNCG-@%Fc43Y(B7<H%_iY@VYCdJy
zrjO2>Zl;?7+jf1igZqnF=AWjE_}2tHBTk#w$=e~M<-JMh@A3J3#4pwE*jzqlUMm6h
zPCAt@)MCCyZ@JmG-r(wJ5)U~3VhoKm;sY;!GMiPLm8dd4qdCP~4LUgTklh;g>floD
zLNuC!u`%)M6qSdof2y+Z6IGru6Y!FJc#^oFL$N<UuCGT-HZI-h1M%zd55B7is9b8k
zNd=j)l1CR87z1`Ncb#b`eljUra7}6I2t<f`Rze3PPb6>m^yLJ$4M5Ued}WWHli6r7
z=n{P8NX7HFm{?AZCl}qW+Uz!QH0o_Z<Ox?A%~&RKp`hl-bRH0C{9Zu2OzMBvo`C*7
z(3E;lM`Yps#|7RT;7_ElSZ7-KG!-U72dI?g`o1Sel{f5V=7zj}d1g@Sw#lp_Iia+e
zGEJOURcRfa_YrfoQ$;wyx8P9>^$iRoGSfY|JU-a;3tvRhqdrE4QnG`D@J8&FxXS?<
zU>}(A@X&qS<Epmu)e(Xzn(Bp?Bo&Jt2Pw0dOLY5zw;QDkI(&|oT6|IWvtlLSQfjr!
z9g-tX-oKr|5j5KNVN7T4K0O&F4#Q$qLiV33*E8Ig;P5yLk}-FBZY5SILFPlwVDThG
z-9M`e@O&35aaRR><3enL;$Sa_zgU^ztJc`ZEu!!fOI6_DiWXNU+ZwqO-`O9bYj46T
z45*X^bF~=;=UZ6(j@gBWLyHahstwJ3_^Ry@CAhM+GCHdafU{gE)is=zSQ01n0%(on
z&D6ZFXZn~<aeCjVbO_^26-q^QdrFZo&u;bU42_Z`hR7*>%R7f!iNc&`j~27TG$$r+
z=m#+MetOwrB^ZBYp{`dp{Za=_aS4dLxEyH6!}(&~@TU(vw!&4BqNrUNCNUyZ-0U>!
z5ES{mL7A$OFLfV=a>NS`x{g{+6$`anA7%^rwuiJn?K|QrUL`PKq27r_Ra8w~UdMh~
zbxMtE$w&=dnRnbVKjTigHk-~x7kNiu%Hfwe)B+YBRUTZm*gNiQyhUIPd}NjYzdr;!
za;pnfHV<{4A96dkLVI~Ng=3mm7_<jx=@40fUKhCoJ;8UR9nY^jM&kcR*YVQ=5%832
z9h!`*{;bp;?_cFYLF)7Kmuv0_P?gBW;Iwm^#M@@dU7hDOL%ZpswzQ|`$GQ|aF$?Y%
z)lmx`=T#sSkj}jPE;g12ZG6sVeyFMgCudZ<7{aL&Dj7}Si&TQ4Hj#-KT-KafOcrD&
z*>|2^D-@}!14RMA5(04pi8+OQ^coYg^0h`1D;@sw7V}O%$G7Kq5E{jqT1(cH50kP=
z;c(6XBX^hFpR#J3fkS1Dud%(A16HJp%zP;ix*2>^a?25)AA*$3CaI=z!b^)*Jeb<@
z!fu-$<w$@jBtmj~pH^-_^c?@&T>!as6c04r-97wtZ};w06MMu5ZbSPXT;<zjp}lO<
zpi4dn4d#k+N?9Vz{0J;IVP5P?9@ht`*rF+!pM#eP5lO7EY`q^jZb*T{hDj8Ozk@H9
zes@;Arf}Fz3PQ7K=AbZ3(>Wa!Cj5K@BYuF7n+vPk-&}n(ddD5>aUN%Z#b+7@fF>TX
zgDUEmh1J0PYgQXQ9hI9sE=S;c_dEEk#<QN12-1EW&FCo)%bzg<#F(8*1z*(VwP~H$
z!D!Ui+nYtxrI{ZaFeOM!S}>QJJ%o;%eXUo%sWi@IXyU#lDD>?09liz>p-Wu0&X_!D
z|8cj&C2s&v6wckG_=j*79_ar+E%RSqk>4<Sjqf+6eKh;b{pSUQN5~9huO5-nFB=$Q
zc4ZQ@{Vc|q9Fi|=z4KX)-Up0Qjtv-SV$i0#C@9&Cfh-JsW_pg6W8ri=qtx232r%&C
z2HX9+F}4;n*6>fa5-vT<-%s7wnpDdRwUHv}0alEUqio5JXw~_(BwxO8pKkPK<zsQR
zM$}m^nJYLHWX`ovjz-6+6qtt3h3GAAzBapD<pW3H3$Z(D)R4+YcLd9pYYSj>TEmLP
z%YhA9$!tUNgT9q5tJurZ@*$_vGa>6XI2?vNdAJpRv!eqYiYK5|nZkJ$DHP>|E*0T$
z_ylZ8CTp)bLw=1eWDQjL`4Ii>0^t2AT|38awVbJ+c-F>NcUtkxIY<G?Nu?&*7&L2g
z`;q=0XddMN9uQu)_akUey^mqB#I9DVa!3tk*Z6O-cm`&eY&chVqRFL8&+2S1sc={o
z5h$vJ`w=i6gH`Rein^lSW_s8l8#CsOMT>`RzG-y)2rRj6y9JH<Z$@aW9623@EugJd
z6krl%do!yT{DKhQf8$a#?bT;G=GJBiHKuuT@8vdoY+|@f+?GwcKAIyV5Yzh7U`gC1
z`5>glPBW0kiC9`?ij(AUiIUU5e%Mgc#>Ry5-}#bF{BOQ=RFxHr`o{%GPH<SL9WV>(
z2+u#N%<Yz;%VobgJ<RUE;W0@%j@v;qfhXSVo2oosli_){nrANFwivWot@MsRv!kzT
z+9GlC^%3)yhBI!ji}0h_d}UB0_JqLO+lA3ywHoC+FPnhhTo?~eyuDYHmLbg4^yvu`
z3CWtSFi%uw-7I)Bjn6G0omz2H-)86@t#~X?xoW=BZC!qcJT?{gCzO=NSJi4k1B|BQ
z*z)u`k^4-LY>^1-cUol(X!wnBH0-`^YWX9~)kZZ936S}wUPG0+w@ntfCvP-fy|xM+
zAB;bGOGF%$%G!<xbkTRG$<X;c?}7jak+|Yu<9HdKY;~BL@JxohGGIh1Io{q_`3ejl
z?(XNpE0=z0zeVtLW!D4uNIRql8>FSVYLy5&LqR5sl-eKanEizkQ6@xF|G~fog+1z3
zhd*Z0rx>r}g5LF$N9;6_qC}jXh6Sq=j|E2dj=Q9fe@>^<Q~_N*TP@dxsyXcS)98Ro
zj#0}z?nm>U31j)$PmJ5+p}d3uKqmqKH${)y{N`A7I})iB;mKSBl}bn6=8EH=CuI1O
z-@)wYIe^hEON<pFBY(79Y@-*3&8tCAv$d?;aDCLN<z?ZU?)9SC^VX-$A0b2NzB*sI
zrrL1AfX}d<j8=tZ+U#r<-QcP2%WfSMrF^!+%wPeH<`LZW?%Hs|gx3CD5=w`urXF8u
z!SL}nf!8AidTu6gA&t3ayo0da@ZdtEKf>o9QP?KrcYIB3W_JD=fJpCQVL?ACJfImE
z%@a6ca7kb0Z)hjFT4;7CKt9I|Zyd!+CozcG$<rvMY>>OzK^J`|YWB)ouvkebs$%)Z
z7iqdw70N6?gSugwvlG@+R0UJf&G%a?u7W^(i;C2Kpv5}l|0Tyc32&mo*&YDzdc{t1
zmZICXAQk@LMQeLtVKv~X(!L%lp}LPR(~|K6VN8l4qjQ*qcOUZLtn{o3$>vIkl1N5R
zBoviPif^FFB7aQJt`9}n8crrnp=X2BWiM4nBnKbzbG0ER=zQRG{lI3ilzBaYBD#n7
z7XF{Ie>rt)XPDv2dTMiZ$Ymc;Q&zU5T!e%#VE$X?Y|)}$l>z*Mom%RX*UcGr@lq|i
zBVU^X3^hG2W`bwRO=3#TQyGaHr3o<aZr?y<f{Lo!s!y<pUFpp<Yw}S#(l{Jp*;FeF
zt8+<%G^?GFJxlW=riw@{fm8_sH9OqD)7WQ|8RT`mp!jJzD`CKH$Po6zd_dWhnXGMV
zx$_c-r8PX6ozy9dGjfV62CgE8Ts-1qyU5z?xsjmP6K}J_IZTuD)X44yHi7-YLgz?v
zk=^Q1`A1&`pSfWP>-()sTorXAw5u50+wDfpK&hm))t-l@5tPJaln%$ek(WX+p;|B_
zcj_OPQDgt4{eKr4?^-ax&25g8MnnF*AZQ*+BKT8$dVbD5?HxZElw`+K<g;NK1#&;F
zO4&LCt5Oh4IH=E~ji}uf0t<;-@CshAK+ja63%G1(m|Jt-obK=H!!PYzWVKQQ0yk51
z1QCc0$&rrr*{wR`z04N+(60$9Rm^lKMe1e9%}>|Fb2?09T)gF8?*Xx;@IexE6dLxc
z*SaEFN-BXvhvsa%-)si0v_7tfGLuM<uTFfkPvxg}gf$*S6v^%87vIK!4!MSrewdd;
z8qh>?xw$LPCY6erL$nhTIMBkKZfjjy8j)0HS9Zt37dY4mULVc25n6R0RI3(Q=@bWw
z48%4k9pb#|UMH&crCOIXS1LK9DBfr^j5nTks-_n~z1p(7JjxVOztEjxD}21UgVBM{
zZ;MpTHmjgMhSH%#qxG&o{;A+>8z$;xluVuN1K*CnzUX9|3vJZ#+v{GMXj8n^4{9QI
z$D##ZHjY+SYAtFvcmo~-!MRl7=u3?@?RN=GCYj~QapkrDhzW(#JKMwg%jJ}Si}kgq
z)_d%U_x=dzO1Hg;fb=Zn+eN!U=E2G2MgOxII8(~sQ&4GVA_EV#<K6e<3xkptbk{dj
z|0^Rz|IP>-23es0s5pUewVY*ODKn#RJd(DMn6q(tVtiy)^H(-r>P2h$IjAN$)q$5>
z=fgB9^^{YO#xy*FhE;@D-L9{ErpiCpX}IYn!a{Tq9vD6Cr?{UQkGTojZ@uqZ`BaYA
zubNVsh>(68SMAA#lYV`O+|5_446sg#FZ-esa&Hd>^F<I241SBpCF5ModCX&b;f#T8
zUupfpGA!(uD4%iv)*z$h0IZ_DU|nRL0d17LFv!n+sg~$BW?U%#9I;jL{lWEOFVZ*g
zy{Mvb@c6|$7--<Z2UHcwwDpeuqApe||7?@7IP&}9XWrVa$mLY5BGtRzhA5u!-1wJE
zTGD9bBRQHQhQ6Y%IX@fHbYrmYVMwh*MkSG&L?Rjb8_+Tx;2*gH&whq3Xp>MXox_JF
zkr^Qo>Px+!%Q@!SX%_jxeF;}RFsTzpG`O5ws8W!`5N)b}pj$aVtMj~+nk1`6ui5NF
zHkftA|1gxs6(BJ+MHRp^XEwS<igpE<l&!ZWkkP?M^FLjvH5xoMSG9ok7tVBAVQ-a`
z;2RppF0b)993Qe5vZ=va$Np1J@8EP56MFxx_xFE45VoQMYM)OFH0&Q@AK|M}34p$C
zx(*+6iPF8gY^dQ<Q@Yrvzi;1)+KL~<!6O>fm@*h0b4fLyI_^B)hpWZ(pqU6QFV3m<
z<u)IyL@g%er5SF?+tH>S1i37H{7q%-N^}p!Vo1aWGMkUW6@HGati)5OL!w7{MMPFe
z5EsflHEX34NfiA#F>6nEs;5geeIt)uR2UiKrcN*6RFT|*G|x3S?O?G*x>O=T!4LOc
zh>u8WYb;H^0<AJg4VG2pVzCPF=h<|mV)5PcPF6XEhWNl!Bv|jxR2}bXgDj}kbOTIG
zCwW0-u@m}ydoVirVw1FANqg??d(EblN@id=Or})~X0_$AH(*8Rl|-iMHWDaK4X3?7
znhW3PjRplF9^2pa$UZDpMwWXi!0R#__5=yNxgyk@``K2v+~|Qo_v;DmPIShSG7B=S
zyqXyi0=tT^H6&P7NLN^ZNppu<xfMiAM6NU1Z6uWrKdp9FbL06IVBvZS1-X`?1Iq{{
z#~*+(f)y!J0P6o6?*ID(VHog2?n?a${lCHr6TFl}-nk~-fr2<0_^60}qNE-5aY+3<
z9umyL8r`7G7mm@NK#j2ze)hay#F;SNDd7CUmXQxC$e(fw*In%+#f*9kG%E=YAc09b
zPxFX5n#a=dN~Ll5eW#QQaC?YM=gTy`<Z6QrJ!>T*wq9E&5sya097-S6SigUN46#`^
z)KrkH`#d%SSpl9?5xPsP)-b0XMjyRqZC}w;F=%I7#v|ROlJ^_XI0xJvI@f7UGp(8V
zVkT!Dr^aKo8GwETs7-DB3^F>XifzO}hYJv5n9B7fkjY=QRrJHH;?Z)6nexT)yu9UD
zJUHw_XiK%_<Rr7YkuEZO<lg*-|JPrk#z#{kmLW2nd<eRn-+<#3bOsAIk#+6Prz|E)
z$(w6#zB-sT_=KJeN)qsU3NJtTo?OneXKCJCA7=Qv>BRCijnH458%-1~V*#=+YPI?p
zhu)n2M3Fq0BRgZ|VdJ#DCyq3<?HYH!s7Z*@{pk**!(L1S7$jmnZ)Zo|%95xZp#gd)
zU=!9M`yalPAHSWLINJY301bNeDp&Z2TOI60tO;TeX`B*~lR5{)OO3J+l$5JN!!0Xh
zW@0mBncVuaDpY!0!%3lXDkT9&m-aUqoD)Z_!B8sxjBGwvE8>7wU7)#evrS<CSVE4^
z>tf!=D))+<&-uQ(gi&_}X_e=<LT8o=(`Fn(5`<3V+Z|SrzrI&!y78(e^NJKL>Z796
zsPXUm5bzeCBE@E*LsX@~(icd3ZzBn(a%>G~)EK}^np#U07H<N=8SttUsiVmVdSp6^
zNS6>?9&vK|l_rMqMg`q5fdfUqFm#zeKfT6caIO_>v=~^Hv)~~*$aw7*#V7=``t9L-
zy50g@Nra5>1~v~c5>8s%Dzsd75nDVfD44W-a27xhpI*4100eU9bUr$bR9|^)cWps;
z7b1b;6qx@7Qu2RGCiz6->wiMnPf!zoffQ!s9k1eKG*~t&J6u$vLFVUywt{5c!ys3q
z)ta}CO(nCtqMr$`px%XGyc=zukAOI`5(PC89Qa=HStjx1e_Z|D8)<9U!dSLB(x@v3
z%($^5lq@W0y)i|^Zf8NB%4M4E@WYcc`&GjSm%<_|9ps7YjCfV1h09-8M$uBmILt&S
z!iIfj6w~@;swGS&S#R1hSuu1nmGlbCwxzIUwA>XQRx;Wl9^00Bi&-Tle<vlPlwk!w
z=>mCxy#Otd)?L)VoYIgK@G$LAhg%m)r2dDM<4}Fk82H5x;&ITChBP^!_zAMb62%Is
z&VW3oyML7mukK8J3cQ(@v+sZrpkDcGnT)%W)7L|3m#rx-2oB3SRDl$LaV8cgP*r~h
zs5WhhwXju2$1gdYZ@!f;evb;3^3`f)*~~S*=Cl)}7}_lUFmqkV6U+xD;&&l%Q5An!
z{0TDCXtWnS!YRO{__?L}55;ASY}A!-FGH8qSW52`{&T|UFCOw~0kBuk)H)3scm8=n
zhvq9m<Q*r_R*dq?nRcR%iu6GTL77FmL?Wfa{RMpo@t;nG_TMCbiLCXh`=U(}Nq$6V
zhN;GX{xNyd&>&V*n!mum>|`IV)vbeL&cp%l0%kSy6&Ii6`1JpKw}4d{Rj7bXJ!Fa#
zwN2m4LIojk?JA_?EU1WX(##voJn-9m#1yqMZZvGYJ%k5z_?1@8EJ-VTW||tRvpzk!
z7w(omKeF$!o90%C!_>slGFV=~0(`PcSPB^(`K&b@gvA>6j*6Bn^L)_Ss5^BUoxo`*
zs}YC0i^n4AXYGm`PB2QrbA_FNPF;GD@Qs@IeTDGQaVtWz5ldj9S{B<8zw?jTp<@fr
z$k4Gie#~~gD;~x1Q{p!|W-*cm+X0O0&%f>vas4e8X7ZGsE^eBV%O9^&8}b$Nnlmk)
zQdIN541#oGsDL(@0OdBk9IK#<@Nvm+>j`p})8SG(QPDfpQc@z1Z10~5p$VcM!n$iE
z^G@13C$cMTTMq{f)DC+S&cBW#8?Jpad2xz=N~N6-&wG0`eB+cSt5cOt<1m3&DpAcV
zPgKWd`9T2Kkn-I`b$<QIFa$ZXT`k`1oT4g}7P`L_*uRT&EDid`UKUOl+v03vovxy<
zwHjXtm~j&`z4V{Hd?Qryj;8uE0RG0MUy*^b#QLiHm1J)WDOh!TtbQ5m;Naloq8Bx#
zVFg$>QMy9SO-acmS6!@nYUdB%lT6NjuX)SA(1hy;^r{Qez@Tomu)!!28(lP7weOEg
z@@RFoo2{YS^hg&gd=Yru8L;Kr=5I}jU;W$nLsGxy!hWY+c*aNdUeY5PF_z$p%0)*t
zF(q-LuM!b$XVoy2kFwSC0oAf0y)=?9X8+qi040)3cN+CC&7?s8=lR8T%h#`8?MC^m
z+|y5hwuK@~KX5XY&VgSr#-gh}l$85N4T(;WV!-ZElUx3(+AzT0*exbtfrW=C@b|Ss
z8kikVONZ<i`-?)g*9Aw+kb!ae88Yk|i>0rbppegsAkW_}%aPi|-ZwFT>vH<C!DT-#
zvxSs;+e3=jqu##lW1V%G<6=NtpwA!<dshdXo?oUGUqT$P1+_Z@izh$bnh!s!Hb-4u
zquEt)@=LRZDvf62r*ltSMq8Svxq8LX<2)Z|h}pfNzvP!X`&)PbM@^&IomDv=O}qqX
z5eB?3I2<bim{{x!1pG*x-^V^Ei$7qgLqS0Bm|a)2raDa9NY1j@778t^SX3%G;*pPE
z8ni7^W$mEF<7nDhB4?8hyKqA0?MAP09zC8OIuRCm?dT~!SE@HRx<JgjF(#c_CUkaf
zrE8_rDHR>+j%Q<fv<-5~PeTggQEG>M>MCVQ3e|2N!yiv%^Aqm8w1u~hq2Y8nZT{a#
z$iHFRubjU<&62_CBK8M8o~x9$fQzP!jhI{=okr#bYFDJUuP-kOxfo5#Mr(WbO%s^@
z!DBrDXzhwTJy=(Fv#eUdyPH2X2$u1^X4x+LQi8KJl!iZRpgqU(l;Rn?#gTHJA0;GP
zDS~*V!5Q2anND>%%+EfW<;0KWwv@N`8Rp-S9a2AR0)}^K8#F#TD^83B%$o_DgbYqS
zg<uv*h>B}t(pJ)%sgMLDqNow&u3k?V$xKi0jk2=A_xAi|Bmk9lH8*i*x+Xz!Ht%2^
zbW5jYsyQfUA&aylP%{Ble>xg;F1s6_?ms?skq}BM9>1GKbQTB<sYLjS$My+&^<qs!
zLnaFqT77PHk?|tW_I~?CAT@_BVr}?5TL#F?n{A4Ek1pv>$ICh+KUO*HFDS~WqIuoa
zJ$`%gH1Zjin%v&xjcuYG#ufiGU;41#9Wn8NY2(uDVwW9>Z>hQ7?T18x+|EdIxXf2_
z0%38aWWcrxb#reT0^I_Px{PL#Ym<k@;oNbe706`^_s2;x+Mf_MQONSWr$6799Vqyj
zp{mU9u?8DzoTNI_74Gi!8s=T=F0+xtD+7Gh4BH$ru2IX<6i)j`%cc78xl5eFuAQ-6
z<+nH^%0OaVCGOHbueNBb21uBNN(<dWo`hV<qS><N#V-G6gGfrCXZE(fr<~|x!OvXs
z=ciCw^=cwL7_)5gco?AV9i8NNTYrgb6S9cFbLuvEe*mY+VpYeCnS{?{kHyTpwerrb
zmY&qJECQSPRXEPXbfdD1R$jEh>FPMRAeru3qZ(?npOe~LZu2B6>wuZ#Ge!B)KcK3P
z>g+G+uPO;1x9smwRpj{Z<m@Y~F%qFbF$|XBQiTccK`1&p7Zx|jtfM@`c)CmSd^X1Y
z6W!H9pI;Ra!O_XYnnxq0hyjSBo=Vh`zqSdUyY+#M4FXKN=Ui2qtBf9n&G@5j2QCN<
zUadqrPEYQhOFZu-N6Q<>Yo41|-#fNV>{abm^*!eQ(Vo|(ehGp7o^Je*ZrRI)oUag`
zyTC?_+JO;|pqmriPO<d<s@0W%J(SqN?n`9KROa$h`<9lg5AgnBm~fsF)>N&n>EVB;
zK5)eq45yk3IG5qIL<&L{Fkkp2RKybhYxC=QTTLUs*R2ok!Qnw3;2BPywnA(7c)UWl
zT54<$#cXwcxcSIky`9}lTuBU2kC^M7B}5NbN9AInFRMhQfc8(s$gM^JFt9VSL0ceI
zp7q2uFOjnn(4D<;1w11}EEmib`n}nq8ha}WA|LJ5>)a{(VrjE_gV?Qg4%WM+TZyIT
z^!r2153~xui;XTV+#)bIHQ%(RjkXS&PlQOB7&>Jn#}USHvzw|A$de~VL=PNudk!ax
z@w#4i1InbIrG`eM%Q)BIK83^D^f{n=XX|H*$m0AXF&f(zXkdq849L!Gpg$#=EN4_w
zty!33c5Dr%s$)7RHe(hH98d30Tde?xN#5L?#^_INYRz2F^(&VlJ*<%er=A9n=MAYT
z+|Z}f=mmsvF%~P{UD(=X_w!KMZWglIuMZ@xM$DB~g+=sc;dnjVL@lyY`Ym4uq+UC_
zWGsLE7+|<D5cN9n{ej{vsgSWTh2z0OID)6A^Yat&8D>vlZaD78hSZXc%s#g({I9PA
z-xVH2-MR_*sGv(R{SQqD2S}dOFylYI;7KHNsV?*stNF}0m?>o{z>yDnsv!ag@U{c0
zT2)fJL78j`*VbUv^AC$gZm+F7w@5w?+k=EQ#zJUFiF#GX4syE$AF2{fh#~+WB7<Xo
zmW5~VPyV~M_{sd^56V}MbPpP~jiw1t@+dwP{`>YnWHpW-`d7<?p?+kFWpmD4R%=%?
zjK{>koN=)ET8e^qZ}c4Vx#c-Otqec3%S^9R>f0tNc6Pq51p}huI_z)C6or7E9ABrm
zFQWN<xTiEKbmVES5fPt;C__hIfX@-A$c<hAytn>}$DKwIwUQjgElk+yAV9NR!Re#K
zne@^(KpU{XHU)!mdF}Qn#`47TYCze)I;{cS0aGL>tj9UPBZ<w_Pt+@nnFU;EDS_1g
zCXL?+qfpr{c;Z9j`P3mdgMIBO#TyS-2XN$a1IU!l6H$y?S;76O!eB5Yrn^H>!=xgy
za!Y4)ty4}hzS~iNMk_lmK?{P+OvNL(?*knQ(HSRWZX5)*K-og6)tKsdzG3EdfjSnW
zn{-&Rq*d2G$X~^{|MIr}`30-l<Ro~WO=IjYA&prg%xnf@sa{Dzk5B3^*u~bU?DO#N
zcm1DgNumM3E=4Uj&$bax48M<@ZgpzZ!BCL?_=n&S^p3os)9pCzmI~AG+s%FD2f4Z=
zIzr#6l&!hP;ZzXd;Z`^TCaD5Q;Mq>@264aJmj2k$qZBZoUUplVIgJT{oNo>ylr7G)
zrtjKBmF_qp;geQ7%xgK&XH&yu!z2Hjz!CHsDlGWZ<8evbZ3A^XRJl1lmyRLJrbFFl
z=GT9ru`+iYT4Z)yz141&8%B(1DOSEsE`eg?e}oP0HSGeU#^3srvmK?LC9xVf5^N7D
z6BLx0%^_RzaxTLn0&1nn4@j0sCeW@aFm)V?td;JIz+jg+6+kkhk;`56bn#ezdcCtK
z?c&bq^`ge4J?V3(Zr)&mKWTqlXl_-|;0&W?7uksGS7R}xWD;53V$Jnn6sfuAQ$6!9
zOOAUNst<FU?DCfNj*-~%vfY!DG+I%p%SJJVmW9S;fmg>MpoR%++E){UBQw+^mqM;;
z34^M#Iby7yificSp666sKQhJcAa$Hw#?mWegklbY&-8nVDm6~tJS!GXO@QXu*hc0Q
zsb%UFMD^&%=F=cMO>~nQ4#<(9p}*f|WZ8;8Eta4DmY0ZrKVo^+3gef6{a$vFurde=
zqVb8#ZVt`=TTIK$qSr5Njg#x?%Pn#$7rN&d=p70YT-xHDDl7iG3xe#5!0unta%<#N
zy{KM>Tu+g`zqNv)g+^6*2`p|gh}6<ZDkzxO{vyBG3}|kj-dk<)Qx~h}RhtexzIm6a
zyj<QRb?2?>{pP8sUFsK;#8UG%gJ&DbLZbtMBU^R8Rtr9GfF)vYGynB|zsk|&oY749
zA65y%Db$|7n%dJQr7;Mf=*zuaNsBiqDfP0-ExU>0rfgCu2Y>X@(vB6Y{9x~UE-N#|
z@BLxaia1*Cm3pR>#1pbz+25nWElgl$qW-;`7q}VWZqqbMr86j_l$*G2H#>}licX5c
z*ndgOSFIim4x_r8Y$az6PRI7$cvXf(b4fn=0YI4aUoRDb*)I;B8uq-CgF<=gvl~;v
zA)3|p$SLCS(aD2Uziso1X4Ctbue}V{*7L<Qe$-nYiUDH<3A~-9i*7SE%H%6Ri7t$!
z6eynX_TsB|x*w!zmLquj;V^fhs#34(ug^qnHC4+<7Df=>5saF=NzbX-;E4xRp>{yZ
zCXM04<b|DLuXq&+uU2AcQ3q!O{3y&ur)jp6!0|XSZpWjp9~temOd9rZy0^OHIg+8X
z_{=O>)(LYX!7+IwO-5Rk#5|D%>^QVZY;e;?f@-h5%7?wQo$rrI^#2cMPaPFy^R*(V
zfC7?A2!enhAt}v*Qi34eASKe>B`BeSDBXyFbjQ-&jdV+QcYm`s@ap-U?+-oCvd`??
zxpQmo+>n_3Uz9=;e5Gp9meOYqp+~dVWH3Oe^IIj%`Dwxz-3DxT97*2SuvzY$ThKR%
zNu(+LaoyEhp?Hl`QeiY7*LNt6!VR}GjkdsiS6Z!bwe@kQL7SW!161O>r&c0w9jC%6
zLF#eNan03v4bX@kNmV5n`t;URlVW_Pc8eb(h{;wT*czg`UQI8}e&eL?6rx1*^bvdk
zc{=yaVkD0bDZLpUu{94vwqH7=57#!U>oHWT*RR$^s_SP|D_9drCbu3iAjcWDWUM4J
zDk<HDc_*y9)cZnq2YTnblOZ9Ua~iLRvpSg<9bI7&Ft?af6{#`lbrBgi2@qU)4);Dv
z#=Q&qRBkj<;#}&$Y20?t*!dYWRk^*?NUTc`sLRxFcD1L+T$D~UrUwb}CUj)e`5H+(
zGZr{xAW;yTgdsA!4wiE<8%gyj=0kLH9xV>2s3;>j_qpM&>|QXUeqpp+J26?cAuPCS
zx}huRzSFf5`l)vRyyxaSD?I$meZVMEuX}&30J@j;O`o771Zbxc1z1gdY6PKTQM|jE
zA=?Do<Lw?|VJxoTKxsTZ%xQ>Zm02Hf6%@wc138-?IBZO#4{aV!T_dR-{i?QkG(j+=
zkXzO(Ug_H7M~EXcnBX}`0HQ?&{ptNdETYm=j;Aa4z=c2Y7XjSoJ-N+0vvDpG(vkb$
zFGBYUirTWpNkqc#)y!<Z-w&0X8X<6f!^c6KZvSouv+B`0HWVsQ%2h00V2<c}O=EYv
z&kOIk3^+Q-aJk8@s#!*We%&JB9M@1#K<+~V8ywW0hzsXfT%(~=hs9(ryGTgxUDL?h
zMrWK?c9C3W%-FPDN9`}1(hlfMl8rePobJAA(Y$@~Z2$A1KXwI}14nsMLcPd)CBt#%
zv?|Bxnc9wlG?nEgL4)wrJXBU=w9|pcrWI8}zE}<u{t8UGPg{~_O)<Fa56-!xw*bc)
z<tN`xkhza!=kAlJ-D95?*vk+T17a9Ix7j+T8Pmtd2u8S=ut!-3G(@^~B`T}#*jw)h
zc-@i6OIP;;c{`uPI|7jKepiI~?i8~pekujON0`22jg_k`)8_urpVyyXY&d5vgD@{v
z%N{DHfHpr>bdwb%z6{hpEvc@h%nFXy9-*TX<HWwz%^dCfZfRWhC~tj%#l^*;k9&E!
zih=}gp+&^E+|7yc&Nb)D*FY9C@;idQG;{_NXC=s2QqT(nfdU-E#%^<ek~STcZ1AIi
zg|bBDi7M3jXx+VM;N~usV{HiTxRoen`Rjc|>%v$uzGPm0Ef&F5zKeX+n{ARMdRcE(
zNMrW}hl_5zI-mGwDGC-gY=M?A%gZ*0*kXO{Qc%MYE%llq5w!ifWaSkPUklwHerLE{
z`G>>!pwtmV1h>=cMp>Hi0~_w4Qq%>m*Yy)1Q_&0WJ}(M8JIL!pI^fZ0JKXQh*F$Xy
z^9tb(I5@9;SYYua-uM>i2XYD2U|Ct{Lmte>dj;aJ)VEWMv5U78WmDY7w)ozYiy8Lz
z_m5$`t+D&S`HIVG39coR(`_1eqAo(2Jd;|y;#x4h{P<lvqJxQgj0H{No^g>Xyg;9s
zC{|T&oZjR81yvAjudY6ZDd-n;?5-~NsJyBg926fu+6sS0)s-@G{l4Ka;}kl1e_md=
zfMkndAc1_AR&`*j>ibum6HaxXE{_1Oy#8?J&~v};6@4Fp@;l>7{5XA;{cI#$j#sqW
zpK)g_PdEk7Y+YnF8g>(limYI`y?fS;{o^920i^D2T^g&$sErmHcjLa2Yz~ssOtzOe
zJLy>*nuCaB=w9$wQ!3krt&4McPqbP-Mu={^E~<UA4SL^kzF&S69nJb$^HBdCeF?3O
zJtkvKTHD4B*wH5t!RfMCNTaAhqI_1tr$*IKsCv~*21wM;x2;ztt%?oIAZ7DAaT{DE
z3-?mlNYBvgEwR<54Q<oj<De^y;+_+m1e{NOZ;8ZED8z&NC(xRVS%d0eDYXh1aq6BA
z%vYezPn4jg?o`D0B9|xK?XHaphL7Ec8RyIMc$0+#g?j97?Gp~hP_AC(OJTeE>VwE6
z@>oTg^M$=AhXEPWtP=b3RzgFA{`q;SZ`Pum%Q>9!ecMPWzVpS$U$5zQCZ@dEdCH;<
z!dm6>j8Wd|s~PpiBo&ISmwmyy`^w;N0s)}cgBupnYf0@yDTl@mJ&Z+qAzr9LG9;u+
zBTadi##R#{<J0q05M|5*yNz9c6*oqwK{=OKKv|HyqU2S-)Pc#IKyN?u)ckoIW~1Ri
z2F3$7FFz%bDUPpo3FGdVgTq;pU5^4%U!)x;h)Io~=fb9ba`Si>B=0u(9rsNrP5iLT
zen}|$^W(%%#K_<_H3xioWBHv71Iw>j5NPWW4}a}wAigGICLhQrJZ%xOzC(wigocOl
zK~dw)aS|%ex9bX6zIH|N)`wwMoNN^&mN;DPA-B?dmLOD8xzTuPLR_=OPpE5Q(GCR!
zyh!wY_d<AFasCl4-i2mp!1mQ8GO~e&e&u;XPb$1e$UU7m>>RQw*K$96I2G^wO>liX
zI}jZKw}pOh4u{P``cgK_uK!SuHtoeLxS)nyz(-!zK9h(hicA+dnun7vQZ`7AyXabX
zrF=pwq=(Zjv4BlPxwkRXhjYmrU%WTw%?y0v%F*Xr>RC_QBZHW<OBlU~3GZ7n4u;&9
z?nS|8^Nc9opVbF`VRugU^E8s5n-=`i-!5###v!SmigR+#6a1*|JbdT4v;<dJ44#|p
zoEN8yoFg1H&ID!0;ZwroZ4*gck|&Z`Pg<btA5m{+)Fl9O@SM^ddK#=yk&1H5%#ete
zZWo<V%ayK}@4+KIi3<vDjYre(IrxyI*E6y1(piMq+WV7yw?9US?%7Q-=5;3~%#D7P
zx=6_7Al1irQ5+MgK8<I5D$nw;Kq~fkVY(A%9`J!E0&E^t8`KKbe0eK$45`#^8znYO
z-mk-G<ZHe@MML1-=;z+aL|YrLNq{KNQg0e37mX5zF2OX?rR_z2aDc^Bwth7Lg0U&|
zC1Q=EczZJ}e5JZ3fed!m8@h-TDpTE3gI)V>L6*^JcMt0wY1lPTJxVQ*65Lqx=Oju4
zLv6aWR)3@fd3~yxH&}uctNmGN#+|Izh~l!9YthDQ8#nm4&mfuiThM@H>V?CIBaXed
zQl9NaB^~;`&y4r3-I2}>iN~nQ6w>5SM@H`JjxM^sw#wtz%7an$)Aa66?oH7`_Qd1l
z&4~bjN2?sxRFF7a2@j-Jc@=p#;6CI0-017>JNPd=zwyU;=Sg9lX!YI9!~jr(M`J9e
zp0Y5i9Ed&Z#i3iC`iGPAIG7pUJMH>zX5xQ|--ls(3msPDBvil8{8LNS0wbx7?nnl5
z%ihk6NC0+~F2Y=VqoXe@vCsa-C}re27Xm0Sh2>yfC4bXK#_yp^w`>~klg|gO#8&<W
z-}1~8T`L?XdQHsdhlSOAWr1}FBF`@6BT5cwf09iz6bz@#sW6mdwK{THddNj1@%iD&
zoBlEM^WSn@Q#dSmOB};5OCkB;zO-?uU3QV%9n+k=%9VnKxj>!us`R-}H60mB0DLCm
zZPZ<0q^^tzt(IN_0XxS`?=lJA48I5<Lk1225&<t)5Xz=0F>$~W#dBew1VlNzDkl!+
zt)k8`>k~^;d@KDT=UMh6RB+T<z+2<~oX5Fy1TwH%0Fh-e^-Fm;m@&Fy0k<jGEcUR5
z9QUQy&#!-(j4+PmlI#k+@>5oww7OxUVAUJKi&M2UT!Mgrd?aR~hDyNoW~q2@#vlN*
z>hoh?Y;92j9+0)VIld0(6adRLb)_!yzw3<io=Tpc5Bh1Ldb@Q2!CHJwZ<RgHvjBH*
z7UK=8KX!hS{---oCgu6jmSQ_f)%tX!R?&&ZP=Q1@_K{2rb~i74f+fe!Q~4NGx1GyV
zp-ge5##RU|L-MJ}*YP^`#0IXsi(h7xHA@LVs|ry!iOBHKL22i7s;hMmX-c>?`a^zV
z_w8zJy}y%R{(yM5jIeKY9NZUHhu$~(Kq*Zb^At5PQ!_(`Gu>x<w`TZBD#&zr@}6uv
znjYrHAR>kj!^clIIn<3-R&{*^+<Z7q)7<vY1pKtJTdIgF6i6sAs&z?+<CJzEJ>#qG
z#(lZ)cWj!tLwK>Pa=&}prIeDl35TOa`c%;xBI1PVK`pyxyq>5$2RfbS%10wk$5ART
z$v(V6X}nZ`Z+x@fmt59Uxhcv|op!AT)Vv#WNs~ZpbV8+AlHy+?qk^5Fv_)@9XAf!d
z_Tq{Fx5w*;*``h{V~d4WBE6wfJ9t-&(kh8(hl?zPhrJq3f=JYj{_7O(jjW!3nUVQ6
zJDEp{_Cqu~?%qrD4uix+oq1rfp`H){P&VeA0^AI*OE0|fhiKEc;cVHJ@5?VxGlL+J
z)}3$yMDw-mH6EX8vX9Q+$jP(phil_)hV{`H0xpw|bKLQfUIv{G5i#T>=lmi+=ibLe
zQAq0f*E{z&Or#%nrIv1&WsH+!;WSIQ$fZa|!n~k758Urgc?wo<HwkIhJ&m1F_;DKv
zGM8Z~oHJ1l!1Gpm8HGRpjXxH%xYm=>l9?})vV0wLIe7O*y@ilM)h2sKFQjMX&@qlT
z_M`>PaS_aeNE3nV#cy8t8?PR|-U-g&{*ut4y{Z>D;&?s&6r-!tIln=$jXpTuqm;el
zN~F~te#E&tqjgT5&qFRZ^&;t1S$E>YUR%GU?ykY&HN@np;8#@EJ<A;CR4R1X=#lU~
zrAIq;94{vPKf?4AkMdG{-vVgk)83F`6LSd_aK1smMHNUcAmPNm`VCX}_=&LI$`m_>
zlfS{FQEzHa&V{AW=s}lu8a^pX694xJ2_RLF1s**SH1J)Ey(24g1JPfAu-JAnWNvI4
znB1U>mP{{UmgJ<%%iUR#vTlQc^6HN@67w?DbkAZGHug3~wBwax3;0C!`%A5GK$3Zi
z9RH%N7h`k+Higpl0jR#z&U#%^k#~amMw_E1sP>m<q1KAy9mx`#enZC6a39&#aZgBX
zO1-y$YHog!-3rrE<p#Sgrb3SX=kyWn(n_fmc}2D8(;mYVct*aDBREAf&#UEfHZF>a
zpoKaksxy7L7%6iZX{-A=li@o(D$nH_)0EpDIrxn`jOajYc651`7fbEM61$-iG~K*D
ziP%HA^MKwFvyIUAGpwY;=$vp1jPRZ7&}aJdG1#o;UR;rBm_hwqbGWvNd~kSy&VJ%L
z$d#v`6kR;YAb-X^tiFfvVpT<KvwCgJevzMevozv_R=jt$4Zjf<T@%Kwh&8*xz;2Lg
z+NBV3O^NAJ=X1GYQ&!+blE~h|V}ZBZvW01LwZj7A$WNX#wtLB_Y?gDx`IpU-%x6tn
z1gPz)byax@hopNy+~DJ#aCM?_t6i|EpsDw{UF|RI_$C*Xkh?7ERaON*)=Bn3Q$&Qt
zzvO4vrX8eLrUlXvB~Dbe3Vd}IkHs9?T)06XKB7~?SWM~dNz~nJ!)dDU_E<3@tG7k&
z;kKhjrF|MVr;G_K?umzL=mIwBdlEZKspKcl#j#3gHtSP7TML$TeiS4n_PcL@^J;u(
zf7_Y>-Q^PMO?BW%$A5}i$i<*`<6F=hL<Iegp^^6&((otmovbG7UxKoQw;qRd3WhKu
z@;=}mA7bAc+GK<8Nj>&TQM4-CKG+RXqG^8o7fEoQ7!4W59cwt{Ao*5(*Ho@R^A@<=
zO%C$7)IZZ1izgb+nv^c^nciVevolRrfUc_F0*}scj1Zi7u7!s|wdO6a;IS&0UYiPM
zGcS8zeu!mYG+e@0Pd^Eh2{qXi@v;IphAe7ZhORS85pc@RIgzfw`H%{eNtgE>N_Fz6
z#=)I(W;erky7UsFH?3O*j2{eXEtHy+t9;bp?UnPfN+L$RxT8@Vw*K83eT!zwgv=$<
zyMwbt<G#G8mGS0*xw3Z;p%5Bg6dq-S6-a^MC@st8Jh_kmDHF@qU`HC8&%pTvJWFL}
z)$0D&16o-??FLZ1f?>_Kk$+}r-3sQuY=ToNw!C^ZH2X<!Oan;l69<u{35ku`woTQa
zNQE((D;tVfZ^nzKBv#;C&(eqFJdaI(P3eW#UF#==f%W*8X<1}C`H9en^l{?-4@5HF
zE=VW%AtMY@4Oc9F<mAwmG;!-`Fv`Y3xE4$8kwe<tp?bk^na<4x`hd2y+VrnW{;h4A
znGxU9{xSA5u9~Uc(=L}3S>`U7c3Pi(9fT~8!3fTbWHXIop?@o3_v1PP4R$^u26e)a
z)bY{<6H5=2+Nm^|l4Ku%>_W^ErRTQuGQI6_`>6Qk&JQkOEy60+gh)5Ks`vi5h(U5P
zql8sL-Zh;xKB};RFSSpY1ASOz!Z<7i)sDAD?qga}y=-fZLbA)eEo3q~W>dYF*OskR
z-B6J+8NR(V{0?r{kNZWMVkx2q`5o8PH7<$ZR=eFX1nkY%0?tUn_QQ{8m{veVqxzUu
zn0pq)|A4wUJ3F%^Z`l3Cd*e@4zECGQ|CncCyPAeWf{U33FLvFMmtsrouEC0q>&K@?
zDbJ#YFy8`wva%9enr>u&--n2~M0M0-(HlPF+BkplFHQOT%=V{@`X=Q-y%d0|O0#+p
z*RI7Y6?@LCX@@)Av66rE-eg#KhWc(KQbxi=o@2)|&l~J2i6Q=G;xl_pcUMb~vD%P@
zVDZZVh6by<^ElPl3v&%>Kv4*(-iPX4*DBpUIVfs9?D^sPdQ<Z0&G*WgUZ3j2>M|wV
zK}j)U)nN{xe(m-n9u%U?5e`n<HbFoiRjd+_Zp_<-n}f-G`rOegSoTdSvFp(ol#iMg
z2xjcPkC%A<<vOU=X3YB%9htGm;kzxuIKX!mBu^s0yN69zv>X(2yhy&;=uGUUDJ%z=
zBs4ws{$jviPqx3YlztA-U5Fb96W6a^n@l&a=Z(6)HJddpm#fc8ubHmy^2J;*j3q;N
z4Rv{>T%%jbUh9K$ETa`RhHLkeH@r3j0S4@#)bySD$AN`Xsh)huQy{MuZvMR*NjixA
z3olj)?+;qylBZ4e4|7^PfQhNQ(oE~~vT#!ScpT<=j`q#(M(}hCyDO4!EKx!^Ra9o~
zKdn3NE9|+>o(PBXHO`fk7w%bL;CZCc_J?;Ub7PTXy`J2Zc!0J8PkaXs;k<ClleQUh
zEEilGVTz|7b(Qe&RXZPD;bYqjtZb@?2%ke0p1*{1sLMi)XDAFWEZiQ>-?jvo9)s+q
zLJh&|LBVE@+8wVZMzUPDjKZu8cgl0tA5Ga*wmRNe%HJNYV7U)}8I1_?;@o*S_)N-s
zM$e9o{O{Z^UGm?46?=CXWp!E9!|bDuZ1f&&=!c`@i<O8~GMRE&CFC4i6<At`xH(6f
z^wFz_RtV}ChLc3+oqKt%8zTPvy<b24^C9Q*<tiE3L?$#viYtnTcQ268l&Xu$?QC?o
zy2+|6AsQGMxZ0X#>5SJHPvCfqCc0)8>Y4OvY!4xCPCPr@yXpWnA%gBGl&U=lGF{jh
zoAR+85M_6lJzC`z+V5#SmXYfpQvMRrz0ylkiY$QdXf0$_^jSJd*8SbqRtb0Yg|Q=A
zk+~~`PV{KkX>LY~ep@mOG9qNSOP2T;Elc)97L-Hc*K?EZBUTxDxnyWi;y+>AJJc2}
z;#}zAN^m-=uTOa?v;L%~ry?;&_+pM!NeZTiGBzvKTMnOAzkuk{quZAURJ*tLmksue
zv^a|MG0{AlCvz1U0d9Yy;KV~Z2^?HT*QV~(s$p9VbD#M@VKLK`BiASrnn=$3R7%<L
zZ95XJKIsFgg;;YhjZnDP;(d%~>KUHB8Zau<SxJAhy^5HbRpMY{J!RA?gO6i%)4q*o
zG|kEJlja~Ic{r|2n!F^yNBT0?{;Rl%1Ib>kK;<uPeg>s0W5SgqINY+iVkEynbEZNR
zVb`||VsjLo^SkLZnwf5^e9X-}fXl}-4$(iB&v@B*REyVM>V)ZbI9H__+j5-WV~EsB
zL%26U@#UgymPci}$sK0lc~pmeI<_OwcAT4a*AR5N+&)s|{58p`hkI85#mqhTLa7?I
zZ1fuS^A)9HZ}%1Bq&~3gO7tmtOOr>`RJd12x>$YH<oebgp5x7>!)Bwmg$><tg!h>S
z&3X=eN=(ZKeR%k;M)p~atW=GAzY<%{5D*vBVTza*OD*IYv^ste8?Nvh`<hR_hP7O(
z%zM|;89a0(Wve>(Ai6ihX}`+2riz`?kq)K0MmFcEehx&xo0^i?6EeLYI*jWKwdPAg
zyj+#r|4sq*)Ed6C4w&GH6>Kq8&|%E*1KWl+Usdhae9D8#dUAITr8Eq6D_nNwreae|
zmhq;J%3-@jrioC2$82QwE2Ebl^!qgU)%#X9-#;W?=xhJLc$H$raXNe@e1@?<0!J19
zi%NpT(ng<Ht|K}Z`)K?l@7S$s@{yw%_Yu^%$Swc2?rs@NrR4@E*L+!JjHBJTB&~fW
z^dCHZ8LjS9Sy6CtLWe?DDme#kI2yaLftTU9ubS^&yiJB^4E1fjNc_i?5n_AN)YlbR
z@j1u_k2>4i8?&HC&RC#01HAgBn4znHaZ%**NPaE$^h4)uA~Zz|$!8a-<qt$=o*ONP
zwoXwiR=jEzOJ;+Tc(V|PS&t#!;`+ekc>`nEe!V%}xV<A7DX1oD<VGzaAsN1nHRj$B
zyQkM2C=Tz<Tl=<Rj!7>uwf)?0#*s&7Ngod~ww%6@AgR!8Cp+`zXyel3aiW>8WjYeH
zG`>ApQ1Z<W%idzIIn5+C@QB~6f2@yd@SCj2ARYb6vpf%#yEpT=-u6wSrl5(PgwgO3
zDsySLh>FlhA^`bE;|IUQ!Rd$i#}J}i<~S<P5a!L^mHEPDDv?QUqhf;3PCEQiOKvd1
z`JKF+^)LV8Ak8tfnJ@mx72S8Pvytry=qW~r#`nt5(%=n@*vupwZ<OQ2rN%1M&g&Ic
zz(`T8QHFo?D;6?+;Zb{U<Tj8$pO0Ql<UJr_t_?MsJs~sxz<k*XJiNO5G;_b07yH*2
zE4ADl=$40_sjgzjJ8?a(`%6yoPptk}7lau;5kcKZk&!jzxoM`(R$~^~(6uc+?`e*;
zo@mZMx32kuXdLYkwXgAm6CMK}D7bqMTIwooH9C+lS1})AEBs#RuO)wfxYrNFSTuFX
z;RyTkU{+<$dMXM`l)LvB^`d>oXD>bpg(dt{^TOlsrjR=ayZd+G*^Ehf+G0pUH?zo^
z(}eGA<?;y#AbY=zt@m%<B+tUTyhKLL&ZX+yTP49N2O+XdceDG6?^94fUO=t_IGBi-
zjO#d&r`%^dKBENl9L!6#avr<14Xszax5WBmXy&aa6ljInRy;EbCex5q`g%!bo<5s8
zQniL#S^QV>TR+{;ydL~gCUlFF&`{;R`e&6+Ht_2yS%EUVrzzwot9kmofGphML0xCa
zqA9qi#I)T|(E-{AUKuHxL09W_@xc2%eII&|W$(g0i-WLEAuQgH2_%^#bQ0yg0(Q?_
z?{{x%I+a^QL_ze!okKS^;W8c<n0$Wxw@DdA0ePBi<=E#N#D!Nj(o!R{dlBGabB|z^
zSamU}4cW$B>QdLf@(Wqc{FkMWtA-1V)kh(nnvV776Pjg!qe8}9eId3!8=9ol&(6(8
zVZ}4T&|Gk&S<cROj0#N_Q;EI(1P#rD`bplcKM3$7MRbw@P70MI5pXc9c(qb9$K;ak
zH3&aK_G`eC=rY!DR5ufX@R$7Fub0N_G><LjKfONeipfW4XnF8#lRDL&g<1Y7F&eMx
z_1ybNm1II+!U72mu{{WOW{m@Z3?f5+^c#n#*aG4O+kM^}{C{A|85c%u)C4)yD>p9j
z1SaQYWtX}tpgfPn2mdg6{ay}n(~Rp4?2TinjmY&3jZBpyID6;n-x(~t_5S}e9VJ``
zN+`kScagqql&H?Voz?S#SZE%PW9u#4A^NG%k+HwoM$V%!2`kXd@aLjta9|>@By_w+
z^+t__xr}E1Zhdq`(9A?<%7Cbdmzb#Z^lE#+vGhTHd$1T#KK4t6(ilI9@w5@f4&+?n
z1?!unzqSKHgaaou!=$p{Odwg2$LYPOXq9tLpRT1DIU1th88o5hdlaLhG`Ea%$5Lo6
zWsC$ZbRotx9gz6btJ{Bqd16L@ad>q-2>q*Xw4o^l)3yw33?0OPJ=c--je2wX-xSIW
zUJFPLQZ)!V!bj3S*crl4?e~G{R~d{iVt?%3FPi=Ka0eaGADsAi_#fW}rm7J}bGH=0
z=zCS?uK560_dsQ-n?$Vix%NhP@F|i?iy+8527|<CijHRMLzHNt%ZE_gzfsTA>wtJF
zA?ugFO;zXd0;12)T)_xa>wI5Fmyj#*^a7=C#ImQsg>pI4rorxRzyK^`^J^zo|0l!^
zU_k+r?cd2U<N@GP)~$LfM6^06r00#Q>$GeWE&fIb{`15uYI+;d<+omW!DZ|o2@`7p
zj;FX6@;6F352piW)}inJ_5x%J0bV_;RNxutQ0a)EqB?+uU2172mt!g9cr7{XoU<B`
z-6)|gFaNe*5EU?fy<oljn|w(DG%|ox`1~sT<!m1azKg?Q_;h7fqmfRmmOS!#xT`<{
z7@R8*`)ymCT6{A#7(ckLy#<@@y%CHgmrJ`ah}z_wSq^YjP0m?%^~Z|37%W)susH`{
zfM3g}&LR5So_rhz3*E%ta{Ttf6K-cSHp1kQ#^PWYY3)^{(mlYpew-?;7kC>AlM0<M
zJ#Cn+BJwv1%1#8knzWQ`aeB|1DFN8Y?ApVB#S%DlspIi4SDt>sITL`WCC~U*jKF^Z
z`0X&*IL(dlxVONZmn}wa|7ORNaEB;><s?8`Cr%N9Gd4I?7?eNGx&2qXmB8?}xoLU&
zg|aQA%T<PHL93^i@sn&JO8{E4W0G?xK>;>o5I|iGbCvmbOXuhNzvaL40wA<!PTo!L
zfB)^<TXlh8WXaZm?x|(``U&T2fT{@2KTJDCOYoOHKLS~ES=|=v*Sn`4-lM`OY#~ef
zH2RxK0CG9(v_AiJq5NP&88WYZ<~hC6UZBM01)NW<;x}yR;Q+Y<h|gF~!2<c%0=}@g
zxb;^N^Klc*sc0mY;&JN7pBsW@Obv5qk^hYraAACT&OGuAu}A^jrM!rKd+HZ|gZl(#
z9fZAMK1~XcaTrBwFE{=bL%x7km}hH(nNKaW4My_Rg*n)N>e&<TbP9txRWgT#PviD_
z1lZ7(K@PstU;Ko30$6zeW${AD09`WVQ<MF5q^3L=*;uGycxpY6n=tv7H{bnNsj%=K
z0EMz@6LcDf_r~CkFP%Ggd_3FAP4TnZ`ofS!7?w0)?dnLTxs{cNpT}j77sS1nUCf~#
zL<GXq6&2{hZyrJ6)S-90V=lve@iMo{T42yNb_>QU+|IPI;_m5rYp2`NRMa~7*2$i=
zhgN!TL9GJ$JUklY+~58y({T1n$ePhGQsJInrMvR*KVJ0UI?oN4(eB>Z^w+-Dmx<80
zL7&x{R*T8hGn18Bfv@(K`b{SPHC`BWztljC==jl^`OhZW0PR%;&QUl1wgwo?#^ey9
z?(i#%XQu#Mj^^P-VAb;G&)+=t9v2lD?vCRv{G&<y@2Q-vDZu8d(A>T6`j7GLu$R~@
z9Lx-lA0GMK7DCT=n9emCJ}2vSYS0UBWHgV>RfLJPYk%JqqA7qe{uU0iDJs+1F;YYa
zV{TK7YUgN>;7DxL9Zw2M{dA_0QBjHH>i1EBHfXOmx};MNT#8oInH(b0fJ6JJFJp*V
zdztIP2HMhOBaYTyc6~0FmH%M=n&4X*gUuz-$EOZDVn1mZKVZqd>YFT|RUe!cH}o#*
zXM^6Ko9G;bO@xNmF&2jU8zX0)>{W<vfu6*N=t9I!P7aGVIjldr%0D1c5}2pkUK;7B
zwOSrlT$^m9jZ%w3r&lY&XSZamuo;_sG1sNyACfa{Sx{68HT+;>rp=mTH}C{%_#i=I
z65%i%w8yQR>q^p>eDzACW8P|M_(O?<ZSUTo^c!qyG6HtXZqQ+EfP~?*n92Q4ExXK^
zdM!|q!G}tRKHp~k^A%jQukBf1P3dt@<Jp53H0BidsFylL0)Kvde-9pAohVngOIM=M
zQrW?oR;7fh(jCRaIHL>YGib%oS=$`4nSsw`FUbGy3cdHfSqHy-(eo1d?N}G2{fh`<
z?{B~Moe6Z9?3eB<niZ=L;4D1Ynx{4W`t?X~L{#ZYl}z$Z5u<)@XA!h7i~Gak05oK?
zmLi@&8)J93{(^y(@+KkeX{Nm?03^wHyvdb+^r61}-1*gYkH_I`Uerx&#t_wf$MJ%J
zX$S&e?L{$6Zt9tM72Qjq`mRn}@2Zc|fR<D-Hcc3<(_xM{?S4ODU)J>d7cZRmw33Dl
z?JSqkC!uIK7cy?pYx>=Kz#p{D_WUV#zU5(}yi-`k&THT5kycgEJ(|pH%Km^w()bKi
zyhH)+{~=3$)BK7AjA*dh%XlhD%|441bT|0l)!dwuHk@n-peAn)g?`x=3*(?D*SN50
zIwzG73wnGuBuJ7^mN`2ZdV9|kfJVh1x>E*b18oj=Om5saH1|_A1(;0?l~Vgk9!W*U
zZnf~<Y`T?yujB#m=UFo#0vJg#h+h23j))4tdT>#3G`x9+q<_-?dH9<GL{S&jRh^>U
zijMk2+4|a}1vJO1o<i*xM;7mpz6tEyFFl$=-nHmzHLTrJ7ua2E74ju(-V`1w+NG6G
ze=6!X!mo6-iht7UGswe-6Y%PayN!nDpV@R$n%w39M2TqBoUd_u-+x1b<`Dzoy;}9G
z?!CC%l^ap>uCA^^X*ZQ`GcGs_H)oV%km~rv*p8GrpEo_+V+tIv(37g2ZU`6n5+_Dm
z>rLouHcecLr(-?6{+X8RqPp311IdjXf*0QSTvVV|!Kz!OPIBaq(C4OLQqXA8bbCqJ
zpyh$-^b$dwi7vDc(1mSboU<I0RqjF`sbcPesaWWK=d7gZ>=(Ycd=lL!YJ&#|NDYVk
z+e0d<56#-V|3ouT4pu;d*M#SMee}m_ev`uYr!oO}bX_7D>Q>Nd<F-S;`Q9UkgH`uT
zy&jY}=|*4j$c=?Q0i#mm)lZ(+x$5vcl4QB-{qF{<5Hg#8R4Os;TVOyELMQ+5xmn@S
z>=&`Ok&%(@RFtm@M_V^D?Pt*y(X4jrh=hD8b2!?L@X*=>K!qfOo6$)5IZq5)BOEq!
zlN9b*)qQl#b(E%1U1HT4j0qk-TBqf1uo`h(WaMW8>Ea>^Py=#sdu~?1+*N8ejS|di
z=5`Z)v5Opnu5(PlW)Ar*f+#+e8(6AJjEEFL^!gCvttl?6dU^_XftANl{y3q0k+n0U
zQJ(@54h8XR3{vJ+Cm<h!>2+MfxSd+`8IZ=wM9`hMo$@Wm3$Aomw7g5hQB5W@>PjZn
zB}hpFF>npCs*W_EZEBz{Z833L@v7TxQ6IU;#_Mt2z1ArzhoSbX)kx8a)lUzzHHQ5H
zRT9BfKN-V-^ypgG-L=iYyPyc`<6O&Vbq*^)4S}oUFDDlJEn?^1(gy2U@6_Gu%hHDC
zUsx-!(9`V8jI9|JU7j<0PxDyeFnGQvE)cY2>(RM#^-mcISc&c~(0b2`S@HfMld3K_
zzry!Okt{4JlFLafdE;a>M7%!LVye(yu*~?LlC~%wdc3iYnrp0ceEtEcUI3NtNV?j~
zFv~5eTkR2`yk84GYuFSMZc79^Eohy{@F0WJ?xJ7>ht0+k0`e4_E3sa8GIdu{sX9JQ
zYRf?CqMbyh6oo@mwvMmX@lo-VwO*8dpXrw(o4b0xDMia=T)|uxJ`=67kOGV4*zIr@
z6JD2>0(~_JZ;(7MdfQ$1ljc#bHP$h|r0%b=x1rM<Zcjk_#Fb-zb5@59@9@^Gj*U<K
zt2suIH~F)URK`;j)*2eq`ug$j;@vlR&kkLxLq6std3VU~kb)HJnENn|GRcs0PY@(^
zc^L*S&od|cw+7Hy&M`z3>fKMRUoJhO1UY%RUgEcAs6&r^N*pfDEY1z@Z!8(&X-IXZ
zLTmCs(_F!}nNfb6<x_~yxC0Q6y~@h;55(_$hVY_%>)yS$>6AA<pE3ZAQ7x-%i?bkg
ze_p8lY{v+v?^@+0y~0S9dxc(4Kj|7@`J6}qVYiwkb49}Lu1!*Y#I1T1jK9CFTJO&e
zWqjT#H-O0OHN2gY`*OZjp;x9@#b(zcVO8dFagoLR2))&kNU{Dw`~9cyK_LB5yl$bN
z<E<pe{l4U+ium?&A9}t=4mkZPoCPed5U+CiOilmk$TTWfWNtM#<5tx?qGSD$L{wJW
z4G;Y;mx>ZJ52hs{1VyOfz9P!f2rXZPwL}A_V#|yV*4==5LZ<`6Zs~H+YaVw+dc506
zi5#ydrNe50S~@ekXm4-crw({3?i<JKkZ%PdVNv$uchTez<jmhwDYRT<d|AI-vR{Hp
zt5PxJ!wrfn)EN3t)cZEB`%?;+!?`w<v~sJ`9Pf`9JyXU?ZVhjb;;qB$PQwCLU8Ydz
z^2V$r=%{hI-j6PtYhv8{b7SfdyVvMcA=65VW%}Xaw)8VXgp&f?xfcT%P<C5k|FT}~
zrHF1_Qt$G)F)A*7lT$Y@jMa`GYg2ZvQ%7^6j;MG+w?|U%UOOGyKED@qB1d+(&70F~
zE7_BPvjSU0+PSf;U1O8r@$yh9`T1hInZscEXJ1@AQLSdB*k7RFqOGi`XLC#Unhfp;
zjZIH$=Mr$43X-{c-k<N*vxJ5wvF?=e{#081&kVHN0bBLD?K~oq8CsqY8s~FW_mTx2
z1!ML5v^VD>9PBh}HYoT5kCtfA6pO5dY_^Bq?FD5`x75d%MdglzKo7ED2JH_R<ldo+
zGPS_WtPf))40Yh=arI`mTGEx$8ZPQv+a3vRE}-m88xf?GPW%J~dTh3^Fj2e8T0WA!
z>$Byn!>!OXPs8<M(@C5dm0~yBp|0YjcccC5;WBnDU3WhkiE*wZ$?lvoRf%L^2M|hb
z@-r6vAIe=7Q*g$)*Uc;BQT230Phbn3oLr7BQ-X3~>hN|g;c<uM^~28Gs_v(sGyrX7
zTP!e;*&KS|uI=d=&2`afz)f~0_}bc-x3LI;zN9KQ+e*C$^K2e~tSlK`HgjuLTBCsi
z=||j$+1Q`1`bP{E&KS&jzrngIRO$A3V-J<vk(}H9IHhko_32g9J)r4a-@VL+m<4S`
zf^1GB$Jya%=x|Jp=S`-j{zXf7Ilap}U%Kwn+pnC9%QwK#!AgoQgd|&7^}f8c-RMVg
z>s^NjOwr(DP}TdA_3YzYz0TpXA{UMD`<me_Y8HR-_~C1<g&o9xP@c-L+`-lgM=xCl
z!S)ggej=gWLNDD7?jyAwMWe5%r>Ip93s7s)K^XoYNIUt;d3bwqqNq#i>$=YMH;)m>
zS|ixg7U9{dlxmiS?1VvF*QV`CZ+q?#L^_%&==s&+XM&NyTp@@eoMwp|-WegRj-a9;
z7@m*m0Tnq(6pxOCX`zN)DyW5t4PRoBwJO~<ZSBU%nqzo(-`GO7I%40(J`UZowX3T#
zF`bxED;_KvvXl6vNl}cC$tWQj$rT$|xnGGpvC#!dE+lv&87o5S99=U9UCtX%)isAc
zNS;H!i9@VQuDV%Zy_*RuX0oMI*i>LAPcVd_Uh5f7q-!O=338NOfGOWLY0fm9NSao3
z5Hbus2AYD|!iTkGZ}4#_v;5Zbh~5?}wnDD%U9AX5ej}BV14;R;DW|FT3ORFvIl8p-
z7V~D$P(Ge8FM-{o2RqbyMPQJe`r?m|FVc{1Z$Oe2?&}F=7)3?^lgq#%u*C#}3}(U%
zcF&zxC>(FZ70JG+{uYyhGMtUGKWB3)CG?&9oQ0E<69fM4A?iqjH@AHplsg6Cx}pvb
z|7L&2I3dhBQMpNP@24pkDk{}$y86jx&m!qvSLrd?-BP(!Z#v7sV!P$kcmf_y8~K-E
ztJG-o<c{=onu#qRE&HX}mlRY-5!54{N_-ffuNXs>$FE~09xeu|PI_}YLKkxr_fp<1
z!DV2Oi*`j)FqLR~r=stDEumy9j<B86VOX)>8f2x8=j_BEU&?2=B!~3lXkpt3N_O0S
zzG0kYwbBNu58^6r9MWj!!8~OYs`CM}JUQJ=;xys?@!pCSu$PIc6?F@r2iWAjo$?_?
z)*P?7sy<ZQB`qkGl3)0AEUPsj@L98h?WUaEg$!L;i5&I>+o1vn;XQ;6pNV=&!6$7j
z#Rj7lyK6nFcv|t;?;ocjXnK`t_A}0E?s$mr1v&JmMs?&2J@|&7)FmdT61Xp*let48
zShb+>N~M|Hbgs&J*L;uWO4&I*D7ZCwk|<@vW2BgG>YA)l+|W&^a<7ZIO@cxpJIH*Y
zSKi13`aoY3E<<+=ZWsAc7Iq4$WQ}J4!`s0gm*gyMM`ECy?hT~8ONGl2^1ba3?D@@A
zaA5wDwIAJ<&06o|I+(vMn5KeymB1?3VtbIaMXmD^3N8)ky!<8U!9~>fcV%gX_snOt
zX3`<Wi(ktR>9ravr<+;atWILlxfjOag-2lo|Kji`FCfVt76Lt-c2<p^sBw>cpHasg
zWMOS!g(n^=9iCs*o+nUUa(UhT@iS7k<L2b_J9oCO?d1X5Y1%M`ffO^;o1Ll=_L)J9
zI{iw^s578c-$*{SSB|Z#Y3r;(v7Lpl>11OlJLp}XAu>|k8Fnwsg{e-6sGCVD%EfiE
z8P`ZCikDCS0yeDzk&|KnN2ol3GJ<*+5y?(c181QVQIs00RQs&-r-u|eBS)OYhX=06
z^rlr$%{({z(w9W^QH<|M0cS{OQqL13<(xSj5V7FDHkV{n7iv@z3vCW(7tS>t8Z*X}
zK8+YmfSAy|FuZ>uMgkndE43uqGZU3XVG5U03717T8I)LSNG?=RvMR4?3eK!6<9V?8
z092x(INaZ~w6M-IFe*KKSF|Bv;m|ZzjU4mvbzBT+++?~thjoK3uXI?YNDk2kTDfm)
z)7|79lbp-2*dZ3!J`WObef4_M<|aLk(l4?C41h`rv_p0rMVB=0E7Y=%&!c3#+fJ~Q
zao8?y@d0_U#q(A5zUUlVqoPSN0#?p)IS-QiDP)Rk5H8iPV$^PAjuUp5&6Pj6q}edx
z&fb`4vJ}By%j#L+^r?y-q=Bt&uj6QJ4|6$On%n+pnYh>y9XjwdmG07M%kzIT`2lmH
z;$%1!ZpS>Vm$20ut+4r$EH7MKq*2RFZ#H!$@GgPMy>?vtgXcAjeZ|^=jjV%AQ!U{F
zwwp+8g;4!nVbGhEQb!`T-I8SJ4k&ZbGjNEp+nBfNTh-bsW<(1bgVeug4u|R9iyO=1
zhPrW<dha`=iI@#S%<1i`?i{jMogb;_Z%GK}p84!e#~av<(e;x%6@GAMzrj+NEjZrJ
z4#c^qv?^B@U@ZSIZbTm(R*8|hiF6Gp=U->fwKY@0I+C7G8tiK9oz3}im?&Os8+}O+
z+5r~pA4W?~r%J@EVAyuFD6>!adUI!6hE85{=Gn7Na!V`SlW<ht^zFkLHq%Biy_2oq
zCDXuh=sC>hcpx_$g%H-Y>27ruMe+&XNneQv55ORuM{~j-BJcEhnaC0NH68Na#XjO9
zH5jmHyQ>>0hh-~8o3lR0&7M22Rm)w0OxA7GCP&GsD$hO9y{L%JVj84W>ey_81hZe_
z9c5`XdiwA7q&_NO)Y-hnkTc(>mLE}a{^f0ft%bdojM<!f$+m~Z7H^wE*@bEC)&w2`
z2Y~xEeCf%LA3vDxZBR&es#0D_a*5!FFml1GOJB}&e951wz8hz{+n_ZrvuTy{ESmq)
z{I=b3xx;K%bkeX2krU5se@dK63D7(nvqM9cVTp29o6?&)9b}D1hj!BK_QhL!p=&ks
zOdGaxazXGLi=@Eq$Gl%@x75Ug;=0ghCI~5m6mO1AHu}&x*cKnKs2R8?B%E>?KYV%4
zx%W9l>(NODKf%@>BS13~rltWK>IVC*hsW|Z8r39wth*~NuXVS(L0S2EHEE_uBvHrp
zF4;`Q0j!PwoOvH|BNc<%PMp}7+`EfE6i$s!^Y%8o#Rrf`!8D)PCW)--rfYU1Erdx=
zcyli8y7Zw#Dz@8DqN_TmgAKX|0n76|SfXX*S}u0Wf&DIhzTI{zN6I3bLcvDIv+FWf
zjj=pZ6mkkWQxD%c9*7$B3?cN>6hWzZp3c83(5QiLn3asXEwWErBx}BimSpLFb%t9G
z6pEpwe7{%PRoa+q;MAC*ar~&A{B6BnS}}#q+C)3;cU|zvLq#+dLF=VUO>kh5!2t8_
z?({M#-y6R*B1S2cn`|Gq6WWrIT5;2)lN^CNGWXFJP$)?v7KgF*3xA;f_R#&c4zZC?
z3+c<t`B_)Z<K=puSR{P4T2?`|+O)X-2<rrDAw&T%OMDH^*!CYAumZyNGQ7JN91H?G
z$dC3}?YeZYvUA~X#$$@#6JMksfQ}F`2=2`Y+RehOV0~jJyJ(ptsf0J+)KI6-ZMRh9
ziG;7-EqzNY!v0H^Hlbo@f3VczleyVOUkJz(n2fPmmobbRjB-^nn`(((=9mLF^b{Io
zH$c}-n}gTB<fPX6ALXsGBQfb!PzYHyw+bmA$`UaH2ig}<0E3}vVQw(-F~XxRi<{hz
zP55Khg#7NCj?%`tQ0#yfaQ16oTyv=9KCWw$X9(LPwp|KC*-48sourgV8;+jVX&edF
zIx6a0a_e|^$_@4wW)5D9l>C=DXoLi~I@_?7OHl<-kq$GJN)hDfpu=WbMgtOAa)DI)
z9lou_*Rpf@j)x)bS|#MdAtErdwE7Jebn#Q-#rPoss4lyAs#1m$=pU|rQv(z9y?`0T
zxYD~L$1;u6kxtLLy(;n$eQ%q5s<Peup**7-qpflp_3kd>cIged<*fC6siyI^%iq&m
zlL3YOxUh;29~1&^IpVe5m>~gq9A^0slG*AC9?XUpTEzf=$du9#e{Aq3ZHe5i(&G}K
z5GgUKo(LA0JFvL-TWt9Tw~UHgC<)dv9<BhH)9{|>P+#(K7>hLMi3v4)bnIAc;Gosu
z=ik5F>1(d@rN3W#vZDGe{o{cfTVt`vxh0(m62gIo#lS<<lxvxjWC)3jcoy3KA<yv8
zO(II2Zy>cw_XY0$A#?=X8I%T(ryz($u+LjZFQjpjjMumawW|F%LPUq2wuo4617`{f
z^~FG!liT%&k$w)Y<QB};)lC7~`1;T~ov(j?t9Y=KkW#=K{{!$c*EH2fuTXXGv)Iq1
zgTs6Oc%L*;mi6kG519dOzWHqC!f<hirG5aFd@SV1#pkvT`mXlAW#BEff%9}y;yubA
zA?NFpU6oq(3O8<Y*~{?~4x(-^^kqH^ba6$Ri<(}armY)&c?ss|?V!_L0)G^$@w~B7
zA{i&zSbBWZ1Q!SEs&4HV%w&Wtd~@?a(&B>xSWhXBPdvb`X8cG``VXg3l@VaeRXc}#
zcK9pKKOJ<kT}y?!I4UZqoKPl`;P(cVa8i*@^8X1{HkJ;AF-sAP5-yzh?e{bWwl~=H
zV@lZdfp{-rUsz;^MnAXw%yVK0nujg`LY%t6{?vqjeneY_37LJ;sf!r#kO+?5+k9^@
zeQrIlO;C=D0ChHa1LaCh!tDz*#o?q!b5C9Yji7-`c)a;4=~H^+&&vS_KDwZXvm9{y
zpzjeeqNKnDx<ERSHx_OX0il}l*nX@EG58*hAaCW(-hQt)z;Pb5b^6NYf3&n=w;);1
z8Yw`_uGR9cF`sLfRlh=2OPDTshTa1X?MKNy%iMXi`&$eC@(kSF6<@bEa|2aU)!s27
zDMI!AgmGH&q=!$g4_;jeYz$SonZm#1uQI@KNui|@E8IJ{ZiqfOI*=-E;hO>{F{|Z5
z{P>ewX!8$wFPtD1G;Nq0KREU)?<vaq^JAGTcxkWUkxBUFhg46&%?D!$ME@c0#z~o%
z0j_JAw-#6#PE2ru<1X*SLwK)L?UAqbI5Kl}3dnjk@)PaBA5@7|WFK4KI{9u@Dj>7o
z&FO_dY2@T9L|<RRA=07Ezig}`JqZjL1A#*)LJNI?9jbWB68qEYa*n?SjtETen*Kvj
zJoE<u#QSL8{0Ghj?*aLb(IjCOeFn;}B;YFt&8R$)e~kBF2QQ7cC>WET8UNx1fWOh~
z)QV4jgk5BJ3*U1)v-opx?cn;GIm9{mUl(Cxkzj>8(9eU{&g|Jv?m1_<5f$##e~nj%
zi65$uX8&Q95#a-39R1pM@=okeegu*^53F$hkt_3A1c5T$fG#6AwfRrVkw5qDJRvyu
z&POBHYMog=qzHB-HVO>Dd+_)1&NE<oJmt)$w`Y|EM+Cr3t=agUv!MO@LBTTE-mi?A
z&7avjG;)|ItJfO+^d}$v8u@({L^L37z^gH-GUpWK1KQ;UC)ZFk*>JmmtlwD>5sb$q
zymV&y=itO?!0tB)1*82-ju*mqzocT2@a*n~fZbPBq)Wy5$9Q#Ru=~lh=W$Nb<hMQU
z1>4up5`SvHPky`xTYj&{wKLdz0TBTflb4V|%fF~+l^0B3B*$+EcLv6>4`5~1*+GLy
zXIAzbgep()Qjp0M)!F%9#DSgV^jF9K$8e$*z&vswTIkFU6M=*#4==^}@~+>Loq2kJ
z3XXc4&U|C&rzAZZgop=>fBdAex%pq(ObQkPgTyy=f+M~I^GOt7rc<6C;~(JPMg#nb
zs2P?2_{;)UZh)`2vZR#m{9}9-2(rsC(IU-5IWr#eH40!R0{-k5zZsxR7z|f&q5BV~
zw8t~>Rr{5ujkEjmi%-#xVd9~bY4Y6}?3Y0S>+NmrnQZ=RJTll|jq~A>|AFCAfY_^-
z+-d#^K2QyEvXt3p82239|E31Pa6)AknzN3nu@o5T7G@7#{|E9P27;Gne6&=~!uS=$
zYF2SY;0gQ(Xg?7Gfddghp)YVE70+C(IJ3Z_o<wPoasI`6Ch~y5lvD^(ubyE&^iKe^
zS9x=T|1tv}J_6%oc37^T8II;*3U*&ywBglHV1MoTZz+Q|0+X)WSW`!5cfSWLf3N?I
zN%6nN&%<`#0Wt5~S^Sle0gYP2gK!qI-;CxV2f(l5_x$~rUr*}5o2W0MYxXbd@xTGo
zk5|*1Vw`~y%^OD7(bW?&XIA!`cZi<BUh-tnK4oLWfZ%|s#01Roe+)n83}c?PJ7+}F
zIXDwx0R5l>YU;&*EZ-gk<|m_4p$B@L*&0OHzPczF8e;!r{3n>)mbycK=`4YxSpdvL
zxA+AA1AHP-`o-fh5puJ^8Qy)-3X`e9v17bvWa=N-ON9x}yLZbi{sRH1fUwqX|Hl`<
zcS;4QrcHFu(cgdh`2=BvDYR!#KcC^M-`H^8fmz8%DHK+(&S0;E8jv2e$2;j?<K@6f
z2M>8B4E^_S{(QO&!pZbmSj_*y`RCwL!QK~0M4e?^G!K~jCPTY5_#enC6MzZVnF^D>
zpNsyr3N#}aQx3#V*8FSp3c&RIfmG{f_U;^<H^9u+>LAO%j-KeSqbGdP&LG<v;;9k>
z;G3Ar=l#oM^Js*z-rAh8!5R49qXGEIs-&kQ{;_@{2{4|dy0-kx@D~t2*zTK3ko{M@
z?GO3jyaO}KO49CayZ^%5Pq9`46FfaKp7Z}Yt;pek-JcgOL--F81##CI%qWy+A^SZQ
zqzVQ;vpW14>=B{)g0D0rLe2g`J&+<8@zDl+2>m7Re(triHO%93lbQ_r9|x&lz|xU`
zm!5^OBA=cAYXVS-VzJjxBBqMO8K2ek(c~lAAS-ilS=^Vc6D=PHGmqmHazZrg!=y_$
z@t~=VAf(F|?Z(&!C%IUFl5S@_>1%Y-FKO#5A0B|KK&P5src$LtY2e_AwkZLjA_|6s
zMQYs?-@v*}1<;15SDdeSMi+SO!-(Yw*TnS?oL1$%01oDaCmEllI$XHjz485)OO6z1
zluIzjd&&``#lFTScExH;w@e{!Eew&oytKhE-_84Gf?}epM<tM6E7Je!d{09f_c1XD
zqs>8i4V|P4&Jt`^$bp^I*E+mMK#RN3vBhGt4Lsow9I;J`d3Bn3R?Df327_(M0({QP
z-F0`n6Qu<}aSk=nY`q?u8*J7u<h_?Fn);A$8}xTh>DXG%Q`Wva*8BghPn_s0xuZn-
z(_8hycjG3S!WA>M8&eVXmg@5vrYAOLeKSF9`{Y*mfVlDJ9Xh_lJ+BzYN&%j9P~=`P
zRHoVfXv&97i1O&@h-R6Dii(Pd^TIH^`pX(mU*O;hHgq!B6RvrO$T+{6^EI+g6`M+h
z@-+rIv(akwEMY@hk|X^*=9o7Glnm2aa+$eWRnxQF9b}I*>{$4Y(Lj`lnXH)=2SzwA
z?7)^S8O;2L`cr=ZM4*1Wndq<0biR%Ot7BWFJWXJ;=yjizZ*9V`HL2n~dyeuHR~Vao
zOE~+yr4sLK&}zGWeGtXVMaxT9XK3xVmvVD<6|}xg==hLmw;0p1Gcrmc*9`lEh~YWz
z%3{an5bJ#QR1iM7c_W0uDXLk-K?S!f?XFtC)9S8tYy<KdPtQ`W;=%Te_-t2JXo}aP
z12m7<5PkbYL$7*r0OL;+!Px^Q5N|)^KFbkkSul?54$b<_kyRfdUQk`3w*e{O)~t0r
zEAie$XZ@{A%SBvo@7LZJ$VI}a^4BLah7=-II49~pROT{Af3oDH5>NC~;XGQVg9Q+@
zW5o?~B32a?eD#{|X&hwDny9EoPAzcAZ0>;QqaRn%s}7KM6=W@exX)Oj=shl*kzpnC
z)iF}dnUxQ@57hUj`wYnA&{N=sFRC+WHQgpOpN~@Q7-HYn?Du<ZIyvWWoYp?D+-*!Q
z{4pFHj%O;&2EdL%@L|Vs0UWnR-rtJ&`;#*~Ea0%5hV%X}&w7>Wd8g8cU-*zIq?4s)
zGmK0ZL%201>R#1y4fmj$58haxX(#zo80QctGSBJuO2j`b-)#0V4y}^UHd}UvWo_`<
z_(k=utMTa@J6|*QQZr1Z+=xwXMS#Ci3@;DzCCWI|a}3;9bs_~#0_o;g^Y0y22K%rI
zldWS5T*0F}KFDfLmh|9;El@bX{?SELf@g3d_=HsRJ!uT{sel@x1tBC+&}$x#XT;8J
z!=hrVs9~B%k24SV7uEe#$-q>iYW+k07GYdxQ}@H9m1&wS0k_H2-1ggE3qx4~q7fXo
zg6Xw<Bw~eyU!%vyJa7M$8?I?ISVWql$Y>Hma*HYEv9C-7&AMk8ryc*+LLb3WiW7%f
zM2uLZ4B@!2bFZq?A>Y<=Uy`a72=|SJlvjYR*M{|etiGT_aqlFj(^|X0+IlN@-okn;
zzY$!<T*=x*%U!-V9Jko57T+^yi|&6(;onmb=HASX5enr8Rp_Yh8x47G*o&auM<}{l
z#pb36h$fMJ8^pyKKB``lzUJYj?9}pY%bo(Aq__Ri?e{W&K2-r9Qg5%y`Ig_Y!)UQ^
zX(f9F*>=#E1}*97_kt5#uRHBdk|TB;nQb;iP`iVQOpoX_1=E({`=b?cSS{valA^Nn
z(Sk~!C)^eb5LsT0h3H$K&qczD=&;0Hq7m}BoimhS8?m>wL?Q4FKR0Jzp?Uz4oHj(*
z^Y#T4wuyR0(!$_2#UO&LXc@x{%~cSlrWtR2j~jmoPO80ksx&Fj?i>*kj5E&@Oa9Vc
zm#eNi!(svaW(nVvmX_M^Y%h-ls=d5aKkQ)F#B7BCJj-8XkULUU3j-n_TDebrKJ3tn
z3}s)a34|mUbTKA?9@CB&HV9s&KpiI=q;*DeV{_`K8-S0{us-kWbL<snG|=-CS$tGv
zoR6scy~nT>I0nx*es_Nk1DC*N%iH!pG|>;ZAm*?I8LCbFwi-R?oWZ4kL)K(Ne+v$a
zeUSb@Nmn;^xc`+|2EkQy(%aha22BsDN<kbp4d|7X*(jNqt_7|;A5DQsapi&ya1Sih
z2Q^alJH#(W+QGi7!fQHRPYt^G1XK#3)Rz?7P3(Ei)1*zC;DP**dQd*PsgeZ4quG}|
zZG!f_Do_{{ajju~Lxq-&yU5c``6P-#j5Z+?b-^8BH67;$K+had;v$mKThdhsqqea>
zM^E2iRN7RtmBMCy(m#yVtZ~TBY7(^OHJw;d10AU(tle!o18EG{>LW{EOw@%7OWYQY
zO3PB1w~N{yx=Dx!lBN?R8hxwZ=v~a;nD386=t8~8atCNv3%l@9i-`t*MI>yhJMvkY
zf%{S06AOI|nFjMRAf4oywL70(ByjV0>-XI@8n*Xgx4M~cGViv~UV{AYa6fH8`Tt0J
z>!>KV_kH+C7$7hrjdTgpNJ}>eNH<7JcO#{Q(wzbV(j7yG(k;?0-O^pZJ$lNIp6?&;
zyVfk$EFPG7p1tq5?(2@7OJ*lGaH)kpP?58p0Oo#4%v_vOlqmDMtiNt3oO|gwY+NrM
zPDQTY_SE)ZmaNpN-?G|u%Tze)?TCjJe95-c6@RXBfsuA()-2WXjqryph<1m^%HD8@
z6j?|0k+c%boGyD+5BMB4WnOHDyHM=P(w-t?MO>WjNvUtuZh@YNQnzFJOE-ny^Rq;t
z{)vvu)I+mnLbuQuH|8*hrbH^XQ}fkI*ZXIN@l_13lk4}k2guOzj)?1odK==)uwRTu
zPvjqOjwpo?T#x1}d`E2Js=%e(A91y-{6&r+$1wPQ$vThp5Bz-sc{Z2oE5%!}g<AV^
z(h-+aFW{D#8@s_?)LI0Enet^Sz%rc~VRzC5*|t4Di_j<)>Lt<wM~TOtZw$@Z$XCjP
zDtaC|bSAKtja$;a_Vw)q=|<9&o)gBY9Zi6V43Fwgm*1!K#KDS+MTR)lD@_=NwF~KC
zpx`|C6DTn=Tur^2yD9xhDVO$Ltvw6sfS}(bs5ZM@rd?%yZ*8Q$l3X@iP(DMP2G{}C
zb47va$_2BjF{V<Nead#DOV?TVyv!jNkUf%l*OjBw`=O6dcM69Evh=v4*{>a?C6{p{
zBWKXunA2e|!+z^a=g6|EoZ0(N8WrVQ<SYi_+hYZzp#<kDyc#vaY?f1BOZn>Bx+eCO
zYh|?PUL^J}F;+xwl^RMdWf3(vt$XH}I;@RVmyI`wA%8|C{M?_fflR>tl9-`xCvE((
z=Zxm*RjpM|jhwZ+<;?bHZM2KrROc+TnofleDa?KoGuJbFl|lF{G*f>R9eU9yX@_AI
zOqdGnm5&&eZLXgxysNaFjtSX@MsquD$LW*NsPb)_nul6yErRM*OEiUzY0XK_p<R~u
zsLxWi>?T&Mj`BkdyJH%s`sO6W6g^^{ZF%#WQ}Ee3THY)iG~=;bP_mjeZ0*$=wfDVa
z)-?~Kd#zLcg2|;(!B~TFnxheEFz@-o8cS9XW!5pQq05nAhIR6Krc|jd1lMFl3v=dW
zWqO@rea*~=k>~R#Hl-$mqFL{g5%g*uHmF-AqoNEtBc<LhcJ{n03GRH5QXferE8hQ2
zE7;QJB8bDIG6B9qP?M=rJCcU)+}y?Fb8+}lC^iy@<C?=^{eJJLP8Yk*OX~M%N!Rq&
zE@30t7x-Y1ZBgA-Liftrmk-^{`ezt)K?&ODyr)e`ZJ;us+7>gz<CR~8EV9M<>1lks
zIx?6%7#7~_*9Fd0&+nBnge#FDe+)C0|3`1od@Aq*990iB(f`I_UdM2lk9a|K))AE8
zMEl&)cJ~XShK8bIzHS`QK}r5uZD!}y+ZO&U5i)}*ybh8z?mG?HT8guvC~DorI|)NQ
ztSfT#%|g3j7}hiU%Je*a=Z%e`h6t<1D@ngwH>*)5@mA_RuN&?Xj_FLgSTzn9xP?BX
zRRaUY)+UP@x8ee53LRyiCQ=q4gb+R&FEtKawXSwOthqb*$u@la&9)7E$@;wO@i(d^
zny5-G<9*8DDZfWbx9x?$;#g#TriJQHDM8JzG}=NBX)$s?eZIVf5|btpSd-W{QkXo*
zln!rEJ0M!#HgX4)XNB$cD={X<(5us?6lsD&0-uGXS2qu0TduAqDo|~4A*>+^+cbB_
z>&>XD9nNDa#&a}_EQL%ySA{FoW}$$>631GzvOLcG6sO^BOLlS0XYU})<A$FHhwE+~
zZO4Y)Sy<YvW+|+hhKjU1y_t+u<H|?9Cgh=kKRb*DXWWa=k&4i!Ck0~DYerd4IHe+y
zaPt!Nr4#wBDLu4VDI_SYSqf&K{Q`Gw(c7@&Gu4&~Dv~8yC8L9KY0nQ7cph4^U8q=J
z$kb<TEl!o&2u&8}4DueGuoR%$Pccmn5Z7&lK3cx%<=W<Uu(@!+^WuQJA+LgHtSD5o
z3TJn=xw`ya8GJi}+5548YmYjQOTR55+1J<sbPAdI<rdf4uRW>oMm;u;EO2?9!yY`b
zZ+c<tT3HylZh!plt3C0L&Y4{p;a8`rZ22o~;SOlRd^85a*uRl2@s9ZOuc^AwX(}a1
zmcGB(`y4ScGM!RC-M(Z_s>G`)Vph`;d(PeM#-a#N7SxgYvH8Q0!UxTeJ4H4NXNSz7
zz${kiL9>SG%4iVoVC|Gz|1g3WDp3q?y<63~Em9$;A2iuzS?$j1_PDGfK9%*|7Nedp
z2}+sxb!OsxM;rT!z!X!@N-g{%xZt+aVK-2?O7rz>pl5t!&A|Ngi_?uFJ`0Q72s#Z%
zx(A%ppCH)_-s>*wX9DfkPD+X-^Adwb;<-`O575vm8?3L~VKtb`I95I`q4)tx0#mR6
zZzU+Z*memCoH+D;Qg_>7lYBV0(R@RN+cufcNjrj4YS|H6d*j9cX24bsBH|;({1-gY
z+RE>{THZufxhL}_T)n@jS*Oa<|6~>rvK_J0XMCX6cs#^2U1g*3CCjN^sK_R0_iBrM
z_J#M@<X#9AxtxmOkaKlvZGgUbL?85-v9a|=HzGC5Bs~@>UFp!(3c20APNb9Fw3;*c
z%}J>*mc0=HF|=%Jhj6YX<_0KrHeK0OE|^dibyZg6o`PCUe%X4yVJv_`3fYKx3(IN{
z3&5C0NOzC)FKm?;8VrxUZ=IL_$6HPzKYe%g#^P4hcH^n?a?iW9D=+Z_4nN&|g&YE1
z&y!uZYU^)FPt@{X=WEo8g6i`}>njOv$0&^cGeaIVm;J#T2BRVGN*7W*$)yt>%P+NJ
zf0*blnsDq;xbgYOLcMd?Or=*p*avhmyinO*uc|*k>N=}1TUrfomOpqyRiVX-&y5%|
zh3G<xB$ca0GwWIlC6|s+d~3qJ5JM~X>B%LSue-Rx(7?DMI_G(PuGN>sX`yJS*MR|R
z1X5G+o%PV5c*J}Dbe5Gx?Tf+Q)A7<T)lw=N#rDlL4$QiO#akS*kHSF+U`MN6(}Ts~
zc$h?;C^5)e$`iV-dT8$cq59(T*hnIpt0IbeKWHdtv<W(6IyJ%S*#YoD?&=<^$2>V0
zQ(aUbyJdO;W-68%Z4udCPB`#9&@MR3lV6T!KI2fCTL~B$bM*n9S$*YMe=FZ4wA=5{
zY%v#$BX8$oe{Zk5NYy_8Z?Hz~{v8yz=VmIfb|dm>*MriEycM^Jp-x*B<QKUr$x|*B
z(=YtRGoRx2+R)G*4`YY=G)+RU2rR#jJ=tmWSy-7KHl|eSQe-x6;OVGc>z8J>kPH9^
zQz=}OU+-Z*d{{B#p#iW=TK`4=k*7h+&c~3fz+yszS&DnfiuhkwpYs@9U%lKrFUo_V
zN&3-YF6C$jodz1SYgM{L_G=0dfyYqxs*BsweKvoIQWpQ!^{-g~1W%qhZcUh2eCaMB
z2%rNs<WCM2O)k~fSzkOy=E`H`vposhN?=IhV*qfd)f`l0VXO2Ew>q7r=GC3(Dedzr
z3cS=-q1T|)fSSjcjTUx-n&R+;36^gs^@Ug7k}DzGH5XGk+udtK{kBMDd0Nl08R8f;
zD*DZG6>~DGj*fdaiW=u^Zy7mxkAWfKo$Y1Iab_7;+80t9>F;W<!rxtQeioc&FYnhk
zbUBS4O>(4my14aV1m8&$TV?jn$ZphkQJ=2_p7Nx=VT#~yPx)84cLH+es<Rp_h5w{=
zntYq45T(pNegb~LV7jJ)UR1Q9lj*L0&+0eh#b6IigPw4*EcXWU>U_=WDMOBIP)fyY
zH08VixxD1IaB8i#GajE%Y}EpdKyS{Dx9C7zQA&{B$79m<SYxtM$CC~mUI4AgdCUI3
z;0qW62!9ieX~p{DjdfYGe6~(e_>k4XYF3BRGn3axENk43=9NLNs*3L^E68#Wv&y+0
zHi=jI-Z|jm%Ly64mk@b8?#6=JSG=<7j<HB`ygLJRNJI$6n=4;7tsG4)xle8v^AswD
z_JH>()MD1uOd<O0khRh;bV_kDII(i^(rL1@V3J*F_$c?;9B0mG>ifF{kDuW?HIJ<H
z;)$_A^57zy%Tq|$ee&9T>v9pNCMwFd5x9hFN2Y7vy$T~CQJ^sXrrGwsRDVSVm)9Uw
zjU9<5>8x|J+Q?dsN5ev+B5Z@b5MQXy)#;+H7O7FG=qT6TxiOt{J13IrgITPM(X@I;
zB6|vex?mobMQ)_OgQoLR_7(k|ZB5aX^jD@TwfiAMyp<r<XY^a!E^6G(EH{~)88K2+
zzB~);Ir)6Wli{e7d^JD?ZMv#qH6tf)xzfsB4%p()w;@`;v}us7JDqC9+>fA0iTEhw
zuV$r1uT?{PV*+&{mR<)apO;za%nkWMcTSD-<5>?X&_AvR7AUh<qhr!)w4@@hn!9mS
z`<w4fWkp`sWW{VarF3FEiOTRYJtXf;z1*A*))2eylEAvJ54zD4OriBde48iEM^7ea
znW#dDV!uuE76-G?glx>ObAQC?=7tF#{{=Q9T*>=mqAU1<6VLW3lK+)P8?mo_TaRp3
z^r|8_V61Z=Eh6?m)HDRwTQ>HkC2|KiPgdvX+cZHu^)%rIj-MR-wC~IONKkDiPx$2a
zum{&g2mm}69xL?n73)$)=gB;7pf$w9X!>ClQVSvXQPJJa(SAb?c>;EO=Ty*uI29*&
zHB~Iv7L3fiA^I`#^T+~%9szuh6c&9{v`#*w%=W=m*P|k-b5w$!qZH2zIo?wPKeglX
z9gZ7p8&l2jV%?D<DUTC1eVJDn)J-S1_7->Ve<{!~-p6V8nYg2}MW4W7qgU2FozNfO
zs0xZebwd=qTR{J1=bQWOy==0`Gx;{asW+P5=m>oP7uLp_`%YnnPF-*R%z9n%bn93r
zm}I$j!MIMSmQ6<YiN1AuoAlDVn!}*n*Oim$oE_31clW>1T#VF-nB}PD#c;mLOD!MA
zMf3%Nw7VGbfMAGz^z!T=3X~{v5qvY%8cr3N2uacLIDJv6z2U7@d&ub2ue3!Y%#*64
zvjM433WF~xG30d~6Q892y6%=G-Hl~=oh*lp`NSh_u{%~rhvl%H#{zrBC>S49+NB(_
zTFs$@8use(jOA}5AIdD)ZOZl=1>bQUX4nj78reC2uiQIBEh}_XW2gFzv`&O}uz9)a
zqA)sHUUEr9gtI`vhg{fjKd7YcdpS&tCm`i^J%g)-ex`Q3t6+TNw?b)iZCpT34XsT5
z6AH_bro#CmV=+|p4p%R@*&a>dY9z|Z)!K$Uz$BN5<VBjpc{y?nW?FQe9d6`HyN)y6
zO&653(0J@{%CaqU%kA^mlfj*peyy-$Zm1pC7bZxak8m#@>+NH%nf%?Da?|ONq>axX
zU!i{<y<$1Y9ZW3FsPtBCpT0Rgo#GO%E`Yd+MXyF9QU2~?$ZYi6^h9CS<zXqir!X62
z<D_ivJI<S+f77-RZ=4+Mbp;=kd-ct-Qe}f!A6qD0ddqYo*M&vnYtMjMFagmMQ4p^_
zf3Q4U%Wig2<*n+}AA2YWT8k)UqdmIJ)l2l^K^bL<nhIjYMjjFhe$n~ywp66(VQ}uC
zTRd~Wc;k&%Jx4^1=h{ZSS7Z5Z3fAAP4yQ+<Vw?=(O)_v=jU7QK%gEq1y6m!}{px5|
zB@7&Iy?=EREmmGOn)!U%cRTn-h_|rQEb<*r2tNKYIKwB_1sQwt>f;-#lq|hg$&TWC
zWWh_rv#;6_Iy0s5d!h5KQZKH>n|a$Jr>BQQN==Q`7BIDmM{w>B)J{-1&PB*tfVee#
zr97_^@9T-0_2Ikci2>iMd-&_HfF)orN(mf2?(F@CEB~9eYaj)QH5KKz8~-HctRH=)
zflOwppmEwR7I*8v1zmXF>8~`8)bLk&k|}0AkAo{D7`Xj(jrx<R0YzId$YF)g4A^d$
z3WCGrm(ZlTy$Q4Bxo?iSc6VE9@Qr0MFdqmR!$O!40z%MnRx<ONg5XucpOiFHrmd^f
z)Q!=|X@_BQg{+sf;OMY{6+7%0JFa*knCqFYJ&t%AO%q?nb(6Q&ev3XjukQJgo9jF3
zh^(+`WUO&P<47S&aDtj=oE>M4R-=c|M7gQak(<VjQ7{oZq}I3yTD$wl%5-qS=(@8`
zp2{`-VCK_O)Ns&`)J+9^yhY{qR5+G2e!N4w;G200!;YPMM*9Fd8qT-a7)>X_@Q~6;
z0l&8(GvyfXHK;W<tZ^g?#aBIA#v^EVJ=dCduFI>TLLFIn(7a$)VeArd^t9FulSWll
zG!%uccDld@w4~R#9zA6&fDkPI88WlUrhhsE)O94N15dE{hNO_$7iK<Q7C#NnSPTyf
z+cm1ctR+~AR?%VIF#YCtILoy04M`3+K*=+7nc*3~?Mm;Xt%-UwZo^SDuIi~9<CFb9
z7V<wbo4c^uraBFI%iDi*?0=;c+%-YG70N&y`w!i`^Q>uiWr(2pwQ^QAYKtg_d};Ee
zy2oCp9ssz;6<Qc65q0V~?PHfiT%ys_zOM<XAR3_U2OZ~e+mlvM{r*Add<58f=ld}S
zY!L20O*}_*cJX}QG<R=JtzdUd!PE2r$J-9<VqhcnecGh}zt_7~X)#UdP3E6)_?}Eu
zVpp%V=dA5;!|>vy#E7TvQ#;Fw1Z)riNeaC-=_B6jo_y|_YNU{aS3D1$%i0ET11zS>
z<A-t-M(gz2KPL_Bj_*Z_%6VF4UM8JtSx_mf6yaG7N5m8m@_;Gpg<%wdgj<Xo>o`sp
z$$qn<2sb4L(nQ{Yc{WSA?)$^o>Qz@7m7^Q>VX-LTm%xhKCv)N0v4R#p(@_@;%b<sl
zM3R>`PhTvXFId}P?@&R`i%b?(15o!X%^Jz16It11KP0alS!g62?jVI+dp+Ntsb_w{
z@8u#6<~l5`F@NYi8)sR`u%mK&IJ{YoK?+FVaGtCv&u^U6O1b42H1fieFS&dTjofTL
zdtH?}ZCiqdkNu;vua9s189T$uMe5XLEPpLGnfC@T)44cc3hr;m?)8Fitxi~;T-H(^
z7W)ILBuA|htJJWYo`Bn_gl%of2N78k9G=_bDC-n(ND0aFh^ZD0PLNMmwvb3<t8gjY
zfr*&IR3|eVTuEfs)7VW;+t*IrgomuzD(&euBLd+lEgsBf$xw~8^v}8a9sM?9EwIS}
zQrHZo+CGzet4tr|v!CgfU4x8rcqng@(Fnmb7M&)sj>m5G__hT}A()T$_yz4D-eX3F
zSun_8_sa8ZP7IcFb4ilhIhG=4G3qNR7(DsP6k4y4mo>)@%NL{@6H%+Yud|_s9)JG)
zOs&zf;OGf$3~0U|J0r|OkDjGSPMTG?rC;b5oG3nB11vO$hjLHIHIj*ZR=AqoN@6d9
zUOk$&sDJeWec_)}K->m~_Ir;@QF$=-+%7=>tHVW$1jq(ym(31(^6zkXkHMm*!*%wk
zDVM#tmB4J^4oOMQzJvQH0N|71e|DHKHTzvf<CDy$12kjFW!m_jbfOiiFFKwJ(k6q@
zdQLILTY7d&T?LoqCmb59BTwR$pWP@P%#!Wi^$dkkH$8<XSOE@qN8;Jn4N1UOgmB+0
z0$roLTBT!kw(V}`25omwPh*LCuXd2?-HywAsVmKANCncx;`}-Kc=RV8s~t`<7&TTR
z>L9l$=j{2of3B$AVxtN{i#gmFjklnQnkaCSh2`hR9RYJ=GMxYBwaGP4U-tk{+8-Ai
zRwIxKg)COhZReQ|zxedC+Lqlj&Ea~7fDr4<8hXb7hejcD`#7<K`o(oMritA8gVMUu
zoJhH7e0D2|4J_%Nv!GBTskW!MJ!cUjfd)%mOGeXL9~1e_m!GN`oOBF8ulb7m@_g2@
z`*fnn{Lv)FZTn%VqH$^Bk&M*ul^&1~AlTN{tG^^dZy@|yP3@hHjq}7jBMJoYNhh1*
z`(I8k#paaD$dUx@Z^C*<i+puoQP|A4Kp$0E&!t`LfTpeu2EOh?{L#Y(j7|kp?it<*
zrN<43dRa2p!lg#N=3LoYrv1r>mhC-eDn;F6Ok};BPw0e={Kr1|26kkpmOvFy03Ug@
z>2eS`5ps+*Bhw0fQ{J`HG_YqdK-IfEoaY&9qCg2eNp-B}QM~)nIC|Oaq)!oO<-I%{
za(rIlr=>KR3=%{;-a@3hx_j=?G|+dtN{#w2lq+2J_t<XdE-Tj#HK<l3)TM8Uo4gz;
zSeb6Hs0~7WK>r?1u%P!|O!`7C`KL%z__`lEA_H0`@dI8K=~Lw>UmEV;<1F@UJlGy>
z&-Yhx&XRd)GISvKhw|mi(GnqzeMmcjUZd)1HLZ4e)25Tk&SOX-y_Rb{?*f@b+E$O{
z%jpI?G3DzT$%e}#GtQUGQR7Qh@EqQ%k$&Gz3_k}*jWmCJ|C`Zz0f+!fmU#71|HJj9
zX*Ugj3r`mf2`kX3bapRYz1z~KQT5$8X$MZAIJOkOhcbQ`z@3FJA%lAbOXs$2b)_Nh
zgNbP>35Tn+!jusFA2@in?g^%%<(J|Hy3ec5R)4z3Wu`ey-isG823=7D59V<)30Ph8
zG3e!6HjfWhT6^IiAT{6wC~-ISB{zOPQnRh1E6W`*9txN%wK!KU+p<BLxhX)<FPHsX
zcguJov4h31o5S(V0v<Pt^#BC081ym=LyHAMPZ9M%{*nstunslaW<tl`>dk8{Ywcv?
zNk8;x?W_`!WpA%#2IH$|l|~b-oVO(QYiTkToy)+RjAfL#%&rqL+P|2c0Q<0dAfV#1
z+nT!^_Uaazcw<9-uj@AN<p<4ETchd0chfu|d3;3%??CFr-I&J<S0d^CqlTjrEO$Mo
z{*%AW`(G>qF{B<`N*|3K|7W@N#Q71Iusmy?UR+%Cuq6M<wyT9^L$tidG(pO+rBk72
zaJJD?XQ;n0h3n-P^D?Y?H{ubdB&gy3Ec#>Ds%YYguF(6>6|fc3oF#CX-Cu9jfGj$w
z&p9fq;GCHRJpBi^N;GqQO{JmzTI<d%Xvzlonzt8M=QMUz3*WMhWm3Y?xEhUNu!}No
zG*87V%CpeN<?V++tnQUZvGES+Uwf0<m{9N@$GD>4;V9i<5T42~vC9EvCwBR@pTOKZ
ziig&(VK8|b5;|FrLQ#`gWzd<G;l$6U5vQVMd=90XCYT>0)S9J`p|TzLS|DVPsHgMt
z62)Zno7O&(?7Jt_TDA7fpa3BxMGACcM}NtXAuC(%WAD^N^dh(}d4rU|ZZ^aZf^7Cs
zI~5#uUg5pvZevGozmr5ZD-xP1)4D4jS4G#uO(VtW1~>EorP{{~YS2$?VjZt-N-d|=
zH4-ZXiAQn;zK^tNQUC&<EXjoW3&es1z-q&p7JAhFD*OUwi~sq~=X>&{1`?C;aQ<lf
z&i);%NG&5d3bG*4WU4)?lXw+Tq7T<wqyKRfFwU#&&Z~_3Y@|r1O1X+^HICaRA!sNl
z(WqM!9WaU$x=Qmz1`JYB5~7ri1dwr@-mD|l8>B*IG&DfgJVUCI5DEo3=+3$3TNV}}
z(SIV9O4drNLCHeRdOfI;+nS+EQ6$d^yZb6+yhOj2vn|nweQvl4oUH*044x*lP1m(9
zrM#q^HQ{s7UXC}0HMFB=9wrS7ewwVb2#z4mw;{E9mD*-gIMW@SM_hk?Gfs;}bFA2-
z<%Z6J*XkKP(=yujw1z);${0EgnX{t}EA92e4fYJ_JR_rNCEcCkaQRZ<J7te@;Y$9b
zc9!b^CJ!IZBk~>VMV0#aU74Kj_U3BXtQc2IcY@S;5L&!}1-clK%B;z|88?-_cYMa&
zeI@e}#8B%wQf8VL`7YU1{da)53jA)aykIrN^-X%eDba_(gG>5<#Q(c+A&5WZ0cXY6
zdBsWk5*l+(UCm<iiE^e-fdPg5`3rr?DMhOEQn63Y)GXVP?e50aAoseQ@6W71K}5oc
zVEVYwqfm2xYGx&<(e?66l*w|E>8&Zs;PpfYKuT0wc|-9{=Ud+N7J~7O9Xsz|^|;z&
zf{Kw`H+*LM41=DikB$=Up#+hH)3sxO${Vg1If(qW9ydPGU!EnNJe9P)Gbi+=@;Lo-
z@w)hYiYgZUWzUhjm{F{%)d&YYf?h#wb8f%Gg5TlOqE%XFJV{taOzi!){+Ob2Ez4J~
zp^hEp4prI0qfT!E6*yU4)}KGXftiHra)L@Ko(UU`cSSEJM{Jis^ZF3<nB5H2)2LTg
zR8%9|yPktXzgiwrYv;#t9+!Sd=_*~4>aEH1VNa>8(&Ke~T8u%XI95kc5osQnDNTML
zkUhSvYJHa^uiw0^4aK6J!*6Q%f!XK<Nu(ephm7&aWrb%d;}h#B4C=kt<IunA@>CGT
zj8$fHM&Ow<`iT|zl1N}_>cm@z+f;7HTTFl<nsi_aS@=G-gV+Ps@{+RArS(e)>$MFl
zIi9Xq==#SZYTh0y8Wmq>H(edt-x}5Fu5&4SHxcaj6qm)M78NxNOzy*xW;Q;e{WI&l
z!*+MD%7i6HA*;})>cLo}&e`#X{zw60drFw{OB)`*PfAMhYFO5z;C^P{2e}C|vohtG
zjWLN_CC~8*avhIqc`OFi)UAV@qceMtoP9-?IT5w<_Uk8S)s`!`!cS0I&fcWd9kt<q
zsgdT^_(Q2T$4Bek%my(wgO;@e(%RS>yvy1LQ)t6qlvjbYQiSPTo-P@@g)Yl5uZ??g
zzD}bIrbW>Vm=0IHw`2~cOj$;jq>I%&mLp*})YPeSR-24=&e-B;Z&G#cH`Kh{ax)m0
z3K1ETdHZAJJM!L-;SZhnT-Y6Jrb=A`pT<8H02Q8ddqE+(#~PJZQr$+uS|JX@IKa3T
z_AQMqzj<{S2b7mmB1sX;<fFpIMi!ArR6NT&KAjNmH+b#Ncmcr=r>_4b{o2ZH4_5E3
zO_$ZGIVo9ROl^(Virqw8T`|pW!L)0C7d+g0<#v#Lcaw-1#MzEDM=^Ah;=u{57F!?^
zFWiEd%`z#Y;D8?WDA(L5i%lvPqmKT@ix+?&1@XBQ$R@z5BMSPJh@s+hROE~=f;hh&
zz2pAU;2>3PcN{Wq1jNu;X0~GLEcCJBZ0e0m!|j>rHpcyF8?Cd0brMkW#CHDwsgPA0
z>FM2g(rVikN3Qj*=seq<CV}xv<I2tPS}DP8f5`?P#0=pQ^u4M5er`mfmA?27m*j4X
z@Fj(xgz-m<VyzlZ)zK!wj1);^PUWzPirJFO3#bh|Op*%izWGo@Ft?@?$bhT}7?a@E
z4QTwschV_zI@(9y2g*FTpf<0VT=P%q2`@KMz^}|{%p;KHOJLGE`Zi7mDtCq_OAR_{
zl)$J&){UW<#m<OM*dWo)G+*e#lLC&LdZRDqCN9<a$NOc;rDDwGQ=bdSaX-tHiXB;s
zGNtnYj1s7ZTPxLJ&25_T2f2`%N}dUxf|E^!@d`VCa)|^**gUWD7sJY6p3aLzvvcSc
zm^A|qqL7p0R_%-9)No>)7&`Yw#x@-Asov{9+Oh>BOy&5nugrb-<nxp*c8`xo{X@_Q
z$?(}N8PVK;1EEO0PS?UzdY*3)Xhi?2!Upu&;yhOF@7laBb0YLo!qCF!T|>DIxm|y(
zjUbnw0;hLw?nO)^k9b3%#7pbmy?X+#3^b%ZX%|Rm)B!%kq^XKG?g`htMi+EFU72P~
zoUT8nWGDF;<zzn&=CJkk@VaeFmmW`-*%@^TL`!40CnY495++i~Rjh>tzg4(kGhc<A
zp6`&b2>R~PupDLt^$bDe=(R3N!lNhFZ_Nn#^B8hFC3?(|>(9D22SqDU6!A)xCSYHx
z*;u!AJQAQ?j^{ARjVgNfk!{Iowjc&`z3rC!@=$?_PK~2m6J;ut%MHCn@OGo~T9&ek
zO|q3)7E2z-8L#$1xcgpbyI(O;QE={X?!=4}q8ub}0grc{!o)=cS+UnAC1-!RCu-K?
zQfWTAs#c&`)V8wbG~J{uGZT%5i3vNyb5=Vdo4K1Su$H!D2MprkKD8XC8P7v#KGAHb
z*{b+*6{BIkO+?WBju?wiAB$c)O)Ka!yxBi^bF<NWg1li}sL^K7=u3l;n8|QWbgwM?
zlRJ7;vhmd6OI@byr!VIG_tu!tHI1kqk@LfWmv8bPh$X&P82f)ncp-@Y@<PJ7fux5#
zc4xu%-<L}%{~+lJh}8~n3&u0t+WZKw#;@~CP3HLe)IU(n(N|Z%TY%Z_oBN$ReUPB_
z)HpF@tcu=hhTA@>8w;BS8~z;6jHm64)(XJ<yRULn$st5=y~Gp`4!zZf<(u+VLj5V|
zc}MgP3)eAPT-j-+k=yt70vQYvPL<p9<mxl)IFBr1D>gi2-EOxNx|N4c<_EeyEz9g(
zI*pw|HmV4%<q_@z>^x&Fjbir0ZJ7i;sN6?0i?w#5?g)yb_J);P0_K5ObcQYa3=<=X
zYVhqoqn}YJ7_XEK6E7S#ltah;Spp-6&+Dybul%0%Yu&9=?x+6tzEx1`wYxJ959gu{
zr^kF;?R!fLmqWFAM`nMfN2sVyol*jutfQJ{1_$<iYdOLAkO|F~72{hH5M+PfKrAV*
zt|@c6<kBj^i>qXGAuhh=orzcc_>MzFt6wDKzkETQL{x$Vj?OHau<*>#K3_5{SU5>>
zJHoBxld71Fl;yRUib|UtpRT>%LfU4QE-LksBE%6Zzw^|tb?p_DN?`L5*=(2}3f`FC
z*D}DxYFV(c{n*F1H^JTowz(|JMf`Cm?3WkD12~KptR%bE=zm`}h-_-+aqS{-x?)dE
z7nVsr5fg1Vib&$Hnc5oLL~4e#oMzisdPm=btEnzCmP*VkWGmYgsI&82antf6)>yqb
z#!fgQkA7L?R(akFt(6SMt1t*cH(j?~?oo3ox00QHd^~>7Lid@tb#_lOd%uXd(M?56
zgB3Tu)#rH<VFLHkC}eTfEc&qVsbrJoLve`cv-*XrH~NNR?hDYKcviYb*EK$G&<v;#
zGjTUFj_y)g8Xlbu(`)^dZxrhA#PV_pJ2`f&D&MyOpwO@tZTE2zgEeXn?Ln(hf~`H(
zZ8bZrs^ZxayR5pSJ!I&!QvpaI;^D@19OxgIfwEcQm)Pv?wR~+~>=|d7L1ntAb7`D)
zSGct{P#ZhCvLI-l6y)rx3T-KN9dOxIOVc-o9{as=aMwoCV+zfB`gMf$YdyEkC+<?W
zQOkH<Gw679Jn_h>dV6Y5OGvWiO-3pOK=ZoFIeweajVs+BPneDKNAT~EDr%stFdc>x
zCbx6V*fH?&30`s8e@+kmwmO_wWM8+%Hhoa#A9k@-+14@GkIL@bk&IB%`sr<F(6}A*
zWpxG>n9--f>2Z*4@42dLvG*{*Az6s$`A*XfLQkvDyi<|icO8Qlw$lxEU1X#;(20L}
zJsd-L7(h3+5}HT#uWKDX{Lao2)!Pkywsz-^YH#&WuP-ZUPfy6ki*;XS%2CO_qX-W-
ze429g^4yuC&wQx3<gQ%&j${n2Zb*ePC?cW1Kl@S)G!;C0d5-cd)b`tRdpGnNF2oYZ
z_@VpB4KwlBno6HB<$}T}W4}<wcB}C^k(mcPU(9Rsgrh>j<kH(E*8=3f)wD*Qust)>
zuPc(mUbF7DK*z$HcccxX3P}k=++XQpXuQ}QpvntjZ?D_hWm?BUzM*An8`09%)}3;G
z+}+Q2NzQk9pbvdrJi>}_3sI`_7GZ=V!IQ?Tow41e6o$xajjMQv7cqxB=yQ8s=vG=z
z(}zY_+AGAjPh;q{X~B7Fc8<7PAhPK!BTFtbl(Kh9K10KK$UZ&Q7sO-+$hqajq8@1B
z;-bUg2PyWojJ`(tjnRV0JNMhxGOODcHdEZ@3{6Jr;!V0OTjME46L)7CW_P(fs>B#h
z`+KiD56YICy!n<6RdmAlnO5rKX9{F3J!7igwdfwiydsPl^-<*`(!o7BfmAEkUrk46
zXAiFFjZJeSHU!4F>(v-i2GHG?Q=Y+NpAqS}`V6l{LBjMgNVj0hP1bmAVtU_r`+!=(
z;LvFnPpEXCu+ysNkjbfT%dvVTSw=orQNp5hYnR2WcYWJn?$)*o#m?xf$?|GRLi{H!
z7HkfHVJj1xA!JeS6G^$B7dIP8jHTZdL;Wa}kLf8GTJN7J#p$sb_te$NXY*XYh@<Qo
z-|oqCPTPaxZX9>4dZuMMY+c5d(T$M;hutji?@lGv`hF@1;8Ju534UXV!uUUu@e7!L
z<Tlo1`qyQC)Z6?Jr4Q<?If^+EiutN)f>AqPRK`KU4jpXfcYy{}JPmz!(ZM?`Q=r*T
zKF^VWB1jrLgiua!D#b%Rg>LSdcG154JQ<5=dZu)S=D6+6g$1h6yt~2NTBVUSiRs$)
zH|1dyQnULM^yGbnMMOHU>d%8psB@^l`C;6~*Y*rfd<;xXUT#qS9Ng|A7>>T!&v)ES
z<hfa!p}(_#7zxt%60Kd)8Tsh@6b~&u2{?#hgV|U22h`f=HQ3}q6))Mn58VNcDUF*G
z6<TbT7u4N0v4c0Z6JvGUwD59|L+JOTInGw+$mDAjP43+7b8e|Ga(&8!qmrlI+)=u@
zy<OywbFM4o-!bctHf~-$ovl*YFjSzU)AcZu+JrhHF7DxVHf??5Md<)!f2qw~WUj0Q
zUk2hg3NXt0P=Q&MPQaV+S*Pt79yiZpqbdy|1Ht;Ubu;o(K~8EyWzCQW+@v~1swD9*
zZ<0tkHj4&l$St&q_Ha17`lNfv)!ZL*^4hs_AH$x^vN*fIBW7-e#=|3-&r=)q`lUGZ
z@<<~yzm&@|Nx?c_y`ZM6<^k;q?%uv%N?pxvi-P%uW^R@?m0`D-q&0tW(#cAd`Kh5@
zNa^DZP}*#nKC^PzGCQg>Eqw3MtjE3sl;zom>R+Zx6K1NW?AoJ$n6CeETNpC1%YFM@
z>HllVyak1t;+5>?&bK>Pz-Ve^MBFqgnRuga4o;^&+Ede|xA}ghDL(<6QgR@3F#)UJ
zVbBjS^zWas(Eu35VzN__{mUr+FrFRs-p0u<wbd&u4ev@xNQB?2b(D)&QK&~^nXit`
z5b4Is+)hK|4Kqx6sRvaf`S-tjC!wbjvt=!Eg#2_Xf8(w_Kk%h4&CzoIMq59w+P-P3
zJLZil{tO{gH`lCtviFR=h^#-3RaP>Z#^fy2{Sb4!;gY?q7wKOb^v9jWDDZ)t6zw+u
zezbqyhp_|G--}-uBniWUKfS`F5GbF<(PBPQVNS0<>gq1lZ)Ypp%K1_>`-jQs`&Z-d
zqN1`}%F!g`ZPQHjeSdl!TS+gUv80Fvj^8*Nu!0@<U=x>7R75HMy)@t7cTm9bxE)1n
zST*(r#l*x=ZqvmvT%WH$s+=ED2V>_#XX-zA)SoTmC@%NKQ|J_E>XwxV{B+x#6kt<j
zI&B{Ov<iPq(IN_fMEib^(*F&4eq3Ed_XhMxH~0OSXfH2*4dL7R*Sz-PX=yTnAaC*d
zHG-6Id@0OwCKBPzx?fiGB(P4m%E15hHUB>rI}m|JDWBFV7=MNIZLjIu#YKa7KF`7~
z%39_}Dn~!50zdTjGe{zxrak2^s|S-#?<Z7X1(L~@5q{du@0(jKKupdd%r)a$3xI`V
zrP}iXyQC+(p%+zGw@&Rl(Iv#67CV;6{Is6cf?z8(KXwrR`f0G=gqgwQhc)W1@K65*
zyJTH`JBmh4vP&iV;Zj$0<kzt0caV@`%8dIY6^E!fcUC;AA#QWFbiVt4Zw`2aAqUg%
zf&2Z<zkRxnO4!#`X89ris+2!e^Y5P>MX*0DGWOf}UrX_Q*&gPC%XGQM$?ejxJ4f{4
zPf-6L>#a(SE%D2f{7{T%<zU@4%KO+uV}26$KXsS*8hALi>lCuWFxcg{<la#k!V(fP
z5S`gSc9CzR6X_u72QDIe-}?T2zpmyfOi@n{TCCN6y#{_G5(6%a91ZO^!7KyuHM+Qz
zbo5EwU_?R!EiW(cJP{7f4FO$AjEzK3?B3|`U%>v4MaH0pEpN_X@2g)`53Jn7KVXaU
z2h|%Xa+oBgi4wDNO3X7Pg_oBP9SEtUjr~FK76pl#-b4iDW@zm1RsnWzIxrKblZ-|G
z_IH1gdK-oWZl|~ta=~<G5gU$oKK*qeuKeiYYiEfdKB^lxZonvX(C`+8-kvG(+}b9Z
znr&!4UMIwB<L}-5pEnOpVK;7SoYXG$yWI<$y#rKcwjVMo2D>cc<&_dzl(A}FyzYEo
zKb?Y_N#>1i^9Lb+RM0@G&S^9Mn&d6YZKO!AuZ&Ae3J4uLkYBCwk6qt;1T!Za@pCnQ
zO2N<Z^IIBN0Ja{#Vgu7)eqPeAJrH~%J5l+F`{c~b^51H=d3X2sBhmOSo&iv!pN|)>
z_e$`sl&NVhU70yA7didUX7!)%NDYH6Vpz&^Lc*U6(4VTr?+t@f-rR<ojIhfX9&k1T
zSy5xGYBVZ^v`#ZFStLQeIF8?@s%_^!A;R;Et5zZ0#AFdJ$uTj(Xv4aSMGXBe!~cBW
zUyrqi347k*wXb@=UW5IH|6#yV;Ez8h*0~2nG_opAAtEM$6ht@?8kW@}AUpsS5sKkp
z?s(@XUt|gr5&?I2cM96NC<JObb4kg!<Wy9T<Y<w9_f+3yT9Xh+ur^^|(tj*X9kBoT
zl^LtwH<~=m7{R@zy=NyOCLtH0M9z;GDwi&5JMAzkAub*;RG^^}5fNc9oU63gimih~
zs;Z;IcZW_+5)NL7f|FWJ{)_y+dGOt*zmur%CP5k8in>Yh&j#~v?Y-s&Yju5T*Mte%
z75;Fl=h!Wo;!`dZ0ZQ{DM!gB0(JI>1A3uKlk|A;bm4dx}Ijsit=}3`Ik^2{fv@yLo
z!=V|S2*pfQtlv9PpaE46fYjGNh~m8U`{i<$_3{BR??B{tJtRiE&3`vABJ)Z}LRvcf
zB+zFJi%wm<JBE$|G^(wS7FpfaS5Ue+4y#YNINdiq{x;o)qr*q>mQGGtevp~D7mwh=
z|91-geY^JpV7LV#M)&ucLhKLjw3mbf^@rK+;DHNk$?Vo836NIy85<P!Qw`8fWV4_l
zAt90fAc>jt?7h#)$%**eE(Eu|MTvM0n>28&R*z~xQ3`Ox(OA(mY{yt_;(xF7|GxR^
z4Q__8>GOZ=+%-CEV<>i#e%SFQ9`7Lo3cx7P2Z;EM`Jv$B;p&l*k$nIK>hl1B3zy|Y
z<X@mZ;2_?v+YbSuCEmx23wZLXIP_NS9<B|Ko9e%RWUwq>zW}r2wssfyM-22sFaGt@
zHWJ)twM1me4`rf{_fi6fX{xaZLGT|upluDrjs+tS@O@Mb-VCRWp@60}urDayw6BYA
zcz;C4!Sm?cc>c$K3P(o}`0)4vU83L1hNcHhk35!>!hZ<IeK=(S^M$tH4<46i=vY{k
z0s;bGvgOF`prK*&@$m^k0vUIAclS<LQo6yR4?)?G?wiyC`8xd8lx4+%|0xyp!QdWZ
z+d|WSzeL29Fta=<j2rs>6TU{=Rz)m1Tpzw4peH0GgmTXu%zgbJ^NvfDAaeC-2@?|&
zv&F<?kjM0AstgS+LT`;xOdD&G0&Q+T;iG@MJ})Zpl&+*g+`nIh3vM8mmrhl7%0HG7
z4MAQZlH%&ZL_$g`+H^Qq0%%9@W^o4+vM!7>eCnN#8V*2ddk8@!2nM^ssX{1aMMaGW
z*pKLV8yY5p-Tr$wSiy}f<4NB9Ef^v8)+7N2yYRUI<ohRhPmzWJqiM5}epkTU7YP&e
zyt1L=;5-E5B<Ay43M$M-u?*h&qL8X#+}4YXj5NFiEm2l8Pb4HH<dlha(EtylCxyfN
zf2iyKNZ$V%^ZyatucY4PLyF$1nB!W5@`L2k^3m!_4rgCIb)pM~#oXO5h6odxYp4V6
zVW%UM(8%P-f5-q?D^bxgMMHm3QAH{Uj0=OVt}Z$Rk~&Y48Jfz+#ifo#t4f^6ZpB7=
zesV%1U@ie5l0D0P>Hk&bAJ7Z@46}nRU=o4YufYAgdDVsh(7}++ObOd*3`{u5gM^5P
zht!>8==5)O3vQvY=F{WCsoqw7c?lQwjJ0FTJ(_=nmd41uhnh^eM6Y$x58smUbrGaF
z4dK=;sdrosz(0TKfZ$_b7~D1lW=dQ<tl1x}d$BWe32-BRjldEi_=`AWe8rRbKbE;v
z0)S_8xb*)JzeOgPH^pIW{*DfGDZ&zx$nV&!kh4;penFLcqknk;M?uV}cmWsQIV?8c
zCzews;RiWdPPAeZF6O$Q4+~5D{qfcGNJ2znRQVe11?Uh;R{B$7LHSoVIFe8)Q=Oti
zY4?>+V4&x-)ei-c|DlG!A~gY&uZnzE`9JiO2)4LHNeJ}c4H*)i_v7eb)~iprLgl%m
zs2@#%FD1@11A}HV%*RXR>#ESxXl^``w6!g5X>FANjt$1FtPN%bLrK)@aS+t>12Gv2
znCrE}T27Gt4$n4<Vu8`eb-1m=B%6xf$7VXz5rBp-T+%@t$ccXcKF~jq>v>$-s+Stt
z#g8w4S50rQtOxJo3EJ;<8f?EN99UO|8-)J<AuEKi$3aVFCjTxgj&P8cwpL*Yb<?*t
z*^p1r7XyNlpv(TYvhM3=n4eS)?1lxE$4FlII%6WHjlthS?U<=|TRPcY0MNl!ZU-;p
zb-^7`Kb6}$;H)kaBX5!X)Kua(K|xWuN_luCVboZpY5`^n!xLc?j-bZ|oFk>lB4wW1
zg^u4uTXNIsO6Whph4mWDwcGmz{jC5$zo~{v)>KBPDokOX8Qjj0kath&n#Z#sWD?E+
zCNvV{2@`!(>`C1oy)Nx|fJ{P*Pyi`f=Q@IvklJk)YSk`++RbRstJ8K!yPi8JlFe|~
z81dt4DG%`9jVrR8uJK#NvIsC3NQsIf2Zmqtu2~E~N1k`sN?Xo||1Wq3^Q{bbi2lPQ
z^B2N`q|tC@;_pj;4=zU%BQaaJ<j#u72VGWFy!jDO#VYygCd%C#v<SHmi^&4bVdex3
zoA!$Xdof00-Ab4U<i6zH6Bl_(nWTrt{mIdwT(o*EGx0779dnbOCYZfU@>b+YfF2X-
z0!fgxj7$uO-QNTUv$j+qW6?5#`#(96e3sp%j1Mu$e{&5p9>0AxeE?E&B)@7y`};pw
zguy$z6lyY<knx9;hDAgX-?140U{{Zjy|iK^TTUofrO5KF5=lra79k;hczC!Uqq1?J
zZzEQ@AaP(&2>@ELbQ(~cLww6B0f385hURXC)3!BLnha+8HDNj2)|Z2cKW&L|UsAZu
zLYsu5VwA2w4jV^)l-vs6e;P__YMA6;xIXx8B*YI_4M5@8lyO(Ucga}<m@p9so2*k}
zcYSQItkrba3^)@CQqoU7aLC*(d63o^YK1mPrQla2e1uX+g&^d7(yFl&oT*AqPcH*x
zoDy{JF>da7TLJYC3W6PL8UvGjeFb^>y90DGe=xVUwX}46`5?7ayWPOj_a?L`<uyhi
zgoq-yBKCk)DtCIl#1K`s-)mzal;FRf$rl#;`W_AKHT|!n`VOX$9)g`fUVXCw%q<8%
zXYYwiE07K$Py{KB>kTqTeSlQOFz9Hn59K`4)qS7I$i~4j*0K4v0pJ)sTpf}a->;aT
zlmpbng7GM_WK-DAxEwcM1W8Ltu}lCs+SUMMPc%j~z(DSEs1MGaJ9qZli99>TO7u~@
z^8pA!@QuOXTMDGelz5v#GiPop84*5*wZYbg&-CT4iB-*_(xsW=m$E6+5c%QU!xQ{@
zbsdUw-!Uv1zeJKaX(AI^zyB0K3@+gCuxb>#;C~Al9)1PeO!t*4tQ(fI@xB0|I;+|n
zy?!Z4ThgJN<vn6AkX@|_-(qEC{M@mJR6_eYzXPI?BTqrCQkWEei1~{6g;urg2XL$+
zb_AGHU=Yyid|R1G6xoy{$YQMceK?b{ajb}+T2OlxI1#9$%4Pu!SWuwJ4L!MaGmo~k
zAtE9wmANnTp+*}XlT}C{`aY>;4abNMK*qy2!wa`X!f6ppIgPr#f4`++XfWW1CW{pN
zD{Ta`XBptKMusdOS~3h6?)mX2bYUTXG|~Iy677NsHdQ36;}3j7!ot$lk?@WVaiI&O
zdyj+*Ae~?ay*vnU%>%UNkncSztxe{3k_o#5s&T9yGk2Vwo#F8USlc!RkR7g%x<Rb(
zb1XeobC`Ma8wWiOT>x$Oz7jESY4WR?`RY|uu^Lo1W(-wpHyC0HO*uKE_BQ7)CW&Az
z?KqoQ>DVz2{tw)nnhGojG&PC3@JHbFFT@X%-_&f_<?JLALMoVLxj;q;qhq6{7c~r&
zW^BoDy#px}6&4nU*+6gDAbApNk!2NgNMjn22j9icEBDi-SW)PxXfU2cZvrdIF74|)
zfRb6-K2~biyZZ4he;(JpfB!xOC8a3r09zvW9q*ExEwl=mLE$-2P-o+pij}7Mu405H
zM1<BL5m-kyww7i`zyiDp31Mr2!ptc!m-;d%>(a<3_k^&?Ughg}b;;xF1?Wd(s8ED`
z;85P5`@SnbRPo9J4j6!_iHh}v?vwezC3I{eGw6Qlmv76cfGahz14?!!OW&f+IGO*q
znO)?ALAge|Pnf@@sW2>Hg1@!jpZ;C4pHMwF2vqVJ%Q)HhQ&lt$Y;A$OSI&`d?Z64#
zEC%5-oDEG&2BZzB_zWbWFP=p#gn--Vq|#z?1Tr94mCMqtH=8DctbeynFbZjohPfr}
z<;jk2JnzdI08Vh#UVzh!9Pgl@u$F!NbPIpEO*Ozsj?o{h>QknEv)^XvSUNcc1#SsR
z6p!s<K*@VlUHX>tG48<7t_K_2MC4Z=O$p|ycrn_z?v?zD)r)=C<c7=_@%#`2PK%J}
zB<=y9%~SS$dvLDDxqO;1lU>N48J&0w<-hIO9ucr%`?H*LZ~y+)zu&xN1D6AjPFDtC
zP_fC741@=1!X?<`oOeiv?MbL9WwD`tlFfc7cWr=j3YsGcJURjn2OSfWBE^004J>Ni
zg2j^aDgj0$dcMR^;A4EAmZ_J&%`e#T$2pv;wkv%xK+5THQ58;b6vF+Du}$BS&Tp8Q
zk%~>Ld=-<8E<_}SFp%r47!~6r6>VO_Ae6^>C$&VEhl4VU1FNCI!y6q(^XVHslAzwW
z$=e;C;O0w3nq=!kiJ_yQnnOmVnxP3n&_~GD;jnXE)Gs4yQ8T#nxr=Pm=~Z7aZg5KP
zx)TN#`e$I%hRLh`&O-0NvLQ3i(*6VLX~NRl+Pou4Z@z0Hzv7W{G!yH+aXp2IyG*%$
zaB?O9JOn*0f<V*w^YJp6?UnLX<v>jzL!NR0b7{i};D1a3XhV`C2`W%2N)Ero6yz{4
z=kdI%EAi)N1wo4A<`@Z>cE(=X2i^??6p0j!ZKQ3ehGG?|TXdY5(ya;|sh*@i@0}oW
zGgptQwOf$^qazycme3+_?63yz?H?Yhd>WgVB;JtK&A;P^iQYlzJyU<yNmn^-ih8yf
zNm1%N;BS-|?IT89CtTH&z|E(E-QduzjC<K;R*e_=aW9$w+_6%8_Uh8kAq@nZUDplj
z@p(+R`OjhO-}4l{!oM_;o*l>s1G`P%58CTztO#syJPdZ(@oxTLeLLXcOe8ZBB9gM1
z+h}z2$sTE>qBo6XYfpDzAv4i37b)i|cB-~Eyga`vXXfr+7k&?%#9r!$gUJhH@d5&F
zHxub8oIHQEiZQOnpjkx>fNwb9vvAW?L8zqX`&=ndjp@$j!{Yaah=mhG^U6U3ddhUJ
zz7Me+Ff0anM^sgjnIECm@ccCkVAygJD*c`QltZ>+KvizXAihDPPm566gJbq=j*t8+
z>y0d8$1OB7gD)*k^@OtR7h<W|NP6JJO`70@$4oLEb3&foo8yCamy4PqoVIoYB1(|+
zA%*4-s&D3Rg2MyPV50`&6IF4$1wfE<3&Qqyki!hi6=gb){RiV8`wqrl5O7lcAj6*$
zOMj6crj&e<`}#xY8=HuvB(L&Zwug`~fRIG-*e%VC0z|M>1LS3spHPEIJ&dLKf>Y}G
zs!VrKQDcC|x#Lb8GVG&zTmBxhnpQ=X60%B#D&~DNl1J{k{tUvoJHwai<+<kt3rwi{
zrUUsQS-vI3>8mF=fzBPUX+p~2@Yrma8gD#)FwBRuu|h=to$d$3geaEARx{6?FfSMv
ztrd@9FC~ZBA`{1`Mx!j#NU~@@gu8bAqDYf3I#xeqO4A-(^r*9se`7N}L1ZvryU@$_
z=qE@B^S^O0{~Om&ANpGtmr4u>ekgG=YhgT0?~pLO14&gWkff!hV-_<wB%~#jKdA-?
zv%D^b1d@``3Kw*wAq~8^AB~GPuIoUl`haZ{Qbk%z)5Z@8WP%h4M!ii#EKrZjZO!xR
zIMAb18OwLnPd#hry17qGzbx?794Gy_xS5EJ2i5Ge#n^#ri$4MW+aodjPh+zl=hCPI
zTm}ZE!}F8&d=yZWyZ5eBpOMAjnFM{u$KSwHY$QtwKyRMh>H@VLk!vJVF8$N!X_g_M
zmsV2Px<10+vL7^TyzYOw?)RFG{^-IWj?>LMidOBDs=W3cJ%;uN)t%+?tzEW<!=nax
zrBaoJ&?|~SY<%{Gv7neXzZ8!sGBH#Q+S5Ed9LPf=T6J^!w?3-(MUs^O*U3`;H*xG6
z0py62ufRgRlI><?b!qg|Bxbr5@3$u%drMt8jgb@LgKg5}N?OJj=i5Si%@agR{ZFqb
z>E}C~Pkx0@zDY1Fe1WjP1M?4GXGu~;im4?pa+yEkk&cm5+?4K*${j_Jdx($$&@1}A
zdnCbltjwkLpk05YBMuK2*JR8gQ<;ulWRix~*9(JGsiiq{!<DdJEG6W_F{FMy?VKr;
zo(pT)i(%Op1@TIi?+k)wq4lgibJT<Yo+xO*N4<Ow`~H2h#;dbDd|let6&~mi&8LRJ
zD2n5HEF=CUwBU|$ffet4E*E90kkuQ*Y)IB4M962E-$mIlV~*YORw*i0#b>OWseQ@F
zsyFj(b*;l1IjFdZb;GS@(=iygWp<gcXCXu^p?v!!PjwbMZgJN;v=f~1w`b04_I2ED
zHWr=YZG7f`xzI9C8RFLjk6(C|n@o4HIq!+c(YBVb(GucE(<n!U^1ADEiNrW;?9Ziz
zE=7kI)o!K#pg(_xXh<wTlaTkvmr7s&rOA-eE5B$g?8XTGJ@ei9*5JFvAcG;Na}~>o
zkOuKHEy=}-|CHHU%t1a>@fpKHYZOkQyhOkr>0>TdrYUz@QwZGqT%~*@otBR`i4II`
z%=Glq20$b@2@ek+%)u3tEEOv7;AEZklWb9Q4KD#gNqTy^((<PQn)K#bbZl(n5Y~}p
zB64p5UDKDQmkqdZnmoyF=nvOn=s%&z>(j#kt-3{pebK-=^cL+9PWt0VrNwvjHiior
z$YyaY^fHJ?gu{(70k*hH2mdEc%Ksh|KIA)PVUnsE_*lIBFv0!0_!}wzgT$2AC0kZC
z5_qhZ#L<tGl-YC7I|j(a3@1ahN?nIdC2Yw5uy%S<ZIP!@3w4K@zd6anKj4YR*7lI*
z)h-=UVBaFQR=Yh^sHI|AeaNO?$W^gk)l<Ef$AB_9s#9RSmi`M1{&Sgtw>?}AjXuql
zluSfahBJkrQvCDiKNLH8r3E3rf*g2QSeb;^n(|$-3=Eh`Sn%Z)Cm5u1x5WmaNO~1v
z7>>6ED<H!(Pb!RFw5kS4NJ=s<k6N6hukHfC@An)_zXIhF2YJ@Z>km7NVxb3#VPVgK
zEUUKo5il{z6e+bA7v6K|(LWT>tf$Xn81V!LAPM0F@+^<E-Wu0~Z*JjZj2qWu#rP%x
zn9wQomb08=HT}b?kGaEnfsMIDJdVOg*CjeKB9{x{4xnBLP}Vi_HTJJB99B~|{~uf5
z9S!H&_Pdi15(E)MM2qMx+UP`2bP=QXUPkXVh!#D1^yrMv=tL)4v@whlgoz%V8Rb0o
z-tW84_nouWEX$gIj9Jfh-`DkP*M)zhOitYC?;IWZ4>_IFc0bf!49h(`_{t?S+_8K%
znAiDe<9rw->eCKrZ{Af(Vc!aKfD9~poJZFzftNL0b%o}0;cJzK`7KFYTIv?+qO7f+
zyJJZjDR*3d#%Ba0c!(_u<wn1}1H#{$o#^BOv``28(&5vp4beGvLfWRVu=9)a?_U{m
z(##H}h%z!<KZd6!J>$1k0Ax!qnQ7m|Qj4*N--xrzPhY#FE&y$L_^ih^9P(?^Dm>#U
zS1K*cV^?@96aM-0)<U+RxBj)T*N=03Uh>tFTWWtxz?v4QEAFM6R?q!+odeH3y}Xxu
zx9e<Ao&{$V0hN{t*mu7t&<73&N!%ngoeS>YYd(lp%b5T+!-JOAxKZQ7r@Kgd3S(4f
z=Nl>M;L(J+A)=`9y)Aybw<oqUGoywp{Z>2spJeUzp%h$o4|#hn<-+~{Jrm<4ZfD2~
z?}H=)(2+Vt`;8@B`%(ox*2Fzoxj6bbxALZ$ZD{Mu&m!dviyv#!>uo-VQ|qk5DFH8I
zo`FW(T2d;I3eo6{lu)c|g1fr7+fTaokU0Sa-)#n-(Zv?NI$ajj%lx17+r!%)9dB7^
zo%o+)fi9P~tLP=uGbzM0--)0p!^0VD(}|xyjRDRC$hZE^JRxZj84*E*t4?=4Ev3dm
z-SA148;obX5-!e>DNEHyA&qC#AULySMiq4s5l7Gs7L)LEvyYykFsF;2aqSzB{*z%!
zg6t;eensuyq8&%*D*3YvHJNU;LMS0-I4~LTTRQ9(j%2Rs_YlhOwexv&e1XO(v#;r!
zrY2uc=K$BCI;=?sV`)8B3rgRCcqackJyMkzIzMovJaJg0NfOy_8@_yA{dn<K4SNL7
zfN>>n&Dhb#5j=lMn)G8?ht}M0y$}U4Wh;(rAUM!Nah@siGxW~n(8B|!&-QPm4FgX|
z0R>0b+&YZv@pD#H@snsi2z(l%<hP+MaRZeUH)wgE!hSJm%d<s<zw9xP<ucx$RiIt-
zDmB0ld<8hg4#$vYFS%JJ3MCo|n&~1SGg}Iq*FUA-y}fF4A$uk4^DClF$R|lJVY!~d
zb((-?Wusb|QsBGDel$OFOrhdSLku(r{hX;RhuE<cagW+pKUiAo<;$09i)jf7LC@Dt
zP@Vj6q+?9NXoi4}ayp#O<vF@{su_fn=HA>{{=Q1RXSWSCCOb@ibJpxvbLsl_?dUnh
zCR`{rI+Zn|J!uxyJ55ro)X+X|IiAK+4!#**n^?S6RxX?b)ZP5Z>ogzrTpkMCZy69&
z?UD@Ih>@BfTC`i~ayYY!I`|M2vX0(%d?f|kx+?cY=aD6i5Z{>Noki8FYp|56)t)M#
zs%DI)u_Kv~#>F6V=_aAxyi=-Le|+I0j&aFAkc>`7?LsQEp_H(DhmnKB^4PlAhb}L!
z>y{I(6Kez^evM7a9gat%UqGqhKB6x)%Qfq?fuPDyXS>rZiRP2j6tJ~3IbegmwllDh
zv~^*+GHdvv8~<RdzlclxMqm8eD`9v6d=I+@{0#b^E1`=PxDvL#4?&bW{mPw#MLAP9
z*%W+EAM9wu*Ig`QILN?CDgK8E@5^;(Y95{`>!0~v_oc4ats6CY4$9iCD<qqr2(THv
zC@NEG@CCNHy>ZW?2Z0P7_I^zCq23VynPcpLCBQOGG9)M75nKhjMFVj0pNqb)|4Dim
zQKeO>7AU{xj)zK#-JCOX-1TamP*sQODe?U;0N?zUFrCAa^SourfIE=(<ID@~ohkM>
z?2tbsFAxCANU3AYR*F|Yh>NGrB9p6oes2YsT`xbTJ;CmN@T8s?&)2@%jNP93X*p&>
z?)h#xZ_ie9^}v^S6Vd?YL2&u(hk$wjbe)pbtKK}QHhT__3yAKaKC+vDk`;YZts-7i
ztM=%fJ<6w{>^Gh|GOn5p7lL}!0~fXh5(ZJgZCoZAvNbYdP{6}w<qS{|Tz5?{Lyugh
zVtrx^+QBug=+2i8ykZ!S^8y<NxED-UuAy-S*hT?eFOS<Fv(NEqv^UKMmK3k7;~S8L
zv1h_qP#~ttX>%%!jH5Ds$sbeBRr%doqX;9&@FQ@yklf-XC(wLLtL6R2Xm1QvMiblA
zo!Bvsj7DbS-)}NVgB#TImp=omsONU}o=r?}AC^7Fy751cZ{5?cGx$VHrV|(@%B@ss
ziv$gy{M1*;7L*LQbj})W^vA?bo=wO@V5vrak{<g@Hg%i*=MNI?yO9R1p2Ii(Fr{p&
zgG`SDTZw=LZ9oa$uGQhxvib?$%!4D7ulmSWPPegnvb^~q+uNj<_p!V1ceWcv=awgu
z_6}{Z@Hj7ZUBih<(T^_~aQCN<h#Pg3>A*RyKgE#ykMJbCjJ}t%j|nUT>gpBcLcLU#
zxyQZYC(};Nhh-o+>q`}9z++H2K;OQ8DzZ1|CftUTO>tUqkX;G5NZLTQ^;qQ@Sv+hs
z9G7b1nsKh9WqkICH<7r8E^Hs&1w1CYLu>8RJ>x#?{;jI#xQYUM*3=VpYoZPS?!Q8#
zIQurq#;^ht=Z`TjKzkFB?~9v3Pf(BHeD=TNMQ<*r2gZOI>mR1z_1LWfuWJ-(Urp2v
z1ePm<9BP*r&dz1k?ZK;vwy|e;#5-0w?4WG>WM{Xf8F-~0S3Bn9Y)mNJFl(<_e(C8+
z8H6wUtJBPkz#Dz3w$bbig3H}DUsM$=UV3IZlnoqUQCFkx_CUL?+mhj<`@7&*FqqHQ
z<B#=oRNK*gp#OY~e?H7#z%@8L`_Jzmw6G@MTQ(*YV7*oOlscVsY+w8ocZCr^gs|}L
zK*_qKK7JC%WvbUEy(Tg+4xs{^V-G1m=Cl~&qpN4{s_zmS9h=166}hYquZoQkx5MXv
zhQ8K{dQWHDSA^>FvadEFq+>f}_KEZU5hqwJNn37aCVm|Bfam*H!hqicVcu@+b_Pf%
zCB!S7ho|T!+EcNwJWl{7NfTi3EqWEt4oHFAln1zvG`=F-CaSs9ZsK1Pzl_(AWS6lc
z=j>%8?z98Tcs}jCT*YIEh)MO;414eRkcaKjGsJiW8&8G!;Tx_-|8$B3|2oHgYHEW&
zO=s$6OD@EoeZBheM-!+5r8yp*hfSHlgl#{d`h}fti+4!}nqvSLM_^7i8Bo*o<40w`
z-V>FJn^^2L9XRmHS;D}cQq!LOs!89s4)$7rylpU$tjDmWVUQ6mR{NL4)sEBDeeo;I
zY05KxyP-d*Y=PaS_X`#Db<O~5)ACD*HjL_K@1=Bo`kell_$B_wrhUXg{#d0x1ofUM
zL$7ML`p2tue$S4B)(_&<1QOTQmbq}y4h<!rwnN(i;}q7)E1rf^z<T1tZs$9-r@a0S
zt0tn;aoMmmzr*ji==n9q(fg(y`*7qBasR%KPE40w8>)v;!9LTMn7QA`b+jSul~}p<
z*!6y=5xoXu`!*kP9(+($(K9S(8LS;K(j|GbWJ$2O$$Ky@p?-+?AP&~5Q;~#529y3P
zQDA<B^{Isx)H-J@aD5pSMFd|Q3KImenXvb-%fb<k9q4W|OYO_p@EgBm!D)jFj~UNH
z#80}t7MIb}ZddwWD>$uls}LXvxkc>v1^UCNP&ff@Xji{3b40_Wv4K@sdlGvUQU41)
zc9|LtMrGRf|63R_NDTB+t{-DUZl~DX-$WmXKspwZN-Cc;R#lU`G!4#WgVJ~bT~ZnI
zfvWq7^**4?rGT(eti3pp4J@xFF{{a=@r_VWmk-LJF7AWQKQf}i@kgl9evqA5JEp#h
zh~a*UC&{t}(D{TA#01<q<~8|^Bn?)La4Vas$#bkqIHGz0fPeF8!$O}vHKU8@3lj!$
zOovK<&P^*y^v-ZUo_s5s4Q=7PWz%nQ1|S&Eu2;2@&AF!YG5S6^xe=+B?2o;L#9Q7^
zLlR2zxYxuET#<5{?@XC2#K-15KUX(#xHi8(v$h?m{&n#C;kOXNR$O%>?@jEvhGBj)
zYp+PBbRnzkgMb0yKLIzgVjve(<!-Gj<`KhmJMFB#Z$-UbV3Z;lK7y4nWi^sKNnAK0
zEe)P)9B5-fHr`kwXzv5LP^}BD<NknakYveQ&mZ>kDJ)PWyWWDy%@Pzkb!%Bv6~ES2
zxpwXLax)!ftBjY7Bdm#p1nPDgE_qu)iFvuMhe~My%)i5Bd-oKYfJ68^o?@!#drsh<
zmXQnkb{9*s+CEDpyB1tuc+9g?{FIAwIJKO1UnSc#TV61*?Kizn84up(-3?yUNTbD$
zL9JH}yUt+(Epm*?bCDy6b<Hyb5EMD*%lV`oG@aaFc6jS5*d#8i<y0~SD>HQVT+L#G
zwuTo0{&NCEUTe##S1SV`jew6}rp+6#`KYqhUdM_1ui$aXduR)`#8Su$u4h7|y&D^L
zn4+8d#Or%F^I(zH^kN7_)-YgBNh}_%Za2)PxrXjit6)+QYU$bWc5<=D_}7)vF_
zx(%;v=#w+s{M^U6YDdl#MaP@)`@n3#eD_RZaBtc3ZN+>;p<N@+$Z|6~-3Y4#^SSq$
zoDQakkTnWi;<h(ABl{{Q1D9+h$1Ju6{9Ps~`K?BA^T-{^>oYs>kVi6Ir)`7nUG57A
zYY0bxKy6AS$x?#*wto6IRLgc{YL|3&bqnQ5PT)LqPT*;2OV@82_h|P5*{GDsN@<)_
zgwyHEh(4>c`t&-;s?}xXSr_19INNgN-jIs^RxBN^SLiy6f!L*q9vF0CW_19Q*JG26
zf7z!)iJ-6S5hrr>TP&2&Mk|nrjv3&4*nnuq1;kK-l2lUzeob~-jT`FxS(3Ww<kEVo
z8daJXAOTtK$inx7=Cqjb_5P7?IZi{1U4!4&h$;^=sBu1JRDI4xHNR*d#b@*VeL9~-
z%V-KR#^dH9PASW@lOhHnkc;%4)@<nPz^2;f34P1yMu838Yh7E~Px^dhdLRAIY7b(+
zy)Ln7J#L%L*Xj(pyxoiptaSFD9(Nm#IN{J)4}E4R1PHBn1`kZs<w5Vu1tp^dDx_37
z9){AGS_kf|ga<n#+!!^_O{BZLo`^mAs$sXGiC75{>)&o}I46ae+sOjFEca?Z0FRmx
z;awqKQQN&{A0gmo@9zqO!FtHC2V#Y>h|<U@S54xa5!?JdH2y?GFR1%B*Fth&T>$PP
z4CZ|;VftLuOD%FAR1S?oMQc}M%0~R}0D5Xv)mUVe!K>f^vd7FjSe$@S^XzbY%NY*z
zX4QFHUfYn#a!;cSWdU#%8eF8B@in8LIv7^UYni_9{B*WTkBNjay6$4L|6fn#?4NXA
z-=fSop{mvqv5%j5QJnEV;-hz<w~19uVUIxmZiUWkMTe7YRa-?hf#@NoUscjL5D*`=
zcR?c^&lD9=lS&59TY*u3l!^i5E2p33%EU5|=gRBvhW(=2b0*ap-tg%8pOVX?@wdC5
z%Q2a_rgm(^3zUu>7J37p<B|ktMpJW$K6f0VDc@BYicJNEJ^oXndnHj9^Zni;&F9wr
z=Gpq71b&f9UdmS=8{$sAdu0a^P#ah8>%!Dg!Q%X}H#hQiIkE`+pGBV&g%;W?;~#jQ
zPpN)Sud}kR`!JWNN|*}Qg2Cpr%DCcDqZt-;>z4FP!H7052>p>0z#fcBi+CR<;rp<!
z@&4*dHM})YrCm`9*vC7s?NrIT2}?}DE3PCNJ4BYAr%rtWtgYRIO9CIi!kYk?A?1L?
zK!W6F$apR)OoHA^rkr!H7I)44(0Vz0z7OVUsU?T{kLl(}I^S>+eRya`Zy;0B?js6?
z8;`%HeEx*pmAuXINH*Fgk!jdd!FroL!D4tQ0%hbx>;ibXJGjvtCvV1uEz^Gge(HT%
zns?j2)^9$9iyg*Hw6F|LFJcnH^_MVDdcQ<y|Lf`rx+{H4MkG+2USaP!dIjTpB(@Aq
z0gd5O_6`)Q$(<5(0!otayuLyYB}(JWp;a$k6)Icl)`lLzRW7r{Jw}*qkf*lI>u{0v
zV+zc&EZE3S?Ay4}7k)?93SC1w6jx>{ApHEEv$dh*_(?=^=Qp>RMK*eIHY0eOv_cma
z-*U43Jv8m<T<bpJ91IffEUjg^<|}a+A&MDE1f}jgG(GS%1!%zn=fwVZFeMuyr=MKz
z^h?wiW;X$P3z>XCIs>b624B+S6^5Cqh5*f~E~A%2O+~u~^|{|@Z5Emm_-q!`7*ugT
z19sZMScBF!O8Wy=ASi^-5&r&a_ucrp-mkOv&hp;-BKp^sF#LlST|<U~rfc-}OF;Gq
zD}#Q^m{I<?7hChL@6)7GMV?2+v#tJ-kgcNcH0ui&)>WvX%KXN=;N9@^M5a!*z!FL+
zG14puh)qIu&E~%(ATa9PPJ8pWi03>iM_%<-GR28Cne>KNh{f<7?MF=t6S@saNzfE9
z|0yoExEGfB$bbRnJY9!W96^hicIWtA4{OLJ@il0CD9%lI=?)wv#)iB3*yYvI+CW46
z)_p@OLPOn+()s7T36}nDa^L7sH8LH8l@PNa8Z0Q$H&gK}Y%<V!?zh<H8o3c{k=49h
zf&^C67u2WLdU%)I)XuLSIltnv|2;*Cu2>+t2LkZ&u(ezNg8h4)x!AI3XY2g)lBnV9
zpuERKPs(I!_Gng$%$!y4hQ@r*5QTv)er6Q#95l13tf&LNu4pgIwC5rl=r^9`r~1`S
z35xL9P*#$ks2na=a>Fou|92K1?PEL0M#m~qiB+9CNX6^dVdJsC**kKrr#4tAPTl12
z%`JD9b_48~^Ovsj!q+QX_qccUK#s`*@|~8j3eu6Q>u?&19QkVB$3|m;feFe#x87D4
znKe2ttE0uyB@V#Wi9n7z%XQ`cFTn93FM9U5Ud`z4)*)uUb6Alp`iF9=Sg%WBu?3Vy
zhmVHlGHsO5Xb(t8R9$3$*IiFPyq=LS|18}I)qd8&;aXV??Ghp`|3c!UGc@#^s~z3K
z;mQ%<&`k0|H}&U}uvLDHabqQ?)a&gu#Zr_EQ3iPxut$X6;&6Hsma|+3WcCB`8VZ@F
z_LrA?S8oW(C7A>TC8iD)h@zH7;;DRk!cH6xI(ZHWY!JCY6@*6LI!-p28z};-nm2Tl
zb-dFy<IMbW?W};NgY>%=9}n9$=u{`NC~NgywDXy_+cw1W&A4Iv1SEw<lX1>dQ*LhL
zd$(*9WM9J*kX)Z<@%R^UMDyZRS7`8u{X4kwbsnJKT%62uSW=Rr#tQ)w0#WOR%$)n@
z5e0q@k^@hvd*Cz1a{G#AmWa^5Jb&cgnJjW=J0oGWbHFuS20XRbzNlT85bYoTl7YhI
zT(6mAt?v;ls&4_&-Uzf79{ES)0-Y0(B99?Vk~#5Atb<+!G$b)o7gZ`^A+N_i(DWDS
zx5=fKWFOC5ek#xGSx4JdC9L%1q|Ec%wH%vVk}<sS-@8ct_01?S{YndF%aF(vqc!_3
zB-*aDW6ROd?ycsWlZM7r6;)4c=h>GAdoy?LEjrs#E>Q{nJ@h`6-1B1TdY{QbAY#t~
z%|0%my0-x9^H`t~UZMjw{3TEmx~DRQ;lESm#B&WJ&1{wTIpv;f5@eQEP6qxq0KMi0
z_@_EJ3Avs^YhZIn8_mah1n5h+mcXQL)tYTi$fxa(ks9WG->d3}ES5VAM7%vOwWp}5
zs5rC?TtiyONLXDhl@r<6XJ7q1PJEm#0d;VJTm1QUy(QNx?m)p*X1COubbcObGCoM`
zP9-ET{PDr2K%{RXmB)`<y8dbD@cEpwReeI9q3%>2(=2nu|FV$%4>iG)J9lliRxK1<
zf?qNLB)H|{%7SO|1l%lp!j8EzM9Hk0JhkOg><=ZG(8t)~9LIc|-wdAwy!dM#q4qN*
znEPqe*Ry#-|B{}{vl26L``-hX5upU)M8Axy`l_sfh6A*FFOOZp+PZ}9Qz#8qRo`?L
z=66pKD#)0OQl{c*T(EW;WgOS+KvV$q!3(`}lQuH=*2&gEnrfUh)!Gj@_E8TxD0;?y
zF%IUAKaZ%+2BP&I_UaQIfBiPj_4+}eCQSR2DZk`i)ZIJ9UhE>l2xza;Saht{uTwyq
zw@F;C(dM(2!|ZMUnkMdg$&D5>f};Sn;8<*Nb0IDeyE?|TS=>;Vf*gcL{Yq4o03pY|
z7Yt3^#?*yT<ggLa7Oiu~jg90kJ;#&jrC~=8K1l&44Lw8e10mFO^W<11E!lIryZu%S
z4`Z8E$Eh87k95feU8XZEQ?yl0%{@)qQS$iYxL5~Go(A=5;Km9}W`t(NT6?LL=Oe$(
zmY*Sn%9d$s+oWt3WBRSkKZHC(?#KL^NvJ}Om;s{=U;?S1b16?SkhC}KfVH}9GG?{7
zaT5|$QQ#USw3ohH|6b$|Ki)hXZ8XY&*!5kcrvO}{s<_UJC~|-6ta-4frGOl0TD+aQ
z_Cgy7;ow4hmCn4}6E8=f1S-up*g2wC&hnu$a3^YkYXd+VQYJK(9z;$xHd3dqUTmRu
z(*YX?@qQ>gT<VUq7m#Qo=>?MUv>e*6K(5ng%T)<1i3`hqd0A!eD_PeV&Ci>L`xPaj
zMScIlg@8N_Kzb0xo21zfKL2fBLz4U&#MDPg$G$4{A!AAiy1j*LZ4?z_H>fV&C3<W)
zv7!4`O=>DLiL$a2Z0K_>bb_(#U;Zn-FEXZ`Hft~N2ZP<#k^z#3((;s{e7TeoG}LrK
zLRHmq`1t_SwD~LV^T&)6^s$!Ia1KEn(qWgGWI=SOyT>W$H7p>11GYEcU|ZVBzeH}X
zGFtZfXXJ82#Vq~tQ`7;y2qaY{t6+DAVphDq$~|!PmxRk=jDVi9<&^`&5C82^fe{bO
zWDRw79<RYyb8USA8kGHQC1d;2i>;QRg&n>24POdDrwF83o5ocPw}XAZJL8`=^p~5#
zS+-Qgp+8Q%VU;6acvYQ9%5qv#E_ZLh3Wc9Y-BJg{Dg)VXI=N;De7TwoLI#4Uh27w@
z(B5kJ3Q?<N3KbZ`qX=c}`p<XyAEeFWmgF%oJ^ot?CiR9^(_lwQAwoSEA;a)cf&8=7
z%lCj)@Z@QE*gJJGOBQ_tx2aX-_Ssb>4(3S@j??K9r#ym;86%8s7pq?b;iYjn^OFFg
zJOC6he>xSc9X%obdv;Y9fTKXr2WAs;_V#Hw5L|Qa`@!!c6is^WOS1P{C$QKv6Lm=)
ze`?q?3*|DUWkjnVfB6{_5FHc;%a0|%7WWY~&CQJw;wJ3>ZCYVxG}7$2EY9$1{$))~
z&E|Fg0k(pg^#g`a%0{iRz(4l{d{^Z_+XJgc$6}RI&?{oWsV9c91<FGJFVoSJ>r76V
zqc`-AJgrVOicd?_htg8MaZhe2sQvz9u~=0??<~ISo<Z%rFfVbypC#W~zh;aQ3>Os8
z{W9bAejZNCe8-Nj{f{-5wU`@j)F^96zDK60MUhMjn;l;}@x+$%+@h5h(e@KI8Zkea
zFk$MbO$P#%gKUu?ntq|Wdqxp4ytUg~<Mw_VXS*j61M=@IwV+!L6*_aZA_Fs8jhgA^
z*`S_PEA{bknj}P%_S8nHDXD&s)z$4%lx{)Qy;Sq@O2C0(gd_@8&ES?-kWb=?d$1pJ
z%m1HpC#PEtu4VJC{d0R`Cb|jNrz{jl+=bZ2&PISNC(Vt#Y!v}L--*@2{(bIwLF?Cn
zLKou?7WqyA@T1{Cr_QoLDNA%{W36)HYac1k>IJ#I0eqaJ+NkYVLr<dCo4(u=+(#)1
zJ>o?*Xc?wZiSUp!3(nSCj(TosGtH++OF{{7DE}o6)o5{_SV%&}C5igK;<q%-dZ3o{
zCRk;vA(i&Y7NQXlCRK2{^-M$c0xRjTRy=>Xfg?ENO@n7=kV9X*&gd0p%&0G2hrgWL
z_w0(!bHTl8bd&|R!Cm*6isVjGBuRmPYX&=Yx)%5K{I=ugDXX!;!iT2irFKu*IxqDv
zxePT%{Wgx5xU?$Y2l|QwdmKaqB4pdw(OcV&gHrAq&<0}&(H9@eduCQ+U+5jnGmfAZ
zhrI`rd0D<)6*J?y%XL;&3*M?s<wGSR*fp<K8`K(AAb@p|I-nqq&M=$bzwEWwE+lBM
zb&eFmGn%;#fdVaDd(0?%&C=(u|H}#X;g(EMd13$eR8IWj1GIYREud;5D(_7l+DMS5
z{S;lTITI?0Yobm|8%jiq{o-kaPqk#V4W#EjF^fzlf_7{At_nmNf0~<&(yuzt`k<Wb
z%U1%LC%r*58{fQk8feh<H1@ycCjuh!Wvfv$W=*eP?@Ql>0oP=Y)cc3rESI##p@gue
zCP8|#4LSRE!|9Xf5kc%Vf*u@xvd{f@en&+{a&L4!JvLFHlBSW^knR$+|05k_fUKSk
zXd(0+xs`G1w0cxz0z$CWg{|ioILzwyg0eLqdf)wiAlPRHv|s+Y7-^R?F$$wM77P&_
z03bAyCN^un$C6*NX<Yh~dsWNOJ(<sDQpt9vl-?wdF2&H7H2n>5<U@E*w`R12mr@ei
zUzIoLVjG|9Z+UcHMWt&QQd%s~<}uCvS&OT6JyQXqdG;sPh)<fSt&i7uzoQ3_pUv1Q
zWT8()V`r#D8X;P7M<UP+hcgxD`EzG8F>y52oxPTA>dosPJ(kc!rfYSIccOS<4Qm{Y
zZuJ(0ep^F%F28>mwICO8u<s8+z47dI7)Mn!Z-W4!=c_kRMm;eR(-~p+t+z3{{E)Rp
z{#Ys@)>|~t!@}wje#`crZy_dxf<kgUD=GyD22DHQDHjF8I9SU^`HO}DF7o~TtQAWU
z0VBLQ07dJwLyErAEH!A2Z9CY|11DBwClf7Sq@OxIFg*~a<QJybNDv4{c<=jLV|HAa
zmW)bx47bN|KLkA``-*@*TrwLxwC4b)6e`M=3{;H4JciRI90xZ>b)p!cIpMfJIi;af
zR!a*)oarr)L?e4`M{C626HE8CtORz=Ude>qzs8q~4B#m|Jz7(SYXgRdObUbc(fb+X
zQrg?<_DFOcT8|T9%d-u%o{4WYiUw=PQ!-#s*0rT)9G*+gt)m39r(>C7cKYPe5zM>b
zq`BQLdHcKij-d@rONf#=(tf{ep4@(>-r?-_z&FMpI%z}LDl>G4;YNXp7#goP!XCeA
zNtoIoyWi_$W$tn48bQu)#S(<efovATNzN2Uvw70McF?z_x`m(KH=Wl%+r<Jk-kdEx
zw;G&rhWdKym@fORxi_Ef-RLex<2M4!_CALI{GR*tvI`)ec~#YQeSpf@D&_J-UWzQb
z#<g*8X#zOW>gw7{Wdp@W1O!uz$bi@u%U71rD>-#w=0MUa-ph1j{F#MpY-$U0;tW`X
z^_*uw9kO&`?#Ek4B~ZQ2uE!jxnFl0APeZ~VQKcQxrbo+M`eV*YnOu|xd!r2gJ>mW<
z|1<`oAfQ<|dbjTbCZX4V-C8|LhaQlJCYs_ZlmqS!z$zwC+aneIAc3VfmB?=^D!=Jx
z80aB-0v=Gk(#`hJ&p5p4p?mK{jhkpaw_%iZL&OuaAK?c+?50wJWhfa+SxmR;cp=2c
zz+$>jYb2yWR$g9FO)cJ8l&C`rH|l~|uL{Sx;VG$qwHb5<$737)GsJr(ydn3u*@rh|
zl<*J1f`4R#xJ>g1uMuiL;LdI|{hME}ppfGnz}^F{&}Fci33cDyM-}t*g{eO&*Ks!T
z`nR;(JCXNXmi@Doy>ud#qR81eT{k+d(7yB$5aj8z&FPDPQfSAMLm1G)3HQaGw{6b0
z76YK${^QeskYnDCCa2UP_giH|hZH<+$@RhBE4NLzI2*|gCBK7IO`UqDJa#?Hz~dHI
zB@gTxf6Qs>Y2(5we&X)wZ*_W$ZSd>>!;5&{{IW-n4t8^cPT4zKRQIz``~Qe7xfUTv
zk-CX_VUC#Pv&%~ADWUFqbD%=Ekd7bfwT!~HfQ-pI-W!`t?z~g}s4;`WqpPzFah3bc
z7rKMDcc>w9BghbnAK(|E?|BuYQU^6WsZh#Exn9pxM9GF6@$N1^?iJ=W1peDBk(+xg
zVD`0PBjEW#UHCYh^KMO~V?<Y~=dviQD}rayCzOMBtawQcKwOMx70)w~zREqUnlX1h
z)B!AD_51;aXi4X2R<JhZqkl8w-sHXp><REIn?t#$Q3*r?4wo0?6#we!{9jp&+7UzD
zR~-!YQ-LV6C0mzLX*KlRAs4XGAyNV1(_gr3i>tmmZv?7H{mVUzRBCuuzMVw^ikWaL
z)i3?*cX078!<aa0Ti}vC?s(4(z4@s%x*&fbI@ud<X_j+iDXZx$!%=H^O*)6KE+hq?
zi{+;AQiDYcB;E9BJAPCTmLTY!*}|@ePT+f|`nWD7uO~Z!l&!P&%LsaHEAx>LyO?h^
z=moD$RmZ(wD5HQ0#?8C{RnH~n(@saNq1=I-SN>|wmJu^qM6Df#9}A8APb8A@ziBNQ
zy^`1Eb1Z6&5sNK0q;G}ne$jl#SqmLiwbGxF%gkU&>{o0k)BF{7v+x2nCcn*T)@ioQ
z_~89)S_SrOV5|E+9ny1;ZzOw+3qD;o%D*M794#cuE6KhZoAXLXT>m)XoQ=-4u1FaW
zQ)4n5KC>k5nyR;r2`~5*Q;;VE$Mi7K$=N`+EDbW-(%kjCWRITY&bKb<LX`^P4g95t
z*6lHl_bvaQu!AQ6eRjcfi#r6pctgwZHj;NOpJ9f`ya<m^F^QQDU?`JrjWNs*YZ!Xd
z5P(i%RT1~K`VV-<=@fGVf+YCe@n+4u5gvpXkNgH`h(fDk3DsG)bd$;kbWtB99&SiW
zn3_x-<*8N?3}6Q_b5g$m`O${;X^#LqF?;XRL=42wXkxk_t*~F#a7Kp{?);e;2x^H9
zJs6w@bb6NO-89=>ROmG6DpKFxKI*Ia$~Z#ElO6ZPSAy4FU#jWg6erqs!1C+wi2RsU
zRFzCk9z#r2Pi&t3=hu03KcB>r0&;=$h+2g<{`pg8_wBb`DEaBqDWGU_Ttd;G)dIoY
z13>oWDX`kNB!f~R*EUId3y=7`zt2i^m0E|!i0Y!{LI-aE$cGzBHA2)a3d-tk64%{S
zX%dN;!9|lxTg_7>0Wlorc#6KjJ%g<-Q-m!%p{m1lxW)Fw^C7Og5qQpIC6%gXYaJ-F
zbjUx!bnj@uMZU$q(Le~`F%Vzps^ri?mMPWeU?6PqrJ48dk~M(3`RBGS_&PEb>rn4b
zu?=&LXXV(0z9ph8;$ax|-M>efDlX>xrhZM)G9#pLMbxvdNEOJBRSs;c(1_m~C3qn0
z1`gKt+=iRg)k$~&NxI&mYnE8i?$n9=+Yk@ass9G9{5&MSmGi^*xzg+e%^5vLMS};W
z#eCQ#cZ#43E)6%OOkub2^L5dY+ip{qBS{ZPcsnO5{98R9=Vxm-n5@Y)a_0n?mK^We
zbv}5k^B(Eh*3-8PJa&*qkE91{JF4a906g5hI~Gl;>Hg<Ft57#8Cjgq!e|;jblyoM3
z{-fSPi>NhV*Yh3Yi|*%fpER7xM7Rauxp*>Pwe;t}0x|6(0IA>8jyX<Ds*lFH>-DAA
zQBR=7TnRFDdLOxLBvEBlUYY(e!}X^=$bO-lY<R~_1BiG;TI{4vz^HqFdm#hYKeSw%
za(D&*XrTd9e6=oLOlN=tA#`_lfM6&+F)>t$dy~3+ik^9EL&|t+Ae|~<;F#_Ax|T)?
zeOK0qnYA|39~*N)Jb#Cu{MU9A|2pW!Z7Pbef&Sl?PJPxp$&s3ikvVBZ5YgHP6SOVR
zuRO#c$0dD>7r6Xb$wZpAbgaNdxXNZQ>)ZR9D&Xn8gF-Un?n;4U`unFoQ>!XFCQ~)l
z;pd8YstppRo8mhYu>KF#q^@REK8CnpI=@ggO)C>w`(t|Xt(I?Oj~|<&zs5Az$Ul!B
zpvLx?J~@zLkMcH~#@0K}2c+;I({3&h2>uj@o86S|{zfD9y?)d778>!AZGQU7Q~5=W
zAi~}zHZasF!Zd{Qlj+p#ZyV9wmuhOa_aU|<5oKj<jZ&7lw0{xSeDy&2`1Zb5MGBCP
zC~?BvWoEey6~cQdDk}YZ>n-2`G_~;d1q9?rly`_of?GbGV*z;^U+dex76RuHu&QI2
zw<kNkAnBMA+YR-rv~HS!gksJ#p6c+|5J?NN{OSVWM(mXOQ~9c*{iMYLUTrHi(R6ga
z1_z!&id@YFr0s9++*>coK&Epaq&Iu+8`kYYEV`R&Zn=~`gRA32fEsHZ{Xj|LDv3Vb
zN+^B93*c8GH@=Mv?q~j-c23U#2DpG)USfjJ3b-*{cra$m;@%Fuyq0YvtY=G8KurEP
z(Kk8Stdu)(mVV8d8C9VG$#JyW0I^U9lu$|;Lc^Df-{u=Fj=&780i(bLB_c8P5O{Rr
z)C}r>ks!Gxj;0e`{`|a?F{)v<^0f~(KI&{XFxVd>L9sW6U*i?GynJD(nrD9s#j4qZ
zw_A-<>)|^-Lk41$Z)J0%$^XBb(sruFJw?Z8G0x3VmQg1uk{s9|;WGP4sfIqAim{8e
z#}2&yt*f&@eq4OZ@oeWR3%a)Cwid(VZ`;3YSG^X7Cab7|1D79AfS>zl6zUjbMx9Gu
z<KwAATMv)!GY}Ds6Ga4Ebvl~=`C(FI2Ve)9tXe6WH+m+qvg@8FB1eHU%VB#8DBt~L
z^{P(O?J{8VZ^iBtz$;=HzfqxoVf<suu>(9y$%^O~>1%SeR7u^gY>0A*qZX;GMLkM{
zARCeWEp~oi15zC)n-VIv8+S#fr__0_Pa8a9X$0gPI#0mmZ&hSv-y*lK&E|nDVT{CS
z6V$M-|F{m^9hDldOgXEg+~2S^=ZYF`RVc|Sd2IH};s8ukJ{!LnUG=2b*5%)1zyB7Z
zdHAi0FHhF!Z(e5*3y72e5|}<eHl3EOId0tunWoSB!e?WOYf2XuYON6^PDj=kb~lgd
zBi8)=1jdJ0In|OsBgH;u5;@o=Fx%_C`NUmKPqxFXEBFcVTb`0~p1Inl)kN(kR~2I|
z(JQMo5_8fM>kS>aOM^Ih+WYP4d2VhcM0kyDL+&}^#Cemyt5dtiRF1~<H4&bKKD7V&
zADlQRcRC7)(}!CN*!-UvXSX74GvX~8gnBhFqqe-lu}_nx39qEQ$9a7Zu%ZZ6)vB@^
zbu6S&u93O}*&7MDKUZyeKA93|UlywoJAE2>7)*N#i1C2jx@aY4LAs-jv4mu{4kurS
zHqu_xKNXFObYi|1xP*)M+pK}jvCA`NbVg2W)6Yw(H?;wZ*7dymY&j9wzGMlz*;N2~
z(X&OQ>|S7QM)QtAtH%(Vj_Bhlx6`kan;n=!z@S1c)_H-pO9!}sf$N=5nqv3A7tpu5
z3Z_dwxdM37^pW@pey2Y~%`0J)%01UtfhAliIUr=S&JfUcRv97l<>C^6@zO`McOu^~
zwL(w8cgHiJh?G&1{Smq+F6C*boy}js#6%Ayd(J4wVg8Z`)M@gHthkvg4jT#z348`K
zHR&_2TuZ1S^xQ9UcsS_ws~l2Yn2=0MRypQQNWrHTOXWEVH-E6L2^3P*tBHSndw|3D
zHdcyP1?O)NhM}VBz3+)RiK@j~kx?{fG2xC%M(b0e0Ygp`_JDoA>kHz^&861pZNEKu
zK4fT1*ZAg6$ggmB3EM=Ze~j%+^iCZCB|P=Jf}pOFn2v(cc-^DdZDGo~+RAc^K#7I9
z+r9kiW`jI0%<;MwxjsdTD7<ls*zB~}uG;GF4<Gda3T*FVmO7Av<hktc*k1<*0_<pK
zVeQ{-KbKcFORAJJ8E>uvp)!y0dv5Af$rO9;6CA6VNw^_+Yfaa+ibf6Y8!TRomum26
zJy1Y#oqsdy*Y@<w@!Hb4aOqQ^>W5W<8-Rsm$ydUJm68Is9-*74SmX-*z^|gy#x(Ig
zR*CCs-R~(wO_4g7g0lU;0FNS<V+a3OK9MeF!!5@k$j%UhIu`uj@sYVsKt}*`%2K5!
zxK#%>F&Rgga4~b+w`h~7m~5GDYib!3QfnD}f8wvp)nU8BDwAF<t)$cD<t$zBpoYnw
zXu6wA(&D*{q#pTk&m%f!)7QC?cLO=lGI~h$*`ppn90j->3Duc5-~doc$w|G{M3nZG
zmW|DxsIWV12g*#825kLsHx@ULr}1;6%&d-W5@cZPNV6b=^!5opr|CEDdHU*u+G$dY
z(<g8BaAvY?8GM9O7a6yc=pd~fhqeH`jKY}u+|*&jgyT;Q*|xLxF3~C{kcLGY%imw(
zMbwMN3DsTHW(ty${Ki5(ybm-<>Gzr1j$lxu{R=!kN9-EnLVELs)<g!rmq+%XbN%y`
z@O_K#1)gFZ_p`lLS(?#b>_!3{dGx-FrRIG$klb;fHQ)*f7d5He`MaG%_>+-O4GlkR
zQq4+8Ab#R!rIf{bg)>hR<3PGEBy9!YpwIV}MQ+PzrHOiHzK<cJy0v+kT0pX_jLYAB
zuE``M+Euhg<IG@7ycG~T_(5*v-uV89EJyKxI+Ov>1}6g+#0(gs$!il?7ygo=b$ov9
zQi;tz7;)Rf4kTHcw;5jarSdpl+b6~qE3~(qSp1^Qhb)Rw?{GRFY<BMFnH_vqjakmC
zpNblfi3j3bXO-i89d8G@@oXXK>$A>iu354B<6lF95$u1}{8t)82b7g;q;~u8eY~#i
zUqe&oYemW%>3)7c|H|(;Kp82u!U$RrR>C5zsl0aV*B*ht^KkI#?9wA}2NZa|Ol-~T
zm4he(MXZh^+%~7*F1|-7GBB3d^ZP=jN3=WDT~h;qZ(aoE@cH#{gKp|;ou}95N2<-c
zv8~EgfZ916pPKm|j;L+y=-c&<u|;#tSk}f5;C+cp<Dhz58*&l=zzo<D-XkAQeOvK`
ze?%ygRDa;=SKT^~!s5%Fk@~IJeU8Q@7MyGJFh#$;NZcJNxKa}^yGmTOy`>I#c|@7z
z*trY#w%W;nbq0>S<pMj213Mr%C_xTx9#;~+s5_Px&g}=%i&9plriG=sv=6mk-|4&L
zh^*-+i{Xe=H+yTZZWd$u_G``AU0XgmsQL~A2#e164z>(2HdcY73CqpJs0-)vVm~Ll
zi^;NgwxiVs095mK?z?z4pS7bZH9A`;^cf-ym=?aU-+e**f4$UX?>_DY6DKXmyvC9-
zUSlBQ=^^_};gS55=Xrtm(S|yH)Hl)tChRUo2o@)<NVC4zr{5$ZrpmUL`cFQMhGw7B
z{XD+F74+vk5Cgfk8|NFZnL12v)I=!a%fNQ<XgJ9uc~bokq!>UvOE7#LBBIRI@be`9
z$6U?SM}A@(6aC??>Vv^iPf3Z{)^>uT&d<?){noCA=d02=-cCglf!CK!f&FuY-Lo`O
z9#{{3<^2@z>uh*;#a2~CEzTapFqi<p$~ZImTwpp<E&kZ$-i>!L7o)4Ys2RNW>v@B$
zu^FS9u4u|;Fk&pL6~RAim?H%wWIPtx{Ag5!Ugs|Zyc5TtIuVZ+6+1czCl+<AF2{7&
z8)~yWHz67B2zJq%kvhlD3&se?WgRnkFOW5c)ImY7%Ve^T0(`%}g*i=hAHvS_k!5TV
z99+J?zVNt%Pt<1do0o(=H$S`3h+i(BBJ$%9>sp2oK<J@3hZ?);Qo-!9kOgEE+AkqY
z!l^wr*R{L^%r6YBJH;=wN&}Sn%39?T`;~V(aKei?u6ozvkR+<2DVA)DbEZceyN&{d
zQ5BA@>tw#$6|;)1@Hd?;!HAO+#F%ZG#hK_IwR4}D85%OF_>1+VA&>Epp2?3}$zrNm
zUaM7*n|p+BYD!tS51LVi*8ZMIe$ulVdFqB0)j}(MWr8rd;@B+6;E6zilI9SR-%SW%
zIN^PMh0zt|0}9^Bx{_?Fj##(2>njcMzLjlJRorg)>iY0I*x|EOBX?!p{^G;ym?W~)
z*bD1u1Cd{4huwv9WiKMcws$17JFk6<HbyhKd&VxWY)Y@^K??g9aaK7N%St&g*b1L2
z*6ni#ynf2ls%2o;;A+h#5v1sSaN=k2su+Wq#PB~b^N*onv)kzi!3lSK+FY^_ow>9A
zS+S}<@CvhBY6f~hlM*O=+36HDDxf%5HmR*8xznq9L*DVc?3eqGGN{(P)#X4AVnx34
z`lq!!R*iIJ$M;7fzfgtJ;BpD;KLMw^p5-?;YPw3gI$?-1TvLDEvt?h;^qqR~4gNU@
zq3}6whL{yB11j2q#JO{HNNZkM;wKys&Ch(IyF=~!s8+}o)z4zb7GdGCZ{Pt7-|J-R
z02xf65jW1;yB^40Pw>XO3U2b=C7*2x`@>&caKT35V8jh_|1V@<=e^xN;+vXOxwh(l
zgbUFf;{W+#qLqXus&U-bY6f$Vg(4orrmLHFiQSuftgjkZSgf42oADE#F|pb^{qwDK
zBVykd9d06bRW|<IEr{Z#pl4&f3;viHp;)SzS`aaXGIhPf4mw@8YsQ6}@x+dXmW)_L
zcMM2Jd>0~4e_`9FBB`&Cr|P$l(Ty+`;zfOZMNT7u1L<GPX&_$p5f$wECfl$R8KqPa
z;X=IiBCJr^d4m0*rdf@GnC-}T71g~w=N-eL^S!PPbqkajJ~WydHDqz$=8yP_5O&wX
zb4qlcCJTy5_}0%DLB;1pgIT1oDo|6+LKhl1E!nQv*cxl*%N~(=Y*TrL2?#zb3j03n
z^XBwRI1NV2FT49-vp5WyABV3vTIvwu)pLE}wRMJdBysVJr1kJnLQ7!U=b);RHboh~
zdGG%Abg8SY1h)q2!9az2MCuncmHhgq+E;!NYrSi+4eM+vlxKTmzI%#d;k;MNH|W%>
zZKE4@l2U)n=nhTeLQ3rsW+g2@_RWdi*BX#rl4Y3J!MRynB&yt6^{oj={8Aj#yfr%a
zpDcj&33;$^@mFol8Z7`~=%7XxVkZLmGxdsG7aF2cn<F((hcTYfS124B+kxvt!7nvR
z*?dEs=&6e(gKc3AtQw^K;zT88dwFu~pej(@@+RQ$fKRV>Dz9h5V@<;0?HBv=L`kpf
zarsI6)XR&9+Y@#2-}{$sI>k3XDuiC*_TBi+t=rtFjEi3JWeC~Hu|A49JiYo6LWl^=
z4g`%>wNO1UEmu^!{`a`AUU@JLmSop42^VuS3Kht0v#%x<)-uUu)iFy<2bB}KWEsSY
zZ@p<<os1gprJ&~dWau@)z=ENy>M*AQ+2w5c<_lg*IQ|+`KfT7GnMdASRfz%H6>KOB
zW`O{Mp&Pk@Su6kcEjU;E<)<rgzYn8|K(V2+UBM$o+pgt$M~%LXR6d1~inFP-Deb%P
z#wr7s32b=7_7-7d%F@x~pBs!A&Q<TmXbyS!_ccA;UOnM{R8FiSrt|*VTjJdoT+_(p
z#AFC68-pWq7$MEpeikQ+ZZbGXEl;l<D|AIwdh}CR%@wdDb_)<L*7tio?yV$Fc>eF%
z^3MtL8q4;>2do<Yztrh&->21hz)on?sh8CG4Sb*O5jMAd=bz-+2q9vf!_^nqH7{3H
zWT5(?p`q&4!8Bhr{1$O)it)@!iQ`(Fp3pHmr-e%#{njWkKu{2@gjek!Rj*0w_e$WZ
zZ@M<qrZk=N#?o|uDflZ%=!q#NohW^^N0!}G?Kjiex3oHwO4o0xC)#-8BhK8Mt_YlM
zv|$M#B(VkZaiRi7PDZMZHbxa6SOCaif21@_o1DVT>e03uQ4P9dQ$*`@)nmT*Eg32_
zCXK#l)-;An1O%($A91iJ=q`M5H{)SYj4~0Dq0QOpq+z!34}I>h?Ww2~vfInXeRk0_
z1srJTgvsIR7!<$p3-&ZK5Y8~u<fSjdW|<K>@hnCzVenPz#E(WaPJdUMtXm58)fg`N
zz)*(wb{20s+Et{c>Sc#Fp)s^D)f|J}Hat$HDA2)CB<NRJ`DBNO*eIQw&&m8;2cC{C
zkgt&rdT%KA!*{P`*wEYJWVVFH{kX>Cw@G;M#zC9^21RjlBz9xqwVk^h9i#qbF&<>H
zU|hp>w&Aww2JCgug$ETmTdEh>dpglGZ#{mF2c*De8kc-{+uo*RbAv`rs6=K+du#QT
zC15~k()i`bvqIVA*~LEsNXv{^{649$DGgO2?p*?-`{$lF14o?9&JQIn3<55><tvUl
zi<O9bU8(_WZeYINCRv#NhSQ;AbN>{`H!iSWvId4Hf(JX#)>F(62V!p=Rm3OA*!6!p
z)a+I35RENma%N`nyQUa;UDH6`1`LH~e<pc!zB#`0kwit|i)rg|yKDF)W@BmL_^dOm
zvq9V`m4`n)#rJqeXK&7llOsY*qAmSuMoVM3H$n10Hy^Dl?i(V#>vmc;du1zo*^j<*
z=NpLzm}5@Q2^u}3VMgk<eM6+#S%(dVLg3m=WVOUBf0tbTxkF&{>SVpMaO1Lf>Y~dw
z)k;V(LzTKI#(byb84#Lrz7*JF*ENcp#VWE}o3T#*s~A0F^Io3F_na;q!LL<y4JUzn
zU&RRQPEU<P$3EM1Y-<p0<3Z|Xz#akT@rSvRzR4K|p1q1($aGXD<>K&~FPg#%$yU|5
zw=%f}gUllWm;Lxh!<buq<FYhh?xejwwBqO9J2moiRjNXB^Dvv;jrXHBc|QB|<7A<Z
z;PS}YBKDdHOA&X@i`P69Ml9z3C+`eTwZ<Psjn7%->{XV@{-;X+E!tcKtd|iLj~Rs`
zKj21u>zDtF*nZ{n1<cet@^z9@>Am~-5p(k1JstH<kJXE#*olK*z-2Dq#!v;?VpZ2u
z<P!~Jr=PdvKB2rGx;Q@y&OloG=A<E5>La(!B08(pt1rHAMp%r5R!0-#NIXo}CGKTh
z;~u+CL;0E$Y<!Dsig-`Xq5I_O&-$VNw{X`N?-;~GL2J0W{u1U93>{UY;)9Qe{Z@NE
zH&vUD0V%g@=#e~SWqiLmUJUC)Qz1^Pb>IAcx#wJ&1G{_U^W&mN(f&7AXXWSch8;$Z
zp0>v;z}`5HyOeByS8J}JzwfUDrb(wj5r3Z%H$k82l0WyAsE~Q`s>m}YjL!bUrDHZ#
zBIGOccz;22H|3O-6}D$L7`Prtz&vNe`=w5IopY_8Lq_|O^Y}f<KRKLV<&8aNvl@{o
zx_g$+=d||=-M2v?r*BKAb<&SwjVNxWHB{#%XuO*in)prhDJ9vr4bO`ukYg)$*ooNc
zhwYw=HfG|_AW^AFZ9*R-DrU!85fcN{R^HwmyXB=CJsIYKZ&d0gDI_~{_(l90P>z#+
zUK$U>0N=9mTyfx0%+*R}t>Z&+!JV9xjKr+N42eJ!qP}daI;%j(g{UREkkJAz#?UIT
z{#9}e3yKv4w~WENakDXovq7+XGYJ<w8)GobH>>+iyRGhxA%sHg93o64WL$=(#n<SU
zde3-<E30Zj!H6$@_Th2M2*9{w#c`xt5PLpvS2b_oxsb9o^>cZ!V#SX2>Wmk5BYM*&
zc5LjEQUR~fMM6B6MxDyyvo7ZUkQO-EFO<}r?6zjKAN1RiKAh43vI~_S_d3*Eq@2!D
zIx3iTfsLpSKDVFFvw_^Vp4cVN3X5)F5C@&Y+$Sb<5@R8R3szj0DDVBE8FB-^=H2OX
zt1mGFE7kF%?h8#fp{VZeLC0@PzIu%gi<6ga8VR(pul{k={PWa=bGF6G7~v(7>qW<o
zzLXU<aG=B0*>j?Couwnt_M#7R5ni;rB><)I{iRNM{T{uKyPRtKpUyC7gjP)tyXFUz
z-8RKa8I(4f>SD#3lHxkB6=b3OLOV_;@$Ldut7qeKrpspor-__dX6kl_L8G1c9GYLq
zh?BIMo4Wj1F>%;_D@FxbcSCKn7TCE7ZavyN?mTcVv60+48pm&}G*FO<=m;tg*S8`h
zP`t6krqR>5GC%i7r1Jcoz2PA__!0AdFhZ}z4H@9;+cMoK9<P?Cm9wbW3U0nJyKSI3
z^y;hg2p9Ai&32;ypa(v*pT#(gi=8+kJ&={+3~+PI)y&)Cg1I)=i^4$8qfxFS6jybJ
z@6IMCSR)wm{@ah&N&f5WsY%4=**^2>r|1kvMuXXwcHsEnOyh72`ouGge*Up;{ek6h
z6hj7X1aLb1UoXKs4@|Q@{{4j^KH@_4YbI03*y}C&LRa3i<^Obv6FaR2HYCXr2jTG%
z>%SvXelb??N=`DjOORhm>7l8*ObQ~gTX7yi{IR7eF%6NfI+|JVn#8ETT3wVH)abh_
z^<JiA2Rp9}&p17bCbYedvv2n6=;g1cuwOny;vG=Q=e_v>9#~Z)D}D%lrT+Qsm1O=o
zdT!<s&l?~ROI~7U#46g${BvPEL5ldn;gKQ_{|}GsXy-UV0lPXHxP`I=o48@xwwc4x
zmv(#_aZ&d$G(jy#xw<P27&tEYZ;uPS9kwcJQzWF-fMV~Ga%1`Mi-K%-8L$C#Y940S
zTC`c}oXuo~Q*()Q>>!n~<|^*E|7xA+nVw^N3_<f=*m-7ly)PxV4cIH2z1`6?=eT^0
zZM1ER8(w6nC&}KuqPO3~q@4Rjzf%zR(KZ%$hC~(9KxNCS3+8;ydE&kB6jy%~SKBv6
z<?9zh46w%CmMjDJ(Re-#fCJmn8)|1!g?5<*pP&Aeex!Vq-{ac3kCGS{vmz983#7;?
zdj_{8;8|Jn8CaylL))r5YQonJ{3ftb$RsW%tv>$>f4CgcuqpouLVPtMe<y-IPH8u1
zfGF<juvVPL`<UAUVIp7PXLEV5Q@4|`IW=i7aJegov@NfgvUmF&7dm|H7pa`~$A%*3
z6Mp*32#Yujl~Zok`!31>(yTj}bLX{PE-eFao?-?ZvYUe3XFke&zw*)LKI`M&RdnLj
zX`_b9Tk;Mj=_emM&s@M)F<JG20{@4z?*M9Y?Ygy~qNor-LX)Z>0zp8UH0dHuM0)Qn
zfPi!Yhu#U&djtejYUsUJDN$+&O+Y~)G--iQ?i<hdow?`yo;&y6nT&(LF!Mg|v-e(m
z?Xpg$V!!{0ddFVP-Lgs}EgH)yT1wAQF7n~8>t@dCj{#=cL|$l^aGq)m(&%Y0VSBes
z-swr_k5%2CKB8`9ja;_lK4G)8HJ~}YDRK}HY2Vq;jen&(cm**FTfQMJn#!qq(+_j{
zx-aj`E~cLaN=RaFPQ7izPu9%q$;Sm#Z8o0Nj~VUha+z^xmXxj6ZzjBsT-S4K{^HB)
zfp{cxrt0@K+r*|iUR7uoBGhs>{R8QimnlFo+n)v;I(&47P28!$ygl!ocR1&L7U*_j
zbe3hgGjt}`!eFTA@NEWIn1m*GJ51C9@^y?31F&KyM^zk9mRB#`3?*fVq29}KH_N2h
zqX(bLE$^k6&!06l957f*1UV8bQW|<w?aVjWQ2#;gw=mbSzM#mhT31rcSltsN(tWlQ
zMJpkGn`5%}pk&IvR1D9i>^4|6F%>9nw-MN%cvZV^Uso-a*Rxz1vWE$`3QeS{X0|Pl
z{NL;tIOL*m0Il0GzjGpZKQ!@GPLj!zBudEjfZkhbwy3SKB4F?Jv#WPOD$KaolAPS*
zOm41kSfyyYKNy6C|G2<ZaA08k3_-F@zMZnj{6c<taaV^#0^UV}9Ow$=fgE)*O+C=j
z0Hwa@O^VP?fR&5;iie&!n;f`&*$+T~F-6N=Q=PfBTgg?u=lTr|-hE2h0p^7}%~VHm
z%)0kjtvXs{J=DCtdT~DnguvWy7nZFSGX_keYC8jjVL@e;pq``2Nj8_Q#Rcq8AZ7~9
zK6~J``y)2f>|3u8d>bprRcz?tq$x`z;C6vFmoZ6DXQTe0dFvRt<QHh3mO(u$B(h(-
zs9y7tSrUqOOP`!`IFk1ndM2!uyFFcj!T{biAyraerg01;<9l{O*RZ=l(vdC&$f*}z
z?Z8|!)uHugb9`c7W1yqvEbA@(cK?93q~`3zQK|Qet^muA6nHnfO8S9s{AR}1?Z}3M
zwd8B4%}{kemuJ1q%}2_88Cd;>1OF=zVEVDjxQq%vM1=ZGH>TuGe5P5lp_2t}idk&x
zx$N39m;z$~KI?1F+SibU@LL)IE`(NlqQ}j!U$o(*#Cu^=U*fZv`>aiA<58UZh%LQ{
z`>cx}PQ+v{^u?!s&c?+Uv2|3kL6$(x>*e5BgZ;J_lNO5jyZBVrFbhXut#1t<>QtJh
z<y)3wjnR$vAaAMeVt$KS*7&vCes!$J%E_meJ}Vx(JtvMCFz~6t`q{`u^^U}=rcSFP
zR$BOuy5+pnQzhl1cWQ59-9NX&u<lj~w?Cbp?#@jDngtx;@0tDzsyAex1fa*hfx7pv
z>YTV2f1OgEuE>Fwgc-Z9PkBf4*y<9k;TO(AeDYvGYBo)=hGJDJ193M|HZQ<ra1zRW
zp%Y|`r+Y_s(6!>~XFGW=15Rw{A6tG>&pdT>LqnrJf<p#A8eYbZ%{eq2=Hu!SQ}2P4
zxnI!4N7VOq>cCr<rJ*Wv)zf0wX&1Qfdy#_2joo2I$hA_{aim1nSwSVwW535|q9WTt
zi^JHR4ndQ>HHqGcWNyWZk-DXi9N4Xno9t$OU)xLsz8%qiLSG@JF}FgvhGd@f?AZTI
zV7KVD(<SS-V-M5aA^F)+)1$8|hZB9(n&syH!SM*U-#{(-`Pk3NkvOLZPHTUo-45N?
zZr6O}6#E?SuoPwOF#gU4Cl^^z>{_U)P=lT|LrKo-8ELkt5J1?{VA_<3V-pR7#2IW^
zOoXFx_UoM6B1tpoR25@Vu|FHVSE?#DI14CtKbop{dqCc$$zL65!tsetZ%pVX`QPcT
z_cH{vKXYJI00xYm=xPyhdtc7+q2v$kpHkl_^`IsV*m6aRc;=6<zueDJfk26QKzhS+
z55s3<^RluN((1yvXL`2hRj)5SXSwF;&)SUsP!}dWsN0$2p@gjr_b0o}a1082!2*$e
zBom_DeIJ7B+z`NaI-mczS-9(k^K3&zR;53(iMw@$Ma}|NUj7&?!Lco>&Shu9c3Db$
zzn_W|4PMZ&YNy(!T2?}*27XNz0CQ&zhhDryyP&hbVCCY(Y1UWqrQqwb8>X+_3odb5
zJE)h4d~0|Tk~C9mF)V8jLf^kiNWa$B546(-3g=>l_9hBmK0tG34sOr5pW2<(emGXT
z-)c8p8$NUJ^)rP$uPnXy?&`ps5B{IO+I>NZF2m>7_N$fC)Ynt_EYVzNwd|I3>tl9S
z_>nF@mFP^DrA=wK)Rhm-g4Hu__!Q4B1Zu`G^Qc<S0SV;IO#>9=>2&*%MrhU3&2x4M
z>FSo#H!9jEu8Qw|JrVHQ4Rz4vb_MWXVzQAX!smsrWkQ5N*}>a3w_cM_tuzgH1z$-V
zriTrCxSVx^+WeXLYb1Wd8!hZ7%6&U&?n=uIqtZHn3{NP2%_71vwQ)1`b-5PoYv8uv
ztjEko?RwH9EuthX(z-U?r93M-=K`RvFy-h6%W<FhXqe33yXx7?6k2fgaeVq$p0lMj
zM>Gp5sllRFH0yG)q6mA~clWPq@^sa5ZRXBRuAWeY=eY2=AFAoa{3r67{L5PW^{*!d
zrWfr-1_brpiwXM!fvj|26>Rh(yY=M6eXfeu@z@TN@#%5F>Bj3RZ$ulgyzfs|Lgu4U
z{g)4B%aww~g+I{^XKkS)GViTUPG6_<u!xasuDD{V>>Ya$uj1B+y_0e7N-IuBBh9Ce
zMe{=@(MX0wLH&|wKbPezUnCD4W<Etn_QKGCq;i)pUfHlO$VBQ|Hv@%elAm<G1KjY6
znf4t?SyY`UJsS~E7tDQ5gO#Mrk><@V|Ac{&9MsnZXRxD!%gkl|Z(%0Z6EFuZZ&iJ?
zmmFEIrY2eU3prmQ%#hHcyB)=F2{%*G=5~IIf#Vfy3&NeF2=sCMhH3B5XD=T1;iCN-
zhHg&#o$;2;4W`(rw;Vn8(NhBVlg$0lFx1hK<m5q#Epy@rOI0D{SuM(J%4yK}e5Dwx
zl~H7_>&7s<Yl$?e#3%7XY(=Ffu_jQoVz3c-e0Zn`oyMsayRJ2EwVieg7;nOINf}OI
zo0$_GXWkY41M{w^Z3aKvxnR;`H*{m5>-w;8qK$idXZZe(w4a)#it;s6_qC~s5OEJj
z3=IMAUnQ3yHJ#=zK7femBtr~_dG{BNH`x&7k*7X7wzD5v4x>-9GaP;Y*gU9M?wkk$
z21wHv($c7C&OEofwshMsDa02?GwvT2ASwZMfOiX=B&7;ICwrBzRK=^OGoWj<GOKwN
zR6FR^=8mCi(NTV#$L<@pXEkT%$Me*ax6o<k@oX>??r4wfXNn0~_~A(Igg!dGyeH1L
z{_d5?{GU7t&=$K+pd^gdnafP`ZU+yP^(Rqws`J}pMvo3Q8DtZ~_}L+Jd7I2CL0J&f
z@5(+cWNP(K$w6%GDp1I=Qgyhb(-&*(-6LE%{e|a-6f&_2$|g~J>}Vg@G3XuhvAJ@M
zI?7;g#q)Suk|@IH1>I`<^EvKqoyY|<WX0+gGc1Ax`2YqPT0iX!kTo<kq^SCN0pk6&
zy=P*<XJGL<cH&YwWJ8uL@&^5Y<Tu4Zoig<;69^L2Q4Zb@&Xn@O6iJ%E=B_kXHr>Tn
zva3r~2ZK8zOMR;W2qKk)j)OLet5yN@3S99IrI0CyhRiC5iSBY*^QodqKKp?maOhG|
z+yJx2jPiklNayve(@oeAwr)PUb}bjpCrG@$R^mlZtjd{`o=8iS>^bgIkohT0lFe6~
z$J~u8otm|dG^hrU(Mq%*&kp3`f<&ND>dh(UMlgQ<do;>NR$dJN?cScQFr|aPxqidx
zTh1ktKr+v`ZGPWN!H2Zwcu`3G0s0Fjq||RYdLnfWRe2QwqoJM{4H>tHwy$0>&lGV-
z-rVLXdvvOjemYng%Vjk!cS!XrKXo5nqE(aSx`G*V`!U-=!+({5PS+61m+uGWy$vsZ
zIk34rnPOWGKKL=o;?soHOd1IzmEo$`Y(5bnekP$;p!C7q36rm0u(h-q!_@D}$3e_|
zz^=|Zh2~+<P!uu%DVD!l|D0>(BmT`%HfU!qNHCWzSTNwwxFfB6(n}xMzC7cgS7=n@
zd;D;;u(Z*9XQ{w%{UiP(<$v!Mx{MI(G9+}&ChkTR1NB(68beHZx>mRq$Bw}Saymo5
z;bc7B9zKIF(YS9|F}2x>2ql#$K5ey~n{8U3&ps&CXiOvPEZ?e76$1s;eD}ju=S0JV
z_X=Mn1%A2?Kl*ydj?&PvqzF6i_yl*R&^K3-;fIz!=$d%Mk*@BAP3}RMGlV$SJWEQW
z=xjb4O22*WO}riJRM)&K8n!<p(J0QxVN>mQvSTvEems}=*g_7sRYnpTzXOyxPYzKx
zD``t;<F2da?Yp4P3Z^+*HPZAiv7vrOtVOb%l3TsJ8>M{B#Ob9aI!saGAN>3H8vxO-
z5kDUxaD9yN#GHD%)`}#Qmzlmr++W3ln`7#L)^#<RK5+wz6)6SVP6Qfc$Xq0IZVg71
z1~~R-lVmQup-y1m7km@J>ANs4DCD8+>(nSky79&K7>3gg`Rh;!kt^su%H>TF!k-58
zpes1Lv&&FTAqGGD9`vp}Yf7I^k#4`2+TeZU{lxaiI2ZcvnIZk7C^hnAo}pl>BtG6N
zv^wT`mDZq>usT3WfhyU>iDBzrNThvgN0-mI71t5PcrLEFks-R!x77x>HP1tPk<}tx
zd00)4NWkGjAGXGvU+ko&;3d2CvRV(FT`0Ym$Lf~P*vZwNJDID6O#gN7e-+@%(tr~w
z)Ok5BMWy)RqmUcSDzF$@YA$s$HCIxVfz9|dJ>1<J=e5vRfI)9%w+?@=PIoMaUD-6i
zWQ;HKH^C(iN8L86)IS-j2WX2|0*xXydS_y8id}~4W<QgSFy|%2YNMvOV}zzpoxAcZ
zunHYUC3WK=;>XsXDy>??+H10>GoGD`rFs8WGGruDnsU4#%U579m-P~IDuk5gl*Ok*
zuE)MwMK3q!W@%~GHr@rBIAO%S*dDs!&~jo)`^dPI*X%nrYY-_t18m^x_hvbD14&N1
zvw1AvdS|?^25Y*#r=3~hQ>^}*GYlp^2W@_xsFb3-mzBiLB3StraA<$KAjSp&5#9jV
z1<(TUecrIvPmB(npAe4y$%$c7z}ytHsiR;EWLQs3e*SL2Gol2D=6B*s_9&*yd(h&_
zK3+x1=PNqqAY10f*Z%nvjY3bEZt|oqCQpU83Au#Lo2o-`w*u=%!&J6ALixUSbTtF1
zWa=xeaEWabh<L_eWDkp`GsA2_{=+5Y2OR{zK}IBl9pkgSvY5^EW|CKv$%w1za3&vF
zET-OdEu}bFfZ7B^6)y&D3%Imxn#ro1CNqS+D&hh&m=m;fVY-%YiGsxK@tN#YBQi0l
z&RME6KnMv7Fx}B^P~qsEB8QVWXw$9+@SFnT7r4@D${IGBB&xQpvOGW0QwuyAD=qp`
zsh|#|VWBS|KHpD}@(ii}r~6Z-p)-!Y!5*Z%AyH_O1k~W4(LQ?h1cy1C{`OqA;cZ!~
zT;pzpfpgz?O}gf>w>i#}_rOy;@@LG=ms58ocON@U_w1+7WdZBY>>WwPUa8uqM7^8w
z#%8Q~FJkOYO+)E3vYK3bT?Nq>NpH9$JKHTCpGJ)ocUZ3X-{}d{{u#khT74iNQ}o$t
zt}Spqzs1NANF?&UCz`-TEwv0_${4azb^V=W4rpo9k(LmALf}m7n7RRyk@xofLwoT|
zl*AoCb<J^ob<FC3*O!VOhGSZ5aw)AuR-Ab>H*GD1J(}{BI1D!c*rM@#*TPD)0x({R
z9~ctFPgf4K^f@_p9As3W%B$^l8`z5t$qf6OH=9GTL*ANmi;qG-PZs(~G#qS*3=c2_
zUGD?noO4?7>jDKF>)W-`rtW=gO#}b+%}WVdU%hvV-O)1#vs$xTUKLDHdDxaYe~a-~
zPDMdw7N2|nGTA@BD2oAnxPkm1X%K=<r%Ju8y*~$#6H?!)E+u$xHn|T7L_A4|1UKow
z3x60FV0{Zz5cveCQE0pRvj@B+O2e`2zLp?Dc6KnNN9r4tg>$jDzn1H(B3muzmdV6M
zQVqDb<@Z>S7Il3$)iNFFK}5zC#XI>h__{6BOPKYw>ke4l8R{2;*)FxU_h=*9sgS^>
z77(8;7_39`G5GTUG_0`5_4#liN>+Ue?CgO@=aX}hZ^tKG&zIoKt}M8ibin)VJM$5o
z=HVv-J~w#sd~p%`MRJ4j9ku`o12re|{TY9PO_)0ts9FP_X3CI$+w`N6POeeQsoS`)
zpHkfbZbL+5ZD2$l#{V}H{#C=#B#&iu<Bwde7PW&Snqk;+#!*^f+n27=$M;V&MO@3p
z+~)X+6-2ZP$321m^$Y3ZC$zNqmTf?A9QR-|+XAQg{`|%LN<bh)$Hc>aGcVbw3f>*{
z;pcIh^R(&Cp#8y&d&N-ZV;b+H<H){!6XUZ!HU#?T7RF5DnvNAvYBPa#G_6fL*`?z<
zMDbpjN8apVfy)D#dM3oYX*Y>eUp9nXF9rzFJT9F$N3-sjsy8eWMXwEm&)dB+4t1D;
zqMG)jmghOi#qpw+$HiFD?_6{IcR!%TL=EfRR&E(_WQiUs(%#u{ai!<@-c|guSO@pk
z<xC7eN#C$;+tr^GipK}Ter~hvPX=ApXl~IkQ1ty<zZGzOVm|<PXK+*`7e**;J>dsv
zYEV#~;?h*a_bxRox<Hj-$``+$OC0wwj0vRA{9eXdA^OMdw!73%kzaaZ-rjP0V5)>Q
zXX{GhBz|y6As&p($jC@2qikah)^4VE((Vtg9&iV7O=@lfBIzCpJVXVf0OiG3Mrrzd
zKO{OJ({nZ^dJCBD*qo7lJ35fPe^QH1-m`9qO{l}Mo`^x#zRGVqVLI<!4nD*p#COO#
zA6ua|KIv<}aDn*LYK;!;iM1y3Rj@8nERiL*&#rj4!G(Q&yM3m0zAEAYIf)n@(?yRT
z%K}$*K&wgSH}*XUg*^fK3nJLh9T1>5U^Jv4RO$2b$vjk#o)`5}laOQiHLT=s`3yh&
zzW?8br~iYmdw=hLMA2U+nF>I4v{EezCXi4NC}Q!qU=o3T`G_q8ri&{5FJ9?ZdKbnF
z5@z<2`C~=usZ0VfAG^7%tkTM)9(69NcIrcFKh*`rZnC0b_c!;DWZm_D+?D_*^UjgD
z`D|H;<J;jWoj+ZXb+t)V!X!>{Qrb{oR<Pf#Kz^!R+~KyFfo(SkQGOXF0d7V&qI@Jo
zT&S(?U~p=pa=gt}r51Ov17>rT!iXMJe}Ck%{MTpt<vlOZB0P;KDwu6&#ZZ7pWgRfX
z&$Up&jltE<*wr8<d}`@Qb7}}xgSpE((Zwbzi|BDu5Sf28{7Dm|wcqYG+l#YP;Wj`Q
z&7x+;xdOH~Hp+X&_IXS8o!6h++<t&UgO?k}OwsoaFS&iX+7o=8`5vmkg7wos+!*79
zstf>uR2`pxyZ8_K^-r4HoDL|c@NFbnOA~JKbFm8?fjH!SKYuPGO^V>GhK>3{*Q-W-
zLA{{1ToOTp*p&;aGH>+5L<}et(}BF@g5pxcplmU*6+1orF?(|-B0$3XNvA@!x)G@#
zd|gV_=!)OcmjaKamlA=I+NoOgjMpq~biN%0N-3S@2K&naFR>Y+9^$A8*2||wsnZO;
zI6U1xcI_5?0iQSMIgJnlMLOA*0L=!IfH?2sQCRA>QKhvSwnA{+<;%kzP`9a-BgJ@+
zin9K3-4Fb1&f-S~^nL6kH<Zw$qh;usXU-Y6;!Lv~%!yn{^<RAJ3p_HEg2)%&Fk+8@
zT~3}{J3b__Un<&!+RP8*=)TlzaM(>X8~8XVJq8Dna_GN4^#r=dM&d22{#m<zLUao-
zapl(M>VHQ#|1ELz5*kscUy)Z{B9M^U;0yhckvWWR7PtpkK;;(QsxfH-l4XvS;Z%^^
z4Wpu9x+nD%GYZ+42@A)O^KkMr>jWi7kw=PeZ|&3)i-pTWWzu)qJNIa4?Rem69=OFt
zDU}0vk+pI;V4eK4>6Ps*6Nx@?d$9kDip$6op8*pDgn5t0s?}$Fr`^ZOAHJFHw6xG)
zM|SW+h!!@!gDopk$hN!*w)e5A0AtW8@|o%B=@DH*NT3W$7u+@tzNVz#s$>b!UI%@f
z=eH+a;^J$<+r0WBt0vFNOga{HapvCzYL0GH*nA`$=sO~n8#(Bveo$A*icmb8aygJb
znC>j0^x_M<|9Nh238AA}bI$jU;qMNP@#58|Wa<8bvU-F(-Twi(Hle)7RlSgNPwgwZ
z!b)`w5IdyMx^*#|<&ythX4R5+4->@OpAsb!-v{}}4FY2ga%w3nZk=(E7hMca_u7@P
zMQ!@yU!{sxVBH3fK8a%cU}b{foEPMgCx<>n*+s#bk#)0{4llkbq&w~Z0Y4DawAp5N
zyXG<-D#n{!QGZ`Zc!Ot>!+SAD8QQHqg_4Gvw*ApAWY)Ql3o~Gc1Z4_3X7K|;rzL};
z$9-}AUB22^XxGR(CV+7@?)N&870=Ou6SGT7`h5XsK#;Y{m50YHdChZ-R=DU9J-O!;
z*ZeCOixO1>g|<7+XzrqkA(6Z+@TV!5)Aoz>tw|a0)jl@t2uhqCB`fe>Hv7LxCYk>W
z;0khGk}>!nKl$}5=vLszGp&M8`U!U5T2H23XIgg~lIqBj1nwCq3A{pD-PqW8KSqWV
z05A(VDnyACoe9JoAOvs742+;31Bj+ZGpm7-%(k)#D;GXf-93I17T!DDl{^|I65e$*
z-~!5@z&#woQ0(`13Gtg%rlP*@Q0=(-+{AZ>1~Bjd71rpJL%LEidNc8%w9a>*<$PA#
zHLT>6e7-K_sF#NKX_vF!bTJOeB%$@uPHv|XupPg<$dPKC&TmJ#%>3B$y2uW!1^4;D
zrJU^=th}=vyx@HAK$hXA{(w8{Kwi_Uc`0w8uU>H>#8)L(w6I}Se4fCrm2Ka$CX?A%
z$5d5R&)bevD|_4|Mp4hZ_cqo^pbsi6CnrXlF&?A^ng4W#t(Tb@C9#(;lv@1r&i-lB
zZ!ZwqsL#n+5>6XUMa;<!DbG2+B#EwUuby^RoU$uz%DGQr^3Lj(EG`T^+?B8kl4GWq
zB?{jfxs+B3^ncM*B$%=Ut^l%i>oWjp2?%|S1ERBJi@XdHyu&wX9^LO|hPddzTV+<p
zQrLn`dFSxN0_@^RmE<hKF{E9xS)KDm^r#8bjHb^AJhl<|hboOfAs$X@87zCis$eM4
z=%hv$Rpy#*U(G|*NwMEn-?<}JL7Ah&9o3f7el#HYDC&mMIHL$RGPTC~OV0gQu72n^
z|76c7b@CBmWXUEABn~He{7om5q}tqbDb;F$8p+>l3%%j;Y$$p6pLyJWy_^iA&zkDu
zI7s?*VY2;y=DvT1qS*5UF!V?ITP{MtX~lquP5awptEyf(QNRGXg$W?rqU=f`zRM0d
zea-YPk`dIw-2VE_ef#p57cBMWKERycKCo7H@?efort(7ISi)vpP-3~HJ7g9~hI7kE
zQm|z`SDidYzjKR50t1<TXMkBcc}I3z&shw7t^v-sO+(py*;M1W`S_<It%PsmV21F>
z5(>f4^`TjO8&pE?v(+|^H0!CA?|eU$BG84J_jX#^os1_j1=aFi_CqXEyTKr*#I6R!
zk(sc#+ewGM0^@r;m^>0Q{bq3YjDXXEj5nZxx0vwQbuC!XO*go*ZY5`OczYBmbNs#C
z_t$^@F;4*$gYlSf{dJN4`5XR9tc;RS*10?D$^`%TfT@g^m?`oaC6$gTsDfDuFiCp~
zb>^7YZ7j?RL5X4PAiesnFL+41%=EK;wWHFeecgd;=@i;YHMf0$qJW*qDQ?lsCnzmU
zI6g-W)0_|YY<aE3V0G3<g&VPwPyksu`=M97ubVbRA7&)eFhGtBx6Go__>@u}wi)`J
z?4^JN>q78sYsDRhq{81~U&>9sBcqg%2;Gcyt-Ws^DC^UIA}NCnFvp;iAO<uiXmBtU
zPF<fuaotpVf3<nEuj+&jZA0DzgQ<>&*#R3ObmLM5b^+(7-E{e$j{Rc$(ZAgpG9U~T
zUJ3YH<Hw(H1^CyTl7Lv&e60n4Ar^}Z9GXO5zAbo4PS;NB);QP$A{0><6lD^!vJ;^>
zVax{S!oPw*??|}gbDm;|AN54jTA{@8&}T|IUqZrUGk}1ihsqKw1|+S&jLD`%jqGz!
zhw?;BU{T9o_Bn*vCRL7D7je3sduX%}-*U%NfCd!uK>3<9AWdkmDt`D5=!@d6Gq1B>
za$OzmbDMUOpK|W!QqM6S|0%}%Wy;X|A!`4VXSnQK7jmOND}33>+64}htndTc;t+_d
zMiMO*<^vPqZSAC1?YcO828cxt{Z1i1M=vm>Zv0`*2UWFS?cx7SFaXOcivSRY*Zsdv
z<!@g+u>{333RG-_y0H+jv<B-FOEke*LF?M9ryNAq0IgRFL*@|K`zry@f?~}>T(?<L
z)j)ElxzU-C0@ce1zgcnM=3G0NKQ)hEAI^)kuNV|i%cyhhO?c*Hl2@v_9?<`8uqzpj
zhQmR*uNi3Xt;Ay+X4cH1Lz}Qt;ft3v2iki26WG<UU0|cifPf2vi66o*mJ*Q9kjN%o
za1n55H9+v;wX!JREPTzlf8J&8if@LPj*nweUu~qv{HCe)F?C1i;pjl_`hqol5xMPj
zQ-OA$yBXI`*7X9APPG$O*44=*VmZ+Im-DGgC7|BJjWz6V&JM`u30A1o$bpF`+_9Jb
zt>rmV91pa~g5a*EN#j7pp?e@3@?M6qPu2;^!LMVmEqPr5(SIo+j1N#vwo?_|mZ8w&
zWnjv~^Cm+p*QaV~0Dh=bd!Va%OjEB*s7T%iZ0&{p=DU@RJADuGs<$3l#(RVx*!r0s
z35%%=Cp*=slTX;s_DE1)WY~XbHALtAJy9!43E504aZ!Bh)8JrqstKrbxMvm+w(VuD
zb69b6CXG@nyLVt{YH$*dj%tAS7(4p%EP3mTjl5{L9+G9!TzO2L?6mN0d3ow{wzOF_
z#<&bSO{rNb*&(F$PnPztg#H;o#}&%|-<g^01rA_5;T8u(m#!jy1KC4QIHmhx_x>PZ
zG`PRgu4OAzN)ZHyyuKIt9{*6>^XIqw*JWRY<Km(3!VK%kly4z;;DJJvZ#cKL<9Sd@
z&-9@R^LZ#2z3UXdpRJ5K4}>=YXQpu8QzxRAtMK*ksp+1crcHi41Og#wL&{zb3!EfT
zBA^m;|Gc43pPrFVIy(%ZsJbRx<<Q#k3pu0c4_`y^yh_kHZu}O{{z`Ib&q+3}eiVy{
zTnNxI#dYb!QMwez2=9%$UMB1`&7%QiNS*Rx3Lz!<?I(dOmQfQ<^gADZ9@NVTfC0<#
zlg|!>vjiGhH7{o`4hIBR7u7zDcz7`Dy{XL-D>D#AHXIy7BtyIspd|x`M7<jf=B^?!
z>?3;?@)8UA`ufY=?J_)7z@&gZ=H0>~ik?c95^Q6-v$ws2LvL?4_iPCnF3Kx(b0CW-
zM;F!>n;oI_A}jFBip5PkN=iyO$yaJ>YM<ojA|_@nAyV4B%k3#~`UofPfxUiv9IKhB
zRZI^f>ji!8X|vAmJ~8|(jBCNfr2(~<=A``!c@rGmjJhM@R@8*wX!v4S;2_p-Km9-`
z;bEBE$v=bApMlI@R|T*c-P3cQw||R}cw-1DkGo<e6XDFX`OXs|We<1k56kn$KWcE$
zJ~Vzpq09^g(57`<H3>s_n06cqtyyKCPy}(3I5^eVfTGU4@0K(buw-#Kp*BHiU|H&Y
zI8`;UY7M!*#v{jcGho2ni2*9Uv`wW*dE~I;nP-n{7@X)@lKN~8?JUWdG+U7O2YV}T
zfb}FL{ZF<!NJH)m2=^S~GJsXyvX@`o6<;fZxL9}eE#v5$P)E&vP{V0>+F_>?k{55{
zM{&S%*(x8Q&%kihcY>$0H5%!G8SO3)q?!ShevbzZZUDrj-Ou@}eEW|q`?(aMig@cU
z!}{A7j1_>HrRy9>H-LbX^nU>Q6NqO4;&c5)(xEr2fj1y8$tk5B1SHlp24BOrZiDh7
zSq+F4mee3%HRiCqhhQew3#v<p!FOmEl)9TdL^l_u+vXxkcxE=tMxzdePQGb7``R?%
z>t_xm=TP75hlZM`lWWmJ>5<aZJCQuRT@b@Yp$O9zKDq1T{(3-<OYZxWLx_G?4{E_`
z&&d|D<SpVU?x@a}_3cN1-hL+)em)0RcT7({cd#aI$Tx8ihQQwn<=JEj^2H*1p!4m)
z*R?g>$O{pPk?9e?x1O*kjKFXcJ%Fiy$K}N85FlX@K6{2>dQTFGi-?(r+K)X$9#)(6
z#Eb*0fA2@!^|pS23#)yz!2C2QmICa^8eEJsbyvF!3rgCBiMxn}Oid$ro|VH(@#Jux
zh$-0h^v$uJvU`fd6YCC&S;98CgH%##Lvpm~n}N+%&%2gf!Z%&EC9SbK?%{#0=wKv7
zcQ0iZb_X8+Edo*TcK^iqfXY|gC{WyNcQO<a+~l1d9hTTG<aE;BEgIpHzrI#?!*7mu
z+t6eF5`ML?^i`GDUIk}^Q{*qs=C?=>04aM^|6)o?EC9;Op8>7Q6HwmAC&pdnrX2dW
zh>#pwXtybQD?kj(B_o)Tmwl@<><7p{A1srI)(;E!80H2`GbiNL67x|9;&$uqi}&Es
zJ{kOtwb8yd-sPK%xa4Z@qMumb?srsUeEAETQX262j30b#?AP`xJd}Lu?gOJGoyg9E
zNGA+^;N!aL3f2&OS+&b9tW03h7ZlhpTUs=a&s{Qw5A>i=%ijK%?2RTSwsE7KtwXZ-
zT)22SsW{GfETcYY<Xz&}RkH`bf4z)=b6n;5?VAT8uN)!rHn3pe|B1Xm7xFX{BqTga
zDmP{trU0#9s!Op7^ZB8YKf=g(*+X6f(2dc>**WJvrAQawTjrv7wNGyOEf{m(Ax}rS
zBP}xYhe!|1!rXY1rryI)mGNEchWM18?2t>$&#&3f@!4Oq%Eo1wYieMd<qvwg=}-cS
zh&o7E7reR0$%NgvkI&TVX0VuWq4~NUIb6UDcdMbS?BPZS%=GQnMI#BeW@4*JZg6uJ
z6Q$q6q1UX{&7JK%^c?IU^9F-BU9xeZ9WaclJ#%!=8~*QZQ;D(0Y0cy4xU0gB=h7X6
z-|-$mF)S4Do~bU}mE;8P`JUJRdzY*lS>!7ufHQ%i`<jGvqq4EzFS$6qgV*7J8xaXH
zC<@2LIoWoTDb^bgcf~8H<>4Drcy$`eMke+!upf)k>?q1Bw<M;)>gDUO{qS=X+YbPq
z2&Lf9$yuhhm6s{X21BfQo2mdoWOrxBH1}b$z@)1VLOgjBHPz|dU5Qk;#(!UQIH*Fm
z%w2@{qz&YjB_R^|<`uK|1z^YFefq~X-X;TPU<wK}3taRTijGyM1Is$j$T4A{@z3P?
z&lvlpn2_8QH=jIi{GHc$a`_ejS}!_ARNo~y4LjyCADiskl$>Q=l1g<uLn3+;B?h@)
zL2Y+0$algaF-qO-ataX-R~m?KF|j6-$ZqfOK*Kl<p7had$Qu|c8AVd%kqFGGmPaEF
znpB4NTn?#V7(+78azRvV8lBY{Hr{EjlyC7m1mZehgy@Hb2QyMi1eJE?4tlt`0SX48
zI4nE+V+%i=)4faY(XcZhs!r?*7Y*wA(l34OH>~^NO?P~(-&wHfvO+$xJW}v=(=J*2
zSx~!qSSFv9%A>JDgvDgE9<J=K*8aaciT7iG3oIV1F$(={p4j_@05HBPe@P;Q5@The
zBmlgtodz%#6<IZT?Uk!!K9&WsN-0G|GQ=}KgNIYyYKUYuc&ZTnJe~x}#<P_T=+4TV
zdzP)NV9DDhrw@j*E+5f24L?5K!UZu}mOqqp+GcCl@WA;}<)VbD5Qu8TOjilccxR`s
zlq5iyLwt8T7tWY;NO7F182y>T=$h}=UXwash>`R4hSHU7nCfnw&s_6m0iWZ>qI8O`
za$n~R@dM!%6uqeU;(*_J)dciY0{iP?l^L(3ky?%SBa=On|B5OI{y^8Q!&U!xP|H6G
z7?Oo{&oSFSC)mxWTTic<0-B7B)uQL`<|u$8>bF4W^J>DC=48_pBsr-y0STSBU13Oy
z`2aU`158`Ebax%+H3y61H*3~9$lY86U{s%{!w$_CHYtsv4e)73G~fIcjyY1GD_;?j
zCdO!MK_BcnM3f$>3@deDfk>%i^*hb7dUD+ynj!qAFCo{EKFyIYb>{5p17R=T*KKW+
zG>~}AES*NF`H1azP&viB?VoP<Fic%x@F81wT@6yIRn`qTNq!jq@9yCl;rYE5U7^2!
z{(FSypQW)^`o#yZehol-?X6-U4Omm4o5!BQy8c{TY8a!zw8Gpaco;pkG|`HygM$N<
zCAKq$F&<hF#U`5q8M;gF8)ac(@g=%BOa{p#w_OJuLgdXtU*nwxyWxU$e10a~juVt(
z=##7o!$9t)3t7!@D9B7dYQEod24%P3Np}oPM<DvCZPd%~)F0}oTyB=h++7Ra^BJ)3
zYz;xc?=2oRhpl(n7j;egIHK8`jh4UeOb<Qwy?k(xMiqrh<L}P`NF|{}Po28KV#B~V
z?~U!3|KcO;?*b2O-?;X;;<rA672uBr;x}XVSqVPkHrXpl=*-sG9>FH=xS^S@iGduv
zveyAh_>Dd>O`SgWhkYsN3G)Tngz#6RByKHaF08VtlarG?`K4{OrGe<-sZojrk96Pi
zb$pk~_96P@0W~|QpLe1wYt*o;L4x1zMF)|@!jW%$z;ndnPHHFvY)I(_7`h9Ka^3Ed
z6Q#N<{DvusXFRkN&kIj6wC*4`;zn<|OJJ}glO8}?><Q^UE)t)^<5*F#`k~sLCgP^E
zJ@nqtu|=k^pbBT8=tG`g_}la&?Ek}AzPU{~AowmJ%mk1;v<ZV4P=x<@(;u9eb(^34
zk50dh={f<IB_$3{PNi^>ZOMVj_i8M56D67acH;xRjFHi}ED+^9E6)$UkU!!UE+~VI
z>#Zpo;NBuM?W6~LCk>f=4@1N}>oR$OhO=n&Xe3DhOx*2Q^yX<sdfLgW%SU|y+@kNp
z7lEx2{i0C%z`EVKjO55j6WQw?Jg8;U9kE+iN}^15q^9g0dIalA@Wy6-*wpsa_+>X*
zejaxE5&TdXj}V})r(O*ZyY-qih8O#7;=oh?#t{8KrT0btt^WZTVf0$sKr>>IDneZC
z+)BH=OcW&cE(PpbfIP1+b3i7qMa1{z<$`dw+>wtAIOd0geSP6MXu#L%^e1uU8j~Xn
zBBgbDF1-!oX{u#R5EobYlD9c%kE{J-#9l#-)!tN{Z)17KGlRAPAP<9%PN@`!@>H|k
zvLC{NK6Zw}!3$0?0RaJ23{D*Fnn4wv1z)8(kFe(@Ih=k}K&nV$whK_Q`pZ9-P3bnG
z)XPSebI1_=B-`-<2Rl12Iv%jc-pfas-8rH_q)(IhW*m%Z8C6m9S<18kyrYiFqG(}-
zt?HNe48KQY&q)A6O^?K}KIR|GLH-13v0n&y{Kr)8;IDf1A(190M|JzXoq!alV0&a2
z<#>zV*-N<>U>{y`Cl=GEHB4AKK?nVT>ygigyJEkWmSZA*+-kE1wlEcIl^TvWdhXn>
zlwpjBjdLm$V>ML-3JXC9$hX($3-IcEJ<B{BFoZN6*on8>lgfqG&X_G}>IaKM9$dnV
z!sC@27DpE9v>#TRC`>;mTNoxK%+Wkx0PIwU0!c5giW2YI3(?DqmEn@gbC;0f5-P+J
zXi_t@jrtG19-ZfWON+ZOPT+gT&{6%qo<Hz+m+vimLu;I7->}GII>X5qM}cipx^D4F
zCaQa43I7(E6A6(yvBn^j^1Q+cQSX0u0sO{2_ZkzT^w!{)aYB@S%M37)oE14;I{|2?
zy6@k=Pd4K>X!+uqYh}(UNTQ$8O6Eoi$w$*zkbogdhc78wm_^zLx}#}(qAH6N_qB=A
zDZ1lau|-E}x}W>#z~=Q^!*=<#Xg(b_)c2ghZ#3d?Xc0XLJw!@&`jaSXD}s~<`Nd6=
zvuMlYy2%6Yu283Ii&;9!F7s<T7Tb>FMXBGHmhu5SV@axz&BbG&q;%c%MOnp70dN;D
zgLfPgJ{vc?t*{>tzt~ykJM^P+H58S%FJSj@0$<DPKKxE$AK);$Qi~E3r>0l=dv$Ls
zB>v7F|3N&e0vy5k5WYnHxBlE5Lf~o-X05FV7xOujf1>2Ory=Ou{gGyJfWjb`Ze`el
zY-b|m51HwwIzVZc;t?TLjnSa0y>^k9xuT+?*nM-hdT(4$9?80<ra!Q9K{+U+G9I9J
zlYQ$L_yvyd)5A~rmSEjm+3-vf$p>q%9KbF|LIMXJS42+r(cAJ5KQ&Vy>=6n{ON}^Q
zKVX}-8e_e2TL8Kz1dd{&G@an8nI3-ZhP75sdlYU)?7Gc#b6XqbdFcB?ovb77%>-)R
zZC{#6rMz~=eqhm=)uF&mZa{(8DykWdrx|rw9;yP!Qu^fQtJ;A@`gSQJ@7@(6{>20p
z2_~rM*ckI$#xfR3FhR6lZuBn`>>?uTgm7tF_eYTAzH<KB>R;VOsV8&(ofWgIKif&o
zobS}qAWJSZ{8iOLuLiB862Y0%ih8`FaIZHeXJX5F){RtiQ6tM5wgl9BsrYy96F)Tg
ztS|+e-ngK76egIuyr7CfZ_oeaEJQbc?WYP(<Jk|)tlkV30EQrdPL(81B#&9QOw8_f
zY0)cRaJNIvj2n*~rwf|Tj%-5b5TMn9d3=5>cE~!V<3|qS=*;d&kn)>BZdyVFB6fcA
z9AUY2wwAHLT(nYz-i+4`&H@F)VP*T@SP&uCaV6NBYmNSuzxro^@Ba1aeMPV_+>PP=
zUpA%>*cfKGT~@R4kwk<zes2w2@rL>J-KqDHj5ct3F-*QH!cgvqw!^e7703a2+athK
z7DzUuDERHI?R#cnYLlTPW;PA6BleJ8bDgC`N>|qP0r}PlkC977zA9j!TXS6{QHMTY
zFWwDPP3XoVfAzPl6xBvxb0x23u&h3|naAU{uMi1uHy}kjlLk~OCm1glS%ut-s>r?}
zvfK;6Y2%$ZXhSrO(f-qQa5J$15`X$(G9CZ92Zg66(ew3fj;7*ir-bNJC4W?}$@>0i
zsN%7S<G<w5&-DmbMsKrm==WFV?_EZDL;;M|#^JZYTrmM72JSOsz?jHX!dK8XOM5rF
zdOjMBG|Sy8AAV&gjIOj%7x@+|of8|!Z%`BwMvlxQQ3ADkEvaFm)ZWLptANdUL!QJ7
zZ!B814^4{FH&Z}~H75fjpKj;DTN7wNwk9Sfspvk}aA`}e)jF4D3~qbTZ1C8X9UDGS
zN<d-|gZfS}=gU|Keg1xvx(KbUBiq6Atij3Wd@6(A7pC4tyOpa#mj~#q!q*95Y_sJ|
z9AZ?UGLynYX;SnrjMAtk!O@J1l)C)h(L5kHn!O=wqhF4O9bg|L0~y^EC^|QQiietc
zc-R}MChITE-iy(K(9`2Xq>)XnMj)|dgX@|lp??SvcIpPC*(qi7Zx43)0R}e?)Fo?4
z$G<!CaPE-l536DfzOCk{f-RYi^E~KmuPss>h4C5u(8VxFKyi#quZ?7CA&<H?bj*?7
z0-8`rhD9;Z%)(?jagXC;X&}si#P0R#DEl?DNp%$!74sgN4AeoI`J&z9D@V9t?!hn~
z_;>qb{m&%i%P0@to7dy4@;0~U{LW5N*pr2cO)H$!^_ni<SRr&<{O0qdm;jlJ8`mFK
z{`SY036MF^F{b)Y$b3s1M1%~EEb_4N9k9f-`1wtFtrh2rNIjE*18p-=0V-fWO)9&w
zbCc@a4OreOlh8XkDQ?|S)B>=h*WRax%l1G;_PdI__GFcv)~`ZRd^sfbsaVH@#m+p&
zA{l7-4Yl{+{eIcDo=Yja1{o^=<1HK?DQIx_ljuV1z3R8XV!+Hx;`&8vJ3zBbLX#Kk
z%kFSKyYZsllE<c|`+8#+E|zz00FiV2y;^QcRZ?Bipl?PvBAUlaMnoq=YZ#n970++A
z<ZNVX)!($(K3DhU01*5L>b<+)(HJtRTqLPkLR$D+PeSIeD-Yyat1~~nTsvx5#ugVk
z*7g=dOFH1Im)_L;I=a?;NycV)n>S@Yw9C1~RIfS5BUd=xx4`~U%`@8D{>q`Pa;J@T
zE7Qc8GC)>t25_9%?pMi`@&tEvU)I=yjQ>AQn@dn|VjpM*PRYA1*cnAEYDB1}ejmH^
zCQmA1<>vKN!_e#0ri3O1p#N)1o&jb~Ldh965e8y`V$n#8C1dN^#=7;Evr{!_nm);w
z0um8W7IU+VarjKd+xmy(5=+i?#v@&64(>)na&$p86id8UBsxooO}AyIBM^~~sojwu
zdRjwC{0>+)df%|*QlYzYoU&<7&tDAcZ1O&cxnMXa4Uinu@QNLaljGUaA{E};LE&Q`
zLq3GJBm+ar^Q}Gnd~?ysdd(cLcA<$9CKaPyIQLM*JlwweW9hTsGg!6^fCWzYpw`Ad
zfSWDuPpyuTmU;$HY`-M<?LXmB<3W{=PBs_mCXCCd?y-ry?5RYxLCc6QbU_zb69%vx
zyeFP6%J_*|!pkV)1`NK0yF7w}km;?xIp;S``5i^deVwzau~Bpi*oK+=a6C9Rl9H=j
zaL#9BX(&_gyFrHU(TW?!rl2dTWX@+N8V1}~LPEi!xC-<SIC3{`1;BvrQj3K*^Sggs
zy!q53K-RoZoXm&0L`Erm(5^FS_d`FqXFYKu&jRBopu$O&Y~|@nD^C2F+65T*d4U18
z1vzo;OIPcHJ6?FZY43M*9TP%Bgujj%47`u4K%5L<Y8)93y0YSYtl3DGi*5Zg!I;i`
zvWt+6+YR_bA@QLAp5yzXl!SCRL1I$WIqh2)&%aS4zgh(%Hofi?(zY19_YKTQ82J=?
z>D6JmsUCItxe{%VA>x{8!Pe?aTm2iq0;WGknz3=s%(Wwwb#?s4CPVN6E$|ll6s7iG
zaRW%AsP?|ZangNHc>6l-M~9R#^sb1#^p}Zx;CRW<=qy3k3Br3amIi1zH|gOC48fC@
zB@t<cfTKvjC=zZu?uwW@A{ayO^~775%x*HBN8PlJo%J6TGkkvbx$S<Dmq&gB3YIzN
zoB;(@wU_A#gd;ht(o=I{gFCk+v65HrB-|?I4T$Aq_i%l~mh)03i5Oy&%(g{n*VOU>
z*)Aw%qYir)fD6oz<mr|T(OzKjb=_uj!;E4tz2P*~2KzGm-n;D5cT>b_D5G}v=(NqS
z8f_X$At7<a`@3^U<wV{qhh<qMqfkt6S)bFmvmx4sKu(URN@Vs9=*^YW*1WWYyVmif
z{kl+uhx^|@Wom@ZwBxCXw}wgly$<apN?-hy{Cq~nx_33u-w{fhf1dE3!dt_c%aX5Y
z$|FKKlD1~$oaUK13=J#AlZzi!`xa<K$Oi&{mNw-HtGJ_s@m<|tZEnnfW$Zm6KpOw(
z*w%<xh3r>-jf^QpW`HqP141bIojG9)fIg{JY2(ibChKC`m8qK2%-6#TYCaJU6G)gi
zkz{XG5aKggUaKE?=LuC%iIWx8+^@sIg^(qgSI^QTk>7;u!9Mk6V}UN0Az+6E`8Lw+
z2h1v_^<nXt<%dHlR$+Udovop+!tl+$<u7Lok=)RM6dv|B*7}tZ5^2D4DlxC!vOz%W
zp3nk#snb0Dp0CBFd5Dgw$m<_uGiV7H<K^QA=|+HEv<*idWO5%{ceIiSq<G$NAwp(E
zzhLvR6=Az(x^_r0_P0a*>wupZ5>_DXy9q+ky{m!)(HHxZZ%>xT&Nv=^igScKSmTQP
zPv}ax_q<faLxP<{&^&rDBCtPcDfGbg<EgLKWSE_m&2x!{Zx`uJ>U|4}???{<J%TtV
zV)IWsOK=z6;$O8nJAh%vrcw7v6I>2&Olx^wuqLqoi-!MGRa@W{Js^!A2}%YcD{O#F
zQ4{r%GN^bt(>;sd`ZMD-CQvkUgzUNSGB-l{Gp^^Dcy%I2HuC<DyK4`+WHTT?cCU8c
z<KW0q3`&AH@6pWPyM)Xq;Zv*uS(KN)W29tQa%Ngpx+a2T658X}KljPU2o5`%1{#Yn
zT1K$j2Wn#s19L#n7xru5ufDrlK`@1C=Hs!Dn|EvhPo*3@pE3t5IHrAM{ajSgyKU)S
zU#tCCaps#I=bO9iSxm{*Q;ma7U)z_1!G>WMY`O_85P$B$ob*QiXJN&0EfHZo*JJn9
zG~M09Wkgj#`|(RZds;$c_Ws=2lPTxI;vx$}61{4lU@qNSv^XAXMtj;x4s7m^s=CqC
zhwASes#3`m>ES4~$Wp$+5Oeq~ep|qM2+M2bI8tAH$8~_GdTd-zuW;OcVRP!Z>u}!j
z&4+y~U&qBw)&7AuCL>I-nThsS=sljVZjOF1g4yKC`_-<{J!d17JqdST7pRh=cWE;d
z$L=PMaa-={Y5w#wsZaJ|F0&!~+;XP8D85ROs?4YyOT!xtzRh(6$e_*HNYL1FRfdB;
zZ}!~qmKOZBvlJp$r%B+<{a*v|A%ExjuLYC5S->n&ioR~yL*GI4xa1R_S6^Fka`hyl
z!mUx%d^sLtvL7|XC?+il2}4kIbk4cq;JE)pj*2L4ifo$#l}sqGJ0?s@1FUZ<e@=1k
zQWmg3>UtZS)(f9LdTJM1W~C)(6Bkeci7E0hxHWMBzo%5$$)e5~EHq$Yz&rP1OZr{E
zXi&>$<4z2he(l2;jlCW<`8yW!bWTC`)svRn13*EWLQyioXTrdJ63{L+GI?6wPw)Bd
z&G<V7+=II3=tA(&j|(O>8U>c(UBbhm_h2|7Eig6P$+nXu=OVCl@gq}pK4aM6CwuzY
zZ`M?J0y7pXOr%?5YcC=4!`N=Bq^aq6ICB4sd@iq*3q~RO7S&O&SyHA(9D87^RhBR2
zaioT-(7d?_qq%SC`)OFuo&8liZmmc9cI)$tEN;8VmP%k7Q>FgpWBR7=41ysoS7sv@
zz1R6a`??=d+b{$usQ8@CxUYB9p4kdd3h&3CO`*Kjho{6n&J2KfpjGTKIs9(T%f@}B
z+#c6DA}M*ji8IUv5yL#QSN@#qrq^f5P&7AOLR|K11xmc4pSwwDOzW4C{t7vZjBf>x
zwdUBsH@hYvBw)<X+g*iM#%}p5$Nq78;us*PA^+*=1)n<}9oYPNy|s2cwM5+gYRN!-
zyV$YbT@fx8hFh4IA>@QR;uk2;3EUBhDz{(0X9dVDm6x-#2;Rk96ey}Ox!9c^Gd347
zbQJ>K4^iG(;;{N?TEQV_mkz(tK&rj|*f-a+tz54y^bj^fS#r9X+?D!L+H(3hLUv|}
z2Nb`*IVTYzNxdj#9{zc>s~Am|UCxHBG%yc`gAr@6&Xhh95z|{x$n0w#HnUD(Yl&R~
z1h=s0VhwEnxi^cQtXOY4n2iMb16?>)Yi!3pIn>Ty26+7SBG<KXHETT37&-~88#B{i
zLb7!tf#G_y-raqjx@@v_dSE@yc(wi1s3_f}UO6y_HO4it<Km@ctNp62U#B6Hzsw1)
zO)htKvgxNj=|I>RNZDNdUgnklj98x$5Y$h|-UAb}H@tU|xZ@>`X;=K6eazaehmYaP
zA4-6=0B`;A=*=Oa+!r!zC#ynwjpj~y;#E#tX-pG(%MgPHVn>&jGwsw1RFH1=Q&WRA
zGlm~FfiZNZ2&>YjjnZ)*A6#$$54GI&qqUO#4X+O(u2`saNedI#{)ZOvF5eVE!NL5Y
zdJygqMT#_o$1}Rk+_$a%kHd$0T=42>`9}Zf&&a?9x_O(k>^p~|cw_VYW-Ra)*Wkb%
zD3z#=;JlD`bxY&x4VN@oHEem_;XEwkUY>z%QR$owf5;1eTlVuOz5`LTXJ+D#mfhi1
zBm}4Plu$l;Ou9$7WsJF3w`@k44PQba<u~s<Mgt62=BGa%1F1(!S5-Z=O25dfWX2z8
z!eoxnYaq!{(~lJ5)ghA+00{ESr1Vf>VPW=c)(g+T9rd`|^ENN8NB)RA#4#nf^03-N
z!yff5MIekIv*z@d{8>%ayV*z4DVxE<XsQnIdG5u&$m=BuAJhvlDLiHihCZihw!Djm
zZj%-~ijZYIAd_kjY;)$3=CpH$l!9&>xzD(6L-Q7$H_l(Yj8+j@r|6kva1kzaVT(aD
z?H=>*!AQ5>DsQ9d5sy8QSB__r_d|j4VukqTuxheanh@2eg1rv<!xO52kBnk0Th8*H
z+(bQQv*#XZ-$B*+iHZO(BVY1uKCrugR$?Gcz~H2DXfq0F*4;fv3fROohGT80pV0Dv
z@<qcNSvmjN1j$LxbJ)-z<nwj~Sa=*I4mNVG+nfGil_t?*wCp1>RehD=we4(qUZ&46
zcgN-=r?>Hs4jbQ2(bcdH&g0+&%hJ9f;pGgwhET`rPm`9jVB;Y-V2m~|yzc-EM?=gx
z{{L3Rd4v9#-4e8W&fQP*?NPLQ5a~7tA2dW%s499-<;mIUgor5@;{_X{UXR|IakYq!
zn){U8+=ofcj|yC|jEw!Zqs($&HY;6&KCDzF{oyNNIaGYclO@QvT!{%MT(@_GOgJ;t
zi-1vL+lT_b@|n|cJ<um>p-&ws(t{#ppH265gIt?|VlyDvtvxSHCdKRq9m!XwkdLDt
z3x?lTd0^FA(Ghnqv8b|dK}s83%Nt@mdMVRzF_d(TrTaB9{{R@%<ALtZz%gAVXfYAa
zb#uC)D)e+R%>0sncn`BT2cS%~Er}IouP!`VBtQW^l<0`SoR5pNwun9E5ipnx+&b4u
zzU}!Y<F*S8o6Y!~+S=DX-2nflHw6#^>dTAQ(RLrnNG%P2RJ7dXzzkg#7vC6=IK`Ra
z0rgzX;P+-XXqL1)rsD)fMN0sN+y92*TfLeMU<H()!c<Umh{%l|*0B!?l30PM*X3&t
zI6E2y2X_mn=q6mX;)8lp>$>~2U9s+R-et0un{`L4y%0e*phJ6(=~zsCLN4Z*@ksQv
zb8B=?hAM>gtVV4A2g`@US?lMe%{OjPBM$X?Nm>fv!mGraCCNuxY#Goir@I9<NQ4L0
z$$McAo;N8lJ_M4dvzT$8=5g>ls&vExHaN{F|Ax^m(6}@)k{KhhWpyQQ$hRvmxkyV5
zX3O+z`0#BK+52@zT&NZ`*Z(5wt;3@FzV_i6x<eYIMY>D6B&DU1kZzQm0f9lfL6DRN
z0Rai=MnJl|yKCr%-_g(adEaaQ%LT)nv)5khu3ez<MjYzc^%uU-?<!NA`VtZttsj9l
zaq0I|y`!^VNcK8Q>fs<ZFBhFmv&6I)cl8NKVmZ^BcHHxvYj`&C37?5JYdI$6LP0Nc
zI4#9p^HA<@qc{e<g=s@FVt*?}j~)VRB9Y<yo=UupjG94#`57QKG~-!{*QNIBY+#%z
zAI+8T#wy;V{0>;zxhZUcIhs)7i~ePl;8N(}>3#n%+Qjo$9CrC0_ze7Js<j%f^=$;)
zsIyx2facsef`l{rx5feCJ>EhM7TK6^P#OAG(|}sIpiy3Lijc(bw<Mp|<kKLb!u30@
zR?7hq5-D%~o(WN(r%s0q;~W84%HyPq#4!G)N)Da}K<F_`G3QvA_yObApNrFePJng>
z*uO8_t3i@C$>z~vShKiEB!8Im9eZ2ubhNyc%|@-9ha!ZQJiy$(PPtpDuTIY3Gvr?l
za(n|0;I_M8)GP`j?SOsa@Btye3#x1MvEJwYqz=1<(=lrceIk#h#?50@pVt~FC$Flv
z1e?+2*w{Zb?;iVA1B%Dmg?ItSv56y}mFx-9)_6bY1gEr4{AsJ^WfkwxUwdBueWu@$
zKE>_G?cl^*4iximf|RE8JEWF^Z;%`!!mWbK3T{EChFzU`hclcLG>L(9>w?G2JZzWe
z=w^awmj?AaVT_M+mlAN;#B9uC*D9^6Nw1((-oFq07cSuUpL-1U>nQo7(<&9sZt^GO
zn&c<Hyb2+ZN-gR5bk)ke#Cr%Gr-}W#II%Z5Txr>bTvKK9F^W>Db=(dsA7Ro3;r1aJ
ziVM5AXi9-HPDcN0O!$GxP4}1jn}6d(Vp}*o*mCq=Mrp-g-wzr+${+GkIs`Qiq+G(l
zh*01%0eA;fxcg`xChcE4djJY{_+zNRUl}32Tx2Lh?+*kT`U3#lvX7z&A!!cCN{IMP
z9;!Brn_{y2c80>SvH+N`1*|Ib54|H)zuvD5h#XeMACgu=@zbF1I9}yPaZO?R0M<7~
z^AGQx3IEJe=NKYoMMgar;=ynelhfV<-qwL3;e9rM)-@t*YJewRSIr`x7?u1zVF1r3
zv_fbdo$*_&FtzKft_ty`?8!rYGAV`q&1MYq_Lld}X@Air@RO@ln4H3vf*d!uG_^$l
zlGcNTAm)8wp^_?4!3`i)H^^zhq3papR#O~ynt0w5quq1aA(R=yD}}i7v)I!n@q5J@
z;{HvEP>=4#tM4c`4}Rxy#X{dvboiC5KW0eyWj|~sn0)nkv+oQ<aZcsG(Y-tWrRD$-
zR<`E*#WEgq=>R~rDj!2$tr)g_)N+*#_jFSX_6DG(X?lf^ykTws&JiHeZ0-wE1vBB_
z*ELi!3a@a``FgteE$1h7VT%y#e4AcT!<Nc>T<9d44Kltz)(iEtrw8km!;wTge19+Z
z-?bnC7N|)MlSP<Oi_4+}ykOb3dIy}B`_mJ63+k5eb-n#BPMY)&Rc!vLqwjlwKJp>X
z-(Ki%i74do{~G%Kj3iJQ^Gz=77eFRU5soqhOBMD6!SFSH)Zz;O*K7z`iLo;=g(4{Y
z0S*xav9(ZoGo82hK)n-N-><UO&9|_$?85pLD)p4vTnsAzvGaR7>4-zh0AGqQPl_B}
zR&qD?=;%+rp}MAlaNdiA*jNrQSn9Q;G`UBd&bh>LlbGjm^Kr}KmB%vTW2Vpt&pqHa
zi0!Skn=LFfmms7P3=kWrAQoNSPC)^U(n5WzD}sbQ!(P^8g128vOz5?MG)xX4uT%i^
zQJ2OL4*I|%skJKGf;Wd+{uY8n$l~~!1PcFw8B^V&{_WMrLf~c}3_MIIO%DMVn?sE6
zV!f;U=J8BL$EXb39`KuE_NGeT#D)o5d4~?IoS}wA$40!G`<x#5;c*0YBU}0UXSv`i
z_WpD+AB3MqhwZzJBN$lz*5+V81hX_gC)G_B9WLR@xaL%~G~ro={m@^?E?Wb#4*@8o
zLAB1PZzHUtBCEu{2s-=jE&WQ0^9gH>5_Wg6&U1eOC+1ofB*&wGc<&QuG$Y@lV&?!}
zDDrR{$&&XNl%vEWz=B608*iXLC3CN9oF{+W?KQ!La$jfqRumBDu)|v|{7G&epG<_+
z45pvdFgwG)!g5Y<Jp3eDhFxD@<t!*Zs76$xSA!hE9l(2Gle|_RetlPe^UhtBHJ3dL
zSSzMr>`-^E@S(APe+**G2ImYQqF%(+G1Y?+t}YV6^iJwnyy)0NK;{}Amk0Wrap!>J
z1SJ&z25y6aTLu#5FlqUAw0t$>P19B$gh}$<VYZSvwurJ0{X_l^7>@;(1)S~l=@NcR
zpx+3uFet$TK~y^g(vUP{QbN%5{&X3u<T21!COE}fq6EEE{1S*k#PZs9EKkGKv<j1|
zhZz16ly3D|@Ev>=gp0ES_8Hw;?FiWg+_YOP#$EkiSqt3o4JE&WK4c?WL>TFm=t;Fc
z-WKP+gDjTn|N4&bN1Cw*5uHYRjb;42+kxb5O*fMpIE)?SCF^bFjb2A$8Ov!Y=)9EU
z+-hVEv*xFn%1v?iuYm!p?QI2&Y$gO{zSdSn_os2R*1Qu;&ltq*IG3Q%>lMe+PT`vQ
zm`M)oz8juu=jl0xd3q1Y1KG#RorR+2bd>@`8~?61NfgWaz~hya0pii3kmX{?<ac>3
zxXwpmdL4wqIsZKX63nI^g2#_*FLR&Zdf&(!?-?DoU$&C!V2%=BQ<t|ze0qAq{YF)~
z_Ee9Y(@Yp()}^AHEaUy*$tuCSc-dA%Ae%Ug-BeGql^Xl4s4l*rgkWazkga7E^56BG
zEel+MBR8r)hwyg|2Oz&Q)q@24<iRqEH1jnx^Z~VUsbu&FzNsRN1Z+e2p#a3I5zPY=
z6?9rq0ElaC8ikF3XD^it`?|b~Sf_6|EfBB_18e7yNT;x}2uEJP;>RulQ|L}Xrf*I>
zquR5kywB>WG<xTVrtctLK}oZK6NqKFj7f%q2INMI+fb(eD;O|Z{b(9Mc*g=#uR_*G
z#vr5tSxEKB2;qRlWvO@2(qlPSRCfXpSF{tTC49dPeG|&vxIRTSwzr@Bk?#h3v_bUB
zaonLXH4g-~zqZ$_UR0VIKp+1Hici%8mf}ztLyKd)`7sh9VI|3S>!_M5ywT24=YcfC
z3T;2wy_$F5|2<?2;3Xn%_H>-7Q*6L@GJtTh_9u5hzjBO~Z0zlMQqFkMTgF{Ml!B*=
z7X!R57GEPSHTn7;<#3d)l!U`c7{$}YJcCsqT)rGFHBvCgDL!M&p1u}J6Lu#L|I@J4
z;1i#z)(y#St5)cZP|8nW)*LM^YgQ_H+pO&Q*pz$g{&;`fsg|J-)<t|k#%rA&Nyc;f
zizBXbvX?+&`~h`|z3+n^U+gyV_8M?1?riey?yTjX^`&_!D3r&OvvA@yym*tUY}B|r
z)-3J$bRQp0_0Wp|0X`9JR}{hg$gV!3*?69Bij?l|%|k{s)zd}tW1U;v(8=1j`Sx0D
z%G_sRM7+eA@!t}d&8;qs;AdgxZa1gY8u*GD%^aDYk`8n&(>zuK!2Zk6e^s$oct<+S
z<R|(hN+ynX^|`*3E#;Rcif{CbH;LblLnL-K!U)_R{<!l-bVI71nqFfjaq#vbqK8(S
z7#65y<`CQubTormOiq047V3(!F+Cj6_LjR9<OvlMn7A$b5>kw}Tqz=2djX#ool(<=
zIF65`+Fr!dDq3!;Us?E{<e=%A`N}Ho_f7uTzN`Cdy{$ikOg&~R%)7QcuPE-D`V?ZQ
zB+QoL-5wY8W9~0+Rd;pA@(UtUcz$@k{Mk<+k(osy*xbmGzL9d4b1R;~2Nh;eiyOcz
z0#^hxyS+A)1Xdd-F+_v$zT@S@lNHSuzm}^97wIZINB;sFf0Bzwzwnn+Dz=z`_WrLv
z#>0O{?r0b%XD{2Xrs|W}VO~1`v-<h0g<9$7){HbYmG_IW|Eh*0;olvn!Ikmz2e7;0
zPv+pItfd`g3x9DukWeA6ZCn6m{RCIQd+;Zuok}3SDS=6Y4)MHbZk-24V%`~=eTuvh
zCQJh($8Y_(9*mF}%$0>tqhNx@L-0aDl0hjUtIBqq1saQqko*i47H@;PD!X*+`SkdJ
zQAj7L1cLysI5q8JoqPbMA!y5t4f6%#v97%9k)?#mgW<@bM7PFP&i0`A-)Zc(Fpt12
z6JTa1Y9n^(LRs-=>j{j8<FP``r~_A|DBufTpBabZF2Al65oega%~QypL){_v3Vj42
zJ1;c}y=!x9f}9iry0SiE1kLJwIxiWCuz6@~qOZ^eV&$kwMa0aro5B#phKSNw+?2XM
z(lhIvH6u7UC^QEWP3*=F#zE;lMP%s(?C^Jbpp}GMZ1VB>`em01#upnnDjBab#Pq2@
zu*q9}oB3$FrRy4bYWw#4$QFAVX$d)yvE?L}-<O~>%o;$;=W;lQjj=a9Z_lM1d`<@B
zByuDO7zsBreI@2<ZN|IWZp(UX0<8vWoOfL-CeT?b(J$7Ud&`fQ77H8}>Q$_TbG~{N
zXi#mFvsTuck#11sa9D^rXIS|GpWU#fGnQK8h15NgR<VasjW*fEr;0O)4eN(g?P8nW
zFF}`dF}8l+4ABJV?S_wx&Ts052_-At8!xr;b{Z2eKjPR;mss`6{5EMwMn<&IZ<UgX
zke6T%p}M;|%2)h!7@c{};79Qyfi6?56G3mL$R0PGL?Q!Ws;^NNDYdL|fBL78mv~n*
z$aFd6Yw_t?Y^UbrGvm4s8HsEL3f@;o6&oT91Jj#_hV2s#Uop7=54m;`aVz7AkLmX%
zvBqDzQ0wD;D{*hpAJYs!)9X&2!39+u1k(pRe$_@?IYT^JysxPEoyXLD)N+2#QYj4I
z*a>i|>Ic}=X(f~`vuI0rGzF{U54YyOAsG!mZgGz{_dAj*uu>tfJDKIZcjrt#?)UM&
z9GR)e)qV@y>YkhGzIRfq`N?}caJwfNzhk#YEo8B;(#q$nu*aTU1(fmgtB+=<f-1_G
zG2=JnVlGIOqIJu^w;k!6o<knWWGwrWTpI;w)-MlDQ+aGfujsj}ZKsFu_StEOjf3qc
zN@U4+EqV4*>0i~_>y+j2FPG#nKIwTXbDarw<+>~;a9mLFJB}{kdGB<0@VRuF(jOAq
zE;SK-Wiv7$T7BU07_fPyteB3fR*1`)sPU1fZ*`Bb!m!B{_d&5+&W>Mqe}uI@w5D>)
zH2=z{%h1Ip7x-RzzZiXNBvPtZ5lK9hX+3<I9NZL6t(EhGT6=wwW3B#Vbxzpj8qG(*
zD-ay$VZMfS=5thb_4n?#4Qs7W;Y4X9<v|?62{q|IZ&daLM<P?+2FZr}clypDi0iG$
zro&_K={dSWiDGJh__kqo(AUyTpz_-5IQnmoA#m<JJiW`nDxJWz^#>Zhv*)tUZ}&&V
zGKNF%KYKr@ded@JFYba2fWscqW`QaEa@v(Q+-_&@zu&Lcg+PvXr!`PQ@waijHYta}
z^y!OP_gXtmrL+BJ=;Mw@lu*V_J1=tY;8^>oJQ!Io+RA(589fozL0bMYO&u6L2$Go3
z;SCtl;;=lRYs)<iWRX-+78SwYlYY6^db?Mgz^F!*u@U7AQsxc|SF{Lp0iEA;;7Tw_
zmLwperE#0f{diZ;1K`f~2feH*$W0M0J+g+Hs98EERpFvwJA@I8n2NWgk(WRkd;H=r
z$LA<Q8^f6<)u_-yMtA)10)zAE1?Nr;-`z0=OKKBvhnWP-E8pj2EkeL~xkUvC*woFk
zSarwHXa%l0d*LoCkNy!SXyabmITo%^AGm^;{SKmz`q7oiBXJ+q{X<k%%LFoR6BgpZ
zeK++%R7}5FXQVv$EdBSFz&AaLu*s^G_eUianm<=-KQ&e|J5C7&JEV$vwrJD<asD=k
zd(Jj1v8xF@mM-+m%%8Uvf!k&1k@lN!whSj4oh9TyM907LUaI13wNP7GCYv3%9;ycY
zX>dD`B;m*q>|+?KwpZ%|9)QxCahd)DJ;F};5@RM>L^r(c5fRIce68XghOrMn1v2*Y
z9TdrU7gtCs$xAG9yw|u?!4j}TKp|8!SR;Hk?>zBKUU!e0FBBLjY;{z+%HV5}mxl(1
zrw>IDXifu?`=>;#N@M0|pe)LbjpC3QQRu1W@X``A52<GeCp?g3QA$Qmy-$l-bkCOK
z`ecQcoY%#sZb@-)nqf%{M5}vSjxqVvNft{+rWW#8$C31@`S${U>z_d%o_WM5w$xTw
zVwv7vg&0iV`)a>T^w!&ghiIjN8ZfDJMU*|%Uy*q8l^QmFFG}>D$h`V|(<1tGcRZ16
zNU}Fp%D6e0G~N8(aA+W9e7Divp1uCKDL%&Qe9y5rf{EK>fN5@!25Q30?k!KnW0uh6
z`iqeaM4l#<fDbkUw;U|wi)^ySF2^gpc^piuEp#qBay!%MG?c$xZzxhfK{RGsGtdLe
zs#Y?tJ^Fa*yHzp*qFALM2r5Q)egp|?R!trQn|=;owcWhVmx(epXJfsjP+`x*qszM<
zQ;aC(lvf)5W~1HjJLFkn8a$|6g>%kmn$QVe<k5D>Y5tffdeLtV*&Z??Z(H(9U+OBf
zXc>OE5Wl=2t2V#GJ@48!7rT@qvBCUrL2B9}gjcCqJ*2~l#fTp+R&e~5B~Be^jMl9D
zl~XFq$NiJE#eJ<Q#k@MBx~a+ZKq*_Bd`c6uyw(qu@i2+=TfZ+SIZIDZYTN2pn||{M
z+&Nu2q#vLCFe0WFYa-Yk+VM2VQz>Az!+iC3&r=SbzO%U92gWxyIo9ld(*vGAG9Qfq
z0^+XOznK(l!Uj@j+hM@T;HvA<MIgNdP}tk;u>N%x$qWFB<;Yk1s^o7lcnUH`f)fO)
zgW^Fy=%VqA#iT$9XlSQuOD;F(yW<$7tTY;6ozEoh;J!dcUD$iDx-8Y6OmwF#2kggm
znMnZ<;=mls(wBY3TGk{z`9nLGO}~<9xM&1l7)*0{ePT|OW3)lr38tF(iU%D*Hr3cA
znVYY)#8lbnJ><0>Vp@6W2KHy9^wwol&w~935Z#GHbo`985hjXvF0~9QU+ggMSxKK#
zUJ0T682U2<)U^`S0^$zH+6S}-37>u`dq2NeF}hrjkq{UnI)GgUwh>Te<F2&(*QLZJ
ziiUL{mh=!hm%BK%Bi>~_Uj@n=G~(uMAIfNMx2fa-gEld*2VMA(;gH=JF=UBt1lIh!
z#iZy<u0dVP=A0m}!(v0qOBGV*A<d5>Tv!<<08Z&3>bJ-;!&7eb>B=eHvHpFpS(j4z
zbR*7tvTSaL^#{RaKW0dTIit@Y(LFdcsL8xL=IzjPp@E!^sH@${_-6a3wK!Cosv|LP
zp}pf>(S<tSaX8xEi<!)A;?u#lMtj||@kbwTQDc!y`_APCNormu3|o_3TLiPWC&ZhX
zQFq^#v43_6F7086c-l<&<!&oAVh3ZBy>7lecO|4Ay;#%gHJQ#YGv#G865W&~#>0dy
zZ4(rzH`RR<4f7bt6tu?iIa48Rn|@q~K*QTV_HO@Vl5-flBEdf2EaE}ON3iUUy*E_@
z`{@JrjX3B5nXT@6Ul)!h9t*~8tB_LR5tz<YWX2RsG_m?~B6*u?bZ)XXCHErU>^DGD
zVS1qaaqFIyZ22jNPyHUpV=3a4uR1IBI{PdE?p^rByW<nZ_!qeq>x|_j(5qupwPV2z
zLFc(-5@xdkWY*bC??(vr-EHI;OmAOkl==T&UwDq{b$3`=LT%C3V%!nHSdO&%aL-~6
z&*v#(dYuiv>%*x%4ut<ETPAjf+P4vx&S_pc%o5#gvg+D&!ljmUqIgV(zSS366pi&s
zbu?5L&uX+?F!g_;LT)O&dOCw}RH<@)N6vX*6z&R7dM%U!{qUrd7nQYa8z+$dvygqo
z259Tu`1)PrcFVT6Tt~@D1OIF5k%&iNGiX?O5!L_Z>WoBWK$zuB^%{lr(ixcwfu<78
zTUjYxxEdjQ4y=KIhYTS!RY|~%0Wl9|=zu*45i((#+!{D5%+j<lQ`)zuT>hBPR#?Vj
zQDd^<!rp70=v@()WAN8Lz-EG)Ua6o&F=%Ijs!&H5V0nd@^~v9YMe+KOBg61)cd0F;
zNj4Z2VkMy|%|Px9GAimgpz*M|*qgNbpzZeB2>z8xL;56#YVHqhWj=Kd;_3SsAWnoy
ztwO12L;_T|CYr@rj_LLk)m-GSdtkm5qx@XBVB>IbR1M_%Q58UcW%4C9vYl7BukdfS
zL>1|AA9&&?WI_=iP;u8*NW4Q!2Y5!hf#fBgokLwqnK;a)nUi?<MhK=G`;G7fF=UDu
za(5`&H~&K)7qXhhw~Dz`bItY8wN(4IKuIPOp4e;U98gDX!0#+q>tralJL~`6s=n~7
zzsSVqYAF5uuKrg7V7)7nJDhVeWm2Ou086Ke@3a0=Xc(YMM#aU-+0TxbwQ1#bw$0pU
zpSB=NUL|vT?##;Wb~)fod>n1XMFtVAc1B$Z6%A}}_q<+OmcP3^&{_Ju{8Y}<oN?&R
zi}^4x{FvoCMBo|r>}5{x+X6#a2jplVO(dkoaaP&$c##3#bY+bE!?=GB>hhZ;^H=vt
zX<|(*{Hi`kxv?~s5h<p8x%4T~=`<&1`qy@rk%%WLXhm}8^r*3`kka|Vu>k0d$9{b6
zpF}cCEGg4GT7VV~cpn#S*QQVFN;-sZFc-e=9a9?c-egtJd5w-82l{rn8AK=DesJ<>
z{rd$A*`Wj{H~jRCAZKs+tRSoIShfr*GnF?i<fnG=<cG7wde?4`+fNJDbaT(<%HBYA
z{m~7x%y}-JbA~D=35a>WZ?&AoS)}WsT^-)9^tv$k5p-~%GK2M^^=XB+bhC6%Y&6Ze
z)v`Vb{^{1^kR0=F`VGk$2jWj>&PK7{XLur32ir|F%+0dI4mGFyWwzZzhi+HHjeGi<
zKhC`qMAV$Rwvpy)C9ZxWcA~5qqaC+2xt-7*E;fev3cKiu_1jMuJJ&mn7Tug}{qUB<
z^54G*=+kC;8Blw;jX69%`Dt(teK@OFw`}H@*!R&tc}2WTieEa3slF{E-!F)Kx{fvA
zx<E1E+`KV<b5_|;pPV8jD(R5sK?&&&eP-ox!J${-#_ShC{elhReRsH^73OKF&>zt;
zfTUL8XvlwsCVe&Se#Qr`*m_)Se1dtL@LJ+}pQ~iB2~8F~h0XK7-|FVwe8mZxZMgBi
zF#N7O>ymg3h8u4fF$;UzIsdc@i=h-;8XPjbUaWEGeb(Udz|s{?7I6wFVGQ7A#(d@0
z(;T-4zch&T6=sfId1Wk?yCDU6s)r3jKc=f%tdrOcm7eYoZz*3oroTGjr4+f0f8k#E
z?|26A)c|DU3G}DB6G%59)myI*SHUNTdjYd_7Aixn+Dm;GHSL~<bK1gt9gP^6tIrrQ
z?gTmn#}8KwgPW|$Zv0R?{{XTKlrvR2X*G&S)<f|quGlLH-&Tvk)S$;L?!&hS3v2ps
z`KU1eI0<hLo0LaN1r_MV2V=8GP*@M8nn!vD>Ec?Z@LJ~VO^Wl(aGXIpzCke~tD<c%
z+Ymme6EKRm#$0<YJ$MV!IVMOpkMmgdbmEv-${BEKHFcSrkXn!D{e_spel67fiOe!k
zm)6aSyALa_8wKlbYuf~g$fp@BrUT#2L&}XpMNekWVyHw^_gk>%^M{R(hWVE2XWWU-
zx{@F*J((M2+utSJ$14AWB@rwE&>1_yvijYBWuKZ2jvIhOy=cwF7GMUJLn5sK62367
zBKUB4!I4a;ZSk*SQD|S2!!!c{XoMEg5+o5W8VD--%q0}bgSVF=72gx@1&aPmLcIo`
z0L-P@3?#78E7GjDfbA+HP&Mxs<^}%}E|5nx_u2<+p(Fuds-pxqR$>}BAJ_m;`Z`b*
zz9($iN7&E<LhmJ60_<O!FR4Tk+fjCs&Iu|tOy>N3;jg?mdhjtvh?Z<e%dW8w@Qu%*
z>wltx548||ZvzBY*ol|iS8a)fKW7P|ZPHX=uW4Eh$%}2Q;~8(P;>{zz!1`VNSrmN~
z<$(4APr~cG@RTs(4E+}OtTVF9*ulJ0n@URS`(rLUJdz!c-b*?4Wb%2xz$wTP2Yv7O
z6)A#b8rcgM(<d;wkXdLxiHB)2A;QK)qr6~)%SEL{5tmA8((c&_0Xx*5tnO)2mzN!?
zz-Kp;!14*+5{FA;^h*w#&}O;^D{7`)Fjo$%;Nk9SZdPj!=j9m@UgO_k=jfZhQ>FLC
zkuz*ZJ#_oc;NJUqf-MXgD8+8cf#o~2dD*L-xzUgNPM|PUY|57<Sn3V(D&$kO%0E!n
z7ILH-OJ9e<B}4p27zDiMGj1l|tv9oKDQ9r`*El>Ff00Y(k!86|otwsv-DIVi!t059
z8I|_7KAb4BBx-+p958Z3Rtc?b;Gg%b((`@Vp%EORge`Z-`&y+S1(eVtqQXr#-~ZAh
zx<bMV=<cLN6nBq5eo6BU%g-dq1|$C5=hn}z3Pb(FokwZZe+<i}kp3w>!qV*F>h4^X
z#4ruDWc$=$8c*!Z-UF2-fHvpZ@!RnfHgldW$|Oo%Zf7t`I?x;;Gp)LrtU-CbHqdIf
zsZc5yRa2Z!?#VJ#fa0}OXINw7a4uFE*MRlA<X!!b{M*C%_K6xx-tH^4O%`g6^oEN_
zXLhY~q|hMG(nl%81&b?-<MrAAXTwwQz~KTg3-xCXe|b8bbLX?4;(J5&?6Juy1DR%O
zw|?DCMWGvvcRbz5sJ8aRq0a(@!D4^qF#7XFx6DJuYk(^JP^+2TPb8VxWo7O;A59Ow
zG6tS_lR$SA!Iol;N-=R$;~)MAy*nR{AfT6$NnA86nZ>NG%Kwj_0vM_u!?sL<$GGXW
z-DxbhRzRWuy4r4%SNL+n<nnf@p58mRnq!ZPR2l!ig<RY$k~zc%2r(9|aqs+cRr2iV
z7&i0no}%dEx>Ydrq<Nw!{<w`mrp@*F$(0Yxc@}6|NAHf4ww-(G<c8mOpyD2lhkv!V
zX*1og``S)OPS(?!w#@prFXNEgsAl2roKd9t10AeSK8mz2n$t!7OJ`WrGUv?b&hMaz
ziJv|NAKDv2aE~g^&1X-)P82))6?|Vf{q83e7T#<)(SwVFo_!y*#6JcwCN#wGZl4`o
zvYZ&9660I}BIf5Flxh7<QOg$FTmdMTXNg8<vZDyQV=Xz)r`yOzE-0p!k2DA$q_wZM
z#j0%{pQCgJvwy)Dj*WqGcwK&j@};JuKyvaFzl>z0&x;ay13Hwm;e+e;O`7(wqOm)o
z$z-nQ0{(MV`>#=FvlD6w=?&cM#=j#^mgy!vgMX^R+xp09d>cT_ZY=!^^4LbbF?_a;
z>r;jGud4Y=>PsS;AzJFQ>;8u}zrnn}8z%576zyoJDGwnT130Yl{sSQl*lR3E3c9H*
zxB+8_D0_n*2Lbo=H3}#O;R_)YuE4UQP!;g%S_Ajva~hbU28ku;_2ZE7x<^GwE`S9x
zuK?;V{as)h`u@CWQeY2;nxU<MYpV3ATt?h204ol8c8pkhBOp&Al%6`!>y;VsfNxPm
zRzr|QyD~&Pqra=B|9~MOoW7=<p)ss+IKSO5V?F-4CGeUWuJ|-UeZIdnm=?VFKG&=(
zyrR2W7pwX5Xt8)sTFmd+ZHTz`TItf@Hg&@q?6DmC;Dv|OyW7vVG~W<6QqZAhCL6iW
zZ|O~jFi-O`;B=kfmN!Wp%pjho*!t_0UO|+u$fVedkN#zYj(c@AZR0f{(RV<I)PfCh
zThdk(#aM1P$4aXP9(lXnOp5E4VGT){(SvzEQW_;`@DCD>Zv`#QUP7M-)Tuh>d0J2Y
zP=vC44jCTJ4S6$$CLaS_vV01?o#3?XK-t#*qt9cV|DL|1sV}Iux`I-93wVRBE;>(4
zUU^vujRC=2Zw);tC|49ZZryjq)%udrjpc#OZ#R@<yx2JEY^`c|IuMr8d|M&dEGjoO
z(jG9AYc>PZpc!H(|22;R&48IRAtFnYh{R$Y25!p|ZD!qIlAO^vD(ilJ5@(k@_;wS)
z)^;YrVVo09DW>+pOw*YdSFZ00lMsj(%S+wiO~8$M1?~WSIM~|Us5Q#SL;PqYT|;Sl
zQv#~^wZ&F0+7Dkk>JtD0rE-$n_D3EU&X7W}JDWiahgbQGc)4z9l3F0mAW)n0TwTix
z_UwmGH<);LlTAT{A+0_^rccp_^TGR;HFlGBT8&OdMQiwY^L}ln5hP|kP75mpF~>A$
z&-ty`EPG-{W20R4$~@Tnr4b2l&l)Nux>X;4UqLdBgK<>jRMQ(YX_vyJY<AbWs@!(z
z6v^NBKFcrCHr(gk0=#E7TgslXoGjoE?~<BP)6lmYbYnQ2Xw2ZRpbp&+=BPuTJuer6
zh++G`p=YGY<yf-OS~U((yQ!QYjjgJgHsD{HzSAS0gy~fT;`}#SA(;D<xJwI-Jk%hX
zeY^xrF@qv02Ql#1i7U<_EcarjFR??LrRjrldD32(p4f=Wy>c0_COnk*$-Vb$dkBt0
zs{?asBlqk3`~aoSdy|%^!)7?pxcdUDmZZI%wn?&><H7f_iGF#H$m9%iZ69r^nu3f$
z;(0GO6e})PYS5D0J+UsN{T6!dl+I<#6SXaCs%nASi2%6+z7f?DCun!fbFC~s=8=CN
z`0#(l$fG%S3Z}<cEV>Le|KppzWCCe<Xyw>~kXyH9UL|nC^mgYb?Wc=u&vcp^mzjHc
zr2PPx%e2&>8sjUcZX&p`eqkxean2(zDov2$FqlNK9|GeqPGn|OTs@(@Kf&X-C?L+*
zYW!Vn&vCYW!`(mm@xS`AJ@^;zZA!;4jrq%0M_Bs%J?6{fN<;Q@Log1|@t8$BzHfrL
zXz$_AxR_3n2$^9Dus0t-b?D-q_^DF)g{bPeAc;ZuxEO&CXxAF2G^jVAlr@n0IS{|+
z1`z$BS{cf~rY(h;z%eL(vsUYt8p!?)u%Q#JH!3%k%IAD}BnA2<{rwyajg4`!#dM_S
z2=oobL0e@Y_K}sK#f9QhiLR99Iggxf_RqS`_(p8&OsI7mb^|gp6MvO<PSiO`LmLw}
zq?xNWe?($3fbw5;w2LUFriXhpS`CsTcM?%P;7j8|P&jmdK6lQI?<xnoA!jdOy^|#m
zfw>%RQ@9V*@FE7$z8&J0ru}u;Ma3lZ+!75exzylZj3HZ_L`q1(YD|Y6P9(DjPtiAB
zs6#(@X(->`PS&8Gn3`K<K0lG?FSJUZLwOV8;ka|UDG^x(l$X0K<5F_sk&^c3<VDwy
zs1tyzhW>8Axm9DB$|$Pp^+6V=TAMb!V}JQ~{(Bg3@@T7uTspo^U^v(LNeK&JPaxrZ
zXBuazHX~)CDmg6|m8yYkjL%->IIn{;=VkmAyX7xQ$-Vv?a$uN&3Up6KjioF3wY`k)
z9b&EiBb&Tb4l3Q4oPiU>+XwnQbjR`@rhDU{&aK|~B(KXO`X4_=;%jwz#~HE7M^V3u
z^HsueZ1q|*C<=#tjdG+5E)OBzOw0c1a^}y`JKfQ5JYbu@K%H~$FykfBr?zcBb4HT?
z%K~`)|Fu3l=B=FR8N61_ho;t|1@-`OWyQVbVR(axclU=v2twOwnv4DVkB>kqiT+{L
z#w>vcO<8=19z^iYZV6$%5szo8>@Lx2po&AdyniS|3>BNyVzT#0f58c}C$#V1OqQ`!
zY!*VutU1=%YoeqXq>A}!04x5bS}mlqW*)Q2!?{`T=W^auX=-X$U021m)zWX-KWoU4
zpSS?8_uJa<=w{!CEeg=X=t=*NM)9uzFxTwoJH8@dvtjOXmv1C(eM>%{nHY{+EP&$R
z;|0^3q0Epy+hpy*v^gGaY4(ONerp{lSbutXRCbr8H%i9`9fO3ouP<6PxZl-~BZd^b
zibTXTs{0V9l!Qs)8TTpBP@uG+inD;*I*7s(p|j<;`R;P5ktH}UW2>T+*LwKmTE)OC
zol-qi{Mr#W26{bI9Z!iDahh7aKTf-p%`VC^+*s|y?Nk*ci)hBaHG&?GeE*U9Rwh`H
zfgUiN3GEKneyjEBKECX1Dh?evYHoaChpxt(HJsK(lc*$&Z;Kg8K~i&O*d0A&ejG>q
zh@gGGEoO<*`5Qd$5T7&=c+f1W-A9<f?`q{?moQ|u8WKZw>g0*M_-FbMrq{GQbmq-Z
zH`nNy*(GD|)KW{r`E9=<wH7v`OvW=}htgrzGOzq$g^=Bg&qE2n21LDC+@deD=w;CT
zb>N~Y?C$IyGM=&ZpYRBx^B458wuCPJ{99jKt^NJTzV*SCAG<+P(T#1s-?o3#^U&e5
zG@@ioz;M0yJCPVqNee6zXt&tKp!cy<OStbZ{U*De{1K1|NuOOH7ox!npWBdx<h7%k
zGQnb=<t$)DCkP|h5!Uy}Q*O{le}b`&I`_(muX!FVWCK7k9QQZ?={O7IWHp?T&Z1LN
zC|LmtLwM2nH(zBC(VYgSZdfk(0wNlO1=GtWLAw}5?dirP9Yx;+IZ1PFWK;dVyE<ka
z&I1tZ?Jygv*N`(62AT6<<(=pnz{Dll=y|N;9*g^VL90lUS*`43t?R9e5yQ_`8&st9
z5fYfM-#WDvf<Tb?4rkM#u_>p!#Hj#@6|Cru(#BH`b-5xSpV6W)W1QySLFkZ11;j~;
zXm=};<f1!>XwYXNKNTWGD_F;RNPP1?N+xz{p!h!Tkq@OdE9X7H7LP^gV&UD97#=|w
zH4c}<O#0+#1GE37I=F}LROW<wHQO$^gwPQgEcCgwr_pWyy#;t-=7%h)qz=YG#tj_;
zFNbl%LfutBz_I$-cWj{YR0Z^kf*lV*&(#bo(t_r}GUnZpYt}#A+opzixpv-mm*x$+
zoQNCUU%1fQ?@zJw+5RSBp)7R8T=g&nlBCmH3~Q%GI;hYCIWAjr2LbiK$bG%*!C+&4
zCNfQpPl&44`J!1c2O!>Rd(P<b{IcZLa$RuTRaf1xO?UKRD7i%|M+L)eY`c^k)Pnx8
zg+mrsq!6wTGBd1oR09MHgkN`#7QH9x-iy&6+IOaH8w11E=(w+mmsc=)s}aeD_uR83
z-xdHlcl<-e*moLOink=eUu-D$MKML_90kv?Q2qVhM1GnEb|r<6=I|hIZM$iBWF}XT
zX1=QB#=%@g2LjE>)xR=>56yIMc)52f*lwaGdVIw7sne$K8$-nVGC(3Y*1%sJ#Yg9n
zCcB~Wjzul`)mP2$F8(gxGE#st*t*m`)`HR*&fxYRW`jqH*;Gi-=YLd7KtsF?T%&Ot
z+Wl5c<2O>6%}Q3bQx|aNx`8X47+0S7I!vzGD>_iIXa*#n9%bIPeES2-ydix4tb{G;
zYwO!>U;cnE3@UbdE;FGT#HP`N2lLhG&lo-Y52nhN6<oJD6X?3}=7l8CDXEErQ^s5J
za%3@zUK}+Nm(Gt(IlgaQ{MCF(&Tc50X;!(8F(Tx_bz&T(#Nzb0jug6Bd5CH^+ShOw
zP>-|rhGcNNtH9Zy5|FQ%;iPlvw^3hZOIRdpowCdoYPfo_60&(8KZ@;*H#X{C@V#AO
z!%OSt2*JfgT(_5W*l;`?_U^+9#a^x7`-B`J%#z4rsbp|A=n_$Ik=-Fb=CD*fpzI;(
z@RZeFWz+kNH$wO1pow?)$7aSp6f@MQ)rsG-FS*^ub-3kWqSTwSp)a~Xa%Y;&m=t&9
z7~8`@yV4DMNIO-Y2tZDMSD^D><Y!sDK?|6PR-P6Ro)BJK;|6dLt;G1Js6Cp&s1cE%
zS@QnoL{n-Ht9*#~lYWl@gs`y4K%cN$S;#KK<xrnwXA)^_Q0%Jz^M-4}U*ps$i{f>j
zZ>rHjFF;Aay`B88xMz@_Wzn}qe@VmxgfCKbIL1BC;CXOnBO%%q`HcWvM>I4Yfbc@*
zLNDLj1bm!$m!Eb7l;Md60A7^u{N;rrVHOe9`vT>Z9MK+W0XHzD3Lu;@&@fYSNcupJ
zugO1FIin=yIL7&Z`lnF?8k(}UAMhMtfYN7q`yI<!3SajE{UM+vq)F`7XvxbKNawCf
zsm%e!>Y^Qj2{F~mY)lR!@Iq$L?m;U@^R+QRVvG&AE5{LJHFz6--xF*@lC}DbL20D8
zti^6db|c&5)xd4axW{5UW5_q>8LfkGo{e>wBffM--ssN>c?nvR>-RD}QdFW{P78IT
z8_Y>%%{$!8ItziH4&@0h03;GV!4~`SqW}CRu$*Y2PRDvM761KR;ngE5HR-1}GZFLC
z{lpZu&an3=t~MK!C1s<rtMriv^R)p*vcKfy4CpfbxZ}p)9<QWVp@hmQbVMr2&ufqu
zg^UA7nhmXs?9iK$<7H7`ye<>g3EXdA=87>&=2GSf*>6Rn`S;=hQ5~)_M}WR2N4)u6
z)|zCxA>USM>FWx~oiBWfJgGd64Sd<Z@jHUOHXquZ_CqBn6XhJjUN$Xi{)LF%6*x9)
zkaouRJHrJdMvRRE0d1OsVlahj`XiCrK#=289i&~_z>4Bk<bXSwQ*L&UhoS66LxR8|
zsNWhKicS9NHFTdOz3HTntw}XoaJX4=0W&9}?22KJ{oQ@_ZSXTPcl${TPOTUQ+rZ1S
zO<YNbV{xf-k0Y)a&gq}V1vQSpGpyy-YeEHKGkr~y&Wm0bQK_`Fo`w4HD00G03I(c0
zMR><EH0S-Ct?I4fVhp{;jt}08qG~Wbx3Q*Bq}@<Zg_!q6f#~rDN-<qyfs4hQV~zK=
zs<7``U9t2lKfo$$0}1WA@=Q0FWM7Db9zoB<6Xo~-g>m-(6vl0OfAJgtQ7$e`#6@RD
zNj9%amra)?Ai6Oo-Rmg;x5y#I#c6YxfTo7~>9X%@|HT6^sGwo*Q1f$|IHh9`f_AvP
z1*V;A`*rzfrsC6cz8sg`tt`?7+0IQUo^Kp8o}(W(AjbYk|HAl2PQ>>*!`KD7m9;MM
zR3iFo?k4)aPM2LlwuJz%XXrRV{F7;I#l@NDzM#7IqvQJm7HVHf`jAGTt2_~Oihc(@
zVB0_n?Si;Q*Difr|BB@x<#S$uC?~;Sf@s$DOt{MMznV025zbT!uE5vd*-a`?N(uJ@
zKu5lkzmmL9(bs1grvQP;V4|8HT;pWyywi9ze_Uuz!aB2H0@LF|;H&`7Xzj!N)tV42
z9L<mSCn$J#8eeg3uSeSD(w$ok)hLBMdB?UC`mF{bCHwXblm{+KmK<mNM*t{eKc8yy
z4}@8<H2^@F%<t9ihW`YyQOKY`pWpEtYL8w$pw@1zaOCR=WXY(eFWHi>Q4kScP_P@Y
zktife1!7HGBoq?S+-;O~pT~kLK-4ccCl`rWwA5MK!2+GMfD-0ih0*7FEE+lR*UzXQ
z;pmdY7ws`TLb0eH=+Q2uKvA@~0UEJjgdGA{Hz2w#S_j<R7_TvoOY&zTm|^AcYYejF
ziNywYRv;=>wO7iJsm!pJ!*ZpRipIoE`}d97??Cjg88#%2U<fAFge<vN_Zra_s7_iO
z^b_z(@V6D&Gy=f4R-rnrjKCg1rq}yD`5H8PRj*bMTke<uX6quf0K}{SymLHnn%8%<
zw6uK$Y_PTwPCO(Z&=`BW=}ZzCVMvWEt}X61rB8tB$oMDUAXHk&z(cHXdB``zIBb2F
zB@K=y1Q?MxJnP+cHs{)JzaZ3cK_K{BvPX$ziq<P~hLG3ev$|=Wz6|9wF<J@olCKEv
z#nC)xUzCH{aW`PS6xe_uV(})+(5LWNX5;7n)`|B<=mb!oFH5Y{0vet-F%pF`-rJ?g
zKyHof4aSCGDv!51KaULk(&t_}#I_3W5m$uHIe$TqhbBdnW|yzPwOmDdi0)3b3x<Ya
zL%{HKG5u@2t^KFs3tPsV(&nIHoYPO_Fulg<-p&5j@3NR%5lXAUaMO5(H#z~^cgKRG
zN%0-91E$accUv?p#<k;p&D2UnHlXXdj5vvB;^)+R=7Mmlm?HRpg(K~6;ShTxd5~O@
zc~;}FE9-Mg{Nf0kX6ndCps5Ql7$G}uZ_-}lB9%YNK}3Ced3x{+CDgs~B^?}ZzFD5S
zFOAdTW6rpbMQzIachvO!KeVeSLI+%j)2=G`%={jqr&(<G0EPNj@egSJ2LUNqpi9=B
zBTDDe8h2k_69dN%`7ss0n?h{3$O9Rd4Jm`t3i%o4%~>@56|fPkhTduA>3vj+6J-bh
zufspzpt?QWYR^?XgrIqfaqlBIUmO#&N&!(v*?GP3Cy>Qfw=mCd!Vmjpz-UVRL%V=#
zvp-Eu8`x5qWwo0uS}!8`+s?KDo_Ck7U&M8bZ@*@69YG6#EzUNE`j-`Nn1wheRAOnU
zV#q>9f+AYu=l*y<iPx5fj#jL7z0tTwI?<-SI+#-wbY9f@cppZ=NaZca>X=6#F52`I
z+p^r$9>-o;^O2A^OxbS<)p@I@ohHe&0kZo=US(?_Lkjt<@h7DkXmnlTL4jME(!R=R
z++V<Pc1<Ir;B$O8E(L5t+$X?h_jEJ5r1iN(&Yv(1z3as<eXi*#qgbIqEnx)pqSFZ9
zkYc|OOqLl&ket>_u6aTV8Uha#5H^ZhRe4^Nz3IM85QVz%TP+p%#r6$#i46N_<?|dL
zCB$^Eza1|%Y(GC6X0$;R@ztyLD%H9meW{v|yyRVmMZ}UEQ+WnaP30?^5Q9G6BhL-G
zlA23ou2eYPLr$P4wV25l^Ul_`w<Y@FwY0|wnytoSQ~c=110I<`%l8@)1($o{b-oI$
z+D_|9uXnBq%IavrNH<EVwV0<!zcjmHu9Wz#8Rrc0bU`6#JDO8w`{!U*t}(PJo)P!L
zY<Pie*8BbW&gf1|zwXXRObD}0+sX&e70Ja3(c{rFHO{_Ne$0I3xaazAk88-n9_Q8u
zbvEdf=IXT)J^vcQ>$#*tkeLaT0nsF66RMk>H0eraJ`CY_8aRW>M?XI;3>Qt~K0aHl
z{kcy$ZJAQJxpQ$K1Q}uji+$=;b-5NjlqiqEq4q%Co)41WqI{niN8>B);rlkavhr7Q
zV0OgLF?`6TU{?S4AC-OR(XJYAqv1l4TKO=bVJ)nvWK?_1KHDA|9Y}e*xTgffu54(z
zRsm*+y!#srg&MnMg%2BS$2np3n*;hr=4mmrIuwG!68!@geF+@$6>D{(cFxN+QAhV-
zMlxaW#W-<uIilriSJYw4rJU;%0{B&j$U*E5wiknpm)AL*+vwGk$iwZvBLC7k5>9$k
zR*x~gap+}u*MDdnll5go%Tt@wk2^*Bh@nTM&Q#=rO`#?BwBJ8bok11z0?v7S*^MHL
z)@q~9+wM?n!G7%53z^%Dc(=AG|0yjWD`6;|xBXuXqW=!YPl3pwPY)sf<$hu<BzxEb
zSP=41ocj<|k`;D>4Bm?TPi{CyZF(raOSsvs)Dr4#V*ns_mL)BRn8zgf8vGI=6b-L1
zMg1k}DL8>JmIV}{Nn)uG0J1^?zhYjI>x_%R`vi~nI^9s*B)SyF<&nW@ONE!DGQ1()
z{7M9+I|Ix(eCB_!5IzvzfKq+imWa>brs%i+qORT}_*4c`vHm<@v(MD1Xu@E;h;v{T
z`Wm9g%SDtm4;aXq;OrY&5@w9M-NT}Vm4USlb%5ynOPIupVwwOu5vxw5-@8A$hq>$<
zZ!$ZnK-<5G8CAcjXQ}P%;Yy3ZG49BnIgv#e*4iaE+I6fxtG+5@3Q(nK%;<^dDZ-@!
zqr5RuM-gHQXvRmyJ&1S(kPsu^zmW)0k9orTgk+a?#|v!lE)Ow!A{*+q%sa!?xXn(5
zYW&+YekvN$s1q}3S7KE=tYf{r$R9i=U6253P;R(j8&`l3-x@oOfc}^TUs!E>hYv%Q
zzb<$<`H_Kh6wO=WJ?xk58S(F&-#CYJ<*3IJY|t-oVr619kZM!iiA|y-1>I<W(g+p~
z&P08X_|lw`8!j;QvIA){$h_|MA^tOYjs<^b*F%A{KU8bnl84x{{)-Y+_i@3v6c$C~
zDf?q|ZM68Iz(E0}0##hP@>s6Do@=s<FWhn68Fb|YED}t1$7)H@ln}G+CPI;5r<Lx4
z9a@jRBwl9Q$``@Lm{8pSBGwjxu?)H;kXduRwP<f`X0A8Zj?K9uWx%4-cA>E#Cj!ls
z6K_YdIM4`A$p_ea{15A0`2P=t3}K&e9v%e-D=aEqON`s9n2N7WH>V1N8TDS52gQ|6
zOAYzbvu5I=l5Bf`nA-nYrz`k)fQP|11S~|*O4>g^ZTyw3o69~?w+Pxl75vlVJ1Q<U
z7wA|3%m)rf!!xW_a%UOB+!fQ{@=m6daEe6!z|y3F+=-Ad-Xf!m*z?k5khbO~L&6yc
z5hEt$m+f^AH=&4?!`E8JePV+Oo`btr03BU~$|-l6`1rW(yf;@LK;f<Bu>O+m3z>fl
z?tz`pTrKWo={h;*by~N}GKAM51aXx=K#Nu9hf;yxol1BUP7Jk>&46sltrfQW{_K1y
zhvZiYY7vV_TOy`+3xoFQWO$9f9dayJ#`+A~1-adY27~3xFRfPhr%JTurRk5oQ9dMc
zXd{d&fX!kk=hV1ocTo!81u0Fm`kAn3GGQHj$58h3I9O28OV~krg~;R%&r&OL*wvKF
zRMC#w0W4cZ22loX`!$WItpHY=dn{P;w#o05!}EB9Q~7Lrzzo(jX?}!Xqvl={BQe)`
z{XR|SCwCX31l5{%18=E8MS}kmppwjn*jTK8ADsB^Bmb4Wiweg2i_w%3fvd%?I@K+V
z<Vr-NmLt8;c0G7?&Tjjtc_K`V79|8pBn&P*{I60&N<T1}TYxGm%>Lvgmd<N_k4zC0
z@I0MROyzdRI8I$p-RI^_%^Vc-cFUfwY*xi4=eLTjI*ayeygJJ1!rV@iB|Rx@qJQ1f
zO+C4S{Gy9tmvnBK*5jpXW`p~o!tuu78-ND>Rld47Uu>-lTs6V%GNBi9?8v)3nkzBN
z+4?QZ?$aTr&&iFo+g8c;w!@EvqS<|iWP+G5f>zTH`<y=-Zp4}`dJ#Or3DdZAEHYSQ
zJ@CvlMrOF_(H>4-Yc$J=_FnKW1GTmcrgxSTJ!wCsnRL|5wkN>}n|W1XHvax{k7L_=
zB6--Be7ITy`*iyTN`AX1@Sik<&K>{=qDnU1#DEvy|49hbbaTlh=7<?@uN9|wXC;gP
zqzEIZa3O`sf&}9@L6V>sV9-OnF5~i=|74@+2QY~F6#3OoFBb>Rdp9p;VbS70dEGG(
zOZt6qtZi2~kv0X0QyK@B8QQp4C)!Tugd(m)CJk0Z=s`33NHeUwLZD8+F@rl%4?TMc
zgxf`+a{KA5^Z;d1v*ptbAt|w>?u0*<5DkHk1O!e~Ml3d9DAW1Y*wAEi@*6^5AoeKZ
zC}xI9Hlu=c0^+wY#4P0=`RA3RFCChI+{OmTNzQx3i89T63?g=e2~gD9yRPU%a)%&n
zT140&GA8jzwf%HtgN>li?Rno@w(G9M*s!`38pJkJNdH3sDg-n}B$9g56ec5Z;9moH
z-%6W0q^)U%Vs>~Bki|6QaW?#8QDQo^1D_Ox#>y$LJO6~rIK$hP3ULkTaipL7AX7us
zqpRRbnc2BjQC{V|Lr-cF4|&&dsCbZ)8FXfH+z}f<5o<u)lO`zPer!v*&~`b}G6smy
zMjju$qwJPI9avi<p|vo*@+3BmRD)_qd;E{<w<>eBo`TCUoEn#cm2dwjr?72;27#Qf
zt}oWAGhmU7Hj6kgmE1-g4guX?b69Z)Vo*zFNUnS|{Bv-Sl4{lvd!V;H>#jPD8}z}w
zI7Cm>++OENAr(vT6ESQCJ^s5!U&4C=#y2FK-vKvDP;mhv&U2nf<L!2jY(RoM)_Ico
zMl&d`o`W6X`7{4Ij{KBuFrK{xqsf^WO}*c1H4|y)3~&EBlGpMk$8RRQ6M<PEWacYt
z;`rwq*L)Ew8Q`pEH>}Rq%<m`VS<x=>ER?6EAD7w4{V`djvskXUl_uz{QB16Y<>Y7b
zzp@NjttSRE{o#VxYz&Kd+HQolCm!^OUeS3`r%{YhnGH^j{721!p9}$`hdPd1>mY1q
z*-xVQ58K&BZ?Wo1VriP~q|*MeD&a(-Mj8eQ#}9xibYds+sZ9pETp)!GCbElEJIu;O
zg%pLa-nTpRgY;E-C8xt&Hoelw`R(?;vK3KN(bTxl<D45zO$SbzUvDfk@<B{vPuZ-k
zcn}>q&N$Tma-$?66x*W;dy|Yk*jSh!?9P+ktvAqt4n3{m^YMP~%p-dQ5fctfU-Ev?
zw+JLz^81k4>fflZmt#i}QO@)N!H0TA`_AmZhQ;Ja>?^k9gdwzKMHQ4CO||5#)qkU7
z>@^VK<iqf*TNosGM#8j*@{Ij$<qMV6om;Ud_^3?ZR}lwYdfQ>37q2x~eG1ur?b4jS
ztRe{cAzJ5L&=3N;rtDbBqFNMT{TO$GXOGgEGnfP!V4)Mf*tfmSs&rRIk(>ggK@e@~
zQ$Oo&TFd@MM8!dvUS!w0=K<q|U1JfS<D9ZV=e*fnt_m*=@iq^!2rGVUxnV~(8M|R^
zfew4xsA2umd1uZka-F?(r879%Wrli~Xh1Bv7rn%a<Lc#6%-skzPt)k+z&a}paYVEC
z<*xPr<Lj-WqJF$D(4kX8x>Fiax<NVwM7kS6KspB)kQ%zXLkW=%fdQnuk!}zW2I;Q*
z;p^{z*Sarv@i2=A9+>&eIcM*)_dc*$8R8Wcj}{-F#<biKX0o|!;dUejdU%nw$r;`+
zPvkvM_;j*o+Ayj5Y1y5?1ynqT<cnZ@liKOFUyq26|AsX#M|nDLhwy_<%5N-MkBf3L
zUSKbc3MHkTC*x`3jjZh+i4>p~^S2b8`f2H}CXy{5nKzD{bB`o`FqGp<(@b=`N$yNQ
zK7b8b(P#tMbACIyY>|4Ny1z4pshO9DJ1BStnIxyUyEF}wENX3?ZkH=Y(wCBQci#Sp
zrNt@V|9JtluxuplH91T6?Et3rPEB{sggOp<wuU37jwESjd<h~BE}k%Ka#07;V_AWL
zKMC;bbXgRG&^yrLXhEMz%RwyMX^pR%eXnayqA>HAHjXTx#B`YJoB=<>XkL#7(>zqr
zlmQWN{H;9(vmhtTD!K*ae!PSAu=1^N%4@S=-?$^X7||kU1;Z=#mw9p+2p-5>3%Aia
zk%vo78i5iMFC{arhEl!&4tKV9UjqCmxQ-Z*J2u(3(4C%xGzNm~5!@q;5hX*6*Q5>N
z!g$XRuZU{!<TKHo4L1%7v?~ltfA+7Ttos5QY2`puIvP_0$~e~hUZGpSO=JuBgfYk2
z-1Bt+OJgaJjxFccPngMoV;mpk8smzkhmH^$x-#i_w1`nN9ux3=-Bv*3>swgzd-7jQ
zgZYhdh9BZs8(yEL4XO9}I-t{Rz4>rP!5tSW8oY+@XJ&AQz}*pv=Pk9C>>4eoV5v+=
zH%R+|$FUK45$d;&FQlC%gAHoLNhpi~oJEqlYsqeZY=?hT1%40n6@zpxmdhr?5JKk{
zk5KR;n}JAx(huK_Vl);gj`AB#Ya|hzh&lAja##x>VGZz+i$NOT_y;yHozer-X%bHG
z%e15P>trI)OU31d7^KXCu;4L7JQ16Ir@<7?%o52K4|tw4JiebI<L)=MQc6_gCf1AM
zeIf4IFa20tXP54*4q~_gbNO9zW#50x6t}i`o_4P*DBe)|oGxK?x6(%3_?Q%|)FO9#
z?5|{=gnTl<H1asTJk!l7iGjipx;qV&Mug1>ia@3fHZv^r6J?afqY)%rW=9Vfi?%C!
z+}H|hhx@%a(EIaQ4H%UTZlPbX0&@-sFjhg;x6a;5=KCG@516RFe-v+x@=?Wav@5Va
zcWOL?j~Wl2Y`X^9(>elCwAgjkpPt!49!7FS!nD8ZuTR6&ya6iIR<c};X=eBz+(M}T
z-^Mo+q54SjhvkItZ$&)j(=jmQgnvnFdGs3@;Z&oe+TPTqMg&2o=PPp;#O{s8xnkIX
zC$@(%E%Nxt*Jz5}OV=G1hFJVmPMw_LoGZ}FyE+p`fkXQ^B3>IP3WrZfAFd9E$)H6B
ziFad}+ue8d0I@gQiC;B$G3qocd}YhtJ@^G(630r9Ws3!kW{Z65y<IUA0)d9omd7M$
ziUG?w*&Q@3kiQMl9D(rDFE;z*ms^mY1EgW3%(iS1T&>cZ*9ZYZK%|N>2Mubc%;L7I
z8CrJ%OfvBEAOZD;M<@U6wkx;80-><~T}j6_?jmVt0V&3rpQ(=HY43T`O9%2~zx53o
z%?wXMZVgoGvDK?(^5l@$3rfinUxDLv8Z#Vv(^rRp%f#kBR0aO$Dx)dG0H*(|jMuFn
z#PGORzYjmJYxuHK_FI|dcE19pQpDpRzgH!b;_mrtBp|}VZeS(*c8dLvv33uGoWC58
z^%$`>QAS7Rk#%z>WU;|+N<Uea2#@`lnetxpx0%V4<Zp9Gc2Yi%_n4aXCt>f)r9e^u
z*Yj~;vC&TCg=&_<?`(0`(6-gO^oCE16<J?_W*5D8Di||=EPK%WY<DeRnwZR5vb+go
zaTJ-tv3YxoeK?((Ld;<}+)`x72&uDeC~X4n9ve5<qr~o*<Pmdb_#n4;3JsSz&eSxn
zjA%x@8F&9U`zl8yPNzUq=w@@!s@7)Vy34u?i8G+;K*X)^StdVsz|jkT57<b%a?AS)
z0oV8a*&>=h6vCY##d^qKg{w{RvoLJjJ@4TQBD}>?4FRlxGh`(Fc4OE(Z}dJ9^!9;B
zLho6d!~IH<i5RLyV0pOxp_cGxB1hITrMTO>5wzsWck$dG2I+eSv5rdOrK5Q1)&1l(
zOHW<{{)@r5@DL(9Z9i%GSZejz*-Xba*+Yo#04V#jb64-7&GN!8IjV5MbBr+wuST)1
zQ5W-WsOs!Bna53|$(IO&D<HAB_B3PqBR(W1%S`eJD4F_RTt=`wSO>q&T(C=fwtRA_
zEM2xpGbedm1QP1ALK%$bWm|1XVA~Fu(0fa7HD#u)gN3%Bv4Pl+E1VP}?@P|itcJi7
zQ=POBLxuu*O=+OX005Mrs`gujk%-3kJsOHJ7SY4iQG@>P>|;Rt!sM!9)2a!c#5Ha_
zCBbQd#D|NU(Mi+x|NoF6u677Ou7sOJaL(O*|2Y0nagZ6p6(E<bL8R|s=lGe#f`mW`
z?LZGed4X#xg-}3GBg)dX#xO}r`@?A+F<aF8{XH~zc9<Q8_=xlP1Fd8#93&IWJoB`h
z&$ARZb_POR%)ekQbjAuG@Y3T5*{I?42jle1+laq2L6ys=LAUKkpg93qFEu*mo*ZF}
zGrJ)O{*VcOu0(Sr>UAVZRf3c$NpnW!vUW`95NQ+_CcZ9dH2sEb5{guWLA@I&h<@^>
zKg@7C(Sw!(ZI=>P?r=R&#Oou9BYut~SBFo8VLZk-Cu-g}6Z*{t3`7|DZY$r<t5y~=
zf!iO59Zb6}O?j{mLMIkRJi}J&03Au`WPx{|N%_s;qXmq*{0w^O_L<Ta%eF3P{FC$x
zjx*fBBAhE(wQgCHGcw<CG>4x!=x^50!i^@-cB6c&6O;0BPMpPldb}q&fQn9_aL0RY
z_CC7-VvXi0dK@fYS1*xPvsh;Z!(Y!>sp+&meB%Tb)+LH*DB4`foEiKcixnfYGp#_!
zvARKoj*KKKh=DKp{_?bNC~jVJ+ugWTHhjGVI1v`m==2|xWAHHFINE)&+I<4Q{grC-
zhAU}_>o>Pdq14=o<7dFfGDQ?B`KQL~kIN9>c%>)TO-Q3)B=kwWjAPo;oyeOl9Qqx0
zS>#%mS}-A+Gac_qbp_bx)C}fZ64U8jjWYJZ5x2L^Ngg?9lJ==DmrEt{s}NSc=~TRL
zY2cKV&6R!{(3?r}${WXCx%MsnjD=gRSGF&U(an#|e$Q+ywTkSuRu}KvpLvvVuw^D1
zJ4MW|FfufFtCXX$`;7L&=;Gr{g*0=aa9h*fud?-D!Rx!PH(C5bvE__J-YozG{FBi}
zV~X+0>cRMMye)d7O{4ok)O!V?+QSbb>IDU8o!x1^+!OlKrKtej+_&ZF|C1no{GSAo
zAIZF0_Gp~$4X@iAOJ^gS&DricEO8oTbIE!j3s^vS`UxONVjYc^Ol)F<!U4H}LE(-U
zLouDjYz0+}2<LRUQ7R@8i~SLmxGxkCv3x4Rw_T`v5z7@8Xp?tZMTay;_4${c6cAnD
zotoxBnAs?cDuiH8z@#99g!WA9_Z1Ru(`Ijsb5h7bZ%C*Uc(yVOfvOM@`rWuS1);oC
zfTba$0bGb=!?*vfaw43dPZouN7bz(VRE=85nZWbmWrGzK!zFr9o%KkLb<w>Qg|sOl
z1Hixx@3juZ(4}x1*;tOGH^!mjQdt+_4~!XvjAimnCF~>xgmn;eE>2MA5FE)QGW)*y
zqMZCH;&H>d^ab|9lVH@{BKD{I{<NkQsoG1!I>wMY@4mHUC>h>jJf!g}ptx-I_?s7z
z4J*kIo8q^d&%h+%kclRr(Ybp7b^o1j%+27p`@Nmsa3fDM0jNgGsP2UN+W)M4dpDrK
z@V-n215hb2`;qeoc)%ANSfvZ>OW*T4cM38<o@kO1MIMG|DDXC$76YJ7WMPcPK^VcD
z`EABqlecO169+BztFO?x3tt>E9$smFmotiNZT8rc9LeN+eYK|N3Xt-0!sKH}S%MyO
z3Xpbhc8Svk3fpkPmzr@qwlCS%Dz{|$&;Apax9uHb(egX4AZk{wFv}4feQtYbaR(OR
zL@SR0gUR3X5^!lGio{_o7Z^baA;V+VTPUj-`D1d?c_NTd^hiwbC7G!g&_wbyimOnb
zn?eUg=oJ%+&i)h!MO{>lTVn4!oi7kE;Np7`91f2~r@b~OzrOc=6JewS&IPehiTDs2
z!3Zy+P0^vW?_pkw#xn0l*7oKmyx(^H{X^M;e6ZNwSHc``shFtV{$OT-stfa9?>u}D
zM}_v7qj=RkYa*~eqD>Ih!(1V&Y&63PNCSHunja7Ut+eZ&bRq=I2gSnyx&d&Akh_vC
zs#+HYseRTfGsK87*Glf#a4A@(xb1Wl4&ePa;DQItk=3>psH{3VZ}NN)9C)3|kds11
z?=Vluk2d+$L4Kh>5<_%ivIlFI)0h$@>;o6{8^%&2_kSN-*@5d#r>y-D`n$>EFW1i+
zKp9ckb{}+=6}CK<v*nX`2&`mPz!~!YR<e3eI{Dn>-|j6>;~tP=@c7UL>P4eFyEMU#
zz5spp&DP-pqGls>3Q5*zv`dLzX-EcwNHNz4Xhsw^<!Lt1QP81+ASI9o2+CqAQ`CW!
z$NDq1FP27UZ4TJ9PNegEm@YHxccGs~dBr0eK?oP3<*d9K&V&6zoP%=jenw(klkwfk
z#680mW$8osT+yFMgB*vloR16Z#QaHUx-|JknSJcrhAq)KAPdu`Q?ryN-a^#H0KZ|f
zN2l)oV&qD_N6!f>!4;yXaPANCqtyU?MgL+lj<N!rI|TL|?|hA4pe3A!3A)LP@2v$G
z_6MiV12I`;H{&S5E?&(@EZUZet9djyaa*OxkMZ0CVKH&xyg0i-(v$SkQm5DWnE|tg
zF?Dqe9<mhXj&tfaf%~|#ID4S}2>*d=M4F9~FuVp(6^Sqdp_I^|lVr>p2HhSVZrCo%
zc`(WBR0^j7b^y<bMYodVghh=pSJR#%71c*9<W58r)y$qqs^=610-xq2r@Rb`OX2`}
zy~WoARBbJ}>DZqARqgg7U%+Kc^V{$y6I6b-(s=X3xue_BPyfaNE^tf2#eYpiH7q8(
zRAHiuXhi3w$=8bmLuxUAZt0TDGT2@F{(blcRf?pA`iVk+qiq({wS6(-e0m;qcL5jr
zJ@{+Lnz(XPg<PQ6g~%vqyQI$f-UkSBk1)6|@cp!SD#Wi5`^jit`N46UqtWZhXtV57
z5zfJCKl6hQ_e39UnZea40(R6XX_#s=hEo-_>oW#WSGeYv+?uWZs}b2EO=>t8K>`>5
zHVGC~MKq*mtWVxN=rQZrMH2}Wj1aMK7zPd4E7=500R-@SZ$u3iAb^I?Zc;KK9y1%h
z`qj#{*?-gL#|Z$2n4q}<txO};{m01Ud_41FR|WPPSI2b@26K|I#1-|XPb=QcH0Qg&
z7T<0Dzk)YH;GX2X%Sm@zTydKi7d4Rd&#FWv?2hmLtC5d*b;&vHP9O~i^>WQ!?2$pi
zTg)@25~%d>xEB5g=K=3v>yvlzx8&s_Hni3Gl<67ubZ(h;sa%h8k|y)cS_cw5ofkX!
zR|%ct;Yf>9U<!vGfCvwYCUX5gdD+(^nImi?$0_$ViF#*iAzsIlMSX*Hyrw<EI8;FG
z+-Q%-ejar}Gwa0?z=rhs=Gbd5w`}R5STT|KY&)|_vjNbQa68T#*I3$WJzPpaP6gjM
zHuo8iW|e3Zzlse6WWw9Bb!L*-z)G0m#DAwKl`L-y*vs&Pb5QVfe*$LWa|;kXoOO$9
z5eh2_ed;<l-}UOVjKO^020Oi+R}f{FMEkUS+Ub#oLNmX4M@h?}wfVPgR`aOw=6D9N
z0^Gjx>%9R#f_Q9z;#t&&H2M?VyV>Nbx0}XqxUo++NqzJnKIuw{F5?WSbp1VA+1roo
zMWH1L$Avpr+hUDbXslM6$XCJ=MtAKVq<UBcyD^n`FvVnsbJVjz?H-aGaGi*bNYJr-
z3jN0^9H{$(IHkjEiFPz9F5IyM;pm9@SthA%xT$mbHKqTEu{HSeRx^TCu5Q=u&W04^
z@Xw@_W*9UPiw{`}dx%@NOZ7!~LecVp2ji%)Sg?K?*}<1xIEqJIHL2y?_#5K9((8Hb
zvGv^JjpwI4+BZjkTVCvL#(q;y@VVGE*CSM4uCwW!_3W0X`IQHFZ76C0lZ!I=vN=ex
z<6X%+{4%}Tm=1vFps+pPOO_+Ycg>A^*!!0525nuI3x%O{OL?sNBaxM4yyXk>UVCk^
zl-qg;IigGE)KEQM0?0j|OH70A&u>q`<T-0-sORc1RR~*~N%#u8!3s-;$n0MBvdJuT
zLXwc-UvqGrMugT`6#u1Ob@Y%d7vQel@fDGJRaO}=cfPN!@imG}^K{V@ULfea`EEtD
zNvtdgh45V5_AT=qosQ-J01?WXcW?dy_rN+}Pl`I(tl#joC*^7U2{8Fnn_;3?{Xtl?
z0jLO{4<^4vBECTc0of0zv`!#X^f+1=1hK>x6$6t6&lg07X+wA|_)g%>XJpJY^f-oq
zU=TCvX)Kx7^VWXj=@@FUG8~ZQx|Rm4knP1=2;lY8^{PR!5wPfu8jLI_+rkig1qx{h
z85X7=Gek9}JkrIY<@nibLnGV{<Rd>t*{lo-rmLgDc7p;m<56{=Gt#O87DGRh<sy~f
z0^F-N=qNuh=79ps=sah*5JH9A4;b)|6e%W|x4Nil>ktmh1tn~h(VM%r0h@%DvF{fn
zLnKho#zFvz4o~>oEk#2q04C5)px7RzO<7Y{htJ9X{I-Vgy^Ca-S4ppIAIQ5$8!Zl1
ziSMnCblC!kv!l;(XxA>{W@-q$g_KrR_!W8+NGHy;&-~~X-}aN-kFPx3-x7fg?Qdyv
z2%$a3=7punFtY~kp(oNAq6Z3c{$<xJstFygfLTpkpSCMc?u;9lrs-7y;%^<35jpA5
zkY_39f9JDRb02<ju)TM7?63?(Tr(9Jz%T66b$k4H!J*%>O`)8_6%Lf|x<jCRH=|0W
zw%wz?t7tSND6qjA(+ZI7LefK+n?0PO-Sm$3QA5Iu<ovr`Q>+8i2=>3{yZb(&{$YFR
z8dh&@U)l*;-~r-bNUPpr0#HC{`Cq9%^agdCciOHLyhyR5V>32y_4|vmVH}{s;A-N7
z1yxDhwz~1Xli@8yUuAdy7@~5b(8gu9r)j$z89sAh>-l$1H8=KlxR5k}2^EKIP=p9(
zeROwsIz~9X>UUxR$ZV5B#H7)IzyS^MQiDE_sY07j9g@oN$djK^nF`?X0moM%kZ2+B
zt;2Lv4)*QyDWi+*h2d0Hy!+>KZ?tY<fWglEM2loxAO(<6*ND*Uu`xI)Q>E~-uxG*Q
zSZ-v*VDpn0{=c7r|E**XkfD6wWTb#%@T}^`b(WP02GTh4>_EvY&R?wt%qT|~xOkZo
zCU43#1nfIj%r7SE!I!F2>Gg7vMC^(*euUe6z?nC)k0KUMts{#}0`{aAMz#K%jb{h?
zvkm9ktQDFv0ds*tVH#4#q$t8}yYi@)!$8u*)$IzHsD$1z@!7%{mhH}1=J$;&3)BVB
z6|eafZ6QYidc)ACRXTe*#s(K4?y5{auF@#yzZ%_OweN8z>}bHr8`!#)E$*k3z;>4E
zz#&x_hkoWqTgGQQ7w6-KD?+m`U|-}xwG2_~ii8)SxK8W70===D@%;u{x$nSAcHQ!l
z_688bGs{hX+lgjQhvf#N4DL=%R*gx+whQi>E*!Nj3|`hdAQH3em!0i=Ldco5>TJP}
zdDrcU@pT3w@ViI<UdP)1WP5YBuZg2?vG7`a4upa1pyHBkV*Zcsa($`=RPsYrGNvk)
z!Hi^PX^hU#^#vc<yN1{Tl!0Zeed!0ZZeZ6P?X)bP0<)dMhW1>KrfhQdZPx&@>F>tZ
z_3HelNAEHm7sHh?5unjjLws$uc9-HG=ZZ=ROP%&FDS&jvQZ35a_1%eF16aR)+I`$V
zZ)uxHkAWlyF%~wB_yV3IniM%oK0e$&flit!nY;a4-1<SS(9`nVp(Q5&`8>M_(gBxo
zvuRP`Nen5krQi$bj!&OZpiH!!U}tSQZxlk?y0@0V<)7{E2D~<=TaesaL}*A?0AR`^
z+q?L)yzFqS)cz2}qBmI-@!=MC(PsYS1*!yn8?1P<Ct6-Qv^giWq{Vs4$D({WcNX39
zHt5b<?HUtGbkAjY7xeL0>0yKEy*EPl--WgwkXGdA^G<enE^J&>B}0=id&euJ;`GiV
z-uw$A*`INsFi$G&M*J(xY8_A3F~X?w%qO*(7eDb;s?HyYAK*y5&!DCL95In+6#P-#
zR)a-ALJ$@`O%MX;H1O4H>gUf3U<KwUfENMb8Kwf>T?yLHF9FDOSa%>(M4Lz?-x8!a
zy1{W&DUd?tktCz&M`~d=sF)X3;Wt<f0j=S5HNgT%kRP~p_9VU<%o5`1$YfvO-VgAx
zQIkxfN8^?qJKY&$=gOJ&x_!2b?%3q*E%KtD$cf>K4#{>-8ql=NA=<i9UrCPR9^}Qc
zgsH@(G;|<2eFcRB10j$MjFew7hiN6qNK?~2!<P6+`;4lHGuQ?xPdAHs0!dWxQ_Y8P
zK<&-Gi1m{sZ*JCWtr*x7gcj?@b2&(Jg)=1iD=%fq<q)L1CkeXo&dO3+*{Cf9b8Kx&
z=A2<%ul1ZG+^z?-no10y^^-U#fPZ{N@Ij%0#|l>=Sr%e@PZDp?+LE}#g%yRQ0=_@V
zB7d%Sl5px{N04#7Zlt;BdIrm=L%9Rwo0FNN21{!`M9r={FQ1tPOoT-4ycpsPW)>4|
zk9qVR{yq%U?4|;sW&?I2UF}7+Y|(UPHvTkOS+>8NX&iB&tbcpafoJ!}S!9><HnHpv
z9njO%{qK!l9lbb(IWmaOpXe3=NhCEoQoiy+Dw)DX2$2G+Btt{H%L%gPagfq<m6=7Y
zKHCE?sM@APE7JpB-7kE#Jy6I2yTv9I?MB=U0&XeD9S5Jjl;I?N61~u71-Dl!^PY=>
z%=6_N|F*K4JorM%-L{VK$%X7+-Jf@#zZAd}{2X3O-FkC0iqi3v#OE5n5bD8?lm^&S
z%ZE&rM1UeMNfF<~)e0y{pv_K-bBr_#`%~YT0htyTR4$_mWhJv|rEWTx-zp*_ugcPe
zUcI0jMrxk)n+$_mEnv>~8uMKv^-TEUDJ<lJ$wi9QY6GzgIj_yzL!GkVk~fPD4pz9;
zxd5EMI&BWe7h@VRsneDD=7gkX34~ks03rL!A{DPh4+C^}=WDbmRwnDBO3FK*%r2js
zT*Z7``rI#Hf`868-J|v0zUCei15glPQ7hhJO&}AlG_205`claBpAZKKetvuk@q60s
zW`n8)Ew&x9+V5PRXA3%K1^PR_ueIj<g&}r5gptAR{W&5G4f<WP6!S1aOZ#|TZ7j#g
zyBr=E-yr{-Nudaqs?_G)vgh)f{e8&Ep)$V8_65XDOjI4H_OC74U%^JGg?!Weg?;7{
zSq78Y1zLOB3*WRq`p5LfP+1+_AlAKROQ(P0>W@%agPq#|pgXC*qJKY_eB{aW8Yu}t
zEauG7KIh~L8g-tlpY(s2=ESE!+wB=n3dm7!!~^`(y{RphGl<TfBelP|dKM=DQ6J*J
zD5E`7L!>@*TqvR&$q*Zx=wkJM<SjAjD{;x#VP^Ax*Q3CYz^6>CUvFNzP(fx3aspz)
zWdTUddnPHqJ3Q~I+4Rxf=j<w;z3Xfi1J9sZ%A34zF*FEd%&u7%9C0|`6b*Whs8z0+
zta^&$tVV!mhZbyZwozW0)t>%(^tj{pcd2FghA-~6IWrUM68v-Z1*Kza;SB=>U?OH5
zgvXgy97ZT2>@!yo%{O2DJV!?|3IWn+GRA(bGf1dMFPs-;V7B}te5$vW*S#yRv4|(T
z6*a_+TT(E^8UK0kaM{?k9TBR@CO;IZV&jo~COMOjHFQl+_<*yzb7?Ty9j=vfZ4`p-
zm^(6%_{9{r<c$*QL)4==$GyjPUA!D)%^|eff|=CfQsUk%*m^YUW4xUjuj5LFXM|he
z?mAzq-3|^hvE!{}=@#8O7A^6Lmwe3iu$RfAgTvz|Qf^C-QM>=hWKHFvtycpH*IpPd
zO~HI^F}wEzOpXIn4hZgfvf}jA77c^VRt>Aody26COnocVEPbvCU#1TYqAh_Ou893s
zzgOI)<T-%{=pHTY2;Cl)=pJ*Q1tUDH$5&FD<HDB}G3ND>(^J0d_Wazze_9nMQ%M;6
z>i0)x11W3<?_v)ZOQ*!RQn-gs2`_i9kEcUNXa7?jdr?1y*N%1RjSD|{b&$IeV`-MY
zv{N^UlOx0^C9&Y+V#a70ze7Mq5yS&gVIa^VE8qbN91VPVA<$<Qq(Bm6ZxAYC61o%>
zf;T;`Ge`nKN(Q~^#UA3@2p4SH4awF;7$+X62Do3oF>qz_XRRa1?eCHh3J2k<f{%=6
zxLcCcHz3CfJ+A;Z0^F#4h>bERa-7OX$)F^xCYfEQ>;ZHajwGoYz>0Fl?xUC)7lh=~
zg)@%f5|8#glNQIZL7~fo^ep~?0oUaXR9dY%e>V*8hK`2ur$O?X1WRJuo6vL;cPB~t
zI##-k{=RETs<~$lL8h0$_4rq$9~wVmd9xtR{Qz=j2JK#+3^V#kviQ*R7LVL*|2UEs
z=ys;XX&v@1Vfan2a}(pc%i@PGLMuZvA#ntPN4bWG27FeJ*+;R0Zu$^Zw%H)<ydUKp
zrMik^K8R2iyj)A=-AD*E#M@ibM`a;i)0G_;u{MmrXQ#erP8!q7dj!&iR}rne_w%ed
z^>vXqg^k+o>=t0oh1K+=LGqPW;B1gmNSKY`YP5Li4u1fRf@C?>)>+&tzN_^pBR1*^
z5YhU8<2S1G;VLH4=Er|qWke?sH?^2YmQPMvvRKt4h|^fm#QQ)NvNpiH%>L(37h7`a
zZc7glq+Ps~iW&Fb?^AwiV*~dk!m;G;WQ!VJYxd$^DUw0VnAKr3pcB~k{3Sh@+fGZw
zr4@npd9~_W(WDv{9@g68Rw)mu0`+P^pW;dlFyi%`ogQ1<Eyb2LaP$y^2NIfKbm*sQ
zqGsG)<HZSe!T$+$Iu(&OnthEy)n3{v>Eem4bwFU;+V+S6FXXSi@XeIkUTYRWXN%%x
z<%-``Mch1qP64|%hpD^Ce@Y(u|3HE)<inUzf1XLI07VgCgM7u(keQJdFgp#qKAoy8
z_Wwd5P+2&~?sD=xGQyzoQ$FV^M6K9gNHP72qW0Z-fo6lDP~$1GG2qfkI*0$tJ%L#)
z^K$~c&q&7WWKhD-O9PJ_+OqfO7Lkp%(><<5R<*q`i7`NC%lHh*CbRk;uPq**%}~ln
z-KX=9Rwgh{yJN5b&!fL{!6S+!M@9U=ly#HXV-<9Lh&6GS#2@G3ym7zLB7%^$ROa}-
zX6Z*F_feg4-CpCur9i5G5Tm}`<S1Lh<?7vUXPg~6@CD@=?#{i-UeT28g!jK`Z2=Mg
z|9XxXg1K@Mi>y|eZ}})DalLA$aC!!xgQAd2GchxU0x|YFf;q*}VbT(Oo+$Vrr^W4K
z<;ME`>maX-zpGt`?j*Vu9@##cv=F*NHqmMEZCR@v79eLUYWKCx^saMGS!gCChzf*F
zP1wNKR4GZ(as(u!RHu$sB(c1a0>>}Z+_pH*k{Y`lV7GyiHcmI@@&bdB!%X_GPgimY
zrz>NvJdw6;r}*P`a52yPK#PuxH938rn`C<pwu|xnpH}RP7zpOu9C*Gct?PG3z2>Q%
zeHW1D`DxWYz-=_=Hk(cBLDy&sq~h^sGJJ3LyA|1?&=aL>SlE!srW&C8ib}*+GTMT{
z_@*`Dqpvp)SQ|C{O%2dQBAq)e<Z)Q2jy_CGT1`JrApitPK=#eq-kTRngtcDq+E*b=
zcPP;4k57H0@Hp*0+`??__6XoPD?`J)=su}j{In^~^Y<%NJs`iZ=bHfnZ5O=*J6_!|
zAey!sSmBaA{J_1Z>k9Irt_6mdwo_H{GL!avd7*V8_(FY9N|lZ^9ndYpz3Cjs1L)q5
z;NwxGdm{hk2@nn$HdcKxMy>t*eRf1Di<zb8pXpJ=w`UD%p#e_xfXIjL>l>tpl>UR8
zlplV~!Pzcn{6(2!KhRwD;!5A9`TD6rgq>JkD5fcBwF4{CXfhtdo_p_T=qL4O_ugvh
z2-S3=J86}s6HdPjj?d`_&B#S^+fA!oW@wXvZu#&g$aW&(#e2#><2sV?Q5t>?%$!`3
zy`jhhz-?^Q9m`F2XW;pNSpZSeRKh>{yc}~jUJv0)wTFDEsLYobi>-99^ZzG4F17_U
znSL2FGY+;-ZDAM@n@h6>h2!i{;<3hajv~}k7lZ;tyQw-X)TtYTP*_;=+FM{D&p?4`
zZ&C3yK-nM#3|w-&ahelkH`d=Ee9S6!$wE*DVjN435&|)y5aLT2a2ysDJ}wT9wWCpE
z(&ZeGSon%%m*h8KUh<I2EJ4G~1NF55@xz$3SVx7s^Z~L(`0}fGVV_F482v&V@X+!d
zZFDSYqq&a)@T7<(yLP3`jlJ32$91+4lEOXWP$f=e1gg=tg5>R459n~6v1tSGNSfZG
z*&c-(_BYVHM}5T#55aSHT510fhxjuSaBvH^oeZ*T!n~Y+(Ing6Ff`L)al`1=rJ>Si
zZw&1NMHQ7-<H8;~UiKq#RlN8Ul!UZ|>DVDyTtx(`Mhup1cQPL5GTbb|@-7KVj_sFj
znZy~4N5!?IGr5U!jpbEvlVNe5MhZLx?iyoP%-dzPJiglH)LxPy<P0S$DP-G~SU~h|
zki4Y!V|5h&MuKW9WwhuUz3|3@<uRpEEtAhKqpED2#57IwY(|<xGUSx_<@?L5>1SNs
ztrr50Sl&QGy~%0pTddwh>r>=^qIgi(U^;Dxd_cO6MJn~tEenoBBmAtdM|ry1!T{W$
zbbGoamDkwd^1gSqx#(?tM6X%~{QP{aXle?vyWrq08PC*_dZFJ8$r@~iGeg*?;f@Qu
zgYZGi{q8vba^(#n5k8S7+_dX?3y^j3G4l0ecQ<e$hCI6TBX5Sy+X-EBUhQTSJQ+z%
zpUTPGnj?wT+Pl9ieg<<V#2(9J5@A!@!^79vw<`vRx2;WcoMY|-&67$El|yAxP^-uE
z>Lg+U^n8i?fu?XDz17Q_dwmul*^nbxmpU4}XIspCtHp3H@E3v<cnTb<2DAcu>{7ic
zK{w~@$)D7fUf`QwzrSgOc+ua1DqfN0vlx(Xx^9NrRk9`x$evEmH-D;fKk5jZ`;uy+
zSgU#Bd}X!}=yy86@GB5+sJGdDaiX8JXLVZ^L&C|n>e_MdOcWAyceUhdKe7OOJRCRl
zUb!5Uf-cv~tF@fwfPcR%4VQn!<!1Ly_mE|UN)DJi3L?e?Fsz|7qEAnAC9#87d+^OE
zrX6j3aeBczf&D%sM5*)lxDw9?lH%Uc6)GvwcR!qcpxZPYgGITf@7IafsxDH9T=0PR
zO8W|xGNv^(FPh(q0RIyY&!ANWXQ>32s2{uye5jx~s8pv&{FU7D=VqVVz0?T^y)^yg
zdS~;XR6-2D|C{$^0-p)-=gHrxCREgi%PPu99Xkk_LasiOIt-a}{noPkgT7Rf?|d&0
z1duRlHJ)z+jke=2+s0wDOny@Ier40bs03GTx0lUhp@aXA+$d4E$5xNQ0q^<Cl$Qq9
zez@YIS&l3Brs>Q<aFbj=Hg7_~O<5~V&KSJgzEv@6dFly?4Dj)n)UNwKS;3;$#l^YR
zXw)}aS&JFLbHmuBTp=8Ov#VaNQ9+Ok__9dcTCPgX_D961ub~`GxzSXPXz=#fgPGb7
zSsQIWvOL|^T{{i*-H4s>f!$sfUNwrd2f|ntMNAk!wPp<+9bwn)mgTT$dl*iwSz-Bc
zv4n`1@N~3*p+-@-G>*{lsNiOc?5KmS(@|dF#bMlm-us2i?MXcIYQ32;=<wySj*0g?
zDz>lAI+5O~G@L+f7=o#4Eq6Kjw^U)1EXe9bw+DQV)iSM}wc2IX&+`S@^tIW?TaSYc
zL+9?*8h_PQk3O*(7aqElB3@i^FSWYd5j)2Dw<r|zzADMdc*=+|YI4|EtMS|SX_njN
zLhF4beJ@1H*n;N-j3GVEVKie5Cdkx3S&OsNyVK?sApEJJgjr4EwYejw19b;}@;~vN
zkjtJUszSdj6|YwVkCtQzo<gFzt1Duu`>%v<>ex<ycy(WA<@rrF*S*ZkFQItouM;u}
z&*-A)eFKL{1$5~EYe#=-DEg)^#-N}{-W19FE4E<Bt_E#L1Sy*lTynTu!h>aaJ(1s1
zmfJpIz-_%Vgx>?MOCjO!%Qz%u&Dd7gFCnAAU7v6qhg}7y;$}=R4uag#!2^XbJ!C>H
za~fvwDWsO7ss(!IkZuce!xP&qwS3Q5q3{XosQRnIUbNFXy-10L>0LIaU%UPMw_gGn
zEb6M6CF11CES?2V;4{e0K@g7-xVbx<pDtU*(_zubSe$XAw97^-#|r%^T8uKIdF<}Z
z+OXvGBkIM!P{~(=6T0ES0|~AQyZm=usm6D(o2Zk{Nl$p24Gjq0I+*T51pTXq^zFxI
z_});M8Fr?bTStk{a>;Cx@mP0@Z@MF1<G#25z95^3Hty_<TodvWcTAjFJfW%X;>RbG
zyFQ5nlXa4ATUPehQT1P5bQb{W^Aat0gLi$#ueJ5*wr~G7u@4-5b^r1rQHviT%&Y%1
zxJOH;?~<#h@k?_NJimNoX5Rc;oo>ECk|hr@Jh3B*gHk1Pd%22zu(-E3n1j;QdZcDk
zZSb}r;`qBFw8unmLl$y#W_uhT_HCAsG3Yfj>zI3K{g>~x-bU657&{}`cBzKG>ecy2
zEaP?+E#m2`&oRE2d!50XGMAlBzsn{(5EPg8e!j*!$VWS@2Uu>V!r$JjL)&)wqLo86
zc;*y*_V$pQ)7-9AiStCU5B%0)vopU_jk1JbJrA)E-+U_1P7H(TO~>*u>L05WZ5Pd3
z_tlJ29H_wGSvD^D%U>NETyieRo1JIWd+bNgE}oH1HI(E=@5`xDd!Gr+ShXBXbJlF1
z?pMo0tO&$$V|o2g)WTKW>AIgg6~|;B#Izi85-56ie3tbXik_X{cwxc}{;EDRD`W>0
zQQ5~1NkSz86;fra4<|vjqbzZ@%wmTQ|2_1SfgAWGr6w#o7j2OY-7e2l4Si(2qV7hI
z--U+2J<%>j7#pVa49FA+baOG&&--Gi2+pr|T2>$P&&6In_PtFtx`?!_C_&wd2&1`H
z;pVeEq6Pn1^`7r;qpESEnt1HD{CjeQr1ru=0aYV90lhlp4x5ZJ2mKXWee>0J1kn&u
zsk48<JM99Mnkp!&Gu8B=smMu*1!f$rdN#oW&2HfBAzM{h9r72T!0_U=wxyO+@jB(T
z-VL@V_&3L^*iU+}PgV@icCd5ZcX_NjG%~`*dShyN+HQl2OyYY>i?axGNogr0gm?P*
zMH#mxQClBXuM8Tc?N@#JmM?(VV*JJQN6EQ+%WkywKNQiM(`k6C>14-5^3a3UKI)6f
zc4O#1ZPLl3yhE3m*8`JS)#`eKo8F4p4e&%A)Xo~Ohs!}!8m==}?^pa!TO@kL8Fe<k
zw_F>G1qGqv)|-gkq^Y2*LE}Wp`<Iw0bLE>ia=^0a)$=D!oEX)eA^TU&c9odH>we!o
zytovHtaOYu%--Ac8;8wT#johtE&$((i@o{}3W7(F@B!ce)TDOUp|KJJqpDt;xn6<(
zQ+0iAZuO%s7eD=Qvnv#b)s4%TU+aUl+1MTI<w1^RWl?i^u&({G+bPxYeI#%J7J`=>
zHS=nzz3H$mj5NY!pHpC==C}8u9eLr){T;WPLvsJPlWv0c*zFqc=%USU3L=@6r8UpZ
z!*4@&a_apq2f&k)3rExSVz-oW_Qhp*=2N#B?WXxu3y&p?y~Dl0{a=e&V^=N8Z8VgY
z%h5%Hug12w^P;(vH*RA8J!%aoKz&^%E@@E%e(h&Nr0<+rd5gD1`YEg2q=h~yc>=en
z%ed8Np2~B{?CJ8dj5xj-or}~`A=gPB6cSZUT$8sgQ$R=-FTV9=#;GebLD9{U+V3M=
zl3W%SKOA48=1p|l1|BPZ!OM^zUsW=#yF#DU>a7p?^uugj=someY2qz_E0m7=fT1&i
zkI)aUEYND~-w{e7aF(tUHHS*DLC?U-*H(gmQ7TqAq<>SMua+NcnkhxIgy(A>Dei#b
zv)1dwNLA}*nOUFYMrr$4m(Kj@<Aw02B|-3O(HQfIf;c_FE3<Y>ZLz(Q!g39-GxqyQ
zOy}Jwy~4Co*17lge_D&($>gE92HkJXz8`J-tYMFv#fUpp6`)E~IL;JT0~ZeUmUtNT
zdN2maTjtd7%C%so$lJT$Vi3MQOg!)+lU-yVL4Dvd7~sm)D!ro#mREULiBa{VcJj0a
z=#od*9kHX;IhnOQgjT7SnQzu-PsSd9>lrk$9lA1nPgTS=sP~D^hNuphNG65gfnECR
zTrPxmz8a;Jj@X?{nmo{pRycjC`P<kInOtZbgDj1Xy}VPTJ9#!JaeK|xnW`txyr1KH
zcYKs_Z!*bMrml^M!w&=mkc_U|i?GB&&R0@wGyUGCz3RyE*>KJjvXk3(%lGFWB`*BZ
zQ}zy28ff1`pZKhc0ll(m{p*zt^NJ2n$Z!zEZ#&&f`~H^3mgJs0w@wFN3a+<)9Qq;4
zU3=qicH>G7bMEl%2{Rc-!5i2rZfu{(O<G~sEqDT1n)={j;TzW?#2EYq9SbFF(A9{z
z?p?ESL&ebW>}?8qb<5x8%w_LOF~v9o`tB68SYkSZZrsjTL>w_*(cag0V(*fis9LXL
zA#-+>t%f$uqK9D8ftmlS<>B=z`}`i4t+@L8{NHzp6J98%EIb-{`R5-`VpDppz44gn
zNhMB4$UGOl4;;oB>SQ?0@!gvbe%JIus@#{xvoqXd!S+KijcEP!yFg)POF4?G2N3w7
zsU7*f{qfc*Vx&}Y!E7}A7-g30Wz#ec#;l3@$@y&LX@3<#FGVv~uzb8y1Vgv=^8tB3
zZZ=Da7LB2Zax5c)Rk0}-m(vHxmlBj&L$F2v%XSm)^E+2ay^hJXC-9MUY*M!qtO&#k
zT_D>{3f}n{L;>dsR&)HeZ7GCYyyD4!duOMfpZ-ui5cW7Y7g${JyI|u+6%XTT+udm}
zUB9E>@f!z*AW8)JJTK&rdnAL&t%pFt1|R(D8<luu4#9bmogO{F>&%#lmznPTw?f3R
zR@Q`z!%_n&U2n}81Hz0=d1aiX+Bf)<s&V!G)??6+wqh`l)8ZUUDnx&0bQzVBQu>m8
z;%i;+H6(+^#L285x=O3(a;h@B7?C`b=x>Xz^c|2fWPWPpyi-Z@#7*i`S#{r6dGR30
zY%s?ds9mM5R~ghETC7ExcC(lS_voYal*)hm{r9uSVu_}o70nxyme<vNx%L{xYO(iR
zeX)vvt%`a2m<CIG4;q)vS8*lEq_o4ZQ^AL+k7sDTz#Gghuu+)5{`dw{9Km8TiPfW1
zv6!36%I>-OnAmNY$L9I$p!?PF#`(n_<bmQgR_r8>$`k&&dSrD($IvhP{xVvCz=*F#
z5pa}^l}SR0#8onR>-!#$C>9~@cf~%@I1(2RpMDf;;t%xhzoOtDYz_m8HID=&$9tRg
zwk}B`sXwZe_i&_~m7R|N;Dd55{-4WZV5qBEy}y|K^E+fA)yU(E`+kE4B^O&E*!EJh
z-w7Y-H(mEv$XvC@y?)Ez40dV6sGx(EObBh2={kMO&R>JbBW->u4ziO&$l7}MDB3#O
zo5#Bytm>yh+4)_E9KVT%?S_qQZQ;W~(+7w4kzn1nMR>jE!+j0_23s%o*bhFRp0<$;
zVyvnkRPTuQ6!<?heONr7-F~4p|HHQMe97X_++CR`e&m!jT4L7u=}9p)pj!)`a|nUm
zx+7BtmeYagh(9g&{(K$6p)2C1&1qsOv<?x+Q}F+g>(`KtSHlNjWZvgUv^Y|eL5%%0
zU4#n3c!jj6Qdb15apz0Bd3g+zG?v;6c<3+69SLhZ>E}{#{NM^QPISibvN0cg60$Cu
z&(xc9c!3FT^WX^Y;XebB943nt8#wL?^zA0wbkT$w-1lc1fIBP;9&~mD&Jk(Be#kWR
zXc~6y^k{|BhUG{M{b}VP_H>kF#g(7MLr8<!?dl{hqD&)S-<V3N(3nx7Oz3s1?$NCG
zllu}d$hM{F<dTc|y2$NTT{h7bcC0==T&Dff1c!<G05`$HqLf5rT7GC6mUmT{7phU*
z%4P?d=gScm_tv9rPc{%1jz;M=g?2#g^k-?eZ2mlF2&pBgPW~~zL%sv63dGqbL&7ze
z1TK=BL{-y7Y)>fmeQUUTPp}GvgEGwPHhi3|uzQx#fPKrJkr!k{B2T-BE_pI9W|_OY
zWGiAv$?YgboI$z5!>n>Qn8GnK#+2jGZcyXt<AptX>7S-nL3Mn5B&iC1apzT-$oFyS
z6~x<14A9*T3y1V=ozHtdN)=_cOFT9r#<mZd=+^6>?@iYmga2A(x44DRH@XUJFAV?T
zu{Re)QwV-xHO~5pS?iB|EftnbHI?Ve{Kf7s5xi~vxeUqP98vFtXzFvtrYbg^F8gQ#
z$I2D(g2$pG&1MJ-|A$fgOyIoJ6@`^~!;<B)s+D1?9&Sw*D&5cXZN5e$61&;2+266$
z-ld7Vmqp`BAnH@s$ZMro-qyd<b2d-q=mW#&7lrHg@pyg>8@%GO<fL-^6V>$l92W;1
zO!M2JUAi%@x-s7jd=*BMtPsNz$<;r%+;V7c)Cp!Y!8~qUEKlcw*S@ysB>C<Ah^tNv
zo*bER?|J~k7p6Qg)XF8bL)tak(ItGZPQKk?E1g`clw40b-X3^DbDj6Q><;!T+ZzT<
zRHA0z%Z@TE&Pk%~xLT$D6|;93)i-D||DuA`9pt=TJ=V0YOhod(LAr+Foksh+3b<df
z;@8N|ojoJZl>|zh$3tgGzrV47yQ8fwt;UMS(6exyXx=|eiFk_+VN?e-LzPNrJheki
z1ep{&S*~pdwQAz&8y#qW>*rmqd*-Q-)ORK&=i-6l+SYoa^bqUMTj8S|Jol}#X`<Qf
zFXb<~*(I-KzTY>u6*cJ9$TMYHb}i>KcQh==n|+s3*6NBtS)DcZbnTZ}c>Qv{Z3D3K
zWs82)_u$^QH%qi_gxwE%0SUOCvGeirXKGUVlsVL%-SK@38FA|`4NlGyV;AYrb`o_w
zvAW40h_~wb%<hWAGhIh-!~J++yEN|kZqh&a$3%AI)!R#=+yU~$vE`cSw&U^?k`#%b
zlXiNydXl?T$A?jkv<enk5*Ti$z7#oHlRPmdyX3b&x?S&Eaj<A9dHche{w`5P%D%x@
z8|a`;KF2hWTEJ8hVbr$MKU~D#Iyp1%MP=P3XS<nfY>QD1dr5Qkt8gF|tu5o~%e^>E
zElFPKbR}vz0?%B}Wb%W|jbGN~L*^&gj5dmtpZa9Et!vBXC^+G8^Q&5}b*$)#DZ(#+
zbog0dE*wVX5uELRLpA{arDJ3*L~)XM!AMXlmwnXOkA(ZkCY0Off6p#*T$I=~<>wKu
zU-`Jh2fl1=e9wN8X?2}7IxGkD9x>`R&sz@ip>4hd8lxWlCpsbwPvm6NY(~_#G4jaM
zvRyh>fnQS#y;>v~ynA?ec+OaHhWk39V<h_auysiF_JXy#(fWXV(JmK>M{96;Z2LNC
zpqgFeiQTG7#&?o}YojhL3jvJ8Z(0y5aUeF<AIIyBra)M#S{>|f^S*uKkqz-S9y9<C
zbWQUK>VtR5g7=^)y}JqN*F_SFcfOfE%M3GlB`t25gV=;`h9eelPxqOdY0_LDt+meP
z*$w*X$DvAJd>ZlUA<FJP*7c#`##Mh2>zvP&Ltgq-vZ8o2i@|+(Z(^3k?<SrpK1aZM
z)xpK6G_#2|A?SM5-FQ*%4G-cJA6LJdqy2>8w;fJKh55SLn6#hEm0n{~j+e=vG*R5a
zcY;~`&pUSG?Og&SMvVpiTE->IyV>>!tIfXH*y=oG``g2I$T08l3aJK1-HWL8pp0W)
zR_%v6lAiPnPLUe5Xt4^O>kbLh&7jkDVHva*Ji4l|w*K1PcWED<@pbF9qK@~V{s=<Y
zi4y-1RH0BcP1vKZS-v3fS|K*7#SwNK%4yW>cA5a=sCM5MsL{`Pq5aCo2nj!c@;r6t
z)W2usLOGKxj>6D$^)ldq5SoynCLfE@&fBhHR7r*K@5}xFd1-i#$ajwQdvL`Qm~dh)
zmQG(*iGz1OOx~;-IL<w;3=eIW6mo^*MUF0CisJb@Eijh3s_k!QR<NH8yiO0!vRd!6
zYFzPcT_Tl0g<S@QJ?F;WBIE8RIxi$ukkc^%OK+r>mo$FB^PU3t4OE$}$4@>EGGj2s
zG>)@iO)yOnf`Q)PCv`KDRSZ${+CWrGl|)5;e)Ns?`B4hGl01!jdA6Gib#>6WY&Oki
zdIG0C_d!Zy?!jz_BenNjjM#;NqM)Ub*v2k_(z(SaDBq*^x$NyJ52RY&|9-Js&N`@X
zw*78nH4)rs!ewmlhx;eDB>L9P64p5OGp|GXpflGfY1oS2827_Up*-~;JMSM{&%${*
zf$zTe$DyhYZ@m;fr2K|U<6GkX&zUMx@WsQn5ACq66E`o#+y009gV^>lW>QtGd6!rW
zJ=YhTeZJ4z<?|l(`^mvt{nVMPmT&#<>r<m#C4cngD4xN|6Ov$;7Zd}Nk^au5ts<t9
zlWGDrzg-RR%yEU+KomUNwdRUTf3SOCmw%h(C)BDHHr3yYP*ir=&#|!f7HlgiL#-Tc
z!U)fDz3whAyuJ36^sJN*M`{{hNZHGZGjOl=Dc`&q1h{RQwyq^Lvw4%8``T!7G44N8
zEC)H59Bf|`(*qyEnIG`}&d0LLi9i5)x@(ou@8p4rjH>4HZ_}*tz$&tUAw<Q?M{Oc_
z^=!vYG2L<i2Yl&w$t;1qP~{wC<kw?`@|?+XpL}3d>tA(9#=CX8nwT75&Q7y8?H|X5
zf6jg2_@hH4#eon_eVor{n{e5<dlwQ3AMc8NyP;XAde!EB#!S;gv&eJtONZc~NTa>*
zkIOFrS-YUDMFLaUPy9J0bU``~c7%gZPviRuJ~Z9Dizd_wp2CTdzKxiUOUJW!(6~xX
z1Lpcn6D(mhFrC&PIXx`BH$}N6jvh>p65$4QP)Lp=wAGMS4c28bvVSFKmaPypJ*=+5
z_))_G$sj_ufm9lbm3t;DDHHb49ZqoYOUL9Hgfa{p8n_kyz0NeTp0FnO;$Tt0@&%mq
zvg=tUAO!2<o9kf;R{S_a2M-g%bU<!D33>^BS6*JoqWbX<cMNs?MYPyxpuc*EcW<?H
zbdf~@*LJnah~C84T~Sh<Kp7>9&fNefo{!^sZ{kU#9Gv#>xed?vXSs6tENsoFJ{!#w
zH)%RQC!mLPcThUhMF@HDKL)*Y{^DRt0;jEYS+2$@?<aqo>3mZz4Lp`EBU9V<c%w<@
zyF9%<(5kuAwJ@RV;wo!#hsf6cmz&Uyo87`#c<q?fOzFt1>G!zm3bQF~vz6LzxxBkv
z^6;PP^3)cOo)cq<t*gFW=U+xMJcph87S;SurYsLgOnl86gZl`Y|F@C&|GwB8{U4g*
zHDltD=3s{1Uo68T*eg_VZkhVa*>xEG$N`K>O|5`doSmY^Lc2NBg}dw+NzC~cUT3$s
zQt@Mt+-~~SAvFcTBl`R^i909V0_n}OsWCtTDk4f2G<WhX>=5fRahB0SBn10W;<2Yk
zyYkbDpCnTReRo3jV+Hsx*P83m+MA2LAui&<-IZo73X$t14e8Ip0$quf+l*~ChF4R$
zi_|SUR%XFxUOQ9*Bxziwt`l5b_0)8QcWFmwf$d_CBnFMwiuU?l#xI-BFx?O0O~h=b
zKD<@Fd4Zqw^DLCYG5nH94*(*a?;raG{^7Owk=YIg+*L<rYKZT1{7Z*ek>f>vy9>Bw
z`43cy9BSb$KRbdPoUo|JJJ;KJ+0?l^6f8`RKj5{%i#`ca?X?A;qji(TL^ZMGU9tOO
zW_X-G+6#awxJni~ALdasiN+cg8LMbzdL;L{Y(;oN<R67+fGVW!#f3ND;<5a4&tKHM
zDBJIEtcAg&Wg=eWNNi|qRU}v25^cS*s^Ej*?Jw!e9_CORcny1HwZO_<Zu7<Zcpydt
z9_02yWXXk}+2T#98g2Xib*V(?E!?|^srN^_G5*t#^2tF8?tlB&0-#sM*8fEBA8aok
z)}@+wKNG}MxLJBS3nfqGY8ZH3<56=gJRBNb(`!U5WnZkCeXwBX_||ai(_lSG4rE0x
z=1!1IqY&Kx*2n9S;UHb&v2+}lN6E)=#%GTc-<<t~Onv&+OFjLUn#lQZRqTVJ?zh?U
zhD^sF4dXkewwFnyZ29rwrvR&G`slTO{akxX<+!eKzoMlyZUrvn3I|5Wm%J5$ymTqm
zO{d%QQ*@{MowC=5%TFMiy`qgtTugQUDsv6MG{w!;qfxD}Sp|ebqFu{VJ}rGIxN{$+
zMXI4oy!)zcF=9N;_4iFI-xOdvgX8``guQn>)qnp#{x0N5IQEL;AR{Z}7-bzhBB|_s
zka0*x)*<_ltz?re#IZBO!7(!HI7WmLIkHFQ@1^VdT;J>S`CRYM?=PKh-QwoC?(6Y*
z1Z~JS?-m{NUuD=;c?l3+(_0H0T}kq<UTVSgr{FvpKWfMf71lt&A@~4O`#^!2W(a)t
z3-~w*=jsDf(u%!g1lx4k27&|4y{3^3#seuLJhVv}wA?59Dr2GF_$44HbSR=WjFj?y
zyzk`#MGAysB7`+xtn-?JAegRCG@8>J`p|~loc0Q9WD6RJAMfRN&+B4YHRjKQo+8L0
zgydWvdHh&544K}#Go~%Ry0Y+ugaP8%A&pUvnUO_s%=oXjRv7zahH1tfaH~fz^oTk$
z@SN<lF_6^R^eS|+c}A%yJeG_QRrA{_7VjA?%vqr^jWLkqpQ~l%v8Y01=4~zuABXD7
z8Hlj5Tl#)yB#|Um*Q1X1=3gK7_LRRRBv?@%5k?v{KP^9wfi-P?w5Tc*|5-co<Lb4q
z!6E_HkRTBD5s|Bt&wMdbqoF#^-SzGDOT^KoT_t-fPg>%eNCmaV0a3XaTKXn4NVFwv
z)R@K9<!n9Z>_vgup=PK$v<6Airi1Ifp?jbhr$nXvwQ1E2gW6k5Chm1YavT6FDRm52
z_}bi>9P;#W-eG$}`0thC9G%12Khn;*&GqNS_~#db+<&>Jz!mhgNwIm^#(A`*5NKO2
zp9GWC3(yWT+7W9%ew!d*)r$}$O){3WXCWPfRZNpEtWlHwTDhBjdo*x6LxUbAg`@Tz
zKB3`booC@UAP%NUx~!$w;R~G&okz>xe@bo=fD0$zBJEuNF4!q%d;7khjb;Ei2mBD|
z0X*jwsl-R@f3P7r&Ph!=Q=7Tl3NdOA-IDaCW{2@2Mo~PsFDc|)NyQu9ij}uT<Ylnl
zNRtugH3v0%QmQ7C?A^N25sun2TB&8wxVON0dbeRFF@e&!M!^Av8*G+qZMk=}Id{gF
zaO+3+ri+yUPFa?`dRMM-J-eB>W3Vl`M5n9UINVRa!4?0xztJ+2x?#ADyxYGw^im7*
zBTSJ@cRQg4IJ!*L^zZ8GktU`M2@E_UK=1tO{5W~2Ji=V=S$)H-kI1YFp46|hWzVGX
zQW3%1yopdcry$sO<puSet&&VX?^o9-uz!zZF<Hn@wb74t6JJ<BWnJGT@RNL4o0mGZ
zi09^*fN(Er|CNz<$O}37iX66cCmoYyJ=uX<?zg^uZR=w>I&mS&m@=T({rAsVvD@px
z(qP?xm<e?hK$;k3_WVh!=Sp=#-;VYX;uB7j<#fogIAVRp1jOgRR~b|T7(@rNuXIwX
z6JsZ=VJ<HvW>hNxr=JP6y1YolCT~eHOTyev12W{0)kve)wy|CNiC?^D1bu^0t69=(
zAJ5w2Ot`ySrTH&sumjg@%_i%pNWd=(CWWB!>YFpnIjj~LxV<k;jE92(0^kXt19qAP
z-E`p>gE!%7S2h+y{2@Lv_JI>SjTl?xuVY!f)Uo^rhp&pK7B`jmiZa$g>ov$)VZ2z|
z0S&vH=aXQJCx0@y?7ghVkEw-?Z{7AEGbX*KpNVWVbVolFBGxPA4t_a4X~5reSY*?h
z{)bTkTy*PvzuE8JZ_xdcP|^10Gv%EBRu;l!<YbXvkEuUBn+i^BJ0jZZ$!|8-HskKz
zTMFPiXfbYgMdodP#`byR_k&*Ud}i7BWjbHeklf@R1VJ5RL@Y7=al{~>;NevLe8sx;
zlZ{N(2EYQ(*7LR9@cNTKaG@g21UF0F^M(K)?>U0dAR+QP>9daJr@t>wH~uzk0vl8|
z|B`d&2!x7^abgv#t)sv7L3$DnSqxwgX;0{;Gu&<igHp&$xf${XSg>lKXojV+rrRl;
z_uqkDmn+k>gZ9v&?sz9oc90)8=a@t0u47J&HbXq_<<#73%Rt9<V2I+~)EiJb-pypD
z$uODsz!P8sG(@MDa8Czo$1tcO=h4|cldn}%-xQxn^ipxJWyoIM9LT<rs}7jjpA4@O
zY%<&S?y}2A@A09WdU$IKyI2CbJmAq;oTm<EVZ%l9OA8eInN}P?sX<#U1pl1<h<5X3
z{f1Sx%tl#f>eMF!oPn}#um5U2%c5K-%o$A{G<9orQW4c1Gn==eI9g8Tui3UjtX>v1
ztrwo+Rkw=`2M=W4m`JlChhCb0!I?BmgR)_{?NjBx<``7B`l%-3uE{GOmDhEmaUY}^
zgSUs<N8%L4&$J@}BmWDao|cNZHn`0NdjEd)+xUsmlM^Y!>2HF`^^JJOf4|uNb<I`3
zP`Y~pe_y?y#W%z73R-`&*oX}-tcnK+g%(%0_jF!g>39(V61bnC`BnIi?}YiY8p^YE
zhd!Rz7h~4MGA+w)Vp%QVj7m&2?^}4!#)}Ckg;}=<1mpaH@63p<(91!s&BVlH1RYIV
zA`dp=qa_k!61@OUI3%XTpvx!8mS7ijw5mbU@x&=OZ2@!#5!t#~WJ<Z5a?UO4^9V0{
z92`A?3rUk+LwixWV%&fIMCH<)SK^1=14xhq`M&%Od2<(k>qfnR8H!@kkez<G90weZ
zHnco_t;{x+BuuGy?Z_MVO~zq%2L5&h^@=~=+zxC*NtVWzDu-;!@|#Ml=Toz?X?i&D
z2<AD`+_z6vdQB_Yf0l%tMyvY3eYk}?jNtNnW-5#zB-V@-ZTuQg*8ICUlr)!{4d?=S
zkiQ+xyT|y(f_U$bFRAbHyj$nxEAWdn16|pVaksaYZG@Sw@=Y(F?0+$~s%qR{x_IY}
z0UZ>^o<n;u?Z1wKKU&_dKVa?sF)gX5Xa|Jo`>sgtX*U;hGc$|(ENB&z+N@yI28{wL
z?>hA83ULH%yzyR2o70Z)(NlU2ly32N)7rck=hyz#MKj9`O15M!zCZ6=VAN%oiCc2M
zeito*WO>nLU=Z|lei&({>Gx7_k_*c@+1`G#xgT$rE{bV~1=JHKe>{iF9jAV;kUld&
z-^(hMnI8}%P8Vmrk~Mo52pcXoyKun$hvfsj9xy2HC^fSKA4{&1N>E^YEnt)Bue61q
zbu|&Lh5meHXpsiCfvzVS8>HR%4WXCl6a~eD$9NXg@>?Zlz#+FO-^6<*{DskghF(`o
zlTC{Z15GBt3Y0X%YR9?R!3azjn+uryaL}0prYiC2wiH4Ql(<~f7dbfE%OBq6bPN{r
z4?bwTJyV`e8~8=hg;13$>m7I?B^Wp!g4$EbY+i5kALOJgWj<TBp={pbU*LtY<m=tW
z1`FUlGt-<4$_R^{AJ1+?40~p71z$#1@OV#w)fj=(iERsGl!AY}9U>}suy_fd097I8
z$16lnka<{*R9Y&oel9bt=4*{J5<uHTXKlnk$&FVe>a%FP_KJ>ASJ)oJJhL8}eOwdg
z>nS_^Xx{$Xk1$bZFAjQ1*vO9-J41K(y8=wK=A&=8Ixli86p8uA6b_R?mIdks4T=cQ
zFOV!a)0i$xKc4CT`Ke5AqMNqF9klbauK3H-={2&wkBe_Ce16HAR(om%yUWdh&H#xM
z0pNUNt6$@zws%e*cU+`wT|9@A=V7mZ|8mdz53!2P2rG}CpB+kn^+Nc#wzX5np6$7S
z$E+_i)>@)a{>hnn+I3UncF8kPC2n0MVzjdDFpnU0u99%<R=6?ZTm<Z@UD}TJO!sDw
z)*qJ;(qrn{8xJI$=iWW((UeG+XAcB52Ta~?UfXNY5D){g@~yvb_6ZR%b{anTwO`>7
zpS@{eQe+D%?E(yc>DdE4uAko=pvkkq6Yr8G=lx(Jf{MfD%x`mDtG%GdRsLDSI_Xor
zj08l;k&oki;MYzy%W3+c;|h^OKWo41^)Gk?f``|hF`OMN!y{lcGycO_S`kJo4;a`d
zOEt49CW6vsOz=Lc=+AQ1?=0NAuXWQoYX)wN2~|#3G<<n;O%1=>B|ps%Icr^;b`UFr
z{1SAy?A;T4HZyd#sYgkxS@=&`5)yp8^P{~gI5gt%+XqtL`p=G5^zuYWXG3X(eDqwj
z)q7$&6S1cY+G3IXZ@v@u+nz;yrZ(mphcmTLoNik-Z}yl*Uvt=-bQU}M;sy~36RHe%
z9CyG@oO~)ZKz26j<*!83*@!1m<$S+}O;NSdb&wRko-aCC6|}oS;yn_4)VnS^W;A{&
z0|=&#ziT}$8Z4FA{~cJRKfdA1Fl4>^R?W_$lI+z<8lU2d++FmwTR)Kv-xOi;6|X0k
zdYR`Gc5mU|8w9HN)lyGl=dR>X0LcfDo!@3N{vLkvYdUaZD9wy>&5yzBxsMWuL9FLm
zna|x*u7LH%7ZH~~A?(hMD1#_-q$w}Q6yE~yiQmVRsWeu6;qWR@DD_SP9h(M+tw(a6
zdTsg2iX5YtMl~Qq4}?ba=xzFTPWJ$PZ$HS#8|O3C_?$DaH=f;L7#QZTDczS+z&(LW
zae3{nV44$u;D4y6M}VGCU&l)wlv5z)0UR^=P0PULTZ#VOjE5M*QQ&N?mI1reLMV1t
zq~VKQ(Af_~zyW1L0R8UXJKV`nUuMuitG&?=jhJ`)(!6FmC--*5f#K-L2aDVA^?&o-
z_4FM~+$2uDepY&5e(Lp~Q&IK#k5(Kx!yyM~#W32hGz~iQe8dQ^GUS)^mR?2Wi?{b@
zJdl8|7)2_t>DLb)h|MU}e%&+p>X@b%=oq-bvjF{TOM~y4fhS3V2|^K+kL+B$(G=E8
zyr-i6=_;=pEj{KM9rt!jaz~2Pr~a*|IL-J3YSv==tNtKk<w;8S8xitLtm86%Q{+<K
zA4tp-L*8Fd_IGW3fBWe-oMv2>l=Gt&@eV&#|8AOZ=9;;;)>}MyE$H}<Mgkdlq{JoT
zMhs0^BrF(umh+NJdu1H>7q0EqX0ri^#4hxtpJvf26vPu-YHtQBP>I!Zb!z3TmVsyY
zDEJV;oKjvuG*5l3YT;uo*}Mt&^b|zukfB0vV#UX(EJVSfBP~xaR`jSap3|Xg68>w+
zL<7?40>~>1lU4jSDzAOfUkM$sO3I%*lVeLdj1ZO^e3_{#RlO!XUPzmx*bSp+Rmq>6
zN3cJo9<x<rnF2Yqd!04DW<>ub-N%U{KEuDUjf9(KGS9~MJ+Bd$ZW;bm#_n3*P_xHz
zIVi0spV_T(Fa2P32d*CQKe^W*h>|--i(6toeZ}d*#BtN<s%Fysne#-&Wi1NW_b)X4
zdB2hN(Y-RyevM6<gh4WZ9%b022><T1Nj+`)tEw|u-cz#2ib2Is;*n8z4*~+hPv=^#
zx$an1qI^sqHX5*JAJ*ZD^fH(@i<`@_PkfHIfBElJi<&o2MeMS>3_9d@jaO~0e|**G
zv(39d*X%ht<o&Bnd+<=keM~ij<Cg}*ZsXDzVW3{u7t^PH_2KW`Ij`om@^xkM$vyLC
ztp9-rydLKsd{64}#)yPlmWv;7sRH^M<^@X1J+Jlb^tsR6+rfzXt&p40z0VUC4P}+h
zP(*$?^5|D{Jcm1Wev=bcFuOm?e(&eR4`uSJR!6@Y;_IjoyBA2vBM>~0M~BYVrU!#~
z{W|CAp*T?d@h?2`Xyau3s{fBK7hqz%KXECaN*_+Jg%yt=r&!v47-gNY>{d@z#^pGk
zOB@_cUNu13i&1OSu1nA03e2Nthr2J`t~+1&aPlDL@l>txtb_eg3*^aQhT=q#Zkmgb
zA>)vhc?#irp0>`Ht{)Z|cq9phxU@xkGG8F$wA$qNE1W(XiQk%Qeq<kMAGGZ*<~>Np
z+=P02ANVhJkZ%RvfHTd0frsSr1vknDo!;&eQ~gohU*DqscI$_&vHMK=VS*RUEh2cj
z@MtJe@`gNbo!@H3v+BdNjEen_6;Usap8knmv;abGeGBfl+&Kby3M%NsWL(sD+l>yN
zFH+}J_RQIEu8<tQEeYj-)A2el0m>sS<U6$%_$lO?NWvi(C@J<8?BWW|7MI!~nDpUD
zzLH!R*R=TY<s4XnF{wOWU*)Q*YGAk$nsd??DrTeM0cK8f;NVs1iK1fPp<R)D&E%=-
zg1uCrWn)D{u%#a3?UW$^McOk8zrWFEFuA@9c}<Eswj!r<1Na4xY&~*%Lwkm6P#;Vj
zw~wu|$qaN4;S86jedbqD<sjl64yn6*XcEd{&1c#f;qHR2(lRxw$!?4Ggwj+RVLC5G
zWS9eeB%;2Vd2;bX7+o&|Ue-HW)18e-qzyPQ1{$3RQ;_V%MBUKM@L=MMvCc_lVE*wT
zO_U=3!keY33;voVW_nm*om7n+Ux`j`EE<CA!G@aSpK^>W9V+G2+c5rqWpdO(jr1&u
zO3M?Mzy|*Q{yHjl%Il{|7hgbdQo|fe%-JI76BjA2e)DTryixH`)<DbZ1(MkY{?m;k
z8@J9^leuF5q7nbjEd(Ub?VqztR2imOO;p1Cyu7%+kN$TI(>k`v;*_K`a*KebaRZn_
z3e4H>b$0LXpC=x^9+4lq&wZ~_m!xc>#5cg?TT`9yoY%{zju)iPbcFtjeAXZQp%m)u
zc6O@K^9teCzV}wB-e*qXE;@@nu=dFr>RC#c$7i#JocM>^X6Wmt>lqK9MRKP70Ytxn
z9Rq_<x&aR12k9%pyUveHhMHO|!Ei9pyN43l%keBG46im%dka85Z|`1de;h$152mSx
z#HaHw@=xkLn{q5J88*=j1Ib-aIK#b_69KFD32SE%U*C@AJR*dHK%)t4bT&Vf{C<K1
z`)ITtks1f&zc43lW;p!V$rEl8*?V6Z9Y#v={$7}xCt4e;g0GGc?-rO_UWinHSI82h
z9!GQTp(8IU({cX_qoB9hBWNY_bzjLRz()#kVuZw~2Gaw(>lgq_V#F>M+Mq8<oOZke
zr9{&(_SlhUI9kWClzg`5M1>JpCVZb4x=`}3seHTZv{X=Rf(afVPS$i)&d<d=#G`g5
zkD~aqStv$gFw}YC7y-@&O-i})&n-520IeDH!p$02ItM$0IEJn&61ct5<>eZNu#G;2
z_t_i43S@agO)-vV<<=sqCQAfqTaXlLE!5;dE&QV#!8UXCMWX;<Q_{4jLzqx`rb5Tu
z5V*@4xaI|5_tSDos<o?7V+?fVMFLJeg=iyyI?Bo7d_@eP@QU8P{&s_hLfed({J+5K
zIg~X9c1qy9CD8Y2<5LbFbagrXNshy`-IIaC;3j2_+$(@IHxb0jHC6N$U?oKxZj3*6
zSEcKkcG<(%FBpce>uk}rz3jyV6}=*tvg9EJs?=Pc&G_maE5u-c(MOZ*XD51hnN4p&
z>x~`<<k8XM@JII7B9@E(IGQ*%fa!c>d+CZh&%Lu<%z(L8dzE$BHp9NzDI>>=Vo#Pe
z6r-{2Ke8zidEt~ilQa_0ZxbY)i>`kAzc~8dCdfj2;qb7(K!RX6<eLHx4L;#&gtPD_
z^N}ipo`3RFJ;#D;+rx_S#*d5jayU8d7&(JDh*eCch~PCQbpCXBFY~<iB0*`{0E~`4
z;1ji>v!>7C?sjU$MJ5Oc#;BNllG#&reTgJ;9TZhX7zuJKz%SaljbFTwN-Rl;f?jaW
z-i;1E;5vnazXTqwRhT!oXrOE}WWbZf6+UA|wl5T<Qt5fbN9;2dJf<?7tTXEc*{#qc
z8mjn$c=^klwC(7cW$`%q%X<%Naxk{NQ{<2Ua3z^%AK%P58=7kms-=0uf+FV8L=coV
z1{wn>w0l1DF<t&<h%1Yc9NvwzVmGU*7_77k1Gxcd(I>56^(F+HIvJ)rgT)WA(HzH*
zb&h%?H;P28^{|>y@A=Ed#}y5;(P8E*Fc*LZh4tdzpJO)TMfKPUgW`>@s5p-DyFLXh
zm94wZ6VpI=d%Ao>2F~Ac_;BIBQJy~pNa-^?w}@`x=cjiLRBR1b;!9`2oCd80P8`u1
ziy)V404Z7x66!FumIjI$ZiGFYRm$J^0<W0z>e_#<tpXbgiF(ja*8=PsGLeb9JohSH
z<&VC1zrGeFdhm-Fv07O#<vdaFIobu-H=0HPRZ0KYH<2q#|JXN|&-cyc7+381zPWxe
z<6@fIm!Ec<iGm5+T#Rsm@XR}qG5fhT6rhVJ0Cgq9nzIPb1wpJjIs(k5781s#xo6k|
zg}}iG>JVswN+RR$9L^rxhxb043#ktoa}xM_W7!>m&e0eEner7V2PD1n?oH^Z2RgKp
zeZ?|i79uZpfGzK4z+&C+HvldF>6oB;Zzxx2<w+&D7rEt%)|AZ<nNkc(1d=?M!gotj
zEjva#H?Zv_J?U3qA`C>EC*u=#9O!hv$^`mg-s~OQC?x9AFRH)@k!t(g8wbK*HHe_?
z+EFzIvBjT~l_*D!y~o<|J|A?#w{5SCvaQspW89g*`5G}S*7@qO(G!$@MBnw+{WxCd
zy&+b2DkarddOKA-mNARTC@008G=7U7BNa<=+@+(%bUQOrLwpi#ioCmhCQvu1y|9au
z>R1h4O?9R=@7aJV9$+~qFhdl#0XiQGCV^WbKNAY?UP<Vk^I813!PY<Qq6JIzqe_op
zH}vKG{up=mCw}*z5hWYfy<`gaShfa=eGezYRP+O?xJeaH(rDFOzV_1>qy^Dba?tu{
z4$YLVK7Ner6~)1WrcV5cWJM<!&qC6?K0DCnHHg{tugPkD)&KxSKL4PzlV@vn6BfFM
z*Q7GRrgU-&hO9uR6jY6bjc3N6n+-vKfgfv6f4AW~uw5TA1S^5f8u)H^3f*o}kXAgp
zjvxSH0}u;CHfV-@@tQE_aiqTw#VVnzzz1BYvB;~SG}<x#Fcr-}FgY;p>auv!McVsV
z_!1X=UT-5PE5VvyC)ElPcwo)jw}tli6a=$GQG^I%sveO(paow@haD~_AXC_$@*phG
zabPel{zZxApd)(%<7hH<9sW(R*QYV92G;z??UMF`Xk+*G!=FMtLZU~nz(RSc(5NJi
z*YG_H&1}c9LeT3^CXtY6(m5hUMzr1!ZjJ>z3-_|v>@e}k3-m+!s=A(!DTRLDseD7V
zWF{7RiK;r0N26yo(*5$$G;06LqL+HcYPhq22v#g-su?fz$Z04|(ngU1|6H<ZP%@>B
z(_uIpsS<Go1B`{ZX>V_*AW}|p<QiOFKJgdo7|c`uKB6uzT{8EPnH>4rg`@QRBCzD%
zY~T?Rs3o(fgJ(7E+N#sGDFKx<{|-g|9iQaNLC+T+cq1s{-@3ZImv!zs$!Gk$Lb&}%
zgG&hX>Dxrmqrb`#JixVpc;0~deTgdFILmLoxn-ku?r^v4`qkK=qK7P<Y_?xpwgc&s
z=63{Z=V*B}2;0N*29H}BffZ(ojEOg7x;Pm)S6(jj<=r3nF$o7ezDfAl8gQX0z0%0l
z<vOh}{_Vx}y&|6U15f<zF>0Bw&r>;SfO!)0;-9l@*ta-Y6$QZ$p_|HVVI%wt4t_Pu
zD%1?_^b)|1z*jMG3mcoMRTm83_8{;(F9Y|o6>!2VcrQo$pcPncp@Q(dmtV<q$~Bl3
zm#?cQ+Ccm2ojzZOMlaCICkl>glzi^Vb`dW&+UWHQFfgc%koz(rx52|Bh@AsmtT8To
zIuHF2y`fxSy2s{KE+LhlSeW?p=75@PA5SJQe3V`**|(c7fJJ4*S_EEkGU`A@xR;tt
zRaY8iaGL56qp+CS><R6GM~82;Jh2XhJ@_4bdtg#2a48eVIgna?YC~g+c6qyW_@-i&
z>g;P}>saJqlU2t>{~uY;Z1ybn%uS%264UpqC|OMj3!$AdYTR?5=r*8CHiaO=ciR9e
zx<;6wj=$+dc&Wku-EQ%--+vAt{aOB!pP)|&xLKBoSGjUBeiMzaFtK@`aVO}k^leUA
z?+?(+OTp>KhhkI;(<Z%u1$#((eK-jC$6Y`4%9gFZyzQRf<`*lyqjvky!9;DO%-Gqj
zb&=EgbBkK_%EPj*{opPQ!a(J*5UbGLE(%Pca-UaqxRPCqo4pXM;g1xjWOttX?T6#n
z&b5YD@LXy{bL{*2fRz>&=CF?SfFHN&$8~S1aq}QlY3bDVLPs>bbrJ=}5n4#myQE>c
zB{3xgjpdp+g}oA}BAkKY&Hb=0;EL}S&US0veZ(tH7fIaKJmQr1<2ANrb;#1p<7O{f
zqmwSUA8=o#K8y&Or0ck(R-m@<Mr@3qSKZ}C9QEeNBeMgh$wZj5oytiqL^BT&8-7*$
z(xh>X{WVf!y#3|Pdbc?RI=ksQX9tD_CFb@m<qY@kI{~1@H1BcL6oZYr5x;Oro!io5
zTN)Q5o}2`$H2R{L@d@91Dx{nW0gb55Zsx?}a+U|SiUw7^yST}fse+1{j(0ZSr?`%U
zRUZea$nj~fRatl0sM}83Q|o{9vl;P~cpVqzTxi)IhzADGsA@DVQv~6~<AB^sN_3)6
zTK?I5BqV&*-vz!L4w|lVTzy_jZ__c>{XZPqf1U8RG#90^z=rM024$v|iQip~99Hq7
zl?voP66G!$E9DlopVs_kU6@XImV+vH&u>|GEYiuc2XwH~2SKg@tI&~LYmYJm>D#5^
z4zU%M4HC|ACz2x0_X6{&q#S2>0~%U9G`H?g7ljun4HyawO$1KYy3%JKOx}KHUSnVP
z(eg&SnfKcT?z4b$zvBDG0RM0+=1lzG{DUP}Zazo{=3?Yr_F62iISg^ox{ez5CRj&m
zx-z&kbk0xJIrB_DU{!>&z)x*;Ni{*i2}fL~;`|a^&QN=9#FklGfNv6%3FU$ojuNp`
z4%dw0(98#$7X#%y=Q%#qRv*6>pOH&-8_*Fj@hYV;Lpzo`gPU*Rg*#Cqg|n9*(QE%P
zT`j3xGlo#~kuA&wtFdO<#GO;*o?GGbcriIWslM2~dQmq`;u@1g1Uw;Jsa(p0nK?43
zifSc!@NNIQI}s0QW1^y@mN92LvyQ8o5^Hoc9x*j>A-GFOmk<m(i(oLy_S^pI*7Ze#
zdg`Jd7yHJ{dk<t!3@eO(=6U|GR30IJ%N|wt;%yXp2f4AA9zdN_UDG4^{;L<jU7y(&
z-@P$yvF=rk&0I=H@5<J_YWe*c$)pc`9|kNQRZ^cN%Llaq#=2}$70}+EqnAN?&wu|H
z5|~<~HAL1<z<b4shNBj>F%%FdVhN|DeM~HiIJdE7*`p6a2>Mcvh5w%?V!VBW<{4cD
zt+7p){F}@=Az}WRATM`Pr^^?mPIfH~h9>uo>%b+3(!A7;gcvbFm%BJ>_O_^gljo;t
zDN+Jo?onxcP=u7>$?l~AyTG}aGxpCeAOpll7v<Y6KL7wQr$l;DZP+O?qniCGB~VTw
zw^|+sretLp<K$HaRWWD=F)VRyNAU{eK@P`)?+M=LvfZJ@RV3&claw-8Q^Q43lRa)z
z**mzB!(YwoJuW#3YMa3*%}B5bbSLS13JfNIUda2%c4w+>3M?%M)`4c&M9Pw~JJGlA
zsj{C{Yg=~804=pb3T*Q5Y(S_D%}U|{$|ADDH$H6)+^JsbkH;4y$1kZY6e-04j}o#P
z60rE9&as2fwlf&kG-j9~75yrGbBCp^BQw3#N)N{JT7hMpIf}v58DAdd?=a`2axa`~
zz}RE$MlV~H1681>1yHMY6J0?}dmly5KSe3lVx^rT92E%Ff%tq4#_SL$C85eHXmxUz
zO%icdZdhQ7s5x8BWRkTvFfEHhz143wy1*!l><FHd4lf5GZ3@)G#5aSfJS+n?3sD;#
zRfxOys4X*V-Qg~(gMSPAf`5iR51NPk`uN$=YM1T1os4ONU+H((!BSm~WsKa#@9G~c
z&%Q?tF#~^u=jyKc;d9*w8et9}pAPhy8;ah#CbBhLn>4a1tC8yoI{0C`@??t5#B>qm
z;Y{p8{ZW_iaRM&4Dd(qv^W}aZM5+pOzW-uX_DDFU{c89FpTm{n>9||JQWN$GFVO+D
zz~lZGLPx4Vp+~I>5eFl?pNmJ!XhPuSE>_GoyalSbU<Nd1`Ayf=5cwWNe0g311Njve
za8z^xEhCAz^2N2;)@Ee;$(}g9<IU>d5F6!!N+Z=-1hpdK#x+qi2Eh<s`vOACYCLRm
z8HfQgC=fKY{b-i&Kscrd6H~SFPn4NNOb`J1i2G(#-8aS*%yhDo-pI8}<6gtOMzJ7(
zwM5s%(6Y-Ba;f(E!?ay8`K1;I^ZDP<P%qnthA3GTX4MyO+g%Ahjt<g%2fmMq7pbz6
zCw-_YV^G7SQ-T?ud@kiI2sX*_`&s&!e(U<A)%*JQqN-qf`8{YW9BtnC#CnE4Fe>U~
zK10C+XtYraMDaB;%H<c(JmtWUUX0jGl!lR@#X{nZlpb;vXjmnZI@W)9oHC41gg}41
z<x#Oa^>=T;)!?^rz&htVg99iJ11JI0MNfhpPtxsDng!P>Odg&b-&WAb<pv$BwsSB4
zHqpp+0evcEY-@M?#H~;i*md}M{wU+2o#eesNI-QWF?#nC#1Q;ENP+1>Ka6E6eLZ8^
z%Kz8c`8N+1;RYUf5%{;u0KVV2tHd=T(?!xE47On=gIntI(sMqWajyr2T>furxDfD(
z0C=BkTbWvwOAJo5)kWOxQ9~m*??b;StweKyd};L|x4=&~JFcqLkA~jEW#ZzZN#?*z
zzU3#TZmo7T_8+53HIB8a)RsnoC*KHYu$*U(uSq#6ja5_)oTNV;6PMt7DqLXUISIi8
zQyv}^(O~FNo`_pW?aeopQk{2fm#ZRn-`2&kDJDGV<1W*wPC!5@7a{({WO&B?OtAlW
z(Ovp#VNxq}KEljS*LhPbBi&u~DDQ50jI)KmgC6=FBOc7GYUH#dIMuvx%~=RZe1Z(F
z!C$6#u_1>GBZ)UODkQD4uV5JVdSp~>s(%5np5KBJ+sl$C(-_fre?X><oQCtNWDgy^
zx31hu!Sai?cNd)Ai9F$QT^L~nGan_~IPaJH__bv6O{Y5%M*P^zG=Gcia{aizS|0q!
zF$ldh-)FGPwv=cyA-b=F`90#Z${zi^{j~iJ`RerBr=W!Ss=%%UAHIP0gp3+k0Hii=
z%ywtE_D&>$BOsJ^W4IR?)HuC>@|a$q;`sw1a=8HJE`pBS2k>LA3@PkVi1h(Yu$fcc
zc6At2vBkCCE>3)fu@n2#t?H+oPd;40S6a4f&W7U1eQBOTxI^;J1H;7>fy+u45jqHy
zo@IlYh!A8nDAYuS${1|Jx1B&|+{;3?m3tXBj?{dS%&%7u)Y=XM?;<@#4EBQ`DM}*G
zwc(4mxJS9>`}AHWq*HgV+~HRDZ89BnBJpj%H)TiC!K9_1B0;Gtii4EBwsdruXq)33
zeM5=7xmv_OW`M8Wh|<>sn5-pUCYW{?dRgW094kD%wA?T4<qp5n|8gL^kB^e}<rpyC
zS`*C2M}e&RJb8~Nnkuta%qh&|D43x?dsO4KPUWEUI=6U@Xl%F*R(jRbb=iIG$u9(@
zJvE&au)1p@^gez3Z45%rX{Hz(wU%s*)=}YWi)x_9y}Iei(SCfGGk&Em1nE-6->nJJ
zinos6&Jee?$ANG0zJlW6=gX`9;TZBKPVgUyTFE2O0rM$Yyf!Jfx(7bOUx$4wFvk4e
zfIpz!l3WNn36dNdeWqVWTVmMo=Cd<F_|p42TooLvI35-@5vMc>1{St@{uOc!`MWJ`
zt+nwVb=B8Hp3~b1g=ANHkvf4du0A4vYW>TP5D-i`kgt{AZE5>R8ibETeGBU?RT`SM
zj^rSIGSG|VZOz-eP#Pa1N(y&MWQ6YNvn0nkC6cYwP~YdS(=7e8qZSaZingLmg7U)A
z#pUBNFjhlrvp}xkKmdXP$ZJKPR4q{hL-VEvXaSZe5JeRb)lw2T^?I+Lr9g)?h})*#
zkscJ2vB@<pQZGOhGzg<#?7ti>qUxXfh}{K1*^sZPT89V=KP&Z^<@;c}81oh%3<?-@
zl_*T9l`>dug=Nd4kqVb7eL){UM}AcJB#xo#dke1ra`2<Yv0hQ+B;EqeN{k9`rIVDZ
zr^S_;bhV|b<fMD#0_n^0H+QWA0MZqQQF?4%WfdGu!t1o~_3#7d!92TljI0f}wy=~3
z_NM=yi~sIt!~DP>Ls@HRo;dXCC{)48g_ix)I8p>iRycL*22IrhiXCC(n+eEJnG0LL
zcLlS_`+uyi?)mD5>uJZQ+w(o^lAEq_t^4lU-%S3{Xj<dHc0+I{XrpAkiHhyqJXrV^
zvC%pUu<y%4kG9YN|CadRItyID)e%Y$edh+JB4!f)z$->ofMqk1j=a8gQR+hQOoG1G
z+RwuJY2{wRVXT+SRLL`ysbLd*mHU9xYeDa>!ws2NRm`N^i>wZrv{5nOT`)Qzfed=+
z7~?+0umnAY){b|wRYY<L<Z&%>Uk7UMXj#;rB6LZ+`R=A;eRom~t*MZ)LYMGxMCN&n
z_U!Zs<~q|DM!;o~c3w}jfa=scPlz5`UGXRC)vwrQh<Ar^EV1%XdsZp)nP}$juxc2U
z0Xch(4kn<J2zVppreLRVAWPRJRb5(zQ8m5Q<rmMj*im@#`0N{nm7VXEU_fz>BX2ZZ
zAYuoY-!(&E9!;(za6g)gHkLZQLw6iZ?!G)z@{omp)dgrjQE?9Zb*_}A_|iTo-Q+hN
z#Ax83y4FU;y3~WMM^$8OZ<y7)7!SUr6lbEHWXiDm=(j_Vl(C^~NwZ!5s+ysLMa+KB
zjF(+X#Y&$VX(S@2Vpf~-DpI4Y7qD7;9pqgLoGX!9&Y!}rV1B1PTWka@qCfcOzei90
zp~Et20E?mqxz{Q;A31~Aq1;D-s}GT&YtL+FY1Us@e9!-<>MzA{fpgou!9t~s{?5w{
zbM--)>}J;t<;5Jw=_`KEh`=`}RLZ^H=9a?kV)#ei0Zd^4O&6*VsjmkAjQ?;b6|B?X
z-im@b)}Q>YiQTK59>$dBw9r#vyncQ^k*jGUJ{|8dGp$)zRg#!tp$OA}pgega;oz4_
zvnr}Eon$C$<X3)_X8{c@xRZO^q$_m^$~jhKFCV6ycnN3@L#jzj3567`jYfi^P>ENJ
z`J1s3=I9sz#A42+aUgTVE?EFixyIBTE4qi<0bIIf_4`8gn<CTL>;9k0H6q<TS(1Z5
zEo;*a@mL)fp6dK`@!!m&FJ<d6-M1A!gt$8$=V>TM`mWf}58l*s>AWhRm;`;{#NiCi
z(zg&3qZgI2rlDJY`>@OgHVIUXXxtb4HU_vTJr^Ax_}CQ7Xbsca7J&^SsW}#8cYb~r
zN~#^@aUJ4>p!bSb!xdPTg$WSUjZo|z`M~1?rQ0W5J#kd%fg@r~{94=5FIvj^7gX~R
zmWfZI%qKnqsbrqfbRWQmt<r4l=KG<h%zOq+1YlpLV}`fvl=jA-&8Ww)aPH%-wz0!_
z7OMb0-t~X+ao|BcE$`$|En}`e`dl#~pg&dXu7YFBu+4btyLGQ|zd`VrMgI85KQ;V&
z+hEX~P8k3Fq`&wACiMAvLrdA|LJHdW2?_Ms_RQ5Wk#1b|vNES>^&jIukeq|C=Sp6F
zb2}s+|0uQQIWM(FUHmmiTXG3hZeE9#^ZtntqdMudV5yr?@Lx4%--s-$usG>?)b76R
zR26y*mPTGl6Q2;KGN#z7woS^~o}N4P=H1ewgy)cs<sLdNK(<%P)5n4tKr4Er%D6zZ
zX5_N6rz#f>oDLD^MTh741b!e$NakF%Baxp}&IzHpj8W0aly=LeI=6&R4;D4I!ia)-
z*H$r<Z|V$W76J5zg(++XTVCE%z4?l!8)z#_b_>CO&9-!pSH4>VVmd{SO1#FZqKa3I
zm#tE#c_TKxGpaVC?}CkM!)1Xb!;=>Z@v~JIL_z)<%aZYmzl-cS;4TSzqa6*NX~{I^
zJTVk{Hoeq`EA^TM1Utx<n#)+%C6Avqmy$%?am?NTSw_<H>7Z>7Qmm3a&VN3h-%Pib
z%d9eBz<XWIjQdd8e(HC1k!|Hm^D``mKSOu<fl)CFhGMV!1c=D1SHqkWOzNCW^OevQ
zjIMrv9GX9u@BcFI?qz|2vdk2{GF`4)i7S=5Un1sD_2wZlZj&L-|GX_eF_6N-*ZH4H
zhZR5&j5LbrB~A-Djt|#VZ*!hI`#;w+0^xuDUl*bC_;5wSvv$Bb2B!SE)YNCK&Gc%p
zu|CphKh$8~`eC|YtIc-P(KyySiTS5GI;M<?JkQc1g#ZjI(BKvblP87ef?~N9-wxka
zRh9^Y%VjDC1tujX%W6JPIODQ{*M9+?{BqyzCCu<u?k#>)z*{j$Ow<)YZhn+1O!WXk
zWgE*b9T%pJzoVh5kH=)Y<lNp1{P6q&P-|w{Ew6N_vx>>~0pPyID!#&$H!>QW&I*Bz
zG6&Nsf)=qFIwGd^IvXPjX%18}_nohrf>gBv#C0pSt>WrpoZ|;;$a^Lu0ZPl##VI4v
zBZucXaLAfkjvnb_JHF3i%du)akh&*AOwEslbXSOX=hju1v7H@sk#AP%I;Z8wD&q51
zGT53k`4L9l#a@8o9zDUQz%sxvbO0cjI^f6Y6<on7N;!|KPCo;t!%QLWo^7OCXB&k<
zk))>B&>OvtHumQ^N9u{W*Y2oK6siREyMQ6ebi?ew9^?O3)_IPMP0oeQY7XXj&kBy}
zzwqz6lEV&Y{Tg#>f1jF73cs)a$A(a<)8GnZ?%cmIf0Sx=C+?hR!=?cW?d0)*vxH~k
zqjGL~yIY_Kb?3A5v;X-5pq)R8G}vO{2u8+yX!<-*;fhQD9TarZ&y{?-AH0q1?{#}L
za0R2Jl|ndIWE@V?ecE5e6!GT-Jmq!k`Tda;jz)1aj1?)F@op~xe@oXFVk*Z53XWxy
ziZ+&gc5bY|u8|0SQ%@vSW5Y77c`C;z;e%aDI@u=mD|AYhZ=^8M%Jf~A1KKZy%21Rh
zwMpdNfwY57nxCz6_O*gl1Y-<%(hhJCBS*+G%o#6iA6IzSY*3JCO|4#aLzS6hjf038
zK4mHXm=1LG?iQcI7L^xai_1&5BB{L*?CgX*oB~W>`HpHy;qWY4d4j~2@TN+)vBpBJ
z-dM%j4C#ai3&Dlc=_5X2Gk>WpXUY3}!_nRC_zEBf0zeJ~C9`M@)^aF?CG~YJfGq4a
zmJYG+7OX71H=y^4sp7USGmY+>ehNT|-lBzFJZdoqRcLD$)B2{@M;C3qk=rq!o{@&_
ze9c9bQM+{oD#!Bo^lFL=Sl)lE(tmi-&l9Gfz~@4T3iVXO3g`i8aAsW@iLd9Y6QY}e
z@Us)SqX99R>N=qmqfm8`a@UiV-T_1GX}!_FA_*>FKui}(JeMsl^~IMLp+Uj5Y8C}c
zqnmDRzwOJRM^T!o_<Zx1xq99oTlc00<bX+~chhf1)sHedf;j?SSfNo%-?W=z-tZ{L
zcd}r$cA)NWMUIxa26>2%n+x50K!3rhNJt=y<a2mjIH_PYj~^jK=8Eij<&l=U$^6TA
zqZ$kbO+C5*+qI>2e{I5IOFlQH$g5uw`Kd2(B(kKG?V{jOKG(`%C8E0<X8VadBTq=!
zC|~xtFJ<EzU(d*>T!0V^KR$7_ZYZ%HSAWoTX%GC_$(b5emo`3GX0L<s@HR^>SFS3R
zogzSo-UEdh1dJ_Dy}tXlBA`rSLTMCaHapl{1Rvo;ICg=D7KuxMiaT%6YFwptUb}!=
z7@zeDjMmu3MpL1ilA3nej8D`*l0aeWQ=b|q{?`TjueEvLb-o&(^>B-S9>M=$cm}6O
z0PM$kD(WbZBlsy-mAi^ASG;Jw<huWO%21Y#o1&jS*Wl-R^^a4JR?FiM&E^eq2{zJ8
z>Uq~#&5m|gnfr3Uzg73>WfM=gz7N<wdN>8hjHja!H#Ljy<1)Fy(S%eAS*)^V;n7+{
z4$$_E4{C4+^7I;3kJLO$Gkgcina977heoH<Lla$U#|qWQu>G|t3ACt5ElvR_Yy>**
z6o?pAas6WEep~ec0*g8~gW^~bQLn@&?<^Mj)MhKd80bk6pz0lrik5>xVXS-@oBW=-
zY2Y_zj`=sTHy(OF_$XfFW2Akn=4)h9X(Sc?o@697@=iKKnbAmh4qjQfP^^6!O0c=A
zwI1v4Dd=c@Rel4?F3fAcX1r+?FRs}EcHq~|Wa+CZfAz%GA<OI0;MV~bXJh`O7<YMt
zMi}5Qt{oi89B*_{CiF(p2+Jt0F|sq5zaXS52DJe*DugWz0dcl!m+j_d5rEn%{U789
zb{<`uy84Rz=ifnQDN^7f#3zLAAs?BOUVJrl5n2B8Qlo6Olu%neNqbN%O8&&-$O$(P
z`~lAko=kuEyHT6^Mgo{*^4ZBxyI`4Ac8b^poBg?<vjZa^eDrNiDt$1V2$<<M><gAA
z1th-U5N=Yqgw4;y?dn1)uz>&WPrHLKmS_|@JPmsXKmQ`#cZ#99Vr)VNxvQqjz)EZ0
zlM2LF*~f}wOPFL+%JXsp4;^_Ws`ovYjJii!d_7hHw}Q71?)uQoF{EhE>_IHYWp9((
z$FzNQWAyf5EvTuJA{)PMPpTo281K7*$c9PDf!xI-t0H`zV*6mWU%O0}Hh73E4i;@j
z`GlM5kPb)_NIX{vvWyekuEkV{<L^8+sKNjvz%_RYKc>1=$6cgIS@i@aZHH@qtS)A=
z*#kPgW)beWRKJiP%5nzER(?FeK_ju-NmP3=_vjUmk~k6(D|%@Xp8>Fw&*DEjWr8np
zbS^WOj{hrLdg%=C=Kg19{+|cyo;(0xTy|yn<Nv6A|ML|*KW0wUfL>G~>#%mK;v&c;
zq><?~l#RIrsJ(PhhTAcMFa+?^iOM=Y<Sig=_PO3>o~UV4_V89bsUb1XNt{*!d8u=;
zNooLT`zu0eugv+@uf}{1&k^Os4f6Li+>mcd60u41z$_J8ZrS_e8U<zIcqLv$77oLG
zD=+>882+q5CmMDSugt~Jaqn~-tF@#ir<w!1CQ_a6>*NA|WG62LW7Q}rOs?+=<O%~a
z0TR7&?9xL^Ls{(m7gz54TZ`=B(gA7TbQNf(GbndGC|WN}D^cY83k6lH9R^Bd56-5)
z<;ffM)Lu^1lcF32<^_ARwh~O%<izBg;j3h(TODkBeWwD0;t^kOp_T?qZ@lwiNzNup
zsvmRLEvRh1>5{P}1~-+2P*3E)s{uge)VZWjfgzIT(7A+ObLgxqk*z+-e%ddH8D<GA
z5p2S<cKrf+6)mRitW8e<5R-BLGT-t7&20iR&~0vM@<)V~?M}()yc`?AWP1HUVFb4x
ze~MdA|IX?UP7gc3^2QvGEdFDAigO$zcmB}*d~%1=c2~oShqvbHfN^`YXQDX71xON9
z02OlcHM(5aT>0W2?#8-;3J5b)&MGrh6|N@{59Mbhx*ObWaa>LIb_7dK3|$geff4R4
zw>+GicU1_eSa}Y@DqiNMgKo!+7FWntyNDW9ec%#-Cjq(A-05;-$y*yANPt+AE*U7?
z@ji4<^{;S*Kzqz6Q=)#`Xrfi5f`2gLj=Bjk>I0gJ(KAiun+gh)ir@q$CHe980-Imb
zCNHLNtSjPJDS=FH4+Kqizsw!*c+s*A6Y2&^iy3_sJQDRzv$Zos$|O>>UTqnBDbIb%
z(R}J_@9E7r8dYajW($HcLeJgV4CQhM9T~!*>ik|5sAb8k-x>LAvPXhvuoGG`vALc6
zmk@+VG6Tq0$S+M^FZ{Y9Y4qMHF0~(hS?`hTC?<ZTZ;p<1KI@`UjPZ-)^m{zGG+=T=
zKc+J}{luDvW9aciv@h-}6zaT2Bqf<8VZZ6BkDMi0R6qG!@$U&K4B&7^?F@g1J^^B2
za(;<AWkqUiQ>i{LuL5g1PxNCrzcf#KPkT{^;ksdVKR+o6o3Y_A!NQN)^|{jUWlY9&
zlX_mzjg;M|W5!6Mb~*6gQ=X`E@36j?(_eK9Vk`r#jmD+(3HQJ5;ew4Z2`2dN8pme=
zlwdNNQHYy@P9BsE5N5qb_4*q1*iI>0bQs-a@MF*geKoB1(zpUtTq1(%IJyLFjw>nG
z(AYlDUoC=}1wpHVPR?%bT*qAsz+ibs3e0(Mt1p?qS6;-TMTQRcDvJ@-9eW0tF}$S4
zzprsFz-e-@5nm0|P@k8zED`rTStm|eG)BhTYH4-^&`!rr+3u6J^2n^Hol#{3B}YXs
z(`o7W#Fg#nNUwAiJu>d=WYxlHKJRt85TOmY%4Mc&giG3*!wHEUEE2*K%%@x@K)tYV
zQgz+ww`9GzAKXCJOV<Uf?SJmg+7G5aE)F_79aU(n(xQSf>>B60{{(&k(+SW}o<zgI
zRcR;Ap||=nxh)<e|0f<HKgS~+x_!2uf0M)cx5L>W2jnW3rVi_bD%8f+y=UBer!YWS
zy-0?1O<nNvrT4_);nVJ=;T#CsHJE|58i%LCR>>tYq~=U|l#!c{b3}L$ScXLS6Krhj
z2_MFJY8-*ob%pc9JBrf#s%nXl;8++LoC~3JUKK$m56Vxl5kwq^g@F=1&M`)zuLmxK
zEUFABxd*s4=Sq!k;3DEDWJQwHm^P1>%sLiO>|O}K)G`sen{Vwo)^<*pZ7H{SkGM!g
zSrL7l1G7w`W-L*e;9G!$N97N8uK|!hzS?fU2pw!hxF!CgppR|pr-4x56joJ4c)9Fu
z1;NqzHnsgRkNM=CO8R*N+fGe{X^(Lvr}txrDP{7}+Y@w+%HG$eg}xb1nL!c^>*8A;
zhM#?YAHs^T#Z>|pYAw(`q<7owTnc>CPrVtiH|en1s^KrcQjnY{iXtjE*}1K3hg`WO
z1^&J10kmJ!7=w-G>M7?qlOJ`4`%cB6PJffK%lkc;p<k?X`dklGks7aU*#7m;=3M{j
ziF?a){=~%<FNyzYw)8L1`TqpJ57MjvVhK#vo7k_vOZ)svv+M3t=ehb<<{OLKDoeu(
ziAsEVEb&?G`)%aJLCH2-%e$E@oNA|uA3>y@yRz)%%3VdlMtFe)+~CDRw~Sx;MRIeb
z;xK7`#J+j5Mhq3JaK=qXn=Co6YM>>vYITujXu<{BED<Cv74#x^f~?wAM%pCzC8%n&
z%pG?B1e;sWeqE)=M?AbXz`weotV~W<6kz+p-SeCFULlEbBKKK>NSZCjHv?R0LJ;&e
z_aKmOom6_=hI<uFf$E{{0ecdL0f@VJ3e3qydMph_sp@FfBq%{qd65FtfX4n!*9lae
z5Za;a|7hlG@d?P8sDHEAXH(g9vs5oDW#{%{wYI5@RU|woRluY;o#jL7YS=|4BD2j6
zvN0i+8`PUGllH>fYjKbtSlP=wb~9u=LvgZUGUy8s1TPTZk7t(_g<|u97NYpok7Y^r
zR0D_<9haOhQL!;pn}|jI7*Rx^?Ks4t<@rz45A+pvBZBbn%pD*BH-wW4!u7J6=KWk|
z7T7b~P5k%&)*Wqo4_uym8UFQcl7H*JWS`%!e%Tos=H0Xe29WjYBe9yjHIwOU?Z@G}
zKkNLt-ovV?g0D)W4zElD{oWFf>#aIE6S^_xTxPCSWG|Q|fuRD(<q>O`*OaGet38rS
z02UF<?9I-p!ilpNHHBOldTRUY(!fV!_8~_U*QF)-OPtkQ1&X+g>tIG!Ly>A;RIDR8
zx64@M15i}LU@pSI98jxkfo8-0ShkD=8q9@x+Mt+HKI%lUouzjg4>hBUk|qN!;~cli
zb;&XSbwz%~-S&Q9tNrax#cRt$v}Qcp1PiG?Iu|U|7k7o$NXnMG&j!+wy?6N%79^gQ
z-pR5FvRqKz$cfY6v=aOBsO4>1e!)?++G^D>3z_^-68Dx60sg!&f_VA;O9i<Ei_-D>
zs@H<VP<efV7^^3=ElJH#)o3WH)mB^FMkDZMoZgcZ%b(`~Mhl1K_1baW`XAZ;>bDNa
z+-w}&YB4HjK$oF7e_j$KkN{qkg0_r1Jipr$4&7~ef>*gjL&f^!wIoNuBi=521&y!t
zdU{mXY5ady*v`-5XVAH9lHav;?{86#`Z>yBb02K$tBCrGw13w*#k4HtBQbhFtPbcO
z7ssnEVbgXn){fNidGOl}a^%IEu59xnY~W*9{fttJS&L5;N+GZXb+EaS(CywLLOCfV
z?RvSOC*dybmQlr&@1$nKQud4?mr+Cv20B-SyuunFz4VTT6ia2TgYCIZSNJ64iU6ET
zssN5IL~Mi+H0up%1)+3rsq_<_L((tK8*IlIR9%x0kP6cZll7$i3})RFs}^wHBvYo_
z;tQd+WdK$6-?(m$cT)VcEKoGKOVB(j665&H_JV#Ma!gO7Y6QZ7L;AQWgFSxDym!9>
z7Yx(cOJ!Q<uxxr%9!(px(&@LBR==SC@oLgL$Hfd22UW|>lC11_^*ft1fnF%3U*Q{f
z^u5iT-Z9hWjgpJuzZy1znNI}=4S1K8tN9Enmo#G87^C_UOwSpW&#&cBb~!Uht*o2N
z-5iB4MqNhduMH498dcnU{(evCBT%{5g)h<1M;`wGgw>q)Q}d{D<?%;vh6dmRsW1MI
zWuyX@F=Y*Vo>#A1y{8HL(AvMTxc4Ne?_63349iUg*#5-tci~C4@7cH8DodyZ4vvhx
zWUj?ybU+WbClG0SKl}e5k-2AkPF-SUo#vMDN?b|S6Yr{uV%Z6W%x7cNw>O?^hK0@S
zFWa_bHWw8ewuf&`=qj##O5J2c(b|x_5C&Urqo2vjt|Gg)7-1p_BR#PYW`H|X14A>X
z(l-d3K*IXcmND+F(X<<bYpkTmm<DezJb~)RYfAm69>HAf{XLp5slMGk<(D|th*bhV
z=+VQK_wV$vcz`JcYaf1t+|NfRa6gAzgd-@8lf<Jm-+UtIGd*;|MG-=j`dX%zM~foD
zC}@+6xMcd{fW`@TrmbiktIJ&+_1-eFW9)zFZ`!_&c?-4%=65+I^f3z?fwihzQUE87
z7GvmK=Je5`gDO)-dZ-PEE#cp&L>j4tkQv-iWp3eW4k6=x@I)nyN6u>SbX4COV4~de
zo*nmK9gH#0fbbnJ<&7q8Y+gLoarF|Q)S$m17S<;!En9w#jQajOj<W2$y2lhjoKT6p
zQm6KU$?1Aayj0Y>UETl3)?0=}xwdV?3q=8uR&nTI7&;VXknS29ln#LbMTQ!>MOr!r
zq(f420O?Rb7&@gxrCVU=dN0>{?)zEq_q}ZV;m<W2bDq}``>`MUe&NIYwS)G5zx)3?
zLuy?9je-xBsFnW4ee(RNq~Jn(rae@1Hwgg21t{@a*m~#4Ge)}N&)T%lKBWMM`a*;v
zx}Xw3zstLO=38gn{#!x;Q!b#RDZU1sk$xh)fgtbKuN~P42@IjWI1v>&`e0F_gxw<a
z*qsMf1c|6xDt6O+Q_?R#GTzoQ3Q$al$o(uSOyv<t69?*0P{fcA12Wn+%G7){VexD;
zz2z+rDqjr{%T`+H2*#}5m@9q1HQ$bvVM?>CBfVk!cvm9UvOU@EZmYw}#6W6WKb`Z9
z<419~z)~>l5f-akP%rMwYDvy9m#?4kzLNVlDf%Obh$!Ci=)acJxChc)dI2z&X-fhW
zISdi6f^v&&qFqyFImIHgLyWyOM%nBx3W#D)y6=7KpUzo%a`?TA;IYg*<Iiti^tr>w
zN5B32ETyAw@~S#nhODvxn^RJ%V#e6^?oyj6^!@L?dTICNG!Ev+0bCz6$<0?jUte#f
z6TE!>?Vw8moG|2N|DHMY&K-%Fh50X0cS3JbY`uFs$@RW4Yw|BInXmK2uHQ^5{xZi~
zZ>G9|Kk`E&Q*32<Zkdv@PVz?M@5;t1;AcU1XQz2Lb-Agwp7}`x3E#@i_4~%CjRYk+
zF4v}*(JsU!6wVC`6Yf1ZN!P7x`EkA&Eg>utlLrjX9!*3$wmWqt(nD(eK!9-Lb*#kI
z$y|RJCiFtH?45iFPr6J-e=h;wF`+xY=nV$E=(h@AAU`O6|NBpkGzuVMHXTRJKOQ}w
z?A8+IK<yIuN77L6i*RWN-2FY$GC%Rlr05Fpi}^t@=|MikMoY6B<TcvhnIRv+n|B=M
zMpVj@h%WMfG%||o(WpK?Bz{-d8g(BZTCP1p!LGE5Q0kgK-~HbY{Zb?Ih045^e%v>g
z{vjS=ls?GDGAU9Y?kQ&6kUl5J`J#+@6Wt_;yE3Esc__F(a>~6vomZ9cq7r=O`jM>d
z1C*LahsZ7&EL{@2guOnuPmxcd&)%NWs`0k;sS-~SwRZJ3xgZZEw-ngOk0YGxpWnLc
zGb1#I-g|&z&ec*(5O_1@plJYp5f?F}I29T!FaH#Tg0xDz=JFxrAl+Ipb1t6<cO}rd
z{I9@JYuBOL*B@gzhW)vf8zU9e{7{|dMjH{YJmphZYDq2~q)k2`EPgPGS2;#WehB)}
zTjP6qR+t7u^nHV!1%>5JlCWLeAXqW4dyD5J@Qw?CSWy+RMPk1Yd#wepc74F^%^gMe
z2c&sa{QO8^Jhgz!R*ND*tZCOS`d8YHla8<H&pG$Aq0T<o;*y_SJsAMxKsO1y`pN;M
zc?5|6FO4erjZv_(RI*~7ydHIlYnJc_yw3bM<)q=oTq7tW1^y%N{eK_z|8??NvXCD{
zm_0XBEe>NMrQPc_)yD;rV_n?L5{X%s!;6D`%3?Pd{BtC;#>$l7854>l4fP#j4#ts>
zpNKTG2Xn=!`q6WdtC(05$Ynjth!<fW^ELR_1-nOaBZJ&f_KRng2*nM!U4Nfmfo#_y
zs!vm)2TE<q^4(_a`ToRh&|zEn{?++zZ~bZ-q#)h%6D0!#@s$KD&8;ZKFe(vMQ6m**
zLvH?L1YK8<TgMH}wL~BqmIo9f8F(xO8nzOOuDj20Dv_0XFO)1}L$gIFeu;EEhvdG7
za#&fdi>r;UVJPBQmSjUi$f04K`UPtA3KdV|z=1Mxu^_PEi2Ph=6fPu2iA4)yG-Bsj
zEmLPyWffU<i(;Zvj$ogKAM#cD=;;Xic6F@G1xvO%{SByV1d|eo9tCrLIOB{}qPxan
zgb$eX=U%`r9arHhsofgcfXJL)eRl+1Pg)F!Vyv@Wy(*|rF#}sTW28z}AFG?ph=O&3
z&3Sx&2c`9|bk+R`;I%|P97gk>6Vle01-Mf3Z!B32uB_g}k-3aM;eHric_@`6och!3
zoNNwoI_X~OjyD!TY(t`+wf&TmSdlg#kUz^KyTo)&#+>+Fx-_NIHpqtXq#AvTKgDZj
z`+vRe|J(t%C~!QfUet*k+ES*WYOW+x`e$vm@}7O;l9b{ee`1AyKUm`pHHk`gY@RYY
z3O}H`M{)Fg$wqL3=jZm7aH4}^^H<9El8!=b%Ix0rw*UI18VK;{M*6SEGP{2fBAMIm
zum)@djLuoOb)TRyts55B&_JK-x#RuczbQ~^wRWg|C3>imQcw@2HuH2oVN^%x_XcG(
zwWT3KAwI77wU}7w!V~nPdPKLm$LkYCC0<jttBJDoz7#P--!sdmVB+t2Q@t;Aw2(h@
zY<B*_?rLa<%HGy7FPWe19_SfbWR@ljG9v6w2rUQX$X)RDv4y#hFvC4`>hcZME#$o5
z@i-@MutLb|q8Q#H8TX(eLOd!hmhFge(#uaer5o5tayl?V`t99#*7X1qMB*Z3(Tv*X
zfaE&znN1+vc^D&n^t%@Z@fjHio{dYFNu(W)pT!Le%p`t{CKWo!kJyE=qN=Q2Rpjk*
z)qnrRhK!li%~wcwU7@P^_6(L!VPvf^xFK7aXUC$C{Q2=zB^BMhN07X{a<e6Xv3o^o
z3aPI~>w}%5&IMc#ut0F%@s_Ls7(mK^n?``+*E>F)PtD6CrPQ1!GX;dVE=~^uP7f0O
zK#_LM%C8w4zFsi?>rnoG!5>PFryd$PZ*AGDbB9^9VJ%93^W%N*{=bvMy}$f(N0ym2
z^Is$pj;^m46Ay7c<^<0CAzd??p4fleLv2S-@oef}DW#&69LOQILDh_}x@4G`+VeRy
zOG<IOUg)t>-ND$)mA(u}?VPwqgX=bP7lTs-<u<c&!76h*Ctg3H^%D6+WdeC}a`uuU
z)=@t>F0N9G!QG**M6X_p^mSuqU$V#`#dso*A#ZPDxx-TBh$V~%a<eCUtt!J=r;=18
z6hkYx_Be|oL|?iu6eF({Xk?%sjiC{EQ^#IP_k;z)s#SnoQl4hwm(~jmHOQ6@dW-AE
z+~%M{arz9&+^(l;W3_}$gU5aa#EQg%9w$9klxO`$Y6(Hm;60#6^!Xz!%&A+~Wu!wK
z`|VMPwMS%xIZIfTg$*18#Jkq<%b(X`#EKTiF+<005uSz+*N_kPK?H}bn-d5Lg<(L^
zuCUFJv;$gD12SPaFT!{;J~8pZNqEFw<lW8N!xCe$Go8;8Fct?2A^hi2Fy}r}m-ZO(
z+*`yCu%>>OP;#gBiE3+Yh0xDJ9|O{aeZEH3$H$l*Ecg|$XCKwR<xZobPxRSVx*+Ag
z?)v{`_5X%?f6B<WY#l3G;*eO!=qDCFpAhz;CC&*Se=7eSt+Rd*Rv^4sm?FwLYa$gf
zSHe2KFBb*e#PMsogz68nw_a`iZ{n8B`E$y$;Pve-1mW7q^7<xD!98WGR^6t)!B4_^
zD9ay`npa`~ttD%cQ4?CeC-kf0ni%UJV<yP1)E7%9NHM~cH<g%P8p|R;gVaf+WUfMU
z7YOy1O5|!<z3ThG0oc>V+=svADGjU<OWEZmp&d&aY&n5<Tj@98d%T#mhUbr^MsDi#
z1|uVNij?Eo(BGGf^b9%`Vt6#WR^=7@;Sv2~d2gAz4EXoK!_UGV8W!vDD9Fp&rLIdW
zvVhs73|N5Q_eHTF>kt;DMme^;2)Y}rvI-kW`7GH^D}2>6+Tpm_(4+{tWI8`2cf3V>
zhma&l$TDu~adLO$1*k@ewnjC?<59-<Zd>k)PBuyu47aY%FM_pgS(91H>&Nxo#@BI<
zwdg{Q*yWB_s2-%k!YRW^I;F{4r;teJz6Yo(&{6W^(nui<d3gzkT(U4>+mn|q4Yw}?
z()PeV)KX#naxRug1fT$w1VG)QOlGNcD%P)V>dw5P^WaM4O9B=zHG%oYFXWS`Xj0-k
z|HSG4XH8cD0Ry=`w%NKjTwzDOJZ>veUu4AY$Y~F#25P8oa8H=zH{ISE@|r2BNXi~m
zdCz&esiz6v+}=?nMD{wN6x#X+zy0rx@(02@TZf%j-({%CUpJ;en^1^PWc93#di_xf
z9$d{fE3l#x?mow)F1i<3{pNEmohKH|S@k+1#tgky8&+tQD}+*T&}KHyj~lN9x4jvN
zY(Lx_UG9FB5lckHsuZ+@P|`&i6eoIhi<cU1?k`!=dAPRaD(%ngQaOV@?Vsf%Z|S$f
z<a!e3<=#9mW-r#7=-K$ZzC$uSqLgvZaD-Gu5d+%Pa*-%^l9k6s#IPullNZTE1cm-7
z?-fu_N7#hP>6GO4SQO+Xq8@K_dm5SDe8=KKX$iwIsY*LPMM1Z%Ztg=Cvja$&zvd`J
zWlqXZAVC~d#s^`K71v&NT?o#MQ~RVgib#x=ore3#(|o&)+K8~dO1>V$D5;6mOjg()
z4dq1&r+!bSzEoituiZm>Z)GdzL<XuV>&R#JduK6Po@vPsB7YGW>P>8QOxK>i3^`31
zTuU~c{KgPQ$Gp|#aex4(ExhnY{Ab@w^hf1_gJk>NaRq!tGh1A^ySf{)=u4-4#Hn_<
z`ib=Zuo?Z`tLT5%@&3{fhox8r<<gYT#;u<>$FY-S671C^3t#_rggJj|?!#|KT9(iv
zZ%YD{r@{N^yN1poskK`alN=OGoO#4|K2{Bmy<$zCioHKgNfg`~1*KHAw^0DBMbhF$
zgoAy3|6SgR{VDHo56>xFAK}B;zjFB)zkg~yt7unuWnev>8<sF7o2aZ`FP(oSs5)J3
z4Y5QQ5)hCwbK~n0TKyz3H>{a{_sELE%sRw5F*X^@*Yr%@_sX(qtXNkUXc_-hg72S~
zJ=cd@S5F|n_iAa;48NA3JI9o$=tGq(dz3tk!<u@FLX^*aQhRsf3%WlDc6D!5J2&fV
z$SGC9-yarrFjauLw220|(pqKL05hlLzBD0iEiGJrC4&e{XlM+a>v<tl<91DI_{IB(
z#ZW|`5+b1+{FJ7Ml0Gydh93M$nl~>>)fqdb5<MGbMwk=B2v*3siI>>ode<U6kd*f5
z_t&k_V3LDgZ#im4j0`AK2|M}Bw8Bz&Y2~J@3eMIy0V5OTbJ4*{Box+CjY$R?kfH28
z?=|J8x*L4~ffBIb&yQQ6skKwJbfyneTVkv@;)h<*p=<<A3qzJyY9pomoNXC`fhAjo
zg-+%W{6-^4J)qgx7pvDV?z*OY?-!5`8y4FUE3`+7W5bqrDfdqgs9!rz?#{XN5*@0q
z^LN7s%Gc(X1d|7W8XhnD%aLT3cl|!<f`~qM8*h85fUz}+PyF17zlxcU4@u^C@!{{I
zWs<<}Nm5SK{Md!hnS3U)H*04c(7^ZaG=E7kIYor=bkpk5EgVn<cN?`D_?eb2T#0=1
z`jc?B90*y^ylhI#oO?qu<LgdT&8e9cLT8(LZCSWrS7!Y8`)RXbFLBz3|J#&g5&r2u
zneiu5=l96pPNuZjp~p&0UX<-D=t630$QiT}wNSII*J`nzz%GGh<aqZ!&&4A_=8|6U
zEJrs9e=*=oRw)%c7ek`2b9kuWZ6%){;c<HZbgv*YuO-e5JfH4vu2A&BXdW*mJx^9>
zZY?P`wyZaGFvfAgyZEvyuRWGPu~sca83ZjV)%`WEZ12O9=_jbE<O~-t0h$UM3d)73
z+E=b6Ajc-j;JK{xhiyN_&$l1|Db^K%9UFUIn=6KpCyZiI45edp*%))|(1XAYM1+Lp
z6P^mW^emB!gU9(vm*k^VQA@z&$G#yU5}`CO8Dpq4DQ&flE126@(||EU&nBOoV=<O2
z>Pu@sZW1w8bXno6A;vR(W5jG#dLpQIY+yW|97h<l)b&vU<IYY7p$43coj4Qm%%g>V
z2A64DqYW06Vs&5pbj%ZR+k6GnPWcJKy0w>?4UsaYJvbRg`V|R)N~T|l2;&O5%tg}r
zDB+5q7sZ8(_U*}n78I8zxlLP|XhT}Yrq&eT#?1!4=ZCt<B5q|>k;o)tWu<yV^HoAr
zOl<7w(%;2E4fTy<(t1-@VAuZTiD}n0CxBLwZnVS%NER96yuRcQy5)N3BQ}p!Gyn7v
zwjq+JQ-p_!X+rf95hghBpDXzXh|usR|8t!zdvt(R5l?+rorc_Ubslk%POo48T&4t`
z0z3=&<{g)YPYhhoSpQ_HoEV&|D-8erM%wI@1McA8H|h1C>Llmucf&a_#n5u^M0q^Q
z(iLqY*4X=%fPwu!r%ntD)T2}r^$U<~;-WsPlLUy)4`LRXB7`baAQ@5)+WhHpbl}f4
zKl>?0V6l6Z0-Wp!K#uf831|g=Azij6r8qe?9d)4}vx$>oGJ>0}uKfn5sM%-9f_^Qy
zHO~?{zmu!fp#}D;RlY=m40nYG+y>c#tO7R*d5xE`4I)cdQ;%8igN+N|u2wA5)@aTb
z2!NsHlq-`84!oCGYg+MAid;Vd78*vbk@|YfJf}xm>uDuRy@+oDw{=J7qvR3ANZi+8
zId3S6n;#N55`th+TGA0jvA9%OxDE^Eu=+e~4=uL}r(;~d`FNbde$3Q4c33_+@(9>?
z7EXl)_fv>bx?FrK`}u<gM<$Hr{z=R4ycbQ9d>Ba|(1NY7UuAB<B8@`JU}aOR3YoHY
zm$6mZ(e%n|Z*RI<7pREP9)ab{M-+!;J&a2c&lRgCnJ{F<oKl&Kfot`wf-{K$P!`=N
z5N^ti&P|ro$|$ZsQuu7^ruP#e;gh4?1P*@dU$TOHh)-Dv&Stg5qAY^f15HM$*Ngw$
zr^h$$$8lku_#&cc&^C)x>4RfQaVT-BoO`andVJ4oVpHuK#Ux*L;?^64+XSTMsQ+B6
z90eeug)>-4y!&q|ta;#{o=k4|CP_;xajha{WTGr#D>C*x*f6|k_aFS}*WW#DpJsN7
z4SeD)^Av6ERi3dQeRxQ9k_Y~sU`fric)-Ti=I;jhKZVugpH{iiBcdr-;S0FJOeQh6
zTq*VePm1zxFJJt$%Nyk>mdK2vrHVYb{JH$cYS%4?cPv~OWP7J7LL{e!bNF4qT=0t<
zpxDn$aTF9V>9^rA$4s5g`x~44b8ZWbikUIDFuIr=`7E9n23c{oU!pcF%?M~4EIGnl
z=ideGPpz85=M2!xDar#eDFVfXYWaO>&3Y|Y)|C<Gd+JJq*tp8&VxSh6-N$uQ|8m!p
z3GUZR`egsCpxBF+-mDssR*5RXVx;-CAm@xXmYkslF{yO)gpuS`v;uFIkVCf}hv`G6
z2c2V+jUnPGytb46Ohg=s!nCrAC`g3#I~I^*qWFot2>+H=&Es|Tch9W@^`?iwKgon~
z0l$^fD^CM#Z3<L!B#yAdWUFbqW2$5#Ym>og{3zNG{!2xy;tHc>)u0i_A^}WsY0Q>5
zI;89{PfX>*ErsF$+C^=_Oe7tSshQWf;rU8m@**JyMqL%nc%odr0Bnxm5|_@%YweG8
z483#L^~BmKkg(SZ2#vN6X|MV+#gXK8K*s=Xz1R=uBJfd$D%IbS?T?a;5vc!f#$!@y
zRc{6qId=~FJ6BWO2d2_XHx9^eU;-zXdv&qPNk@0AWvORsB{bB8m&YXCyKHOSa~$6W
z1Nlz&&GT}w&zbRd7FKaEA-0_{;YCsLeo!Zs`9V;Zpyz*()GR%wiYHX&y=%lndA%%+
z)aRq4y42y9KhyuftFB1=p2X7J!6n?4$L-^W3A;nYr3<ncjJxfM!l(36+gWlrTlf0U
zqrO05B=JSTF#ngH+A~ym;TtcW%c|$Jm!a>@#l^vuos8eqY8Pl*?&_4%>BnNrW3(fg
zRzt1fcp7)IZw7e=R@a0P76<ARVqzH3)+^Y`^47h?2-@S%(?|{gr!Qv#jP3N5td-y}
zt~^@nk8#$5<dzSlGgo44z?%7`hHR~CajgKZP@Xpa^X2;3PbU4OMBXPWyc(5Do*w7%
znTUalyvkxqsh)M(>Ws9NAKW^AFm^DTOwxS_{885}mUe(dtGw~Oc=clGAv0)iB#MJD
zid(()^>EJHwNM6p1;PSyX0RX%8Mj6Nig$%=Sj}*(F)qocbdYU5tVhpcOUR*-*f3HQ
z#KAoLapco5)zE~sm+cp?#N|K9hRE8jQs!!0<VB_VE=__TGjy-KT^LW|M{UZ?b!H)5
zf$WtxDIMYwyZD4CRsODA5^PIa4QduHYzxbus)e1+Jew>)+9t&6Ggf_jRvoLQtxb>T
z2^c=BkqLPUk6@YqqXocnadQHW=2QY`+_Nr3$)}OVai{X8(-qOC!L+ev;O@9SYSg0}
zPNM~C$!SmBc0^B)X6%i|Ob)E66Q{=u$MRf2T#k)Jg=K>SxBjOWzeniL<!K64VDNaJ
zb^i5yx10E52JzoX(u@d0ZQ_n`7G3Z7B3aA(s($yA{}&*pi3r^&HQeQ@C24|4{`_io
z+#M}(MLxE8AGj9`oF*%Ohsr;Z?^n>50hLgmOr!Qv`NWLGoQ2E!g7x^nqaeEhK79L=
zKP;}eVby$dB+>rx<&|*FcXH30z{A7D+1yaiE^&XCg#Qcz6q)|OfRc}zi)^F+!XJ)s
zDMrf{YI1^Kt*2%yS;kYTogmT<ZL||qfvfx|Q7by;<j8(TzQI*o84z<VjSsm?JtZkU
zH!QK!8aKo&`!t+xlhA_m>90w{-6k$ZzkSdgB6_8<7jSIhwG0(E6jq9ZZ*w*#>ikNn
zk@5*AH$xM4=|$-k<Lg6@0iKec`1vnlj-==CGh<W=rL`N{vR7BAa+|DGEjH6PHD@_8
zioCIS`mm^usX}wXN==u)MBd~3Vg$aXqZ`y%5ZDbw_iIC*Xw~u~<Z6Hdtp}h!Tc*c-
z<dM?r&;d3Up1yJDf7|pLU%3}7n`49D>p%|zpm?xRrBooo2(c!a*ue&YGlzusVw93y
zv3caLy4R~*w+&uVgJ_A2w|)uwL_T|iuQ#pO-7TvY7319xYdCppi(6Bt7uyPm{0<6n
zbq=$8pC%5|?R;bm`Id55NY*$mQYrbWI++9+|B%4wA=M2YA8Uw0lK2W&J@ldz@Lc9X
zY>X9EdY__n1sid<2nZ_xkdovG59N&Ic^rHyuO=N*kNKHOQLz3>FH3>GlILnDq+X+w
z^b#Nhu>h0e^b&*5J>6^VXucv94<$}rrSdKzU)kvk)4zeg3LlEsV-*-ckTqj}Vj=$U
zd^Bf!Q{^#3b44Jquu>iyKqmI|Lo8dzZH*Hkg@PS`;iPhA%jM0dz<qn$_9w^wlL0ky
zC?@rZFhckrxJmjdDrI+NcANebZ<XZinJPm`BbA>K-oPk8|9sBN(3?VWOi17R)tcDB
zze;=-W&n(UI+lB6LI~OGo#v+R!^ufneabq-ps&%zda7XtvDl!nx4ns#z!+$xLQ3qj
zG5i6a{sz_-IL0_TV-e+4m~BE#vFxZSqKXjIANmq5-%c?N`%KHR-AvZiL%<l}68KEf
zsvvDllPKa4J)0k>7rABt2Ly8xVrs%yc%=egXc^Q@hmku#I$Gu6@bmr6a;T-{dpbu4
z8==?NV(A&5dg~b3dhO%$g)UL|KXH8>r!t4Uv|DJEUmNHdVgHyKMT`yh+Nm!Hze_wd
z6h#FQG@u_8B1Hx$5>3TfZUU|4JKr@k0%;^5Mn-2%2?|u8bj45%v|H%Y0-3K`=259p
z@>*uzoSuAEZa+2?*sXK3gp`lm#>BP6Na>cF&_|GP#A9;-P6=EDp}iuP97uZglA2bY
zA&-=|+L098#fSv0k73i+%(`&HHw9@47^k=&Q^)<ZynM*jlx=Y}c>$hI;c1V?tcB2X
zEk>V4(3yhByz^C(f8|_j6+{O5RIqtIV$nfXCGW0f+oKNVydTkS5g(DD9L$Z7A6kB@
zinz}h4LuPB2Horu7r&bizF)Na7LCAt)ym?2Cs9>w{}Wz*6C!Ex?<j{h+x}p(2AG;Z
z(*F1QjC2?D+!EuxI|LNrf88<t?}$+{O#bC7Xa_44YV-2_owJ;4;pULq{D0pf?fjgC
z@t1d#*KH14T&Ew1?3P;?-c8?KqX?B|(p*I(Xqx_kt^Ru-E6{}QfD_-1wMKghd_8mD
zW=eCxHwj~lgKNB{DPu9KnO+02cy2ssmSyw_2T_E|2XxCkkG1JXd4VE*8Cx5J7VjVc
zM_3Lumkk%Ytk%wTEj7S<%)=mTHZmE)=)=9+a@<0>#5_!E_<2^DRBY*`!eju>DsXZH
zu4utKgrkF!YH{ZZLdT^{3~P|d-bbfNTBQar^mAnAs;dQ18;;lU`H^pwJmqVe&btTs
zEe4nmmAl)b$WxzHIy4D+>R%C(&n2aP1OD0BJ)7wmD#Oojpa7qbgfN7TkDMJ0l~&AU
z5DzYiBJH}-(F4#Tt;Ys}@GunTIB2C!JgX`l$9*4!S!zNg9mq~b5G9(3+MXmn$9JUE
z`b5FLM<jxi8mN<hDMv~{RmnwRIQ-Zrv|?;n?zU3ABQgp`2C<8K!g@LMM2qdr+S=OA
z4hPOAz(XU3)k^Iw{Egk`*R<Ho7`?lda2Ocy@_kgR6!wG>pePTzOpz({qhHCG+Xhku
zdbia#+v!5(RiEnhz}y`E(ry3hooiPEqN4At;ums{?<3ndk!vek#<sgG0q!iQ-V1|3
z<AM@DcMu+b3EMm^v-m&LXegC`8>RU!<5A4h@m)}&D0n>PcfA7ByD#;tZb_qRoA<u_
zB*Ng`Yxy^l{bc|i%41ko*+O2**IcfQ?%TqO)lxP?YO4+!cgKx3zL&2yeGsz9?=yX5
zFXFWnvXDV|vIzFW#lz9)+<mmmGS*qiG&7|YC0+{5GsvD1A*WkyMU=`k=JnHlcQIC4
zmHLI{F#S&C(N>ERyK=W4s|y?Zq(4*YT<5+geQGtU%Wrek_wK`_m2j9aTWvDHdH>gp
z#q|zQ!nqbq_KU2r2qHD4w>AjDN5jLr@aQMeNt>Cca0Xh3d_-P(JpWn1vmzv_jaB{W
zAg&q+P4z`2PvP8%r=f3R&VazTqKLSU9&-N_XHF)x#sr;{OME-n>yKgdW43QS$arcy
ztGLpax*KY3Jg~*m4QEo(n#qGv48dhw1L_JX%)!-hOnCNvIyW++G8=?nv|O!-C<NQg
zSV<(qY#T0cz3x+`j`Tu5Lu)EIT}qn(z4^Gf6xPN!9aE_LdTOlF&b_^Ye0<FKOl?+g
z#_)Zdk{7!vbLDb;b}(HGb`sJ?OOwnYvx-70Wx0$l(@OH5fr?>i-lzM^{J;{wLX$H*
z^-2;p2Z-<)BQ(yEjXSeQ*M~blM)XZbh$=B6eg^U`={m2qKO^Vw4!d}d>`xJ}6CHg*
zE8m6?U(*%@3D-QnZIP<JM$3^PB(w3fjjbj76^rIHMurio&6a%EI9yQ~BsR_dgw-Wg
z5Vmd)8-@(4<qTN0ybO>Pu^8=i3D`3qeRqp^3D^Wc1)5YTX9BE7ML=MD*0;Uvb8OY)
z+rFUNKcpoP)lU*n6;h{On&9LJjN|&zY4|%e*$SrK7c%xHpeQxXYx3;I2yt?bQb8MF
zf_{$;AHKf&YLQhnPpbX4R)MRSemyGa;&fG3zX55TJ?re60&}9M-5e|9;waWaTwT=j
zYkzbqH*77_sM*(E`Kmy5SSufyQu%uC#_4gU-<@q6-=o@^QqA_xk!pSIBEy1~gWXJk
zyJ6W&9AYWT*ptY?ReEH{)1R`#TC7tF)aJ=0eD2(#1)MKFJx6zX%G7DbcgE!|*ypR9
z>gHb`XNreL8Z9ik!rxYy%$<313nZQ$(!%Afg1J9Ps9W`?74a!T?ZSrM-{<Tx;W1o)
zNRrm2U9d5WJ2$q{*%^$)SK&~n3W9cspG}TxRp~^2nXh5$c=vst23=#<e6~}yv)dhS
zIgmDWc0(U`obaVc`raKUQS-#bigmk2Wo<DxF5NQbC$IX4oR00440TUl3*_M%Jp+PC
z=E7CNo(;YkFNF5H&ZyGBkSsQbUq^vP1LCyWH}xjX-MIXliC6bd|FJ_&KG1zMGFXMQ
ztUkE0&!eL{cJV=dTi9jx^Eb24cBL2R#|uPX-*+1iH%8NWEDe7ZrIHF=*0Y{^V_#IB
zX^)QMs$aDGWI|TEf@h&=yciJH#gV{esFt#}YIC!BXK$*jy}9)|h1+IyymNTKFfiT9
zlL3Yt(lF&OVO37#jrDL^#R9t$hn6F03#J~1litcVKhL4cb#_EE#V;j}PpeE!Gy1t+
zD3$?;@%*fh33{BmYgWLA*4t!xIXdZodN|2ne^*J%@x_f^ed{*58*nSRa}n-6uhJ9!
zCfxq~NTr<e>SUW-I0D-o@IEts{-bU1TM35!kcKf{ni#1}r@aVE<LUPo=mYD+35@p_
zj+feE&5Wbj?cG}9^=aN$Qw2N6YRCz%5Yl*5Y6dmX-Q_hM45VT>zctJ^9JZjwhP&##
z&=wNjrZ?}|UWyI%tA6mJY%brR{_$Y^+M;cjf8+F3Th6wL+L%!N9NRDY|K{hn3ILNB
zfKuEF=jy9e<&`Yqp>r|m96ZMo&v!gGY)^f^mhCUc3wC#qWoX4EQQ|l!RM^>h;YiO<
z08ZO4XF)<WmsqZsEfK1P)?*z}WK?t&zI+P)#g$t<iMtA6?DpFAWAcKnni=0by(o69
zbSqAT=Za}4S;KFuXi0CeQX0gqG?LTnFuG2=-)*zF8XNn*KX<&aIpZ&YR+%y)vTx|~
z+@SdbvniylyD#BYI&{NNZAYF`t0r2O#P#SnADR2?A2Q2+p)ea2VBUID8{GzZQD!tn
zVOIP?JExM8N-0rBoF%pjls&w$2C}9Q!-mN_=aSsmsJ0$WI03YhlPxL%X+kL$1Bk16
z_~Jm^l=MKb>OueX?^~ct>>h=Ao?JwbHxc-O52XbdLc_~{_A;O_HzBe^$?hPxKQukT
zT4n;b7wL%U@0`R18HJn5KC<L)AM_SDp9E)H_@>;Yr?fEO2enk_&rO3uNGLy<DWp4g
zClmXQ*tKBFuSN+L0d)tWi;fWB<*xIQd#(p5;g9N1#tc_oQXSn&`+9>B6#f|FFMc4K
z<SW|;1$T8-kSxInruUA$npY%itayLoo3*M48JB(Hw)awaL{fWRsqoT^Nu$|-M5x$C
zR|t^0!kzHN_ud)^FY??G6Wwa@CW=IJy-2JQc0*f4iNMO}2U3arRAO{ZXtuG6^|#+s
zi1J@(7UfZ7Dz#qV;zdt>T$XvyV%QWXoCdVxRONKZuJy|`%R)%%by?L?$R9NBXMH_}
zAFTA>JO%9hAbimv`mqD9yG>3NklByzqC0ilI>|ZseUtd>8y)fLv1+f<p!d0SLTz0q
z&|y@pJvWcZ9A$@%?xf-;nNBH?N?Z`?8rCz*mDOD^>xv(asiBU9R%MOtt?Sl<H*r;4
z5(VvycG9L(1?80a%)@5^!Ky*eFBxz@&v$!7>{~%eTht7hynGR!CgL>bQYFcS!cMym
zzm(2KwAqd?`93*nTb5ClnRqQ*o}R8|{t{5=CKbb7&#Kx|nK-V0+c_!DUn=D~$Hn^`
z&rGD`>`VAw%j__s++yQ>ZHL~Gn=|?%a^+78*)0#{Do|(jv}#AmG>JY}-39x7RqDZV
zr-{A5^yHO7Gx?h6!BYJGDRm|%s4)Y#KB3+!vkj`&_g{4Xd2#FPuTwkyI(G5wY3KH?
z_C&hq$)e|&xU{)#BcZcNi@DXpshTvW;{dk>^n{7ml&r@}%xQzEL$--clv8Fe=KV`y
zi%w_I9=6>h?pwRh^yl-;G_U#7C?ncL?b`*n4pw`ckMAaa3#a}DBRHH~Jgija9a#|N
zXxkfZwD-F#(-IoW`#o-G|7@lp(^sBpHP0V#=jJV3)m`%*pF+v6R^33?n)u0>_${Kd
z7<gICeXXLMF1#au(Ck*-C`sHPju{j`$h`of^?077N2~A6+&s$5-i_nZeb0>FKAdUh
zgYmbBS9;%G`P@V=?RW2Agj>8j6Taki{pv9nxT$qa?AhbUMwhwS5VlWw==P&j@cxNq
zkgW0IO$B1T*JX$eUgJUZ<@8o6F|A5&sUe@l<?nRhtE4(LId_-(wPm;3i?@9gZ4)wh
zUfyz{W#V;c>2|TQYO>|B8rH>dpJ5vCTsORJ<dhy~=oY;(piD7g?B$XWai`<gfeYhj
z>qgTu82+q?J96o_G^4g-q(}DuAje2ud{-T5B<fc4ZrOq@puP3rxOT#Ij$_8!q1ljQ
zdxo))?^#VkihzxhrSUCpt|!V8$GSbHern@hZx%M**zK9-?%`v%t4H6jS6sPc{kj~=
z(B*{_OqZpJHLm(sJ*U+>TN4<uqu1a_T7dzA>=V@m?<Z=e(@`b-Ze3Ykx$ox%p_cZ2
ziL_<(<kkASkHAMZk#=WCBKCUPm_ZMU^RllpHzaDm6BE~x&~bl1e8OVlc{Ejk&`LXR
z-*c`-b8D_H)$C71|AVFf-6nk*@COF=J9OtBA?eGvFNZ&yEJ#n7wxEXU1r-~goON&H
zIV}fqkv*91(JjkEl+nFg7{7thBzh?u#`C%NcI5Pn35uOI*hIPdL`YPxK*OT&F_Rq`
zv?;^k!g0iNS7%2GN~XQwxoUiR5<iGwL~l2$+nj1ZzLn`$=?JHz;vnpa!Q=qi!&qqJ
z+%-Z&pQyU}<)b!3*0jvneJ*WaB}@WsrJC9!P6G-L71W1&TcqwUJU!hBVazi?BcP>W
z+{PI>mkB5N_Wfs;eeGT)uX||)<pTR7!U%f{V+7nr6^#M&VX`Bx^F)gdY}6V!z&%vd
zs79E7Go*!rK30>Ja{Vq8oSU2bjCL*NwS8f1SE!23qEs-8W&z*gw2UW$oEt<9a_Lzi
zxU8^lG4I8elJiC~^|rs>dRT;Rn5x7SjWX`DBGjBCVtO7Ts~1B~B^$r5M>FDHai@k%
z<+VbQ7VXY47R2Y(pr2@QoS?*Ob!BB@#q!{QDe34dB+J$)fk*;4vC<y9`Z^E>Yp3z?
zwjV2uo#Afd^}*O5d?D@j{-`3d7*k=!Vch);#uq=#2)a~Fs_ds1qYdBhL31qw-nb4z
zhYr8aZcK?6rLnaKJMJxShkpTw&~f@Clvu9H`p!FCiJjv{_orSlu4>uj#U9(W9KyuZ
zQB-f7IEsHPKekxfu03eQoa3taZs$%2!5_7n*gqhv(`oIhwx=FMBy0gr+lkR#z7L_B
z)7x}H2Ymzn+)(HX-ukt7SsA)`BZGy*Lb6;q&%-rd!0I+?;|AFMx0p<x+MKZFzWaT`
zBDY!Bs=jnVHj^qNr+$)s2_L*r{GGXm3}```XG7Y8SWD|q_K!(Mu0eEOTaJ#~op-=A
zV*5ikc_|(0ctpkbbvv6_?3*t=^`M{bD!IhWpOhIF=p=}i_w2S_g4=^v)D6Touog@E
z^UXJ@0Dt!Q3g$1Wwet;Ai^y;L=#kc4G*P4?-7`vUcA&!oyuPB=(SC=G_N}oB48D*2
z@-%F?LBFfi#beQ2I`Gx1#)iT2m^Wq2T@%d#yYH2m1($#CX-qCs(29!ExUZ(C&e^Z2
zY42ZViQL|331@s<<60`b{{s?z5BuP#b6qC4Ak$rx7cc$wxX(FROaQ46{&#Px1BN}U
z%$dVgW1T0aYx8izWKpNQ&I>zKcm89i@%B2gXAx>}=saiZTVstZ2l7*gJPkuxS8uK7
zY@jytDggz~KZId;*?Kc11Y6bT>%Hc0M&se^m?8W#m;#c?{rfP$H*GP=c>2jB3NO;%
zje8AvmzF=W8uMIjef~;Q|K+u2TRVI2P)kbmP}XE|acWR`{G$S&&+xCMrj(CMeO{q)
zwFN4tY;ZMb>tKwY<)eCqa$?!AL9TD+SDiNH-RHZ_To6V-{vBelQBsEI#vZ#9y>JG*
zn3pjfw6}PFn1HdzX;30vx9Y#8Es^BQ0%(U$#DzTEP#YJ!zxC)@g^!oeZ@<`ueu?Y-
z;tNsVCV}PT)@K{~pz`9PSO(CkUWTV3KzUeHLg9wH;K|-Q^bQL<XkGa(pV-Q0luY_z
z*;;w<xV%;nuqodBf*d+Bt|O!+Eo|Srh}Xu*=NG%upPCxpr)LCK?)WT70ejCServB-
zw_MpW)8|)fLb~bo%wfyIr?GoJnpM?zy?*>;|4z})7-v1|WP&Wfuuz#Fe^2uFI_f*M
z?Q&`IyH4}+)Qnfx2)eJt+q~8DWg5^4w(R?$*|q^G89Mm3nz?@P;}><Z&nt<{cl0a7
z|E9Un0xf;b<kp>CY$9_^dh(9qC-O>Rql4V15=#gVzuzAGP8S7Qy!D?F;J-)a^v@o+
zbv8VYB-fF9^TwH<5P=B`P3sld03if@nE;UI1?lUV@n)XuIX8*5$i}0Q5^Jh%jkxJX
z8lIz*#i-%JDuINw2VlHJtvDK40W3ux+!~?gqtRF#wb(i09Yl#Y|DCW(7CmPQ89?@p
zzfMTSy6HD~@1}gVrhy*WK&Sdii~>q@<RKlOvL#oD<pSSQnmu_kVJ$oP*={Q1H#<2Q
zfTC`MMs2ABSQEsRPM={%MufJDip(*r49;&{W#+lWLP#3J&<!@?9a*kn521>+P8G0u
z5Mzw_hEb4!A(JB?6#?b!5mFSQ%PhFSJ~}vEK?ZvGj$1E_x+YxAIVLu>Rp-^!PjPac
zy}_I`tpa+Gg?T_=G>l;zi3K<fSKyB-q+tnZf%H8qWG*>n{868?L*^XRM8bR&lEqI5
zlU>(G^7sLw!o*4fj;!XBZaJ^&;X^Zt0Bv`1j8hH?@^^1%=WSY-gUqzkC*rU@Xo>y#
z+gaSuW24{4m&Xeeg=0l4Z(>A%u|TlueyrI|6>qb1$WZ;k)QCQ${Q)b*H_UncD+L!Y
zKXYznTYh;f0~;hnVS$`<hLFnq$)S_ii=K_byp{F_jAfZVb=nLMrxrtQKU;<`4F380
zg%9HDorh-S<Q)nMucIb*a$qG(x$H&Gi)R#;$6tR!o>rQ%q&U|_+JqY`n=dCBjXklu
z*YXH2R{Z!b1B>9iw@sawhDnXH2f5VI+Q%q#Z&_bG2nokz60@>hyIhp>J7a%Tu)mK{
zmhlao6n5F*)Z8&^=6w)x*Y+lle$(@_qk7T7<$4RE;3xU&gZCYWkl%V2#@A|ZMgB!s
z?k8pWEtcF+W1-zMW&x1es;yvWw_o22^}k8_nr~vx!6IW-vdIbJtwNyo8mwd*NV|8U
zUC&JJ6qUF6$_<G#-ke$O>2;EG`))6UTBsn%bBt%r*U7q&icGi!7EP8$BE?KH-EoiW
zvvdbVeT2&mbrnWPOjjQXTj9d@cSP)$D;Xb*jj$WUkn-$Z-uC*Lw?ie?ig&Xt{wA6D
zWbj>7S$|XRLwkvLU#U%fY1USB6#;i(%$IL1jmv^CTMs$D&%R+TovCyE%K^I}O2IZK
z-^;73b9+!BnMwQlNN;(9MU)VXn^Pm1y%(sOc+2d#!AHG(;uGv!UP~Toa|OdQfL5GP
zg^Ry@kl1>H_B+qIn2A+Zir0+vk3~y1djB)Sct;M*FqmdM=XKZJ7UmoDX|k8b`zegT
zLoLrZU+J&E!#zH~)gO-&v9LE@|ELt7e`}kW+fB@K%!x+zF=`<uY9{V4eGLVIyLDgZ
z+T|q}x=XWMhm><m+ae6LTxys1{z`6aCt?#WglpjjWQ_tS%`B9oF^|5sR>1C@Nq<?{
zvf}|iIG-@~3m==v;$q3^oX;wL6<BVIRptjj7}*^%BYPc_t4JP~TxErACnK>ikV{k(
zUBBmJHT!jHRd6X%(4=@UX8it?dl-L{*kFNd|JRv+LE<mF{_fvPF6&1JtODX>MkcJ6
zbfDhpp1r+s>1goo{IFcoZdp#R+bXLAl0-xHvTq23ut<DbXsRCOKHS?LY+IGPyz$+}
zx%=#?!n=UkX-!BcuwK|+ba^-^0e@q=jJ3&2_>!0_+cY9fK!_1t3IyhGM~)Qc=-JyG
zuop=>*FOR<XDe1Vk#`#fRU~{AOL7&UQ<hfN33`{q-8W|eN6Maw1z)bs(I+fLDz~7;
zFEq?cfuiPET{EHT$q3Zq@(q-3r762Rz&SKXHQ~e1^RTEbLtm`)v%5)q1aptRQi_G|
z--*RIE_O;WdP%BBG0=vEEKOR;SdsNn^O<bre3QoBWh0C^xlJ+ZoyX{^IElf0Akfq;
z8nw%{_YPiz=R}H6LIsmgr5a;l!`Yb>2JHur=pKfMM<|0tCiBwkHM;oDnAzCCf~I{0
z8`Y!oexc8CQc-vPkaQ3xLs}sgeM)g{7{F$YMzm<k6Hs!pcu+3#=vT^q<m`)NPBN#x
zJ4yE01>}OQn8XCyBVp>DIqHCGvMXgvxk<A@_W{@Jvj_d-D?OrNqK5S-OF<I=^)#NF
zCV91`%^+x(rlQ-XgM4?_FyCl7(Dao>*PctXq#1cAbWeYw8z6z(uW5D1kcD|;{2E<R
zR;#>tMVkZuwY|V1h>EePXA!g=jq9kVR%^XJYV;P{AwG2)VNr-O6Ov_~b!-Ww8dhpO
z-<bg-LKo$?cei=^G6e_a!jqpmzB7E#lFIAG(8%H;YCZ+Ls>~z;mDPFgWYcIp7jBL`
zH+^4$8>3QRdLMWGL#Ew{r}hfapzBGcc^pj`X4#v7z9f4l>1q01@cpy1Q8EeaO|scn
z`2nJdZ?OVX6^mY@lVl4?`ZQBbW&xcvv7SNRr{7o0cH`BfM-<P5l&knms`ZjQTa^L9
zh1Kb>GLMs=3O&ij!i_%iPrq{UHY>Ig$nhzFM0`yG^_VrpMfbyuC>~Pt7_sj*A4Ea)
zbPDw}r)%a+h10*w#q}!qEnJu!U$%SR?NG+xw^xvMY)P=G#bx?lsA&oGZ2Qyvd;;U-
z6{gN`Q!695YbFxL-j$);n^Ydt%eQ^s@~onrG^xP_5-VV#v<9eyHIz-p9O%n;`CXlg
zY>0;QKPaG7Rv|8~NH`-~@Z*x$#MB^9`KJt%^4K^nPDCX$E%MZNd)tfyP+NN%LyH*r
zGUxteygET<<HMx`6fT?(JK^bDqTeV#By@EW#hYULDC@y5ioGwfq2oVs8_ImWA~d!s
z1WHPIy>*tlgPZflDFQS7MPk<%Rs2T*$L+>Or)|W1iBW8F3|0n^T*XA6%*PfD=VF+d
zoqqI|pX&3aktSy4Rkx;h6S}6p;P~sb+y!G!#ZuwVmJ#NX@1eI)wwnv((e?KPcU^Zp
zMv6w0rD!JrD`?QYF%A}#udJ@ePSCLCQ5XYE3j&yEC~Lpj<MoW3RaFz)ekz2!CUx@k
zQ#;eXJ?CNgJoAE+$Dld^!1V`<(!S>@J2cCD(W|l=2;FG$o~r!OpdjPB`qznivap=*
z#g$jGm`#55q!ZuzNU34jU@6|^*$U{h$neBTVfT{ey6@K@)ILXn{O4)R)1!8>z)j?V
z*bz`!3(KmlO%9uNy6pBS^F_UX>HGU@h~hQgg#1+Y{&0u|z0`f=@i_W9fDy4<`~A4i
z!96oA-|z`)$*N%iYF&vw>&)DVHAWmwX3;U-kzI3igy+r_(;K%`*m<vN?d*Glm=jS?
z=MD(JV;lZNfnB=iNVCFVVd3w->wRV3#QR)H1ef0bVNAnGZ-{W=Aq)p*uoV)U%Fz&c
z*_@^aEW#!9a`K`98mWp}+^w|sEj}7$mZhtFdQ4QfJkb^#U{qvyG+P|xMKnVA;>6|p
z^0?u3+R9=Li{$i&)L#4gL$zi>N{^_$Nejp?`OSqi5*zhgo~nAt>de0T+H77bz?;7o
zdRCvbcSc*DK=_)<kpvzX$#W}w?K{DPmwAQmM}w_dy8g_Fu1(s+AR<hRzTc&-cb(AS
zzKDHG5#O%-POYQqZ^_H;&Z>S>-&1|Rs%6qb%{U^=TaC}~7uE|`OwH;QI=-i;Yzi0s
zRB8B6jV2e(r^;1nUvWTP&@B%=wQrO>Xb#)<5Wj!9bwT*AGB`o@PZ`XzBe3hlK=`^^
z0SaN&Edsxq1&~4SYiOnUjvrhroV9XkxL)HI5}KA@t{e-82Nr%*enCUQD*>@?5Iws%
zCAQ3LHthC2-+@#;HD^<9shMDGZrtdv8i9NBpk)zy(2h3=?AWS2aI-b3CO$n1%glY#
z$h5nT(;;v&5}wvOFs_)C+|Y5(s>Q8o-l|18)2CnM0y=<;ds_I4u;JNm1pxFF7e)sN
zlQb6LC#4a%G^wZrC+G2)1gWi6fNNn<Y!KG`++22#CB`Y++BrH$3J<-BGYhKv&j&F{
z{55S|Y%JY?Pj($)9xUTj8(1D#eI+MW)}MGPO&S)rS8^A0{}&YT7*|T~wZ_y%2GC{4
z<wb}<p5$_|Qg?!6@94Z#5V4)iCoyghhNTvuZB<Z+2-SgLA0&-DjJKwrG}i*smO?Vk
zJ<KS<#3AGSP29C#yk;*6*1JAf15iMc^C--w3KG{s`p+6v?1ABW0Ja_m^L*)VGHE{z
z;1yx~=N154gqQL+KwEtWD<D6!IES#H>Hy4385pjtDNe+E#B@LFI|MY+QBHS`r{rdO
zIYF>t&AN7rlS+lG3PMR5ud8p=A48KT-)0@|G}b4%@|p5Z$-TW?&1^-<@kT&Dn6EAm
ze_Y;no6miSW&+Rot}?la8{S;?86<A#GG-8C04F*fTxHAT<n)<^)Aj;Qqyf>^{r>7c
zZLQ1im*sah?nUhmY4SF##YrYo*Z1H1a9%iUQL<6?YBkfzb!>k#eQ-pvvEgYm)Em)#
z{K#=~n(10hbbpWCd<~ssni7t@rz}~0MV?5o;OO<7MbV}>M=&GPb494Q!Di!|nAfur
zGp5<+FN<0ayo}f_1U?;Z300Y=64QZUiG3m2f3W0cH?p2(NN?nV2+rR~)0beuBSa<b
zDL9GDgW@i*C;VyFai&!B{Othd{K3?A?R?Gx*;S4nqKGMQ@;BfSMd1_WvWe2+EonQu
z#jz@<a=v&hvE+XqvUc+WHk{KcoM1$79@V(jxX{9iI{h+Z7u$M05IF(hw-1}nGqR&9
zUIpalm&I<DuNQF1F0ocQ`aE<#7R%?1S@b-7wopoE*0x#JD)gT2xO*~sDfyKXb6yIA
z5X+aj6hX4kf}b@j{l_tlyYw^<x;M+4Xpa3^^+=jF?W~7$<gys~_N`62xSU#!Hi{9J
zJv~`|b>y_$=o%BT1_cV5_Ok>=pRM)61NI|2IPM}!=*+zy_dbo?f*4&lbo^;Hws5c1
zaglXoJ>tnSCKiH9|5#1UB6fjQEGk$y<zBvzo|x`F5GHsQW!G?JpkM87re_Rr`S{4l
z7(vi;jq;F>I5Qh0=X)FPt%sOHU@eOyV3(c}x>B{gLR+3>J(`pBUA9OnAb6y9;ro8y
zsJa}*qn;!#zQHKZVIN%q3-6uzyi85MOR*_gsrkK*_~o{Y=6AwDw+>d6TYc-38v2Nx
zE}9OGW`0d~F)T=BfDWa9=a5vk9=gr`@UNAVb5T&+prh&+H+g;#nt#3dKNPrc^#1AS
zzbbiFZ96bxhH`#`d|Q~uhr3E}=JOW=6QMg{iryKFp0Ag_acoJkdpR#TBnvrt@*aHu
zq%%RSbgoR&yb5#OBG_LqV3b=&D&IhieK~!8dqHfBXE?HFoYI`inu{^X?L)q;hbV5#
zL+LkVCb0a}C_|XzXQuT`+7-|M(B<6Qk78yvNpzM*njL8~JM%T>L~rFC$0-uKeD4Au
zlfnb1m}@aSt<?8U5f^{`E0S)J{~@oCVrVZ}%qb@2k}#7G-w%OiTE4qPQl^$^N(x#P
zC^t8_JgqcG`K$06Rd>X0t8Gk5CCR5Sg)n$$QTFr@51WPErj-qOLCF`Ww-iMl?n3C3
zs)zx2>>t5SN{j;_4w#G*hJ2479V4jRU6JW0phgs&tW{(F0$L}RqaZJQ+8QSP_I1U&
zjW!}6E{;cvB@mxD7X3PhoErRap9$T+Ei>nrpfuKQ$*?A!b^$1o<N=0Yym19noe$1f
zxD5S}LrH1<ol;5sXXI>vkzT3t7O!hVwZ3!+VIDaI{3b>Hgw!!1FoK_-b^-Ug>$a^9
zYX}p(O^`5yTzx&9L672V0<4FwwK{&tj2jkOxK=S7?WnTQDVynfX3<6Il1kQ+Bg42~
z!8jT87d$ExDeHFY38nZDBmLP_Q}@(|f~k)YNB}1Agm_z(g;t!Hs3%dqBUF~vYfr#T
z{hmO1f3DXT5rQd3+zgIMpLl)G+U5yubpU~Qc30X55!6gtwyGZxK3M_XG?y+0*!);+
z%X&yzdqaZ!$P50hvgwt0z>xz?9{ud(AX=iQ!fY5H(|>BD4lxlIWlqtM?WhMtb~p#i
zFu8*F4w#2JDa}2mmd8`=VgO^nuFrnc*6B;L2aN=_<iorh9=;j{e>olnJ?3k48lwR^
zcrAdn_wsvTnqtZys15szNAB_>oKJzm=pZE;B(zgUirULdGI$|=zC`7*QPdS690V|t
z30o#i=J*Cf3uN`^o}TP{A?3SmJiGZW%jARf)`^E)sE=76mu7B$Q>Zo!c0y$xXOj;V
zZ?|t;mM^~TA^Pqobpy*WRkR$V)3`r7`lItg;^;0_A_MJXX;bgBwoh_#)Vk7Jix35Q
zxuFQb(@6`rX}{}kRY8*^Wq~7i$^XODS^h=Yc3t>ZK|mUm?hXl&ZiWs)x<R^z8af74
z8l=0C?i7$#ascV>?uMa;dM}@Nf6pHvAJl8J&$ZV&mWfNBnQ-n-<cuNfgq6~u#R?MN
zqGy?m+VV;%<k~R6{40CB?cSpawlrJc@c7=_??$t(8y_0w7akT~E}aX${O|=fKua+w
zARG3_OEa6bd~WM3N?R*$*QMu8dZgto>{PbkxUc~K9RWvkJtjc}E3QOKwoe03i}2Wm
zP{&;mWT2$zr5U(?M|!mBpCBn*Q=l7ywsFzZY>|-N$!s+<pdhglWV)A}?dOgQD|hfZ
z^ok3$Yn>Zrja~}beY2SnRqp}(gu&aTJTVkclZ_EE#@^DGmoCF1#>ywIG9QaZI~=pA
z#((l`N{6;tol-?&Ww|V;wQtp|NZf!s@~xr`x}g(0^N)w<W(nqaw@U%7`aAD0?%)3K
z`;UDI@Zp94cBFsik}iT_3iEm(aBgV*4S;39C+4Ku;gbpWlcmTlOX>EJ$AaQ<6x2^o
zy<kwjr=>xCSV}^IjaJ_hoU}YqL-!aVVxD$rHDNyzt0sixHX4K}D))Wr52wK%A%MG%
zVB`g?(r`PIv6}=>$dZDg8_)T^{d<67w^ZZS^;f)Sp&sM^6Y@KX`kT|dHe4lVDnSK*
zgy?$DE6_70sH*83(u+%l+T0GIaLpeIT;$i_(JwU2X(vBw#+5FkE&xTKi*YnKrqn5k
zTA;&99MeQ3lv}053|(2N_iE*FYX+o(^RHBgaJS(f;NQL}L1{%4r&-<|M^v>>Gu6~_
zgUV&X*z&L!c;^O2R93VAxFXZ?!Gu~uOvaI5jfzhAUrLU{6OH*w%(uWW<&?nPtGtQO
zdlNCdez*1Ru&5Xv$>c(irFX(m;nw%#XJhZQEZs=`w+0fUishv=z`^)|3cdD!!^L(a
zXcM8|ar}r#JDH%=mT?PY6<BEaOPtQ}XG0WpA6<7NFz$F&27z$y`xSeG`4|%vf8f_(
z(_AMz;^w6Qu`$zxgJ@nf=Dt*M(2ataVlZwy7gp0PVS|aw??(`Q;vda8ZCl%6E(y5F
zJ)ptygO_+dP4I7vnXNO5uJQRf9dSO{V}K>#JrvNhfJiPh0XHB3T+`FL7)GNwsRtX2
zfPXNnQ>0Yf#S>`ItKToJ(-@z&l4EYeJ%(LA>X~xhwh~d}DDvvnny13s&c{LVitJ5?
z;l&pF0#E1RS0q`F)hLwHA*PWpa5t{oX+m6WF@dbYQ0$&*nCZ<##euFRJIqY}BPI0o
zyYTh>goMvePIx;?zD=Fw7badclY{BI0s9vxsPoBehV0q~eySg%wO2{|cax3B4s3{L
zl+0VdG|F%syovri`@}*|$Cg4kk{{nQOu4qrIXI|ucyoqYb9b_$?C^7Mn+d-rmL-pb
zPt!E{*^c+(#{C5(cG~n`;$t#tWd}o6zqtEgg@=^12=roTW@{?h_|<$w?ng4T8k~0{
zM@jhg{8e7Yvl}#fp6BusF2WG{$eO+vz<DeBKel%%4MPOtz?lnj)1?)e&SyKT6D*RD
zhp&hcxzvFyz+j5PlDD%I!O@22E4FsivfGJ%9tjJNln6M%%<b;&;=A%J7y<gMS<S>e
zvrXIgCe?-dy_Q-~1TS`m;vXLnNS99E7n*kDi<GTi<^rAo#xBbK-{nl(9_#XqiqYsk
z$Yxyrm6tWKAuoa|-gf)R^cZ<;q(;+QK_0|T4%u)0Dtm@mm(MgbW^O!PICWbI`FbPo
z6e!5gLQ7urQ@%TwF9A+fIoZap#_Fc`JH})i?S$!vWmWBy#T{K0`{z1;a32NsRES-7
z>{Y#M5<@6Rs4q!*QM<d2Nom9mAZfP+??-lN3`h0|iZ`!m6mvHJdv5r6_-~04vK$tE
zXq#VKK|c+_F>)QV7;nB5{e5=RS-i7(E#`;0AH)`j79;bSrC<aVOLX(2z;2FYfkHjY
z@Frec$n}ZX)4)!)KVJR5RO=bl>T!EtR_(%Z%fZRh(xUD2MM{Goawod`55Go4A9SXR
z>gIKozwRpL1Onc$etE`hJnnlw`_eyYJnxH(_9IGH{Djzx`&j8ZwH6vsU{4P#CTeY3
z_RMA14$17gZ|itaVK>J9V|SHx8<?#3?)=ArSe5p-wFT!BDq_tL7sHBG&%~J${SlFf
zHH!rRMmkVL>HoSO$-5`~&x6LCSu_DV&cG|fEyv*uUEqCBDYw6`>D(vf*^Mi!*rV{q
zqN^8EnNZh|+^&PyzF^CU?efmfP`8Oo+Bt*T|3N@r8~+B_aG8CD!R(;Tq(dtjf|EH@
zmB#F7fn(1`F65|kz06X@PT5ngK2ZuGEp7jPG+`6S)yY|3fEBbvqvUJ)!lGB*7T|5$
zh-<Gf&OQH^Y)h+p(LWev*cj>{@|b)E%AZ}A3SE*tq2zU#pKKD-3~&SXp#%eUW-w5>
znpg@$L(urYr?=Iv(31{`FZbZ!7#Ssu?YO%-7^;-{;lJSC{A%RM6**1tcveYXm!2$r
zqEI<;rS~cB<Ydoaxa`-k{k$Jy?aqKhv|4TO5#@)AVbSj3*#z8M-gXM&D6pSmR$zG~
zc#Np`or9#l_et_S{oUeS<&-&r_5_@7AM(8~Ng(-GC55ccvE$PP{lKb5TKtgP@eY8N
z;Z0Wj^5ch}(&lRo%_D@XT3_<%7I{a!sd8Megj+n|r6vbnFvnh8HvGS>dKH)H5!g+^
zXDhPHU8di}dz*RUGE)l`$u(WX{!m5Rv$M^RGO=ov$81Ci%u9zXYC3`w2Lf;+cpTJf
zn)1D4o8#tV4m>L(YgtZLh4jO`brswdXXI*xCo>DoXGc27iufA2@(mz7lw<F{nu8um
zn7z9gxZd7nTW8w?T`hq!v<&l~gnvbSh{2{79k-N{%8h<J>!WnoLm-;VOOO2LfnN@m
z(cU_iW^3`6@5v!TT4U)&n}N3%J3^G5ywyXqfH%^a4^(y#XC#BfQ(JKBaMekt0XCsj
zWAvV_b*J@BdxFXDnnkn&Hd8J}uHHTZF1g&@+V2sI2t9vN!i66a-t_M%cw@d`3z*f!
zf{jzih|Om2YgGK<%;_Q!xoWVKMtvYT9Iznt-v92A`}t!cnJl$_1EnGKv{wgc1NceH
zWH#gUi=EVOG<y+NaRcUM))%{&fm7c@3~Azyz7fACV@^54K*?;wGf6DZ){yAGB%z<t
zJ@*%W-h=*(;&t2oJgKU3kN%^O0(JDjhKexjl${2;UY||A3=OXX`&rI*Z@Occn$S~5
zol9()DO$}7#N`xeol7nvi1lonz)=A40$W(_rGXE0l;^*Pe21X(tvHLx-FI4UGv6)}
z%~L9{?cW-X-LVLq!}7{Yv0cuiW9-6B;?#uk?B70fUJnf8x~cp!Ei!Unpl#$aBci^l
zcm4NbtgnDEv<w#j+uv^0Z1mA~8%;HK+^?8~pjfUC(OP4?(di_uO$0nz-kaZ1Hd{_0
z4hFPB|32Rf47xrE0Z^^w457HU%}J)$eKW{ZCVDGuL%`*uAxhMmO!T~_xTG(lmB>f<
z^`@sUyr$^#yF%oztIQXUD~Dak?Ij(EUVVvd9lTFFDFqX%bb1F+Nx(8Xk3%#GI=t;@
zD(;=;yF&gvYo~a4mR5+J>+L4Sx9@GzV0tlYhk4ZI?Ha8(9@)c_1UGtpv9UHEb9WpK
zNiWWdX8G;qBGp^0j9gCl6^AtX2bqxXTdjZV!b8-Lxs*O1<R^JVr<0vTra9)>+lq^T
z%mA_00$89#!-n``|3K9{gLR|tiHtr%yJ<6SaBFrW8as`O&cORDNFoy?3<9q#lQ=`i
zzB08r(O<cwjTE~yyDuN^s2`#eAybb9_gz~2$2rbKfqGbu6k{)N;u)wz8)kpZgc@&L
zp`z2!^msN;O@&2#mGiPbv>d0_e2=Ti=k(}I1N|*JK9v=#$$r5*4mrmMdp-HElC$yW
z4{fI~$?F}OAGs0!Pet9u_$q=u6%6=QVzrmV2NvC3*!``yE-w;Ap@@E<%oTU?f~EX}
zJ}ci!0zNfg*7EdhX&zGT{q~3_U=7d`ecbIbkkl?Q&^#X1#Fs0ZsdVpX91-dWA*&9n
zCRm_ueWFUdJam(vJn^0wnfyfr0O@E(rX)J^JA_^?mzJq!F!-(vvPM3+wYGA5YZ#ci
z+<3wwa9VioZd3B2)t{6{2J4w_Bl!&QrI$CP>jo=#|C*f%3J5Fjg)WV~w)^|?LVMS)
zq!Ruufdalq4pR4_uNXd$$Rb-T^j!peK*Md+)M?XMef#U%E1|J#$F7SLS8pqUbr@||
zZZSk*pN05wwAvtFBY~>Uc<P#@#IVd#Bikv+ZYE`n1GeI?f)#PW<~aP+g(ajmEDS*S
zBx2Iv<z*)iRvpIg2z1ta+(=??zrx}?{4EPd7_t}}%aomTJf>YN5RN}2LJ`}yx?gH0
zdCDv{X|V@Pq2F_u)Sbn$!y(7Z4ga4;20m<jfU(4ub=Tvg3BsXb*+tY#p$tJ3$?@dh
zF*Aei2kl<r`~eWato?5W2ALVNidFRonW(jrWwk-1fQ>)%Oniu@dw+>g*1abS_pQ6C
z>02p1+HOGsb3W*4gM>U-cdnV+TTs>X{nGfZvF~jnz{HYONS06HvS39p)p#9cfME73
zj<6^k0crw(p(q7loU^H#nF2vqnD#iY*{B)MauNcuEH<SWgE0Ocrl9Ch>=^<F>}%)D
zOKh%%KNNk$TnBbXu-G|E1i-qU;#=B*0odv1fE3V37H4@hUr(-@49n*&;=GOH+Ej9-
zE{~&fNE5?(7uK%Oaw{(6(kHteO$LouFH(wvB1p7g-*9ZrQjKNsq#eAqdPVP$1xU?k
z&FTc3ldKtuza-So^$~6(*Q8jN;iPpTZj{ZDdF85aP+soNwh~X|{swAlcw;U6?~eFn
zHKeDT-R$N7yXlLkKOVlI>_y(Lf9@>PGu$D)mUUcB_MiTdNZXpQV*Z}hWWpFn)yrbS
z*Hk+nz6g(|sw<hZqWE$YDlQT!cXk>Yt4iT2)~LT2BB`q2%wlHbrztivh{T3$*q#yc
zT*?}w$kTiVNU79ZpO-oQbXfvt`?zaAWJDWSedy&2epl5>AWarYXkQs1qq{qIV0yr?
z;r}QNd|g>N%GA8`htVtk9R6GQZQX*#P7=}o2vth&WRN#egO6&Ex;+CmCNOtuRN>{A
zkXinRtc%`*DuPfA&6qP3tY-Z@{vSW6^En5L#cttDQ2A2GDBx%@O5$7bW-C??r6(c?
z#33aWxd=IFj}L)A6IU&aQwl{+o>}%3dX=@DY|Nm@EhxkPX44b(K-~|J2%14sbK>`l
zbtB*;c<{M2p&=gp_N1c(auF%8=|)2&@^Fu?>i)qi%CFJ$B64Q4kJ6u0b@BekgkV1q
z#=)LXdTYdT(nc96F-pXek%Jr88Cy}+)ST_dm_cq0?mr`Oo$g%q3EuUX7kQxyb~PX|
z%@Z#Iw9p9eEK2zIj~W-~vM@|+xgW*Y%RaJzG534*y*<r%15Nkw_t>hJD?)Tm0ss}g
zxbp0Gj`ORUJ5CB!KIKLOn%om%VPV9@<JXJfp*N92+OluR3OR(}s-|HDp4sZa+vsad
zj9Ev(>C!DA%hZ^h|Jm~x?`K3gs<KJA1S}Uk#drTj10-Mo2G8fPh71p3(A)0nt0%jT
zxd0@*RC?NEdwbU&0GW@@F|UI-?YiEo8xd{TC)hGk)4h_xB+7aEsSUuL*NRTI>a~pq
z3Lp!=eybU37qZF?jPH=l7{3?ypO88>bi@qfac^a-ufKB`+6oud-l7SfYx{G`AEQ8>
z9i*Ouqeuzs!sOnS@<W3hdAAk$Aoc{xw7Mr4OKFkDJeif!%qShAW`iU5NX{TX@up1G
z|9@HnUXgfp6;|N*0)iknt!?YO#Gb4lr6(#Fv~Dz{n-(Qid(%`(gjL5@qxBHg9wf$^
z*es8s)o8<yS$+0T=7#8pt6Gl9idDn3kxCcw+s?MXG{LG3HV(It)eE28ULXi}jj*7d
zJMO|D#}piN6F&KD6z9s#<Rm+%I0=tsk^(gy5EzKhY}F1{E*@GT2RKDVk=@GSwDH=m
zB58(S+$Q8Od%yo5c{73Y@1ZF0i1WnZOp=Nf+GbvETo7xXKvj(0t`qe&v<7GLTmfkB
zo+1UX^+$ep1MPRm8>j#}A$goqK_T2i0P+A}ZrgE;m+U!0!9)Q+wz(>ja}DL4(nG-m
z$`ODt@h7Q5YW5ojYK>IH5Foql^zRt^7GR^fG2gtJf+ozix+^`~BIN@o0Josm3$91F
zVFPnH5-*?|KK`=P+#p&pE-xZmI_WY={>`;ATuuQkraU14FH5NV1JEccDIqPl@=s1n
zn?FCK({Ijl86L<AL1<Of8l))URK0ky3D(~&yIkK|i2@FG*D<HR2n9G;v_@3IsGhgC
zhvBB$r0?DY%<D=$4x%aGAO(yA2)bVJzU>eUA2{P!6#Eg~Ca=|e%!EU`nw2n|%0G_w
zy?<Bp_6zs1-`KgOf6F^=ZA3>2v#I3qaS5Kk-JoWajc%vg2j6@;0?MS~OVo=5{eR^E
zOowqm#Qf(y98(dzO2|7`ZSt5WJJ*{tga@%hAHfwHwK6VOQ#%$@`1Wv6)v@Rt_D#xX
zFCU^N6INr82#FG{J9dfw)gYVmA^l;iP#@wzM-cccE;+eIsyW@^r?Ml_V{)>0f^gDL
z!Og6e#6?k2g`#5A8jSIdCmzV@_mGzxQ26hV^Ti7l6t`EBCqCk7ymkbzb?KkJ<~Mn2
z+EvE->CG8a%mdv?I5<Q9C=wWrZh*?R2c8~xD7}uh-YM)pv1+HIz2bU2#f?6Q^LHzc
zXuX^!Js(gMz;z1<<`41-UMw1OO+#S=YS){D&vdw*?G#aifnw75x@K3jLvIlHAL*<h
z9n(9J0F*sN*$&w~!cEW6{hY+v14*!t#C`-JTasuSM}%61R(%=<i7=fl@lEyfSlzz%
zr>xc|3dMshsqcK5fW=lR8Cm3aseVS^`Vaaq6<_23%L3@L^E}mgzU~YCQtaO$YVszG
z-nXyC;my>&!rn<q8Hxep5%#@tf{NDK-E?#_-8w5rTSCM~dqL!(#y8Zwyyy17@&}}l
zF1l#kDIr4?o_1@LF^%>u9iqE`Zd<J=-4499{3KEAhq%M1V(#*c8Fsy=iB(mb8i0v@
zM@~mn9TPMn_MnmF%O%+CM*YFl?LT|sEY`pGM4pou3ysNyvLdv!uE?RXrdnT^4v%@i
z&H;yuXrYFH_DP5W=RLW{B8l{$S0t}gQSqs|mL5~jqm^zRv~_De!y<USQ)K+=kxCAN
z?NBzuJLl>bnjoiNLip?7Ff*Um;aL>{iL$o_KgEq3R%B_nJwA@>u)U|H^velc9-$3f
z7OX!Q$YQ&Svz;pKANyO_3G`I~va!iW<2+oHC%}D{Ls3;t-!QN@py9FX7JWLNQ!pa>
zB-M^sM>iDot<cA6ZHdchVzl3@lz3q=cV3{C$VttMWBcs+JoXBdb)x8rv4Z>b*IAz%
zDj$l)*KhadgCpmCjvWe9wt(wkrY`TESj0O)#`>Oqv=NlTZN)`1S!;gVjpmP9HgH&X
z;-~sE7loR@6wDtK9ny+gqu-c)u<Pfr7c304;C$wkb6q!1G$&IQ^L?@xCp%nu(ra5;
z;<nzt@!gn8HvBOR$RG-R_$o<~*dlMO{Wl`DAr)!(+zuAhxHCCYv$F#>-A4{HrJTeB
zJ>;o4KA;f%0<)0#=fXeT+ivdP1I|UI>x`|>?ngmBX2Qu-&L=1RjFgyg>JTG8uag|*
zJEo)Ttk~n>HeQ6#Ib7MQxp<DF{l>S_r(U9uKj^fnO#lS`dFKnYgtug=Jbg%K0ge>-
z!}Xl1k0#JD=yo}=L^9x!(Am+`qTQrm<FS*{Vpu0R-|G|LFi^@8?uRZrwJ-Vg86uPf
zn0H6qHZMj*6X)tI_dGvbQmCS=@m13sU9}nd2S^@rglia#6y>IrHSYbFDe){?yk8s$
zfhqR-of{FDA@Q=5ycJ=SW;P+s_iGbGykM22l`2%soaZ5zXXBV5WY?oPaFxG|SJ^M-
z(@GF8L;B0dH>2*sdzg~`GPUAy%(%>sJD!32$s_1(1Q?%Li`9YYzMlaEE{rotY)vXa
z>iF^F@_cG$!ysYSP%$x<Ypcw<Bh=66(aXySmB~iUpVP9i%6(Jv>KPv@w!kKiEMAb3
zb+-&G%p{klSqi%#6Kb}p2)EX6b}flO^)ALs4JEKW^8AX`f8;V%FS;hkHPIz%KN$&^
z^JgUm()j(r6aRjbVF&0Z%cv5zj!Ldp{|-Vf(XA__g@K++&!8sF<|&zi_f4{6C!)wV
zV~o$1oap+p<|I&rrbo7|A@E(ZpXnKku$<kGSa(|(`;@)4XS)GWb6f&<$YKD7W-YX9
zQl9taT~vB40C0Fivp0^dRyJn>_C?*0Abt3qiTaxioen_>$T#eI)v=+N+0~e?n1qLc
z&>}F}$|(x5d$kE-bCS5vH=pt%fJsDGz6Sp>rC7Amjn|r10ZgY?zU+B6^P1|+Mu^4<
zuG%+Xp>0I$`D>6-#3zGr5?yZ<^Kr+Bh`hjWEQk;g(I%O6jS_Wg57eW@DzTG9!_=au
z!U&~#O9Qk_!y3+Ly2q`eMf9wtdVK<pnVCx<{nCU;m$USLbSdt?UNj>gX@y>nZ3YeD
z%ZFMVCb3;7l_3n-cx*LBCK3VC7X$XPf0g<E_4io~oag3;iyKE>IxSiqSM#KKp>BUI
zXp250RCeySNjMlH)V$A4OhS+IWID>RMFx;(#Q^_*6Givmr4+-Odij!i(P;D>1Z5h(
zF3mVdyaXuNdvCO1Kuh74X!Zw+;oqxSzXO6osMcQl90o1CQm1h36TiI}36n@>6EF%G
z*88NK$Ftu6#m=kHjy|r{qs-Cw2E>B`%L-T*h51?TEy2|NpAam@EV`WxAHPMWwnBW4
z=8F0^bR5cov$F>V68F(X_&$-*MP{|LP<}w{gRG3UR5bnaI^21f|KSEPxpsLqDVB7o
zP!!>FHJbcO3;Ds!?G<Dx?2?&N3)b0Z);9pGikdJZqow~GU>f-T?HL+cK>ZX()lJgG
zn`EvvYZkg<6+(9IUrBmBj<_D7HhD9hv=@RF0}Hjixyhq-k-j+io4ne6+QPx2^tySL
z`p%^})!A!~Yb$?cYGwfNbrp6GXXnlri~k99wUuI_A;D^8Lr53cYL*Qiy>Rgx6up{7
zP0iixW0Mc6nab;v9xwc`@F_*7Gld6($VpN>{J~?tBYeuqE?hA*li%d4a1{so!P15J
z$<2n)K$yZR24fNdB`@6Q!7l|b)NZPrjc*0w^D&#-CfCo(hpSkhS}9HPsxNTG0**d{
zVy-r^@K<;QjQHjITDzXBU%mrk$G^7K^w5Vt0DMYxRqks-hj!=bfr4pd@_fC}$6=u=
zpHUzLKsmrj3EW<QKQ-PD>2xMHOe|P)Y=6}2UnXkGb`%VQ{r_7ZOv}ObR?uB!QBSQS
za;9vipm}|*z4F!B`B^M&IkQ8%_oZ!{81NKFEBH!Qw&p@h@%;y+fCW-iIc;upb(nfS
z8qk$HtUaH`?ZEPIId5qL=#g-N0X*%aMct~%5ShwIgXFNyR-*voApDuu?dGpTV#qqr
zSQi~#9z$rm^~8)UAJ+#}{!01d$J!h12_7q6?-fFTj}9K&cC|RzPd&BF=jz0s8Ns7)
zyIi4%0x{C_JgQF)Xnxb#?PZRikTFtU&7|fmoE>hOwOsf=asWNbUpYYFZoo(H8!l`b
zWg^CuRZ~HW25c|uyO7ZmGiEuI#d^6v8Jia^2+Ct)LHi)@jL`pp1}!j<lIO`Mt3y@A
zQXp;Rb!Fl=eVeZX1&SE#(_e1(EeB)1U8@8PRPFDSlj2+nS!&MeMmj#4>dzN4)d)CZ
zISgyBWCi?s+2aD8SC}g%iVwZ_0$?u!ASP@CH9iO@D8m{_4o>w3BqcTcnCpNfbER7<
zvwpvw?g$SyCY7x&z-)>oU^e40s&)QDA;=pw$5~4&fB+XpW0BhPR_;lR0yXccf3n3^
zq`B(_Hn&hbHKypBY;6*r4bag-(o~Wbe2LHxXNjT(7H*RA6jR&5!S%61Hg(;e`8q<=
z6vIO(<|d}BZk%ZG$rA~`u;ht^r&+&Xh{=76q{yEUxn7(YB5%2Q`E1HpHafETvi=d4
z4A_=7`l3BH)%VF{0lrdxOH+g++{^(^j}ma&ZYJy+Gm&j>)}m0XEOtt*%0TS!rw7c*
zPAWKSTyL95YY((E_QZZYvmk`sTg20s7$Dcj)lp`s0@$W%OkC@gNAadB1nE~?0ZVj}
zckH|Q$VMN%ZZCJ!V`mIq>LcWErU%Q&NE0EmP|3}m>^w^G9=upQ`Ouy!t8B^&4jU(B
z8MPHr?PfX7NkLa(Rqv~2PxS~`GRbfFSqf?)ca$fbxuk;QT8E}{HI6=_LNCX+p4~^(
z6=tZ~97Ing<A$aAbI<1rxLyITF3@<!diWOWR#JLpbU2=*okVYR=G{S6I|~q9c>3~j
zI5c)VGvFk)jXN!>pz1Ox9{`m#lnyoqe%eK=!9_&}DZQ^YhCWoRUf}$7JH;J*mz9V@
zsgtERLHx2ZHJQl9XY7T3G;yb@%yySyBs64H+OKy%*EaUnUG_bw7k8c8(jFM=+mv!z
zuk!(nXA(XV=-8MoBhuIJ9)Jm4QMCp5+3SATtqhlPZTApv0x&!GOFbUDepsIi1p|j}
zt&+EKtV?9AvNVraoyzbdJ>DR3W{ZsBQ>S1&gR&avJhO?yHpK0mg^&>hK6GPOow;e<
zj=Dc*y@RRBl9LzzNf9*!XtHTJMx&q>_ow&+hoA30?g$+TSb1RW-@YN?0l)2{2ybWb
z06bfhkBfL9aJkA&HT_KR^|F_~KlXjb%4^^B|9pL~CI7zv<y41B*KJRhlUv%LtA!`A
zJ`Le94eR93W4g~3YE&&E!NH>4v$(Vr6TZGiOB(}SQgk%Oh934$KfQx+gXJw|$si+!
zsw;y-T44A@vXS>Y_Pr_i#lVPgUWCpMU78`RU4P94TNAl*Rq_puSGEz!d%;*fA3Ks|
zwSFSJ7x}&JGG{h)Ufax8$KF9zXmJgz+6s+x2qVTCSA5AY7y4fhCNUqta<mw~0$k=3
z2rm5x%i9lpb+3KsN{@vNFV}&VgqlJs?D%cJu@hI0NH1#Z2sR*l7bzGL{N*P207WYH
zy0cHxC~!8%MKoyW$f}tj0mtXajZZNEak*q2LBKJc?0@o22*Qk+<8(55_oDMs!~;97
zN0FdsYKg?;Un)Wkk4xy0-Aqxd+?}+1Xyhfm5wulCi2Oa`wz%*=qn7&W$HegHN_ZcC
zODl%c9UEW&{EvFo4IO&20)Db3#M7J*_Dyl=VKgNwbKtU%wuCfJHI=*SOl_sTp%Boa
zs(+`a1umPtn_nosYpip(aeqeIcAcg`azApdJUp1*PnQ~qh6LfrPF@%m*;!nHUZi-P
zTn}U7n>H01dhPYd)0%2;`2z`%Fh+_g@@t0FK~=!QIpXcOn`$+19Fp=$Gf*eA%_Fjv
z<L3@?>Mi16;5aOuV$iX}EdSUkZLbt7eULp2feD5jq|elkOdy8)qW`BE<<rDpq$J-1
z5Bz;GI%>HgBl2xoBAqVXQnR~z_fM%sy?Q~#etJcV8579@l`5ksr<;rX{_#3lkG+YO
zM((%t4FYQEctfH4ua+>>-Ujk{5HUAQQcd#0(&&2>!r8*4BG{(Wt?gdD+A6E+g=s)f
znY`7R^W<5lW;k*A+P;~T9T*fJ7#O_vs(U@Y8bd8fW)drxh4YH~3uM$PRslUR2BU<N
zk+BaKU6(IZPq;OxT>J^>eJ%i6f}&<6Nu?wav3U+ivijegGA{yNC%x~aZz4bTWu{kH
zr$pG8k+~^ON7=i^=e@w&eGa94vu-)dM@l$6hE9>1ni{o=E>8eqN{RVaEbs7`&Q?cw
zg?aalzR%eFY;GH@^FG);KF<M7H*W5QM;Wb^S&W$<S(&R{R*!c8b|=?4Os5me9f+2d
zE|^`9SqIrKX2ib305Gar!S4jFPG9J5qZi^cC^^xoBY*@o15oXmtlVrUz{~IdhoVW^
z+v4px869UMmm7k3B!i#G?lA?rsl;c|t6oH@OAG9(ZZs&-6e9C$k{wuTLVMnZHs2i`
zl1+w*0JJRWt7o}L-&(KRnOqn%oqQK7dh!C-HH^Hs+^*+pDm`QAD>yQW3c2G5jU)YZ
zT&A{?rS1KLeC_c~RmMVDP#$krf7N@qrC<7sU4JWE0bWidm?nccCy+J?VXNW89ETu%
z$CmfuU=oJvRHYB+`*=8IwPVeiqyqP+v=%F3M<<nrCbxSNMg2S^VRRXIHIzcvHOBsI
z*9W|oVfnHYJ}fNW_QG8DA5ep{a7ZP@R6*dfq>9ZN#_TA)+KXXP^(1zElBp!vEe?-3
zYt2kZ#ISbfZ7y<+seH-BkbkjExENx0Bj06)eaqFzW$VrF=``V8VZ_f`>yeH}M460N
zbLC>nKJVnFZ)E*g$J0MeYlZ0n+dvoi?u+XPgG^LyS#lTG(d+raDj48XCz-7HsDJVP
zp~fqFSs$hvez!^;VA?{rywjZVF(bHHDm1cfnErr-5~zn%Kh&$5Ug@;Ta9116wx*^i
zxePRmo+ekLSvg{zsJj@J+^S`*d?j^LNp^Rx^Z~V|MzmsViB5*hU+Gidf0=QgE@X1r
z@x*OimSqsN?~7<4L=Oa)Q|4wDIyCm>$7xboZKt`41s+wR!>@5UtJ=?Nb?T-n89^-X
z3$B;=SbjcTugRVahETRz8KP~)l*}slJUw8cZc<+ccc{=Sm}0)xP?OV`iJ=DeSH>(d
z>u~z8m*fROEhi7j+-m3ad$o!jYG1WCx1MxBhs7u-fJe0`DJp!JDzTuTu&Ec|`6@p?
zoWR=Rt(liJsa{7q*B?{4Zd_V$Sf_$hb_t^4R*=n_F|Cs}kNoBI)Hk6TJHDtddtT$|
zS_RXALWf3+J3W@YJU*@6?y#;v9^(|*lPN^J1#Yd}77*FodJeVfT$K|2qp{^)n$p2N
zQHCA1v>-6eMKK%bknQQGdK#bow!sZ>*xm#*>(bFoC-a?ZF@yLfUVY%>2o}EG+(0O?
zFQnOKXkX4@;hTEBRM(w6Evsxd65Jd9N_X7XD-%-K#sWH27Q%89TBK6+zMM)nU;Ozl
zRw1Lq=dh-c%(>e*AglR46(a+V{6B0e;pg&y-}mwV<Z7?s{_~~YyUXIkumW^~ed!@b
zUS9qiSkUqDIels(EavwDFfX6hmNP^?JwXdf@b*YpVuxal6H{Kw4@pM^{ey1u0sH)=
zZQmBjSm=+aBP+P<j2?YgGavvQCrrL1cKI{w+#EFiR@PQ=$huIKob&)y#mMCs{b`Yo
zqZ7flmB6>(tpPIE<btlnv{2B;!23C%-FvUxQ9&|}d!1fN4K=aOYQ!D)V<acqZ@k)d
zfZ=F}L`^fq6^v3Rldy@x-SD=EJQbEEI~~Op*6uXd8<RJIw;@2ql}52o=jt@8gBYTe
zi<?A;KjVl6g^{GErymS6niHw30??-qp<NYv^$=Ba=5%Ga-kfiag9W6z*4%F*$^l`W
z=aBz#VD}ft0B`SnN(Ze=soMR{s!Ofwo|-J&e2MCFFus|9jw7s;th{AUhQNm*V5u64
zh$Q;vfB;yv^!SX*7}GDf4uN0NC%H&DA-Az+0Zs3;^*LNemAP7KL|cZ({RS-g4&RHa
z%A$mrguZq8hZN6(Q!+TTDaO<Pc8gFpsj$K%JgzhShihzEYzPd0Is6+hFyrcj{=t2d
z?X%Xy1X!Z4uy4=$PV(mQN`xObUA!}GDMI~DkA2RSo-fE>P92pyw225R$O)@C05fi(
z@qj9i!i)RVe{OsWax74E;1T}XOCGJoeMzUDMR8bIM3guzgs|nX*)C@z<ix+66Cq2L
zApV^JsT*lhVS)E(v-!X=hW$G#>o*~bZZuU@`hShMTat&ZxCoBoam>@mC6dQARqTPC
zW@J77sef;sNci;KSfmYQ4!9)bUgxuUQEv&!>0&RaTip}Ps<2f=A5(nq&q9D9S4DZh
z(*X;OSH=?UAiA-<M~YN(Evl=(JNAJg6DCR*mJaitCkp7tU+`qL?-+UNHd+p$HUm?p
zJmRzK2^3py#$oB})r5+GeB-A-ulBWyD{fOC!y&L%ZENoF>JuJ%$Ta=Gwo2WZn{cOm
z=!nR5>;*ehOVasL>_tvabxy6x79w=>@?Nn@s(uAB5y|Cs-d)__nYf`sMh!Gfdyc+w
zWU~W>M(#}L7G<-rYFA)@Z~uEu0=J`1(u1agrJ5RcFvr|>GTmb?6!SW?r2ml=<?WI2
z!;H5YlMPP{o5HQ~8|b%!i7#zMyyj@OZGER%uNm?WF@y8D&&3hHzC*~-rH1J`@59}o
zR<ow(4!hxt=hiygl#R=;>$?<k>87ir!Uw|k*ZD^L?jHL~p3Nj1dA8FeRz3vcE5Gui
zjBGu?O6~ZRWmknoeYLHB5<@UVbM4PU+f4!eb5=VzYNG6K<d<dO^8r5C=&B)|<`SUz
z1Y9|kA0MyNzZMc2-8A}MF9qfpWnTP#Ic1(noQ_J(>t2QcpfmE>xElAM`QIUA3>7@$
zFZTklSK^~ZeOD6WZyAYaa?E$-dNc5-yG)CC(Q58R^-F~|G?RLx$!W9wcm);cVqNM>
zM|wrPjepTdKHX2Ka5;~wsPc9uK6~-9AE;h8oH(4T+ibs+dAYRak}9*!?R8G)b<*}U
zkSmS;qG_L?^t?kbaQ0%jL#|=blywIrJ(gWY(@l|^UA5MAjb7*s47`Jj)cYI?ee31&
zphd{Rk%WukqtZ)d#DD*N{>6&?LPrHaN9F$+D?3FcdLHDZt3bvY<6tO=ywIa>EbV1t
z68k5Wv`M#aBjz`WO>MHM(~w4Ix{N^}Mp58QFo`qPb220X+8(u#PPqi_2(q&0xbG2?
zjukTR*_@>s>f@5j%x9f9EVA&3T3nCm{FPD*_0iraZWLCyfr<O8X(*vBkDgj@(a*J*
zoA@Dlj3Oe2SF>i=HVX|EwEQ5`!?C;&S|5_sn9Hx?sAq51t=-)lBC22QafykoJWz#L
z-vDr;!5oPIgFqd>{1EvN8Q=UR)ChO>kBtF-@g}W_x<cku8YHo?yolKM4{N*=VU94J
z?EY~}6hZ1c5RHWq4pZ00;wry?^|KoMa;gM8i6rY%ocH#A)6rFQb&ii~FQ8<wGz^yl
zhl~2N8|gXUkjWOvmcou0o$)kUs#7O{`&eIE<3vRb6-Zy|(?t(B1)Dd@9m|&{D6C>O
zgU2pODUG{-t(Ryx?*$hBuh`NWn}*+LU?Rt6CB6-?GK_TXjnAJDpaM_!peR!+8`rc8
zGHZfy{wa(dfvMfg6+-;p5@wYR-JYftBiZMn7pV)%xBh`P6_vu+Bl!A08}p0!+cDSQ
zt+$Y~o*nH4cn_g5Lznvk8xacHiFqWiz6RchIBX;ZbiTcz9{Yx6LF*{lAK%|kj|{T6
z%WV&*<A00L_Pm|q`wARU`s}27a>t+I*ZZTrcb#okz8j7rzbhIc(3i1)|KR`hP$g_E
z0gpHISo*-;od0$JbLJl)9$1PjgU2)(_&MdX9^><{y;T2>)k;m??cReYb^zBOp}CY4
zE`+%xP~368u6Ul^n45<<Zdf>mto2x^(&M!6hYwyNC++?I=@}%6Ed+`ZTk9^ae6K8`
zt7TOYWm|^!+ew|SJIl4xndE!ZI_bG;j>g9lw0D@A*iqgZg06=+))l*YALB31Xhitj
zr(C+nbA!;gI?;#gZ7a5Svi!ds*3XE3i3EUk0|f>8z|K9ck>$sZ_~QJ*_!S_kerMRR
z^K4BV5xz5+^H`}x;f)r#5A}VxBvkG06+oQNZY3w$yV;uc+u8Y<kiJRuSah~(S}!dN
zaA>C_hfd;3h>UeUTt|n8!|z4|um=c@rSP}S+@?0)k1En`+`E|T!V3W&Z@;cp23|pP
zL*<#Oj48_*4WIw%@?Ep^CjPrPO>Ih_b>fGmH(tM@;6F;#6BC>)3SOwg3xce&{8hQ&
zLTv?T8@>I2remR*JcH!&vKPUP*ofW=>!S=CKVtpQ9l6?z=A$;MCMn4hCXXX+jTQkt
z?^qLQYB__dNf$4c*df!LOI6#~!a???oW(&839GL`QgRlBEK0+rp*V`JAC2VZU9#H>
zbmQeVrAa9{s?Y;x;}i0Qtw&cqk2UA6Zp^R;s|q?E$|OVE&XN`iG%pC0{Vf7@+=Z%F
zzVuUdpD)3)d?-=3-;nO{ja`^PXNXZc={nyT`_or-;69uabJdLb*eG&GlHb+0Ud<1N
zg)_cQ{$}@)%a!iX3HfVSoC&eROm(RdPVp~|rtJx3A;pFThtGD#CD)Y>?Q8Q8E=?Xf
zNM&%9Zp~P{K#1%z)L+wb{fcA4@cPmD08@gpMb0pvLzc8(WOuZaW(oPU3wyaj^~d_a
zeV>dQYK>L4OFR64w8_Ij9dszqcu)_ygVl45C3AJg_AvSi85#M#Lp-Vym8B&ebncWC
zw%<Ab&ut!@^*4I7-BjtPMT+*t%}$Y9;qVoGSE0aq3GQ$y#41QM-=M~{;IL+)Qla$l
zSgw+p<g6YSkQFPWrNav<>E5H(#h9?Em2+7PqEf}2PBN*Q&Q&_!2Rd@6?L41zOU|U1
z%!Bxy@9iLZ;m^sl_e1S=&q}zErsZSt1jAp|l1s$!%s~d(3Od?#u~YGBtg=O+WZ&Pc
z(>%z$-TWeuF9EB@LGKSMx0UL0M&J-Yws;r78whGL2^J{=5FI4nDaxS^_kaibjj@r7
zD`8B+!7P%<2J%g^7d07&(uQ_UX8^XrXio;4mC%?1&htM}YyXgv@-p^nCH>)}g?^=<
zbrP2e`XQf74*p}@tIDWLD$qXr?AaV@mF6vy=*{O$j7amBdvkKtGHUfr=_9jd7-sU*
zjsnec3@W#Pu~s{7+VR=gBuy8d36aR3<fe3vgdx$CT2Z?BYBM{KLyB3nD10q%>hD7v
z&Z%;dS<~<m_J!Quy*<SNoELuvF#ck(MQ?uLe%o^_=5w1M;Y&`KbZwKdnKYx(zT3o|
z{Rh=a@^n?~Nnk+j1FA`z_f?YrGE^lYE4<;1_d8IKFaUk>9xY{m8cBDAv2t_}P03hD
z;+SHK9m)w@1>!$n;OMx?1=sW>)ou(6A=~d{xmju;rQ}GW`?_cQ-%hO}6jlIWz+WX1
zJ3_O?0RK6SOqyMHk`(M`4KC3Mfar_FGicy3rn%Y}g6>Z;LzZ~7HTjKug)5}WoL={*
zzPDnEZTO}E4zL4pmSa)#(uznnkaB)xc)VAyr{zeC-h6=q{ugRw^oQ^5D}kNziLc(^
zHE9uJHO0oXe1N&c5j*E%*%Pi=W`u7#@4kSUaNyX=JfJMS@S71LD#bjm(0b72G9pTQ
z(ss9^GZuItjIs5!zSz2`(AQnrzb+lI_4Q%|t9S8iBo>kB8j+Kg+#xf}f7{K{fB*Y4
ze^6RRmGh+BA<sGBk53+Xx(>^LE_;3P)EslSGxG~G(l_$isQ9Jw%Ky$zH({(eN`a+@
z<3sD?K$$ZoZ;0mP=KC06^I3LdC!V>fJ~<nx!ToYu={4U^ODAi*TCOa(Uu?EnoEIHM
z0s$n1ex)UXx?ES7F;+ajY{u&;=uo0I3=a6y=54<Uyjs6?y)7VYvFFUgxC#F+T+SVJ
zQu{e9IO96On9-JQ=47)wUKw*Z+Y{HMqAs_%s-GtQsD8#tK*>1t2YfaUdvDmWL$6-O
zizc5-os7Y%hqk*mU?2$bwai|^VZ+nJ`M9--%V%0?#(YetWD*(lmSfC*!cpI)QSTPG
zT2rYPJ+AeFUj@$U;H~aHL0?~{a{=o&@d3uCFdS2l1$*q<1LM37f5v8UW4|-6Cc;>J
za{W|;e?3`MQ=>I6HA65WD$NbM{!}%Khek#k*|yWiNkRbbf_|=)I=4=rF}#uT3)W3W
zPa#lHD4pef?u^Nx;WZj?`ty{BFKIMlF_@t{xGFJ-q<d|Eb-*3{)g3we3iPBSU)9Db
zUp}5;KwU+I;8<C~%gjG3jti}-`+w3)L$84Q$WnRIgi0Yh)yE$UD&Y|j9tE%!wAzpW
zTFABHiNo*z2$EG6I#sy?5G^0b1=x^HvnVi0Z8YSdAF)g-p5+VC*XZW!&~}5sv})xn
zVJT{v^a`O5(1F*f_k&fnEphhg%+7T>c?$r&Lqqg&<tZT}mC=THs30~XPF=8)OZLDf
zn^thAQthjA;AhllS1SI9cv@Bv3wWY168NF>fj7I;pqVdjL1eJ$^GzwWg2>Rcd_aKf
z*EWXI19rqlS~1Wp_c-;#E-xPKr4twFW(^wY4^p&oM2SA7`)Pmg#IQ-e-24zBEH>dR
zNGh|2u2*L`#fdzZF4mbE2107MeMeweIKo`qOL>^Gl9Z0k8*N+c;$peHib))FX}{9m
zM$0eh$*VMK-@q)XFoT`Za8?r$V{Kz)#4xC{J?Ql;_*;>GrHpGjzq9G+%elV<g5=8P
zDZbiS9vV(Jtb0jHL9j?U)^u>mnxe8;yVQN;H=d_ou<aMO1f-K=JtX?3OH>5uAJShS
z#uSHt3;N%zg&emQE{j*`?hy~c7aiVa2;io*+gvuu=D6cn7wHd+z;`!P2LwExyzcDJ
zFS>6Q?2kI0o<SDF82c|3+%aTr$S+Uvz1gfuch`OWS08-<>Q+?%FRSa}sQfXJS2TA&
z82sV*!g<@KC?NtX{8unlH*Y_9J+~lDQYsEyHp3h7jZiWFeUp<PKmqL+?YhR~>lZp{
zrRNZN@(s$iX|Fm2@-1B3WgHuEr?w#R!^x7m#iw6Pe{C*{ZaYV+2d~|uP~)P-F2A)H
z>D_tlWE80WN!H={j#`77?XrxFc)Ae%&HpM-3?Y~0xjt6R%VMMOyzQ2<Q5qN5rsE_l
zmdjyLCtS6J0jWz0$TrnJA{slI4g_`%6*=0ePFf$bneM{0O#72HaRD^wro7EU<%gWd
zqsGU)s~L`UskiSix1_$dULVIg_b=)@%xOC`ZxK9*v7O^#p5JG?BA6L_=+mb+eWk1p
zFQ1WKulO`7rEq2)|18m+u;dbNyo~U`{EZFUcYN6S;B~o`%yRFW2|3?`tY%|l!Bx`u
z<sI6#f^#TH`xCH2i#!&+%VZ9Q&^JxdrA+j4I0k__4W<S~TS$A7y4w6H%uHqPdV9LE
z_f|mKzX*P`z*ij2|2V54zu2F(BI<K;fZ7CDVgiJ3s(d!GX!&RUBPeEO-}ld)NCV<3
z_@l}Xr{i0~0VAIy^3Z>=uYQ)FqiEM;Kch*a^apQY=i*a$uS?k*Yy|Xce&qbqwZxiK
zmC#}Aqq#W3{Zy3UHQb~yN=ZkU;bVFF^eVfEG23g{@IZ+W>GYto9ptY)QddZ|v)FV$
zP?o#N+FUq=<bu(2!OY4koA=gGd+ka8+re~w3%BF4f#0ngm*(GIvA^XMpYWyr3XQy*
ztsA(eHf2njuSLdSR&Oq~^EnzaSBkX_-3&+XBOTnH#?ha!_Ia4;K%cqWOdwissgnq^
z9T0s-s;VYMD%qvihoY#cdAn<k6J9%p)+`4|)K|M^(aDDH6x+UEH!pAUuu&d0HCJ2Q
zRGl}M9}0oVC=#+fT3imyKuyk}(%}&EiuW&pzku`fUHHVvt9!uU$>^%xIbgiYZStJi
z+(Pyw!wh;5&$vO7fI-fa8DJP~+W(liw*VyOG6t^~wFy40vbJU4T&P%ZG-wCQy1N60
z+gkogRPPY11<ez?V-9;g*<;C+)#polJC**AU8S1aYjzHXRDVY;zyDc}1qVrAx{|=R
zj(gDZ{fOO})J&PZnP1lQptIQQ{|;D!zXKMWJgovYqpnu&caRFRU*!KF=&?@}vv*ol
zT@4f24Epm*msd%UHf{SJIU-+sgo4Yph@4i{L=$VA9KtLW@qwAX8z|l*XICi4n_Z7H
zy`*+AQLXt#DrSUmn3{>bo3=$-z@vZphWYnV@`_(F8c?%`{boi1cp8&?*_)YYH6G!S
z^J>3Bhrf(AeMMYt+~LPA_%={lE>Of99;2Ko*aY$X5cw9B7#&1yhtU+1E<Wfcl&m6p
zD;4^3zRkx2<(ZTeEiD&;eiGF?lH0NQ-NptTuXwZ_7_BUbvVVUwM!;G&sw*^Jru2tk
zEg4LQ%gek|^b7WdET7AZ7oopn0wc}Q7%UgSF^ocMwC&E-$}!>sRKFUm$2vtqgF|h*
zKW@tXdE-x{lKOf&2un&)frg07c#|f3;kC9*@GX~0=&0BOJihCNAx=pMCh7JtGu*VJ
zemS4ow0w_>&w$vBe=Lg4NtzD@P1gzYF2ZQPJb*r(Rq7M#grkcr<;9m-C85VTPuDTW
zS<c`KMBDYUOQ11=s>jltH(5ij#_oH!%<20(AYVNB^0_RfPX@p`SKZR6W4i!;y|BM8
zQt{x(0#_kb2Vgzc!H*~U`q_1B|HRrK3J2vtuA$emh6gzJH(k+igovKya0a{7#;nBC
z2!-=Fvnrj^W)^gt+3TszgE>i&^eaxp*sOK9iL8<D+AT|1TnVCW19vH@+3TWk?fdi8
zt9MY&%Mh7nb{2M5DB$u>ZgUmtmBbSJ6YH?zeehw)?;xnyS))`@JP_mZ)J#RjKJsCY
z@hN^p>`tSQCACtjV<D#5^_WH5_|9W*v?ieJ0)=LLuPBQMfDYM;)vKlnpWmo&Z7aK;
z@B!n&@4=$hXkpxZ^=e@-G+qT=&d(COK7xPwWj#_Wasb#jl>%|lwK%L3v>qL+k-Uz9
zYedP|Wn**TtX)-$d;=x-s8Y)lEfuGJ;BrOdvX(JBORQMoJq1idGnBqCRrm>|t?Fsz
z+XI3%^&K?L^=KOSrkf+kye3t*MC(R`9};{|{q9Fhb9Vyf>RWRUx;#kg_cbG5iC7JT
zLj<tNPmef4$XQyB+KVoZ5C@fsVvjdN8uEv?zpk#TcCB_8q5u4VOeruHt^6@SDs`H)
z5~P6cQs2Vso{*cF44^}oT%NGiVqW)ep64~PTOlVM=rqotWm0a>P%@wUu;cqo9+yIy
zH%;8OWQjUYRI|%YOFUbfcsBej${H%9*JUz89eaq<Mk}RhAdjq(`w)=#^&;p*$gvfX
z=6iP($aKEG`dbLrlWa)Qs`R;IWgkG@dMr6qGG<UZtx7=lZLFmF@uBxae8w(2=%Q{j
zOQ6o~{n-(5F0`6@=g8<Z1LQ=ZCohjv|EjRhPv}5EUW`S+Yb_V~IY9tiSacnh7jVF7
z9vvc^D8jV#^!df*_xses&Mn_3U!zOkvW_pw?D{MsK38!-`<E<Mco@Y9&*s1&dn9R3
zGeb%`{@szs=L}~pV%5*?;D;SCM_5swtWdV~hIDuZ;tIdLPW+YCW6?MM?`k0a4WMG-
z-<n->m^hUFGZ^Ltgv>w~5y=d`7nw5g54=XnM9=KY>|b^tRVi=SH?9<L^zb@MhVzWC
zx@j9X89gOyOMk|=BLKE#JX4Q(=VG#=l`}S|FhcU-2=1?idEP7+y45oI8-)_@Ms89v
zv}Wo<`g3Y`SPc1AH@*s1;lD+Jjt9KSGC|6?`e7pA|J*{28DkS-zXJu}>>jG~%zKM|
zj0pt&dr^)rnXNAtG}k%AA@=#J{-RKL=QCIiMwX!CnmV(PwZRuo+7k(lJsUEr4kkt$
zPo|F>J-zjG|H(Ue@{2UzF{jVx^&P4Jgo#-@3vl4ctbC83-^w)Mj@Z+EyiUz!rDOTX
zgtyS~oBu7nnfu$Jlzudh2(wp03P<NoGc{?D@!30sIov!ac8HbXwHpUkL#8FUew(9(
z`Uo1f@==skpgkf<#GRA@pb5EPTSwl^qk=NxOw~>0YNUdKLM`)k_#Ev6N>QIxAenv_
z4cw40s7adH?`klG>I-Vq?)skh7b$ca7JDZW&Hj|8>nvCQsQt)<tNIWmyoMUu+#~-Y
z^B`C$CKMesW<srWTnN;p?2i79Wv0dj#n{i)7U(P9|3KP~LH6Rb3k1o9D<-o~g&eI2
zs?m*^*keG1F?ix=y*r^&s0C5Vcn8W$=GJ-NmS$_G3_~8@5to@Q+}DdjuqGVolt?9q
z`4MMxh#`(%y_Q=gQj7R6251aqF@jwvIyscLr(X;&A|c>TO1Mk4=#4nm+3WK%X=5JH
z+n;Iv-@Yr6q6sDGQ$AR}Xd|PWKT8e>1UgC3MPfc{R~qb1XB|8Xs}b6dEPs5s6Y7Ww
z%0Q>)1^tNp^TKBveS=A#)cyCsVY>ehlWcRMRZ_DWNm4g+YrE3ek~2m?s=XwBEXO?P
zo=+in<q8%QK!eV1-#@MfU?*U3_g(U7eATj?(6W7RI9&?vZ{Cd0%zOc~Hd6)ug83Xz
zB){<v*27~Jy{WoO;J&k<^8F=&GFVcSMKOubrXdq7)fWteV@i;wF4%ukRW9H-md<Bo
zegQr<NVlHo#u?s<&3Gcw01tD<&-M)O@lc2=a~Uv=zqw!5Tf};F@-kKFB^Go~P8RRB
zGW;K3e;w84x_yDdd)I*CP@q^L1lQtL+`Wb3Rvd~IFJ6iU4-yK&o#O6Lq>$k5Qc7?u
zTAcf`&)&bY&-dMN|6(u($zUYweV(=EoNG?P=JXovUcd76*0mw1M-m*qRn9n!L?*fn
z3mLW_$N-D*&b*-K^pateJl0_bE{3xYnXA25PyLgYC2^-pTEDgcCvBVlX}rE;drqp}
zReOj_ko@-~BX#27!qgASQmmY8`OSUXSajcveJ9t5`ZPCu!ZZnDB1vGNaBDN)6<R*F
zFZ{+i9;sA3V!wWLjlD502~RrrSzALXM8F0Y@2X9bbqLx|C2Gh|5rmhEHI2M7Yk15M
zJI7_W&a`^K`B^#T#HE3$C}@UwP#;04CPtpO%uFQnw$86Vp0}NQNI?H=oRaD%-O%i$
zmp#%hg;XX;26iBtWaOH4Tc-cq(K^o_Z}0Brr_$O~+=04J=uaV~i-z_a-t)F+SETav
zAY!X{->C9upT<;&0@0{EODO6fks_zLgb&sE0V$MAAi*~@IxZf?^+u}<$Xp!Xf-d1e
z*J^po_CZxwv{a{xM6ye<{4gkD>V>Oy0EtJs=Q`v=JjdUWAm8Xe|MxhXLY=%M(Bnd{
zl-rIFZa!#}`_a>IXtp+~ZG^Q=L_}?Vn8pFy)FlEUk~oxy!s)t?I_HNJ!|B$_kx8~?
z(Rbd3%#wEfz$Q*U+!1r24EIm2H-;kKCjb@4bo_g-ei^WuC<wrX5c2_uz%r?D(k%|k
zr{VHze>VE0W*RP1&*~+1hT8IuQo^v<ow8t|=j?Hr_rbK)YpA!BM*b}bSL{Swun~JU
z_Ae;&t;di%<yUsnx+Zr5XgN#J3`<#ys<G?Au7QyTVu(un3CA}Et{7=^z1sI|{7WBg
zsW1KSeDy^yTwPz6m*Cw-0<eVLZmn}?{VFeG$1#zrNq3k=&{Z)^cF8SNlqB71GIx!9
z^*DiNqm|}g6g8jHeSA{2ftFZNRMe*k0(i3|SK{?tk(u}JPcBQ>kH=~?$OSJ7eJ$1(
zz90S6&tUqq3{qn|PfxA)i`uoLQ|9tz4Rp8tKr}k@$)9g+V&;e;@3&~aGk26^iN196
z_2TZ7fojJ6DINGJHak}*DXg!MUz37VE2o1%A&Rl`)qr7{erkI;bl=(Kn9dNRk|~Ry
zmY*+VhJ$G=?CXW@*lViY^0gJ;F4?$r3?~mMs3`;oUOsA4ZE`1QS3hHlN&52Lr-&sC
z6MW}2AYNgwu0DnivoihF397=nF!m_~?`pStc>CdIdh~f@sy^5-{#Vxr@bk})Zzk-0
zi{`!b;ghAqJ<#|PF?ANTuRLO#xJjg;s&fL7;t&cK@TjGq&Z2n{_mVTpj>0}a$-NIY
zK<~y9dP;5UW<Jmc73qiw1g@jwc~_9*bNGwnKW9Hw3HgD$B*<44CMYYVH*^iuOHR>8
zyUjt#1f(9FK^W{-SZ4K$?)rcWg9rsa5f}3t6Cj9eZHVDy_TzEP0*>paKSd8cai+VD
zvj-Z(+2gkIux2MON-bW}sI%H5vd6<JW?o9Np4kr$a9nl-I@RDaowWme%0Rlv`~@0Q
zoz3x7w9kQ$7U?~M4fzAg#nE)GzDQ=PBWWq%cvs9XY3#WY{3*!%p~s>df8%SnSu4aG
zOW)n^!``Fr)fg=@sEZW7X$OeUl+kZERZyy|>1S1V{_C<ddEfd4_fUefRl?mq?2#u3
zFMb1$+7g|{S6`dyA4!M7NDO?EYaEyP6t!iDrjGZUZ?|Yfdivf@i$cX6r}pUKd{NT3
zkVz8#jM90YrSsoAv>fd}_qJ>!@a9`|UFw5B&M;H}sN(8k;K&DWnzd~L(@|X_QcC|$
z^Y*XTKsyOC#vkR;BI!O6c4*EU3uT-Xp)$3vz`n{$GRF6z3fqg(j-eYM%sYPME8qki
z==45m0h``k%jImp@fLRvV{e+s9h^Drb@ep`QS;t%OPcI`YAQq1eRhk!!#8A)YvmHq
zm%*w6>yB$>?QbNr6sy+xeKKy=a>rGplvJ^jF~b`@6&XittyB;d`9ao(p_G0>nyc&l
z%O6^=k9N$bNq_^54@3+`w)FI-y-w{RR;)PhwfB&fIgJJr^Emm5p8aAZ<zC;(9DG`k
z>KsDx@t1^FDbEJk2|)HBl8pU~vJ6yS#%Q`<L%^sJDcl(QvWjS9X-2=BC~fA1L(0FI
zgx4PUh2@W8u>~E$v85bPB2zXS-_uNRwG-h@nol#&*wrL#>Eo*A;#u1+oxW{-i|w?7
z^KCGRQd!%H`^H}VW(1ea6rCnM^+O4^Afzs^#EHq?pmTXLI|k9NV>>s#b#4G2l(vAm
z8T7yfwT6u)uFln&Lo*bxefbnstWg+U_5rmR=SFvVbvai^l1)&lPl8@)*5d=PGcWF%
z4e#Ymk4cOOl!GZ{_gjCLWvXU<JqGFSM3#~}HX7<}DcRDdlPr4mp91nF2Icfz4!*DU
zB|i4k@qpE4Nc8r=c$tM;09M5E3a?>ut=>Ijv#s2V)N(7MdDdq69h`tON$DRgxE}P)
z-6A7HoH74ffAy}BCh6$$nXv43t?+o%wKDSTfN@I{`Zn<nIOVk~^hw+I*c)?q={9w4
z{-STj!)kMbo8o_n9k7D8Qg&xIjHqu;j2LZhKR<4gQkm_?peJn8GCjU*H>UipH(O%k
z(zrG?A9$rwTwRUo*|DwLiJ2{9Tpr0N2*3Wd_b+<q<0C9!y62_!*~gdXdO#QaSUp#|
zugp+LQ42_bW?_o6WfxHNazEHam;(y3BA@dM+)Mfoa#4Du7x*EVwo}g<s3cnxSR0R{
zg#~`v23hB$gy|YXz~6-=OX5aY!|kN#awKLj;@!_VADs?BM-nKMx;0)1C2eBYXJ?x(
z*13O;q!g1tKG>lJ6peInS#&>zkes>g$hQl%wj`ups79`{oO<&Ps%4gyPu6vIiw274
zrFHAwXeAmYPo1?{jDj8Tf;tS{XJwk)_qGv%c+cl;5|)ixy#yt}JI_>ctiI2M1*7o5
zfSIvyed+bDl`cxiOJ#N*Q?S=a49*mxI+)4bx67?hR?)RH&tCvdo?dBxC}PaL@BE#!
z7EV9+3*(X)uaBu0Rzihfa@G8pIvtTsdd?Su1Y9c@Bm3EpU50if(iU(~_K_DRm(;#`
zq@;0MVTrtg$6XjZRNDZ!8n>0XPzWWMOhi|DYiTY>BWgoi*hxcLZax!?2_Ef!J`G?K
z7u62SPcdM%^j>VECQ&U<Lrj3UYP2)P`IMOj8*VH_QBJ7Kw5tg`&~FGxL#6@t)Y44U
zOOUbSR%lIZ5~;OKgK6@Wj_o&f5zqR+geaaPt;f{u3z|%zEb%r#G9m!E&R8Uw9M$K<
zB(i%gmN81OHUr=y;0y6HTsqe*RF&%|O2YzyBlUS$z2p}K-KX~R&f_ML>)(}zYuh<5
z{Aj`#JkLlAlEBeDI9~S*`5oq_@a>nJ(-mFRU4hQ*2a%<-pNDn2xG@mz^`0ZB{}p`q
zt|0KItXVDR{Z8dZy06|{`Be`Pj8r`=sCGtbbT+aF<nF|e=7>ec6%}^E-uVl!&nQ9~
zr6ValH|)9G<`Np-zc&>F*rI5Wed$?`JKs~UG-B<8?MdCEWsfBS8s)c%?lUF~jYr#6
z@L{n{;uVjjH@8nd>ZsA+n?l>y=g7@RepFdQ2z#R9z4sx06~t5ex{cc9qDN{`v9>lB
zM?}s;x&^wt4nu)M#bu2~02=VpLF`W3;KROPqTf>ILo<j?tcjY~1+C!P$+$&By4;z+
z{zoi)FJu2bqKh9l9$kY@{k(!yrbM;2^QzIpE7GK2r^#<QqLRM+2EGS+HIdsd_aP_g
zVKw&Sszai`eP$iLxjSuqr#|tynIz%b4nSk3TZ9Mro-JwPh#i$D#^HcG+iuo(j`r_v
z_}M)h=r@XIW0HF3)o<q=+a}Ro)%OyX*RYWuug>xP%mw1SSG={)FM1#VzlIQVXj7<v
zJ3+EG#ZBpS{>FLWuvfE?&L=AR2CKrTAhPfytD>1$Gm9HZT=kGZo}{-c?GBl75%h~{
zwlbyrx$)XJF)Ert`0-Vl&rf00xs%x%;HVTH{)LDIBY=wFz1oc-F~{NT#bIa$>cU@)
z?RaB2f`OoB^3n0T4}~M;%Tr$V&)+a{rX5V*FWt7BA8h;-ZNVx!mifCsEA0B4#HxoP
zWJONoqw1ep6(0gotBO-{a=SJNk2OM70j96X=y1o@(-2fp8-IR*1%kcH-Hl^l#__pd
zwJ6WFamNfm)YIQ{TEMF6<$Pt;PQ_v><8lDNd`BrdvwFYb1?N<zx}7zS6<axKY#ixG
zvPP}g53qn0WtqNa#ub(U!U27p>4Pv>l}q*M_rg%~rR&Bi6u?e>ZSQa&z2Y@QmDU@_
zY!_n&=}=rA7EqxQlZ++~DlM9OE8MP<tuhFu^<?&;a<WJ&|7%%Jd8<^<XuD<=f9;r1
zU#{s3f~dZEshnfIrlWABpMa}%k%m>{_SYR{Wn*jB(ZU3d?VAh?2{=*RYxT2q?>#UO
zgk`?4oJ?OY>iHj3AWiTC8#t}7U1CRa?sd?N@P3QF$B4~t{;L(Z)6tO<hqOwDx58b+
zO-2A#8eq>H+>$drHnX^{SN|RydcF4Y;(QhNM7RI5_;BNfF|EFRW#aYq@$k`D#9j2|
z0%$`2z{&9AXkNgz@9*dYfJ}XS+V>Q|fL}=-^iX$KvCOQ5Qjs>ONdNNQzb#<Zuj8?{
zovv$b>-M#HR#x7285c>;PamsbX(9#CZd=XMYyVyR{I(9cHw{eR*|yRo!F&CAE2Tv<
zZcZM|#;m)`;XkK)d%0m)yM*wpcebco_&6L<#l@o5#I!~DnG8a%2?*ojCX1^rej9o?
z;Y&xodoo)Fl?`_b;+u@mHY3{%^q2$n%hL2X3o{BO7OI|<X=H@qVHU+Q!T?&1Zf?lR
z*pJR-V<<jh0!u;3F`u<v2Yd9APdaL|;=7EktMH&4oi98P)qdd1c(CXTyEMqnZJH9A
zp8H*?<ETZnUXByym*zH4TvzY7)Z&TPQSEWCr1<{*0Xp70JAPg!DV`ukL?B=qpag_s
z#55zSe6P;jnmk7$uyz!ayFbc@PuSmpbiZKRR@YV>ho*|6<kw@6SzVWh!vq$^p}lh-
zoi7hV{cyHTbX`GKp@YFfejr<4%LvZ=Vb@WsCVNo?6bpA9pFS-!=`a#gPW-X<CF@gW
zp-#UUfjNcshkKj+#+^ZW@e(fteIm~lF!i@!kIZ!a#}b${P}9c#*mi`E&wwt=EyHn&
zw3FF<rYDMAnA9$FoWM=ELLoca{~du53GhDL#}yawcD@i%L^<s>wM6(J@(n@zHm7G-
zz=aN}ZnY8+p5ioPw%g))45UOXeUN^431m^{IaO<UL2TacTf)e9?>;_yj}d@FDWtgE
zc9W}-G$d)>0myjz%HtXOOOm<2y0P;OArk(4h_-n*FOpl?HlUt;m&E=>%oyU(-uLr+
z#CzmbQvnQ3V6pjk?2uv8rc~Sm5+bk5gd$+yc|gy51Yb7bltREd)|)BV`juDkGx_s)
z2Gx>SyXP;A$GK3YxAWMsWtWnH-T@L2S4`r8BvS7D{u&z%+pm0Et97%M`lJ;%XGixL
z0tfAKVsDk2DxW^9vssj_+iOp=E5Zd&ZT@bg@D;S1iX`Ro9P57XyKV}x@o}Vdy5<~W
z-Wm0dV6(W|LsKZ`E4665&EWQ)VoiP}NN`&8VETP&vV8ds8kTED1fTs}!*J)qtP7C0
z&Qv9D9JcaGh4zpd&;)_TTJ>=~(zoi_keb)Ttf>rma)g!yRG<Fw0swXP&aHH;X^|NM
zADwFS`Ipj1`$b+usu_GL;C(HMK>;l_!%_xYKk1yMuf}3F^G&7c1yGV87`xH-i(h3^
z)`CdoYyYaK{bv>ScL=F{AG)R?jjEHF%SJ<u*Js~eCG!zZ)^e5|>Tg<+s)t<p%NU>O
zw7i4*dEDmBjeZ0bI+jj<V_$6AKG=VYoKAbaK9~U}Jk7FpFmlMoqtz@6mYp{(753O>
zPF8_$9&}0mo`vU6ha?tj(NDs(*Z+RT$<YEX0h`j;V?Hhx7G-mpHWIb-bzwGt{k3fJ
zKcl`8<^o1hY*|j4%<M!0mouvtNok=n5En<g;3W@4pB|n4$(6!!zE`^lee3BI{L*xw
zK*F{Py>i}BOh;9;aaTsRZTd(UVwmc+(=T<MUTc5wa8)l%E{ramX;hgFzv$PrF@u7B
z8liMC&<=MseH|#y*~yOJa9PIgQnVUM0bRE#D%jJqrPRiX>O0`awwOZf-GcEV?!Mbb
zSnQ_?Uc%Y6=iD}_DNh6?1ys^`6w-aRM?b`~-0gi?HJ=$V3_RmBYm37b`)F)D((i1K
zG_Z0X5<qc;KB+rjy58d_H25R5?WXR{&$AmZD*ND_Wyj@*sCT|uY^lU-My%XcDoH;-
z(;z24;fi>l!uU${g`qLB{?t@0+Nb?rO?)A+|I7u_H>DBI<l%VUH`w)0Hl(v|UtFGy
z-)&u78$F{HY5JX@#NJBtHOj^5tEe_|XlUvkIoUhugLv1SsX^pGny|L<AMN9bX5fLj
zjp!>*7T#?qHQ$i>aU9|14I(URq2EMF#=AZAM+NKzria3?fuU2sbR$RVQ5WNA@A_9c
zl{~(eZ#{o?T$QGrw6p=IH%_7U=D$vFFED@$?_g(X|G+PN9zby8q#awY-sEA!z;EPJ
z!eb9B5)<!3wUgaNM0%YWMxjsY)hjrXx{6ciSA2j*sMj1Ud2co3?}tW!3%0ua<-#Ye
z6JEUx<>}R0*KL}V*-$k!pmIJ#_?9kxTBT1FrtU5q@7<0TF9_11+b6R1ya-P`8tu(-
z^IqnSOP^JDWc?oFM=a3r=hMfH#ksmy?9LtSOYs(s-;b7VNct8OjG1QZvyLn4Fe;@B
z*#?HS)E(O3Y>(P0-Df1IzYz=)9#Nyd10>Fz%sG$zE*kwuDFRp9_(UQ+G%H3@)K)>p
zRH0=T<sn{YKJ+Pwfs7M&IKvqSy4;d$pG7C62L}yQwN;3j2$I|0%w!E-*EZFDUq2@l
zRgT%BtFJo!-k;2kyq0CCQ%LCgG7^%C4B8mSqiOJ?w>FEM<s%)(aHri~;frS|pd_cA
zf^%->MxDw&k+g1DG_UOah+=Z7fYku&Tc6E(qutz4pwt(@?sL@|On;krLB-HqXDDxA
zK-sEy-A0u2Nh@r?syg)5%|xYAvP*BzxTU%FxQQRlLj|~y%R03>8-Ma<wM*>rbJF9e
zstbwaMm;LN5h<~cPF**H{L2%2<4FQk<aznc@|8_rG2#OU95en&7`~CDhT*{x?uVzC
zATj-aA!h&^9uO7v7uLAxDHRUnhqx?6zc2Bmff|`XYI0;n;@)zVq<MG!o*kB9t?{xD
zlrE8b;q}^bAoT?uj8&3Vk)!>ZtiDS(A>d12H$<$T@1~x}h>PxCdUX6vCMztQlNkkr
zI~F?Elap&u8txi>+b5NFRi^zeYgeKKIALCAh<L*y)t$*Ur0vK67&-MBq0C8MQhJhO
z8!1&7y=|H&bT_(rA7?1|o4C!2{i0U7d^ha&D5(obb33bjpXVu~->EIc*fC^o5Ez#Q
zmhjlgodE#w=;u!1ST86%nL0i-TyFQDHcF#r;k7_=gSg<u#Q4v+GnF1^M8>p%XJdq=
z^2AKMswf@vSS9lNdaQ-q&5mC(ueYV0cJOHv&}wXUHEtLd9`EaB9ZYp7J-%Lk2x_cT
z_q}^HNnB=B{;wTv-uo3m+vqf^E&Rd<0d9(g1JH>OI_JZ!P{b#DFF_i^k9g*l<OiM#
zmP5KFqw7t~Hf&Xi0$g|_fVp>xm}OJ{NSgZuKQ-7~9&jvsV3+HL{-HS0?xJ_XrioIX
z3NS7&o(qdTtQk)ROb0>VC7-a;aWe-*6}sb@VkRQ^G<((3_zdgI4ZlLQ-Sm$Kw8(jZ
zSopWuJNrH-Yh(7!ix!>5V2dRb=eA>3F24gP$`xKTr)qmD`%JWCJgg}f#-`tw?!C`c
zdb($c4wXI$`ZlAMBQNp6oGp?XopVG!{Ne&gibd#2QTPCwGXvUIK>Iw2tQd-{J%r^%
zbjgRrl7SfFtP32trijbNiCLt`F$8yG`*vl*3iAfba2qQk@oDV+%DC5KqBxC9qQ4|o
z+L*twEr@!UF{&m85h@x``_M7XMZ>{Wg28nzpWIc^#r{Y|y@4%~!8ejFYZyHZ5pO3t
z!4&WEvghPW%y~2p>gec*XReE+N-;+?{#QipvQ0tS0~*#hPXt2+o}0PIy-1_A(<NO@
z7)0x%SO;79{7mH*6EGe$cHSPq*T*xp$Ep)3hu}qsp5RHqjuV6+f-YZFoV#!qX?N8v
z+aei+_5rofYPK_1&O}Ymm_T(fOmP|SH6;`(wDD;uhW;NJNv7!iA$sb0db1$%A7RP2
zzf==;WcO2#yk&gd!pr#UR15NJBOK{z>Fh4&Cz^8ZzC#T-d%}GgxPoslcT`E;aoI{@
zuB^B%mB-mo893QKAy>A5_UuR3Z&VKMGH$UmR735#Qx!09nDc-BzyN({JkC}P80PR}
z$k|8Ag;^}%kZB&Cuc}1~7g(ixs@F5zah9}=IlH-4(w(<m9dHb$B*auifDo`d&tqQS
zx<k2y#S{Y5-sl^>gT;1=ynbdA0_*?md$`gnp*nLLW90ld_mlST3Lf@Buc%SJhqG3|
zT-vI!Wwr6OxI9UfQaA;ZYkj92b;@sqv27=jQQ}5F(ifa$z)b3t-V7)@w2XY$zJFtX
z?4BraQUT@_S1KrUFUFfa4*Y$m=6l;TCYa*m=He?!9R=U!l^4_YZ0!Fk{3>?&%XH;8
zNR*DiVYh}kA{PCPTi$-S^D*|c);wIg%n;bXg4vd}F74@<J$d12p3sb=yXZ^<zdhYF
z%gfmRL2#hgw_!DqWZZw{<wvxM6SGoNE6XE#RA^?vGdELd5D2i&?10;(B8<(L?1h$v
z;Pq@Y-4E`MzZZYUfn#3vZFLOMC8Zi?4FM2^@#WS==p&|EVAli|FLJejxp2)AkAXYq
zah_p*?sxV0O?8*=g`&{yaxWDUSj)uWXJ}0=88#oIJbwDGGANwBcg1Zr@)Nt5lm4_>
z5qwc>abR+@hRXS!7<qE^M%%^tXf47i9<}V~M?VPXpJsD8k@K<n89LsVSj>B5TesV`
z^U}AtIbz2qQ<^((jtQxmgV^SiX}{x?d9qd4u-NS3GA~IWm`LSKvH2talQSBx#)AwP
zo6znY0UafCk$t7C{q=4&2cVF6XdX^r2AKQO+eGm@B+S$*j<GQJ#s7(x&dlA@&Y-Kb
z!Q7|{*2(9C)kIn<&au&rlIqmPk`SR9(JM!ezg0Odx3NpILSKOhB%cM*&I56pg`4nq
zI7qzD)U=X)((^&Ch_geEmS3N-C<^Dd-1m1|LS8CW0Xr)4$=y09qdk8jUoOO?;=h0v
zIGB|#Zo|M<7>iRlNV2#hd@>t3Ie}5D8&u>5dJ-vNT~s@*Wp`u5E9APR&^Ju@l%v~m
zz%dCM;={Z6ROz7<9r(p39GvYElEzuH)UA9w<Q$eGN~L@-J~dEU%<NY{s{2$5mr&be
z>3qIgjI@t<NMQvU#fMMx50d3eVod}KsJpnH_;>WITYmhqyyAWwSoce!89Ce7cmDE_
z=v4($FdXY9vI7k#tOY@+3!}&w5UaK|D~w0jfRlauM-KseY9!E%7SDgTu<@5dPV5b;
zYrq?J;>h0$!5F7RJs<t8F8c%Eqoy*@{s&`y^}vl1Xs5&MQ)l%KPV?j?_7xYQtVgEa
zhQ`I%D^#N@!XEoHl)`QaTK04DMylyg<aF}q{qC|*rJu1^B;P$W)h%E0&9!fK=hChp
zO+V^AaLR!`dC1K8lHtU4dtz3^U#H0qa(#H^_+a#FQxSa=Af(xT5Wr(I_V$LuwfPO(
z7cn(O#fQ3Yr$guB051U1t6f5DoL^M?mP#bpL1WrT--XLmU?)r&E~M#Oe#sr5{adYm
zwyxcEl<j8(X2jYCL~OenPPew8HYH?Mu2jEYC6mFH7L~eSmn>@kb)UVVB~``Nda|na
zWOG&{!+y)xD2hkeYTr&|+Oj|8vvqbhl7U6dW<-7rUgO-Md~~cep;Ou(J^8%pJ#Nr9
zl}9smd-DoqPgc(@JI@u%L8M!xP5Ne3z~W8d-1{G8In`E!V;gzJ#Wj1P9)?Yd8Ekc~
z0m1p(p0E7(DeAo~69f580@6ji6gJq?@??s&suVpQ8x{`76cb{2_~xgV45Kd3fAo6&
z^Yz@H(P1*cb!~=!ADKsh_W@t^)bd?u-5{zbB4)BMTk+@HDqR5yAGn}LC2E5R5nt}Z
zssyvx;u9CqEK`1(92`N+V#BI(M%7kt&KwZk?Oq8ylbZEfDNKP+aAMmOtCU#iCK~rv
z-+X={7eu#YN^0X&x*cTje$+(l#SLVs!kRuX5ig>Yqm2xVt<IJ3Y<^;P?zw+>Vx*n{
zMWf9FL0DsMzQud<8D+VzCH5IQ?VZ=GOzh$3e|W|grnh?kc8BtUgq#7oYRO*AB1rQ3
zGoHM(a<)sH)W^ZWLAOU;F`}39%Q_j%0CT7&&W=SWHEJU?Vuq4Dk&@+UMtl&R6||t0
z-A*vOQX%$T;c{N#EAAzC^hJb1Vl4KgwS%84J{m>O!uLPywfo{Io0*#yc$~`TlVi6B
z=z2uw*hU?WspUdaolcy-;PhilU3Q+0B0nl^f-2W*xYKz}BPrK&W^3H-D)teCMV?T<
z^qv^1gYC^AabLimU4FjK-td{$wrtq<7j+|p_&Z=<+I}XmRN6!10jf(zZf*H;#0rU5
zrCAl9oP2p|@g_)!6@p%w+8jb+rr_R|;*Z+oHZDoy>v_5K%VL)y!-pnEE{1(FE!*+P
zwtG!Bj{~!ioxs1*@&fgLgN|C*>Bgsj^=ZIEDQ+kSh(Aroxl?vT(p;IwybERM$N>(0
zdKlxt_(qyqIV_4qrphl{UAS6RMImXTXYiC%JK$Lf@@pl&KV>net6!!Z_0s@zU;3Pc
z%YW4R|Is0xN&{szO(-t50LH@&=)9&Fjp|&x*1&;*9@c%pe{Qx0V>hHzf|bKGbsLWk
zNyHG2<Le3;OCk@Cz90!ZoK~{w00<Lz)(P>Br1Wr}>LdBbqPEg`xhJ@DMr1o@8`z1F
zN!cjw><?rs*p#wgTp9_66crN|3WB~9un`s=UQzkSQ9i+SmL7hLNrEiM@Xu=EqUAMP
z1@bv^h*70ua8enE7feM>waq}#t%8DPn?+EG^~{7;o7VCOJ3_aJwjCWKcC$5B2lP$y
z1<wP^-}{SsX>BIBORz|E%!`=XK%Iv7lgzqV^KSs+us>S7d9QB%Nv<3!(p7%wPiU+=
zfg6}zo!>cYHaCN7PfIr1d?R2DI)yMci2lF|dTSagDE>9K-A=TOIECu%_Zj)BRDBb{
zZ9K3FgWEBA<4c>do-tKHpPA>Vs0y1VyCE3&k`Hc7HKHn3vt#lSi!fp!9D8agtmqwt
zb+6<xnuY6^n3^|r6lt5(D+kj}bk8z437T+3H>qd89%y;t<SA8K4(3M5LO$Wm1E|q-
z%nJfD$Vj+|s~%VLgbnU|zFpP%kc8>d38^3vDa{x`Wn!a?s9BPy8NXpUon^-1W|pd$
zi&WBzxR}=<fTvBADlb-alZaxLx8FAT0P=WMs*D}_L9qTV2orZors^z62QBn&^{=wq
z7JiV9r@uV>hnWBW%vx?#_ZNVQ%3#982|ZaOm+=AR+Qd!p(F?Cf?@0j)uGHd_)b{vT
z%KKjlJ?d{`i+_JPmK2#}x!ln?{dF|<A|M=3e#)wf=BDi*<FLQ38*vr9UqLe|nd`kD
zA2CaO3d^@W((1!`=*0p$8*ZAkl@;9bq01ReX?|Pfa-6W+B-!J4*F2C~t%Fh4`hW(G
z{rOYf`^oo<Pif`cXFVA%_I`^|Af4g%mq;x#(z?pHIqFU!f>hZ&yFz_U3Hj9#vFOvV
zXmqFwSdE#KxJs{b{c)4qpx$D7>Ym-x#FmTi(`FPGd?M9};F%O$axUXy>6z@#SNyoy
zSUlD<@-bZMKSF-xN!OP%BaGKxb{PSBa0@_9;DVBo_kD-Cq;FRl4CYhkj|5>$S_WZZ
zj>c|Q%+AgNVtRp#vw26uTwU}!SwEg^npK5Ox=}UK#hIYj3Y3C#ooF}oO5Os&YmD<B
z&1oz=!V5)JlfvvTmDP08-IZ!wUaXK<sDF%{G`mWDH$ZhVvrrO=ZZ?Rsm(cNj{h4k=
z*j;2VN!&%ytEwn63A-ri7~U3W==1k3nL~3>xSwk>?u-mEDULaH_?RO^=n|BC3&87K
z7JUhsfTwhQ(&8z_`x1N|Nas@!43Nh`g7Gj{5?p$QsD?nt%hweY^R(BX<d_*gENi&}
zq`H;Exh%~ki-mmUOecfzF!kY>Y?|N6&m<GIH1m(|x_rKeTm(i&b#R<;TFzEk908Pe
zACLg>_P3tGuyuAr%?GH7TLrkAOG`UrfZ-pCrT4zi6fyD<`^WL~*I%kgIQoOrL_GM|
zOU*HE{cYIV_ojz)eJbX)E$|lsb5i%yD(<|_VASaa(QuT(yTn@PA4HX0kck^NR{VsP
zNV&}SkK#^~OXlK|{_}Q!cQdg9Kykwbw2a2UujwA_B)Dp4^8caFGZ;(GA*d(hZk<D0
zWBr+?yJhy6gr&$WYQV5CcP7=x^Dh1%;c`;E$zz9X`pKi3;HDcdCnreU`51s2x@&P6
zlKW!vMX7A3VMpLZh@ihWaRw_w5-|QMv2B+(qFJd-5~U4=ufgA$101(`Y%=EubFKKs
z@kjl7-Ac5`4i!p;9oBn(nWQ}{9Ys9J)87;SMK16m6YIq*ofICMpYp*q62AiRZ1o2M
zS<J=cp@2CK1(_$ogC9y9t*D;ehSg|xxv4OCLeyJy8$81jL3epsdY*>Cw#g`jHLCZ6
zgO>`d5?|B;^{RvKjAlcH6a?cN@0$6L-1e2=$g;U4vJ@c?htHNP8|yroUx#m5*qIwa
z<s0z~RYKg+D}#gaB@0R+P>BxWF@`1`?r|yAnzt2neH`7Y1cGiSt0ZVuB_yjhp^t8W
zjpYWH08U`iiR;1@Gf=2d0c1=A_{E?uXVFoB^}X6$TL5{nT-xEFC~{{g=4&`P`p%`Q
zJV#}z+}68VKua{e3)JhTNq(2gey7`$s^wd~Pd4}<mFG(2esd-}9nWzpeu_s6Ju<X&
z77y{=t?V_(wJqaK9@Mk-Z`!s@r+^OoVURrhzu|W2UO9T|zID_6uc_u2x*ZoV+)A=y
zP6$*-Ep^#9EaldySXQ>?ya-UdKZz8-DVS=LLflH@4wK63E&VC=9no7qdqs;^iN&7+
z4ywNYIuql<00xO3U%C9fhNL*eK=Fa5R#L9D>szpK=>b+a0Bq#zOQ(J4HmX`qpI1sD
z_+~m@wN`9#ST$K?Y5`-_htjpHz*)p@xHN>^?KlP#Q?=eOGcqPzU=k~Cs8U+QEV^s9
zgQ1F)7^Ml%lp3>M$SOxnuA$p0S_ZnxCIbT*8TKg}U6(4H&rorSH#U-<?Nrv1cFc13
z{PK0^1Qsc5uT4JoJOqc5`JMoJBpX_}v>7}Bd=Ff7I&%`{D(KKyEI{>1lgeWg=L2};
zj{#Kv)?#!0IK-j;Nz;p1d=RO6sDQO^S*Cx5O!n{;jFVzwtKJEb9J#hxdxkC{oMMfo
zJBL0I84&xNln}}-viZ_*rRqY4stN`sR4rUz;PyogkW128zynQ8oHsG&dDAR=ci}kl
z>9TXQ3?^NOiUeJLoF2){JPtdsCg&QrEZ~_^Nl4m5mX*L|D?TLTLaj#oBN&sUiR&^H
zmx}%7^3=_py4!tsW;9Ldd^TT&+(R_e8;Hvy!xkb)7TAqg!54Pib@rRPE?Gtia!@z^
z6n3VVuvh)@m?^0#%}mzIB2uQP)(_6##^pFCSP|M%N+q~=E(bVY3!kw`9tB|#qAoTv
zJZOJ}Fcpo}=#q<gDk;qFPmGIsIdnobmH0&d50Dg*q-Nt)DQms$dDnxvJ{S+!#?$`S
zbp8L-%kRv<uQM<zZERF{-bv*zSsCa2?yurMQ~!7cz?R|n<m2=6@o~6<;`<QMcI5cg
zVdIYdgmLc_xny}}IyiQB*jyxZTy6PZi!8MFC9Uviym-zP?^A=`my9*^N}J1vO>ew<
zyoB2w>>(vcLne`?n#7%<J2;QysI-FL==<a8XNcWKG9oR7cuZpUq{&&&qr)VzuLe?E
zQ?*Lsj1e!0iX>j@w+bmiV2xG3jl3K7rnXktd<Gb?wR+{SBwZsEC){2!Nxlm-${)4E
zoI-dk-xZFMSt$ayE0=3=a!52a1#gp)X4sd0p)xjzU9Hrk8Gx|XXmZ{92?$#LRET8+
z)$37?QK8XF;)F%vp+U$ld&nIT;Y2JHmBf<NW>M1Cw%?n?pXaJ3OV7#&O{on9EdDY%
zf^oB##BgqM-$1M4wR~e``_YSPLI|s1%D93|CENxcX<1@?(ezzdSn@D(Cc*{f_Q5~x
zO6`tj@}q)Yt!k);NvEt=^y2JM;BkYz`E25fpz7QdMMR$&xlob8zaW%-o8NH>%qkVA
zP&$1zP)0BbsH-dy=xv`$tL=o!V}oGFVS$JWHvKx+HzuGE$?)&&P!rG_4SG)gYx>?N
zYcuA1AqA(a3`aFC;@8-6gLzTM_<~)Tz)s}8LEaEWWrWy7rBs?Am-f1>Fy8=i9Tb#Y
zjzWw@r<M}A(Ce|e_}-jOQ|eN5`iIEo4_O<KrRnv`4n-qcC?U)7rj%`fV){Q&-2WBR
ze}8oYcrE2H6`M?90$!Uv;vDgV0$54J0!OiM@v6unx}Cti75!PIDlo2=3znv4eKu%q
zZ!I%#jk?^K@sipknlO9xewAA{X5~cVUnX$W$op$J?$6WhZP5qPf2{R7=RBbs%d$ur
zFf?M^N@hDP9jiJ0V3ZTSZlUD0E!4QZ(B21Y6&9q?(*XsQ0oSFHs(agjZiVs`BdOg$
zeLK>C&0}Y77P{7Xbl4Z$2hdJG%|j0wLvvXw#{e1ChbKgANBmrI?&vnM>fF9Hhq%u3
z=NQX~l35oDT{gCyV1mH$G+0<k+$@h5tK-~JzJE^5DFZef*G<s4xlU&aRWk7{0Sad-
z)vt$%oXtqh)jJ-@2g~*ay_>1FQj<$JHx!`0lc1rMWJP-pv}yWFfKs>KQaUBr0G)|=
z4AiYu|Dpu)0*@%l$2wPeDkji<j?pZlYI2Yvo=%PgQbosN*55ON2GW9?&e4d1`Ww)b
zp><(=wgtpn5j9Cj+3oA^9&u3}{3vVO7?}|Fu5oi~t1?=YigAwY4<g9x_r9C!FKOt7
z<Rg&-b|t>}SX**K2;{j|?v7^3jO14~c6N;2A2D0+D5O=xvfMM_fu}Eo-Af3jwVN9y
zKZzV6z>lk#Zl!|uCW_*Vr9$Y0SXZglxSuRqVzvwZig+m4g=<`bP5N@>rKjs_dQQ0^
zexHEu_cPA7oVY!+jX|pB(3My81yK~sv0b>^v353K-Ds6dg~(O(B)}>2<hjI`!iL|A
z9vR9RqK3U?@i2R#uaUBqlm2ui5=A&vOj8nD0CoO16!hP!`@4U7-HTT^9HaxIVQVeo
zQM51l?esKP++*<w34U#izd6=e+<ez}jUgMG*xJ-4`NsBGb=bPBxhYS{=}p@+VifIQ
zbbB-%wqki<I_R~22GZ+EPDa_kD!n!cI2ES|DvazGW!{w%P-42kkbH*R7N{^k=XJAo
zM9bRuxY3$KS^cP3^x_>~g-VB{^me_oWixNV{a+$^PEWeWHfwx5VXS&}iZIr3`%&$U
zzJbOFi_RDgihz>5xYfB@#~p;tXindBSZ>2dB*Cm6Sj}PDe_lRF2jQ6asDbO!?4ok&
z0rUXw*zN)~iJ)%E<Aw3GCXZzDbh5rthh)O%GUfFw^AXu41W3E3p%BL@L0jF}{<>3q
zQ)3{g(_*H=BzgcHg8KkeWHX+Bf2GRp2cFB(>Y#_<nLy4kE@F;IjD0}&sRrpH-hEp7
z_G^eBya!thp$66%oiw&m!YIjzP6cv^d$n3SQi6+?lqpW=#^f`Nh0;{$t5E3kt%8`t
zb0T_^xsUzH)lmh2Gi+AxHfqJ3D>CYYlU;JX#%V@&$XrER2iIaeAS3pTh6dy;WgX}8
zTU6r+u2!soLafNB3OQ8KK0Ty*OXi8OT@*ss%sKlHu%r2FAA^c_0f4VPZooBr^DfQJ
z)o+i>%EeZF{;k3wo$PMOxL~~I4=a+oZ9a|T5jet~F1=!QajWDmo$OVqVA|tku00^-
z0kkaXng`I3$1(8gO)!YumgFbv%vf&#72+jTUkIs=X_C3L{-sSdZ)Qx@g?&Z=AOaIo
zXGP7(Hu;s#xw=cwykttQJjZ=A_0NFtKmGfUzmXBQ#{rkBVUyamd7N)dPyODErr0qt
z8)<06dahQ0Ke3ZV&*kfjoxoZ&R6gL}u>D3pZ_G-naWY+Lp1J8Z!T;#}F}Ln=#mVvM
ze>Sl0mudl>A<+NLbxhipR-;=#L-1aZjlGl`nkg?fINC_(GTCMpyjd~MwKhy~s2?*B
z;Q-^%b73QL9(xw&`tHy>FFuyDr5%O+Sv1f?i0wX=npdR<`G`qUnvmM!bFq0$l~*BO
zkFPdb7<KtXWRykNjaJAs=!1=!nG3>vc9tyot=n$nRax{~D=t~f)hD$4Pkz#ceGt3;
zm7|=@w+NlB$jF)>;CWp|j$9vS)<7-AU-jh*&N}}VuBOe=6{hQ+jC@Hk9Md$XrJg&A
z<th@jFx~9oIP1BQM)@c4Q7#k>#3LE@*u|WUnRQeY)GPTc_ZpZ;g+EiH<k3GNBw2$p
zt)-=$3G8WI$vW_K305lxO?H$Wq-9w2+mSOm#i46yrZ-)rYP3TimWAlJVb*YbYEnlb
zJA>pHVkFPc=F@qDA`SXkpAifDeDY2(8eh~V@=FE9S_PFBKj~ChVfjozO}OaGELBxg
z`)_mTr6riiT@Bd`%5}mFN^p0a%ZOa|K|e?P#IR)@xg5_-Ag(Ad_aI$Sqkw=#QSQd4
z{{5ulT&*p`U<$9xu}+OOGy=!gt3qLRU4HiZB>~G>NgCIUNlT<WcJ#ZBYsUCrqz1np
zmQbTUt29t8s-*BZRn6q$?pkkr<39;OR-|GgK#q{%KaoQU*XAXI_+ph^4G=<xdxwTK
zQDK#o+KJ8SLCrEdm5)%+Ezw}f#ln9(u=_gspEL1W2mr<rno7Llr887NHNt^heWkMn
zbNp_80{AN57i$T_114;ZMfRA&BDSBc?a`$hG#4wUPXh{vbDwB4Gcy%xAODX3R~5b+
zzxONTk8(RQqR0GmG0r<`DM3k%2?meZ0{8AM$<)gmGgygmDTrQr=7B@_?4Cgyz7!&}
zc?IKWWSnn{(2zfF^#y3mKC+_9b&rWz-mq(14ja-3f0yCfZ(g<-`fRZ;_bO=OI(4n@
zy?!y&g4<Q;6lcvf==4p9c%Au{x=q}y^x2#*zXHQi9>L&OMO#q1%B_sw#VNm>W#A+D
zXiY7_Pn!ABVnQ-Xx7r%J7A>P@*GyM?IOxE?UYgx=ANRDjHrM*3XHbNQWLxXV)6VKy
z)-wL2+pixT(G%9vN>k6&!J}qTC^=e{x>kmt^wJVxfg1VBPC)M0ExyH+e6%ckP?$V<
z6@XtwzuGgQ0X2{pjiXAbJma<)_!rA^PGV~31$Lx}(_qy6Pr7AK(Rx@(k*=@#{7aRi
z?`Tn2<b7HmX?ZtuyC-9ERi328`OD5b1*(97cWAc&*jaWvmY=+7n9vOLf}4K|`UsNj
zo_&)YFX)mP8YpV_%hODSDd!<6B0XUXEWvsMm>L>VIp5n`oNSIt<y7;<pY6>l0V9`b
zQeg#<%i?4^&?xy<cZhPAbI2}-@QU_0xN0zst8Oc2utyzdI+^3kh$F3$PXVPQtHrNX
ziqDJ@90<whvN2FUXfM?|fX{V^az)ZvmDGZIb&Acp)-BsiADX@#wS@ZbH*QcAeQ|D%
z7I6(Amwm||l4|Jg$K~<QX!}1E_)kGjJO=tczN)9dxZz5|h5aP+cg&1Jskz~-(zu&R
zS_>|4fq%<~h${xl#!WQ@V{WP&d@1-H;bLn~b1S4}JL2^nj{kuCh`W)rW4++#->2;T
zYh?eb#|N8Bs2-_zlz;#RkbseR{x~UJ%k0>rWy=dtHcVjfZ(0-9ZI#8yPG(DV)8cJR
z&@It)W^rsiXp#~WJZ-qiEt2(&QYqG6LtKAnF<*%zic3t}KvWX?rDj7-xM|tAkJhi}
zY87AfgP3h-xhxB!DHCY(Rkh-tK7C5b<i6u~V?JMcB`BG~HMxKeXg`fyq$TDQk-mTd
z9kbZ&t5N7ctjaVwM$}jZA*r@OECcq`I?|<nAAIGm!=R+K*8edo(|cPg{xn}oDKW}U
z&={f*_tAC=ATT}FZuAsi*eN*2p%566ndPCO>lUT?<PNCisP!f3&HFv%E8pSj0znv~
zTps%dTO(P4SkGTlQ$LcF=5fx)C+>Qr1bFp^vRzZ_iYR|JkBYJji-dwm&CvE}FO}1U
zZZ<oOFIhnk|4gX+@v2I7&^~fDDv^^40mWuGX0n4HBC>|(NX@+LTDGd(ovWewxdQ}~
zQk@<zWtVz_kU7%I!LAqqgzEGkR|79PKKfMh_1o~rS*fblm6_1aJ?0C;>7UaGVf96T
zLItv|2x})xz4=9q^#o0s-vmS0Qxg;E`eAG?8(3{Y@fY^DpCA{*f_SQYV&>3?xIS{}
zLK~z(#;6ju5=`}%&Og2h4p0>3JT#>3qo7@vZ%>Pe)g_Hkt;ibwWonerL2|X?sV>I=
zeScW)dAuI|)@NLWADJrXLaSM>1l-v$UavH>)Uw>_ga41l5s+yq-A@>^?{f?I$3HzK
z#aG`=VWncK!y+@jUxR-C>5n&z<6J4iT&&Hk#G7t;b@2ef#@A_dmmeuUVO1rckw<Lq
z*f)OI_O~qPzV0iM?*$C-iw9R*GT=YnxT>6~Z%r_(?2B30&RR9|HRWkMMCxg<YQOpo
zZ{e~mikM50r+w>+uTTS6a5Vl*1?TE-xJP3V*Xb0Zsz|Fz`nPu}bQ`SmP^h*3UgK-V
z$1=9OWcIedrIt`&$6+g`i(+y0gs`bHLw%d25*xv^fEI#2=Y#=Rd_05qE}!z;dz6BD
zS==1GN(!rtA`N-dIF6#Ml8bqbZuJHt$gzE#icvaeqO@cTzL|BYglxA{XruRTOm!Og
zqw#obF?SS@mYSJFE2qHez%Ra_9A5D##@MkrioS)FYxvrN0QZS{=n^^|*<OBZc)~M-
zLVcfD>PHR${=EO`9mZh{pM0Qn-EQF<G0>HS<yr+g9FGmu3&e~yN7IJkWFvd%(F5@Q
z9E}*--L<RNlJ)9_;lE&#;>%T?y^PJX!yt{%vx8JYpLgw@<czOdb}P;?!P)u{PU3zw
zZ7+4>I87F1vw6~{<f5%!Q;edmK>6YeqBtk8G3VrKq?9eOW<q^Avl*PFW#|G}kh5=d
z3M={6LvVI8Nzzc866suM7IV*gJM^lxYB=2|ziM(>4m_U@-39(R7HMKx4_i7P_qRWJ
zZp9P!?%^jnbDiuyNuBRckanEfUEi)V9nP$|Gf3rx(e_GmYB{OapVK=_iORrSi0nWO
z&JHd^DX*GHL&fTDH-mrmwJ6YcQS7ytvY*@BW{sOyDr8d$)Ak$*etxEeGPv|RUqNdG
zSf5nmD0odQ)}lkqP9a0L5aOEZ|My=1=T!apX!|*U7?ZbB%hKo6*46RF)NR_{AB*c@
z;_q{?6b7x=^R=o1ARf0ub%N<{{8V=$zV%!ymz5v*wfw77IK5BAEX~+4a<szUs(xve
zyjx>|*?7$%VsUV5p9>|B<o!@`&Bq~!)3PUwWSS`LP7Jenqrvi^*jgohGvudpPvupA
z1?AP_Zjt!V1zzu4)2K(u9Mv0aPPt`H%Qx&UB<voeTB}e8$h&@c*#c`2`<J5bcK5xx
zN3{Io_JTpRdHq`GZx}tO_}(g1*jilkFC&=g8uwaO@c<0SHpr)-yP0#fhXsRu89Jm+
zmdA3)Uo{xH^?6}F&#=kobh~nlPes92!wSJsU2T5(^A%mUYJ%(~y~BGZP+g=YBxw|4
zUH?5?#i>$u`E3=ajeS>-&_@2~XSbT3CSq8d4c3+;aQ#;SpS#clYTKurc-d6=ruy{`
zl(86)8XIXTL<qojInydkSp#;pt{Z655^-yI7^4A{h>!`DP-JW`>@biIg^a4PZYr8@
zc!?ZCLAg7@XBEQ%M%xGpEpt18!wcQwjY6O^I1V_Z-A<@9Y13;a91)|pbsNe>G{|F`
zjXHiAdGGh8M=frv09TS;=oc;l<0{Bl_C(S(D%J=Jt}42)dJa-bc3)RZdq^Hx*%g+x
zx%QmjA(d6Psv9ZcwFq<pi%oo5<a@$3)94+PhR-H|@lA+;_mLhAnpBExy@`p7ZvVnt
z4!3KQGOeEUQX&BLjLM7RJhy)ymlNndWZbj*&<#hvD1>{J6!S2Nb71z@4+^;#y8|x-
z-q3UQT$^FJT~;VK*jj$!3UTWc4bl<CocXws=5a6obkBeQL;6<o=xbkftUg2gkstB@
zDy_c<^M3{-09p(MhG<ytQXOSMsQ2QoqE;2VS7`20j!(p2uNo1@!Y0EA(ES)9!_3~7
z)cH9T8z-tg+WrHgwL>Ueym8n(OH_(&pfqR6tNwpbfCLb5)>`PCtBZ(d<`#-8PL;$-
zxxeS=J(yym?&dlrYLs!F>xxH>Ba7+4)rmZBKO4%}*jGBFl|33W5w@c%psa3>TO>;&
z9PH~$^o)S@XVbBmyJ@AznI$2Ds0yre-$wDIAmODZdNwB?vcD4(p_-_!uoE+<vSnQ8
z-qpp*<~<Ta*y0TXNhB~<Lwfy_tsL`Of@D75e5{4CcDqIyDmfoB{j>7Kih3_M+Dq#$
zV3W*#PF=yl;yAFoiQYRnvc*zO@c2tW9N?0b00et3tLoEXY7-$KcPWLAt1yOcU^ZAk
z)@zj*ZFEbyc1yw;tJffGJdN6_5@-&Hi`17@t5ThsVj|UbtVkd*?eIjzf~roZ^o3hG
z7I5lX0g+KF{BgIKyr1-N5Gw}g?08trBUgvU8Q4IWK+dLQk(h#@f}>KVuev47sd2K=
zezJ8-5*#H6GJ@qu4Ofl>+|gsE9CKfjOD&#|7ID6MAr_l87#6+$Fn1EYh|_sLSqwG9
z?P*1Q5-N%lx5k%&5Xc^uUAOMC1AH*p5gL3MNGK;f0m?}(J5ke^m>}+MxbeXPt0~q>
zG=X$jXe>l+qN6h!om30CErVah=yrl<a#~#8=IljUKkv}206=7vqt!qZ<e#I2*>*ti
zz=GFbxYGuP5Y6)h-xTZBZzRHBNZM#@Z3AQYjQgSWo+FkGv8&uDjmtxF-ye^d61#@X
zhD3%`J_HCTNk;Qs%5T!F;5u)1a_qjA!!f2FR%Za29h>;^Whm2~NWEn6V&}_Ofz#jP
zP=Fh=$5%0#xtfEoXW_Z8%bWkJMEZYebpO*uTu;iYD8xv6OnA%D(!3(xc~dpDybOu?
z;&_Ta;rM7KJT2{s#>oeT1FB}maXRSLDEUK5f6Dpih2C%gIA}UgE@7GZDE6=Fp5eKl
z{Z-7;T9OnbKh=*;6RjbVuiP}b>}+Rk=lSCF$iCO;Ae}Q*jM#gZ_}@(B;f?ZCQ7V<#
zgk=N+OY&`QgpH^YsXV!)v*>5UFc$TnQ<1t67MkwSta>%-RlHm~y~ek+kAvyrMssW9
zO#AB^aAP9aS(tG2ZF!CgW%Yxf&nwp(4r>w^y3iqjEs(z1U>z77&cKq`FeM9SJ=>m@
z@^U@cm$$C*6>(23(ZPpE1L>YpQCRcpj?B_^n*81iI-3*pnr(i20ygtBD&hXgG`5Mq
z&MwOPEo9uGsh1<>3jNkaj_a_c$cg}VZBuxkB#nLY>}yrZC7B`N%+S><zw;aQMj4Ds
zB^QkehvULGZq@4Pc*52r)U)r4ODQUG)u}P!Xdg*t>&59joTC<4-`Ef~-PLz&UE5xC
zV+(spPXAEyS1yh&?4dg7k<>VD(MVWuev+SUZ$3WQY`#Rbo$|a_f{KsPY&k4{0*uj!
z&PgPQh&Yk34%(H^#%=|KG33xg{B~<@U1zYgx+Rv-U_Nq8?&%Kq=Ze`nPDJuug2H;t
zMN)eDI-)oPO^DiOPH4ozT-z>1tp;qCs~#^$9LKP?GbJGuC0+aFm1osGyy1YAJG9aj
zDm=#0tpV8do9LPiCEi&by!zv$<ZFxndYZ?2+7cIAD~TjJT@X9<gDPTiLrmL_o+h2C
z+FifqDwyGotL6#ebnR{#4RaH-ZJ<neQ_X7v^-n=3=IZqJUK#a69)7=*xjhLbF=+9A
z82GL?4!3TkyX@bI9%Qa09S^;=rZlX#o2Bvoy^nneA^#qe`R=j~ZNIy^r+U`RYVdNQ
z5s}z3%RP)56dLL{$s}ND+w=WHn)mM9qIBz>dt_y_@U8XCk0gPTVaM|x*p~shIT>Kr
zuabc;gF%$#E#z_MVx2wQ=d3zoayi30SDD2<iMcyNF~24S5x{x0>bXqx;jzJ=+TZ^F
ze*|pk|A}UrVc>Mbvav$m`%~sBLLt)HB;^00?5%^^Zo6*b1Z{()Ed-}Pi@Up|6!+rp
z?o!;LxVyVM!HPqRyA><e;uLp>FMZ~G^PV~9x$l|t2a_2{<~JGkzOJ>`UVH7zr^Q=|
z<gV0eUw4n*F39c><N{yqS5cYY6HU|8J>yfQ=CgK7twhB)oV_l#CB5#T@>+{0o$U4#
zUz~%k0p0ZD+~Yq`WL=q@Aw;%os{j4T+1mekAYqRC5KXS0r{E8!pcb;*&7zsjO?(x{
zCog2fjRO6&GaWwOkgYSOn%J@XX;3w-eL3m;x2Wg$Zwc{}ue%Q4@$6h|fc+k8k+GNN
zTGdKlwb_Wbsd9`C29C@RUFjTx76o662`oHg<p7N!KhPmYA&n&dwpjgK$f4+-w0bTs
zF2UO4g8MRM)#cOW4c?B=h+xahg(jBJ>SmFOQCcq?^H~^_2mjzOR=(Xe?qMTjB5{2)
z)|k@{?c|7r#3sdClkBQsz6PUZAOehJI7C;(Z1YV*aa@OAveS9&c6y;h4TRlbrNZFb
zRW93kv!-RjtW^#H4)?!%+m=Oz0E3$kgu};TxXf*!WWPwfbHx#{{V{>Bfre#I?gPZG
zNP|hBdcQanLPIcMFzZh(ig!8*A`T3dx^Rk%6f1VpIt`Vb|Hcr*=r;GA4}-54kaj)A
zA^TJ`r=Pni5{u54;T$JNFv@*Sz256=Ahn0e!5R$1<LU2du7bHO5Y~?Ho{P%Og^uvf
zggJQa$Ldb$h639)OPe&{1Q=((MjoOdJtGY7E2#9wI2tV%ixitAO-73Drg(Fl?-<=^
zA<N@W8PJDO&7Sy$%X)8^kv)B_nUj;#2?lg&X^F3i>U_edaw4lk<UWjc?#+CEDwV5M
zaa<O%3;SFw*F>d3jk3*_cM$^1tj1KL!@<eR%;6`E9zkAS-T<c0ro^rzY%;sxnOHN&
zp@}G-esv@F>5@evv$37LvND=>`QDPVqsDn%Lc?UWm>JL_MJvgy@n;+RUqb&qy8ni}
z8xUeodbQWbq<j)p9ussL|MAKFe#X-t?eE{p=%5aGpdJNT-iq7@*xbYQ0?g%I_QaIx
zFZE}cw}+2yzW)=tZl`p=pa&7p=-#Lk>cGd=3x8c2T8SaEHQtY=Tqz?hpkB&#ln%=x
zm8xHNmuogjR=!_#fRnU5c!06JHC=hk%fXfsVya{Jr65IB4^mPo+Le{Z>DI4GHJJFj
zB#N(^WZ!DSbj!YdQPr3&uLtc4EcHJFhYBzDixdO@yrWW4f&8xM#{wk)8xL2OD5Ih<
z>Q25O*BNfnF2d?LpyuIO76*<rw2Z#O519ep$csK24(EI(f4*1_9WBtbT-oj&$PWeX
zx0&>0``jK(a9RY-w<6MxAZ%lTKTB&!`g{EeG#f-+bEw0ngQjSFl?-l-->8dPIhzc&
zy<M--BCjU3HF!;W6lbR~Cd9LV)hQQZi3sDDI9U{t27`kwzg8muDG;WI(!U~`K>5t7
zSM-ae)d_gxfQqMGZyE(3#-)$cvHyk)L_k79f))aa)+566{d`9qrT~ck1o#8N4qk|K
z2w+w*B1EDzL=WR=XZE{>2eUbraoz)rcYWBMv9|zi%glU$tQCd!;lP<AoA0;VQr`#@
z9{T}YcZVr@HN*7iQP|v^6PM@u0=Kv4__alA5a6!Iu?J;LhHBfriKzCY&_&?{k?TVm
zr}Etv(P<yIyA!Oqt4pZTEb~uMCfmlr{<Jg`hS~7#+}s=rDbBCYaF3X~7Hjkqnk0j-
zwkrg4xk-m<{5HNf1;C@TMGC!jEkXVa_|c5IZ4>D|NhN+|;7OI81$M39v1K_$t&KwI
zCG%a?^2$xP71JYdol6&*!OB_KS%aBn_Y=V?^GIN&g=o<6R?eVX-;=<7_#Bn3>hpWW
zCFW0#8jtkmx_2&%id}68)qZrpK+XU6%SiwYJQ#mVPN*>tG`usGd5-szp%V`7`cdtR
zxj6<u=XJ$EyE$m*4AwkVcv&Nk79T>EpX{Xg=8{g<j0Wyry8DDwbw@m~xi8#bBLB}r
zPU;l8{TEXDSnes`Ba0a~cWFt1*v^=aQyDh)rM4jF`-KhW*rCX)im$8}jXZ^u7QV@7
zzqwOc0a!FBU^thm^>Zl?u4y}$$)qjd^`HBaL!efRi<HD!9hzy4S}4K6ThVQ5w4~{A
z@!<~Q2X@^FZ~<x5CuSFs=O*ix0OQ$NmEoWLg;gEzp_a-mNV)|O3hZE6W%CEBr{9LA
zrCK=SWpNqL=MzP(+P|9yxI*8UO;2-@Te(~eP0OyFMXfcO_buPCEU=eAH62T(DLIlx
zVyeBXGF=SovCZYu7#QOB4^zhd8<y|gN*-MH1aB{=T_lx%?2*`uk!pA9PBfCx?pVG}
z$?B3&wX;of)@lk7l8M4iq8ZJce0=LO8mS79`@=KicP+=eN3Kz;|H1FFGM%o~5!ir$
zIE^ZZ^bTpW?eS`<sIielIaa6L&4C;21q2v^?Ij?e82$RZLSHezB1FV$K_o<=ng+ar
zagnm1{{dU0%dk(z^4%`1<Vv0)OBAxmZwMgp{-6N4(zaI;)0V$MyJA*-v5W_d-ex1Q
zWEZ-vr97pV-`>;G9$`Te+C_C4t<N^S%VoMZ&SbHsf9tb|YgD;YmpPd@fv8XAGP=n7
zFf+hp#UoyCR9REQbVEV;blOwYUw803#AF`6zU#2TVrCPr0-TvJkOdUc(a~WaRi*?7
zqu>kqc)8&Yy2Bfpzw6jmYser5jl+zd(?Upv@=ujyjAK^=E9?fDkEvN(7EiFEiMNX+
zxIQgd8P5Fmc2^MsNimCDM(yXfR&IJ0_ve&bFNU||*m4$rEsY0sMj43HkN9(YF_uc8
zVUL(aw7?ez58-y6ATKsM6kt;g7uFS%ZT7Vd&EIh2MZ~ZE)5-oTND&^YxKi#h`~NLL
z{*yJ`d4JFT$<~`)=}*9*$6yrRqDpG2=ews{MGb<K`k0D@GZ7?N9A#<|9`Eo5Mm;7q
zuT!8#r#tk+xMomYzEr5PX;c*Y(EXZ6T>JVcGVo$J<z=e9=f3XV9&xM<sIQn!!~NH9
z=Q<<THq{IPDTt!K0^5)R3uncwRT=fm&nV_N=~rbSv{#<gcsQBXwO@6fZtce7W3*c&
z!W(%lJ@zqor8GK=#IHV6Y;Bu(Zkb&l#MhNm7X1Q!p>2WBlFRc}>-s#6Nt;Z&Re5B5
z!gE@3!QVSdFy^JAYq}atUI{!)TC+_$B-TKVuma-?>2;aS$kQ~px;?SG4;0~|;5Dnz
zZLYdMgETr#jY{8X;4#e&!%Xsc5A&{kOH(tQ9BcVxfSU~3%?fhdzrO%#2y$O?zc3!0
zZ<_&d_>;FFBCmd)k!59OCWVXf9Uo2yP;23015}wpJ+%_%Ce=56@`89Tu+0JQA#7nL
zxGvp63-(mW--4GdwqpdZdh4%&LMYS-4Cxr>4^apCZb-FfjThZ3xphH*QXCxT`iwjc
z7>wXBMNmUJFp6Cv-XV}8jATsQep_A7DWZI8oeIGWCi<S>9;(zo8OLYDPFOJUG!(>h
z5IW+dN;VVeLy6DC7~MY=Xx2Xkc!i^<&3}Dy@rC6K?!fBr?}MDCbXFqtXn`KkdGa02
zWV%oiNV#PV<Sl!{2Uok=JD7HKbkteQQ0|%AfiGplK9#nJ;#nYZAm+t0xtlGnnG0?j
zA0yxQ21hI(pf5<nX&!Xb=<9fghjlEWVo9GhuZ;-pp{VOceZ!eIQS{jzDVt9A^~(q2
z{I@68cdVwQmAB-W&?9!_$TDnc(UreW103_(SQizg1SPee7B@1a+Nx_>cK>tg{+}m&
zy8?*&)x9tc-0$MQg7&|^<ZeK~?0u_=OX4j_n+vtJ3sFwN8SK*K(0kJt<hb3gStdm-
zQ5vaRS+2d#Ry=&N%6NNCB1rnYBTk4-UX_^tCRd~iP#(MKUP3~340p3tltLa0Bv3K9
zHdk4g>o{bc6e5BypsH1-#08)!rOW;QUI6bT6P1xuFLEiwFXC!ahKeB`gvf6k-ZIfn
zl~;dC8vBS$I8~D;x!<X}{J@yT(WvTJ)kd*2Ri*bSAwj6xR;}4tq|<v}Rimz2&3^%9
z_QSVUe@34D#M83~J6*;`j=p<?g>0WJlDN5XGIwLE8tYX)^5^SfhWMx?>Q|MM2d{1Y
zS{9XSytV_6WAD<-6&R+4FEB7irU&MRAL&TIJKx+4+C@IJ#sdb@SMrWDkPSmnJwMYT
z(3D~F`93`;kR^v#1H1u2+RD#Jpo8OM@CoUpfvfA+Wv}zGyt93{fdt$ep$rH>LNI2y
zg8D%dP{;{N%{ezs{79Wp-cF<9A*na;*RpBN;VVd@&*8rqB7zzsDLBT2@BqZEx?|E!
z{h;`CbF^)Kh04KwBrF>axoRJ|-!mt)(~}r(b6xfJadXaLuJQ>EM)kivzaIr!vj&6p
zWwXx-Ikj&!4eYE~?>YgU>ADNRh`Q(ecYx*ZfaUd!a}lm>26@MKoKNZ>O%{rzQ&9NI
z(>srxYtSY?+t@^@@>D6OI%Vo&0OPax-5m!b%D*jrwFB?_D=#A2Gu~-FZQ}co?cL)7
z)XLAIkJ29Faid)QIBwGo<vSx6-51}&D0H80Yt^i$dbd-}gnD5t<=+iabH`RS%siL}
z*c>cwT^rUH9qX=tj1Qd|X9^1LVTDW#T<p#CI7v%K2yZ_#a4nyF9P<^a=(Th{3iy=E
zcYLiQ(e3+R5X=7x@)LeqIB+?qZVGYyhmsVi_6wgH{vNhhL$bOAAoD0G{9T)bGK`nE
z4@)~zumJCpiK?XZy3#t+4;EqAV`+@<dn`0uc4*yao^@!m0zuhHvtK}!8v{wh;x(-@
zl=9|o0i->kAR9ZI6uGL{R#&~03%XeM9f1mC3GXE3NHpjY77j5Y;^L27_PO58PCae1
zs7B4S&nr0ipUkU0so#SukCi8FL<CQBtc>+Yc$KZTe#r5N8!YJg>^qi~D^GGN2d|L5
z2lXJdT%s3k<z22!3uVSVx7wvFpPGM7EcKB`hHDA%v2Bm`6V);uGuyY~olHhrXMx2P
zli``O92*UKL;#IWIq&;w@3YB*ed9%={X$=ft|J}bN9b=ihefgpiVV465bOXo*6wJz
z1p(U%qQjuKjgKgdlw0UQV+5Z>N@zQ3rR)9zUn$k3tfCU+Fo%!#VswyuY<;sQU;&6V
z4M0Z3D|7Yi=k(1222~;&8e_2R5}phb83AIt<8S0C%igA=sX)UFUQsX?0#hnW&g`|n
zS^A064vE2Q1+W{QLLA;^(wZA3$r9KpneS?|r%0zU0x<VoxI9!0qOeGKI-1<L3H&nj
zbb=<5E+@`;e~sgxUb*ufM+n+=QyUJGTp{VEIgdni6Y~_iZU`9vXfS#uQoSH>w_7ls
zpG!FbC;i`yr&~5Db0BAKd$|h%^2>-KCg78#A>k#Jd3RP~*HByb{<E4?(3`8OpH|J2
zTnr0*-e*wUnPh=njEUu`tVjFbguV-t>Q?(O<jk$bhGO~mI7T<Zd|pNoLbNSs)e4fy
zraKdlzu3%lp87lvLdSGd>s_PyHsD(e6Hhk=LMCuEeYfcJ;#4YBEhv7!qfvvBL`{RN
zJ)QnJNdKSkM}&-jDQ&sxJ7x2Ig{YrFuz=Tl$BR@Erm7<YjI+ampcMvH(xy(~ip=RZ
zpog(clvxVTIqM|w!^oSKjW{_P+UnSRb<Jw8bGogEdK{Ecx`mi00Mc^aq>0^e?)Q{K
zR_@HiB2D~c9|w!e8CCMJ>r1ce1kFR|snd<kuWOzK$^($prB-5A`KANH#74gRqBbE4
zlDjLTH*~Z!!}ajNp(S761ZBh?OUUAA6LI{07<BT<SnTa;Df5ZF>R))0<I^dLG93g$
zn%`~8{}U%}>6^BhYwoRdJ5aI4*z&{gV7Z;F+v^6kj*g}#F}>A6aelH;U*~ft4Kn4t
z%_8G<l{$kJr!7|BY2n4ITGk}95Ea~Rd4k#v_|!2y2L}hxtyc&)m(-{`STzW1Fs3{&
zM(D{6fG`1{T?gD7fc4E|N%hGl3pogP@U?zH9}r#Z#(#;_bLpYHF_b3}sw`j$CT4!`
z?r<9Ed(f<ur5qwm6!=!d?);*RS37ss*dII0KdX-_`Y;M6Q9mf;6gj0XK2jzmSkScU
z$j%+#Jj#Ok%Hke@vIsmX$-hMR^W2)p=p!5765lUlm(S1J3ECP1JGgw~v8KFJX6Tb?
zXiMfXagT88`ih*})mP8o(U{<lM#V__4RDG=S$)fEAc~O6X?ygg*~;oFBfPnVA$a;R
zx;M&doX5MV12Hw85aN~4^U;GdEEm7&Q)f#q#;w7K&!k^J{{&~W{Ac5;F|3pkb~7RY
zjPypl&D1Wl12+<XpVOf<eMIz;ETZOJCk>;~@gPCif%PGMZKH!>JlC;S6~Ymq&wO!q
zwkW5{<gCT_E>rc_QOfig!Q)EhY+G2#^Xc|Kqhz!^KSUVQmp^Z3{%?Zte*qAGIEUxI
zKsDcQrb`am#Qq_3=}Ie7^b*%HX<noct6SY3=JrAE&g19i@`lw`xtjbeZC;S$@F;;r
zxts{!Y>jM;d<H!-$h(NobJI*ni<ac>h+rrhdl0{5G!EQ;{)T3Twhr~{__*%k%qqhn
zamV!3EFGV#>tG<=JY6Y7jkHP1iKmWv_uFaC$a$>lsQ3KVz))jOD|8segJNm!t$q{g
zoQtLNaw7fOB!k}b7|zN^?PB(nksMpEj7U5B2>k`(Do~H5i8?Z<486^gEy<vswNU>6
z{M4*;q_<WvYfu3xCZ4@+Ay5D6BJ!>O_Y-EzZe_w&;|^nTRE3%pZ&8vScnYvTTy9y|
zY0>`UM>HCaj)1r03I>;?*0mpY%B<z(&lhtITRcIiA*hg0;zwE+KYl;;U;N$t-2&Z$
z`jXwM0Kq#H@T$v_O&*B4sU*uq)9(eWBo0jaF6pB`f_pJOyZJ=q)DCOc)hLnCEi;)D
z|3(N8fzhTEV(2ET0!(7fxxBXjLfaqC5Q0R~W&{wc`hTePvWwZ%dh1I>jJ)mllcGf2
zErpmtP{5v3%{UP^_iz~9toS$!kU*r?7!dtP$e2;zd}Bb;Yr2}N*k5)b)u(cWj5J0t
zS5LLR_%x<AsKoId*9Q+Zog=5R@$~5E2qt(7j9D#G@#Ap?OsRF<&Hk1t11&8q;Fb3{
zKF!X~vKoB<^2_shwPSjI9(VmUThTE+Pn_1E=ykW-Lj7vJ2C^F4VlD2~K=ao4>U)wh
z7|Yo@`e~5f+=<Wh!GWLpP?q})72a;lD>WlL<56xF`jWc3y4;p5py#&`4n96OomtPa
zl(WL)$>)1e`_*jSK%D=gP>P<nZU^3aZ#nHJ+`8MZ0b31MG)h%c^B+O!Sv~&gu=dA=
z!Z~L>z?4AYe`izvViWnlNgz)aE#JY7Jy;lQ;^Hl)>nxo0U_Auq&gN^BnLfQzA``Ou
zv@#fpe&sy4kIOZjF_Bi9q-Esz{ReHDwvc8STXhn8Mh3a64tx-p#{D9D_H3JppSq(=
z__h~ymHOONp4HXJ)vqNv%Vt`LnVQelS>m`mcDZr$_1>YprO6LoWXXa-Bedu|O#Qvs
zfTEn|g~hYquG#dbI($8ys0kV^X0mO@*q<M#NSa1$z{g3`BHB-%dos2PgEl@QFUst{
z#s74J>sMRAL{ZUnCBcf^o02e~>9Ixl)jGlYL!7EZB?g~h{3RiqWEBoCD}B!G<dR8q
z$;YcETN1>RY#Cj@35|34*oN;;^J^ELY3h)9fumUU_3rC0mwvU%p<_`#5I*Q?zG#GS
zqdciVw*WyB3-H?S7Cm#*=X?x)QRiP?UIGjI`k~NVL4A?(P(>h?r>0=L<*Wie70we7
zyr*ToZO*@uak*@P!b?CtLOd9&e)FBa_}B!tjc_9+#}d?3AXTP}8CC9G{>HM6q@05q
zOOJj1cZ}HEg9z7fK$G5f?bmjU++JLV7Okg+boq>)u0Ese;27$i7mg;`bY;h)niYTo
zIv>3H2lYVAO+5du7C;z6WWFnkjhJ_cS>s2haXe4bPlk>I6IX{z#<S((0T=-KBtM?x
z;o)KX5?1=F?mE98H@WHb`wV)HAny(=!Y=c1GwR(!Pt^3S$WojL28?Ei01S3L@Y%?>
z$!?u(f(S~Zsj!#KGShvrHLk&ID;Q>Sj49}^WN`ueSn^=Xqn<s=(l6SBi`#+~!N>EH
z$Y|3a!+ZR-z!cmu_TBDqx@-pL(3;nQQJv2UFHNLXpJvsW%sDOW1IqL7e>$xv>fv>t
z;6#8Y_x~`{|7UY2TkLO(MT|5@@CqV<aW#z3hIRH7K{<30%zAr+VFj5aip`%+XQ6I-
zMM;+tPlimq=JO=da+4?)RA$I(BpfuFf#<KAFUEpA0Lu6?%Sn~B|8=OOvqRa|BlqL#
z`5f97#4Iz{e%?m_fa-c|ky4!vTx_gSy1PT&`Yp~mG)H_-o?V*Q>@(Z)&fp%GsICMr
z<?iK4-W+e@4lKPA2wQtvuGnPKWz#aOs+tU*{>eihL;WlL6NcbZ$3USODZ_mGHTmsQ
zOg4%B!a+9Ykn?9$dppnj+{&dX66++BgsbdAucs8kq5`3kSpzG$|HO~?Ivp$=Kd7QO
ziq59KcIh_Rs558;0dmTL3mo!kl(WvVXCq5T@!40LX@Z?%N7}RR-k*Yy3&5575sX70
zR`e(#%be`&NVQ3Pes62v#*);ME0FrVdj<c2e1v;>&M^y`z_+IfXgL!H0W?06OoE|t
zf>Dj8h~^UY;n{!ylvjpEf_NqJjM{T2ecbynpsletfL=UmcZtAH;p`h1Glf$!qEEBB
zJX_bOmRDPSb|X9kL~;JG<-P+jHuZ*<$s6KWMBj|A;aWLMtb_b;b~O<t7Qsyh9nt5b
znSEc|ZR`%1#(DO3UP>gJ%_XFK$n#>wCsY->ktNS}k|}Cnt@smcH=ZC>isEZ1e*m9b
z8XV68#a4{LcPY@qVTh`J1241ykO{5r&R#%pdV@=f({)h~(%QK=@1x4WGq?8q5SX|P
z|Niz2@zgXbLicN*W&%3Wx0eqeniHs6fAVaQaN~{*B6<?IT)-mE!dDIE;=xXlMgwgV
z^*RSZ&f2}?D90%0O}KN5qWso}?NbAO>irrq3{e7SGD$1x>FI#Jvs=XBB2A_onD0%9
z?+XvgVatmHsm6FN%YQtv;Wgl`3LJ3ksM*E*3vikFOM=hPY@QFaBlIAyoZTsvZ$_E1
z53Q%oDk^GIAK&!9KkE+eR49VrfydcXWNCL73Vt0JyZ61k)O2T|#OhBP9;z>(Ew*le
z=D}{rs{+bNt(xk!Y@fzx-Jid{O~S$*P44oT&)HLpJw~0myKkU9$d=nXI7;w7T&XLm
zg0HmHqT9<v@GY7J?t1c`vPxD#d6sKPQ^g`7lKBT|Ri3<E@<QNH>7WI<mfv(KgC-?h
z(v|feTb48V+w-)puF$1NvOnAokW|OfF{RVad;jqYo1c|%(QDgOPD%7hy6>O!S!{J>
z26R9>ygypp_8&J5-{}M@7DDYmNv4&Ts)!(7U0>h}D4~tpD}HQjzkR?e>Z)hxc9n0!
z>8{Q%RxKXSgo|DU8J|6$9W}VCbfv;UTjS!I4dFHxgKWM6o{|{Xl9U{H!N4;dCS7`f
zdv_Gn3mV{;q^%r<d}dTxU$1o3em)LBLFkdo=I0rO^^<<+7N!kFc+G12ifsQBkshS{
z!hVp=p0t~E-yH?Jp`Y8+c>Ii&5D^!~(mk_o@bNwFss-)0crflHxnM!+CN}VE<R{5w
zP;oMy;E73#!N=uH)y0)#L^^_5-2#3a`Gx6FQQL#D&xYQ-Ss*L)WaDU}wD+iU%wpq_
z8>lBU4~F7C%TqihrvUx)itc=js^Vf^Xt}Zgic3GqPJ|ufy8RrW()Xr^1R*u-?+^h$
zG^0Di+1dHGH85%@itiQGKJe4&hxe48BfC4H>OpsHp={KQjG&gQ>uXU@h4U|Wx!+kl
zjY!NtXkUd2_3zdTU773{zy|%D`Y}@z#d5s$GoEcHxo&X14_ULOzV!2M4+gPhpIUU%
zH!ZT7;aXXPE9*y~dRO1@w?D$Vw-P92LFxHD(Zqb4=~mTo@Dg46vA?jr)xR?O=9u8@
z`d{K&>2F*sm2EivGe^k({FftqusV7jQ;YDi<M3=1EgilCZr}Lm29(B^r+sx<w5gJ#
zLtC}N^C)%rQz3~pW3EP-<S3~^k4<zul}irPAZ#rwDm<>63o$78{zVax$YqiL#sj2=
zL20sI=j_<mMW3M4@h+$RE{fGC{Ck}x8d8(DT86MK;&f}9k_T$=W;UuC9T6Yt%k{pi
zj}h{XI*v7^)M&L^+hZ9Ja)yNU>8bEW`Nk9G?Meg&X)$bNBoGmPSm&x>!rS;`-_tiO
z4<g6{kV)wx@y+Uit33g#F1=Q9+lLv<+r1K;5vz%uG84K+%WVbL?pmv+%i-}RGJX_N
z7k%#c&+Y@58ck*56=yioVX8X<1hck41|`j{YvHOnz7DB8Ib^q-a)^b=n8rEoaOaWF
z?YO)z9hJ;msy<LpQ`7ZO>l`Kxz1T6xndJ@v$xKtj*^Sh1m>=O=wnIPuZ@MLaLVra6
zm-qMgi2N_ehw!@B;Er;e@V!as#{&V#XvPmWrv^lTNrG7e;FEcG%?+y`mJs|7;6r#`
zG?~l;esSSi<Fs=?0F+O@8+({3v9!wD{%GwLQyTno_T?*fWkwZqNDefL3`|_2Nf(9p
zDFP~UBX?y3Am0a2I71!(%+vO~wKnqj9n+{C3Cqq50Aq-F-Ho!y8AUoDfIYKs`4Jo)
zaeDJ(`irTWy3^b5H#ykZ=>-G?3<L!I#ZFDqVQ)i|*eC^Atid`uI*xET6>4k}o}JeQ
zq4>A;c!i<FYh+*L%&O8-bY3j9wY)uDwgMift27zS-xDH(3`IE~())x5^4}rnb8uZr
zL?2`cV#wBRu~rSHbQq32;qO#hxcF>-f2!S*>p}HtQSZ^58QX^SMK=Q~a3WZ|&PV&)
z9ZOiogQ6DW2n7!eSFcQAVKD-^4sdmV-w4nXe}K#EBre8_Jo9xI*RAvmae_`T;R(sV
z#CXtOtP{j7xb;tHsJa_1_iyd$xBK>Nkd}F&US7~`NQB2pE=s19Ax@O7VYvJ(3T%6j
z%;jZLWDFW^95&P_y-Ab28VS+ml9kI)LoK5)32V;ubu17LD1eg3;=D4-ml$fxynvGy
zYY(RdXR~WfgZp~k#qE0>W+=@S1qEtXmMRN6HlUs>%;60}m%*P=eAuPP(aH-`4+3MV
zA@{ru<;GDDJK*XRF7qNuzuD>GU>3lsMY7P|XQXemgC(`Zq_yjgZ(?Y)OJvAAxAK3Q
zx%z58Z5f%3w8_<AH7yrSfUAxZ3lU&B9R^XKFA9whuk{!p6s-y$hKzaXVr*tDo3nZf
zNDBu2RD(O7V)(YcU9P0NYD*1U<v2Zs{KWH=!gLw>;!%ZpKb&A(+V+0ao?5Hl&?7m)
zY<w0}yLEP$^CVXuAzql*svR8PI)KrJuz<F!q4=pp^8i&<BSVtrRaufb(8r%pUf}Wv
zpjVLrM*{rom3r)->{}>3Gra<R_gfVce?9+4z#D%gAfOC$g!lyfB9;%=>O_?7Bv#!o
z<R<rYRP#t1MPPbB$VL0+dx(D+e+IZ8T_Uog=1mYUKH`_&aZ=I#W;c1fd0TTp1KG7O
zG9w3<COe6RiBE0bYup@F0c-*H;>FG()Tr<a%pZe3b(#VYHwbB>DMVx_%=sY38D2=3
z=}US!arWlL5ne?ajidqF4SPJ&_at+84qC1+FOk=7%+TB5&T=DXTO&OlwBL2TPWy~h
z3<wDc5xa+Un*pU7AtZ)cMx%~%=(9E3nacWl6MmV1FgC!SO}s1Y4yuEge$9ggEF<$s
zdB(fZ44ebFx`x0IG1Tg(2FG&lZ7JA#G<mryE%_kmvMJbMX7VZwOyFQMez$3Jn@V!T
zKDQC`Fa+Gi8%(8z6*IZON%<73nhsUlmMxsOm)Frg(T(xdT>k>$<&lX(y#;5l)c++t
zI{v0dhnTH{3|+3DmVAcSMPtI|4~<zx9Zm8YZn<xzpE@s}ALS#weit)nHa5yRf>KNr
zAJ67%au_4T{1-$V@-jUQ3lgz`M6|WVC#nWjsxeh_<#~P@Sps#NV5?2yHFcWC%c!%k
ziq%|zL7er{A|tU*$8@oRb&6_OhgL-ore)HPo}dqGpl=i*o|^*CJ0oX8T{p0Ur8?dl
zYN8+jSlR<w>{gyJBUwhVE4Tyt`{z1BkPn*4_!n09t+2~FbJeOJDmc>a7TUv7>yC>;
z0_1kyTjVWw&TK`>hc2$@BjpS$btbM|UfaO~Tlq=^Tm8>YngH_<B@Oq_N+}2XDtM~+
zZJGW1#1cck%bhx^His&^vIgo^(OS98Yp?AH=#q$H!>3cVAB!UjJ+C>VNPw;(;mCem
z)nyv#l(H#$t1dCtKigGsWNcz1?=)IWVgkB)4Den0G&SlJDt>B0lqu^#?<rB+E+L`a
z?Qna4GUZaFQN$mJ%A+B){#Sqp+qOf_y@LbvPPkfqnT0xm0|kU|36!2jS7i^yR)`H|
z@b+xF&+8W6uH8YPMMCOh%6+ep-^W2>N_bV>ofnlLgez+@#r76i&mC7KM1~W~x*!wn
zGnm4NnKDUj3hc&Nl=Q_$@5WF@041lL4F!s02{G-r=%rKcPUcyPp?rHg)zTag-5ocY
z2RWg`y=65$q3B#7ncy53=n{grZMBOrTJn*j_?}ukJUu_6KRC=qnp|pjm^NB3H3@8T
znvG{F2;iM0xgzSf*44c;|0q+Qu}%V*W&a(`bhHU*m(so(zehpOn7g(zH;-MDfOq@P
z$Kkr75w>H9k$E8aA+6IT`5;gm04sBow!Z4+lYY<THAT;LFoed}V3^st$Q**ff^U}H
z+=NTmlg*#HV|#DRFtL1C|IO^Xb?t_sUL;~T7dyLzl9JK_s*&;^9hhN|*TV)0`0=}N
zm5h!?#p{B4@}_^uk?5wsEl``Fm9BqgbwWzu*F#82iWZ3#h+3a(VV*Ll**ZLvy-Ja6
z62X1;doZ9Ghgu|wKx#Onvq3qzl4Q~{`6aR_B(y`>f1yQ_Ox3@A-7PP(G4}(lv^bfZ
z4hdaNtolZC?M&Ra!UOlu2@jWF)rMEB?l&KOPc73}^K^egf>&DFl<rVNHuE6+CiAO|
zRU+m3TlD~q1jLm$GtN#Eo(23@_k`r1R2fd!OIx?t;+D$4nJR)-OfIZ88YK*!HMDhE
zx>Q%azmca2<O!G4g*V<6BZMM*0IB~7s?gtFfaeGGDXE?xs*yoMIK$Of2JRws-A{j3
zvm9pxs?MswIpk{Xj^Tw3h6m+QS<|Z(dNr7t<rAK*!CQP^n<Pd$$*TIxA%cyp^#4f_
zCO8}mSgviq#=w>Qtxys$_UUqlDk6!RCTS5(E`EUPIF``IyDgKqUL(Ab|EPLgP@}Ej
zJ)lzq`8NE5c+eO^ISa}Po2E??uh1<Q>~0!*V(c(ODCF|Ig4-#2d-%!T{&YcPt(q=Y
zL4a4%T8PjWo35+wJILyj(C=`L5kLZ0TLoLD_*Fo|x<maUyM32|Knr*lVX=z$;GUxf
z21XhT5a@q67<_#*MPNmbd&F-PfuW!8-*9h(z3>CnBPtq}`;xiTG*|GQM14agf3Hzh
zCpLkvP$Wnuqep?z^PMV^C<0Hp&{)c!hP0{2pG3^>Hx2?h+Dn!(a*c^|YqliDFYvi0
zXQ1P+w7!is1hgaHt!C&bl3nEG{r<&<7+L<5#+Gvf^g|{unlS06-g$&CEQtCr0Vi<N
ziF_YU^WM-OBb%Y&jkw3L;qDKG3A_nx)46GE2S{1)8_8$$R4EcO<-f5y0Q|z1wb;dO
z_|aH7z{GNDfa@{kCSG=Bd6g;PJ*WRMr}1EAJVNmJ_3dPBUfkEdI_*%iV<xBH4?mIx
zo!I*aXBxicWHF_~NHR9$HpYo+SyT*5WHWFCx%^s{!yb=ZyXb_TZzmA>wG~whx&q%X
z@Y7%Y3#=kCf!{3x!w7Aj|9t;oD#0lvuo5$uP!l!)g_r=*u;NR4LWJ48gp*PdHnEU6
zKr`j(l%-{JMw(nrf&P73q1UeS%x1&wB`}mhal!I**@3lM%79&+X{!l@T}Nka`(;%z
zU7n7`)-H+A_p7SlZBL`)^h>ABfO`4Fqa&Za-J>Mpwx1?@?+GdR-lVL@4+G|jtA!89
zIDXKD4O`+L*s2LZCSHV^WW6(w$5%~dNJ$*7OO>&sP6BK5YmDpVdQMB#I+WW-3)ki$
zSiVKC_?+>*M&PXCUUTbs%_UPck|8mA72dtC))73ls~|7()Vs`zC@SQpq~mgt)QV9J
zR;jJ>C1tp-IgHg~SbX2{5l{e1pbf=QO8p^q9xdhGtVlF1SfW5Vt7#@<naGvt8IS(?
z2rYJnEXtX=*o@a^907mItJCFCmbJ57J>8Pdm^&@GD8prcep=kmR7JE*yVkyyUaL#V
zg^oHykr^))^U)ojJ3)rGoSe@hKA;cOr&tz`27PrC!<P;ap0@40-3Ig`5N10L)6{uh
z+geyzp^?(-=W^tBqA|5Icl!ep*aKf-DDvY4nDCR(_hy^*A0lufy`kW$_F7w*#4{t_
zZ&Am(4W}*YhuCh9eMiv(%<k6b>DOf=@8}eEbMgY{>araK`JlCxh@lv_mi)gA=aBRY
zZiAG62nw{i&SCEn9h0BBsVxe1%5q%=$g_*<mDf!B@eGlq#`EN=EYUgK-Q5jrpO^qx
zo#3#x{f*EjU%HTBGe9`)J?BJs9-J6?Sxe8t)Oll=#%vIv8dQbeO*88|m7{H*%mn%T
zo}7JpZM@q{%WIB#AZc2C*Mh*PhkHVs{V1{ka%&H7=6O>1UZKeh<J}rfEXJ`JEdWwj
z<yM=_vZoR{oCfCD^C!4DFTzIZIr_n!>KQo&9j;9zhDJRr{mpFs#JR3;RWdNV=qE!b
z_kE+){BV+*F211I119a1<*(naSri+t{~Y(x`G4;eQHPbrf4);Dg#Xg3LFS#C3!l3E
z7GgSG>N0uJNSmOhoGC*NN>+t8y&DMnDM!TdbV9d$x0mrN!f`*q4~xn?S`~w|pNeu-
zWaJc<hNA8+f4^p;M%Luuoa5I8HRPN7J@B@ftn_4T+UU8f|3oo5+n&#=iq#Nn^}OHe
zEV3%9_k{W@R7Ha(uPX_Y-Z%a!U`;><ffb7`h6ua!zNZe673~BU6;~?A{rJ;N;`_+1
z!QG)*K74!kIf%jm_@xZ0aZ+-R(fwyvC&YxiDmA-bs@I>ELRtE;C*0fdk}G+n$V@i2
z=5Z@*y3Q3kXM2p{r?cPr;r5ioWw15tQBes$WmrVJ6_s^*f~$G}n>^ae`qG!&zu|{M
zPA~QiGIjgG#iF8$)TM0DGbTl>ZN9|=d07s#sLw?PU!lpp9FK(<+^qLqOw&O^bSIfb
zB~3#1w}$p}=bFS@HY!O^tv3EvpM>Q$kBW;cIzU-=1a|nCg~?QdDt0jtn^C=%bQyRB
zU<G3Mllvq4qv3bK1+)DCS*W1?2P+ouZFM%dfI+0Dc|9CaUl{Nq@YxUl)CvICBEL)*
zI$ChT*B;E`N54aoGF~NkjC<X^{DQTiaT!CfH}g6q7{!ZmFpIPD9%I%Ii$XDf)<)x_
z%vphk$wI2_kMi{3myh3ktig+w2o0^|Rd=!PJser=($mIKwCkwOHW#mgFudoc0D?n7
znfcBKY8-0nSi1=@FPqy@6Uak9>TOZO8S?~uhd|@guU~!_*Wkh7BsxTPsm`5DCpmzj
z)#YQUl0<!Hr{FF)m%zeXzex9tTrlNBVQ-_isFPm_tQNQYtlv4N{dmgf9bm4(kQg`0
z{X+jZ@^?yjZ7=Z0Asl;pTbIh9D@0<XI{?3@Ki$BK^`VD?_Zz#SBsRNPh<X?2OW!6&
z;|LuNR*EM~HZG>XwW)$pW@jj0ilpdYvHH=s94>v8@4P5t8j|-pOE}?s_sPQz()1DV
z&n<}R?s{c7H)}?d$@EVhH#mPw{g=b~^k!~FP!AM2s4t(P{rKml<D7PoBBaT3GCa3r
zOp(-Om7b=Q9xZn64x+X7(A6%AqR8VuAC$25T~t=;Rulp$VNV))Ia7W`Rk;zg@uvt%
z7dkB#tT<h78{zddP_cFIyG&7%#ji#;IX9H<ykz{CtQrP6ojtX@PkgoSb3IXnOKZ2S
z7*BMhhSvy{OV_3Gy$;5ATp!getE5G{k5WmL_V;1vh_{Mg`O2j{WKu)crNE*}*4oV{
zEEta=)ch{hhB_@F=keI3<)AW5v1D@p=b?9<jeJ)_6UMNbFYH5wYWQe|I-~D>e;R95
zo{Xx^UUJUz3T@2sZi=^n1^zhp7upJ#aMg{(^3Fnhpn#%cX%am|ID1k1eSQDDq)re*
z8fXJ2`nw-aeqn>QX^wq7y<WYfkH<NQ@l>QK4HHegY89Z()+{6uN2x{0|Ht$fZJ%ui
zR*RpX%gTsLg8amdN46Op_a7^a?^nka7;u<*Qj|!Q$%FtRe(HYW75y(GQ6*krzZgX&
zZT`GB&1`xbtLvVxU`ZGL-IFJCczA;kH6RC0lP-^b*93fcSO^j_JV94C|3&KE4<Oki
zL<(c`n)Jh|N)xhfF<(eZIbRIDBa4nk1;iCLekz01ssvgTEjMI)$^qCvW|zZVcrAA8
zgYj_qM)%oZ>!6gSHsr*}ePh<5`=5F$?0LtuD&7`xP3C1u7S6u>TC3gVr*6vbNnZF|
zHryorp*Bu{bn}nnA3>h^RA;f`d8*%v@~}v$lf>Zp8Tb~(o%OBG>kApVHkZSA4y!q&
z8?4gX%KGv6;9!rkika}y0w{e8UZPa=?Jw&45>e0aqh7W__H-jVXuD>TiV;d`meEY#
zK}x@1n8Ce?fP<fezYc68EkZrgK)PO#mj(PIim9R@Lcl2*YhrH4dk6m+W%?}AZYgAI
zkUPo@K0Uy;o&{q$(vDoro}Bz_j7gG7@ylIFDIt<XNKpF*_4BsO>UHO}q_}v<-5D)x
zcm1#a{=dqWvq}C|^**1ksQ;y^SNi*&VyTuDmWpou3Bi`L2TFLMatDyWvBF<Klf$Fx
z+aM$tbQd1v%NiXNe|j>#9m--j+u4zc9U0Gl@mP|ZM17GK%N9dYB0*i7Caew62I=<o
z&x(1@g~z4ocy3<%E|B_Ot_&0wR!W)5=a7!PU8MdvRGFAKPu+k6^cI&T54x#qX()tz
zk)<Z$HS=nDxZE$MSy-ZXmQ_(K%{Bd?5q2b*$Avs0hFv(~{8>`2V(F|hF?AgH{m<J)
zcC9T`Z>u>lkrq-t%!NBEVdXHe&cQ5)zqLh+Q6X!`@<DO<P|-%&MscsQp$R;4>3W=~
zMPi$9_*32t?PJmGi^#DEqtoo)0s{QhCPC0do}hIQ1i?1mP@rwN&ajMezC6Fcec%GU
zcuYX|LV9bfVt$SM(!?QcPWe4z4~<5r#aClz>4X85;iGDw7UL-yi*iOZQeBH6AIN>;
zUc5qgeMybpk+*pZf2~Kv1txk>O(m6VZo5XkDe{Y$PJd6h`bZ&ODv2M}bF8eGzZziI
z(*FAb1<t1nqd;~a`^T1y`;v9j1k9o{;bif*ns1>1e{J@Dbka@CShy`cCchRVAh0`%
z6DM;Q+<$7KPreapfIEL4VI``U5p%I+wO=qRD#}~p(#}SMOvaXu2r(+tO;<R1(=jx5
z_MPcgWb%DFO)Y=A(Po?)MY)$WL=`Zg0O9e#M;z5HZ9(|99w=ZGD1Qfl^?@c>#kJG-
z^zU~T=j?Gf<xG~`Uf+teu7hRYy>g+xIF;Uq%Ue(V4ECJ3ga|pUW8vn7U)+D~I!y?u
zeOTb7p`%Or^XCu1>P=1r$L|AnIZY;l3GFzsIMvOUGL{S_Eik@*HjAJt6*I3Xbt{jJ
zK*6YvUxCfgf>Bs73#mqZQB3E-OTC3jCOSGaefo)FF7H(gKaGbaQQei5m2a*{%md$v
z_EYN@maACA>shkFor5b^{lsgWVsBkO;p31twP+Z)RymHmE%Wh&?_e3W^EuBr;Tx;y
zO+WK-{qKpR?O#v@FXY9w46cv=nG62?pP87wt+|2R|FlH@B$RJ~kaac+R5bNiy5xY3
ztTejJRNcACL0-R(E*(!pe3@{w6q(d?`2_;RA^mhrVI%HToV1Y~QV6tBs=2?^4U___
zqxv0n1g7s6RNarA=}Z>4eQ4&xBUU;P6_v}GE#p*;1j3`rYtw$zZcZbDj&X)F#?6zv
zI<1pcxrnJ89%(NE;@4sPN!$r>{svX(ZSrE+NEjG+vL6-|AgW|v5%txxb1IRy6@00=
z2aut-!#%>u2yL&WoiQHu3tr`X_iAg4cRaNFI(V$sB&}5=oGwbCm^fM9IPr$S^mzyv
z<k_fc)uI}d#Z{(TE(J-R`BMOeacoiiUbfmNG+DpkaqO`>ifttPI=tsZiBx+Mm)tQu
zD@3ofUr|(Gr_gUfv7(m6ZF8XWiB{oTn_-z<HmNg)EP<H_r}a<Tud83RU7DO}M)6d%
zY<>(U)|-x_$G&AIQP_gJ9T?wV9p-78`av$e%POP>zvIuIRXf4kPq&SlNlgmLm4}IB
z$Pq%$8z_r&oJ9Hyx92;kgE7uf?;At}cIr63SMOdKOzKXAHKTlRw1x(l#$b4F!|HDz
zE={dS$vAt-J1--Cn8|tn29v_7n^f;m?+}SV0E|QsHd?#XI8F>#7;Rm<zTZfYCRwut
znX<LTf|zUh(H}aVbUuf{ILii8>1=kddU2@q+>%ckS93heftxAG!GNKt&m<QDN1)PU
zoa*FfeSLVhAlhEp?{I$~4I-|AN)2Kj;eV36%L_@Cva+(8G%fB#`wvPp0LuDHmA#QR
zQTkkOYL=RV<$aZf>@jQE@)Lt6#2aD4QqW@cWfr1lv4Q-1+$)J7)w4}}U+rE~%+Msh
zpRs8AOg!s>AlRtU1m48L8@|oLjjQZM&oIn|3`RH;QewT*s$x2t`Wos`zBOHI0B27}
zRz<gM(1lzyq7Ql)w+Dy()R)i%2V07ZDR(gwN3+9PTn;r`?*3F1NPPtfrX=p`IpRG&
zj`9A>JOL5L--4f@yjA|63!m)&kjb8hURx~r-6znm^y#YaNLr2Su%m>l&?wag8~Rzp
zCbAh}f25FMA}-d)i5t33fti9|#RSiS7lChrzR;<dA6r*>XqLayGY1twcGc<!(jlA}
zdbic2YOD-_gj$=edX-5`&!!RNY~2Ax@GAWqwU-<F<{-^(lGK&O*i6G{jxt$}&yqFI
z^^YM%mKF^VHj;`X1E}I2O~s(`opp6R8Y@Hk%p<WnzG{v|q|=AhD9j*-dlt|day~mW
z8fo$w1)$2O`CCcy!wU)Gh@&|F@x28<)ktrB@2?N%Ok5*BvmWEeAyUG>f2SgNgkYNc
zgS|`Q%{@xxyMzUcRHPg4EJcMW=T&IXGh%6H^FI9E*}%zu2VY(jPeSvmP2aMEo%*KL
z#11~jJwtpj{H6~W>fQG+G_9>g*5|Q`qJRaluW4vkOsA5a^$hxabumnQ&6uFFuhlSo
zP#fS%!RmQMR90S&UTZ8ZEnS-U66wXLhMLa12we7I6}wa>v+M<OlQvgLf6K2OM)3Kw
zeKk@}IyK+pQw4`>jvDtUnN(&nz!!k`4Zt4hp#X@40M_i2y^92*JC@*^4-(tQI^1!N
zvpt;<f5@5QZ|dzeqcqAj$F8ZYOx*PVmPL#B75&_&5r4HsU8zwztGB^x>%c%2VRTQb
zcLsZCNdPmv71a8qoeeX|4#we6pxU>=FzU@^k<<2*x`W1{7^M^6!f<L6c+L@D@$pxx
z*g4Y=hqY(}4E+sZRH*BSF`8O+#*%Pq{2bmP-R#A}MR|eK-JGA#+FjJ0*V`y2<48%_
zU1RYo3Yb@y69B7^KDZ7nf=fpt6PWHPYP|fC)KRwLxo~+D80Ki(-=wh6F0NbYL;Zcc
zQ8xQX97ctjZp2Y%qP=8ys;e1Wjyvy-;g;av2H=Z1d+udy7hu^D{rFQ~FF9?UZrG`l
zeH!#0J1TRlvzX4c*{uih$I5WfzKr7Wct4%zq->3(ggA%QX$GAZOem@E{>#`fHwfNe
z_rw-)PWcz8hWZz(VXog!8-4Uo42W0S7u!r1${~AM^+k$MFC$h|vxrSqjo}nusYl(_
zPO3QPnmBDvfi}l|z(Hyg*iFk`dd(IyUtVwrxi-RJmi|x?;0X9&19CTUJxoANwoZ2S
zc1k+f8<)t>SN%}g&Jnlu`VL<uMh1K>B{>zU?I;!Kb;Ptibg@At-QH=-em$koZKjFA
zsT_2u<_3Nxd#*-%K#GUsNo<rkqUp2NFJ{0=y6`Io(*X}Pd<zr1V%89@)ae%NZ)qrU
zwl%x2ec14|i4_u@D<dtn)Y0Stm2LHb=j5Le@wiH$*1Sb3eDxOLt0<Gsj^0V58N9mD
zLZ{@ncVJ%%hoQl+nRIMJ*^xTgHpC0wDwt*yEfHTqix{O<(L(AGPaf2|NHtv+o6ed`
zRWklhu_mN3Pov*LR6V?>TC+{^$V<Pd!TAzC*%63=fdLFJ44|%R;w3A|o}^dnaL&tg
zIuj`iw@{g1@iZ~Em#7%o-u#B4GtHJ7H&<<NdrxAgOo6r;PFMW`N-{|XAcc~2lVYgH
zu^e@WMk1m(8Vs0BES#hJS)QX{r|SrYhDNC%ajfB_@SI~glFCg6Ef7ddBn`uUl2vX?
zn9Ma-hv_d13&fhE`880Gk*wm5BzYm=mEDIEtvec{n`1cr@$>TIc1JneWEH?eB;Arz
z(ep~6bJdqSXbv^8r+Na2@SOkNtc@0jD3o>c7Mi8bT;en8tSv6$(?;e;ag4w4?QPk~
z_6)#qGRt%b9?jrVt4Nx&jP6s+V|ETgC{1RvGVe9BnN;R@hk0Tn_NWNtB#0?Lj5kvy
zGXX64`*+&MgwVFVt{m=Mq?=^$VUYI%ggN@Or(C$l;Fq*kRI$Y-F1NO|^>hM^H9~A}
zdWEhI_%;g!@irE(dbl0tDmC7_t~jf4*TC&)X-K^c-D))K#_p04T^Sv_nJ^Y+?~>76
z`(Z{*7h|Xdh&}O6a0Njs>IvN4uuL2NxwzufFNw-OO0RpKb+F>k{)J!WNBo->DDPUr
z{)Iy;_}jaTG4w1gD1cIO&=;|i>iJG+2Z_IbQ3YpZYcv&@kU=sKVlFKZw$}lng2EZc
zT1upk_Z`=hrGfIJia~{2r2@`aS&~?g`9OMrCQHz`;fCcvu;WTc-SsI>%bixmX0$jj
z<fxKI3i6`S(TtYHq6%G0<xN6Yt6QD6_brh{Dwn8X(v}gkfrJdODbDAS_q^j?7@}1)
zobOJ%Whn%RI?)I66K0_)RN6$a?8mGkj&On+9MJ5wcE9*gn-8g%zNv6^1jNsJ`k9FT
zUbLUty7x#pyUpMn@fE67t0)ZrqxzWn8L=BVa;z`};-!?^pf6G!Q!_uD!g02HH|F@K
z(zHwg>Tr3*xj4^8&6Z(l?5gGq(8r~v*1|>|jl2SpOBOAZ2X?EIwu@M_u*+uBn?O|R
z+Nz|Vc8)@fKaR*r(&7!?oy9k2dU+MJUyo4@_wC3e{8U7)Y~zJ%;%TG=f&rc$@pX>U
zHBub!z}CCTzHK%k0ba9?izX?^li>IILIfx8x=Ap&UoE_5PSi%nGhQYAfC$0>jQRFQ
zJ6Hj}bVtJv(6pU*j1%m4z1z+&&m-wFCFzv8IgLv?*%r-x9jXdt1ht{H?^`<+t`UjQ
zF2eN6ch2H9&>c74;V?w*vpE25@ll(|)c|q;-3LN`bOktqW0%VO%v*jo?BQ7alg4Ta
zY!e32m+JtRXUAchGkgnn17w@8tkooWT}CtYpM3MkE<5p9^Oi3B`ju<b`*#rTaHU2)
z0zlfwxv^2PSVejf?4V&3m3l+g^&&KCoVV=WSUU<aHDemjueCQ{*e+G+@T@{%gGA?y
z&;tfOBV|l7n2PGa`w`Aqj4`VM8^F=KDV*rzj_Noc^~m6=8XUR%J504?*QN7wX$i5A
z*Z0ZG!gg*V_vxvZahlKL*e&|1fh2$;nBxwms}7eD(HNf!JU3HQR`${fWjvoQ_Bf^U
zf?~15^XvB8g!o}z9jAt;=>U_%f8?9pc>Y>SjND#$AOF)WV^9BgUJm9)n>}Md6RYAz
z&$B?W=5@?pR-ydL=JTcdKum&E5Dr?#ev$pU8$RCf;H}z&a?>IFzy0`27?}+sqTF4s
zP@|DRYck#&j<}AKm?&ki(X8LoD?$5yNS48IMb>Id`nf~&|KsbcqT&pfY#X<rL4vzO
zaQB4Z?(PJ4cXxujYjAgWcWoSkySv`bnS17(nLBeI|6bqfe)zk-s=aI1F8dmLY6V=q
zE>a*myApst^E9zF{M*yG=Fc%rhAeXBy5Eq+55Ao6%X{w6WKBi%zM&GnW|jHL_d|MW
z*DQzQ=lbLAOjTY`6G*0p(JOEcYou+k;mX6(W!*Gan1V|+5;cZ`bb~W!IZIQomie#G
zxn6Oj)b+)3mQwmn2eaP>mOw&4B_i%J-|{?{Svh5ryF}x-S(+T46%P#mg&QEB3ENQ6
zTzUa-%}3ekjbTW5jRtjNYdI&NwmcWiQw8{I&b;O`sH@ZAv20jtw1;y<_$4kl&EV-C
z>uc-{rgXw=y-LOUYGtB(ydk#&vCGkK>m!0tz{<skUD2zVQ_*-9pXem-%{TxZXB?&)
zGzHB#k^+{t=J)Xh1``stz{WQZ%zw=fzeax}=lkNUNroGd$X82W66_*>s$Y+d1h|4K
z{I~-HGu#1M2pCkqM``$d^|<u6LkxjM5>UiooQl2)#6bTXQuaqS&V<qOpl2k;!S{&U
za$mtznB9VFx_89udZ$K?95wqoyE$-=!REuAY&KJIyt%X|*vel-6P=x%j3ET$U_;E&
z6y=0CI0@vE=g2#UP$++=nE?rCArgh%h2-RL3&D6x7Pr{2&(&hM{HU}Qdi;7dd*Q#8
zLM9HO1b^}O4}4ep#o?cP)w68Z$ZF~C?(VO<4G?fxgq{FztfjO!ihNsj_hgibnB?`(
z9s%Kw=L|NG!3BZz5=<KS4tU@D`$JbUK96%?`~G+;sbY}~e%ZD})MFEZkJj#3rrYb4
zRK{yW2ct}7qshJnhTzXC*2UG-b-N*a`&Fx^piPkK)?1YD(Swif|EKxFBmRq3zI|)O
z{ok=lRLtKd4KeZh1VT}FsK3c~uQQOSC6gq=gxZuVZPb4xk-0+NPdTV4{O44RQMuU0
zrC++yk)g+~#f5+lZ8(ioAxOO^ntm){e3j8UlZe`{lEY|JULpjKK93;XQ+;|48pM1{
z-^&E@k$AY<$5EAW<+$$@2bg%}uUNTr`s;UHSGw6R|6nP!JT{`{{IWZ*1)>Nvup1%b
ztOQ^YP|B)tu$qcxxly;U*L#H%b`EWCV;)$<as*BZeqU!L`ayleg)nFkFu*X(HBQ~Z
zv2tu`LLLcuzp(?&MQhSNP@s!da(`O^>!bE8PW)yFB^ZUO#m$`88i-f#Z)un)g`-M7
zU`NzWxyq_62a*PSn@`kWYJ}C3mG=8U3sb=6@NQ2?P?a33WN$GXv0tt+$p%e8C70<6
zeBba?_%(0Nw&@A<Xy85#pE<5JgTnhb7d<hyagmthI>1Y1G8B=6o<_zG1EYh*6N5O1
zFn~mZeD8~*B_!(yd9v((3T-eM1Q7XsxtdTNH$=7^#lzrzN^{!>Ag1;OyDF^+Bgj;X
zu^}w5OG?gTt%&4M^831kNp>D0<%Cxqx(RHB;=lV*hlye+-Q%ljYA|z^d*rv8K}IUv
zCBhdyj?%Dd6lW`z4xxSC)Y=V`ePxtkp>LU+9_yC5pJ<*SM;lm)-Uewx>S#@^1ua!o
zRjbKew&k(!LEfRb5TPIij#etKTb#KTLH9U_+{!TvTbY|Z{=EKan>Di~gwGZ@1^+Zd
zBA1k<60zXg*Y{mNlCM_ao~N}UhsSMM$Jb4LN<C$<JFmP);2;ut17^QPipAsL(wLu%
z@|8*S^_4G1pwYM5xhPua<E86^7MH{NlZ9_kk!<$YoxxuSZd=g}k98v6TC8(HCK00i
z_d1#zOSK%gjV{r=YNC;#tve%FU5^8R69xRng1mFsw=Ck?Caiq$yB(a}3ZE-1X0H`T
zGgEW;i>(|L6&o|N*pHUIrt2lc==Lv7dt6=p7|n-ylDoGolL_MS6q3qLg=BZxUF(_n
zwU)~YPYcpr3Hombznl6Lw?IHQCir=<+ElMt*ZM766KTp%laLK+Fgly)Aj9iC<s->T
z^G@5x^z`ZJ_>t$@llsi=pG>u1auz78I&UZEU3ULBjtyVZnfaey01VcD%RIa6Y!gEC
z>8fuRX7OW~(eWIa%Xl>Y%)Ffx#GvU`3)w%@$M)i?3&YCUPXVv*x$D<YE|c+a@GLY}
z1C9WqDZUyZKM}nO*x!l<Qt%DOhC&1HRg_asccU8(^!5u*w0qHIZ6Kmrg*KC*^_Yqa
zPiE}*9qmepdtqsTV5j{a@6(OsPst<JApHjWBQQjw>d#*qwMWGD)Plf9+T<9{-Gi*E
zG1yHWm?+tk1O&LbTJLg%4x<r^{qC(Izk1Q=f%jhLJV2E82Op<=Da{NXKfL*l+qPGF
zQ69S}Q{kCb%nOg<%$9NdnJtL00huv#?2|+dfs?jd7^_mUxN@q00K7XvX|A>wTgAM2
z%^tai&}Xj(Fv}!WAe9`Od>qbpuIS=OoN_d6C=W=FR|%p@(n@M=H4+mr2GD~GxIrqq
zkO@dLjg{ctx{n6&r$68=x3iKEuHmwR{9B?pf*@lseh5UX3?2X}J0J*}21jccpEJhp
zv>5`!02y|aSC3>`UsP1I7)2scPEZ_VCU>_s(zEZU42FVDJL}>l_okjW%^aixrp#qj
zdW6Q2i()9U18~H|`f*v<5w9e)CpAo3@je{Agbl?AX1mjxBvJmO^((=osGn*B4BmhM
z;;*IXGkn6+WygN#k4QT(i#(_sE&0OL^8P#C61-205>mcur7PgrV7uUh%qD3~O-&;p
zw|?|nGH5|MJqK~|nrFH=&}3DPV$EP4^H;7VF1=_GK%XfLij?J`Z{#w<OZ4EQnhAzC
zj!H2L#`7a7@`ljO7+1~Y261TvczdnMV6$2PA5IKHH;Z1$k&wz#3j1UK#^TPHWiyKm
zi(Zn8KSE}+Vu|xe964x9N;G8lX9}s9zeK)kA}6ao1vGs-15UiiJL`2{($a52ufgGT
zCQDa=mSOzt+pDpc_l7Dj=|-#7-#hT($v|`RZPFVaZn8rG9VPe-r^V&#*l2IMc8(B<
z*FVN%pt<n(-rV1w;~1_&=v4I7@jj2YMaCOzZn8KZr4JpVKAX-0NA0q_@?ee~e<(Sk
zqzmp=$v3<QG>5Woc!Hj%qUIXnKA@^v)fyWulQeBQ)mvNJuBF?30x?|oo~q)?1YZ9z
zRh=wW#ZPJ7ARA6i72Zfq-Pmr#9>hggIsGRe?w9=gZ+Nm!Ex7!za%cvfzae>*m1&Yy
z)NSjNoWV&>>~qsv0?!Byt^_umqE#(d_8HuXnlVv<=7xo%GV$bNi6*<#piwGYu7vfA
zpru~|wWIreFEllEI6$4etJhVExNNC;Wtws=wAW(f*Xr&VM`cpg=4{>xEm_tQ^7wwC
zquP2#uhB@4br7q=bxYGE$er&GCv`U5Cl8e2LOHX_BGuZqd!e^qD!~hHeAu5PF=O%a
z@d@%enC=p+(7kc%;L;8i^|pPbk4^%5v%w;j8R@%=c_U<)U1Fl&l~g(%PMllr_bcMY
zY06bJ@&&Jix-ZnaNr5AK=xdTl;_Q6o7Xef#nsmS5#UX|$zCq11#SZ#|i&EZt6+>q!
zr!~rDgI$E9o0nUd#*MDHFX!uB$AQ+a-3?+wrHbxKgC>QPv7{G)rGf-jN6L)o^upd9
zj#aP6Jzfer^3+vcXBH3{P{S~Kp|ZXLClJspcotTZIUr+@XZ9g?9L9XGfG2*C1ezT2
zOTjF)E{AN8T8=D{xSmK3(9<=+t+Z3&>9b%0<Kq;~W27uVMng)#WQI0~J;Ru;-Ci)G
zP(vA$3iZ+`(8cA}ORq}F7=I?2YWtfgx(4JU-6uUVmsJzruNWlc0-m*)oN-!K*}VDK
z6OO{9`&P2VCfc%Eme?@U#&|iO>6?86QxEW(r7TLTL7R=<U;s69MY0GUMpJvH<!PvO
zVr3E#RkN0aw^vY75>lRql601=c8T(Avs{j&hZkvo629f-zbr5p_3&R4D&HDc?IID4
zV&6pSoFaA|`r8=Hz^oXrZ9wg-Sv*1h5_KX)dP=iS5^yolpt}!{ZJR!-Y&(y`pj8Rf
z!U5^3(IqWQ-?!uOu4FA2)$u&9qprSc_64ui=p*6cbh<{j)FGcYM*l@u-Vbe?CCYx^
z7Rfb6(!0L=IotaUNYw9o>+tazwemSh2abUBw08;Y{73M-+3=p%@jeVinRd_d!KX7H
zh^`ASm7cRtuW+ShH$1l^I3ML(**pv(Dk>Tj0<Tvr5C)sC`%NS1o2`UNXBUJq51lXg
z3^1uW)qDifME9v#2Y=d08B*j3mj2bGjZ*(xbN-AT{QSS^8T^t<{sx~E@_S+9S%UYS
z*>^XM&d2*@u)v15OtvbOGJhJS(o1Cxx0Z|b7U}n=gY;dSO-{vqSw%5;A{C*sKyXzP
zJOLS@5l?`!{(x{8I{PB+0%nhogpK%br|310&7W=$9E7n^U~emr3U4&-cUP9UIePYT
zw6c4%@QN~VQym_;N`xHW4G#|THZUM@kAPM3n=_*iWhYsz6qh#5d7aiQ=7#uQpA6ZV
zxCyPfoi7=+g#F$*$q1RaO&xZ>>)sS`)2&1Xw()--V;<oZXpSCSsdbUtxUnfSURdN0
z3L7g_tEz^Piv9^Pti;HkiIZSSf&FD0exX?>cj>ADLm`jRM2YyZn+#rgleq$2QhB+#
z6DEUI@29$3B8ZwGfzt4@w>Z&hxq08KHPLO8vZ9KUl&MVKp-6(sVXsK@JRU@>ZKEXz
zVTSmD2rQ716cwXy%rWv7vLMPdN^x`qG$brw7!T_nW^)3G5D>72NW_{F%hny$m}RnG
zoo`PkN9xecl!3dWWJ~Vt<MVOosZ<jmU}Pob)PtO;SrRVM#R=A~hVCosx%FA|>;4tu
zsd)BVT~kcFHA$BNjo~f=T^Rlo26cuOIs?)Qi%jJ{mPgxk0DsHeb&ulM08J10NgPCH
zC>Wg-ZvYRrAz^v`^AYF|$O7G;RkE;Cj3W7C%>asX1jx!R_F3R@2*zVlK(<@6bRi8<
z*%0y3SXza6S06uLy+O;fn&ak&PAvP6TzFcq>w|6WJawr>Fs`{z!p4#O?7zvU`c05`
zMd;G*QdxdU$)*nl<4qrb4Kh%z)WWtrIXN)~;VQ7<0fwvQODpdy{g*nI5GEeU4Xd$V
z&5=MeC>u|RX$>dMNqf*X<Lf;JA1-bWs9p)$LB68RncY8U14Z4N@9RZIS7s5&VxBkq
z(zP~IIv`W*)_IQkv6l_6LZ7==F!-lFgc8B;UIDMGF35q+A$JU{<r<w@G^J(6&$rn2
z9~}?FKCeSA+45-@9v8Z!Wx6*evSwo!js~X-o9VPFbjdHtYm}g229HrThQX0OKm4wj
z4ni?}AMCGHUe9T=BhPmhHzMsGWEh-jAO|15sXjN+sNIeA<bN@N?X2h^Pqsq4sLsC*
zod2Ux!u9B{|BvJWo$eyfh&lOyWvOVVSE7oFG}SKm%Fk$q<d)Ag;L$Bbl+?P<3qPNh
zJKFa8sxm1e_U9%1RP2?QC576)aTz;Tur4MYO5}6gA<YA)Z2=i+Cx>y`7L6l3U7g<u
z)|M#AjT@#)M$OENWy^$+hOr&YcL%%pln1j}Md3$BNUNx;1)WyLlknYv8cl-c(7pV*
z+?J5lzbcTTVSfFRp2g1eP(Z;<=Pkx?Gu;*T`4qYU0}$+JhQSUH+R$K={b_$4AaIu8
z^E~hqTgC!o5xxQqH=@*R``)w(lxoX#HM8d>a@2!RoL&kw!kRiur6_)t#V7<BAwwI^
zw5dssfe$26+-3^;bcBb87dCdvAE#3e%Q4eiaM&dCB+&sS^1YbLT9h{Io$Ed!ncQ`N
zW{pol8wbTfqgDXQKJ4S4ejmONV6Vk;@I<gVy#vi`bxbiR9-eroFt#xfZV;Gm(8Bdx
zz9KYk;Ge<mz&liwmCf0f&H=8q962D(UFhB$Q4zrDSW!m*;0t48BWI!<24}yG+mDtN
zxt@6VTKD&7a8u_v1;IGHk&qhGs0De$sE)WYcU4X{4Ew@uYFlI9KsH_bJbl^s9vvXq
zQW^yyzQ2anmmgk?*#?Eum+sPx9i{*mfsqcym_JfV3+E&(P3dKFa#D^MQ*(vuAS2)R
zW<H0I@pmSvTRhCfWcM{OvZo<#>He{3fENmBp|WG@fkXVlTdtRkfTq$`;fiI7BG0M1
z4Sz^*F!-m@FCJtjtF&(FQl~XS0+SKJ^gHbktcy&d?~O1#pwXO-pu=*q)1bGdFExiO
ziy)5{kX-ez@efp&FR;#J3aO@8PSTpyeyjEkHN^X!*KKuKgMVohAhXnZH+v3*MS
z?O4_LuQOugXJa;n;%sFb1_mha`<wLM7pu0;yClus5P{cDzD}wOCFF|f&4qg1SD@_P
z)ex|q>fw(#p@v^m`yTw$O;fwEWt@+U=Ou&>HD3pxp<&3J8-?I$?rVePI?d)sv`_LK
z?jpYV^A9d(&gvcD$0mpI?CuE6>CFZIlbxB_vU_)m03H`q6a~u5e-w<QO%4zL2HhAi
z{#Jt}83h-8|8tyyTtaF7PLV2bjTpKT0^-!)lAo8$z2BM|Q@|aAt^!p~6*&=bu3%Yd
ze30&(hKn{?wfCiGtLO>u)bkhgr?NC@y-Ld4A2g#!I(t%hI}5cdLEL(VmuClf4g3+5
z?^g;IN|n(yabF6F0w`p6n8{Lky*h4iIa?m)0^O=kyRz4}2f{?c_Y!4;0p&jyEvY<f
z!C#d^D!$SuZ0b0a(s}P)p_O@U13jWm8-}IEoUyUxzQ{Vjw}MS!qmKn+6Lt{BgoL3&
zBfD~TpH3s2=1!2+csECbemhrOg@Mn6W`G|xbV65H*Jv(F$PL)VPgCadNz6{X5S@H9
zFYMsT#Fc@i1TYwN_!8hu4)40CnmD@qOhe5B`9-opjb=n8nG#$W5p(nfB&z>95&v64
zJ?LAZ7sT~t{>kpSakQA3{P{<n3&Eu_h9=hL5nqfTZ02+s5&po&iAkXgItD5#YBh&2
zq<jH&I5Ol9VasAY7<4+S4i|8^K(c~|_X@Uy$&m?Z|FArTpBp@>ohDP<4iN(HE`-9_
zcd-+(W@rRDiW>E%xq7nTp^%TTcc|NjB!{AE@nJC}J^U2wRbW3F?Xn2^m>IqWjI(8o
zaQFPs!IP9zoLbl-CACC@+{3AtB?98wG78Cq*JVfwuoj5@f;D44=;YJqAT;!3974F^
zin^o_`cavUsK!FeBiS%hWuT_gl6N{y5Z|CHVlg2vN5N)*>oqpgW0=VlHBEJ9A>FKt
z50_~1d4HFC;9W!B1p%xJt-rx?PmJGJIzwk+kZ%sUC;#;o+~X5)|NRSBw6BS!Ww}2O
zSJFL0`{lP1-L6gz*^|izI0A=@_LO3_I}%>$kNS=J+`Amz`83ei9Z|lEnkKKHG4HD#
zyh!s{=IdsR@sDLeN6=4eymWWiMlMRf6gBKD>w%UGd_k0T(3PsMIIGLPceUdM)4#8o
zd}BGf4-A9^K|sVjBx@zBK-F|sv%Enjjf&2p4B3y2i=quupkeB}U8MB^cX>!)px77h
z`kX0_AqU-TulrPx2_VOpAgaNQ&d@_V|0e1awt*Ik%ysxjlGc~r9}#EL*IJ)WfiSjh
zcLWwL8TvuU0?+gJuJj~9lPUZYmFc~yRo#a((Zf*dZL7FX=c_ix=bAQ4ccYl^G$>`j
zr_(vv-M1eX$H&;2s?g5ukK2+)yTvp2-pGVe2{ne{C(a?%8O%`c;zW&k4|U8Yy9rin
zUzp*)Kt+O!faUwjZ<Wh;18PhrDp+xu{`F}$l^#0dzaF>f{&8sJ7q51cP$)eEE~?xO
zpdL(2-l)*O3~=Q}gqAA{$Sc#Bf&W+}sFwMu(SCcZ^WFLwJ$Ps(K=8Xk!IY#%$Y}Xq
zi1A7|sr}qSrtvcHq~PF3!*1~8AJ;WLUo|ajKvyp+exsrTug0o#KNt<T^KCJKgrN$u
zZ^J98{Pj`Oi}Cy_4>=pw41!kxE%HO}L3yMw^|$(26L*eSCKngfs+B+RmJQl^ekVWh
z6MG9-YqguJd7ygpzUlo!HBheW6F6O#X&tUOw72UaP-)GfRKrO)1WGq&A14_Q-pc<7
zhe9`jsLALDGna!yhzp{sQ54{znzPe|heRPI;k+hz#VQG{ChP8P&u|p<3Pgh&+_pRQ
zdsh&k`+^#R%A~UC!71j(huRQ7W3VhLmNfEtTE})l&bQ`{X;?8YYG~v-QDDq3-wtrK
zRshNe@U9ECB*cQ?zJbrM@X%0D)G-NXI5Gv=QB68Ln0P0=(Qi^X6h<=Di7f=8MDbSj
zeG!dt7{_+waFl44Mgsc1G_I@;T3Q+YT$xsO^dby<I(%2HGXQeZ9`_t;p@^(w`TI3Z
z5s_AKEjS5#>EkjmwG{;b)g&@-{*v6vp6+3sj}bMLd|E;;WoK#9`?+igWtW_{^kCLT
zCo-orzvh~bIgd_A;keg{4Fx2_#C13sReZ1W-0BA7@_ek;h<9#tI-zLza)t#czt8lg
z)Yn6VoTKPb;Vh}oMOq^qn)6wqr>f3twf9+zfI88bQEl<)T!f=yu_L&^a$3Zh_E|B;
z{cLruV^7zxHBd7j?&bdVp_}{V)-#DK+RL55s&<m!t47*l_>GaN$VTe9{o0$U_S|LD
zt4Pn_SuS4$(QLjr7N_hkPrD<yP`rkIa>nELMLVZTRS&;N_Fmz`ARivLqnM8S5qX2C
zNX|Xtr?;sM!vw1RsjgDN9T91x*@WaXwz)YLqr<It=Qk-jSBO#{n=7<cCy4$Pg$%Z!
z5r!@jL|pdT2NsiiOZApxk2alUe_9j|lx)LI@3#i#&!HE1h`4OR1vjuIQ4hwtL&!K<
zz{j^HCuXN($;t^6t&ZAiLtDA(jLlAnPK1Hc^YymL=C>>}q>p$(x`yK6xAIeLt~plr
zcbtEQU^ms}6pfzml8=h6;rf3Ky#Er1g2ot(f|kY@EIYJ?fIq_-<>+QJR|eSpmerou
zZ`{kTH!g9QSWt58ieM6f27K+W=#R?OJ6{9p=Hd$+NCmL%y!cLH@1wkXBl-@`6H1A5
z?dKBl_s#}3N60Jujl1{mEQv7DQy^d5Bp(_V1{A@fglELO!NDO+4|GV!aU|1s1q^rg
zrte8-Ek>c2omg?Jm0@2GNdM4gU4uRC8Ig}Yq4r$w^+y!Aul|Ogq}K;~#^@&(>$!48
z;3UU`(Z$F>2#xgClsAAY)2Co~C*D0dsT#!mX&e(bw>lHRi4x{9FD@-I&?5cN!V0l(
zsE~@-uOVj%2eL~~^AJO+hxnA56b0L)PR6^ib_b(i1jy?rkQ|3V(S$PT4*y!h{c$G%
zAkUSTQK2Dm+%H*xvv?L9G8cMBlg|%-d?ErbLtD0&c?f}g3deeYdvdjD@9^s9ArcF3
zf89Hf<}vPzdW(ZuiuEP_!;g4<L~s5jM$Vuw7_m^h%^6<8h-V0m)o7A?4CmQUn-bi&
z{Dy>RxM4}eR6Zd5bm!UfVBpS`35P1*0u9gDKxw{U*Jylfh!Y`jmv`gT|CQJ7d!Wjs
zVwuAf$Q%`C=L>RoxK1;Wzmp%nws4|+oX+<Gv$_OKY77hE(}FMEs_VVI!%f1+8s+CV
zO0|&|NHw^H>oxVuS}1D;!YE3;5n;{trL5T4Tu(*($9%Rz_IgRzghq7}LNG<0)=4J?
z#W^ETpLrDX%(em=5r>Epw83p~mg6^#vi}}P$f6`y9*rzybP9KJX(?x+Yx-Tg!3(@P
z5_0UR-6qgyfy*xoN^LdZ0f2RZ4P3~f$(4)B|F}(m$TTd*T5b06%BF8i3Z4(WSsK(@
zHI_+lPf-IBl{OYS+&h2*I3kSeZRg9%&%DldnG8;1T9xt`K974U-IK+Nvb+;}`Y7_4
zi960@=Tx=*AL%Ptd?FWqJDk}7j$Hfav8Pj6aq(EtdQ|xQ`Rhou)(3!`>1<1`U|ZwC
z*k@S*LmT#c*YZfuE&eud3QY6Bps{j}{iRA=qQ#``a%!n;CQb8&N~;T#*?u^X^|Hu+
z#B1Ar(E_u>;4SmSe2JoJmgh6qYcoIq;2?f6{*hg-_FgD?lB&#By>sN%^=?MgNYch(
zQb0nJ%Jh$<_#a`HP~;0{Fs3+IkNdAk{V!?p@3BW4bVk8bpZu4WIvTy|_O(w}qGYAC
z9>~eQgX`p!RdR7r=gIVAn{kidS5b*EP>H?3uhdSuU<US$izHKgvZRhT$H5xFXM3Nk
zyuHPoMNGuAHNVCl=L*$c<|odwt|^LaETQBggXt6FQ1vd9nr5$0mQlQKK=z`ao2*mb
zx+y_i;%u30Hs#eziLc{QKa4L?>6S-h*>uH7^r%E;q-T1A-@_YS^_}hQXJroXQB5~i
z!TYYkE6$M%FsCUI!7(`{f*atY8Z1`@1E3wMRJ7Lsw)=Zn;`SsYw}TX7)eHbxhNbED
zvW_2^j`{hf4_sRI$0~;MAs&m_;ONzafx!bE_1)rfW)g~1+<z358o~<-_C~`39j~AZ
zFypendS{)-rDZZ0Vx7j4cj3W^9Z~9Z0!%O>Pt|U8$6@*QfBqKS=Pkk6D#?Sn;EenF
zk~c?&d$0f;Q#22Pl;9JNBquBTe0L8R#@dA`o|=M*-kD533{+ZnU{#-WxF$nTCD4=1
zd~IJJ*aUumwcY=s-Uw(d{2o$ICtUI)Rqr^{Wut^h0MXjMl7+1J1V@XEb+|SdiVbhX
z**^=C49>v3J7(wARs^=noG8fww#pv=zD|n%i+cP`3TJSv$`PrbOm7V@cox8jFBe%~
zzj3aTgXqV;R(5w@F!>R}8B55IG^k6{o;ErMuX|Mg-7K{Ot>?Zwv*>O%6LVd&DTpe=
z&YxVtVf=NOm7lAPc~(u+jVC99CoH>*Ae|BHoZ%X4vl%U&os-gvfE2^2Y4B<|HyLMj
zQXbC+nJ0_T)AMDj422ln7?-2`7P_}U#fkxT@S2up(>|QB!}{VK-f0u$!+iV0T!+fs
zhTN(0IrfIdvvD`GV&$nnoE0@+=aBCm=-#%t%Rkc<N;lS2uB!jUJv(Ii{pzwbW1`sC
ziuV~8mlm|VGk$nj%$Smd<XdlFU!wL3>HKJeY5d7F!CCb$?`!+}_#H=qDGt(p<^zqM
zo*sC{EDoEja@{V1Il!X(3(chtHj~e!JCv5+(hd{T_15sq)S(xL&EhwTcFvKF05Ah9
z>d7=v_I%k!_>7|cvI%BDod@I1%V;{R{nz6%VLIVr2zkvXyMJgX(NrLw2HKgo<01*n
zK=$Iru$|@K3eYJ~>N^G5B#ZoK;rd@vqp$owVv*zTsjiZHu2xL2#&5#ukiF2h=rej?
zotR*PV-phbyuu91zPQI50FreupSMCt*YX@9)$6+Wy*m#L@tkNVdhZTuoef=FS}RSF
z;Y6&a0K%YJ$ET_7tmLl@NT%ZO<KPBhI!^$F)7jcIB}B(Z02M-1T;*pM5ynpyrK7i1
zR8@l4Ncc(1glBPKk`IzHv4nYg(A`;3$nVPp*AC3eth16DLBmDysM57|e5;LFnvgLJ
zJ{LmNqcsFAGQ|=17$}mP%}K2Q2z&MV7O+o_RXWmZ0HDY~!AJqe;s^t7ULoKesiV<v
z&B^OK+$AkE_niji1pQ#OD=eFk0`>=rf6#l*1$zHbMyB=je4X9*Wgikr=xA-?p&gcf
zgvyPX!dBjEAH)Gdcb^U}9g+49NwisnexLy4!>0d6IM&O7WKdA(r}Wso$>Of;qT9~g
z7Ty~{juD<%vUDE-swy8RHFg3is4WdxwH3v*g&u4;fSklxENuAhK9-n)dm~<$Y@*b+
zYTrAmUzB=#8pQmwE#lQ{OS!?U6&OVCoaq}`kVxz3c<(P8Ms6n|rpsulUqN!)c+i}f
zR*z30Hk(l~aHa(s2M)<xEVi3y?38p#Of5!UG}YoV7C=YpTsz53ngI<7Npr{w$e|@o
z92^*+hMn=JML<^?fe=}(|Iq~w4z9-|I&tGqFXBrN2o<ZIK|r-{;ZP{^e)s0g<IT1<
zr+Wi3lAp~8JPWlIuh^3N$=^GCaF0@rK`K3M^wbi3Pd}E?;~knMcxeE6C1vK20T*+M
z8`BdL;U?(PA-x?g-3@Vp+lGs9eH5eyUk}U>4;en6G1p{<IdDdutO0TkUvI9m0)WsD
zBTSJ<V;NhFLsvRSrj;4Gq1=D8hN3Rr!EeJJge&{p*5YpnGN%0QgSZ%0fH$rT4O8Q8
zHQ5J&Va^$64g|nIygGCz4Niosx7_uG5BYET+DT@~VX^M{`T532vxR67oU!+5Y!(#6
z#KfaWCqj>Z0tsXZxpZ|gL$%u}R=I*b^a!U4F#LeP#yY1H6_8y*Ywbl8%N{O@d4~^8
z^mulix}PFgze*J*1*npZYjryL^ZL7N=(i|7mwyxciIcAS8xDs#NyEu}lH98vREWa;
z#VX~?!$lu5wLOhdsl!1fv-4~I{n8wMXoX@?WxeGLystY3m#rS*hNMdwA@LHfEp>)O
zN10MdIMqC2flk14=+=43B0r$xX5K|UIY?G0@r2ECNz5Er5pWU5Z-1&*FD&|FOnx^}
z{DTdp%&X&Uk*7fR<Gr=?IvZFSdsNk-k#}Z<p-ZUS?u{d<oe@x~{GAMm(aLciH7t_1
zATK-H@;v))#yKD~SfR)n|Mg2=t1!VJ@}{$8a-<Y5YHr4@E?AA{I)^Dr?kg{Whm`Zh
z3i%b~<$Oq2OgrjcyHh$lnod~~<R5X!5pi*Qs_Ptg!Y71%nKJ4^-=+1oy(3D(I<HUt
zE(@6SntxzKos?ELK)i7GJH+EmDn{le!6OHJ(RSo~nWioYj)>UA<x1~MhsD9ySE9?R
z^^2|=43>p|74?1}f?yE+?=X4k<iGv{fd3Eo7$ba!Fz8g4Fy5RK4F=%bH&X@j%(`!C
z;aI*5`$)qvd>FFz6Em)BZW`^8ZH0dI5wJ;1yLfKT0dESs=i~t%I$=J%_h6T*RJs*w
zM556I$=H1w#I@vtydtmt1EK>>W@<l<7XVA6!c8e#mAItl!ODuL#ue;<<{741w;j}@
zr)!Zgap-AmU#eQ)`gdMp91{(2&&lNIL6-zvcim9a%CAI>uj4#lsDG41`K+nRrG6(&
zP$pBZ9B>v1HJ)?^)DW=s?&*Dt`h@?HXt|7!3>XNPbN5P4yI$<eBqy5&%QTQ^8F|87
z4#4|0+<mR)qb7%HU<YCA1IIzjnUr@GMN)d+h|Y1u@vg~*mR!<ZZ?U4B{K03N1qt>^
zdUQM<)xl*n9FekrjuKYh06XZxC~A2!BMzLjZ@+*NY<~=ku)7kdJuCN<-yty&%2ka2
zc1nCo0aYts)@V#~6F=6bkxWcN#BaVBhv-+YUDu!Eo*i+t<hYU?H4!&scqk=lSm#Hl
zyFzTDB_iKO?@->;iu@-7DgHrgt^}G`K=9C4VaQoa4k&q*3XKJ5I5?PV64&8~EfNNQ
zUn$Eu!xW3|SS~*y{}icm2ZGfU3)6&~r((Bn(UH|7qN_tgL$qqKhSk2{;#`yX7HE#-
zw<D(2k$^GL83%0v0bQtcMOpt}S=FM`Dx%iLn(pqcIFf{%A-*)9AMzgho}PRoxPmS0
zKLHK5@o4SopXKj+v*>tE4^oL4)2r@BTOe6m7*?iR&7|wKdyD7Az%r+UW<25g?D4_t
zV36?oJqF|#WC@$2G3hnLOihcgV{v9e1OYdY;T%>QWIWENN+&@<K_fXr5Q&SB)?6}2
zex%z`Kr?H0UxR08ff8CR6?O#lYEVDb>KwFdh!tSD=78P;gRcyHqC51Erl;4Y^J?K(
z<dR($>f$GCm0q23I-k1+;*4>>xXw`CGf{uU)M;0J*Q8^q$$UR_n}3<k{eFGkb|GP4
zkawMrxJ3Y7;f|E6)>~2E=ak~$)yQ;^W|=R2h9#tS9`@k(5X_#^JP4XHEXsSiE`NSh
ztxzJfG46lm%12LOx^cRKq1wN=D4PtayW!=SG&{@ziwiQHt}Ib3`Z`<n0Vq*ys<cSv
z_8Gd&x|}Tt3w8HwSL(8W$Q}27gBfwNngWS|2+}h$XySETW&EsKr4N9cw(+l<^i5$5
zlg(Apci&;wht`~AEl)O!k`eKA+y>a}A37eY)eEI@ImQx37!J)-pZFd=C686LE8Jb(
zv7aTDTn`bRNc_6Hxl49Kz+5@A>AY$!*XdB`?KK}x5gioIAN+O3k4bX1LdbFd2hFM+
zbX~62o6(YrMD-r1o0d2&#e^5XjCH9|WP3d`@iUcAoiM|wRL6EcoGxgR;IPv<h)773
zdWPL~zIvv5$!ft|6KvX#ojuCOWIyiI&9iZB?hvY0#c|n;JL4-@zg6Zw3^#CS**sJ|
znKg`OFs)Z6tLhajHDR@fOtE=W)}c-H=Dd5!!m~M$O?h7MLlhVmA>Eq<^#zVTKDC+e
zNj%w(7>J9DJD)$#*@Mg{b6o_?T)bDAtxSFzkJ)sUCw_F?{iJ?uVXiiOIL8`+K;}1k
zsWZO8Y~QC`aykItbm%pomy_=LxKEc#XID<F>O9ssT4)mRwM{M($l<`<WY9@{jk8>C
zU0zmdG45O>7_=z0YO8&i@W>bVuKmmNdPek-coe2`qVV`LrF4?WuW;SE3kG-D&d1j}
zg&oH}M2-zI2xz25WiHoCU*4-F*S2#FqLlYZkBH0Vv)ooBQjORA9m1NB7VsL)Cd))D
z3f_RjD`n$;2;@YMDGsYOGDXTRwPWwqVEN+1xAJjpyT+*t6OJ{<x;5vQ%twOlM;oys
zFi*srPaWJ&%vrFu#{iuoa;ceryVU3YUg}xU96ind4?g@i7PVU(bc#DnKis4k90^vw
z+rzk!d~^c;`)-u=A7-az;$>&D@7C?L`Ss>1x;2e~Q|wkeR9!Yp)bY@)$uUHNPQC_k
z{b-M62p}O^K1~t|(xIgCC2|V^0DAqkJT%;rRtf;yLMibqrOwcGCao-J`GaH)b9WB}
zDr+50(aAO^nxSX(Pc%=Cx*$8FvSa)WYltQRNz?*>oLC{ldg*Ql_)w<=WdR|BNJB-`
zoSIZ!kx~Dt2MK%bJnemSG2sb7>Ybj48Nybwyd-Th;1{PIscke_h7)SAF?K7>R_cR4
zKdHlOY{n~zxYXF+MuR;slV&A2%2;tp)@2KdL)V7mH<9;fc>{z2N)&km{0}u9E<##?
zv>A>%7C;}k;O!uGbG@W?>dW?>0z@YUiNCSFXIukE%Fl$Uf^p9$FWvC=7sLAU^-PlG
zmVPsUKDe`y0O{aj#XjvDLnV2~*OCCL+AOp~MAPVpL2~(8E793qSiPkM9<;r)i)ip|
zc)1yUY$nC;zi`Or0VIAfs)v4F?HQ|Zu(iLo;H(&r#Ijq<^}l_~JXO4;+M0tD41`pC
zdxJ=jMxGqPbk%)~ey%UFLhIe)-bk5h1RuYFnjaTktgF;hdfY;cp~Z?-eR|$;MYO3N
zH(EAYzD|9a>N_E0;LtT2H?1DUTr>$(v#^obB0t;8gI<Gis1)*9a4-JMZ;T5h;g#4*
z^raZOG{6N8kCUOKm*l0KuQqK$+aFO{p|+FtgPIP~Q1<qGy;bup^z_o0bZR-44w;~>
z$`Tq)*7^IkvNWyqx}?>8ruBh7N8Gv$o+HI1_d{YGPm%7yH8jU{Jibbw3J^D7z=!H(
zyOsyvKv4Jnu)yhOCCK~7DidyU;i0?Ms%LZ!;iSD;H|h`X%1;^1XG=S}czz!Z*{DCB
z6q7S2wj0lPCwruV+>tnAbrO7LA?%z{2SZo_-?r3N^a+VoS8}EKWU3~d?{7*KVNh}G
zewV;p?14N9e-mkyo&+84ZoK!5Qr;Y#DsA;e^H*FBLf>7$5V6k@$imvrA2Q9J^&*@#
zUc>Vq)ctIy5cp_s94B@<o=?<&KuQMX*u>?Fm0^eXMO=s7ki^ZT!&a9^*p}<jGKu;(
z^+MSx9;?T=>b;m;mt{p~Qi+o}S#(kDdY%mUd{F@sEXND$COYlf0;!xy41$-#K4h?I
z`uJss4VusJFX!ntM(1l>jq8df9KSXkHs9<QlvP*nWmSlZxglm`nygmsYxVc;QGGpJ
z$2pJI8YEi`GkDO@(Dp`#2LIf!^|Yub((XL8>iU38fKnAkMcfd5FhUDEXuozzoZ~X(
z1s<7IwbOOIKTC$OAB;|XxX==f2u(`wB|W|Kn{6XtbixF{Y(gDg{<c5ka$#(JF%mrS
zxIe8;*Pfyk2zUV_V4!X3O{Mf$Z|A$v#&zejf2@uq<PjN+^itw>I#)_MLbJNr@1WPM
zQq#$sXh6eJkfxCJ!q7X^eK}oe);DZnth&*tJg^1r3#WwAqLlI!Pvfw$PT%rS+tlGZ
zeIRJ-lQ-S$4B)-*S9E3}H4=yd2Fg^XRecx+cs6V!xZPe2U9IOoc6Hpk9`K@m@Ugqk
zhcf$Yb=y@oj<sbca*?{fZRO~ta+-w)0zUzz_x2&Lvpt^S!ov9#&cDp*|EqP>omvLs
z(5BWrOn5o|h35ZT$-8x`^tT0d;Kdi>3^g4wUhI!_WqMuiXr?>{QEiq(r-e^?cRU}%
zW8Dsj9&Z3Jf~O1_pzXzDSnQSPxJH_#bb(L8_WRezO%oBe<VZXDstV6ZP(08m_jj0I
z35a2VU5+igs1c;qiDSOGO09MHqwb;0vtcZ%*jGBx!!TNU>okrxmldvgZ5nSAsNwlV
z?1VGdk=slO1$x(!@X~k`>>tLB!gZo42t&L%)|ZIYu=={=Y)xcn@y6l5ke45wKyc0x
zMmIhbpys*kk>B&6?H}(d^*h$zkSrB3tU*HcAM^9|#IlSH5pK|ew@hCD{&_G~?AB(q
zd|?;5c*3B=?-%t_qAGC5MY^oPXqn~e)+*U_V=>ZO!Xe@6<P%G_mR)Q(O*qM|@KeX{
zl&Cu`hQ8}mCW+j_kc@3CoLvm1QC?cW?ee#X{d&+Hd4YcOqiPR9j`YU4*QY;46H8AU
zDN@Tmyb#s4xx5ingQA}u3Sl39ZBhOimC59$ri!^F)EDSgg@j^*6}$8`zP~ca#2T}t
zY%T^9Ze%)g?)Aqj%N1&@lR-&7K~dO!dbr<LhZaNl5<8;?XT+>QYh747!G&id6m8i+
zQjDfRwkx(Yr!fa%o8N^qc7<b5K>sYpGpxiD&TcwFRRO6|3<sR<rnH)k(n<GPL0VPY
z$Enx!!~j>AQ1-(6t_f*y1TkirFJnnMpB6ZTa<SH;7#Cl0=oHC28iDEv>h^-9@pSmy
zj@|h=6``Fk0GD#jCYdunc6OCBK2}y?kY%Pbl({{Ut~R6tTxu^@d2)p#Y2*};TF6Ke
z8R65{JYCNYSJx6)5E7h|Wg}!cLSUdc?k$*#+~8Tg{bJrHnGKiJ;5~U}xx?ppzLPp@
zOJ{XbV0Fw5oV7S%?x6&)%$VXgf4u|hj)9<e!hYoOO0hg?A??B89aomIdC>*+Ti(ay
zdu=qkYcwp)oa)LSY>fu<M9=FH%2B>!wJWg=cToy~c=X3IK{_4m>ucJ%0`CCm#1(6G
zU%ku~C*zgK)Wq6+m`#rdIZwzxLtmnH;Y*J0<M%!=P};6TE(*otfA5(;GLsk_i`5k=
z*qF;>wvRY>J{&%9EoRO=3oMdqoC_cPhEIg+lS$`SG~cedOBBB~9{-+Cw$ItA%UL+O
zw&U|Tv@qfZt5cUmg6_i34b}VuzI}r2C$YhqY^at;ZU12*Xl(?~a*Tr4>n9(~%Uqd6
zKYUtvx!Fb*l(7ps>Jc-AOxc8D!R^#9^Hs7fGtwsu6%3y#WqVv)PhL{k#kV-<*`Q7s
zdj&dWGsu+DLyaBxin6^X8-+KY@6Yvt+6WQJo(25bnX8nt?(*!Gk9{p8Us<kim4RA@
zKmoPePS5Kjg|_ojt}fck2F;mU>O6i15vA4IxUw@vsD3n+EOv*a$3HK>ENG^D8aD$T
zo<>DPof~Y9|BbQF@P_|Fbbs4MIY<g>ZU47x=AVy~R#2Z%JghfASbQEJnNx>f{a|RR
zhB17a9HDUbeJSymcHm1;aSGn$6F*=_5@KUXZ<0M}A9Ph^Crwz@x_xLQ=(@{@gniGT
zi58RP4KqLRF%{QeUk6C(Ab04yW4evr|4=<Ww!K|Xuku_Cd+^7#g+rB<CQ5t|ho&Yv
zgKt%|m1lbg%^$C5fR*2i-5#7pC*&nK4m~4Lrj+=65%FWC9#u(DE3-uX-5R~PWUWar
z??m;RJ2T|axsj`YhCK&2MbQCCg-h5Zk&$3ktex2|Bg?QM;eG5%46pG;E%;MP%a8j3
zqp&6$6cRmfw0-^$KVe-5X2ovYgDt|F_1#xY{aT}adIcUl6bq5YUBbu&65lv(<9&?L
z#=a7o-m`5srdnDYB3giYtFFMftaVrQ?=>G$i;|ggf;^BxOm*<)l9G^?KRVt3X+x&t
zRz`6kU3bG#9P*p@W-?us&u4lLt!WkWg%VoAay9ajqiFyU5txt&meIVVmve*cIQDvi
z9+AG_e&xsGq%$JXF+U;(8gqemZw|MFIR;=;Dza2OXBr3;6{>(VSO-gJBXuY7vlrna
zA082%cF;yNWSq4oe&*!^v*9KZA>ftm-uHGro2Kwn1V;+wfYY?av#OSXO=d@czm{v#
zTW!}uNV~hH*fRYgwCC9ymC?t1cD=3Rn7u*yFj1owfi)%tso!FwV`-8Z_HO+1r<jsb
z{pos}>fOw}+d*cL?^tm$6))yv4vy?5kIQ*^_tHX{swAlGE-WlOT$rpwgMjt5{;lP4
zJE9O&q#f&AdZWuxK2Cb=@9z?~R#Fm#oLA|{SRS~^e;DeBQEh-1u7g1<((0@gElOXA
zTLFAB*!JG<3SYRAu~r-SCTG~41ibbJn55_wRVkwM^AIT-Eqvw)rbW7L2khpV0P-;{
zm<->BKx;RIAiMZRW!|3e$a#6S?$n>rsk#%1=nszB)b^imL%6Kw2*7N5M<CnW8jp}K
ztUl%O$)++7*xj$u;*DrpjlXj3pdZfUH(j@o=OHzj{hCr0-Ois+CUq}yc;4M9bY|@%
z{vJGX$FZ@sMjso3G?H%9UP%BoNeIbmz6ObEL>P<nNB_QgcUP%fI^eYR>$tmD<$STc
zwrUVyk)4;>V<^fB&1n~wfO1p)YwM%J9jv1V3VdaBJ#q;SiK@0&1&;lM6EHax4cp-~
zr5sA>JdIzYRk$Oh`fW23<>VNK(CvL}h3yelu(ICTA&V|WU@B_Mwe-&W<P6I74eLXX
z`ref;&!7`TYKhP`{p|#jCu>o-+@9ucFu<a3_*|^JI(FRUL#l4dst_{Sqi-BA&@z$X
zX5(jn)usVu54rA-r-P>CbeonR$MY4M26&_c{EV*zFKab*%4Lh8WZqdgE+$i1_b;@#
z-fvGPVNs3u-Ors~9>zEOzvxt`-ZEipw7M~b`QUX$1Xye5SFp5fb0Y~@8kJsD$5g3c
zxv!^%GW^(^VUm->OUI_dU<jLaw|90VCQSOeg}(3pPXDM9Cfs~bt#}nuq5DvX+TrUI
zpZh&qu^ME5b_b+=a}^L-<B^)3ojY~=fJU)k*r$@Kays#juh3+doVe7OE&A|9tI|i(
zyxnN4J!Lr&#jU(KXy=msR`#ch2ag(IQ~ftM9WeISmD$&hm%Bb>oAc@KO7AOWidSzG
zqKP|K>jfmJ;@CA$9mxDjRmfJBucU^%a=Sv>4L84~(?<G}DOR1dAFqZMm_7C#wdrH0
z(%w|U9wuQ#*BFKj4NsXWr%TuUz%LHi+p}NqPc+1TI384nZlB>GrWpp`UPKUrbHDTS
zkNE!MwwCd*`dI>eELEo6GZY?+iipM_e6243J`{D`9gu&?_xp?1`&qK??t-eW^Yt|P
zzcHblxPRNJ%eGh(1pil{^v`Si-yS*B|8dBXV``uSWmIX4><<&X9OM?Oj*tRSXGN!S
z5CaD<P_$7qdM8R!EQx*<86>~y8r!Sz2O;gy%O5Dnayai8YOn2lg_32*Xn0$$r_G<^
zkM_Y15qu+Xw|Fz*L4qAWD|!3X2%q7eX1puJPf(#yDUBHk+36K};~Q8(W9iYlbo_`X
z7}5PI@Y^VU%s3x{r+|ra8BQSqJe0Ii`LAI8wX#Ru8FiewoQh7O@g!VM%Q!!lGvX9~
zVBkBMPmp*yw3ZK7Te`fG)*t6{4e|b@)JFCtv8-CjB0`?nEX*r(cY`5Ppv!vzH+N9W
z?di%qw9s)*+ui#~-IB&uOhVY@UB+sOLSpUaOM#3h61cG~YHC94fATwk`g-7*Q~mnJ
zPFw;;2@Y2og12z!M}x8Bl!`)~oA%WYVYP4hYbNq4mAerBRNzbSB-3#{H6JMjc+23;
z>|Frw?#a1`2l1a#>1&G}g~F_6#81{bwTBUeMw@>O;g5+vx%NO|iJh%9U~CnE34;ef
zzQcl}QOx+}K|@j}K*O?47Yhl0^ACi_Hj5Xe`fO!OKM9<sc`*yPxdx=8sonLr;|XH6
zg!+q2C%#fxUC|6v4r@>mm_FFTM4s&YV)G>DEDnbxvZn+}hylnV8#uF^oeYeWobq!&
zla9?ISC-_J7|>0D9iVFMc`wNVlK9=W?gqUZnV9AT>F@GnGltl%ZKG3{1|wo6%tGGQ
zIJ}IM<V8IA+;59<#)k8gwd~>aWPEOoK?*ryK`WjGS05jrJ!E17k;pR`#vty=EIv&k
zDXr|7{j;Xcs2k`ZTX`Q5jIX`|Pio0Afyi5i9302`KZJK=Zd-s48L{>)q8+jogfE$^
zcW?Xew_4VLP859E#!-6%FXbnvKqthW+R7>L7c<qW{IS+dXSGEfhc2nx<Y^kVo#k2X
zF3_GiK<>7(PXs1C`uM0vg%@zfjVqhq_N&#+C#EB(Wm%LYR0FsTd%6o+U@E&+8lC_W
zCq9E*XO-&<R7uPJ)N<Ls^bs-BYXPJeO(&B<6w+y<5e(9H)^UY|bg_kmUUGTAFuoa1
zbzT~Ti3W8&J>y>YjoL^?lJ7pA-Y^X3eun`Iorob7MM^#dCYoet7kfYEobW#E@j0(y
zSZlTIQ>HR`rDbXSeAflkto7YY@zV1+TQkfRDOR{7(kL6Bf9$VXT)i1CP4~oQ`4M8a
z6m)}D6*IbqmOpMIaCwr=7CuasRm!t+k;2LE5#qnth7EUG9;myyp61WCNSdge35z+t
zzqUB9w=jAQT9yP&d1UH%>VGQ)sPV}jRGJK8G%xOqj){WrwtXS0k)ifQ4OwRsQ&m1c
zIH3g5i<;XknGah*2U+wtpPIA8akwzOlnC4p{m`7%sS(<DpWL@=u4;WgIu&+K=1XYv
z3Eb7*AMUkYmkd<H-v8FZ(TYV<jie+NqOf9<SvTxi0F>f%G8}<=H`m($XKk!eZVN*~
z0`2`4eBQ^eEq{Ke-zo`<=u+E^S9&HKV^K=W+t#q(GI_IB8(qD$njaVojh^mW{Mpd|
zerngcwRc1xahX;6xo1P@?d7m^R6AFBT^#ncr6^lrlgA0y;azYGM1F(blS!7lg7evm
zJm@{Ct`>oZp4pk$9L=;PcVJ#TL1sLGJXBY#TII-_!=<wML|?Bm)rwI2F6gnqfre7n
z{|>YZ{{rpu7vpxe{}0es{R^}|`1m7S4h09h-MA!Zj!k5K*3Ju)0Y_w!RHCuT8G}A(
zyN@5QAeRZTNeQbS)q5e}cVjhi)Ip<{G(t*h48ApII3Z#c$FHK2QoSE%kfi6HysdKr
zMp%VEC9XHbj<}9o)Z1v`Pz}EK_ff;g@B!tAN5r5Zlj#YgxOA<X8#-K77@}U40!3R7
zK-P>T(>N2-Gj``Pdou6U=gks+H5nCyb-o3H>Sb!@y4|UTpI02~M%97Ig+<CkQiy%C
zp#=G(k2~eL)`pY2^U3MDWL;;Haq>6LV?AnsGS~K&Xq)P02+KKZwfOhrO_GtR5%B5M
zVB?4a>y$1!uO|(zDnkgnkSQqn8HJP-^QUO?!zpfI+sqmg1@DzqvgJ_pvAX$A{TL~{
zc@1u7D>AT#(mnzI>Lpl9^lkZ;Ncb|6aRo(6?Wm&N;r;KJpT_V#yY2$%UYSHHFQ(Ow
zl@P$Cwy77)=i@*lNVV24{7>%(cX3In6-2$2+HDfT!jMVT3DuMJ7~~0hB)Q+$MNoo_
z5kH}!8)f<uG4ux3_qpLP8uJLrG@=p}AU3-FVe2Wb$glwmi@Z)FUj}?Xg3DEwZU1@L
zhP8OrjTbe?^=GKNn`n>lju;Y5UT;;hVh=1d<+2n?mf61y%EjIbaep=|m|<DxlNvKk
zCC2~Z>#YLfYP57g+$98ecPBt_2*I7;?t$R$?(XjH6c*gwJ-E9T?s_YyPoMiw&rCn=
zP4Na_t@YUgCK;usIv@e<1P-qZb*ARMu;4Nx?Aq-Ubq>}(KzUUPR#wGjiX*8v_@8W)
z)YSC)&Y&v3MrOQVWE2!tBQ8*WXG7`j&$+PB1o9<~vw3m^M`dZ7In68i^yzje$!WnP
zTEXxS{I9+Po?$H4fQ24ADCI1yX2A`4FZmXt1Oa*mhp9=YWNtY<P3na^Zi6%+A2y#f
zNDRvHS_wAqC%!*@>E^8B9;%h;NW%$BRn&G9EZqm)>ZSSXpbnQAznO(mg!+~9#)IZK
zA6s!B=55Qb`z&)wbVa0Gp(^XwbXJfB%75*~tqIaP5P>;73RG=;y@Q|<JjEzQ`t-82
zD=+<m0<=PQzSv-t7ko<9abaXxIr{4(o7nGZj66?I%ruUnulPiO!QgP%Q83wlPW-kd
z!R=njMOSL=5`-_WM&kT$e;LrZ>{a=6z1>YZjpa(zBdab~w(Z6SE8F`#=yP1i(>t5v
zw2)^b=11(HQ&@^#TJXaMTpKs4AkFb+$yWi?$|;97$e=mo&<<cDZxO2ZQ674MEy~%V
zmYRz9&Br<&NXVd@5o1vhXJwq(F1-bQ6|(LC-hb995Z_+oC3`+WS*-89=YH%N8CBUl
zCB>ZlU?fT2bjWspov|l<)Us}oeMZJHd&x>qXL3O$)L(S+GvZP$iNfb3J-NDR)g(Ja
z4cPGdfV_JekM0koXt~(Pqa0K&v>&T#k`@%Hoj;z=3t;m;!_jGQI2<lz4OIpr*==&T
z>W2-tXa1=*GR6H^+P#0RyWc^mvcE(X^o*fduLrtKLVE_pK}TR!d`!*(ZN}3nD^x#n
zE1b{GUzEXWFWTFhp|)CaHlGCE&Wt={7kfcdA9de($D;N7e{rxoQ)q2{82^~>7!pZw
z|GNu-%jmDC2iM~?a`zvL{{L_RWfuM2`x!cF5BnPlKAE!qP@vH`_FV#tiE4RJJzmKZ
zg~x@H1qxz7ZZT>ld$q|KMiZv|a%q4XhMh*-O2pq1bm{g&wt$wZfPq?NsF5)>#$J29
z8ooGDk@TTm6%FM|bGZ!VyX%?&)uxLVcCVwxv4T$~f#<RD&=xE%l<tsb=(b1*^FX{_
zU)6a+u_rfu#9|b2iL&nw5-^qe)9uD&@s9cq!Nrz2Cpq}y8JjMUVLn#$JJOVoMbmu~
zyYqQ0=R!%UpJNrmbjmvAUCBxjMb|=~bujs`LnQfybIxq=&6S<Ecn>@@k|&O_U~`#L
z@Ip>Zr+<hU=VSPST-3zu#PWG+6xvq-P8xgLQyKL>IVi?CLE8F+WKRPzdT6(I*S&?B
z;<?t@C7!RrwfZb_QUOgT;Em6?8}n{&Tepg`-OcL?35vbSOPFHW{}CO`+<+KO4()xe
zuILO?(vnSoNkXL9g!hNLTxX<*OLZWb=6cehI7xh_Q<p0-e1dA3s!}vX;fRMGpx5jx
zpL<*I-&U^^0gGvcKHuL%Y^zy4>MOICWTe8$Y1-e!8gC5Q6{6{(w!SMY{OIKoj=Udb
zjkHdVOY>V)pjv=Dg0ocu&+`50h4vI~1UJNHPfsf4)2U0)Ipb_?9UY(QbsJ+bYpQ!2
zVT-ofBCrY<G~2oVwV+jVt7Ji_FIhXFkxTEio9%5|^Y;*s)#q_z5w+wySCC_;j+v4Y
z8cp9t!kli)j6#eN2>MeG3<;?)tG>O!0gE*mOXkjx4qpo#wj{h#*M>;bj&Y`v&#olf
znH3i<QqyrtIyp>-0@>Y?yIIjMl_RgzcFl6$Wd6jLm6i$}3n8b$(bkVg+`HLj%e9U>
zQ}K(XELR_5to{a5Hy`1z$uc>pRFbA@)Oc7f2t;1lQ$K8QV{S%ykdaOOBE{gRE(~aA
zuC1*_P=9-S*qrCjn`}1|ua<1HG}5WAdb#sD#1V@r(h*ZW=*X?sb^uvw*}R?|$MiC(
zyM!QW1EazQPZL1ZIPaO12+A0tcY~<vaPizZt8F1jbkL41qihB{($0zM5YcbX7~%+y
zgfFH}i$nQck>dFuS3|8o<|d&?oL3jD*tVZaq@Muz@9-Uc<sqae2U_m%NrIf#l>}U&
z#5h^Kd#Ahfh#MZ80`%-}6XDf+J~vVTV5{+1a@BqdJaeKM(*;ous6J&8ux>oQbk%s_
zDF~c9m1~>qtz5Q|jJjlLi}Kwog%w}At3!BYx|(c@_~Y^W+$G9<lob)2?_`l`s7kj(
zN;ik&yL_4QyA61)kMq6ul!ZpRy^+z70996-bL~U(-rK<S6*cjS(_-(qh66?W&t~(3
zL+j0K7b(BFm^$sD6ctp&3ex&b*SYh2n@DxwEBA5G1?7d;WuBK_amRHXXjxy#zQM}x
z^!ey(a?T2R366=S2egk`)6<tX(*Jh9>;`vpd?mlntV56&xXb))wYYFj$DChP0qjET
zZxy@XN6R63K<!$+FQ|m*vT1L6g!Ih0R$b?H0afYc&;<vMr5mmM1IW1Q|1PR&PF;~r
z{|k7%{ROYHt|8N76mZr!?*4Oj_q3D*CO2-}*-lw<T$c|*P8m_~$Cy4lyAgXbTFe-O
zsRX^RXUTW?E+c^gvXqqw`D|=><lF3E${fP4h0<dRFT@^-HSGO{)=&ez<q;W8&>=lF
zd&JT47mFgJI`xfGKVY_+z<O1&nt#gve#bIg2SsUGT9lm9KJ;PX&z8cCGfo&n<rDq;
z#E(mFFe)ksxtz;`|Ak^Gya)u-UYS*+lnAAXwPImZ%9$t0(jdbGd*8QczZIJ#2SssS
zDQ96N&h8oJul*x8(x?*JQUE-xty88qCII7uj+UOe+TAyHnK-1_nlD|EiQJoFlJ=_L
zB)ec&*C;eF3RVS}^cdS$w}C}zurF?-zYVI24t>ve_AeNNs6RD)ea88&NoN#jpk^f<
z%ZlhMt!x<W&q8kgI8y(nH5#S%HNlr>I}{<JerLLohF%<D$FPV7{RNy)=yDmt&;WHm
zb<c7cFU$e9ji=*I2g7&OxTVf2kiAq<v?s1L#tp?uvrF&uC%@Dm*L?F;T53!!d!M1b
zKW`Y5K@CSpLPj&(5SXRLIU%FjBQaC;h7**0Q}+)K6oD7~N#2ValL))@ty9+%tRLnP
zk_9SuxWNHO6e}0n0Dd15OcoUtB67oAM@|(@j`Z`PEiyznp5s2j^Y)pbRV^d&>Hfh1
zEpbwRP0>TCf!chS;B89S+Zv)33+rO1ogM@F@Sf*$PI7Yb!t8EceLV)v6l<iW6bUCe
z`S)e>mEUFIns{h4Lh0<k5VqJ9__184ve&N#z%U_xL+OHMxQKTugwaA~i-pQKdBL|o
z_hB>g%w4Z+1|kv=jy!17RG*|%6LO&*gazTpfAA(@{DH{q1;^9+R0rM5yQx%#zG!Ml
zY<1k<D(8;m;8h#L$?iJ(GANJ@pG`fvXv=WwPP95!ZsFDN-v04hmZZ`9?U^pz!qc<;
zFOga-n^6pA1lX+9_%bj4Qu(Fit)_;B_nQ8K+-ioH>YyFfvcO6#+$8N7L`brME+He@
z2Q%8_kX%9dTF!#jTTwrCwXN!Q@uoI9rzx)oNc*l8>+|oANIA@yvVo%~UqfTvxhmdZ
zQE0E=?nEy-=*I+J3KPq|fQJ&^b;E^mM^DY!&k7bjybv=q=v`>1Uq}*rJ?44(i+8FW
zbSCaLns;vbBTD=FXd4Z8zsH9WhrVjq2V-*Ir!-jXH!SMXasVA64MB%yKI3wm{{~WT
zj%E3&XYYziC$GFQB*MNV;{=ZW_54%-S_ZA<q@<EPLXc}u0j5EO4;%cq@&!z*Fxm(o
zSf6+g@)SQ~di9&!?a+0pF}`0G?7$?Bx_`Ld)|M20A40ire!yZ%oD%%_18Bp_ENHB=
z5!&2{4<II0;hgX|<oDF;d$1A*ZL;EMm_9Lp<na3y)b2BUhr`ti11(OQxG-iuix^Xb
zg;R&CKER3d>hw2A3jV%hSl^>En&0O5-?raji4w<{+SaU}|4r?+0T3}8bY{Nnw4Q@l
z%i-52hdcZIgUL%*QIZvV<TR9jC?|5#f29)54XoY7|35V)65_B10w$C{#O7V2)=4a~
zUkm~9hJu=0vK?*PX?8cDP#3skrm|)#_A^;TY=EBR!c4}$pSpN>lp|v=?js^L`3`4h
z9=spIu@Y~KTxUfYn>ZLn1>P3-y&6mS93^#(f63jGrwv!<_7XtTvL7U9>?4!>2ouzs
z32Cf!QziJs9V(obMD-=OG4|V6PRyL-C`l$MMW+1m^KL=TFLh=bVHOs!EV`6gT9_u{
z$lJt2kDtF+YWRv&=0%r}Vvw1BY#XcC8Po8VFX-#o;r7Ylsd2w^t^LNk#MWs66Bc~G
zYmW4?i77N;B`cjD%L}BPsvxHL64I#5?L{rr>Ta4Jnck!nO?41n(&W=J;{tRVrQ3=$
zCTFw!<{ka`;yPU5!kG*U>-cHYy`hkWTLpXqL4QCS@HBCNPAAOhrz7TgveI7O&R1FW
z`*c>KUAUsOK0mn!2H~o7wKp(ur?iGI2I><UeDc#wAj7gZjs;gwjTUOjNTNyHY>k-8
zuOIXx{&pL}wrIY8Xc0|!BJN=K(j!_)=qj2#pV#puVO_^0YC(4@)wYO-%++J{QN|{*
zNrjQ=PMjwV@JS`J&~Z$ZWf$Ph-FG;0aitpfAq{W+QK5L!a60}#C^EjNwouTF4A(@G
zjXg1VK*~5$w})25auUXA!fV?j^@#SCMv_Qh#=(XPTpJR9lWKGzX0Vu!cgV_<S#ZK1
znxi^&;3L($w*%ffu6+&hI%v(=g&(utXxH$oU9%|=i&9QhHwP6C(t)CO%0i|fRRyof
z@%YCXhjh701r;PLit;qo;?LEWi!Rhy;~dSD#!`a^MCL@HqpEY%g#%ukhk?@S&SvaC
zE9E!08V?cB{J}4IUS2-G7Tq>0>*Yaq!`dhhr|go|EMRSpQ#Rtk3iby5!kv2b97{P-
z!Ao;=z5Jg{FnXt-#D^eJXDS-XV{aHuqs6|+^Rfq4>T7RL<ah;;t;FiQLzS`Jn(+RZ
zoEaeMvovKtk<O81bzhq`<88XFI2wXN_(Rjx-GIouS^wXNwK$YAG%z@JsF#SE^=kmo
zanF;v{oG0y!}qGt5+iY#D<lGWu>cen`C>^uk=~RzZN8t=#Vqily`jUk*;s{G!uv@p
zPNL-_al>V8L&^OPSWr~w@ci3-pYF-*IKB(%hq)0TCIJ+eN-}Uko?WM&5RdT|Vd^$*
zk^{L%;!3hzmDPZ+Al&kJIHqpeR3t#-M3+~`;mcJ&1c}jOw`uiO9~wA+x^j$7KDa5)
z5LT}p@@+1N8W|Vs<6~oK`Yt-g&Z{l+@@vR}su;O@OHGFz7Ja#uAGn{!SpTKo&Z+-A
zS!~1h_EdiTj@yV#$Rh)2+lIkXd3FQhrGd1DR!us+<|D{ELVv>7N+*~UX=DM(zCP5L
zB<siQ{Djk&xGzZVd{kmY1a4iC_#cIiCu@qbBZH=I-QFE{j;}6hU&#uXKq$IZe_k4S
z;4YWr{kGq@dOkgG|LrDx1#pDxcK;MMTaM}d=SZUK{k8sVso}fY*aR#xUgU+KYM}b!
zjqW+c|HFWSTkw|`OVu(V_+NN2g1_<R!{I0a-X{2I#4}RAIs$0EgV6~!mpJbxJ=GoJ
z^c(O?LM{S&?&X%xPPc)^V3Ar)c3<;TDTkv7`wC4TG;=2;GQrutCoX{r+8nQyw?aL&
z2~~krq^^C^m@eSa#}Y|0p@YCk^Cpq9_A$t+Tu-7A@Kzb<TUEQ`{umjN=pjF-HyQhb
zNSXhu*_FdOxAo?pI6j|3L@M9SQgVM1-ASYB0w-6yhj@%~2yP(){~F9xjQZzDXDZT&
zP@>9t$*(G~GQx0)#I@=yGjz#nVCjlg`FB)>ss;6Rz+l^wEmHj#M;pFGI>?`vNk>q=
zVMmu&_9-NSsFGt)3@P%tvV~3^U>Yp>Ro4j)@bc$jBZ-~WR>|LMmv?|_0}ILBzrex#
zg|(rf-RPbx>?30m9=gdlIy}(~&}Y8g)Pa$el-~vGsEB6+7o{LpI8*W?Wkv)sMD2xI
z(h!N0ZNgJR4uSFgNFsHCVqaa5QzZK)Q(CLY`^i5El_n#1TYM9a$0#b9l@xMyOeSGK
zs8I`iA6`OQ#!L#PTOkbd@OlmCfM`@<vQ)$tha;hQZU@tYeR&D(VkWZ_4z&cU)wAJY
z_-@^$da_u>SWEqRKWnNpsc&cpBhd|{RM3Q~K!&r+U&gTH!ob3d)X1gArhpP)d`GsD
zCX=z0hYo;Xv<6ul8<8Dl{C(*Gf7K_{=Rk?Hc5v=lSh3^VUUi5(f~ndK*IQOUDXRN9
zPV`06QYoPy;xYTr+6mL-LzrYIhTgiJ;qlV=mL*md)ziTyZWqTyhhJu}g;U)HZxb9^
z<bD=IpV}jNZ4Ed_Z)Xa=KSH7v?IvcefU#&b{VLE`6(a;?D54d7o<U5t_tW(lv&nq9
zin%v_WZTn0hRScXXNNQONYDFa)6bA*BGl(y4u_M?F`*Q)g0<q=kay_{pUR=zHD79k
z<g2i)T-|ppdAsGkm^nyB-;VkP4&5wGGc0y+CU=WC4p%G>d1TrJ8E$sC_{A4N+i8vb
zreFuwX}js<L#igH&4xBO0JMYFIULHRfkIxE%XOmbs3$TtN%yyIdw7xT+70F^`>+kh
zvoFQO3=T*I)1QAFcxKO4cfD(NKA+HYY!E6Uzd;B~;#RaiIo#7KD3UlY)x7MTSX95Q
zLdc|ZedDxRQ6H59`G<>4tG#E>UmNea899cFdN76N)=eQly~v+<?aF>o2f(1t*e8uX
zg<hj#GxvH-<OEn0Q56{AkfrMaF=p65`@S{TqNZ^CR@RCk>L?Pg)^+CXIfWHlGg@@o
z1|i>2Brdhim0L*y{rFO+7p&V^Sczkkdo_S2beSbTP9|HEP0G5O*XEGArS8yO_5Gau
zfF6O@{wf?Ik>EuhycTd_@Ji5r2q2A5&K@+8F8sHjuh;s8cSc-?oK##~bfm9<__tM8
zm{|=esfx<mDJK183%?qm<$$N<CEEkYS|A=JVtj9=0x~dFL=x&D`FuQnEofee$epe?
zC2pxVm2WF+A0ET($id_%|MIhwiQ{Vh@}fA~W#isOHudQri(;nO-_4M{6?YKxA4Azc
z_RIe=7b}3k>i{Qn8-ZlU2*r2kjJ=HLGX=9CHwH_hUKl?iHy(8vZJIrU0Q^U6CM~>V
z+4XL<7A4;jB41)g`%-labUB!<(+ySoAthnDN<vM!fNM}9OArDcn2DQmHIp@%X&TNp
z$49q8+T{jk+S9(l2>mroGcM9}l`ETcS{ZerHwW|6{($voj5F%&34HQa%SwzvDoy8Z
zFyDQ;G^zPzA@%N=JhoRmWo~ZzCWX$8&&&>;JPi1#nlqAjNUeX$bz|3Dbi7&`EEwU1
z`jzQ5!2AQg(<~p9mdPMHM4AM^oH-^W5Kqpr*(2=jn}iszV8=<FBBrawNltf|tb<8{
zQ?$a6Tpgb78jt0%r$y7$rZhr<D)-qth;5G<nXM92_aH>Vk)hx+kcW|#X%|cjM-C=3
zBt=BN!^6QT%m_BwY*KZ7yu&(zUk0;gpNoR!Sd3bH*9_BhTFanQDJ0=3#tDWVZuK;3
zk97Aaq39#lvvI+-H{o|PwB;>ZD9mmKSDi1T`6`dFi-yUG-%Sm@`*BRstv(`dEF<!~
z?!hjLLO>7S_xU{Q`HA$5Ri~A+f>8xRN_Z}D5?$XiHzuXf^l&8XkIb*R(nfZhd6+{`
z{b*s)*v@{1@mO{MLU_j~w05{RZpZ+r4>)8tY8(muSneLtMs$fi*Q}+X2&-{;Ci_eW
z!iggX*u7uNWb7k6=!a&Z@w?Yx0DAzmD}>nq7iuN&@U#R>w>JmRe4p=mB;wSZB<b|!
z(Uo57OzG5s(WPAg9{ZI4=*{dgzLSf3l3Xa?YmcuH&7CrH#7zdu+QHslks3qG_nkn*
zd!0<tS17gA4zyM#F+nl)_4R?`wkUM|v~Na#W|r$s$C$cRwND#YtrI};^HML?6-&@6
z2w@pREC@KeLghG`Es6+)pi_M5<C9<dxyN!+vaNKkcrljn0EgEMxpoKws=p4HFUMCa
z06>LYieRh!;h(@pH&*Td00_6#`8Sr;?q_VODkgu0@F@CtU3J=edhs!3qq+V%yxi`i
z+d0qVcA%i8l>|m88fN9GohM=Yscpbc7BK4KO`71pRP6GnZ!t6!cY#9k=qrtmc0;Jx
zaEsVofa4NL(-;T<OIoz?QEOkV5plw#PFpjlTC2czi>cjU<I>F|%@gY`5&hM$LmN7D
zr@)UNvwOqa5@jKaelX))2bM5~AG93}ji75-$*{!kI4qu5E^zB5H+MdkvA>k`ghd`b
z*Ol|u<{v;z{HSySm9iOtzGk=t3ki3r>CYNS4e)wO`t`^cQS-*<y5-Bq^N!Z0JL9#C
zo{0dsBy9^uCS;&3qcu;g*znonT_01@b*xip$v<_cjxf_!^o=KaRT5&b>bkp!@QjA8
zFP%m6loPn?-=!qG1VOHLcE+XuGt!@3toAQ@$v#gl0987dsH4$`@=pGX{)-L-mBLdu
z#Ek|Z|Hs*vI<FU1c#u`crjvilTCdeOj6vtwuYB{PTcYKxj{dBZmRUCb?$oF0v{eCj
z;x6+86dC9^T*(<dfC;UtH2m5ApDj_&=I`d{zDc~B^`CeDFW@@N{<}FooIhza?2>g`
zf+%}*@PH@+&jjs1Rmdb|hAd39w6f9QT(XiAvAfjqmlCrOPj2fd+|`XC>~J?pMO}js
z<CZX7Xfw><KUjq;VSSel?gEPJfF#o<noK%1Bs?x)N$0QP=Dw;Vl@u4#XirXFzi&O9
z>M07bLv8dqFrVV;xf9T;*_3wn!#Pz<W=frRU@zlHOwuHogVNZme}rkPnSq&zCwXp8
z9yz+<p-F&PC#VdK4T$8`uPy-6xeIf~d5Bt<ECMR&mxG!jHtM$4Qk_}nOovGB?Dznh
zYAvv%;t`I+kWok9vW8Kp=qxH8O9%X}GwFEA9D+nW7wQPu+#Y&Bv#@pRF;xpz+#4Qe
z<fo>5OWJV(nC_%FK?hr+@Vyi#{Gy9o)=)q?<5$O0CYu<psoC{k@K`rsecnwR-_AW8
z+9*u-q<yPH_*@;nyEV(>!&@q=t$~@IC?{r928B_BbwCu(c!XU3$v(_wX%ccKkc%S+
zb4A3(RdrIY7ks^I_I&qfS4Krd&*`-kIT0<Crlx5G6S#<$i!BH%GsmO6>v6MGu1I&Z
zS`=Q%S(LhtSTlYq*E6}h&`Kf{t_}2sf4Z^{hJXh*UrLP01tC<8pAhL#U1g65D1UCC
z*y)WElo)0NhjYENdk7!Pf@Zs)d;`w?*`5)C=9@$^H_&5;EYfoMIxxl$!JhJRL_pw2
zihwOY5S>(|5iPM0xi{ff{zd4c@?N_E>tV<YFz!|s+LJnEcbj50`BKQZz#XFaYo1`}
zEsq#4b^o=)<AJU_$wDc^*>#+|N9LTFg+;<IGxGClp(MJboLq7ey&ByT8$Z7es0Q<(
z=clt=V<EWl<kVEcL<Xny?M#7`;5(`7W~~uy8I~rprZ6Z4gk5=faZ!Cveu4e44Gxza
z_B?BfJa+PS)G@18h3P<*Wx>dm9Clatc{PjK!V7V<NKiZD!Phy>p%O-}41G1V^b7jS
zamh_b;lj#8ZZ1h!XlN`;I~7jD!&Xng^~BfBVFZz^T`q_!sEs?KyNzEtxolIN_iCpD
z4x{(e(+ZfR$%kR5Xxdbt#ytA>_JPbB?*qAU=IlO`c+hkR{Tp9B1GVk;Rqi|88lRr4
zE!}}hDU_tFJ=vVVhO{3g);evI5LPzoUEc)s?!(TOJG45^m(THnZvG3c$_gCJqln{g
z2Y3JA2DMfuhQeLQ3kc}SQS_(G>-@~9xOjO0CJYhds~xB>4zAjqg8PJnF9imQ;Cf%^
z0Q&YEAq+eCI!t;zBL2K|I^T{l3#0@g9-Njtp8OFV<bO`pIXpDo+~7ZZ9znP}Sx8aS
z&CoTJAofpr)SY7Y?3ZYHy*7-U#T;a0t%XSXf(8l_w*h3b?$h6vN3E`3=2kcaw?lln
zLu+)~FdTi@c{B&3aCLrdt!nfx>Sj<joG#R6us@z43EjNO1k@26A%*dX%X_~?HC=f%
zq}L5_zj-_`%r$+156!xJ)-F>lXstperyd#@Sh)+wn7wq2qfO8&9ai`<_>T<Nmw!cW
zNxzOZ|N6hSivM9E?&kj2Hkqd7<!sGP{YCWJp}xqe-u-$hfWIGhI$4eztQ<vbkgkS~
zjZW?wT$C_EHg-bmVRXo7DrN816PM2;BeH{1IDH-k>Jy^GIQk5B2Var1y6<nBaPf4=
zquK7V#<8`iID)H~JZqdW<xlAJtR68V$WtFo9!6{f%%L$SjnARktOzEmn*M7}qKs~}
z@?Wm(gsck@Fk6FtC=PzmEeGwin%BJ$0vnAy+uMgxSJ91cUv=!Ez-WdROLrI-UEmU|
zC(6SG$$E&Qr{ZnC4vbyAC{a>RK`cD${*W$4GN<hkxSjVu`t8KqM8E*ZmveQPszrLT
z|DI{d8_xv)3kqMfYOdTmS9_gFxwQ!nQ+`M{p6zBY?BM}{d_eAeQ`=nCPUPnwkGd)?
z=oKkg?dP5qqwC4?0(E+6p6%KSNSNCc-t%Ui@}Ng)gKL-(`E`mQ+?OI6YFzZBf=0^T
zpf2m^l#Jl&KxUQwdOJc}c_}6dv&WQ<5jL{}RY{471brWQTn};dmXFEgoy}Z1R-_2K
zAX?hyADEBk)uQ50KEr7t5<Oa|6eCwqzFA<^NhB!M-pg4OHs1J*=U}qDPA7%kf&x?m
z6vN`_fgz=4wXo6DBiqdwWyGq`xs@@-<eI;JxO2XaiWmdP%5XJB0j;?mnTz@GzDtbP
zz$tu6f|x{V4C&B#5`=HxAbd~O46Tsi>tal(AmC*zcSU_;vGe*Yg~}q2%qOUCkIM3`
zK9k*D+CoaCSNN(D>#Yf<(ssKmC(gvW4W_kscq(Vj7{I%K_NUC0$OZX9Km-$5@-+FF
zb`G#|jv6r43PTUC$#z1$T8EaFqWD9j7&*EKSvON&FHQZ>Q#kSWh(K{<Boapoj~Qd?
zX~VAvn(ld!d%uhmunuxvLaWuuNYpb4eHG(0p->0Z+U<%#+gXD)x~kPKAD<-j_9C6$
zY=S1EArx-=z0m6bA6NO6CP88aOB%AR&&o_cth7UXX}wH$h_W6=ytCAQ<}8E*-Sylf
z0S*M{H+3twc<zytWkmwg+VZDWQ+S70@3VR<^Y<WscNwI^$yh|#4gA1DKljhc7hH7o
zzxO;;!04?wtk=}R0R-|d?p@l<TwF^67r%?%_V^8nISO?E(rt)X46#N-V3Xu-VE5No
z)#bj{^ZM_ZDt{Ht4$xu4*$NwCj|-3wJJB@9yBF}0<WK)9f#3CZ9WkEHtz%CpNN3yl
zVgph8cQU0W!oO(uEW7^i);!?k3=vQagANks#O)(+W5rp+%}jzr1lai<(0ZT#S%Gwj
zh^t1A2w$+V@|Q_t%d;HZImpE|N^rWuWw=KJs?HxfJGfpD$nst4e1jRTYFf8`8TYrK
z*sIH3c=vKoa+{RK5iYV=v}XHhd8M&;D4e6~veM_iwyfoTdv3C*bopknq!V!FZi1M^
zU7h6jCF`5QGyA_(0i9QFz2qDav8KGkci$&)b6s^o1K6$Z+NQ!~`_0Y=<cYpp2Lpnl
zRg(C0OcpYtD<E?RP1Blv2ETH^^zNXb-^EUrGH=1W0NVknN94^5j9{C`L-ThpP{GzE
zxyN|zQNi`}cT`XYSJ;Go@#eh(t`?oDQyHRB@Ah0+qw!1$m^|`N@2&V>s|C0F?nL81
z-u^Sd3W7^6tG^%m<zW$N<WnpJ-W{JgPT{MW&1SF$7FMeD-A_GJeD6ZY7zwOPn;R>|
zx71gIj_0gAr%9p&j`-;^?*^@bU9DB{F2nH`0mB=!C<R5YVc?j4wI-(C@oXI)7=xIy
zNZUZ%%<rr<_*!VlLQy&y$&|J4GqbxzPS=q6_3qD5VJR`h?v-IdK~M3>B=<>vvL;)i
zPW=)3RGG$(vo=jxv1_knEmca$Cem-)>`odtNr)(^Re{Xxki4g;#iKgaHqf`}j0Ru^
zA$mIUFxsl(z5d|TJTlWv;0nT(yI5y&>LONmgYT+*Gm1Q%!u?tt(LSZwliXv9#a*dg
zR|?@WuSdR>CcjmM;_pC?kthXX_}d5JJx~@~c08G;yAGSPnhyPi6Y?@FG=*L63y&Q<
z)gh;{fi4@kKhyJZYWurWBE`O|)Mn?K@o+4uy?5J9KmSGQ-hemxlcejKc^<R?9q<0@
z$na!}MTi$OEQsy5KdaY)6nS%^fT$02^B^z3sO={x3zuk-zcr_F*@V!?jjLUIC9ri8
zAnEL<pdA%5mJF}@Y_9^P43EPJn|qP$74|tLky11g2@xzN?7K68WP(~3AH#A>&<XLh
z#Uh}}xBKzYbvXpiAy5de`zLs*6-ZV%3B-Dlzz>w${lT^`;Tc|Nawr*~X<)xTkVT0S
zXPi>48$zS&RHW5pji62uIxGztf+u4fC<hUMr~b#50a%|E1_s%qh}s>aonV`Xn!gJJ
zs|G%v8bBXYkO*~l1H~t&uL>S}L~5(+D^Z#arr*Lup5YFze+!)`fe!*6nr#uCMj<W4
znnKju4D7dEbs+j%v8-@XW<`(G{b`4}M1qrW0u&W4vhwO5qq*7H=EN0xU`-abmjTpL
zd%LHktn2`}*J4GcQ3i)aF<F;Aa_>-s`FuP`jRcEER-BRlyNwDZ$_qS+EdRZBS_BHh
zjS@LY52f?jn8mJxO3O&nE!ga;BQd147Kke0I<!Naax0d2$p(1Xr-kV5^t<FLPa`~j
zriFPJ@3^<>ad54uF91#UTXRlN8t$HIUmM64uRCk9EG%qQswW(ZE&@7Tv?By+vwZEm
z_&_F8dcS!P3;12v=gkTF^OqI+Z6m-0M=GfG<-payT1GqL&61i=_LHjk>b_?CMTJ^*
z@}~ETY?KS6G7w*4g7HY5BVEum3IY@QKiXu+#Wj(M4Qi>7!Ql8}5!D8{qaphc?p(>S
zdD&|YlwoztxqHjYxyKoY(d9GV-4<M%u4)girO`(jl;H<_$Jk1Mh1Q+9!F9iqd`kEV
zud%+*$ndx=q3+N1d6!PqBy8a9eD@zU-Gt{y@F2NU?>7})H<NI{%F{7K|MT<X=xfkL
z*@G64fII=^coSQ2x>i7G>3kPRe$n~iN0e_*DEnK)2p3cBXcp78<93$bxPLhAUgm_q
zMvr);=OL~ueo}-a8EsE5O#tz-<wCMa#>)HoSUe5+=v}!m7%j^9`j48W5)aQsyURx3
zp@pyc$6i9rUcdwPvJq2zO&j0sCAssPhHuNGD%ljDV2`!d`vCT%!6;wbxi(jVulnM{
zFlgf*kxl@yYtgj-=y9_}`P;bYa9Nze_>Z^$BfW2{Ne}wa-19xo;i!^tjQEtCJQR)!
z$ydE~4fjp^F#o(;(0>kJCmT4JfjgD2dL-np7GmEs0Ds6{7VKn##i}Z{7-NUiC{>u`
zXmZN)S4e{J(g@#2oI4JhX>p#WN+$45v-&*QHeVC4l<nFpB2Qzg0}OEYu}y4R8^%rM
zDTWPtjVB_?d{it5xUorz*rI~T1bR*ILPq<9)I9>+_enWu<xW4EDyMQ*^Kv8PpHM3V
zd;q!vsTyfY@j-jO{QBtBHl@z>coHC)|K5BLW8wEceU1UV@h&;^t(S7bF#D-YAQ+>=
z{s-7jr?-s-ynWPXY2BDP0yn(esgjzehs8n3Dm-wue0hiC1x^uUE^uUAC#(;u>h3P1
z+O#@X(LxbISvA{p7O>XH9~Ir|;|iRhp5>i(0^h<4Fm!ocXZ7eJkC9MVvC(PLfI`&?
z7FwB2CO11h$#0_q;}cDXv`V*Al)uvK!4?IcPsB8u&vN;^#mRBKi~{jS?()IT?^9bP
zorx!e3RRiiT3rxvJ(bX}%9OO$UaR05MY-L6q=w!=aw&0FE!Z=_k^fFeOJdG=ppY`e
z^OfrM%9X6*xO^aSbam4xEc|&;0hbF!n*j;<(@plRhaZdr{qtviB1Qf05QT1pzDs-|
zqX_SsA0f+RVX~8-#NsKrJay~g$~5?uz15pU@i@&Z$)-NT70OZ}le1AXfJ%}f0s>(<
z)JtEM<lvG{Te$~oqGF0mCNeV_`0}yid}rjhV(-mDYOKH)`}=Qik(|VE!xqtND!=+_
zB5GFl7GW}sn$@(9H(Z0wu(8pRN&&w6z}L?T3P(PVTja(&`L}9lEYsCh23z6=C0W>I
zM!SyHZTOg*Bix_ok*GBuJFgg}S@7y*e6>k7<8x0f1L=CRjaFJkgkFfKsA`Hv<YZ)t
zFj}B{FkT)HBO%f$bjY|3DPA&xu5QlF;$k&&1KB79T)9MJlTK+z%;d0NepI$@g6Ts-
z!1eFE!8*7RSF)vf(UVmM3%Y%{+7aUsEP$4=S~+}ohB2PnnBCg}XOLpQ4*KQhU|sPC
zJBGIzqu=jmraO3lzExK{{p3ZT!YP2e*-0~GUrhUAT0Y#?9)dO<Z)7Hakz;X9_BeXi
zEWjLXkY$>P4P>2}+~^2JdA}MOC62zi-bclLRq1+iaQ-VDaI%mn95A{z^&e2ndV-_n
ze@!&2kQv~3-mPg1mXJayNKMHCEx;(aY%+kZE0|RYH-#d8u%Ku{-m%9aqNa>TB7R3(
z9}v)OA0O(*a#m@r>XdvAeWSi@Bz#MN@RJbEe)bCM%W*rATyC%!${GLN8UPWn=X1fp
zz}m=Xl?j`KDeA<zvFZJ4S9HUoBB0~D^lztFd7#gJPo&LcR?Nd;`Tf${W8TzmOjP};
z2`1m=GUvy-=+5b*KsPJkkQ++yv)c{Ojk4IM!82$)N3cmmOO)P}?9=J1=6JtLwjwH0
z%E^4WbVzhoA!la=)y|NnctQSNir&Hw?622s_mkQD0qM&$b1(0MZP?I<O_%ENw@ptE
zzbhl+Zxj!Z&g+=b?<ZsX@j(|+O`CQl{0Cv;Lt~w99>7+IZ5ar|HkU35u_z*=wkZ&C
zvB8hAd2xvWpYRU`j?464!=A_K#Nhuj?8*LX*mF0E)S^}+`AUx*Q#zHn!Xa!-mfr^h
zgZW)n!}l45C^|{lH!M!EmX6JmDPO?5$vxnADUe)#eOaB!nuu;W^!4ew4wCI5#OPW%
zM(hVQ6j~}=t{bU6Nq&~Ir7Ciq;ZsacV5_Z$CHANYL>!!HP*9i_7+DX**(mQP+BWB*
zF~)?2v8z44E5ve`nrZ)G_D?TEH#&s|PI}Ama1PTMt3{At3mR`)q19@vxy8x;Ru&q2
z2;nBy+}%TS7J4{N*AY=yY_Ai9pB4M$55O#~v;>E*W327N`*bR5n=M9|S=p?&iJ;%!
z+4Jc0M+~doqi^&R<-uBkcPFaLPJHr%F~rmbVn|p%+)T@`rurxby%5}<3`+N+CHdM&
z;ec=KD^s0<WE^?BH5I2)Qy-=md|;Jy=S<$}jo8j9I!h1?3>^U^I#6-yMi)^_7KWXr
zlI(a!HmT}0E}~H#`ry1YG`Z}@Syq-8Z&ojpX>B)4I^aFNlH)SX7aP1T2ZA5m4x6hS
zFCK?-62c-ZJ?axNqJ2-za`<)d(UVerF29hQFXPATW`Yh$Y4gal^t(j8-l@$hNA;z9
zizggr<Q%GZ@sd>@o6(jiURSbLL`0!TnW%7jw1?aWJ0H?Gnh(?Fx$H&wbX)Cl^7wK~
z>rf5_+dn(N!ypEC9FM=JIvX>i21jjqb&JU+ahTDN_KWDxInHkV^t54au5OQKISVFB
zRQ+@9T|i$Vp>k*9eGEMhD&A4W_|oJI+&9;p%JhFs-D0iM|K6gGg@K{JKbq8D;uVU7
zER5qP|E+fW4_#)iJ;u5@a?J$v9opJB4b7oyutaO{fLIV|TPeZ!V3a;za7d&_YW<ns
z5PuYCGz6kQcG9kjz}pbdHdZT0bObUCZMx7I9@|l?hUD%bRVL14i#dghkzR)ZY?iz*
z4_}J{aKpaib6PlMk0=#QI-2<a>QngH6WxW5g7;Q{p^g#s$_jVsMsI?D8WfMJsw$qZ
z%HgQWp}CEY@x1sUUbSD#XqgIYV!(-$We<%`^`R-01#Uug_r&GiN`r+gZ`I6j965ZM
z7>>G{N6&=6@xFDd$rzR=w@o&2s7i;ntO`VG4#`UMqiceVEJu&wNwfVvUFE^<GO(RJ
z1auM+eK2OHqsr-;9c``bPJzI06bnwpl5o{wLg{8UQ}bMFaxS`v(^*Lib5(w*v8&3a
zMF3Cyknw>tc|qY0OHPG%V79oH5w61FS7pP3E)crWdFQa~++f|}ru6Xkcy6LqDg)%l
zOY;!9Qo+z-<tTnW*0xhFOquv*2kfAHSYCu@M9fx&M?&~65lHZ}V~SkqSl1g3;f(fE
z#mI)+gX8VV{HmahpDA{h2MXa@2Q&5~^I6X~ts}Vym$9MlCS+0;+vm-T?~B&!uPL`j
zR{Z{LR@~>0=ynUshmRExP<&^zMfB$$`oUc>D9*4)L{7KWcIR%`zs<YokLrQicVD(D
zzc};lbgIN+QNR4K!EgMo9K!EEvjS1#vf)j?eOSaf9&^5W0N|GAjR2HIy}p4WMwEX_
zsamNgi{*Gv=Qz7~t=lliQZC%Qt(2O#UL))t6~&(`x}NQse)2V2U@LO>>E4u_vN$d&
z_z)8w)xYH5Os$t?oYR(MMk~o#be#Ki9++FMHx{WxCQ}a)c<@c8-Df1LG@r}+^dB&0
zXwJXwcEW0Pe7&vT^>--A6OMlK(6~SFUdQLUDKq_f{XlW?3r*_y<l}{(jcv{)Lr2T(
zy>d=|_d@QKuw3-l6!T#F<EX`fX-4^`+Y4j+>+Cod<Nd`pvQJ0LyjSiNc-v$v@g(0{
zA~D6~bf0{#gD|yH&Hyupii+BdY*#h+N9|N^$IKdv=Si9A)}E4lL&>B2yXTtE2a2hd
zhk?A&#W8<=Lz<-i(z|t@9jGQJNXz=Uf^Zg?1tAAs;;Yn6yM^&ctlSM=`w<XvUVMgO
zi@*h)`G0@*pT};W-w-IFZ!x+=DQlA$W)!*VN*Xd-v|x+6-fS@U@}zLf8|?GMV_!>5
z=0@sJo`NW8=&D%GYbqA3`VOo#ny>b<kCHw`!@u#8Mb>OTk0Z!*yzvsqs$Vxlq9fUg
z#iRP=`5kTY<MAiliJ$*eFUR~M8X9TTfEYu8fiKPzF|9M`oM?QotM-+tSCgk8IM7Ap
z<);f}Pb|lN(30%~m+`FZ-MF}#0lUG{Pzkaba-TUCUPyQPz4xQar^<CljiFaHiJF@x
zdBC8H*68IlG^E|qrE5kN8L;sYFWq(m@$_=VpMas$f#C-a+S$4!ZB^OO$OFUB!YoPq
z{fb4Z<0TaPGlD|O4Y<KP^HP9j%`o_v7zZt}rawp!fD50vu$k{WpYRF&W3Vq-kLVFu
zYb>DN?G5D#mgrZ&yeToATy5oG4l2ugYpJus=zUypTV0~Wzi(^*!S)UtOos@5(53+5
zI0b4ua7SyKMZouQe(JW;a<p-jj}&U^x7GGuH56{aP30nixp;S@pz}g*-mRK&HFk!{
zCx<{rddVmN)r?Z+>rnKVM=z?6im%O$BqUr5J5)7n6x&w6R2H_Q&~swtwWn`U8EDTX
z-<`y1s0Va)wIz|T8mu@&R2nJhXc!v~!?W}7tO&6}KviZGflZUO&LEtjucc*VMC|Ms
z?sk`7`Mbs(XGf7Rtg^EG0jpm{kV1~6|HS1RT^SI9BnF}>UID42YF^N2nr4blc+yS~
z9Q!rpoc?h0V!IY|#Lodo$pqhEMg2njG3Ehb&%aIe?reyUz(dV1z$>%ytAgnJ`k;H+
zOa~P<=>*bO{Ik<}Z46H8`|gySHgJeo%EoxG*UbE+qAHwM94$$u8x*y`Ys(jFC%$hL
zg-=5FmoJ^Bmpq#(&G4}=fLcl;J*uOjjZugN*1CIuEhvOMBKRpwpt=Ga1qVnSZ)`@*
zz!Y8Y<;pC5^>4LwqZQvnXdKToh16E*bgS8n)M=b$zhG3X<-@HIahYTIH)D-5$F>He
z4bDHNCvY~@XG~UQ0B|Fj(}%=(ZsC_Oxhfm!!b@7rl)92hLOK9mWA`UUtLD}DUSm8S
z0B@eghv=PCb=Kdibei;S)+^E$9<pBh5WKFJ`Ux&DIu}GfuXdhS1K7o~E&|qk*$Q@J
zEvu|m_?3iO>8tIAhK8>WjP&$<Z5N#u1ZGL{VBhYhLvg&b-30}e4@a55`*naDibvrE
z2);k9sG{pNc@v(u->E7ux?Va~L`+b_60kt{SAq^QY3f)bwgC}P&V<$P1~aU!_5o!=
z7Zd40Y0P}9bj5Omk+=~RACIO!9UHuJlYCxHTh<EtEV}OdDj-1g<U1tiyZd8Qb>e8h
zW=Aa)Q){Dj&+)0P`VM4f9(+R;2y9>DTXR?>Yzsu&mwSOCWYY4!*Rfls9G;r8;N92B
zzF>H`{ms61nPTB`GX0dXnHf_M!(FV>?sju<em!&lAxGle?fdQVM$cM^tIKSz@zv{j
z{S~*V#;SpPF@-DJ{od_k3PlBhuIqh8kc^)G2G*-^o5SbXq2fL$NVNGZ9?^T+d6ZPi
z?if?;cR4d1L-B@>*f#_33iqs|E@-CCGkYX_cQ9|4r-7;sd@F+?oo`v;^(A0ME9cB4
zjcQXH%{SS{c)f{5(#bmjUYmxJ7q5?svXI?;Y393_0%rW+D;F_LFM$o$H>Y=t`&>%j
zs+_mG*9(qQwu%zc*SqJ1ochL`dyj$^U{jah()v0%uY=-33a)N8cfyCtZQloz;$*8J
zH4z^?V&`++e8;cD-TVIluPwr>3;mYw(#QFo!!qyxC+z-3=*uxB5I%RcbG(U8m4>mX
z$wK!C8-|2L68qoCWk}^tdlZ&X=_;s)ulaxe^BF;UZ1}5BVkH1Dkjb39HQmF?<zZO2
zEfw-`B(ymDY1h-8%WvtVRcy`K-KJGzwkY1G#!~#UM!E!!U^*q{7|YW<eEn3!=j@MI
zDl<spcBR345`TWawbZ^FryI{~B18rXfBL-A<69}~h+0ua)8D3s(lansC0hMx+wQq7
zBocHE)&IG>IIlnFICXa}a`;U4dV-}=za}Yd-;qZrsGgd7x32HUr?pO#=(8JgQ6b>S
zT*~&-CbDQ#^E7ey?|H|u_OmdRM^7hcf!9l~Nc^uvPER>KO>eR*nJOP7t+`8U`R48S
zig?yOmXxGpV3{t4HUwNOC>l`ef~hHCN%&IJ6%JhP)Iqy1<2*<N-0)x5Y#CwhrSpPw
zJ_lyS6t5WiSe8{bb9A~}QkrE-Fa2(H4#CI&IIzyt$A^35tj*HEG{+F8;bav+ngi%`
zd*tJp%E<J-9invi%2IOeZ|uXcbiChoHg6qmz{#Ej`kL{aer~j)q5Fp3BO33ii}G^_
z+kvUH20n;VpmI$+Qp$f(){#p^P=^}DTz|=@Jtg?{2YB*$0E?y2i@tKoAubmS2L~oC
zE$x9iB;3Ya!4CAX@*KZ%Y=RI3Cb+l%qtuZyy@aX<c$RrV5(+#<=F+54w1H!Cl?77w
zR$kvslyv~s&)>GWLHbSrJE$;(-xwric6;u0p$ZQTxhi*Rt1P{&5O{m#zl6v-V3GM&
zjNh9#v%4z*h>1z770>j==Tp-PsCyWetHTdMkWN2jqNrn)03{2*RJZ)}<)SJ&>C#KK
zv>X79mIX%pWk$gHAs%l!z%#zrlHAa!v_)~~U8L#iiXBFuf0}bOC#dFz-JKrQFCFB{
zW^b`zf=J(&qH|Tc^Z$y?tZTU@4$bCrzP8K-u0^BlK3t~kjwqB|L84@o?WEr7$PF@}
z7_%#Ra2Go77sNWjngQIA>}Xz&)9o8F4(L)>7AmR+XS}W_c`tG^g_^cb-``&FmzL**
z-Orkv*uUQW(!khkRP30<)Y@G(oC0dDWGdSnR$9=7&)Xw4D9+&hn&UCAc1pyz%MtJz
zfBDV|s@t>B_IbO58BBIgj|eA}w@XSHoJ~K<{^3~_w<1BjzR0s!{G!X+ph^dP?7{m?
zG{MXinCkFwJ*KE{<EuXLymI<JIusjYMk$0WNS@>V%F3W~owXVF<8l+6Tx=(@e)5~P
zwz%bLE2hu$u1eK2|Mihl=pwdBdc;<Dik>?-V(05Dm*xHWIxH-qBTF>jvzbHJinDVU
zJxQaICpF*e5_)6W@>tR(Q)}k)V;b3(!|hRR;IQECVaS7kS^=ynpT7viHRBkzo@X@b
zrpHuwuGh=m(6MP|SayedgXNCk#-dOq#07l^bSnS#qf%Aw&XnK_h68sOh~s?JQE#Jg
z8E6RPNB@ledP7HF(H(S{vn#kc7hqA{7WXg;UX`AboV>kUlG7c&KQ>|d>gyL^`wCCp
zV85gs5*{w4?LPDLvqKZwOkjCasB&w4sx&72d_UV!?0khW=)vByV(Rh0ar_)|gBp}o
zkr^u|CLnh1k88f{jnJAub?`bEKfGe}Nj|{dD-e%SmdWOW7JqwQtXerX?au*pBK$gD
z)tp~VXglwGfPE<Twr(F@8iNb_d1xvA!;lSS>*b+8L2h>nZK}%Yd~ND#_&e`f+*1a-
zuGcOj{=%8d{z2<k+k<xq!+<A``3Of+D~%2JQ)ExkhudC%h#Ow*F$>1c8^%+glUf1!
zY&Y)%xwfv`9hvqQISa;lTat^H4C@xF>gT1wzi?h(?YGp?BJTf4`CB~4bHS%;In&<3
z{_4>vMxVb+*+j<&q!LGtBouF@qDPC<_%OS@0KZ;MrRe_FS=#^&)&Cxx{q#crj?F;~
zg&D#B8n*v4Q2*EL{a=q=IM4*2ULrI`KZ3&8^BT*MkexUr&M+dh0NnVjtZ46Hiwn;+
zl>8~tdB}mxi15KPPw^iw)&o?=)>8w7rnh2-GH@Rh8z}2M!G;o2iJOeKLCp16Lq@Fy
z*gB%n{r)T_+A=sOXT<WQ;b3ZC`uB-tYQo;pE)hfXr7aKT0=Z5Vy6g};b+cl=oNM{T
zms16bIa7?EaMLd&9+FcrfMpf<vz*qEhDPK@<UyQosd7cru@kxMOhI*}N2$E;9`Ky2
znyTzXi7q!kFJ*@!D28+}H#n+eN~}7EHv}3Gy9y#dc%}Lc5w)V3=6G;;YE&1noqor_
zP%D7Ei9veEZAvcS{3NiJs2e<_w;IZfb-2@x?w)VjL}PTT`90R@svM%7hZ<2w$$e*%
z*LsLFVUVoU9on<yqM$5T&T7IvbQOJAeL#HOMy7)0yxu*tBOGwt9Ia&_$%s|O(A_#=
zLc>tSVQVR)3|Aa2O;WiMIJB`8h_dbHdLK@TGyfHadZPmhzpmW&ZlvRCb@!Q!Jz7Zn
zkPDy(i5C%ZbieYtq={?@`y~R{Q}ZO+px)2`rGgcVsW8lkza$V)bM95&h-<1&n%a}6
z2!{}NW6i6a1d7UG(0v_?BNtDf_J4pnhYv+AK`-4>^Ya5eCBSK77XAVkZJ4k1o#^cq
zhBPdf4XM#bI-i4d0w-O{%r;q*fi@}c7@RKl_J;)#8Rhe}gBUWUvWpGyW`BwW!U=n|
z_tfzU-5V`PLU)Yh?4|CENnb}FB6r+aL!p&W2}6QHSQ}w0Pqm+hSyfNzrd8}P#Yw6F
z7Uxl!O&ec$)MWga8&h${>C*u@=^<M`<iButyR#JE#@AOpk4DYoHxW8jJ_J--fy+ka
zdBaTZT}cW51d+t7Ml_~=sh~4Q99B>yAwfa-uJtZ9y&HjY(BqTjh1X=HaiDxox&=D5
z96PreA!9Qx9-d(|hj_~=0;j4jvDa;!9qfX-POD=NivWPfx2Bk=tf~P`z49qF2KpSD
zw23;B6ij*1X#$XT@B-@8*#XtovOV3C?Q#B^rEpk3DeZVxC;THWYO!Ho?LObo9^+_z
z%3e&UXQixM;=QuU)0TqeY>oe*`QKdt3_xJZ`4_)-cjBW?;7mb?T>z#wA1Dd^1-l{X
z20)-^g@QMAP|Wum<z9OciWIR<g{gJ1VbDKjlYFblwbj&L7;Ze+4J_%o`Fc!2-^Ne9
z#}t+Snc{-kJIsVy^ivy{`MR{#Sk>3fK#)!Bu|l3}+ZdwW^l3_qXz4+DthI5d4Z?8V
z`Y+}2aL&Kt%$lRa+0+I4vZ>T*TiN{C8yIl;BB%`%{HP5O-SiA#-5q?&0HTsO{~x;E
zI;!e#+Z&ed?nb&Kq`M@f8>B<2O|vNh>5x`HkdTtxY`VKq>DY94cjx={zR&%gbMAef
zKiOlAK@8?vbAD=??TTCW1R<J~UvJM{W&ivcBWV+i+nFWjI1qz!v~Dwy;s^=2FgDZj
z-Wg*?T|Is<oz;B-eKdP|V0KulveQ?s0Qyf8?3QSZ5s7m?>+=B(UoB5$^y9bf+gZNE
zG%b>#6xF=lUlQwM{aA_(1M<xcE>F(Gr`-qkXZUd1_oAN<t9a`tT7!76NpK+#)?yb1
z?2+?Zz($`>Wt-cZs{@Vas1gA&YhS6%IOlb<7GaWCH@rKF22GB)i$p1p9b`t17t8uw
z?RQPLkGYOn%ch>JXJ_v7diNvO^6v9?W(bv0&4t&Ib5}cGqC}5>v`yUZHMQyFEazN`
zDi7p(h&&5Uc<xIrRkezG{tJOvX_tk==n<F{d=7|urm}11_&3zzKQ7XfXpQW;K3}C1
zF3Z<W`1dMsC_P8KtR~ryP^s2(<hH%np%ZB5T<wxrtsfc4Ba~v<M`>U2rfBHCV%vdF
zO*XMLZ>@@A^W*bk4flxe(QQ9Edd_=~NM+7EUaNyTU68@1((1v3T=-_~Yw;p#dgZqY
zgE#NF<?$j9ao_G}2Mk<1OHYLKBR+l!=Hq^EUe8Hatx<1*afZ&uy}9L#rZ7dv$Myq;
zh=g>kOPoXhJ?32smRx(N3&A)&I)4b2T-o;mzL1K9eULJX9&IkZjVQwJx%TS0$2bki
z+oHJhv`a_MPuGLU#-69e4WK*OqLJ@NX2T9G0yY$7E&E2seo8b8ck`>FRI-8VeKF_`
zi>A^Ynkz;Gf7txIx6cm^QuN~8Z%9`MxLQ$xElx#4eq^zm>8xQW5^k($dw6#Y<}ELw
zlt_rC`#UR;yN~d{L^vTO-Nsw>?{#0Eq2{1#IjCp;%<Ry?7?2l4Xl9O6?J%*qmbKGG
zV0zf3$na3qH}>k23U!U0XU5H7G?-QN{`&hUH6D3G(m7TvWgsJ%y!0*mCQaogCOhu8
z!|x#RddFLs_euyKVKRm}qb&)gb)Z4DXAGT<)g#UNUH1*(@Wmo!r`6nsr&wQG!(3ox
z(RRr)ANl4~@TccV(?l)h`}gm^=x?$~;d2n5Vre9)-7q;gIs0ZRtzx5#?{*(^8sKq=
z^ySRUj0Inn7R}5dDjC`ih^9<fv%ECvs+csB3mDXI4@Vx!*YyZO6vKM|8w4-BkM<FH
zqV?TMqF1#x!SDbA9+Jw(!*n_8Whn%Xk7+D6a+?N&^TV3h<>dMu6_hsqq4`K-hC^W0
zIfEH(-1NTH8lhu*Q^;!Nl9=h(y%q^<xuZdBntn8e(`3)fEU|lMhQ|u^I=nhAL7ZU1
z*YG38*W@jDE6K+T?WRwyjtdI4)F?E56~AF+`85|c#P7+?%?+SIHOUmvDOE>&e3A9Q
zRg_d$#5T47=^p#SC(jAeap~*0sj)7XKkA@|(|#H&U^$MplUwy8to+l51+BvcB88@p
z!n@-2>oav@roywWR7SqB+lw^RF_80b*Rf|+a)*Rwa)yv1=w3~+ny@mva4UM0?y%ti
z5N)v<ghI{TZx{{0!MEEb4NH$3o5lQJi0e%6SmMkLHVf}%j=u{od3QGqv*9#$hlk=-
z!E8#|f%fH!I1<)_Bw`w{uKJ02O&m|QV?wfEIb?GnrOy88`kp#l+e-=3l$q(U)Pgo5
zc1h^ee$M&4xd>M&8;;p+_UxJ1emIOR;rHw>cD*nG<y`c7#ssf!!;Yes5^<KEaY{|9
ziQ~m@liGKmURV<One8r?I|n=*J(q25%eP2wFH+h5xL$G>Y!|Aq^&0Z@eHCM-)o{9H
zG#ZT!@zvVEe-M<g{G`uWB+wUtj@xW~Xef5OL;q{;hn@C(-lNa9$(!x<ysIMU)aoi3
z&e{Oi_LJ@X&JHOM>u=(V8L{Vodqa<7(HVRTwKQ`dswEZoRDp=pW_nKTLietahZnM>
zN;90FKRqKnW%)qAE`%g5`hPo+_A>U{-Aom^)Q6_&o!eYG4@>0fnhYdn3g7KLNnU4|
zTx&i9xNRJ;-e5+&Rlxz<Fwe-T-M#$9ZA%OMg7;%B3)@xzq-pKH8%emr4la4%T6?nm
zHm=(9uLkqKLEOLB;S&at3$SBuHTMydRh0J126q<gw48l(M$x<^H`T#{KuzQ$5bgo9
zg}3~1{xerUNuS=anNo=2%eUlsLm4-Cy>`<oY$PN(RBVTcdA0qJII0#2=}=SVi{nVe
z;L0#We)R?$)~YCbm-Wx$c!dIpOTk_6JU?wXn!wnCqZzAR9K5}f8x*v98b7HCXk;47
zwZ-=8t#f`@W${`eN!+!e!bxkQGLY^<SQX3(7G>3U!xAIB1Y#f_GMAHhe!o|umRrW=
zClD;4+NH+ENd0VItQDuM?scXYMli0pTG7Kz8Y)xW4Z=cp+;0D{kI>UTt4@+|hQ_;7
z1#D3|{4VV<<D`xO4O7(&R8D&G=FG&}eVFNaj6SxZ<IEAHrgh<Ua8b`bp`Rr24`VXR
zmkjTiwKo$NC`h4Dm=Vd^hTmUrt16&APua9Qy$)lcW1x`Y7K$lrK=75b8ZSb`T#<;`
zf2Xt8Z7I^%Cg4jk=bCBy@W_q1KL(f6qSq(n{OV6{aiSJ#s9PqM@dBozl58?DZmF;}
zW>EGlqBBzWR9%q8zPF=^H6!&s0|8?)HRisw=NOb$)XYP8&%U)0h?`n$FfnA&e37-l
zfrN~XKgJ}bQIQp=%jKm^1j7hV<}ERokq$mRJ@vcrkieFFa6wQT{2@Lc80f}D^q!?c
zgS&LimLn)Qn5R}>ld?0oj)e=z{--oXvMMR3Rj76Ro;dgWP`9isYLSC>4;50PMw?4*
zQr;SM#~b*0`G-eT{-?PEKV2L2>yLyDFF?H&a#l(>1Q_ta;t}&DCH9GhefZpv{icG3
z%S#V=6bi%21ED6S2s^l6!P?PLQG*)e7AqY=Pqii6sUGsO8qwSgOiY%T7PA)J;TDf~
zmp9vz&uDgBP$o68NEhn{GFcy6zzex{h_>LqxWQe-BjB{4SlD%25KF0{5Gyh|=?lUg
zw1U1v6%>B$J6bhWz=#W}V_PEcD7`LySFK_?uH=d%exb46RU+Vdv}bc(b)C1iW6*1=
zEqXao01}xtH3U_!L*j>%v!Y_H`m1keeGM<kWv>gf-(M2-u+{4?IyWtwd9Nb*$xbWP
z?$6hk2Yn$j@;B;Brrs;$nbZ?T`&xTaKTLG&4<E9-yNllW;2j{}m)ctF!qtw7q^0e<
zdbE3exBWFSGZujI8=w8WP_(hXM*+p<Q-5N@C<$8fIrnIJUg9`M3amT5kPAHLY>7N>
zEOzAj?tU3?+PHl(yG?UWwRop_)cldM5sQK4s%hVu`<TdR+U<EL7^&g7jmmwx_Uhro
zY7~3GNY*Y&y~Ca)CkMxwxq-+)$)TiKz(jzfdXT};Zi}7G-TmQiXWOWe6|fLqVP$e+
zWad>WQ~%7a*J503y1;?m$7V;b9!&+=xQ@z79#O|at`CEc4;U>MYZyf(TPaSTe%6Gc
z9XA|K(R55n;^)FPF^1boBWOI{Lz?QC?>Neei{;d=JpG!zdD@;nKB+BA&R@;L8qF`N
zhrfqY7Z-~<=8hbEP)@Ph!Wf}tXLm1j^wcZ9Kl8Tt-zbk?-M$+(X}zrev?^$}Ua3I6
z6@c<fxXt5p{C=qKP8B6t<N7YXz3cGz!g~9Fm7u)SLQwg+mub^`)}y9#y=R|+kO*p@
zDxw(wT{)5`mYtgs{bk!r-t+&W&WI(!`1{k&FPxe-r}P|+;#!&eaYj<5QGjOi=Pu41
zCbbx$;1bv!a<@64w-Pt+Y_B_gwy}|@)?I8<gB;^kn044Jm^Lrri{5jjdhlPj@7(_R
z(@$;nUW*8tT5Uo5c>zIYk`c*k%(i={N~oLf|6$7hUb3I0(S>NQNNQ4@*!~U3{WsF=
z#H=t7!SZ?k+kws78MsQx=s~B106Dl3liJi@iuAd3GOk;viQIk~TyH#3<!DV9FHufZ
zjodLq^$bnJ7W^cxejpGNC$CrE4xHZSHCxS2y#{~A=+&ebN!LNVr5a^N{v2xNf2o?<
z%14qS-iF^!O%`t@&p>)oL$z9*)T4;`Hs3ef*ebp8ErArmuUFa~mKcSjOfbBjN0)aJ
zoIdui*!EFlkj^z1Yj&P4R}92F<pV<ThcBg+<?NB4RWzm`wl)I7KlW0&EYW-{0}XV^
z6RI24rd36MJV*B`(0cUNz0UA?Mh6!n9HSh!em<$vAJa+xK$oI_%YAW!Gg@rLvgGUi
z8h_2!r#YH#CnvSy6jD8LIzus!rkD}G4A90VZpteI-f*!n;S7mOOS^1qelX#pQU%!e
z6A_gG1?n&UQN}vz<ubO8mR=tgHUbU>m!z_C1*(h~ZJgsEQ&!E$Sacrz?@~i<e=M$6
z^`}<V%69uAnDLVG14FOp-qzDnyNeH1W=qmn?Jl-(4oRm<+KF<y(pT+ZHgiHlh4Bpd
z_scw(dirahowQl4hX>@})n;&^vEz4OqNM=NP>S#cKB_nnL}^ee_$3kqop|yQqI!~L
zF4f5@LNZy{8b!^_)uDb52<j0o-<rV%(ksOAoveOkRCXEU>8BMICUb7PEpY9cBz0S;
z>BzCP$BboE)OeBGr$LF4flfYI@bS<?Rqhd7YCvu@jd;&u*6Ro)>L*mi!Q`8E4a|Rf
z<ifmvutU~-a3O0I-+wxdO{dq#=6l;0TJlerW)~S-dZ^z1LDB=!4DxI;fuh4~kWAS0
z267v{r8HuL6sF5eK$gX^=1Ps-_Dh$*z9Y+FU=UR}$Bz_y{|gs@+GeGoSpiRtL4rso
z=t+k&JX3?phfsi%QidyW<HXv|YuQw~2O!q8ni|ga+Xgo~vL4T-cs@z!_iT*DzCGi3
ze?4rGskvQ)G?u!nlIa%f;f&9KmEgNotl;-XCPv2Z0^`$r#a2X{C05OX$$pxm^QQft
z6G9?WrqhQvCEA#<c@YX_a@*FVthidc*q`YFcG;Bq?RP-f2OvUK7aT1GE32yVTg`ft
zPdn{FF2@_j-)w(ue@kCGmO7BaB^U@5R1m?AaLrhuimMYSn}2p@Pe@8qdC@HSwTa>T
zwW*ICne?C7nZavqkD>VPSS>CACSt%NE^j}w^Z*N#ocP0D>A6S_?1H#5!`IKM_eYJu
zq2?pR)BN(_S0d}V<+(IJ;EA!mdwLFlse=B=QXk}yrcQaCAHzMKwIl#h0C3CtFfcG!
z&cLCNR!Agth*tWXhkemq4v3E#yzu|BhhvG_0W9&xX#($Bw)JS5n#K*rfc@Gnd)0z=
zX%KIa^uSTap>PN&Im-2ATQ)WxjG2ekVybKqPd~i9LKPFk!mFLn?{`%b_`H0vr%K<&
zW-J`gU@?0wyRI{3yKBKer_)8LC;jSDp!sw|Q?C|+j4i;~bJv)!m0%Wm|MV#y?y~#V
zedw7F%@hX*O+i88gZa$Ks^p8?X{eck;5e1baXk74`HESi0wPc0Pw@58P?I4cF|p-&
zc<fA_<9@(`_|~_%f3=lC{*XW<O9<Q9wWB%7(7!(a_jdFD$OKlHSpg0!iy?jg!kv|t
zM9&N>llvCs82D4Hj<QCqB&tg?8yke3tBVsp-h0ZuV|_W(rG;RS|6wC1ZYAx-Ksj+4
zU7$e_kS-G8)jrgH=<L|nx{aL;EQG1_M10@P&A~q>l`ty@6I$B}iy4cgP}>Rn#ogtF
z*tBLT!&Bu<X~FhmKYsk1>w7;fW8^4DeDD5G$QJ~levlhMrdvP$M$&H{!W~K&wfnQn
z3lW90(?c=AWPHv3SJBsA&dwZEAjMdA1%sfPL0=TYf%C151DZkDQ{gv&A>)`ejyk7#
z7Y2N%w%e7Lh^Bd|$Jo<sLvlyZN*?JQ!d6hA${oqKsg<Q|0rRoB7Yq0C?N$rFKK)Eu
zR**f#m&xb1J_;rQ?UPrC*P|O%vuo;UMkod68}SaDcBagK`J!F?K`J8BT!kz#@Lc^M
zWQp}lsAb5|q|p$pJRgOo?b42kv)u!)t;K`m&NC-H)m#-we#KaV>sFF<WJ}9f+)p(U
zpXO(8C*L1eUIig^>)n%|urAu$_@}5}8{)KK+R}uMqKfFS?Fz_o_QO7W6e~fYj3edg
z!hxU<5=gP!sJmpxz2atx)UGf`>dddH;X^=Ts{!DdF$C=b6`qrQz#$!jP((Y^=)O(9
zQqE5EWf5=$O-ywZQ7T+VbtuAp3r0plEm1rE{6d(XfNrvJ@0Ctbn}tPA3sb$8v(q2#
z;gUbvhcNX7NSrQngdR~ZVNB7dJ^Ga|s-(Us<`CDKw<xt^1*E1lBaHf$t=`nOcB{sX
zO>Fu^m)bPFS^-=?I+Q!B__xwfq(6ent_o=8iHV6UpB|7{SWmM*^pdJ1KvDRw0u6^F
z>cgarVsmcMhm%4MLeU5?FKAhAEBmQsU0o}8*&mZ5&Z-;j{Gge9V<HUTqruAP6CgSx
z-53!kev>{EsU3L&$>^v#xD*RlIl^E!yD~W|HZM+es>2<WEU}k&zqMPK#S~LHw2|Z5
zA5RmnBa^>ZZs|Tzc~+ec)4Gf*SCzAxZ=EwxB~ov!Jt*|78}6(1&xc%$6<m&)?iW)c
zRrTSW;Eh7vj$5zs=`OOxq0w_Qu8v}vkfQj$Nnj~r#C?td>^Id_2#y5ze#w>eOT19a
zJn&A`KUBffA$kq?NAmp{QHpVc0%vz&mJhL-*y;O#CtVo7&~*my!}if%4bQ)!Vdl>)
zKs`R@L8ABm{p0^}YNe3vZ`GD$?AJdN(Q>@ohHP1Fv5z)tQ&JHw7f@^k{mM;Wo3+Ub
z;fLt2jaTFFniKwJCQMGs%Pxu;G$e34i{iOX*KIfjk`3-=bO>>4C{O#58cr&XNXOET
zG7+1*WD$5=HN=9wjo)d<E7&-9`X4*=IWsX@InW6E)ydi_(gI<&c$HuLj73KtJBmBl
zyTH_l%0+7ZV0|KPX4<+RF1y0<pW@Z^h$w`vakQIP(qy%9WxNM#G@t9_bk~M3-KWHe
zz2J#nKB@TkZsH&CHKKlX9DduFHr{fsc6FdzOsEfAl?~3UZ)qeeUKCvk6J@6T(&57U
zTxS!MW^{{6WBp!#wFyN(kEa2J`r`@b&z_AuPG^BM`{>!IQF@e1ywF!1rxvn?Wav@5
zxjI_WNCRgT=B#kqGL?9%L5gpqI-ExiB0_KuVuauu4iClVtv6B<QLKf@Py71q8Xm5k
zPalpW)_;9*d(8Jnw46tJt3WLX+78Qg!IyE}FdVSztoZJuYmlWmg&qz|)7OEmLwg%<
z+*El={Daxh67f$kV@Lh-dgpwKIoVgBYn|zCU-uW&%YtHTEMzg5&{=9|OUuyg7v!@w
zE3%^k-w4~Hmk^y8PGag{laA8#Q+c%rKLbP8=c=mLG35Mz0>h%9bUPZ{IRZp55P?*&
zYwfP_A)gv*j>?dFAjqZS4t41=P@7^RFd_8iyt}r^04aQvuJfvLFU(^|+0i4OwQTPv
z6iMw>!aVJaE>CLoUC|6^j{V1)0jXBMTOhFml#XQng@k?MH;wW+-@_K+8HqWY^Dlcq
zn@Usyfv8Fb6~hCX<=mLWvbmY3;8z~4R{e3{gac6aduS}Br5Rvw`SqbrpGySU4MNYy
zL1MI7CR{VATS-8Wh>3YOsjdFqhvlf}GYVNOzZ&iFJ3D4vy+FvC?J>;99O|asItMBT
z+0z&4Gy%#{QUF3N+RF9>xJCKDTyN!fm-A@Lx3WZ+Fza}t=1uGANxqfnEgQkhiOMy*
z@;VW{vBoGW1@2OhV<JB&zs3<78XB?_thFgvEjnK8Eb_M*=dZa*vs*=NqTcBSw{N;M
zv3A$vhG|7R{yd;5j_PTjd#N^>t~@XFs{JPRf98RkM#6;Zi*<GJb(*6^ujM{vUbB;|
z<D+a@9Tc(4gYze*JF1;hUbXYAW`uv6EP(ek=rIqN9j@ccI7|My0{*ueFDR=7I2BOh
zR<`^}FYx4hIWd56!`tOF?5%0L_KYdy`HsAd{H**&?Gs*{*cl7q#^%Za0rMCVH|p+p
zq)>IVN!RpxbD}wZoiQp;F-ugv@dbhj>ryG~oB_zrYjV<}{x2xz4gn&#;dqmD&$ax8
z@Cr|dpf_Q4{aJB`L8Im}#-Wfqk60PDPL=h$-BWMmRKlCRv6O{#1E)HMDwSkPt9C=9
z7+xB)*oth=o3j!GT$-^iDm{~0)*n}F0(IEng%+|11K@u;l1QP?3ZeHYTB=m*RUY@Q
z53J$*@Rh+gy&%~>rnReQinzGRjEq@RqFzWzad(O8hns<zOHxT!wkN;M-#Z%TXyl+X
zA@$&B2L{}_q`)ev8Hcz`X|I|1EgOrWJ}q}~P60v!?43|$wcTh5@myRy`9;r^&oFhg
zoz(qh#YeM8A*%M~eNi#5O&3aWw%;8Us7#Tpq$3>_G4{-M_i3#e>J-Jwi~{eI2>vj=
z`RzT0WYE|yCP}gE#F^I&?U07ck{*&;EVD3B?bO%p^QN9;V{tv0sYHH5)L^st+Jl2-
zRKyzHd_kU6FW$VaBTH%!;YM+17)+uHG`Vpp$1UgBmR441(OHhPYMq&X)60V_6yhlD
zXy5b_0iei6MzQxCB1?&BKe@U~sgx{E#YLd*<^;=4lA}(!XK?L2o&Z+veie%NN6xY|
zNYr#60zHxX>FrwkCXz3@F>K}~rFNi|IMolBidB(6!boi2pysr$jkMCMhC7Iw`?xnX
z?QXAz@ovdJaYN0?&ok{-f#jAJF_E6(YlO;RX5g{22~_D#_N}?ICwR}=@tTf~^6}>8
zR2EwpF*!LIxyYo!<)y^k4m|@S(^=()|KQEIqR%_=BuK|JV09{c7xNvkJ4jkgnOp(_
zhlDYAlpD4V66BpE&bp=Gf~Z0(po6KOL&JobZZ|eI;)2;(^xQRQ8qqL{raXu?i!42+
z0AnVFBYF1}Yj|9KPHUNnk%JLz_EN_e28ll#Z3K^r%=#`Z6=nj9R>_N7r;dRn8D5w2
zqY>#4<nI;^Wmi8m#GvsDzWfCjlQ-}Vy5)2$ddIQA)aFjz(O(krrq2ai)J>3NA^M*p
z`(%xTEqZ`z?0w4kq?z?`56w@^rtUAcL%>8Cy8OIqACTzq>GR38zUiu@7s@|{{{KI_
z_X>acCK?kHo&T)n|7?~eb^pS*I-ADrk3}z}S-UiAVfkQJtgd&=YJHtn$avOYLq7QS
z^e~y<^sHByuWEG#OpLZFE5t}-bCp2sKlk&$WG_TLCn@jK?FSdiIyhH?LvQ9*7a4sT
z9!_;{=D$CVLERgIs*u6aGC0)HqwM8n-BjhJz0qdxSL!43&84PMdHWgQ)4H|L^zpL!
z!#a|8&80*<9gxomLy|~3-<BUiYUL0ur&lWAD!o@WBv1)POZE#gNlIXl{@ltal*1Xt
z^^+``NTPiv)Ne-YDF*xmE5&~w+fO$otB{=)L$!#BiwE)t_a{$3wUmjtjCKBPtgcDd
z&!~CqM@z)gpONzUy*)gcmeS3FKu^aqD%6I-<}^Xo@>#CGp_lyGG2FXMG6nC1b!Px2
zz$|5evNclBxaZCn!q4kChf#?*`$0c%G$dXxh1`3lN7v|#^}NA!V=gp>tHf!q!}Ahv
zMt0xzoM-+XFH6#*AoN}EOFbF%B3Eq=JcCMOF%z?(<S^)f(LEm4un<AA^}(XI&aF-x
zCET7SbY+x<Gvx@UTn*!8;GEQCLGtyuhJJLKQsYJy(zHHyCLqrGWDBU65Rov@aS0Jw
z5;Q9c_9hi*_Y+>q(i&)(m(tEWJoxzmObqh-3;{>-CeK6r7jr45AAi3{fVbRafy~Tt
z%-Ft^feQ&nA~IVCmV)txWKg&4NXLaLfl!Nixp2T2TeRC+o>rMC;%s$MYcm-hoca8w
zfk7`fmG*-g$S2q{vJAgZP&t+C(f8|{RNU6ZfVT5U`zjlKus!`Q@myGcY4w-XmsNYV
zm5{h_q}EncjQ-5?K^0L`RlN*Uy&@@vSi<S=auvdIWFss^a}xPMdRFswd@aCc8EeOl
z7lUxH&KRgGqMeeubSAu|C^+)9VarJuMjxC(#Xh3QM0i+4rDFvR1FXT&_j1A}2du9t
z=18mv%cv<H7Rlc;kmGCs_AfNRNhe32;Sxf`JW4-B(W^oQ_6n^q>g&Yo_Mxq1vqGLK
zm-?BGg#aTgykp=SYnNkihy;~aP@vc`sze+>w|rcS<{BiwI+&dp99hCJw4yM&t_lmv
zFT4YltDb8-0Nj+t?s$Gd{1h)kDZ(6zFLqVIc<Vo?+sblw$4aNH>$<Aoy~6NDir|ws
z?D<rZ>w>Y=Bn4Pt@bLI_f6J>r{AB9$2-Dv+evT6N_;*n6zn<Qof1lpO3eM7hZiWBb
z(_8fS>CJU1n}5>I{t{1G4rOCZou%%llt5OXevQ9s0hP{okysM>IYGPNeV%F1^d1eH
zocG0PrREmTwHb%O=fDE;1uv%nO5qlQV8kzUFY>|X8Get`q)Fp&HY#s<aP9g}%wuwt
zOTD#(TgvA2q6nPsky%||He_fxaNo<1vU<KhwgqQv7e{4tAsmv84k0`bA|dFUg-KZ>
zSp1Iu@h%oepKvWx8N~|G#2Ra<SONf#uD7y<3-*Z2Jm#VoC(V^K;1D;_BVmnDtL8eX
zQkiL<c*CwtiQ(pwI=J3Y&GSEg1`RogSx}BQnjQ%FYuzs6tBYtk1+--$)J7u>zVGaJ
zZ<;=VgpWRXB9MoCb-BJQe97p>pSGuj*2qsbJtHG>?le#$CGc{g)<}65H9hw5HW~2;
z0#AcFW&zba27x?yu9>p*(|D3pCR}1;__$=mI%U9+eq=m)SLuE~os^3sZZe?(t4s3p
zAf0`ar)oor@1a0fg;CX9S4Auf2jtv*hR+lfZlOvjGgrV8_sX#B$`4cYrD(NU-H%&c
zeL`-NW4vQGC?&6T%(AeKMmDVh5k?PyG0jfywh>^?LX89wT1v_(En#K3x$w$25-cn%
zfq@2%Ht2lDZGOV0KAS}D94^{Y`B5v<z17?~fzrKo+*YK^&itWfx?t5xu&PGxbV@xP
zoWY`3Q-KgXpQET98^4%AvSU$W#)ouN_oCRSFeS$T?b(Oi1w>AAZ`g~LKf1~=8LPV5
zZF{qk5iFdIpV6%6_M@#G9Fub7Xpykb_WA9uU~9=sn8&4AvnSOQ)Mz`NeaCI4!UDMl
zT2l7fA5j=&d`W=IKI1)EgrK^7xj#*jt*2Ja1}JJy>tT&s4B{|-9z<#koo~oM5H;PO
zKYuW5gzd&V!Gl;ljV18{mzus%ZEh<>*K!e)iMg596)hMBI?)TZ2%XDHo~o*<lbyVH
z^1x}C$|gZR{Yy>G@w^X}>oYS^`JQt+HPe2EQy>*0n4PvJW%F#UwplN%KxEPC=@N+Z
ztxT&w65TyN>BdRF4xuzpu8v(_1c|zh-`M8~+xactPciBpR{|KJ#nD0|Q<)nEcI+Em
zLH&Qq>f~4_TRfoL?-n*aG@_iYU^pirCbll^Fkc7LyS<hU>J++~S$ADyWv&gjV26~r
zt^(}I^~+-~wEz^a|Co6@SSv>Ua-R|@lStry=|}#@%nL}Vx&C5R0dFOyeazTL6?fha
zSLFEBJmMi*#EU!d(d{J7)amHx<P`-wMUO4IcAGgf(ITsmi;~VZ${Eyv#fQHq#dL@F
zTD&Q@Wl%WhnMJJh1AlHk98&c@n!sFeeWLA=$1`AH@EPs!MpzCG;NmR4SREPhi&y`)
zwTjbz6m&#|rj6%BnLrwJ1pfMglwjaRB`|@QCS^v^iaF&cd!)Jy)E8axTR!po)%Y_I
zBvldwacMjF9y(GUM|n9RTZYZ3QbjZK0>;6aH|B--+L=$TTq_kZD<ErWEP$9z=zI)6
z1d9xn^;}ts_~Nf6MOgavYhW_0_|D;pbJqlLSki5@4AA<%<1^KK_ez3k;cgtoPUzsI
zSm-+S&71lWM%;tE^)j6K^OD^<!!W<CYENG28Kn6y11*2CHrMye!4=|T<u)i_+SHb2
zx}Ca~5^Om}3Bu&5+|sXcSs5VQX|B)byXjs1Ioe;-(vX`*^w#UP_0}ik8ohV-@Pxcw
zY;YKuR2(Rc@(T+fs&^pO2ACVPZd1>E-xI!^vivi5Wrj7#|MC~(=>1ifF^4lk_Yvo|
zCn9+l-Fgd;5nm~!IJmrEa1s?eskx{_T-rAnZZn4UmwI-#u`*H*x&tApEtMpa@E<b0
zge;Ff!e8INeGAuC6Ala9VsVF7RgJ%>bn8-4Q|kjFwXnpBJNfGtF^VRw`(gajd2aqh
z1}p}ea>5@gex_tmro;3ak&(}s@{>LZrT1e!eS&97{~&msh9X~*1t^D`XT9r|Fc%&y
z&qs?}or07$^I2ijFkUQZaZ2>sou3Djv&nR$xp6Q48@qm(DR#-S|8*wHh+9lUgAgTn
zRC-ICC31YYf2-&+fuekFV`F3G{#YMZiSy0dx1WOqD0Wx|D&%SGrt!mJGw|X_{2*)~
zI<;xHu=a=0Deb2MJPquxAV}etxnE=g97)5K#stvly&5MGJwL~^h^+#vUVOxo*12~=
zIxA%zT8%i6);)fd&Z%ZLJsZ)uz65NMX?~;fC-Q-^__*5LrahelQ!B_!hHkk>%}Q-t
zt(@E`2GT+K{Ue~l>jM(D2UFdYoXC`2e^vs3zpwnc{->y%>)4uvE5rSGi96Jf@kNNp
zc$7>XN9_TsP+!;ouDp(s@(#unlOS1~%)5{vWu-p}iOreq3U`AeO={pYbwwpUNqQrJ
zvaRF9fZGY0FSX*;A8P+y_w~1KXVd|n%~KL>zf0u*>5KrpYoGtJam?u3O^3cn9GL7j
zGu_Pb9X#3!1lD&iG1)bol|ORQEStushW@y*>~!-J^2H9vR_yF^oQ*_x=y0^Tl17F5
z)su=Fb3o>}Qp5zW^)BBd)vbG4$W~EIEp-&B(}6eFhC`$uKP~w;i^UWpMU+dQcr;I`
zFT-$J0;XlKVia~?f|F)JD~dM$0bStl4rrJyvgI_Ohb;==kTv$kU21uc`!x^M?=Hwd
zcC+@#X2e0L7sexq6UmQ)9PDVbGBYLRfYoo3Xd1*UInWX8!C1sFO7^R<*KHxRL4#oe
z&C@o^Him48Y_VCMt^grO1TIE0C(?qwxU`o|WT@@oNlyn~=CRuu*}`^N&31ZY-KQ1K
zqW*(^b|CEmd2mIRUn`Yx7{6i^PCp(B<7%nd^&2HEq0a3N6Kh)3x|)TE*xgNox&qYm
zwt?QJS06$xZiPJJUZzZ4g$A!T_UUKBaL^XYS1-NV2H)Vpt+2=MejbQB_<R+Lj>qzd
z*yASjoc7jSEu5eP>e%xw!_8rU6IgW^@8tYOcy$NrlWfrS(5?=VvXc|vt8E*SGqyp^
zwCP53j)<sJKs+{rCF{WG3upRW(PqNr?cf|qs-4#!jZ92`S&0AA(fDaBkMxALQH@<0
zd{a_VLhG%$@*$pD9CN0S79JDn4($ebn<=>jofabV;w8xcLe?u;Wl)o5;=em9l$4cY
zDWJxxK+BFvr~(mS3#LO7o)d}XYS5s~o%5E;Gd81$l`Rg6o>i}epOp^;`)9^)htea_
zoXb1f+ncM<w|YHmA76pLZpsBLksF=cz2mDB=$)Do=x0LWb^9m<h3cCn3YIG?RF@q<
z`qB~?EMjFjK%`R}MLs)e0G{NsA-L>k)u96eIWnnb*w$znVT`6p_@SX;<zP7IV^Ru@
zZm=jU0rPe>c5ns)S{b_nLg?8e5Dk*Wla{__hlRLk{{ZX?Ci8j+LyOeSN=VQ!J(qev
z#29&9HN~2GR5`~U2UK_+qYDJkJ5Yj6`uFl~_UIKq0!A+DvOk&?I~%_f$BMO?6RVL7
zpnZQT9W^OL<JKTWnTL?ptzv;coqeN?0wxm$JU;;qSRA}%?X1T{D<`R*2E=>@_{k?O
zc9&Y4U3XzZY*7~dqo(d8LS_4DS#CO%CIk*os}VHh`X4T_{t^s;8BPA7W<;*nrS~5Y
z`d%qW8Ld}s7LD-U>QwO5t8>?D`SaS>H5$-f+5a#(9nb^1_vZLeu*E+u!T)&H|9<(e
zQ&0Rz<P^I%?{xbVG6h#FLL%0SSo3z$$SgXbb)?@GEO_fkvYYCVdpA8ud3Q+{KJHWf
zD!|afqDsUj8^_zGnS-5_d<5V9ly*feOk}ZRpX96SrpYo3@gmt;nQ}+TA;?rh8j9N?
z+VA|ju^xqL@wEDR)1ajcRiA1C0S)XGORFJFmyeK3pVlcZ9j7#S;20jv{%(3SRG1yz
zWo!b()22`8BwEI-Wz{v)ax1dRHBpxTULbT2@dtkv1*slxp-0GOTc-Hb%mQNfu#rjV
zzUflnpKz%dQEsBdK1?Rsh0jODV0}yu>G!r&wGX@5DO#NLv}tB<a6Prrh|7K{z?o>r
z({hV>h?!W>%V@|l!^Ge#(s}=U$ux7E^H<Y{9R%Amc%gTnMu2;F6$;bV&4Yi6viEI%
zTX*<f#AnqaC>SE;NVYmDBIB4LDte0wnbNj0Vvr?~X@6{fgI@-cnQq|D;FBO*-+iFK
zA9QUv`b4V-_p=<GnGttH!DeO%9JcsPyYs$~x)<E~C;`PZD}N<pC_!a}_RIc>oH=6@
zq_Bj;dYZHI1vl=KN!OTYP<-pQc#_#xUZMk*^`Kh+H~6OMaQvRB8Bx}z>3u)lt*Dh2
zKxar+q0U|ULK=o<NQle6tsms)e}BdA@#o$4=g*&!U+egGhPy?WRK5S~dM9=@V-<T|
z6e!ae2xR{h-T*`nmLKc20bnXctVN^M#q9jbMn3OUqEC^zZ;Hts$c)>wfY>UK>XATS
zOexIDI?rCGw!sOZ3pAlEiZrOLKSh)<4AeZ=l$=O;HRLTey#)V#P7vRFQk8Z`PtN12
zsSj_%(2R?ADmq8B;0GtPwpK!N2XggCy4T*(ZJT@=ZwF|<$;KxphCJ+EJ1qzyP#clz
z3Gap{7?r+&4QGnvVVGDFfd;<40{ZxnAXOBsTnrD)pbzq25vm0h)CZ(wI{(O?6BQNL
zK5ZnbCuC(gPf0sLb104W=YC8NrpDxXmf+A&7U#Oxj+wfTTl4E=-k}A;#J~<YT5tu1
zUW+8ak{&)bHZ~QpplKj0{VZfkpn%gbvsRxY*2-hjz*7u14{CC9pRR<NPCK@OwOfx+
zj1arOB`1>!8BY@$HKMsBhn(?_h*_0^BoL4>Px`As@7Ez_GBUxxwH={T<VLPrBUv~>
z8*K0vvfWm=wC3|f|DanBC@iCZ05ij7yjaM*$K`pXDKkHR*=(xpT}1t|9~ES}bnYF2
z{`P;;PZczOJM>S4(_#On@c!Q&IsqYYN*#B|WA++-5~g!<nw1<GgDO{k^f~e~V9n^a
z#XMLH+y0H1vysG7-_P{(!`2DUbnUM{uNWpbx;2>}koN^0do#V3-WHX>{iX_W5v8&W
zK|3zS%&i8o1*srQ(Mva}`oM(tzR4jnt-JjBSq8qs>_O~G%mLpeMS~FfZ>&|}IK9o$
z`mR2AqM>*qpYmhwP{tj_Obo91gfdu>pH1PHb}gemKCXv2raoDS43kcvZO6RrGVe-+
zXTzdmmWfLsAy~6kK5r};lwVOv0Uw~4w_2SmIwM)N;#M8+V*0LHJ*;~vB04p$!c+PT
z^7VjK-kZVOUNWA1Xblfv``}Q_bJe0lCX~ck{ElemjTBg09?1>0o(UgWJjtDWP7;|a
zPX-Is$RO7<RH<Iyl6BE|o9j0trBO6zCR!Ku99ALq7{YI{rDS&Kf;o}Z*!68HuOtS>
zx6Qm@HHhXa;@plCyTUvZRD9j}cPV!j*m`j#NfAtsIWNis&m6BzcS9Wb%caQz|LL;B
zqJ#xnqc;BKS;fv2p|c_#wcE-1C@h~J9P+9&1%m#icL9X9RFa-yhNOyfJPWseCvT-w
zP72;74aOc+#qMtV*!QbUhP?J&O(mkbUs`MdZD)mO#3%l?m7z3Z&PsS<6dY=YBiF@k
zViAD2>ChTAFE?$)94&mZry1$rC^5~>83uAP%sb(K{`|SJ;65S;FggbP`~$!FN0<N0
z5v|xCM+I7u=?o5LMH*s@>v$Xcsz^i5*M#I(@kfL-t@>>95q>?5lC9Ow3Tj$AH=9f;
zb7$(Wrn$b?Kb(Az7v=?V^=cpaahlO=bt?T~>S?xOauYM~T8?GJb(4)G+Qa44GawUr
z*mCr0P-#=y6}ha_A55FIa<lf%hJ+F*AHLK=qq~i19w4LP9pfk3Bp@RTD>G?Iy#rRo
zP@EXJ!njiB_$#nPH3Sz^;6Ec2vmS46k?Ji2zGpJ;cOYSlE<|uPMM+-@F}Z609G`x(
zUY(l1PI=uNNbSnt6e+j_V34hZq3E2iSXn#go!eulO?`)sRZ8!b${LzD6?Od&KF(zD
zdx`$&vlsqBrSIEZJNVY$(bpuUY^llTI<suQEhPjpr8YgOrq<-<tBYN2Gt!qU7p+3s
z>WtXT7I&uWKonc78dskd!Z%SMvRhEcu2<Tz)*G#=a*2T*EpP5pw0ms&&%1n*l`ExT
zUU5sO1K*Ab6V9pr1m$iwBP1by8E@vNq`Z8U^|fT6`=2HNK*&3ufBv<;Wf^-4+Wm8L
z{Dav2ci}&U{Fi3=WbI+(r~K%czP1x3FB0SL-#RPbjfuK%6wiYEn^%iu6>@x2yb&Ny
zsw10LQtS!(8V=MGOHc(GhZ()V>*Z%$I6oDCDk~Fz2Xy(L@)T%Rbiv$hT$#^^N<5sx
z%Eq@BY<?;`XIt*bFTZze0@1iTl*$n*u3(N{A_?Q`10@b){YXfhlAMaci?2JFA`Ku0
zX(M=Z;wnPl4{@+)<~t1j`u3J8JoTaZIQ9Z?=SxaohihBJ)7OP_3-X6vT7>aFcNPYl
z9A)DN!eumZy8fbsy0BH8k@D{8bT*f3Rg#q$jHhsO3G3G1`jLHmn0$H;Z~TAPi*Z@t
zVzt@GIaQ3bRU_@!CDF!oxZq2#d_j!7zm6$T149{f^mMf&9@Y#II-Qiby4Q{|PKM6l
z*SF@XjTquG$FZ1k!*!QUf+~_>9tF>Z-~;~vC#IL%Y+dEjJ93eY0rn^iRn8wgLR_OC
z)An`M>!+4JuL}9uiWOi-%c{%#u>c40b5kse#L}}*8-UiJU*d#qb_;W@pghw>aUDP_
z2(x1}keQxW|F%sZTLH$}57|Mbq#=sYY|Z2GaiL_oh?mn3?)VZ~kWNn~4BAy>BNYIQ
z%}&KQ^{tIWo0oXD^(dT)ZT3s&waI_}Y;f(o=I4iX1h^d&-Y}E8oNo;wdmhT{XlVch
zw!E-)N$ggcDu_-|!vlcMS&^|Rf33^EfB&A2iwkEt;8}cYI1{uo3;@`7IZFH3Y%jE2
z5sBv-h--AHfw}bSEP02<HoS~(u#g!-=UKxSt3AE*Yy<bk+urhwv8<5qt~cWgdefVq
zlwTxHA9#pLZcfguG`8En^pP(b^X*1Y)zPHbG*mC-(^hcNGn{)kG(E>(fn3#<_l-Tg
z=B+MTx13O)272p|jg9v|*b7jEjr^0!Gh7l;iwKEGtcEj$kzWHgGn9`6=EM(dQqyJe
z)}(|7oe(CAHrqwMVSO|Iu+mZv1VIYgZ~GL3zJ@$Cad2?K7D(hMv<d#f!YCLJ^pCaK
zg;#8V9c@z0H#V<z%Fv})$-?60Uxgijt<UWIYy#v|={^{gwdAu_CiNi8+6mJ`KI;Kh
ze{k9U+~kOT;YTCH!nu!B7@<Ujpm><NIpin+nqzDN=>2>qTG<zU^6T$FP?+AMgI}vU
zkSl?S2=SPHsGWX<2>q1=+LfDk=1}b%95f!!E&RKG^*<@Bzg2zo_kBK^be;a^YWTmj
z><<rr$MWszh1eN+IN^Z1k^$68T>?w=juYwP$hfl=v8;0J{dxyx+Ij4LDhcAnX2$HV
z@n6(OIHag@n3JPQ4E^pl-6r{KWKpS}O4y@O%feSim@oKFa#xyoz*jNRr~(O8W3Nkx
zin}W7xw?KWRi<7+s1;+dJAX-3`Z0)o;eYMv27U1K$K(9yg2sfk7g@YO=X3ZXIBjfo
zC?1Yvv2O-wZnxPE0v6f#PcK>=j0G6UteU(!q`^e7*%%*QNK3DUukEztwjLIe_wm|h
zNeb*EzAX8=?t4@r_ELGOr*7HtRWI3fK)hym^Gf43wXE@(#^i_gi0~*FkdjZ9MsBZZ
zVifW9Or)z9F0ud_zVB1%FDg%2L*X^c;ISYnS1?1Z6&_emI+9<s9N7ppu`HK<FP8|(
zpskLyH@_C~cy4{~9C-yS(}M=qBx;zh<3?0MTPOnrX<h(G@R09=>~NHfAC}{f_G4UC
zP>cgtmm!4&nq=i5;D!MiOQAhL(r#WWTFo34PK*C6*hQA(xg)bP9AeShidVl0<`;Ut
z-BDyG^#qcNmziRkGeq<z`DpoAUM!-vQM*bpQ}S2wBI6#!q7f+0h+#~aMI%q*_bn)r
z3M4k_YLpjB%*PRZZy}bdm<!As^7pI+(Ix0>YxejKHOC{JTprF(i<K<}ht$^ADypk1
zXlj0eBSq>(e+@9>c{JQQk}$Lj0v%R!m$@1{Qa;;+V)j?B__On~XRen6mOE<UIqB)?
zRWV~<3TZq#a>P2r$y52B>|@{Pj5e{3hsdpCOiq5^`aosLDDMAmNZck!K~yl)*UG?E
zT;GrjWuy|emEAhWUMKK@PEn_O-n;bmsi#oSp1;bqW|O=!!9EMbs#kma1w!hX|A#Ze
z7@EkcDy_lvYeqzL_A9{nWcxz%vf7X(;%c&EtNar@`}z6#&>SX>z@Ym$qZGSpsdgzG
z|2q;zD3NlOmxsqC({R;?feMd(J%n<#RPG<xl~glvQmpP+xQOgFrUdH4wZS5{)GMaK
zwuw&gX1Xnxwl-5b9!&+8uv9j9%U3$DB6WNuFGghzfZ3+8%o}LI13T=9?8<W+nhL6{
z9$QkQ4u^i<`w@cegG_4mvFpl*ji^DH4w@34iGY1f7qQk}drbTu7#(u6vpX8P?PGxm
z1YNPsT*^&!&@z_*bGp8o8unj`UL;mOy&<SG^jbD=@DarJZ>0DCuHYaVO(1GSk}je7
z|D6OCsJ&vN_xDuwic>=-yT&nuN5i4nQ<ZeInF4u~NH4yXBtlo$BqSL$f$E`WdDEeD
zaquP7UZw*6aBp|?cE}5aX8Y~LbsEtS%>f3}%Nf&;GaA{6Jpu>lzKz1_jijbReR~?}
z@(zitXIY{VKZ{_i#codOVuvz_=Mk+HzlX1eDm{6^|1#%Y`pIhjY{SMVVNW;#ex8+G
zeS=1~D0zd*DWW7>#pYe=`SS97l&_>p|L?pto-kMKSsM*YhL>u@s(;o8#Dw%bI6fU~
zCR(|R5di7I+#LHzhgEHHuBI<J*aYYHIjMsrjXfAO%p&hBWgKIFBwCxg@|${lVOR&$
zQl(@q;q*^b>bjgR5eI!3r_X$`W7yR9sksDKS&zih{i85E>enj<zUG`N?98up+}o$D
zJB0hYOKus+GJSF%Y7G=gX0NwDtleYv_KAC%m)l-!&b{H0$IV$42`;dkO-BA^qHZgY
z>I6-uTyI>)?o4`l3V;!>UtXeb)8VSS(-{}lGTLoJtM}48^o$TLc~E+n6LiD%w{2Ey
z%j@audlX#iskB5RR+C)c3fb$>ePjrI8SGL@qbJ~c(8QmUCUqEIs`Q=&mK}a7VfHSv
zzKwB`N-DvZ>jLI)W~5tkkm@dqaE$hbu!lKCB`65q^3v89E(X|`Az+@@Ayqrgq^KFV
z+!sqx>9i;U-k-t(<YpPJ{JJ#aAKOxo@`Il@@SFW^-7fa0af*wJ3!Ig`HAa7~y{ph@
zVy$~s2Q^oLs{rtEhhaIF!aYKTj=Zx8@?ZRV35_o_Ix~k5OQzdzji(*`aOw!TOT1!g
zEF`J<cUmWm5qsDY`ZOdRgXvzK%qga7-Pv)NK}TLxmP~AivmyPdpZ5LD(5=74jxvKB
ze1*~WL_S~dEJ%-remGGWA0V+Mp+&d_DI=F;W+wR?Q!+;d>~BQYbKJ1eray<Fy1DCq
zGSq%chXtPsf$Mws5-Q*@V?L!Y_dB`Hs^1{b3YXt@8Z&V(Eou&A!dJId3W)Ki9W#dy
zYrlbt1e)4w<P;R>IXDJe1i@L0uKiSio;saOmPa9;+R@xx7j;Wlvo-7;|F@{V%Jn%A
zxwfNY>s--JlcO`+4V@!Eucg^xd6e=%ZjexuPk=1|J#%eley3q@9YoGR@V7PRxc>B^
zI3P?7d13CD)_gW@dimkQhntlUoWXl#tD5z@ePyCUU?JweB%}YAsuurS)xNo3LF@lH
zlK;ocy|Vo`W=Jw?%IW7K3vIugnW``%YIrz4s%SPBzDV!g>JWKTMwxMQ><WnI?k7{8
z`pEmP_i(>vOasG|rwKx_*7M5fg@Vn0BkLrSnEzQZF!r|9=Pe2BKYg?ud#Mvh1t$V;
z2SW9t4(O-DJfe=ph(G$g^!Cfna@bLzfO?k$*{$wPHv#)-bj3z!8;@cfW>5A8Dk8?m
zNy+N#IHcmV;f)OmM(&SGRuCRqVagO0HF?5*sv*~08Pu-N{RAq7{sUb{Oo6{7gRDh%
z*f<UTI}2dCZ$aF~;D>F@*1j$x&++$Kq>-`Do_&{jt`C!@4uj)6yv@Pm<O>fc*WTxe
zV9Z^D5N0Rph@>~d$7ut;7j%l1**}pXXa$_cKjM2cro$aS6lGI5h@F$moz!~ia7zq8
zdz3_)o_5zd8!jd#LJhoxx~ByBauRqX9+@brx1ANFU9s*)`RmPqUc4vlCEpwF%#=7|
zi}qZrgM;!aZ!SJdnRZ)-F}th8&9GGWZWabGs(@IfnW!h>FU3D`hIY%P$!LYyh$N36
z39<`}cEU^D7M`Do{TeuEU~R|@UYNbY5#a9AMBi+May8U=OlgAS`tTMRPv#<<ski%^
zy(JegD}Q;Uvm$A#<9U8NBJYQ2<4HdGk3I)qs)k~VoE@u0tLza^cE?TtnF}&1VFeKV
zV%;It32ps&DFdwJ3L+D?O&ZQYya!0)3d>$}?Et{%l5I2cW2^Ecm>MA6Z~@RRWd_Jd
z?|BjA_L=B?5r~agNyixI=S}0%?DH(872qO*-{v=?<nP&w)?L#&bVA_85fI&~GUrgS
zVU@HRhm0k2b}GHPnQ{Dew2HL}(Iqbok5y@J^V?Cd1-a1g(bJq?H`*^(d0$?(V8ge;
zkj;s*_lSZ@e#o+;2%e7#bt3vBt#X>SkOC3){HjPS@qolV@LLpFhp);p#-?3=QXQ}`
zg4>-;)Dv?}q_46(MIT|itdZ}`{jF2&A8B`@Br*mRgSf)=!9f)SZ+mfm(-h9%OkTTr
zsw*Wm`eTiA-)mPYujX1(rR8zv<v~StY~=b<MV7lww3>^~ZWvRobSd-mPR&Dsx%TC?
zBr6moBsNmIL$h0DLQ8ia)!NC;w*Pbz$AZpBJ&Y#hFY8#!qAd5@s+&qorAlev#gb4^
zfVOfUHq*qc`Y<QzfM4P1IwscYe5{4<+g3J^H+S}x6Oh~8+^okxo>bq};b2ND3bl)M
z`VRaHi~C;_bq2g-!C#Gv%1f`sf1k(yJ#gl4BR>N9d&;zR(Y9GriWai)ngVS~P9ef-
zA@V6Q4qY%Ixd|=m@vhl}B~Sa{1_6aujDyt7uN56ui+J6&n>q_$Q3B=2NwlRpl4#}<
zk^jw)*Z0a(LlC~)a&1PBvr=EYn%o`L+%#b8#l<oC2V=|bV9!7eH-g2QR>}cE;v6fM
zOj0zR*d5}x6;q&fxXPG9I1b!_Za_gs`ElEep(V{_;B6~vPo09FH*L7rzB#3um(;hk
zchPkC8kK`T`iW0;9I6i+Oy5mMiZ0E?q!4ec1ntYO_7t-|Nx@%P<KMMB1#O~YVRuZ_
z$MuIIh)^)=1mp>z>}hM7M4-zQBlXrAD5HAr&dHQ67zDriPQ=1_`7*;%e%#T^9E{pD
zF~%RoS>nTg*#Pp#laJqtX*c1)?7r(u`xT{cpcgXIHryL=&Wo0Vlr6}Av=rtPy9&1D
zJIWCK%2MEakWN!*wYx|6b5!$s=F6$#iV*MCPph>+g9SH3nm339ffs`ev1-U=lT8$d
z=|Kj2+i)I}DlZt$Y0+%52QOOK79O^c2Md%PS*CA$(0&UY-@xq%a+3i{dE0)<^oA|0
z`RXwP!_`ZDOavZ*oFvZ1{nxt<hMN5es*3DIeKE7|SfKQL<SWt<qSiGw3Qfl#w&?F!
zC`jlVi35-qGehaX6sq9?K<j-_-j^>sU-$#MwmTwX;xzzJ<2_FNoyaU3A5S92f`v#3
zNXi3QMm3}k{(?peK?o@1g$A`Se(`YAj_kXcE5Q690xB1)DYh;Dw56B-1TTpc{YMzK
zGa}KH{HmrzLg1TM={_}KG3iGmwjXX94!viA$~Z|E*JF|B3&wok?uvH)Kfb;?DC)TV
zc6X6*Nu^6L=<aUm6p-%j4(UZiB&DQNy1To(yAhT~K)ShKe>djF>-~$7VVH4dKRo9-
z=RD`kFJtr1^5ZD>>=bPk39EI)<qi&MJ6<b-%D^fCh|aZLKtWA~&4LrQBGzelFt+?r
zi2Zi2+M<{B`ii}5JR=)pOJ?S40@)z-hO+%vEQ}Q-k~i~@ZV{6Uc23|lHuH!9ee0<@
zd;KZNv*+&&UcG#2<ucL0Y58uxYRhxpxJeBn#Bg80yO+sXn+nqq$sHINKmy_yZUIES
z(Sxsl{+%K6JR<;u)x!#7aAjx!!NaxKs87{qq-v|dsoc1BSpUIg6$pDMuprr@t1}8O
z`t(`Twe9Z}oUi+eEB@)(8Tve6k_^xCU7Xgl{q4O~SbQ+4ZERKMxHFb+pYo&SLyPxk
z(Vtj2a`DzarS<>Yo&W#!PGKqrTz{2tu8n%x|I2s!fBf?i{qM@XM&3y5GzVp$zF9BY
zehZft=<O3XK0grzD0B``jOULy^<QT<bXd3|<`d%vHe(DT%w&$FSoK{$lztQKTcMkL
zI=z0D!p$r4(S-rMox2h6vlN;Lv%gGOR8<N!w%7c|_{Z@2A=qaZZwcJ;a`)U4)xSW3
zH|2I0niMCmK7KEQCWRtqqrt{bm!=?`z**rl0{V!aIcR*O8G^fqd;RcYg}L7P8Dt?B
z6+GrI?d?*x$PwW2C{QFfk!Jf)Ub2`pQiR{0$6}2_F38G9I<>a;wM|zL2Y}mS2V--z
zqJ>ZHb9L7{K}!zX69x50KRdn*CZXUSME#i#%1A3K1&f;s!e8t!r)dY4X#VKW^0M}Q
z!3C-KG4qVw`rv~?o|+8oooGw^d5AcEXK}{}vo-1F@UqrtTpO>QnYRwh@KT**gK5@F
zHPPy^vBfaz+V7#yS+r%jG?I&99rO`GF?Mwe%VeziZz(YkzfoH?e^PnAsuvsN{=`06
zf3Eyv+fL${qE~5F-got#xfn<3W<qkcNb4VE7-Qa1{$2&@LZ2Jv6o?~OHkDssD@r9@
zeO=^qOeJ=5n&`d@Q%wbL<CH}h==n-BaN3m#Bi7)?CX3B2NebTjU5@g#mliHQS$j&G
zQL^p%P(B~X=87K24taqHUl5LrfVE@4{}a5G`R3)bXW7Jiy22r`SSS?2<X9+RQO{#j
z&lcz7*tOeY=PPEBG@&)@!0wunhMg4MS-rcaE7GT%la^!?YoEALGXGdZ`KKkmomS~F
z0S9_S2h3|sclAr6`j>O_>)XL%l#HdoD1zFxTDPya-W|~alKX6{F50_i4yN7?b0%mG
zhk$QwE73fy!UIGKe&dg{H>PurTzz<bb~X)GRNh69>L<7bSx1-E&L0u<&x84M7{Y#y
zA|67^31IV}_lwU+1rrdcqc3++v3n)S87_ve{(PpheU`y0r~8RRQ31mzIGg5+gQp97
z?sjykLJ7lSTJD(jY$->7LW4h3+jS3<OfDqWaR$s~9by_g{aW(Eh~BHh;g{&%LROF*
zaLAOeUx^8#<Z;ZTqL3xEoVu{b*INI=>vd^kP0a0(5k@AYr}BN2JPDB;Z%)TWjQBFR
zK2~Z>ifr){=3><q*gKbr*MS9331_#azJ6Xu#gV8Lu+MIVbFDJ31S8;}IauB9c~bvE
z!+JYB(yRl&`$N*X8sygN@WJBFBE4i#FdsFEh3i3+Eu!38=&0?<*W=-0&X(~si?JKZ
z;~<ILDz@8xkF)>DtOc|c8yWMc8B?ry{e*h}Co6@~twZY}|KW>^QoH{=hS7D_zkZ+|
zl8%5#^6i1d=5yZo2e506Dpz0qW0-e{Rs){vK+K;kB<c9iqtN1luFPl|rsmtU&lML?
z^BQSSHS>XfWvVteC00V&C8C4DoKPZnJ;zDrfsZI^4b(J8X>@OI3$dwJa7qi+A5SKO
z)cbvy?Bh_|cvO2a_us?>xqiGFN12A?vYpERnxYI8OD5Wgo|*lrQ1JpsBE!w$$8(VS
z^U}GPeSWV|TiKkt&I}=5qYStSO?Ixl&qa%B=Dgf3Wmjax54Z+-DRsoE5cq3OI8MT5
zSTg=lg+6VZHKVe*QXn=>IMnU&B*Yz!H8tO1?@E!#Zft4LNLeLaNm$9RRhMSYti_>2
zT(-TP7g5{esDyd{T+gGjCR18(d4f7%#`J2qL!6agNL$x1%Qd#()xkkBJYIIt<jKc#
zK(i0+2aR!)^bgTmYp$ZK;#FcIZJc+{R*en)bo&iwdbJwPDrO38MI#o<;=>q5W9Si8
z>u6!OO;oc3hQ^J9rhS;<!e*!<^eycA&WM~N9~ZtW`U^MObH}}L$r5d3qA!RHiDSQ+
zjF*r)ZiRk^NUGq}S{H>%4_%T@;;C>=V2ta_^_48mk`udg61<n28r`RC*t(Ig%#;xs
zSB1@gS9}!+R6Nw~HgHknEplpdBg680dU}u;Pp2-0eWnqbAo{0O$Jmr|%=lwJf4)IL
z@~87R^*3uE2-u`Yq;`7*Y8D>vj%5L}*}4Rj{`n^q7pY$YpOt>kkjop0kc%F{LM%dR
zK~a{TM=*9Uw|33QySZ20n|XT!@#aTi=JcZ#`Eg0laDt`zYz^5wFf-oCyD7MOe>2n{
zgX`^Oz(0`~ZgP@6^dm>s7-JkVJt6pRO%5;4VO}?S4B=^(8~FEt2?X}@v*fzId>%3!
zrB;7oFwYpMJ3ZqLQ&o)}!d2I?bf7DD{O}=jB$P8Q)T-Tc9O5&9^zbstUd|s59HTC_
zLIjWN)_iCC-T~~q>YYoqS_>@FvHJHemaJeki()@Rb5*(yj)BfLrYroftd7y$-ZnEc
za|-xY2JQXsv^DGOQo~>ONyku1V<P&99Sy(8&@f_A@1uhY3#Jgu^hcTBDvJsk1+qz!
z;yY*Jo5%14av+>I<*JuxnMTwOvjDgBGfn-sUs|WJV{UGa#z(b8y^p#<kEUqH?fn4l
zFxM7pdrPJbm-I8HFZBD5PxrsRc`^s(#=4tJ`V{{EdB8akjBek!{k!G#V%Vh1$OyEj
z*9uK;_yg6vZ%dQR04!~L@_Ij+j0h_^F3t9+94XsZH2ZzA$V+(+r_&A}liLKlS!4Wo
zjlf|o+{zVI+<2xUS)05=w1(XTLsmm6e43*d4TeO?$lyGl8jd2BoX@#3bJEG8(K1>h
z&U-meXoJ%<pMtKYyiCQaNCY=+HS5?Y^W+a0R4yme4`+SZ-H%gVcip+fje`5D4+-ME
zrFtJw%H>C~_hVL8b=BYY>9k1Q(!lT9KO)Pd+sS~eJ6ta+c!;-<)thY<%8(TfOBpL}
zV>TLBwGfRC*tv8}v|+96LBnA<9&W364aWmDtc*gkt-2{p$v8?auC71ARMnS;dN1R^
z4T;+}#PhRAh?ahrt&QPvT!Z$lLJGb4cZ?3UuDYU`P2V#{O$y!Eu;dXz*<se{m};s6
zEsCX4^t!79DtA)SV>$!l&uOi(ou-_L5eY7Sk%g&8YNnF@de<Q5aK4MuEpa^Cal7X$
zVp=KLY+c2ux9Eu@E%O0?KzUAUiLP_6wKn#njCCL{Hn9tSxL6kv;um$B;;7Tb`m_NH
z`Sx<Zlq%`j*cU3KG`Nj-E;7ly#G5$USq+jWWWsA1A^~Xc(d;rnKA_LCar7*8b1j#P
zvbl=sjDKw}{a7HZNUVHJ0z8Ab&tjA(ZyA$-2I?5E<CZz{_J^yrHJDWIvw4<!^GbcN
zvWdbf!m^aWG2B>*hM9g1yQHrNXTlQM8;;>XU=)Svm~S2)3t~~8t4Qad6zWXLjA)Hj
zQhdajm47}?(STq|b<WSC&#qvohrq#6rv{THEov|~GfONj8%Z`7rZ1-!rgv}uI5ZWJ
zyj_}MtzZ`cP<`@%uZ~0StBzk6`spBD83D|@zXN$`tr#y{HljU$7<1f;!h?SR^V?NP
z-D)&&dzx$wu>7+WaMbd&%ypWED#mjJD0+tV_~*x8Z-fcP1pkCdoSX8ShwvJFm_<el
zF=ieI>S5dH+iphe4-+3#h)1F3)UjBh^KjAP^0iD%_igAM>HZ!u<3<)HeqeodChAy)
z#_-0e9Lebx|JmOa8X?l(BnX|@Y?Dxu-iY~YN`JawF^`3~IY|sS%26s8NRuAjDA8+?
zm}GOt6`g%r-%tUqGSvU`jkdo6l3Xghmg8<e>wwkUaUBr<pDzYn>cA9U@kY3sKgTV$
zwv;BoSz3e)#}yiAHg-l^LO*dPW*IA(2NKVip8C<=S9=)SCZ5wPS?qtw+~zG@{(*KF
z_xA1GmiS=-#5TNy#_4KV{`5eoByuVjGj<Q#b0FJrzdBf!9)=f&myr&MvJJ)%F7B-p
zReE&&Vsz0Wf3QQ(7(exRlG)gmJJ|E|;SJ(`b)meQt6JWS$iBu>k&^D4E)59fra0-I
zJn4-0`?AbZonKSVX1>&CYHCAasJ%nMk{HS;^!uv1`0;dhPfAChTx#CoT=G4BdwH|f
zV4Tg&M5l!ZN<uOU_VaWrxj$SKXXT~SeJrYOqA#<I9g2^WE<1E-u$A%KOUG`I{koue
zGnte?a@LCkAg(m0<#<^f5*029gg04w1yFJbIWWW5cvN;qloBvd7{v!^H%`}!Yn<k=
zt+S<8EEEOm%gz}Gqg`~3HC=V=yevZx^CJda^THzwx=<-XIW#M~C6HU>*aC@vE4c1v
z9Zd2U=he_8Bo>V4LS_m)puEJz1trC8EUy`$LA4ycnI|@A*gdXgb?Tghg(VkA7<Gj)
z3>SRUHFyMW7Yc}UY!_%W4p)0|C?Vl9>RK9?B<6D!#(hN3P~gas^_EkV&YuvC_-}W!
zasa>w5)l?=TyG`ib0a`QA(0_fBDc%a>Gs&mi617!F2~}U0xcrt$!%k-lN%S*aW|Sx
z_bYR=iMg5zeUl`1?;TG!KLUS&rxJidGRGvHExIj+qVEV&<==mE`gVyUmFO-kDU*O~
zu4P*}4+noDx(&P-PjA?>KHKMGwhRT_^opUK6RxhVrxCozYO2)lN**SzzrBrMPN)<&
zp5ihIGHYl^Ew<eq&z#ItBnvPEOFNz*n!OV8O&P^+*#9XaDUg(mU5ljMRC@5c4mU$x
zT}{UyQ!RnB_&ZB+VsnA<sskoD?LpQT*CnDFp}^Kmp$oVO8lw>#*-l6mSYsq{{r>(J
zreEaUaogJL@I80;QOngT=PO%L8>26uUMpJ5jmqoxzn*r^ORK<fK@TLMNilXZRRn)s
zV1lX5qOHrM)vdTC)9be`FZPF5biWbW&Q`*oMV6D5+qdYG_5j55-|O5F1Hu(mW+Tys
z`$Pkyzuy!<dA%I}-?#QZ9^iTmjsy8+jOriW|NJEX{+J-&U*LOKeU<ps1_gE06b@Mj
zuu~a9S;RqjrD2IYh|#&s@jn&(*kqb3)U>eCoksER23q$GWCm2pozf>o2e{nT0=v$A
zymYJX`%F=@GYd3*-E<1%Ugbtq3rs)6fMK3V$il^18ALcsc<P@}C8eRMp!#d%JoB*$
zua?WZqu;V7mv^|Vxqjv&S#2iZMM~6&iu!I0Rpe>A8>rVr@3j(2Oc-h5VcKD|lG0hj
z)gXL%DNgEXH5GnDh}^&a=<!>Z&MFz6*pR%n=oMG_%yvy*q5#3J?{xK4=B5|XIj63-
z(c`$avb9y(PUi#Vkk!l6@kfLlc70M@K8*1lB1Gix>I7~jNG<SYN9Fv6DP-ze6}Kc8
zrs;GJ^>HrkxwujTo5s)PgRL}ONk5OOpCdZV4TL3z=EO(vnOfQJX+=JFrnj!+piXHP
zzseN%eJFYD)cxhv<a7DRB#gtr=OtC(CZ}HwL*YY<F-a_$qp8t3<7@4$(LXWjelPB?
z*5tpn(f*-V|L`UP11YvhWoLOS*(#?vcYs7ZSo)z>CeSc_joNw$hjC;hZ~DocKs(?e
zJ=A~M)zt0sIfQ+_%3Lwv{1ehTF!!#|UZ${`hWrgLg2@?(j6y;5j9K;GNER&IHj~Kt
zFSxNz&N`6E*y}Ww<%2NE>>d!L2teYiVm3u83?LOSwue13X$@m3MxCW4C}Nk8Co{KD
z0WPl3H+TysU#yrXR8-60aCX`;8WEnZAA9-sGxdZXS4yjAVEE1p0z6oB0!i?=owF74
zqontSNxn)^iS%8M>+<adF;1zDVMO-%YoyWw?iM1c0^?-I5TyEPbN2o*Cg#ZM`g#qA
z14Omf<JLQPX3(q2{5RN?VO;&}yCCkt<!;O|2IxaoE2iKleUTkZv`gS@G-+i56#ka<
zO?j+2bS=*&P%PN^VCE_!khk|`fFRCg8t-K+?`cLvjnW*D!h+yIh?)_KaKLxmY;5eW
z4m5yJ0DOJr6&9Cp30xcvI!1c7UypQ<K{o9eg@FGjA-*Crq6KX%%$RW-n0K_atnPDE
z>E4qYVXp)hXGNZ{g05dPk~7$~ir^o4W5T*_^gd`j&9yzc-bIWgUo{?8mD1d$gWHx|
z9)JDkO|%};)Bxbrqiy2dy{7-PssecTf6dY(57dxlLEHq^3`VDC;VC@sfo+18TleSu
zj1?=Wtnk8^ug^iWSek963#>#AI3U?yMfDI*`{Lqgl`<doTxxo+*?8ok*i7+gRQ4ht
z7|RmQ&oB}r+>r1hm10P?npD=qByy@)o>Xm4|Ltjl_g+Y#a;{yeWY{t76H7s!$j^aS
zoN>*SIK#gudBl*YNtSr1R#r<Czu_WzAGQ=$X!>4^)80%q+d7S}3cwfB<)Q`m`H5w+
zL|cDwI9giRM6Iq=<*1BG+67hnYzgT{e;g`;XZqa9mhv_V)|E&w>MK(Ukxs}fkWR~=
z2mKbKZtBC~yz6MvhBs6q@f^dI33;-|XOj~XX=5Z@f9SX-%B#!!6D+w(Nwn8oM)au<
zp<gk^MB6Pmb^5nZsDl?tlh#yF-TF7sFQ7;Vda2xUl*b=4Zt@>t<-e@P#GNOv-4@>6
z+F0(V6uxCFcT-2<Y|$r^9+>5rD)o9kyxeG<SAB}TCp<DR?}&I@tKMs}6{lqx_KUgT
zY*PQ2c!=0^+nLx@1(DgtpI1VnG_DEdjHZQIUqvjZn!Rtv|Kl%Fr*Tvz`*s+(^3xxq
zg3?k>i$6e3GzT*lzRE2q0CGJMkwtmj?hgy*M-YS{LS8D@Sxmg~0Ib<1N0DL}EaO<9
zDA8uO6Xh$m_A)T%GfFr_DVuEFP*=C4^8lK)&-bSbx8rca10;tY`KH2+rugI2T&H_U
z*Zpg<eFEau21%BDMXpE=i2Yl9)l=gmwea}ToAFtUS!anF0r}&KPojp?m?m9c(Q~mK
z6Z5>Tj-2KVgQPP%<8uSkUY}cb&}hl3DbxZPS2U42CI*LpufB{BH6DAId|wlD*|FO$
zP*vN{v`NAfEk_$kR1kY-ZW=2-`1_3j%C3;#qxS)j@2|SF6yeqG=`ciT&n{|y4s;uS
zILd6JnEw@UJ08U6h44()kmMLXUt_IK!^p_#P~F_Dqvv~L+VKakPh&f8EL%Ee_#@{R
zDz|LcB}Qjv%!|w~_noPZhn56Oe-djQ@D{kzEX~^-gD4bF*BYGj{x(wJW$Cy1)|#Ii
z3k+kA5{#XjlZ*`yka#O@k0et8Ri3r%H+CsbgEX}m%Z}g_=d;ji23^Hm{C^KZw~qik
z)x9_YVCsK@um3eGt^dx-V)yo)r#w0=9V5l0S;<!B+@g{Ag7qCiu_me3&SW*5$ij%a
zL2-A64}CMKrvYV06hUFXU+4Ioo{$ALvIS`%7|nc`J_1!h^)$h^pYI@(@KFX$$vO|Z
zLiiFFQ`{F(8!D1%?OY5dRf5onCOly-gUR7@oV|~+6h2McQdEIXB?tQMbsY}LOGU|W
ze%D|hWAU0pt`C{>WXB8-o^FdA*Hq0V8v1Yb`Hdq;^2v|FSbR)Ad<@WOvdNpaocvCz
z^yUUsKq{j%=k*6!dn<FK#_2GM!s!HOT@TcUL%7VO_!Uj5MdOMJXW6Q(#j9ZXuA7K(
zl}a7smF7EZcg{g;S-PC&TFs=T$!u-C#%0G#6he-SDwCJUJ}<`Cr%@)~FH33Ln$u44
zJnz_VwPHo;+CWL3)i<0k?<2~pksuA2!Bw*q4Yh^o{*<>O-l%l(`Jp=7hr25$TFJ|G
z^s{KD<`NUybyRE_b#7xY{~flW2z)%0aty3hvbu?_(e{a1O}+uabfYj~ko>a#jpm)@
zR4z@JrbRo2kjI#oL(mG~D0sN{5)%v9G6Ln5;$LH8VUgnnDfWT}001>buC>gOh<Y8_
zN-EL`N`&aMV*Um@QJ6^@uvnRYe*<Du>3F}=0Z*`?zw7HEInO&8WyAj?>eHCk5fM=d
z3X4UlS5s0K8Hk0uKfjudbpMt|T;ghr6u}y|oW%xZFTk=@(OLDh_TTGmj#Yr_M5Hr|
zNE8v%Dw!9iIc`YYNbE!!$CsLeVbMPABDDZkzBJqHML+F->ldeO-!gM)d$KOVDshqH
z5Q{)Pyc#K{<F5nt;snBTypUi3NNwJd#~8M4v@EjB%dmGyHI)ZDn0~i-`jm<3)gw;E
z2$}#zOr}?LG#JRY&+#K%2m-&@>1>2+$>X(~h=@p&G0QRO7~)x^eZ7UT0`zurG$BJ|
z-hQ8^IL0?@XB4-0(?yPtWgzO_1NmD?NlA@Q`(A>xypGYAm$M_>`(56LV1@c3wUWxx
z!_8o-H0qwlc%Vp|6MyUWtHc1^uAN^SkKzPb8rH(`f8byLJBf2#46KMxqfN)w?*Bln
z{$p8xNt{>iJ<hkPxa(BA#;#kFJapoW0(RecBWclcgw>8a=?S^W*R~<~)*oT^V&XC0
z2Ze#Xe7fi8fku7jk>0M%9Mmcu#hkv3r0(-(ft0v*D}mvY3E;0EH)MlbP;|0Nr87s7
zckE-xgz6^^$~Q50X{IFH<Uf}#{=$axm{D6K#V0e0dAdhKT*J2>Vq~h6-Arp7Z_2#l
zhK54vOm{Q98-DGmWLI<Rca$l<5=#k6)1_KVuMjqiIA#doGabCI<h>cV<J)SJbdA9d
zZ93Y(Sju+3uj?%TPL1Yue*SpcgK#TjCh@G!^>;K4_E$QKOBNU>yiuN1&9CsNX{@bP
z{1)Gg_R}K$%*Fm~{!6#PgEx||Tw~=_L4Q`Yed*j&KG6F#nuw4V_7Z_pYZ6qL>637E
zWA=^7-;t+&E~gm=&UH_8Wl9^xAYEn>?QD0mjafR2Nk%WC@`)vzHB>^2SJbG8>*i=;
z^S!LS3S)Mcp9^rw&dm*w=`X*VL5HfEZOJBercO{&O<hy1IB?o2nQyx2%34|$_y^Oe
zm$F}fPY*$c+%L|x=9Xq3+86qVWmo##aR$;7<D!HeD7LF7-kE~X8m92Sl>??8JZ$C@
zKp>2DU-OwG?+C!)?O*2dM@DFtA`^b!3t^Ffy)mc#{2rm6C_5vS328}^q<7snB$<ZX
zB&jp3dn0kuk$+6*wfa#kNcR+N8rp3UX_9=Dc=XmQ!q|%4eL9`xHGVJnL#+b_&byrV
z2LrLVbZRIOr4x;l+3v@y+t8&lef<M<{WSxa>9f@hZ<3Doz5VmSq|>w0cj_G<E`KVf
z3$hA}s0r`8ujx_)<yQgCPmjo)+rZpr8JR#l!O;bCX}-Nhk~#yFny92CB5nP&UZfBT
z#=uA3oW~WV9Ti=#kkx=VFtcf@j)?w|&iSS&SLt|=hog?^!!i$9HH$eAtmmH#1aih7
zls1i~s15}D@%mj8??2O>?KdC8jIU7Hy{*7!tU-4to313;T)qbUpXuPzYf62$i9z*Y
z<|EZWtNkWYxQdY3Fo8De7|!+qLFh4NBddBpqWk(^8|do5)fa4qNT16E$)suVTSdRy
znC6@9<U;ollkJlyd{4LMHurWeUp+21{sl*$(*9Db#|_7=R{xrN*Y~vR!iPKV_WV_f
zAN&EzG-<P@a;+S~BWpOy9+>YCoZ768zZaeA68w>zGc$iGnXU*voV*r;fOEp{>{$`U
zz=*{xl_3NE_AyAKhAnVovPdi%q<r#$sOcdM2q>`{XW<%IAXn$F(KDov>XN`8n431_
zkR>&EQhTkFBwDfnO~=^(K_>vMd`C<*{T-LQdGM=Q!_l6r)7Wwebk}t7LMWa7E@Cft
zeV=N~aY&2~j?dLh^<93C3LV<rlHsuXHrWcEBZefK$*YdETqNrE=CRqmw*P)m;$|^E
zWGj-UC7QWdYDa;PRrA+s%6hkq-he*?l&(}2f6>`jK!4V*IL0n@()8jofwk0jQryq#
zF*`<qHS%}!*=P(R>T0y)QN7v`zj5R_!*sgSoZv530=$yU=g$?qXP#jx(-;OCa;VSd
zE2PmhrduN1N-!6@*;|j_4ASBhhwE^=W{bL(R900E=olKyk08lF6qdYsC1V=9N451{
zV~#8_UdZ!`U$$X<rD#LhC>`IbO~9rsjlXB-AE#(v4I=Zkz(}3SmA4Lp@ECvm_z{U2
za{7x?OJ6_zi|AW&oQ%lNU4Z{c0B3mkM@R_tSKcqjc{tS$7z{>7$VP#o&=bNYKm;#?
zIBy|Tkiy9zHz?K{9`GxtRc##TPU^j7)_6KEBh)xC{w1tOEim9YA*fG{G-lj`#+G3p
zqsYK2bak)mR<s$UZp9S-9ET7biBxf*;WZcV3@r?s+9RBZLzz-OB|p+F&9ZA5;ACnQ
zMkc>X92m;O(ch(%l3P-_e*0+Ak`da`yVB^YlE6wiCcvd#+ImYgL-`sIX;^)ixm}aP
z$!9Zg|MU~fJD8Ya>H~l=IliX+s3QQGn1Gag667@b$^|-3RnGA68G|y`_lx`Ogo4gd
zw-KfXCNup-JHR6-OZtZ5F+|HUHoUL3SulECke-3XcUFN1tsod88J5)MCYz3-yTCaz
zd{pYIFMoCG&`NFCk`nG<)~RueP&Jw^w6?v~)T#H94c^68LBrkd_Pem$&*}FxIGIVK
zyxj=<dz&n12adt)^Sfql@b=;W_nW#c+qr$r1K21VPhhDLRXTpd!uCUeU*o^Fy|w^g
z<~{NqR+dft3wOFv0l0G|)osZ6L5L2dv@oqiLs&3!s*7kug}L{$T{Zb!wch13q%119
zuu~4Iz(HN_{zM1RAyjjNSKsNQvaXH_$n)M*)CWPjjjXMN>8nkjJrR;4q9W!Et}t$V
zz+dsNB*Lj~mN$Od{!?ScyF`fqbS@7dU;T)F#j_Yb>emG7HKRe})99FA6<>(HVd>MD
zEKoPNS_tIZiVjkjO&z^j%ljT{zt4L*1HRleZEfuE-TbT$KWz0-F4S7CEfnRYTX!GI
z_KhwvAh6h=+b8mxXwuG+@u-}d;cy=w7abTUk*bSnoCTyun;nwKU%IkB^skxn>5jfn
zJ90_(r2z?LCg!<=8y7XF?bb`CovShEt<TE&u9ls*w&L}o`;MEWj|8om2$ixiD&*`U
zN@&>}=tITqT&>s%@TfIN4IKSB+%-nj5u;pE44qv{cx!8#WwZ_s*yE6<zW9GFI!H3z
zYovAc>9LG$nHKmB>YD9K+S&``Gr9cfWN9^<?)QY>Ri681heIt3%RLJm3}iCSoU51s
zA6r(7aq<B58=AW^?=3o3oB47Jsh4=qQV=(6Y;2~BM3&y<srDjZLm&{ejo9Y|DD3rs
z%I=~0T5b?vI%q+ur2ZOd4Io=SNGLx7I+8{7wNCdlVfY3Q8=F|4xbT}}!X$({5q+qu
zjt#RhNL~!wYhnkQ#mXW);kcb#<lX?aK$I#KN~!g}{gjk&Mt63g!gKsvASeunfgiSj
zz4F7{)M|9eEvWQmS#GY@OXyv$#Z$j6PY7v`%AD>9ZqR&l^C-01jq~b5yV1Iuu&jZM
zf$}T|Q2!M0J`o>Afbye--0#RjTIli!kSSPEVtfxZ{an*l0J2H`02ETmduqUMolE8=
zvYdhNo2*0tlI4LZOwW=Ke<Mc9gO!(`-w#qIS9bEf{uQ)!dr)RCgj@~e5-hs>&ga?`
z)5*{%Rg#RrIn9dD`S$SV&vcdBz9kjc><Al6zB&H|u)%T0YxJTKvUVHj-A;b52|U9(
ze{DZ2=?7iQnbY@M+1`8rqIlwB6a^PZ9C*%Bq6pc{`e$vIezu9Y>}$9%X!0OFu_Et9
zsN7ZkOEmPZ{X6>>_K&OnMa97AP8|QPeD!Z0Tl;9o7gHiNd;)RYWMcGRvAu6B2%t6C
zc^7CLigU>RO0k0y)M*v?hUxB1MzcOw&CJ_6UydY!ibhx)IwS)!A_R5e%dBe#gUwAd
zJF8Z2^04&fjGN1=b$mY^%Pi=vWJg*gh3(EsV~{P$lNvZ53VgXwKY~>Rrm~rs_#vKr
z?y?OUl~39{Ww<!aYKk8MTAWXF3VgQO#$LUB@N!e;KFo^v;VRGiJDX=xX_g!xjUhU*
zhz{PIxdPwy)iu$Smn+q7RncRxj@^j%4lrzT{ot;cnoOX3%4V`${$}8#`FsS6p~jqD
z;Sc@Q`_|^mQ8&VsvMQ1$eWn0&<3D%}XE`IMvxU4jwU6{X7`ei>=6+Z79*;LWTTGb4
zv0kG@v^`L$-%mbzPd4B$oja_&em;q<xYgQ6YwV3Q1ASy|FQscB!(5B9r0NRQ1?7*g
zxp<l_Icl}BTtq0uBIS*FhvqN)>B=I8e9CO&+~@M?EVN;UPekt?r8@jpRb=@oE56bq
z+&Z*8lc8r~;-bb{cN&PMKtg~V{~{rViKG}hdWH8GDeLO4q#1xP!Ot2%5XTV2<?JT}
zOn!2}i=&2&BTKg41)_tHL-dfaSlYk9Vh>+~-uzzP>k=m;f4|sJtbmDHP80bi@EWX#
z#<H~NqF8P5?ULs$?BzAvXR2U;q<EHODhGc?+=J2Zl5LRiMA>=LL%YUa>*co|U6&uc
z-9TWpj^TP2n$5^?e^~2clCYRq3p-81!eDdCJ4AzELY_IwH4ZZcyV?kb@)i*LE5J$f
zdk&SUnS4&yJ#~xOYML666Zyb$x(#8UJe1SJ<ED1jMPLeiZCX+s{*cCHpY|Iyq6C@5
z0VYyd{h>dgRpcOp%}0#bRU|+vNGct){xZniDN`S&&Z9V875BF;FMndcm)Jfw9!D?F
zL4rHEI*ZFg{O<e(mMqC>CX?-QVo+zwYri8LCp4CNXHJl@7@vDD8(BqHGw@gS`^Z|8
zyZun2#;|xZGv;PJtm9@h1N{#WmSqB@Q*9RxbL&Kp@gC3vPUs4PVpRNJ#CG)}wKO=g
za*W%QT&?D}w3-dNI3W)<k9v`H|D;^5=jZ@j*{0{5{?Eau<KLD8ERBA$r1nc)I2JMQ
z<@`hi^_aXcM`Nlm$t>)O#61XEEtT-4)nB3J2Y349bw&v_+9#ef_Q&eq_Zhg#&0vhD
z30G`u$VeVMPDpmUh%?hacp#s%3Uf9h^iaAiM<mtXZ&b{j#@D&ah#GHPCZ$Hvirv8n
z>qTz1iI&uL4W@##5G5C!NU`TyHTUB*$9Z%^a6(80$Q2vi9<5P|G@Xm>l*+FrW=?mL
zmvHlkV`ayPsiv+DN*t`<yMw&?e)d5r-V^)<GZ($CK6kWXjas^@MKij!MS^}?<BzP4
z@6`vC9q`q4VV#dHyaVMM{3AS&H4UnYL7bm02f-XpX9#rJ)Lgo)4T_k7-nd^?=D&X|
zURa=37phQGu0n<X3}uYYOY<BgQB>srwRGB<va=QCWnL(Ds6?1+EN6~xbyR-hXHlw^
z%}j-5=kRrlbV_=JuEaX3x**Fqxidqi&ywQaDcOcGbl_B;BU<Tt#y~WB<`UGUTxaGL
zuzY(@xuCp|y<NTkGbx6tV9)Qjx3$O<BAIOo!=#3`U0<I4T5B%0!#a?DWCCbvh3?4!
zCg$7z#skoS0r#*on3%Pd6<Th$C3|}isJz_|;6GtFFi``E_KqCc_`$=4Ds<sz%iTZl
z^5Z<H+x^0JjJ!eA2oBQvQ)+k7RAZU;pcjrB@`|#ek&E9wZyf`<4Fy5!X<1h&pV55$
zKhTUkcl|O$aQ@uDBq6j_c&xn+M?P6`DEJXBnudzsYK@UuUv^Y?+^U>W{w}8`XQ6j?
zZl)-hIr3QYMhp2wLqNM8gN@1>@%|aJ!~sy;K4d+T#No8{LmfKW0!u(9{RF#|uSozk
z3g?~gD1?>c8U6eNxc1QTc6>IvgCS`0&wV`1$hy)dzkiyZ2nubKlC(U=2RKjg=NvK*
ztWd||APo->52Ou<obw}N+r3lA0?#=imt9J@h~jpp;33tYuG>%B#eofCddmw;N3oG?
z58PufPDu7hHl~6&oVFM4sM0=lwyTmKM@PRbLanGr#){`-rniQ=dh3IXiV6#NX>)RN
zwzXCO0mzHWZ?<chyEmH7*?HUF66lcpK#W=ZTd7!j`yZaT_O|f9m~+XdhH3hrm=pUi
z=9K3goVs_x0U20Z<*Q!TXtvh)G2Lv`A3=9>`ng?&fB#6w?TDAlIU#nK;thPq<ZJRH
z#ZgH=kyllO$6(&9C1dlP3~{Yr2`4o4RRc}=MX*A}pf|XumgXMU7$cCw-qW|GxxQYM
zQ=MI$Iq|Y1m_t8vGA8#TM&!Y(pDay}k&d$f`*r5U;CS<$+eq|-Eb3N0!fijbYsJWi
zzNLsj_QcHwansX-AoYRVkorTR%;fv)^AD`PpQ20(nyjiyEyH;m^&IbvZVbe0EHw7C
zVkz#z_87&GH~5nZ8!S}AXEe_UGfy120>2<MO9<jZJ0EXu!kuPx_q7T)+t^Esc#h4i
z1VPpBmM7!hFnKFcUge7&3f>)2t=+9&!GWD33LqZ`xLPmCSg!!9^Vn~$0aA0cD9490
zRgLiCcz^HmlG~)tTZcfzuQRe-ih&^;SzL{atK+(N>a!Fk1GiQMc5>9~Qn}q>8Qbev
z#OnE{zdz16T@7jHFy@Y%Ykf7@rbSC8dZ=!~xRrz6{IWnxc;1emA(qkod#Mg}eE%yt
z@m~zOPtw@-=<+}ia0x>IU$`C48%D$*V!ML8K``!-p9On`bXgeGc<aXvJ89TD!v1eC
z1+NVdDE9h3K`ZJlsPsZ1kt2(}0-5-T-=bKA1Hf9<NDm-Ud09wBwd0FqzCac*e>L<0
z#da9gLHa2Y`+*N{5n@A_p)-pgh>S)N<PsW_%j6iyu=Z&aJuqkp4xr8-G%C6Ci!U7m
zU%8?eKubCELmjI|yHen0;)W}#56az}`@+RRO&@nC@Owd8ZhOk)Jv|hQtJz*PVrkx|
z(g>8AUDE*=v7?JrgB)E(5XYZX&g&<#hNPeZ;iSLHcVi>(%I3s2zbpy#DiVL(EMJnX
zUFYaG50&v`dT48P7N#>BnU6;<Xh2z#&nLK#$kBB>Y&{N|FQfhR_~7oZ6ifzX3GUGP
zHpgPt@6SIT;0`tZWY$`qx7(?)ZBi18g=y<hvQljsvn6EIjiR09I{7{0g@;2$?a!Y-
zFaLD=Ud*Wf_Ua)3ou7>f={qD-a5??r>%5Bm17^<y7)QWux3vCfp6;VIrWR`APJ1tB
zcw27Q_Ah+dE~F1eHhQ`tx<mUHZMqJ<xBsi+`(?#lt-Qry-Wh3h8W@uKK}PbiIHEZ9
z9T%T`?%|9$FAcd>MD~de)ELrZH@`}aI;%Pa81?vN1q>+K;~%a2{^aKo%;l96V)E0;
znJUqz;Ezqy;8?6vp5%6>*lLlfx0kZ4((0%Ei3m&J{wNWVY68*`^9i@nxXf*?0E%eP
zh~91XDn|a<>?6kEG9M-JxcH%NvKNiXv13NKOeZ;dvjO5UI)0^`zi!nRJzf(#*SmEp
zIhU_}h+(OmH~pszb?ZwO(f}CSOR6oc;THRdq0+%JP_<B{IH#Z?>dnEh($1p)K9n!t
z-W<VE6H5O34j_>xcDVWx#!6M@7IAn?RHI0;9ocYn5O>2v81;~+X>B}XF12fO2A1(1
zo0_jTLbtxXZKc<rI0)z39vV*eW2*BrFPBpj=9$#YLk^qq%OzB(O59%z(Jtw9jLvk9
zL`!nhaL{4+q;6L-)uJM45J0FIbc6>hIVy;DbDQDd9NM(EjpsR5Pmr~@YJ8OQR`4Ii
z_4gnZeLNuJn9J2DVecbG19ey6=3|Xx&wT*309PM_0E=&mwROHX^_%n>b54$2WL*>1
z35tO5IU!=P&_mmCg(FYrjlU<-(To8MhZ~q20{O}f3T%!+Z6|lG-6xcL_eSGK1<p2D
z3++r(C`0Wx=6Qe5Cr0R>J=tFhM>vanLn7;Z3(H~F7F9j7B6#0@yQ#|7iDb}biNkY{
zDMG+0OVc<ikxr%HZhf9pDVmRwtdes?irq2RRw|(Ch}WJjZ`$W(Gk7AgkE%K>@#^Lx
z{eU7Q)9!D-wo#gVA3Oo4H5YtV+rEb7?N`kB*IwvRUplJ^2bRaVcHbYthxMwM+T;JW
zHZ|WJH6gJfctMONg?4*W-Dd}qx*8|moFB}`bDSvn-Hxa4I7DIoK4c=NznFH+!=Sz_
zZ90lZM8!+^SshNoQ%S0d&cm$u34>=M-Zju$Os_i!lSmnV6#s#`I*26&m2vd74_FJI
zLCXZ+$Klh~t5LCfZSn^L61$e+KDG)_)*OwFg5eWm{W^q@*#OpKj^Tv#ZR@8H5eUMT
zR%yG$=>hDUrrX1b%4IhuJG?m7o!3GCc>^p5zAt?Es<oq)|6kna{BPjxxz#PPDqc@1
zWpKQR(GaUSKZ>Ridg?Wx86Ju}x=CcstQTG}#yw#}nWE;lRFTv`Sji87^}LQVXK1E%
z?b#_sl)!$EJ*v3*fQwUfV)3kp_8xhsFU7N^vRG%d&ABEvVojg1`9u_<nzQHtXcZ+j
zX@3L4N4!!56^lRzPVa&H)%~#*A-bBGkIIX6F(rGE6D#lNQlI@4O@dX>)lLtgSIrI;
zyAKV&z;&omzp_c>Z)^%vsaw$7#|XVMwNprP8C8oPOmW##RLRlPRpTl$W`vz|=4_pA
z-<c|ZOpX)*A|)5Ui7t3K_;*xpqZFa4i)k?2W-=xdDa{^QM6L-mD)YMTy;j$84D3j{
zkG<z=eRSoyM-3W`?g`zhQ`ckk<8RQwAW+K}E-ozML8#JvH~VVY@WSq>yjamyY(r_V
z5c{;Fk+$GF#m^E${`g+h((=Qd?U01~54yH<Hs3X!wIm`;%yz`@UVirJy~1-P2rtND
zaUhQ<7cOuA1Y{$)al)|tFF@E}bWFZO<_=q&Pm!Lt;G;hn!vq=c7whxIP>;e;8Pj0?
zV?s~O;d$tvu&}DM>+Et-jA;(#b9pav3yK&=Q@gF!n0_O?mwNs%keZ%CWd<V_BYq$l
z<HPsa9lL?2MG^KGF@PeA0|jxmbCvqUpCVDMAzEAX5{<k3o_H{YU^Z=CM;fY>6WhJH
zvh>k-N_l7wYikV$gvno56aN^lc%Nbu_?bh3ID=zHcd5W!m(WvCRyIf$pkL4L8dTIu
zv?$ojhRbg}FLz(x9o408{}i^7ct*8JJCr1r*4;4>fAQfv_Q~Ijv2{k*l_qzt-58(e
zo{pFxn{oddmAMMV`SkH10qEID7~`_0P$R^<l9I9aOQqwc#LddFuQ^6-H}abm>#~;O
z#ENrMxrAi*ZE!jI*_VWKL;L>l&{p`1jqz7bVV5~Gm#@ze-%yh2=<RXoWE!95rd?r$
zRtyI-THvRK_tW6V&tVGPkDnrY3hbmfn*ecam!tRH2Mbks;EL{^oJ1c3fxmJ_Ub?TA
z!#AL=!)FVScczaOQsHpdJMZ=j!>RkDe<=;=jeoVh{b*0&e?2w_#K+fv*_I&qSw~Y5
zB&1CGO>TxkvtI8H_`p>wzmn55X>GP-DcZpb4TSm^vts}UmYRrAT36HRTS~Qq-M$&{
zAiM6l4?Z>L^Hwb(Pz$JMf2COCBDXcXvLsh}w9Pn?el>~)2+b(~Oi~S`v~L-e@a?_{
z-7SovUGoA;%a)XDUAOe<cC!6!dP_P(f$fOX{%fDD&azmkxzYXn#Y}2@vxp=<tBuq7
z<Ry3yCM^!sR!O*eKu4J)++-qeH@&6mea_4~F1C*=7JLK!z74FJujfU>G5hm|HM|T-
zKLkEzH+9;E=<M_JZ5`py4gjVH)2D|kuJS{mlpzMY)h9)c??f1JxONcp>EKPnwzkh!
ze+4u;D*r{_mzht{Em}u98sQ40?tQ++z3yT3YLvq!PuUWI80&gLr@$E>^?8Sm5SfOv
ztrF$3()#Yv{{44^3ysIaXFRl^gzy^E#&gxb-U~??1CezRa%q@&hQPW-27g93fMRQ&
zngz@Q(_MCKlwb%5HUx3crBF|hvr+g5`0z2R>dhFnYl}&{4>OsmN~>Z1;Oci6XCOxi
zH7l}vY&Bb#?iv`HNSuKq92MHBMIcLzPr)DLdAj)q!`jX+VrppnC*~QOy(}tYmgR34
zy>UX2<7>__aCdQGA?r65egA1}1#Xc>*E#1r<Bk1Q89ByY7RvVW_EYXIGYbC^JlEbD
z`^Jb+r>+6^5zt0-v`8+U!6_ig(bV@qv=yE@4c+XfrryTu?spR1Fn&-JF@}P+LvZO#
zR+~L)@y|`sDJUr15G^?1vZLVpXSX(M*ra`0)YE~Xt=%Rho*%|M))k1au-JA*6r6WP
zfBdy>y1beDD==t~?%{Ui!QUTZ#ruNVn}g=z*wt?ZcfNC`(F`j-_p!*rN<PC5?Lk{b
zk}_p{6a&LH95{E$HUeEwbf2G%*J}8C>wFqWy`56v8)?<vMgBIrfQ%xEZ=jK(KKtE^
z$$+DwJh#mEqUaRR8yA)rQbXR!XPPtp3k8<%{MF#nn(A6v|Mhz21#p2;b+ybjcB}G1
z*e|-ZRp!^k7m^Bh_nTY6mUnytA0;sRWAtwJC7yGeF&D3n=*Hejs?+_xEla(vO37Ek
z0lyG({hwI?SVT%4^w7himNVewgPRGETDp+RV@7YwUQf`fKbVFOdt2tExUV8Y&Y`=w
z&~ZGa*<-&aFXxD7)4XS4Y;e@6JmT(8BOG)6vkcnsaTal>8R;D8t%T44X>SmpY`zM$
zOKM|X=^9}Sx+%0buFu5!qYhDx-~<WSpGUJ`Qhmkc&V49qH4r)&C40{FCFDpe2*O@l
zz-FTz!pO~_Yh`5XG!;W<Vr*LEtxIa?__inW&v(BRn!GfpkV7uh%5Gex$D=F8$fqPd
zYN}V`+N_#(IKvyiP?CSfH+0hySi_2W)^nxkOCwJTWoU|QjhsmH5L}PZzVviVEt@S3
zb6j?KXm4#{7FCC&hpU5_sq`n=s<Ir@s}xCWi4O){1xk=Mf4v-9b)K1??r(HGKvM!1
zvNAwDzN?g8`ND&GSAals3rU9<LztX=J7-=vguz3E)h-davB|Nn%K_)p-_&`W<)1sj
z9$+Zo#$u?Sf*>pBqk4c}zf5;07cuAp2~Eb6Kz5(!%L?uDLPB3uqpaV)h?F5~?^8om
zDws3GqZ;l>b!DaEQTiqp0jvC=2R@RU@U^W3<OR(}mjeG@?(Rxo*kV2J8Rbh@X%k*(
zC=w{ilPdwAT<yC?2xO_5O+n@3E}Q;WG(sZ-`is6-Ud7;w!=Yb6igVs?eENw;Cj75O
zn9Op+U$R3!BXvH5qa&VRU+FE|?)CLFPN1H|x~+=+;%S}=>hzk=D#uR&Uj}<F28YHO
zqHSIiy8s7!OAVW;H9z9wPA%@*2`&S;ivugV-%=fA3c|(wZvTu1;)VT6Y{?;IC@`lt
zuLc6g7kLhV-HsLg?tJg<UxTI_J4H}A;|ANSeq49;G)=m87KI^0Oa;LklSE$ELZ5Vp
z&*;3PX##)sLM!KN3PzrZuY5-dEXMS!r0&ax&SpDqQPpF6Yj{iVp8mrr!hadO{QWfk
z?p}t^1^#(A2%H5L{vBF{PM+l}^5CA0?95ux6~iTX7}L2*-xT8{4V!!~=3xA1de_&g
z^8*?4Zscm}C^`$p7mG+tcQ2}MDrUNpz|J31y=(E)!1@h1UpOeyuT%nz-Wo(cIwEer
z`iMM7w$`Sgz<a^B&Ajk}#Q0GH@tOIUuNt_-8Vzj;*dyVeQCsbqXHDZrBCl4x6nim-
zV~AVXmWB0`L%n(NW;4!uT;vaCXxtt~C4#vmg$=#9ZtqEZ8u#9Xq!SX%wwe1+Qz@IS
zRze#t$H=4x^xne%+7gw}$!!6Ee409?7(;_iwW~O8PJrd5A+6*4IMWfGr%)Z$o<tH{
zBtZi!7j}YGSmbJ}ewd>_E-jAj{jxpm8}$VoBaNk&S)+z1GiPHTn>c14E5G%E9rZdP
zr(MfxGW_gVW3{arRoJGuRar~>C6asuF_%I-fqx9hx4lrf2++@J1oVM0Cm`vn%NOc<
zfBgsPA<9LPoD<~V?hVF)>%741$Ku9jW^exr`+AP>O}D`*XG9XCJ*xdX5dJie2t!x0
z%I$@an6`p=Sdk-=xsy0KdZq(wS3&Qc&>lcIz?&#083l=Q(%~c)dMVn0N(|*-1O?{J
zHFPKg_po^3SX)md*6ETM_uDEwkkoAL)haf+M$bZx=4*#uE-tE{o7vW;zB1#Xu3xUc
zY)=<^yyT1eb}*-rYCY4D;4xnYWbqQWdv?E&Bp6>({I!LEv8;d5%fMxK12JPoZg7s$
z|76ZsEx|V1k=Ay*UsUONv47dTivWT$%hRt0ceFwZAl}NKsC=*aItBQrUTyD?Fq_v;
zNeqK3P9r3A>I)$-BqdyTwG5lZet*Y9Z1;_zdN@v+m{&p&pDU?z7RCe5_wHXLf6(5I
zkk%9Ff_essr4k<D{&C$|X%+luS5(5K#i$7+lJFB<o`>_Ptpwu;7Tt+h9>%6aRu6cT
zq>X~nuWx)VyGqV-l$3$qM?i6Na&j9}y88TT^abX>#>;gOFkUXn;>HpFKX-Zsf2UL)
zZ65Lx1FnTUHI6n-VCp2iGfOtR-YddoKtBFC1!6QpHuNHdt$1~5_%+^mw0q%s>62i^
z`{9(1lqTT{2Nh@#AqlaLk%u|sD%kXbj3V=l|87-*=c$y#Y0-T&PDMdrrkxeUWWWTg
zGDB>QE7M?9*Yn7s*E&x-S7Sc9KO0jax5?JIXj&Tp@Nlm6V665i2~7;rCM*$c^cj5A
zI*0?bVMk*h8}2#7E^!o3nnZXZgs&@^B<dy*>SQWh29X{bjG{<3b{d)*GMUv*hSzVl
zn!*<IKV+fvHv#4vc(saRlr%P_)Z9<T)0X2WrQ2-Vm}Eub*W!)HzdaHKp|(WNP_c?4
ze(;Xf?o)c$>()Sm2heams|Ae4v~VL4GgR9D+yGY$WA;apl&-5e**WI4XxbTCl2}Vm
z%^730Ir4KazRyTGH&1|s+tt?v);mGSr7H0nDZ<DYBo;~=NgUQDKqTaE5Ce>^+z2pR
zosHsVNUsZy;y5CF>38l6_3UK?Zb)=Kg0ToC6}X+grhF62^!tWuq(ZhWHFM3-C{!FE
zYO@G=C#{Pk+hPA8?U}}-O|#F9Rt&`=zI`^&(fyO@&lHD{lg&g;?}b+<8|+<axlS<|
z^=X1}tL0k!@GzP{{Byo!-pm^8n8bc2cud-t{H|BeQor?yOV3p;W|?CKs`mAFy01o&
z>3zy9u|I_mK$S5n?-v4!i{%j1-j1`0Ir#_TR#IR%JAq9gkq~EAd|UgLi#VUUg&-wv
z;tmGR-RDw68mpF=EL{W}fu9A>pL_M`fzl)nB0K}#d!yJu`#x7IRPFOPARY1#i?(Af
zdb5PvuLTd*jdZ)SB3gF|Z=(=gm&Hbl`QR^|o(WSR3(wx1?Z}FY2ZrwfyUh9SM3>Q5
z$JZEV702FOogTp9VDfM>*BEex<2cH*lfcGx02XciODSE<>DS!=#}bU79TD|W)qZTr
zZRA&<+P7WF@hDpU@eaIdfst{vaCcDT{4bm1iXt$1+}i}s!k(T(t0|`~%QIz=T!x~_
zd~)75ZktM#eWoW|X{$034kI!kglY6_I((bq72C?#>cn-r`^FLqQwi*PgodE6(=k@?
zBX~_p-?@D;+T3@$1!Sy#alb|Sc)d&Q1;3{UTTx%mR)t?hUpoEwpsBV?t@3uwe<(cw
zl>>d6_n~^q<o0~e>5QQ+KlIRMFD;&y%g6i+3HMJaR+v2ve5K;un*Zo|`ZPz4l(@VO
zE%8fbGV3S_AA5ybOU#cFb2*t#GYuSVDvkSb6uPHXBd#?(94Z?$nx`9gKb-!M+Dn=3
zl%8gh>E<5=Us0EPwSt@;AFtZtV-)yBF4cnOJ9-|rI?0|?YfJRreb;4HyTvOkqL5Zn
z#l}S(tR(%qqC^-&k-U#nXrsuxk7-bV@30cFU%&iklJdqt%*QJwER1BJe>9Xm!b+$w
z-8TALfpM8=MZ0@@9_S0eVxJb3mc{|)KgrtGK(3;{N4+k@`;_en*aeWtAbdZcZ+^Bm
zldQ*j@rjD_0m6?`-|qz@0Au+xJ5HI{!G?fO*W7w<qzZw(QdWfN6F?LEX#n2K8Z(nK
zl5kXO_h#fqGtn(VR<DsfUTDgHW9==2;%t<4(HS%$Sa63AcL+Y{KyZRXaEAZ^g1d(h
zAV6?;cXxMpcMI<BcHZp0R^4;%+3WtgKcS|k3g+$U?x!D_x^g$Vr&~tWAJR4-?r`zX
zWS?n>QUBo29mk|qI9h0t-73h7HvO0RkPMxO<Bv!5iH+YH*hkWYJC2XLK3o0Zy*i>1
z>lVssT$b_O=m2=;SmgQ7fAm21v!f#2`|v}rzKme?V#e_Y4y8s=fN1V3ZuewKFO0*|
zydKP9x$r;!qc-}Mxg^8@r9F)w5idqCn)N3DW02$i3E;f^L?WCtF2{UjFbrJjwhD_%
zEA53}fpgd2*n-duv_nIF+*5F~iEg^etSHee*2Ow83hfn||9y~}THe~TvGyp1DS?D#
z`)4EzVu)S#3}(Rmu&ft25S|jP5mfoNMvhJWJRf$r+su6!SsBTA8c2ZHmPvr-AKdfg
zB<`TIH6*6%{V<ir=!|ICReHbjKcAcC?f>pBV=G#E3I8)xw~lo5m#Em}ev)MRT)>b{
zrmdW%Tf^oCO?}$kc+RnRO1xqjj+hi|$kfe2XctGVKuX<^EL3ay$jF#@Zgyj!pzHqY
zy~P(tgdUM_>JBxj#-3ct6$3vRM&wfAuLBj=K{yQ;K{Xe<VoY|sI?jZa2-S5WDF&y_
zhs+RV?^V7sGCil0Wjg0&*SPOGEcnTe%eH+36%SQwSFS*sU5@>iB5ilg0uNhD?g5zg
zXBVkl>vZjlg+|J`-b!00lNFo%dK-G!Tt=3+MU;)@Us|Svl`#r5l-3fNygk0;EMIgt
z*+st?KM6jPk^%5b;M2og9Bp#_C$Gz-p)IXG5+mqQ{QI1Xp|#=gd;7E~iB=(T@#{k(
z6I>wQF}_&#^l-?i(m^H#X5fvelEVy|EK=S0kH*f{)@CJ=<T_cMZxnrUUYUaIe0q~r
znQ38R-@RXiw6G8WDJLG*o94Gy(%{~#^^gXWAsqWdI1t<oEI~IXW~hve49XTPLN*IL
z4=Xgh8TKtgJ$nAwO&S7I$U9H-ED+x3&z}>Gs4LuVPptIK&GO{&Fw@0%(wViVCBF42
z>cnG?NAg@D+GX2V&s^soB*6c+v<%U3cSl}%P<ck>JZzmBy#vZ={52;|w=$V2-D^A#
zkaO5|*0nMDi}}~??EL5~PsDAgww1s62>U1eW2T0IT1!+~!|1`v@3b2eIXl_zq-=}2
z69h_J^P?&G*WblDO`j2v@zTfgme@axXKI}K#NHHZ{%J&7m+}J7B7^9jZB$Vn;gg#U
zx)2ihoJ+sA7A=jznZnV=di{esPG{<OE}WGPNh}vfdhX(RP&V5%^sENY|KvAAglXCQ
z%{N>V>#VKnTM>jk+oN7ujx$PYRa^nY2R=-a?9gzJTJ%S__1ff-g!aRuxJc9iOk_MF
zIn=AJhInnr(m&3Nfqt>WLr=}HQug9NM9ZGx>xT|tTe&)&>DsB+*4AeHo66$C-Cgzj
zp#w0&y*-(bAg#G43PeHr|EFTc6rcvhF2!;Mwed$n#ZbA_MG0P$+<|bC2Bl>tiAm&0
z<tr3=4(<4euPyIw#d{V4zQn<CVn<hYGTkHdeH}Y9l?so3WL9AGQ8lCR`Msb)7+0oq
z?R!Pong)~8miw9D;BX5#FDjFrVBfELr!u&@rkGT9MuZ96)bk7N!ut)hJ|Ayx15D*;
zfI6l|;&CQC@JXtlGY>V2g8C}_2pOK}<KO__(1b5e+cQP8cX4Bj&Lyl0eBcZzS{(I2
z^v<;9f=Uv#sSc;a*Tl)~I)LbP1hJnUsniypmob^hyxjs4oEwNdrxh#51eJ}i`Zq4l
zKB5f`FMSzoStF)?L^&p>JHFh98_pn2!ut8FV4z;BAD0RFlc=SN8`q?_LT_DGAjSMK
zW2M?*U~qtYcTuPJ2!W*pNs4PWhT$oW`bmWkohF>jC(Sq04G{q@@CexUI||x^!EnfD
z7Cwlu4sYV|^u_+Xe-{|u2>J)1pJkc?cMRm)4S&&{6MgT4cpv1}i?IaK8YxlL(Nvyk
z;Y6`fSrU1orGD>d6y?uL_US~?-N)p*X(5}n%&F&ntp?ck&z?kdQE$y<#w{a!YKg4T
z&ziqf)GGsm#eVCv^^P6TuO*t&(&B*2j|M~=6vWfEpLdOsdKGc2MVx0xHR+ZK2??t8
z60c6C#@Zc;49EB{KiRXuOA7$8ASKq?eRe;B#I&LMNUp3xwthHAIxc-P9PRm6JquX0
zH#2H_oOz!wj817}6OG$xjV2=bu6@!Ch|S(t{~0ABKJ*deJAtp*|46jhpTK*e)9g~g
ztFmV1LvJ4w9UU*jWC5dYlG6R<o5T7j&j~y{JWg0cCs9aN3a3)wz#S{8^D5YI0r6oY
zy4iRD<B(J^a4c~m6whq1hXCa4YoPHC(t5LKQ3*H&6Y_dJxpbK0<8B3E(hQaxbXgvA
zuyJ47qM7=-jw7VUzTWvP69=L+tvmnE3yc2PUpbe6v$dzmf5g<>|86TM4c4jGLQ-Ju
ze>PEOA|n<V1HumJCFBp7Q`ja=T*|cfmGe)2pj(E=&u77m(INI3U1d1KXJ^7}^|6oZ
zI#jvA*AE*_9b8dBE85G5Gt}L~)>~LxHE1-;3pM5199y(`H>L3fzD9r7|3JsW5~cOR
zs_ebfA~wpi=`f&JZ*iSibJ6*ZrT=I*mD}tvgng71{S@$54hQtA%FkMxNIkKGaWoEb
z#SZ>t9~UVH2%KE&26YZCKMbJFicHjOpc2lB^-#(XT)ABwr(6_i?GE6!+QcWj&T80A
z$a_%-khldV1LA<49haMh-TscL+<i_}aa5KVlLME>u6N#yxWp4Wa)S9`+c@S(Z)lWq
z%MUwiIKSiMzH>czs_wy#^ssP@;Xhk+D)<^m#_Q8?h3tP?$;Y5i)R3fE+B6}N1d|h5
zvyDWZi)S2oNqq=Y58M0B<|{B}cX&Xn+P%Pu#syG6s1MX51a^57iHycGP>dLUJWON_
zq|8R+kH?QlYt!)^9tjeMZ^Hv*JirnK89j5#1x6%>$O13r@8mjMKrxCB6KRbO$80CB
zprv!um--+pY<i(j4C*RzW9ID*(jUcgJt)XSQ8CtCAIie&Oy#j{{tX_qWcU0o{*Ta!
z8OipbePItZ;)4<?nY^75@mt6EP);t%*3pR~HS7J{^5Zv-$0-8twNGaOLLA3F!f5>K
zp#9mFCU9bRrotEzDA8;fn*+3!ZG(8!y%5bcyO<7QMyIxC)UF@rIG8O-f&l(5@n)iW
z?edF0+#iR_=L|eEgbokq!)_&mY0;pDqxg<{VSLv>NZdCcjs~Z>YcMe;S_*k6IdMYL
ze6_#nEOxrmNyZNWG}j1g9_4Q1Z>zQ;D-}io&CfSWT+z*)i!RjEjkf2*5U4%JM#>$)
zWoOHe2W|BLtdbsZf=F7q?hZn?3F<*Zpr8Fk)tI0K#N;pbHM}wuv50f<ANW52t=0MO
z>2r-K#@XRNEGb~Mb-m2Lf-Q^$&&aVD7^L=^TKdL<c4bl3lSE>WApq^zu`g~ND!cXn
zlhr7#`#CY>WJRNKhmHq6WB?v-sW`4h+&L#JvV+`(HB<6BL9OUl>QaXKbAq#dP|lw+
zA9eU~kP&`gPEMxaKc>$HK`Pm3(M8_QH6rSCNQs;Sf6#D-tjn6Eg`1wY08h`llcCtM
z@VT84WrY)nUyaw9A8CJt1PR^kigTK;#lDrS-H3V4MbEhaCBs{W$Tmacou7mw`Du&=
zo;t@hqym)oesACcts))FRRBke(a(^}L^aBYNQSxR7ft)pmWM=(?L499AR?!E0|e_-
zw*zw}P2Nwf4tE=DBEq9PqEX4`EB3~p>f9P`qBoS{F@1eLeI`_1cQlFVPNbk^Gg~Uw
zXFF-QZLSns)zX_w{VH9^YxxCW-+n{Q#z)su%NVlabe>m45<whCLuUmrE>|97m>n=V
zOgGHl1a5t#seUU6b27{g$$9l7pHbjD(YJX0d{)r-;g5QY1-p4Wdfv~D!C;;@<wHD3
z&P0aFN=hjF#^3(fd`RWFGVnU-&Kf5%9H$A%8c8idvnG%*nhZFF*|g2d3Fn5#!-Q6p
zmX30OQAs}-{umMV_EFM?x{7CgYSC1+*a^~?O`nwXtL3tjvz~kRCd#%w;>v`%gq2%c
zUxrAs$$>6hn96TUEl!&p0B0)&xBd$>dO{g3$46Q{RG8xFMzSEoHH^};;i7WdLwxg#
zf$k)KOIcHs9$+`b(s;(h$|l6wgW-O)3U8Lvq&eiFU3XLAjCC{6(^qP{(l9^XkMf=N
zlfK?b@KN}*Yzen+jbe`yJ_pG(ua6I=)E7qtI~h7LhGeB9;-1$B%Ic-tXzLEVJ;PRr
z=h>3;K50foalbw=85<s2&;^XDAomzW-mfp;Wf-ltq=;=B?obuxou$WpOh*?0s*d%g
zi8Fn4bqHhOf7;st-F+eOyu0u9K2-i+<~9G41nbxR?J6ryhy3Sl624sRs#LsMS{Q?v
zfHW~(mHcyAxl)y}GxKyU)c%B^MAciQr65E4qDpy-@bM-Z_9xwZYz%YOqf>0B98!OW
zaV;Nkz!D={D?Kv{EU`jT)Y!-!JBBh|pSf?KV!eYa5}F`^YUne_C|eKveLRq=D~>qT
zyTf#3Nu~^P5&2q3za1e#$}Tbgcb`TTdI|=zxLJnON~6`T@}_r(T|0crf>~PCQF-^s
zfYHo->o?!YxMTNLrFGn3MAS^Es`rjg3uP3vxH0foXE3Fe%v9JGM!{E>S>HNZ37>iK
z>$H{GaBAGOOW)>tvm}p0t-eA0HHZ##(z(_`t7nt8+kP2}WN|@h1Zlp-7g^a*fPuzs
z94+!o%wK2Aeb-yhsZ@_qUYkev!8vpp8?*7G?z5_tqu+@U8yaO8XH7rD5dGG9os)DZ
zOjT^qK}>8aRRYAd&;(9Gv+LV~uZ3-KtH_v5Rl~PGok)1|?=N6)vevm89rl$RX^yFY
zhYJB`64#6s>JFwycJ2k=z4sIRhk48=C>n%`Ko-dh5<Y0KUap_mp`sRI3VTPl2^-Qc
zpu@tqJKz$MBSdD{PqhqN-_K8c33jXDXA-|4v$?{m-=@_}b)!LTu&bywO?B-h67{9D
z{R+RF!$L--z@Wf#2r`_hmMwE|OrxSDu-O5P`Em^e)NC-z5RVQ+8`>j|VoHRU_9gb0
z8=^vidwJZ`Hj6j#`FKu~X&Z+3c|9J_ouCrVeswbk*2w873)=hp`yHFX6v6r`!KbsX
zoo|DWtL~>(rv5dG{e0apKTT4g8C!#5%+WS=aa()@Y&f3%e$Ks{pm&VYNhKPOadB}&
zoO9X~fDLkux`5kNc&q1Q?HF;g<Ng@W&O00CU7uv$USq+BAI+V3qwJ5Si58?c@vTox
ze{Fb*g`f<lN5?=WJF;8vKzzm3wg@g!%s@nPKU$p5>|pD<CLt0;VJsOq^m7v<pb!|_
zzh^K*w<Bvik`sG)g+xr*25$a`p{pHxzUnVuW^7Sj?>}0#9liWr<R4En%GNQlKwehL
zdz`B(H0>qPT#lY_$*^`qqfFAg-CmvR#;U=MF<hJ~GP+KM9!7vilD@ew))!O2HcBi-
zW(w;&5_3ffe^=W=4<gm~;Y?}I9ZnTG?HSabKNvDCE7&hcr4<{fluLqg8SL7I*7pid
z)z>j=y0#6*lpW2SMQTID&Z|~(#X=2xeQbcdasj{q0sW3J@w?srWi{Oo&i#PDmUi!N
zVg|Hj@3!Sq1xuM`;ZXs@@??j3vi;<e!$~pPmt6It#$UA`D+W0Ib1L|y-E}8Eim27F
z$I^Sde9KzC7?y^g_&Mk}_pIwZ=#ke^HkBtI_m1T$qr=0;TutYi&-JBYcPm<1exlVc
z$6-(RqN%7XhKAHz{pHE;16!-QFGq^~^C*HwtyqQ_tvZwJ0Y+0prqqdtYgO^Ws@YGV
zdNUQ4QrD3zf<JkIG+<2YIQmAe?ErQ%0w&Cc|K$6ASl%yV3*PBsWWfIt$wBfhYVr{n
zew+pRv-^*L&+ld558x-5WIQ4WEZm#$Kt4LT9Kcsa;`gV{ocF_$ZLD0-(2$H&hW4T@
zkv0Vh=4R!+F23JYw*Ku6n+Qp{n>A68rpYpm4ujru@!sj#*#vibBe1{s%VpZqtq*7B
zJCKn&`=$>izC<dKpcVtKIpG=gZV1FzKPl1hW^^qU$B~{(U_g<@kP;)p&n&UCX74-u
zMX|<Me+YiuQuA<!*PlYdSqWzCEqUg>-z4DP>9-~5X!=ot(6qnUSn+HdxH$~)C|g&$
zFd!-|H+c1t)1Wcp>&$~gvA54d!?lm1al}f6NO(S6Rq)v``nQ^0{~fcRAL{&F3yi+4
zt5h3}Y0z9^geAL#LAT7t`Wc$1Mm@UUUS59k<cTsMfvWxis5?s+V7neM=bm5K2;B%M
zHgLTVoWOXzE&oF{Q@;k0<ul^9hiI3~fDRC3V}~c;R*j6u+CB^AgRk2F+!r-}qjo1!
z{wE`tqlv#&AYom`GWtJ5Vm9zjAOAA2QMgBxUzU(S=)FdclSI}W;q>fvRa;xmQ3uC|
z$fd)Bbm7&*ZM&w$*LgcLV766tBZVVw+h4?*WbjC#zYkV4e%a0VVn`zADhSIy3x8`l
ztg<zF&yT<#SIn9&r<Y0ZpNAZ{y+UMAFxRRA(+<;>C}Vk%!X;u3u64I?tVy;T`g%XA
zu{&68uAHOM!R%G&o(g=^1I!-=0r%@@8J7DP2ep7+)uPXY`FC5&@<U11t#tL$y0$&o
zO1zf&&p#foxtD3L9c%3N?pEz4DvWX@gd2_X=)&{f4MqRZMXEin%%u(6yUc1%<SeWF
z`MKd`LDsG>`Fb)Zze&5G{Y3X+>a1?Xt?6mIAa6^p?J0-o#-Al#i<WF@N?xc0baV<F
zXMRU@_#rTKL!^lb)?$ERg8Y78&8;6WFT{VtZLN{hjlpAED`oXDcv!Rg<Bo>{UFdl~
zKK6J*8a3ii_+KkgNH)&R6`Hp^UwlZ*DQw8d{s98;NN`z6;oo4eV${iaT@b5HFD`0Y
zz#7ACWeJV>L^nJCKna4??yvbWLV(X>qtAEN$CEw>B)8++KvZsHD~_mk(VS&>SOD{&
ze$4ss4;k|PQG7=ILf=18;6?EwSx^W)fT<(jd45bC7AC|ktysp#L~_)4Ahw=$0UQ+~
zfJ24WBN&m03=jZh3SjzO&(WjHw6P-IgJLdP;Ol3k9A%-`NZs^L1N_6Lo7e79<2(rm
zFoS%WwY2%c7WTQlW|qZsWmPcQIPzQhS-+!!Ah3dumn%p=U;BNuwN=0-SvA>(m^NEH
zNrm>=``X26j#XYa9Q?4M;;!PTZT0JwEFNuOehox7y9}z+Ejj)jLw-+JRMUW`F6>d9
z#7Q}!ot@F1Wni<P1f&PSQr<|WI|oH&v4exs?z?`j5KK_v7EH3V_qwtnOuv%+H|?u;
zRNYi%zabN&>W1NHkBI1xM^$5*#H>7I%->3(we{zfs8{JiYj5pL*3^dp=b7W;%VBMU
zlnrfvPsIA|W!B#xc*xm*zHD_h+7?iW%k7pvkm`yu4;ct}{YMuG0U6-Da$Ed-HS-@%
zG^On)Wx%M{^h)x8#7m!krvGW91IHhc9V_q<V#9)O+r4nHs$4gCGZT#UX(%e>X!$qA
z%S~0U3?%{8`=Xfd$s7=`S6#LON<Chayn(ZmhDip!f0)T>`w&4Utc+**-xU?5l!|B1
z-t!k;MT1L!hA#xPcCo|s+0mgVO`a#b_+C!;T{Qkk_L@ShtSSk6+To6qlymwmte?bX
z9c%hUfWdxeID&=N#qGs)mrf;)dMJ)5PTEoI=@Kvs@jnGzr59Aybm^$5U`-~Pg16Wl
zi<b+8XjYpnOd-1#MkZ}7NZI+yzqU*{WaOkVe#w^RZ-%P&&Xm*$u99mpY+iH$Ru-K#
zHA?E!s?0C<W5$!&Qk9NNPLSK>*Jv-Kyyu5Vne6Inl?+`XPOagV^T)L|Xs(=q!U|5`
z9_OHbC%{pZY0LwBjCaE#Qf6#5>ar9!=5U(ElB*PJ=ho2+tBROG0U8ij;2U#>Z>N4q
z2)4U$$~LoL6(mkJ?RYp#rw*BJ7a`+^wt<c+blV61@(q2&yf8@m(S6XI6;9gyt`H4P
z_*wPv&>Z?#8FicI+cgal72e;W?}dvH`_LVClTkx=7Hce+NPZ{%z31>^uzW{eU?ZF5
z@FQdj_hRL~oD68)NSXhK^hA5Ohrp#)ogj>T6qo)=UOAo!cdmZtVRBgwZcaOW$bL*f
zO*{n8;Dg}->QXu`0Xhu@ETZOfBGs;e2fb}1q`DB6(F$6)70AHIo5ye#$Xwrn5wL6~
zPwC^N!SX=~1)9QY@Eu&iGv#&Lv=*Z_U4zeheW>@^cx`|Js;FPah`KkEU@^pu<MVg3
zGZOp*=!=H*O+czdroJ3O!eFi((nW9p2Ce|ea3YcCAFuH^+iI~#9CI1cRebq2P#GJI
zX)p|<+v9N^p@%j009tP(yFNV`lMzJ<#?7#couS-f7jFX1umthghN0)yN7C7Lul4Am
z7GNa2A>Q~DyT1mkClCHF!+N^9%t_bQ)QjPS<*q)q6CuG6{JxYA^+Rl@fL=WZK;4fY
zp?rtnz!X4a7&<U;TG}9<?k2(XwD9l7bSHrw&vlHxzgiODUtnDvWt!@BK#H=zsq=q0
zeZGYKRnvN7jRrgm-HgJm<{kuZGOV(XU8)EuXDf*$N@fb@c$-MFsS-phm{Uh^oZ-fN
z$-x-$`{^CUQD97c$!MI~($VGZdFy$|bL$o+ky_9qlu~!Q(6wmsdegA0yK<`2$FPol
zhU5a@45JG!^HFR6-+zSS(5?H<Gh)mp32-1;%1cF3dNzC19-U9tFF4vc7Tru90~S7R
z9cdV8>~&iTHW+)BdKm9{gSeWQT%*K)jWEj|V#V3h1CW<ysRBnGks52BNCnbYb0J(R
z9QrBZpQdc2CVTagx!yI!M%pBFS`O+%#OR0QJ#5S<;U>-0nH4V_MlH)v2mB2gT_sAd
z&2Ff@i`h17(R9k&U15Ss;}!`H$BSaj4SVDoMd7oVJ;B!>j+2b<&Nfh;04yn-|HVa5
zYFxsLMXyym)%%<ZU^yjHep?}@dbb<<&LSp8MvjG!09oy#&pcWxlt5-$IySOVhf@)X
zj(!u?K)7}M!FwpAjZ5ZY)WtK}&D`~@)jdaP8<Qyi?xg8-Xq<aB{5P?6jD?migTI4r
zdxZ)-LJ-$tmINAN#!P{-gb#NxE(^8uif7$$Dwo{qzLL&oYw3s?LglThbB67v0*kE7
z&fe|*obW2%{P5+8B&<O>>FNAFLSoRnH!^U*0?Iqk5ekTLx4`grqa9frzM25_;3MBU
zDMW$H69qLJ6@3EZ*^H3$s|qM&5)u8qWcXeZzg?;TEJpPUv;yEo+l-TWf~hbuFqZK=
z$nia-MjfF7Ts%Ccy0Gu*lJtgsWuNqst)e$)tk>nqKayr~?OV5gTdo(*LigSv(<P7o
zyFsDC^vIL{fRQtda}7!#ygq&!@D+*(%mEdC9TyIt?+u__LEB-~EAKdjX%eOF{prW)
z$OvMh3s{7MmMCsINGZtvL?xyNq*3XY&wyVqGKZngzyQJ9&!;rQG0M+|MB_zC5>^|C
z7QNOxa7r(LnBC-fu?F?2SfwD6P=;`GJgW5$?rs3`V1$c4a|8D{Jl3&HM5&b*Qz2vb
zQa~zdNHtk<Ob4YsG!n$vl-lcDzCw)89VSr-)7zk}O-@>^*6PH$R4_$+riI=78`yoa
zh-fLW8N$Boh(v^n9^B@%qMv4;u72VTs@@)obDq*qb6PjRF#2S%Q)h2C3pMn*0qe&~
zE+_BODg4O~RzJo$d?m7j|AouI9LIehCho_=r00E|6GHmh_s{LV0<S`Y9d>B@O80a8
z`jot2tp7V)A_wQER3e9g*BQ*6S<+h+PYd;Qu+X6SOr@C3$-4=pyE)Tpk{3&7c+`N~
zh?SNL&VLo44dvgeqcE>)F8jYr^4}HuM2K|;2z?FWUd1dvNli<{TTqUO<O~iSJ3GY2
zAqp@vaEO>|Hwz*NID@I`$@OPjr7?UB>++9FB5C?Q*qs-MZFfff;(^u{0|6DkXoqvo
z3fZy<o>gA)+QcA|ymhkjrTVHqwlE=zxS~Nbl@D$q;;{~bu)P<0{jY7D(g%)yx&5Os
z*g20M(dzpu^XPqQMJdRClL`s1dY^jIr7NhvddW+{!?)}lWNpq_&!;OKiF+D9CZTFG
z7KZDeu7>rWBlWO3tv<Q3{Ykmy&|8Q0t2}=f2on?#v_^&R{^RJ$+h*q$*=!YHDZ9#?
z6p5wJPc3&r%l|oB(!ktfpl7mN7<M2H2W*!k66Nf0LJyC{*aT4da&%i72^!QknpM`D
zjS;C@&v#f8xSdO<AyvPlnY2C^(%0Wy&#g&%1KGuoZvNRy1I-stYQe^%cK(sr-HweW
z%4Do@;*BbSY~;ybBy6Qs$N4mbt;x+W44g|3#2lor$o)H@J_3F>fnG?+Z}^kK!`Gq0
zWKc4}UJ&CV#3&!p2~H{d<+Sb9X@c38#aACp>#Oan))z*4>H(sJL+&PlQl;+?C$JL-
zzExMx{e*u@>o&N9E2#Vh^<co4Kx#fCv}@L6w_5p2$n{VHd%*87(TX0_Ys$gmXCQ^u
z<~eB8Z8MaccTHoB-oHXwTV+m15M-=r$ba~SdEJl<5H@};j)yh1-yX$m52vFWcz>sy
zxAQ=qLBYxtZp>8!Mo(feWv0t`m?_ax1G3dwPzbpkZU8I7qjr^anWwc1qo!5DEBG>&
zSC!Cq<mDhCg!rEZ>b>P8nIhKXbGHLDX-7WFmmN^eDU|-G5A#Dw++|BstkdT1Qr-{Y
zw94}2b!>|^Og1_y#p)Bn+0_-b0N=Z*zc@sUU0?MnJLN+ksdw`#`!6`If{)%%l|i4z
zt&KzS=DK;Rg=;^Z*@uW1JRf%=!4&&Z$cZ4A(~)|CLdJLZ=kc%)^V`=y5D=#SkUsV_
zn|&XRmUUjVl-ubewM?h6p9(XpZssx@(n>epdN~%q7t-~G&4N0$thL<V1g_Wk&fp>n
zv8;tYJhXqZ`Jqvuo)LNFc~L-HX1#Bd^@46DtD^Hc^-f?w+Og&M3adXWO;~qsY%G=^
z-9q{(^>J?ZB=IiM?7zy>EbJ-aU%ini2+4))Msk_+wCextmj5ozzr9qV3Wg+5Akq0&
zub#_CHGTd~u_&Ar{4v(gP&F4e<fxM{jwbS+Z?Qy!Cn?GeKH3^pKd?qi!tQ3xDpZ4a
zBSadm&NqKshC*FYLu45mzf%9U(N_2}iV~2lxRs2VK3DyO2USn!xD|Erhclmgm6SpX
z@ZxaFxq7l`SblB)h!mN+uFsy?@t4dC5D}w8o{f^VGs6#boLBettM=Ky@Y06%xwT~|
zYV8guY(o12nuKWk%%{a2U{5rwzLX5>vFcIFrWQxc;?SYT=c5;ihpF@rH53SfL$=k-
zj<cf*rB>{LQ{XXA$<RI&%3E>to?<noj+6XYl>mI1Xi*xWEC*Q_0rR}ot`*CgkV|Hr
z7=h(Lgj3tBo?7-GzCOQMh*GnlT(xAg*#C^!)z~+7=(W=ybDA!pYy9dQF?s}D^iml9
zQ?1i6lFej6%=qSv2k`5o)2=V~dzxo&7X$G_g+@zI@4_TY+miu0Z!Ii(L6#6=IC(oM
zV$iw4Uf5-t_lriEuRrr5wW0w2SVz_#z#7`ge1O4H>Z^gplHAfumprJK3sfI`iA4U|
zE#cEuUKTAiY+=!Xa2-<B>hx`#+^QDA6#A-gd%v5;2YqjLezRn)W>)px0szHZ{HTMv
z6NS9Nh_MUH^ME`isTigGwq{P(-Yvy-Cjq7%$tLLMorK=(NC%`fDv6|e)8b?ql;)bP
zm?e&yUaVG@>ZcAtTQYhYO#$UcII`oo*II8;>Pq0i-vI7YHnm@;^EWbU8c`nt0&_xY
z94FG)Kr}Xt7TfyIxeyaS(GgV0VL63%7+}_W@nFL2GyR@I94<m>!M%MCU`X(Ij|UlF
zAE5=g`WiMc_g4g$O|!Gqj>r#EK2c`CJD~*j>;Qk#sn5LaW-r9%ng{+>gTko)_(52{
z7q&Z+o%=ZVoxLXMqLti(&H6jH$~Dn__)h9=IzWde50q9hbfxh+JL+YeG8u<OlhS!@
zhD!UojL!Mktu8s|%$+B6T5`g=^<1-_US`NkzEVZknx7b+A3f<eExyYAoGC)*-2v3M
zYr~V$rWf~L^X7V>YCCL&#L=v4U(5e6f&O<*@knC>%}%kg;&s;KeBQxlo|un3>}S|e
zgv1}LNo3kdZ`u$)!#Z=y_H01V9-pF=^NGY<t*$zHxM%`pvr;PI2|}3>C}OSYWR})Z
zUU513#@OWgL|dNdtdItwotG@uUSLvR9oGGWfKFDfF1Jl#vSyy|vd5I{w*-*2Pib%*
zqay7wv43-9j>K(1_RIY>_TJJ#W^gWLUjJ85l{+m0I;Y>_giOkf)%-TEo_59J#3Q+v
zJkD40aBzIR!iEpX&Ot+fmwyF`?K!IEP?QWQA4!~!lIm@CHr7I7e6|8Xn6i*~tcAlw
z)5*!sdL`fK5qZtmnb?cBZ&3-@?<|X8D!dEQ*s*v%$t~o*H>-lQ*GfhhPPRxm<3B!H
zSITA$oGce;?k}H1E~TA3qg%A{Uj*=i1lB4%lPuR_vs+;=GWdOxMI6rwgjH&I#3^n}
zOco2~E@wk6u*Qd|91o^#eW=k%CJezB$n&rSl;HPDX!VHMi0E(j+&bWK>pinZK|+He
z6iU=wkYN%?_&;G8G>EluZj`nuVBNS`ivZdR$|HR=9(1!fvkJ;ZUqdi)g}l&CpS+!i
z2@xd7X|P(c)-l}vc%H{coG`d-hkMh<6Y$_O;wFu7XmZ&91Cp5)rc~Y8)E5}e@a8Z)
zss%-Mqxnegz@0q-Ac!$QELF+tsKM4*@DN2iGI&RN-m{aAst0D8xG%06wR1}1F#p5B
zf7*Phy`|H;(1;&wbud0+snknyld^UIZx7oILmS7Uw<=~~!Wd**Tb4W($8``N?B@s*
zo@jM&hWp5cYt%Kc(~H*rnf#5BA7|xj+si`{kk5+vP4Eb2*bsBiA#~N<C$~aTAxjFA
zDOS)-cJ#$={HMT_?>$|Tb#VuV$?RY%EVzo=N4?bD=gZDVLJt#?sRajP{=_JwG+4rU
zW4Wgey`vAQ#$5HemSq}*@6E#?;*Lz{zU?CtY3}f-KVW7GQz!-81qe*O0@TsTsy;tO
zN5su+r(<5b{cYLr1tk0D;jJIVR|CEeGBQ_NIs0k5Etn`)HRq*yuDW}R{_SBza_*5a
zhgY>|q<_opzJ(`QH!Yw`fc<iiI6)v7hmJm_ad|&kUTPIEgky(tSuU3YR;;L}6z&e=
z+;0E9`nA8$@If>T3$(hB``2&&_kQ-TLG+A838>cB%#jyvCT!MOgA`~sBA}8_NK9m;
zlOhQE{LjQikG=Gx{ZM~}Klaw-{>64bv#Ru#ZG_RLrPt=i&J$Wm98kqwzZAihbZWI{
z0OL|PIkt@XmFR)5q2nhW>7&JL;z^@!qJ;X&^ec}o1G;=g25@8GYJ>5B9-DYZ^=TU^
z6AeAjLfKjrK~6<6qfX<e*rys%;To$-ane(PKPk>c&FZz5_zk-!O<OLZnJytP`t^lV
z5J}D^kuqpG1Pf^>Ctck`4l3^7$pOO>ju*c2*?&C}3x^`ovNE;pX7TXi9#?M=5MVN@
z>3POXm+CBuMa!zTW1HcyqLMlJby|pK!s}CR7;O*6m?R52H9Mb5aQ-S5>;za-mJ49{
z^8@`{$?4(#Rodc$u*$UzeM|a?K+eWJ)D|3&qx}vO-UP)v?M=lp+s50&IY#?%5=Aj4
zUIw7_-hgi;5$Iqp!H2ftftu!Fp+bPlK!+Ga`ZgYoHvGeU2SUICB~9lMKyds1z^c%H
z{aH@<>r=U_FQTtx5QfEjQ?R^DH0=g?1`K4f&qw44-zAV`SSqE2Mmu+9ws*PO_F2(-
zoc!2~LlgWty%&c`vtF`xn*C=NRFO<>XR}=mmJLF~1c2@{;Qu0^Rw`s|ui6bUp`voV
zR+vC3Ypocsi#uk2mdy(R1X?1H%=9AQEk6pbgf<<)18muaCqtcDy=bW~!L3B?14ke1
z!SOKkRiq&lYmKU98Z$wF`Bi^K50RND$7c_U4OqwOj3VOd55GlIsBWqhGDN<42Wf|(
z?fuX#x+d{Uxj@Q_Wz?87N249#^cSKm4K?Bv;Z(Fcf9nkyPwskxYDM0g?{3|7HH!vv
zlGPe?{rrZylLVkfgzlYhY3f}qiRY;^qDtOAZd@;=PJVmF3y`}DN{x+W(L1^EeN-*=
z5G!8X1)5o5`}(e4gkcYbkZ8Njsf63$bU_r_9#O)F*;Y@)hONn7;knq6q(LXoH2(Mk
zn~YAjyPmj}!wA=V4_l+ho5=X;YyHN50)|qFro|oyP!oW8Z-sjwEpBdi!)9!md;53u
zDovWUj@y+7rHu#lHSbD7)9Cx<6;i;^qoiBwJ@3D;79P95dt5}7+N$#Z8-4kI>hFd4
z@5s4UG3FJ6s0|MNQ7{faVdi|Y%$)OXJDl(!Hu6``1rIF_`pvuuWV^nTfQd_xNz-yZ
zfFqvqyP>&Xg~>ESSG{aT73r>JxIA@9r0JrHzhE$^0+jL8*YFaT=`r88IoIEH$`U2v
zb{+YPz+aiz?mZqb93DdZHy-vbW{T$ef!GZSH8ascZKTGLnf!9mPs_OqjOAPX5fmnW
zvZa8JEVil9DdNYEA8&sAwBW^!(5hk>M*M-B2Fr@0&jizRGJZ|-6>E_)6g4Rs18f*a
zhc$bg`bebWB#|d)ClWKLv{_AnR7`tUuS058N~W!(lxaB=SmWb1W%@}z7_T4<Uk!Rb
ztz5)6fAxDb#iXONCz8P$@ByW;F;(v^W`<Q&<2l4AP}nu(#^%%D-Tksq;qlAkW}Cax
zp@VTDqER*r-NIo+`<`O`0_;HF1k(q>5}ftvs=PRD!@>!%S7ez8>8r%7z_vkS9b1Rq
zyaOPaL8u2%gHcnBz}UttP5li9{wIa5-6)CC&=EfC-3a$u{~EzHch*)Z=C$AXkwF5R
z2~oWy$7eF(%%72GakMF*=qp%SV`O`F+}0`*Sk&_rwi~Hx#Q^V}qK?qoZwGTFS~P9X
zH%TC<uH69D=+977My@@?5Od9ihY>_*-(NSrj->WJ(H5PWuQAKn6Y;<u<HVzfnv9w^
z@$+3E(+(N;c#IbU0xb3I@sb*#IV9(_m~~Lpsp!C~GQT+sV1sa-;S!@D=b)r}^oHQG
zSuJvKlM<-qD|Ccru~-<O4GS85QntIvkc=Rg)7!}-_B?uX%iU5?#l{87^0l4#d!J(#
zIWqQN+4mCy=1K>r1~0JT#CK1ake<Ga?V%>#!Mm=9dO1lmX+t?a^>>#)$JP|vN%06J
z<1C1muC%hlq7lF4rdo8CV)q&m>I^{QlbmMd1cJO`+0*X*1ZHJ~W(R739Jn@%t3B;V
zc6nj$-q&*^V}F>u&qA^nxcw}cSA7&(m}tyT=7&L^!&ey~!*eQKA+2QHqF8&2<W_DH
zOWL_B9-^CWkMsM95}<S4dU~S;0L2G5*g9YTPJR!-;!$!bO$ex_2!T158yA8YJSXq|
zjj(k87sB#wsJZJuBP>MQe~XTGO~0+VSXIBNGn_7n5Iayh=Fj~mhmxgvLGF8<P2W6@
zaKnz}g&d{xWdf$pq~H_%**7ZKH^08#{xGoXrF*J3Swc0xT|_olC@FWabg_i1&ZbZ_
z+>b@*J@A{_p1V)lj*a^wQ*^^U)Pt+DmtJfPuaY-*r`%CKasd!*hHkUG!+-pMbNw<7
zjkC~K4yERv5#S|Jw~m4_21N-SC{~-j-=A!VQYl9Fodb0s^V+xLg%gd(i&QLBBO@d9
z$7Qlw7A{IJC(@Ro5Yw-DaZ3Y2C+h2i)I$)5KKFJH5sx?=_c}jWt8r*`qsxS0LRtBu
zlfTL4AG>}!8nq~LvEYHFu7JM>NU9|<0Fy|HX}TsI7J^)0jXTn>=erZ-S(K`m{`l_a
zZ~X9myV7`vQc6}zNu4LJ)7l@^3{ESPsLy1n!0p>)e$$f5?lCHX<#@WU-#JJH{OF=0
z@Yp4Ymv4$r!8?Jle7l?G-6+uqD}YghJ3mhTlWi0#^I#_%4tlaYb;aVJ_~iSpU{_!6
z;tJzt!5%6Jk|eLiXqd9JX99P}(yI;<Lj&(RJVJ6ptah?ku49K04zpK!@w?5q%qR@$
z5C<MM>J}(q=<Jsu_67m1!&LxJ))jzKj29|RzA=MF2(6nHF|Mw=@gBmHzD1u0LwJz;
zjlE{Ow9R1jANTXpzG7{yqLvD5M=Sr3%&jE>efH=;;N75c|6z475y-{`*$ZF+RY3EH
zgUdjLqTW3uWy-xjkJnl3|KPsY9Dr~Wmyaywb9?6-5h3zM#HZc=o_aF{D)G4y#eM<S
z$`n1HEYV)7UB@;Bihhh9oHS6$c^IVrOTD<2=bdOmL;TvTrM*%BTCO)<V2NH^>t*n@
zP1`@en7uYkzn|#c@fyj_@3f=YH6h^1^96BD!4O+{RqrN~5&&sqa{sutl-lju8$FSh
zwNDg6!%|yTT83wx^L^Bl)_@l19sC!hU~^tvW3TdBV{R!9s<xUFjHj)FTC%qPdqHbw
zC{F_l!AZ#fvg?1k5&XML8AkwbHbQRDvfv#C!-w@<T5g$)4{L`pkwtFNJbOM$h7LJr
zoE{mQ%rfZd+^$(XcqC1R0zDUO{62(Hmd5BA>)}tvx(pZPfEX;zP|>kmw0$8uu_^;f
z;EbRRQ2l(@@hxl`rJioTw8!g#@1l8}gHd0Nc0C5p#O<%}_<&WGEaH;DWL2K{Q1iT)
z!Kcsqs5aj&b4O6sWv1WQPvwn;zj|H^1%(C2$<?jpwwstB`hSR%%jYi@u|Y})`@TQM
z*0+3g3au?@|58ZeV^qXJa4c}UO2ZHH()hU~+qfXot{2}_a+TlJq)#q1yPio^sg{ai
zuVBJ}Q^Ydzdo>}a^j7u$6fu@_2y^Y%8G6)MtvrxP-|xCZ-p>}%^W=peqrcwAMuh#_
z3jlGSoPwad)LJVu7@<jduHE3RxBU(??E-eRJ)sfGV+wnkIH}y?5t;TdXdRnTeY_(y
zFU2V_SP2RJ-6!d3S&Vj)#}3^IQfRm*n@fabiO|!TUlZ4;(5pv*QqC_}Oq8oG1S1fk
zFP0P+PE)&==mOkR7TPW}1VNJk9nUw5LJ{JN<VzAn^b3XDxm34hQ78C{JslldEgFP@
zssNV@r*4c=9Th+3p)W{i>Nxz7Eii(}C;CnH7AR*r10|id7XKak+jJ>H$68(ImLdVW
zhl&%Hwx>z(mgvtCou*p9Py1mk^JL(cOvvUZwMAKZ3!@fMYpO)Ep;)FIyX`@xJh>E5
zpot}3r!n!}FVs7!gdf&>a%^PNnPqYbY(2v1#ci53UxoE9gI_2|A)olJ`n*RWl6SJ+
zJ2f>K6vw&mTR~+Q`0=fxUMWJ}ty3uI1cadF;uRlt4*hRXeW+3?T5o264(uJ;xQyX(
zZbp&hqaRwx$6Wv*9$V;`1Iz_@NzY?E^;7rV(uB3zbvz7+-V%OEsu&hCEH>|j%wbsM
z2t5iX9b?<03%hjwcpFKfCLA<`-@uHw8>O~xrjoArnzzm4f5PNSHXD7`phji^pc9s}
z2T7{4&jRd4(JLl(s)t;5J=kgp*d&1{*=O+on(X=w|88eJFz%QCx$C&V-zb97x=*t7
zTbtC#1mFYFlPVpvU_S<LjWBahGceJ_i~<+3#`^CMG;xBrB&@X#zC@8ic`z<+CugJR
z$ic^0C~LfTeQn0;b>0K<h+n1lGm$dDT|dJ($UYY^YBYN#ad_H&R}nfC*>}2K`8}W_
zKGb0*y8TH`E&@&HL4jH>IeUBs{{o-~^O>QnTNH`gr*N1@S}q`C6`|*LIsyc?DarJ;
z!+Og7#fGYAT8+*g6L^qOt0fWA58HAseOAODV5x(<G%tJ#U?neIw&}X&mDiwiwuImc
zqq=;{D@C!vv9T%=58C=L79F(8V>)W70YHvXxHhQs?79?{f|p13Y<63cI&I?J{Gy76
zDar>;y-yAbN57Ak9GH-L3Mp-E8#qLYJME9gz>@Q_i_M>fn~qVdMG-+AK%+$LVS_(g
z2hyefklSLIV}*yoB}*i<aE?zMC)I-GUI0H0dqqt!`1LaFl}8=Dog=wiSg$uhpk3$&
zZ$0dX)uJRQ9-&}T4*%6hfX*l&Fs<0vcHUsjmpqPH=YUKZR<}VMgsQ<n#<U9xK6#kD
z_c8Zn#J32ls0gya498f<z#}C5f~W<`C7Q;+!_%JPMf3C_FZd`ws`1W-@={TP@H$$9
z!i1yZLvF%;P#71^9j+v{%f-bIi}Re@^TV}CRV(VgywFq{k?a}f5|A$$Fw((0&+b8%
z$FleWyy}~`kM@womMVt<auDyV@otF0t9n?;%B+Z-_YIo2Wb+rmf3SBQ&2ygnp<Du5
z0i6dZ54J`=3V>utz3vs-D_WMr(r8!SCTi1zn>kP^F%S2<26E=#_0-O4vUt7^1bjO4
z8g3@rkG^#<v>F!X(A+^_MWp6t!nY3MjT{kM*fC{ZoFG`S@}3}OLJk~B$SXIVdyJD0
zNP}6ZGMT&0R^H-i8S6H8UAV|$vp(T}KJPC?P7$bGwsk|}6FxN&Gnx3~&t|cMyijj$
z^z-?4y4@(DC|O-r8jEJpMRB3tBx^VUB14hG5`COOs&zEb>-&{Ku{m31mb5jRUZc0f
z^rkogNP;5wv<_QdyX6}D@9ixZVdVxfa3qbT?Lnajd;l1tP0sDH;f}cW{Az=3LM&3K
z5TR;ep)$*UGQ7C`Wx{6Pi~JlR-#aJv`7VaVTCkvS4lylFvdVPKVQ#l}I{G=W)N;Y@
zq@`T+Tq&|JP3Lo|_CHbA_M~ZTmE_x_F<L^m#58@R&dsY$?<}rfT?;p_o>Rl-bVcsr
zoI@*V*slV#+}%n}%w;v67y06EV`0JFB(zo<&Kl1fn5X;8GB?g?s8=;rc@_rVOQ-?v
z)UCJ-n%aYhrptEQzh}m@lCIyPvl|cm=}BmH4wx$wa*W0-REe=O37g5Y$BG#FYTY1+
zZEz4hP^pt9cP@{4Q>0QtkIkU!^fHnPQO4Oby$`XpCuLTy4RKcr^y-gnc)+(iS%yRw
z3#AW#I&g8PDbQ;Z9>3NHRWw{7Dr_^TsGtlrJgyF^GHjPo1)FSi!sC~++ptE#>zdMh
z<{Nl!;w=;O)$i!M?{w#S+>ZM9{e$H1Tzoc<c<TS3?;pBgWdJD3{V~=8^Qz#>ilz05
zqGwg5ty+aHLG4d8>D1}vmAvtHqJ=Qv*0Gswv+6<@uDnroXNj~8N;pvaiKInkwZzP%
ztLQ>z(iGBKmfNYOiDp?~B^<5(siDxwc%fIN;i2HIoyZ8n#W*Zl{hR8(JtCRdr<}8O
zn1x(2yb1C(_ft>AL;;~Y2&AOfJd!U?d_*NZI6o+gM&1s6p*GqIsVBFeI&`|;Y{KyQ
zds9eqvA!mW|KxJ?U3$Qa<6Dqr6A9l`E353pxzNj1m9cVtvB>>JWE)htK(#0rOO-5g
zue99=S|tUlNa7yAfwxnxPR`V`gBfF*?VB>43M|@Y*i#Qh8o&)H!VYiR&rLEpZoCd)
zm9|{`-jx7TIU#CaZ~Hm~st8K@+|W`8+yt;#beF*q?Y^K;sG9}H0gDYo;`<LctP$PU
ze!U=fpC1THN@(S`n_)tO-{IeB3t7Szz&wES8(Tj4@%kcykqX%F!gwv0_~)}xy+I6M
zIEX1SB6JI5MSflVAc$np1Lru(7W6Cl`klwRh6n4T&rh*n9PG@B%5Q*=)LE@?t$|Rv
ze_C;zD;}%^(%q17XRdI_m9UJ1QA+GMjMkm}X!G<2u9211Ro*Ch=i<{A(QMj>d3_>+
zb-o*)4-Be>Tcc$yH=5kJz*XTSxpk-L-am~f7jjILi~C$|t-xq?l?JFo{S3ik8Z=OP
zdo4p`u5y_s^WfMJn!He=wu!jqr*zB1nh)(`AtuB}r+4R@+rR?s_%h-2Cy1tzZSEf%
z#!X<z-s|BU;q*&`R@{jtH0;Z;k$$p%`lmvUyxZ>h!wJBEb86L3bDT`$Dy8T}r&?&Y
zUF<yUARU!8JvvV`BnmK>|9zs}Hm_b`=>Kx3pSd-v_vzHNiA-xZ{ndUP3-4-JpRV*4
zG&#TK6$OTUXs{dlJV*D#OU#C;VX#_g>g7rK<#B6M(MBqUo<_QF>08_+!95RGiB6TA
z+l`CDM%i|S?0za>{V0*hY5h+h4Q0IrZHpY>DG?(<x?gY_+LZo!_254z@tC4>GVZ=r
zxzf1mrbSbrcFM2T=JkxwaJ@sQ-SBk=b9+aNmp72f34QLWsY{|Ck+hX?X=@Y_)eSg*
zS0}K?iO<i@x$&G6{FYtwx~^&F-O9=T+MY@+`$B=M?NYH?L~*;9kLvcFbj|a&r1`1y
z()~yC9V5H(9%0AXNK&0-0O2CS?uLkZ-I?P={)X7(pT)zgX9~UgCWcGboL9`Sp)I;7
zCyRG#Kdh9~CQ^Z3&|vpStn)pC*!qO*aJDR}6De$UwjfwVsK#v^hxt=7tKx&edA#LR
z-g{$e;IJ&eSluLing&04oVuzz@!`V<sc$X&KR<Puej!pQH_GE%4ihM5PR`oA6Y3q5
z0esqnq}+enHV6{vIW=gzsw#U5jS+Hf4&Dj6P8#1^x6v${&aUuws~FE%uy~*lAGr^`
zz*HbAX$fZ4nJ?)wn@!WMxDz~bc)#$wI*qqGoXXeAB3>+hNUCuCqL&tMC@?jvTr`V6
zdC)kEzuFYHAC^IKx+EbKY<z+UZ*@&#yCH^qV49+n=5NJ(5psfA^<^wJb%pdzWAEzR
zw}yT3=Z+;eNX>(}o%?QS(@Fq9i1EZfzbV&$vPBxNYb-5ER(g(hSWDZl_j(rJf83)$
zg+oEe#cp(HkdfoxH}=#U%z14M_0UDV4bthWG?CdZElu%begtp`<VhGWy{XEY>0(E>
z#xk&=jF-^Y=;p^!n>+~@OH0UXK-{%1<lxczdhL24=lPmATe$1p<jj}t!I^I?H@5*W
z6<&At|C%W0y@83c>2>iw;{R)+tP}wz$}j$ft2=F<!Rhl`OoTt)WKtn@4_ToMO5JA?
z2xIBWXov)0HVXYVjp4Df34keEAiko%xczC|aM|K&H|1)wl`%BP_l66myD;>KK>73Q
zl=Vt7xV_kfkVC|>El8<C+|#ulpg!4v=a}_g>V{|Yc|rLWSoEHNHiEc#=KeQdHo#|A
zs+TnI?<F5645LrWjPT*IoL^tBwnECs(7*{VmfYx6YV{BS`RpGtA1kPv1boNmt7QNc
zn2`6ubdOF#eEWPbWX!Ak6Z7U&XqhCi(3A4@_2B|TMFUrIFF`RMNS*#T@}Fs;J{w|^
zA|ktJ3Q|cQeSlEuW`&7O%h+$x4%PpR<SMaU-}A@S-K&Nhg#ELXjyx@KCEwlzfFcOt
zbaSv|<oc-{8AtGXaLQ;N(%o_n%*Bt3*;1HvfKi`&H@`kdke82SyAS11L0va)GbI^x
zXDivsZZshc0@+=J388wR5qyu2t&h<({E<=_bqCGcAQXkX8K!p<Ek8*Vj;&qv!7dc9
zx}P_Qa<I{dXkuV-m}MttwPSWM;2hYoym?Gfh$!u}_`LMr@ePkb5Iynag$}LV^uySm
z!Cd=@A@9nAOPF;U>*t8yyGzX*g)GpRu4#~#y-!!2^+CHEt7%W3H)IU5pOt*v8i?8k
zqO6=Zd04XaNeMLA(h{axUO4hXJa2;U@dK<p*4LBW9zNg(u^k#(7YkV(0a8k@!>4Q%
zpQM`wBxTV|XdmL-dwU!79!Fp<MNNgzG$A@PSP3y<cGxO!D1cS)+D&mz9=(%t(C=Mz
z986T-oGwsK@eEcUO1>iy9QSuiLi7Yr;QPtW%9HNokUE`*<u7AmX%8uv*Eix!^g{Mu
ziB#Zq@h`rBxS3}I+tF6N%lMxptqZahUQ#g>2b&xY_Vn8?5B13ER=plm8=DS6KG$RW
zQ*1|SS>mz)8ITG8ds+potM}1NR?~2j5O*yd4_aB+U{j+*ER{DC>SBq_?aJ){zUi!O
zo^~EnqE623GsAWxmsPRM&-;3z-hn9jtAm0O|3l5g_ZLa$d@$OJs?jsvAaF6JJt
znC6B0Hs4whO{tk?=2UJGPs3nhx;Ag%k&zF39c``anzl;6-Aa`#)^t)&F`?mK{CYYK
z9-FetVzW%T47s7aX*_sYhkbysHt~<QG_8J|445pJfayG0yyt?K#-zZ;f3k9Od}qFT
zk%+8$tGlxC^Tyr3uJiM#;3Lt#-R{apA@b0&OhC(ZuE)zl-u?|;c$?4F{$qADqbl3V
zjm>s%Xwvq3|H-MQoBg<%vX+mo)(dfms~mjci!c@ci?6p1it<t8M;8!Kq>+xLq)WON
z6zPzV?nb($K}0}6Qo37u>5!7{?w0OaYN`8j&iCB8_cy<D{&a>Jhh^XAeV$KZ5^-CW
z&y)-S?xm}<{xJ3f6b^8&b<dV8`^drmxkHo1ymr02+mUBN>MsavPUr7=UsYiGv>*Ll
zs*wie04mtG^M2<|hoYC|Dr&^xf-Wg6q`7=);n42txS=QgGv{?Gk<0WSlgP_yFulU4
zUtnA;Cf`ajl{A>*UD6daA>B{Bh4jKzZK7(VIai5$%~@j$_i9|nu0?d`H>A8^;6jSL
zbfFr<=HOSGPq}@D)W!Ms26|H$oa1alY4bcfL$+Kr^7!H$>C#IW<{y@uvi7W{{U0?d
zU>*b}SVN~T;(sSeek0!IKH<PJY%6oj74FDxI|(X%Iy2UjlWL3_v;{7oG!<nDM|;wc
ze(Vx@5HJ$RrGA@mE4_C3!*t`e<>_%8AG>*g$DK@*sZPRDEJ;R5DnU0jv5D5HzhwUf
z5xOl`o-XoQKZ|{fx}O@y+g|~}2FQxfcUXKC(Wt4APQlS8V$P*u*Vf*fGwY!XMB-1F
z1^u8g2DrW0*x1E{$bvNOCGm1^oY0Alg$YAV>dqLk))?0^0q1Rj(Y%T;HZ`xNS@Lld
ztB|0(2@SNFEfPLz$MHiXRBmC2P(eav;~PZ6CX`u(Y=n+2bq4#PdDrnWy`~O!*%F<x
zfcx0w7}|vxUcnC+Pn38YxdXU@KI)Abt}+{tmBx&U5kDa{m91xLK&>njKrHa*gzjVm
z(9LYMiHo%ey6#EmRQKxphk0koq8%fhLkZ0noZyufv`C^IQIuv2a%HSrDDux7y6C%+
za1bvLhl~?UO&Hc`Ufi~QYm1Y>=lMKeMhr)2NBj}9Fi$LH07p<k{K#2{kT=V_8hvvb
zO16rVa{X2@jXb=apl^?*lIi{z&9<S>Mt)eD33wDw2$)l?NZ;6j9JOtoS+<r~^bj)&
zn+p08oCW{R>kx&Bpf@F9JAW)e@^^qeMSx*?uOWT(JM_AJxx%*}*3N4?_+BwZ@8ynE
zHr9Popr~b-0qwArg?&=WEzWu<yx$XOuH7!P=>E!M!s0nJDYb_<i~BJ#wYh_Rx{s)z
zZ15emRM=CKVkt7%da7vi4!ZvpO55gefG3h@{oQRkxV6^qKzRf%U4m4fXjvn+GZ<lR
z*-OMtX^<PW6!&XF_p2t~=%WBF+Sj!L+XWTaLu~HVD2&FeTkyJJnI`r^)cdDo!Jxc$
zgYnNr-vxzTx7Yn<O>Rw@DK0{JstraR-RL=~<08LBhq=D6cQ_E<hkTKnyc*0$J#JM3
zvIOy`?lVBpB`=s04k!oR{O^W)1m{xgW9;r_cu>gfu{x_x?gC#4={;}BN^XYo_xuIE
z+88g11$9=g@KKW5p;=%U5s;;nU;RPDXYN)^Si1qdlaw97%|DH9S?iYRFxV`KriPns
zE{djN-W{g_iq-F*<c>`Z{AVl8`uqG)F`cejD_FM{vy`x;vCdw9KfX9Dd+F}JNgWi{
z?{AT=Kp0<p6*?<Ex#F^Z(S-0Db-l)&;h6Q-X(?weV3JqVD^>XR&p?x&+yU|<W=I5?
zt=IH!txgVg0>#rv>Sg$6Bvn$}n^G%XfGK-+vHo1X#@Km`liUGUEkrHCJO1=g_&L=v
zR7p7M7eMY9GslX~w?e)3=WQLdyO#ZDpTvE(_VuD2)@y>zQb0@B+pIkc&Sc}r3%-5p
z^xpY+OkQlSs$~oIkcN?DcCY@>_`CJUoQXr++hn>k>uBnrFC$sIm}no_Ch6H1Ck}@{
zM6mxy4AHI*oUf=lj*yK1apMMvFattek^Oa@X2jdPHcVvJ7+gMvH+6bUKYLm0m|yA8
zDtUi3>B{!CI%v~m7=Mnsvn4ZaSu7%|Maj6}-hYfW8UN=7zZ-G<JF+ox!NrHdf$0JU
zY$0VPM(l;AD;l&kM(kn^!ZGxMk;FAnBRLw~T~TDj!%0UZ8T$2~^FV-)P>lYKS+RIw
z=|Zh}#&8b&1&ba-1$q1CinVLLBXw6GU3USp&t#GSO-Bl%a9Euvr*M<67G`gEPFBFo
zUl>`2Cevs-k}<yiI&@Ub%!qQjRKr#)cUBkP#Twa0R@jCd`EJF7TPk!ZE1E8rukXjC
zsldggYMx4-EG7Xr2$u+}5KB5z1P-LBlko%HbNHyoP<GG@%ZQ^k&(v5;8XPTx>z~eT
zotK9TazM2dvZZUOBrb}v5&EqRrlvF|dS|<USFbqO+Xzc$V>a(c3y^D(>dgJg;pS|U
zd^UtNQ*n#t6U&%bsJy(0Z<T19fxiN!Y?%qA9Hm6IGbjCOPJ34PJ8-59j0$1NX;^rR
zp0`5DjwA0Tvb<K`#UvuNieNuXuNwL$u5@@SbEtcbFq9V_W0KHtGPAk`K!hshJNvM|
zVeD?M*Yd{b=Um@>jD;UeG6XN<1zijkU_HF9`7fdk$J*PE1bY~KY?$w%;yP9ltKsZq
z;YKWO753+E_(GfW(vcvuCYb%#GJnaM2T``eNrl`>!czMMuE;M5D1SO<>fOC*t_Z})
z{CJtp&<+!4hmR7b48D9mJTEhe_c7k<nV?}45M_Ck+y=I(RJ_~v?4Y+v1yqDbHE&(C
zY-Z<6*w@u}L@>PknB?p2mIM*h_^{*myKsF7_x7Fks&`|U4RDGtZ>T;{68NGuaR6v4
z@%<7*b8AVIAc<|cQHSK()>6N4{!K!L?^Df$OoPclU(HO-9LCx1+&Wc~=>5o2Hv!9s
z5Bi=LJnpt*y*$Ep2VfFqx1zgWtK5)R{M(Dpc}6*5ZebxwID=o)W-rX18Fc^A3$N*H
z?2ZI8oA}*MHS@CBIt8hfs!S#84O@hqm_UD(=+vc4y0fj%r__X?C_%1QMSLE=FJkGU
z-gB9ByCm_l;;yAg&A2yRiCV{$hRSeWUcKS;na|)<py5MmnGrb__Th#F#Yp*8n7mjL
z)Ll{JwVSv6C{FPb$BZBZ13ec%MB)};j{D;JVsq8{#>Z8_a{3j9+!6|=fbjl-!>v$g
z<RHBh5o%-tvQoVWmTSF-SJ|jB2sZD>iXN6Xsn;HdPZJC6zF)ZexN@H1<@NzP>3r6y
z$BKJC_`=6&Mg*v)AljRVgrMmr30q~`Xe9D*{j#2E+AIN((Z;_knFx<R0i2_;(c9y^
zZ<ohfCdG|!$4hHN)OST>30AfB+b|p-MfiTuE^7H|B{BvJ7L3WPQ5uyBzqxd|XK}bC
zPrJ}>VNO1>H|g&6d%TTHa=dBxJPe{20q{bfhNII{u}=dcnX21mYk31g_E-s#5YH98
zgi}X>+&usck)GTf&~O0U&psjEr%9r_RB@OaHF%sUc5kZ6M>-DE`;6!7jwus#=lMVB
zwMDY;wQd4h@9l?XwJhV;5tLr;YH?~ur+iDZyr0PE)0!549SgYzdLEVAJKNuy&WL0x
zrg7;>Xp7!zdfImiiEo_IMyQbcjx0?0VBD@m!WEBCRbgB@`i%OOU(vnJF)S|U+S#Sv
zL(&AS^X1dHwIKEiKVQQID$Gmgo$Qv*bK$?HhA<Kyb3g2Ip(SV+sccHz54sl#+0Os=
zI7yf50>jgr9NNA2_s)3W$C1h_ex#F!1N*zc4ijJI?)tJ@du?E(H44xQE)BVk_tDEW
zdv41e3R-AZ4crKO_8gL%O%?rAzDVtaV;}i{1I~BcqwO#PwkRfgwJC;G)+LJtht_b>
zmtSwMEB_hdrfE+crJ!xI+5cQ4bDq{nDIQ2SbJPpuT6?)^X((x&))Ezcd>>66F9T2)
z-_u@k^u_SvB^&jl<(&+&*()-wmiOs!&rn^xs(N8}y^ldv)qIb{*u`z}zURApx@GzC
zWpeSwaHTlBPrOm0@aM8f#t3yGC>BwF(U7q+{MO#1CN24`G{2RQ%~sn|0pVOTr-+K;
zQKDmGa-1D+4&bNDxrk|b3mfWuw^51!IeTX%$Z7@5lJl1_3Pq*<F~{swO97^Tv@qH_
zLgr}@)1^#wNKI&^77g1|9*T0XLdyvaaiXNDR$G-Ynp(;Dj(Mq0ooG=`=aCvEugAXN
z(tH{k`IM_6eR3vP5Rng&6EOnuvH4<JNAZ}1=Mz6ebc-cwq6JBEnZNHW<@n~#Sk98G
zc*av(4_o67b%6+oNzB~Tk0z?HJ>~%KB2@>xwFb(iBmU5*d;MpbRi}3F{j{(~7JK)Z
z^v!Fzcz%X4oB0-#4u6RQ<H#DkT|7%dKLLNj!^V8bxdZ6!xO%Ivk36y%i&?i3-YVKX
zda|jo*|fRyg7AiAw>a8usC~7LvGDe6rp=2|A`6Go(mrqBqlRtROBe(YP0nMI<g=Tc
zgmO9~MI|d7RAJ8Vbfls@j(^LaGy!YIaW*<*j@|(BoqAE&rZyty7LT=;l;2jT==rFm
zqA~h*wX(UrCSgPA(g6oOAQuK?WnrnZ5Y)f>uJWdalr!r*e~D{%g7v0lAlz*RTjs|y
z2dpzB&QY>}_-<7VmId~|07ldCf#JF-GVUm->AJ(nnjEN^ZyNbH*&7bpoXyK9?ct_*
zJnaE5Eta546Kax66Sm5fq}>1zLOSP#5>}_68Rk-k=JgAu`dSK~+=4%a6WL@<*D>8r
z_ZZ~adk3bI?koK-M<5mjZ0sdt=P0e$PA83-PJ@72WJ2jGa?gU^cD^=YfX)6d{5QN`
zu2Lo^rzan%b!z4|wS4sqEpx6$u3)z8NZ8GXSe%2nT~GKs@M-8T3|-!1!J<eCW}feP
zC{$azeRQDE35g(BsPvd<{t|bOimpb~8t#3)e0zoi(i2=YyZMTCCedms(mLAPT;BTd
zspMsoxWp}5XJxmqlIWUPeud-ez_$M9F7Z_L$Ap%a;{(s&G|A1RrP%N`sDQKi0F6i^
z>S_^j>&aiajc(E$8f?hoJr#0<J8A`xz^TQkT2_MLnt|XYa`(Z(F6cK}UbFCqt9yAK
zCWf8mj3lr9oQ)o58kWaBYjeUj2K;LGB1Ar&laap;G19xW$jX_J3fAL7P0MTT8NuCT
zPG}gR)O>OAiKAwY3e}DLdhw-ldBTESvj<=Af#L7VlkE?SI>u`aB6?S-+6!JsJ|8|!
zm358l!S}-0H>arB=d9E)g*C<f7R^AW^`~NbLPjaXKe=w<!iz^qKbbzdjp=smBg*?6
z-{Y(?X>9RKpO5t{T98=Ns_eVxwA8AuHE#{oN!5?As^4spzBAh>054cYWjOW!8oysl
zZx_Ikvp-IJ@G_IUs)-=wldBUt4*9-CLNxid<`cclh<+p!CBz`z%RK6V=#z520K?V6
zl+>;I%i#uy?n1U!<1rWsRfIloK*G1W-CyLsz7yU2@<PI8iR#@-xaZ@@&PC**9Ekzl
zVR>tNzT-`0YrJd%Tb<ODBkq2nD`oa2(v{l;IF+rADdAjH@FZzxggzsZjPYGCX6W9w
z(ti~Ct50I7z=E2LzW=W`^gp_ff1IOY=75gT#$4^p2e`xY{1L4gN$$BFb9_(hRg2>L
zS^3fp)MYnjc4B9%R`oeD;a%w{K|cxoG?~^3ZR4}}(isTTawAWX>(?QHh7-d`4C*5Z
zB~wyDR~fV)@k4wLpi=no{$05Je7#K8*I#IubOOCE6K#5<s7R6=<KLQE$VMJ5@$~D+
z^d+?V2X_AbORfASpef|pfQgbSzA%!goT8$dp?v$t2=A04+Xeh&q||jeF%ajNv>B)z
zlVA0OtsJq$13#)4z}IijcoYNXZQ$=&4GfLhmBklW(U5JIs|5h$Q_m(k3dx7eH2;GR
zW(~q`gx<>)1SHdIhkI(iCdss+zIEZWm}D@yRl%pEdXI=t1oS{%x6>*eGuJ96Mu@NM
zq$2EbBUVY5cBqP{p9(|?N8F5F;IGU0l;D{uGH*VVyoqUp9aIZ^_;#3OIGJxRzc|9o
z(7n(zr4dV>HRcZAWk)zSQ4n?1h&@z&F&3)_zAf=UD_k$oc!H<{LonZ<G)l0{*QFr?
zg|vN_;575$MLk~?+O{<IXO6Zk2QvLp9aEHMy9h!bK+wT33bC5-0(R@JAEkg)UB7=L
z|0OWiM7UQgcuA$e2hKmrY2oWHT?d1}z{A~$#1?8dkiH-cGr`2YwbfqGEfarq7$&h%
zDwJ|xpwHgr1fMX7vT0W{FsZQ2KdJ49f>^y@TL2VrfX^z~3c~_VyKZ%gB+TM>L{>Vt
z$C)XiM=}%y-TA}Qn>+_-<A0oz<x`z7f@*HWMUoN5aX0ZJWPdWfzQFgFR4Q9i!iUkk
zArxZ~co9J~AWj}#QJ|2rRTc~&7yKEgFCmr%5NkTt88GT-!v0rYfD9tfialhsHY1ma
zCFisIy)mdGaomApI8A)&hgpOOJ;95XK5pG+TN*HHy2&axBo?%}wo^7hsQ-g={s+l~
z=3pp^ONZk3<FZ3SW~$x_X~6VEm>r4BI3mu?(O&I9cRHvJSc3^dHfvtEz)S?is9OMQ
zp&|-;xbIijrs-1dnEmOBVsQ^Y|JlWcvz`5KBSg`?e*>V2Z+jMwM`tc?#95W|yo6o+
zfU%|-Vrk$49Q>(ASc?f%UtIykh-~q+tqqe8`vMD}{)!+!79nR7{ceEC3ghQ{WAx9q
zwG&OE8Ge^qH@-0U>DRq09>?$84JyCS_I%e7x#3~e>HDa`hf&0d6oH)fE@)O@;S)?-
zbp6oU^L}Ve*?-^RzI{Xr>=%`lBpJaL4`6p>)qdww8czy@XWOqZyRDBuEa_ZsHbO?{
zFZUm-$qFFmQ10tF3&4Y+?3TQH2aLX?Bo1KD)TF%pu)<~Hmm4+aGs?{Xu=K*WcV#mO
z5WC+ws#4Z&(eJ$=(|r6Zl|0Jxbq&1yk*va}YJT_OnpA~$K8HNJ%S{ta<&Nw}lhB-p
zC`Sbj(Pl&lr&gV>o~MGi9>RSc6E-BHiN&=!CzeI;G9eAcLmd(NWV)@ko8V0hLtK3T
zq}n-qf9PjwKe0YGaKeLM>j@Pf%jNh)`Y4!~^u=_Yjox4Fi}2iEt!jSwd|=-y*XkP?
zTyXWDwU0mKiNdD*epqn!U!3nx(+ybu0J+YKXm7&uHecpU9Ed89ij8c{Tj+OB3JsQm
zYLU8XHKx2s`yPfi9TK9ZH*Y>RHuEW+ZS>N$LezB7wvp*3*dKNZ4L~R>2!i}>8u!^B
zL!GAl=w)iS*nn^;ID=S`Scx0m-!+LKEIfRtXY;aCmSvFpyI4dMn!Jj)4oIk&qdVa*
z&=&CH7CoGpckmI24hJN=K`r?VF7b%7#TAL-l@h_o;Y%;t^6#a?k&1@$&hdzO6C}qR
zPm&NV+l;HF?xcU3wn;@u)M|nK(0hYzs{-j@n;;Go5g<#)QP~(UtgC==8pMrObfu^q
zP-x?-t!e^qpNiA!d;^ijh_IsyTR<_BkAOEDjVjzN(g&4I!T{Hnwxw4}YG8<9TR0}&
zGG2nNdG*UnvK`cVcpY%wqnRELVrEi)pymL?vlGFc%ZPN^X$V0e!?r}wcd;moRL5^&
zmU1woF!@hoc3OnB7@3_EEvp4LgSwN>3Lv@|O?EMQXIzEq22r{i-3F(l)Kh?KCg>ta
z1CeW?f;d)bI9}Hlnus2}`F46OmgGAa7FqJs8P4^i1LpW+7fcZ}%nx^nNU=SL9!+=y
z%+jeIm&c<6C>DxPik?$;>R+yVnOgQ)J_C8Y8S%%_Zb3~N-cdkFrh{B~4g8i%@RP9S
zw|wwKg{=x#qgc_Bw2sTp=}sct?UG1GSWf!+FV%uQ6QAuS9<_4)C4_vr1UA?6kEPl?
zvsf;FEUJQ9uSY~V=x;lHotGTQBgloOYY@6{-zWM$-mW|@elDXg6S|{Jf>?%<`)eE8
z-gOihcYPNiO5qtzxbH$ayzcaM%0wy`pSOjaq&Rzb1_PQpmE%ja<1NNQR~*|^yoV8S
zRp8KXd`!1%&q<$f&i0DbcaptO{gU4-{u+9+xA)OHcfFJkW&Nr^Y@?;_TPq$9cTPw#
zbbo*a`?ekRxKF5K<wr8jrRk1N$7^>Ibj5}A>IE<*uUkv_@W?;(gSfLKNzYq}Tg1*I
zD_eQp--(j@ertJcsQTxuItO2*15sE_-IR>mp*QDSeLh!5+7`3<Kf!ws(vvhD6AMzl
z{IGda`#Eg)mB!0t^L7uLEXjz8%?H#b)G4p;XT&bD1=wEAzaNj9&W@ToCU%n?r~2qM
z5-3E#F9c1iXT(uiL1?Xckf^^^%vSJl;_<3mq_W@Teh+=t_VzO$)R%NPy_PJ3YN0bG
z=4ETJ%MCGIq1`!!a<+esB;Mv3?UMUh*Mr^U*#s|h8*UBJ$i>+f+eYQ?4$+IF^Uv6?
zc`touSMR<#4cOKpFWoq*0Nl>YVUw5Sc8woNc3Y)b%w8b~UbaX+&KQ8H4ZL~Bzdfwq
z1rY{IM`s5i2`P!3UfV@CTMf!m0>Q8PF}Sb8P(@j0{1V(+OcK(?-xZ2gpU$k1ZHeOP
zTs$5A+ZkaGr!oiD$yX`+WmaX7M1@;0GB1A|Uki-WYQ|UN+5Ei^>o<9L_CLqz9TG5Z
zZm~Mg-~D$Z<O!N-z|#qfsN5`5E*6I<2K^N+4IM3i&-3=+Jw0Lc%OXZK{PNXo-}XLt
zy_LHL$#3_KD)Td}tV-O)2VdI$bTkH*KhT8dj5}!m8jUZWIs5%HbX+Z9R&|d7`xd~l
zDD!+${&>Z5bJ7@QA}zcMx%cW?fnRSEzLH#`9<h=r=qDlP&X5!wEcbscrok`EV(^;;
zz1GL8XnvwF&A)==6t$i}I@~k6@5?npAVM1g9N`#;oZthMViqUT)=8ivs6yve2y&wQ
zxU_Mb_wbM5&||x~WG=Slxq(A}&0(OmsWejSLAtVQbD9C_k)10#uB4*+3R7`$l{y=@
z23G-t)0Ex+6eJixH<rX+8Hzh#BEhUyxN0a2k0uIRj_0rI)U1AnE-x+Z(DwQki}ndH
zLyaUM>P_UZ3BBha`qV}>S|Tz`p+oj0m-XuOPT{pBySr|be1~i*{CIaxt`_2V{obIA
z*yas8YP4|x6-LNLqmkXbKjx5McLXt)WHPTU(@$m%H@V!j8jf$B!X-(a$*hg^qFj9E
z#wkdC6}A;L0vCgUdUBIS6D~l0>`COC>ml9AD)VkqLx63#mYUoGz>JQYwsa)-`Ndfp
zgrb;1QQp%zfMFoo`$c1ciOC#WZqT}X6JS74I<sZWdi|W^ld_8dA8TTyvrRVfx+ZgI
zs_&qJF`E#7MpowdpP-jZg8oVYCZW0gsba+h2!s`JB1R%)vu(W2T<ikn2;Qb_tG0&5
zmq9aKrzFrHmeoL?0ez~&+f3qn;*nICnG(o2X}uFq$)z0J^et(CJ2RYpZ9h^_h{&WI
zbxVvCw7NS{urH!>9NcgwcX^%KyE-ARMp<<d+u)*8FzmGKadD{TI|hzK_lCDVJ?q9n
zvg22M1z+}Pn=$9B8|nC05)iTF0o|0!QT;k_<=KBHnQxe|-Ic5vI)EFmmEm+O$74Y}
z*+2c5jcp%krSAG}{S{taUC^6#i|C%z+`Rcd?A6px><hGpnRrP;y;m-g$W0|w1l0Y7
z;Crs(l)2%u^0l?&7W)FW$ATy)7Jgpmc*zzYhpXPYH5rqfO#mskjDQJoEWSUs4%*n%
zFnGCl>86mbc4+ERuW_9DSl)U^jf4VwIn1TAbK9w^0yWMnJX(JsDtHh9APc+DqLCe1
zHy;DvhoIk=^8>`LSbH4~+UAt=hKAZy%m!Y(8vpM=8cNoq8Pcw<c-@#PoeTOd_n=Mo
zv9%x;$?@=@&$phns{FoVH=X#lBh1W?^(UL29Tq$D(wRb?OB_HUBHONcsoR*Ei59~S
zP7O!-YDdeKFvhPd2fplCz<S~U50VM6D$d@LM911&PJD{wD2P~6rN|H&ZU&PTA4ksA
zSe0iGo+B^)i!nYs4Q_A1uS5&!N-#Q>X!SFHwwcTxzmjX{*nzG2+iuCTq2ZmEwHu(1
znOGBt&h!Gxht25}cZABdmX?EmVt};D0r;y*-vko)zo-u%Wq=^L&5l3b$Dfr#ZtJ3!
zPWhvU*7}<Hp#B}z_#z2%?WbK~r!>hh){h@(-sd01rGtkO^7d6WVugwZl76BcCHK9t
zprRyrJ|qsEe?L(5xXd(!A|InV@+nu$2Hf{+lthfEZ9W5@c#L1H&geiIYWO1es=v6r
zf3e}5n|c(<=~7^u|Ae_!^gE|Ji7Co#_vaXKE1Y_ToOY(?O?o+r#zHF7y_vt7#M%zT
ztkHrHpor-Rv&JKtoCl!zJf^m8nnXUvl6`;8piqFrLmtr`zd5DUAu&bOO_9pUfYt*0
zk?j6-DgK^<d>Ah2DG%pK?|qYMyA}0|<Hhv9luugYf|Sw_5pg*~u}mNnBy$9?;Y*+X
z?b3^rgIDs!&q63goVs%$UPkK(I2g})dT|Qz83;Z{J%n#kHZ+?&!Z;|SIDJYZtix-8
ziPHGIR=D;7a67xLBR~SM1E`-QyW7khG&5+{9jIG~;j|?5nN){l*Kfg2xPlI%K#Y5X
zd}|5nr%o&}Z87U^XUtBSBr;Y_A?FX0cza{$Iwb+TNNkL%J*n3rkjdzs5u;Gg1CD|l
zxulv*#$*oq+Qft!72m^}nGHbq;am&i4@lV!W7T2yBByxy6_E8``-?2NPrnoLMQZuW
zckW!eN_ZcNGH@qxoK`UQ!j@wC3oCpT>A?iaKd!KF=a0DG78k^p4N&UyIl+O<iG}wx
zY|7bR)l{Bm^ma;wyiW7n`!&pa{+G{lZvNLgN7Ho|eD>X)#l3%x#P`j{9CCwRgwE3x
zXPeO#%sa%~%^t*A!K+2*G}f(dgDn$^Y1tnbO=YJTw>u<d7U;E>CgcZ<`@)ibeb^bQ
zG?dnzHXmn7=N|h!kvU&NlIWq4+{>ic12pLd-ew^fGc)Snt3MHAgdj(}2^!Dq?<KZK
z|8;evnwS0d&V%Qzmt^SGE+9WYm`<I$IK*1K*ie1M2kFTLzCwS{LRf>12Y`%=)kTyQ
z%eCZaVCo6$uRJS5GN9+DjkaSfaOebVjxdCwsxfGr;$isq$ko=hw9G0Cg85y7u}<)8
zaQ+8!4<}M*t&MA%E+C-tiEHTIx!nOUx&oq~##ift&2*};d3km{Pc1yFg)*N}7|>7A
zdt%f?J&1zg#i&-M`yLKky2n{MnCW~GyV2~vylmoPKG-9ANy>jULhN^BW*%K@yMR3N
z@@ie=eP`EfyZ2$zxt6Pa-+^le{yc62?B~pigVNUuSM8S1W7IdR_wE<xD@4Wp91!do
z#c$mvB%A<*m3ou}lo01te_Eo`?CZxb-k696BX1Mq1F){~eYlVAsP|Qx9_$x(*rLF(
z&=UBFxcW))XxDH9Ulpz$&9SgwbN-!&dfcS3HJD~wAl?GGsxfpZi~^L^K6_nrBsjNf
z0$Kf`$~Z>vmUJC+eZTpfN6Z)(SFyac*&R1CUF8~iKQwdMs1CSkd5YMYV*zi5Ou?{T
zU_R_fBgsbrRkHd+!}yEw?Nj<MMKH02%(4Htk|+nBJQwkD2lW3fyX@(Lt55>&JhzOE
zvot`4EFZ8@N}8vc^}AA?rUP5A#<JzJm8Ya5qZVZ_?7=ikjUipm*E=(Q<NE^s&;$`v
zCYuK4_Pi~8ymZ`qmG+nGQP-Jfh7`|RATSA3g+>E(TNx0rX|Jw+6k~4-d1K=H5!)_T
z_p=eruERP8CdojKff#NO?#Zi)u!cqNM%}>qUYWKUp=x;v4a(^>v|cAgV-_(YO1)Ic
z@xC$vSK6&Qlcp~(LrI9;s=kDUqICn=68xhC3v78q#~_`W0E33{)oOCIAIl!wX`G%g
z%g}+WF~SSwIH`BWhcY_TGHyR#ieV*=RMYTbV?D?I5ZTkMdNpT}AutQoZ}!AoM(Q>J
zoZFY}-Pt0cKD-W*scvH8AV^B!PEs5KLq}+%A=X6yV23x^G-ezekb*VdEY#Vvn+?Rf
zn){<cF*N&s`xgxw@fOlRQ79EL546G4@BV0TUjwB|c|dEQN|T$dM)1-{G=HQ{<1p)J
zq>KPR1+1+c3Q|~AjS8=A;tV$z(NFdYnOP(BhSG&CM{*dJ$!SVWRF324wD7!<(X4k%
zf{8*@RPF75;si>tKIGqskzXce2$ZsG#|+ZnRr>I>&3bnd%wVl@jkyvswi#QyO1||w
zNfH3CFjc7W`-F)M0qHm^3%f1KwVb(B0q1-q!vSVf4Ip8O?-=-}E|~f+A{Q6xZE*J*
zbhd+6pyh-4BZBK#kl?f^(2$^&A6aH5Tnj2g=o$+ZwQSe)PR@tC0%7MrNs8m2O_BSj
z?8mp11oAqSk(SZx04pBZAhKE*Bp=7xg2EfI@%8u8a~+zlZm=0nsn-5l^3xo8WYyL$
zUiIY?TC)B+dv|j-P>l9fs~;WP3%DGlC(K!MQ}t7l6oL^$eC|ShRm2Up<0}zEkPDk&
z;{%)HbdRCmuPvPO6P#Ob>JXuTY&R}{C<V3B^jRmSr+Gyjlb+zt)x~2=4A9X>#b5W<
z4f(?0^Cr)Is&ZRV?xU*Gj>vx9s<#2!Q>+A*+i})ai!|-!ER^{{p9<Xan0|NNakVQM
z9)2O@=50Qb!q?2XR2KZV#^Q(RRP*bq6J2$yfk;HpD-Y_u)6-gWC+e@hZ_ZSSZ+7Xu
zo}oPM*5IW(D{T(8&>vu7r+mB`#3Z*1{T|a?aB=vn)IMXG)A8@Knb!pmDZ3Fy9ZTD|
zr026a&1U1d(oIv*2`pN&C?Z1qMfMB(Wv-9DFRya$lmcb}q)+agpmbw$qDX3pP)O<e
z&JYR8^C^|>3NkC=5HJE{_i$qjU#T%<d=O9HA-t#gMxanW4jz&emEz*9D&IX31{l#e
z`t&_QH4jSOs6YQ65p7gY3retr8|2sjT4T_k#>ltvYn1Y~fRBd3e+mVv3S^t6hiIiP
zO*U$bz`aZngR%4lUp!9dOqZtB8jdU1^A=wBNYQNxac*kUyb$AYIil|T6m%A-8gCPC
zjiMOOHPR#jXTWY!$f^GU_pP2R^(sR$D!3OI68G@el`z+X{<Zgb2ujG!m9##XDlT}%
zsy*0l=7H~q#6eTU4ASuI1M$x@n8bQ-4?nk&;g)FQSgo<yGpV(~2^oTqXLKfn0MTBR
z?-95uW%|V`F-tyr(R#PVhw&FjA&(hhppyw*Vl@D~9sbD@Tf-TCejTYZ?IS{n!eX`d
zTH|M{(M)mB9F%SWYvLIwvM_5${Ocr81+%xVOe&l8HVCnhqY@RTo_I-szMtL)ggKUW
z>hHHBU)HpD8P0q8Jc{$Tdz?(|u~@)#q#&k^QWEF;9FpOfs$oGnw$?kRI)Zu7a|8(}
zR`?6c-p|u!CQy4rS^+?FQGtR)rNuS&9@wY$r;U_9%#>)YPrviqqOlmFbwT=E<GJT=
zEHfD31K=#v;%^B-Qqw;m)mquDH{h}Y_I0Z&SCc@|$t=E5UjPrOT!7f%P}Kt8nSjUZ
zFmi9ha-v|7ssRBX&B*tBn~h>7@X>F2tMZ2G!wCEW1>p*CgkZ&V;koxZK)rIb{vW^T
z0CNe?F81Ooo-xHgC@t%xC(N0gCf^BI_gtREAd7XO-1fGNuS^GH*yP}NeQ6zRZzsDR
zZin-4Cma6&QiS(uwi2441U!kNC19PWkj4GnGN6b4sOA#zE4)CR!FFE5JCAlYOz}7k
zcEhxBtPt%sigd&5cKT5Zq=35|&Q<ov9o;oiyc>ag_Y3}OWkJ<KE;VY^9Q!-IKh~mB
z@)>?R;#z5bp{-SK*fLq7H=rl9H8b|SGadk$;i7ZwOFJ<or1eBmcjaAj8!QpV_MtN=
zsKzv(fZ@<BNtJu$|Dg2#{r+HC#z3P>v)ta!ZB?EGptdZ?)FB$KtR36}#kj9{WvG>T
zzy0<OFgLMcL0mFQw3_IOln(ZJiX6d;#sRbMZsvhJ?7ig}t<P-5)n-1ra(wOw41naf
z#p}3=C)ink#OD?^2F{j$p&|A2v9AWt%o2+pD!4e6SH*H;eQHO8Nl#g;Q+J!^md53F
z?r6a52^m+-S4<;A-=DuYD)eG5e+=e6v(}6RtSmAaJ?Y_y={Ikb%hQ|uN82(9E(t>-
zX243zt|Rv(ukT<L4Vi;JejVQwDnF0C6;P)MA!H-F5mpKg#OUPZZ_QeCTCfeU*QuqG
zz2%)j+4f@UY|-CcScAJ&8m)gb)U?SMyc_LCf(CfE{5$3p^Cf_?cxl=My8roKY*r?4
z10gYbw=+itp;@X;bh29KnMbJR&iS#$8Y4SfOLX*cy8V5XBw!I>vlzp0iq`j|@z_Nm
zPuJI#7Lnqc2x2u_y;8pzw0}xL_qU9;sL1=_=2ey5rKSX%<;suxpHJUkG0fqTP&tlo
z$W-dDy%XbFWi_nV&?o;3YNXHDVTMr^*-#)O1MTVStDHzpf6jI0Zlc}(5dMs=erX&L
z9s%;3o`FX@OL))Gg`y=R#O7hY=lW>Gj~rOS?neG~D-*KHN68a}htG?YYCTt(hji$)
z#hiUl9sO=1Re-wc5Dl50zRW#ZC_s2D;3C!rQi3^)$q>zu0YsL@15A;uBIMqMu^fjV
zfdruheU%1vk6Ej7!_F&A1a1s29K8$^EW@{n<^ng&nLQ4QdLj7BWT#7~tazVCAc5^0
zcj-{q#zn2hX$d1>l>=<fVpQ04nN%+zHf+O;v4wmY3`iunP(V8H7zbE^`+%q&vNn@h
zq!3yQR)FrJqy^DDAnL{RTJ;#{yz~*+kxLn}HuKJ2f(K_w@9iq3SZ&gcLv|!98+I%N
zoeo<I%cth5EQB6`Mg3#(7JMSol_R}DlaH53&Mwq<i_fcFz@+yy?SXcFFg=1wklCN<
z60mX>;pA-#NdNTe1S;*H)f0_Q+kD+NMfc~4)*MT8&3O|_mT?m35s))SXlOtUo<N};
zsCl~r$RM6&a$4tzcvoOzZc#dlR1skAS$0^I6#$KxLX>WRzD*_TEizw5#5Nq%*~J@e
z_e8nzr2|Re3xo$GpD|p*^tes*o#2ife1af1)e-F-B|F~;qBnnTwgNQkTu~2|%-86h
z8HzJ`GPB#+e;3Yta@iQ9ZKi)XSz@@kJC6q3i<?{De&6kl78a&Skz#w@Ile&a5Z%=0
zYtOE!Fdx#sSs~2mb6@ez$uQz=$_L1&-qE^m$V;D>JSlmpr6k2zO5K-Sm0lglE)8mN
znYAz8{QlKH2fv{vBaXk+w2W`OSCIH=GgtW&>8PH)n{Jsf{c}m=6RB?L>2@-pk}UyU
zO=SpX)+l>E%%wV8?N}vz)0rba^X`70ORDnUvx2$0rbcVn`r><WS=<xr+;Abn(F_}2
z=-3RzT2UxxEL_O2rYHKH@YZ|<4;T@b@jCXgD1_YT>fItyBVo76>FNxk=vh5In^6|&
zUgF<hZK4K6e?5e@-qQi$C-J{;&i7)O_TDcQc#Je|50@z)Yw*T<`vuG*C_!k<F3!FA
z*9NW~*EazXSe%x(x!f(E<3aNwuuIf@N~5}3boX0jx~jA;pTpM@wUjP!umOCBj}u5a
z+S<JKd+9%ne**W0j-L}&=eMbofAd5RJ5Q-|Su04#0sm`-r~m+2jN-Kc{Qwpf!`oWZ
zIjC)MwVi83s#aB_%~G{80lOCMLTp_lJ2=>fQ<f>ApVg!>qdp~J|36s(RE{|LHiUSj
ze_#AS`0^ToI2QqmM_?CYjiL~LPQnwdPl9Z@o<DR3YYV^(5n21%f8@9W42GY!j1nc2
z(lLE9oK}Bn0YVUKTqEl%AkAd@kdMQFkGnCz@2^UUf<(*`DNlAoYUTcezut!MyyBL>
zWp<;&blcxv;u|uWy!sBN1Lh-{cfxcALv}NTk35_52~;MQE}9_$Ee|2f=d6$ZDU^N;
zHBoL@xQXJ{`kYMbMp0(DQQ0k*PRJ750XuDcVmVVNI~|b_kpyuG;di>*yp^KVG{szw
z2^s%@$zA{=>lg|wczO`&w}n4=+q-Yz0lPi6Q!`V2FDXMp(EzUH*VYb<gGKQ;4L#SN
zlO<XcH^8fv2=x&0L?x2-QlxSl=Q^JA#Y#meWKevrO=?=$bx&>Eej;CCX+Duu6W>4f
z&9&?>LTYafVs8km(;iex#CZ&rbW$fy1<?Mqlh_{ad?laX9Rd7^aR@XR$({L!2>aPs
zCj6Sr_hV0IlIxhvt{hC8`aXugF7-xJNPG3AZQL(Z$=5*(6(e`o_ReEJ6er(cxqW9w
z$C~`EG>In??~^qsNXV+au@_P=`|M*GPq!8)>&YSDns>i7axEbQCxR*CIosGN`P}lA
zGLCHC5YCk9WrWkLmGAZl3P{gN2`%WrC$Mg>hk1I%I~Q<CkV$tETEcGte`hL6$-)sm
zsJgAnzjYRB{Vc+U4E`Y!L*+9Tafc`;q+Dt`;P|@l4bZF7OTpkDBe&+0f%yY5DJWww
zrR2-B=fy7b$6~b_E8U0rD2+|IAjpKAln}NMtaMGejSS}`M4#VzD|~4K_+qokB=gxb
zDx~mXF<n0E#I14eCAELQONJiK=<w(*?<bA_P1U6F;K~X!sExg4L#3h8imNY${><bR
zS9eRD^^&&VbNriAxnt4DrV-I;(SspA7}v6tTcg2EmhWNG#1jy~BAkFfKR<8md{5|~
z`YSqEr@CIfKaQDnf#qstLSbttqe;idrmIC)2x`J5IC9|iXYE<1zRyQzD@WS_Lm6+o
zy}9-F)w_&W{*f6TM>q0GvxOBm&F=1@Up|?j9${g7P5m6&NLC-iQTLnhV;8<16!Srp
z-dM&?-~Ir&D8x%=YHXs*%8gnXXMQ>7FHRjUXC{wC|Ld4wG`-{@r`QOXtswaa_QY%k
zo?;Q0*Q&_>!V|EcRN+QE-gC@R@6l*&wV5~j<73P<3>fJ@{>lVRztw7WD>Yq7V!|sJ
zjymp^k6K`3p!Z2ucUnz#HX(dh<U+;+|5(*tiDpEME#$i<X(eF!oxA=7&7*$11Ag75
zFn)DPPxe_;i6-DQj~a9^?`ln6{hnLhzdBO%L9@}dNk{e-b3Tr-2d$SK>W5D2YE3aV
zKAQ8~SpPQZ_~53m`{;Hr>vYIRi42}2b^*G-d1Xb}#iD3qccw&A_VsS1r~>$fyTAVJ
z<>3ZILzfEqj4+BnXc#p2w7hGTTlb}vCw?;d`_)2-vtQ_ASm%&6?6e9EFV!O-2_FOY
zPN}-`SsZG862#9JRR-}dLKg1*84EHF2wmoY3LBisGD_=KAtU0$fW)i~IY1;=LH*FX
z?2xAEx0N+~IphC+ucGVWlphW?>5<Ko{rM`ya%~IDXP4@I+C^xGL8$8x5J)|<SA*qE
zthmNw9D8$uYJh-oY7YeTU=G?$<VWZT`O{<5w$X`JDe4rL1__J?n4U0Lw^5vfI1t})
zLd^CA(EW4MJ*2O{7))k`&4E&LBgKEtTKK}1>7>B$9QN~=ot0KUzdH9+lL7#<V6#AP
zoY&7naGqZTgx-hK2@kYenLlnU>n@Z>Y69&`Iw*AxIO89x@gfLHL;m)Y>00X=NT?tS
z(=oll(Sk}<T5s_Cq_WPW><*EYkP2NJG&q^nDdEv8x~wO~KCc0+j;_4?Jp}O8up840
zJI?#SM^G{Ff0PjV`Kt<8U|z<CG;O>jU~!mvvF>jaP}P7Lkl2t=;WyaV2<=K{TyXvR
zgEl3M(?k=z-$@9s3ci+m+XPgONKWIFE0>)gc}|w^uRfY4{p+C*DDj`J+$X&}xe~2l
z)O~>Y-CE@y7-R$D2q`XXomzPTVve08!-n5>pKWf=S`(06*S-KX>A#@tVh1&)+5>)N
zzdy~aqRW!<+QjwT!iHaECI*Dcf5eNZTtBQE5ZIoM*n|9|04Za;#5uz2Rsw$R^7~#Z
zJAH76^~l}OcdwVVTrWq+Ep2V}yaw2xLWHaqhMTdpSAZ8c+dW*wuE1-E%lYtNN?JP@
zzzxV0#cZBZWC4M5J8qqgLfoZoHo|zOBN$EW+y^d7h0m?>usr_u{s7k7v1B$d&FXc~
z2oXETv_O&jHJ*pm^p9JQ5)hS;eWK(oc=!wh<aH7aQ*w_>BDV8!g^e&p?HW580M;}c
z?Yyt+z_1N;Mgv~%!KeT{Q1Xr4>nZOt;N26;fpt&u8S5XJ+yAfl;6LKFuTSuRCWgV~
z6YnadQYSMW?+Rp(`}{IE)@4*JDjZCIqbgohiWzbb+XtHs|7qPQ)lrO*D<%wUQ!^qW
z$QZ9z12JpRDTQGR>C<%9PCkcXhWK0?0Thb{5P~j?7xdmE_wGlUkZJ6n;8;2ZbxoUC
zP$wdeaY6DIO9A{<Y9<yj7SwHjBQLq(gl5<IcS57YlqAvg+rw$=pjxYm{Dz)FJhLL(
zCSDS%16APB3;@j|2#Y?29*9!4Be>7OUM@X39hN=!S&>c8Wp#&zy%G;k>||vYSr%gW
zgdEDn15psvdPFm;5Zq8u5U+8pCa6^&fLu0AiKif+u<Je|kVsp1rP%<A0~HhK`pq)v
zE%3h1gkXw6vd<AklCk{#f#?9UZBPQJOyUsvo6TZ9G;TsF6W8P11i2gmUrAu|)vxjj
zdLO6)Id8{{41OCn&^t^@h3ucWyVtb~cFz08c7_sS3YZ57LWrDyxqOLc2a-#d{Uzb!
zkvE#`BpifM1g@5*f>|#F$FLq{1|#*hj7ku)VJ2h(&e7|rJ||<{oLIFWV+1bX#R`Pe
z9A_F$1UDpwxgiCf0)YtQirEme15Wnf*YhAA;-18l#)=N234fk7)J!IyzA@y{SJ(sw
z3eHY@Hf*qG+@(MiB?tJ51dja+AC%B@U#8nIeiPXWe1er#k>%kQY1adbTkK{NF>ZGj
zk0)t?rd|re;%eG(#88v%1Os13-p7$;kG2KPN5?xIH_4E}50}eY%8X5MDvWtwE4lia
z#yM1EaeqeJu(IlS5hX>ZvBrJ8ta(_uI)+nhr+Tqn!JDFeA?4emtvB~Rei_>WJpv;h
zkd*?{z8FkF3-Xc|l<^UwgCqNBx0Vs+wA21{v~cD8^7r5Jh5>KOL(GW>5S7c8!T+nJ
zPTw(a;1=?tTugV3{+yO7vqsqCO!m0t-Udy?0JAqIQkaNAs{d{wU^W=+Erv-xJwk}1
z((HM$`S1+`iS^tsy*#r17@r~70=Sg5qw5i&NnB>p0rr@f=yxagS7!YiBYCF3Q~)=(
z^401or1m(<Af83h0h@QV^Vi@iRR`_6?qbBLSjeNUJrU7b|4*hRN~P*!BFpvW^V9su
zJv^+p_Ngyi_~o{YKOZKAy*OR|a#;Vzd0R(EM??3LRi`dG#jc2Cr|~@m&&_g$_rnkC
zE%|LlUE9u!$FF`QAtDoA=0$P8Ogp{CGN^3Qd_0>AR}u&`Pg5`JW|~zgKDm%|dzVSM
zUp17e&2h#+41Dj0>y>JcXX%_RMnp~2W>@=0kVD8Jr|+(``VY9R$2ILc7p%L8Zh>DD
z2?ZT3^uyg2seNzVie$&toAC6akp2DL!>r@I?ZpW`zS1eumPXgZS1DQ=SpIiMJJ1;2
zR(8#|3lH~7exjM8Wul1~m%uTg-m(2J2}c_ckb(rYfS~YvnvUO{$WLv~IbQp(Wh?#~
ztHKO`()OG(n{N%DKNe9r_)_NYfYS5Gk1QW63uzTxlI|M4lXTs5bI|s9T^0)}4G_xm
zng`_KtKlZZ{u;vmvq5N`ydNkpw?4V%&~zRxurD=TMKOIWlFpID>g&T3o_?qgtOG!w
zT|)^_S&0^xTui5ouIa~1iBN?s4kBz#W7dr0XR9DFsoZYBOdu$R(ThWLT=?Z%PxZYM
za-Rw)OK<ofLFfZ(Afm^J)wA@LdwsV^b-zjzDH&%bV}^Z?)c{l&w27Yf{oX`o*UhB}
z)ggJ9Ad7PFgOe&~ZRzuR1VSceCcCf}If$Z-8MF?N-==`ek!_q#?6nW*veJBL4-VQv
z0LK(sga^c?z9b_Jr2R#&+{51wLl8w4rM1V-MhFE30nM#7VHC1obwK9X1H(Z7PkUek
z4;ucMw~T*?f99;231*d)(B-cVDR0EyMW9x5a2gy5<V;g*aVNhzp#w1)9uB7orIlX?
z)1|hSL|-7Pt0<9+(YOwV+QKW|)J<`L4<{$U2GUzJ$x$T~L<Bm6?dFXW!7bIqYJ)^B
z#%x=i^#1(``ksAOZ+%cArqMO!Y4vQNikGug#Gr`C+01ldXVq>$_<H%2GH+{NY+_i1
zZ@2|H0hCZ^3k+h`0kSxk_(5*mW~=}l>fG}g=xSzjD&Noas|W>yDoRjUwfK6XFMwcU
zZj#=ambUp+<`SfpLC6H*N+DMUi~U0tJu*^tDjuj<qN+=g5xKqBIUQs*Q>-y^^Nu)z
zU-Y_*Y<8U|h+=~{(w>a@Jm7)@OzQbT>94mDQi$1oIMN`wfK#ruQjGk*YOb5dBmEkF
z2=kq3I_<M+0?g+?yr7~W#FYeI)nJ>!W-Ca{y}>GS6{G#r<#_s|dZ|7!gAQHUzMN&f
z^}%&0)r06%R<q4wb^9XvTyTdx*bkN^PXyu3RdN7AMUBUEww(i*^sTR!@VL&byeYHm
z_XrZzxYkD1J5a86Eq)|Mp8qI5JUKVsEc!XVzFXF=+TGiOAA<1%bKutZnx?^oNE8d7
z5hht=((^-Vl6KZRRtg+TQe%x=WImh-sM|w*O@(mur1l#+Z}VT<MR~SZxHETKgUe2X
zfT7ay@1c@@1q_ufl#}(xuB!JKtokKig_qW~zSUR1GdkccP0>+?96vs8E4IyQaXR|=
z=*u4`vHTj5W0yNx^gt{Y`n*%Y?X^KAP_zOb;b~rc<mm(C;iN5&>nK3%(=J2x_9w18
z9{1X-nv?S@n`4bs=j*ilWNSn=plgPfSjbZ?(<UjM9Txu<`K7k9Xd;KQ=rsp-rFG`1
z8r@<>4&3GEH+Zv%@RG9<QiD{6KTfJ3WKMY+u%77R$6%pGSsl#p{vzUg-8mI(xc+||
zDZsVTB-s-DFJPjc=#_LFcMVFW3{Apo*}bw019Z{X)mTUKkB;{doO|{H6gBKw1?QLl
zhpy~_>R*Dh7l#Em_DrB~Ps>Ne20AbGhW%loT<I)tc;5G&pyJIlJhV#kMRxli$+?s^
zxLVT%+1LqF2<oQ@#(bZ?&dvbBv(lPZ6dwAQcg+TkE{AkLSZv%@B&5uy^g*>E3``oy
zaP6u|#p)03AnC#=42zSd`kE_)PxAY17TbM*AoP!+zwM)vu_#EBng_T2Rc5r*G8etA
zznRr|t{cwlD)Z29+u7Ma`T-Ss5roCg#pi5uh}m|bI>x%Jj}5E<R|C##s+?s~#w1P)
z$JJ+T+UwmB$PDaS{jkO#mSRVbr?(j-18+hFe=GeUp9;xAgM)4ns?I{(k&rMz8>y?G
zpUsdKqQ+I&F7Tpu0!FzNk@)ln2?=Cb^l!8nl%_262xN#z#(@|P(a>r~Z}db7yt8VA
z8)C8E&u~sVpyUmcf8+Q1T{5TH_hQuk=JR18@)B7Q9|RoMaVG0OC@)$WoPVq`TN{=E
zt6CqPlJFXJ0iqqENG02<cAL&wc)JvDo9125H!EpkzoZU-smogR?unjiqtv+$zU~+z
z6Q866*U?A`u+1z<#gL?sZ9dQX(!R1Q<y#gU)c{5SieoYGx%i3Q^-6Pc3(8X=g@?Ny
zxJ@<UDIjSRmqbW97_p)r8A<D%15UY-rTCE0sT+>;9oZ7O*9;RWea6zX1h8W5>^n6c
z%-0M=Kq0f@1F+o*Ar68MaqBJKH%<je_aP+c+}5EyN%50w<)yK|tz<}jX9Y_l&R<4o
zaka5|=;QrHh5i6I`^KBk%?=dnSSdqtVDD~T((^fi00W!2vDk(R@$7WxfSvmA4iwkf
z+UHQ2m^>9q-k<x&kF>uL9RbiH_N)K&*;XHYGrYxAwbw`loXq2^`3M%pEv%AnaN5-S
zDnFdII(ffq=lM|fyv*sQzKlI<t?Z;XB10ao*&TrqVQD$MvT`DhJbql8oyu6Lf4!bZ
z+_}Gq1RXoOhjn0a8j3yo$H(v9jx$q5irY`!y}5DT&Y1RIzLLRx9nZHyQKm#7%@nxu
zSr4*56zck82IV)^94!Bt9KhE^F&cQ=y|-G<{;AfyIW3li-nPIWQ8~0dEB!*c%;_iT
zrj*a5CkN%{H@`0jSH6C>Z+GJt?s=5M;;!$>$C%4dvVAjnD?8^jGmskzi3wfr>GJd@
zfsCttT2iN99T+!=2W(td4x8s5N6+Z^-)*g2r}sJa$FtHaxgOzGavDyEvj5H;tIvT1
ze&tSQieu60_t~C@ns|k88TLN5wZ9v$A47Tr@2sP45o5Uwyw4;f)l6p9al7}ueJgFM
z4)=SQv*7fcY%+bPGB9nsnV({ZIcXb?1S5U${EiW#kj7Ml?se51HBuzjujK9_TWhz3
zn>fKq)=Dqrin-frJ!5Be`WbH@ceZCLxD7P)nUYr%Bjf5{YI#C^AdDmZh6vO#U8E%i
zv<A9v{b-r`hfQHiMC?=9j@q!Q?Aw%4(dPiOeG6406QK+S1YS~?wv9xKr=tH@hW>M8
z-GQIf_>b5lSQlui3IXdRMq9n@A}Sa8Oe(*Ok^7QpQpm2o%56raITNfVr&sD8*w!H_
zulY8Vm}7<FKCHfDZG;>ImN46+8gAkWoh4L-vMg7xAVB%loAf+|Z%YoAt26|6BkkY+
zKYX2KR8{TU?Fj)zLRxZ@(jeU-(kUR_Y(fO2yG2T3(};9;H%OOscX#)uHgy)y|9zix
z-uJ`#&R`4}Yu)R<<~8SUhT=_tN(A_M2YhG2y}`fSG_xofaEnB~OQs+=uxR{!oz8e$
zKo<m*+&M(*MxvMxAr!#{!&g7vUyPgsdBI(N9$r_pRkTPZxovr(IJ&&ePi=9aM@{M|
zqo<n<C9T}_#px0qJTrmZQ$6<rt*k&mdSO@1Q_P9fGWI%zneD+GU4UaCJoNmf=u1Zw
z*SQ7<^C{{Ov5Kb%sc4YK5`^SY=fl<nqz2^&gGOnxKPLK5cEhm<p@W(sQ6Wbuo9d0T
zQ{PZgH}T8rmz5-fFb;ejGfdmavoA6Tt8#G+asKLw!~)b8{w-l^uF*`!bgLAfXt8+x
z=;5hd4rkXq;l*BLzaT-PG+}Z(Tt(qdM0tz#L|3)O>g;Dk46K)dhQp)GUjP~-KXrE1
zGmCYn^!6og2a$Afs58{0Q`mX#?Z-sBSeaaOr?4E%i(ezL75)ZrU4y3DpK?=w==D^v
zO!tvRCbU?=HBm!dfqF&KKd;`;0|mE)!k+aPugZV%ds0;Nid1(2OPvFbrb#xC2RBT$
zN6Bgo!f(lu6l<+ljP)hady}~W*%1lG1h~g^y)LJQ-`UcawMS7&HD0vC7M8aWOHDWa
zyiYl2IQ@oYe1>EobMrB=Ch9avoY13s4285<9wY$zixcwu;)j#!NP`w&%g;j+tx55R
zay1=Rgy5Sc@o$U0-mbjm9T|&jp@x1ShDGzHY3%@=3c7q2_FkZgp*$Z+zxocPZ3Qt=
zOE?2Ct+%0S{lhe~j_&8lTUe@sI27=x%GK<1<;c&mQ#=&gRv=a^r5@AM$l~+3ELqkV
ztSrN%PXbCy0cfJVm;qS4A^e5&+3YSW?#~x61vd#<dJiwYX212)$X>l9JN;0y;Ba*+
zZt_}*B5wPOAvFbd3d)_}wU4HqFsI`u@?`<$ZsbI558bOZWgqxU;fW-$w_a{k+hr~z
zcG{(OjdurpY&*A(;56r^-Qgeoz}=0%6WOo4(oE28TDdgU_i*5u*ll{kGzJuS)Z-Qo
zmiEX#0&6)bc5f@F2eX4NTA7fJrP!Z3L!Bp{=n#;%)kM8lud~wMZRRAgeY#{N>(2IG
zAy^9d``1?2GqJfU7f2HEiYw{L)2cs3%b&~br1PnnD&3`9K^L)iAvtemo^Y^X@4nys
zF`rif?g1=0vI&)$3l9F><#j930k5|Q9uf1t8LMbknG}rM`*a2^Ugx93`0^)INyU1U
z-*UR<dj|@5ag5)m5&X@DEYIYz?GA~-8uos)%xM2SxD&r|vjaXKvzV<J2<488v&!ci
zE-MYYoo?rwam3&9DQkcho3!RZ+J#=^uIXYm9Wv|j!N!J%yA9gEQjL<+F*FY9eNh}z
zFWW$%w>9oV+Az0=iZ^$j@gzbpp<B0M5*Hk?Qr($;1s=7y`MM?iamZ6IztiCxwrF=x
z&-Ynm!CW-=%m18kx+Kqs)nIQsFxXA^*8Rf^0odfCnbZX|rh(t1>9l^o-s_Rzxjv)v
z8SqPC+`Lf+v0Y^f@GevQkIcE<XJ9n6!|ivuKur!skivMRNk|cVCum&f*k_Cyt4AS#
zN3vLJ9fMFoYjXL!=KQueEqhNvE9dFqR*XV3<rHcYJx2cPf&wjAFH_XY-wz1U?xS`&
zpU?~7vRJQV_#-MA0Me@Jr<Cums5bD)r0~>&j-N0NFd^b?6!3O5%Bzf8?BTeD<m4W{
z<@MC*9KQ18e{EVHrrXW$-%BIB8Hl;#r`OId-yBI8X=lGdiEXl3@z%<V>^a|JG&wOq
z4ca#jc?XC}YIwW#S}Hk{bZPqu{-fCRy97@1WHw_ez-E^oh%bG9|Gwmcc(w!xHy%gr
z(yN%q4mb{WCr6Mivnoqrya4IeNm72tW}6Td)Isb;wwB(6zwkZD|45v^0pKZR*pSjM
zHv2Z<gect+K*pghVTg-}f$-5Z@L&XJqBXgKucj4I`Cq&2Fm%KxxL4@X)ClhZw~4(s
z&<QK2&QRZRKUJjRLQV<hRpgF8gZ7rTXH2pIZF^ErO2W6|-~OCQHYkCV`Wq7=be(O%
zVRd}g;bGkv?<pVrKJRrBokdmBzz~`%d6@U)5?gLMBuQZzA#=H@!n;zW2N<PUB0!&z
zcceMQIyCzyB+To2$t6YKH;EMLBv-uwgoOB4&i5?espiUmBk^9i|5GYG*hw-8PWl0w
zbYQYxy6L@-9qXSK7xJ<O3vC|V#F(Rj6aBejcw2c5_;%nN>*zMG{Uw=9m<3#p9lbi9
zRugEfqJ8T^ap|#nrL0Mv_2=(zz#D{e%hSH3`?H!H;PNWB3p13J@rb8q*Ip#Ar5RIF
zc$I@M_jxicu>7)$uB!n<02tHbEV-Q^p%gLqub7!x6p%P#luS&XGC4QV4`;;tv=?gR
zrKd4`QJ+TVFPdS}e)mXLzuQtTdWQEzO@9n_V*oc~4N?8wCECE9E0{^R4zy-A!%Igd
zo-^?ehjF%KhRB1k72=-FiIF-%ixdZDmt+w(@f*3%(%(paT8gQ*HJZwKk3BWz4H!Q#
zVQIjzG<Yj|+6>lfj({nZ$R@6(Q(wICF7>$>nqhYxZF~D|yWgqAL)_D92chNN#PzhT
zN3sY+c#)3Ucss!RXl@;QzZvNc+^aPCl%}{+FQ#WjzJ5FIyh`j(;}Fjzk4I(aiE%7K
zr;)3GvvGOf3lhjt80cNRjeE1Bh-TiwunzMP6GN;xa~r9qp`HQ@e);?9;SldONTy{#
z&sht)<4Fv@BS<}<2LfIdnF~A~#R1E~%0k)4@<{pych{guHz2|eFuo`|l6Mfgri(NT
z)|LXX@*)PFqAK7kWUy)Dl)=5-yeJhGX&ikbwl-dT-t4e<em5QYdW~0~q#I1cS4KYH
zF8_5gJts($IK(ypy<hj64OW54{&Ps!wm*ld566ko<S;=L+}e4A?j>bn0ro1z(#kF$
z#{s6*X48q!<iX|vm|(ol73mQXm3qA?Tt6rr>X`G?cFy`2JBC`0k)9*Leua@W7?I#M
zoA%OU!|&+z)^1cYK||iM(Em7$^!=oPQ;j>Cp=FrSmJFBIZ9SW0zEzd|YxRW3NrTQ$
z0%oQV9D0(>u_Wh{`;ROlZo1n;29zsL_o0Gby*1+n&Wb5&8Ei<>V$mBVP{^aJRFxc*
z503(${K^~2*rw1fNN}P#2*H0LTkj6zcx=_{?n><?lfS=F2*&F!q-2+yQ>-D7T{*&)
zue4uFG($PUn<POuPP(@kq~c0s=-X%YP#L0EhoP)3FU4D582`;tc0nazp{DsskT6Ju
zg`Xb>Qms3=`B-bo*{6UyQli@+Tl+<P0?-WvM$z6tYx!$(OhVR62MH9si^V$!98+$h
zq_cvW`B$BgkO}&GL0;4v2i+f6dB%aF^eu&O!8l%e<+rT*yG;A5E2vk2!t0Y3@r)X9
zX6Vz&g8Y%YD6uH6QmO8gdXK=i7vpzv7FH~rj78`)BR@6+cr3*I3ZEYL*T|uRXZcX7
zbnYZE?#o|4^?DFQF2L+=q93-+Nxb}?eEH5$K+p3V5HoOo;N97Ucv&s*`y$K0MN-eB
z<37lP0<_BwKUho`C;ER3k(A?9xteXm<nB@7_BxGYe}vnr)Sv#T$Gx3y<#6$v+(y}+
z(9+vDrpq0DyvwEE3Yvv^08YLIHerdZJ`a}(2j*k4V^K52VBe;Y<Jb9%z&al#K$S;_
zigsM_^Yl7Q+nAZep{Nu8Vzu>FhS=*g+}$%LoZVx7v~5}x<Y`8F)42@5(hlc-|INa3
zuxBDn0{9IL+rKT7y~Ai34!S~c^tyDm`E@!H*iHLiPy!}Juu(6b&!J#WMAvdPEyN(!
znlzTM%H#SQ#qam8(1ACKlpXUi5pqZfksO2=Od16VanDJUsNPd%_}vEOPF6|LUWw0d
z2}N)EY0`FzT+u$CNwJ?swE@+4^T?<ZENaPZbNV>IYToCJ^hhi`N%zSMxQFq=?4M?!
z$jQ3!X`LK@0?`B+RI+~w!(a`kENuOM;w90D-);44L>hO8HaH&w54(2Ztgogv$Z}cb
zTXT)JW3THYjTrcjn;9`mc!XQftFb6sEr}Ky@<L){nrl>8ON66^$KExaB$dLQ>it2S
zhGgJV$DJxNP=@VD;3d{kDtZB&N{LjjE|<SQ*t*8>r%y_v6Gw(e4F}bVCwY}CgA25p
z)K{On-{J(Q72h54?48N;gz!7zkPW@EJN}_StP*zc^lI(5;-~WS4VjFnmXBzb87FdO
zf1O}%GvjUWW%~+ZD>`gF!onws+`ouXQ;)|~QE`La`~xmutvIm!f!T`?H1pJ>8$zex
z5ouz)r34bX&O96C^5EouhC9F;6V5!<%v?H{U{spRw?5QPKctNoDXoaM0{;Vk!E|N&
zlVTT*berr!2cgD+vVnw#Tn9g8pc^)K%+gYdoir=rsdd>CobGwO#KSgUysqncDq38y
zbNvr=c6I#|aFwY5p#VeS^t&YF@4w!Et2Sxm-`ML<U#venksBe<M=LzjDr@uk2=6UI
zBn%}*|ME#TdY5Yo-Cd#1vW~1$)Mim=CKgZ}6CXBaU^w%8tMtS?*3n<NKBjHjmR_+2
z*oCktF%(qB#SGxkG~vd_7+Uh$-3K48@M}b*1!J(p8sfP9?<Suez2_;_MW*>fnP@cv
zEv~4Lry(SEy!Vwx>m`18tb2(!ya;`(#phW>lq*?EBx7?g0V#Y|11f(IJvlm~S$Lq)
zZNxX=>FkF}aptrsO5h41CBk<ie4#I^bKUTE6ZM<bv0TX^KuwKO0JzFYwbpvjZoq8c
z@G_;XTncZQlHGDLiVmqE)30^|&Xhj@aT{v<Q3a`8g$@l!9WfKXz;Djn&Ce8v^Ll!?
zzC@Ys#!y7097y1S#4@XD|D>OF=O=m_uhefq^x$;0=vHYp$KL#_qR;R9>_8?~uIrCm
zz^2clRb`@{Hrbms7Ri#n5Q38jGF9B9N?!uBd)X6V);<6dbCO9+__^Ne&Y6IQdw-X$
zfl^^J^k;40>zW-;-fEvZMUWTTSUg=4oS(1Ly=K3iA;&I+KN>#F*BOX5{sImse!7}(
zOO3<$)?wz!7U1`w$h3A3DEuMfe0Bu)`JfyE#tSqP{Wg`0*V28ScOR)pCm_Ou65_)U
z+|Tdgn6y+fc01s0qrJm&K;(H6<6TPobJ91msV@t}DZI85%}E?zeUUNI6qO(5LBt{)
zxz7cG^RqyggCAe0dUC&v<Da(TugDvQc3|$Kk#ju&R;nb$=^oF`MB;^NFeY(z;xUOx
zwW#H^j8K_!zql7EyGiioP|{2|F`#gVfkc)ix|?D9MWna`B-B^<@NYdxL=gG-^rwTo
zzkC$Kyl-bcr|!S`K)7<2)LfF%9G;izJs6~Cs0542OP#42lIr@RUj#K;OvLUD<HBLa
zUpm8V;$|gUL*WnXtb~Hm`W$&c^sIV~lQmdw{63HO!`!_@X_`DqC5ikIm=2>s;?&0b
zS_w20{o6GgazYPpM^c?MW5GS{<kPtK=2vTwAK#XXEnYGa97~9aSrT%X#MT}OG&;QZ
z)bC%UJMTF_G#Q$of-MsgtyOs~a93VlGqVMDJ9!Q1R7V%qEfT#IfgaVFZVy`c*=Ngp
zu9b=>&_)mIHOaktD8`{bBl<c~8E}8LgE6C9{|U=2vs1M~Qa~3rph9>9D}v1#mA#N+
zr$#mIygLbHli(E>HyQ5<Ckq~f`~)O=LD%~(%q5S=DXg=n-HKlXZ5v;k<P#5aR1-?g
z6hUq+pI}#R6rUnu8?Kk{avqznk$)Ql{J^DzZzF<?-Iv>$4hkOEkIWD*FJAplz~R6I
z5n9%*G#w#3;Ee!?{Nb^L6S+O}y+pymZgr(~?&0&%=Ra}PNx`k)JB$EJslWHP7sl1f
zb`%C4+n>Z*>P+exvY@KuLTZJv+$jqpP*H!)ti5Db>%=CvfoY6Dj7JgnSuFiK5znU*
zwDBZQ<4{4*mXVazTmOq^JwNOuvHc+5{h~zW<QQiDL(2{GelrVmGjv2`0(6imVt}$B
z9m5|E1)WO%NxxV<+cZBIvH>vmvgt70<(apGx3l#Y91S$PPX)fpL*?;oFt?k5GPB*L
z1ylC3P6*-<xHl{wAd>1~a3=RJs-2KojJ`jALUMGIv&p{SKhP?5@q7gFnJymzjqz*W
zjQgC9YTBp#1k3y+UK0%LDpNtX>wY~Ypzwd)em+gD%D)Sr{IeQl`2#qS!adQx8)>@h
z=D)1KcVeF%@Zm==74|Bep>?lPGj8s|({bOP+u3@+6b>tyn|XST7wmY9#Ogm1*3N^8
zT=$T0t^lxM6qRZ)wa&Gh3CpgIF2(lORqG|ols);tvVS9iC9BNTS1z&r$AN%Y!k^OP
zpA(-3u)Exjl<(?*p>>Q$t;a3$1h7B;zjO@S_GddJlE{l?KRGqO{Ev5=nv)c6>Fv!b
zvTHva_ex_2IM4Ua@md>U;xMYMyor`*F5=q$$R4CkKjO*{>wKeA5A`HNF^zNuFsV*+
z2F)I_7Bu9+4;7TJd5&UGR&Lb3uFQ$@J08+Kdr|P2bsAq*2zgvh{>^G2WpWnJXrc?~
z&&0(=l;<rqOoF#=(-Vy7`QU^RtWX-M<M=}E8l1WuE&!lqfFi!1VhlcftBfwk2icwt
z2RV*?*ciiApsu}EmlFdbC-WQxi`KtojOzUP(e9as>cyJMaJ;~N!5t+XK4)zq<0DFn
zj}#t>P=*uKydW?WzUz3oW<Y|f=yO4IId{4!wu8&jyqfUsCXS4=gmySC@kP{N=?2oh
zgP<(c1zDJPHR`Hf2sRD17YsU_wYt&PD3eR;w#rW~)Fy@PHC?KAkp2-${he+!UBG)j
zXhR0HkH1#|+^BK|rqv2RM*-D(0<P10MP9#>^2>cAkZ&u@6@5h`Fr8(fIiLr>hjJrj
zB>?TOhr))>kUi$-WZf1C2y&L~?`#W8{J8JI5QQWgphUJ*<h|8!GM{MznFD1$@?Efy
zPFe}xQ~3u3ML^6GMr3A3aZn9<#BZLu7d3zx`3ukH45nUAK-}gy>fj>>r9eeI<Z%tZ
zh~FeU#+G1~(_UDQedz;8;113Xn|~<)szw|@=HN>KDm7WMq#!_s`+jr?iFZhldiuLk
zTlS5KFnGnYM??n^yleCDYk{+uM+dYa!yV5(-6mP-#2)WN^l6B9y0<~JOLLf*Qo2ew
z6L!4VFmW5uEd8pfSOoIO+h$k6w+B(@j&Lgp=TpFpAPC`~FA)KVaB$Ys!4MLU>7b?6
z$KAh+)rsiyL$yN+O%^DQ#D^#wzYtR@q&PPSIm~!hqI0FGWTN%{j1{HCJSu%>uvNGs
zLG8wm3`;DF-;{|Sh!Ck8=(v5&=?<%Xk#e2J?yUwZ%C?QljOI}i=JSM>AFk9Ha2M;)
z4nQ4zh2rNu;jI|*pENdyV>DKJ#~b!b+*P}i`9%6YJTR@Q-s6c*n5X$D--yhPO9x2!
ztW>IH+2v}`iNK!h=2>R0<sU_c6F0O8{1UEfRwpZ#a4NOZ%-*cTp8t$h$pyNRYJ?LX
zMLvE`&}(w;w}DYjSDLnV%_JYBiTHeYc%sNNnIaC(gyzx<<J{M}hXdA6Vah`Si)gvq
znqCDfJciHFMO7xzlk}>9(63|K=&cTUAr@%qAY6?U%&Jvby;=V*PaqHKW5}0Y_OMcC
z9hJ88K!QbvdF^j6mMjpp-SBIF{UVj{*ac`^r7>thh^EoOM~OS0NWz>c)}w0ObMgNe
z1opvfKJTw4in~OA5RUIp+`JeZV7;_UivpHlj3L-kKEv5;7SSfhW+ey#sQWme^B?tZ
z7SK^CQr4Bp?N!$(B{qR--CZhw$UwUnib;3>7EC+}@2niV$`aM<t29OP2h4@+kEpZf
z+3^zY6Vpb`GEh&N)w}NjsB*QIl?QkF*nEznJ9CXP-ddI78Ow+}mP9ta|Gjar2iBOx
zw{Ut)qK7d@X_39Zxn9}X&jv@0pTuc=+{dnbzt{Ong?IN(JG((Pu7vIm^AIw*dGMHn
zD$al1k<j5Z_~8EF8ibrSo82z%J!RR^DHR4&(gWSD$3UP0ip#bZ)CL*GZ2RllYkspF
zjB#`pUu9xy783<-r{5qwKI&z4Ngll}xIp?}6LqK#aR1a_?CtfqwozN{lHsfO$;+P3
zS3t)LW-b{0g8dM6R*&#`z)f)DRrsd@(Zjp6p-6?+lgMTCbLk?YnSRp{Xpl5YW9s7v
z6(2%JEMp~v98y(7^n5hgSnql3M_B9D8U<s{;{&9BV+fQ0NL?~=;q#78x$@({VgW^p
zWWp^A_pe~)m{A`{pwuw2L!Y{hdG)1lFf~yDO8UW%;Rb1{HgDkW`MlfU%@1#Bu-}ek
zhwYwKn#wi=M@+*1uwFR}>Uc%GS?6?s_d|zqfz!B%CjB+Jd}g~k&?5R!|JC}C5QN@E
zW;;p}Wd%Q=Sgy#8ExaFCR<cm*(6;b5>V!WXYX88N>JHZdyF9R@*77oO+b_!O)f4xD
zFaoY;Lu_)U->W<X&9lCDv#Pz4grw4NVOGc`aBuB(;UsNZZq2SgIz!JwBOYJf_iC>G
zeQvBLe<K>VF_-=Uk%!0mmV)E~{?3=!4@n03N~`&U-z1{gIj{Q#`i;$cR|xFyx(Ibb
zM>0^PZr_Fq$LMuB0QdQDcK$C%-P|pZK3V#G`l_A~4)+x4lwjp7pk<AFkjKhsfwKeS
z)#=!Fmj)u$9C7_$KFBh(ldPBGZC5ty)n0FE%gsk0t5MJjovIROe>APaY{s+l@nUDh
zWt7nYfwA?xpV1yj)$=D6sh8MC{qi%>!hz#+mLBXz_C>{26mqCs!}OT=2}D$e?%zi)
z4)b|Z+i0(WOm%Qf<z~}CqSX?OrYVz%u?St2C8}>Q-s026Iv`8OZ}c@Fezwv6rFSKs
zh?Lu-!D&Pa1$#TvDCdT=U&NS$y<uY!Cxh1qWv%=#L59g){OImEprkp|;=Q)}FLGjt
zu+a!TsOiHbN2=S{cXw<L{h}LjlMMi~*f&M1O3qz@Vw{5i2mzb~wvTu(A)~y`P`X>_
zgp7I0OVMwuNgttmaCtV=L~Ne<@<~KQ5?jTAo+!YxzM82)E{O1LMp0?crLM;OvMI77
zRS2&hQ_(#1582|(e;iQHE51{M=lPHgV$X{v2YHQ0!HpfutCglW)dJr66+tVi;N0AP
zQk2M+7H=npXi%(OqwUH*+3p{-6~E7gW9V#iF2?X?Z!t7fq!;>o_wK}pTFBt#0|{9|
z#Z!;)Qln$E6p_%|b(ns$x2IP?KZVm7{j)s(HAgx@BibPGVlc(iG8iG~X`U|Vs`%Ca
z_bp{rTm2!)hvYq&#tK>V)*<an<AHR1MvW%rqb|}Y85J!<b+UMoTme#uvi3QQCUeoF
zEwLG3?u)UAWkD*gzSxUPLoklRh>7XNi=1qh!w7Dc-+s7C5af3(5nRj;;PgEGaJ!X|
zGkz69i_0>=WIbOEbWi^r00}tL2|7y~O;%T``>BZn?PFD_Q7Kn+<yUvpE0-06tphy@
zNhH4Y?w3R;e()|^6I{4|6AViGO0le_czkO`9vA5a@C@%i){*+$6T<EJcE0VT8uc@n
z10sz?z5|M^`;II`yaMZ)dnD>!zC*$KuYD!g%R1qvxIZ2Ks@T}df{4UpE~nA);l8Yq
zt{q$gR(7|_pp8U9Q+Jtc+mr6t2+PmQohZ%%3BiXU+{kB%X|XcCE>_h3gz&f0;v}Zw
zB%J_<ubwUgYRW`Rp6cfX7a*=%qMQ|o7<G4jQU;k;pefO=v3CxcwT#joO9A(K!g<A3
zSe`Oo`uh2nA!CiB7yuWrHNzeNg56*z8VMJ2^L+(?6q>4(w-$ph_orCqncarxlD;+e
zl|bmS7Vt{B$)nD0j1Ej7*3+*@LRPkkYddyc3~v4D2)s3Mvzkal_t?&wGh~^F6TGOP
ztuWUgHtjKvd2th>ci(|=L?Ut#zMCO_(tV7GDM${~WJDgqcxkOzHOob}hf^3?o1xME
z`tTBoC{KxqNAw0xQ)(EKro!7uid?QSd`C`QK#D~3B8VMqbySONrA6u`uWGd>V7i|;
z&|m93Y_0z^c-GXC2iML{dxZRwBhcM<P63wMc`GK+oBegF5F_1;WnYu_p)U*P(&|Q3
zsBc=L`F5b8lTTBV%HQ;FWP7-gphG#gC;Q4+ACv-eGP}+@>j{-&oX@9CWT_s*Y??K~
z82{sTLGo7q(KuW;+(y_9urfb+Bk?<VYiCu(+r3^B+WXK<$SBBeV^wrGUlJsF%S8Bv
zOvEfqetehdpPx>MN1&377(0O<<GHt*uUAezoMjn)O~U8?M>lGnlXs=Xn)u<ko@RK%
zOX}b6neP6xIJ}K@C3<L~uzzqlzTBKDpqJ6`(LJTbGk|z&)GbUG#O}wci;J4f_{MVh
ziPxi)^V|5~&xAwann(S!r5O&yRtosg>-{ASNl1$AuqE)D5_9BYa+0ZK@gJbw9M{m2
z+_p2SyUi18hmzg@$V&g$kNt%3>{DXpm0s@lNqcrh_EqHjtDHnMs$|?>9^2I<7z~5O
zuO+0`$6f+Z$t;myOajiw@nkML@qua%((#U{C0I1-MpdFJl$`wh#lpd#shW^8yHXL1
zeRP|p$cQTxwX2WGU6#D+22(izWw$T}p?HpzT)PnHs>>K%`f;|A1MbCOcm4YY2tg8{
zjKL?tD~ikd8o|YgyHFPv-@dRlBVHvKBY%xcM=k-iixoT<1Ox$$@h}q(6;g6S!+8oX
zd3H!8b#w`Q1#%V}DC9gZ&5PwEoQPSE6Lw@>x3cXk7m6+5ab*Q~o<ej}c?-lU#vn!!
zoI3&ep)b0AgNk1_`#qwGXJf!Y!nv<@MJMG9MJPLg=XGJqD98@Z2U;b>?M#Q({AG;N
zg(M_%U?UblV^tukZ`~w$QR>+<1(VAPloz-E^!43DKhFkXDf&GIBZMhzn+m5Zd2$6O
z2wFRnSTDuaS<S7dYm;{Zh7LI(BSQM3k1C$$%cPMf`wdQ7d8c+?7Qw6cQ8g+`sh6K}
zSzoOb?0D9;Kr5VZ&~YQ9xUs#B7OadD#D8d>PsaS!G3XD=2+IW=NYvGt5keum4L2hC
z27o2_zUl(=O+CO|iRQ9YN71!U9;<aZS+-wtnxX%d$_lG_Yw}v89Pu=SmBd4CP>HxV
zlKX=6=}@-=#QC1|Y-}2t*E)pXUz8AhkS_AOqBp`KNhVA6qQ!R^ZV3NF9AJ)i<up_x
z-r2(TDrRb9+Cc+5Z1rzBw)0$sI=v5cvl1@iXqsIWdi}tA4A|7ribGng;>$yYri0$?
zc1zA}bCwhjbJkuU>b>o}zY$Lr9=zzIO-mj>VwZ_xXl`MZ@UP@<UHMOZ;3B83DXV7>
zypxsn2PEjIN#?fu$eZNtvD<VUNKbs);UHwXH%_At^?3eLVt*pnn|D0FD#!ARW74jd
zhC#iBKMAY8+rp#YT2clh=-tRquBJ9!=63InbowEuo&ERN-R7eSTp|O>?g9U{%)zwM
z5B0Bmtwa=8iQn{c#{4r@#_)G{D(*m@yn&J}>*Ffq*lz}QEbf>}S}W@<f0}DwGM2Tl
zoS+eV=dvWo>sUOHGBzXY+-xtLY|^#*KY;px6*fMr^>Cs4u>^_<pM%oMSJdRspFB=_
z%8LKLFJS@#Em!8j+JgYzp)3pFc2bhHoGhV6mDY2fleyLL>$oJI88Gd|+l|Iyzv^T)
zxl3!x(P=)&cAjHWIc#*apQ9gDtN61Ua3FzAGo6{$Nv3M30MA14m1$`H`oO?Nrf4iF
zTdvN0bNVZn2`mio2UEXU^2g+kWzQM-yK?s!k3q^WTWh7Y1vt;PszyX+f|El@eDO<J
z3=^!|EChQ<q#<71UR^j4yZ&EnSqq3Qgyi_&XoXEztEk+~1#K6xnmNeeuIo#+`l{gu
zoey`}wDKV2KIXgcwTjA3F27D?>(qV2Xq3x_A!ONo*lW2vR*eJ$I86<DUuU8>VGxm5
zW7juhR4iZL*TN&gUrOh4d5{ZCw@VV{V|<DcasoECv4EH`-yQ`J0h%Y4+oVJVVes$>
zB9$2^r{qzRKDS#0E`y^%Y}FY84}5{Xer-P{ReLMow6h_%S9y{zdN8r0ghXa8Ug`k3
zVwX?v+KS=7BeQG!TwvZ+8{ynN8~zUGs-#fynRYWX>`USMSoHt!Qa92)5QYlf*Kn=A
zZi%r{fYMY*iNH8$R~Zl5kv*`T+R~s%o83zDb70JcLDODe!E{FMJt@KkC|HS5#|l8Z
z{N)(-G<}-ZvEj3gY3K)H6o&SOpWwg|#8{t$(22Lt+qVB4AJ(%IT*Scr(n4|Iz;sAj
z-jtb6bBg?u7hbv7bH>wJ(M@E%B$_+h!-@@-4r}L5nrr7i0Stoh(m3?-+@7@GnR<WN
zQBVB-+bKSX^ur8edrOymp6Q@d_%WRrY*Dx2TSh%BbWgqheuqJOdy;M(YN|KbExGJz
zMq;|Kk!8{5E)&-Nw0d?UJr^NRMtGkNy1;@@m|=M30oV#Aubq9O#$K&IJv+;G^!(rv
zk!7Y2iTa*CySMCA0pdBUdYIGGESPz7dVdP>NQ&$C0~MwawG>2RWfbenDdF==YES~F
zgha@5=HF&crhibP!#P76aLBjO7`>|y$l7}T_3zz)O>0S9X-XRZ2Jgzh+L+(d?`OTv
zt;_4j?8I+0qMP5JTQB1$@P2!247E2l<EiYtPDn+F@}2Ed&6B;0NI?u$@G#Y;SFbMT
zbgQn2W!2z5O<dx)ZEiG~Lsf^~@iG7j0FKvjEHfqM$E!M24CUsX#le>?<Np&@u)6+i
zA0gPWJJWv%#pAU*%tr({?6jyKkG{-BI^T&A_x*(0b*wD?^<rD$x7sh+6T0O07KK(z
zk9pN)NpcJXeROrW1KDr#5G=<$)vHl$&F8N-*@o!Q@X@;%m}EgnCGS`tRa2Ae_4K`O
z@#xhWtA)3(RNdAB2&h{nW36m`5RvTV=#!Jg^oie(!kY`F9Z?8+le$`69}A&Il74RC
z<`*-rH0dKHdFgAm`n%oum7BEh1l%A7+3ZQ1rYMgg=PG+`ets6aXV*&?7u%xvA=8eo
zYbOQz=SvU<nfz}~EjUNSLaP4Vtq?ra=Joy`jsp6%5X;SlPL%6LHn@td{yne-ZZcva
z_+fWYTV@h*n=o05)RzHEYpg&qg&)J$1kDQ$7z;b2Q6jUK98EA_2uFm2QUc%tltU^Q
z<JOm<EM1Wv2SHyAKJ(qzj=TT`NTXD%DmN5Oo-~~jObEU(9@%bZ)uB29@Ov@EdQH>q
zF#sU7IF??u=k^1svb7e6_NqXLkf}dcg`YLB^qA!Vp~b!!6({D#J}^X^NA#+ChwX8(
zwB7AfWdrnGjR+p@S+=Y~!cCKb%OFvfkk>3GnV_a$j_J4K`up~$Oo`BbH4VM3L-w9(
z8d;`ZlBPim(c&RU+D$m-H2xo!34iWThEVQW{0LSrdC;Npz;rlkbrOCxTdG5^XFBQ4
zuWN#8GZs%Xp)f>a8e^6nBywi%Q-LPQrgx}ZUIm@0x5l-6(}MwN&zZxAV0G)>gqke$
z5J86x0q4<3H#$`texoFG18eK*n4QIJk&VH3!sQq}h>nQY(b!lO+EiVz&3~j|Y*{~`
zeNLu?zXoyJ?S$xZSvrx;T3fuH>)Od}(<nUOfZWHg?JYZ1AZDC}YTl2@+wadqr3Kv^
zjA76yt-~KaTVL<iUj%l3z{fXQ5|bwisu3XUl=WX54y@jr|F|EXK^^xR&&j(@s+B?o
zfxaXGoAk34GK%<vyEq2*NT7G6;XtB_3$Fbfj}hS@lo{t$@X^Ki!1=L97MK`YMXCCU
zoyeBTz|Yg(@X1@N*{lRvSo7W8B|q#b2Gzp$JF2@EziA;Z5ihu6FjYt+;=txjl*%v(
zU$*#JW;CM)%UrEj5HN?%>rFVqGgG1mgZ0jgyK#}3sV#6(^{T&A+zTp|d8K_c85Jkm
zt2As!fRXaFnheEjsWTbSh}_@Akc_tx+sX7n>jG40<fM(fDv4$;>$#ghrwP}5v{`-f
zQPK6CHN2}kxQ0ElUZa=V|3Q~v{cje)Em6(48FEHq@T63sbR2u!=K_2G&7qhDq>Nwe
zPK}3?E7`_!ZqQeb5_o@yGW?JL0Nh&YW{q)ozvf85?4fQx?2xD}$7*gIR^4Ugj=>zo
z=dj)2Ko^5-dGna`$<+=J2vusd!>bzmZ$IaM`arKz9c(ffsXtw|LdU3HYX3odnEwWi
zl-<%ckwJ~2$#PAw2HgHV0BgjBd~dxwRJ#2h$#lif>sd0|b17dLG30wx01m%avoK&Y
z(6F~H^*oUL+eBLb>DekLMt`!?Y=RfepRddXA)S^ku4`&?=b$^p8>&ln#1i&dY1AqZ
z@|}%2@7vU>{5GNP2Aw`sX*PLRpvjw+Etg|Urfke?A=2Fcj)+~&NHaj3OQkSc696F;
zkk3e6I7>s6Tm}SA{^Vd0It<hU^ap@QwwQ3`aoiv!%WyB-)raTqS1LF2jVORU&GBGf
zjg>QJ?6u$+<RuDSIC4WKyh0eF7vUST(sC5C*NV_v9~|z8gYMFgsEMSLAoDC-GND3S
zV6zGbNf?MP(b>A)F__FR#LM=RTq5OgPS$^UqyA3u?FkDxwHz6##FS`f(@D#MUcGD-
zzrUpE=e8S4>0T(pV${bmQKoV`Aj?cDZ|;tK(ucT)C4&Qp>E)}|3RFV$#W5x<+IFIU
zlW21#;Sv4df4@86n*MS11G(Bf+9cvU$J;3W)laa|8SHeBEyXJj(ZIH!vpM$wIHf*6
z4S+{ZhjMi58F*%-v><;_F~dkA_CV&t?sm93ock7Ty-*uBj_OdQ-(x#wx78mv%+oXb
zXLHP->pf_P&Jrwq4n-s~6`mFsK@|66LHErL7vvvJ5bEvXGz_1tqBRQQ?pdWWtz9({
z9uKOBoqKCe{?2-~OJjd$Ffpra#%`G9a!se)YamZ4Z5jTknE0;t+dbuXrdQUpzaY-{
z6m#wt93tg@%-s8Ypwn<R=VN6_uns1-%q+RG((?8i3HjXH`Q49VJf7V=j%$lU83a>f
zpeCKm8b#_&r-SK+-3H{IbvfaHdxyPSn~U;ZjHFw|$6k<+qeIp5U?PWr-tK@|OHAG6
zYMMpI^1V3DAsbH%dpz6Wp1G-&ve^i1mqUSqv)ZvXIxm{K@%G;nOg@o)pa@Za=DKL~
zDaqAmp%`lkSm+!r@2F-=vuK!(j{M#m@3A%AhVHRD=0iT=etc`NhF33+3ukLRv)1>v
zh_5&;)MqA-<8bLNfm$I|UL{YKp0I3~Nn`g;!gl>(^Ku4u5H2Tzta10}pK#89c4&n_
z+L$U08L+FyOqZm+<Wx-I=8J^H-YS%#06mWUDicp?1R8V|^CflrJ1Gf>4o4a{P#9_)
z5^t$Z8bOZp(eGn=TR)87YaHW|bt_Tuh%0EN&bKG653=Lgiu8S4Z~=M*Rf=I8zc?B8
zgJbFRmVYDMG4OnjX3<NH7KFXXJ?**)K#g?vXp|~WH(6O`m0emmco8_9cvmGj4`rjz
z=SjgNgEpEB{H7U|%mo-S?DmttA{*a9IHS#mpzjJCGk9diLM%-uaz`S+jX-0m8Uv;G
zW(@EHi<{kt78aczgFs*Dj?%syA?W{rB;8$jx@Fr<_zJHbwVR4Al@=<SPW_~X2ITn@
zy)?NAj;fH{F!dZUZ;}f*cTdrWIJnN|ujJi9y(C)3EzftN*WHhi7E;+R9r|*V{-7!z
z@jFM;tL7mUb~u%|TPn<zwj;Sa`$+l-6o4w@rLoLn_G|oyQ&MA_P6~_C?#f=y)}YNe
z=8YuNu>P6VxO&8U@CdA_FnE7L>*6)Duee*Y5pBvK{zIT-q{}V~?+>%FL|vJBRs^C@
zr-272f?utb1MGpyBpv_lg?!y`G>t><={t1kDhV>1Imuj4VfySND^V*{uM*)4M}h~v
zliIg4k8IFu0OrqG7j-^8nnB@Q@}>m?AuP7cF>Av0W|ZPsCVD#IA=yntE=%h7i^4*+
zl0v_4sp0qTs^M;^3l1aK(ID^Nq;DNc2?4iCl06XX;#s<<`&WB;zR(iLK5r7}wjTZ@
zWFyex#q$60snZ{nVL?A`>RoC+YU68`miRF%a#^}=-D)#cWJ+}V>7+jO@(6N1a9(3?
z-XL#p5O)|Y(i<1eWBK)E)hDmFKB&P{MG8dk)%`e21PZ69TILu!x053&{841KnY8f2
zNEvL<h_YQY2=LlQ0g<x4cg_Lpq%V)3-u9~LkMJs21Ix7&tXr5LwE(`t*9JL^@D$}u
zj|4Z%B9hHE`GbYIz)Y9sA&Ii@q3`n2V}kw{t-52LOQ)n~YYRoM2`aB7{V2-IL}~Be
zLQ?vBPlagS4w1MlD&nkdx@+lNP4zcGJCfY>@e++Pb^w8Dek#ESes|Ya@jXd|uhc{g
zkAWZEw;A4p#yCp=BjFJSl&aC@L$g0f69Rq_jPhC9U?1%T5<m4%nt24MQ4s%O<yZpn
znXKhI;=5|gMt(u`HblhZ>d?*>)Em5;B5s4U%k`eXLmaOrKhYV3jh2{Oi}B)&&TUvC
z)OjIO;x$qVBmYYN4khUuYC~$be}bMyoi2y-^RpAf{J{AZjM0BPAes7udD^Ttzte}4
zdMpBczTqZF!SMr#yT3TVSzzT?lHf(;Am;vC9JH?Sgzzr!sY10%qfX?2H&^_6qj1ey
z0vlG=n-u{*642xw5=u7Oi}$prv>rW?<w|p&G$WEe+_1Ud<)O^gRp6dwPtn)WCEYz$
z=44iEm~IE)7B&>OLoCunu%A#*x{xLOHVp*hrp>KGqEiGa6hqgT{6xajW~MJNYsjMW
z+CejuRg}5*m;VNe<G|w0Ur8_94w2|)meaU!_7FDbWgyIPy9YMCH^<mc15AE~5u5ZA
z2Oi3F+1tpsBL6Xa2{J@7TRQK}w6?a4^qxEfUXK9zj4zyX1v_KJHvPbqQvVjOel4(n
zyjCyBwW-#8MBlB%N2J;4=n!jk-Fgx8UrRw7%`;;SEE2r-$;wK|&ooa-?pK~#7oIE{
zWVo*;E6JvS9)~s}PM(mXYrC-sMg4^~nqpDH6Si&`mydjz3?73vd-g*^s?g@6$3f7f
z1Ov&`iG#v#ZjEvlvq_&+<WEP_g?>g!JT_5zP1lpO{(qQ5l=MbWIlpe#HoEkE4TzTU
z^}~4=HvTd$LkZ6=+{nlIz-bV${?i|Js@5ZaakK%zrWGBRYkD911s-oy8CD$Sr1e}g
z&N?yaC+FB+JffX|O%JD<?v^8^3rJ29?k*!HZe~!><9SeepODAvQ$4n6@9LIG=+tal
z=<8)Wb}(ly*LsGst&`%}eC5L43|(Kj=Z)kXls2osivTfe>~jrP<<K>|9gmqYo1_ZY
zu<&{bS-PX8H!e(!^asU=!G9)3{QP)O89<?p$VmK>>~S8f%ggk&c2;Dfq=?h~^l`QD
z?JW*$L5FwK^BsA-bi;16whx$3r-LVT5{FEg&y)1#Q^xoZyVt&Xv^wJSkGzb|mAHhv
z*6qR&w85MDY=d}~m~GViRQmIixx-{ka%bqxn%{M_#A|%H)&%6PUsp@lfztL53O^?c
zHaIZU-=&EdknP>BbC`_$if7fKU=@6dUVgDGRhj(#CgBV9YKvE<Q&oGX)Sm*LJn^TN
zi^ZyDldYdz)7i?+7k?d^Gk4Zqg5E)@(W<+7HvDF97`E^Jk=5Y;>)fj^f4(_(?4Ovo
zcH#1RbIL}LEFQFsP8Dl?L?vK)1D6|X>;##ct2lB&>C(^L;uB$wp1VkpzV)=ov0hq?
z=5}Il$dHyqaSK_BJ)GqWsEc59M1|%MM;XhYWJbuP$+Y$zij=AUy;PGafvCDYT>7zl
z-q;c}TpTwY+eaB!ne-i!&+}Yj9f6c!pBsUcYoVHr^BeL=>L}w7IN9ocF3V|N-{NNx
zlgDNmP7vAE>^-3yHUaV+Tqj(A2L;CreS{B*bRL10^U)klv;HBo!)1kPAFhc<gMmR`
zHYCPK@{r>ic1gThFszrYaG-AAOX?!c5FUsMXKYKfI-laQO#keGVdRu8<|mV4#m*&$
zyNL4lvDjSQZQ3fEmb!YQH3c<MpNJJAegjh0S1`yl^9C|kDwQTOC|%khE4WUgLzFMl
zNft(tj1RuTes~30DS}bveiVegp4G}qiC_f7CW$ObJI|1Pe$#&3aB<I+$$aI`OC*FB
z>n0p;#v^bXW_#}8A_Qg07JTb5g`km(_5;k{$-<VhU6vfk?2Wz)Io0C(l5S^)F?({8
zv%N*gN%?^ei=1^(e7}sXZF{`I=%pp#3{N^&9&$1ZxRL7`Dn1x^vXfe5VG3tZa7(M3
za~I3|^r-eAZ@dLxWC)1T5@|XbR%emcUuZYGhG5Q`DhXMV6LC6Qk?G(ZP>h)M{_rMw
z?bwb181VY6R6u{`*ql?Kn3jg$tmfV67VZxTZF;e-Ph&3GPz)J`^CqNmd@G<R$hqN8
zRU^Px4N+Gr?ClzyRs`u-hyv^Ob6sm25pV8pZ^}ioTs4Oj!1+M11hYi%buULCT@G6B
zB$tE;&l)p1)n>4Io#7dhtR{KSe^~K{3h7z@_eE0M50{9o)vSbHrOG)aSlQ5j=Ly`K
zcD|vs($@>}d}GO(w)*&wqf3_v)nw4MX0phoZqarloT%gwYQAwgb;f7b8F<O=Fz=Xn
zxfOP51|VksjYX1610Q_JQ22Wy`VPzR-!(bvLlaT5{@JfhSS88vcPKwN!RPt2dpZ}|
zJ8-!itrT`<NEBhN1R++ekz2Yxow9G(<g0KYM-qJtI<OAGrnSei?6fW)MhK9r|GL_J
z(t4-jy053JY6WLmk8C#;<CZqDg3=R_^kyvJSji<Oh=@CQ7QZ0+AUdva5j)r!HTG`(
zLWt5Syr$H;iPm&J?8b{ln1I~*FyBSbH_}kb{nAZlnOKPX6JF`T{*)!OPumUgs67!=
z_+Aq*DNm^B#RxTZB&MN|_pEwXZ1L5B+@NfUC9PAM?wJaV7E|kXjExW9141_+Q9u|4
zRboflT&BLuh6KsMEQ_@dF{KP7)H&=xL{29`@mx9!#b2SD4+MltvR4aYM8XqTV)7K@
zu1E!f21zYQi)M<QM9rjoRRbg;oKEjO{5?+Mc05u^G0<!6Rvs|>GHK+#7p=#MfJ6^}
zy`rL49_2d8<9D1|iK-2_VY8oHfDs!&uZL4d{?HYvmpL8XzTS*W9T6cN=TR|wfQ65j
zTvQc0SvIuj63%Rmh`7iusE_Sn-~m~mXqP}tRJ1g%4Msv?tIz4WWy{v~Cl8l;Zg;gu
zL@AAO>C7#_<*rAAZDr;ERq@&a)Sfjwbsv#Cn%uT1M53tEF6D-ch=m-JGi;)Yv#%&>
z4W|3uh?EB3Rvw#>Ljf5tVqn~q(RA9yf%;CZZ!<><Rc_rRWGhgNkVc`9nk^34e`S&%
z_GRVyYSz^4jIz1eLuKb2B#hi{a}sb{8g;4iu3QWmS2y)8k7F0zT^J4a@hoF*VSh7H
zM_SXzga&p=CsU}K^=A=S7XG+}a$1acwOjaRi&i{~&WPqA2&kJ#BxXq;40YeY3xg5g
zfU{VH`&PMF<Y^Rsi&O1BvIw~g9<=-g80Dn)DF{{}c-&w`t16UYt1DNB0`-#Lj$c;v
zjYb)13M3&4v2;XqU65xQSebq^wG4ZB^6$f+H}#JCcL<$i0`8hwoyQK!UTmpyGqJQv
zWGL$y^p=!!uzbYz7bMkAh}T$7(Jw0`xL`K#9bbKV`9^Nt?(z!}nm@vAl<yTB`CJwc
z|5?7f6+AXO>#O>y2rf|y0{M_hK0xL}Va*iS;B^T$`>7ysRg1iBLUxZrY0`4iayQ&Q
z)cOc3LYPy_0f@dBrKV`3ln$pvY;E|UFC49CnqAJPfg{sFZo9pIYW1s(EX5fOHLD=Z
z=T@86g8b3t-GSEF^Ts$H-0_z&Qm?PnAqxJS)?pSlSA=q;qBLW_ofz`+KJ@q&T5^eX
z27$bHMOEN-fva`HV=eOi1}{P!dmYVug{5T&3ak=&KHnU&V%2{2cY`>@j@px()QYUi
z;(@U9_uQ}0<|#H%Z-6*4m=~gnvm+3~1<--IFE^TlHUjV+wg;n>vn2ZftS-r7zXuMt
zbTO6=@JCXAWqY)bK+wseIteOXx;It=T}@_DxJ`G#4mD$XU8ar7Ft<&aue7sS7d|(W
z_czEl3MymEMDZVskk^0s#~HGU$BT)YEtfPb#OIszGx{KFB*x-LS~Jm>-ArjprGC~a
zh}U&haByAW`3!qfM}kh2=$4#d0^FeKqzQHz;|H=H^8%qJm%Y2LZ(2=eHNxrCFo)Gv
zr|@N)e@C5rRp6tq-jzNx+cvFkJukDo80FVI+ml?j0Zhhh*n{}T{(6Y7%koIbXq>mo
zLc!wsVVn^MRso?2&I&Hm%?hx~BhsveHL4&|>3B{VV~Xe;J)NqEP<+;?J2Kb5Kfi%6
zx&k=^@g65d(c*9mY0&>msxK#_Y;r!CCZ3*YI&hxROJcND80K#|-#<7XE?-l3ytB3C
z$Ub8Vm?hUClY823)1ZpjzPZn7CDzTDxsKki5tA#?u8T>8>7dZ-Oc%2|z&78WQk5SQ
z1zck6*Emti+BdWFVvSWhCjMm0{EmG6YNYpa@ikeU;j$82W~}h+?pP#U$=TSH=rV`j
zaPh-Q>$QZ4AIolI<!$$^MuENBT;7bijJR@&$aQa|1Nn_$tz9jM&r>rjzs+UJhI}BN
z)kTl8`HB)A=;PXo8F}aRhP`a4y<(-T)hJuuO`^E0Nm`Vt(ewI<sV{#fy>mjcIrWcM
zFDQEBw<R?YW2YDz)R4+zD0?`n6ZOh=dO_659!AR!wQFX1m>S%R7Sf52B-?H9++t|P
z@M=R^d4)W=LM)^RFeZt|MOp%Wz!~#c&oiZ@9g?lf>iTJlPD$@2&<t!YVS%&Vhjg;f
zvc^vAbgzAO{c`<|rwUgnA>85LvZ85Cgy&jx(jN*Gm81*U$CT@LhEr(~^@&NogxUb4
z<}<ay>;G^D{!2)-HG1|P2TZMuc)y~zRq=T*2+Y47I`mt|?k+Nk<20n%c$%5sec{N)
zmjg>ONZp%14woBrB%7Z?sAU`z|4bGB@-|XpxGil^IX9b<suFk5AL}$4Q``mlYA(H?
zQ*ULmc@mH%LepeukXy=xV7Mu=-W<l5dtAjnmmh(<<rsf?1nFiO%mVwBVLiIpO4B08
z-J5L0CS-K?kEMO_dLWu;S?!vyc&_4n26Q0TRro|fx5|rFw~K9zHtL_WBGHxbVNo~h
z81g-4ZNzT-8^2vS-A|UANkyk~<jeu4OdiQ(D1owj29m*Gs{iEoFm8)+`SacG0^w#4
z`sBoA_zLkx8a9#lx=W2trbP%T^eUz|y;Pj3lN(O!U2J@X<cDWqW%!Y?GRM7f3_2Rj
zFTMOBzd}}ge~UV`x!||Qwu`ns6O(XRbTt{&i+AS<Ux%T*{~Pd$6CpT<OvlQ%sO`I`
z=itW<Zd>w=+0kEix?kGKya~hlHdaDvZvhgV00=%89j*)C8=fN2AeieE%b*;kD;NYF
zNfl}eJ=DpT#zHZ|@xwoj=L<naZTp*y{LYxzqZmbJQnja6f=GgKU(3IS4P;q+5$u3_
zitT05NoEcBSgfkp$aHqa61}Mxn!Z0~VAe`cgP57vP@MgDdQrGxMi9PP`H!AP8?NQt
zIyi0bMcF;JHwDSp>A44`4sHMNUWcp?SccTh@<|9>?T(PGluHO*XeC{Ol`=(MweEo}
z-xI4#`FQTU)$}<p28qlqyzQSJfxgpbYB|@BQDU`Kc{k$m7VM{;a1b#5i28u22K<LE
zOT*8K5f^4922R5-mhS7k2LYplQ75+L>g?KU>*7$M%gwQ$LP<mDvBL-7FFc}!$-)|>
z0h~!}Hhty?gQ}DN?OOR)20umB<$oS$INuB?hojquqyG#qdAjBQxQ<Gb`pOJ(n3(fR
zus=3D1FaV)TMyM}o%IR@k9rAy=aICpMOuP>yvqtPY1RpA=yrGTD!;?D1~6HppbWE-
zmk3iFUyKOH%M&Ugdg@{_Di<b`j34a955MR_XcN9We0_e&v$7u^o4Cb*{`+iTJO`sT
z<=kx-d{VJgx57yA7(Ypy7EZ`Tx#|8MVpFDhYnHTp1V-fX)4OY4G{{v*S}UD{c-z#+
zGARq1FkNi3l4wf>b-&*Ji$`w^luqw%C~YPl3n8{K^j0aA?QC82spcF^EFsp4xcmIU
zWme(+^bV2E4aoV6QQl*CS(YzqZUshqAEg~K#pKDO7YL|Ql<uU??JnF&0KB0_bw>|J
zI<4IA-y2a7FDv$BS7g$>kE^$cJaT^GnG7$c(a5HKoh`Lyw3rj*EM!FHYt^o?CMbW9
zuPYtjZNEb_9r$sb#C^*FABLfb$@2{#TV{Gbo*BmX;?w_O?7f5GZoswSMeu|uDSD4I
zM2lWmh!!<^?=?EnSwsZUiC$I>qOKNo_1+0q?=5;~?XK^abKdv7&zbLh#Xn}u7(27;
z{@qu(uj|FNOn((wsqTLc$+k*B93_dY9@6mtDIE%kvAuBH^`40wsd>sVw`YuX4twMi
zjh2Kwo0lJalrR7kmt@@dOKqxn5=H$ZVm_Tb(dcm7hLGE<lquJ2<u{3qqyfJTZhe-t
z*8OdO1U&39Tmms%EB~OsoaaN=Y_WTKSg&ii`JU`T{+s`Tla2e{qWRQzv&uh=<krYb
zAL*o5T_0IEB=+x%IngZ5Ailm^0F>;eASd`E8@p3EH#GVc5?ww&sq%h&O&Z(b-7sVa
z^CIZfuHwr5$W5bJ#H?m0<<j#1$99?D#@({=#QoZd<wJ9kMzLS;6AlfodsS*`gN7Qj
z<uTvD-lz4itO`{3T)f>7ltMYi6Fv)2?bGdgHMIh{r->0pWyhK+g1uw|>Y%-i54dH~
zbcqSn+#UzfQl~5FY#VjH42iM~{u=eizY7$!ZvgVHzz^trySkj`eeYn^pDqw14u2N6
z)ZL_#Wiw-x(?Iv;JoDFcr>tgVU;KtznU6aQaNiTW14m!#-zXi~<Gw(zMR0CRX&bvg
zGz$_8>Hzg2<P0pZ2yigiIy|b;K6S_M=(3sH=-a4BXM3V(EQeCK)r!@ghj<MZS%uS*
z`o6okr_(7uhg)i!bp!QXmA;ZY_gwPsT};g~V1_<dD~jUZGTmQkm)eLDSc=W>pS1ao
z*jPP$rgQU!ekL!Jr0*mzRPs}s00^AhOr3#m5sKFa!CSy;cBK%mq@(d~2$TLYg^f$l
z7bUu;5tELU9EoG!E#CW&VC;okPWK-{ab*QVKD2yf4(I*8QAQ0U49i)aB&-SOBJ@;t
z9s-eJJs777OMFM)_Qs3YueWzNU0@Ih!poNoAt;Z;+X&*v`Uf^_&^C@R=b?Nue?2IS
zND1vS_`M#wS;lat$8h-_CM)92Z_hmvsCQm-5}C7z<bG*6Eom0DqafyfPB@+J<6D-^
zIj7!x0$lp<Itfq8(1jC9B<~s2m<EgWnqW{j9H+19!t(VDI7M;nC!(G9gWka+*n2>c
z*hy8&{K(2x9y?1TzrtwI^s~2vh#q5m+$-RZtPy(H3fwt}`d8X9vU>ZOD_O+|KQb>C
z01Nek8iZ8Bo(%fNMD-Q|oQV8<ox`HthE^0o`;D9kP2KU}elCu=z373xO;1K0`5;fU
zdCwjR(OAEIHF-5~24dPKv`vC3H)@%~f<-btZ+%+!>^*X{<*HsD&G28l;eSEn|LqFI
zaN}b3Bub@2iOBuNvS%)AWlMrf&TVyX^4<4dO8$97{nfInUNRikZeKw{{o08b!q#>4
zR}e8hdT_rON9T18slL}YHd2~h*y%fHslRWFbAp;`1xWz%<d*4z^YV}_uP2i5cQ;;F
z`EuolkINpiph}_#V?#7JNQJ0BIjTo}AI$Rsouqxy0FHiKR?xj36Y@J5;QaTeCGeA;
z2Bm{-zx2FNVjygbI9K|iGNe~!;~3eOwaL2l%J(v>P8&V_k-ELEHI-!F_|MhP2Mj`Q
zRHNAwSS?v~xj1>NSdPtcalP4*#Zk{)cj80bq$EaW-M0EWW3r+ZZT-#Xp$7}=E@urF
zNWs>@8k?opGEda@Wxio(<h9E+#m6x$sr=?L?>w#Uj-w0;R5l5e&nP(J@#*~p>jyTO
zgBlEG*tK%)SL*q^^W(&Wj{9R_lh#Au`45D@{wA9#%<$(jRg_!YHdaiE&TPc{0}RfN
zAjA{o{D_$ty}=}r@~Z03S~6B0Rq+qbVuI3ui4uviyB`gIe+Pi>M4_`SToQM0Be&+u
z*DfR9;qY8C=Fcs>k4%4QWr`TCBuQ+mQ;h_X4U&gyIHCR17yRs^VjIs41)&nJTNh65
zJ(@5^TI6oUK=DdPDM%v@#@9pf8MkME;K8#k_I$ms#0<}h)$9UuvVYf3R#&}U-jmDg
zC3aWIes=e6?<E=QlKf>xJigheJU_Vazaed0^}k44(Fc6;ydY2pN6gPT#;8V!<>Cmg
ze!AIT5=U4qvcl?>DRRy|H-ACME>W86-<TO2&Jd6jV>HVY_0uXj&9eH{Z|{ch!=8y2
zax_G&cs-pz>D2qay@F9QX%%zmR$@49h3$iD{HscUX5db-jsifNsPZ~7Yk12!G*xV<
zZ#rI*4|oL#Jaz#S^AG<YvYx3To>>p5-XMZf1M@v+DmZ}%{N@N@A+KW-Dt`Nvzl5B0
zn*UzeFN0_AK{8D%CceQ-fvuo!dmhS2k4L^eW8yAr?<jWTdozF8&2WIICSqJ<W9UCH
zUS@y(L{PPh%kn4i9?pGzpPZG<oKD~=28oRkNA@jtj|kT{O-t@!w_xc^|J2my%s3Du
zd(MCUS-x${dx(_mvM;EGKuA`~+lsm}IxI`{5B)W<80e4O{F8XRp?miXYHZ?gKv=0n
z2JeDf8ovTp8Zt4KZvk|#2cqvHKBo64dX-N+_9VUSGhnyzG)}N7jBdKy#R2uv;^nQe
z#mUW-8<tQI^Vb(;Op&E+!3GiL^!8ZPRW5$8Aj3~DO`*aA%K>*SI5q6l>~=+ZwLjAt
zZijH54QG@-=AuY%udD3+3LOfLc_z|ZWFB>%Gdv=Mq^t?Auu(Ri%o2LwS0h9zwS*j7
zo~s=8j`Zi>Gaq}7(KX%&y?1Soh1bzvBC<IhHj4A?Y0$bPK2D2`noE#d2Yl%~CJK4o
z$NsOm>A^xW`-O_BYsdwUd51&6loyfhFOggn>&MAmOP?$aJ>V<&;_;NdGO5Ege8!cs
z^ddkQUIb(#mD7vZTJ>&>A^q9q`D*QFDAl=(W*fSc5L$^Np`@_~5XOB<0*f0G8e6NB
z2p_?#N`=f}m8>(u73j=R?TpbLuhoP5ca)uJluk76=P+~Wrn2A}mcXhqEU48^h&2#n
zFXwgvrq7&H+W!xW+rM_pe@({Yn7{F{b8014nWSYis5-zrXD%T}7vk)7X@+kWkku+d
z&Hs_soKEA5tosJ+43{7|Y+RsRVjur;ulz}FVIHm7Ka~8}ar^B(+rt>~XYU;ZBPs8P
zJ$E&0AV@TCgIWoQO0v&%5KwSB3^U#4%f}B?JwKEBGv~hl3@G;@{2daUj!!}#`-u90
zSMA$5;@X*uJ6<O4>7-1RiXmX}A`7#lnh^c8^N;sUZOS%lW=CFEk2Ob+EVfy3jNMws
zPhVMo-LjdHVD<X)8h_+0#i>TJWBVfZO@@$b-;k~Gy@8}+-ECr^B))|V$G2_u<_r>s
z^$MTCn9*v4qUp!rinGM`Mhx}T`Q^OiGDFAcUOfotg7i^sbl?5bFChta-7M)dzQqv#
z*4?7^mt0Kd`Jpp@&>4h~^VcfZdk&K}Y1uAs%Abi4ld|7p(|D~KT|-Qr{>z@tc=t#c
zRsh{bF#;OR-O71qOtqnfIYdP<?2~wqPI=2+%N3_Qbd`1cqw|yLv-@4dwC7b8&BA%<
z=5ybvPM7*zkhgE&czgbyFF%Z-3+S6l1$6sSa60RHkK%8;J9&$Zot*N+dZUVf%Jw{t
zfbsw!a=Coq#^t}g!yJ)-#ju5|@m80U8&`QJSv(L?GEp#9RQgK+_B7;~d)jX%ihDY5
z+Ln(%FybV&N}yEj2$I4a0nnpwyeHm=Hk}Pv5&-wx$&&9kl}grwzkK$eEUIjm*e@+;
z%3r)bc;mdn*sq<P9np3F6`qNgc_OP?i3fWWcA6dm+3V6+?WaQJTn9E$J;FXiI=BOR
z17a6Papwfm9)}CFZ_PD7DaO!?(GKB-C3Bn0?EWrJh}e*~P*XdWCT8Rc?*1IajdKu4
z8&3S5AvXv+{$cl{Hj+LfMjpZO7($28^ECuhO9?$=5~2IYwpr)THuRKH5q1FM=!Z$Q
zn3C0e?m14YA{*9?|5O;B9cS@UIU_rUy;beeORszx+`Ox!51DzNlQ*-Q_I)0{@H|{l
z)(_qsizfno0?aQQBz`*O215AvsE6J|7n?jq#)z|%ic&zKJGOBaLHI25E+AAMvC^)>
z5=gd9l2KJc+@9xa)T^3zzc-%th_(>=oNn|JOEzyN=|9u2v*&ok3CAJVt5LihilBRR
zW(sY=`W6@xn1LwB>MJ0hO$bZF>%!(*$Jr*j-|Fzd&4dCR{P@f)K}d($EjMSXS|ET@
z)>wi6>sfddWPi6a%R<;Zlqf*1h9_pX-P`V9iw)3!WkoF8l+uIW_@rab^P=B)N0ao1
z|I-q<T&z~$I>%ixEDKgBWhkPi0eVl|FbgidbceJ#3?3(O5c|LBRNK_v(}P}TI8nzG
zhPxEarZE?BJ1Xf>mJh_uCP#4mva_P#`>8RII^sWa*S$VMPF_cS6)~M1vgg)di$2ob
z<<{1XF~Y`Xqsky~jX4e&QN4<DVE^tZUYMo036M&f{Dy{KkmQ);;2@(-Wlo1MO-BSM
zqF~@z6ifz8{chF??)mb`(#$V2#ASZ}FNx$|PO$$Y`WEE11yF?%;Tr_U{F%*01Ym#d
zhRUg~Z4|2)`1g+WLS;YCcI0W`RdAxXk85x{U8aEnWuN~~76XL0f2a#FQ>?D8_Dtnr
zk#W5ZjMoP7N;Udk7X;OBJy9^v6C~bF^)$Eq+TF!D5wBQ~i6H=GD`)7u3aEOYX8KAG
zH!&4<H9f0Z-<_Qk>?WTN%HWxWZ^>(nt~_~QqQ=0I_Hx`V+>9pqiF`suD_Ys(V1dlV
z3n<URP5G^6{~@qU%#UGrf$-?De(K)$viX|iRAYa#Jcasl6huw$?Yb0oI574;IYNmJ
zqdtj#jiO{h8+r3_Nqco^Q2(52R^tDYaQu4sR=)k9MqBR#W`dF4a&VdSRYLfN@wHur
zN(IFRKxci4)Q7niEV#_HFu7}m-D~=a1B=^QENE@_Ltp%|dSL<8g<5z>b&tIoYyS|(
zJWB}W=~^l7psBF6*rLvfOD$XesaaBR7dW$-?$rA0=UEjPDp6{rIkPk2BtP%Lp5cW0
zF>}32eu(rk2-Lv?F3^N}8p%=3a!b%_muz@vf<ylP#dsj*XJSc#b<7g-SvO6-cgc_P
zQD5fXfzBA-Pd8CC0t(56jS44^q|e1Th2u}M44VopBZ#qlx8qL$2Vl`w@4uc$fEU2|
zKXhE%BWw7VCt<=hD$xvL&k|X`&lHt(7dYp9CQc(Te%iLY#jc;zTN8ee-=Vu_d3vrJ
zfBCKJO}00;e3B^anS6#EE7=HRvD$HwS8uRP`h;9f?gt|k)^m5>_jzTIyQbz#hws6i
zKzjJr)0cJjvmO3H%{N==KwaA(Vpg_%%rp74cc!rQH%^BJ-Y{*3VvXWl98(_ak+rA6
z;y}$XwU9@7Fi%ihU^CF}{^x0Y5@7Mg`dCMA!o@KVi@^Dgm5UXD#Y=4>Q={9~oFU})
zei`mhXJW_y^Z*t@7l;TJ{bRtnMmzK7!V#`+25La_`bMAo-jGp=+QbIi(UJNRSX5&W
zPmzBP2w0Am161P+8{g;g;i>n;0VI~N#J1F}C(AJ{kwY%Csxi>OXz)Y<^~NSfbdSsU
z<S|#0Y*(Jx`U9E#Q6RB=bC9$3(+7Vn4H!}6KZ0^u@W6P)vkA7|uzQsQCnk9e{fv5y
z;(sbtZt4B=$<oSnV3IvC3`hGo@@KESP*|kAfs^)X{I4E~AiD6gr-9>7dEi2j6-d~1
z-LpEl)&=nMD(YD)5Ho}S3j6pJxzh1UJV6J?Tn<t5j=p|;+QN4)_{G*^cLdCBn%Be;
zRlsTYBa3@F#>F03tIi9fG5IEpNmaGgz0pyHLzE~Bu^)8iKy-1_1$RKuTibw(DQ!AM
z<9cUP{7`CCzhHIv-R=cU`?}_D%rM(SRUis$KblTF#p--j2m4#DfSziPu~FxaN>*2c
z+1cz|SyXK{Rl02l<yp8eveGo!!Y57Z`$;f2qF@O*>(Yh4B&EX;3js2V@5QF={A#um
zOy24A+9H@9|5K?z<MXIHG5v804I;^=X2=PnHu_bmXSN~8`1+gD^pM@>zS`0#QFAZ4
zv$=M97Vm*i@vr3HBwq#mPs8g!^J?qQ|7Nq<ocFFU)6$&J0siE_f`%fLoVuOcYyW0I
z_Vc4re9|T_jD3r(h-Fy%9SJGT{YoNkNK(g~`(FN~gD0Mk^k?wsy%-tne{g!%QoNnc
z?+_v+*QG!6Nl5PB&k0%5-?<n2G>n&w^j&F5uAP*|Yn|z;OCy$V<wP?vnyMNSxDVMb
zzve!9`;AeWMGY5gH?~7y)SKtT-@NThH|`p3fWXxfAO)q~Kxt5$!wC({1<Qd!v(rND
z!(v!4W@B28G7^VWvE+yh342HCOb?{)8wEn=je-{bt>@?#rS;~Nt&a&mpzi#(9yaCX
z4enc)`<qtD)lS_5nyweMGlP+-JZ{7xx2T<gFC}*_AqFn91>Eq<dkJRO*UTg#%k0uB
zK6jll8v`Zf!-s#o2UsRrm&InU44S#to;Oq&-;HVOf(6j11QN3zV>%I_N*X<q0$-4r
z$dK5tmV!<%x6sk^9JO4D#|9Yq8Y)5;H!elDzo@%Sc5iK8(4tYB&tn!)*oLj#j-MW^
zWKB9|VwSd+RfyuYjcHTeY$^_~o|7totTSEUq89-%a=TTQlA=c~w>hE$`_kSX*XlX3
zM413?Zyic+<%$%r*DyYWU)4FcG;tFCzEsXMFY}Elcg5gtf1Nj;af*c}8!^u;ACuS?
ztO%El-uPSg@dS5T-}sFz@9jry3{@*9C#Zy@z#pe0XOYd~PwcNQBXD58B^je`xCU6-
zZDh`WznR><T9Metj4x`lOAvtGIxbfkJ*vgtD-IBm|7rJp7`S`=%FyikqroUZRsUxI
z6HO5O32LIXYN^US9bRW{QAF<BJ4;mXHfjT8FjcN*pmw3xAnX9j@xcz$EOJklgr(OV
z#zHDy$I9EW4Lptka}?C5F-_eEs!~r?gUD=7QydMY__}}pmcjbIUJ;V~+9+4k*olD5
zp26=Jt1MPW!C1kFsp}jlLBmanW=+uG#U06i^SV;oF^b`J&^G9gp!(){qPEd}w^5<(
z4A3Ul*AI&iiyn<RsT>H{C<P(dL9n=w1?Tv~Ra?Eg-gS^M_ufp;L3V-V*M*rLAFtaR
zotv?ty8Qcu6>slLtTM;+0hv^sAraqE2_;=>Odi1&R_}g($3FQG6#pLD<{B8X^Tlx?
zApt8T1M6}J|I0hKHj#6jdYqNp(?L!gQU!O-;PVGN79={MLK2@#Eq%-e#o&QVx`f#z
z|HN}Mf~Qx8ggd_y5vsCJNwa&5AV|SP%j7iNlY;9sG^|5wqix#dshw#D^S^)!$i^>1
zz#f&*9YGQ5Ui?`hgZFfWOK$v7iFq29ajam37#pR|5DM#GW7bBQh7zHF5Y^S;&79Ap
zNL95I$!V;6#shhVO%!ViR)hVSlxx;al-3Gjyw6jUlGxnBLyn|YhT94Jc}Ny_BI?YQ
zP{+*(3{C|0Gr%omaEA?jKN+`hJgB#Dws4%`JX*WiP6g!+RCP5uQWRJ-p%o!M%sX2V
z78WlbPV(L{O*8^x2Pi3d=mhhasCCTgkbT8Ky%dubBLvgJbd<!d|MiIGEC}r9R!JOX
z=el~6uf|8p4+A0Amdz~b^p~^lM|At0G=E5?mYAtACGrFAStd=58&qDY8I-6eZ%m}K
ztq{~>mk0jezCDq^#r%}m&-&RZ<8-#t9<ysbeU{gRDV%9|8;<{!^tMIII%<-&%y-`E
z56zAb2ED((dxL8>Z<iCZ{T1`l7qes_da}{F8UFH))Au8!ZMYc(Yq0&j5i3;-k<0gb
zd)d*{aJ_@}ERebQ*+hk2KRnQD&eI*_53o<MjGM1cc6$T0JQX_8Leq_ZFJA6rGw<mG
z@>Sv{UvG(n8{csM`t$QKJmr-?$1csf0CFpd#wnI?<cMtX`DAM*6JV(L1@}VldrU_<
z<yS(=KRRswoO0DjmaCnlDR0u^ICKjl3URxle>ng+Ld=k-*zsFhQ64+hotr^#NqVoV
z(*M5JU9+<@pTmU<9bLGYG}ovCebbr#k55$Idr{g2k~gPKJonLo9YAjx3?BFT)ccA)
z>WZtr0w{0sH7td~W|H-f>bXk?jy5?C+zL>8<5=;ft)tnS6k%w`Y1)Q6IDV%AT%%OS
zh@OTPOYbD$FqMM!8H$rdy}WcE0hby9AE|k-<lLTLx$t#ll$6&SaWr0w+D_-{)-#|d
zO7u>U!_F<gjA_Fb^*8;p{{7b7%3|T0UBw*2KVqpdGAkL2z%R6MO-o({&MB!q`CO`2
zp!Q(Ma@TRLULK-x&B;SJO^{uJIleqinXx$FwA=hmthrGWJ@tKIVg~lI$2Ji`peD+4
z`Zfi^{|Kk69PQp@aGsAzbPm~iV>6ZwN*jg>s9;>CG^->7{yF-=Wv?A#mJt7l?4uG9
zh;d5Gn{LE?W|5JmCY~)(VQ;47rC78GN3#d*brfqR$Y}E-)QM39X%lGTCt+?v$*=Kx
z)BO;r7&a<e@&fE|U*7-tn~<>7;)`Dt*)TMy5Yc9@*ZtwGn28u`7j-^4>I)~q`EDq?
zLh|b=ZGA&dpu{l=hztim31k1k0Ds5WQ<+xYPtwz+q-<ThSY^pp^WJ`z3(R@4AEnfz
z9D?uZm;@+XU$m=m=BTp!L-m26-utBVm9OVyTrmgkXFG&lHf=AiH2lyv+fXT7W0N-E
zsw~8N2!BY5dA~UO{y%+UZZ;b#59)|7>li?v+hP}RtguO9=tQ)DItqFTt)JFacyL%d
zr?p7^%a?~RbGm6`fHwm*Vq4O1*?3%I8*NaTE-9iFJojgrO(ajBbM!n=tFiMN3nc3g
zUf3~L8Vqh2KUpK$d1&00vLTlT73y;Ec2Vji2YZZC`66`_WE6+;VtP`2%}nX`AC%@V
zuc!}>O6cqh9a}f7#Gq2{0R04y{bUxfJ%f^XX3Xl`uOZ!dVA?K*OdNRFcu#-0`$1&c
z%~Rqv3*snl{TOjSu4F;VJQt^vYT`3?;*r22#2YBzZnc-9dhib_<^aF3`t9rwVhunj
z^QulRL)H>Nj$y6!QXsQ~y1$6IxHyUHL<E0(0+e?CW1aP3MJpo0T_`1#9ezL!#v?dG
z9s5VJpPZuNmv_eVEMXWCm57MRqdN=nzQ~;?!sv*9e}4Zxh@MdXoj~?2K1BKDkn-jx
ztqKTEvGFem<q}lY-cfZe=%20;4DgUKu=Di6e7N&Hva21kgOntt8Z*`zEjFHxq*tKF
z-}utDuKv*90Hn~7x_*-SR0_sRkr2*<v-kQN^^aBJLcl1KU%sNi!7f|;T;({u!zFLM
z%<{_gY9EL1n{cYZy=n>`77~G*aWc<_?zqR<BMtkV!FU9L)}L;#6I3oP&b6gI`-><-
z6-tT*;C>!+Yh#_3=@_H!7SE;cb1b!02gR;)b)6q(uRP)?Vm~1!rSi=~J@}tz7zeDg
zH>_^yn<MvMZ~}W+BLdZ&(O>H_nKbMC(dhJ=xph0k{|9RQ+hBeveB9oX-I{M_arU4%
zz!(RX{0h}*J84CAydoAKU%PD#IZ5RGsAD{!872X5!ZG8~>^&Q8x%ON=tyAEQcI1qt
zP9rj@-ntVz`+{M5%Y@F0VAzb-KT15~6xD8InCDaUhFr_-dME<-3=W&l0rSIGJ2d<h
z(oKU`wK%Ywq@kDpem+zhlQ}bbv<@6aFq{+EbWhXGL#8AvYzd$q#Ll)jWyJc;@8ofd
zAkami3&A1?<4g|Xf~2VDN%~|7+Q$3wI5htLsiSx(!l_AMS36sOEm&+^_T_hl-qY(j
zX?Mf}V%)|jmAAXwWv)mmo&xVsbAWwuybq=wfr3@a8@A?-=ME1SW8y|KqbEqhACdVf
zC7KaL{wOTOWjt=Aar_QgE)@96tO$!_r6(}xTZNan>_J0C@7{+XfL9Yb6Q0lyT!>+d
z;zjn9%m=k{G;BP&;86jxi72+P`^KG)b^3S|zGi@%F-DnkB%pczDHiH5OGiPjal1er
z&^Q3U)S?f4Y8KqC79Z|>cq=kJ@+M;FgYViJ-&SDfNjSmHix;@*;Pt_1cA96*{<1~F
z_g~{@<J;hihVnbLTxbQJk1esP$J4mD;gwf^gbw9Fy_>(GfzTdeP01j$n`07HlDq3I
z&;ZVLKEq1PSMVj4q0l-fGFU2oR8#`-kXc6V<Hw&h0M&o}ql(kK?HjLI7X=Y$LP9ne
zPrz~E)lusm<k+Q;DfFH%jx-hXuV^}v_rO=tSOb9Ra1)dJeb5pQM9i3FBGNBx#w(w4
z&kK6L!ONF3IA8Bv!;O}vI5UN%Lu@4XMVYT*?usuXa9g`Rb0RCZvu>`<GQ>x&s|}7r
ziS)*;G4(xJUV=k-&}&8p`{HQ@KK1e&___%=#e6S;nTz-AIGCM#Oi*8Wrzc}a@U`QX
zv$IMm@1gAmMHvkmp#!hufWxZ!9N?Q@IU{gs_F=FT1dpE!qCPV<g5A8WHS>I#)eKaW
zCG7qYbaF#)!j7tpE|Z3qg^&>QuB4^|p%Il8K)Q^^#EjRhp!Jq%uYt%|Wh8{LKQ(we
zmC~EzS|H+M?Oz`pkV(fi#B`XyX8GLcj_z{nf8KKHv2j&`T3JbNWkskA-+Hu@5N`Cp
zq(|qm1PpjNj?DujMmbCHZN#&8tSo7y?0U6{K)BVM1AGKnb&4;AJTHH7+wBvZL~_q{
zD*fk<lhCRbRrOP8uIkq!<X7Z0Hi@^bR2KE?%oyP}J?B64oswsIS{_dRs&G6-?r(aw
zpmx4FEqxTMyhC#jmSVi4XvcSVQs6u3<D5~kTf@ZRhw-bNk>4RWcs=LtlLE71H`lFZ
zNXOPaBX9R1og2r?nv|ct%*NF0p3A<*k?aEASn@~p2U@%CBdOeOFO^bRTYQWuC#`{>
zoB3wBemg(%j8VG3y^y_387#K2@jOOMF@{PwSIYNhyH;ENF}qEIe$$_{y-h<j-Oy4U
zm@uqBb*wXn==TIElK&mr9&KGlX;APnk#s975aEV_yv<VcM)il*fE4ak`g?Csmgy|;
z4AF>exl^GB>?SHd`1|)b68iH1H)Arz$gQDg?4)^jnf@|M(+G7&;;ut^I);Daq?I=H
zwjczKlZt3=uw2m4(5G3LcZ=i)>CODdDi5Z(Xm*TyC|Ke}Q1^;1T0R#AYUQxlNbA@7
z)J9T?C_h>w>~CqImM<IVPPF*_KAE7W&PmPa+s9fRbSisW<wHh(DJzbpSKCBcY}SCb
zTX?n4l8Q|Gj(bMY2d-#R)+%XTzu@!|*<qUwnoWB}N@!wDy3~e`-~Z*lai5{*(nE<x
z2ju%W4kUqZAXoMvK7$`uvnv|twoj-Y6&DFKyhCk+En!+>`{Q}CAk%)+GK?l~1ziOo
zhV%3GQqu;y;2p#<OXwQueTA?6QyIw$8z(c%+r}wz_^sVxjMz3SdopW4?|VMJ&zc=M
zZqKJrejW9`E`pr>M!lp9yX!}x14-g*z=b~s8pb-o8g=>M`X>gAp)|W!YKN#a4g4b+
z3Sok<reRNGosWY^ijfNLv#sa@C&^7M6qck}C#{HA&luFV=RxBJePHZ%P_S>>E<vfV
zMPDq}c8YoQ{XmCAR!vF!eQsad!0ch1-`!vdMmyN$m-~-9gh3HqHltV`T_j_(>QHUa
z$mU=&{#f##%F>`a8_IaflPD6D+mF@cda7Pd#%EWe>*UO5m3hEF<scnRu!Zg@$}BYM
zrst~*F*Uj?$aor8(b6GZ3iE@TpFjD+W(Za*=oTZkPA=fl<*502_UdJp*Hga=te2iU
zV@&f|UMaFm1?Qb6`k|sa>4;-Xmy{&DGB=fVZzj&I)nHMZB=Gt*qYCv|<@10nU<74t
zDk}2oC)D;O278xwrr1WZo0kUBljj{|&YFb=Q1eGo^AX$`ojkzmz57X4;r&(cTA&nY
zsleX&=yp6@yBU6Xesa{Y(BLNZ040KFuaH%0#~mVlLCCFNYs%Z3<o^_-ggkn9>8COw
z6HS{+RPgc{c|w<2f6j92zn_l(#!?dPYQX1t;fjYktlJFL<TU7e1W#x>fg;iYH)|``
z{4e#^iP7+L9#qkEwo7$UQ{U!FFGHMpO}5l0n&UP`fUF=KH$0u*GcS0H_TlzN<B4XI
zu7#z*o0m2y!n%(<c?#t}Lp&%Jg=xKON_CrFG_sA(++YcuVRxyuC%vy5Kj@W?*hH+W
zd^?;wxL_ApVx-7eX0yuB9)o&9peb;F_k<a1&epw6S#3W7`!R_nT7fOkLE6~{{p%Ku
zk)U_zPR#DIAG*nUb$b3Vp1T4K|K>b0&=UBQvzhBX9vI^sxi?}Mlemf0^&Ck`K5F4n
zK4Q6AcC#M(eV`Xo2Ov3ae~$zT#yS`|F4fhaL15)!fsdb7BHq_<<N4P2E71F<WbLUA
zZVg)^c<v~~?_&79&dPpmHqtnS9}di1KykYsbrA^|v4_?<QmtXV!;LODAY{Bm(v-(*
zh0;-@(9KBeVx3~MdiY7>{AM9EDP-><Cz$4EkK@=VS|O2zZhE=2^|tXkx1{4b;H*0c
zaVH}N-TT)=pzY2GfJ%2)X}8~S<$`Js(w{r@Y6<1rn%nw%rGsRrN@%=?{Tyw7unF>6
zE8l~EqsPalD+pj}a#^o%{TRyXqY;8pJ7!Z>1AMgapNEuIv34C!5WseQ6f>HXfeJwU
zhO_e9e9b*AtO31xlbi*wNu?@}VQQh9jf71gO9>xTS}Ym%{QZ+;-fW(bMVV+H`59l`
z^4~KvG%0caI}4y9!+A|!4Q}Agl4Fwo)=$C=bxab7e=LK;2-x%8KpmjX2Y%*}cErI*
zQ0Ifsd80kBMfJ{TZ;i0UI`?#JyLlW7D{*@c6Pj$piY1DFDom&@hj`RVy*^B_Vegw-
zOS}d<tA9vJ`741p?3Fhq7ER8KQ?OVaUhaBt*D0;0zA|do@d^=frUNm|<<gMSld%_n
zdv6rz-sT_Z&TF5F<7KVN*nr8dfaLl(0VaNI`v^`NSpf;Kgv|LmJy^p397enzxk{rN
zFSsL1F#?D&FhAf(2`ds$3paY};(T9ZC2w|?dOzrZ8-DV(R%t~t+ji|2Usx!?uWIX2
zV%5_)S$Zm0!_vSDK-9qA@24gg2sY4XCOL&sQZjoYbKT68sMis$T+wtVIeac|N>YSb
zPEFg29Ei!v%`|blt`5;pCUg-AkYIh-w#fqqT7$=g!)qN&=N1n3g6k1t*~nKje*sJ7
zo3o-N!XkTa?$GA_+b6y~g4LrLwq0$=Yiq-ZIA7Gn*zX=89M4>q%9=8BxHra&BXy7(
zNVvVCwfRDlg*9y{&OK)BV<H8Xts#P$BveaZVS#WeAK_51*+pTRetp_iyV=Q$>2Q+{
zG0WEJ2@k*Nve|n`h#pD@denD%twRXNKC^SrR(H;>@kPPbZ@=`kCexA=E)!~87La|5
zNH%+Z&N*`tL)+Z&Kan)R?D?-T^O7`T>Mu`IQntM<zN+$PnC*Ltaf$<g7yL)SDvpgO
zNJ_G6gR=DxhL)WbG-k*%*J=TY{jhClV(0nQgK>xPwdWJ)`p0=qr+%3X&OAUrc(*^Y
zk7&ja-E?tl1WEKm?H0D~6$WdMs_!Og)w+`1oUdPXxSuCSa5N~2->nVql>578{+%fi
zz)U$q4{wC4se$dH9T_0!;RcwP<vs6C_nCoie~vKzsbyJ9xij)m`7{hYn>7s*dY8Z~
zTsL~SROg@WCuaLzk#DJ1k2DYcFtgerm-F<rWk!RoAe!z>?YsuyY6;qtFIqIpTmF2b
zytN$EexK~PXpVHf6<;!ZKA#fa@OQB>_yIV>EzceNLkC6Hmxmp6l))DoyPkK8+~#-e
zeQ0ZJ7|O`LZ>(K%YImoOGY~=F>zQ!o1ATnJFPh#mf+YGF;CIYetO}Ei97cH)Zj_54
zyU!1XqX2d{FKyK2zp=Y4f7#v1C2jFOGDHE_)Fu1g1*hfuMm>G+dp`dQe30!FYhpE1
zO$H0L*{~KPzu_uuN9Hd1acjI2nO}(>zx?40D@<NK?pxIJiv^C_jAzGZdF838Fon9K
zq3`3y<=-(*Wq;k3?|y1ml%uJtOjacu08}J3)j6pwqG@b5src;`Xgc3E;W(&Q*$_at
zKq6LhfY_-{(No_KP{IPUkZ)>F8#F-tLGZxVKzJ@z&5qYWT78)dkqO>AD^=Q=b8f59
z*=>)WuMJpXni6jsCG8_yK0Ej^dO21sy*-O#Hi|VPIO?W|))23)4dW<R&F`>g3K{3O
zzt%+V;9G0#vg_p<fGo{Xhr#JJ2O4#Y&q6di0q}u$Oez*cPW0m58gPS~^;)NraU)`j
zg@r{82xP6qN8r#_;nN~iG6X-wCnQL@Yf8wTb*FyK+#Q9l;#|ix@bc!wa7)M{9Ri9f
zZ-4?mLNbSN9KmEBYMi&#FNXvIV{dnQC~s7;$PrT#(p&Si*~+KQK=>*U{(+R#)M4Gk
zHdeQ#jO9Y6cD{`AVrQ7<OL=UZB;rj)I>3jYC<*)3aNPlJNDzRebc#X7f^`~X1k!tH
zsrSY!+rdN(rKV>)>uF!b+;k%h_S1OIbYdV|=H}M=6e|e?9eDZTKQ&{qUVC#Ckv`aw
z&){`k0n#S@$4_`hgm)C|4fIjhxwCF<v!`9a3>@#WI+>%*vbMKhJ`VRNHEl?7LLtt2
zsBK8g@VRsDpUB$v`}I^>zHZEk&>WY3N!+HDwJD$Qq8|t}dAvmrxn6zCfU4qO7ReCW
zsfMr)V`o$=18JI{TXzKehe76MYxMfl&pqKPuLXMguYyU$|KZ+If88BVRy8I1|2;1R
z7(D_s!vAwhunWW<wic77lN#$-4QEh`4@PS}i9P--o;)CmHb30KTkzUG0D>v3LR`z9
zGzdu8i=b&8uB%mKIUko7DyMTKU$#i{?`|89M|~{2T5xY_K0EY%W43W*+KmcK2e3!6
zf$-UUf9qt}=-S~CSi*?%ME}85iDp7!C`$j&Z{;}pmnbEOLCvc#m~r2uo$a4fd6WM@
z6_&gP4^A&d*3FUY7gq!n#=m77J;8cDS&%x59UA26<X;5U`?Bt4e9CVbvd8Ya)L=d9
zaCy_PZTuaB!!QJI&GzJM*!)3Lb#$;cSn*=l%?q~JlQCas%RCCcQUoe?baP9HNCHgr
z&uO^0dU^mv)*^6Ia$ijk%oF3-%y%-tR*^^ozIpbk+L{E+%Y}k-%th}l1R^k3i_Bsw
zBF_tpMQ;}f-$*Q1rBu5gEa;XuAm2A^HPTq-kaLAQdJi-E5YMbH`xyS2E@oG#0eB&8
z1GGqMFy1Ag8VNI5&FwigKNkQTkc!3-M~ot4lHf?|vB56HekLW>1Ha3x%lfRLmS_)>
zczbkva8s&N+$?(8CB^*%&`RS2jQrg^mdUgYb6b;diN>r}h6Q>C`zXvyu&h=3dP4x(
zhICNL@V_LeHZnob6KBRt5aJ%m>WT)Vp>cne+pSFThnBQYQ#165W37IQA7X!M6#tV_
z*HjwFUHmn*x=go4&*(3-`d-`AU~OotLkA9YcbTYrtIMLvYvf^@s1r>z|7HWOy*2nn
zI{dUElp)Ci&B!QK(u1jV4qEWJr6aI*i02s*lv1PN(+Ddm;vL578p%RuF61PtrSplr
zyE{eU73T-gWoF=ZVOL;zQGH2z{BDp+fI)Cv(2dgGN;M<Mnm@}8axTUn=z<kC)%px?
zshi~ZgyXhN9{ii}hXeB4<r0NKk%XSE_h!KdH3O`M>w6(m?hm3sUwEdBGqh%-VkW<(
zragu!rf|J2Z#wkp|9($iZthCcY_j&}L9|0FEB4C?xc{wv7;#`s{dh7?HgVYZpQWNC
zHY0XRds8J8An`*bUkNa)vd7NYTfG{ahxSzXMqLz9JV>mZ2@tt=l-RA!E%s2KD6f_O
z2q+3j!Y97EelhYS#MBl~^b!8tYG@B1#J2e-1khr!rt_a#)1X0-V&)DbpwMPzOi2Zt
zfXodreWFw~A74Aew8C)141YNqR$9`nnbU2#j0zjLy|6l69}>eCqGB8}uy2r6H{;Pi
z3$-$E!+ZAJ_)~V{%e@?$vv4M1VpIxoX=jkQl{JK2Yb5fa`6p$Y9v|8*5|Ns!md>pD
zB5{J9_Z&L{KybYCu$~00)^3K_o0JD1vVT+MF0@V~kzjWjjY2S-TC?+ZeZ`?M<7s(t
z-6e3c3J}kMVnhK$rW{drD7QMRy6d+Js1!Q>>zZ1jyePi%)Lv7&mCisb)-CMAwS@ZO
zccKuK*Uf(Q=w}XKP7$1?IKgwx%^i9`H8;mme1VN8@=`o$n^BJBB<RTXWC-!rnSpvS
ze`zt9S;WT>ooqj+fAhcp23D$-z~`6$3O#hc>yU&psqd8F`4)xM{EWo@p;-ZRG?{!S
zeU%(l$<>zae&N>cbFpU?oKtuysvhAy)Xv*<KtwvYF=Om2twzH?aA{5figw$AR5)?p
zegMaCvS0j}o?MR5AnNq{x?JVnw5&-o{2x4VQnzE%rq%A^o;@MkmZIeZ5L&i74;@f&
zoz_3%0`cy9*x!3)zxYQr=aJ*Nb<CDU$Y*yqzTT*G{;#7(H2g&`<)!00j$`jcnMuIN
z`qZu63}81>8Oe=2%_~u2i`RMgLJ6e-cH?j~oVEU>-{4xSQLe!><8q1FaTK#i#9%&p
zI`q`Yt7!y~)HZp%D=e?lBc$4x28Ptk*?0B)fL32uw}&PNWyqfPZ;e+C2kZ&1IA#h@
zIGG-|UJLp{^D@tFKc`m1C#^q*Xp|T!QU9)>U?n!^xw<{t+)y74<4<nhdMLL0gQh$|
zoZ@`saLv~r5Xq2DNkTa*vVeoXx^=WF>OA)fmts&`?}?eyJd~*G^ya#{6B_>x-4a|2
zI0>v0&W4VdeW1SbidPYwL=nZ}x4VUpE&5tRt>$T$e$*Pcp%Ve!|G|!coYhEJ^Dw&=
zBUAwB5LD+9@cj1%1!e;_D994X7_*`Ql5p#tCPL;+a_r6(R6``<a|3m9e^+SB1{H}(
zB}F8^CISzgb~=0-RQ0kyN6cW;dVM-`ooG^sI_~uKTa}!s_mMBwGy<!F&VPHC2>g(*
zkp0nL9?x>xhC}joph!ZO@SL;zsD6(F*WJ_R;<sDvgsD<lhMr;?YmrXwI~Vy$2F72z
z_!{6p#uZCmlfzhT`^!g=VuOO87<Y%=V;ol1)VE(yD~(Mgq^~b`MC)G=6N3bs@YL3`
zrRURQN`qqc_2!5}41ck-QDB+fv{`CzIdQ$Hb0J7UpAHJ|0<NIdi>(~VQb<ZdwuC(s
zuGK8`fxo|sj81jzR-UF4A<jZKzFd{lG8}2zV;}N+;Ok6kZ`X<Ol7$UQlxAZV$cX~+
z=Q58m`DX-ef#`z>0>)ahbDxtb!Eie4#<JgfbgT2`H?o3JSNpR(8r{4B*K2dADkq8T
zeI__j4PW{rJ)yu_m?`Zm=Nv7vA89XO*qUk%h?VzS)iHGe<D=Lv{uK-;#Vk>w>%X*8
z5iudJT&dQ>?+p@P-Oi<EfoiLM?q1r*Z5@BTLtq<ys-He;h6zF&?S6XaXObx1(_HEK
z9A<A>aJ4}KjrSX69HRoLUtgzR4*tx>fUrT{V>`+&c?R?Ad}t39G;%ejzF|9!d-9t%
zIgL<Sl7W8twY19CY%01~HAhnLco5$yPbP|B6kD7UKdh`Ik+Mi}`0qXzY~6{{Z|>@V
zlhV`$mLgKX<-6OR;*(Hora1~97g8P<?jG8aE)}p{EW=D`NVEZuvZi)VWe&9AyjrC+
zTxF8&pUeWjDVJgl0T*%UduGUB;<tv#54seAesGNb_4%X<z79>M;A`+@n)^7;VpyF2
zGns6iEG1-$RPztq%j-&mAc&F^YLyVY(Q$=`&(6(qqY`u!>~^>IFJ|GtY3a9`0L$Q(
zybP2(as)F3yo(+;qaJr?!wG&u?#tB3c8iRfkx^hqXYhgli?2zo`UU9jp!O78*M&&R
zo2mu3fPJ?9GaSb)vM|fpt0iyskA=Sn9=2yWIsGMqEzeU-K6Td4^!*Kl+rBR(bF*+f
z);TvAohjlPxsSP&z%~m%jeVhHF~r8)xt-M%gS=wakn*=iHMKH?{qaV{g>E1Yd*5B4
zJQ|SOe6H^b5l2DGGS7_}fq*Ya5>bK7ZQr1~qr~g8xf(}y&Ib%>PKG05N0O<c?jJ8F
z03Q6t=+^2q`NoLC<g$okv1(>9J;EQW3(ob?#!KPpo-v}S0t2!1ReaS;>sw>sY+A7o
z_s8ubhMY376s}a)hT@4oT~<st{e`6RH}!_Rv+rJW8~yVb!Vv3FlS~1y#0Adc!~bcd
z`42x$5IR2)2X-s(Wqi4!)%LSftJpw3dUr|bJu7cgQGg{ODIsZXVUIC2jt5qdw7}uZ
zJ+|#a#T%J{=P&z$ThyPkJPfOj)nHF}#;*3BH3a{0lLC495{LDJv=>qObqO>VQ?ICU
zo__QJRUX1`jao)ym$omG0Q%t`Y27T-@Dtb9FGMbaX&_wa-NFLB=NEV^<+1zO_zbZ>
zkpwvt1p{&qafbpM1wpNW9s6O?eA~5~9aLVCIEbiVI}`4a$aDus@gi(O(qD!_wR8kS
z2Z)D3TW_$;_++Uy$-`|Aug*52MUIksqSQA}dg&9*_JeweNF!8B`;m<n*X^R>8ybS=
zDpMq^9Ia~v@}sJx<wbuQN%UprlyS{wLPfm|MKoXc&$fvKAA_zy+x5n^9}^Wb1i3Tr
zhX?_-P2vi3e0qyg;4UxcPsLl$K(GC{-F`RO5kEovu0GL2*lHX7SOO23K1_<i?=cRh
zSZ-jBKc*$jh7wEkL<+|W1^jE^*!Kx0n#KsOg{_1N)$#j|2y6W6E?0qy=e&Q7!6La4
z*J<)_2n^a~rZ6)NNL8p7KXmX%61}Tg7{g`Qkzf$-OW>*NGKJf7T;lmo$aa1epRR7W
zM7O0bz?fvIPpat6H~QKQkPSVdH(g6xvy}ceU+M5&T=9fAZ$RHH!9ib(yF@<isOn~3
z%v_h=4^za|Sc@4U(Rl*yGChgq+)K~Y^r-cNS^7uB-H4JzPLBF?Ny8Cb(InKP<a4ov
zdk-sYyM0Qd0zm41+{)$;jQ43~B6asmr3y5s=|nv2`_jFl!I<mg(kghjDiAI$FE4-J
z?L_*41R@xZh(P?>&gWCj_9U+<(L8t>D+%{Ep2o|p7s$8Vw-Ts@YI<Oq^4}Q|v(``E
zV?jCz#fsbkY?-bjH2CVR=>N-XF#J0kmOtA7NK7;Ic~!Gy_)W+xCXxWw^%seKeQ@*Z
zll^kiyl8C*QfSZRC5pYr!zoB7Lt}b0Otw{2ja9RhbluHUz|V^RvUX-OY5pjZ`=&Zj
z=VvDT8pUN>?$kP{FrO{`nB%~=KyfDb@ifLo+PLBLbg;wPfBIJ;5AHo>;muDswzE}Y
zsojyA7qbzm-$T<;J86@K`u<JxJW^Sa#S5vEJ%^JQ)uZ}OO;SBACrR!HmkWY?nmsK@
z*Yb505`Qf`F_c`n`KPUI-->whuaqKN&x^BL2NCM?<*nLtK#a)uQ6C)2IzX4E5&@JZ
z??3&$cgLQ-h>5YSI+4TpzjD~_SjA0$=L@=-b)ANzERlkINL^O44BytsVsrwZ-ONU}
z-!J}K?6AeMGi=cn345$11C@V`1cH2Q;x6(&hl_lSB5tX$eY0zFrU+d@1^&-63618@
z=Fgu2c^)8{16y=$E9&WB5<7{rW@IMBxdt;s)M2bnA^+;xFX#uAKN_#e#lN#?zj-@1
z%}F=3Dp|-r_u5+QjsD1=DSc&;GHX!vn~Tt6-D>OpmaD}IkZx{9fDtE41(%_#t2|KD
z+VI(49%~Jo->@J++UJ6A=6yzo$(@f)Ec~>f@jI*Gi#7`hQ(8P9s!!yP?KlMdjxF&k
zsVXVQ7_3F?MU!_;Iab)(^gw18QiPDULP`4{^wST*{N48jy<NKGgig91Z$OdSixPI>
zX`UI54|eQ-XoV>$+!9s2E*0wD!~eE{Q{*vgnT%%9G~=19mE0l^L@3(M)!2fr`b6|(
zL85Jv**YVjK#<2@78Z{A_%`rn$7#A$m-0W1b)P;?X<{AOTz6BzXL(E{aZr?bBswH$
z7`J{k4yC0S>SWG4Tjnxa$3Cm9{j9A$11RDN@$T>M2f&kWv2iOzCxQeIi{NBbl-eJ-
zqjxV_@?HyniRYDYp+iCH1*8^K0l&Z%N||bnf7PY@nzl<N;wx2y^#f>E6ww@ajCDBo
zVOiQs=a*O4CUmY(jrMnVqUwKTq)LIUal})l)+50^C)T6QSQXdL_=(eO6&&%b%?1r3
zf_Qwf+T{5(Sn+U@v27ujv)0I*>)326Oj!7KDG-9PDlF{iS5<xxx*18d_gKI>3w-{T
z$6j!!@B=KRNBmT*hjt&N*Pm()k|Tp6oUOn@_WrI`#Nyst4c20lQ42bcTVTvDc~>DP
zYu!1Y-`t$gqI2&c*d{<!C|_4Mbr)bw?&UH5p_qCs$`f$DGycYPqmOGE$Z;lRuuFM?
zh{Zn(&lIG@@5&T#GOCmcxcn?*z@J>J18q);;UvCv@Az^*F5^*rzT8P)>tcIQz`rTQ
z|K%I~&&M5h0r0qMaM}*S?lLM3$PVaq*Y3S{b9sH@df+b5eNHzE3l=?t7Mda9S)$S-
zBCRTa9kXO%bcj2M(1jChO8-iOX&S||&7f_>G*z?GeMp^XderdCxV%C+z@!cBI?xZ>
zyJWb|7QI46G`UesGE@X?_~*e#TC7LaJqY(K|7<TC`-@3CYI8X^z!zDq)2|jI_eUwI
z)~h>{LTd+Y$q&!enWkwC#+s51TwNGg3Ikq2_1Aftt-p$~#fb6?{xY@w0p(tD?=73C
zkzY>{%!>-Lg;JvO0XJ~L&Y`H`_QmXALiMXW)DATt`)#}ct~l2*L`V{P(}8TT8R^;1
zocs~MCa~-i`dYV<cl+4!s8AWH7JuQkmQm&qnrD#-nQm-KT0Uy=LO-|y-xZE|g?hBk
z3z$K<-I5HvJ{SZ1&)(*FR-qMV(@RG3yf?^O80Km@&#8Uy)qNzDlVj9qZEvK%;qsiI
z+;SJC{zJZ2?{~MYmw(tco83nHF%N`&BJECnwii7&0nmqBY!q@hb3Kx<H_|}10Az6M
zOqcKfG5P{5ODtfHxs+I<i#Y&kNU%{lYOgr;T7?+fy&|304Ul7}UdwN^0^$I0G-?am
z1Xx~O219hZNnj1NccMIs9+vt21&elaO?U;JBo_}E>mt+a__`m&oh+9p*k#>)z&mFk
zWu>%wg-VT!V_Eh)i&|K&2mp1A2;G*dMm@|X3M>u7))%=*6bD7nOjjffmN&m|FF*f>
zR6ozBh*Y1K@D<Mao0La#kye2Q^|Qkiu4`OH54<8f4}~UOw;azv;~szT?`zq{drj7^
zef+UyMa1Z_H|^kxjuHr+>05R^Q$h-79b%O$Xv9X7ynClBzI87}3!E~U7R?0pLNhWe
zukv9&djcm@uH9tX?|V2xR=;f>a5}Sp70V3r{N<!uC}c%YVNju7s9fhU?oC50*R4pL
zEm?#8t)TJQOkfZw4v@PE5;aLg_A5aPSj#Tig$IvSp;-R>R=%O-2-ivu5ED!_GjV1R
zhg6Me`Z9uh%Ng(3oCw7^*%}B`#tYz#$!V%FO8d=<GRm7s9HtHi1!N7<i}}cf64Q0i
ziVIc|z}ouT;?5tYcYo{Ya&jTXf$4N6`3{ELiElhprgjS--ZBsEsl!7fxMGC5hA7kK
zY0HE7b<?fvT!75Y6@1Esn=T1)#27;h=gwPbcQl=kZtLt?I>MVHFxQU7=B@;C{Y^__
z%Kx|>e^b3|%<e2K=E&t|s%un0kKozsW3+`{TxeM*<)xLBJ)W<btg?+nCxhNfC`kpD
zOvCmp){>>D&s{%sA!U@WVU48nyO&OAr&&!(UuNg2$x_%u=FjwgoPL;_Z7k9)?_6%E
zpch0ifzVE)Oiz<lyPOv8Y2>|`2zr$Fa7EyRH28qQZWej{jKlu;{ujk^AWE4C!tOX3
z-3;r-CjtXOLp5vn%%#62CUu0zu{O51{XZ+%LI0s(|C$U$pmpi^ulk6~m#Fpnat)j6
z^uFgQdugJYZwNc}x2#69%ACS)4|vYNJSAJm8;e2m;ru$tNM;d~Xe32Qr0X~jV&%_R
z^A*{<??5b~0T7~vPHk+t(81w&&YHHas?EW(C-hT7B6RNg<e!R|r!JIy*tGtJ?YG`{
zIvu<(w$;D-*6f{29Dso3I`J+fmrAtmUIVRb$uZy?MSjbc#XSjST$?88LGp>4BIXY3
z-$w!0Iey%xxfu9%>n*(P=mSzz^%>Lif*%laxF*)>u3n94mFoW1sJ%v*<9uCI2b``Z
zP>Dsieg*$VdHFNmMw9#ew13^FT|L8dw~M|b^kwQK_F>ram4nWy3)bkw<iC9@*(QJj
zWZyogGP<Rr#mK{B=wUz0C@=k}ARVI9hOY+FrPT;!*JKqkIAV!(KnAlh7+@)E+EWpj
zwftXvy>(R7>$^8RA&i2A(v2b@4HD7}u$7XK?igA?8bN9hDM>-;Zpj%ML>RhTVF;x|
z2`ORd=gV)M^PIik^X&H@*8*9rHLUx(@9Vlgg&XIpavES0+YIM)a~vQ5FO(V9h1V!5
z5wFp`vg(Ic^2ATs0>aid^^MX<PJ9&M!=nK{cI7KDlmfr>exS^9l*SiyYCw2G>WqeL
zd3(+hC!Bj>rXb0LF(4WE{IG(iwdYk<92^x)mmn1Q)f0I{qUEr+`;UYK28<0pk=qbh
z)Mk0i{ikIVJ#wS?_J9}>v+klOXU|TqP=yE*d&}(Ehn_6zGK@J#<Jqu8fk34&ER+j^
zr36plz{1c5wKn~wA~|k;GkTegO)373CsbzKgdTkH${(g}D}~l+rdv25ow;0<HIHw`
zO9F6{HVoycBND`Hk7;7^KYT9oKzU9Z;RKkXgP_wa7zx^zy)G%+BO?Ad|3dJ+T%Kqt
zb0S9?vy#9?BFURy!<m9_<Q?BK8%z_j*F+kDp+Q7@1FyG8T0nRyB!Bh#9ia8O{CI(E
zNHwWHUqPLaSNqDZIXg9<kdG$#;Buafu&NQCj=mEOPY9NFv*4Y=_j~kI9_E4f!z$f-
zuT40PbxO#OKkUzTs;9S2axjzMgu=_Ro-fnOFos<VX_~xv-ea5<BTRa??-Yl^I$dqB
znAPOR`u_yzBBN>2evhay?ieIk_EpJ&;S=4=JDFk=nEh(0#m0MleiM#TJ7fL(EH5W$
zeM_2hp+rVo$iMpV?2_pFQlyt2z_y%tmRQ)3RuhT-3%+wlq59O8(shYYY43pUC>pZv
z6n8-Ai3k5EP;JfVisJQwcqe`PMOxM;i0dR%@BQ_yv_sHtguJDpP#{cySApJmBAnr7
zN+6%NS2>!}JtAn%AgS?iuT6mT^QAmXS3K87E6?R(?$0&b{}!kGz1IK(3gGLbyd&`o
z_@~Lc@;}7fGozpt&M+0f_w#xO-{)N!dN*yiun*|;)WqZD53zrL{ao<e0Huo~vF!OI
z1vUc$O0l1PY`;3jU>J@5RAc|06AnbJ%YG|0G6JJ}9co{#2VZ7LOjzw4&)Y)v#_E0&
zcz)q``>>^9cjSnN_+0<6vSm5nekfj3K1Ux^Ds1#<WiYI0;3)ss{#Pw^&YJ|g)IsVp
zryI+l&cZ^GcmPr1z{H%hI&9BySiDTtHTzx&pSKCQac1h(=y>j#r<+DkUBZ_5@HsH{
zlfyPXChI@I_`zS`r+*3t1-kw)5gd&X)S$_xwv|8*iso+bT3@VW6;fD;A$P_PF$y3=
zHFJyEWI0Kt1*8NZd3{blIc`+}7)9ioG0h?jyB|4GDWCOaAaxX+<dtylO2Jt8Yq%rG
z1CTLgw%Dxca*$W*z!TnW^OpPlA=^AsZMBO@k<}~lqV=HKzDX1gT_7)x6P$66zF^Pt
zyIazQfH}VEyrZC)CgN0e#J>Ofm4|iUt|g40<qZFDkS6(#KUf~f1H;M7fSw{v)^30d
zgas7e3r7S4)_ho~DniB5Y&1?_iGSnKR@%{o{;QZvJVF1WbhmdJi-{!}$Ob|x-rJjk
zS+3`I(xeE}4dy4S&j;~MdSg#0i=r1JrMn~UFxd@=!vRSQbVaxoYpz}`eGX8%mMo+<
z1%{~wP|moOADQkIV@z4tRB7B&roa-5njco!cCsxqATtDri^s!}ktSZWuLCG1%ap0F
zQ+NUJ2DOa<hPmyg;8BRd#4{GZ@n>X+?Dv&F;W1^AJpPn~7xZ(2!^R%VVv9cJQJ&P*
zwm0cYy9Y!mw1RwyF4>$<N5MuIvrIv^nq+j2Yiy=AyJ?v@S1QPQBKH7cwrg?L+cc-u
zNGF=O9@pQb9ggS7YC4I*XVCAM?5tlM$P`Rk4;PJ~GMcogIFS{UC=S2vM^_a1R-?ws
zXU^yEm-*l8AqZ0PpWd4r&b|HR)qLM~jPHLzYDbZfCj(!T@-<s20<nCu^j48CuRJ3h
zjanC&BWF51|F+y-s4NG5N8t9w@zy~OJXDwKJ9=9$q^VyqcBkhC|3D!$ZeKa$K7rE3
zb7*$z#rJf_WUd*;;>~LeQ;xvh^lNRZhoiQxnY^~*OwligKC+-c1bw-l_HKw)j`0R-
zn2*b7FhSspRdpn`#)C%Y(&Xn<AhJeR|5((&K(z9abH777mmYyRP4>^p@>#3MH+D%T
z0R?6AC{z5S-+UBYiBrE&tk6*-IWA60o!&{zBMd)?AI_he(V@y~2EvLWzkvotdsBQR
z(o~O91RQJS9BFMsMj-TQnUtphUH4Q{$|G4<{X$>1{+-+Kw5@$t&r!VbBghN34QWt)
zSC0e5Gi#7RtWU_&eG0B+&nO&E7=WQD0^WDlUH#wUwbMD#SN^O$CQVecRY-kvNmHNL
zfKChXcy$kYjBlrEtuCjZ8wtO-A8waF_R9ufEI{wG@*e!PgGAb{@ZLcqet+J3iEK9M
zpi?9@7-xqMC8OgPK%2+5z@u?(lxAgJey3v9S=efTs$;D1Tlk>S*6|vMd%HDLTPpN&
zPPDTc$YccFhWrKjRmFQGG|56q8*tm4mC-2ak7z^vIvM}RP-5*rHKKcAndxG^x6I0-
zc?=hVe^Y$!CcZk%lRECSnn6{RcZoV!4*1c!_c2^`w)wdUn4r)O=Wavv6=J<9!XSRY
zbHy&FU+|-c*hbOJ&(^Dp-`T7n?n*_YGStI>;=5__@$nb*DCvvNcG*kH)(o2UR8jj4
z`P-d{k%XVI_!}xMpo*0~<5`)sU@5UN=LG?NA*6`-b5DwgiN2F^3Ykz^-wyGzp&xgc
z{MRNXJ3^Cx!U|Vu%~tw^y`s>(mqn^+Y}WzZPorr=s2yYVgQcvb5H^g_o_mDpF-|XD
zyy&HqAf80q;!EjAHUhJI?RjqH2xq#!_B(Pe3cnMo|MxS2p?H`~AWE8c)*?=t_L=v`
ze`s}>OI>DZbp8W9DZjulSB>&k*RBVB*v6mP@1}$QSrHZ274e51b1;$sfyd0&JH~as
z^%mO?kI^(+oDvP;E(d%5$LO1j{Eq_B!i&kR-w^MQ6GusAll{d>JvVM1t+f^?zW5Wb
zS@7(ReP%p8X3E6y=izKt-2ey4GZMH%rRh4p9Tz0CpbsF|--F^yGb;d%CH?mT737d%
zog+tIK|BR1p5`+`q#g)S+3*N%1U>!EWXeOVsH@F22hm8>z>q86-XI)}gpLlt1tKNZ
zr7qxB^qn{8VWd44$LYb*nS#|@j|9=rspDASK?I$lXEz^wR&k2BxFC`KkkgS#*fK16
z@OxabbY8QZij;_2<X$O(BmD;#U2b@%D{bH#-LRososem%OB~rgpwv-Dj9KAf<J+6B
z)>MQ@jdJAh?8kDSAP;u!X>-9CMsfWtAXT+ws||2<g*1m99SS?m2x&)j#kK|Dz`Y$L
zzSg^J7x*%W$V)6X)$V+^gG2?8sLQjeZ#iXA=b?F}BS?1Rps2CzkqxPWk)s*6cJ@=q
zJ<X8oOoZvm#-e$UI%n9Ud4!d;yFrq}zImVzqZnCmxoVWi)4{=<#aM@7?5?A`4I_y6
zG@foMk#ExlMf^>*9BdDfznfs+PLIe-aR#1}?V#ywG1p|?L^4|;Jiki-18%1Uo-;R)
z;GXO`Q1;|-L`f<nN3-A+U_q8svIne6Am&kZxGU3AHLZ^y@OKT0)G`)=g?A}h6oj4*
z&$-7XtUgIEQ(?q{!sF|^hD1+YNFMa3Vw1beBE8Oy!il%ImbZijK(7TuNp>PAWLA2o
zIaw@6{7UVj)Q_U2*T$b|os*Kd(mfkUrC$mAvf3w&mL6GlACaO$nDY*0zLzJF5;`|h
zWI9v0+_(h1=J3ws4`T^;qn{48JwBPuH1Y$X=|ncJ_~PS_4OZ<D`~NB+fMo*vM@Dbo
zr91yc(c3ZzT3St0Mnv@citLYNV}^%Htp;YMD?<Mvbi&9M0(AhJ4)tlc^2GxwO?Wvb
z4jyjD&lKm>I8TXyEGchkXahkJ`EObh(>7&Zfb6uxg-J)Yf~winQ)pulPnN7TD)BWN
zJ?_}g7Ds*f>igWw!Ph2T@_70M&EX`0&)Ux-)>_vWp!P=;Kl(?1l~|fGZ~?3Ac+1aB
zr62FlhV;jS@*)Tt@PMAb91u0&D{eFCnedeAR>WUk><qlN7OVUSd&g4<H?Pu-!lR7>
zxna!Uc8OUTJYJt4W1<9o;#n|2x3p33S`lO+_^6nau5a=2=U#d@l_|^p6^{K4%UIax
zPA^Mr+!2BPq=SYTCx-{YM(WM{Lfh;b($Y7m8bJILGF4;dj+W$pIhiHm)MWhnXF-*v
zZPNn^u5z+VZxW|~m$nPvozf;>#H1|hY=inbI}JBFWiP$D!+zoyD^ch$V*uM`HQ;We
z$gEwCm63+WAXD*G9>Fx?Lir|9(x-c}GDnB*q|h0Sl!MhIvqWkC(;E^PIgff*Ki5$t
zWSbv!=ZYSi7QJ0v-Z2A@PGD1w2Z(E-&B*&SFyswC<JJIw5KYQ}Y_)!h^Cb^u_S2>M
zcUAZ=XN=uIWjFM#q;<s6MdO?^t|LwG=ncyQQA>3*V4SHw<^s&;=7|0FxdmctZ-;kg
zN?F|=y3NaKwiZWHXV-(RpAX;~;YjcEXD<ic7K&0|Vt$NRI{}Ax_gu63OFl|p;+EUY
zK6`Dyk?|YbRlhx0w8Z1S!SeEa49GN6l6gHg3jH3D=IY49j_4S6vt<POFEKGO?bp^(
zzDr#&5lPF#9O%K=#|zsi{~~36!}oOlE6DO8YZJsm=6Z}VN&uAN9rV&5HXWV!p2dH~
z%4d=40{k_?zBlgPBkTSTDAVM8v)-KMOS&I9@?j`mv6)ND0YiYecMmo(yLOi_T6mWP
zPN=Bz?I-T7qK-}VpXz@c>%W1Y<lK1l;XL|hKd1l0<k;2IV3y{6uB<I#92mHkW%k>?
zRZ!5YcWu>>LBxGMbI@<_Z!jNNZvmuzEeCPYlFWyy1Vssz$29)Y^Oy2A5Zl4-7+Uj-
zvB8-Kn`*Tna}<K8G&)Q<z|8t%_<Z*pdfBSy$Z0(Lg+SxM;p=fZt`1!;LTq@oTvdSW
zy~f=LXY0N-;6tA*f_EX^?d+iGfy(Clz%!kEzP*wFxCc&-=PM<E(!t>t3Ln316C^rm
zKin-$bAAtq%LXu)$1ro!Y@vH__a{&feDbspIz)GR39*qKm<H144^Z>g{f2NC`c7*N
zhU3oD*&LKf(;FYdpsDO1;Y4EA)4$Sb1Z{eeF#M2`+-M5OPR<#~d`h(TIml#Lh!|nT
zS3E~oN$O~PFIt#TL*-e1uBBWt;0H2Bq_|&FS`q(qemE}wuC+(NjT_N*eIuS~%!wrl
z8&8MDYUSA_sG<D%ce(kOfhK!JEQA$&t|qZvqha#V|HjQ5y-;i(nCMZ`Irs{RYk<92
z8KgIttFXsGHSrWB7vGY}$$WcEW1EFqHzz`L7lEtG?0x%Ff^B>UQ^Z#Og5JMzx|RFw
zox@}q&3+z}#ALoQ_j+%ptq$?<c;}>T)Lb|T=FSx*tdWdMz)kh#;PRm4QeFBerQ&=1
zhCb>86pQI0q|lmIdRh>AUu^aumS-6|*3(pWCsSsdT{<!;*@>PB)ZQt(+yVdzV0tOQ
zk>#4i2~5s+ncVvlE}J|z`+-2>)&KIZQ#1uG36RbHg({=a654Y+<$hvT;HB8cGgbr6
z{M3p>5{Em4?x3*7r-W|#7GY){2%;9V-lQ)JVt6mD87jtN{USaRd|DwT>Wi1ygbwUG
z@)rRb5DT8uh#=dK$p(4Gjc(Jvm{Xz15YOK4YozQVhh!3B3klM*WG%0D`z`?cmz4>1
z86urm(^N}sFp3PYE&3k*X~5~vB8`-!6Tr%o<Pw<Y7sYbXjK^kvdr!P4-z7febAA2$
zZ+O)|M`nVGYxHXF%b&sjeE(rD!2@y*o-Qt?lC0$(iWQ+_@yG9eI2s765(3F<4ouQx
z|0ojktN+VBzDbTP&{#X-q03i9Sp4+(`d+ihiw7_Nes*#Q3AJv$+BQhuU_NsgsatIu
zSVU@<pL?$kZsOc3XiCXrdjHAYrIjW!hrUH3WtE<%)~xrW2^YRHDJMA(eqcQI<N5YW
z=)J`Vu^x^S(gcZxI7id|sk$AouOzlP*a}0H>Xgb;XmaJ5+vRiGht4?aEqG0ItL~4s
zGQKB~#%bV7@iS{by>TDPw)`+YU!zRdIsc7iys04m1`sBYO^>1*8eV+b8b=rgw(jhb
z#WOlB#vc$%kiH0d1ZjV|pzJtmt(QoY&27Gc3?jkbt%&*Mx39#`VWlSrI*+f$$Rffg
zs3W2~vh@*w!8MmRC%wYiYLX`q`T8hD)D_{aBc(C>{nb2A^U^txZmZ+18q}YEx6RAB
zb>#-)({9AePCLUK811x_Edp<!l`r!X;Q2iO>{}sky@ADx()LVk2Yt5W5uR^_lX@>8
z%^)boRr||1oHhasW@W!$pNjI`*N1@~{_asXQqiq0nL998oyT;iJhpoK@l+yJ(>MvW
zl8zSVToo^R)VU56Z9I`I&zo+4)SSYHuubo#_p<;1E*o5-YqS*10VFxz<A=x}3;R;u
zA<Fzf99`I!Sk@)nv_LW%FNV#LnK2lgo8Tr{bBX5R=k<jO5j<$RHkdpZmgs0P_1&%o
z-(_V#UmjVzLpE|Fd!zp&7qn9h7@k0VRe@#dYLaArzYWuIxnO!NG&w5qR|i(Vd1X)%
zk(Y%V3rTNe*InY@20kJM-6_~gl`hi+X#_F|wrZ@@{-hbsfJ>>>r^9_n4$}Hr{b!Ua
zF45Ivfmy~4F26G^I14D!nanyPqfe@^8y#U%EM-cWIMB}O!u(s{sgo!(DN<ulQdK3I
zNeL|z08H9;CF|`c*j9#8J0pofXe@2-Ip7!!i+;zdcUvRCWzFoL1@b>%Wy3jv^-|EB
zu6qA<5d^iqh3ws8E$}|kj^Mj%baR96{W)X&AQt_+t}KI##y;)Hd{zFRd_q{&b*t9<
zc^MeO@w}{GJo%PkL_Rmit6IZp|G8sU@r|6Gm{GyIk2U=kU7)9{^aI<B%pOOt=JAmI
z-2hy3+#bn-mt1A}f}^p)i0G3cn-X!UQU5b5y&Uh9T0~enHn7BavcB@LabuhxpBY~?
zH8YWsQ{i$x?yA@4%P>);ne%x5CtaU{_OkX;EJqYReVzTpQ=fyO`W19fRvcjSz>TS1
zNsJ=}D>kY<<BrGcO6(0CLJo)`F}pP9FUY;vD4~;}PGq+z$aTVVd#j|9mQS2iU4%5!
zgpyf>>7el01zYFM2YRKts^xyZRk|O!8B3HkT|e}rgd$fTKTMPiuSK0V+o*y}d!l`%
zkgt&`$N+$)8BeAzDWE-L+~o1e*kkNTmCd#|hbA|K6xQRr$4VQH*AiJl>ag>yXsba-
z9VwOF4)j}i(bu_^G*YiUkiTCaZseRy5lnzDfITjh)6p%KX=jh{SuZ100CH=Fksla>
zNx?`!xJ$W(#=D=7w#5mU;i?7J9t}&ud|@}k0|(f*JSTrFI`_r1f^R<vsJ7*s_dos)
z64Q(pe3GN)XJknPmp}EM+*M`LxGyFU%6DpzrQes}dqhDu33|N(O1&{^73DKWRwTSN
zmhk8Hht3$`y}sI?77l1enENxr^E-ULvQePy^l6rJ6faCi|7X$6Ch+^I%=I$6)N2iY
zrr2iEU@Xq#`COmNep^ELo2wx8vsGJQ`mihPc=CXttZAp*IjAgwT|My~1s4GvaA{v!
z@IkGUGQmGbEkn(O9I54<F~)~1Y_unN<vKceyiWqx$Ub+02M2_usfz@{uzOD!K{fcq
zf>}8I$S=&4OLCUJ_$dQY%ZC;n^rt9m-pw&ApBu=qEA)%G^yZyeU}(A@NujwmA9l1o
z8;09c>7bhOQ{R^w@`F1wTW--j{!Zh2b#d%@<)yqgPT}dbGGDyV`~QRCT&rp!^#z%6
z|LM~L#qi#JDC1D-`}Tl02WQ56yzy3WqOSKS8VGDJEExM9u>B7vn+qvWb6c_v_Kf>i
zPk}DXU*~+1NE0pR^V4+>t*M!VN+*gdvl*h*)V){VEW%v=du@;i`EkhLbmEZ@038;f
zbb~L7bi<t9$8+~}5rh$-4d;Yw%73~(@;=u*8DVdINP3(uWH+jDMnS1vOo$|B-YNhZ
zb=xp0F8|ZR_jxtBJfzmma){1b=OGN)-`9rHtbj4t?VHY&qJ8v5%&c?5cpvLGT?@Ss
z#bt_S=$3Nt8$=|97PDGV)jV?ICeD_b0lZ|^`q$EP@7s!l*)<v`!XOm#g8>DiI$Ix#
z01ty~1jhx*n`ZC-{&JNQHLlkI^`5NMQ;(6TPyijo3l9U%+=_2>1FTg6z5#~$<mLA&
zokBqHP}w5>)KiIM)S)Ma0lI<Tfd91z%pLa9_?U@bL$^YoLx~lHuq*|I5%n%7rNg;L
z*&Pg7)R)+FiD^MhBFG@Xz=w!*6^L=S-om26OL=nKzPB`bjfoeenPpC~T(pg-R=c3q
z4Z-Cy`DL2?_m7W+PEkGhS6d9nhs#;|PBJOMM5pg#Pf*fZAYyjaRC3TDU}h5PyJe7|
zH>#c?E?hQSppq2F_qa@UE|KIC7$J-&VxN{NFrgu8<D)?x`%ekCzyU!#K_Y!UB?+k}
z$z^7{9j90nrI?E|%-?P}6~Duct;o(FQ1X*<IzSVu*vz?)5=l<aH_fgH_}SvtZn38`
zXNY?eG=g{InNX}@_U$u(q27nKU>Gc}PWdBeTm34Wp1!P)e#xA;aa6|nM>C2<Tb8vF
z*tdlw_XahmbTq-y$j^24_@;s|q>!QSBqlK!ux5<;f*H<KKiwO+OgZZ8q%GB}B!2yo
z&rEtF!gNe5o8`dHcsZ;#S=~`+Z8Yo>m!E@P1?*60_gsep%twrwow6-F7JTb~`>Bmd
zx({k}zGn>n;I8^iayF6AVK*v@NygMtW3-+eUiSE3_gcNcUdt%%)s*{xmck2_1#mxv
z5=VM6cgPZpbKV)3)yQv<m$ltqQU)EXWs%<73$Crk^^N~2nLr|7=DBd#s<us0$3xNv
zStPuB&^u-#uA~~02P$xL5O&Ze`6%`3ai%*l{9AhCysf-ZROQsW2$rWU`4s9;)SS(f
z`YHLiJxj@x5{&fX-xU-q8z}}%*QuyY{zA>(?RQum)vFoLX=(o}Py?{T_wM*TK+qY(
zDD{-LVZjf;qpCkl5k!ShjNcatDDLoDS3_cla+H?=0e#}J3{Jz46Xey$N~MxA-be82
z(-(;4AXnL_zMR~O&M!DxI|lC*0$L6q7CRqJuEn3~Bqt8(1NDo7EF<o9mhEoxE?~>V
zFeohdnSF|65e0v1iiqmAV8OQ>o&x!>BZ5ha2^J1*4Ln5T527VjMoeA(kJk!FCGfW<
zuk8|~VLae&Q0rHu<6}FRe23E=qJ5XnReug1MDsc;p8~N=UiW=Ak&cwm&(_EN>EmoT
z;#yJhiXNGU47&D%j-q?ad&m%YzL!JGx;%M%xB4PmW~0PsafBFXhUzd;fSFm4$L1u@
z7K_*f;L4NKX+1L<7C4NZrj>M<n`MM@xT$s|t`pkDHL^SCnC(B#LcYDmX1L8-j5&2m
z9w7TW6>nqF^*A;vs8B>!H?==*eNc*@W0{g2e&4-sXc&h-xN^H#`COZ2H4{Id5ZNco
zJ6NzdLF)j51M#h3fxbR-RY#u+)FJ>NGDd_2lvLm4^M!BG!*j2Vg+^-HKH;FGU5_0|
zAHxFleHYt9!1;J__%nYI`nH5q@Bpjysr0_clg=kEom(%wl6$0d41Lx#H8thB4A$Jt
z)mglj>ZF!3LwAJsS5sXh@05#<ru^AT^##aMnNYVUEE7a#+71PPR->mHPVA?SGTWRi
zCp_K)`&e}NO}4R%V3(nE6@Z!fq3g(LXTRT32=)`{SvQ^Y4LbPpwSkz_eT6lbg;@XV
z*oF4gGJmW^7@oxWwD?9Twwzp*cf{l0Wf@3-@KOhIt|<EV^;p4m&-Gz;P4?;&ft_`0
zO$LFkwPS)!n9#?L*&5vqPR&I!ET=rUJj2ja$X)M7VVQ1im3F1B6rJ>09@cB;SwbU$
z1VqmOitq0<M@JA`9<OOgb2K``YCRL1_CPu(?klI6wzv={OPKIO_A9>~-=E{<3dJ_G
zMMz3frhxkb+aHolUmFCC*01z)Rm9b8&nWlZeg7-|1uaGkUhfeyUib2QnfVVkgB*<|
zD2a4F66jAkcYmyB<T3xeCtm68RiMvV0qJ7n_y9xUOHx*jIvPvHAt)0|nm~2ABzvHc
z(Ar1j>DuMvwZ9y0gyP9{i6E*~DuWAYrvPOSH`AuWazx<8DG{ywEj+{6#Mg#HcS(~x
z>4aY-6S3wp#H9w@LeXJn_gA?fk`0Je0=ySR1D$;A{eXMlUGqjeq~If}Y(0_;g(uhs
z@A5Z>iX#La<Ms7CKv%X@O@Q8LmmS1Ed;eJ&DGrz7bkbx^<SZGHIyT<OlXH|Rk9Rmg
z%ahPv4#xf@aa6KofC>S&cbwO(`j1b73W9Ftts_RHU@jI|Tf9sCgzkW)d2^j%dU$A*
z0hAYy`o>qu(~UfNYa_blL3&4kDwsf|Fyps`fB8UU@;)WAJVt(v|EZ<wDGIjs7fFQ}
zlGh;3vo{#G7etI58xcLQhrfr%;AcGw^F8RH_o%7v>XK@S$Pk3>X^v6MBP%-xTdLSx
z@3x-Qc^BhHP7Zb@iaAVG5V?a?f#O-RlE!RwkjT(aUQZ31WK0fm5)MY(b+&`n{+T=#
z==p5YOQ032YJEH!4wb>QuK*oqL~QNekg?DLT=2R?=q!2NlSfQb%uZ4F)Fy%&;pk3f
znK;ymZJ>U_xmeyE-yTEksDh>R<!+my-P5^3=z-nbtmIl%7^c#CAd#p^`e0CSasHkk
z{j~y<Z;ez?I(a}G*faPX9h1Pzwpm@@LoxN2x4w|`81R;D{`<hPa6PcJeK#8U=W6S3
zAS1CF@LouX9uMVRl2P<No0=MS@WcYoq@5>rc=~4ry!*es0Cs->ADJT2kY$#9_Z@y6
zvVedpCaH=b?c3-JG$3F~_+ThZQBy*njY`jfI6OgO=gk!zbsuivlM}AZ)T$|o<=QBn
zc#N?b)F~}?-oX1o4mW8mKuLb8RB@iI%Yf*KD}i~CJPUm1kj?<<Mfb+NZaO)7ZO?*!
zE=lTL4h_z_**fP0Rf4T@E&anyrG$>s?N$wMA+4aQZdKX=0YigYfa0my6!pfH01EA*
zT}e!)20w0$71f<TSE$t^{a%)goCuHrja6Y}YiA4K+#sh^-BOc^rhvV!r2VlTCa#;f
z$e8VTe4<~aM<)3n+P#qVPssDHMJ>n^(8O&QLjKYp(2dKI6Te*ewnJq!At|?y+X5e`
z68{UN<;B*!f)eB}!ae8}ZO~f7g|nd$smdQ!C}NKWG3K2oD^)Re7ar>h>PQuKz&H13
z(CshCB0#T<G_?5~8pRkxiIxbNN&HcHK!Eg%G8ToH+oJ~@Md^35WicwgULXqlxry7C
zE8^ld6?-EssddIssYg^<m^YYgz@Kiczl8w;@1<WtWA}h&eu$lxUu`)xU}=FCp7;m!
z7x?Zrjrrh$YDGEt!(EaScTyJH8sWHa%+EYJ9y>t2$Ms`Rurr1mH+RGN_LozG8{w%o
zW<VBc9My4ITgp0S?XHXlC()H1Cgsm3mwqsLe`fM<r&>BLNA4HOq60EI1Ms2DgA;`&
zA2EbS29oUt@iC78Q-2se(WUiZcZ!5wo3|f0;!#q!)Fv5=G?vP7PnOYGkQnf3aARXX
zY|rc#7GH`yw_E8D^$q!PC`giplh<-vObr+o^2=s@J^ea80xCg^9^X}xiEhZF+sh{0
z6>C~b`u!f*k%Z}g;x_?S)POmYlY`&kn8LJAet!N9{S5s+n9Q{mm3M)*=HB?2%4zMt
zu7}~*>tSTtFOGk+Ho(YUgXge6M?Sk}hG6rj=GX?g&-q@;JSRRwhSQL(LVgOkj(G`r
zJ|yF|w~nsNE0C_X6W(}~UN{-5^vQwEc%dhklF}z2yy(U_MEmUJ@SLN@fE!5nVrAkM
zIFToln*9}%j!r*S-V6JC_8Kk8=La1H`&zH7nooaGe<}u14J`=y?O@R+PrnE$C-Pn>
zRg4m#ferb`C4x@2ji$e%%E4&3Q5uCY)HF@-RZN*-t@5OOLI3gm6`YdK^zK46n`)|J
z&(U_i(gfT4{&<2~us;~9DF85k#G3H@k(N62oNYGps1mMG!(z44I9eT}^<sQ8_0$Ik
zYyOqY);AvEt4S;YsA#DTkqH-sg_0-r!Jo~kB!mHJIxj7JrjlLtJs-Q;2Qqb0=?yWj
zEeCMoUxe@}?+hlY%8#ss4u4cbEadagNd2ORB~Ha@!&g1Gt{0R|PcpM^j=uA^lDVJF
zHnn&%W*fF1`T_-iFCRusbitnPA~y;mnubDe^nEi|J_R44zzfSDoKdqkI*L(B94EC|
zR^3j6eg9{-L-L#ydVC1wN@eoHii%(&E%-c%H(eJ<sJ;3>aO6}u0Z+{ez*4#$&<nl!
zp;0K9ljwf*aE1e1!R>y)#EmQZC^TcVKutR(wczWhb=sQ=oW(0W#sJgAZ*BZ`rxmY1
zzGiA-dPIaEDVw1_H~vU2(E_Wqe(;ODLKatkwF2|=ygMR;U5r_sNTOpQkDM3W{**9F
zOf#kx+j=zP07m@AqAinq0!WkWpE2Sm8)kt^?BG#2%dCj7ZrZYlFRO~p=SD#`*m$Vd
z;bLsSWZ@|{`aQ{>);5iAcVDe$fwBb=#xWD`keL|q7Yo9Icr#wm5@!*Jek^4`*NR2e
zQ_@`s?QEw?_QJkA3pUR;bG({XXSM*DJ4&Cdkof>cC&5gJ{8O$GE?R+?FrRB!_Fkww
zvDkybo=~V1;LKe)>L34rlE+@<bow7F-M>8!1jX08;nC<nHUF~&``dp5-(1Mn0jB$4
zuT9Ba{|Y1|-Cm-;Z+M$7cvCK<Cb!^CmaE}&^5S^+8zIpq1_B)AEhQ8Lf;Dc1x=BNW
z3&Ptp;3i1(J3al<4-iWQ&J7=&MR~2Vt-(pak8{wAuGe=%TI>45pYtgJ5~CBNJWV&Z
z;3`egia2e)j0b^CXTd^tt_`>SZHl|^f-y+GpyB%qQ(iOzh<v$bhn1=pe^vvqFlQ%Z
z=`M_4?`cy@qVYX+2EoY7AI(ZRSe_;}jV<Hp?1lT7t$0?I+Wz$${vo&${>nsME~l~F
zM%^e?3XnQ<^Dae`iUxnVh8MS?nC29}Vob8v&dRrqwAz`UhULi5a)}o;&#sLF(qBD1
z4|S50vjDtt6X_?LYIUEM-^u<9I$3<vu=3@1P{CNeR?v{T%*C_rFPEV;4!#Zf`Ck)r
z40+t6*9KodiGQd3K9_)w^JZE_W7XrUO-iCp$Sin}2CLZO<>bP!XV8N2TX`0uk7>Fm
zA9^DiSb5#y?0hs&ye1echV(}I3N6UOWlkx1jUNJeI5sG;tMdc-5dC0!njT^qcrXsZ
zd$}R_kRr>@A-W+P>@9HGtjR^MB}NvvTQi|XIC85FcjIMeQP(?}?uH@*-a|C6YYI;s
z3mVPnU)Cq(-V0v1duHb{whvAfnn!*x2G}M$drqXR{#(%ub7YZSZ7G1IOn`n?Xkq6Q
z?x;J20eu<WhC+UzycuEJY>k63=b9V>?vrtK$xg6if6$PgnLn#@^IoWs!z8yP-=KhM
z0~_yJwX~}MOa`CyAPSrTsk%$Hd~|LeMl#7JvTvSF4M1josf;U_)>~fYBsWwgaTYw?
z`h>WT$$+oV<4JHKUU(PZCD>}3eb#-68Q&4G$BDYb<xfd=Np0)2xttlAAzTrWB|IAR
z`|%pLt~Wgv*TWQey9In`K=?4}588ql=G)d1Pc^kA<*@W>FP^o^Z<Vjg(>K4rqI~mT
zc!~f4#rt|t-#z*&==L|Z)!&OFDA)*4SCQ;o9BdrtK;Y%GB9+1E@$C^$3S8bJz%O%W
z>@HK~atJI7i#QYu6>My7u-*6o;gqPcCbXZ<O=;I^{j&7^9GV{!7|U56Szz<&Mq|B}
zCr6q24sQs8@5=n+Twq|UhL7M~t$c(<;TyxB1WPaH>r9@uo|ec}q^$z<2V%G*pdIm0
z4I!jhfk2?Yl(l9v2;eVu6kQV-?`$}g4w~WQLDR@_(Ca|lq5|IUmPDZUv<2I^YBp+G
ze=>ez_POFCT@Yr8LQ$UK98yXvi4RhuPot>&UdOY4>f`nRpBP>Ty!Lp#g2J`$KX9g$
zwUDz-7<-~!w8uFcgmXdDpR`)v+lCS+keAQ-*6E7-n*?EwfB4FPT!8b=;bE*6Azu;%
zVcRTSc=d!cBDL<S)E!`-<UJ+2?z&IG6Jxzh8rN=d0jG8w?Sc?R!ff22;K<u^5aLt3
zgA3CEmVFJfnj>>yhebVhr*JFOWc9Mm^sy-x9}s4~ch;GT^cR9E?peYMy1GR#=8V#D
z77S|^v8}hr*lxsC`yTID@MMCQEKNN^up54jB6O3eZu)&&2IABVnmkuF+sXB3j>r#y
z10^DFWG&~GyQpB8tI-4kPI82t6U{5Pe_MXiPI7@Co+{;!6_`S*`t3?}&jDCoNOO2(
za!L<%G&Qg%vI~=f)kT4gAT@}NAH+=3#=uMs$seYVjCNS6?k~Z0!-!PH!bt!HP-j@+
z68M)DeY9O&k6o9rR~@BSryP^?t`e{ofC-(0K(n+UbRyjWKp^(P;i=U&AYU{-Rt*p8
zZ$wrnLJve8nGBMA_iNKtWj3n=CfRM=3g7UYET5hIZYBAM2y#H@OsBi#nU%?$W=bEy
z0t=KsCU(h`fAvYtyOc0fyt<e)u-W<dvkt#L>qwCat$$Yu<p7Nm9)eCP!oL7sC}$8t
zKDvZ`Oe88|!Zq@e$fc~!0HX!??tJJls*fiy^!!Fkp=&#o%9^E)(~KuuUd^$rLA>z0
z=i`6*`ozuYO%#nFo92)PJF?*kXXn!rmmLk%&cui`q4^7dq5~M6*?`e2c`XwZ4XWyS
zZlw^k5k<I;o#*FaC<6Myr0I~|pj<;AgsIA|TIJI1Km0ji-S#FVC)ZMqdJr+<Q)e8s
zqs;k0x6qO1Q*j)Z4wZv;C8fC-=lAZe=Q;wK26yJQGs{2Cn9~)xKX#gXD4!YdwB_t&
zjPci^SRfM3<dlS(+SEXeVqVjlGqfLNZ-0khR7yUm;X;FEaz7RyvHA5Ai)U>+&nVMt
zmqPHat7^+3>`N^ZE;gV<4Kf8#b~!-_K$G)E$PvpAPX`6s5x}XxClfA&RRX3M{XolL
zo%dp@+E%@MclJK=4Jdf9BUJE6=!l7#R5T%3R6k5G+99=zV5^UQM+_<!0H{4QWsjru
zBVwh`uVj2}A?ucZF7`U8L(#v_G|AuJUrb`nSG6xHuHjV4ttmO@8Y|R%ZhvpaE>C-g
z`{Q5A&)<<Fw$56j76X60O1I7Y{i;PUibw1CGGIjVl^B48%ZwbDy!Htkk!PTTDi6Un
z1#QF^<|n&Cz3nVJPU&%ZBS#qeO<2>74>gYESaS!%<yfc*(Wo^8fmdfxXj#uCHFP*X
zR%Fw>$3omPSjr#Q9ZEg=J^-ol3yH#H4=yw7I_||fS5QeO6XKNoqR_DJJ=HYV$?J%>
zD0;E+Kkk9gQPw;YWEW%KYpSRtB7;RyUF^1zk&fkdf8BfPxZTo56+(@LTIv>)ap6gL
zbdaDp>b4@z?x^a=zL64`6~0F~2@5TV756pwue!KP($ZLnljZUgczH~9mOm_;A=f;(
z>KG!h=7yqN-XOpZ8NxJo85$|GI6fJMSoVJc1^Q+FwThd#5?z8%9=m^m{38<UZ}}Xe
ze%B#0yY}09`vm_;pZUM3L)XC_C_dn)yv(%sMNET&vq9M_YIv3j^#{qj+89#N5+G^L
zt^bNv+>Si_h0?g6&sE3B1A$j+J}Wi*cPlZvt<FixnM)Ka3Fxec4Tag+-Ij32cQ)Co
zlV!!o^3A!t{wLMslyT>&p5Kry+Mwv$Xe$@(<ma+A+RR?n?N$VxFC?BULkWz&ypHx=
zd2C=SJo+`mA^kIXp-G<QKw_naxl=HdL@P(I$}`^nQ9X2ie^o^r6QxjmK)nZv&*o2m
zDf_eOYw}5{eopwC7UH)$#T2^~*%kTiZIUhYSR$uFwG7S?V)_R}v|p3xoEv0YGR`w3
z0i!|UvVnx`X=*}Bcku@9#w-4t4)u!E;jE<&tNkAtJbG${HHL==bFwz&v%s&d#8+p&
z6ww5NC4-&;tC;O<Ic7OW4y-%T!$Yu|CcvA`n|7B;04~@*;VI+g3c_7xcd^^VR>TK@
z#(NL^RxzVJMT}CWuExm()ODS9r$=B}|KeM}iA;CI?0M+L;=~%%VkybN*%jL~SU}xi
z4><RMWDRqOkhi?;nJa?Ia77DLS=d}2U-qX)^GIE&6uKbR)z7U?Uvzn-0t&cBjGVi4
zQ`OOvdzcRa;j5xU4I^ma@99YjlNQ~L2#loB|FD(U*$U*z0I+0@1XRME2&AG)_Sv+I
zra~}De-wY7lFxM}fM)qJ@9lBeC4Hw#8x<a1<VWeHWFW0OvH+m1YgXH+!n~{TTc%~a
z=3)V%u)F)f2ae?#P&F1sOzVo$^ROh|qb*ZjGnlj<i6W!&1rWPYs+d?2Sc?HPuuf(e
z-q-1LnG(r_G==}(_3R8gsTMq|68G&0#U1H_tbqh&T2Qrb_3`q*9pqgCdV}ku+}p$`
zP5bZBr_DeZ+@E8l-U2@t$~VboeJ+RemlyMA?F~}+rqvLouiUm_e7*sJ%sEc0uM)mx
z$ulsZCfs<uNin`Svzc!@l1W?Mp#){7q$cjA;J?ir^`_M?;!~`QdPpmI!`G|r@js}Z
zm!%M6Kz-n0I|DMtSSd${i8}2qJuoN$m2E<|#si43C+Zgo1lH|!cW-xmdOtRokf*a9
z)IKL2+&HXZQT=r*8`J_MYfKGRQW!r~gx4~pc6nh@daLVMw!Nw*pOtGZOZpCiGZUT@
zfOj;CdDL6vniTLzk8yL=h7aokD`@c%0Q9qSgr^@yY-i8R_*!eDh=dL!IgE+L#9Q{n
zc=E6LtY@$T51O07)5ZY&8H>$|*wZ$JlF853z|kg7ejxahh~VyWti!W4Rii1Slu=S+
z841pIfq8Fneuu~rZJ8c`ky!%YPZx1Y1wsS9y`+D5m#(`0WY9v|eWTicR$6qThdRU?
z#E{ZqjIg|Yg)jW5o1P12PHgMA*Y^5QAS*dYk7ixC!`RPVW0b*La4Yyv`=<UJ7H}q!
zZ{vfV6_IQkFeQH!-W{n0y<rtWSj`dmmpv()9HH$r2J+I^okMI~F9BD`!#{h~*AEev
zP{Rhxw3+OM!#qaQfE-e*C@r_9yUU`bq*a-KC`5PaJQT5i)U+SM7-b&xfR)u=WJ?*K
zsgWIvD^NLx!$y-GFioHe<TtDFCxS*~S=hxa&yDq{n6FNOoo|>XZqpICj%3NqTmM+Q
zeC!ky(ARm}BXS79Rkq>2YbZ8>EVq6RUYpYfnCPyv;b^Q3moCtJZ3SPr^2Y`T41*c~
zip#f8CB8e&@e*d7Zyj6Cr@7+ZLxxgo<L-882@W{_Xi}0s!R19g^S`>Mo9+L3AV1ya
zOOfMTgMq2H>+U_%vCqf<`(lpy3lE4od|*n!lmOh$3l#sjtpEGVD{J6~&dgd)1Abo>
zLy!qpk>49FtAk6BD9#UjeBVl$xUvHG3djc;*kiLyWo@|Uxt%XlxB+zbuj;p%8|LL-
zF<ST9G6<5vDKzQfS#!Kb4yG_Ga0NJPb?}xQJ8`cYsJz`IjY4R)jP!fV_9p{M=%|W6
z$P<j^(L)hw5XBL~K8@<Vrk-3xiN_+c`RYC$eexF*qT}A{dQb6Ous8lr;_WE7{odXu
zxQXUC!sj%_Hs2<i*3IDTh#<u=4hXLp7))t>Xj95>_CrqLkfpl=&TU{a&E#9?f<Gs3
zyXg+~?S2*r#Rn2c?*o@E1roa)BQYF=#JYSL`-X)3jd!!dQbhWA3ExgPy4x1<1%L=S
z=E&yw7RAOqUw!#DIl0WZWX_0Wy1;)3ks1#i7F%y9%Q~Dj1uVUMhsh(;#L-%g{uqVo
zt{4&9tp<`FAP?*acCHWbTK&Ihzj7E8X&qGmvaYqL4f<;$Lr{R`#*00HsZ$i##wyDH
zd3f*}=TkA1rAg#>kRnEBt0Bgiu!0KC)wI~d{A}_D8(WJ@+v6jkKN3MNCIy%#VaCbW
z)jZ(bE)S(QZ07;wuAmUs5|PlcRQKl@`w~zEb$?J6&RC6&`e5maNC9X>$_Owa`k&{5
z50G%M&j2SJzn3tMAi2LKJo*e@!~0<E>+xR)7EY5EsvcH@6<im_gorMZ<+3p1=1`;w
z&1}+}c``LoV7qRtuI$Y#urIzegR0+6{$?;sa4AaN@nem2wkRv$*HK(5YhAKUgsMLe
z);MrDfM7+nm&-QYC-JM;r_5(3J4Q4`S*v{#T8mr3=(OfrCsx=^=NlC`?$+k-1+uex
z#95FK0?K&xo&b98<g(vws_IUZH60&CFLvD9@Te3wC)fJ{V1TvqHqCvNBp#wPT+{zP
z&2iBbKw_9ki?_7Lzu)SYAFr=|GarMC!m0$w=T|?M>+78oGy057upsMM3XO72(fY#|
z#=55IEpnGX4B&t~kj3iU1D<MF2+_5oTiN?AVfFb9U?E{;KlBMi=|bm14N3`e7!>9Q
zNDAA$65ON=f2=Z`K}Om0j3~kluV9E5Jsri%*%o;V{*dow4aukwsQVlZGk4ynI5s%7
ziva?W8!SY~$*&+qCGa9tzk9kTtf>c>-V_1OLx@6K;9eKiBXbN0*0=g@s%L<GMP?~S
zpkjS8y43UPGrczK&^9%XY${~aDlT11sjEHo4Ur4eGQbk>h>Ze*cWZqQCHWcMhZ4o{
zj6MS++7`Go_XLPz-(Xe%DOCtB<6s+t;iQTrOz9lBN6GO`vVMmGBuw}YZkd3Ys5ZcG
z>gO6II#)!WVBOyOLsQ(;$48nv+eB@Fa8v2SM@+33M`_Qpq`%khjp+M^6gG|wg?g8x
zp4P~0Jwz7ZdP3jS>F%ls7$Iszi?tkiohDa22Mo8O9gC0|pgv?SR<n05QhlrU-QXYo
z@Q<PmnV5VmDTyWdxnS7lElFkHxdzvLAQwiZ+Gc2u5eXlATig4Vz(wi%4wWxocI*kT
zyASZ2u;HWcY`5^Ol|oQu0@S!COvI*B@QRHA>LdL3@xqjGNm1p1D&hk`+z>BUPU79(
zGOz_0P`m-Z$`qP6FqZ@roGZhJIgbO-ma%2>7EDomMs?5F)HCVlVxyKxe7n)hH>sAS
ze&#34`Nn>SF7CNxc;EJlIkNPsV{|}t{6R|z1m;49Kx3Ww8%#+O6qwqR%k&F!@0GDj
zx36Ogu%IjcZJ5v2Sc~i#oa<zNEkV!hY#pgDT}eb9Tbsl~P+hdu=f~u5KL1rue?GQ5
z0I(6;+D`p`l^e->yRP-ge3rU{&+F0QVG3p!X+i|Wk7E%hwTpXdWv=t<|KFP&SAU&K
z960dt@a+G2$N#4rTA0s80&d(qdgH%YX1U-tW8`>7uXeQgMXbYwD$^f2y&z8tYcXL{
z$il+$Ndle=mU6~XTD|`M39esd^XmH!sCT;Bb|775t+zcSlHOZE_lfxva{(kbGo?8<
zNEKs<sRdwu#hf>I#x{oMh4~N78&zb*%Axk}$G&}(LZxV$#Ju`mApMGS?qjY1G$|<e
z{dZF8q^otSir^7)_=F>>%mGe|dRZZgNAc&GjC3J~kdWJo;`Of4V`H?fjpE|$_!VaU
zXj_7ulB*b{&#0>uy?*nO4j<tI;6?!4STKsOTLa;5w^%+*)0Ncp2M7S;B|2P5w?6tr
zSvcFSEixsKFw15S0(8mQX;7!zHdu&f_R~;p?d`A2ra9DBc23<KWtO7_(cq&C+;XfN
zV0I!=e204K2!c`s_Gg=J>g75&`SmJ9!8=RO+Uo7W#=$(U`ekJ>YNf>I@QKQn(|+r_
zUjTnxD4c66m|Ao+1R>B6dI|Rai)wNu%6Z9JY7JF4Bw&`F(vu>vBqUQvbg;o<O1z*^
zL0I_&sX=g=GD3g47e?eBB%K0#X#bkOXOi=I?%Qe>EnXLUz_=luVJcC|rJMb-QRJ(t
z%IU8CSzD3)5G~e~wACK|jDFA}O3+oSC#h=)@LYL44Yf5l-$GleH?zN2#bvzu;W~u|
z{91UmxKGL0_kh*u2yu9U36R_?X1FLf3EA)ByXfq82*U0~21aIKZ3dI?wO*c<(&c4Q
zdyhC2?();5jopN&m-XQahNSTFBN>j)H1!E(0x$j~O$1GexQm60mC-p(5X~Po834_b
z5ht%6qf)O~=eLWjtxs@7%U?9&=YPT%8XxmHxT6DJK5d`6^VGoZd;;z`A9ku3xi%yi
zoh<bmo5EcRcsa|Q?<Pczm5sIzp9)WiO}p}Q!MAKvmFlu>J`g2kN;xO=rM8KGP7+{>
z8fWtU(Cb0>nLPeSi&Gf4VY4Ez#VGOPKZR!9d#u%Up8d~f0`7I4P(Qu>?!^1w2VGn}
z*L5YGQ5>BOco95so+yj!qgxGaVqHl_+#2^C=lpqr2_FBI?#_V2tEmsT5I;HHtXw_&
zUDW6p2@eOhuFbw*A8SyJQo(k)cJ<X@pLg6e9)Pg#RtG4a>azjKa0!Dcf(lHFXGITQ
zJnhNtdZ&B~j}D;1g-X1$FB}jJ8D0unI;4M2z6<fgyL_jGp}-B8n^fgNaFA{!7~KD8
z4K7eVp^|8jE&a%Zl1Ed!qV@8%Skns~ShW<uB_K!{nh+zPTH`7{$eoP2xzhWBnpDNh
z7%794^#J`Kq&j_wbR(|;C+8*e>@ENhB5zUV>ypoP_{oUiALMBxG!Nekwg9##s<0bg
zKgYYkS(v~%_OdoZ+|mzBX46TvD_s5;{a2zwE7i^Q+s{M+ja=hOyb9!I!k?i~@dJ*s
zf$yNd!g+lT3gu>SYbb;ZE7}z+9;H>(e06#D(ri5|u;n0<!Pi`B5*-}CtgQU&w1Rf)
z`&M!oai=WP6y_Ih)!gYcf`sn0_ig{B=wOTw7VQ0qxVJB$5x)$4JA&_^Z>BTC4D$^0
ze2d#=RxpkOb_sstbCC{c177lgo<B;=E#FS^!F97cJhE}1*(In^rpK*hzeMM^yvmpB
zD$LlXo3|OEKTu%EVpU1>FmM?I2YNAhUoHB>l9Tj#ThHB!#)_ZkSpgg6VcTC6%0own
zKw|5wD>`q7meI76be=?D=x*?R|E!tZ(SWJA4lt1>e)@PGb}+d40w8bfd`aHIlu=Cv
zi;hNnb5I@w;ybH;M&_8~rsk8#rsL*dnzUn29C`TENZX=wj7#M`qmO6R7uHT?G_Jh5
zHOU^EuBDr^Xek4Hsk0A&d|0}jt?4}we!G!u&u37j&-nW)|5=K-@T5!K)&K#i#Otr0
zHA}31hWmT{ntNhnM~T}qJ;Do*uI<S>>>;^0mAbDKnSdZVldi<b>L9s?YSoLk{r0D4
zH#2=nO0J-uK)Bc|rGSf|`>We`oco<yhr~6K0$To7FJT5?l1@gOwhOm^pQOF<j;>#n
z<NI+;M+EdQ@w^<rKXm0VS{;5`VAZu|MI*-d<Y}|8obpf0t|0TibEU**pvq7pTE$gP
zowsH0`;9s5y1+M*XlsM?;THH!V4JbnJ8+{ahy<t(j<!m<c(J6nA8DfpNNb9Lq}?}P
zB|cT88~?V#BRvqsa7$+n##_DBeyG8evvuxJsNVJCYk7Md2Z83VD=&vSgC(V$au9<H
zDRQ04EXLh{;(BFCW#)$l+L|G2KflEgDyzX{0fHT;c%0-3tKLpCalX{t)B=1`keTvk
zih~uLS$YgpaZCL9`k?S)wu|c4Yp}N3*PaqR9SvNR;INCOv4Ueq%N&s4L9M|W67?A#
z2O#yH{+Kt3!dRLOrb!F`$$X7<+K`J0XJkQJ7}ix|SIqy^<0lrK2Zi@JzVJ#%v*;28
z7&s&h_f<{{f!R40|CoebqQ4~bRRvU0)*&;R@zo^v{(`*`?D4QBT2PwoO#DNH>Y@Vi
zEpL54>M|rhO}2D$+*6>Fsl)feb;ephwwCrZeT*w0e%Lo%)%l2o37&&NBTI}e5nVFN
z$PYC<A~RnjGF}6RJ7XL8ODvlA18ouDqlg$|--;D0RG<#GW;hkw3b0U}As;RaVc1K{
zjLN}-iMyhh97VN~2Si=nG<rxjQTS6aqJ5mVzY^}wR9UOQ+M&p0G9wS;iUnz3*h73?
z*nUseHlfj0169DuDwXXBEhX$&Z@D|##LF5WWpj1Xy)?SI%mhTR%Jf!Vyk;%UMoC{#
zl$&9emLwY(&-@tGo#qfA_Szy)e)k{-gx56ZQ4OGIlHn_P0!;n87V^Pf4VtC8PCxyx
zpt4h1>XH@Hg6yzu{f}D&oinD=r#P~ovz1xG)qlje;EuB@Grc_Z9wbMfJ$~M8+=#D}
zm5|Uoq6)Vjv5MKA{cQoP@6gi*5GG#{4f8>}A*-^h^1r6DWh6xpw%lWii{}GgX_JoR
zJGUg-W(IKDoxS^8c}&X#<zW-MxsrGIzsK(X+M6!4=3Vz&5>qq3g^V6%r)WK{Orrl>
zr&62ilMl}noz}>H(;n^o`Sx2Y_j0q=mf&7c2eJ!!B<db_&+SLEPZbbr0gC_|gN<lD
zD0uZ%Sq~^vgxE!H=C!#$%(q5SO42oBD?Vfp8+HJ$53L;82N{DW%OpjnfIKq43gYPb
zEB)dB;p;8KqHf=<e?l0gMx`Z{8|j9jOC_YG1nEZU7KR~2LIG)zZV>72lJ16~d!(BI
z1_qul&vWm6?Bjp@_wT(g1ZJ-5I@h_@XWgqei8QA>W{1R2Pj;d}tnd75QlpDzjcV-|
zv(62O)Yo~o%wOr%*w+6kEpW6dPO9c-u;U?@l-kr#72nKQSZu`Xz*9)U^4#Ip)30`n
z#O*{3({K@z=-`Hg;vSBs{F#;NEdyget<N*Z+(a2Tw&QSi<od(f+!nAA0T4GS*&jez
zQ{(RE^>9Ivj3+u^ou`h`o|mgiJZcf=zxc>F7hbmocYZpewZqF`TrmY4l{6T5N4?K3
zd8y_lcX@m#@`lu<_)JJS)H|;pQ0KzuYRKqwrL)^s6yw>QAbT+cIYUVT_{bG%;0q_^
z@;$WxTdu+v@0vlvQ1lY(a-;0?u{3*IyrpU~jDk7omlT&9uuHxw>Y+CD(C3?`_d)p$
z91oZ{vhETSUw487!z#9{0(tn&VAB{rJ<D<^iWA8*x4vskC*#-Nej{YHT}sI!$8g$F
zzW^Z?cY}h7kp>cECoOx+7T@h3SW$=flFew!)!w(7?f%=u9s$PJtj4EKJv4uB;MK+{
z7xcEDjk1k38r?qy2_icUF>~LS8qzF~1MNvt8%?)<QQx*5NlRD~?fbsqU+Uj$q$fe8
zJka$Opz2152X0jIIWU44pRPm=EfOs6kGILT^LK%VcemE)yxB=NsF45TxMqV}D<j3o
z4=G#q@fTM|9X$46oOAJ#hTFQ_SGjoVIr2Px#iboO_wt~;6*^Paol6(fbe3)QLa)mD
z`P)#k{#sP?&a!%zKm2V>OH?ACuhTr6MqZKT6g0~=aa{dZ8P;8rjIg%ncJ6!g-oo<s
zV;yA62wS8UPRr#UADS~}E05+QK(x7BI6>(#1aNrLLn8mY|L+AtWbu8UcTI!7gwB7M
z&av;Ob4kZ2G+AXRR?=II%o-ZKnSpnK&iw^(`2FwSisl&P(~g%Ih}J%$XO-gi<IQL+
zKwX;n@wAl#W1djirvyujK!)%)Z$Ey#OMAtkdLV|kP3mlH0u-?4lvvsnL&x8$6R5>s
zp?a>yJ@smB-AC5}!ynDpS~WUB5h#+HB`*TRrPUC7Q@VP$Q5DZY;;k4<vWOkQ?)#|?
zgT>%?m8Cf=r`GwCHAaC(hW)0ilLP;DcRb4HATaG75|e_0ycEOWm1&KSZ5?L0=jqD_
zWiO;?y__8hSyBl9c@Up%2a|$9kn;|$!l?iT^)u*l4D9&u>o*!V1Z9Xk&96wgaqM>Y
zoyk7TZ+^cqzG6TT>3lvIr+)xPjxfPL<|(hJ9Hak;oM9Wif7jLk81OM44xr!W>2x1E
zTw_J%G~1|#)w{w@zlHA)tSANWZ1*r-w=+4Bzxx?)T0ZMN5zHf{f-oHsp(X<(t^LIv
z+05Wh+_D5@Ac?Jx?weJrqv$WHZR$kW0)TJ}KxHdZDnJ;@(?H+y<Pg^k#%B_`LAMXv
zNqbR3$C!@?7G{im7cqP9cYMhXAF#>SV_w}X;5WTriTOf@XG2-^$>m#zt9jTT2{>EB
zPol}}(CycQMbbBWUDMKLb74SbQA+FGE%XZbUC@Z(^Ft@!$=zeG*G)U(>wuN%<{n1i
zn4kEFW?R}|Sy3p>?qjA53CjG?9cWCkOc9xp>q2nWP>Y|*-;s2#8ww1Hq#3THr!k~^
z7*@bD(_to#FW+)wsMM(t(Q<Q5D)e{ZbmMnn=_5!IjX%6#Sv8Kf_KX1exMWhOrr~yU
z^U*~T;e`erWKY0zwX1z>arSqr7Cl7IjuXFK7P~w`e91_58|-WvcdD1pChpLvympQj
z(f{mwu#j7Ly{cKaJkyK?QuHr<sq&B>%|IB!p_>&;;C&ltTu2*2m~%w>-=B7KHb7-f
zF6K-CPycU1tfBv%AFy^ngZ0f@yKFQ3UKNSP2u$oE38UG1?CW!6pL|p=@H@Nm31|{J
z6DZIr&kC6HBj_U#1~4nSIcluN`hG2}*1%8y%EsyVAm#P0f)NWvGOjTuO|Lx;_Bp&b
zQQu>KZB!}!Ow<?>{3R%m<{$h{1<TT;o~hVzyyibnn4Oec<oSs$?!O}lcLn87RA`^1
zzo&~b9F+dtNb+6r9UOnfM$oSW<?id23M_K#iz<m<Dyc<!wAhX*RS3ISYmYRUM`}Lg
zvii_8yV9SF|3tjjPQRFv=Ts5klhXVOe)0jMBhX)HN1s?U+l~VAz%u8awx@CdWGhG7
zWgx*k8FF|MfXRu<AKQ~!+?bcr6!S@6#iN|y=Al}hEqv^Vs&6=TJOqjrMCh;yRT_#$
zU`;`UG$YK=YtzEeH<k_H^T!nKeKsiOp}Mt%$?y$3o#ZCT0ohUa5expY+{H3IR%ebk
z7*<KPP7+FG@GTr|V%1=h{LJiorA3Mak?Dr9@^D-888MyJjgHusEi_}fd#fYp^O15n
zT)2{H7(V}@bFiJFOr(r?mynY8O>dDBndY2(F@aCl65hH#)ik0lUc3@C{ep8M$ZZTD
z3%(*o_DR!ODSReGbpZE+7@kBu*`;}NnWc3X`U_zjn*^pF=7*s)i8audO%O&+yi19%
zPT}`gvxHO-*Hdc^rPsrkD@k%AZb89Y;0uY_7)-CL_E$9MF-$4`V@EY0Q}7bV%ekLZ
z3-g;fn7-?)XY!fZzPqs@t-I+ba=yJH$GyI;#VogFS2^4U(KRhw$Pz++lNv@O7&+w*
z8kNy6q!#bchA21d1NT7UyC!QMN}(gli=2QXoMiwgTqU+1=9o|l#UV<<ieZ8gdmqq#
zl-eur(M*s)(-I+f{NYk~M#um4^pUDjzn`pkoUe@k!(<J<*QoB=WRQAde@NAg`8|8I
zXX|0vu`G|7^xXI2Rn8UUTNa#7`kOujw@iXQZWqwU+WTtgpE`?ONP_g^&#b_GVp)HZ
zQzP@d1MUCT4c2wkDP1I5YZEj>gICDBkk|ITL+6~JGwx@v*@!TcLgILCZrPVg44ZoA
zT+Hx!66^UY&zL_pRHPvb8GiFM7~dbbW3S|b?+Vm@9z6HRqJ4CiR1_lBJr5~yn)UE(
zf>I1)W36HI^Dz&%384zGx#lp{<lWz{{001H-I!5-Q(S%o;MEuU<NH$y&x^E$V*~?b
z_b#VEh3+$u1eS)LwmMV>?nOp!S4hkd`OmGet@uqc;jF^_x>HKhPi93zN@v)dwTp~7
z68**sWWmuLGBurR*Y*NxN^A2Dv;>&d!W`x$Vbc-fZhop~9U%IgF1wn&U<ucb;WdI?
zd3G|o4{CzFF(N#H=y!k5{W-j{sbHOcM#G(hb=%vlC{U|)4|SylO!TK5t`=`bmT;n6
z`scMrwZnZ(>3iNW{_(IfuC;aB-O87x(l<{)>zxXz64L_v6t5*wLX|ZJpwqsk;xgQI
zk{uF+4$a-<c86fiUKHO<tP^V6Onk@vF&zlHo|Xp0zsutFn9o3jm_e$-n<N)$79tfy
zyOl&DaKqOcVBNUtdU6aiUtkpQK<`ycDedj@!D9KG#)ebXq?|YVJbKrTe?(9N&-_Vc
zz&ZZpfh)HkTnPPKi4grnarR_0N2&!2FJ(AJ5;5qWKG6OOq_%ynM)z^7$#dm-B|*7=
zl(v`a;md@YX8r|6fRI?P7oqn8#cLDGs;ltHCT}ylP%EzKQN6`&(-kjtn9ggk&vs5C
zJZ^HNVy<T<o>flk9ld1w&E>jlBJU=2HYz1aS2RAx7b_%u=1?!3N+24b(kn=#$A*fQ
zeG(3}dH_y#C!SL&%t9d{3io{XZQyrOejA%6_KAyv!<OV|Mm6C=sUn<n#BOOl9j{LE
zDG>T)JZ!l$tYe!%MY*e*KihjwEB3qp-5(GC@1*_pd)vNf0oA*ClZu=pn1pO!`cI?V
zi`Kh7CxIVscLv8mI-_@xl8>({V)aE9n}@eOn)7oOs*qDAl*H`<5nG^Po_f2rX&f7~
zGa0x3qp(DBl&x5Iio8#Ai1Y5^PwPdWfbnh4TO&}-HFl?S>6F-kkZ>NV9QC1(Wy1I7
zZ65l_Ebs71`xj_IinlX%J$kqis}LL0bRd?Kjg(C*78o}g;qmM$(Kx4n2j<*tu<wF@
zt2gO9f`P>q`V&esB-a*lRG(e}8kBzBU#2Kf4eN!?`LmwwmVRM5-y0siThu8RTH3Pv
zaI9Q=^6rD9Dm!pvseek*6CALGJ?&}#&NrO|ntPw)_(ZrQ&!;4Th3jo7Ii4z!ZmW+$
zkUjDFM-Dj}11;7qSfpaQ*h*EB==<n%xuTYTy(ev%TEKx5tZj6-_`lw!n59zM_d6kN
z(o-a0NBQmdr)<9FlO;S{JyVUdK#e})rp`4~Y_zH9rsY$z(yacQ8oMQCfXx&6wT`;N
zGWm-|l8gYbH4i4CUo2jM+Yh-WWhEMEkVG#QM_RE`4<HP}V+v0N4c?XEvlB@OMs%lY
z%%cu_@Vvj-DlT!%$CeJJ)@J-^LOncA5jo;w#q9)6>~8S}n%;0M0&8RXNa|oxD(st%
zG(M1&5ipeJz6!(xsPSBl>@h%7Y_u$1C%5G&fRFGYLGVGKNZZ8h3^l+lKz%8XPzzuj
z3KG67yE-F&Pw_0r&OHqKjWc%ydm09*7Qg6U06)IUJBsDTIq8dGC5{}>M^HX|R3)Fj
z|3oqm<imn1?+l@V6L%p~l4x|X?%=vble!~FSxIhYyHF5SBkd#${2lwt9k`kj-_28e
zZXvf*GaD>dUeLp*@G+F|db+T_2E9QQ{cF~luBxsd=ajF(C4t+1huI_$Atc;vQ36AU
z)^p<tNF?2L{Oz#ZXWt@!2h^T1jUF~P@iJn07@|U5Fbd@a-Br+?s<P+dBS{e1;l=HV
z;u8*SOm6%cl6zo1yhu(cz)3-sGYzoLmM1#!%r<nIkMhAVI_@RJfWB`%rrnaeS!}S&
zESM0UO^IRi+<v0KEI9~GOnQPtkhk$&HB#(bAXrZRu0i0_<S&-yLtlFM3}Q%c6J=9M
zFjvmX)y%7e+1qKn<$u>WA}uB@r@0BxU*al1R6958_sCtJPxUn2QR}!J%qb^9#09Lu
zbjaUf=#A`*#cVm%f_Ihi8)HyWhcCB3Ek<AtxC;rZ73O`W+n$OS8Ei&N-X}XY4iA9V
zprodq@9tO+=cUa=(Sv*oHr(8B4c&56z}9NSrCaS~ai$hOca7hPl><BO`iqi?MzyqO
zZFzJjS{;&3+fD7*)*mDlVn1dTG3E{ZL3x@9;KPj*iY2_nD&3PqxuTH!Tw1*)N=kg*
z5ua_oHi@~)HyjsXlqcxBmM=Kl%(>mzO&^ZGtE`nvc!h%x9Qt988bGbwIzg?sL7g_T
zw;=ur`<R#Ej0w}(_+@(eDhB46x1TMI@QjaNgC*!072?A_4r@FB)=qqf4X5^3$i~Aj
zt7sh4LapML9l?ZzH)^`opK_~+ER=sx5D5I3gqp7KsVb&6xP6fiCWI;*PSRCdXm^Lv
zGRlOKyS(f}dHQ~wcdzj7I&sy=I?ROFamFz!CMa;gB)3mj?z)<SYuQH8{fb-zHV#dc
zm+OWNcehL9MV@?U`?TBZi=Pn^@jl>u3pT=+mTJ$}5AA9fS%E*yw{3@DpKcg{wm5;W
zqxp^^=g?!I>|FWstdir2v-FL;WDO&(8T~2glDaj#i|pUlpv!~PmDeYmmri4^ot>M#
zobT?=RnSr4KItJdhghpmcWHfpIY?59A}7ic`6a6p7d-#&A8Zpm!G=EbCP#0rM{FeK
zgDfAtlxUo)cTQW{eS})i`YKkxc+paJw>5&*U1IG~AOT}I;rrsVbT{(J?Z;`4hJ<OH
z3@~2LGb}|H;IYu{sh1kU5{?`7uTHl0PbFH-kAVf&Y743(!(zL;IQw08x7QF<N26f@
zJ|^ANmSNC%9y!M}N!0y^^dRmw0y)nFCk`)}9Nas`bC4rn(=SMmd2Q(VF1_XG^;y}g
zr7rWx7CODzs*jbfO$V$t-C}}3?%!*{OOG45X_Y>}_S%qOZnd9pM1s7DPW8&ZLQH(+
z?M2IS?)=dBFQ=HYg6rG4gK@<dC~Hk-qjx2fhnP&$!p|2eXm-!PagKn!Ac$L2m7~;u
z72(Kx<4Cea-_3*no^t+wtbxIr_d>F|XR}MGlqDYX&uRk`xLpDFo-$KHbbdZ(%sF23
z(o9tmL2|jm_s#GaFAHLey@hjiF&>qdOm+!kSLac4sEG97%Drj!itmjq6!>EKiT{vB
zx>=z?Z|ojqVq6@7_k>Au)>F88AoUquCM@rzD&KY6w5nH?Znsz#&lOxVJHs!YJn(wR
z)<|Lvukj4G{9W`CurRsY^%B1M0!blUTc<M;W)7pQlB1)~l8%zf2hNO0U_;PrQ`(GJ
z=~*YWe6GPfn$aGJ5ln(&HjhICD3wjXrtQkj0K>&n_n7$v_U`*oq)2dCF5=#)R9=S(
z=8&a5Un+dhHB_N#czbiI3Sz|ieDe7-u-h_mxb6lWJJnz>cgheTs8+^IpQ|7+6x1=q
zzC{hzW5oH@hRy0DR+B0GpC2n`rc2C6>@J*wsJb~+CKzl3xVruM34^+R_*ASr52s7E
zQZdD_VQ@NfAFJ1?bcPsYzQU{8Z7C`;XoS>BQZT7Z{H$Z%`^HltfbAX6s?~pW16(kh
zvsUSDEjFKUSxo6U`56s~8V~aLTKr9f=bM9Rcz6@4_oxplb!?a6JP~zU9pqN0iVKs%
zI?1Mx1-dhyZg1~*KS$2<(wj#|1bl!1&LVC7%rk!L$9plCb>LgnE|*6ucK%8>;9(qZ
zaI;C!N}yo5thlE4u5q$*jl3&+3A#qK7yv860kQ$K;@;jVbjVds+d^SjXlOWDN7I)%
z(%qMOBl5QTVC@`4<`70fS>8Htzn|%MyZi*u<!C)k+a{)6|Be756QDfy)f=O_<GnWW
z9L;TYX<!EU!lA=0X}#<|Z=l|45|APOO1kPou9>(BMCA3Zaw6{G9JH`Vw>V=xd<NHY
zOp0A?m`2<o>iYUDCYmu6<X+CY;M;t-pL;mvVn%qVv3!eFF4TH*f*c1p4<T-T8?xcF
zG-FnTyzvs(gBZfAU*V1sv$KgKX}h9JzbMb5i`Y8&R<>8j(};bHE4Ub0K1R77IswP`
zkOZJaUjqp>y_pioR5Q4$@#cGmU7U4#I&+HPM%?q0@qqvwZuZIwjmo>l-$zsY=*%~k
zxiXcA@xPfM(?6k!LzU$~x>_cvNn|pqqE(8W$ndkhTEp)A$r+!;Y5b7?o#Uo_E0ZA&
z?;GDTXQjs{_e5Y-+2)=H0Z>*W>!2g<*yREj^1wYS*<_YF8c*=~o@a6_^E-W$A<@OZ
ziVcr4e*m}YlK<4gMJd=<>${EY#$bOs%G1jtxR966$&7GkCIMJ$veVc;vsrtE!|PC&
zSy{CFSk!D!2nTUx_)53NwxFuHs+oZLvdGfDgml2*&2nUB>5k3DW=Korh=k(u;X(M;
zyx#gTz~8wbRjWCHGl1E?(mrCC(>bI33?RvZEp9p=jlJfX7j!>h%}<@?Md-+;?#~%U
z6NPNTGF6x5F0Nbx2WwQtY8)^=$~x&tO1f_OD5`$^rF(UueK{<kwmbqP`qh;t5JM_4
z!-9(>VT&HBT!DA%IWw?}ZI9eD3>)KLq!LUH+e=zCJ76U<QomIukQjqSe|)$=O39(>
zP@c$2ACq}kKR<WsUhN2>N`P(*DWp{&b8}Du02b!zUFcyE-yj>Ve`L^<G>L5ppncMp
z-G(M+mJK|X@+6P8*KhT>Y~^5yUycMlLT}i`clWe`>JXZ2WwV+d)-#E-soohyrPs^b
z|JpWmwSmX0Zv3F?|L)ajV{?=T9<O`P<7PxJ@XU+ahH2*i@!a()&}24j5MbWqEm*qQ
zeo^q@AH#!B`YP^w3yfE5>*gBH-^DJcOm*vJ+UxZ3)<3$#8Hyvp)5m(Kh-~u!oZA;2
zdjKeNBWnjI$CGpjw-7R~;of&d$+kJ4Q=Ig?rmS;+lTJ9I3U;6<#)7&W-cO!ksd~TM
z9y-Vq`Iwssg9synFHqupweSRJvWF6b_~BzA$8t+uuZu;GRPl(wQtjfTfJet*ee0ta
zD~yo{kEE_*AhOI!WXz0xrxRfFwYfM#!&XQqna>^4)4gp*JxWZEyt_TTOIZX4tp#dq
zX<=fJJ5W#~rH%}6=nnD!BAFrICTmkkhYSqI{8gkZS=0FgTnWmmx;ir%FtOo{(Ai>$
zKWecCdZ;cfm8q=4E`=zp42Zgq?VR|6DNa7saFvj{WvIGlg5}Ai;=kZtG8j%!Ef;l3
z)7=U&yIY2x{~UPMHtrV({EeUbkt1~ghL)i0BL9jKd*`4&p4D2G@c;#niw<>4xtTH^
zL|ahuEK$5crwCqI5_fcqp|2Ywv6rY?zWbJd47>{i`Z0(eTD1beSHd$Z+SB7e)eNVq
zl_dr;TDqa#2Xr;KJi1{ix;;n-FWo_qm!)!}+)<a?CT$A0$(O+yISM+LK^{&$?$TX=
zURby3%v=|B1isl?mAdfC8KmPj&WPnO;(YiwHHu*~)kF5dzGH5&rD@Zf!+b~Ga_`)Q
z$@3t`_i9X)Yg7yqE7LksgR8ivkABQVHPZ$d^Zh#7+7q>J6$lt>_Mm(CIP~He?<lyk
z6H9K<U2ZP>4+mBi?fGq^x>Dswt6YpgfF&-MnEdEWFYEIo%7VnF9Zq`#&q`ab@(7-t
z=^H;IER9~Q+%6dUa_q?X%u+wY_@)J;+}vlgl0jP=UgldE^X}4gh&t(Aebs*Mcs8`w
zwL|Qcgv>HNJ~=COlVl#>+=LUiKb$uy@dAA@Zm7XNmhWIR6fFu_Jegfh6T0X4Sj#4c
zXLm7B?GOsOj<e@sV{P%zy=*|YVZ$~iMkGTIh~_ZzFBV-?2d^1#gsGH9@e)r*B>pY{
zKR+0|yeS^C>p|ACyr;P8<~#S%s+TB`q&UT`I}wFGldw6M5GLsC#=3O+^TE5Or@ut>
zG{I=ITO}3wv6zZK+r^l!{r7*d00!do4`YfcWw6VEAd!39`I6teWCtsWzYQL{DMTgJ
z$1vg3WmtsdajfP-4;|^xk^HpJ`gil@6#@Z3!V90o>)rsi4lN9OcAnOB-o48+<b`Z{
z{p{w@cf0$NU?f+vsqFBpNkIFEIM;f&FRd#L0Giz8+rMUU{&D+@O&h@KHHqby)sgbf
zSeYk}+3?H-U!7R}`^*yJzIXK+qpoKE(`ufm2GEkl;orS{4gFzi^cFqtv*m87njA@b
zy##tf&l9{`KWB?wbSMbd+e+-S(R`l$ZM?T0lhB`T6SJ6Iwa$;f6!n3cLebIB5(Pd2
zf_-s#-x@cO8VZX33rQv#!Fez3Vl(-)6`g-P=u3?>;(MO=$5C!4t>W4H6C_6k^shE(
z4YLDtfs+4W)f*b_AAcnO%t<Hne828NikAU3b<B7aQj)qxK-Ou;xEm-i?!a`zC7aWq
z^Ygg36-Ek7VyH|<+y)zU6Fk^ZdQRj$TJv)YM4hv;4y;ey%J$zfrEW;61{nE^^^Ny=
z@68rsruqFS>d~o-fR&T+tW)_t`4uIxXSZPd0bv#Z9v*BD(y;@dy|W_fT5}8^rQ6$U
zSefxQ`6AgZbQA#|u3{-tcK<LR;a{4Ph#xyB4SA2KAP1t)Zm3_$-MIZ(MxX6!f8LtV
z;O#!e&d>zLbA2TT)}r%v5M5n4z|O?w;RP94+gx{mE=XtLwqbQ!44e~WqSNK)qZ7y<
zM0t;3)YCm;c*x6IKAXoNXx`WT@=AuLZY-Rh`xQC)Yc`lBED(=$K@0#nqt;?XuCc!}
zuCrb+c%`{b>#El~TYykOGv;<{t7XuRX~AXAUhGS=3y_t!vt>BIOYH+Xj(3pKHGfUJ
zzV~&0BQ~J!Bu-b8T070L>=*Uhyo=G8H}c8VcU+ZeU%Er>s@Ch#dC(M!AunUpb&Vv)
zayvHn&F7JmP<}D(T6^*O!WnUC^25@L3l$r_GC_J^q_>gZpDUnL^>?aY($0fPDw7SS
zTPb@O7E7To9~t4o#wbk#FpC`{hOW$hc;_Du`Pxj+nMD+E+Razv8&+D*SIT+l##W6c
z>59-XKNdYH7R&|yqwPs-0?C)2nY$L)*lByElB^%Cl|2y0TiLSBT<blmu~UWGY#1~8
zob{J$D?AgHN_p_<;*pV~Cv(}PRXG3PlhblYdQCFJz%&d1GBwUJ9})#D5sdC_RD7X0
zNwh@t5Nd{*3&7wM|A@FXdKNG`xvBnU0ALbtK?nm6nB0|ePc}aNQ7~POMXR~@6e~{K
zxzmR4VPDo@8m`#6=9_p8SKqp227l3t1WqlAiGF|ckggs<Bh@erpVmv~l(T8Nxi<-W
zj;hou^pK*Fd+z^S)!}C4NK53nh2lW<d!y`SW!_tYRl}sh!|-(Pn}VYE^5=g-Ih7K=
zxm|s?Kp7_8mhTnmsq+oC<kP!QOd>?@c9Wh!H$rMHhUNr@5x<Gv_sfvyHq-HWv`vik
z_trA-c}~#bntlw%KO|mOzFM*%FV-x`(s!Gh+C~bRc0Tk(&HA_VS0pUCYLKH1W9X~-
z2W+c<YX$HeY)1$vTDp2(G+$UOrCqFS4K@S0k9go~q~Vj!H?Lfnwamt;y*NrF<R0o{
zC4P5<Z!v*T9<w*A>DyC)nD<j!r4}!r;^Vq2UO7eFK4xxcx*nE?4a@FaxFRpkGTOI!
z17gI_UJo^(0cfj2)~(}jmDC33RYp5Tqov8iKZw)$x68c~*lAUk@gp<(6Yo|L+D}d|
z+q+i&rcWFS`PS3P(Ym>64bemO-XQ1Pb|JllGe)F55wiS`sUYyY<zt^j9*sP2!MBj2
zWqQK1V3jd$9>|RTn4$Wa1VKWl_cvbG&;KwFSnX$6fwlzZvveGY(6o-RDIT|1z(h+d
zc%G2hDxVI51~2xmJ}_k<o5r0vn;7Zt--%<(^$Jho1scP6Jr1a?+}FOj<<2xmtq3Nr
zr&C>q4PIVZy<Mt*t&qUVKvUA9y_2fX<v0YD`b#CUW8>yF`j_qBv)6Iuereq%a7O#z
z%kKXQR{W3CnOf=o$mX6pYiYu|&XD^4g}e{1gI0szuz{68k2&Ixx`@NpNa03uAk}7A
zHokmgQWv(WxfbjypOn|_7}BSg@e?bjfZNd6u~VBrIbWiM*W}{mwt8vKBzqJp;*`oG
zr#HE^B$_Us^&v&Vd*{vJi&8&Rk3;oKE}6<mdxKKlX*||5&3R16o9t{-KOsB}S~TwF
zyIKZ<M_9O6QDiLYofhZ^#^wNr!|c3##`lwZ**GfV4@YYFkW~tnwT1EXjEt*XFmnXt
z*x1Si2>#Nu!AKD5;PgIMRORjK-Rc>`-DwPY{?R9opJc@Rc~&K?Gqa-EtrH+YujEaI
zG4KH+H;fp6eGoKhe%EOu#ps6TQZ$@IvS&xwebgnrh?GsG_}M|>q{EZ$J`{pYwMV&b
zOpD$N{aJ>io*OO;;LzfxdaAO(JSHOoS>ar^1SBtMi7Ha((#kVeg3pD`0_b@2oE>7-
zge-DzUwgLtpf@~lGXJl6O1I+2l?kVvs17k5$;~SHqHaV-m2t#$Fri&&`<jIjoSV#`
zOu$Ze-q;9X>R{tiV|x9-7Tex}HbR+coy{qm4-!_{>ex<3=truX49)vEkw-*rMGM_P
ztpxwvmuR0Rn)rTtOERDQ(RP=VU1xMLW<=t;C^Q0n`V8TvoX9I9-6UXNpW<{J9r-Kq
zS>+HEef!JR8lhRDFGIVVj(g=uSKD|N?HY<n+ziNT2e+ZL-m=d#-{RrRBy5HGloG*Y
z{3{|}3?gwmgTm8&EY&(0Quz8)$kSq;JjTbEP;6he7?_ZfLBz3WXg@EPHX%Pb{>j5@
z3y%zGf!R?5XYEP>Q;swmx7}IHvMKkrj6pvsbxsp=&}Wr%w#+F2$Yi-ap?`_1-}5((
zYD>bQgSdrS(C}cF<`F-S4|F6AZ_9uJGBuKBhgWStefsWzJZ0vC2=k-|P>I;vaK8Hj
z0X$jA;0N7QqK_gfzzJr*X&5>T!<*uP=IVN}(ZB6wiG`AvZP?CU0~23-Bm#y-u2X&<
zT?FINCNS&rmhE30b@0B#l?rM1$0|?vIVry$i{OCVJLKl}Eo~ZH-0PWcAJMxb_k@$s
z=iLu6s2@JQOdM(5!n%QJ%p`Bl=(frdh~I8?pcwKs=|^!tq_}$x_KZeQXBtBTzgr?C
zW=hppI6pe6k6Oh6j>BFJ)TJle!hltZkEMts582}ZD`%tT3jhL7oP01`j!d9zo3H5l
zIG#U(?GNUCkzR1&Bb%$)r;gX#N=|@%U1JaP$A$$Ai^pZjd{-zn^yqgC<h0s}@IdAR
zD|JF=%fiZlf|!=850zIEq*Z2GrWQD<$EO6IIY#NOiAMNj%*+vD$Q%-`ckF+(mVqW?
zN<QBoTk{FBQ@^KjmKh>sezx$vsw{66eUTM`dpLF>IjQ>m+AN@aYp;;N{6Xh%>UFT#
z=yglTUMn2?2~Z$Hs2OnLd$Cx!d}oPc$C_U)^xA%JTzCr`a^T}K15BuzMLK;jGBHVO
z<A(EF7JB!uuMme3-v_hoczSlh=0=nd{ijIpg#2{6*JsVG9-Y_zv$Y>x607R@IRY-h
z6F!kWwEH$4w|oB%t03un{qDh&X8ix8@`2vn|Eo7V&1|J@OC<1WzFCW);u3CKtH3w@
zCM+zdh?WZ#dFMpmVWHn;RloF&BiI7(NJ3ycjTR@@N#=dYbo3B$*P5Qo5YhdGa%Fc1
zBd+4#q|u>;<Zj0-hAg|axxIB)R3zUQUr<GpwhR;)8xjTbxqQN%Ncm{I@T4}A0BerW
z_7_xnspYLnv(SBLAb@lz#dk6vV+C^n^P|&f9=CnQbGO}|c#%;CT~op^Wd((&ykD?P
zu&%Y{PJ7i6SP#@~In~myveQLu_=b}v6G0U6iwHAC6A6$X(>g{t5JMT?^UkkV^7Sj~
zY^Sh7n1Q`}KVXEORg&4j8!l@;6FPPVlkOdv@qC!pnnPf(Jl>iz%}W;$UKec`bpV+a
z$tBn64BWuQPG!8|<&a>~X$&C~&Op9MR^%QOAYfzG^?TnqVZ6wsYSD>lekZ4=*MVUY
z8eV-g;?IR3nd$jf>2r0mY2bTzi?#rwF(n2vd`5H6Is;S&%|<RWz-kjnnbvl`vsn@N
zY}$5h2l5pa6~auem9(4LJ=Nd$TL&I;Fa2uJOj!?~!_TDt5P%0Un7@8$7#i$@?0L3o
z6AqS|Jznnt+31EXa9v6XdOIV$FnO|>T39ZPCG}rV444k@4T@0j1@3lxQBMM5A&`<`
z2jF{6fMzpQ_&y;!LSn9K@aKda?0)z1`N9lyiM(<dYHBG$vr{g(^sFH1FHwB`^^f_@
zQcqu8J66D$7{7FpkEOmK3Ap}dE@mcsTvX8qqClywJUmz!8`Mk@wOyjovpZq&{+h`T
zey^Yd^-#qtA9lb`LIm^=e9KBLMZ`I`P(J;d+sl$1>sH)l;J6m>c@)`DGALf7HJw%5
zew(uDLc2b<XK1`edA==7DLfydc-qr;WKt???(#s^X6m<_lJOLE^WDKb(QP#(Lf>Jj
zNJeDK{wBd_$3~n(<3&qp>p>9xZuZb}!s#lOX#$tg%l8H_gP?0)yG!nZ--pk&eYBZN
zTxQPNW|)VzbQ@eL`C<}`d}ItMMfk0Q*_fup-{MMKyN-52oi6n32?6OHIPJs`O@KV=
zKTwY{OD9Ug<kznl5O=Ec*OB;pP|qcP8ScK=xcE<kfxE7bEE;pzs~(lKJK?`c(bZ4C
za2%wv-8QR$NBHCOZurAi!9~}~o6Cu_kQT@F-1dNT@mkB#sm2TRNmm_L03^<u9>U-_
z^U`f%uXKODx;F3n)^%<>%CVWyk~Bm-*W@*tV9R0RTux!T9c_F>uZaYO(A;*1Jbdi@
zcHDG(Y(0-4yDvsGVj%X@vI}>LIJD-h<>G+guQ|V?N9mG!zJ03kX9pjJcxFcIbl>M?
zOzYc2iwzI#Sj+w3PF@iNJ`yJ&8pzvLyS_5PrSGFFSN_-n0Z1V}r@w5X`V7S*qFh@8
zTc_gOy%{H}80BW959mbBatU52fN>nA?xq`7=L#(vB?4b+OIJScSdQ%U_6%5cx8qc~
z5T+zR{g)Bf{NAH(smm+b{vVdWZO{Mjs#w$TaDgo{4};sb!V+Bkj@{5+tl%q&CIuvz
zYKcQpkWsPpICQfp8&Cdx&2#gs`c<s8Qfi~!Uwh9_3djeh8qu`_Dnmi|D^QF5$)Z{y
zHWi&XAgEXzeP!-)!g*zJMK<KqC_`pHX&c`NoKJCb;Ho}aM|SSLA9hq0Ruz^Hwc7T7
zW&d!_u%?*AF2inEqsuCAQ6tEx6tTj_vJ3OXaBG9!uOy83fW15Q<3<%axA{6Jv)Y&L
z2&z${$cR5lms!TIX@Hrs+S<&)WiTG{m|>UWLshS|cOX7_{5^Cpq8Zovfl?<ZBme3p
zE)j-g+be(}X_^tigCclnp^PH<-NmUtNavzNHBj>%Jdba+)-B<+d}&TCA0<o;hf_}k
zyKVP?V3s3ZXOwCfRgdKRgu1357|Ig2DH$u4q=)M&S({#9uXox?v7^J1<2&E3Dv5<*
zyH^n1+D!ght>`3r#xIY{_W4zcKEqylmmqW_<L7M+`L0!%myq^Euute>w{GxfAtjfI
zKZsdsq@|hw3^IZ=v*D9nxX;7@kk|$32CG!J_{KZk1fe4tvPGRh=#d`G{00x!$qSWZ
zKs+g2423(Ek<Eaq4E4-UIJAp?N_?ry0Wc!^phhwPWDKVjcFDk;nItNCvchrgD^<zQ
zY1jm>Z!ZC=E;xfaJKrSom<6%xl(l^fz?Ad}nYifCKgLtCnbrY!cdJXnmYXlc>4BI8
z4MEtrlCPA<>Ug;slQ6KiH6RCo2HJ~MJ7zyw%=Maq-eUd5+sJSGghPH-jPZnK!Bioe
zw9RW3HHlap#lynypV#fOyC&xA$^v`SnvB%A`|rHDelswj1~6i(Qwi8Vt2$*uB#fMo
zjUtmwjc>j_a#o#W$P9P{WeulFeGwr^_J~I^N7u3=kuf_{C{N;~m*J%SXD@r}SPS1L
zIwE>9SQ6x8{Py{N&a8B4!%jc_U`~!q5>A=HXpI8D<7Ze8m3h47_z$h#9ifloGwq{5
z2rjo;f=EJJSdHGjEe4${9T4Qd%cw{;&}BDXL1CE>U30`Lr!=r4u29(QKe3#=UYac)
z9#iVs9r|a{v&gauA(|Galjwgfc9~HnRvehvJ6WKS(^H(-nm(yXf47-nNPq~V;CaRO
z9!xN&nRPhQEL}5ZY<~uQ3->&;@pYgy&4#V-=GiZ9_H0WAEz(wbY5T(g*`&{)`QV$5
zuTe#_d)>}6;aaz6)cqbwg+NhE2c5<n_OkpaJzv|Cxnzbf7uMeTzC&6SP7~ca2x+7A
zmWT(srZEDF$D8}(hU*l7Mt6N8Op4Y8Ouu&w%U*msF$!mY>1>RkTEPUFV<CN+-GCfg
zYmGSB712-IhTi#MV&~dkIZMZ?irxN#isRDou#y{1YIEA9Bd<oA_1*&q`C9_T<;{Oz
zK-c#+{tGz)$)5jo%w*n&%Ys$(4rkdOGh+}my3BhOXo(q?lxn=f`)aHcCXv{vvXtDc
za$v2d{&amk$6Fd_kE96e`(g>DDagC^6|ky|+UM=W>O6o~XsZ;*8kLBb=S-M|VwKYk
z>N1@7|I<Gvb1HJ+vHpW(h^+A~pufcj?#5WyeE(wMR8NXK0DIF>-srKfP2nC8VB)fK
z{#z~c3pF4r6U|{;Ze$#RyKxyCh|p$7)OPfewtrxQ)ex%+#kE$Td4lK{m4tWQsV~s5
zA{r8L<z7bSf`M5)GF@G5o$R|aXrjD_`PAR|ees9Qj5nyyRiY6^4!;sB5hLk`ey<VO
zWW2-r-fCO<@VPT=rg2<_s^%wjqx4<FZ9fJDsZRZiuZ+PYC|i!1OkeBDwEY-&c#scb
zHT}=eu8~B@IwW1fwDR1aLKws2TO80?b_%p0CPV70F%?4mA!e5^+-<jOtB+rsr1(@x
zL+O=w&c<q9(a?4F>U(3mXcy^>VWt8e&^RAF|0nYRFMZ{vEWW*Vu!9NuN0LWZ{|s|h
z9nNJ(WSR}X-R=MfQv3wi5J4R7WZ574lFSFXg0A2$dB#9Q*%mRJ%65tvaxnwgMb4C(
z-yYp{66VkpmJO#T89XkF{Ubi#4D~1g_%(&u_>mm5gF=3mA4>t(iGkv@rK-7|xXh|N
zFRzA9%=N;WM=C1#Cx<;^)-4x+mRw_(aR4Ds33bo9Cg1?@FL8G$<2s;RfdiA`;71D^
z$Kg!J4=Do_g@*~kux@x6q<n`%RrIy}Rthp?qxH^^zV@Pt@ehB>{`tU&WP;>*+Ac}|
z@7c|6D)XtGxb_sU^PK@2k6erK0p@`P;4^OKFC#q)Wo-)*cTf#b10n_tsSZlm=Gpsv
zHh}o1=&n=I`Qcj-oU>u&RXrM66;|1#iotJzdz@Gbu$9_iWFM~YD}d}50Ruvs*P0Xh
z24ysg7~9XU78AF&s&*Fg)8So&h*#_8Wu`8p^y_y^8nLK+LY(5iM2s<th#thzltfFC
z{uutHly(*l^);i$Sim^3zQ)Ee1xcJ%r2vK?|M{F8`3ynPMdD!Mkj)<Aea?sn7uZj#
zpVB2Lw%mG|)+tu<)XHBlUzW9tGAxf1oRWSiF)3~4<Z6nHpN;Xiwyt?!3bpw2o;X0b
zoOR6aJeFm-k3-xcf;$}7w6w7$8+rr%`tH{g8(-j46ngdRvIwi3{WSbjf}%jxAL!WD
z7+tT1Dq%={(Cq#Q;MLn3T6Bo&Rv!0}FZ;ClX?y$%)y$bH_`I|UHAmIHoAhXe;IsPb
zg#%J#h9FB)6&as6jaVEl2(2P$Uaql$e#_ZYKs(^t0+ESX7k=oz_{a2m1e5ncR^qqh
zK;AIl+>6x=HA@@YLQUZhv@kJ_c`lf_I!tBXul}N%+MeFMH!@*!LRDgzyQwb4>12BT
z5O;kceV@yYIP)Vn#qT#Alh;^dL3!7||4kk3$pDX?0~vbB{~FBxhrIOPwhI7P19)sZ
z*z1fATJwRo&i7X_ZVFwBprPmw^buHg&neyW_u^ZYIpb*Xz8m`JKPk|mmwviN`bvYL
zu5uq0q0gmc^jwm2#7Bx9x(qla0C|aCaE6P~(`A!HX4QOdZRiBOraWE~Z)rA|p9t0h
z9|^U=m*4MXk0;p1*W1(#bnoMhY+D1=r}Z^{m!dxw!e?}tq^~u;N9x|$z8&jPx1T9$
zZ4?NllA?N?g&EZ5gyBVUn;Bh$>3a4qpN`^(NMOCT6(`6J)kpv6@ql#A^m{|kF3hm|
zkm|tGPsT4KhDxV|la1P5g|ao(bm8CBzTta$a_Me7z$Xy;!isk?+Kq(U5p}jrq|ga2
z%e|@<51QW#t=`Tye!XZ*@XR#;6+HNx1o1eX6roGi8z}<Yo4=vde=FHF-S+;hz3$2^
zOc*1A1lxGK12ijB-Y&W8lo8X_Ps?oGu8&s(cZ7^i^8Q{6CCHZ=zRW5k>Y~>(%?77$
zDJ|Om91%MZCc254B~d%Ghq;PS%KIl^ig3u5P&v(2gNQ5$z28x+i&R?8v(?nR4~^kj
zGd9}mDGB%(Ok;)!;B$Hs+%@7gITX}zrCaBid2@SxXrFRTsMdehLkq`O)?sKU>rOz)
zyH??_9smWcRSwHbm>uTUxsJ+yE-}&3DRgZP(`E)J42x}SF-cXrO8h|uX-R%QG`l-;
zKtRxL43lb(TA#|Wk?nm+EKq!+4rEo=k;-CPzcrnBjIk#NKXe{-ksCdj33p>w;es6w
z<Qf+ZP$Y+<?@kZ>IqMkqz?6)^1W=9;ynW7z9;{uq-gCx{w~?!;Ulwd=+MVpkJ2B7g
zxXfuru^^wp;OqeRza@(~o~LBeq6{Hh@(%#Vn7AxT;>7y#^<4GtM)!}I2m3{uL?j{2
z*TaoxZf^Ev|CAP5a;V_XjYW8l^k?^HxAz0-5Is&CU(c0fn-Aw(*#Qvl$t7Mr+-@FL
zIlRa7D;p?YsZ0nP6~sQ0Z{(B3&<ZtS2@=T1HVN*ajm7i})P;E)tzD<5%j~L_dq^ax
z1Vr|$iEF~Od@oX;sF&DY8CwIolJk(;49@<Zt19(dDR!)&Ov^bawyBZNu?#xRgF3II
zvws6M)%hqII&wiB7Stl5<i4+jO{HO#cL!ZOpTSM_UNW33fsN)xYthFGFRP$F+-cD7
zLrqV~I4tIob_6o9XiQTma_f0QRsBDIz=ZVYeMy10ltYe<=G)`0>(>)eTJ*?U3G{{#
zjMpzN%qPQSef2by3p{ZcjuTK4<<P<il%=?jF6nK050SvG;%KlcNeABd2b;;_?1!-e
z49NJ~3&k$u%NjlC)<sEc0P+^29AlLnU;(X|o#ebl8D72to`XW7#ph0jtv&(XIq9cn
zq+*MiiDrCkz=L&vHoK8s;loc8dBDpYmk%Ps>%LkNcHLr=7R|;x9Tpbc=eyjmmF;aj
z%(ZA8u}(Yu7cS%vyMN_e=f%|iCk&ip9gz0gTUDPcJ*Cr>dM=L!)hvoa`dKVa-zGl`
zWaO#EvX)Xp`MxKa)GcSxJxHp1!ztDfImwbpZ$a#TNV0(Wb(}%>d77Y)9wRZCeOwdH
zcVT+|#*liw$~)WnChe2IbBymNIbWU+AQFTYClDJXl){RYye|*qAp)Taj{;36Zr|!<
z%A<SEa|lH@dUEwF;;|~&AcwJbqNG;izL&!VYC0+v|9nEc+!6LWT(H$ba=)&auPsVQ
z6|G@ONzmAtF5Yd^#DD-zG3>Yg(UtyjQr=Z8a7W`2e?ns#7|DQaAB8cEA6<kimquP#
z0CLG|mjg5k$RHyYcwM+~AY#}tM@=%#-<l$PWCJj{Bu+770T}V&O6&DO<A}w;gR%#o
z9w_Mpt7gaa{ZL_&n^{Vus`6D^n`ELCmM}d62=IV_bpITfMFK!9h)VJmuH869@^UR>
zCG-l>;c85M?I_ujWj8B{?)<Xkm$+q7bD5Fu+4*`NL$|`8H;BW`JOU>+C&Ki))^jgh
z1Z1-kYRdBzU(LcF3nxWFDy|CPf^yssU5#`Dacty%DQzi$w1mHg`%EAeNW@>7(u5}S
zxzv$=WAavgiVrpM#ob>EhSVUaiv7IH%i;UBGb3kf64)vhsQ?+Zk-d1~;_{E655ZBj
z#92F7!g4r;rFEO3jgmohkIJDbbM~OWu{n_r`4x;*Eus>%kHx_!tFtZFC$4zmTSEEz
z8@5z6a91BFDHV+fd!=6@L;!$YAfZ<ljoIbRMvSUCpj2@}O0<AhRcgPmA0)`Ob5lwE
zRzQlczYc505S?GDM_-vpl`LFQQzyT6J7#Rg8Ug#rxG4r^P@;j~_mqvu043zpq)x+f
zbW&jKb$7*YLYmvWe-Hz^wpo=Egx&{?&EW5iJh!fOO$JIwJHUCB&9{M$k=k<!z*R^E
z$l9)9L4tI!x^#Ykc0e&g&`A)6)I6x$hXiJGK5XzG8F?g5dy@^8RpddN1jp%=r33l9
zD|t-QF=B(_H#VQpXq3c1L&*Y_c`aPUvD0|9U94PUg1zXro^Df%v#N67ZPYiK^7H4&
zLLV5lG*c}1LH6(cnFM4h`MDbe>D|jL1BzkZfbiAn74ChppJVLp%VusNdC_#rkVp4X
zioM<KVBxKZev}iLA@3}h_9n}_m>%ID3p{*Ah`gm0;y6j!uYe1sKSXf(;as8?t<Ra$
zP=k>GH>Kc#BIS+uGaX6-b2T8At`Rhw#rN}R<@IU{?5uJ4%-Gh~4-V89_c7Yd<4W*i
znfB#**^G#8Y~Y?_&pQSl1}-b#Y72O4Xcy_z(&FvNJ$nrOe=D>Loa23mz>8%dWA5Xd
zf9?72Gv#qEFhpfPI9C2oD)L>~ef}+&%g^X`xxjBtH`-<fa4p!yRQ>vCG%VbZG4SJ4
zqgHnx=}KP2tv=J?hyfSa8h45pF9^Z=i<qi-_jR|$;Efxv*Fl~wsFSrNzirF??KDBX
z#YxZG{1^p=+*h6pO9>7t@iUes&fg5VO5SPqlWXdXejW3SO>J}^2(n{2=}9W)g-#I-
zJ!{mOwuUNJeEHI-AuZ>}lOO;Ie)SnIc=O@#hxck)a#O^<=eBbqhoD=lYlK?`pJy`m
z?&k&J460)cT_;?7J~&{N;%lSkrj>f`NCR5QI5+9hKkcIS#_qsEp#fyb3E&=(2do6t
zm%ZND90l`Yw^1{5WMCVLuYGl0T_~WO-F&v`=nwwpYA~I9M9du`*+GB$ou4!|m7T+&
z6`@~?<KU{ub>?GiXf2QFOI#a16#|l*z;lzd^TvK!s(Ci6wKDWdf`sVLjylrm!J-V}
zmNGNiU;{e-HZC5lB=w#j*uP@M0oey<=orNO7BgidX>9^A;V?5+LfG=>F*Ae&5lut3
zHNJ**OU-W`83ssCi)?@muqia+^D((0K$mjk^r@J9N_EUTEYLk&LU_EE4*N+r4c;}i
zL$-_E%%))o18apovBLG30P*O!pL<1<^&>#mc=d++hw2%YAt8CUPB0u(U-Ej7FQ0VR
z$bHtr8GSy}C>)lYRx~8=hY79U3WR#=JhzmnR<40|Nm5=VZ2(x~XL^iDp<+UKih1_k
z$h2w(l!RILbQvi1Wqut*;FS0=QRCjlWeGLmbT>D72{AS1I{iE1@zT7o*r2f{00v07
z2mH?0KL$9CJ)dg59#Zg*T%KpI+4K70BX-(D2m7bPP<bfLeYdz)u|q?}Nl&kc($isk
zY-sAR;aZ{qs&4T9FFFr^cIb-(>Ee5FLO&Hi`4vScH@E`M>hB=aj!!wIt$?76LUB?N
z{KLo*4N0g0o;LJ|($?YVAA(C1VOHAp|GG-s%y*~l#<MI2GH3`FfYtjc@69<ZpcjiN
zQ^6hEbRdC^%OS#hpm_!kd8w4be6cvMr_Mjn9JgCiFS{%{!CN)%J2f@aPv>&S9TRd2
zs7zzJN|Ki=uRVdP!!H6A6XM4XAXC71RW!>liB~dot8Lm2A1fW%EjeUv-3Dv$vW>MJ
zwhunG*@f7<eqVr&h(D1uF6R-w%R1B$T%5Ek)s-ERK&1fhl+EX*+r+phAbUgg$g5B;
zNqpcSv2R5mJmhvoMNDi)1z(#(7){x|d^(NEp22AAjC`&vWVzSXu*z$Cb&H3ifLeK$
zN6?mFJ>Scl?%mQpQ1*n?u*A3@oNP!>A-}|+BlGY*S_54^9r>JVe@0)j?_Zr|{C=1@
zOS+`}k7q{C{h7fubzyVIMv4){L0zj=!>sRi@D3*@%2H;C7!+H8^O84i#C0e(c5(cA
zJ{Qk&KOVFb7qt;<5Y0qBn)YnJTygC5YZujK_42ghEB~xd$pb?}oWAaC7zstjM+d2T
zxw6L(wsmU1lDr*dPi*k-qVnja!t1ivZaYu;6u9wKJ?Y)pzVFDvsG<pv>wG4q>5PM_
zlMC4=B>bP$<eXVILHp%gN(+xZqN%4YUo~n5Qwugmiz?bPF;cKCw>A9ONz=N7s)ve-
zVy)@PxQTj++QLmAr%C&@`J3zDq+t7C-|+n+!U(PRvtPxgqsI8ms1WO@E7kW!*yPUx
z;dgu;K+zqCACLc$4wWSJV25OvDTbptfnLCc4)}2th0pDk6$lIK0hVTTu`{qZYR}#|
z{zkJ4m-rSQz=P7kPbZltw^6rMp3dh6>4h$?(c4ep`jXfVrtz&yMb+T?43a?sB6$0>
zt1&>?38D1W-U5$QyXmA?ADOJTg=!zY`=$1L<_#F{mL=YRgzhYn!_D^iBafpc%~}T0
zueV`{0e(wbUCTZKd<s1P%9#*&R{uB6<pcWA_s+#-EaeMOnsSXg-%WKuxGYylNU_(z
z6D`j)>KsD8{SkP9JK<MXG%SYT`vHOT$|g7eG}?g#50<r+6)8g|fto_Ly?3LtW&yq!
zhM_ogXY<m@*ReA=IBK8U{4niHJEa!#C?(*f0JS0Da|mg1y>@4(jh~w*4Mqrd-dx&|
zfBdBd%sb<WTbn^Qz%ARrI0Z}Ij9!@*0o8iLbme>r9eB`}G2F*k+xN}G_CUYQc7FOn
z30I=cER#)LwZJK*nr+GFp`6`JofvhXOo-z?V`LrNKEtha_W$<qkFCfFe=fMpr1D;j
zNb)B;yx#V_PW3P4;?JH_q%_w&m9nMRXi#{S_TXwQRFyHo(xa9aIWe-)F7c6D`>u!f
z3Gd|x-8y-?Vjo?ojipzM79EeWtQA{R52lpv)y6uHIuM<+>HjsBy;<IK4caf#uAq86
za64D)z_ge}&$_hUa<>Yy*m2o0gGWp$oo&9z!ARP78)<$5TkZD8C}*+>y0%KAeeBLu
zyXfBN4IHr2M(zzvxBF7IDN777FJUzLRIE3S{}fs@_!!EyB7bPoPa~(R-kNQX*H>Qa
z*R~vab_AV|0}H7N$FVHO3yG;pyiQpwc3-Ovd4L;RMQ3MTvlRfNi{I(d1}n9oK4lSj
zA-6M{YZdZ`4RX6aew5^2f%ek*b_Q+ooeHdc>#;abn)2^k#W2+kgZ@<NBd@OKf3XXF
z9HMPG{F4QI0aH^yV`0+%!B1af*o<=SG4Rm)d?02uoDza;;g_HmS4fxVb~93H4*xH;
zBmg)S7C})>-~I=*<^QXg_;>sQ9wp#xxKDv^E7q}bT3=G1fLw+ChvqVBBc)81-s%5C
z*jYzK`M2wS00AWpx&}qMyQD=Fq`SMjyCszF4y8nL7`i)zA*6=x9J-tH_@3X{>s@=V
zcb|V<tmQw?_nteh>vKInTUT)?HNd&H-dEe<v<;~iYOJjOr6CH<W-uunRWZnO4S?sU
z+sB#vX;D4<D*4vDTqTxGu((0{QPJ@>8T$urM#^T=$)IHV3xXq6XUX3jAzDjmH6I8{
zmtNOMzwJ+xB8>lYjTidlKuK+gnuYV;pzmz78&ajaVkkQ6I_Lh|3e{BIdJ~?conV@k
zJ#DM}Q4Oi4OrTZPaAqH4oTCrJAe}1u9E&MK`Fj-^2FaF+0xe5QX8=aYzRXOmWm*2-
z{DCMRMIg@eElTe5LE?|mMwR3-E=9QQ*jLe?<GSNX<Y&LNJHd&$q{!QG!jsp4+od9%
zVLX7#9Tj>>5rCuJE{kzqsXs+aLAn)*eR>2l3|J*X?S^BfeV_+hngIYnjxgjCEuBpI
z+UV<E+z^j4_(Q6(1C4L>*N83y@$qktr(eOlWZPyBe87eO^WBW_XTi;MiYar5wg}IZ
zRF=_EahV~+0G$tm=o2|MtQYjD7m0>Ak1YkOu)CLRb}!BP6IQLe4MfcR?p1J^m`F%X
zszgRG_W%i2xQv@(z;M$+<De<W#@HI1sM|7^K{y<nxq%SI%0`1Ql!`2scxEm4*$v3q
z3E{kV!?u_sv#|xkweH{!xr3KW{)ek(xPKQ*C_WG>g3TZ3mtfzO;430?|MtAStojTt
z%Qx<eo<%6GaN2t~TS_O{sXVC&PpDq0)I6uzP%LmP7sUQrQec+Bq+MG&P6i?lz<<0l
z!=YrEM$t&}4!HlEC7{~>o*xJRnYIJ!E@-`q;B+idT!*Y$6RZo`KA!ohNQK^>$Eayk
zB%j0bDSZJ?aIwp2i<z#0E1}q1-+A$2&Obm;4}4rZ{)&3^tcr(FMy!Pf@GWvZ-)hx!
z2RMvoO>X~?^$ctxgN7=w!3<+FX5i+>M=qJmp>`IXV^JH8sQw$F7O#PZt?F;v&0E>G
zCV<sKOn-zzXdP%wp6p|j^7f~hOAbFn%VPk9n1{=z2)%p*t+~NJRU^@4$Av1T3S*%Q
z)<3Q5GJ@UI7-wFDo5pm7Vka5@QkyH<k0vP?b$A^5z5@7$^ElB?1%%EgHgDD{Cr0Fg
zhU6~ab3MOZ^gjIbNSpIp1;NTi>hW+_oYO`0FJjrYd(ZYuY))2<O3_(eKgnv%_kse!
z43x{!>l5Jq_e2MlSW}<#YGNwzv7&(6QnsI)!D!(LZ2A>d?gfszZk`BPDybn<B#MeW
zyhbQ#9BW#)(Jk2wCg=LR;oLdeZ{%5wsoDqwK&L&VassdgXe_h{e_Sl0qxYl3r6+gG
z>Stk6k|+tK?bV+fuYS}z6$hQGT?G!`w;Vz?{c>;#pOfMoZRh>63O%_<CvKIipPS5c
z{fcIEePE`!J}$dBK9>JUd1vZA+2CrV!MR|1!5vWKQ{PFD-+1rhz9XP!#>#j<!I)S<
zCy(_JC9Q79eH14}pTKa9^q&gkaP`;Qu`)ehvHjmkp8sYEq2&DQuS*l~8)A$_MRnVs
zr9U1Zl}yN$4ojCTP<ohuiN5`WH}$t*fv3zyl?nW?WTT`fV`D7TH2;g4Y|jw8cDcAj
zk(E?@Q1+#q9*yS-esaA>Zqc4Pu*p)Rb8A_TS)x`4>fCP1U`3jjQh{chZBb-Sn_{b8
zy&`mHGtsNyRGNxhDnaLIP&Baczx)`h+%fazDpQG1o@F2<H%48(C>L)IFZJI4Vi-mA
z*PER+)C_k`r(xo^&z_=n%Rf=Ub6%EHQIV4$;ml2C-*RBs3^0oRNu>Bh5%2knA-Z^H
zoIx6%)5(f3l0~d0nGX(4hl>}8gWcWTM{mwjXj^feoY>4+v$$qa>|VMJtT8o<wd7o*
z3-Voo<CHt102vwpHA!QpQ+moN{As0Xq70*1@!4EvX^oN!Q4j`@nzq}{9X#h?uod8I
zVn}t%F#6^>six57oV^J8y&?KjLMF5a_Fgg4_Gshe2SwLkW-f@ays*KamInD^zGKeU
zUCgMJ(Hca&@Hn1hBEIVeGZ7ykhvF}_3E6?&Y=|gj1Av)h26+$h>bHkqeYcH$U3=!J
zP+2s(InUJ@U2l=WZ0m!DSWboYfW7lzhSuZq&w9J+%d7<yv~@NU_}%2NHo@Bo$UsnU
z?a)>`8r#dt#QSAH#3RCE@$~b6aDV9U`kq1lhkgYs5Uns1!RB*J+dYjO{;SvC^rAGB
zo0IDL%uw?YHv>A`J&^oNj4qYYcbJb&fRk-Z<{SmKlc}vuT33T*c-DSGeJPBh(wsb_
zkH~fo_q0A`Yd8yG16Tk6$P^(}EgV9SMzOCoYJPg$;|J<SlA{N;#t7g1MCn0lnBmnz
z?$KfzGPiYs2uDO{XeJ=KDL_VFUywf>$M}CFgjqa&D#N3Pl1^-l10hn0^lyg`B+w4Z
z@-D0oH@PA<1GIW8O?`*?;W_(ZL>f6lamNuJp8l`bSW&evdic^DXTWSC`l)n94sEQj
zQ4bmpku0Z5JvE{MdV*FumnFmF6q7$*x#pvPX8B{a&4bj&j(Moeq?PLYl@TgKMe{0$
zr^mLjQiY%IblAoHZ5F|CxF>JrP8hmTu$7H)MXZw8hZqWcq}Yv}`=!%xy%$;+g8MEF
ztKSB@UX3+{%_ag@uj77qsqGY$T@7Ww34eRmhePU>i&rs13|WHiICaydnpAyR4o3AY
zEws09o_m`dQf<^~+q)fd7wp%G22QMu;HD7jc{Olx^48{wG7<A0HeD`0eFV;k2@mF3
z<YRTL3$I3SNoj0n_Xwl?GtExGPHVC&ZjQ9KB+p6751j$$$4J|exTE%5d8;pKc#SN#
z&8R4a|JjS;?`_a0gY112w3dkRAYE;tB|XZEZ;a*f5@#|TYC*)KWfk=TAN)l;&ZFw)
z54Cw7*4JVN)b*pFn`#J)eojX3;7neFxhjv8&ASSa5i<qHZ~d|vwS+TwLq^1O(ID!h
zKwmmb(-r3kHf|mNj{EGui~a2n)oM*I!(~TVMO#j8GG55&c|3?}rqr_h7~%a#)@(4s
z01RV7C3X6+|LqDs^>_0-g?F;17ig=HtH8;EzhU|@;}^uKu(NU!e>gJmmWsJ}?Xi05
z5v9HntYyyl#S@la@Q06E4$b{%aR9P$hV+q6;7HANh|@y1sS=*H*y_s!m=(B$S6WQ3
ze0?ilrUirD$#FVeNrd|e;Sbs91IOWXookO_FU{0!T6&Cz+R{wQ1w{VG;6#s4N~5Z$
zd>`6nR8_V<6hDjqMQQWHEHg?qwU+FY(ra7(=c>dlQCjqe4A&Ubcyx3b71Pue4tXY<
z_&bVp&?&pvj5e)OO|$c{qfbeA0*iR+^ceOk;mowkff}ga1J^D9w*L`04QZ|vbVk&C
z^%v{qf&H@vaAe@T?;bV~5anYOb-FSX4&hldp`gaZkEH;8NAeK$M8ilg3-rJ0!)>R6
zjM|Tq*F=q^arQ;w5_5ES_`S={N}Vp(MFfaPgm?_0JJVmW!{bS`aU#CD($~@&0iqi6
zt@c#22>VUapOzP;rjRF>Bxj}w1>+bn!k7i11`YMPRHoWuUl{vtlV##=e`7T=5ssw_
zpm*EMxp%1K6_q+5G>~bR9?v0Bn5v3eovyBdADat*?Ff)QC<1cW1%L^Z0OSnB9vo!9
z&7*e%#Cgu%l|waGwZ2dqZ_o#7yNk~BZYxn{ZUy=f_6uX-@Q`3XjC=T>-jp7)$ei<3
z2?DjMT;y*khI!9UD|^s>PPnw!ML9-eJAxeZXpN&td6Nw>s3F3jMpGU$W=6Q;5m=W=
z4T^38AX_Vt%1P6V28MKicq~H3Ta@=`(UMdbfr}+-Wk7sgay?Tbkak@Xlq#$9!NR80
zpzp;z_yH>!)nkMEV>3FLLjY((%jasjF^)JzN)6i5ZQ^_QZE0_5ioWE0fHsT4JkwRp
z<JP|QqLIsfM!L~OsQnx^dD(<0Z((>hJkXP(!yx2!=Hfe#0)mPKShOO0PwV)ac4rzG
zdk4V3OMp`v&v`|%AHMccBmk`+>VmCfc4i_IYwL+ty@<a5CEsbJ|ChO*EC9s!`M}%2
zIeEkt@n^jgbC_}1rNq~L!87b^!r#5rhj&Ae*rmt7I$1+X<bt9LPyy)JHLYEQ^8<#L
z@##7A7ruuryh;?Ktd@ytv$d8~BiP<No$HD)o9j@s`f8_(wEGPpKf1QC#J+yz!?n|$
z`U~H=SvVm8ZcdNl)mt*AyQ6R%Za^t$3UUp*Uouo;=ax)n(PnAexgFk?my!zjU0_*7
z1&nyecT`fXh}NMOXTIm$)BRt*CIsnL0R;<p-aW?U&`*QUFB`+*yO|Gjac);Ct8mJf
z_QOnX?@)MOsBr1wcik>+EvQ!wnfvOem5b=?JvqvY@GkFuU`a=e!_3I2?FDvKsc*@n
zZAOp0SzinHPl;#>tJ{2RK4pnDMxKGT-Ck(l8_nKR%dJr~*(j{HNlfecCJklq7IpJu
zWqSOfcQV6s@at%IHub%^QQAU9zjo?6O3{1fHX!7_P^>?kMle>_64mxHoO-HU7dO5H
z&<Bw5JU%?Gohf(PRt>kYuP!)bBm{0{GN);#z3}bmJ*LfkYmUoDJ72>XsF5kmxrch+
zQtbqPB)Zr2fJ5a&<{rBLsc9E~b6*xt({J(rGso%(Be4(|8)cOHVmwi63j>0ZP*Kyb
z*+rCb%5s=!Yf9hZ8*?-M=uDP=^@UO+7jB>!9>HPhS@@3Aw@l{;$ab3KrhY=fy`RIQ
zT-2sfJhSez9t#4~i2AkZDY#9%_jXvm>euGhE*KY+=OgcAiGPz-eCcvYU{{FfuLjUB
zehxFSP^RIb=}4zHH3@6^#*<HWl&Ca+^&pIU@Smfk?(5_Q<#(fu6r<e*IFCQuSeC~A
z))Tn)Iq+HC1cQXw{4EVj9HE~cBk7t_-8E#*q!~6Kmk=cx!a`~aNSw*$`!U2Uu;H*}
z5fBfEuSx@1)Tj@v%a0{)(t3{6$xbMEH;SgA101QDbQ>p-AVYZ?w$7Gw{M^D!IJ0;L
z;>&_JkVk+qP@v!DhjWEO_at@$vezEk9>+7XN<)EI%k;xJwM0}AY?1MVIin!Kz}&Y`
zKP#82PBLkS3Z7ma44$DC1N}m1lr}6C|E6?l*p}J)6{a(YL>BWx9BiDaJeqhl3euj{
zaldn1fIyi#;2HV`ng*%|xCR=Vjs_!!jtXlL!H!erdO$8Jna-1+1IE#SVBQs$tf38^
ztZ{t!Gd`}X(+;ggy9M!ORip)c?P|9(VrL_`uQbNCnqy>tiDHYhT4lt>>U=D52Uk+&
zqqVaNux?juKcI?v$ML3#rP1+F@yPxZK=tOzqN(~QXdr+T!el63(36WdGAy@1O(USS
zPEn~`VI$Q;*Y`ON3ASk{Jl~y65ca*{TTXTJg;C7@ki;a!odq(8{~#es@bTVA>;bBq
z?F+O$>q^E42)8UV!NnKsbmZ>%jpWwV0FBMhX&gP|^O!76u11oumrd7NsY_KF(?1oJ
zvpsgxj;8#tuL&)G9gbgkoV)<;##D<lSf7pH4bFrO2cfVSe+uC{egN%uR~h5J=%>Bt
zcN^s(cw+)oHSNQC?OBUt2gaTrV`H^LYf+}7iM8~!8bCZ>i>jUwcy_fW&%l$gI%nVd
z8k>ac>D(5gWuas`F23S%Gg(E?Z%5MdyFLd*sT%Upi)>N(#Fd=!7=zsJe1q`Cp{ig4
zwVOVQ5w5_IDDlma1WlNZ+co929w+S3W=4;))-)pd1fGYBAjDvhWNI<maN^%tAAfUG
z3aOZXrH<A3`6g>|q;u-?VnJ{U>$}J1YP$snn~{M<oNl+h%C>js6R%#dx83cQ%wD>@
zU%KFNqkTRobonQutLydggERc`{Apc;V6kFLXsK4quln!dt=qSco7#2>?8bfX;WlM2
zuzw|^$*p4Yo#MmJejj3}nZeTOCCb~T(zPdsh|Bd0pPGqf@!FT`c%M(TjXvLJ61erc
z2qkM+o`+H`+UITAl(h&3!oL;cQwve~TEFg}JB*C1{5lM}O}C;T449U=eJKMigl!z$
z9>iQ-7FHu}=8x3RgdpM`_Z`73DF6>A6!@h8)~O;JF1}7;l{&5)l=t@Cs2wc+2mefi
z-U@%UK4Or2rT@ONLi)E=c<o<jhF$Q-#coE0Oyu?~R8P{k<#gK7c7<%}3DP)!B9$+G
z#Up=K#gBybGbZBC+-U64T}dCmZ$N~ZR(S<?rlL>AJ*i>E4u?%$<9^nDefkIAuS5YR
zmebQy&3c9uyJ=Q79a(|uB!?anh}d1*NRn0dqehN|sqH7zKNoa0O}@)5)`nu@(M2-T
zp5sUF>oICxR3yI*n=aq3>Jk89p$(DWpwK0^y(;k~iZuO<ohX4x7+Wu*W<EGzKayPS
z6LQHVxL4b0g4)0zpYqBp(R;4eR=4+K@b*u7v7?b?fg7ZG3uR?Kbc%c)@Ra#lHT@kD
z*+=}?Ed|(KC@#(o4867*2?+@iuo1vjOn>IAkqL?oh<oREKP-6YQY#v7a`1$XOEiI>
zAnzI?G};TcjR>x>o!>;Ai_{iz-met4!pZ0&!Mo`73wTC<Whkr7`*et7+6V48gC64d
z?Ob^+gCqxUeBi?F!N%S!f_0cb97WKjrUog}5=Eg3t&+CUiQ<d=P7zxSx5o6{7`TPP
zw>>|ga`Km|^NjQW#gJ?MU!BgiIHM7AZviOXsS?dP&NR^*RM`Z8!dYm5IEXnE2*}Y1
zJk#=CP>b}giog-d+r(mLcpoT&gCUCWX_?kQ(81tnTtnx^nWd$*wL2s_5pW<EhBVX+
zNp2u|?z;r~B?(eEHGvOYxD@ANCBe_Aun_1EOF6yHEYbws%LUD`$N^*+Lm!2AX>c@f
zd*7>Gas5gjdjR-i588F~Buti2^KF5gnDIfbd^2ARftj1qYeYrcZy=#SSBG5C4G#x{
zhs>haRRZN8<75NBvs^)Psf$Nq-A<hN;ka|KLPpvtUYSx#-~Q{bw4~L51ft1<^STdT
zDkRLz)QECT^&Fjtz~>hr2%)}H+S#__dyktS)YFaK4)wpS(w>Z{&80-sK$iRb%E9<{
z%e?nt%Sne6SjxT0O&^x%v4+k2K9X6#^)u&wmO2pZqixryiFDp?6SL&YtBI!Tsrm(%
zWaQm>zPJBVoT1d?A{~!0|F`nc{SPUPuDktI65v053Ppo$tj%mjd?ew_*j0$7N34dk
zwnyxdEuq6mPF{1?+CYn(_V&l38D<&AtTW%00a^;&43HoB!WP`&mU6N5|FHn(<jTkQ
zN@%k^g19%*%yZ%h^EiY;(d*XUl00qJhrWpMdAw(S2U^D_<5K{>z04!TU?eE@mVUm*
zWJU?`?dN5Z_v%D~{Mcnc|4<g-*@%cFzm)9u>&LoHT#NvC5ns29Aay8^Zob`wn0cyo
z{vwBaiuy++ARjSCoV@4m?YMmmu&>Lyd;_&f-#K_<v}UxnjyTqzRVt@&=}9`t^821&
zk1Tq-iaFA>Bv#&X;FVVXm`tetORbmz>~oYYoMptBI;*cgeR_7@0#Ln!agsaK?Lz^0
ziofWie=<hu!&Y0$Zpy0H2PV!B{_?~;HZp8!tSIwtTe>&5x~ES8O{kA(D*#w|zf{Zh
z16s^s-kZa@PT||O6#MGtrLv=+fa~sF>rkCh&k1v=JK^)W)9^*7xYo;uf2H5Vg}r4I
zv<5_Y7SrXy^F9dM6$ti?;3U6!)(bml0AbTrU{%Ag(rS9s(=C>w`|^1GCE8rAC9Q;A
zYtOwOm}e?M7rVPq?PJoGo(KKvJ(rM>vR#ws$6_|y;2Z3PS2%@$QjG20e-+Lq(Z7Wg
z`Tt{9Yx-At6=!cLsmf~y{H2+nKhfvV($<x~4V#cpQh{k`G1AMC(DcZ}2c@uM3>9wR
z_2ZUQ<x?`q?9E5&G+56v?5MIz-tbneR^_Vw87fkJB{3r$Xu*joE=m!6{ae<LO&+`;
zL@N^r|8@KBNF_Cg(UWvaX6+lq=@T%xQn9P??7FQbO3EPfD5nyAOpb&gRJ*vnm<9l@
zVv6bSLxeLqnKt$74+4yM-cD=MP8tg;#m|eL6ZsV1I0RXR0-=r&GLz3tG%_~jW{bW%
zDXLCuDKgY@hVaySSmngj!RGv)3;O#M^(7PgC(=)<pk3`eRuA>E?6FZKO$O{1vFyRv
zJD3C+xX&?7+~I~{{2Dmky`X2s*hj|L+8M%7%yJ-L7r>5>nKm}Beq$ti0t!z_O4<+=
zG?3o=iNuG5PJiZT7j}&uZEWrc#c?im7$(Eng!^Q4X}JvxTX6Q>u>+<uRF6*?jwlSU
z;k$7jp(AU=m_1@SIJmR^dTah-*sGd9b+ENEPxia4h#$y+zs`4@Mz~t1&96m}_Lkw;
zIM|+2Il~ySnqYLS!322P1_lPWvSNUsvDs_%a8t6jAw%1U81L}TS^vA^u%;rAHBxh+
z^>IpC+RlZfO{uJHE|VkjxmKy#c%MKmfj65h<a;W!0nsH1B+fNy`UL>6Mu94&TAx~G
z9GKXlzAJ!b2IB~PytzC)JTL|X_z^##Gp_`<CQ3)hn(PXn-J6YQsnx4dNkzMmXoA_1
zR*;*J`;__@o2@1pib$>3a)R_P`fF%pSV@58;KI37-+Q0EtUg<mbB+|xc|o|6Mn)@O
zc4+)u)vPv1?~t6Tr1~2n(E0_B=-m|w|8}fIZ7h}kN+0J)_)w|Y2V9}MpA)zybTtou
zHdA3h>GX}}S3`S1AZP6E)-8D`FZy2EqQfVOb=66DtmxXa)Gl}^2^7x9M}*y1RLgZf
zL91(Hz0MJh-p$R6F+E8m6A!h5cC2=E^Oy6`5j!Nzc-sV~MEyw8tq0rPa{Z_LTbW4O
zCONRF%V;1JPpqR9+tA+)+2N)G{ZOX4RRk5Y;t*g%iS_ym=}ndDQRz0i#Obwoe_Cqo
z+pfU<?)zS%8I=8s#)sU6>QUek`C4~LCU0;N)crxC!1Lzez7w;{^zO<YxJD?^Pxw;>
z6)3#!v!w^XTbd<Bj}KwvQA``KblxO^8pL)Ax%i{7<n6l9{&3S_vSOZa6va1-L(I$f
z)G)8xou4ra-nFPB4|<;a+#w%DT-)TyeO2sXCc>1+)x6rfzQB(l^xU~CI|@z<j2{U5
zlkQjY{bx&s2nmiecNyQPYTIcwv2Ev#_HuNA+m7Ih_)qElLXE)Knq1SWM3=UtTY6-Q
zPU*g^8lb2L1|YuUtU=5vfTTpUpTWv>wfou4;Uju_)cq}6{%oTv<Mk5CWz$m9P_%!Y
zH#zaMtvL-#?iq_5kDHmNul(v7F3SbUe##f_qu{>N$XPv-Bx;R}h)OBS_7#3pLWk4O
z0BA$(2M)*m6Zq~I?EFzT(KByZqo7t_{5cAjJo}h|fquOH;3gyg6e)|U@TeeRE8A0R
zWxRNWl@(;`w(Aq%hqP=%*mdW5x}IJ__1!UZ4~H_@Um{HS!sAMK<8s-3(M!Aa@uBId
zLE_L+@L4OCpW&u=%M|XszkBxsOa1a2{*&!IsvGzSW>*g3?(7Zfw*)x>O`I|RjBkuh
zB;lq}R55#0gztSdgD*3IBy*|WDB@ScPD4VARjSt4eZ=?YOG9c0ZO?{D9g^2KHwXxS
z9iIMQ3Una33Lp&?q|40N{9kSw2E6pZ8gb!msr&7vYP%`lLM)3a7l3YuIn1`2RjJ5C
zCrzm);H^)5&N`C6#$dMmFm6ihd4kY_b=E&Ka{5I#e|8ed&Ecn6JMXGsYne{MYRf<?
z)8mnaSzk;oB{r&QNovv%luMe_L#Oo9*-$NeUf40D`|Y-I-P)_H1>xH~i##)RSgcbB
zzmreIHz%8M=^u1OTxGG8QA%8S`F5q5v*9O1q^g+fj7)U#*w>O(A2|CSex|pwS(go|
z`VN+4W2<)g^OTeZI7$|)D{kfGQEX7!7<S=B7hp4C>X=aj=FsD7pKAlN(81D=p*^<r
zCg{U3y(0FF29ZklgZY^bt08XC@Exd}IJ|F`>@1CZ3(txaP<gY#?cD;rP3&Z4WD*V*
zn!@f!?Ro5eJhY?x6LEXQi%dDoeMi%I8@(}@BKUkcQCThyh`nr*f}`NYyT*%9IzN9^
z%d=!4e%d2|XN7Yi9z|ZWk1L{PlgWN+fAgfT(mb=~YX~0^@6%+*S+c^{+&xn@+}qIW
zZZo$tAiL7)4w8-Z3qIF+EcRJ6N6jWGSKjEY-5wGVqzG1%8xsWHE4B5S^Ggl3$AB2f
zlbs=n8|fEF<8RHKdFpeXIqF__@gms6&eOs~d{AthqWCv=z^BL4KsHQ@DFLa0Jc@L%
z^;(SMYK=G6W3BvnL~ReOar@;&%Jux9iBiu&s&TZVH547hZMBys!>->wOtRJ&gDU|I
zU@_0}tsQ*$c%f#X!7=ob@M5SZ$I_}bXpMl%x5K)hEE<S})LiL4oS)spCiPLWDK8TP
zvw!E0Wkn!S&Yk~g`>QIgM07ObS&6O#Oo9Q^3{&z0+|!<iqfbqM|Muj3TEFQMWfQr(
z_X)+0jJ_sI7}+1$aw4B|f|qwZzK!#KgHhUN<Bo-$RzTx-LSPJ%u3PdNC%Es3-bXS*
zO4sw-KR>#+^{bz*N3Sp9J6t;CLQi3D1&Heer?pe8%~$d71a07IFy(mV_25gX<fn?s
z>!22v7Ms}5w}x7uX#O;rvo@?n&q<T9T7m*tNJ4MC?$lov9inz1uY<GhUF|_euU@@0
zohLMYvp5&zD3z0EigY-Zj(VIRFC6#cuvwkSgbcg;!!3Q8tlC0Jd1GPs=d6x~+uuUR
z@X@dWnd$P5QJHtN(B1il)BFZAv$`r)5Tx7d!4m}^1hz1=SKQi7!Fl=Zy3V4;&v4x%
z1TAmy0L>`OVrpj%&nt>$J~(*=Un9qV&Ay>v{nB$0-NRl^diJEPi^A{f1t4R2F(zZ9
zd>e=kP6mP~><tGG@$Op18a4_^&j)43yLe<tc$2)jshp24la37NY4=uu-ZX{G_fJnW
z0cfx<horDA*aj^uxb+J8nf@OLJlNQM-mS!}{gEGDqa6TW1*vH#E{RNAZyv5=47{LZ
zTC?!m*hm>T!5<u&p9CF_2tRi6AnwP35Z&1M*EVf}0UF3no3o_nLR$gh8f7bf^3(TE
z4E0F?u%qHlL3r7tx6MWC#XnW5?60P*%zB;qf5WxxeF848O|+92*88Uzc=+p#{b}XI
zvXU&@I=Wi)Pv)AfesKLvr91|uie_STN@pXhU^vO?Coo6g&oU`hw&SB_Ol=VKV<)7@
z3^E)$-HN#uNYt35;7_i2XAD)sCi$ULTm7qKAtd<Wvg(v)$rUNm>4gy+5P0-~i`*p)
zOd5glmX=fYS8;MMmyAs?#_=C<*C*eYaS20{$IfYdPgLe2@5D8WwOZ@gWQBDSUt2q4
zaLbe;`zEbzH1kXrSnuN%mkUz`YN+y``O|8p4}*^$Y_8otMO!uQr@06IaOME0ek#kk
zViaRI6TRR9q%<rWC?kr7QHV&s@^%-60?Sj8u@OT*qB;?`(=gM`Q;S<osM#kVGN_Zd
zVu;oMj;rlXG3EM9vGTPXAZJzL<dNe%aP$MBN(D#lijmnsb&;Bx6PsN(L5^`_34RgN
zR-4OnXC3Bj6nlKBGR?K2*R`%YMKL@Nsa<}2N9Mk8)U8y1Z4|*fwy=iG4E+*V*bF=E
zHqh*q2J54c*kb!|nvLe~P(1NKk_A|z>DJ-|3V<5T6R(8d9P4pHw5C>lSrzmN`dS7I
z(&t3AWpZXhIH%&8mx^G0tJ$k5#5^6M^)?<EGL^*{Z?86_aD?JsNX{9Vx00XD__V9H
z%lF<~>?8E#0g#j<Vi`qnJkELC`e44n&VMgZ_`(wqf5}Y#N`I~D3uKUW?nu}~Iy(%D
zy+#wP^X^zRCTAQn&J0>SY`M%v(H=VnEZ*@Vk9Xrj$f>?-F&crYq}*2Pz-9JcEXuz+
zt(=Xfoxhco$7Z|T&BaXE8s!$)@s$mWZV)hQeFP%1vT!$7BGM5^?I?FLU*${b9KX(^
zf4}|hn!ExQ6|87Io+7|F;@eZq@oAP6A%~^&q<EhlFO8XAop!B5<)tLurK;<I_SncD
zmhK)eYzAz&=U}{+y|B@|s7t`4GL0a==|3R8@tT<uH|yBS@m3?jODL=312@;QH2K7u
z72nm=uY|Wsa9bZOT+X*h7Q&zAi3U$kV@ud2=5Sj(SH3HlVH0$l7l9WLlb>!JQAoW%
z+s77VLdyC<xjLzi8y#+|P1?-6;Dp%cFxyKFrx!%-UbX&{|J7+r_fmTHruwOW0ry3S
z_mA(36&1}VCu)bx0b`Fk9uV(GFyGPqQSBu@WpY4_NO^^h`$El)FLad9tuupeV|_%#
z{C5LN-4jc9-shM@S7TCO8>C8f3Edi}g3R1QfLT#{onhaq_)BH8t)^D5KIgFEQtx_u
zO}^GnCrI)Zh;fvyo7d{J_~|{-2Of-I6$TrQ=lV%B0G;OfWprZrLp%v4!BC2}9od^1
zQgPxdnX0+uhc8!8h@DQ$0ER8XmffAlB+mCEC*t939QTE@n^dR<!S>`S9sia-N(8Dn
z6*7FH|Mw#0G{W123(LB8E6Y8QOc_hVc1<mYSV$`r+gnS|X9N5Gjm*>RMO{%Q>*O;@
ziU``q&1`DzgK+o7NQx8Nf0laiXMfAitJUk`|84CDqzVH!3hW<VDgIKZXJb1zeF&cr
zLsHd9MWWh5u8MfNEWE~2BKg7(Au(q$GRVBDKiiYUA(Gc`5|RrsH9wvcr+oimmc#Nf
z<%RQ~^$R;!6Hx?7e6B)5p+9Cvj-dqiw4bD*so95ereRnD_OAbxe2K}4QphIWB9p%G
zlR?{)W?VH4(Os%2%u|j6^E?bEt-;?)wDfWUs`84mE`k=%@FLu{C1f+i3vTF=X-Qp}
zpt%a0W?KW}Z546!B~@o}g>Ud*8LuCC(Q`QXx2R1fy#2&^#6kPC+sU^4&Zo6mgj4rr
zLfyUM+B{~%jHTB=M7~~&7fvtd(MU+q^zUV!S-j<%?R1fkT5Y5gV6+|LN-5GSSgz=@
z08W)Z@=mq&Gz-?8p}7P26sxh?H7!gZ^l_>;TdE3WJB~PUuksA33;7XgQ*j&0SIlf@
z6^vRI;|PVgrj5)_besCkB+Rgdv1g1lM6G0qgN64pTZon|LB%~1Z7@!vxY{1et>GD(
zr7P%lt@$1nvg!P4wO@ujk3uh;)VX+PEi<^Gux$n|yj|z|HR=2a)ntgsI*kX86bER|
z6hRF9HV>;k5xQuT0Iflq+&7Z(RQ8q6^H->k7JXts$7IW1l%HQOd@8dy)CWcnAtLIV
z2EM*d2!!Ic7u<8!Me#U9YrG3gCELA#!*PwP3*ESu_s+=P?`PZHiHv*9YD&$39abt1
z(GUU|Jl_?`PN=^v&E7V#Ievy)Zpv=Zr4!H;M<pddnQSfdL3@+^1I(}yqCQMN6-I$~
zSE_P^wu~?2S;|)-1TvWtPe|i5|J@masf(uTgOmwaUnXF<50t&d%0&X8)Cc(0TlAjf
zwWYWEnaIH8!QzUTj!;+=c@);4D%E{8MrhOgu=&*e@X0O9giSc&&lGA?EnnNV$YWA=
zi&xlfn9yltB=M<cz3%(~J#7xl<2$IoqeS_kWe7{3FaK1Q6bhtWa0{ExlO+L=fzVu9
z5{NM(rV0i^2s6!L`@aCH0?v+S_lttz*K0<4dab2;Wo;GPd1HX`-8fCq-mchLnzVWO
z?sTJiT<)vK7tc{)eSQA~8o5O8!zTTe-{&3Ql}4<me!ia8aZV!3Kguu-kIV+m-&};h
zxFNct%?r~Zy*dsd3}rmRyWt2TJ_n481HXr>3dy|p*qz2>U$0!)-+a8@?$hDaXi%cQ
zc9}5yY1b7>wo`nFU63Sq^YM%}$K#z%e0Cg*)a4AvD;l)NmMambsWkIY+q%mymqkch
znT*h_p=a{s$5W(AfHe=e#&oy%?|K_&KTybQ9ss0Ot;4S|wU}R`E*f~3UUh5bd0`Wm
zv$?yr^nGK*BxFt;WN8uyTsM%O7R8s(o60T~99q7<YK;z1#XTHT4%{D2aSU>Edl(v*
zmkGPrFQo_4Y6{=|h{<Fv<FbN(EN^s*bvbYn?bhnxpGR@V`_^{3c#C)ND8z>+3_c%_
zdI8$CEILo19!w7HixB*}xb#BEJ0<<R+OOpXV@4#ejaG$WIO~0z8(Ow^HV9gj|CZ2N
zo_0pfzWJEu`rwwHde#O3QrJ7kSUmNXaoo`M&GEikfgNs`NnC7k-sCX1#O#)}g@yQy
zRI-;$SIDQ}iV)F*eXm+w_p2JWUbJkiE6XQn)mSHOC-|2v`n!Mexf=_+$r-o-TPgw+
zZj_C5L^<xi7K;s+*@B(>t8zEzf)a9wY1VgKmYq+C1<pDg=H#x7h60??e!pmmrc(sl
zZ0)ouyIWn%Mh;<RXxaF#$N8?``9BKYHJOY)UA{b@){7hAX#t+qI$N<Ow2_k@I~;q~
z&}R(wZ|Vv4WAsa%@nP+{MfsZ??pzhov?cXEYqQg7J-<&JP!8K)75|)x4G8~^wYqQf
z-PiuN;rGA(>hx08AWu9M)ieE`Lquj)B_`!ma5{EsGTx+ZcOd?GUgaFkLAc0OV`O1_
zhS&N!!9X|lPJBt4t^}yajA)289?`1%i`aB+qbosM+A0WHnN160v??0PNpD!p#c31h
zRB_62YEo_%k(HIq=<b^r;}9vEe3h>Pop-n9C^IYgByAI?<0gu2nb+v1s9W-O8yq}P
zjcIS*s8P01u0VQPpoLFApIqjk5sExuta3?+7oF86EWdhAqAC*|7f4<*7$?gp(<S}v
zWnOKfPL1zDUy{?{Rl&=Y*dJ;5jP(y?_x&RSD)kbEge{xEemjW-Lx{+v&(|Of$@L25
zTi(*%HYepsJ3kb+_IiyP*pz{eH7Wp5G)9uoGDtL6YIBxk2ts5-u1#1Ujoggx(YH3m
zFY-5qeQg@)3}jXeL$B$G1X795W`IQ^9U!~2q41wK&m;<hKxoH7-m8^YOnNtTSNSnK
ze*8ta-m_QO(ZqKHjho}EKSqo?>&imF-+I0Y`Cb)_Y-U8AuML9GT=JGVpLWmsT-Y3s
zOW6QXk0yRF9RGF*S{Vl`UoXEOwqB1PaKyzS=_xWjthzTCX|(ttJ9O2J9s=L#i&iSr
z;+_r@a+?QtTlADuod&qt>X-HfGII;lyG09)?*0`UbF5wL&5U>aD3yQ+RiWF!z?#Yf
ze%5RAk0@wZ4!7pE9CUg3%k-ywM}hjMFV05DaPHF3GMyFn(pN8yVWS_00_vnFJWV|G
zszownY}pmG4TZ{Iv{N=ZL^Zk}9)t!i0CyooIsYts>yqCsJsjR$C^cbHoRt@lKF&`g
z_fq-SNB+sV6kn;p{B9G=yvO9~Nmf1u9=dnc9>?O>$6;V;)aHvU@&ljzfSfD=xA+gT
zB>eRpvMcMr&%mHMM&B0Wm!>>w78*6Lv+dU~Ev^(TZYu!;hu%nH4#Up(ngt4nQy7{u
z^1?e$ii;F13ceL{_^-V2^n*JK;*U>F&Bq-xqU#=1S<KD<o!RyLuJJAN+hkNeKD#@}
zvsYGSP@iJGok#+r-M0yuf&4Su#iyuWz$7=}+>d{}>|1C*CvK)UG+R%X|Iy%<Qz0j0
z)nU@N`0$X0)D62_R6`-B_?{M*!DGJ~u>9u!-YeN}<r{1B&{(5Fn`muaVy*3LJuTBj
znX<Z(k?~oJ8)UGWA`5AD)pj<&_-x`beD-GJ&1F;ELm$bboV)_)^it%34XUfu2dpHu
zw+Sa^YxXJWi}CYw+4Pf{^?nhn`p+{^66d9P&Fxs%wwh&E<U0sW1D0;;zZB8?letpe
zm-?1+yFas;wQG|F&Ufo;IPp5O3J^~Byz6^DA7=kdElxqyNc3gyeM`J1cfI5pepa+G
zmTN(z+ceIyO68X>SXE-l>m&!&g4z-%@BsJ(07Y33D_(lsxD=R)z4rZKmvs|gnidR@
zF}6sCvbmj0^mk{}$Xl}h@j2jC0NRv@>7Gk3)c-u;UX}cn>FF0V>$~SD7~~;mcw&h3
z+6^U0Ac{UdUZ@sG!0=GDUcFWOq_Kh4*@L8Tq?|!H?5cUq;i_4<PTF7GtIzT~R{c?f
zR{p}0j<$9pGT#G~i~2C(^~%2hlyviT418oP3ejR#_g`WjjGb%KV;JP%wMy2=EqZQH
z*mY||-#_^|zah=ZqU9}ri7mHfL7Ka^`qbwXhOZB098bD`(64Skc7^Q|9bmRlCN$8@
z4l7eF!+S_iHU_|IzrRSP#RHLJ^o|<^uIEo0wga^OG{}8Zk^h#mQv%&suQU67bLW&H
zT2*HGtI~PO3r3W=_Q1B-;B0;w?$U|mu_pW!*$u6W-7YqB26=0S-wlm8J;wm-{{?+&
z4RT>pfSR2l;@{eQvs;4mn>!X49N=G@Y+AszbY-YJ`_78|IcW5tvJ1!g7Rik(_BrW=
zIK*?}%y~J(@kS#?*b0S+pBMBZClX3~liJnL5wqFn1EFy%q~3xnAIXStUu1I1LEvAb
zgil8ru5)?7Ksvds&)CIq@k8#?R8fpG3U!*y+})o|uT-2f<?u=AN?Z{#vlwjeRowG4
zC~d@aIp-SQR1fPVs&_BCGY2Q<dE7(-naYf!7)L~u=McoYN9Q8cfA}~is^>Sq0qcy6
zEyV@FD_^oJbKL_lhF{P{r1SFh-q#eqqR(locff71g9T^P*c!y<-I>#K2WW~zpk1pK
z_Dii8b~U)xXzy&MzodJ@6_sr&N;?|P73W-ev`M=NjuNM_Zr8azu2#YXeUA;%FWhYT
z>N>OYFs-A&B8&T|scF6{KNUJmL#R>8Ee9Uv=-S7DRCNnNIT;QCl&R3OZ?44MLeHB*
zR9d?j70mEK9^|Ljo1c43JcPX4`L!oe+7Dp7`Vsx0+deR-Nv_%cdC&h8oWe_iubkI<
zW#m79<3|{K*Z`W>&AuK(IJ89pDdZ={3AMdMqlya0X?=3idOd+^zRUuK61`Ypr_plZ
zbM*p;q+njj2bEDLJ+0_Y#qay3gm}NBmY9+ni;qvnM6~HMiyg=kh|tqrPXYO=VEZdd
zg6Qa)YBP@-<m?z(O%{21ZE`OzHzmpag}T8H_;j?^St{Z5iGw($^yFL;Hq!$5Z@JZY
zTb_ku2SY5n3{iU{QJxb_jfz3ek`i<#d1Sct<CADhpqLvaA(kgM_SV!w?s;$NO)_7C
zsTN4{`=6El`fc4-p3Lsd`Ibix%$xmrQ#X@9pK0+8Z1%|)c(F3=<xejt4_h?J&*5A_
ztKb(9)L1Cb7RbA!A#;vQ5S`KlhIW&>2@F%80Nb(2Xs(!2i<hhWGNDFHCm9A?mY83u
zq38w>c0$fJFxyA&o;ipk^UkELx<1wZfv@hGAO&#JwIF|bnHR;0u3vp@d`n5Qr#ZK}
zp4ou*=Ff=ERPJake>v3=ivLjGBBl6Lz6PvbEGcshGv})Abh*{G{MvPx=h`^CM*{W^
zS_Bj5#+wLqz6fix$QhzVv-#Pe*B+&VDeZvcS2ikdh<mlUxSWXyz<HOQZu1KeW;y_<
z*Sek&pJDn^7(W6z5m{4dErLB4K3ikm<Q;tv!2x6fHWpB{wM|n0s~YQWtszs2W8`kR
z3?A4uH6{asjnIE+BeO+Qv);jwPmswsi96x-j3LC(_s&snzEt9St#u?eB7HG(T#B7^
z`sp28OMprWljf=sEvE}7>_I9M@50z^LM=RpN`t5<#tQ(b;8gd>-`|{Xj7s3TYPt=)
zOUceYDEzJ~2qXKAXsrh%aBclRBqMaNAdVOxXjT8PqP;KIoPW2p1$2jr*r>zA4z)Ti
zD<LZ|J;x1$v{Hx1+QiclQo2V0e*<`;zw%9vt6TlPJn(S`enjmj$%;#RF|(unZ%cu@
z{l5m1O&K4T9ODAdh~x}Gx0A@vTX`a+H3@omF8?MH`fm^9cRH{<V76ADKXfm_0KFqv
zH*Lz(3nAjKFm~OU%KfpYE=2!?oj#5jGrs_&9LqmDB#PAk^|MC3Ue(FD$#^><CI?yU
zHJlxLV_j|X?FZVhP`qs9I~S};n%Liv&o?MjR^$Ai@#mRh_lv2_23Ci}KYcD|+Ax-g
z;a}SAy)X*)@l7-nvkN6#{0Kd=N`?>DFn&Zq4I89FCw7qq<AY#i`ew5h5{fdKvDu9N
zrLeeS#;Wz{Bux(IGP7xwYs|FV$C2@d22>1+U4B%}ffLe-W%fq9QFe|4JK6C!s0Ged
z<6rhVK*a%8VxZA>z5rf9UQo1fJ1@#QR^}Xuic~Wkbb*9bYcVGNH-I^X{bWkpep0IV
zVSUv=Xj%Bw8bK8BF~eDOu!6^QW?gX~o!sTQ44(yl?$~PKh|yN&b-U*oL{3R*n_H|c
zFrg6D;X6`jBx!(!Xi;G8-r!Uv`_vn>-k)jKJ<A__UIttC>CB3?MY5;x!<`k5J{jr?
z_J#6L&k}%n2n8{G&A^c{+_pj`kiKN1KyJtirJ7)$2#J}A$rosJ71+nXSlD7MqRYsL
zY)J?AtWRD|Ejd^VushQKRXUUEH@TH*CwT6W3ZmFUc!_53l+iH}m40PfHS<FKT6+r@
z^0510?5zp1jv#rXf=xZN=8XqbpcAUL)BukMU!x7IdarhWl>_^{ls{Z-(G4|Om15mA
z9O3tVZ|~BJ>x;JihsJL;H)ocsgLjQ=FPMEZ3h@7n{VH|re;vm6bfG+I#!v=Aq78j^
zVc10k@da|A<j_TR@8X%0hhQf8sM0iY9Lw=ZJQ}HOW-t=pi9;24=0QuIzV1W@{|NtA
zLAPgH{#nRlX_AkPAMbw8<+Z;KbBkf~KbSE;_pOqxKkQDBOHL|L3z;j(ddG8SxbvsR
z8g2rZ=s18xw=P?`)-1l)KlVxW0;@{f6Xb=c0bZAuW^((#MM0V>0Wy$K7D2W>cHf(W
z6K{jj+{Xi_oW<||*$nD$5A5D<FI!vv+~@KFl;T1{JmXUmUQ1$#6?CU05U8$F%Rl>l
z?up@Lxhktbi&NQ{Snu=)qV_FwqVZc$CVqj_4>P;@?wC02i#bVR48zd&CZ;Tr^+D=C
zl}bU8cTzH+s0H^5U#=Fp{NOLjK_zP<M7~P&#vp8mnfqzHcK3yThW_Z45$BizNwn+0
zEx>|EEYvbgGaeOtYT6eSac|KlWRu>98@mK*NJ@`?Y{CSRr`1dcX;1&Gcg<K<NkiK=
z5jDsG%<Ec4){?02#iwho!=gS+utT2xvXn&c`+#L*g|}|j<o%?+>{9~GpGrds^kJkT
zqzOl&Cw=^G6QYipC^L?B#%D-Rl>&B4+3b3JI9a*5Cp#(v0)R#~vFHr<km^IEgD=`5
zJ7IYAETz~KQo!4;4KiOHj$CpOb&Mr?I}jVb=}=inz8UPnM6j1OLWKHs>{}TytSCa=
zH=*)YK5QcO6v8%{{E?`x9q1tqn@dJj8Wx<>Q<X$E(NUZ^;<m9gTRbu8Mz?)2*FDi)
z7Y4PPbF2BA1{4a^0W`~0h_S-nn7~TWoZ8l&PO{-(R8s8-zu{vb+_s!Ox1fh`zU`XQ
z4#V|mzE`H?SiM+@dS~=|@LbGJH2C1Pl}$bR*9g8nl0P4Ct$Kmn@I#!cF10eP$#Zr>
zZ!4Sq^T2&T6Gsu9a(l7#_)uq!GGzqTNztfh9ZU3EU7kNsZDJv4L+ack_m0RS(MZLD
zOmr`lY4a8#8SkZd6k93>ZB1>Vok_W5@X^X=@A;s#OqFR*mvz*vFW<QD!N&so#lSji
zhg^eez(#N0TU*?S`s?KVE{55rbw#_}-_1c*{2^-waL-$GyxsrPq(0*CE{Ad6e~`H@
zbdEYJ^T+bu-vv8S>-wKT(^*_VDEsa?>FY52L`UG8)$X+iwfX*2@#&yI%fsWcgB^Z<
z29-A%-kTBh7141T*ck3xixGJPSjOfpfvm6p{0vN`fR~e;WxemNm5z*|u(@IO$xn~q
zZGsl^gr=DYYBrfcer#N)T<(W<xf^B9R4amRC(;5vtI~HqE>!#<U&~cRvkVL+?J#m7
zilMKF1?^j!ujd3j53XpOT%f-NXkTi~n$((pVIrO!{Ea!iCH)u&HSJB;`5GZVCS_7&
zVP9=J(M@g_+TO6RC4#517>Y$dG1S}#XzFPhO?*<#Hp()eBTGt5zu!-M_JoH*h*mZ`
zwN~7$Xya3Pd<7~9nl4x8^SKm7b1)?aGpmnoV$<d8)Q8uiA#308x|ta!_F^SP(=e(X
zw|l~)<XseO9KDBOa_%$1NSlC}#~=NeJ&fupGx8j9>{BN6C+4wP9iDrco^U1Yj9DMe
zHdqCaxXxwy<8o|Fs;M;2zU4gm-OY9$iwsQw!v&hV)9|dx$U1x9JGBMTPe!0BDhZ}7
zy!Lm)U(p4Ft#<NkQF9X4*Vi3BC~PWJQo99z-06!cGdy}-3n%^v(8$JJx<Z9UYp>5x
z1H}!*0BR;VFga+5KopM5Zw;6lM`j}p&8?L<Q_@q3X@yCPU=3wm4M<r4y_YgU_zu}(
z)(=T5kfY4Db@aJNwXLnsSYIHR<J)kS;Iyt_IpzZlYz@~-Q&;NXy;J~#X1?4;qIje<
z?Ck7R`CL1_9%Mq*=IBALdP&GL;fDJnWxva)_G%{P{2u6H>~I{I5gcY~W-+V>ZGUsG
zXR3sKg}g5k0d>phzBAAP*$HKg%nm`Okr6An%&9UWYjEZ5I>e_8KOYB$BM|^m;qE&c
zUiy36=JXgAc=$*9jPLX>FgRC@W7G)-3f8W%+GuyBG$=>X^xLWH^aC;lc`qAjdh5U7
z2{CNn>hB=teDu9hYyZLz?INVTb7Z-mdv~u0tsgWUMm|j(n!vp~e63mQqxoJW3J?<Y
zPpa$gaHyf9KVBJ!V!e9=0#gMqMfV8eucA5rjtqlGJ(t@5k7dSD2K<Xe%41s!PCNlj
z>#6A8_Q;3*Ga+`D?N`HqkI-F9`mp_f&L02Qp=&Dl_n|b%9PsMIBe%!4$B8C=^X7*>
zt)>%rR^p^&;3Ao>T1&~R%+O<>s4izkqr02mk2}a|>YCi?B#@m}F=N=roP7U_b^uYt
zm4XqtS7{g59`ihza5r2-(4dPRw7uP6d6J`eO0CV`bCv%MXEl;zuGq{_uN>ve*cYYp
z<{&G`P5mWN2q``dV}<R$t8vq+RGfHmLmDFA%80+=1GJk$M?_UiRn{qhy)pLw9LkSa
z&weIjV(8U6IA22Vgl{7gn_B;#FeRc(w`e~~Mjh@V)bI=E2QwPe+|R}>v!YLiV&%ak
zg6;=<l)}MCvgjz+Sn<a1o^}#rg$vz-Y|-|{%uj#jVLsObE|-6Ov7I-7=OX?QKzsZF
zW|0&jg36K275AM#1;{QRMQo=^lnMY>nCE991Il|*_X#|!y|2%f6Zr$uH>a&`Am1yc
zC>3sOGShkP1N_m5Nj&=bK)JA@TB20*MnfqP>omFATBMlTa#$U|n=Mh%^WdJ(q=Kh|
zIyf1FWH_f^Tgtk~=FrzRQ=Dxqlz;MXQ>g_gZl=kTq70kpVr*T}y7j_}fNN3YN=%R+
zU~`F2VpNy@OB5s0ZKx8z%$Vw<wKnQ&OiN2UAj^qdK^IN2DIv=omoLSOc;@Z%85kl0
z(<2>q=c+AVp>a1z?X^O#Y;&rQEpH2=m@jFLd4TgsN4=T(EtF^=kz@!5Gtp}$gz#nP
zc$kop%;$;fV?*1E;TD_O3}H8agOP@vpd|yWzZpFA%7uK`Aa^9kuakOUv%z<aXK8+C
zNhT7tx_Su#h_;8DlG48?X9440EcE7+*}Y#eOj5KM5ENQxX0i!HmDb^HTIa&%T}+EK
z@F^asrWj`g10MCYv&-2ys-+}=Nn*QV9MxJ^_Gz4H{6<jivrVMR<mC@aANyATI+w*f
z+cnz66hYYc1E3ZGU@q9dp2OhT#%0ETJ&?aoMuN~^I}i?JCrd*&VY&n}e>mC><S1*s
z&Pl5L!=hK3E+QO_JGUN8M(9T&#^%Lpu7i(i3)xQrq%PIz=Ey=e{h}K!-qExTZTG42
z|1?zv3jG59kISF)evq~jWD`=<L>pD=UNOk&)JA`3&~u%uhM*EE^ZWt9BHk1ft0L)G
z=#WxInst?FoSBbqnl4>hLr9fgj4MBCe7UQdU!2JXeSSfJx{-}%aV8O?ECcPwL94HS
zs-=T`I2dKK(;JmEhc#dpTA#!w6)py|Cev)nuG7m@Ez6B`LPXy!m!Dwt_x92-#Qvhp
zM=^<DUy3e&2W!<zZ4(>bRZxw#)zfUWPKLi-xcqUZ)1dc#m36DADYA0Ic$J&<%?vUA
zlnTYGFRt=<<<4?b0wKAl<ZOS+bp_GqQKxx8qXv8^s{!zUW4ZvBo(@Md8QZPRxjQ6$
z<PuPO)dP^Ez%(LsnQ4u}g?zD+W84vhdIH2L@u%XC#z{eVr*Sitm6aE6x=GFkwFpGG
zg+Um_*l(Y-WA+X=T(kAZ)&e0nqm;MbdA4I6eO6M~$3q*2I--rNn?fHd9XHu}(|N$Q
zLoq!gsXals8GZkUuCETNGFta0ly0OXHXVYbG;Bgjx}>|2?(XhTkPbl+r8eE&-E6wM
zyWx8|_uQFt&OP7E9%uZIfxXsxo?q%jrKfcqSfguyo$F2+;pzGSxgD!2Hk~1ZnS_mg
z%K<?+j6n3lXjSR{aV?zgn~o}c3ur*=4}Jo1^Y&OYC)CaKH|#zZ6QHKp*;M^>8NV{9
zi_uVN^PTkg`1k^=rU`5X&=3SsvDR(Sw{XJZuP&05&=%G!?^p}-`sVBX%6MBZMZlvR
z-XhcK(cuL{x|w;<Ua)wTBGX1-({Nn2+RA-SNJTd6u?Qtw+>jHp9tMUc6Tp!=%>DKS
zvO212dyBB>I4lB5bDFNGo&qFn*+6V_A`pYby8~#cVaj137M=TVVF<9kyH`|H00Pbk
z4BIVK5@d!X7kvtU-i@i}i+_lL5>TjVX#3{vnwTHP+`I-lKjCiP?T79Vd=+i!us-&-
zJI14zLCFWS=h1`F<&~x_>i@D<zmyt>+6LLYHmaGjb%TQ-g1o~Y&a=%!j+fiib>4*#
zf6U$t<A3b4RbS~&xBb4?<?Z3*g`f4o<45D;*8V()X$|!3=h|BUMqiF1*jJfD;S#d3
zkt6`f%+Pz17GWV`-AaqL*!tO@=MS9oKOH^I|7H3AXWDP8?Tg^DK}qMh-kL!%ALO`U
zBlWc*_BZ3@yWrMIv=Gfc3@`U}RgWSC+)rw?9Pev{!C7_kOPLV0Urc@D)}<7g-%=fE
zREfg>*iX^6_Ww+G5fZh>Gq4Ha87lvc!S%*MLUJhaZMIl)D^`3}-rn}MiHx3YXy>~|
zvr!r>d?FkVYo0h+#NPhi-gvavE9I56S}T*a?jfppo|8Fl7Ppi`<1)$6IXtnFLpAkS
zJI&9&I>|KOefjj0%^AXpzLK9t;OT_Uk?I<U!Oef@Yc=-=D&DjkB)j1Ui8c@n%)46o
z{kbnX5EMrab_+(U=g3EMK*OoT0x;_UeZD2!K3icv0H7=fWQ7<vVS?ZQ7LQK;88mHn
zkHpUt{;Jb8@QPz7`_Q|awgTAD%G4lq-`@=Q#J>Kh5J>H8!{OM0<vQ*O_Pqs&YxyqE
z_!kI-A0|?Eq1iIk+2%dhmNLj)g*V+5>jMxiWDetD=v_vg+#zi9ARF%#^qD}mxnC~!
z=)mCt?-X#g46+GL?nIyqziXw&ddF%CFfoglrfB?;0cl&nQ4DlA(D?qS6b}CkIFy8p
zD^EN0dJRxW`gyD>ZRXW_9s9lDxVFB}O;^@h&g%hDFh^VPuG(gEIiW=ZZ%ue<QA@hu
z$vwx!3F<VMn7!wGq(Qz=Mkk)yxQGBSMmMju!X!yFb{^iAK~HlJ5HY%RZviYaPe+$=
zg3X#=gLnqHIYWG<?FU_UFfZ0Gb%3NW%|>@fG@0OBQ!?bWYZixj>;T&QXO2#zuu@>W
zlX!^+ZVrymIlg6cXxzSA`v;jRtxhh{BI3MPSg;53QTPtnJ(9m<6zk*M$Z@C%U7S#r
z8>|K@+dSs{=T?zZ^rE#JB~`@P@dR+H%@nZDCQzM?&E76C&$iSkF5|HV$;GZoL^Pt>
zxB+qu<n2wfjqjwh^Wt1)EFaYM`+KjKXLqf*+)rGNA`Eyub@V|1b3SL8&A;EOUy=EF
zbmX58)xVnJuD-pfV^pN?UHXIJcu}0H3$^5#dCRJSu1LKW-ERze_ch5kwT@>S*NhvR
z`f4&}WO0n@Fme_5NpTeLbVO>fg<Pa4RqrSZUVWz4sE0`9{-w+*_GVz}{YojwWqWtU
z2beSPvdcQO2w)pciyi!DAU$M^fUn(^72lt*jIfm`^$q$79Kt&GfxxhLceIe{Z28an
zIE_!Tg=<$8Q~@v>Ta5AdrSenxzFqDfCTA#`rJv~5aaHiDP3;oW4tn46a}<zsOENT(
zSWf-<IWQT?^(!pEzKv@e3bP6O`7O11^(0hdsBQ?e+wv+Jwi>Rk+HP6zmwe_sknc_I
zfCh3(4<D3SyIK~IfP0z0h;X?P{d6QF1AZesi<ermtw-TR1GK3BEzGq)LVz|pn406T
z(c@gFK|YfY=!tMszy@7oHK&e{98q|efw%Dyx1mtqB8=`J&;g{veJD1CX`Q~Aev4S!
zsKz%P_Z5Dsozsb(Q=YN2M7l4QHY-?<5n;Ui*KN;tOW;f%E*a>qK{!)!1teQu>eSCR
z2NoLv#FpQlR0BsJU_zauyi~$%1qkzEw5_?a2?M>lV!0571r%xR1%3h&-SJ9Gl^WXh
zLC%&fO#WeBji|Z>D*riw?sVTR<?xZKm{MSXs=X%V{w);CyG8gt37?Q~aWwc+miuCD
zZXIYB`#Ob3+@N4-9EW+JneH$gbf?i+^az;Lc^4s6c{bmfbr;_1a2%xccuSu=<t|&h
zqo*hw!3rCBV-MUPw;W%6#5Z4qh1(*hx}XRnSpzntI(VdWUr@HHlF>TuqUTfCKfdo!
zve)nSy%d0{@+ZVM_lIky*4<Lau{&?M_pEg4={6c>n{8am()7Qt5jlhZI2rG;(Cg=7
z3?D1a8AfM*XrdBFTKL_~(y`xFD6O&q@5|4d`K*hbF_|w@g}Mh%^{#@7MwiEE-x?nT
zQm;BDjSgvj&#Qd<yp<rvUghT(zUIBTi}ejObn-V65{>6u@+_cWg>26~hsU!A5dWc*
zIq8j6bp^`Z?SFYnvXp_R#7o+;MLty#CZ$4o5TWk&c~44jRie)3L7B)~%Eo8VIziy+
zQTo#W#eGh@ibEfU30&Y}Djd1CMm!_nJPj`T>44maQ$VEZR=HvFZlxNc_@b*Mmk{O@
z<|k)or-q9I`e1{JY7u+IbGJ^HvVE>nacpvX+>aGW>I+DQD$|wqR?())$^<kGRon>6
z7IO)u)5W}JE#=)-xcobTrh||QC-$iit0ct-IX15~;^3HiYNswzeac3x3+rev_h$%N
zdC6!-)+aFec5+yQd+u7xOcFN6&V=1=e!yTVqdmY68w+m1tP(*H6)oavA&yO{9RcXR
zJI2v<TiHF$xR_;t5QQ9`zLmPV5;y?EniCK8trua3^V95tDR$e{zq-0oL}Gw6XJZ|z
z$f1r<Bf!9<@!$&N6JiAo0rt_Et$D(iAm;Y{kh+VB9z&}Ycyykfn%Y!z-xL|NPDu$h
z_QyFxKzXFpVT$`YzPdfjMs65@Hz1cx@(1+zaaKE+(_L9XY!!K1X$~-^j+qQlcwMIv
z1BHV(!<tbpL6A|}dj{X$%CwA(18dEZi;CNWM?kh>zkcz#R8N<=ZUcw=J6n*ECT?%i
z0i;o1Nh6)J=vQ2ojlw~glXak1rNcqc46~r%V$;$Ar&zLuznwLd9}I=};*23$f6Fc}
zwC{u=hK3}wu)t^%xY=~>507D=Y7}7L@i?5pJ7Ed~z8L+uI49is?WR*2Cw;|GgD&)W
z_5Y)F321pS*oAg-pK!jlHl6I2u9xi^0@BDneMyRW;y<caS5{G8H1m7BB=7*@DX;co
zFiCFgeA4Ehn7egfcP_bHKLV-tYu-oig{>_K+Vm^NCr^$4+n4sGM%_!xp=D`VD?s$I
z+R@0ce&M(90i)1Y<Z8vlH6xSmJ(9x2H*|HI%K5CWJsh=1Uru{J%D}EN()WKyC$i$4
z*b#yAeqHoh2Vqd0s|QH%<|oJ0U_vT`b%wQr^-qX71#XL^s{L{5LeVPHPz`Q;Jd{~i
zV<S8yXVwG#biC<^H#bVEIhqXIMe0brubyC=riwIG-U3EjgU_;K@I0}6Nb|G2k8L>C
z=`pt=PK;0o8)aaQH=Zt#OaC?NVa`K7?Jrh-B|k1XH&d*weg$O6u!e_$jDBd?_@Zwa
zvj}@l;tP>ylO|uj@v`2jaXNq{4fq9^r1y_ffr!;E({V8nJdGS~tEhqSJWJIryP(DV
z)6lRHf{BSwg{hB`IjK>F5wMeSWlUfWMu4JXc!96yC1IZZu%T-sv&DMc+_W*X@UH;i
zhRx(DNMX5)=vXUfE1}wlODWZ<V<!npFA_@Wse0Y}DwY-j#g~w(+92IGQdixYC%gm2
z#<?3o*IFOYP!G=vA(HO_)uD^vR8&HgoT%cVT(fBK!(7|L?nHr%u}{<FpU(rcP*13q
z&c)-+dK@!qRo85(zR>s2T<_lxE$Tx76ZG36^O@cw^e;!+))4`s);e_7yW4>G1anU9
z#HQK32^QWs>dM5Hvt@8y*zX8bLKOm@=P%Xv{#>ZsH8jxMYhRiQ2#9!pr(Ek8TuG!=
zB|M(bA<*{F*%#@Vh8S{k6onaPR{!(H{+EQc|3!D6z5qZfaXlPD6Fy=M+2Xba?=J=Y
z@7S&v1$ib{2dPFrgT4=^k~;b)TAt)wza?h*muFV`2bf!wfhMLc=E)K`BhbyVVnh_W
z&+tAV1ABf8C7rRJk=zyhFCq;7mxb3&l~-tlQ85}0p_6Pv;4}Efsc8f6%_nPFk3#jT
z#G-zgc&uu*!OoW7sN}ABfn~RKvnZjPpANM+Hz!pTTxR8A%V385yJ0GNyQT0y4yb)H
zQ)Q2Xb346pg#qVCvIhebfX<8P=T;5`J?Opimq+dMBrcd`8IWwx<6pB=AAy}48tD5L
z_&|arxlMM0PG1JF0vO5gY4E@DvYmnse)AIMvD$`!E7nO48QQ@9CY6$QWV$W3i+tBe
z9wkKnAR^8HhJZ`|q}>Ah_vm*WrCp}`qlmqdK(?BWJ_d@9e-_lC37y#l!&ft%>6Zx;
zjW!)Q=ZcZ>YtX6b2}N@mw^RbxeFux{&Cj8L%&zv@*)%eIM&k>%>>#IUW3Y|UMw!Fk
z)VP>pn<rV0Y2%EJ2d7xt$!fac2x1}O=CQ6TgC~o5oryR$U`d1(cWk0>)2PcDO5=38
zCOU<txxW8>Iz(7ibt;k`Bq}#J89loM<@Pcdyc^=4$?)y2a|IHjlYkU@9zWr^&MuN}
z8`7;g@4L|$FO#t!;ut%ddWJTUhdt9<Pq%<YC{w5#5bV=G-e0>t)t1%*4jj%@V=n{r
zJNk=MzdJdnFKZiR9@WfF?|r>Tx5}*Gk*sG3S2C=J-dy$hU|xK=ehWSo7n)Oc(j9YL
zZ4Z%e>53v~V4ApDeZ)f|gr?T|K0mr~k8~XxXuSTi?qjAwSNs3JRGVJB&7sVqAF$>d
zJ!E|PM>et5>E9+-@tS?G8fJQ#rAuzr;US0fF7csvskEl!!N}#zHpSFC=Il*ze9{~N
zuH(V43lsCQPm8o5IzaV=aVoc8NktXt{&@M5=heac&wte?MzSL>&d+|HtydPZoA#S<
zFjST3mj-;W8&eiCx23%#{xCYCjcZ!vd(;e&sE-2fjlN_pMU%H^w0i`9=Buq(im$Ey
z>et$Cd7GG-4P?}D(5STJlj<fjYyQZVk&8NVRWyquYs&Wt!%+UI_4$#+HgA69!NVz&
zYnN!hCZ(c+lpns+b<f!!$RJ8lEml&&xj3)=%&6WQc#FDmU#OzmGHRZRuP=K`xa(xC
zZ`Duv*mwkFmZH=I(YfqTewDv-rbEe|lA9Q@OXsws#ryEprj#l!aU<V^yBbWT`^)>f
zn7;-DpanD`;<+1dr`2^9b3~}FHL1Y&WNzM2lVs5iAS@iUW@4sb-{<6WEvZ1EdQJ0E
zK}IZ$%Kv5oNLs-KdERjcM<)Kgww#;eJmTm<UiNO1b9nV=v+tqVWH$dNuI8VX$bZ{Q
zieC1T3eWqgr!AB>8w?pq*%Yr)G#OAC8Bl~i7bz;Sqr6d^AGpF8O-+|ep1^`44Z3s_
znb#hanh?HTqC}<EL=ISjX>`wUi^6|T5{^uckb(?@3hi3&G#|-2gkdHxb00c*n~rsd
zWx+Ck$BbUUs-L@>fi{J$;Uoh@dJX#v!yh5Fk_)1C1L6>r9I|@&M_6L6QA{xG{>f|m
z9+Br1He(&y{#a6eK8rXjZV{n;8ZVl-ylp->ICg^Y5u?_YOXH3(cLV}0p_vR(*`u^C
z#POK?IpBi>Rt+34>xi$nP$C@*fY9)-n*4?CnL-O)@3^y=C#<?Pe?MISW1*E%83Znh
zc|QZs-yP9|0uFNRG_^7s36L-g16ir4oS4V6JTXj?4Auma+IXkhO~4Xf0kD(nTaLIH
zLUIeBFI4B?AYfmd0&IO^JOk^Op*^iS%+O}_X@0umaizza$Xo%x;x>PzgyX#T+Z`Zf
zs^bAN6usd04Z?(`Tj{C}@qGNNV1evpNQIzc1^)Rg@YX(V<$M`FbsFZ~<{>?KjWytf
zaZPz%X2?7fLO6tZ&cj_i8tVX5T3i=&bvHw*Qh4ZG(+7B-0+P0e(zmw~#_&!^S}a-t
z!Tj7{UJRzU<4A>HIsJKa|GgCux}oE$>s?_7qv3qGP*-u@W|gYk+-Sxj|A(H<A$KN!
z|3c_LbQ%Bh-<ttI+hM(fL%8r|)XG8F+L;z=kgU;oASZkf@?0l&WmT0uzW~H^{D9eE
zue&H0!O?Fw=K$!VVg<3gskXfDI($;uPZQ9gn5WZp-`o3;)e-5{?osoEvGro-p^5uU
zimA(r)<l$S-lo&;zdzfnIRDIiYn#zwjF>;|+Ix+<HPC@6gaxtgiOt+Ra2ifZam+1X
z7DxM%CrmN2+L4vC{G382SgCSI8o+2ZRYdb$$2TPZovfDft@Q={?ZJcsWvCsYWBO!~
z(&A<A;bF~kQFdQxOj)kO#E_d5r<|H_-_Sr3B-@V+wzxh3$5+R1@pCza`A6iu^ahqG
zuL8{q{B(Y4o`L@1L<(*lTs9OKpE19umjyd!2a~H-ueA9g@d5DRv>oX>>Zz5^GGmYM
zpZ<@v?_W=wYu(Ff+f4KfGt~_69wJQpp1w&Pt{|0Ed(*_(uq)Bmr?qdO;a>uzIw`w5
zbH@o5(0WnDGp>*sBnOmPqs5~kp}V7!<Nija$H)4L8Qn{Hf4gn`A<8h3np%B<&K9wY
zloPoaF7mC=^ZZh|QVX6wfDxBAeaVT>#1rOW-{l&Mh9I!9BUqSorYWHzY-E7TjRE(N
zg5mEs#V_+)4!=KOTHJ!^gp=j6TUvniM4)jyoSO<5*uvbwY#|X2)DeQeEMpr@@HOh<
zt~N8aC%+CRg|ZHlXoqo~6B^5ri_EjIlJ6Ug@Nyb=8beY+=?XFERz@AXoNVLft_$C}
zVlnr(GmOCDh!ztih+tV_>p`wsyO~0v6FXm`o-9E^#Xc+lN6o>D3T_mi!R@k3S;h*g
z<lFP@223afkx&qr^+RUpU&DOkq_0K*r%2kct;UJk+*7M{qhpzZ!)C|rY$gKOhKHuF
zq=l>!cQ2z@n(dEap(jsmZG<*a5ov*?z$`sbq*<XuayVb(=EV^M<ZEr6H;evKZIG;Y
z-lYWeWjgNGz>|#;NrN9XvZAt-J<5w@vp!$h1Ge}m1kscefZ~RA$qo4!I|<ETHlB*C
zzJ=ITZau*nZKYvjHkYlt^!fH8L}9M10_bq)G3JB8H888!)p{swWj*QWFSD^Z+`SHp
zOmpCOW-;84`cG);e+R!tIIl3^n}V(zW<j2;m!r`?)<eSh{>>RGT&aiwez<F_ud8Tk
zaVjf=pGzo|9IHW$qu`7;*2ioMF8VIvdp6zmvRjRgcOQA7R-NOdg^5#VI5&Vd+fnjY
zO+637IvUIbRqwDAuIGl4jgFjb+p#UwD&fBVi1?|<w`~rE)l9@tq_Avf!NX}|Op>ge
zVZ32x%yHqAE*KELG@kWGvD?gD|4g->fnK#Iz4-m2SemR+?PtKpsLW4~lgFD?>iTGI
zQ-3tIOIlWc**Ea8*1mWoiYkVY=Nm7^?F*Ib{$$t#8GX&;@~+%i>3=?H+SZ<$eUhGR
zk+k`EyYV&d;us~{CTO!d{o9mP^&yIf%)cPq|Gbe56#kL>Sy-*VZ&xa8tCsc#f8!He
z>cbkYb4z-K=#gAH%eWofwn>T0$rez-m=h=aWpAY#KxU9~h;01DV}abW+8&SdRcs;*
zSk8bcv<J8&I4$`6O&A!j!>XD5Mp2yzJkjNprSvO39VTrU2uiIjdK9|8=69qIla%|m
zzP8nGHf$7YZ8->0r4Sc-1Hj(yUtqGja1Y?msAQ-SN6BF*>d&P-y-!j+{54AYY8}>f
zlKTLNxPJe&B4Uc$N&sU0TjC&HP2%M@cj&^Egtf_Pgn28BNC@n4)wgZ2V2mq+$4Ul-
zY%N#WyKqEkTp+0fgv-e$Yj-vJ0@0Yu)_8KTgWEwPqs<5EeWZk9+!-7?W|j7yvl-o<
zT5oMFXSusL?(K7DTOHo;dwlIEwh9Q_8m+IM9bn3e0=m9mw2L`3tRGB)iX{xVD(GNb
zv2oR|XpFvg*xcQ3UV30Ut*Qi1%zJC3yFgiB=;G;S<#*Tl5^s~d5}dYXt2ncD+}K-w
zd<NVHrY(<GQU1Sd(93(_HYd!U0Rq!8p5a(fxJ~#5rX7LDxW{EJZB}ciuQ@zGP>V}r
zjS>ii%C6Iap9pf;FR1nvRtE~kJ4*mc@fIdj@U#<`6lTDSoXsFgzx?s(PpVMw#USVF
z;Ma+CzjoT2Y2`C^x-o<v>|d|>y=bxa2~gjC;`Q-PXZgR2xc@&-*MZMJ#3yo*@J5GU
z@V+DC3r|ZsZ)x12|Kb#$wssTuIcW>)6?*nigHEk5GA~jZTVaKBegw<h?QVli``x}S
zZi^RWUB%gVD^@_#f^mTo0xHJK^Sq;Hw_4|M*}rPz92^^4#HAHxwYJM8K@a;6sJg_h
zu4h2oS=~wYUFA>SG_2eNlDWs{eBFjC!+VeO?S3Ez3ay5B)#=FV=vkkK!`c}^z5KUc
zk){;m&rq=4;8Ohij%=^#Ta9M#R1>q1=ICXyifBEsg+0{GSERY|a%=zWTtTRw?kA_^
zw9ZQm%O`mhK?;nOtI++DrCbx-RdG1Fd3g0iqRT7(<A~lRezOCMTjiGC>?R7C-emrj
zjDRC#>*`J*;_BVsnWFMv8IEVWXMSPVNHt-YpkLV&PaAV=oBacs*9)Lfxw>jhuzP8a
z>42POu!6wt2CF}sBLC;yd4tpsr^F1CEu_}PFx%DEQ(Avi3n>8&21dF<+J`n8rLtJr
zrZC?JhcwR3G%LGr^>;)+@s1#v%YF)GgEt?K$G$k`ES-nB?%Q^h_#TXfnGP>tg_E(B
z1;vzm4!J5a3;mZoU+B<_a+(|UVDUTY>s~bJ>8aXalr&P8;}F9-O8<0X5-jZ<|4Kkg
z%!`HZAAOM5s?}-+@_T^5FZi3mLeWUzX*pQYdYO>E!<IHZ-R-B@e5Pg)2OX+{qhpVf
zxZy!KI7X}8qOUbCPj^v15EOzjET%AdKUx&oA`C07@<<~ks<^Ap3-mWOwtoTGRXi<t
z`YGA3C?wmK)hj>R1rP`8KHb4fl>j@dyh;u){2`&FHdwVPuteAo#t#Nk`C_^@FlASO
zn{jA*>8S^}xv~nXhMkMu30(>OR!x)~eXMX(bc`G!l$qh-LLzvrjSNCS9#*%Mp|Tzq
zSbRCr;}aA!8{&*IWJ-D^Ea3kQs#s=7>g^ye2jSWVY}Z)iiD}^T0CX$u!5#REenU1z
zmEVw$>eE%tD{~iy9ZSC>LaH=6RzB}{go^4+hvDB;-0<|oI`9t)Iqez?0sKsZ*W#F@
zwSTe+=(S=`4*<ZE)W!;)GXVO9J4=r54n{NxccX#TyJA9I_~}zOWun=K1R&R8o^28n
zZy=VfsDZ$Sc`lJNPpj$+Gyc|ER28pzc58k{jn&NX?5yuefUp1J0v+_?a9$mF9Jj9E
zH2S@8Ib9p|9rW2ou0DESU?bLR=~PRu<*>My5q!vvbF$_=`2;dvP`8kI_Vy`;EnUlQ
zetNv;w<lNzIwPG=iAM+an@tCjm4PVUG9jaAX5r(n7nr22N5Ho*k%$8iMX%9%;$FJ4
z%FgTmYdR_8rhg%WKGP$I$AlWn)SGpQKxk%<te<0n;=<fGLB0=^R94ZxwBE;$n9@4d
zI~)>GfKDjxa$quBYhsGv`I_Bw_Q&Vi<NE!Q@sVb(;CWZawwC90^0_#nJ4M)jxP6Qn
zb$t%8z1?kFwUVYS>AoRU8nPS~q^WV*ua;OD`Iy3I01@ky?J(x6!7;?F!IM2<kK7(}
z({i~*0eA713HgpYp8vR+rSbViJn@q8E9ZJ6Q2SKc@<a*H^Rf}m!-Ch|FGXqYBvOPL
zJoRW~-nxX5nQTs>0>CP5h?_Gre+(d-i60gA`uheFC}wom$*1#T`6OZmuXxM{wu9Xk
ze4~nVYiI?&f4x8QlNt?TcWCEkUjq{1ZeyRw?+@PBEMaFoO{&BV04^zPTSSF=7k*Ws
z90zoy_3IN}DA?Jr)2D3(7STDWVg$@>{XHRxf*XAnXApzfdi#@Ri`hKGckcf}h`Cn0
zjKV{3Ue~5F0hEshMHz63n^%rVs$;x;L-Oh{A0%Om&&Gi;K}2o1?9*Hfe}Zij$5&+n
z8}T1WI+2ki45K@8#I_Vu5V7vNiS49(MRKX%VKul}ie#j>N(pORDV0c-kI(GsQLcWj
z0rI@8m)qv9WNo%h9GF13j1H%1pOp7Sn?Pqyc+s2l%jqB5C4WjM<pX3rM!Y!37W{%Z
z!5z$d*nOD87udAi1g^soDAX9#&7+FtX>SXF@w`DKd-bN1#ejSz2M<OF{z)VK)W8sY
zUSx)rl4v!g6ZLiODke5#UJ%>b*gS_4+#85I`Xz*|g8TV~-ER^VpUK`UCU(mEo9a5j
zA`H<O5Zd*}_WjjRoAIIM1Q0Vav-VR?1Qp|Mw}NLZq1}5T<*{60dUN5*%yYHpj;Mp+
zo|5VvInDZxocB)WKC(gPL91|%@Q;g%YF%6-gDhS3>DX9OKPanN2-p5Z4=)W*+zpc&
zaZmRh<aHK;?Q4U7R3otdF|z5<_Y^&D3SLr5d#!phC;n&?9*%Mqs{G!cJTg+*hWs50
z64JZmzk#nIUP=u3p2y>Vzd1j7n4f262+pEwN*UoS-98VcrgB`SR-D#@Z}G>JAP5&C
zUIIZ?(J&ap_3AnlzM_$@E0nhwH%{&mM>ufq0^xnH4Vc7Knt;m5!?zH(!H~xwqAf|G
z4K`4BH<%4!iTn42OCIS}L^YH{&(`<%%(n1M+-dx%!c6J9$g3A#m=x3IL=xV;84E&`
zkU55NU!q-85|a{j8%VPd^dU;B+#Qd@e5rERQX*W}&Nt5N2@}-TZ77Hw5A%OM!b`Y0
zSo_Al0u)#0EM|S*^#}3o_}`n;bZ$9ULKQ<a#H>iK4iwL47nWo(p>n!*NgQ(-yORo;
ze6wPRk3$SrzXBqtJ(qn1D=jFaF}@F_bMtK;nC;Ej(O)k==S+BS^lqCBBoE2omdC31
z(h%sH4TNLNmntZ1XYrq(big0fwCCDR7by&F>*({;SWW$*0&Xpb{`F{{`hKMRfJAL~
zj5iQ2#q5JgQ}vSIZvx(vgb_&RK37+dZp(d=pcasQB=Dt?Y4HWaz6m_<c=Wuj`fDD%
zi5Oj5v<u`;aE%;npA9;V@Q>*OjcCNT$2}km-0eFcE9ntY!0^YEn*B8UMnpjQbE|K`
z!SI61cGGw#p6N{p8<lBC_vH~SU53!q$U$%$gzDdaZ^9*5Iauk88ocz#8-8%%7U}Np
zEeXSkF$Z{N&wTX&*d0rPIE&T}1s;zB^$TGw6(U);Fs{2m*3j_ycqkSH*VIj>gZRM4
z01`yvD@US9G~uGc)xq6-(JWo2A?97X9w%llPJ5aJp19x@G7(lHnV4{yC~1iS4jDGh
z7^JI+Fx}`W63p8thQ&EZK}97J*r7f^bw}4NPV^Yh3eFd3R4iCn+!yf@D-0F@0@4xB
zFC`g^#GpX7G2^Pp+DE@|Uw4YQV8-c)CoFtypo<0TnicUV7k#U138K(YaN%MYXAzWt
z*=sDn(1GVjaU`PHnF6JnhAqTZX4+~eyc6}S>}ae9>i~Uyw)Z=CV+fy8$>TiWbZvg_
zBTg#=J%Az?Iz`wlgQdo+k*BAk+R=YW6vOW45U$H4Hw(@iX4Y(@94@kkb4U7tlF~!6
zF*0^QMv`qS4qW9A6B5B)d=zSwT1?{s@Q4{sQ;<=F=#z1mwMd_x)D^Tc1e>7doiN5d
z2XRp$LH&)Y;Y>*{Qq=VzcrkTvQ^Hra-!4h8ck!`}*@U`<y^u=pua9e-j9P$fuA1wz
zY5-W)Ak*kT=Uy;arXs{-NizJb*LBB6duIqfAQ&Oqa~7)oL1yECxj*gOn+KZSAnSS5
zF?gQSn|}c4pK`!1v3*;6*3WqOw#>D$l>CfxoN=z<)>3nJl}t>lX!U$Vs7Ch3596N}
zr{#&(dnr=>um11nj2jjO(tNH2`P`*`T_|FqTVa+|j50awv%HAuv9LeZLFZDU*Pzwi
z{1904sdw|`1TJ_#)#bu&-;Uf8^nHGIt8yx}%MP<vRVttqRB6;eCc3*|Ex0@E!!;c{
zM$K?^We+#fD)vO*UEDS-xc$cP)nv8(R{l1WxIV=Ic^m4ehAoU8QT=KCSM}ntA5&uA
z*Cprfo#{smO9xLGZScv6h=-A)-*y(aN}VH~$HiDcwdZmh{Mp6|>=G@V>Trq9Zj9$0
zG|z{If{kJ)gG#bxr?=QAhUp-t-K&T6S_+`rZT!4_YpidT!zL2)Buz&BC5O0&Ofjra
z?T{hjYmxmG9ija9y7eZIMmEDnl`FIUr1y3|;4vNkY_p`WO#G5}?5F$63!FL=D1_xd
zPTeqYRi&TH@=_wdA%s(l6m%3GSN2IHG!f~wj3@uRAet}kE$#t?{2n$d#$g7XIMO9a
z_}%T&ox^TxMMTGbO`)V&kUNuGLV>U;mD|N77{(wW-lFe^eNzX#cEnXUMwG9>G1G-!
zYRp(Cl^7o3o<LDeIkrpN0A29g1m^x|Z1sgNWemt+G&H<z7Xvq=Xg|odUg=A@#a}N(
zvxN;ucv%E-QebMnDStQo5*l76x&)N1nde0sDeR!aVvRH7-2MI?DR5O3NWRr7IJq7Y
z%vXd-Nr|%uQEy}gPs1f(p65j88&TX*<i1Z#rsxdBBNT~#y$+cE_`TGB?F9WUoF76Q
zCWL<+!^alCv>wGrMq_2UifBASz8;(L>B<@f1=2RRla2ovF7%Ql#v>oozxJ;i#rF~?
z9?Wyv7o4Q>DCNW0y9{Xt<gL{>)O%$;v~p=0sW?t6Pk%oDweD21m#BnR4D$^vNfH?`
zb$8W|>0KADuSfcjuY&dJ2`&Kb6}~C;w=wzi+WO;J;$0zUCY{rRl@Ng}f+Cy4xvHxN
zd#><Nlw0C$MA$d?-RDtWSi7fa#)9r#zPFnM1J%Bdca8w6Fvqz&y9U0B^@XxzAya>Y
z*cQQhM28T}8OimogRjDXq{w*5aUTPLNkg=ub@1N8A;ps~&^>zPZ4XK?;CDT+$Qw5T
zSN6#C2$LbJ4~AT>&Mw!x{7u@0kg<N$pXilH={`oI#UY3NKc9dH1%J_^<7l{uk^p&3
zZ1MeRj=+Px&s;{<Ib2%X$%a+TbotPXH%3jOW~>zW`+ln-ka~2F>qSditghz_#~iec
zu3r+vMayLYlSPKjyhT!DvO`bzr;=xfZu<O}N0<3zGD*!%9F$pnF|u2br=XvSx7KfV
z?~j`~l|Gx#3Ha9L^&9~t+ECVIgwsfRL}cVQpn`c;t$}J>bjilo6Ls53+)n7*_xHM#
zlDOX4{9ecA>Lmy6U7sDtLcT+fpvU|w1@2*IjLY6m-1kJJ?<CPcwA#;0Yi>eZv}&ww
zs`<wiHrGQldc@}75uLpf$Fo^%BkV<jY;i;x0P_Cu>|<Eaq+72_<Y6Qg8vMBTx3srE
zX@J8erc_hL^YUnWQXw1M<^6SrMV?pD4C+Kh!#sU$qYLCx$FmtrK+U=$@wk`2%&;mF
zXorn3KeL`Wm#GqtFhTV+72v3a|K$_^jI0<w^laXVmnd9<!;@@A*+xs6w9)xdVnw>b
zamKPB)2xdVZ`~R8oojA1rtnGN%IjU*pa`|d-gqpFj`pFMNrLyLC18mB{dW4_S*NwJ
zM+tek%0v=M4bjFRauhbXO>mL=PcGetNCznQRouOlK@fpS4G?58TN*zj^?Nl`QZ^xR
z3tm|4R5l_16)we;*w$w@{6|)|Og@()5~L&dI$)=Jcai)4h$4`la)y$Uruj<~5TT~_
zJNTq9kX%euD)?QC(PBMaZ*Xm?af7(>;A;w8N(%R#W|vaWDUTC01A%XBpgCh^>LNsB
zK-f}RGZHZz;<+FxCWkaj2=9aK;x=1u>MBr_3yjffBobct(L`n%py|SM{|NRDGKlS9
z&=n7E62=&rlW=EOMJ!vqJx1?($h}q=V|T}reU}~^!gP3WV{8PQ^RY!#@FkVudnt<`
zuW;6S;~os{?q=)|BBh`)5Q|NX*R`!?rA2}uV^J}Xksm14T2B@o!D)CbwNz#7D@b=u
zmLS=V=i_Wgi0a~QsGrv3LrUyn8p8(Yz${AlMTrIUZ<_oo#J&I$xJf|v0!DS(9<DME
zy3F*sn!R$vOc4(5=5UzNb(`JR?m@7NE^L1{4M%q8ZREYsBQsOzVo_k8?@}*hr(M}m
z5%Rc8QoC2@2c*oEn~#w3V|H7NwmwKAJJDJMmGfH?sTbj5XHvkgr;3R-X_kD&(tPVD
z6>sO~#>Z$H`d^+%DVSIEop)J52PlwPpD&H<Oq3&fu9lMXk0w7~&Zh!*f@*_XOUJC5
zYY3Ex<5!vxO7`}JlR4`ajag~Z(Du(B89fSo(QT)ZILCUA<8_J4J<gwY%aR#fUuB&&
zYIbfmMh%tAZz5jT?@aB(@|S#%;z(sYKa(*wIjrX_NsG32-R!qrl>IP|-)vD$)Ku}^
zYZ0j=9A;n6ypmVOcF!|P|MCm&s`~*W%iUBRY7edv)u1085$7F^+jrU9<K}w_@Y4;v
zcD61>_2<7_jsx!(Ga=p4WE8~QHun7i?6yRnrMC#B1)(>T53Wsh4V9LQwEs9%IzaO~
z_Jyw@e?<=QCi=hMUIB0-{-V|aJhaS-uN<?5wWP}v#4!8WsI31u6M#T==kHt!Nf7(c
z6Uj`#Qn3*c%}5o7TP!V9Lo+^-5(I3b-xcTwACtnsAHS4Gq<Ok$CyaHX{C?@{X%f{4
z{(zi-clI`zXR$%=v@I?&j1RB_o{M9AmLS~j0r@#ongq%@>mYY@i&cKevXGYkkr0om
zy+nwMEK0gD4G6zx8HZt!&nZf+gvne0(a?811Z)?)-G}p$nlbJw(yO3~@k=AJg^stU
z$_{Gt`+SvxbL6Xkd>k-6iaUJ51KkVVkzEN@_Qw!qA$l=iB7Kj7uWnFpf!xYj2YhB7
zixD_u;Wy&1ln#iEjcuh84T@Z_2ouW8ixg)5I^}@oJ`OL~fp<RoQHTFtLC3~(T17ii
zj=<Y*m&rz)%!@{<Nx`)e@fr;KTdgj^N46!ZT_#MrBm|%)VpX~yf%c?B4hzOXOj6u+
z5wq@l>!*j?YS47x@BDZp3Y<Lj#K_<D#=ZxL$m+V7({Yf5R{3)+3GL`0UT3tVZ!Tmy
z5CR{MY~)3{JqI%4Xr>mUE|dnu3^q#2^-F-gME+4sY5452Kb@o?^f;L{L1dmmv7O~r
z(iC=Sz?1<>EJ5FIB`cG^MzwJ+?xix!=3x<3uaqP{+_u`ZDj>Pk6xF}zKvl|F95Zy_
z0`9gd^PNnUf!Z~n8{ki(kuY5}{Nx+W-a;pn%*60a!e{hLGSef1m)Oaa^8Y@2usHOD
zFXw5Pfi6U&6zx6|8+(S3VocYMUD?_f&j>r|V(FfYRRnkMR`4Ob@$NdgxO~>Tq|Ud4
zPvo15TtM*5QWJ>FuaVR)eWjul2p#T;kkJ0CM#?XV2F~MRpkNTW6B-}!ZqV%3w-(~|
z{??f`a`RCxMJA*V2u=iYDQnDm#pID7Zp&URA8eu210I2kB>Y!2=VANJBj$@XSX~;M
zR>jYb!`o-KMI)6dyLZ5txSipYrQ_#gZZ4>RNlMvpec%WjoF>o9q??<$tLas$Fw+&7
zY!V-!2RzjPp%~r;;&OD3K1tsoYAwQBA?#&B`X6&+8-*}M^-2bwx-?v!{0gDi$8!n|
z=|pT!xk?SBukSiU9A(&)wbGInqM6Lq;KxuC(5R^7R7ZYWP&pA<axC}hxc<c8Kfng=
zp-Rg7z0L3XM^Y(R%O`CZ`Ep|R!GvLtc^IO^!93q6=tM{1aov<*F%A<X{lu<<Z^9c3
zzokIeaEO9RsoB}HI_|^sQ%jxMac5V_X_8s=mn1TS?ZZyXxCZ8<VUe*M$tgSkoXi3K
zUt)1Q^Iuj$Fi3@%rqp=kY#4i=eLI_35vRkecf#1ueg_Sr(8de9fEOgkISqZ>DGYUd
zT+4im@XkJTU(#e_5!z;vMmsUdQ5}+1oSE;Ao61rTktW+UCX@q?G3%KhYj!$18H=d-
ziel(f9*`wqX`kmSlDYnSFAN-5A9CgQS0U_I`hXstxK7o>SofXw4-ig2lsH&RDs?By
zm9J$uqWX8wd4N~#oX@YB+~Y(VnGACjBP$@eVsz-!PS|NB%T=@sWj*~5*mWW?;tLfD
zTo<XGFhOJajWLY<X@UOQ0&m4`RMW~fj=$Kt1K${o^J<dcYfo2;2vv%Y^DZ324+e1=
z1UdDjKAv=7UflxKs-}N^7}H8E{u&2EUrXF|-IoJ_LtN6FcPpA*?so^dn0hIwEDJLZ
zqhwyKcrF@@CGN{#_yxi=__LH)yP)-Sl~Yd|jAv4{aWmY@-c;H(wk}&y+#_^LUbO`_
zF4<b$^=)sMuwc379x%dL)gw#s-~0VHq$Ge=m}1(^o0q1u{-?SRD;DY10E=1r??R#<
zKc+3y6-#bEhc~Uq0<Dw&oNm>DJDK{vPlZgZeyUktz<*~xm<=)xZz~1_Yluboto0Sp
zFym*7+~efWO@32V!p5)qL~GHxqtqcM9A>jy?EPINC`?-OJe3>=jCjA(aqYt$dybn8
zv4PeuRf`5s{3>aBwRd;_<F(_?Nv?1Wb%UenHnZ;L0mu9tTUqu@PaG<bUQR#2%S)9b
z<E+VRT(8h&Io|9wsh-b1ehotGYxBdfNLs#h7iD@vd&+Q{zrQ@ipDxy=0_I7hzZJw3
z)s_=mj@y~nJRh6x_87NX#F^ZH6L@sKX!&&WJZl~bH9O_B`gHl0^X2R@gibYj2q8A<
zLx-7mBs_xt{YB3a2A~pc^4N$d>VQTX7!fv_J}F}cWHqLagZPH_c3H7cRE{B%DN<<?
zSsW7T;5P;pW+76wl9<OyQWd`8*5P6iO{*P(Vx^rkbsrOhDv|oo$7#TWLGH+f80BR7
zyuD#}%E$`lSCD=zY(V;9{#r`P-HbgVg3*#{_lwtwyu84>!am6fasKSdu-m=KLgPFs
z(WMU04<hCFkJrn^&f&ky!!iDjQ%;wZQ_dOsyyO2NG>yoMrJkfeh7m~LjG~v9ZA8*o
zwwxiI!XZF8CmpbwAOY}VRPP)d$CY@K_i%|RjHv>A3gk2M0U#=w-=q_W!kgQvdokvB
z#}Lm8@EGby)c|93W&6AScp8Y^0p9&bQjHY>hs9=}25V?pTNc$^H*p;{OGXR3${0|H
zMr0g-U2-Kb#OI<@MC7A{z_A$$OokdM#LA46c}6xo%fIB(`L0KY1-Z9c-Jy9XIqpZm
zex%;uTLfRulx1o!O2!f$;I$J)ur<AnXsV03$I6_j2h<i?@fyd(Ysn<NqXAk@zB=jO
z8>3M-QI@V7+8JPY5Z;SBuXMz_4;^DwkbmGr9{;28N_~~U%WAo~38>BMJR)km_<6pP
zD%Q?-(kx7L-HLKfg}Ft)?-a+k(4p~LlIXhe@UV3Y@hB(^*dCALSXv&&*+uvl>}E<b
zedHm@!pK$~_iqwRsRlt9oo^T{ea+1p<KQn1|Kq0qA9zyu<-VSFQ{$!R^fc8F3n>0h
z_I@f;h=>UP?@*j5)5etHNQ^U?cW)X?6OWei>1-+;sY3XBt^D6;Bp<{gJMm602I-%i
zZU7zR1MjS#fuDq_=P;>=GXP^qydsS+l(SVgQ7>uS`62VuxQ8)wQ{c?rj`5BUkHTzW
z%!PvbJCo&88ELk8S}+F@hnZL_b{t(N!ofFjQ()Qz>gNZH;{=bQ-$=!~+Ws<^i1rr2
ziXpU2if9xV7Bd)*aQ>66DbKn=_-`wbFdVNWFun~#Hl(N(d64sO^K06%hE7suWt7{6
z)C9WJlc>sRgSn}ZoNu(;sC$#EtY(q{hlM6K?l^s?uoz}Y3KB0yAd?=}lf43sNDW~a
z<TNlij6OA7I<nc&a1}?pvNE{9@5F>Igv8=WT4+{mTTV_QSS|Yvie;(u?)Z3)2t4CS
z?)z@xSK4AkT~Mrd6j!29v2mnd8r)Za753F9sYon13jQyX>XlBYS=A27LgSl4E-(`y
zY<+^3z-4-<n@MGa^IMe<Wp6B|Et_@pFo;W5+~+I{Qhy^29XwGmQW-9y5-?XL7_<S-
z)4i>a2NegJB7YW|ylU{o$J91W4?yN2K7j;c61~+cRi*>@w@>%S?@@b;R?r}C&i8LE
z$&5vzswK@8gW(d9_wNiS<L*=D7hj5ys>hj+J{oj$gu76RWOdFOfQw!m7d{l47Lo3E
zJB6P=4~d2Qw?^|yf1{@;)~=}@VeS^wZ!E*iC@q0^+T{rFBE$uNO`NSRKJep(N}K1Y
z9^iP6vN0!40cjZL<U6fI5^VLHBc*z5mn`CF=YQk%%J#QXOCT$rCCJ4)Y}){q<mzKi
z(vPJYxH$b%M^)=ON~QPhKBk5DBBXPxg8qVeLPx71!B=x2j|E9(W`NKrYoT%`b=P0>
z34^r4pEDBZjM)O(f-RqxwkK@ZrSorw@0Fka8#E#M@dcWoS5OPT>@O=N{A3rCaOte$
zV<4{<+QoCL6mBzp@Bs*<Z*WOxcOUi78IuCOlvhCR#Fws_YU81_%fj2~A5B}t<Ab1V
z$)4UlPR1cnI}2NO?vdlxnORBW*_XPNz^IHpU<Bn;d84^)#%x;7s80FEvUKS&<Fog}
zDdHI*(BausWCv1e60~i1kDS|Hvan6Se;bDj)A=rKG|N`h3yM;=L*o*mI~v+R%U}S|
ze5YiWIa;OKr_8?5XP(jgm9~ii;F)_FtZ3W4;pb13j7cmBaE?_zBJ3T?&ir#6<iF%S
z^&M}MzvNKCXiWTfK4JqC?v2rT53fBQaDM9KTai2^<YjqGnyVMwZGj)G{4BHI^<4`^
z`%bmZd=X*9PF(m3avi!6i29>gey}QH>YGFwN+Do@fB0oYlFx^?!ODC@QNOWJ=TuA*
zUMwLdk#3QIweip;D%D^~tNg`r&Cuymyt$JwUJ!yW6(<#L5mhA`djN$13Y2X&AsiD;
zF`1C?a1V%lc>Zs72GyUU^Ar=9`l?E*+HE7@Ma_Q`#4?exE#P^vi`l6)_)8Kze5Sxe
zliaZiq2k|UkFy*=eOYl4OX<mJM%T!*SmPAbpQNJh@UEeV(?LzbC?S(5;CPw8s)a_I
z3Y8%%(T_pccR{3L$|qu^VhX(pgvNli<BCKH05A*YE!tAxS&$NVRC>$YF)q9vN@|aN
zLl;J1_Qnv94^J{)NI9^Odom!FBw;Xa_LbdkbNYD*(Ho3nV+HAHaO?f<(HkY$zUv~;
z?*(3u44;`&{blKPXm$gryZwox=V-oWWND(xP&PUym~k!;HH#t|u_Ucb&nAkm2v3JR
zbp5fcO>D929v+T2*mMw?;%YRP3P&4lq)|awd^tZatmsuNBC=KOMxsnUz<LkA9Yy%G
z-LU}0#W|DGV1ycyu55z|7J8fluVG9q8|})tDn-1)r`?ZVg6O2j-E9@)c%8imW43qx
zmNu80hqF0gDp_MIY0dn))WCFKd8~8Xl%9Yhok+a8B3Kzqi}?5X;(svqoSYXHi(dp!
zT|ul2mA1oZLx#CYhq<9LFLOhz`>J^O+1&Sy5zEbpxZ~z$_4$ysil0D9#|;Z#(}wA0
z4ANV}CoG?h-vkHd>JeMSD`Y<T3at+1f0&dS^949BGz*ZQdLL)av+Vml68cJXBB}(=
z59~!$b@C^T3(q>&;WtKCKUQZfg5pEi%$-#$56ewXjZ#mx+|xk<8$`e#L<E(Amqrso
zaB125m-l4yWe=``AmdM&Z<SqwTjz7R3h3k7bj~3=d|xhP<d>fx&ng<Z*GXRpDTf|G
z+TUVM1$#i~-uJGkXXpMjwruBtm4YmX>4-bnM-Y%1jcN7uYkk(9xvTOCH1*$qH{?Ap
zSe!#XN&G7*azC6CWQgSRtZ`>QJ@M-|KeG8n%sNro8N|4xq6l>C13uU;KqH-Q_HF<t
zpmqd~Bk3#2a93bos4Qoo=9Ti1ipQYn5=joy3BzQk=zVdDaK&-4NhC(eJ`Xs2Tii{#
z<tut~o@**Sjy(ZV-ehA8?(XTC=X|LmmG%TSjPD#H0u#egw-iUfO+8!!8qbs9aEUt{
zAWj{967s$2R1mYTVmWWKbbm!@@z!Ci2n0&bh1A)UHb2eYSZ?S&fD%bNsGdC~rDQn9
z_$ipuceN@l3_}!pzrCycbAc4`Id4m}exbrVE=m7%>H>?DB2AQ#RLHkc5HW*c7-x-Y
zn8X|@HXJ6}3AO+r@Mopdcl3dd^+JF)-9-Pz^Kr1S{ZCfG;`h2z;5><fY=RhZ?$!oR
z1`Py(TrS9Y?WRm+n`ite!Zj<|9vepY)IF4Y8WRJ{1-r=^fDP2H#I$?MR{X<jp#0tK
zDZoG4Kn9qP8Y@ATW+tlXU;rB{_gO8ap>Ji7cac};`D+oP1e52Rbxg*udGcS&!<f>)
zWFhK*n?$3)$8pvwkEl<#hc?pzGn8WknVp!nE@-PuW+vF9Ol|Xrl_Y8HicjSA+126v
zA<-9pT~G-jCMDC-a{Msk=RYRdyo*BJaLa(eQ`>bXXdB1d0psXZ^-X43n^arML}zqT
z3KR#&5Ugtc-+=<}e*gs+VgOLEQkY=K_QkfhjF4Lh1romE2}B?mdvM96viEt*Onbkd
z8&Lyd1w1X6bAwdEqSeFS>z4$gc?*2h^V!;^Go3lg^z|uMsl9$e{Au_YDnD^aJl#iJ
z8Z$zzAWGeIQ69U+(bh7=t@*fCDKslf?`V2|wLQQ&qjM~KJF@DxQRQH4IxsyXPs)Dd
zeOCl@xJu*w?FZ=IW4BW68veoUvG+ElU?H*KB|i+(%FQ&+wV!U;VVPG0$?ub9^g-L-
z5_T6GvTuuOl2xvIJDO-1c>5T#rOY;V2x!<J)2jh;4#0pY<G^XycmU47U(EfG52Zhs
zbHThkunHpB(E=P1Om?y-pIWrs*wwRU`$moR{{xT909HY+f(S<e9P$8fsa857%DXRX
z36ET7@AAP&Ht(7WEy5UaUP;BUqKK6H++V2)*g(s2lh(*<wE9MnzQvPZf5wMn>JCwj
zc=|1={0Xys0g&Tn+?|BeM=<JjSN6ugvq9Vr!^V}%&hPxVwRhj|)f*LVhCGI8Wi$CZ
zA?f<V8VzL#B?|3UIp};gcL;N0x<-<Udrn|u2<a=Q{<Upzk3ALN+xw}FpyDn~)e=+X
zp|D_{?Alrl-s=UYV($pfza)QvGl7;^AaU9G2xK8@-QumS0c`b#(DQ9v43H*1)ze;M
z9iC)C48V(2ZIpowDWW?Mz@aZ*h`tZUK^4Kdwl9e%xtwj~J89=r+-^3)7qqJ!d-aJZ
z!FsG2(4N615baA49Xd=2+!<uj?`K_tuLAilx+)L=W<|W6j9jNwzhx<MG#-#0P>w?+
zu)4EG5!XHh%k}<!S8F669k=}!`93fu(t%az$XKtj%uFmu{EcP|byT%fz1qei8Ws`P
zw3s*s_v0eN`!1x)LgcOe9&aVqlLt{p*SIjJ)>Px-c%_6MKJxrEvguI9>FD#o$)_28
zKaW?77uWulLD!+kpRBJEC?<^L2oaTxDdef{7`NKI?tvOR$J!iSfJ2nq2r;V`>|Y7J
z<{ySR{F)ezW|x1qqk)^r6Uoj*$d>T$lgkTSAZ$qevbOx8qwIVlW@l1M2Zcaup*%!a
z3sNmLy{@lpG@51mKhxWR*Z<PRD>U^ncCIyR=Zket#%y8MU>*pO_ifGhexM=y#JY@D
zrQmur$1o60nEC}w<y1h3+qqg;kbRlX(e;W$qw34ggZZYJhgGjM)!(XPzQaU@%}Qtq
zDu@DCWli-xykp+<jx<|4vwuq`BTEmtNvW5Hh`CcowkUt*M|f%%=;^|m=d<NW_IAq=
zTZ5Ovi<+WG|Lp$d)$cvf%>FW_2ZU#FS<aSMsa)S#t((lA{gl5AeAcn1e0a)M0ef$h
z4L%>L-+Pz_g~pfy7<ft!npfuiY@fi5qFtd%L&=2m-`fR;+43%0DN&Dr8v(}+*6k%=
z@Sp{(Kp`p;2qPoaHrh1P-dS1&uB3E#?~h11v2C+i$B+A@8wh1^M`S;pNdF6+1W-%y
zASB=w!z^g!1b)jK$goHdhCa!mnMzQl(c<hDOFPAVVSG5Fo>crD`Lu|AP%qN$Q8dSJ
zJhN^+^mjTIHHEgQSja^fJN3tJW0=>9q4WjoYmxM6SeM=mvTKn^yhrMVRFP)V%7Kqx
zJj7y$zLBe>Jx8(n?ZzOLT5iG1=2^b2o03YBctYg{Nw1+GkJ2?#+DTuX9V3^yVwZrz
zvC`cwT5fY#MYU>dZSpeKNXYpD*-Rue;Lm<bw%-;KBD1|YAOMi;pJHN$0M{RLz^Shi
zQX$-_n1MKqWFFwa`HsE>>yvu1mT8Yfu%;La02~x?(3yN1jB3_^FL~Fo=UGO(;Q&Im
zVHNt(@dE=}3$Q3y{ghvrV1v*`hj2l0&j6Zg=f)x|*!Qj|7l7RonfJ<`#iQ_Ndy8ws
zq{{yvYhM{wW!i<Sf>H`>5CQ3K5Rgt`6H-byNOyNjZ@NKRN$HdhNofS6OX=>;^Dt*-
zK4-2u|IRO7HrL+l=Y3bNd)+HR!!`(ucj%EV{YhYzvn5Gl2BECM{*2I^NUIugwytHE
zUohJz)P-Zvur}^6uN<lH77Q-4erAkP`^=W}jEbCG?bS<`92kMN7davSyGwgxuW*Q~
zSE<?84=vFH{&om-ngS<&EY5l!v?sdPk%MHUPsR}&+##lrMx0g`Q`?NFrI@YDPWmaC
z&1ZTLT*up+>j9T{s8EAWcjq}&e9m_i_R!z}#E?@p{aA=YKmR_V{(rlshCf`>3Di%;
z34Wph_PF4U4v6T=s(N{}Xt1^I^B7rwI^>?iIk<PKe{$z?69Dwj;^B`uRa_~c<0Y%^
z6x#0my(PF=y@9T$Q41m=m!k-D4eXwU^x9?g6Wfs+!f|w&nHkG-mu}+QY7XUWgQxQz
zW*O}R?YYY=`fC-U9~g8lUp@6`xFt)3*9pBnsu<*vGx0eu^!)z*8~%M9h)UoSqIIbK
zG2;TD@{0srpicEvgWC8>$-y)apDLG)?v`?=dBWA3FXQ&nhf_}0JuNJe4%#?;2Y#do
z2zZ#sycLCOdxZb0TWj6n9md<ah>#+`Hj92mE_)qFLGvpzjs%j8Sx)T7RqYOYXiCt|
z>rTN-+A35jd?XH?f!a@=ojKEWybARNU6CSVxP1(vG~_aLG-m!z=u!`0X5o39(LbIi
z)^UO2Ga&8M+0~G@QgS9A9gZVA1odK@ON-N#e%gb0h=I9|rTjxDo&7pwNNZMd&~t8!
znNNbAGu>fKRSDle1<|u+!5<z1F@mcSe}@9WRNlJ<X??%;c6DVrIlM#)TDw#OF$ZZ9
z)d4IrnECr7B!f6+=4VS{;%VqIHUrNSpPrUdiYJP%We%cu4l}>_2EsCvala;*yLyfk
zuF>pTL|G+Yr_bk*tijOYH>>S@yy}svBvT8)pYzZgAfr#+1Y?H*oqm5*Rm&q;t2aE`
zFY#t80rE=8w&Q}h)rSMBTIyRG#>^~GqvOd3*MN=Q;&8Ck9Z$B>;fDC2FdWX%RR%yQ
zNaD$&&Gqe>4;#oZgacryhNR+t$!KAcany`%j=L|0xib_6mDvW%)~#w6lC-K$rOs=*
zt)Fmc(>=q|`~mfOA!|7@I5Ca3iw#?$=|+k+%^1Cy({9?giT^NP++yF3OYBNdy1UT$
zSe0<dJSIkds}a_P6BHU$VO!@GF~_A!`Je3?{69o}U*B(H)J(Z|B0;+pu9jkQu=xXp
zwrA8nm#GXNb8h;aTpj3v;uc%&BCsL>1j@MZb2elBX>->3@}ny|;nb5IDaX#?6TQv`
zT>$|hm(I{Uz!-RV6mPeE2PydV5SwTFsPhh>vy;Nba++L{WtUKFdy;6eT_h-EPKFtE
zl;%eCy?C<8^X!+@`L95$>nY)*hKs39>5nkhhb~sFMuxE1iy;J7gHyt;I<A-*+hwqk
zM!zREX!3cD$K`F8Kejf$!a|3t=UIzex$Ch6&)lR@b=*K|J-1%-`O0Rw^M1O_Wa@s}
zaY{*ZtZKT)!ppmf7%Z5cw7sTP(rNGQ(k$*s!{|4LYD<qC`)yaroYngTR5B^=_?>QM
ztwI5GrTbRXqmfLi-ilOhPv~&llyyEiDl<yQ0W~c#`e)p~G9iIGz#fr|w;8Cubdf!v
z6f&2~ASax(5`YT*kaYLp%W$ltfbQz<wWNu9_#4BhlOpl<<JMs~(@h?3bdo}(exG6N
zccgC?fz)x4$U{VS?+U^Cg(;SmS3i1GFe%vUyQ%6;kEEdPY*Fu|SIyVFCsP-+EfARZ
z*GLYJWhr|s0RLX0Gh&NewiG?;YJhl2Bv%XODRJzA)Sgc}BJR^I=0{6X9y;_#Z7zbA
ze!RhsoIFb;{KCk`l$9dduuM=?uJWN@5lZbTR0)wN_}pd&02wDP@6Un}+t8K1JSpD6
zz97rfFEIP=8pkS&_RAGu5R{5LE=UZO3Y7Yht5q;hLOlACIR>jbJY^Bes)2uCe_*xT
z6Iav~?Am}}I#y_s3(b-jPov!w@_ES0J000X(&mGyLM%tCud;=;Y0vug-2~A}fPTHl
zC2CMOoyoESk8CLsy23V}N4_k(%a7#M2ZJyxe(kxjL|40!qt@QjCc)UTt~Jg>!u{7j
zT5@_nb1Wu%{B(jReO=$7VgYv_N0&M49b#G2Y8O<8{q_|xZ4a;8%Jo)AYayRA#eb?r
z-<?{>DEq5)6`3iOAUiK<)haG4Z_8I}dE_bQrfnyyvzUMNU#{pOwGqh%lsR%8?qk(n
z>E|mnhhi&%s6;(uv?OhF9)s5>tXznZm|9-_o`&(d`~n?Bmt-9s9TLY$`*NAC4GQe@
zk=aN?V8Nv!?AdiOWTl|fbhMZZi&iO;6LaR*dnEQ!myt&;tFRM0p60Pz&rhatrj*oz
zY=^Z5%$OZ)-JbF1r(+D!ru@o%{qQo11>=!*>x28B+HSk1*a{2==R(DcKMh2zRld^(
z06RL0-Kj=-rD7FEm?0j09Fum7`xqY6a-UI?SOh*>daotxZttk!E#-Gnerf;pz5^Ov
z#*lwVwhRp@nZ3zdTrqt89-erF0)Nh`iFB3<Ds<udSOvh^E<X`331Xou?)bU~`mro2
zLB0JS2a0E&5kus*9L6<`It05CK{6CuYqzR~i(x_XG=peKu*)~{iEQ9gLw@oQI?Ie7
zkAk#J@KPlNLXVt}_O#siZES3m*hQg=Dfb6NDWqc+{ru5`{Z1kkN&I$Lh<<t=4T%kd
z7*8x(#7jII1Tb8S8ZQV35Qj7%{XZz>t*#~J(X>;~gKUUJb&HX)XjN#i9B{<46%p&t
z1aV|#ncu`vN*BU{U1knVi5?dp<G>-E`cQ1?fboB&s*Wa-{IO!qX;DVeETyhuFnC-(
zxB(_d3_ucolGuj-P9<M~hR&D6_`4vO!_m!b6G9b>RhjvA81%V3vWCRjw|k{OSvnR*
zq#qt6>g@{q>6})ktXZ$+FiV|z3-*6eNRv`<k3skQql^fA=)=EJwFv1S2bEEWK;+5#
zRR#T?418yQeAY(QNl8V>X1k?hWMzzui??MHF8&KLq*UiWk;Zyi-gbcSPe1-=SL6O4
zU5&Q@6p%p3=W6I;+UR;N#-K<tHodM8uhU2`#2_%{RjR;}zDv@`^@~llVX1^ZaBc2d
z=J4A*gL(2(GRc$8m}6W+E*z_W)lL7%KKQ}Mv!~<3C%gh7vlx7+bx>DCkQmzYbqp`a
zcE|=&3xwqz$ZLuOk!a9a(vdyUe=7L2Nkj!s)PY^ubmCgJ-4w%sWeU&WsnAySyeAz(
zzjjZifc|SlKNvN#w-Q;@g(E(t4W$r0sT9jOA~_X)bQYBCF`grO+#t^`FI|!l`a?-r
zX{54^h|fpFCUjw&0ApWR4y+wz47L_zoP#cHQ@pmxug<3j71XS;{)Ckp7Dg*OBvQ2G
z+{a7hY&eYm>K;U*zwYI$Cja+pqfm2dJ$Tj72>937dL$BbX?b>oeB;4&b%wkGDiKZJ
zsXp8baZSZ^!7^k%0re^iKR8}>pt00Maaw<I0aSs-XbR5(Jw$G*V-l7oq~94V`8oLl
zK)iHSx)zZtQN)#i(@vQiAPSeYpppK>;j2%D=-X9zzrpP50hxvifER4dsa2VqWUFf?
zXffyTppD(FG~b$PRMrJRB3S-IidW^*e!S`NTh&zJTfZQ(PjygwUfHJptNC;HYh(y8
zUWQ-&e+E;Rv<w56zE}S+=p?$A@w7nLUe$_RwfPY}JOw%)Cfy*PK+oK_Rl7#FQ^YAH
zD-AbkDy|X_1a&EKiO6q+>jl;SWgWdANZ#Rt__!HU;KhHoBc72;CY@zO>yil)vX!g5
zR*I2PlRhB#6U5RZQO<u{kU``JMf@OM(69WY2&Cbnj~n+|QHp*bdhdPphEwAHQDq!a
zwkOmsC0^0=l(I}jGO;8o;x*IZgY%ca(i=}Sh(8Fuw7jcBVAwp0<RYod*Fb*#blchy
zU6&+}lq7$>ez(a?ME~epZQbAqL(&a^MIV6FTeTZ^mB26~r1KfgGG<&D)Z%s!u?#?M
zByzGT6B|TD`3zT!RWkzwsXM^1$&B%8ApJBzuG97FYLK7WW!V-q>Uh4B7Pr(<I$gIY
z*d|UDdM84zxkaR%7hqf>j!7vMdB=dfgW@K}6ACwkH55XEnt21JZOaE=Tzq_@^)txf
zC-R)Y^-)ZmJ0$4YVrDwW`rO-yD^NyzGTwpl3_=wp$}La^E1FY1C{8g<V@t6EmCOnv
zGG;PTbNx^cMjQzH?tnMzf93t26hQNu)B5tNi*-dpx<>|icg?R7jnZDuXM7o<abu+j
zPKfpPO^f_sJij_zpi~lTqo;kquJ^BE?H`3~WPE@Qf4I|C^9~f2Qb^vHh;R()N*}%H
zvdp7_J>OvJ6nfD<-c1&q(*r|)w(s*8hMi$C0Ni@8|EN^#_q&EOEIac4zFZ4LS-d<_
z2cr7S=MxjNkon3XuOX@3^G}?(q3-1-hb#RQ{QPr4pMyV_qU+f(_TZcYLo9BBnTI7r
zwE;l*c67F+^I5Mk!P2#yBIWL<cDwV<+Ba8+Z`}Bm)YvRCGeX1_q?pM%FW?n-pObXx
zS~v&v$&*Kkek_u&PcolBsU{w#PeT#^4(7`fK+lxRtew@{L6;EdZUR8D92omvcA2T4
zUU3JU_}&ZUBg>%Eg2jehHy#e~oVb_`W%!33AS1c04x~DohsC0V<Di*!U@;M3+v%B$
zH-UO=)Lq;k{0&%t+bq386psfKu)4@lr|n55FdJb}IV-r0ER>p74Re|E;l+HYL!|Mq
z>5V__@c;%02`hNHrn(`{juVJ97|QLa(XlDynDg$!@g*wpCf}8crn-((xg|BsQ|xvV
zbHfDdd1?eVU+VuCXz_pxJh}6$_ceDV!5PY*G0#Wj!rmp?zl^~_kwv$q$OsVvHs&)a
zncpjNaW9x(5DTgO7-+*l@JJ|0pHpSTEo^R*wAMWoazA!8A7Y8!;{9fx*-kiR<Ts+=
zM%4+$_O}idFX6-#Pj*E`7bJ-kiWGq=A%2eJv{8axU4W#sCxy$7{`AgFR<+dre8`2n
z8t6#tD+=wv^~Pi=+;!)ZL{af$$Fs~pCE~96R{SuGR=Jp-02nf`6>_WyNiKgN&jB>_
z{ki+~ye?*p@n+fz#G^>>ra3NCbo-v*v3CJSThtJIoxwz|$s72*5eMT%Mw<`rjxR-x
z5AImV=hCD=^x|lSF+Z;I7{}c?1~5t)=qK`QUu3FZhN_C>zhXLK?*~v|xbAZo%D>A4
zyIGqw+_sNBd8DNzVrT15#aoBk<oclg44QSZP_gqS9h4^|15I4N91g<_d#^9beuo|Z
zb^S2zp8tf8tE~nHD9D9l3O*I51I}7JKS(AYqNmv8M-D?wLDwVE%6J@wJ|u|Eq-9Rl
zwy?PYpj+<#=69YkLv+EOiJO;KPB%C<i+(L&p=a?iMg+d~!2JWNb}3jgt#t<K1FEdI
z4c3gXcgVO{7_3t}Q(q)k2Gf}YuJ(MxvVx6s(O;3!2nTeW=Y4o?Le}=|$?Jeo3cW@o
zu@f@={G!$wbUVD4#_tTYc$vhXdt<r1k1fb37}I;RlVwoZhVp<8V}n_Af1zWW7sm?>
zmLJTy?M@nDUjA6c98!yV5g7hy(WKGMbICz#nz@|_#|_Xllv`dK28D7lr;*5Xul$Ge
zx${4(!2hgp*~&QMKllS(XE%F{0eNPV5>HB}R1_J6ITzWU<+oU60Qb*A_a6_9ni{<M
zS!~P#H;6G0LhrS!Kq;lmbj^k8-mk^rlOX4ZB0(@^Uy_gtl`5>GyFlmt;8A`JCAYSQ
zcHv;r$(B*t=0xcx`an1-^F)`Vq+ZCG*TFykoE@CPi7lQIX=p<knLt7X7$2w7FbCji
z2HY(s?ns44^W#oZ-UhM;1=CPQ4V6)mx9L9SWxZ=)`N^l326L11Qo&drtJXPgPdRF;
z&}GT;($$dW{WL{cK>&-4KacbFIOn|0W!l1Y(<;;T5A#EzsR1x=N1VzI{G=DC7bZen
zRG9jjT|XluN!kgylHO%(KdaWTvn31{`Dgj@FUdOh29kAUjjZ9DAP9B#OR-r=9KJe=
zm&?~T!Njfle4Zjp&PAgd{=q6rt<g0b3=A=?s1H`T)R#;B$LBpv10VLl%WvkcZfps;
zgUQ=U<Y(c2dO@-NIgD^Kj)3H8UA7Qn2rZ}U_%f!B9(fOx<OwUOxr*~Z4{YunS!@yt
zWxI;OKm&B!I-5+%gjNxe0%T-lMeUE7*;rV5!fp0`zM`Yg^!i|eNg&@U-os4gKpE*6
z)6Xq0AKh0GP4a2uIfNN3+sTkC(-koR-aPE(W9DbCJCv6cRYnWcb^Wb_6ZoB`3_*^_
zj%*3Qm*&u^wiRCs#L4H<O6jk+S3M1xSGy_u?3TJ9lQlM(TQjvI!JUydZBpdOqObT>
z>$d(i81R4ZW2E+7OR|Kj&EY>h={=;Bd?0FR`BZ}*G53)C1iy+GN9vJ~Js)DGnCvPu
zp)Aj(!HZ+=wIOZ^NNnzk2n}a#HK_b>R!&8sX~?BY(u6b?-~20_mGjY!X!vnsAFd#@
zQ<eC~D?}uSYvy9;V?2m~)Q=eKSdT%Z3>2a-7!JhV*cfz6Ga&MpoUL=X^NGRbw0R5s
zT567xh3M)Y873dFv`89-gfvUvd57^&gZQ}q5=<y^M(ND56yk-2?-rx5MSQ{Mw(k<1
z=}3V^Z>bYy5aXTmRDGUA$(oNb!rPddNc%^^_V+}XZ88vn8OpwWpj3aq_`eI{mmskd
zUhEhH3Z2V)KOG+h^32CDKS(VpK1u&jsq3XX@$&$@7K~_v4?!}f66+ZB*<bNp+|8G?
zLbDDEc9Czs$$2c8JJ&?Tg}q4rVEu!$JZBD1bu0xkKvgFmqyb^~cwm(ugyYuEOBR&4
z`o>EJz44i?d7fN$7SIxQS96V&s9fnK6<#sg3f*cXBqX1%D)lP!vJ$VG^KU)5K|w)E
z;T@dLpR~=*3u75I)q3I?%npZ!L_67!ca|9HcL|u%bu&(M8Ng6_xpJ6jGUQ?HXRH?7
zhv&}ZF6sYu-jBqf*r^`*Cc=#BzdQwX=$#GflwVE*x9A}9eG~(PdMt|7Lq3p%)DRVl
z-`^JYG$W6=YYOv4l)HzlJERtC!PeBYyb;?ZBSA<Fl{HGmj_KFr3#QjGu~1BAcCMCK
zc{mvaE;d@)o}L1LT#W{p^VdNb6oqSbU`w?s=-+P5){n=NWG*bn8#Mar@<J2+RYH_O
z8k!A&esZ8j>219kF1Wd!tcZI^im?@pMOXMSIVD9mIZzCmMBOFQcQf3_#-31X_(f=r
z?7xmg?A<^H0>@nyyZ;<l0(B}>5K>HjYG?nyHr@aIdx$|%gLzf-czHR9<d>f(vUNkl
z*mNyla6K!hCH*F(?|+n(lw_*SUyBWaL2M=(T1nl9ETktB`p!&5W7*_rNf)L**W?I9
zt4DTB0L6|0<Cl_Ux*dgnAzW}2VWc5zl>i$X2c}vi<uKY8Ue*V6eI^xsAI7W+dJR8`
z{Mo;MC?xZ4Ab(qI?y~MaA}vSP6dzlnGSq|}j?YaB@IsNQ>DS87m~L2=6YM~VG1<7^
zAcf0t@J0cZh-)i$HW8KJhHSZ4u~acIf-rirg5Pf5Fb)2|PjI<MaVf=dmCFtQT(wpP
zZ%1iX6;~=(awV@Xo}{inqd$`#vr<`&P5eg?;e90pVh2wyq~d=;PXE%UyKeTu>p$UE
z-n``RKbOI%&6g*ZGFLWY^n69#zYJ-GT|I{|G<8))<unK9Hi_5Nxu@Uc3xqvINo1$!
z9*7E9t5k~RGbC#l^68*sXCD&{XV7kHc*>+TBN{1EsfJjCfQlap$QOEBd=aD+rWEiH
zxJX$<N%a=`kcnG#3F@9{J}e=R6hH)Y;xdF=lhZxR-b$74ZiH}eu135qmsMu{s&hUV
z4|b&NUz}{vBv+f;_9O*`Fp$RN%8X<LJxV3lthaaU>5Kf@jR6Y@iwR+>RZy!mWoYiZ
zR9zW3SBvf!AZl2@LdEX#;B)01rBf=7Y=OJvS&r%dQ7|qDa9^~qnZ1Y)y1fM0Z7(j~
z3!iMBen_zyOB`s#9hr+l6L6iUsb^j8jZ2^_sZ*m>%BR=%IIpGG;GFkJcKJsj(4`2h
zksTHj!hb3!v3De}>Q8WSdH#e=3!*~ABk)6ph&!heu$04om_jFDFlwZT;Hm?fcKL#|
zfTy!3IQSDs@UqWj_2nrTC_4HKpp*8m$E22_Q6dT|4a93g!O}d2KgRdOF_Ff^OMgL{
z6#Xh6rKT%mbn!fZJ?7c@GG39g7nh(F3%Iozd)cYnSONS$s)m%s1lfNgX1V{S1&R0c
zN<2?9H+<w>%hf|sM6XT&OylsM0GnufN`H~r)4DaD7V{YFHt~5nQ0pth!d~2JBpnPq
z##7ZqaIu&vxT}g+cG3N#ma{|)RI)ZW!56rvKhOI6g<uyDxq#46f<Nszu@mB1#y4H_
zt^z93uZB*VhVEoNy78guqG@apgNT-oY#iv<Y%_?pwe_g=_il*2@u~Lq$l$X2aV@So
zHR~P2wq}}y7tBVZZI^qy31;hG3+ei3C#Nt14{DNuzY9ft${?pe*~B+mLU*(Ft5aq?
zQTw#X3uCQ+=BX~2CZaN`Hp`Wt+{{gPCzYQ|TT>1c0vJ}1Aq<N8IHHxBEQ+p=S0~g5
z|Lak+-973j3<&?(oFMkbBo!n%@hdIE{Otw^dQ!Z&o=v1|we_oLm`wMe1W>^B*h5-j
z67~}DbhShK4g1WOCS!e;uDv<^U@P$%{e7qiv}c+!IRBC_N|)4s-d-<P>e^Nwwhbnc
z*PT1CJnfnU7ByYGRvtHVKP{(gXSbYz2JjwNYTp8F>jqMOy;1o+r$2Fczo(#*`VFcl
zZ_LxJnSW(w<#$t4?8IeAzkSu;9@i2Hc$hAT$@0I4B1??k6CYGu+@|b}FrcjsU(B#y
zOG(&o9Q=KjhP_t0JATai^+vao?#9y@PmO!0r_SQs_MG!3r<1wqUDGkFVut<FBvtl#
z!z?>rIPjS{xVT>LG;FhTC0VztCK!VAWL(!MQ+@b6Xz-=rv4<^;Uh67X-qFaiew(qj
zaB*2iF#)eQ;YX!HZr|g7e0M(yaH7xc|Ie5r;V!0F?j8C)rZ|WcOr3HtnAn31ga)D#
z#821HZ^a(6fM>&GlFn_{$gfi#ORLyw$yqN%|6I95NqA$lfJrieA&P*f3IRSoS%{tz
zS~(S8q&{7X-Iq?JAo@fE*6}WvO+Yg^ftoSo8DlJ&7%NJZqtIcd)2^qjW4)u=Q{*yK
zWW)ajGw<PLBEdJqg#Tvw|Hw}yf#R%SsGv&z7A!}e!V`Bs!N2lj-4Ea9S!y9X<z8;+
z1Hvykl{=te^(L95jG5W7?Gs|zBuVVFkh$a7d-hMjV-h&+MSi;Dr_bf`S3!8l`uo46
z5`QnWh2*2h@elL%Hzc=<;!gOH=mURmL3Fu2&?0fXtg<-x?t8j=Ez}qKRQDEZ%inX@
zY5w+YYisKkKTUgp;|!TtBQcxlm_4^F%;D_|;onYT?E{XNM$GB>{|E#$fKIU|e6>~i
z?OS;_P=Oa;9KuSi$sTk{j+!cF>-zVUgN*{J4QFpAzql#?M15tt&AI<23xKW-QzY(K
zEGFw5Dhjo$Wx^@(pA6GgZou{sF*_;}f50LV#A9yVrj=Cd4U4wsFx`tr3q~Ws`y>-t
z3=9@?o|M~m*m9i>wtS~V{a&Xsq&wUWeOjbY8%$0?(Opg<sXvkvX4`i)AC$Gw5iHqw
z@gz&5)>f`upJuY@+Di3{X&ivf@~O9Z-yWR`SWm5dK?hBE5tE6}QGA!F^^QFlhmW@>
z>%XbKkuk8P6WRizFJ60KkZK_J|K~=L?G5)XW{D3i$YqHaLPbR{q*IcTHk6whry0T<
z&Ns}gB=Y1aQZGGR`N^k4vvBA|!~pk3-Y#c#_4Rf2(fV~HP`v|TzX_J?-k#%B9?8p-
zZHk`4*<?96IsH+Pf-iiAlv~~M?^@()WH=+$Hpv^+{>(su3%A>vU_M_w70~bGkvF&w
zaFA(!hnu1dYH3^B^PcA-U<13!p=RA2y|UK1SK<IVM*_VjZDybV6=+74TkL1P@)fnc
zh2zVzjiZ%GH6#u}#pQilwL6icm{@F6CbCr2ZN+nJ)pS$m&UZ?er%+bTJ5i7jXP%n8
zj=SYBJ=VN@zM9s5pgQD<?p{*20TA8`lG#H3wrbl>9UtsgJsGS*z1U*RK|sg1K6<GW
z6c!RwQ?n*@)i}uUh>+{b1#H`GV*TcU#!J1LIzC6!%;ysA&VR`YK;DNu8pNl^YoA0^
zb>V;J20V_Y3`_25JUxvJj-%y1ed%jtydIrxIG_{#A@=iVVzJiPomHvdS&PpjpcR7X
z&JJQ+oU9wnwN10kwJ|ll9J{ilrerQ-#=yh$rIbN#-`Qkpj!yTykqzKw`(ct`e&TF&
zs(y#j%R`CJQ~Qz>ihu26=avmg3w-?i=RadUY7L-A&x#M1EPuBxe_tc>1B3qX_HpfR
zRSeE$qy~<|Omo&XM>}P*cEYl4syC^OHf3cpV6?@xXN4g-rJMs3lYmTqF7cOw@S}$H
zP8racKCkwl04VcrUp_ZUDAdnQ_5L9`+<elDS1Wzzq$AgzVaZ)zU-_~IeMo$sqb!xq
zF3o>oY*;#7HP>%A(iz55dYgIB9wVF$5@*$u=?bHgBiB7oIxW}benEn=lH7EBQea?_
z?A5`vO4Mul9In$9_j3U1s(-^hJE00JO3H;GZs_$4>l;8fbq!goB2L;|R@R~zpZ`9&
zi;FVB*=V~N&%k2*&P!mu8cZ1<7~g*P>tPnPPUG118c>+Tl4_J9Y2TTyS0CUj@nuyi
z?E_pY246F;eMAXP%4OJXO~x5h;ZPH1k25MRRfQ%m2~n4w;4W^D7SRq4LYTUKtg~LF
zombDf3pbs)vnS~%0<3{BWAg%XZa>rQWja_<(@MkoyMcRK129?)8mry2{}C14Lwf2C
z%qq$at}Vj<Y_W9@CZdQd50>AAOsZw93?+*>H4O=~tmU?Argnnk_CQox<K@MuLGB)y
z)9MBtlgCp(7?_1ZdEGf%pc@R3%Ersi!a;skA#<O*qT$ZQ$MaMk$JY@EJE+d{bS96?
z?NfSmM1!xdPyG|so;<&beQ7pFFMqvH>zT^&2IP7>FU<hPjhFr1NBIF6%3QyRt-fVT
zxK~$A^}Dff2xv707IVGa0w`r*#z=Ih?vlTDZ6PGpLr`f4@ap8^(;rUZVP@N}%MEN(
zJ>p~RO<-~WQTlJO#Z$(+6OX&ta{TYae^rveD-Y9wJM{4in7RKy_nvY9PyC*g&2&lu
z5Z5p4aoWCoW$1CBog3O0NYucTXOdS{{6ZAQS9HG4V!emy=_abvJ)F&QIJ;hMxvfT{
z-Q-hgKC4!|Y43Z;cJStji%>lMdGES1NYz|iW(pEX`xw<~#G7s{i|KDRnet>Saw<*i
za>8KiVV^ICQ8JeS^3lH2&S*xcu%7T7;D@`N?3$xed7QcuEv9??v9*>g7L@0jZ$DmL
zEuNNJ|9X(8)R;75e^@k-R{1NkC8D?7ATb+Sl9jh@(@}BQobDB?E$ufr>*gp4+PTZa
zy^I`o3Qim`1k+AkzI;2!1;Y0=2tALOa|su(Pd0D$C!@3PK=U+O4K*p#O^sKpts&A`
zQ=!xyU|~~Cz2z<=!Y!BaCF$@M7T~{uiisGxHjyxUUF?4wz)u3`lwJLA;oEAlTcR4r
zqA-U?FL1XGjrLx&TI%a(y|ft9D6U&kqfsLtn3ZZuy!;aC<xr?ifUGs<LeZY)w&Nm~
zCx=x}SVDf|eXbc9AH7mN2H1ioPhXweg2|<`@#~#eC$kk!5!$KsZ-G;DSsvY&86EP2
zUw5>_{%3e5_zUFoRePy4PSD?c|KCsjZ7E2S7$#P~jsBiI)F3(=fIdl8w=mk=uIaCI
z26G{E1^r5?B$kfdg1NFq6ZyIL+nZCe+x}!Z4RZ+I{bvyR+spkx&r`7o7n+zWE{_d`
z^R-2^tEo@lKY9wgEaZJsiv5wCmzQVjR;|8l+zKhOEe2Dkm0lO!B<1##7`X&2k#DV<
z7a5zm8Q`NqphwHFsO8r7X6btVjX*aFQ|Peez$l%`M%X;|HDjh2zZK~arD<HFkj(b&
z8Rqa+<%;KVi{G@Yo>pv6TtQdh?qDncQm?}%b_TvInDri#U5~R*Lt9c`u1h<yCZF=p
zyPa;uxb4>R$@5rsbR(DTN~e>s3OJAR6vooa%87=0b~Dv64eVE`TgCge!#AJ&@mT7x
ze}$3HE(dJFr3IbfGMk3}D8wxhxg)S%0z5~l<s5d4(wf(#*j`{E>A}WCLSw(m@7W49
z^v+FWv@I$9?HYc+Kz<0^g#Q9gEz)n{)_wFnWZ&E*bhrKNgzi+Qx$V;z#2KrA7~^^)
zT=}y(scF+$uvhHhpizH(5avAM6qel9ccZ}bSv1P;u7IQI&GxOh_GHzzRr3wCU*c^t
zuZ3&Q=aLq3?W6U{f{03<RSkU$p&ygp*F>WkcE=J)HO!t{D(5THC8_M*EHOD!ry(14
zhR3G3-*2O&q)G5|6OG%o%EqSmZV1s{2coX>fZV<isM)DgPtrdBd@Vye>4WVUU&4eh
zn`3JjESin7vO_=H&<uM**GI0VTvf5*NvbsK?FwHM<8j%qmCnpv8!{NyHL>hG$$R@L
zMgCU2nZI18&Gr9}{Q9@ZOT#?&v&-aagLgN7c^j+_%npO`aPs31x8tq#kq`UkJa(^b
z!P-r()AHbxjh8IAP-u}>V}QK>x!X)SS6zWJZ2PvWO;sYn_mKcae-ejX=k<1iwgDiI
z1J2oQCDG{hd>||Q#BBXZ*Y)Y_x`koZ7%63jWk5}0T-N%IyZR~5aycD0w<5Zj6>uN&
zsB9xu7Ch^tx#=Se6RwSePL?QTbV|>eo!%KTkE<HH8up<ufq;56Wy7F1p*QjsTnY=z
zr_upSsCww8NBp0anARdGnjeT|-uheMp~V1;X!sm2Do8tdFJ9j3=hs)Yo8gu+iMYQ>
zkaz2AkevPERo)5y&jRO9&~H??9t@}Zy@s;)huB4<<3R{XM&^^(#lY-CNzaT`(?LP6
zjLwyr)$7Fa?9`ljkJGSFx8*bK>$waOx^;m)n_ME6>KS{z9K^g&;-NT;-Ux0ImnQ^~
zU)ERCJ!7%8af&*m#{aBzq+GmfHKmTuVg1mpP^j`+i|{hPUZT#vj!}QV#yqiHF4M4~
z(sEXmv2F>&sNtP%@#*;hlh9V2vL-|IOcIILBaBbNI;q-zD)?QRPP3a%>@B2>+FqJQ
zwVxydp7LE*41)cS9I34TpmO<WeRo*S!MOVWM)TI(Dd<eaV$bi1DldFP>(4y$cBNtk
z5iNIvLZT=zMiX^s73#L0=16-fXJllg=0xg{bPzIiK)-dxIvJj^p*$^PRUkRZDX#7s
z9oN_lb>k%&!z*I_@a}nV*1A+$+P)~>w#|HFx!pLb6>GC?TR>QrLBSa1l!aZMY-RwF
zo>QCNxA51iGPswcZgZ<V&4^`SmF7#*BVx@QmlYPVz9;?;o*25laSTkrO3qHIOGpII
z3}@R>o=@VXp0^<E#DFZB=la9%l}YN9yVDKWEf@c8b^g9aX1t41Pq%7pe-objX!lEA
zIMX7P-61<4@urbbJc<$I>w564v3&LYH^L}3GbIG`&7zc>9jPD~%sM}v=%nzjP)9?C
znU6kQ+beB5>yVnl98T5#j7dpjF6F3dgdZp5ExEK&=~1ZibHbCpx98WVB6Efq7VQh+
z1SPTIl)<J!7#%FLXbQ65{U-7i^SeJJT#+F<HQlIj8Q#2+r!G8<K@T}bBVtwqC8*(|
zE=fx6{Wp{nWt6*zRc_;iwYN<?$LuA)hd2HoKvW~-UNiIje^Jf<f+9h0FdtDRNQj3m
z{hND4hkebXZ@*c+LRp?eAha$8y%ZJ8UC#>n0m~fYs0^0<?L5!^-G-uM{HxWE+M1<4
z%8nj-SI&ut#|fVOjTR3?q8yyMB80Y<@<u2a*~e6Kl%w0j0H0YmDDhFSQ+ArH4ha7E
zW7dAMQgy&`e4tkGyPt~HQ$_Qv&9GDoE{g6+`B%?$r@!!sxt{E7ZW;7%jIw;ZC6hUq
zAmf?0HRH(TJ#0K(YCO&1G5AMC1DWa0i=3L*vi|-U|GM_}xibbWyd1?zzZnDKd*1S@
zFpH5DDVH-qW={*e^l<j!u?$yzB1rQSZ*CAg`-#@a#n{bNc9pRUe}<)So3<YwY?d^i
zu`xXs+N$66qSn#T8E8twIjW)8Zu&tpUI?+$pMYTC;;#Q70UPAC&UH_WSWY*&05b%M
z8xvy{Oe&4L-$WTaVlesH`;+92VeO3%eS5&`4^nCDvv16IJSCO6Y>!~GhcH>aEW>_h
zqubLNm-?;g=D~l3_|A9XOM_8w>hI;UzaQ^Ysk?x8rPgNjcZs-<m{N!i_&%8?D^2v?
zM|mhR4>7YWr{WG=$HqRb{lBSJckvN!F!dVYd~)D>F5M%X<_${@r?^Zcev`r7P8;Oi
zKIi#2OOKykzx<9a3yEUco;|&`<eMrf0ZeQIC5-jvmGYh;=<0O}CN37O>UF$s9zW;m
z!2p`3Oe%*DeMSo^D6fH4%`+yMi9U?&TJHPVwyU$JYmR-a3B<FOI}5Q<NXuNi<GajU
zi-oMIH>^30WJI1zw;JpHZ_~0*4L!4Fx4!f~8J9Fw%Ln4u3QQm!wx(^6o!iE=RWDV#
zJGpGs5R1dbW3lkLlhgU(!%v~&{W1vu6cvg)Q8`elrTI%de(wi)Kac{Va-W}<G4(f5
z`I;{HS!gSZW+d!$!v2@jLEhu6tMhT98{ayKb5+=}M4ZY=sZm<|yqEUc)T@*7k~bgd
z0e7$Ub1>XUpU7$ABaa$y^0xWYV-Lp<^V@=Qmed$zk9w_y%%`iivy{`pD)+77b?(=E
z@rIlEN_mueTCS6|Xf}0LC28drm-8~IJd1qwKF>(1j7s>2cT((98MbH2Bwcx}tK~&=
zKBAN@_rxdIlr-*afrjyJ#m9`ok;s3zLLq5zq)+@>mf^o0>94+w_{V#9-r*j=+5aB3
zAxaSgLmpRFBIzHzoZ8YEK>)b!F24YZNLr;ra;6B6(Y%2-5ZyBB65~6TqTvE%G^57J
z{-cdi<*78g@DcnW>H1{jitaob8O@J<k)H-77DdBS)Io<P78EB|V%Ziosq}~X)!Em<
zH2M`~d(%~qbDm0GMuiO1s#$TZR-OI!#*Fq0FYm`*H@LZ5{h%cPz(%!?2@kSH_;9py
zU%67&LzD-1t-WW)$rfEy%WVB06Hd(Yq-f)2Y_?bDazo^7SV657jD1;h%<E@N5*|;#
zQS$#qCMxM(q$U&Nw$q@wQ@48GWHu*Ge*8MV*mlWyO*S$0{y&|^+dJp+d2vDach~s0
z^N_g@)a;G7@XE9Q{rRT?33@*I<qy`jEFIqf)HLnY{utofcnq8#4KGNF1~90yklC7g
zV(QjAGz)WU+4#FnQaz=pQgXL&@m!*AwwYtqMiDslb-Lb|@dtx%3O}$}Gcp$D0*U%!
zaYu4%lPBGQflOxOk$%L-+-~(|B&UG^Y?2p~(VTCJ=t?w7-;VXQ`Tj_2h)u<B;w~o$
zVTu^Fj2=B)eaVstIuT%(4`c1oLGSFy>p=vfNQ>#K%wH=AB#u)@P877XQ>vS79<IG$
z7A@sqpJmRtbhr7kSi|Lb6qJkf>Md28wFq5m-h9_-C6|)nY4kUrtCT(2n#HUnu=?Bd
zfQzU2ch+Y>)h7FQ>+|<@?jxXpxt&~g34gytZY_b1s0cgu9Cb4_&7W~m=imafZA2x*
z*%G}KgAuXi2EAvaMik_(*@I#i$5Bu4#x9S=TIi4s*$i_A(t;1bW`K!(T<y*9X`J12
zqx2|&+l#i5DdmQ<1<B<c^}6nlHxU;iCLRVecygbFxN_0R`xCTq7yz~|Mm{%D0*kJ<
z6q1=`9K~6LQQ3SMKE3p{1r8Je8_W+R{ZtCA?wpY865?c|Q3B(5?HFk0f#yeSx&rQ6
z;`;EhVeLxNW{M|{o#3rlN;%KSalHES?al6Ur#OT0+L14yodxw1>pD6$yck8>y8Te7
z)i_)-pw1~v@@&!l`WQcvQ^$uqm)s?gjnrJM_WFe9dZXHEni7rAxf$febF28Wf%T5-
zDWICyu<7r7adXM~pz6u8>hseLcpBxVLe_zAL>|<;QppRk5eeSkxm~90#ol*Jib0{A
zvvW8CS}X3?*`S~*BhZ+A<Z=ed-Ocb1S*q0$o|XRad*n;~9te7XqcKEh#Y-SiOrqx8
z2@eT{WB#R%mLW{9SSMWBk?k70LWNl=|8?&tjV~p&rW{4Xww78Bj7-)=gA1;G^f<Sk
zSt#SS#>(3sy2_eq#iS~#n|4R0{JSsEN^n`O-}}UU;s42&S&tgCtjO_k#PnRdHm%Dy
z52YUg57Fg(eRcb2#P*r8hu2T8mUHa2EWB}PW3GaNs($x5lNF_!IrecW16K2z^_*jq
zmL9cqIAzW7)bY^O^tYcbyLJ@CzMrTuA}Y_86odVV4O8<@Q{x&HlMGpo+zr?z)rH$a
zbsIikV&a8sP3Iq2k6NtD!QCA8ynm86_c&+qQQd|{t@Y?U9=CmI`Iu1?A!~DbYu|4A
z+v1DMp7A%Uox5D2CEe;{7m>w1@;oNzekD1X*Q>F(-<!NN;J9wDB)s%odIxqzG^N5D
z?mLuf)Nbt9TVKx?&4CZwO*&pIR`Ahuuxu<@Zm6Y=dRtsq?q$@$%>z2onm|n|B!jpA
zwkP1?fX^GS42zq>5fUv`myn5JE{!T{#TrN^NJM3bEMK88Mivy;sgaVAT~B?AjBB{)
znHbL&>Nt=||GS55_UIO}KAT7chDRf)U>9sBPr03HUl-RG$K;N=hg}y=9xO)8cVB!l
z%Qi04wRH`Nw{`hOm*tqsU9}Acf|gq@ciD+fe`>!M$yY8QA^X<wjvuq7dB!lSr0Gm<
zWgwLdux!TJ8uUtTvQBjs&06-h8x6N}7@QOivT)bgg7jx?Wp-px;F_B0ITwcttyW=8
z1J}C6s^g3EVLB62gsz4PqyFgIM3*~;tI_=NNY+7a_2SJRG?)=VR*f|2gD3Mw$?Qfw
zZ4vxAZIg5vXkI6ix#hOYwq&T-aqLDZG|Ji@MGARJqa_5$Eu`%Wb9YWz<9SG-^yMj0
zEJzOHL913m0h+}X!K#0pKk6w|qWt2?34Pl9uLrdyVrT?YwF`Xv#X(1x-!eqX?N(7u
ze$)hM*bjBwwaR4h`r+Li8w-6?kveNH=Ps99QJ98F3_5zSSe)N^0S*Yi1NtX8ob9})
zxm>d(m8f1js&{dGRk3U)WwhajQnA{v%6-F~hC{8|vth}G(UU&Q+I7*_EE!fGU%Iy&
z2bC!H?kc@d@(fe?yT=7Cy2gR-5#BnthN_|C;xgz!WLM^MXP*DqzkFozNjHG~yREqL
z2v?Wa?U%N-i52Z2-#A};G<I|G<Kp#^TZUQX#mm7#F6N4XNED!Us04+D$0XX)2w1E~
z`MLqsg~y4-bv55h>NK`-!C$z%j*+@8Wrh9u+&h;pHNKr@88;TQ*>Np~$BaBQ^N+VX
z$k*Fs@r|=+lqn3W#P3nObfx-napgYhvGM#%is$IO+XbFzucz|J_{ervPhBi8(BW1G
zo%6j02c9}8L$3BnU#<W2yk3sCs;B7W%NNIL0|%ycYC~_Pc??2VF{4>S-s2wEy)5~<
z%3xNX(nyO=pm=9atWY%^)CeScYaJb)q-=Yot=knVYns1ms5?ntPoJ)9rY}A@O*5P4
zPEj)9qAKC8VwCKqvgeEPUxy}Qf84dRfPka9*o=NT^Gsj!9Pzq6ySD4yqEa_t%^(n+
zHsk72#E!&GnCosc>%8%ZG3AOi8(>g28in}AeYsgGX}LWuEcRB$;8eZy=JCXrzgGm8
z@E&|ZE>k%(vyzGh<j)3XXrLdJ0BGW<di0fqw*Cxkt~#Z~rDE0V=RjNE=d@r(HX#lk
zcBz^T$?O#GPuf>yLvr3-#{Pz5a)Pj`^%3#oKtDZ;*Y$Y<FW*tnM+TuN9A<GXl(JXY
zJGEs4T^$j8Q-kt!7@!SO(#-aHL6@~%(PAl#Hvf3X4E#$#`yW+M(v8peY%oJ&x`O{&
zf%1)KFYbZ9zlzbvMSa7j)3k=uxuf?*p!;(>2y4}}YU;4Uf8l~ZWIbMZP=L0qYWim=
zs_pgEn)25#m<$%BI=fXoe<M-P4^cW|?+CYk0c6&lA{Cvi*>7-?_1;-dNBe1*|Kw0d
zeg?dF%OJ`v4<`$YXe*g+pI2_D7t3+B`~G~o1M_54z*)Ncwcq1$uaD#BLimj83rXRr
zPrh<DI(BP}-3k_6WC3fO@3o5g(m~aAv^GL{%+bYF@xCzC=$*K$wg9U<agO<3HI;D-
zT2j}-TSKdzD$z^j&PJdJMRDX~B+`_6)sTkBIh!l0^uxC9gGq3>u|WVD&V8j#yPx?L
zZe&fay-kjF+S}R7Z;Pj@iM1Tk>l}fA9-pS&2vr!2jLoq(6J7PFc||L02H#u^*%oW?
zU5<Jfx{UfSbw6+@-_ms8nc|k8RG63tYZWw`z_(3m;$|#Pvb`60llGki$PWKefvBhA
zeU09hl8Zs%F#H0uUaVI${faItYol!5H;3Cbx4egpf=Elv1v@gzIm@AD)VDlim(ALZ
z2DjDTa>IWdy4Gzpb(3BVbvfUok!RRd>ou|0-Jo&vU|_-T{b@w+uR(}qu$9T(D6yi)
z38M<h?3OR1IEmt#&`zB)qzozAAB9w%|Aag34kwtt&N)C1slk;>JKn^}LI=exKDXnj
zim9q6!>!HF%YT79iJmn_Chmvc88r>r7c-}DUj5Dk(cpgLU+I?@1tm*i<KL18JNB5y
zyyZcrBHATMa$+nbBp5YXk15{VmgXWMHzL<qZC(qA30a)GV(#zO(vj#jvFZ4P2~LBW
z^of!Z*h_2<Nqk|G0TmIc58Usynk`?xovcUYq{&~>OolVL|FBO#*0_cTtdyK{p?!Cc
zi|_cxNRYw^9n0<>-)`SKZmbu&@KPT$5Ci0+mr_(04oXg4n@~&YjdF~P;x(%-JP#Zi
z-<E8+S-B=`Mm(=OPv@AlSUH!d654{F>y4=qvXw#gN;UB@J3?Xl4ifg~+_b^ORhF+c
zpC6ZaU4j<w7VFFK!Mw|0*LaMe4y@CJ+hvUT)vt|)Z@-KO*68l*7gOUq^6i%xea_0N
z%5^&{{dCmNA<t)_iwM{H{sr;lKYu7NJc6R*HE459y2K_c>jyFV1UjqlYdtF}wOGPy
zsCn~Xbobcw1I5Ho><Pl@@4I`PJK^*QrL$nz1oq<vQ(x6o6sKrQxX%Z(V%Ui-aqIh#
z7kJxI5KQO$1pMZrTVAaM!q!8O0v*b&U|}PQiiHA`z;q4hAfl78PwMM-H5!6ud-#BR
z`NSIt7%;uZ6+=5N?{#=r3H(LB`x)pcBa*(Qf5d~VyTkbU9#{~Br2=`R_aV$Nci2pd
zy6-ZNww-(XKD)r}k#e0LehK~?9N0Zp(x1MEvCKXEzAE&FQ^pa#DyYJ(=9Rf{W$~!k
zs6&Y0!z_`{^)?uVmxAuSqY84K%jV?ETP1Z*K1yQm6lo<te2k>vwWGQD%PxX)A`x0>
z!2d={Jwmwd!_s+ehhL6<1?$-pp+ZF(X6kqNg)g9_Yk}Kh&SGyqgq`$}DSfpnD9t1;
zhdg~GrzZ$smbXt?;dft05C{FypFe0x;G~mYX8t;zF%zo-{i%y@(q7furOD6w)#a?7
zF+EZ|QeYYY+;W)DkJrf5$em`7IZDO%o^I2o5i2!j;c#DBg2~!iqe<dlDf!$k9Lf$w
zsucl7g%`*t4C>X+QyDm7gf367L3_+N-Q)C0YEFL2oYO8}rTO{rcV^I{6iF?q3qZYW
z)A`h@LV@G?>wNWWbF~@i*f(5^&@KA;%LzD2O(zRwwJ)yO7Rek~6fi~I3E;(ED?4pV
zP#qE?1ij}lpAau;;0>5_acjWM8MGX!W4NAYnDr16e|)8Lfp!D{EkjdZ%+{tX$4ByV
zQ*-J;&s#!S!;vQ7ywtPt;-&rspF)YJrgpmN+qlqM$L&$a^vk~dPAajm3?$6CFPAol
zfdW@Smdzu1wo~W9y`MjRd~dnq8CWvKyh6RdJ#y<A+?0Mpkn~{aX}jf&f`qbD6R&ll
zX~R}<xIJhGxLpXO^Cl8Hzw^sw*ie<z-RE&VDihfzG&27@cq#4G%)hhR^0b~#)=q4$
z<b_S8+9IF=`czQ7qsvt7xXoQx)f-pE!123wAi^oe+=sMZoH8&~N0!?joLjYj&WfdX
zowsVMIKLRLWVRgFjm54vd<2kVUkRdpQf2(C>|91VIkEG-?iHM1C+Ml)Zw-$S$6SST
zG=-@|BN7SsdQZSUpdfOW+LSJm4*Dl6pbsfawW>TpV%7bnFl4P7MS0elq{BYt(e(t~
zkSat4Wl=}@^%101m7E(v{ORJmONbET(V4jxVVoALzsmGMgnMdmbkLzlnxJ!G@Y<4<
z2pSLku^pO=?G0h_v~W&b!R(im6F44*4-#KhYLIsXJS|BcPDDjgean2(B<(7Nx7g#|
zw2E-)W6g@wM%R%cWUgB%=*{i?NUT&|G!2$6uk+#PknoivLHlkI=U4E(7~0qRZupbE
zBM__}qavRmIzDZm>4PHf`m_q>KZX&rE3W9L{m;ArEA!Q|<2^<Xo8^q38vaD^#&}7I
zo%%~J5)ZJ$L7~n?zNa=HxsqYh$kLG!R7ZmNKkN|}X;n<EmV7RSh4UU5o0cjI=PPDD
zW6)@boO8R}t|8?~kBJNjc!DQepoB22b-5+|@cbeD2MuX~fe)|jR{O%$kw)xu^JDU9
zb1t{t?qQ8muaqRs%K%(iR=VfKkn-_ZiaM@^eAaq#PjXD0v~+UyM_)94zm2gHF^MxS
zs~wFbW<A#|g&&fwzG~GuhFb-Gbm{qKzpl>Ri}`b<v-8sFmW`S{PIK9}r)Ast@D6(4
zo2!+ZBV8XYN+t0)g>T4g#wEl^7EM=XD<Kd<{YCsMoqv&DoUf)E-}uar)P+wcV&oIK
zcYRXO(CE88?UPA*X+zqd$lA+CzU)RpYdKOykjKVuH7$iVX7#bQ!e}IvD2M7w3ZQH!
z?fcm@x4-0i@Pq|CAuyiS;n=Wqo++a$op8jJPCI+u>d<;6UjL7KFSx7&?9g0e*J6I@
zBz-{tng1!Es1|zCFyT*t?NWZy#$<iWIpGPd)?(bZhDN=zM=aG6Xbbn@#=FtOZulzt
z0r9@$a2MQ{w{XAO97zs*KEhRnsqkLIUjF3j6Lqtfx{7O_P(~cNX3szog!d~3wtro)
zFz$zq)T)n44XuvP)&5KyCL-DkJ_c#D7vBwb5=`_oYSGVIk+!H|wYW&=1M<RI-jk(z
zFp07WnTetAc?tz|BL`~e$T>cUSUy4%iLZRo(IME7*N;x{e!WAQFcIclcxZoCiYx4u
zM)HQ(ht;A|*$~<Ug8(Vi5S0?f+>#<4lL)%Gb1GM`K^|9N`;8uyRh?gbcl<fXgx(Fi
zsp+DFeuCWB!JVjw&xE&pWInb0=HAd(%&j95&-4zfywWyE86q-VHw&@PgnnYQ%|Fcn
z_^ni(`5m$@rlR3&QFMa7oZ-)X**9gzO=)~y6OpepaL?7J<MDpC`F`FTZSN6vQyZ0Z
zCknTC0q`6vIwkF>`J;oo(FSUX>n|e5XvF(!!6PxQQE2m&jXC{`=xjM(QNQhB4^7Os
zuNC4|qUs_cVryarBBIlEVyRiTzdruW4Q(mlkV1~y2JVsa)&!)o96;sYJ^58hBgkqI
zDooEmz4N)9gBX>h6;*VTuD)zgmA+5`3oEsk>Z2}4-7qa$8T=b&ylom{V^M#V^e}65
z$}Pdi1FW@Z)^aHD#dVv{qnJqF6A1Ip@7+VGbSY*o(qI?LL+6HYKJzDd$Xtz~+xpV^
zUYcGW>F~f;;7`0MzzrAs){ga#q+ggqrCk@eV800>DddWwG}LxA*Je4JHJf{S3B(!S
z7Jw~Dl_;JVRq$*+=HDr;a=DVmTXbaLmU{2q4ujDdiNa*w;)urs^Gn$q8;bdt3;oNX
zdd~)fKkX<@tCDo5xc02uZ##@nngM?pUgyv_T(vCvKd%ek^3j!<*hj^z`Op@HhNqhN
zy#L#!YTw@E%t!y{y!V*)$PhUk%ioJhk6_Om^SyZ=X29xQyj&?m-6vX)Jpzdu*Q=%X
zgQF^C4Pg8>;Y2+bEegN+r`MMv9%EmA6rb7?%ovddH@IybNK!fyv}Zx-cTxireDQ~Q
zjD7HRNz<>3waWeDy{JPWH{t`0n%9q_OtL@HCBBDHTVqqcw}$xWY$6vT#z3lk>AMzJ
zljcR;?j6{@L5Vo#rC1a8R~C!hdiIF)WhhF;kXD&7`m^<)J`=Xkl<;MUC=My_k()XE
zTSC9Kd>G`g^AL3vI-TMK<%sGuiXAidcDrqPwYN%;ei$tD-S_yN8PwId{pQnbRqg%e
zc?zgw&gvn8ME^IevvVOMgIDC?&hNxt^+|{B1xJ<AVU$&U;Tz~V3$!QgdMNCJ)d2*V
zF4#m>>>oGxF2JG1f+K|$DNM_*`*!#C=jNul#3Q4mU|(kvx~1@6tzAnH)x%T&6?Fa)
zdq(1d$Wt=5O;N{A!9nFFy|}%dsfyv1DY)lopN#gDVv8_#t1S#34#XX{a_om_u?nAf
zuP@smRCkk(wK`9{CZ@F{v7Q)0uaFn^GYPPo!bwo_`v`}JZJ5c2&PBTA#sY(<C4WW#
zET9`cRM30RV9K~eFchEv&37MyaM?gK9#l0ry~7_qisy3s1?@I1;ej}t^Hzu)%&kTh
z(_e$jd0(NFeoq&L(mQsjzBCR^pqe9J%KD27;D8l^`W>~NmiR!VurvmG-O#4dNuDe6
z9N`q`Z<tLK`h7i&I}@jPFY1}llPi~wc2QF!qdh!76*{;zx3s<I8@1jj*S|i)ucD_>
zhG=<nkFh+={Ns)8x)@urQB+9+^X>x8y8nl`w~mT>@7{)`q+vioq(ek$q`O6>r5gqj
zkP?BRL3)r<kx&|>bLj3+YCvk}?isrC`Qo|HeeUzSpXYhcTJO8o`<DwAxR~$vv-iHP
zYhRze>DX~}1|69EpZ8#c`k(lx;`Z-)=38fo3y1qowY;DJ+a0tOQD8EugFd0YL1DG2
z+#lJ2*PtBx_&&?up7jmfue*6e(}k7189#>~6-j%a5vFGKeH-7jWt~>iaji|fmNY)}
zrToeKw_jAFxu3J;ugmP;$5qf_P;C4`dk)L&c5EOGuKT+m=O(Dzjlvb&qOUySC!e8;
zmc@M+f%=hcZc*?NP0sBt4e%<S>|x^Yz6ZUI2M`T(E}f~hqxYstC|v7Y>8D6%(^LjP
z1#r<Y&^zxU*5ytF+IZ~5iSYk;cz*b)WuF=M<lKPzuu7ZET_XO&DZ+ZWl;lN_DXSk-
z$&2dQXV?s_k!JU|6Y}W8E*))Yn^6F$Iv@3y46j1zcIYD*e)OF^!SVv0?7BP%y%+%J
zD_LkTcEgr_idt%x%YA}XYN%;GW9{DY<<wIjM>WY~L-#hCZ>HII=BdnDRB$zL3Gh!b
z-tXLF0`i&;CL{T#yT8{iF)gCAMwN0r1JZVCemyUML-Ia_^FWiHQHmY+hG3kM<hN=7
zj9@Qg-;?dijM>M5u!_Ve6Cs7kq#Jr4ByGz)LyfEaUm^6Q3y3b>F4WfCX)?*NhP_IW
zO6H)kr@D$tBugRoHl1{ex4`(&!{EPH_(O1NEk5{nUdw(zE6cJkGbBQ#wSQ>QuG8qo
zP^<xINbTxkN*Be+SYY&Gk>-x=y4w_S*=}QvPzQN%YT^akF^med@!N&xs|}xLGlm+K
zFfqWfVA43VuUmoVM)pA(jj7}n3?1WXwJs^7`^TL-xQ?WF6(A+8c1@^ka!w8oRm>fu
zA6pn~&FSKV(2>3m#aVU{vW@XrH;+O~ZYdOD)&+u#iw%_bnY#!|5{n5;^n~JIMNuK{
zOEZ})-M>fjEC>_Y@mcnJz@S6|)xmxQ_S%k_f^;%|6P{zH9}&)z`6oAELk<fOe=GXV
zb4?QRCR{UWa1T^!s*mkNiLI8r8D0}83GcntEVV5AD&&W$D8=%z?*6gP(2);8GwG<x
zD|5rwBwx+RfRF6d7e2uGh(OaGNInKN#|r8HU04W!Qh^{KsiUgqU}aCYO!npBi~biu
zAw<Oy{g2w-BIQEf{u&n8oJW)p+|cQ%SM6`dG&|SfO<Em|CGwxtxmsz>9l307M$ca!
zGOjI3+V$x7-$OQNOe9C~mgFW_!0245Z6SToOVvknQhyQW%pE*E#2B~SLHOH{->fuf
z$CM>#9fv(Ph;^0zQVQKM9H^$^#N6Sl!|4M!4@=mQc+!|3I&L!gG&8QLV}u2DCFzX+
zH4u6#nPc&4@y8lkP?re|Tc4|#UGyU%W6or55E?L?9((n%`4{ioFx}qrL0W7Wb#UOg
zl`1xvgNBnj{RU)B-QDXNHVXc62d!C!bhlp7QA8rnkpv(TK<#EU`|KW!nIm~zbhuNa
z@EeLfNnyz<>|!ud+Pjzn%V?C2-@mxcFq-#;;x0Fl_HWp7#8jWb0=(W85;iGqB2hfX
zg!WVO@2T8#uL0m{FR*0%Uty9*cvEQv3}}Q0nWDr#*f&;q&eg9bdk1$$cr%r#QU?8v
zap&E`7|{de=e50dbkS8z$-&Hd;fB`$c4y_*+pcl^+&h*69P&EyjCuq=FSlJk=GMo%
zNM}F}=t&UhtO1ev4K5+H-<K>h{ZcAgAaBK!ZTI&9P^qn4uPBj(01?D+spf4o9wY3-
zbBcThv#0EdtdyK=zc6QYd2h;C4O%Pm6^V_R7?L$qLPjV|ZuM3unA%oS=0^~1N?%XL
zFPkiojltEYVh!~tj*UO=;6!PWBwZA)nT4eKY%!?z&zd`V{wRM}Q5QSpW15YnflGm}
z({kAb=lFh0lyq;&t-Ph`c@zMtg$Ir=Oie)cx6Kzmz;f<VMUp*I!-mh{+=T0{6DvWq
z&kR#eUcgBM8MYAccLh--jn7*0?(EJ*v`Dwm-pDrzUvcJ*0Js$cV5+R{#NPjo3f4X;
zA7hC_<Pf~yY|tO;p#4tNWaX5m$!%b|icFl*Oz6>!r^5uyThwl*^y_Q*SLNcSGdvCx
zSp69((^vezX-;kwIsN{K3;zjy%uR;x=>+xJ9Uh=Ja~+(>>L1Y+bUuFhT`fmUwTJIQ
zLzq4gq|3fPJi8CMJ3PKaS2u?x&?<*h68)4mCx{Y<t`h&#JxrPsz=E`{@Er{f1VM&5
zxJCGgzrL0I{~Jp35z7M!CkO5S|H(-T0Zzh{H0wZ;l*$e21&Ty~`zP(crJ=ta`9Bfz
zAK#R@pHt+INGzc4?koPeose`dcAo3e(6zsSv+S=?Kb?lRIHJ!3Z*g?2KX3RE;t*{-
zwBiV*)G!UnC@XfGr>04A2^f`TN1IR2UjU(jJE~>yBZYE(Ah(;Op%tvmx3R*L@MIqV
zF>zli5PR%KGO)rcU`Q0evI4>i+F?0K6LWIAok0%KV&!cicqAMa6qA>p?sST&iF}IB
z;|^tZdxy(A9-)x)^*iA=hMj|P9Bi{zqV_ql=<{1F6;g9~bwwnnjOYlS_I*O)5~+k$
z%AsxxrZ0GDcl^xNZ_+0l!$YM2>^b3BRz?&7@?J8XF5_=zYKTVO1W!k22lLpKE65;;
z9|rxA$Qn#?g${(?!xTY-=DR>T?4Q*r$<Mv;+4P<=v)exbq8_F19DfTVl!Qd5KO6)+
z@&5~?`Y&$yTUM0{_j|(z?R%U$Ro^-cN1K7S2EbQta}3X+x%tsaSHq&Q#NK>sJbAk5
zj&94Ifa}bW?IHu5+=lo_XgzI@1p~E^UlNbAaA%|JZY&?8u4L=KY3yUc5~QZKv-<(H
zn|+8Vf!~eX#LH0LC6DPZ{Ttidz4dULQ7##_jDZDByf=aIX|+}P2~>#<%jh=<uH!}v
z3<D8Rp_?GFZL#$}cES0ZB93k?ttOMxZo0o12*E3kq#x%Xkh7uyU~~g`ke)zJzV$cF
za3p90&8N+pGrixVr`DDaj~7gK6{4G1sb{JU<&(%Le~LeKPE6!4xqXtTbJw4?0Na4+
zmn_o}F{-kU@Z^${p_ErVMN;jJL{T&Ro(LO0qhmY94L$$|>VyXxeS%gLq8zn5B@6CI
zb5f8NJh~~)>PkH#|N960AM*8YCQ&lUt!9J;b9e9fl9aUSA&JVX{!JxVnXZYsq%Lv9
z1NezT(qGiiRz6Yq5#EnK+s@_DM_@EG&qL<=Hh~??5gw9+2{!p8h_r%^=Q6bNwF%mV
zE3(N9_<0kT4bnoX)xUT@MJM}APmbUA$S(mc0fL~sZyWV5F7f<^OUP6crm5Z@`dM!S
z3XU=Dk_|uH77R?Fm@gZ*GnLm%PQ}t)Q)OZ#uUlZJ<m>FYbNUqr+bYC}40Ot<jd-5!
zGh@bS{&|QoBES;}z|QJt(DyvJH`SK){WJWu+gJ5qFjK`Jls^XTKwQ<0@NlX*=<2Pe
zzY~sXw0yA?jm=ko^_ySBkpO-X$ohRL4vi@$FydGM<I?fb`vXy+LyM^l#c8VgCNL4*
zcG5*t5Xdn4R1*0?nwu1hWV|SpA|L<%CVTw5WALxW!N2}#r?^Qk7Z>_pVo<RZnmeD~
zb7S<hMh1!rFI^TxFlH|r1$&9U(yj=+tg~?!huZ+;z^(U2svrWM?0t9i!28YIXxM+}
z22BHES;I^04BR1VXizI<Dio(&Gte)%IqcL!ql+cn4{u5qRrM_qw#SUBf!LzKZd>!X
z7?S~FWAWOYRB4(xS)@Yf`GMyV&LBo4MeJ^4E?y~uu4@Htib#~R)Pduq&24f80>Lmd
zreNed2mvw!mp{nuM$r%?gj&qwK{^MP5f`T`=fc7Jc8vaoAJ)1h*S(BRH&>I{9I648
z2|x%;1c=9GtbS$;zPCVEU^xKpe~@Yii<^Apx@y6g6gqy+<T-3F<cpM?y3K&TGZd7J
zCx;1T25@aJha_0b4NydkeUz?_^;VA!<a8bjfLd_0!8gY~R8T?YzpC&5HoyCI|CFjA
zYbPJB403gowoW%mwM3bXczNI7jo~u>vH8V_Yt1p7sWyO{m9y2A6w};YX?N01I>IQB
z1}kk<Cesu_4z}Yp1WpZ}e1k9RX9O02DGWhWfq-~nJ3*n727oklMRGQ7)4(uhv+Qs&
zo=+f_G&TGdO?jmtp(SA7Y>B$?U=UKG1f6|i=)LZA!O5G6QK6+Uy_-~|Eiac0rGXFt
z0w9L+q?oqr{(iH0MnfW0ZKv8ViG*)YKG~7PPxIM(U3OtP5eigUjkM&f+j}B9$laxy
zoqUiE<=T7tJDhERoTQ-nK8TwdBD5gLpcyG|n`KIkT9y$kp5rZC)4wITN_r*6i}6S&
z_<mA2vINH#JL7`Z=IZLr#7q>LZtFy-ZFmnmqf-GokZp>-l1yL)`E~c*s2Imr&z%2R
zdQrpuT|)g^Mb@VY>*IoS5CVII##1bQqI#(r!O|s*6@-^WQ9XglUB(jRw_nP7#@kge
zIfnZK$7#%v1hp&`h;|Ri?@UY&chE(=5aEdHKy)I^do(c0*R4fD&f5M1)c({%PwVJN
z#F?hja3K##Y%-lMevwe1=lJK)J)@800WjMtTJUb7>s?CeJF!7V3{WW;#f`pD_W+H(
zNL|NNp5lf8B)ur+N#owm&I4_hV*@eCwn$jnwcEWL=!e72gf1bZdOrin3+(`BMH~r1
zm$@GRg;E4$v;KA-6!E)ye3Z=EdLoyMa|`krx@vSINOHDTJue0T<^!cC@Q+f5t1}g}
z632hE?pF5O%MXRVhdobDF;KF4As`wsOW&>^LmGhI+42V@@CkH10O$i;42*RVi}z2U
z{oj$xpI`Ys_#?;o1Ez_=Uo5O>tU4+S#|f2v{z*v}k~k-%8ON6bYl0@eKnD+{AHD}3
z>uoL<zEdsx^0yMl2}nb$GDx;>)RTB1h?m?qA(j#i+4j$JClvZb?N8ec=jO~8O}pfi
z@db0~(~IK+VU(n=+go$f=SvxtcOv+KBY6IissP()4_d)Z42hAWV@Q-wcX}_!LsUt}
zup|=&Us+aP=huK%a9sZw%YF1!$YcpOuqzL$a;1GxA`55=A6ZtnVKw5f^lK)JdaNZ&
zhWv9e!-MkYt`=9xU%tPQQp6_aCck%;^Au69dHR%a;Rpus)W2kBZGYH_cQ+@%@-3#Q
z#Zu^rFj??($!!wN5$TJW4;a+1Gp1$2`;psa_fOn*I_FYNqi*<KpHkosKybfz1BYD0
zLS+T_Z_xYi$@{Obq$(^@Yw^HC#tZ@*xUHW0y#Z<%T#)gtw{JaJIayao^!U8boF}TS
z?=&4RhaTbkZ2j^%!78!`nxD>2QKQl=PbtWvbk#%JtebC|2W$-DbPz21*7ldSRoerR
zZ-#Sn4aj><r1tOiy3P!l*GG6|9DfSgJl-xb!fCmEB>I}p>n%1btM;lt;KcRf6tEvY
zUcbOFYqbQj>RP<6Rb(_8L+$KSXEf;h0WyFmqpvKj49xqAP|pwa(pmnR;J1N&p5Efa
zoR-%Gtu}{9`?O6C*F5GdO2hUlPG+GJ2qf-zQw5q4iEU0T`^_&d>f6ezq15JQaTwqD
z(i)Cu6sw91>LOqF$NQ03OD*B++(bhsda&MokTpFyf=4b>7m1CuTGPxMiLrL)z`@dx
z4#bmYK=!6e<3OQd&<7aj5pPQ{k>w23yT2p66VAKp7b@n5(_cPl{1pJOPj8^=eI7#P
z65dc<Hs-S-Ah>s!B(~RZ0bv}sePU%_cG6F>N$LU9*&<^xDCj9>poQr+X*g;1{Sxaq
zNi;bO)smr*6K`@=Uc@}~Q~!3=jW~{T!;xF+pXL8e5&EC#=syZ~8iA&cw5^Y{-AcR1
z?neDbKD&X~t9#`;)Wq0?8>&DX&Ev=S=h4<vCshlCf@eE<V{h!I&*(+2PR#YHtCD9t
zuf6qa-eI}Y7vBoJMQA+FnS?W|E77|GVGm;{Y2&$&=Q|SR5!t+57@!OCxkmHOefo)6
z=mIjqM=9<>5d57Co0!%rB`ov~%We(DHs*(z1so3jDmz&gYG3M<AeRGRFx}vX7&dna
zOPsXN5lHq&jt{~so&<(advLp0%}RR$3w8(_b~_VDv_ISvBIPF88YG$wlb4t0dpjpp
zw_CHCGSvF2j^Qg+U<mAnh~ykc&}{4&MS{<T-PS;3HD8}Cc1A9?6alovhZ8}lHFw*c
zUh_YAiRk)9eo+?CuYQAVGg_FzfPpRKuL#LtD|}bX?Dhe`2x!v0tnFvE-~GAGu)%MW
zXD)-7=&8R7OtA4XnzZ8pAS8L-3wz?<7$gaYI;<7IDF(PaW|U&hSHc~E=Dr#9H;oeM
z_o4r8l$Zk<%-uqK78C~Px};!V?#KU1%a<=Y(z?*Xjr^gsVE{yNWvv10Xq;Y-o>#X`
ztn2~^b+TfO8|^kJ6Jt^0eFhO}GkQG$KP0egJW=^C&E(Hi`ga`RM}aY-1v1#egSkmk
zEjnIb9%Xkb6FnNM(XWFLdS6dF`@nll^txM#G(e)X{<=O*`7U(zl&#PZew*P`V2=4D
zj6<(Be5-ETXRTO<<WBF{Pk{6phu<R+dmvNX^-d25Tg5b+<lI`iK&wUz7u*%@6RNX_
zML&gWArg*_x!EDjDUJO8oE=IdI3s~gaX(g@Cnf0W@(fI|Ud9a$6qmF$RufI6_b8^}
z!(eI~SoR}6Ar!nw0`!IgVE6Tm+~wI(*ZU<RAH)+g)J~)i;<mm&0u7SS1l79Z7{lw^
zz_b%XOD*=Q1o+14Yb4@8Xw>+lLoainwUFK)t@l@;K^6oTfnuPJu}cgC)I|;+x&rVR
z0z~<pV(l%GxqFcW20(4q4KJa2B~2?ib|El<!TqqeY~`^u9c#V5zj#;W1PSE?P#|>J
zDFfw2s_84KNwUq|14)8$h%afW(7s^Lm#~7{>j4lXJSebAGpPK1_kJe7{@kdfl$2CU
zimO*Y8y*SaXh0#!dK$@j2xM~Q_JvOzX#8t3obC}nozC1Ueo_q9C!qzu8*Iwc%J#Ii
z=vn*3=#dcHBHgc0`g;Vp+IMf{ut!-IH2+KyK-k?>Q(a(8v<EEoc)aL?;sw|M_vP*a
zFLj#bk92%4iIhk+lMLfX8)lsrY6;tFRLkA=r}-e8I<rqYR2x&d8Plon>K6NHZS!>+
zsuS-uhMF9FbJ!Wj&Wh`znR@u!u)yM%QytW7rXbr}IZyx+4Q6ZikENH3e|-X+4=L9m
zU1lgv571pL21YIJ>8-sY*0G#F65U$D6p~?HlWH$nOb2lO0;6`vlM>mINtfvy`LdN-
z*UL^qzLM+a=1=FyGUDas<w3v#VAX-Abt?3g%}N2JOQG)*_TfW~4DyyIi2}$*(BkUh
zyA#o$1`OJ`xq2Wf2j9be1_<YHHLJHD_XD)a7B&plcKr-TTJC!?{XznDgawa!G|F$`
zUs}t_nd>CV2Rvngufbh?uV}|&en~ar5J5iYNZyO@iC-#zwm3KQ9WZ}zk}{eq-N3vm
zJo;ZUIlIX=xItm{Xb9gMi%<-jT!-!r%h^(377E$n(`$F?ql~IhZppd9Q<y37ziYaO
z$#~k;MK!fqleZ*%M;e2XV(6*ovh=GE=*}OF9`;#tBAac>qvmIKrz%LyUH)H%c_(h|
zPCC9G=v*O#|62{7KLUY&;TLc=Nk+q>`b}wZ#$ysx0=xcr+%({ngY)j4)3eY=Wo2K!
z_*u==yC1BXGcgeVpxEd*A>PNTu?WGWja4%h)&B7>GS|PB|NBkXp4l<-p-rKs-3DPO
zQK5JU@<3tScg$2&hzReCASCdeR{Jx%Xg#Nh?(EC9t)L;`dub+biQu4Alj&v3H`5zZ
zG`}_~Y^>KlGQf69N-c=!eB%1MNRMaC_!<2W1ftUAaTsAA!mQ@rqwOfg(jQ?@R^q<X
zKOw^ZEl(RdTv;gx0trq3S<)yTEL2+|nF64Ppb|e81np8yXZgEv9OmF<;4};Ef6c`t
zV#!4bzQ!mkb$Xm2d9A0nA$g^jn#}v|FU%yhM}TC{D1CC}&;^;$tBk3%n{916+Lipi
zbdA<GYk4UUs|bg?y4{)b2KqY4t-7kuU;kM#eg*a0V1>E>7B(*KUB){UN9eq3hs)B~
zG|%h+ljBsTcA>snl70oM@v(`o`D~rT>&qiH<%FY#=`Tfiux_&?k&5+!HlobF%uGI)
z4Z(8na{+t#hiGfs!+DOh3E5fc+jzR2iwanIoZ)2!&5|%NkxPLivMm50eh<AjUBb~m
zfing~<~O$X*9$N5WY_}(ac&8iCw(TBzz^BcL&#`kE2W`CA#Y`R=>w|;_Fmo4LPGSL
z=6-vV@sW-QazOU5phGeCmp9W>Opof-<T}*R*0e*^G&WYaRJ8nL;c8Y66bpudJz-~^
z3krKXPj;h9puCs7+<m>tz!mfYGw3*3tl;{3|6|E|8Fp5d+K<!N+VAB(DM1AZWG2d!
zlp$U`Y_Fa2YHF~)L`PdDVLJoz#Giys>h!*;AF|Re!TNku`GT$NY@98Q`=ifI{qs@j
z$oOZk0J-uT4%M=?Pqa!W-dl^N5Ot|doak&XO?V+V_#Q1l784r#RvC9(vqBN5fLDc8
zwtnfOTzmQ+_mu*Y806l3j1B_&I5^G!)yKg-(1OzRk%31t+gyd;s|{*jF-qPkTwh7~
zsR`|P6OUiFFrfF?(A0iqvjQ%(NFZ|hJ=z)X+8lNgttuAkjD$;@Ni+DWP&?+4w|h*t
zpRDGpPr@iyI&2j|qPH5Z@L;uFKPAsvJN=JdEY~^eK$C>5Nh5jy^E6Jut|?%mOpe5+
zTzmehaZd|?I!rh>*i%F4){uF8QgqKq3;yZJV_)`_X;=irb~X=IV2iySewOZ1^A|<{
zfJEt|gwisn>IDzl>+rs@oYhipNKb6Ug%gA~;Y64y&=sJofEJwsbPGCH6+Hgla{22&
z`VZ&h?{Dt#+~{<tST5n{9}I;x@zpslKazfz`4J~JAtKI!fia#WYGj5F7A&QQm|jaK
z`-JlXKEFsRxIZG?NIlSC1>b0Bg?^rBw^fCuwW_Ax+B^||cO=W|oh_RbVwc2PpX^m1
z9?ZO2#`cRdiDLRrbRG!bG7b6zj6ts?2b7gR>~^rA2VN&6Aw$gfObQf~PtR;TmNVmc
z+B$C&QmP$qRgG6_FpS#c)jVf5WgBR1WsJfR<RAmfrW4pbJ)r=-&Pa0H8EDb`2#768
zi9h@ij^^&y)fng~Ie;7z0p#!=56}FIRkq@Epth~sjusdw$U2jm9t%C7d}lh?m-9Vq
zeAgBd_M-S}v#l0cY>>#tOGaI-8heGWd3c<0f1TU!VSb57vF<*uO5c^dlqz88l2V-K
zE)#(jaKzcLrT;0wgZ@6@6Kw6B^9>qZsdz9k>Giy~(($*07$z~W538_jQ@r*bH|%eD
zYWA9p`TTm$qSm90{Sr07Z@nK|SndWmRD-bscwhGtkUgUHJ{Z)@*H&(r`0`l88kn%z
zcqY%9*l;`^q9U^Eme*v7k!SD{h#ZHs4*YwAQ#DT38^guc8rIfxVpX;T?|6a$OI#K(
zdq>ssaO9rJ;0C`<PD$!}l_lzla%-E_60g%I9@h=TK&hz_>)9Ou_KS<mpWMm)?t`l%
zz@EXZ7&~x0tDIddY_i(wmW|~qEG+Ci{7K;@aFrqFyRlI>yeGqDQ(%B}1(^{gIXY!#
z%gD~jnWdpB{Pi0ja2a#FI`<2CzljvDZ=&?9a)OGu=kfQ?6BQK+4%x~XJU2&%f~UUe
ze5;C1M@sw?CEpvliZ`RC_M<?jYyV~f!gsnXxTz$p-WDz0f<=Qtz?id(+KFJKUGL-#
z9<WKcThK75fh#5Gj;h$FBZQMGYpy|vz-C#AT1rsy34z^8nQ7Kotuj@^Z1;SeiC6Bi
zXx#DKPFqx}<kc>*W?fMSd@r+SEzaahfo`An5sP%|qPACO9i--I*U=R=-9X?m%T5Ec
zrsPg4My~yIZT;w#Ga@ZygJ*-dB6~|QX%etC{v5}4{^myoX$vM?FV|4bXgHclkQC&P
z&*10VKCU_7_q|Qdt}E5HU5lT5K?aUkj88~V>`Hn|U12vJ3pWidx~hNm6Z}okRl?~&
zIHl_l*@N>QRbTHVvOFAJ!xaYXlabzV%J1ZNnDLhsEzFhg(bmj|5b9UHy5ILzG$hMg
zlw->s0wkh#GH}<!9FRf2Hb=v?asq$GgiC?9K^26iFPT3KumLemRGS6#q1o%xAU=E(
zu*)k0=F72pAGCz5JsJ3U+<r$j-9KH%dxAwZS!t7uu5(|l<K4!3_RB?#Z!eQR>uc6p
z<8$a&zkdx+mNoI(y&opwilDpaWvkTN-<OsVB@#>|ablWh(8S55{uJ0B{#~!BpRuFM
zgtK8-LNStl6i3wJ&S@*!jc(S7ChJ7tw1-y>PGSz8u5=f-8yeXNmj?ewg_)rEvG@V$
z9#m1@L^CPiRDn3Wuz?;DuPC*1v0JGcfEKK(ECBjlhZ=nW{<AFoU#K_mBOf2%&daA4
zXp+LMXEy_UV84JBuwH1SPlL=@ia?V^b_UahtnEZ|c(9*_0fzpFV?Eu<FY?YhhK|BI
z<j!NX&SF5aqVhP5(J?0k>FZ@pj{U*acc=X7<Ix&X!!RbDQoBVVzO8OusiQ5=?V)V;
z{%O6=tE6>l4~gm7%uW8`Jb6XbIxzUljA7$t?bi16BT4Os0bT!OpR@aCpRmGfE?j1T
z%^EbQs@cXBkR3enlu7(}YTxj%g#AHylJk!inziD%Oa3oh%T}ED53di0n@&3p$&bt%
zt0BJtm0)oV*pKl`D=+|Ezux)rh}obij}Ea`9BF&x3LZ>aM_O6}U%XCju`?o|)@AbA
z=R79)3eH<@m(Y}FZW^S!4H5O1!NE5Ya{EDVU{x6OY4L=;`mC(9EZ2#}g}i{5>h5<5
z{Ox)LAY+A+yMdL)?2S;DKI_YIx(BDCM!s!_n)y$a33lfem=)Jy3Un5*!m|&0+sj2)
zXLu=_k2SIo7{LTo)E>b|X)j)<6#@wj_#O?;hY+t<!pCf)uCH6HPgduEO(R3;FADAy
z%h;Y1q0CdpsR@qfj!IDn1YO7bQS1}^5~>x78)_*t4TmScI5PPbX3p2X+0+iqc=GR^
zyrtUU70}xKesqV(+<&7*HUx2A#Mb^sy1*t8^(c(9dd^GaThP!hXHQo`GJ^ta=L)!*
zS3XI*+>j({84399Jxg~^01$;*0hTcTDwy>tvvYBpIb9usb<u8GJ5kw;7H4$P`owD&
z>!aR4R%7IW_{!uosw<_RA^lK$d&8h(`whAHcEgzQL?tE+1NowO!!et!=3TMJ*@VD^
zhLkPwje0?Yd+q0hCJHL_auRN$E+Xn7wwicZtCH7x`yF${pXXTW?7rFv82`h`cHG4=
zU+&!mAD{d(1(J5{)#<pYe^%`2nQsnz<rEp1<MLBm%}oPT&OFUJ8>m5R#GOg(R!(8M
zRkqXMu<=CsOV?{N>2=`3B{KTDCcjVRwKNj3>o6|DmRVH`%tc)L(MEhMqzP`ALK><j
zJb4=7@%eRMGRo#yKsV5N-J^ozqhYlbjC|kXv9U~1;l<(1@$50k<$SV2vq~lDqq_F~
zrbB(p2tyMAwG*)Wd~+k;FX^fI`pV0q6L(^rrs=ym31Zj&`_-jO>YW8ASw+85ab6M>
zmo%odu(}#*-*Bm&r-dYg=3NT7tEbne1%#ZC<K=;DU?_qhn!v172sJ)<dXcmCL`DK%
zL8$+P6Ui<n@$PQld|B#Be*R{K5%SWw#FRmYdWNltUa#-;Gh0gI(FWUw0A%;nRAO&$
z-)hHHQB2~^@Et?KVPPlP;D>C`r01%V`$}_-9ul__r3Avv92%F&-wc<ap+Co?kuEql
z++NzqV}U`>dcS)CH^lLQ)kLl;SG`s=64wpp{<<S1&QJXln=ZFR4|YT7PHTa;!17Lh
z*io7cd|EK$yr>L`F-f_TVRke%esGcz<&^K@Us^-CQ(`9T2IoNAAs~Ms*#>{WG0?Hv
z90Y99NalcO!K-J)J#(XQr_`%9i!#XjzES0$^_3=xS|JANtoq(mJsPDPt27eb=w-Cr
z-(NmnD3>b+ZC+v4knVVu_Cg9mAc$OGEgO@6qL|{xCW|3TlD4d;8NH-`x_V!}mI?!h
zDIQ#KWNun_5nW53ycn-hDyRf*6jV;wH$33{n=A1@B+WmM>>sH&_sI>w%mXgyklgi<
z-^@oG>Qt4PDu%(`<OXzVL}TRACQCcbh?U$mEQ>&4ZxV8~p+VbrqLqWhLzcgQbtEo_
z12>QXkeI^l_1nn=>8h{MCOabx3^xmJtg4KaX@>lF{dt&gQ=OhXyZUxAG8L!XcfvNr
zRlS2gkzp);wpF)&u&_3WBq#lWz#9lKYl%k{foxo12*<O7`v-?rCQcO{>>^R#V_Yy}
zT5|%mP}Zh}4{<%Q92psrVjo1DtwK2Un;bC+DY+3O105c~PI8qo<H-@)Y<r38J^ZuR
z8&&1su$(vyDpJef!jl>m&hxGE2Xg_$r$=@2J><@IW1O@m09;GOHH5hWb0eLl7BSXN
z79)?fN-Hp7=3eirsT{ztwEPVeSJPFLu`kL+zvd0uNRE1disT|+6opo(4=_;xAAXjV
z>Qa!mLphI^2=`16tb5ZGLP)bAj2|U=Bvhzh^O;R`<z-ox@_K6+XS(=Ce%X%r&BiC9
zYp<QUC)+tVNTTP<r<dj1)~9>RhDH?_G<`90j=68j8a$4&fE7L&j~ReP5&oK3dKHp(
z`c;)(O}oKW;B{baw3Ui!&`WAvZ20Pn?_Je->3NpTT`68lCO)SzSK)jPGvO-cX%%{?
zQIhrvvz;0%CBd1u0n@1xRmJZPN4J}<{lZ*h)fXQsuXX2(ILXh0#h+?DLXBmo_-vWJ
zv?Fg%mtmi{%ej=;xDfAiwQTtYk;*{he(-7dtT_P5@Pc|G-;!=6Iv;;>9reH@2tf8V
zvlFg!HLJ;rT{NzVU1O6D4YD^YStRak2t!84EhqeS_yG_n@!fUSrz?2~X3nzF>{-A`
z)|2FVFd#gMVJPT*cAPoEuT^26?$CG{+*zNK%rWYM=j45so89_-#AfUlK3rS@Se}$I
zRWEi!sn-|6xGLcrs!bPi*FJlXJ?m?Mxrz@Dw<af<kS4XZ!VSQp%W|mXzUOwCAPodT
zSI%`TrwOf?=w%UE?V#BbnU+Yf26QZ{gt$n&vK)4s!f1IcEdB#apxb>|ZdZr%cIy1`
z@t+YRCC~FQ&fpn<a86tcp0G|=zqp=GPalnSfv5r`qt0_H|JC2U!2idnyZ`E@chqCV
zAkdoZyg`vI!+t^0%Ezqcq~oI1HoB)1AbBysRPJ*b9RD$bO3%$@5;bkDO8zKMG4x~$
zIXLvIYMuNl;Ls2Q`>2YoS0%X@0FlCEU}D>m&rKgL--KuRUawjM7idg|`4m*UjtdRw
zzE8%a!bivTwlM6L2aFiB$6rtgZS1nFAD=drSrmS3iy_1&+E8#8c7Fr)ZV;TuINJ#z
zMnD*ADh=+bcKm3(JR4f+Gv1Bst|&<zIND!WyI1jX%ziH6;==2!OY%yZ@Mx;do_7D2
z;sL5^h+Q-m(3&oDat88hb40$B97T-jIa`BvfFJzCS#!c@keH1HGdJD~7X_Mq06a2&
zQ+zBD_D0g}+M5GBL`B}Sf56*cl0TW3_x18@Pp2vlHRn!F3}j-v?B`RMeF`D~eMsjt
zDuOkL9d7#$ae0vs5Q{<ObDAzLcy-d)olr#ERrxXn@6uU&Bo3FF)~oc=K>7cwG+
zei^UAy67zDHw-Ij%tZEFKy8k+&+v8OtE?H-wX;5TE@4uGXrh>k8(-9ljm3HN7k!g`
zzWF4cW|WC>CG?pDcn&h(8=9}5t!9@-5_2D(01sxORj(pMw)&TYb?$lM)+;n~hC`}>
zF^OaIS!#vohpMk6wS8QKvSu1;z;BQ*Q&5iPBk@0{(n%dT$)fA>w$CqWzV6I;_TOrB
z`WG3XBm-}b7AlH+icsgg=_8idq31BD?On_^%XoSabzK*_=d_PH@(Z{<=t2G~U-57j
zvRMe3Rpg3DD{i{_W*2j>C`q%}*n49z15h+tLTJBZ?XQ+4$pf3Z(i^?cC%l`kC8B8E
zmq<oq-_9U>IxmkVO?)GH-k$8tmxDXrojbXXXz6Gq2-poM_h=WSdT!AceW`^c)Q&q`
zU#>fhUH17reF~H*$9txM)MB$NJ>o?6AGvKMU$2svn2M)Bc9QMJ>j9}=|1U)&wUt86
z7p^H8S7kT-{d)h(Cybl)+N<kX%f^kVApiJE@#xR^`hOq;=r_HWO--l^rkl#Lj;2?I
zv1U5W!BcPV@ldw*%Ej&v8!swkkfh|9;s*n5ep-A{5*v?1fK6&7w0ew#9F>Lkt!(XE
z4><gtalv%222rh8_=acv{kr%NBhKks4iM>kKm~naD!7n*Zhc63rSD{Zl^J){p^@p>
z8_&b8(xLN1bhFZS{BteD1v7!zu>fC4yIMm_tj?uwG&wb|M&cZ~Keau(>fy2pqu(a-
zM5cErt^w<qEgO<5u9YbTvzo3iJ?eaSe`Pvfdmr0y4trF8g!qyRjy_sojqrLbja(Zv
z=ayUS6P#7@+#Y#0o6j0^JmXoMO&6Sp5VhL5W$?%y-oWG>WOzVKD>gvBWo>2-%nWHT
zVJ$^qB{*{HU~vB68lXA4(Dh{_S8zowXtsO5$NGeSkK+Ip_mH|#`qrdT9grgmFB_xS
z2#Z^vQEk3G)Tl!2XU3VN7iasJAG3I7u+}E~HY$Q9#UDZ|R54YadWiv>s(@;k)SYvO
zMJ3%a&;L!cmZoMq`o13|N{>NX%eJvai{>blB{|i^_i}`GyHR+#d<e;!b0b+R(0LDU
zth}{}b7O0l*hiM}nTy~%v{d1j>E?(Y6fr=UHMPXuO|Q{la1LV4a|vf?!?uVd2h_z)
z_}U*|jO^WEveMTLqOnHF3n<gtXGKmJDoXMye#U2$W3n+o{xt7HNv&qgDmL95Ji;-_
z{YcOGS18N+sB(g!decngt)oPz{>(*HA>-r6>W9r}7&YA!58DDPW`G#VxRF$-fSE`F
z-WP)kUQN-ZdRCIiqBID<0dpta6Dw}JsS@?$1UciM3woM+N7{hq+#0*vYkLJR+Icgf
zl%4&~M%Wfo$aR8WrsXMZrmVseR%xr>#^_Q+U|6J>gj<u&n=0|~FG>6YMK$iOsn$E|
z)1n0yv@?AC1qWjp3^3v4bk&D{_xb*1FZg>bNV)tj7=YP8+ZsCML4gQQ66weVZIZIG
zN=Gw`Sx7&uN?;t_eesrjKR<i-b2lKPJ-+N?M)&?0REB@L*{mgm(`IA`*?RzB^_g5y
zLUbRvHZ1_Pk+msk_dWaiGQ4OMdWz@R;s6+N40xx>z%e<;jptj7_HJ)?05FtUrbi!=
zuK+hLHxJ4C04U^4c|T43W~x*j^1oj5<u^e#ek?3PP{=DYSHkR(e7*NJ#;|s0`JojK
z<jjos*)L$rC%>a_1M;QF!ADtSV+if*UDQRq8bVo#T}%sA_Ea54Tg>*G^KL9$wfduz
zs}q&jUO64C4FWLz*z4XLlx4~du;%>O1}=qWufM>#U+2$SpH7TZoK-lXER7N(9|n7o
zrv%jn6S^b?5gr_9s5;5do*r?U3i{tvJJd0h<an>%)bDiKu#Z<U$-NQy;{b_>hEaX3
zb|5?}-n(}Y%^#84%q@xOdAOy_Tw!CgZNY9_y?7)F`+R<~E&%Ar&0B(O?GPm56M#93
z&&TX^RReAlES%2;QNg6nMh)x-%`0%C*$TnZihRh#!!Cu$@8gEng2;{GT;2)?honmY
z`qvBZJa7#{gc>qH64e<h9j<*KS_T|ys39)f$3#3~@J~zy5O7r%wfpcV=fR+R<NI12
zQ@@lmZM)p&uyu)7>Wy*3<WJ7R^Jf}&SEyiH?C-kvrd?-;@Zpl!`d)5(*4e-AXD1b1
zdhMgC_=4GF@+~G@*P7uoDz!$JJo9bD>zA%GFuVPg?);)Bn6SvTaq7(~Sku}~r}Q2+
z1;nejyFYX4f|1p{Wqaip|1NgO(bo6Ybp0<TYI5%EvGCXGjfOvY)jB2fD;=5F3JqSk
z6OZo8ZPvurW8Z)L2iqvA<5APqY?V~qw^Cdexe|>y3;8hU)3|N#^-Lm{7q}!cToe8E
zpQU>><=-B%3xAOpLs*x&<f*KV$r-ALI(LIgxTx)F;$pq$pSb`kNsd?!paCHze+)%A
zKKusA%j{snTHww!e4%O*S=6N<F75Oh4zqKK{xMcDU8@%Mx=-8*Q1;~LyoCIGE_N;L
ziAf=5Zq4{Jh_^tWl><uC;;&2KI?sUZn%cuzM?h5bjtw8&qYI)cK?2X(BFYn0as5k2
zBTIL&`Y=WCdZ?&1FMsz4pS&UsTtK>I<koUp*>t|``<~n>Q+MP#D#3oC_|>e=@ngRy
z;CDxK^LqZOWim(#fJ^O+=#<X3GwK)?Umm-VtJ+nbj|drlh~@1U3EOx_rsX0GR<}FD
zEHn=Qny#`K*L+wo4+$a(g<+J#G<tul%(tBu?1RPLul2svX|(XIPo@NQ#z1i#0UFg<
zV-@hNUD;s5tcxixnhdQ^E{3M{yOeE!sGX2`R_{klB{5u7RO{98qSmuo#Jt7t9&Bx#
z!(M=`{VJLbZM*DvM&x}=zV?vkcB5UvN<nf$oT~5Xe#)V)7H&lsjrc*s8B-BG`Mf#b
zB)~WFoWm4Dy{hbAqdjGhXkqtIurRGd=R8W<-SXUmVRZxWA45mmN1zf8y9{1LT$wo8
z-4n?fk*?M1+9D-klg_LY+4S6QQlPVHDO>(d9u{?e1f*LcOUHu`%RMl3!Y0dVqj9a!
z7T<WD=`CJ|i7Fe1usPprZwc{>fdG#mkF!(kb!N2)RmDypT%PrC!Pe;qq<w>Q50P)r
z%<tTP%b7^NPZaZNa0{3V#@ZBnj{}X(mt#LRqTJ5lEtygKd{<I!t!>|gi#+Bg3ri+B
zbL4c1JwJe9{8sbJ82{B>0Fo~~S8@Cv-kX7=!pw^()G!>gCeUw~0=Sp<rv4}UKXVb}
zbpE@uAS|0Ca$5_!jB8&=5NHiDh1qGl&>W9W8vE%h#c74)vmYTHLugu_;egX7!PG(}
zO&q}qy(1J|kxs1bd1k^jHO?a=Ixl-xjMWR?>DShLk@za~>7n<N(8@AI*E0EF@B+V4
zah5iR{sy7|4|d$OB5U<}aG=QBU<26d<B@pQmIumz^@?IOm07zyxN&d7hR>yY4CW~3
zeRfotZ^&s_9#88vK-#63ap|i+;!-zG0~b4|?$b<HZQMdSW*fD<L!G(sz1mUpOr#;#
z7ZL-AACDn}0D0x(laBINJBn8mXV;Bqti%=Zs#!9&Vojkdt9fN_`?S2s6T546vf-`S
zDZjE)l$Jhx5&f7P0rcjWWcqtlRD;x+2dE{Dwenm7*M8hXf7PV?9SgRa6ta_Zj;b;^
z7UBe)Up3;QED6E0%g};s?_-*Vlh!cZ{t)>Nz|Yit%k5#AjBSdKcMhaaAL9EZVQac>
z|E*05Fk~!kronT3C<zay-84;7XARe~7IkrEO_$hd#xQ*BktW`2!~h}HfzoW|ffC~4
zy0p@h_Adv!=!Qfc_V*w5yU_0YAYok-Ok359M67HYDSDf=3&8LUZv5#H3+<2Mr^6b^
zyrPXVez#Q86n*z)*fRu8806y;9k2>)p<zkP&E)!Gtm#+E)eg4j>!@ULy)UgJDavPH
z$SG_4L{H#UyYPF66b?JVJmqC<Qi6$+-nei%p!QrTU`}#B!kv1~|7Ij(;hVO_E3J8F
zd>!oB?$#t=-Z2Z0N$`8W#6-jHRn`Wq4u0n#qmf4IHj#;HAF|op%g>5`^t)1Pc|Jxb
zbxGcPadNzjG8FgXzvjca>I~fI3|pc~0(y~8SCwA>pFqd|fFS&qH=K1J{|n9!QgUV=
z>2)%CdGRMnKqCkkS#ro{RPlwa{h<?c-Uc3B-se}v$^AO@24rAMrz)oQ-E&I1%@DPo
z);8knJ4qfBkNx~5nBRCJKXqC4>0jyFZ<niy+6U=AXf~^K7>g8v00><xNSEAjq4ixi
z&?NC*)?$Vxy$RvHfx#!DHb?A~!h5){TRhNc0tqPvQYY;z8cU5&eS(6rUzp|xe)T>-
zPSfw;*W$gD@I@2f+i5!zVWl+`qIn&J7&K%cA5&MLS<aOUJ9?#t8$V0Esi{g>w9}oO
zh+4Uv!$G|$nwl@gCU$JxFve%n3ewY&T%qw<ns=VC&JIcrQlRq*94*-Ok@p<4M+2Ii
zpPjot0Y_MfClppv0%dz78WT91!0ng+wULgLUtOI9A6)T%h!PB7NPJb<Bur<ZR#mxL
zN;@E>MmTe2y{o&~I60t~cCph@j^tb4i9)D*)Au4NREWh7xcjcXlf8*<6Vrfw1^8z5
zK{mS@`4A4(j?vx4&cSSUuSnM<=Z&AvE9;gMvK~$az%Z{$RB#04pk3AU>&fGH6?2)2
zu~v2GNv<yg#E%A!>3j}I8a7F1zm1sNVLzW@H>ynBYVZ__ntGm8T;E*;Jcg2rJ&wgI
z+k1Z9jc0lJs24N(&7yB_rIp&;R~?Em9Cs49wwwe!eK4^bReXs`l$cwY{n3);UEfhf
z!Ga}rYUxtpejCq@5~|UH^k2UYXBfbl?NaLM9C>;#RpDgnwlD5>Klq(1A^5jTPXvS0
zza5_He10-f?zn9KDf$7-21uyLqIn~2vOhJ>zgXn|?27~Qf&5r|rCi9`W9wuJGV|X-
zW-Ofo$RCipY~0mkAir$MX?M(mx?G$9v+#83GY`XTb1f8gL6bwkgdX5f!jmz)W1f~x
zAa#$hlC(gTR^$FE!ppDTcr~M`M0#ZhT40<JrgP-|0#7N*$I2Udk%6~|P})oV-6#yU
zb`gKw<Cnlo*Ff33YK<+k>HHFRoi#tyn@242Io5k6j25nUvx!ckR3%Qi&JL?)o!tb>
z)F52sy?Hjw_>v*Si>&E8ciuPR!7^%O3cfY3rn+nftmUy44>u0e!6lBVo2a=e&SYI%
zDH{Psu3yzpl8>e3CNDG^UTyZyV$`pa`z7EEgwd1l2b5^_#E$A&O;K#|=amgK&EA@*
zwa8B{rmQob?9d=_YlnK)jEq~lz6!t=Z8hW=pe7#Vit0ieW80;}=`D#8KBEBW@&3Sz
zX(Rt%A1yH2YCKQg&O9Vz8I03tOdm6L?>n-d(Y<j9mN7vqR*u(3hKkth-wraWGHZLj
zZ0-XVx33?&?^i3Fjz52~RwS2Iornjs+Ff{T=yG^4q*6tNO-R|k`Z~$3E~xg-r2RA9
zKW71qG}f`UzqYW9Ubr=8nc}PBP=6)TD|G=-Q4iJ<{SiBJ*~2S~K^oViRPhaih34Wc
zl}sHIk5D{4wE}P(zuS(fetzJH_QaPCGS6*VAHmx7GPp#>`cU@dC50t1v`^#c>~Pci
zwA7+@Gtmj20W9Y3r_EZ_a11g8Y)oMolvpHCHZ(r@=6acY%H1r&p6JAi=r7Pph>_yQ
zddTt<BQk-XKcBGU-qx%@h#VHC&}?cKo2H%IPR=~i<NTx6`)#yKxm<ceTqYJj{LsRL
zk+qZ-F#I#U9hfOFawwk!G()rqEWYAxYJRyjQbgZPNSoj}WwLA^wHR&sGi8S?esqv~
zSvjc&m==v!3=-{fQc-q930--36icz_{?IBmHrn`=iI1wm))D$(R9t^#Qj{)&l@$~p
zIT}w>CBqH{69CI|JN<P}T+)hV*zr*ZLdNI8R7KesV8)rk$*Pyz$=)QNuwf}IN$=7x
zM^JB?OX`A$Hnj2&eb~@!5(Ekl>p3o57Q8)<hfr6SRj~l`iJZrS;nYdD1t-5Khl^i}
zg<bdzG)e~uoDdH^6&<)+9;roU%w*`dZ;t*n;Vpu*K&MH<1vN3^Np9>Olcls=22w2F
ztN>DGUmzIr8mJVEn4;$M@1-wut4nlM&s;_w4%&aHdqp+-#lq9m!2nNfHf|<q*H;#t
zal=Sy>6{pdd1|zv>iLpXutE>C2{`A%*xK`Ys2VFpAsccuBIQ+Qr|_*RrwTo-Zq1OU
zXdq;}B9`6rQn0y+>dra4`}#-rE&Hw_o=Rj1y*;z*f+bMd*MGWk#ugS%R=zBz74Ktk
zUK&&wl)q>EeR9My#}#hud_tlyz#M0oJ_#(Nf9^WV-zx~G=@FduQ8YL98Wen}-bP0(
znRvCgDmmE}OhnV2g3{udRGo_fK4oFcH>t^}+Q*C6nwh$W5($7)>&r6kdLDOJcPW<P
zCrzWDK#7}?JETG?j0+1th%w`*xqpfg1MaE*b=qyQZ*G%Q_Tb;}(=4_2O1!QX=^(%S
z*dOr$tUpTf&obn6u;0d6dJ)jfVoH3kLbIp|4Wf(VCPe2i%iFB3nmNKjq>kmcnH0{H
zbtUb{0rFSvCw`$DQ90jVC0XoiXJnWO!|0bVLJC9_9zI@0-MG`rz>iO=rl)F}0hd5d
zjEXoe0vR%B|Lm<_{6bSKgZyfl{G28EZG9xL=Bc*~KG^$}*KV?YeWZ?MBv;EoF#kg~
z(9jqJTU8*(EmM|rxld1W)cGursC$AW*#YkrO&b~5e6h5w)OxL?h5d8cE9V!^r%QLP
z_qJH#!*TCk`YS2M-_v9m?PW`*;iFqOrA5+H^I5&$Wbe)T6cr`&ZMZ{+0fJfj<RjKM
zAicgoYyyLpPMJg$QmwS1sPX)Jc9WHTD>S^wTLGkCSHW2?d{l!DlX!i2(?q3fu>_#^
z_e9wkt2>eqQgb&$>~O&xj%9De!r*<OEQzMav!Y;34x`dQJ2FAeIN5;vOGeo$xWL+!
zAlxNDliX9VG&ZJv?B@v4j<nbBAkzsUyzg%x0X);ZCp)@2LAv~ND+cxz!fMy_slL}&
z<<>(FqlhW^ZEj@QGlZ7QACzWCcCAu9lrw~o3fy(LW*#*NJWy%n1ilgT8IN<jv!%tT
zB)GI~hJB+vs>|3Tob=ZbYACK-26K<$U=U52awtM@%Bt&$<APj1Yf*}Xcoq-^C<_^T
z(rv+`Y3XV_T%l2#LK&n=(SSiTurN@1GJcGoZKUQ4n+Cy`VFx+)Q>=2IKD-ITTE93)
zNsK2Ic_;rW#X0N*)z`@pzG|!O<kzcpyeeCHqBkb$Ef%T0d;jb#{vfC}8J15r3}O)?
z1Jj_<8f&66C;>jS`J7@dQO6(zB&JfPfO+`M)X6PiC>SjZ#T|QVKTZLmup;Et&!X5`
zxAiBrzU|(rES$0VGVD5|__e@?%T|&f)~thYL_yVXF+zx``h%YI=zdr#JeW-L_S``1
z;(3N{HzufX)t~r_7s>Ch3>QvTK&~%N@z>Hq=te(3>>%ZIq5W26B|Qc~f$=e$k^~~2
zItA$-yNtvneQgtf3~5|n5no>H!z+`J%BDd&PERmLtwQ?NihA>cKIOF*<Tp7+Kje#(
zheOhZc6jPHSha-5y3Kb#XFAV%GZmP(*|?y{)fmWmDApp)7uuim*-r_X%Yn;`&LP8J
z*)kT+1f9-?R3%~eMZ2CaxUZ%tcF{VqPYrn9c{qT*-Q+O2m7t*_8lfV2s9E<D$mews
zyNx!mx?wHe#!j8-ZKhUvuE`3$wXGu1`I5$U`t{|3;#?!3d)CnI9-UKPW0E!5nEbYm
zlH+ebC`$*-WlezP+zrm%T8I3=wl*M3<o6ujv?Jy%i4vWJ%o+~D?$7|&ilz@PU1v4w
zi0thAY-bz2bNQs4Z94Z(<4k~|nvE-vggGCU<x-F%RPjN*U6+7STBU7>iB)ml?##PQ
z4$X|};G=xD^V+;y8R!KON(QD_y5-qupXgazg2#XAK(#yz`?WAw=UBU5(vXM0CQ@gH
zD6T)$uX?R#%Wy~^^CxW)0j?)sCmYcmRWdr=m9~{H<*@n7Vf=Sq^7pTr?Sbhc-s*8j
zK=|7%jn*{3Mh-t#3DS)-C5$m6%fpKZII)?+*B#C*dLI37=%i|<)WyexvMS%=#eybO
zp5k@IIBXGMid{6G1W8W)<K@od?>vsiEv-BD$Y}4IIjWN!BE4CbS6A}Y))rMIGF@lf
zb!PJ=Q{&314k9W_n}AYljk+KIRlbD`%mD2WvI%knJgv|o!_0DveezM$E2kF!pxWB3
zB5Fz-yRk~bFf-8!bnT9+yrr5%r!k%I>Ph>$2ufs)f-U)=EBl(K<AIeY-CgyrC%&u6
zo{{2Dryofp;{gt%Z6tD$Gz?`ko_V(~StxL&5$X(dd@at7sF)wLtLP!ht?!_Yf&O1A
zO)$4xYQD_outQ^-4zOY3D3r>L*KWif@68Q@T#OPw(oG7Jz=w;;_QY}>BefY)f@Zuu
zCM@SOR3*}WcWJkaL7rUjs=yxzSA-cEn1={vBlq4ad_01ZKi#0_+oPgC;F){JciyzZ
zJUZez*6y6S{ELQe^xopevu+|5QPBhu8?$PrH`<H6KsH28G`TGEB3@2!*lbPJ9Hd-}
z^^xfamPYI+0-e`W=Z)O#!Oxjt>zlc=Z|O*<pS$ROAFp$D=s~;It8~I{=wcj;k~sNc
zuOXOSDs{{kC#9n$Ld$3RvA8xrkHAn@?fa^V8Elh{tE1nt*MLaJ2_-3|<zLyE^I9=S
zOhBO3f4^Te3ZBJ8J5%m{2e@$l9uoVw#tPZ$6tQoOu;QvkjT#J^F9Mw#U0q+Up%$-d
zIxAbYqVs*9yEWj!m_ohwx@bv3&Tl#PmmbceUoD41=zOFU$+;kF%Q5{;bLb)~@#aYW
z7@?c3MA;k(f|GVHZq1--?Z3oDTUP1$Bm63pPHvwEf4aFXx8T(r8Fdp8FwlrY30-b?
zLw+pBl4Z})Nq=UQA;Hqp(#wY1=W6#Q+jKY+==L*@bp8!Ko8KRAj{~x*4z|yOuB96p
z>YdonNB>NQ0^PQ~UC*_FT$#Rl*pwQX(e}%Oz36U!P|kp5kWOS!Dm;odDYnlHFndgn
zYBAiHiuK_Z#5grP|BJD=463W`nuG&^;BLV=XmEFT3+^7=-Q6V++#&cOXprFUNw6H;
zJ-EBeZ0_fsZ)U!ln)l|<DJmybN$qQ2Ypw2H-LSQPwfhO&XxH_tb3GRf;^TcnwnuVJ
z7x$@0w4Uy-_O6ec7J8LAJutMMzVdr=F&fr~0V&4v(xk2_j6v#86vw_nX-w{c(;fiS
znt@uW4-C(p<jY#1G|2=9F{Bv8GOcQo#tiL&%1#e|)ELYrhm|4d4ymb{p4{^J&J~l|
zvywbTlSM>7nxchOYKD&;&#hhaf2R}xRZ`Z?!$}InNUaMZ^x!qqBLZOc)Y~YApA`k}
zB=`U>ndM^<X5ODCe-iuEAK}r!BGyxjuH#cuYwHOhMJV)K^@p%OE3VjHIxcsn3f-9{
zX`oE8(=D+89JMLH#h%o{Ej#;qp6GlU-&pc?1ymT4>W=aE3{01~uvFwgWJy`hr&(KI
zGiJl<eMTH`?eOqg{T6}TedTqfj%iCD?|e9tuh6P4&@!?Jt~`k*R-Q%80U{6GmYn0p
z)D(1DY&c^=(p6&%2@V}e<3Hgt0eb9m!LIzE`|G2>yo7S4_kfe}_<m|d>6d{b6avot
z?a{1S2$AZv{KM6rw8MBKZPb8Ic2mlE?qgMWUaYpAu4)BWD@W%@$Xc0^f^%2_>&nUD
zeDeOqj*fv|(^<=%8@Ym4diYTz8E4G(YG7dN-nZ<__m8y}Pkg%hGk<Mgem<xjWvyHt
z2d+U0ks`4Opr7oHCtrVBFMsfPx|-d)fC#yAdmrEY)qXyU5A<5#`jPK7<5*_}9D$Ua
zY=wuTI^m<X6Ct2C>7=i%cu;-F59^LL)sH@a)j#sSNE^Msu-z{D$qS6oyuolpW`L6>
zl@4Ie>Jc+ky)__%W5Sytcw=4Jr`zd8(u*}h_SW~<J!s&jx21h=Uo(gFe@gDl-vU$A
z$^5jjBR$)z%8qjJN810Ag8#n&twUU7^;tZ3>uPku9S%Txp$<x;X?AC=ijHm#wf|3B
zY_SfaFSCOpeE3wSD2s6Qzhkk#r*T#6HMMk!EH$D=%~f__@eD-*1rC*c1KP8>f5n+%
zEbcJj7o@(6ESO|H%c{~+tH9MP9-)#?ANRjmCMAqaoN4zsT2z&OCh*V~^ts;H50{gQ
za7MkS?++j*jGUK1A>ha-bZE|vM$EBESFFBK)aaR-_UssKbU&vp8QUw#HCYtpmNRQI
z8L(NXFn+uI9XO=T&?Q)n3S+Mg^_|ZHS)f%N&)@P^n^n^hgMhoOYppR;{ngGVtGbGP
zs)bNx1Q=&rYK1HbK=IXjKBd#V3rO%HVHGYK0Hus})<}rdEGtD|_#8%V08LDeewjxC
zapX$qS-I+W3JK{>^xOw~dN2^)kgUkJE@9+XE{ae9q}=~Kd@IEp+|9TJ>=;ka^6cP<
zE9iH4Flu>>7H#yJECW+FA%z(l?)#UgpIvI-2{;w-g0H)BeWC;I?ktb%h^ETadTVbG
zi3n$I&uB;|7x#HFoDBZtRg0qv%}q|0D3PwVSg#fc8aNMZkzkZrs*Wh**yj0Odjqbs
zQp!ywN56~W3S*es#~jpfGJUW12cXx!FKr8n*2aDo+*xp<veZbOWwdI@dCyIkYuIr=
z=CL)|(8UNyNNij66<X$7ej-=j9aOIVvobf1(eLvM>;NM33VJ2Q{B%5AfcnknS1bxB
zv_C|m+UQF>a4~#~xVqSzKZ~)ROe4;6vBkKX91Su;uke{B8Tv2%PfZ*9+Ow}m;i{#l
zClh7Y)T@Qv{?g#be|JZhetYeeHE0mek<?Sg<+W38VT-kbuv1GE^?^*uO0h%Tszx5O
z(;BdTn1(wiO*W1Rsn@A7pnNlC5VoyfO~(`^uVz>Xtq6SHVh-F!Onh`-0JctZEb%pP
zuFR|Id0l_TA6t{GXAb8qlK^0W<{Aq?t4I^`^M%aupB$D|Sed|^nGTT%`DGXkT;e?I
zK9s3_YrS%;W%2l7RU5=)R(k@9BqGX4zQ4b$eZ)BgbT>#4&#(+0G*o^GAUd+7qH5m`
ziRY+UyP4Z@MZo7i)3Rai6lkI+4e|o-U^|{yxmiXc8TA^$u73n0Ve3)+{mYF__oRSj
z287E2Jfk1DT+|jZv6XsFOv^J*xJnvRfOmcL^Uc8vkrAtCftJW9zH?g}TLtE;JS}X-
z_ppV=p!`oS)C1gkqxA)~k2i82Y*oLFp+Ot0dK4$zfSo7NiP9~ZYO3Dk)<9rqM%?Y>
zx<%dgA55flmpor-=fWi`1>yBDtlg2iKc}BrG{R>ADNO_*_3Ls|m}P1ldl;n21HU{$
z20G{wsd$9rA^oJ!PVcw2Hd}lu^%|OlpU&Ak?(VbeZKmZOT#HcMj*|GMN<1BX|NK@d
z+AXDsF9d+HdHZG^K&9Am_ml7vkolQfx1L8M?8@)Y6dgCM{!ER%V2#aPn+trB9H{#F
zcVnj~*LN)M#RY-WegZj`<g1`1ZpR}KChszUsN|cGn3F8-x$K_))RHqioki-unOL))
zd)<1qKQ5WBUwNmg(LO4FG>n($-;<iMTKrw#e7;rx?xJ(HN-g`@<7u@FDkf#rb~=lb
z;m|(<2xO6#BdcV(vTJ^*Dv%Q{kMT*X<u@3dt{=~Z-ry+|tAuC<mm>X|`QaBxtp(CN
z>(Od~snt<ePY{nJ(GF$e4-bFQcTaCh?R+p7?06WE%W86~YlwK<Gydd>-M_uHJ-#kY
zRB*A>>Q1PTd0tGj<3<RqGD0`l%|}<XofHQ$Yd5&S`d^HyKN+>oVg{zB14}$asxQsZ
zvuKln`9QR4H#YV=I;wwe`&1Y9awlbA>g>&?DfoA~iS8-@JLxQ?2bkSrW*6H!KQ3-7
zkglCRQ80N}l!Lk$@1o%9?j8?06XEbTtb@8Y-(@Gisq3qkcKHPSIplrBIasXmA@|p`
z)8`}qk<Kuy;NZZ7^pK@0UbUjDt=~`Hxpn!_4qG20$*Buh8l}j#l*MVQda<ogrudz&
z-sy}yOVAcI^~fwW)3LJxL@nc%V*e+Eior+SNX-b?_fXv!41b)y*soaSu6x6~qM@xW
zVZT5m;d?wD#AP=pVib6RV$bBh-K^PkGpxf&rf<klYV;W+o71+O{)kDh@e3g79>w8l
z!atWCCf#Uw1Y-sdhwgN{@-G>~+u_YrY9s^uB4Stj(<MKM`K^GUYL0^@o%$lXNcL6E
zm2?)rUr}?(;XMkxo>XQ}_ScT}W@ngR;6-?(@a&N4bgt%_WwEOC+i7rcu_t_Re?s!Q
z64IEBz6mdiBGVQ4I;N9dk4uwMQBjTpGlAN(A6+1!_X*x<CXkG?TI;0GFtPKE6Up#y
zsZwia+ZNKoN;A85v63=7U$maf*Ke-Br8AH}b7lCOd#3yb!mF~+&f~VLtcMPm&&Rwf
z2<K=ZeLH>lB+W*!j{-Im%?M@wDkT~SQ5q}J@{r)mciXk+NQfMcD1;o~2HV*&h<@TM
z#<)*}6h}fJc0Z;Jkq1X*DPpa+Uqrl6a~PALLQc5d(BOjT{5;*Nerw<*bQbR~0j%-!
zIRojFxR5!%26?OQZqRkwvhRt(BT<&);$AE5CgRD<4P?=(S}N9$=~e9E@4LEZn;tPV
zAQHPl;C7F1sfP7Td{|K}R5X}OQ%sa!ehX-be2?ywgrBg1V&C-Yi!Wjh$aVnej_p`d
zBTg2kR>S*-(&OLNfH|sv`jl5;HUhQ}gI2gQu9Z%Ry3}(XClmZXn(Vg<-pSUcOI4Ea
zP3W+%D>`2?BL1<uOoi^5(}F?eCou7_d5;@_xYw<54i6&dVghUu$j)6<uJOh-WJ0tV
zkpE-mZETxT-N6M2@_{l!%9{i`SI1D2*tdhA>oqj#ep~Z5pA#MJw+of)vG>ln^Dp8O
z|I+BH4xh`3!YvoxSPuL!W6VRZsM_ZzsV(g<r}KxJS^-;7<trZ4bR#w|?TQmPCK?HT
zM=eUGvBP+f$&5o%-j974_BN_F^l16S{B@-~c@<7O=9B5G)x~f|Iv?e=_+PBZb@HZ-
zze=N5V9vnKO=rqMroSoh+f0pNd<g(H;p&6wr7X|cU~4I)mPVmptafNKZ<)FZ*`M~}
zpNCd$j#J8v#$%WTvcC}G*CFBW`fYK#?SdlbF$B&}-(D_O8rky?#lo8u)liwzBmL)M
z34d9pLItd`nfPhF|6k4H|N1kLa9}ahXezZ$%+A{r9$Nf1_|=pqDi_GjahzERn+Hwy
zElJsUGFI<+AGuW`$NyvY_m8EKQVqT7Pp;oIBI<=@UU3-uZedy@uN$ZVmq;U~atanu
z(5~!(5-}cgfOX3_EI(ivV!;DAf*KnGd-HMb`zcQ0bA}lrab#RhP`>)+Z7S3850`s=
zzYGQx^g&K+Ko>{o7b)-_@K5lLJQB^tR80S6p!!#x1;?WplP3f)Md`?J3!igAG?^|R
zy=DSOwl;ycNB8UAb48xJdQ2p!2#;e`GZzvy4tu2ReP60`AepYxk@20OFBHQaby(1q
zqSs2F$hyk5zG}6vH_zTE^3l)4?O$;{d7F}+ZJB)c9Ok)q)bw-SgW7>k3_Uw9U8(P+
z6B6K%;xc_1D9D;5*MjLYtoePngfwsy@%pUX!;;+f3_mrv^C?ofBMH-Yp#%`GS9hJ2
z+e^1#h}vN{n%Vt8-Zb0UceGLdt5vBjdcf^8eaB&V+-1q%wQ3T4E4<1orwok1m0$l)
zr;h)}Z{%!i0V;UTHmM}X>QPrn7hmzxW@6-iHL6x+RWnl{{^-T7pSy}WCP$b`B6~la
zz0SjRef1h+b4wRZEwmSl?GqVvxuUYCpe#{)^R5vRN0#%ZKu#LAtq|Ho8lzYStN3OG
z<OWYg3C8Q3@8EtoKEB$dg3i3!$<Ce!eqN3ZexE$COAGK$2qyM-70LC0ZIiayN^EBa
zt3{|V5Uf=v1e16&f*NUP8@+ohavl-Y7vwWAUA1sO^`<Z>eD;w@0RXDV8nH^fJ<~Vr
z>kE}_$P$B_hWB?5ee~7s(PqifY*D4{#8_Bwtz~S6SEYh{$Z07^MRZFve@~heBG$;6
zXt&{f8a#%TomZyPmi7_Vh{Cx@r^kJhhgyNs)KCR8J8`D7ABb`vJOA!N%OEJ1SWeu<
zg)a=}bC{z2zUWo?xN^HX0zATH<kaQIDCzT!=e}RYPuqQ`ke{YC7fwI?+Q(WQG&A$U
z<_I`#)}O9gp<3k;5YYL1<-pu-KC-m%Vs-=3sRfR!&vbu*iTypW_FLfA+02UG+_dv{
ztiWG76$sgl3ud=eq+d=(qVD$z!F_0r5eY}cDKP2^o_HFWuRA@yRXIj=AFi%>&OO5A
zIo#xe{ut#>NatY&^Bzhn2;<X#_aP#lUlX9RbA?#j-&PnZ*_z~KObzB8hjsqwW*a6!
zX-4425#u!DP^9R=ERRe>IC>y6dsy#uPQHvKYdXrFB#4$Yk&hnd_QRLK`i&ylBn>gu
zQJXv5xa@58VanH?q{4BT2_!{b%O99S4gMSlt;u%1!9Qj*2hC7Uym*MSm*lcyekLEM
zjrfKnCMIfwJW8`hbwQe$Rl_kr5{&q-IARbiJ>QCI104+PyD|Z-Dt!cCIkR4%8(sU3
zjN-EcCRd%J2VRoJ;B>(F+LGLYBY{#YP0~-F#-I=YC8nDorS34qZ}p^yoBi<!^%w%o
z?ygQuLil{sNN@5IK9p*|IKwmPkmCJCn{`PLV*s7Pk{Z=6(<ZojGuy4SWBwe~hOOW-
z3LCLoUwhJQ7-Af&G?(|wy6^sma<G1yD9)7}H54T1yMp!{JcC%lrAXaZ5DLfg5=&iS
z$|;Oc+u_pz4~(((nF1bW$oj2*<3EoX#YNFg^f<b3NCG!#Q(ab@R>KazG8A77#0Cd7
zzYuWP!EDi`L>}oi_U^Hlxa9C)nYf}5qq&8M94)x77pEI0lI;9t?w(`q%klDEF@F?X
ztjjyeh5V#&(1giA_pLi-sE+yXANlL4I7fl{i|2mFHR_JX!}3A(43jgUkSrf@gZ2zZ
zu#D2@ttNWIJjS4|SOrZ|$lP5>dT#>K-bxDgqCkfZjc`tT!~wPhij5|~6T9ssjs56)
zNr`AnasdTSTu4tyX%|lRlswTam-W|TQ*$TbYO)}Go44xuV7;*<rzXQ(p@>i$#yz?x
zL(>*3@fM?QIh6zNF4-YTN$`my>5?F$@=Z2imf-EWvoQBU7>Yuc5mDhPl9@!h*O){%
zs2U#|H>tKY+b*X>*B`BsPDjc(87+(@z1PAR6LHrQRU+Sqg{CRSW(RY73oGv70}VD%
zh(y{+1~pshe3-p8*Vl*9A68UJFl?hn7r{ZO7ZM7NauYaQzNP5zY$8ajin$@6<!W`o
zv6^c}$nBC+Zr5gQs0v5I>z*i%Nm0Zbh{1_8W~~LcQhA=t!{!B?7wC2N0>NZEO2o-D
zAL#`d{wS|x-QIB;PpHG6&i-yMQOt_~(pd-dhtpqRyPmG)SE!xXTFKyRf#(_YaO|sW
z0eU7YRmz+FYSwQM4h2Qsj~ijYbj#Uj=S?qgogvi;2?T<>tK%)(dC@<K9gfz<w<G?W
zw;D)>5P?CY2hAMdm<TSjZ<vnrkdt8cCAgJf!VUAtR3!$07v=WTCR;p87|vC6q0pzu
zL<KYsX=Mprq|+<LV<|e`P!>z8B_20QNXs&SFJ)(CdqpwOIl+}Y<C`n#^~lkOz~kGQ
z;9UPYLmOpue_=dL%g>*LS;!>KH{SuWW?G=0IFg&il9G}#4%a@YfPBX>S<dP{u7ouv
zVzYZMAt_N>mZX+!Jp7GOX6!*>UZ1UOuSFUH>k}k9=k)ZBxUV%LIWAd4mCJ%>l<#g!
zRy71W%uR_hmXmr{He8!k&k(*AN_*?-7}uEPa2`>)(T)dfZr1x5OAA!)A`c(KfGEwy
z9R5S20th^11Q9|zW!JDVe9KNwj-58C>w&vb*i1-HeHYxBzIHhHbb5blU*n<{vPDwD
zxvi*}drxwEcRP=KO%3wE(d2zLe@5eS<zd^z18EvfpSo<|XrIlhHopYKiev@dM`iTH
zsSefUAk=zCB)r{(4qjVBe=i)6M8Io1vr}Wgh+BLCOOZeb!{@n==y}sDjXLTmR(Z8r
zy#R5p$ju({{%9-~gisr9-Q@lK%NvSrcoyjY=3@=#^|5lX$e=fl7|CS0hiKO&dzi|Q
z>#8(@+h{*Kr46q;U`%~z#5b&q3rOKa0WH_MDKvwb3yI|q+OM|@^bf)E2Cy`=qFE}(
zq!wv3pL;%33Cg+}q)!<3)~m%)GKSp)!N{_EDpnKj6TcvMbeg3y@w9%^m)5_<pvlj`
zv6ygK2s4|XsMWLG&x`c!+@{xOBxSTesF$hY(C6Qa=<5?vQc<^ZGC3;35J`fTJ4bp#
zW7QShX6`w2ev%twF(*D)r|weIw<P6U3dm&T0?NPL6x3qbR#{xL@VWdTvQn)I0glgq
zf=g>Sn$vQja~7w=e>QnSuYQfG*?cepJ&Uo`AE@IENo$4K3O(Ou`34=1d~8ljMdY3L
z3aCYx8t_Iz`xC~D_ceqyk2E3-jBGrr7DFsZ5)v9>hOEM?q3(}2iUHE}XubWQQ;3a>
z&!_KG4F1+#0}6Fg&|#9&X}gF)f9Snn7GL(c+LExHd3+oA31?~CbVUOzo<tCuNk2-f
zwFpVrNO*Uy3~8!d11TDp`SUHT*yG*B`O0#GEgT?Hg;<ofh0S#biR`-lBKA6oYC~A-
zetvQ~T?@$e@(C?H*DElQv>L0ym?||?b7y?At!))@xn((AZqwUy!!V?T=JPy8oG#aj
zjQS9pl9!PHABjrxhV^-Wn$o3#ezD;IUa~hv#KVJ&;oi02vP`>{ZOPS9>4RD$!-DJD
zZLR6)0AAi4aW%JUB~fME<4*6YxmG5dd4X}!PvtgE`wtqe$oidM-vE_0c$wd`n}q+M
zz{`9%EtFazTh{%h)8A=#4C?gaDzeIR1py$o!ktF$CI;kBck;SI=h*$R0sx00$*!O1
z;W&wJ-$IkIvLgKXDg-N^&d{4jUvhbT-fA|eItE=~p{m#55-xuTpa4+C!zqd4*M|$R
z(#{5jd#+t>XV8@fZBh%w{_tN~-49T=hP3+K!+VP5)2XBgXRAZ8e*OJ)K6Nv#><M2R
zOUNBQ^L<f-RbLIgO7QuSH;Nw@4lr;NVGH~kUEGDf(<nddFyRJz7O4EyB8g>tI99-p
z&8UfeCKIecINOs%6*wfMMcUE=xt!aBBzCl9aX7p)AGXCQRLT*s7RR2c-Xj;n19md#
z`_zB=Rsvgw%0(88QBm-bz}ikoa~GH6g4K=P*wTu?Dt5BjlMhP1#-ayVZbv}@C?P2c
z@$778EpIw-@v9?&xN3Z6ov)-i^3BanWK9jZixK?>yLA1b?R<^jyb-qIkOCoBcguw(
z3YSt!@4as$&HLJFTcBni5KvtIw>{c_wQ<0SGJYy#g5a3I7D@kIu<}~iwMyt`kI9Sd
zmpF_5ghRr->9oL`qd2)8Ii*m7k-_jTF+Bs~eIX_F$MUo^eWE}Vypufzo3<lTf^{)k
z3^uc;k}M(tF6;~OiKXp}{JoY;6})k$wQ<Gu-{EeKa?$pN=<_*pa$#R(ZX_n=^r=Kb
zUnpb`>OU$$_!oF4a^#5Qjh7PZCk~*QJTbpX$og19!D@iG&=I~J>8>K$FEoYshfy{M
z!L(mase65shT*6<M#_{e`80grQDc3<3y*Rcx^N{Y>NdS0!-6bwPJ)?`_&(!vSnrn+
zyVHvc=^wSs`GiD5naI@&LhpRzsPs_ZtS52L7fCDahDj)mpNmBu%{rp1mnw_?%oOrR
zBog$|Hf(!HBn{I(lP1C{`S>=Fl0W*o=V5YfY(11kz=HuhHY$Zn)a23pIsSZMT)IK8
zyzhd!1Gy)-Cr*EjGU=f6e&3Z6oTDXljA;T)l5nYsYjQ`~jut)JqlB^z^bgm>@Dhr3
z2SGmp@l0=}P9A<Mu;Oh@8PLc+Hxf<%@uyNoWsO(Ks@_<=4!hUoI1P$1kP~V=)*bLJ
zTTqhJb~DO&>~F4bfh<<+lno@10uz1b&od%v@P>|w9gtoZ2}j~3L(t@~4DGt(hazqw
zWkTg(Up@E`NxI$B^-@KR10#F>xg@Vqk2CWtjPq4dCaH*z6kldO3}#UzDq+E;WXy{)
zjIsHY!7XUr8#-6I{7+?dVI{=iv8@s4FWe};r<4D5?Jx}Ux#CP}YWU^TV18hsucl`1
zBo)PIP|neQZ9xi;hNShpjU;_Ak#|Bb`<caWj?C+L9xq{J={LH`O|HS|9t|mh-F3>+
zie<>}hqci7@&w0@tMXPZqurBiirX(fXn7j<-;9!Z`mlb+hwm6YlBO`1BwAf{x(Pb2
z*hzk+B9wK^b&RI{JyzZM{B2TDUPATZ%gr}((JLYpc9|z{SC8t)vtK7pvj(1oKlxO@
zuCG~rSuxZOgv^+B&w5J(mD2lH0>yt@BmXI*BA|Z;8ydQPn^aN8c8$kELk&bp=preZ
zX~XHN!(GsCM9rLAy{w$LIL|#r?CHfMczx{j*B(Psw(qxuPk>z3Ffz}4j?99z+*daU
zW$d3E@a4!JQ1vd#DNV@jzf$BJdQe$x4n9vnBbo(sWK!(OZfu8*wifZ8j~_eV^K`3)
z2np?NzM~iO6sn?G703F-fwA|8@^0anTO)xAjgYu+;roY}w`N;9`!^vB07$nk87*>R
zNgC<nZX22xNVd6Fn5@cHV6q!vrTI*DYi1bi@B6n04ljU{7VA&0TtxRLqYnf)$dcsH
z1v2k7|I%Z^>&Qf*NKo5ZHAf}BE&IGTc9VQj<2Q+;lM~M}T5<Uf)M(uI^K{7-GORvR
zrT2DqH2bf!?wx4V_edP<yufFwOnD1UYWVYSRyS9E@Cyx&%+;{Y3>Ld0-u5Tr=$jF-
z@5^KwdZi!RXy9HbOekXcU9TD1`2(=a@@Zxf{%#Ip*_GSxyJ85@YchlaE08++eD*#j
zc@)xuAk9bLLq^&5SdUGI8d4z__!VifoQ`iaccW4+`+(`u_j2Uq7pTfVd>5g6V7`=l
z?ZSO9zMAh_;w|7i#Qk@Y=EHR38unseqGN+&(wXEQa+Xgbstk_n&uT5vQ{#VqA%GgB
z4N0kLFlH^v_o_8fZSmT}{1QzpWx(}AG*oJ=Viswr3L>7@Mj=*7)^|<F0yCsbH&QOb
z#6*N);#j7OV(9&ZLO8P3bua*7H^7qE<gK&ZWBA0gil2#J<8}r-08g~gc;#)#3%+KR
zzJ=*5;kirR7SIlETB0HOuef!b-oR=bcw>~w`CRzL<a652M5G%9Om7FMVeK<X9J5=r
z)6i2LjGU_mu6$jlXBWzNSKawdkb9JMgb&MPG^*y=h^#wo?giRCH~HVqZVp!e^ngGe
zxM)3)U;*=heJP!5-U_87i`Sk#1WLDtuE+KIn9V9M|H5~79QlZGA*$+wy^yHr5l@9m
zRtS<Mgf1j=;6eI0=*>h+7wZO2UVczjVxSRgX*4ANN+I&?O0Ch1W;qTVRu=P58BqLH
zDKDIr@h<WBGq~1+CjZZY`UD@X-~?k*uCLpQEVm4iEkPPhjw&sBW_CX<>&}CLGL8xT
z#zC{u;S)y+lL02e_mGh+l=Q?AU9L~`91PBH{^T~pWb)4Dt8U5oO?#tLQkjeN7IVnR
z{R#RqW%v7!SUJ^oOj`JCDqW=bSrW*Jk)CiR(-}IzC_O4n`+J^dE?%aVSf$s%UB(%f
z*?_W&iu3LoR6?xnb^R6`=z1XCD44Hde@OjOgKprU7mlnpVWGLU7L}eBSahKn`=+4h
z622OcgEp+ikm@sDIFN7OhB`*_f(JA2TqJEQx#qQX5RFbxmn`%&;yM(#8tktfK6PL2
zJ8isE=<%IT8QRFv2+3&Ouqn4ecNf68^V^kj1q$e{t`G0t)H|-KTp^tAope3F<M(t(
z-{d>vyFI?SWJ#b%Uptt1(QX!rEkF_+jJFH%Yw~y^;BnbShk>~jf4uY3iA}#Jmi4Vo
zN=n|eU2QTAUrbm-FI~+CxgE~Uql+cD!?J3wUQ!Bo7@%uteb+}tKu9leD`Sgp)-IA_
z^x8_Dy{bAr5w0+Pig0&AK&Wd#|Lg0s0*4{ln;KsVBVawjQ|!67G%5m3Ou`ORMM+&6
z@H8O*;)`NKQJ})X?yZ^E);(buKKD@D>ZoVnZnS<g`-7?mkVPc=oxn|3Xhrh3-PDv3
z*~Ft05@93P7X1?aB$6-Zyk`_+Jn+LjAt?))N<O8xZhlxf+>0YAI48#uk#ewB9=8wh
zbIZ3HFRVcrtdC<UVD)Z+oF}8p-{tVRBhFOnp!nV#2D8b?ID|vOTHW_mnjR^_gHJAD
zMcZe&9dl2}jU_+b{vJmU()eBW*>|nFSf1>7jx{PSE&}i_3eJULx;DA3=^@J<z5gcc
z=+oBWTP%5@2l~MC{v|4(LQ|57X&ILH5h9GcAK9C`%#Sm^G`9Y&@I`R({zQ-9@NtLV
zyVeZo!G<mW1y1&#ub^R!1*+_<j}a~`>w;#|GAy5ZRUZl`%5CL4S-Uzf6B4MRWK9Zw
ztcQzA7e%fwoi~kq^GX0OCUOY6&+pe)OH@z-xY;mxsQVS^<jRAqQw)Hm+X^T{=?@zS
zm=J2EXElYM$pyn^;@Q1|pv4_ww5*=yP}CpyCQ`sVx*H-|58oX)q`j2cxC=*6oaz-x
z!EX$cQ}qYMa6YB>pL)=DCoLl-ZKqvCZE0ueFh?QQ7KWJS@Nupe@8m^{jVS|tRp^%y
z2FgS#(c**#bRgpPPo6?VP{JE{RHUG>wKt`@jEH`3{XjJAaG$}mYjR?IM1n5(6IB+y
z;qrSjZWqC6qw>RQxA&Jk+AUAzeoJF~7jzeLQGgBlLxFgtB3o>@Os;-3<<Js`BbLd4
z;jWRABQ<Osp|ETcqhwX!O9x`W^PO*-H5v&Urd%om=wXCXiU1u4A9fuhk!#v02g78*
z76MB<D=iRM^LfrxI{q}{;}Ys%^Ud;2{+IPA8QQ3}zDPa#S;VBJ&Ce&~2)C6)(xl`i
zO%K=H36!P@AJYLuUmwho{0P(Hu@C<2bUuX;n#Ui_J2PXi_vw1J&dv!vY<Z=_NF5YU
z8XrolM*YD+e~#krXr%#5=;@Fml$7?Koy^WC@QTWAzV&l!F)|`@NYev~1i3w}d7j{d
zEv0u=x{sC2`!B?nqo(5<!k@<Tqzdz$IP#<~Itn4nD?+%jy@Eu>%i<UpfS5I8Sw?J%
zn-vloFYvBu*{6*y8`8P!bv?gRpi=a6$nw5^(CKmxqj)mB6SFq6#$IUEWF!?V@t)s?
z5^M=pfp0Q1Jg$4B?2qn1$8pg5uIo@27fBL;th>CTJAZW4!40`VVt$5*^cvJ{liof*
zI8Hyho&7dd>b7V6{!m?wtsr!NA;o2R6MgE9KlryHL4s-F?iPu~W5mh(=zIL@4AOM^
zmxlm=i?@>h1@Q3CSArtpv1gd~+kxeK^fZp=$i}x|`p<Y(@HVXhXXXu?$-mEJesk>N
z22lJl+tc*Z;LM>ScHCd+tv8Quo{CbGZl$)i_>uHlM6NCKSM+7&Lf`RE3?A2lp?HEn
z=DDTRL+)f`!1E)+6u!^$2gsU0L5jCn_9?W=lU2R`KueS<15uK7otKSlC6aff+~&D=
zUloV3Ti^jknBsm7**SEl&{s5A<o|*Om!co+93VBVE)bFUZU(?3A-y%4nw(?@J#XNA
z$ZUWqhsg<=Fc$~0Ps081f6Vtf`$VZ4Z4+q1IEVgD#ekER6)WlN#g<pcY4;Pf1P)RN
z!{r|L1;=6Z#TTn@upW;<HDbW%?1!ubzr82NU|K#iQ}k(9h_aunVHE&8@LZ%4^}0G8
z31rfMazVslJ@N56CK}uqfn1-RlUqttE}{69XQnDouqcy-$NL;cHVfrvc}d99hw{8=
zYWVV63ez=U`1dvby08T5&!UeBcsSy&33%dbb9QX|jw5gm1T;I&|0u5c)Z<qigS6nv
z_DT)bxF1-k3MSoa6LM8WwzzhB@N^n=i7FR}!A>*((bH|c3SdcoWTG())~=lMQ4nI8
zX7N_(@KNx(n&wV%{uOuh3L|_l2sEa~&g1hZpjLceq<;xkkp}MpR;QxXhRmg`;_q%E
zH&e`t4_xtfrU4<Yk^o+)rpdtK-9@14-z&TgeS{y(oa`V?b@yBr@AC3@?KWF-x8|J<
zKUiY1eu#xfkD(#-6n@?>Il1(eH;h5MxWo01L2R*rZXj6OBxk<S3BWYzy4_Hlt2NDD
z9)Z2PHRvA)3<j@hHl7ICr*4VPX6|q`jA=f8Er-ASldD6XS^Jk-%u1$oL>_(S;pWKH
z>v<27?d0N7{hRDor6x=p640p@$AAw&tmpXudg2!U58C#B2grG8a?zVcjCQl!krmgi
zNG3XH0iMbSxYGG(qbNf%WJk+w5t5GeC)kcogp1d!!1}-QE*}%?G17M3PObmSc+xpD
zgb&7o!*NDJthsbq<g$30Ca`~yY4m1qzxHHOg~3tt#{fa{DBA@pMj>lP)Y=Kcm3u{Q
z%PHjrx%d>7QVlQYkbv0rpgiHF>F-!e^WW=$&E2FdsIxP?0__PuEA4GW^)el3MH=be
z5OYg13JTcVjxGW0n0{#q+`=`ugp5O^;n|YzndLJl%f%n)#F@w?N|e1b6niXJ=`l`R
zqC7s;TjA(>wI=4fF*uTvu2LV|X!L-q{c00%w=-pN-<J?4un^n4Ju6y2oM(SWTClWu
z0ks=cjabr1P%(%|UP#8&W@FKtPu8C+;7oLXMT)#NoSNJR3tY{cp6i>kkcx`vH^=BE
z(y{nx>&ELYLTBX{J)tX!v)4lXkOyZhYEh?8HHWwoEs3n5C{;d5c@)s4#z9!XG(A0p
zBQx?iUf@}0!MF~{k~E*xzI_b)`zxMy`Qtg@@*ZzITSZ)M6nM5&$1Kt(6`Nwc`P<m(
z?wqPPo7wPr)mFK}!rq)@?8RR4*<t=%)9bLdL_Loz+)(zTa%-~}!mruJFWgu*l3hZc
zzF~9gwWb9hG(oru=tK|KwMpK^DmUxV=!^B%u3r0PmecU;wc765Ow<aQRWf=0tGN9x
zNBCw!tG2V%!6%(LrX<H{x#<rK03$@&E{uXoEVS!{axd3*eLbMJ(*`sw>t{5TmH^YY
z-Mi56!Z%W3zliGe@}#?EwQfc&c>u}Y_4KHY3K+kHs8^v^829GQk^+}@$Mba<yUBmY
z?)}rX1RoFu_sT_G`GjjL-DKWsbHqhO_Onm|{7erUDrP<Sm04-sa;sXVjqyv-e8b^`
zzn3f1Lh$IMpiH4uEi0D{o%Fx)0J`bqWD|U{6aPON;CfnLWu{!s!-JAa!r+w;6ra#{
zu#e}a0e^O++%tK)Tq>eL7wq0-ftkzy+iDP2x2WWlc{5y@Y?Mn$B_sNZFln2Hz^VZF
zQN``@>V?DZR4ob&ENpOI9;s$<KVt2fC5Z0;uT+f=hYnPBve;FVv~ha^qGN&E_Pd3d
ziV{NO9n|Wf;lcLE`vAv`rVITmo;Y&+$+uUq$+GXW;DfPHl3AC2)*FPuSv1h~x-{vp
z=;rT~Ysu7ck;x@4()-v@?XppvUAfP{NV`G<pYO6!BT_c*c$|kgBrhLsR;N$<&@PaL
z#ApGi1et)yv?eCH%J#+Jt$g}3f|m0t5huH`GP;SQ<MP5O-^D84<GVmcy~7V-@@@QK
zb7gA634y;ULt4c31I`At@)dJhU5*(jg|Edi!JXb>=acbuo=38km{fATV+9oI8S`~r
z5enHe^ae`jb<%Viab9PNFQDiY2D*mm=<k2BGTnIBmusEwM`(Hb(dfezGXx|x^bP87
z(X=mj#Bl!jkqq!+?I^73Z&lG0=f=nXnw^dxL*v$OBk%X<dLY@IXsIBgkooFr8EE?6
zQ8U-?9N#?vxZdFasw#zP`{F2Cz$UI@_QEAE^Je>dli_qEm;OP;9SN_``;}~=fw7al
zEIyB2=$oZQwSh6L;_z|39le)GB=Y0#;3qOhMh*Q1dyMr&bp9dT(R+v_lJQxga7uN>
z#Wx~%JXqPNhUW*32VRG1cZ4%4icfIBWxN0tuJGS*9{*o=!UI4$m?m#S$<c8y0Ma)n
zVe$~X{5~m4Glg-_L5}?EmP@k%G(nF{l1badc>IrVATWPg6+-%@WWA|%&g_anN(`_6
z54=(^jI}B`_O`4EOSG-hg#K)CeLBlg3WY3ELBPa6qjJ`zzC4i?wKhMwdK;xSUiZEA
zvSBg|5iI3DbjFeVZT^%S0aB?ctk$EEEHcIaNoK^w9DM-#?qI0k)44vu0{03%5DN?X
zU|MHFN)qf2Bqu^@y-R%hH^+y?8q`BRop%=gm;Cj1su;)KHH<LDjuEzdv};(ZFie{q
zK@cH>w+TL|xd+quA?(+E#ilgtbzPY22gT_is!?}y)sTMTG8$b*{pL5axiL%l)c(5-
zOV@N1t;GEsy9#1<$v;Qe_AGPNXyJQJeWbok>=jypOM{qEQG@D+${K8^gIAb4!N2P`
z41fE>UH6=HjW+46Pk*e^>$rEUgjvuOCK?PcG2RGceV0uWO)pl-lf0pEFqQV)@E-U1
znXt@b%U_T*1ki9-bawh1{wfD=FwJJsPzn?LmGQwGhRmW-D|su0vtcO-g6;<5NYF4O
z>&sh86mvp8V}0Kg<qSS9)NLR*U9i<O0my|wXkc2_B4O_QLb;(!@Oe(3v+2K}n+Ywz
zj<stNj;-#?&bZETh%&$T{)0^wqaIfe;5J<5b`ef5cE}F71QL9+Ga_4x1JBPs&eeG~
zU2^7~w4<9yb^~DL3l*qQrHK0Uu&x8gBbj=g^xfC`XXBuzKR4_=(xzYKIXv^4e8?Z~
zV-MCAc{Mlc>Mp+FnznwB5v#Pe(Zq*p!uTXsxu{%A@oxya*TYHx9iEDwy@OaQ6P5%+
z%_qafM=%1zNnY3jf^88gs<XO~F{Bs`Ck9W}-+|mGWevdqmMFCs`{fJ91z3d-JM7Xg
zxwX4~wcpECPxVJ*QlVNr@P#{&wS%*wq@PVzZZ^I<#%@sZ=iW?r;GR{ry9oJxtgZ^Z
zDe<a(*rtObcqEn8Eiw0L39Ls=0rRKwr1dsaSQm4k?7e(;qcN6Cp`@~z89dHqNI<N`
z6|<{Y)RPmd%*$iOWUMpani{Hs&r+8O#Vig1Req#>)5UU%03T#)oxZNC`R*1boPw4M
z-|z9UM%7NG-k56c(5xBV6Bm=&QsnUK#p$nm2|t6D?lE7+rm#6S^C6Se-U7D7x}85g
zx6ZZRazoi+b6Sbb+QbN7a=9!u9Acz!LIK$O{r*fviA??dEmEK~+nJFRTWuyw=?(CB
zU!L@}>wcacK(0EsZMDL*U5kGk?YuzKYd)K!nvS)(?Y&!WyHVzH<&;yB380G#MN%?>
z{RF%HIr&?ejD<@za2lW5;n0YK@JT;vIUgD9LfUroxE;9wJ+)>FBHNBUvmSjiYCJx)
z7ABV2%RgwyY$ang8mSOGuybhe7S<`v*GZY>OQ0uPOGwK?$$pJ~GkO31VB2<W)g?ar
zN@ytDjXd|o-5+|8Cd}xl|FsdO2_d%wB1B+PzK6?wNFs_q;N#xCYopB;;w`{BltcX1
z5B&~qKB|}Ef^D=Ej5LfttjqpSF95HdKg6eZJERq$KYy}a*bG=eGcfQKvsACeo~bE3
z`QH|M{MTZS1LR~3<>Ri<VK%52D^s%AgsG?8=Kc7aszUReW>MnLHJLraclXo;px!C4
zK)EM~Ns37PeEFEdp~dv(n?JZ;_U7Zn?vkwZ-i`?`_K?49zr;Ut){)%TKgmzUhyPc|
zTLiO?l_pbYPZ7K=gZA4`|D$Lab+;AMM2_rv!?I&Jkvs_(UqpkR3NGC5p}MIPSRDW+
zBn<@9a5&Duh>3}Hudb4^vDd9xE#dRD+@S3mK45a#zK1Q4gzjPHQ0{eMq##V1tU-0O
zay}hxM(%mmS;N|mgdqD3S(x?As|}u>#7ShFKEd+1aE0byW{ofcBT1HimocLszo$p8
z%Q-Gcv%NE5V$<3~wxSACzs&)~kJ~X$ja!uKaH*KS-e&S$$lFkqPI^tINZ^ox?JRo9
z+@lZ+%V=p|rzY#6p}~+0P-vn+&POH(`PakfJ|6g@gChLM1F?SmMG}aq+t{pdmtiD&
zf-tBA>+G~HTlvF$xF-loTpdj6O#HIuQwkJ&LR@ylXgqrA$lUm@H>SUkOISS2Ux~$=
z3+A%UO!n2tx7x(os}fX(Dv4Sg<lmzM@szUoh#&n<bANLEm!`n``-@X*Tj#<~mitTZ
z&BgY9Bw>{Sh6$<nAwu)_ts|E&WLg2|;~)FHEami<ST&Ys{5m^Cql#MuTOiN!Vu!?@
zO9+5yp1T-@weOv{$plWZ@4@S#gyCLIwh<c+zw0!5x}m$>+c`<i{!iil7&RT-lRnG%
zdJ-L)BCt&VW!s7KdJ;!n!{^!^K42izqVAE%5`77y+xWg$3_#V1kS!TcmL(PK_`}w{
zEuNy|*i2dzAsM-Nv422;ekgU`G)nt?9Y7`o-V{hrVfqhJJ&|Um2$u=J3)Z7Dx0P20
zlTgtbvn3oW$kvYTWw`H2V@;9)azc)oW0)!L964Q@V(C`N3D@{s7BC@Y94Fv$p;(3;
zHKMSQl5z3G1kf(=0&_r;pTh@)T2WEa^LVL01~Ng!2Y8|vrT$}O8nPdBxQHHWFe|Ht
zF^v;x@B**t^jk8Z2IS$y$JvbEWXeR0_P(5PUg>e=g$^8GefqOH=p@9NjeEeEsV8;_
zEXJZRW;LXEkK{ga+AY)zDe-#8pf4i3`e3>iahcqr%QP2i>{DhNUhiF?s#g&)DwJ85
zu~>Z)_HUXz_><ErcGKqj;oM%%1`(O$GLFEM8aX<y{tL%@PV#rqXLkMl{pGa}*C*le
zLXRS`?l-+SAkF@9t!TFrf_**5tMJ|3ayD4s=?_2wZqbdTsRcyvs7iuYm56tPzu1i-
zE6Z{>VVgTPv2>+dVoGoDzNyr*I-N~OhAx^a3BWRDuhQA?{Qa9~#t#i-Fv3>1pSRW{
zY+M9&`k$uWY$(0`GOBTG`b!~fEJ2xf_l>4i&gWEJVou<_xX_hoP^pFFa$Vd38XC>K
zn2LuHK$F;*+vyJ{HV}<teoG;Z*5^A}vReYJG<!Kx*HPeHL`^4^*JRj7+O)BgG1Kne
zIqJ*hGX>x5#G3o9HgP-p=f%zoGQAd)T0j+WH%=K~Q-Wpy5Ld4I4&r%kG6>HCN`w3>
z{mg55CLveWMyLfMo*MfF4)D?z@KQAm-roFtyq^#kOQU$ln8S?L*CMH3H0SW<<K!f|
zUe0yuZVK3!{BxjmYOw4q<*2>lEHJkO%aLPFfM2;67ARY#*D4H1m2gUdW|C^VilIA<
z)*vhCwULzRw~?NR_+<YxJgEi4+##sQ{ayr>#7|`~H7nnHaHxuswS5_}#_T2p+_EKL
z!kcC>1B~>QUR&-E5>Ju3Z?PZ_4s00E3>-wmMi=*M+#>4wnf&?;U$AnKqBA@^Vt;bD
zzl>k3a60to&t>QsB*;`lIKkw>olcDWaH^^k##iUbH79P=eiuq~L|qB8!xyhN<8>_e
zYDBq)L!$S`EDjRD;Ucl*YrACB^iFDm7pzo2vPYKIVk7a|^8=~6P%@2D5Ejiw%JF{h
z$Df4kK9v1NJj{`qgYNUQKa6{uS)Gm_dFKO9I&Q=xQFErSfrtgr;e4I^-m!kOc$9z1
z3;GA6s;|g2<@adBY;Tg(4z-F<m@%Phi+<7-R+Yl@y<!M-xe1TRZ;w9Y_U{XS`jA4e
zr}^D<EvPdgH?gYF2N;m@d@<H8Ai}{p{7n_w+c6lmrXV_U)hyWBtDL4)z(wsiI8<<J
zC@u2&ZRL(aLdA*iDM*rNwZWCf@A^)9drZ|cwJiW`fS2G_(MY3gnrI9M^s4dms)$d$
z6(p@7sP5nY`FdRcFpE|G9-jBt><SRyU4D>EeFkWweG)aP;eq^~K7egeRUHOOz4}`c
zZsVl#XL>r}_-JB_j0wG+#dgaB?y6A79Y50y`D%fuOV=^5EW3FYk1^3#K7ZA{|D4+P
z$FA9Y&C!L4jX!l7+*99&Ur|`SwVLEb-~i9qm(C^rI|A@M6iRUKy=2ZTeLv!J&|0zz
zg@J6llf=h5Q@l-7;~DtRuPCe)?t102RL-Gc+IvN=tl7k>dF%B}$=41s%aYQUgtAx^
zM6_piqdftH1bkEC1GKXTsD;T@M)S115I`4_2*&$b|Hq6f#rDB!#+_z9?5%k<d-5Q`
z%9#@%R|_E7jHOv-+>3=-&f2|qOG5hqjam#esViRj7?>Q4d$8ozUDj;>+{1OS*b?D$
zZ;XVSpRTvZI**RfiHMMcgM-&jPS85FQMh<HvHp;*LRnkRiqBF%kAWR{l1$#Njby58
zKSR8ET%qXurC>!$xQYvG+}?w~ne|=^BAiYd;e9$OW0)gJhbqHwOr=7IU6K=Ibz1L*
zt#R8UZxY)x;uW^rC6j5*+MVH%R$L+LM-=<vW#2&tin+ciPd&Y07Us!PT^QZ$K_Q&&
zTjDjUU>%6YjXXTGYfiH28nSb8g8xD)EPEFdog89Cla<MGJIY=6>0&!}NUMFuZ)(m{
zV@pXz&|_{b81-|UP5yB&vDo4Frj>W`Lib>TtuG&Mrqm#!lixJSmuHRq5%d}zR80rM
zfo`-<gg;tn22gWEkOpK}{z6(yE1zDw;=V8K{0oSlhEfpZ@bG|FfxMT3>MR`^p6#zy
z<-HAcOZ2mpHq_<3rEfC*MlF8l^FC7X0kes8d}I{)`otyhV)W*Cy2CmDl*kU&FhDbL
z*YXAK=GP#Ldiz;Jlqc75G41wUG~n;FdbA-OAI=zLT8!Qk0coX$ZqBS0hcNI+D9K!+
zHN--0EcyzaHmA<T84yoEVhNCSLurg~Z{H!S>^<|n;Az*MGZ#-vHu1NKH&uBi(w(Sj
z;g|?NTfIA6Zjz22H~I(s8|y4$W7K_wdzGh641{w-ngSsGCwzb{P<@-Fh3dmA#UW&u
z0AkkK8C|nexzy+h2jCn>F|MS(j_EI5mcG{)%X+*{UkOP8bYSJy_c#5&Lu-SfrMhn=
z4WN{sNfq(lW0!e-CJ<IZSB5=HxsA?M$LxTjk6QS2g5W&-7+$6GYYjVY8?>CAWRhLN
zeXv=Q9704Ml{r<}nnt$whl+9X`B{zNSZ*l%Q5HffOKALA5iXA_4iL}&Qq5SB(beu@
z$gn7aEdqabrB?tUsZzCDD*_yZJtaXD5ZM530dQVI)rB`96;AG`Rt1~Vt>3}XKc-BJ
z{$8r@aaR8zqw7ZuF`X_?UGMa54JJ+cBpI$P8cpS5$EF#*T<=T>9&ijRS%9v$A%dD;
zgFCaFBwM$kmWY588FT@m2UV-D*0V!dFf=0{+<X&JmE-EP$Wb23wj0aGh?=!lvyCzn
zE+?Uj`ucEvT+9T3=Y(GceWmv9kwgV>a4;p=yQuX~c8(jk;cG26b^zR#c)J>6dzz4_
zTyBP7jfo=-cNwT>7;_cdZ&TJI+H*>SxtzwN6Bh6CS88dx18!-&IQtT>zc;{tMO_HM
zbvyR!fVH#mbVDD>;<|u7-CK`iyW+N1r%3dJNQt9ynRY6ZZ&9>#A<;wm_Z~)&$b5r`
z>!FmStPq%GD6i}O9BX@@q}B3N`nB{sVO@T~_K9DZ;!Whvt}9Et+IO4^lI5Q@XpQ{t
z0?RQ=c5eX)?$b-afesFrl5D`eR(H%<h}pxluNq3&CJ^T-&&H5g35(&(ph*@RKU@AL
z#`%8c>DV`4ey3_8CFLv3x-kK-W?<Fjv)d7!r}MjCU-CY61DQSB-N2&32bk---ntIM
zp!+Mr582H%(oxfSgzFS8PhQ)|Jl;dvdpeH~Co_u<p=`y&e}xDKx3({G^u+88PuNAn
z@_4MXv?J^`mg0!9khH3)WeqfsJ5Qjjrpsdo#Ib<A8l0QU!tlWEiLNh!A3jkN$CUQ~
z)QPxUdF}ZRZir`_2l2X)K3v08y?Tbgo<Xw{DEFiC4+&bYHlx74j^|}h*R!vW6@LBU
z6&DsxjUPOhoN1QaXP3(l0H?PIgEo&3g4KB8S2u_48$bWXzLt?FINN`Vr!`Cb&)pBE
zL@r)*(wGqm0m=x_o+1@$nsY)v)ssw9>J(#%>ye_)W>GzK{`fEe(+*9qMcRfCc>5@*
zW??6|HBs@&nShFwS`{Z+v7r)YWRs|GI>F}3X21&}m|lgjQ(wIu{X;Y7M;!$%Xx|0k
zH3*ZoU2J{Zc|i((6tZ{+B|9X7!Mjk@k)ZB(#Ir}_UzY<yhTDyRb)R!eT2Vx?*NR1e
z#Q;ERCfiZulKBrgIR#>OZ0GUPFaQf_+BZ%T1#aA|x0|cAMKkNK4!v$rE$|OziHb%J
zVb~<P2OV(Z)AungX1rm?(+^qxHIew`!_0BVw`#Usx_#!ZM;KuJw8<F@l2$e;l;9!y
z{$Ozjg^*MU1*jR<J+s|fKWBSlsDGPmq+T7@^S7;{7_=>w>6a*FBTL5<2k-cHAz$s!
zYI$H>>?Tq;-HwU={yh@*4uw$c%7#<D>pjI!Rd%d*M;IpICxCYaY}1lzPDC(;@K%1?
z7#1O{PTi|8uVY63f__#q-s|Y@b2HDLIxQao!aT+dlozM<gcpzZgiHc9DnNWRA=Hw0
zlHuj@1P~=9Cl#3OP3+^`6e`sl@O$<G&VgXsRwdxA2r;9BhlmD?(nXV1kpNOFwh6X;
zWK9yr(2Ijb$F4t-Tl8uB3K6!hfauIk(#?bBCRaPLzN3n~EQ*nCF;{%TM;nlGm#Pnn
zWE8gm|7^+CY+#N6)K`NFa?TM-{lsuxZvq9-5}o9)Y=98P|3WzKvLT)hfHtoKA|dA3
ze#fQ$-6dv-k)0mvWW7ik24T>A*a~7YUe+PmD}CQ09#tH)u_BD?`LVo^++JOR(p{Dp
z5C>{EIehP-#(wG$%V`l@HEDmwr*S)b6#RS>%>(zkbRm~YH=M^0{D1o*(Rv?F^agvg
zI6VQSXC(GpIMiZvm*XqjSur0UzNu0bBu&s@K;KXIa=;G!>12K;uq(Rb$20#NuyJX0
z3v5x?tuMM7vi>_PZxaLR3D4ad*<Bn34H**#;UCyJ4LmQ~#!89t{e#}ba*71c@Rm~>
z3`a;J<$y<V5vjR?xQr*mcO#BTys_N>65WsNC3lEWQOP6^J@t*8Q?kAvXrQsKI#31H
z**u04!Qslndv|2Cf`|$}RaB@PSe3*W<p!9QNS~hS9jaxa<DioqjJDT$uBrT#ZTMng
zr)op!pQ|Y&5&_+Zq7MnBf)Wr2;wJZNzys*Cv=gJf0%po}P+Hxs;}<w}Xt~J9-iV2d
zC)VRqn`_3Q={Nh~Fy$>lrG7%0VtA{}!G=D;=JM$zv7*Mz5#Ejm_s!XkqPR!njiD^#
z`9&DIZS{}*D3D<T(?--b!kId%(`h20yeeh8I}W3bMs75o^vU3Vu!XC`9}SV=VxZQ<
zZ?c<*0px#FK=cMyuFp0vC9kc9P-<vS46ymeV!pxCM?W$eCMqqVC0a;?&o8wVfd9F?
zmR0=pGU{Q%+ch1XzL2BWrdvtyqS9aj9DpnOBl~J#r^a>1qeI8wKsEr-D{5fPw?v7n
z7Lpkv_7=6Yh|_V#1FQ^k`+Ny=SVUM>o82W2eOeD-TwrI)P52Hqx)wB{=;g`qRmgSd
zu-whl<pxl<;~Dzk=P@@-^Z5P`%HA?8>b37076g%QP<jYaQUxT2P(n&UVrUpbY3YU;
zRJxG{fkC>vhmsIM0qO4UZf55ByZ5!P=ga%t_kNFK4!?*W9L`wh`mLZ{;<<x|TPP&T
z+8OG-2GrXLkSXqVv3>C@>sto{Bxci`1#4?>eCF4I>HRl_Zma1qq{;f(`-2~Bsz2bW
zcPrd(>xBaqOaZurYtycS^W1KXuU=ZL>(>(;opG17eC)(n4lC$GqQ6L`9!kcX3)qUy
zirPQ(`+d+4_WSB{d34se(Dn`W*!jD++x5&7nz8w+*>8ccnLk?BJ+rR#e|wTE;1FyB
z>$H@N`-0(9zHDEnc7b}A^u78(>b%H~O$`e{DbkRT$|=gO@18_AnrSLlD}Y4YKBKID
z!9q9ClZ~ynjWA~DE07rl=)+%PoA#v$WjHQ>KZ>9GB<pr+&AKyP$E<~ErmL*1e8Qd9
zDy}2#KJ(*?IPiWLAXRk!GT@iHZvN6xw&SBbIDn1z??L#Bx9(hz$esQ&3OdK%B1T8C
zmkd9Zkl43eRuJw1`kJJ7r)mb3!|`;k`CA@*N!VA?%T-5bV>n~R_CvB|t-fY^KOh85
z-#@t6Mega%j}g%c7n0t;e?NwbyAXi$wh9V&DMqDP9<mcvR-zV{Het~|@Y@%;2>GY)
zo*DG=U}4GGNI!pb_ieUOfb%+kTMG(r@nCQ{I*l#;qp$_=jH?CI{=bpuVFan?^Iy2Q
zVO)M;VQOaIi^iwJ#=A-BpT3DC!&xU`6qCv0Gh`>9V0alV57dp^Mfe_lCRQANb<agM
znEFXynK5P$DSDCO+%#Y)2uNKu(|69#zNpB@@#qo&rKgTEa(bv+YHCh%b<QAkyJz#H
zLkZ_)vSQ2~d0{G8F^4iO2uqxPZ)2)2u$p_U*1C(}0`{$JOVpACp&x@_xi5Ke!1lY^
zO5lrU7sDUt-wmQQNW$CwOI~%+_PMOc#z5>WmgNcixe6n)%}~N?VukDRRJn=7&B?5|
z$Kt9smE&0lsniG5^|@FI-4tLQN!zcNN%O5*POh?8Tt~EYJGadLekVEKz|k3+0igYd
zk6skR4s$RsKKR~B&ZcVREH<dYhNod-i{D=La+fJz8+ERjb-tYcWs~v|XJD*kN*b7~
zpV%Gg?QHW)q3;3@oytu%Kj8u4E~-lBywam&Dhh^7;h#2#@&vxTx<o${z@=|@dOU|!
z$-<AD(ch=vv>1ps>l%e|)nu6lO-{@TQT^EfT|uZBnLis~vD4_^Zh(h>Z2*8b(RxDF
zTK-Zp=H>I#&;B^fg7;ibsQh{Rp!^|ud8dSLyrnP<BgIBCOWtQQo=H#NaYYW_WFIzO
zvMkYX{53ww%r<$;Dj~(u7f<-XO6rm0kVLHDRD;in8hf^&mGmUtN_o;^bb7*r#jHpJ
zo}j=+{*WXE`gOnzXBaZ<S=kzA_>m|2fit^=;!J9}uDhVT<dlR8Gu{t8#x?d~&e@P`
z&cw41nqdVRb$rz}^CYDPivC?;G~WP~q$VPdwokv-KZw~&fp~kqRm$KexvOsT?A^zq
z%8dewEw$IL<IQ?HUUrwearZ9W()CQZYG#orAmcvb)s@t{8!Sc1nUlv1+?4@fvD$Ce
zUhh8tLg1p&XtHowUEp<LYOC{^m5hptz-lwuLxq9`PZ5Kq&`(Hog5@g(y_qL1x_&3E
zq{O8)560of7~KZD?Y%U$h3_=yai5e*k((~7G7e*h-DcV6ecj9?i95*Gs04W!^!9N@
z9^To$yAne)lapJV40*Aae$5sy3s-ii+Zn*(d##jzZ7<2Hn5*8#_tX3cxuLK02_Sew
z3GLv6XQzw7C`dq?BJ}u(%gIi(R&x$r9Irmjr_a@JkR;PmBqP%9TqpWV5u}I&OJ@@j
z4H-xkP2=?FO)UB_P(*Oy!}V!pk0>}StV2o*th*q4(==lNZ-E0`z1+hf$g42_fS=9N
zNDE;=ONR`ING1cruBb%3P96tuHPvYr-GLNp1*{Y)IxJn_-<Y+S@tLiiUq+T1;EwB&
zupUO4Q}7uE3goGFRMcnj9rqT=^iX)56>4`&Q9S$vY1dc~L7OaxP&QoaDmMICvQ{Xb
zX1`mMrp<nA@+SX|9GCY0$IQc+`q`)%7gXE0BjL@*l&g|vJs*2Fa74LLo&t}pK-$UX
zm3rXUi684u*<S)h2@<)Hc3z@$`QB#cp&RKyyG;SRE&hIe{jviQK8S=qN1g-_Ux1^5
zu#<p1gjZ<hy%ivq+ju6af+jPQ?*l6f1^K{dLH}cgualP1e+ZjIFH=$S-Wpem!<jQ<
zjaq-aO+dl%$}oFfJ>j7dcBhe;we|sIAx{<Y@#6R}+L>4pX38X!71E>d2bVWiz@1Jj
zsbss!JA#VxKb=T<4$0<#TQXc@f^voJ2ip~b83C{BgvGgNu-T(<VfGw#mZ!q_8m9f{
z)3F2<tfofz6-(&i4{s+_cJ*HzF3ExL6pKGm>EjICAvcwgk%?xfXH_i!g!2IYa@9EC
z7eg@)H+n%<5Y&Zv^yrbp9`Hu2@glxy@Cca3;lICf=c1ncZiVozaAAW`uXbajqP{tY
zuyy}3FwQUF8rN*54qHCnMbm8i4%DKr6TX8nmnug8|Mg%e&=F6OlR&pRt>7AtHQm<o
zk(T`Gt*Mwa7|aTY{XNBs3-afYC(_dk2lT(Jm1?#YxAc81z35DfhFd5~j_AVgi88cH
zORq-r>enr8$F_D<{}@PTM>9h1J}`_GtP?eC=HoI--~pmdLkl~k&?l4(qE1wWnjwKe
za$fsf^Yz1UcMfubM_hkqDX-e5VyX07jZFl$SF|$#2WMOoaww%dx!!8GqM3qv8o0fP
z2;tYnd`3-{+r|UZo9fJ)4GALA!K0DcQxE^Bh_!Uf;4qK1WQ({LshjBirYsj#{v)8k
z7GSA&U@Ul~Ej%k$Pt<UAIR48~+pheFqi&QgR*<=Q)s&;eVd?7ae3$6%EoLZGm*W{g
zS4)>;=j7kxers&Za$zE*WBo~-J4Hlzq!Jh!o0_twO8GLiTv#))FF7BYTLUwtWVc~d
z&0~|_u;K{;3@~iBMVswd2L2&O*~BN(!GJ{j3wXwZ>fb?jD$~EN0;4hj3rYOo-X5LS
z1i2At1;_gcxctqL`h))ANI$)Ki_e`aC*`No(Zus4)iy4H&9F-U7Kk(Nmr|%@f?(1P
zkfKS#Om4>B*?-+n_k(^@Jw@FbtGg9U6XHx)W7m=U`e6B7N=Nt=_+FBqNrp;Y?)ql@
zcw*MiUbWhn;CIFxbi-mLIL^y=x9XH;3;$8Dnxyci)O`qI@`~oM`^gNyzyd;!g3%3%
zBfC}vzXoZ0B7mCXZvrKs8RX(u?+chu^z$<-G@@KHzJz@L^qj9Jrol5qjplEb)%X9h
ztS$jMy)il7e>eb%RJ&*V0DEQ&_A)CA!mq&0qVM|-ob9Y%`z8tv_%wq6!^!r0c@gG+
z=OwS-BYzB6bDz!IuE7D+Hzl&_H*j^fR3I&2=ukmEGxL}ra}CbkDan7gLg;P!lIxO2
zG?@+hYPi_@y_zS%3c$HFVOK?lyb<XQ`O8m|K3A-N6Bs2(ZdxJDBQ#|J7_8P~nl>4t
zOMA$QWA4#|V{$)CR#|kMF@i@uGXxc5vVb9=JI8x}4lYKYf1HO-Y*sIDtBg}3Xu@M2
zxbc3evm_yvI*AUgu<S97s1HdfkA55+9^N_LO&fHy`g8GErn9OR=pn!%VG_3#@>mW%
z$khQ(%4r3`hYuvywp|dssDuXA%*+g{*ay)G34w3tiKElv<#auGj?1Kri!^O-eZwm4
z$LeC28hXzGiOFH2XUxk}D)WrD(+;NYF=p-hsfqK#w#5Za_10n?zHj-ShmmbzeVw#R
zDLyC_;FUejaO}h`Lj^i_&0hl8M)-Jd&cnt`ddIiU;tzd;AvyfwY!3X&Qm=c9{^g|K
z=fCt#f<$Ej8JL>8bIPW(J5!Q1oBSWEKTSK`VfBu}{lGP+e^{Ix<wj2RI+o-|n`b%0
z1QlmNBDLx%D=!*VUQ$PV`sQ~h2G8f>u-oC}K#g#pgpmV8j^wzNz0FR35?rs)7{gUP
z&i|NDln~bqpmLn8N*I)>&H9G0iPpZ7N4|IM?FU>#`9A@x5$zCA?bY_-BXDI*23$Fc
zBzi!62Clu7+8@5=4L*$Je9bz_dU|_zraZ7M^6E9n{vkxa^>x4mmJa9{-t|U<yvXm{
zuSjIXiNyHCg&io2aLRzo$}=X81sC)uc_acK36z-;b+gf{6;t5^__vSxD@UiK$iC2B
zyNwM3ExutdyqBGq`+O<q_*HNpUU=DfG;q!sx#v2pbpc*0yZO^ri}kJfDvaTl__3=$
zaCMhu^(|=ryU3J<@6VrO<Yps2SGZRa5rwurr>ppJN*nhQJEn@rYZ~aH`z3|B3bvFJ
zh~CR(Z`b7uLdw0#nlSh16T4Cy6ZCiK9!hW!HC=HiUc1jF0~igc*MN+KbFMbM_3;7u
zh6zP&H#rlIK9C>YXZl}Bm!M$nU+c<QoexFG36B3ise@a!oqbpeGgPipyLH+?%yni~
z7Gyo+n;(c<Kx30YyK?1$p^}CYk?{i^{dD_6ieliKj0=k>6>EYI5^?WK9v!f8*<sM1
z$hPlkuUb04xTTJ_dG?OP?n9Yg9_f*6fZco6+h4guOx|*6SH`B}DGqA{=+LJPeT6-k
zWtS)c{6Jbb?O96C&0mVK8;IM4elHXz59TtugN^OS@@Nq|n*;hzx>)#IbHCXW(3#kL
zhI9fGr6~qU%wODUfpHI>PZbaVovqDi8&Ute^L>R4JK!{|QCvHiBb|CTLT-QbS~Op`
zxv@H3)SD#tbsC9@TziIE$DKD>TCejpE3mV(b2|zsITsE-vz0q`yet+B@#F23gR<Am
z4xW-^Ti{D`w#`Xgv+Q}Kas@xUZ5HGrFZW8nz*H_@qb%}7%6*T)cDC~MREYel5{=xF
zc@5nt$Hy{h0K^J%VN+00ECRXyK+eOni8^;gIOqCz(ooJ5z|{V{ONsj3cw^1BqXG8C
z;L`$=rT3r|8W*RdMx@yiDD(XZU8ODP$d&_J_U3lPgc@)hnc&rDVUvVFHE8t$rj
zfU^1e9$8x{AR$4lRdPe`Wbk?8@yx;JCoiRUn)ZP>hJYHoQG!re|K*}iXXDKnj!Nhb
zwEJw=5o7&AR+d~rdEmLNN=HJUzH#?in$~lkHY#o-qC)MWJ2^@T{?Fb|=gZkn*WTtc
zYzb~8HE4*rWiwvfVN;<ZJtF^oe<p`e6YyB&|G2C0ZF~qJ=|~aDByq=PytJ#S@|`#x
z2ldTE!&)LiyAg##Jo0s!AW}c6J-^`5j2E}>l9Kv`(eii1<R}~O?@0ve-o8P7eT{tf
zrqvD>%tP~t+a<jV790j9*>>p9?qv6qdZ+(VcpWSC_;LRuz4x63hS#-knq(F45}gDo
z)ADs3#&(+wBEl+I-w}Ad!KsStc;~D6mc4raH_5<TNN{kwfIp!mP;<lZ&D;Dqw=dd*
zW6&h&ZfA*eV!uc&f$Ymb8Ed`9b_amXh)(mnNAbbSD$Qt{lkr^`4e!F&ASO*3UC@}r
z+QaCzp=v8Lz_HyOhXL9M9%F{{ZQy^prBkbHbt>--+@IoJs9M}Z?gy&pDE~b6VdWzM
ztl~D*ethj69f0kL<jrY<{_|pp;Ky$APG6w5+ToOoV*k}^ac{c<J&4}$=erFzWvdTJ
z^&!R^%w#O?+ko4)%lSi+nayw`vHv2B#m#=U@zmjRh@<IgDI(pX-6&7R&~mm`DDL6M
zctt<#g`3G^kMyW^DGZu$FrK?ZLsf#Kz4rlr#ab`2(TvsT#XQY`97^mIRH#Fx5_{XC
zQ&%F;g8DqcDcghnXB;nK1f6ig)<@JehgOS+Z?MIC)E(kg6sR9qGhrqJd$WSSZYu(0
zg1Uzu%VxUbIS{Lpltlm3M=p?~R}-fKUP`fje=OZY!*zne#~do+Ej`Cix2?A$T=#|X
z<IyVD^IMWqa!CJyAD!9U!q+jLu<<9@aLJYn`_o>o4j{7j#Y^+RA&KUN<6TKp;G(lV
zCpT4f2Uyr*@WTqyf4AcwV~hRwb$_46)AfgHLm-hxA=S3u9luD4Gwu-U6;?V<<5BHk
z3C|<J;`wqW;CE$I%(qblq<Gx-U1SAXYbn*$an#<}R8(|;L>}sJSsb`-YvjGk;X@w9
zYa1nWJ{|Pj^AUfQF5Xp&81x{<x8^uJ-8+{iX15o!*%r3*NBCapI?Y&irBH3}2H-5v
zIbEDf-F#s074f)#j8DpIDx9q|5F}tBt!JIWDtOjj*jQsd5{F(AI*|z^^4sBI=cQ2n
z#SV6{CUtk)eSqqcBxZW5d0Yq18nu)O?joqDW}2E;%aWHS(>kH#ePE8GSp+8(2kJgZ
z&h1eE#2h}CQi!>q^GLzXP|P*v2?LBh#{dW>&Uz~xfy|R9wH(f^$pSfWJR&#mzjza4
z^Gl_~&K?)YrDE%wuHFBz-*QcIhlK9d=S4b`m>Xa8yB7Ab-o8%fxr`SQ9!vP$+dlzi
zTbVh`FMFfeCF|iNK~D$pZ@FdmXBsG5(u7Hkd=_y5%Vq8+kviEEIdtCVS3Fn(C)S}X
z8iY;TqeT{Z+5#a0N82~^&!hGGcGJCa0^k2K&rv3lN(#AW-T8LPSG!VF>nZHwYmjCt
z`gSS+mvDZy*teG4SinxHcjju8H?z9Kwbp?F=8NAz)TWHjVp2*v!4ny?k$aAVRTipb
z^<W#{G9zL_II7P9bC+UU;@o;&COj<^XLeZOajvs*0`=#&nD6xV`BsuQ2QrGR)PaL$
z-T5;ZH2wP3uJ&qP>)oi}586;~MnHF0C|qRYxW6~sO1d>tSYq4H)%nbFf-K$R$gznQ
z71xTEP9NoO9qKP^xm~6Y!qPS7oC3z=CUZ><j~#xH1wWl<mcsbUp4Mz|SZ0lEkZ{cE
zi6-#;5D?Nz>RJS78NC~){CUEmX5ekB@iXP|WXA8uH)a7b?RT~L(u2aoH9h;7=U%Wp
zevHE!mKgJmg1=kFOQ~}2L-28D#NWz~jK?f*fV=}fB5(a@o43-oFEaa_pZsr`K!54u
z+g^YCFQKs0(jr}ao0h(cg&>kqfQdUQSNYSFq5CZEZn-IE&7j$Lt9a7SZI<k%SQnR9
z-;$nWMUNDHwuNJ0pknkob6*7Z@5gC#`D!vAJA?8)OX__3Ez(+*RB>ESC>39ra{w;-
zTZ!Dz?;y{(2jn=@2>6YnT%my|osk>`Zw+&_57M#Y&ZvFrA>GODG_6wN&<}&4D270w
zu{bVJEWSg2qJYeX?um6=JQ))6`$fL)>!LFoCxLuue+mcpCB<Vyc2I5Bx9;M*(mVN|
zvqs@9Cqslf-;QajzC`f-$k>lW+)d<%K0U#g-f5<hE^d=eCG_qbIb5EP_t&fNWfZFo
zLN?A?1urWk16_&b?~5vq9BgJ&KUr?=?*~zPbT9-&pM~Kk0{)5R!<&t}8+TKG`}xUa
z%!6U?6`CTkRno<9`_n~>8iAR!T)xq$XoJ28AyIdfH!YtTpGe82$K<HKpu0LK!R~G^
z&S|3#^(l}w4kGk98I;#~aUMJ*zbv8Lxoy7=BaD(f%5Mzn*<4tZIp~pR&I*n54!@*}
zQRdbyd=eYQ<_Q=-6(w`g85u11gnF-1by^)IZZ1$!Bk$RmyDVgeb6@8eiX#G9H&av6
ze<A65>RM5OEBYGTdc{dIKc8csYeYHMU_PKLr7I3a*ZoF6fuFnk@HGyv^{4qkD(mRZ
zDj?k4pfez%&cpX&x>@RbB%@7%$9Dg#^ox4W-$ZyZOJ7LuO$yy7^Y``nfX9BiCC9*<
z-w>Jd1B<>f__{>l?UTE_6pvmTJkn}kh$k&1;{KFl(2T8JW<cTo7+|?R@!|c&axHv+
z(T0c7e2}f+c=Pqk?MFSds{`1F$Kz9}7@xYULx{<rF-8Ci=iuu8zse$PGy5yE>~Cjv
z$weVd&1zK017KDP%E*+zfVgN&p-8OS{fUsWaMb|oQM-@GMt8qkQoF8=?W#>NH+8tJ
zKS3rYCXdCxD?Qh*aH77sTxTV)hz4SeK6EozwWLUxU))vb(C(am#s=c%;h{1OB#vhn
zS1SPgj)vu!HaHNyOXk0H^O{cRQ|<eb?3wUlq7!Bibd}FczkQRtb8CIZ_u!W8eC_R}
z<>eRA_WHAM<Q9#8=T{k17H+UIIYrQ-S4T&6VI^Rt`M5cp%MFBB15=7{22q3L79fpu
zqQSZD#!GjHP>6dm#=~*k7$=gD5I-IWFt!Wu)B%lc<)z(*1?YsvC#T_q$q|e?o<eK_
zlzVO3J@WGM8p2xQ5`-FgDiE*xKC39+I!(X){D+qFEhUv<+MUo~+IU5*n9>KVYv5Ja
zL~vspV;UIX-5oD`sguAKBwEuFk?b12mP6I};tun$(8rGot>K54iM>#R4d6cp=Hp;*
z+k*IZP>1VQx+v<P$DI_@Da#6dPe--migbY9xEuEIB)|2q1f~0%7Kl&3jfu;uPXvpT
zzy@sG1R0K)Qy|-xrHRY~z{<EdPwJeydVep^A&J?o)W|OZ4aybh=&EMiD4;iqR>*OU
z232v7+siK2rpz$!*~x}u9ea#jTW^z;&$&c{bRu{!`da!<$fE7X#V4JQpLZOfuOsfk
z&u|-;rEzroO0z9*_32kX)^u=%fX+S!G5PE3S8HOKehyEGOUieVD2NMRk~9GF#Tj1A
zU`H!>0g^BvW1;+2nS7Kt(YaZFjqQcmBEsX${Ud1tYl(IppQOf~Y--7<Mj|gX@&W}q
z*C%@gh3yKt+Pyo~ZNl3vo5m|@)8n2Xz`l;saZE}9Q=49&GG{1ko2Dk&f3t68bMzsl
z;?<+F9xWwK1G@{ZaNq1ef=j|J4uyWDrHB+s8AHq+rPfwfp2u@R7LwP~)hr-I#o$-^
zDes`bm-Z+!Ix(6Gb*|*-%l_lqtPA?{_m*Gkpw0KtGD~Wq7H5T}iVA(KgdL-3k$77t
zCdXI2eZ_cp0+#L{bZ}+kN2kRq+L5r|p$KbxkPh=ww|zi?kmJx$<9((t{-vQI;sXL9
z6<k=Jd1Ut?r@j6o5jSfO>*11a$N#--7S`!MNYQ4p;9+KC5>npWOZa8;i}MfPrrPGD
z^DoIEPx6Pw{yJsAz3$Jk(s;7P%ayBF6q*k9#gaswXnY|k>#F#)q;KDfrTIcF+B~Sc
zQ<{c??{f_v=6YV4MIkJc1Ei>^Nhw#gR0e8&{R*!cx<M>dXa#v97ch1{=L?<U-PGAI
zwoZDnKT#l|m0FA=g*hQ)fAC;39ErR(yhAaU+Td(*eU{d%x?=v|R+y^~dNNUmm@>p?
zNW){XXl@^gXV-fA?De;SWT3D#`-eyq;K%)4!8kKn^JOcFQHZY8sM&hZYVlTye%&W;
zuajuECy6X$1nQ~aKC1v7LgOpoF3-*Pxk7vI%PhsSzZa!x1*(qlloHwsRVQ#hJGOmz
z5eR?rJUo<(zz>f!PIAd??N!BE)<)1aIeqYjtSr^XuQDYo>&xA$A6UYTkmd%l6Pz#Z
z<vep-Vpn|jzz_;bu=PIM4bX-DiYerHUxVp*N#u9%CgKAR*N4b&T%A@5V`JC2xVWF%
z!h@$<QMJ#tm~&@;YX|3u(z0SXQ&ZIAPDb7;(9L=vj`6W~`q+y3gOi{cR{_xB+=zGa
znobniRuwN_5XARU@Bu;qy*evm?!>Z@wddZlZ*hnOOfJ6RG3Ud@%Hz4TKaIO~_Tp1=
z0$Fw*O2b;}PwS2Is7-qYSc^0ZumSnE)H~|z6-Tr087e<Oi<&?Jz6immZSP^J55S?c
zbt6lvfW5i!%})qd3Rg{s42Vewm)S05x+Fh6`2MA=$Re~nq_8}MhSg4nJy+_oGq#-v
zu+I)Vv}j~=J?ftV)G?(eJsPqca{@}^v7VUk1Qmp@s7>{2ZShGZFEWm3&o?Iq%|MUv
z_d#N`9_TPx*)~G{rn`XVSFI(6jC+sxuobs7=`$OZu2JgfV3xd$o>Ji!E&QW`Gy^$U
zI&BnCBoL!@QFWm<QDjK^o`$NH3+c<1-FBzv5VAii)uev>&HfzdbFzyoTxoN!r*F-3
zMcflEvce*%=))mtVX`#c_q3kYgt5%*;sCk)w#5YA<cPc;55X=Y)7ZB<jwXX$9KwI^
zmyciQK7RP{22f`E@!ZJ7h7%ovBP^um?X4X=9GL*(RVQk})Z*W5En}Qp(B$G~FUeId
ziVgxbLZVR3CfNu?Ftzld^ilc2wbBcx?B4P{<^NEx>@k^2t0F!UO_$rMLrB+c0!DDP
zcK$#IS2*xJ#(I_L34I-R9w=-%pF?1AsuEPD)?8j)wNF%JX`c2W;Aq^jvUy|IgN@#V
z`qeN9Ubjh(!pAU6<wV{fpgwnjy5u>TsdvFCLFQas&+x)fj&kVv1H2`9_L%uVqKcTS
zmTrQmFVF0?;7g~66$+MF4GFwZEPx8oLUm?&ANL7=^=YVlTFg=n6WX?ciA}kTomhH3
z3W^G^C?HcN(R`!@1)cFwkN|Tgl1bgk7=r>SygIY4>2!(xuZxd~it=*va@11PX@Iwq
zA0C_9*pPYu4Oyh=J543kAA3L?6p);(K>C7#ff{^AT|<4vgHB#Onu;4z%rYuP!~2Ok
zm|O^Oq2RE;0N}7zy4exvJ|iP>+1A}J2%oF_4B`&A97o=nH;^~FeA}wgA=j=pOG2`2
zD@pALYX_s8#&{;GyrW#DTozwOF>!DsLq)*ud;WmF<fVZ%F=`Hu<d5UkNZ|pjThO)^
z*md0A&e9$dH}HK<SSMM}@}uCd%@3XwYpS`SDmGMgK3YuKwFjo1d?TpnOVbJ_CLjqM
z(z#!6)*bn#PKB{!L<)06SZrAJ-FP@wNv?ZGw5lTW$jy)R(fOP=KgBowSb}+945RH#
zxuWuy;)LnC)snh)KT`4MS~?Y`xHq7}PSe&XW=a0<5m>%Z-^o_HWv`1(By;&~;kK&<
zzo3dGmtz1~s;d7fn0%tXT_+1%qP42?@H;WvoELalc<1}tqMQ6FY@TO}K}_lofbXmq
zQrKowrWdln?0baIKw&YevOQD7?b3D3l_FlG5Sj~6)}hyCL@@zfHsQ0AzW6M-8t&y!
zCk%q~LvM$SKNH)-gLw57QH?61D#Qw|sW&=JD%b<0*~)JF`v=OfX!+Ant0XgUlRI6@
zL<2I|+3;#AA2{Jsod{$JEBG}dPFSh#<$qGK79Pm6h_Dm*rr&w)WzDK(q}tk}{qyHf
z)jzitV#CSy-)*V-NB`VbHK~zC%|I;eKzdkEfkxhxl<*Hl0%F3h!t$}L4DRyEHCA>p
zrB5^zBQL*`1TAD3i^9PzOg?*c$AYFQ0c~1&c8nftn|W_rSq?}TY5b_ot9Fi%?DG*%
zL1_A|PjnoXVrOq<WkpVyf2%@LsYHJzUzdD?s@|f(8G59VOLukZIL|1hMQ)VHrysa7
z)%y13)Xn%pgVDf?-4vl5-a~7Oa3-O#=;VBCQLhn&Nq$L56j4Yj9_b>m4P7Uj9RP^@
zR2m9$JKgdvkJ;RJGlP_<QyalA<wk|yUwJ!RomkzDR+9s4*p?YbpCOJ>OjX%oKNciO
zI#8sf!(25=KI^|eyD7fOcGW#YQpTVf^?nrmg+iCaby6CncZ$nehJF;RWW=h9AL0lC
z4IFyx{S{fR%~Kq^`uB_HF5M84Lk|^ev$}uS43?FV6+wC!EzcQ3W<8Pi(1#k0aSYx^
zE02=Ub1nvq6u%E!fgme(8U1sJW)BSGcRr{+t$kEA`c5SHK2z4?nOYe57x}#*Y(d%_
z_k?@a*@_<*>par&%`Jcdf)<&5!R6&ef%EHUF+eEvlO4)Q05t6aS^)fIY15ZP+S|%6
z+Gh_;*dB-LWW1;JKT;Drs$hld86Z5@tn#(XT1JM3G%70X!e5g~=(=-A#?tT!&fUI3
zkLrNVgbjhbS(YYwKujmpFg~33xiEI>j?mvj>)*_xg%cK_4av)uSPw1wUdIq^N|TXb
zoo&>Mx@NhA7nwd#cCE175_%Z#dIqFuOu=~n(RF7x5c?K#-fj0fPh<qhuutc-Qk3mt
z0mc=6?<tAywp-lYgLx@ozg;(ucT9Z!E9~`S*9!7STEo8(G|;Ms-`l3lJHih-rn&?E
zjsm8l!MX9d&GJx?z_)Gfx%CmprSsTms|6w9vnG{+KaS+}q{F-aZqYwnxl5%bZEO4n
zXRqlcj}r<vhZn17uwt{Mh)fwrO}?dF((9LkoXBj0Gp&yReUDGV7^)OZ9M2y_a-T$0
zl;#fQmH73{@S8lX_nWYl4YiAnELF>gO00UHLtL((3JT(EjT8_H0fDu>5H1-iEteeY
z5-K1bz2o3e9zkKNzQx_yd#aLdx}j~gP@UENy|AVfO%DZ<0Hk@Vap!sm<B8*y^Ilg)
zzv3-wI2}tkXhWU%JjtZn{r&C9)xiVFtoH%)<ZMCHn!!1}<?O((pJUSg+kS5S)KMrk
zKgsRSP4c@ydEF;A`N$ZqRm?P)(xInt%XWXy+kW0I<I78|tXH!HOSe?8VxT7&p^(rA
zAnVR2T(N92RLO5Q?4G~8uNjyBkR-{H%I^c6kR$es!F=)vA|-c$iC52}%`Lsq<8yg)
z0*FHAEv?a#>2t8;iM9=*dEDrFHcusfK-YcLr-;nkv`~7dyI8uo%ph5^U-J4_eS2A1
z>ecrA%>$U&vDbjanS=M<eGY*+cz4=fJ0Wby(j}X_^J-<pEJ~suTd2IGv%R{do5G-=
z5_yEiE2b#pFiAW)CS;~hTO|=$5Hg`a;9Q}Xi+k;DT7eFcWl{WxdHX)&;2Dkdo4DUw
zWwFQo62f~GK%XO$EmB0hw(M;DJ4Cz7Esxd$;jGnuaA)9P+;ItO|MuDVaoGK<&S^p^
z(>;B{P|n_Ifc`S46kaZ+<{#6k`C;$74c<$!DdpS!tishi6{A$vxYWx|lxx2!$}G+a
z=YKisDm754Zf##)KChK?^*%_)^m4epX)s+k-n6x~wm(4CXk!kw=idFq@Zc+H19d_M
zpk1)zoDO4)5`QY`n*vcYd>3CjERQ6pP@P#+On45{oIy?5l(|By2pS;rc?1>vPoUr=
zRo@GnQ~mi$>$;ro2g1*uF>#Iux-xIa4raOL0biR9&;}e?+n$EM5iw?O-pfyIXeK25
zHKyqF5arXqC(Dg|Dgh^Wc1ZTXEhI9s&xtK-S*y>h1X9?)r>%Id6>DK8fApEc(veq|
z^VA-O?MP=U$lj81b7zYTiyZhQso>l&8%0jIZ@Ahp*I<~ERg}l|uAe{0uYi5v0+LU#
z|L4ya;g6dsWMH5mTrC~q<XFAqN7@4kt_dwr%Zzn>sQAVQgWnyrqOrfxFIDV73-63!
zC_$)BO<Disoz2w5)rDRj1=91FJY5<8<&dZU>5-H#8W((S1D4lubq!*4cj2Gj=h!Pi
z?$L10a)kA^G`eo8pNFU#yqePz(M`K$5YD0x8|4I6R;_Jotcv8fzG-W_1IEG(_$G9j
z<wiAcf99&;8j3#mMe^rzWq(gAG@1|$Q`L=o9emnSHH@?k*8+`Em@ebSCYd*$HkHhV
zaO!26Y+vL>`L^>`Wv_J3KM?jsKik8ZhDL_*UDb1R>LC(3o+z7wQ7+e$XMB-TrA_l`
z&S#T{Kh~vup+z4We9L8=wj8??0~p(nAyy^~;QY&_d&<?gG9di%wG(+4Ny4)?%0n}-
zy1c++5a>)CK}LV-v*(Q1p1TMX_IE}j1}?U0TPwEG(1Lh-PG=JvN#N!1VXODq>5G#V
zX>#{^bZC;Q>tQ^ggiho6ra>;a<Ha~Irg9~fEbo<Yz$m#dzZPyl82Q5D{89|a#u&Q=
zc*xO$!gkbAsLy4UDJNC_D^FS_p^rqxTFz1XNMDROMBQ@40)skt=l5A8yuTC)-m8Db
z3KP43&MAeQgPs0N?1DkBuf~zhm=je$*gUiLl#scPlf0LY!WuEPX%?~9cLBsEiP%A#
zM<*@%QvJLL)ADVO)~#g)ov11(d8SiDwmn&UcKx;p4YudTbQAVPnMF#9F~z9{ORxr0
zRQ{6%aF%4Y<lOA}4R=a5Ie8l!NuRd({d*lz__)Mbw0<4BB1OfgserAaSR<n6r@{V8
zr=Vwi3r9SksLH2R+ir4~xX=%GgFoE0eSq`*r3JEL@(lBC=bC8LL^w9b>VB*&u$p6W
zjE4XIA>il!U!PZo*uz4gG40?8u8x?z_`-)%N(wnnwly(z)Tk3=D?u-X>~sz|&12|#
zcFZ};zf7vQ{wM6Bqs8={Q`7bAz6+t-B!?hR>+ZAlST5AzNZ#HWiNwmn!4&68nnQa}
za(10V=C0J2894v^0IDm@C~k8#_R)UBxupBJA@|JtpZ4y)mocruzNHdCcoD=hmYSNY
zGu;=yQpV2DqX8S$#zF-G-IJ%@hhfkaqn3I2x9&#bZ9RywaKqr|!Dw-%(J4ayn<V6N
zBsjAn#(@>NG%qc^Lkp{XPj!o0R^W-zF`Ii1go}3?<EcO3%$a66s;(bYMuxQAto-Fv
zTR~94na$N{^p@H*Q8z%RJx$oY6!jLRSZ|pPkLrI7(JfI@;dQ?HNSaE=X_k;yW=$AU
zThLn-Kv0q3k&M+Q{hAau{dLlRLUU(e{`_(eQh=zET2Ccyyxv2WafQFS7B711bJRm=
zY&ohOyDduXU<dNvuW~nljo>*Hm$+&a>N!8ir+X<@Pz}IaktCaKeV3yi$Byw<wCi~X
zGrByciu9V_=qPb-l|O7w2EL&94BodjT0)=ZTn6Cn*<;KN1_x0zUhEd8qW2bUn=yMn
z<Ou8F62UCs&D%#D@5gRf0tNA9&F4;K-m}}ATm9gDarbjW_bxZI9B>eCHXNBvPcG`c
z=4hs&G=){#p2FonB!7fYsHu&*>}3tG^-Tm8RcG23LHW6Usq4}(R(P*$6pMm>2t`S5
zJhL@O#F;sSRJJCUGE%%1faPU<o;&$<g%Zk=!I6EABWv79elJ;c?R#Akb3(KEDOa6I
zN6Kd4^X=W+SR9>aScL}v>&mp9!^yRg-tp(|)H0yKV~znX;g67DUa%g%WgfyY1>(tw
zFJafXYJQ%q>ibObc@<90th;X^_#)$WhbLmC#&VFN&TUrg{AJO~#m>4oclEr-@$0>+
zL?6D`dFq*<s<WuowUyoGv$<);gY&Z7AblID8dL|f!7}_L%VyRrL418U%SUNIZ6Dk#
zVRF4I-Rcvd<BML9L3zdYBG&cg4Cd2S%GxD&t2rE5b5*f<ipan=V@crM5sfA58U$))
zeb(OBJIlM@`K+2N)1Jstymqak4RjBnD4Mdf0rj2FSD*l%CGa*&2|A6tQ%u;GUO5<s
zIXonyMa4pb4QrcfRL>}P+1U1q1!A`l<3{djkV{leny@Ln!!(BM)yZNIvlH-QwBMQL
z>_i&^=)|$ay2LSPBy5>i@!T<?c$*aA4~vIfynWValIPkHc)AB@5TdfYUi1JeK*ef6
z`3cN8WS1q<8-l#I_2=71_F|MJ%^+I#g5ce6-fJ1NF(elK;e}1LDu&*(HCl3$_r^q+
z;1?$D`x4*D+~2z(nyY}`k@*Pr&Zm*0$8MHEuSN=*q<L;rrddr!TI6wIK`q9AtS0*Q
zrDl6RcFe|W+H<u-G@pgiM=5dyUVY!Ko$kL>DrTUakgx^<1MIrf+*~joD^f$YA>TQX
zKx-mTt><Tzls?X5KArmCjAwi9!=tdP80DGQ!dK0|N|}*wKxZPrNn0h?L2MJ~jS1n*
zEghxa>*X%ZuYqolm$=u>!|8|XVdt=qkT>vm!Q2QQdc5gz+Tzv_3bOIrZZ(nNk;vpT
z%DxsZLxoPOII1uxb5`UU&W+^ee^5dxj`Y(VhHJL&`vS99HBpVOX9$cRxTXG}S$I(c
zb1ZQ`OMCe92MW`?<x-oz{~0m>e@n^w*pSi`P{bDWmM7eo&-v{}`gmHR1z0xvH7}Nz
zmlJLp*d<Z12=p)1v^Ivf*3)sTAZ&K$aPnKzQg6`=z^t#Uh`#&$MF3oQ=fX;vrRj1_
zf5Yf&&uv|d@!3ijXJdoDE%ntE&hT+RvJJJ5DSe6@EsK9~-E!W{A5Z38blu6x7kN|H
z_~(4Jpf<&d8-8^<T1ik*@`F@th2{KY)}3^$uk||Z`lJithR1ZHbsnB4AyJLGxI)~^
zD+{pFlL@91sEP8g>fsfAS269>PxEzvAAYHP&QV16WzHUxAx4?Sv1{ZxI$jdL&6>Ns
z_P*KmtMtxL&d*Qw2@>-$Dypv_!Kfr)W!q7k4tFP8q}kyQW_|7HKI!6zKY}%$ZA%B}
za5XG_jW^z)Bqo)*d0eMlv~}QDq}4Di<<Q9c>sg%ajLv%p8^q7*H=wbBP10MkS{LWP
z>$J6lVM~;VjYzSrX2*Sd`1btldFwT5V((<>SJi;RJ#@RkO(wAwr3VAcM=h(T&QBbx
zx~Wae>Ypxsk1IGB5MTf00juL{9)-<N6ixH)m$Q*n6%G-8$^+Usr-VFAO?*|$dpoBm
zgm$8Ac=6FTP~;57OX%tu>|4v%-F`4;LGtG7(Ob03=vWcz`a(%r{XL^|?L>Q;*H%GN
zLYr3(axJCE42;Rt2$<*~k(%MvDQ6)f9JlUupVJ;w!Ky};YJ+G<1!i8}PUS-@;!f!F
z!K`p~ro1y`WpF3Bz}6Pc{Sgs0F{ZnnjonO6+heq`DTf@?f5F&4NLJ)y#o(l!?b*zN
zC2DHaZg(n(b5D~=HbV}${u`<OoWuX~Cj;~c%T6By>%b@bzc?11<{C^%%!@TZL55kg
zH(E5hXs7)SK5H0&Zo#jmT8U9U)H3t4oGr~atNiZ#UV|87)Lw090^krX0IzMF<9g2q
zx+WwwJnXdyZ*+fkPEXJ1numbv-P^}B+}LQ>Gh;3|bC#zd!KY?LlpkVoc;^TB+4W&H
zP142tb-?ni?;!QozE?BI#h7ln4PG6Qvr8!RvFvV0aQRXiNk?aMGh8ce%ROToF6E@H
zD{Xr}sh`?ZxZ(1+&XF_K!G~c|j#f8dV)bXtb{j+Mdh@=cs@D?2U(#l*)KQrRVJcO&
zHN5BZ{4~lZV8X2AQ$eeb$OLg&nMc>p*)Zq{tBUT^lgqt5@4ZL*=E0e+_i6g;%E-R_
z+Mo>m$<>KHh8ej|wn()b_oh0OiIUt=F^pk{1U`3^ADPJAm)OcD>gWnftS8<UUTE=t
z$46N7K0xQ{oglUG#~C7RKytlu&@A7~Z-i*&=h3a~l(^c+N}hZS40P$aknKlj)B6sz
zMi=BN-B*eHm)v#p%21jeh}QdyY7G@vPCdDa%j4q8WJV~uS9@jvel>g`hEZ*l-WhEf
zs)F28VO~#lR%uE^!(HbZn5%zIdN{}&i|e_81}C`2uY{aryt}y3Q_UA${E@Q=@4be-
zbnm^$IVQA|qFFBO?nEx2m^4$j@IH)reh@G#dtblumdfZzy*kiiWIWmm%V{JwgoKrd
zer*i-8%eeavM&_1NA^#(M^vMwLNQH-HkeWLr>DfpRy}?A4?(q}0ug^7qyNL7No#*y
z@WqEEGH@DCJvHn?2zJd)&O`f}MkibKCvm-B^PTaSw<t{!bftyYT66o79{qUBE+TwF
zh&{odg&llGPU;4ij;QaaT0MiDwO2TWI~A)5`i)&-DxvhgKB&_@%*`YM_gcHP@f+&6
z^&&LsH0pib>=>i>tGGAY@`fj>h+qn#WrZyN;*z@b{Yc5RX1f_KlB?yh9OV+}9nM`y
zOgSW<%)13xsd%2opQ(5LJ~HctBsNzlXPZhgm6XvIlZp&yJ>JYBecFOu6_1uJd#6jz
zy0jp|z|;q%8QRzB(H8}DSVPv*QLkO*#*PU9tjTLg!#^EV7Xb;D009$D)*=9qULJ`U
zFt5#B@9dIz^x53)xZJ8s^gTWLb+i=w-iV5;Q%~A<^oe~s$7{WSH<8!q`k_CMu)%-<
zf*4`x5hGJtu1+T4Sf4ykWxA@}BB)?exN3^pKKj|ZR*Kvclm4{<Xc*Hl_CRm_R~Q0z
z=7`4-ZF)foeNnGtCAyr=^*hw9RkciF;lo5%MeW#Ydf1YayS!Mz2y|Y1Ek<eBDC?BN
z8MCu4<qkcI_ebG&4lbbrg_{Q@_C*JBMq!JH)&=<Kd@I+^&s5&EdJSIugyk$|R6c}6
zQalOG<N_3aAS2+gO_;r_oi=F9U37{IR|>#Xdd+Fbg-?Vtp;9-XTF)oWZ#$ch4S^>G
zEl+k2<2I$KhQYetr#-+%xOBXzC$ar&qVzfwsKBcxKE35kTR7>w14oV{_Ezm0Hy^mq
zH=k!;J)vJN58EmWuOz5CnXw#JzpR07QTEAq7gu_45Bg-G4*gXlPa7SV@90~dkMnOw
z{|AG%xv)O&kes#XXK)md|1M2YJnk^Td{E-KV{)BUD>RHBG$zJ^trW~iX8D@!e<250
z%P+~2O7SZs%E+c0*#RmC7F!m5;aPOk=(O5<k(q2C5);Jine+wOmEbrHT<R7*iCPhH
zI3+HuDI9{$+iCXhgfu+C*T?PJjLo}e)A}JcJq|M&-wbVj|N5N#m6cP{?qalTmKMDV
zeY$Bf0PnAw*@j}ol&6%28Z-ST!URx5_-*i#Kk#&@>&R=$N_pm@_+i5sCzjFaseK?>
zCVaB9nzs1@)1bXm#|-*@)xm7E+j7|FD?EL^Zv0@!>AgOvRwx_5R@-pZP<bHUu)lBq
zJB8^yf<4#ht(0r450InFl-^~3EoMqOO3N=g*~e7ZSu^IiTQeTmTTKreONHj09*2ZX
z+aA}ynLS0$U#BClOOYE)g23>n{uzD+yzQ&K)QAKSZ(z#&Gm+mNf!bML>dk_itGbR|
z@SG2|dKDml7CNDCTG8Bl`vbt?JFRE_Qx!PTT`~_<kUJ}pB0Nez-o}*qqUiU6v@ySz
zf+;>XcjFSeIpQ(<MC)I6U(W_f9WDNL?WEvN<k3wvxyWMHb%jnNqenKqYiO$bo=xBD
z(5~NypCk7G4PoT8C^RRB+LZSaG>mAoF^D|n>U<gLW4cVCyp}E@8FYVURPyUhq3ydd
zpzB#mh2fl$8MdS59tvTIyx*CXMZ530?>$SR>ZSge$!o<#*!^co`?fyZHw<|}NxSaF
zX`c6X4p3!{HZL>o2jg9EjWIVLm?dXVl&smUMv5FU&o1v6B}qm~^mBGjnLA<x+U&i%
zr+4)t&_CMFPsg`75)GEL%4!L04f1oV%%g&APWQa`oiL{wNUce{;XmNkdzBk{Klcc~
zwVNrnkW5($j2!+$5&~@8$uY*ja}}~jhrGiHCwrJ){^g;W2G+1<K|-S$Wc#I0dt__W
z#($6J4MwbMzIynqnceKv=-M#G({NoXe}z!#2vzI8_+xlY5kM4Q)?2J0|0~jkvHwB3
z77^EoJ5dy2F?cba^arPu(IkqH;CI!kZH+%;<e1B|Cp@(d9fBAUaf*VljY0XD&Ac?V
z<oY$#4!U}F7KFzb{4)c%u`3Yr&=@OaB8n2rZ;>bdl=I9O@y7i{?y@<L<vu%GmrjXy
z<9YQZ>t2$Rz^Pr=sOmFAvD#*$2b|h-m&wPQ{xz>oA&B1=_)&{(%)`kNHe)>QQw4cC
zB#BbV3>K-53El_a@P_S%7qh3rNV5}DE9>8Yo?#XMEL%2XrP%AAIOeHuZ<tR8#86hU
zzwutBMEnC|PkVeW%`BAL!Al1nPk|#I-Z^`P%-I7?(?S)U^BCP+09Hw6!+AZ;xBTtz
zsJB<Z0j(FWLSgmOW#%H?780cR=B(c*erX=Fr{#{heU6OS7OvmLtl-;?=ZSL|6iF61
z9%gc!wfP!0wE}ztyg#&qb3t8nl2ZlYzSj_tUgonpue-F=l6;1zUE);7-`WS?gZWLr
z`}XM-_NsP^Q}XqusxRFYUZDJ2N^7$~(vr&T=K~ITJRPLh{!=H{p9&_eY@t2w2;gpO
zp5hFGn)H;s($56%H-&*&>ss*M8@kV#_Z*D*t{b}5hW1XL@8B|DMe94Rr}enD;h-hn
zooB<)Hv<BrA-cO3lGnQD)AKiXsxs2JI<K(y!D~9_oT?L&O!Rvn-RGB?>V0#j-H^Mp
zXVdTXJ?yXhF9|AI`m~3Qsy);e^-#0>@cq3yu9=q19k*xWc5d@2qGp|!Hm-w;ocf<a
z%UBq8?OUXG2D=&F3(ZmdrU$rGl<!Y{QWpTk<RP9hps&EQdoqr4+BT;s)9D#^{l)mr
z`_S?%vKW9;(;OamtmGTpAJwiPgzWO*`vziUf@Yd)MoQ@9{sG1m*a^3`i;C@M%I6Bd
z>8-j#{9jLOK<4iPAjaNuRp)<0(8kUjf0jF^0Vv^yjW0X_b^yZDU4m+Q4s#~=Ph0az
zD7gYKcUE5VXfS#rUd7-9|E*-nBL+2e3ix!ymipJW@0q~)=udQnc;U;&g&x9LWbu(H
z(yXsh$gY87W_PZTJ*A9nyE~WiLjf86CC;17$*m&I;Me_}$xt=v@fUc^8|f|A!%Jk^
zdaOH>7U|T}5q}8ZlHRoh=i0j+@WY?bMt;~PbokQL<O(2v-;HSRMzr@>0w?<y9*`To
zdpmvsL4{VI`{mKQXTF1r0_Prq-p5}spxB3oH7yZmkI~t&G`j5wj=b8){}R48HO|EV
z6Vo4KxaT%)w>{^2fh<;c)Vxmxg<Nf_LYM3sFV`mQLHKo$_-84?$g-f8-Dq3s9ZyNn
zGx|SfiW08F?OA8UacUvi(pk;f@O~m3O}Lj!Zy!3lQ?brOd_O%^@gO3NQfp>mMlylS
zyA7)>MBfK@&UO_trcArz#9K!8b0X%}&PY`{isw96xcLb?Y^ds$u-z2d#7*vN^&)0r
zF|n<Fk>&7LriH4Zl8YCVJkYUjLpU&!34A-p4a?CRyB`r!Xw0mZqJuc|TJ95mH@6G|
zJ%f6VJBXtXryDzXKuKJ+R?P3p_|YSIGrYo+HG^VD_!Y?n6)sODHh#;@2&A8#)OTt3
zOSm4!Oq9aEU43~t*L(h@3Z~ZH>Dm8aG4Xwu$_Rxm@7G$(VWZ45IB7_?NorbML&<k1
zg;x(iqLo>0(pk{>*Vo2Ectmd^T(HT{O}+S#TpZ&47Pi<)!AlNY)*Y_b*H#M8?IQ?l
zOORi`yhL4x*61!YwPr=@onr|M?Yqyd`>7v1W_Ej%AkTI!?`^B^H$SddD@wSmk2*BG
zLNBe9KP2R2+Ii4B(I2YqWlE}^44z7VyLQ9;<~#Jc^Ss4<M5?OZi4smDD8qlkF5fEr
z|49@7hdyqre(-0t!vZEYzC9SI(x8^x#d42}rbB6hNuP%)N#2&)On*&=TIoU%^qAXw
z4b#uil*qo~d$y0M6Q0{>xmo?Wlh=wGuyvC}pV_0Q;1noa$L`~POf+&m-P;s78TNWl
zcVKFm@nCAa{;=Zk*BhwGp)VYkb=~_ev0>J2dX({Etj_;f?GHM4J;G@PfC@02+m2ef
zbexeegq;G0U&C_*=8!oD<<M%ph<(22-YigmjPcn9&%4cE5A1iNmnaoQ95p7xC{-mv
zD!&QwE1=c>6IvOXp|86=`h=taN<_P+G<M|Fg!i~MJ+Xky`&*FY&YoTcYt>Fk?aUBw
zZEpett${H$c)u}hb&z2?%6n#crU-+EoE;w^-^EaEZp2di`s}LC)U_Tn)|vOwrTA%a
z<e7`*L}+1mPfX-rPXm(&@7+^z;Wb|^3HOWblkfU=ZrVoh0DVskD)8sC+W1@Q!2Oj9
z?667q);5{>1kK=PR3vyNfVttZu!gDRx#xf*zi$^5`M#LI9({0lv!yLu|8r;Rm%st+
zcE@;A<LwS+q`mL;^fP!#ME+foadff8{^r~bseNPzP?NL89qZ<u9jjD!7!O3OSXtOl
z+tnE={DK{|b0)eOHQE-;YP2kA&7F6zz$oUJcfJrSPX@K1-aBSix_fjG3)d_2Hw#W#
zl)j>X>j{hjPB`RM?{|Cn@t0X9@0~%q<R4o?MYF=CSAj@0r<9|WZ#RSUE1SJ+{<4?d
z-)GPXC%|CU8v-p#F!t_Rg;q&D*6AtF0A8P2C292XnMfXk1rn*91CJfymP_JuzkS%e
zt#2B8(7Y!?p-Zj2#5@1Sno+tP693wpG)`wJv`P@C2487x8hzD`<x`&bsnW=_tF&NI
zvRh|3rGxIY1IA=OmkVX%Fur3VtoB_6>z%HD%2n#pabZJ>z)iv<=hGL2=agTvcHlCt
znOFYK6sp@?_=Re|3DkSgdnF<_K9ph$A(T6%qjv%a9y#BelX@h7xURh&5ns1_&HC+R
zg*dpX<zZ2W=sfiJ+3smIYLz6O>z!S{8R<*VkZg#p6RWvf!QBxKU~@HQkEs4{SIKi6
zy?+?*XHB1cuvhK0MBR!?YF)T_b!|5H6C34+L&}9HM2y~tz<q1a=S<dum|&f-g%MIs
z$#4BD#}mhMT+^H-KvsO)?m;$Z08Z=toJ$peh^1=#ZZ94>a^jMsD&5xc#*tFHR(sKY
zByW?zU1Qh55ZhN2$R&+t-xnSprIl9p#m_!;5>>}1J@M{ms54G9oN-II*_bTxS-^7d
z-mPnZ6x~b>Q<57vcM-B#=(vsr5Yp7|*3HjFOskGaog8qvuQU2OoX@#K>peE+!F><z
zUHcQC#djX>*7<&#HtFWngZ%ciYeos~0%?j<O1B1}YQ?OBlgm}Jp8^O?1OHETR~`;^
z+wYNRlq?gHNV1beC~H{?StC0Q6S5N~WzW7>c0;yoSu%D8S(7~}#xk}ZOBq|1$$svs
z_kEt{Jje4o=eo{0*EueK%r(RPyMN#NyL>*M?|uIUKfdpS-i;i=zTP)(y#m$E?hJ~q
zl#>}~V<n_9#!2ZC$4S{rEVSbI(!%y)_25Or`cbLx#cyv0&M(J$Kf*YXSN2Cr1Q_p~
z%Qr$>f8IBE<|8z{*XHVzqRC`dWf9rsa-9B0xx>;-S7^~^@Vu;kEdCZ+$Fu!ojNxdk
z_0jCYnI2c~t=idYq(gNp)((QJyOx9#J`S6yRo!Oi?L1G4i?c8DT&24|`4ThGIE)&3
zy?HXkYb|Qw0aEEx{vFvb9>6yp=vdua?K8p`e1$F+6>n$rv`vaD4naNrN&?dd><2ox
zN8dWw){0$ojIXp>3YbC)7NbAflbB_g5wY)l%<Rbaq*mtd+YMO%PEKv%j2+ZjJw5tr
z<6Nb=GLeE&GGiJotCktTosAOd)bENeKnHuqEjP`Y@P=lYQmA!h(hh<GlN@I7JI482
z6)^2ZgNtggDsKz@x%-?{{Fz+cA<U-9;j_J^mQiShF!hI-!nfq8$G01)Ml1JrM`E`P
zB>R@1J8+)Au<pasMu~lX`m@domc--JcH~2EGbM+;AI+iY(V#*KKJtFu5gcC>5{2a6
zG}5Mc7a3E%Iw&`mJ$^k_UY4`f{*~zI59XmuJ5N_dcgbFx6GQcknPCn7oiP~Wd`etQ
zaR24Y5wPqG#F0qXJDN1eju0LZd=?$dYROl~y?)AOEOHBFa`R_UE10LWL}KqOx{rQ%
zYUkN(g+6!Rc9<*IziELCeJRQC(!6axsn9c`#DbS4XP+?G+8o1+%~LnE*=LB-zcsn`
z#K+HH#YktUOiY)zp@LS>?tBVw(|6Tiua-FV(>b29Ni!6^FRiUfq-VvwUQQoL_&~8O
zp78lH1d*Xy-!}91?aTshgh;sy+n#;TJ2qDMI09;J>!nb3TLD%DRsm6kzt#5-&Ft@c
zuqS?3VI||uqfqd22Fa>7>3cboo|W9D@Idzk8>-^h0lk!C0O8EhUleaGG(^Ysd$!Mp
z<TwO0ethr-fC+lFOSmUMBkpx{K&2Ya{`jqx0X@FIr_&X}XF8GBkzI!pYT!K9P^>z%
z9|<{2I%t#_@f_pVe?OZ&U9#rkchL}W1&$|LqkaBZb@QT~qw4O43konhuG5RrS&(3#
zE7Kk~?Uaa_W>Gf0@(E<_tQ}s$jNn#rulRl1{kCM$(kpRzW8nFBzLv*w+irvXK%5I4
z71({zVNxd<WRbBMEAa-0FV(EEO|&N&fAqB7@CbK*Uly1bLx<6Mqq84_f$BKYy2U7N
z)gcZcLT3kVv%pntPTG8;!auHkjP#0dF(VGbds<76;jftDwG#QfW!gv5&vlw>%s6-Y
zAk2|J^EqW!+|jOpyIK7Hs~Ck=3Cq{E!`pAV8Y;Cx@~{?vllt-wjUrS-);1~7B<%0k
z;~!w>Iwhesju`kc;ACPJlR5|0D17)rYCPQTHfBX;T8-qMWw-P=nfKm`C8#m6puJYK
zXcxpnn_9nTDdT*v4mWOw7Q2)riRpgB>R>2eb>S-RjJP*)b1^q_?8{E?*fxCHkE*7$
z_i7kdU&xe%j3*dHc}O>jR)T^WU00$~1jQ}J=vn)#4??(^`W`k0^u9B#yvr1Zw2zr1
zFNIma8?#kL3ulZ@e)Jb}1`f>d=}ZQbv8TDfJ5zO~i$tiqE;T3hxOa=gl-U?8DJoRe
zvj)9*oNw*vJKWJMS$(3<721}U+rE`KhvK_3ir332lz|(%w-!UnbFz<n6}x9(NxNFK
z9QQXz%^;YFPh^$NflHDvYgOMu9!&0;)+>(k5BAW(^G+ES9#PQ<5)Lm$>oC2a)s7vg
zABTSWq*-72kXU!9?3VJ<o>%HZ^GLI3;PC*dCPGqF_jijAy<SNgLp^fwS_Jf;&5Ylr
zh`+o@sQ6hGfBdMO^WD6^AlYk`m?|GJ;D_})>6JfH?B$09d;jf&m|rSh0$;aj@Ms|M
zoJ*ACjw5esJIh4i$^hltYtt@{pQ_zskt`KZSXp@d0{%{AvzkN=>N!m%tdZn4{i+p9
z-%1{Vxl~Wn3%hAVe7xY$KXyyCDT=ePsBqviyESH+S{k9Oe+j~jL2WpA^7}CY*FxIN
z$~$i$<<~M)T{x7lC%-NM*<47suoD#z6<X2$cyhiMOI3;&JJLm2=!dKj<9D3K^Evc8
z$SS8@Z6sLYw$IfiHGQ&7l%aB#-o_DhqQTRbn_<vkI|16GXiZs;bZWFr(h-v23T1Xr
zj6;(t1@0wJr0r8`=?bgqS;l#Jh=4=CbXUid5E^ud&_Imo&&bH<+o?MiP88a)ogxgX
z!>-0m&$!G}<E_o3idsFDcaiB3@btGcIHf*L-`OKQBhY(9eG?G$qYk`&eU_OnpH%cx
zr92m%??a$?UYyO)A?%p?*T1<x1)nzXU0aVCFTCS;4AbBBDZx`c;1g?618lD?rR2V5
zdMEhi6>N||)d#HmQeA*^D;dlBLo#&s3&(-!Wdo}3D|T+`CLS+<E~-=3vX$k%tBVgy
z-4{Z%h4kbrZp4!JbeDTdlb}v)e1i=nllae6gwWGF6|T;lcx&EaB$sDST&i`qL-uME
zmYhS<2>z&0R4^5$I^`lwe9@slN{<5JVHSLkD3Ti0DYDgWzwtPbLuV^Av|Up%O-SrK
zO@EC%L_M!X#W`B(Q-PIVB5Cha)vNv?#;>R63-Dw`A~(JkL=V1y5<-N|8Xd3ljU5&h
z6|<EUO+P`(<txlXNQ2bYZRUF9i*PJ&=VG&$(>^Se7r8MrTus71Zkb1PoBuI#<7UU6
zVD7JcXZp6rDZ$C-GLQ0_iivsuOYMi|y68<WWF7YMqrLCFBWp+_RmJORrL-%KMZt5g
z*fionn|c1l9hpNG0xZ)5nuH1n3T{}Hcma;RM=qJ#D%V&M_$=3y+0Eyku+ta)-m(6=
zuMrL{rPBiT5BU~rMvOONJ4Zw5_@2IfHV&6cs5qxgwAt1UGOm8%xxP8VZmhL_p=Moh
zLIcpJouKW_UhkJyOT(;Z&%*GkT9HGKgvPA-8tLhllJkK32MImedlHPZw@`Wf8%Yl2
z5x8*^?)uf^8FhuUL@5Lb5>4UL82zfCRK(MYB%?5F<4!rMDlfCZh1>BnB;k6Wk`d7)
zt!xixWBhIdAkg1&^*Uu%mo(8!0WDtyd$`s#Cq<ML)wsxL&+LK-B+tJF^Ra#f4X$G7
zcV^V#nRJqdLmT8z1!-wA6(P5o2X7VIVJWd!zK!b^bd&V%HQw0VPQh=cos#SdVvd>a
zd%xGmGBVJBM@L%sG`YFUZLXZnTDqimGOWaL>Su%&xMgu|u*OzrE+|>dP|X|cxAoMZ
zd>?l|X?XEpPhs!hS1~cCq&$&Md0lm%s=||&mr6Q6)`M*RoTNfLO_V})?sw6J1(%!@
z#KYCuUgvyWnVC2N;~7!=wLIB6Nw<bDbx_9iv;zD5jkQ1%wG9ov=A%)n;z@*Ig-4<x
z+QM$#c}DU>t?CK8m{3E~NURDYHigzidIu!!m%I>WTO&}Q^9<xg@M7y5iW}uQ$F08=
zC{1iKw~wgKF5cLGH#y?-tQhVbw2T_z4q;*6T4TkvI};1CHQ48@U0f6kL9TIQW-7`u
z3Mh|3^pcm-X>S`j#RaA<476{34?QxB`kjAy{R{qOu=Us+##H{RUjO1>&EsNMuih(^
zo=k4(uSrtXuq^UudO+Z90bG8BvXZdx!RO&sKBl)a%jj?=1_rFuoC#xNtFN4~8=kk?
z?que@+cBEl#u6_3Duj0EH~B8y9h%(RK(TgJ%1b>=)9^V~c1&f&AH$ew@8Z$fjy|c_
z#Y%#^Y3;}Na-U4>N5yR2T}10LZ)L==R)3I_KAJ)J3yMnFt?Cb|#Ov#~@s!rcnZxKN
zsKa=ZFvx77imD+8WQLtLO&(ckrOrd#?~lFR`bavtmU-*)Wj{h7+~%72?HTVpyCg2|
z;rN%6et@7LnMBVcHON5eRfEY@jq?XlqYP{MHoA46nS0ZYi0erp3`NGzPe$#b>=tGM
zTWWbZuJnK+i`OB3s!O0pEZqH56ljN}hv0B7pGTyV=WHx2CnI~{o_k&1deF9sHMS}f
zf{qV$XlhtgMnl3wLW!UKxE%#@)eUZxJf2~o^PFTtx9dH_Znz_S-g4i`Fq>4Pr8SY5
zmsp5{kmp)r^;fjb`=y-<_dP{7y>7e6p?pa%Fq;v&V^iIl4-Rb(G%LYsI9s-`2_n*i
zd+SkLnWVL~^w6~ospO=nOH9(=r+q#29)2VC^k-FbVVlh33SBzmqfaRpDoT|*qyTPF
zs9L)Cg88CH6-ZD=J{NmSzZmevD%$bGI!}#n9-Xz@qSWpr;ViBZZ}5S{^Pqt9V0dV9
z;2HFdDhdl^XXjsKu!+V(wX7F!^EG@NJ7T`!(K=YmybiAmCqR>w&<^nsW{~CaRq01Z
zwgUSRGVd{E>Kc%M5lY0pE0rb#LpqTAti(e4Qs&pz1TX{Ciw*<l{iCq*cKlv-57&su
zA&FH5fI=5(`*2)7i#FKgl%Li!>*NaWmp-rR9AK#~B0`+%%q-LUomk~TfG2a;w**p&
zKF)FYDv%Hm8+Jq-GmH28-@NVUNIVKky69WB;Vd@6Q2>=BMz=HP{+7r6Q_K#0*5INR
z%*>RsU=bOKx6pMH2ouBUEgYp<w3*|){b2>Gh-n|L-eH~}jPiKtwxx5LKVpNh%Vctm
zaQof8irb_yf{vQz{bPEJFsT1B>aTQxleSywefvlmL+qTY(=8}MCbqh!X6FgbX=0Td
zlw#}+i68(h?O|(`u40YHII~+>f@!&<f6}xLk_5>IxedyvvjHek${N(kC|<|`TPw=q
zF^K(<2TW)2rHLaPWVEn*v_Blj%0-7P8-(=7vg;y*n2kZEcTex4Yid0ofl-Y?85g9c
zM`ssA6BXO=;?V*@gEg0?B%;I|`rkYsFtSugoAgXgio#2&Vs^D>I>yz%Bj(y3GRAC<
z3Z)qj{ec*qP4Ds?pOi#suJj~=2-xEjUcN|&4k=0Mna|15CjAJEj?7LUJk+JxH2erg
zPcfCLk+isLmboLJ>SG-njoY-aHEinP+&%~KND<lgVA|PiO9fsVov+G*o6&t%X~$6o
z*TmFmd(7s5l7E|LTUpEO7O`2SZd|+TQ;@iCM=XC8CpN!eAW*eDbQM=&4R`8~pxuSh
zciHk|VnWcLlRIxDEnD<}xj!|KbIHtq)75$v$CG!IwIWn)kob7kIfSOtZ&NCb6<_n#
zhA){fzL%L-<yA(QT$-0(xk@LZ?|n)N5de7BeA&9Ct<9U$qUjr-TpFnm>SaiuL^p~>
znN&l5V)XOj2?S<2r7gPhs~GXcQJF4=5ahIhF;5%?D#g_Y^35@j1~F)TWHb5o$6>tt
z(<Jc@ypF&Gn3UpI?D$ftr<*(Gonw0OEyBX>hEOlvp_z*Va0bnh<8-KL`{M|fT}Mib
zinqOP={d8rx0)Q6sPt)~Q2=3B-q;u=)j$adPRCb4<Jm>|zFVq9@=>WM<O98kU111S
zF(jJ0*e2igM93NcsFXVc3bN#g0+lg$bH<-CS5XSIdq|hIFHE#AmYdk=^)GBzF3@J8
z_P#|+NunTio8=L!J<L=u${se+v7`&c3;&q)DN+!a6_<#oY9-7W!{6ES#F`DM;VhE0
zUsJ|f{l5e5Sg6@<v*JAtQSl6NR4aK*o%eOa>hn?(jhQBA%?7n;Kh&HxnZF@jzv{MH
zv3|ii5C-~eeh)S(OF38Ly5;yeCLdZmD*JR{MEjc9id@H%Co5GFZMe(%VTjkt`p0Hb
z+iCtmHUt5623nw$+{2YNZMQ{pyD?Jz#LDpo8a71rO_`x?>E7ZN<$Ic!uTem>XE?PD
z$^|r=v^ulvjvp1KGdnIi3C?-s#l0yVW2zb;%_>zhxiHT`0*a>h7cw2|5zJ^YWXNBL
zI+?WR6~V{ka+%{znX95)^ZC(K+pW8PJinM4MKSxRCL~S|fQN{fT~iH!g)YTZH+i{!
z5&S{~zY{Z;Slf{;mG@gm5n^>$)Ey09+?h@VK3|>m%;&l#$JC?|O`noNngH0oJiw9V
zb*S&MeP9y=)|Co;o(Q*h8KCbjg1qb%dJQv_Q~XqXQnJC}SrrOAadxNJ5fk>TSIbP;
zPUeb;@p~vBk-gTJ*gBphKU27RwQ&)deYSMze(h(Srx$t0u4#ePOa<y+4S4jnFuVgk
z^RyB%+IJMxbReZYaL6Z><stxqA`;j#JI}nW>b)eN2lE+q+IIZ*-?;ghDU4i6I5k{o
z8Ln6PKP#0xs?&6Z(5CuNpzH_%qXsqBDH9d-(|48Kl6x_vf;6p@+MfdFXS~{6X>AQ3
z$%#d5;puEj8%n($HTJw_J*ByiQmvYjn?Jr%;$7BOA+o$%l$lg2I5wu?C3)-Xc35<C
z27j^}0SZa*nS2eAQZ!$D;Qk_UQ%;=YH(5n-ZUU${Wz~K7mYX4JAnBCF!ZS;;UC*7|
zfj*wQ0h3Tx6j`s>ePh&a8QkNnsS+|fQjsy|E1(Gn(rJ=VI491F*Lm8vf9&RvI!T*-
zcKD(i<kC4W06W!V{ZEP(fpnmKF@tlvlZ33~I%odJUu^lV^BSto>4zvQJ5EpKya!J7
zjH_+LDpYN{xowG|#}}*i)o|2-R_v>0akrh7f<6;9ZSmD{IgYrhDSpZuBZblH({$uz
zaP_0+buFRBTFtwWsBDoSk#9lUl4Ag+-&Afm@e_xTbd($`Ut8^H5VaPw{Bcoh=9?e=
zB9~~;TL(wSdIQg<YauzVBFMBJqfP%l!v9gIlbI4o@BXIFj~(kel%mnJM*(Snv>0p8
zRtBu;+PL9=SAzl+MI#D0+?k&Tq4V)WuP(cVAUWbfc_Uq~w;z+o2xvi|&D>%~ZZ70~
zZLTW7h9$0G2$US4R52Z<>t<xiW;a1mPXhuZB>p)-0(FCC8INO%6UyLR%4H(7r;jC^
z|5+283F;nH_!uGCx{#=y%qvlAYPRRWODzgw7|T)BrqB|IIqR_M1gWV1cK5?$H0UfQ
zyK#@B`WsxRLcel&<=s_g+P%4RBZZ;m7&`0j$@g5#Aor~Q2dHecy&67$mIITQo43v&
zU8#SMi4tG;sfGY<F42wq2Vi3n(9=-5Bdja&EMUHV8fGDjTm|tmZi2}9`ii8siFX6N
zdtWM4AZfv2!bh}8?kf`lFodsk3aGB0Q%N2U(^TA>V+MB66m8OPG{94()V^^XwvCLH
z<T6M!@3@=7o}H3#j+2U4V|mU=btSW2Ze`~h6M~XYpNh(QgqP|!zu8Ymo>*AV2?Ufr
zG4L29>RLO&Gc1{AA&%ozmS&)Piu(V7mhCuT!?NOc{il)CyTOH*AX8RF%ecI3&I#wD
zFSGj6M8{5~mWZ=8tCh9mF+2Fd+7wTw>mk(=Lu>PIN*-DesCxICV9;zkAqLEL62HeS
zewbF`d!8Ni<)*U3BYF_Rx7xzEhRc_Y;-oRC;o~f$gCA7m(!QV-AWR!X67bpYj|%R|
ze1AOk)zGx~%5Xj|HzlC|I02u_Tv&i=G&LxIVgfh!Q3Y)UQS*HXPDg4ZXLHe;W>jj?
zi7))WKRCDg@AdT}fwv~4H;J?~nkgZU1U#I`bb8kgt19?3#0o{8LE3SjP|2c8h&ZWg
z`kFREDwp4sSgG^YRnP|5$$;kjtGbqo?eUvP)<w(y^4lla8|vAYCu?o&N_u_FOKMf!
znass&v;i-aP2}?rlRE=?FmSY<j2xG$J{K`;P<!!_@yS`wA)S?!He}`3K}DOQQnrTW
zdiCzM?U%pO;u6<mi8Xlji4G5Y#t%id&Vl1X=0)kBN_?t|U&jPEvY>O_W>vsV@5eI!
zhzrHa>#NSL_iOQzSb?0a+W*1kFyj-`<lX@EeEQi<i^%HdsB4q#{{YFo{~9Fcy&=Nk
zqc5N`iBKbaodvp1VPHObK=wNaaPpYa9PCT+$m@t!Rk4mHvV$dZ#jc|KE(P!ZC7e85
zZN?vKmj6GGlL4a6uN>o2i43$xmA;m6bq|~^3+K}GBS&NGK9iBlY!Hd9H4E_OG`pmr
zp$g|jh^eK#-q~lEifr_<OEz$-$Ts}axqqtM3<Q;1=<!ml`9w7+gVl(=cChdFU&!3E
z^=-_-OnRpWGMP?Secz4+u<5*c-2obR1@!-b#?93+`d=d<z_=0)yC?EnMV#-)F)=cR
zy|^Y$#rTv(@*Bq~T#_=0L431~)cdwadz+8OD!k;osd3h-Eb`GBLq^e$J7><vy>PrH
za+Tw{g)Q=dDb1j`L(j5dc9%$u0llEauU3_(MpLs0fkmxC2H4eRp&!1B?gnSU+PDIL
z9Gw8A%_uV!XOU{DXO{IQH{ommDX%k>_HyCvnB^Gdt}9}R^4&?I2};ZS7=O70OqM}?
z&l86U187W-_~VFz_+!O}9lH@sdU<wm=Vs3P(2nblv{$1E{o|AA2%|vP3F(2t5}Y)S
z0Z)~kOOP&7_!?d$-8!mg257$6osFOyget8uL$UoiqB;CXxRPdu<##~uUcKN$4|n57
za0`*utMT4|9Q|f3OG1(o8yw`UKxiP;00M0oAG396`!o1@7_czXnBs!)&5Ka$mhQ5B
zi>}is%aS+?Mp~h+DDTCN8zgEwX9rELD2`(8e}O;RV5@3=)Dejtxi<bb9${TGQ3;@X
zeqAv8ypt^b<OC@}0_&<58$16e%xqtTF2Ht&^H3!o9~*YM#eg&6{f91n?BDCsQg|8B
zljy=>z0psaI^w6QzLBb=&9MvkI6}@_Mo)Bl!MLm;j}iCyhRfn}vHP-9PN!#~Te-_g
z?Cd$vBajF$0!a9LR`9yWM~M7r*w^Y4`7z5^Q&A8YTWE7$F6CgiXVm-!OvPfL{h9S8
zz5xqg%l(P8o!y>o4-E>IndXxn-yhuHe-LG7GqG)aOT^N&wl00gE%GCtfh$Ns|LO`1
ztQ<n8_9N8&S;uJK2D|WTkn89DsIce2r!NxDR>tMj9%^!xBOp<ykRb~=4m^gb!bAA@
z&PW#Q&@BXkzF_TwOc_r39jvpm6J(U)4}AZLia<EDR4$koeeggh!oh{e0}Y^u-khxf
zxF)(9_iEt$K`^Vh8qfvYOi8ps(7{*w<EV5)1K0+NfaQujKlm>{u>lBSknl<A@U1<x
zgvzKl7kltPCkUrvPc{p1lO1L!Umk*)w5-vm3Jw~o;R-95l2viLLB>HJ|GDRV-GQ)8
zq*8KP_2AiaDuW9_IdWGHrMmr*U}<u&aW;(y{;8ZA7)Y-E2F0N}pkO};_WrRUPjlcR
zt2hwca%}s}=R=$KE(CaCe7&FgV0+G8AVdmHk<p<8*}fz=)8oZ_odYqupetdQ$G624
zHipC6qzUYV*|RSv>HM;H#J34UBBCP$O7b_f|GEOagzd*9;Yo*vpL|*<uzmjfT;snE
z@k=Y_3<4i>1)(i|KQs7uz1)N*aHA3dV(RG!+Qc@FU<ZBseEI|J@aKnSd{75By1-?;
zNq?Y8d}qK&Bgu(3|A@0cyXBu=t2h%ZHpAc(cj=%&7IY!Z*u^lz=Wty-1(+eoGw9TT
z-Jk}S3m|B|R(vsdb6C(c_!HK<>Dcr?75Bef`UxRuq*{3_4~&FAzu8YnoH@+`HW7b*
z_xIOYA%u@V+VdRRfcH%&gnT-N?C62%?w?F@P4-|9`ST4NLQnk&>F&n!0m<KI`FAgn
zlpwzBMGf-;4qRmL&<fy8iMFre{$|R5j4OB*_yF@+n{M`lT!59tl@KW>Io4?o^tC^~
z>3a&yDH}GIb?_RWASR^XMow<hgHy&IapRl!GX>kcJym$nPz^Kc6Z=OPEZ>%)T0L@!
Pz>kuGntYKg?CHM&ExxWq

literal 0
HcmV?d00001

diff --git a/docs/assets/deployment/hf-inference-endpoints-new-endpoint.png b/docs/assets/deployment/hf-inference-endpoints-new-endpoint.png
new file mode 100644
index 0000000000000000000000000000000000000000..2ce2e6ad8d78bbdb695d8539ec545a92a10fd80d
GIT binary patch
literal 52361
zcma&MbzIa<*EkHKqSBx=tTa+fNW+5C4T3Z*-QA6dfKn^njet_p&C=Z{-LQn@F16&o
z>vdnh`+45?{pa_c&+N>eIa6oOIdf*td{I}G!+S>g3<CoLPeES#9R|k3Aq))6=T9D^
zAq%L5P7DlOWm_pJbp<J@m+EfLR<;h77#Q+jl60_jH3vzv4c^f`d?GEWxT``KM=YuM
zg!980{bxn_2cL+|->O#?L_Mo8lKz=r`ZAJ+u*y`2wD(A#6o-v{->kEu^(m&uyiU8|
zs-XA%&3Ibyn6UTuiYUg!;?+A_{2xyxD;U*CNe;#-QxZq$Js<E+U@vq~=$<@sd&R=W
zM%}?Xao^V3@|4ihfAr1w^YMF>e(fjvCJYS5XB)5c48P*Q-(Z|DhiD~ZV`x0{J^k+c
zj>#CWDi&AdiE9$Eb%{#?aq;()Bv3{pIaiMw#>>*vt7=?~*Ufa}Lu3|`G$PTYLJFVE
zp7sP0-fV5FlD-uqGo!M>+9_l|pSP9RwYXK`b5u_lA1Ckmp?m#ISdt@U`=l6^vxi(|
z5|rcNj^Ho*lUDte+;W85S*@BS;#HMM4}j5@D2~t`>%)ebX-*q4AKwc)IGg`3*_S(A
znV8Hy=3By5twA8!0fHx?bA%fn3aZjRP!-c=A$eP@(}?6Rr#`NP`)>@H;<5WK7Bj!9
z#8RYQS~W)x@9pHAS_Xnx&!MlXH-*^(l|?ms_GkO4ad<b0>5AS`e+8<3{-BGs@x<55
zK^Ll`_=Z`~tV6cwvqqm8W|cDI(+izF^KX0Axv4=nSxtzLxhj%0Gh=Cq_Vg4AvizYJ
z7t$Tar+~hXo>7dMNKBfz07IlC$6F1_TsE&vj`*JbA3la^={tY|%BV#J_x$Ta*I*6R
zpYejBLaNySQEmYV0xs1gkTK(ERHWwBmlSKbRDst0n*ST2wT~Db51#2xcUXLV)KhMB
zZgisho8%!<@-gp+Cqid@SPaBBevBuSIL|tA2)}#?aLEh?S3cR2y5A?%9{hqW{QEa%
z;pOG4_tl-6pWWY(4}@Gsf|v$#v7fFzwdg^ed?qNx==+LQT8&yg#X9f~$4Wa1lI7uM
zhys}?;4(fYl=}Qe+F%Leva{{P#pgWqH-+^kEtYFQ1B)0_EfFn|6XC*BZ{{yJmQt<M
zI170}>cK%%K_diCkNAyTgO{j&NLglnp~ApkdNkJE8Mr=D@fCJ)Q$F&{{`18uJ#zi&
z`JzT9E2|}WFT{+`qcA)xd_OmmcUEFs4rae#(%uv*F153B|22@#p*vjPEb1rLobUmo
z7p8sJA50w4Sbh`EISnRSLszwH?WGO}p1^wxsjNKv?VE)6R_~6qHh=A%$^1@XNlz|b
zie4I=+T(SVwW5u}f|Apds?obpce;7Gc|DT6y3=S|S&_aB)FHGQ_IA2I#_$0gA0CP$
zvT(%lJ3!t@MWNfQ8q;pIC`ybS0-Wd70WTuhfe(?}x!udf1koYFKSSU`Sb}ShZY5tn
zc@*~&pE2ai#Eo*}n579@>eKBIdi4j%q5Qej4i608yqLqg2=$wIsQR&HjkxiF(}xz9
zbB_;Xxm2xKIYbZX=w5#c*=1n<%wz@;VsPleek$D+N6z?EL57#`X}+Wt{b?Mr1=G7&
zhc`ds0tZaD7~L>!rH)<_#HnuaBcArEdun0xzb&7LW2J)Sn%Yo{V2(-_=RVqf;PFa7
zTsyyILgb9m?`c~|eF1QS7T3g%oP@8Jnp>c+m%hq^gC@bWrpm1Bd1;Sbl`Jx|()3W5
z?1G4812;2FwBrT!$NtR+0nb2G;EySr?|o>3D52pJJuPtOhm@UPP1H^pPo8W(q4@Ou
z6aCv)rlRYF>$powG@rbs>Eje?nVY-YQl&@e$6j*LIlVlh%YIo;1R(L3XN(68W^buP
zGQt&n3+bmsrnshDr{2HA-ow(1ad_*+j2)LSNbE+}l-QaO5FL<o8-1IWuTWL!^N#-2
z+aZr3-XQ@+1{m+RP(<1fnYtoB&CL?MU%tP1?KsbI&uPzN($mw^(j)Y1({&vy^wSoM
z>rU+meuIA4mo9#H|E>A!#UG{L-X%He(1QDL*#f=ETbsdJv4wZ~{D;pEF%Lr@OLc36
z7SsJoEzro*D0Y3n$&~fBq0oJoWbe`0yKBsAOTQFmnQ6s@(!trxa=koX-P2?%2&t5P
zqIRKn#SC$ImOfc+wtYfvc`a65*aA*%gIx|<EIP=yak->AQpe}|gt~Vp=>F*LpLkSz
zD0+D9*Z%R?x7%;tW!_btE}szpu{hR~s;x}R7ts{ml;fLlWt%$5J;puxv$xwW!ieU=
z*tsz~CtJQ!*BP>c*QR#OaVL4_aQEW+{Q45l1xqy4CiMGbD!egr54>55BYs2fRv+a3
zI+P+m+$)?XoDa8wvYz~coPz2Rl|sx6MHcTLUMtEQ3Tui=0g%;_Z5KD3hbW^=K-dX^
zt(4Mh3i~;vTdcQS6kbGE^lX~5sJtj=v}|-^^x5b|>at*Qdd=wcs7{7phPOegZggF$
zt%f-~gQ+*(G0nDV29XK#XSXkvE)CN@*B&oFFY}#wG{Zl0>0l$!E}-ea=2)>v>^NUP
zUr*&wIhW^E;g#m~!Yk!a!(Y(9>hAGPJ<%s3S_Vc2Hn}A?b?-HyEzw^>VjdPE;i9A>
zGotO(wmiJPTaj@)vO(@{o<pt++aBJD7bO!KVFi?OZC>^6q(VAEV1No0&1=80-SEju
z!viB}E-E9Z7GA^tW-bp$ue(3nN6hY}p8FmRE^40O<DjVW?pQORY0l+KAEf^X+y;T%
z-P=yvX<9u60<kL{Dzl8o`*k5iG4lf3RSju^tNu~mEd;|XzpZQ3S}MN-R~x1-<8qpE
zCY)PV`C>U)qH3Z}r&b5S+ra}U@!15?D1UkkoG19K_%?XI@S_Ph2m%N#NE3;)NPf{A
zP>L}irJv9-a#+X=aAp&!b(C&<Ml?r^Jrk!Xq9vu$roCWY;xZ&%5hA6b67l*y=TDSO
z6#w~Jo^UYA@P)6$kcge)uQ(es4=oRwv*}a~9zOH2US2bn-lOP1vK>GJ$B|R3N-KT4
za7gyoc=fCk5YJ0jOS7BCxJ|2=mPCuMjH-6>%uFnd&T2;#0HL5!WbE_V#Qekzk}?+M
z3>VY<&YsLKax9Z9a26VQrb6bTBjvj;$d(Smf6B*pf4cdRVW)m4PF{{n-A~OePW@MY
z$wyi3ym!9g-hDr!$COt`rbf7UbPTzIl3v8uz1k1-vbcynSjp_k6mQyE`nA+e?5I$`
zb!M?SIL+LkaQIDT>f%+l=8W=Qa@b(~FwxaRU#V>T+ev4QIo6<eVk4J>l>;ble$zi8
zw))eI)A~h=DqyiYy*KKeK)w@-j})VPD%N8eS1zR1Gs*J<2etE~?jt)Ksna}yK2E>I
z{<I$WLP<qlRB!}{O1K7XJ}7wPP9}E$3R#>^A49J<SsrGLBgolB_JypDi?+>YdBeH4
zYa@zDmFXK3IQdDk;jQnlaZ8CyE*0=X^N8boAFKx!4-?cuR+Q*}ud6nJZN4|x`CV>R
z&SiY(HCo6|rf8%nSpKczeVHQ=2WYQrUFCGu41}e@1lexcFUkZBp+0vvcwKlpg4d2^
z%NDiYEvAdn^3~Ar(D{35?GKJ+#iexU`Ck1e$DJTk)VsE26aT@BN>N79g;KL0syZz?
zI>)b<n#vxRYy9#!Qk?g+^zJwc*N<4>^iTCyy!hA_*%o}DwCwF3Ja@m1b%0fe%}G!p
z(Icc~81YM`a=&7{%-LDq&PJ5lud!*e6h1-J&mfwvoWU0Rht|j|+Rvf0YGw0LzrU)y
znn%`%&{d=FyVGUOO;sZan!x6B<+-#|>(H@mk$z$C+t$mgBAje8e6R($47%m@y`r}c
zHc?ptrM2_4FK;;rYFdx%PwK1ZaqO?SHWv5gTw9pmZ{1IEl3ucDp$I;`C{HvvYzS+}
zSsiRT{nK!}3R=zbhqzQC+qdtgu)_)1f*bAv)mjX0CL=Hj3}|~n%{RIy$X=4G1RxDg
z_EdH<h|gF1Zt2Qb(^`EeNum!m34eRN;jS~8qaR!mY<r4W0|y1yc|i7$e3<-y-}ntu
z-3f}WG`Bh)efi^i!gaa4bJ+_xlh6vZ2o}411)r`N*Mxp;PYkTPTR?IiEVivItr))o
z_Z{E7==gxJNx<*er@@$r$1v$|XYg$O6ELSk_&cqhAO!X4z4bu*#$!p&+hWMk$6&z*
zjJXy(4E7Q=HO!Zhk0mp)CFLNrWmwit?e4|ZgzNJr?me@$ORrCyBmXF0hptK)<Z5|h
zN-YLsl81$ga&uQe(8r5NOI-yk6%`CNbp8p(LrhAHN9Y_TI)X5%{+pM@WW~Vx2mSy9
zBf=Kr;lDVl==AUR6&?T9`A>=!AC7^I{zr_CKDiJ65B9^MT&(|-$9#@1!+4`9rJ#UL
zHO<{DEuGwLoIPl^JW*)CQx|zXcMJ?troRzW;T_`%y8T&OEnN>?6=e}~XGbnm3uiM+
zE+0pizwKa%`G}yij+P##FMS*xoZLlx#OeRR5JBhvf`Rle|3UGv7pK=%QGY4r>}L5=
zfQy@pn;!J+<;$01ZWdM|@1$k_t&aXDPH*Gk;UWSAdV70wdGm2OyIBKygoTBH+`K?u
zUQRRyr@OC{hp7*zlRLwI8u>r%NL#v_yV<&U*g8AC{M)XnnX{*dI6eK}j{f`oXPlNk
zw*S+Ull#BZLQfF*w*<(;#SQ##+vuudf1x7kwmy~)deXLzXqut>0PzY6i2Z~A|10^Q
z9{*QO-T$e{!^`{ss`|f*{=Ze<yIZ<RIXj~J^Z@<Odi~q)|1SKuq8RY+)c+SL{zK<~
zplCvao{0hfyJ(<ilHFAi=yjyFl~&V2r)Vzw=Zi%DvZCYP6dk?qLvE@ZFfb%B6r|s1
z`CuLdV&}f-J--yArO|5s9F{Mua?n<gN?vf!S=B?@d;NuT=Arqc7Y5v<k@-_eR?bye
zGbLXhy<n#o_|fw=u6gxpbfxC<U}@gKxC!Q}4RH4^&bk^+<EybA%PfDk%j@^*LF5Pe
z+$XFLA|*A5kWLo?2H=!)5z;#2a%Cd*htES6=yMUJ^-t`AWF-Ij?<Sk8_`(vlB(9k8
zZ#5|yN$_hbyK%dg=ON*c4?~sVtNjaa|3ROzc=$uR(wIi;{d)@XWZM!UR=}>1x^S+W
zBuvtE3j=CXG20Y625rWl^h~XgVpqg3xn&y@%R8;wDBE{4N-3pgjiFYLs^-^I`QfPZ
z@Hr;BQC5lvxB1`YfJ!ru^sCS#_(h1B1m=IJTJ!Hjv>ra_${(3fO(qge_p9__l_=y#
ziqLw9?fOi>J4E$883>Rv?rmc<p7+1cBPyWuQPs^9V7AIX+Qv;jKW=}31B_bFjp6v5
z!&;y}H=o-f&y{F@$mq%J@+HatOM&ok^uW<DseL_12>rwfk^0r|lN()wlD|akNRR$d
z$I7t$+Efw%#eH9UChB<{PD${hVq+8WXq7#fHFy`Pe$|2Kz<Up}7>Jm6@2WKJl1m$d
z&J-&5LqwgB#{Fu2$UJP@AdP^?SjZ3%2Hg$R=m$^s=L|{E1dH7N0SA90wX7YPQu@0b
z|4>BWfnA)2Lr)zDJ-`z7hgw0uU&QOj{<}KD^k0|rN0#X(ZjiAd8+ktRIBYQNzaf2x
z*vrQwz#<wlUsI!-_{x~Vr<bGo1)x_B=BNNGAFAXa<z&mz0(}o)`yMcL{&A?d*$1Ez
zRqdt)W>fi>XYgn->jrF2jLPt|9#V2VV1rUR%-VJTGb;6mPeKx9(#-PyQsqA!)+=pt
zk@=`zWWS&+^@Y9BKhR&q=;f<>s9wYVAFM?F2ZgLS59$eLxNDzlQ$NSnRb~gUqQkCG
ziJEW+DaF3$Q3-+>HVg&9XW(U<dRL`K+nz~ak!%mK-^)HzR|@?JvBd}~H9HOM89!wv
z)&Ec_H;+D-lmf5Ly3Qz4vRh6Prqg|F?uZ7WM`zFbz&48aZD+HIYIWhHPj7_JOV@s>
ztA9d&#26rG_~*kbay^SOIZ{iJAdlN!<SUz7>HWA*@Ne)}I5B=*axk5{jndmvq&`l8
zA0>1M{5KTN4)C=9%8$nQzh5XqwjskLv&M$3cXbF-mbh_)6-qS|ZZ2vz&=9~RN?x#h
zlf`S!xIZG6fCf+zkSgvE3NgbCNPLB6s>a(mfhq<EkGpTD_G#rnt)RVYiPxC#uL==*
zJI+~9s_mOf{lv++ng461S!-Z*=Nvg(asQmuoZ#()W($^gh5laTNfL?Zpk?g0jZ-NT
zK7^A*#s<_f_Sp)X?fUr%@fMa+ammXuq&NV934ju5X#gT18~W0dbLHPZewSj20%}&|
zy46wNgjn%=uqKh(LF(u*0ax#L`@qR7;(e66snnkmTPZ>d76~psi#h*PI#hYxt8=9T
z|9$BmNT4aKt}nbs-L^%iQ1heh3`CtD8G*neoPg(UVrr6thX{rU>Ne3bH7BQsZN>&;
zffX;n6E=#G@B=Me-+YA9Re9=d5klok<tm0~;@qri>y3p*--J0i?=9~yBq3(6+?7-;
z&NlYnQGdWV4W(j3Qx=H~<>Z}Vh~fo{ooal}Mv!f;hexV?{t$(;$_|PoAT$Yb=}t#P
z3{|>_8*1J*0$vAy#`uc@*}!^e*uLfuBY;7!w;*UyIR2fZr!EDxlXulH^jKn4GZF!L
z1neRQ_(8X%6p;p8ORtS#r9-n*!%xxdjPFUE97O#mpk!0M-}Ek~`^WoIZET0PR)O5l
zf~Nh6B_ics-zNeR0Ulx#?J|nA`)KW^z6eLlN7gJ8z_LfDj#KS)AE|XEEhf1yK%;gJ
zRMQIj-m2kSfRKfij|t-WwtEI7PJWpEFGHw5{6m8oG`Urfa&DZb{htkih7PU!V?X>d
z`&Xieh(l^+DB`T~nBqA~h8Tl}62B);1nFEx9g|z-Ip+lWrDxw9m|yJ8^ZE9Jl!9=g
z`*a=#GwN&Eplne@1gya)k}h5yNY}JsRQOErZ9YZddG%X3L5aCrIe>C9*<5NLS|TnI
z<aQCvbw7a|%E+ONyv<)Py;UNYMvT-AXa)RbJ&ypb-Rnf%2JOuTGmfF_^L^_RoyGkh
zr4_u$>HkiKl?lB`=-HB5sz?96`0=s4-59NG)T^Fop*6g2N0Q6GnmnIglGL*Fr#GQC
z<>HjNh;EqtCDZ2|5zl9@2Ck_-d3v57G(mjfy=0obN%euX5mFwBz<b4<3kae(R*juQ
z=_QJ)`8JKuJ0y%0G^EG_C5?3c>F4R!UY&@&&cz<I(+OCYSBxpvy8rP*_Cg1AHEqyr
zn*4Te_SOufv|fo2?}hlDR3g+egV|JqY*D>8YOvxCseXy7&<?2`?6;C@dAC)42)TbG
zXA#vy3?mn?OVpQMd}H8^`e{i)fQ2_)gQ^49f`>G?UV+)bGmpU4GO`|L)yg~TziU4v
zA0}Pu8lL)m9T#pBcT2M)yJbRVGeDL5VYVfk(N{9vXZ8k7(NT(VVA#i$sXT--O!sP#
zhbBdYt0rc6LXKiTN60d5>GBvX*w5J{?1bFd8Z6pb5ub((m)%WLJ<=>W3nSKsKOy=n
z!X3EdDF~@vcz337g$#u^bC~5+&LodgK1(jdVzYYu-K7Lj-!7R$&q2FF*Gap=P{G#3
z(@Hr(HsrgLp=0`MTZeQ3d#CgU8{72Pj;hVPucOmvpFC0@kmKGH&?=bUt+ox0r2K}x
zT!dgYi*TdJA$r5Ko1^#@{H;f>U+Gi(&^U3l8cYHPeS!&tQdWY8X7bA_0^((qH?FD(
zgpt7^u_nAI8*)V4My}9Wp!}62I^+iRzY#XDKyvh&@PzLS>y&Y?0(EVI?)R)~?9SP4
zOtWNb*(&SbGT`Q6+e@RgCcEw4g}>LFYjh=<&bMTruJtsSE@|coF?gXDuMov6rgK$*
zkb|k+4dpCs7>ps5U=c%*1w_L((D|z1uHa4+R~Q(Om_#=GUT1bZPU$-kCorikmo0>{
zJ)Q&H-W34v#XTiy<0x-&Vwr9_^()e=DT=hlgKNd<;Ku0~yQ!vB+j|8U2Hw^J*_$XH
z9z=1Rz3IDrVm+SiNXnsWQf4-yT7r2Oe)cw7wvgK1;s>jdCqK<>Asrr!LX6c!HDV(=
zdZcWs%(gVPXkKLh9p#p+{t!0N*Z7><%wvA7s}e+Y>y~8`+SW)wY>*rh91>(fJ?|^D
zgb8WeYNMu~Q=R&3!|a|OoeI0n*TGhFHFjF9IDKF7#MH6+ulN33PaLXteY#-JUXgpv
zqLOZNeR=F$q?VH%a!6sFX&b&G+yl}PQ{Z5gct3({zDTzpsTl`R!98lMMn`rh%}4x<
zW=eH~jH}GP`L2a1Y`5PW3o4NU1^Q|I%Y-i)H<e4Z%e7WCDwF*JtaL3BLt3AR$A)z$
z8>YrT!x^gX;K;{|bG91gg>o1vYMZQc+iE@f_^SL{2FGAo7rR#M`$?&ijvudh5-lep
zI-AR?>Uc|;!{+U#8*S~UTkjqhxt`XQSyI^5$?<A1KkI{jZzfD^hSuKyRC*^~aHsKj
zvo3M7fEuRr3a);Yi+FQIP$MPexbGv6nddWSs`33+JsGWHy4H3rr|P^ThDVIgQpV2_
zANNO;&URYXCQw7{m4&P=4`;ct@l6mlV}H!U@u;>#r$M3zKf6al2|&_N-$&o`5IUC8
zl?keU9Q$HvNHz~=jr~Uts)s9H43BU2L-_gu!2x9|SdVeJgKrjBcl9jKl%$GkmN<Cl
z+;9<82-?dhJL6gQRsq*(Fmm0%^;E`0OZ89dAK&5n4(LWteKm_N8$Q9M?xSNLrkwsV
zESs3$%=2n$m+oG_yyd&CQ~B`M_I17F(JayaC6DRR?NwCJGPP?D(e~}>ILp3B?zdA0
zAz9ZFWe}_2)wckxw1C39qPwEg4`ZP)HtaG8ul~2WVJ{Mhj$hYuawPt76k*Qc923W&
z>fEj^^DBEH`@vzW10ATEviS?kLXOQ+!v*IM=6rHgm3d$4I)iM_3H0P6&Isym6*X_^
zRka)ZXOP7)%P<E>{o3a1p8JfRK;+(z2Q0F3ij4lNGfFb;Ih-L>&J=W&A?R${r+)8s
zxFB;oDzlX!VJ`QPZ$~e<{<cj`WH36fin(&uI5_LMWy_r0x1vhs^JCP_YQ|2EzpB9C
z+3sX_z{S;$Wkj&bLd4$ZO2v_!Y5GtqIa8hmY#d%Ki>&i$lMuCP;nh)|>Eb|>B=h&L
zHznUZ#=b4%;CnCRM!`0kD`X&Jxu$!c|800g2PdeO)S^^@U%>hv<<LBKsGmxkHN!)*
z*ubr#pzwGH6_rxXOXb{FW4mY@Xs^)+TZGB_(AKaXjxz)7LQ&s>Q7uh-;ZzPc@bRcE
zsu!e(O-OGdy%5z*?#@=lXE$l!08>!0YgDQK<&o7eXTxhb)SjBvxcDV5q-E;V@N7I=
zyg%S(xxtDjX|c^fu%<JdYN1^^Ev(jgzS?p-^m0{@eRmTt*K*l&?};Pr`A&Z21Tv{q
zJFT+)dMM!TeAcRbrd*}LX<22_%W*REEA0*YEely->Gv`S=z8w<WRt*ZGe%GVZFFbW
z1iPJsr654TtM{xZEi=?@^#R#%#>hg>c&h0_gEKfDuJa@aF!?kQ5QLmOXkM()-kyUG
z#N=|%B7Y&55P>Rd!NaU0Kt1G6R>P`5o8Ni$D}hA^zSBM`=dDb@3+VHozH0^va8b)4
zt!ek1?0Pl3c&OH0LN#lRM@p|mZ#A=&`C_fDIe2c?z*)TJuzqpj&7-Iix0VX%y`TFP
zETw;-dB37%#I`t#)L(m5Q1q}i!8hX*#NV;)d}ezX2xSCYN~C$O2F^Ov{nmCOZgZA=
zf<#t*-EO;F@xNfI{3_Nf?@#<{2rYzErEImVI4>-#K0j-M*FD`l&+=Y*rH^ysMv%Q;
zDicNe_?c&0bQ<5KKaSLn=Xya|Em`m~F&&Ci_oU7DJW0?tELP^4t>z@6ce}rLSQ$qo
z+0aruttf^n?Ks%jOuk=I;bhhB6q-Ytk&|5UdRPIo-s6?bL?o->^YyyOvatch^7p5G
zRy5c4zsP?ybd>25si&zZ=V+oV1azTFNP3xPy!Z6X5#MA=w(HQOUf-_jr;U2nh$hI0
z@J=Sla*IUr6kNM3?5OorRkX4hj<|1t-j!1byA^hd^m*q2t1w;qX}o=Qju{|gQ@GSZ
z6AnK+AGaS&)?A(LP)*!TDFM@Tz=8aJu>kwZHUYhi980cTyjFY~k)91ilU}1s-j(>P
zb23hSiv%gSfaOqPnO@c7kDdpDs{tfR4QQ>MI?UBFl1vsQ-{`xW7cqh+ul>vYs_=Cj
z$G84mO<TlRY2S31AHW!)yx)iK9&S1e#xpgML_T*hm}vENhZi<Vym7aG_w1BEr7X~%
zcUvf!r;Exa0mGbF$LG&hr<qo%r^OqLfYU*ioVl2A^!z&!6Ga(LcJ-@4H#RGy@ofhM
zD}MW&HTxApcxEG&LFeoX53foNY@G%kRy(l-##g%OXIyB6^Ox!LvSgFdwa>P<jr{tq
zNleu0aC*y9w-0hk(^Y*Zox){g<LZ&ubkc=0?c>rSyfqSV9PUXSe0Pp@8(BTA)&S(z
zfb!6I8cGc12zt|U_K3O<Y6yA$QL-9uyLeryQ!W4=yPopcUl=`dT70Msp>lJ&6kfFt
z_~&fE)Ysn+QGN$n_dixavzb#1G8<>zU$Cqgnc$a@KZ4#>V>pJqm}K<Q2IQ3FFb{)m
z|7g`5x8JzoQ*G>?eJ_rWU+zsh7Uo}VF%5yMiNPC%&nBdVQv$!=qt!R7{vE}kh2oMI
zJdkK}XGG7$e!rFL6`7*C#HnXTvc-u)^1H-!`(!}^TDhU99F>GWc6^sNVcRWXN~3l+
zNyD;*#5kOTT?O%Z?{FfxTz|P;A$l)#trD0=RW_MN-%2aEk|Kb$PG{egpRH{{iD>E^
z=6}T5&eSe=I809(daVy`9pns!0QqjQNdy#!>AclGk!|+Tv8?$Ea=f{fA^_RMiu_@%
zNE1l5O2ZRe;O5eK=Mi*s*x(^{3VDok7f`91C6ea4*%z0z(7wl^wKBz|G>Q^EMWx+j
z;(hSQKdZ$4($|eIDt0Hib}=%oma)?2pW%DD{cV#ZsO|n5IyxqLoVjhSp&EZH(sVhv
zMc}5TMZdu3KSm7%$$#p-sGBt=`F45NxK$a<KTFUE8WmK=W+}SKaBdzvJ6uf3@sZM9
zGs~I|d)}yUwz!jxFdwHf31}LqBp+Lfif*8aM0VDiy07@|z!O@#T8`TnGu?*1KZ1L!
z>_x$p>KL>V>mqHkl+3H8Zl=ZnJR)hlAvdHM=)23iGtF3@(;Xo9;X;EF^{PPLKu&2u
z3`-9=P&Vy2i!k~9+-nNKqaalZ9J=G5bZ%>Ju-|*2TF(LR62Ga2>dMUb14?iE{Bgnf
z;H_baOmW5I<nE`LJBY$Hwkfjb=@N=L>Op~hqNJ8fyeaV;%Szl$+W7lJf)pt!oIMp=
zKTW+eMg>=u8QJkbAe`)p{OISFUg0Lh`w-CgtepjX5E3;~00DJ1Jf8vInKJ1IRb7ix
zt$>1_D}Oz;UdS(Nz2=*jqcA{QuWeVcf(MkUnL=@~2An){w7#F_UHfS?1GO?QBzb0w
z)p9-qO}@jSsC9B<*FO+8uI}qwP*Cc|#yS>^{2B{1sGaZ@C-_qQ>|+`dX;Es^L8Oe(
zw(5n{QHPqv#Hwsa1i+?(_J~)m6)-OjtpVxI&{Qk!$*R_w^2Jmq0|)1Y%GJ>4*1u>I
zv7pwaI^l9c-<1=qwD*gw%Inh8ADyP8O5x8fQoEkCYgzH%X>b7Aq_1SskGp6~3~pVe
z31^bfR#&K=b(SZ`ij)8LNSb5)qEicQ*mI7IH9Jggu*5yGpzcZF9+Mj<T>x9xF$G6A
z^7>-&xb;~BnmP-#Nj;hO$HAzK1cOHx*nj|&8F293ubQ8CXuani&ifQd+vay@O*ze?
z499$aMU2Zt#xXo=L`G%bo+PY8k&I$&@(|kkDuv9$E6<OP{c??1_1TQsKK4jV0_x&*
zP~y!%P}j4XXG}*xp&>)p-WS_{N-I^D`)^Jc>?`Y@397cD?xBMH)Tb==re{2DS_-8)
z6PG95y8ByB1St*70}XC*V7hJi{U|o7Gt~YEt7zB{j@I_(wH%A6>ZyqY0_f)1@Dn#c
zC{FceH-SVgqK)gsWk2}O_hNc79s;qG4<Y={K1o1OZ!UqRm_QR9$!XK|MO$J(7+8h3
z-IdLEdChz8TS`21EW;t~=VMiax3el&OZ5#a*93ZrVfL5*@Dv-Ag7(=y>9HZq^faOJ
zz0gPXt!sPDoYnkjIJ;ZwzI{p<>yVw9N?+Ch-PoPP^{%;9!?HI{zfK(71ccB#(UsAQ
zm(dfS*gN`+RS>l&-xVXcl)4S|E14bQ=WHmv?GG5pg8(2x8}c>%v@NF-gOs##V=z&#
zU0tt$ga(;3g!!9WAAZjIiac|RfUwAF4pK{d!gk}RX!-^~WaUZl^`j`>Yl8L&)h2Gk
zk%b@z%l9UG`E%S&@6FyUS_US)PpFQb3OL=n*)BkV%#+O2qs#MaRni6c3=V2@=5za#
zOZu)EaXuzlXoOdrSU!eYvqsPlj+F6mmN>O-o4u>;IL5!jwxqZty9b2Vzf>YX<W7VW
z(Zc&B(&cCsoI!UN4N$(z>9OD&FOS!=(_>^{pUxm^lL#8G*J^R`CAJAg8qMt~7j>kX
zpQ782T8=@d{SvgM=>i3>U$vUNiQ1eGpb5TxYIT-6sUbGirV4mDmmq-e+IiQd%VwPr
zBlzWyUXvYD%(1;0sqsZ9-Opb`lfcykH~V4E;DkJK<!V;{^CX?o760Sjttr=vVZ1Gz
zGU5;dj$OZ;rA0Ar+joiE<_oNI9tkQ8esNB8dU9R|^4db*ae!g7c#T}L$G=jF(v7<)
zFM9_QRL0x<`-TR8w};b$@e#v<T!>yH{lw1rZGvDSZfjKb{EqVJK4(xCpONG4kSuBn
zyt~UpgW6*6&L3f5sZP=XdkndeeSI|F^M$00_!@G?lR&%d|BEW9KsJUk3aZH=hCcHM
z%1!o3eqRLRpXYdqykd_au&%FKM_W18NeV(kHv&zYK4bG|<otGt!t3L~6`HrIps=!t
z?}mop!1Fr2V627IK_0bVjG)Q<GTeSSl?9f59j2`mS#>?mp`o9_KL#l58t<8kIQav0
zUs|^y#J$oEl~U%1E_>fB;;p`*a;nuBJZb9OEI3d_jJt{)PW=iEfY-Z=2|owjH*T5{
znigNUEo8CsuiD(5^NurK*bASS2cF!$V%bEF?~+4mAl26;&MNDR)2iaXuhq>=@>mVz
z(X6O=Q&X1^c>75)ZzI;c2q%*5M6m1qPv(N<c2jczKY=)ZQleqZ0B_mQYv=i29`wDx
z1;L{X!4`9PpQi8M7xCQNPkxHkiGSw+<2@b2QA_`0={{m*G*cZkLdq#<wY>xw0scN5
z9lN1X1vfe<|1RS#AI$%=6IRIaO#~0UL1&M!4M}P)3hbw5w>X){iXvVrs)74^u9Ou&
z2%(J%A8Iu@7B!*uhqY72Xx;WRO)@!mbP!-ze=$~Epri6ig{n)d$e_tA>~7=G{fq}<
zo$cF48<7ZKLXpK~Jf*Jd?48MWYF4mFgLAdX8!5=qX7D>wmSV#?zTZ1p%=dzn;g)K;
zRn4%*%c%%@ue*6(&RW)ttT+I$!^gM#(Ki}U{R5^_4l+Q*Tw3f>M;afO?!>a%oSQ#U
zyCgt!4&@E4ftTzL>(#U#c2%`@hGH*z{48tv@G~AZ;5XZ|1A7Uz3%z;yXAxQ$YixE9
z!?^N8#kY4Y0xSj^T1WtQxD~hPp52`$8<c_H;4ZipvWlk1wvrWqBY(H2|H7hHB?L>X
zW(j~~<HNuN*EU}`2;6R&tLMUgQ<T}zUBZoxQ;;-olP7;(ck@S;l?lGY*>2{@Sv&<m
z{;qVy{xtW^_4_~G9o9*obpGrz$!|yLeQ&(f986KIG`?~BMqx@fV*wn4F16m@aZ*_R
zI_rFcO~XMACj|gjH5!nU!yYK{yECYn9KjkDnxmvx+Jx+Q+_s*auA=T|NAknyVqMqB
zN!!ysmt6acV;g%G1ucgx_#y(r#89_579upOF+yt}BvM21^JyA?Jwh=XHFxB>q|@SN
zG1U%7ot}(~opK0kWva?ClBQM|wM>BpdE-E-v7t0fnFW3Oa`%_3sE*cKgpwiNWUJ;b
zR#<lH`Amj~wAoMJ(^0_#rx(;3X0B*Mr|sR|G_3OyXW;~WT1$sW+<(5^<q%wM@h%1$
zI=%(6_8XwMd`#W<c5aj%2pAk%=FaHq8J;epo;Y|jJ9v}L<sZBjZ*)I4HHD+MwKRoV
zhS*I2IDn_SXu+xFaBpDjqQ3HC&Rp$=<CdkSbzx)lP=yUj804|I)6##`MP6<8Rn_z6
zOn4ZvIh4eHptOR%Hri$SLoys?FyX{?P0`v$cGW*D1MCmJn77`d_GhIr@S8=@`4F~y
zoV*{FxZ5KSEl`q*z$cocEM;7^Ofl-MQ4adVk3G}@uR|Yo!hFsx-F)tNX(asmgBTxP
zc`w+?wHU+{SSYLM+E}4n#WJn2$b`oFa2O#ODgz=LYoP?y_n*=QBT&UipM=ZRU}%T(
zOQwd_E#&$=^8V)d)iRQmLf{F$#4W@FkeU;0Y|#e+$R%?@^n;`&99s^(k^v~?mYC%#
zQEDSo|FsCG?GcKLRC4Mo1P(V#%iYD|RWTmC+V7V}?dg6rq+#{GvI%wX`ZzG+UT*oT
z-fl3pMkuO|lv6*lIv$QolB5%Gy-RG+@H_=%KPhuda>c~3|1#hT@s(tZM`Ds}=m%x_
z>zLBy4Dkk|*#JHXZX7aBrf<49Ze7qJkG+Yxk*lCDdyT66!iUZlR>0fdfQxPDsF%@$
zYjsu4nzNL??S62yUVZcTs~|m+n$u$leN-`XA(FSqcDk>~ceCiCT_M5l`r49V`eQ(%
z>1@^0z?Zr2qqb|+B_{OC-zT`?^#i*ZQa!Y$X*;*LDk+R@fB|)_mn$uWOTH2J_x4#`
zn^I&3j&=Nlp%QvB(Zi4cR2R;;Tt6x5c86qCwl*&O3bvi$%nSUQMApaFH_zFC`#Qtv
zntd4hv!vsZL<vhyfZ`8K+iTOfVL7_IpXs2xf<*Ad7JT%q@L9o2Biih8-KwP^+X{2J
z>a{u@G1@&ID4O8}zWbQB-#FEar>7+v50U8sZkt!U7Rv<;ZcCza?$H-+BO({uk*><m
z0Hhr+*oKh1mLkEk6;v`~H+i2!-;T)<7{0xYD?3GYWzIz>eo+SA=4B~UF*N#JEcFM4
z{aO)14!XI#4o05%ztT&m<pPdG1@plj2lkXWp>|OXVt&3|PlK764&?uIBaT+VL3&pD
zb&BJ@?t{TD3u&nI-r)9o=q-Z%fJiD@)?UME_C;fN-S#@x{RbSnd-XwM|3k}cpN+v^
z*mSo(Yk^i#ob|b{e;Sr8!ao!sSOH{9L?<`j1Jxt$LPc)nfcy30o-t}toIv#U>(!Wp
zdTZPPg%N=TNG<QKF9q*z&XqPdZ`q_Zw8{Fpvi=;phMGf!ng0kJwVQnk(>+;(frB3X
z!E~GO$GAG~peJqr7|(T3w2osiy0@=N$gosV@3<)YK;RWnA{dsWvpYTB(u**UIC}6-
z^5@s>THc;~a^R`|ahtama27(C?0&F{adq<I2d0H(#HJxKKHPu(^I%R%Wg`u{JYBdu
zykUisYh(E=077GTkn14-Oj=JOWqP!ebPRII;!wqqgR_|T$x*3mMu#f}Mfpm4ZMgG2
z8+RbJSwz6g!*owN%Wwl@qqWg9#;~xH0;Qbe`{6XcQRa*Z4O-VgLI3(UP#Pue=nkg6
z<|Gcfv2T_AS3{Q98u-ZI-HAMf-ml&FMteS*EjGnbB-b26hCyPR(R?GTyQ!1&XTKYY
z2lqUu!cv-v806BmISs77k+o;7l~Fz`av(D<!X}_Fixs_?>p}E=B{^Q%uz4}ma@4%f
z(H2ecR&cp8_|D!hBxuz{x%;VaJc;wfhXOPI%L9rS!9;A@UgW@K7yi!h8Nc{Z|M4EX
z4_Q2z`I5cR$yfaXb(({E9Wkv`<v@_4d1U&XlXuM@w~_7>6F$e#%FP-HpU0MTjdo3v
zRRP|Q(d3MBm7$s<t6sKh2fMQ<J?rv|!ioIN_`;Lx^?u7DJ@lLI`Jq0m^^Y&M*Ke3p
z$BWhYPUWTQ-_HtcZ#t7D(3i*TRb7#8f9Qq?avC(CFCLO?-==BEnkP#2bCwSLC~Ma6
zc}Nlto9kXV6I{&jq7gNSs%BFhPnM#dsfD^4!Xw!$UpqfR8FGQwX%QP9l#A_tYZ$bo
zvW;uz_L|k<3vmIErc-K;B<`HssI9I}m)OkaC7R#k)+5{*8WaJhK{r&w1;EFsduh=4
zLfpY7&a)mGd5S}OZvnr;Z<1>9*uePT+V8Hf3gws5+ha%F9+BdnbXrL~ko@#1vbs@*
zf`cX_o}UVQ;(3+9*>E=X6m%q6!Ph8Z@}{0(vgb_fO`uoFNmRWJ+-&+|yTt&UdLwmD
zfhF6fR4ihfVni@(W9sX4ihhu*#P8Q-I8oKYwc5VB>k*t_$)_Qe?LZcL)q#{j%_8yv
zs*}x&+A8-ajz@>Hr8<vun$AK2a7=vG<tl|=P43n$6cNCsu3)zX=R_W)U!J|j#qK5~
z!x?&?&harrmPPGeWhMn^N&<-{b}@8kq1+UmO26dJ|4tK=WEgPG5J*9ktf0C31c8gd
zdV)h#w)j)e^R**KnN0uXlGlm2zz&^`3yMnL;B3h{M>mj{_E^tRfi|yQ$L3Hlt?x)n
zpQ=ph`03oh?s7}R)o-heUIefR@AVq)YVqZgJ7n3gCpWB@E#NIL&2qE1AU2JUi3el{
zMZeEH;DUra<TAM57PQK6Y^b}drEwg9b$wgfbY@8lI|qVK^jdh%4IFpFZ-e$n1rJ?S
zbSVpz9bz#Wx(P%_92CqYlTrLv^itOVn~KgG;$c|nUKW(5&D;&uVPl@*SpVe+9>5G=
z$S6GXgWMW-nNhgQHs;kO3CCSGkT^bY4Wb~m)3{)Uvw%K_R+<N0E_=^>eYn52IY<ly
zgHq9Vx?TaM?o^S@Gxp_{S5Hq9Tb%Y*$}_I8;Q2iYQ>zo%I@K~1GzGdeiQRz1KOu6&
zsNFfsuj8weRLb%kQpr$*MZAxiEly;ajq5X=R^^L3BT@;PgD&*NH56xYGHEHaey-8q
zn1(YylmX4g8SxR9y=35c4d%8dJ4s})R>V-L#{CO+?Z-Qr?oKPdaXHMTtk5lmg+NG>
zlxPbk%}um;!Xfgcdrw2SHiLL#gNdhnBx1EzlE7*NNk0VKE3tR5oVWOvBp8#Mz#K^)
z<N2kbaQL!?Fz5{CofCL}6&+m<b|2+`)82ZC+=TT1{0c*zO^;(<T@A9X9$psSp#4DN
z1r8~I({Ci6CLCjFe1ZkaMZPPoS8urVcBdj;!|!)^E#&(Xc^6b8tD|e%J+@r<87d6~
zR})?+mMJ6jQoM~5>0s;&ZfhafFA`Bp?&DFvfjq1`tE)kRzz*<t8^b2IBv=+~Sm)tz
zGAF?Rg4xGuXuoq*N){XIn3@K++1i8K;a6a%ctQW<Dst_@lp&O^`xwWG)<ex@N8J3Q
zzieznaJQTaZupWoz0k#4+s6WbCqn9m<Lgda=&F#A$qj91NXwmw(Dr4^BSC^jE^;0-
zEpESGyCxfruANdOeUBi@%|M?3;xH1~M`|E$W}oYjs!l#gG=6rlhw{l}i?gnuB-t(&
z_`}MANs{A=iE%PrTZ!L(%T_#8_Eupg4wJK_z<&(V^vSk&sc)PJ;f}AcM;e9NN>JmQ
za#?7`*GMUJ+#UhqRAjW9k+Cz(`Y?iRH2h5D0F+hx*hNxi{fCbLE@E$m$K5F@6r0ol
z7@zC*(5^{Hk_?q+l@FKPkl(un|7n*6ejbjx+aH|U<Siqb78=?G_ji}j)z3p6B1gkO
z>qoVFl;WER;hqI%s%2oiknsM(&M!^1sH7PF3Ip0e8+OG|c%~!hXtF>~a;B8Ra)8(N
zRG1C2NGDYmLK}EC*~5DehXhMsje~A7qdm}aO{7_*Txaj97jdgX6<@_0U@xDR9gKzT
zL>73<kek3lWRxiz?lb#RLSKV+%s?S;tJly?Sf{1Kev6Ek-KxWRYaotiBw%0Z3m>Y;
z{73^d;El*juB*Tkn0uK^@>YXZ0ZN@x*mGL+#;>e@&qHg*4<CIkwsvz&#+)4D)`41z
z4R|{k6@L_dZD97!*73Ej&(u+o(T8N-#Fx#`!E_EF6UB4ejQX+rkH7P5hu7L^@Nu?j
zT;3d1qPFK>c;<fb(op<3%}*;ck9L{B4h5g!lR@7e(cv-zOdgB~O6cWCBbQvdV|;fu
z5miEc9}Q**?h6@+A0^c}T)8RrM<)5KgMQ|==05Tb*vy}q<6?9W-#lDd@5U*DH|=CY
z*0oZ6T97T5=ncNI&B-?>kT%%XG-yDukVXYqQL?k-j-xr#?1{cb!re(fDKKExllI&D
zX0-d^miWa84lC+<-+3UH<PadttEu6|`D$n>2>#7|Z_I185{%Nlvk=!&7xh{Vgs@8J
zfk_j|JSLqy6IWrCZtXi{Dh(2mt^`+4U?j*fw!vgBJhb&q9i4S%F>zcZ8k*tU!qRv*
z7S}n^(*MvK4?u-WE5L@_x14>5YV_3Q_SyYxvTMW;D!Mms<PCXt)ShyGMDZfi>%g@0
zxc->%)@k1}l(VJwsn<%a=7jwXUMK_p91FRCg}lpZ>dnWS{%CyWWeE`<m)q2}Ja|E9
zKXWubErrC#=avPb#kAxv#84A+YhiM7*eKsC3Z-%4{9(4?&#DtR&GwPwwYJmrEA;k}
zCI@pj9|?-p8ej?MI@}fm6RflWGNjbT?Oo&-F%f9rn3yCDAn?rf1nvBh@tD#`(e+EY
z=NlK}i|o%|iK!gF(I}9U^DIyi3*HuW8lYtC7_RTxoK}-K-3a&kn&i*HdDyym@c_t$
zWseEItIpn0_>zW~f)*uFw(%iD>n#6+s(x8`$z_FUw;3!h39M`iA8lCe+Xy_fEWqBA
zxIc@cMEx#oH$3|#(4L4W<vM9Zo9L{fd9rs({ofcs^kft~*``5W-L}&!mxu;-79nuG
zCo;3ioo{!nKK3Lj%sMAX)_kT0#I!$C5*SYl7FIZB5?tkYVQFpsi(!+_y(znp5P^C6
zV0xdeJpo~A)D?gQi%^y;es-_`upHj;c=qx~#C~Zaq2jxFQnx&kx*XR5!5)#$*&Uy4
zf7KZ<k<(QL5F3xuVUNLnoqT!e@v12KHO@Y11C5*Eg7EJ+lsxKucJ*O9Z{WCk`0?Fy
z*izu7IFBD4_Q_G4BelNqS+rmS4IV7}hS2m|G@wWm$toq0GB#I98LLEG@ix|I<=R)U
z#s}8=DLy)_b{e2Eeqq!GZy58L#zk^mrIO)!o$g5FNcu)aX$FDvy6zJ|VoS19l7fW~
zt8;?;U0<a}G|zq}Vi@_tk}VDCMmV*d=ga^JV}&~+KDXLTQeItk#C@(A6IrZvnE!a|
z(WWBD>J_hW=p3N2pC85bTHMdU0li^m#-<plSi=C2Z!Ph$J!`_VkdxYJ)$tPuGhf`J
z*gIlUJ%YFm@35x33sHxAIuDMRPf5yl!PBv{fsgOW5e3sT${82gd(*{geXepsl1IPo
zB@FN{8~n@OlTw@ce?8YrrZJ%2ls_H6IaaF)DznhLr2_F?tfIW@p(}K!R@8i9gS>h&
zg&;U}vgWLh(zS)ei90}|3(f+_Fuh(TlzZ&bnmoMzmD!zleRWQSc9~)IcmU2DOSR_n
zQ%ry4i;Lll_HD+tT0Vt)YjyB;Sb-+`&O-F+_$nk;ur(E-5}(E;=Jym}x$ZO23&Ey#
z`5^wb79`9Xn4;V}snd?Ly?MCU4Se6c^d|Ii8uS(hq!^qG5~>OZFeZLs00&qoFf;E9
ziey*ui7TGY&Q-xH7wE)ejq~rCrsz1qE*!D#p{uV!Zhfv#Y^%(y##L{g`<--RmkEP5
zT*`*pxF5s9%*UZO%lBujKS4NXk0l+2<6fBIg3l)HR?9Jo$kEkL@$5+H4m@++dbth#
zvGHk8&~9mX{%YhKiLCm<s93{yPr#P7!`85!-KUVW<MuRj2wttj?~!ZVn*PVEbktXy
zIH7CY0Wrii0=FVv!Mc+DEY`u|)410==S4~xq*ky<w&_}5h8mw<MfVAS8n1z4TZ~GC
z*yxWvA4`5%u`jf06fhx<ehsL@yGJqPFw^>N-Y(_NW+?&8cf%2YpGgS$$t;A2b`-}l
zEllD;m-Z4vfiJse$-x#HCa~tRO6OImWi%FbOL%7dUMdLLASO@U_Ar)rc|8I^di93M
zp744>pglmZ=Hf*>!5w~ZaN$zTC=-l`#=9L7R1AwZpbaP<&5;-%S|9Yl#j$_fz8f~!
zagI4d;RIS@0BkFQ{H7tXD;>pze?pyA(N8Ye)lzAZuLId&Pnx}t6GqYg<;`;I>obBw
zBB3Ij`+=jT9b*H6={lEn)aNk?>3g@Yq;9bs`-7<U`Yn`O<rA_I(PFf|;E+hsv=Q1J
zoAemjSJFzk^i<7B*i|Z6W({<MK39}8Dg=JJ{eg3hO+afAxRB5AbA^)Mj`5DoVF~@3
zAebI3&x%dfW<ynNR@+a^Gu{mV+^kB8ZL`07Hc{yj93MskKS-`>x{DP(dI^q+c;~x6
zJ*Q_9Sk`R+tQtWFu!LW2PDl~t)t!@+ur&|Z4Nv`C52u=J-U)u~b;KY1ZF4yw?i*Qo
z7F+}3akEb4lM{Hc&Ui7f7<jp?c3&#cu(!5J#4FW|)9Ls6%r}*5CkNFU*7v)&o*FF9
zo6X)$77T1h(u>$Vlc){By!%QP5O&`mo4?2=>Ku4;=q<49x>XSxC~oE`IkR^mJXQB{
zH6=@=T&cavD$e=$kzwLrul>Nzp{Yi*j<N52yXYGEp$!7UextCVc{IMxCury%p<<*6
z_-LaD&Z~H}JZm_;T44)6int^i7(kmD6C3D_7R79Q2bHg11hOUo<=5(LCdb30xgA6X
zg4=(#A1zS?m3O;NR2Ui5%;?)M`nLwFWQm0JsRP}zrc<`R(<m?2JC>C7o^go`W-0={
zZ0w``Aw~SWN7I`Mu}Z%bGIXkZkY-_!L+d@IoPd!2F`-SA9^eDof5#U%0E?Zwe!(Tv
z7efVLkKmYkw;%fR`Pu^=i5SXBv+&(KyqE0Qgi*eS=(kslI@peT6<+(PiW^dEAI@pO
zN7r%}272{T{8rlbdy|c%4B5AGA6iII2w}HD+v=p6;9^=HcHY?^xR;0N_40+G%t;n1
ztUpUxZV}aM3cru1KVc>8J2%qRlc?dp2^ANYBUaFWIrax$uI7XczxTME><1jFa{f71
z+ur5^&E>u9eOqQo+(EHdt(Rzu&9z|^BC#O%_La84ZmO8Co9xx;_W1Z5QC^s`7)??Z
z$)eUBl!L+HazyONw#w6sa3JFC<Ct8MWPG015(mWMi@$HTFoz&6#fVm)OYf7STRr&W
z!&ldBd7m%g3^rruWSe9mQt>hrUf;8Qx97iBXx-J45ACx5x;bzkx13PJnZ`|5XATr%
z3<oSkS-0P#pC3ryBp~B%yDbxO*p&cWcUkvua;}jtTC%q)8DlWlAGdO=F1bw_50crC
zy}IO^^5q;7lY6ZJij~O&4U=?y_!GQ6Z_PI(y^s@hFI*5*=)ETmX!ICD7*V@8`-0v>
zRg_@y5@@q%LUg)T7@o<+)`Gjq5QRITZE;;FLvg|+0mO`DTNUxK;68~Z>f{WSecZ4t
z%troJj^nu1yX>y}n9joVF?)^ZF$EQF!A;8%EzOdGwx!e&B`q!`FUOo?G0n#q(FR<B
zy<Z}8UeoxUeN+`x6LPOVu3xTDMN{(dl8f3|a0iV%`Flw3sp{M$>3^uEOzDWq4zj_e
zX`!ZSMIr+`e--x`{5^q$-s;Dp?fwX4NG0RA{xElOz-<1AAawAaF-NzG*XW)Fz^WnE
zhQSyMLHkZvUqbb~f<A}&$ObE={6Fly=U-FN)-9}}0)n8@M1cs1bOJ~hf{2I|X-bn4
z=_0*K2?+v%6sdvGdr|34q=QHcO+e{Agd#PeCWLUer#$bu_q>0={cwN#3$R&xt-b2p
zbB;L%d1;k93|@v<`k|)V{CdxNh_n_B@>~CawJ5oRcxs$k3zs!)&!yj!KxO^T6;e41
zJny!V1VCuy(L+9YSIcPMv0;5!myQ#EWKMG__xSH-_IDqvSVXj}WiCG#YGy!8FI;c0
zXE9A22bKJEH0J9NM(t$a?~nX`4&%ofO2PJ=T5I?c0=7@CwhZy1c2P-!J*s3Wif>%5
z>v^cv*E2uEAmU5l#?2}|4(yLHhTOAP3c~Bv%r;yc2kIKk{fiYp!-o@=(f}Bchyk;Z
zqqW@6UN0w=ZO9A*Z(A_Q?~>lVSI>5qJUuqo3c7POf8;@of~REX7hTk}Hv=?lK)kfc
zwt8<uwyxt|XCeK+LNk1R()YdO&$=t(eB#K4e&sj&^Etev$uA;HV*MQzO^J(x#yk*O
zU~KzNCvpq6AH!95B}(DZH_Z<fIZ_w2Srr||fR(Q{PYHtGByB*odAqDKm#c(^WRLsY
zSPv@KP`p`w0_YfbOU$$UMysFMMsnh!;fqun)`h{48KyxdF2yMXR^L#?e*12nT2;o4
ztf*B}Ed`wF3#c#}<z&V7hwE{@mlD)$A(DORSN-(Jdqe7b`1Aeh6|hH8INW=^(0};_
za%(il;m6PP7-gYk^>>EeSvolQUh`&$VnmE{*8DpFjp9#OgvaDYd4Cm0^Jt)GNo#_<
zcSTYDeHr35>Q9J26*U^nMzpDpE`87UUL@V$lCwjejJF;RWTV{P%~KgmF;6YZ{*hqs
zo%lWkm1D;fDnIVglXQFK2-2_J`ZOBK>6>P~8;>Ax>#6GZ5V%q!<V=24m38+mA#hy=
z6SXhKQwH8*;M@#*@7bS-v3@#sm-Q5l{jM6W89A?mbdwK*z%@_QBKOWut?vD<J0qWT
zqgCK_&NF$4dUICd@$GfH1abYsJwoW6NO5(BqEQqb1m3eGV!(m7z~lM<xRTn1S&p0=
zv-$Q4tQuyk;xb#JkxG<B<;$^9iRwjN=vH-P>@QrOP5y`PODLg$AjAyZWjE$QC?y5u
zM=Iyra^g21cMDP`h)11;{&ewYONf3+m)F|3U5H6}OGoeAYW38$i!~q!>NFuW@#%T>
ztF4va?V;>1FPb?1;+%koZ3QD@hZ^HN`(gb(i=HI+$D;N#ukp{Nqynopugk#+6L<BJ
zhjD#HpeC?S5)9eAJ7J_jzjh%&C%#mZy|Dz`#GIgat3~(jkma_=MnZ)6ZjnoR54^*a
zr_Zx50i0^Bl%WeMddu{%N|O{ilW^b;fv!2rZML56Fl;0ecuK3_#{(fdFPhkT_ciH_
z^SedQ4T`e|@XJIT4Ycyv4d<$`R#B1%d+=RE;b-{nE0@?uIhBbEAKqeAz6#oN0KrP{
z<r8_3%_MLB-M+dey?jBy!iYRn2ia5&1+*$>Mh&H{y<MlFw!c#jBRynJ2q!fMF;=<<
zu(mi@mkH{MM5m|`AAxM#8uD|agvy)t&nZ@2i%DcEyt+|PzSy<&T~e!w!<m<Kq?S5E
zNEPzR^{L|P%U10I`7Z0S;!NpbSKSqi%5fg7+l?;ed><WSmRaiGQ4^j)PYbI^K8AP?
zIei9;^H7@`Ma0)EWArnMRDkF5wDCPG*w?hH5vE5Ku=~8*#zM<|n!CFIOkT^23CCN_
zwfXfJD$YQ9BtQ4H2AmW!Er^D?uD6|9Pc>P*#F3YZyHVvgM%)_zaOcxs@Wly9iCAA*
z--In@o;~Gb;chWvwn3cfJF85#us5jCZh6ZipI(=O%-k%O>l(6aPgtgTsP$D75vq-1
z4A8?2+LvlG)1O*9XS|CXdh~Srmurf0DBZ`sI6e?FZF;n_e>8`^o)1yTXYCV|acDg^
z7EgpdZ-1+)ch>G6zOi~Oi8lVMd149s@gzg}iz4q=WN1r8iY_nnOGVPIRf##2powB}
z!B=<SoYy+14-PJD;<~rozB`oFO9eZ337Oo)MLusC$`$IBzP1)m7WxL+jC!)KcWd*p
z8(WysH4D}LuLGkHBHrOiW>2nW{t?c~+AGMDg!+E<fsQ6cSh5edAO9?X&rFEB-1ub<
zo{h(e|M9n|eefw4UarDg@#xlY`J5*Q)OJRy{@SXPG3_^JT}Zdb2e|77>S#3!0l&<A
zlSMi{xASF*D|-+;CCeVUB{=Q_9~Qb4;Hca6U^Vt_tit%LJl`7Pv@Lr+FfFLKyb<z^
zI7Qwc2d}-It!*z24vqaD#YUtLu8JZduQp15%ipnCW+c?L`)!nhBwU7tvN5UcB57}_
z4yT%)RUDO1Q##Z+-jZ+_me0=XXiu@rydL%Kr0mtq+V%DymE6IUJ0N>@f})&-^)4TQ
z-ygR0VF5}XeNTmzAmHy9RnQHjn`ud`g;dcZ#F|VYe1VGDGwfoP7x|9|ccXcCg#uW?
z=Ac9{lg&*UF+cf(#+ES4^>A{gg8vhF&_KI$;~EDhusaT1!wkwKS{>-hGoO{64fd$&
zMw7UE1S&v;yFX+)=^8XBy^kuX?{<TP97VTfx7yy-{a8|h8bpf!M1H4;v@>Q#@hcPc
zi~~{3@XG`=L74dkN69%^4s5&Ory9KlnUG|=S<-Oxw6^Rnh8U-qR@MJ9KHOXNfJp~l
zGM_Ri*AG=EFfF!kEmZ^_0$Cor=d><7MtClLCu_Zr)8;IK)sJ<g3!NA)(Sy3<i}Jw_
z4P|$T*@;*ZX)o7EmKB2j0FhN3MF~`+c~h8MoKxWTYQYEU`y7ikpwn|2oU-?38Lqnz
zteA{1N30%dL>AnguQ3OjE_6(R*GB7=Y=QiiuM4u&pX&MzcIOnGYC@5QW8DN9AxrqW
z2SZZzffDFAXvX3q1Mjmd&P`(E^Pk3{2!)RiY88ibHJ1`Efs8aeig=FC!R~e^^kuPP
zM%tlxL3AW>`uW*b-Td|6Hsjkt=JvWO&cP!$Jpvff^;e5NSdzF#eyg56-dggL--;Z5
z{;J8bbu(s)+?C4r#86>4iym@0JUc_s=EHk!DIM*JwUnj|f}P+heTLMaz3y0C`YCVX
zyG}QLR{+q}1{)oBf!IXPzCYT(A3!IYSNci|THlg~s<`Hk%N{DSLsF+!9BUIja9tv?
zLgPirZ8$I}Bb`1%qHZRih%?>3=?dBOcJ-wSn0O>}vbM{Q*lc4tU6>w_$NgYv#;VC#
z2OPYs6Ph<Hj{#ZC#jun+BJz6eYs%$8pj_?vwOwPy%Gz6~7!-6{m2Oi0!RMK~Dk*7m
z-7(2jv!1Y>?J04EiYjZr08#|F(ya-+&p%GK5MCL<v#l(fg2F2JJo@^i*;n^0&dCnq
z#FzbKe_T-My066sIV0_{N_d!u7`=W~`D0yBHp*P$y(yo8zbN=2{2jepzYR5`jUxGJ
zk}L})3)Ed}cf18bEz-P6T8Iz?a}`jWn!Rt;2!2=dnoR<UypnG^<yh^kl=ihW_)phw
zrMxHl=j*{VJ#NN7Ly6zI{hWe0HtMdXO4+kXRN;Ord3j+1A(SAtV<5WQM>J=QVt0GH
zyC5SMs)nHdc$-6B&f=o%e%SM~>+O-+(RKTQBL4gFYqTsKiz|<vT!}1OPZ}e*dadwB
zulUgE<X#=5EY6u2m50*u^Sv9FxYlww8!)6W=J&_DDm#cNQGVoNYHJ;{%{p#pr2UA+
z%v0Af>gv5d3TQw&#Dq%FpiaI=&p1>5a*Xda^$V;qcx>NAbIVyDU;1vMPG~RuyUVwP
zJFSnCw0n5<7-OE@N;wm=Xs7YLi>03OXurhr*tedp$;YNcDGB;iE~|=Gy(%@yupd@{
zgnA7RPFq5o<pJ;CMoTR3Ft&{1m01UDsfA)7^FD9onT39@e7LJfI^hBSu|Vt0L5)V1
zsp>;Q8xH@8Z;Y2D&;J8eoKlvyCfFjLfqZVDyYe$lFmsx>yR<QLg=iU3g_LApMJ+1a
z)kra?tL*CjO!3WX5icN%1Zlm~Ox!Ae*0?}-al@6(9(9GcE3Tv0T8(F;U4GDw%5E~@
z!sM!859W4Hyv|{<P%xqo7vgPu8)dZW3JK98YxuF2uck|WhV5`8#&nI<c7$)zn}W1j
zUF#k6dbU)J?6(e0kk=D@C4CQ$O@r3RB9C>)zPNRN;GA`LJzE=8<q_yBn{wPK@x|fI
z98Gng879aA;_$&tJfHKqbJ8t;xd1vZz<ls-(<$XDDW>Vf-Jw-hZ*QB^7L>ct7qJOz
zIp3J_=;h~zUnM{YyjlsYJePLtDu>)m`9L;DWa&hBEZ9VoQV^6dg@piSWWZM30rU45
zaj0HBq=4&Qdj9@yXNQm5+R_Sf?xEbgR$)F^O?PEPmrv1B&qmJXm?@>e;}il<gvMb#
z#eq#WDQw=SJz;;vfj`Mbt_;L1<2-Aid+#`H-F4JhC54y0NY!VfH08?MIyRy7HO%G8
zL-Byb8&ANgvb&#R4g<l4u_Sk4^kupx&SU@iy`a7`INWt|9-Kea4!vROEqiL_M$JD+
zyo@rPlKw{SG6@0z%ra}ga*TgA=zHkJ>znYf!idsue(}8?$yfVX_$)0ONXy87?BMA8
zo{daNQq@Wfrpu7K7yy=4yeaMNv)gvcy*baF&lg;^DMs{Pf6sf$Z1ec-Gn`SAPxz4_
zT1QI>GUGK~aSo#;LcTAA{-9W}IatBB*H2jwfB`x+bIZlTv}f4;vgkQw%L3C*^d}SC
zw_N?FFdb(N=P4}3-(gY37u#emx3nnAcFA(=m6bzkXh;t{Ry2#P(^>;tl7)BUptZp&
z=P>8ss8fgW8(g5G;CYSlKX>u<7_}k7n;Ysj#<@JknWs7lL>}k&%YgGqAY?HA@1fIw
zrnX+C@D|#Wuyz5VPELY+dqq9yW{?y2z7_7xXv4~E^MhAUH_1YGWjC&ds?xyYvrl@q
zMd}*2^6;_Rn=DgBB{z{#Y}L&^rlI2wUe3|wvZ8v(XPs~ul4pT>a@k}&kM1}s7>0Eh
z6ho%bzfMpnUD`)*ZUr@Ut~4RDW<XSC^Zg0zS*UFo6M=7UpB`zv%Ou>lI)9V9%tcK$
zvkg4i#nXcBx8V%A9potUjX7&Cq;o%J(Cv9smS`&%X?axJ$|pc+FEMJ!z(rY|7gtu}
zEej;w3RmY#e(7us`<d_%J#S{Rol&PUSy*}&Yea|M9D!{uv}Z*3>m<z{Z=6=GD9;Tk
zX6fF5!I<T9RE%xUjzi#6xk8y_ApB-i!+N@~aYhnC8;lO8YM$v<f%gEL_M_$^+elh|
za$AZs6)UJ2LQ@I*lVrbeqLj4LVX!Uq)Q_az6JUuYz?|Ck+Qu_uqx%oXDCg?`fI~n$
z@Ef4XOaM0Bf5??JbY}8eH%Uty`m%q)>G(#^6YZ)P@j2X;J}?rrh<J==Ix8$+SJ^*4
zKA3&0OxdJ%Du#@f@Gxe3^p0oLu8vUylc-?Ubjmkh&X>kkt9l3??c!uM7B?ReJfU=d
z*z(C8E*)}K1Vd{qwdNBe;~;*+HSR*Qpw8Fy%z`;pjw<L}NBcmP`DC%Ypz1-{`!X9%
z)xjR?KC`|o<~P%|$7ESzW4dX2IS(#b8wc#>gk35%k*1%jvuBlX(PFmBXX^klS`4I0
z(lmIkKf;v;1KDzu{sysb6E*gjZ2gU-b`Jl|8&Pa-0I*=qKZx2&*@hKqTOsPdaexw1
zaMTS|kz0F~I)q;b%LFEo0FuMrnq+#c&n*Q1#wc(s9Mh^8N0aw}U8=96l1Yul+<DJF
zrcoJG$ESfBA}x<mgb^!r7LP^y*>(s&Fh(_w9Zvg?-oqGpwW1VI_W08b?b91zL)K6h
z%jhsGk1}cd=8l8*k-$+dlB?gE;YUnIg{_a6f)FBGDAFX}<`8N&wmJq)IMG9wr~cen
zVyWXh@p!|=IF_|dBYRY&0fMk``cikFC3D#G+c4P}FRN9l7^gz>bA_CAlcMQ2uI^xO
z-B685fgf91`c<yDO=IRXIwi)S;&U!yNrk+I@}q)ox#hE}$8Pf9lXHb^b(6}p3&VIu
ze5&S9%x*KzJ(S1ciR-MO$rksIVV%r%mpFHeubyr<(5rrQ6TjSjD5gk3xqidiy+7Bn
z*39my-xAP6<o2+fg+0B(_d}-rk@NAAVt?9+#$CXv;gc0pRgq<2tRa<hw8whil60$3
zWArcJQ`&%KE#Y*hEK4kUO{3R31L38q#;hoY6qzqA=bY1M5-bhKQDGHME)6XY;k+1s
zQSa|5;=N47+~|w5`OY#~ui$-UaIGPrVqj`xrJn-IR`9)Nl>toz)-B3(!Nb4w++O~`
zn}g;2qnF6uy@}8JGI;|B?o_Fw;VUQ7PE#jhB?*iSlf;hM$#cR!{AkqW{OZQ;3t<gi
zV_}K2;S6534%|yHn_mFN-wQZ9>d}wnNf*V+U0(~MZ@31Y(P(w&)bcT`<0KzPV?;Z;
zv!Bw-El2aMRzlF}p6~G(AX6eui3VL~!2P)@fb^#Ic>R|!4hiu|o)au@5|Hw4O0wL{
z(?n(f=gGX8Xbu_pjzUK6Yu*k64)Od&_t|UFaZ0zN58dI=50_HX>TYc3u>iK<r#>kQ
z^ES{jo422Z(<M-7c@y5<)h}xlSTPEMGHHx9tL8qsyQoMowa6Wn`@pYpzb$X;1=hZv
zlQ3$O6zY1!!z$Q!?R#p8Fngur?=Ok^$(2D-9rrxhs`ZPR8OMW!#zk_#7IO?y+>~dS
zZd%^=le@2$0y=`V6$yN#KRm;ih!1&3O&Qo0vUKotU6p30{uN=g*qY$W1u$f|Cu@ZG
z_0_xq2i<%4Z!O&IJKH3T;P`A#41tdU%e|AJ4PmOKcIu#c*1wvSFlPuYvl|g-1}{AQ
zi`FoK+8Qa_oFssavSUUqosx^qrOgGvI?T&dMXXYr+f<at#+X&L9LG_<<EqaT>9^Eb
z|5{J)a>jE@+Q^AbmpQa@9mue5zzR_R+>nnS!y0OJScJw@$$IXO<QNN}E#Vp&o;_jo
zG&x!%6{u~|s(S`%=;q9u;u=eemdd-&%p=8=G|GHL`hdoxl^T+BX`#)YOVzWj076yF
zLH^Z+jYCIYv;v(w@<h6dL*yKTGic1nl<v_!Yj>{>+U>2`%Any`ZohKhZ-5};H`c_2
zt3035MnkUZqXvo&rDaS9SKR-}t!vhDAc#)bO7g_H^h*-@*PUm9P^sHPBYP)xP_rr1
zcJ9RGU6+toOI$M=dr)e=Gm+(Ep4HEN*KS!wD#z`95G^7$sm|_(8*88ST!PfiZ-4gy
zT_K(tXxH#zYjR;(D#pv{X8GO2Ol2r#nZ;-{<H5<=5zZvn^3l)LByd2BD0|$9^3RQ8
zus|RGe57#mYvKs6rQj4;QLtaaa(GD)>~{~3F%DQ@|BbDghZGTM7Q11)0~>2RN36fI
zhK4nc?^tRA-v$D=6~ZIL%O1Q}%^|IMtPC0GYsQp2v&AhPf6{(@2E^8fS)DE_KDG}x
zFTWs!&5Jr=$Z6!h++UVBNMa3sacazDlg`XpU`LXTn#zno?b|x+07;1qr|Okw^^OD^
z|2(-%nFSwW%q3W>xkeaXCd2_QAP$R^i$w&T388FoU<RUHw*9kR=B<6%9q?b5@MC71
zfZp8Akp(V2B)hUIGMm=H)QqXdaV{#_)If#V=J)SiWdo-ebE!gZRE0?JNL1qM5<X>9
zLAk2QbfnX?OQV<TNhw7T+3-~Irqur7D_Y~^XSWp5Bj^1}?jv&PJzuJ@mZ0ARqDUjG
zKDY<?fcPI^y|HQFTOt6M@w{^dLw33=_%uO^SJ>FcAk>b?ab6yZP9Y%!#b#9cBRWuK
zy&m?99#Yx;GWH%NLcMR|DRrmKY7aPux>EmH88LpTK)Ys5#`p{QUER!$-n;pcQ>hQ<
zMfQI?Cz(mldU_1**P|Vt;(+<i+|5Qx{sEeyG*>asB%u%NnqqmEhrIW1h@*UIIalOF
zvh1<`JHr}f_us2(>OL`$(PgDG_juZSZ{uV7?sMOYxj45<?o6!!8M4sm_b}1X$e(s%
z22bTjcl42B!c?CF^mOk{b8leqFw%KnUTmZO4R>}rcne8)lHX4~V23CcDh@#S0uL7g
zVooNU<#=nf1)}a*Q6yC6{mdwTRl<p3)jm#LZg`Rp^PBVxG9P~_;=LdL2Oq5w2OaVK
zo3nf@naiKZ;mn$xIorzu{py2!Un{%vsA<T80R$N|C63qlchToWLhI*IA5|u4z}9cq
zpda)nFAI;*+@6$`JatNBxhcv+OnC5MCe*!_FL))(e)(^9@0Y}T3c6x(1&VjlzrpF;
zHVdT!_@J5JG@HH=(EZ&n!Qrc0kCO_Vs#=I`CP_OdW>ktqeB;ocj@(TkGS<I_*f$=b
zV}9)peGv!ID~llWAwdC9JrCg(;*mDu-A7*<Ojl>b4vtAyi&wc(^m>gSlMT;TK8ohr
zN#niR-WH=s@B3O<4#3*y$(|L+&||i#C<*#~wS<XTgv5E%cZXeR=eZW$V6NFu50NGr
znVnpXlB&&I4KU5&^w~MR=r|@;e)K|QRN^bD#RS@+RB0FI(%z|(*?Vh0TbctdUrK#}
zR8kAIGjXa{aqardd+}ta&dT-W4tKCaS<79YmGy36_H0VecP&#dk@Zk2t)-7ZlEWQu
z)7+cPHrbb;bO~0ht-PAa$$S*C-2u2=W2D+8Ms!H-Eho)4ttTV^BvcUzH){UohMy~4
zjec<1<{5ZzsjffENj`62O!(3FWVcm)qrKh+0K8R6W%ufQB$O45$m5vgJ={Q1AE03l
z=pDdDX=s}$<`b+y+&AxGz}r>xDVwzI^*gXaCm3y(eq1V2rm{grs%Yvab$&rB#06q<
zOqof>y?*(%tVN60)ZMfqy<bJSvwb&ZwyIyM7b?%yd==~|bM<@8Lh!}(@vGIPN)?w^
z#jiE^3a-zcE{O_Rm&OQFN>3KzFuWJTKyVrMJ}6r)yL@jlaEvq$d!*1CtjEX99`KF0
zvr^%_{8F+I$|4>Oe>42ky4Wd2hOoC#+o=!iwcLcqFVl0}$Wwj!CCh)izEZ|HCKLxR
zmyj=ssd}2G`qF6nT!<Rtrm31+Z9n~h0zDnnXL3aYkJrDvaUV)fm3PpNgvnqcr%YqE
z>b!i=LvPwK`|k}?5-KRNULPzYsT*zxqtk1y8R+SVuN?nT)jQ#G)J-Zn4UeEMayEv*
z!d+*@Yv@7)2*)W!@Io-}*C6s^M-{@vd7Q<i&dm`hTy2kS^a&@k$rv^4kFg%>^*OHc
zA7RtT>sN^4OFGP*cGzxtd?VJjmT&K8R*VWOjH(B|Iv;Ryc(4>fFMUiL7eL>=`U?U8
zOM(Wz_Sq|<u?;pp(gAL2OXooJ;+Y852i2O&Utk0k0WBKhq&5XA<28R5w%|K#6nES|
zog0Nl8Qjwpggp}dSQ$G-si?ud*1<m~7W=04fwNASFfS8G@cGx;{-r#YXN8qL`xZxR
zNiWB86nnXaq81+??P)90YRRnxF6`ewxwx8+$f*^0a6+O9id^rsva70i$HXewY@{3N
zFXRef);0P1CRAA;v9(*Pu#RvGmkjJSTAfI>J3nw?cdYGv((Y~Y_Nw<J&ahn-q+RE^
zu<<h1EjtFV!cLfP+O`iJ+`oVjb~eTvaqPV*6+-KsroPtgI?cR-wOgx)JMJ1e&=mz#
zECmiRXodZ(<?|?Ai@m2@sCJ8ubnijZ>%6r!PGWoK)t06iF#@*47>H0GXou!%j&!z$
zw~T5%7{D8cI_69G;NpGSW*<cvpy|m;V9Sb!?^I%*@lLf`ua8V<NTX|2^;4LkeE9A^
z*qW<CEx+)B6qpORk0*Q&IEzWHgy4-qAI{Yl??-?u<7qH>NPUj|5#(t-9o=HI5?*9P
zwd%Z0!4%*emg(B6)(P(XQbNCRYjEhGJ-iiQ66p-G&G#6mJIoJHxHp_DlqdpN?+H14
z9)HfC>e;hYla;0zAx7m&=EmI{RZ%bGOV;aW#aQDb?EJ*Pi+_AO-tQU$sut3)IQRC>
zNDQw~-nWlB7sT!vo#8y_aDzNCpSicJ0i)?yL;BXPO*g?Q`MdT@|4t$wQw-r3JLRMh
zx<V=mi>Y(C6h7e41Xc6fJuu$AR(IQL@EM^5<LN#ZVGJ%3#d=B!Jtu#7U7||7sT`sk
zAoAqE2;sCVZNz7?7<Yv*ceRwl>`ll?`pyOySsh=_-R_BCaVOnie(g+tv{TuJcqf#v
z{xN1gXjMxC71_FDgLq%-2XKLma`)RF+#St1g;4&P__*X*b(TPMYYW`i61#=$CS0@3
zIe$Jl!<>*lN?>Go4$Un$k8rm>CBcqnM=wO5a3o+T=;f1j>Dm0WQuhNTr$f(qtv@6{
z9Je$mh8M?nu2}q<Phf0!t`Au6Ot4Sj9I-4)8x4jC={-~w`skzg5C#E&SumeIpDyiC
zalnr%s^6_K*|)z+gNw@QuzWxLUNlXGwJ71hZcn#s{kpn`eYo)PHSpYP5K^o{#+BDh
z>+Fw1`J`tR9HhvlAOzmE9Qt<N?g$&#*Lksj{aP+e^A{Vq!!9deu#21hxD?t-p7UH|
znS|$uO*RP8wBl5Bq}d_H8NwNkif9Fe#bT6m{kO2Cap4moahovHrTr?{*UgTgH{#4M
z`C-?%ni~^7RJ{dq=5A)1iiB0cL{viyA^`j8vspYxVOj?<HzrZL&tCpj0tG1&6YcZ4
z@oesP@N+FWAsGzPDhN`<!H^z66l?dj<G4-o+jGue6OYTKRWH{uHejkTZmiWuF23dg
zh;~9H9i}8+t0Q!fmGM!Djt2E(4f+)aNwdKKR{rMx+LYAV+XL)Z_)iNao5ui@xwWFn
z##E-C5@b|Vk6{BND+Jodg9~EVd&>d8MiWBho^Q9k&XY1?md{c+p8{TNmdzdB!?SLh
zw(;--fpYI|SGV`H6N_NX=%N*Ezp6_U?#UDXIJ&J(tq7Z*!u(cMj(}fD6u#S*mkaiJ
z@|%J?Z$dV?gs&z?!%vASo`D?Bpt|v^*TGPkhb(o<D<B!yS0%HtDHR-)?8*1*;UU>4
zm>9*c*l!2)yeds;-V1FeK`d%>4_BhHeF#;dHPSP#R!>^p9?akgvSC*xfi+$H^>`_m
zp`UU=mQTg~bkX61DfrQ6zG(?;o@Uqmvn8JNjYm|zed}$YiY~YDWSLvE1c}!_vuO*2
zQA{t9o!EpINH;m8WC+r&;<7u_=1oDqu=PdPMS4Z+D2fuqcFso#vcp4i{Cs_gw=0~^
zrSPM>R<IYV;;N{jd`y-qNW&!9vdIG;-F*t+qCmgj%W+O;<$))nZ;Fk`Wp=aB6=*8U
z#tQ1(%Z0sV_z4$7p%d{RHn2KlI~s;`IOoQ|tEL8Rde`u`U_${vIEgHKB5SQjbBmQe
z-|ATJdpn-nsLrqb>T<d==#mW0D#{Dry>uiqkkB@S)#g*oxyvr)nEbZoe6zcJ4s-@=
z63u#F>V<p3Slp-8?Z#2EfbQk49k21LR8L}98QPX;_wHJ~bG;Cd+_eQYTJ4qK9X8Cz
z<p}RCo?^N#?Oy*tKlQNJN&17zY2pt>=SFM*gd{As<n58H4L1g@Vk%npiUN?jtDO?g
zJm13f)PvT^z&DVMQz_be!Xj)zale4ZQ|q%E?&a>x`Z1rz@VZt_o2X@>zEMTtbOLbf
z<}07f_EKV}GPrd)Fc$%aCMIh9g6zGQO`Dj}){)`6OC`Y`Mer=k3z2Wi!2F)VRCg7X
zCPQY$Wj=<yO4!eZgfpOaI++tbD1*1F`8jR;gfd}R@lv19?R|mi6W8sab9x73l5_D8
z5P%i1_S>T_)kiI)l>jIb_EGG1bdJ_W|NJ^72ys84%|np*B|1{D+vBD&lu8ap>RG@3
zsGXaj*0p%#MRD1Oun|mu+N}~t354ggZZv;lFz|Fn5Tg0JU@-+#i7s*?^L1+xY-Mt%
zfh;sE6f=1We3Uf$hfE=zC27p3A)QR#Gh*hrN0`D&a%{R^3KT7?+4{N=>n^t5$#rv&
zB0A@xTCi2Lj@IJDRc|e@;@P)_8q6ULG5z>tp(%m>ik5<VUA9%Dff(QqXug%eW8B9)
z5M20CSrOn61V~Qg*M7Neor|cxt6~gfO9Uy?PbyBhM_vs+dr*NYWjP3@^WThLtLhdB
z*ZOI48wP`I<8PRAEYoBI4iOCKKm#O|lPlzZ<_kp277h7wOdG0Zt)c_<1!A;ATEJ(v
zg34XSlneaC1)9rNFS_hb6oQbN@zJmoL1o>Qc1nY5Wf%HXX{>*ofbyeJe(3W7Wr<nk
zZ17Oj57>0&y#hfXJ%Ku_mmH@Gt}pj^f77AL{4*bg3mR`D2b{0mh7~DmY4dlVRa}lY
zkQJM^_>6}|h#QBJK1yC9eY!V%wfGp;#kQ8Jme$|m-lQtn`K_O6NXFI(DSOPxE~Jzo
z`q)IQydHfkJdE_wi+Y8#tTkS_f3M}4^Q1Z9cFTaZ|DvFT{r&JgPIG~od(|o_Yen{>
zg*<~iGTYQ-0+5WsFzRYHksY_;D8=!LOac0~VIy1a)=;db)?;H!V<s=7_^7GRwoeeV
zTVVe{^$Hm!)8~GB#3Nj(pjN{O`Cc9Q^z)<OD<9S7S$H9UH)bA#ddmCY-u(P=x<W{J
zaZU~U?T$R3<KvLq5QU8mP}WFii|Ioh*?l|x6`51uE3Q)ry@YMd(jQ_$yk1f+89gR4
zG8pJGJ7_n-w-pzVF0<n7CsuK!osJ}7HdAt2(BHtu!j`A+`k{r}a^ZlN3oi_x^&R`0
z!$lEp+TxfM1M(Oa#B_lD3#YRH=R#@=ObGq$tbny8pL2fRKC;Ra2$J;I$s0i|RwLIv
za9%ND%O)ZSekn8a4=(X4DJHGj@9qc>S)XCv#^?5zf{vhYSwUVza8?eZ8;ca72IRZ@
z+4U#3ILjW~eLN9q8@|>}dc|b3Oi9a}R6%tdE|joPzM|;zlSMRUohjYpJEWb^y~W7Z
zia5&l9ld9u8`@%T-IE$6gw7Un(1cbw&Xw>RBPG8^h}kQILM#!sB}U3{(i8G2qEXv*
z&bZm$5K;Ay+53}WPdh0UWlF|E28+&AW4XG!?PR1bXmBr_kEC8vSkH^<I}$)w?L!N5
zg@n(Ny-|vsEEe_HyhQtHk0FKdG5_a{WH)m8$J|Y^s*>3Khqe~opa<Kgb+k&{j8xAT
zLegD7shvGlNzs@2v8&k!<<qrjj}4(Au56T>`Nj@{*ZpJ6r|4vtueliWfyOF!eVJFn
zF@iYb=a@bvxY!|%+@sJEOBNyWB`srM@UVy~PlA!4drRrpDS^1N0x)+zidl5#at}+t
z4Mfm!mwWmA^3q=}tl#{nH>zOq5#oH5qNw{H#Y4ELTCUriF79}qxW+s`ClkMV+r!73
zC*yL^CDHMnXvDGClHcqB2tC9!w6CC%WMQfWQ(y<pgGLIi;@w@kqQE7v?@#1h@wL<u
zQZhC%NbqCs*H7PoMh&TPK87;kQ4}{-rGKcU_ws9yJ^jBQVkksoQO+EECA;S5Y*I;W
z6C0jif-2*V71WvgoLRrwMQZNSuLKLfrkHpZ=6j3zC7(9D=A-oJcj6;*;+_mz?PM}?
zPg=_<Fl(m4H3sJ#BVxCXNY}$-2M!&7eHsqRx<!XjBk`O)d~%LHqzp#2huk^-a^YQ}
z!0!y3Yg!rNzc=fkV6GlSTtV{slsg!azvsDWNSSP`VeXz;=(4_d5E>ntEMnG>?DTaq
z^v~=No7b=5!Ui`<FWv${3i*fK2hyf4W#346iN*cMbVAywmZEU*ptD(Hs!I#uUQ$wW
zV(O!hZc}>)($KW+*@n)M_zF?$NtEt(2#%p2*9~IP&;WvL<4mkrcZJcyX1i$Fm79C(
zMOj^Vp4p!vHm}2mNQ57X-G3A_rqsaFm5z5GU(H~TDZu#6?!Kc0iFT9LwJS-J&aZ<c
z^HgJ`@(D4C^QCE&(@Y^w+!w|cQRS^%j*V|4^{pxc-c@)J&mXz8;6gch^KIvvd@JSE
zr1x)FlgH}H?dM8-UznRMZsloz9qNuz^CV`DKI)zE!92S@d%rc^UTW4l!ALJPy?=B_
zKH;6<+D%1^CfUVfjMaK?ZojEk@>99t=)_-&hNf=yoTFqTzxjc{jdE#3>;8xlqcJii
z<LxAmL0JsQD&>ar&$EPk3a_SWU04K%I!`KjIi#Dl<%eUd?&Rd}TkZa#0LZW4&7I}k
z@;1I!-BFUw{#nSuhpj!i{rjgT^F~D2s91~L!MarsEyO?scy#m8Hme|N6zYXdT#@@C
zJ*~p*Rp{nr<*{B6FaU7)qzl^vnFoB<hqHE2mu6E$eW=GO+-17Tx#*B5Pw|}0A%a*d
zCt7S!E)KAf-8(A~9Eia74V>&W*>Z4*wY?}OPLe9tSnk`S>uhl&SY%ido#*9*@;`r`
z6gKE`S4ZHbzLec_I7no(Sz9YGuC%;llOwmLZT@ZEAtu8<v$5ClE5SvRL7fKj+Pbg!
zD?V`*Oy@A270Dtj1%mCiaH@6}9=t3ah<>p7dg`k~nwKfsO@Eq5)7$Du5a0V<Qck<F
z@qQjGA#74xgJ~8VQ1yDR%DE52uk)@ny0qT+SRIfoHK{FxO!qs^SXoU&-y@&1_zaRP
z3scC$o_l>G(Eca4on8a<fi%^Jat^;gf$Rb#`<fKD0v^ywpD@+hGrW1OpBMkJuc57|
z<s^@7*^p=9MFQNY$}>FWaL(U$F6ff&=tpU>G?z->Im~H=GQFhd%yfjYoQQ4oG3L5K
zrgo96H&GRoqQ(AT(ybAWI-ptF;fX{gua7E9cxsN86h0|!o%36fHgRS(2}{yIyy7_7
z93ARc1tA{q=~-28H?XfOxR{JKT`ElxyJYbv*VU_H3MPi3*&{>^3AX?V7>Vmu<|w|*
zQOTO!A{E6naO?5+*deRxH&}tuLZ{oKdH(d(oV~i?G3B%OAz2oX6Vm<2@gx%``zu&(
zWa~bvV5Nf|lI^>7do<sT;iRSJQmK{Lj>oA{D?;;B6>T+I;(Nck<M4rzoGc{k+9`3J
zH|thZQHJ+S@2fdY^bxinJP-x81*j>AlO?0J?A5(pw;4EY^AxJeYC{h4W%py1H;uS?
za&yWB(g^z;s@q(f_e)$_vVH%Y9u=jW?6d+z8GVP4<j2qg#V~l$Dny}rX&qCiSJ!yu
zmg02UK0ULU_i#TwS40P8=Z7qDuLy!Le@VQE9NZq@1zpcyo7e;PAStU>V!&of6X!r-
z{gS$0y_Q+$Yv{9Gb~)=0vO7(C$(pxECSCO&v1_#EZC9VJ3V3A0a`SwpVx}QgH$^wR
z%%u%PwkndtK)!bmgd`Jw&W2Dkh$9)SMVtm(7f5`qCJ>oFK%R%h+fkYWvwi7=kg6Rn
z4PoW(I|INLWbv}rnI}HvAPY`hx6RMv;|AG;dPDe}noiY@;j$iutnxk;tPq$_?uDRe
ztJFwv{e(ctTJp8T3}?j;f96U}G^zP3Rhk^nF1(y68Lz+3p=!uxA|H)veMP=--*fGn
zUeFvX^(f$wpuC8CCO!K&(uXf;iJ*HHb7>(!V6i!=&13{*fHH>c9^mpc?7p7Rl;&=B
zeSq%|07Qnj`X1ezu;t=Ugq@xMd88@~40gnB#Sbh)t#@?c&r&6NNeA&7mZ#mm>z|nT
zU%T8_ShFctOXwm^gj(y`de8aVouuJ#IPR_Vl%lhPn)UIWKSuDGpWFHM3jon7kVI+6
zd*XRPvE>8hJ?lSCm+5aIwM5`K{d<Eak+Ri8DYhA2W0hi>P&wm7)(75Evh{Cw_PL2(
z06||G#4banb>tw1$2UG@n@)Y47cJOVgsHZ@V<7^@hg*N0x1hxFnL#+BIV7jj{r>QC
zLC6W-2mLM0hqd%jUxH2X%w31RA2`21_C;|w_ODcvi8T{N8Y6a~4~K~kq$b~-+>+--
z-oVzSXBx-XsX?)ASo+e2$z0H|tl~;p%)Ec6yck~n{u!dLKcu(1AKa%#{X|{zGoORH
z6{ULuN80aV!)cf}WRv06@QaqFo{^|y&zkkgY7}R&gmSlplkD$&p<oU=n+e5zUL%19
z*94K`8z<29ak7<n*<-RWB|*RU`1km+V!D)>vF;Oie9yUsPw@lbDMii;i83u4k&3Kw
zp*rM2YaJZGFgW2wru73ru<#-yh(`b(-v?$T`b2#kIwViT?y9}h9mez4@L`gWYE+Tp
z;$E8hwmWpFl;$;XmSCE`asKc?(Vb_{1uyO{?O)#_!A}pQZOJ6UVW%C#ROKnt*35|8
z_{&7Irz-^-sFxZS+>tIovZ?j^DciJDv}09oVWCZ5(tAdI7kdlece7!@Q9LMc3&&ND
zO=_)__<lh=tJrjRFl-FiDev3SS)8<_Ja}8SKIO$tfqfmxEPREl-A?zAxKW;#;XO4e
zK>2F&2uQ9mcF^CI@fM>g4W`b;(EcbN-Hg6<90U=yTnDH$ok||P8`W3;fIFJB%esYE
zQfhRB#=6IQi%J8sfdH9}<-0iNt4INW%~{;D<`?N0Lw`Av#__V}*3<xyetIvX;t^ut
z89%y2#h7}!4J{Z#ViD*wFwPA1ny9;9looz8_lhh_^qmqmv-w;alo>o0OqFfjH9u0&
z2P9(Dpn*J4<@#@{4Lax8^|?CF213&xn!rO#f~&3~;(}<W#2c)Q58sjV02K!wm2A^x
zLp3G74mAA(AnN}_6<i7sfc3tJXM7j&Bry6IFj5*PrDBI9#Q9QQBY02$GV6_ej%;?4
z&<fVfBJ1ku1(-jf$_E^L*9ugGPFL%C_?_jE){`aZK#))$zBxV``bhVXL<80l>vV#q
zZdaI>LUG_CToI|4>bSdTD3_Kw+CTQam28i8VJ7xU7?x{35%MHELP&M5l20%i7V?#b
zlxBczZ*Z)w6*8%`tXIga3=-;hZpMN<n-&b5A2U8u8>{lICHUg506f9h_1bw7tykli
z#0Uvomy8*R#Zu4GBx<`wVj(Y(ag-7g?1Bte5)pk?0bQqP_xH+MS(4=lv>KfMtbhP^
z*1fDU87H7fecmjqK-kCF+2a$Y$d#P@;BEBe9k1N;ym{o4!|Ct4++=c~RUak0XLdV3
zwdr>6t<F|gQit#q5eh;TsIVqe(X0{y5sQ+R>tlGPccEc{L%IFLer}Z%^N5F>RLBIC
z%Yv0MA^HMjSNaWcyq!8iaC7G`vv3rf?DyE`X4RrzHLdoeZ${x;W47Dhv-q-1V@LJm
zZJ5TsIz8~%A68A7Yu3J(rFYx-{Y^piL<H^F>*J120O5Mk<XJH=rU#J^WqZqsPWCp5
zWz05-zoF_*Sgs05LQNVZpuy=}z{jMS@_lL7)$c`5T?Ll;@m5l=+Prk-zG=1dhXaJQ
zFPuBZ@1To!-}CC#6oE@z`W7Id;wp(@$rBZ5+Z~X!VUmh}9y5}ftge0K{1zap5iKu&
z8a2uQTiME-TUa=sPs$@<c4N|^s{=Hrs(?yMvwA<+b%mbDWy31F5<?I+QDe3(HhgK5
zqL8YFuI^2MO6(3F;r5RPwC9KJXZ4c?g^a6`qb;N=Y1)Cwmsa|9Zff)EM%i*!9_rMH
z4pbhJfc?|8e?9P*u7-?u-5`vbwwR4V_SonOl&6c*;BD2}zB$e)fsiw^jEe4dmG2Tp
z0|@{IAzw&(1mVKx?BLq0);ZrJcK-{5r^n1QA>W2XFRyD<+g>B|InQT87V<HbT!1qb
zh@!umaYZCPKb~f5LAQC<)~{91+q%fXjmx$S8_)^hTIkp&T()D6X>5PEPiGsIz@`ru
zhQe(kqqO#a_qnh0j>JzM1kxIgR{yrv4;2l}gX_g!+Sjj4+^0P%UZY>XK1BG*k)Gmc
zJ@jnEO}*+yac*muPK4x_La-U<-OigMKksXG6RbaB)UfLHQS=4e!rFbhfZ)MRfc;`T
znWe;p)k@gdo7>@SC(l5gT-F*)4~1C-vd8o2gJ$0-{#Y4Rduabv(20@bEs6Rt&j*c2
z>_k+S1K*1)9Qy}SnM`6WkWzGsB&#vf##F@-`efE8`yh<FhbDR{kEA3Y$SSff@coz{
zu(J!QsrD0ZflBAMJl%Ho5n7S7algr)_{L!`9?(RtX6SKqs!)ISlgMc6_#oOV61VLV
zZIZt~wD!Tpsj(IO*m<JA{3%PQXVV3qbj6HDe6Y`Evf}Ah%x`{|8ghIeG!Y!nnK7@j
zGUT2Jr4v}6=E5YD$sA~G7!q`s4vNu3QMxH`ojzQ>&#>ivOeCxA;pXIFo|jpJCt!xQ
z)GNI%f0^WhGC(V?lid-&8Cv30SjW2$zFB-;Dl+OOH-96_Q7iM3!7qK=x0Zu|2!bT!
zaa-s69YC0cl1fzZn}zZceU=LA37^OGz|qyur!5&WPS6kMj_PjTTkK$FCH>Zr2F>$g
z%ZGgISud+3pHgt{o4kx|&lQ4c4)N2?b?$}$3J0;3Bay;Auk0_=+z(mc{ec0$(f;G>
z8FOWA$zPh*N^<UReOcGecXeE4%1T{)4(J>VKA&op+<<cMMr18fUQ7nf=m5God7OKy
zQ>rP;uoXYqQKSqxm3;aPK`b7)bct2un5Vk6?^A#n^^cD)h@^O99QAb_G9NWU9&i<{
z0Oq9_%haxq_~$v-ysOH7GEYv5?w)q+c6&ckmq+mQ9`$hLaTEBg;ER`cn{P9VWd<a@
zgFEnt#v(1g0W|)`$?vv3<@kQ-T^#X<rL(z-H-TC)R(Y{<m8NQjNU@Jh!}jUX-%Dw)
zhxG*v9$A!h-RE%rbR0tU?b~kiQi3!DE7EG|u6!bm%tO!n?$zPxl{zt@%2*H<bf=B9
z5PCIMQBM^-o0PP33V<{EHGl|985M1`?TWvdQn!#l!2Y$OvAu|QdP{nywEjYVIV}$#
z3|z`Q=mX!qmb&LgYyGXTZntY~PlWQpFG4CG2`xWhjq&_e&ectFH$|W5uv``tmrxWk
z?COKDm0J+-VTa?X{0Ko6I6tB+h4lHf?6hp-vYGTR1G-~jG~@Wx(ieh0q!?x(oBLN!
z%RqLawuf)jt%KR7DIs|ybClD%Pi!t{$ZKd_B5MDGG2yA3Uiz|+AhY6&c#^;+Nar8Q
zQq}HOyfiMbOxi0$hkj!<S%sCk+#8oBx+Gza(*;26KmI9E^Ai_WqlfFIw2xbiL<zRK
zhucMp*JWh8)K<u2e7-X74TGxrM*pg5RW+?29~ZH8Q|>k2mU>JS)P>idem}ZeiSUHw
zk8@A8HbBM?eEsArW&l+iRs1oPF#75BV$?sCs{U$3G19;D-D8<T%eAW-Uozh;FS#}{
zS&88El_&*nB0(1tMOxAHx&=@FCF+!Z?Wr+ROwF;n@QCw5gz7i$0#Y{V+{M3QUv1Hh
zfF4jS7HD%0MuYJAD=8o7tV&OjP<dTK0m(oU{+v)qDkODLt@(X6!ao#7C$CDp_@|(j
z&c%oifiJBYuRE5i12z3&1SG1wt`spB0!Pwc9T{7yA24LW+iaufpDjLBz5qn3HkbcO
zRQ*Gw>VfP+UC*aRJRoZ5^BeaC^SNa?5DiWQ3qW7A{6fKo-Su0L!LZLSTP$s|J50m!
z=(^o+Mx(?2UJfI$AIz-my{eO`zns}u<pvYy1raTVgaV9Fw;MLbDkH{=Z9_(jqkC~!
zLxqo(Gx3gq(q9Fkzk+Jn9LsG@zTZ<23dk%hchFQ;L><~Iaicb#LZEd&``z~LHTq9%
zpA*@1NiU+2)oi+v;@Bbg745_<G;lT0IaIhm6c+akC?(1T43+#ka!iB@v;vAjq%SWB
z1)jwuv?~0wN=h^%J3k?c5zFxRGP^!j35c`N&Qkx(I5$iE=~u?N|1K1#GI`}C5py-R
zJYV|!NBZkJFw!jsKoW`mPBuolJ4`$86TY1nv@%2=^H&883{l8rR0KA(PcVJLO9);c
z%MzoSI3$pz57{97_=jfNiz*l}YrfG-{?Ax3zRSJSrizkNiKxnbQJnbCA#(Vuf_CeX
z@IN%`&Z}fcUGK5f?Rrsd`(j7=A|rk4rCfX%o)S=w%E5Hl<&^wwM7*##BN$}<cbvY!
zgh7Nac#ZD7=x#h~jGW>hpI<nmBaE&v`Z(Y*pm+DL`S*e9lgg9p?PFg6eWYwaX^fy>
z<od?qAG&6I7i>Zw{>EdM^GdGV`i8tGl`X2*GfeMaj*E!Fhq2$3gS>!zf@wapl2iQU
z4c9cWuHn&S)i&qZRk*2zEnn&YCh~QzHlMX)zC@S~;r$U0wp9-Yby|fEl#_}vhFC)p
zf{H5G@bZOw=FtvM1;sjfEJ1%&-Pq}WQ1E-b50&HiV=Z5yaygx_0n5W^U?a;K1=Ij}
zJw15oUAR60&_N=7*(iC04cygDLjQRgTVEb>OFRBvpU!g_BM2K~of!XDWlRo|i(9Pg
z`AOh$<1fN1|5del3b&3*;EJJ7gboS<+|6LGGl$cuGYQTDY#hFIaOkQl97w;qwPcyx
z_(rMO5Rhyd8O@Fcnguk-RsNGoD4_O7?(vx&^DTU|!uszC<NoWtK&#+mxI-(JxAi#$
z{l^ts-m@Ckw3IKienr{vrU2#GYgthQ`Rp}bve1eWuUm+Jh<%5qV5eldOZfsGw_BD?
z*1H;dh{6lv0tc%F>aN62kL5;9JOTfEtN`Iat_$mV8e0)Y#Rdg`7xKfczXRq^TYK?e
zYEXC;U>A5%U6P8uAko*rp!8i6H^R=JnC2x;_lrvz8;*XybUu;Si%UD=V;-=g|FJ-r
zOtxPK2)vEpe+x*x9Y6b@>ar*PPL0az<HWyHqwE?`li|}hvj3VI*bfhXS78M&NM0Mh
z`fT=RY0p)&StHKRz>LEh7NE-sG=Q1M-lLj=uf)3*;44R(Z3mSFTF3g~<G8<P0FzmH
z3BP+FfO*$3NyH{%#~G8xz5n<a`WE5K<d+{#aRmdTF0XkLsoKiNJ_Yo=$54Vmt7rO}
zOs|5LCuG<y7nASa9sUxzz7gJ%xxSIolKF*AM^@*8ETECs04tfn=CzPZ*UJ(A+yeAu
zzZLc=IUzcdg1_fR&E42c{Dr+$ethmcmcI4r-xUNbWOUf~Wh<cKRzG7Svc#MK;syB=
zNiBx*E!+C>rx;ugK9ZnGD25yhDr7Q2J6Wi9eLR%^p^S#12flTLx*kyYfw;1LLM+t?
zN`&)Nf5jRDvDANe@KwqzmC&WzT-hXjfAR<pou{^1PQ0lt(28um`Hr{%j6+lzpj-qt
zqerT9yb$KKBNs*(iQc&(@q!IW@5%NFcrjpi<a57M)pN&=EO+)t?(w)q16}D|*=#@%
zt~UNyA6twEuCnSYi4<>ilME(`J83PHEF~IV1pk$feB7agrBKQt>C};c-tmeo!WS*|
zQmqjS$k<vmctvVzH9JcH!ASq)Awj7-7)`-(HBlJ!J6BVf_gB1<@Tb>LxZ}!XNC@w(
zwGgE{5xIA!5g9}a2ES_>M$8txmoAED%J=ZFc~<QEFMwFLqZ_BS)!*8!&!%9v;PudL
z)QRLqrVr?7Ip)ZkZS{8oj_YCIx$_q;QeC_AKR;B|1?D*JtnQ35{C|J@*G<?3%(hDK
z|5@N+VB7YE(5hLQT>|xgJm;Tf%+D*QT>H<*|LakAU-2cJ|37L5ZoRumYa{+&^<KLZ
z8<?Yc`G0HXKc90$6xsV<Z}2ei;e}9f*8ge?)wQQ>I`=64_t*W$bEt2kt^d`q|15O}
zXguxzYyAJ~`Tx77jSnE~dv?~lTC@IdRo|@)N*Gh;VYl`bYWC}l*DgK2uA_UMhOF<H
zZRzsCvIE@_ef1z`Lgk0Zka=YX!|fi17j2=$pGARJudUxPql%4PCLcMb56lhB!4pjI
z8AGe$jn((7@6S)BStHUt?(x3j;Z!<z;acFii+9eQr+WAwKV~N}^eFKaW3|tXhW+<l
z;2$ff?;vq^{<Fw`ly2h+)akPNKOXr%_ao0eVvRZfUse9|zR(3K8~Mxse@*&ZDHTxZ
z&HsBVeOStUjq2i?*>nfL?|?eCWPrvt<^S~SjeCJQNurPB{@vSm%&6~tD40jz$u5{r
z73KPO_X_|Wt6#N1^{-)hN6ULn>n6=x;f|t=!w!1h==Y6DhYVJM|L!4c_VXcCB_?|J
zF8;HkPXQN6k40Tlj+zd2)n}ucEt8K-RaXp?8m@cT{kw`cf<T$627LeRe^wH^c##wW
zes1fYVfhI|n+5Npofi%yus8Pg=abO=lJ5U5cSk4V;x+V_1d#yce+_1==LP3QjR$YD
zHY#PM3FVP!>+N`P<BBTNq%!KBF9+ud#h*;2P#5#llgVn(EK|Wy#B30o{mdQ1R7rH4
z!84EiXM3iT_KouE-vTlN6uCp}oudzeP9}C{ock63{e};-Z~g5OZqtU)f6c@@^%tX#
z3z}1{-j;Qz37y|8&idL@=Yh8FY7(Dpx+E!7UwjSW;<d5-6ve)0J)g0+9B8)jR6*l^
zwfB}`QFdL}uwnuhA|N0k(hQ(O2`Y`!-9rfs9nt~<q997gFfgQa57HefIYTI21Ck>x
zE&XnuTkiY0kN5fhf8TL@Kl~xr%$|MiSbOcY&U2m0PC@XetUOiY?Ou0|6D<k<o|)8p
zua(JZSgcO>Lby1=(<{AqV^7*|;9`&dFcE|4L&4ranso)bV-j^|W#Vl&(ltsR4`-^N
zd2^HRZ4o&!atruJVR~RO(Lpxs*V^_%&gvA67f-?9Iva<UI$NBaQOz83i8^_+I$^j)
z=|c1_GDAoB4X8|U?sRljWzM8PqBpAqPIm?g;cYQ_jyRLfPJGsdjP<Tk&UIXZEQ#4p
z`Gp?a7@?jruX<kVH&o;#j#o9b%g}oD$93wN$K_IHUEB^U)jM6gj;cFC#n$n%pF6Z8
zQF<ITVTmnw{@y&kj5kGD<rw6v-~898-p{O~dfqXUcf=kwm}L{u&Qm@lz}eOvk>p8%
zNzo_b#6D;$nn6phd%~)7$8>9qQJeZj2!v*3EA2=|Xo9;mjpe|@?xOo@4jr7~Rbf#g
z>>hr9TK`y1D$1I-taN7Mk3C6eJ9{s(%IRLD*MZlE+D(}cHl=z8yfhPaNq0)@Q+V^u
zcQ+!SfsOAJ&Qc!R7S)Q_Mm<^CL&`0=2T-(;=o7zbg4S6`LZi(4Bq<@MBSt9(hVUNp
zgP8bV>(h$jY~jPq5^iqp3K1nG)(Dy7yiW{^11X|=+t~pZbjTmmT0P&M>r;Swx%!_d
zaxJtmJ)@AevqK+#XUi2eJ8AxNABy0#c}q#qd<gm5l+!`{K^GwJUqWV$or%~9nvL;?
zr@ETpx2@=(aOT}pbtQ>4)gi8bTqND6`KkAsyJP>Fe{rYg5jyrge7J18<KmyqcMa^R
zp66t@&z=4Z|Jgz&ltbBpiB3-N?HV0q0pa@<W5FM>d&MT$$JuZ;Uw15KCTER$Ssx1H
z?~GVfL~|_bUc9s?z<_EmxpkrUbV5JA1N)}`{tLTHzRt`axzkNrL!&|6ByF?qB+jc;
zyx{=S(RP7CkA8WiOb(yI!+%+np7^pKY5NLgosMSV_4g}g?!$yzAEb~M7HKSrsA_Cx
zJgJv)4=U^s_XKvtAVE#Ri>G^(Q4x%c!@JG!x%12lag0EN%&tv^-+o;0-8CAjbr0Jr
zWnEo%mPF^sU}}LbH;jG5VR^!<_4fKf)|2%S&g!eoFq~{HI~yv%4r#AmQKuhF7@_|T
z`!4+T^5fsD47=WTAF|=Y1?GLxw(-U~$meoxFYf+zyiiJkUrs{?eQuHX0W=k2sO>86
zn)Yrlk7CEFoFohiIVos8e%`H`i?bG2tN?;xQ1h-k!=Q$>_`u}Jy!yVpTqy;$EyPn*
zHst5azpJ-uW`wDm!6L7&1WA)$pRloTnuwPwhwEf5Z_I3$5HWFccVGKuKgLz(&fkF&
zJY5LkRN&aknM^{|ECl)Ko@IK35)qEV+2`&_um*)5JP)8@j$%=|2HOR!nQ)V^C;T=v
zTqjHPee`P>D-Q#T2(A>ujSTaFl$k_c6)d^Cf-HK|nYy>|&V6u^dMOtEY$@fz0#PFF
zz6PTND>k*+jQy{H_q_!+mE0NuqvJkMJHh^%{7O3irDB<wyO#cNe`lu-`N97({CmL&
zsNG9{lGTIl0(G3IlRB=a9q@mx#n|gq#<;&3z`5QOz_h)BtVkY>Z9FUz?d++h`r-2v
z>oZ*Q{MwQ}eZaC#YdM5RoDxg`*W=Sw)^{JAB~%xaI!0*#jQZ}h43i_BU$Nv*xZNo2
z6OT54(<XN%0I8nb&BZ}(n?!ZJ1dx&eW#|;@D^~h)q8{)4O#5pUsLC}eF{;TGM=#3G
zj^G2~CJv%qi~XV=uAI`#qE((FH)1z|o!~8!UZ9w3J4Zn-yTQC0N}Ng3;r!_-uUxz@
z&y7<<3VnA*T&D%1(eKNE(11^Ay^%uEMd!jR#vFqHd0$_HyHa+pGd>1cV_3i0BX_re
zzQ%2p3uppGTa(`bvobH<$bmprnjTYWF{qg#Wh<^-aNKHd0#&-UWMdp2KQ5Qf?B<G)
zaP5wf3*)>TsAYB@8kL2OrMz^ye^C<j)_%~C0$w=g7E4Q{z(9{}1&%r3j^q0~9zRo1
zB|;=m1C`0oew&CP!K6-?KL2`gexM-!V0+ZQ{wffDWnNf`51j}9qc{xRXYzxJup`9i
zx6aoxpd6|a%08;w`4kM%{`f^4FP&#rl|u))C(S`1rxlI8+Fel6%3ErfvNXU<N6}HL
zd-vkGzmB*z8v;shL=Jr>ce}xJ$XM}D;;nBf5??ji-&=#_!AUBv<D5{csiG1QeEWeo
zvwSRlZ>B;NDE(rvJ?5lTwYQL$0ThJ4yQzQW<I7Ca1tqTj>6AFCh`Gkzx#-o7C+ZHc
z-3jAqb_<s<mwO@`VQK={{a*g|@#PKE7s)^L?}zZA+It-dt`MENHl<AAMdCUSeLJlA
z=2%kUZ?)ekljC-XQXoQ#D80pxZ?8py0+nCfh%UqHwN(u&U+p?p0n1`jF$Cx(3Ky?Z
znYL2O?l#^Q4Y~0v(6l9PDaJp;aWSu1H9YxV*cF>ETrqsbR48{++=Y!?mH`<VOVO2w
zdCEe|uQhbc(2Qw+yoq!=-{4yq_1{83Yxj*s?!!z?V}pneb=5o`1%sV@dGd}Mn2v>a
z-6WVV8}0A%ICV?IMUD@8-Plh$Wz4QuVV78UZy}J3BOM5@_tblN=BQ;U%6q-!SezqX
z=(6qs*b=IBd_|5#(v$PGC!<9zh}O>Rf<&2Y=W&?R>T<(LkL)xfmg=aBzN?m>Q5pZe
z)gEtpAP}F?y5jCQT%;W>^&!OS)XqxMhewE`MiIi1qH~E2$!*9SZi@)NVvq!bt<>!p
zaKCwvhuPPa^%WY57}r^_=Nr`N0tGvh22)UZ*sypy^pPwOtdv}h2u|nLBBtO%R5{@>
zZ!Qo^UWj_KJtU!9VYlpjQWqW5=zA{FY1OxW(|X^Ok>=~ta0wj9Z@Rj%vzOYAY6?03
z3=dvO6b=juT6SL?JJI-TH5&$2PEurn3zeL_+NaQZPG4X)-Ndl=Wl>+AR<}U~z!9*`
z71@tfs!;J>J`|6?0tm^O3fmi7049VjhGUoZf#OYhxkb8le0+T31B5e$I$7L=&+#F9
zScIb&sFOSU`rNf_N6xr6QHnw`<6b-ZS-C6n9?fK05Ak!NoEQ3;w0k3-(OL$!^CY|`
zg0Cp)=%8$dw3#WMl<Q#5G2{d*Y%l$UuOGyU%)aR@j}F=^%_r%h7Kp)`EvB(?b3cpY
z#RR>aNDY}))l>bR`TXr;w(Ka<B875|`$ZVXf*cV~DSb<AkwV#g=*~p&Fu%{-pS|^3
zbn8aj!xVYW_FxV;!+_Dsj|ukj9Brf}8>s#g=5rtcL|8tgD=dP8HyqeyW%cy6OhBIy
zX8pDgsxWchdlrgNNqg#^H-cxMOK_h<IRbHmRyZp4OEWOjHmg0^#z6u(?^C$@*>8CR
zB4`f~(6uMSKTc52Ty71a#`n3<)$Y#4htlr=!KF6PFm2DFeT=?qgdA5@6FC795z!b<
z(kq`kI@#x_>M_uGxI67&X&yo?fF$OsY&^<lrL-lgs2>Rk6a&k4Ynkg#)&r9kX)KbA
zJHGmPBj~VE2~nA4qwghJ3*!3#-jlpqH;}J$FYL*7Y(9{q0TS(O8~E<)?KtO;UV9m9
z)2*Ym2k3d8%!%XxT8}pJ&4UFCl(4mVg2TH*oN@#|tOtn68n<Q!@g{?0=I{~ivs`@L
ziCiMAZ?=b#45jgNi<y&W!huZNeSYgErglSlz%==wP%>#xDQ9WCT=e43RZefMo#5lb
z)vzwk`d1}p^}XF8I?UZ6=+Z!%Lkkv59K*qCVEogL7`6$`^QCl;Kb9rDe92=zRyO~m
zULeSH?%*cn3-$Ut^%Rec1~SXc(SHuo1%_}Hah>Ak0@Dw6{bdg$_6jUhmI^AyiP#=e
z78RA2_K_C`=UD^D+d{vbx@lnZ7kN&3MZsA_INEi^GuPr|!>QyIE3<)lAy>4Lnu+Pd
zWLgiR9f#pD7j#;F_w&Jl*h?O3E6#Pa^OjU}cY>f=m(U_)cdZpeQE5T7y@G=!d2Q<q
z1Jxl0&FdBQnMLlO`S8rwTV?!haSpC6!Ib6qZ_3j1c%k%KLG^4pr-d1-!-|crN00Cy
z?qq)hbMgzD5%{3`L1T!(`0ak4x%%Ub7z1|pAND1k{3}zzLYjB=@M}P<`%(z3ArDl&
zuCcwlP<CJKvr2NAc2r=3l|wZ!t?zC@a9?hV>*V|OmelVGrdFYIy!%p@jw%GOn}TNr
z3$@P85A)SZt0(fvT}rW;;JP{+ad-KvB56uKL3jG9+)Ty?sUBPWovI^5b-5G@R1@~@
z=)N8mZ~-HAdN$Ml67UTs!EC}uo0xb~<)ND2Ig#)<VlyE^IJ-2cL4qaE=+oywrVnVc
zr%IYw&X$RPm=#W0XyHICg96Uma`n}SmPkZDC=qdw1^~};QMyJs{@S%NoJs1zyc5aF
zhw3rP+nc>gquh{_QdHTn0EkwQq|05`tOat+(Qda7=E=_3bUj?YwYuKwxqwmQnSFoG
z%oa=KT>zCun1l+pP_~EPm6(aMMn`~hK|=7ogIuzl55!sIsqCyQR23anpC>NG3)q+A
z92Eq`QFkMTtB6cj!U9eAk|B5zRY)^Tl9u+HWE@|+!Z2g67;A64h!r7xU;B+twx6=5
zm|1_dW7S@ci>igc!mG(#@lh`k;82pctJCu&E8k)JC)8p<KzR>QRnUIZp=y($ZDzyy
zCg$esZ-7J^M#oO>sZdBKIu)zcit8{;fAc&7I4zQChpOa#$(1Zypl@s|2$JLyu4?+?
zI&IWX9mE7JAv|tZJ}unB^aaY|f}$eSMQ!`CRiM?mYr?^!8P&V*Zdz`+3vKnOB^Ko<
zqsgP%<*63CY3y&LKv2$Vy)mP49omQ-<?W3xoQ|W`uymJ=SCp<|Rt*C442UudO?s23
zt~WVMQTF1jc}<Sf8;kHYjA~VZA<cZP1Wjvh2WRAS4bAqTd#7vQ3u)W!l#atop}P`~
z4*H6Zt@sJy3mzGo>?x6UMBjiyPU{;c^}3fBwY!M<hrln>7$xBDiv?8d8!?Yy*++dn
zmV2A?cX8ysDy+R#+5WxXpV2ML=T!rjO9q**01>YW5sGSieGX^(nN!t0AYUY)V#JE$
z0eQ65at_z`@62SPd|k=RE>~TN9joU&d|Z0_JI~8kgRRt=lIXTL(7E#{bwFmdZYQZ0
z3~YJL`be3zt$<}2!IOpTG#jlSA4Bz6*sp=RQ(w9G_utlgHP3Jod~;JkVT^$aTc}^-
zS_~vQhLEmy0#+_CFQ9j|)U70P$k-V#P=S->BZo0Y7`n4d;C_foIUi>C&x1P)w@^3G
zNO)q|on>9k=WXHbV~wUG6LG0)@ls<*V~&vt<MMZOSl#0j=GwX1E5+LT;OfGJ?B3?K
z+w4=;JiRh=;W1V<^IKTKfVuXfeX^lrLbx7x=R_EDp-nT%sZV<27fUz^@Eme4S{Gyd
zgBcN)Mr+_AQeG_Pcke2ij_bE4uehuq%&#t=`ivjZ545K6c&yCxM?sUuxqeU=!TuOa
z7m_vR5M27Ax#Z>5t(V<p-GIGwp{fK`pQ>ZH5otXV`&cg+s>U*|mppl0_;;hFfxbAZ
z1t&D=N1CwT<oN=eU8C_=n?{ABMsi+n;M^vLB?f5j1GR)(TfgeKl2**+E~Hu*5APOf
zo>g?~>s!^#PG3m}T6|k&Kb^Z}OoqG;)>`kH@K_yth=icB2J9C?tzN!d_3Bj+@OPfq
zpwJ|v<U2A3-zmUoOI65wPYNvBNJ7h)d%M+01L5nzuM@l^y##Y%&sneVsU}&aEFtby
zAS*<4ZM)0pMYP6!a!Yuvw6}I7A>zX$4VamN>soC-<~HFO92L^NExW~wT`urKeQJ!#
zCH}Ic9HUaThF!Tit|3#3m4TG{rHZVE=n2@gru6sBz(j$tmGA1hwlKc(gcUO(P(Z4t
z5Xre9z52G|TD{KAt|K1Y%^Z<&)&SS`h_lZqMjEuX-111Uo8+j2IvE0n>c69d7YQsm
z5te#TvUXm9_Jau9E^8-R8P=d^1;(Io3%^^dPx=Gdbc^sgSxLoi?>4tnY9`BUM+aa_
zo@nuKT@Q$1y&kWoF7J*aQaQ7z(PMjw4bag_IF(*q`pI_ZiHGyIE}yyeXe|TE=%G}T
zLD5~ScBo}fdNyQ*cTVT{=&-XO;c?v7)vd#zXRJZn!{0m>2Q-$JGT&;DtO38=v8BNJ
zj%A{T=`ZH8^QsOVP5pt4ExDg^YHV}Ei@gs$U^i6qn64h!N9sayhEyu-^wkjk?%)EN
zV9rIgV<`~4a07F+KXHs9d3Hx-*8N-A29f<9&9~Jz0#*J{vckS*UcDX~jpMCCpW$P+
z=dSoG8iqd1Rmu7VS>zg44+I^iB(qRQkngMIfnF=-um)l)%fV02e^zQJvRHb26p<LC
zBTZiF5|D%JU|;L`c-$LK)AyErmJB9+WTPTV#;_oY&YP`RFrm-Mx@vMNSLACd8IVdd
zjlSY(<shA@|40DgS!m4>qHjDFWe<stX+?h;UFyq32Uq*VurF&Baz;;IR43}8NGLDR
z>&r3@Fmao0H!O^fr_(c{SS~hs;_je*X=gV5&hhVOIb+8I9@u5*GrM`%bCstF#pxe2
zNdGc}q6LiMNO4rMsF@~9Ur==wy2^5uOKwJ6;QF_8^2_sx9u3ysm?}`DVaWTrZEt3X
z4e*?~>VF%5r<i{+KLE2Y^H;H_A?0p|t$=c_G`O`4^^Qv5-<vkQCmGKb!+#)x3mKBt
zhCW`G&N6iA@A<JCVUV!Jw7=0U;x;lb2JU*xfpgws*K&XDv|kk%qX%ARvQtiadXsCn
z>R`bOHblI&!ezMCRi}Opt>G05e}Dh-kJ%2r44oP%KgS^TorhPG=-6FW$Mx&M^-wt`
z(ebKL;gmx5j90z<lVuoZd|zanHU-LhI3bUC3aA_WlvfdCU9?aGj<QZJM}A=F+e_D7
zt2e#1bjxkn*n6ycR`-Em;p~!X-h`Y!4_VEozfQC1VSS}f=rM2(qrjQnJ8yV>OdM79
zk>Do~XSXJvWdCyg&cplZTZ8&;ICv|8O;7p<FQ2kE{PRtuN(i@c_tu1wszA@ZL|&Q2
z#dkM%cX!J_rc)>Cx#3*O!!yyz5&X0F57Vtzz}d^lD?ZHE9o@EG#_*Nf27tgaxWXG8
z<;s-#e|3--9~*>Z9RC>Zg4Q1?KeMdS|CFH*K2L0d#PX!YJUaaOd7G0c!@>!bucNhq
z@SINRjIC3-cm*}Bm%Q1tqS|2ht2#KjT6cx2sx7Ct$m@yw<ajQ_(5Ea4j3-@T(PE+-
zh9COTo+C@4_!<(;9z&f3W8o~n>Hh1BY|6=@%LnTAwWlil35NUXiZ<@0@fAdFMc(-I
z>5>;Dh5aL)wH7A3Wx+N%--$*-hzZNY`Cct`qZESqqSzhCa%;_7^Zx2<rkfh`t$`%B
ziVEP9DjA97+T1xLqq>hc_R9Ok<sihP<2Nzl<^9%^l?$&5a7V93VW~1h<s*e#P{WJ@
zc*?CJoI5^I>*RaJqKzK&p+iStVP^LT$88n#{9Jt_o#2fA`tB;RHg}6g^(Vie_tRUR
znexw&a<HLo<V%y>cb%R)D>UVFa#z4dw(7lXhKreun#<PfkOlt8_>8aE;@3p1Z?$`V
zuT3Xz@4foXgq`Kj4xQLA8F5d3tK1#D?-tCYhniDdIdnH6v^^`A?SfwP1;|;rQS+HA
zxmhfSdt1bDZ!6x+D$eT-CSMxxfxOHc!tZS`_C}$Ty*E8go0*8Ur@R|)N}fZuQ9hhb
z((om<gOO?1=0ZN%nYhb})X*F^yx#5W)24mp{=uo6gqy1fFY=>&BC*(eup9klrsvU|
z;Gp4=kyP}eT4tdedhr#y*3-bK9iy5xUW$_PJ-65CyimJ6DT^OjNL_EFWjXwz7yqkS
z2p{)6^^j7L*|5C2*hg*k*O7?emhka&iD+;6I!Q+_yUpG2c<E#oFZAYa4_-c5U}Fis
z=k|W>G`phAbG`?Y+CdZ4;o)#oF1Gl1$8f_Usv^u{R0`I8b8*Q*3f3UBn2{!h(sl83
zB<}gGw6H+VPUHQ1()BU@j?2~D0^j<tOfG7=l`m3m-MaN#v)AZ{l@}R1ld(!BIs4>Z
zsA)#JNss8Xm6vg3i&mg1S*9kd)$UYGpW|wNN!NPK3?e53$5}Bpm9Qx0qKmMUXSJty
zb#f|{3So1@gZpAM2xkuI&)i|brY;3?pu=0~e8vEiM6~tA;nv{j*_r;Sta9c;KGej<
ztq%$hgP^?wHN6E}#f#Qt#vhzrf4nk5-NuB#_WMJ`;`pr1?4H*MS92<ik;9Q~Oxz6z
z#rAi^TyVU06;^fI;9|R1{oWIwvtvI}n&WiLlJruXt8P<uUvK~WOSqLSDx`g{q$LSC
z2P&cVi5^*LxOTl|Qnl0fUaQWGq_C+(@ZRbUHDK-z+vTx5M1_i1-HBWLKJ(}1czYDp
zDiFibHLiG6YWyM5dAM6~gXFCn;&`+Ms;SKwRNPy5ph3>bT|P?pz3#)9V0J-ojNtFx
z9R<fp1u~?yLi`N2GRuuGW+u)P-(GrLP|>aQs2Zi`<ZX?QqupE(!3HX6GE+S(NH1kj
z9DYxo|G+ixPFl;;M{`p;t~HOX_q*B)T?wm#%$4yEk`Ou-t0KlBGrC0sPxaM|e9X7Z
zOGi`XYn*)sO=>Un{|S2E$d)?aBg^V^eAeW!&?h`dzSKI^j%~psr~N?1E}8LH80?h<
z>moJM^x@nBdJ_b6-q{qcHACdGJ}xf2A(OoUCF7LKpx=S0*{!P+!GWZDBp~MwUTGE>
zq_EjxCR!lMgr`Kpo0&_@G-_Y|?pM(o1ktwN`i>aq05Ke{J26*{m6(M!w=IXOdNQ(w
zpjUL>n@tC}dwGtlwLjgs)iS5@1F27{kvA2^^AAVnWv3MV?&#Jba|3Z#7MMK^?6qCt
z>zSRBd%7v|K3sX<?0P`l^NaT-=iYFT8W=#MA2f^^*TPsmfB0TnO5{{%SQ$I?6f^la
z&lT-G585R^?21drCknYhv!-wf;{J|gHeZ(?F7S4JI#<#Xx7d0a&hDJFq3lonBb%CC
zs>xKTds!8=R8QC7!ZPex@k_+*E3TIlQ6<IZmjB62VX<u}B9U?8W&*E2DQ1pq41(9&
ziPu;1&%d5D54pOCAI6XSbXE8j8*+Y@?@g!Rq`-QR$<98C(ro`_&Tbr^Q!@t(b9Ij6
z(pH6-U&(zrcWKl1u2P-O<hZ+IVZrQP5c_nF!k$&Z*xoOK8eF|T73QAA$RjVt{T~UF
zWGjhj7iUL{SV%CD3b99jvhZaAq9d2#D>0!jrJ(x!A}R82oSxt!k)WYLoK$4eDuj=?
zHf91c3x=${w@p*>1D&rP_(4~(r4zdTq$;J}?EcU)zaFFg$;g$TKgSc*3$VfPV8a?^
zu{NB`^@l&sc)H2Cq4s}gr-eomk}_8Y<pNES1ZDD&PZV|`QA}W)=YtBMf}iK#{_qnl
z8Z)weAeB5Z67I}-Qb)u*x3J-;I>DiZvdg{n()emQiOSe=8X3m<nI37fvj3x<ZcjI#
zIc+ILQjuREfOYGzKK53D@?80OViwRaPe_JYq@f;f!|I~Q(c1OzVFK^s=2=LcN?N?d
zhuyEonB_|ik89pPXtkG<KSRWXAhRcIbD%gjh1t!=8G38V&AWXm-(C+O#Td}m=q0^M
z6R%yU*ShEaD--kb&A2&!oP`3jpRD;_o_l;y%+*q>8(nPNPcFFDBO6p6W-!!AGCKa-
z$p5jBRgV7Za;uQcaXh}wa8V8(Z{{+C^Ko&tbLb`|o_*U+=4I$*$02w)WSd~!{`dt9
zQRmDjt^*zJq4?`M^^yOkG&MM$qnH>X=Lz-*;a0mJXPM`*pL9hf<DtNDJJYwYa@%$R
z1Zu)(-&W`|kUtxViBGGrf3gF*{%TEX)T*_xo=pvV12+#<m(5V#216x{?~3NW>TS|T
zv(Y!A7*&m42=cBpZ8nYs1-4l9$OOUd{Oig9e#bbuZSU#G78FF9;%`Vg^5qex$opD-
zdP&Cll`uM`F)u#pVpyS8;S>{(dYwGipv$+{o6PgwSG??|WZFRhV5^rVT?D!I(tp9i
zAIia%dgb>0#`@@qo%Z18{ka<Duxvrl$4z&&&;8Ut4M($U3dyc_jng-7M&!6ZOtEQf
zQytc3SZ^YO$$a$?WJ^pPU0=cqSOa1?6N2si@vHi$c0M*Kos8YZ%$~>X`tZCKcgN8*
z;+Zt=e3~2iye~zq1=oJb#!O9iLn7Un3tUH>%L$ePWQmc{Lkuwn4W7!>g84OMB*&}i
z;wU1sxOe)aiXKZ^Yy0yUK(0OR8ln%Op2hl^yG6rj<GAURVCI9pYkbzalW{9{#{>5g
zP4|&UcW*AeBRnX1t|od>xLk7qh7)n26xShOwIuqJ?|*&s)6okB_u?j?(j+5w#^;G5
zqt04KLcP2Qk}Os&bEn7;>co~i_C$D@Lti!B=m^Ott{M<0{mG5yeSDgZy_+2&T%*PM
zgPxc*9&H~gaiLcr@hYA0V;i~;=Qk?O(>qa5=(U=)P_kFJ&N`3i64*8EVHj0=%C5VJ
za8@)`vg<Pz*GIhB4VX@+zTromXHarJj(wW%!Z`iPczx>CIs3id*GrhzQ6*kHGMnU+
zA4#u<=By^9ik`VT!vA7tr~ngBYy%m~eG8lK`O!HhI(IH9e5UD`aICvhJttf=^-*xA
z)DOCo@o_quLrZ9DGYP3o?u<*YXmsGHH)`vY>k{5ydOfRZm1}NlN07Uyr*Pi~S8If;
zcJU3OMPHsf#(v5D{DYKmomL4(8f&oea-_Alg{H&jXPdvqisu)2!^5*{mqhMQ)O%0A
z-AIJm-#-ot(6l@MBS|TJx<Xi&%y|_?3;QuPog4=FR9G;sJa>MNj@KqhKXXUGt3jyV
zSnah468R9mpD27Ud*bD7f9tgFkc%6Ge>p*y=aM5tm~Zp`waMr?FQ@xUp_0jBx5P=b
z))(cb`?a|_6nz#JW<x2b^)5U7DEBM&D-I@{E3|vGK#Rynyl;*O{oMK8Uf!D={=F%r
zr_yY4Y+Th+Wg8R)Zv%0bRRR4h`M3VbPF;fARfBs?IWt1aSV}o(=V<jOk2gAaW<lsQ
z+hcMy5~RMy$IpD$zZ<dDNgf3KDlx5)!!bc&`09CJYS)%I_9Ut4)Pc^n4}TMgk(l<N
zlzUX>(Wh`5<V9}mSVUT?m@VI71G2mYPsnLTcP4!3wkmnaV@FdTkded3Kj*^J?4*CV
z+<o$^@tkemGy6k%!HT1WqJZ2g@39A%6<U4v2FT5-qs^zq&uWOQ)73jUa1adQ?W3Rd
zNn!4#QMC`e{ew}TWR>!?5mlVEyiZY{q-Scx-urZ|_KFLY<}B(ZZXbG7nGHSOuaznx
zpxiH1gicq4Kz|?wU55*_mgt|+_3>Iv`$}xvGVB-(YBGCQJ$)yv`kZiZ<2AEmYrk!x
zca+z!X}S!@W7uLw6dCPuveze8Iex>vw|_x7`h*DP=?5t}?st+ZWO7^IC0)i?u9o|K
zNzMPVuC%-7b;m;Zl3l2`?I8ryH}bU*U1KxV^g-Ay4<efZ998kE)&;kN<l}=Z$4>(h
zhBR)&QWW~P)F)P(JW{TWhE2F#4JyuMWKoE_^}ea6j(=|GrhlF*GKI-%*231{#^z(M
zt$r=SZe|oYTr;8c;~JB(do+6xRODlcc{h6fK&trT)*_2OMqCGx1D`sV#sNgo_iWV4
zbZPxdWTAt>aKv0@e)WblIo#uzV-<zhw$OLQ*EV`_LtMM+$l-2}%i5}3Cpn#_lUf5^
z;EEy`lXgr`<9mvjhwu#~;-S~hLpP*;eYd5^2wVV0Zt-q5o>s2RbfXXdloPWl*n=ko
zg<W<Bc&`1q<D1=-CJus<CU<zaQ<M$KGFE}od&}5h6AXea^ul#=_}Zn7u+~(Yt^`4n
z0!`<gmKQZ-nLVkHp1Li{jTXqlP*K{!HmunWK1b<{kI0vW#4uY9<fBXur|qmm`Di0s
ze4JPym@(crVg1GO$vkB*f|+wPqGpds75YojX^+IWe}0#MfTKE#X$b>zWAh2Eo;Sjz
zP%Xc#hdw=zhIzP!I>RhAbMB<j(|~3qAnfeLZnL}tuRv0&)J@N2upMEt*v;sf9k=+5
z6XQ&wafsquX<%9(xfMaHPc%C<zNIFV;atk9MxQr`9QnM3#jro5?KR<`6zLavI=r8Z
zj`U2{vvJDTishgaZiv4%(@L?w9C_EtbZ#lc)$sawW!hsNkE(;mZfUoPdG_CIg*|$4
zY<=Ao5l{PDVvd`uoIA|ZOv`elau0GLdG|${e4+~E@EVDrYcj!i8t#qtbw&XJtxbFR
z4Y$np&e---*ZB2oZeQnbJHceJ$<cE8(?O<Xrefb3?oS^z2_-G$8&Vr1Y{zQ_r*x$}
z>{Q_@<$xtEnm(kz2jPO1Lw-Iea!n6@Xf7vu#cEo3O?Tn<lU0d#R~!V2!g%^qJ4O`v
zAl%r_QjFd-r*@IC6#d9cZ4_;u4M>fi4XK;;_U?1!&}rXK*xT9%>DEiQiM=qQ1}j%o
zO8}2a|7|Cqqh0g1>PfD?QYlo~s8!?0=Do3Sf|X=Kw+Sz|q3U^Wl>!W~0M18NXE!^Q
zfUP)3XNcEkWg1;z9XSdnQ?J%R%>SmNEbA-kaSZFVR>?#ft}O06X?SRdzGrASx9PIO
z6O{1Vl-Ue5xpy>Eruf7yK8fPs)=r(m1W2LU^`*)u-}6e^tXgkjmD^dpIQ?foi_&{t
zX6zPu;44U(B5&yUrS7tn6S1wm0WvZ%?{bV{4*z91W^{3TwgL?j-z6X;sqNAu!{YD7
zoXZh=9Q(lJ%eWT42qcd*DJ#hA*^D2Fq+p#*mt}7k)lGmKhCkFz*`>i;0=t>PHe#wX
za-k1*UvCdk;qO6{1f9$(xq9~E0xPKUCpvpa68UmWLZ7n2N-b2r-TrcTWqUj8&0xMx
z$*b0UuCkQ#S#jhTbmbJ0XDEpIB(Ba~Uhtkb2r#Xz+Y`@85wB3r6iMEy$w3$AX%$}E
ztjZII?0Z>So!hIqkSR@|P>g;y?UA#iyQZb{<Fz*rjTk1lp95iu6Z?8}Id^BzFOYtJ
z`~mlYlN^15_007W0l~v;SVk58lG?yULL)l|#kV{09^Ub!FI&Ugs)V`OBj-2Lx+8>@
z_VngAGUA_R-_Pr&A^d}DID1)Aj-FGGn?)%JvH;C#_aKQ((fqV78CAW@#6#oQcGsBD
zqkRcFSq}nZ4=Dxg^xC}lfYkz#DXq4}6s~M*@fz3VTs_4mKBY%Nty`+2G)^54Qtfmn
zBjLLY3peLzE8ro_RDDN4I-77%9g-s7=Yr*yB2u;g@N#{~B&;12uAuEZ05!uSz(2wK
z{WSiUfI{8up>oa2TIY*2h{L|Y94I~wp<)_Pd?^O%BhDh<TcbBLVl)ehWf>N!KSY%+
zW@sa|#Z35E29EbGT~HI4T^S49Vg~p7+L|`O6HTwC;!20E!)wkVTnz_~4RT`eh2ku`
zoVZQ*vL@mj!-iby*sXJ#<s(*kpB7K51)jhT-t2Yzk>ZraahyJT^I0D!byLyHin;MA
zKjU_pIJ}dz2@n$*?C|fE2JHB{?GZUdhRoZGSBnKqiX`u=P-yLR@8zMZF-MB1>bRZN
ziHVgonJ8xC4~oXkyomqY8B@hJ`lE*vt$MZ`zxWaM)VSH>xA!)h_O9P3a<wAEnTq1G
zABT))bZHGf!(pI&^Kn+H6>?Ab(J>3&yT3d$)^V$Xjs}GndrGXuFqyGvbj-!JnZiL#
z=XI|8S+2r=d9G$+a4Bl+Y#)bDM8iOg(CkU9`0KVk#1=LfEi#B`ljpd9d?^`SG;o(b
z?3yL_zH`pPNPdXtRx*=RJSM?=)2Jt?Mh+a#VsLZ)o%jw|rC_!^j<3ee_Le%bBT8l>
zrcI7C$aHo4Y}KCMtNs1wdfZz(3Dt&H>qlL3bGLsIp8{u=7{bZLQ4B8N{;yM$p2!*<
ziap5<xOJpVaWFBY|J0r$!_;y|rOah;qfT<~ytX5K-YFFj`7bSd&_hNB1WH(4a(TEU
zOZ)gOr_aG!KrH}5&8ZH(0tF^|K-!bt<s>=nzFan#i|{0Nu8_yURSeH(Dkf5CKIF6I
zvx_4V9Y?h7Wva54<P)ZiG`oWH#8`)7gj)p(D8p~i41qG<YrmY`l*v|4E}Y+o9H=&)
z8m{nZqE-Saxh!qiL?Sr#;+-qabYL=t26a<Zfq@b1vQMK@Nid~!WPaUGcJwB=wjSB*
zGzd0`Z0={hSpwPFCD;TkTO<lHi2FDd2M{~A2JswmxDPI9cA`~KutaRSvy}86!V+za
z@>YlRmH|ZDP4}ZHz2Q1r-zzJl^l&vfw-ou$dM`KbJW`DHonb-Dmx<)xejbAp)*8sq
zyM>jfw)d9YVRpoSEFU-CKPZ2O$38PuZ_&3ItyVUum<o6AZ5u>l@>bE8*^f4(xm2}T
zSh67~mYq5sMjm`j+l7D_>~l|YX%Lk-F~Uz#<K2gDX3$k7!&C5%>D{x7Vg04j1K2l5
z0wsq<k^!Z+)vB*EL@s7bQd*<eybe?u(C#D2o*{=VGZl*&lmYPPlaJ}VZAsbWnzo=3
z`?>>0W*!>rKt5Xw`>G&j`E|?iy4;8SLg<y&FU71IH5vMvdU|)t3%2uW0^Z3Y>B)cz
z9vUmc@*+d3KkxNB#aPnV;<+{+4Xm1FGUKEM>=nNwEDy>pq6RgfdNn7}J2&~g5)AdU
z(*Ev`x7P{wJQ@39ITxE6L4l4}_LO0Z8Rdl00P;b}d(C<ylwD(MAI;S(MAz`ZI=EPR
zrBOpjp_jnLw>Qi%p;$^z>!M<H-Iv4l82=onhF3o_0`+P5l$x0CBg>U)RVXhlC7IuA
zCEZ^c3<<SPt9}@oRLMT0-Or?oqpL~Mo9DM2W8f1hJ<fk!4M%gaUmtFbmC1Xv;+9pG
zmpO5eDQ`%pzKY26-YUQk@+U#P6#JG{lc~MD#hY1r%|rhn;Xx)Xl_{K`96o>*BMZ8B
zn7nOT`P^z^IMymi3We5Z(Bz635C-A(h?U7Yw5I36#Y|0xl*ko3ijW$k>}~Jag}HpY
zCT})1;QDX@g=2UhQhue1TfbWUBxmuxGQWCMN~nA)vz;kM?`96wpb7oQM+Qf~zFs%B
zg&M)$WyhCQ!*jQ!v(w4rt4*@1Ijrgw6NQG+1Ct|u3wg|#0>iO#sfA!lo~6+oIro5T
zG&YN|ag{y_I0?L^a7(Iu0j4iw2Ni~y2{Lq?jXhkzpaKT+a_(wWb-R^7wCZuH=KY#*
zQ5ja&;hW)x$3u*A$N57aif8%#i+i_SGQ<vzcG?-oa$BljdaW~49(S4vep0K_du5sg
z;=n@_6sw^z+EM*OkuUxv<wZ4bNOPpff3V7jdZ7el^hY++*!qa;y&iP=$WJ)%D_NF|
zFe2D~zP%<SUH^M3D4j>iUpdn*no5LIwMXbAE|hMiqOUdh6`)W9^5fgZQPnjoARToV
zPrmS`8t=L?CWtOi+3QPYqq@WqH7)HQM?HH(`r=uT+qAUvgLd{Gu4nl(Ij+X)u>r98
zvy1!@@3wNg;oOu?DPesiL!a2_wVo6y%F3Q|?6sUNUc5$T7qehDPmXc+1E^aV%gU8M
zI7dkWOBMuMlXOvjB%x4L!GKk~a;9<H=Sy@DaMC>xA+Y)kCouM;9xPQRw>5I7$trV-
z(eqp`Q)#}x-i7r-JG7T3zu+cDK@jtLm#*DmRTAD!_Z%S!+uAQ2Fh!2$(2TMtnPa_3
z%Wm{FZhW_C`C-@k;Jg*-*$QQ|CMdYN=VNHS3-!EXlQ~-53R$vtvSIPx?hoF+T+8QD
zaspsq8ZI9rnzH|p=L3tH_fd@<GM#fvYB%|rlzVC-`iu!I*$}9$Y{Ji1QaZk&J2cdF
zE6`Aj!m7yk;i+Ddx=I{RQOmmU6?_cL!9((b_-g1YZ<jK8eCp>$mrEV>Ui*8Ra+0jQ
zG#kc6j%s2pH4>StA0PW$X^@9ph|5APkL&_msn+mtH%zIURA)l{;)Z~eiZ$Y{#Je^C
z9#&9k(sRT1bu#egu;wtBJ<O|lL6hW&VcV{Yz5tw?%L)J(J6{!O%8r~jA9%y*I5A4L
z^7^lonZ})fl?aZqkj5U3S;wzVWIkC}gfsM9t<|zHb}{Usl)fD^Wg(;+{-<06;gjq(
ziY<p@4#B3@VX5lmg6~k@!7dcD_Uhj<?~K#%cVZ9^bS0NzUBuN?WOL}Hr@v{Fxc-Fk
z`r}`(f1(}0Mtxy%;cU!60c>=wk#{`IP*##vZBou1I7RO30A8@`Vjp99r9kZM#SbkS
zfdcb-{{fO%EmTZ+6OV?FIUAg$4}c{N<F&Y<pO7dyP*Lp<#bv0vB?U9<_>M`rUA+ny
z`?(^K904M()j_7a>$6bfrpu$Vd{o3dWO4<aM5#CLy|rs1Ja6^jY=w5FT};abwF^Af
zZ?C%#jHpdv4V^Mz0R&ZhGe5oG^&2OY*)3cT<BXgyk()UdLSm)r9MeC2y3fjwDq>Z;
z|K7B0WzFczA1In1p{buT@)u;Do`diwaWoMtbK?%kkEFYA%(>RGmEBVHg?zsybH)QW
zQL|G)+~xKqFV~EVTnkGslxP;{ekh|(b6y%!sdia3yA-VC49TpkH_Bxda9h!P^s8e0
z8Rr}?s}~SXUyg-Qx#jV*c+DGt>=2MMC|n1*VJrZ<EQdjRl;ZhqO@W+z1n?65o6~I@
zcIT)cy{;t!7@Fd**B%XZ#|9>0fR@CS=a29V{}}=0%vQS;`37^2L1deVAvQ{Zi2=U_
zm=HDOea5=-I0d7g9j5i3CWajICpX=8IHKlYWJ3d{R52Yi@g0{<nca3iKlmG~a`_p+
z^xvUD_j?dT094PR3(jS*-$U`t2{z&e2N>-+a}9pD8LF07(2zIbcp1-+q=C&fdk`;}
zQ=X6`OaW;9gWV;E@ste5wiS2nDEKfH56z!DxzG&&nGet~x?(9uAE}(l<p%0iON@jj
z`<}3Wq_qg_QaY?P%=GRX9!Sn?7_R>Z?Br-B;rdyAusPq?VV*0-t*%~-ybu!oRw!EL
z_$!k%<JY+Si{!qrKV$$aLV$?ZE&e9YBMe9ZYYu5-;Kh6`E>|`~%h-FJNQVrkRgefo
z+b_2b)2^OB{)t>|u|=hsN#g!EBoehDXNuR<q(3IbF6nbE_T^ljDr7)aYu}8AP-`U#
z{$VLuB>|LsCl5Z9@`RQ0mOLm0VAm<1HF6^6i%2l)ylN@(A{@u;QTr3^QDi=|(u0Xa
zGjVDpSg2hJ>78G1kGUdO@yIs*kaLcQGMakDE$*odz;U|6BaRA$Gc%*wNo)B!Pw&*(
z{(z%mHJQpY`x8(~q`Cv+PS)zw-5+GwG2g@fYWe135u|;@v(~|gGAY4w_%NKMuk|Vq
z?GWX_Qyk~B`ik%6jH9_?qUgtFL8aCzcf)fYnhCc=cDy%X?*23n)jLIo_4t8zii4d0
zDy;;DZoY~u7+}TQXu+Jwo6ov_=CzAmcvEF0g?hY}EL09hwLqv}$a@hSn0K2f!<nfn
zk55Q3v8Gls{J*j}d(7e=kIq6xL?%eu)o+2(h$3l|H^@*U`kU$~dJDW&>TAj95xFxd
z`P=9xJOF=Z75W+m=`}fg$%$2ms0nnKv&>=>;8ojpvHv0VfaN?UTBR297aQSmQQJ7q
z5s#d8ROwb7#T9@2*htdW7uR7cW7hN_YOqbTituz%>zuH=IAWq@m;n7zr&zk@`pK&J
zb^f3U3ZxZ?&DfFANF*kk&3(POaMv{eCv;1Cf_4j#%!u+*f4NOs36W}7=jx3oRLcPN
zK~aFaQLCyTJ{+n-46TrUs#ol6Ak}j5&nfr{j2)`sT?gRJ>A4QWi%r`j!`&Y4FO|%K
zLV;J^6N&$0Xl^|5wP=EpVR-F^%^Thy?B@v;=P<U`e_q2awm;Y>zgYwE7_(GUGl>W}
zF4rDUE^nt*s}njaxOH6K_BpZX+R&<NnIxlJJlur-kKM{=0{q4@Ic(FP0Y*tRUWN-<
zJ>jP_(J{-%s<Wznw&{H5NV)HlBp<K;TwfEw^q=f-AtY*U89zs!l`AASjRG*X^wq$O
zbY7#dO3wgQLHA>*<;eZPa>m|7&X9OGYlJ-Ylq2daao3Gg`j0pmRtfUJ=ckOXbH2*P
zs6f-F;4tVozo+$ise<V&>bFUKhqm(FShg(OD7kcn{(|)2_HIu;p&e>|eJNj8i)-T8
zfW6me)Ogj*vZX&mA!l<WP2F{vtChTMOw$ysz6%dF9@vt!Um^UP3mJJrHKV*Wf9~{7
zmQHe+326z?pv(fsD3Y!@$kjG{!%Vw?(}J|Szi;FdW*n1KmZp1;+2~_z4@9Zl62TF&
zfS0cOa;IHFLT;oQ6^g+~@snLLJ#2ZMuWiT$C>`x@M6jkSJy1^yIW_LV^*Ee8p3_k|
z3p!jCT}H0?+WQbtm&iVso@^rlFZxKzn=^k+#o5b@|Fy{evnpin-B5(^48ZM(d7fx4
zLOTV>Vz53w-O(uG^%;EgE)r(g^G@m+;Z4?0!AC+BT+z5uM7!`Zma_;tI9{jP{9syl
zzMQ@ndM^|;cI9kDM>zc{RFxhDHc_NZRQ>6;lBPN<QY8Oq(D5D;Wn!XXhT$88cKR45
z-P_Qb!%X#86+3!`0yzN=YJR-5gQa5ltWM8G1MDMJxuP!zuX*#S!waa8avM+2TGqK#
zmD(C`EyK>=5tEm?zwuze^yzJ$*{4?|81rVYlb!OC`{+*yNPe9KryY17@>&bhJD_VO
z%<ktNhGRg{)+}1+KM|1WmT6})YT{h(zijyQCzK#|uEkNluxha?Ou>+OP#D+hp?J!i
zJ44XU2o|$^+~$S9_S9?9vKudmb?3C5HXMSUub9-Kk?_o<_D=e(1cV-e-Cemb9G!jb
zg9_F;VScYzy=Om#6<6NRU;R5Eqz<^2d8VKLhGSaFH*#8`PWYvh!a{r%e5j=OZ4Y_b
zYiA2TW)Q?ObB1j`*cz+a(e9Qxol((`)qwo0L7}sE>O+0h1xE_!Dj?ogk+f`%Ay8uO
z-3o&4Q|D{J`fDpSuXvG(U$LIkb5a=hW|!Ti_@^^;V8j+o<hoDWR=;<)@Eg3VuIk!n
zL{%6L-v6*ecesqCQXYNdAXEX>eigD>#l~_v<7Wu^6@b00ChQeCHE#W~jT|qVJq!xo
z=FKL0UMSS=wiXo5ynZ@%M4;yxXM`$FxuEpB=W7X2RT9~bPPoKY)j=GZpU$(n@C8J?
z|EdNpnj3ve#69D?K>u1<lSX}>^mLmcZi@brWjo5Y3w=mV#>{^DN#(C6C)DkS6@Ldc
z`Oe?yR{g5K8pw(i+8(1k{r(W>OLI%m$mzSEGWh;t6Y9u<T`fm}v^;J1-yHU)r{FQa
zLEkA6`7f5~>B4JM1%_9r`jh-=oaWE_pZdJ~;BnDfD*x%I{i_S2NU%h(J^par|Nb+d
z6z1-kGZ&0bRDDm8p=St+NJLqKLMX~kkLQ1$oP4(!0S*`>7vz+o_wP5n@je7RwyDj&
z`tRQTd6n=CFpkB}&r#(6yO%cLvGKH&?dgeq`tJYff-mIc2*@DDmj3I{fB%s23D26E
z+v*hG^zXqnWdq9+qOYBKy666k+n=7@pazeJUaI`ztpEGFqV#gWF@ev2fpY%up8bDo
z+W(o*|9`6guXXtU>Z!K8i{R9$W++!t``_#I41vr^83@yl&i@pK`0vdUjym5X&We?H
z4yO9sUjO$7rjG~q3*Ku5rTE|Lyb^4K=8({L|7}G6Sxv(ySA}@ZsH*>N@*gAC1nfG*
z&YAbrPXF`d<nwLJz<v#v#&uly-#xPfj~&v|?*3mBcG8R}Kd@QY%zjg@|J^eOKx7W0
zrn&n6VA4JSo5f$i?Bx4zoAAd7ypIQu$9`H|{@c?0Ye*GNOqwMhiuix`Z0!6IoeQe?
W=&aEp5h%cNMn+0e5-o1@=KlcLJrYg;

literal 0
HcmV?d00001

diff --git a/docs/assets/deployment/hf-inference-endpoints-select-hardware.png b/docs/assets/deployment/hf-inference-endpoints-select-hardware.png
new file mode 100644
index 0000000000000000000000000000000000000000..444863b17c1c0c357f34e9dfb6026c571160351d
GIT binary patch
literal 367803
zcmbq*1z1$=+AbX;B?8ijgaQJBfHVjw4NA8NNHg@%NGm8vcZ$;8-Q6HLq{NWJkVA78
zU+sOqkKh07edfAmX0g`1>#Zm5=YF2WM<s=qxVOk}At52*N=r$+Mnb~zK|(_3#KHj1
zEDq&bAR*nBGZPnAk`@=IRk8!UGqW^CLX!FzrH-kg+)a|K{rWx{mV~Ixnmj?+9Z?yq
z$L|m5KFCO+_}wvlu2lRr_*Q|gL{WM!Z4ebfv4J{CJ4}lNhnZ#bZF4~#HnPK%dIRq~
zFZl9oFwSd$54<`jfHVX-d2NQ5gDqM>uSi0)HAo&4*+=Jy!a0OF-9)AVN4I;##LP_D
z#5r_XUssDwVC>c}mVG#Qd8Jk6M^}x6M1Sk&(=?qgIJ;s<a7J&HXiTJ6w_NtKU0yTj
z;TDJ7=Et&)x?_@M6LBXq8y+Q`P<4;3O%aJUcmJg1Hqz6Y`-45CMxs>wpGclb`@O|(
z^CUQ1UR5A@E=c;8!W0#n!E!idCbDL9F3)A96frn>uPsO8^cJ5eYs@M<^D1Tic%Fgx
z<r9uT?!1k-k}vm+`#3;~B}{>jiuv1U=*<Yj2rN+F|9oqZQh$ewi}?O7v)hjsw9uAB
zWX3kbWxnD%PvI9`_*lM^1V0_56(pP+<qc|{NtvPU2S$I~ceW+i6w_e{$Lu(QBz}<(
zA&W)4tNGNs4o%rN_7Hw}*!ZYqiI3SsPC&VBbE1<HhjZ!9{qN5yzpyKOc&~x_6U)WP
zQln8`MvRg7ZPSbIA6|95MJ|@3$39YDH~h9<k{auImQ=mxJy}c?_f}6rq#-_rj5NK6
z_(-B@XP>6S$1#{b@fevZ%w6YLl=b;5(Nt!qMAq=O&KzeQ#ds*qSMp$pw0-*NwyoDI
zg`#j?-)9QRGy)tvBKT|yQNnuk{lP)XCm&->cE!J{TrRkYJzMZWYC^fCG1_GG1-&g_
z_fQwEFh+!SEQ-PT9_!fw7wUsMXRh>ca-3UDDFh$iyW1ps=@()xi(hUMsC9qD<Qp49
z&Ojg@sg^V=f3O$3*X4}}5@zU5#l&8~Hfp<qf56X0>iB}1TXHqOkGcg8K#hZYzIej%
zAXxZ~^lf?!0`U)G652CJh~|2@jq{=J7@5fuHL9(9C6gdS86h>HHNiACnDHZyv3MON
z&UBiml9%U*XCJ;bI=8N^*9=9DxN+h~3M9-K^nuo9kHx-%FDpl9`F*!6J{--{9WP=Z
zLS7|4d}w^HJ@hS?Lq<SSz-DR?=Y+`W%N2|1Hx1RkLgG;9<rk0pmaPF=Z-a|aC;7JM
zoscbBHjr@yLb%^No_xhXtz)Zrsy5SP`NZSWNIWUcV)ZOS_1$Zj%F>VZ1Ie)%rugX0
znNKs_BkP>DFWylHqc+~7BT=NYp=`EuvU5TgJ-K*QKQ||V@K7gs*9*43+(B}t+1cI}
z+DpO_!fO%+AIm&DPbxKNRSYIag5u-cEpaCfWMM};UQKPC&BXuY%~#~T`wW$L0sUN*
z77IO$7LVTh<ItI0)qwFE=2+}iZ#pHEXkYGBN=p=NG2%(wBVX4cGzFj1g*#O!*6(X=
z4jtZ;rc%_QrVygtzyH+Fd+h<^2Zpzy&mLH|VPZ?Pgx#aZmX_osz)lx^N4Fn#$B5x|
zh^1Igm`9hvGQAzLnK+CVKTKhndk?!^$x#K9`+5FQ*h7kyR0C5=e&l}9%vAI>6o*Gz
z0cz>BL;MHyuGsb76<^thsBgb9zemK?PRYU3(N0%v#7Y%mP+I&p?{03JdGU+m#6p8@
z4bme*rk}SH{RNtcDSbMZP~2|`Q|SA|EU7wEd6G8<h_u!2g3!pDzr0a|)5Ecru*m$f
z{pg-QG7wlKSiC(WOXUZapbL{OW2|YdkCo`78=z&oZ%qrkpG;dpNJHc%MISEQoxCg`
zM87NTl0i4ZKf*R*JEHm;a~)Olv*mLqM$E8??mKq(t0U_o+&{TToqsxyOP4OraDGkq
z=y{Jr4`&aL%!3uqZ@znRIg;hyU6q%zG=I4K;52`Hc>9q0@N;~8d|Z5>R$07;Re@IA
zv|jnXIsTY%jzumc+kQ;>2l0mN7&t3MsqyP&z>BY%!{?^mWrEYMwYazMZX<8|Vu-iC
z^3A;eBlhd7v{#w7s!I$>&nq+R*NE294_==lpBlTyFiMWfMC5i)B<5?TxoGT1zY8T1
zw}@2BP%9X}lb@tTT9#}PQI=nZTJArMQ&wr70;omPz17=n;!UxGlO4}m*M{zIXl%kA
zN*rVyoHolg95&52Yt|Uo6h`xhgmNGQZLw-{)LenppQ=+_B2LU=hdBl~hKt%;%>#9*
zj`ToP$tlTFg&LsHIox{1Q`QU73(E`Q)5B8)t_`Yyuc>b~1_kcGJqO$gG8nfGN1gNW
z<zgdQdVo{FlK`&UmE;xoj_#3Bpi@YH9w$rU+~9mienw_OR>&j#ZpN&IWA_PRLLLvF
z^&X~dOuNBKQIAHZ=Ir-?@Atpo8h!jd|9eV*UjNVjTm46|v%Hz{rTwG*>Iu9FVC`6q
zPvx;@uMBq+7}~?F;>@bY_Yzm!SS)fSa{bi~)duqq^IXQ!$GOK5mZm%nJj#~LRt1nd
zR#O#I6%>|*lW9%`PH|4ePBGiB+<4uJFEGw32>l4DAJ9KwemP^O1YUTyEb!x*po0;A
zfB*^qxIhD?*%MBe<)AR=3r~AH#~$11RR?h7QP$8a|F7gP>zyj>NuH@c)2ETApnB>$
zuof^}sI#Rj!A7BLUCXJ{S;OXF<#e&J3S+d-b=-8Qv{7`_-|-C2Zw-0NZjgeYbv}0M
z+cn)gURz&{gI3S)v$JCsS{5eh4R&gT5`LcISuL)N<DGX42G`>EGL4y(D%KWev(HzK
zAi`3rQ-(mb^IRd1nSx7$_ebWt^;f;Ru7oBc1cKe@kZ`c@9^#qe{=oZ$&x-F(U_=s0
zs6zCEYKvU(!LbC^eR@_S$*#xAgo;hMtB!#+fdjXMsJ>H^P^eKKJ)B|FA(?wdLPf#v
zG&bo*7)==d;Z%yCJ6MO<MWlz{T;@lZ>01XC2g!rc*jG=u3<ugd-!iqsK6#KrX)0M^
z)^+lAbPaso$zQ^ilHkHmXl;$(o>he{z584nY4n9&!CZ=wfr%cZ2qU9;=GlK7a(5y!
zJu-nPk4Y}U#vr}9E%D<^reUUCCMqe0494#;xr>(2W%WI`5ofc_(HeA}X02wNv=p22
zBIV`BT8~_#VMz^~7cK$dj+{>ea`Sy7eQZzEb=W+kh{MYtZF)Ev9ffSoCAK9BRWHx{
zm}$LZC0((6V6@ad%2+AA{Y`S@=uxurxZHZQe|JSM;R%|HcrxDkFzD6fL(kWOeTeSD
zt}701gAH#ptx@_>t?v+deZdP&F{Ng9E;yMFSwEM&$w0!14T;Hk^i<bY*;K!MACxtA
z^a-!C^_bvB-Ihxu2|sZGtGj@Rt>+TTS9E()!OKU-nelX==`@G){q=BoAGeTxBrRv7
zu6LgO32JZo8O)%-@Qpz~8Y^1o+~vohu?T`qUVpl#&uXe;rEMjAg;)K!AWJK|yyVTw
zlB%KlSpK_wHoXg{{tRwX8C@CP{BH%Sc~<N=>=qg(#nvY^>??6Ayv*k;M|r$Djm{Tm
zxGlKqyr))qvqojvMx&X4epObYfwFVUa#&|&X5t$U*DL(2pq>U-uj^;uxOE>D3eXEo
z=f2HRP_I>2-+4MyorjVC>W2eNX3EhR+yo2I3Y>oI7V9Q+<WnD1@3kd63%2)~yj(@y
zLM_L9j9(zq_Dn@5@P~ZiX2D<{2qa~0DnRL4RXv=$J4D#|Kp<W&fjMM@TG#25t7UWX
z+!A`Hn}U?0LsH+flPZ_j`?JbR3c4ax9yNz@lX3edz5~hpoqXW)I>gC$oMciweIxz6
z#$~7Mg7)&2p~8YjYI8@6{Ms$g>cybWsE&#!R-FZ>dO|Lb7pA8+>o#MoC1y-($-MTD
z@*}mkEBz}|=DVx+H!9EPh3AvpLTw6<8&)qyFaz+Jy(%v}6l=B5h69oDwW-^MYtA&_
z$L&NX5$ser$s@_p!dxzD7c(a=$|g$CD3Ok<;oaw_Kke0rQ?$Gayv+9Z7W6&6${j*C
zVa^P0V`r}26c@Y#b2W8Vu#X!qa5ls&6wyv|Afn=7<RyrBv^!clsNDFaA=0D#V*2>;
z7NmY|W=`*se#g!kant)f(+Iq#O)8|JaHKa)_75EEHryxG3C7|o@V&46R86`Xeqx9|
zKF<t=`FQbGB2CufBC%vCDk9ScVTdMTioOh`&O<e+Zm`cRAy}MxW8XGWHuDq?3fho6
z^_>^jPE~P47KeBt-}Cns;NU0-1;UFUV-4wd^72T`z%dpQ8ZtQ&I&g#xyoHe|{yKhv
z{16HCxAQ1SNP%WZXn*`h0r<XteF5IrZGQho4G%!V1pc}Myq!}~{`@tLPb%u4$LO5E
zH6$@*acODbTiMXg*x1_M6yy+xRBQ#Dz_yXnv`0cBVYq%HOTVUv1NWaaQ_*nHkeA~(
z1X-~e7=hjzvpHMYT;B&t(3u}Nv@&)upmnygw6^DW7NYy@7yQ8S^=WoG+TVWSU?D`O
zA+JO$4ze?*<zeGs<De71MN3O7XlL|}|Fy)6Kbix73DKE4IN0#BvxC84HZT_($j*fQ
z2_GLHI|nB_C+B0}7mw{-tQ`!TA6wf$`28k--bcdN-q6m>#=#6^O?!P`gSQ|@2O&DT
z>yG|<{XR}(XS09xWNrV)w15e+UteK=!p6b=*S&$Jg4bvHmCT%tEj1;~tbjEG`VfA?
z#l<1`TZ4aG`d63#)>PwPO*#3V^89<#f4lVermFVFcH$r_pi>9oe{I+wjsN}P9}NZB
zujl@6Yw`O+|8^EwY2jOf?0@Z=@GWA4>`q`KDa|AlRe*0m%&uQ3alpsJ-@k!lRI(MR
zkG)z*NTNv65@IUO$Xm16&crKISGxk(eqTgU3@{&^<)o&jKBP^3pY`FaVH2XJopWUF
zVR6+^-oREK+`BTJJN|Qzjx7sV%k)&*EY=d7lI%Q#KqPPa<*OOgK@KjHfo^H3F6m>1
zLXLgG{l23(zTFMJMti30F1Z#zBor*#_y6&Sk{Mb!mXCV8Tl+`4|GYKOA_Pgyh8hix
zKokl2KmAAz$0k54G~)d<D*2x`23lbG?BD(`rVI=^O71<aGefOGBHMqpXrcs(CjZrl
z39^h((3)AMaF-ki|BD4fLiSk@ME!5J`MoFu5iOQpxAncu;Qv@guH}LN4NCT3jTntN
z4oM6y<J9_0_dk`7-<J42?X$uEYQ(fk-GGFsmr!)9|96s&*6f0DvskCLp-4(fGRy_w
z-hBOc+3*g!D<vb7)72VtQjF~r!}mx);wGU<HOC@2Dj-LM<^E!Qy?>%J8%ib8I`1N)
z2yYaCL;@7FM#T@1KFMFqR+JJY>i#_i0>Kc9Zh{-PBPR!GaVN*sq?+x<%fHX}A&a*J
zu0IhPd#*sA=Z#B{MUS%U*N9I{EPdJR&KIjsi;nL9T1n$!;4S>_v~+Pg$*AS$eDc5O
zLX`I57y9tTNY?I0-LD@rNam=@hW*$W%WyS!90jS7a521o2&~2v-r%ttS3`x^`zOi*
z`SE~&jndv8o>T+&d#?MxvTsb`qK-sZin6))&A4ADy?4&DQ1lahCI;64e{j6H2V`#z
zWE)*@lgi~>CA%VCEI}1mMqWPZhl(=tS1oSoCu1D1!{r@6Ez?W;@$%F|yE%VlY6uG7
zd-B+=DTUpo=BM}nE~Vfp=1nP>C2~0^Z63?v?CKi-gCnZN(1YiWg>D^GW!e_4S(c^K
z>Bf=KSBVND!)InZ8aC$5%*?{|xKt1N`-9w<IGfG*gnqH+S#MDkb}5ygn#_A%Y-YQ_
z#>}GNTIC}|oCFF4GxhSUH`-byZnPkr_ZCsXy0wV-TML+pI0_2V(OP8O@<?^xm3M2+
zAKDP#ILtrpCc2JxP#WoRhLDBLUD##8zm!IhbDK-4y?asYC3NUaGJPLQujZ^*?Z$i1
zXNcO~hYJ#2&Q-IhXLKcchD*KMzD<OpsMuw(m~o?I{-I>vK_p$XwTezVQ=6U@ubFbA
zGvbt-^P0eUj>axRXwAK^BRp=D7bS0$;pYp}g(7Z<xE|u_vm`D#Sy}rWwTxKv1-To?
z_}8ipqu-KOwYjj!b#ZYSNYyGgmwDkT&vcvm@c~u7$muJYh5%aU?*2)XoBXJ^AJGRA
z6cLBDFGMKw^(HAU_IvN`=NwDSWnEphT69sFe(C<{OPU%yTvpi&VYUiS9_I&~^yaQB
z+!N&EtAi`J1U6&)Fzt=DRNpvXf<Vzcf+~z=@b(-NCO&m!WaQm!ZC>Tqx$41&g}23S
zGH8FD!@5P;$Nq&%z)9A?AT8tj_xQ%9cs6ph!VesPVlB+3eZI-Ai!u;?AVHcKt&C~{
z!=^X=nsO81V5eDDA`JXOsaMi$aicd{(LXz7)=4dbf3ch|mfe$osMEUOSi<>M4P%0c
zEp%f6@Vw`*7H(F6ht;BG1XV{6$6BYIsJc4T^!sqvDMvYmpp0;u508H(Nyun)Xn0i2
z;Z_hZzX80gjQl&Na{$*1)cN7(^TVePoTyDO#o*7<?giX9TRQB?qDn+!-F<ld*^#U@
z%u^XzP;z4;SDe9y{ci8C1WJ?)%hVX24{?$KR`*Aasxs$@1;5*85)39RJ&d)jo5iSy
zRY?cyyvf_Q#9qC?{^Q~1M3jm$VIuZTGWXZH)Gc(pRno5Ue1Sx&iS8T*Zu1QO-p&WN
z6(r#$jVW7%fBo>!O#qh5+m7fV8yZX{nZqkUDM(_&Xe|2Rpv+Ey)albr>+sh(+7gg{
z@}rT`m-NyZo=3xtKeXlyYyi~bapO{`-0}YTe4)m30#=_++&nrmLSJjWEn{b#$oMN`
zt5l6%u`~GqP(xq_d40Es391xU$gbC|I)!Y2`iAK&pb=u>cyE5QXuRNa=9pJW=yJ@F
ze`>Cz`1*CYA^{Z}(G6|>T8u0W<cr+=gi1?+J#}phX>)T&UNmd*#b&Ng<200{`SJvU
z@wYE-oF4rbQ4N9_jHbh<jxJ{dv#-DCKaBg{Ba#2<0FB>G0sWVqo}yH{A-b*iC$w`_
z6~ngp<5u*D0gpN6^}Xu(4JzO*!$zQpHKT^A$fMds!JDVvT^Kw1@~=7E08N-Po4zMn
z*>$O47DhOhF<0q*RJ+2<MWP-j-H9SX3sn!Yy>U(|Uqm^utReiBy#nCvFkeiZEDSv{
z#D~^jpcW()<~O-Mncvm84B*pvLA+?xw>>c-46o?1^zJ<FxUr#4BD&=e#7%<&sd94<
z=ax}th|s{7j?Wvic6Q<5XTQ`dB$Q6+g`qUMsWO*b`?4BG3)w^Su|#7E4165Vz{7U?
z8nou6S8s3MC}70&Z(8S$;1%1rzB`Z<CO5>Yw3b%9Q3CJXxL=zPW`#Gkj}{_gVwlLt
zu06KA&wcnCxWHrxq7U1rlcoLH4O@nc7E<~i*TW5e6ZgHvRhoF95wt+((Zh#N@5AMY
zFbWr`27U=S-Z$BjboC0*Lcm+m=3}oj6x1H?Pv}G>abaP!)Mu*314i1WkoM-K0tEAV
z6Ui^fr6B;7bY`77n_=sbneI2bKy%|r|D3(|EyAHe8y@TF4a!<Qr|(2)m0}>!!x=X_
zr~1mmDr298cI@Jt6cEY#7C})OXeZ4og%`_np-F5CaDsqKk-2cyoLgjl@GEGCrShd|
z+^TkYq1iWFQ$W}Jhm>RRi3E<%rdjmU+X@7AKGtl3HwK`z(ZKRTo&dY)Z81N0foXKr
zAegPnGFulGYY@owOXVQQ67`;SJCd=631`P8Gm>#zJi8B~I0zxZsN7r<vhrEjm3e}9
zlm2=yJ$&OkfAj_D)Mv9q4Rvsk{Y#A_=eO@JL}CAnmHvr-l<-zqzzG(;F_z1x+RS}!
z<vR!Xyvs`)j2l%kGWdFaNp8SCR#@p?L#SIg_|g}rjtpaUVO_sO6tqgaD46p1Q}VUJ
zK#WuJ1MmuS@JikB(y~Pxw~pqDZTtjfLP0ry;TxraS*Z!5e*4j+QxSR9(GG_gJY8IJ
zB+Ebu`dOkD*Z#&Pe+f_!(a>|@1p5l<*LLAQxW#O6onstT0S`e8_Tsx)-qTQcj;++E
zf9ni1U;Q#eDnokdl#uwr)=}TDqwo*_m4}qtj;bl|Y17v#Sn*;Nm>7sJI!(E~Q$a(R
z7v1Q}L>cY?lIqqoSApwek#cG3);XYKVmiu*yT$mwbazMeO>4*F0nH!z%Dwp*1%PG{
z=wPC?&Nn-i$)?dcKP5Z8akyDX$RM~jJ_y2dZUrSrnMg^hJ>oZ!Ca6QPCJFo{SbB>!
zN$Z@Hcbf?-IWcj|ufgix3`WED42*fQ;-Z;P44#T*b>n7S?_VRZe-*gzA$(#sENzrG
ziSnQ4q~rkF;-icHGnN}~)+2d+vjHn@C}2*y*^~)qn4kPox9%v?Y7yuR{!qi5Sb2jE
zf1};$C$EBrubhVeXOI8xt^Q>=aJ?|00J^ge;I$fQswKPGvi*hDiCN$HE@;NBTf-q3
zP1`z(Pgsws#!2faeHO$Br*Bjzl`q%o)C#FcvOos}QZ110Mj!D<+b@$S?dZ*iTUHB@
zfo)=RNX5JW6Bcaj4cX0;xLf26a=TSw1x0Jlzx_)Uq1{Et@?p9Z`g!|CX?aM5OmSQx
zP-+EqXKft&OUwC@U6ep@cZbmA!(aI9-wds29M)u0<!qeQ=FHg=uHVjd{UF&~nKWuG
z*)PY3<c&t~ff!9uM&{1h*UX&Wxkr;n1*N^xtEd@tkT)SW^@M~%%tYXxJ5b>WyC@ce
zx3oM5%zvYO3t-$}4Yo!%iq#(mgI2ByqnXQM;yQ3)+DZb%9HR-_Cop?B@TQJL8SWM}
zgM<zjN-DUK3L-F?95ua;mRI>a(3+_*E`J&A+<5_XWHBK_g!_Io6r;s)52Ixp+b#FK
zTg>+9LSoP_q(+qE+)7dW%!*)U0NY2KYV}6p`ZHR7d&>{K*$Qc9px%4Ow0F25g!X^5
z3(rDO<_M~&$06g!01UGCS?JtdwR!lf#Y(-4(s>7MqSeKB(IAisi~9R>nj1y9Q?rTU
zd|Vt-0WMes0rx%Wu(=ta{ILnCktn-p&5jd1a4YDM4d5NFN2BI*vwjdie1kfFbk`Dc
zEufD7KLXnH1m{{n!>rt{wFd8(Qu)7V&9isEX-$dMP9km9n8E)brN8eSeFH#vwl%&?
zynplJu>$jRdReiZ1fU=OU%CYEHd0!w<YUAKt{ctxLM*!F0tD7oQGdOh|BJaf28d^(
zD{9+-8^wzfK$7kds;LSvK=o{J{M!EN1LXP7`3D08H<~I#62Mf|K7btkKS=XW90D}O
zbGJ6Kn?ZaZ3Lr6HBgh=!WO9i-gsrB_)>sVl)+Y+}+q7oYmpVQ_IBn&hF1KKM^yra6
z?wa`j9Itp2sl2B>#&%t*w!A?DyoqF+0MDliNc8pmB?h?5F5s>BvSz*u<5RWJGgz%+
zvdbzNNd3o(ac{JAX9(5T0uyv#dzDB~5_mz;NdjOQUkuy~>)D#{$Ve5ET4S0Umzh>c
z0oaCK?C9AWC;UYUrJ1(mH*x(s{{+|j>SWL>L^w5;dwfdZ6K$2c?@IVB%lQV~j!$F{
zb{el5Oxuq)3u+ZykG3>NW;v*l<DQy@pI_{F#qim$cEM(AJ?JL%-10x&d-6OyB4TAJ
zR3!S<*B5-f(;}urwAp&~H6X#yODs)0-b<VP!+!#-f9<Ka#9cu8K7jr0pWn2ush`k&
z#EgF1=9e!kRc+4>H<?bAN7mB<se>llDA2BefzTA|2|P{ARyNMYYB21?la`ha>+6$)
z)}3UYqp>v{zm4NC@YzAaAz}Sepj&%-Y8oj=D<YzQz&9{30K_CYQI<<GJX&5*5qJ~o
zUS;FO<BhmY3r!Y3k(1?!JLf`&Eja95v*39uM{TvpMx;i}p841Ze>w1fZNNu1z>N*>
z5I}FX`DDMjv8dmzM2Ht4Wlz`V8yiQnRhwI%&t5+MY2o6#03=sOQpHf`0}%6GUM-l-
zCIg9&3hVZQOp#nxdZHT4TV`v);2af;ZyWFW<4+1ccNAmi>D6mZmzfb2N4V|Ot0#M&
zu7B|4PscHpTnT&dvZu;+DUn?#PrGt}YNp6QoJ`QUXvTTzv)!BvluzHzMqSMtJ)hC5
zomjoCE_}1Fac<XauCChI%Hiukl0a`bgX~-D!Ja*$1%&9yREfzyMLL!9I=3bV4z|BB
zv;izKpjy0@zuU9jL2REhp)zjUpAs(cW=!L`I+rjOan~20?%l7PbG7J-@0mKBGD$f>
zDPl@-FF7;zUb2-OMoBf#8<%Ux*_tlzbqPrEx;*)bnLvn&iRWOM+Y>{6fbfW6(=}Qj
z`SzsnYX0i7a>llkY9#B`gJJeOXC~Yp&|KXVq<!xRR^4s~Mf%{kqyt&3?dkH;{ttYO
zm~>KW|Bm7QkVyq807x<|TS3!rLN*FduTAuX)$i6~DTN44WFu{`%P>@k(d%?HCB&(t
zIzu%|-+2+eyRYw)eQ+C<Q!6fSR|2SEJ$a$Xpw*}^_KEeGGpniphN8&D4{+A{Xr}CZ
zgNKL5Q#$l$c73)O9lMWt8pU*W#-FG?oaQ~xtg07$aNd5(q0A*=*V{sC_BA;>UJ4Dq
zEcbb=UGYr+U~Mcn#&qFq_$5u$)k(_LF0R*d*vmwY`of48+2|!DCGK9Ti*Y8&VQ#Q$
zrq#=1A%cj&sDDZApGQsD_eBZL{i^zP=x^{RO&{3+cQW4myAS9T2_;6Ga3pW|Y{HM2
zvHzyu=m}H8)ixheWXdmt0P+h?Vw>^0y4XWBUd^s+S6Ie5Y)uYVUOMw0oD3lyXoKoi
zH^k>%ph<gsz3efrXA)CI;GH>6`&BuF12Y{~!Pt9!mla~Dr>UeJ?zFzg;TVjsn1GGL
zVw{z!tKJO(gCpA>6lj*d(5kQ`>+EWy;`BUsCgXR=+CdWl!&u1)0MNI0Xd%v`+IV@o
zxwny9C?g{iG-KEM*lxd{R~Fd*2OT4??7T04Y=En44XD-GXW^V09ya{{EexHvd_>OS
zt$R?BtEon@$Z?Yt4-zgc>KQrlg^zd90NI5aAHx@$M;#!%vknmsYeQm3uvr$acYR;j
z8;)CaGjX(3odK;F$<yT0_cFG83Yyay&)0?~yGo)p&-#`URK5?0Q{-E@J72$VJyY)n
zCgXVX{zsv{el)8l-D&*coC#HKAtI34wX0V1n+~3v(A8c{V`Pk;YxZkBMPrfmasW8y
zs^z=K5GoSPR3hX4Q=gH%iC$kjFc(O*>5W(AuN|1<9}eso+W7zrCi2!OH=V`D;-MO9
znZam1Vvfb@e2L}(b3ACaM%B9U!ikL6I<a(0UEhO2$nEGhMDp9l=)^}gi6aHH=6dpv
zweFkwl|2@P^(3}FOi2#m*M4L`<m&u`<JXs=(E_k4@iL#|D0RI@pvH>|dM2iqpK>j!
zLWPcE1&<ee8%D<`ijTOcypZ!%ypE<!&hX?2W;(@C|K(o(I-(5%@X|vLhZ{o?r6@E2
z<LE{FX`QKon3x4U1yGrW&zXuTFcpIF0S)424+{UM%=}owfMbi}G?r<L6FS=}eUj_9
zxqtXGm|Z4<QGOYa=+H^wysxRLP1z3{%*U8d76WM#hpd809%ooVDioAB@3r7TI=xXb
z0k)6|mXnb|Z}uZA3^Fh{7^5hBBGGUL6PPM9i!ddql8s>-P^@=7oUv_27pmm87?(Ob
z+V;rBz^7&{Y&gv+Was8qEh#Pa@R$ow%N#$;ffl)+*qK;D2a>)Sc7`YzFZ^ujfK*r!
z)#L4CK=tZf9YHaXG5$NW$pL!3Gu8HzJAm0aqtveVI-Snat*tOITK<_V<dzt;=Oq7`
zockJOR6GKP9X=>>HRHktILZ}4e1k<RFzR4SUmVvrKxLDYTZ7FncROi1^Hd5a($i*`
zlAWJ(a&pog5ss%d+vW!qMkRZl@4f^~p##ifqCoenXEt3`%7W0iM@D95ZR>&NkNGF3
z{Et{!@79ydHma?L9`f@!!&3$Kx*qJUeGRQS8$rK#-RX6O@T&FD)YN=k`c6KRs*ZO$
z8^J}5Uk^H!`~u__1P1-obSCVDw#!D-lQR*Mr|K97$8*v<jhBA%yCD<viU4*x+I~Km
z4<y4B<}WYKjL(mEOB~i;L+c;_s1pykjqRZpvT~SL`0B!^`EljUPXW@4U?LF!7kPLz
zo6sJAT3aZZM{P)=G^5|!nJ(J@_D>3cxv~k7JKob1WntX4;A!l7zh>UaN-KI@m<2M>
zBY?%W`uQp24GINFXVx2JqCK{~%h;heVVAMAvHON7-y|77sYS-bs2jB;NLE)@OEPw8
zlzEDW>?=2C>Zb+rBE#tRI|}y=Tjm<<hbwe5mwY0?kcCrBYUk87Kz@QZJJAAsYlW??
zh~7FD4(sI(fNIvia|&S+)v$7kLDB<oDFUb!L(Nbil7Pe+g<+R;2p+Y4Bzka^Hdv`p
z*m&vMXZVSXi}CF|i(1}8PUOB19<D+@z29Y=+dSo>4(L4I9q{`s)o%-XoZgN50%|*&
z3!xTrmDn-_0OQ>K0Xt1?3CabjKx&Ae(Sw0*y_nNkz!wbcM4O%sP54n2?gO&VFAj#y
zXgX|{Pn?dgyUv=_jp~ADiHqxDt$yxHvywVXfZ0=j>V6C#GMusyfF{}pwIr7=Ap0OD
z(R`EcQ}9}|a_Z-OaQzg_R+A;w?-L=cd_?&ZKyB>`&2C>IS1asZ#ku0pRUBl=Raqhi
z{_jHU`|Y>DDU3zb#rVqoGrBZ7AHa2&yaUvO1KSo-JBpJ#>0TF``mn{2!^6CWqpID3
ze$qQLOPkN(WWyJe7I55yr*}@k`Ov4D{|J%1ndyt(uEeJ=B7~OD-Jh<Pa@KOr#=sC$
zq%R|<gjtqCwxG{WJ!3p8zNYN1nFyUGS9u;8ieQ$c;JApejI8`*`~@4mL`&dqIM}dg
zGLJ-$MSa2O+&W`Sh8F7C)~2-|>UI9$X<nB1L`l5d*z%C5VVO+^hM6Ii2<v&B^X|{|
ztJA`(TlLWkwgA3btbK}$gV}j^;s~Qzerz{g<Z?HZVLC7%QJ&ao-o=?>7elmny2TC8
z=_ETdIp}QqpiZ9nU2Qgq`Zh&E&afnT#r9mi+u9{JoN_Rud7_B+YRBv9%$X<D?bBre
z77qSPH#JzpnKcwO&J+`CZV3WvtnX5h2;IC#-oz7C>`}`T)h|x<HEF&Wtr@7!)J-=;
zA52U4S=gyZ=nZ>a?x$oyh24&}(o0;0EV2ZhXWPp|xv`Sh8ZA8VS^w#yvN%!ZXsa+P
zd+Baliv!8l;29rbwC3DC*#MjynG;&Tp*d$r*9kGX5(u*Txm_GiboQ!mRRM;hlh_g$
zgPz-_7KpZnE&}~id?B6Yn+^4<oxlJt0gx5*44w_mjB2%F*kAC+5O3iZ&bwoysf{++
zs!c2soeiFSkBpkws6;TM&Vg01xLqW(;H2No{tgXc0$J(|#Xn^4HD6H9RKOJq5SlRE
z2XZI;UP;Z#xnOFi(68G}dGp%!S_ro~p9OL?Jb{$(1636Qoz|n`0p-?1<3m^BIWc$-
zymtKTy!4+8u&Qh-YwLnv)5YKm7j-nnk=8ig{@8y8SJ&Pz6$RY~Gz!Gr)-69zNiQX!
zM<$Ba$@b&&2~V?{N((2&6%%;mPZ2viiGJA0J>vL6%gIBn_#&*+nGx8ZWE(v%5{=J7
z!H}XuCmp)Mi12Vag`Ixh`A8rnWJ_<%p!!Z%f16rRL-^ugbVy#FR(oTjke#uJqGnFT
zFB)IuTnUH?JvN!-<LLoAyL%W_wtEBt^^U3QZ(CMaPH{dN%a$#}Q6|&@Y{!yismGa<
z84!@g2C+7HtQ{t~tj4{44&}5M&--x5f4mZ-A1$y`H(Hs*1H___=H2%{7tW(Kx2wn^
z4x`Hb!O%G<1Oh^t3DE@{vC(3SKc~}{#*VoO-xe9C>L_3nPGs9AO{r?;W!b9fr_C#`
zPM|3<i>-mRR=TFMHRZ8y$_fk1KI2mGNL5<T0!V|&fs}EGJv%$Q#Px7v=+Ns7GT)}c
z6ske$6#4+8eT_r4d8Kxzf#{5!Cn`^JN4hQ|8;k84*KrAM&8^j+w$fZKK$5bL*gjM6
z9vzysqRp)|W70$d_xgz4-^=c~8~owP>DKqmOo5BWv)LV^p;WPfJs^%)wcMN)MI3fL
z2z9QVS#j>%nJRsGp!pfRF<qX^s!=4`vvDYB{^Q{j{hW^o_`oxwk{AG{bj~tvkzt<+
zDQS96)R1<d`~$<QNPF+7=SM;HoX6@b?)#p7yo@x8f94Xu7ODUM;>bnt>;`K}*OldD
zReSaMboodkqUZ3!?qV2$zO92fiNM~TiN9u#lM?VlVsonAU!E*{>s99yVNol{|Eb=)
zf{xB(*<-tNHEt!~n``zDj3w%Wr9@bFz)Lq5w7^K9mtj~hGHo))>gd@r?$#N7dAk?X
zt6S?-4Fwg7L+8D&JmM%1$|v-207&p@uEHw8?GvzuB$Bxy=K}&eRZCmX^Oz@VQbL7K
zv%365lVth;q=+XJsDE`j;RJ4|#^!kWi8l>2A6wK>Iw-tpojKT2<GAVGT4v?*9d>Us
z-@`yT_N6q74^6P7fq_97w(`rwLakViqMb-4#bnASu)NZNz0bohis-7ihpN>udDEPs
z)kDnd_RxXHBO;FEgGMbqgq@9t<JwD8PYa$@&N^wgT^=R^Ovz>X`MEoo28dXq?5XB9
zOL|2v4k82w*!*S<1ulX3>@lall1)H7l55z>Pw_QAv=pvd(Ci$ncR;>sx*#MraFznd
zXx}4M!*yS1@+Kr+$drq_V|xxwc4K?%HT`PD{xi5vSmbEBbu~ucvwA;qUFfO7Rk~y_
zNi|e`yb!8?xfeqSO^<GuHyD(f-0|)?uC1uDFcJEvC@6RvX5Us|fWzGsByIL#)T71N
zTaZfqIZse}ZA2RBQOxP#MvWCoPDRslHkVOrKx>rs#*gmE-hgENa`xEVzw=+I;kRNd
zF+EJIftVP;$P(7A+J}>9&R^Bgz`PGvp4-fSn~{&ReupxjuIleQ3J?nnEG#UOx<8$E
z=IV`C`{Ek5<%(VjU!B`a%gXK_LRVM$$4Y(2n&rDxgfEW`=O;~7i$K*YBrfaUVln{Q
zqhVL;u~zO2H>UhId1D>E${NJ_pu?R7XUITrZv^0%=IsDj!LK@C)d;4p0O=MM_P<e$
zc4k42iSbvn71^oVuglyKWZ8!ff^+%Z)Z=N31$Wzs=GZhFJ?o!ZP5;=&$>q;yDYvUp
z<FlS9ND`=^$KjoKFTLgu8sz1qv@cI58c$DUMkk961C2~fURt^WeynFyQG{x^khn&`
zapUgr)pdMM?vh#LmPed-SS<*|$o1k>viXA4iDl;JWG0D(ThY$B?;yCXFnJA0xc<e4
z`W_HJO!p^NU*h2=7ZzaYrKla#h<Mh4w5=i!be5=Sa_NpiUT4}ad)-VA2HKq>4>wN=
zYGL8m-qQ&&AgFNxsoax#V45{+K-|o-1c21dZ-wV*mMcYj0w``T{%>MU$(!he9psww
zenbT$^G=oeP^0CQmxqfg;6~1?uf8x@%g*QNm$06u#LHzzvpV)CR8383zW(~c{G0bJ
zjAnM~5k>MJq3%nyBRWG*lGl31M7nAY`AP)9g<0}4c0oo)8PfX^@lu^m`5CT<=AF)d
zZPP$S$lF=`0gS(bvEK*eZHm%dx&9jkPhFt?N(>%I<EinKvLGUxlI`O3&^|g8DndRo
zj$~kS3y1L<zUVc$R|8bSled!q*TwYx4oITWsSb$o(+yw?Wlq~#X2a?J5GoQ+VE{2E
zzRwWoDkb2VQ~4Q<jzi-7f=cf;jzuS+VUw?<Istt7P0SaA&_d4Nis|;YE+Gi%>DF{l
zON+`65@q8_HyMQw>aBGK%99t=K=i8PzS|Ci7Znv3JRSSGa=tIC|NiZ@xfY&5jq@*B
zC<lAg^<J~6%OL`=5BIE@ZDmW}_0ye}F9E(ThVa3Q<MFtSjS};yt9{=hH_Bc*%esJ$
zLs{JBM{`AGvus;)K(d9sdil=q*+!Bl5H4MFaFxB9co+xVUDnKBUw&d)ukH{K2GWuG
zH2Utll5H{UbP9Q~A>nn&y#T#%G(D=Ucrahy4lk+sguaE@VO*!}^fwZcfPfau^KJ&c
zfz9)Um$NO=TUUkGnHS{_4@~^k-mc0E(EAqx5<s#W+ixOj|MckT{htS>t#{I|oY9*r
zts(dQ{R8F7lgYz1Yt^3X)FS9t*)<r0qdnRE(b4Cuuk2ojAHc@sr_0UOci3Ci^yZMK
z$^|B-3@=<A=@}Tl-9}JXv-m88F&_M#HvRJ9njjqP|BF`wa^Gp&Z^j@1D^_a&a~>Bt
z7!rpy6WzxW1_Fj5^A>WOJoUn4w}Nk)&Q}+Rl^~V^xK++rNTn5oaV*E5RC$QGuGxI9
z#`hx;Qx7_+&H{{u^<2;y{$}{H=+PE``K@w{B41@qAR}5{`L_Mm$?0aH@pztQdQ@5Y
z^a(&^`vyi{liKT<DX>j^oQnWe6gKwY2u0y3KK&hOGaJ1fgUK?lE6??r>QYdYniL`+
ztF@&A7321oY~{?;3Kp}a5n1-AV#Cf;9+rZir68M69Uh2TCavlz0bQ4ss6ANij%%%Z
zZ>h;(G!T!UoR*~_8l1MLt-b0Hlhy=IN#xHahCFS8cv-C~acX%D#NZsE{y3yE0K>Ue
zFmvKhs<&3>Wc5<xp58>%Z&u+kRzYJWKnhqWvJ{*YH(X1Do~GAC2l^oGKZ4DyA3&{i
zGqyLWS1`5@DM;nr1DQK$V0?3*)>*|(*39IQ=53iW|0QBHFUMuf*A7`ya%6bb+a0}k
z0@8|#l!Q-@ai(e<-DaRaO4_CEtW&7NEepQoWx6naX?U~9X;PUaP#(cG_`%(`o;4IG
z3Si})BK^DLSz)?Pxncd0lDc%M6N4A!%+6T_YZr>`0+lirs!K&O4FKbrpXj=g?U{9_
zLJy!(PYw&cwjs=F-^>M+LUWs6?_{XPfoivTDswXyP4e4jDy+1@Zn_T(X{*%Oy#N=n
zoN{$;V!8$a-+4)XN{QZRL;#Yis$&iBS*VxC-7;^QRM-vpynXBp1<!j_8p5aw)7J5Y
zkDDN>IV-(vwQ|=u6vA_?b(H_~^ERY1&@=3L<GrB*T>-H3^(LhjdILn(7*Ep4E}oCY
zf}U0V=+))URnOJ=;FWW&5s)hyDKk^npZ{`SeEDmr@ZO=>gSj`AvmA4~!#)c~jloV{
z#j60eXB(t-HonlM=uP@(*|(A-+FO5MqdLJUKv5P{h4HJ87+mdff~@bUW0D6ACo&YM
z;q0BOKQq4Qpj1}np9lAqx+XIw@s}MPGRQ0e3j4Bdx52Hua`x_Jrok+7r`h6{>}jr3
z-|p3h?R~0Z>seMa<CZzixN@V3WSyxZ+fvJcDW_*$o<_?<IA^jKu7Nv^pd~}gzC<B?
zHTTAjDcQiI{N*jKTB;>#Ll98aUx9D&cV=AbuJ@aw-?exV+)J^Fhani8JH0(y!HLm~
zPc8V6+x*9e_t!k&wIwCIU|4rv@Wx#J$dnAXvI7FL-mb6*0M+tBV{GZoP+7(zbSzh0
zHi5^=J&<{m_85pguW8ft=9zGXPQc!U`l}TT^z<;V8%un`SBqo=wqBTKj$L!@qr>*J
zYMIYTv4VlYHh_^dVRichv9)+OBbYn(lMSso4G`2>&$Dg9!3kjZKvN~{CwKgXm;_P;
zT}p0~KkYIzC%EjO03E2JP7njkNQUXRqlLSmB8WBV&aolzY{lVbwV>}p)FC*(KINYo
z)zl3fKmX>#9B!-v<yxo5#>cvq{JrNykCf)bY@X22GqgPgHIJl!r18=_NST;t;Uv|)
z4|M=)%%I1vc&DZBwrjGW#YR&y^OL;uNd%6Tl7$@iP3NmuEvM90GaVLE=L`Dqm3pWK
zV!7wR+l3*N+GV!($NNzUwUukz2u8jo=wltVo(Ck2Q%ouSPJ?EvTQ2Q@{dvIXvFGnr
zhY(4$`{ZW$&)oDw_CMICMmx0(5p;C)0Yy(w&tZU~3EJD+3p(0{s7EFwXdAU8OK$Qm
zKNDGT)Qd7`WNfm!luLRh!iWVEFt&m?^0Pg2seEkhA&sCCRC6ik;^LaMD4RG1LKw>Z
zMY%QJw~dTgdRv}>cvR%Yx^Q<!g~WSL-oY1|Um>iReE_g71|Ql5HJrR_n>1(*@DC|Z
z0%%K?4Pf8foW_+uv)8Ppr;A*yD@wZRKtNDNT1)WCfZM?u;gbPBzu7~lG(lFm_dGu*
zk91@?d81~w&G_w!G(JxjVh5jfM1D8$nIb$J+y60d-^uSk8+c9gw8MD%%uWy18@5}H
zsGLH#Uwo%?ZgY&Mt<v325IJ4@N@z&q4i}rh2l`5n=<tI*ILe=ZWGd1?`S8z@(mfby
zVL}<TI={j3OJ24u;VR6K5+&+C0r*}Y*PsNS@7LK~!3Th-Y!Bxe{j;J@0nMA3W#TSw
z<4)R#6cc?)TRNS~C%RuRC|}O+j35LLxu`GlUW)7w4|;AvMUU+7@0du|=*&cBp!QLi
z5%c%!SIIT#7WD}Q;$R#_F@D~x-Cimu$itdz+=&}0ku1#$yfT_*Jz3BE95|66QtATv
z93x4k9mW#!QW6e4Khbq&m{}DQheh06X*tWb#H3(9_~@G!ceUl($?ICR8VIS*(5;^$
z@ov+5CYK^EWRzgmZS06l*^q4E0wUt(P|0wszpH<i)*nEQ7j$f9fH_=!F%^*j6@6+o
zl4|Z9xnN$WS}(5wQP-@>QAbn%o?B2O^CFabn}{n-eyYm$YewcvFZRAlF{!0?QvJwl
zG~B=q0Jsp-_9cx`fRJLwA!R$j#a0tiC<|Huuym*(z`8fsk9Pos0PNnu=7b`^F(e%V
znW5-7E|b#^3>L}F9_L)im>5Y7Ned#KsIs!B^VOZ^i9iCTL1t@3mC$`ST~YxZzEHh(
zvQf_${b=jZ0OcaRks@7QyV5!e1DDP#(-VLfBiFvA)On|PmX?s&XR~_EOQfLc=Pfd>
zcb|mHWA_2&==H-Ua-V?B(&n{Ps#OEnt+T#$W~FGCahYuu=K<`V?n5g{_@1*+jEN+?
z=d^YlTx$Av2=pGvyb<Kxo(qv#u$@Kh0oZ?04E_eIPI?K$uDMCrb}{lWH5{Wk#<NnU
z;dFH^<$K-kwCpvqPRoo+(Wl+yUG4hbuWh_pL6zRT4wPidI?c+NO;@Ekz}Buxzo!ZC
zjhHdJ_xdo*_eMX47|ma{(j1KS4up5$Qb<8~L?RC2FM0QtaD7Pc-tB2=@0DNAXr0G3
zoz6;o`e+rkEoB@O4m{!$Ug{W_r+4A&HmzIhU=!n*X5i~OQm1LCpTcv13pMUl?~SLK
zh`ZP#-T#b{Z6^FdDTa*+Oi*7iqR^1qFx6e{;VQKm-7i}!02a6?Qq_<BUQ$yHvnnx!
zQbSQE`8CVGiCtLo9Y*324tmd(;wIS9v$N}yuxYYk;!`>tsdLqTFXKY=2{>*}cV8%V
zA8m4#cKdbOSFG)q%Jx-?W&ptdb)hvCU$vn{wldQw-sf1wWPWiT%P!kf$Hag|L;16P
zye=QfUSs<KHN?q?NsjGTjMeGs1pFYns~<L#mj`iIwzC+TmBO7{775Fw%d$BqT<xFx
zOTQ#jSBGxZXpZExOB>Xt|DE*rCVGCI3~QeT>XUZ9nL+}Z92E$3=mByvplwhHp(DH1
zC-1L6?3wga6U4mEZ+MvU^Z6>Q$xaW*Tj3`**}*x0#EQGb7lCJtYHnMT#dZLAISnvv
z5(IKw=CKHu7Dna%wmOiiz}vCNN6Hf7?M}>v@KTu9kE~a3nPVX0eD=!UbcE00;`%98
zu^TMmVPOUdFu{0zV{D%k_r31x1P8*^K`aFUWO;yqb>tc%C5um<#BXet085swS^7>|
zVU+g>$QTgeM!IEc4ElyBGvQugW&)aY+Mx4F(|6&NpX!-SYG1ODfb&N}D=NgeHb~mZ
z$*GMWVvy4kEKD)ituho1BpACPD{L_)1a)<Kg8*vHOm>wyI0@oz-~XgCK3`s3kZ=>q
zLAShDr&}A%d0wEM3-ga&j8a{vb*A%gI!umwiX}X#@<jhlPMm;pWY7Y6z=bR9?GxkO
zei}7F$|B)9@2mNmDaYmKMDG>l^I`gnX6u-4DIS-fvo-4HMmP24WE8@=+!C3SrYoJ)
zff^AS5wjX1wn_>hdlpb;wu1i%;^=gFnuY(ZD7A^_>wwpI-N(d<!WhuSM!85glnW{~
zoVLb>OYyEZb>H>6EZ-eMGBJcNq3^aYUb^$##5BKe+HS1KyWNV!z8<D5zG=V8&OMPx
z<7gR#eXReisPadl`UF*J7a9WEr@dTZ_;|*qUkSmdVbUPTVR2N+NS{LCLA1Yh2pgM4
z>(TZLc_dBXK0bl7T)UF{9APLR05)ebNgi(J5r@_ymV08cQ>4?d^Ew5_c<-O4iJ!I$
zB>v-(2Nk~Sq6E@+e-<TlQlKF~s(aBG?L<$o8i0VsY^JI>R)l4}_95=D`B159u3E$8
z8^iv1?sTz%#>>OP*OjngMA_5#6cyV*705M<scgfma0Wo>Ow%`<&+_#f_2PMiPSuZl
zxPbKhaQUq=aFA-ZJ8Y)fu7k|PIj~pLB#8ltdG`*dUI6kp?*y^B&bv>KI;{ew9l55C
zM<c+qFK7TcbH#RD+R~QouNs7hH!>f=UI+Ji6#MF>b=~fZ`3>GVXK`x)2mppftx%8Z
z)P1uix3EEL&I6&V>yY_JP0CCKTN}~dq4k%C#Lb1ZFn*>PtHJGPZR@ZXpUJy}h*=Wp
z=(WZgfjWVad~M#&hj}%1vue=mDw-Lf<Y12NBT2=C+qZ`1#<v7cDYD9h*FxKP(hpj$
zh9>Xpe!WD9Ueyv<1VPEN^BOG-b$K`cL93^l<Cp@nn-HyfM%N49$gu?Kex5J54gvwy
zM9<icJBQ|8h{|$-YHqZS;}q?D{shvI0F7J_nZuE_(jZzOdv#G`Wv}kI=!qMRLfFN-
zlwG-2HsSf~oP5J2Y@fl)cWJC=*57J3BLpgAk~33&R(yRN$%7@l1NruS;{ZJDw7IF6
zAI7YXM`4t6TW_Wi_!kzx|1W@Vr>BP8Wv@?|Qaso3);*`Y?aWhUs%tq1{K0c6^jcE_
z$&ViKNm@5pXK7El4ZkKrOVKW&JwAxD_fQ=V7Jx}IO3V)VW&0`vahWYqX7_kL#5W<Z
zf`U7TofPj@A!SC?h{&mP07c6Lm5Qu<l=-7>*d~KzCN9NzL@-7QMMcm*s_+%CeiKWJ
zKgBX-P0VHt3un!|Q4O99)MS}D^I49F9&u0TEctZ-kNvR%Ns}1!<n-G>k=vd8)onn3
zK|5%D^=Y=cjV}A|n3U?RXZd$*$apMcf&660gnBYinBR!lSYekT%nh$ryES2dprG~2
zeYq=aj?Lr*sJXFaPQVmLoZiOB?e8Q)8cT|fX$NXD7=eiWLlp+@GoZ{Qitu9B!B5EK
zlmRH+Sj6A8q_*z^5~LYG+J;cybm;Tbrh>6=qkZ}jw-v}q8kRx?W)_ZqWGj12<g3;l
zUYspt=)W6Eb+@xC0Y!NtFKm?#0#yGJP{kAlBo@w2m+Cv6zDi*EY?dZOtz5|_0+V#O
z^vM<)3?E=pNPI}D=WNjS4gkCRs&^)?lFb&*fLwa$J#95H_@1j!pvSBGTVQQ?%TJFN
z%mAmiP(JcEChxa`6)e)Ma51>VZEqGYVCUrdw2fD{PD<P+s1XH+d{7572!9FPzQB$m
z&*EbJz_WboSs;KPsWL#7&V8k;R;bIqPwENHW%KBkgi6<2UL_RO>>hWI8p#d}f3Xfa
z;aEKw<(J)5>rWEFJRhx*-;2T~w?JRz`OfJuU#bWm%&!9C?$zYWc3#-=cX^7QH_HA3
z$z~S;lvBoYrt?JxrE7eX>wU?Y(~>61x=ga<3GgC?n*L5@lV`n0DR|r3(%SZOapjyw
zvjOsZ{dEitLpBxI-T1+G!Yj|<1Ej2aZ2PM;`2%)iE2L8SpB#3+++p|HT@lnYYv@i_
z4wzD}t$5s5p9exgXzq=ke%{+oCoVBT44b68@e&D(eDme<j9J$Q<+yDg9459~OKIi4
zsWh9NS+Bfuu$<^QfiDK8@bqMk;;B=OoXs{^$(oH+dGoy!nkumhbgz6{es0t;DV<Un
zjDaYX2U9B&oLlT~u|6?y6fiSB;i^fZdmPUjMYk^^6jQx_SQorSus;3m>;CN;s+S~s
zUKWYk*gB}YP=tW2g86utW-cC4W}i*tQ0o0FWRF3I@v-~}GvTgm!WpW6Jo}(<?>DWn
z{8MXyqN2?jfDb$4eP}G}+i*>cR(c*U2CfXg%xN}X8?POpa!4crqP69NQN@^VvM~YF
zuTb;IL&k44o_c-@_%_C<5v88%(s=wc7$!Ui5T`>!Hb5yxk`++=0R5y}W*VmBy8cZe
z${4)#0EfooAnZ07XWN9X-lB=n2Q?az^^6Gj&e4Fm-0KJ|ee84jP@vlDiTCh2mwifs
z9Sm~HD}cI|C{)e_YVx{z*&8Vd(JCNW#_0gZhVY-G$#<tpr1m&?buzo-X%YmY^bjd%
zI$wE-`*E`d@Gek004bsI;#{<dU6XQezP|W;2X`@0UMo$DMH8_$EFRAbf~i20pBM)0
zQ@R$u+L^sBBLbfFbpU^zNEd@GWJDDKU`IL|AO+VBEmBXyW!bRt?59s9G4o4yl78Zz
zOk3T#e@&5|Ek`IW19U)XrsmI+7JnSc+z*&c7j_@j%m)VsNb1$E>07#nyKgHW<<dI4
z)F%VwX;e^It|RwtoyLduK;@Qz{Dn}SKC6_xe0lCt0l7Yz7m#S{{%4|%_PwZ_H!~@k
z;tztVIsZ2Vf?T;3Mj12(9O*Q-w;*7pqXgb_Zp-Z?t@6{jgU#)$(KM%vj(%-9I5_NJ
z!zKQyC4pwX%hLCJPO~1UQ&pMyl+Nkl`eKEn!O8~BGLACUv;z4^{du?;@Q_)n6W_j%
z&vVVwS>|<D88>~eJlf-dq}mnVUFG(S?j$Rq5@)$b7W0LQ*zPt*Mq1~^Mglr49%5ZH
zql?E@w|nILh=cgWmP0}H-2Y+k&Euio+wk!gq(zi)B1@@MLM8jwCMlFXyRz@=7`ua_
z6tb7K$Zn8*8<Mi`Vr+x58~ZjG!}p%f@^m^qzu$TO{eI6s=aq8~rqAd7zL)F1?(6Cr
zD?uxkJ9QAN0>z(kn$KaIxm#ZH>6Ggfk6CxPX4^pr*`u5oYo@%q5Rz1PHm2{Dgjwr}
zhY}l`&l$z!57N;K;!Kk;p=Me09`6%5wOI|k+R1(6j#Islb2BV_;?@&zHqPy=+L-q<
z-V($?G>2Xzy6>G{1T(jQHu9-bmP(Ta?wZZjc}>O9O)bTlemO>AO#L#VacM4QS#90=
z>t(xH->kbBExXaj!P-m4bSzemS{OX8Pf`69kA!2gSTR9=`DNWKFS3n1DcGsjtg4ji
zZ)-Qvlq94%tMd<}8AD^az2&>z9_!=A>O66L`&V1jQwlViJQvk}$$c9E&EMc1h|4ie
z%j=~ZQ|auxh8^M<OFGZqKi-##d5u!hItUn(5|zKHNB7&SgZvh~YbqvZRI7?B&#LTD
zPk&Wt+If4dC633r45Q<LEt@NCIpRKFficDR6x$h@0OEW@*}in38LG3)aelk8#+1&X
zm4TJXj+(v7SwL*eJ6wPcERiEzevgZ(&plBj)=VYP&jtudl0~>_Cf!FVpmbQ40@XQL
z9W8KSHuLg+XY^_>n&_a0Pb3_W3xgl4)0?ehJ+IvYJu)|!dftoP{J?Uaj5mgE787>X
z%|he10E{V%Dr#6C<E14oO3F2Vd3a{l@9_Ch<!@E|hBJ)B5fgMVh%U9@*jVm3_l;Cq
zhl-hkzJ8kparUqUB+4b|r&0|ckEAG&8d%Y>Fos+OPWHIo#E{e%u0{3s7psQVnGbl?
z<OZp%i6^THNTamHV!yo6yBQesRV6sn=$wujB}N2o^`X2}^ueI#?q(a#^DZ@#8UgfV
z62=43ZhcDU3*VSi?a*=S8B$O-2oRtww;85?wOq$Ao4S?Z#4D6F_{Fc)ay;m<?v-Lo
z2j=4C_??vx-dIrG%Mwv|qnU*>q<taI(vgwHP>Y1wwQu|TEtJ3wiq<=a$#`a?y*oR7
zBaM>FoqWm^;Vi1@@LV1*YsbFD_h4mP(TRPl+~>F5QLaKRv3;GNltd+}l*9`=%B&*l
zy(9;PWKk6EII61YbAztakM0@}R%7IJ@EtOv%iLdB+1B{uJ%3mOx<bc5+O&H02Nn)n
za0x7?7tOn~U%u%|NMMh+{A;>$1X|JNxcc1vxg4LA{7bni*n^}R8lz{jVu><kHd~~q
zgIV}Nj`v5+Tr&_)8ObnqTQw3}$18vmuNUJ!QIf4YyFlq>_5u%Mhj5_ib1j$o;Xc1#
z1Wx!{ORa6fTR3<&X-^pn-K^0*&iTQJ?ju&U7|SRChE^)rO=&sTEL#KwF+2*!pH>NT
z6*{I}8Iu}X!Q(P>LGIF(B9FzaTpD%Q^L6+a0`j-DmRFr38irRg2!Z2w_EnB2o@}{g
zu&ISZ82xP3j7<|rIYrMpTzXSu-fCdvF5V0^S2pn)YCa_MX>#B+s8xtE;m%)vPF(oR
z1LPcw=4@R$6D^5Fl+7$R<K+|%1|93nz5t`+>Oj4b?bWPmJx)Av?c>6<P7P@#z<xt@
zu__RU#cCtg$>9iME%q>!9XHfsP+1Tz@-N_!iM31%JjO43@i;Lmi<yx>Lxuoz*}`Yx
z4IkLA8e`XGF;pS2tL$0>xuB@L2W@~m_)0e|v~RLs-00=hltiwq(JWtvB8MV3lk-}O
zQt#D-n;s{f2usn1rv6IBU#6bTq_wW&#+>q$7tA7Ekf>r`heef#cX`7;Wbx8fRh_oF
zr&A%*HmG#a=*N|Zp&Ja86n(!<M7Kg|$nd2=C#H_?bQ^CH*?8=}{iHTrWvO#$=GUEH
z9{*BcHONgGP0PHzaNKtI1&dg@k5O(;&b2O3Id-X~+1BacO!pgdeh)lnk+AG%y!T5T
zP>SSgS&*ycKB-)uZA<XooKmguOF0-*d)0d77e3Qa+M&)-$J11U;wzsO<2}{q>_uT}
z;Rrc8dUH&m;$2hG7!r$!*qpKQ*iT&aoYh_U`l*@WRJ<~9Qh{{NatLjRdd|!rc5)=W
zkK-C_PY%QEEC|5lsfVdacX-fBq(*LO0N++2mzs4Pb)mw3vi&8YY$`21dXO(U#vu}j
z?;n^o!lC?i6vI8`)+mt4+dyW}ptrb*Fq7-YotxxU=piv&>VKMel|0YUkqs7^q{~Du
zI(>e|Rp&P>f2gcQDEZEQ#dp1OPELDH3LxXA`_WP=8Jaki%LO=q4NCTU7iKp-DR#ey
z@9=5LaVMVcF~3${+UV|gkZ!%2JY99%yk~a*Mr?m^%(5u@nN`$RM!-1cR5HTC(z{Bc
zVh3i9kg{)~R{LW|?;$;zQxnWm=dNOIr60%WAmkgbb7{O&H}qIRiHrq5YYuVl`NGOl
z?A_=kV9kQMRETsn3AdAR+)iGJG8i5^wsd|v{DYU*6Rf7wr0!DkWuk{lLEhDQ;7!+4
z<M``+{G$Nqi?Mw#8d#a?>%=d2vE>Q!95<!-*KKi{i*IaW9x59b5;oU5UX2|U-{e4g
zD_5vy5#^ISF4i1nY#<V;C4zuvBQh-f4PubbG3t%o|F@YyS}<uz%k1|hw1pP*)p>W~
z#?!51fzpBL62d)%k;{jNSh>_MAf}X@7Ctc;0Cpwca*K1*R1g7Un&4O#w66E;mADGn
zKk=imuUH?8YIQSB93;_mY@7Hnw}Q`#AF_yql8%;fC6mVlj)~j);^=_ZS~%YUcQ|W;
zot18!qW(M;n+iad8eJY48L9m?Mx_%I%(uj<19M8Jmc)kWDMe;MFIFR<4?sja@Zog^
zUtjgsuMa(2UjEzMbPN9>!1r<N$28^i5g4DoP}O!iW%@$-dWQOpTHMp;2et{3C4n`p
z9-3Q&+XRo23Av5uCOb++lYj(P`{WS&2sCp3N82&h?*^EtCg}x$DRoENdGeIg#$<BB
ztRg<S#mkL9euj6z#k`Oj2AHom>N&IWuJ;!YaJq2;|06q3ODEVxv7LvaThDPEcp|Y&
zk7=#qROY*Qo|8J*zM1p5i2chw&M*y&)+GY`JxzEh-JL%=Ix4Bef{FRGL@3D6X<7BU
zJOWz~stwaUxfT&tptq?D(9P^zN3b}1NpAgWY1f`BKc&21dwm<K>Zvgv&C`S2_s6tT
zC`x#K>8`O*9l4f$!g0IY=yn6Wl=o1jT|-ZamiVQxWQ&&~LWz<6_A{RjbzWV4W!kV*
zu63GIb=$a_o&q^+w#R#DKo@oJSZhT@o?z-z(p9KrbM!rE(YWVix@%M?D(X~(wrgxw
z)=7W33IkIeJv|8hZpqybSx&EwdhR4Pt_bjKZ5Vmv-V1jtY{%kJ0^0OT-W*8Xi~Bcr
z_68fI>p$%&M8z|kh2&6rWf32smr8nym#nRYyB2OUlJT556Dn|%naGyiaF%)Gxg|%9
z@FOw{tBVD7QsSQ*K*3<!1$P}u$X@Dss4YMmYt$UU3)}6<`EHr`TN;Ms`)80P9-n|E
zET;MZ@if=2P3Qr_VSOUS)j^xW1?r!4S{Z=!StY$A$&+4R1y<pWswQ>v(#s(f*{YeE
zCR^=a=sEII2*7NQ$pdo#<x)<JMc#+Z*eoi4v-ibLOJj1@B7A&&U%S;$X>x8`4wR`)
zb)h)b$;(VSk`4`@GxMbwVc=39QR3<vzq*^iENpM>zU)kE({7|vmA`QS7Z_^?MEvOS
zHE8SvJ_(vetmPr%V2zCiJvjAR5vcjmm>V#0zEf6FpHm6U$YEFcDwlF~BJsWF?qDEl
zu8(DfjscxYd1Zw!p`{*3aAj372B^@jZoNRsWi#J$2Ur~WYMwloio?wSbm36d_J%1;
z(a5PRcBP^Lhsi>^Cr?DsE%PO|Jm1>t7)*UvPNvx2kRelHcE{P``A^n2<&KbA9}H7O
z%7b|rTCAv-3n=FsxjHT1&Cs^LDq+&irlBen;)ASlzbt!@ZX;dNNdN7ff>d+tYxe^4
z-ZDuNXkQJdtRXzguUm%|^~7yG`)Y8Q8m@L=IEvhRsI5SlkYU;WMl0PoU2hd&P7fl=
zM!|UCR#&Rc@Wv&5-NBax<qGO*x32+0$*M?`!GgrTfP!qtp4;n&&DW4C@0Xf`LL&KX
z`x4b!{rZPx=OupGk!2`;KFwo9d&-@GOI-c&#C@-!4T|-VRGmnHrouHj)pToIZbFUu
z=j>Ql@nLInOXef=WdX{EG%McDuTBK^6MZe_GDUN;b=z#0KKY!o#8Y7ohJl70c2$se
zalrJ$K(oI13!B(<cD%V_v&y>T)OkfQ;ymw*hXtiQ<}H7hzX+m}L+`X+Y2&{-KXKO&
zuoZE)65}%jM>%yj&Fe!o>HF3f%J>5w@7Sdb%cSARIdOIS5r2V!7fe=V7sno((mA38
zXJfe0%L?m5yO%Jh|BE6FThf)V170{fj)%XLT?Uyfexn$tNPE-4-r`ge=uBXhTT$L=
z)lu>|x+~vXze}8PY*pp{L5fO`HIoEaVT*9Wiv!1WcQrNLrZ<N2yd@><L0Zz=`c(^&
zXrkHswUTt7TmCQ33C`}lq4q?8a;upT5+f0lR+<{7rjg0Wf1#d*8o4LSqtywWsMg_g
zv9K+y5BYM()>^{O#ja{%znvV9L#grZgRiL72Z58wLpG2izk9MPF(FmB<2}}VxSH$I
zWC&0HD)7mZBMDmx#oG?;Jk<6g`3V!e`kdCdl0(}@1Lgwb$%^-1h^WwLN?dVQE|j>0
zFdn?!ES?)>;RE|cwwdd^ITA%U%hE|(q#8rsxiyWsyTM-Gd$8_q1u##<?kLJ^H6jKd
zCpN~lHQCp^`!R~Ve+tqKgI(``YbZHZHLriEF*~utz3i>f!CjQc(%)yO<wn={4-jE<
z@y;b)y$UG;fG>5h$ux<TnFZ=QDT%<=-`~*XZ`?RGh1d0Pe-voB4zL_R;OAVD^32=L
zFJ?MAd-W}gCZtFAPtM0l#H_6BTDM$Jt4feH7=ecAAnG<VCuO+>fqUKhgA)D;wlwA&
zv&W()mxi7UbGs3v$$x*bDXzj5?_Fp4q9}E*8a4j|T(H~%MP<$1*wY%e2UVXP^ckoM
zIGQ2uHfq3dYes$Y!FBeH0av8gv09O#Wiy&}A2aUYsnf2SktQTW;@K-ZtZZrIj<v~T
zghQXhn+&g^%JH=F)MFlPL*;TWds!Nq15Z(A5*!gD_wfz;7L-hQW?5JSt?%6oB;G$5
z>6CXCWf-Yx`@o~_R@PAq%D*X8MO%~lcAoy<9`kS8=U1f3VSkmmcr4P)HA*&CRE>g)
zaRj%-fBB4iB{@SaWJxsklI_T?VxR{8e?8&bdn#9KY0ttF9;~J%(;-wjuTL*!^@|A1
ziz>b=o&4g5O{kFz5-Y_E;^c%=-yN9tC=h8brQxK^WSvE?j@=hXLGA3tWtO#;I=yRv
zL<sabP5x!qx=VD$hz*!nspZ%|E{$7~)kQnyR$Ge10vfbAhVzw%b;OTJFf<C1d=^nk
z+`X|9Ob;Z>nV}CFN&E0yZiE<1D!W1Fs_dZ`DKk8>G#<rNU!&w9zl4gTOQe{sRE-72
z>o&90^ApCmi}!kFU3y?0llIDQQb5b@9rJ8d4N$nuqK}M?i}dB2uJBG`2nPnm^A2S^
za`!JDpBx+Tm91eUW94;EgSrhjpV`DfpII?=B3Z$;``v1kE>R;v!ZuEdDutR)8IA5B
zqg`zgI=ngu(*%Wd71?zYw}2x@M(%V}Q^`sas*_H*`ygq<f20Fkc~9DP{*?W_jKMtx
zPhi&F3S<#G!S6Em%4h_}L;N1Z#R-=c0)CDGMYaWOky<}GDG7;I|Gq*io@Wd^;ZsRN
zAhY<#it1l_=#TU%i&w4Do4UVjdU?7fg4E7CgZc*+(%wUa)$zKCi>!Cv>^&$F;$xh}
ze_WmRNY~_wJZlL~Znj^}Id<UFBz`M_b-+LFvQ~jb-xqsd<+@l=gpYami(yNLu2;#@
z$*U-A0rJZ|`JmKU*II@T5cyhW?0oVp*Ljh=Si{iNSPM=;v;29c%#zkZYNU1O<9rFr
z7cEJwD9XcJGMR=}W-r!iLxX~jtLlh%^SdqS)|M-$hsYS0BwNX3RC{{wX+p@_r)%N5
zbDbGW4}NhdaZfL%W|e()++>VJ`{J}KW+)-B;zd(b;RH=x8WdGJuCcktHpio!o*66z
zCs_IEKzoqNOet2evURej0vVTUa+AxBm~_d-T0L*X<rS}0+ZW3vO{~MPLFI8dm*3IE
z*%FqqqavR~%?9cSo1ardCSCWwFLnP^pMS}&OSCXu7DwNXkM4lK_k-T&LOF&_ftDDU
z+`lwRE$&-&w>h4ujwoI)c{3|a|F@9ERzPYQ<bOvqexpX+K4;xpW;6hJ^b;V!-L3MW
zI<-<e&V=hi<zma73=NZHA}>pm>U&)BkLbwnFZ#<ajvIi;VVOX<C#j)|ufA9ShU)<u
z`sa*!)C%gUoN=l7n?2I)+x-bwN0Ab1_igR$VsbNIX?Kvt^1RTeoyzZ6WiFMxUgC86
zm_>3nn`3jh#ihzepU{f;hmdy7{OdrHNwxU!DMGV*keTIxmyY>4L4gZl(ddp6=*H@k
zd9j)N7BauAP0wG*1}gDu%q53S4$HfJ{7D<DJzqKt(Utnx*Reto&nQ-Gu48(~$r|$8
zOZKLUgxHjB274y?Iiad%1h=&et~JC(&F3K7&-EL{v`MzNn-*c$*U5AG$>J+snSH=W
z1@v^g9)0j+UBOF^*Qh0eZZJzobRhZ}?R;jKdy&PKnDIH+^f=Tb3ss;A^Q~2U>Q@xO
z+G8*1tk}#@4+NGcnL0Ar4Gh$2NDr*~iZLjP6BJ-{H*#R_{sG*cTJ}NWt$mHYI~?{A
zzFwPmOa<B5sV~y8M$Y(HO{W%Dp$~GZn!>e8+uS{3xqX*@Ea`@B(2{T}>|ft3`vv5z
zX7UD}#5O5gheZv}yJ9P$S+<T(ksm02dRwD)cX7zjh#s0XyFeMM!YiBRw3YY3b1#8K
z@WovE1&bC9P7&(TlnM<hO+s?ijz!bEEBaJU0%q;EOp}u9l4LdXF_~BgJ0uGvu`nHX
z^c7f?9}Vbu9C>uIJw?0V<S7p6=J1&u<eWB=D1<J#Lnz>iaS**~%{+l}M$KfuFIx4L
z-S8Y?vhrUdABJtv69`#yQ&dh20Gn=&LX&Ub;N%lHBHyjgX68BD58v!j5KAnXzQBDo
zidQBP$L)C=Gh6-Xyenz&RBVd!2;IwL^wO@rHsyFJetPNg!p!?vv6A{a=04#jU4$(k
z<^p;vh1g}$*JNjNGS3pJI|gupWYWX6V~Rrka(psuXbW82(THn3*%zgJ4oq>SjukVl
zuL_EMd}U-{a6322zj1vw$UmxJeRKMKHY}g2EsYYwq^?aH>Jl7Ki3F3Fw@Dn7tg8mQ
ziHp~~oe|MmRy_rZt8;x;)WeOwkvvQ!_5mi@UsWmqp~K#FwrZO5tk5UsD0Ot?=SwYC
zNqbiXBvRka?LR!r_P2{HSov)Yy5P4p=-;GlJlpqy04OY>$hqT72S4RM0}YLO+Pk91
zVV~=%nW*>Qg2A`?Whe!<trO@+%Z~uyi?~92MjYrpr|<U(JuFgr>fW$dl;K8(ok-)V
zg$$)*XBumCrtwv4;`_Vaqh?)OBbJO7SMe8L&%Lr$$i3P80$NFejKN~zVAO=l$FA4w
z`Ea$$I-=L_=(l|xeN)9Z;kJahjzy4!9)YLUP`O(w{az{O?)@A{OCGVi5~o@<a>n9M
z4Mxr9r>-*BghngKQp6z(_9kKQ{w#zxqa5s`UOia}vjG`*^@=*GYrf=_`}gmcHFhr(
zIbBo{YxHu5b8^8Yd|zUYbsMs>6A0Ulz3~f6{aBaiEqFhXtX*|^EfuR4m_8*JE2Fe>
z7Y?e@yHN`W<JVXbxhgD?5POPCrd7f`(yDn~!)|s#j*(^#@S;g~(_}}12giO)Z^{ba
zSVe!)$PrZWgqhdNU6&gS0D_38`+&(%V+XQka7+vr>@h~Dpwy*dnL82M${Oc01wY>6
z-`>b0I#>ZXX61I(bMHg|Bh%6o#+>Hb6q9pWm~iJFM56LDLlV3HvjvEjaw$q|*HcZE
z?3Uf3nSK_J>*!FrnRzyAYj96<8oa1d>^a2;uCtqoNgH_aK7_sHYEPO0uh4kLtO7PV
z8K!PtxV82D5p{+8!+T^$%@seDRt436wKRJESa-z)nIcrkly&r6r|c<Xk<loD(27k{
z&%K4)zc7kt8eD5e%be+@=$&y$j4@k-U-4;ixJ1^n8(YX@7vRs>C2)K^w%oMG;kmoK
z?na}PevBpSOPF#!R~8UTt=l%5lN-u<iI)iQaGwdzkd!=rIP-<u*|0=S0TF@F+JUfV
zW(;95X2k_X7=<&0*?R4>hrZO)bIXT^hSFEGH*MqNTIPkC8eaj4kib_lILC)?BgW31
zA6##?Yo2qAeuZC`yW_OBz;G!c7tRQxgLRzig^^A)TZOO$J*8Zf-~hjK2~#HWCJh5f
zzzn3y58rGzX*ie@w$vi>)#*NsW}(a1R}rJhaVpQRRH*s->tkXHR`@5&wX?0?$wY3l
zf|!7BhJmmi7NJo)+iX*f9<NxpEGS#9f7?1UY&e@&)s-Vzvucx`ec;D68g(vRPb-mI
z=`MG?hLWy7{Y#zn1Ksc~NmXg1MLwQo>jE;CX-f<A3fg=3c4YS1&fMseMCH9dy3;w6
zS9m2jvEi*d+PS^{DB9VdFH#DnjarJ}CQ6paiK)_aZK<7$E;p%A7a^vPmmQ3<e>AOT
z=N?KfcTcUVt0^k$99NebC%^fzF1dCm#<e(sZH_kGwXdJT+KZ&wO}YT-M{Dob`Bgj(
zE!oU(=l+s&KmFEuuILLMI2Eq9fHlgeOEqJniX;Tbtqbg?h52kgU~xio{+*G0D;7)7
zmR>f`8Ev1DXx3p%NA=#|H}1F{dD&!IgF{skpSW|)Y02G|(3@#triOM}rv7F5m}!Ok
zhTGc(J{2o&T)}<Lad#}uS~mteR1$EkT(wY3^4yIn)z2aIiFf)fxnX$>^cvQi2di9l
z1hu3DB$j_g+cEEJ__4xG$=^l4R<Jv-r0^uArEus^bKdVy{>laj<t1+)Yr9THv!*q)
zkgNmiNbXEdWm1J&Z?P1phZfc7jc`}KB_?EypYzJ-%Y=hZwBjEB_#;0X?%eO%cTpXy
zahObi`S#z|JHFE{VIzY2Q-?>u1So?E?%KAyxxunB)KQ_Pq*VLPjk<pFl2bk5(o9GT
zc4bPy{EQTSGRBTc<-70y7A{^F?7KhI7tk^_5X@FIdGDt}Qh&6>lO+AHExQ}khpxOo
zbiZVo!D%SSh?jm3Yj$7;U|vZquJXnDsiGSrcNTGr+r`g7hv7JSb?UIDzwnRI4{`JT
zu0e<QD)?}+N?G5-Kb-Wxe0i$^Qp|E3yEDiJR_uT7zBZUM9bsUJa`&ca*9(l%CwAcs
z*CA=kI1y2JgY}%ju1>mxLe{J%<?8m<qUnbWf4CZK_ZrB~&s+E!AgrWm`t8sB_|Ct7
zLY~VcNwICAcwb7k`O^0_ajwU$<X%lJr3}7)LpyJI4q!VFPl~8-k>Ihpxl<=rt%mA3
zvQMqcs`C<WAj99@tt9E)zSH<0->oBAlAEyBfU8TI5>Y42$a1X#w%Tq7W{TW_V*7)t
z?%!NT5VuGVxAuR1xI1^E&k_eGc}LTa4&E{tRZ!b#xP<hF9nm`>r~Th{I&<lF`1jQ_
znq8(gm!|v6D*}P;5>ALswAugTMfv_&|NayG=(FD!^6CGNFXxXV`rRWxLW-7Vwg2P6
z{&p$;`j0c}@Ho3(bfQmPweEQHH(`kHpF}%J;*vQ2gypCA=w9Bh<mIU2|3myfB=*x^
z_u3c^lE(G_^#y<TaQ+BdZKU|-lQGM+*DLDasUL6Y_uufs9pthmC8U;ruG1G!4tI)5
z?SDMlKVD6EjgtEz9x>+pdyxJ;NdH6r`}ZLIHD>)8SpSVk|63vT??L+aApN!I_WXY#
zwO!%{0|xn@RxN*)R&Vd<<{Qesg^l)C9&~hcvu0d~ec@d$QC2IuYG3+qrR{5e`(Kod
zJ2`2}WQ<59U72&sUY8$*MgDT)Zi7B$*%80IpMu3#Zj;IkY;H;6^Zj0hmYpB?6MtGD
z{rMAbdA>*Hx?8(kr4c3P@aF!>?FQ9dZc;Tx__vz+vw!_Fd;ACV`?oA7-Gkp@m4D0f
zpI)TjBE|PW$iD~azkqcA9;E*bQTz8G{d<tUM<f0P3Vw&3{_XGn?eBia<o_&s{}U|#
zg)T{9^Z#z>@^c;A+S<Y}mX{aSioBXzSzM;SSPFpXyjOt{`(Inx-(yCa1_0UxI{yrZ
ze%(w~S&E#SjiuV}8L{{omPT&?!FX(o)1WjD*r`7RW%%++Drvkj^ADlmd~wRm1P2D;
zMPzxhRezDqqsk>oJ-45HY){ieFc_F={AYN6N++;F$jgqg|5_8H!py8$HU4uu-M7*t
zY@g#FK8h}iO4XZ`{c-~A-ce*fL(8wIlm70+cmE8%HZ`Eplp0~-H}AgPG1rBPGXCY~
z)~TL(lz@qE=>0wuneK|<_(Kce|7Uphx#Zi~kd)f3(?gr!l{L-#e(Pu7QbrmBIQ_E@
z_zDU(ASl5Mm(%5;(tMa3MYjZ;f_nnw<y#wO#f$Zvqa@j2P+e06--feb0+GKw*&zkO
z!#qG?$cnmfjPLtH^Mt(I|HD6gr^;97L0h>V+%**5fIb;rvZovzH$U>zpgN2ka56Hd
zhBYZWA<z_hh<Wg3-%dA1N#G%>G*XteZ}X#JFS;GR_5I<r@6YT#2GSd=G5u%rrq5|?
zj^Ndv_HpL4dYZ7L5%kBNp_I>A#MC!dXQFZiDmE9NT?WzKac6|vV^D0ZI~`?y0@m-I
zCKfHX-!T9wtarHVzYI`JldsIHhmmGW^Sw^9Lg#*R^8XkxrNr#YKTR1sXFN0$=@8~1
zTYAJ^g`*KI+UDRu%hgtoa7-L+h-d&hvOb8d&Q^ejiW=z+fbBwT9_*>A7g~}?Bw1D0
zjtTF|R|I~5NlSXbG8R+{qx~Jgqk<&u9F2STmyN5>;+{kK=e}K!{JAo_8{a>=KY^j&
zn!$T6<Wu@IWjJAm+YIA6$2)Ftkj0*)8~|+&5QNh_UYbJN=L*X$mmYqkB-z4@f@beC
zF+-}y)W2M~5+L}MauQa2rc2J>cpbfKqg)J^k$c0V>|Uk`EDD8!f@fIzx>EifnzFp)
z;SyY?-C&%wx>kvO>SfD*!Md~z@9zUq{<rbxt$%u&_j;)+DV=QRK24S>QnVS8^mLV1
zzm}#=zW$X8<%Iu7lD?b|H7hqz-#+`1JC*fX6k_{l_C6Z-RQalm7+HmleW`*HP>m(+
z5wk~NM#z!<Hono0U!NL?krCUfK=57}Y!DJ{yoM6RXhB6d>cBC<3-SqJVPQG-=h9EA
zBMq{YA|&io3d9KiA@roUk!~bA0A2rtcwj0?qq!Rc)8IRAwSay%X*|>$L@Os)N%cH4
zze~LxR1H(XyCr_Bvn$N7C6-Hy#p&&HW>CEKbp%zH+EWplCt%NrQ`+Tnu;x(wGwxsz
zNIY-rO|th`#8hnY**eK;11Ohg6bNTV3}la$+mhu+BA0zH!-io~zPf2RX0#>xb2OQ-
z*Prj<o*C(0?fHju+|R{qYmb>Z_lt8%OYNrayGru5015e=?JWYhV`zO)NzGpxa2%!*
z0_!G&=4hc)VmJBRfLEU=8^wRhBBJ^$d4TZLnPT|g*;P+avPg#*?_~Ef;w6$;FDdc~
z)8vf{d(Uf?C>8WsimZcbuiKJ$Sd?XnG!V*<M91_xYi%`3&q%+~`_J*_Qz6aJcl^^s
zMEUIy1!rcqy|+Uc)-WTFFt?T5jT0|cK`k_pWGs&gTI==%B*2pE;#ibby$_S+{Q|ev
zY@I8E6^cnR3oXl^DZN}S>~oZ+5oPjcb1abl91Q|GI;*ftP|G?%5<j~caO~{LROd6(
z6Nn|;qLJK`90l`#_DWM0zA;t)Y36aIah+&=a|tSj8|^0G6KI6TB6UbSdXl9Gf4WK-
z`_1PxRQcg{>K6H(BOntW3IytKJAu5JL&l(5dtN=SmbYdbC?kXHgN#?_%`bWl^_;e`
zTb{Fn)xcS5etK@rGo%y#iC&`?j8V8<X7W}0lTtNR;G`=!U7I-aXAZdHPa60$Kl*3m
z^?SqKL*R`Su`pc25nP_FXAr;gL8Sz4?StHBv4wD-YQ^yV?7qwn_uDKIQ$2wwS6o?T
zi#GudeEi(bq^U!#_a=dn&Qi+jHS|tYh~Y3<%jpx8u@(xdW1m-AqDyRJh2;JW!JbpJ
zq>`iU_w<w`tJ{-fKsrx(h-X{>9RbT$AUCy#3ppfx{k;hjm8fGEh*8T4%@z%N<(lcc
z)dio*A+Gi{kk%3JZHw4Xuz{eGA2ULosT}_G=-UvvbH=RZN-uv6C@=3+(fDKuH#(eS
z{Db0MF=fz98jHqt`q14BWZ`lntTs8FA*-}I+}TSvwP7TO5_@;-mp>ou``e^Xk9hyb
zr<WW8X>vOBz-5#6lWiR5V?j+mr-sGlZKBKa&z1^*>n1$I&fQD!9=h&(FbpIcPwkrS
zTO~Ka<lTu!cyorCU7jCuhjR0x5J;VQ=bCA{fmkxwFBP7g#ha$1PBUoP2OV=732F!1
z>(rDK>q63f9Ni+!MO1q4G0In-&7KAql5@g`EnvG%Qp%!G+yHU1@_^YLsrF3OENw5Y
z+qr(TNYL<`y(KLh6>fNg0HQuBTg%B3pB%EIK@*4!S25NURkQj=b3bWCUI+xf?f4}O
z8(&7_ZlJQkxnS%VLd>-9<kAc=#REyjc==Y2v^-8pMa7R|pNbZuGs9t-cdqq1byFm3
zw0tvL(U$cn2#f3FS0sPduk<3%BoS=9eKiwsiLQaD>6U0lw-Xbhe?H(HyN;9YoaApY
zf<vtsY<b$u?t{&f_4XvP5y+Z#H<>I(wqBOMG`n5re6JJ}DdAC`0TH>}n`F*5x&*YL
zDd(81O2+$b6>7vSEkEhO1W3_5l8Qece~_YU_F*zOU7~SJXBiwa&ObqZ?QbyfTFMem
z0?G6`&<SVl(GQVL(?c5c)PTL(2@pqe`dV;T@C#Y-7ayi;*W<gM49Gwg5GOJf*xUyy
zF_PW|HpjcbXz2C;c#xT$NS_AL;|W>zxn<DCXh0PXOcfAGdd3WOSNAZVB>5g>fZbO4
z`hzeqYEqdk9%pfa3PT^P=@wy&)<C7h%@SN_a(WD->PS-feHMjUhH7tkma79xa4EM)
zhDOGNB)_hVL!J3^uzMK-7giDUvn4>(Te4Zp^p*oSV=aQaV96-Soq{C0KkWdk?STiL
z;fg!1xVD>2eNMF{X|YSOx{YiRAevr^asb_WbZXkT?fYMMK5dpY9NwjKlFF-(YIzru
zwpc9_zXE}u6J&nz7Fk!P;o|iZ<v%6Ixu5GuzT0vhbHNdGa<F)0oVeS=?Ss5bqmFOp
zJP?tf7E5sA2W!4YdJXe;kB>QYKbSo;v>_C+oO;j(Xv`u}LUx9Rtd$Iv_~@+|2{?T5
zbE8m)*5Hxx9&uAPpxsmI!I9|NpBGySo{ufqanj)$q@`W9QjB}_I&Oc7)y(xb5{zv_
zd0W_O*^Q&<(Qpl)%$%G-Jx&5I$C1ac{*#U<KcDa%!Yh9(#OmbMs3kUsw6}|)>iFb>
z{!p6l-XaPGQ$I&9-G*38pSG4O5w>iK2E)8-GBMAWd+%w*ESEr1pH>L2ngcn2GN{r|
znLNAspYhHQe@fGNT}@HBbd>5p<y^`uwEoS}N7wkdjH7lR6uc4(+JjyNvQ;;QbMOWc
zTHz_28^2&Uv&t^DO^6AXw9~0-9^c-=SB#R@u|fHZ*MXI>=<{pDXM56uGt}tA++9r3
zz2iVHzk!-<##|}%DN0B>tC&>uU;%6;B~ihAI^I3K)NUCT<sm+Ltd2uFF|ADecY6a^
z<_5P`1==oHcjtkz2=c~qw!!0O5s(TUjWo-Aiq*6d#|{3vbw&5<$EWXb&J3nIw5&3>
zzEFG2H*-(o!kEcgR?53tBwbk36MR-%MCL?wx`p=LsH$a`3b5bZDv$fvgozs1K!z=w
z?C2F>CX!ss0?fL!=o!c)AcBv;RR}P@F2TF(OTBS4USNDhELguiY6a4z_4OX<u0VAu
zyoBqTwG&*7c$K=yEJ7Ct=P~fcikG0NH&O>xg-=Z7)P1X<A5P`g?v+`330^jim!t8C
z)Aui1g+vrw_^pMGnOKC2gz%U+hW7Dzs*P`(d$|#VN|F<P>A98NbDH^uZaS(U$F%1*
zaRFKCFylId%ZDDoFl=PcOu3KQy~k{hRKjZZKN9x-Xe!R+UWuXfVi0C5>ebnj?zj}^
zH9dw{)@JrBNs?vEGw(=}ZKjE5i3o5eK%5Mlp|N{>6e?k*V%YXK05`_?oe!Cr1u<`H
z7*<~@p|7Ux?B35^#HLCc)IidC1CK-L_<Nh+UC}?3PBCmpF3yfzBkW>+qb8+FJ#eq%
z(<r4uq>EAoR0|V6I*7dFYsn-{$yKlhxh4>Z<(|1}O(<=zIgK+WfD_#P>4isJ$3z@5
z?B@o=%;iT!nbip3j-)p*C*`*71`FIlGre99y@nuY+gUZ^QWl&;E)Pn3WW+z%aOEJ1
zkQ6RQma1M1iQ9)-Q!$L#>7o0t&fAvPs8k!twMKtWQO(yP6@Ssc2li4WCgM(q_Nz2y
zTyWwPKo}sAQOGa9T*8Yz5|_Wj?Y0I&M)*bL3PvZcCrrDe!%PO@bb?YlqD8#szs$oa
z*T_xHX*9k4KnM@dDtim1)sfj=IJ0#8j%`ci1^lH~f_T4vPM?f-H>;|1`irG=9M^MR
zBrfFIhfdfGSAWV1{g6n~6#W{6LM-c2`A3-5(~-?#OAC#4?>9h-<TnxkVMYNb@W;sM
z>Ucl%u7(9y5SD+T<*0DZ!c5^HH)KLetittn;oGYSj8=s4qw&_8*9@opYoX+nFjGpK
zI%r_ZcHd)%eC@<oWfk;Wr8m4Q5@Xw0$S_0mB<DX^o;M!ROSOA7k)jSS3k)?Pr=>2e
zZ(_%Lk)Idg9XN|J)^i&|B8cigR1#9~CNNnXY6JriW0n?ps&!XN6w~tRq++r6(5P#m
zGTun;@ZGNOT%BGQ>?M(s8-6QY^dp>QPtQs#Zsc)67*n-wpG#&1-R6nF1#esu3Je1@
zNq!Jn8l51T!;Iq-WDe4dBa2v$e4JI4pK*<*EIj7k!99PR_y1s{-~M#w8Y$3mo;!D#
z*#U##4&`pHxRxYUfn$&3b`@SoLPcGUP~@LJzo%e|4acwDiJe`F8*gAAlnseWzH8(4
zWjmq>HC6s9xJd6JCyUL;LyI8!TAi`b7jKqXe6v}cFddDf%e|Hf+iW*np<QVJCG?lZ
z0wtL~+31jf)0sOL04BkRl%`;Wok3wk=U8twDJ#Ja$N?>tX_@`iF58)DyrJu0U{soL
zi;k&#Mfk|2oP5wez?e{b`K}bdaFX_3W^^1djI!9*BdOhYgqEzuOzI*h?j2;rvxfeI
z^kKNUWs*{Ud`r6Ro=Ur2CpC{xi>buK3GFSdGyOi~2$MpN=kKVUN2)~ppfe6d<n_p!
zR2+~4FG^7UMDz<mscO3?TM)$JE=kCB?W9;1R*;PbaoVbkWaZ9}W)XaC;%O};`A>bw
z;%}Z+Y)o<XfEuS;!}4C8jqCXAREX_4u+Qtm^^oPeLh8E@0*DS3O-j%=sK<}OFhmB*
z9GM*T31NZFLX^^$uz<aqwILqSTNl%}DXn7GdZwrr<&kHcd2D;2Vst;pFR}XVdY`45
zy56ROF2k!R4I3g!RSsku_$|ZYBS!amjhA|ZRY&c`nq$L#(_j|$>;S8Hzd+UzI%ceK
zh%EnJiz#p<q!%l&l_BLXg9_qm!(}b4H;t$6gx5m!*KWUpW_c8#nIT{T{&dkoNe^{C
zhe7Fh@0!)3v&Szqc^ymv&Wi6sB_2`ER!x~udf@^6VuAF9Q!rkKimw5@L(T}7xCxPx
zT`d$otbO*f;31E$NrOB<|Kj_NfX}w1m-67ZWq=sE#El8+H!H&4$aeYim8XxvCVI8G
zxvVRwGEid6Q3$*gC9@_^zM?;WpUrt@8uVQqq{_R@j5o5Na+l^0)RJmJi9c<+c^(Y4
znrOw|&5?Yz;4=4N9F9XRU5lemSs}z}7q$(jfy!PM)>e6+*s89_GWxYUV?mc){(v*C
zj)KYj#mZaskVElQZ@BieHjZ82ioLd*OwuI1LJRs5%|Qt!%c3_{YTH{x0}$vecjC-l
zgwIlfxoZd}$Ikv&2uw)kb7@(l!mRQHJ@Nl?2wvRuRA(l$!sMkdTM%3;XCpk?FSivi
z320rfo^i;_2p;~rxo5w}3o#wmu#_fnu&e{ItHY=$pRmh2dPocTT5U{v&Iu{~im4!b
zvSW-rQ1pawu$)j57+=;ewfI(80aACT2a529cN#r#2@Sxm_f<hUXQ)~xyxv;yE#m?h
zQEu#|pIgvnK&Y9=MIf4L3wf}~PvH@otakn>?%<|e`<Q`#HSci|(TD5Kbs9|qA9#v)
z%da=AU#G%Wh(FZ4zQ-oPzB81qh~@6Qn2J`MP>I#|_K;I)KnR~%Lw%!PH~TF@wH+Me
z&};JP`JhgiZRp%y+S9e*Q+dL<>8zm1(B^aAX6v{kok_A$LtkaIDtMheMk=6WEWx~7
z-h@T@7~4)|)j9xMd2zV?7A~M4O~OwIV;&G%;xXo+CAmjnP1LCQ*x+I~mxf=!Nee}A
ziM<h1*0H(1Gzzjk5v02ClGEZy>&}xK;J*zjy?WC~Ea;z?ez7rgiO_Ng0_UFYG)uL5
zJv`s0i=+pQg!8iTI$U>_jotHL4q0^f$~1U7bdSyAo#u+$+C~xgD2UvyJq8hVi4odU
zecZFDp5=7c&#hBb#<{Jk34!yr8`mV;DF95Otzruo!G7C-C_6#9=Dmm7LAAq7uh&O*
z!<&+M`Np0jt!B5uJvV-i_<HWT+ru~I4CeZ7ef$~cS6v_F*NOhwwEs2GzfRisxt7fl
zKa0h-IoQ5IYK>o;{JP1hzhV64`r-((=5+6J63Y2@9KQwtaTCe325S*k<C>~cn64mQ
z)B5FafwyyHDr=xSC1Bn-b$2eKy;W~ss*B@>x|Jp9?VZ7VDM?_W`sKoV<}Vsn(P(IF
zp59#UI`kN!l$1T$Z`TqAnc%c}kjUMtc#-LB?~L+|sd#}Ik~2cFrL|`Oe_|g_iTO>V
zbja!A1kXK$Ln@e{<b#4kJCJWrQGLY8o?}LETDC_8JL{#j9t!oc;Gpu_Q+P+g1Io*j
zQ-*IWbf)n6`AjO+SnJPB#b&5{m2ShJrDdPkE$l?C-n!f<NYYZD^Af1ATe%ar@Ach1
zlu^s*lx>T8qjuKn3ECaOuHpAfH>xOzp4UGsg@B|3{yxHW>_+iL*8e<4&yo|QwKMJC
zW+b`sqDzguqa^(5VwDpep1G~?VSpcn`ilB1isyE+8`upfR>Ry@dpPVn3kTi%(5LnH
zBixv6)UFqi%zT>;a#^8QR7hx;;VTM<!amDV88OU$GzG8AsyUJmO_4OC<w0C|TD~+@
z&?36@oDho2CXz|{&9)~#GqxTO30v$&&rF$#al0wp&&1s;$#ln{C*q&w+$=n}dN)ul
z%Zk}`zH$+q+$WOCrCXMc`yTrm6_FPVHosB=m_xPb5N(YE6a;hw!hS(7a79N16EqA?
z19y@6B(QTfkik3(>(JMPwv5O444+18Ctx;(9j1RNRzKS;r9XWBhvMPSFHK*=iqeyi
z)v?W}k<p%U$@5wlOCLyzy((@oQK*Q2_^I)w>Ksory9-)e*wCNu*;sQ7Cm12G`W-#%
zo+zNR3Nk&>V(_{5jJ9}e*)^~DX}xKEpAk@vVrK&@=VrA03S@98^W_sb#rA@g>Oda|
zgqG$}C8OX*HbW8V#=Dyiy^icsGa?_`QXztn5jKi<U_NC)rp;~g$*oFxyXBi5@>0xU
zXMQEAqZ)1`33#ql2O;+j99iVf#X!ZKMpAmqP0RYs^kM*?7jWJl&_F`h-t<S<&336;
zZTI!jS>tOD`nt<Vy4?;iX-TJ7?#g2;8W8QMxr?KvSQbMi=*8I9pFMo+6XyZR7XJWx
zdVVZ`3-N(R<StDPyOG+r9)N`Uqh14^i;!aPkdF^uzK)kqgCC;b+16<v%I(HF)wD`7
z-9b-I5ncR5xQRBB-6@;GUataPhwHbuRPLr0Z6%twR^);qU@f{h>g35RkLy!iZ>2+8
zwUm)GWubHLrq&wwO6r~dE~)%w7izpv!D6{)wQ|m%<U*ov-7|R2Ube3*dk*%T51|!m
z4>R*^lHefq!v~mf`!=)$>+n{@@^zSJJvk`%M)Bg+`D?K+JKtR2gM2%a&AJ5WAx7`a
zayLRFYI$QCAO>7-cbVqs{Ff>$j%Q%yL$g1{90Hpy?IBnWgP=!T^+G&@Y(@NQ$r8jm
zDqR<*K%BQW#&Ie&`BFNLU<3tIJIPaB8&>DlE>`ZhxD$AM`l)fEFzeou%5#6Ikp4v3
zf4$;==nRrZGn$F<RNOIa+R5#W0=G9)9|FS2iGA_w$DgjgQ_IayA6ph?U#OUKiH%Ls
z5)<dJzHeJ<%Qr#BM9Yi;d%K2Ca-CASdwlX9({3Zry|hN3N6(nCr+s~tX;&~KD#vGP
zhb*T(9B5Ism%GN&1JYngpNMBy8mSY>Oy3_9RI7(KI@mm{q1R_?`EkU&rnrr^&xgz2
z^5CfX9m43NCl(>C?MKPa6)+neNot+h_i9qKS<pde?EbCE=ajLzch<|Ys3A0-8$XRu
ziISTTY`ZAPo^51d#v9ElbJFzswn{XsLbqYL0%7b?GHw1aS*2T_GiUP?!qeW?inHTB
z1;~y@95_3@K3C_W(UQJ&{Y9h0>WAVtu_@Fg=%sF>zD8Bk!RV-gr@b~TU@+CCVPk1K
zZeHcopNFI!#O0OMWGG5E-)V0-W)||@8lq>(`JqQ;>1Er|tZJ&06);#Ug+Df`Od>Cg
zOO+`Dw5<%nC7J3))(;@eHQ8);N{SfS<1*$zr1uWiFDCj>Zf<XZ**@o{nspn*h%Lw4
zsC)txd^a+!W~$v<Y;P_!=dA;_KWg64`&l8YrF&$PM$BGAYaC=C12?yr5LC6LaYN<i
zafzZ1W{TS?2ZbkIx9Zv4e3Zo~Y@gyHTDg_F0Ci5r(L$Ma2{Wleo-yL+^ZA%gqwzh&
z@+~q>xfBsICZiobL#CEm5)2txDzP@zN6Qg0hn91@-XZcoo4s>JRg1I`dXEbAV`5cq
zJBjBo8c}?AZ@xco_q@rc#RCR9+RTca1EuCxCd63Lcs;!5bomRsc2IdUU)U+i+2@u_
zPC?x+l|{l{L(EaA5J9p`&xM|52`koNZOmIX$9{j#xr=f!!h9H)q>~LxdwHk)ePMRS
z(K`n<#mlA5$)+pB>wZxmEKfMcEU$Qx?>`ZBKSy6WjKX>8RkT#e*mUVYzhBf>OM3O~
z5T8qcJ+4L*+b-B;N_*!Q%w;PCmMSSi8IAKVDWaax{NjZ8e9yM~t-z(K=&G?v+2NwP
zqgO@bH9mpXQg!i`FPEh-VDg7oPEFq&f!iHztbvw3CNS#E6ZOt#XMEDsKCg%+u`#g%
z1@|$>zR~Xo)(B-b#|JIkYdz#wVB|6PJlpK*o@3TmR{flspKiFLu9~1{^+L4o>?dSm
zN|9C?rxdFn`y=joLA&0srRovQy2@^aMRt#fu5;mB=0MAhw!qXdcIoX!BojJ7r1|K_
zD}#Fclei8!5w3JuEdleKxhfUs>*EFPLIK2AMzM8MddYGzmjVi`#Kdt?VU;*N8)65J
zo(E*WI&%yf`t7#sIO6VikcT}ct3(V|;?+LqA0IdIRjVQNnq{qTFw&7>uI?_YN#0F9
z4VJcQGm|U74(-^JD9T#itngj`{TC*YX%Q*89jd~s<I^(sw>lgj)ZoulmB?aSE7A(_
z|23V^DsO03A8Pi<jJE+1lA=@-b(cm|^?qkxG9-7dal%(nwZmH;UUwe$7YMN6G}lkA
zt=_eNxf(_BDMpH1l}McP$g*YOi!%N=T=Z+|Y<%b&8FaDn+_RKL$Yj*V)Etzh6asp+
z$8oY53bK5lF*Pn>DGW(luc?tY!~ddQ^~qibI1T&zpouH-8j=?XM#sG3w@{BCZfEML
zJX`0YCTk~l=xU3`d{TPMGu@+nm+lA8+_`wdQD{(4d+=v(7)Ik;MqAJxHE)!|9G7Ek
z@Sg6o?5lK_ho-4y`cAWYY}%->F1vgM&1Z}BA_Jvv!Rbk*2ZP=TvG-JO0jx7?b9WE`
z-?^NCvr~+6^CC9lSLYuFXzkvvbd%D`>NxZcjibntyb%)xMi;6k7b-#(p#j5glVl-9
zD8yo+Y!XQ~<A}EQvJzv~XLpP_ah}p0vP8)Pysr1gFfki<lw^r()u|9mty87+19bbx
zm!6E=_h#7~A8!aU_}>vm%nfK&2eQWHHUV$o_FzHFxF(PJ<3M`xGk4tu*v#d-%KC(7
zIDPYGU-C(qSC7WY1~VmB&=u4QfK0XF*XPbqMUD9_P29KP9vh#Iw_B2o{?(XNsC)re
znGi6*6NX{y#tJRR<ybp0jV~}mK5TSDH~nUKv;WgtgM#-?BWdUZTrolRACI2mfCfH^
z_hAmnY4t0a?5CqwZ=D7|Ud>bT*rT1dqJxr7U@RaPHscd{zXolBE1<u575#Kh1Gf-i
zvcEe7#wQK@d%0qm-Y$Zap$~WNs}ec*)hKmqC+H%c*yR=u%?$IqLV^4iW=J;ax7zXf
zwC!N_#CW4%bW`vOXktg#jux<G#E?*cUw0NuFvZYR2(mY7D83n;XiG@68Z3X)P{zAL
z#HPrz&t){4alGV$4iTBe0%>LaT=RtHgJ-TwU|GS_+_BSj$tx_oz@gtp%EoenLUpAx
zhAHxEKUo9_9<7h<;cTuQu?4()kC74lhp~2$C(T#~G%Zt5;zWJqT+A1;N)jgoJo+#u
zj)4Zk!)0eijRFd_w7)Y}zNbp=6)_1Lx-r>B;$QCO<#{}#=Rwq|7n;hCPeil!JX_kW
zJ7^OJ7TUI01ZI6~RHFxgn^73v;4SEpSQ)}=w*@)U*an>M&hR$uo$*`J&y&&8ArZNJ
z4l++g8HEiYxrwvFP=IShpKTGwWn>H^C|qbbK1Qo?3^IU$E(7}D=;r&u!c^LQ;nn_3
zgfV3$rL`$%wDE^Wd&`{?#aH1*$V2(bJSZM5-#ALL)@#c3(~jr^a1k{XzKTo?%ifxF
zHTvk(1Jl73gSsTJ)~baTV!|xTV|$Av;Wk*NE1C6lBLC3b$br*rs#*wT!*FfA4l~36
zu8Tp_+EeiE!G??kp5=|#v;p|04qUjimW27f(lKW!NBox9$&f1wae>+57k)Hv`lF3W
zN!>Nrv{5;;VcHZ~w0^lMWl{oNZkd>=i|Iq<4O4Yll!x(w_ez3o{PW13jsW(8>27li
zCj{PI;manE<%ao!>*Usk+hWBwfzOf;sn$*9AI*gNNOyVJsrI<<$aE#te50X?a&^Vp
z?>J9V@d_ub)dKY=*b&LdjVVaibA~7~@_sk<b8HyzRAE0n7u)d|<c8(@kCsPrTaPAc
zmIFJfmd{IovPwmUk?ii_`&4EXFPxld6|D^EMLNUT9NRA-@6&9859*8kJY^R+5-AcO
zOc1(P+Ud#Wz%X1eA?(v?&(YD_(T6auxRXvizT~xT{+rru_ey>G>}2Hy`a_lzAv1p}
zt0}9|u5USJRa*9)$;j)>eU9F#rn=u)P}{SPfEXki-QDK9MrA;9X5FG&N=Zd_Q$HSd
zuib)he#d%fCv)f*7`-)53!OKg7X5TLIw+PG=cx1OaoY@fNGq!w+_6em_RP<f6Ea11
zRKgVU=sLS06}wel+sy&25w}cVV>T`cj!yQfGk%t9536f7qDpm&y1*NAhn`3KJb1^Y
zm1^I2*%)54)igQ}5DatY)qUU-`nd7k<jQ3+ekR=q?Qf-XAj}$t<Mxl6Jd2+@H5Y0{
z(|^>7M4GU&qMd!szPfdAiF3?#&EW?59|z&jp6$0dnet^9-zC6zJf-|u4vVq^)_9=#
zwr0hb3Z`45SrVt!JqE*PMl&s3?(F8c%F6GiwjOf8ac*$2?ZaR&{sGQ$eDcg07;-#C
zs-)@o`a9EheHl7)=>abEp>{i)<Na1X%WY|?gg`U)$xBoUU^sK}O}YnRrf~L2dGXD~
zy;wm*Lj-wc1eZoQUx}hjp`UiB)sTd#FKFA1$9cFb(Y{$)NqQY%{h8F^jPmCy&EX#Q
zwgpvNf=M<`K|ht<Ip3t?v~4l>Ee)E@C+q<);3-}xXentGx#rZ4Uj&`*NfxWj>Xqs>
z*6p<#&2;I{XKaA$!LY=#!~&vOSrl2{Q320rv;DG|Pof*mBD>^Ey^pIhBM7KMTZx61
z!FE6O?ulyB40M8eE8(=8S08_$`LISt<vdK7FY)r6KhFeWuvfAuT+ktChO(u7APl6t
zd&Ap^YROsZ#cBbwD-p_)S^%lXqL`08eR~8fAZoT6d0T3M3owV1Dh~rGo_fF*hb+VA
zitCU%11sQNi+g{hGP_jVK-Oa@GbCWkZ8S`^Bx_|`7zh*KQecu~$+Jl1<x7m2R6Mn^
z;VYLY&f0bNzv-pC=BET0sOZBUs~tCDo|jwbynr-#gDW7$gRpEdQezPJDRWq>+r5)-
zl!wWJXHWjrne;BJA?`?G!$YUFJ`>yF<wE^0iv|OodOCMOhY}#V<ZeWJ-aPoA9HBZi
z9_hz?@vJJLpiJrb4YQWpZlY-cGD^%L6bj&cB4IRh+iKtHL>s&9$lDC6#h3D0Kuwh|
z2AxNz<%}X_gokjj-8)4%FWs^o5AmqJh$%NM8IcEp@dtsSC6PmVxxfhtCK*~j@C8*f
zn0KfFod)Y9J=m}zI0D$}07mY<q&JzgIAP`NjtA_%v}DwZ27iIqUtXCfr2WRQ*+50}
znT6+BVtWPb@;g;RKtOwAY*ew0HN))JE|E#&THy`H&u_hVk!4ws?Veos@wa>Y2E_yQ
zBnh`c-Y_y_H+e;hM;s2Hm@!}uqYqNw_NsOG{*U=lW@;B<E?!B195TFrmin0By=B*_
zx5tSs;)L@Zk4daDvy=8(FRf@qr>!2sWIqJl3YxI0sV!1tI~;$y@Clvn=UtvKxmY=r
zYw#*s{#M$t?da`Zz8Uq==lir<E7<uRPa6^B-HbclI(3%#t8y6=fN+<8-f+}>87`5W
zeMa-}jdYMdR%p&FvKRzN;_1flBju&3XS~9S@eT<C4C{@oyoNF=gW3Q)of|jQ>)9A0
ztIS=Uj0w^oZ1!iFJN+iB0$|h}=IbvP?n)4k^ai>b2_OG*gV<b%eT)0;Ww~uEOY0Ab
zZV8S*07aN{@*2&Q{XrIh3bGk7Z45p;*#Xpv&|EGz4<`u$AmGIqGmYC|rAzMd*?j$Y
zV@Bw~R_p3AFaNaFdyzTPU>K`nM87mJ&##{5aC_y|@C?)U7d53}mt1XWJz);2PgJ`{
zLj(_UdlJt~JXioC`)T#ymrJx9CyPxlCt3y&vbcLwpMom@+95VT^@3D4A_z*(ngV>~
z9#;L8s-qWs3Y)-lFsIArCK(<zj1s)sm$8Cwn8{x{lAEzY(q7ewR=%kv(KhF36zgQz
z39Jn5Q8JHoISJx&hC>XSql$~6Wg_nh$1dSSafg|NnXDHIfy&!m=Jkah1zN{P0nG{P
z#BUJ^9G3M*SNaOkEYI9;3bIEN#?tR}ueUQ}t*fZiZ~@FB{5jOX3^DE6@I7XG%a91U
zT&Ak*hfw|Jm!_V-Vr$x5gq^LV<`yQ<Ea>qBywJ4x3oOIp0Oz81LqPofNstU>n}HK@
z4|rH3k2NQF9HL-md8VGXb18&u^>g)6<>KiY`81k`*$I$Btn$$u%M?M#c8S|mrsGRn
zz%Wtl+{+Pt4*~QQ<;U3m{RPT!Yl&C(&Xz{6oMcte#-(871ul8J1@@MAuO~X|FmyCS
zh>M=+7h)eD7wyj@uZ#)$Y|9cwfkG>`<8yo(Lu8<4H*OZ6Ak2U?@Lr1mHpesjdA|$5
zSB8+DLyyHuhm06@z&NNv84&o06)hBUZr}?i$4jPFErqP~PqM<gSLQdo-KFqya5bwk
z>74p<G3#WN4Cn9D2tTO=)`fiHZfQpjs>gc*&z`@3OfwmhzVI*Ctt;TFp$Z93=w^KX
zNT;Lj=tJ)z#&&8T!d*g!ZJoi2NX*vk2UvctV%uG(@Bh&D7En>PUE8p?f`W*YfJljy
zv~;J0v`Dv<NOzYYDFV_UG1AS@4I?Gp-6h?f1K&B`Pu$P_{(kTK{_FqOnzdvGoa?&I
z*yrBIK90R>Ab@gf6q-N0N<Q?0>7OCR-_B5Pji<jNj3?aqmeK+tq=Gs%PP@t3GliR4
z&$Sc1{AAMJokS2s<J_Mp`(^<gVoE^e)e@d6+zPoqh=sKSm&wlYC8@!tuV@CyP;rkj
z*dwq0@Fns%8sO%1vb2^0-QjEtjp-5ru4oHRO-=R^zOAC>XR(yp^S+@*A?%~=`8&SV
zVx+BK4F^4WIHe5_dpP^@1?<;e+lYI24may?30t3ord3UN)rW}wQf_SK<DV|p0HgI7
z`VSX=w*kW)pr@<;5o@lkG8dk;0KX45c~)9*NPZW=CSyI$#y7eck9<=P4K`W5I_!%D
zjtT8XKkFg2d@?=nc9|lG3iOZG1_mpw=8D7`TzbQvrh^n`gNq7+?<Wf4S59tnpDvJ{
zT2!%#EvVh8VF84q@#7=@_0O&=n$#U`+-Fsmx_6SL1|^IG_-Qp0ByAt`2F|m9UiN)D
zs&(`$^~I^UG!t&+Q4sFg>-{JHo&)b1TFk2kKwMw<ZFP8iZ(#76L8ES%(rhMIEGgX$
zbh2tCAbPqvo@5O*2jQ{$VLj{7<WQN(Pz&fF?^I!4G4T#T*g9WXcT$BvB;+6lBo*5+
zZKrcQZMz<J+mi`n<CS_qNKBm*1gJS$4RBEFOIe_ZNGP7o<V|KF(^ma_k_!l@+UIVr
zop$MiE@q+ICbhHcp!-%NAOa2Yc6n?gb(a=S_<GD0WM}VLY=Us73F+o|@(t-F@LuU$
zWjlENw#RDub{rbu!De)0CI5^IG<yiJv;g6CJpo@8+@!}(kUi?mPhGVJEtL?h#0*!s
z^{i~f9r}jrK};}DV4S#+L<xp1eC!a>b`k_b#_pSLQ0AD6|Hk=41O@y)pyFIOSfEDN
z>&FfSQw}F@O#&<q3zC(2I59doxOuyt&`_A`)Mjd<kzi>_;9!`Q5*;QA*^U6<N{s_*
z%Spt+A{`Zp!$F_Td$`im^@RU<eu}<0-$S#$6>ZxNO71xf01<sC&>3Xuct6kM8YMu>
zW&VW4@KtX^tiI@8dKx)5Cx_k1YG#7vecq^Ojxemoyxc@W7<XU7^$az^xu7h$Pe6zx
z?#Vgs$>~g*M3^Ym#d);ZU>ixmHYb<7gc@4H#$w>Sq@Z0>U0lFluwiYSx1xJZy=MR!
z%57?}T6cI%Ov7zz+mxrw<67>SmB3|_YQ?@PQKLS0lPXRC0c^I>n#oMh*kif#P@W`v
zQEO`J<nkN97H_HD1YvM~a`_JE^AfLa$#hij4A^bP1qm@&jpYzM0Y9Cg?$hZwMKYse
za-U6s<11IF*cyBD{Ls^+?=FU?P2xySKFcYa@<}`+l}uAmRy98>_<xUHU^O~CiZ79s
z^htMIP`fjO;5)8C$`y9rybNb|86@NajTBJotx3y<5{z{{&y92f@;K3s{F?!+s-3|(
zznE!@+!$HG>$EdnwX<BGUsA#np2updWH^<9;uA1)^dMQ&xD3)R;EewO9Mr4K+-Yhq
zoa*aPpa)RqmZxubnLXmiI(2@_8*XynhnHN9l84dw5!<F`Cf|ZD4z@+!E(Cyz>U0Xc
z7u=88DbEQ<iiC%wj#%YL@ku$ObCW3AB9B<93t{wssdn+L5Cs#7=}IPyfR*ZiH-XjG
zCi-q1@H@t6*+<8o1fF<i4eZ*^&O559slwzporo;jsI-~3TobOJb8{^day&#Ey*o90
z0ceql4qKpCOuj~gyUXZ?-X@Ryox_4G!Kly+GW)MS^MH)j&SS|h;rdxG@?ozvfR0o=
zK&LbH;6r{+b@ZRi<XiR20D6}|Q&tAqn4bHdZqPqAFo+g2ivW*-AIVE-4-Db?wVXLA
z04VKL4go%>9>V%Nl5lq8ZFU}%!W7k7uEae0cS_bX9IBVCjEH_PW_wfb#m1V&Q9hLn
zgd5gzepe}5^vd9b0VX2L95)xp{=(^yO*8J3-ThkdmEWxbN~+N2*e`s~Z}tINMQqtM
zNF^>$LuX$f%|3rnQSirT_VwhI7P-&VbCn8DwRJvP?yAlHn!~CwfCQf$|4`7N@|jmw
zmTc~H-2r5Uf^o&zpKZ4$dqIO4><PIDjw6YeHbaTrcG&g!<xG0y_4RuqCDan2$U38t
z2gv19Y_x%{GS4vD2wD2C{o#3%!g~N56iqGu3mWRpLji;kRgwJG^WXb-)%E7;n^usU
z3lQPjdpB1P@sG9OpweBlwYW@jn(g3;b8r3uqPZv54|z#ubRfx2oitfhX>Mi#vtBpw
zeg|N+>l?D#GRBIUCWl<WDl>bm0qY7lR)#@0iswKp9A!XdJ50(eBBft-vn-LbBw>}p
zLK>S%0@Ur4wn7p_bYbB32oH%<!o!Oc5Ut|}4lEifi3B~}RWAQWleTjXe5AF&d7iIT
zry}+_x?x1zC3j(dSK48&N*0On{%y_T{i6wyI8-v(gINAe6=7&7v7juz1mVf}WYIN(
zs!-f$9;sR9T<mrzDiQPP>(PqDxPZ?gaJaE2TL5(-;{BzT@SZ^^H<bdf>k!k}qhqz@
zd1e!S)AWpa0YGL?$OR!3-%+NX^^C{{7%CngH|Cqv+i-+SHPw5u35BeAeA@&n4~Ae3
zi3hbH)r(!8vI+z6LWK<gDQZ_K#^V8pye1bYQGzZ~$u^7Z(iV2osQ@B~2B_O1ad;<{
z-wvBBPo``}DxNyi2-<ZA{%4v8F`uP3fS5zw!1xICbGui*CwJk&LjRe#qQGeuI4Si#
zhB~WY^G!Kr7Jo-Ww{^S3JkfyKtRE*cRE$4ct<js>tYbrNjGhPI5r$qUK^$PYnsmU=
zIcss~p$+nz$-&u6XoSbpQ+-uWos|+e1b6Q3fu!DS!@*w;^M4=f;HT{M+w1};$$i=L
zPu3XO9_WNBGy-C$Mh52}rc?HSk19S(QG|A(mvOh@ct3~7wmkGc&dK=HydzJp{kW2O
zKYPAxLahCf?snc?8Gy{~_wQx<$2k0aN{B4k1){x4OZR0!62XbjO$Z%K=X7K@zXU8K
zRZ8?Xre1cS-mP!iJU2?-X0;o@>si{qg<W|71Ck3^MPK5xm>8?(eMGm{1psJ6%+pjx
zl6SW+jCZF>Mw3Thg*!7{c<)7|`-)!(PeGev?x{oZHiZZ28uRAmMQ&bUF5peZ<|2~G
zxd;eUN<yfsE$tBiz99{;<9FwX{?Esttx{E54>hWsrtWbmjp==X^6wR>bjS5q06VMl
z%G<zZzpXW10kVZJmGGy}B}22QLQs;A>SKVV#S8ln=F}gcT45{1kiB~~$oXPM4pu6v
zeMbxQKy@Rg-{O5cUI(@i^}*8vbi!2}q%kvGJ@|fa>9<ROQ^nh9*Xw+fe|2ODg%05%
zshV#q3M@Fni_d;`M0%{!%-JnXarH^%_{`T#6$z_F@Szv=Kdll#X4x?@oy>ZZh+z?c
z`X7_|udoF(o8h(tElQ!@j>yOP3?f`DE23$eHsbPS{wN0`*OyygUOw!o3CF1`R?NKs
zacb;Hfd0oqb#&KvYdwJ!WDdLg>pcwU)+7iPI{Kpmx7evoAck~3DO=146*1qWpecuE
zd$d?U=unb}M@~{a_ClkGh>o=+_KO`NW1iTLB)m4w$yAs!>8~8d5#E~<1q7(BSEt#B
z3f)(4kQ;;7KUyN15=%5>*c<NaPsx|S0fJ0AaZmg86cDamcL%i^fHJfH61_MGfh5Vg
z+yTC>`@(e*=gvj2j^Ln>`ShvA=D<e`fyZu1FTK`ofbwT@BPBy1n(l1ojn`X3_GK{G
z9GP-S8`teTRTz10uu{{<e6)N8cL>%_-zWLZ862B@Y@~TV4Y~=;)9&DO<ddqz9E>}#
zIm2ygb$ClpK4y^Y0=u{x`iW%gZNn;6m50FbM5(dyvBJH%=Z1r%!}r1z!<ff_NgN|x
z*~FRh**4L>QHdxsyJR?VSL6L%0bd~tOpryd6A4cYt~N>nQ4Av>=E|30P@^QjuP=%g
z@7bbcrKLtB@U4bqIims5sonb?$@6;G<IZYNSzW#BtMkRr{tUg@V@86HR;hyBj|L<f
z;9Q&!e*!AuNe@~cSBj+x(8i3Xj=S_`Pwnit7Ann)u$uvP_2_8rR!J~d8mdtb)AEDW
zcQIU?EaVA^yiSE>?+2dQx)dV!qI20;o}H->GVA*SPvtwHDn^4SKA3efVmMC~`lzSc
zf=h7z3!pF*8*YoS|NLA++1oRo-wI4<Y-&<kD34SkVV$}MecOXo|7wIdwamnr!nqoR
zy)R><Z8Hza(FuSrY95KffAj^|1!~76eLO(<Qaze(l|^jS?s!&eOI&~uAXGa6g^Hg}
z{W-L99Xt2qaa`xS|5ASITPO+=(-2^g^61$N)Wn=v4J>99zTQ;v)5XayXt_ulA@EjD
zd|S#z_6~@Fz8sHg${#)H0-#{bsUEN3SA2NZSb&PU5w6KpMFHs0?e$AFuv^ht?9Hm?
z?UvY^-ECR@<B8cT1ZNG}%w{&)T`9e4;*h$@P4?c#2lR(`C5C=6vuW^G)fc<rNF@DK
z+jb53WRhTzTTz*7S9zST=!z34r;a75lPG$>qcog&UaV8AgNAD!Ac=$E{~&tYpS_ch
zdm)^N38M#12@}2fMWIj*t642Xx(6X;9){}9ReDB9Y4egw%BcN@RlJe>tLPYpD=3#X
zU6=lj>KHOxTJ%P>zoycjF8N#qBW46JM=-1W8zW_U+h+$0O=2nX-W9O^nSEe2^Bn&S
zFq2@`H(_p(nV^whDyP`S<j>Dn<iIRca)nhfY^DeT(vU4+3|*c85F-^jAk<2bqjJO-
z>pJ*tUl8;-&VL8^MH<{d6;ZkpYby>I$UB>exC~g?nr|~FTN8@OUf1XO76@8B0k^H;
z=#{?l``70HMSflp-+hAA$oh!IY?S_#%DDQb!6A%}7p0Ih2e>5KCeu~>_df)xg5W$t
z)3TaU-(;cmIP(BFijfYA{Nwr-Xg-_!(Mzn<YvRQJwuAr4A$u7lG=qmih_VDSCRoN%
zdx<YV=Y(Q|HmU}Hh~2&Xzv+tq{q_r1Hm<NW{}bt4<52oVF%XbtSWRs`HEr2YFJ-z(
zHyN!fB0wmL05ippAy@Ix-hLhU%G2lyF-zauJ`<25kRFwx5#T~4C4&%gk#B>|?54H1
zKRg1Eyw=RbCAua6Z+=E0z#UCWO%hDeKxmUVz5F2hszO6*TI)TDvz+|=D8Ox#0E+Xd
z^!S!dgcOR!<HFu#yhv}+Vo?R4=VLY`n%aZk>S4#Y<v?vR7QT!~)Zh|-a>?)*$r7OO
zkP?$oj2F9bN|V3SFXUR7!*RE<Yd=1+D}4Fi<`rf5uL=-Q27IINgMgR<bOae{<qksg
zRQZN(b}XbmN(}q+<$u-!XtDhr3DO=R94{pIxyK|U!R+u)4&)Q|(%A0o#4mP=KJ#>e
zF^t-@UYApI*dchO`gv!nPxgrUUCZpZC)w>=0Uu(sx11CR4$-$I$XFd7IS^yHr-g8I
zPF?|0tQ~2}*Yc;0p8>fesDa4}kpA1tBLV+l34j1^5Dr7T<077~-?W1VdX298ek*bq
z2T4UA&?gHc<cy-^+yNG(i4vH6&z~V+p5V~C%4=Yo2@b%<s!WWK8#RH39YOrObY85w
zMvh(YdE>#P>oB6+DCRPD9NxiGQt!D!8E<NUsTEdB1mTwCQ~%4h^q!<bkQW*MS>Qov
z2D^Wg6;O8^p#wAEBsl;Xh|60*mOzfdxA(zHM+wMfq8=Rn6_@*~`#*>_{1s%jzOz3_
zwjX@qOg8knGbqSsezIall+IAF+$I4eL<Z5%H`*&&WkBDIaJyb^iLV?XBuVu=ALm`^
zLC0P%F)RN%un>_+HFjs~ml2SXw&Mh4MF<G9MFBOOOTFy9!j|i-pJ`^}HjsI}Mo5--
zpUrKi15arUC^;ex!uUC$o@<V-mWw`z01HVZ0*NJnDiLYde_Jmbl8a>R<$B36ZQbls
z5jGhJ+V6G)#j4@_cW;+^eBeCX<D9QMnKbLtFe|{F-P^SbM)xrrcVB4oI~Z1!Z{2CD
zeJwHP36@x}E5^DTXq0$ur^7faur{{^YA2)vRB(2p7;0vQsfAIa1>r9KM*r6XAO;l)
zs{Bhr05zgcY8HN)@*UWBDxO8B@pQqMvA0z^POn(7kmOTac>c21|K(JG&xA~nOl2{(
zxM^u=rPAJ{s%%kd1bxk8??JF55tRd~4|{oW?ol9Avl7G(QI}A#Cb=1aEptJzxDCdJ
z2p<E9LIePFS_@<CQ<AOFs}Z38&hrk*%As55fFvC|mfZ{(@F56M7J?|+vhxm+i2x^^
z90+Hqo%qp*Ie<deHo+atYdeVS7{Sb>%fz!#mdNhjW=9aNe-<@AJnZdtElB$aB6)H9
zqZELSQ<=Gpe+GKp9&~aulsbpaQN6rJ{0KtIMYE4A#{@+l3~?YY1z=xP+7F1~cYriS
z^oZ5&1AciRtcbZx3-CuLtO-7{as`WVcElYD<^^=T@2~|3bVqwQx!4@3jbLj3ttyhX
zlmL>is<)=b^yH0zme}%^2asH|*er_nMeN01aHe`}&B44D6~5OqY*#IXa^H~L01ib^
zXbdSw#yNi`oMFsZE)MzdFPLt2$n8cm<zHeav!(deILttN0Pc{ALM26IUD0g;Q9DQ@
zksb2X84s29FaPb|jx8vHQGyCeW1RJ;yqp<O?8=NbZU!YO`g%6HH=caC0(yI~mp!^(
z@Nz``2TLKvmk=J2JrJN%7ig4Y6LVJq$vJzc7-?E=iZy=)NCnp1upQOdufI9X>;w_u
zE{Q6l8~{L7k%<##<KO_%{RtQ+*yv**h(0ZZ)BujG-1S+TU?))9D!raMw`B9Wb_dvk
z{Iu63DSzdYiV>lT6Nwv(+U<%|?`wCjB7_F26Re8W28kn&)SIvDW>knYiUb)@jwlQR
zMW5BwISKXVDqc1)_pv&z9mJGU%?qw_Knk%cId=!ReV^dWB0KzNWBmjB$M^2o3?U@$
z2>+?}Qv;{2%Q7xNNF&zVq%ZS?k7PM#hCML0fryIo(&kl>{F6Nhk3%ky8#Ke~hG2R#
zuu1c^&pKAS%kJX0Fm}=khr7<>6;&VnRfb+egITBYt6f2zWdkSIMh(L^dG;Z*phiir
z7l<)fW&hw;VFSXoPS8Ag$IKFl-Cg(xhANqHe{&$*@_yy50k~jkTeJ1GpGgG;4nE|W
zHGUy`Df)5!&pJ8FIIpmgb|*@+)?SVMXXP9rZG0dr=T`e?rT2}{4-a4L11e69pw5^u
z9nb+UUBA`2SNt9n^O?m&v>v}#xMx|_!!gwkIB45Rt!BTyDQpx_ujZF^Z79hChqz>=
z<&26W=b!au@{l8t8jnlW1S9{m)une0Be3vx|HIA$*O2<dTd}DplV=LTJg*{W-ITw+
zvhsO`a{CjqlF}#K=vg-??fqx8D0uYWNs-c>Fkcrx0}`3qGY{@N9X*D|PR35Fv$goM
zF3E0@-G&j}RxFb5R(m=asF93+4!p(H@)Qcbru~5Ja|`8zP!r`XGUujxr{~-#AHe&6
zy@aN5UU)$x^k)1p`F3{EY?1!Jy!C&7d0V4SM~GPaV?p%yX6xM)flj%po|+2-N$3`m
z(09r|P#U#;MA-iREtp8@^O{Xx5ZBQf^hUe=^wxj#8jzol!S!LiIK%w-5{U#JO+pE7
zt;zvK2*q=AT3QSBFVBE@zAc<DK34IO4>lQn=OZ3!{r&R)^_c=aZ&#LKChnIS?KF5?
z{^&?jtFfn1hU)Ok9f(l<d3U0iK52OW9;!db?1S6wH+u|y|H~)A_vzC7?z0D&yF&o~
z{>j*<h38dDX&v~T|K%s&Ujv7W7&tu<iof4^5z4E^$`-Qb8Z@%1^gH;!Mi~tB?_a5q
z?-t}pV^+w)jTui9TNf70>91DM7k91K7KjjEzUP0-cYfAdl=g2^P<ihUnzI;Hy8qpk
zXpq9Lr+j{`v0ErrWVgtw2&Dq={C#dY5fAb6fAtXHCI`I2UW@!W9)d`~1dD*e565;#
zKX!oTXb==v!g=xVA!2d=_4R#QNa%jUa(QRbjtC0l`gi32`(g&a^<JX}TjOYs9CW__
zH4_-#pd!H#5DvkK>Wg_nQatLpLh1(_>py?}mw~suhgb?wWq${J5o^hNjQ@Ejf4!@J
z{wyj8W;yMKB*ph{ga7Zhn9PW2K<)T{egA*C!GEoiXH-v-=UB)HMzv8IDT%B8eYM~1
zLQFW)Q!uk`zW<on{}|&xpGK$!v8Aaf{x|F8KPUC?OC2oEz_<^O+`D`Y)ttzXV(sVu
zKD+-M$A90B&=JlDOuma<EGd+~FS>s{CDt$7@a2DH8!&w&Zumt|h5w&M6EUn$^$~NA
z^UHAlPYv2Fk-asT#B;LWt`kuiuy&0^Sn_KzeWZD;e|zzN-PF?yR3Q`+_$dm)IQ~}~
zhxo)h5Ebk_nOFZmF4C6JTBkW-9@nk(Xy;J#_~(k5pNk_0EMhj6yHwxLU4OKn|E|a5
zdBBz-6`eSkB`x3j>1UQ<M}#;rx@WH(M8KF%HFucixlO8Qg$H72eC6kd<4em7+H~l=
z%TCkN-CgVgAdh<y=6@N*TDNZD)N9xQmo_foO@>TL)4)cf8Vk=(cYNvU`>7ND+!sdD
z_^O`HLQe}(DTYtz3%My<uH+KA#5TR)&8}no9v6HWl94{PtKD+Ar1UR4BB|5nuE!0v
zRTf*E6gn3D)<M+sDlk^^#(Y*BpGl{<Q>W~efK)QQ`uJEl=G-6H`tdKTg)hb_ReR~9
zm|tGJmXrANtntPKClkqSdcf`b-9-3GA!hg7=+CvS-<EVRVt;WSD_GD1Sgo=ax@K6s
z1T*3}mXmc!0@qt+HP^ciki1@JtGgQ$%jgjJe*IE=xB;8>T0n(9XbDS?%cRj?f#JPI
zVSO}?s!^lQ04k6L<*G8uSKF-y_WJyIlf$T8BSWWBkd{<?s!+{xs#x}E&hz@1>FdEV
zTW}Ld2?_6pt`SR%e#xgOvS_o^sJ11}kWBD5RVol#_YFozN{#*=O{bb|FxHss3@vvF
zy^r6S^{?S3^|DBnr}j*{e>mGdiz@yh{`G|oGJf(mq-Pd=uc>{Wg~p;x_sU#dX<h&h
z$6*I#j@WLwTYSb1UA2v;Zs@D+N_%e8z@m*J%=L&^&bUvj=+l)NTtlh$U35_}<SzrA
z5g3<$W16>;k{J3AvqgppHawDA;Qin3chqQv5jp7k(}ZFs33_>7U%A<JhrVz(56=@h
zAKZ|E-%%?=YpiB8zcS9Ft=*A~_-Uyh?l8%gb39|SGgoJHFN9dI)v5uPE+!)jlD&KC
z>`n}>+R*M6X>~(J+FzX3R?xB|Wse{7csgXKW|PqhTmDv#OagZp=n<MHHF>?Q5`!tW
z9f;jmz?dC~-JSawzqKWhaV8+wy6n^@_uJld1=2HIxgYpdzHBj{nZ#|vtwivAsG~gj
z7<ZNmA|%qc2{uHJMvzEU9X7eU6_9!}h?&!QwX0o6sF1=&nX3~nGSC_~$MPf{OqJ0u
zGbvh}KKQDwyte!z;OLFX_sBNzmxGmpFpc)_xbFPcUBD(n95%?Yf4XI4lhtMz^}O%&
z!AN=RhHa$v4hwz|t9`Y@MCJq8n^01Aq{h&ks0Up+pG(I)P|6dh?1XSuDwe5DWue(7
zv6vhW4k?MyhZ9?9J{Pgpp}LrFY~H{wG3*pwA8hO_y#0)iK8nlbpsbuudd1B^Im!cm
z;ozEO;KlFuNoByV;0wuJ|IcUbD%9k-X1;IOR=n2s6gH!P0Z4g76LHB8SHV|0tKW0x
zDRP*SyLdZo80}W3p(jYMVt58f7Bns;Ki^A_%-o;DiQTq3%di(<eY22mms<?uBnzQ5
zfQVl$fBE7!zdsOm=zQW6XV`_a>YVT2qj@{L!gybSx{lI%GlRqF`ps8Puj-m2R|m8H
zI~Y-^OZrBstj0`gbO(tzeNmQJd>V6-)5B0r1(eWJJY^3_(pu3pOd=1Z?)rm4{7%++
zqlQ;#NS02wF@5HC*l&$t{APt(YhnUt)us3!b{^BGl>JEF2c^;A{mkBsY6%KEE?$*l
zhKwG`0bjR%e`E8H$wAq8T5k4i)dZGzucT{Fwz6n(NuO5ekRV2SPfS{6Fn=O=gp$qj
z?1eH^Mc8kFOrye<K^DT?CxV5a`jdHyYM{cRw%{s)qBg-FeND<7e&aaN%`=g<nP6}A
z<H*ML{KAgZoCV!?-o{p1iRvl^_Hs<v9zM4@+7LmBrr3oipSLuy=#r)AmG^moRw)cm
z&aw+@Y#TadTOEX-V?8KKQj8^muZV1R&w$)3-Q}YYSj=q_f&!LJ_<-W$h^ABaNg2m>
zCbWz{IE*L!i%Xl>M4N2fv*dVU6%|m#ETwmQ>dY|VweP&;##q5~q&7Ecndp%=#)0QZ
zphlP-wC>37;DK{I)8K9IsU+Y+RJx&mKmPb%eSu$}OyeQk5}o{ioc049ipKAc<zX#b
z{q6w|NmF1qv$-cqIajwRWxtC0Wl$^UK2oah{K)dY)c4W$Vv@D*yn70Lq1$yeb@q`*
z>##$ce_MyXOR4b_g>&1}R&mGVOoC6CS5qc-CL<fiv|cEUxc8Sq=WCiCUF&9jof(N-
z#TlNFk>c?^EzrSI?Uo}zENh^m;U83T49IWJ<RULW7fd;#c1=rUzgoB*wLbg6Muoy7
z!#}aQL@}UJ<D!R9#2WTqfBQQy;_Dd9LC@6()9qn#k6U7N(=5!U3d3k48uSAuQRQDD
zE!M!%bF77*Nzf)fh;Yv*9&J?`5QzEAj-v3z`XA%(euOkxx%<Ikb=Kq(d$}Wt_5RLc
zfuirLsnWA-oXUsr@#=_%kF!}gZSopHK%V0LgwuJPI?eYPl9M9LQjCmiR#QJWU%)X)
zoQ&%tJI-x6gDJ}RdzX7S9?J9%@DE`#X15ASe`8$cE1rHQoj;QO<#!}~@q*EakO)-e
z74dD;A#p19BMggkn<R=(hOJBI7Xfr)ZpVm+_k*YJJtRpri-pF=nglgoo?6Q1yvaD?
zUKt6^=o;<+td3^halAW}JeV$LG=(4H4OYyOAUuM@aypaoj)=9Nh)brYV8UpAHM0ph
zhy!U2oEH;6%rXk2kgT5JxcjRXYGs5rnO09fMT(_pa>B8_B+Rj9aW@T5ivRK>B3#?V
z9+HGG62cXIA5PbPb||WhV*0pw-NQC@Tj3AVq;9pW4;VPN!!JN{&G%%;)h_+i*Gl<_
ztV+I-*m3%kh;?0M%k+DXE$k2x>mvo`(@tsK=Y1by&z~`1R?PrE&9ipwmX_deoWJiD
z!icz~^&fEylB1O>ne*yH=<AC7cwC}Frr_9uOm4f_ey^Je>L-urR6b1BP0O@8EG^VH
z1EEn>kQ5po^xK48%=n@|?FJg9pr$z1T@frF41#?uVm@cJWfZb1krY0N+=c)3nO!8V
zKc<#mH6?$YR5RyXPemcR$e!i_UfYIP5|_=Vi-+#=%UGt66ggiBtXJ*ZP;Tb=a*jTQ
z1(EaNa<M$H(Zw#)o8B9(iB;R%;AEWw2cWR6NarV{e{gNw15>-&euS0-gqU;nzLUu=
z@{6OA3iv*p&Rb-z+2Tf!;E$No_kzmFHB^wB+@!nV1OK1wbGf%;Xk^YQA}(vk984&G
z9D9{5oQ517LSaJ#2AuTE%iYQG_aC)ON0ZPmNh#TagXh9z=I-QKp9+urk#AAE2Q~N$
zKilO_aU<#IZ-9i1)bKPQE%UoyTAYZr%ah>E3k=UWi3iuFn=4A`)}91CZT0Tw_Y1U2
zb)w)-JT8mr4xWqYK{PY`COL2X29=8432H8PS}G2KyCpx#<U4R<J}D>Rt8D8*r&!~A
zUnTENvh8YTVbj<(Jl1n&4}W{Y>C4HsplCoSQE`4ewRC(`iE)QaYcO8=hBDpRGQZo7
zK99{onH2P`H=k09y9sVga{V)SMweHFaF<6(M_Lr0I!ifI9H#r&PJNkz*4#N7zRC8a
zu7wt>afj$c$#mXe&FSosQl*>&uH$C4>+utK$%1@1czDMvHtlNnAlskqQZ9C@n5X%-
zj5>%S1LCR1I2$m$ET+vzCh}An6>IEG3M6kU(?+MsoW6S@U+h<DF(-D3K~!=QO`{$0
z2CZxVis<TMN?d`;sjqRuZq?*88E$`lh5Qv}&7H*KFe=5A)?QnZ&3mDutX2X8;P#QW
z{aHKnrh6fV+X>M(H2hvgmBtu?C_2RmaKKpwL+>3Otac;~sq}G?jFl_rjcI1Rh`p40
zRD9JI3i)P4H>!D_%<C32X#7e7<l8ekF=8?SB(7oO17F(IZZPHFXX$EdwcV$AlU|m5
z2+9Nn+r}0pdt|X4u}H7ri^9KFzDKs0s0l8-FWtc{T02ywpe>a^Rj!C_IyYcIEvi}C
zdVenRgoIYPB%3GG?JT+QdR=w0!2q9_+cg6C)USXD@fo8T*+9cGo<mR133R^NWmC>3
zj4`O<fN7E<8GRPv8G_TgD@HVE(XTZZc|G6bTJ&kRrQciUy*-<}Sz|nhq^VC|M`)`w
zCcJUx%3OF0v|++!<kb0W03DL4wtbg|-Fjd1xLqat#qEVz<9J*_(ptyeG=4XXKp5O!
z<_L{|B@_Rc0WF$dC-7jkhav640VC+dA-br{>*pFX57iDRn?jRs)*a1C7u^7hBhPaX
zyb%WBOwnN7&Gn-2CiZHv`?71Etf1S)1EWXV>b*o0+18EjO4)C9U`9)KQih@1yiP;w
zL#r*ccmXE+5hJuS;^>>t1>MfhF<Sin9L+{&)jU2d#XjnDblv~VYXJi_@RD%*xUIOw
zYR<1-%vIiea~5~J_Zfc!ZphK4T39~#(+l}vHDzm}B)cebbv}hWm0?_uxHFFV;|MiR
z>yk%!1uXGyrC=Vibc5s0N9V4%1(Hq(Q|0^SuAmFNA!Chu%~wuoGup<-aILnTo+$6C
znFg34RvyHy_N8F7?F%yJDgy>DkK3nu-HB726;bq;^ZH_F$XgN)%+Z8o&RqHOfd^OT
zV<D(257xX(PJ^$hs`ZzDE;#P*g%d8Za60tLkZU!#LZUe38S|1B%bWsNJzH}jV!Xtj
zntjK1(QzN_)sFC|13KK43cEd0`ME_5+T;~t7buV_kL&gMk~Q)*?DiKa%|2HeP01<z
z;2%AEA-}Vwe-#}mHKRMc%cW#wKh$gjRj(B;8=&?bnYW8#QKs#r-*7@^&V2qfIZY^`
zw_8`xlFlv8fZbB{At}Ece(T}&_NkpxxKxk;MWwSuxMpWmPCoPJ2c=z!F@<V$KZ5TS
zFeB}D#ghj=emT8nHk9RL>Bg;-P6#91#p+w#@kqtMHE5|{toJ_Mza*$!jTR-0rs$Xn
zoj7xwt$%#Sbs{<5&q<N`Eb;Y)4l4$Kw*fOr+FlHojef3HaiZt=K%YV7=GaYn=($;B
z6R|4Sh*Or$!4f)Y3J{KGcdlj@pk;V1pR(@YtIfk_j;ax^qKb|m+G@r#KmFO9JY|>u
zCx-##NEm+M+{yE(3&^dHXH9sYB_DgWxKUbN%_`@Js2^W1XL_#VH4<`U%a-S=KD!QC
zu-d=;u~IPA+OkI8vRhwmxBO_Sh0n81IS~ePx+Snu<~Mc2m4R!q%b-(#*m){Zh?7!R
zDlHCz@h_N(m)azRhwnzo<6~6eFDX2t=+SNpOZAVL?DzWhc*tgZA_M2#cY5Mf>a1`x
zN-~1;jD>z+j4c<RK4B)Apz)+$v|%NbuVQv=*MpC~y`Ieyv?Gf3T0N+Qm%0${JM6_!
z+EKwGpUv1}oD%eR;rEU!3+gsR&XRfJ7cfpr&&nlnOH0SVMW-rvGtpN26my4jXsl+5
zl(OC#O-cD{wT%VNsc;55RWB_Pa~<=WJda(wq>Ez0J@SxZx^wju6N13n<S*I@f8$Es
zLRt(&M6_D~7CV=)dRR(#)0+e{Pl{ld7I)dO*mWgCG7g@Q=evIH@l=%JYM|YO?)6j7
za?f>jnEo9B<HHzYw(BA2aDYB5F`f!+v_$=TSjGxB(L*tm-hF%qZLv~MwHBRnWbEe_
z(`6x4fwl=TEh8OG&Cj+St;)(!Q}3daN(A^7QH+mXP5cn4Qi@Qks&pUGxUjjlg?%>E
zpzpL8Iv|iD_vKj`&D(v&<FS%B+4C$0AL8}KFC(DU3nG86bC;pgYS)oN*zg6}S@#5*
zg}#`kzW9gMmipRq_LI903$YdttY8r0FYuS;w2JT=b`Rgys}$=dW5qiq^y(!q_;1W{
zNU>n_(br^EBhvDki}M%)_qVy{&EhV$F<3f2?CdpaN5792JDKZ?lfU$>YMXNeg4X^n
zhU8~>xV#pw=Sdq?jGbRj+t$y&nB41<|6y0+!xUDWAc^u-*KBB7W$dR-eYb@MJ5HaH
z>l3b{myk=YDzB_>`huK`_wi0;;?8iB`0a%88rvA&P>`})yqSZ3QAxHw7$(>l@+y09
z*Iw6ipN6t-tgB;teqJEy{ekL`?+4>jgC{vd>EAeYO|V`^_4z~zS#VHKR}GMFd@MB(
z7j_i4g#hv1OTlh!Ls?hUDA}Y*<(ye^b|T~ezPo4dCW$o2Mdz<M@D>EgsL++zsOZ+8
zC0`tyzDd$hCXRfYqWI0Nk$S%+`JFsxx@Zvgc{-LUd}G=SMZ1POW?xcfN<kqoCfT#3
zp`vZaDCPBK?;WM7bt~lCB!cCe!@8|Y4H=5HqbDtv{sQrA$|I7cx<NlZH$3pdC}-Wv
z{S2;cvvfic<%2b$u;&=(RSOj`mJ}DX*nw%%*p6>$gxS|z$#1uQy6uHvCSOxr-1pKf
zH^mq{SZ4M)7ZTZf^+UrIVlDqwX*flj@axqw+axX3!r9bOMfc~l%2hd!FC>CmqsD#7
zX(S%vx#>@ap<);#`Ke8EBr{*%)k~Q5H)AN<eOjqv!ftTY)RmMGUy4=~xLI^N)`};n
zG1*lAaI|p7^!`Sc`D^^$)2U@&F3*{ZxnVMDvMNug2Hz=#cD<wWXYF@66~amGLy>gy
z4_#l%q{>841i8HOQ-8pBvcv>$;I$S_K0B;=)do@1F#a)iuoE~->#;u2MY5x2vG~(!
zy>jj*T=K%fWl#%3VwJPRSACqY>$%qzM6QApS-BDH*$sKBNr~qZa4Goi5JtL!Y6BO8
z8QT)OzWj{O!Yi{l1aX4?_@Gm1EQi06Dd#(R%Ck&<T7cWvtEy<+`P5<iNaMR?Hea||
zwi>0R<@TIq29?KN!>cx2R}TyhIT9ZIL|5vg8ZV>plX*RZWuprRi3jVJ^~USRA>;{K
zM@UUZY>V~s@1b#z8wo4%;jZPSROM?XrC#INVaf^dEXuYUb9wdHjWs#C7mp8Y$dF*p
z>-QPds+zjR{QyBvD1;<$i7Un-5+d_F;#wjzrFP(8cJY|kstW$WFip_l+IOB$-RmrS
z|KL$46&16ib8SYhg!}idYqDv9PhE{L=Kb1kP-tS|+tQC+NP&*?B(!L9pTd9|=H|}1
z)b?%Hs3+Od5Vdc49cF%(Kowm4W%_o34;ugiOjD0N^iwHr9_m}BSi_!D+4>#sFdjZ|
z+M?|<R<)A%$Jh}kY_(F06u6NKOTD_%;r-_1w#kW!7Yw_+rtWP2@X3DYFyEQeW6%4|
zilwjc(+vdP>QIS<eEWBR>mR$nkZ*N=hgd;2yEyIhdt_A<cuT-qu3|jAF}Ase#rYDu
z(~lbn7Y=1Im2cQ<&9#x12jkLw+r7Vrp^VadoFOrX#j${dMtS#WXDw3x`7;)H^8@Nf
zxtMhzK%|#W5b)b8C3l)l6mh?f=u^;EYP%=fn9N5u={K+I$r?P0>K&3$u#R(Vj&~7L
za2Aw#W7UwLNMkWMJe<*N76nwGkh7J5d4LC;qeS#XcCUUA6!&B(Z0(`)n@>U6;+|n7
z232Tx@?+;DeY1jD)Ltl*z5nCla+eVA;3_(H37xpz$H5paGBVShIv-S$a;ll^>yw@%
zvARS7jxML?m7Ye4eF%1Od!)-^Yrm(qVLy~mMyqjb&bYrerqv@JMVD0bXG9G8vM06Y
zL7aU(rjoS={r6#NyY?do&M$9c3*ccShdF)hd*$&s8m7b9?}HSN%4W{UtNYAnysmtq
z(}o7E3$F8q#Fjf(8Eo=0i36N?ELyehvU5h~vW?-_12d2>r-K<?Z01L80?)*$L+fsf
zaPAXrXmTBQ(UEb*F2Rc<>7{MA`pEKQo!ql<-7E+-pLy<nl&tW0Q)V<pbGyd*r21V*
z0WK<+T>7cqe#r=%-Ka>k_BTnAX|K(u<G0TOtS5CDQNox6ueazXt85ZzRi9#LZhLkJ
zf5u)T68Lfcnc%d#M!s>eYYD9C@X+!j0q;ZG+|7~)HB(A5QrYxW)Nu*3$(Lp?>)*l~
zB_MRgH8jKQT`ji<!gu9f*IpjE2MlJ&rZsu<g&&MuQY2$K$jY$kp>29s2wA`h$b3lI
z7GJ7HN*wX|pf=9TI_>1uIJpej@O^J;I2DLn8(Ljk{^HrYn^eJIp|9>DWBg+u{GECk
zey<t>QTPmp9=c<9K%}7p!`K|}kb%CB$o5m5N9L%=s1LA2mOhGDZ@pXcv{AcZ<nVq5
z$r9Y{<``uDHntrPGec9MZd!MPFSlMob?T*(YS2|2s(W85XJ4n4UnQr8EvOsvWm{3>
zat_)cQ>RzvHU8)*o`C&`!Q{ghZ)?rfhTm;~Iv*OIa4>Ny>YWsg?1Tvh5q$ib=YyQ5
zo9Hj#|FbBeKr~2Xc%#+WJ+-DIO#V~Z&3=d4R-peW9^A!-Hm$m^=a;qUmiGFQ2&}~)
z!E>Zgts2v$rrnHsp2~9B*C#bzC|O~PO*ZPssALCE;MMXRITCfI8rg)wJuc7utM4bn
z>|O0W6xGOK#kujZB73i^V`-FG=*g<^4OBbCt>m4{qu)jjR>_S*HG^k~FXNYZp)#>E
z*B+C+PeS{bzGK|pmj$`BvxYnEzeAsZ%k<&aO;Mp0z*y<;E*3rVE(Q5>xo!VB@K3TS
zw_f!{LxdQ^K=<5@d9iw@;eIoUUaNoXkC96Fy@vxu;Y%Zh6dgO6_+R<SVnTY2)otDl
zEE+?+(()&YiqfG)^R3d&H4`GZK6YOrUd%mh*xR+_t`qrEhuC#5eU+{3x@cp*g8HKT
z#C-14ZHtwRHKTr#@1D4-X&~v=n4|Z^l?w@qcC*=Kx{1vQY`!l(OR8WB%5b!s?5)Q2
zou^a1k(oo4hS?f;cQ!lZ0^l*@x!8eWnS@$La^>4<%4CD^M`%Pw9uxI$q#>?1iY~d!
zCG686JjS{`HC$#lrt_7N>+qo3)*!eKTHz`On$>ursPOtxN3DKfVBMYeXy%z2HYpvx
z$BRcD)c{LRrjMpk?#}&Kw{;m;4AE>mTe6ic7PZx}fs~?|86YrI5ImZcl61xNXjV8+
z#^8bAoHuCC9_x!Ii>816*;|_8L>GY?=Y1AgT$PFAky}4m)-JfWbQ^4mWpQG@|NPM>
zb!hwqo2l;_T7-Qv_Je^<T`eV6|K~m5=-ibijp&ATqtVk?Jagyu4IpY51pKKh4dJmq
zRI0+bN+Gq&q)M5jgKkCimN%Ul1urz?wQst1+1z%pr614cU22Bnb&qs#@=vemG}wm3
z6sYCpS05UFya*eu5bJ>m#!AUEWs&5(PT^D9Xjs%YIp4AuqG!Ds;bgT~+>ryIGyP>Z
z>7pAtkrB>a4%62Gv?#&jp!OwJYBOuorxT3MuTNHu3z5FXHg=G%do(z&V<WOLx%aNj
zRddfiWShA>kFAo^0pj<N1e4LNR$4R9yW>(9Nh05vIENP5(Ta5~X1et|+fF`lh-eHO
zn{~=Q5qKtFt_4r46(l=5lZTa|dY@NAb$7|=FdFVQwAEn3&sXHf>8Je^VO4M*$3->^
zT#F9^SS!`<WX+dX1)c}Izr1ZB9UClQ^iBrC;_569xt@^xu*60X%y4-^$|i1<6<khU
z4{`U5-Fc}zsikYC1kG-$2~c%Cd!_a`hETKjkdwx5$#>}b0625`>7->m?H)FYWT7-#
zT!Qeq<C`>wDaZcG)UZM7&qWTa8%+mR&!?{Zx=eb*q(^A3_}JX@IieYreVnT=_}v~3
zVhA!;l*5Q7BvE!+)w*;cudA$e25w?9ubOUO+9=?U7Tz?!)BAe<fOL4IjkaMnnfF-O
zok6FFgPPoaXYbR<uJy$Vhs6q?k@k$q?EnH@|N8k&Bh9|$C&!J(Wp1lF>Y`@Y3Xwm;
z-dxvJw-~0Dw)kYn3(}X3D25WrpfKY6yu7g9rd2Al7S7w9q5Q!zCkH8Lu_Eg0xXmj#
zRDbVtMe9-r_K28fBD?gv0SIwwMk;(*6_g5Y&^>i(IW(_)QOLTqN*;%)6_Ygc`iCj~
z)0y(iTS@#*qa4i33p~nxY7A*o97dlEl|;+#)P+34DLmPlG(L~Vh01-0v%?@jbdiYn
zDad@&kKLruSX<Pq;8br^66@+xZ%1FF>U~D^?XYs%C?=!jo~D}Z#Rev|8ja`>@^~C7
z7YJ;Xf13GQ>^4Dc-yB}PobS--MVIu>m}=_$>9A+hvpkqAsqQdd>V6yBfOGoN{a!^Y
z)ngW}kVu14uX@|%PioO-dCEv|xPQS>484L9u580p+;LChH){F7sDUf7RNW-PA!x(?
z#-UP?kPe-TCx_c9VFr~ZPmue^5hl4;u(p!vx*FkQ+GVlJFMTE7>i}Y*soAujSU4f;
zsdFS)l9)+2x64qx-<zjv@ErbuPu}ZCH%}9c8=w;24+G~aotHdw>;hChR8aT+H1h``
z1e`&jA5V{t*^+DL(nwvkU4PDy@!F{%=Yacu!lwoY=PdT+?r`Nf++jhz#W9ZHrRglr
z+?yBC&sEwta4J7}nq1thXuyp3O)b$|E~BRF9{B_`^CudA4=&ED^UON&rN&am*_Iq=
zLe57e)RjrnBUJ3Ln^<<b0&#q>QyuTRmmS{J4?ktv*eq(ov5~Z9jN1wl;C#rgrF@S0
z8@T-zinBZ-8{hel9Gtf{)OX%owy;1=gHN^ByyAh^Bau#0b~2+j#{!QQ6OViKP*IsH
zg*2ziN_St9IwbqkhUSrbq3`<Guv616&0WsXe94hG#cn4$_E}oJ`SF009>>Nx8xz_U
z=1#PN;ZdL|VCL~<;f0kPUUL8{^CL9I<%+la_rLNR2R+az9Ezx<*V&?ati|IM--*V&
z0V1Hx2kS#Qhl%-Gr6b?)Ay&DIMbwOb^DG8<ckH)#)b28H5-AWt+GFx+?uTbLl$#vq
z7h&tZ29B54#2!ANM#Lhh5ux#8H=i&A4kXw-mM%^j+Z4@7J2hZe4{-5G>5gS@FuO0w
zT^^oYfushF^bx%rR5Ocb*KxYxQCGh)wtn9e5hP2w!g-wTpu2J^?#Bp|FQafbOH+=|
zsVCX=Jq~^RC}vVjtRPdqnbRhFVq{UpVk??P%x=1n?vCJ7dbNkRG4#u$wQZVF0@@k`
z_K&LKZfoLl2U5pXiRg;VLPkdHR(mz|bMi&naXT~RIXY;3^@wLp*H7*16Ilj_WJz)K
zuUJ^#SDWiO99=?kJmhZI?Pm66MCXm>amnf12xK!AXlL4^x~90`ILJK>Q$2MV`3h<E
z4ShLWq{ASU!w+NG6_ZvS$S1|?_=f4isk+EJTWvQ+;_B2b>TtEqsheKsVw+QRRP>b5
zDmk&@qPy)VY)4LH57wIQ7bXbTpn56$WTaf6J&%}^-?g@zPWotfL|9fTDBZK*W?BAX
zF>jrgH%s6p@zD}DEmiG<$9&?%7MHGQWIuZfnzjhI%=5#J8$RK74Gzf<SGEpOuX3qt
zg&uisJmbY9JJ}f>je$K_>x-u84Y#?fww%&UMjA}(dlmg4Se>U~WO9`BP#CW*%-PGw
zV$hHAiz@2bej+ZYzdB29E|Ii@73Ks6P72NPlfXF=h<fo27)s^mZTeW{`FFTT639E#
zg9Dy$x{3zQlay)87YVe}jb3^7=d`_L_s`c_|ATDWYgh%3pnuaFHgeZcYv$Mo8fyW!
z^16PBL+z3GseLK3VP^KkMBYV)T_JzC*kO|qcPs=mQ8megGJkq=iB4`l3NsFafLmq6
zEqR(-NiAVite4MIof@g%)_~ceUc$8Vo2>&g>u&y=^FPScO6E9|;x);fDGb;TtL?v9
zcNi`6oT^+lY?X7^u|KYcP)BD<MGpp~@sSjEEtQ1%Dla`zCbds|+_rQ;0vFFU_F?FE
z+CBQpz<cPj`f(xj4_V7Z6^d;F$gUOef}bJ0;A)dY$0w)z_#4)$jV!@$O)Xa*t5&*h
zwpRHZ4oxY?dwsL9)jEZuleh(v<SMA+$yUGfu)`K}YYe>X_S9ees%7Eb_73h^Q8}57
ztM7hQ|Csvl$2O`wpL`@wG%dNC&j?d!S{NC3H_k&sewDV-hX<a?!>5fsLG?r{lFHC>
z&*XYjyGRH=Jgl=nOoCLmb=eIKzirb=M~*eZQwUhj;>>FO_@SR2<6ETN6{EVOtq+|2
z7<C#YEw41c(=j9r%s5fU)Y6Y7%HY2zvgF-=_ubvnMPI3}(85DSvzm&EtMKOBX%nt;
z<MEx2%sG8}M&OQ4h&H8kDgVM8#q1*-wWE=ZP$F*eI{}{0<%_k<ZcmyqJg>w&?g}9|
z+Ts);_+ss99BH%QBUFYU&1mc(b^h@iPQtC*#jieieIMog#SwH6xrXbYG^!(wWWdcj
zT?>*E&J`*F@-~Hp3OtR}g*5$q?@F`Fl5GRO<QPk%QHY-bf5Q<#e8&W9I_=edYS*oy
z7Z=lfTjJ`w-_?q7AMM9VrY6avK_9!B%yMUonyVun(yE=h&=)>2TZvIE(07b9onFe$
zz2f$`m|DXyry@#$Ce7Fq{9<bEsJf^(-zwASZC02Z54B4n2p7bfu=6a@$0gHg4%ugB
z+)jp`7t<F{CnAL$#GPY>6)?eOSCC!CZI3Y;!};#9C}@Ac10F-){_5A5z9dl^*Yg>a
z#yioH@?Gn9iW#Su!*=iZu8G`y$k7e3+=i}49_QHlm24CxW9;Tr(Qk2J#dI}I9IZ}E
z3S|cSCAJVO{G{o#xnz!C+Fbrw6zTlw^f1$lzK|kj$5Tp;CWi1dc)Rw2(x~noeqP`@
zXEcf+brYhU`(tcTMWU{`IzaBcd-l-Q?NqMKv(vSXhK1d4UhY`%H3^RdwcLehuzS;e
z7EM=&N$1=0u{tlK#|u?YE2Lf!Nx~0AP<ofQr_BPf&A;NEjk~(H6@JX`(l@K0jx8zo
zq&CZ{$q=M2&cq?~&@H;GHdwWE1%dR&qpZsgld?@dp^;sDO}30T`hM7z2~#IyWu{Ya
zKATD5F>S^5_zU{BuN*!O?^!}ORqWY_CR+N+du$vO#;*dy8!1$8{rt|aM_}}kj~n|a
zOPhTSrE=-p=~??ni<=-zuO2YoX$UQ}noM2au2v-dNx8{=7=xmBai7j>=c9Nahb;b+
z{XZ1b*Hx-^adn}St_^tgA&b^enaBUZ9%~-RXNbd`HZiB^Gjf_ZfV{uxJ~xdOQ18<!
zXf&z&Cif_L7A}#4>#a7-X8X!1A?}Uw%5a#ShAV%teg2AyVcYS|_Cxq^2Ak<~6_#uj
z1;4aLR;v`XV^Bg(MIml`O^@HAmE{)}mnccG9bfR}q4!&dXAuo!WV~jv=MPmR)Gi94
z>K8Gq>v`sJ7OB_W{=9|r?nf8B3vZWxR_*ALWBItXw!4%5jQ*UfL@%Lz`9RepX2?)#
zg&^P4hREZAdfq!qQ#BX|I5mF&I*ZD}1UPf);*q-g@~$OtzlTu^%xYdeYBhGs-mMEi
zxpTpqiPorkbA;w`IAg9X;APMNtitq(g4Qd$kuTmJylOa+!^rPR6z56a8{uxVb(v`p
zpK@}K@yYwwWBW*S&TO;JFONqPtO5H};Z<;K7b<?sKQQR%UaOT~oegAGR_4`Uh??5H
z7QvZ$KgBtwrAB1$_kfV?TsDmw^?M4Ke)ugf^AW_hzfOTPZ*{`#nj%=N)Jt3F7YefM
zcrWTPeRzYM>|?B));3l1PiKxu{TwD8RE|EMzWbJ}J=-r|e(tc(&XhJ=u#{J^bbWgP
zrBSv^BGK{Cm~iNhkrhhSYOk);;Yu5QB;l*)CinFbNRm2o<TAP#*ptlKcw5BSD#(I2
zrv4>`y*7!R(fxk&a9`x9rKSi5EBciu+}X9uPKUeyB;0I#5ZI<E*ISn*ew5syE0?9~
z30K@^DKOn6^#RU|;ay9=K$Zr<*eQVumK@Dd$C6ig`B#}J?HxQ2`j0wcNdmMRrv<rc
zooA?e!V`0unm<_~`1RfN7f+^PrMkk^u%qScw~P1f1{>2H@)QBoZt;vQUM0J5Dy$>X
zvdDJB1t#c-Z86s{HL0Bc{tr`f`r3{j^D&v?pwHAZCo^|xg}c`l_=yF1x~c|`Hw3zl
zuBy#l>TZgdrCQ8KX?9Mh95$dABzS}suKP3tH?^hHg<kfYe)Ba#U%OV1%-5H%&q|?d
zyRb@)T6=Fx3Is}4b<G#QC|AGx6O}-)03LF(&HGln?G_oHBt!mqr!15%)4`E|`U~Nf
z=RvjWoYAb6K!dEB6Y1ds#fe4?pTxuMh1^~Z>Oe2xV$2-81Dzsrtoj^TP)TE_^k)uq
zo*TppH@6Mw4TK)93}<e{BjX@8`TY#}`Ga*jOfKz@IyZ?IubI>nB5M<qHD_)+6!LLr
z!xNY`<KP$di<`=zzWG;s%t+6lnP?+F1!mBdQFiR1M@I<OX;LkQLajX(C@Ma%=trFc
zm{dwyLx-i0KgwbmFjuczJm0lzrdQ*SG$|!qOY#c~cvdphYNd6f>wYZ>ixlVDu9{Z+
z(wFyf%?BRd?D~39G)ReA#AWtl$RG9QeM*18oqa}vUR~%2s%z9{{UZFFw;u4y#x35t
z824#yE4P$;aA2y{2)H0K+g#j?mt)p`^Exd0a*BR$okB2o4t{`TR<B#2^xea4cgKo1
z^b`>p$;0|q9!G?2CYUfxJQ~0IYY#I;Mhb#GoY<+ibGVVDD$l7V_)XBD#EV_kh?b5D
zF33c6b2+7-=Vd)5q21u_$Kw#JUJ#<1V0NN($E&qm<#KJtDT>Fk0g`vezYQGhVnw4&
z{AMlpiH@XDdaFg7{;{LGwkr7Jxz05&wokpz9@%OvH}gEbj{iY2-LTYk2+nRT1dX#W
zh+ObD#A3jjzjynpQDW{FYkmy%{4~Mm^TNm4HxU$)R}kyN!0SKg<DQCEa+zv;AiUf+
zoUC)nil$|<(|}r{!(49YVuGXb&|YHQ+SKQWuR0G`-ia;zKkU6_SXFJi_p69fA|)Ww
z-5?=I&4~!o-7O&9os%gDA|N2$-Q8V+gyf{VyOGX0*#qzUdET|xTK78k`nEs3$KeMK
zzbIpj^SaLX{r{&8MCV|%IQoRMp(&}Pr99dpcYmu~S*pLYyDy6EEjzbuM#jzxTKx%J
z5t21IydGv@IeACNQe~3?4|vARk)`~RixqAJ?v^(rXj{Zt8Qi_ot7UtwG0)}h^#<WM
zQ(+uiJv*ROw-L~NV3;97$6@f+Mo$QZQ>a!%lt{lJcQ6Tmvic{k$iY;(I;$&NSmn*P
z%R241UTfpEAJ(zNkWWV&Fi+2TD~r~WiyVM}cF0EgD%OjrX}z14DpbF-B4tyP`5Lbu
zio=D%T-nN<e2#*rp7a;k1ao214lkrF@=zm)c@#-6Z6ZJ*^<%&Lqa2q8-<cP^974_u
zxn-Cq9@af#Y-!e2^jOV_AiLV@$Q-Uhe&;9OswA>=kgT686YndZal8ZC^*1PQpV)6K
zx^A|fwc+=={K^#jZF4MC_Iky0rfk`ksMA5SOtI0#_#S4kZY4rJ9iFdxIk!?z&nP+4
zI6$Lv8Ne4D?O#J@h$Q-&1IM>kVkcHz#7_A^0meh;U1+mslbGd%O`3nOnwIh8EFL6+
zfP8GUjEeZKy*c%s2#c>I(8}l2beibX-a%xDI8BfJ;<FpFzA41;Ln>yXbi6U#k<ntm
zwp<V)YTR16{*bZuLBy`KODp{p&8yj?^~bUTy|Vj&RxO?7Ijat6{<=!9`${8ifVoAl
z`fS63H4LPbOqQ=ae@Gj*FZ?Qa$z*XQstj~Ksg9;Wm9ly_?-hF0^Z_q|O{Y#m*YlaO
zrr>ZLn`*IFCgyswO`Jcc%}}3pOQoH+jhG8bZ1=W);HLhfMp7q4VS1#KR4m6shaEm=
zYduSMtytdBey;0DvPj&o3IziF%yi!T>6Wo4!8hqLejLd~Vur)!n`a|mhsg^WHhS?l
zrry@JSdwA5>a@iNC@mTrtX4oV)lm;<satG--q*0LpH{h8#RuN+ohu*Cf?-(PU)ENy
zUH%@|&KQ@Z5U_wtugO&(fKx8rZ0(t(teQ`D+#m0voSJ@HWKIwo|9<_<U0*h3-L<m~
z!vEN6)#y)%$HSD<#;s|H;k-1t98uqL8%;oR@B*^M9$N&N5uzqLl?xbiwYMW&EGHp`
zuQOw{1+&RR^YmSAp1KLSIM1edfmg+~${muOn|=J20Lo$d!d5P6{ntAb7c@_$W=u9D
z3T)|n5`eZ$g5V!XfQ-O<5`gn>c@VP8st9TcwCNQXaY}ytkW|1!(2f#Lf_aJ~0j4DZ
zt`ADFoYx;en9|;o@NFp1R9dDAK98{UeuDvw{>j0cw{=l~0gfv<Wmc<5T+(Tnn^$P$
zr-+Nh317EVMqG~0_awQ_eWv+t!@hf}iHu6Ck3xt+GUJ7+3ifkuZk)o6a*tHTW(>E_
zx=CX6)N!7M*%a5=EjJmO&u@mj&<eaQ|CblQ`BF+VirHEt-q;|oo~IA`1}wAvI$-HT
zd!8`NM`oxPTd`}ArDG957*z<;fO*uU<QQ;or+@wARG19h-c7c0>nFAB;-OY!N6BhC
zc4eG}U)coPI`ES^<S65=6}(hhT&@!2g9P(4L-Rgs`js({4cy1{q%5B?q5<EtQjWjc
z^0?{4fwpZ`8lWaY`L?kR+4%O16eJZKQ<S04dy8My>}b(FwX#j9e+T1VWO<|QS)^Nt
zuIg3xEmPqgR8Q72l$h5#^9ZknJJJc?yG~BE;6g$cpLgzhJsNwiYAjcKHu|Z?5NDM>
z;Y@=yJ>->5g{n)+<yb{$NFXwE2k?;uj|;i2qUk2jRM*^Yv`QRqc1p+QNnfNhX*L%L
zB6f!$-#z5cjCTAe$awb;Uk{^HPhO|J$J|i}*};F5V|9K6NHx|qHcv$_Jr*n$)%OeN
zu6yY+V5hb5kRo@uUP!gbHeOxPoH!s`5W}B+{{D#t%;<CV)!t4d`2ZT`HHY&<Z$Z7I
zvx4G9I=aDcL^t(J)~}f1<&?;itisa4`8pKy9>tN-ZmMPjnZX4X<3*yFyOV0-^RF;e
zU@9WKLKX9?X;*{oH*-OIZ`f=-ZrqGuA$Nj|S?||T^1ry%C}&BOkRSKMAQZuv08nD2
z&H79K$;JzC)TYqTi=o}~e*LR;Z(e7rxfb<}W!U&GRv6Z<<sk!r)@OA}t7+$M^hYQ2
zH;pUN8r8_|e8LFhD?!a}>0A4ESi8?}98xqbnhP?nR_+4S(Af`?cRS|gsnALffd8s)
zJX&3W*ID%6*q7Zl?Lbu?-ny-<HjA-KS+xRjy?p`8Cm%{JM|$iqy3Mr-@rI#S1;z9;
z^IW6ULZa%WR9;b|>1<qpk|YFN_R527OQ>i{dz=O~&j%*86?`Zn?FYDlj-=zvvV-f%
z(~hnw)zUDZnMfiqOImhD>n7`W;Qi}?trXOy61eLqv6&5SANjaZ0BN_Nuz1YBC20To
z2kgmvN`2#Ru_fNrYw)KA{FW{9A2Q|X@tKID_S?7|axNIga~}U3pOr5_VO?x#Ka-<j
z{OfC2l>el#y8tQkoiL-txzju6U(W-9DywPWW@=>4j8ZsuqRc(DrM&EDuO0)`Jy3;P
zfqi>>g)vq<Y3DpG&kO0tbtoWxE9e2iI8RTF1Q1Z<GhlX*eSI7(KMbJ_$}3a9kI4}1
z@YRZ?n3I^kyWSH`4Hbp2&VYLQJ)a-N$*O!yM1bKul^X@lclSk=bRD<j^*%A%W<*91
z5xS#u1iAbxdw;<YaKQ=kH|Jg6H|P<GAVpXOHrr~W{k)e<%yu0seK!^ja_aHf)9b5E
z@W%?u`hC9-jJ4Qok7t^iVA8P|yX#!G8tk#|4vne2wrrF<gCcxl@Du?k5h>WEou6dO
zec^Za`&|T|EPrnjEnf3cuVWOys#JW)`i`~#)i9ipQYQ7blUv)X*2g1kA}xTtz$BPV
z4t@-zU5|%vxESAn9M4J4_P9ovOwA4IYs60Ii(JIzI)+)b!|qO{??=h_wIyYOI+Jb3
zW$G6vk&?>WFfgyS`?jHz?${6b*)PiZ&q2k-qE%3v8U4yo0ok(Qh^i*$&YdTVvWb~4
zD3zc3ab$g3%pYsgx{Tt<pq5OUp3DgwI2Pdty^0#02YAnrn@fyne@1Tfv6Sv7mfrGP
zV@72a4+?ANPY75t>rY}djh(p^Wptx{yLC<$)+~_BCKkqT8Jj|_P}@+R5lf4Ad?Z_N
zO7Q^G(8p_pBi)V`OR5(s{2_jV_P=PRdF0?WY!4r112L-z#O$e)`z`3ETg>7y4g5uI
zwr!Pn=<(WM{$c183{Tvh^V1%+vF}BeB<=NZQk1kz#j0!xZaZQM*Vl7C#a{D~wapH4
zD!CkR3+sdarIEo8(Y)B5*GtZrWIcg*_SuUuoay4rxvdoZeG$9Q%Q1h77qKEzZ?M^k
z^)4OY$dVCn5Hwg#4uu<k??*FfJ03kz3atAb2lp&f2BOu!@45P66W}r|lYIRUPBaP|
zg*P2*l-k%nAr1DJ2iNUq_HXuB-JMy6Bhc_#b6OEIhL7iqin?$HyxjcLPkm(>5+_CM
z1_ekCY*KutUNr8UaVU5qQMxfyqub-*0;*fQk$Dl#e^gXb$lS|0<^L8!q3tCYhSw4J
zVv+KtJR^DY5kJD8>WnNOzwQTb7#*%isg)*IV-Rrx_T2M32Rfp|0b!xWru5^{*yQzO
zmbE;c^dx?=U&>Vq-b^a5N`qG319xqp=Q*+DCQMglvz%T%g+!(CJuQ=3)&pQihHg9m
z>7PLWtDGIBo1(|jRZflL8|)B*wkx8^;;aO<-(GC(Q|Xhuqc2l&#?cehUe8uT;vF^z
z(=&E}qBkC!63>ZRbgfRgHBr{m`&umJy;bzCBIS>d(tE)6@7$SE?O`WemM6?mhKyEW
z5xbKXd(GhIY-znjzao`1dSy~U8=vjVI8mhf1PNqx47yCq*Dcy0f!K_xLXK@Nb#LKX
zrwRj1H4q;p8xURJ$vZ|<3d&0?N5au|G3Mfrnx8JT`Zhljyq({h=G3;9N&BidZ>k*i
z%NSDSg6Z+w=Y~--;zh7=gK-1!PivYGV6f}eyhjUM_qJ(uN4sb|lw)z7_DkLnzpyrx
z+~=5yn6YiTZYtJc!a<RLq8JO;gkolUyE7tB`dg0p&dKlc3{5WfSClLPSV+E3d_)ZN
zatp1>cJW~!yI6CB#He}ur`U_g;<^?AlZ<F^aNHNn9h3Q5bFR(d<8{ko_{K+O%iQ3<
zLiPr)Wp{cYq4FyMt6sKCJfwpEgWKtOquhRhN~?`5^?R9Dz-aLBhKk72e}vv{Tdhco
zy{HqW`j~XCHL@6i0^F{_XG!kT<_KS6kpZje3Wd#c>!RarHC1f@K?8=QGSLEY-G9<(
zpkJD`oC#9vv|(0r`o&Hccs1K^dfFV`e6KVu6T@;UwZgG|a_X}DkmF&+)d1Re4{(R#
zXCbVd>N)XUwOnxv_15@cf!(I`C|yDwKC}n(L3=6>U&8_;bIp1xs;f-)*+G#!i{>{G
zriOMVU1wJvN0CeyN*9Fq6Wz=+bWZyVm8tKWF9L&%&>y~YUw9Pqkna)uESKsBaEd|-
zwH#Gc%cOja1@Gc&%cBM5<-ckhPA%r7rv#DIYbJ82#|}C;Qjpkn1KyJBzv}3f-F4G=
zdhxr9#XEZiYr*&;XsJsSr!ji9{6$^9zK4KeDCJqzlx@lTqoz1Fbv2nEk=lQ*<&WNo
zIUwC$uILySC<UNBxZ@6xaLa(h79X1q=oPt)7c$d9Cu-yoDkzv?>hRCApkA+(xzo2E
zx~q$6Gp$z@_V_JtPimj@GRws0cK`yG4IFe=UYM}eH{G-A7kNTH*g6ZUb+s>nShuYf
z2-<!4k6ai~Ek9~(`IADI;2j@^*;3ZoXntj_blJTuxNHC7PNPD3S%;=<Hkw0PGuIo-
zE(;92(#~apj=23~2dcg1cODNncJk$K{FI-%L)>P!UuwwQd^K<%m(^;%3CmE<9W21b
zXNeQn=zzQh6lOL4OF5lf@wTtj2?@6e3_d4!cb{Evbm3;3_l!U9*&_E{l|r>aM+D(B
z3m5Bob<sVDWpP@T^+Io}7rcfPDrQo>_9zNvF_Exg=>JShBBO(|<wf9E8LiJqVGw)^
z@vOmc3fhlL4C^`eQ|Kj<K((3J{JUrJktd~2Z*CJ%c&Q`t)Z|T<>k>;DYwT^be_=w7
zCHxhm1Wvpq-Jh<OKcE_&fu@BWY<x_goDmfF$5>Z3cV9+RYX$P2!)eb??^^`k;(MO{
zPHC^W<*r`&@xz;xaa{K87{CUw?(UG(8+@L*=PSl?@62{}pzyTG3uXOrk)W|N@BM#G
z+IH=C?WvJBt4{e3OprwK;Gry~-m)W1je;f(CaoVPB%7axf2$V3`Qkv-nuwq-)~S}m
zpM3rT#S+M3&omA8Te@W}FLcTP0!W#PBfP{CW}wDbPZowvu#V?H#N%;)M<R~bnaA>H
zKXk%1DcijjzLvwS^)TA*5h>D!r%Kb?k>~y1zev>cBW*nT&nKD)c>8_FxrF4K_g!%x
zG~iEfn<pSF4OI#Cjtl`|-;RPmO5YHdVKgy2&&hm={m+1Wk7{&~WOp|9T;F;BrpPx^
zn;k#<AoM4@o~j)W$RN>}eD($lBIPST!upCTgP!-um)2O=NVgSjnh@Irlh9yGL3ksB
zf)THEDC=UsT{fJJ%eaZ`hi7(=A!B;iTAVm=;f3M5D7T)v(0sRx#G9)#XAViluJny$
zjKYjbRfmVIc3KFmt~Pg)%yw)Dl)B{C^rXqbKOw&LoUHY-E(Z44GI!FvsXu$J*2ZNb
z!T$N}yu{6YdV3|v2bcRmP-ArQ)<O(Fg{3=k!`E6olq}cB&@f^yAqZcHDL7h4WLk#O
zE$u>mUgIZ(Hu#>Kc8HE9KCnrBSlV4;Gm8f}lgwL)N__&VQ~6K4m|{=<DYSeP?vYEN
zWBtbwgTBl%=<&)7)n$Zn;Wo6Apg`oyb-7IPiyx~r88I<3XQOop7M+Tb?hKw_-zTTr
zA1a^LEZ2r`oA<h2Z=ZgQ^iau;5GY)_4z%f*ZFnpViY<-~A)8Q^?>cUjl&;<CrRPJ_
zxVj>`+g2CBZk>+_V4UJ}SbKp<a-Gg9w;Kb~ipf7q-l&-L>fc8Z6(T*~U6Fr=wKv<Q
zNYmThKTu?A+jNeE-=Et3EvNmF|5*!lK$w<6%}YVU54?#}`ghoSfKkoekb1MnV~e>Z
z166|U=>`ZP<kh(&QPx|LtZkTuE;m{mnB<Pndb*;I$#sXDF;5?M9=hV}Y~U@J{^}yq
zZ-!JxC!Om0D2_bm=F|;f38h!*Yaq33Q!#3B`y7TM=~2q^lSPq$;xQ+k8l;4l=*#a+
zfh3=GF>S@H=XQX`q|DUCnW4ws%xXvdYaC|W%I0QhnSb4jdR=K2<W>i<S~O0>efk)0
zJK?GU6Qw}E;Y?M|HVXSJfJ$e)?*~M`aq!XDS()mOFwjj9TXL%mOUL14V{_1;bbi<i
z$j=cwAEf$xk*f;stKh@pRV(xB>Iqn3-CkhGO@8gF&KDE;*BPKkHeZJ$??uDGF8oQd
zt(%A$eYuOzVW8Y%pp-Ti1ihGR<pMU5k8$*25V9#<Ec_hz3m0DD<a#JXesB_iwX<_U
zmT1VRESkr)>eWta=}(1hs)!jJUV7&_-@rY8UDGu2VZVOxhxCMpKqrA9P)4S+ECo=J
zL`*LKnHRCeF5D$Td{}ConhAW_agEI9nRXIOYtxXf9JHt7;R?kG(Rl{&nF<EbK~?;T
zfAwAJn76rs=7HT`&E@jK+DCFoKOEbG>@F6l#~3#%bDq`x_Tq4+E7reD#2+146D5??
zQZyOVlL(G2s<|~GF3H7-6|sYB0!ro4(zc$%9Jx2i^cRnJJdKltOImP!brdaze%m`;
z4&m%_JFXBNp8mNVc}w5f_BHM4p9QKdqqjAGtg;{Fp=?1Y>4Gi-1zZlYOFOt2YbV&j
z?>d9=Bi^n9WcHt1QWYqyjk;trtY=-cDGxT+r06;I%5G0RyEgr1Tl;Qr>#uLbbed~B
z*8jtG`3+X6R4*trT~`v_0hlx7YcDQ4?H|8p-ZOd3$((V-K8I+tCN~Dj3le2W2dIBj
z>OkhTUXWV_Aw>4gM)KHH3zhWz;qI40Y0Ylk-|=!s0R<hP!8jwFw{O+N@^FRr)o8_e
zkK|#2GUrz`H&~O7bSUnRf#%i|!@YvZZsC12za<aZPj_lm4=68-op|k8|8r&gZ%3J>
zfcs9>PXMsFwg3EQup~0pp*_Juw4PtvOuQ&!M<6N5{LPE29j-yJ_5KN-?;Uf8)P1(Z
zo->$X)NT=8|JqweW2DfcHVeSA`JG6!kmZh(T&(qT=IR}Pr8%(cHHqH%qmD{C?Y(b;
z!@rT6clN$0Oh_tY?A^$A)oh{%3-<Oel8=jfu(|?Je{{CGyRiPVxYSs*RER9`-83B*
z^JM?1&R_yHXtD?`nps&SnOdm9nP!2o<OA%vFo>c^hlg;24Q_1}e+;Zota+Ar7UFMy
z-@plMH0DpN-AgN9&HY88T6j+J+Whh>dZqXsHi?W`HnhX>I<J3wTO@pMx>Cy+7-H9$
z?3Z$%&5{@C-r66{<20ZB?6uXpa;`YVzi)COPH$FJ*p$uAfBhWa8V<0`J8n2bX0Dud
zdZYKszLUs+?|e|;P-Wu#K-HBIRDAf^uj0%+X}%7KW92rvB_BxJpha3E+j+(}S{W>U
zC$X<W5A++u<WdBUliLkhQY69wZKzP-*W2)g%}9C}gCaX&2e~o<|5GxKn8DOWv*<}l
z)E2<g!X8|4*_=|^>3ACHmf~jAHkw#kQ+9hR57kQsH6%)pClZjTiaZnyA1h_mb{z>I
zmsQKJg=9Wnhb3zJzdQ3{xef)C^%lu$*~gE16VlDIW4cw9xCdeGS13}<U*s~d*$;D@
za)M*o6ahBT_<J2|JYckdU&18HD359{^(Ha#Ja+W;t{VmA?y2U9`E<n#oL%PPL`8u4
z(!sYyP#HiV2TJ(rT8SzG+%R+l=NnH0h_+46oAJFH;8=-=h*0eA=Deu0&lJz|h(<BS
zVdd5EB-1W(#-YG?J(?>mo5*`u)jO7>%EhGCF)tKBxQegOKI;L=cp6)&y*bI~NVj-F
zPIe;uoSEkKXp_#J@1vH@=A-LobQP#u|9G|hH`GCM+~fr;djZZoD1Ep0*ZLhi#;iOw
zd=<C3SEGFgW9&QI+t#h48X@k@^XaMl*?-p&_!B|_9ir`?TsarBwYz7t=5tO!7kZ}2
zSil$$sac1wa$6GRba&OO(soo{hlOr+aExv>!N}{x-S*Cfxpf_t=gDcspM!|JNKSMF
zkdc@kG&*f_Iv;>U_YcNeFfobw7SK;1WPDWtM#;Yofp)l`(xNJ*tp_lZIs=FSu~XmS
z@xsZx%}?PIA9>}J$v3wq=B|XCg-f4B(e#A4N`&@lmtA+-16jw=O(>{76vnKkqCsUl
z{jJ#o<4@WFU@iAk?3LqW^;Ro5g6|BNVs~Y@=?xzM)r*2;TwwuU^JnoHa9;mYd4~IR
z<0_E?W^~tPNL8NH->&%#FA^`3PS$YkfMje@mapq%AT_NbJDL8<;ffCoPoBDM?g^yN
zZM0g~N&p#=c@_^yqLQJx*1|q5)H=SUg2)f;W{wJMhZNF|^bwj>bd}6|ngcXg&!|X4
z><$g!@$>B7{wSa<9RD9NzYfBOh&O5X82B+YQsXg}h+XmwCe#b?etCY)SxCaBSy6_4
z&U1WK*FkQhUZf`;&uNl|+lk?*qMjIuom5OlD;E(LN+ys4LKdLyQVaHQhK!!u%Xi(_
zw{c$EFK`m6*wi~*48v)IhJ*m8lE_@SQ33-#rvZ7ecFcE=3v7aKBiX9<)2r`M5x~%@
zS1VgE-oHJXIR=Nk7k4;kKs&HFO29e?+bf0PLML;MMTWr{YTw{+79?RA5cWei$1+G%
zhLWY*$le()Ziz~%`qn*ReTRH<-KSrZ6U|`i(FB(V{2E%qB3&Lm3;<J82gJ}0=uV&q
z560-Nfft}dGrMScG}bCEK>LJuml*1_Y5dvQvVo<7<l^Z0F3{VFmzOta?rm}fn(-2y
zVo70aU2A2dBi#b7`{}OTGHX94CUV9rc_!wb@oUz&UYorvy44H%R7ZL+3gu1)Im!_v
z?~E6}btWs=Iq@o&FkN0zRZ&G%(iF|MZR;)S#@xW7DOvKEfG&A<NL%rGH<cLg>)-u?
znX}`mN#$Z#W;d1Rc|>7f#Mu{pes<>+9PXu28)xwzOGS>W1W`VpFIVz6YPZ8}vpR!X
z7?30UeRuc}FdhOdI`60Rs<$6fBo4VYZvdi<iFm#@W$p^LVQpB^tD-GnjNUeh&Rl3U
z&7t3-Gj<!_4N1|hNt?4=G8+%&22gJcl~RVvvOu>a;B?DCZn<M`9U2?<ppoyrG@rK}
ztLn)t2nnk4j=!4p&O;YEH)B;rC<w_xp5_kkWamPzXOB|7w%;iJ>Os#|zZh*wk*9|k
z;g$5RvefmlU8mXc@b0tc?y7Vr`-zw=4i?(}E_i4&i+Z5ncuHbXxXE5)CY3Ekpc>n4
zeC0Bu!_jpqwr>>1h`b3gSp?J}eS3Iy3%u^PI2;6w-I{sU^>KAPvN9hciGzJm(BCFA
zzPwfv%-prn5_PF~0i1F5dM?{SDnfS^NnS$K0Z!_${JF!fKU80{`F^}u$o_0iMfI7W
z-1Sl>BVfcuIZF#%wT>ST^xcX|N`2el>suVD!-1>xsvdJNuufwFdZp<+3_2964^z0A
zvN)Ty)>dk$G9Lq_h#nur$y*tHAz&Aj%syn!St;wrtW@a2Y*^~uuHO(m3k;Dvi&-Th
zVBUC21d370k&<Ig083t-tZ&TMSkL(}8m=dkPJkT69#04K;H7v}fK&?<)Sf(QxMmU&
z^xmI8A-&h&^9RhvFzU<a0y^WO^YU(z)kK&l4KT8t<<f2o5l-XBF<-R&xX%0Le6`2I
z0WGX@jZ5)w3bgyA-&<(R-d~10>Y5EUJU_Li4{%<xZ%+~p$8(Un3S{+OjnJ!~oN$!c
zikCBqI$-$J8~TiXTopc(b{Lz*S?D&J{&Gf+dzcYu{M?XZ<HpdRzTV;q`4GKH-`AYH
zDf5*)fb#2yr4o}Lvf5t(babsZfJXqWN@gV*aPv$-y?4Vp`OyM>l`G7<4+cAaP~H$)
zWEy^s1&SvUm^)SU3c3<JI{7`r44ZvQSk~r;hL<~|7RapMQl$}+>l0phmv*INFO$1S
zdmdblN=*HWrQ?iWneE;EjO~eF%E25$RVwASOVosC=oNGr{WYV?dv5=wa0k~v)5Y=o
zb27gPK=x?S{y(-rSeAzVKtB&tfZPm>+U9J*dpk^lY`W_MdD2qI(&*5m!R-VM%!s0d
zXf-HnXz+Wjy@4Y(!4us|1eH$@W_#%7&YCOYgaBwZE)xN<5-Yu`46$B86XKaH#X0mA
zx$zsC+V5&FjA2cw5##MN^cs3@OD^E;dyVzdNC0O2LnhdtU#QA>e?I5ukxV%1p(o%j
zG%Iek&`pjjD?Q$z${uQDldgffSnkN%e9=aujSGlrvB}v^&=g06sytz!nHESbuEQ>1
zMDT6I^?P$mxkB#OvXKOCNnC!07@Ng%qcB$M+^}epw?HXJ(=d)V3|`@bsBF~HWjYy-
z2xkXnZ_iXi{eL?MRJ&i9_i^e1K;2muYq@23`<0*B#dAOk-FeQ^^HpvV`>#WfM2_6|
z>ZRtlR3>AG2E^jsu-=iN^-R?~Q_X1i*$3m8$=xnYnvJ1iF-I*H6=n?v@cKY<GA?~f
zB4VLVQ)415-fQ{P3We$Ol}x3?QhGvk(M=;@WL2Pa^pN%kCUE410h9UAyPm9k5Yj6)
zur>?<^w+lbrcYMLtW=Sj1`YG=Y9w}Cf=@xaG4XuzHAvb8A8{J!K&N-qJ6$*i#^ZBN
zl$ZHjrun6DP86|}n{|&dHqwDvr{;?9D82k>6D_k9m4b3d5x5iqYADq@;ey=2NwgI;
z+){Yu<rKvaGJ<1EzPgxU?GrM~{mv<6!!d`iAiAGdI0(e@DSI3}CB<#O@a*s-xoEe8
z!rOnh&3hFYl<2^@AiM+K^F2y*+3E0xDUDykSr^JVnT<JbzJ}S8ze;lz7t)gO=H0gi
zb{H0MC-1z`UhJbk5VD<h**n)X$g<3xWC;F>*V`58;T_jJ<$^Ac)R*uYPq)df?XZLO
zUvTsH$E)Y%!ajm(c87?cAlOzPJ4oyz5Y1tO=cb#s>ccX6bs}r78lEp7W6a8<@=h(n
zzFwr?qAi;#<}{xv>-B!0H55akdo-3TH0*xeCW2~`scfXA{2t%V4;D-<>5T<>MeK-T
zyL*X7atR}I2GMuN1*})!68t#dJN}Ycwvgo32B8Qu8p)Lx@9vC??SAM%tOu|brz<D2
z#x=dpKUt#eKQEl$5Enw|=rV3gG!@uY7{ZLV?=AzmoNhbpDL;6IdR&l;<;o?iu77NE
zL)_LgsE6)3sme6y)L#=OK4{Iy_E4YjTYx_aOJD7ln;JZ1p=+p{?#H)|vp&jr?Em_(
zs7iUx5sC*I;ApvO5~o7mbnu)`dAx$1Cnq{{@uXKBe4glLn*3&48)(zI;_~i>QxU2E
zauUfuJSLeB2|<hl_;&Z}Yf)i6_az*To?^Fh5sxDV-1jEXkvagDEYy0eeLdQN3|lwM
z$eruQ*GC#>cMn|%{RO$5eIM?71xU}HtKBpLiX8V}4ri{a@E<NmgEuYbgMBNf7KRx`
zEh{0w!I+Z!hm>*~G0_27ipioyaPB?-oV1|IS4?dfUGMV_q|mc-7zmt)Op0JKUPzSS
z_;cP9Z|~Ti1X?Zto(e=PG>xCPbgVX~%r9ni1mgD4=+w)7L7k!yei%NPY$(Qpn17!d
zWfDp}fW~y&sK{|Ni+Q1Z+ZaN^{`-yiwd_3|{m%VKf6W(4|C^MwNpa|5Ruaf>N#@~f
zu>>Fn(LO3!N%*%P>VN*>2jEqOe)ey#DkwK<TfLLjm2E$u3Jo?#NPDgRnze0V=y0j`
z6{`#lU;-4x)dMMBNm8*D+N4gsdqD5;bbC|Tye~#qE&y^~&X7}E#!_r+<F`bz_*`b&
zTml?S>1@w*2+)2_^0n<f29B#?X2pKdOWRz8Qyo@05`M57o9nPDhjD%`v>j>|?41eH
ztN6WfC=Fmd&_-V}w;a_1v`Vcgt$Slf$GSl$bx%*Kxd{lQ3(@W4=R#B8NE-PGOA&7W
zGRm1<Di7F7e;GY6ucq;*i<QKx<-Eh^SEAdp5w}<g_ywT&KM<}J-G8CD*B?!f0w>2P
zwAG>xega5xop;Z5+h?u`dCKEjEk7LLvI`YMt)BVUw>qsOgbkn7<nUh=67f*R2*RA)
z{e5amTZMZf=gVYF$Sw#cSl=huO9j(bYJbhHbjMJUJGqamny-9U!RDa^(F3P%NVYO7
zmAw`SdmsyqhZG?%;N`7Z#c)CQOuM$*)4o!umVqwn;N->Xt#OrvMzm|C&}0z@P?e7m
zjPHwIboQx@_G@BTZ(d_;S^E*5S#DRn<~Eu@>fVckQE(VAMGZWcD0`49mbBrrvc|Y0
zup~5lAgm?_sNrh9RSB22P>+9nyr7%wqFSI|n?pd&T{?TNp3`gCca-XlU&XrWvNt|4
zU`;?^{IX4l4ew&IBIPC+W<8WGO{ki>K?9)b)IgQlt^i#hz5p+z@r)PgNiJsJCi2+U
zUO%dS=ay771Wa*rd$6n*&E8&}Y)k~>MSzuB^lHycJ9l0h`E}an_HbSMmp?$58f0tR
zq@%X2^X2pr2u%0Z+5~Ea{VcqdNjhe=o~x5x+}|>NIFFG59_vQp%pf*N|3-XTvncuC
z*VVx+^y`<fm+ZkytLKNK3%H$70i&A5qa<%7G0F#<s@A9DNOUr{35aXUV6p-G=oi|^
ztZCZBlP<GO_a>I9ytnDSW}$5Zn?g#Ib%2g|->?cur<TPQ3ys$&`zB{vP9Dq(pttIW
zzL*+tNlnH@b=9F9MF%JhN14gpKW9kaE4wKTZO`@7h5n;<gN{}_%oo?`9;L=_nOh5i
z<-EyBSu<`=^GgLgBm1wNpyIN^SSqa_sXPSQ;U{gM1J)_UYc<M|CPa@K{U|2p{)R-$
z_e)grNrc9;Qmpl};9;yBU>{&a6j<o02ah<r*&M^#g2jO;-{kT-o{MNTeXN#B==K#u
z->g;Z{F((-K)XJw+s+)BOPcy6*{@%fw9&7-Lth;?FX-O5Z^>%K?9)MlxwpD$+u&w8
zOs{z<@R>fg#{GzB))peyZgJv8*7v&uhYzj$x$lVu&7VxlZo28^{p5H^fX{EqBt-a9
z4dACQiyi3gN&m6Uh5hNi&BgF<9hovJ$Uy^3Jl#J&2=P#cur~haO%b%|ujU&r(8pap
zsVF@mEY31!hGsCwmh1$ufH6G!qMK96@ca62@M12LXk3u-d{0moirT3Z2@I|nq;tMG
zL3=WyxXp2Mvu+QJq%$x&13>kswM5~p4_>=f<y8DGB-gK5p-(`xURe<8=bFnVVmZL|
znw;<lIEy|Xa}dmNLsmHM=gslthsl0RNfUP+-96dTlfSoXLcqt(b1RYt<}A!1cWcrH
zf&A~Yxay$viP>_XaIgZD!tZ^K@hMMng68@#9$+OAp>gb55Y}l;L?4$eNF?77;Agy~
z=}2&mkBiTiq|PFATW16@z!^!pk_Osw&Y>cp8qrCKuRl&6WBYe@IsPE%==zqp#Sm9Y
z&9W-V+{%Kqj@3W16aBH>d3kweJTIf{+3nA{&ME~#<)+ST?4(XMY82;Kv19vb!;?L}
z;H^na=v7oI^~n|1WP!+dp&&zyV(YAnH$%TQJwLK<Am1gQW+Q?ZupP_BR!BLP^m&{z
zr^gN5uy??<y-fPB_hI*x<$R`L+?5JV8@@kQQtkX6pt^f@fL>%wm3w`>_teHF*2)P1
z+r_Mn{p>>8!n-JKL5yXq@Htb28|bRg95k^%jWqWeE2^fq)3=0!T&^MrVET<UHJ@`q
zCc@N+T>v8_hgyd#O>?%QJAz-(pAqH!6oMYD_*<C*sg;%&dX^c3fD<R*R;7JnFU*>V
zqh5mW+Fh~rRu+53`{UM+63|2w1U+~E75&**o}yxvk8{-v4n5tmPR~@^1;5@HHXOXR
z-|qI{5SpGOQDZG<-ql95Mr)|C7E4en?acC`_nr7bMZHyLodG=HC+@%&+R=;E#%)K)
zHIogqrAodq05MRi<;A5VuO3!G0*}{P43c%^1K_~yO~$~iu~uv3S|5?6S~!_Fjg4`c
zVx==#5w+*2Fl(SyTyi7fT%euXK(P9Smq%mQ-Eo%FN?3iCYeyNCP=IQgnAlpV6$>I@
z%~pK1O_(}TiG6I(p;!Wd-&WRouPEPOECTYYz?MsoF9}{0c$+o3O=g+IyhYSAsY^!N
z;~6?9ge<kPJKxRiugKi%8eXS_-^fh<sV+Tc$+wc%4@0!KA_J94yI+;I9t#2jM|BNE
z3sYBopV>Z)*or`P{dL(?vD^TYN}oYS2jWqHpMrM+Zt*c+j)Hd1>RJWu{Gn-ornBKw
zBO9yaCiBP!V11d>nwzozxXhy0!aRE0Uu1c|<*HrT{h7EMRa$@O$gv#SUGGpxRrCft
zeW^(Fbn9LoBKj`>5P`nzd{+=gl!6WS1@Wn~Ka!^+xf%XA>$pBfcEp#?$yr?0dNhOK
zO>cG-XS{dGSYQ_NaxDGjIJ4F=z@t+4xQMol-c{K=f`CuNUvG=h^~0ouh8M^4)HpsY
z8lgL1kyd}+f)21oAi8Dx7)kVjdh=e5TiOI|`io=(SPDm_hpn!s`_qHHOc98;?1kXg
zM35BN^(J(Fr8Zs60;%5n+oEfsI$*YgZzP+Grs*;F0TE)@nNPmKVxL6P29w4=5?D5J
zwhX+u>i|g}c`gQ!%b#B*1JFIYx2dPZX>Ma@0b%CC-57tZ&UD0SlE%FJBGvlAInj4_
z4-S{{U86KtC0*1MYH^;OOF3rEr-^;5!3G(JvBdHXSZB5J?rb{PfCn+QZ}(&4wSShJ
z9m#wGFYP4$v1;W{_gmk*`9&ZqpY%pHwp1r)EMG~9fHF%i_8{dGxn$-tlY7rprXk}6
z9=)6<(gZQmi6=F}EJvR>I3J7TjSLDFY4)kFWJ^;$gJwmR$MZ?=8nYI8ucwC0(mj#1
zgh^Z)NOqHGbKe*aiE@9Er)yqnD12p32CW=1T4hJ{0U!y76qBEb7b)PqcY*_NVC@EW
zQ*QrAr*_)t=VQLx6IqL3wWK3www2p1A8!F*<gc_z@?WoA{5iAa#WlH1gEZ<kqhe<v
z{gGk^p66s`a+2{>e8#Zwaq%IW`BpeeaoxpS<d@^%_2_riQu{SB<v3yBoCC1k_fXPS
z%8CtB!9uqQ<s2Ct;%Tucx=Fm6GMCdSNy_V%$m6x%Wld6pw&MfH&GtyA^vXLcr6UrP
zD!N=zl_hLBki%NsxJ@!4OmU?nP;B8s$%KQkt19A!NJLE@U>w+!l=_%Jfv`W7*J^`B
zYLWgrI@tH9nP?OTN)e{g|DjO==L5!16fCmx7{*q>sx}1eeFlhL(lE9ELrS-Sd-3uZ
zdkftGmwXDp^?aqwMGoP<xeM$dRoVULG=1rC@J-JZEWTD0RYF}u?8x*rcalScHT10N
zima^6_Xet{DMl(SKV4~j-Xvu5wuj8V)ZOsWMSPNcUE*HtJ0c*T8VcQ?`O5JwhWJc9
zD!4C(N(|kSC0thHt#hS4pT?&S$Qy7Zz#`xo`Br($pGBPg9>yD^sZkJ3@W#j`MGYu*
zY1q{BW?wNq99mvgoAJlkK+7*3_qToAS#R5P>>E8u#E~-FVuW?{h9y!%j3W0%p&u9B
z`q64QHNB{SM~qUgq-?zCyo+{#V8A-(TY{^7LZeq?;Nz*-?l5-;Q`hG|PO^F+R0jZP
z!x(~Hw@F~_biCH4juU?kx6-QI`0{lzm4ZjXzW#94^@$!DeWM$lyP-POQIgot4FFs}
zIQ!+znAE~MC-{z!Jp#bvuHx(giv0D7J-TD^d<%qEx6Un`^J~i|*4rmDE5V9soL2%}
zkpt(!o8g^#@m%(v@dIa~N;cG*sC~{cFbr-<u9}-vAT^TQI&4DhARl7YLQ$jW$T70R
zBFya@y|#XH6v8B8xZ_`#=3wTh^g8+0-)a-xJ##vkdt4~r3)ny!_hWm>Fn4o`ceveT
zyl}N^O$6%x)>gj9OyV?i?;uZ_NE)9s(2+dy(GI_NSYFZXeC_iO4$GfDz5N8X+5S6h
zDKGyIRJSxi@gowW;f%DT$dU(lB49d$u4an%1A5ydP1Ml&2+<UN`Kp&!2guP1fU~V=
z^KT7&9x}lOKwTVccB2*S#?ZMRO^X3)Jbh`Q2|jbE=-U^=Q72}4cv_l{`_2nczt98z
z`WGG}#mb<mP0WV`g^lrP8?rVMkCEp9iOif3bH_h#K|q$ix7U6A>%Xkk@X-$V0a()A
zn_NyjK8iSdhvJ0R_j0ND9gR)Nni}rCgKl`)5_AeFR=`%y;-X91{t<`I20#|hExgf#
zZ$<_#YQ%)|ZEhy=rdMQ3cUV(?pS6~J0N=HCpS2&RSmJvKNm_Sbkr;ABIwLE7iv?C0
zIB^Q6Koyk&ic$%*mHS`ozyBlg;2ses_;0q0%)LZ*Ib0A2j%O8JnS0+j@A(9#r}BF^
zb*g?#(y_(qM3n>#3V+ukY6fmzz?9^mkEZ6ltoj<O3u>c@v?=JY(F+)$w8*&5*^65l
z2Rgm|LG=lNkN*%@;lm7^+n!>aHY0$Qyv-Zx*rEF&3qM!VKcC}hq4znk@85>||6%8f
zkDv61-bpToVco#3)A&)q4E&ih<$bqkL3c4@ttTQM^1Fk~$BzlQ6|mEVTwke3rLqZ?
z|2qHS^A269&DVV^L|sq8z%A+i7wD(uIcL*o@-=~J8qy}SY7=;D4#bwNytVrDK7j!E
zM)FXB9KHN4@K~qPUV55~ppto7g*$w_S5$l>AN*%z1^M21+1TLkwG97Z<%n=Qjoo@L
z{?3$hnfx*yy{wGxY^xN|B|72zLR$WgA|1W$ZlTT}ggCV%XSlba1xC{u_g;J?Kc5Kz
z5Zb<=A(zu~yVy&9Lz3|V&G-T}?*}nIjPTB_Q+Tc?XPc0gj_)I9iOvUD0H}Dp7N-%6
zjsv;>@3wgQ;{J2+ZQg$tbS(dM?FufP&w#ee(A1H#%JN~;$umRdLD`oR*?=={0sMCd
z=>9RM9{ohpYH$icilUjGSE<l2@Yo5wZXY?Gw*U(w?jLe0X6Pqj5!z3P*Xav<QU5Ze
zw86T!v?seDQb+p-`M6!;{f?EuxBqp^2#pRBa5twrZn7yv(6}m>Bu#&y<V~@m4J*bX
z1r<27UMxI~dh<|Yw8b0Fzd!5xolU=9%6v2@T_$60N`%^Or(d&yfkpKs259U`rGl)@
z&?tC-bx$g|!gnvDYaja~{VRH~fhQ;a`k#X7fzRxpI!!wIf3txK_?G^Ev#{kB?78`n
zO>CfMSzXK{oK8Z>>3aqRj|UEp7>-pQ1p{gj>WF77)c{h^Csf0qUs4}uOB`n80e{CH
zz?OV?cQVMq7r)nkuy?S>=nd1E<dZbvl-!V`i=1{pe)5lEBVmg5d+p)+<o~o?NAZ8V
zT}R^To+G<*{-1UWjs5w^{};Q3lt4hpDSMOtPn(rq|8F-dMactSK$QOfxUxs~{`C0Y
ztnB%}kM#dO(*OIF{sXWf{QnC4NX|LwShnHg=++@XK)C%o+^si?k#v0^G2oy9t_Emo
zZF?DLq#h#SU{5u&r^}w?1J3Lj5uL%vS;vz(#X#~aW_dSY9HiLwln80%0}60&Q278J
zs3W#et11_ORCWf$OXdw536{9jKQ;q@1S;p6-<%7n&F%4i%rO*O6-*A0_^a>7`1uE5
zX=S!sGhgs3nmJk-VJ8HDeL3I>+Z^}})`)*_ETec0i%NwGN5f5MkP{&5@J}RJ0aldI
zJbXxoM=s!!biCG+j9d@5{aC&+2{s4n^s2id11ZP->L@PLX9aH3L`>Q_Yj;l`=onYv
zNSL=`Y#+{TkL08uuOt%_qh`?n_it|2jIic^9$fsNO<?c;oS5u?r3I0<2W{`fxAp_c
zhqjfWD9>{|ss*;o=`fMbjZjdt2#~m1E>qOLN<M2^Z)U_gJ2*EK9=>_@GJEFkGv=;R
zGynLbe?2WO)4LoH;K4zvD^Q&-^7thGmEZzu+0gpWu+|DHeb4>Zr(IhQ7vw})u)lIV
zB&#gFzT&-x%<HREh~gCJt-DAi@>qX!6g&3DlgK}FTQd`6)u{*?Oa;qVcQn4&(Rtg-
zF4Qw}vkD90Hr_F1YUS;I`qj*EjCT>1d4&;E=;Q>;TW)65<)4G{<6XX`pv8`R?fG!v
z#+(s;(RwGYS!tXRGeDNP(z&7}GMvHo&f#<v@VL(iR0gF3Oy%P!u=+vLSnFip!<+I)
z$hS00>#pg=v#!G<*@cYS=T<6>UGq`z>dI&OT@Uo;XNP6oZNI6yNDv~o(*f$esb6+T
z|L~1IK+OW(tA(W5{(jh771gohmfq?Dz4JOs8m|U3+RKl>y@0ckzOnnoadplPqDB@L
zBMmb!?WOv?c`e&P9^}TXu|#)7s1?<7u?%ayr3C5SP4XYs1g+mWi$nr$1(@V{?=B{a
z4UR7Lue;%}1pUeU8ifoulJ&u8E*f8J0heK%@}LK{EVxBF`Ch*qu_@2+UV)`t-Phfj
zbQqvJtz|SVNT_X*FWyv~$b4d@Y7y8r!oP!_P3JwxQj(V{?xv*f8XczYW+|A=t`B{W
zk?v?w?Y19)?bSCy%I)3m)U6gHU(`QVxr-6n9pOkH_6X<=5If^s3Y|bz*IHZ`AI`As
zAg0PApF;&fZ)K8bgUeWwBbny4Qf!{Lt6MR~{xC0pDZJ=oWc8RurS5_A{?tqjd-aou
z%+zN*lsPuZ1!H*z&0|4$>vFWnPLy?{Qx{2bKPD<+mOB<f!HY8dRhIef-k$xgHmGfI
zx^Jf$_p3{*knKVL{63KG-$yXhzut#llUsPh*~=1_D$Cg<so?b=M)gOyYqsAK3o3x+
zbZ>-a>U_$ET*F=V7sOQ$TUf`@xyHocVQx=auIWg@-t7%DGu4F(t0;$<?&~IStgTT+
zmgXd(HTQf*Bw($H#qM1F$yno^gtT9~Dd6JkH`6*qwbcW(tkMsf14hT0)r;M-rSQ{Z
zXP$uR&3xa)S)j&|XHz1F740ZRV&8V;kDk_IBg!@KVz#IX56xiwPL~Y2IB*-_kYW@M
zozf&<b4V~`VTbvdm11pr(l1rBW_5V11)2g*ujRT{7T#YjDUr$H8=h6-O|C~>h3^Ds
zSL~VMz~uV^cHcQoWaK-8yEMC%Mq1fT5W>>2a1!TmrHDLhV22PyNpN?qYtD#LNxyjm
zD?tF7pYW9OgloQC41MGzgO#SU!;b6lZv0j2?C*}J^~M7c)6NdB<-b5IZ@G!a9o!B3
zcByZs&$GLPfjH}L(T1h(=$?MD(#$(^l-IgglH=IUaw~6-Vm1vO`-*2QCx$G71{h^&
zm+KApcx}o_!unNIiWw}P-WQYa>LgzNW74UFexIhThyRtROFBiqLv1lTl1jK5ASuMY
z#aXRRZ#Fz`6F6d84!+-+n%pA-)P|krhw6*{Ii11k`R@SN1X1^sH8q3LO0#XIgsU^F
z>PGENo)SYee6$qk<A*1iP8I}5w5I-9bd;BVJ><h(A+szxd53G}uag_F%IOw5w4B=2
zyJIZGLz1)Ds<v0Ll%gALlnvY>Vn0pRd{^4FpYt=X0-Vt>3>%)Bo39l%ZzWikNb2R`
zY#an&>rBuSrY{JMZ@1m-zSl^|64<XSHMtj{WemQe4V*c3=^>n`oDGgT%n?-7&y-mL
zWC7e~KiSQGekpcPmx%T6gbAIzh-O#k|EMGSHRaQ^X$+(CH$AVGdZYH+SvA0RaC_xS
zdgn6PRV6Dokw<BHY;X85AZsfZi$qX{`n{~eFFo&k+GqxX-1gs}gq5&?&5)atxVoO0
z%6QAnDh#s4+B_ke!@!Xjb=v=JT8w&GMGVMsRaA8uSpG4*MBm@{PNx4JaRu5qptgbU
zc2Klx1ltm{Q<`{{QV;fVF_85O04Ti9(fRFP?*owS)Vkg&?kHqS&D#xi|H}(tJ<qsO
zTvg-34!U5v#K7;lkyI@((MPrG{xkI!xj$?K`-!+3eZC|rXy>e_%JtBDS46<sEi|YD
zKWHz*UabR}--#@55MpVSp}&7R{WGJ8Rog|u$Co!-BDe#jZ&M(}mQ?c{clQV|p6)=}
z0TyYGvaa_j<j4>y<3pRvhSA#qY@9~T?`2MeOb~v$iix5dB1Gi(+n);=mqy+A_+bB~
z+Z3?X+N{%xXhx@fbT|rNL(_n(o!dpAjRY-O6pdU=P3J_TL*A6|ydcf$Z0AHA2;FSg
z1o0}LF}Y^#AY^pwe$zOEtt+4q6>yPEt~%<iqzFY6b`pmDM!)9uyHk9igOIDu92ICT
z@OrVH5?MaN<daPMy<q%B88-euM+NhrsQ6o;`X?$7ZQ}aFrIvS9=npAP4Ry2Lllv_V
zRzIPv<07nWzFxx)U8NJ`@Rv^(sL82oe>@k_iGUITA3rzXg{^95f$O^qdx6?U4IDv(
zoShkxzyX!h^oG|3d5FNUn<pY_;Akk(=!u{4{B0F>)EVh3E#vuWWnw_lnu?yQf)&ie
zYqPMdA;{OGLDnD7i~?8)>pZcx`F#DFQF=qB2GWDSHR8#j+hV6_e3*-U+icEdHs2u2
zWW8-5-DfNvn^srndkR&*lMV>&7&YN|xOsVm$BF*h#)%!U924_j4kY!V1t$KnTu>Dv
zpiC_M`dd_XX;Xh<SUk1AYD6+9T0VpA74D@v?r$n&`Cbg(KMzvs`d1$Ya3VA-i2PY}
z{NMHhB-ZcqB)u<xt%sA#NSqV-9YGtca6_m?Lx9?%A|_0@Jzk>g{}SwG`|J2{sy=by
z1+Qu+@lY=HdVjpG{~cxuk-oP)v)Zkpu9RMRlc#NYe`9@i6_&TjRRpIMdW6M9QzDtU
z3OEh*op{T;04&n-b3hvNy`gE2iQ<{dttZ;wmqCegBzBW_s)5tdE$yzz{q@k2$;S*r
zAY;C~&XGa_wwbL!2S3+*uPE?J#ujbO)x-`}LtQ9#)MnCH%87CgH;CDYF8RFGdItwP
ztDRZ64jIWFs2h}$A@-Mm)9C1>P=VX+YzMP0%IwH*Y19(%?%C7c7*<NP1$O{RmM%Q3
zxji9d&9!Yw7LT?q6ov`T(=54_k(MuQh$nbw;p{cchx$hz{wov9GGs-@%C#y`AQLQ?
zntV5bBM$Ti4V~T$iz6}ayHcJc18eKZnTaK@L>`FP>A#}F`R`krz#Ea6M!x(R`7iOM
z)NfB5Uvj>e^2CT4t7L^L2?HR1X<c6gmMyVr)_i$J1_G9_CgnD{+g25wOyE!rI&F_U
z{#XNe)>@kHTm`EQrGE}6UcGO=X}vyBvS<F9J>$56`uwpiu*gIW-lVpMZ@V51hUyiP
ztoOy_c!>ZRe6ijMO0vKOuP%^#s}y>OfSPpRfRfiNOhb)NHi28E$c)nB+U(~inrG;3
z+bh}N(UwO6Tc<tBQ8!&l?OJ-?Ou7{>qM0<gDO%>rRdqI7fZ5KHbu^QPw1wmB%~>tx
zY2VD^_OD@NOG|(BwQOA4Af@p}n-iKhOEpdQCp=ozEb71-sieUqkSy;;kC>R>>)Hsa
zWZce`k2oar5=8uT=di&nU?Zf2+h$4g#PMX~#a?D+yM=Da9AEw?>>?Eg^`Ica5Jy(S
zq8;DelTCd@8W?dK{49{iz1U1&2dmTX%~fb`?NBYaKi3~aU1R-N8uh@`^Y-S@k^3f>
zw*7ihuEFUj0{d<)n=XV{;oM3Szps_YI=i~{<czd>2F%6IP$WjcuJpAxnsq&YprAw0
z4Ftax(5l~2XQtEs=xJ@no+x3wSt4|Lt$kP+rRRR7xq|p*F2K^;^zn+_X=#Zv2<(zH
zV*E>(cVm!krf)!{Ua3A!nsFCSis551UN_5#VM)%l(&X02XiLVVTM)M%wnkoig3k<1
zCtcwWBNH$`V#QVe6cps*9K1!yg;K85<6LEV0h(#Pc(A|FoQgo)6pgbxK<3#x1c3!X
zPOK5i<n9Nz?pkcU$CF*wG0wl95^-udLuZSPGaKHsAzv6ZifOv;&)Y^v-xw@(!zs0?
zi#;y(Ydj_~Y`mkM(IJCf5AKT+snbrBt>59RYMlP)3!?TbSDi3S_DK1<JB@OS;y2)w
z!4$rC@s%Ibn=)X{HziV(H`>i}Hr_3{v4LoSaF8TBbA>OF!-#ITUad|6R6wI4AS8ZP
zHJAcVBw)XZcXJrv7#`#@?v(*nBoR((2#<NX7wV6!O1H8-J28a+-We~fayZlCcs6CI
ziMfs_`Mw3^EA7SaL$OZely_;avG;yY&hPMTFwlGFgxxfsh6$a{o=U#ncrdB6L5}Er
z<^3q4DT{s8tyzso-?bj9*Rn%6Qv-<|C;VMLS8tQHvO=UUJ4a5$WiphBatW`?tqnYy
z?};=uYkhIIwZdJ4U1&SO)#mm@{O9FyG&4={wVvy|a|Sq%WJrG(;>2yF1n18JkJv}x
zIhGp9#@9yfYHJUr7>kE>;^}X06bqQ8Zb2P`O+CZwL=3I8MZX2CA_d_{YX4RWlUuF4
zFW()8=@E3IgY=y=ey2oSL8h8E4FHJ6^!<)bdwR;_C?lJ>nBzs*`W2CbrGH|+SN%wh
zn};wgvUFNU(XXC_Kk3!93>Y?`FV%!q*Zf&@Cg!xM4oibBr8D3eX(q5aSrcYJhBxOu
z%et~4D03)ts~~p4gbcRdsd}yVhHj?KbrGh%Ia%aRxL!wT@HCEATFtU3>ltEo*|ZHP
ztA<mFc{C3>W7+i5{vXEPGAhcx?He^fN=X3`1d$jT327Kb5S0??mXhwSK@g-Fk!}I$
zu0e97B}W)w=#(59h8hOmlk2(f=UscReXX@W!sj`U|8e}1VJU+*ptV_}Wpg`zt=nLg
z6IMB7+{)xl2c4oMq6`C491z3aB#FZ@v%VV_lO$Sv!2L<NeBSP+nqgy_o{mTqLh-{1
z*7X5n0z=nP%}0K6#JZf~G@X3YDy+wBG!CR%qFHUOXVG`RAj))xOO&xjqgY4lj&#%Q
zFHv=KO&F@p@uIiU566+7_@~|@3ddWM20i5GM2jwQYcA79t%4>42&|1p)9hyGP!|00
z4qCJJZIrl5hJ+arwjsK!YlW6dZa0@lSFoSez>x2%Ii!E1;$GUukJq0?VV{g1&ntJr
z)qb{gq*E;KrOXegZ2;ln!8@%rl+JKr)v#LNdSTh=h;+mB0jm6L;W~#&jjk2T%L-f6
z@SK0B)$ZlXB|}W1rpILli*c)zMp@ss22AM<b(XXr|ABj^v~T9+{oT0gQa_%Tt4D6G
zy_8#;`ZXXXEkp-@FlG-(dM+|s>5mj~iS(skq<*9oF|Vdoc9{{w2(9P&W1O@q(YW}<
zZrrOTKUp~TnJrC1=0>=Me~R}8E?6BrxSx^Pu-MwPce=Weom*>k(Ou`U?W1|uKfMF)
zE#6}LO5$?7f_Fyd>4=n>_(#((7nz;QkBpQ*&A+6Cka5b@hxrEgI6LV7fZP7eqwT%4
z>ee|I16d9+EQx*zuIlmGFRwM9<l4vn66pK(jC+=OuERDA%RRaZq*G2y7r3L#R_uU#
zNCu3a@>}zu3K9xk;U3r7JutXa@0$qSr{SOKZ3K(5<8@w1a?Nv1DZirjI9NBUp#(6f
zD1x(es~(WV^as>0+`wj5fO=Qy6G+dqc@$8gq1nC{%=&dRc%k|ibH!bXe}#3PlP{3{
zouKTrkRYJR*~<rd;nBgA7e>JgjaH?_r+?<<bT)Adx%`ikQdc$3I?np}Ykx?2Z`s$V
zpD>U2Ab-7Q-LXb)zCqtEo9SS3?IFp&9VtEwV~^fdf8r<<bE&q1QNwliwDMlVFEA@n
z^M2XS1a4~BYjqwHeAb6K7hAGV=tClv>2+mY+?T+aWL*dCJmag|XKSf?OrLt-XvjUb
zx1DNfYnd+8U>6CVgY=_IkZe@)>2T5snqHsG_R>7=hMH0BU5u1c08hw54>T)h7jnw^
z{IN;m;+)U3^+2qRBypUX8ZGe96?o2J-x0|V960&*#fj3|&ov_@?w66zAdV-F&k91`
zfk5~Cx3@p}I-h>s84nes`O_+NW;Vq#l|J2_69xE{iMiT6B~kWZk|%fWJ}e;xA1z4B
zUT7+Z%%=!vh}ch=gpd%vP&pa09~Iaz$-X_`6mZ#~yF=_$p&B49J)cul^8JjK`A#z5
zxo87^%_m8d1BF_(usrXkJXt!Mu>&ISRLdl=0c0No?F(u~hVzVjHCiv<FrkTDhF|!Q
zZd2#j)JKQ38t{oar_U+GJe<>4`Z=LMC5Nl|(`8-asp{^tciE^C8nm-)DF9ZyJe=M7
zj(Y$GPeraN7%iW*g{Lv)%?2;<=v{6_?%E~37;LW^JNuF|?^GSuE8FYI?$2=4&_Tsw
zWP==t`#v*}rt5b+R{GWbvM@QljVU>UCvGSM9^9H$_e)7H<S;B;cY8{Ngq+9;50}FD
zmar8F$xanpp+X)1IsuBmR3(XDTbQ)lFRK>>sKCSDaAb?@gx)#ce!!LLJ_9{oW6O1_
z7*ldRZk9jlfJP3?!kjt?HvhD^+fE#B+yw7zFya(`$}Ar>7ZYZCAbTj;N6y+N`lZY3
z=dHSboV&|Os*I%gKC<0BlRU#YkW`Rv+Jw^qxZFm3Mjce!!&@gz4kH8l23yEu9NgC}
zHxOTs_MG#y_k3hzW3BvU!FTKWSOBi!7?gAUx=@4iCh9TErZ){gqr#)9y7*9@q@GDM
z%CTyjgvJYq9~Z$l8iuhALA$ISRWDu>V#vfkB5=psvQl}GvCYJ7y5^FH=*gIkz6^1B
z!@KLVFYfRrfm)SmXnxOj-(d*vszOL%2=kPETec18{+#*JLHiDy8)FIEyk|~Zy;gr$
zrRy857AssBi5w4}*bTdqF#F9j@=s1>iigLl7HXm$rk=2yGLk=e%dgLxIOr{V@LPb&
zzPILqPv-*Ti>?$HRS@2j74|rTX18blY~8Icwob;pjSX($-*>g8=GJFg6Q1oq&$Mi;
zS&Oh--;!T-&`;LBZ!@3o{p%D8@;Jc8&UlSgdpwy#JF4c*N}lx1CieGu$=57{RED9h
zG?P2>`f|KZ1>^~${zo^v0wR;6gaGi4_m$J`I)(pe%UIsYJH-KBM4{2PiV3bY@b1*i
zyJa!D6#PGRwpy_-(&$Uht1S*xpYMXw&#hzf!LBU+p2PEt>3wb3^qm%~?)me&5G28?
zI7^;xB`Isuky^y99g++d)gUX}R@}`vvmBh^O9acqfLb#iU>N%cz%#cu4l5w<;^-_U
zcbao^FlpI$n;Lx5Jm}X#BbF@<(Wo8^V1%YE=fe<S>Zcp>@Kt01;vIk!j+Tc$9H)*e
zD=w*wQ!swC8Hlx2$NAb!<(vt~Y=EtzQlmQHydrk*dJ;qL?%{n|G!2nx5HGWPu;I^#
z3`R$P8r8I<pepeC)_AeJ55}(ee%k08U4hVv%-VKF+PBlP9lj1W(On=^?Xmth8Sj<Z
zH78l<bZ9B@PXPLD#~1*H<>71M2_CV-fF@R1NAGGAwkqh<`}@zt-x$70^7tqZ-oUU*
z;G-*o`}`(tTs7Qc6nsxCsjRfl?lRe(SpNzA+4+wfH@~ZAI@~hG^#s5+VHW72PqtrI
z;v6c;NYB4@3AU!$>Tw)?&ek_-25ZUg-J`Gn)7hJa*FWV^+S`G7#4Cz5q`er<<b9gD
zjnI0)vM{c41lu@nL+l>^PNyMMTxlE==i}4Q^tE?VwOtxWuFuB{`=#sWeAaF;olqs_
z9YxNz7fJ&cX=(kb#Bv8yDYI1h)bn?xGgn$t$m4<9Pl)y+)GJlOpCazx7QMG(33x~n
zyB$pGz#G6E`a#DVEEn3PAkVKqZ^Td1ze+UTGHCJlWyU-JUd1FTVmx$ob$GGzI@r5)
z?pFMG-tx<`@->f`1kMc+IUol|me3;&Q@WI|XKGV`!CX@(h2i8_*gImyMIQ$?>6&kL
zWV+9kg{EW5(yhg;o)+D7wkNuzT3C}UAT1l?qEm5BKgK<^WFE|{neh0%!MIGQf)d*X
zP_i-|lP9CyDCxpo?weYS?%6ktJLq!>#MryE7Qxsh-yXA76`I<3UbA|mUgsy)%QcYn
z-6nEirdb-*(8c`KTfq&OY0{|w4A&oQcA%zG&2&xiTI!L06n=^#>o(ePZo$10Voy-Q
zJpgSCv_w6#m{V~mow{{G&?eVh&GT_O;s>u+kpj-!xY12b@qz8}aJACbLGpKn0$S^l
zc-5COih9BU@eU<AD&W}zw6_G&U63kHcwJ6Vs4bC~u|{_hlgpby`J~7sciw}#GtJ`b
zq7HEzaOl1fx{9;n)Lq^9TYXw#iSmeNetG_>L*nY)^6;lP=`BKS!Xf`-pp)u$>BlAu
zi`EkVi^=+0JtZk*eLfUyrM&PB>lIa?TKd-#w--2TRjRYdo(Nbk9<;bk+UVZx_df^^
z<sm`AGAQtJR=Ral+f7^Hd2GiY<Xz7FUvy_l;79~K2&F}qPE|I5vTGX8ZtA`QcF%sl
ziLwC4djdp%Re+Mq_*TguSAlnAJ9YS9bSB@I-J>?m%cC>xVyj3?vwB8@S<zx|$#U8(
zIFrJq&~G#;vdZpR^#Jq3d;50oAaYlLO8+L{{d@as_m&E#H%|4{z3np6v;C$oZ+T>)
z#{Y~D9P0DQSY4SZYvf7%QwHZG^3S1DM<UzDP45cDAmeoqe*+J|4<`PiExmKsV{myM
z_v_)|{{Fi-pUE2?$)fBfKkgi(<-|K9s9g?i{V0LtY!ueOh|FLY??<`B7=Q^GKQs;c
zH$B@8!q)(QVE<(W;=zoU<VHCQeEQ**lnGp#!CZ6ihxF!BlQ^#a);QWdiQ6%pno8Wc
zc*%3yXJdp~uhu-F`a{3g+D?VBKAZkqou1Xa@G}<It86oSrVx6t8-G<E{AdG7#C*<a
zqK1)7!>@mFTY^9bJO)nwt)z46p*p*%)!;3TWH8k=H#$$M2dFC;QI$i5LEu9fCujm6
zKYpJD3f~VQ>?{21ZN+7*>S`}vfqSG5EE8<BC)n9Irb@FOMKkU-$mVutHf<~WyvWfm
z`hu~lR+PUDvamo=C3Ud7WOjuxkGQ-rEnKrdH)F%I9B;u!*LEfw7;BcyyvPf|)U}&(
zy2Er@jCd5U%3wdF13uBqRQi76m_#%#2x6%EOVL5=rd`Cymt>>V?y+g4kruxKu3V{j
z@5|cyN4_Ft>_7fZ^_VNZ39!y9sV4Co!+2h$C6ep{W=$qq8ve;fmJ@1v5&K+z%b{u>
ziO}lPA3}SZYgnI!l8TabsTZI7&-SAn<LiJz^#kJAVG^#Gqo}l}(J+Tuw$Gh3Y2KKi
z9B2HE&R+E+Y-6;rWx1i>^nY+jiBRb`oIvT0<qQzcTB-^lJk@e%`oV?Xs{xSj$bw56
zf30W3<2z~=D;A+WEr)^BtB0GTKlKf4nM)ATUh9?XwBy5XnQz3ViNBHC@!VuN>+nx#
z;!;0LQ+)rhs`TVSo_n3FP1Rw9GUu+ZGaPFo12B(8)CuUl9Z7CI|EDA--o0lHBuUde
z{nC7;>{=x*O}y5JxwUbxeWH@3Sb0TVvL^QPEX(}7?mGSbEszS@L1cA(8}c(gzK`JW
ze{y?%`L-Ok$?Ni4Uy^)moy{DZ+>y8SRp4j9{BV1`Z2Cux5cWEKn1`h7$pc2%$LYMD
zlDAevD_&KD$Z?@B&~1wG*}R04)F<-_4`(eE+wLzv?f<AMQq5y-M6q_&U?QY^wWpXM
zGv6^7O!#8nE&Ed%5LC+EXP?uBguYLC-^KHh$II{PGa~*|jJE89QFu*tE8Ah@k7%Yy
zunOS+2cltAkfQTLac^|nOXywKv=#?a1mC5MbZLqu_dt(ndHiK)dh7ax*LZc_&RZjd
z9h#t#y<B-+7~K5WRqmjEJ&EGy8ap$dop~Fg{^Qlv9_bcal##^4fN!uc$SYb2k$`gw
zeGh=9xj)WGb^Z?gz_+0Xb6i5pJ|n=Hg+__>hI?05<r_I5nb5Fb%R5ugc4~JXwO$UI
z2Bkr=oV|}M%~<W*6s0Ai5r4e^;#3qFAfF|D2zE6rGd+}3q~Tqq<i1^MbQr39)Q7mb
zG+l~s*tj0Z-XoLcvqM@xRnw(R^h2`0K7e{`Pv}`JYU@9g1k%Oo%%E?Ru;U7yVx?Zg
z?WQ@?)=RxA^M0a;aat$y3Rx%b=#N)@x5gO6U3AVq_NJ?qrM6?hT1w=jqOdtX#WO*-
zm$1@Wvo*%lvuy(j4`CzuMe2xa?uJ+qI%K?KhO(9_W;)p<0|t8H3T91wt;64O<Gp;>
zH&eMZ*cRbJsp{`#XXo7)x%RvGewTz*?EqM}ftNOW)cvyvwj}CXOavUL1Q<;RI|_zd
zDq7)>awa`C%$U6wqK9$zW{eGB15rJP^epj2qJq29os!QX0>{Jk7N$#6Yot^tudy;E
zI>A2xd{J5j1b}iz0cJ!W10+8PE<VNrC2=+HS5a7kPEOq^i2Wnuqci^7j2F-I{N4*A
zf=GU#sko>+!Uf!<(yj?dD<Tj_=>NxUj-v~>aQow|GAGp#FK-+7f_2#uH+6*eK;Opw
z2F5?~yNTn3mdDZ?YC!+0s+9U$RVvoH;|s4Trl3J<+6Dz{@JZamoC6QS5HBShco1CE
zS^C>g0y@s!yCT#?!+f`DG1#|>11Wz^w6z_P5W+T0)Dt?UG?XQA+a&QxlPQL$VShJ{
zH+6EJ;;#Vm**zIC%*H`_MQe(3ByB}?(5j;iBu3Sg4KE4RRzB@t-V-=~t<Y?#kyZM4
zpt|lKqTthii30i};QR6F=1hI^zCKR|e7eqk?!KL+#XN%-VmxrsMk(6=Ej7ob!MJ|)
z@6k=!tHSoRJ%R~FL!<A_-jrSDf@K)l=RJvcR*qjU-_fW!&k!s$m_1M$w@a~leN`^9
zpLP}tErYvzW#>_*^#?=l_iJAj@*2;Uxze*0esjKa&$s_$MtTyJ<H0+BZ=HsL%PHH6
znw3S`mkHsY6=;JF7cb5nUBWEpyT-q}MINXq79Y^{Yn5it`jWk8VXht8+Pk@35YoRs
zy$g9C4xh-^{lxJH(Riw%qk#;mYp(TLJ4Q@yW|DL;&4H9I-w}}xK((rW`AoZ=FVL18
z|2~sc{;+^+%rm7iZxN~0{x!0}qcz)N$wbZjK3R3&AIX~~&_v2F^Rnexr0=SN1>X&Q
zh1J8q-R*(2df>9ecS+bmGAK_N{hy}KQg#h**ziQrN!WZyi^N2!fpef&bsxgCT7g=C
zsN0}D5&ytDn7jr?9+(#Q`qW@{i6#_du_8W@Hb*KxK;t0^v!!rCY-sV$c6Ru+PJ3*O
zu=$*{sLJW?R?9@B?Vsw7dhR`7YhQIa+L#-n8NA@ICvH3Qp0DbE>>gv?qRuGhwD;7a
z_gl&U+2MKc?U;TVCZ?bKPS#e2dwu)u6xJ#2mD)y-@qHsxXTRYmA$B=sHI`SfS(25$
zgdb~N)##5+PrJak&pm#m%O0_a8s1;hN;<Crxh6&}$!t7$?6I~oi@p0WZ*yw{M32m<
zpMO$ALFKW97<HOHwXQnyo4=W>>60NLr6AvF9{O4YJY`(zm)oG_n&L(i>xQ2A;<BPd
zZqetb`%C=1tQSV)(h;)oR6RdRFk<E0TQ!aQTk|uI@4Wod3k1vWPQ=y<>WxzZewe+7
zcfVmj{9vZ6`w=8MZlB#)`2icILnoJYqhsYm+tq0RJB{<ttwFZJGOsT{@$U7+OkEbD
z*>|^@?}NGE!|O5YqOur)YAGnOiCeUd=kM<;D%f>JJ#MX|uhSd?4T6S^wLl4*4{*Y~
zoF=-$JDn6fk3Jb?)!GpyAS{WW3?bKZfYj#AkK^Rk3;g-wSRnxqMzIN>)&wd(32H`p
z!|W!DmVBs#`l$vk>-5)PZ}&KsD@!7C#V&%9f4aF^V>ihzcpiW^UZ#C&Q7!=$r6-T(
zJ4ysJ%-c(GK|`0XbFV?jUMVk^HdlmHey00Oj4{(mtMcEW6M*h|_*;D)H9w9dFg-|U
z?bR$EAc|1gy)E^|r*9N-gzUA)r`7*K9(dDqX)~OvK$8bjzSjpHc7Qkw;g?q%NFDpi
zDY<YlckgR=o_YeQOfZk3eJ@k5Z9UDuoa4cnjQ(Gy<p%9iS`DWyOWz<FVzJ*g0PYb(
zu^JrvLDtEE-tK0zTW^lryV50BvmJwR$uCl&Sb%0Jk=NWUSE38qOBaP0`vjb?-7L8)
zCS5UbVqM>RU#oq|IBD*s{S((3Ll>z6O$o1=(-|SCdaAH>DN(_Ney~hi24eZrK3->k
z!-qn_0WzMXgd7~h64gVd{8nEb?&N@{XSzEf(Qu4y9BOx*;5@;Sr$>qB%Pt=TF4%J)
z)cGS%+V@zW>dRmE)aAdg11#e<<d@FHy9Im14H%8&zlScwij?_pE#{R1XZg8d7?O~>
z2hk`}p$g0p?C(Dm%bHpJ@GE!pk>7JkrzQtRb@yFKgXryI&6bx+kd}D?pWT}*W1Y8Q
z<%WtEtIVR{9*~co1DwgJb>@nU=`4olmN+hkZpgo!G6-Y`NY+B5?}9%4+t&SjljSk~
zeD&Y|l@$O-11W#q4?xaENj2<uP7qP7=~w^?mREEo0YnTwn<K7;)$Oat0>Q|!fGA6f
z@YV|+CRBfi38?Dn?wT^Ka&?|1j1^tGA3B?fGgfEfKR?;{KxMZ9zB~*)$uyjr?0h1q
ze0aP65b>;zi1lPg@_BBz%D3Tg@R!yL)5sgcSrOm8FU$+s=og-W4G84+DmylAM}#6v
z$tJElmYK3sg<GLEn(%&)Vq<rcgTFA5*E%<ck_8sc;JoS-$;_oAW#r=<UapjoJxGha
zMBTnlt-?@!e&yr-CnN>Rv_Un6CQ;<Kl9@a+h7Mhs0t^@g?b6?V!#^2m7Yg{WjjCyp
zV3*FvAI$#Ts3&XeZQu!%TI;8U=p%_W-xIYd2YyX^ti$j76M}r7cuAq1pI85K$IOUw
zd^%ljWwplw6q}(W^xhLd>}>Mz90Dq!Tb7D_TSCgrV)F$RZjVZbtY=<_h1jr1gpA%K
zAUi=f<~bC+xpi*c_?s);x9fh8<XCtnbO!~3S3chxgBWtW{Bq=Te+5;xBYmm!vY5T|
zjSCVz^5&@8bN<EtRtiV1`Wk5&hl<X)=aifCS8I2fDG>)^>RgH-$%NS%+G1SFKE_EH
zC1E*dnu=MLO)#((pecM;UQ3M5tP2Qx!_UO3;$y-c<!+-nmOGKjJ3NPMd>$bLh$`x-
z+u6t?oC|%^<Hn}>Ls=fhr6Sx5)}9t1(z473gYRct^;GkYQginT+vp&~&8m_>m4Ip9
z@R2C?)M+Xx$w#=y(!a6Qyo~S%@g8(7ZFg<>0>6K3N2Dw($Hlac*i{IWD-mvukvf}O
z|5Kiq5@qH!yp$k(m?plNZ2e}U0`>!n6|4E+pUL?+CWPD%wc{@gz<#6d+C}eEQe~#z
zg}6gGE6qrL@YmUAD==q(nFvJ~>oV2_$YaQ74B7&DD^7Ni!<4@_CsVc~KsVqL-_saF
z=KOrQt{bCZ6)nl{3RKG%KC4hc27Uf|sn{o-gx0uk%E+}S9D3*D`=*TR?<!H1tg;e!
zuRt~q%zySJ^!0xD)khoag6ts`+>fZAQ$mDkf{p|@^dIbqIz>g9Hsr5+ZyY>33egdG
zIe#AJiEkvXI6q+%fPhp?{%q!&qpgkz4{Uy;Ru3V?4pMs$ECabKIkNZ%1WGb1Uf1<>
zCKWCAl3hjoBJ%~g)IpMlB$3Z_Yi(5+N9T1dUJS|%A<n;f|7`F9FOI8X&#tFWdUvOR
z3j7)xbZ%@re-1x5vK{E$eRHiZIw8BF5qzhlAqZkQa2K~fKjclFpG+S)ZbTpi62*rW
zVM1>2L=jR0f@u3Gd#Q(9F~;tL7D5%Otrad{3AawMD%oB-H05di&`oK{#!L2(Mg?~f
zsV&b-M`4}B2a?<C*)6xv*<DR*WX{HR_ul|qLfejO?`?-u0JtN|q8s}ERC`?iGf+d}
zTB6?u7<|rNN{3D+1XvCkRjTxQs(%l$N*RYwws4eIdZ3>f80N&)8RBw-rU?X7ZUnrW
zgV`rhyH#`iCIEzN$|WuN54zqOU<>rSd;n$7G=VwpGf}{e?cuyKkB>P?U>i3orux6^
zNq&hY$P9o3sfFNZZ0mcKu70l_-&D^ph@??sKBN^2sO5F9;8);7c)H@u*AoeLMS)op
ziT2=m&n%|j_fXI!y*ftkrH*5OhK@5z6uxPST-`nz>Lk+~$(MiPzQ6>%RFkG;_9~rX
znTL0T9yw7%Q{%{hh-!IN@V?Uo(}@z};+Fy?Y}BPry}*Jn=;j1qV=eOC?UdOXlH?8-
z1mAZmpJ~(T1Naf{&%lY=_XyDa0Q(s4QJwb=r!Jnc0c5;t1&w+IFBx&&L><YDY<CEO
zDt!@<hlkzf30k|1{Nm-M-=73;m;|<sSb(QHJ<MJm*XgnfgWskB@%!&-|5iW8>YB_V
zl{HFe_Ys&hs{^diXgL6X<-V<t*90Vat0?!Q#U7zChePr2qz@Pwecfnom0ew)T$Qr$
zhy`3ug6y=MqSZB=_V%3n1dG%I3Z4)nDBBJctE%rfexxVED50{X9pd;)gS+4?3d<Xs
zYJ77?twT_e%y?NR{%u6#>(GE<qY?-IjIw0XP1GcFQm~<)@d>?@#Cil3<ey2SNFGf-
zLt@5%;#GKD(m^7^j&V)@Aw(uJKH9(fSG64W%R->cJ=JvdpOJDTA*0{m!|Tt*?$o;t
zoLP@Rg;fb#Mz~i%nnq$t%W4rN1!D_z8K=TccQ%|jQS6~DK&0hh7kJvWme%{>lPz(W
z88hD1MG2D?&~K<YS3$b9#4(;kksoQf#J@DjA?iv^nGsO9U#P^wpdC=KbU34hUVvyA
zO9wBfQssMP%_ynWP2O2vR{irm+p%vw#$jcei!jzT?vvR^X&1c1ITEqnju_Gmf+^F6
zmN-wekdm?;EMrggxp8=(s)I_qsp|l!ADMeah$-*E4hYn=n%-j)1?BC_G^9`&8Tl;I
zaj}*99j>xwu38@aYR$NX7a`d4fe&5)IFpm-AfAo9Q@qrD?@AI?CyrBq*+$$3B(-zM
zB}UqNCsPfryf|zLJ4u5ZpXwS58jEW0f(BfEyB=9O)b8?~*9>lZ^8GU?LN;&X`h>L1
z*b5TG&2h=);wm0KOk)V5W63l|egk;c^|hzIo4I+kfOGHQ{T8vCrwq^q+J>&#186g5
zv5Lae<IWA6ggXu$(v7XJMZ*&q+GhuP%~b4VjRPa^-FEYCNa*VZCPHcOLiP@zKHLjd
z1{95zv5R>Be%txuoi6|Qzak_oFWxl{3KX#2(^_(1+66v%T0XrO#sQM3x1U4&%ChVq
z>NwdW{&Hq<s2MUbs|)~f&A)j^38?50wPMKX2AzjeE!gVv`N33G0#b%*711Qv82F$;
z;Op5YQ$3TNPSWOB5g*yGWL!QnUs<xWays-4_2k}Z@1NIGG^1bxZAzNuO&dk`=_fWf
zVIq>thr6SU`~Vb-b(n<3!5rr0_3L+XUWSsENF)(yHrJK1oyVJa;EG8OZ+kuEj!t*1
zmEHSm12ypQCo&>+oo+%8O&2<BH*tEFr#Ex2ro}zz7?iE)<w|~LsOy9?GoGwwE3_{u
zSYduk%=}aL<Kdik2vJ9eY|Nl(`>lDF>H1wDhDsGL-Cpl>na~LPTAgF$fABWr=Zr?4
zPd}IGcS-Z|a5_vkOtT-vTHk&6XA+hg^gl5F=Gy#v9NqkHR-UA!s0!_ZREx2Z!FF7b
zeE$Y`en@>SB=wVd1SymK$R|L^pq{}rAhey!Z@oQ*fpPGhFAFx7!P;Wo1s?L}4z}~v
z+vAM&tr{x7^`=dBza+vxvQ!Pcb+#UOr*5`7n_Ij5Pkd39ZqH=Sbh3#*51h$fDiQG0
zPG!*pvT03P{yQ~4xeu>i*Y0M?ORgzf@<FlQs_0vsDqsenj5w-gW;uJR;_okqN`a!R
zW!8!TOttt~TnVp}E)b<8e>=3fJYp<=EKZ}`j+2_S;2QI<SgrxsnUT(3rV^LrCkF1%
zz1;TEHM~p(5!4RjWTDU4|5BYja+xS3y3U5?egpy00m;}Fz3IJ)<xKXy3@0-I0P(jw
zrw8*p`t;9saRGQU!koKQxThJ!t4UtiDYOvYgt%S+`jBJ2wVOn~GuiWCzX$-cV?a2~
z1mPd5A8+YS&{vij!zYi27Fokk+LBMH7MyF-@^oq#&kR7!VyZIwRh!yE*7~Qhp}V=a
zOh<$q&%FXW&gFPX`+0#bu&kMZ6D~ez8o2>&r;8MFs`-*{u;;8nC*NG)_>P^_s?-&f
z;)cxWQC#%K(6nRKQp(BWUB6;$mPT|;#Q6TZt7L?rz|K^ycW82$_iJ4h5yUcVybO5=
zn?1)0Glgjp%3Sj^+m1x=p5IYH7z%bX*pZCab6Rh%GhJgYHCkvAq#Z4Uva3<~pXqQy
zgM&nTyx3luVx@r}M0F*H_pf)pPn>ldbaoMj*Q8j7QjKR(49C>BM7g$erX`6y`e$QU
z5vhQNEWk@~ajUpm4a0FNAk?CGDnfnplLFL%ZO%`7h4pBxeqjFT1!LAa{NAj7#hqsW
zak$TQL>*Kr7?B|7vO3@pNk8Q8AW0EeNeGD1Y53&+-5fmn=6ZM7_>Vc5(hv^Rbv_dl
zrEue5K20(PJOGL1Dm>;7T4T2L-&f^0Z$`aiQZkoQw|a8o>x`b)|LnD4*AQ~J3^$Td
zzbj$h=_TRwH#x!XCk;E!oTH+@cMNQhre&G2blCbx_UH^i`8J(^u#^D1GixATR@2Yx
z8;#po_!p2KvsY!~smHkL5%R)<OF^_MD2lv{T&iJ;B`GV(BmkX3rZF9d>g3~JF}TWn
zsL>c-^Gg;=Uly<w4+UVhGOiS@cAEo02VGcsl$<E$>*gPLu-4B_CfVrNDy<oo=c(Uw
z5dKrTOWZ{$M5!$pO2r-^M=$D7qvBq@2SN%P)<BH^M^kS3>hS(YTa4=(zb3Z;o@DPu
zSf4Y-gK406E(J&)M0^_NI&;Fiali^A9FX14qAC9lXsTBnv_&bI#XvCgNgI=U*q%>r
zx<LKSl%Yn`>g-KLPqbF0?$*iqZ^+HHG)cD?FJ>h)i_|)NKHl$n>Uz44ywbs?(gl{O
zj+f|X6wkP)4Q}$1luLRBj79Bm+C{|3Ue5(+!QI-|2ax^TXkd;*VL0m~>%&*BWl8ca
z9>be;`!7%4Z<A9MuMQc@&Li}`_kAEX!!;MU2i~{jKx<n#c;#5w5v!)N`v%*<ePV;6
z-{2TP-WKIagGV4s{e|j1$q_(9TVk40G8&AeX&%i*RaG}UiJY9%3=9E~H_2$a=2cE)
zy0j++?x}C=-EY%xDF8sE%(Qx0OyKz2bfkT%8UUJGJpJ_yzq3s)^Cl?r(Z{Q)e`LIm
zU&!$+qnG}S<VC)35<&ca8B^Zi@*3;GTWG%jgv;UQ#aK9_^tn)qsxwv4?o3^%Q2^Q>
zT6E`?5dIFs=iMx$+X_>1-3J37aE-c9ptz6x0?S1EXU1F6{9B9zmNqN<8(V~4&(Vp{
z+@i2`*h$TwozWs8pm_bzP_dqH2UPDA+$BY~{8eZ1l|w$c0eshjp`u(S9Px&5r<O7{
zMa0#FWJVvxs+9T^nr2eq=~L61LmdRA6Akg$ohhkSNn+-WemJEcq71d>oV_oH)iwS&
z_i;iIyogCbuguB^z*10y7Kg6a-}lAP_3Q6SEmOmYsT5ZkhlU)a!D~VyfZF6;fy5-|
z7=7LJV_$1z_R^^)%0TAu+{-0ZhH*(uh5N@Iq#|vS@729s`Hhjh8WmA(vtg(+9=rzx
zBovg@#Z!?1_FQ#Z4x)dxE_6m+CllQLry2E{*^B4EyV^rmSP!OxDM{$QRJitx-`D>6
zNrL72F^}b)QMy{^rUN+Bh07^f27UF6Wef{b*7qdD{UCIY19ksvuq6*mnV{SC+s*7<
zr+DSGT~F?}Xlg=tnbyF?f4oO9l_O80ev?^?la*)e@~I`oBgu!3UEz7;7k~?d6W!=w
zO5E}t*rVb~r2A|?2+aGLFnec`FB(e)yxGy(dDJd37uQZa3baBM9G`9L@}7T!${Rlx
z6^)JS?YmFbf9MV%RjU7Vku@oCCtdIE{Zh|$CI>i6?Z4DiJq^UB0ufOC9uMmg-%JIS
zvSrUg3b~n-eRiqbrNl!P>=K~z4hN8g5Yv*+@{u$-?d`Hp99^Cf9;dlmL*hLs!w<Zh
zw}HNw)~kI`U9oKYT=3OEp?}({25b4(sj`z4I>CYh)SVNJo*5}aAF{lDT0Z^I62eF;
z<t}N8A=okWo-n#6Bqok;!p9Ozo2ov}lTyZt05q^b{w1}_0T-X@!ush*4Hv^(j_+XK
z(KkT!$ER-SHFEH>tdqPn3{nfOKLQ}p8l#LIHKF;u_N8^&r4&|Cq)&@cz_7~BAN=>}
z#!s1lGX3}cZg&9wf*{aqUi%6X<98E1TwwTowBQp-clw+Ns|f85YZ9Z)VYH5TL-0aA
zK9ZRFtvWh!i2FXUs9zeu!`b2Bm;0WS^d+C$&4|NhyI-G+H_mSv0|9A1#!JH8<4Cis
zVY7W<^9ixK>HEvRWv&U&lNl>y_kaNWKc_^<4kc-U^Du4ScimBRl%9l4hvv*FoIh4y
z+r7cCR|$qAKaR8X?7t)|SM`cNOO=&qF!sc}ac(xI4Z`*g@|y@;4Iu$w8b{fFP-C(5
zmbzbWO%7<s;NCvx()L-EVs8{cM2k>JGN}?XpN0+Z7AN$JAxb9&hf8iZR-v4I1Ewsm
z`B0eI`QcmzAmdq}+#69{_m9h3X7Fd=j<l3XTY>PGi(ekQ*r%6gd3T!*+_y0e?CoX%
zrS*Ic8JwRC>bmDKVE%C1Yr0<yq~kqcW;EpnFzsW{k_MY)YMKR0PqJOIw3D#AJN}_1
z^QnvhM>mVLRy@#d{!cQIa>5xQOv^wmOv|`lUpN7?S6>lHJl?;0S4^+{Ll$@b7wCI?
zKPcd&!>?|OgXCbU&LLB0fxPwB+2K@Y(YZp<2PWcrVC7w&%gldoSz<HtBzkINsh2JB
z_Fz0`uEgg5evfdGk59Je1OB{4)vgx{y6yvCBpZpXCvXMiKMk60!(nV9R~j7a#v=LL
zoX!dVY8zhEe&7T`Z~a1^#4oS|FRDwOf_vbV*H6U7HWY5vTDi~+G>J_wQnD?ruh8mG
z9iP$daY+d2dQ(Jho@gyT!7u9XFVh%~lO=S}yA;+Id>2BrG(7!4!K{DPuB>Eckj*~v
zhr3BUQo*r>jCfqZr>b~O%fJE1R?(}!Wwbw@7Gkl(1q+vK^4QI-a%?U57XFHmk18At
z38LZAljqjL$!b>^BsB4AJ97JE^%A(>jN1MYaLZ4*5i^6OAI-sTj=4lUbYaquONU$G
zm+9B{(j?)dI|w`qYOO0kjQ#7TpmMZep5nw(6TV>NT3oB0J4f~>NWfmt3BgVYI<eM1
z;GxMIL%rpb+~_n}`Ic5Yx=_N?vCEn2@KwD*AN$9fb!{zmGu73{Y1|sg_G1X&DO>Os
zt(m&llJF#p26k)_Xa`51_`Q#QhN(`u{A)*IK!ZGA5*lR817NBmQy+U0KLCIOu4P41
zX0ga60y5t?m2@$CL-0vg#W7lzPVk4elpB=E-n!y}S@c86H*C`{N}V(elr~+a2b^6B
zor_XpCgBo9Z5YcJ%mTfzl4Lu2J0WcQ&?7xHz$fe;fs)V$1#b-ZNct70$vYX@Tb=&)
zv@1&D)emxL7O1z+(*M5y`Q#3Rpmx<Tix^SBigOL4Hyn5qE0p!EH>$H%tYda^qj$9t
z=Z>ve3fF0KU5BQ+qRHelstyq1NJ)1lQ~LRpRsq@sZv7FDZHK^3O)em-M7*>EXmrU~
za+ST1>ElM+r=b$8Xjpw%)i)wMT`Y~?$vU``F+CCS1Fm`)XvG_(>Ze*-e5Acp{8r_b
zWy_6Rqbw!glO64*0isv{%J1v!TF%P~8x!jZk2|xA`Dgci5SitD{_LY*Pv)YO>wqW5
z3S#MMEyC=Xrj+~0(U)#5m?xg5O)-s>x~HOX)iebKitNK_C-TsBMp#Xk8A{1KoPu-b
zsb+oX)$cysJg^~lUFC!2pb>BV-MK(j4fFr=jq3dW`bIwm%%H9l!D)(}k`2#1SGVxd
zwSJ=B*wd1=eaF25Ip&|%+b#pYTiyIqg(((EF>P|}HhNXID46(l-yI`qKju6ZN;TFG
zaI)@dFMcK_U6?=ETEdW_AbNOA!dtv-4=p0wc;59MKrIYfq^^0ukcThtcx2n@)~w4{
zow>*I=^t;;Zp%+Qldiiv5<3A;<emHPr`t@&detreObV@y&Mm%doMwMfcw5G+Ibujj
zOU2Z(Mr`){uKIYv1m)v^5AkW7cx2;OO34?or{s-;5*QkjI(ULY2@Y^*<Yvo0;H~co
zVcW22&#6TXZq@7lI=ZM)ox)oX<TZS-(#ftP8E;)l4?sh;Zc{(h{EOM-1XpQDn12p@
zPQqKGzLUtSdjI{bKg#~-?=qR5+JFr5es;gx4_jDML8=HPl_pnT2StOO+8J)c_|Hy;
z@7P(Ryyon!2Gpe%+YfJGPj!ntbHF7frss-Ii429O%67dDS%B1mdq}7yb6d1pj564T
zQ_eOqW)XE_<yj}SD98kVcm5tLpyWEtBpXMixqtZ5A}ERw>gXM#`N=>p;*cF42Ue38
z1aWxVlcayT{`Ry~NSRMj^MiRIrnk~(jO>s~O3j>npKk&u=tg@;<Y>!@Q-VjKWrR52
zJ%#w5lw@2<9J!Q+aV{|y+Vl5=j6%zJLrOWSQf6+^btZV>+Dh-x@@4Ydv-vhVf|q#B
zI(-m8Bv|M(hNoEI<ML7Zpo-DZ_+4D_(a*)x47olYmq+_Hi0?ry06hk7IOF6QpO;Tj
z+h1}X%{J_Ja?*9qNUpQS#XoBs;jH?vg-){b77AEXr;g>H;CWVmDghOPxxE4aH`@q6
z?-g=n1z<kgH}?|&OwM<?U9OzHJx5bRAJV$;jlrs{EKJ_o_TQ5cRWJWlA8*g$EPEAM
zC%)Vv$<+P&B-=Qpi$0;zWaHHyhss`8#l*6Fe#^_koTfSu^^3#gU8UiRp?o%an6~AA
zp1|~5KL6c79e@p#se<QE0k+@m?7(6Z>{Y6FGxxxrdOf8e%_+XJ{=ceK?+beUhgC}k
z6%dv(e?Qe2#^KPB2XK6>w9IhG!pDGOVvy8oaN$k=&SHmlj<D7c*DUl}8xtd-Jm^>s
znfNy;>f^6m*ClE^&Hq&%*b)<G$PApGsRg=TF636Mqv`_mLV%P*!n%NLdDFmPgh7mS
z{DXFnY6?Q&qkJU_4$`93BG)Ij4U4r~yg01@wpZqX|51lOr(Oh<`|r<O@~&k(s$bd;
zhQY1AxTlR~YYskUGa3n{XE#H51w1xI<Q_Q=U#K;fndWG|1<;OffQVdG=OYs*Pi_BT
zDR+Z$<A0XegQkYnp2mDxIeqysYqP2ird4r&<Yw6b(!49N%9ofTdKw0_VWmFZU~xZ<
z?Y>v|5hJPT)ep-Mz66fe3A?P#PkT|1u4J~Ss(PlVW60B|y^<I!ipdJaU01%}Y>`}l
zLx4%MU=aC954fFr_ZbWyBpAp#%?h%qZat9t9%-g)#)+3i2N7PT2bzTEOTY8wJi`t&
zx);CC{et;xeRBseg=Yh%@M4_54`2#EI2FoPx_U5}h|Ka|b>_~h2SJ`+R|8#K2tX<;
z-}!FWp^62)Fu^|g{5rMimxtR@2?p>ve)Sy#am|TH5b)u8C*NW$*bh&tzJ5CoB98TX
z;Mkk?li%J|@OV9t`4L*OvIxJDQSiSL_1>RA^_KPYrnUa?k#mT6?`x>l!S+<qJs`YP
z6)I~BF;rlJNU3krbF;6enBJ9HzkX{e6`6l}BS2j`>Va<itlIhuOaGC=StLYFFa9=Z
zDH|g!eYBK?g8kZWxjsc*-jlR>Zcizi&8I%$Pji6dXlyRc%>WO|=~&{?nmdO;$v<Gz
zj2}&{BP!@E4gXT`uPIRtok<y<Qv1VhEm;M!ZF^lgm`7NE5!#@e3^jJP-{2tYB$E%e
z6i*jdeD!c*je2+$>GJ2W8+Y|dyJrN56De^$^$)|kH55}ZE%@3vT@A&LCCk~s9AoH}
zjXT%+?E&Q8ZOf|pt{xvrlzyERmzK6m>ku#$RDSVazqMeR<;JnADD>Yh30<HAWo8CY
zTjo>Si|)f{fo*=*>Fj8~NZs501visuNaV+>U(UsZ=rv^~``<>>u(y?1xu>J`sn2$E
z0M%Q8$Nz<v5Y91|t-U83fEpMtexTx?5s-pSuq+gS4?t%>$nMSh9wV=XqU&SDb1$G^
z7dSBiFb6h)IY7gc^{(fF!OR<YZn>b4ng2ewE-5I_3>{37BlP&~(FL;I;%M6wT%<@?
z7ZDz@zA!v}{_-B0nB{iLIug-ZXWEEsT{<~6?_BrX0MhGT9RB^h>PW2urvkoueYz!M
zIe?~u64I;O`fpy@|C_H09F@P`l8dfsDi*wJnyQizqNXFSSo?g9wf5jJ_ZCW(gITO+
z7{B{s(PaI5dAz{OJ2LmjX*NHHXD0K_t>E&X$w@mr4G;rg0`=KlT?N4*>5$ZrbfAT7
z<OcJ5C#p-sMz>z}4||a&m9}GtfGHSqamuN7RZ(Ks6uweJ5@BIA7%gwtp#ab2(U8>j
zI4I$pNPVhr)9kZSta%sq=W^<6W{i8=%EQCe`x20gU}{utF?+?!3SUr_kxQ*Y>(KH(
zD2P~(;4YmaNF^P{_Zd7st6tF9%qkIZd8_L5yIhqRCi~qZo#J!r|7HQ)Mdk)1uc-sR
z7rz1X6?Uzq%YdJ!e>~S00IlWJD^j#YO^laZ*heGkCAtRj@Pf06oV*gNRaA|IunYEG
z5g?1inMpGFyi$@X;$i<TW`8j0o>BR=YdS&`J`#n1*IYQ{;LBJ+YCRhh-);Ztle;*4
z@-V?!*>m#<u~9#NRqc_)L7~78pBRZU4Ot_(c_5m4W3rar=ATozI<Fj1J+k)p4ZNo9
zN!~iTjDp^yqS?*Jl+1r1dJ^4mUH14<t9%iNf{l>bW=Ab&MKl_6ZYGOnBpG?gco^eS
z-2!k^TlZ{9FiLCaxWoyuMcELNcc_@Mj=s+<3drs=KZg^5njbK-ZK^lAXEX6V=B|$i
z&L*HuFzR|Ezb8UuvRdzIHJsB)M95$3o$A16*sdiE-rcy)_?zBU(cWkxlD;tAT45v`
zgJ_zBC{)mbOv)e#(3p-of7S-nLZ5Klc<Z{o6)y9Jx?l@XPQI|k;@z&W52V_E4>jts
z%zt-$O=$HPr8|ZW-JYxx@qdQjz^{=hb!SN+#^5ZtEBWQQ2Q0eGLN6b!pg#f<bvbY8
z!pm(YrHcCLn9ijIJvEzsr5U9|*fwbS;_^aN%~OCK4umObw2qjK$8oZ*cx9jV*FJIY
zpa??fSH`zuA+5Y62P=xhuBJ-~$WxQ)V?!;&<hUJ3dQ%uAz2$YDS@fejo&{7O)nQxH
z<|0QGSrb=zq8O$fulI<TCs%dW+$}(k4N!8i7H)2@|BU28Xu333RGGZw*4Av3afW)y
z`0VK4>~pRyT2XLF*T<`_kd-%~hFv!AbsuTPnYNu!GcO?c*<&{Kf6DGLn_6V$nuahn
z2%xkH+~QvJ8~(Jy_s4A;Ot;=z%1GR0@keUkjKgN&eL2tpzPb~N`~*iC)I~;Uh4+zu
z+!)szL4Vg<-?K1mhfc07M^um)*P|2V!<OfX!+s(JzL|Zl=?45LcElmKD!4~U!jo?e
zVAnVlV(hAai<|(_6mB?-_2^-{pEmT!Q)DQ3-qHJ(R?#<kPD|3JXCL*MqdxTtr|!c5
zXe`$M&-bD64NqnnaSaB*gxK5)cxRL?`dM2YotT8I*6BAznRl-4gztYt9ty38M1BSq
zLu&33R;iNH3<=Aa((A-cw6KtIO5*%-+?(A1*=y_6x3#MIuou!A(+S?0k^z}tq8S|1
zPFF@%LtV4_YZt#<hu-a_EZ+Th`po@W8cAdD#XTvYa`owTtJ+>X(9#X=bIz#lnt_#N
z-X)iF^1tK@E>M6n=K7+?zm8SR0LZw8+@b*fcOGJ!F(9%=8y3$vcyLHim{1Z>!^51?
zzU2hDKwX~?;<@3w{z^b3K=FYk#VY_xB2g5l8<TP92TZj;yurL|{??xG2gOkgQjL3E
z{LEq~>mI((8V>mhLNdRWzVz-Q-nHA!(JBJH0pR~gP>%KJBUy|gi*#w4Ex;H1N58#z
zwd*j+T-XJ;YPB#sMf%Z<J`0TQq`u#BrB$$dBzoBCJH=dy6^<7lT5jx98P6A1#c7CR
zR?xWWFitAbX-5Eg>Wu*Zt*3I&)h};;f@c(0F!Vi|zP^`d9bnprk*ZQZ+P4<HGMeDU
z$NP9ufDrUY6de_NP9>&C9L$?N=}J=~wne1<)9heLI6ZjEE*f%x&3ZrAEIJa25M8!1
z*Bf)hUZ^iE+r2?QxLWoN>ykK+xYaz*>EA-;g54Wfdj+&9Us?~%;29Z+-adEF*_y0&
zsUG*(Ut&AoL#EU^%(6H1yC^gNJR3f-Fv+M5{+My}mAp3U0Vc)*h-9wmDg2rI^@9U|
z^m9!8^02Mv?9&4>fzD5n6=R${tUh@!ZTn)S)&BmX(wuv6!k8iD{;JD%a!H`rO;MMc
zbTu}SHj<iK31~nOd;aTJiQ5s=xkLuox9x5IKWMw2CJ*=o1JGy={aApn+nDpU!SgF!
z4VODy<<EUMwo@6r?~?+-*-QKHEhgEZ(7EUMem_wlJLk@8h^{6-+CGlm3rr%N$YZSR
z?XpI!Q}rZOWXSq3KQiO=43(=m9ems5;-mzJ-!GVI>t3u~u>YyyE#ZkWPrHD83c&Gy
zoY(sgpM3k>Y1hR4Oflu-J@s`{8Ov{`rF1t`rz!ejzb5y*ier<1<>^b$HQ181uxYh@
zrJ5BpDj-Fu0Z#TU%`{-i0$nqIW)|un7=Xo0hA6axg&{i?;PYyQd*eu(+`Q(FcRCPl
z`@0aU8j(SZ=n(RB<g+Y%sW;y>`$2ZxxA#~BiQ;7L?~Y&f6zGgsV8b<4lmatR67`hf
z3&vuy*S=_Vut_iWAfz9bJ|XD!+1FM*@WQ*aYP1y>YP}I*%%iyWpKuPjE+{RP3_;6z
zKF~8ttI{t}$GA9|2vzSQ7A-N9${*E!@r?k;##8asXibRe>QOhy4oX~5V<hRx*k3uR
zm5rabUOq8^l&|)A-|hk^PG8Smb$5<sG^zu8vCzG7%FDy}Poh-3@w``aFV$}^o@5mr
zAF$i$1Keeg54t5)KJw+cXPq>-gE|OJ_1(PHZX>y8nU>Gs#~A#A;vIX;nsDN<_SjeJ
zss~jnn5M4IDTZ2orE%{cYB`UMndqJU3Op@bUGkJpj{B$!ow6_7PG2`atJ2uTipL<|
zvOrKtJdtteysSOf^xTtKVE-(zbOj{jzywV>O(@6$$OB4YaPCySy-6KN*TLgVdYNTk
zW~^{gTBD?UcAVMuF2%;K-8u0M1LKS7B=Mq`{E<7JrVlr+u}uYpWIT9uSJn?w=&@^Q
zn1(`?_)0duxuD5*T-~Kmfm?3u&t6<K$s=x76nPrcL8pHwQ}`QzuFk||&d!?}YMmB|
zQ=Um5|GuqZc)`dnnrS6tvJ?vQbdmvbc39(&_<|SSAQ;5|)mrrY8`T2S*Xw4Xq=1XH
z{~eWUjed?(Q8!E;M-ESX+f3lT$^&jn;urHYn9t38Zxig9ujvTY#%m2X0-nzHIk7*e
zB}bl^sN@xDxZ#l2dKxxct4e6<ZF}J4j|uFbV!jMHj8)~&LWXkC_*HVeqvhIDh!xC>
z)MaWReI)TV4d$TTzRb|hHS$U3(P*eW_(31q#RU+itoeP3PW@0bH838?rN!|wDdfWv
zKl9%NMFiR+qK-TrA1ZwwQyHFjdfRG)vWvs;{HWFyWt3(irYj=KeEOQXFmXE!d@Ne1
z9SH~{6*E6JyqRQF=GH|Oz%%>ed0urz-p?-;HK(SzMMka<i<4z)Jyv_^TXFz79^=t#
z^@}EMGOUjvZ@=CF3)_Gl(66^TYok8}T&ZpEx4YWJSwU`|UVur1O~^d0{#|dJ6>|+e
zakU;Pr5vXWj<6fs>YBJGfg>E|TlEDN$o_m&_z6gmY+;qGXP-a5`F0{uPnk1=B1X?o
z!?vr#TYiM7(~zLK#rM4Z%4YZ(q<v&{#-~boQV#?g*pkR+?jJZaY3;0jlNI|4^$5d$
zT+ZKy0iFXC&<=B`pT*i9C$K}+t|6|gP_KosuAIpC+HcqR`QawBPU~yMq$|_qvs1Hs
zMN_j079NQu`gqHas^J#QLse$`<8rrj*Zi87%0!Vh?Lmb}+du%E@N2>b%%Nf;k8D>2
z4J`N)1kL&}Ns>4*Rb-to{KjbjClh&CZ9eo`JA~X3TDi&zlB!HrQhEH<Vg_bL+wu&O
zdUxazkpGn``?Or2bB&t)4zZ%+h#;TBs?6f}fhftajz^=GPH>%^Ci=2^GiEn-@pI#J
zXP}?T5Bqe)%C^5V|7E#u3$JEzn8i)3&IKp)S4sBrGH=<=$5+4t`l7m$RNl2r1(T{k
z$QKb_Mc}Akzf0`ZDi$s%RxSgS#JLd6yXK26?=(43wU4IfWIVbri=Z#eCjWxHp0%BN
zghS024*(8z=qzN)bd1Kl^<XlS(~Moh>n{gz<|{B(8<fw3m;(O5ptp^tZ}niVm(f1J
zT$upm4+6k|5#bVsH_Jpo2iy&Ttcuv^sBRzU^0r`xgwd1yR4dMR^lK0)ETNjlzMVqq
z0bhQ5RZ#{V%9Xw7*h1W*QB0yR%Q@N@8NON7P7IAa8niBL>j7}BOf9iXC!qPJTs<SS
zPqltTMn&mjrqMk~A_Q%7`jruIT>98D!2!>$aJNY7BG$2x{BeP5mP*DND~A?A$ePyv
z<zYJcyh3%=p9_0tqvd^b)-+_3b?wYg1_()H17ZWfh@#yK(f$|11ciDDa@oefPf@&z
zUqfcq8N__5CeX?t$m9I%$sq$N+4{7aaygJ&wdOi-8GM32ed_P#l%-<&&D9k9_Y{KC
zt`zjz05!|FwkVm7&5NEfLd=eC^el->r*%9E@NE#0b_E|CsWS{%&<i;bZ_hPo^XFrt
zmU{6m5t+GVITf)bIRdKw2adIH+r8pPhPAy@24PNJJt|5pbk}(D#N!Y`uQNjqji!^D
z@<Ft#@7mKWV~2fNgI0@CS(S%L&W``V5a{kY;TW>SFm2BABx*zS)#09%kNSwk>aG3n
z-eLB7UdK8~3It5veJ1$t2kl>$U$^l6<NnF<1H~_h;)kq$Yh&m~K#9{c9a=)<owkjw
z+L~^QTuun#ax3hD20p!>A_cXn7m~40ZS<i(zEG6^BgHdxE!BmAq_RI7$rM1h)1L-Z
z`k-g6MV!C$zU2L-)tVYk#y%oj$aJ^v@9k#bry$9DX#a6YHhzRH63GuQuOaOMevm1Z
zD?n-0W;Wk|Xn)t@HQSb0H~D|qd+(^Iw`N<^0D?$HK*<P*1VKP@MkPwlSwui`l1!5o
zm7Em>lpvuA0z#8pL_lIomeAx3P0p#`YPWvpytCQ&?)S!f|J^Yh3<O5^>h)WzYR;-z
zRckk2o-U;bfA-u^jLfJ|Z}b`A4BraOvWc>j-Y?^ZYqn42%LseweebD)aHL>!A!R7j
zV>vujmd2MYLd)t<J(3+;*FS&>Z&qEZUu}+vt_)E>n<m=x9k0G^h1!n!`7l~irSzQF
z(q}~BJ<w6$;NY$%=XJ-5i+tRKWkQ*#GS$}#Y|jfD!|so~WgAxeROl1~TB32{pSCDw
z#0e>_1;0B~ds|P*^BhD<mJ%ydBe&|=wb^@<%l&hY+OGz=zWcy5UZRX;cBTGe$gKL<
z&y2l!Q~%;Fn0xgx^aj?1DlSR%3Wvqrv~`}HMg&F$;*tbyCyO(<>(l4V8`!HbN{<$@
zA~|8^bn_WXzS5ovyK*IKuK7j*KrEZgo{t%iK)A`yLJV;Codv$HiJZk3)<Zt|eRQ-t
z@g1$9S3545K6KDUb8t&ShjYTODpSwj-CY&ErNj8<R@@b*Q2Z5{p;F7sKOI-sp(k$_
zmnNSUCtw$o<@l18npCNn+Vyr+Oa+<{!q=?R&TW@3<h&E`BP1dtJLkC-T*4-%0F-I;
z7+qHCH4#+U14E~_meH2PM}{yvs!uWj;q&FcBw0a~S)@TJaVj(XIIf-AEXPlka+>t)
z-hJ9f-JMkDz7i!p@X{)66jXi9Z$~xJ=Qzu}_nZ1={WcYP^dorhhj=+um~PKtK9bev
z=k+4ucX38Azc~I$c}jQe_ND6^9mSjl5@@!r>4aCnh~Sso&2n!aP>wHmFH|VbHvOC=
zDUZ4xK}cy%4U1^;FD6)BbQhZO^AqT#fKr`2eJF<SenZkK&3np>=Mvl6wc8pFyd`?L
zVMxx3HZkQvn!OMXu&8GnAK%vFZyhzz4~GZ<0ar`vZw=z+=W}~`A0rmHc$}jILDeCJ
zV!h;vE5Gm^26cO!sGJd)Jr`%R)!^<;PjhwC^KXyK8vjdoF^&&<6HYx4#bkbOCOzHS
zKJut_ok#SB>`7cE4o;b!y93*y{FbkMC?uXd&R@yBJmyi!8}P+zJ)|(r*z{5Hd}q`z
zO~(9%S1(QcDDnDNPYP_e4o9)ZteTkL)nAn3aK4LP?N{mxJ@BJ_-LwdFKWhQq6;El0
zVOdiTrtOY80!*jLR0iMSJIpm9npC)98GDlZGRp2?Ku1>mGc#Z`BKckZ*=Rgr`a*wc
z`}ZV9wV?C|SE?;&L03i<r7NyQ)x@K>BTY0Y_BL?r1bL{!O6UP;drdZA)`<~g^3~&)
zP3!>?%umj`R`Zq8==j1%V>hwjbD@z=5}S*&K3UEe^Yu?u#HnYkCdWJ^Ip33W4CWHu
zUV6X&X`$jEE+SXnC}>CR<l0fD+0&2Np>FDysA26~kXKv^r9GMBExm{1mJJ##;e4Bo
zdWLC_V;PgkR5CkMvzq&)|A33pi59dtST+KSZCDDD3|CGTY23JY%YWVOw6F0iuj9?7
zEkp}vg~4dKxh*vOP?F*ZpZ26ed15@T(KXWTjTS1Vy=7;s-+vCTy%p!eFqJ<8x7r=a
za#E!cD@39;{N1^RIkK<AF4~R5rKk|%^Sv@vlt5NhrL5O=g4mN}+bByT@c#nUp604X
z*AEMr70}5YR@v8yTUVpZ`RL6r5v&#8+w03ysR^;@DsfaUQJGY@)|qZ|LzSo<$)F>!
z?=WydgyAOS4fVXP@%9xWfm|i)UK2;rjtnsqm9eXLED&i4OM_4a?GTH>HNQ8iTYd&M
zsq;C+wW?7`w^Y+cD>kvNtY>9%!_$<Z{-?JYsKy1OBzwNt92G~r%`I>jz1*NrywO$D
zYd=_UW#VV-4ku%UNx5YqYAp6`>H8%Ubq_aN?SvW{<g83>Q(~)1nh2TGyTaCSU3g-X
z;Kch-TFy^t2dJpelf{LR8Ky;&X+JbGJV^%oepc`AmHB0u4xU<@GpbIsQtd43z;v$5
zrw9~|78<$sgcwS?JqRb6d$|jG!L|kX1d>hfdil&6E}mX0zj%n1@OJ(FaI<j44z)n9
zPX>a2M3~-Z@wrv5R%^xzLG?lZX^`b6qTy)~|LOkaL!HrH_{nLKxsF|6y?WzeQJmgB
zGsI|;`C<I!lnZ%}_U=Z7&UG2yP}SxdMBCo;(I<Oz{0K<Pj;{uVQaQ@<scg0x1#V4j
z)ZD&ntz}wp*SU~o2@Ybbg;=AeVor{?^Nq_Czq}csP{*qMjLp5X;8tLV*RXRs#+kx}
zmB{gQ!8vI5pgY`g!76k<&aZxPzEz6zognP#FlkQH8WfW$yS9aXd{g=O*lU0CD7WXf
zh5erQ9j^1QUea>TEf3A}yXC4PcH`v=>ZdC<nDfBQzMj}@C~dmoF}^kD{fVZamlZ)9
z9_@nfPP|XHyxf+x%JuC$l)~1^^(DEkk_n}z=Zqq>3te!Ky2aJrraZa~&W7Z{TX%JZ
zry$i9&V*$aI~yRZSC5CYHXpG?&!3_C-Pu;gZVwI0Ovs`01s_0^$F1O=L|hAfwo<}-
z*$gf|%kL9uZ-huM3%;Fb>$hD5QS=1qc3QsD;%WZmV^53dq~VHBsT>zaRpw7Whfr{v
zqJ%6bJ!>`a&<@e#pZ5Kazp+u>(y{M`f%2YGolo6+i>Fs8xn3)L9yc`Sfk+;C@miL#
zQt7XSh#%b?vjwE`v~x*v>HrQH9UmKq@9zk0B3uqlQo-Z!JLf2r)*`A~aF{Una$Mux
zO;;zhX-+dz3y3PuL#w}InQNQ!LXbOur5vx%FUUAq@>uH8*9n~meZ|I2if%L9D`83&
zV<N}Fq2_ZooW0x%W(m5klvPUF9Y2B$?qxmo8`NXMKj(YUNtAygC!&6H_?NNOG_FQ%
zZGu)8e^JzVV8WMqSYL~A__5~eO<KZ~+>ph^kG|MH1-*u4A{B&rB%4{^5k}QXkdwi5
zfZC(V8ICkCqEwCVE}Rkt6?lsfhq+fyPM`u0XFfRd9}|u1#SEYVZ}ahQb(}^{dt!AY
zO+-%F<2=-IF+6P(`HX3nT;`i?ah-rA<+lNALK-2v+phi~DH>x%SIxE-ab73IT<08<
z8O1CL=@Ae~C#s-ZZ1Q2W%2lo5_&_X)RrnfJ60uHn(p{^tPj<5r*n2EtlmzSnS2#9q
zF>T4^Kx8-}GYig)9j)w~lN5NwOE21jp1T@WtY+=+lg0CB-mK2{Wm8Yuovqxt8(S*w
zGVZniooBdiKA?ZVGXon2ah(b_sfRb!wd!1W`{0grjGs!u@p0fD=o6R7(vH8#_amaJ
zOp}rEF?_XpS<I>xf$!iG`T*{#Vq^%U9XIl=im$tf3O$>-l`6aiV`;u+bc-I-V0~ec
zQ)W^ku-z+Iuf7trv}SA)l_m?{kfz{U8TbF5pL9Vcq!GmqdWD+JwprVeDMg_nDt)is
z#5X1mr3$1;HQG%9I%g*%MyZ>7&Z6U*(a$Fz8wVzd=p!*b6*P66)8|Rz93E~&d#MPS
z)hE{Z5dElfoqs@0ep2-`b1<|axKP|h^4a#!%NS|6!+YN;iB8U&nIXgb!=7I+?v?pE
z3Mqe#wRZCV!omNoB|Ym3CAXRmk5}l?#V&5WbOuC{12cx@DcBy}H>Q&yRXwJe@hOov
z3VeT(-J$7m^3>nkyWu#-gd?XFWj1~qJn%;D9ECj-EBW_yLH#v*E;3jkXfI_jT_h$r
zm-Tfjjko2ILaWd<w0u<dXJ?JO_R^FD3QC>6++_^Ua^8IZw&ws!{=fPO0R2zQKm&ZX
z_UTA0O)!nvvkn;zgMy5iY{w`TNk5a7p_=ifFz%N;oO?|Nn{x_0=37sTQdwi2;ndtW
zZ8!FVj*uzeeA0zCc#_3}Qrq|D)JrblM9r(b^b>HM;|y9Om^$sC{DHWn#M;MGbk8qc
z!fW&MwXjrT^H0mUj{;K)th|NHpS)FdagCe(VQksz);i^2**Xn7e%ujj*q3+E(Sr!<
za}?kEcC^H^v8t{n2A#&E#9xNoLnO8A;1JT0as<8dFy*<-P;+gBl5}VKuC;+AA}pPi
z#)*1*k3Wt1jnYf169-e1whhOZWS#q>J<F<*V)qgf*2*$7=!LnPUmh1Vt&xc_j<r*C
zu2BWQsI$2KYGMy`x=-7SO*MZ9dJaZjmM!5M9e<wjo&7-?P_ea6rFz1(E0+3KiQ^1c
ziJ<TNB2+8=XU6G4V+xCtxp$JLU)SJf<d<U1RX{ZU4U_Dpf4s%f$5{Kp>3@n@g6J_a
zybM;SgH7^{7)~)p$L*>c*ndL#fsa7Lea}0~>kU0$c>eqlH05Q(@|0<OsZLffb^pdS
z6}G`Z7iQ9*bykuQUgo94-I>c*>Q!oWE;nu!W9H$)Ke9VB{^N2cR4{2w{9j$P$QC~J
z=bsO5R@8FBjJjfYeBpMoq#{h4lXBxgh~$r6@QXh%R7Z%bZ2yU(F%zAq2!!)li=;~I
zz_bHE&m7jFe1cZjCNy<b<h7F`z2_UzZY3CI3OW~@I2s8R@jeExAs0@_`k&YMpLNGl
zON^Lu<8QxIh^#*XiH#~qE5WDeCIu6Y41$Dy?Hky-V^+|_9Q`on#ve_wR1cXRrULA6
z2*y5rxHs?~2<kGwu4k!SxI$U@z8Ibg#T)+sQDQf_tMYvEJeW~O93-mVAn{+j`#&<h
z`$;5VRF;?i|C@z)ZlUr%LyjCcroqX{YDvB;e<;Jyl6%>x(kbSn@10<mx$g>?Mv7o4
zN&a0-d<jtO51<iz05uSuAiqD7{PUsyR+N1lh6_X|wamYs8w)LFXBZ}k0^5^{f9wqA
zY_RfVUHCKlYXZ|`8`ALd{(rhw#=iY>2(Qpf%uM&3@nhG|c*>h}X-H1-(aDR>yVh+v
z=W{4;MMsHvct-YQHLNL~clyK>0EP^nm;ZF}&l&j79FsraoI-xJ-+23%2!_z;|Gu4p
z{v2Qp=tBOm<^Q4*fqill%WHEzU!QYmHS}7@E0MP)eq^Pymj~m-w2vmwgToI>MP+eX
z{<H4?`OSo>3^=^Avwxow_$zC_4<i-w1;ZMuy!)$bsY@*|qt#9gxyc8y|7;D|wCJyw
zjmW2aFlHT$g}LRkYlrD3%U1jCmWd)W=<=>uKpubjA3wJ5O>jtg_5b@*0I&JK_!qqi
z1}da&E`vV*|EMg;y$ptjdC=u(9-y6%`S_Ye%vX+hcNvvp<iBee{MhZ(V9e$uc~F|b
zVtC^!TS6&w=?;?;yC~y__$R3)YoIm7b-#I$>PXjBi&67SdmXi1(+%bCmW}2`5J%yX
zOAyn{i{sumkQGT-4dsL^7jPK@&i%ue3G@Z5h7&a3<L77o5wn35PW{gPYJ2X>LAJDt
zSj1B2&i})gFKBGspd+-^H$2cf_3wWq|2crrclp(`5ff6ZL6P_~-|hD@1JGB9vG&l2
zm*h9jT6gr*^R)W|WQ!Gb%(z8vx6XXGKPx~}GT^SF(@8k)pRpt<hVBa@>xHa6_C5;4
zM$2kvzT2M_oN`MMkD?`+bY7mdl~Nhl&n662vqpAf87c=pocV5lR&Z<@z)*?ymn|Uv
z`z}eH3%q}2;R`HH9)@C(b}GF0>a2JB^Rs>UIcX;}I$V$O%%}T`;zyvPc#Ok{QqY7!
zDCt@6_UC8o{^x@xPSMv(WX^oLq_^Myp9A%4Xa3KD`v2)bML)YR;vw7mn%tI!)AmhY
zkr(_4pCaLzr;%8Sfei~ci1qmm*E0><#60F&C*}RVjJ5iK3uW_9rs-2=zjsf&Z2xqw
zdbU{l<Z?Tw*VbIT&srYCP$@}3oxWj_Qrd-iZlmbcx)*w3+$Lg1BJ~43Hk#6ZF7E#@
zexyuN#9}<&Mqz)h<9}a_6fX(5e04^@ZLoz5HX)tJjV(VT&J=+Y>a}dpz$lgiA;|=4
zsKPu(Q^l&#Ul@hm4#UesrXDm#?0hUA){2FHQJCHmxAL`Symd={bFS4*iT)`N=<pu)
zz8Vm}aPi`knNJcrDR^hzeO!j<Yv4-1>Yg?@a}Q%*Va)OD(r+V5cH@(CuOzS8)Uzs=
z*?iR`3tR<mlmUO-`d4gUD*qash{I>KcH?vw$O@l9_gHR62dFa3!4==bCc#pRcET;`
z>e`L`t6cHuL~$)6qj$Ca=F#7pn&0l-GL?`qu^!q^L`J<j+fFmMT_(m-HBJ{)J!>1I
z6)|R2vi`RT>(K=xNc<Aktk5&dPPRsB$qd&w8ftV#(%DZgK{#8YQa>f$Cmzj^=Sld$
zR3BaEvzLO{vTRApmiPQ%cxcz%Z8eL4qZ9BKd)tw-N-3f-<2}^8!e?(^78TgNyt&Ld
z>9f|YQ3iI;_Tuk{o6UUz44#Sp&?vbl^!ag9sYa<M$z?*qL}PUyi!zcRaW|1+s*xf$
zJ~mqQQJW*pY$ZgX%fXa|tpZlV?blZ|7eyzSgq^3d4#Z$gxM`0kJc-YIV#MpBU`c*^
zF`pRD{C%tm##MLxcGYdvm%lYNDWsooob6b2jr=fFYLTE)3}@DF<P|;aui@W9Q?$KK
zu$|3grArhkr*nD-rzO}a!okA&=EG6mB{=4d;F+@wo~R#1I5W{x)pso}3(-5gy%G8h
z#V`Mu%ZN8Ug2D6k@k_5;XRbvf;+*ul)|UF#`?LIfp1u_JJyhtghw9FV*g=Wjm>uM&
zo&mESTm(c6WMuBKsIJnu`1ilo$k3~739E1zVF8Sg7xDasWui|6vQ(TFs2LL_(O^D_
z_a|BH%lP=8hj-gtnA8ft{yg7&fU^qM4eHI}QHAcHM*M#i=;rI0@P@v4d1y4~ILZlk
z+`kt|Q&(}t<--N9toyGrHl_L%1@YxZ)}YJacZN6p`0fdI^1ABX^vW@mQ%ILc%^V*S
z@|}4z)0NOT#=^ss^kiw9o(94X)lIxH`J4ulU*d3b^T4Xz9V+Rnmn(++l-6IN8%Zz8
z=1R$#m@9rXn^khOmB69P62?=nHhHYk@untuGLg&JU@O*b8O<x1shQLD{gA+aC?^IO
z10^tXtf1b-<AHpW&uZy#wae!Ab^U7Jh~tBK3SqaUcrW<Gc0(+O4`H5VExk6oZZs%1
zLaLgYbL$ouu-4qz(=(1p^D^SK>|ju@*=r3-PyAkiQYWRPW|g)M!f$-H`ICuA@wrQO
z;RZ-f#yt<yp;|`wdI}<_*Hi*#+LLrwi-;MC2J@UX)64j))G>x~gU~*<)3Bno+dPMP
zZVH=C?@szv0`8|Pt0pqQCRxz0=0ZKRA@2V6r-QyY+)YMTcd`SI4>si^aM)|=$Rfic
zWHo9B!Q)H3*L>u0I_mXSz&y<@%xAS;>1%|C3_T;`2aPHXVdUqwd!bRu=}oJ3I8XLg
zPh3_<^;?q!Vb*F@8eXk$nQHh4%1hmm=`N?o<=o1n5D$GAx1v#GL_z}8kB?iE>(Eu)
zd!=$i<-~GK@UY{0YZ_C^)mzc3`P6HgtE0lkj?*QO^&ceqpkw2Z$3*lyVK)OXZJX;k
z-dxhl*rqHHTc#^kPfhDUTz8i|Ej6le2#Z&0M%YVFkH=W0`E{VYYE{}UpLx`Y<z2wF
zR8VOPIqRt7?x$nyY{GA_I;uqeoo4IciLl>F$WbfW+hwMM3uP!62lT)q%^jwd_x+42
zJ61F&M<?lPmw6^mrd5?JPNS3xZAB{_*_y;d+M{SC8P^Doe^Lz=t6Fiq6kZ(BFJ0YJ
zo~zO|b+Ew-bZuWi-1IW`cttwdb2vL+DD|0tk$^o@f|h$E;!)`dNZUS-zx#Fevba{|
z=aw3JAugYyRx%g=gx8T0{cptFDhf{QGyBsSnd|Vqifj4@5}w03<Gi+#7CyFUVCSQ)
zLiDt+`F#&HpA8_1-<i!-Kao&pv_IPD&6wr&7<=rKWN3_BD;Maj^D}$2QrTMSwY3vn
zGn{9D9SK^LEC?j6dgfV}SLOI#=R201iYuPkY-&G@2jekHUw($nVk>NoQ(mHBg*-j3
zwyYybOS643Qb*vQ>)>X+u15>=I7;`2wNsiZ^WR$;E4mH*ih&qF<G1KnoaMp!G6mJ*
z)ad<|>Em4$@^7n0Dy&crUYn?neZLPth&sOHT9})@taCd>zN(a@D5qmr^yGy>&Aec)
zsoYY3;o>z)`;dK~9XgxcyiXqKX|%IREF2bHL~x<z#pa0BoaVfV({GMeZ6B4<OYNg=
zAXVLZMLB(Y-{fcKNbO+|$pC`uVyN%bt}x*$y5dP&e7C)W$p63!zyCY2i%X0J7w;Oy
z{sX-K5EabX3KV6>z-*G=Cfq77=skVJsmK^{LA?z2-SL(E*H^ioK|&{y&5?cdk;gJb
zF@h%k3a=^H?8@CN7G84GnDv4oiC&{9@7bksi{b66ISU)g)$@?*CAM#LV?aOdI6}8b
zG5YxuS~qXcNty4<^6*+A<n$}{;+XBr>Cbo#d#fAOnTSDI4V(sXln&jvfw!A2x2bBf
zSFiN?M%>5tOXe+Zrcra;$B603-XdwIa-V~|-tG+*=opNZT8y)7{?xZ|PxJX0eStd5
z*nwE;yJIAcevNx@j-~@7BE68iAF5q(n8amzyX+L<6OE*Ls#R*)$%!2IR_1*o@3<zg
ztgvA+{*c(Hip!w3&0c&=q}s#YYL#@=TY^#AY3D7Nx+imb>XWj3H?o3C@W~^hDATD*
zr^yW8J5#PO?tom|zOMaUrl=CAm#R6kC=_}8His^zNy*R6hrSL%(&)xDeC8Epa9Rdv
za$LmFQuZvQ_r(zlU=Z%#gv_;0>%+XnMOpcd=Sn*B07fVk;y|ea5n`q2FVgy@z7ghw
z#^jN{#e*rbQhcdi5xlFT_5tMI{jyAy^UzOeZ6&m;Xs9`i$LJ;&+TU`7){fK#XR7ko
z(@6GLn<gBs@_20b2d_*jBXio?_7aoun!CD(N?){&qwNyF^i_kLewF^lOMCI}-!nkD
z>tEwFNA2%(v_#7-i9Z$7w3kaSj>sYm+N0hsF+3*#X2Mtsp}$Nrm5RC)mw!Ht>Q9uT
z^ZW4=1<3$C5xJm}^{*jv>*UaZ*6p`jqc5Oe?B9^gfFN#oiz~9G{w5H4K6~d%5G1N{
zQ<{nSZYKW9i1vjG7ktw?cMkeo^AOdFvp&q4&G@AwKUt1i(i2-FY1K8}OGzvq&Orx`
z)dBPYw~=Pgd!^ez15EU7B~8?Kf3O;(@9Gz8E*E8Ju9(Di6J=uWQ0~UUHfCEM=l7(~
zPnZlMYl%3}SG5;YRc=k#I<z8*WebjvyycKKUeBZ<8}athKtIAQHF-~|dtF9@!QVs}
z^o%YrhAHS!*JLl>L)o1wwtuX)PPlwI$dK|ndAX=(dH$aK{np38Z9I5uv(n~(F2qum
z*!a{}xD#+fTDE$~m6wjbv_sG9?;3C@XrH&?n0R^{dnt&bGcCb~Bhjs6y0dml+(Y4@
z)PmW(dD{h~S&D1ki{8u(JPY)ny8wF_z_5Qi)8g@&zT#L81JPdpj)4regCa^WnM}Zd
zHce)9X@+QvvK0X@_|!bq_%(lPtGK@0eP26p2qp@vXwGkg8+x?8DTxDcgXhU34;XE1
z%`Vjw>|VpVzHj&gOIM5=QyLb7v&}~mBWc_Ee_~7CPQaGr>Q7S8H5bQ@a653Z+jlJs
zPrrlY`3xDM(8zzH{_C{h2l*sJrB6gOiXD_~g>w-1+qd<%I*4sYbd&WPEcho7@QUx1
z#qhG`{MRt!H1o%gvkZ&(knVbZhp)VwDX~`t=j)y=#)i}G6#{lJ`=(57^1`N0jxG(P
zXwn#>@%)6o$k5n@>cd3&@@ceVghx+rjHoJ?_2J6&oWmBt%<)kYCk9-mwJX<#fj{HJ
zUs>4hS${G#*FQg7)Wd=-+J`in&dt+P#kPtJ){KWn(q@fR_(`|jkN?yKZOc|lve=%F
zW40NjgTmdQ^I0p#*##B(%(Fg_n}-Fpy;g7d(J8d1i8o{`M@BxJ5`0e;t?3hxnMkYW
z<T)(6TxxHa<#zCC&qrbSbAyhdw!=+alPVW%uMe$pq}Q%J?aUs_f%y<tj8&1ce4X8K
zzg@VMzqvP8xOq^?rjrg!oj}!;L&rIP!1oLz)3J43`9I`*sdQsv{|6HzhcPiE?hdcd
zIyYZX<bW(fbpPTLUFE!7Tq@PqM7>O_T>4kkYPNP4hq{Ho4}hlsmE{*d4_h4FV<OJK
z_YOMf5Y0B;St3h>o}g8TyBX1+CSe;`pjS0u2iha54^U0_cb9rGsf(^JO)r#8_xS&~
zg^d3Y?4u_d1y%9!)I>cRt!uZX3x;=FAry+o?iG5OK&tW(qDNf%yHH=rBi3aD?ZsUk
z!&b+YY6xFw&X)~W<+SJ{0-V7{{x`*G&fk5Ig=Va(=`j)~FAVLqy$Y3GU)|E~=$<c(
ziDuY$nchk^^L5zGbV$XSX}v@=QWL&6|9aaW%qC&A;(w12O=b3}C>YRFm0q_>_j+if
zQ~WqWJt3+kT+m~p!XuGGSJA|w`zMLksn-VHf!XSfqdQgV3qun7l+%a870bpKcXmsP
zc5;zNPxj?Z4Uql$NZXJ;YCU_O*>I8$|D3f@9k2%vvLGpxg}=^3>JNrWb4EI<BGL3c
z&m;a;+mKC^oJ{b9&HQ%DQh%wcSwD&*?NqrGrx(cRIa7z>PmFDgbN$Dw_vju&^0GXN
zBV(C-1Z-cPNaSxxPq!1GeKtv!#mLXR=fvwo027{W2!Fym^Y;#U7*Lq9@E7?mO7K59
zDfZpy*MgSKhRNQl`MRT4;Wh<ttKLa@(lev40}~IRv0srHZLhfE96D$cAKMhBXMRMu
zFAu8u*%o=T5<qoFQj~0zAOdNa2U<r@Ubh_u^VzRYP9InrqRt`PaZ`thd_2oMH=Gvt
z4U~?o<xV1Chx&|r0NQHV^ye-KtrhaDwKSEk=gda-)>V5%k5;(|9s1fcTM!!|%M91{
zX1@-F4WP7dp@(wl<Br(JZ#Pt|*YSVRQIIG01;FFU+So}2^ueV)e?wl2wuJ>vf<cda
zJD|stE?tr4J?+j$e%v%BEB8g@v>RlY9fVkJNOBojmTNclLYOjlzrT!vyM!x!kL+3_
zpkrx?q!TRG6>awy%1tsa+NbKZ>`DR{zw8D6!pH+&E5h>OqJ&q?h|aZUM3jV)N54wj
zo(Nm;#L_t8A`Ve|v|0LMwo;0&=^b}vZnJW2mJibFT#mI%6=CqS^_&Oo7OS;QmYQ`V
zOcI{D>9KF#DD{-LFhEh(w+9q5AETAAcm0d|uGM%wdK9n`>E?Qb!rHCM1&NU}Vgz4O
zNf>bbtVXLi&iEy81lkx=uk7|$xO=dzNlCXA-FYyyL?cp}Q*z{P07V%%6Wpy?ohxV@
zTdD@Qt+kh6`K{*9;+h&?Yp;@nvQ5ju(>dWm+G13LvTBX$NMnj1UeL(J-l7jrw&qMu
z4XPhUbR3?_wG0uW4CGr$AJ9VT1y&Hn#Z^PJ4gEWsA5R#dg9U?{`q_A8IyLZ8F|DKX
zt%<igmSDQ1q*$<{JmJlG1P8MEbBU@|KX*&BViF8T&t5yvWn6qyrkAx)!Zdh-L#Hrq
zk#AmqFz<B^!+yy$>r7oBy=XJP{is^LcHzvz)&NL;odR-cl~&(fGb7T%YR>w7pfJYL
zL%@7+tG;=4euMTmrEa8}I&2Ec@+~GK!_pP)azs{ZR;-1`f~lWxOvgS^oR~KC)}+Ks
zI~_Svs;zB*H-i+gtVlY2CsEXet1}pTuc0kZ?l{KK+$mCTL5FiIiRn!ru5MlCfl)}E
z38l|tIn;m<#E424!CCPe;>r_Dh;XgouMlCCj!JsDlum(>t$>lom|JA+Sm|0RimESd
z<K%*V{nW6p*XCSen(@e6%G3HuZYC_z-hyS~#iM4zMv?bJHM(-GG2$s+^}oY9Wn(4x
zl-Nw}jutG#NlC{(hia0MV(nc`bQsMI)Pkc;>cX)S6lk&Fo;<P=bbQjgDA5TwS`VbQ
zjLFl@_>hn%F5w&7cE|_>Tl$7q6&<bUp4&6+J2J<G1_I98L)5#E%9pqSV|w=VD1-mo
zAVZ}%ZUOi1RV>{Pv%m^3Gg{`2bIav~$`+6qt=U~Ek~~%;u-^AHCSnrz81f*CdU=bz
zxZGjVYr?+{<Rp`b<owJcoRK_|Y~#x*mxIu@A#i_#&ob^SFG~j&3a46so|X-~_oL0z
zg?*gf1VPj+-L(%oroN&<BOXZ}1VN5trN+&EJVVK>j0u29#UDlulyE7$ta2my2fJ8_
z0@)@<QDMO|6C@M6nAAso*<aDVc>`hVw!KmZWV&Ueo0Y@-_vPC@YBk9u;ehC7?UdNd
zWrYh|Xgj>N>!+#!q-EiP?lNPKR$dlF`awjL20nH0T8(jUwr3<*j`OKXvX|RvB{YUc
zwS8ese*<AZCvqI@!E)!$54->NjG~6?RA2aSXV+)z58QPp^&9x9zHb=`05y~!gwk5W
z(MRe!*K4eNMEk4`n{Bz3fXbqPvHns+KSDW&>!e^=D|@qUHv3=;A#}JBQB-$H0YedV
zKYYcWDO4%ev-igfO6L!16}NAg30Yw-qWga8fOOq6-qZ+_9dPx|rxABIIwYd9NVVC~
zAj<=tnSWU}z<bDF>h6v0w@3~cXt4-EKE>ay4^hum^JCLvNcTORg$*2tUdMv@=Y2DX
zj!HO;8U!HU`v+AjvFq}Uf5IXoAW=8&?&5G}ChH4|5`#so{$P>K(1Wm<c~c#|RC=N{
z+kSEF_;G5-I;&Lg;}V0-g~sxN3OrViMFFWIqbi%-a$Dp>MY*d<4t3*6SFE@d=RQ5;
zeXpv!HCpr?$?MWLXlcBbTRZwQ)%Qh-QkBT--;Q<w<<G)gYfZF#lNpze%vGU!_u3P9
zVJ>ZNDE@*2)<`hzN&Q`i2gF9>y4cB-w@<VaxlEayOPs4m*zd{kwY~RqG_(iCYU#ot
zZG9LeQBoveJ9DMFV%RNfRW;!x(GGS5TR9As%ihKwVHFgpY~Gp1l2U)P^j3lG1hSW9
zB!XKZycD94;o71@N@wzeDmi}5O(tkUGY64is*83g#7x)R+|Mk}vU?jF$!+%2pX^I2
zevsq%b(Tzt>yCx6do>iXT*e|$T2mIe-GW#)O<7xcnU2D+-2a{r_%9do#UA7&{YF}=
z&Q99FOfill^*@e-yxF0r*Q%>bWXA!i6ROnYraL{KBEhD;R@1_>G|e+@(Gq#9Z0$pJ
zfA--?LiSn!iRF=mxgFm$m0K<%V{7E3^G79~J`w$9WO({r<nY`5S1*WK@0CMS%ztgV
zSDCbv8(bB>FAK&3n8C|E4dcwCLz@q-P-giQGe+`_%_aX13-J#OrVb~}Q%zSdmd({*
zfAw)&V*t~B@62ys#ajCX60rh|qx^y;5~o{K^pF@>LUd_6Iw0U2R8@DEUWobL3&_V5
zOArp=_o_A%ha%F0CT!Gqk*M~hsAydSf${<G%r;6>)fo8cunpnXEMIju!a$>b5L_@o
zJHole@GIzcifR<UL%GH0aRZj)PD!ymP6QV~yon`4i>IywE8#Ma>W^>uXOj4Hfz0F#
zxM^AM9=`amC-Gn31^D9u%VU!I$MP&vjTIWspZ6+lXzY@%80Z+fVlh<OucKP*fMW4j
zeFxY=BIl8Iefmk<P>#D|k<KjLTM-ma84{rFJWqtNrSXXcQG^F-)S&*F-~*M^NCAY$
z+OW#zY^Qxhe?mxzAaH`?+k5cMSzXN?`%Vq)f$@d)Qjk9x?=Ggck=xGWE5cqjeYzR4
zO0h%ezSM)TfwrA!bF{ifP>UR9L?G)zeT8JfxN57NBU0XqOVkOVJFFr+kbbCUW|4JC
z0cFtNQST31jps3E74GuE+lHRk3`f}SB=1C)6xWVwwIxM3ZRa)bJ6e8!LEtZX_=i&+
z9^b}2?YQa9^QRX;H>+uTS87e+4#CP^V#tdZdZ>N&u%x0`bjns4e^#R{w_@wmgMtcM
ziwPX_ne`7$mL5)rkFE=R%3)GV2bbvCw*F$j)thoGN3%uyX0F*x`<i$n?_wx$a-~IO
zy2mWIMW+O7J&^Z17NM`n+ZEd_5yMGKuHuYy5~^)dXCmkSN72@zBnXZ#Ge{NO6~$!B
z)X*>%^B4GoILEr89;>w^T(mZ;6NS|-RH6^zwkvm0-ZT;}4=>eA4zK8JY2Pv(9-ciq
z2}IJka_ifKG|wAdiGU&-{q;Zh)T&@xNYeDRyV;bbMz32w4w_gpR-Z&>Hg8qZb((t0
zvg@+1E$ARlX7{aie!~8c>xZzhwf5&_fQ{fKKqpEnbS9CEjgoF5U-};b29(D)*H-ks
zZgc92Y7J@zvhg^)7P)oEg|Hz!GFVBE63HRlxn6EFG-J@XyB8Q7I(zaVeb~FGa2_Q%
zEDr{T7y7Bzg!>GOkB$dTEDt!wD#TfV5zONyV@sd4!QfbCptj-n=|kL$@{s)0HHS#o
z9TTYUn6QRD8(cpLCelejiy!2=6=JA!;TRH={7Ht7HS%XSn7b8J6dl`y9PcFE?L#a9
zShme3R|Q&+A2`iW>WsTKC(*1HYjoQ{U!PcYp4Kl)FDVh$c@y<3FK#wNP2g%~Xd|&g
z+okQQ&E=)>!YUEBr)*8H0arBTxXd$7US*hpNK10@NZ712uP)wuLUSgP#$`4NVDS9f
zS$W~inCTN%Ow4rhub64-^6apif7=Y(xFN0nSDD#}$YS}50yCX)Fm1$QCYQSqS>69C
zk(;W<N4K)R2FCw0xAH|=f7Oa`sR9W5q8ev@OlI;v{mu%);lERteTAlO%oyjC17=-f
z=uG4EyD^a{8gYjL$Is+`uqe&*{Xxx<^VfTG5<tF>W$r7>k#(8F_^X3P_30-tlCcVU
z_8H^)ht|UG$06ocHiJC(#+Du2PApcmPM_Q7xRf_~zwOD+dK4(;@*Ov`SnnWZ<tK?n
zgl<Ats!5EKdEt^;O(J}#9Ig*TYga#Wu38(bi72N@T9?7j21$###qM<FX#0^HsCy5v
zcc9vN%);S!JfHN@4SjMho36DvUR!LLX`s@kIXR`kf`h>0TCHFQ$q!x8azU?(dZrbq
z%s3f5l}+7ePYLZIVraI0dAuWjhx)WMZKH^nr9%qTc3KzI7mm2M=A^5Zjxp|x)!H7@
z{0!c<angVfg0@fb?UdXp%W8}}4#vZJwmszJ4s^mxw#ayaVhL`K1TO3Het4=Rw+W-`
z{OyWEtyvWufR<(h8Zry`^SHG?dzX~N^UDkuh2oVIo7AXNq1T*Stn!-=Y$P0xJvQe*
z-k$4w+sLbc9&_}<Kdu=|5%`A#g2^^!IX|H|(_|d~k}%!)?NGZmL0~Nbjvljg%YS6C
z`0{bAxQ~Fa`%0zVP-!DxX}<K{sIjbxP4`c#HG>iy&Ydc%eyDt=6<x0~^fQi*TTagV
zJPE7xn%`6!(pLD;j@U@K(r<d4*Q^I0R^`|i(}}A9A1iup=4n5_5|MHmQyf9tNap?1
z11suP6*F?2_6EQ%5~`U4-8s5)a!xzTuX+oNhsBkj!AkD!x1&+Sey7LSi+oNYE$?e`
zY_-$z5@0^%Z%3^CuLMD{S4YWN=p*RX^q_c0iJT@6LH7Ly$nzyP9D?@S$>v&W$5qV)
zoz;h8hXhn?R+$LH!O#%PyMFG9@`ukB@1t_-UFRK^-{pJyz~T<;PTO#~(Ho|o`bd~o
z-VKdry}^>{oCwL5a70ekw{PF%2kE+y(;ymRce+9^?yVu<IJD#`z#k<dCLVlZh0<BW
zEgJZ=Iq1e~-z=tGPFTJRs-YE}oTA^siOqc-YAnX<FU}o+f~)&B{k7v%Q1<#a&^`E(
z=slXjA^60kko3i~?lT~6ufWqZ{MwdvW+ZJt2@^We{+&;IHw%J*v&#y-fD)s+$mk4g
zV5^iV;v5YX#!<$hCkKNR*Y|cjB3CO4P45KfMyg~^vc-?W9Vsuj(=3Vf*&UIN^-&Ht
z<_VTDRi??I*u}h8u+kfUkaHv^SSqKJ9(Da#5?>L06!K2YOICGRC!g3kw1T_s=$>SG
z*AR#tMJB*cxymfj3!2xAun&Deu0%Lo3VtHwx$qMI^ig<SyE<%KGgVFWj{oBoe7f=B
z9jv93ryIxUaO1LIw<PUDb7G_0D$h??mD3jYOM}aw8a_bHopfkMDJoAZ5ge-3R7Fwo
zjj^V%Qb{lq^%oU!yTvP<n5-c^)LszMFIR@veeiEi<TA9cRlS1B8C`lFb~PR<OYDbO
zh0F>2;|4*Wa~f1Df^hnfeO;P}7{vM;<<@Ts7s+M_->i+l?FyNH)}lal=0-C_&j79#
z_b&eOnFM-W5+lOn=>1DN=gFm8cxp^>`uQOMJMPrcESy?&kgP;4KKJ|e-ILZilV)ps
zo7V_Uwnk(R+?VWZ70ao&0wjzJD{PyR)<4!a(_x{<d!t%|`HOHocdnT#?L34RnQ(_C
z7RK`BAiQchZ3j9wpVk>*GL>`))7ooH<}Hxr3Z>6fMx{?kyz;!5T0tYy+5>lgj)lU}
z@#Wqop7h~Y-eX@`N_Y1nTqai@v<M?}F_8_e#?a1#XX$lXHQG@EUy-}Wf*mh%PdXc4
zlig47!_qHNlH73?(1Etuu%sO|Xa~q5iyf{9Yh=4%LlNbhJKq+YRc2BOS80UHl-B5q
z4egCFh87@eW5G_Bg^4u40}SNGLFqs?CcAnl_B@{UV(ncmA-}HL^g6%mH*RF)mXPgg
z#`1HPjo`P*Lg?Cc3(6$~kKThmMBjU5aclLuoqS-KejH=Va6!ieP`S0lGci_ge}zrE
zG`H#ni;{oBkgLBtb<WtlTsT7Oqyv4&Kj!$j9nZCv)%*zH<yBm|cM^IM0G*gwINp~<
z#Z+CPXx~Mt?>az>+`l=ldm86GLl{RIZ}gut?QHQA))zp#qLg@-lt_b*>Td@I1`de-
z6KyF30NT$M@|O0@YYQjF$ephJ#Tr$PXHPGN&a6*PyWBhse<Bc6Tov)f;nde_3Vw?`
zRl7ziUC3E6l17wKcdAH!fb)g=>bux>r_EU*$W4RYRdEKJv`?I78o5#?tqxc^j&o|0
zo1j6=cR!||w6Sd8^zI3?rgGGfB&&EdF7_ds)u*p(;U3PkYLb$Y+N{u}J-{RHnCD-}
z_j|E>O*D&M+)sncwBF7ruGM!{ta&RZ<lgi4gjwt9cH)wf5=;td8i_#lH=cGlJ3E(J
zt@#Q2&Qu!RtrvRl{uq(O3VYH{VM*_9xSSMW_0y`B-bQ)Jt1tO=2&I#c<hD=N*mKTi
zQT<vyv(`6^jrPX2j~(1W>VZbcNw1G^Y^kmT2pDEM<JwW}7X^KyXlpV$xC6BAxYrWl
z;Z+Y=R}!ANlUNQiAcv&<-ud#G-mX;{!w;)}yR-kJqy7IzM=MoI5CkSjD^T1vVCJ*x
ziU)&l6*6TbvW%)+PPx1A)^eq^wBkG7@Z1xyA7<WJ9u!1}goKQC^E<o#9dk^$<6^>C
zNxwyF{~O(H;1g;r$DXWL4^sp>8O3b+ZY}=!5Zn)g9J%Ld<;4OG#$~db-+NUh3sd6r
z?oX`2(e6j3Qh^t+@9%^@f1XW>O-J^(Q=|dK_{jOee<y2><^--xcmBqM*OiMP!!9e}
zIA*tlK3aooR6nzZ7IJ9jsF0I0&&wNMupj;$gOEgzqCQx4CO1)D9MxL*@A8FT>j;d$
z3Gnz~)xXqvGq*GBFZDyS4a#jCs)6({wlS2*@C4}M@Yr8`nU0d=x<bL}RQ5*5IpeP5
z*l0KX_3Lc50|n08{kiJ*`Ut0J{_eV@T&`j)k^66L-v3Vg-pY&XH`j5UFPfT`7Dc=|
z4u{unb&2ZGOFM-Hy=J`Qx&CNzs4S=P#@)MGyQ@eJGc&WuQ}s+)g_cNKS_o(slyJDS
zEPD9#j8ISO1I$JB{+AaOY((W_?V6w{8exr($|*N(Sl5$GycMe5mT&5pS(f*Kg!WY}
z{J=MFt{tp55?Oo=0r|@j0k4@Dxh(L2Hh-E&RUJG7nkm`vYm*DCxT_QI|DK_4eTZ36
z>Azjk2t(z^h=_;;5W=~Phu34QqX4v(@275nGA0WkZ**U*8}prd#X1v8?^iiy)`uG;
zD)je#km4o7JPx~m`#2<U>F7&f43)zVYQZ+oWwXoEfoHB?`XuI^uxqnmDq^0HPV5$N
zRI#ES4#k7H=)8~3#<ia6UmF|6FAde1_{On<?mEo#i1Z|x=XeT$zc{#1%v-cMu8q}^
zQc|)4$!`KE5fR4uY0%x>?K1J@d~3QS99-s~UCc$^`|D<|u(crUE6JvK@}qWxMO@nX
z@m02!kfM-Fpbd6G$JT5+WpTubMBm>*QJ^6shKV}-+fOP0Vl8}#?~A=Tv|kCR?nVoa
z`}QtvQDCJ@`q$^ueh4L?zR95j)BvF`UML>zqO!qbj%8J)gPQ8PuZ`X2h98$YBwH*G
z6lR0WZ>ig|&UHbDcO5B$s;39@^jk))u`IJ2E%ZrXGvrGiH+9qltM)yb@!pfZT=k5g
z?!#R5%opL{tg-79<kpZH=ST1UEHMXzSXt&=>4aUrC6|FsqDxmNSQso$*D5wa(kw3-
z6&mm_f(vr}7QL9~C;V%7z9egE@2(6nu}2q1riyyB?Qcw5OgBe>kiAIBI2;(Mj5#VH
zr}tO6O-5<f4wFi0Bz!9~eYO|6F_z`vWN&<S#1WnVrlA>(Ep0(Hb0U2=TUjlCjyiwn
zUcZ}8#b?oWwKahwsUw+RsjtR)<tNWuai5Ci*||4>^%$Ihp_=jFdKlOn>sLR^^F7{Z
z*#s}S%vGkf_jIr*6?EBa#_tqW>G_+90u-YJV<1O<=U@MK6(sT%((4^>`9y>IUK>2O
zYYD$@p67EV$navVmewPWgU#6t_vaP#X>+zC6@`7prlwQ^c2DV-a-mZD$^5n*6V+7E
z;HgMyG(QEW9z&GGVQ!A*<t5Dz%a)zVt-zSRd%xWGh&;#-T%?X=qf~7*<LAZNUyPsE
z7!#3y8n5*#^IdPiu~Zw`sm<B7N{3j!$TUVk4rY@!m!QQW)$oHkYIV^7kHwy*Zb!#l
zgd>pol9G^^tx>3M<(;>Yb0vSc_Om4O`VSAItE%@PF<<Hl%eP>MHv;kCEgrdF4l^Ev
zWx33@Z4gYK5qpWw`c)m%|L@!gsE%p3%KG|k1m;Ld9x@OLBJL6%nWeyyl3u^QNMYhp
zR|FboVvH6rCNAQ$u7)TTlQK)?7Q#^pQ#<@{Zrmc7j-93cI54)RT3Nr`M%z^m1xR^S
zYK?jeFtSMZdwUe4_1#8GzQ8d*8UAb?`C)8M={3WCQy68oJ8IZ+V%)jcld8rY6$^aX
zH@+avGn_-uW#F3A)c<X9&AO*VW}3K9+n2zLg(R<l4UXGaE5Rv&Tw4{$a-MGHg&aPE
z`SpJY8U?n54zZ|mbYkp*HE1rDKr8a>jz^zP%@ZPeiP2u-Vu;&PACE_C1<^XiXhqbk
zVmfki7I5$@UU;T(vjt6DMk*WKRz!jRBwaMN5Usz92Llb+Fm9FZUlw9%*b^IJXJ|h%
zKpmeTJ;q-Rrw;9?nFCESS3^U?Tpl%cLwh_M69B+-kz+-!LnBLREQ;~b+EAULnnLgS
zuGHB^BFWFgm-B$lmHqnl>nNA?SZx*NcE(CTyj@r6#Jz=@bFFAa-3x~HzFZ`d{~+_c
zqnaBC0?8^jsqa3G{%q5)7)dA2-t?Nh?81DxO+T;4EnP%G^Uh*#i?btAtv*{Zp+|Xx
zVszjlyKWIDc*i*Z(*rpVVa0N$%Hiuq^kZ{Ca`=jjwGG(08^G7bVPBzGXfMzZmum>Z
zE_9E(shs6^a=1BY>i=qZ1G#fczcdS<PD~H)>MaHk2)Rlg?IG^I^3%+qYPa`{d_e54
zkWlTv-Atf@c<zo~L!YX?zRLF4PlkQpFk6v4%4~hMJxM8oioe5o1G~X(LGL80tUFUK
zY?yJlccV*mO@6!{!U8Hc28vC&_r`pRNA8fD=xiZ7CU3_dgHrxBV67Zg7H@Ncc#l_W
zG-EL60fF5h7eU3sUArFiq%*m{R#x0cN-98KcRum9;Z1fYlROQUmUnIQJA<YkAb$V#
z`IT&wI&U2~Y@z~B2azI(z%zxO^BJkIFI;~10Ht_3m*Tkeaqv+UVbF3Qa1?Pzt2L^E
zg+N(dWw}1Gv|pSNbi^bZ?(_`G?=bwiwN#yT9I|J8{m!ER^LM3B$Ls4dqb~iOf;e$t
z<dBHMe^=?opna(!M<tcrM$qbr$Fk#ERN!a~lbj;>QOAd|pb6kD;*w1LhLTrjTH|7G
z8wvotX#=w(cK}gS<~p;+OFl`tsYU)rC_$)dC*}ADcTS?qmw7@9jB9lI2!X_NI9pUM
zl12wMJmd{F8>D57E_UZ542ef~-uD08C)|-Ff!UAT1V<~UimV#%bqyW+4`j8QEp!C@
ziQBwWIY*_R-}2+ksp_(7*nv^HC{T-lMhWd;i7PMx4_%mKm`K&*COlWGXGdRjO(EJ6
z=wnwOO1CpGe<B9+ry2cg!-AGzaul_O($*gBtvN<+Qeb%yBtp?%6xXgT>@Gr)dHr1d
zyP49#m*!RncI$zt=KEY{N+Fk{nVoHby1Lmy_;o(ThY!QERMW@&+6q+P@;*owu(uh2
zIgWF&C?!6lcHNkIppe7`N*8+T`XiUX<go4i@ZB(O<LW1?b`s{z`1-Y;CHLjzMpSG1
zeRfyaF5(b=K7<fBK(B18%nUTiW*gVIXIwZvTz9Jv!D>i&yUew8=vN<4KrIk2>^is4
z8_#owam~P-4AqQ(cQOFS^-u3^2*zPCt@m|E*8|6P7SJ62BM3ndv>`31H7#f&f?6;U
z;3LshA3o`IfPWP9^xg<Z<v3O0`4L^aBL&36?7=uh0>MMODfwH5Fo$xFw{EJ^PJ;pE
zBM)R-0H9(5?X{gp*hYHwkU7mn)B+C$JCVKpkwZnH%YdKPaxd4CORs<bF3)E0Id_>9
z;xGtkMIyK9>XzrFGm1e4IWRWZ`(FY)tOoQ^I0ha8JMVt<ZDkTQLy84BW?o;B@d!$P
zYI*;73(=&xFq{-nzFd3n1%AvbvZls;{8K7T@C3UUJqd|(qt%wcdtm2yJywkza~9?P
zE>DjA1?fZnr6t1+LhoHa*&T7z0QL)}x&kavk^{2(?TH6Fu1SF&&rrE-(#Y@%EoieR
z;L$Vyv5{K^$8OoOHhY+@7PJipy2u3qE^tZqgSrb1%3}dhQ3RxoSv5_}VNWqqdL4jF
zJ<*aH2{mB&jcZ1SRmFGWYk}EuIC*vkLsIxvRciA8WIweg44;26jsl*+AaF^P9LvMF
zH)0q>ZZc#B$!<P;>G2fE5IT4;Fl*5HGC|NDYD5=chk1c<fW>H}j{uc{@qom!DcrAa
z)Mu^EVL3$tQZ070Qs!`ymX-}lVtAb<q+lgyt=2;k!=6rlv#0tb-J;h<kz}tTYS{Dr
zv`;opTx8EUGJkGKKv;m{oBTJ{?>AVL)dH|^jG;C7nbx>jZ4CQwc+9iFZ5z1aw7sCt
zW>`@`1Mv4!Z$fVFEjFXdPeTv6q}Pk<58LpAmaWugj}Nvi0F`lB>|tTk{1_e&0*;$=
zowoE-C22nxJb_>Qg^a3f`f?fDlel4r7`6m3YT0o06!6cpTDfYBb(~PG^Lt};J|KLl
zKDiF?*3w7)7cXA40U|zIRI}=`z5L>krstzFH06x&(wE!6^dU@tJvEhMi-!f@50rFg
zr)HrpL%C-cWd0?f`%*}btHKm3Atc57ks$h+Z0dBfR6c$XRBjDKJTS;vB~^r_&U+^o
z>_$}`8Ijm}K!H(J&yp(GfJ+2a-)p_L3fw4fsY%^nVq#HF4uKzlCoJeVW>gPQ@bXx7
zsnetkn`wP5#yc3m98f&Z*0`nDfBw`1WOYCZrbxa@Ct&yHVC)v+<xAYw7^YB8y-!kf
z{>RR??}~D12XXMPJzBky#&4^mZYrb}xX*a+g**^N%(T$^_uXSVi|=t^%z^ChyN8$^
zdIKee#H_=tXubdb*MEXEmEsrJuhJz;NXhi%)irAF#n^x%JKq(_<MrTNwQ`AACE{AZ
zTT88bZ`RqBaRRe6>WUBtk<G_D&_`u>9P_PlayElSw*lsbbuB6a{VIqE)dNa(&ou3Q
zk13E;bnhWO(hCe>Tw^<`$#)gNxxdLSROBvh3b1zVw6SWwlP}m~qZ;coWR0-<m?J*(
z`x9Atb>Rl2OZaO)E*3hnW;{~``Ab6aC6!E`>=tPvj}&kAl$4OP6Ze`a7^-Ulnjc4&
zwX)!jRk>PS=Xo4rj;g<_^~P)J+bdE!ItK#PrvRk>&?Y{yBm~+h1PHEC@!MQoGp{{8
zT;2rSHN_lbJuTW36BZU0Jc~=xwM4TVe}0k<3JO|5o=L!OU<kO&Undi&sJn3e((hcD
zpbTda!udOp`OoLs&yl(W3NJfxLvXG)toONRRWo=3>o$|_e+qy=q$iMe4Hk0)Y?KOW
zds=yJR$(<@{A>cdwxZfCeaYNm;p4q=|D*!_vSed$BB5cJpbfq6dSF_Q`N2$_Y8$BT
zqMbix!=<C7v|5d=2Y{l53Kap=Pi??96>{zP-L>xdW-sV&8=&-{F09P5v$ViirS}Yp
zT&x!6`DFcmJ~3fQ#cdl4P*S-|$0B(Ae+MOh+{LjL!!0RhpQiy?L;~!23m85NLL6=N
zkRuxU1lwpKc6LPoY^SdA*$>}UKR>EdXwXU|c|0LRNkzrJR=X8hdoY(mN<*_EltYy^
zr+MN!*AerAfI2_l4GXIhE^jk7*%)eQu9f|p5XqT>+U8l<xS#7bOO`Xhw(4fPAWL_1
zhSzol(CFE>R%tvV^+JY}r@HElOCZSeHnM2GuV^~m?=Uaq`SVxFBYpst#j&a;0*X8o
z`er9nE(#<IglSIFE-b%#tE%h=Y~L2-n#i-<X_M+04qYzcXA99kC2cLxLssdnm@o#w
z65hF)TItGrtH^Bcoux>>Gjd#C3Ne8~2+^<OQoQ(%&;6XF-vA7&a<{kW47>Lqu~78(
zh1~*6-!dzr%h3;;2`BSrF&mn-AAm7mP~Bn*?H8e;O3(4gLBUA40?!U@$}|ACmbW1N
z`Pu_iTAyka6WCqA<X})bw<DQ@iRJhoZ-llOH-g9rWAG({(jxfKYZoM-{?`+`(!^^p
zehL@>m$F`D$+A|ZA*!_AW6eYua`<_sD|H0FB#BeMhvWi`TkSfOp|V~UQu1CaPb0(K
zXm6Y4;!*jT_k?kRN^js7t^bxpTq#gPo=)cazi?hs#}@?gp67hL<C#ww)PhcCMwHpG
zu13;|ict82h?#ngZVjD{mA&e(kWAo3oNB_Hi2rQYf36urbU3zAV>>v!nm)wG7<Vz#
z5#e!R&~nL5=<y1T-_o(Ru>G;HzkYbcH3we^uU~|o$Uom&*aL=Jx1@M4g@st)M{_o(
z8#SwpA6BXp8%4Ay2ut<gn8IaEQ+gDGCfHWUAWL~UPk=3n%o#4V2)lp(zR;nTIUq!I
zM>!AQ-cU{vaHCc|%RoqNl79+K>emEuqKBQ*>y;cgLRE}O9EBZF&pK6@H}}bhd^Xt|
z)@F{F8ruHR;>X4W;Ju*ipkjDXilZ2CdmMH9ssnzKnEnNpTX(LD&nR;yV3IutTP(K?
zK1YL4o^awdaP2V27mu7>zU$rp#om|4L%qKJpK20mq*Ow-7AjlzeM_Z6QcCs~vM))N
zVaO;I*-|0<u7t90GtwqxUj~Cw$U4>;`|`U!&erpNI_LE~fBs&t=Rc=&j%Gfe`@Zh$
zdT+O^IV|EF49&XmT~SFofND2Y6kuTm$^Lh&6`uJ)hYcPf`ihV2Ni{9|P|DV0V_4qL
zOZGjTX9AZ7<9F<xd%jn@Cz~PT7p>$Upu@ZD&AL2gnmsC23uLBmFr$s|iX}6?`Mf|=
zJ9PaPs)EI5FgP5H2RbI6Q=g(t;BM7`WLWvqSVh)fEus0eyG&xEt-#l7W~xr!KK0vj
z(T+(M#k|0A@|`jN6Kvix{~hf3^Q=_qt=oEUkp5}nXYQqMM|Q<_(?7Nl+xYDW4U~NE
zmGo(F_eP<ENE~)n9~b-j+6O-|r+%c9x5Q=LIQEN`qcY9xh?X4v{gZ6s&p!QHgJ4)X
zr0q)jCXiFVxAMOO=6`l?zinLQJ<nqk|MV-T_g;m-TXJ!t!YN#+ii<=1rEpRs3;`go
zB0c=N8zzAuI=!+;>*K6E^NWh?(=XJ^ZVP)alHIr0BCz|NcGp$uNe&9iM9?*4m)Pn7
zr@Drx_>9xjs|;6ZfB*IW@l(|ql@+P_q((jS;J0UL>OR~u2_G*JFG@46$Ym?VJxFda
zu3*4<U?nenegy4LN4a-7m|*qJ#VHBBiaDgQ2kCvD!s*qNd?rkc>uK6A5K`ucddN}3
z1I6*BD81Jtb$9W;j7wS1I#1*WMdSB-Pt26D6m7k$cXZd&MDLX3i++24@xcG60fnZ$
zT`3tkUarwZ6}OI!K2HSt7qiG&*CwwXI2t8AwzxoALluq(fiOHqNc<OF2|Z7*^u}4o
zT!W{`s@{VN7TwtUAP@w-x4KW5Ed<Ft3Md_sJMn6d)`66n&Be6le|wLGr>@rc$mr+R
zn7gv}T~<}ya3R+%1cfpx&9-4SqWzG<^$uU??WsalWMh9U|Eh@HRq@}`@a^VG2vWxk
znV0()py{h%n{MN(wj#b2*lE6eOOf8E)W6{uu+twa9ZbM(jJ^+kU)b0pzX~;R)akaz
zYllA3;&+|jiPGM{y+8QxviZ|b?*dU{8!RL*7gEfv8FAbaE}P12Niru4E#quTedNsp
z2AH0_ICP=+Id5HM^8H^_;NO4MUGi2zGM9k-_Db0{R<q@u^){tA)9oIl54{ziy*uk|
z#<s>bF+t&^unf5Wa&u1dT-`34(TqHSi_FXZZ+FZSSn9e7ls)S8CeO;}<m&|rKhLE+
z)3nN7Q#Wh<*L_u}-D~vqQe?sS6B4@S$M&buyc-fX^_H}3Vl-oX`fk^3+&lwrR6G2a
z9IDSQ!FaX0#T_t_rKa+@J$}nFf9;04<I=Ulc9(wtF=eadPj*{MeMraBe^r=%pGO_H
zY*wIbja9a}`}FJXA+RZt+IJ`zZ(T}>Lsd-lYJAE3WnC{a-YD1qdLoT9D<-+QqSc<a
zGSIl3mcXfN*h-`j_FIUUC}%I)sG~I8f}YOV9B9qG^^58Ek3Ag{jY<qM4n4GH;vy(}
z5PMfw*i(@{>s+Vn=6d_FJ+ViOt2=i_^Az>%{so~2ze1&Y*PAUdtt=4aqN$}iX?dU@
zJKaT#FYH!b5G3#5zjf=C%ZjCuteyYT_K(E4AohRWrd8@HcJpF(-G?f1zPJ<Cd!$#z
zm^gnUri|3QIHGbq@QvG9IeJ`LvUZroF9UJj1>9wl8~t-pe7&FHG*TAMQ}p)0{1ZDp
ziD#Dxx{5KE(s2K{Du3JPdbxM>nW#Nux^dHdZR~~(T)w^fVsxi}Y(rI0ENA1(@TSB~
zkJmz-SJqO8O#UH?tSED1)>`B_WP^a+0=9D+1CHG08WQ!-<4efXjnK6}U{jquhU*Oq
zhHNfh-(TRKuy<Aw3?6f5z5Nb|;2NXPGG+OP&w-TG<;(E9zWDg6*Vgk(9K@sO=nTAd
z-x=oLX&~jdaK9QS+7X{{Rv4eO{AJB^+=8HKWP^1?5!bu8690>V;LkIg42}*K)ZCow
zQ`#@TXvo2JDra4-1&hf``CmA%NmuYLLMGe_r#bdN&Yj=?@!)!NP}Mra&rhF4-u`dT
z!1yi?420g^>iXQjTzY5LXEw3*CLFf<obNBU`tKcqHy9_*F?W&4I&BYrwT@Jttb?$c
z|M$rLD%=0}$kx~F|E;qB>_wOVzu1_Lm8d-;CW4}(qCrb~nFf~t@gEt|paf!<W~)rS
zR|Y;$_WEu=`}r|j_u}w>cCo$Z5U!U{zAnQ;RnV4H|2a$XZaE}Qf@)@B!t#~Asjcnn
zv998abuse%fMbWfdGkhhW^8pa9(0}00T7aTPJDGqU}3sOgcJJ`FM4N0*L}Qruxl>@
zODZUIWs)yeF3b#qFN<^Mu3ZNKsS9@=ZgOWo_1_BMqn!XiAhR0eGyX3=;1zOHiUy+k
z2x_<$%%y17`_5-4Gjqt%ZOc=<ikm9{wsMbDaL-W|o(sx6@>X?HTWR5hob%AtOl1%;
zeGcT{2g)*MG5tSVl8{}<88NsXhWS4~BebSQ<z2=ib_p5iCMG3y$KC;DQd8nd#zHSS
z`(Q|?Bu68LUsGJVacMy%#|k1Vd!>6McyQ=HPqW^e$a!a)fv`t#Vyt-mOB`qK1W1z^
za7#<_FTN820ambTi1(=+)Ro__4Jx`mSvdzh@>f5GzZ$s1Li3@91TKeUm#yA#nXp1^
z(oEY{kZ7s^xVs;&f`5iACLk0Jdao`c+6ljz4<9}NzARDbvZK&_76zyVAY9j{aPKv*
z8EFZ#`dDK~FA)Nw?dkPT{%8EQvDsrTjTo;|o3#~9vZEPy9qyenIxY{a$PwUvX6FYI
zE4e&0!FChZaD*-R?~_Z#A6Wn^=hqtw78G$}%fG1AR)tlV;kA^PCmr#^l09bv5kXwv
z?Y2J{tEqi4g(lE%ID7_~Liu#HfS7%kOtAC_$akpY-6VJ>VJ0e@6Mzb}U<2CzYpmju
zpR`-A&la=!$!|^oZgxAqF5Hk^zKVH57q&Lvx19lvrn$%mufW?45xw#G3(&N~q6&89
z>DH~U#4uD#M4gByrC~BIXZB}g6Q*TcK0e$r{h7nTO(DFYZmO@cMneSOKa~T@K2Q~D
zz+?YOsOZyz9Q%vz>txFRyob2Bya?drq1Ft&x%uc!!$K*wNG|P8IceK=9_uu{rN$Hu
zR-ICz+g)YI+aKG>g5nl4d+0pT)7=+HSeZ3MwkdoLajVS*_TAQAyyn0KGsG5wiZAi_
z5-%?=0|EZLB*$&)JIZvBvN4~-<+-4KS&R!c<LZOXgi^H!OhI0z>?33%Ag6pok$sG~
za1m3J)#Vv&Q+w<O(W%ItsB&KJO@AG}s0%)b&PaV-LG!=bQUL)0VV(IlHGmO!#a^P=
z8zvmzT<Ap%0*v$wmwW#Xb=Np0?AQ3jq_9&s2o_oT{49cJ9+0<#`}e=M<NpDeOm*$p
z_!!Bb&75_9EVmvZm}aw3L|B?Upr{N10Tthn0d0Z=4Bk#>El*#BbiG>{AVN3{6q3I~
ziCg_ki_50(tAHFT>!Vi91F`Vf>9Af_G?&-K0r>jKS1WKP*@x)IpZT%;-6Xy|jerIR
z0Ae`^jhaz8_rKt%^We{SgpiEYpj3ZajH1V7zwO+@HP3~@wy}w=^Ddc%Jv;L?UW<T|
zNLba;wEsJ|8nc2IH@2;LDXs40sZ(d&+={q<<UjWJ-<dBy58UY?KE6}qgeCjow#=yh
z>Sr~hlF_Hj?rxP$_qJ#$S3Gk|_w^N>wk%@-tES{BcR6k48%m~Q*W$B5wGvg>`KgPP
zaJ&a8)}Sl<l4V?4h7N;=0~E%^ve?2nKo-mXU<a2DF=TmD8`am>IzEV}NRR#8-?cP(
zKjMoBUJn*<8)3ki7CEXSC>27fnm&@dGZJC9;&m`DTHGQ?GvZi9i7jw9Poy18GGapf
zM>|{c5nUf}VamMCU*N~<tEU8)PQt?5O*`cIPhqIP`Se3JaWs$Hw0D5}MmF)Ak4bCE
z`{`rnSwCDnO<Nd@3$F^}=l7c4C82iRxA(}y{T&Mai&`j<C^6@A6r~-2Q$fykTyVtu
zE?gctzt&O8;+FAwCAhD=`SpIQknfkB?q_{tSBngLf70x+qxp}cMp+4(##JHi54Y~{
zkCMIpQuCxY?~WZ>FEnP%*5b(DJ7OirhR3jV9TpSy7}?kr1skvIeB$sJt-Jn-q)pow
z5auBT<B6dIUb4lv)cEt=4V#|Og;Jag1dkkfE0QZr3lL}FKlc>Kpo7NG&*g%2M*UoK
zrlIsO)G`U1HbEtm^7JI>sa64Nw{Q1ZlQqJHb&@>oUc!v@X$yt79O@HcLG0z&+e$7I
zk%31)c<EzL`?>tp|M*<r`Nqegw7y{cIjSN6YLDq}ZRH*m$2NV7s@@7;JITHaaYX~G
znTps&>V+*?zNA!+B=59xAhFr(i10fFMDWxn4zcx0OPW;1?rncB{{Q&t8KgYRs7_XU
z@5$ZbG*c_B0jw={C#nLwFXa^^o(4mHCg$9NMC+H(11x^w@JlZg52r>YgP<og>h-k&
zVEyz=JSh2JraFCHU|SrhEDmHBCi3&39>Cj7TamceTQ=OHEl-hPld`>H*_5F6z@M&y
z1r1$MzVleS4sa&}Q76=9%9p1D5WxYF>vi&0+$a^uls#yh@SF1>4l=9cbk&p-0P;fN
z@!!Ys;hh^e<_k(~M(xia2ack$m{5%zeHJN6TX(6(boEJFs*q99d4#Ha@tnu);XS&)
z9_?Sa?K<%k-?SC!sZ6Z2O{A8!eGnNPNYPd-eBDnncU9`V+NwH9Z3jeQ@TvAiJD~L>
zm=!(e9mzMlf$wmtIut(NnRt{vL}qa)>A;6xqOoht+`!ZHg{}hV!p;J_*v&UV17hs}
zNsZ-s;<eS~g~W-`UdP4Zw3;w&B{o~8Rx)N(NMsw=z6AW^iQ>W7ikqg2F+4?dW86?b
z$)3ZPCCajiD`uNiC(Yy@tNlrpF(2N8eEX&U^6d}MdqEdbvs=$7v@KO}w*5vEJjI4Q
zRE63>iNAOLfBoqh4FB-@&w5PfeDmIF`EcrGTI^zOMcID(@xH^C%%kiI7-*{=KulDF
z=*9Te!0r)ERE5A`DB7>W6qfZp{5^F_!fZ%4)S!m+8$q(C5V-xk$D416WR}yVowr>O
zk#qrN|Df}BBWOgqPlNLDctG_*PcGVN3V*EI@j98l#|=*1e(5~(ZH5k%($AI?-)DZ*
z28<o)HoiQWPj|V1WG~;?(@tq9x^<(mw^W`P<tpj+H|Tl(^+u^lyE$@O_j*U>;bms<
zT%Fl7Eye{h4pNizt+woQy!)6#T3A9zb&{C@{U00P&wo@&0ppNKuc{;E77g0JaL^CA
z`MiPk^U&|Z3uy=8((#fEUEo`d&h-FIh><=lF<<CHG3dBe$!R_q<N6$^|KxnH?qDcv
zUx2nO3+bwUCSVRbYL3gU1jH;grfZADyysz*6YS9~*m<aT=0CnhCf-4dji4j=v|gB%
z&R?hpPnHFnr1evW)f{?Uwn2WiJQKTAOJ&35mlr<C(_zk0U}s-QJI6_u>c4Tap0|6I
z+k08ZYhi$OLZOKZN83BH^qvzm1wyd!ZbuztRdvKCyq-8C*>d}gZyX|u0^f*R@T^_i
zYyHS_X<Aq7WJYY|ViM_1$IU2r{2`m)OvrJE4jm$3wRK+#sycS7<GDswN8S?W#>lI)
z(v3C`O*n2V_Sev)JG_S7;}y@i!VaD#d#{;=oeGj4eVyA6bog9gvturM8oScs(18xP
z64Eowig^(PkhJ`PoM}*!yG>kkjl`@p-9FH*>cIrnrqlsOlyal-qCO^5!#6v3qsr&M
z2Mnw(P0VS%u;MYbSe@?+HiyoSCNv02q;Qb&w-Zmn)>Qo~QOCUWAo|ZN0G0UDn{9hZ
z<Also2&TvN&Mtq+6Ab1lvTp`<(>&bR<xGkDqP{g!s?vDrxvGvI_$A&$uY18q$00CO
z$Kml*0ik)vmNRJ|wpS0wKBZ0Pc3;8uZr+Omr9$B2y`sncm^hEZ_jGxG`@|+!D1~|k
zKFy$7d4SPr?Twy2L16-M*A8@C$2I6L6N3ftv^GP#u<VvuI9xi3Hw8?+7E;QnO&SO*
z6e(f##4bp%u-nCOLNpE5OS#zinLF?9Zb)FxUxap2gdj}0bm>EoYmd7{`h!dIp?(bc
z{9UjzHAdPpZK9fwCKV(AQyr?PZNt0*D~vV2_3p~|PXPllu05fk0$plLxu%Kk;%BGs
z$bskRme@#`1<lS`q#a=cJ#4n(6<H``Cw&8lg{5V@^;>Cl;~)VQ2BL_CvO}h^p}@|t
z7@GDz{C=A^7dAZ~57A;aQXA^LJ*ha?)i=7i-IzdVyM3nK9Nl4`-+H;CQNLA^UJ=YG
zBA)CD7G0Z17jFNEv^bk>f=6Vr<LM2fw!XccVL5cU-KxG->{(h;CyafA<i}+iqq1BY
zI2NFO&Ccp&A9_TGcYj5EWn14pU9!s889Z(84I@F>oTnomW1mvOM40-_(e&~nKlybe
z)%r)2Xsy3VC1!SPII0AOCNY<>E2f4yXLW}R>h-$g%+z$5m!IjG?7-WXsFf(bDxDcx
z()A85@};W|R$g^0JOh2IO#0tda@WhdXirji;hjRHS?r4Cj(l#;h9ZjOkeC>$Gc70L
z3OnuE>Sb3~CcHf^t&Fu`{dcK4W}NtkA^tv(qg6JCXK857u_BI*g#yKM!fT7R9w(on
zDi{Unv$((8q))>WuN#)7eGd@9@LISgbcWq}vt=N+UP+#7Pb@f$_F;w+67J@dZllD|
zK(-MiJ*-veO2!gL^=Y-z<i~|+OUFNCu+O*lJZ|R1Nn1J-US3SYC}Kx#(E2v-6!k4H
zr{((6u}Quobi0r`QlFZ)NF5xxq^H&ky|-5JS6vp%?1Bm&Z$~al<2-nbSkMAD#Vp@U
zg{pH^xj&Q*vwPEQo&AB`vOv1p)+6V_hmV~a*>$YTVkfO|y`7A!`9zaZY$#6$Ch4=)
z8-n-RDw}r&Z;>D+LBBqiXyPFxbJWUMZFup}!>d<`F-J%|ZZMa5N*}n>p@^Y|Ae?*#
z13svPuDDV?Zl5E}LDg@reK<bDXWbB$u4jDbQYSv4wB|_tXm)9jzvl`Z7w-5+TMBt&
zII499wd8z8dP~G!s?+GRq?>4rQo~G(ORCv3<M9*QSGvP&A8y5Egn51IgXv+i_LZqp
zlgOqNam(y+L)*9aCtRO;y;aSws4#iYfJ-}2E%E26@Y}}w!dEwuU6k#*g&1&y7R*L#
zSr}TY9wh-01nbX&l*3K2k#WUvGN(p3AQ%<`g{)CgzlZ7|v9b|s^`O_nvpG$h6@4xI
zCcS->i%I-9drs;MJGRp(Crz;cNZD1kx8vnrvYkxB%iZ>ADS!7j{}m^iHs;xjB2sEk
z?o~L7%Bta`&)T{m`8Bfi9VuRGwC%~!ORqk9pFMlFjA$^zEQmjq*4^f7{-`)~7o*hk
zlg1xjU~&@${hWP!*?((`I@VVi%t|qrY>mgW*wE{4K?m7rXI5cs&*dv{W-G>w);=y@
zrDYFmj^Dq*?KOXmoY(0)>9d7vsN1OVyk)Ady)Rt|%}+y4ZIUmv?qVaHm-mf71hStN
ztd0M67EK%V(rpRRvNQ?4raMnYv!~^n=E5D6VdvzIWXxbd^A)}Z8zn)+BsteBhOb#f
z{DhF6LxFYhyuJ2<3+M*2gO=b7NjVv?$0g^Uxv+1q)X*zw0~+JLio162107FUx*4hE
zMQ$6wuGE^5s+|ldXAHBSRUivsyCOBj2wD<?eyQukICknCG2+8nU5B2Mc`&A(0ku+-
zK^P$p0H)q3sTdLA6F`VL00@+*ZRxm0agC~=Y4LDt9~n;boYAaOzk+6ha+AJr^WSxV
z=Y0Ccir`_}Kh}Z5d|~0LkhyPTRUHu!xTRRS^bOWasDi8Qa&b`8^nI4*hM+^_-@@(b
z*q=2Twuh$i-laiAB*T}pX`!_HoW?&C2>Sj~mBe>0Qr9MPuH4j@Z93rQLxsAqY%@Ws
zqC@|Hl$1Q(iXM2CaMFas@v}d3GL6nIT*&app|SielpDc{QXM}mB*r6d1nubl;p~^r
zT;Mk;F_yM;p;Of(j0*yc4RY1()K1b><P(RIg5-{7+G$IL&c2X$pEi35s6|dywOJRy
zEc{^Wv#JY^fg5MkzF>T_@~&ZA`)Df=*uJ;%yc^#KW7qCOumjxrat}sd_FZ|f&*`+K
zr_$z%{BR*kt?`FB9o5x_&-|A2<E0Z#<E`cUv&tEyO1q+brN2?=1Wn4W0OI425enf8
z*nyJKteL=Oksj(Ov7Y$6rW%oIfJ`FcWGuiyi4|05Xsw3A_jjq5YbI-JpO%7GN8=+X
zDJFvEj-U^kHtz|>ON7s;-RL7jw;Z>u?DRA7rn)BlTc7CW1wJ{4TKL87YJ)WYOzqs}
zSjC-axCD}_c<adgiL~lnDB?MO`{IG;^UXb7{Ni+TYm1}VbE&Nm+^o>#vDmR;%Rc6~
z$2@M)IM%;w#m_&T=h;}i&3@2Hf1m=ylE2}4p{Jd}lm~59w2p8CEY!pe*5r#G*%W+F
z7iKim<ciqHLB`pJSIw4ph4!kTdk!}aJ7eX?i;^shgk&sF8+jz^<1zWHIc@P#vreyl
zXJ16W9vtcml0PTsGB%`jvC!UF|IJk&Pnay6NOpyr^;ojKp-x%RzHsh-A0%>c@_3=X
zhnz!8dMJ@J#UJPSoo2=rA!wpi7~YX?cN)H}NegoP!Cnb0j0J~{JHF$y-eM&qnu*jC
zi0jMCa?$y=1oeQoN5iAVlhxGoZMrYzk|h8SiA)t&lVkKgOtSln)T=r?rhumIjNZ#1
zoj1mBM%n#P<kRy=UIR1eMZX8lXk7M{x5r^L*&ZonXVC95G}XxAh*262m!K8}aY)xO
zdZ^>W@9?rat(LDXDLX_RU}d-T><g4GGwI$`OL*ls;7YQSo-m3Oz2Qf^T|9ei-?r=w
zqVIO4p(x_z=_B;^g-5QuntQ|_J7g?C%rxZh6o0;WFz0f($9OS+QN($CVpe$q`ei&F
z+J0_=OfGcEUj@h%Yp3%pT_xW{9Ta%GCEe>f6SE3SCY`e`Veob!JsB!%?DZ+&=SYOX
z9fig|IfcwG+GxkPh)~O7#Kf}_GsGlyf{R8tNI!mdiv6$YGXBbXBU+9$qLa%YixzDz
zr*sE#P;;YUe?e%;dA8+^GYtu9DPReh8pg#r{J0$qe}~%2(naN{9N$&rE2S=WhP1Pa
z-ciyHTx(^H?QgD`+%-`)%-^KyDDY1-!Tp0F0l&ElKiBC=MOD-&(F^}Lbs>@|Rj)Nd
z_SSLb)CW-!!y6R7l>jtb+n`Xgk3~~MCRqM^TAY`Ev~rP9s(MqzurV>F)x++61fd|x
zfzVN?z{2+!nRZ24(rH?Qmtoupk6_ST`jI;-{q2Tp)4gmh?Khz_qybAS+#OLC;UFVF
zhDyF@GL^t0tNljQn!~xgiB0pEsM88S6=y75$P%Da4bBILos)a2>qJEHnf|DrOhB1<
zr>_ioMNF2<TSXG2q~BfVyTVz#9V4i<SN!J2#ZXc_$sNv*N@~~b;PR!;F57@;>Gt%|
zTZ6YvqfGK|z>Rebb>CaHj>+D{B`^#su27o~3^Gc+;D|gkm*hIpBibx**-<Lno?ynj
zRPVjYLZ+KJ6qH;!2{O+|+N0xX!_Q=#7Aj7$IBu^cL)+PFmVhZC#>4(Qa1&RRuwYRa
z&DM;)UD$z*`BG_o{-m*Yw_SQV5ezGjJ+p@;55}lwH)a*W$L_z8`k*j^!MsxQi^5F;
zb*H%L@#!oL=&b?)1`vmpAN+~hY1&!g`HeTvq?8k*;9DNmMKi+ES`*y09J^x<ezR%5
zXlRLuRXv)cxIU@%IU8O;%ay}O@PgmKEf*}fhb8Jj(<Ss|>ZfwEtL!dA)#onm71Akh
zDcknml_84*HpHyJVe;q2$N(?l6z_|5vEt;VBNFi`8D0S^d5$-hEk5JWqALrxRu|iY
zXWBl|1sk#~zC68YrK@RmB`Ia$$*rc^#(MSc;o4>fZ1Wan!()I}&ua=))X%4C$Hfls
z|K7Z%&<=dMqAOiry5k08J%p9;*lTj^lUhkL5p^=2c2!D!xi$ZI$=K1PccTtLLB>tF
z+C%E3i|CH8QPv&ivPvVlo-2<{l}8KXmP+R~QhQVq(6dTGJ<W|C@|a-t3EGe%H-7HM
z#HNm=<Ky`K*cj`>%`o0sf=3I>-9K9U8#;$?YiS9`>ucxde)tgD296wm#p@=%zi3}(
zlu6n}AwDIODGI^pcC93XZ_X6ks@oJCQGT-(_8M|@6&w;SCWa=i-FJE(F&kwYYVV?x
z#@{RrJLJikkKVllB^?|dnAdX5TW;_kodrcS&&xn*^4%teIYr_D35Ag?5;n&Em}x!b
z#D;IqxZaAWC*x8Gs$W`kkmP`$jEG%e8Lwm%DGRZ6afqf<>ZX-s+s#X~9{(J~$<fS_
z${wvH)erKnO+P?Xe6C<vbmhBBi)@BTcG>jVCU=49#VF?w)m8{5$?hHm*$yI^LJgz-
z9wsBBW~T4y&)Hza0`P0AOIDczGCI0<JB3ZNNsAtb<{7<~=cf`Vt)qE8=e427!6{FD
zWa)XGx@EN?hqkOGd4g>u$GHgpN41)R^s#53{<Nw-@h~r6t@rA+Q2q`66&ctr!!Ctx
zq1CydRjusGW7fyCcRkil^PV}0O=Vg36o<a2V1{WfptUnn#qpT-Ou$4T<?w;|4z%iI
zJo_)qXb6~f_@GY{szgIvn-H-B75qt_dL)C#?Gcyl?c4-SKj03lxID&o7!)wvtvbnS
zyvusKR0LND(j8vM-5}@y`0*B410_Pi)kE_`Exq#s*<}|N=O(yq&l$vtnfpgX$>!8b
zkq*WP%S_`Kg_)a^tl#MOxDRs5QXACNDE4ZJ?ss1F_FeB@=pyoc6y|$3B;}r+UmJZT
zVfLz8i&Vtjgb1zx-!Q)s%r@WPyRDBFslx}PyByUl7f+ynL~U<M*Et}XaEg4eWP9q|
zeurp>6S!)%?TQEaK8|tN*jHBp?1uzK5N3_^cIppdTG~;w%_b?uZx5Grt8T|Gj{~9>
z<17nvcu^VPLkU*YsZRjczJB`j>AlY<C8KZG$zI3M(1F%qaf}FYN$-}5n9LmmFsxui
zpf*rh7Bu@<yN=7wapz<Qo;F<94DRir9g^7J(15VM-yU##W~Qn;vVpNZTj<Ie7ql4u
zLIA^2k6<OHI@Z@~b8x{FayN7PnDIsMfR>#vwM+jpn%(W^FG$L_;RjoQswE5HQwI#~
z@-L+;wue}*_By{DNey=tHNF0*jEOJGwf_s;1EdjtFDyc(D1z(VC+b;YfStnNtB5!&
z9@B1P#+IjvN2H;?09=g?8<`OD2pTRJk}CcH-N$}7P6|o8yzMrkdnAwcTs7I}+I8zX
z#(m}mbuN41`eS(mxL)H_l=>s_pBwP6e>C7)SB&Icn1v|y)4OdH3Q`Rvj~*tNXWYp7
z>e1dcQ92;E7saMXDQsAcZOyuwo~ghgT-?92v0jNX2~VY(urzLyF@+d6SXst`h_$SQ
zf%K#xe<JPVWbWn|rTM}r2ftm<U~XHCe6f(|;9s1mzNN4hRq+W`{>jr_pGkh~&AcXp
zPp)AtW1R-Deiq8Xd2xYs%B7;Jj-uMV{vy8r&=KBMNnm)4v3dL$b3@azP>%Cfh_l=>
zkEsV=^Wx2~Vbvj1Hfn}Wle3pTqIUP`pOntMlI`-Sg#?$}+_0>0?>uHPzR{sZD$`Ko
zmF~-(YmF;yCEaURtz0V$NSHT*%{=qKV;%$o*VZv+`V*_^7kI1ttb?s(D0$6h&^Qou
zf)%D8Mnflr>=rli_nZ!xi+j*v0$1I)u|IF_wQ$@EBxFRa1Fn{UnWPKke97B{w7Qos
zK4<r8V|I2trpT1G?eHl(HTNwQEHN6hd>0+dceb)%i&cCHLWTvJ5{BnGO+BYhiqNwe
zMfi1SZP&g~?zPgJo=g)e>=L6MdZerBXsjKuM`(YzJZKR*u07z~UwKl}Iz+Cq7A`Da
zGm%i?l%$TdYS3-l%gmlKm>Wwh=E6y{P^JZr()T2&Z4o(d2*_vYkuw@I{dd2J#6@uR
z52QxfpOtY)oYQnS@@BEul?`k-HpTm3-%bO=S91^K)c|_NgURx8ClL_c^0`lOupQ0w
z=<$R|ll-u{BvX0@Fa5I?L!`p&h%~)}F+@(b-6&~ojfdX1_(m2}c;^6Ft1;GGrX>X{
zu`eoSsyZz>;1E724~wek^DO&&L_d6e1BY_~YMrdnn(OGyJ{b!GhDO!mz;$_}Tc372
z0WeRpE(5tn?qhbz>I|Domc>Hj+83+L9+NY*)yybqJW&JYf$!cKBZHwotbBXC0C@Ep
z?RELeygcT|Q>6ZJ?Qg#J=bz%=ZEj+4OB2^3i0?qLzHCvQgjcLCTsoH1;QsvFe0yE8
z;!Eq^MotM7D4EUFCQm(*x8uVnm&`nyy`x*7Uh<m5p-cxeHy-2sw&UKL?#(vZCpr)4
zIG*0qp5J^k7ySrRQJ1Igh~94frj_$72m3M<4$hJdX%#xgCi+aBeX|dD95|lQ@Gf~a
zD`prjx^shf-mkp2plx}nld*92bIdUFZmw2yOBLC9LaU1+w{xklV&rI%bKS`p;bu6N
z8|zGUR43D7F=wfa!jao_$U}`Hp+n(kcA|H?uW03I4K!xq{qwDwPf4h7@7qaxzbE?K
zsLq6le2mwQQ*kZ{ruQ1s7(5|L<cL}y#7?-FZC`YW)JdV^C~=`21%LYSmZ5ug>~(D+
zE_`Y&9vx_$y5fD6@{c)|jr(5$g=Kl^Pi~+mtJyle!tWacuF}fwCuR0s?RRtpyQJTH
zcrd6>LBfFh^27zSLVb)pk;wZA-0fKH!shy(#MoV|%bvMnppfZmt&gROALgXiGy>K#
zXHx3zF>*1B>Y&Dni|d9fW3SBrH;v8jt=ujjm7Ms(ajz1*-=H{He$R5Dw0FsM7u`yl
z_@SN?HVK^y)8@{mVObfsq>ou2@C#Q-)g>(}nJ~9oO1{KJ%c)86+PdCnS83yMa@-60
zi983gQu|njMJ~FS9%u6=7rryWuBqC4ZHfHl{B6tkD!x5eN{12yJTn)s7|-1*BZSJP
zTRwCO(~^2*)C9n>_&C~#b=PiPt=7J`etP^`FLreX0k2mB>uaaAcIza}dZ%Xh6PnM-
zL$ck)<GJMkZa2NXQF*>J))yoE{1bCoq$N=&5}?7-l39ZZSTOlY_OgxVLy6=QBwa4b
zVv0YQ$M0W$R!3`#8Lr}wdkW}W`&`QA%+Ww=N{66~pm9md(zNf={6w!rq$h)l+C~H@
zM3BUyh^I8joO-CVus^H<&*m_A8(^0`o@K=acrfN6XfT$I`{vh(9hmpHPGIz~Q&#l2
z$|L{wa^E)BaoZPtqx0B%X#NvosO*}PZGp-mvUtC<ml<Ae4ypo(N)7U$=Hk5);B4H!
zxvoTOZ<%{!UQusPkK0m@8u_Uw|M}?pvhmUTUY(_`;fKD-&EK}146G)B>i3xfy^{0L
zdD*_l;>Y<T{66McL<3^e8>w_oms{Y4Eq%}7x6RhuOW5fJGp@m5JUyHiSB;#Wh^|I6
zMo#jY_FH)CC4tD!#qI+}eILZI*oVy-a93eI?ohwi+3jarzzZ~xWXsiCjtxCGyVWUl
zmHe;D7e_LjKpU`h%4VXqGvJOsTBqW)akyV1*{v_|LS})4sw1|=@r|@SCDIz!drBu=
zj1^FUkLH{Pgg^EqyO5wO6BX$iDHygvKeRrdC+OE(d!jT50Zrzz2oC_vC$P_JN$B>|
zq#LE4-B|*DN3e3=ZB0wbP7WG%xEYJjywB%v*>G%Dl4x`QAmHh&?Vythil`<h<D)sj
zXf~yOwe$wOG}p$cj+b<Jz9ClE#GVWoN8R6(kBmD((2&3))i+&)x45~3IE<?B4VEUl
zYb&ofH#U^XTL$+7G*wLMr>&-%e$4sLY5A@x&wOFt?^}91ZcDk0_ov-@^RefMK)yBB
z_d7ov5$%fIT~RMBpuucZ=nb4M?S0Rpf&5}Spo4uen=CC*okx6r-^+z!|DYW?FSv2|
zUWLF7dZS?O^^IK5=V?oR$4+gXjFh*$tLb5`C53W$+HNI29NJnJ_Ieozuah3Kt3ye_
zWpE4BLKWX!phg;NzwPn%@#;KQOA1;}M%RyL9>EkJaA7PRoAGyVCYltevB;y@>04vN
zyS@P#@Z2KS{j=S4kVQ^>ro;8LraY^Qvfvtz*%J!j&Xw72S5wod%g`Z<=$W{irz^(z
zX#ysEGZQikEE_v!pJZ2_3f6JFQeYctIoZW2VM|Wa<}R%Apv-RE%^qp4HhDAA*vNb<
z4sv`>o(kG$CEYD>adU;h_r(n2dn3Gsr+n0@lOCF6yTb0{->hOTsZD`!N#n+m;>Z)e
zT@@xdlqZmJeHf0Xv`oLVEBkc-oV6nr&@kjSFa(kT?B{YHc&2xJrWCz}(>a7yF#S@-
zbJD&AIfM?^hQ7BHZrlLC<tZqRD#J@bZxJw_##sP^aU=N|u$Bc?9?OM(W8JESt{_&i
zXUYD_6LDA$q08m%5wU>6nr|;=xvM--Vr&H#rkgkGaM(9?3CpY7-_GU9V@HfzkgYBT
zAmc<E6uPe@p%r<(wVQ~R246z=VU3pU{mE5!eXNl|i~M{R|HaO$#6LtmxnCh*LvOSl
z-hR$@TtIQC?#&ONle(VD-xeYJoWRYZ5NOv`Bszf6;`u5aXI!_oI#>R5=7oCDsX7~Q
zwG3)WR)Bl;IwEx&`*I-ovC)I>I^7gtCk!rqrFwB0R08`E<3#91Awo(^*%B-tWNJ$2
z*5BmNoR@LJ^KIK_pq)s^^8K;VsiS1g&+423AZ>VVjsNlEvZWrv(tj}@COmUFCcQ(g
zMuFCHkwv%;Wv<qop#wfXmb$PydKR8Qqj6Bd9M9!{(dOy1U&1bnUGtr?(~>5$Lgu9i
zW*f^@2-r!EmJTPz0}d&iht?U4EY;b4Yo&I;<8yboZg#B}wH;C%xW$@gNK|Gnao$I|
z0bdr}up+07eX~kNUfmmQn)5Ls`_9}MYT&(z*|NPB03PxuVLY{|fjYj7SvhBM%+!QI
zXb|WJ`dSQd=?_vpKuhzzd3dSXxSY`Dj`L-Zy_X898@*;fJ4oSmuPl99X{@iOsw)RH
z#lf^(36d%fLok<XD&KA_U-4R@5!=UPXYg^yHyM_U6t-(KN`LmgDcH{39LGJF9lRpr
zU~D^CB$*KBDT)loSns(A$J|0I$o-qkkBWWEV($dw0t-r8#!l`4E^aEaZf8@ZkkgCa
zg2*)Ih14iXo97P7-Q~MMj75o(n(qkApVm6@7h(N(<GB9Q;f+2-@;=VeWD9O`aKWV?
zy#Ff*B+)s?!JHjM^u31hdbHf&-4L&OCb$(87YBT??1IEwFQGWod*t#$P9B|W5-!1I
zLC0KouSr_KR_-lx0&c#i1_cUu=3&$Bac4TIA6`HSQDb6gs&rzr#ttPs*gy9TSjBCb
z(%nd{KnS6JsV>J4=;16erxHW^;zLfwsp=yQR0vsm9DP~D%v=)Xz}I;@xdCpv(C;CV
zjR+P^irm!j1iBQ;tved{%Wx~q!S0g-&T{z3ar*!)76Q@Kv(&v4)F}_>I%urkIoC#7
zUcNmsA!IxOIdD&E#{)H_>9fAwE)^*lgPrfW02|-IvaF6}9~`(Rf4=o-vQ%Z#S8>TF
zZsoTS9=8DoTz#Z?<=kB8%JKl{4jvay<Tal=qrK8Q81?K3eU|*q*yp>+dP~yD1)G7U
zlZG?o_|I$Tr*{+|f$BQuX1?8L^wt4-t^n7ei&nn9;y1t2V|yKx=cR);1dg#8c?h?e
ze4senyEkh|r_f@V;OwqB4Ea_c1_2qf@0aQ@w|V)ki$z;ORO;%xyY1lrzJY00e^6jY
z^80a!KDI64@vx|CV9j@0qdGTdXM~ZT0nI45b9{Omj(_CZ8f<nn#e)wGW3qZb0gvDX
zpDcsRb(lciqf78>0*;9B@WiNtFj-vb?!n!Z7{!t3rUKyhk5)yS%b)$gp+kC>&OZk^
zHV;yXB0Gkq-!-vG>~pG>B;I>|t&sQC125O&VY-StvFYS`&_>McVcnNTOZVY%d%D%`
zr<UfUC*Eh2yc;Ay4#B+`rBZE{mWDaV5x5TBf&Q{XA+Y*~6e+%O4wqp`0d@O*$$Cwx
zwV)SnAU}Nk*NMD<0qp}Pk2yC=q_O#vC$nj)?{J{5<`+RHPQJZI`J)|i5%GD;p!^WK
z_5FlsMavhfS~SZ7XhJ^S>)T&h8d&lgvR_KIdTdxw;n0T)wZy(wee^Yu17tM1@2j!^
zJQKa9)d9z53MlRphLJPSfz-W&k6xHha9rxXiK%17=4qfOmO8b9d&O@5&@?rC<?sIW
zHG;GxR5`~5$$Wo!zLXSFD;4n@9+9XSN6(dL$0=RM9N(I+E~x-|iR;Jb6LeCyq<k@d
zz^9p{8mwJt-|cyE#NEdJ%R*<<%ZOO_PgMWWsFr&Q195B1Y1vu=B~0DHP1|7mq<oE2
zCQFZk>gp(TFL~Lumo>915+@RR9ih%uZ`!WFY<sTM{(bp%+<3w;Et&)h7EelAw39y)
z21Ag_jCkkNza%Mf?FhRwwxp-`Dh3q}8Xr`Y8VzQGM+;8=+1>Yo&4F%0rhX{Yz#o1A
zDIYfDn9uddW7lxmLa#2wuJ6*s*+cCR%w$?TUNVZSHNk>Rx@Y3~m(YQh^z!Xg*B9~;
zB8*j#ZPLXzai?X1erE5jVi+8bH}lyvjE)3K_w0RfBE}vfP5?=27!5N?>r%~T#9--}
zf)!^YhCJSJehu`rg1p1!0TJ(8Q75y>gVDEx;7Kfc^q`1X%HqU^nftp<Id=b~((~8i
znHP=8EKOl}ILfkmLSre{^AmgUtKrLmTm5Z2Mj`|aX@lzFS-z?vjm=(+lnH%`wO{Aa
zSG@C)_uQ{X4-MM7G}Ln#6xdp2B#6y-;23ZZR$UltpC<Fpv&Ff;covanbtv+{RC;d#
zetEj)x}3pe?Hi|ovo8$`v$AVFzv)96>a$^#i{z>>hhu3@OYNV^w@SRz)@^L%QhDFD
zIGCPHPX4&8_dPH-<?=|Ya405fxrgh;+b2@%T>bQ4T)lI7zWto?mCo*bN&%N(4O}rI
zfFF64kqnB73R;>madHkQHeT@BpSFpG@-2T6<P|yz(xqiEA6?N5ZUt-wOWLJ>>i#m^
zk;H7Z+tw321N{JGZI!A)*uBjYY6qs@z#1}nxGlx{n7B@eWUIXyJIXZ2?2+x;PkRzR
zSv#)4TcgiUBTWW-FRPhA@72)H?$X+jA#Vf}j}x@L#acb1h^8Kn-@VrLC)fMGn{QDS
zcf4zs7HtA+a#})iOuUo)K<%XNmynbyR3kOxOy8)2aePy;nUpp03`V4O>oOyPr~8nf
zyQdkB6+&@C!Fhg<P!=yeOQZ8n<PGDQ|AX%(oE)z8TDhQetcU;!Ifzxl!61_vwLP@q
zCu{Lte&%J53PkEx<c@keYoo&e&qdYJ<5d*@;VKCBw3E!)=0)fLxTyHMzrg;qK<k!z
zF6j=lu=(_>p!9C&hK6Q--b}=~q<n?qFm(n;+Or!)eAHboou3o}qv)sbYo;jWQeJv{
z^MCRl`c#9A*(mucu9uyvFyHH|ap&?#U?@zBMo5pEH@Lm$@f-1*@Tf~&GFx6<s;L_n
zko*nlH<mhgUIKBEx!CXyBZt*75PPm}j(9Pf=nVM9gU*?^-$13c1Fz4zFE4FIoy+}T
zd-P>Rpf-dhMxuCMZcKbBm3n8iO$^eF8_a%8we}QV>e_(_!TQlPwwP0{;oLMiz*Ej$
z)Ks0ECafCt<s7BW`OM<>NDgV4uS}n7Ddv*I>K9mT??5tN9Cqs{;*j7Sgo`CRr?^l1
z8iUSkQ?g#RNddbE5wZXw2PA;l%{m_FPKr%ecjV;W?L-EFDVB%>*?INkw-1!>o*=Q~
z-tzOF{f=lcIo3rIda*o3T<R-Jm)3&NOpB;@kXI}MSOou~XS1}<lWHh;{T@yikI~1P
zwKW`G*>+AjAXm+iv=jR7BaX9H`isuF>F1Qz0h7Y&e;BgvstkbF(u7BKvdNEGG9J@m
z9_}8jskO^Q!}-M)hg0ptVu1K;raJ2rjcx~0DI}t>lsTjWYd<~1><K{|i3wkN9YK)h
zPxnyZLwxX}9eicWi_OC;M<klL(a>x2Z?zM-@`k77gF_;%gaQigz%jJ4&O;iIhM^a=
z6<dw(%`LuX6xoH2`4j38RGsuMLLUBMq%Ci}d#j}ZkO=qTl<;JrmvxeA^0n017u$n+
znP~?fA_2{iDGA{Cfj6|zu2z00v~?n&b41kRPN9*2AkwXgR_<dd79>R+M#c9*u;-zl
zO{~kv!!}%3Ch2AIxFyzYNQ_Os8C)vFf+bj0rX8IDO}RD49nZ;J4hRfL7e)VC>d13m
z7R(u}D$Je`xtO5-*!naTBCYpOcKm>Dd^i3`!Zk8t@{l6g_TBfA6f6Xi;%SK<@r3kQ
zc)a{0?z1qK??AVvg5Y9K!<;?Yp*c0s6V^N7zHP~HYESV+s8yyON|&jAb`a@g1~Fd=
zwNc>w8Ux8x!mKXxpw~uC*Pg%`EuA+6#iRx~P5@qF-u<J+J@3Iw(9j%{C?yOU7TB^`
z6X`gKa14F9)geI#ou>J2HRdwl_1k2K=DJrqv(!9x!|$0(28T?+%i|g=_&u#P`Y_U{
zDOMcXy4e;4+^;TYzL@elxYdeZeo!2Z8*LUtMB?sR&FHq#T(62`P-TRYxbIM8hT?tA
zV3G`NZvN>8I+eHd?e7Y^O$}Ya4fjldKFgal9PR`;&JNo%_F<`wiQc6t>^rf9NNXi|
z0^miy-V-dSLiLb;@(ZUggGY>!hkg}019c<=PM!mHnVsy|n-89L#aRbSbe>o-FF(-`
z4h0~JT<8voD|;yU{9y@KV2Vu=d!=WD=2U`BY{k+8s)8mETQyKCDx3WHz9i96rt}<a
zH$Tu68e4{EJeuT&w9cjUro~_#`T{b47TMkC{L#R#>5falLLJ7`siXhILnU58jvj=}
zy*uwwfc~@(m7PB7P*5po?X}W$K9S6^NTpXCq$-96sMgnmjIfqbJlw?{gKrwW>{vAL
z+_1mXCYvS+O_DK`M0tQ5s5K%$rQb+byyTnJ2SS?dTB+YC@YwHl=JP^{tGf*wq#8bd
znuwb3>iFZurbjU$JVnob_L9F70UcgJD^mL12H=L#8)yDWK?P|8qM+#)f$Nw+tI-eg
zkja>G0GXa>Np*ZAJ|8`sh3mD5xpO&vt_?;S;4JQ^s~tO*fsYO5l$RRLvZ=3zSgAJ-
z>=Yd=fNq2W-QAQs2EKt6AW>D{ck9HP4!wF8j=VuC+*Y;l964&-M>7k7?LOLhqio!@
zCEm|Ea>AF6EIGDMa%fc&!m6xw%}CJ7@xYOO%d+c_Ue7tb+wS3rv2mqMaBru$TghLF
zD$8j=RZa3Lm!CX&(ja5E7ecIA<pS9wt+bbPYUm4g-(Fwu6*ofcu#oic1e$tv;Zxa_
zah}s>%qB>o;>nhIqfIkz(7&aOWO@Vn%aDDBeX*^#ME<pDxsq7C@e2`kOP&+uwmX*b
z8KW(C_}S00pw<9)GAm!14KOmx5%C>@EQ13bmOqIRRX|gHp}oX#Cs-xy>;KJ4KMjsu
zw+*O@B#clN97W&*Fh;bo4|)XHKc3sA>B8T}^9@nxNPRM81$@o-hXY~Zre`@N06d6i
zAy>*)(!2u<a%{3rW|nej83KU0i9R!$evqtt8WNSoA`fL)f!vJ`!2<imKz;7*KJ|$;
z1q5TEeRfGb^Aw2wM&uL)ReGr~pYPgF+^h(Ux6@}fi}~klm)zm7O#x+uPSS}@-*te5
zd<4N%`w<Oj=Hgkb_VC*-_rVw}MQ1mDYNbJKdljsn!@y2?9WTAkgwt!GNsqWaE6^$*
zx&;E{Q*{LJ!uZcR#SMEXJ6%iFiKD&&#Au$2sA$>1g8*+VwL7heqyBW0zNTJ{48gKL
z_D*2AUQ|i!^B8+O-J~IM{}h^2P8SBKJ=WSS$F9EnZ5UMEmd>xvyF<T+QEZC+>OKE$
z3we?HVi`g(`Ip5Wp3`LRQa|-mE9z5(=#%Nz>k%YSEc}x$2&Om{0@#N|mUxP0C3I7L
z8HzrCee`3gxc`a9^&hF1BD3Z|1T>x5Z2tj{wr7nPt;3Q|vVg>$|4RM-!cm{^{9gHW
zQB6Jxu99OIEId%BytdpRrg^0;=v*l>psCd~QjRI&(u__OkeDUQvq)5x7^m)W6rU%z
zct!n}m4<=HySHsYr!g)V3Yww(w+O#z7&LrF#_2_lb<1rs7x0-Fo}frB50)&0xpF`y
z83u_1k#MWp0)<}DA*m<a#RE9_FzSjGZiu1qS~h;xKhwChE$iqtD~!5!(Y9_T771;c
z?4V;6%@Kqx6sb`Up~kE4^QVT#s0QGyBt5!0l^=E9#?p)B6-|rfQdO(u>2Pe<t;+ia
zs+kwjI+eu=S>-Pa1iGi-Lo!kd75y+Eu`tM@TZwr(w9<<An2Q+BR~~ppEz@!dM8vEt
z!fM$kUC6kUh2uK!7rJ)*V3cMEp8`!;X_%i$)Ef^=6MSka`{FEx<ApZq0veINs?7|0
zyx8!UNbEPC>#PmsS|HqsR{KM^L#8ge&b^Sdxt^MIza2pg%U2g|Y-ghvdbAT3gp6s1
zV`=v}`jo}@*ghPt51t`bdPNrsOSyHuXwXhzd!zi*wEhzTfwa)NH+|CUr)lC|E3e63
z;}boM4IZ2BOSLb_V6@dIC_{=|cw*9=C$%RSzujztv3Sm(dgoQb3I1aVxndmlCBuB8
z6-^D(uANr=q8qMRH74FChB?H@-8tS2f`!w7^qS|^N`*m_a|Uv>k2fE*Ml3EVaF0Pk
zBh1?1#xY1&)cF8`z{w!n3{BEvzNi_Y&!jYe^(DZ(5x%{&jY|Mv`_Gn?K^FU$1=|~M
zsr0LGj#TNWbDF!7^sMU}S&bZhENss?E`aFcM4Gg!9irpFHd_N~Y!d3d+{c~ZLIOSA
zmPV7eq&%wwn4n?z6vgw1wYukRW1qvucP>t{{UK@}?}_)(a=a2qIUkth=P~<Sh%XiQ
z*-VrJ82t=6%;e|t3%jA7Jet*vwmzMv?r7{6OYEGvm3X@aC5FEdPf8$VctMQoB*rCp
zq`TXm2t36gjoEgzs``W?56L|Ubd-&AUw|XwMNC5xjB&u#T#EG=m(6B%l#dZI#nLW0
zMA>ye@4P|n@tCm7n7WWT4khNLer_rN4Dvl(o{g_AWt<PLe2LL(Gw&Z^Pp<JFL7QeP
zV>F+jci&mjD$p7ZTKc16YseHYe7}cG69}u>Xal#zXW+%YZQF662gsaxTKDpCS{?1`
zMBBJ+CnJHNOpCVc%zKI4l_1X#xpLoWRL<6<!Wh%+JDrAJIlLVn$FnbWk_rh9zP_<G
zKog{F<5p6Tsm>U^c!Y`#vpozbNr}P?42vEnq&&SzvrURP{^o0c=klwFGNP1IbMF*N
zaL-#+G9{+0=o797R<=23OnXf0yYEXwlp40JaoolwOmwQJw3meP*evoh*sPO&+7*BA
zk3W7odg?A$MGZlHQfxaeipzN5?k1)$Rcy%>%II|KcD+rvt8m|nw_S^M{}DO;kwv@T
zjJxapE;wB_O=HHMY!)<T#bzd)Xtr^F(~)6%r}ffxOiIu`R@;`VcM{*^#$5KTMMOB6
z&)p*h_r_7GL8Us10W^N?kzeL*NrjoO;!Y4LpN21jxC9U036RL9C~D_0(DpUI!+<P8
zHemRqa{IpQ44>gDS(ELA^sg`jl&sRB#WP`eP+^DrE{1K{wATPeJq?0{z8UZ(HZXQ)
z7z#gtY(jr89o~)!LF2fE&*5{Q5<&8G$Ov!JOs(0mcqklX{SW;b!i)_iWt70hGEt+;
zz-oQ!sT6%yO^b+C`!PQ+AC2<8&#WP6?(D;#g<D6juG#%zi7Rsd8a`{I3eFY2f10A8
zHuPu0ZFU>!aibk~026%ZM{tt0d~+La;&5ue_TZ$jRJiISXnm?dR3eyyer@fz0QzzU
zn!O>o#1vH!WeIVUXMcsiWef8VH0S$2FZW15La{8wa_$VOH@g=b2S%J)v*)kVz|NZ<
zed{w@ib)V1A>V>}by6;jrzmR~Ki4xu&<#B*7-y>{8SzSWr0L!;ZSSbmsEe7n<-`Og
zDBp%C>?8^zxm{VUu>tv8`c9~s10k<;=_5@#)VzekZhLtyhYJTHlQ{P-KO>OGJAp0l
zhZzlO)Dt+_43Lb0wrRvHCkvuIJpbNgNwp`BsB_7)uVcpom|bRValI~Vkxx+-;*Hl0
z{=%XDixHOrN1FMU=pP@?-^Wo$ylRT-2v9e2gM(dw3<yFiplw-P3?kt7lA3Aw5F3%t
z!%UrOQ{Vv|wj)FCfLVZ0!DOugG)!RA`!W!2Dh$1Pc0G^&K<NY_j8Z@n{&o;LyhqWF
z?-^2<hBDUB(p@}==>Gkkrvnd>ta_MnF3w)z>hc4Ow?^M0W&j@tmrwL@#8@#KS*!wc
zoD5wLf}xUgnqFEueCW(|lS(jFl$Lny2?a7Ox4J<BY+hkN5}k$MjpKc`A3#|rfIyAF
z)=?hmZ=&d^nQzDG!Q-wL4J+{9h9gm0M3|yMqo0B?Z8t}tkRGwT@G(t4L_TgBTLOcC
zSY)j<B_-VCsGN7=OsDkQmw@N^pZ_V<G5$IVI?Jr?zs#He5~mS@#A(2&l;tCZj<90R
z6{JHKW8t&IjmL%yd&+G)#5zFKjI}dxhd*SQ-Ou$xrXl{C4!SL6>uc-nACS|-2zajx
zFbd3Hz+HO>8clXx#5&ej)4+-_k+@;P=UvYrOQ70xbvnF37m0ecbf~KGGqQuR1+150
zKzJQAjFCQvmOPxP+Gq9wI=6nrONKT|C1p52VB#$6ol@Px`P8;?K+L`|@np{weuA)c
zAxry1Cq{Uzs4u7|uQOl{k;O-41IccDx95ZxtkQnO?Wlld3`_@4bfbKEu*`RQ#EkKA
zSEMv{ZDlTz*R|Wv8FN?}ypRJhQfUa>%UVjq6X2c8JAIHql>^0aDyZ4yv+{iJCUOxN
z$V`v}8|;)%YHS)nIoTi6H!ep#vPpz6pGew;G1eiH8~n`L<0k@uW4tM&_an?En7T;y
zIpOPdMm1aDgC9B!thxIe%?K{Wu}Yb}z@O~G2bqg|g7!O6Te;y*+DvQ%`2qYliLQZx
zi#XjJyGJ9ks{j;+fWY-whiwX1+QgleLLd33vx@`5zQmup5?z;d>+-d~jNAVNv_a|r
zf`oj5N+L@-HIEh1L@(7zq8+W{??9H0$#xR^n>MR%)zJV}ky$T3%?O@Od7DJl@NC|W
zY4*G=1Bg(i<>f_l*ajDX_!F7LgBbJ+xYZ9KYA}=<c_82J*)>J>bC=5Dh8rWLr7>|3
z1(jIFmqOQqgu@{A)hDy4SW9ln)30k<`;wH|zZ*d^KI`Gu^TXt|RoBMz4lS&xokF=~
zoy6Dr2N1iWf<*Ky5&?2ht=e8kvhq>jo`#_sCi8r|PL5nIR;>4kjbb>>FPDpBr32>O
zfo$&;8~sd^mg_L5^(^LFcy|ZEn!=1Wi+B!&Z^~nxbM}yPk=FGHMI01JQgx3zkSv(S
z*d<yG1JIhT{F&5jM%tpG&X$`H0)(WgAh!>F1#!|+qg|s5es(n2>x^2qDD27F;hQ5g
z6*9}BF4}kwu1qQ8nxvI<B%fiif`(u&wne1y;3%7N8po&iKa<+=n#c|n?rQ74u-4OD
z@_g1}!C$gRP^-||%tGj)(>e~nJ76MU^eVF%Rbp-Mk=!=`;y<SiZvF?fX}uMF4aW_r
zn~=N$B+j0YI|Q2}Y{!99X8WEtAF~7k<+$R^$a^5LtcyWYgdI&lBKdaZ{zfEUS6UpC
z|M_?8UPi=sB!~3{#q~cJfwDh>Ywge_k0Zte&*BM%W)p%2X=WVk+IW*t-<p;lALN1&
zGA14ApFbUaM=QJ%tg!UA;T-<-nK8)1C|>{bf%p&;&L*3T?3ams@<164K#8BtH#d;|
z{_sFQbOzMgHUicIiM+`U+zMX~OzlSA0kki<<ezp9&-spZOUZ-3yv;uYB!8<9)_>wb
z!uIsO^UT9<7lhGeHs%IW-!rmGs)^67QeZty!|gfqH%ohQjQ!xtr{?P*fr<W??v6UV
z<#M0p__+r=T8a#rD{uZX!Twt-0f{M-XZN8dS~J3t+qYbUVnFjT4H|~|PO+Dou?qSw
zU{GohWZy_UCbJ27k$35drga<tI&qP|7$_A4X2blC$69!&lK?TPA%q`Uwhf{J5HmF(
zsb7h)=ggs8G{N(Ygw%Y?X(X8e;$x0e)>9Ea9flXYH&|}z@!yF@;QHi2T%V@vKsMla
zgZ~zJv;dJuWjnX5--!eFi!sIA03IN-3=Z%n=!F`JPN0#T5MbU;_`QQ`RJgZB^BXWx
z;Crix(mSpQ`6Yc-`Z@Vig?Ig{OaHIFI&=+gir)2c%F52Mc7VE0gU99KInYBPRYt8Z
zU)8}nkW10PzLX+`oQ?<5Izav1k6f$)px8ktg~0WXvlTwh=cGENpOYR{c-H|>*8k1N
zaa1hcNjp0l>-PWH`|7YNv#xLA00)s)KtdW(X({QH4pHgul9cX4OM`?UDS}E#H*%0}
zY3W9~yS{y#C+2;>nR({>_q(2d)EO^1_u2Q_Yp=c5FMf3^>FYqrTw*!=z;*~=zYyto
z%Q$ls00!QG{T>q3dFNNUxc~uwd3WgdsRzlg^Ve(mt;PMfUPG)lf9lLXwE!^ShY&J=
zYJTT+^y9JMC;%;T6y@%Kw&UWfYNneY%oypA3%>@w;`~AU``}|l|8+oF{_O(_4G%IJ
zXAQVwx^^Bwrb;8#5h#|tL$LY=Kr+uy_|}bB-D1ScPN41a{+}=V|8aF$L0?qxJEDqp
z15`i6WEV_?I49nf34k3Y=>y1sj3D}64p`jz)gHxTZam}}4^;jA_Y<K?N2GL{xWAo7
zh}H2X1?NTpqYePy<G}uTjeZNXyji&{hoS+8QX13?_2~r_<Fdf>VY9c@3h`-vOlVbC
zrkL#;;Jg2OXNlaw1p8X2?(cuJ9iG69l28Ti@6*vggT!y|7D6OP@o&fGJ!snY3gg5d
z%W^9II_SFpb}0(@;OCD!kN#N6ln@a^Sl}A`57mJGkT8K##i@5>$sa43E=nLyn<kKq
z!tO(_*1_ak=XNRiJYUl5@U$Z>&v#z-s<p{S^nans27UfTBu8|o$11ViH090n9n}@*
zL&s&79il3WDNW$A6Mv#4BNKY8DMtbOF#59$!6;zoQNF4JehPAb0^8`6{B1gK!j1+{
zEDG(2jrZ|>waRCX=ecqGwWC#p=%TsaQaUv`@DSO)`kiM!<d0t9um9&qj+L)X7B@#Y
zdYYhF{<<A`;_da@9mnT8)!wNDKgv`Myn2=JCS7hQ|Dm971{<1n|Bo$z6F@x4A?m#3
zLy(K_U0tN)s~eSjv*J!?)|8o>3yGNi4$<?!&PpV|8@H2+cX;kx_PEb*Cn*-26n&+`
zf$@CQQn90G0AsCGls_=LLnIJ+#B262Ter~wSGRI9iDl;V(k|OkQ4h$qv$y;*)8!+^
zLYsn${0A5p<;nEfzw4;~-;Y2*az2IrR>=0f?WO_`Ys^T5LevbVJ7lIr_x2|Zead~H
zocmYL@#<gC0pNZfBlF-ubjzvSDOx!J#<?!@x?DF3EAc!O|KftBd<UXh7}l|axh|Gc
z^K6jd$H2i^DkHSvkmyDB>pMEqK!iw)FL?v&_r=%0Ha8|>_e54WRWjvJRq=Im3Brna
z1pU`%`OKqcH7R)n8OW}?UwaIGe^}Ml_$OQj#FBhu^ZPj6n5T+wG4r|ExbeOJ?688;
ztQJ6FV7&yRUUR88mwy-rRAP<jshf;iE?tILFjkG*aZ7nV+lLc;AES=PA#fk{TXE^#
zN_OV8FS&jcTMX+z`V&6dZ+JW-zfX?boo&Jw-@C#}3zxBFjkWd{j?fF=*Xvi^=b6fu
zSQ};evenq*jSm@p-~GGv_Pa#qhgBtNHud7S2P)!9C+vGv51W9O_v^xWu887ry`jf9
z3I_?%D=q&bHN1%u$-=8TLT|XPpjRn>Eey30pRIAyN}g`CO4j|)D-!hXpDU8rqD=_V
zyOwIBE(}~TZkpX!Yc=lNuq&G7YZy*=VG_0c;)7yD)4FK$gwNF<X2)OOOyn*Uu~YlJ
zrx^!VUWQL5bN9$*+o#Tm&+_?U`%aY9VEWpcz-9w^!I+`>eW%bLrbaxxFVtoe)?mwo
zi|*WB{<hHa&>PoX3yW({H-)MyL6{}7Ln$m@yJ|?}L~l(k=1EEd$RYtv-^9xP6>I<F
zNI^VV^jqJcuf$AI9er}%awJHj^xU>o0}f%aGv8+Dect%wccQ~9KWfo90mT*%*zDU>
zHTnNh&j0i0iF~+aC*E6w3V1v%BoMW*$IIf2*k3O#2#!x_p@mOoSZ}?pf8NIS=g;9Q
zA_V1}&^E3O`g)AC71%%vn;n*ynpIFRV+rH~i!wyp<^6|?GK(k!UY3B}1HjNn4@wwi
zie@cy6hFD6S62K*d{8M@pfsd4I=#TBwtH!#?~cm4nCnLHS3!xWsud7H36vB&P(Vz)
zM497Lk2|p<M5!zy&JXY4`5I!)DH!s5;@$raaFNp+&$&`Pw)-WrpQaMTU9y~dEn$ky
zrVKH~JYj(9wj=U{P|XI}ALa=kXw{tQuWz~x0I9V;8fPii7lQi~$Dvw}4R#{Fwk+n-
z)08F>K(7}Lvi>|}XUL;*B28O6#w;I7epZ#CKq<1^n^E8{GR$Ef?D@PCNC+v~5pP8Q
z!&jwzgaA&A8iNq*7PWKIC>3JZ_qi-RwoQ)*MW!jAcf%^R=a0_>r%n;=Ylo0;1$X}9
zX#D{-_w|Tdqe&Si_@u_q5TSrO>)fB#`0NmU+O?G6(~HYKw~e|$RRRcW8Exm)A3hHr
z^=we06JR8m6l1`LO_s)!m^AUj&dpPB(&7lwqbl8ue6G{WUnRT#`NSIu<-@Iz;QH&N
znUR+k1G7HpO{o^7L(DOJTv)=8!diK}izrm3-|?D$m#C<*AmW|Bm}@@5sMaLfRwHd`
zWDRGO@STrfZuXbK=kDkFQ;XODHsicg?(yE6Qca%PuAB-Ch@roSsr<8ALx$W?ZzR^|
zKDR(r))#$*`aSN0k52ZItivy-O;a~+!E2Dq-~UB7NQ6oaMe#(7_$?!n?(kwGnYAWO
z`RD69M18{yi~9~x*vkHQgNc8C+VB3<9wWk51yT+G|3uaA^2D^{8J4(jZd2P@Ev2vZ
zDSLfM{R<Bts4*+vO`i$+@goJxgm$8GxopeZ{5h_`w5P=}|HrfcQCk0Ys{7FpL4%Th
z0du6%sU9ledA`LAD5{+D$6zQ8@-zMX&wTUmxA3n&MWcd>0*B>u%_@3b8m8|kyXcM~
z1wiMl$C!Qn9iic08{@Ss6^SZ1bpb*9;*Gii%3RlIv+>l~j0aRnh|B1Y{>49*C4&iK
z`J6RI!75&QiU!A5OAR)w3j0HpiXRFQqRI~Y6(a?Tdk&lEF)!8)OIjgKqbZ|*E-eYV
z7!@ePd7(ob$UEa)ve`LqJv#_B)n3RSEE(uLh#;!m!f^!1pptJj@$1`O_^9ozA79uR
z&iHbKSNnSZDi-nZ7}*aA_P;(@&ea4vQTOn8)UV?sDQF+QL;u6&zU7B#Y3P(Amd?iM
zuc8jg?*g>-)2`b>nE$YTqq6!{>x1O|-=Fl~b^31<{CBrt{Wll<H)mG-Hwym$KRFp|
zemNu8y?5vr#aO!jZh-ZNC0Bb4qS$Ep@mp>4S9Of9$Q9PD7kC#zWH!-2nt|Q>IYM=2
zT-E#=AlMs&ImWaNQ1nn70Mhtk6D_dubfE5uz^l$~4iafuQ-gV$?b{8?70I_>O8RAK
z*Z`6oAStsEb6XCxUUHx*A9?{$Xo*0OQHB&Ka?2dSdYB>_!4%jS5WRObz-)Yt;@VXl
zM~_LPL;{SUZ|fNXI6yXls_*i#au6!ZaXAGe{Io&4aH4r#fUy5~5+E_}%zOq!HUxZg
z{!qJtvB*b!$st7pnC&e-(FdS%4vPUgTLXkyWc|_jLmn)arVshL^_pqG5^;N`1ECrN
zkk4`e9D_h+>b|w5TRQb%m^l(un=k@X7`NXFPn^HFgn<sgHHsu51UIO0GxLt1d)Y0`
z?O8Q#`#=PmbDAa1bv|?tI28Yw>H%$qQ@|@+1d7D*kNO0jIZru_h9|;rcAymkrY+F>
z)2a&vB9T<K^@pl^cVr)PPwc}SGvDlVtInaErSZ)L5dH$NzjOm2^F`q5f>S=I%!>jP
zds7gg(_M;j(Dg?MJMX%)=piJ0IL!MqPG}~8w7yYWWW=aj%-co)ucQZnlp5O{pffMs
zlg#Dy^7)>eKCq)z0dvojCt#fv0pOmvXk|~*?UL+4;zV}|9;2!sg2Igu8wQd*@raQ|
zmfl8(sVe}#EmB^e1XqSA@JtPzdvK*J-5#%7z1rmVIs=9-AHo3SftVWQlE4dSEz^&-
zv6N-qB<tKimJdo%wP2_Og+2W5t}l?iojnFV;C1ic7jfOxed>So>J%V?jLY3O?>rNa
zbZ+O~u}XaZ0iCWO{-`XceoYmC%u)kJHEz673%QS2N9r!ro{ify8G44_XKkNDwRxmH
zMDoETGSFH}sNfY)<7_~RztTmZ`Uc0F5hfBqtcQQ5jC5<@p336445jNTfVZ7bQPBWQ
zR6t_6n7O`8KZaml>f~qgOeLb?@QUCF?1&(c6P}b<OK3pW-i@y7QHGlCb<pQ`Qm}$2
zR6dY{8Kc9s;V@g}3O&^kG$1<V_@qJl*tU{3lDFyj7KV!fknBhVOq|CnZM`~D7P^Tm
z+iwS~^-Pl5!0n{sAGeeLxPv9}1jfj!rY8rYQz#yksO<o@3+KJ4;tHOPSLr3#7n;Og
ziw<lDmtYFqiICRj$27r#bUti;)8huO#`DTRpnf$fZBmKbt$|kefrRA1XXJE*BDu!|
zKnC`gzt18;@a3xkg<?MME8r*B>*AItHUnRXE+Eu<hf*z{6)Xb1)7lW`=G8y+mRx|0
zlU?Wi+;)KLS+{EV*Vy;P^A8*ta4z5X2IgL!QqPrAN1mh30W%)sw?{T#fx`JI02*#Q
zko-!nI%41ho3-DPJ<Jk7bzeHP{V3~%v}bL!e>j8T*7|%W<-MM%L;B6=j~LtXy~MED
zP^FYt*UkX?)Mwl$cpT0uosN`K@4HUS2ynxWk5{wfB(4RMdW*wYv&nVefK_%FOTD2H
zczzmV<NHgT;l^Xm{9AuIH9&OV<3%*Uj4wzf5cdg#sgFEW_rzW1mno~a>zXR;fqnPx
z=9h_Q$pce<faWjIAU`;f%>Q6v6fB2>rv_q3hQK1<VfDWgi=_=D-|QD~DER2odBci-
zq!GWvGVmk}IEYNeEDew%(&z%bU3}pvN+7*l_v0Lxc(hgK0eG@osm^H`HG@1MkAu(k
z0nqnbGG)=KU~<p}!1KqpZVLUiF19n=$^Eb17M!I6=BKUB=0qjyVU0ZW;Yhia+RWbM
z0^y<Nu@e}~f6z56xr4xCP7rz7#vif)S&$h%r*r@-c{Y+~a;kA7U%j}=WfJ%zB`y&V
z_UVF<maRhzm!Xd?x)zcyp9=3Q@V&ArxwaXxIt9R6%4(Q=Zz52^c<fy;H#2Y0`|8RW
zF$(QdzE&V19}skgpLUk$rhPT*bP#^v@PlEI!qMlz@$MzN9?g#TK~)MXvitQGhaPFf
zr|Q$JC%>VOC2jcE|J*JV(fNR4{SHmsGxmQg^?k?e?wP(pmgSCGNwy%wQk~_FHhT9}
zFu)-3bf_t&a4Xye6dKo*ExG4K1qgQRJMXjA-PMxS)5i_b!n#RuqSL@F;d`2hg0u!V
z5J8!x8!ElUSTxO4D#*%9+=MaiRU(3>x7I|a*2@e)xs^$?Un)lc9Y_r*fW<mY!+s81
z;0BFjeZT=|#CWU1Y6kZv8XJWn+Nz_GYV+?|+4Z%;0OCFXq)4Lg3c{`x0ni<&hmS=o
zeMTqzk_Z6gN(ef_^SGea6y-$osI=<4fOMmS;OfkWaf#Zw0WLd07Q2c@&6;Ft9(6JG
zrD=Ap&nTM|sa9FFkNQyFDs;Wt`T-<^5Q6NxY1xh^bHP$q=QMHqfp_6?l<VLnISM~S
zV3Z|%My0S<$!kBJc784p@acOqEcE=q!QZDAB%oy6i@LO?@-pErwftS~dccQ$;7+VA
z{D<Avf3`k+X_ZF=VQQ{;lh~F=tAkPprnwZLn4l#^AB7*>U?D~C%N4bKV|6l)!|;jn
z4y1D7<=dCDqb$KCo`|&6>=rYzaOY;<c*=6Mj@*()@@l9$;QE@{`tRR|PJ?p5HR%Xw
zt0e%6U(sGh!e9b=pNUI3z(3X`r43Cn%&Y^2<gSkh`x8xS=oP;VpwE*oa@S`CX(J?F
z9s??HHqi9r0L98FfH`>?Yyf6}3ec#KM5J=_X=^fACIDytcull*v2>^ZAt*0yZ+(Ao
zF4zUu^vz{jY0v=F*a6JxSR=mpqydei4!~rrd$Lc*j<8a?AY8OSEaBpP(UFwf7Zblx
zh(@}Z{`Um#f20~l9zPfktX5F_)5rQxOKUatFbx0styi~qfyR~O$HZ&CsYZYF>vD{v
z5)#mORDB_yG+|w;;F<Y!H1VXJ#?>A{-v(lUi<=e==x_`iaz>zA#0YyI^Mi!}3zqJ_
z_9?60TM8R^I>m$KdlJ#f3oYEHJPy-}!D2Q6g16H@&k4o=>7V(LS+Bf@#aru?pfU_>
z(p!4YfEWUVtzZZs=&s2au|Edxk^31ApTb)X$(mQI^9tMsO^{D&MQN$@CT}|$4!39Y
z5K<c_9CBokKI2sQPIaNS2X6sDWO(wc)VCXZeM)FKIe@@M-`Fp-h6<%-G6n6O@jTbC
z_9$k0q<8J5%ybq1QuxthJt)k~=hYOIYl+Xk$=94omQ2KwI(O}xS)6Uty8J>0ZQb~t
z{OupCZoBQTH8uDoL2X;9W+(Xks8vmfyh0lSuXS2y0QN!g2=FVYdZ_^(ug((yAE&o2
z5!EWdspu*4t!4)x*F_1PNduNSne7>HI1zUSj8AD&ohzV1RyQpJ&}94?b*{VDrN<O@
zYPZaeX~%B!-^hYd!BF5qtwix-w=s($wcnMDtkaV(3PjnDV5C~s@G<45$`CA7i5Qv(
z^)A^^D9Qtry{YSWEoN@cTN~5$+f$Y4!82V4&Zf@JN4;;&U{#E$i|L@+bsubT>rG;(
z9qMlYj6I-dJPz^N2SCmg01{0CMs3Le`;iQ^2~t3rIY{od7!#8ZbW?3IE?odd1f8q}
zA>jRZ))%!KXvkA!he<@*XKb1e0<Y_v&?vADoPhkz287W*pKjXvki|WiAseeZT~0wy
zcJf<7C$rW^FrNkiTVOv}_yRr&lH4-5GC&D(sKNBJgs%S<KR7`i0inH8khaJUu)hca
z5|j}aJV6#xBx{7M?**zt_!xQ)aPO%1TQ)QA61=|He`e7ub(iFxs}M*Hg!<J0SNj$a
zBAEMq$%E-b5`ZHY8<ieH9krbSFPgJFL+IxUCkl4MPql81e#lJ#u1Y}2O(OdtJR@*g
z`C4zLX(R<2&ou>#)&PWZGD3}lq|KZxO;UhW#%W*Bhop_l#E_})-Q!1%WPNwj#D^#r
zNW4(s*jOMTC}zKQJ?hN*P{q_o9g+nu7B`kN0k?|jC+l-`r)VvzW*zI)P7YH@2(@@n
z60mW@=zRh>azLn06Smh4&b=StyrkK=p4#>{16&%S&{Bt`PJNbudpLCM<RK}{2&RC3
zA+ikF{_V5-GTIywWW;@mQQ8+kpZ6^gQXGo7TZLr-!6;q?KaoR8@bJwYc0&m^q4nWB
z;_!Vy8)2f_*am>$={g;yaD}>wXyVpch7@Z<0QR>AC1|5>G)~qS(6%CEcqoA|3Q@>d
zx&RPtZeaFdlHo??Wc8!Ogv|^gJz*M5;SAj$OkfI`P3qh2wuB1=9=pBEz|Ev61!5ZZ
zPj4;<fZx&fDcCSnyAoM(mkH}8VuaIlm|c&NwFDM`q;lwx6`&&V^otat8QWjV8@y`(
zfJyXyyeo)Oc8h0(8Iog~Zqe#Rrx-*kHB*7&utgw(JFBlavXR{Pn59*k8cx#U8N6}?
zs=`NrUw2~<MOA(Dr2VJ5nZ82&hm5-b)QZ#DR*U3A^4@jjJqzOE^5fN@f>GF;W2|M%
zw~2s@XR7PIO1}>d0MhPbL>7#uJbT1!K(_6N&@>YDvipM4hcT^CC5p67Du^RX4Ku3`
zYVr)KSeQbP*^w$i0!;SD;bUwZ;2CZ4(;7KUT090)a1bl;d<#EnJMpiEQxgEZ2kI?~
z(Bw|0q6QW$(<IxS?!?hEq!}x9+PTMVE<FIx3S)<EupJX?<|dlFq)wgHqRkY#eHsC)
zSRg|)!npL`CciLHY~huC=;~sQ-7g(=7^=jUXmp8X0k}&Wny)6S?9pc!8(cY_;0IM_
z0Vx2{x{}C5UK-wp>z(Q5WUP}nOJvBm2VYJ*jq2=A$A~Ts`;cs#(?YiIn2#L^wvm*&
zDjC?cl}5SHq<Q7<?h@aFrKk195aZ|@PWc`a3|#N0U*9Z|K64fy1N!JzUlP8J1?uCp
zohe8}VcaJ(sM)3~v@&IX@^DRXVWhsIYHFswxj=ycZq;S3&mW3}PlY1k3&lgG5rKsK
z;eYrg`-->`!bPVGZWTA%e&oGzrBCdqbJg5OkX~m`Usobud!K9s>m@=LR^`Q#t<Sku
zQZK=XgR}o*GoC<kVYp;BIHFgW{JK*rd%J8*Jr>3kHr~<Gwk$_E<S+NX8_w8J*xoN&
z%wrSI+hjKj)vi`d<qPyyabe$#A2HxoUAMIssI^Zmr8{IR>@&o?8|s=VpSQ%-IGm_^
zj!aftO{qmG7tp1#r$b^BI?LylHf1vsZ2w_%ysSC%9X)*MgTGXA!vVv^@FRt@*Cbd8
ziz&6h1IWm}QN3)jFgpjbaG4dx^125#NpoJmH+FPyPi9SNiun4ZO?Yph)$Qj>TdcJM
z!ZgQl3b+VGzMD!qHVt0c_?%ZLD<9?VygtIrjeB{a!69P<2>y@5nWu!tnDK@B`XXqz
z%JvgEKfhV&k2O>o?jk7oPz7UHZZC<v(=izv^UYnO>4U3>f=455xRuPDn>|ogxfQfP
zfex=#*dZFUwCj~ych7i9Fk_}!5}QJ2r<J8+%_m2<m*bZ!xEL)b`_QQh2#YwnPRBtO
zDE2>Q@4h9K3t0FONf=%$c1n#~m+l2~DJ(>tzTFZ+&muKITLk>Ga*~+#<~3o)I13`9
z4|^lcNc(C-=tXj6@11r$3S<vFjt{GE9%M)h1XLus82mwk)4fh5Qo<uuSlvkt)7aB{
za=u}27Wmloeu&>f+jrP+C69?$FLCK5*meLITr)$#ovSawO@?8^+r$T0XPlq(HZs%3
z>hSbKe?0bZWiD2%oOZXOn>=PwU|Jk)%pX+-%pU1%U7Kro1pAvOvKmnuhL(k(j}htw
zC%5P*v-nKV+EG&!W3R!!{-e~)@SO9gr4W}1UN`ILw~aI7{`F0HAX34o^zF+Cm7gg%
zRYJ#;jw-{jWx!B#Jj!@Brk0?*p|H>@r}^zC7vJ=P<^joYpQc7z*cMjZ#4gUj(z-o5
ze<$lfM8>)Y=yC*&QC(M+S7sOUzyfyt9@-76eDwZEJF;_x7q3V(&gJc@21NaZnUuy~
zbA?L}RB8=)i0qXF2h!!WS2k?bvNaVYFtwUXHkeJGjWY1GmR^0ULG@{*^db355~l9*
zL!1_F`}BxP!=`r<4X*dH>Gezc|FGqLZAK9%5s@SNFS-6+t{c1hMHn7JW9KnmR6mFZ
zJR}2;#J*q2(!#pX8M;%LA1g|nhoui^kp7Ukecj1jN(D2DQ?uP!KeFPN&J>av7kT0t
zjbF@OxG(0`(6hu#Q(dH8UyK_I7|kOl7PZ4`?_MV*ON5t=%RZY6boj2AM?Iu=*@$bL
z$2qpnO@|LJs+xZd?d40YK=sI*V=mGSJmX;XTX@RoB^izu9W#h09S41&s-^cJD_7r=
zt6wUb(Uzua`$tTT`99DV2pz)0abX$U^>WU8%*TrB`f~-BE{#_uVmRrYrF_<gVTkSr
zp<oR{xE#eJ6bCnaI6Ff@ke00;Laq086qgPSZyLLx%Urc%%k%}_ecZlxca7{N?DF8k
zv6YGorT)?sQWq_m#K)HlUEdDHNz>JPG9`yM_xptVx^kY=xQ-U;(DG(&xfXUkIBWC`
z6Msk6tQ1p103YlgthoRLDUH|RNiBHr!3Nq7+TD&q$o4`#21p%JDH;TDdnA#SRO7ZJ
zXUyOM?t1SUAZz(->5i00Ya7ytgN)N|V0<7nZHe>-CDT^vYF_Ti>2wk7UU!*MPvu>4
z9Zx#D8SS70`^(Skv`0+mHP5^AE7pb<vXc&xaipY$Z*vqoe^*%>7uy@K%6@(E1nv@P
z8}V^w6o!d&Gw1fDyvxsicuMzlP+V{=`Gq~9I`+ANc3!a{L4Mmu2Es(Ax}Oaq6NBAT
zGBePaPR-zYd>U)4y<mQsgF0-nN}`LgdH$r$^{-Xiq7mu!FIs9%;TLqV2b;@eava{x
zObO7m7LtPY<M7$%S_<9!XG-2Xag<0hkfH)w|4oL!5tpAIqHx7Rapo(n^(_f_`D88(
zEI+;0goB`4KQeqo;s)DTwmkV}`eg*=!5H03D%xH^1t5ptB0Hs_qDAP#!x^~t()nEq
zA-6fFBD^dx+5-`a;5eEzab@`a0#KAY(!mII-RUQfLsAQYMk{A-2NoltaR%TQ(ez8>
z5Cq7Dpdk-R>5J;Je8L!)6czJhkWQkqkgjbGpEz;pu%jZ)pe%O7id_Wq02CIq(A>gX
zYjQjd>nv{?vf5BMKZ*O#f<oAVD!D2EeRhG+ypg!hz%bue-p?EE>gVi6fx{nyO+))6
z92zpPb@DA~*r$IZMU}Hyyc1mma%oc}iF<YiWEN!ei94IB2*ohF5khsY%b6zRq(-{}
zvR7>E-o-z*WheJBBF-8~A%b{OnTJZ_`EC4Amw8rGO%5%hKI$}?`)Z?D`@tvQ4$7xm
zP_|Us!WT7kCG0Ad>|G6jR1SO}nZ}OVK6JKUWFwX#Q}RU^zmFi`z{M0V(Zb%p<K1kf
zvR!Q$cnN!=nC>f(zYt1cG;=I3!`o?(mOJZdG3$a5t0@<!?WP!Iv1ze{xY#y`XnAg%
zR$j?$fm)0o_nyGHYnoS*5sRdrXs0Y>RP!mC%VHRZ7cVW&bXZ~4wovmv#m&Z~M29lW
z3q-q^Y<VzyvtcEMa@wcA?zKx~t)d9;veiZAlm;fJqny@GF9wnNxvzYPQ#8LS+r9JV
zV4iVbGm`8lb%Q%~vKnlCybCw=RNbtkW+wn!MC3hx*}f6;JS`uQ9Hh@3`w$4ONsR{=
zp8!TS+PcaRnU$IgHol8;Cq-OKVH;a7*N7`CG?QqXMW1osxHwp(WMf^0{bAH0@`yPp
z|Cne+ps*sFQ2|4+MSuF4vN4ermK)<2Z@YD57dP+s`iiY}1zjzk{$z1fByE5Wr%NZW
z=|Y@lkXm%ED}IG&5zyhxpSRu{$>(ELdsut-eKJ&cWS3x+*yQqwh*tS5zg*v`OmHas
z^s9-flzWqh$kPuU!U$V)Ya<by&q7)K(GwYsq+t6DvKbD*NLAcPiw=;Pv2o2s7LLBA
zXYHQZi4(rOxmw~hBcq`a@${JI^`3j5biGySCz;tVaZue9DbxwYKPkL^odW+T$%Y^h
zOFDdQ?neeW^f04GTDki#ZPZ=`n@K`2zIWwTlaBhVbDxLg$&j@-id%7o4}Phzn`<I3
zYa^m<h`0o9#mgp$w!xEe-y;#iWI4m1Q?)L1cfUBHrJR#SA=F<Y2&%XqW9^Fa*)IVN
zm8eCuCL(Ti9b`92+x+v8S*oW$-7|aa-Bw+x0?qFaCGr*a>4Nkhi59)9ZQt>NO0X6M
z7T*fh#0&KOuu!v)9D-k1rFnm9$8gg9W`;MFU9AzxsVHi3;WcO<rmNj-_oez&yGRy#
z0$BM^_7K0)F>-qKQSQkTP#0!;Cuwy)&=3m#=wC=YuA6WC*t9bR8i}ev#Yy~-YWt@>
z+5k3GY<wG#-b0P^FfFL~Yb7`+@h=K%w_Y!XUWg8)3j25`@uUg9De4NEqQ^9vtg)X(
zmwC1<rSHe(OV%d^kvgAr1$TXOk=HSubAoHJlA?73^91#;>0!0mCNun^iHWU3;P#O5
z@*{tHD%HDC{WL!!tIExW$0NggUZCqE%k9Rn7tao>HUbUw7+$I$H6}2-?bmWOlB9`H
zoV|S8ZeO}jZ7`1vRJXbM4`|z{mAXk$<+D?3t$swi`DhEo+l({rXeOCc$r(QfC!<`q
z&e3)~w=phpFwzQVMPepw(w()*zf=QuCyjj=J<O~+$f4scN#d5PgqEm&Jp04VSN5HT
zf;k;&jT$&Q=5_WbsKIz)@%d+ba^3ytmv>oAyk_rmRDrvBJ>HzxocFPDb;V9WOy@b7
zBy@{|djW^vlA|gwW*jTw@STvC`=Z;S;Aj$0wl#b0tJT=V4?=JJU4kCEho7}Khv;>?
z?j8niU&b$!!3*-LY-=|wzHF)sw|hu7wG3fou<@+B_UAKK!JBJ)?ww6R^F_Lcvv$RW
zT#L?eIAxN>W^6)&?P;9C_#pwVHP(7FCg2jXC+N>T><lLv_MwA~9^u1}2!9{ue{u~O
zrtl+`f{bRfj_JfiC?*w}7tDT9t1uRYV0@A+i>Ti8%TbRAj<SAkj;cWzoZ-az(4OZg
zGh*UiVTDTK7kUd3*+B_*wLw~G9==Jbi}*Ty%aXg?b6gh0&I&}3J4oX>3y3k7)EKVN
zKsv(~%opiphJBVy2=Iv%^SYCmdqOO$_tXe3r5wX&8QTO#VRX}(tCo1J)PcPAT;Bd=
zMIY+G7U^QZY)?F^K8$IP9WaX1i#i0N@!YI6=NAUrmSS?cDC<ve+P5X%^#+lx5>%+B
z5i+Y0`F4*E_FhS6AWL7l{Z;5JiJpz#tPagQ!Drt*k1y?DqfZ)K4HywS9rZ-8U{YAH
ze7$hEFT|#U-5P?*QKO`-@<|TTHZ~HVxp+G_aI*e%b}g?c^46yn{l#ZY_}X9jqlNO0
z*MMq8eXy>wTXef}!j=D#n%Zk>7%lU1chw;Vn@bxi=fm3AAm~=uLW-2AvU6y*d8rU*
zptuz&#+cVjJKW4u=?ojK&Tj==xrQ4j5?_f$nc7M>30<aLW|-ZXQMBzoQYnh4jPeqR
zBQp61cCl1XD;<kqkDV3Jl1RvC93pw+B$yLA`?Iu+=b6L<f`#_aMWxL*Ukq>0filcq
z{YBLM@FlTz0>2Kg^!SoiskE(9mFXGAtw+0{TOu>K*9~lT19<1^6I2hVp~tg{y0o)7
zbQ<FG47h3saGDuW4Z$Z~#)gY(-LCfMS#NA1mCW<bGg$T}vlI+QLzj2a;F?W#;?Lh@
z6dk%Z3zmV{^ltd}j&B<gnJH-a0(tD8SJcaj>ZTu&z8|-4BmaCY4Jqn*@AvZF-zbDE
zQBb%dp)4u+Y+kXqa1^rn$hSJ*fL;rgEM2Je^7|<;n9|lA5+iHxugPaeb%Uh9KfInE
zlcHFFX!1Ip%8<=dF-cD%EFWT*fC?F25H(J_h|B<RNtgCiaDeG_`mM(HPI+SC!$s-d
zTwI;@`P6jKZV~IcQipp04wyvKjYAW<k~UC=n?#{Kzq6q8#i87URj)zdruaKC(n28q
zMi#m~56X%iUc>NLp?NRt0E>*^O(#S{ozUCUNLJXVv9o@9T1}a~nL^L~#N?D*_D+p1
zRnje5jVMH1F66*UUNg9L?4xpoFkrxafG3M6KCdzLuKv783z#w7*>wa3icQ{Nqj%}b
z7or<T_gm=stGAIax5RX*Oj_}^r_O35fRtbG%5V?89%cm#b+=&Mvj_N-Ezr~WTzw%s
z+~=7%HrJUrEd=m|wTNAA!{!hHm5QjcpR{hZq;Sw<j2`u|52l%P;TiuNYPv;@5pX`j
ziSWqDmN$<oGKagiory)=AtoD=5tftLPW=8}N@~xcyxTBePQyOi5uS02#&yJsQQ@kM
zx`EDq<?iumuc6>FL9*z(Ly8cY&t}@{s$Qw|rXTaXaTDXAIEDq`!byV#MC)a-hvQ;J
zF_SKFh0jz$C?0?EkQPtGtQ9g|NclQ>Vz<uK;K3;66Ez?GDa|nxt`WvEajcMF8cy^`
zci;$ZEeYHyCuU36k15N#YUeG#kCIMIaj9m`5Fd!rUV4RcaCsvLd|D9#m0P1#Gmrz#
zqI^<#De3#$hiM(CpA+2833xX^W*qQqH2pi7kqh0A6x0Bp<fT#UA&)SFSK~fs-`2LR
zd*47ck{!dD(hwWP5MasiCV;rp3dj;tFT<Gk0xD{N;D#)>WQqmPk!V1ygTa|JhRO-%
zy?1!6fkEob{bwKd?@N>*b;!4ks(IEnbK!NxX5-;&TZOb#wVHZNrZWiCK$^t7-aeNK
zxGk&q!wA_aU_^hFIB^GQvy1@!k<3HJJ=o80s4Qvmk`R|rNvfbW%#d#LdpJVAV+*ln
ze*SqDcicXBUA?Mq!E<@V_p)#A@f%Mk#QAF`XxbSE#UU`$XraGvpzW)CgE{x?Ek5)4
zSv_*ZDqdpt3PGp`u+r<mI%S|>v)dQ<q?S8d^8gzA&D?r@VeM`7u=6!%(0*R=^y%*}
zV27U!s64>e?mK2|qhDMt=`;*>wjw7*is@sPtHhcsG^Zh-PqVVUCr$g4wT_tIWsCfA
zKvoxFZA$vNkfcE3Mt&P@Q(U{f^h1--PcmK&J7A1aJ=_T<-}httfLB&B@jWZtZYe5n
zf8LD>jd2*Ne4+WgJ^}uu-~}gehmclHo((;^CvzVZ_I+}|n)X;Xkwqu=Gey9v+j#23
zgGbLg-Q~X~_Pc;i0}Mz$Gpc{hhH4x-B_w4w)YO~M!`7>b4<9}$(bdY<p*1;-*aKtU
zd+%)7&=(qzoAr)ofZV8x=+bm^=8A@wIF5~SBfrG*JA{2jH|3(|Zt$o5XlaX9bM^)L
zmwFi&*|v~RdhbGQjV;KQ(V|Vue+oHpeW<mPA?HqL*n6v4%DXJiY_T)Ai{({IZ9^ns
zH+7`~IvVw6oKMPsDAKsT-14eO{i`P7KMwJaq0k``nkoiAqxam3A_ob=dgRvaoljWh
zs~*ZdfB~(AH(g>74DSA%&pb9<-ecOWTuUvo;}Krwg#%0U_;7yb4U*PCZYAdAS0UIN
zoLQknhzdOkqV{>6?=%F@z}QNL23Dk9%@Lc}TNyn?zxRO}^{0FF5$EbdN2ZJhH9aq<
zkVH9%OZrQ^M>jAFZHeFMh?$z;!!xIzu0i&}Fr>!{y^QGnSI`ZzD64;f4=?q^LA#~E
z_yF9B50kz_#L4Al2o!h`kf!}C7R@q74xCPZXrvg|+%3`+(bvNZ7=6eR#}rLEG$)8#
ztxPa4uK>Zl!W^S!V(b*EidDYGX)xfe%6AA1nQf@4K5eVk$uj>WVV7vVIT%YZ(I0>m
zZIQY9sF0%YYn1%vNC6%`d9z{oDd&Fln{945JsNG=xng{oVU1B=&of~y=><!XVLE{T
z|AYMUH5?K)DqJaZHx^vvm|J~cNBWsI58i&jgJ=HGTlo|^yQR5~5bv<Ixi7K9G^$MU
zuttIEArS$&@sI@|^d?ftB&-*M#vaBDO$~Xm(G)w7UlbcY2wLazB3Kpv1kPmn2cKrX
zA%f1orr}hkbMNih<?}UC%2Txio*OncF}qLmLs4}sng#Vga6Rp+YH~-)vW;o<yN@rZ
z*H&Op2M8!OzsrDBFGC*bM9hc>-3*l&-i|<sY!WON(ub{n19uJKST)j%S1`^Q8x1^o
zDarfWr)l3whE4fHXUnUPe>neXANt>QVg>_^GHvKARbV1b@^hSdQ4<*_Y8Wb|Ha3of
z6ZssLS|~9s$ZS&z3!uihp1D5vq3#e1!3kW;>)57p3^O0dlp}b<J1$QHt4(eTqsH}>
z&!)$|Bhu!wX)&laqAubUCw&)8@v+ZIc+a4YHYu5IFW4|JRpdY*>0rmP6c>0LZyBV1
z*m7kN4F|f06ON5@K+X?);W<5xYeHY<K|I5)+lZTO_j4&4UYzQ7Uf3sGDShn%Fg5bk
zB;3U7qhCOD`eQutFpQ6QS3!GI*Yo?$n_^Xkgd0i%yAs-}k1rLav|V(MhI@L1dp9kw
zn7{#r4JbtbLh#IbVgPdT<qb!FuoQ*UbKSQ>StjffcF`d^P33PeOMx5Yv|XiOvO41`
z7yhIUDizN33mFuL`b9Lt;O4TQhr!L_UO>4r*?-w>m#`FkOFlPK=eqX?+RRG^-I;fj
z&dZ5Z1J0+dEJFQd7WEV9)+|3ck?GvPuM-$m*7PXWGP6Ja`JHy4&77aE>yTvc+Z+m>
z!PG9}W%zNRkgqRiAYE94^Mu9?Qx!dM5qXHOUAc+S7tMe6R-=gdfZXpfr{d)4{V>~G
zcPK4-z~HX+1#6#P+}ouu7&y$*8VKi*=qHq~`?sH6UWKijO+^idLL-CLQCrR!Fcayv
z?m9S*#=^`<_koUm#KE(FN73P<gd82d$nfv4J^ReVElX1+cE%^qt@;1sYy+7_nGpXY
zKG>m)@k39uu<P*PTDHn!acU;gPBbtqA*$=y8_xAlnbjHa59#WYZYz}ZkG^}~5C~Zb
znlbvP762*D2OTy_Fok8q9RKufa{b%4kguAtA+s!@kYuaOQ=Xo5ISFZTbi4JOsg|6g
zpT)j44ES&i+`Htf#MJR?+%?Y8)E`(gZ>u5#43vL&M=+g$jj5h`!PVutRFmCD<N(2g
zKq7_Z0$H%P)5R@{7&879UnfBIj>bqf4I?R0$N6oewleLBW1nDRV$=vPx#>Y3nkJi*
z#up!8Zz1{<z&iJuL?ogJ6__N2lB<F^`#*0d1d0<PbpPSP(ND_3akvMGsU)ceSd0BN
z0;vSKxFRJFzO}%WyNeIqgy%9sS{rkFxR~+DgI^pt-a9qKX{mYAUSOUW5V~6N3FNX}
zou+CJvVdN~&G?e$p#}B%oMD^SS1oh7`Dj)*)v$Qi?gu=+k85Lr(Y;3ldoO^e`yrnW
z`yxc^xA3xGd_JVnJS@#}rBT>Mr<C;5s;+If8?(XCd23QbirIYBYCGGFHuPY-qV!gG
zc9Xl1bX<D&V2*B7HGnj@3VDoJg>`~nY7I*dk8d;F^POr&hh}RUxt$yEDi;4L<aHLH
zk%>!JIQhljCGVu#F`iET(UY({tQO}eOZU8Jr7vUU$zMkwWftsRc>>{PF(0_X%0eN1
z=2M-s+~`pMJDLNtxeK|c&RyUbOE3QS=@`kLf6aEifV)k9VNf6BPs!^WEFS7wX@t!p
zOf_P<G4^*7nlJRZB*d5!!-H>Z0)7{uF21bz*Hiw$i1nhbSED;mm)U&K{ZT<Sl|!Bo
zZlFZ)qcQL;9bcbV_HMSPEM{ILIIgD=cq}n;*pr^JSZAXd`usO9Cered2c&WaoLo9$
zfH?9Ee;p2%vQ>H+0(|mS&SI42<`P*_4iS~<57|W_ASUm{2uupey<bwXS_?o|Wk!^4
zMM;zZ$E(h)Kprrn9$oLL@*;E=Twe!l{&iwX?1(`O6l_}d7jBeUtRLTLmoT}lhDEzK
zteGfkJzx?_VayOCMhXYoQT}xTu{N)H0c3A~9?Or!#Igi$El%Q!SpwoRQ{K)Rn$7a^
z=<NprIKZjJj@pEyF?Dv*=+wOG=u$dPS=1n+;XP}=CnR7W(h;8@GV4AqK4UN)sg(iy
z!nmL&AH7|!uQPY_zIk{VsM3?TDZaY<VSH)@O+q~VIUPQ^6|cotbM&KOOmA>rb~$1%
z@t-VKh|WOfr}5&3-Mg8eP4Z^s%xE-vbi~pVX!py@5h#H0#GC3>VHfwVQ9vAuW(0k%
z?BHUMRr2-e!Fe?a`HhwqKCv|WB&wJNq}L~_S^{=Rsuu|C%_Nu>i}6hNB}sY3{_9c@
zdk`_3m$$xB82==k1YZJ9eGlHmqgHFx0kE4xJ$&W-*xr1lza5BEX8HL>Wm&)7NL_r!
z;wUc`F+{+$cK@gT#NV0Lu7!w{--B5-adR7Bg<200kr6L;y(UVOM>A9)l__0)c={82
z385%oCtjLV*Cf%2!W>NM`2FYSEY|{XXqJLQaq$ZfhMUl0-EEFvt<mYPdB6dDUZs<8
z)k3jK@$fJ5OM7qZi~Cq`WcTJq*AF!?ae28#p_K`TE+S8IRv!WNKAC`<!8cw}ia#nK
zGJi5OXF_jDqjX8mU;&Ocb7;JSXoW_xAzB@3Q{>6Fq2wli=-SskFg@TFNpaAi>snFn
z91X}a1d$eXr~Bc6l#B#-bP?zG>XOh|p@MFf9~B_cXfl7;G!*+*rUcrpyoNOxC7c@4
z^W7;teTh1Xggf}ebW+SL_X+Gp(3!)`OKA4)OPn0X&sk1C5u%!gB@y1E%FfIO3SLrK
z<^=`q_af_3K?CG2)J~>EWd~u4u`1kME7b8C>irFyN1{`lzu0>Z(@vu5ii}NPgzj@5
z^%V%RcE6uc=D8$syA$+WhOTD^+J54K_9`(FJCAyKX`2iB=K@qfgQqC-RXuyr{G!!6
z-&X}Ix&nQgC7MyI0y^hlPER%;Za-dXro<zguk|%JZiHa#-O63h4uVI|RY&vk*ZqOt
zCKC(`M=m=)f0QWxGGd_CWxGs)^}$`~O!w4qf6Sy6cAP0UsL_+<r}=V+q{3T*{+&OI
z@pzs%y%YOY^KXEfKOh&M94Xd$1|Y}bwIY+Cbu`^hxNQ?*mFdqZbJ#!DJeNE8TTa^&
zGBTlf@4j`v?>M~mBliTD2=&zWRs5|xD88Si5(MM1JhwiU1*#MVte@E@knee1w+?}3
zW|>BS8U_t-nT{2<y-lsorUjVsI=y$D`YqPp6C`_L(DVbd*Lo+%P_eBsUn0)>Iou{=
zayK$#a-A(8&>F9nlSe_QR+%U{5RDwW$NZ+Dqzz?FH)JtW<~WH*2;hBf<BHiM8=|Yx
zmiLyrXzep!s0HIv@Np98h64w)*fTXkTje7JZj}gJJ{Qus!XGO{9$B2rpI-z9YK66~
z2M{Xui%R}D+*j^&WDH!Z08<I6yBd*q@MI5@b}7Q)V~!oo@d^+OdzDc#=V-(7TQo4*
zLZz-s{^{M`#uNK4$MWFw_ODcrYB4xGjg1naku}v4=5MwKH$tlb?8f_vUUim?VLNJ{
zbMd^TKM|A2nzM|lIqTYedy(-$`vcPZg+kY$xzltI8?}AMxs86lH%*Yg$c=<7HY$ll
zhSITUgpX-=vU}1DeRq<p4UDe#I#F@9_LmyuViG+vke96X1eP=CP#U!KMzNWzsrDj)
z2`IMgD=X$YDvef5=o*Yde&!{^*=4K*Ig<pAH?SI`HK`7M|B7Pj8*PhuBl9-b^8r!e
zXhp8HEox+!o7MY?tyH~{N2}lb8(hya5a{H&u=&HT&qY(t39vg4l3UJ@tmLP78X0X~
zMsQ4hBh@Hm9w?0ITqi@DA+eufH21ilHDdtEP;B-#el@IVpS=QqH<hn(amzuRMrBF6
zu@$V!$6_<k8ZUe2iy*26yq5^kC~+Pfjn>fGgrUmQ<`284xp1Z2hX<QMRp5pY6Xo67
z$%jC%_@Ajb!1;*!N-mz#@=Brojp9xO@|g!^I1M!EirE5ZQ$Ku?d479p_(dudhXaeV
z*$)Y+Bq8cnE~e$!t)rIRxnyS}VY%2AfH1pjvuq@g`I5@s0=f9+mHVV0WcGCf2ZcSj
zpC+NgpJIj7P-U*xiFn(gNf1}cFGf|=qGa8ab{))Ba`ATnSMZnWBf!ru5u^#)P<iFs
ztte}HA&bb`oYN$=EO*G8I}v^r1lu+1g<bw_J?lWIw<j!a1O%(HaI~ck0U_t38>>&o
zk%aM&HAL<f`VK8G$K1x(jtf>64i7DnPUxfVWQ~Vz9XZ}NY84dN8U1?2wMXs)AdR{u
zuS^KxehWabm&}bpyJyfMWVZ0g@J?Gl5+=tUKsu)Lj8fxB*Kh65TK2@(iAbyg-K8x+
zgb0hqr6<pcg5szoMAABUPazal=kQt^{ZJi~JWQrr3y=x{--Dht9l+C9>g6V16>1Td
zX0sU1d-<;P4EHn7omHSJFeccU(@IWx9Q?$uOKH|iX>e)QahZxA<vze>Lw-_qA9WA3
zr<Yq$i^&7b1!e$)MpC!x&F1`Up+6oj>9mev`3TJex6Jg+;@jEHRUBRcl4UY`zM(EF
zKfk|6HGDi>eDdwYac0$K>Q@7(?U=mQqPd{_vr(^o=mF#Td>CuwVpL7SJ$!PLn(ZiH
zULy6GJc+8OHb819kA#Mo<H0u9o9!GTwFS<Q)-Aq=VTVcKEh#oN_ic5>CyKd;7I2fD
z2Vd*Ty%9S*E-%eb%G}Z@z_mM3F!FbkrSufl_{cwE6v6`}5M9w?m&UU=8lEB~kfkSZ
zg-&KCffD2gx6IIOCV@nfJ`?<z3v4EK;@bJ6;Des-w~wYiX7cxtFq_t8Z(=>q=;skr
z?|_8mO_5zvZMKqx5xOvkRv&<F!oicabM$@2){=*y4`UJAFh!T9Ydfn$dM~iE*Dzdl
z(SxBdwY)<QI%_ze8Y~>{cwumJzLsR>m3r_(1ui*GJSCnLp{n)6zqcz;QA(ox1t~T*
z^`kI61jqK_(@`6!9SzYNgrOQABXX1jRK9UN)#5hn>S8J{Y{_xKRQ{R48EZPIw)Z`y
zMkrQFMOX8jj1A*4HiS94{tG)U?9&!jbix3lm2*>GrxoxZ2(%zjFM`ow>wBTvd&t~t
za~K?V$}(Zm^lpuij^29@RrA|v<^2Sp^Y_?ZlT`}Q@b0-3O+NWSB_O6X16Jc5s)c-9
zqJazAqO^{Sc}altewoT}8_IZ0(Bj-68y2%SRY?|@iQp}aOIfy#IW8D#`yF7apoM(2
zkQ5FckfLIre=C}Xpkrij<F)Ywl@m!e!+FI85g0D@0drLeJAq>rmn4$(q-Sis83x47
z9c8h@jv;%p^f20}J@QA5m<zp|{DPw=(Cq%#`Mc=$AM;V>BYLr%UAld&%k>TG7K#uY
z4apB+mJ*{RUa3{Fj*dBTPiUY#Wn=|RwE&Frw%!G=u>KrD`N7=1)IySihL2c8MpTd2
z1O~<rYbWVxb9=r?K`^R|l-<b_WC>YWD9d!PaL7;QYcxyjL&TtG4JSgvGadvc=g^Uc
zgL#aXdr8-mTC_NV2mR7hUP)^emi!@uvBL8Cl3%<Vd7CbN5|q%}xDmjg3Wqb_my?ga
zC@z%wtX3?s^IBbejtZ?k;bgy{BS-#iRxMpwV#!@cu9saNclXh8Zj0?#q@A<pgyGjG
zFa|;+IlMNR9-4yS|6+<}%5kLM$wz?^x)c7>4QX4=^UG`F@`{i7wzp;`A;RWQTV0Sw
z0?%g6*@K~w_rOF!V&`^#v7#MXa44O&d>wHd-9N*A=zb56n93CW2AD1PS@EQ49XBR7
z6BF{JKot$=&rvam?M~2m2!4`1Wn-<1MHfzGSe;OqH<5%$d24_>Js6muTb14y{uz2-
z_@o2Z7qrKhzr+7lX)^q)H2Dg^&HLOhOdPr72$!ChJ$C~2NNtToE^l{cW?7O|_n^&&
z893lip#j@f&gMSW&b7uef=@CEe$eOtJTN5QjJ9h7uauQjtu5v&9V<J2Ujdo)9sx^^
z(zkRQ|B8Dtn4g=}MRW#Z1t#;_&~Qf~q0r`5UOyruo`@<@5ygkeW7Mm0^5NeB8*Rx1
zx5-+CFCbHwG#A`sJ}M2kZi7+0uGfM<i6;)g(7aF6h`2-fX>#+C`QnhKQyvPwKw(j{
zFt~H?+Pk*AEbWVMyQw*}0LjkdjmYNvia>Ly+-?1&Boc5x=w_s6#?mt^Xh)58aT^8c
zfQ1e}l$YvA=5C<;klD}vOdD=|Lk;b_RLW~#cn3;68s&2RD4HEZJa*b6Fe+J#>N>S>
zXZXHJaZBilgq0RCjpA<Gc0Uq=XWmd~bsB7~e#))*;<fgx?~-m#_A^}sqh>XlCtgeQ
zYyoL5U0^`Z{%MA?fe(&rB{W40Mml~{VEAHwpi~+pMt+=wSLxGPbJw5SEis%tnEI?-
zou&xnT3LuxN@){Q*C8?+e4jEn<*2RZ_6#PCMgj8!P)_Uz^Q)~N)f{EBQzf0qUvAJS
zk-yo&9BH$8OLhC6OftJ>x2wzq@yEEdT07s|{Q24`NS_m_+uEnxJvK-7Ta`tTAdemb
zRBW6pfOGxUXT-m0nRg#z$NmfM<oCDWPL?+i1w>>dl1#0@bp~cRM>9PvmmcrKkAwIl
zaFbd|_t6D6DP`R;UWf&LfX0ui5e6vNnEp|W>Nhcggfg;o7JSdKF9vCoBkprGR-aOo
zQc4t|^B+b&-&@shq8wivfR-JJc@!$LI^%5uPqQ~#Rdxm>I0Z{G9JbSSA|7_+GT6=3
z+8C6%@i^Hi_bHbF@#D>NZMyu=VCbhBCm@ob7z<$Pi)9I}5m>F8hyzzD=Xi-&%2k5$
zl#}snufLC)6KP)K0Dq+aE4XdGlKA!^g)&4d`GRQ^mLP9l(I&v*x-)A>ZVYytph)x3
z%a{@aqW9D~<8N9VKNj!w*sG|LKFVWXu&llHPFd}M5;9KRLb;#$@OA<IB=d|@t%O}S
zu?$L+!{lU$8Acz+axEw9aUah;7}E*Z>lhk8S1|jY#%9=TY2WukCOn;g+%kM$Xccf)
z$6R7rBBfX4w$CC+*lA)ef-C%Ag}a0*Wqi^ktj|_t`;Osiql4l>j!(X=J;|1_-|sw$
zgd{3pUNmB0h|!@u@?y(lMD3b)KG#+OlC>guJV{6`C0EUcIFIe*PdZ_goXNTL$!m26
z!8z(N0K~syk$i+-PTycPPm~1oNk_t{&oCq`pc^W<dROj>iZnrM<<Pwp?w840ANnI6
z%L_kK5lUmOBm91S=EdZM{YcuP!yOxK{sE4Ow3iN{flTn%SLJdVQP{x1pz8iN9$OIi
zgnD{wdtOI-KiBiwx*WWGQHf8s0CHWZWiBS0U2W}G?_fvwoAz>~p8dilT8V>3i&wf)
zZxmsDtJtaQHNDI@d$Kd4NEnjolL>6Vj~(}Ao5CqO2d5#^8@iiqW6cFb1A2v_wrc>j
z?>2f?Gnsv=eFIS@ySjTt2gtFTnEe8I)2a_Yd4?zxrXqwbAw>~joc(ujePEouqyW*w
zrTT%bD9bF;Xt~3YaALf%T(9ACdDsJ_txbTs>GJ|DA)xba)S<i#;B{R58(;j3jWq{>
z&0f}oF{Tx0cNMo1bjt(MVFZ2CTfjA{`sqpMNAHetssW3H(~f*G5Factkt+o>0=Zj7
z7Ci0|^pBIlj6Vrz&i9i$v{Nq)NDW&sfvTxZU915)A>p|(;NcJ(b>P5Bj$l7`%f`2Q
z0NE>i_{aj(u2#vM7Anv00)2Jt0orwN+7GDrz(l_qZUDNpnrZ#v2v)1^xcd)m&qp?s
zRT(-T`v8STkL7a1uSq{#A(d}foj?Vz4#7kLWpD}*8$HR&-RoL=EdN6NwX{a~9XWOE
z<u1^jClg>rm~9kik7X1+d!E@UQEc3)|IQmQBj983{ovgaz#Jx;YQ6Kw6td78tKN-_
zL9V=)B$aAx)A*<ykU`P*uK|Dl=@*-XM$3HDRsG%>hc0FX5NoglG(rZ6#=5BE^?Z#|
zm<z$Ohk%;vs7=}TCz$s~(UGm{-m`n}Hi*<<bB|@{^XWn4RJao|UNR`9k%wyxp<V)m
z>Ium#ttQi*!lrj$fKf8~worFz%Z>5K#{e!jbf*t%`h60a7wjt5rI3CDWBW<n*WE<A
z1U$-v+tV0$a?acdW7ceK3vUDUJq>IC`>?17*ht}@boeCrT5cHN*rP84u#52q^}EK%
zQ})8%7>Q25;~Qt#j%Xv4fE47ibEW$9LC@>r0B<;X&@nIxTcQRXkN)%{^a!M9LzQ4!
zngfnJhMv;RilY2=_C^0gvNQ`gUY~KPX%Db1ahf!IFqMjCs!@cyK|T0|a<>}*=z1mV
zg+GsvXN@Vgj={A9+_1Khy4PLNcd=Co>DG5uhS`dPZEv>D&bNeNPd`hVDeh(LI?MfB
zuCNvdP^}-2!-uN5-){B2njc|E6R$GpoY|xF#?c=yHn<#z5KqYd4WJ#K--D>eNjEHi
zzL5#f1z#7WE##}lXZVEp0hKg4oZU`gUz6xySOlEET5;@9bDFB*9W$1Olli2igWtB9
z-=5ekn8iH;-Al~U%H*ydK#aIsQ;ycmi1!u2vvb#q7^AKxNu!eXe}`F;Gdybr<l#%%
zSeSoD!}!Pq3D{v?3e!pfAIA6FhyCua|B$kwe27nlU$=IQZzT;05y6)7mDnMjhFjkS
zH-cdlKcgtYkplo?&wp6<@!piFT?c(43HdbsV^9%yBapJZnb;JS{0O44-7#=8d<SF=
z2;v!jcbj;CjZEz+hxUs)f<}@2pPuFyo8;peG#aXVcpkz<ha!;?L@Pq`e;9kqs4Ba)
zZCFA9kyg6X0O{@)X%*=b>F(~925G6A5T(1jyE_)0i|&5sy6^4#?ESps+v6L<UkqWv
zb<H`?a~|grPG|=@91+Nv-X`9Uf@Wb(2r5(HHax@!;s*>e!#JMa>40&iHv9ujSH1FZ
zIwqft`nI|mOgTD1egX3^VmNX!2rb%OKI4fJv%~zinV=6AW^2{+Hx}m6$ZxlX!RP%~
zQOn=oC^P|kNWUSH`4r#}WhaIMFsl<%nKSs-PpF9C$)MW;y`;pBT9FpN?X2<7M3|f?
z_Kk895W^#>HR92$U<Lz<IqwNTmy$s=li)Bmy7@Au5en$(s%F6bkm_jr-(HoFJ_Wg-
z<ty#^S-|8R&XD^5wHkj%JPKY?YKl-11%pu&E_l%V9-<qZ0I5zcF7hp)&Ta%zg)@Pq
zIdR1^Sj=lbL)H8jA;Li5vC$4w20pnr{9zpcoIK<dub5f>?S1y*z}_bT*eStFKIpRl
zj9qiXkwZy&nR6YIKQsK+J5x3M=gWWo2!*%ERw){9i&;MY`MS~*@X+#Pl#40BLmU5$
z2>4S4{6h`^HdL6vR4FqEb3UIj8~`~M#&L|=sVWU1^K5z^U=;=cu8<Gy68iIVV2_*z
zw&v}zt2m?(@$8JS|9M49l8?T|#cS{4e6l@FKv~?WG+r1jU(EF9zAF!3v~v09fBn%d
zc_#%tn(ARMkeng?^Mn0in}SIqR2cTOUn(QQbdoUdk?$p7a+_RGwOFgsr?>IXVu=iG
z1})N85ci;CF!;lmNpdKKmvi{C0UWc5Kmte**$n1#X+Kaz{|$#%cnn*2pJe~@r7FFE
zqo{0;YFgcKzy4*~vqbIRMIq+-=XZjAn)gm9_*ExrE>s-<d^wu}><{BhX7+!3OaEJv
z1ztMxvij@)T;|@t1Dd7zZxZ6QH1pu*3y9b}MbqzySPX94n@^)UurAJ%i%?px$o})k
z=I+DZ<$`PE*&ni-0uNYS@!=G<<o{*!D3QXJjd%x4LH2)-0fku1!zgv3t$nxml4Cg&
zYR8Tm?oqhyR`Ji#(U!;2NdpP*{_T+gR1N`NgHAb6>kG-BFMk(=eYRjHz4w1%nSA1b
z7rBi47WC&-6mmd@1r8g4*iYR6V1K{~%aGqHl#2s|gJBI2#uW8hK7pyF+$c(>J&ZcH
zHT<I-cLz|Gyvf%E1F?RX&kZL-tZ#Ez73dzV<71omsQlvDi+Y89vj5k*vIozq9vyY|
z&+8a>fUWdBDzCji4^Qa-+0D5xV6TesU$07R00=Z`c62pC&@MX&bp!?pLkRdqs%5l{
zMj+61=p?U@R3Ow&9YjOx9V!!bkkAE^y5s`Ut4@XA%7N!Y-8N`avi5;m1vM<@UFT!s
z^`qM#cB4``mXOA%X#Ma|r%^>+<m$D!xjHR%1q7#z-WoL=sV9tn_-$k4Oy-?tWi}H#
z<U56RY%D+pt(f#RR1{PR2Fd0sjul6V<8+k<mkI&_w`vek6Ml6*XE^}VoH|VFB8~l4
zdIOUVueCp;foDgCD~vH!Fq~Y<q1V38yfRp<5=PxMuS}fzHG<AwU13HDTV&}ruuW%k
zWVrp$zWRTk4eUROU|RKr{(byhX~Nk6RV3OmJn(2xv<0PU?dpb))M*LM7Bq63j|aeH
zC)rV}{q;UpV3hhEIE9}iWhS$m8XQi61l%zY$iS%<W*dXtSSYPYKk5J662bbZ*e`m2
zFfJdV=Vz3iwiv6;-gbN6C5C;uRf6Ly(iNJbqgG{-h_AdECZ>wnFKuakHlVxStF)09
zh11_E4oTdoW9M*%E|y<&<b<+&?yol*gwfE6sO`<nLz^s<SvK0gf<J8>7jb2B_;&Cx
z!i&uFb_77A9elv#A!^RS4hl?kx|Wt!01dXV!I%!79UZPAZk?yb#PMK-rmsI}WVQdb
zt4{GiDuYZWNmbG8i@|D#Ra!ZA(ZDc`<UFOE!_6`teGT|Bs(-eku$P#Xu+P7j<3B4A
z^Y3F4RD%}SYD)sBJgolZv#uf&?#))P0{eV*Jm!|kN^^Bqlkwbo{E9H-R3xvnYT(h*
z592Ty9iR9c?o|P@c@h|j1<s%ovUQgme{B59AAhTn%<faC;zy$R1T}a`|4{)U&Bz+=
zr<(!gx~@r5#6zOG#S}cPcVks=5fGE+EE{PVF<i1lb(#&^`cJnZeo+zpI|^gP!gs@(
zMD$6>jhmzc18_I72X)yTI=vj&-bvw)npj6Kn94m@n->9fEB3WwS2zh8@)<CNdjBFV
zDoDs)M5stt(Xucm&*7k9ewU<d<>w1wnyI|9RPMSHsYEiP!d_T^5$hUg51vzc4($At
z-Bqj%{4ZyS6DByW5rh9ZLU#MPe4cy>B@<jMH=D81{2E~nq`EEa>#5|Tl$UCsU=f0>
zI?a#DK*MpP)7y`s*8sGsQMZk^$I=J`-s`X4UL}ehnhn!p@evW{nY^V-aq&>8pcbi;
z_CvvWB^_OPKxA3d6-vrV5hTk}4L_h(LaS13B(+r2ft#Ex%dz;9P`JkB++zxqarq2+
zb83+oWKst~SRa@r<^>_x_JY5<0e~edP{+TEUz$<@=0dC>m@<hQq`ZW@@9Gvy|4r3w
zZ?k?eJS14eCLMo=`RQw&dDS->2R;5fXo#iQYmGT{nP_CvZ4aKm*US1h&`hj9Wn}&T
zKDEf<l@MSjy!k(kUW&Z|ws0n}&f3^Ww$#F#(W?VCR?k+hvS@)KxZVheUWcK;Y6>yy
z!m?5IC&Oe1f^xkmuak2xxDtYEpdwlYwGUq4B`ncs3{d0V{e^-<n*hYFVz(>AZ(j+#
z)gtr+a=i3U{HsPbj?C0nm^Hj<qa&dNye**wg3RnK>M<=bY_C7dv-N51ibEKf-68i}
z-8y*%l}sr-#01GR#f*~4C99JQmBUBvR0AC9mRLkhv`@gIz;TT=r-WY*0c-5(YRDPs
zWFqhaJCRrfG2;Uu`LZ933LBO|kao@AiEX;4)bJBn;B3p2C~{}FsVCqzaZ^YXK_Yj(
zxEZF`EM*H)|G9s?@neiPfxamu?+N8m1vwTUDN(@R+pkmtw2}E(`X2x7xO++on!jI3
z)fG~d)#+t}GL%M8V76ue{Jfmia%k9#7xd#bWr*Qw!Gi^+0H4OdXxN*QNx48xA7%t&
zJE5e!9>t9=cx!cX)Mbhi7$ru)1FRJEK;#Kd512b66F(*a^ob+B4k-|%K}Ai9=?Yqw
z7kCT6K?c1<S09ZFxFX3w8r`XS{wWrP$VLo-Qtf6WLz4JYhzHaKOGyeb&x<sOG#|4*
z7z|cz+(kTj%s%H9;<7OwE=e<K)0tmmaI|tDyQ)c;XkInL!fYY?j2f$+_Wbpn7-BCT
zoQL7_PCUYfBhBSr(B&D0b8jRpInd@$9Lk=9Q;;xUN!<1lOcQnA)^1U9zFH7VSEEXw
zY65+LmNGiwaYZ7Vvx|Z^Zry<iI*-o5bZ>qok{YdiBFMVB5-d|M)5Nx%2_DEIL;~+N
zj5k6Ftl;!n*oLpzW%-=&UpD;n2rp@a=dh-7sEa)~-Fq4V37rkpRwECQT~?<<9b4e8
z=iIiW`V5QMnojPAkx&kJ-U|pm&ftdn<)pCt5t)PlW%al*2*`SprOiNoM;qm5KMx4h
zNdQ$!2IuA=oB8ZGEDgx4dO3jS+tfWsJW9w6|AtKfxUPW)N5Bu|@m&?j2SZ#t27yWQ
z>a={C=Gt$!N!nupWRL)Q7K$zP@?RiTyyU9mak>_mB66N=4sqt<p}&TL8*vHJi<M*V
z4e@cLBs|VpBdRfQmX`t4;_(P@!Ev#j(sUG$#?8dyiypR4FT5TWW7ZQX^*O%+zy;D>
z8Az@hgMls}iVIxB=iYx8E2{_8inFM>pbuS`*TmHs5al8*^K;-}r*m7q{>e{0rqq4S
zLKBIimAWH_YZ%w#W?*V-4a;@bDN2lep4oZl*~!eN_TvH>QN*HUtLJ8<!Ap-Rz951g
zmKf2^)QH3%LeP0RnF`BotT`Q(X8)9N2RNUcoC|g_e*;Ni3Q2a2SNgR=!ggw;>1x2T
zA6U_7=3c%>8Tvh7v3?ZB;e7nH42aj3l3x%ma4tH5+AhrL@iT$dP_9@)JQX<Dp$9z>
znH3ASlm~g8URE|=<3b|P2-%Pu!@lv$T#v~MK1M<-UR(r5626vAy*nQZV?Nru`-@#$
zH7l^1p8rVC7ZE#r`b*)(TR*YG*Yn)@u$F}#-TRo<N6%ZF;=i=MV(HOX#ncBs?#ujo
zi0`2W_J@W&o;Bb;xZwekpMNYs`&B=f3}U~s1@R}y_pfWNV?Wo^Ol&}lT1z}(`P^m;
zAVI2k+OB&nx=wHGtyVpkAxaguw8kI^W*$l&0`%k*Q9kA2A<(^A4Ptv!dB(}CNTAJs
z&eWnN9R+RU0MXRuc3U@gi@TzzptQk|=|}u66($aFh+S!b%IWKJeT}eJLD-b?z2*l^
z%4U9L^E^NnV#?ZA>RFb5T7v)`O)b*HV#M2Y^tjWsc%&WQ^GB@X6ECV7>3&#=V0M@Y
zVO;m11=fMnzU5?lW8GHW#}(cA`dGMu)brNbvSGgd5Gn{tk5*{Z5EzoD0yWs&ac_y3
z6=xnx%?L&<+E#M8&*l;sXP-@yIDdHt^OSj9whIJES?KR}V_v-ZjOe^mf^Y-C+SQQM
zHx&`kWv_0o*v-aq=C3G5+<6&-MFU2h8ziB57Z6X#T+Z<^^r)Ap2L0zP_oXktoJ3e+
z<m=Qmd(o-7)zYW8SZ}SPIBDXExLv*!-q<$yG^JYBOTK$beh8Je3~)lb`tr$p`q|%z
z%$iLjd$|_s5ieEzF38MV<XH!ePrupa_gaaVZ`1{uCE>0BbMVcD1qpwZHAESU7B}kU
zjL2s_;>V|hP4lS*vr5*stGB#8f0@I~?I`un0g}?~2zvF!`_=@3tF;*0xU4i4MwD{I
zV;xP5`O_2fbKt#KRRfS(sZ%~2i1`rTiOe9W*(t1Dci#u{nI7p)m+9o-FHI#1RR92C
zjGu6fRCoB1yt~Hr_4Q&Cqz<9g9+FO>t>pIjw_>m!oeWCJ&b`}#$tT;-v9Qxl;SMv>
zofx{UV~OO-r}Fd55K@zBpFkuOb-RIb8nwqINC!{<IoOr|yH5n2_rHLV*H~~DhCJ4$
zWA{sVMuR@DJo`K^xpU9L(RP);?7b=45=pwIS7jOg+R#IrEcP13+-kTNmY>{AcGUhB
z%bl<#gL@#_8UfA0!cFR@tdZ>gTvgEwxY<`!T>(adK0Oxy3R0NeuooJdGv#oS845yF
zZARhnO5A5)GL}glw)B$7xvydmI9ph!9}zoX-B4A)!qx{sKs~9^PuvIUF^g-Wx>sZp
zSAaFp4>$@$wWz9IbhDX{)hc0nV%D$Sn0tE_2&*7fl+dUV$C}*-ypJAe#grDTRf&74
zRfZXGj^t(wGH3Cn*Di9VQsahAwVc;ql+73<8y^g#Gq~nX0m~V}>+Fh8l@eB`B{cnF
z<-uJOBzKn}=Qn{1ZQq#P=V9pKHUiLd?r~mqMt|s+By<0Isu8I~R-=bJbOdlSb6|{x
z{mXav9ib>_wONsft-O-kcb_z3@Ev;10FrmZvZ~9XQy;$p0562&q^1_A;L9n)L2DD6
z14{04x9RD0@J45$W1ES^flGn$n8^YwvD4>a&o>@g#`JJ=Zgo0QSH>N)7Y8}XW@dy?
z1xUGhL)}Dfjp7$s`jOUKvlEq}`#HlRe&1?{XH&mSGW%423Ma&*{kFxda+@~i-eE4G
zllQ>L!K7T2TF_`BjoCE(%6a`YtNpB*>q%=gxmyFzuBwbfM7w$A?puRAhTX>=A@TIA
zV}^t1P+-2AXk4Nm^G;*Ro4xZgc&z_a6*4`C`5FIvUGM~M?ZBiu;<RPmK%7N%kn0B2
z*<i#m1feNzz_G%1E~lkdzjbZf;CNhh<7e7uL|t_Y#UZv?Yu6CX<@<IQ<k>P@`rAQz
zmD3c}<GW)WSw9YV#<h}`C%cPjQBPHoz`Y}ASQcDRDPTn<B>+M|tFk-o8$^g}3$|)9
zDBmwvl=G?b*a>@O>%s+g^UL}{I4I_?-<BkM9(2n&aV2_P5~IPZjGk8^&LCmAgCL=L
z{V~L`@au$uV?(Irl%~TB&861+YmbhLMIh8P*qMrW(1bJH2IYhQIAyC+bY5lC;b4)!
zw6Kd+9|I!+4&lkWa+Q-fbqkcv__{#}c-P3u+p{9iFxfnWL;e7E=lKi&aP{8}l|?Zn
z_sLAgzg26YlHkg1QZ^Dml)z9m-Cu4t($BW|OP8|VrJ!~deQqu}a|da6D6woaNfqK|
z+BHw9w{6*?R^D=cHn3mEKB(^a0ImfF`?rrB3L0iZOCjiaP#1#IU`=&S%S!32+Xl}v
zNhj8Lt*ZAkQQhIIbsf?Jxy(3wYIccNBOVxL#U7fxjU3E%9E&~B64x;%Z93JZ+x2*M
zgS8^ahcjrB+lBVj+9m0w%Q#}4$Nl21nPuW!zlXM2*;!o6b>na?5kZmGT}UFUrFY`P
z9%XVD_8d~*UagbwqaqR_Gs|<cnSSMz<_N+Ty$s#I(Km8i#9nnOuHdCaM*`OWhQ4-C
zfj(I3)t`H+J0hAHPZMz0(9K$Ga7Ch?9d1(t6@*`}0y9vHJpCM~4eZ)hsC?3Z;ccf$
zQ+WHEwdS1bYU@=Q;H}h_Oa7PdBXjmde~)6m^J%>(**)Ha`muSdHnb=%;9Oh`b1|j#
zkP7Dt6$&~Jo}f3s2gW`UJ_@A06Yw7{0Bl>-@L|UKj<XOw5KN=V1U=k@;$$h=t7G96
z5&Y1w$ZCXIpC-b>k*|Q;S3Dlt5JS)$@Wtvu4LJ#-daORcBuunWf*l{Rdq7oOZ9Q5I
zct@MaiF1;@jwb|sPQ~0?>Ao5VVpS99mSDWJ*6`ONO(i*1A{EU?KGAqBmtR~6IA4h{
z^N2V!B!#+5Bj%YA%}#~Cz0)TKLk{54)?E&g4ed$0M>&VM#r0SCw#O@m+>$35a8MSF
zpCTyUW-Ct#P{9zP4%v?msw>Y(IYwm?xY(JuQ(f6Ok)Ttw9O1N7Y3E&fV6GF!K4zFt
zV|0VfUh#Fm4Sk03nOfzo<k)W5eFkrj&7t>=-&*t+WYRG+_b2Ft7B&xfMUp0fn8z&n
zaE~eNc7#)O<9V5w$m=Mq&>)IFJ7uQrseW?qiZC$L6ur6NVrd-wmL#0JUwW;x?CFQ=
z!=kQ4_NIJ?n1KD-IH=97Vqn5v<pR&?7;cz*hR5i(5v+SZr^KuZ*l_HuW!7cqOkRx;
z^hoI{;)t{ZEwu$gsar|(I$;6d<jA@(;!x?pzRQf`5_h4z&`uLbRc>fuY&iWOM0@eX
zh3^RM7C`UGU{b|~+;I(nf{SoBd8cUc`guz|M4x;MOYd*6HPf;Trt8nYeYSBj*QE1p
zza2zM>nJ>V1nrEQcDo%3RQpoxDK~67k>X$ikRdY*0er6U+b>ch0>4bB(!1r0ZX_a7
z%mO^wXYu%l4*CV{nTXW>;t?xSubMSM9sAW5<$SaZS8D$dA;5}?m(LH~3Mto0sok)u
zbFdt(j$-8EdUo}`$kB&M$L9J~SF)~lII~`t>~SaOZh;{>zY$rP`dCF%T6L5HT~->K
zK94}?!qRZV8Hf6e{c(nFa@!-*k?G8O!L$h}q_KaQMG#Pet51Lq%bWjF;uVyznm3AY
ztxaRZtip!X>LSwN3QX}d?G*6|{4^q|D{etu<9Gljh@y;<Ny|SwBoWDgy|wpeW94E3
zwCHVMeAu5Qb(QQi%@ugg$^bkR*@r*mKPEampWPS2nFE|%wC<{;wNSJ(X1z|t*%Z54
z>N*Unc)L&#arcU|x#cGck>73{gSx~wK=&3e&e+G+@|Fii+z1TI0t^eFAuhSPXnG)7
zW4BrB7P@huUPVN*A_aISCc^CKT!rao2N4z~-X8of6-2eaG>>bgS7NJ;W$+}WR>v;G
zi-DgmK4uDYB@?Y3gmPYM!6F<OI;e=&fKhBe0QCvMyv<oyC^sUem(oY{hLSB0rh#!*
zYUAqEeH4m;hah%N!spc_ZRVZUA62YpMhuY7VhP06es_y9Xl8yFX6LK&BvZH=;-n^T
z67<LQV9ilDTqlki_qM%7jQ`L*J-mN+Z0asDu##&?u?K>7^$mqZBt1IbK^&hXh=;65
zk?|CfI7|;>e>}zrA_u!rG{g~mM(ud~DwY%LHV<nxzw@Mm5R!e%W!o0U!S>URZ`SOq
ztTJ1Mfx2|RR{h$IkGXl{T;WC}!i7T_3%_fVY5FpAn3tRF;5JEp5<dGmwa-uC7;Dhn
z9TsF<rC^cZNypKnSg3xxF0@~+dt%Dt7SI05$1nNcw@~9*>71bTnpHlh;Xsl;WN(B>
zuK3(+uCgFmc1c2u>oWL&$ldD2IfwZqX?UB<9dPB~;Ie`~wFqgwY;G~WNM||jtg;6v
zZR=N1Fdb4i9P%TM1|lwDqo*~d!UJBuetNx-d?nK{o-3j}|LZ%9y^G2d*Eqb{vq{!2
zQe#g}<6=#%VrdDvWQcX#{Csm^14U++D&=MTx+r2-fl$$zvtV4pK8I0SgIZ#x`LShv
zO92-Ui*6HE&C-`wEl__8bBv=YtmA}`7o`?8sau6HIP1xJj2=k_v9f7Gr4TVPGW=nk
zaU?ewB^aW=`ma?;2?I{nKy2@Ckn7}TKyvu<xQ`LRe2#~syVqvm3^oSh0Dgl^__IDG
z+fb9YFisybqAVsms49nEY-p_|MmJhuyj24#*GZwM<UDXt=c4~e52LlF=Ik}y?OASs
zrj-@+fkKh-?fzFV_fD#aQ`6khqw<A7tX44oClpiHuQ0pnu8l@QW(30i3@$3#LisKO
zzT=(QiahT1?;raC2#?+A-Pt}S$ID<B@_6=2!>8q6SQ=+AcEXl41+OH0J_1l_E00j2
zBhxj@A4>{~yjcc(16^Q{!p%uk_fV^qO2#L2+^MuOtP!}0iFgIFjH$5kz9L|bR$LxR
z@L@UvIu4nHzk!`m_7oD5(5W~dR^$n@fF>MmP@pe7CNZJchLh2NZFVUTwcd*@SiPu^
ztXNIOYbO$Lb6T{8QdM>n1OM=TFS8ZwzMJzsQ#qhv{7UdX&fQO@j8xRgpuAG?J2UK7
z54aF5gvde4T;z{rHxuxHhRnK@LwKpNWOqThQlFyQ2yLm>!uSN+MphiBB~VqQM@5<*
z3(niMsX;v%*2UVKlNH819Pct?VRu^2mb2aLSL|=VN#*r)1Ae3z1C;$()^TPeU!!8S
z|JopxfR)1~eM=?psCXIu%$NFO&H!6p{&`c$YEBXib2&tK<$6%*`Yz79#x^q`XK}-{
z!YYTtslSA<9#WQ6Ur|2ot_*OeP6Jd|`#VnCO(eqpiq8k;^ch*1feL>CtHCA`$N5Dz
z^U|1^*1_O012>$JVswq6eYX#n0<m^!9`~_{EcOyh^T4!H_GE!D`N^E6VNoq)v_F+~
zC={Q+hhDo<<F91*^UC(*$*XpvF#g~r3XO8u`t|a%Y-m0Rb!#s6=&EIuD(-Api<b5|
zNZ_&GX_q+D)tZ<b0fuR1W~^Rk1@X%fL{UOqU7U>NcB>nI3EnPaAb&$fCs{QhWI!Ty
z(y{XTc+&zJD@O#%s(k+v4?*CQht_C#wmb*3{zUp>??OD<uDfS2kmSF3DaW-E^iuH*
z;8$!9H%$*joh_UxS_iAVcEIr5z};RNWj+_-SR(n2h{-C?m7#RFN4BHqiKnRt3PmSe
zC#2j&*VA=o7W+qhLX=+ToO<{qNsb@w!5|%3{Le(5($8qNtOoHZM2QBnjvRBUVUv)z
z8eba;nJF|LC<!fMuU3PbFh0;%?6z>nC7=^<5SyN`d%N>WS4xnosc}Hq`M7eY3aklR
z{s6N5@Vggx7v|=K?DH*4=^JamSO>Ct#@eh@POmlLDaEXg%4v^HD|ZLMM-nEbDHpQ%
z28IP0saP(UIF4DQO}_3>GnEf{0J|2S%Sul^rjvKZ-p0M`NP=j(;+**8EEgq;$X<?T
z`NCk%yfSnRr)BY;Lxj=^k@O!RJrP!ZbF5fc|6BQG$HHXE9GClNGOTKN%`qrE?6j2;
z*bi8nL=tW*!E_=F%K*<;6FQC+!Zh-HxPc&ft{}07BMW%myRqu`KDX_r2;ADrAlY`9
zx9%E7LoLtCC@h4T7v}&^YX@7qy?|^#Q3THJ(pkvQ8I2XXM1j!gm0hN^C*~yRl#GRb
zNEyz)XdJ`B86<mSUkwo-2{vqF2$ETIg#(+SYY>%=M*&BUVRQ$>^mSwzL^Os`go-;V
zws@dGO~?$!FyBs5Ms-$|3i$$W0EvZz{L<7JT)zg=?oa9VUQD|qKEvc)Pj3Z2wuG2-
z_9CG)OGqC=-+;!}n3SNN1vsHxXQn1)dDnK5d_6QiKQVrMfu+tQxnhNc{<S)3#G3pO
zHKuYYlxnS@EBL!oFFp_8fcS2{KNivUg&w?-T>0ep3+1gog&yD-u8mxM56=ms3CW7;
zCHHyIVOMN2VgC@~RSz%gqHa#$e&6`uk?1^Tf~Kvvi4r9^lefrOk%i8X6#C3Fk{!Kl
zs;e%GE3!|JkcmsCwt%Mihu!>g1`)2T+RVS;ZSmF$Dzui>E9GnPa$-^kBVOs*@Mwe2
zbLS0L=UoOfqxS8)q8N*u2emGmoZ|>dwGmf$EzX4Gf@IefiCo4c#v5FDQkvyF@9(VF
z-J2Yd5++?aI0qPBEyOCt@jZ;19{5pb$#N`EljGMMv4PrMw*|Z0dSSpp2$LWL0$DOv
zPA>vgP*KoXS9Efu+2ZU}3rBiQNmAIc`1&{yBq1&Ykf=)zhbFQ?03(fMN@92mGA*3B
z{NS+S)S|}ef@|e&bS<wAB&K;5`1?#{6zTVoYY=gB+$D_q0Yg<fRE-VHHRzfijyBJQ
zu5K|;s^>IMGX%seO8ewCg4)h8##*pd^VA#{&N!JQNsiR(95h@pKTxh-1PWNXn>B?^
zl5`4;6h>vJs`uG4o}r-(b4@!9!@2G*1!)$kyNewL$1UAmMHaQO1^KdYDg<I+a@k+g
zvmTZ$>+(g`$yY%T)ZD}lCBht-BuT9!e`TWQ>fPP6zHt|o-Ay_yJW0OT6OncyGe@8I
zWGr*Pd-)`Y)AFA3Wd8=Cjk<2O;%?a?tcb=3oR5Trvw!mi5@AH5jYxwSibDR5h>Pl{
zxXJjyNXNcd7lDC!dO95jkFjIn^E%{vSJEKM3BZ&#-VLP>dEd^iL0i*`Q!)Ln4aM{+
z7GOppc!OHcHvTT~%~2AkCF!qA;2=5x*ll>1-nrJ}ijqp#1~yqf|G_khgH3Xb8~;pl
zPO;bk%*yHuIVhfd!3~tIXtxxFm72GmNan4DlS^Eb)oTQXA|Dyqe$=Q{x~mmO1<IRp
zaBOR0?*ZM2D8r(){>`mB{?$sym9Fg_thgt75UG?KDW<m!(BKR4@^GA0JQqdu1e}56
zYt;5t<FOonYLgVl=mnaoosyND6RbE*>^2xcMnSz=_e^cu4c?|kI(=&G0&=(S_yppl
zM(VtVh0t0h?}q>R3D*42GmLh!@&P(Ps_QpuVf8YUis5%_$L)^-&e-A30LZqtv2A&b
zmjIwKo)x-q`Ws|t1AcIi+kI;bcnZ??2xY)oeq+DxfTIptD&5}n7fE(x30SBFxK;}S
zuj=TH?FBlfkuZq#D?ZDk#1PvI3&e%aQ`?#LwfC^nOReP%=Y>tYZ%CVvD-e%~0$q?9
zdKvW&*R~$YR7jIL_LDUI3jN(Tz?>`l6Xj*SGwMJcS$?u<y8F>ZAQ@&{0mEBv57WGi
zBMiFoDMd<Z`^ZgRdoGr7xk9SiuL-b=sr31zvD<k|n?%5DM~3QcJuC0J_}Fv|7<yyy
z!`fx?C3Vpg-Zq5qXRVH}kr!d`?qY_N_ESuE#-`ijZXS%IQjN^mDIOkEVCG={B%tw(
z1zq;qBBCWjd)^^?J<%`~rQ9t90-!y-eBlnXv4)O!IuQiKf4l$!YtF&_^(|L(-kr4(
zhup`Dr54{4i=AkQSY#J)Eg&I&J8`u<N$W<YbgosIuO!XSq#9RI_+2xuoUpIl0kbsC
zb$cK(7fQvyTdxJ38OkqBDx^@!OR;t7>K5)sCYb58o@x+o)qYT~HY(XR#L)S+q_d9I
z6oTDXM(uOqa&p&A(LI(gaWVjH5lwT`={YKU!F}(ihf#*OXWo{(Kg$`MRXBC+e~5;9
zsG_xd;^E{vSb5GtMr<;H-I6M1g@(2VLx;Wl0e^$f_MP+)Ced5Z+f_0&Il)?ZbJk%V
zfVxI51#W^&rzca3)r4O2c6N9Yk5Jt-F#Kc@%{rI-ejoT|TgingzQD@OHI%Rn&>gz~
z<gZ`YR-ZatD$M6NfW{Tf5>DcqZnNL(bi9Y{RD3vhSu&4Dwww_QWQ%UfcQ4-hGyex_
zT`D1DX+dcTyT=~7jk_a;0rS3>!{|^G%O^8LYFXlQEH(&NcEF#i<v{Ll$&VKsFvO_K
zz#>WtiW&mr2fZE)@>g9X?;Y76NxuF<!U=IJ+Xfx>Zc6W78!`&}k;BnShjY7q3U_xu
z>^8Hq!BcLhw@QldMeUo{pvh9VhBCUZYM4SZ*gW18@y?4@JcLXJ6A27+-tWCIg72~{
z>-Z+U(&2sSjWA_AFnT3icM7IlMGf#atnUUf`HBh+v@yqpm%?x`DcI!hZZ0s8(Sr`K
zWtWf`j?Q)^*)v<nR@#a|xvXxz1HRH~>c6xf9E<ED5Y+<j8Q!;o0Wr=<;Q>{p*Sobi
z|NCYY7`jE1H{4$v5osN#hkT_g0Qah!Zg>m%FKN(ypY)z}49y;Ns_!#rcF8bhV`~6l
z+1x~S$;fxIR7DXH@B7WDsb%0)sb%#@z()U=oS$R9QRxwFvbhP*!_o9R4HB)OP(J-x
znUn2w`#?Im;v}Rh<ymxg?kun$CDWd<vl<Sd?7I9exY($?xBjb7;zyZW6}5f#3&p@2
zwl_O&Y0k@Mkz(ajmgh{aRSTj>c;&u9Y+p{rSWQm-nD%GlG|KO<?L|51J9NmT-XVb#
zxB~Z|D%jJe3!Lj)24p~oD*x4eSK41RgKPd3=kC`Ai8n>|<;jfCBZQaZ<%_FeXSjrq
z!BDEX10ZEKGwyOweT2Ah?+YEn;=&?p?H^}k5ObacU6wnqa>H8M#7`@A8^DT8w$4Ej
zt(}C&4*8P9LZcdHkv89-)pi;t#q~Ty6j8wYp#x8w_@(cOe|(j;xf)&F?zpc<U4-#S
zy%c@>Dy<B=XcIm`0NGI;0(5{YOvJI|EBM_Youu!fTg31Czack{-gl0)EhbTwp2(rW
z?=7r246OHgvK2Lq2%cJi1GHsNaAg_01@K~q`3g3%9djp6`7LhOnh6|-6<0bF^V0F5
zZ9@aC{*cFtZk(IXL)<k~Pyb<Rc(=lcF8G;GBdnn%U4*yz2RLR{zyPY#48)4*S}9Q`
z2gLpkz%`<qRP#yqM@GGxCFimuSMx3I$+XTz+3Sjce{t5oHBkKf)a-MI%l1Ik>}mak
zpW!!ia(JNC$#5<J<3&KN1>5n@#0bnfn`w*xFL>liEQ~-j#`PR!pq6ra+yZ31wRDzs
zi(>FUH>1ATndtjr)B9?LBtc5d>Sf5*Vndy9YEnB<PqQ^OmW?pB<z#+h%$I_){G>t}
zRx*j|nPS7CRBReH;d=joV*uE)Mhv5)c@oM?`L*RVuYgk4CrxFofit@~2;!WAs_xyz
z;8%i{rZjBBYAzOCY1DKY!DRV~T1-gnmv{B#YcT)&(B~PuTcq`2Vlvy24wvQrRH%tK
zZZlU*GK7wed@HvO0GI97g$tDqWk|c+0ceip8kVe`+DmQcJ9}wlCGg{E#cqNaUb`4|
zv^>7esU49Z^7r`CQyM`%MBjyZ+^+EeQ`tsvQLnckZX**Cf}X)n+DTIzDK<|N`R&U!
zK#9Urikn2%dO!P(+Q&57COXaxZlxjONg}uHqyXOT#4l6!kB;Bdo9P2W>-({#TwYQ3
zWPEnLwD=rS9Ym`h{~pnEwIHHDx&wlwYFU0Hu@U-FKJrWb#--F)e`E$#YjKR+Wy6d^
zvi;4MS_@z<HB4L6xfuS)xWdr3?4i-T)y+Nbaa=dc+!wxsxyOK|p|7h(a`9b|SZ`-y
zPR2C~nN-*p9lY96SoK4Ni-QpKAp1Do0>fPb;^{WHDy|wZ$`u*4j594i){ry=REg37
zpAyRkVoAh@C0`86DkBPvc;v#1knB*vW*~4Q%8CM>vQO4d*{oMrwvMe<pQ9_TM%w&<
zCC9YD&3xPVG@fIB3{c?Nwv1hi2A(ooq_T_#Z!S3xwWBiU4$|W1#&ZtxWkZ%~-^QLx
zOL*Kg$nRBcwURf;t2+Q~W<D>(<szmyRjLX>Dr=L$`W8=`JkZP#!`gvs|FAjy0XSGj
z5OB`89j$Lw7=JX{>Ev94)<9-0qpmjQ9zznd`{I)4AH+Qk+hzGTrxAXree2Nrnf)*O
zvTve*tFv<W`eOQ0(G$2gq4seD*#W#P>ogSPaQIz~rQJU_s)ywywQ^OrVv8xi7l6M+
zPG-@6k2#z!i~u8EtV>=`AgS3NwpAh*X2HTvI#e?U-fGt3yCI8OWgmg&anqcUgASOz
z5#Am)0no#F^^^DzAUGy|b1^uj{RHgQ_~y70pS2hixW-zl)t412&)USSY-6}$x5Pw#
zQ85=M&)aO`JEQ`xOA7j_f9AEICcgAU)Uf#pYdoDi1gWvuthN+Q8v=3+-I^W%l#0fR
z9o7cM0c0TPDk!d;sSG}jT4W!Po#6L|1U@)}0KonUWo=FJi%T6c3E-mMqknsOwBdz-
z-c41rdQo3%KV_`yzX1gt9cISVH5@~b=OPH2LLVXm`+Egy?>9>!vGh{)F?8}A<P`Cg
z)mT_-{{E<Vgpmam<d%x~8Fw9po_g3#S=MycqcB%>_d5id*VWt1a_Q^WAkQQO(R6PM
z`4CH;66L$7#la^nZ}vWc==w5Z(P%oE`D1&)v^Oc@<3+Dra<qYpe)2Q&kuFhdP!x=8
zQLi#l{mx;PHMWi`O(}U@+RfOM&pgyLPA4;)V~<(}Su7B#8e&-sQ8c*qt8gVn7QD!p
z%L%8k2m)<$7w^Li9wag=r(hzkA!0PHpl1@Wq)?5Op1nEB(_g$5-&nYqTKF-1e~2Kv
znnDyXVz=-VyG487bW+9KKN3WAlzT*w2u_4nOy8RYi}?e}hzK(C56~j9Azw}oiy&?~
zN)RGWk?OdCS&1*v#47T#$cI6ju+OQxTl9cuQ>p6GUZsT_N)w&{wD=aTQImJH-*4S$
z(VxKrS{l>GJ*pc_KxdD>3X?jt?0wj$7zJ?xxNaC;hRcN$3r?yvXD$^vMKOY;T>bqC
zSF(>Z)yyZZz4TdKtB)MdBQxKXd|iV}L*pF#IrNP|@D1hVC-qJt^|)@7u2~|N9ZM>?
zqM4fk40=OD20=4c*S109oq+T&K}%Q+J1C$>f;JH{FUllx^kFwmIqg!X{*SUH))z1Z
zV|`uCeoa$fgY%WxZ#8fN7{~=qy^x}$cRQ;n8&*TZrlBE&Gm^t@wW0X14;#tlectu>
z>fcFerZVwF3g%7wJ*<BxYoUTNji7<xvr&IGfjV$S{lN`Nyl-xHWHwm&Nws+2L@Avp
z{P4Bru)24y7%_;Y5E(H(CDMW3;Lp<UC4*5CrT)<>4Dzr78kfrTjf3Xzib|k*8uUtd
z1U}6ZNI(0<@ifah5Y7ZW-qatqqWZS&S2JUNJpzmxg$^d#;7C-4v0;wA7(mXYQxH)6
zT+k#C`V^~05u+SuZ-NDcT8_1wC<O|wvK*eFeCK+kt>f)bmsBfF<MVLvaBpd~SO1pC
z9l2l>w0qB*z2PwD-9Nmes>U$Y7Lf7)(|=R|-dY+Ij(Ur{mprwU`5-Y`9m8eZ4<5I&
zroGbQC7zF~hN?p8ipeiBmap%u$c0BQgBY+kSdWsANnN2>D7~QEtkQQyuDzmt{_A#E
z`+)_<qH<bK<T`|DH0v9_)dvwc0e!~E{PfvA`A?1l^}lJiz8W!Q!%6LLJ`h#s)fA^p
zd|H?_$(M_c%A`}H?3`x$mPb+o91yyPhR%ZM{xU7K2Zn^2MNiNwS-VJL-Euc>4&oE1
zZagq6PnHlanClKEsqJ=aW8WicTd-$d>^?}5!nxg{ak9;+GOV2y<cJ4Nz6Zz8^a~hN
zsQ?e($nFa~Iv4<x*Ei%qh4``#<dU3V_oz(-I%=)KlfEbkcL*M-&en%c+aGvnb~N3t
zGdgqD_owpD!RU{|<@9s(>(`Tg*}!<M+(;M9=%{Cq3`Pf3qk<;kN*z=iN2tl%9)z$`
z>lP)r8fRe1lqY~N21qq!lr=mR#wq!hEk{uyCp@h#w-+4(6pGGxu3m>1=j0jhM#K)~
zo0!H7`_ZFsg0@t#TDs)RtCpUrJEDTLg;(a7W!evL2FpGj-eZ8EZA!^Cx#qq|s&j8S
z!1%#U$H%L2plEmP>a*?jd<`nRr?&Qs5ce$df6za%^p}V*PjXZ0SK{P4o?BfD1TEU2
z_tyJ3`!R>x)!%UNzB)y{!bHieewI|H2#Rt9bdh?(Tu@1geQ<&7K_lTQ*O^axz6^7n
z4vLvTCY@u;yQ2v;teEQR%=-ohdbL}S%!SHaDs~v1QLLQge>Ibr)%Qbt^6a&(_$QG%
z@8^{R(ep~k1z>|b^3G3vI2JmoYPvJOyj9!Nbrzq_J88AbH-#=|)N`Hw&n^N5B-aTM
zy5S`EpbD>o?iu%t@U}p!fu{=OSN&LMA5cY8sevKmhL*p31`_MYFY_)5mBX+L{tD>6
z#x>QD9!7p+SX4QP8V|Y90;ZBosSUM!jHwGt=xw?sM8n*5SSffIyZe9%&x}1~ayS@b
zD1{!ywNjk4biDGOq@y0(i>X~kaxkc*5g8LACeq`S8S^H%Wdb3;vOK;}YP-6s;UmQX
zo3^!%GO@#V#9XHbRMFb=mKx{h&GmfC%D7Rb?d4*J(`FX6+d1_%_9RFB?*+c7?JbsE
zy?9zo9aVpue||arRp8lbr=}S#Gn|EHe&umOLd|@`#bUCurSyGpScI3u-t2mI$yBrC
z=oUoqu{QIOdfIeHIbpZ2^C!b-dol{kSMvQIIwK47Dj8LZ$qg-$y5SsONhZg=EX<70
zy9+3E+~oOjyt!mKj{i`PtL*({l`4(2s2(d0$yFR>v1cJ|_r*OL;jvQ7UxEZ|e4!EL
zg?u-o$-31Or29`K=OGMQgq`AAaamX>o)^CIZHIudhKFKH@;Sx<zv||sVPR?hO~WEu
z8|u1$JFCF}+G?f+r2mQ|`e&i~0VgEFuLeD=XLwmrW^!6!>u5(ks&sKjaJbPBSFF@q
z{bHh2Ur?-dd3gPKs{kW24C=^@g_Wq=!I$PQi9Iftop<qFnK--IcG;8a96D-Wh1i$Z
z;hF;aF#XGO9dlqCi^Uh3W}h4d+P+W-rrR+XSZz*VK!(&{MBaKX7*#qv+DKBP!N9-a
zyQR9e?&ac<JCallh{`ymd4tz9TPjD&wbj=>n}?a8GPYeYyD6IK{=ukVX9IGP0;lV7
zE|f|1!?m)jmfbOf-EFkiz7x8Y<aj>6mBd-3vzswBQN&|<3Kq|+e9prJUdGy-iK{S@
zw0aNiS~KVUM7+fyklbb1W_vir;xygOG+4%ey_MdqMSt#0Fzox!#pMGP`3=|fSj!^%
zxl^%RTPnu6$5%3BQ?c9sp~MM&|Bk%$^t1Hs(=Ub@vRwKl>>Npr7JyPYKxCO;w^7{5
zQTq%{IuCdqdsPrAJemFLr6OYa=PdeE-MTA73!o@Y$CO6ANc|cy*?iDjt9Ae3+sQ=I
zv-cwoS{lDXWf6a4z^n2<tdD%T6KG~11v${}SqU(Puo*~@%Fwp26{pN+gVFo{+_Q4M
zk*fvAfEeK%N${lu6Vtlo6^0;^5p=rP15GU3D#lH1oL;z%*t#7{_>0k-Ip8VOKrln5
zF<_8vj_a2_f-C?MpoLbe2B84pWCh%lpXX1Z4pg%+fgP6Thy&hHc{t!zECLcSZw4n@
zyXrc2C$^xdpo*1!^?V^7%FCrg-R}}qTpqkIk3^~(X(DLEn1N_sm{JJMLK2`n;Vau-
zfjhPF;anPSn#3W9HSJV^F9|o$2ph(}?0r+TW=sHqk)_SuEUuzy2kk2QV*dgLJTNk}
zOfm<<haY#|5TRtv5*y$;MI=2OMD2^~YNUP<d><y&nmyF6`MC@~Y^iax2ivnBSkgfm
zv>?R4sC0g8-=7+DiQN`z);%FSb64v~17cJ@hI`d>tllA)XB0zRC4q9!Hb|63op77%
zJ7c%6<CW$zCZX=GQ>L;&xHzAGGS7ns4{@t-)%tOKI-G<$X4E@L_{g2`qI_eI|H8-u
zeY!~2>}(-#E5gLH7$#lPbt|y1`xLh1ze9q1o!2qp=JEcgo@~PaCtBuqE%=+<ddm|x
z#)P#4uI_VWrOOVqTmvjhK%m*M3U&lnn7q0k^K>A=hzKC86-YG0SS=FwkzSt-pxk!A
zELw2*i2J0URW^c@pRy6)Kb$HjBL9Glv&xcJ1`%xiJcHbu#3#2WLz49s5>|+p$8UD4
z5ROj@;-yEBJzz>*D2{21tO`g@&N}~AF_g$kH}3T|D!Q?XT28eeraMpYyxy*5hdYMF
z#G;j#Df^Ab+1o6t9b$A%A1qWf6<k_5SjHGvK`do<`5jO*ar0uYv!@o(EkkD9P6h^k
zrA!V|MC*PgY&qFUSqUJQ7QtY*<1|u$ESB5me(L-B3u_*`e!wsI<J3mOqRU3^IZ|SZ
zgT_Sxx&JIeBxt%{d5>MVf1p2)X8f0o^zs3kf>N&35qmF9tU%FAzB2q;ZqG|BY@~dT
zp4Mcz$@*K;q!E*OG8eslh4s4&o3G+~_+!R<6Djzao$2Yq;xduBaCFbeS-3O3$X~|D
zpbJ57Algxy(2rH10cdnwT;*R>Hf>Ng%>CF_^n0+tcCfIBkWNV4ih#X}hE7^7fFPu_
z-dMd?t*#&SQ+$^CWfSGMrM=Qfny<CFlw1bHZ{+jDK8fH?CclK5>0EJ*LT&DrkOYzY
ze<3fL{Rs6!oPFV4dhIFwJn7pKgK(^M^dpqWfBp&e;duS_z5BS1q~w!M=~Rop^XhE*
z_xIPcuw0Yi;vh<{Px)sHA=i{<k-<p3xsvsc!%RD(zvvx)*_Di@yIbZ=>G_MaFXT!y
z|Ne=b`XNwM;FCCp{)pSJ2*;nV0%JSbLa$$mTd7Xgz5ap!*U!K5>9y*sU(>JP`ucr!
zBK8}7-)o#YZdsUArm6H{HFQq>HQ6t{^O=vUKCiWVg<}P>OA|~Sf9>v)gebi@dESy?
zmU&fi58CqR9u1ow8l~kS0JZ!s{?!<2HOmMFzDh4JKHYBiC&mQl_4A0dSB6eoSP+T)
zP=ItD2=xjx<VLZ5v}U_VP~xTkJzDU3<xu@NX(Mhx>tPE=9_cavOJhJgfA7jucDHSq
zri>{ufgbp<Jd}7cZ7ddheW5s;Cq~lClc)8vlj;1^gadze(-F>3e>bWJh1)^fck+EG
zG_BJ!_3V;Z#J>ZQ<lgToj%8C;N2klfQ!CJVkK?O7Yhjhj>ZCoYW@KNCP$o4g8X{0J
z|I|h8bdR-q^^B~}_sBIrC(N{jvbvU~%ZPzJypuICPW2AJ`LZFHZuvHan+29HTCl47
zS*RL6C7Xp)R^#u`^)Z{zvQfv|9ogc2-Y$7o%<$y6$8?vZomD=SMC`pc@f*#GoL%JA
zwTKPIXL@X*6HEquww@jq8nm~q;?gWFyJ1S^OEqK$%0Ava&QNH=&CpOpguLPTNoRo*
z>CFIwY1f6Q$3s_t#nGTEtD#{pxApOEBDwx+A5n9SuAa<PcjlPzg$&B->=tuuayV?2
zD#S@5@k5Y{*Vog9TGZ{6=)}_Ph(ux+8M98BLQj#Tcoylc-8qoJ+&1+6drOut%R6v|
zuRlinBrnIc>^E;J&comTdI1QU+RQ#UQ$WE;Mt~C}^aiR1B^aZesWb08fER8{>kbVi
z;hof-ETY#Yc&-xZ=<J28%bfSzxLJ7S8dQh#x$aFsby=<Y_<&2Vva}j6{3|BDP9O;X
zlqc62)@v!n>jY%IewemH=URGnvCimO^O_G`XY%DIm2qJbv5D|g{9a^xFh$>+$ctAm
z{Ti%{+aj~L-WOj7KyZjK+(aDGl_w}K3u`?w3+=%;DSY`?x89q~UBs)qs$*Ul>{PjQ
zJs)c2;{5FaxK|_?#$nyZP<3g37r2|jhG4jB1Au|^Z-SrEB#IQZ1)^)|Qk`1Eh`C2)
z(*zbao8;333bmU&_J7z8T2Bw!z9J36*^$u+=2~t>G?7$D4vy76Ua?%$NCp04aO^J+
z`2bT`r2P1(eNz@g=t_z7){b*(%AsO8faqGa44Iyhm-u^<g5wsd(e73oVC3jZDB*^#
z`3Jay`o&K*PKNJ21XwkyteUboaB8JPDoR;kls^Yik2EaDS*v^3@Yg_QLuQ0%wg~`M
z8Z{KyTl+0`hbNC`e+5)rwYqOPHr=EgR4I(Ky2G)?kI-2|u6C50cGi5;cE^9kXr=CE
zK8Q4+Ug(}~18Mru!*Xi&Mf4}c&sewM%{m;f^j=V1;qRqyM7TPGO5%36lIrcDFw|3u
zd+)&vxB>@#A2jYS9$gd`x$l`O?dSwy?3^QGQ~|QP(l7TboDsppwuUGB>X7TWUBCx<
z-g;HrdGP3aB=ZgFZ{69nknh>AMYwh5tfl8;`f8EbM`_nYjV~8O6GsL=HpOrm9weW0
z;%$CM+mAW+#tr;Ie*lfdE4RE2hXS;=G0azR)<tpZowG>?3OnMhLAtr#ymzAykC>-u
zBD0*=o6Lt*fwB3@K*$;_YDyRC1$lJ))^`R_3iiXfR*(f36+5aWUbFz7ZBIH+P_4w(
z3GuPd4IT0I%T9dp19|78W8yz2@FNsEG5BLbmXBr&RgL((AF%jDd#)~?pKHF5Q_mKF
z>h(W;Y__|?^y;x*Ztz_7ky{vZk^QxYaKy4Z-1AXr9T$I~qopgfByj(F(~K`!ece*2
zqSH0e^R~<L^xO0@{0yeA&!L8X#HRVr@n;{uEg6|Als0arx)P_-d@)o$m3~#Xd`B9-
zTZegNw6ofB(>}e-KL%V9Spz@19ibx*y;{Pm`~DYstI(?}kSh8VsPV$|zU1zML|_8C
zPNHREAhmXJero?Eci93^3j5EFdflA%+gL52&2VoxIu6_v1r=sQ8xJ)MHQ)P_ZYtuc
ze&FZxTqYoT9qJ@VR9C&wu^F<@`4@6H*U>)lj_YJbSUNheS4gu`p?y@HS6KTRy4#t+
ztoPd~>pA+-;`HyaRTA5JmPrs-N0_RK<(X*jciC$p>huuc=*KcL$J*}7v#aHKXFpYC
zsqNYw*u`5iY4dpx(>T@sT53Pv(lGX6wf^=pU~Ycg*tAi&T<nsof#n>MDlpc-<zU`4
zYagF7zZ^&$8R~M1inG=*db2!_6-ct>uwAxs6F^%2d)%|>=Iwr@=d`@M{;e}vaO+ua
zg-INL)z0!g<Vez>H54lwdLhQFzEJaUT3{tVthY1u@fwH9fm7`Ji;3l%kt%ua&yKA3
z{i<Zuf`S+ER%V+i4}&DmTf(|zMEb9M9)$7TsOgs~p^e$R>wfnhy!UhgP>WeG+iLrS
zi1D&o7@m6g8T>D1yW3|YQE99jgDJaBd&|7hJo#R}2eZYt&Ak(#wKb>+f<Y4KZ)kPR
zOi9crb=1@K?*6GL_lp;ecu=BpdM7!bQSROl%kyH-YQQHywd;&{(b7lHiv2z;J~<OP
z-0+p#N!d{TJ0$zC1CvYIZ1ka4m6|7ds^3xdJh=`ZRZYY0`#anux;l7%O73FxLudOb
zN?ZY@oa5b~B=a?~#Jg*CRWw~s6#f2;AmYTASrxbYa&@f*LvZ`EN23ke=c{|yNn^-&
z!-YYm1i=_44Ba1BRgPN8=5HZ4@&kodFCvtN?gpjUyDHiw_*UaQ>e;evS2!bV)X(~7
z;rZCivVaIo-aX;1roM)&jf+OeqqEL}p-@sFwcuyWay*Sfs!MU0=77$jCBF^#+ziFh
zFf5B!OZ>KUA;>lFPH~4*c(7Pk=POpg=in5`^<@oTwL&*+kMKo{p2$2M95%W4B+c;t
zi<S<Z-;|8$c?Op#omMi>;$I)Hd}w6-N@8%L36M^T9}N;!86uQVzRsWyEVlZiww--Z
z*%%UfAyE|Jp6eTgl@P2ukn`+=saB?SH!9RB1)n|OP@(?Udistx8+$lqV+zSD429)c
zptx!H%<_W3DA4L1RjTnf)PfJC^dqWK5lB6%H3<c%NH1RGMQXh{=#GC~y2NvZ|Gh`L
zVAqP6Rc2zQww=45sc^mBi6hZ5IS!u*>2c;KzBr`kkqTPn6hwgw0-!~IV^qeleEhrx
zWKFIlIhS7f@|Y<a&N22<_YF+SAh?T??zoK~H){)fR&LLlUp-P|MdcWXgR)j?F;kJb
zXN<VS2974_m#=p?@U7P1K1ybEwmR!S+2^e;`gWvWuyuRnqAz;i9$9WcTq$P-X}NpN
zDF5ZTHtXB+Oc3p|X@B5&d{qB!rdYR)rQTYw&sL$P^o(3$EpbWVt>{CQ?uz;R+#1!F
zjao`x27CFpyQJgaIVc$OS<cYK-?+*vzg4&{Z8Fp`OEH%}F3q(8bmz@UZ+v3vu@Y;J
zY`$}s1&Opu=ZHCk^NjaMXB``-52drI_!4UycukV$TF>H2`fg+!j(gvTE~F1-&O4*O
z_wRj1yz4&{60-Tu3-Mq7(lc?IRp#y$vFcSqUj8*6xcPy1ze`0~z{n6A6S&Y+PB2^K
zj|Upc@Ef{g)gBIUgOk&OmW1fZoRdMtzNFx_qLLfFUS14JmC~jndcC%3dp16Wpi}sS
zVBM(356cBS#W0!DxL*M+ClDaxQpaiwe6RHbG{ku?bB|iO>WG*d3xy^y-uv#PlNz<n
zm}h~6P2T6p^33H$E_6mkZ4Lw`gD*Xa8PB5_nOzFIvs@qYUs1wS5KnjPVe7vb@x$!w
z40c>y(pB~^-L&VmaO^EoY{C+^Y7e{Ui)+|G61WbPLCj4TfLbq9o|&B_e&8zKED75@
z_%s(IwUd~xKN+>5ez#Fhk$9-tfoT57UFccpE$>zJ+sL<{=+x(A6VDB@6=N-5dau^H
z48DH##Z{C07FRS_ZQ^|CL0{zDo$A;i_8fD=n?jx%Vy<d0;^*qnul+jjvp%GuKlMgY
z!WnbfirxX|XMI%9RR2tcQhi7+y&Ah%)>ZY(q^^rBf--^b+*DCG_ny(6i*b&^jh8-6
zOb#ovEbrC&;tZQw0PFQP%a^sZsemXqs)N2brJ_f=yVm_7Gmx?bh6^e13LhbU(A!eM
zs;3e()bXbvxmmla==80otw@qj)GLp}m;CveS434o?k1%e7sqYxn`WZE+&|}A{p^8|
zb<H9FQx5);4?K;Id7{@9(>n8^)`c<>g+ev1Ah9$<bJ?}P{)m%@sf)7&@Qd3b{P)UY
z2k1Jd3ifzfxtwQ-4!(Bk;F~gpb?QjRGZYa@H(i~F{@&>hRnn&qtTq_BV){SqeRWio
z-MX&=0xBsYU7~b%hX|-N(v3)W=K=u%ky4S64(aZWB?3x!!y*KvbJ20<^81W)&fe$l
zyYC-&j62R4Yv?=R<z4Tb^QrmF=lT8cuoiY{lRa1>m#8BmI$riC(q8Zh;Mu@e*H0-h
z(VAweo%`oAK2)<^gsJyJV~=-ele=G@K7Ei;Co8#~+LCl*#jqlYHEnp|jV=2KwjrBT
zqwV%W<#+GXu&SBPmsd>%5Ft0EZ!}e3AwD!!<ff#l;7t`&oyWASCJhr+NiT1iUS6C>
z-k>3FJBc+kAASR$0tg0vS|u1L4eyvtt}gMv^gk)-QIyo^;tDn8Z?o6nCd&JGlbax$
zrX9;-Ofk1YUc|!fKBa0?#j+Dg$Eu=wpubj5Zv880Mcw>sMlOxEpm(*Z7g1;!w5%bV
zhWU3(>bYDl;rf^O^CK@5?>%UEka3iq9zM|G4EY?S`N1xhEWcyrLaaxW9R-_Vvy#RB
zx{6nUL#WhKOR1cssz#w$w`;^h?(0n0-*iJ$*D8JM1zs)KJ{MKMCGCJIa^)_kkRw;j
z-0i8<XXh#+5k2}6B%`kmKM_1p6LKVQFEy`xo?HTFpnxQL5$-}*B4l)ma>maq3JD~(
z8Q|wC8u3L#$3yJLeBalGX7acan8cS<KhB@tnGhKAERe~$woqSy_c6*<f8dBMo#M&P
zNb1%mNU}PgM(Ft;yz~qd7{Z+hT_Ukif5umom3Iaz^M-qQ+OL1Sd1n;|?e?-!tM6@s
zd^L89A-ab0H!$VHZycNA-R5{LLD;?76`h~2ptTCFr39j?a`A1y%ysEa5|+T3OzJzF
zuOvc>3!}K$4%!4<pB&O7HauBEmPYn^R7`qdpOUI371>_o>gL}yYZ<eiyzI2_ob^3*
zpk^6v-}8Q&db<j24Fm42+uHM)@uUQz4~taGur>^xFZ*0%@psDo5Dp+82oaG&|FYI9
zYlnz0Uq1!$Wlro}K9=M0Uhg|<3oT`a`RHm7adl`!PE;#X+9q!Y?Nl=OEll4@sw!v^
znStlrCGVLVN8fsqFO%awxwqr;q?-*ZvMOR(DE~d7=*`UCXo3jg7-f`p_k4p)M$++Z
zmq`&@;q7K*Z@8#u<II7A_ip6&<`u(EHAkrg#hk#jy2iTJlDk-oz5_MRZZJPrPdVqx
zX>M*Tol%g=D1@%QhMg_(mS~R6X<x0j2E`z%qagT$lba(;NRl&-X$BqQDkcoMb>^pY
zOe*GvR+8py2$|$;8<Tt5eP7sw22o%u-BCKh^2H-5@w@AXQG3BKTC_zT+*jaecHt+v
z`B-V74C_f?gNMsr&>beNd6Cn7PS1&q_t$a7Lbav{cD0{PqbBk=HB?RvIB!mk2k(Sx
zS8|<RxS%PK3Q4_3Gpc(2mE#a341!unoF<w#DrG2?zQD%1Pwg7l>P8Don<7Oi@|e80
z)+1Y-YpGB<HlflNbRB+{dsTB%Bz4vvhjt{k)g`BHD;!Gvx|z_1OI0QEb=n&*OY*Yv
z&04f+O5zOjMZ!4_ZaF)hb?X<8G3%6%sa~)OdOw(=2Ua0MWKl$OCs={l;?<YKi_<~~
zn#tbhAA9dBAjcq}h9X@Zev)ui<XQ8&dH`CG6j>wlY@JN~C$ql{;({l(71@5Bv0lwn
zSc|d?v2ip%cQhiE5WRH@yKK}K);SD0(tr~mu-X-?Lp!=8tH-NTnZi{)q3C(0ydJ_6
z<8P=Wtlk$?PUE(HRgBl8G%|K3%(EUY3tF3S=FG`cFwUoWGPI<tzBSV@#oJ^bi;C@S
zl205iU~Af6psjvMzMg(eVcM3nOSvU4yh36V!s^Vfo<E+zz}PDL2H$AN`A){}w99yZ
zf!=vQyr6BP-~~xgZK3W+zJ}uSsgu<q-sz8z#}CB-L3O~|jP=bb3pm4J|5>YeB8j=p
zJ%(A+;MHR(66<WuZEq0l89nDtJM6M}NC>lOvbL=nUy6U-FzJ_TFUavm8727~8nn4$
zs(<5n%KLO?v-5O)u5#QX&n}eYo){ANEaI4%OKxL+yKfFBd3S5~0^ofJ5ROko+~x4>
zJqI0^2NW_7>8DuxZ}?MTj658kB=h*5N@Yyw3}81ByHK1sko#DvP$ZP=#oBgbMht^v
z-S|I`^*wGeYNqEzBAai$#jW8nK#clHgVbNsnGN;x?5*~a&zPk1#WHH%8<zSvJ0~^#
ztKKVFT47-NOAxZzf^55p4dMEyM>?2`#V^CXuZ#gsq?X-WW@D%CoI6!M+3AQ=W0He8
zs;h11X=kgLUzJ>sa8Rh#yvD?8>}6Gk$)XpP(2yO<ubscTmhN7T+ljYv4YhY<E|z5(
zZ`8O0oQ{0^+6Wov^WF*3KRR0wzu8$1Hd64$26I9s)ZKMw{d29r8aA<O*n|V=q$8Br
z=FK=BAdN9%_GD)d1G-bpXFhQ6lH-$i^Jf_}%d-e<(w%|Q3J%lBqCj79=I9~e-7nM-
zqLOmP=o|9<N|0R&t>&w!(Ju7Q_ZNm7ntz0x#zTy&N1&PmF4>Nz!0k;CuoGIsgf!by
z$`X|DETdid_yLIoto>sM$f2Kjv_X0u+NCvy0-V2VyS-@(Vs<{NevPL4+5diA$@`H8
zhhC*1&w<KGlNh#A=d`(PrR#@MOsb*A;E6HkgkkqBpUU*j`%`RA+Qkz38z&x4+KOIo
z2L|8&9&>PrB=s5e!|u%O^s?M%;%tNHW6`E##@i~<A0E<Tf?^OcA5_mNQ#*bCs{(pj
zIV7OMro~oWX_WZzTjrF1hZ&xksKt87=>>p4)j8ap7A7vI7p(arf1%`3skcw)E!|IU
zXZwJB=fRhmb{rP?q#lTpc=g!Qx^pFJ5Dm4(I!+)ZM(X|a;n$hqPcLlI*j`ENn?Jc^
zP2ZTK=9`FhK7uqmcxYRd1SIcMGF+;%&J%N^NS|fng?7)f={=~Yr?sHHXiQsPmk}10
zO8yz;f><eq&-aKsaZ@`vaCTTIgxE|)|AVmdXB<-XP!irAR^Oxsfx4jOo1v}jzAypq
zFOtIZWFg^o+!#rTJ2PJe>g%S=vl4Sf+$5eOQ5=U<-%h_fN`;a1mTivn{`wVmY{JSl
z!7eTPc`}BXoC(uQt-#reXuB%=PK&^#Wb&3Eh?3vnv<}4<eF;~!?x%WLYQ1>A=zw;|
zLJ@^Y#~kZ&l45!0c&rwadd?!#qZfxZvH8}Cm4cr6^pkSzDAEFMRo<W~a=2UYQ<}cm
z{(WzS07pCemOBm7h1W|CL@}VyZh`vFfGe+SOINeIcwV|<yQ!-w^htHTaPjvZEYgQ7
z&k|>5oR59Ew!&?JgN3{uMD9K%mv~_E#ij{z;AEQQG9bW>G}_fn>Art+;hj`FF{((Y
zez?FHg#`<NZCKKVb46v<Eq_zO&hJ%Gd<k^ewXGpBpM%aXDkl#d+R4h=`e=-FsHHgR
zCG2$Wt<G$I&1$PwWmLbvP>y!Gd45=maxQY9IL7i!G2NFratw#m@ZpCk=8H*(0}r|N
zt?HHoEGed_%hONEPl)^?yuIt=*&SV$27Cne9#%d63UlPRZWjbrPZ#e|SnAWjS@?|_
z5mD2WbvG7V$?vtjDA9OrUkDFvD#uL@?8aCuLj%!6!qX+@P0~mBh|^R{Yjdw_HqbNT
z9q&x3X&Z;pgC|ti=5u7Vbs7`;h0K>!Ez&U*zO;p2?ulMT9?#r_LII%Q{XHEGIhze!
zFVB}^B<psw+ld&k$2-<FuUZ~jdR2XLbJwkbLlWw>CR)FUHq72((a|B;8PPtpYd;Xp
z@8BaQFlozmHhOo3BdPV_SF#J6_~&Ly6)sH>vxkHvZN6A1t1-p{-)t`I`t8>`7qY5(
zXA;PzRV%R5_wd36A7BjCsU<QF;&?^LvOvBl%%54R3e3H*n^47=1-zNjqVG9S^ywEa
zpc2wAWr|A%<tJ;>7e54s{}A*P9VBLJ^zaW)ndiSr-pA-_NygY`NQ-?M6<t4+|7zg*
zQZ*fG&>Bt<VX`XoXz<N%0X{Sdgzt^#p*>*x&S{8~jM0%7U51xl+Qkv2@qlKr_$)M9
zCbV5y{EVGQCD88KJx%;g0E2sT*?3kHx8*38EzJw>(<@*5VRzDEneVSG>^U&7I%L1%
z5bUyI6RH{-_a$8Sw|j=7i7$_BaGjD}xd0q~XkZ(AF)e<~pN$~mq;Vt{j9z|Bo2cSE
zL;h;*mP~6~&#qY9E)EXbj`d>^1LIv9)M?eZXXLvnO3>Y=5<H1LS)DXx5;XIJM#7Ci
zu3{^Tj<0A{IH<-1>4z%C58ACxC3Q6X9)~{X9DU91KqLH8LJ&WFUzU%F%xIxSxq{xb
zrTlp^eVtybn24R2wpnh-UclmzGUVo=Y~6E~iA4s@i-Fpsi&IcbIyPvit&%A*(@$Vz
zx`qM|x!<7d{s7kMem3VF?eMHi8|t95`{|zZ#36GS@&$l^O1K_$8YCRysntQ{O(Kuc
zA;Grq=qayK(86CwCDlbmO2}1u_O<~n3Zh`sBb*(|Lxo4q(G;nXDW6zhe6wp?JK@=#
zDq5zkXkvnTPzX!KGDHv^9Ii{WD6U<(adnbV{bK?l<I&DTuR^m+*1V0c-?C+sET<jW
z3LoeX?FR2WPJrj`D4oT>hPgG6Hxjz4wE7~0ih48jAfC9~({BMnj}R{X@6Vfilx<M_
z)1V#vi{j5r7i@udQvGg3tG3lKDM=pmuGM}t;26NNQxu5}vd;-OTDU(MV(<pLOLb?6
z_-06{POAu>S?%^tk0PvLPB&N>#9&*e`D2IP9(ouCmL^Xzj5v2@i9h7)a(a2)ZGALY
zA<_nS!@kGZr21L0ZWlD<wkxS_EVwI$lIHFPxs`PBChg5W45h-8dMK7VKY+}^J{r@z
z)NSK0y}m6kMnhscP&_)z|ClE9^a4-cGC7qCW=}XxAhDLqwL8<2s$g{8aj2*}Vp>WN
zTK8tilR%C@B$}(;v8q9>YNtnzhW=>QzAg_g($=Q?T+q9+T`)IIp60#j%r(o#VQHOb
zbnm>>4F<(PGuLc-eg&!9cyX;Yj9_kpV>SE!1kOy^JeeVBRW!254E=nAySCla%mz*V
zo$@W!b4>DGjcY!9wqytJt%)^TIX%;sssL;DcZFKv<TCkd6w$ee3I`jtEl)c)bkVut
zQHCN}@ATbxw7>u(;!#_2w|oxo`SPi1JBN&Vk~^x~xofz+Zw#qh;6)Am5Nkrs9+BQ)
zrN_n~2m9{$LA?Y8iRuU8<(7In2I^#Qk&nDqN68K?S~PgHO?vohp-&kQ$55ZMLcNH5
zL`yk5H>EG)s7ec#L7To3e(x@RvdSjOnH#!)v4^#)0Xbqjbd~B2vBVxf^)we-c*9bh
zr9=BRVcl$e8hS?tb#QnzyVM}vUR(ds0fHm01As87aJzJoNQb<TS9N=jYsBl-{)tma
zM~G+CRI)oB-bv>uq$icMjYYMn+?&B+&VkQG+QM6es5sSh`50h-4p6G^d}=4T%ccV5
zRT1jF>$QsAJ8=|F;)6U|jU$@G{d9Dma22o=Sm+h)lt;rrTpgL!sQUIR<b!>5c&8mW
zrmu3epDbZ$YolP*RD%*KFBD&-QzzvxX~b44l?F5Elz)8I{(&caSx?JSX7Ecj{Cs@x
zOk=DqWAY1cTVI}f(aI?gYwh`0+GLZCd#m3(ayxuB!YUSAg-AY5rM1co9>3kW*cLsj
zDYZJLy>M6GdsSlB5k|(#AITbexbjz$tb;ZMW^dphY%6%w=5J5jcsx59;f*%1^?;CM
zqRE5b0%V-NzE^*xbf1v!i+n5_6<turEaRv+*=GiH31Oim`W)OZ$N}o4BM_p{phZ=C
zCbhSB(sLN@lQ)bo>^{i2U50Gr3iz(85lI$`XmKay<2$qkyXH@(33FL;+d_y+6^G?&
zzyVLtcp0Z@&;F_?kB&@kZ$~>?(X7p&<#TP~G<6l#sJPS3x?ad(9jyDIp?imaa-_KD
zQvGx=fYL)DptkPSE%JS0k?)<p+{Xh|Ba5zx3c5ZGZ?wkVZJz&(!<`*D`NF=j*oj$X
zu+z!?^=us0NwCnP)k1aIKnI7X3D!-DPm$u^=W^f9{XE-8>s!7^HNF90EL9(aBK*Wu
z7!|2WUwcpH_&Z4Ex<@MmO0G$it50wz$=0NoVc`Ckx6})ih7^Zbc^LPxr}R=uuFjv@
zK4I6P{&Y(xmpI~->!6^_8HwABNiIRTE+{QVmD2yg_ELP2=98~&>b4}D&8^u(Xn54l
zMLh+hv))K>PF4MOS<mCXj4Xdd3teDFV#$09*bWf%7^+^Qdjef#PQ?sV<b1m5eEeuD
zMg$9Y(W-n%xP~9#9ZaI!9$dG;R$Pnrm6Ec*aX9}TDau+w@n$ij#pg##mq*=-rjsg~
zi@}}mM%B3}O7zPwWBL!CKM0B>(5Jdt&6_UV{@RFm7SzwXJS(1a1uAm^&T5WfkIyk<
zuHV9f-x544T-%~;d;TcoFOU3Jnl)twg{`qt{;(ionR>ltv}uu1<S@pXwj<f8K>A8A
zts6n`jzE(3HaY6T!I0qlk<Q^-nd`m%2EMB4%~yrucD==9C|T>tlD<L-MbvEko^Z{#
zzBa8OO)}c9f9*BfFx?}#wZ2C!wOPSpUa_E|doy9%8+pSNa2dF|EmdvpzkZIof!PbY
z`)Cf<Do%x+ceN6YmV%#jX3g)KnyLSQ7lkH1mUZR`r;TNFUcLZ>V6PeHY+&OR6E}sx
z%EVEEjvk5rBjwy6$s$R<>=#>QqvYTqDS7CNaRKqcUaxw`?pDauJL67B?eufaqnQSe
zFE?H%t}RjLc{ivjd8X3o^`6?LW|IgUM^|P{79Oe<0@!lrg~2PG(M8*%A^qi(&m+Th
zd&#wH_0ni&NP|wdh3J<D?srb*s^%F>*0PB7ystHM9H95u0G6!w_~xD3j7|}Iki2ju
zJRDMfQiM<2v2&47BNE>IvC#z&zyqgIBN9H94^tXMO<%=E`s*UAxwlv2yO1BTMA$Oa
z4p^nvcM_+M+jF(4aD3qSc0G@4K``C9WFuHO$l6N=%89d!CTW|W;$PxUWK>?-LAqR%
z56OQ<je3A}WBFO}MzSSwj#2$+Gp|diEiOS4*^bpq+j7Zc!+gJkKvQZVZG+HI)0<<A
zR;6EQjPWbV-4K~lkadv{t<Ko;p<(p5-K=#zeK%RF-dl^o`FfTlU$+6(s0w=ta?hTH
zAYh~Weqq7qEoEL2%oi?|Vr}DubuHEt?s!#lTY8%^x+GP`eSCAQx|N?mRzzcBn${+=
zhop1w=niHC%-XAa`c8`*t<>CRSrp@aiUysnf;G;F!H3h3qyD>x>h7@Wf*~R`f*<p9
z^%h->Se*(=P+Fz|y3aEqx~8Jmg!*i3KqW^fzs#S#Fj4+&xbrT<0I{gbD{dC|<H8`$
zM%Cgrs}8N6-1Lt_VH-@3yU+_3zqLqxdHN)0D2eqc<WAW=qif%_-1D7DIem<a$#+?$
z##P0cdzTpe^j)W&shEe-2}#s5OtD|#deGDhWseW)$w^KktE}uLs2W4pVWrcxDkusS
z`pn5p8N`GSm}{f`OY2KtCdV~QYC+l<Y-5y)cHc6*FNhYfWo9{WqdtBBD;G-b%V24|
z?6`?39JQaipJCs++67;INd59%aobgWj1IVpA;ocd?f^YL*9RQj0cZp3qE(Xd@e~fq
z&ZJQ0W)@Yk)mZ%(j_CuHO&6Kz$oN6EPAj}vXOpOQMFqvzPb(Ee^A@e9zfG&#LGn|;
z3BILiaEvN>-t8COeYe#=Ud9X`ur(_6Y%eZq*+i$JWX&y<;Ic4rh&+H;kmiU4!{mgq
zMfGs+^7;!s{uz9MC=A43fzw0*Xra&@+Q2Jd%(oWA|4LI<KDoj$OCPYU)t+*LJTI_n
zxRje#UoA>8I>uIBr9S%SW;W#^(t&n?_bHCV_N}J|D))*5ue5(1W`;8O!JeAJ<5u(B
zU;cgT1e$NO8cL9#;tG~jumE2m>kX!W!DfRAy^uw-Reno1SI`@5>PNutG;ni$w}@?B
zj^DC+id4dmP|}hg9Q7oqC||TBbF&4O7_VE6cXFW=nK}_JBcq;WGctX+XVLa`k%6`5
z+q<LEE{BwEZWIF5t>)XPc5of51X9-P78D1oJH@D58lTFoM%6H()`C5pDD51dCT8Zc
zXo!Y5Z&jFcXZ60<Et13#4=E3l+6_3eif_4x?tE|&a-EqiuKTp?kWlI4fLXnMkvx~3
z5LMQUFa_!|;2JGxwj+n!JTBiro}|-X$0@?3<*ervpNC;9eZ^j0aP&E9p>U{~70EO=
zTq#Mj(VdR8_I$M^Zd`fY4yU4|S&9fMEu48$S;{z(grlc2$zk5irlYI5Sh7(#Bdj+V
zet!47DZeskCu~=$DS%xuiLnJoM}_G@+#|t8=@bg{BxMK>tB;WMp9@MOCb7*$Kz<()
zTir5iLNS=aG$J_nhgMz85%##EAlns)6Z<h<KlwWV@2f-~v#mJUK!&+}f0UAeZkJFW
z&4dXZEuFpdqb8#HL?%U-*iYME4&$9s)Oh`>A2base~y4iC)xXCWsaC|OLO!U72t^w
zC7(Apm)NdOD8c3EU<3UGZzzf%(VrGFrb`%ONGc26)-+Pq_Hn7pz=RgmS~5!*cJq2^
z-lc0f%!tt|%_31osX`4e!8M^7pxG=}m9WcGj5kHU05zb`HH_xP)|pz~YuRZ++C)B&
za$c0X=c*!BYN0gqfaEJd;pNF_6M1YBC{U&9IJ&SrHE7rX<S+ql#fF{9xp<fu{+1-J
z%o29_x3<fY&-0(De%Ww#sf$+1=^j+@IeFUccW4U|+ixP=o;{xOw$g%EzFq#YQp_>c
z1<~U)?~&EkUey?Ks3w)UcUdaDLS8^6xdc_I1ZgbkLX7H#U7s&0E_W!XE~I!~BThYM
zcG@W@b`xBihR<RQ(Zj1#Pzs%K8AG%e&p?Zo`M^HntnB9}PW(mSZ1;<HnZJLSLWYw<
z<tCVY&*bf2n`nt!#V`wa-6LG>D6H!t0W`kvuJ_^8KTiq$dy_49%Pb~v7C~&!Mmzx!
zo{5o80l4H#OZMi#0V`ow=rw|ume1~gueA6P92nn*7z&wD+zZ5}NMbJxyyf0e0G8+5
zA}Bh#J_R>KN1bCU3=k(=9UwNXDyORE=8(<6-;3vWG@-dfU`Ertf{Zb?81Uh_`wIg7
zQ|VacG#<6YmFT-WJpHH<hXO;q0yZ9ueQ=St9C8BsxO$!sALIzNOy3Qh1(ZCwvxk&D
zH)*zXJU1$$K*tPQ*#j|ViEYHuG!@p=Wq#Q)=$y?KUfhzlpO8F6U@FM!xC^eWCRufo
zllaAq)0D3RXk`p|3h7h4I4&Wt`1bmPm&JK%1s$KU@$H<A-=js|;(~229Hf~K?}hAN
zy6G4V7F1bJ&QJxB-r6NC@_yH0su?)@Jw8rh-;j_7ni{@-uNV*|3r1m*BmDHwkJ+0m
zm{1aww%MN=(t{4BJW-XfOy-B4^%?%q7~RhkwoZgNOmx@tk&(Di^wIi0-20(1VtIIo
zH33OtZ8qXhl*b{gjdU0`phM$>W$HbhUd^bkNCgpoy!rxSKk7)fxKb$<gKO!f8q5T*
zm)ZQ}YMhOo(9_K!SNyQkyAc?#Q2^KWd8zsE#M8EMHoM_=*6b@+h^QVv6jvE_dv*;b
z`>^zB5sS58HUYtWAX0TErq95~#~<!(w2)&$In6%FTQc}j_j8=cj>EM+<8WQ+95=hC
z|Eg_<)_XslA|N)^Du09c+yMa123#79nd>UGOnU^*0<fj8-w2ND0E-qQpAA{4p7qQI
z|8yHSG3o`P`B1^o8Oc*fPn_z)+I=p7;D)1bznxN5;pW%M!e<iOAgtvZQm$?j=Ib37
z8sS6<QmQHF#if>dncYc;-FBbnLP`ZDA@w}{5h8bx=)UxUsuvj*qj>z0O^h*m_)ZX6
zUW$-ix^x8AaWJj%J<iYmzmo-GNCAkYz@b6C``2Rmy2t?i*{EENwg1a$!4qDbtL4Go
zn4vc&sSAXRnjr4)R=LLc;IF0gLz&2+;=}NBw!;7@H!#*vIyH0eZ*Qen^(<9Q0OsF-
z?2$)X3(q#fob6(!XT2{A?1UZnxPq)x$z4=i+xi`;w(1U!!40se)ukTr)wmUn^cE7E
z>Qs~JmBFl_QmRdWi>)3|fz1oYNG{-@-@PKy_uf(t*fR`$8M(0~`|VjM5e-04FUw*K
z+b)Kakr<lXwVubqhmL|ewx1qI#gqE@1T^e%T8|Q!v~8U1^@_5-^Wq4#9(50_gJVEJ
zM`_O+{V8o)+1NL-MX#v%SYE!ao}tF&O^{mvzuIeGZ#t@41VzJDSu&G)>W9y@)pvwJ
zHWrt0Pa;fj4N1iN(vts&{;U}p?ICQXStmn8qO3hw&cGv*ak>G-`KDrz`pBcIB*so0
z(iMZ!;7kbE7an~qYCKuB!+3J;^yj)PBFq*)DbdZp>*&f=flAosakqHA{ZZNM<n$v-
zz)PialeWcY^0CAP_glU-5%}vNYwyJBxKNTo6D%7R&={clj9oZVy$H;eYI0N`cbl$Q
zb}FWU*I|7Vxm0{2>p52iF{o4JPsfZRR10gC;%=x!Cxf254uBcB_j<Ee)Bg*_*(@4&
zi$anRe@hO3;H)C%ND#%5S`K%Qm@tSa-ka+Hq+KU3catVPT?8CE70c)Aty@At`&`z9
zC~5NfW!Ro@jD-SUBdeF@3s$QxxDwlAgol9l*wVrQUpq<2zk5Ulg*6YcUeUuT;{I`6
z^>4k-5lwt%b!IKOeIcKB9z2-jJ~M0y<mOkXv~u5|wDAN40i7R%qlmc_5dC^f3Dfkz
zDmNozzdQ;T+I>XP3R=M7b{LFzK5rKJoLeqcEtYn&g!sQNZDQH{`lY%c?}%K*B)%Fn
zmm`~g42D@151q7bjR#S9$38dTiycj}D^YEdN^nsPE$uM!Nq%#wg%|fO;CND8J5vi0
zL>%VnpEKA=c`tb1SuT^6u<Il>;u;d9(J^n}<(Ombq5V<A@zXDrqL`s4EkcF=wu%}s
zbVO=nxBo2QVk=T%kP%vFYi#2FvuZ~er@8740?%cSpeS&LyaOuqPR#S(_Hjp)Vdz=E
zpX5dfdKc&4k}-6@j|CH|#9&E!O(GS*x(zWgVbtg27IJ&ER#aek*oSdnNQ{B%Uekdb
zQz0wls?57bj79agFtX!}-W&n2<X$RrLSxNvEgr)6?eKmO9u8#?`#^m*Dn_|-Lb1~Y
z@}fOJL&NhPqh(sr<Ht0GLhwBg=Nh-2d08FM0^;=!Z6M%nIdcohB)x1Q8hvG0xJW``
zXz@`|JkXaR6p6&SQX!=~i*#(915x;#V-OHNzWa^HsuCc#X(I9o6^ALHZ{_xU{Eg>(
z&I6BWGyIN>6p^c*wB<a;7`bv=DqfN%>f<e@39MBj5Hl$emSmAmu)eRaz+BEbVb!i=
zdMV*X*ShA+MqKDjQF4wxSJ2_apdiOziCE&Sg1jL_I@U1E7pj1{X}@*NwZLC1&v;B|
ziT+Vbv*v=IsNHOHZZ2KA&;c*SiWpp=H+8EOk%Ud(XvM2VfEn-!8vd~V0?-Bl7r6J+
zh3#0URJb2c=A-}-HC6;<e;5D&9e!1Pq&(*y`a2AHlrj%9(lFWvb!lmSqV+P(6iKdX
z9qsJ-7cbcvM4lK;Ww7FWee=itKjq|CAoEicta1Cc_>MCDe`Kd@g^!l}ZADMW9yQ$@
zx0R%ipRIOc5m6ku0H&8B^rZn43VaPPhp9<obDI+~TrBZ6U0*ioihWyi2i2s6o$rc9
zy7)(XP}&{D=ah~sL2G$Ckn8CtNZVq&=NYdDuH{3uJKnee;#n&4my*|bT3Z8${L!#`
z9)fP9EtSUIsG^tULw0#U`@iJ1AzucP*nIgIoY<c(Z93$N%VLaf69vI-V<2gNdnZRm
zTl5t+>Ps`m5pl>gG4nG)ZY3!35|27Asl~<@><dMhq(D}88TZ|M;Gwoh#0Ueo<(%OY
zMQxLDfwRW&4;*Xwr1^8Ks|38?Gx_3KKO;+i13aOWc*AGMdyGM(4v)-a&|Q}kT}?h2
zpyl11O}LngbA>^w7)U1&9h&VOK9`3+>WMABX&Wg?R7b(INrbyd_b=QyP&SY4Yj!c9
zZ>s<}G3{sbqE_LQ=nx<6?MYBe*n7`^;qb<JVYHI_?p^+BgaCyU<h`eIbDTt(c+HIx
zzQw8$CNW8JHuMA+Fyi^c!pEwK@kA6^d00q8bR9eWkNVU%?p^!n4pc|2LV>V0*>kf-
z#3})nhOic{pxN1EYzlPmuoE}kc(E9?@t*1kC{RK$Be`iSuIPTB#E0!T)b|}vS(5m!
z_}l$e{`9w3K0#qSsPsAcq@aIg0H<C=BJfvi^-nJlNfNL#;1x4$jm?srqR&d02V714
zvQy6#*ARUHw1KJ!C$I^)`wo^{2}ePzoVLxRbrt-y>2!K)3M9S~YYu?NbOlt05qNoS
zhad{BMg(^W;LL<pO12PyO3e}S0A`qPl@k_ucCw+TUZis`#t8u>72bV4ACzNpff7U|
z)f7NooWl;Gs+JIWY6F_joS$aO?qq$&nbLKe3;19Fa-L3zt_MDvj`2<4e&Fs1lr6q+
zFTiX#NCq0|eC7D)NkFvg0FJFof)WT{*MJB12m2a*L7vC0*vFB_fF=@R20^UO)|xKz
z@bJxjFyLGO^{C6eZZFK%tL1z}!RJQMXR*FSfOTO5_;2K+WgU7&PObQ|NS>i@A}RvD
z7Xto*OGp&}?F=w_cIEr$6qxhI#IW$?*`9ppmJX;hJ3qebOfTiJ37m@)g2dw$o|R<I
zxHI673ihb+Jemt?;kPol1pU#Sq%HE)LROFv+|1J$pW_&u<ZSjjz!VYyu}ZN*keDoK
z%=9z?utq`lqdjpj3jnl_f#?hrpF2DoBI!xR4xTHJfHZ-|icJ8jjk&zbW96>Ap<aZa
zu1*^m=}oYb(w#8{nld0wqmE`F*+y%t8JcRz^m%&RTV|r)SyvzCjD5X_Pb-y~)IRMB
z+vqD?<Bw;>4Dn`^8j`0OsCM65IzCMz^j|ZlMeVx~sRex$fkw4dk=UdYY0lNy@U_w2
z!>8;sF4WTDPT3@U>=RCi+I!5+)!|^&=*Pr`fO@2M?P32od}ES#ebU9x|C!fX4*>V?
zl^i<GJNXz0wSB-GR3F0bFl>H?Me4N;Rc(jAAS|mb>k*J~ZHRzH`(p`wu?EMvSm*fm
zLV$+hB0*Mp7yhA!($o~OmDg=Or0lkFoOns-QMcuNSVtU%hwoAas!{_X821r<t#(_|
z@$I(z0M?!8)0ohz_!-t*6^L!gy)h`;K6!MURySb~bJ01<y2d>v4>Lk^b!<9QG!o{Y
zmRbSq5c$wPNYfy!mrpco|B_>Z{N&C_vGY-Pi*0d!;e21R)4E~HE2`=`aB8wnC5z(Z
zQt!Ld3wG11KAap^FDv~$iC0xM%?PI=tu99w0F6sx9f%#AM;Fgs0>q~N)Wq!tt`Kqk
zNlkr>RtVqGNtIXY@<r)JrS7Sf$-*4Z-;Vq57PVi!YJXld*HW>$&LAak$JE-aZa5p1
z`8NSdS;`~y7m&46GDn@mJg?(7L(k+fRv8cgTFT<e9PjwCocjUTEgNVC+N@>7qiK{n
zY~AL_`5yY^b@n66w1OP;a4uFrBlci%(BXBex+KOjcO5hW|1o#{$+K!z+=Y@Gd@CiO
zN|oC1bC&(^ZtIo0yMcRDI!^%2j;1k;udtJ)4nw@2Q7h(|jvj7H^&1<~tm#Y8U6j+W
zeyo;S!~c5LzVU4%VTXD~jB83Z=-+ByjuzZBsu(EmXrPz$Y$)W$hrTr-f@J1<sG@Ql
zQ>A~lnIxzT!X(KQcZ9^V?!)<#+$gMdLR&1`u2&f4J*3d5*veY1F%!(rLcah9JSz08
z?JFVuo{NY>>czq=bga$lwl-u*FS_MnM@6>E(M9XgwbPvPkyhdH5moTo$5s~cFK#s$
zLl&ddGhgfCwrpXHf^7yLUe6MHL`{+)P;bWUWv#-T#oz^hj~eFWOo~%<<VD9d;*Cq=
z@&>p2VSLGB?F>vBs$#tvx1mZ{bo-WsM~b7pj)-uRre3x*mq-Z9bIdSk7^4&KufY4S
ze=V=ierN+#*IvvdHh;zI|J`DP(5`Rb^{gU}g;Ef<8i-ko7};)Awn^1u8fBzP1dVhd
zV<byvaJVyLB!Ili9os22M!zw1_1jR(YXur0_`aPv1*|yvE)sQxRu6G~1_qP8E;XuQ
z$IU>qwDp9?cRG<mUb}pW2@JqS_T)aPlsaac3QgpG$o%Y#t|R@chh!pxdZ$sZEu4&G
zR~76{q|(v~$v=&sX;YU;tt!7)VoZCWBTiDXv%)hm1iBNSp?o-(avM7d$GnES0(xmA
zL=0wM-%lj5PkTjDNT51AB_kPCm#MS>_#NJO79^D~<_vq|ju88WI8^BAErxj5eGy$1
zyKS8J>GtEYP?4u54Hi@&Mo}s`9(6&z%o07%LG6TFHv-ONoezL5+GIDdE!gu#_APa_
ze2upx$w}{3iR$gM^e9fhuRQ_@-w(SJ;#TP7uyh<=!i>#DI_%91HjDPHfTf}&D!%#h
zLn9qmfP%PSM@9Rjmq<cWP8}kf;OlFL+p^0Cb+%WibdIV;8yDi4pn3RMVCd%R8rY~-
z_8V7jG~8g4G#5#za=)G7Y^#!3E4^^2{(k>vnQgfcm4wLxAcWc3P+Su|U^g`1oT^!R
zT@fF4@WZ6!FXkLep1<1lxrVp19xJ7`pb>9ac7OFywTZypS|rJe3s6|$X}fS@F~0sj
zer4*<M9HID#Zt3lATqv%hyA;U^-sI-=e1ZJRo_71EXj+Pgg6zi@%-6%9hYQjrBV<^
z8qs1`2r#<>1}?yHRzh}IE!Y|Gu{$|{Q^<5YYPu?bmxW*3Sa9vug4-bgl!uwhsBlap
zcz!<jjaxS!FWCTuy$ikrN%zTMk8)3tNS46etlyJ&?Uy77fK1~o2ps|}Dp2a?5^qzR
zGYR<Fr$C8sZkG0E0)G?QHoZn0o+&#CSHRR&1NdPYADgF!XUTq;2dCCcwJsa0fcXKt
z3g9ep)3Y=@!r(|GysQH-Rs8G;&d&_Ke{L@S>OSNaKOZtz10Y7;;z?}Yv8@7m!F}ti
z=W@3#AvM5T`-}oYugvESayo;zAemi$U(q}cLD!uCd*6P)3t(Q_0DXQo@z#~*Y8+;q
zV27P6aXDjCw{Zr+K5UjsB+LUhx&Q=r`$R!k7Z9dptpO6Rkg8U`WbnT$U^$NNZ3nF2
zv!^vI=D0!DVG#CbhsRI|!MW6yU^M~nXhDdl1GT%&22Tk<3pnu<+NH~5=TnkD>>N+m
zl~3U7XSKeI7aVtnsDJAdeLnwMqOQ523@{1VfOET|NrgC&4lwil!n(;%$V!=9y=*WZ
zE0rMo$!?)N;t+DH>22CAy}eyPyvL^*Mwvk1?^xA(NBiZu8}f1F*T+~8vO|*p6dlfw
zI@Q`jLPblk^)I7~j;5p=rz;y)X+PooX_Wrib%B(@X8kph0#@hgp~-{hMl_$|_@@+C
zhr;C{-3IkV?ZdVpdn{L;e#(}#*`FT7`zlDBHgs|iBWGKw$mjCHX8(IXd1CgmfRfC{
zcS6kztcNcknaHX<A+<BNiUViU*tQ<lcr-AtooE$v_VBfQWngJ^OMADu*>rgUugGR1
z`0WkzIgu>33yAt4YlApCD}9JorT_lpTd4rDRn|@6#646)4Z!!=`Aj2FRd_-8S8Go>
z1z4ljTXfwQqY!mXd7hZaZ<<dYynvWMavn#gQ{#b*$!Xy^;5Fz+l((khDBf-FVET_)
zm|KeewqdG=1quKsOybXa!+)}0n-IB5>{oRzV8IuZE*0j`PVSlCWCIv3T-Y)v%+kXw
z+Bog!AG$VQMSHmi@P`}`zI$vL^?Lpm%9!cMA+gD^021N>FfF}e17D!43#4t-b|9N)
z2S7W_nyx+T`JL-d!NdbE*PZsG=J838$nSalXTGK!g2*AAIuF@l#V~2k*Sc<z7YYLU
z(`lfhn}AOt$PR-9WPcq1afCAhmwXyfE}qvQV+-{)0E{5S(e8)hDJoz1hbyODCpvXZ
z+R{|uXyib35YYx4FW_uJ7}Aw2Dtdbs0EpV_A9tvK65;)GKiff_f(j!}|2JOvBdHz)
zKD-HVgt~PQ{<cQfb$Zwuv^v`ytdHA(D6fZDFA;F-ZX#exCq32*I7jV+P{3Rsd<a+U
zWLh|pMPxPeT(E`r6%Xe_Sk;VA0IZKaB4ssf|5w$_-?By*^n%#S(h6u3IMX5fd8YHL
zy6V4P^c^714>m@XA|3h6`X~==FAr=33NHcE&;}|NsRkVr^4sQ<CkUY{(2UNbMx^yl
za~1)CT%8=x_`S$Eko>3y)ag@jKv3qGAo!<}F8<rnr-r4TuQ7*!5k3S5K5qEifd5>O
z&;Y(UJ-GqcB{xCi%5F#ebgi?cnm~Ol$_N3{I_H{<Tq!A87=pPSaXjx;Qc@}jDtrZr
z{ajRMY8;nqK{~b$faX;LAi<O2CljhyV>N#(s96@u(5!Y@(dkGQRrNqBfCc!kQ}rKz
zVx0_51tz`8*n|G*t$kJqgMhoz2scMBbow6or}z7Z*J6{jKq4#krMsy9sXB1QBUbp~
z|M?2zI{sN__a6t-O@k2axBus&{h9QiI(o6P>)FsMsgM89rxX!oTvA-Qa(Q_plMnqT
zaPs<eP%>$2BJb>gNrBp}8?O?e2BCQT#Kk3Hm~H&9#I1``&n++4%3dO5n(=%7Py;WN
zNUO-Qm!)cXm;;mC^SrqmiBT>Y_;HEuCkxK1@cn%!VckwsnZ3lg`<}VX<LEe)VlS>-
zMMC-Gf-emT?vokfqPaQKAh_tlvS2!SP}1g1;WO1Qy?@fc_aE>6^Y5FTe0gD7u(1-a
z=XBt!xO}3SGzYSmIc(vjC1qn28y+<uJr*9})EB17{pT;G6q`l9lYPmlTi&URbB5eV
zuNVHGUhDT4*`Xu(%?7<#&iV7L|Nixz5HXa-1&?&yXusK1&O?r~r3(z{TfhGHyO*zq
zdEuU?hnt64lD(TwV${!XF|fZGYg*pu<2PHNyMF(_ObTV65)zzJ9PxHuHdR7h9qHN|
zj1=m$zi#ZqL@MwjDmZZVZ}mDIvykt%fO++<x&5Bm5Z#pFgtXzt)|p=a25<3g|EN8o
z-@pAel#oX$<dm;mG;jFzZUhEuig;L!x)D<(o1MwZ%Vh}H9d>Qp3%~pOTg8!NJfc4~
z&dhMJ^}&vah)K;3<i*k-m%v`Tw|Tn@J^DG%eE~>IM2>YUezT5_4!8g768cIqD+b<h
zkWNEPTp4VBfS#hl`qYegnxE!KSnz}NFZrm|phV*djKRuSq;A0sK=+p(Z{-@SwMk+R
zlkopJmoJ*VuXS;1?V<Zsxs=5G`suF=G3o0Mn<)kGH%f1#U?+Ys=3B&X=CvKCxgrwz
zh5YxNaH2RUE@Ve_KF!BrK^IB<B4kt>bm!Nr`_`bxn#!u*LP_3CmHau(UlSviLVfM7
z0Zt+i;~RcKJu{`{Up*_g#y(W4Gx|>c8Vov4Y;yCX3XY>Mr5Rzgl7vDX$BE`U6xK;4
zM_Z}nzjUKK=!JXR%qb=M4EaL8>aQRFzTnG8!sU5I5d7oI<ey~7%+wiAhL<}!S;4Ma
z{90NR^e!2Lm2E|>8ZXTSeq5vo2R&M?&uH<cO!M)}1J{2(ZbG?Pi2A<xb|q;X%j;ir
z_Uoeg(~XC-ls&|MO<sfecJa7c0a9bS7N%Dv^QFYz02Dd|gT;7wdYTA!dH<eGGDbG;
z3PCwp+04W`myJW@_no<_&=~bR|7GT&<~nwCo234dCR72bpHo@fjF1>)e3az)$n-yE
z?58d<S@@!pJf!_0FrLm&B1=ki&G(`=pgaX#SGV!0J6|?s<(T~(6S`BK7?!2gw8$y%
zDrtqoJxokY9*NoMTd2If-w$9I=fCub@AlQb&~Z2l)U;{`{nuLmy6_Fhebp!KL^okf
zkKU-B#pP~#-d1jUm}FoX&6u~{Q975=U3ufz-B*zYuepS7%4%zQWjj3XedpBGpI0XU
zM#>J!H^coo5S-XNu)MPL;@cl+4t~Ax?~CtzzUaKt?LP)eA4NV{8IegQ=z^+Qb{ol7
zIs5m0V@1tYRAI)Q(V0Lsbn(E@#<tjYD1W_;ulsc%u*?6Qz`FeqSQk&6dYcmOmL(H5
zp{Zyr><m@L80n{ve=dyJi{`5+Jl5mUF5%&Ff)-!j-Cy}$A)S$wloXEbA8#sK2Pgh5
za(5o4OfD1MPos3pNtOTogrCxsB601m7tZt#E!i?hX)60VR=5+bZ{*We%binIMN1g<
z`%&nmVg?o#t{%(NhbE*^P3ER%b}6_hz0mD50M(YH|2e{4igv~j^2<2!-9nlc>80zw
z29?2d{w;^U9!SQ3<Gb};?}tg%7c=S{>F46%feb&$^KJjG^xI^|CX3|_p9BU54s_tR
z=;EXB_Qt}h?YVwW>-lx3J)v|bTohLBp<hb$TVS2Cfk#O9>}Tn;!SWj=<FT2DqoK|6
z%Tp@UtKa}~C_9-Y{(EAYeXq5(wGFn(X=jp+jgH2v6=}Wo@bHMs^L3rbon0atw5dV;
z{ngj-zmK>}ktyNSv-~5MmV$ik?h72<AG4cv8+DD>%Ek-g>9)8V>ujlPYpYNrllXHX
zUR?3zM=w8_I3PU{@z_ub!*Rp%UoLp+55Cfo@E#V`FT=*B;A@j;I`jbrx^{Qs*IfR-
z5KyE<g7sIJ#TdWDb0880(#oCWaAq&v{#3BE3u`CxG|7J!UNDHcdOl3^>!HPOkZ|Sc
zdO!HjmfUs2@^yWNGbNN>zp(oIv3Jx`NS2A5p==r=97D1Ci~MR`Wocc#!N+Rv?UOtN
z52R~8#tp3p2fq6~px@I(O|5uoT5A@QL3uR8R!w>ImMC5Cm*Y(-yLLB0@jw|z=spD>
zv-C@W-+y;}-DyE6o#i&F->fr{^*<7!dk7IyMu?COju7Z2|Ml(74{ko>OBE`jtfqA1
zC;vk(y3~IRB%KWhrKr;k@0Styb@83j7u`!b=7+lb&9aNU|6>xgC_i0abiW3@2JPHQ
z`K?X{jY!jcz1buIzLajdQt`iD;@5>3+VzLCg0;61HX9cC$>2P&TYQ)aV(c0DAmG<c
z&Gm?h5Mf7yf_>vVAaumWg{}k9%i727Lg|s4xsAU}O?jjkZx83{g&`%nUQGY*W&E|C
zed0*CN8v1zbxhO=Z#s|0D<Szi@8z+@O@q$xz+|#3|2Zfr#GuAepatl9;b?y->K^|0
zHg~CMIt(Cc9RE<%9w9_610iZD)F??Z;@dcQePgt#zg&oz!39FDlIelTRr)udok3X*
zAXU8Rerq;Ux!6m*j=dXxH~nH3#D8m0v)8p+`y?ga8_43@wV^z}#OT+BFV?MB&8|-L
z2<O3qPQD=V+oT$#BIZ6x9f(mqDfS<7zr@%VwijBfM2PM;YFz&NC4Q}i(;I|&k?CiV
z5w{cHCZu@sTTE{<<IKI>t@oStn_YBM{N>^(+4OyF5=@7}K8XRlk^T=t;S_(AyW3>C
zuMy$IO~3Xd#oyLY!^{_*_Wd$G3IPghyZ@iMas#0&HvfO=3IR&QPU^j1VqM(#!%Q)P
z)%$lv6^Ik1TPXJZ-$D^^=at<9cRj@FIS6I{HVCmrKa@=BUr;iHLHHjL{kcs4BcgP@
z|0AORw^nqTiH)88!-(xz?95~}znrXG#$spSpnW@OqLfr%-3Lk74_n+!^~24-{pseN
zO2saCV}#nrwr7^gjhvXmn6%?Y^7TH1>($jp))m<P@a40`HxafnocLdkD;#W)1lwIQ
ztS4PRI?q%mlZ;&rpD1<KK56ZC<&6+9nU33U?S<ryUr;hc2pu?iER7RrH4e4+2-50q
ze|6Lr8L<&ezMPa<NtM1Ra@SPXcNZ5pABv2(#{c0f?Czle-_uz6_ZSXu#F{d#KQaq)
zZvz?2q|Nh|bovX-%=NiA?z{mx{rbwO;Y#Pd(8>mGmQWBo=rSW5)Cnf`f8+JCo5l$d
zp~qGz<x%0zPPuXC0T<s`a&!a}Xz&*%<9aul#ds*PowctFH}Rf1IYAp3ZQNfe&)4Fg
zaM?xzWMpzpwZ{55UUK-wO)ED?Nzbk?A9vMlxzjZqoJ^L9tW7BBzLOVTe5pxcn}tU1
zz5jK8-O<NZZ$MRD=S`2$`Fj)XzoHz{>j>vn#EjnP<_7}X#V^8MU?c%m!UKDu%X)6~
z=R0qkx+Y2h**w24q&1*SWJVqvBxMGt?U)e@hl7Z+UNuS+fpw!w`|TEf8Xn3%Uqskb
z2*RFgPy$mNuV>FVgpc=ct{gWtB>;%?sNDN)^E|vAq{<=-`;h~*qAv1U0$h9>>|y?R
zgwy=d-n(U!nZn2G*oo0BP2VC156rt1W*?z)trksJ@7|YDw$;~<i;I1flY2SqsjtUH
zk&n|C3mbF%u@&)RL%1e=Ih=Y3B4%HFbZ)S^L=@Csb5V7HcI-PiJ$!c7<n1LB7ni?u
zyLDs|*5sO`v{AP?7?Tw#&sXVI4#`_0+VHg1Ap)MMRud7U!cWQm6#@0yxdx^1I@;O)
z1k?Y3dl7!B6D{N6F=$#?^Sr+vs-x$bcM@;g02Xn4!p*F8_bqn0KFQ4FdvC`{;X#(Q
zqlM9oUZ157^HZ)RTDyD5#7#|GbNd~6wmhtE&!69eEVe0RU0gK2mry)j`!=ekKi;TO
zd5pqUX*Hds=i|8b<omhm_PK;<QmsbqiU2|-4c=Y{fp@)?`1S#YU%Y9o>HDUvkOuF2
z%S1jtJ5l@1{ysLh4)zZ+SXE&j<sQSY-%HH9+qgS%_i89Zww>4kz?iA5yu2!fhEL9T
zL0J#qeN2_BZX`e4HE=A5xCyi6Ux}MolPHfqe|uiL5q>(@78bt{-BWY6&2O3^!+P>P
zA;NYP*=KLka}Y4Lk;GJiv(mQs6^d^a7rhF$GIecjajZ45YW9|TPVuVY&&3v&d0~l_
zjh9frE{7JldX}?vkvV5-jed_85^;p+v5v=luqiQZF9qT8=$4QBChNCHKlGXn8zJoq
zxG1(@7ve7U1W1Lgndwl(H=*<k*JF1IenDNQ3+X$|Rt=)+y7uA%d;3qd4wf6jv<JGY
zE((vw<aoVk3N#x^$JPGY{oTC(BNWyBS3=S4R$P?ixVR^x$E{?855Cyzj}~Z0hU>aI
zX_Y+FoTxYU^f*m~(>ER0njWf<4$w8hE7k@}javo}m@C^9d?4x*dIbXsRn)jBFm92g
zB+rYCaz`t5V6^b=IGa`LZl1rzFgq(gsXh1_yhGF4biOwl2XEE*pdhvYOx(L9AH%ID
z5Wm@w9h*86FcnPXh>1{VLZ1;4x7!PCpdJ)TKf~MzJ$aj8I(2-CHb`PyKlt+O%vn8i
zAwql9inX%CYl*0+=~%vY%@v!cjt+h1qatDse6QU>Y)KN?{`XrFu+^ML_k%gYs8<%%
zVXw5u>C}rv7<5l_LIz(iQV$+1OX&@7^{jS}f{MnXow54_5TQiR9wN?gZ7abJ{F;b|
zI9?_0%z<md@2-Yj9>SVzybaQ_idfHQ>v)+_OErt^MXrXyV25@di^IGmh@4K;5Hi9>
z6<<Nv0fqbjXsquUyG*-_d=?#<mp4KrJw*0Go0^WEc+5gYdFyEYtueZtqCxdN7dD&@
zw<umuj?qPkdh4E?nHDBg7O5@-XC*5b8R4zGyV+|A-%gu6q!6v;-za>r>5hk@?^IQ^
zc#Y!g3n^YSsBPWe#eR<<3Gv}WochJS@<_y%^v)y1wr~XnI!O(7ZzZ-Wai;5K-``Jw
zH5>Aug&nQJ&5ys#pSu(uqd=2S)?foh5u(GSQhu{?H-5M^4TB%bdi`Hg)+!&IGg{Fm
z;jr-VHf!0I&gcwVpN+llg9qw}bPbQ~_`6D5*oSBqGFe7-76r?^;dW0Ck2~KoKzN{$
z=wpemNTDEIpz}6dvx){2W50K0>heOrN!GkKsjUPJ52cqeqv>hEI}w3e&JEJZD7A1V
znYD1uc#y>IUV#(Lr|8zTk&G5QpN0>?M&m)GKvSSsF`pveP*>`<)gZU!DgTi>PdyW8
z{bR_mJGOCrLc$Z<hB6WBnR@0hCXy%Zq>lSkL}98UYk6x^rN-LC#Ke!<$?8~`N%SVF
zKU+__d`v!H4PRO;)GT9|-fy*x-#Ayrs<;fg1#)Nan1}gh8XcM7V8=hAHrn9Q{pmbu
zy$Dt&%#-}0jn&)Hb)wYWazO>;<bx*^5NWELRESNbj^FGCE=Yxq@iKIC9%w$aUaQ<N
zU+|0{9N9=8wixLgC>gFdH#1`+7s)Qw27c%kivIdus5H4JgYe!uEN(#pr~Yy3gCEah
zLRb|6!+*)D9Dod(MCq~KjNSQgSh4NYXaL<F$*zz4Zq5GsP1eku;9#OG9p!7f3W6IS
zo%(4--vz?3w|n@$pOg7qbaJlbG>O2>nDtA9Am^ED#PH?I17(l>ou<s-ogE?tG9sd!
z6L=1h;ewEe&q-e0z;pcBp3!Pgi!F;;dp|GT#mclB1wI=xp87>omsLLX?~;zzZklW3
zKeVY>q+D+$NQmhXUJg~m<~^KtXm2oYIgtx<(f9E=nc;03<Dg7dzdgmtJ<PWmm&YQX
zmE`b%xB#i;Q1r+Q9Am?~_qZ8VMOg$c>z!t5Ou1b*irz7k`^=B;ukW$;uzl@aTcdcS
zu6MHIG?7Ew?GaZ6n|@={wCB6DaJk#S%6qaqx_psDe!izam^AHK)MPK_47of|(6=TR
z9DRaye!0@Ckm(AW=3Af_Zh)*LfapTRWhQ7K!pFmMZ>I(Yik)$(AO!b1S#!L6bS!bT
zq}Hq6jXw!BC~&~FX(zxfTWK>}L~Pp(-^wjRE2HURiqCFQiE)5H#8XwPHu;S#mb8#I
zfBQiWBdcuI*0Ns1SqI6=4BEx*psY@o^XCGmT~FgTvPtRCy$^-4GhBJCL=0ei$Ghjp
zBkH2AUksD0d4BALor*wG<;hj?ZE6Z2R&2d=KD3=Ddp<t=!WTZhnI(yWozr0+7bH9D
zW%6<{diy0r5v}1M4_SXaQn%8Gb~$yV?ODn1%+ul6TQucnt)<x=Wuy%x?o94^uh8NA
zOyjccw#Q}5WPg)GQq-ZYC;a}(`^fN!puf_~vneQu%uUe0l)0Ii5#K(s(2`bVbo7A-
zDzr1}zH#Urv0jOu+)`Mmb0ORII+k1O)p2|*u=3K#RJal&eJQ0`)aOuUCFzu0zNqnF
zB)|77_BW#@hlQ*>-p|r;?Tb6d6qo0DCZ}RiUf~p8TbWCSmu@S=`(KO{vUH7%x*?}|
z2~Gp{E47v^@$fgvFfZ2$tpX&nNm0mhCOB##=r++Tq;rGP_U5Ub>qTvzol|HBR>mvj
zGJxI^huV|ZH#>DXSNY5L;wQJ_pC<QY_qYx(5_~)%**gBnpKaGZ?PHd7sjXip(s0lw
zxDpX@mQlmXAQKcc=-TKF;aXM^**g;*p!V^Yf6>0w?CkD?bsI%==mO?=NllNIw_JKY
zDe6;TuYt8Ay8FM_d(Wt*w{3k`5d={w8xf_eTTu}Z=^a!+r7BXSs;G2A?+^h6Q2~|S
zL3&rJv;;&!=>nlcKuYKV0tq1`c~|hLoO|~@cc1%yx&JZl2M2KwlHXcuu34Y?%vly^
zKU41D6!`L*%VKr8fY}Tq)JK+BNI&q&?ejxaHe)%RTl1tRCz2f8{5Gybp77EI|Ct9;
zk$#J`Jnj3_3Hd&;o}NOic$k{)saUuc#Zj!5&)`(PHIyq#@$XV!P%>qI&;{_|fmajc
zse+e@ThKv(`HaOgv}iqKs!OWfbY9fli++>AwJU+6(w#Zvc9=rrg1oP%x#s9OAQNeb
z7*juAs7W$*0FR(;Q}7!b1ito8M$I4pZ=|tm>p&{I*v4#DLLJkuNuKXRwi~?97k;#6
zJzO4Dd;fw-f_|0!#wSZn{)KzJ6X&nWN=r*G#SXFqs(jn6#qt;l9{EV#&DLVrAYH12
zmYyEAr?OTWb38lAn0vGUjIyoecCk;kjc$>Ed-<{-KW>ko?K@9RdU5`xyj}V7{1?u3
z?qi(lHBPZ`x6TgP$w-xBwSFJH6emAo6ymwPw{y4dg}Rx3+Xlf=_u6|snUp*|Gw9-K
zwvk+<kXw^jH0`nw9gK;n5X<X9#J#H>8{CROdz%Ww5Wp3<@mZeYLeAc%I8H<sYK1i*
z^GFHcLDD7N5mIm%3c<V_MR0!4hS!ROE)NLTVGzjWK!mKhkI(%k&IcZYCF@JYzJ6P)
zy7@+^<G=(Klesk;6CaNChG7mVtysBh?$m1Kd3S8I)!(zx?o8VXB-D&m{x#^rg4wm!
zpqM5Bxr|Fl0uOl`Yn3mIV)5HdEbUh9kdhNHgIx#>UAiFzTk|SsUyJDZSR>_;sQ-%F
z-cewK*8_7hAC;&_^IS_|Bg19eaiKd1C!Xoe?cvfy{~1Y~IozWc?LA#C!I3=x^A#n|
zy`PsJL#n8#bbn?`W@}d&93D>4lqJQ^z{n(|Q38JwN^wiIL$1^?(^JE+=8<lEY^=Hv
zd`pF5S~Nulkn{au10bgAy2o>2B*GPo#KexALtb9qdBvS1Rj<4)_9Z77a7D~?XqFa?
zNOeS{*@&>fZRBu&N>SbXTbEm`so_g_cwHiQOTL#XZ><x#Ljo2X&2YHsL}&?j*I6E8
z&)(-Q6MXV-^z`|O(}c3O)yoKH<KxoB7gHL6gW1VfR5W1@ynWy8bc<{lY%EfLqhoKp
z0(p9F{+-;kTJ~VT_(23&!>A&&5Fs|R1hkYD%+GX*1O%tIHd?kxOMdl(3gM~s#xiZb
zZY_sVIeC4ad%F0N0sxuzjMpnR&Q`IR##gks%Zmr2oS(s9T)DiP!)V)UHBHSNF(QR%
z-ITTd(*8=ojF#mHpC^?6$ej34vJUd9Oxs^*8`?!~UFsab8F?ZD!!rR?&lMRqk8Z>$
zINEPWYzMRRNVhZA*7%uM6WtjpMt;VzP@Z?B5c5*j-OqwJhUg{V_T@)lm%zEim~DNv
zavqrsladCW7{IbwL^>CEA%$Qo<|6X5wG~@gr4L&Tp_^49Sv&3rH3RRC|8f0a`5$t3
zk5keY5H#;5oV>zDP<gQNXd6!K(Z`iDzQ?YlYh_xb5Qbr;w^8tF!^1MP<qJj(`;cDE
z`+6?VE#xU~98Q5(`&nAEQg`}Ka}>k9RAMEe#7&?ZTgwpBkBnXuc7iU?jWt|lxs86d
zkncpiWyJ-v+>cF+@@vq!x0p^1izG+uR&yuhPT0&%=w>Und-6GZsem20RtgJkIz3S_
zNoEQUPdy{8o8g`|SQt$#b!y2bB>Sul&R{T($n6%?EhyB?+3fb1mxXUNv4i$)oTglr
z;kTNj>q!Esj$mFvMyn9X15<@5-2NVo%oIqdQ1>1x*EcgXX<Y5WPOC7ejktF5P$JfZ
z@b;tBX0s#|+cubJwJ<ZVFt?zlu(_<!zL2Bu1dkRniZA-GzAakol0$Mx_Z?2cWxMCS
zbG5a}6ZX=1A?%eAFz#qlb%Bt4Wre&&6pCTY-^qIW)38u7;g|p60}M!<tnp2Ly>F~?
z%nvR9%Gz{unnPa1d^wu&3r|)%Pemx?thJcCaObr-33#3R5GRTQQ7JEwGHsM1ZI^r#
zP0&CX7?yfX!&WnY)Ps&*+bO(N|E<E?5(jnXi9sIXdfx}%IYlMJjK6ciHYyw{VkcHP
z7|`Nat!L&+BtoFM@88_vjA->@@)`V6vOay@Ku%Ipo4c<7i3?Wkc_CESXPaVHcr{5s
ztO!EO(v_29UV$~i$wmTJ(xsV3eN#UrR!)V?!LXKw{S88On=EsU7Af4>ae6bwcgX0J
z?W`(Dh4wO(I2A3rO0w?2j}LyFcYJH6KY<O^{UQe`Y|_ks+$7vwpkcN>lKuS%Mo`r~
zEHh<$vBIiT2DK>C^N<Z{I|M6vZ`ISco^O=L`U#1AbWlskg^X#9x;Lw*;;7*)ut0>c
zzWhpwAoFu3DOKxK7RtrMDuau;A6(3qZ?U&3J4KdZxbV61{xR#f#vUZkxpc&h@lv~R
z;&j}+QE0M_{PxCtV=jMmxajcAam>L0i3zOE9d(MTCyrcWq#zyY19l86!?C}UQljLr
zHWWYBkKf%QRoXur_PjRzQUaB)i-hSXc{`-K8pxPlC?<)+Z1hEY@F@kChr!qwyZ%5h
z&vPe@5tlYE`PEsdHj=dY#SHivIaC8Fc>x0(h0DS*tPKmO*g~R5`4E=nv-L1f;g-ui
zMCF#-MWvO&kM+}4n7r8tmdSP#vSHyiETfw5eI0Q*Xnj~_IsB0{Y14HMlTuYOXs_!@
zf(T^?bNkieyBJ~QsNSBQ9^1}i`w*v)1$ucLaSt=AXIOALxxtrbx^Wa2Tb1lAaa5Xa
zOcDhpUiu6*$H=weN?->9`jvNTdZ`f<rv`g-XU`X)`Uw_o<b>ds)mpe$O{d5joOT;U
zzKwiSYN3_RQAZ@snZYobMAzKaLiuUh=wf2;>A7AVO-uP^S@Vg&@#8qMz#GpXVCM9d
zcJiJKr8||RjC=1a!Od&f2>YwDv*l?AP^GUN8g(UnZy%ZUpwzS}=OE+uGK)<7yyQp#
z`Nxf{ZFd|w%Lj}kz0F;Gxl`-*1Zp5G-_N25zMN;-Vb~W4<4bf<-x|p-j&<Ai2^=qm
zk@U7k<)F67lb=|^HB#!ZYma2kZ`8M>Q8!@Dk3eeiZeEzB4Xf6^C9B3JfgU~8PNg7D
z%N$5BKOG4UuRXOi087U^QH(MOC*KYFZGT1O5jNCI>)@<Slc|+scTy;kkYyI|`b`YW
zt(8kn7%e&Ht;g}7Dn~t`UZ|wQ?fsJYjLB}0k1PNO7pKOw?Xa$3)_R#5P}$`d!B_ig
z5c+V)4WoST51u{IR-@Z7XkV!fELL-vk52v{pfYLWRD?G%U|dxk<RXNLF+~X=JqoLg
zM{4vB4R7JjM;d1~bA)b5NXJ=RPzRYCz>?EoL~I&Rr9`;FS9TOn^M9pyT%J4zxP;+j
z{^$?6lrruL_HY2YXv}~dzP;bu7BT;k+;`t~!ox#;+Luv2+SF$iF{9HVMQC#w{LEuh
zVUb_Exn=`mAZ|N(pI+ej=1cfx4R%D~_ctI-$fngBSVBBX(pYK5y&s~kb=&M72`j^q
zT?iZXnRt82=rP`brUB}?fbN+IO-RsRNjgslD+75ev(aMc5nO&Tlowc0iExN+Tx{$$
zmPvx%aX2>bMGqKVGay^W-6c6aHQAG03@gKLHr)2xTBzy977oX2)y)QkXJI<z@^^1|
z19bx*Uv{@y3c-8J$W@_2m*?cOJ?i<eX<sB68}n#{AKbvQMM{<0U-Jks1cMU55O9EC
z@T{u&jg5=zJ_-)iv8dy~vwBpGf(7IJZ##EPOicJL-LX!W!TLViDAUop(QoW}6LSso
zGVox4dy6c{GT`%5ckF!dPD<Og`=WuU(ux=DUsckXB;Qf6n_nn65f8%t28=I1oFr9g
z^z;UXgtv#+E%>jym9x9qI^Ve`&11xP{Sd?9OtdfNg=4(RpuN(HzNvR9eYQeW%e#+d
z2kpOERsz4;ul&Q*zUAt*wS(PvEE2nAmmR1@Neg_H>IYMhD^G2@tIP8fiU;#9#qe%U
z%tB$&AeY5=hOZ|OL`{@9S{Lh$o)0eE(n0pmyXyhmYQ|2nKIsBT!IXsWh+{JPsb>?6
z`A*7Yn;6~L0nE$n6r#7+`g=ayJ<h9zB>!8Omw1{68N1{Ybbd_mtI0c?LA#U5mA?Hi
zeV&4yk`3^AJmd_#@tLUX(oX4(SE_S%?qe~4F|cmNQxIMtjgF%QMEPYh7bRn1<U)>k
z)Ym9C`T&Ksfu6ZI3$s`^->PrJ$P`WaiP*B`Sup?<%kQ3@HQ4ff|A%P}O~V4tMkRRW
z-Q<vUIa()Q7j7=YxfhHQ*o?NyFN9)j`m<j@B$(ZNC!f`KyJ0mUZ;xjcR~QL}=@g@b
z*$s!SFAOio9d!y{Xzlj~;U>bMWjfvk13_!ZRG^Jc++>o?*nydJ6;e{71R*-VDN1RC
zpfUwSQRZRtYOk5uwQxDoy8O$)oFvDsuX8&3#sfZCo=qcx<4Ka8Ow<t4`5a1ESby(F
z-dFVR<b6H7X&cc0u$Iq_V#8#XXI+S{`eMVhMpZa}1<+{fSBGDBR`AiQp86OrK3uB1
zX8i>>LcWHXVCC1(C`P)NlqT^n{Xt!9W&^88*W-y2+}^C3%U}s_Z=b==FF-PpqnPGL
zHKPIJ8-yr*hfaQUy9Eb3ySf}gzpmL$l8Rjcj$bZwZSC_2S;qr5pk|)RqTLtKIB<L?
zEw2}8c1y}{YJ@Q}JlXqEOVKnIC|q!5sBi9E!Xh?s2@e3V`MGOAohONQddyAtch@n>
z4t<hL+j_Sc6=Tw6+nL!75T9Fwt@z-0i#9pBu@H*spD7O5fkJXV+KKY6|LrKRTw+Yq
zolHvm@bsMS-d+flc+kpYt_$W%d((SSs52uw*{=xS#*%+`-J-azb}+ec?UPPtb~71W
z+#dWh0c~61oM{pO)`?$2+(4$c+sJH8v2+7(w%ax)%8fCgAKfoyk@8xwW^?i(+l+|<
z5WAXX&$D%;t>Jc?xK?_s^ML>!AZjlXfxQ3;e0AKB{Leyja~cw+<lHj1_Pj?5tt~)|
zC~?KyDIWP!+4iz61ye7vQIOh*Cv+4olcxoi$v%F#78pvNxPXI?$ijaBLk+G`f@%~<
zqO4J>5x%FKU`i{R@fHQhcfzB$eA6{-TlFt!Avf17(mk~^fiMP)CrJZgRLC*o(4v4F
z{R5eHsu1V?t~6rm2;t-^sioxjm&37Z=j~Dm>#XhAhTEovddJBo<wG8}QgmCL$SPrA
z^_q&JAIeQ_eZzEUviYr@>IqBIIwq#DI=X?*G=jj3J;Mes&uu(ziZ9Ra(J=dvg|GFR
zMv@m|&Mgi042<d&YU2XYW49GD2JLY`{cQyW2j??V8zXB;fw`PvkDD69<)e~)mm%$~
zpvhZo?nO#X^)AU&J06s5_p-Mcqs-<bn&iHGr?9$vK%dNoCso2D_wV1z<}zcffKp=o
zOtyB|Nix#R=d|3)cuE4wV1?IXV{ZhMm|ZO1S^OigJ9>*!K#-zo2=`%<MKXfAPkIS3
z+Yu2ubHNI*Dk(?{k1T0f0wy_W1ZhDc_aWLvW{y&$dp%X;=t!ADrZNk`mW-m&vOi#U
zSiYU&m+HS#nLlw@D_9_4NZt+{=6P#}7LPQh_d|JUv{bKyMfuxJWmHN6r6z6FOl%I%
zdyJogJ*L#+YNYMGa%y}&zSP~9PYXABN<E(+(O-<q;}?uw9h&w;u~YMKjmG({VUXe}
z)wU1rY=QJC638+oY&RSA(Rc3uwxE~Ip#aq=H7V|e|3RFJ2vbX`nkm`3H@8zhv>zNA
zA!{M4&P^9zE`~g$^L4O1>x)h>E8w|QNNhENriepEMn-T+kg-=Fw;(=Tbqj7rYpCos
z6k#OFpsJY8ZO|b^C@eNfi3Z)yjx^rxb!$Tjb2yy*h>uUjWAbI30(=})1uDlJAzrxA
z(DnsFOK5+lZoZ!A@J36xA9h%@!r8*vJ)d{;ASJ82+1#Aa%;~-OZSG)7UEZJ|KMMjq
zs|EG67!nij8>wSbS|M+*Lb`iDUBx7lv7Kf%eY%w3<Z=CFdJ3*Go7ck|zyhI_DDMZ!
zuWwbhi`ds-V4#SE7K18>|4_MwWN|z0vJ}vW@Z$=7m~@9;gTV0i&QGR1U6ajz!0-W3
za|gKg_W~1Q;CM~GZXwk8sah+qB`iC}czxAnS<2$mQqoP*5>Ii4!qmGtLjHXyshYoM
zwYkuS8&`h?stGL)3$eRizGWmo^Wl7?A+iE}3_u#DaaQ+zKm;+5P|XxVuFO$9W5utR
zX&NwiGBFtbEGGA8zR?>}mEm*^;`~gFTWB^Jk2H#JW)LtjEVRWveN<B*dbx^`oH-ZC
zW7Ev*kxy`?l!w#vqrO=TuhBzwbabp79PT!q2tJkinmoMLm@;xn;BI2`*HDCOMYUGp
zVt>J%DEmCU(0s_jQL+yS1S;qvy$)!hp^`#{O>wnklGl95H`{1)^O|lhxc5c73sgjW
zgPszYjcN+q?gjrDXH3fr^6f%SQ?ho02Wu~B!w#3VWK_8%Q<2v$M&~yT(#)kDv827P
zB)@^GZhsl3k4#`{KKCO5l(ut{;X5Y@ib$a?_Q@8#3bApzf;CeSlsZKPV~(<&>W0$j
z!$vg=+55@Dz@^IW5aITk5}L!anOcXvU`%m-w6UZL+~A+mv4hyPXZu@GCOAwysjlXp
zdG$smuBp&Anv(RUNs;8^a&M~^y>w|rav7MS>wvw?%?lLb+9#bJKKQ)0-Yx{Ks1hm`
zP1F|>)Tin2?^P4rHZU(=rKHvxPZaB;s!=4>p5<KM{9x21%&o_wr-k)YJ4SihVSfX3
zbJD1L>J#kZR&I9Ut0EA&t#(^YW))g(5c0)hP9S~ik7uVO3d)jeXXs}<%hwgi$et*K
zOgl<7lPhps0Il!Zfb!eC63U7M1<3DfIt)x?yilheq@J8^80vjzYerw8-{-=4%7J$h
zLG>srn7j^My%g&7p*pD3*w+!m-+=M(n~8&G$C!Hh4mnl{8!`E$5mL<ZIZw&?`p(fJ
zXb;X0vuMesaFgM1ad#YcBU?+~S88?BoSksy%oz^i=4488B1vYABw|R@;A}?9H+(H4
zpYfWp9o}lTxfm6S%oQ-I)aU8;5F>8jq3UF!4>_@vrh&ZusdNs|JNS}wB0=!-k`lZ?
zDq35T;82I5flhuiKMK;rpG0c9XOy>sU$ZuoDr!OfBQaF9BPpg#wQ>RD_~clNMXtC}
z+0HLiln}4{{AN(yF*F%U>Wkk#@g?nh!t=H56_AlEAj$hx#K&l4p#2ttL?tg0uVe!(
zJBSPBWhV!%ePp-401ogs$z$u8LdFpQqcwQ!PP$C<Ev*gof$0zN;wz#*^bO|@s5kq-
zzkoOW0`<Zq!Siv8>si;JUt3Ll`%p=H-aFp`r4QLwXI<n>cAFhW+h2p%O_Hn#Z@={n
z$GD-Bt?^zlrrROw6Qx?=SF)pmMd(OB^ND5st^INOwcNv1r7ei%>*V#M1a^LYq-*Du
zxs85gvYV~_6feYl1O;m^DK}@5HJh(lK&n;F5Og<6VH^5;UpAc25H>7qtE{1Ck1@*E
zEnw7FJOy8dlF@}$KK(^&e_;FaCAMR3mv2J4+V(wS3_zK)m5}j1!1F<AV}<NtHbI`I
zujRw*a=(W7<lU(R_ugj(IDYY_Uik93&ioD|IGkUv=$cWbEvPgaG1aaL>_OZhPe<!F
zlCk~8kS78yL=nByos4?Lb!F0i`sHg-?kkk|OnRv|q9r@`N6ycaf}isN?I8q^5by=r
zyxd{baeQN_!j|XKm5*q0_Y9*tgFZhLod?^Sy&aUZ?LaaTCbt{d|2)f6&{GITs0-$$
z6mq;v+uSUfFImsGv0Drge8`pph)^8Y-YM?k{#9`=Cs<&oWA6nYU2^av)6ZLd*5wse
z`5ruX+lpkZm8(f2`l4gC5ZBpZL<_`yo0N8ZVnVNZCUrI{#`jW^Yg4WOPlpVn1(Pi8
zZRqW%FU=2CRzJ%xuD+P$H~;lq@Np8#qLS;Kndj3IenH|@uc`Oh@eM(4hXYWg8C?zt
ze4%0A{#Oa&2)UY!t@F#y`G~aEC5Qc@O?j`r2<YDRH7d_r_pd1JkQJ-jzy_8160l8a
zrG<3ds5?0z7HU6DmmKa5(jwh}u0JB5Fxm%@Hkz^%1M8b+*g{@;aKBYq2gq|mXmxKa
z#{bFo{bnAxpf9#ZKZ8e)|Cwq%w1U@zMBGf7$E9=s34d=08XC&;EsP1Be!l&F=x<ip
zxA%r>9k6VBT)I=UnK@0V|6d37e~`|`HOV&0o+2NHE+jFk6ZYK4dk^P<B_kw6P3q7b
z@oU06r(}_@nPefmp3T>dK~!?IS4=bJ`{6juVwdg_eprIUALZA7b;ojoAO1KYesDq-
zK3q5!t-3A)8t;k|H7*{KzTZJ<!&%;C$TnCMhms)j_^pSmukl0L*h@Oh4*Pw5%A=L9
zUuY>`tUIk8I8JNGWjkEKH78Mt)Gxdy(KkQc!zb@(zcr=WX(e0X+iY3BwwBVpwZUP*
zZA6oym2<g5-^}r*x$>&n_RMnGL(G_NjKVDMCJ2P}eOU?K?KUrU+Y@B0qc}Hx*E_Yc
zp|$H?Lvmui8)!+<Vgui;IlgQ)!A;9_=zE2h!)Uu3@T#R`%PbvDd3oQhd9{S4r#T~L
zg_^{0HnSvV^$t`Af2<h*A5sE74fpM3#yK#V#IAPAv6(B0l4T>pwlA+M!0VxU6Z4ze
z%BFKGw8%QEzJA}CDrkm+?o468aFtMu$@Y7fCM!PuH0*}1Hrap1^U=Wo)V{U(C3qE)
zBwB5*irLJWBH$*RI|}?z@<Rg~l!_~!0Hj5hXLFOKGm9_TM_jY#tc6hn)XC{Qv7)-~
zFe3P%p`Fx#Un8p6e&dzz&gHt>L5ZzXKxZQ8DD{E1iL{BVNqVf!v32)!l6?E{dh#=|
z=6x9e^!A{&D$P?RUL5|_lmgxnfhF;yJB|1{M4aGjw1p|2Zd;X}(?ri!WWjnMx?LVO
z<Q+-=(Xv2bql7yqfBv0tXY)JgS0J`c_nkjd=hzcnmTBlIRs6UvBb%@A*qwNQ&k-*)
zkiW$(o$W<pM@i%<+LPkvIV+atmNfG9UuJMp@vyTe_DIP;3v{~naI&f0su4h1uv{`d
zZ|0T5rLF%=^4NYaaHW%iNJYac-#acY=Z?<hM4dWUY}yadSW3pr_q;>5YZ3#S6Y>dg
zXBYiRR|@*KkE_nBk9C}J`12y_69+%J5_u;@#XU@{tzS1^hetm&_sXdJEJ;gUGpjNm
z(b}(XE)<^L&_IeLIH|M7%0~*2VRe}0pt3^tR$VIoLPN1Pno@I5dX0!AuC@voy&Fm*
zU~OXtIZ@gvdm4a#q!)54AUqlnSP~TNE-Ft~;`F(si6|9I4r<#v$xZ1q@-Jeg#P;CS
zl9g80xZ^BbaI&YupK{KQ$@GuB_9A$7uRUzEvfHRc=S8))ra4_*0BIAH0zk=bL+By8
zm^bcujE`{OXIh$n*`xNGa|828{-4_RM-$A!zhy5!1dcmGcD48o-K4~9<p%-)Agi|4
zY*!!5kOn1*y5Y_AcRaiQXL_;z_xG11R9Vmd<O0}f==#52lmBanqTn-uYxRHaQ2*Dl
z_rI;X^?$!c{XZ@G|4>t@_bu!f2GFk3ofE7t7!KgwAVnTo)4LP4{Lq52f%Uz;%j+FA
zpzP!XxDc$C;-hl2v-zgIw$)`UUrVfQpY&@JIf`$0!S8s?l!~w&Ul#x`ZH0ms@E3no
zi=S1bw1D^Tw15)=#yKP)YB~`*4G7RfU>Fw^v_EU9hvLTl(87x2^;G8OlOT&E(8I8}
zw4jk6ZaAh(DJ@uCQQSp|a^ir?0%$rrLubnNmo3}7dY5oC4VCsB8X)6HtDkNxEgPv<
zXe@7+@|$>IFBR?4fwG52LsHV>OZ5#6{$=;^4*E0zE|PV4@8KQeu=9Mue^M4I9S_>l
zul{9QI-nAfsXn^Xmd-}alYe=9IPao|uMFsD>m44}K^E?6POiT|RR}AR<EgHt_h;0-
zw*vSk${u`uGt+q?`%YvH#)sc;&8Jn?{N|Vn+poXs3Zepuq8uax=*WKdmmS$hD9Iav
z9Xbyox?}+W_wS>#dvZsxklxgKS2Hds4d?4_Ijwka<V^!^1PRJg8Dvd4e=|4S72NqM
z0_fBJf$8{lK0jW#q*D5{Z74Jli~$x2i?6xXI<Z{lR<^eKuf$rT_*J|A6M0DC5Au)-
z+mzMuuCBZ6cf>^n=#m**_O5CU&0_>GFEy)c0Mp$+<iH_=y4pASraRle5GvlQ6rmdB
zr0x_PJn47x(3rLEici5s550H0*hoz7Rye3s7VPJ~B;5QZ(^Dm9SMNJ#B8931RObIn
zsuE7=vz0qc3ou@fC!%gk>{`PW=nHf48<~w)tUiA!0q5E?lKtzc6;p?4va;N=3qfmR
zQo6aoInWfS5g52H6jASdwszYJ|3n!k(kalAB8$G%X)q;$nEurv?K2JtVoD<p26Wm_
zGXIvjU$>0w6os5Yn*wC<ff&dqL>`sN+tWHQ;L+87)|uC5Zv5^%8qGqVl4ef(kDK&Z
zQG#wtyXn)X2SZgh{RMkh7B7m5zKYg`D&PQ{6xI06nPw;6S{5*c+j!=9l1Jr6$j>`?
z_XHpun#npxCojRL`g<>b-BN>IDrWg-npbNsw5~W8p;GLIaYf(Vf6!u7jHD<tSiKC_
za<fIcQd%m1te}44=&@t7HbM2L_HaM+Te1fMJU-g9X@c9eW2X^=@~*BqDgbaki_ZTS
z^eR)F6nYiF=^{HE$z5d{|8jYx92wQnsP~(F;4vW1s{LbgrMuxczrX6HOv_y7d}6ex
z3Ti}6?icfiC6B*-ip8fSCThk5zuVV;KJ6ZVhNI8Mm0W~}9^MH`c9tW%^gJIgwEg&}
z%(Ry&t8DQQoBb;1?mrWuajN$oT+wdHU;jLh^fc?mh)By(bDtLuepaO{m~NlUd}9}t
z0qxO?ow4?R(#elrdGTw9e!WmsrN27ME6ui4^0LcWa59@CaD4D=%@d6epI{^0qf(|%
zKk~&lKgs{i&aub8ZerQrpJdIt;{Rw?CRpqwb#mz2Q4Le!>@U9JowHdo#l^qm=-`Q0
zD5ja?BByB@EaC^Q{Jd|!6>#b#^~qjNF0jigOebPiPtlD@r!w2uoH^6e`{{OkK^t}|
zMeanw?|#uPIVxT5Qv!2ypr1zz0)?<IqHSE{1CY#HVQzjGv996W{t6D($=@{6mCSxw
z8iqgbCOh(`)rA9jZ~uDp*VFxeakN~Kn*J@z4uq&{kfZBM;mU!85kY8+`S$@|i<_r@
zJuvuwsez=*l9%t?Bjt3pYyH&CRb#fz+K#^!?VNqXQJnDWGie31JA~G*-?zUR4XAWL
z4SIHBI^@@Hf4?{yu1J0O`*V<?W4`?5;kL`d^KsYgkq*68or?72)~%zk4dN~WkE5lE
zPlV@vpAnf`zJ#mFali20K)LDEB=UXYJcU)3@%{v>Znq^YG+X_;>P!aeRMUxRwaWuM
z&M&qNdMDox=*t%y%?FH+I%RL{^o#9e>wii_YCg@plK+kxTD+3s(xTelmrOjw{Y#d4
zyYN)ZA0@R1@qaikOxR+cZ;`5!+IMZLw9dF9=7mSCh&OcH6hHw6zA*n@?XRyoTBk^T
z;O(g&J8oqXr0eHW;U!z@Ba8h};@Wu}mw3hedS!s*^vagvya8>gYP8*ugyKCGb$+vI
z%!>LuaWnh!<J$GY&1(ulr*wr(5&S=YqscjK#zR1f&@|u_L_ePA5i^qO(3a;W?4nbV
z)<`{c_bRf*w-hmHFumyfLeKfR9^u&kpYKA6i+(JStwzAs9Cy*PjPh#lzw{Pfi2ZEd
z;!9OHbEFWv<Q>HRTOlknS&C&_mKV#2J_77IK3O4hlm&HNu2&E(SA75b8Y{BVZw8lt
z_U>80{NU*MUI#Bq{CSlB@w&~*gC?Qn8kCnh$YT-dukN`Er$unf#-e&P({^bzMUDfU
z>H~zk$vrA2%g@zvJ4biCDHGu%F1ysguZP`vG0Ox#nxX1-HL&XbSD2qk5CK*+G5$sb
zOGNHX%_U78L}&6S_$Oy&jY}@$Thhcs#dp~qY3)?L%+tAi8`ulirKUj6F%O5$fHi4B
z=7Cd2^z{{x5j-;XX8IYrpp&@sFsj?)ReN@Qz%RMlc~PH8L*0N<pH>9#aEVr|{l-(*
zva}i!A}TB#<rb=yk^A+l%8CrP{_m3o*j>R_ffIGQ$9x=86*h3VEKpBVv8<KVJX_l<
zS+b#rsrONSuMh)(V_0s_T}SyJ1g+kO8hms5v;p|$3r_wX&I;A9hs|r6dOTRS$8@7S
zKck%%a`m<s&}f@&Q7Y~_L>?3YtA$=Kpf`};#fP&8kfjaiZ2Z}I9D5tNKeDkw2cNyw
zmnsX1&4EdsB~KBjqfv)}skcg{4`S4PC`WAyiRsi;*aoun1g~oj6{KlkB>S$=|A(jh
zEg1e!|6rmvJ9`}k?zJMv!A}WWjv=7upr_;gs;C}u@mv6hFG9aY)$&yFRLm95-A6^&
zcIMTU34FrS?~R!N5Ym1n<~9#67wDT*%TH<W_n#pdGt;Fst@?}2J2&oV5n4ByTBd)N
zmS46Vl$c(DqhgHfIzW+c7}e?{KiEg(&Ia_iB=gW$D#os+tKM_nX-(F?Qgrse)i3}v
zG|*3h;!9sz5~B80@iA^A(-S_Doicga9>=MK790!KRt`iuf7(93qhK0Q=(c~c6-U8V
zSl&c|k5}ZN`;@SWzvbkM>M*e)%v#3Bj}Xe2<mA-4S5~^u?~#uMNUfpq=O$FU7L;`6
zqOjCp?2DIS%jz}mXe*cE%3{9ILyQtLCm+()7P!Y>k=e*j<eypCAqA@J;d0)gMEGS>
zcE9i^9;6FEBb(E~;~LziTAlHQ%^G*|uiAkY3HrxqlMtceO}P@=55SKX$n&eBh#3Xi
zK{?o?mGuA~I0Q2non~#s^cnf`y5hfdH%YKWomeS>eefPh);H@oj$u`y=)hsjSk?Jm
zfBfrHc3vp*gWIfk9t*s&yUg^TIB@vxX1+7*dskM^(<N7O?lF@uDR@6`Y937frz2rz
z`hwIevm=B(;`O-;2<GT`X3-GS(2E`s_Z#@9YlTx}cY=lSMa^H_mb=%!v!#-@6oSyu
zz7Sx&R~qO(abWQXC*S6<B;9xS%T~WrP6CiFQyhMtw$C0r?aDu;sZHr_v!xhhu;SFx
zSY5W``r7M>GTXuK+d=iMTb!D6ucYWAG0i?Z=xiT`SG#!G{^LWGg*@i<NEo4up(wLJ
z=CjCxl-R_AfFtQvK0a?9^ElsrIkA#_T8&|*H+i>9<KKAxUCkD+4Pbv`ES<5tn+lI_
zJd{m>!5;A%AM?2fQEEFeS@6T)?c&J$`Sd@JamWl%BoNWB`GM1;sOG;Gx&;~pj4JFQ
zoc$C|yP{*)0}=WKyLm8qyOyayyeTmw0`6m|T015#Q;qg%17l<83(p6M(v&^tmfqzM
z{uY@ZhfM$?S4oz0dJ29Kdxi<pg-WV|Wg03$P_qV;v9<J@&(DkAJG^4`U>7$bU0GFq
z^88kX9*=z}q9Fzl9Y!G}IHULjVm8Fln!~21QYme0KRSPghfyE@S-gI$p}kZhKwnzC
z8ldbnmi3tg3d5?oG?oO~#*>@!5tuc%-j->r5A<pSyFcNb0gXyNW0n0_NueWtAEJ_z
z3(!(-VAn-!P8}M{kj%LumEFd-!^6sRq>%3~LW+OvdDt_69%sIXdrMh3ToK>2-FutC
zAEL$rj20kJER?oZW<NHYLcT8dI~M?+-R{gqdHL7kc4P5twb^iZ@oHMXEINeABht=o
z@Wpqh`=-a)I4EH`BiC-H{hxO|l?c?{FqymRGPs25Mwxb?QfN0+R%poVlgIqrpw9Z?
zsY7AELL|!lPCEJO3P@+z4H72$lgG-e5o^8u{rrdgo=HejAsyo>s@7w6SGf68o_=oJ
zk`Sm_k#JvF|KRPKrkdth^Q2kP0IeuB`P!fEZivlMioE+zR3~1?{qmbZ7vn{LS+=1M
zRyITBHnJO2kjsWuwX63A447qG7#6VimNeUhCY5&#a$5RtC;dO&CpfrI1mr3GYmXJ#
z4n{(nV)*?T85puaYrf0-mqou_Ro*TEDzshOy%m$({+97zpH}m*<9s_>GdS$ObUk>x
zNI+#QLBowt07{+n7nedetxwm2rFnQNuYk}j9>HI8Te))gs#N@O;`UYrhsFT(R!<lC
zvbXfXb<FVVf<y8+W@b#AhYBU|m37(W8vfkHf1IK}mJL9h$=*}+2bgAW`ERTE)E*~~
zWeEUKTFI)|tW7^B;*hM%xlsGvYkNrLX<s%`*B;8)jAdNU6wAl@Ns0&8(=?#ukKGSD
z-nk>Oe|w>4wP6R~KbUGSfXrG(xs9G!i{PK%9`4fW)y5RoPuBg&NT(_nkF$lwu!7@M
zZ2MD&$DdU_;^g{wgtS^c)n}hy8U15OVZgX&D>%SI>+W$u%e!5uyD9aXn^(;ruGCs6
zvr_XEQB6>Ya*^MxUHxMrO{9NIM3t$g6VQ_^ELM|Eg`s0S<xZZb#=De{RNvU;)cQwL
z;rEp$RNC6eR(NeZ7wtj{9U8l3J<}2E-1Lvg;_oTi)ECri3Fy^QD@;YCevMIut(9Tb
z{frk!Tz)ZKQofbIHc;Z~J@nq(V$vu=kE^^EFsSke7_s`0?E!UB`oDDzV(20vwGgCy
ze1(2m5J11Vtbfbzc_S#?rLpVy=-QO;YPog+G)2$U)NS@$d082NtUKg?FtAhb7^Xw=
z<iDfZUHldCS%l3`SBE}0+NAf}=oPC22hxNWtbLbo15V{4lgT;IRLQPoSm&k8K8t4C
zudwG{o808Pf9w2csPG!N&A|_zHu1+&)B#`d5-?qJ0b>g%cX>|K44QW-?Mtc~b~lLo
ze62Qa^0O<g)SmpH+hF9aGA_d%y2Hx+H}5`|pf+qmzS{YM-Dvfxjr9xH7y1gX%jrID
z_)Tg_IYy8g)aS_q6F70*%cI`i&skf$SGv<4(E%Hsb*D{X^7Y?XXBR?g#UrAXBXCJU
z+vJ45ChIdY!}KMx?Z5{y4Gqn#f21UnhU|#HD0P9&sSh}?cx*JT!ges(i?G!_gdphA
zbPA0leX>NFIYqHMj@cE}U6B}g+TDj^3H2|c3usQbgQ?>hyO3BMJ9&T!P#tdL&c&ny
z>X30jR{}%{G>afGa#7%Szg>&2aw>EYG8T~Mc0Zp+<c&A#(WKb%e&Q764*wfF%*8<+
zF7eKAG+>Z>*lfic8eZ;om;i*vf!BW%a#Ik~85Ek3kEnOg)>SRMrWV7%Jv+z!1Ap>U
zUE*lmmPew1$uumaAJZwM_q%O=dS$aR@$9|Krjb&Yv#3l@D9F;qT;2s+*d>*eh4^ES
z&I10&T7TV=&WC3C5;UmlVjlrYB-W<OOB#+uKIlxN$@lNn?Qq<^XR+tBi|CUTjE6y+
zp=1sMj&AdDb6*Vcv|Jbe8@I<rok@1=9sOE~oRM6ZK<iq2!{9uAbM5^ap7NlvFBG@k
z&&A*^dS>i^Yj_g4A)b>qZ73&(=3RRa&RyRB+qd^+o~;#t>D|n?r`st%0G)2tcVCcQ
z=5J_?`nQY$%^bQ)T!4h%+{J>TfLO~$qOw4@({gUE%H}27YJxWo5Xr-O6$VoF?+@<o
z>e8O)IcA-Bi3+)K$y5ldY6OG|kgi9PLx%t<l(^lHUZGy)pIqK;Lshb)!n^kiBpJq+
z+{H6SYj7F5`O(>wkd78lB($3r#J<?SL-GIL7)FC$%H23GqFQ&s9T2yPL&oBP#1GLy
z_0govvD4n&Z{{~oTWQVb`bFPvXss2Zz35zrBA2>zJ=Q&9M0ho3xi{k+7c<i;^!a`7
z`%3F+R29L`=%1fezIx=sHJzI)cN(74aNJUUcjD-xf%esNZ{Oa^*nj!@V{McI^3xp)
z-1686N4GP>i29%vVQJYm4gyn(AE1w9;?cT(&gw|Yt&sbZmuVT6_Ff$}TVt#$(`I6#
zzClGbo8JZ@ge65rlm>Tq-^#i5x%W+%tW_W{FCCay@Obx+%s>3O?#P^z@n+Ln)5>Ux
zy2YjIfOm`VmTY$yadyxcaC=H;-^HvCK9+i~lHz~&!~adVV(#gHguUk#ZMPj(hdZAm
zImB&K+XRear`o9@8pKB>5+e2dT}mAd4<Jl%C2G`%V@wT$flI=|o1ZTpPlO874)Um7
zx6(bE)_rd=+<8CK&0@J{mW1~j>Xfhc=cQhhKe%u4xKTyK{YsV4ydykpY>^t@Y5wZb
z))epZKv`P8475ZL&2v=BTedjD@sG?$WS^hyNoXhJ3|?ocFgX#x;qr;~Z>?>wQtH$x
z?eihyj~wV%K0-b^RN9VR2Bm?ShmRR8*V9Oc4Ns34%j6J`G4(zluT{zqEIsHX*;_9r
zwGC0A`_6iw_4DVZn>V&5j-<pdGt~<}wq!gx<foJHVdp$Nm@g8KjwH%?dm;jCpNEI1
zvm^4oB5oM`)rRxlpuQvy$pqj}o#_^<$jI25mING!W~6d-+|&$5{NRcI$-3sBjbrPN
zj4Kapg96|6guWv8-nzrWHB|h5!&e=c>f_LbA>+bO{=iZu$^5HIr#a7$S3Pie^|3q!
z(J+~Mq{E0MzwhnT{D#=x5$>zo*+o$6^Y~yh!?Qr%KKnnOD;>8-zSfYE^3J`LDSAUq
zLojUSTGBrY;?Dmf&rz4SFK2OW7ez%zDn{W=T7BTcNc)!F4wWhq561HLCwBVJ#>Fpx
zXZyQH_F(78u;WLzHwDbLMC=C3LUM<y{<JTgZ-<t>m0*F-K`wnb@iegaaJK}BTk=Cn
z)LVvk?2>$wvV$_tAKLa6u(PV^#>U1SVN(-!R6o-{eeTA+OCFi044)kOGk&k~Wc1<{
zGtok$(np6U+0|U<d(XwwXC77JWuyi(zWL|D^ej!pdvjGUFfbJJ<>tGDCDOsb1*1!q
zJ^uS>=iaf;9clIrH5gP<+=7po<NM8^H(R3xlJ<EcboIY&u1+R7Sgl?#sgBf?$3Muf
zx)O9K4NM1=zE`Xo24`bF5c4PXOk3O)lNvYIcu{Yxt#yA<63fx>pSN3kh<N}`-ecGD
zWeUwKd|ROIlGYlkSaDPP)1#4YSUBDe?#U;H{~z9P^T#dQeukSYc0(UPYmP)jji)V`
zHOTATeEaS>G(E2m&s6%}Aqmpu>)X6bLsc;)xW%+`qf#rA8HO9rLMMHM%c6ACV^gk&
ztUkBayPkf=^}J4!^|=E2j!cKTxMAlU)Aao=Q}69u<#JlL+fE3f_r0KH;7rv_lKuuJ
z$EKf{1JhvY)>`=YC+Cb33Ai2*&BeWghg<jNG_=a-hgBc?%1gJ$e;5K!0wWId8$4#>
zEOOk@W6Ja|=PJjSr!k%jeHS$L&@vkr*z#(35zVYrA8yPeZo~b2EhN0Ki`Ru}R{~fB
z1(H+zwn7Xm?UzK|KRsg>b(*@yXDjQpefW>>(GREroyPU~{^FFLPhbq$s}AXf3w#&2
ze`?6o3%q+yO43b$o~Mi_n;xhd4NtOZp!>~X^&N$J>QBF)@BHsn>J4$K%rH9p{plAK
zpCZ4fM0Z2r#D*tmgEJ7GQ~~w*u{Y%je@y;yRy;_z7T=r*X&Fjt%&S>MO{T>jNscN_
zsIWt-5n@?kDU*zg!QU&T461Sst|s2+=S+RTeNp`-ZEj*E2Er4=)*2#{?D|KNd&gW+
z!&Q+~OJkk;p3Z5a_!RPXbNMisl`BVFFe5vCrlC>HAb<gbmLH!SD7)K074Wv8U$AEJ
zQb5U~Cn_l$QCB-m{OFBa&U|{1&H5HzC0TaQEl)7ZH|Ki9naDS9zQ>%l<?LuyesT00
zm^ft#CZa_~N2?s>5YO0um|Yu;r`o7uu6TTTjE;&3$PiV*2*8ZCHg)OkmB!qg=_<Xo
zp3a56$thsl&5CiJ;O#!`Tp3v!3G+O+k!p>eU>1Y<78vKaUNrduk*_bLaB)f|e6D8v
ze$`siw%T+Q?K|TtgF(;*K!BI{e^l_kIrePaX`3vCU6~jw^;o?haCs|?OJ+S|&xpHY
z%F7ooocRQ^w5{O9)3o9z0#LMKUr+ropV~uA1050D?F2n`xbuWBV*AE0?8pP}RYB{7
z1H(ml?Ee1kk`iZ^3h8p2fx*v0|H<b5h2q;W%i3*pk<vhHJ|0W_h|WjHbjvs^q-Q+w
z(C8-FOg=J9h)bu<_3%MMy4{PYBpv$p`L)gT8BQcB<`NU#c=&xqtYo7RX&ztihW!~$
z>~P&^P}+Pf$n)^>J=qif&=6Kjvb=J?$+wUpZe+`G^)g!438CWs8<1CJb_rrO(Rv3e
zC%3o3#J5av!+K6EY-PTmly+OZ#=@uBn_(|AhDDE5>EtUaY|W-eMnye@IBjbSKvx=Q
zb04+GYZ||zrCw0w_I%P5%7Ie5r3wQcSyvryObwOjtf?)`{5fz10Nh>pz?^JTwN5!)
zA`2EXzO^TWdxP+LHe7b?TJ=Iv%`6y89v=IQRvEic3?IAciR&AFt9)>@C_+>EYfbK_
zCouv>Dgs6oy-N)l)asgNZ(tY-Afw631njcK)9M?MiIE188n3JAnf+tT{NjpWTh{uA
zC$`|>@>|zf9=zU*$}CJ?I-e1_zlDQYc4*S<2BS@Kd()EyFbXml@F;w)FB_15@P)~*
z=mwp7;Nen>&a93knP82{(PtrAyeYw@B@Si>E1?q=2bg6!rAst^*yYp$-ghz<jK%e3
zf!|ra=U7ia_oAx8YnqRgloWqk4E7Wf^Zaq)|4k3-&j52p>*25q^KzTaErT^E$VZ8M
zFK5|9f%=Aogph&M`{s{@&YTHCG~k1&)n_{H>9)A?$8=*~mdl=vy@s&n)GQB^eDmhK
zekMI{VB>%sos{F5mm<oEtrI*oR=L;Jk7{Oxa=2acmks0QlzMz#R~^H3`$BQxi{T18
zb0-_!)SSZmpPy6HEKf~6U}60pV0_qVZQ#B6m5OOrM=*--8#o?7Tj*td?N*Mw85rpe
zW`-*~wZ*8UCKcCV*^{6o{FsKO$LHs)y@f^+g}0Zl2CW)<&1H&uu1)!zbI^*rq#RMc
z^u1FSqfX^0`UQ|7E6aIfGpu^DXihtRmvNoHnse&hxvwD@48`<y$l;95ZdFMT-`#7R
z1@k_!DlyM4J|lrC^?i27<-E$09ke44i|ku?r0uIV<7S#W&Wn&OU{B$hefX(`ipr?c
zJ`>Ctv(P`Uo0p+~h;E)7Ci$HXHAEG%3C85PtVPpkd7cVT_1<p%D2!ch1k)Mc^7$$4
zl@)6I^KG1n#XLePp!<GFzgWL9OWB|VcPEX<GF?fDli9%`c<uM6bjfU&OHBSD3Kw`E
zyBCHgRLr^;TF*r#L9Pr`u5A_WC)kgvO$5iiTZ(tr`!K`ze7wrztJ&XH{_GUx&rovl
zc0;q4PvDHt`V#V!J@<$E4_KcKF|BlD`Y-s`(Q5-s#+l);egD3dd!P80-M8$>)qeV0
z+Q(40?%)5O<F(Y7`&F1vr#ybc`RkNARkPx;$VPMRMkKXkBrDrNWydoi&Pf(z0(EtT
zk%h)O!gbq(jls>6+xSWMOrn&t=zcb1hrRxhtPhSE)Xu(rQ8u3~arg+lQwA+--IeMu
z&wY?hFawW4^^8<Gn_N$;CxY3M)!$*;YiddT`BV%DlUE{XbW5ZAFKu=zkkwrm`dp))
zKIRb~{_`@?8@srAIx(DG?0FC)kNq2!DKNy=lx4DZsr3cjSdBZx3ouccxIVV*r|9*W
z1c+r%mPU~sm$XYNWh}k+ai4|&8kfF17F7<?ptVF)m=h&Y(U~C8se2|&=Go-w_EbI6
zM!(s@BLTy*XTXe`WN5T4X?10v9cuQy^Js=a&Obx1-CB8wA-7<K`B@gZ6wPv(T4>um
z0?B?c?#r@>%FAO)U@ZE&fMEP2+DP$Sn9tT+cCJ>6{0VP|mUG#&D2X20;R8bzc4}rm
ztIFd~a>2CsXZCd)dNOLsB!{aGBb9*G&{j2s=jjA2h;X8)8BC5X>K*A{qdv*&&(yH*
z@oUQ;g5ZBCxIQS<Nc6RoT-_g^n?Fzcv3)1h5f7QpxJid|U3vnEXxs67_j5V^Wu)^L
zk=a>1#guG<$&Hp9Lx)|KQfWmOWP(D*t~wrJG4ua}h2<Qdg-}FITxxp|oY$`T@_|Hz
zo6eoDHB=GRF+$s6e)tKNy!f{{nj7aM>j7wMNX<s1^qf>3cT)Gn{f^dY?%wL}N19z1
zk*(7Kb{*=@y~p-7Ng4UrUeLW>e7O-a|Mk;^q1Q#``N@kS?<|eE&Ov>ck16=c9zJ%l
zzPu1PtfKZKlGcd4DE={Oy&~i5F(z(tXHEvz9=;C&LsZ)y8P<BdKjS9Fyy*Y-EZrcO
zQSbgX&6u8M3{Ki=4O!^Ue4%&N^&|-^OWK@tnGBVX{<bt+*`L=9_=c!5Gcsm3fs|Px
ztj+?3=7V2*_dMIpa8v0e6uh(c+mSFj5@-$o(A(yJFtWk!7S<xgH>+oW8iPuK%4^$g
zycFr+z5C$M^QFoWrx!2YN!avVpnBA#Sl_sM;FhBJ-1F|wj>1zUFlRO~^_FpO|C#-L
z?LxsZ=a4XSKAh13YFFv^Ya#W^qcuseeROopwNuHo-<TTImQ9b?w_ZGOAmX)cqujnv
z4kO`rd091LFP?aEA&g)H_aiPAgz@lejCiB#G>=8Zw3SA)%&jU~k!RDxv7cu4*Wt>A
z&6_OWdR|cIIo?QQ!`(AKy$X9Y6wL#oA-s~t+CQTDNEPaL^gYRP-nmYhw@nZ5--Pe`
zF83}6Nu&0MThNN#(1VW^{8t?U!+yk^|1lNt7j8+U5A_W$X3poWowcG7S?zu)-~TW_
zCv`fRVNvFq6)Q`wUtm+2$G2NUo#&D2jWbZ%*w#XWI+@qsrI!4O&#~MCYWy%lz<2k;
zOmp_zZ}Y6KmzitPw2WOTbF&dI94!ggoOh5qosn_Vmd2DSCaS)t`}{2|maA&tQ}sQx
z?M9eRrAz$^%3Pgz36t*Jz?=ZoWMc4^_>p|OeGME>uDv2O9`6Vypy6iu9+#H}#m_e5
z<`FM|Em!6u0uR-isx+x-Q;ELf>%=o!#}B~FoC%o>=-U6ehhp-<pj`&G6GMLnILXls
zr$9+nA#e3fJ)eRJxyw%)J;5k)b>LlMH2whE_hV&YBm)(0E<1($R>yNze!9HbphFA+
zWAS1(IZh8HPIw~nbbB914TPEiBNuOA|FMEFU>^Pr%t=o=dp3{TeZ*1o!v{G@Mi5x!
zCOBf+C3=AL7-wj#G323#lCBI6)>J{Sr`=%Hc~K^C>&{oDJ%DB{_OAM~@%<rhQ1r~Q
zX!8<J%%i#h>USUWIAZ^#?k-PhPn3!fgl*op=y|QmeI35N_JXBCj`vyMheKDYhASbJ
z5~|a<v3|j-sXyZ7eXAkIPZMD?!?Sd!p3-rj(0;R%N&(r7-c#>R+3>;Lm%ihQ9^AOD
z*&Xrq(1DQ;nSOlfBYQFS)+NAd(KC;vo+|noQvT=k(Lc+~X&(Pus??odzowC~)lqJ?
ztq(4_F^E~mss!sk&#V^9>x$PPoU?#3Fs@|YRJY}f@G!S*?(>bTvtiUV_gm=W0y#y3
z($;D#O=Rh+d!Dgy^w-f;*XD0oT(mj&t(99suBTzy%o?eu9-Mi@lObs;EqOvP=nn%&
zS$V-|sPLyMg9EZb3(qDl9%<&+HngTs>UhAHbNzB=w_fb|<p$-uAZvGtN{L@YL??m)
z)I_d>;7o2x<jDCUFc$no&QL(xXvTFGv->U|o=dwgs{<F%?M<0gPtZ(fO7VO5lbE@^
z$9=xMI?-EUXG9eumFUT;8hEW&JCh7d%z<M;BE>h{GN#O#y27RB&jx4swh1>gMQWsB
z4<9@k02z4Kplpop&5bxSK?BGE2+Qe|I6i?-Gx3_7*Sf>Ul|B0sJ_S#@Ogv?)?vAZD
z)oZT|A)F5FvQDw!@m+u2^sTJ!tT8%uE3CkzHlTs~3^Mzs^$n++qG|OD17%hbu%iwg
zP0h_ZNz$&fK=fRbXz_);>jGf3Vt2oxHu63W0+#!&pMLA@`uh5|-qKX#6NdGq*s}rG
z`PvgCvMB+Suj?ONZ!PA!GX)Xfw@oE@Bgw1HJk)GN8ogV4?p5R*`ZR*{BWM&;KlWAw
zRft@#jrr;=pqCe%8_Q^jhqe-~9nL@axb}sU_L(zFqP7Doua=oVaNj(0rapB9P_fN9
zOK?6?)}U6cd3>%&sEiRMb~`s+Y=qV^d17Rs!j1!xb2Ct}nli?|Oj$XSyOZ5OY7!{v
zL&o3s(M%jm^jZ754t7~)`ny*J`qZO+XM&HHh%bjIkT%l?kCc0##g)gHdW95K&*$aL
ze-i#Q#jjrbG4DuwyqI&*VTh8X-mLR0`4cCUaK4hrgOgI-YSg$fHb)I1gLjGw$TWp>
z1#TX~&;EQ#peiz3_nb{wmF@fBIC*8B<z%jY_fN&DN$s{g)E@Drq@3L&^ZB_B9Q&fi
zy%BS@eK%%Cd&?021M_@DoSE}#3RQV#tA0*GP?&CI*s=7WLp5p|@z_`|-=pM53h7xL
zv8iX^q)0E~QpkLJRYdPF;OvC7dn#)r;i(`{O^rCIn{woC=lP(8qFaR=x;kR~r*pl;
z-t=0v+vIGC<>gGqbEXN(mKL&mBZ=1Ck$2|HzltDwtsr^*7PXm=Iui?l5>u-aA-HaI
z6dbqiSe&z7HWKNjg=pww#*)(HlSQuB8NyYBL#_+oG!XXJ7EV)L9gicio~2_xify3f
zIjc8(+lPINWbjl^_>NR(w-;`?FxDpvI@uK3GbeKC(vb-K<rd%XA$*Bzv6eGa=C@*5
zAl}+xmA>k-B@svBpdE=)MHTPnaVHSO&unHNT53Q_=hXS|10zK~DZbb^Yb30WrTMA@
z(utBw<2!uu;m3H0G|SfrD&sjI+t%Vzf-G<oD{WQDMq!C&=czBRC*B;Lt5{sL%{D3U
zD~grW%h*W2)WenvQRI1V<(y?$V;?b;q_b`()thAT_U-(@`}DwEshK7*;?w?(WR`vt
z_oN=xt38#e#95?Z_3Ybv@vB4dK|7Dxv|v$DNfi)D=3GAhD8&|6RI}XOe33H@gqL8<
z_JU2kE`EbF{IC)I*$zx5_t#BBUQQVo*f*gP%6{&Q_x>4yXNT3DbR|X{uG}Tgs@C})
zUgq*VzMKjC;oAG%#gM`JXMCk+&v2o1BW+|N9L3J4=V1ldnwQ4B(YmtlKSwd{J;PJ8
z_VSqU$v;Cw=-jt8*o{@O@5NnD%Fm9dR7pZl3d;t98Qx7ePK-?FV#U=LHh(Uysx{_Y
zf4Ddu^3d<AF|HodA=4?Lk@1?w*X*ElSnbJY($kST#srHZ9a$Dn^cCP&>qx@RggSaU
z1>E0QzveFV-NnOH#I^o&>HcMnSz6D_$u=An>0AZLMIPOE2Bay`b-!nwGpgg=oM-t_
zKDn(6$<#+;xrd9YX5wE}#1SQz%6fWh&@hfzGx48SNQ-&}_7o>r3yp(_&5RcKoLuXy
z$!*x%8M-+k_ocS@`yHCjDcQYh6TV)}VO;F0ch8;q`-zhhrut(He#d$m1{j(=F7^cq
z^N6SfIr54KK4=Pgnb1FWTaoIF<&jw5EyU$5`)`*5Ub)*o4UCLr>TDTjm26`+?&%n<
zIU9zk$CbR{e_wKc`Z;U){GZuf{~u>>9aYu(w);yr(jd7+SRhDuw;(J^x&@>gqy?lq
zBm^X+TS~f1Is`#dI;6Yn_prZv@A01Vd&fENIR7|?4u%XCbI#|!uj_MNb8F!mdnc1h
zBt?GP=Q^xNJtET|Mf2R#N6=)?h;aV`Q9V>PbN$|xeZtP+#dmvOG;LhLD799?NvD|Y
zh+G7e^G#MOpN(G>wFW(tc5|`Vc5_WrYVDaWeD5#pjqqMe)=5-5o%|W~wXmU8D9{EX
z+bxJ2EF2}@z+mskOvJPZ(UVxa3{xic-IkCV&StFA{(!f!<KU;K+ADhyG3$aiJGiE*
z(8j^(g-s6!p$ftBvUKd4CteNFXc{eN0Eq?mnKSfZqOoT0uLlb|gV*I+BEPT<E_of>
z;X>blq!$16&bPGkFFopgrhZlG5y9v!Y%EZGFV#+Y?ShW{oSY=cgUVX!<-kn<-T+!V
z?-)Pm%QB-r9#s0{&gS<gpuOzo1EZp{<3uEh*ts$5>*I|jpSxqK<&>9IS{93Kz9+rU
zqIoYf#zc&}F)6yap<mahYYE=no7QH6H7a16GOYEb?}9~1Pv=`zkL%sq>Z}a2IBc*H
zOt<&W-h;Y?{P9vffmZ7l2Ut}e_zC)}vCwbY2FdniPh3CHx&Po85mZ@3UpjMM(<lq=
zyi2*maL6;@m~CbrUv$v5&Na6q#W$@KZa(ZLdv|l#lTsi`Tr>qM|HW|T8+te2M&sqj
z-`IR4!5Ox=6xCWdt3x^7S25!LRp0kU|I}0^&%wd_WNU(P!HZ)2E|Xk;symL{yzK*=
z0#_aP-R-`QfZ<Ae^ON&un)(~jefX=C{a!<g6$|^kE$8!|U2!nK&lxL29B?8^+h$lN
zK1<d+QxzV8arPEj)9Y%8K47!801~P;lAtbM-TDs^@#Nnl!y@<ZHSYUZh~qzh-bz&M
zi3E%Bhro*c*86n(TX!rk)bv1Vw)6tYXpuW!F7qFd*wxsVe~S+h&px=8Mhxkk3TR9)
z5T;Gc?x@Z6^CCWN+_;6Ab<~8L5d<uKHc)qoVlGzL?eI~+w5XE&AB_Khe+eSB(p1<Y
zk^<tF!}Z{k?fv4U9r^fPpJjZbq=2D-og{Qvk)SA}`i<D8TJdWS55jqi?*TT@kZ)=Q
zkEmUdqKZU)?rtc&?x)|$hSSZ|nTYI8Rexd7kj(*|jIyw=Qf97ANtWZneuXP2^>YXW
zJtkfD-kRjZ4hM^HP|uC-%t5z#{io{66Qs^up@Q7p>W`VbA(YOQPc%@_4<9pf{{&S+
zJ30s<EkQ}U@~n3Ag8VBH98IJA*7)sWS>PShH0qY8@&o<R*iU%zsOu70SEVbDz82t6
zYf+?$O7ghSOPXTF`wg1LQHhP$4Dg(i0F$@+L22F~so-Y>?eVEaN0-)di+&-CpfC(t
z@wx6fvtkwmZypdA%#K&!x1&(fyBY7hlKkn@dO*c4a2;~NYRl))jo?@6g`K$z<`9mQ
z@Cg$&PxwBp?xJE`TqcZ$b`nV*kyI+3n!UwPdX&O-!-;o3uYa5pzI6BQGQc?#9hO*t
zcZ8tkh`9i{6sOoiAjJlc`|49b0Aj}~j!0*HZ`h#kE!kBH#L=VfZphZ3@BIE^<#8)C
zpvxC*ESX;dpTScx;HH|Hjv^83ik2Yn6_Jtv#x6|#tF{zGWfpmvpK)zQIe4|l`DEe#
zZn8GQz6btE2d?|53l8iy%B0RwYbZ$*YpPZ#1XG$CsbV6W_~?VoOqqd*TeUk{YtmHz
zy0OteT>!@Tn)3X0;1+td!Soovgw>Z0uhSW&qvVUP+d%&ir|X{X<ht$e24(O;oH_?s
zQK!QB2yzhA7&<;F-WQlyoUxiJ&&20We-_2t!S@m<JB{fvrZrOAL?>QDp5zXcFZppF
zZ!i_F|FkM=CK|OZC#@9@!lfO4_AwDPUHT|yh*7;H1L)4dU7laI(fv?c99CZbW|=xC
zK0yI5SD+rb6ck<XI@go=VyFniw8;7AvX5s(#6A$11TR;n4{BXfE!KXexXMX$kaeY?
zGWLik!0snAa8aASQCrI_+5-z52mgO=fd`5fKJybfAA5IY@_j#^AW>9J>lF_h+pnj7
zRDv0rU#}lkwK~08fcSAdCkr^3^A$cj6#cax=`%{E0v)RvBBTFE*pj?AbaUW8cm%cd
zyh3_6v$?C}r;do?E6B#2XpUX!P9Dryj^Xpdsc9uCf^xt+NAA^EN$D^4rXkdIPjoqL
z4b$PLL~z<8V=aTRDNt#^N+6^jSFE|GhrcYU|Ls*jB%}HM?z%<(Tj-(-JWfI;HntHv
zW)4Khmz0J=Lhzhn`Lm-a!Gm-rAA=sdx=KKrxluD~n~g&0*7hpR01tOy>*r#-KN=0A
zF@)Q%%B<KX#iqOYpaTO<QpXr_nC3Lh$4`QW`yM1<KO<TmNsGVz!ft}D=Y6>b4Trkd
zTKw!r>s+A?_vhpTre&fL9de+UU;sM{=JhpLjQ@zaP$)<ExV=J1CyCul4S!H@8Pr&n
zbIh?O^Dg1ahLQzjDs+m~Pg}2xvuqTrs(l5u@)anEr?Dlq3e1hiFkXQDu6S{#=nj%v
zWBXg%4uy}qR`HjZd@m2sUfJq>{I7^w@34v*@6Ubi6Zh|ipnkJ9ZG7)<PbaMcj~bk}
zx2#qkq~YEI88Xi22(ulyzG9VnHP%mJEh<app+Qu)H8yRXG2^(=-o%W2BoYP~?9W4{
z*EMf|dlAq=Mx$oz{xMg+p-DF;FEidIu6i`6htd;vPM7qe%KO$sKIq{vl7ONh;<h_{
zg;!w-B`VrTT7BK<Vl&g?C15DR>d;n7MFOYN`ikMnlP7?plWv^xJ(~w+*ynicY9oDQ
zDaNM@?|#Z_yOW+S339u^<FhQ)W`r(s@3mp|Uqc928Xl}>y#R|Gtk)w!j+_9P|B<hl
z#;<1Z42m7cEjq=8JeRNdrPQC-dx;=bKHblL*ORP&CD;7@e%#qHzWQvN6ZRe(Bx<Fp
zP_3AV%VtK^K;UE5?_zO^cLtpdKz=~RXee_Z!AQH<7Xj|w&kfsfBBql|=kJ6Xbyqk7
zOv6i0C4z9&w+i%|8@wq+zZjEU1vjY^Rs0M-M!{{b_`>T0yxM$F`R|x3%ySU&R_Ffi
z7A<T~pAnOq_ljrED#DN&Q=Oh|Qedy}cw>al={766sthhpQTK196o_kL-j8R?4ZrD2
zm3lPbv^x+jHurObdv(qLH^|Cc9I;jzzx98tSD-xT6+Sn~8W!j2&9KzBj@<aQD=RCS
z6~JY=iIy(>^MN1Lz&1(mYyXe~tbM$I(fNa#+v6YCPV;$}Uxspts$V~MniP|j3CkVQ
zLfKrO4N}exOMooNXT<m~B(+8CYpO@XF9{I!FY3Z=J;D|I^lCX|<Gw^8UFM#DSENB9
z8$Df4RN9gtd3#Ir>76eFZ%8i$bGpmAQ8p&ONj6HK%RFvA8no_yl(wv-43QHfLc^Ww
zM%>Egu3#yc>j+t>u}M*%=Qhb^Qc8!(%Cal_?g8Zy?b7#oh&zO7W~-7O!*W{59;;Hr
zz$?MJLt~-EYcrHC-9C2qEg#OA@YSDZW+{hmY6_XEnBSKn2!<4rWk?uAysxZ}>O;F$
z;ZhN}Us248<{&5&p?_2IpcH;z*S9Q3@5)V7(W4HJ+<pceKE`FDRrO%8cgLNg9xvCq
z_4Pj_&1p-V(|sQ+pl9$p{7zhGHj=J@jZ;nsOIi$wMA<4+s^OUw<)yV0!E@2~k`p_(
z^S1djQ(dfo3ZbR_zVpdNtW<cbAY0b~f+Nv4XSEcv=%Njqs@p0mPAzCsmpZ6{yL}Nq
zM#gEr7;h+8*UdKFO&*?s#s~GvVTMM(!3(v47^c4)d*u>;=3gfShNQ$XPaNDixwEbo
z!(4x0R0-wip429_Ax@HnWSt?B<3}G8ZIsz4&7U=j_=RAqd7QXwMz(W<n~F7LamoxQ
zdUt{lMrI$~*4&|q^PI%1@@wi1IN_D!pz<*8p6^1)Z}pAEdVW~5m=m8%d5VaA;EoI3
zX*k>aU93S}vC?tr(6W@i+U&h6D0a^E#-kI9=g;+LS3Cms&I5&b@#Ohqcn997x-T_0
zvqWM&tcKVD&Sk#zQJ(nmBR0opkLe$Ky%9^I!hH`WX^*VXg>R2l2gKgi0vy!Y!!L+J
zgGAE4B+m%-vcT$ieFz(@&174PZo(baHj2yTKSK=uo(*rFeqa&Xo-{k?p~xa_a!kE@
z*|lK0W5>0IMJRE>eQopqrU~C<_87cT6>Bo3c8eJ6{|K?N5@(A(@I8oZFD6k?@x5h(
z7<`+l<?lVb5hytOsSn-ry1RSv`F<j?%6U@Q=!t`@d{p)oEZuVaO7d!?e#3DZcD3%O
z?2-!g?WD>kY*&`HorZ*cljY^;_=xSCX8)4zs~g6e8E_MNhr5}c=Oc~dWs+OI2qD>!
zMnt(RHS7$67MEdAtMW?OTT74{Lq7PelDviR`>*1^g)B&CA#Nr53?{L?0~-@>%3i}Z
zvpkIxHN2pb5|XeO@)$|4iZ_j5oEaGWKJ!|Y`yH`_q*+*4K+&Yc5v7e{u5FCo{$LAa
z;Fbwg3aqv{TJ1x`E148^37lb#Z)-+&Ed0tW;&Ec0s9nM1r5v1@is`IG5@J_VWUgF;
zbQ^nVL49Eg_4_tqNbP393S)K$rg>T(vwo9i@e2XmPbeFYN}n1l?NleU$v07<3B<O1
zUwypcL3rn1ieyJ7iugSzDC3Tl;g)`YWZZEZbSe5p>1awG0R7OC)=C98KE3l)OdnoE
zW=V;6q)aSrrr_W+dj{qLnAGqw9e|*=+kx6;9rLvrdCe`xGE(gFNzOdv`eG#-4d2+h
zQxfr7cyV%Gn#xO+5oPw0`p^@t6$!|63-`cjwLEGu@GO@_BIt;`l<z*+V;SBD9&Pdq
z=1IBoVHW06@od!8fe~$p9NBS7NPrC)kL`H>I8={@Ih~G`4MTQGjA+Q~LBpWc_4HmB
zVzDQ$=m>MIOzXqQJ?C>;Ps&LD@xcu3<cU6b?sR!`yuyy#{~#@vl!zJ?3YQc>H2gr+
zbTB;bKG<1RLuUcU0~GVk@`nmQ0Q^Z1hH3tNAi#-1SP%z;%Sa~zQL#%fmu44D{~xaB
zK{w6sRWw6R$dl8kG*5^<4S5~9xjfggQruS57kz0^SqYPbc=!0^JAa`s!VZw@Sv7J~
z&=#yArafI<ck+lLy{pzSt%SR?jnOW<b5f12CO<o<TC(?B?)*r9@rsgh?=I_BsD8CX
z|2kcnQnL@;>XIA&(!csEKAt9Q<7j0$19kY6l~)PQ>?Pkb_+?k-QC&tb98yRg)R;N<
z$q#H|eL$vJ$x5SbZ<39JtovqcaIxT$BRWcyoaR+`y5qKsWmNU8LgXbJIC`6C#9H4$
zl&G8r*}PNWS3doRnRsVoP;E&FkeCs|4dO>=KcjggtAeS#>!8}fR*#vZF)rSJLz@OJ
z2p?$qEiB!lruDnV{YmA%iYvcds@KRZ_S6l4W}i=NRsD9uM74uw%D%X(4cv~+y+0m0
zIp}<RZNpH*OHX}&wO!V5CvtxiN6Klg^ungSg1dE02J!q1fj2QWF3zh0@sI!?B|;2o
zGMZqM)=+w;Hp#KGUg;N5_lnbK#BNh+v6jv-0^QNp#Tfbn#Sl?4DQRr8&mvloy!3ey
ze8-_lez1r>vP&+O3PHStLz$38eRifjsw5g?#gIcQ4%J>@4_cYU)jswFyjNAnw^u)a
zcmVG!D6(#2EQa6SnGk$t1h44f(eU$~NcAnP+$W`C^{=U%V2pW2uY-~-<X#{hP08u7
z+?A1oM7l2&ZO_c2Tld4Y19cc-PSK`Q61wVZDFBTzjE&vgkmpZLfiPV^KTF}9-+<uT
zH7fOWdvW$=@v$f&N1=tRb!WW$U8q6_?!iOBH;Ogzz9PcH!ZdnSxcbx=;FFhucm#96
zh=7!y64zz-TG|k&UHS3w6JxhuZi~JsCvTPT>HalcaIoQym*heg>*?J^e*R_22+lpB
zo&9f2-~X1;rPo4DIxO#?_Vd5c%y2pPIxjSQCSBBcVpm7XZJ9(W>{xIYNy4T3`@T(+
zYj1O793Nl*wW2~&@1bk)yw_Ec)3A^Rm+hEpZeCtt(i90HzJ}O@a7nD?Y)J$E?H|&u
zy6#N|HerSDbkL%l)wkbsjGZS4e~%vs*lCOibLq=_IcIs?Rws^^6yBs9QQt$0rd14-
z>_*&_n|Y3DPwz^ICz@*Mo~u7o13^=D*tjxmMy2G<SGPy<_vi#6?+JoxD#Y`Q#N)OW
zT3e0q2xYE@?Zyj~TXNZz$6ooL!1|BmHzG?kE3)FE(X{4=!uleHUE&916Q5e_pxSxv
z){x!vEW9^1>-#wpma%1Uf0bBFQR0zmCLH&sKmK`XQyxXl0HSua*R@OB_qCRjF}czk
z7`w9#4_sqp$p@<}uixM`VvYS(v&*NhJ5!?xpVVX}`rp#Jd=Jpp;3sFa(?WeVUltJ~
z9!_s`d9<b=;BZHfpGhU^^T8YLwsQt6Wqigt#Vyls%&=r|=S`?_GuVOKf<%DiR$2vX
zJD2zDqfM+ElbWf$AT+(=Ne@|^ZLJuqHQ-*eLBMbK`k5?q^7yQN1bx^vZoq{4TikHj
zJx6GA`Cg7hJu1o*`>O4h(_cFNu?@?+H9+U<t7e*cv`67Wrg<qeLhWW0$@n;qU*gEk
z;mwha3~4JWl)16rbj?GfQoq@wz6K=?r4$AS2mRgHZ?x<pDw}IP=pW_7xt2+N@|63m
zj>V1X*|W}s^=>k|6R1Prt_yr|7OVQLYc=lm$%KYM;MdO@5T&|vJ*OcqOR&^Gwb0_z
zS(=);XdCHTi>V5s@4eQp>iI}`qPP2&y3USFKBqQ%rrgkf`kf3j<A=tXcF6<50f|;S
z<3W5z@guh{j6ZmSIrbf{@2>YHVvlKfG@8v3hJ8+2>+-|U{-M>EaN4ek<{J<0)@~K>
znGLk&O<R<o5bqbR>k*#+0wnbF_l)fvMDx-1A{%IV^}Ot#jQ&?=^8fTVS`0WL%I+23
z|0*9x+`hp?75P^`Ca9yn@H(HDn*CP8h7yp_u%gwHs#a&L1(&LsM&_dQUCGf>tw^;H
z3f{vTYC4=Gqr+`h9=p!mKm9Gb@EM9z@<^&6Engts$};`)JIJn3hPjRlwq1~A8PUzU
z2w{Oob<y}vFZA8J0it*PuWX*Pu~CjT@YlV#k#`_8;#F{HwisWpa*~Uu=8b2ktL)f7
zp?aS&!ObND=ack9`h3nwvG<pG{D<8^7;AP($qNc369xLwnQl7ekShQ*ML1-o4IWBo
zp$<#h^DhP9rwY2eC(%g5`W<7%4C7zP;1<J<kTTS2lK%{C%$jPKzkz!Y2N0#+&PD++
z&(G1m+HxY*oZhk4e6*t-)q6ZGK7KWaEnSAN{UfDiyV5`ayDhH-S!P~;mjm6CcxOey
zLrFT!5kd{!C5CPAZlEkci>150hKnTQiJEs?!P4+R%;=Z}cYDl5R@4XnOQzbntl~fh
z=6KEU0sGP<s^MF(;n%hD$y8gaP2OrcR5OlwEO=})H2{4fZB=Qpx^o!$%xyx)pTIg>
zZKY=W1Jx~Ad`sqA46Y@6qVZO#*&qONq$ja%tDc_C+Tr6<rIjBN1X1(GnQX4cDRQeF
zc$L1E+?p5U>+D0IT?S*+*1>~>$MgFg{?dC)v(Dhh`CuB~qDd2Q{k1g!6;gltCaVbT
zs^KHOU-T1>mu0GN&_!G4{u-~|jXoAzn<W_!OWv{dd$(7=F$NH*w1X78mO>3fd+MwM
z$?O~QzQgD|!Jn{3U1-OaXVA2%?zMiX=L|rGGc@SgW+O3j?|}XKIiux%g}>tKgD6hO
z-tk2BdrveK6?5n}tgvfd{W=X&GS)YbgwCdnp>8tFdjf*E-=8BmUp{XOZY;}WQrbMz
z{^7+mv(k&-hPt)gee@c!6_^FiB4%S{2CeD)WYw^kA3Q59sfkP4^78V|v1`(}sRqcp
zBhpHiW=1V4P{F`V)F@%}Tjq4L=3fQM&-^R}q6)tz?aR{{{<C$5Kf-Uf=nNWCeF_aK
z%GYrGI;TFSZo^oV9dQ2ofoXQQmm(>>G&$tq&`g`*+S&OZ^ZBAU^rnciY1CjM6)D<l
zx_#+9nT9a&Lja{vV4ox>2%Dm0uWP@weJd){wLm9mu4u2`uEf&yrGVNqAt|-8PdR{O
zQiZ`%jfQKC;CZf%Rdsb!Wo2Z3^rt<4{+xlEn<(3`soC#Xq9J~qAVFV9FOuA)@iY4-
z64z~YsAabmOVK2qqN-gb^@X)MijUQnB-edhJ?%?e@~zJsX|Cz>R68m(tq>E9GHN&d
zuzEqw0wxwIdzvE#ISw`^o^K-y35*&=z!x7n^*o)>(7Pszq`t_G7T)T|h{%BG;RHE0
zp|8W%9mCdrRoB#p0+wkBd~UsAc&;=3IgT2ngL4NQ(1Ic`U@_$I^ia8RR46j(HK>{$
zGJHlbm~A3?uwKqgcMYn{KNe%F5aTaMj1f5_#=FUT-l)C|uN2~4e`$gx`)-@Z_E(tY
z^*I%Nzv*ftbNZjfH)ycr_xWnh%}81MY)PF`A_Q;sb7y6)Kl$w}WZ85&jR<Ybi0GPm
zn=&$?JQsiVMFUMBmHGlWh`P?RywY1{uWNtm(&I|Uj?DJ}j<@dU2F!H|?qcaO1ntR~
zI}C|^U&X%HFE?+E<)^uPwrc!+Z)o5^)mJ9<@6~SFs4F66pX2|!$xGM0GN5m-&ifqF
zDm>eAK4mg<m*K*jaJ$=HBAza@Xi2sgr?kOLKU--MUi`ia|F+a-{`&I*7xB=;1^q`4
zjRt(+1sSt$9Jq7y6iBD<Jw0PYI5>VLu!w{$(zjjD1v&L`?|+jQqxVZWN^YWbG06PT
zYBS3nr~B`IAo}dXITJl(@m7wY-ANIBu66f|vNx+NP8KRN@xNJ#{~Oqni{aa$ju`Bx
z<U4cnL`7}kj;Ejn;i|}+=XZ{6gL@1q>mMR6`-3;m$Gf$~Vy<(Uwv_CWr*Fn=B0I;D
zSJO(0)L*F|qE&pp!7}0rnLj){44X(+19K-AZmJrhbE-UiFx6&UEM5|3dJcc8Q=Z4>
zcQnhffsw-JWhCOfGE4XqFsMJv)!jCp7~&UJLq8T}<N#o|sF$o3_l-lmrUNpUA%5Tb
zONy~dcE~0!kANXkcO)%~Xr`vAA-woV7k!MKojqPYNSY$Z{BGLpOW?R2Rk-<$_o~po
zx9IXhv^5WiHfRX^Fg5NquJu>z9?HWZHaXv4SV*8m99*sfcs}ngoWqcuI^$MNrgsXE
z*nbkq%S<)88YuJ7E}Xif1%rJXG1Lp8&`<4;vybH$9-v2Hl(1;yaigP8wpMI;j^FB3
z+0ZLcUyK*3q&dxW^OA}%+6nYLdri&D7$)FuKe&6vZ9DhJ8skV(9C3fPwyapUaX7;f
zcb|#uoM4vKu-%rWZ2pa1R6iBg(j?RxMIJE(JXMt%=OFOhjLpHi!MuCxl#d4aowrsy
z0u#Q;6EaT<WcGEBU9j;%@W=*7ETE5dcQ8V3kZk7r(Cdgvj^`(T<RfY2oL8Gi8#@4D
z@+8{k@~K~TS#9*w8+}F?HSbo(C6JFYVqB73fO7_T#9A#pqW^@B=zCBXy)dX+4(@0r
z59aXU&fi_rNgg=9_w6mk_-9`EKg}C{qRFBe<)Mp&AMoNh&<BZb%VW~tpS=nTmtV~F
zS_xHaDuf?+&taHiw7eX`z{+TH?|lW3c#F{vq%Nx|yze+`t2<^jvbG#QXrS)+aqZ8U
zm?D!%Bum^RLqkIWo4;nsI7Um;<#f5z{e3KEHc09A*_PwS3i99_`tag4gOoUh{4Fla
zE$)h$x>AJ8L;nXKZF2-b^RIxzT2y=jBt-n;uXu6Ux`*J|#+2r^9I8N$-yRyetT5&F
zko7RCw#27V-^~ShI34+_VQiv59sbgvaF!O-SNzsftPQ~bOmhPPpZqj?{d7f<+xVom
zbsA%8-Zc9TG=-^=l_7slKzUND_n*pn%Qyh+j<&+GUZoqbRw0DHHgC@t^06uSc@Kk^
z4V~W_9T~TTwblDMA-e!w`zK)TQXN0!>M_Tm6oN^1*hOUIa^s8Qe$#Q(w@@@U)o-Tq
zbh`1BsnQyH&IzS>8}|>^NBl(ac%XOBjoXj3n%&+!FVAxo4-XSrSs3ao1H5ONPZhq@
z!uDLa9#8VeVd^=cmiuw(fk431Ln!<t{20kVvEB2CJEj?K!TX!zagZwc`PQh~+Gsf&
zSXTWBi~>oBr#>=PU-D7E@v~(v9B`zIii3BpH+&0C__7IJ_-5bn(ar4?LsnLH?3I>K
zvK!$C!EY3vI~59)Ec!4%S|~;^lkwl#BRYA|Cl#tzl*TGp_ju9!%}%medggqyXUdz5
zZ6Ug(sr?3nG>7gdUHCz%HzKzu_+T*WN0VL=n+LCX5YT#{l?9W#(Pq<S9!B}(%3a4~
zRE4H7-|1CH_t%8gb_?@_!5<c?J-~82HkizTX5tyCu?f+~Y9rf4p9BCFDUa<=*fH|m
zdF%aX%u@;7QL6U`aA{s=)1`HOsJg(t=_=Oal>+)p#AhD6(#}8!gYYxnWzyD%?fvX9
z0Mp2*1^>*$jSF}3v?FX$wOE~r?n&_+{$BM`ghuPrRF;~G25x|ijf8gaIRR*!&rsyC
zBGI#S%{A*~G=q}?mR4Rvx26%e5>$o4!opHcmq#N8XU+jmGqdUf&4<T1*voy=UFiE=
zjQC0BJ!=VyA%weW<!*m(!Tl`oz)X5=y6zID7?RD9Fm_V=>^LotzGXCCa<%!(CKyo;
zhr?KPj|cjPM;lf0T_R)abjG0n8E^i(@aX@#UH3D=Z~rp;<5iaQDSjXq`O9Y?lE)m(
zcu9wBE2M2rhWPt+g7&Hz$Xp{j$O}0h=k*G|+vM8Ljk$W@{E>@&Yv+f<7F~;UG;y0o
zK9H$(c1Nn}z9@F5>niT*a#KGWRyz;s;PHk*G++_RFhuaD3d~v^tP`V_OH;!F>lfA3
zZn9a-8{;Z7MH|ov6~!n|(Pq{qw9}(5v@I@m)Gw!3G=Vj2AC=cuSLt8mhMPENmUQ`>
zO69#ATs8XfJB=#N3jQ$Iqb99}m!O@PNqf~2VdnUFL<FT~y78&Dl>NSNb_<zpUFMId
z$8mys*C^kONbq~a$2)e7aU-d&<Ei}l3-qEjo+R|C4ZF~%NE^YzoR2bgfFs2dYaJMy
zCzr^qpp#^;N$)JFLVpFPgZuvYlZ|#Vv*$*sdD!z`Rexriydu1?r|;}#7ftE1)K<=Z
z>EZn6IFPc3+6ZiLmha8gfAg*E)rB56%;5BK?WyeoRawRp;E{hAh)*SrfY|Q1c6??m
zSl?Ss!SLs@+C2VCri)E!aF#k^&z%=A$rNt$D7^Qii1l(@_UF?KWT^YkK`JG<3aRI7
zc|_=L>D8}Ny=_&Kg-QDe>WZd4tI<^Ag0c+4_Gi;5t(=$2h#P1D%+|iulTBfZHPnqf
zOdWrEcAerv7rp!7SM2SO^3J$|kKDxN-%w8fJt-))JS?OHIN%Hbwqnox`)u}7dcVXn
zEAcb+|LE@jw_smCC4AslRBWV7crNuFP+sv~`*g?o>z3!rqlv`OMV@)b;)cy%Pq)^e
zx)zARkoO&ISe!M#YQt8cgj7@mz}<C1Tdc7{UEJK<EK>M7vla3z%3fv}fXT#?N2{xn
zgv7+fpSf)df)<>^x8`@@C-#FF$1j3=3KI3*WW5eAd(dqVa8n7p!vj&H!~}6%urh-Z
zNIQ-8X{Crkm;}puyx`-{b@M&}0I%QnPL|jfN2_UOU>iOwR%<wmOkg=yBP}-OU%S99
zJ5u>0@mOdz9&N5UV0hNHaj2Rij_inC-OF{&9WXb?{jcd~UH9fTEm2ShzuVLa+fZNB
z><Vx`HN1}6S+>>gIz8X~+0&k&L84S*Uj{;eIhuU>zB|Aq)HoeiQ7i;&<4aXjP8#b)
zGyGfhBA@U)tf|5dsGt82lDE9kHkgY&h&frD<OWXBz5sk)5G;-kKz(qo8~fJ?(NCH=
z%Q~8KRMbgbP3l4TLU*n5sM5-l)7Koe^~{06lA5>Jt?}$~DVRzfAd4!zlUmJsX|D6`
z=mGBPNt0f$IY}f_ehEB5-xvg0+-xT3^2xk6{HfvVbhdrTAiugYDJT65iri$>`BopF
z$@=e%cqHZ&i4&k`jfh2m$NKn~oB?+(z8<6`HJaUjKZ6PXliuhThId=&2xe*W0co;x
zx0U3+J2c#;9Rrlg;Q!;?@NaNmsRoxmLGob1TPv%yDeGH9ra`MN^+kq`79n|SdkLzr
zs&oA+dqOY60-;fFE+Te<9ZsXzqhLHYBkJDY4xj1MQ<HMk+T&tltF-In5u>A{RnTC_
z(sx(V<7$&9e~M;qukXi`^Qp2M-tmWb5*GqRR|3C1vm~@#DkhvY$rO1qY?%|3sZ@s}
z{sfDB`GhwBwMtLEOCg@)F^bI{#a{Zk(7dL;s5BYSrEwo0ZSnH_I!~!uV;~svQVAzI
z{=NHe=gE3j<mb#H>OUk8K){ojGD-B&QI(B;#|E$}P3+E2|B}gW)7XrI>>4_vst9$(
z6qwP1TH2s~W+rQRco{GaQcRk+x;*Q_R$EF;q<A&8KAqKs!_>PASr!Oe$7dS6lQ%E$
zs9BGiFV|DB^V-gQ?!lYQ92CeyCf7;YP8r?^pkef_<a0IyOQXCxbH99cCm%Ix8=*^H
z;5T?SQq}0P9OApzT2C+cuc#?Ye+B`k#xY6Kke~yy|7`Rx8+GT1Z!kAv+A9E};QcC$
z#&&DGP(c9Z39?L-YQK3|%456BTJK1eLCZ~2!=eWpL&){a$>vWzo6s}fPwLbc20piI
z9Yh!2=f7Q<U*NQT%kjeO5JCa>4AoY7C$>{=v^wsbtthb9Q!DMihWx99iMEw=1)Q^h
zKx#Vvx<G<MAS&}@*#Fe<&L#T`&>tTDMKib29r+gCg=eDCj%vcLEwX4K^7e94<M;ak
z`K=BGisZVqjL=y~HVJ&)Q`dYNy5jM8nuo|V`P+}<@v8DTD6asD^(z+=#X6RmI=)Kd
z+;PaH7H;aS7XHktFgs;Z+4VP{Of8xXhon8d5)l{fdjNG}!y#W&DDZiJ=RGqu>liUH
zF1dd+h;!LjQ|$U)+3U*=D-lU)AN%*$Pkv%CpcLoy`^<I_)(w^y0#!?8V$^VO)?lT0
z0c=>I5q5nfmmV2}ify#@AR$d`-jaqKSAl3zX^qh3YTVOT&FIZav8S=$cVUno&xzl@
zUJfL^SIEbGadgDe_~Kh#?zSO|N%WQBbdebd`mKgeGBdFxOSJ0#Z#)Z#u+Ri%02wm4
ztc$w!a6z3tAQljz&rXEQGx)<zIhLzv)Y&PH_IsK445*!a5iM=D#|awxg|E20*H-jb
zgopsue;`*x>9z=`Q4a}0E<}@Xro64IrSL|Q_&BS8Quzl=j<>N}b?(ROg&^4zV116~
z-TCqJt{1bVl>OZG&>aym?hSa1xz4<q@$=*#{%(#byABlzSzE&Nij5RFa;Hlm>;`z0
z{sR@P%OO`n&8sehrac75I4}BYo*bi2ENoW4Qt0UNiOk}>8FKtKpd7$4c^ZZf$wqmS
zPHgj<uhfa{pYi9>!#=aG=XT%WnRNR#uZcRqjQwGyIr4z^djAhs8ZD3~!EFcZTy8?`
zz4mSX*20S5#BmXZ+CF8P+Lv@a)mDAtV&7&K74YtBSw>&~I-7e@#OP2%c2@@c_T(Q}
zjyy8+XlQ5*p%d+Kaj{%a=5X3~n;`j+)WNW&9;!({w8d(*&a2I>f;{JmFFxx<zS%aA
zEH@P5Y+7N8{yvkC{-6>LmmN){Q!`@_K+Pu=bSn=ZG#*37r4_?ww^%e1dB#=%OL;FQ
z$*VF9qUYivo4pwDC*bJH5xzN)kXPz>M0>XM+jRl!DaW(sL~vOp$z!tbUV<P|6~l{h
z8!=VPtLgp<P&VLt))SBLe)6l1nTtdtL|dYLJcn%$Kz56=#PX2W)OGTX5|s4oMj5jt
zXS2*0HVB3I8zo=d(N-WNS0ASxU`=oDAV-M?LP$@7Z>vXyu5Va+J+hbvFsrh?+C0Jh
z50mZvkrQxx{a8{*_hWvK1J4Hg9OykLw9jdhAthl#o1Ja-EwN%0T@h>o`oG>Trwul^
zL~SI1!Np@YPd=uvo8N7(sMYB570q(8jD?i-jcBhd67OUNFLnp#l~@cPM#sFz_SYEh
z6%T_7qd<w1K)>Sx<!te>B{#q%v3=~9V@IiQJ=>Wc&VlUUU%9jR5^VYnOS4Q<+K770
zNh{G|PSWiWw~eN9oH>Y+?tGa>t_2u)$Qf5k4EekJ@K2%<VLOhaiPukh7hD7!upiZC
zv6HhjdS5u`w%(rUoPuqQagp@hh*VRuXu$Tg4)!nwi!zDVCLl8?Vu?1I7FKipTFRt6
z$>oZudCR*mk&bR^Z0Z@+7MrxH%$0kc5XOw8h(wMX=YO!QOruUdfw~G_Ec%x^O$!gt
zuUtQ*2%?yvrPH^<Gapvwz_O;ne-ihv74T^On<L$V>7R3!<FDOKDG3?@gLh;gLAQ1a
zi@E)4xzBj}?BHkY8oJ28_r`x2<IpkS-1q5Uyv_XwMq2*Q8egsgJD_JZeocM|Nx1Vm
zU(@w)UREJUB#}d_s30IFllF8q8S^xFk)L2yyUDLCgkP6-Wo#4z98rt?bfI@KIzhh-
zJ!NGDb7|;acdx&Q8nCH!NE_S<jgHO-(f24kBkVDNH~u-xJXh*D7Ql_`Nu$Cac23UI
zUzu4W_;e3cZt$M?V1kkUkgl+XF3I{B8>nAs>^s1XCS|PXyG)yKK1A;aCG8_K@o^Uo
z#c|mVmF!HY$=Q<WASSjav9xj_eF28EB&Cm_Uby%nA$?i=PtE|Pmj@Q|Jp1VmTVr@y
zHh1}atyXU#XE0rBGI7&9j>CJ{zq@kmjo{z*x<Geu<5p5@0%>}mE!V9?WrOmEEmc@I
z6k2}0ZvLx8OXe09mIu6OykfhcH*kYVZxz34S06D&t2q@K_e6EkyqR=?R;%1zodWCQ
zV^WT+N*>I?Mmh~9PFIy*5J?#KAl?6(2<j{<m^Hb=uM=D>^_g{f`}58VrNDCHujv1{
zd{~iiRU^P#pKjok9&b$)<13ap^vlW0W`Reo3fLe(beTEp+c5t??a1OQC?^2Y=?wI}
z25f47zbql$&EZLx*nCh&!Qrn6<K<MtFLv0r>I%J>^}m&-LL4Z*KR&DI^%q8%VxNv}
z+F-Ni-^_{o0~USp*NGLfEL?W;y5~}L$Tp2Y{IK}*Bhy8-<%XBoKJu_DF6PFZBg&`F
zJF&0n!Ca1M3b_Dx0b0+`ksl-M4)g633Z1L(_<^{vOP~0KjsQ1KS<eC5Mq?swU>21a
zD(%&Jf7ghHXRipP`;LP}N?)gr+2EIsHx4%s%_Q+XvSWW0lk99%41DMF^Gu&i>Xn<+
z_x#EO0tIdp_!@%!ou>n<=35{&+hW#$C;8+}tZ+4uNc(m7RzWrq1w8Y-x@g{#f-F4?
zw9a+uF3JqEb^8%5JlUJoYOpE^@+ldJ%wLlZ+Xy~(+qW8}?D?l(Azup=dr+rqt^_nw
zlFN~+7`qXP8N4s(4zPSE=y=06Wsr2<AUX$vkeeW;=sP+2W8+$gF%xFz{>OjU47Tqe
z07m>xu=ryZqIgkUi9t^`H%J;s#DwTk&LMx_fS@n7Z7)@*%6S_*EIc|FZ1$)NmV@V{
z5S91^OWCoHtowO+@=)tWH#4cJrpAsTu-<EJjh7l$hB5w=9w9)54^O-kS1}#@Wx}Li
zIafQVE=?sR&13g6(SYa%dpAXy`oBq4zd>AWmQX<W+W@JIYHK)s;z7)qN6TkyWU4z@
zC-bJeC&J49Fi5`10V5T4xIfwhf({yy0!-!IKdt-RFw@eiXG|eX!_fP4`lw1We|w(s
z1=!}998<DxrsxEw$;yW1H}hR<Et5&wuigAG$I%qymYz1n8Qh6*&>^3QALc(+E%I~|
z+Vbj@|NIDznzug)Luv4_`w@I!ybca?amrXl4<(s6^4TY>O3n~Bu(jkvcZ@t8@Y_d&
zA|f!i08+=|i#qGSQ}t6J8<ek%;!2Y*(P)9G9m*(xdwDP=Y5%sz9nOyw)$=2%j6&Ot
z93+BMWK0UE#!@<wU!Fz=7b9%6^-%ew(kY|oFsUcyf^R{m>oClXb0TVuAXdz4eQ~ff
z91sM)MDWGvSNd7AD}0V5Y#vVy?A>*$ve%*s$w^9MSUIa4!@SQ7hTcD9`4KG%@R-mV
zS+8o%XO#fG79$7j!mjeV%4H@+&8y(9@NGOq<rEpJnn&}fu@0PG8g)lCb_)uScPrW>
z1EL+>^$3;Rn3sUWpNa~lgV0{f7qz?0ie5axyPG@TMryLXZp9ESTDu^=BFBRqPuJ1`
zirf|UtMtVb@lKo#x1oSJwP+QhQM_FunIz&uqbp0rShIia@6x6lh=Z}C1Q67YWVaf<
z0O57zz0}CoAtQmv)5jLN^UzG<7E7`x_Rx>w0<(Qw>DTnvAw`W#o^%TYv)sd#9u%?l
zE@N>dDEV?SPp{}4vabM(Cn!Am1B8ftz!meqYL>LupYUf5r6oU{>l>sLoNWR|tA}_5
z1<T)UK)!%(bxC(?blR|$Rd|)fdABqhu@GE(6cpvo!}b3I^#VgbJT*f6*y_L4ax<pO
zUKi8hj}z<m&rJ94xy6dw>lrL2{?D0J86|26f)RPlO2&S1M(i2-M(LsEVH08#arcc9
zzulyCxDLkFixfAY49%~Lmf?gCT25JlZc$f=$;h%bFLl0mcQL3lt=X3>`-*P#<gn8X
zuR1j5eCD*x(0AKI)8m=>u(me}t-_MSN-=SEUxY1bjMo4l-x+LteAjmN9|j~{x!exk
ze5axR{X#v<d5jHruC@>s|86V;Q(fv5&>WI_dA86Fcb;G@jzc-N%c(xQ{=<e6^{?y0
zY1=x#z~pu`xX&~~W(vT9>4%VDWySHjL{gtjSl{cb_XkWgVKUGgzUz*yHbbXn-M1!g
zdaVYH_PRexzv|QmG4;%c9A5#nO&vz$G_%A+wub$Lou<ffmmj@<gdtObOlzn%BaA7=
z@ds6g&mtO9Lu>DRy$XvO@H;-iKW{C^Fr@WB(b+$YrrBv$PcGSFV2N!(x+P<DY&=SC
z81><JHM+U5)52Kb6JCP_V|AXm1)1@yj;NX>7pbxP%#m-$Nlo^+t?%9cysqQ@lH^vb
z)RH#8{or<7fm6q8)}8)i0hQM)rN&Vo_C7t0cJvMfvZav$U`OY<1%{P-4S#?`$eJ&s
z^0`rFvzWCACuZEih+9M0cY?jfvcMnaE1OP2r0_XWbh$0yVfi+I)j+&R`N1<=&xO;w
zil=pi8Fn_}+ME{&LwxLO2x`W{=q?fGCu4}G7BwL@G(p!h4`X0dzD4kJ{1F)JCH4#U
znU#w%IhJ}>@mA7d+m=gH4G%$Aq5z@8E_{Xh5}DHQRW!0N!lN`dG7Q1s!Bjqu<)UOr
znVWc^omK&YbGtqHj)#5Z<r77m(UCy0k*B<Oz*ARmI*K%K3B~{0Ny$fD6v7x-Tx!Nx
zusWa&I<L49-i{|EsklEIdEW^ye6e&lNR1gLg?Hk_*5bZI7OVBTykrq_{q*74E^7Gn
zgD{a-p(ZPQnS5F<b6rmU{{HYsV?u8k|1W6Qxjo$f-4J(!6LXF&qDrIiHy!)p*_&<$
z);#|Tii3l{f`jkNI9EhXb$clp{X|$8?WOE(aU6_wix%gUKA#?GYTx~yEm@a8nQ7vx
zV)En}6|<L{3!AGbd6V?%bC+zBC%tfbLc11UoU3^L@f})N>(Z4z=hogRzYj2`)!|ss
zEEng`IB-9E-(8x`faJD%B?vuJrh$MnvznG&dMr`U)()6gEC5y0mE+?_{occaf1*Sy
zE(&CwjTVTZDnI`k*9uEse#vzx1&qBq^?mF8bt|=+|G9t*z(eT@{8z}|WN~v@PsM20
zSoalOyz=flj#vrTPeiG9-VrE~O<>UW#V=Z`qYV40UZN=`4_-DcZ$6rZ1ia@e-W2@T
zJXZwA2%j!MyzhHyR;OhShj+zOcUf6P0(F6Re-=5-=IR`}Bvl`Ho;~Ry<dYsH`@kZ`
zc)QFds~0S^=5fq;lK?F{vsa{#yiIWx@uj%hq4K^E+gEXPWEV^3kF^T#D+r*v>IX@t
zB7hchS^a_;qzESW>8SYzk1BHXX;XQguz=|>3mEBFG23v^Kb`hXnPE}Fd1C&^;|<PM
zM$2X`13i3UEo5F#(iuVJn;1;N`6~miDzAEJl88^syoPS4k}&cw+V=9SKA;FoI;{_m
z4vC4NI$O`l?ONgPb_-bn(DwwuO*jOpHWCJ)KiF8HNb+KI4}^KGob7e5d20c-eI){5
znG+|iDlDnwb@CN7RDOZ@$%+mcno0et(}bWCH`6v*PzTiU4PmdiE-!mm&fex0%ym~u
zOXOV@%YE9UlM?NQfYiRa3Jf<6++aGv_;(Na5ZQKji(;<w63X~NBcn)-!IIWK8#&5T
zyXu^)ac6Ar+<TkdaP~U~UWfe<3uB5%UByJ9UUroPWEa#P`l8~r3GmF5MJ|!yD8A(q
z>-iq0s#!R|-IM}_LT8kbwtCP%@XWhq7sE<CNNi2$HI~KEGg`Z3WAWYB%E4vi4>G!>
zq}<j?O=WHe>4G-g^6A2}gtJ?JvJ19p(+boE4i+?GT>C~^V>HCb(U-EY_xx1<i>s-G
ziW)z@@k4w{?fGjQ`crVYNEeC(R3iK>Twa2eh_D?DM7A=ErVw;P9C=Zq6rOFg&)4f#
zC;gtS9HDzuj<uO>Y<7BaHH_*o6LHlV=)e<dUSz~wF&0ep&*hPfjKyOixX;987JKcG
z2|vzbGLTL(OWc5Opu~$R2q2g)%g%;_kI$sHtg7uT`wa^76vggMkSD%Xx*j41d%-N_
zS6(snT{708I{FfXiM=4X5?xG5yai|YyK!Y{zCO`MlBr2RFeAW*2YW^)m_K!iqr^O6
zFABivKGpw&SPvZA9vL$<scgo`4^AMI{$CdJLH*Cg_T5QqJazp7+?%4LPs{Ji+Fi*s
z-S5<m=jDdPxD02j7qo`XYma0RQJ62zG;xBCqcor|Lb7rq;6)!T#C0ZL{vu<R*P377
zrBf8x<y<DjlW@80z+j=#r|2g%n36mIICi|-DUC)NaM82D^wde1_~j84)wq(iiwoih
z2N&_ssDSnr)K_5XtUkb`p#8=*ck^fd;|JxdwC;$UgntW;I8>k&(N;v<&3k}hq(|aR
zh`_g`B<*DKD$+yZ`?xB9lkLzCNxZ)r?L^_8EqXCWt~R%)pva30AM2ZaCK=*jn)htF
z#1MZJp>a4a{t{>1w+*992x8h*tn^xcM8i}>HcTgJBvYy)+Pi0JoNTDx=qR3thunMA
z$kz^G-nG<xAm*g~;qqYRuFPG99Q5>aRhjJz|IP?H-Kxw`Uy?6i;qzo-!Ub1!$IA>=
zy!JypBV?lptKLO9qW7Q{<8cnxHaqzaCNBB7y`ZXEQPRuVYFQhkuhszpXZ}R}CoL~>
zkEFjmR4z5V+gzsheU|2~<iBv!WJ3MoAvhiw-qw15Yj<^XJmO5N#9;#>?n~+<CYyhB
z-q;Vl@fc2Tjvrzq>FViGj@(*8iO(u2ZHtxA`mOF7bmasV(Ps=)MGZc;r-=%Tk_RD>
zI7vUz7Tmg>$^rAMlTCh~GX3U10Hla4D0zt1lr|m7((QtE`42cQojaDn&-AaSm{IjK
zrox>O19>OEs_HE;o$a6d85<nz<~4l=^>EjA|Dn~fM?v?eJYCwmF%jJ0MU2;~!U5E@
z+fN}M2#>+qOjLtdQuz=`ZAK?h@8<*2{nUg%9i}f3$eM58YSH;g+`IwBB)}^=%M=7w
zxH&*%eHX|wUt=f8lqKIykQvN(=(BhK`B=MF_$ZzDrGA3QQ~!-X&G}i4+v@aB%-4|`
zM)Fxc)wX@c7KQF+3=+>j-5v>e9q&fhdv=Y43pKhvm++)(qz0cVEiN2RHrwVP_xqF{
zo-0VFEWKOp0V$$Ey3d`v#z}^lKWA$@;S-#;t^D~3iHc=oe`G9pM?~qB%MBp#OyDmM
zCIuQ;Mp#5p3Vr^}X|Y^e-}ODg1)%*ZMpS;7D|MO_1pA@~#?CGm-yLx;Mtts8N_ssD
zlHSBJ%~y1xQ$ENqZZM4OE}_AXS{Eyh{ZmbWpScSahoY@jNhad|up6Ww5mCHp*U=mx
zlHUwi(N6etCc6TD7a0JF2L-pLtmrH_7s<)4_F~9AcH6&T`ay@@ptL7ZJWAYJ7gMb)
zURLLu%jmq9trXQYLhYp}MlB%1-+^Gd3Rn$LISdXtR_#_u;p?7v);-0FK?SomJpm$+
zr~d%K{-;T2pkuVMCu2PNu~q?Sog`&<Td$$W!NvpaCJD>+KF=-Amcv<I1C1}u)Ml#O
z*Yek(4i*ws2r1XqMy60%w1xuG!<FOv{^^HpM{v3Fvmj^mM3NCJ^IeGEfae3R1u?Ld
zKHn@^<NPn&Qtl&PuNyu3XU2?bAx~w?UiV4C^DNlPw%ZbD;}4xPtN8xaNohK-we(3t
z%KoWe3P<iv{YT*Iosq_w1NPCoNT;@RVVxa+<F-cc6VSN@eOJ>G5(q~R8$oS^#Z<Xr
z$*+V}SrO+g)rYN;u~Z@$`vl}V>X-YC+o0C9{8#i_9<TDtX%4>2IcX5+R=(q-_<dAR
zZn0bGYa@m;IIzOjA-u7=liBxk!NH{!T}0Zse$kpvmr@Y4tv#03I#b30jJl*8VsH_6
zKuXgH(<0kqeP^S%Y!1A<CK|1f&~GFK?;dSsB6VgkK$aFa+4}+!KUh#YP|iSiwx1t&
z?(yW^?e$L}WazDK?Q)n6gBS4q%nN632w~ONONB}vEK7=1Htf10xbKHxep{A3?IT_o
z0~&G|S{BwujYy>BWRbG&(DP3oHq>t6>++jjD}ku`FHpo82od{99t!xPe4p=+K>dyF
zEvZI6`!*VVM+X-#-jWz@mlR3JqH~d2)*uC6m6NMN?-D0fy;xoc!W!UTGtDynlt`(l
z%205yE@$gZA)~8OnKdFgc%ctX*6`A8>Q&$6Hi5H<(G=xJ|6|r?4ZC0;I_Lpgp&gLR
z>hA~Wx`fSajkAl-Ly-cASp@HH92}yf?}C^^ahx4+K^~Y>e#66uS-73r{tnz^0{g4j
zQve+ZEoT=8;!KCSA8pa~>GnoWdv%o9K`igbZi}3Mn2EohQK<fHQ6*_jTVu?!Z)p$0
zN>HOVNU#5Dt2IVlKo)<<K<86qPTmB72=qWJW7y(lPbsV8I!Ni%ycxTGIH_2iyE>*4
zJLrGTYJ5_o=IzD?jT4ky0T4CcxwnjO*H>46@NJ~7l&GT~5sV808t9~8fJN?!H9PXz
z_R!`%O!9n>4s}sNI_mVLioWcE3kBqT1SK0yPQ(%U$L}LA8{J;KfabxM$!tO|r|U|z
zo1@mfu1-ai3H!fL*Wk3@^W7|iUBWj@3_?oHo6g0$SMy-EuFTZhDL%CAc?bI!q$Scs
zB`AW4=TH9%)?m6&3TSuQ3EP{kWqH_SO6!{7H61qmFqk3ZPrk0@x0rA9j-RZ3M8zIt
zP%kOaXlZwHQjVlBB)|HkW9xvemB_5exzQ6!j~tED9u9XxUsSb#79&3|koBnSL+mmc
zwYo)sT2cJVzE`2Xw2CR0l)H2F1JnAHp+CeCU9npqKKqPExb)SM_HRCjJwN7nYd@#E
zc;29NaJf}nX5JV3#k}Ve*2#5|bCscSP!Ky4lYH^4(R8M96yHmhOLS_2ka@SH(}oM2
zJzC#v$g%HSU4#AQ!x=8+_vq7Oj)8DP2r>c-?P!z#_MhUjqtyfo0hi6_!)i-)7Kfqk
z)z4t+)@VEsd#JIv%ErHvFiv{M;jk=8%3+GR{}UTuK2g^()aiYy%wN}(FZBViKgK}R
zJB?ionTpK_5%lT}RX5R;TEsL{fuKr^$qwt`N`NCeI`p3|0DJ}e{{QXqgyoAx#&gW`
z^g9Cf^Z0}F0B;H8o|gD?JMQ(gadM6S{R)#jxG~ls;kyM->s-EZGj$#GqDHWzcpTaM
zI2)tf-(?&CnhP~M_$MquRWSVU0_{fx-NZ%Q`WpE71s<nA_T4m}vIq#IXjhqM_TcQi
zUmNvV%AMqGq=@>lOKZ!U{6dkp+RhWr?Ww;`M#cG%t4JP`jw9NWrT8=Z5g+#>YyJAy
zoAB5IFVgs3%r}@zB7y@@^}8RJ@1#SN;BiBOQ0Ma%sXTz=t>@`$77LW_qp;3;h9b@1
zlf|EJ=A1@w)se8wG!0LHkLyYssy>G%yC_ZJtU9$}4$J$7l(U0gvDN=)G<&xIZ-b>w
z(%uOI^a$aGl_&vNxsqN?n;0?=6jbyD)QLUJPB`pR#I4B-eDlk$k2Up+F}$vCjkFtf
zc=8?6hDB1wiq#!E*4m!|r_Mg!gbK+wOZs7uf{POpMQVML!Cv~Lz|SgVsW-U%RdhMq
z`?>CsL8B_P#e<YDuZ+h!1Kssh0NMq{YED$JfYMc&4w33j=O*ftRtj2;R#8`K!>Hb#
zYY0@j99kk@7s{@M#m6q|Yjan=#^9L%8Q8C8hu0H+kL4k$MtQAYmfS=ue#=46<rp2n
ze;MNg`m*L;U64G~L<JD|SrJS!K+P|(-Wp#6JYH)rp<nz%+{5|#cVvlP4RvQGL1MPX
z>@dvMp=suI*tSm8Wt2*hO92jP__@*pV?I>NaXqW;PU~lkXJTrahn2iy08->ur!TDA
zXigngy7?@uAJ2z^NSCE_Xe$Zs0bYBiqnV<4&t<F00Fhr^uZp4&A$us1d@utq>Yd5x
zV6E*pJCl#7d(v(lo*YnliSLcTXRGo7wB=f&LDkjb!BQs{`3b-gf41J8vVd}LA4F?M
zS56xHZxPqAxdRqpMf$N!JK&7uj@x9z?#7EGdjIRw@2O3@rZPIZH;-q(crj4uUzfL~
z{jRs-`Fdf@MSCPvY_a08X3Opm+CLSs{$hy&14MIx5ZWkqbVfSf4ys+;=w=kBufe2{
z_k_cg*WyM{n%qIMx2_#vnc1XP&7fz%0)&^IeqZ5p1asa)Kh98oo4_ydWX*Zi0t$FP
zD=dKEnFqKn<Zit3U*NSnya4-x6y(T1=N|mlHqlUU@Q*mGgX@e8X8{yp(ER^#_1*DQ
zxNrXrWtAB!*<@2m$T30@p;E{=A|-o|;}{=%WkqBiBP)9!;~cVAMr0n2y*UTRp1=Ei
zpXd8~p6C0YmzO^{?)$#3>%Feph@Uy!G>u4WOq-ww{=T|H&G%doQeay>OH97giE(&(
z#-gIBxn!%e<(0%O!bUuovhsrdLf(awDr~>IH>3vy-e#&vS5oVDt3sps#2lH2ign`i
zvUI4Ds)THAaJs#N<dtdq%5QNIo3MX=U(>kNK;GQim+RMTd$srr8?0oq?@OMr%G9TS
z`u8vbVC)<CUWQ`pP)Ge&PUR@s_xi5t<s1ixz1MralQ)={)Pjb{pc#WAIk~5xfsvhg
z`e=Y>vg8dhrI?&8A=6uE^#{-HHysjUwlJV<N4id;P3(HaN0zBeZ*DUFH~93gqnGxO
ztAw8`<~f{{Pgp#Gw1EC0?Sx0&eH(LZgYRc)tfIA;F-Cl9U^>wV96XFJ>=c}@3?Ngg
z&L{@9MVc$JI+s!}AZ9>xlPgffh-+Tc{6jCfHk7X%64I!)d~}1J?h2jQRbm(#*#f{i
zgakNAdqaQ<l75fg)a}~doLPNp;G3IZId#eR>d4c}e`>+6d|N_D-#a((k#E6;k7gD5
z;L)u;QR(UlBeRM3S(^so6x@n$?qi66T)b*Zh=j-<%Rzd$WYtTRins0RwVx*|Ek_1G
zw%G5fuMQO%;;{^V^>x!XeLGODc&NhTWXc0<N<3J21st_1!{1-}u${Q^K0UtoN-CM*
z#zoS6V;{&zkh>kW12b*EC0E3IhX4+q)<}_|x>Jaqz3}@1iIRzW&pIf>HUA=@#$~iT
zwt8D{*J34|!e%^i*DXlv3X+_CW`IGEul41j<=|Ahj8si#7AknUwI4<IHVb5-{+)?x
zBfGS4$p;uXzyI?o27UdWZVIu{zME@Upz2E=0lf?pS1BOx3w6_|yiRYBqmg2v9I&fs
zdezjXc+#%<x}G^?ndOqj0(*_3=S1-&cAKWHoC*=JRqtot0hm%!T#}KOG*zY(DregB
zN{cH>41i(xHpj;CQaiw9GR*B78|GTK&>g?Fp9^B4X|Ph$&nyFWBZAG|t@~LAlG(J+
zoGt}0LBTY0^_8}E96IE&)3Q7sy^jzSF<@`Na}j0I(6Qmz6gE!DUN|ajCI#TrdPfjV
zH8ruPjJa@d^#=XP=?y+IGMHoEnt#90aki}aT1#u?`-g}>Hs9xck|@?rt`*$#y}ozs
zk8)MIpv%E?xUv6jr}ZSDb_aYa0e`=|)+zuWRZsfYK#EIQ6h1`7+jm30HtMvllY<|%
zO_6dp1-;(uoEYnG`K8Q8&V;g!Gsu16^V<3&=cW7hU`x$+&1_cv@%$5LtWVj?yIs#%
zvSqd84E_rc<$U^Uhh<sqMQT9(r{=(Gl`fNaapex2!g(Eo=^F+0Mc+T?f#mmGw*>vx
z%g&*s4=Njg!OjBA0jogc-G8h-e?69h$e3~c>i#aM&G`l*S*RhkaKkfYR<E@fbgW>W
zunCnb5n$zGZ26x-7|cra0PUr~Yq=FS9e+EF@Y@$5P-)+F*`aZ5dT(q%2&bH?`|T=D
zQ19{3{IFfr#&{5V>UV)&q%qI+^gG#^rZ2?f1@z^MFLnzO3-`$t8uaICWINnot|N|T
zz<1^R`tG;2{R>)g8{10OtpcB(JY97&keh3d)cNd}GIFrx)u=YGblBTBZ@&w00Zrte
z`AWmPG<<iz_*+vxa^EL_=$XGTV$R?Y@MA?inuXhN2jXwJz)Kotu2qk(%$Pk;P+??U
z*LhL0Y0bQyh5$*u5<*@tg6&x_e|{*hxo@5Yx=PtfFZLuYRa~wnTE%9LU-aKMeO;$e
zYqwbF7cyPnDOx@48?`rmhr$dZ_2k1pw$HKdG@le=^vX=1zo#X};H$_o`~CWYxbAhJ
z<bLKBI?xEP{y)wWn`b@UV?o>>84jbI7CmJ;(5HJC#jYnLIA>xy|J3|RiIU-qg6$st
z(dd68;b)C(y`0a@1}3B&tg17T9}`rWs-hlLZM8lxAEFd(DDt)(wifyT*D0whcRHjX
z&1ZrpyekP%GyfNicfbz9)&rxKZbLtgJP%pA3t@A^6NJX+Gq>EoN3nc8EANvf+;wcy
z1Y1c|j=(G?jp5pQkLt%fgW%`TgqPRna*I*hp-o<g#y;*_5p=l2KbWg`Ed}pN9m|T&
z-J<QQ20AVfu;$g5KIK6OUrd{D!C2QX+@H~&nG~gy{_EO;TD>W0_rAm4gwyT)BdF&i
zZkbK6<Vo*6LJ`JRvxI=(z)GX=7K;<xvVzBzmp_cUO_2-CosUUV-;)Xz^Nx3jP*G6%
zhvsY4g^*+t&Lz`(QkeHij*^)3rFF5Yty`N?zMhS;$Gzm2A9X54JNAATiY}MG#2xE6
z3*yJ?v8#!Qv6aa`7L|ly!WRK2XXhb|O#V@}_wF|%$Y$s6hz=qtj>RD0vKa#QiCl0j
zaKRUw)jk(3^NPR2E28g@Oj%lKK>IG-*Gg<G$ek+uN2`F~wxQ8rUrzXs&tE2A#f~QC
zpHEO0XF9Gl7<soR*1eQAKb-BhRe{OunI1N@ZkSeIyL^e}GtVXWpdXRg6_v|{u8>6P
z<&?-3M7McrenOpVzvPLjNw|NBxmr+ZmZ!2BDtO76Z^tR40;c?GJfgL9ytEAUh~Mu5
z344^Xym#vQkA_!A9fAj(4c}n;dlU!>#xC{?7s=!=T%!30{0#WA!1~hSb(BsY?x)12
zUA%->oq4t5o_@llXm?QQX~d_hJQIj7b7@;O4{IYjsxif7+&nz|+w;!m6ehPN8}w;H
zpGVuI+g$icLc{5XExm0Ql+R$cQn+xQew$*0$+oW1k2I+DxgK=a1<-&kmU^9yxxX58
zU7-(W_dvtE9P9|17pGa;m#m>l6svf=_c>grS4<zGA?mJv<OMbke0x|}+WEs+JUv+1
zt}+MzWWCd_Zlg*KlDAUr&5u|Qbpbguf*8|H69!jM<mcV3B4n-~UAc-Ql{@gkfQw3B
z+-E;Gn4`Jhz~k)VeigM@J$s6DTu3nJi$s|$1svFZDuno+&#|4`LHXuUd>r_)gt8=?
zTK=C&{5uKXBO~A(ZcV&J`uuWWRN4n=S|9TaJa>mWdtDNm1jKG986`*k^u)rJYS_*;
zgA&TVTQ9y(_<}M&!=InoF6KglyTodk>P))`4_1Sik}6i=U;3q85%IQbOO#qh_GYQa
zVchyZ5wOFgdtS-Mol;Y!gKD!D=%Dyy-8o;^>>fMOhNHkF3GZnADvyA*;mWYJ5oA2G
zgi9=Q>C9Dz;z#gakNsik!LN^-huLObAKy$~cR22?Siw#1%kE62zU%E?o%nUpbF!bq
zZ}QU*<%1ec7p9Pe@=wy0<$vK#9!Cj3S9XETa^Cfa)kJi<awN`%a*CG{O19zs!)BAU
zer!3qNE456;gdLX+k@<%#Oh2W*AON%c+?D;8ZaO6Sec0qTISjw3Cu&!_Bhuv7kijZ
zS9fQ+EE;}jZ}l~E>8J_;JNqcHHdkZwbE+pT9zXZ%;^~CHutdH^_W{@gQ@3yCF)w?t
z{6V7IR=lAD-!z8lqb9w!jDHqB(Qp0G<1^It>jQ{y{L^M|V&7k<&7G&6pnRCTh$<s(
znr1<BpP$ELo~W=^5s`(>SX0@ILwTs=b_dtwd}oYU5bFEL`Q)7_e!=)Hlf4N;*!(Sh
z)~Y0Clx{0Ath-k<w7@;bWQ?LTerNNj3@&bVb~Mt!${4Q>H+FbHjii7PUT)kbqAc1K
z>8NT*O=O~X9A#w*ZFi;h!jL-&@+kBJ{Kdzz87JGOw3J*ui^zGIuo-cXo!W5fYrOx1
z?X*J%sMG8#Cr~cG_9)ZTtWXnOZ*MT}lHsn5lDC(v;63qhT#nqSxo+(9wXui|^@e^7
zXbwexGGT5toGgga_u)iA%y)K*Bo}-k*|GPhq^)K6k{C{>^3WYA9d}Su$Mn9A8XaCT
z+SktDesoCa-zBXpY`4`m;cYRnKEpHE+tgWCsZd$Uo-Ni5PVU@dJ21S-SPPYbS2y}y
zt)*qY?#N8lhkLxh@}e3!<vE36>7Hb^)gaV~|9(Ec++V8rz?-^Q!eYLy$h#rXP*5Q$
z2Z_AW=4C<YzuR2l6$4xOCNZgxuU`UTq+dssWoo-Mme-2Ks-8<f*&8c}G~-o|U=|yI
zx8M^_dI{T>wlyPIw-Nku3Afa6u`Qc~$0$u-(aL$lj&~>o@AZ)IVgFA-BwD?K{m=R5
zFSA*X0Iq+BiYum#%k3)ZEi(DEXC%WF%A4W>Butm#uRcPAj6|v&*Q--<LS9Kql{wW&
zLiz?;h%Z_m&wFpb8$qHYOFjDQ+J(@C@G5L)X6^W1F6sYy_2ko_<U-qW!)vWdIT0x+
z;UO^?jEA<Gys@>_YwD-Yvqv`NPv=nIlEN)Y$MVS<!*xGQ7;v~D+|o*i24eS@zgdYE
zZ6r0*G(^Q$vtz5I3)r&J$`-Cb=Mwbv`B9o5l>lvG>>COSl(N(kdiDxWFHCbX<U2%b
zROy-TDnKqq8`9RHuf<rGZkZ)VqkfD0T&CPHF);bZLg5uh^*-WtnX?OD1Qc)(`E(LN
zp2w>?4T-@#O%Jl>%#=omVo1)C$Tih|;fv9XjLQoi(d;uQrHiG%46R$d#hOb4M}qN@
z5in6P5zX(J@B(3Mm_Jx_Fl>$99Zt|Pk$pURhojn`5i1SNw*JUneKrtZ4~$Kj4lhgY
z225|2KLC>oa-#~fC~}RgHuky2OdyG9A%nsbm#mGkA+`{SY}AhGQy(OGqhLtukT##t
zd1s9oPsW9BNbRW4v%__)4r+1?#`A{AI;Kx|9Dd=TH?i!#!E62|^VcQrthPlm&*9vs
z?U4gv83YC11{$S}>w3knN?f~HsE-=1ixKk7x@ut;51+TQCdR!Le5PA!l2vz#2%7jE
zdAsF?`Q;}WeyQ;r;^w5t&fu9R<{w_0gb5bci1X9L&__zO$ZY++A+g)4!z>uUe@<n)
zZ-{jKA;Cf$m%VaG$ylqL>Nc#N3WcS2-W0V<eQ1x_LEWP*+xI4$T*>ix1bJ~AltlR+
z@;7w8YRUW@4mTezjhv`IQmBdI{Y}MmFL3F(6-!^^Y3~CZaQ2bqzkP8&L+x!x*BJPO
z^1LFqnCA(>z2`LSYJ+18^L@_qbBdmT6Wp`661Ol+FhaitGeNqt8iXQCBi;YFbdLqs
zgp&sJ(E6(NHvo?UX`y8NK4hqg)x3yi0*=*SgqS^k_p}Xu!xekkn?XFO==B>ikz)rS
zExg4Ht(pXGZHFskSic;Q_`CaHH&PlW>ALVuCp#s~x_U>Rfjnfn((a*X#V{ekb;F`-
zbqGh31pfA3^hp;p!+q=0!<$F~6@Aw*`O<kii*powd*vst5SjC>u;C|@BYtJ+fN@b&
zcfP1bw(fmrMC+CfJyMOyn=!$)Vda?ctNGk6wcw1~=0Okjtq1)qC3x<Jd*ViJp2w5a
zSuRbPhDc4ucC17D<&PUxUS1r4UBe{^&JWvW(`B8{B`{6qeG?pzZ3)pZtOZR*YHaCX
z(_@a~Y@C)Gt2wbJ`9@YiP_Sc8MwfJT2emg<3|*hI^L-;ycr;VG=`rxH`_1v*JM6~V
z2houQj%WEdrH|fzRSYaxdVIu|O#bhV=HJatl%_oEeYtH`w$q5g5K>jx#I>i>d&l9e
zARu4!=UB!g6VTzT5B6)kW#y=*wfvIAMdA(e$|peh{KRNS4nJBY9&8U|I-CSaM?Bd1
z`twsfFJiNao<LGPW1rO>(!A??2zZB{VCRMBaG;E^r^l72o?3CP54+jcEX4g~PMrer
zrJnoiW6Q$YtgXngPe}&$c}necrX80Z5${h^&ks}SBdzR7^KRv&5aiAYayUz)<HV1G
zZBGNHw`+wWCydDgIJPZBihGP{&Ori1v-8HdIBo3`tkDZ>l9=p>=4u{P^`B1gd-ZI8
zY232dnYg-cP$tBWWP;hM#3v^0Xh=t`_1m@*Z}EVA@cE~zH)OJAy~&y0rSWbuVL-d*
zv0cywH(GDhWEBO0Ptm_^w_pnXi)4+vhTQ}qQO51I^FmwCZlXfvXAt`PtK?#BGAuA!
zP2lAxpx=SgereL5{JJQ9cmELVDscfB>V~>J&({(rOk>pPe7^e&8}}1(&E$P!hRN<u
z*mU{1ihKSX?oJ)22$)t6Y0Iy1iGGZSiT-uPo|d4P#61(wd-l^#Pxc4l%Mpq~p}AFP
zzx}C6_?hKrTXl-Y1?SDxPS-ew?Dn}an<U}MVR}`W)c^&%kfH@~+wA>po%;vwId{C>
zLfGfRkyvMH$WCNvP9P}~aZhB|?Pgs2I<0SzlZxVnOP0R!QXB{TImutwOXxvPomAvv
z+7?Rn(x4k_ltjC5t=kL7yBn(XS3{aBONw}mL6E5py<Bm~Qhy>Lf=y1gRBd+B&<Tx7
zdGqFMN$z~ib1Tf~O&Pa}ZeeQ>kX;*Cba!~cR)6L^kY-xwQJib*8hf9Yvo{CmZtIq6
zQTuu+1-r^<3GZ)A?@#wk(i!)H*L~fnEH{=~x8uBjT_oiW+U^}n_5!q{E6Bj?Gu$kI
zL%?Q9Q`aoiURW#xgKz!@3g3H~8ZvDPZ{@((3BcuNVU(rU%@!Cfbp*zCOVzXI+--8y
zleA5aD;5dnr$V<!eoS&alfb&CCM~#L%)48FxAs@08s$P-@I8xT!mFBCTC!W&s#7+m
zdhI>MZ=HOsb84-&L>A$`b5U(JI6DjfWTI#sAy9rc>r24Q>vjvXpB`5t4_lAI)QX~Y
z(ppP%Qrz4Y@mWKZV_YN>0-y@ZtC3eQb5#43FzLkU7yz|HOYV5trd}oom^R+1{W^Qp
zDmu0#YOt<dq`M%azPpJqcGtn&+5L~X<S&a4jKFlnHWgppYxuaP9?gvQS(9La^C#>d
zYfSnaIsN(+G=3n=)>axGN;C2K;~eqe(gAEfwf7-+<oMJ<o5aA<TSVi$`bMH<(et&H
ztOBKBLzDyu<pRlozEx?!G3e3pN+{vzswx<@5f$c;s63}r)Q@5^g|SdI^TZp>YRK&V
ztx&-Xo^M5ZJB^zhfh1hV4{cwbNAhoN*m`45L0txT?2q_iuvW(GwMgTyhLi4wY7jOx
z!n4br$?)S|EOX9k$B*(V=lK42O)mC%E|kZd3U=fpu3)mE<EU)QE9L7@O!D8MbLn=R
zX*gSJ_~gG!rvOA#Ga>8{shL6V*^R}w2G8Gf&LB~hKhMXn8hB#BuoW}RZ593NBS3sr
ztM=ml`GxX~pDQAI@9{Zk^DnavNx}@i-b>O`_F#S2lesG%s+V}J*+h*)0)W<VD#dyD
zU7Y&tK~2Y;Rw18&m2My5e*2vm59Ow9$-<`;#L-ruB_dM4UXP=CDDngB^$3B@c2eZ7
zJ3^?VE*p_`PvvFim5ac|uNp>Z;WXLrvGo!wEWb;Cx8rljP5lg<U=d;+`hDPFwt*i%
zdppLkj*)Z6;+F94?6P1nda@8&`9S9BrI5mtM+;z)+vcSuDO?S|DD1xe4_!qBN>lRa
zeS>c1mTjFzZ*cVBa5Bd2$BfP2Z04FLmyheH&3YX)<&Mi-`O5AUauho&vsBrBO_jFw
zNjhs(?!05(^|$RQJDu3IJEI3FYcn#wk$3(qzpc7`zo}AUa$~V4As(uOMY)c9p_uC%
zk2DmbKu_9^UPbCsH$TCCIK1iwKe}h?Kizn-67;>#Z04>@s8oHAkH_~n9~}rwI7-_{
z$Vw_o(+WAp8+oevkxlholo)e!E3-Z=N%u?fU$d=0MeIL3({qm)O?B{PGCim@?kL%B
zr}>|U2SH;n`zEA{z^Dmg{R4179c)`B2qR>nuKcrop<vRtX>(ZLwniOwp>8~i_gDCm
z?NAlN$T4Q>EN+yGZU+HQS?5F{KugUl^NVV`It3l>%(7TKWMTt=i9wI_{O#GIhBJ2w
zU^Lhn1tfIz?|2Y*S@iYLh*c+rPg?2H5qLNH&l}_<6Z-gBC~X$PA$tg@8uNV?r359%
zfNANCiWoQ`gTx9|AKrmy7k`uC#JKjSt(!>cUr1U}ih==flm7V4zJjBf{qSiedm|F(
zc!H*|ew&X;t_JVg*nHLKV9`4pA16d%q2Z6FfHCkcS$8dd4Y$CacMAuHZ&0O7CHCd)
zB0pO>p1YSyw=9L^Ks$b0^GsunF<Uk*&zh56pDbe&9yQDC{*L|94-;&laX7ZF;%j8?
zJ>N)Mockbw`D<Ofb&r=f5MM9R9PlV$HGptDGUd@Oyf1xK-E%AauWU3Q98*|cM{f1d
z<MK%Rxl8`b9@MdC!(bl^Hpca4o6Vzva8~iA^Q#lxXo*w57C+c$!D~C5crL0jX$a5r
zAcf7%=@MhbiR>h+<)fnpma<z4)N8ZutK_NAy>&_ntRC~``$x>Syko!uQ+xl1a&@}m
z)fyixYtr7?wf%L<;@T?&CS7ObWR;ik`oTazDF@ttnqPztyo!|M71A8lTO~}oany4T
z?Oo~-PBvK|j4}WJU1a1RRu&!EeK%vI)RQ_@5^9I`Id#wx)`nkSeeyqe4Y9lVTucI_
zK{#2&B)ifo25DAy%8UIaIAvX~SQxj^e3PU4&(Awd48Cd?Si_Pl#cN0|+q<2g?yEub
z)CvUu6a_$hDxeWyZ(VB$P2(zmoX%XgNS%<71JOqSSfbN`2O)Ker9Y`YGjEoDP&3lb
z;=Mv1BD|9!<5kLP)UFZz%b+RZ-aLAzmpP~Rk0j4`Tbs|SWFk-Maeh^{a$xJHDui~m
zc3XolJ?IL|dN}L=V5Iu5?#8{;K_oZRxHBNP9WKR)ddyI2U>U5V!-kLte$=vdbn?U`
zyU+)vBu_y&PIv4I;`u)}f)0?Iab%5P`)8aTMe23(cz}s+z4`KfWMqmH_Kiu6a_i9o
z%p;MDMCZ7+?-*BSJNpw`q$45={5fB*TpRx?BU<r>>}(S6HF7%3)X?!zxY&~}$7wI)
zEv4RQ`W04VH=xmXNR<|T({Dmgx!`~9g3`8ELpubq{%V$eD~P*yU&WH55s%uZ72P{x
z->{Lw+oyk){{}9-B61%gowdXtP5bn~Bd6DJ;tY<TMF&Zop<l@eZ+`b6plz_I!>+qC
zC4T#=5KDb1Vs*Z>x9RLy-GSMrpD(n`AuNfG3pINM8wuI_^41j)RnE1aP*>pV>G~#L
z!7RfqqZtC>04|HQy3;+ZI9ES(<|&VN-FDmGL3chkYGx0cF2NAxEkoC_-rb#%ux5Hq
z^{v_1XRl76@by^Q#(b|p8HLT8955noLeoL-t5f?$si;gbQSan)#%M`lpC`@{2TV~E
zVX8`q@t-Qtk}#4U8Dib}%@0n1OBwUa?2=ozPK{jG3Xyj&t=YY@8jW55=C;HfE@!~b
z%TZtzelIu+NZT_8EEKVjH%*?xf5VtM&sH?O1-3#(X3&dOj26~hdUXr4ixiE7^-jn|
z=fd@9P@=^@jgf$;0P8V)5TjBX<yU<Ro!e{R`_48er+*x!EQbqBb@(myx1KRu$G+2z
zGE;7QlsrD*Ik5kj3P#zuE3_tUoL-r#S!WYn&AJg0;N|80_FlutrS?9z8OL)k&j-uE
zEP%J!gf{EICPM<|PCXz9-XMba5T-?xZqjjpil;$Z#lWl2Gg42>My4UD&kV&v6Zq0<
z5;&n<*J+P~g2YxV7AL*Y+u6TGl;F7fA57M^vF6IPiOe=NBR%_+#=`6Mm_3`FY%Zas
z7UQWm?3$CLxH|n#D)mUn*%$c2P}|c&Qn==7)!J8azT^3949;;5d2_DK?UnnTIQZ7d
zg3eT;2p#TExpLVB$s(pQWir-54(f|!598(Q7<_}|*FS3OYO6m+2)%WrawfJ!H^9V`
zdLxO(V5K!I-rbg``!o!parSXcK7LpI^*qJjfd7JV|2_2dpOJaY20e6Kv_d*82#oxI
z>xkB`BZOwD1Ez0_H*A>V(PL@a7Kitqk=Zy2w1Y_l#@UD37~9ArWpR4>>DU5Y61Q(j
z3A<z-qNhj=)0VJh-XWq<8lsWHDkxgYV4mS`q;{}>ECuFa{6*Z{otVc4qInC2eJI_v
zMA%#``#z9CTIZ=TM7AqzhJJITLV#BV7bJIL+#9|9bXy_Edc8S{x1^W;dj|&5Qoq<L
zZ1rQjVssVJh9LhC8Db%NhDjLF9O|x<vxmc2m*%(5a(_g;rsv_<qws2>Rpv(AE;M0H
z1!rm~8zP|g4-34xVlAN5pWqEvR1XR-H-8YO^_2s-n@yz59$AvwK<O`O%^N>hu2fLU
zL*0N2I%e`>(}%r%S)qLA$2UwLDt}?2Y#eGMZ@)8h*9|{D<Uh>ltCs1~xge3LumJhv
zIEq(0_lnWSF_rUobWfP`vPRSDnJUrN_wr*Y4dX?^!!CZMmpe7fo}xOtE4o?2KGTMU
zPFtl9D{NZYREu$y0gmt?ej(sGY(_*hB9$?Cj#}okri7{8oI<EBnF!vi4u`UaYKh#i
zdDtp}yl9kbcAlYDtcf2S*0;u0g`sYI8s#Dp4f^T;5U@a!P>M!p^AOnioZQ)uPG}3k
zu&1)}#}{FN*v}G-Pb_7f0Qw{`=A!$=*K#A2J`k+1jdOFNiX0ITZY*d)Z)J?Q(OM&P
z=0@xDvNZv?38NZmYLZlWna|?aL=)y}Y0VWl(xoP$LsoRSXzN8tdJzNUt<IgCBQFAy
zUsUd?V3U#jk<(J~-8am8ivwuV)e9+lO4lA-_f90D7AS0xbyt<_PQT({1_W~mjH#lf
z&+{s0{@O{29wv^APX!Nq$qrs*Qu&)S$?-5!b_=zycj~TcK2U^#-QT`zF8cztJ&y6B
zT^cn1LxTV2PKr-?d@cPZOiL7j9SqCu4(Np1$sEr~t;~#SkT0!+{<iP?{lQ6>5x<qn
z3h9A*_(t+#vyxB*+qCP;$J_m$O#-*z3bTiOto25#DUgDj7`_;nNm-qB7DP<E*G|aN
zYy524p{)0|nOa@|7!Bj6(}`vEu1_tEZ~TW3a_((084kPrLEvt^w7j(Es!}RDL%9!7
zB;JfbQ2498JmDip0~P;)DZWqPxo3N(0MatQnr>N5$;!kqy*=_&7A?4ev6W#gF27u8
z-`;bz@)H<Z(hV&r<CugD5|bZT`4vdKw#;Fj%TU;afPdBKf-fW>2xEIbO)6&xMwD}e
zcAupv<FwuaNa|^P{(|``x`P@$Tet&_tuS<7t{hv%1K({YB?07JRTa=kY2HYGKrYr5
z0CqM#o;!TEJ0Bpuqn9Gl%ZcdfHk4*;i_MSM@d80mkFD3BEBLS$QFou>_&wrE=Gk}m
zBMV8e<JvOUU_uM8Ua~gkUw3Dmmw5%9AoiXu$5oK;OIOHUpGDkBkh&3B$fK}{+EQ6(
zao3_2^#Tos8R{*rtXo9G_Y);-qf&{?W+T*(WM;b-`$lrDpnL*odI>Ko!QI_8uqth3
z<hkStTRGm2Z<v@Dr;<C_EXz0oI`;VB8gAbe5LcZ&DIRSea#Q+-ug=;P$Q?h!I;o|=
zjW<cd+RN0k6U#DhS%0=ijAgE`h}NG3!cRJv2Ik=S((-+j1f++Ffy>BiSGc!Ik!|@Y
zwK7RYkRAo-B8+e%1n8lVRmDty3mmyH=ho=^6t}u&s~IN2Qe!`B*iT^+-TLGh51rke
zSd~4CWSR&QMaP+Tlk*qY)VOVZ&8nAk&4kh_9|=$IkE35bEGC4OiMk4R{nucdMjY)6
zr9Pp4-K)<gDFRfbO|~w!zDK&mAC)*2^n~zC_>K@=#pj0=`cAl5ey!w1Oy#xi({sf{
zdJCNdAZF*=a!QtH7#6Rz!^diAJQro_vvy9K;2ht{Oje49<tnXic}OsdEsZ@EE~Ry>
zP3E^KqA{S9EUv@VzR<5_O3aC;6fRY^;2;?(KLJD)4|cWk9y|1!<!M|vkA8kudX0je
zOc2oT_KeQByX;=mkDA;<<30PzI;q~9+<<pRrV<<;C5sbn%3o8W72qgPW!H56j4qxD
z8~!tX2h&(Ind}%AF}ND!cwRJFTN@K8{hMl`Eq%0Fxfp@-|3TIDmoid<=UK!CLXjHV
zeSHhjDE#*|nOEOwWSuM4b1KoL{m5&7?^Kkj$uhr}pZBP>0=j9<0Vy&J=Oz(lI@^{w
z-|t;>xly$hri=_{jEs}+>#9tf9b<yp_cd&mG1O?C&KgPmb4`(UZwB^XJu~Oa5rs|F
z_mWouw4YW<77L%L_h_ZCJrI6go4(;OKNInPnNImMEcs{BteRAt!?7Gq>XAyd_%|19
z6zuMY8u<=MON39YYkn~P-<2_AsY|DW^&9(}rk9j3(U0BajSE>e=cncR+il=qP0VnX
zw7z8|(h-)1^7UL0G~yq#Ar5O*$3w+l-=uaybfze6S`foF$rZZ6t`DgJoO2b9c_9F2
zjF<Qv{))A;M@`Q|7^WT1<ZOK(s{S&G?m|F%@GowN<_a+JG#i2uF{HiTq3QcUGQ`;P
zWWPK)I4$uwX5XsCGdGsF2qwn<T}s?$=_7$wx~;Huh;<x&-<k*cu%alohrxI4I5Xgi
zvE=5j%k&)H9&9$Kt+p0QxGwVZ5dbaKtKvl6p?{9dQeEre#$DY-S-xLVli}J!h+jkP
z{etf;$se3;{eB}itn*rlH`UJVfy8sl41bbN9rvv&;=|HpjU1BfW@O}=a%lHE!*~3i
zKN;0`5e}GU>p2;n^uU~&%L&5RDpY4&aDFJ2c{@?Y(w9nPvJ0&v6ET|Teme^WL@ke=
zx9hmm{@ItvlYO@;{fg1^wzHq#n~UU}mf2l5&)#XC0N#b_J_&oj9!VmdFMwaYHU0ax
zAaG#)v<Jp@*H)Xw9(9rG=}S2^2~9c;M?+sc)31ak^0p8nLz%WnBc&E^=1fAH(yoMz
z&*U;b@zv?+@jC1_(oRka7#WCAF-x|8_BwXyP!eGjxTLMhln|sk%`93U7BF2|MJu>#
z*q$gz(pR4HP%|O`SNlvDbgvYRmAdkM83+d9;KIAfATB?I#Xx;h)fxPtP7-YYX_WyU
zdtGC8wv|z@p9TI|M|#T@nS4E`mI5|qC|ps((x`WQXtn%y%X_U8N0ah0)1XtWDjGG1
z2s-sW4xGC4*lB%UM$0UP<OVHQ-#(>GF*&0<4u=kk+=I3V`<txAxsx=UEy5>~#~fp_
z>zwh68jts0*1fPf8OXP-ZD;j<B(s;GxbM7neLa4$xn7)yWW+`@A5~5gAPgE%mvJwJ
zaSf<~%fQ1vx3(a*nz8bwoTWhLNU3f4hTtDMy7QqWeaR|Ui6qFCOJt3Lzh-EFKEP*~
zGc6uB(+)+68rDvnznq+gS@*l28Uj(6UcQ<E>Hn7z{Hy<zPvR=^IHUlKZy?h}^ohwB
z(2v~}t$T5yh{<Tr+%d)WGRuQTq;u=GvDIEK?6S@mWjn6nn_yA}VM#}CDVc5;4}3rB
zb*+za6Ri4bK~k-a1Q^unlzlr(C*_PPrwKW)P2I*LiBG?8*7*apV(<a9+esdA1SBNL
z3XSB0@saw)`9sLHEyj_jZMUih-#pg*O_R!X|Myj9tLb@KLj^|bLu|QOJ*hy*<^n%t
zXMzzKA77kBbAoI*wQlQ%V|TZ^hAU_w__2;P<(dbu!q|OP%BLifE*g#|lUgAW^Xg)n
zG$N%{^`wm3E!yhV;-b-iIfCw(sB@Px8oWq(EUr^fcy?p!TB`ZM;P3UZay3SW`5{a5
z1o8)ed#~#l>gLw;bGfPYS_^X=ps67<Sg$3t>6an*e5xyVexTe;BHvT)Wthw#vmOP(
z*9u)7i;dJc4w%nwQy*BqliXp)U$nFPK`JjuJ!ffK-3^xa%JHu*$Q-aRxv>jzl7LwK
zVs?^LDa$JOQ4N#f_N*A4SJ3I}+Z=8${2?UlC6CAevDJNfQ`7rMi<g4{Om+`g{f2a4
zJ75*ik8T%zm*mB=8OYrmQIWUByUdkuP);2UBk3*{F64(dY=zs#2EPV^(J5ZXISUM*
z4&H~9)h>v|MYnUbdkDGxlI#r74>diHFu$pI>^nFd(?VWE!#;~EZ0ccx)t%&Y>`s6c
ztB#z$E9}m${u30LHeu+Hz<dS>=68bdOi(vB%ACNWBW>XeNH63Sj%u8b(ui?CCk<>p
z_5O!vpW20nLYOkgVZ>?0CDBVdYBIln{9l?H15KCqu5bAhMxv?7oQe0m3NXeP;Xx1R
zY$<Q5t0?-!-F?|H$79%ehhR?mw58+7dtp|s7^yWmjMd+B@j<SG!S6MP+wvg<yUVvB
zAN75!QOFgOLY>KTye|GHeDt&5L$<xb=NtzN618u!#y=FKII2-znw~4yC5Fl?Cldz3
z7Px7Am*msQF45?6k<j=S(-u6WAXcNBKATx}1Boj7sD4}5dXGcZk)K-15}(l*pBof7
zTL2p3f0I?Z`{V_BmE&Q*mLyw2iq)RJ?;hV4iH&Hz5OiPJ5JUTY!@N*W_KPC?jkzby
zzr;AXG^pD%_8-==eiFfE+?vt3yL(!&d~Gm|0aMiIJhk_M-*Km=*K2L3^!Rh4x~!JR
z6Twstge{#c?w?`B>VW-04N~IneLlv4)H^9*fd{=inF4fMr+mDhax;Erb`cjVg230Z
zud8%D-hktHfl7{Klf$xjY&L3$9tr;ih>z$zT}Jzpxg$Uz&)-!~j3t9`_eTB0bInqZ
z46$$JKVmDu0@o1Y{AHfEVG*I$!bR=v4a(z#p*gecTpAA$4WrR#%-1_`rQ*9hrg14?
zt*EZIGser&?+9XxMbX*%^jH@Uz|z@&<m%W~3f@0B5N>DKzFI_RT4Q90UOQRz@9&24
zHk=-qdogckH$9Ela7itIetUx%rM$7Xt8j%fAYhtWb_MGW*K=?eQX*dSEFDxln)fz(
zeIewQ)iuT`r(;i>?EQ{H8u)g8CC$lCvz()i5oVckUZ!16ri}`z_wwGzdZt3THKdtD
z`c;KZf0}df%vmM?0;ziO3)t!Fx3+$6^s0ZtfDnD}^PgG4V$^Gw^o&(7Jxw{4aW$3L
z%`};wrNb<4;?Vn0BuHinc=|T0GAvYS-uUIYZB3T_e%PjN<qE{UASIv0-RU~{cky@`
zU_D-cNe6&PYS{yJ+Lj;&?rThS8R;F63UHaNVs30`T5&yc_QIl2{2WB+?EBai<&n{k
z@rDz?Hl0{wAiNQsp<q|aD(zAL^iP2SFyr=lhT|4`O(%Wp%5O#_kN$?U$~=awkNeUX
zu!N$$))MN0uzZpT81GCy7CyEIE=Q<fe`n}`<QYo=nEB{Dra*4^%AqO*>>D5#%+fzT
z{41VB-*o5=M@rA81i0)V^4j5%L*JSly}V8;QhD`*T}1^rN#YL<zjk*~{!uJ-RtuOm
zZrEPjc*GjE1n`-nx-F6J+R3{%OOKe*&l9PShhK9XT*BWv&Bow0Hz?{<mWm7~+3^7$
zB~#?jIVQvf`dld5t6LX80CG0gDE7k$dmxz1`fptHpH`=xl_b_FZO)gt*1E2L^GZNJ
zvfes<s=pARE_gku``_rue>a4mzy7n%3A+SBu(H-BvSQXSb!Kh!)i4qr#jWn*yUfKu
zC_cH4M}aX7bRZfF)wwhVQ169PiEAJ^fe?1PHt^}&oG`M?Fp9=P`t4w10*Q2pG{R&1
zxuC|}%e4Fr<oT}AxwuTWKg!b^w1u6q0SN~mkrC$7N8yjg`3kj7lUJU<<(`cnFU>`U
z-W?DC8v*P%D>Nu&)n6bWQd{qDy7z}6M~VVy46p~>B%$c)ZokYHxpXGS5GN<O=927y
zX~66F#3&!%Yw<nb)YV$yyp)_hp0{@Z0s<b~*?@%Pf#tkOrr`G@Fe-H9=b+$mlynp8
zfD1@yKEk!m=D!H2jD;Dm3gXrsy`v30n-1)8yi2C3KH`50`(xZJVV6fF{|$8KC_X;@
z+huY(<fY-bHC3dx7RfB#r9ScV52fiVjstb%B>vOUMh648tmN)N^FWm)KZ*Ae`W6lW
zXMSpQjF;%Nu5OIl(SwCF7{TlGfpWzmS93}haEp7I`9rVC&cO6l7sTfI*jnHBgj_$u
zUO$34Wz1M?=Ou!dkH1S6%}!3#1@v%7@sf<7G-f9*UcQ=HSY%N1VC&`y(I@dyH5p8%
zIG~Rre#$^#f!P3CM2({dsUUQ}1M9wg7AY`PeBp+WN)LH~Xtz$;2KRtldhMaT`&cvS
z9lL*sHb=4c1&%{vl7d*14f$fE<ZSQ@^h+|4853-^wwrA+Y#|{q<A3VeD_6BLP>7CF
z<ingk=x-8I&r!$SMrU8Ej4a`qxilw$6t0OOJ-w&0?mhHYCoAI<%b>z<q6%_o{0q$q
zz+4?ba+G_vt$Sd_O@qGj0AehaISR&cCS1VJQN51Sg@{JixX``)ys;!^`(h||C}uJp
zKmXK+<-SXKw9QBgvM_kXM;YN@i`vrA<E?rd8XOInS^V9pzkF5Lk4x4Qi%H@l0u-&o
z03!)<QPQ$Dx5K|6RCRfVS9M)H)^KPJ5+4^Zp3(#NQ`mJu9QjFUdaYP))LPm&`5gD~
z%roKshwQqIB2q0JS)<ksZg924UtHigxPA2nfmpLbY5GZIPev&Z-eSRm%mB6Is*{!B
z!hHR{;=A1cam#X<F0u6?mWWJ+(O(w_G<@F<_^N&bnzpH1cDE^0YAzOi>nadojHQQe
z_$hBj=_%HN4-kkT^f<pz>01<y$W*>kVxKhNsNQ|s*9ZvN*V`tKZ)h5U-7`3#r!Up|
zs>^ysybZMp94oPIAGFZAQLjvsVI%xH+G;?owJFa^vygR<%2I(0!K-wRb8T4j+AB|O
zjn^b;E)*t-zc2@IlkS}b6rtBq?qr5q?Bmd<P%^tj3oTzt80iFPH52m^$?89pq9GQ0
zU>UR&GMEOkx1Mu#$Mb8Hs(wj4CDB34c|;Ay-c7Q#DwkRw>>>B^_mYKC1w*L5!sci<
z6svY-$6ku8WpN$t3ZFv#k^cDVzC*ROJ06RkEKQYRM;m~liRZMa>GDi#{N%KDv0lQC
z*>Zm)Zu-<!^O*Q&bjX_={Ggf|*<BsuLdWrd`cG~G8jM0Bs;{<w2cP)ktjn<&a?tjK
zusT|Y9C}ypQ3F;azWmgf#<)yWizisNG(n{s#wBfia$3gp-i*JAGQ-U@2f?KqT=m{Q
zdV+fIf}C`51W}|$A#Qcx4BloDw}^!UiOJyJw|*PZ@u3_Qz6aEW&&Z&b%%wj|Z!q{8
z!4|&pV27Q<M<WU=WinXuu2NZT=30Ij(9jyU7Z9Bnz8%GT;0B$H3z#kwG^O@`@+hl5
zX@*LHZUGP6(#Dk!4VB1>Tz1gmik~BqdxTs2St|9=b*lU1u8dv!qc<HXU6(sC=-gnM
zlYeVDcIb}r<w+Pjw;!jsLkpAWY$ZMt9uDCv=u_{iT9x&&&L6q)axym61Jvp4C<$Lp
z%I4LT=&TRBc(8}Die41<p_x#j0c}^I`UMU*OZp{u;#n4;Av3BMER00^$CG)?G-cU*
zn|f3M3=Gg~*lGJ*1;;zS{})>au=Ro4o`>iqqs7)KIv-cfmTC9KkI-L=7u`-~EmPP$
z!b#sh$`Q9by!VLtuhMiV?SJ=bkUr)qMt!SjHyuiuM-tF<hdj`#fyt)ICr*X)hOs|d
zayiY9j@s8a0Ts9=K|yZXBj(_SO6L7#>oLcSlV~_p*A<6>#w~8Jk#p|%!(pZDIEBqY
z4e6fK-D2+^gIBB!ilPyZ`HHJSl5w}2VSa$}CZ#Cq-rS#8BVU*A?tRI{*Hqn%40vie
z&UFCn5^B1+k)r6G*G-Bmoaw<Aa$eWfn$@~e&}FMZ*eD~`Jz)1zCG9gl#z@w?4pB7n
zEMkEGO3YVC{JU%41E!OQV&((fyrt?lAI52ENbv|+(621IFHv5Z9J0Z)B7QVZ*$o90
zwoP;4!;e4VzhRnk)s?GdTrk)&o-NP+?#J}bz?|A6dHPxPMl@oXUQBiev50fKCwyDR
zf*yHX6i&&^C=8uF!^sT48-+)vOy1=R)UV<$;wJgyG5xihw@y=ALP!7@t#YJsxqhnS
zCB8^3tZ#Dv7k!*F#tL17amnu)^eFV7-eTOPN9(lMW2H@?@?c?fzym;sS<~@xlIX}q
zK3?T>opcVbQ_U5c$WlI(Y;k-W(gx&F2?=4jJzSBH2eOr`CqzB^{(`7?O=dkR;(QO;
zpuQgP)vx~7Vkr=DR@Z@5J6h4mmYGC}peLM*ZclzhoKKyf8g+^&r7PPF9U{GtCH8@|
zT(|RK2cfno#w={*95N=gRmuqzf&N68VX*Pr^EZMd@iz~^faEH7&`7PSH;^n=<+&~!
z_>HhwH8jozgH9~W=<f@Ps%)}^W_>gR3w<jyR{?%F0enUe7JwniqHI}8YxK)+xzj<p
z8sbBiAXeGoxU<~W>XqOpbqjWWMwFWEbbxk#)-*`B-&KcFt}EbR|DG_yZ8<&2A>Wb~
z$><m~^F^$;!;Q@r)SY#;KThaTmRW~Wb=Nwuuu+_SyCEFmw4Q!uYjvjKs1_&UsAJ$6
zM(~ZvJWG3Wd2)snKV*l?IoD1+HxoGeU3oT6@U={JXqqVsn+j=H;H$#TFnvVWfvgU<
zd`xT)A<`_nmMQz8*V6u&Wd?KUD?g;WCD)hY%}0H7w#R%<n+<H<XY=bCwErqo-oL_r
zO>LUk1-MCMXKoI913kq<qL8cbIq@nFEb0-javnQP{XaT-a+12q!HrC!yNEa1yfH^U
zmygOeU<@yQUiv@c-vT&^DXBT;73>mz^yiPY$?_*8Hka(eHa^C;u3=U5i`zfhjx!KJ
z`s;ZWvi}nQ8oVJZiXS5q)2K9UOS-i)P)yV!#H(<0Gd_SjZGZ~2r-M6vo1;2JnA_$Q
z9D*q&Q#z;?mZZ|z>A=^JwHug&;?G33z7>1$(3<!!{ggq=v&wmS=n1{@sj7%*23Au%
zh_{J+VIOV(NyCa$i&(&ND&$UAG;i5gDfPLJoq=}elRINrh;vEsFQr`q#HRhyb=c4`
zn7-a@ml-WBkvH<JQlpKQcD0sR0Zq=+v<+$WgNzYVY##Gmr*kv_aiBKG8|A+5PGxFA
zT}VM-C`GE-J?qz7Af=IvG|RV#uEJs_z|0^vv~bH{mJ-$$<Ca<OonDA9R1z`*Vkfb_
zdX3nU=lf#{;tF=*>ey?x=*m~$^9e)yZnXZD%<V8tTYdz|**5!aQgSGF@7E~az0jK@
zhV+O1(%=}d&S*eHjum9_iK$Y1Un<<x5i!urt0CP*wPV5rg)nZnCv73^cV<C^fcAic
zP+JGRN=rs?Uy74b*+F6EeWNJa4+keRLF*e=3nkbK^Uf7T>MQ;*uYLc+HJKT*fQ+<N
zC38Sd*_;|SY}5v*`hF2CLiY&2s~F9z1qoWeoe9`l;?OGV-KgN&v+Jr`j+?%`XQw#A
z7P~0S@#;i82JeusU8EAa4dH8B*OXf*cX<q;N6`Ezq=BA<7{?5RU;Ha!iyGUZ$xPfO
zMA(EtmGv=k|C|1`MD4sNU0_Ha6yZt#Jd~GzqAYjxs_b%D&;5mPU1_QSLi5Yz6eMNn
z;tzq5JL*pe6{%-CIW={^TNLbiTq|irsm2+eaUO(AU?pWTYl#A^ukoIAXT2{?5zufN
z)bJyd$H5OmR2A%C{a#?%6n$xBO9wD{de{g8XCidAQ3g_dcRd;+ii7QC97XF$RN2o<
zK_9*TJhwbi#ZBT3G;wNHT)Tf1wCV%``tni;HGQ5UWBe9=*Kd<l92I%3=}$QTn{#oY
z>g{%KWq?t>kRJH01nz%v{aF?K;7^X0>Nm!8>=N3wVFB%?KkB&8G701{reoYxOXo@9
zV}CcQx*sLX#RZ-{eEjb$fDop%qNS$`sUb=W`|#+Uq}0$%XY7)OY*_)z;9nFRa49&|
zkWsno;~{I+Kd36K?s^@k>`wwz3=tQ8rzRa^IiO(<4bdZSwA~7`liLZiXE?gPycF@+
zYKoiXoG?GAH4*!>IJ*^A_bgx?IqLBR0}EPL__kvTgf<sQC}`x#pcfe55_y>lMxRX{
z)WFdntVu{C*nkn|b`?L6RnEN3n~;Ly^ZieT08OL2z|_#Y2mJ&B(h}S*;fM0|XUQj8
zrWi3{B4L>BgOR_IzlSUKh_A!x&;Rv0i19p#Vrl?<Y9UhvU1}&2s;BnXJYx;S=t{u~
zC>3daoV39IuMPuSN)Z!1<_YZ|CeXE8thwzPie@*b$*RR#JUNa1_1LSXXzm!_;LXV$
zul#`g+N|A#eY=#k3~LbQ+?T$>Sb$;}G{MLN=GgHVx?dpCYYqo`-!Ig>hY%lUTAz^H
zu$cg+ug5ox<bM-)1M(VIk;nsJdZ~qz{M*0u|4UCkf~29>Wqcer*3^_};Gbfbq(U-@
z9;}o&e~>ydXkFg(sK%2fhsAZ`{uZC8{UCsc5@ao5Sbm<_V06mbF^6$`pVyvPo#~kF
zEUC4)QH1gs{g2CZx@%HpFT=s0e2Kv5k{f;?ZL=XTd|JJdo%EG+BdQdDJK0~F-0AdI
z>hpy?*%qSD7n5u?^89D>Hj~9usL+HJy&<x?uu#d+VI%qvh@<T_TnI1o6|HS5SAVdN
zYGY6kolMdlV_VZ#xI<|vv|iioVzd5T9cVCaz48}*r4QE}zhAyldsbY%Q52*_>#MPj
zDUOsr5<BL#_CNQ>wCm8lTu#nzA=68fILxlQowT2^@3}X@Gnb;7k)CAh{mb)YE4c#u
zjG4;$cmr*jsFR@$uBNfbk^T?Y3H4`I%X?TZ!4tPZ_<Qf^8ShN&Z|75>&gm|$Utsk-
zxy7QPzysELar_IEpt}U7!`k8f`hA&wFdRZ0-wBrtCf~DljUnz4@H##ExEgc|HaC2d
zmzAEZf>x<Zrx{Y3n>j2~r;=X3ckbOWo7tE6VKG3LtmrW;OnbwiCl&CmD-TmCty#&3
ztVwST2|v&*enwXG$kLoE53S0fNe2Dt<?-T@y|8b1b7G0|He>Q??QO;Lvr~G_k*V{u
z{YfZ%W5HBS^$Y9Ov3CL^sPhPET!&$1+L85hvZAxkuksjG=dZw|Mr^MxC}d5w?tCdm
zV%@<6k9+QIMuq`VSDs%3s_mHz4?O};%{6L4qds;q9_p;tmObhacHbsvqnvZL9c8`!
z75PfYX&2hOAOopypE)sd7LP|fw3p_+9vZO!$zvW@yEOCL!2SI6Zq0Rxn<j6+9wab9
zUHW8?P4uezu-LHuz(XiX>`^3=f1B}r;H<T{z}8_p={nB&e#(F)>J+zgm9`p5{&gDj
zxC^6ndbFpp#z$K<L>D<tEw}dtzFUdBJ-#=hN&=Q9Wsm6LT;Eg=mV-BX%shb(rm)!n
zg=x97DTi;@scs}1a;KXAbB*}A3y`yu6w}=pA_{FP9$h>QwicZe|A|Bm&^;B}Ml|wJ
zfWbiiy#9<7AyPQ`wCF$h{<K9Bu&ZEZ@pnq<s0_#_azLYa?Z#x%5A@BipnnA$nfyg5
zZsa~Gzi+J)NByB(jsZjZZ>Pb?*wo3Qgd^HkyviW)EANt95&&^lvi+w)r*^(_wqSIY
zwbP^?3jry~A!ZFFi4YbxhYk+oS25<+_QH)%5%O6bl1ZqSFVo``?5z6?O}p`F%tegg
z>q(Jl=XGlcN+Zh&s7-z2-MYc**02ylm5&Y@wK1B%_3Wo(GyAI;66(dnSM9&yp1OSl
zdXW1dm$f@CJQa?U$|>wqOxGOik|Om2Xl-2Zc|NUgJ7#$4VTyicD<_@(yM8gEJ&2L9
zTrG_!GNh0tk*llv1RpaA@Yxyw;S`Qez9f+~K9Ssyaje%WJxheR4O;KlC5Xvsi2h0c
z0E8XzwEdFt=BfNvn>hbJcVBK+4jXxwNViblnvJ4;N<zvri<@e2-DchjV(WP>qtE;H
z#AA7xi>iaHZ{x2%&g~avo7ubJ>o-TIfJ4yp{DrUsfk{M_WX<K?4c}N`b*6+k*)({0
z#!ThJ7wh6=cQS(BdNl@IAs^G+!8BQFFa?65GW2QP(*Q9XM6EA3_Erl^X`OVic?3?0
zIo^BvsYqnzP#|1GKb&nXkcxlz9zvV*A`#NRLIQ+_BN34CpS;k&d-+DEdF#p0S#$k6
zjIPM#UT|2Ap)Ns;^=+P%Yq4tGmWLosWz|&?7x(6mf|_u(l?HKM{|;ONPZxhD`k{eZ
zF=SKsRF@tw$@+rKudLrv0MfSm(;=7_mQ9lu0>q6YKVK|ml+vaElFA5a@SMk7Y1K0r
zPwpS~pI%rO6!wj}uEk$5kGwy|RMt&Uu#`!Kjfm)Ji@LNcV;8H(Fs#P?C$5|Br!g4`
zY<<EB=WWuYV>L4;Q(Z)!@hbId{D}-g!aF@l&en%Tbrv9#zc!E~EiV!tIGzHx-sEWY
z=Qn%(%jy!(9}0=d9&}jO9P*{IMJLCX!cf97yd*|5DSifCyM?#va<rC2y!KOliqvvM
zY<f|LUh%chq~Be~PhZ)hN8OX9s-*L6$F_^NHA2&h`jo}Y;7PVF&+gftf)C{Uv=%eT
zX&cG!v|VSIJB6_^tc3?uKDkExyl(>*GCy63g$Mvz`p6$}LgSI~TLPNUwqv)M3?7?>
z(6`U=NAO}%&`SSj9e;1gQ!*;*mU6s88Ax;wV1Z^Q;w(U3inh9K>}$N?nn2Ft9%lW8
z^c0{Xt8zkqF#zv^Nw_^wL2t(%g&CbR5tpBZhl@ua0fCAEr!OC8l#MD`y=f=ie$v!Q
z8&N~AzLU9CQspqBMnJJgTDISDeDU@Y4a^R3Cf&)_Z&{E!rpa41-?l4n_^v&MWkeku
z(TR5pPDXm4%<a4s_Mf(Rfk<5#LcflRS^zH4pU1#`iuf7FOCrjPipu$yRZPZ+GZo-8
zOIS--Q3U$6>OW4vp0qfu$$XuT&bxy$1vL^d^Uq}}6-ZFfN7Z<Yh-^^~ibRm^MQ8q}
z=$F0pCV+o~^u-MsNHhAb-65alsmRm*%`G}Zly$}QJr@UWISYB6XoH1=yM;KSaj;7&
zM0Y-2Ku&7E;BLU2l=@J?=Kv<TDVHTho8f|jeI$zV8qxAqjmPoKeje%x=G@kZ=stlw
zSGWe7?4|sF?7asx*8TrKE-twwJ4v!bWtEw|LZ#5KXW3i!)`du9hHO$%LS%1Ab|iaV
z%I327{J-A1aru1j`}4Vf|IhDt&hMPxeLAOe9WL+pYdrUOJZW6H8~P`OZ6on&+*fEh
zlq}~SlAjQ-2fQXX{otcUZ-0@4jW1PB3VEub@WMNH5cQf@T6WqFG1A+n!|Gd_pkee~
z^hSaJyF=u5Y2{{F?v;mMF6TE>7pp{^fpXHfak*vS83abk@m8y3Q*FRTn)Sh_H0b7L
zXJ%J?0u>I$`KREYx_({ZJ-=(N%_$x>!D}|dR`Y`(;L#7TVQfmtefz%`_P8;ZXaT`E
z))>vhGC!AIo!0KXy9zvHC|&k*u#|U8G>UI5(s!hEb)filp^32P)EBkxr;Kq=PXO-U
z{mNH1v;*8b;qFpq6ZSAD`1N(sta9#EHX|^_2VRfYG6dO%G4p-nsdA2hs^P+_YqCYz
za(F;wm!<pUqXMKSULVLdqYAD96gNxVY_6q~P)IB)@AECdz(YLhp&2;ElCI~km(3<I
zTT9i@iQ<N@uGn-FYn8;2gN)0-e1Taoxsd4<)A4Y@4_xb@9ALWJrs@@UY2|URe(_Bn
z*16g)A$@P8z@2j9LD$V~i^7ByKC-;Nhg`E1Zmt%&kn~#{R-du^<kcUvz+NyfT@`ma
z%00VCyaq6J`D`U~zq<R_tIM&jz<W0(j}`T~1v%T*a9SA0SN|T!yjBYrTjSK4nA7DL
z8=-JrUpUUeQd)BTRp#L2TgkMQQ2&1|R;M^-j^rP7iBcUVFTP}p>fxV<Wss{T!8M#V
zQ?+cgY$r;b@eOqMdU*^?>0x{~*RzBO8;UK@>;PTJPki53f20+ZbE@3sbH%0V3}>F3
zbsZBd9C!;bD2A_zQN@3<ooH?I(oz|CLDV<tK39n|V<@^ARSZl|jY9K|T)Qm*%{vRg
zVGL77zAnTvCwZ4VAH(*0HS%N&PkT*5dXBi0jq}@D-_3PDQf7lZoMuuzWdYIImqKSu
z8rHk8UiIvN+VOGsIWL;4el}kNjF;pXGfhbvyoW$4J?uv*p(H=zhKkHjJX}u+;s7eq
zz1nj)3095PJG;zbMNR@IiAW*w>@VaHmQ!7UHt0R?8@tvS_HqNN?YsFcOXM7YQ}YvZ
z0o`LcuWoHYGd((8L316~$U-d5r-u8rb*TwZ32qo__?L@eJC6l!7h@TGHi1f+ReXCi
z#<0`@np?J4W2=@9%mJQDh>)xGl1_!QA4)#SPP>DtQoyF|oWUDWd69JG6q&ayhI=*0
zD&XDI>X^6@%sfXL$p0|?Sw%X>vxJ0&_bwKbX%oDILsy(?2EMwyjQ^<rYY;J4(3*5X
z;`4I`!d{N<84c={pR}_BVfNh}F4QzcH1)&U9*b0~NCtUBp-}ZFrK^3_V2+8G5zxq>
z=wPbPc-9R`?J|j-Z{^-0nHczPkb$qe3zfIXTlmnS9aN8MP@fR>SRgi`Cq3`uR1x&3
zy`C&;Auvv$n3$4qIX2H>)<xcXwQtkNT1XzAft6KT>HtzmT?{MDIXCv|Rnp-`H9?Nb
z=TK_&bT)5jAB@TgqV8uG*8y<;?P~?+64LlnM-h*@z_^dt(-<8BMwM}2x}%egsMXnx
z0x!|!mr#viFRS~X$-R7;K<#oWc3yNRs8mdFAlG(%q&D)5CFA<2h_QGukszB%yK7G0
z%w@H$3xZ5D${|k9#B>FAnQwSs<=$i80nxtv##e0x@n$)oLQ0^!UuGrVp30<t2Cp|Y
zS2(+sBm0Mj8n1~K-25V&g_5ve$FIak#&mi1!q3R>)VgniE(P+0yI1#GF1Kquwq!<2
zKtmUYDtFAq5A?~^RbZ;A;@h{Q8w@gmjW4RB)>f}{&t!{(?1!OdUO}K`b{*5Bdxh&f
z+peQpIZ;oRA3D^kuT}*K|8m%kijuu4NOU{8z<lP_EkU~2T}z$^u?aN}wxF)=u3v?Q
z&D^|tfW4qu@te44N{&^JUEp&oj5S6nTbC%$YRwchQ@?!S%Nw-&h_92OfF}_<A5^->
zlHV>@Z{=wJ?&|iFK)n!u+d^bS0%*@(N5cMIi}2jV+^~^tLeYtV#TA8fIsQK~;@5pB
zPd@S}?{L}DYD3No%EQa7zCUz8;XCNt-|O)xzfo8CsCf8yB_)XK<-Xo)*w<krhHKZd
zP`OWIZ@0c-=>ynnq0}ZZP3|B>pRV4S+osEocO<kYmgtPRP?j1=&Z5lgcw=IyR0a%%
zWF&TCz|4%-<>6^6%PE3PaV`*=f5Srw!eljmkMDE%<u(;-eXd`O^DcDW=~Q~jWf&M%
zyV9<#eLGJ=xqOL2$k8f^olT>lr4&q}m!ocDv<+D`%4K+Dvh}J+p~^fbTWjHV6er_+
z#|Lv1V~g?R6E`+r`Ycc{N5YrJ0g96}KMO2ns0=#;WLMdEEMY<uN%|AH6gX6!N+W8w
zK*f}G{`^-hjL9cb;odcB1++>eYvV$=ZH(L$JSO+67pHp`u4b6N4_Y|GZ#&*H9KF5C
zXXb0Z{Qh}0G<I%Bf5ydc?8Y|!i>KP#p|sMgpVE(S<9A|W_)U+r-_v5T%UsHT?J#>+
zzR}d?oKt*BI}Pq<vago>><r^dZg^Q38Y5CqhC7r@zw~6g1(I8uhNx$13HLwVaqA1N
zRGnRM0u>?8f|1B=3Yrbx(v(^eVK;Rz*FKg^zdp{UPa<<}p@|yw1?~f~tCu+x#(Q%0
z@nGD(KTeM?j&WFP7Te8xel4@;+VJYA-+iz#0QyU6EIMKf>jF6!LgUAt3y~`*q`Isk
zEDhgST4H%L50?i24#+eyBs#^L9c$_y4pA2@H5z!!{|08$4)fFDDQ_>iWAFWqhoiqe
zRy*UHX=dptG}B6NC#5j{^s=#tntxt{=BMa|JQD_`AFFD;3`K9JuXkVVA(rt!$t_AF
z>}<=~`F!&=c5gH}s5zVRLlpw}#UcRrRo&iWrnSZGOGxgdRIJ00ms!;xyVU=kKzf6q
zp1PAjb%UCh`2$O{p>Q{qY^n5cRnV5u?howf?QK`r?Mkd|%e33QACriLmQsZqTuS0W
zAyN6~ABD%THpt=!o3%e)=GQJ?uOCpc)Dh+Dav`<65sc4O6=V~iZ>UGPjOt}E{=~ny
z9kEpPP4lBw)~3-Y>u$^nJzp0`Bh{$6k9B-2D)wr})d4q4=T;wgLYmTvuWWhEKTU%{
zf%>FBhQ!=P(O|%7P=h3c>&-F319Q2OY3=qxdxE)KHiA{Ynsk9+pr-s}3-2Th9r*{?
z)#lGDOe`B%RX$!=#>|jP2d85fCunzR9@D~8#U)Gskvio)_1U2Ahz@xuO&jwJ^+{)_
zb@)_i8|@#tUbUOF&9d4dyd&7ITcf)Del_9FKJ2Y>>L1kQ-~*>OZziC1^_s|t37!Kv
zitT%ED{oTIR6U!Y)mw<(t-vDmR-EK~-hXF34^+LpwTHd$Bawk5fmk9Nh~y2Np22hj
zW(TbTHe#;2<ULDfQ0eRZt=2aUr4Dl=H~gu#d1FbuRwuiYpRp)lA1SPQEH*`?lH+)T
z9#gw?BW&1HxX58S-lT|$+H-l~W<m>P!KH3lHh=Y$6x7ru1LdAnR+_H{y3ufrD-u==
z(vTB^fth<=;r>gyV{4#ABxL@qR>MxtlRP5N{3pd?GzVJ~n<9A$>ePPXyH<K)PdovI
zK~-N&-FO6rs>{RaVDeX(aHj)V2^;8Od?b4yB|SKxa0T^Cg!2U0q8z-d!3kd(GN+~#
znP!pxk*qc#5-nF-`$;QdptJ;x?a0S?Px|5{>5;9e;K3ps1@$XGOHIg0#|b#t3YW&w
zb0D3K-^gFU$mg6g*?QPe@0Z3v)bm213UYElvHs-CyLfvKQIiu>&zFzdu<mJj5vg_K
z$HJDdd&8p}?w=!ce=Mv-gEQBfW&L%S{Zz#i-S{39`(*$CDLITKc$7K3Y`K7`+yq6J
zW*WJg8{_XYk?(5x5DC$ovX_a#lbB;Aw1!N@4m;q)buJ5D-=)Jq6fx*<jPqE%VR4IK
z(;kXo)0_YRE#X$7v?UIi@fn8AGj=u4j~y+IGYzWvSuNZDS<0Uh8%ZTtXwffNY@u2F
z8q<o@ttM+(!2O;6$d`6fIO;~6K2*7_B`j|u@w>Rr1j_WL`?XSoIL~htVdMfEKIRIr
z?DPfm!1SGB(1ynLC_*9ct`+T0(@8o<3|~D}u-t}MLr~fmVHXM*%Wfg>`yMpKI>+?#
z!hlu}i+O^6gHjQI5OfiDtje1LAiHx9=cxUB=Kw;r*U>wI;6y&C6t>o3t$|&X#I@@9
z+b-l?2eq@B`4(}qFk}+5mEBjZhpHNj1RW2&nAY-=)I|cC-hN>yxI+&G6QQUSHK3Jr
zP>XzERU>kxbikCN8Q^L(mTrM*-F*OG9R((j#=8h*Ufw~0olrB@KLk6`rQcJiA9|t6
z#NO4Q0dTl>a<s0h9H;7)H$JFj)z`_c)raF#f3}m0WREMQEh(NFNKXr^vBEq!G>Gvq
z5Thi)=~=ej)*KkxlTcusmqA@}puE_2;yyh_XT$rs<gjV%h-zcW^J>>B%&wb$S$GgY
z)He<#-1i)Y1aOiahTq8cm>T+-m?`PnUOfh=EPSD{0>MX=0}Ckj3sOpAYm-7^j(%w}
zpB>1x($#=-pfM)_>>$5+vpyB9MSxz1W12@#mL+3Jwa_Gdm8h(>PI8brjq(BG&yyVR
z*-7lPn#Hz{;sor>gsz`B!ZeS?uIaSDZ?{-~MmA8UG8Ex-%&}lR$BU0S2kTB}Mx5rD
zTr~_?bZd)*rHC8M<GLL4T`t%43<wPf?C~vlc?a{y#@WfMmIIzXc$?MMlE?AQw&kp(
z4#g^h=cW$O$}<2(#1_DjFBLnk+9t~c*+Yl}F_#}me9G7ayWOB#Kb<nRg6i!=ff^L!
zco=K}?keOGub%t9GDHRxhiJ&p3jLuAr`Q1nOwE)gk3nb237f7iJrSNK9~;!5>=@*>
z(8gTpW8P_jZ)$4qbh1<C)tsDG$@jWQM)kZ+wtmLOah-6#gJa*jOM59Ksc7^Uca?3w
zd@`kC#f>$oHzXbnJ}ojM55~t)Ft*FLr{Od)F9oxx>K%9TbUOm$be(?o5Vvff^n#j;
z9j`y-K1v=(EiiDuMi9m2qc$aHArd|XE^O8=^bJ|fL_y<Z!@ad<WNH03%NG{Iu1$xK
z;hvg28U8OTlo$IvOF-h`(2Cg__-@P+zYo^Ww3OEs_@oB^MYw8wK_0A;H%IAreIC>y
z@CSqM(dz$P%qFy$ZI^3=&|6M1>2S>3y?RrnGI2FQ*&#PGzux79_Q<dHfvE%`jC!1c
zdeL>gTv@%JsyL6IY}OwIl@X(4Z29hA=+-G<J6DY9WH~T!!l;YxdNKC8EA#BU`p5|;
zB*Cw%RHIckKXVqmc_b^Q#Z3E;^1@%O6_F<o<W+CE%n}jAAD?i$8eDmFCQ7bmvI^A*
z=q$6!|JFwk4M5LmBR@uJ)0@hcKt2{eA;c2&ql0Nant`a-7MQo*NYg-3wxg1C|L^|L
z+klkSNI{m&^wnMyTOvNm$H<Kio(5&gDWNn|^Wp0DwmQKeP%rVDgZEaQXifx|>KSo9
z)sbbJo0V(4%qHI_0DBnI1nscIZU$Q!@q2CPe}wk;K$+4$CMr1%aGbyvD+DAev}V*D
zs!HClDaBbE3yN|OG}j5rQ5?C>7GB)@EZ+#GM&2yen|&F&!opx7jG0wx015j6=T)ym
zvG_mk{kP<bAOYI!u4gQ0u@%#yV$|W-NZ*uNw5L8wH456WhgTecGxOa<J(<mLRkiS;
zH`076{yXK76F9P&y%SaN1ETGw?e7*Opvq-;9Sfuyel6A=J$;my80$*j9Wu83#iyMF
zh_0`nAhDt?xayPkhr0Spx)_B_pmQd%SYQK*RHT=WiG|Sdj>XcW?vWpnZAO}yBd~#R
z=kKvLmvU>edPtv|^ELQhk(leTNkNlOe|k(G--7Ut_B}mg=#gTA3_715+w-#eK(9R9
z@~QKWk;R~q;J$F)6fl(FmAx(a$t?eau8#bTSRyXaLopa%9-u!7?V&k1m_Y4isfYvs
zkBkZwwjI9jPd>J+fP9VR=IT@Gzc{tTYS^tgb9~i*9(RN`AXfP2?9d77|6M|fo7DZK
zyiL*OjV7zbHkn(JBz;#zYk96pOb775Bj2KF<PKHLE{gSh0y;+#@|$QsM;BQw8SpO>
zn0xYO(xUJRp6OWllbRdoLNJjUK8(w?P(O)~`hI1!`;?QuRPP%RbYTyi1t(r9t?nX`
zZ=)+TbdEN4j}DFZqq@C=4m0a<#h%_NqBLo|?=q1+VzItJR%bZ!UU4R@J>h;QJom`@
z0^zpfU6pn-ZFK-ejd9&}wu6U?3iJ6XscM+Lw3N^}wBtyX1p968xAjK0KYDc<eT8UG
z>@dbmN)^M(g5)@dhrguU`&^x&hxv|mcfAKkLLR{m`7bdL_xeYG_u$Z(;?V5v=~u~?
zq01eWq-zK!#-b}sF)8Sn9YH^lP132uKR+T6QO_RZo-|X~)A7<N+`MuN7$Ob>m@wp<
zrx%Vq3-=f<&&KN1uSUtMz!{^T4*0_%+uuQ|4~D&T1j&J;w*PaqV>XI}-O|zV+S62g
z0{D+=r5W+a*&gAQGXINvpb#KtIZFYYIO@6^Ovm#JRAi^z&8GwGcBwfr4+T0RPaH!q
zc}N5ZaLQ(eQnVMLf2=smsPho3_~~yHn@8-!uUeh(P8TxzNAfDsVjs~hr|4Uf4IMf&
z<uixRks{PJQj_coIPJd*xGs(h9A27O%=yQ0L+2#sc-M_uFCH%E$fMdK9^(>xP=v_W
zD)|R3jE@(ugnUkFfYPxrktW*3c4`#rClRolRLM9yg0At5@?ik}9R*yXi3nD8rANo~
zIcCX9f>sGKXo($#PgG`c^`JT*BMy8wV7I*l2X7}v?5SMiw^zCNCnv9xg8Q<o;`m-K
z@_-n#UbgK7C!fQBL{)?zBgSlRG5OEglVqG|>sXc(d-!}EuVFUzN4d6TXQ@m6eV7)<
zL#yck=Us!#?uWZZL=aVcyC6?U=jg<H4xM1og+Vc$&MPd+;5}O(D=xUsm&*{8+<H9h
zYAr}0&s+j^=uKhhcZLDWhCv0pqa&>Er(3eT)IH`ZicWh10#6{@ivsL#F*O40{o+M$
z<eOVZsP)Lp8FYRcP`=!|e;c|WY&`N}DgTHw+1%2w_*b-0B7UDC5YJ%se%#K>lS3Oz
zGpc;hZl49=;-CvCg{R<!r^){ll{@ZHd1o<^kiiw3j=uY6Ec%?6re}^XP3fv0HA#Ru
zV>8NTC3~8qsco_)$%|4bwR{R>7mLZgz;-Q!0aWe&^1xMli<S0L&|ULJ(&4wF-4^;s
zqZHUJSDmUoCfhwv?CxLJs^4IfpQY_l>zr{fCD11X%6=XmkdbEvn1kC7T4prv$_k<&
zF$PdX&t%BEoXqB!_KN#XJ$qUAFmOYpLJ6Df{|1j@fDsx8{}EC^TjJhFF+oNhPfN=9
zy$eqk(;e8VwwP%B&?!-Z==~vy?sgy^!WK%F!65kl<*D9J8Q#b)it2dEBkhcdBnam`
zE(vycrR3SYF8zOf8`w*W9PUeGuaDvS<qShQ$HoUMvFjEi^@=_$emDf<W1s*u`Xa+o
z+mrjY&P3~o#Y(JG)HA5i1`B7&4n$sVl_K)_GQldM)a9T|(7`$JFe+r)OP?hEqx<zw
z{lgx*W2CfQEqkVH9M^F!!=~GLmV8>zI%%@wr`q1>s$7E*VGkZjl<FxqkcT31BcyH<
zB}T}e%xKYi0$!~sbpAd%Cy9w;E}IyBc}e71bFCI#0Ui<tu;WQCSLWjb$I0v`ta?TD
zqm{9B{YU)cz3)(*r*Srora{F-QYqKd8d+-eCFGvh`RV=fHg07TL%}s9>JB_Gj(FhF
z5z<O!LpbMfJ@ovVC_g*n=f+6cFwN?37uc<ST3ztbKt0<G@_Dp8>yb-EV<~_JPlY+(
z{M(1be`p09$uWwN_h_epih1lu`uPq$%pnjvWr$S#$Prb;+mhpmNjZ;$&=cog=;_Zc
zKM)RGz8>Vk1rqhe6CUBPwrJ@2_QalmU=whTZ0*9$L~2yP%aAK#aOyA!GU-nqj)Abh
zRskF2J-;W)y^$-f`!T3J8I;%oyA?~6=TCHw&T&oX2tSD3!CW>n{1OmwOk(ckNr0P$
zc3p=ba~L3Zg>KKk@c0=}*{EuRuXy&8zRNRD*rCn=6{w__A4xdA@<vh#*jhn^`tVKf
zz2MR}g!a-dMQH(OQR+lC;#3(yhEdCtfME3gnqY__f~i9%n42!-;{IMDUoq$kgfIRP
zpZa|$srbi8nZ48LU^NW??KW@2%;~MFK@I#F%;(Z1ulFT6#1;y%&{cs<ny#UDGuB>^
zbe~X8F)9SvOE=b@p@jw2K}ibqzuRX<F+qAr?1VyM=PGq2YJIP%^WeAXxG%5LnUT{0
z`(@6F79Z`p5wBpA-@iSjpuqA*UZGgnf9b#6n2`+R3QA@}2AT}qq8aCi$8U1G;tTGB
zVt6Hhh5fG=FJa{(^7M$_F~ww(gZD}S0vB?nzK$*h5-;pAs5H1X$6G$2Gk<@>M-Hin
z_!y~cZ}6UMBKGWE+^dM%Cqodq0o2vSE&=#+Xi@A43rgWaEXei$2n#a6^2fZ6D9BtU
zNJMISBjJ@*V~8Vh%4Z}HqZ#P^O-2g<LZU#J<|t$FK#YZ=2LweeLU=^IDZCI9?xDEC
zp!=9eh)ME@*hV8z)YHefWqZ}2&<g({c{J+(hvfg3*7=9z(JdmP|J$X!P8_kPy6-Q<
zUn)Ur!~@Ec-&it=If1~h*h^{rnZU1g=?sFbmh=R!9%#7FA6g@oW6x@F==yh>)`%P=
zK=}Hk!3%EhrL+G3slyLk5_66ie`VHTAl^boy$Qf6fsD7ml*{JI@Ewo<E7IOsh#W#$
zgKAis{t5&Zm%iTqo*>)eBk!IbTjc%QrexU+Zlz&!JPM5A5iQu=YTmV_aa+1$?ZQzw
zOyU6W*n85M(A^)g7+OeCaDgax2GN$R_D1ODkA$651MCi9o=`F9t!2BH$IA(ttV&#d
zJ?9IR1>N>vLGxU`Hf29D8cm>^Ki(7j_J3dOPx%nJLJ7jM%^4fefErm0s!&i7Zvn#i
zmM%0vB*lpY?fFDTc#z4uf(>#*r#v~-^BVCfIKMO{h>DhI&VUK6_W6C*vTx1I^~&a+
za1=mYzlBR+rpV9^z#+(dZeex%(2zy&ia`eSnc}}~K+oAp!bMElF06uHot|`7KY)`+
z3*jX0J4K23M35mu22v&W;O+n^wn&nI|9pv}vGZtSltoLTxUswW`9Od^!{@XxJlqN@
z0lre9on9h}2-3)J|E}r#Z#A-I3}}g#7X{e--=*r(L&>dhtJrEu^8+)RE`xsMRWL%C
zSyK#N#ybn^Jfs8DguUCd`(L^}jnDptHe)^MwxF8J215D>ADxFEjZL)pz=82P4Z>@A
zpin+r&u^;xlc94AG-0Snba%ZOx_sGs0--rE2T&dMrlwQ+;dEEl3{-H&{+!6wyzf{B
z?jHuPm^!`H6xC{>x@9rPL~A7uYJ@;UCo|gK@^=1U>$eWb*yB3NBx}3V{W!6wmbZ83
zo0r{jWJrmRJ=d%gJ)4}BbVt{(RD#={G~9?)<@<#!zNcTch;%=kagj<+6=hW+aUsV$
zL2soo>##fP5Y*h~V7S>&ou9uME%a^HwVZ1)E^4eXG^Tgeo%|S#NDO2Dzv~Rg@Li`a
z8uzo|dJ+cE7HCPbjWs85KnZW9C$t4Jl_xRbw2v{M|HMw<8eOdvKJSTqN4_^~Lk|?a
zF0udk`~+_VfY*mZ7ig+p;+Pe1=E~=^%*m){&rZC1_YQYDFGYN=s7L@BlspWE$c98j
zoTd<V&iRnrp~eYn;uPHkrV01gGag=XBSniS$BnZJX#v-8utqH*w~bvq!lTw=hw_!M
zJdy4cllv>$Th{)6uR|UmFI#?*GZO);#Pyuo7Wdo#4On_MHg_y?MV3ft*%Jw%uU>ZD
zsX%eNZ#g;v;Diy-zDw9Rm0LU#p*{?{c-u|77M?N$1_Pvz9(6F4+A}faYbiF1VMf`8
zN#W0DESR~it#_T)M<VsX7*~X|x_ZoXZl~5=MMXwXuZ0UM=tuby(#$C7fA+>*0Oe7z
zT;mY{^b<UlS*~SKG{Izk;u0tgwFFppJM@CnA0-t8$@VXVRuOwk+{z`k4({cPhv+TC
z^;Cb-7QLkEPwQx+NgjB7|Bw!^PYeU``h*cuU9i1Kodm`V&sfD_Jh(6n%(~MpR-U~a
z;&W{$Jo&h}uiv=g=imo{?(y$#Emn*0WfYD^Ka|1A{{b*#Dc1qS=dW~f3j<KD9n75I
z+N!Q6gS6jVIsG9viq|~4YkOh|ls7lLjj=eJ+C%H8r4`TqOtmMZv>X5s1uvVeZLa+a
zA~YuKv;rvfIGz)J(|j7DIds2i2LscMjp*XX{+P>-+DqNa1ber6|G&P?Tu;zHw)Jru
zpvDX^MvHosnU$@NA~xQo#9!hvXq=011GuKy8<S}+cDuLUV^@NKq?e#U*}IpqmKPSR
zA>vfc15ls!05O2RyStmN!RX*<@7|z|szm9n<X#Hkoae8aeSaKQxy{)|eDH<8U?Ngj
z=cX6Q;Y}g*@Br7KBEc16S2Ev@J`X{4AW86PL^MvbsSQ6#1dvKBfDXJI)-4K#d{UE5
znYrK=3F?DjQba|W$J!81x5w^w>93CuP&VKAYtnk7wzga?xgV(~fI3&ut-@~K5tG+%
zuO21hR<s55Mr3U4xpja?fW`2*IhOy2dd)WtfcL?vU;iSJ_tHM&h+R5yo}nTxKtw6`
zHj{|q+Vl3uv<2Ee0%)YO|5Xf3<MW9KOJT<JVn%T*Po%Sl0{#A-!fAuej^Q&GY?Hv`
z<7gc<HRE1{hdV`%0hpc_ptiFkEk7@>9^|G<Lq3@YL&KR@A~p>}DPRtpKy7B~gRwhW
zKkmp-F@ozWR$gt+$;qh&1Ge?S)Ruu)pq#%Rw6W4XdGbUn=9>mk4Ax*$pD~XDyUItg
zuYpvQZPM8Lr+i%sF#s!c`DE^)ruWmvXHXp<?zyR-%5b>O!%xA|m}l2I?zR30e!=x@
zju%!Z5E!SOU4W3YvVm3MWG83?fbQx)sD3KR13>G%MA<86W25fldP2Rt*#IHTNk&Oa
zi{1YId}t_1W|Qcre*4}!fGhTsr`Kw&?cKdn0j~XH6}yDDbiSoO%=~UOEolPR){2Q3
zQ6GmS)&7>y$qd0w(o&HhAKK9$N_$n@s#Np>8Wmp8d+bBn=Z@={B1g0Z#LWvF8rPO$
zq1(4_-&IgRwxb%sd{kCo`y_NiGaT!{aJ|wZ!LUo>R=ZA`?&~AgUnvX=e9v-<8h$(1
z4PeMhR)AEN1(;&8ncogXfAA!xAFP;Em5;1h5L#@f_<w)EaL>-Rw(C+-PaKTh0XAU+
zz%@m++r7=pQ<{F-BVZ0@Ff9OBLSvrPTj8{85LFC)eln27rd6UM9dKr-y{f5eY`9%X
z{dNSa>Q6SUJhQ0#N=nXl2K!uzxKI9+8A;VF@XkFR5;o;b|NQ|=6Kw%KM@G5RF#+Hl
z2;Q3(vq20E;4h0hb95>(DFA4ja%a?ixMzNTzO02s2KC*<HbZ3M*URBl_Fdut+kT1-
z8n&e8h0i-T+4zTA#lXZ8r&Vj|rQZF~+=$Qryx+cG%YGBJLWg?S6YSSav16L_??umU
zOuw3gtS1sy`C~j{?Ed}<9E07xC02zy^MDv8|D1MBWOJG!NMs|`#rS7@0+1E4*7X<Z
zrcxw``T}=^t%tAAc6|+^;g~Jk%uo*ceDRauJ{AD44FFzmXpG`2RRm*Cu(O7&nD*6`
zP9pBL6JEZ8L5S0s`D4G=n)2`0dSGk(wV2$+sZ4wS{&jYCYbh&klO+)7oE|${!RB}A
z;5$H5H=H&7Fhr&PT6bB=${-L-T`vT!LM0JEipzoNrp#zmdpQ{P6W5FI3sFJo@jVh)
zZToMf-0Uvxnx;cPBV<CjsFK9*0y@wGV<-rE*vUMR=H}+1k&$Cm%1%y&_m!1hmW{Xo
zymOk+=Jcn5OVAi<GtlRu6-R-7et2GlZU1{0SRneb)M`iqbRWEMiINyikxyVxiL;OH
zbgw2;t_1^@X4+8!<%8A!<P88u)U)Fe3$TR40G3FFsWT80`af>-El&z80?dqtf=9n{
zF3C{Yz32lYt+e_@byo{P3uUHL^)s@&ckT?eGc*NI3#)y2B9|8grVbm2A85TZ!I(pz
zky!iy1ycf2FP0)awD6h8q`*Uq?C_J=SzKVi$lsW<xIq+4TQETLVqZpr@0?c$By3R*
ztK8&+mzi~QQV7_lI^4(uZWF*L?<{eC9R<8RjSeup%yNEh{?`bQBFmHZqmcO~I9u|=
z)CCv-`oITVncRtrKVAueX-4teye${ZoFRNY2wD%U8?V$jHdHkM50UaAo9$T<*Mcru
z7ce}W_s)Tu!&0ii_aa;Z*970AqxJuujs|JhfEM|3{GDCVLOlym&KK35t7U-B{RPmm
z?=;o54q8-e(h@*xnDuula;Ie=)D>0+Jv=gJzJYpwTA~trnVCRt`U26Co#Mf5xp>E)
zxcSA2>!2@L9)Nic=cZ?UJ-YxD?oD_1vd+<jZlH~a=WA$IqoFBhg`f`xO%-8azGHxx
z*WK-Z%PoO5G(a`YnxUY@@0wYKVEja;$F`}$)s0YD_7E_Ey0>=;*pQ)MqWeJFEEvkQ
z&~{JW$u2I7ZVt>Rz5z}0Hb3zq#1m<sB*>XhmA(mZ0sYTRTNoJyhcL+8ynXw5=PtlE
zWd$u&;lsnjj^+Zt2y1#*u4&}Z+}!6Z420tEEvf#^EeYj%AyFvQ0^pBH#-)0wcgx7T
z7=mN6?oc&!YCtubq@^>3hlh)sqX}3dm2k|na#pK1h)Q<BdY4ed4APE~x<Jq3Z<Y+D
zBV(KZ>0u^2nlAcKT3i4FT9TATK)YWEgteR2OCi{^hE1+PTU}j^umiBzs_OuL{Pd~T
z4*XZxmFDGn9&u&~ye}=Vey&igLT*!*Zq4Mw`JfXP<map^j&bUKJ(<Pe-D|wQFk%gO
zp+3j>2d3S2GyhmD1L%FrQo49(B;38VXJbT){Y|wkkD_%{R8$PA>I41I{z8k5T+Zug
zj{_(x(6$|J?QI(}-p<)HUKtp<3Y-coI`d4ruK{lEISl5#Vuf-bjuT?`vGTZDI56h!
zKpG@7gKK1Dgl=dS%(GH3XpT=$yPiW^;F0sF_`8~EIwPReyb?e|2;FQ31UVU*(>9gM
zbe1*nv>_T{c-C7dOsJW++@an8X4+qHa&qdqcIfB@Kg8VQP}tv8_Kq9JE6pDdLA{(y
z3-=Bf9!~qQ9&#9GUeY@5Vpl@IxAg!-bxbo5fUMkuV91@99SxY|<5?jX+5GoZ{hI)W
zaB*^Rv?<IyulsA7Of)p?Tn~7FoFD>Y8EynQz(r!?f*OwMf*+5~0GLayw1?#nCIF)3
zGr?&Q0NXESRr31vmnp9U?SO%3Bdz^1c5+uy;cxm$_XOb<GC5Pma0C#e>u6$hn=x?+
z=CBK-C<i<~JbXm+gy5x>pVj`==8LDLqrj|@z%EOg*1F@F<`}(k10K6>5NybBT4tGb
z4A$bWnxIH<DZE6OmZqk7XPpGqi25u_jK0(JgGnu5a;X;XL?>^bU8klsfFtu^jS+On
zxRoHH387d8>*qZHNQ999YEH_GNa#+`N2=DR2a>-fW$&_Z6#xGAGCBhflniiv5f{L|
zR=aRLSG9@yN(tPAEhPu=PO}nGp2*C|i1_?jLKVd5^Z_Q$RC@;M!l1Utb}kr)$-Dr>
z6ZXbgE`wV-dW+fF*{N<Gz$se*^05KLG8hE~)j@Om=`;EeHf&H46&@NR$?h?d^512o
zzjnwQ;hx2vu}%j9>liHb;+_x|{hJc&uT>?kXYnf5BDxa2wD)9&f1V7vf#?4@jelt4
zw^8{Ir=XkI|D47@r}0<r*FUuJ4{iLPqK%S!AAIdpiarQj&eX~~cg6MT@UUL-?MC$I
zt=KtC6pCu$SE#<Yse!(JT?-vqXj~kdy_Sck(pe<grfZU@km1QW|GJ^Wzj_@j_7=n*
zIAG#d<#0PRL+da=)~X<eHRx=z7d`72pBrH@c~hFMS%|4Wf;@4NwUN*y*%Ms*L7XlN
zJ33lT&q>j)<r#k=|6Tr6)?`nlkRhxe6Wu2q58r$5cMyV>`il^>&t3@n2NZ&yB>-_y
z-s?6t{?^#_uYO8UXxurC7TJcvzz^~6D|X)0mAu#T3>$m>u9i~l9dWC8E>DYN2l0Hc
z%B7pM_dsaY2xKYf{~}8v38nhp?WOu0a4KVN!Am;4E4P0<9g;lH%-lP8>qzjK9`3za
zWM6C&g^M7MzU*jkpQop<?<7iGL=oJy;w0-ay?DBr0&9WOy5;bIE?x+(0|CnhaS+Ou
zIP$dpGe>Zrf<oERP$=8cfv8W7HS;~bH*Z^GM8Js|lgmMe$1P@tuu5L)Mmmfjv&G;-
zVbDo`DbrTLI*gDb9ATX6AT=ZTH(tm2!wcE*)ma5+^PckH`P;XfZjOeNk-fQlS7W$6
zO8g)l3Y>~L%w_!NcQrN1vp;_PD0Wl!gcoq_87Yb6Q|fk0s%@kNG&R2+WFEv4%VC_`
zU=4Erb`2Pw(3UyFz#6L6#)Et+tDc{*=wv);LH2V0WWctbvJzd44Y`<%NDC0r?Ft<`
zshD)_aAk>xm_ml$MZ_>do}|O~AO0Q#kwf}13Cm$GvjND;^m=k(p_IwgSxo`UveW{F
zdRbZMnoV`l(ujy#<VKdW!O=y|#%4w*WbY`cod+a__+DXtp>G?vxDvxMr}^|uklV~p
ze%;5~_X%hY4qqo6Z!VTNDwft!k22zbLk>v+q=tAQDkuHDoD&V|q@Aw@U@CxvUa-H;
zLCn4K#H?#*U_3?rN)qdU$HbW6T?*2srZL>Sd@?5=tNVWb?0WG^xu~I`Ar2-|tw*1i
zC_eDsYeV*UuGV=I8@a>x)ty4}Gl<;wM9%YPoj!QpAvu94yP8-P4!|&VkmcJl8$-#P
zYj$36PYXKtHs-B4Mbl>=ZZ)-@)|Ec~D`=u(LycBcv=a|uilHG}JbMezvv-Uwo@-+x
zBiZBNTL@e7+P1Nit3@O*2cDNQXcuyDShTmXxraZbq}b&*F3}d`J`$cTF>P(>I%lV6
zmHP(miZKv6#{@|nAKekJy^cJ))4}POw)Ad3HbkT|l<Sa2uTvpzd3<YO5hv1MM9%~r
zri`xZ9>b>|zi86W*5C3eE?+c?o8Iv%B~O-|{XpOe3mMcszJ4DxKl&I<0^6*j_;rE8
z^aVG8jePSTPQ_A1z7>j633N-{pCbgCZG0{rhC|`BMCy;n0(2NWk(JbKX!MJ=0NG>s
zRO59()bK2s$!^zup)KIaW;aP@?=hIdf6m5qYG5)wIRh<10jF&toB7t<%$59j%q7W^
zvZIBlfTz`&$!UV?iLhZj7w1I1O$OR+6MbwZ0^D$u<lk{ai^8Y)mmU3gz2JFmG@i&I
zth19HeLYO5bX2QBqX0@i<pg@jCzv0TDTq$ByF1j>-Fm_LH7y69)xz1Wj+Xoml!ST1
zxi?)jS4a36!e)+tBRjm=2#jWmEbpQSQdm&4U+$kC#+eq(vlm*zS|D++9GCIfC;eSe
zPgl|AuZ-j=`_<3q(5N+vLC34#-dYyl#Wc#?^XHBoCO*XijhjJB=vctX!ns(cgYSw3
zVfT&U_4<jZ7wEqgH6((~&ZDY*4o?W})5&wk@XwADn}W;m)&ZB%MqIfqmuHc_RFghc
z!nPf@vC;ePP;Js)4#wsV7!t)X?^N*7%vdbC)w|VeaJS!0uEp@A`H!OI7T)sPukCl8
z(Ur`Z>zFfKUM_t-8O^8dqrOdXn%m?zym0bFMp?h%mp@>YgJZ)$1e~73!QQLYU>Ky&
z2-9S_D{M{3dPwAAwA<L+-o$CQJp9(aU2e5`QZ8IJpn`|?gr!qYmtB(@ek@MwCXk8G
zbxD6fptJk_0aQFDZ=prRKZP_-!K61wdp-Me?o9QfhTP|9EP${jg_9Rp_0l(`#7J6x
zt8ue`%AL7g{6D^AmB6sn*OzyFvB=_WIINNj^~|Ph|4ry`r?`kDJZS_K)yS0dwAE*j
z8Ed&%MVeBg7iUZ`A&+1F<7w>r!-oD=&8LQXE~Ci<+J0Ey7+jbypRKhdBgU9feC}59
z&sdHFA~<}bnDmJ?EUZ04X1@Qd$!G>uMw8|@A+&Es(ISs?F1c3aPH@&+AogBWl&?d8
zcA$+!@YP$y8EjnK63sw6r{c2x+0Njv;~tBOCEDemhsWDT#*s?=nZWz~GX(eP>zlM|
zLG4rv?XOmXWv^OW<pofMkhaPlO8mnuU|>#MfC>%x_6iN!(N*97e8pXDT9g-3zT`V=
zzQ{eAm779aoj2>gohW`P{U^kB4Ay!RGW725ozHv8!+7ywS-`=k*JWbTIF&R4nRl(T
z@9ok*^2Sm}`p@=C4JzasW`CVKcd>r9pP5KRyNk)c$!K-vesCmXxf)-y`9tc%qul>A
z2kR@B?~>lzP>}y&WOx7fhXPZKb_5&lNeYu+kFlktL4JON;#}XDOuSdHRco#4(bSii
zca0?y49c@~Z9SKxnuHrU=&^!CE9f{p#>b!>s8_qw9uhWGhY68Cd*$-)S8f;EV$cj>
zaq!jkbMQJE21mv)62@|=WV`Uu77)Q!ucMhqPwD4|_{<k7JIxoWU)ireP%UOnGmiWk
z@$G{8M>u%Jb*f{V=4z7lHhRl+{0pB#__OD`G`fv$&5EeR2^e;Y%Dh5Y_80$VMf5U~
zgVR5-B;Ij|fo!1T<lq~uHMo4yJL$6ZtR_J(whoS98v^$EN#Qs;_`p5>Jjs39Xw^n;
z>QgQBdBlvoSp`<QxywevWkV2creIW1jbI@CI@a*5{6g>@$+cv;SLE7QgGF(FZymua
z;&U?E<`GfN?Y^ZXe7C62C;NZ_T|Tm=0(v*X*RSZ`)=YVE%AoF}csFN`P;Y=yd;TVY
zODopLtc-W}PP3Ww`NZ8-?4>K@r<Y_YI@x(9nlv@#r?DcRZT$mfC2Xpm7g#s-d!H|O
z^*DnJ_W&sm=(PRgvRc&>^Rj-pQr=D$+BUdX>(_Io0u|Y+@Uz0LVoE1*N04ZNFvhsc
zd{Kg5&zJrp%j8I>#gi$a+r8X#>5#2)9$=6kQL+De%3_mvul0#ak_zu>Ih9MrZ)*Fy
z?zow@r70Md890VzIb{zjJ;{C$TBg-?{P9>x|G6_yW^3NpGR%dOjnoE~*G6jcu>^;N
zZ&RM|FwzPuS$DEcOARJIZBZ7O)n9b^b8BrAii+N5&^(0S;Cz*QnZK(Bf46FOF0Rt7
z!O1YYZF(BThqBYcR@<bNG!g~7)0Gcr3kT$2l`br`EBk^+%o(?2;X#_lu1XwtUf0tU
zxwGqU1{fd9D8r&R5u24KUN=vH(R#Y_0}bxu0`is?^%o$UQ*lqPDEgww_y0-$*WC~~
zc%Fl+cf<Mw^OIy2ObMF9@2y-6$(4?#OL4i{#G_sA-v4X4wP*DB<%bTu#+wiMjfy3%
z6pp$_z3tazo^|~my5weA`T!C8Nau#cw)?zWv4*ur9INb{>2$tIxtLr}vC7S+)Twuu
z<5rsmoGiujCytwr*6GVcFpjjqJ(-_`$n9GTh#aDq%dW{nLYdzMBP+sc#i$k{f6aUw
zGm(o7r7LmLyymK@#~-x2X`y*uX8Qi{wtDR?N63}C`!^+}xhIm1$<b{c6uotf^;h=B
zFC-Lsyt~zPRWzwdu#xgp<bXEEqNur?k)VS<<+XhAp-^`?XM(#+x@+F$h1%YkM@*av
zMnqd#ozWvJ{FTW@%-N!XJuCV$FB%H8yw^#)wO`wzwjGhxisJse1*U#m7XF@zdGShc
z&(-^ZsDn)|k-Xed@G4nyzlVHnrt|_ATuJS<V@+Q2U9T17`ZKSR;{Fsd1iL!^H>I>1
zta2(^K)*gcH`~Zbz4gm#cYVP5T$?+{hEQEQ6D)G&ZyAwJG|NJ;jLkD#^vW4RMYm2Y
zEScZZY|S4To-)+~P<ZPT-<e2Y35)ihG<L5wOCpP!OZr#~N9D;lO^ot*(-#(&<<&=8
zH%+`&TxyKHUT1Uj*IXkKdKz(JU#|v-U|PUSl0W?rD%QJ^vYt@hmSnq)QZsbw4DOvA
z;+U_jA-FM9&XMzNJ49gBH;_Q?jL^m|qX|;IbI&dM&jPxY9`61t41b|fT{9WU80NZF
z;95BMvGt|qx7Z&Sg33C!6{oN8J<a<3Rd-?dCqw<i58-{)GPg4$^m9>lsJ5lkmPA`k
z&FUksTs*ygl=8p)>B(BS%;EJq$Ef}I<nqhR4TsW_1@ToJEG3#y7QUTA4f55Z^Y8&v
z34sIEbUdfx!x-hrkdtOJEfdzvZTpUG{FegMePBv>)tACTn$~UiS}iBfO$&38zVdr_
zR;vxakpdT=chC4qBS1HJ_PP2%Sp{!kVu`@ZjGTPWtp<^~(U-1FI&p4yjU%QrJ<Pyp
z`TKE8+X+S5fK<<mPHan0TD9scwzf>4zfPb2QpZI|d@dqSj(_Vt*^R;7m0x(nFWh8F
zgnkZWT96Tz6x>v6a+<J3+DloF6V$noM$;D5-#tk1MlsLT`=(pBduh_V%3(m@w5CVZ
zR8T-ha1tgHJigT0Xzn7;i@H3@ktZ2pLu_Z)l#c&BUel?-spKd~liS%;lx=<E`(mV4
zRPI7#sDwkwhnD_WYuR+y+*BT0aSrtpi=T$SUG#c=nPX$erI6Bcahv@^=t|%WGCMyp
zl4~ATIlCpFEVSfNM|r1TczB{lskSF=tl+kr$Znm3xitWxPu$k9(Rc#Psghr`aOy9z
z2O)vlGl-tAa{Mc^EU&ZP+{2`ptFS_TkEfWPU1JS$^+Hx{S57hXYtiuHSa>{Z98|Or
zb_#y6{Dbd_ls#&Y5lGME-;T<Ev>lGy5|xxn>XqX~*1R$E>L+!N=kR)#JyNWXT7YbX
zs_eXvy*)%Lc3~`fDo*xYBRy-QW9io4g*6%GjnxaXKU|Or>@U6EK@r6w+HPC>VeIU$
z6G8GlWhzW^7fyES-|aP9dXQi|&(Bo!O9f=l-^%e1FT8)*Kl*akAwI_~#4JlIKIdiM
zcCsaRUBfJ2O`pZ~cPH!hJKtsOg1T>bvh?kkB@3-MJACZd+VzOL6QaZMU6~n9-S7Km
zp9;l_PV_C^_kvWbGQ7_<_{a8zl;@xB&Xz4WT8Yj%*Y<Tv=B-nD;(N{JIVGLTcX`AI
zvl-nL?NjzycX+4|nf5lx2j<HDLk~zBkP?=Rju=j5xpog7vqm}n+Z7RYvN~cx@+Sda
zooziA^M(2^?5<meb^79;({{U67(hwkvNY;HlODz=>MwG(5dYYqv$d1X`Ae3}22AlG
zjpmMSqwnhQiHd6y7jGMIS9)<gr~aztvMkhX>W|rfe#UwjX{KsvYw=|{A$pLNPgIlU
zQ6W2=FMG8rlQ&Ai%`1Z>YisO9<=s0Eb!pQK1WcTBS<}o{?eiK8o>+gTu5<gvuR&B&
zKr1^VZ2B=@J1&dn<(l)OVpg^9?EaAs*L~jwX|l<5aIUVkWRKI>w}_wx9yTD$Yjl0A
zC}S)kFnn-SchQA+dYl8xZ|*Xxh`OO^`3v(f0A3$=7M|a@9t8I5)jQ!MN*H=a(s2b}
z=jHDIg1ri8ZtJ&9eic-!c_);?Azq0XE_1EuT&7#=CFR{>IkjGakuAvvy&t)Y^y!ni
zd@)4puN#!EZ`Nb@<X7<7tcQ$b??fkwk2`abtPCk<!l!@a-%wbN{&h)j`e|3vQsQ%x
z53D@NFKC1roD<zM+5CscHJ_18^RG;%45+ba@96lf1#;ewRWOsrA{6Cx7V4$h?j`A-
z>h$yNN<Me@i<JMZmW=`rn7WpuN?`yExijIl>GOfuL!QVLt=+K~GlT^9+Z}32ExBV7
zn6e)1THVvKh}bI6T^MfLzWL>NUDUp^1ht#WIvtD87v@U7ia9EKA>X;=oTC6*r==WI
z;L=)|dQ9ap`<pw1TpO#?&SehxuBL>4Pis~@Ch!!UyBXHEEwMzL)OjwRW%p{C&}g`d
zRwte8djY-e3(3mGalq#C*I3qx>pjIO`awv>Lhy~?%PH*#U#pfmS4#~%Y!uuSOCGE@
zh1&B^e4R|(-eB=X-Dlmjq!I~0Y4Z&@+qtEjvsYXSsWsPjh!at%_pkDOq3v8Q^;Y!M
zwm^V7oAS<1O4q7bNez{GY4>RSR-}!55Ai6Cki*9h=bp0myv1e1BZoQ6@@>-ju~4V_
zuZv^%zrzpFc2s#6KrxU{Bha#q7K}R2ZuNS7G-?E3shh$30{a@hAs!@Bt#DTdysI2-
zsa~v0=Gv<^%y1)pPrUt2%?puQ;Mm!b5M|2bON8uAA*u$~=Je$GMEhywn=GI8py&io
zHHi005y*SY*~Q!{{lsKKGnEm-tW2$W+AeN@eQUUvmwz#Eyyj88`<v`-ruEW(#g>)%
zfbp`SmqLY0Pix0$W^1Q|wsJWqQ|H8SI{fSF_&RGntIf3t%hfW)-paAgPu4}_lEbv!
zu4nXJF4QoH?yT0$l=9H@79^llD_<D5R&}xaj2v<`I`Dxu?jfrzdxm3Gc^)nfqRgpS
z2&>&yT5o&btMS@Q+O(^mLUc-|3=bRlmy)vcztZ468`ftzIa$_uydxI0&ZOo-tuz1G
zY(7Q>^O(*xD0Gu^yEVc^cquHMx7NQ<i=HKR&t&|_GszT5rOHnEfnxpn*ADv-EOs^O
z+@Q}}tcAeHztcH^`kXIf8ICvm?s-p>ly77MlP*JoY}<1N))EJcu)fv1OT_(z(F&}-
zW;Fb_EQ>|vzn)#Uzu~YZ&^MEjph0JP64m?I##}e$oU_y%d@N-~`w}UyoW<jTc<ln(
zg6$SbeWyIvb;+eo&e)(l^Nmlg{JX(-(+^cY{Poj{Z4RC~VH?UXCy%qop$x8B*=U@#
zc{Ba2_~&D+OuQY<xn05FurRVUg|*pyjtDO>eYRKP*_O@Vm~RqrUqk+$+ju$A3z_NO
zcPUboNVwudB=Rxp+3+gqv-8aA>dwm4uEycqxdqATPgWe7qrBd{ZYjg3a1vO0X7bLQ
z+i&i|56u+9h=rfy+t<2<MqfpW7==viX80Ek*fHO)9e<!HK3UP(5>qvSBGz=2k1JVr
zl5N|Lf20#-R{CIxXqW8Ml>UHB)1A#IYq57`#dj94x@Y7PJW`}~<{dvK<IneA_Q+1L
z5}&)ic}6vgg))Z7L&`XURjucNNJR^iX#2IYF$;dD;DFTYt$2*B;@=O8c7uZ}s#n_^
zw&Y{p^!rqppN)lVcrn_yViD`3ER@G*(=4Z+IbmEZ@C3xv@;7}jKunqMXM-6s)QIyJ
zg0s)@|EeHS^{}0l&dV^Jd?CqBNWI?eLF81Zx`1r!VsJ{}|D+_c&b|Tv=62<5zDr4S
zNjEE>2$`GSvZlN0g;|cv$9_)Q8=Fs^i0^v*iRy{-GF^9eKht{lh%=bG79SLKhl(fI
zEa*FaVsXv%w?RW`nUc<cz%%AOmNE4Ft~IZW(w3aNu^rm$Jjy2t@-mC1<29UYRWmp7
zJH>^>ttc^e7vrlDL<QwRI9kS`#oBPoytKlOn%#`9a@@lVBf|aEOINq&tQsKHY))ms
zZM7&aX*sUT6{bJ6(|Yd1w$Q`t#Thl$t_7lwZsX-RJDhGiZY{KHXC-Y$HtI%3zq|zg
zJCvsIME=K66(r8p2aFv$>jbrJeJy{{4LaV6KW89OIkkM5Xs0ThfPbfG{Mb^v?{NKd
zkHBrFU+skL4Gpuavql}CZeLi_CYGq2cPyGR%fEquES$!W78LJ%!22C!VR&dK4^d%p
zOyYXsY;J9Uub0eE0=3Hf_8U@3u?5P5Ph!-YFnV#c?=qskjR(|B-=%l4P(_Nqc-^K8
zYFDjx<%`K=sE&!=J=5p2X&9#z^5WNP(u2qxVi<mld+>UjQCUc8?i*eGirytkxbwZA
zIy1+@epMgCnem#-^eQPayU0nSSKjQZOCGlE8oZ5@?D9L8wDJHgYWXLQy&d8h4QzKN
z#h!m8;;iM1$!isz6yeM=D2?-!fj7*&=QzqNBY#+=1s0{{N{`kBh<>HU-|%6k9PZAK
zezn5m6hyL)GH@fkkS7@b+bO>?dF6a|OW>)UNVl8%Y4{7TEb<1QR8~${v4}dm>lchB
z<|&I>gg4Nn;+rfgyO)Y1V(k?C%K43#*AsH<t5=WHRH0H%h9-@4-{|%2y^}+`mSE2k
z((ggG>27Q^^WsM2lR&cs-7<mAq(w)szGZ`hIO4b^qBMn#@SG>UC(dyUzTCuP<?nty
zm^o&N;W&c>{hM75HU+uKXJfN?2(lkrqQH3n(YBXm_|L|>D^VYb$A)H1tZ*8y5%=h|
zaVTcNG<%1YjFI;yv5WKW6fghkx9C(B3nOW&@};L;;&Z)Y-1R^K5k8>FvdNk*R(#O5
zy=?G6=)qF_lE<jH{+%l1Sp&Z|hZ4kaez{S2c|X;;&nv6zi;vb9@~ducH{D3vl(DA)
z5{EDDjLWsPcxtiNv}?wjk@fbJV>SIKeZsZ|QySmE>mKD47n_c6pxZ){Vjd0z0r2><
zzF+P@CO4J@Ek^=vflCtL6!X8wDPka8z_zH)bkg-fz-6nPh6j>0GSL;w)as{T(p~;}
zGgAq9^>0?C2&pZL?8{<3jHZ$E<yvMhx;bPBJ!!a;R0z7uW<8P0jZjSCi4P)~;!E-L
zr0%6*!(?j-B}-0iQ;(19&YMP%K__&TXQj4{#!XigP9*%&QU=J9mtB=xMm40yQQLP%
z{6;mV`6p~E@}w4g2TvLEOy~o>g>TV|;Xwbx4Jf8k8%hb@!Wr)q6vC`aMNd9lKMa;v
zTq350m)(5X4RBdsCt--sA^qPYEY0_NKmSH7feCK$&RopptE8PcqVF090^e%49afP1
z{K-};4jbq8pxvF~opxtzPP>OU+U%x3Z)#hFx@eum|5-#i^GPuT_uZ;ys$)<2<Zv8^
zdY>kfxx1BdV52}f{p<2cA36T%`f>3&N3W&?4zsX}`QX%oC_-2|sXO@?Y<+vdU}Y7$
zU(zd@!2+t{b7KP*5mWK0goPqwG-^yS8FA$383D0fxDipwo5E5Lg2$zh$BuQMwmfmF
zd+Ylm3(h#j`PGj+bLpi}Zj-jaJbyX5Cqw+CbOvwR$wVSlra=$azl}IN7SqP-TD1m%
zcW1k9JE?}~fyDAa!+fMYwp);ltT3;KW^ZmIr{DxNldAgWM>FnZ&Sns3u^F(KoY%5n
z*H4O_EB^VkH>LL}a+cjFjHM|Rnfp9MlF{CFMrd)sSkmTaB$r0&)i`Nb`L9B0r{VUQ
zJN^E6*~0^$NGPKOe>R<dAfD}sv~;tOZY^iFwcX?*U=2&>I}fKuBpB?AN03>!#i<lj
zS}*IS1C}gE$1UJxWBJMxl}ugQ*u4b;yC=zEndzpdHp$C~t9-A^$wf|xm2q6P-+#b<
z`1sJ707{w)*3&CET*KIKt5*H>2X2rkcYaW&*2d07{VvinGROFy#0ZT&YXnx_#goNN
zo7(wxg$~j*2<NIRPSz8|`VaCQC@uMtmTR=82#AXtY<Hf<`Rfm+f2Q%z_|cpFF8AJy
zYuTOn=s~JPn!6DUGBbD2mtSU(j67}sd_`}D!pT8At#3}nYwJEK|J51l=Cw!b)<X~8
zSlrXms$!+XQ{o-gGpv&wt0uT#zAcrug_>!({Hb@gx#`LlTjQ02sU_Q;)QR@&4|%;0
zQ?yUj`?*N%(2C2i{<4VtK)c2~m|GXcB{{3_iOk?VD0&v##T%df#&&yjRc<q_aNCuM
zk)RK!gka5qcC;KT08YKN`v3?_rSxLJdyblJVH6Z4_k0MbSl68ji}?Qo0g0Z-$;qp0
zeWPe_evb7b+r?W!AfFn)C~6ws8*dy;lUC$av|~r#&LL2u!An88G1@^snBQQWuPD>Q
z+EUh0D-<<f1B5AMyjif};3R>z@09HVHRD2W(}~Y)H=SdI^Ifz|UZnHYMh<S3Z&jqg
zKBK+_V%m*(EpyH$k6QUl_E2BZuIwXYoYl%1e4^NDF>oz_x0>r=XBtg@{RrVTLeE`i
zFHHWa#89K+$?w_Kic||JrphpLN(<OhB3Y=y4JD$jd!#T?FIq>E47lb&0K<)i=p4);
zG+~9@X7jt&Z6C;GKy+g5QonSm*eWhq7?hNT5$^0V16MN*RI-3rL0QrbKvMd1iPje{
zsquIux9Yw|OI`j65yClIy1G~uSxg%FiVSYtcocoSa=A@={iBqHThX2OQ@;qkcORy^
z79t6g7*svVb0p;oM6Pb7ZGN|2rYp4mmC%rTHmhVK$=PXrd;Gy92+!4n@SMzaa`|cQ
zT-*999+@FMU%TEq#PVLhB<oc!u!fXP`?5l8?mX9bv#!A}&!@Hzq=mj#+1>g77<==0
zDEszryhTWfk`!4|Q50p(I!UDxDqFG)mFzPj>tHTaDn%$eQwdqeJ{XKiWv7V2m_>GD
zW^6NKjG6hJUH5(6*Y|mS@89)2{WY)tm{-mDIgjIbFUR|1zff|sk#B^&%40{wqM!yZ
z*o#H6`AE$13?T2|e=NQ3-6kyntvec{`R5M%m(w?Hj4;fegc^Iwg%oZNz4UvP5g<9+
zc3@?)GV^O|O|O~9=Qo{V%h%v0|5>~ge+GV6Q0KC+Abm_--SLIUu7SXd{%Lu@YXph-
zfE9?#6G9UFXnKJaZ}tl&x;x{3o{V#HnJzz|0ZvC8XCaKveI$_lhh=M5mQiKAnRnqI
zlR9JV77Dvem4qV;B_1a{I%qHJtVSu_YuLDPR<n4zFmui%m7;9lA#IwcjHSaHuF}FP
z4PMI94l?ltSN4!9PmF(Xsm%%ZDFc8Li@}-JX9p1JrXa)bB{`2rfgPBG`!oM4CV-}^
zAe{S6D$Uw-OSG{hKt1-9{Hp~$-4&y&i@FkMj-HyG?FJlr{||4{DQCOWz@J;M5k~>v
z(Y(BXJp~8ydkdic6lTI)-c39MX<Tq2N=HTO+2MZAVOFm8?H9XZOsB$k-;oQy6x6e~
zmaZRJ@kYvwZpLvOnl=E}b=AO!zKv7og;Kk8WCRnvqb7`k0M+C4O_b5<JB?BA*rrbu
zr)AgX9?qHYdVUSp+#UTYmL*?1c<#Vc&iU4poVQ)ftYaadi9JsgLeEK#{pbI^Ciz_<
z)Y=qXZzafl{xqBw^sg5LDJ1zFE++Eg&|W7C-y-0b09<|E;^TFrVVprC@d!iI84f$t
zFm|J}D*)^__J8RA|C=*xE#6l_pFVY`Nvi^#{A*ihXXhRPY;|?@cKY-PEASDq{3D(2
zS=2s{^g*XOJTR*q9ByQ)oSKci|CwBUPbj@#zy5kubCjnzdkyb1UHyb`)FjSetvgXA
zjbSE~7(*?`JrHao@;^*NtUDt98dQEAktzT1bVvNy^ps=qJsQ<U;!7@h*Ikkk>Z)Am
z$&D+-lsfg)=Mo}$O!$C>_DXM}-%Z@VrxUI3@<DkAcY#Aum&(IFs(F@$e&(CVtW{hP
zZ;JExefk#{y8Fgf(HPw<g>w?WWs~!p+XS$&Wt;GVKuR!?_ZaY0)jj=opt{srMJUbu
zJ=@#lKl{c1rG^0hJf4K7w|DBat+vu)&hf98ob#gbWYkj(Fb&8sgJ-EfI24}dwNZt7
zqwiPKY_FOIu4QlR#Hc1YM;!ucaj%tjhc#4(-LLy8YTfc{6=^uhv<DG^Q}XC5-8uFR
z?BHRO>lAc71Ec4@fQ%SXv^P3<`01VyV4rq5_&(E|9xwMz9;60VGc46|N{iN!DFDqS
z7pLc;K`Xdxfz_863(R)?TOBm|z%FjG1LVv{og=@c@$(A30yJ%T6%ILTPQE8TxJxFn
zGvzAYjOToMtnQSltL-je>M1hb5K^#bJgfu>+;Sk}WF%j(v&>vKTutI_a3LR8CIWmT
zkKMREz}U()>qjo;8SQR@a3`Qfu>eCpGh+wf-ZMv*E=UMk5iqv%?0**6=TB8M729QI
zW*$@5brca<Y5LJBu`{M!B-#;UyH9{0<rUY&a41=9xfDHh{LI|yzw5}+1&bUTCBX3T
z=;Bfu5t=kFc1i3!@~oCUK+VW48#hjL3WhPu=G<1A;ec4ltvhj7J{W5*U(+!N)e*Y<
zRcE{A)k|0Fd<}K1_K=FMsJysWi10he8;1{fLb7JM`?8)qCFW5#hdrdHpX*BJmF>H&
z<I|;Z$Ty)oClwdekz|kb&-&bFCgaW-N_3oF5&96<`7aLBcqK>}J$Ufd#I`vA=qbXW
zZ_~jq2^XENiyJD6?)vj3*0|XEw3Qye+^bl5Vv%kxC2#rcWU55BwW-26;g*$<2uFdI
zKc0t^RVJ`pa+4gBP<J~4U;PEP)k;_1H7dA;d$~B8748suCE>7lt}aE|V2U;?)3}W~
zPJc+EKRNCUKcOg0Yd*X!FUqG^UIe!nOARm(spkw14=Y*pI>XHz{l0u}o!d7i_Rr%*
zYq3NH=~v@=dw#U+fdf-lAP~q6@$siv>eSQE+eK$Ukac_xZkkusA4?84qyrL}gs@2(
zpvUio9q6``c`S(H3IQIsLkF*pk!VQLqhAV#91b0Jt)u+zk=Qglw!K&pIOM{UmvRR(
zEm0=FOv^ustVvWQ4KA@jb{+Le@9}usMc8<n@r~bBlSSVjMyA0Jr~k?V$O5b(gL_V<
zy!saWDr%_tSSalmXThCU=p5<$8#UFzpT9X!77=I|I`nP~Wj;3jMW!TnOwm@cc_MtJ
zSG&sf;o42nKNaG>$D3^yQscJDd~Pw!hUQN>{NVBf5~!<VaiZ?|5OY|nEMS6w-MZ#z
zC3mb%^#c9v?MTLbJ(H!}PnDv777_iO0OM+ByxwRF$VI6ZcQ?x=s7<=GuXR5*+z<VZ
zy-^6g=j=$%f-DBUo;gp|CGGyWaYe$LI}N}aNbO+<LPTgC!SEfgzR8rwa*uD?gbe-x
z!bArfjZey+J!iJkJNf7XD~0<S8fof5J~Tw_H?C&dNB)9dn>w+2s%UU+w05Ou^IMcb
zZf=W<>a}WjCfk&u_3=l<YZ!esO1c8c=he#}+&hkrY&xX7=_gYQG3O_Ogo)z=4?a&Q
zPEXH3&5nO{LHr#7@xOZkP(4faqZ>B_fs`6u6KGP*=J;y>Cx&w1i$B=0Bwl#E=G>~n
z`aPs}H#Kk}mf6gkGt~1!?mMKd6>uWtUsV0lR&P{w9RJRI<l7oNWVVo7Vo5yf_QW$q
z_SHt_WS8kiJ$qg-%sXoBN2_YjCtH5@t-X~Tc)w3FJo88E2aB&e90J;l0F4q9Q30dD
zPHRj~kdu0;jUI<@t7LIc1-v6ZZB;)riz(IFc(%YC`S!Bot<Niy`jg{~Rb<+|mTpce
zp#6C|EHNUugLVyTE#xzGa7RakS0DTt6z@+tJ`miSC%W>P--skttQ>BjzUjcJB(+RB
z09iSP*Ggl5_m9_ozz~L6UkX^YIPn9tmfE)`+i~VMJ}e?eJ<||BDeFIt)Kz(N)Z$D?
z&$A`@N456VL)k=vx>iSXKi=a_bXe|ocD+32etJ4)?=i!nbn*3QsS&Fz*xr>WOq3A6
z;HLl<ZCX6&k+l~~0(_Cyv*+#+)ZrufHhTz_9K*%0dem<!Y}aTm%9WgLR=T>_J^fM`
zLeC^$jU|m02f>BMhyBFIQ-RI#Xm)C<-6}Mw@c!)mZtu1@PpN;j-fY=ca>I2w*?r&#
z@kns%T!iLWnk?HuSy@?pE!b>pNE?~Cw26hnjmA%|d5K3{4T?J);uqv9(BN-Ca_u!7
zjY^4d2(c;Ot<s(Rw7`<hEZmd9y_WJ@TOL<3@ryMNyg%%f)YiOe?EMyauy-p9mM2%-
zUmS8re>i5oc!eC&{QX2?)7U{D%~3dBQEyTAk{ho2Xr@)8@1-w+A-ejlYpZc*xL;PP
zCuWRLC*CkF&vuAw4%9L@Q4VoU%*sPWbneKJaHFTzEcLfLWoCV}Kb4l#-?Wv#Fsj-B
zINS{VN}FMqW>u|~U+B{-iR}yba`|_TuHOG9-yOruc=<wB6tE#92U{Ga06p{x#;(y)
z10Xv)e|}W|4Pk+;-t*#3oZ?78Ryn1ScM{(jm15C^UH>f_6pxjYJfdn{T*x6qG?%ZN
zxyNT>p-G@M&s_QYwI-ugPua|@m0wHp`j0rAqHizPH!rbtv5QS!>m)IPUpgHq3-z*l
zBi>mA3y{tE=Wgq~S~0Qa>qUBA-ULmiN)CAE!Ui5TuBV%5M3t3`5sjJNDdQU#7iYU{
zCzihCx54%cp!zSvEVy2_hwqMagkK7`II^CR?Xx^s9=*@V+x<2g!U#_6Laa$#<Wf!k
zE%(cAV97zFS<$yuZ%GG(iL$Cw@EN{=;Fyig7-RnF6_Sn4_dexA?Il<!)tmw;+Uk#g
zFsm&L>7Getw(4#<qf#&OKXi-#K()VXMTzBkv+XGQSE;F4fo)`Ife=%&J~Z+AcG8`N
z9~+c0T56=U0Em)shrNz(fk~{qCjC~d4m8e6XhDg)Qb63iJ5i-Cj8y6f-xHRcah^m&
zO>m@~Pt{4TL!oH$z~`m+nSXJmLl&;=r+~*~;Al+ScjkyyL;mFhr)YSE=dwwgG)<wn
zm(OT&>!Ma#9o5i~#B!?IYCoQLM-(L+sghfyetD;;2Z%c&qW)2?{~;q-Hiq0Rc^~$#
zXRY@8S&LYr@e$^|QqIv-3wWyfto*I9<}+Q{g7H+9wDhDQ-IZ6RM9-KUiQYKUuZ%_A
z`j^s~M>!DN69zB)b;ZQrJ2r1TEOFwU4;f+XUF|iP7~VxlKA`#z=ksm{Hs0cowQm@k
zu8t$`^Zvk#bq;6F<|(eex;W8-^>pxyyS|Yn>#ol&K=;Y19PJU(UDRR`9yCmWmyPg@
z+KX1P<X62pRjdYJbADlCllsY|YE+*+;3hYP2rat`iE84I23p1nnFh066Z)!BJ;h1(
zpqKPf0{+B~2f{INE&>2X+*gLq2ML$E`O64EH4z7Vs^Mv8`EbzP5%JabuVkqIVATIi
zR``$Y<}cg<?1ig-hY$<d%Z2XI>SBG`dXrA8#;;^|j`K!-kG+1aj<eLgK!A$5kqSUw
z5vuxQ$m;2P-y_4mL^+3&uIoJW$IZv~czU|sI@PBJ(mHx3H_+qNU~=~8z2K8cMyONI
zMn>U0yduu{0Ezv3kihf_%Z+aG(z2#<rKq^OEb5~*sQG;)*vwcA%?j5XSf8-Z`oa6P
zJER@<<+;H7U(~^JT?+ehSf~r@N`Ovw6x{)PwC4B#*lPIr-)_b$%F(w?{0*)JR~3eu
zjaf3I?lICtO#E2~e>3xGhi^)+z_d*K?N2U;0Z8FzUFNuR>PX_HG3B?Gs~DSdFzlDB
z11aLnP|g9~Pc>YIM?;9QA2R{dq~*vQE56OE2&`mnjV>g4CeK%wSZ{2GFYw8vr(s9u
z`?=6+rwEi$KM#{@<uq)hxE>(!1r$1FwS5>qkZ?TUje%l4TcJyHRYq`;z1Gf6dP_Lj
z?{fAtjO}u!<c<rswFM&d4FlTPIHhv$qCZ`+Jo`s0stz#Hb4~owJ$1FUwL2~gq2O(m
zvAg#lIB;#6OvVb;fdA2SyCr%`1lW0cTToEY%2^0*^^)1r-`mT$K$7OkiJL6N_Rc+K
zQVKcV`oXw;qxa(Hwmu+))ZZvqqg>Ui(y)iD2ZsH;S@Ul(9V{LJP_T!b4bKVl$b9Wi
zXZ}21Vf_F_szXmG1TGn(74JdvPL;_mO{}|ip?mSu8{J%+BS%$|K`KN48s}*@$swD7
zpi^W2@IpHd|F(?~$ZXriLgd_5;11Hqre0>em%o2*vQ=X=yp7yy2~EtP{woXNO2K(R
z$7l}Bnrcbgm|<nNtk)$G8%v87)@fN%UFmMldHQ(u`XaBz{WANxOIbP&^;+jb<!P+*
zz^jiQ0BDs`?P2HV-)XndOq5SEB9*>UqNqoGNA@SDJkXl-k<-AygO#r`=C;jhJ_t>4
zGHSRLb;fNurQDHNn_K>Vc2Zr4ywa|INNGnH^J334vXXGr^PMqqPWDFqwxLn9XJjVB
z=wYU&B3dpH<MgCm>Je$~;l&aDMYwoGaG4?JDf>JUQt1Ae+RV@hWj`~~3&8z6qVnBH
zG4wGGs)+Nj-Pk9<QhTqP7Y#*XdpxsFGuq_^Q9&GugOcMBWwG1`LI$G6CsKa>>L7i>
z)gItq`maFsFJ)@()p=9Xl+sVM4JO%1g4ChSe`vN%Ollh{+FzF8XwEwLxwfI38i9Bv
z%<IYO4Vbj<+_eWS!~=Ab0N(rjeRN%XU8Zh}C8i9hxO?`r)<=FbfSS=;n2$Azw2uC|
zl-1%qpr%YbNW#ULNgslh?@Z}`rg>eCdi(Qf8PuI}0L(TV3N{`eSn@*|4=Pxt-{dEs
zb$%4u;Hy#R^AmZ0tuXRb5$*Loe#?cD=#?hZuBkMTW9@sd7_v#)AAkBB&kKrN6p6tn
zwH7k5sM-_D-|nqW{c4MiEo&^rblFM@fcW1vMjug^Fsr9-kE?kQZc40~^k!KeK6X?U
z4KD<W0NUVUELl{$Y`ap&#?R@a$NJfCH=l%LP7U}+d*uIcEyuhJ4D-60`tne&DgsVY
zI?Xg~8?#EM_Rd~*FB=NX$3__Z5Hq(|IusNMKlA{myQDw<*d3U;r{d+uK32Dt9&Tp_
zmLHyY6(M(U?<RQWP#Y#^_~;_$(+Tr$uR7k+dzXPoHd)FBPvbL_xY4(wtS;krd6n)B
zbnhsvRioBPE*ip~i7ma?8+gwzGVau!2j$WH`r2}{cR^sU7Q*$#Rgc()nfS$8r-sc|
z*=tjYur~|C0kyJwH$_*E93e4@B0T0>hTBZr*W;H)R~U&iVI<M>l#Q|IVQzkPL=F3l
z#np#(r_Qjh1(wYBFbh-Q24%`#4YENb8sA{`NW3&F>iGa)$!EHAO+qC|R6+om8YZ9a
z5sWiQTUg%c-hbQ0iOAqPC+3nO)xvLQIC(EQiq@1L@yFA|V(?q)ogv-j@)9ES3MuFN
zbKkMabY7mk=QQZ=5#hgm>J<0%@=M7#FWKfioepL8p55vpvke8(=_!l$H-N%@PmEjM
z!LiRzcJW8tm#;@25I`BAqEi6FMv8l_Dycqk_SxOi>h=Sd0(#0XMYEpXE0wOPCkhDj
z0`6ISzw*OG^~=r5wi@tip~xZa8iO+uUYZ6XlSk6*ubNhK`W~*=CX$*j1``Z7=VrjX
z?`mnF+sYuj<NZrgKGWTAwwr&fIn$E$#b`nG0j|3#F_Td6c((BH4HZ1(4Pq&H*>`EK
zq*r6LfhMLflGN^DC3~0^C-`gB%#b23kZATi=+Cw};GmGJ5UQ~qtlxFcWN8UVR7FO%
zR9F;@6S)>g;bUbNgZZ{B`a6J|VZGSBCnk$jZ6V%oSefsuH!=GpfF|G7oKp857um<X
zIyM#_GLEu5q?rHJx&M&IxXp1=hChv&b)fSqC-v%RS1@`IW$cqw4Lv*I-G0(Q**pqk
z{d^JQSNSGWyw);UQYJi#C@=(tjYov*Kc&pb?C&zh@9#V)@mcN;M83RMd8Z+wm;dSO
z%cbVe_uXTW{iAWalPiw~eC#k(esy@D`DT2l6i#bIAdK}WF>EGuQ(H5<HgJ<!uX25a
zyWZUGj$Ynjas+0eLbp;Kn;urCOuc3GtiFMwLn&4+I)+-pa&1SGaYX!^jxVz47QOjc
zb;s$uoFiKTo#JS>9+aEh?9g7XEH>?HF1yxpRz5r-sLA0n3pnG`WZ4(_;|(;WEEQ0O
z7@f$o$r*uO4>0=(Y?TUu(;Thj7YNoKBq#T6Bx)6xuli<tooZ_3(ZHr8Ji|DQ8hfB&
zh7>HoB1e553hb44-9xOjVG<j!2y%=U{g9)ZR+-Z??UWwj_27^E4sHW0vQ=XV8%<^u
z%IROxabdgV2=$=gMutd}7d;?sp`6VTyswk^+7UlA-3sILR<oC_lhvPEPyDL%DXQ~F
z?8lD^jw;>NADcdM=n_FQSqhoHe-JV(n_IdBmh$8=czDg~VhQ6#ccU@kbq{IR;h3!k
zz`Sj=_0O@4_OvzVkw1st$Yu5M9zL9VZBnq<;!y+rzqIh&T{WnXjsbVoZQB_mz?*F`
zJR;akO_UK7(^ae|lnA!e{ye&jt0jP$UgG1lo|Z$LUjTZhG+Zt!*QGyT-py<>d%hW5
zO{=)}!Fg2oA~dY=CU2GW#jKX-e?2!l>ipH7q*lVca7w&g!xF9BjYtR%AwHET*DE*l
zt{_MobL^_ebqY=H_?^j%OA)Q&havX?h>-ZC0uh?$0EsLx@Rg-c>;^1rMM7yE`ab8{
z_IyJ>%%)g0lnuW;<4HP6&s2O>SKiGj2CUxpRcrCTf%cgj0s{c_Xsc4sBKgh2iAtc%
z8y>Mc38OdTbr0qo#W*RepUEuYOXq)nMh?F&<m5EXHE!s)yA&|hcd7A;a13m}QRWYY
z&}IN$P2a!!Ze}kMb}fHHTiLGb@&kd$oCg^sIz6hq9M{fydFZO6=F`ERxi8GEAq(#b
z(SZcgDpa>~nq>pyIF@OcK@8om+_>$83o<vjwc4qBDlL3<Y!wEngS2EvoDaM43{M!&
z0XG4}O$1fL!EM`&zR|<^rSs<;C_lP{z}~O3<VzR{q;hnx(vtw9n<SBKHpUxeTLesV
zhmN$<K?r|_a_<QmFeC`+9gT@|1dVY+ezi<jp?3D*y&4WhZ*+90c4?=mTGZ>WtY${)
z7==7|+vN6nEs5!|ov(|~w|Od-Ag5F2H@CZyXioyGTJ`H5jX`GD@I7*13#rNr+uqNM
z=D_T6A?7f|COdO_V9^ld18>ZgjpU4_+$9ADN1{oi>cc|LP!x!D5Tk9v$Sc1s{Y!K8
z<@>4v_PgkunaGh-{D?+N9>gW?(vG^qr4-R%d9RJ);`yZw8Sl&IF?3|xXQ+4qqkg`7
zYL})62G$f@Yg3$dMlm#9)q|fq(-MQGj6uvflVY(x&1Ge$m)b8o(xoL0%~ya?$y7xs
z1Ehbsh5lJ?_pATb9RB`0w;hYHv)!ro<|T*rjw=Z)dXlAo&#I!2o3!^sVhPN4(Z_g8
zK#R|(bpZQj@X=Wlf5Q7newSb#coQ7o#Jd_FCZVz}dfK@kyys;1&c~RLjZ0CkTDts|
z+@GYgc{!sukAfUWfJCsL{R^f6?))+l_d*NUf!thR9|Le^n~tnH18jV@=2@P9SPEN(
znnr>qN%i)dk-iuQ8!5x~3`1wZ`vqQoE9i#Z;#HKI^4N&W8GNrr9|vFJ2$5?4MB^d)
zg2bIUw5|+wj*_BAk-h`&pI7I+>4HWPt9=S1*FHA==D)fG49C5`kPkOZe-uHToY}mq
zxj;meYacznQP7=mDou3w<>Bv3WtRV1`i-_#d!6vx!r+x8gD4f_z;d?HJubYBqutoQ
zU%(<?VSTT?y}7M3E>1IKwDgAMNS=?DD{NB$%TQsKK8hvJ{OEmj7ZI}P5$WfuSF=c;
z?sqzC==pImvfoiLNGZ0Y9X~h;o4Gbf@7koNAhkPbjt4U1hHnhU(~6VQc)0x|q&c^S
z0Q|gZOhP-v%`CC*MFSx=P)PsI-6%8TsSk*r2oz-<G2J!PZZDYH&Oz`qX9owNPBdpk
zyM=gD$IDx?{XZoIP*`?31&vR=6tEEOek5zmBNDb56)V*<H<Lzmp7cX<Jr8yAJG*1e
z1W*9yN(94$0RwXw!5DgZ*KtbcY0dXj&j(|;jQU->F41(4xN~-=&wT^}g(>Z#4$1?C
zve<E=@<hb2#?j{_|Kf((4<19Y!L0SB%MCN{Gta|$lu05>M>wixClt*pWIO~g_P53}
z{f8Y6UsrF&pOWGQJ_(U~JFU0U$~KKnIDKb&eZG6Ud}^@lW;+sR)ot6{RG+;U+vaQv
zfNKpDFbcuF_}@Q)s5A06b5Qv*g2=<Z#x=<uyUvTn{Nn=H`BsUFqtWU}5z%O$C47Ql
z`6|Gz3pNqtso&){nYbV$ctckVnU>Jo&>eG$x{`6|?ZOVt4<8I-s?o%ucAJj=%WNVe
z#C~qNNtUr#E9N*Yv?{oqEGZkU8%;ftSdx*{{WRld9Y9v)mY%I)aZu3n7~huMjcPjn
zc>g2&o0-RDGR5gSGSgYQfiRs>-2@W*L+{}b^v=~sFCsOG2`|z-h}YG$8fM*MtK93^
z(rW;P2W(aDY(nRdCq`}#gZUq|ml)&2-<wb;ER<dweOY&Cd(}RbnIza-D7|kHrCidl
z%^G+aM~TsC=Ja51dAE$^{OQ*Oz=~bj`NkbsB&^9KR}<SCS}+N>S48uwIF7!zjtfKJ
zLL~a<Y2wMlE!LHbsM@Q3<=Mh9B^UdzsSCTv@`ZF@b%jKzdu(U$6eK4#>t>~xK1mS9
z2f<idNp?Xz_-5sFGu4;rB06pL2eVz}jl<;(H{^E>kz+S>P9A@gbW5Q$^_I?i-#edA
zz-n$>%Xm`Ny+_j^0p)AX<Qv)>H=5y+kB?fOQbu&EHc-X``y(mWjxDo{rPtSf?#3wA
z<ME4ndmAP*>@uoPC_4JyShTgLof*p17KV|am#;eK^Ft1B(Y;7Waaw;5Nh(NMSMiv=
zW%(*E%8m0=oDs<PsxBdJM#o>i8WdKFfJ$AQp4a`n(k0}EL@fJAc13|y(&QsaaOi@G
zP`W~`o#U`qv+XX6CvfXg_@gU(HY)kAzbJ#vrY7LZxfFn5o|XyRlT(w)redTs#8sl&
z4I?(Q@M%}_*an4`jtS~XUIlmRPkxg@j0d*s7C3}%R-M1Jw6zK1a%str3*Avs2+@Qi
zU=tYX%A9K1zyVt7QTVMRc)#Si;28$6tJf~ee7(N8B0;%77_@n9wQ&-JNXHZsa3=z#
z%z8=mT|K6s-K)~VJe3Z{<hrTEfY`<0z2m`|i@5{j4b2(GkjO7O{KrX&>)Pu_gNv?w
z3P85|*ltLXu5K>skXn?)oX+XLmu`qMCO%Mk1Y$I@l{8l~{VLs_U)K?nq%_Z3&W_(!
zho%eRV^a(+BNf;4r3I|AAx3zlFpUQM_}+5q(6n|i<ZaRneYsHnHkA-t_bS1!KX9fU
z(`$mFa6hs(_DH;N|J=xn?T2f!=FMiJf(oUGkX0A65XbV<Y4+{3jJW=Onp=VsIwAk8
zobF~B7at_E1%=m|^Fxigi^ky3)aPWu*(-7?-{Fr+%gT}!S*BiIPFo`Xv&Z#!v-<l}
zchUK{A`v?<X^v}nd6(L>xt7aLCsWeK>OpS48$?$ClJ@p1pr=)tzx5IxHyGZ0cO|}5
zbaZX5gc^{-mR`9(Sh~8fFDgB^R1_~>u}z9VI0a3A9i20*b0k4Ek?Q=mpXTwGCEDD|
zHB1Ef-NVtF^AGv`CGR&4^;#b*Gi2_m^ltaqs31kE*L1>WWE|J}<?Rn!XNddv0Ac3M
z>W_O-zt)d*gXQm>bS$L^>FkUVTjZX}jv<$1yjv}sU6*_U+E7tcc5e1`-C|^hj=qhb
zD23N`28n5p4LxR8g37K7JHt0DE=E0cr&oG<uJd+XzUp`B)Er@C>@<fP9(4ii=;x$p
z%`ACCk@H=U<kgBIb#33_9KKrJ1Fhf9+FZtdsVvhjKM&E8?4qtE>f+rua+)#u?KI5t
z%e_kHX{<0-U|9g=o<(p-gz<pk2^gK7_ltteJipwabUV9u3NY@R6J0LM`Wg7plpfp}
zLk33_vOeGa@w&ypIrxI#1@d}j8h)x6bF9&8gy$_W5>g0n8B~+%Tl7miHIDEScS5pj
ze5BfA*J*4u!vedyu@14zJ{=p+=AXY`v}Pic5fG{nxz?LA<#XVxykP}*-YA6ertz_V
zSasNXI3iGjZs12JvPK24^6=xQ?1>~-t3wEoR%DIMn+-87L=@p}7~ZBr%(9(odr}BO
z2i5rV{6tp<(9f|f^4W%ZOW+oel6{-X254Ge(CAZ4&}cc{52E0N3JRLd0u_ESHuou3
z%`feNpE$+1GV-Sk1-KCZK4Aazlk1K<j%`&Rk1#bSXf(CXeof5vbpwYj<ANB!IlMED
z=S#--QT1Xd!LTa!Ya4+OAs}yk$h85p?ap!PAM=cvk_2w+g^DhBIA`YEzx{h1F0Nra
zV|+%|o^?yaW@5M04uxSOw)gNgN#AZc)8bf<NH>JA3>hfzfm};d+hc30je~S@MxlMY
z-P1Y=6Mxkom<E7ERX;1H<Q-#!K=uA$50lj2?n*3A0Dlrph6lwK9RLYWM(W?#yBRy0
zqcP1YpzoIxb1}SD+;unl%d?XeMi0j#yfobK_o*RcAFdb3-I0`MwG1A(axX>iMEpaf
zoG_N(Zc}UAZG#H#FSNx%MFg<wEp0Vd1LPtx{f(ZFBCg*#zWK@g`qH_t443t4>Cy0r
z(#ASFB5^f4>?+41Xj3BXRqBVBFa7E3oz|xg2QOd9@KLE0Y6pd3yhm|G!n^?vRf9S+
zg==Wp*$?)(uofK7&D*0l`}88pJOP;^?@NxWU}RP9Y5xAWAf<kuAzNkr<Z!jw6Y4EB
z+zT=?Jr1&sifFm(ySepY*#Y?X9lJg{@`+NOg_I3ZC#&@0`NnR`IH#H$GwMtve}a^7
zRoDT%ic<=k$|ueaS&FQnrz_3dl_KnTD~a*b1S<*BEG-ggvXlq+P+1iE7J}EyyI*^j
z7e}MZdnU*6-)=T3Q?0#JMmSrcq6ColXBL)oAr`<ECQDwZp)7^^Lyj*v>h>u68+*rz
z<;^oXOMW5s6rHs)j_*1iQhmff$4qgr`U%>TR&8OLt(Y!YH(eg~NB+kzHt9$eUCEPo
z5nq{3J%1<A{;doA{b}Eh4@#fLzK<wQ_?Mou4zd5TdHcJ~cKXg}e3*%eNs~yu%w}Ep
zSc&LUyrw`b2^)l08wH{jG$iXp4We~>?U7)AkGn(7GFIhDXKObV0!NzDcOU%CUb;4j
z-*$;1!@2h7j+~Di+2bBSt{b)ObFwp8D$`X-eRvecTfC={Y@UgBr~UdAvF3MCfBR5m
zzu~(Jbq|YY7A(xfBV3_Ifb4y!2R<{tA?KLd=_Ry5%3j@cqz3#zr0woHN9gKM2~XcS
z(N~hF)Qc$h`TP}!pvA=_B9ER*8z1^Udk)yey}tP*Gu*nliD_bnpr%Z_A<$j)HaloA
zzRa%}CZrkzjxY;A+}mz49tefJwg(9-H@o!i;FDO_rhXyp+mUYV*0b)~Jl9K0p=Ob%
z4ntzdcMci6Hcw4ql_WRkD6GHnIS?<%ilr_#QgmRJ7ZVyHZhj6j4r3oYxwb2>yI<Y;
zSoQ1zDB@WEars8;hRt!{-MqA<?BYco;?1jm`w~m;bV0iEH7$!%EO5&hDmf-Ybfq8F
z=7OOh@0@@e4k7PAR3p$xcm)P*dA(GDml@`Nw|FNOO&#YL9}obiSAaQ~UYiM&iGSql
zFr4Ph@%09-AI7U_b3>T_J`R%(4XmF?DsZ93vPfFidpAi1ilJcKWUjLP*v-97iMkb|
z(@!zA`OYD;*e&(tXgB{d5t<;j**!A%^JA>VvGG&SY;04_FE#MDTp;D${cqVZ|EX;i
zcXw)`YBDdl7kp1)ABtxu*jYEJ+*OG-M~a7@*uS7DKoe~B8^QOLdHNF|R@%zKx!0aj
z+pdwt5^K7up=@xpQL)M~UBrUWsi#9<&)oi3JxkplJ$+m_>T~U@l^nYPZR@KybH{aS
zbtv{84m+@#vLnx7Z@SB~+Ew<U+r@zZttxPx$&!-w-tkRmb>j@ocHrEkl2lXY+t*nu
zG6gEkQMiUJx>xJ_a^p}|tv)je<NSJMgT=YokX?h6zk-?T7hM^Pt86WoeI{Bw#t>3l
zYx{;WCY}m09?Y(Si#9<TAxXaIhef_kcJE)x?p-0aHxeuvz0MlThSs%>9s?Ad!n%b=
zLQU3`JoM?MShD_($h+_FVMLh3*}lXlS}<wBcF^Zdqf6Vd!TRJ)cGZYYL!EU6pS&TV
z<m;yz6Ot}uC^x9`!>hm%;hAh#Rs~T)VLFwBTj+IBbAc<`@pn!93qdIEpyqXVT5im6
zphd-IMZASOWYA7;SC8fitBfu}@W8uOwZi^abQInX=1jNUyGgtp_RCg60QIWZ2@jgI
z5#SHl;CUH#cv{9d?@>y*e5Lu5!_8S>uZS7z(*f-%m2pp5x~%c%eMYk_b<A}#yZz_W
zsa&tTM=0G$d?1+e!UzK+wX4P$aB9mO_ZsH(Z<Ors3hFc6XVpBWlt#ddgAmNZ!G|#0
zP7@Fl+~$SyzO=*~v0O#VA_%WbD3aQhtnY2JoFkD24`yb9ev0k$sG@Yv=xmm8*3z7D
zVFPFC?VZ7xf-}thW-Ub`E;n6N-1GAvWN{$=f~|`GKYjGi23rv${3rvFUsG3mHPAfk
z(YzSD=coHNveFJ3_taOrEvQwSBmSbnLM72YV4#f7Hd+*t!+m`gNWk4Ub#DD<_MMvw
zVGMY;+#y(Ud~H?C=uY1D8UGHpYSlPUKg+IYV!0O{u5vDV32sy0%ONg4%Z9=7bThHL
zBj(w($oE6pB{vG>r-jUg!bc?vaqT5uiD1H-(Me8A;Bnz{xbYaQ`)*Om72d0p0$8D7
z)QCc8HDH<hP^lA;0b8}bEZITDth99?q9l?gk+;vCnA~FrH6GhV^-ixqwM}u0EyNr6
z@CWdP+6t%OM8O&f4$1$OBKt|vPopRcj7p8yn@8TB^U2((GVEP=gio1`Cve$W{tCQl
z6sTE@0*hZ^j|gQe*=qt`I=O+9cf+`CeUDd_4H9KZ5^0GELRcy7pw8$)tuI8FQ(Yu@
z^&S5{P%hd=i|8a}b$J=&y6mnPijhR1W90QKkf3d}UDAzHWYV!l!S+!DVd62X7Vq45
zVop}{*R^mLSX4+0x4=Dsm=vY$$6^?`^HoNDWcayR?EBT@ZZW@T%h**)qob&E$ul~)
zBy8to&r}OtRsd(b$>}qqd*}6T-)_xi%~>Ne6xNM4_<diP?NsNJLVk1sEL78EDP&Fi
zx^Eig&!e>9%4=v<IHj8+8iAI&k7@{X9tP`d$~uVw$^4GU=7#>&6^o!3O}T|eJ)PIC
zUAwN(bmc{Sd=;<#a!Bc^{}EgEzelvTtLNcQ2Z%(sZDiSfdpKX8qZ@m5-9j>;cXdGV
z)mW&^QXNHF0EK@9fscyUJKKvn2hS3(^+SUZ=rZK=5wRGbgL9qyb;*)(Y;GO6!Cs$0
z_@=SVBwBsu;&hs>&N1KI<yDm*$V`uaM_@&d?>lH|vefsf<4gQK+hp5^aEaSS0Yaej
z=|ziALUg;~#y?zhJ6O0=$?*wmszU_}rbi<<PGkfp`KoQzkA>&(IxosxYOMMXe{bK+
z^}JgSuu{^@M*E%o_g|eJXZ%K)g}Bhw+Y};3LV)g<+<QPq0GM|gjJ=X@9>}#4U7v~|
zb@dVbr6i#e-FCoF!)acct*z=^Cl1Z0plHpE&RmtwV5_jJxtqMHy;U>k_>r!xc_&rR
zek48F_A=YVOf-hh@e#G=4BnYp&+1<>t-qta@gesGIjUr20IYuabkN&Q`Eubpi@K;`
zM*Q@vL=B8b?jw~LAMwpCz`X*cvupSQ0hJiUqaj81lB#IFG9ou1h8!5K5`$00s;q8g
zgv<o-JktGU`@{&97ZOGX`G!qRg#e_#oL1dXSi^llk?fpSUVod<zo$Y(j9M=nhxR*%
z!eR~iq&3?iXO`vaAN+EUz9H+ch1b7*GVvGfp?v(hEm%i#(AuITBToB)zL<~ar6qHV
zOH1TO5y>ye`~a00A^hw@_;E?>V2jp<SOV=nE~PifQOC_6)qFs>A9p^~>WM$B@52Yh
zlPW4_#A5ef`J`~{eMFg}9H-qJ|5Wdvs@0infxDoi^Ex23CaF~Vd8T6Y-ub!j;O8LB
zkO<jXX-hfC1NTRr%tGB({~V8f+wA3KR`&Fj<q#k^%?z<Hal;go0m0}N0p2D{CyacF
zAIFk@)CesGl&MJBZsUJrf!lT4+D-}+zmJ_ZbD;^9DbpR)44|ozo(vYyas#1XbN4w9
z3e+NviAbBQYv9<1IOiDzXH25R-B!7&xP3<~c~;)#q{J{&RY5400P}ND0g;Xey*3)*
zz4r>5QCBFs+`)YJhm3%I-EAY6$OHBGB51Y&#j5w9s#3QUVo#%M^eLwSZSu09>QO5V
zNvw5PcHos)iz~6o>j!7lXvuX<wZi70>&6&Lh8-KA?p-)BH*yU_mpxBvy7`A}JTS45
z3vIE@4Xd^t>%rduC$_80N&q%lyS))Dqs5H$d&vGVK)JUDa`^~!mwxBjS8pnVjHjdm
z6%QqXIeMIL;ggWu!y$cirhF4TMiQ$Hs1+RYGHv6{`Af`B`_rjnEelsh!Dob{*1zsD
zvNGZ~0)328$g%xN;(h>b>EL`_=604NL&Te|=AMzn#^NM)JMeqPtvffWk^RPwY2BR?
zTqrb@_NwAK#^?FGu2rA@$2-A6v<4p!?ao;By0uY6f|-1F1tQLGChHUPoJTGW!Psqg
zI+4J7PG@BRT|HAmfHb`pb~4h=VxIt}M_`)DUS!C7sF38>?iDJomlY`1?~K87vCM`>
z7a$XN+&$7tXNg)@g&%KF!!sVa`TKd`=f<6fSEn)-$S!aFC3gQ+Oa3ws{GWaxyJK5L
zqkI^2i1iL9Wf@)_7OE?rt0qw1?gQg=m!kun{{(>8h$s8jzsgIy_uaKlE%O-TalQsD
zv`h!T{p&bSy>9gviSb$PjZ|Ax9g}lafynbFf0``V^q@dErD~oe%(JXc@tCF+(sD?v
zh3g~Xk`s{w<}%8wz4JfVOg`hiQ4=mdZG|qnYRu_FF2T5Oqz~DrHHDuw@h8=R%yoo`
zx9Ngj_pp<<&)dd+>)h5Wy&u;)S4Dsiz0n`NPyMi-&l`H2kAz)`Ex<m!uiN5r-Bssj
zV0@&Wx=M=Lk9Pqp6a#OZNJdQ-c<+W7+)slpsVkh_K&r{}zR$7X-e`Cll!%FVAJKdx
zcJ%oy{8!Z%h4q$M;6}<t#t(({UJnCFEMFpZ7f=T7BT4dby$d={ZSXDk`m1NJmgu4A
z={X2^cBJgSM0mirgC|v<MIHc(#`D?H^HqNG*~)TsCcMf{fS)9<XguF_NeKWi^_Kkg
z!rr#+PmI0}H@_fDc_|pwfx&^1RO%Yx^QXg6l^Bu{GRV-k5Fqzp($mZK_pnizNYqZZ
zMDzN>gqAOY*c6g{p=D`mbKNqigdSP|EIgHVqRZPtie4kAG*Vz94{cH2gu#Y2hjZRa
z&35O_Ol&pqvSr7rRczfHVX#{0)a~Leq@JSa7v#d;R~$A@#(-a(w`(dGsGjy*UM_Lc
z5JJDEx8BYpMfRh=ipD6jDtVO+pq4MxVYksmWa+EO14a=o;7&rgCJTsq#X}zAezP9a
z_XA~^36~l2Y7((zS|iLi?W9CG{|~QQ6EpHB7-?*qA?2fwXwB7&&(i<7)0(w%iXi>{
zx9@^v&Vng;S=HQom_tK6r;D?YgX7LtwmZj-?9zg&@TJLwTyFq7=oTu5>K|dwHnryP
zJtfNIJPVuQw|!Lxj`Q_H|1P_`U;RF(CErcbewx>t9t~Fnjla7c74%xZepTne5}xGZ
zm6nC@evaB)Jyd(kS&m~G6>-mXqS78e{Y{yBPflZ^p1e0h0JvECRo6+~_2`vXxD(0o
zi7TeBX<k5{z4WL$ULiCE7~qs6f80e`MOc6SEKcM9P|9D)%HziEyRLMDnW^7jq9reX
z5A;oH_ZM$Z-Ju$)($@g&51uZ&X)_9)4NC#<B%$Xu*I=F-o<%B&$G_*zAO(eTLEwcf
zhWbKtKQ9!hZg}sqV<t=Sz;#Ku`w@KxA1+53V#VHp!|n478R0&qUZBl=eMwX6uHu`2
ztj;JOPOeCv3Ju}E;aZ4C;DNIprz9+g*w*eN$$qR*zcU=&;xbLk{fy0-(IYtbXJ=J_
zh|vDe@2|#?t$<anhy^`(7fj`hF>Kt=l6(i{e6HFgmk(WZ%l7LvZIjyU!OXT~%OvH&
zQQze<&(Y`MDEZXRjJS2u)DlMBVERkRfzgjOA=d}a3VxeSFsJ{>v9h98X9BljJ_5e~
zH$KQz2>pD20~CcU{_+AaUh&ictd_NH*6N&{eSjy(WXT0-IUu?r_8Qv>G1p1t#=4(c
zENgF|H2SuYX~Ci|DEGHd20P5w<@Ci`SNUOeO8@a-H7JPh22;{~&*N#UFQ(RfQQi6|
zH-EgbgRm24SKXjr9i8mN8ttT2Q!@H?#(1b)GWd7n1Z>1xckM<gtpCigSc%@r9rc<y
zq<sr7p;L<===I1d?kIGk3#}(`t~M;X$vIJc^jA}r*y~v%VK`~~6ZW$9qa|TVCjLfq
zFC0#<Sjp_xq73dSdDA<*ta=ci0Nl#^oY(6o-t@3?r(3wys`rh)W2d#xq~%eh7i)*|
z8O31!C)2)0%kAYlM=~QeZ40WnQ;{m}-y&ZP{P4OEYsvA5mBhk*V!HaGa7RhLIF-To
zxl0wdWWy&S03uASeczYPencq-?nJfE<E>>qJ8WROeXcVR{%fW3)~%1Y69eA|j&ssq
zkZEi?>6;267BbUR9LYG_F9u`pbGtqSK8ZW^29&L#NYrtFcYdSfs%LSncBle-p)S`*
z_a}q6g^Tv5IeL;<D=kSZXmh}@<Ml5_c=)&a#|rE3fsTbInGUw6$2o;}VP%p?St4|?
zmXYi#3{b7!APj~Y)HNlsh|sTwTO`i$tL=fWvG9i_OO0Fdcw_!U+Zt$(Fqvq<@{qI9
z6gBmF@7#fYiViD#9yyykC`DU86yGyjX59LN!x*A)C|~d0znBkqwkME|C2r!K(gs^_
zkx-QhG>5^+)eEXAHC76~D~q!P{!NtGI<ViP4jTa$-K0#IwgbBzp=_4*V#6%6Ya=+5
zeX)9+_a@<VgH`dWXb?vQ7&z0;Pz?{(2ji$!eX-q;3P;vxkn`~QdP|y)a~=MX+~Od9
zw3<Le;s3d=HJoy78xAhNR|_1wZpfB#2nz4J#R-M~j-s}g<D(WUgE4(URh)Z1%{VIa
z`V5c<eDlMf`ze1?Dy{E?f1kirdT@trwU&)kR`7VuMN48g@|_O~A68%OcunNqR%^7y
ztXZGundrgW--|00tRCdL9F;uYjQ7IZ8!x;ur}+(Bf@anPW-OxLf*+1R`nCQw4T38#
zesGrFy}wBN2+`59EcG?QXRS^`fOT+#>u4wpQHi0b;w9Q1?NVZmLGYs~V+?YH7nKwg
zuc0@41~X8ZJIh9W4w#^t-%5bz4egqK(HV5hm$r)RG2LUvheYoj{dV~ifL<@>PT2^E
zxulhYgYV|}wz%9Z-M-368!OaPlEFj_{s^=OCd^%v#JWHu(!7vuH$d=>SpY%!@e|>*
zqRc{)NCn<u^%r*sauS;MGU>%Ff^?Q#RHa3E)Vm`@B1BBi16MsNUn*?;qevLS+0|#w
zfUiUW4;$D{?i9d+fRW8w7Wtn0_;;Bht`5Ko&-vZ0-FzfNs_Tqkdb$U5oql#wLsms!
zOrhF`uSQFBw2T9afUYE#5FGwdrV0YlM0m{bZjX#eLT7^@QL0)9FBHPy+P7Cr29fl5
z%Zz|mVfEPSb);^qGpz9qo)PPJH$O{oir34??XMeT^8hh0g}EyK<ww(^nulk_IJ7Vl
zeeWmiHXVjfq~W{@tc%7=gaK?GZfr2h)CUjQ2w(_B!sRAQ-PZvKvK~BMYSU-*8M(-h
z4)b(d8H(RGcAP?@DoZf|E(dvGqd_zjeVX7GtaosHI7o(8#~Js-E|4KI&cHHU_3WN<
zJoO)W-{=V-(YYq5iPq?Bse==*w}g-#@jFoSjYdQ@ijy+lxb6VQXjCTz4(<l*>jQ4`
z{{b_t??ixu8EW>?F)G+SPpkIph4B}aln2LG;*GklyE`BXehA1RHQu5?Y&8{K#GN74
z-BBb^TL24mXHw|pr`?@laW);9lbfw~3-!Ln(}Ox{6KlSh;*SI-XIXfn%N1Xb=@_|7
z3*b_S&^~xtAn$1Ksg&pVV^6z*RtwIJIt|b!u|>i(L4882yBY*T`<YZVA^lwP*KhtJ
zs5*0s4y_B1z7^@|8ZY|7y?tkX)!>1ABE#XM1K;;8DE)hNbDt|?CNKNEZxuz}S}Gac
zCzG?}8k5Uk1D(=%zjUPuOojKJ-4XEZh;~(G20gNT=a0;oT4qxsSjX;KJXd!b3AuAh
z9fOl2f%>v%yG|axUz&kVvBz@kSAS7`;r&i}YDYdstk9)8(TJcm??S5f4G_a0^s<EO
zvxS`vI-NYjq&?=iQC^wfuiELV?medwO?YyZV?J}go$*sLN|JTix_9%wL;$U%*~oG>
z@W7>fLPWtRQ<*ORNjU23XTT@{kaw!vfWpZLM)5xYhzU|$hMs`PPM%FW{f2G+ff&Xx
zNpG{*K><|TrQxA2%QOPvwU#h1+j_4P-dl;$=W%ChxLta37I{_@4K?<8^YYWR%~Hbw
zfhJ5YB2>QYBWt|o$BexFV#cKd>A1;sbE!}<!4Zm)7fD6Wl@owTa%kj?9%z_{^1`SL
zj{p)0II)#GT;PBzZ9V&?9m=T;6pi7JJ|3e^*$Q9`mVqe$*@c<rGlNBkiHG*;xsDk+
z+#RO|?T!nxbzXGTkTb^gxoE5!3;3SF`~8AccSCOA)s%O|;v@A#N@6IDmb56CCAzm<
z^S@q=@RxP^Y2F_)KZlnA0k|s|7mJ04Amk{t5KdLMKCY7~>ln|?_02+q2pT3!k1j0!
z{Y?k8q9+ar;CAuJ-OsM)jHbK3v#r&2C^>(5c&fV{Y&OkRH<+C86MccG2P6*vGC70k
z#>?yn@2}45r94&Cy`6tU8sFITy`;L^F?(}RWHc-W+%QZ)Scn_my)ctf?)gk;OxraI
z@1=dqxqL5nWdH7%wEb+3Z`S=)yhYIJb-a>6RM_YPz`+7UtMC>cM2%kYfb@4;@K!c7
z%{o=`_H7?v26^cYW!G+mRLy7YxT&|?_2k1_1eIazqY{YsUIq6Jb#<)vwzL>A$E%zy
zLFXzp8gi{nzXV!@Hna-7G|O5lcMRf0OWm0sbJ%Ek$#yZyx72Y^UT*$y4_xuFdzTRU
z$U`dLvQnWw;p}oy=EGY#zB4u|IOd(LM$*(&TZ?rjnErS=Cd2$!JD0hBXEY%1cDgNo
z;p3sMuS!3Sp$~0Tx>wxau$%lzs?xurSgU&mtDy2Bd~5rcNs6ltKM-CEuNW&`oQZXI
z!J0^nda@Yino({cYzI~<y=5OEs?sX|@Y>{;rJ97=UV&fQn~N<^8wojTX!On8(AuxQ
z*Vg<^haoV=5U##^%`tUK<^XRcqQr^iYKr95@SE$@Qmn<UNA+L24j-CkFLOq6SGybb
zA_qeJBN}r%BSC=+p1`dN&HZ;xmKq8u7eVNjvANgwgz;Ph;EDUp6L?UJOcuEq!2)Mg
zrlt!WwUa)SybI#<dX`@zrg*$@W*{6mpUvjt<1N1;`~A)vjC4WhJ`h$zG?Z$F0)99`
zf$is@s`j~YHJCv-a|dcP@}KLilVrsaNJs=tN2aH42t#cYg;5^XHA4b%)BtcGeaoya
z9#eg?<WdaT;o*-z^|L?EwyVOnwzI<JIL<GQtjkyWC#6PCx|VBXPq}*)M{M8r_u(B8
z)(?Zn5LxbhzrLIaEv7LEjW$YDn@sNzJ4tM9N}BQ9n{M8~emXRZF4>(S!EJqTMpzD-
z{$PSwRC_Da&C}4rzAYRDNWP~A6xNqAYZ|%k$_cM~aaOx;v4SM|q1LhA8O@o7A&mOa
zKkQ<w&A4`LpXUoBQK!>V#6GQjD4utWZ(?}GWqTJt!WUI(f#o)->5sjC1|tk`u58py
znrN7hcm%y@bzF(KB7Mhew5a2-Z^frdz^)VY>meq?Mip;$rL;!gu+JGYUHPD4@+9AA
zo@QRVx%M{d(vpqeEk8tfY*8|=1r86F#G+Q^@91Fx3FEur&t&fbmH8)?F~crF%cg4I
zw?xvt#%|VD#fB*;5!RX-;_5VAbcSiR0`RZ=839-m%xctce#WY0KnbHMS;NWPv+?lB
z=3P?PI-BFo>BQv(4A{nB#2i-~ok}=66bVNcjZ^IeNXuz~$wAY8juyZGJXR!3Y-b#9
z4198!HQ4ngvUw@^b{{661=F71YFd#OesPfxz(vh=s{<{;s8IkMqkErX8KuEleFSi0
zzvwf3Fd!Cn*3Gxr;HeM)`K;uhey!q~<BJvzrliMAKtd2kcC*;v@KQ9%SxgP6iFJ{_
zW$@oTE<(oa&v=nPxBJ#iUF!jF#Vt&x{98Q2FGbh*$BTyMLJOQqawjaUv!i%qFt^$9
znP>hm%*8XM9lXoDr08{)@12n83wn3sZXth#R&j%~1ow%h)8aUNpr%_&rOuuq$~lN&
z>y!v)j{I8F^v}%oP|{|pwOYL<`bKf?l=|#26Mf;~fXSZ0S8aO2kWS@vkr8E@^=V4!
zKnk<gAiKeCzGXS-LD-sm+4wjtAht^$K6J9Z_x1?-=8MymbQu3-Y_U66Tg3Wl;B2}$
zOB?R>+TM6+dvBeA5%0r2Z};(M#GzgWx4`xbG_2<4IC*i~>L1^>&K?(R^n*KQ#vNDF
zFHrNUcOt>j*#(k05{0tYE7<i2yUvkg_r9lYl*8$Pt2e$mn@>@8WEk!Ll{>NA-F_{j
zXl)#E@}K~JRPJrSRJr7Gc|yIX3F2OtmT<W&joGH5*V~k;b50KQ+~K>(iail?am_78
z+2iFa`>XxOgn6B~y$#$>B|T1sw6%LPDwY{JNy?mpsvpOI2oL90o|Z^;WeDLq?x-qb
zW*yrIK!<c}3KUEX!f7_pq56RzOVQqon)*ZBdz>C6;qvzDV`aAz#>y1uIZAled)c<C
z?BCBdxawUk`gFZ7jsS3dV11DggmVZBpETxQ?~L*zF#bQ*zB{VPY>QWsjtGi~f>db&
z0)l{aPyy*m?*Rqr1ZklK3<!3r^rq5#lNv%5=^!;g2)zdg(n9Bb%#4orUdCB(z4wP}
z#b~~BzO(z@XaBYq%FkZ!Z#(v%dA>hN`;mb%MbBJ|?1kIyn?Bet@u8mtKb>={fp?Ua
zpq45-U7gCBN?FIA;4B1zLhQRs_J7|IAY>gUtfO$_>OPmD>AdQd_IlZ?SlptDBt%V`
z%hjR}mZ%U6w!uX5&B|Lmb&k5HlIFSmlv&?ih0}yUwAa~+(RmS`(!Y_;oPAzsrzmhC
zJ&(mTM54Fay3E<E3iksGV2Qwv(z~U;faLM42Mn~1yNfNMcfbfyGhYES*nKl~eOJL)
z@@QLRR`#Wc6lvR>vsl#brgl`oG|?D$Xo>1=UB;YmFZd7lp2EGiwO_czo^liGdWYnR
zJSsCO%#jjfWsL3$m^<ucC(kvW<r^5PVfeW3F!ad(0#?`6quSe+Yq#de<3*K?-#m1)
ztTh8Krog8#M>J2SRi$x1xO(AzS-TJqS&fTSo6}MBu=kMLlz=|C1TTMhTQI*&sn};W
zrpyZDvvODiD%RLv-+Y5*aoS)btC|v8twFQ1jY4-j>NBeLJmC9t*VZdHrVd1k*jbP7
z^Obm-<mX?yH-q3Co~cRN$d`ufA6!xQ4a(1Lk5cVuxH<;P9wbBh+NzlN<f}^U35P}C
zifHrqc6EbOSloS&@-6&PE8ka2&D$zF93XR<rKoCqLt_YP_+VkSrG9E5$V~dDlm4?R
z|94?4<edzEU&4wW-F)ftNI@x3u5#ELcUx|7z}SioRV<Yr0yz+zZqU@<H$!&WOwSY_
zh~4gxrR9}2-wV5yJNT}4oNREf((GfVR&Ky+1Z#TW%p;gCoFTrLk&*lhA(jl@dBD7e
zv;ErWKVCd1Z{7o@`GQ#0ml~DU!e<;j3Lkk^x_rI7BhOL{au>CAc^PG_=E@6C_>o&a
zp-UO);?Kr&FhvD*qi1<hjuq(01quBcsD1I?F2K5@j6y*_Ctgs_m(@yky+DwT9;`4m
z!lrcjSn(6<13Q#KwS;vgEbezMjIevgOifBL*B*p?KNtrRwLSQC!SO&4wr#N_a#bqW
zCWF|)r0Y<<rG9AG&=GE2=3Mp;{bUZh?2NJ!7f&5_!2OFKYET<k?mtz4((EXK3h&t+
zZC!>t98>CG=s3f~E&oT~^3U`<6Vo_RovNH8fLU|-*6A{qaz=c{&npX@MEJyh6#H`X
z+|QR+l*{5BYUndjodBH@?f0s8AN?JQoj~PpQ8J~>7*j8Z<d9R5y;!0a%Kxz|iU79>
zNnmpKow@y=;Ft5~3uIS!2@K93gRv4Sk2BVQ6z}X5j@}~n`O>&flx@4)avnDPkZtrn
z;HUE{$lvmQ5z6IA4`AtX7`l~Z$~#K-mriguHUF(W{^p*)KAFm0ynm_noI^3jEl({o
z(tpoL6L%T1XUao`&v;gD_gB>gqc*4|_nT8pbcs8Po~niNui|8Z`pk4AnY-@|%OpOb
z<kyHJUrKz&_@j61WcIdQb<5CPTuB$bML_~Q*y3mM?&tab2oC`GoG1bff?|IZ+7+Uo
ze*;~KI5ZW9LkobU3z2e|&##*{4WNEWR5u5d0oKndKp0t<nqKT(+oVgGJNO<f4HPIr
zeVXUvaa~U9hne(1k)RL!{BU`J`vd(*l!LJXrQKtN2pc%M>*@)6__>>AZJ5@?k~zvB
z)sqWHUbVxl(B%LKbpC9L|IvC^P*2K=UuQ29;lY#f`ph|6ckCS0u^}ee+}yr-&(32f
zp`g7SOp<tJbqR|pxD}jDFGuNZz27Bhd|!O%P^E0>JG(6yck{Pa!b$%_{xi2CXpDn%
zzUa`+mBTs%c48^Lu#Nw?x5%CIjNFee5t%l2lrp0k15l=R?^ze@tQ65=261)Y;aH5~
z199y*EtG2kblK2`=5EukmmL4rK!1L!)u5c`&PlKVWi79)3Rq8-GByKo8EpP3&wpqy
zQ~XKU)t!k{{oA^c#dm6rf-4}q`kZl7Z|SiwW~L4^*?^Ugq+=Bw#f{@!_M&#>9Pxg~
z0H)W;QpmvRsQiYulnzr6q3mkirBvx(f1x)4tmv3atacB1nX-FEifOWQkEyr|R(X?c
z^hglke}{lQ-=?DKag~OVn9|<wmc4HJAilYu@Y%mI(GOCGk(g5rbbhu^TMm0?`2ht;
zwN}W~ufk#)K(p#UK0!T-cM8}G6WwXQ@gXa6HPqqrvOVYa@wbsCCq4GZcQA`<-;($t
zzCl-(vYCmc20v}Q_*Erv#~;%zHk-QcPdHQo>dQAv`)rluR#h4a^U<cy;Y7*7b#NBX
z-%Q~GreBerm3Q~z-@Py0({4bC-_`y~=Re3RqjXw?IMLF;H4fx4TjQ|Kh&i5s;4{9?
zv^i%+FT48w2&^9|PVB;`Y~LC1>-PTRDW~un9x_GMkL57}o&5e5_>p&EB2vrm2MXlX
z@3H4-a#FL=%02pfpO;l&{(PBHr9lq*5_~)+(RpnfiC~|bO|ZRZxYJ2zu1gcG-SN;6
zNxP@?W^Eb>b^Lb<RX}GbnJ!A5k~sI9j%(PA5|eJj7_Y$bE@n=XRf&kR0E1F^le5+>
z06c#St%x*+=s*qA9%^!pv8$Vbj$eW-1fIr)J)f|;w~qz8HrGhahX9qL5VY?D9=3qz
zjZ`6eKkZWwar{OTkU%iI7s+E6Wpz(8Niv-L8IWC#KPY@=^{p{)%3mGin>u}Xc?+kI
z!3naFztqNcjchuYLwg7!wSJX~>2l&@KH`R-5B$Lge=8eUDm(vGzp=VEz_f~sW{5Go
zj<m%Mv#5clV8$BHk19!8S3s6#R`?@K+Y{pNTTY|c0mJxcTMi=BNEDT$>dis+H&GM`
z(#B9M`OrRIRb{ahgf?S+Z`1O|gxKtDN5)mDac8FfIhm*WFs*@$EffQMk<Jvn>bpCw
zUq>!6u_mJODUyF97_d<ws$D|waqZv0uY;0B5^}C?(VUOjn)~X`2i$^>ab*B4UnRQo
zDZoW`HKwZ+D5sY+D&P);-b{bG#yyGQ`P)rMp()1(6pS2rXMZlamy-IiSG@MC?{are
z(`2pt7yNR@a>iQ>4(ZgJKAicy?|atpL|yg-fJsbWUPR`SJO3*EzuKW6$9eyT45dT~
zxmVG}m$CUXQuAS+3va*p#2++}zn;-0df3ga{8bj5$V+^<6Q2?9`S|XBRk*JKv$#6v
z>-^%swO)wH_yOOwwd|O87leE-<t14%78yQFP8fKD;aF7Z8>*(;e?90%hNXb|_61#!
zcp#g&@1_yq4c^3i)9_m>a=c@KivXM=^TiGUstoW#7*cBKeNm6Zkdr^lbz%#*tGSVh
zGL=l_i5^>38CB~Z_XZef!mzn@6k}1N*|J@KQMy2a>?+j4pU2^~QbWDlf}M!EqQD<9
zWy(cPp3bPn&_)g2D`6<LY_*{v`oFp3<WC_6&zRh8=(d;&jEK!I;DdO1-@o~JvVnT0
zv&Hsn<I46I9A4emgf>wI2lgHp@G5RR&^Kgdn;|H|4x|cLr}vC7@cfQ_j_Jds0F0lT
zn<r~1puEfjXw6@Zr_31M81G^jRlf10P*xIS<o)za(ouVz^>)6Wyn876z%&bn4C4AO
z#g`vvbd5W>85g-j{)6&A_xxWHRz#&|BfE-KA)b5}ERN{5E4R5nV4Nz$@-Xzsr~5kA
zn;{g^UM0v<beKg@RM*NpWRuL2$=RRuHa&^f06x==9G+?5yCwj6s+GmHW&!PO^5mvz
z4i@GOd+<7mv07Z51=N1ipTAd_jz%d#G%qvPaOKESZ&Y}S1me<W@R)2m8m(kuZt+^p
zGjPsiOg@{sS!{OyVfecHQoozWLc=-zf)r&PI_j`jsL1ARA<}6{=anw6PRSy6Q0Z_%
zL3;XVar&rL)Yjz$yGk`!j?L~<0B&mFfbnv$0tg%hz9gU8Z-mTBe#{Qsf8<G(Yq1w+
zL9b0?3T*;b%4d021iqT>%*SQ$I4p(TbloZHR3a$CJZI6jFrRcEDLj~3K4&eEAFO8h
zj&Et^cJyON7reZpZAA0D2XfzY?DqVvf!kp7C1p}i&>p)jP4nVc4)m=Mue2ImrtPiE
z*aQ~<&V_-KpB3(462B&Cj(F1brnMJb+D7xF`a^Y_7saBU2tRf%S6JnMp$`{5s>ukY
z3k|M$)x1<uh{Fy~-C2`dmjbS;$ZcKxnOT9EU3WZ~%3b?{F|(#nNPTMNC2?fW_jOiA
zKbU0vd|RWFw4-!J?duJn3|f7jMmFXl`!^SM8dof~Zq)v(+!b9s<^!71<q&R5A+LrZ
z>)s1HuSh6CPQGt=Y+e%-`cLKXkhicY=x&fo5~0vXkMve{y=)zwy`d%D1Wtz&)Cj!h
z;qfdY!|5H!Frsvh-e7?smIH(|#ak#GFIt`s60}Xt%7M5Kt{^MCpk9XsT0x@~T55>G
zht;u+WXz~iOO>1u`x;%=8s8M{L@(|odlRqJI~8k#N~jd1_vFUzcC^}Xv60(Q&h3xy
zyjIX16sp0asaj7YzH#Lr^10cQyz5Z1m%Gm^mBnKH4E{0IFev^ZmR=w)PbM!(gN>r<
zVx+Wm+{o?sNgS5+ddx><K5I-~mEXRb2BA&nP_uP@WGglTvio0<-7D(C(mrKQLkC2!
z@>+&Bafw%&p^LQSU%fccwv(f0Y#bYJ_K*6Lw@54+R!&23CCx|GD;^rmipdYPnMHBq
zr24(j;mawfSBVbMycAV~19O<qEwOR}o8xQmDR>7D|1PjraDAYNW$@a(U@ho-Xl>BL
zJTd#FhH-ka{0a@=HWuXID{+yg6s0xqd5yVhW+7f|MD<sQQv8QU`L{~`@u@AYRsgt=
z?|wTxB(F5?sY*o74E}xN)wZKymLpGTkHH~(T`Mk`F?S^_BYWk?(Z_B#qKJ;@SEyBx
zGP?<u+Hf?Rv0Fo>p>O_Rwp$|4OK6+5kO?Q$nxIZ-dvtW@#`<D7(bDp`W<VF3vS3$T
zFa3eZ(QO^(5eB+=TR6NcFEor*`)hANkZ~C-$hc{9U!0zOoY8B%Hc0c#GOa`&Sj|3+
z#}ph4nLDVkB=k(Gl=uHWs)&m%$2~Lg%3><lIW4_6Am240q*Q986VHK**TgLM9Qr!c
zKd2+(4Wmy-0e%zf9HUOCjR@+8&k2jCasPgx7V{m+4vya>tM9oY45Gi7ziDfGC=lFV
z|MfHxlsInBRIY-8RF!)5IP#mDx<bX>;lJL(D1f6~rTdo?B~GE%1Fk+mE=mto-2=4F
zeVr>2d`Z9+8YtiMnQ-vIVm)2{!)fh&x8UxXCKLN8x+J?-U=wFMSbPzrBIl;?G=U0e
zuUs?F`vV)p?XhkxW@(T7FZncXcM;!%+Utecn-6^HE-3-GP+g+^pqW|5@TPJzW5}Mt
z6sZOF#v4`Y6>p%qkV|?<LdVq;paa_3R><Ojc@enV*SxgzuwpAT^7-mA(B9k@`?W2>
zkJ%Ki-q0s*Z@@}5z<V**W;?yf0J!&76Fc!xJfg+Nu*t{WHn`iP^4n9cvctDf*~d{=
zo%_SK7jzjlnE;t(PR?3G*ke0`v`NcOPbY9#S?msCKK5tbEqwBQD*T4ISJ&CE(Ad_D
z8bH70E3Pu!2PzMy2TyCj?*lJM8|72bs0?Rn4H&YqZmOc!b`=r?dbPrkFQkCfYY!Zf
zvydqw+%o6<2)oYc@PNnA;Q=Qm*N7=~_R?-w6VStowI_jsAR6y-Bn13vniHS>OreB4
z#uEgxzW|s)IPbb;G8@@2ThB+c;~ayGX(Kf!XKPgK!^SW$1MgUeH++cCO?_V^j#@X6
z`?rB2rObyTyfz+U6Jv%jYoLHD#?3((dW~JzbCh0ntuD&v@;(KJR+~-ofg5=)+G%=b
z^LzHlBLs^mawFBXVMLMpQj!z&u6OUdnw-#^{XWsR^fPc92i(&NQ*S1l%qv59a<XNo
zTBKDE{o7ON@sp}7E0(JCd8Y01CwxJ2(@QAY<*ciPk7HCu*l$+RpFM3mMSlo-rE-(m
zbG>+I`=YRR6U6~K%>A2`wyCu7{OuS+-zJ|uXL|t*$bR&4iPP4NbZuq(iX%@<P}C9f
zdJUXU=iNi@#-q&<y@<u_fK>hF*~BY3d$+7^h2VlrOe&GA?i8%RbkFU3*%Dg@xARgd
z9vMBg)6VBVxI@)>w2jK}7`#@Pg|Zxzn>n}csXCmhHE?;Vrp*3DQtV^3njv58N{L10
z{>W#GpYcjyacxAg!At<8p@&+?Y*mi^EJM&&3<C<Iq)ilaaPzcx81mKZ;rQVL*u=&m
zr$9t)wn8+}HKSgND!-?O;@hc781#z!N#P&r>%V<4bM}IEzj2&uZbTRhhyK!Atg<Fz
zcUpRf`J1G#9!t~Vm!ps4XZQkUy3%?I)P|dK(+Ax9;R(ExZ~kag_3oL-O)6KYSQ^$0
zH59?Wi#S6PN7ztl0Dyghv^Gi8QLq~wOxqjDS?2q+1Y24p&La3#@XT^o?+=qY{P^Ch
zZWd0>Td&NXqCR5MsT=Z>G%O&Eb1OUN#y+Z?8x$_g|A3PD>QiUju{N7th}<Q@(6m($
zMKv`|@T$a{Fy_DY`STv=<x3D0VHDbS018D5`nx6(z9U>4?Y^1rrRs;10ZLawjocKK
zUqpDgJHzSJ@<OwUrm>cimcD7lVEeEmD7_bxdA*pN)1evl!9w8UAKn`*{z8G7BfXX;
z^u=eP81PWHw0x?PV-Y>$3dJa6+t8ehwHy$~d}XM`Vz4Wsn-d+TKYsZS4&h~Xyf$D!
zZhx$00usVD3)=tqaF$2-Be9@;rB3MnEU`4c=W)vt`qN-FaP&5JCNsGSqz?_?Bdhn`
zAc5P%5v|?gd-muD`9TXof|^9Fh;zH!H!cq>bAQW0^W-wQi=mt?g<HHN`v*h}%kHPq
zFTxkgdjg)7yh}J-1AK{nFP@O3tV*}aZ-p4)Z-q%uox{D??0IfiHBl%{m!tPz5G_T!
z9u{-cnLiA_E(uQivsE}wFLxLfI$3775>r>HUVO9147WMjeXw8>?t-huB)POULYlI&
zY<-)sI=t{Bro!DS2gc@$EAx?8C_Xo17@PbKvfuKANGJB~$@;_M{U86dDIYIH@7Tpj
zY-=pV*$o>e_lyiOhq|qQriX#>YTES2qlm7yr=P`Qw)ZMOFoC#iUZ<4vY~?-x2GVkc
zyR99)dy*j)F8bTnGJxUR!eu&vPSHK(H&q+5a7(%z;bk3{Q8d1fh#`k-2u_;)^X@hV
z=)><&UEPu3*j@_sY|1y`?B&qj+AC=n&JouF?$sRH7>xy2u)}9vm`!QsE6T)FJ|Kor
z@43Dt@VdmmGpsBe+c1xl*tOw#K;`XT8)WEAy$90b>*h7SK%xWR65jf5D2!`2MW+v4
zUih}>iJd<Lw0fo2_=Im+TW;4EhP-cwc@m`t118tE{Jo94+<Hi-7=5TiA(jf$h@phF
z?y^w#MmLnMh4uXviR|G#fu9OD5K;RE3u$HSNJ>SupK%l`5mHFW?cW#8=#VIg=DBT?
ze_Q)O^s$yG_jNz|;*b2!bV%tdbusdJ%I6%J&lk$oQfK4PKGn7rOA^dF)FbDD|5a0*
zHDa>#8!wYWvs2VuCEKj*PZL+=eKgtlX3sShlV`*!81%hibm+NfZvsE6VC4ZpU9Yio
zC1n9-bstXe)SqKPgRd^KC89Ea#FDPDnZ%B4R=T!^W^N15FKbI;z};;>)<GB6@6M~F
zyF4y9I6DiCT}DJKA|5vh0~o4w<wz;Z1YM4g_nvrVNzJ{>MXxnyo9&>u&ALg)p{oCJ
z-RP_?EUna`0>fy(cCX7n+mk-@ewj<OjJtwm)IHUR)%$(>qAe0%qPfP}x27vBjT{vt
ziRP;Hc5!mmJEbN24-zk4no~A2tG*a>%3T(A1X)3sa)vhe7;#0U9+pn*Ug<3V!NmU{
z=*@DlcoM&{M}FhMtR#LS(W~>JQAk{y!!^y#y$k7!khG7ZDr%ATdI0FKiV$6yOTMm`
zW!e6Imb`Tj*Xt*=53c~$QoEV<@uU8%O(Ud4--Ud_!{m2wW;PC5AD?Mi#R12IK0cmz
zp^4J{UQI#vA7oc;85|;Njzn}UYI1I?uZX4(xFvk|?wsTW(1Z!C?U9^;(z&9gG6RMc
zG6M{BVK|kDRo`m5Y!h|L5s^nfFghZoVPG297C~@H8yVK6c`|J<$s(#Id-^rt1jtcm
z2>ObQt?bDat*12>IgOhwQ};i|$p1)Mo~-*!tx2X;DEBA5VrMpk#j7xVGT7X7ZLc;o
zyGUhM08p&ITgn&SfxO<{oLt1C{<Uv6^^G9;=93<eQZr+}@tgg2BLW`BVO{LAr;jC;
zaxF7?DHP$E8S^>`126D=9^aX43>ea8ZZkjY*;!Y0teu?G0TGi*AOsMc4=RLXHuLpL
ze3r35>q%G?!PI^rZ;X@i-Fi$RkTNLRyVNL9Iqd5@del{r88VcW&fh<I$7xQ#u<I1~
zOwG><d0S@f9!MS##`8NaYFgEX7bE1}J+xL{U%uXUogfOxO*TCE(C0lh@G>i8$1N`;
zN066w3P|N)b4~cq=09it?OkI4151Ly31~<G^gjDG<@bw7<BA7Qu4-PPk(>|Pb${uS
zl&dr|pP)RoSES#3t1nJ5X(-SY&9tp_jdWT)JX<62$>fIT!Y$DG{9Z+`$Tr?MYL3qx
zvm*<66(1Y5jFKjFjcO*NZS*Z?^yHSGhsQ?DsRk@(KN0eZyE}_X0;~{Rz~zqs&6sGd
zaU>(&NAnTo2;GNu)Bs(K()eDKa&y;Jaj!iSmAN?vNj;pku)ODC^{9BIG}<<7g~5Hl
z#I0iD)urXuIEUL6@?XU$^ahtRXK~e(kzR?x1XY{WF+N(UcI5_GQ($bAmY>~E)patj
z{4XbYl1<;E+%LweXwSvbP9~##Q5vE^bK8>Sa#zRN7EPheL<u!>#Z2E~D#PMC3iif3
zrDo_qGk=X)Tv60>Es}E^=N@7*S!UxVDE954RrNx$t8Q58%U~`~^`vR(s~_luxP0fa
zi>W0D)Ch$K5MxJZjP<c$eW}k24RD#$#ne8PQ@k{jjVRu!u>eX>fV&sx#f|n-$TtT>
zPQ6CRY%lHrH@70q89D{wUJvczNr2jh?_)7)`Tc5fk<ITBVT{U@66CD#f6*BKn>tc3
zjUlKza&oY5UERtDgCil9O@5<drMBuhk=hD7+L=cOX6Z(rzM9^HL=L*_FYG}VKwU1(
zaSy<iQpF?~8&F+VtH@!I{8ufG$czEg^+uo>kS=Na5`LW~QQZ;F^<HOnNw-&KDLshC
zGCFI_U(&+4>+ArOwyF&9oE`?l2<!Zz^Si3EhxGL2zOHb!<pi{bRy2pOkMFhxc~9Sy
zL`VMK^Wu>$U+g_=Aj!tFqc!RJqx-kqu)2|f)1Adxh{xOiniu;YHuz9>99d(m6|@4Y
zKCH;6DHSK&+V^NYb7QTCsIVa4Va&1Q&JMc!RYXz=x=>f7`BR!+v=)kfcS=Ci5p|)Z
z*jf{9l_r<QvXK)tY!Q6pwMFXrSF#wpJBY$jjU$G$m`*W1j{q>L0hOd+K1^Tut;hl8
z)bL1j@7db+b{wkG;w#8-I=Ab9vb^*faiZ8UHY&Z-@>pzy;%AM0`*iIlNyIz<)xXU7
z3L-U%AMpGcj*7VfBtIY2`__lzyZu|PzIT<&u8Jm`&>$9GKhCm9h&Uj+=`xj^U)rXs
zUiyVLdaPt}S584|(*_6J&T{Iwdt>&h#aizX_tx-V9$5~{whho|1NhIcu8%V$RU7uP
z(Zmul&GH0&DLaoJtXc3+p8Vel?*ID4O0D+<K&0F%`AXdy`}l6pm4!>>3L>AkCsslf
zUyM2`mAuVTI_rojES{5_d5@v96B+eZvA-`2DtnOCy2fVHYVEsg&ua3}{Vyk(WVx7R
zll^M6c_TSyvAma{4&JdHR6dgbHph5zTg0eDrkWqQH6tO7pM4+)|11UIVa|;y0-d_2
zzLOw%zsGNsEv|*w73si80_HgI>y_WErIbpj3mfJ?kY}$bo1|yeZ{AA0@^-HeQ8vQ7
zi9<LKtE#RIK?<2l33Dh$^X_f!oAIRN9#~$$N4i;#4YMBYi46qjVQ%?s-qD9d;91)&
z3u_;UTbMwX4svj-?`9D>qh*r4>=Xy^8*a~bjGGEJaij=fBrKoUj6WaMUSA-7-IUQU
z)q(#yynp(uB0(h3QMtg`E>9k0;(jj`=<m+I%wV_INpoIPw7i8Zln6(FBqLj!UMaRs
zX>MPBZ=Zo=h_YJ=bQJ`$M~uNW1H2*<6S~@J1K9UTI?YYaENgvqW?<khIUu3bR=bEB
zYr_gYay#Z}E2Y}<mw;&-?>9Y?Dwg*ELEVsY#omDMWJdNPAPydtstg`O6pw7B|8StF
zLXg*cncSVr4S5A3;QnTg`Qf!-T7#oa=9#oukLu^*l{3-Vbg7vgzVp|<jd&el5!$cX
zcXjRJfe|@(e%~7N-=X92(Y*R2run#ZteB)FMp&?HnTK#78|Sp-kXp2u@nCX3Ea!&Z
zVwiZMeK^e+=A~|jTby;d>yf>ZMg9?YWY`^P{5<<zszuj5w<vUhLmJQla~LBcK0RC`
z1UL3*Gw9fj+KX&?UP3lAN>lIDwVpe=)w`7)vMkK2WR=uWfwmp>Mze@wzkT6ahzWe=
zdaA1i#jM-$`kirtkjm9~cH?fQ&5pua?4O0JNY-0d+6!%)icLt{mb<>@Tu|$4dR=W&
zBmGfH=Ss|>kMqIj-OUZf2<XNVmiDilq$O})Dc;*y^A6=+Pja@ofBz#2V{>N;D~mk^
z6Nf0GLwdE0S#W+8;C1<wDjz%3-xK>6mvtrkSQvf7^$rX{Z&W)Zee2cR%%5jYS9b-x
zLF5tp89tmn=`eryos1LA;sQRzzsEjJY?TNkXC6cn7?jfzRnin-uBGj>*1cJ%oqg6<
zii68J%EcpBK2}PHkt%Gl=*udE(fI68o}*=1d!p@ElQFi?m(8u$))5aJR)W2oo5K>f
zWvS#7cT{-rt9xGJ#dw-l+$wcbE^HCuvle`1At-dqwas#!Wo@jBWev^Zj~1i{D*soj
zj33=cuh6x7_^xP*0L6bSJ#-9V&$ZYE8e!9(@mOmhCr$kfblmyo<H(#Td@Xlvg(B*0
zxz^1Q5u_=@8))Q4|9*yd1rwL*4Rp~*l27?Jg;}AD-MZkV-&6okcDHqmU=|Gcpr@G?
zYjr@)ZU5+WF9wmdN*j5&9wVgjFicD%Cn5((lXH&oybY)e*H&O`|4yEg55#t`jh4dS
z9r?+1=e8)ooteRG8kyzIc65o&_=(3=Vd(!Xl*Vigr+3<gQB*H&3@@)9DNVmewDm9u
zUL*&K_yJ;bzaLijzfJ&t;PF}$o1Qm^8DPG?gV&=*8Oi)~qh3sx_GYoYPl}!M1(4yE
z4C$uG)rQjVxDBRoRwpWx;nz7Y^qcbh-@clR11V6c??47TOg(P}T-Iyg%MLCZZq_1@
zw!k`FF^r2Q#J+tkaUc&LS#!z02d_kIC1>4n>gCI3<Ky#jSGxiHI5Wz>?w=IqKW<0#
zI#4m?09_)CcvZ{DU>#vOM#^!^*!mufhLDe^IXvK<@ml}>OBeY^rycFfN4Ww7Ha|E4
zkQis*a<~Y5;l{6fu}v_(@sCgchkvN$r(`0QI%~oj7;P{fnU0zcjY4UNIBxCR%{dKu
zWk0f1cHq76=V|;51^(et|HCE~tOb33<GIUdftqS=w_Fbv+qWb$J+6Y0Gxue%C3B;T
zArv)1&3KvwRTa60pN!EO#)*7DR@h>FlhlH2J-euH<Yj~DBtr0bcQ60v>Ho5evxT)9
zWPTLiU7vdXTdDd4hC4=J0w(NLk5qp)x_n~VURnJE9PYK?s`jH6e4;x7+}CMtYcnK8
zoHLFBDAbuKcw!(F(u?;T;k-Lz=J=bp;(rMg{#n&1y(z(`Dt~52fAt<sZ<A5(Gj!%N
zJpN6L0js-s`COeNQ1#t;-FsaB`QME<s61Q6@q5)><~{MB|NIG$Gt7uQfC?WpTZYGR
zqC}fo5eSg@LR=xrmI~=EF7m7wUMaECM&wyVxwt}Jxlk-`i;Dkd0j6(Ym_+D)m3Irp
zjIt~zD**xXbuONe`cHR?(Mu|VGa8%#lvXUw8}v!9K+MC3w*U-g**;eWxqo|vH-Y_B
z=kwq3P|kh40Cq|f4GkV(vYm-cRlaRkfDGWXRhuwxoyhqGSBW>MPa&bpX=@N$TfJdb
z;*o^cuV1HRG;7sza)yLt2A*#f>A$(Q&PsD=)=SUPcH%bwI(?Zmyxro^ygY|jZmx=b
z7h4wI-b+co>&tc+pECHouB}xmWl)P0i?O^0U2bzxIj~ottg3Ok`X3jTemq_#h|K)L
zDX@csYQ~|lh6am8s@$iea?$rkjxkf8&r+OhJpSOKNWs(j?m^dMdxz7;5@~}#2|6VC
z8Juk`$H%bU_66@mTD859sXSG#Q(<Lgcaypng&^w$s3qr-N%Abple#8~f*=p?H%n5^
zCp|mlNiE4$jWrxj0ie`fHH?gS`n6}QYb0IuFAXyjkJccgl7D6LpYd_CBFu$(wSdHz
z&)VwJf^b6@Rc02C2=i)DeAOkw-(8j>K3gK=tekyIxa5m(sfMO8GaLKGQQdKPKGfes
z61dc;8D4$jf|u{W02m~6UX6i)>dfm|VeoS{Ha3&~*CCmNzvnHc5CbNgEI&+HZeW91
z{zEyr%=b|do@T3BAF)~}%_O!xVAW!gDdH0qm6IBiHgQ#Ub{iQ?M7Si@H{K5S)mYQ`
zx`hRsD1`j%9|I15p2>fyvStg|z(B#yY(G2rB^z7gY@BXe6~DWW&sx2>viMm5jWG&)
z>FdvFk-usJ8A3ehF)-ffw?Qs?dio2b0V$=WO2EKWf%ypbAFOt=Jjud>I$!o7MU-yQ
zMgZ_G>*P5WpJZ1*68lr(Q&fwc>{|1y;A;@nx^9<V*bWQ4#D{NURX^rh($9W2v5KXU
zzrsB5)yZr9xs$UMGPj1=-eBlbdY{(|oi))k9<{V^q+jjHI0vZ9W-tNa|LQp4moi&;
znRmu3(JQuAcA-FXz%6{KPkCRpJ~g);-n$C>-GWTtls{x=8v?VeCj;t~m0qh_tUBet
zBdpd8sMfT{_Im`<5&KyZ%L$%LP{rCn1o~zL^J?UPur<&tOI>?c!08@&M6EGr<nIzB
zFj>lPt>a`gH$ts$aZyvJYMAIOZpLx}bo8eDws4}D!6tY@c=1Ppaj43)u?Xd>qD4Bd
zRsOg${a>8&>tA7YH1qRso9hEMO`3%IsR4<czQOl~|2B0U(a~m#!ig^x87ossS+46*
z?@j*E<xQWKu9Cifiv}GT{fYMOCplhzE)7%-O=J(12n}^T6e;0d=D#iLxbg#p=ht1G
z#t(dTyv7RH%I<tFF`%hgTuUMvrdxq}(r*}&zlz`zQbh6g)h#YRUEPQ`z}NwUSTn%<
zHS8sto#-xczmzGWEH|liD60_@6H_gD^(24zOZ3BQtQT8BvM%K+C%*q*3Ii~C8-|8+
zH}v|}b91RRw6rc$z)%m|9iL~G5}{HJ{>1G&aktYUGDX0U!DkqLSC8*u@~>RvQ(LuS
zGC29#K6VRU{Oy`MG*%AQ5%TNHxdZ{snc0~Ji`sQ0etbu`i@GPdP5kYES%#r(#&^<4
zw+Fkg1@2G_djEC-chdHRn){V1uB)*&HC*K;uXK*obWTeQm8#?eCOA#w^NGQV=}UY+
zU|3V0GrTJ0qoSA?i`E&&Pso?Ozl9LyGR^j*p{9=JcTasW8CdIIhaLA6ehsL{?oT&P
zBy*cyEg=HkJAA4fjlA;eJ`@^`G+&Ai4NFRz6SlnaJJTa$dWFQr)wONJgA7sJKcJ&z
zCJQSAurgZw##%}(1dRN~V>r7BPkI8387PT@y*%M7fpvzc`ktN(kzrvMG6j!5H2>De
zVB&Ydd!u?f$?-PN%nX}`jsZ&@r91yNy-}CTG|>GP@rnMQUNNv5-CKFu5k1=9&jv^`
z+l5!Ll<pBE{xt9o{omIf^uFRvIKp}I!0-M1LIAl0KrK6P@|0(v!y6XWFUK>Lb2kf|
zxT+{C<yk+JE4eQw1yfmN^)$Im%3<k#{-@_<_23gZ_^0`}%kn|GAx04L5wddLRojGe
z1R&6Za`D^nF?6Iu3{aqD-a1h$@Z;kNZ!9McJ2?A~FE7*g4EAx!$;kn#u>=+W+XjVG
z073N1Gh_jAP01=!0YK^|8@)9M>Rh9T0s%>&=zh~?eWGHWSFR1Lwx<K=SnF!2YzY5c
z5}5kwQ~UniM-}#+zrV<4N=!f-XOL1+p{>-Wlv4G1kjw-10g}aEj!s%A_%A?|UwJ6<
z<1=y}l;*Ij2ytGU0eMxiAWMmmwua5&`OqKrrxTqI8Pj=!VU?RnyKL_?^z_EH36QI0
z<eoq>ei!-T{LiERl`sWb_;&Lsx0O8GZB!m+EiCZKD|xv2bhE*AfuoRrW7G{i`m~TP
zzyw?%ol#bG4Je-g!*h~9PdJKC0v0pTP7Q!~;<7tg?uiNPzM;<5<pFS!m@Qz7*p<b|
zo5>39M<G_hW<LPDf8FU%b8svm2F;eE`*LAXNgO3Wi{EK%T^=c5;O0$0oo`Pv$ub(J
z0gPSoWzPcIatBaVieieP`N&`>f=hmI>IVenNxuWW<1svaAleyUL8jUQ4y}xBb*D5^
zFuOb9Hbj4gy3UyVWLtb$9$-@Y7fX34rgDc~P^C#t%8+ekPx-?w%74jai88IC;|WGN
zZEU$F`)h^fmx1f!vitzvqPpvKEqryh2DcNHaG*>rxesOmXnOWVRRq><A^`^p{2mA<
z#~UYqJLpt~5l@&H@Pz=(mi6^@#J4hXe^hN*0xItq6WbAR{y6K!PL%w+oTmO`Zp3bA
z!rEm(K~O*X2bvuvA@-gXe-b;AKKzF1@xsbczW<cL^x-0PBOaHVs!H+xr&ldwAQhfh
zU!y<0Dr}ri&p1!V#3@HfAd8=($k*d#yjxVua<ty=^rWjj0q(`uRs?_~VFD~WV-6F&
zuz9NqbAOtOkXT@Dx#oJc<A3%}{GjT^m&X#7fT}K~JsfE11VE9vx_@h9GC3&ui1RFM
zvi&jM<#_Jp`IvjETKK^lW@mpD)E`m^yF*#<5sdrh)*e{Xu$+jvGP>w$qYDvv%y82G
z{`uX95THx5>QO+E&ngPQ?#)iWOuZjOO9nb8yIMdDJ(1F+fMZy_JYhdpYH%7j_x_K+
z>9shGuVKiP58O{jkb9#BOdghlo6wO=<=J%-Cz3RP)AY>P)<wIqQvAByvnN~9za%nb
z_xQAr7@h{6D5CKfPt$FeiWfss7x2pjKA-r1egw6PWR&>o2VP&UoJbBw4SWEjeWiV?
z#Pz5gwkqi*Sk;f|%X1J({_T5H-aic+@f(+WeewLBg1Yt``uYeYYG{XLmN6t~=-fZN
z+Qmef?fgYMkRdLZ+>cSxQ)_EQd_I9+cC{W3zWQ4);pGLO%a7FBB1Nz8k;x$3s{51A
zDZuG@Py6`9SC0?G6W-2EXGla=6V|%+oGS0cBtiEC5jXwD8O|L2ruhUQsC+G9U2kjD
zCBO+}B!7;XCahm3fos>IJ>U`}8s{Z=?lAu3u3rK^*qsZ+FKU*p=gWby4FC)L8{23y
zaS=P5883A`GxmLU${1)eau;}eqCIvbB^aSBXBb$<RFOXe9=(0NO7tq}NqhM5-R;w`
z<AFPl4*U{}tN3-vT9;3>5aSog%7H;(pO@jefi)z4Nt1L96F<c5$D@9A{b5uW?*li+
z;H5AyYPca_&u!$Gjqy*W^-or}2hhUk4NjD_zZPTK1o|M-4<#qhp6DGkmpuc7i+-s3
znAOGpUsyc^{D;sKLCb(4FRoT6uJ+dp!}@4|wv=7mOTiO!YD{Bz$2j)pdkz4)#^SdV
z1?z`7&Ex|T%A45pmM294&t$3zj>WHe>sW968`FS*)|ADuYn_xQlE<5Du(k{xx(vS|
z>zIA_kD+Ei_VC|Al2Q$1^80EO;+ap>Q#+RmU|{$)6vWVPT<685lUDoj-F+y~xsvG{
zeEaT+Bwo7#XgoKCQtUCS{F7SvQ&Ihk#+x>*C9GZ!vK#yV&QR0DDe38LFV9~y-(H>Q
zsq%2HSV)VTu3GPG(}#)TQ*!dd8eUMeZGWGdNq~%oev*6B`a#w|Mg0ydk=+k0fFvo6
zPxoHoiKn5z8-fut2%J3#6$h@?Cp>$3{2ZHPQfMf18QRUT-K`;z{LPiezvzu0=Lq2S
zRRJy2b8KInPCUrYQ^&j;_2^HIyH^&@t{TRX=+08$IQiuj?C_P_r!91{0)@v?VUwCm
zlpQ1tKd)*{>58PMiz#@0wj<nad6?kqJkzt<7Mg7g=!mOkw?7|G+~<2E%}k=#3dvjQ
zdvhW+JMSb8HhN*kwnq~$7|*?BLk*RIle97(Fh3F8TfhC}^ciBNRmAzhDp&Z@XmJ;O
zl(s)hsh^8leS0{VL6WOYH*d3)?+HVSb$3oT36{HGWTXgi(S{L7@eYAhW#wc-SJM6W
zxFs~lo5-Ay4P!6Xsd47(nw9UhvJK>hOYC`PS|hKoPSMPs-okc;Y{r#tr+=%Iqw-C>
z^6QCkUIiE~V5;-siQ;=Z6>s8M%&`cpZkOFVGaf8`=-y5`!1qKp><leFcBt5LT8CB`
z`M}*wjjw9ekH@5H`?<R8-8g$xspP~mnQeo1wvJ+Nn(E_oN3~}tnw`5OX#_h@;icah
zU+<ER`gr#R;W_PeHTs=purJ-^w%la1MY%VZ2z0u;K49`|r1*6P6LvQ-ZGq%;c<E0E
z^er3Xy-Wkb`<RJ+!kC80@hqR!4sXV(%;OBN8>YQ=xt;z_>pr(GldjN8F`q?mn*C@s
zw@wxl(zqY<JUBe`>4Q-^;eoNkA}Mr=TgRf$kxJ~2UC%B3GM{3IqD5<DgzOn!?r&{|
z)sNn(BuME_4;DsG8I6>L_hoA;&$b(Kp&(1|XFF(HV=lel%JUt*dNho!+BCSXk@9lP
z@;?G<H3XmyG{K$cPd?HayouVPzmAm6q`YpoaZI3)tpaEf!S^ZR3g&PVF0}2>(bp`s
zZ#&1{$lKv%zBE|qG-N?Q*V?kj69&3wLb=~5j(v{=`AY847d7GxWX75twkuWRgr72=
zY9U|j*9Ao+?N4*u%w8Hr7;@>f!#(YEbRxBK4YapbI`R^2Ah*n$DUYSnPK0eZqbreC
z$fkK9*N|*~pV*J)_IE|m+EFNx`EsS|VRfu<Cb+&b^}wg<N-k3sbdMMOv?EqKRlbDl
zyN<=a7jH<6$NkYA)6e-KW6w%!l3&K)k^A9<WmgUG>#hxk)2^9N+-<rC#GwjhqkW*X
z*pQ7yAyJB(#%_T_RQT$PYz?iysM7cg04t_HkMTb-@Ox1H^W5gWrUO5#Tev!icspP<
zH?CaTx6-;S7?YfsC+mp#s?3Mb`ixgB4h4kK3HSrQ+kP!1z4k`g2n%g#X)ka(H?GOQ
zEkHj<ZDNqh{)FU@1{g)1QZ}$-(oZBLRyUELww<{oMux})afng`S0;5JbghMB22!(U
zJZ^Nf`a+sj`#_@L=>=fyyrL=fWY&btqmJ1A>DN*ozEZyYYnnqfkR-@#uAxvkZvu*X
zQrmG}>ylovTe3>L#I?DLsxwn?6@qEMXkx#l=*7$&;=G93C|~%nbhplpI7QTeDjO8Z
z(9+z#k>y(>vP9L=+`NjkMrT#*ycI=ZlU4*Lx{Lux^cBea^}nlOx2XVCmqY>ywf)t<
z_^Aq+C}55ugU1%p{njHN0CrX4`*VrI?WxhAT-QFmzEBcBh0OTfo4KTizDGFUwG}w_
zwT@%;=78Z$Af3bQO^*8W>RzxsV|Z&{rse_Wb~jV`$~d6T!(#+3clUZ?_EzBPhdW)q
zgkL|2sY@SxwrU<q@Wid$m}&}!ywG^$)0HT>HX8?S9k26G1>8-iCVEKoa@iQKwY4>Y
zj}LwwS^Rd&Ri>-=`x4kSpg4burnbX_J%lq8v5$sB;}tm7!NGP1^R>o92Hj+N>IGz(
z0?dd{c9rU}WQ6Q$=wo)J-OeR26{lfd{D`~pSaf*eO<Nd`$y%<o&t?Q7MQMiA=g1|A
z#CPQazBC%kIT!pRz+!S_C#J-grdnY^o@mx(81RIv9_beU>D~ANPC#hJ>v4c5A_1l#
zD4g8*><88&n7o}W__p@S^#?UR(4hh|e_#6@5<ltncEPpP28uo4bUZf~U+Iu_+4k6M
zX{M==<ZP|A@wKV@?)KIW;t+Q!_cz=Lo}YQ;Iq;VPYTLvEtX6A7eMl|rt$)#@ezEJ?
zMJczy!?j-gY@b^d7l7Be`Bn1@KI2;5Wl?i3Urb;5L+C<xuJg2_E!$4Qf>+AJhDwbR
zrN(AgHDulD9IxzZ@1~m5=-+Z?83w2)!377W8-IWI%cn2rkDZl2*rmLmq!f4^RMw~g
z^?qR!!@Ap5p-U2v+`978CB2e94Tw`eeki+2Kz8Xqs?=V+aYB?3FCFpBr`kr&7SgIt
z>HU4O(ImhV;wx6;vY=r-RAk{kh{X<<C}(M9PU4o^V})!}%o+kqm2HpNmx0gUk*Paz
zb0-1Srk@)-?4SZ%t_*w*y9ku>eIAKSXc5+pdCxr-jdlGZ-d$`U616U#0DZ&(r3F(T
zjsOE;Xvb94=zsA1eKQzXH}59Jq_EP2ph~VLaOKYc=U;qcr1C)qzh3syAI@3#1_v!Z
zq^wwWHKTAo`E~q)>?%O;*3fH1va~`O4?g<67t%Ib{_MGFvoraI&wP2f#A##xp(rM&
zIK>$5X3{KlHKX5tYZ=8sbna?FoR@uxO@E5}_eofxqa}6}5f&PH{&JpCMbUdM?N&On
zr1Wz-fJ#<+&v|}u_S?t1pO_8B7Y=$)Arge`hgqk-z6%G}91OtAmQiI<-1$`kjva2s
z_Q+gA4#6kwl;racW7TLBAQJCVl%sex${dU#{pITu&RzM1k`GLfS?7|x*Iwo571kH`
zEA?9@K})UJ7BdvF-@m+~lEYSv@|ARN(up`+E%D5I3=l7zuV!BZ*bSRlK2C=FX|^Gt
z7M;+-`IsIg<~a#fRl#QD4Z|wZ5zoY31rXKuw459s?6ARStMhuP;IV1}_to)Qy_PVx
zYyQKqh#*L;u>GQOI(#XB#w5fGi$Kzow)<{$D||Zb0$Kd_(Z4-W5(Rt(cn=DZJo=Ny
zxFU<Ts`Xyn<7}PWDle_iR^7F`6KdOtOzaJ4@Q@-SSB!*55zd4UR9$7{J`vE9t;+{~
z>TXD{qO2V5G}AiNF;(g*9mNM)Nq{HTsO1`#ZAmG|ihx&Ynx>Y4u<$UdW?zoMbDkMY
z1tkZVu5B+l$v8pGHO#qFl%s1e9hrh{Ts8M)c+u1VH3si)EQ}s}!@b?b*cyQ-0IGJZ
z3wEKCbV5L%twM2PJvg&mgOX`rj^rl8T6b4huNf)Pg=JBi8#+b~6(5tn6H7faivr+S
zFMQ5qm7(1Kvhvk3Jgu#AGp_0#)sFl#DsiPPojN9WGAjI|L&=Mouz0?j*eSsa__*uQ
ze>3N8MZ8_{Icd;Uo{l(?usvV5ImKa241&&Y+;Zz+X7R+JauvV+wBVmi%y&toD%Y%^
zLDKVH-h3WS#hrLrx(gJ1QoX?Vh6G4rd%S3G%@W}3-eG`lJnVK%CDeaG!MMWbYzg>U
z901RiYUSv4({JHT((byXKTMW?m6wD{scXs9OefUoK2@5Sq&BhMcaxkJ<kBrChEb>W
zuHIj3JE-ooI;Dr5(o~n6F*Y>)xL~DiNuE|29=rcN*!TVUYx3m{upPjuGhy(UKF`Nb
zuSdD~yi2m?s~heiGV7xudD9<Cv*u{8#;so_8#Yz=xJl_9tx(ld^6{g!sG9e>CLU}B
ziOUkJwP!xnp{nZlE2{(b`gg{T4$IIIY4o?OLL_#k!%a+upM1RX5@Jl->4V8Ft2$K>
z*p|$W08KnA2|N_KnnOXyD#oVCW|VNWkuFW(mYWZOqMPDYYJgt-f^zZ9SJjClii|AZ
zHV@a6j+z0tb3_id<AAPg0fLX~yCHX~u3ybqLBq@5GD@4=GCk}~I@B74;?T8ev|$4l
zVgY6Sh3QE?1`IyiW(n_N&M`{y+zmV%I+y6BHrtiNSUhrW-gfl>Hx>mv0`)OkcyW*q
zu@P3*5$wA^72QP+_s`C&R2p@kdM7i8=Is@h1_pT1FG?c2f-)2tE4R^D9}el=?qEC$
zssJRq%A*)3O67B-93y1i^TkUY4g9QPr460NKZ|B^kI0I!z^y>n(A_*(EkMn3qIu^p
zdl<A3)<M#+p*v(zN|i&t^73gk{OZcw*WS?$gb&<^b%*UYpJ5X%hbmNxb_ytt6@vsQ
z7{Z)p+U}RMQm4uyhI=y1_Fp_3$V0KBAWx*<_EpL~UN5+(-#vzj^nn{x8&`BnaJqgI
z4_BgYQ$~vkr9x5TB1GPn4E)jSs-2iDS%iT`vgbaLk&C5a>2e4;U76=zuF-YXSmB_f
zf{w76?0x5ETVu4@*E$vbDwotU>;<;h%5dQuc=>k^4qSU@?TcK!D(%J!HG3e->(!ES
zIOAL!YSFo+$XQE`eWJQcH;kEy-ht1rGs!h=4N1S~_Zb)oD6+-*VD*HufQe;ZF5f%r
z^70cRJLr@RcH)VURn+lES8s<f({)tX50z@VrC=k^>`}z-Jv7MD%HmX|MXs-;7JHfw
zko)Nh;0}hl`6Ale?-to~5DpbszX4EPHG1}Qa!pFY`tpp84Q|<9bbJbl{42;{tjvLk
zWEy8zjs?f+Bc335^s5cFR@zp5UUVbhcnS;686ymq$`s4@z9CV5a$~W!V>VKA0@E*d
z=rbM#EG^UZWiKFBMmED^kWfC8QY9U_7eKbH$~Mm+)vqFvw&$zXVbWT^oqmZYqO9$n
z-}vrstT?#P4qd1$(C(FN-f}@BS4nPtRj;HOS8UQY>`K>RJ6q5$oPU1rNL@Qii_}P$
zXx*Uag)?xFLO7m1@1CAkMP=utdQG3P;)#QyYAJ~d#}-n3xKHttw1akPkq1aC+a@o!
z@cj+V;k;N|c&A;B`w;2+`t~yjAGa<SSc)nu4s2k>g6gpKntY#suuS5&cd`9%FFqds
zG#y?UoaL+on-iGCZ*HYQ<JS=Mr_<U=e40+LfadX^K{>vm$T$F;+a#a8U25+&sZH6y
zJj1v@PUHkAvDRAH8H7@&sKV=n-qu#<xlVGe-eVt>w@doS+th;mZuRbBHtc3uu`5O=
zA1_Zl?es%(#bK@{KykTJk^9+FJCcW=JEsjTZR#cMb!gscqyfDL{Matu&f@-W>uAUr
zJp{2@F^3#v;N;>*I8NN@{;)&D=xwU|#!d)7$IOvj%XWSUdYQ@Q40*o|HD-hz3Nmr-
z5F#PS6Ee@yMu<aJt`@hsBR2ujzJ`2Of$j!0-wGno9+dsSc4o;u%^V=wDSxSE%EViy
zpfr`3)dD24wR^%8SLLx@WwTf5SIw~jO`*8PDwerWVAinDH9E0e53><EZin052o-g9
z;(9&2Ji_ngZfMNGMVuHDvp~>u9GiSGN<xFR=t}tDCVhpQ22><l7|Xu-?&MVc;wNqp
zA1@XlLQ1ENMKZawg!^n+TcHoU3sJd76&f2K-`>l+Th{%;WTTjU|J!Rc$gIqPQX=<G
z>}RXtZ)7&Z>$L8wAWb=`Qa^9t;>$IKBJ+_sQ0(~QO0<QFVT#qwg{Kb{)@AM?qAgyX
zv-;+;ZwZR+`nuf&SdGAq#iy`)Q0_oFrWH>!1->tmo+IX>=A(2EHRY%Ts<Xg28NK0L
z7o+~?i+iAMK^sk9yXpBZHZ*>MYu1B8zq9jWZJ<kuJLdHl*Na`@A~`0I(F^-e{8o1b
z=Xk;b-b7kZ#1Un!l<(MJ=ZX$TE5G3TS#}unC=>@h7g^tHRMFdgJ!-7_QgjYQv>)(f
zwgVy^nLKM*pjH+K&A-Jwnc3@?q|m7R{ymD&cp-NxZ>&<=d7)>=4m@(uH45Fc7)FjY
zr>S;RoE>tFi+kXRBoiBS_~4379z8>zpdNP<Nx?v*BTNtN0J(ZVu3IqZk*Wh=^T%14
z<R;Zud!F6UGBDEM*8Ei=`_Up}DIx8OT<bou-4F7?c?k$d_r5jv$CcRcROu~{S;-4R
z3s9~k9UV7D-y5^k_(@XE)jT&T@V>+;#U&-_nhZ!%ZjG5S6m7e=e{ql7o;nVxm7>AI
z`c-zR?c1IvTjd@Hqpp~eLov6n2qedDV#!|7GA-5nq>Y*O@_ZU7)_C~9I}^;X@lwS4
zzE2+qD4OW9-&oO9J~%Jk1RXnTxqQj@B~!V2-Pxa6Oc^PHdS*wsc>TBzix1$BSCcEB
z=zZLNd|dS~2{}${IA&AX361P-PX&AV4{(>uyQ!a<s?1CHoF8r|D`BG&CA~HHc(iiG
z*K=#>y4%4B-u#L%fe@(pNk_EfR?9g*4zCs3)q#TKgim)0X@^zR)q~G=EVvo8YzK+2
z6u?)9K}Wkt6Kz}Z%jYyP?w^3ET@GKf-Et?C(7_2K$QXL%l>XO46p|Ycrn4T-F;qN?
zuPZ1tzQM(BAH~*VBe!ndo5pr^u>V_uPGV5(t-joeHFI{TvDM{LgAyB9#~M(*ql5+K
zln7L+5dcjsuh)V6)jN_6pWTJ@(2sVx5Asf1Kzc}lsg9PqH~OEF%iEq38&bq2rx{2}
zN(7wgU-WIH*8QS|SB6@c%RNvz3(m&e3n)t-J#zE)C;{B`&FY6tRe)eNV5SF<$OgbN
zKf1F6SmjMA+%hnq;b?z-<Qz@$60YV5p-Vqv{DHc+OA<FyPTh!hMeo!fUYSl*b{_@Q
z*E8pD&)TMQaq>H`zQz9R=m(a;t53r2Q|^Dr{37A<B|Xe_+Od7>;Tif)>ubxZY>VdU
zcVC=qD+p%)66mNp-oq+(2L6V|$@Ok3Ez`g=H;0<yd9?=E^!45+ZLg_qi-RqLpqLNY
zRS#^(@q-|@n2yFE&I~=GHO^j|*UPQ@vPPqIXbyqQneR?2`?t{#KK3<?i5}oVj<hw;
zK#`o&+tpD|q&FsmUX+pGgf=|)RCRYK+$!48rnp99@s{b#;>S6*F^fY{aa_Y<6&MAA
zI^8@Ij_{iJ83q>Qj+?!qVw3Y@#*0qa$9dw8mu%*ZK{$i!BMBGC{lKG@#$Tbk7E2hm
z$xUR+Q|N+2{m4p6lgClRcc&$IvS`B-!}Y~?Lzaz7)YFyOlhXVl#r{hbLbf7LbQ8}Z
zDC#j42kzMO#+FOzn(ZQ8=F%bK4pfOqu=5pnd(d?-7Y3vC4M;3NyDH}-eJ9px@A9t{
zt$O1e5>gbC2T2bNWW5KQs3rqf8ukjIKqBAo??gV6G~NW|_6*d^9Zo0yf7*M`u%@=I
zZB%IjilB%nNU^~dL_h_k2JEPSNC~|Nh!A=SJrPi_Q52~PC`hj&p(S*s7o`OVNk9~Y
z5E6vYLg1V1^6b5zjr;x1kMrZ4>-85`%*vW;t}(|P;~w|8r^|EfUbdwJU)IA#ea!^+
z|G5qR<uA7h_WO<Mzry(Gl=3i*8QW?nh(+FZ7cLKQppBQV&0HDQ9dIeE-SIlsS|G^=
zNNf9$eY4>QuWsEu$14V>`n`V$-WpKPV>?G?e8##0Al#<mqh$~+*37M*b=F~Jo|$b|
z^jKp!Jt#R*)+Wry1uiqK0=7O}&_xut+VX1^`pkR65iVZ~|EUb!yhmZ0?eWsm%J7+o
z9Bac|X<b+1FD0Y#V$bBAoXT5Wt%hgCKO5!+A(zL(W%FEzN-hnTyNb+5hZJU8dlslv
z!^tKT;qW{W*wu}1@s_)1=55WeAn_Ad7;y_NCx+|}A!#5M-=}_5apFNF)LXn&d-0lt
z?v+N&?OeeT*C)8ALU|(u6(ao#ra(XWd^bPWUf4s(OpfwH=o_^mby~}_qZ!DJb%Nq0
zXF)y|Y%EQ6-|p+M?-;!-aF&Z#k`KY;k(vrVa31uH;#|YStJN{WlI5C`?IhSq$J(mo
zq>ZoQ5RRE6LqH%$aWfHRrhkg8fymt~;ugM<c=}SNPO9+xuE%_mZykDHxw&AvlTMje
zwb;d*i(QEl=Hu!|N4m&BCbpfB8D*=#9w%|UeB_f(ToC$lO;U;;zH%vpU$a_Cj@ka@
zRi41*>~7ocLe+J6#<lpkd1X{=6$;h{z|@Ny&-^PD<CM(@z#->_#(1GN&-L+lF&*}S
zRkbN>snRO7q0ndNdhdU>N4_6CWRI%F01WafX}{K5P1lE=JfxbWglpgUIs&X>bM|BU
z^d-t-*4Hqd`Z8sZEFbc)<k8Do#ZSI9oSO9K%VBJ{7c-kXSN^F2KNE3Sq}AujdyI>!
z-m?my?w#Z`b@YaMSfI=rFLLI&u=!hShLQ!c4Jwvjb6PpyqRh$Ifq;3_SE#F%o4`3q
zQgDfL-G4GZD6<Nctn>=ju;OgfxZ+ZbD}*85L{DU<1(HqrkCDFn+<FtJcqTPS8c$0H
zhnJ)h4l0Q$-*8#%&DIdoldFvDlf{vkStX&a(I2nZ(6|jseckn(NACA^R?Y777Lof@
z7+Wu>kUws)J}_Elc%wY7Du`s*c_a1*Ao<*gUVn{IaLR|k6FE>g(z{TB?;^Lma0O-f
zGOg<l*s@BWlLa1X4sADv93*bzPMFzkNb0TlC(c(*_suye((@+>)Be)@QpP8qXtBCf
z_iTqQJ<9*&x<oE>TrKnyt>a37eOm!Il2m`L{&S%T>+smTfmR8<PJHqg*80f~%Omp>
zQghILtWK0ma>kvA+~=|0eR-T4u{kv^A~o5tT#Kd3uSZ-Njp0!(oV<(JDU$I{hG(vI
zne$8_ue#)XO<#Zj0{PWo&j@aAZsXW|3JT|pFVky!N^gK?+<o^Yb9zm2!rKTNz;nBO
zK<LL1{~3@194w46B@>7(9lIFc^@hsDCmHFaDSHcsKguq3r2|*&kk?^Zd{%4}H1`|W
z{>j!Dy~wh#QM9r0#R{p%6^zz!YZz728aWs;>h55)CB9jgc$8<i3~sXw%uS%UJ(#d<
zaGNa~IOllM_k&e8S0wIu>#I=wgl#GCJ{K41f0S=39bFE86Hg7ib@nYj*FbWpCI}5h
z1<VY-l8M2;F|;f+EiWWrW>Y{ep^1+So49mL97@e9J%X(Z95F6<C5Tz!&h)M`628gM
zhrpMJ?B^08$r=_}NM+oxdWT@FT2M;>;2^sluDS@qZBgbOyZel#z2=()U0ck3@ZV_o
zjSoAWt^m(8dojYBK2m5PV)6;Q3UH?H2A=(+bJ2${%vjr)$W<;80y01iO6+P`$Ifj4
zI8wQzN>}sXUjq^H3#>&zr_hgvchduf=Gvm#k_Ip<c?=Pc_PPG?F&~5Mi9W@(Htp?T
z=fM@_AcH3eB6r-GsG-lsAOR>a8?CSbYA+AjBJoqxc|~!XxW)y|ZW8@`QD^c3?RDIk
zCNoW-1TM~aHASdKD}PPi*jVe{@U>Y@^jyOG>>$_!&}|`75xKrr2X|C+C1C0j;Assb
z@Z(&LFdjw~sc>G{*Qmnn4F_C)DFioH7QxSg4c9xnP|)jKju+dkGQI_M9)#RzN5>6{
zYBnXE`Zo2<80TDN@)E$;tHZe#P_Om+f<Czi)rL!Ei1V^wonOkqGSQqj{4E#OoM?VQ
z$n5r`Q7U_lDCM<`g1gZp+8dM&24n>Q9!_YBfDOh{J1EVG8~|6veV;5xXamQr{g_``
z*eK<i5ZIAopSdcGnIsbg)wECVK17|6s|%W^)h}sUXi)9Md>Q>-yqv0P4#&syPEq#g
z9ac8uP?|P^i|CRc8^G)y8>XwNp<Ib3N~JJoG(tIG_I6^eTMiaW!jPLJnIU-%+i!Dm
zFI6uzB#aiZna4|YbHrK_CU55$oSDS!0dB<*AQB6a=?0HMp3n=~;d2M%3DvpdN`}>8
zIaMy}&(w+>dR`RSp*Ye>Zzp{wrJz?_(hg5Pcv1psJp0MNxs$=5ovm1#6OX~Xeiv5O
z7{dmq2{>If$@@S&OZ`E04CW+O-MladO`@B2ntArUfby7?CziV<t|Z%KaeVTLF0s4T
zJaZ?EgGbup`TV@rg_a1xe(rq!nkWE)VSKO&42NH!BKpPKU1%8RPqBz>OP?gLC!}%g
zC^9bp3<;N9g)fDCUay-=jB2{E&^YSy0B*ik-=br;F-Hwj<V~rq*YDY_v*X4u=G|HT
zD2cI4?sVQ8tShw4=a}RkiMOqFc>%aWq6;qNRBE7n|Hl4%*`mGxEb-F`U2V?tCGLAo
z7jU+)gjaR3U?mNIaYb9uCzM6nKj$AMtQi-W`f5zoab|iR`8C3seit4n)3k9p`1Z#r
z=tF7aBW@;FI?Au_@+00~kAggPPw{hm9pQJcPP^SOVaMIf&UfY%RsTlsARCK-RjWpE
z-kKNqt_!DuQmg!(Kl1@?b<uL33VbqKJx8c%#CK3`D&3j>m&(GQ@y{z=5HDr?S_2)G
z>ejjBf-Vpo0X#Bc*|N#7W^V^;12%{O2<;yrz-}#Dug{g@`1-U;Cjc(F5z{4#o)cG_
zBZZjrKJNT@nN^|jjV4}KKS618dl#x*9ELGZ+9~sj-H0Ys+k|R?z-YeV9b6UXxJ^!C
zm$0|C?qrIkjcSx{@YE)lU=d4xe*F4yFHPbK+8TxoPV}3~h`%kN9|aJ;)x`*|XXKGe
zy<GiPj%YG~t0fF_zs`2O+=POm94Z*mX#`p$z#KyG#=AEQ5xiq%gU|c)Y$NZK#*FT6
zHGrCbs}5rh&D6W8K@Alvc4%ywl|^0i2GIH%sC@6%bl?s177vojhMoJG7d*AGHVHX>
z_tWbHw^F>?w7*y4`k{9QtK_OVrhXGUGs|*;wMYdJ{{W63{nJu7f?2&i?j7Gf?@G1r
zZ-|Egj<9@aedeK3nPDP!$rA{0BR7I7=b8i?(Q&diO)cNzCs}mC(Ujpxw(ngO%)GWA
zgNC(<OlKZj3S6F-o*sJy+^%LVf^mB>t5)Rh11gnt^v=ig!fv6XCUz^k^~OxHq;T*A
z<gt{Q)MV2PqaE{{A>oqa1esBf6Hxi(gH}Fj)?c6{h{pZ6SVX*cyg+~6Dr4l1+F5H0
z!R)?IlzZ#dN1)iH0aHrkj|;D`3lynX$;=f})%M%o6|=b(7MI+S55~`oxq<Xr+25d;
z?C&x<f=N7{+fyF)Zi7C11<qSp0TXu^J~uhvWXY2><dT~bC7|3YQeE22+OwH~xY`rW
z7`&!gOC<})<x8qcs}WCK%TB%{p^s~uT=jc<xS#r!4ef2L{|gS^WDdzaQh|2C_yy?z
zilxe$jY;xwVjc1d@0ySJlG?OAJ%ag^C;yHK`^0eO{fCg})cL*8+39Ct&*xY6*I>sU
zkFF;9d$wGyt@6}2a1W>x$~>~%EVipq@7ya2TYX-_H9T|){lNv^;JiGtkf4xs(_^Y9
z<H*uVB1c4#vamoDX9)UmAeR}baeKzKZ)=5LX8Q_0i5TeCh=z==_;rUtNUI61>e+&;
zY%BpmE(Qw%6Wb#ZK>>r8z99BbS@kKL7>vbtn+ws^cGNo$HVywtmU_hAmy<kFe)V`s
zcdvKy#q*<!!|b7^kG>DAyCfObltTAu)aK}IeBa>58J3qKUF}WL<!;1CT-n2w)Zv+p
zm#CvZ;exrfu{I#J?CCCfZ+4Plu#Fj9>QpjmX-+!Z+0AtOb1o}f?K$tzQC%CqYMzF}
zb++9{ix}cnYx=D95XOSuRKKJW3;*tO)0MEhW})S?Z?|{4eVYVT2Kmg~S&-b0KM24(
zqte{McMFZYNwCT|^_0`RdFP(yysIwU9&~bfJ0Jkrp)K;P^$MOkS)Q3~IH~vfo%?u`
zEZ+xI$zr>7?M$J7->i7!xoH#Ws_#d-kGnB7E9=H)gG%-WbbYxQ(v&YO?OSD4&s5}C
zfftqFDdKzG*dIw=T^%yaGn5)CbABoGJY3lS>N==0EHiA2Bpn&P2Jg~Cdd1U^RHUqN
zDU6I7L@h~w=(u~+h`ABI3JQOiZdn{wzFhqs0NK_eg_Pg=(*}_hBURpcck6J;X-xf9
zD&^QTyqY5pP&(o0kzr60yk3#y*Vib}Doh92jD;Hl)B}SXVGn!@_PJ(V3>{tdtN@gv
zU~K;E1u}pfb{~X22;>St$Iy8`<`vaQKvr6HMm`ek37}3`-5pyO())ItZExdt0|ouO
zv2IhB@AkRb{7Z!=!SRr98pG{c0@4G6S80x#MJfEN4C+%udts&9uOK6vIWqzEo*1Rz
zIf%JKKrGoH-G9q(mxHHuGjGko_1+m}rQo|_E=PC>M|%_*<i*2yR0s>JNXSBC3t8(x
zWhn3E0moVjLS~q_01}RC?Gq88^i$CvNt^5=mzy2Er1i38VUeExt=LcIQkH)c%BRJ9
zBY4+})w1|{;TMDKMJRjc_wMM*`FK{Qo^rew%J20XBP%V1LGyt?<%eNUJztK{bilDY
z204%evV@{9_zG*)Dfc<Q;6^b|5pJQ=MZHU&7Fo`?(idGq!^`w`Np|7FJ4n*&^>un9
z@zI$x%g($48?)I89^r)fv`f`12jA~cxHd^#g_SuD_35{&;VfsRuim~Bk#h+0SwFg5
z4_#L9cD&Ml$mPaMD9=big3!0wS-07cj31o}PpaQ!FL`LN0HS$H^0^^>Z%g!NWuh-1
zl}yW^fTZh+7PZR7$|CQ<#!~XDaAgm={5Jd`W29eA!_C0zKdsDr`Ipt!RRdmVp9Vmh
zs<oTs9uRRy$yu}fQLFwB{0(-};4|8rw7dtuvonXB&)p}7RfWRX0%qa7;@S%h@wztk
z1-AnLU2QK{I!^P#Xq4)r(T#-OQ_?Mqz>NOL?4M=r=bMS-G{QxsH+&c?&MTz%>FGQ&
zT!d#$rXnp${oeyCjnhgx`z%%xI&82e|9So?CoAmZxBfin4hdtrvYHwoZ3!A<&MCXu
z#$PgMD{C+9r~W8HGGIPem3(GTS|XEqlX@OJN<rgw)0#j9&j91C;`o>o4*^BEA1z0t
zE*6~9Em8=Acu@#=OG`^r<OZF%St4wa%dM(1*9^tFY+D{Mb>+HGjj28r<n|h*^6({#
zyu)|7E`(==><YO;HqG-RRV0seiz>_C{=lvqgArpWzTt*`C&7kG9Zvhqno;BgcdL*P
zdkgY|T93!KfEsrk_RaAj8Mtrwsxy<n_9hsDoo3!Y+qexL6ePs}`)j#*k?J#>D+VLG
zk-NpfiIUi7YM4=NP(A?&iSoXLR8VKW%NpQgQstFnS#Ji3T6llTQQ(~0Yv>zG<m^S&
z`+HGZ5>G3GKe+LX>}+t%UiR(GZHkx<h)tzo@Q;aO*IIC8loy{<1IH{az($skI~1{o
z=zD4iw23?hO#%OkuX6f_ux=h}Q(5B8rMtYdWiere*I%%+#gR`t+jm*aK-*kg8*oB5
z9^$lHSsoH)g1ad<sCrp|?XYwn4TlWx-tY~X8A@iTU(grz+Qi6JgUZV_^%HP-D8L1|
zVCOcvOhZyNe#gcAUh+xn-f|K2vh(E+t|8=k3zj8uQgOESs}>toBe852y--m3sl4#q
zsaSc4Mzap_CMmQwY2j>1WnQf^M1qxN_~J#!{#>#6rJ6x_wR|EyTd-oO#5z>TLv!iW
z`uY#BlMSq<)K<W#f(C0sLa8fX+K1NV7AQX8D4<)PO-t-4Y6sPR^wv$Aj8)mazwFU9
zBsFe0x7&$lx*|5uTi2yO$J-C&4fPXaJLnrK(|y_2Lim#&Chy@f`R3)Vru%6Yr=E&d
z1f(`njF%Wjg@KAwUM^je=a-q@m(;}M^iKFT&eC1&SA|#ZdUbVwjT7rYj`@)rU($n?
zJfS;kyEWWI9{kC541UX^eT>D0Tm8VuH5Nd`)!_EuIyQaAB)?`Q-Sr!Tn4`?a&W*%p
zcHx+W?LiCiT-VSqy6q!DVgl!*hPzu2JmH*h%pkq*R#V2}VX@zpywe)xTf<&Zsz|3k
zOMIH$$H!t>=9F0K*xzQ}xwAVDl?>95^_59nA-3s^_JT?b*B)Hx71mR7qInuazP;JH
z>9-}`Tw#soRrLvYbul8Q+K?+SJP$d!pCu}H@X+oM%K$PeO=Dv1hJb(w1c9l2Vq0`w
z<j~!L{KVSou8a5`LQ$Ns)cnVzCUcbl&-Oon><Q=b!c=gKPxYZ-&_pHg+*&jHv(aWX
zfh%<hI8YLbfZDCcLM@(Ue=0{8CUX<Tg&@z=QF!7br@YD4P0|)%Y>ER~MhUtN#b8j7
z(yNIR+TtEgOP;vd>mtR=faK(i^~BP7QyL(a6P+)`CtrDL`=Z{`0oQ46wiZu)ELj*0
zO8J1zgG;-#^Yded0>L-^#R)yJJAS!b6`L!`tlN9FgSEugK^ygjR5&XIV7NzuDZ6&m
zH^x4vn-5%Y)GvBY%HXEo4Vl5m2&J4dEz2J{H(Fwb#XiUz$d8fE>}d0>&gM&c8SM;e
zGs{n&bMT<wOt@w1`&8HtNhGe*6o%;X+sAM>GVYq{(p!Lj(=tA4ZG5rn>-ii@h2^@C
zTAAAbFr)Vf^Ir{JMKR=vf{Twt;I7sZ&n#^l=EgMh5Yi?kxAvbhJ{*4fOyd)q)vVL(
zHK0h|kyvhoLEeL`Z#&<?AtZ9{pa#_^0$cxdmuuA6Cj_u-&6wJ_ewe}s<!ZBL)cG32
zw({Q92-6z}0>Uh1M<QXSS=wAvzS@F0hNu$dSERMCMR#6?&kwAUE*f|*@h2sM*kRS*
z4+NS%wEL4Z`>!<YB1gXE0S)R1;XP%SkYwWO>w1nGK6rR?c`O?dvT?hrHe495^hE6(
zud4^d#~bhy=iVOplO_0YZ;KB5$ZV8MMQjT=uYS@<W=o}ox`UEDyAyuhfTC&`F2&Lo
zZa8ysf9cQZbBkFp@xAI%1X8O=1US9Zs91d%RAw7?T$g{l7Amr)es-Cxt*hZ?PIzZ?
zCGm_n`pX-0Bz=*LFp{4}d_<>Q>^?KZ^DZTx%}~;?qcGc{TMu{qdfbQmL-=q0&i)Z&
zQ^h&zCTSNrkmo*omJ1$pd^Lk|tTPNH&b}au`u3qJ={mM*W*=3CNIlW+V0&T?mjK=&
zMLkt5=xeV|D4#LPqg3fqb(hD^HzMcU>hfNTAZl4poz>2g0pZpBj4P7<a&3$odG%a{
zi}biHYrSRQ+@(rN4SmL?THdSx^7-+oz`(#KI3kOxAazK|>*{O`-DQP>+;~YUq@nV;
zO*et{%0lSiPQ3bUeI7Gp`3fZ<{oCDvJrsTC2SnY>y-RQ)lbq$oqr!7vzCAtU10k#n
zc{$<?{Y-4Cw}f%-ixH0t5POFOr{!~>VV9!9x>s!3>fe_{wwVenstMZ;T>B=a^^0lN
z$9BWEr$v)~^Cq;F$d{`D^Q~)>%zCQ+wK+!$VoY^a4(%;}6XZjrFA7CRX`vR~wwdLH
zL-R~NujPCxaLIcN6Q5qMtREgINV*>1RS6l4Ygv6iaq2ni&i8qV^hu|X1wP44&Dd*v
zn{ei7pY>ZCBRZFPM!2>^b8cxC&c@I47z4|lOVx>u5G-HKO6s^lv@p-mCJO{>?LO2J
z?QmwYb(PC>4I7C*AMS~}N-vYbzp0oPxK?IRiErzllW&n?PjQ#gBM2&q5i%<yq1i?n
zYzq`VBk}%_(OK9Tw=_TR4%mF5X%TH;b>RMN?b)#a<w`yxIRRIdidF(=efL}ciD`-|
z1jp=QDyNGB;y}s&;IgUCf4Xb|r@otI+H)bes>rY>-aUTF{tMs7P^+ogvO-8e=w~8L
zB_xkr`@E<&WS3Q?iVqpx0C~dK;2py3GF%5wUv#OO5_3Ii=58W6>UexE`-Ftsq1}el
z@Yb-0-Y*&SrRydpNnLE2AD{4FCk+%Z+ql>d<Qu1r^-#UOw(O~8Dm`_5VT6pRan+#W
zT+p3)hn$NbLjeibG^p{G2;<qxN#TGK7I_APs1naU?~efwkEp7em)`PU*5E|j6xiYm
zOcf{^ECu^&oN@B#78vb)VZhRC@H^g|d}p8Njxq=^;cqCc#ru~{rHh!_l?lO(Ged=5
zB_X2%=Qm3m<V|DtQv)1b!#r#_-w$Oe%NjF4h7%r)SjRx~06j^mJ9lc<-rh?5M2|c3
zBd}amJNfbk+Fs-+9&X-D-G_)L0oSiA0J>+lL6Ny@?znbaP9%=r^W?2Xa#E$mTtH*9
zW|-f@^I2#0+yh_dsH9-`scCmV>5jjZacu&XSZ>z%(XRc)B33m~!wo+*s3R_zDnwX!
z_O(zJiAcO#<7^eLP{<dG@^CBZZTLuR>loUJ=^Tls%v3(HTW`o9_&VrCtY-$t?|?Is
zIWlWuxgzMp)FipQRz>@A&il_5oC#v%Vu4ex0TRHVNH@9j53jt(osBOmNYZS5uE>42
zGIksobRZRXlp!(VO&WNi7H{^|(gzsz39)7L7vFwoRic_IFY@~Z$*=st4?*ITJ(sC_
z0L)hjSUT4tlZe+xPUJFGqer^B6Hw~=rB?>v9}No^cbq>1DEc&?@AVs<D~4flQZKKK
zvwbES@(vfgkTM;nvu*cL*|c%{D79T~7R@6fj>Xtp`9`|)T00D?XX6T#ZD*ES;m^z*
zEp`Hi{vv%WkxByR?-@N*`?J{oqONsUFpj~?R=)Q+qf<ZgB}m)%NtyI*q;E964x+nq
zjSbA!N8%6_Qn%M9r;U80|Gf4;tmaLu|CLEF)w1_@7cMT~)FH|4Qtl<GWs1v|MI&4a
z=<!8x%gO@F=yq+8Fap+JhDIpc_UFnJOmE&VHSXh=^@2++tc*c?#>=I5<$-e}Ul#KY
zRRZvkChvxlOG`Y9Eb2L5%>IZ{TfJJE_FnmtL7Mia&1+|gF5lbEyxI4&*jK#>;)l2=
z(lzH~;!G#=-*^2u-w98)rC3X_)?@RH0qe{jI)lQd*H5;_h__24SFZal4%w57u`a`<
znvU2=F2Bu)Js#vMYQ=@{LiDWCCaPb(1G*p*<uyHw%Da)Q)c>-4<3zsbGN8!Vj@AV)
zo?R;gz#8Gg;i~+n9C6bNfP+Bio*m@VG2~fmhOEC^qZ2pE(6nLY*@_En+`=<a#|2nY
zA;=nF3;?)aZoRQucLC6pk1DjbwLRyCtleAyuc_Kgp@n41IpVED!w6n|3IKUe0ms~%
z6lIGCRky!AzICGDm8JW+Lo7rTtmx?hx%%1{U1CN<i}@1>h~vZ`6}U?%M}zqG0G}r&
zQZoC&dU2W5Out;8suRrRG4*OjbUDfUrEOYH+l<zPNCc%qk#655c;WJDe@YPs6Ruwr
zXCAB^ulK~*>+99HHK=5yNa||B>mYO9QXh)$9|^1hM*h%u2rj?(L}_H95eO3wi#(lU
zo;FEdt6Go0R#`HXsyKV;RfnkW;5)zfmwRX-yVu7+1mA61d}AW;eT(Hr*~>zC?wCvA
zXh!VwSBb7nWAAAPn#Y-rUyFNT>WVqtU0p$enXjzEq+@=3ONTUj`MH3tewJ<G<=H}M
zJX&mHTj=bSEd8A!XyWCYO@Ra40&d2OkHqGP7bXPl!Y~SL#4i|a@>?y^9Rx&$w+6ye
z-*|rE&kmWi%@fE#1^wZ=;=vfMPz6`Q)!B`qWO1ALtZ!=IpnDU7ytcrWDf8Dq>D!qs
z^_PH2R}eJ0D5UE5F@~oJC|Ep(v54D*l5o~V<{+~xbs9P?b4U46Sk7kn%_w*1y<Eyv
zq3m#XseXruS2)wWu0c53Yw8FHF?Qz1f3L(v0K2YOT?657dDbjy`Ufak%ge;w5C>kJ
zD7p+_-s1w(5Mw<6N!v*H0akN!o^X-D8!}+W@;@>}aqApBc<>gWeN&4u)P|iF>;N~8
z4H?y)Oyg$50E9MJV#S|}^&m@>f4AxywbA06Gb#Qqk6B&;$==mh$tqX7c_%y^tCd+)
zKfei6Eoi);E`W|RlN7&+M5^1h1rUw6Xi&+@J$8MAn(K<te0`0@83KvcsNu#4`mV+6
zTUL8CXDOocz9h8BSUM)NV_^wj69k+3REPpNP&!{BF)-jh@)cN6?RM2ac1K?!Q*3wC
z(+;>)RHJj&%uBE8CZ6*P^I5*gT&+8qYm=^)cnnvb74SsxC6#{3T#2P&Okp?X$jv!3
z=qnZPxO_8I7w&T7Ksndr-TP9fMVCLPU#Z4E@wq(#;eUlJEOp!yDARmOIZ=b^)<1LI
z-|JZz%~QgBl8=R07L@gL{p-#E$LG*xtfg%0!Gc|CK}`zlhRlUiNBMf%=#1>d0vx<8
z!Ci4O4tjhJ6EZ3ixo!r}qAcz<$iK)@Nee?*T*74AOv=T9lb8}c_qR4&QY1Qhc7iq#
zk8hlQ=9fEuU{Q{%b9FTcH47huq6F`md-TdYo4+@Yt6MM$uvxyl-Kn`V7&q>4V9l1b
zovfx)4myRW;LYbOw`4AAtJj4k&Sd`9m#JN>CC2WO=L`Ep{k3UgA8495@73*+b)6ja
z*y8=@6`f|$Wl&8NS@|4=*jJaR8c?<d8sK6MUkF<s2R#Kbe)AJ64C)R2V!aEc0-4@f
zwiiCYaU$!~@E^mlqM<^pyhG2$vlXWKMoxBJz~A}xcgY=_*5+2B-cwl`@tlo5=06Kh
z?>zx@CM*kn%xX)Slt#POtTYv^&78V!s|L*W29Tck^u`0!0Cs2}wGdS<zO^?QvOX8J
ziQKT1ed1XHq-OpDy-Rg~qVWV&C>I!?0gtcFw~v_({vex*LRi27u2c90RlCyZ%A|2u
zC=d{&E;0A`X@SHMf=(ky3WQ*Hs5j_ou-2o}%98GjbJ1bniQ10<)ydPccE}1;W#D>6
z{nKAe>@cr0vvaAdTr8j|>zC{c6R=trQCYBtg>4(&I+P$76A9xFLPx7Y1W)!Ox@XPb
z>W03GE{GhO!ds`dXv~W~NOqCui@F|r(g9srHa5O6?f0gy2r7wnPTRl#B9GYxB5c5A
zVK)@yTGHpx){Xm%MC|r^Tg){X{!TiQ8nBvO5yG`Wdnf%FoP3fk_txJX?vouCZyzX7
z#(0<J(!HS;0+sY4d+8UKo_Go)4gwma<{7?G{M4^Z!Yh%!7eKF9{Hf$_IDd1;WZC*A
zX>jo2+`4@HQl*h&fBpn$bpgFRr=7mCC?>@QjhLWv6WiwMUEjG;Y*siOJQ)4e<cVOz
zyx>~K`d!6Eysj(e>gU@YlTt$lIPzmZAo!w+Z?>Kfc%Z!+Fe%DgCv9H!0;{tCp)c7d
zU@z~Pzjw`v)eC%Me64J*Oix7wZHCLwPbY+KUtF>ba)nWeh@%hCg;kLUXq8AIU4wV{
zZVr6erTM0bu~1Ju{+LQCSS?RO6Mqms$pUC%v1$(bIKf@y)~An9^Ur#@1_g)SXRdb$
z(Wmwe-Dy~bA7OVn{?}ITUsN{xNA0_x{prg8tO)X)vtyFKYR!H3cSbJ`K$KMkULBP&
z=Mm6dD-8~B**_AnCaghyt(A7z4&4uc@{G$70%atWjw<a1v>%w+j6|_gwt)+3*co%;
zvy6Ai;oAWi-?7h|fT9N|spI<B76C4qw>Ax}{XvIczJL)@@+vkj(gFd=<wpYI0R^>m
zJmqVvcxq|*oC!JnLOc8cxXTkmakzMpbmexN>To_uLoevu1O;>f_<<R)Y2rP2b+PI>
zM~F_Un)#`U(U3ZayH|~w85!4(^H=Sh`7m`7WWEdaVVF#S1<MuZ2V45|<PMu$f^1eO
z^+3bd@!0@PEC&Ent{>|tAYB5BLXc(wHRTEk&jJk{?cP|BPeVqgHfes}Nqxy_kp+}i
zB!grrYyBZ~2X`AE)NIVW7R{ZEwad63zZgCa7E!L-xv$v}y|Wd<DTet*hXDtGi+gei
zo4NvGuxua7$Wjb?3^eMz^`TfTFFe0~>RGoMy~A9}ZUTSL9>l(Yx&EV&<Hj&CXy($z
z2T8p?<k)BFVuJ=}k8jq>AUtf?0C_;l9jf$<uT2T7kn2ePzE3T3eTL$1y~APPt#!vK
zdDo#+PvQ%yT}RhU+?hZ48O(cM=&Up_A>5IGN6E*cy?-FYW%=rzspllj$OQ?b$cFw;
z*Atgo-gMk>CCw|9$H*5XeVlQaUQjGq!^sVeH?=B<|F8q~c(=8wNxjZVM|g%iT6EgX
zJai2>3EEksyb~g+pq59%AH`weu{i=o_296$_|1}hZ(V@&JkNPn@fO6Wdf3xLXIhtf
zXeKBpG5%NlYip3~q9yLjq}#4lA7-+wzgvfWybf)9nyAR#I2H8Wvz7JP_E9^@fdp5>
zA=vqO#pcg-i^><8lSUW!C^qXiK$d0<7u^ubu-V(j#hc6o?6a^i-o(rxRm-?jrej69
z+b8piz8^l`8OjVFzAe1#z|s(Ov&%yH7)YcT$XDe=k)y^}cGF2YiE7(M*J}!P$_=W)
zy3RY;7iL_$Xh#O&5lInEL6WiAx*zF>I3dv<$0V<V_^ZzhnsnAxVC^Xfv<KVWiwHuq
zTI^g+T5Z8Bp6*c4tKi){eb(<Udk^OoAYL$5;i><Z&;DF^+Bx?GRX#KS%I=A(IWFKd
zGxR>Ie6zPb?Jz}8wz7U-K&tjf_w>j;27AmTR~=Eq7c)U2>sou96m#Bw{i{Q&S2xxf
z-^Qanb8l9)&jeZoxBZ6RsMZibyBMww91KH_CT_OL>?=56k$K~wqSbi?lR4!>hW)XC
z{SFEQ3{-7$vL;xCt66#g<WtN|s){7San3&`Asfby{hWsV{hzAUcHJzoZ3SmPwh|fv
zCmxVvUV!y81y#;6*|zP>HO-3}`ctf8Tq}+;P$ES@qW_cI%8zf%q+`7~mbHi*tPVZ_
z1xYm^p7Uu*O+8~D`8}XN`Rq+qyS9B0t3tjh+F@3%kt<pc_OM`6&2{-e|KPk<CFpBa
zH8sD&+_gH)4(-K~u7Y9{$uZU|NP3#C9fkJzcCF}qc}-12Z#QD`%qAOvsnI|62_V26
z=+*9PJXA%w(|Mcu-D>m`!vJn*B9=-Ay?IAWge*dFW1N(#h-x3lH>u+w@#K2dzS-sK
zT1_*wnt2m0{JeJUn{@Cy{i$Psl;fG=d_HGBD*P5%?jmsTLnEx$JIi;mKwhFuykoC9
zSj3J?iMg#Ma~KZi_&$2>(OcKv$&k7ezSnV5%1q32;uL3oUUQCaLCKPdqSyCgC)~4B
zI~MK3rEw_d<3io4lEpQGEULyJwXZ`G1&?3ZJ$c{WJKw3&!(-e#$Xni0&-MX)-q@EE
z0o8o8_Z{V#98A9D!wE$QX~FZoKTSd`+vHLiW$*-GgZ@C)dh6uB4juK+cQaV-nV5uE
zSION_Ur`<^wF|dR>RzP2xXLqvYcjLXxW@N3grnO2kjht8-_do8>@l*&gg3M=pFhO{
z39Ep-)tL6|cG)u@UH{!Z=61upz%kIx@_424#c_dkJjO0dByHBmm^;UM#G8|NA&9##
zU)R_Xn}7J@WBynaNxp5rCj;KYSR~;Z;hxTNrTMWR@UVV24^%E+HMY5Hq54_jCXx|N
zw+dBt)0`JI6w<4%)=%sqT-dGLyR^&=*O%)rroYS`96P}WC=G`#m{-b%F)8m29~J4L
zlU_(e2i6Xq6bo1)$9BFf4@j8?bHliefd5u+saBYL9#y;8(*X`oCooF7*JPDjj1hs6
zqQ1L0fP}+;*mbWwHv89Ky<*-{zr<}C=*~P4#{b%fy%2Pm{nTDQmZ*Wp!qpQ=u&<5W
zp1F3@Caiq7;N7D@7h_Ms-9xUA`Cr4qPQO_uKsP4<LKeS-ck_rJ*LawuG`bzNw=}G^
zQ7>)MrCb?cSSB1MMamL`dDy;92x<F$A!WEPUz1#gbCz_?^7&IW%eQf~VUT`<bF3MG
z&IC+l#iSK?;n+-5gkbwfrRQcJXWI4&-sIA%AeUhCplJ0A-MV_0FNeK2v%NceYBPUl
zYD`6}I`rK}=F0$@Clz#rU(@F?W$s;7!^#A>P~LzAy#8@QHl1P`^a+&2r)6Q6Sr@$-
z+nL!~U`5sYjVx<XqrVDa3~7V<CB~KMle63?Mc{s(?-f>tH^kp{vw%-gp#_c2HVWI1
zRJiwK>4@O8a^yFeJ!uGf^=Cx3fwY(fk6FA{s-k6Fg2afQmcTF7(?4c2J?0;&w#?CH
z9+cdj`+?a#E)~V;&#%v;GQHZZIGNwl*3FTOd4H>d>D{RwtEE^mFu4MXchcS}^9`mC
zz;4z?<`XOAu+!hf--DWe<3s`OTg;qZns&2@q#@=$|8qjA!%KxYu=g~6)!pua48N0k
z->-OT8WI1H%{yI;YX_SC>C<v2)^d-LL7qQ}WRELL4xaNBDi5h5G-_t{R2EDKy9x?P
zgVKc}Hf2I^@7|65Pq|)}wcUTz%Lq8=x&goeh2VKI;fpUwsVnZ_#S+i@g>7tT0K|P9
zp!@}Z;H5J7>@l!#Vl{oSJzGai+)LVvVG(ck3ys7kl7Mr~?L?|9KB<FU#&YRwqFxab
zs&~ZyPEy|%+`uc!ZsEJQwKP<)p4g_E*1g|z7$=h9Bs|^(;xlt`0$=Rs8&GgyZO|s_
zLAZ{?h8Ji-puWHT@v(bBO3<RQAGLnR_$e&wZy9ws_bQ0Tt|L}^Q^UgNXSjt`2J<c-
zLfzi9(@m_^pCCZx+EGQOeI0N#m<0V8tcIG4!eYQFGCLe6ivTD#7!+d#%m`I-;%0mn
zDNu+sH)x?-^wq;ikmd%sqxcPZ%p{Fq$4R`&oJZKz0+-z?0qN_g&J<89hz134(L0H3
zRX!8~nU#lpo-vfq-TReBW`hTndoz#BMNSop$PtSyAuHe0quv7DE8QnMgE|WK78tlt
zDk_mFlV4rZC9fC^!hK3y7<Uq7?cdB0(cMCe6SSq!rU+8|rO8x5-UAWFic#CSsu9kS
z@9nWEEpl>Bgt1oxJyn-t625^Ba<G(8UU#udcaU%^;`*+Gt7GCIqE#>_O6SP9T8-aq
z=CUQFx$t{G%`qaocmVWq<@WTA`OY1tBi61KlChS3-wx$KvobLXfv;>6TzfuE>Fcv#
z$G?*tf0R}R=XNL+7PW`bV49%Z)z;K$`fXmb*LyG!c1f-h<3kNTwxqU5?(g4u6834e
zctt*}&ep<*M(Th5M0&=y=3ClDt7o{+qw^Pe1L1k+h~7BwS&8+vBlC5Q7}oZ2wnwz>
z_fG*flti!Gn)6IY$VXz*HF~>EcW?e{$}<2FTrU#l|DgZ63^zG&$M(<**;Ir>u5NS9
z#zM*xrsDkzNz=;&5%~dJgrQpP`ZU4aC#Ptt=uXET>0^6z@g|ZE<&K|?l#+G`r%Cjp
zHK>c^?$eZ1L)m7N|1>aFuA^Nd7{;RnQg*oVNOBb=1{AwiBY1o5yJGnA<P#hh6p4nT
zl=fHGRe8V6_T*H*&A0?v&VYC>$fc(SjA=^Nq+;I{lsXZvj(9#^O5$|Y`J1{Jr#1+h
z>W50~w+xzYT^2oLRJN)2AiM#m%?#<C9X*heZ|SQtq^3c2dIwtMd-84wev7|*RS`qh
zQotVr#UmHrK~j<N`^y6IP6sMG0I48TTmGWc5~U1exG}-ZJE|_YPs+(C0lk&a(RV-s
z<5`Xq|Fy8iHw{SCJ;F^e)W&Ag-Q<)NL|?REb;V%~iAMn$*(ZF>ufQu1r07=+af?vS
z&JiDC(2vc2LLL__kevX*Hx=Jcd1eKZFL5tgNT&&l#>U3CfZ#yOG*;j=5y&o$CN<JE
zb#&r^vP*M8i3=7hfdc?)(TLw<GQ0(rKHKYxm>2W|i90jN0b&sg^Z967MkdxGQ>-22
zd};mAYAX~dLW7N^(mZMoTf5$mKkI=2uz`g)rRBk$n-Egz?V!F=K<fVdcx-mF_TdNW
z58r^aMGUBBVhmRYVEv9nC85(AJ^Yq|x+%V29<^Yv^mTcOth#B$N*JW=M^c&=XYiou
zB(puGddFM+oV~X`vuKkNu6+<!K8CE*|AwzoH9vit`w^RRo?*_h{yc+6yD|_Imxj5W
z12U8{va)S?C4YZ}4(K)3{>3)1gt6c=C1vW<qRl%Y?XQv_lxFY+@7XJ}a9J-%xfdhW
z(-t2y3__AzeNCU(ig{2#li}+rZ>hf!o^jh`$SicRDh9}B*v9*b9zQc*Y;RKFc$^}a
z&_Xh^EHc%yo5Kez`ca-JiETriF0||>JzQDIEL&AOX_;BtC#SKz_u~^%8gEkMp;khw
zVUOCK#hW!|#yQp!J@ImMHM}@ugBR5UQw}_Lz3s(`si3g$_J(OOh=7JjA#?}K4{$gx
z=s9fMDArt9HU5j1eQ>YVYY=;_zCF$RpCZBEfc||Y_c$^Sd2S@UZjxo#oDU_4@Saw_
zbN+Vo=`&}d>}+ih;cAf^vU*x8gMik7fjkIYJ>l-Fmq<4P`ch0t?SV&Hug=L9TLv5w
z(s|H&UtI2}X9Mzv94?{#JFvix^<TTzQ-mr=h3MM@3Vhz=FBN3KUb89dg~^V!RNyLh
z?p4*{jeDx7O{@vRn;$=03-$z?B_a~pQIlWGaZluoK}S@9MYU2l<2Zn%uKb#gi(v#j
zRX4?=RGn_%Kn#&Uv+qt3dY__fmHUeb9V8Ti`I<3evbZqvK#?WIWx88Dz+4hq_*5~D
zV<(;dB<XWER)q2WiY#u(vu_b_;~o#69eanS)F^vw0PsuaJY9ybHEOdN=o$Sc(H@|r
z3F{p<J(n=vYSU_}v_3sqQuRX5b&llgr*YHWGV}K|I^Hc{7J_UfW<_xCY{Gp;b_*%7
z3<PWf0bSyOPTu_v9SO3{pv#Vbkf8M49<M+Q<b7Y19lR+>;2{Ed#t%*Kf-hD4e!K%k
zluIu5-Szhuq7ogy61tbOg+LDid2ka%vspDk;qIH#P9OH5s9hn4%5LF-g8TLqZ$zeV
zWTtPFr6YIbYz(9$Ei;i(_8USi>*#2@>m{XBto}u)3^Mq`PZXIS{KB&iQvxy&^ZW<`
z^wS?~O_bq+&G~J?dg8^dM71J`#bFez`dSSD7vcce@`yw8dZouVZTzEGcdqnw7Xk&Y
zM}`K361yikuT9SjoV_awK#TY)Z&GGQ|J`q7yY@Ig<igv96i2?hyf@>XALq^cVe*MT
zJ+?Ler12541E&C`Y<~fhMV5AQh?-N)l4}E@1T;{~1|y4-oB>9DDbJ5zw%<=@;;mY5
zmX1QdA$NemAg<J5y!uLvViSl)tCuPTU~)b|1%MD~&;|-^B$ovN8o_C>xL%*!xnKb?
zX*IW;Ts407-4<eBT2*Z*gdHbMJ}t}np>$)x#ON>U=Z|v1at-G`uS-B3ors0*$42~Z
z3H=tnN8j2MAk=C5jr8+BNR<AsY~cSJvVni*QUCZ${of^5|5u0d4~za^9m@X|HU(ms
zxBk~d{r}%Xk=W|J&FBG3LJRUhX(nmkiCZ6BwEtD5R`ljWrd3zPm*q3muGi;H4xTV6
z&0ca<95aL#Z#3DM1`LnY2$ehU@r<@9`<dMBgQLI27r1QE<r>D0OB-QDfJX*+E}t6|
z{URU#;fMa=!8iYdhv%ICg7Q$6a~6l+lee+r?80?#Lbtl2F7enV5|IS7X+b|Ro!d64
zZM6BV399W@$whax;?@Gmf8cQHhdB?aJwFbx%hR!SPp+<bWaO}0JX{L7u%#IE&DWdz
zJ~xno1&!s9=w~ND$9GIyti;vC(-|`pKWT{h1MqwBiyL+H@DM7XXyr2Y$gRSY8r1U`
zzC&BH6hiobtX{xAoX_Ue)puO*_}b!gt0vGmC)%*<|Kh!Y_Z-cjpLu)nQQECcuM-j>
z{9md^KmGC0f1Aa9*_#5-p@TKJ%dGX>LP{sYcZ<Y=Cbw$<EG7TX&s1zPDXbW{T>L`9
z_y$lq)a1eNP*}saJdWeF`li^j@P|eG05HZIleF&7>BQFHrxyr!P%wj-BbOczn*Z6K
zwDn*^?yZ}4O-LzYj>b!xUIR_|)2#JR_DfAOOe5C=B9pPPGqse#ffNrQ1@CP7;n4R4
z@=tzIeT@D7Mp74$^<IC(8A38@s&BkAB%5=qGUSE4rPTj$GQ>?^ro_bXV?kI8-o;Z#
z?AmRi%-GR#E+puqR+u4ok%q$QW0FVMh4;VtQ$O+#GXT$}ewgEaBXRL8;M0gGd0mXO
z4YEH!nxS<-rPJl||F9(4nWoT-ns@GGzWBvLAI$d{lvziNJq5~cCjCUz_wb0>?kx|A
zQh%Wiq<rw&dH2xBl9G~R^PhBG<57-=^SReAl2f<JF8&CHL6b=c-zQghe2I6sPjpYl
zV@)8_$PAh-LrGu58mhO?izuv-yKvveK>w!E{jC{h4~_vT1R4<DH)Qd_x$&%h8av6m
zn?L8~n^yozFN-d`*SIAF{>O|FU4t1rPTNul%wpfAZspp}C5TqAVH%P8Cl9UdUP{;B
z6eN||`T(!P?1Q7_n;Pre-IR+o+>#;w3)xViHR{+=k7J~SeNu+{j{Vt=J{tc%>p%m(
z%n5gbD8$gdwom#9U?Ec_keh74o&KBB^fDDG7U!0QX0MntX;6RRYx=XU_LskY0isrG
zW#IrXLTz^w>h%+3!7hFpOBXw&ZQw?_@~`)Qb#1#T*T_DGe1F}OM{IQfYBLpFFAH{4
zRS;Y*D^MkZw!BRpoxd0S{=7A(?q-kB39!J!LPzCy6>3mV>X{#D*JtIQkAEVU2bDwS
z+^zA9{`Z4dUe~ckCLyzis)Di}u4E;B$rSK)pQoG^*j9enO>lkSUU@P$resr@o|kKh
zTmf2^eB=`T<dXlTXX!Q1rV~gBA)}qofx}<CPD)C)=j}#(V5vt*_=3(y(Bya)E%~pC
z_1l7(_FW~SbO36hRc!k9J~%>o8wTiRBEI7`mGt>XwXCpPdyhEa>d?*QHp9b^F`0@*
zS`?H|<+^03J>|`<k7rMqmX)HFC$=OesE=-x`xKF#`%Dg~XKAu$d@~%~*f{@s-(8Nw
z?p;o3S7C#v&HN+dn&?37=+caXu(;YGO8Q<=^?Td4Gl}o_U7EeKOzspRp)Je@9*v5m
zu&D7d6{-7bGqiCou-t(zDDlx~^+Vb1Of2j?zg_hEAHiohk1Z!l*}mfO?Wc?Svev<B
zhC7J|I4vWZwVoEGBK+mdknX5iI`=;>{o|852UeGjN<qZ>3T-tro}YVMbCjRdTSvM`
z<@AK&cGSb%JCDyK%PW(bbCwE3eWh>T*c|lV2QvDUi34H3^I*BN2#f25QAMG(Sr-+c
zZxdL#+#5wKs`ctnMg9GXzx~FB`RF=AZf&jIl@#iq5>eY>X0B=)UL(0|zMXo%9z0hF
zA?T%0M#@~7Ay44Tr%L~Q`+K0#jr|xkxxA~wIgc1#f2IbFHbo8@jd$jZc85tf@zx{P
z#^`fTnmbR7RhGy7WBC6W%;>q`RjG-1OX9ALr{W>pHtZN}W}R(o)6<SY!#)vN=SMmG
zmz?3x{hM$m8dT@g(_1`KmuPgI51~p3ikvR0x!XZxFc>zq+@TxPX=U-y9fsHcbFcsY
z<J_&++DscXTJ42V4g^+nbgCR2so`6W^rNeR4wLtVuB`O|du;w|;x~W9e*fJ@A}aPN
zFOyC|2q7oKQUgp{Z(&%wHK0~7y18roX=FFm6rR~j|9#6pP06jIj_k{{Ov2U{A)^jP
zQ4gL9qc_LYNiLWlrmp76_y{uT)DmQ^sS7ys89^pXOXc;O3!g0Vb+-7$IzQIcqM6e!
zxM}e<bH-CW81tBcsjAsiO9_j7kr_Ir=AZ?}7eNSLnB8Lbelzc2aWU#FzLSc32^l~m
ze2uvHyPIld*Hrno=}?v5P~c_?S4Wkde_3^()+^wx&(iPvuT`;WAFp&pgDFmLgv1xj
zJvoqBaXh{#A0Hpm>t!VtKwzOwjg421^1tk@1AJYzz$J3~+{MRQ=Ts;e$A4XuTMljc
z=BAlqRv2VAPtW%$zDD>6joG=g)TP7JQYaJ}m36PYp0Yst!qPauJBW%FvB&F6va4mJ
zUH<1Rjdn0OFQdzzyW<wOQw7ScsY-kpu8<=7crCY)HC1-68a!+a=W4OrvNq6tB8#@T
z<#;w<U$7nL+R7rHN*8f$7J*G~jBhmYEPq@Uyxu@`kd~IVzcA{&O~sm0>h}ZjYV}{1
z4<}eYQno7nVr%A}w0L(^j5W1iiAxP}uo5ih+bVo(q<Bj%>6%r?{0O3%|DHcB=f9>)
z%_g{i*|ZH^yDqRENXHfn=r9*y9e3S}Izgqmo&YZbzn`hd%BMiHF2Gc9y2Bom2e_KY
zZBzcaChHEe>|J&tDxt~>5RBt%_$c591`4rQ@Y=?w_H~~UAx^B!PuhsC`7i%yCpAkS
z7ZLZ~!VZ4-m#Nw6jIbX|#B!T$Yw(K7O25Fi{zgW^MvVy4z|SbWig!kv9W%@sQvQZA
ztrJ1Y<Os+L3QWIKSkOrW(mh@sTRic(boHRI!J5-4j(PB_2QcQAJMLTRi>@&^#{9ZT
zB+}UGs^jvPX~zmo)uB_((x*uus5#PNo)JHHKgG7eovz2Y8-p0_xjsvc5FejLvNHpZ
zC?+dy50qo8BZ=sdFW|$&>PSs1K^d;|nK||t9ZB|@sONH9*vGGqh(3^ma;BXj@Uazn
z8|yjaikAH3Q+C&=9S__U7O=%L{r+Cn#Dh5z*eN3S_=!>4w9bYL^B7v2sfYv%THjpQ
zlc1!<A+?1U*10IUouZ<xT!?6z(m`<q5Q$j+coDXGoO=M-QAG?>Q+G&jY@GiEZE5`&
z)v<ZQ@8?5ENvm5XwaKhom8^H#&f{7f54rB{ZmoTqM7)&i+&D^J{^6lwmX+vQ<UqH3
z;f`?}sabVbR>1lkS$-9%xTTlOmKLQ$9ref)JKMDe(S@+)ew_oD0_aVQ1;^7YOXmRt
zTy3T!LtrZx``h%^?PbYq7~r^T?-F#it71q1T+}dX3;|oU{S4MXYH1di)Gq0Hkb>h3
zp-9>ZZ81M*I2M9Q@K*>_P%Rf6Yu3~cHu>sd6PjLLS?#3%k090g90!iS@9=;5mFxSj
z4k|g5<rt2=uFRu3S#jHZ`*~Npf=+h@c{oqx6+kBx(veYm#4NC+uCxklH3|E!)}is|
zO|RE-yI{|a&32$r>t0m27L62ZLO_dT75?1&sjvpizc!~kH-i@oo){{)T<9HC&{V0$
za3sajUVfga)kDD%h0^S5SvHYdtmgA9dplgpdk1=4Lx-ny9@L+KItNJjMv(fuCRO#?
zjefo_`aWiIzKLE;bw58uuHZ(LdwM%76A6-=w+(Q;{BlFPe|W__NP}vAeqxKMJE<<Z
zos5vo=|&~On2Fx0x#frFa{Et=(c0wtGiy_PAz19`te-#iNdwWtvv8!dRQ=4W^<?)3
zg17kqv_L2ef-RK3yB<SV$Ox?p8QtM-yj4&X$fP$$DvMj!e`(S%O52xXfLrf36XfZx
z%AJ%m$g6awnf=S11D%4Mx07=GL-439wGn*Rw_!)R_vWKV(h(8A&ba#qz!<tZ4YpeQ
zM`ZX)U0^|wao{}Hrw<QTKE<u5+-(>;Xz#2{FeG6Q@c!I`ht=uV`RB&T_$=Op{eYs(
zddm`BVa6{_n)(Ow3S1?6Q5`}(ATdp|+sXs5vLCC!yJQq-(QsBi6MC>_@9w8rt7J3!
zI&M{OY|a_hzr{=X-Qt_s7v9X8FI|1DOd2kRuR7xjDJ1WxzKK;mO6>5v0@3An9)(B$
zYrg>=-|cd6jyl}3-IrL#<vf|>|Di1PN=mMs_RmeqC{0~(uxowT1gBG>f(pXr(7XCi
z``nOZM?6h}ZLx>EGPW}1K^NJ-Dl1Dy5W70<oHqt>(+s75aTS#;d%w&QAv9;_0*LLY
zrEa-{S$M<lwKw1?-rOG8V)l(5)|s)RlX3k-xzuK7Y=%5mxC$|AF|oyPexEK+rtq+Q
zI*sg`3o*!JIOQz`IAdv^&5^A2QL&y|d7lUDPCLz(XmFK&R~YRs!`IaL@UAkAe+DPN
ze=>O8O5z0`ds^F6fiOUs9M&qumeTYVSnGA(d>7uz=uXP;4Hrt$Xq9s#W^`Xh6<j;@
zpN`=7PrzR1Tt8Do0PSb0xI*`oTFdy=91v9NX;y8Ks|26f*}+;$uQVU`e}T{vb~RO<
zH`&6y{qCl3v6ek}pEVuijI9WoKsYP=<kpBT=N!X_|8q2TOf2vRrCAe81>fc}2kigN
zW=iVJ)B_w{h$i$7J#6WG*7VMh)N4IKTfCo>7p+oXFP6#SrfGLQJ$L$f;eNW<*k_K*
z@DC8=%L@oKV`{Kr+D3*n`?}?V*%rnNG-v26<vs;Na<!w)<#IoNehVga0}eew(pofr
zkG-?o=omX<TU^E#Zw&0QHP*91*x35Ru++3f)h*2Ow~?o&)E%}a2VrN?vo?1*Ly)@+
zmX7^%Ar`9#+ce;s&ED5tDL?-6;TeK&jeu`?GhfkW4-w&*JiWztbqq%Ljm_$fjOVNl
zDg0#*{M%Dd&$4RoA*g*+)y@!SM@VQc9scK_s4T23RjH%lciR7U>0iEBw_#wVIYwEm
zXRSBo3ff{UsqgOHT((~u3-H?FKY#tzQRd)`uv(lJh#v)3x4MrCCwmy=*7u)o?Wq-Y
zdhCcLk>H;s*g!gM`{B9di~E223p;szA6rut&udT>g*>+!!cVURUp9JuPjs0Hvd{F$
zU*_eXtL2}c)V%^1ZXIy_>ljYnRObl{7I`f7^8j#*g#{kLN*i3L-F)b0Ch@cJ@Bc-V
zy{3-)W8Bt1`%@<<DkCoXlaS`0v+>tYcJAY0u^bJ*ef?kOVT+fNz{|su+ADkI=R?}^
z8G~6l*+ZnM7vBAR<^6Sde;HK=2YX2ORKgZJ>y|hAW9I9aSXt`%m){KT{o|9L{Qf_l
zae{^ACn?p>{p9AW4`vD(-MMzt>Cyk~jsAGop5Q`HrGME<|1ukY8Evupc5oaK;+L|E
x|4-kABDnB>m*Ez(`oGKYr)%o}L(6c3dCu?Y-JBmX*lpmS<|XZmh3Bn8{tqrtd`JKQ

literal 0
HcmV?d00001

diff --git a/docs/assets/deployment/hf-inference-endpoints-select-model.png b/docs/assets/deployment/hf-inference-endpoints-select-model.png
new file mode 100644
index 0000000000000000000000000000000000000000..44f66520fd12d1fbe2b48e9031e9a9c30de97933
GIT binary patch
literal 83638
zcmZsC1z21$6Cl307S|%B&?3d%r4)CEqQ%{17nh=Kao6JR?(Xhh++BCM?eE{+y?ObP
zO)|-g%uF&f8?K}vje$yn3IhX!A@f;61qKEI69xtj85s$hbEaAP4F(2X&Qe@lNk&|p
zO3BII+|tGj2Ig~kye2?Pb%-ECSLH1NvV_Q&19|KpxFTPWnfz|3!@him3&J%KQ>x01
zKrPposLUy$`c95rWu!^accw#t#`xjbxU0Ms1=eLrvz>c`+a2;ekqjE=b>Ca(hnZY?
zRI$V?MiD8eRV2VWnIK7w8>M!IW19plcM@w|AUZM7GcuBOvQ0wTT3b-C&Ai7%i*6?%
zuR66s)J-rjw5Z!0*?O^Pm!dEi@BGyg05Hm^p4Ua5Ds%=IRnh2t$d2*2-wGXm;T9BK
z#0#Z15;6BG!cdi5KUSl|a5TT27$!6oA?J%E;E@S3M(G7&KmXZNAP^HEG$yrx-_QGS
zyJRVRVEQ7@ZmaZbVuGl*SnCOuSL9>j-bKM{=HbHz9k=u+)=<vUqvYyXBC}Ced&O${
zP=+eLUP@X^oFCZM@P6CIMwxB6?Ckh&FB!dOrKtA1(_r8An*8CdY6S{O4Pqe&E@E%H
z$S6p7bjTYu^L)01zYa|ZzxHs%J{HxZ`w8g3TS<$Rk0wsKH*by{Io!{@HuDvFf7`)O
zy~E4sE61<ed%Q3}hQ_vo`}VgOSuBe}n4cE>HnOLijaG;J7twdz#+_2X!<74tVXNe5
zQSLMkP4W+`vyy<%=}lMui&c2Z#s(6??J0@GggL|bcM_fF*OdJMt`W3p53uAveDoef
zK8h)eWHGv>ef-%wQ0$?nn6giqOA@gn<DBz!>IhO+sQk$t$fJ-!$<N9qjK!=FFJwSF
z7V%y6F+B0xrFgCyWYb%eXEOk%6Ao2trqeVQvA0bBR{ug_4iDi$1c}WLndgQbo(A{X
zi}r#94Ye~9JKWF5Aq`|$f&51ta*VAp6b|5>n}f}}zh_Xd?othN79|?=zyB^oH<SfH
z*+enzeZ2_7DuL;bg)gao-MEH7aSwq{z5q&nVx@@?`YMA?i-av6CMu!33UlApcH!W0
z8#qV&ZHEHh(Wil4fUXvY0>=(}8O8lwIGUMwD;e5yHc$x!oCc0!*&%Z3JAzh8i^a{-
z!bxEOtBB)0UA|kR<*~bW&t;>i)?s%W)DK%Iw=2qN@86pd^~D&oyX1wWha6{pXIl{7
zlisyn{@UIYC@8+a4~g}CYts{=V;oTlzsP$+>jrDxeFTffAI<rdX;GPuLeEk0Nn^Fs
z=94ePR6IS~dhhv{y1B}k+Rp6ZjpSS+eM&;XYUJwB^dXz0lsQENd<PLVfg-g7S(lTW
zlN+MQBUrg@eO=<-R}<TO#N7^Z4&y<2etIf+m5wHe*(v1y@P+3ky~e0VF@gkU9}DeG
zwGV#i2Nr~fy{w+K0<1`X-b(*V9(e9e#1|1NWW*m-n6&=klh1OE<7QtOlTh~jsg>Xo
z0y(qDY~XZ7@fR`f0=*^?6as2CaU0?6{8}7tUHk~MNL%4EaS-0V<p}aWpm`TYXB@*r
zW77*jk?8(GM2jLL$%c)RBVtZ{{R7vOP9@q#wD^bbpwS;%Cs<4IGb*ef3V%4SQ2LZy
z)c~AgWs^VNlkR32S&;F;j)@dxAs)cFFzAG6<g`rk-OzfWwE5TPvP@E-f3+gQWA7tl
z<?8RFt}^{d{>!MQ%DD7RNv~Cv)I(Z@(Ww^U9S;3AdRj1lCq7xgzz&=bst~DRK;n+N
z2RV?WBSg5j<<cI3q$~ET;sxym@(wa_P*D)I7=sc27WNkUsw{bsy9D(Qnc8>FJ#9%6
zqtxS6%x~?e&faEF)#Fg&d4Hz;DKwPvNB%qQrHp4D^)%l!^R(l%x(eVBUOUQ0%<UcE
z$FCt=r?*XUt-pLCed1ptUy^fVs`5Nks2RkDU543)xxUcsvgHR}B^OK9{q|DbDb$|z
zoMp3Ox<$XGxQ$9lNl8u#)u~O<vMtw1UN)$^w!)edDz+|JDRQ1uoy9+ropUeDRO-lu
zgh=ITPrX<S)e0=D=y0CCIfXq9L=x{&4lH;(o0O}Ztz6)!zC)KT){y6XfOm*^qw)m%
zWagFlPIBhUuacpKv@-2%Pp#_&^B4kg>o|=(jq-WivUDB7+6?PowPm&Nb-~MMwGCF8
zP_pPG+Cyg+?@XFl?C0q@n0$Mrb$sDc?efLN?YQ>H<=E=D`QY7w!c5tuVDZX$Z<2-_
z1$$^yWK*W+uSd(IDb{h;smi_{t5ALNI|KX1jLeMB6<YQ&>lkf{PanY|U>h+0)9uqe
zh66l*phaL25-G+wkqgEG@foKcYpcftWUGTXC&Vq}QwTeH14%v69T71pBB@N&JaIbP
z5t}*5Gx0a#3N9h@Rm*PH%TG9|rChvrR{+_>KBL{rVXXq~wcjDX-~L9OVftP6J9Dgb
zY<moK>@I1IyC9`zY-UU|l{?j4H%Tk9F3D2a<T916@273DWz+ms+OGEp>k^5QV2xXi
ziL%>L&w0do&iQ*A3$Au9RU1az@)ca$rTV3MQk#m!Y`1c^WH)@b#8YK&Ztp5E(sMmd
z5Do<mEe)ges*{rYCeI)KSsnowQ@#*>0={|vb~4LPY@UC<|JauTIy<=zJ1+0JxX0ZU
zPAUiIl1R6?)jJdLX!00R%9E0Fc#R)~OjYQe=u0q@>f5!j=?ye9yV$yckM_>qIhVK|
zyEHf`x*DDXBg%TBjaiH`@2NZ<yhkrBt{x5!_mcOUHm+G%02MYB=>`)6S}{0LOI&+Z
z4awXa-VyFCSR?dv-)a<FDvDS(8m8}mWHx0^+P7@5M>Ek!)I?lQZwwjkfd*d%7k=?a
zcvHimA!EMBw7{6fjKung<%4ZX5Qn3NH%op(B0%#Xf&7;Cqp9Q|QwEM=XUU#xXmjW|
zsv!Aq3Ib9Mio5r#%z6atJOt#Vd~S1#-Z%+3Kf|6rV-H2>;d=@X^I3hF{b6D3qUIub
zGn1tJiQQzpkIk6A?<~@naG$c_<C$Hnd@FT3uYX4DPo?w=p-)tfX2#ErKX%NcTH;J&
zX%(zKzoVn4wO2eNrsM&RJw(4*h|7sf#Ve(kOLZ{H>FP}jm!_YhzoaMsOqciW_n92H
zJLZq(mG`uV<?&22qF$Fy7g~0vLtUlnA0{0JuY|Mob~dnQh<kr=<hb0%==3P_Crv$O
zU_AcMI)-CkH`BZ5ll8RTG{L4ntFx;;xVAF&e{M{7hGyP1$eiX&PTw(PsLsnBCIk=F
zkKjBac#3CWzD(IGFTMw=2#nqjRSdqeavB}^Tk6cv&glGJkv9|oYl|v%v9Mnd2M~|3
z%YPeBeRLrBHlMIGcv8DG<~+LpF=^%#w};)Fz)|aoX9ocve)&fqeql%84qPsxGob*4
z;h`XfI*M9*sw~(5jhm^PFr2WCnWD{OZQH)Ddpm+ofi9oUFabG1@5OU=!c6#{S>ABD
zdDM2Pf46t{=PtMALwTW2QC;=d-5qrk&ABr3GG+s?+gKha;TQcc+-3RY>ZP_UXe`!R
z->U2$n^|^~cexo~KHQaZ>ved5pE0^IG`XK_OV><mi%e$<p!C(yfM8!#Qd|6S?aOLP
z$L(Q#knKLu=vAd{?W_0DT?Ica|8j|Ov4Uocrsg@vYEvmvnewd5*_S0(GxyH35S`Fv
zChsKgFLwcL-`hYZvTN?nphd_Y{0V#=fC;NyxR*ywFLYME;<$XG)ZYHHl?6YUS7Xyu
z$>k)@01bbNTq<Mq5rw{6q?b)s)%p(NfVaYDMVItZp2tQ{mFqRt9R+=1a^L1#xy9t`
zZ-L_(d;`4hFRk~FztJ)XF%3-(OFRC!6_xkZ?M_ydcTiZlT9>t)0GqbH55)J^f3h7Y
ze=-pCWZGO_I&M8qw3Ar1Xdwn&-<8Gbo;CzGWNr*KT^}{PYzS?nd&f9bJhbnDrvV{Y
zjGzXvuVRbt^HeA-mM%q~Q1i3a#X}$7<1ZF+w2bMD1R-`$4e;utr|LJQ{dnR2*Qraf
zr)_7=sZ1SEImq(*YSR!1s&k1sKJ%dSo_qEhA_a5vuQ#{ao`oNIUNGOU?ceuN-UzGt
znt}xG87^mPCR96O+v9xez{?LzCo661tLp{~hW+Qy_?>=N7QZk%kI7*sf5Lq2bf$4_
zJ@Q%9#GXs8$MSy-QvWvCzKtZp^imLW769UIfLUz8fca3Us0d5-9Z4h&AR-+@Q40U9
zsolAt8hdN$t8?!{?JCEG{r4ler@#$y-7Ga%Sn(AQEKzVEKPzi_4D@>O-AqfyTwWfA
z5t>GZL4YNJL4>AYp+N|i^gn4S*!M8-|Hy}ffeE#QLHJi41!(;DiG_y0IRA{{e}=#S
zpucdT!6OUq-?b4iv*7=ohC_yy!HBAg%g8`uRTC#OGdpJsdlx?DSubb?io<7ZXBZd)
zy1xNdMuqkQ+Wvy2nwE=}yd0m2y)CnmslBlovxlw2-*#XGJounVTQe6UDi2#5J7+!*
zLF#|h;De_BX0uRJ{iBMDwIH>Yyb_hTy^|Rg7c(m}E42_R6&00$lc_nMiiFg^(4oHs
zsV!Vw9QasR+}+)o-PxJ#oxZVr;^pOKVP#`sV`GBWU~=}fb20K@vU8^SXCwb^N5ah6
z#L3dZ#nRr6>TkP7#`dl*g4EQ1JNnP_&+jzzu>5aNcFzAA7Ic6te@j?CF|)G#r)?;z
zz~5XxB})%88*K?oTj-oY`w-$}V-@&E{r{)rzdimBrq+KkKe4j&{4eVN6#d_*>dt0P
z;`X-CK3#<VyI%i7{@=oXAquek9s2)F#XslyAGy$p7D5$Z`Ol(3ix@FipzBCxDWRwa
zjiI~j?*sdHpS}NQ{5K8qVxNw4hk+4+k&zHp^ME}`2c*4`yc^hfN8mO@g`D%A2nJU2
zl6BKlN(rZCAl)OWCL<@q_$gIcfQC`(jk6Ful3XDXED91W<M)8i=FVxaf2p<DyZPJ9
z=-J1YqwD0N@+0VDuc_|d2E1h~tFC4fv$T}Jxtv~%!0z7kfAYKYgTR2_W&k`WwtZpF
z;XNojpJCPk7eapbu&r2w&mtt62=8D4a8xk=pSKEOI<jBXM!;AE2I2qn`e`{}hbJYY
zq6gw%eV)Y<Xty$d*x`%>N53n$x_I7%7s@$2svsnhf*#4B@H`3WJkJG*y!t_4!GRry
zldMmG8>|D$Nns1n=KZf(;Rg=PMx+$o&J0K7K)`~)LbgyA6dK36@T;uQmjO@+tq(b%
zM~)JG7J<U#yx*NabZoFsfxj0i^QyW<B~mL+kNXB~>;8TOChYFkeHXwd$gjh|qVdyF
zC{ZIL(}#j9r$==q$>0~p@PZFG_weiAk_fPckZq0-9$*v4t=ta}592a^C?pdT$0a9=
zY9}YhCC6LdS+=Mf{;*g)H|Y@XoRI8+j!aDCIB-MyUjw_iM<bDXoooaLD(;Bb1AMSy
z{N?>ch|y5Kd>JmRoqe=LT?n#<@eiS$EY&6$V&Uf>LB=DwTIC@`_JjG?n}-T(vLm97
z8d(O9e^?pAD*Mveqs}YpYe90G&88wFDM_cMrzd7sYV@@Q9g>pLWvFgunP2O&t~xh<
z%CU&#Kla1#?snCuaU+JvmTYRcD&2yr)*{0eI30aMWGju#UdD(oDZrA_e+_pZar|-J
z{jz-mOz>oXvvGh`a*mbl*crJg@>P|JY6c56;(JkL<zib}?G49uJV&~(;}sj_UYf5X
zZV-8x2ew5u0`>Ta@#n{}2-<TKnr_-<ew@3x-9H=!X#`_qwMbEcSpVHfsf_+2QSe}u
ztad}V+{+^qVNEPq<1)Qj0Of^@Ik@mEDIy|bFonM;0f^X@1Fcm*(SoGcd1~!)rf&rP
zS%m5qg$E7>A3Z2ulLO0!UbG6$*!n6A<}EjOs4Wc-3G(uJNem<tW&7~}I5p>$Ep!Ap
z0xV0b^=PjIKUq-zg`zp3EXS`M_{O9NDMbDO-PFS)EF3I*DlW+p>2H@2)pvlN56!Sk
zSHWf#r^PGw1$|t|9JX+mbr^Zdp1VjIS_sIczEt(%kvnd4#b%hhd$ktJpOw6@VPOCD
zBEMCl<B6RL^3nFk!Yl;HXOpX`#m$67A)a+ga-g%Z_gVPw*o*~K+RA?rLO|leumRv)
zfPAsO%y8^{^!Iaxowhr%##~`$iLs&z+bowqPLNtDV7Q_2Sl{vt_4<Bqa07n;n8eDW
zEVLAciGn|t#7U)^e1jY|)pJXFC9iDu*l7NdBi6q|@Bs^tVDZwc?9Pz{K#36KC#ZFY
z7v3<D$#vWFw0*!-WMI;W-G##!W*+d-RcC01sJG5`=4VO`jwH{2$Fit~EV2WWLZFxU
z*0Q81udHfjcb`xRDEi|NG+G;k-sDcrfqXq?@T*^;00*1oJ<7uu5x@uu!3O0%){157
znOo%rm6u?2Y$pNrd%*1n#+(^Ko$9r~1SYd1xTl5wGj2y<*~-Nf#S~?>u!yi9FzXB~
zLPDw$F$;F!5QaiWh?OuY_g<<Qff?0It7i=(6Fe{fMxaucf6a!131%haM(YD=YU*29
z@|UCh6{9r`!|BBpuhHMz)~S`j2zT{*EyAU863<zUjk8%6Q`9SR`kl^j6X79V3Y!8R
zERvu=2of0P$=~!AzP$)lXYS?}%c$VUKU5s%Hv7|2Ai4yX%_w^yj<!LSXFW1T8gm!L
z=Aa-d8vpZX$4eiNAhS7un#&Uo2<sPOYgm7+HDv~|kH49rjK5h)K?XPZADh7{8_5Kf
zs-vd9VX2}?`IRnZ>lDUUM|U*;Hp<IIAve7_U-g3qK_#b?no?G~UZKNfXnsssB~N=}
z-t5PX_hRi_WxDEh@|F!plbKvnpyHccakQu|a3_>)&i<FrWkFy_0CJKofCmL`Sj?h6
zqaGw_3#vQx>ZJ#rcqf12u!Bx10K}-B3%FKc^pMI8i;sznxJF<IqW<{sGT@Zb^j_>5
z)Igb&D%4=0n?KcgI%9FZPOL75a7Zkfv`HkdCj3S0l$<9`VpFrbggI<2(1w7b)_MjN
zZzqWIH3-|sK}1l5|L^L-fJJ7G0AF`tDp);&Ww$i7ra0a+GQQQdz^47E<nOn!pQ?MC
zuUem@a2?kF)!LalOAM~bd`-j1|6xQ!b2?5NpW~K)U~yxw_uYZc>pXW<2>Ry&JMx*e
zySxDS+u&5Yk&-NAOq(r#1ziiB3S^J`9&q<0ra1q<>A~U2zZO+HlH?Zl7Iq>y&YSrU
z;TsiLQn5${#Z78H8sJW-?Qy5{y)01xTt1v3BBEF~0l}b~sAG`9OKF-=5}LoLl00uA
zh=jaB5owo8@w!&htZ3l9Nhr&TKw(OKZ0bq?#=EOl<eLVDg^g{&&wL1wEnjRhC9Fxz
zzto6)2=L*;yr}~SA^VA#;8rH;#j(V*T@Z@;p~9ru9xkOnP;Es2I`tSI(p2H`?3a!3
zl~42&%!)5@K&l^~4O)_AwCLvFjhpC(Z*+iTO2td(qz!aC#VPmQBrDSaM6;xbZ&#}2
ziUVH%Ba`JLU^p<vXc=Q$oh3thtCVS@@#FDpy>7i`euWv;xzum&5x#i{M*gX_J-f6*
zQUGlAO+kYEmZs9OP?Cv{k1sV-60HE~R~_oR;8s{XP*}RWY|1IF%wmdbj~uG=^q>(n
zl`y%SOeV0gv2*bH2!vj?_B|s#!Txi)^L(JpCy=&Xi`p8y5Y4~tm`jC$RNcBi1e={b
zy&{Egk<bwIvw_?`^z^zoA%HyebS%OT)0BK;iZ#~%q`4I}<wluT{@YHdLmmAEAy<aS
zG%WEf7k3n*&tV37T$4ocMOJI;wC&32O5I(a^#7bQRFYw=$<!`LO>Sh()Mm5$G;pZ8
zF<~!6d}R#08Qy=)d3g~tL5GrSY1U@CEIDa{&S9K%F!Hj>TUI69)P@RpEqs!&PLX=e
z@{%m+^$!J}BUBuPiWrA$Oi>ELJb`=-zubsyD}EMKFW90GCh~k>3M&g-CCj+?+ppLx
za`I@;5u!bR{C=-n%kmd|m$QTmbwPf+L`_IC>?%GNUAa|9frXJ3I&I@>QdQPes&9IW
zDn)$x$CtQXulD&mu)Eg$qsG4bVd~8#^1WNJ)}Gn)Z+Oe`S<MW4tE(yWw`z-q0N5{m
z4HDP(MBVu54ztnIeyWPxtnxQp2EWG{$GkIOzwepy33?0rD+6Y0DKD(ZEXJl981Uvx
z|Ja6saMeP=qwqdy-@D@BZgUMzO-z8W`1k~>8XE6j*^Cj8_=qmiuxok0V==*}_V2Zy
z67AxlvRTAuB4hq>KTkDF%81=Ox=bXWK6vS2AB{t7DJ$+2Iro1sGsA!RK#zl6Z#Os1
zfbulqb(`q{`7GYR$hkg|w_`#Dmop4c85%qS@1rC<DI}NMdEL-Ifn`CaHGx;geUbhI
zkBKpmUD_HjU+RcXz4vF35mi|iso6H;w!H}LcTdUFOxO3nTO?8B#INqB$D_Vic%rV4
zFJFSLoYWY0V0g8jiBw3gC)Iwe8?iSFwVKvJX?0cz?$idC9;l>;?qR$Vg{%`6j0K$+
zsBE;F#?m4I6tWevaTc)^(hn8VlU`p%JyjD)+*p$yZ1%8-R04#sNftRO$vKqD{><^2
zGnHrY8w?zw43)mk4K0}Q%ZT0+o%H;(KB!oW*^6uyK`^F$OcnYo=e4hdKcm6|@K5<G
zA{^TchDk7yc$Rp!`E#dDY_x(@vRDt>!fFc-Wxx!r{R?uD?82g4TOxia2X7DuG+U57
zgYjL4dfA3qkn&7%Er#weU%kJ)tFw9gA;%#?-dRHz8F#O6-hYwr^Tei$2gR1>?BE2=
zV1*pvcdsz7FbL5E%?&&(7)tgRzxx%3{8E(r@+&L-2tI0k{-E)(0F#_gB~z%aNd1Gh
z6uRIS0lT^_)lN4IQ#!;dTj(LvMc-qNRmm2vgC&qM>X$7KHZ~jtwip@H<Ce^8yT|G2
zLf5jvVd$O1*H@0G1<0ZKa6r8YZ^7$&TtWh=E?^uLjfocVwfouR1VA~9Rg3j+wrf!e
zq|)0FS$FCUu2cNRa`*f&n!%ZRxAAHpqEKPbc2H8$j%l~SFkaExnr7GjXx_Z_bX=EL
z{tCttRytpAORqeCT6@YVs_IyN?l50NVys|`OZf3N-Kf+T9v{1q#pBer4}%iH)WPc2
z^m}&&NMkaofK@X4t@QvC4ZFoL({xmo#H%MctXL2tAM_iOlaoIt+2Z+T9Kjw4mz)a2
z?|$6e#})yLf>B5evwgFCkzsGJP|hh)zkgo@DpzTLVo>%$L*<#E9<LGSFKCTg1(tAN
z*1o~muh4B62R|8S*4eJq`?Kh{rKqiE@H)T4AmJE%<2XR>o<|9K`4k^Ps#E{Tq<^x}
zaR=_6kT7ERwY1YWtd!i}>C^W{H~9R^=?GpMBmE8qFW;dVeo0udz-7nz*$yxSV7r?1
zEnvmAr7qd9{Fw`J<5g0(4uitGBTWcmu#U^+%k6S+GdzwP7$jluv*vNl2B~)@N%yKW
zIquZfQD5JD)R#xq*d1{*Qbv*V2=B){T~RVOpDoOh2@?MI>CHcmo@%7%l|i<+W@OA#
zbj5Baf8C5A>Q8<Lv!X@DEmK^sV^$M_%)3+fF@&?kx{{t%yOz^_#!G(Ex`#kaz9hE|
zUw3*-xQX*02$rI_v9F`V)I1LnLsK|pqYJBnbh<Lzx|zqikNaPamg#i1cKMhaH{lrH
zzh^CO$Yp8j{ZKUfK@LV(v5B)oo(J@Uc9;Y4(|4lu-<|4xi%elw6v%M+1U&CB5HR&@
zQ3ReIoH;;UxXz1B-@p-GHVyK&HJ=Y}p6GO6zEDJdukU(#`NDUeeHF*-PK|cI%z4^a
z#=}eD8F-DYXbPztI)<>b7rK_`x@Mg&912MKZ6f2CHU|*NxD<S_=qPB<Q0f6vK9j=%
znMsf+FL2;=C|~|@D}de$LZKH<2c{>0XXb)vJJ}vGRx=;31rR8#0D-*F9*(zpb3Hwb
z6gXyS{^|JH8+y81%yG{Ox;dC~5iA+q|MSP`XV#B;iY13#_i-Zc_GI>Ny;D44@|oWk
zuJ2atXK<v+vXvNESYnn|G&)>0XBsJ(Y-_*GCiSztF5i+CMglOIJW!-?eh+PSzy6w*
z0+6rUw*8cNrpwR2xxHDs>4}N3xIL=-$ibKwO};X7C)jdr&wtc5bN5jKl@LPLED%0y
zuS!7n&|z9q-_=qxe3-0w0%TX_2#3sf5R-GUu9)(8dZG9}`C6`yhMpwI1J0I5^E|;N
zxKBO?FE@_tXiLdo0s`?~Q>4V*RLcS_ysOUD5m&O_Z|4)&Xn8EQ+kQAMCg}iu>DyO*
zgZ;1xSp<_D!T*IPX}U=saM!e<rjn@94}$J#fkJ&x8+rJ#Qan;+0`cMK5`ADe*=x`W
zPwZX6?w0_2YqB)oao*V<80Wi$e`Z=K_omW#YYr!bU)41F&!=($g5Xhhjsq3}3@Vge
zl$UA!&}#%Mve~zp67dDhk8(*DFzF!3W5~16^NDz-Lh7DCOv<8bo|E8@=Wh0?ri=>C
zG-v130c7+XI0PB$i$_D@{1hc8h!EI@PagOT57E&l_JYHqPIG+<pDkya7*UA*Wl3tU
z_&E6IF44bbIw8H`v(osK4HsdT|0+K|+3JfiFOvhuS`HO%tt$kF*X066+JV(uhFJez
z4!D}e!q1$Dbnl1&U?+&5lAq{Pq~xxNO)sM5SqvBE()08Q!KofPLR|*hcKO>7zTr`2
z<g=Yxm(wkl?MOcYlMfHza}AxV4`veY2qNC1pQ4{;;XM22cYKV&r*PR%^e34gp^}I9
z<aV$nn`O;R$*8D5oE~1{Q#HA$<HX#X$W&Z8uM8~cFobR|7l`Nn)SsbWYYRPgYt2&v
z^~A9wh8?8Ix(AP7F3h~vsICSfpZ;|xG=1kW&X8wGLVXGMRY&QA+xdL~`6$_(5#4?y
zoQ1L#i{GGHi>Z$y4pa?UTQ;PFFnfKP?`9&Co!7YNNqGe{p|&3lscVr)^J3X=7~!(a
ze82eIj|!D<uNJEA`o<cfxjo7FOhJ4Ouf9j|hLc^X&6^@;*$`8@;9JjK7YNN3To#p7
zU3lPTmY2@X#OK_4CibXPidPPrHcd&%eDmE1w^JQeb_0DxFyp#69=KH$$O*KUe%`Ue
zxJA50oXBo&2sDJ_z-q1;3p`qmC(@`b;2$Inu^<ks7cE|mDK0`4P0V4DFp@0W0P2o;
zLS7JSdoWj=L)>^9r><l#c48Fs*vEOq6{WaW9pLp{=jQBqS}m=A{)sbmzRwi)C=T$|
z*P$2_?E!XN-fbA8U^2Jes5GB)efpWix9fZ)vvVmk``Guz%D}*XqTS!UI6yBSn16%C
z7blYQf>i)iIG0O4GH(FitxPFPlWjj<y$%ek-^|ujOn<rKx1I8rdVL-ZB6h*+33iVG
z&8ATXz~6JtI*216DP%H$e_N5t87e94Y$VjDk^#CzZ}ldGBM(^k`2yf^>X#G{0ap82
z>Lp}cKN&~Zim&fmNcw@He*e^<iFF#Xa6~@&|Ao73u>Xdl+$$BF-=Za2splr&xhGwj
zp~Yl)op-~*VnR&iz>gIF`-cOt+!-Wpj;GQw&Hb$DW>OrB0Y#_Tg~4^j%Nk3HADn3D
zBRX+W8$#)^)ak=@u+U*BOwx%&7{hlpIJsj!meMCn4>Y4-e<k`9uv}-aC`-Wd8%y{p
z?6>a|!w_zeulss3(peRNoX_R`Y2%E7|9(YTKa@oPvkNkOe*S4R1cBpq8Z5>6tMB@h
zr77jbL(#KuBGD&2fm<B*RRke=6>|4H*QGV@)1~9?Zdc~4w{j$Jx}MKd!QDm|?ay9U
zH8H8TW8AcdnV>UX%^8yp@LldsH2?V6D_J|?&)4t5kgV6Xr{eI9^9oRY`tx0Wo%Q@=
z+x@z%YJmb>GEE0RJ0)nt_jlTzr@36F!i3OsskWo><JB&03a#(cP4*8O>FIKKq@V<Q
zy3A{Qp#rFnNP9HUM-VYM_-1H;a;D|HU3SLfi)1J!xdm3c^nP{y@O)ZDhUW0|W)RA|
zsM3R}4iJb$z=Jj2>8L1fD3ViO{E3?5y>Z0Rm?vj&shqM&bTONB0mI-Np8_H>i9+7%
zelaJ<Su~1WLLh|AFIsrdf!oG@FzY5TMku!p=~Svrr>@q0&f2>xC-dOPKnAC$h=US;
z92*RNfmq<@yq~5=186hDhh_FwiJG=5;tooJWj*c@lPJ&T)qYGfw08|AO`2xA@oJ;K
zqG)GmIt|0Nagafv9fzrK*tL}5edpS<7dpkJKUC!^u6hQrD)yXw!+~)l1U)uC!R595
zB#oZqS<F5Ps@i`&ZP+OCzAwDJt}+>z20@%X<-CZoqscsTh$XBJZ9CLUG;Ut5CuSzI
zLv^OcAJ5vKnVTgv(7w_KD&bJ;xv#mtBfGg@wyvmx?b>P`(Oq|lf*<RXVPV{0BmcVE
zxZ)xm$r5;&Xy6s@b$fJrrdwmq>3TFfgfa5f^SsSA-p<}rDyBW@tZAR(7i8J`H3oA2
zTE2UF@O75?b>kJ{?)A8vxY`=XB>~osc1NHcKf+;)-wMKmjF%Xm>{ZFXbz>l?q7s{E
z@Vd1k;XE?TzLy?%pH-Hg>J5)kB_+t>VfGTd<F#+Q)!=(NFnORr&kaT+)X0zW>OKI}
zCr-8d@;_blU>z=+#BfSc<T9j{Wq(BQf;<v>z?4c2<?K7F(6Y4Jfu&631?dYs=g1Bm
zY~dLqK%HB0ET3K{1YSwTGOpW(O5rQ;z5DX_FCULG?o&9AEtbwd94wf1%zVcOk?11p
zx}M5`pYGUZC{EJoPM2Me4?{iC4r^G<lk|VuB?70sHu7cnlNfO7ctbNPxK!~a;EnHA
z&n@vuLrXVBJ)|}8kNc$FdY?A>MlF^a)FcqFJO+bgJ@q%J%Oh+pSI*WVv%ZYb00*MU
z3s*FBmzC?*@6a&w(lww8N&O1V>9qX1@$!BEt&W2OGO41?#_%KK>vS!3F>;dGRGl~y
zxURy4-e`WCP3OVe<tg&bs{IZXJ^vVyBU!B~`_Zycx<+Y9-g!d8l=nv5WQdsM#*k}^
zovh2HgMqd`VqA`6mJZ-fuw)Z0o)Dm|pRd0%ui^i5;gyG86!PQ)hxOL)$?xf_@Pjg?
z5){(DiLX5mIE=v;_^MY}X3>3)x=ZRe%%{%I^vG|w;Ke%`(KK)su8s;Mum9F1ns&XU
z11PxC+zzD#_WlBn9dXt!7<f-B3WM{OexmC&n2#Y$y^D>9os|b3GeJ^>XPsZx+}Gq2
z4UUj8Intll3TtB)9uf_J$<abb7K%a}m3y68qBfmB(m$H;*ssTAfV*n~5<l~&00yhQ
z{7?UkJlor>be;dcCVX0RTUi_1pH)@Nrq`AgU0wQ?DSy8P0&V&h|6$Qyt6v@_ADu|&
zPjp*vsz{B=ybr^n=J8kpc`0hO8xK3)xelvD83G^i(eTnlGbvcDX5V|ARE56-Q+|MC
z3Eq>varPBm__*5suq|t~5<TZ!>UBTHty~X}bRrc&$b#C+;swD|6!?M3vnj%NTC2**
zIN4#l%F}GhvGL4vJHafSGhL?L(1rfFk2MGVodoOG*St!`k4nN9a7V-pBnX;%z9rV^
zmyt6N8UEABT!kjc&2`01|DXFqZUPbn-p3=a<ss1iU3+@Vvwvvjw%c<ADdsZIfnOKL
zO>9T9zAJC&o;F^WC=duMpLUaj<8|Oz&!R){E#pb?Xqt|(v*v!Jp7r6TrUE?WzqRIm
zEd9!}HQ4FP8RdeMJ&qe$%>)%}3I>lZbWH9i_VXMiI{C7-o11ebD^(#sRfB#sR1~yQ
zAHuYr4R<u;iSnBz58i)Eob<IP@WNdT2=q2!$+`~Nt*-3<)r&CP_@U*lNFe3DMDqeW
zwHo+Ie+6&N$2et*r*fr<i6@rpJrXW^V;1>x&E)LSJ?`8F6=i$O=JMtQ?=1f;e=UDG
zJjM$!{5oHw<=IU8#0qV#;Y^IpY)M#9)P^K!4o~IA)69~L!v@8K6SF>MrTVPnRjB!*
z8;uv^N7c>54B#Ze<D_aJ)&e%{S63l=>HW&NJ=u4n__b8~_Mt`TSnw4cXgrPgC7yfc
zB+<tv3SNfhth8qQxATPH0D8TwtZXDI1UaKWOALW{bJ!*9#>Ml4>qD?LnZ)C|+lsBr
zZoFoS^Wa7}eRST6J*9Lyzx|M5mh33uW3Fd$03VKD*hQ}TheureY^W4Vt2nJNZ$ReM
zfU3(RBlgJd?&J)8Z#iq0SMq*YL(cdgbI6!Ng~7$@C66VVuxsucV3+-L_oN*KVXzDH
zvHF=~^j@e1nM7hb2g;-3FdOj211j!w3rkDmzDLMfl$14J`EiIrNsI_8O1)ENiSz_^
zBH0<BrWP){QJSU>O+)fJ{kO|lf4{`rfZ={Ld81OPf68ex@(;x-@cHy36_4M9wgRD{
z4~~2ahm3m*q|&J8;A*6Tb>Q{oT7?htuye3t-@*AT$#1k&ZT4c!68OVG2xxGN@mGUZ
zX}MG#Ed6zpkmB>(Ukp52wGZFC4yL}Lqdm6lhK!6QDstz9kUH-{L==VZg%z#9-BzUP
zaR}Uc-r=8`->=l+kj>tbIZ-&yp<w1QuRm>|tYXTh!#^07iy~0CrJV@emx7dIPU{_K
z4nr3GlAccmFsc*86rEpQ5M@WduCFQAz5Vbx&0&=l<WknnhCG*vE*8}fi-tMwoy2sP
zILla~L#N={B`VLnmlMi8Jpl@Pr|zW3%);lmkt|RbnaOSZW^p6owjF9NanzUHAw){x
z;P@)6wgE&R@Xl=6gr%_Pz__Ofz6-gVS6kMN-SfAF7hM+#uqDaU@cwQ^cEJBDfn{im
zC<;Df!Cr6h(aaUGN|{OlsqlEdf_vo($a%X{<Z>Yj;5C9IdOoo&a*Yow+7N~vb?_vA
z0OkGBtb09c(ca0jDh~Mb`hcfMROh*7kGU;el}UAdJlA%&e9RF!w>!6FxGhKmP)C`s
zesU^Mm@?Zl{R)AZXiMx0cU0d^X7}d8AmdT0p}SVs8y<KzBkoAo#?E4VV!7fZcOLze
zu|wyuoAgNlUksfTH_B`dGQ!+4+Gc>q03x8o8`#qAUl&`@C@ZGw$FVmP4LvTNURhvx
z4qBqm^y#jLcXNDl6!e=>^t4AM2NLNbmpJ{>Dx_J4>DS)R>?C6@)In0Y^X)2q%^9(G
zS_COnbzDGqO{L&>w|5^NKQJ+v!OGEVHqtm&vjttSfA9>7do9QW{kE;&63tSl;N?o*
z64tyd_$ri1Byo*~#$hwu34(Nm^wW30UL9-S48N{(Y1i2#%P#2qI;K}MG41R=*tL$J
zN8hiwD;n^*Y8sfUBZ*3kBv#}-Q>6XDY`@>IXW@I9gdc0CPH0THq;fx^H=N`!Kvh|V
zJfF%xV@9KfSJ$K}yVaPhEjTC1J+fqMii{$xI&YYi*9Re^DG<BDK?O9{o?`9Q#M}+*
z%Gbq8quil#&ug3Jqbs!HAh&U1+Obo2AqzOC)>6JLbcAq;Ut4F-@20&B1jSbI6Vs2c
zKH<1R(6}Pscc;vpnJ^&~&B!>_Z*C5l?Yf+k20Ko;>`fAIWECJEgass+$kq1yr+u?E
zpj#7eif!Mr#1LREph4m+P{p)++Y+gJq00;YW}Jb9cQ(RHDHs!ZF-SmWk*d)pYCuu5
zQ(JxV^O&Skm~FrJ(Ky3UilTxW!KX8HrSSN#j8>vt-HRQ)H*@|epVjuriIsDaHisAa
z+h6MU!7UeYRA7_yeq}Sn?)$I#a{ZC(&Aw^VAO+rCwRzSg)4Mg#{q&o2kfG^zI)(g@
zw8hg6u{mELZCu65f*~j{b$p(O=e+fLX>dcZRnaTx;F5$O3Q*-wb(ZEl{>kuwGaXE4
zfB+D_a*Fgydx#OZs!TTcin%BJ3G;mll2_|#rtcl^yS6;ntCaKKHJq#=82kYSApKgV
zoL&4t-4(l*GJZ}G8w{xCW=3#bD8@IfcfnL0@tKcTbzTX1A2I>T_{`FJ(MrpHuXGlO
z-utp2Z;9RJeeYC|`fwgt=18RjCz}WnW6QePH*v=6iH6ptE(mXn(QkHfEO7LJJnjp`
z8&`C?Kwj|h4IT?}#m@-I-jkARIb{E2<ng#~i;1cd=beZakld2XC|1&JIBCG2P1v_+
zFoq4<7z3Y4dmSZf%GH(*US!ISU(zODLFjKFp)+z&ZX0&XD=pCFZ=0r!>bP`JV{*dy
zCNXYO-sGHfnd7I_Z^c0lR998u$Diw7`{H;4dxP1v_Xf&anG(Ys5daFW>63<F`gb|w
zAftdlHa;_-boR0-|N6}=DS%cuiI~I1kbAz%{wr!}4PUDC`C6KS(0fJ!p4&5wT5}UK
zxn>DTIf0E2Jd<3^kKPCXva{8qz}_pC<xCoMib5<4tbZ!OEuO%BhSz?Sck*I0BF~i4
zJ0f406wX8OzF6_hq_{lo#MtbJaA0nyfu3$EmXNb@-B|iYMn(z<TH9M&4eNHAF8F-E
zb_E2_))b(}E<IkYBsKh4Zg6f_c-^6V%__(ME^l?pMD>ftM+IIlQojn`uaY{q?$P%n
zu{4?1@&*$vqzXJT)i6DuR&28^a&uv(wY}@W>4(WSkrt`NpzvXB)(P6H80vUF(<SLF
zK`(qx*8H{DyfXi;F+`I!mgV>e_?nK0t?TAi@ohY<u)jM?)cYrTB=|8jSkl4av~D4(
zG^)R=tbw<n%47KsNn%B0JhNv8bM(2KpqR1E7nI?1#qhK*T!Qpl1GtBcDeUkHFF>~o
zhxexJM=)AnW6sWrGf6#l+>iaR=HeH-)=Mb@RQ+$p6Wi+aXZr$C*Xj0(_2HkKLrfC4
z<}_cWdt%5ak}{oHU!S8Z>=!M_9O|nA;CXQ}$BFf|#0c=xFFFVfljUZ<jedHBxL#0^
z2%T&OWs0-K#dDQ6yQK}a5L;udI`x1A_KS)(JDp=$l-78+Q7|(+j_3>o&HRTP6Cu6_
zc_50Nku{X>umcP0Nyc!t%eB9)`}Gcfr(O)s)S3>d;I#)O7T>Ih#xfuz8gkB`K-F{n
z>E3%XXH~8nVfbWW_5Lpk9hoF@J6ZL+_Q+jbKe$WLJ|=LKX_kLqR>h7Ax;KwU_+4h7
zm+OfA33^#UlU%N=w;ftx;c?)^#9iH(ZRqH}bgC&`_IrkhZlWn9|2wEF(w&m6H){#~
zM_mee&ARxJ9qlU5&E_|Dit@(1Qd{&P$YzsF3N}Q8Y$3QTBTV&{Ys<YOnOeIs`?Ht<
zA4?uw=dL1tPUz38A=2<{njzk{Kl*BiTs-W=a2GgozydkW@qUh1y$BDkamN4}?k)rG
zA~7{2VH_z+_Ew(r*DM?J8k1~cBsx~VCj`dn-e-D!nf<&isJDKty_r2=2<pLb>A77<
zbqZU9)t6GfAGjW<-W1XB!KM#@uNvA^G+cAFdTM>~u{th~-Mqjt3Ol=hro2>%zN^Jk
zHd@$y2Nolq+Pk1+*}5Fv-i~15+9mAjg2xiTPCBa;$8tSo{tV^|IsJmLThNMk8Y-_o
zDH^=NO&Ax{u|VIkuYeQA{k8nG$gI4rRF2AUDG^dVTB=a#w9Ckyx-wv}ODr-c>7caY
z+>1x12fAL9qGCWquQ8;0{vtbaFl=2CWJ%V3`};#AN%Kj~DQTMf`1|GZ7Mg=!zT2j*
z!PfQ;C!sg{>NF77?W*x;FK{Rd=I}v)^fbw6f0vX&_E(`2@PIS8`I`!w!LEp&2`c8F
zm-~#hlxFwgSb4AOV_Yv6R7L#H0eGZ<or%KiO}{CZy&_bMB`msTLvi5v11!`Ycgpi5
z6aih`%BF@;I0N1xd*mtLF4WFhzv3eExDTrA_wNWkj(^<Y)C&bukOF{E)qtk&xFPyx
z6tQzK?~JI;#O9j&V+7^-tL2blY5&ABYMl%C>2`m2-@FC4d)b0)kqiHi^)sKrmvJ8E
z7?8v90?&a}(Ll$`@CTcQE?k#`Tb=fF$SwE!S6$f97QsvCF;oErE-|5<au)RQ$y{&K
zCq?dnG)FeOogPu_f1$V$7%pcdGui2^aO^yUt5ChJ@p%PnxBDQv;>x460IJ42zCz%*
zq?V*jKBIHhmrUap74>(u?VRUNC2Uej?PL}E^n{R~F=H^)<3{tPoCoVOw_!3xg@A$N
z_Z8b_$TR}5ZC+9Eyhc~61DQa{UmK9lv@9A@^Oo&t=VMnkZJ^^(f#GCY)AedRNdOy}
z`-pl!QQBEa)Mi%sei%K^!$f>T<8IqsaYP|!MF#esDLyLa1J7Rd_2-1jH{2$BdR|+*
z++%LBQ{vi|q8fVG+}jUZ91iyo^A;dzD<H5WbL&v)_@^f5qzJVpu`(*++trT2u-U-w
z^rq0b%J(QHo<^YQhvm9ZqCqqNy&SgY%ccjj7;hs-H#b|t?9|1)2qNiHg&nG>IXvT1
z2J3YQP`YRF99xM3Na@oljr?#N9HK0&1cgbVTH%Xllq1S+4Ml7WgcXsT63?vN&y$aM
zORws=j<Nkag&rlG^S&LQ)HD%Ig;)j}1r^nm6qJQiI!f6tkg(GFBst-x5AJt6X1H4a
z<nTRqml|5-GKt<xfhh#iMH4n>j?w0M!ZJ1}6x(mMBWP90d&BQ~SW3ZJ&n3^e8!IG}
zBg0s)rZoOj$G0)MGY@7p!xq$;vKn+eo1O4$H%`++zBzDk+6+1N9YBuEj^6vzm4!IP
zppUA*<s3%}cA-uX$Fgbtq9<VOR#Oz)hSPfW-EhH<kHnTM)r*587JGYtl5T)T!E%mM
z&)*C+<vB4!$b}*i0p~;t)V)9G*iL=4vUylv55UD65Kilo1QVO3fW)k8=7IOY(_W?R
z3>LT$^J^>Q3AM5iDk(numd7tb?rRDhzI$X|m%Bq5femN#@y+%%_$(O9!5N?-%buTE
z<pF_DX*6;UR3SJlq|U!|?To%Q2)awpg_NaVoL?*MFi1py*9MAaSNUg&1sjEuOBlab
z@fhEVC&=)HaBA{gf^34=1_^>*_2xnY5drx4yDs;nI4RGv<o4#b^uK?9<Y_$XO(@Uq
zZxT*S%_p{Y7^+jKmc2*T=MabrHYLsu2t?J6{-LQJyGz6mJ$_w2?MvJW51nnqg1{MA
zn*gBbIk&~@Q^sF)^pCVl%bd&((G;X=FR_7W+c6Kj!-^_dPP-QQg}i9tqidf_sA1<R
zzVHlyu*`!zWOsL>T?;5VC?OSw2${qwbzcQA&yUTG?X%27uZ3+$)+YcfvLG^BYvGf&
zd!d^mZIWpjvTJo8iiw_v)yZt}gFvjbiWcLv%i@yq>N_uPup7GRW2ca>+Z`<~r%xRU
z6%u7d%b8b9TgU)K>gQaks4Fs6eX7}hf7h?B3q>;E`)`bjl8f$!(z0SRixBAbT}FB&
z5#&Z;i;1~#lXicl7Ce=ktBS7|1^>(Xh6PIEDVEGrG<Y?2K=BM^?};(n@j$h2$y_+N
zg;|~F^n0aMO{E)^Q|NB4iuz?>&^_2E<)#+u9eTxg(CKSQ$%Scw6@AKb>k7S@-jf*x
zz%x|nbLmEi+&!k3r8|tpzwRBXl&#Xr0-u843B1IS&f}|^>I66cdUb`nJ*~+_IzAjg
z#q3Q8sBI$@F3EB?mky4(6;K}ClGk={*x)U*JZ4HOLZuvI%7^Mo!kXG8B*^%(eku^9
z87()ijdR*pIa1x1WMwUW3|y|4uVuC*dH5esB9T~m_$kKKoG-HK75yE{0Z^JnQ5obW
z0YoWNOsFBw^RV{gh@-N-gwY&8HNsrpeJPNDV6?F;m0v4Xk1;}bMCm?PL(L`q?Kos=
zOap}^7)F4RVpL;F(X>zP1A*?Ykcw^Noldvc_6sqt`2m8F#qc(GliEpzueKfChF!0~
zZWO!7kD?5LmMcR?xaswa-4fw<fka9IVRg7dTlqMBWjf^Qx7;|K59|T(BmMs0c>9ZY
zN?H`2Iqtxpx}z9Z(A-GY>K{+W(geklli4jNsVcz8g5!5lo1GcOU)L!4*D8C;icr~X
z^ZXG3o}P$mYHHmhk7iJ}m|2Sy!>?IJEhpjY6z&5EPtJ2BzfLm(-JsS5q0;$+#vhub
zlliEMLWdqlE!PU4JQoA6n~^b(yrVq=0(JY>21@F9W}>B{1frjAPw`cO;TLE+FAJCN
z6rUf03P53a+5Swd2h;iN<bpoPw~Kb9HNv0%a^pj^5zFp3-yG7CoIRaoYBxpD35wTN
z(I{6xcf4qC3BC<2fAN+jsZ~t~2Z7vB*6z)->Bp=WYMnXFyCZ3aVOgRrWtX(0x%y{R
zBM$N{`!alR@p-;|Mg*G;j5Y=YR#!VUuvpA7S}nX&HWLy0&oX03cOqi|Z%M>B#NY|Y
z5SspNSW|OmD05UA?T4*se`35w)bA2}vMBxf^<=TiX7t?ZmjnWuv1S(34Z`bl)JuvL
zna|7RfXk#PpxIL)`HF&k5Z={w&KDo5(3!A+nq_AG2!J<z`8NIFS1auXzna{yxzlTF
zi>48o_?+>6lM$ECg;*A(fBE%Jo~?^}-Q!mXmT<QX7Nt;{X`SD4vxF7dVAJU{&6e=1
zp5*CDL!x}luY87vrFVR%5*&yUthwcU^(o~=7G#5I1yENntAupPF;8t79P9(da!Ev_
zqvKn;o(4_S*caQ|=d5dRmlURERhB4V;mTDv2yWYyqJan<-RTkmK<RTsJTx7<eMeHu
zPwst_ZLa%@>j+&__$omvF63U@CNuixn;iDrS&G-)*EV@WU%`=H*Nxw#`VMD9XAlh1
z>w|vXvrk*OS|XJb2Hulj%Fo$YSBtH`(R_BmqjwNzy5<McS(B<IRV*G~4IgX|q(*OU
zCXXzuj1Y`}g+yzj9n74|3dU7Gs8F<5V$|91S}4z|JFr4sKKS-8$hgmy-EFdN5tXB`
z-KF8U&iL}7Cbwa>dxPZ=o)-BL!4J#~`O`nytd`h9opd-9JGFlx{@Z6<#00yr=(m4|
zjlAeJ6&)w$moHx|m?sv5k56h2`86gq7b-xYl&+Ee!;!>(7Tx+t)AiP7qn?l{6FmCr
zE;enfm17CjEb)QpPcy_&#pPo$h`YkWVOoaX)8J+wd;w4HwrF$%WzETQW=$ef?<+@4
zK;eWKFxucQH)`xf*F=4-#!nLxvMCK4o}mR)5*Tp9Fo!><a`nd$WFEGpDLoM|-7*X>
zR3fZsm50k^RfS%=(Ogy?2bN^4Ytt>F;9tQwEodrSx{Wm{oHWtAdqh92ap)JS{uE>i
zz#*lUwUC)~;&b9h!4u1s>o!b{T91!eo}ps6C~e)tGjkd#vw1Xu#{v3f@Q*4$Ocwmc
zwR&aI=#0^f643GxO`&_m=@^xIB5|Ax<PcM(z|iZ~_Q_nMR`9uF7R3I{?{yZuFlO1i
zm?cM8ncfzc-Mg?$R=+7yUO~?iUT8OWROhk+%3T)EA+DTQpJGt?sh|<&v6)SOi%s$v
zliMUHU4Z2~1Q)ESRY`UBF9my#eCjAh6KI?I$Cr5r2epl0Pft(cwYv@uo!V|<3;JgC
z@Od7Oix;lh{5I8j#8$B$(7U}RNxOt(sr$^86u!DB16kLAz=igYzXvv0oUUV|%E{Rd
z&e(Np>izNBoP6ohJ<pL8QzQ`G4pd|kDap6KNoYX-mvNIJxyYmPNxibNK)+>P>iNC$
zzV!dHfUJ6`7wFIY<~>mo7I(sM5*Z~EnxT7JQoxm2tLpx^4H;u5Q`JO1WeL(8*C<r&
zo0{QajBC4K!q4>%N4K3m!z1ml^7tNmN`PprAM5#iI<q>}>>3pw?X%izUwh}<P%<(5
z%UJ+_Ce&s+@=@@>ypuE#>2xS?DR&8Gd!8fW^rOJbr1)8u-gNj~mrx+U`|9zqfUb48
zC)$onQ4q|5LCzMpT#rXXq|gL<fOs#vF6gguuzeOvOjJ3UX~8P-swjXS<imxYZBklZ
z1JIbW_|Kb11P!j04L@4mZp9-LT)x3v319Y5uv0j2^lIIp^d8Y_zFW4I(?}e2ifk<o
zFbSd?_TA%Vw^X!V?!@w$czImh8lcSl{4LEfM7NbZX^Me9Q%tueq-#1eaav;il^qRr
zw(VhBwpC#JQ^xi9)Bj=bEyJQ(+puAJKpLcLC{Y@udjzCI2?+`5W=Lrm2Bk|7kS-}v
zQo37^PHE}x&Tp~z<KFJ)+wc4P{qY>@;F!f?vDSUvan*gD=d4fwbpVvN^wx1_J&Zs1
zPa|I2QYJs@;VNBuqFO_*)pWE|yPK%i?HDFQ!`Q<WQu2Py<-udc=>wBuW@SyysOB1U
z%qt{h?4$s>E1-DFs%CK~P_*D!)Xi`vP2)tj;`>KnuRMjA{pJIZ9apKmU%NY&cH__j
zC9J?k3xTvD<B}>;X(JQ^vHHbY49AQmmPfGx6s&`FTfa#=qvVM--EKjBpP2Z$t7`?m
z5#VQ>48<6g?=@YYW>D%Q$pCv4`#f;VJ|5)Y7!6#st;zUAQ`13zY4Jf2&C{u6SCN_d
zy0V*(f#kQH=b`H*Oq9Lpe6~8n8Im_ox2w0OTBJ+94ZU40G3U2l5v&kH^u%Ls`PMBz
zD3E8O6v&;({mEbdYUq4OFU<*sD#@a``9t8!z)w#p+cB@o^5h16Re53inD)0=kMrHj
zcvQFw2q|S3uu<_Z43#n140Pp$oqN;aAd@n#Aq&1Nnjf+Xnr+I#K{<JsV;G+Ahofe=
zwMgfIsL%H0?uY53IuY|4X&KE|&T(nBRX%wc7sAQ8uToj&vHHGw*+Z_M0LMLFF%qJ<
zfg#f#Q4VaY;dH)fAH5Tq?^c*oHua|PaFvCxPUZ#vb)nxtpU{qg6+qpB2%EaSG^pA0
z$Lx*&;kHcq`ck0A@q2<FrBRm8#k%=qj&T3uFEzjb*Ce5W;@ciz1-tJx2d*7G)>8es
zsM*b&o8n##x!&LiOyaohJc#!V-L2iN>tT5uwwH}5G};wSzYZbR;^{X#*4T8rbvK22
z{d_}GrJdaMiC1w!gW_u4iXcKeV!vX_=pgv~g5xQ8F;=C|^N@{y_*T#Jvu;N*_TY)Y
zZQY^qLFk79@Cm)w6(eOCW!8iMx-5w?C6|q0ht-!)HJcHY20S=Yhu}b7oRK~lbpIZn
zq9W;+fR4}<_~io;$eTB_Mdc7CGRHk1XHE(Ub^gO7d(lr1Eb1<L-O^d%N5`8fMYTT7
zu<Y8!R2hr*koO)zo1qAcFURomb_G{Bv=k%7cCfY>5A`liGh%Ms!#t_ab#BkpIEEs{
z*&P@C`AmLvWA+JtaMb2BuN@lVCeXz=KOd!-By5JGa}c~@cm~Q?=utt-vI0A7cRa5#
zc|N-8Qd^8Mp$xb|HaH@$-F5q$X4xO~JXv!YqZ2Tr*}?rWDg`y9*_~6)u|*afr^@Qi
z^WHRL73el>PQPLemezQceceM6QfT&JB;t+I{zYiI57s)FiNq}q`@FwLvkN$Qmt!8Y
zA<tme$92{}O@MAg-9nW_IU^AiepTnhi*xkt69Inxmc_&)OP;OlptshQja0sG%0S~D
zVuSaiiuOyB(+k0zZhK-PpAA8?dSzF+`|%f3cJ-sz?+VWgZg)f3xqCQWw<kxXEYEGj
z;e#SdhDG%!IiVa4T`6(tow$?&QL9^X@|U}fjjL|8UNKsa7mkKih9%E7uWvQHn<M3!
zO;;D%L)UYX?6PyUS(<mHtY3XkV6j}1qpxm|_Vi&Z${F9A{Aw*bkx!@#;{N>PbZXh@
z!09>Kb|o*)7c=_c@#{I4<cXf!K$?bJJ-6;RRX*1jF@;{VDtQ(@X7NO>5x09;xa)CA
z_O9XlLix$QA6lT;n8YVP-!qR$ABGO#ifFWX_Wj^GSGWL7bnJ^6fhm&=a?s5|PajZX
z6Q}RF%^S003gqXzhXgpIugudLAB>YI?JnVAd!Ad~l=@ghAkigG1DVxcu$9`yG8eEV
zh5V*OpGI2+NshNzikKO)@5hg`f-Bs6KMFSEc$T8B^Ts1Y8LK;$Ond!b=O`Xquyu{Q
zlBLslFX5#+9+JtCJ5)y2Gq2Q0DXbvsM;rDgx}<tZ&qG_kMi>@}t?uD&Nh3gkiVBZD
zMp%DivYguNEyGhkx^X%dX-Yn4-z*PmC$LPHV{EC3iBgL4X`bc9yz|T9s*rP35S<9#
zXSf^<zIO$f{%pXbZA=row@dG|?x#no6iOD_y_U0jVB9zBxv5y=!(eT4W<q6sz`Xv}
z{4hV8^$GV!$n?@W<55>_-?&Hb8nAIq*4*lqx&cPR<q+kI*E!=Mx)(x!G$0Jr485Mc
z`0UQmLQ|)P8ZPAb(iU0!8LcK1FC){avjJjfhe<C{_{F!w$DLZ}OU(_@WeSHeq+gsC
zU2J~wh^cv(DUasv7>#T!_tk6P{rpK&W=>Bp1M#%ng-ZO47x!Xoq}Bb5*XVY}0@%Kz
zeE+)TdbyE<=>uP}>$Xt0Deoqg)*0ApKL=lG6XvO}yEqT{=H~D)oB6Qe>+gvePAh#}
z!&DweTabF!4bz2BEVm2Np_V^0->A1Cx57NJmRz=K1F0)LdaZPtSQH9>5)mYt@;*)k
zc0`VI%AMK$)aD9~U$7cLbnRz))gOMi*z2TWd88YcU-)w$J4HE%iS_4YOj^9k=W~{+
z6VXck)7*@n!HHECj!)?TOeDc`CIma{#}ni@n&QX4T*x*~Sus~k26N-kOYM3yHWhm2
z?9UaG?<%(Hq`#WtH@7;Dk!y91kABuA*_f7#$ajBbicn{DOfGZihkIYc7hf}5!86Yh
z*d@Whlx)+4h!t54=BvrrCFxpLP#bgud()2Bjs`lFcHfrQj2fst33OnU+7<_cBmGL>
zOX|4WD{Mqciu1a#))*ZZJG?HoPl=uutG;|`G;}<f&y?cRE&kor`z8~>-=rXW*0c=0
zH+5d@2~Hw^mgYFNq*XmyujN-ftocD*m4FM`3!ijkG<YTeCTtQtA%{1GF?ai1f4tDj
zYnr$7{ZK_p*~?}a03s9mj-;9Ya;vR>v4ZGl#aM$kh5j@DH^R?*P5J+Uq>5Ps-E)^S
zP05+RhfOfxBTY&x9+O+xHPCh3Y(cq36%F|+PipJyG~pX*x+oE6eBZ@=dGP+1+YlD^
zTwyo)z$)L{%ekXD;T?<T%kgpPb=N*>^9E@LJ<g~l{u~CB(jT?ofE+nAh9$g%;R;Gf
z2QI$fc`M0mLub&AKKkBV=MDJxUAt0?9&ddz^PQ@&UE5&E91eSeTVNI_O8VZ`^RB$w
zYr{BG#aA)nGu$eq;>Y%l^{%7Px_xPjEb%ROcn-{pLRNRolW|+0Cn9^M(tg~m%=>06
z_jY<D4Yx{cwRh@PKmFAnBFzy^((dKsN#EAW+o!q_T%)rL)-{yI1@Cpc>D8z`jwipd
zP123IP5`Cp)0}+Ill<6w9`fO|jlt*zqPPz~MIYzS&MI%SOo}K}CWK3fodrGKwm2(>
zuNT2VZ~V{B<4v7!1LVwnqoUgfkQa9h9XJ#+O;roT@y*oLyEg6-mD4tceQ_5HZJh6c
zqp@qFIF`{nF9va24L=V+i?BuhkOP#ITMk9+N!U;Xg(I`JCKT4fydb~uNCeVNUmXms
zN%I(9I~@QHgiknJeWlo|-I09%6#uB5B*LSdR4sOtiSP9CN9>oh7X!vFZsz*2SYYmn
zrCNFszj^R8Dm}?1dRMZJS)WEhjms0;^#x4jTw*p#dY_Z?@iMBw+D`Ema#c!)D`=Sq
zJSFGL6i^iJH7I~*5Y7-X)?CO)#PhR$tpL?U6gL8s3ED@?SgzZT6<Gl*Hy;%k@MQR;
zzjVlh>OdtF1nF`<nsVUje||1F9h=HOPg<yr3D`$h$}iObV)`Uwo4%m~mW7Ca^R^sg
z8+SxNc5pMP{{-(X4%HJ~*Yzil&A&r;RVwXfEGEnQC&rq`lwXF#&9QNIGm*P?ESC`7
zWM;l&rVsw{WnRMdqETH)W?q~KW7>Js?e!?SwzN@yBUZZY#9M#X<|+qc>R`>5!XI<B
z(ziWLdh2J#f%~GaSsT^OdY+V@;f{Q<XWcKPcD<*Zx2Q%4W#QC5vbWELTvbvtqn0fw
z1kmtpZIM@>hVG>Y*}ja8i!FgZO42EzN+k`v8Qi8Zo{&X3^HUi;Bs`|~L-+$8E+f&J
z7xLsX&*@Uum{$&;OFBipyqD9ff2Ndj@#EXpYMaG*>Iw(Lm-h}51opXvHVey=4>YcO
zLhhycTs%59p@%0eUOT<Yp1&^mb{$pJVm)rh6F*q+-hxVicu(U{qDbWpI{Di)9h8HK
ziPf1?B?fIOy3`o=U8V?ukc(qe<4+i_7t*>{=%31hq7@#SX4EBjpS|d744myr7i?^r
zh0qOJ<WYnpAczayaRKa3)+hG~Ww%W5bS+#az52m7;L36;Rk7@|v@AG@1|&pWr)u#T
z?B4bpoQm-b-cT$T(fM5lo^l)+*uD0<Nq&|tX5)Aa%Vk!Vf*J(RdL1g&z_IUzP;eQc
zq<EkFFcT(9gZGOaVqM2$(*hxMTzvR+D2|{Bx-}T<BYPn%Dr8yunp-1(@*-OYq}^Nk
zFtG8-<P&5nx3#M^i--w%UZjI|-<y_p9`6py$EeZ)7<A~9Mxi+6yhVzGwx8Hp=cnRy
zR#q7D*GhCiH7))V!cl_9)_ifpZIPuGgEYYgnOt%t?}vWu6q}-^cu0`BSfqUW^ssmU
zEa}6&-1Whg;mtT7YYY6z7&|iyTh_{SpRVpC+FIj&YVfLQd485?`X9$b#3NAtAdULx
zg7iw%KfspwQG)B%V|JVylBF&FSP}r17LM~MseVSwwB21T$?wHxQ_1W3!qRzC`TL*Y
z;$v~cYQu?xM(DU3E{`kCGn(Zt<A&n4ABR`KNTu#K!^+i4tnqA%`m7_-?EvW1Il(Y2
z-cWrCbj*x`gZ2yKjR0dH^y@%Gek=7@rw2S}J$<37s;-D?!^xJ?s99ko8O*&l01Lcu
ztlZjOn`tFRe~2ivDUq$3iTH{_o@ba?OG7^Zl<B_LLZZz>GE98`<>xCsH;<ONQ&%2r
zlZ#-BI008|N*K)GAs8t|#BT1r4e2wijF5dr5#P+N{VU7qRopYU_yzrujQk%=2kAFp
zt3?TGbg$eTKV$*fP|E<1;=2?zlYJZ;01^3gRe=Bzav7Bxz@ZjHKf^ftio?Jv4(#S~
zw7|Lf63#lpusn8!3oGW$Njbb^8wto8WKgZqf@$0G1|)JG%C1^gYX4+^rR|}CMHj;N
zY^vfj`A1)_cOg&L#-aLOi030tL!NpRNnA=^O5Pe%_pSwQo>R6shE2aK{*E3;_LEkl
zdj#Gcg07;i)h|l<Oj+5<s)G+#y;Z{dhq=81DGtgNihlseXt#+sL5ooY53!|EAvl+v
zC%5IfZpT(X{?BAH{M1BM#p}xDQ9><4Lrm<UVQIs83yQNT^G8!W4_R6H5T*|Azfl}h
zmi_1h>W7Gcp3$hSiXv>||8Z~;T_Rdgj;I|VVNf@MB>hvN7-kL*k974oIN?~&EaTjV
zh47vkxK2(z;JT4$l1YEig3OhurLPY;mnJ&u_|AG^gBWLh^opmsS@`|X9?W#4RQj!D
zOa#7EN-7>Z52uZLh<}ylXQzBYj?rMBm{;@Xp&ovxpmO9t;c+}4e42&?20T6yPzR&{
zHP;bsn8z6zo07B?sw@CnmFFhp5%C!n%l7ko4J3Up-vG!pm^j`Z-uy1{fl-HY0Q#T-
zql#|SGPyKz#t=FX(@ErTUR6AJlJ>nPlLLSjgQrg>Gh$CR)t=4>Ws^~$MdU!<a@i!L
zvirj))-fED1zsf^sLJB&6RYtAWwXi5#q4`EA4)eAE}Tye^uI_}>3Fo}J8+wR3%S*;
zU5(6gFx0o-16V(ztWesbbQ~Olx#A|?z0e85QO(Ydz-zYA_7706MT=!3LJz>erAz|R
zDdNFkU+TbcJq&x+!t4(U+~NCejJ{?$EpK?V$UIz`nYereip>ST_Q~-hAzS)pnu4F=
zwxegF@3oOIP4%gu@DONbK%%+cPSm+qaJfwylK2tAevx1JNg!dI#Th#Tc@xi|3y-H;
zxMPfnG=T^kGTa-T9pR|z&!2Cg<2q`&H4PKD36>(g+7a;8TKoz3lLWtXGc2kBKS3FM
zf_Ll@{5k-GJDk=i&hE<8Md-Rj3_iA$JKT}!%*?Jpf0HoFK*e&XdRU15)$W-bm5%06
zoGnY9XQ%u-Mq=FxXaEu&LsXg~3Bfi1R}13c!(I|3W8sm_y7%FtnOw5e|B0*XW2>1O
z#@uk9sis4XG!h*bo~_f8IokQv%scOfHvPDHH_Ipe?(jalM8zI&@b&9}aRYo9j}#5*
zr-bo-!W4D8Onc$1eBC+9Xlxr`5mkacIELFB(7OjhE)W#7h;#{53|Fm6s^%vjzv)L}
zi@g{Q8ih2*YNDV-NHpOS=M8`#>Q5!k+%Vu`#P7#OBBfd}3=@V8q-%WH@<;w#VLebt
zmtT}%#NC58qQfw&P`n@6On5}cuPW+B%|2a`H$QX?kGMZdRya`~<;!Wj+scRD<u~UL
z0j6a}h$>dp%_}5$Slkbv>kbO|hE7bUF-7ofeTA@zXSTs_NiMP!#pcH8V~^O4U@ARN
z)V8xWE$od;&2#@rvS@`Ez8vx8N1d^Ij-fRk{vT2e1JJ_fd<DEwyAg4)FQ<|0_c|`=
zFZ7O(la$4yG<7toe>k&)W(aF?m1;c+jDv+9Mss{%(=kbE4#f)a4?u-D+&~Chl9&*w
zwz@|*E6(~V=v7sFk(p-ksV#JVth)4Z%~p+IeM6XAf0VgQ_!)`N8U<-6HM56Vh#b`N
z&C-1GOWO--N1JEQf(NnQ+2Zdk?~Txj80^37aQb0sJCA^~hC4`;Nn<hj2ecR4Zj#sS
zah-4b$2xWTDN(%mzK%&Lw*gj#a@;dbG_0Uxx3bpkW*T%U3^&lF5W1_Ed0Iz49wc(q
z4P$Dmrt#4k(0Qd7m9`Ln{m>i-ufRx~__+6E8L)}Rc;g{ou@d=Li5~H_-e9~V_<~Ti
z>sHi+PPUD3M@gYnOas^#@kRdT%aGGJrK^UxLj*?gM!)Xv?sNIzMBW~5WTL5-+8_9P
zBoAJq%ZB9j2Kf2T7ri=O##S|_mRb}Tlj@#&rsmogi(HRHbWcD9jcJU9b70do$L>B!
z{Bujo4{{0b-+yCaS|W#0r?Qap8&3P3vi!pIPQ+fo@;YD*yq4H96SN4_Cznn~7=9Pg
z1jmv&Y+XmF^p6$@z8#^Kc;gX)Ww}1~6wC@Dp$hBuMwCT1xeh-t#6(SI3BHGw{VsnG
z>}sG^W4At%rJPG6Wn9&+6;4}2RevL2aS85_UpA-YC*smc9ImUbtp0h9NbSlW0)PVi
zF7URk2B`;tBk`rDVK|)IuBOUKX{WCm^=W@?^|%39TM$A<RaM((BJE!8aAJSuS5Z`h
zh*3#c6kt4gux3zGCUVgd_-G=hq1BGXqnCh5jX<h4y>MjkD0=fga*$Df(}zjF8#kxj
zNQY~;w6GK3HQc+G4N%86<qXoe#T&<7u#JDjc?Iwa42;c-+&)i`kv2ue#FH06LMcH9
z%;xt(tg?VCQE*G_o3+pFnqEjkZV_o#Y7-Qr%mbgIKN9uyFoz9DXeOwRC)<WD6%R;!
z^_&*8PekZf5fRTCWn509$!na3Iy9D_KJk{m4F~9$z{TR6d^nk&#i&T&fe{P=tC0wo
z(}RP1{mUjMW~ydS(QsWeH%EkfdiO=_Rpe15z+x~Z=>+gD+KP^wB$h<CN?aCeQC|8z
zgUfGACyR=pZZmA;@`N*96wklH6+T9!0Rca$M>=V=uV$7Q3Re^!ebNjK`AYsgY!+$*
zC|-3L2`uW6G3Cb<RCG`H$1@tImo5~%99*sW8w9evv%HPH@V4>px~X6i4n&<s<z`K<
zt<VMhT62ck>7sd<IXD(M@~@=dj~20LZP&bOEYLitbGcq1_m(%rMByVun(pnnpL)bI
z*78j@E6jPU>zkrEE#yJ)TiD}z^Wk;SUUH`sRliHQ`LAi1ryve+E1b`e&VXugooW6C
z-rsSJApD}D0Jt}HKmenUGvT0gdZ+{m{<O3oW>vbc)NRl|Z=0CDgsFxjYdpu^d{8_`
ziy+oK^AMm13dFl3jzah7{gZ?Wz_*If?0GdE(pJzk9pd+Qs{4rL>?e*yL-oAvhDz;T
ztM>4Tik-l50sJuNwFAuF?~bi1{XY~|^y9FEQ`uh+(6jIj27;^T#O+p~o{tyXd9ok0
zvn0Fqx<g@}P!Zu6`B-uZ;}s6@iF{07=rVsE0zk5m?-;ONq5SzwyfLA7mpAjn0`oa*
zgPaniB2|`FxV>?m&B!9EG*xABOvIDO7sw(U`#^*7e`EAY`gZ9D6l13OGPg=hxKsPz
zaoQjrLuMmK{v^<{unvky<3-y>1`bJG<Vny4@(~DF1vC#~Iny)(<e;RM_g%a^%fhgO
z#hZ+qg<d3k;tQT9zJ51%9w%_`AD$=hIZ3|fGZ1tQlUW3N$lOidf1?azEemceK%ytW
zh?nP^hl4hdfkyv_NF<%+PwJTe3@6_wAArpUkLGVT;4gmw0X={~mgNy!sDvRpj27i>
z()%X75UFX#%sI)%Kp)&c^yY65RW0+mtA8Ig`R+)7UaN#IQuW|Ybaj_}i@WMoT&=Bu
z6GMHj0h)Aii9f{3IDCY3O?%PWn=T&Ef!H9j&|`g6QWPnEW<hdy{33n$ZSECZz_h}V
z#mO5{urKTN9-g@|hTY}uPUwk&UTuwQ`jgiTwkZ+R5z+zBQW0J=UG!Uc4!UND{TZ6V
zD{-?Nn#|w)ZKnUS*T4yk6scjE)SbOHdfq{Z9!~}se7dR!IDb}R4^ZFD(dbP-ul43j
zq|`_^@uo}e4$L*&eUS;9)W89Opy-caq<<r5lfcMkGboWac?12|u>#{sBKX5e8G`;I
zwEF!-70D9cmE7+)I<Ma!!iNYD^pH>d9VY!I&K{oMd=vcNB}Gg^Kmh?vSn%Hl`!5zW
zH*^W;eDl9f2tPk11b^ftw2HrU-0y^RA}C;iz4_m-{C(c^0HGPCggo_o>;F2ZM#7_X
z`#<!KAt4|}4$Sr!%ffFGA|T=d@{9aNpY?ms6=O(14Tqcfer?tNE~;N3AU`$bzx@dT
zeF6}p*wT>V-^Q{D7%OC4oPYZh0*VbF2EcNH{cme>o)(ZF^nYOZ``<ABZy5i#8vnN%
zf91LVR+|VY|97Q2u!I64Vlh|yHr+X69aUTv)`uLHR{e32f73SvV-fe?^i=u|N@Bpg
z#2Zv*hP?G<vt7pmxqGxvl!9qflnlSUV>~+S7gtkO#yQ@ZNdh)O&38Nge;U+=80EPR
zbe@DXyRw^`pD{}TQ{MUmnH!v0^Zp07V@ALVqT?bt&~p1VCGuKZjO0B#8q>9RKZ&5=
zk6^Fe;#Q%&Q;;t7QStFIt%10?U#-Uzu}aIzEH94MU3#!&ez!af?<KnL;m9|7C+9LK
z@{n*K!QEQ?IiJvp_#x1S;ViVGC%Y{KA8nQOqwS=MxN}qaoc)Ad;$a|xRh^JBdxx`R
zaQhLXW!ng!{@%4<Ui9qj`SiVdOu2IG4Q9^0tgoo(`8nQuz?N~X!SvPgtjFf(e4qgD
z#zLj4xHwAcqgYpPh<AUgDBP8nJwQTQ8r9Sc&AP0M);!IdPbq<uc4<vX*aN7QFSq$o
z8t^iEL?J&7%F9%2)PC;**m|BpHn~u|y}6!&D)B9C-T-geeW0YGlDilwK8wx2goXmb
zmZMlj`pdGxF7Raqn<2Ammx(L{8ITp6&l|5@#s;IW9GP{i2HS#Y+mj`CzMk;St^gP>
z8C;P)2}4AEk99_&ohpD8$#Ut1fw#2h_Sbkc(VMxO6aGXYmjWgn*cpnvf`S|hAHeNm
zZrDN}A>cpjwiw>zo#c@{(n+W+Kua4hXxxECE&w%raxnRl`+Odby9WHYa=gByUqZzs
zuKJm1<8|1}&oxc4$s&#d;;lB8MgH5^<wL+9Q9uQj;9-KLc&rx<4<nfmyPtRLAfkZ2
zRrMVAlsT>T0oBbcU#k2&BB*p533&#yXay{$DOO1+gA#ocDxPV{(F&l`!`*(f^)NS-
z=TD*OeAw?E@u=c`EGr0e_~<t%g^qLdB|F0R_WE@Ad^L?mE4@9G#J*x!94vrdNPta@
z(F}oSbOistj=WHwKY^w{flH~V?CE`?D9>f<ibefUGoXdz5AUF(@zH-a;{#NOtTkNj
zWZ5@f$4!=78t1@Y`d%NKX?N_=^KXmdQS$6uznM>WIA7fQ%XI-43lhp=G{Yu&EzoU|
z>wj2rmXvH$NkG$Iqxcj6u1mVZE*=Ufyobgd^!NDoevrt*#8ICDrw$nIw8$qOnUQUm
zstJXY$7yU|zdLdw)=Y5TAKHw4(=j3hJYsSx80FCuaO!+Iz^*Y;X+KB)o`;`5KGkgj
z!)mU<JA8;f`pzvGLHWJkI_L)0{E<ibEGl%*zzcq5_w>YScM>44_1|s3y{3qH5Kl%6
z@0fFubDA{mbjJ3$QXdeqz-n#=z{j$sVa8E}pSF9G_#=Pt+5*70<um`}!r6fWjVmI~
zvCq0PK<z#)+0_-mieskT2wYH06Z6h{QKWAsdI~U?pqkn*n5<U=b<1MVMn$#+QBOXl
zRFNNwY*CEt{C3k8Hu$nP!rSG9E?W~^ds@MY3JO_3No4h<sq~wo#+ym(DT-18iFkIs
zt%uAkELi{$IuiI4-3OLemTl$CSa^&`n(vLfF~)5?KzG7cIX$FRH3w9!trxfAJXWKd
zZX2~>xJdjYnDT>41q$Y)?TDl?h_PA7`PS3(*bCtFvA?46Icq*^u>z3Ue8<vm+tsV7
z4u`>&Y8(63MfFdO9s-cWD-+8uL}au9KwTO6z|pX|kLmQqN>yz1*F@hF-4%J}d7kd9
zG$>G)GRwQVy7_A8-JIO?DnY>tS$zN*K^(iD{Q3ELP8#0N`*Hi_)~LVv%jq!mJ%sFM
zGaXDInS<L(-|Vx?pRmS2J5ip}Q!$Xck3pjlE9d7Whn+`~B9@GW?j+tW3ALXc9B=#|
zk?@ei0Z==COQq0WC-PUTp5x_s12k$D_X9t%JvaRhwj)w%XApHO^49_5mEI&0w=k&#
z1TjYd;Qp4H!gc%R45%a(-J@h32-?#*IqsY5y8;v^PH$wqQF%<__G+ppJE!QB6zAoe
zbwm&)Uc%ENwH*xIuE=k~59!FpDV?c(r-2$9QV(oafjy=ojfD7>(3f8O?HT7ROvf@2
zlw{iV9xk8z_J>u(rIm%&v&mBcSSBXhlS2R+y-NqoE4Q!iB@dnk*qR2cs3lSDHr_U@
zdes#?vBlxH1kix%-z44M3Rd3$<Vw}z`B}UUoix66o?)?EVOi6-^=S)bdxIwZ3Ykwk
z!YRxTicdEy%1@=ZK7Ts~WB=|q_~zRxqBA-%J^kKveGL~y_6Uwi!#a|dP4`D8y0?}t
z-bDg|XAhSX#5tpS;q;D+DF+Y}7~FIgK82J#!o=~pJ{}*4_oYG^8Nnr>oCb7VDojS{
z@SeQ++|{tMFdNStxVc$PMU*JPr!5FS`t_`PCsvSu-+E*WY&cUobStyXhG{d=SouC)
zG*&YrMOs)GIWKcmT3VzyYn>QSu<iG*<0$~l&sSb`JNU+A%#BHS|GdXMP`dcJzCLx#
z3tKvJ9cYumrE$V&cHQMxS>$R}Iv@S{8Bj-K67958F=dy!Xd7`-QLZ+&mnRn;h4!0y
zPfxwmZ-&-LT@^Tcro|j^FS4so2u;*Som0dx_-EU6B&2UsV#@uXW?0s7)WdK%ul1PJ
zl6BT~ra_u*<Ge(Jz!;PGZHcR}eC&LaZ$x6iqIb2*3h&f7O+^YIiwa}@xOeQLdx5N0
zw9?h+3j@7Xr|*f&L=O*~!-Q5D6ZwxF04A#R2ivV_Ps<AmYHyEUMHv4cBvK-UTP@z1
z+<c>Dn}aESyeZ^T6QdQJ{ng$>1(WcUr57JwJS|-^*69I=iS!b=Jmb~!wQtp?&)!Z3
znJ@Z*LU^3l2CAfg!mv}IEf_G%wv(ojd^O{fZ^^d+iA+bELcj!Q4e(dKHvnk+(1weR
zPYG_p^ZEC<dhT}*y&2bgt!H>qBUL)@cgHy8ba!XIWFU^qw+Bb0b~rl?z@$x~_T1tE
zSb_G&)r1y;=(iqvT&(8?Ys`x}9Ak7H15Qd`jC5(y52w;732qz8ww}k?q+ElJMarVb
zBfzVoOnJ2r>7fQL(SX9@(1SLk+HsdWdqy*L?_KnS4PGsUivzYTP&h(Il!RMRHWf@|
zZ;wkYlAuM{7Jkp_acN9$F6q<*yC-uU(K6I>l5eqSQxhc$QzQ($_EAO8=HU(MQmg}X
zsnqy{k?6l``8IqDb$}EBi~hmRbGXy<W{5Fc52*?i@8v>bCtn<ZbKnT!66SIyS^83c
zqVsrw<>5o{%{>J`&3dSE6LvZkhI4c#J9LnlC9R4N1ImQj4XeL3M~2$Hjr94|T2^FG
zu75zB<RNiZn2kYGZ&3*<NaPsihSR7^{X_PI*Hf98Ac(&!9(FlVVk{XE_B8ZWZ5*3!
z4Ze};bF{_BX5XQUTiDeyMv9M9V~D62lr-aBw-a#{R05PP?ZQ0HG*cYu{BvHzyipH<
zT`B?dy3%4jly{{;oE(arOvo?E*2da_5;DgxlPioZxV}>uglIf~M3coMy!fPNGXTw{
zd?&SMAyZ;5AKsK5boaeE)8D=bV4s6&=O0q@^ff9{1euc#raq7QZu>~am`pYdm`=OU
zl+n!Pi4N|Fhi?~Ky4i;jY?z#4+t+kdFF27c3SZ$T=pXD&p`(|HgAW&5)sthmG$3Ky
zcb*=wZquaNEQ|(@t&#!rRcm5UcIyTC>83_hzBPId*|-2`Doc7KcS84~A0bIgOXrXp
zu@(uLLEbWUhLJ6<P^hyD#=jiye$S$$hbNikxm6+~wKA!YyshtZzC2K8A`cLmI886r
zkxNV;ls0`=(oMp?RezIiU7+w%i;R4-0~V_{NnMnVr^!IruLI&beKOJX4|h3IB5P70
zFMM7ioI%rkSHhNJ;sm>ZP)GubN2JQo(t*ekN_uEigiNk~k2{BN4%&(hTQ_xqgGtOp
zl)_5S^&A`=3}>IGn)bw<$0R{BQ9%G=#8?U~rb769DMqq~$a&^lgITT3tEq1UlwId-
z6|J8uXUTtlBtTZ-ctTA!U@dxZN#|9Zg4HL@Ij@rYN}J6u{#7|H*OVi*e#GMksTwPi
zhZlhVYdlo;KsqnFv2xBw_<^?)9Unl)rX<iM&*nihN+aswtb`*?{`)K!BCv37hG9*9
zqL}FMA)=gMVa>yXc<D()PRB<QGRb8EI$-o7vH|np)Y0?x;oMGjjZ_8d$9PeQ&4V&D
zR56-#En)242W}8$5Q)#+jl2y_ylgWh3QwZ1op~HK&T5KP69J5)_cb8beae6or<od;
zrwWpq(&)zE?<S4gIf@?$x?c?Sd>t8)BfD~uX)UcYP9TH?<&<3u@76uuimKYjqm<g;
zD`&)=DsG_jK&klM@!XJ1e`ZS=Kqj*kza_zc5kZhxR!j#?6L%cJ*XFTGc->bf9v(2-
z0bwSW!D6<zT_Er2XwFUZk-yxoG%$Roorh;!$o{>rRd6*~^3K&)6a(T1@qLn&1UG7}
zA)t;`)F~yN!$4Wr_N#`XPH@!u2IP{!a&i8h0(-{o&1oaoD#@aQkraE^HUJP{z_N|s
zvaaYSs-WucfJ|`RxRqEot8rZo+G%a+2iYS2q{lKz^;SwIUA!+$x<T!I^lbdW+m3vW
z<AB_9RS%Dvr|rk>>8}8vQ*t<fOz}S4r?4K+DS3j_Fyo1$mkT}ws1&oXuuUdqIHF)%
z2FV%{hre0`7qZ?Ug+xoO(~Ja*qNM6%K>h~8-7V7xsx<kM-jVN%uFMh<IBN5H7`q9=
zYDBWmYS?r@nbPUxs0(T5<M5fiGh`fxO4BqeuCv3a;#7rP`5*)C*GAqPxyqgPA$&NR
zpLLec$-7*}uzL>NPblq6<P3K!EA4ByD<pDm&-;C!MB)R9%NULu*VGeNclYX)ks0Oe
zJBFEQuWfAV*f(*Zs36zpWhq<M5rVHIq_}x;Og#K1xPtiWn;Kr<Yy+;(gqjgCUBH1U
z@|)E1QPhHA{k`~)HN}c*`Jso_ltE}uZK){m!+sLP$ru9_;w+)!H($r~4}mW=qWC>S
z30neGb~v(j$g^@B|76yrhdoRMJ(DG0wVyuwieuL&m)k&QdE{jo;O$tM#*)u4$`@ry
zwVcZi1ljys{f(n?!#vvXi&q9yAMp-cQZ=B9aWaM3f!;Irtl`Ly_8M=FIo^#T`X_5C
ziSM@&_OhRo(^OpeYvs~#8cHY<V-mBb>(_g<w^^g~$LF%^)g&xW0kJMy_{mv|25UK}
z`t5*#A@Vzz=Hf>Y2s!9m!wMMZrpk>RBm&K113-elvWi+8!u>L*ZI_MNo~~n@P5#IW
zj}Yvvh;Ihkf(d7e>zkjD8fC;%5xu?y^knw4tf%ctYDp=jNYWFIY5NEJP6WLep1e_R
zof{4I4d-vsa47R2i-(KtgkuuS)|6dCVK&23p;lge1+vxE)u{r%`8NnC1X5sk?%*@Q
z_*<@?LKCpTrN*X2If~Sx#3GM=Yk~CM`F5bRCN>qp8KEwEqH-i=_pt95^$~%2n2uLa
z-3!)cCk^x~-m!vv&n?dVSq-FGyEXOdNV7s$Tej%b<BN7k>|U`G@#16`eydyIBzE-@
z2}kC#(;|t_D>?_t4BZkRd}Xs1Nutt8vs%3D(NVJl68`TzfDppyBCc5Dd8W)O%->p@
z{so1+T_6){$VIiNp`JBMnK25n5o?dvMn(6bo41z9VoG4GIL4=@CgOW%hXchaMR5=>
zd<&lJP=1XJE)-DX&4u;+@}bC10*MP1D-efq?2&5I6|onr(m@TUP+;zp(fcE(Uu_^_
z)`Am1+H7(Q<|XbW7FtKZ@bIE7nqjQ%+9}ZWAo_@)uIE8EwR8tS5+ZO6a%=cfvlPAN
zl;HJRMj+ZtJ-7Q)I_SMDTa^0?(g^A#fD(?Kl*AQXs%9!(K>Iy8E^&a)1H1xl|6mwa
zE1DNCK=c40bswH+fw@iH9C=WSK5ccx`DW0HU0?I000YNF-zn--=)A-h$%rNtx)d$*
zmOW;TgM{M4Ar|!l_Lxap?3>Z?>mO|aYTD4Kzgi8cd(XI}zpqZD@@T>P{1g*sNi1*_
z^v$z3kvFw&5q06mPXT~yaDgguz&jr-5M}z{lT#^cLGMjC|17#lK)8&@&^In#7aNmd
zr$W{j_kPc`M~NWu`l=}yl8rpfl!2$q`=z%aQ*~LBj|vT3Gb5lM9BV0k@&{pGo+?n2
zj}NF3lS@Lu9j99)o}QQQU+4!{58KGl^3+pOWIF&Eoe)`|DAOn+hU5Ezi)#O)4g&WZ
zx1|W-9nN8PBV}p={ECqjEHIBf8Mr$ZL}t@7z5#fSZ<kiWl{K0n+(kbWzyh%VP)CV>
zW@(nC-h3l;U$_zA954jZ4H@n|f*pX9&@aaGQcH`JzX&kHZ>W>HsIb`tw5p)5zPpTP
zW1nBfOJU+LGc(f-*<0x0i_exO1lNJOew%!JFOb6N1d4N+*9>Q=>#UQ}G1WIEPCgOC
zb|RU0qRMLw4hD?d;=Rc$`mGn-KL);a4yP4}inqD^I5jH<ph)RHe*DOeRMNtZ3>6Od
z6_$l^`dpng89U!=0U|GYz@yo5w<@D``T*~C9+W2eU}N$%AQ21N()S_6A8umcM2aaa
zHs}v`OLmugdN~s9vN=XZ8`ZdDIZ@;Qb^*&mKd!f%X9cD@$x3LV{4~9xt4q!@H>fK;
zc<vW{ygBYUG=-QS3dH9bR2sS4Z;2^oDZaXYJBbv(A+6kEdGX~49c?)QkY682%Op5n
z@A}?`>auU4{FPZj#LJ_Bp#kY6Y(yf2JYv{cfp+>N;zCb9_57xopnio0XS&aTPw?=S
zhDCbkhS)ci9=a)P%hhyX%^iFl6$cl$9*pW^b#0e)QUg3?To8akPh!nyDoxzi=h}*u
zhKg@h<e350A~pdW4N{7d?HzvNnh6j<o$!t?<p89PctzCmGcmAIMM69!Wc^_J*pfYf
z{&C5}#9ii6AH_D3l#A{FAWBJc+Oxu?hK&Fr@Q%?r5Q8tQFzWCSK2Qw0OR3<W(=`D3
zkRbFKo22`%hW(~v)XN430Q7o<fy8UTDF}>v_ktIF>#_f2m<a)oMzeka@0yemN$VK%
zkf+X!1H_&7_wA|l6%=wW!KZru&*CJ%PiGJ{o<?iaJ&RL{T_#v&Vt;2~7iYkOxTzAa
z1rRjOd@LJFR1&5EzITq7M)-5bGNmJjsdI!L+CZ8NUCVx)aqRLgFw?85a?dwD6<GkF
zn|q3c6_ksQ`$Z(_Wg@Uda@eC;1=45hJw0)@f0QxpH#HIFBJ#PJ$0^v%)>S`!_Vg**
zSDPR20C<3sNJ=wnYZVX)R9|j~ljys_+?vc~s;91w<6VE4l2{GrV1LZbt=)HIr$+g}
zh-~WH=yUxf-cF%?nKZ_`mpxB_;;uQ2oZ3AMeS;;n1lqXT(0T2MXF$0So7s=P;$<;o
zg{AOlzD$J>$9Q>>?Kf_FJ4))IQIvPdh_MB9`=Ph`z}@V&(s8EhojQ~}o+maN6D3(s
z$qck;Tt=Sp0GUvgIutFa#L&w1&T5)3pY2RU{1uJ+5<a<*a~_p#h4v@-M2^&V(W-?I
z77GBn&9#n?_*?uDC4hv@E)bQuD*Cmk8p(5j9iJOY0)ySVubAoAcp&Yr4uref!WFJ>
zFoo7mSIMANp44(lW8A|GgNuv<8`+kSKt{$dz_b)GPpX)9R4CZ=>&B&%g+j-)%?Dd?
z#kW*+J{6-QerdR{x?}Yd?cDFi9jW(xt@2V2iF;zXXm;eQ^^5+W`40u|;xvQ+6aqE@
zLt7*xCI6_hQFb9&C|FQ2RYVXvpffz3tDGWF=SSFSb;jWGE}oqCXU$dc{7;~!x1c9u
zgw!8iyHgXYMcAsQPc|J%!QY2&s)g+5CZ}XX!I*I^XNv;zptC%@i^P8Fy?m)?WBw+a
z)#f!MhSVS+Y|i_XYI$ktO5F1`iIL2ECWNbL<yC7!-jvbvCI|k^FOP)^7ul-{>AO2{
zqgaD5=^8%p?`ue@;t_eBLXM=vgMw5VSRbOB9n-R~Z0#^S6vjd8<Z|HVdSLbL+2P=8
z0E@Ko#k01cc37{{-g9?%{_DorXCaN%7nQWfjjLBG{jT=tcwh-X1Vkj1Ng`66d9Vjo
zo1~{m@e7(0CcbNKr8F<!S<R==pGUh5JAz-l_KL<v)#ZL9(Z)Hv)TSfFHy!b$l%k;V
zJ{pY8Eesu%elLP$xH3L|gS>$Ra;J3M$27TZP;kEmY-=uhv3d`X6iHdA>tWlUPb6Ib
zI6dl>Q!q*@5EM#bl4MRU-Y-7|g9~U-cXQ?DHi^U!oIO*U2jc|ox_iyVKX=S*j13I_
zPDw861>i0!Is%tIP*G?egdsn|^|Uy1zUgg6r)(>_Qd3hqG|*ZeMlX~q@<Ts+Z~6!Z
zKbUwEx7%=O*ZsJGwLGaG<Cnm3EX8Nfu(!9gR|JBRkxcFUZ>Eu#PjXDFeR*#o)t|o`
z3^?0V*H1U<$b48e9C4y-O9>0Gz5daE_&VQ}@-#+8Ondt3Msa2N<{Yu%q$iqY%xaS*
zQaFAY2zZ8_BBp!Yl?f`G@{4NhmyGk`MiUmnU+kl7zf?3@)^AgS98$Yb2af6sX0x;+
zy%3e$F*h73)u-?mw=O$3PsitO#lEoIChC38(Tdc*PkdRa_WAMa@!gfC*5nJ~+E=84
zI17`G{Tb5NRCB;SjP$#%Y2*y^+u|aYYe5{k)poC7-A{4RYMH(@eKk%KPyZNRV4Mdc
znnIXl!g|<qjl%*@+Qru5aj!}WJ=Y>Vx)}mTy-CXSmEMt#SG;4q<sLtb+}aS2IOM3q
z)b9qU2?pG}c8o-K_p33XuNwlF5`;=Tu(`~=k1x89WzokCfUo%&nJF=r*}hqJSS|Ge
zs7O7O_q$n&$~9lVl;N$O^m-7TUEKIRo{}qvvXI4n+HLW;Q_@n8%p_^EZ@lsIEv(q%
zmhQvKa|OlMq;d?Ojy1;VpBb&E`nnX&*k?3BUg|Okdo2Vr5hvTy-dfFi1Dg;lDaZ6?
z)j^HncdRTY9tGnxzWlZ#ODk81qN^c|{Z4Gr#U&oL`v?sQr9d9Kqe%h9gc{iSvSVNm
zBe4CPYFq+?C$Q1Vf6wDG;Qo#deqUC0A9O|oEQ3GRLsJv#TW)pQ+br&s$x4=GOEP1Z
z2ed|5kG1k*B?(rh?73Qr7S0^=o(M|O63}&UzHwkVe=&CigzY58Zw~pt$dbDOG|(h^
zexESVNHz(M^#EJ!^p-%%v4z6Eu7s4H+BmC+KyHY*yHZt&^%NlC%1IG^9T(WodWdWm
z!Vn~g9(CaC)qaw^Ue6`B_#NhM`t`Ltbs(P%4vZ3A!F?sX9LNCE-9q}(4H$Y0XFn}}
zS=Gi33Gj{PrvueL&mDeLv)Ebu9@s?6lpSzqUkz&W1KfpI&t7;%F4{lbs6Oas8D@-s
zITVw9_;N$f_HxBiCzKM|ArheY4Q&Co^laDPQrJBth^+9g-}erhMiZQmdBDV^#_$qI
z8(Q~Uu1QUeXN&#nsH%HdY*4&;d=UYsHD9&w<*ISqr;xhH<I=WPZ;`dmQlUi%<<xD1
z2%qCa_06DdQ)M`}7T(mt+41<+Rz6b&ivpnqx!Mh2({q#TYVs?FNEN8$#uCjGg3_Bj
zckAQnN)~gJl2%5dYvpo*L`zmeO2%y~Ivv35!t}_Iq>XpvJwVkcx@-`+DMo%#;b3z(
zFsOH@%zkOL$4HXcl(8@Hac|9UkCHx6qc5M-EE{>Cs(U^j8O5LKHiY{@Vg`mP4FF#7
zufwJ79QB9ChCy5F6#QeSLe)T?a`=m0?GQl2qpcV^?&}i0eBBJ9*_xX^Y<QH8FD(7`
zcFnYeyhotIop%;AF7<1nNf^FF)s&u3r)k7uP_HaH-!BTOTt@aiE~`1_+sOMgUU80^
zndGVlO}BFmD6KftxCVCAtdpyM0?f^9Vvz{VK!l-A%~uv?vopAu?rYWV7?_}W=T_uV
z5#UQcjGz+MoYKt@@k!_b1m>(yN%~u2m_AH{Okk~EYS+gCiHlg!T(PKri_{ScL}A2@
zJDsf_TO`B7fa8(tdOJaS*wJ~lJxBpC{TV2oPCKb=H{c@#RnO5!wg9=`VSs=>Bo&t{
zeCB6spmk($c)#fB%We#O3UQhf(Bj0(t0ZCZ-#WSs2?<n2Jf=es^b!g98VxUnuODM`
zGZZQT!~AUS=K4~X>UorTsw}>iR+*WS_4t&lH1LcH>`|G&`pmCs2o(h<&Th2}4JJZl
z9F6ar@qvIGC+!ENC^`W6{rVvtat=vN<Prsp`SKJa$6@mR`Umq=OHu3FcN`X}$eks<
zhtM;iMC{k-!-($V31~sK9E3(?XuM+qBKV!yRcC|eWq?z8bJRs2IkLi<keaHjB6_Uu
zF%JX9sh?`R(0jiCx%yJOqcgPMDqul5C4yzX%J8Rwyqi;oU;LVyUlQs9a%$hd+XFv3
z=;6o(csX;tFHd;KDC;p@w<e-1?C11ZlipEkvYY{~>yQFRy}IHeDJ%pTgrhFLqa8VY
zkIQtimwztV$nA+5QfDe$^Jfw;l+1P5?7@Gvzex)Noic26o7%^io^}C9cO^zpizd=(
zaq{wN)KvgJqEJd-Df`~h`tbUEGrXN;BSdKND-cYS1D>(zXuS?DbthlZnCH)$Uuyvc
zJ*)s|ecr70Hr?M6-Ss~kIyz;!U*5f6J@;o9auxt%n&n~sHT17G{c%zb215ssGMWE=
z?wv(#%DV?NcOzw#{hv=6@b_ziU<MWZ$IJNjPg%@hC}+WI&DviV{#>#Wn7}*Pzy<#Q
zeC7Wd{{MWBe`1Dm&M2*qe6SO8;`>-O{HXo%D(%VNtNU(1pX#T_=n6#NR+`a${Kos}
zbJEuR-N2c>3=mF^li&POzTL%x#s=ZXHaM$H|D2$oWDKuO<SE8ohH|bFyAa>Jip@a9
z>09z^-nXw=Z+m@lA8WBgnCY*Te|K_KjKWv6n|;XVI<#~Tg!h&};7kaF)zHoH=ATmw
zPk<kW>9{w4b)}PEnhAq<=|Yc8_`N-K1`I#i6(9a`7XO&0O=}o7T2pem{4OD0=y1E4
z5L6uH<ttPfWknJ>T$15DyBE+`T*@c3zc(H>NU-KiJe~x8_fWseosQ`lrOo9F1}Gi`
z-XEz#QpUi;E0dls*Wvn)RYPhHJ4eFc!fcgZ#pZM4+-rhhshkau_ljZ{Ai`q=pDnC1
z)vWi3%M7)}nrjbi8YbTgl&AbI*W!a>F_q>jcW-&!n}Qhj$z*f2E)4vhq5Bd+sUUGN
zUn9d-Vl--jvnw|zz#?1V1rvy$8`Yqb$AaVjvYmgN7*3<ox$RZ@ibm7X8pY<!LzYCU
z*6MzMC6nxsu_<|aQ&rKhGHEZx)07+gA;|yTw|OKJad1$)9*;1tu^z%J)iO3LRw(pA
zC(_N?^0c1>uSN0h{Ey_zCTPG#(VNfz^=3`5$Nj78c55@f5ma2C8dEx@z77(z6TQCf
zCL~bjL3t>XW1qj3w&K7%6NzHB0!Ol}cyG@kzq2EMm=*TeUvB=NBWH21ZOPxjcS_0k
z%1X%F%S4E(yXU4<b<fbLFPQUvuBA;G76X(sWy%$rI*aDgN|@;|t|z1&He*o++xRbS
zDJ});LOq-9G+()TXh2n=I=(r-FuiG**{%;l#-OC^$A6bVmZ8%<i)L`+E_8iL<B|11
zyjxAi=C<8rG9gCr;XlRnYdS@mOWnz-yxCP0@~S%(yr8)?qwBBR^L9=bcf)(kogDAE
zSE+$UARv&OYjCymeTy*;0-q>7ZTjKNpi-?Bw`RFlG+s!=^AN)NPnjj8!TzAzhEr#i
zemLf#4d(b&q1asW#kW|W*j#g)Pvz7C34L5Jc&7(Ft?4}2k@{-9)7<lm_htV$dFlZD
z0`@<a6W$t8&@0SZU*H?P7sd5z9<)d9KfCaxdMWZgkfnTNJ^i=|BK4%;F=H$QZqc>t
z<QRB;t`R32;C9I|9%s+?&xRqu&|v(t;xjRv`=uf!O%+$n3cPN3a`*YmV{w27H3uip
z&1*3>LdXPymhEvAbF<tl-jrS)n#QcJihtPFd1hDnn??RZ!+4<jc&^!ayuP*3_xtRA
z5@2v`W0X?~;e~R(Kcuv=d(;ovgu#m(2f#Uz4;6T!#pb?CVhPt<b2qQ_Y7C7PyqUTQ
zbqM}pp<wv;&o+|mJhpw6d&_OEO_;7PN-vt4&jl@@5FG0AXF9l)ls%&N=;9&T1u*yw
z&B+RX)#=5tAouefOSyk)J#-$7rHHHb_S>s3tBcz&zT|H^;8o-1I7SBW$pg(I4S^nT
zz~EK`VD<`eXz}6r=9C3o=$~e>Neg{z@-aUY51S+KQEZQrAQVrMZ1N!su|N>G#rMjN
zkIU#~T@!?&QkCi-vx}1*=^6(2J+IvjWR69IJ3fMPvd^J!|5x`BA;RGI-fH|q1A!&d
zUr5ZSkGBf{_hmXTRJFNS{=Z~A0<8a$hud%N+#l*l9R&r4nN;(?$6p_KqdxBLKZQhq
zg#fMsYAf?UCmwi!1@JdEe^UL|WmSAUfjmPkMnKuZ-jl333$@GD&g^ujO_TlgHsU)6
zFscjZu1`2+fp<bS3Vu1u#a_Vg%M=B$yLQIWf}zD&B7wi=fTo1Rydi2-${%h>BH)%L
z+Is!6Wm?#Pi}L9wdleecGhrowM@2g4rSu<z<%5R=BqFZF5fBh=Z--<06A=(35bjX)
zTPdI`c4?Q>Ro8<15ENcNI>X(N3AjZu60@tc*Jq9gbj>H^#*9zHc}W#)2J=c@NoM-r
z$Hzb_F@{*u)sK5tpWe(lnVkv?3*XMH{+KaObKTVzi=RvV@j=b!aoO$6;rAVO?Wo@4
zDm|A)|5^u^9D>o1i`{^^A`Wej!B)-pCWK*##!aN0XgNJi?-&*8kdqs8H^a60(f)J!
zj}KY0v!lot@gdY@m(O#@p)WgONkuvf6*D5W6)e1KVAkkRNd-!0a9<)Ra)%#RF)eo!
zO=9XTk4=!ewjyxB5bKZYhFFSk5EUpD-vBVwKd&Gl#|ijhNdEEu|GdvE2Ds(BS!2SB
zKmO5%2TN<gFl*fka|CGPf9_d{y}QS<^LYIP@blLJ+Wz}Rj#IXkF8#hYhnMP&gBv>a
z9$zolWW+ZX4H~?vg_oivrvb(yAwIDOmb)_I7tz81bAlHuuGc*BOe^(CaY>uYH^%rX
znyY!x&5wM5^LoIx;)mJiElMDpX}3N3wV{_Vbr0qBc<t<04bM*^WN54ooMfrJA%9Co
zimXRg+y;5E!k6w!bJhf!2Doik=qJ5TXJ&SNPHV9r)~vsA1W4LzfK7iPfxY3hn~`-T
z*YRzNxwE&IT{2<|09hgEbsN4+mFL{$ETe|^6w4!(fN@|?awqNfJk5JOChf}P^s~J;
zOa5TwS;J|4|6RGR{tqCFe>ui~GaXgnU*x@QtsH|}(Myed6jQ%wcyiGp!u_kufS!{8
z8VCzVHV=mHWBH5OFBR1t$lsNdpvutf2gy_cX)D35n&I5~cMJDkJr9NlieLTQ=@h>y
z*-RW*c&jc6NGC1RCyRe=5)3C>$8&1^dpyEm0l<JT1lWWvh%n)d6>2Xki|k9y*<K{H
zKWtn(ojLWM?b<X(#C2;zmS@l5*Y=)dAuGUp5G_!(RoZj4agX;lhrj+?{q?qe(Vhtu
zpFdm2njjbs)QXMH096*V`JJLW4)Bz+EEwX&BdXyH|Ly-wr(d(`{oSm3fAfP=tUnlj
z*eBe-U9<TmwF~I{ac_WGCJp;}dnh3A@mt_qt?F_wd+mJ|7l&mOoXLFajx9OHbiaxR
zw>7VdoeG}%lhidO-F{Q?SpYH`Ma(bI;v6Ik-ru!!IAv$)=4w^kGi|KMfTqD(ctB2=
z)UC7)hK=@b(^qlile;qI)$Z+0QSI&Z?(X?y6d{N_y<uq=NO_)eXw}VK?^IfZ*;oW4
zd(+%iT5R8Cs$U<EzNiIuuGm7{wVJaDK_#LJlvtZ73j%f83+eN1C;yrMe|#h`-pxXV
zdM-wT6~X_Hxwnq0a{Jy#MG&M*LTc09BHfL23DPN`fNVm#yBj2gO{au(gEXkLpptvj
zNcX1hyU+QY&++_z=R5B2jyuL3_YVdRe8;=iyVhKDKF>4fS_^#83%VWOts4{1X~7l)
zbK85^D@Fzb!pX2h=jFQiYI@i8+TPOb?owE&sb@C1mYCok5gLMmZ&f@_6D<9eG$IWj
zCO}I)(a-zcrnPOl3DC6ngSJEtdT{;5JK!_bXK}8+=nM7v7u$MW+c}3ZHXg@yIf8<~
zRXfBTB@p#R{=&W<o<Ry&&PgGYr&s6k`~7An@x#dXrGO2Q$BTfS4*N;k-oO39a$y%4
zEZIL!iD*}*>?6ki?k57y)cuZ<)w&d_Ne16|^pcBikM5ngyoK{Nq_XL?qDfrz>>cOc
zT?4g9Bt}kwe=K)|E4a&$^{wmtHbb(ub-dKn^2H%c9@4c~?s#Lh2*@bAC!s-re$?du
z@*1emJ`>R4@*Gxf&uQ(G(#0Z6P6Gi|MSHmZ7r}QYkj`u;;EY(8G4I9WFnAHsiJY_P
zHI!tbsq4l8wDfe=2=;c-)8?*B>Qr^9Jl7FETIH9ikzNhdFdZ)Xe{k6lS^7@tJVaBp
z4b+@;wE;G)$*P@)YeK@JiZMxk33Plzyvp<rKHI6@u%Frl+!islRe;9jvx4c{MgJ;D
z5oFu*B==IK>8E2`sAX&N5Au^sg$}8yL8=o?+?x_5Y+wF6@$;7W^TQWoUf;S&R0sA2
z1rZ0?0zSjdeXA&4xMNsit1x*Uohf_y#5xt%b4cb|-*?X?cc*dAB08xnI7F`<N|ZzQ
z!37p8(E5e{XXQsYm){{~7um|^Cu6Q%z-sK+f2B=`?SC`tzq>JbI%~TB6Gxe1vw#}#
zQ0Ma`od*xjD@<=j-h1!0s4cyKz!Z|T)qS_MZ;VtaCl39A1m|U^&w1MtB~BNNa{u8~
zYeD?<=6r;J7_JYLF!!Ky=Zfv*_&u)grp%3p2Yf1bZ_g=Qq;E!Kw<1>EA3oKY>(*{3
z0SLxaYNm^&mX28tjdqpi@&4BZSHEl|cDh{iatEhX#~8fSyhgNhK5n{X2<zRgncnu#
z{<Kav&W=N-^oBo-%9(Xlo4-A4a{m$E`U2WLWp?-EH<xI(PWnzBD#?Z8y-?L|e)H*p
zUe)p4*Dj0Qpj(msBSVs}9rj;7m8i88omA`fVy6yc_XeG`-!TceV=i5<3k0jQ%%7yy
z4_BvR9uZ&4ot9RYI;?(bo8}~1Epo<eYFpTSb-KyZLW42L08S`BaHa_MA#;*)tRY_g
zemu^3rhL9u?7sr+?)We*mq*Wwx~(A=?{`u_LN6sn81H{MYWixo*v|*}&DpRUJ)1O1
zCY40ZAh9+8yn<cXx~vOyH8=RGo`b#5mzqo7NQbL|DKc2jt$rD?FoN1`ogkp?^!Yj6
z#@SD^9eZwhH&SSn_0+?;fxe#m-b>yqz%gspGbEq{@(YM^62W0!4cBn>1J4kei-e=n
zBgDFz1S?U5oNdL?PZPWT(%Z`W73ba#lO`(Z{V{P1+{lUja`uCvz_h=EJ5Z#+sR-q&
ze_dAqle+BnqkKkdR%&o6l_VtN)&V#_)A3u&=)u)ssuOBcpNp07+3mdd|8O${-S#{Q
zi+Vd9jf*ZWcVBLr7qiYA9Ht|YFRdGo@?ZF|;9hTk`EX6pT$;1ktiyn`O7d%*e^Ch7
zu|d35+U5yqSAs4Jjd`lkb(mg`=vlZwy8_)Fgp+S+bn(5s^pdt+dI}yVsqRUn5jj*%
z9+)^m)%Lrro}O2LE&~DewdLZBjc2%Q5f>O5Q2PYy>4Xl6p}lOf@n(5z*-XeZaJS2a
zMtEy)4JY^j_;+(^6(XS5w#8mORih|Wl3J60Q|T600?vN>!;ZmQ73DI;+OlhUF$=H|
zg9b$HEQ?(#JbeVr`y>aMEUPl}#Us=C&Tr@<{{=;VL@{n%gf~Zm!^p)slTKe=EZyBK
zk$eT})*ifg)(+|N__)Q@F|D0qJ&Ea6_nC3ji)0VzM7XfJ_m3&TM+d->@&+kZ9*5DU
z?bM^yzLXt-$zuzlrf+L!>A`rjsp;Q1hK_9ZmjFkWvz+{G!nC2H@nQha_+yHf)SI^_
zv(H{Ib|x?~0YE4`lnAQ=*o-iqC3ZtHtDVDw#?^Iwv@8v3N43U&3(aDL>ZGh~W17Mz
z)32XltZ~Lk#dmF~zA2xkiZ7^Q!$|>-`y$shW}#NT7TXtQ)QVf}z)$VeVZd>H5F<)Z
zM?HFWQ@wh3EOA$N5TPJSJEz^IKmnF5>TEs$-L8P7vs@b@zbWfEY#L1#2Czq)Hear1
zk*wB+%4L`DmiGl#<tQbC$+Fmo&pC(bI579UX4`@!%9&IHHm_$6)8PH2C~j3d#T5+D
z8Q~-S{-8J_{x$VvtXIl}Vh#eT31XMS>YSIAmU}i5R~fl7UXBUw!6`l(hIY~@ZCe-9
zVCMLTmplbZ6f+e(rE%^+;Nm;h7eLbq7ySm+%gYAx3O%!0mVbfe{{-TfVF=^_VS|#3
zcQk(^Pi?jSsb>V1YmWHVdRU!OTjAA9xa70>MXP-aJF{^kmy>ChJj!*7eCJ~JXK^HQ
zhvxVo=j5(#wU=&9Sz|@oi=B^d*ILu$pIxVl=Bquwync3iGCShxz5Cjfe0zFf^;K4<
zhw3hFQiWsY;!#=?yRH3U@eKh}5TBA(LqDwaHB|Bx0EYX<;|hXW5;Yl&4^HIy7bb<_
zwo&cM)E^qD_nGulM8|7IY%Q(jiEuL&BL?I4N-RMOM-;wgj=IogU=Ik}%!I7|Oj^~W
z$wBH#)i)uQOXcfXjfv+<Dcdub)x*)i?U1jk)zZ%WQ%)+XGb<GZRG$wh5iY2MxRTBV
zQe3ynkv!Ao%13eyPw?Nls_1?}dS8;c8Y$orJ!-%78(u`RG<!>0)7OInr|n#s!dwO2
zY$`N7mpDp{55aW1d7x)PrEjR0PU6x-xum$=@1LzRPR?WOXw<ajGQ4S*BsgwLJw=Y?
zy7TdsE6eScx<52Qp+hMu9@l{OgHrg#K=G>wGE;q0p!T%;cGQIes@pOP#MR%%v+Bw@
zs1(5d+5!!Fr=sF+Xh5>iM1Py^reAac+SdaKiEW%ZH}CVk1>GHj%37&+FtD~qluxCF
zM7%7=!2RV`1a3sIRy(NV8xxqPR%&U4+tx^qer|jA6Y*dEQt|P#fSLDe7^(Z$?z==U
zy~uxy%JAy;)by@lHG1)SFstfqly59ZCSqr1x5QHGQq6O!ajtaAa_x8ALyA0Q4InPU
zWeH$d7<z*nJ?xrpg~e>6-wZ)h(KFvIOB-o|B1!8TR4H@-3?|`wC+Riym`P;1=|c0q
zYhP(2RDaTDHH#4kzWns8V%X1Xif>ciWC;y_@WrXJi)dUq91`0heCJlybxS~bl^?HL
zXqYWHZhaWcugcqx4v`w&mpBN-MfrIM6WL7XVhDkG5enN!!xRb8ypkzE)rRHq*t=cL
zek00LL}-~B5lhyP3f1!G3uaB&+vV|d3YYNy?)6q$dbONQOuX-Wc8_-^br~F*TvfJV
z6uRVZ%i~^T{EjXMx=#Q~0vLhW9Jc8%X`kSt(c9BeWVbsgN#zy{)gHcgpR<n$ZK38>
zmN+3=E4^^z`%WV+zp0KRUi&HXa{b&+5Y1vH;$wB+1e~tdR7unu<$`RK-(;em_C_-0
z=tn&<9{C^~9$UbFcA%*jvWfZd6!U>7E#C2mD_u5*AM`lWX?~Q*9f#49hscE{@KpS`
zL4o;R0^%R2Sy6USYG2LVBLUkf>x)|P%j{QWUQ>O6{FCSUeXXvhpu34xIo-)pE876b
zenrG7j&fKj>!Lbj7kV7w<5*j$tjAQpkQt}s<5;n@O^zVN|8@5&fB1}m4RZmXW(d~}
z?0zf9fWXR@@{bd}eksG;$l#N8R#gfo%hJOwZ;~*FEsU^}^=c(3gv&%-Xe}l0hLDLr
zbCHh)t!xj>gyY)q%m>IuwVx&mdH~Lyq<KmgSvRXnyeD3ueFZzZywLLX_{amY0(Blr
zkvHBye+G3hR*>k}WE)-n?7A`h>|viQIIeGTRhyg1H<5K>e%xp!N-~L((uw6VHxNxa
z6Mmstq>~;u(P%g&BnezoVCefh*NF)n<~EBAMn9P614G7coskxZVH<TY^}VMpG?`XV
z>UC%lm+zLw+0@$P*72b#0h;e&=Hk5G=|m+H4j)aP>8zsfY?f|E;B_C9crApdZ*=xb
zk-|3VVU}BDut$*!JR%zB(J3WmR4-M}1V8wO4~$oxS?XOKvK=9CL-0U&DwWWI0Bv(x
z5EsC`5W<BhIDuy8p5%@BJGjO<!8iRefLjlknd+_A6tzyCr)s>xGk}`miM;*%n<EOm
zG)Jtr&5DbcE!*E+jmB+qVdQAOR~?Ije3vBtRXoN)#^<y$ztniac>au>Cd9E^EXB&z
zr|Cx?uag8fqxF2TR+?dP<QD*PHk`_0jAc@N7W2A4Q2dxGp2yhD3Al}b0}hqHR+I!q
z24933>Vb3|+9TAHiQO#u{Z{F3PE1q33V!1QCv-{_e0^Cd&{!=nf0(vtJKI6Q<JjBT
z`ACcKG5C|buigs@?H{hnOT8MY0ZMND@wj#pweNvbzKd#kH;bz3m1?&rAi0xgjQ=#X
z&!~XD@=j8MPnDvS4L-_6G7;P<$UWrH(IOWP1-8EmlzLU~3o523m&CJfj?Nx@7_M&L
z+E|`!Y86nTIO*S!Bw)kg@35OJPFAEStPpTrlUg`F@nyt02@~z4`6jL`a1(?IlfEhc
z>1vIAYI2m6KCO$nHm$2dhz57=y|}0`ojyG-0N)hE3A4^kyw@Z^W7Z-k)3aC5v*24e
zS<7?yIiN(Tx>$qQ@WWu73!g3#oF>isisa*1Imb%&&qae!d{hGV_#=^xZ$Hb`i@z~C
z9X;kwhpGQ4t12J+(J#!{0+lrFQ}Bt}+E}vaa+SD6$yxN-HoSvzm^f118Ia9R+=zRq
zy5S^eE%KG+DAD7b;D@}slIpTL&k$66GmfA;T=|@8cw5ShJB<Lh38g`$#O+-~#v26O
zDFTQ=ly|U|r;Bnqr%hL39I6zXBsi^(tz>9Ru&hgSI3Jkg-1z#TwyxpLBl@?GU@oDI
zsZb(f_-4rVo4TjKRj%XmO*2n_qaNL)?<f$nb8i+fVy0{-=`CrKuI%x*Q(WYIB-gE`
z=>g+Kr-w{?(DZ`-w^;++_We@uiVur((+e?$0#D(okpPaMbQFHH<4AwC{Io$##nEf3
z&<jv1#>qF{RS4htA7?G4Jb#Ggtz!;Ul6}x_fN&L0k6~Lhv0fI$B4Bcua4T=V<JHBW
z1l4xgR|NBL(<O-$hi_^v0LvL0Hs)I1*=iLPSK*<i`z6`ct}CvkmBUyl`P&p1fA<Tb
zE_egJYR#sRdea3ZQ@N#vGpE{TyM<`Z*3v@YUt5R3f`~4H)j}dsjfDu_sBYY=9dK~?
zcMOofrP|b*PqGB0^7WeS#xb|uJ9dmy$9zn|{Y04i9)lvp<&M%P4DLoTY};SLP5OXX
zsxnRvX*QX`PHeOz>jh-3?PqV~Pe^7?!tP?8d}UrJEsKYD2D@GzrFR(}-2qjj>J=U>
zTqbO(vyTw=yzUE3KgnJ**A)3IAAUhsLP=Jq6Zf~gt6l;$1K{-PL~()wB^FBe+Rmo-
zHI6c+TtR5@bs4~I^I_mX#%`$Tw61$5-ncvFW_!f$^BL_9c+02e97dr@LB0$;3EI5V
z3M$Ze)}FqeZsn_EfFhSym+Yqt0)-R}rS)6oWH)Xg<9*LD?`MOjQyCOf3R#oxPc~r~
zhXpjP)$v^YS&fk(axGuo_=v)a^!mjTiJL9`)TLRkk;JN$h^5_eR~)=C+WzPN4Jd!|
z2SO|rI&h6FT{>p}Vq=A)k&^(N>+y)LLzRK%-TQ;9Qw9+(uetIhQS=o+hYLXHpY1H3
zG+83QYI;#KQ*Ayh81Ff!Yf-i&Iyo1toB=f-?!eYp;mgmN$u@Dmlr8%103o?EF6Zi!
z^`dkp#2;B(|2&MHV_0hu3T$>_$~D9soJ;HryaLqDaMBt(Ea$0ZU^g4_k6{s<c}uF}
zchoy^*BHBJi{AU)k!i!&3Gr_LJ`V<t0BF1#(d*3bH%~TATNpJt`$%2q@*jl=ePUQO
zDLMU{&<q_{n9I?C*PS}sNzZHUX)}fAdd&zObvlJ)wgpZ6AW$mKeR>ulSmr4@CM=Ze
zuGRi1#7$#=0o<$Ce9_i*B?4@gy1L|Tp>YGgH#iwZrnCUI0*?32ZUb)0z9EJ8bNS)N
z)zU>GGYMowP^~dUtN9UerItZ_c1V*7(~=bkvgcjHg$=6UQ_U&q2!7p}6Sqauu_>3Q
zI`h>={5V6-jb3Wy?Sh*gQ)GqQ+X)(URCl0mgcdbrjI|X|lX|7T@zmelUR_-lv=@R!
zcV3J+AB}pKj>YA?*#q=mI4O(wm)9n+y|+zmLNEGP28)kMMFCph1s72whI^%(c$FpV
z@^y*}r_^~b?3kFe@3rpCKR0yfr-?uMq_GqZ&KrQAlt_qiIwz$ZdRgfP?7u#ZRNcs>
zPiv1)3H&%>IWeD{O6J$@2#DHyz-{nuN2Ta9?|m-&hA~Mx=3Q~P9fkbStQ#%=lIj1l
zC?EJ>g|eUM%kv_&>Xqg=WC7ELK8H3>u)5Z(>E{X2y(Ud;Z}hvIdQx|;yN;{%+aPye
z+pfQbx^NlRCA^gPdOEN1V#;*K(hdIh<Ro2pMd*5xbbp5{3fOw?IX}NYimk9^9SzR%
zkT5}_7I+$cVk<R8npr8R;R`2<IMJJ*EAcS(2gmyNPoEt=KlPOQu|p1neZV!b^bJ1C
zy8Tfu4A%!kyr4F)ROFjA;YFxA)hErUBwPK6rFseb{+<GWRE&Th@63QxZ<FFp;iIB%
zu<BqZQMsFjYwR~3GPW{5AG!JT$FCH!5sp{HYxl)JEA+B>k%WpFOjShM#}$uNWa<)e
zT5^R@>cCS4e&6Xn6jU&lH=gXU+KE_E(glkH=QOKtP@kgZ<<y<9QQ8AePT0=I_Mf9@
zh*fw#<5m6Pe16{FMWX6_-PfU&05a<!qe8(fm5DW;<)w<{WKLPI7_rGjj@A*PnjQ@T
zF04x3JuQ9)ashbH$+r%(8U*X$9WV0uVOKJ9*05MpcISpp(1GrFgf3|O!}p*EE&UfX
zSo|!}(f1&8yD|xgadtm}%JRBZ|JG}x9lkAO->>47Tw5*&@Su_UxT7NY>ASPMPAL#h
zI0Me~dbR(}j@&*bq~m(K6C%*=M!qjux?R!AZ*Uv?#>a93#{NosFu9XlR!H<{h)#yW
zO<-<ryifW%6zN(|2jmuc3qc|FnoI}whX|z;J?PA=OgS9JpqhZ-l=^C(&wZ&;AUcrI
zd@h`7!X4!&cdD=y&drQZurs-uCT@biV`l2MRU)o!3=E!^g?Hnde~zBWA6{)jtel#p
zpU$DR&nTT}=cAqH^QBz?bvee1ojCz%A7jf7xJSTtf=&4Xu+4iXJ#2>;_F|5&*!1=&
zeGibi+@0$-Zl>1e-CL*L8??9snVyTaZ_ag4KnKM{$g7tMBHJl|XL-M8m$u{V-jd-C
zZw}^s?f=UXv;&+*VBoB@$g%=*Pc*$)SkHR1Hwfsca%Ik#QUtncAhGeH3%KoPv3*bV
zyE(=87?(vq&y%VA0oijmP7n%QrQ5IuZ;s-un;mqSHi5rWcj(PTK5Fkw=He7=L4PZ(
zaDxBPcRpZE@9CFk{bXI@7Le;#ZN_iE_b&kHh{JgFRMsf!NOmT4(UMU(uw&lFJ>Gl1
z*P(T**sdX|@}?r5Lv&j+zI^&cIeXAoY+q3&kjtd%?j{U(%aZPPIpNMuWh7BNE<awZ
zj4HMoTcQm8$4KtLNy6~&e1sJFNq09Nl`g=<uw2_)%&<P+M^>P8OA$F4m+4^p_^M}^
z>#A-!?ULIZp-`EB`jY)Ommx*wKxDm?KUKB@e>@rN7QgxhJ9&@^cNRDHHTyX*9Ke9X
z|JARlH1^LNBOsfY`5}n^^+~GdD=d2rtRZjQd51UNhM?s3(cWPj1%c8F_IK+*&JQA_
z_k8Miq;7}c8g?~~{D^n?ZYi5OkNKU|i4g*Kw11pZzy96`<^>*zty|)F^*2d*2SRjO
z!q+;744M29^3vs3_jyEi!nFK657&2y1IP{rM~wy9eFZw2>0<r#?|uUK><{#ey7Tfs
z-JnKvKr-|n$tUh)M0%33tv~yZOq&@DK_|%7O$`hG9%AlX#53YoU)uQ*_|Gi(k7rc$
z45<HprX~>4dF*;i4)#Afzm7<hepXh`$o=h^+CM(9VS~f*?+^TMP84`E1PK6?wvtJ@
zJpaI%|9yo2IWQPCwP)@94*ytX|3wmfW<c+;6+g26-ROV+4~Plf10#s}{Fc+y{QEfl
z_x&+}sECO}QhMJ1+r<5M=DSJf^bvf2;Kwm>)9*I)cWdJTz-RMO510QDfqrlMPXbNO
z27KY1zV{;ZkD)}Qt%2|U?H3thj!@}e5dHqgzaKHPM93@Tug47M|8Dg6W+ah;AsP>$
zudw*{5wfpD%%$b7XY|kit?fUWvF!$ih%CWM_wPo3>t0M?Y-%7jE!gQa7IQCb2D1~F
zgcxJ`hS0C8bGiv_zhi{sg%&Gs&%eK#8<mxG-0;^}c5AEaDo-0%>eV*GZ7$Wg??R(K
z5SQybB?RV`SHr~H+Rn=r?v@$^IGT4HSqM<eHB~pewD0N{KbRQK2_D?CEj-UUBUH?r
z`A0hO?~x3|jt_kO#>B}~;<f5S`x)nrvrZQ`=rVs6JJ`_S+t|(9{m5W)dON2EdR$jJ
zCMoFhhQEoE-rC^Fh0OlP`CZQ|>(<v<|31HFSXgGuP3e^`5|@^Tudf@ENSntf>t;|Z
z`R+9(S{f=ILE=B0_w{fzaW;=uSF2HE`>zFEC0|>%-8@%b@H;mOwEbsv{cY-=Vo_XG
z7%ni(5?9}AK6XfNe!pfqQ-JaFO-rA{M+<pEv>gU6r-_*t)Q3^Xu~%V+-`b|exB$3+
zHtSuLAep{h<?!zo5x}F-(|xH|<t}l(`=N*qckzWDk=6MW(Bu7@FIr9Yx$S{FzWssn
z;O}nzZCKFNz`eVp{0Hu#?UISArgI0YSCyL_gh3|%sB!q)Hq2zqB=yexuQr;(aPe(b
zehx?D?z@F=&!EEhf`2X)cY!tslLVVh7G0cFzj))ESmW3j>(k@#E&p_Ancj72T1ykv
z;I;ofqxGAyIivE~IbDB$y<j~{63@JuceSKs;>QdkFZEI}f9=`TlP1=&B<T>#0Io5C
zwrpnh$Fm(I^+_1lE^{^;d?CrI67@K!8r`i84I=pYuPw|)JRS$mzLIcvuqz6jJk<Ls
z=)SQVRfrVN6yQE*K&8F;rl-e)0F7*D=1A}pc17J7cX=gwByzv0F?&4wd_wBr-7E>?
zUh9HZQvt+Joc0dI+Nl5Re{d|=aY!w?Z)b-wZll*8L~NMUcAn761}!*ZZtS(dpoM`{
zvweZL%w4gf1LGU~X+&t-%Lc$jvxfn?XqloHrwmoRp5rzF#iReeu;%bc#|wMJ9CH~S
zddLRqqAtgM{9)!9UxA&{RLg*)bLn;@j_g|!$cR1%)kSOd-%E9zu*95x%J;wcp1)=_
z@Yi98@f*YUd>VcLk=_?=j=kRTCI{5{_Z`>p2PIrC)Sh^BN+COr!%1j*i*xQC#bf{8
zuXm=Xj%}W4e9d1N*9rsW`&g0tRiCqif4=$dKiT~=G3(qysGGFeh$)`kh&9(nCq}il
zdgwOxNG*ho-qUIK%h!dPftIJQ2bUAd{)eu<ObJXqV(I^)C){*e3?G*Jp6*V(Sv(vl
zs2Ol&(5OPCIwvLGRVo<g@QV#++D`SJ5od0kJ{Jo{5{kiBzo<i=g{Ck6-t#$qQfev4
z;m2Is!L(;4=2sl)!m5HXud@_^L6}|bArfFW@q`SrgCXp5FaO=qJ{rEimd|P~*;2(l
z=NNs+h~3W7Vh7qOz<3p+3eszSCO%cVFFMZglydY?d>8wFvYPiuNe{?u+CigmwP1&}
zx@ee}D9yTu1sje<fscdK=r#e0+gfc7<CX80oyF+(zXl!qcC12yOXG~vDVfXW&K!-6
zeH{X{?au};e4RRc$`4UJY4RO?7nje=Mn!D?kz4+4B^q#dtNKMVHt0??gtjw-l`rR^
zM?4)UwO<3v7;v0yJLvHojp~*i)BGz6s+qA`FF~$Y9by0Oj=C#(C3ztuT^Dn#o?9!$
zZ0SSk#A(e%gleSAKc@-N1oKNxjrHr^_IxnjxZWV2RqE+8>BbYWxcVR77V>x;my0ub
zjDFJ_GmXpTs0c-g*viy0yN1cy<w>fb#;pBQsg_`s-^+;p`(1N_k0bP`RFVTTlqhr<
zu)dADV7*?`#@boStrF9(RwnqL{1QJNYT8KB{hK#s>`(ML@6w)&#&hqYd{Uvu0T%LJ
zb*c@~w<<%M$RKPhT7A-g?e`bbaoJBt)}!;zp3iC2Nc*n7@SW<tE{_ZrG>6bEc<mT8
z$=}v;B&v)i6^&Yd=ppdD1Aby?MDii=o&nRjEPYbh(p5bST2+Uqf$y>%f`ZahMV|7d
z!r$Mj<A<iu;mTrZp?gw9#3JEXq?HdD<5BM7DZ71`guzmuB3D$z)#Nj&iutoA6;Wp?
zTpnTwWsy)MT=+=He#C82OFOERitGG%&BXz#HabA!`htJ=M0{|SiHX-kY7c$O-~ZDI
zEa*1QWBf1=76N<v5Of?<5Q8=rf3&)xElwrB%~Tw$QpqZ&l3|}8)fb6}MdU2EyT*<o
zCSiN`L?mlCw4qYmd4-9=){#{kSLLTR4vyg0`XW~6N#FOyxtk}i`r6+vh1D>eNGj9O
z-y(HLrQYXJL_ZS5Bj=!?=#Rx&x8;2@WQQJ}fXwx=cZ)?%jX8x*Kt85%lPfa@Q)b@c
zUQ;HmxF)DYuTLuF+i*&JkVUURdcbwFq+>+0AO;BDq^~!>BUW40YGc@9(PBt*2X!Dr
z4~b;LnY0QdfLK@PEwOURetu}sY9DH-|M7DdHP4Q8na=m*Ua!V=!OHNA+=@XJWvuO^
zw?oG<G8^x84o;L3{DP=)9TbC+9)h<%D_d{JBB3MC45=pY6S|TlKY%hb3{mo2o2Q<s
zWEnilT8zPi?9LUBpsAgNP}-fe>$C<)<Iu(<*YZe*FB6w1WKlcFbH_(*(FCqj)n|e(
z+s$sBiioZ9GwFf|gg;(#fi)IU(f#TBsGlVa2F^vmF`rOKI|kK90(+L51o<4xmIu3J
zH(~NrKN3(m@Q9fdxy{YUS}^l1%OhZdf%AAmrp`f<XUxJKWLvpO+3A+fK?~u-i+DgL
zZ2rN7rt~At2vMBAfrpeqhNaSbL7Q_L8vF5XM7P^do8Sp)!?@cO&p#xz<o!x%D*xyl
z>sJ`bfKyI@O7=;3xVX}!gYn8TZ_Jt9c<bA<+W;h)cZe~di?P&E!9izl8j5^Go6ts0
zQj8S&D(>O4&A>D@#S1#~T$~A9>bN4_wV;A`3SaJ>>SVm2AnVd8ZNpnb#l||mFa3j-
zeFDd`QvW4{ed}U5{p?!0Jv6(eL*KGE65=KPHIk#0<R+DpnMicZZLrR{Ym)j^{4dQ%
z9)7DHN?%9KV^T4Ojzdl)Y%o?i^&h)$R{Ky;p9iW8Eiy8*VZVcf&Xa?9^I1JJp9|dt
z_*%vDvR?Dyiys|LUO()=yf({O)pu2Yo6SPbJ0chOi-pVnK*CpO=fkJm?M2IM?&$JF
zTLT(YyAV<IzL)so1tD}&dr&nE-a(OQXxe>$;iPw>4nsuxpX2SlXawXvqT%8BN;HR-
zxQOY<k0>CO+lv_9dXfd2l(^igHz5A0yY5uR@lv9u`j8DzXTMyRZGrb@Ub??{;~4Bn
zs6>JFjBK7(33<Uawdco!%SBm+na_}iTT0t>=YhPvHxJ}oSAvY(@`fM0q~z>`9MFv3
z<$FZ*T6+1wo%xX_B?^(P>>xKe#_!e$*;@`Cl90Lab^GsvR~T|Y(-j5LM^xOff<s$}
z={B+E8RG{?c}Oj&881=7<{$Ql>9O4uoeG3}2xHu|3yr<#rcO<~l5{OTjyysYj3O@u
z^@y?-hkZt-klYJu@MqKt(s~Sg67WQT%ITrww$;d$Z0**JlK<slz&sw<GpvoA<Tbu<
zS%6WrbGIpuEVh>Crf6V|c?9-0O+5Z<7;#p!W_WWyc(sfcX$8eu#@;RG5xL0+#F}{-
zg`52<VqDg3l~FM(@US3aWGET9!PGV3+2c4Uai+n$f?<_>@y_n;VAbLjQPS5?2&Xxu
zBX7{L)3ZT>h10mI0xJziOsbeNcjU>;XpC#N^w&f}I`>CIu^O&kPo*V&^82PmX-}3#
zoJnK{C1rV15etkNTOSKt6VuOS?nZ)h+Qn>>83h~4VEk2hW+V6Yn)-J61J(&GJ_9<7
zRawqj`VlOzJ>eKbhaxUJlD8jvpHe`K{et;e#*;i-QPj&q>sI*vav|kzg$BHLkPWV&
zw3@W}{vqgKoN#jKAUd0-h~7~<WU+F7&=i{CSOAhwDQa2z<b(0xV*xB9_HfeV>r1%_
zs+P}a?EwctMrWv8#X&Fbg>DIF9HA&LC<*Y(#&B+P;(SJuMysNAmvY6DeWYEcR_ybr
zPo8I<rL14`vpH(zQ(gtMPuF<4zDCk`Fkez<AxW{-fP(~rw2|qo`@B@#v49(xV1qt<
zmN*z_(OZ#vdkD)1-tll`rS=VcGw61+$`9C;#OhC}W8+Fufjf{SNSeY;-E8Ri0=8tA
z@PRKOT`a~@vXJm;(qm?$rg|QAtVH3cb>i>=E~4v5E!q<>odWi2^+LRvN9Kv}A;Lc9
z%7gQJ?qM{JTDYG1iuXw693!sHtxaeJgla9E%MW3)>T?PFo2)dPDHoD7Xh5gtn1v+G
z1t|Je+0Qm{SO>#VvJK6|$0q<+L-=g>GKqOTf_if+$P%4IK_hM+E#F1*F2<rb(5w72
zJAniaEm{g?TaNA9@0j7pVdT1S8DWgrA+eS2<HEU<m-J?)xIzj>nKmKv7LtHVWr;;2
zbH+mi(In(YZ+kW8`z+%3AkM{!sc7)8!K(Z(gr;Z32_JSa;bhWdUw8%iJvD!CxK&*+
zS^8Kpg$|g2&qM^adwfhkI7!NlAVGoQuEj;prGnlf<5LeJUluy?#PF_ysrhNcJ2G_A
zyo^5=_~j%vM<NM9eoY&f@^VQ!{t~8Blf99dDCF+rKm`}DK<Q2sM<YU=?Pwara;9;a
z+KuRVXTpXm70soouU_U)-Vtz6nk0pmL4X_t5xQ(&qB-wrcfI&pa{o~jil5znn4fHq
zL<~(l^5dQk)p18~37d{q%Z-X<nCiW)^!BcIxZhFm#8;b5CuWf92rFVX>ixAc{H&g#
z2*u`N*a<m%`M3&Y#l~RX#=T8GEGETG!8*?M3R=u7^;_GLj=S<J@{{RPDa@g*nKbg>
z=6O=5cr6$~q4D<mAPpl&eifsVa{WL83moJH%sQUHVWZ@HcIlO140tssVakpnO7)HW
z{i@8I=4mug)BMLDUB{5^*O+sWnq$Yl_8p9fA+G<bdK3}lsGRnOwgN}^j9!dC5|iYx
z<s@A9D@uPT6Un>NAyC5imT|L9ZdYvzKhd2AVt@Ujz%K5?o1*u*qeU61U+d$Xoh07G
zQ+!>1geTw}bvhU+AtGmWS8~SPhjE%<gHd-6Gd<yT!q(hFxe7fx6kFd$r}s)d6qeYk
zFXjnmA+QiJCm%?_$Pi4@z7VH~_Y?&jOpEYFNZVz+0;KDq9=~7&w50pJ2~)(U39s>=
zzkJut2)lQ#ovr907{RkDj&L-9PsIbXyi%K(w|H$(6qt)E8#8Z^$Q&>v+=n`t=q)=h
z&wy}1I{1TNVC9KQeNDfnk#Y=rhqa-Mu}(_p1u4Sk#~?@6sY+%6J*b_q5I2u2MgTnW
z``cnOu>uQFneX;PbeMfV6^<ZHeNxGVfx=&3A^Xa%Jip`ZW6$P9hV(ZF*A3Gknd7&h
zW@Y0E;p51tgh@o?nfbkaW&6r4-~OpM_d_|vH)1*A)#=CqFu*okzx;J76@Uk?Ek<JX
zZZR{OH|$c-R|&PD^86CpYwc1dJj~2iAl|45P=;X7rpG%c*IySk%LU@*O8LC~**u5*
z%GWgKQQ70~YKO#VBIntUb&`it1DAK!zyxoiItEnR2?sO>f;WOMgO}(|lRu+Nh*@3h
zZJCc8gxgQFqyGUR?cX*k+DD@g$eG7pYNl8Px~1BoIr~Yffx8cBN<g;z)9<13^S)(z
z$ILQ%B=n1aLPy#E1v-+hE9~JrFU!3Z6e}9qigI2Zc!<dXk7k5@!fPV!{!kpDKCQ4v
z1jZ|J<6SF&%pH7TpqAiFAgASwOT~?Ocr+wErHl5%b$V5bD>ArP3EA!9<qLyazm99E
zvkGjVhw!fa5}$PJ1Z6RyN}Jbl-oZy*+{Z4*?;Ikfj2Ce{bHJPJ$rw4}=#%Prt9jUV
z-1lfW-+Pv+bnsA{L&#dtCtn8bS$veFC_-tW3zMjv%(2sswwTJozh6)JQ|GcfGN*<v
zHhY2CJ5V}~`v13xQ9nT!O*x$toaOkj96VP*k1MZ6QLjW+Y1(B%fOf>F=-Jd`0Q^8=
zkz^<lYX^UThm|oLCCzYE*1*$ZE#wDY3pci+j*F~@G;Y1C^d}Jdl`C+u5STrcg@mGC
z^c8Ap$;fBu_(hTQLMXF<t=T&gyh&p7$hSk5{k+K5N`q)@_(zzB#Lnwy7O@$OLED!e
zf-7tAM4l=AG}Ou3{wS0QrkkK&ni!%I(=uQ22ck?NTXUCE@Z2X4oJm6B2_`|Gtkh}(
zn7mx4akM)&WvGxMz3qLvdn=c_ZznDxC&V|pnV`JpcM6B#R;iz_J?F;t9$DQ80{5uC
zItHhCN9vgQ<&=u$#1`Y3WWE0!nE&929<Kt0mG`Ak2oPF%#+sQOSq^#)gO2KH^vrl9
zK6-}DlhSZ*gQ6Hi`{Kn`IV0jCY2z#&wa_^WpZ*Ec19?vg`ijI8-6`!^xs;4p&u3Me
zCNJCU=*k4Npb*tbNnZoHrQB(2qVF3d=}PEN3Xmt0vyT$4Bo9YTZ9^nNLVw)_IJeVq
z#%X^a|G>HT%NC4)giC)y!euV@5G4?Ub43Othw^D?_~%4k{-SU%F|$;1w~mZ7%N*zb
zATey-FPpfl^3440Kia){gvRt`2v6!i$%~pLj12iw3oDR93YsT^J#|#DGtdMB<{!Mi
zQz^Vj9wE&|%5FIfka5yx(q3eWQmy8cxSMcL#ZNDb7gc}w{vrmzfdS+KOU2Su!s^ua
zq|isF34;+0;AqwPQki+E;E_&ZfYbdJnnq#uDD3Lz569oyKj}wPdn#+2FYHWM_@(<o
zQ`UM_iJBixSg{C80gS22@p;0^(Fr)h^H$-Kh%HUT*DCMJHwMpfA@DfA9VGAoeSl$9
z?=qcsGSLBF%Qjq8dq{DRWtBpR$5|n8{-In6;P?BOo~eAHlg8~tL~#U+`h!YO2K3{h
zjSg{HO&i4gg#^DdJbXJY_}Y1$<PdG&3PKXetfWt)e9GRH4#Hgv&DMiJomRCto>8nn
zQJW8J8n)<B$N-J}G~>q^_|=v3E=A%(dJnnC-={s_KSg#gtS$fEH>F?2%!9t?R%?Eu
zDezFo(Yx*t$6w4(B6|TG*pfG~X3qz+C6jQDI?&=A%qpXuB4h$EHX*wk)514Ao|e)!
zL2k5%l+95HTf@^-DFVQuCLVdeQ%NDQ0#Eqknr}lCln;+(e9pk=QZeV|f+t7!sI)$5
zWq4^z4j>mNwowav$x%qL90_XJdo)Z+_!&(Pr{GEni5{v}$DT4os!Du$Cp^dRInDwe
zXRw1foZO%avn+g6o%h;h<+4p5=8r>4RGU_O3Gry-_~Pxq=Km-9o8%&@Z<7{V)zHZH
zK<2@lCN@ue`v>^@wz9nbXn{)@!^Qx$5A<A^qGdReC|Nre#N_oU?L>;agk)bX688}l
zgb)B2(3pRP6*NcoQ!PlXT_gm!V17mu2Hd8z^x=l~$$;V`z-RmtcNFNa4T+XvR@g(H
zPzo5rkF!91iaf1t{W9?aj0b?Lxl`Fg8{q@mkcoY2ielb1ODPIzA!l{L15p<Kj>qV8
zvw&AfUw@pJNQ&U%&tQRJ6tYxk76q&KLKmDK3DnLNh?HitwXY0h-S|wLQ`D=X*g_nB
z)T>drs*(Zw%AR)8edAi_%cVd&#Xyb}Mnq<pP?SuOFOiL-p{yjOX3I41?aC-vzb@jO
zxJu<eW--Dlz(Rn`A@etksYNCv$ECS8^o|yiILsn$B;}tmohDMrMFr%tA>v0UJbfJe
z2q4J#uRzd`L3(;+s57IK{W*KLdaX25bX&p`TyB*RAeNaK<Q@%MWD&7c_La(vkzTtD
zNKv8j26<;eD)~0UVn{Efa_kCCk8Ul*t=wOJ3Z|HSUC;UMy}q?*39yJy=(K5vvh5^U
zsY~8bfsDVtq=N-^6)ae_vkV|J^l36_b8b>bZR_Q5t~T%MZ41bLmfdE#&-UfCgzCwY
z=)U;iAtdWT+&5**cCuC7Kg@CNdhwV_!$qaAz=Urw`@TfB#`lsc?4b+2f1Zzk;mhS)
zk;=Zud6CEqCt_$`RI~mLO~noaIfCO7^7P~<{SiO`Gj&O$$fRX*vr{7JGk=XW6%8W~
z=fD^7*GL)fF|l_aEReRcyi`D=99uVy2I6S9>AQ<tf}5e=At1CUpgB>yQbO(eyP%^$
zX02BBdot}l_U=zet7KNf{L&NKGxQ6DRZlQ0T-x+xw21`{XQ`!dDL|wUUW6@{$&{&x
zNzFqZBBFKxKrgVvJZY$|nnNBATyd|~%ZaTTgrq)ZtQi*UzInt%K!sz0)q?xzy$N<8
zjex9CRHimx(_H3ryX6gJe7dIR^cd71acX<Ot5o<+nvsaLtJ??8E=^`pPdH}qR|E`^
zvG+15NN6C0%GNF<_S3+<)E%o41u6Ubck1s7fWv}h2gAa^P)W<3BvDdjXaI_&_NOx3
zBtd<qNMvCOV}ubt2}KFg9(p>r8Zs2=L~6l%Ers>qxK3L}n^Yh;j?g;#c+%EgnDkW?
zHU+(SIf6dc%dpQhJd2Ol<MiWM8(_N&Rhd7oA4NHeWC7D<fli$lsjEpJJ^G0ISgtQ#
zCELtZRHeBXInTQzC>|cd5IOS5WuWgT`(gMzo3pg#0PT4Qz4Kai!G8CMY!w!YDOY^5
zhxV_hj?nkqalBNbpic$45*K1x5=!Y8j){lHMd2*HppSCLj5<R^4e5276STD)jHD!?
zPuCSRlOBB2Ev6j0R`~xA_{r+03Xb=xCL@);((0OtLMFIJN*V$-K2xHoG;Ot8<jYUX
zIWlGp-&xgC$JzOw2@|Ax>F0=3$H7xN`jckt3C??Wt)3|+DY%I&LYG6vgXXWSL<3IO
zQu34JQ$!d;S?IS46nuv6tbhe@7O|;f;{IX*fPjcJmK_BWikT~r3AJ&Y-4CSzR;`6)
z2u=@&4vm1+j~Fv5qA8jCU&L&mN*sCiT(3Oi7?ORefWqKvb!-ZSv||(8Dn>}9AiyI2
zDalL0ka-k4!m<KeN3iX@R!_Wt<oIB$Xgv+K0X4f?g4w5TzQ33U5OJM5S5X3gX#$L8
zQi4H<Yj72%4L7-ihA$5f(60(YnDhUj#`wZ0O&Xzq#n#rE8$%^MZIiG9su|tLnQ)pf
z6)ve`b_TBKfjtF1H2~Zb`~M#9!3W3gc87n`d8go18|5XW_v#;F@==ONDBigg19H`Y
zrZimU-N_n&U<f}pp^uCN=ijv+aO=SW{Yrm<IucS$f|qPNt&R%?O)>>MJMz6hdJa6M
z5n0*xFbm%Qo?NGCc#$4&F*lM3?qx5R&wm|CT8Izey)3y48b_R1D5~)KW0HQZ2Y#)J
z8ae!{80_l`{P79obbWFNR-bTD8;)4&nthrvwC=KMB~%FTaq~o@*d(ZVS^(HxGgH0s
zrqLt!qcFwuCQT@H=VkR1Sx*CjG$o49*CIGpVON-#w>9z~?_{Fp@s71)HBxfW6G-M8
zW*4?k470x{xH@KiSOdo~P~iRwgS}9ygEdu}Y&f=VJ-17mS+cJqa!l484a(k{yqnz_
zT{nb>y9Tgh*YDS1*82o8kWj5iBiBW1U_5)GZS<Lfg$`-FQ?0lit<o9!xEJquS|*2;
z08fp27P3!#AJ1~ydi$@l0Aw9Q0Nv=zPjly-+OXo06|#xvp6&R!q=mfBpa?YzImf_)
z=D-a6&jl8*hD5uORyj%4M)8tp<(U<7X#PZsI{!h6YVgr`wAHYP(I@i@&HB;fN)J{I
zQjq7HFZqd%#y#(w_u`cRQAEBn*3cd*PYER+Oe~2)2_YQ9uATAJ0?><eK%-?Ai?~xc
zjWpp*A`r__2jXd2>D2Gn3XMy#S_?)Q+P*T6V{{1xN@mGE*Mvw?96(wvRVn%ajkU|V
zVX<A9qzeWa4WMoYj#fhns~Zw>wpjhTlEHPCBXWMdQ@X2mJAmZu($x+RQ+eh2hk%F`
zoBX~Y{w7)EDA*=!a<=`tbMO1r($k^38f3AHp#NYp288PK44GJlg5B~kT7Mx_=7wt|
zqZlgaT#PPKcJm_fiA02i2ODySqO6iM#*6YR%n|C1Q`#0qjWt5X*OI;cLq%k#2_+E^
zK-PZDZ-T!ILb?V+K6P!pC!}x&G2bl1Qg0tKB#P*DQTJNLow(noQ^Sx=tR}5Go<aHh
zf9<0l566dVbwL6ydGkNh;~cX*T8&ajj}(X&jRgtGd9b9zzUU;{MG^v_0X?lX+0j1Y
zozb*0#XIB>93zAlKpMeZto2^yk~so<OI>0j5p9`yof{d4`-wm}AS}lJB`iKh2#YoU
zC&FTxJv|Qpi-u38BrCGn_ae@POu~b=ae#RcxN}2gR^OowrpE!yeUs&@4;@xSLD!Xn
z`wjLBEotBHH=KrT9aK(N*D(R^K@)u)>py1p43|U%D5jB)3kP?%8y8;bmdc+#vXd1$
zV)hsxy%kZSpkU6O(HD;z8Ru7~$i`m<s)@W4+-#U{w0d%xi>l(ug<k1<(}tE7N7zg&
z<WS3-V^iWbqeEY^YK!C3--`i)_iYU?cS2USK9A7M1vsC{UXk226_4bZ4<sQNp_!ym
zKx)Y2pp3-cu4t(+nfqTkxIvq?tBgbFMQ1)r07S(*aqR&BD%~FdRS4oQ&od<{ru&jO
z5`>nBJQ8QD&eyybB-w-1%TYcv#Yq_|yqe>*3>dW66M~xR@N7EHFHfZDc&GvIpE7`q
zEriI|$PXi7w5>2ZTGT4IYY6F)GT}^v9j~Q=l&nW8YN{OHL?S04*Md0;jKHUv4Yy89
z`+{?K3Hz;GMn0C@9aC{xZ3PmSDE?;?NG}?E*M4p^pZl!(D~F38oGCPSfSA$4S?tGr
zGAad|A^Kpaq)Nd#o#zxa;QU?ZJcBkUHGpPg4j=cG<=Q&kbNn+WHJGJjT{hb<y1nr@
zGK(|;c|>g?w47_h!<IU8xrqacvYWsZQ4kWC6}&Kbzd_sHTeJ+M=FwteRgRr_ikoxy
zGkI3w?2D{*two?C=krY~Fp2XzQdnf2S}}#nj<)y<t59js=Hp=huY$mUGtv?gd7@B+
zqRD?Y`k<fp7lgeWp<GEn;{Pv%&Fgwcm~E~FwDn;L(9tbh?-ymoxD6<|w3KGJ5w<IO
z{;6Sp5HZn?%TN@PGb?H#b1OxfNE}HSLne^uL@37+?L|THge~`bYr+#6BM9qda;U?a
zBby#T*JT$5&12}!L$cM_G!YZ!G;`8d)Okq_u6b2drK5*C-FaO!dS0vS$v(TQ*KoSK
z27Pu@y%0u$vs=Dx_joOe9tZ9>*n<>K0ppAUQuEU#;x+MY8&p5n#T0OfJq{}3-McOq
zbbI_44kLrncJ;53PHa%O?nyCdSROFj-1lDrddc)I*PxK^HSh|lOhIO`atIsFi5N;j
z{0ZQXEc**ETA=}XS@|FH3=QI9^n`G=o*X*|{Ia9Jtwi!6ekt39<NO)rmS_B+S?8R5
zH!;`(gF7VK;sy-;Ld$gfG9uM$clsUeOC(|(gvaM^wIPjqUd>n?o+!7_A1KsEmPz*I
z<tIu(ac)U#gmcph2e3_0vlKo8+8|PT<XFctq5$Q@2Po%|U9{Iw!$Y<wDrU*xfGZX?
zdQpl#QowToIm!DnK$iB=(-K?9+NU2TyT{OI<sCmLK9aPev<QX`iP1V15d4+P1XxE7
z^@j3o0<aQP!j2gpxWu4~jZZ!#4~<1)okb*m=WKa$xfQe#k_tAq4I{W)^^QAeXZwR`
zmpI>yFp#Qur_jh7y=OL0NzH~c+1Deb{{73%4clHgoWSHFoqT@E#K*o&CDcTZ0uS$b
z!t0tD5ghshDJBh-BedGL{Za@e|0!RCuqLlKnOwLOD;+|S>z4YgMTEddlon-Gx?Vo*
zz%juz0w$ic>hs5ZBOyZsnwJmO?g_m~(8I#O_#V!F$k)mn3WDZh5&ImBdbp%?_ig2i
zJ68{(M?H?7CrlbTWs;68;Z0<_(R+5H#nod1V_ZasF~fS8>NB_yc=>XLp?*ZLVzM`7
z#Y3Db+VA0?N+~gpqE+-Wg3Ii%M9kNk`9Ddt>Pi!f?q!ZlBWwGn1S7|}WahCt$Bi$R
zi6Ah?y6)KjO~(EIm2CPadImJX*jGetUJlb%73Bg4nxU;BlJ=EVYT10_a4@vH3)amR
zSy}|hr^7wMEz`*_#;6YR`+?0{KkZwtZqswNpI4=r?(!tVN;)sd&nL!iN4)Xw)CtjW
zlZnujPV;z$ZNukLOK#$Vr}fmk9(~KFIABsMgTdsh93=ZunRTzz2!O9AM+RyM5m10}
zlamp%PxD!Vh{Z)O>+WUni$8@{sLPbjWkC4<vCw*e#`qt=J$<*3F!!(m2guF;n#vPa
zU>TfHr0VwxMP$EL3W(PNKz9UrCHO6kNJJvk?D98q6U_<S<MDrSJ)k@xn@dQO+8f}A
zu_x+4>Y7KWXRp`l%|lgYSs>~%(?l^NWQhM@e}JFa+v}$bYEa25QPn@Am}Wqk{90O(
z&WNL9;!@$~$bD5VUCxyHm^+0|&m10y{G<Jx1J@<qXGkpqDfc$Xa^Zo0C(Y0=ECX<j
z<3iBYa7KDFp<2g~vB$*e-n!wp*7uHGEp4+oO>XM*HYArmP}b>b=&3*@SOMf+b#?iM
z)1AcBE4giy)3C*R2=++b>lf$V_?>%_s4&>gc2tk3T&=Q8^y=C90w`zymOh@}h)LM}
zhq;UU`2z69#B>oy;H*00g}Iq3K}AM*rr~UxWt_;^jr7Uun4NE2&239=hD{reKZiyc
z-SHN(Q12K!WV$R#5G$X)kNX**Y`QYu$kfulWR?NabdMo9tboc8iBK6z_M}tD`J6W2
zW693Ys5w!1Rw@=|Bz`P}1rt4(FMXQ6!}l`t;j7yI#5k8V(&<?@h|YoNEalk9&9h+J
zd%)N~NM(C;<V?!u7g%h$fwtxU^$|dw#h;PF*+6Lj!V#9a9()|U4#V<$pnNQ2J5pY<
zmSN<o&iTY<B3z~aaY~)$sE1ivA@kwov8{ngnv93T+ao)|OltM}JO&|S%qxlsZOw!!
zpAWz0Hy3r|zKI;33Ns4Cy5go>ZejUEewxS>(HF1un<C6uGG_0mc(+<I_3DMaUPf<G
zXJTK^2+=4p1BSd3MQJYloMw?#53mJfXjrSMp86=va)=&>@h}egbiX#fy+GtB)_dcL
z$$gS8Kku(k_a0Qk1F1~vL)|HcKA-z@A7%J2hR(LkcEF}5MIKHLREwS5?ro{JDu0VR
z6WT6Yudm}g6?SZ8@s_fhzkU1j%{FJ-^?I|S_#kN)j9R2HGTh&1e``;n<fceRfLQ#)
z{@VmA`9^D-9C$VBBb#E09QO|**B?sQy;kYI`EJsjJCA+$cW;t@4z?nsz3C+z&e_9g
znNd-;DfUQy%t@z4ywbPgQm^+X-B18<zAim=wq%u*THy(rGu@vh0snhVLL9fG0=NL}
zxbz(vFRs(Q7R-^{_@hhCR32%eBdnFrv1k-Q1%M(d4g_hpNmD;jYCwz0S=k%tHwaN<
zrJe<xM!KbDu+E=Sv_-JjkY(SG=6*)UX&Of`1#tPDB%*}I@I4cvCIUguGoZ*NWVC#m
zln52b?3y{B7s39JDGRj#oienT7${akps^EqiO%opYl1b+CPq1XgQtL&MI8uHgi`wr
zN~I%7Nn(XuP@;KDY@Y2+=bA_pxnJw$Y&XtZSSLtamzg$?`L4N}`1P5HjHq7pujtQ2
z1xsXmfAHR8>jG_K{qXFO@@|zeb*-+%2#j=v-<fRV_`-&RGdYC^qL9@ft)EsdlMYG^
zSnvhDrQ+t^&H66vHnKfOo30WZB42cMd9q+|^E!8a>}H0tF+%n1BWPmnl*YYB9w+bJ
zA8Af*Gi7{dME!%sAN3E^f7L(WZB`CvnD&9%lOrJ;cq6Cu>(*s^T-3oTo`IeZSaB3M
zXZ}<FK)-iQP_`^}cEL~&gnBA9qwfsHe&O`jn&KGG`f_k7aewR&VJBYLg^Q{SdWdpA
z%fHkjV{(;wJ3nZ=jr;h>k8IMEZbSvjohvO><>4wM@|s&>>LO7)B-dGJQH7{30E6T&
z{d*3Nr}h7-{{8ML^EMq?NO($(PVwTSgu?(k#CkKqSI~$O#X(rvNj!)IU_vq)IO^8Q
zglO9+0#{MLO1{pd;+8itgS%t>elVx*Y-^f?{)eM1S?BwPAmMkxmRr<+_WGV*9M8|p
zR-SQoZPlQ)l!*H2b#*!J26=xv?j(u>z{dW@BDrr8kMCfQs#l#~>0+fR=+mq_lc?vC
z@xt?_7r?o2H&8j#mmYUNsaB|N%`SOmIu|^qKBz63CR8zdKs(!-MTQD+Z0=UJM~G0q
zM+HM&V&3>JZS9FHN#Hiz{$Iqsby!qw*ESA<Akrc|Ff=F)3PYEGlz>Pp9R||fB^^=%
z(juXNgi3ceNJ-bw-NP`<%x{nP`+U#+z3=_yAK&jdhChVEz4u(#y4G6fTIad;uZUDh
z7^Ae@(dp82@<e7Mb5gG#vPt-M=iDS!besdX!#b9nZ%;0KlUVAOf(0%p!fdMKp|4@-
z{5kus1)<J$Esp8gFU8EA+Z7LDJcYU__HT8NA1YktnI%f#25PK@^@8;_*qxIoxH*cZ
z{c1<)MLrYPt42_;OKbJY{Q<coTGPbJP888n^&$Po%-EY$X{4?XoGI2iwS1b{qQqEk
zdDkx+w0Dsw101F;(5Os)+N;03`Cm2T_yA1Jn1m8<KCR71r;}iZRg)~gA`KNwF3Pzh
zO=1bE;{<tTV>orVd%Mh=5o)I~qmPL&th0h+S%p8WI&J5`c6&%vhQZ!1hG)Z+!0@M+
z0&Xh7^(V<#JLexEOoqALt}-bqpslD7b9$Ue?_OQNoyjKQ8aw>#NA{!!>}D*&vghjJ
zTQ&v#(J?uu8z%6pr0Zss5L(m0x7Y{%M)Rx+#s9+TXy`C&cM%>W-0t)?zuvtW`k~ow
zfA;*K>=5w<u}DB2D&DYPpMq#tW~5$w7S4Ft+rYTa=$SM3PTUr?>Wog4y{73<S%S2_
zt-r4Z`fM6h+X28b^yQJ|!iS9V!6&6cmeQxDwhi&Vg`O)=5A>;ueZyPP^PV^Qpf%xr
z3N)M^c07U<zdV)mQu+LC-mC!?X1wsl_W2$odaLEr%N>J<BoHSeh0G#GXYNjHI)DRG
zNiMcG^tozc*Mjl<G^SI7=&$gZLJz4prewG-il9gaRvRExQiy(Jv40A#i!tCzrFuFC
zRq^}AqaC6Cler2NbQ%zFas_l8wlEzBQf_LhfpkI|5|X|+q0a8(yWtF)yYb347_<fr
z`wOipIXX}zr{FETCl}J^*4z5SI(aV3<k7a*c^@jWpYyB`oPI}cLmlTSwpiEM<(9L^
zE)D55!#)R;82Y*H`NUv-WNks?$q%L;zm_S6@_Rl1K{$yOp9tJ~Y~8<!9SJtYz-aK|
z)3%<-=RrR^K*3?mPqawAf@xMc7O5gKDBQr|f^qW{&f;YNGi~T`tL`{O>eWX6eW%>&
zv&?Vk=~bkhH7Giv8lc?0e^je$|HF-bQ-b6oC1Z|S(vP&|X<%RrJe{+a!J*}y&+qUN
zS5ujd_+|qzx95?cgT8ktQzMiK9pcej67SM-wXa+3q}+S^T}ZYw0J_!!v_3Do{a)H(
z^cfYEXIOyGYa{BV4y$6ziz1_h{oM^As9@W@ZIg2gzsx+zU{dcHnCc-gqr~Z`as=6r
zY?z<_?zhDd??~#G`|Y*a7B9r_^Qu@m7vq=9Q3=L-Zth3!ancv@2fd`(DlV{(sY}15
zj2Crf5#<anagHu}5Yz)N{f;*#?lLvb@2(6kgp=;QJr38M*n*4_>bEeb+USXoi}ycD
zgt4+5PYrY>*pd2=pRk~Wz{#XaKPKN4b>B^}@42}~cee1@gIM9$_T<{RKqbcEh8rm8
ztlL?D0z)(UlYKg|-eKw>|HO|8|2IEI^8Y<Qh7Rb5RQkTUXDA>H4Ceqwa1~h}>r;+(
z%3TBbu?H<yOal;w<9)ZD95gxjr}-2vMwmKg>7#d27ki|1>@Q&n^uGR+XiY;($L)2|
zy5HB9m5*dh0OiTBxR2CIN$sYfpXm+!^LOuh7z3m~`3x+{OiQg)N+4t&$NSIzYAe*c
z>~BHG&cR8lESL!{)A<4Hf?um))fJS@g+2iLKl66zm@|cu)x6e)3n%p-?=BuEEq9cd
z_&VgsYD@g&COMg<e&L)yhh9Dms|M!KSxG80>QAE`+}$MXS`4?R*+N6JlfMNCp#-Jh
z1FG#Wp%@-77QUdGE+(S6M-<fSZ66=^ckvg%-Lln*7)}i)lk!swm>SHAQ@;}`-dFW)
z2D8kBKj&2Q+E%6TA3HhjzX`s6x(GVX!Q}!FDJ7#+=sdtvMB&~;uE0l+bD_BaJL%tu
z^t7N64o{AsOSn?m2-Rn$C{ZQV;m9cN^BoJb+a{>0%T!E=C)EC}#8+y&pAhXNui_H$
zQoH+yAAHNg=hrb$?k6lU<(IZJETWjsTZE5MfWq`04A<!nx?=HDwldMvKZPzrd?3FI
z5&Jku1mt(O#Ew`bGP9p1%YglZ0k$8F;OwWCmqL6*PSM!&ucIy>`K_6d<7*pn>PX*?
zB3^oa;{*!yHC9&*;H{5C-6C<y68&}M%9F;*z5+0`h!WpBD8c@fVJ5_^#lWdG8o}~<
z`yLR^o1XBUTTOjGmLRF>Z0lGEU_?s5+Tzjk4PSEZ`<@RR?3#FAk~Wo&9HD>rpp+JQ
z9TOzy&`>f}z^eR|+o3t<LyqbWpEa+qf>HurN+0L6@bR7p6f`m&D~>c~G+3XD!y=0O
zdACNhzyXNu6E)P>)AZX{jG->;r%`smO~))JXhStq=ux6gS8~n$6&|3M1+KaZr3eDV
z-rkwtZIAg^(JcPk;DFWSsAlQ}zZR7hu88B8o|m71jE05`rX36Pe1zpZ1Pz(uo(9j8
zcYyU?jerOLVxp7f<N!=`$^Q!`y0;ioL4k8`ocSt`#OXbhCElW0o<Y$i`bZn#^<o-J
z;}Os20;3qnsPa*tUOs<Jv!x86*tGkrkS9RWJ)Ek3*DC(gcu4~4UZ0m32j{e3+8%Kp
z!8=T+lKm0+9}f~U%3S;IKE`@uiJ_fA-He=stA0{?DQv~}$Lo)kvMK=;StJ?f9iVgr
zS#oNP3K=MGoRK>AS|Sj91MidRleR48COi9m21dp=->t}mOe2D3z9X-=ud(^>`@j2L
ze%E)?Mf3L6Y8F2T=>rRrRLNV%m)W&HNa1fRlI*TfVzlH+B=z1qv&_k>cv)iXlxsWM
zBU9p;2mKWG@a9NBH{*eB`21XsClG_#D3H?t)LrCvI<n|9_{s5P5j_>&fLMBisP(i!
zWXcL)*!6;UENIv<T$v<Po&mXVGNyq?q@|gXuDIGMw-#8X<H6idOxGK0Y}*+bc}Mkg
z`Y{H$nl7GV*i2d7>J)8!)sQi#Z=jH?dXnVZ*_-uH!#Ye14sjMukctZKr@ZYY7E|er
z?Unr=wW%I7f0G+Zf~36l;q{mxP!3anbjBPX*eN9<ZS_d^<UyJ9Wsh`~a{ZUB@;_wv
z+l<@cmym_rQ?-E(s;lTbGTP+0w#viaB}YZ|u#?kJPZK{$?)V#a&C&8k0D`SF3<a-3
zN4e~CEwi1pub(c5*Wj+dQurnt=9NZrG=G;l4q*2_TJ2%ObQB+vD+@-=lP8VaikN;5
zI2nKSlc&05aOLR|gv%*+bNli+!y!~zm$pZC2cS`O5@076Sl`#7I-~|lnClU`$wE4G
zOj7r}Ng!)99>2Ooy*+>tOYx|Ev_xN)`$j=6?NQo@Oy666Q=(#^oB<1|^1z>W9uSB1
zB3l?|w}xLW`PCa&yMD=}z6?oR!Iy!%z~I*u@kWOcXzoLK&yyEf(g#QHk<FhJ%_Uae
z;Meksm?jJ;W`-;}9ewJE^Jo!A^yfl<hA%G3bPH^e9v^rt_U}8TmK6*oUTeQwWsl#M
zAPKgJd^1!=cyI}RvDJJwB*SxM5jrKItEXQ2o|3}wunnh)w(qGNLb|~$3EJ!5(~y!A
zd5+~A<(&IWMk;&YhQESlmbw>dT9@YhKH2G)hGfl~1h=5Q57W+zo(;#dipqanUx@DW
z>ZbdcTSO_ciXHMy3E;MfwPP`K#WMc8k!BF!e|KN?!Q3t6yC|nWV3%e2UtkvwkGFpl
zRjcl|<|V(?X^Uy3p_F)DzwcMrBnTx|umkd=7z6s6>CRa3PTn|HO-h1WobTx^N&sT?
z(d&0uZ+k>^e3zdogmQdk#aL|&Sn-)sHm-$BZpgEK$GbJ76YU_4joZL<vBkA;dgRNT
zTu4}{fv%ogV=`pfM&?`Ef&Qe*z_UW0MNTKOKTWk(PCR*_p!#DNrddDQwEdz;djV=f
zI^DJ%jpIiDV^uc3=#cYrFPw4r!2S2zGp$!Xs1pBWe~;mZd3#bPaqpD(o04RpJ%>i4
zx4}Lm`3uN{IzM+Ab*x}Fz-As@hOq{$#!0|O<j^gsan=QegBpd4@Mi>|Dxl&-Gj;%!
zGTa;j(3)yFi4*+tl8;U9&%nANviulZ{TJ~+x1}kDndC!)X>ajQn%w~H;RlpG3E$Po
z_Hv!3)&}`kNf-Mbjk*x5dk3FZJ%drdmn&>+70|AVdQc2t-{N>l#eV_cu}2#MV)XcD
z=rk?O=l!PcDyc7iwQUx2k^4wLiU-O{0Qg-Y@XB^P@(etG*__->u#mt2a~d~g+!onx
zk+$LxM8@$TQ@m8=JjCd`6n)lWI4>WQ`}ePV3hP=Ktv&)QC%E9?Gd(>E2elhD{svYa
zjy{IQg~t;01?Z$o-?qr7IY^#Z#Wd-r=+g6X%>5%qr1_X5j-`pj-fEMIF-d+71*pu0
zfid{%7{1$C6eRfRniIf%eO(ZMhpNk8B<oyPfwBQj(j*g?^K3}5D$RRIgN7%zaX|Q7
zbduGCGn^}-1S^d!fDL`NG$dN?7B8OL_<H$mxnBe#qh)a>LjwN5?^)ipb7y#86wV-8
z=Zq5X+_+`hacvhi_5yfk9FY6Iy6m(x*<01US?<&G<siK1t|$^Ac@lT<!eKt+D<gmN
z9tW&6745Oj9t8x&GxA{37DRx2hLrnUx8DvD@vNDf`B{|v$42OKsj11q*?7u;l@?jc
zs)xU0w$E-$CgYE$6Em-X5XmU=Cym-Ili80g-)SQg^J+nFFm0UfgJmV1P7MHG-X*}w
z2et$SND%&%VsQ-;Po34DJoL}pBA_3`d%@oM?hcr1jp={NM_VkBGQHCUBFB|_;mEVH
zdaEC!mm%58(H?y8m%s19_<Lwi%d?{gEaA7iVnL?`!mFKus89X10=G-tXf7XU!<=Y<
zj>rF*G~wI(&bAY4XG?wxW%Txk1B$yn318?3bP*;w^Ap@l&Uav1y8Owyz)5^hIqr7{
zAL`!|gjyYu_1(lDc3iqztYZ$NXz>r6vm0MGVXR(Vt_i4}ZCZASCw%L+Idftks<75=
zm;*<D@wGXQMV}>&5u<}N8>4-iBvo54l7#t=O%-MJo-yDL0P|!9ZWXDmuJE4d;x%8$
zHYGJX1<pNd{+c^CR8#7Pkb=z>i2L*vQJKO5z{|i0+zk|Ig|lBGn|$*{mW;SYoL$5D
z*FDnjWKMge{9Npe7fXl32WaF1&PmJkFoVlHd@&p`53N2pN?jV+zZXfs;PPhuH2v^;
zG#yj-7(wKredgYP_b!q;2Y!fN)ex>W#Cg75detEii_wonfG%vF8t%9W#$S0Ut#aT2
zJCR>ht0=TiUfo=k50=dYU?gWC^OMSV^cv)_;`rxEJjrT=U-pkbH@8?kBRwHbf30AJ
zgl?cwYv&1m!rI#bksq+N|C{Wh4SOc?n&9C$^j+A_)%I~;ue1pm?Bu2lroQgLIf0Cx
z@=3x8=1EQSj}p$`w1H35S&@k_>Qm+nEOAmcMj7y|<yPun!i#>~bYbGhH`nftL-Pk_
zipSvP$o{2Bd!fa<(4adHfEE{_clf8Pln#^swe}(g?=DUW!@n%7Q=^fWEQjMiDky8N
zMv(x?JRz{8kdyCxNO`U^=qhg$=~{B%_?a@wpcsvcSMmm4HS)D!^#_q*f}cs;<5e@{
zSYIPl*7hR(MD2>(#OD(X9vQ#Th0OQ8FPL$xwzK54JaS9Ecv(9KUVzvOKvv&%$#QJi
z7j-keuIXvutuaVIWA~$u8n-H-YYaE_Cm)vZjOc-SIjO%hZ#{vW^B??l;5J!%oG$^W
zt(Sm#WcQCVaXdW2o6ee_veSRGMV<)3s#u?Vj_g@jW4L9Stobw>y$Lkz&?A)vmLKoV
zAcu_`a*#VwPwQ^?_^;f<luG)VULS`~j;Bw;R1?&MxwBp|ST`1e6FO)!gJZy-y9@%J
z7iBCOSRoboA1dtKExVV_Ja~f#1W0WADT;9o4Ec<jK3+qVs4yOu?9I#m&7ox{`C6PF
ze7xcqOap#L>%NXAnJ5=Viiv4RxP+K9M)Uw~HW=e(hqOrRsLZXy2<(JN9A&y9L&HO8
z6b^8J)|-M^FEM%Qr;WQqyw!!ebeC}1&fYT0$Qu!*3U-d5I_1u{&oEp(bxJ4DAD-`;
zZy)&18b?H*WAkUTIKe!8BRcc^3PIWRzj(g98x$KaG2GwEJab?w>hxt|FvpF@c!8bS
z{YECbN`3;8Ut2Y#@xNAlee#^@Fo{P?YA*=_)E5G?_;3Q9^kH#04#vZb`X+ACqTk^*
z-0iP%cxkFvWp}sA50rPx52~yJMhi_}jE;yMR1fGGKD=>fn{?A;7brNZq?mHc7WuPO
zU5j<&ToaN(Db}f5j`3m5@u(P%pT(l69zXaO`z|5)UjAjJ&5(Faxo<l2i^-#W2gWVF
zrfUuumDk-o6$|K4xJ<7UQ2czof8m97RnO!vfI+ii#s5Pz8#?c~-Vzh(ldY7_<&C<x
zq1Kcs%JofB_~yGkg%6%|FVfpdk2UcKrO&8^?syIf*z){PIH26V#rO8Tk38lOFBVI$
z!jRzOg#HP&ir=-79_^5R&m$=3rp~#iG@xbHUYYFe{0j6}k55ZpH;3M?`*h)4m;!&_
zKyl?)@!ViwmX#VBns|mQtzO8GHdO=yIf7=3qcT~4c<ej@N+c0pli!)`{xqf|17sbv
z3S^0%24f87-#|7Dp5PM-@=RcOqIs|XRi`Fde*!%#&yW8tJ+q#)z#R<juH^lrQ6xl=
z>~L3b;cI^tYZtmG5pr}0Ig)-fF{aZzFyR9)5*AKTlS)6g!{AcVHVISCL*`t+FaCK?
zF4m$60S!L&lc^Ui+pz(_-%Gju(Vc|zoGq6bV?%z6gEHPn0og7dz^o4L;|~hh<@Gi{
zedZ8PJY=Mit6GH;0d76K$b4c<>rTI^@@Tzh$@`;m-BW!~a*ZkKLKU{npT%3kUZttl
ztz47PLy_&X%y{tXr1sJAdRS@qJquWcD4Ofrfpow`^U3<Vw~|9WInH^An9|bA1u^~9
zo#NaQ3X*_rB=G*)f{1Lrd-SfK-ui7sM(W|%C1d*h*pU=}#MWOB$(p!McP#<2^;yl2
zO;Q_PjHV1D7|>bA0qEp$52mug?Var{+C;LhfA|EvWU!aP7<3#A$QDQm9>8)Zuiv*q
zuQK`5HJOXWSh(_7iEIJ3endbr1JNfO3`x7VMWBNjLt}i50lNy&54ZiV)k3B1F>0RC
z8|F^IxD<GQSoDQakT`&fmT(H@y#0TKbU8mlE(f|&-*^nD%qj5x*6kUuGB7bPICOhO
z`xTh<Wo$YHlOUlfXOjC22$YuL0nLls14IsnO;Zad(%ZGCS=Fu?_K8i=xsi*;dgU&g
znLe=%SF@9-7dPgX^i1x4p%-RLYJbPRUO-WT>ptXGvXFyz4#8B5n~=b3F5b=AyzvT^
zJ-d`?C3iOWUT}LeFScpAYoC~^Wbc-da$ukMz<@7DFGlo5mgB*@-whbVy<iiaV&B6c
z;!=~MO!49C>OFgmxfA#h<ZFi06f=<k6#M^P+I@5?%W~wzqR(`iFWf%%h=5mE>w_ym
zfAC=pAQU6Ct;8VR3*Sr%eJ%bgZV9dX$>I-EzPooth3-MBl(m=P<Vb*y8ZM~k%rrtV
zhR(eAzQN3TKCk7(DR3TNh#amECVAryZ2Iy&xo+S1kN$1^JyxH)RM!s@B9l{7H<Y=C
zH}Ox|l<Vcn_kX;YmJiTQ%qIIg&JEQ8a4zSpUW7ay^Zyv;wp#dGjT6=h%0HiwxvOzI
z66}MiTu>;2y11N`2Q`yswx9kX&Neq<Bz)vORlw_4R-^VRJ<nrLPZQa@{1~kv34i(I
z0N<yPI7rs-$cviuY6Osy<@6V17br`78gvZEBS(=@Ro&^oX|40zS5A)F(dMzBl(e5%
zhQl^^47=*V5j9o&=XesJahi{2Lk$MKwo@fN_imLt_}rA<pH}oAEz9R2>Y`US>&O8C
zjmV*i`mpfSD6Ujl#lJ|I!{m5dT=r)Gl~_k%1DgaW#^+II($MC$XbJNDVPxVy|9`37
z!6dQksixZw*KU08v9_d~m_$ALi(2~VJD-}AJ!9ungC$VHYxs;qmjMEgD=isBa2zM7
z)sad}`AN*YHWN@k+@8FJjj12zh8q9_2mT--O#D!K)oKwDV!cK!^qN=cj=^(-yUvBL
zDl;cLN$6}fhOb#r%UMLOQt?^`6rT6h+@wM%olWAe6#r8*(|3bfve#rBm*bq{4r!yU
z?bp3WH*@koJ=%klN#(OSbN;EOh4kR$vwh^ZNcBW=U7T`A9P|L=9ks(6bHe;B6gvv?
z2iXdj5;__`1;QsyhKK3?2I>rQ?%QDB<pV@FoCZ5j>dTldT(v!%%t*+@9Wk^bOQuh0
zsu*P=lStIc6BXV#3ld?ovIH@4vW@UdKzkbeFYPH#yMn60eI19}y`Fza-OA+=tXztW
z_!te<mF;ql%nq^K^XvyekSMQCl0BP!jNYa?WJTb>1ux`gnTw`@N;umMi<?e{_3@>>
zGI#J%4ESfsheE%^|I+s`c1eOB?QnfG2B`uVhEo;8BL_V!l}eC*rW308SDUVV31^-*
ztX4&8Es_P>>~0<N6$Kaetv{%Wc)eH5B5?zlph5hqL^77#1CaRqgVNgfackYp4IGBJ
zd0er)iEREzi@00C*?f=>j!w83%C<QE*$9^n9Yznxatvj1mYu2GjkHN^a)g-GY8S|S
z&L54Kry!Bk{G%<tIDhZbS>UDgk_`{zzsEdt|3OZ^d0RBCQ|_ZAlas)K2S^~WwQk2R
z)0$&l=wBl4wB;MsdL;NZ4*1^nOuu3tNDKVWMcl0d{Qr&d$ZTI32|x<bFMop+{(v@-
zF5!#Fqp6rWG~zGbV*#4oNW77aP)Dw5&$?xlf?PSQZvtohDp`~2yXhkQo!^5q*4rp^
zKs3~Q>)>th1z7+MIBCDf-qtg{?@VpcbP&Hkp~1}Ef|79zrDA=RaF5(-_yH5;dmZ)o
zcs|>v-rB%*42ZBbQH{udQuusS;_hTQ$i{gd#(hrDV#9KNHz;M}N+&)Ys7wBZQ^RX8
zI91<lUmzT99zg+czyBA!$6{4bF|Sn7De2t(?_G$Hen{b#KFBcy41Nq77Z0(L>Xw=8
z*rfT3#eNw=otIc5=#?xi=d=P0uaG*y4=woAJFeiJnwPP91f98l12n1VJW<!l|4G5~
zZxQzrKFg3$9j!%yiNwRg2;5M@-iKQaf<+P^MP?#}d8xBZG)&?MW&t6_)ab;^Ofp#O
zaS-+&zFvZOa{mNHCvg-;>V*-O&YPuyS1aSyBFq{|6`mMRD11{iNH@Qc5rZ?Y>BO?K
z!qg40j{pZlM&qo|Sx_tnBmrfwQt<qx$poF>D1O3X*(IX~0SaR$`V>q+&`|{SL;|Tf
zu9)dbIBp$*g-|B{y);X8VEBpBG?yKbR^4Co8KU8#VjnSyzTHcJF7iM`x~&*idd+H+
z0)3kX`aOyK@`tUstd)vAYB6ta<NR3G;L*1>4$enULOaNkR!A+l(sHusJ{o0l8OM?m
z$&+KM6F8tw9$ic&XqNfIj!{8R4>xs7nlm(o^Q2QsGhaQIr!v)4i{$+&o>y0H?t8!9
zJDU02I+x6-KC?DuzxKpO)=_uTATKcKvRIy=Wde{cD-<F3g>~*|TC?cKA-qB5|8D-o
z$7gCzLg6%Da;}f=JoG|;?oG~<1jj4N{FN|MDMoizr<rBnovOO%%}40J?7yh;O8Y={
z5(v$-DUQi>H7z>8Xrsmn>HmYpN#OI($+ELIkbbpB?>Ty_CX7?A_r{Xv|8J|eA3<Cq
zaRP#<#EKhU8S?B(qkkN%QsTooZ*`ERsGcP+(K4laI~$Blf%J=9358`u`4wMuXZ$YM
zIk~`$`tf=X2)9@N%+&$(J5S|x{x8)#DD=fJ&XW)M^;bXP`^_=3G?7d~z8svEF)DbW
zePRS;@-!i2x0rERZVSlalE)BK%RVxc4{Yl;vjV0Y#u9Mcwj{#~mCNl^L#!4aX77ke
zJ^Z;KwJ<LAUD!br`Pl=Z_bosd_GIDPHw)T_;-QlkdJ_YW3%_Vfem9Wl3#)#uwT*hY
zK;0N{8O}O6^OgL@-IcBF!<YF(Z>!`>4YCKf%Eh~Et(40XQq~f<d4WF8o4g)%DN$_J
z3nrBWq)JnK;*c5ngipetr3O3qu&NgSJ$U0<NN|1XhoX`0t0Dyl`1f9HcW|_w`W*`4
z&x_Gkj0}mizmmLV*anJ!F_%((|AhJ7u7=1f2v&n9rF`%AiKviKuGY>x(<!%vmE0vC
z&}X+t&@V&{YYbywIl-UPN%f?))KpOd8tjG>wZGE4a;-wc4ZIU$C+hlcSAw|=+YErz
zK)g#hBY2P2`la>n3**p6@TbgN?Lyeipl2zcJ6$Ib_az8iU(<k}YmZ(ro5*Q?Z4&Qc
z;}rS2a&#8-yFW)f`d*pwjos;sDBOXOt9RZ#w{g3_-+F8EDrjRsba-$27tjdLxeI)0
zkQ_rI(tOP*P{VWdoL!s<E+n(_kZo>3lyOafr>Y{rQ3lJQp+)>4exkt-{BC6r?{j#-
zPMYZ)>vj+GM3VL#oo$)X(>H3;)R5Oz*0YWGsa0;y-YX`RuX-jj;Yu~YwA1u>L$Kdj
zw_&J*)ZtBXkCK!^^<n&)biRqvo#&%6XLQL{2t&qm6Sh;DVk<>Mu5(6qaFK~owlw{2
zj(pZJOW*y6ybZJ@S|*o`!woh~?T%O4aWk*6h(_e8>F{U-&j#wlz)1aa$h6ta*>s3{
zPj-yk)$auNa0Hlc8{A$^l6Ea;s8`MSaBAaHMONy=y>+UhpTCn9qtNfEwmx7XbFR(a
zESQb@wfy*~*z9zwv%n|5D*S?NVAZ@4&noNJ!0L?p&YSx)OnSlIacldN<NLPOmv+Vr
z11!ph8)huos#SOKsd{@SGTsk<@5U<AiN%YurFz3Lj>y-=*=g!M8^J@cez0Rlej!Z&
z)gQOsPSDPNg61el+5Y|=bpj3YR_VJ>>g4e~sxA>i8|3}%2Nv3e`7zn<i$jVVyBvmi
zQ0>F~!M8OjeXrM4^rBZLem|>{E5$uetQvC}>pz;I!}^?0f1k1RnTm>f%#)@VtB>s$
z!mLV#(zp7A2)TP7N0#dFZam9_aM0fKGN2)O$%Ex(;^NZj7$0JShwI}~jDLf^yZ@<!
ziZqQ_ey)isX3=rTq`3?yxKvlo7rww)(v|b9x?>(SffKD=i43SZTc7laTE+Y{0z~6r
zs<%>ouYP8CT8RxhO`m->u?sMgpx=6{@XR9cq+U^TPqWOio6w5;2CIAO^%tcMs`H1*
zZyB?Ew@ei|pn=FG&PaTU%k#6qH&WBRG9RW$o0~RFd)}*c9LjpWS5QbqYBWz!s4P)&
zo~T-%c!a=`9App!YVP!iyu#s(G~{Ecrkt&|<EJk)m7FA`&Yv)@$*V|DQ1p%ces)rA
z#eU*?rCgOSF%!$q9{qgs1rZH4plQ61F*2^?!L$V6&%YCR@}=gtlel;9_E>Pa5Ypxa
zo}ntl5$?21aWMPDc;4>(Y*puope}J}S<srN*)NQL$k*<R642Q}zSj#InYt=E8UaJy
z5=u{Ut+Q9K&TomTS~ay(-du6hgCMyO)vJNsH?AQo=mG96Mq##?IY#`wdjaOzNE))^
zSh_8@C|GPoK=9ty!>TH7|LA3KvYqHTllehNa&EusQ!C#coMgH0WBxX7^(uNv$Hk=2
zs<3&I0dtWlZRG!w>QzzI`|zy{_pkRnk+HSnY$c;@A+$p8F&=5F7)#10$?a?39r{v|
z?|V5`A;#=S{$|QL{H$=<K0lKxN><zmPwxc3SA5*<gI`3M({1I@6ZZ-qUBn3eNZhx*
z`K4%#@66}Z{D_GV4~>1ySf-V-pz;oJU;F0gl<nwBJcQ?jaiT7rwMvW~&bd(HEAeg|
zihsH_=$=YP+oi#Y{LOAGI$RRM4!IT>WEtxd=*yz5wHN14SLv5N@VtI-aWYS^jG4>%
z1G7uMh$8B~sR=qTPg=V6VYn5o+&e$PO8aB)d)YJbRaOl%cspNyL^p!JHu7_gBZ7TP
zRP}<li%GQ#_p5~rW2+J;fpyDDWOu!){`qx9`x@g26U6h~ejVde;JsNSoA47F7;A~F
zJ|bCoTre}ITg4K@Yw=h#>zE6Ac?K?3Uu--j_L16Fz6(#HIro1Yx7=+%iZ`1R7vFYa
zDW2QcRBF}oWA)Vku{{>le8vB!DyfiH1zmV;fJGLv*O+Az{yEPIcc(I@V|Q1D-}(7_
zX9w{&<NhaO;rqSg+YV#;ToE~9gFHY&3QbMs;pojaNlx#2m?{-bYt(n~J$ORr6}7*o
zF>ZW<ci14q#@dob)twk+zd)h4qI1S_RUdK6q`3#%zlgHIAw$V}h5X%gnQlH+sv4(|
zJ!1R;s6ulOHhTGH6_m6@ieOeo5{@HmdP3TJ#1k7E&KE9V4Le#xl^lgn-nj&GpgyP`
z@SwC_$rwN-%9N$b{JEvhe=vD>?ia{d`$Oh(Bw36|Z>xQ{q#ih^6Yi!{6$#bN&1Mw_
z=k7Hd06rq)gG}`DzLH<EHA&${H$EW~8*n0cSeqFvvX0fO=*~WwC<$rE0p=tm)Fe~d
z-TVSC7}}JvW*L24ys7$>)*{fl8@mKN5cD9P(#jn0oIsQfBhEK@TBR!I>>XQL8Us8e
zB8a!pM2vMHkm;0dzzlMZ$6hkTgK<bbA64}-Q-B2pt4Q<1!$ZAk`&h;|*`<^WlsqE}
zl6fZWs9Jl0cew99{-C|$Z{eh_+C<$aNh0bsO;6G;MKbNxL=<=%8rMbiq)Lt_!8?xU
zRCX<-BEu?S8{9cz>B{FUpzE!r2Uy_yh+>#RRZQ^hDg&hgOnjeYQ|niw42S7Ev<R+u
zmYjzTe%%zDB~GUKWF*5yc%~Pu*ZCl%`XIw@|K9mPvhOsityd)8H-w!yrSeCZVZq#X
zvFLrcER;d5iCIPAo9MQ&j}UR)RDd*Nhl^GIzKst)&u$F9jI?J<#p2JaK2rXU*H9jA
z@S+frLu`+`%x7{VTHW7C4Hd!Wb5YBFV|=_Snoa)5Suu9~n*mt9p}~&QHfikVAJ{Ik
z>&H*dW`5MiE5=mC9FeKr>vN|*!^{7{PWYJ=u<8%mdBJX9e<?Vr3q1h#$LQgwZ0AZs
z>1>O>9!lhw)DNGv08!azQ=zvtl&!B*Qc5YHIu6gOf(IXH76mZ8vc6oK0!9ZFrzV$L
zn0i&bmu0*N!)fUWa&Qd%Ahq5wc;oaeE_-k4yVy!-)*`%Y)xb_M-R8HdGGHvf5yLE=
zzEh8vq9+<Stb%W-IJO-fnN$vY`n|Wq`(6kb%@9_}0Lxq=WdZ3qqxDtz<k)F-Ukb+5
zv6vVZKAxDd(<Mq-tc|~Q<4t2$__I574DGK4xp%DD#wWP44NJ4E6pSAhy9WF?AY7EW
zF8Hux2h>cW9NAzkKSNNuY#F9%RkAknm}rKJ?6RPFgo&6;5`fL^&Duu;BPM^2)?|49
z4prBZOI*dm{!YvD(VIWftMrRimm$FpJ9|#5udEhq3|L(QwCfgc0F_wlfn`FhiiJhk
zpXi_<#OnPN<F@`IN5y26O?`QypyeTxE%~h9iW#gIKJhqHW!(@Ps*t2c1tazoxsPzO
zpJ9THF>9pb&#H7;ak<(Rc%)QBT0YoS$?xH->hVl%J5)V69xP<?QKB`P`H7@rJ`CsL
ze3`uMCAeov6$yt)6$jV!uueEqvW{3G;7lU|n(3-(3EzJ_FyRz2_;kok_o8@!oG
zoqbuO&&GEA#iLZV;#$IWfM))2DH87^gM@e@a)k3H5FNc-dw;YTH5Q99dnt&xhd8gx
zHK4s$1fD{Jkgdn+3u-8T0Y+YQ9D?=SegWL5X;if!r2=u7nfNq+QNbNUDt=<>BSrgj
z|LVu#m1DBY{1IRO2RjY+z8mQgS4?aJcA`1?q0C<v)!fF^l`btX8KF#EsRkqcInhkB
zOyXR$_bU~9IrQioEg%ee{mI936Dh6pCVY~AL51sNN&}4I$L$vShwsPfzBZZ?1m*Hw
z(v#I29Nzj)ART6#moFHY5ak+1NlOyuACJ?}fh3Jy4ktV>1%JGjOW^E~QS8%FRhd=%
zH5!!zdQ-&tGv==p(2^M*6ec$_#=Y?BILnZNx>A(syLW8UxJH#{cYbqWBC!Q~@n-L5
z8D3}ZOz(SrR%Hj)3HdxO0_2+PhEX_#R#rP2k2ef01E;<y;dBW{KTK*QHNXaPzi%=S
z!^g2G3o2xyf+(W_vj_w@K}lo%XEQ&u1NN$`5_N5Sck<aHliUikxp@OAL~}S44!v{8
z3`F}>1sTt!`{&(_(@T}It$xxx@zY?Z@5BHTZYj<(qMR~pS@HV3)i%|X<j&453>La)
zCnIcOwG;B5=X*tPOmeUIq{S1;D9glz#PFsSrg>;?Dt6l<XeX#Otg;FS-=s>zT*ax0
z7<_{jN~%irFe=g0zyp)2YjdRwvi^y^3^*Td3RdV;FGZ{)9eV@vGuI|ain7-_omWr7
z6*YI-E{cBs3|bU<lr9&AN%wrpjwV{lYFGp;Jo<882dz}N^%%PKzN)Ai%1<Iimh@VI
z&gxK}0zqIeZ3lTH^yP&S%8jV*!5K*?zSsk{nWZ%~sf4qF6_F2A2MwIZu>Hd=YIoyZ
zQuWzbsh!5iam2mzmz2*;HI;<9>1uMkdHM>*bAB4?^vxyx2?l*}2UayH$vn=w9)f1L
zY)%zl|C~rIAxowH@oiJ(s+bGMBF%55I-uyhL0+rS8)Jx$oxM5hK*(Z4-!~c3US>S1
z-IyA@L}-wr&Y_}Eyb?QiyZRTHf)TB>@h(_~4j2N8g$22(@<{F(ACNwJBv3VS98`#c
zE`gW=w4!2MWbhvO=Hq#1t%}|MTUJ**CBJ09BPTEI2shg|OkAbALGn?zj#fbnd4cTg
ze`ZI9t~hD_Y_ieT&+@whVeqcoO3}BoyC|bv8K2aqm+p@@VW7;l1zf;GLyM3}^AE@*
zJI4~-Mbf>OfZGFe)s3iCTZCefYw}m|4_PawiJfz>o$_quh<7FTW^0G(RUu26&Y#V`
z^Vj@=Rxf%^L=#TQPTMVxM6eh#+dOGvHoVOIA>=1GWd@G-R;yCY=ZQ>sn~MqHJ)UOr
zc>i#JR(4XKj<(0=VfVRjurU4SkAkY1@1WjTdRHtu|05I%ZLU7bCoEt2tzjz;uIZB^
zscpd);+ussl?HxOl*N7YUq0TfT2>I*xCdlfRmt|^P`KokIV2D}ND0?Ofv=oxDh@g<
zO*SR>`@h~8_zmT)OpjSSu*85PRz4OnPNfz3*~s`dsTfCxT!g|u{TG32T%~@;)|8vA
z{cpYr<$~SHAT+49BD$!+TM_^Lhe#&qYZ%TCuIJWdCOzg(yKl-Nxs_P7rys*^Txq8Q
z^)vn#|L|qLQoLWu6&Efb!zTaFpCC5{*{~3|@yXZ4|M_0Pt)Fo+b;!Bds51ZO<psXw
zZdf1@KJYT#Nv;2KQEc+!C%{#A29xFg;c2Fbv1v)BH1tdI{$cgBvVf~jrr&$_4^LA{
ze?tgVn(<9f;UBgvR~)$NS7Dvo|L`;hqPSKN1JM^{VgGeSBV^rxt3I<Wy!#JNQ(=Fr
z*RjIB-iVm;AC_(hxN7mR`n~^ZJ&(*5$lkA*Ex7)qyZ;YMH%ZXzsFjue^gnGb=AW(g
z%uF3^_1mu>KKqBI`~Pzz@l?$$=Ig%n33@D#_R9`1RJT_<(0Rl+&f%Gs5u)F=%zY2=
zJEf^cY5V<sJxEM})de;CWz1EH=G1mEocd54i0bp#Z8q9^*h}7g#_G5<H&SaW?KsTo
zJ>1|?w{&e^XM{&vsp)-`DRDs}EWO4}4R*FgFD%9w3=a*()R8us8QaiEYD(DFG@L~h
z%pY;wkanFF5v?&FMD_%LogLs-?ozwSF8v)M^@w@*Szg*H<repF<8LoTM{CO!Oke%o
zcBX_erf7cH0!uDCFf#60_}0XIaL@J-WOTzet73-1EtUYLn-PH;lG&%9^{%prheL@E
zRAAZXJAH?X`>4bID~fZ%;pq*Vq8{IDd}_UUOVgYM(+s<I|3$)6V*H{Ohj>I^Ikn+r
zb8m~!jC=Sb`4Srb$p;<|dtlQ2j(>5(rm%b7BcOVD_`273{Tlz_fo3B*vthHWXu-jQ
zr;a*%PBOfoSpUX<XVb+hz}fnUr7Q@~<<N4Q@m)K6Yk#_zhFDtSsoR{RKQ;G23V<4+
z>BjTt@tH>&EqgoGuu_kM{;t5j`>{k3uHhN#buzVpm_TMHETmz<dA4awkp9h2Yb_{h
z5Gqn9G4I*Wo0hflt9)){w>04IoB7Br8L(V|{-)oS3-}L%b}GGJ3DJ^dW>hy3n~~9c
zSHw3(wK0e5;#)6tpdCXbR{Z;JM`(+J8qaBs=VSLyKZ=)F;XORChHy#9Q)>Rryv?2g
z$4ub9)TEgdaM`cM>!-lm*$Um7S93`^I=UPKk@Uj>+9$N#oG4@<Vzg!NkYFIU8(EV5
zqi^9r$;fF`hx1;--~2_Z)*ayRaWxctf2wRx?@?2G@ELJjPPMQuQS!Dn+%?TN08vD^
zZR4!Vsr9>QBedbz%}!WxZtpO0fNDV%p1O$2IGbB^9Al^uU8hD{2$m_>66(MCT`hth
za;dor6wkRoVO~?O*ClP3bAOpF(D?bttOF;@_0gE3$IHqajjOBmVL(m@s<fV8IGUws
zMvrdlC)0Qs`hd(dgC!PR`;lW8K3i@h_@y6Zjh7icriPyusZB7z3|5@fc5BM$dlq1J
zn(zGZ2hQnZK!?&^C3DqIrJI_Rg?j_ZyC!eiUo4^UVdzRkbHCJYH?!o3Kp#eKN&m|M
zMUV4?*CQaSmbQ!a+J#t-g(~(gq|bTwj#qMV;itd58lnim#}bG559x?B7=wlD?*GoJ
zCSN%Qe)jk0Hf4NTGbP4EI5S@>B6=J^uA9E!Tux=|07_VogLBPK(bU?)j<}O01U%Sh
z2!87C;dK@6JkKFj?til5ZFc7*k@Uc+JYZ*Ieu&)kq*epfaETQ8<<}Lyxxk%W+jl5T
zwt<Epf?N-;d;H!dr6Xnta5xzy=8lJ?PNth2x|)umrw8~pk8Uj_9SZL<0)rZzX|AYW
zZ1NhHcYG^uv^URN!OFqQynZj{5i*6sRrl#DPo3u;nS*YSmS#s-bo9Fn8U(An`QQWX
zfz=1p#Ig+3n-Jm0S3pU?mdJ`<BF01v-3vu6{;hsTgb0^dnY@+dYyLwITS=QFjm9}R
zQ#`-_VJ@OX(<AP@BD3_3e^u}hL)*iVNm|$-MbdhzlzEbbg^T03;d0x}P3fx?Bnda8
zyoW+GS_BdE>8npWz56#IrB;Z?iGs)#flua=zwmRjq|vW?tG-dLG*TwW&qD_s${MaQ
za%Xcje1?v;FCaN{ut8W}fEj)0qHTyM<QJ*)=5>?=BI(p0IyegcJv~8@;nPjhJ*<!1
zZ}bVJjb*e!Tec+iSv8QtR!R4q&~KH9#s20Ug4%$%lWRV_V&iT;b-99mov~**#@H|t
zfKL&8aqQ-)hMJO@Th+fUz_$nqqfk|s%z^!GSV(Eu)Aw5@!{@&J?Uh5!_jwbwaE-a@
zw{!#7CfBi=b9?soC3gi3Wz(<o7&qTVcA6UaRLw_&8~PT`srm|i4Ofm3(=7~+VEFHg
z#M2_M#3thjeqUvX*DH$v0l!9#R(bvK7ipUOzw=hiMo=lbc+?vN(7vRlc|(WL7bA-T
z=*jOVoOzH{G6X2uO_vy-zbX>7U~f3@kU3~Q859;`I$Ig9JV(Dfx=h*KGOcIQI6-7!
zJ&$fcS$U6`HJZ;`*VRKAy)3THK~!~M<kBYzD008vvI<SrpkGoy?HJe`fXH#!HltcP
z<-(yjN}Y+MZ2Gp?Te3M6m+e|E;qUT#a4;&|3GrN_*{#QSQ#jno^i_s@yTHfIBX#(x
z$DYyo;A(B;cw6md^gyam4k6?xPLW4%<lpi#B1|Sk?9xrY@dnp{JLhy%41ICO;fQ+Q
zRl4zEM?89ITKlc<?lu3C)LQdJ{zWL6gTOHd#eoF6VR;zU&_qI^-AFEp{6&w9+rKqn
z)Q&cgxN}rHl@Q2vh+{gv$(d2xe7J8juY<A@$pTq5RTiya!J*+OxasVn^yyHD)<VdE
zB=ocp8+upx`Et15R{O%?X4&weKuE8sf1?>*gdmKwCZk&SmJ5km<w`bOzu|h5w6>ex
zB%2Y7frOjSthSZ&PC%9u2&!8hDxNJnX`Y%qi)aB3TAlB)Pk5t~RguPz1LxCM9{n8~
zW0W+T0r0?v*2VsClIQkr>YJT}1M6Uqcq?`#8DjjE3>TWzimK%$f6v}>$yVbvnWk}d
zar=|Si!ch=7=2J4JO}-KS)W02bj<Q0PS2B>NU;9VvJR<l;rq><IG_1cuz#C~sZ0#w
zbg=lHQ~VHDW$+d}etNAsqmuYwK49?>g_221!JlqCfjNxUwQr4}U58(6(m_%F0Yf)S
zV&A+ZBqGZrJd}_mm4=z(k3)qkZ?A?ThU(^~Ib|Gmd*lqBES}dD*=y(<<}NLH{PK5T
zg6u>Pz@GbrnS<KbY5flTGG4(N!#RsgT61C5Ela!2@T8mJXEYL??yW27rxP`Mdj@q_
zP%`OPc@pD#V&<98U*mCon{MMYYFVhv^xtubi!J+_^HwlG<?m<muRO8zX_QCykI5IX
zk9~6i>W>$XD!pKC8IL!`KzZTdVMl`xaqHWa61$;8+oW*M8}31GSw!F9;XxV~I^y?7
z-#PpQdQT?D30`PFk2KUVEX_@`R$nM#XttOnshrov(tpf#K0_}cp7BGD_2sRBt4p<N
zMBnQgPj#JChSP1`u&@yR>9s=!^yrL78ZNScq5Kx?bcwHS6R81X<#5Vmkp>5qh?|$z
zuP#TzKDzZRI(3&@MK0YBKfj##O;QUBXdd4Ry87ja#Y(C7tP^o#e%(grpumPGIHYZJ
z&4aoI9F`nEL(|G8WRe0ECP00WI54%(;WXpNt4;NLIr3HWl@`9;Xatn+c%~gXGW$yq
zPW*LMpUI3}J_Sm{4`J=2_raFjFPl-emu|hn>+UX}?QB-@Fa_R>CU#*+42oeFxa=h1
zE)Zx7@2Ks%BxaBim0glKj+M~QLIsU{XY@^_g}oIHrSh|RCn*-^7;8I0dtumat?%(6
zT;RX=j^u!M94S@kX!DV77(tHLB-X&Zx}25Wd35|I-gsCYSO(UlA661iFCXb4_AlH?
zNtOtp_>%K5JK95TJ28h3(6#1XU=ey)O}}3edGpBhkowem&WMXlNWi>Qn)s?j3lFab
zcL;8c9q-?ty*z3$c!9Uts{0T$0UWBd>u4lx)x{UHO#Ye88!vtK<U87;hZmrtKck`V
zr51Z-`iQs}o<qzJYgTfL`O+W(JL@Vf0l!5ECC6h_E1{v~y`vqmVyE5uX`A_|mm#Li
zI4woZ*7^r`;2hmZAeppxXiA#oH6Tb@uYh$V+3}Oq@<4BlFOR?b8Wz&>6G4SgZ524O
zqNg5kcOdF-+U^`8$+@4ac{JGOM=N1>0uS2cgo#{02w+C7UxPhlBm^TU7hndHK~76U
zP9SEJ569n)z28Ou&FwwV1oF_0boVtHIugc<oof{#iWN5OOs+spdce4cMW<qLA`c^1
z`0DKXnwFdTGK|&TD}T@*$j>QY4U~NcaXKi5;WUbMvat*thf6*2^32nCzkPs0j31mS
zvk#=8#}=zC``kWAY|FWzhD6%4EgT9xW@^R_zkOZFC26Ser4x~FITCkpzDq}PBqD{1
zx#87#`kA--hIM;Og5Tb5_?%;4*75NSu?RzG2Z~UDX?f1M)HRZ!N6`ebYWa{@FRZmq
z;9cMAY@Zz3ybArE@^41&BmVjqR*bK9;}D}<CmM4K*bbfFpVuzkhzpGYdTJkmOrpF>
zgTU!FHb|PX?JJudDx89{s+)Y^wY>i_eD2zo#>>Z{f`}%r_5R}KigZnvEu_yce&lPj
zv(ts&h;O}09P8fF$yv=N%%{fpF5lmP;V1~eAs;Q%(<zAY1#l&sm+9YfY-DKeEUb~t
z@nbI$b(r51_<-BdG`DyGmDuLd|Lu4bnQ9O7A?*wcfxbnDD$g2QK<t>P1A2z)Lmd)L
zVZW|5MZeOK>{M7TFm-6k$p@HNPTtas@B9|Cf<?c~VA%s&or9YTgUm={p@$N?2VT3|
zuKZ!Ov7@I%IGIQ5?^yR;80&vs%%*i)ZzOtv&Csp2H&_Wli}p}nkL(hOgN_l~lPfA~
zho72`(pEXEt>(@#D$XBvfn0sWXYqWmtd9P5dvACXzVvk$vLG&h@T-0{_;7RJn~D2~
zw=L=sGXFyCW{k?T@mgoiPw25Q?wYCV(q;-6;R0%N3`Ra!`#b8G$_B!#-$BTP<9nwY
zvU<NVd7v75*_oop=Jjg(#!mi;WCyp=d=h-epB!v8tFNpfkQM*$BukSWlp0L(9oTxh
z*UA-wR?{L?Tt-*flr7Zm=F(}hmMp28{x!Dj3!iyogm=Pl)St&ofAXWlhw$;0eID32
z_LF&@Z5~L`-01k37yxp!H77FB%_+(t2x$E>+`V1lSAQy-&E~6HO)&^Z%igLm98m0K
zVGL4Ps|c`?$Kg^8jP~@8QGIW1=N~#fFWIi__!^jG=WJ@z7mz8US^gSwnYG{HC|^O^
zAq<9WipoAhDZ>0r;FU5x<WF>4IhmdRUW|ByIcU-_Io%Fy&U1*@%H@=5aFuT3er(|$
z=wgi`tn>vUopfO9T<7MK2LR>9QwMpi%%=8X>FP_<f!flDNfqeHg9>txNa%nwkY3s8
z^Y2ylm+y%7hv8&qI<8js!4Rp}-hEBS6sHHb=lY~wGe_5H@#^2P@@FPH+0L<%AN;zw
zHz+@x?E$XQ<xPWF_DSm%+y#;@>FZ~C#f`?(f&~s0P}LR3WUjcoL(WZfB&&^%79Bu(
zb)*ckSc)y9r|8fCQgNtn{We(gZN{99*WnLc;+~u=G@J+_+I)Bz5Kar*!{_AAsz~P+
zaVvuw#1Y}UaosQbH>P`_1}uS%*SG$%uPcE)BjzDOzBt)6Ds&(8dzPf3yka6tA<?3I
zMBEq58C+&}#(u0|`3RfkVAlp*cguMUZ|d=HDo?-JZ@e^~A$Qksh%*Rh*wOtRTeX6P
zpf*!)lWG?!9i;QP?rzFhS>|jpaV=`$M`#F&oOf<y8w|bw3FqkVsmvPrsY$ndauIbD
zR2J}&2KL}7a_1}ioF+5kNBB{4lzz78VZ18wZrg4l5&j_Qos2~PvzWEygn|9f$+pvx
z_cZE6W&ENWwzVnV`31)k%Q$<V*tIRPPj`g!J+IVuU4ouc9PMvdLAI10ul#%S1w4WB
z$yvIWZin3El(eKEbLmFY-r$+e{@@u<DVYht0WoHItVGwqg?|a&>v3Kc0BDP^k`OLN
zNr*yX{N9|N)s^0Q=wj_vth0fC4J#ay&W-pY|H8dEfC1S5kQyn==nh;mlA_yYcJKIn
z=N5+?11)bku`T6w4Que5^9298MFQW<GHE4di;m+U+6~*Shh{5ruDQ+nz-n_$Y+@ro
z9K&g{&{G0XPg;#pFvW3IkKnL+Y~A;q=9x{{80mqbTMT<in~3||12UyBTd9}%4MW77
z3;u{lI}FvzkMw-f9BOBAOSmdNvbfvM+LU_KI#oSoLxHflMJmwPvq2&<!_%z-cg5|^
zB9Y`3c{`IFr<p|fURG=T|Ms45lmXian*p0QjE>AyzIKIx868%SL#`%V#Fwo2raO0P
zE-nPzeYpwI4l{g*5PR|^5%l7PQ@C~8G;82N-QmnWU(+Wf)#1HrIp&T^?4>!he-7f~
zK69XGFXVjLN}@b#=_{<mk*t}wyYuiT^`M0M^@`(<<u4caa0W)iNwfEZKmWR!H2B+w
zM_<Njzd_RIiD~!?19$%4Zp8SIrsbDD-1PNxvupA6Cab4Oj<lW-e*v!!`h`(*3i$)E
zV-bYwT2Yz5Y^GneOTcAhZy)K*)`17YYFvI#;^>NSF6X}4@9QMSMnU8T<H}*f%bc9+
za4*O9@M}T2&W)hyWfHXmuwxG`?AaU+PLfe=qlRG3TaX7>lGpI(3HjWuBTLgE6o{#>
z0O_#c6py%=*GY1ADsSEu_CabFabfomH_uB~Lcab)cifyJ-3;(LU;Fset2<}74u8R`
zTQge|zB}xb?R2z})x+34anh`|drC|*FMY;eYfC+bYI{YZ+4$Se`_WcWvwLe3`V_t%
z&dsW2^6UQXsqmgq`JS&qE@-cua+wQ+XEyCUr^EJlMYW#sQ!=CtyLhl42+o}P<s|%h
zn1R;~g#kYYQD}T+=8qMEkQ+~WZxQPl1PO`#^0%?T(T+(necrsb2zo0U>1XPG@B%qV
zwEOAJ-&5=jpe{8kFzzAg65W7G$fBtI#8MT<+89(2Fdk`qU3a1$t%Ao9p4Z{z2%+M0
zy=;qh_;4H|HPDt8*hlce1K8a_A^5!;13gwj6iQbso%os8T5F6hFk=7q1ZvLR&r#xg
zC;j(!O@BL*9UPbzs-HoDLLVr-t}jM+vq`{E)r8}1<2F-w2SRgULvz5)`;0z@md1l?
zH@xNf<0arVQ;jTPK!~|*z82NPecBZ&;2`gp=*JyUO4}o_2tKX9uDKeFt~#hymIekP
zmHM<x%_)gpc3IZU-KYIbpg$=);@mS672_qm*cx=K1|)YHNqu6_9_tQpSe5Oy^|9^k
z6};rfA+dLJ&I+%a2+8nEC``QmzqYPC9_p|ATPFLO?4z+1WgYv3%pf9ri%7O?k(d$L
zvSrJzY-ung6hcClu?{BtRw3&kQPv^r%=pdo{JzQa`Zj;fA2Xl1bMCq4zR&x8?mZI=
z2?q*63o}8g?M$if-mxs<cB6G(Ivye&!Lv1;<ik@)?|z?-B+)<XNO*vi9BdQ}Qn4$k
zy-FSrV8DQF@$p4A{WklkXo@MiJF{uu${lu@#oUb2v*lULq|j|?nh!WHkqZm&W++01
zo+#_tUq~|l74qSgZ#R!h>0`R-%qSdAaq4<lOK-e}n=eew01c*$wGw!Uu)eXiUP))L
zS|MtFyCd5hXzvTK%kaeLotk1o9lpeqjdf-2B8|IWgWis?YOn1<fl(d@q-o)iWoY@m
zu?BoJ@+!uhT<e6Ad$j+PcETlbVli=zaU36ylHC0;m}}!37%Jt5jY)}>vGOvnwrMBx
zH<Gj*cQY5uWz7}C!R!0W%B*!eU$4Z<t+pME>rq$#5d7%?com!}(CgnUI-84e6_}78
zSB`g1*jXdFwKV)nKB#L%ka49a-t1s2oTadMrZU={rC55sljf#b_y(f#M+PWk2m2(F
zwDIe|%$1#(R@;sQlQD?Us=mW(&!g&I&3E9uWU*strnYySJosm4+dlgN2~=EC=9p;k
z7?a^lP}c5|IK}Zsb<ENLy+>R<lz!y_*__?M9Nv0Z0u;6HR@&GvLrL!%OYfT+S!Xv?
zba#7P+{J_-80Cd+e?gek9?4JXk0*}Gt*$y@#YsPk9926IEym58_*#r%!9<4B^N@fI
z+U?zbAbyr>Pg!==?uka=Ns$gs?9l$p3M2z2CSLW{o;mMh<EQI>x@hN1rWRoJ9M)h5
zRLpg&uZenxZxb@`mmiR}D$WKhNEV=OoJ!@5wEKMG2kXv*;)6qi>#uBfyGK^X(*-7F
zGRBRp55BI-PS#_l?p_wS<K2mV`}#s@_t3sKwf6r?ETKYzWF3Uf>v0iTY09EdmucxE
zz)>XsJ!7gbs>)S1$Jk>SfJVdi6%#E*#n9InwUiCTt#7IGsw;DS(jO!a1Z|6%*x5qe
zsFYRxhd{D1Wh9&3#>p!6#E;S%jeqvp|LTVgCttflcw!%3Su2S8#b;^VksH#UphM9?
z7H(O2ZM4#HA%L^T)q{UPYK{+;hzA5V+$)HqA9z9*%+{zi&;R9ff@jE*A`j@pWR+!t
z1mijTL$xeYQhX@{7J1u65JP$Qe>kOo_*&Q|po@n^(_X_j{;St8hOZmWHZ)N62NxaD
zx^Wa_>+0krU)Mes7JqA2<`U$EUBc;?`ZuLi1U6Hy2$UQPir!6_4gUc0isGt2y#S`N
z$`}8OTGnh!Z(y8IyMvOOV-x^cZfv^sRMmP=Dqnt;@C4`0JLx>NUs!mNB`FOlxL_59
z6cJ|GYR~74qCwA0oY+AM=&z@7{2tYDDe^UJMrB-V0*O*`Jnxopae<)5-{}Hebb{ET
z%Rfp&BU!(|%WIZ9#6%~?p$+qm8_6fWXk7gtANV~PXF}^I+`6*xN%YQ2)bd<sWEP*M
zBp*Ii0s_@47YhmsCcZZ|%&HU0X!V6n75-u?Hp-K}_y*?*>eUcqjvjMzfAH!G&}umt
zxI7&^(CaojBR!6rSo(h27Wp?{fB~+Y^c@~ns>!P!7h|aYO0ill2V9=4@4x>%OHtxu
zjp|R1*j3slbIEA!!Q(m3(R=s6o>!`KrpYwIW78Cubf(}TI<_L(1Sqs=#L&p7_RW&Z
zP8RCI&VsS)XUg5bdJHd>jBgu_&jJ5g)VW<_&Rd1&*X2*lv-6*v;f{<Np$qHA>uXB(
z7^yD$OW*N*OvMoyWHGXy2Q9OMfIXByAoBVb-X4}OHhM>!2_(IF^%qy0XRjGH6q|g*
z+U`ot!;(gH0C5D7)`*rWWkNVj49qtx{9)v9qGyljFZd^UM>F5WbZ=(p{-%m7u%u>e
z?1HirQu%h{aIL($?|{H9NonZ&tN2s@_K8q$O<RA@o-A)dT>Z8Z4>LH*T927V#0~<3
z4(hU5kCPjfsWagefCl4*3>+NEQ@-oH`eqa3Bn>f1Uz7dIfAI}DI<>W2`PDw<D*ID}
z*u&4o%r!AN<IW5pUm!4dDhNE*uI-e<QIVl!xu3jSzZ!e*e7bcF5wa<YwNop1JY`eo
z+n)8{X&mk81QPpS#v9U%5>TC6^)9X+q|hMO4S3Fiem?02-^O?kC!4PX)4D-M@0~4!
zlt6Uj813CXUAsnTBv_|@jcM(><xVQso&47$&9Q)Wzg9igOd~Tso~YDsXOUZC9Ki;p
zJt*5C&ww(9k^v`9dE2?RWPL#9CtuK3)Wmx+1z?WBqb{(!nAFVs2-&9ZEz?2T{Gv`9
z>8O8AWb?jINIV<LH&L&tFw`)6(lcRDQ0eqQ2#o%Y-^eT8$YGh3pms_%NDC`9=I7CG
zWTK|O$Dfdwm;bWp2%-tTelp;6oUy^KFyi{0_Oyi;bT`82Hr)a2FI5gv%AsVjX(^$B
z_zLPd_~8>j^Rrsng}z->F~hkF8_tlS!Lr4#-$Cv9Hs=mpAutV`I&D^Dm;<+NCQWoI
zZBlYFNA+Qg!L6q5hmaj2s;mZd=s!lBPVHX(aj|<pMJPXy@n5Ss)KoOYm_1=sZMD?r
zEy8Cr4?B6^9kP({b;^BkX!fy<3k9`CT8p3((Bv|UmJ0;dUQ;KCjszVVGto-8J2~;0
zUd^Mr2|A+_$!Qq~{<fn|$G^g{2>RF0P_jef=y$n)>g&6^xX3DUIq)*iT%MyS)5?0X
zm|jS(EyL8L#J?rSc{1S@E*1cUj00uI*q#=%YeuWRCPU9;Zc%jQ&yD$OH1lW0j^VN2
zMJ;(og0iPZ#UEKlC-$;lDC>AcZd2K4(x05Ur4>0cui2y~KtcdJ@+I#>U{p#W(e_Q?
z%#kE?0nXORsf+N8@C?4}Gw^0^_ynX>Q&-(3XZl&h4D512i)idXGJF^FZsL+YsTa?P
z@v~AoJy&*lZ!ETPv9#`o>+}|slviKJfBHd#Cez`sm9=^hX%Va5H~;BX03i?LuB<VX
z7(vfz9@E?s7WD{STRV1jqh7miwrhItoMp9JMg6^=X{$~vr-Ns@+^qZp7`f9A*NhVO
zFXC^FEGm_79^=3A>AaA-^2sH>??B$V)*=^~Dc9$`&+#_t3WF9peRFLF6<cSXs}EKj
zuGHfw+C@7kvx{a3g$$X`<t5W@d$S#2m!3nBSg%j^_Ef|SR`1RqfJWjZs0Kt>zwFW)
zFg>@rS~sHF)z`V`6|l471FhM;yoyaHC@}A0RHr*9mz|Wacw2oEgU`V3Kt^lcSzube
zNFgt1EvJ;oEqiw|Ra_HS6B1O<ntQCq2L#nWT-&Jagu`AxJ3<dc(In-u1fmNaERctW
z*Je18q|3b@G13!@m;*;@waQvQTA|K^@3&W&VkqTU#pclkZ86lhJx0M<d>lL-^w2Hz
z;nQHA#BZ{!i}1;<GiC?VkRa7dH?;u|*D`z#xB6|oXjy=|dA+^8wf8`NhRTYL2j=EB
zeQQ}h>BI%R0+8FMc35Ci%00*)I<iccbTyVdA&lyQ!;#b_kR*;!JJB3YTFiuM5%QlH
z08|IG()*ef&#p^m1*IrR!uk(Dj*jhN(BXBJlnw8+?C-RP18;M2f^T&0oY7TRyvu(=
z1!~n?L>W}a*5P5iYv)GCOw%dx7Odv?tsUZ5hJI2YkUc;6#j;9?UHY9(6V7*dr_5%r
zXuRryGVWW~%6N5czyz_>eY{#~b|h*8W6a4X54=6Nf8DNF{l-8cFNXN0Yt`zlF=xW3
zLWWva+Y?8qCPlcJKJd*)uJaN>%iKn*Ph~J#hmshIxpq50Kd`zZ59<ir&U}`9IuqRW
z2~Lr?eF@o8>}ZxbP_|eXSfp8TL3pm3nP!E^#@2CYq1=&3#N3i&A;xS$;#|%YbJXB}
z6i?=-le#=YYJJwMKUAWZm8&wdvb@JXc#toY@fPrzuS)m`eEnJfT8t!>VHu<b?Fbo-
z;iS#Yl9X1fMxI9}hwN?z5|&+85b*oFEGpRSBR~<_$VMkNjZ<WhC>A+A=Vav^5kUh;
z<Lt1vU&2BxNZLV6d0W5UcghES@#nrhbT73hhT|ZDyn&L7%#hjHmBA~_X)AmggqQO%
zp$_?!W;|yk=$^sb7=J-BRU9&9Hf8Y6br945wC6G@lU|QyxaO{ZyM`;IoRij57~BJR
zSVg|=1rF|McvbgLs?mJ+B%K(}PwHbV$3Aw%LWL+eckjn*>M|EyIwB9(K8{bCN&is=
zkw+)mOF)8!tvOm<q+L!zZJY7e`inwwgYh>E<pAGU?a13oQ1ncA+*|}H4!d+u`J&8e
z;@Kz{KFLjk&l{s<oV1;97=9!c5p#FL0<z)cPRJ~?O`}6cSa@Gg@Sbo2{?4J~q;bc6
zO(QHMH~5jjLKY`iBzaK&*&xEwkpEcQ=_ZeB+;83l`#$9q+hQzxnxMi=Yk?Gr++ahw
zoMZ1Z=4-9dCIcD9P2EQ-hbvrDyp}KMn8ZSZcv-65$Da34jJfqa$rl5(+4o|xrIP`H
zHXq^5$g4+iF$V;IME7;8N~mph*Y{aoXx>dZ$2~$o{j!BPF86zF6~@gCLsR0e`L$EZ
zb-uWZ4a)8N>6J*WdLxwFa0@48+;lQD$PZ_*HarTAqeU`H3H5{_1cx~pbDiM=1+3^{
z{fG~H1tyOfH!M`uqxjTs;P4Wq+ZQdpiXQI=tnBk=iIC_Iw`0OY9v429J~GXvoF)L|
zO@e+jF*hnmdxR<WY!|tufpbP2c3tuiA}PZ{)aoSA-hsecp0^FdLpW)-Ho3Q1Z*qhu
z6L(*zIA&f>>my(kwz{7=&N=3%qUcJ_hAxmVPK*rmdT^=HBHgWj^umL51E=+SZMh8>
zUNX_%+he*q_D=+ZLr%`L)mo0@XWL1+efM;&^D;|*mfWDXn*bXwCf=)osP*?>W+B<t
zWi!!!6ub9Wfb6QJwHIbnRuCc6>2L&a@tw`d_ww#$w>s?2pBwXZtdAPk(Zz{V_I%@h
zVU2+2^Rh_J^*$`3S{pI_mgf&@1c0}9X0D&$e>GB_Ozum2RD5a627u)Di8I<Ed|yY6
z=z@NbbGgw($Fz;a&HgL;O_H5*G)@rM*@c}|ABl$s(_59~I!R1_LmT3;F}+PGtl4`J
z^i$jJi9R<rFF38_q_RW<;ganD01oSHZGFto5Au2NUOxU*@V6VPguoh?VIA&U5dO~F
z8BbtZfb|b|f`ZCGc_VcT+mW6(l#YVC@W6%KwT>{3Wr+1M=m$=5D8hgD07*(gObkF-
zx`#FiGa%K4$=5iFh_>Walj#qKA(pppdnR8?-WKV%W^H*$@y?CgH{YcdRmHX^pDCA+
zo{!y=J2Z*hiy(b8Ca0vcU_Kz&?^b2Ny*r*0_n*6Tz{~BwyGI3bIDJ>DIbZMWZL?Sl
zj_VJLh|vBJJWUxj>|gCMekbe9F`z&^+uZ48ecl51&gS)|O4>(MP{VDkOU`h_-jIyG
z+>|(m3~Q5#C2d>XvE2JnBebkiqnGBBP!k45Mh{asIvC65_Q8^A<dS6Q)*2TVcBSAw
z%jE3&+kkyTTNjtkIM42>bIS7fu~|wp<(hZb2<lLw@$y_=`%BcHuW|_wXv{Q+hD|kB
zA%-)@D-qQq1~Gr2rUUzo14N>v$i~##!fuP~)A^vEY(E@J=hRvidgK%S6N~Kj8~IsG
zAY!A>C;pRRHPvLg8@lswb=XIAM>^*BZrV@fGIi4vy``w~G$}l+R&*YW`g+~D^YW=H
zX5fQ8*1ZYvXjs(nBVTBd0iPHc+B6+}^?l$0*GS4>$;K6Nt>0iR6!RDcc`EH{Vul_q
z)0N>jJH`4d7Gv>UEjaR8<c1tG?Gy8da#`Fm+l7tX2f$H)v!`ood}928F;&{iwG-o;
zEe!3!qd@j}Hy!NI*O!D@_)-?S&3@NUQcCK;I0W9`)2pc3(nNItG$-+|7_QETPnLDw
zkG6ZN5;Ug8x<q=X1DrAuw?3bs<0tubv~4;C!H>M`8XTtNV0A<WF~z|kwSD3WEM<97
zE|_~M<A%<Yv%Xu2jzF0acu08WGBzXJ-#Sw=cvnEp>!TF#)|Q8?nCQ5N&fKoI_ZQi|
zD3W$Xx`OuJc>}<{o~;XFaH>YMqlVW_?Q0I^I|GFI1d6M-cj-X{&7gQO4c+p%&%pM!
zxfgOPLz7w|^{Cz!W+0fYhQ(R<TfZ1>N|=(8`oW2{v)Ux^W~WzI<0yE)8&=u}FYbao
zp3Kzfy|iJs-LJ5kdFx^!;Grb-kZ-zasd6jmL>Q}{nKT$0sdf3K36@`DX%F4z48dY6
z1PaT;`%jgGEjT$p0I?~d13X8)*o#@<4|>K#qm#kgIGx<N=A>*kw#3l*MD2sE`>6Xd
zPu?Ydror`LfC+yPm+*iL)kWiG;?REIt#&`oB?OOW4Dn7@{<r@uF$rsO?FzZV2r3`z
zXpJ5P?F*?YvD8;#u7otOv<@>9yr%kROlyc9PzKDpq`*eSkZfQEe4f9ftjI^A$u%g(
zrVRRpu_;2kK5;qwMa98g|Dp^-_V`Cp<Mke>@%PxYuyNDG&V>hA%I7-N-BE3C8=sz%
zRwwd+%$cb%Ulw}byU$GkX>*Qc&JHI(zF>0JSsr|EN&3$sEy)unQ<S}~9YOE1xf4n6
zdJH`{{CcQ7t<q-{tgO-G3C7*kd88WONoRJtZKH1K93&yxtU%wKCvimEPd4Ed9TP{W
zwxvt?9SL%u<I^vYlLI3~#6BfGH3#I`S?jFN^o)UyZ+q%FMm@yN+Y&JAkC?|#nHv4c
zi1!TzJv6g!x|<S8%16tP37&HhzaVWA9ix?5Hl2qXdE4toK62ih3qR4+^Jyr*gZjWo
z_0ct8nZis=h~%N12jTrt#5Zz{OB|Ee>-lm|^V=1H%suNgQO0!p4F&-SM5k4QeYy=%
z-m!x^bBZF_e&6M3JonP9?2`@nOvp;Iy-wJ>4OySI?YEuZ<w-^Z&_A)ZTnT^|9k;t*
zG3&4=WVj6aX@S5KVhHS9^(7T-g~d3Erxl{4^?px3#Cw7)Z%Y?-kLk5JjSljCZk6X$
z`<pCzTD$9B%5^Q|`U(%6p+vj1pS)jVVd(-MR9VUCl&iqcZp6_IcZEr6;(sbrmMXw5
zs06*6u1szECt{TtQ~7axFH(rXcQSV4%jTj~ob&td>6=c3lFxnDmgqqeo{fKy8Ixo$
zlM!2C^5<c%n04Cw_6>PLL?+Pe_Fi;zIeW-E3jWryUR<$~ZXTsYvv2u>k<(3hik+pc
zo|GnMUg`5xM8Ob5Vju#}YMb9u{T4YH7g!*8ESO_pId@wHzR1W}rv+O;=TV&L-?$=V
zSsYC#u0~QjTz4F@I;AYZ1f|&!jn*%d6>6!Sn6r0+HT&<~?L;5W3*HwHcRr-m|5+b#
zuzO-@vsG2ydr>Ix^2JnjA+{~#F3(9kT?g$d>jZxiyhd56$6$xJ2{02%Ge2J$&~M%J
zow8L_tT)6qxn^U7{&1l6;*@oT`T|P8jq9`y12?K-j@q7-B!H{0c^(%S_g)IA{9`kG
zw;<&xl{1Nj4Tjembxh)W8T#>B0!91W`JJxUtVwZ}U*RDDi{v1uQ{69X{Oo8~XoZz*
z^~F}Ve|k<#Nw<X9f^Ljvb~()B@i8y`s;*3wY~eXVHQ3A%-P<}KY;vnP1%_ABJ{rSM
z3d+iEmh0-;Yd8Rsz7rY3ro-Rzv=(wq?K;<G(p?vtiFa_4Y`&tf9HwQ@%jAkw>f1Xk
zo-eHV<78kus!7pFI|2Oc!k)-|YxC@2(--B^Xz4Doc>Cm~?UL}u3l*BzQCg-1G?+}O
zm)Df1xV-+Tj}`Y}bViHL3wFD{Z0xdEpr6sn&U~>>6DCJKFKrneJvkLf>(*}Kd8JE`
ze0g6Kl(M8WW3s#@!E*VKCMODNSY`5i1%?1<_K<a!7TP!>ok*AoS1QIg)eI<T`nl8d
z!>%?iHa2$K(5K=OzlZhBTl!TNdoL^FhV`>Bm33U98XV0VF+ut9oq9+JPKtC6vK$=3
zsl~|1SY4^+YpKSNdQ%|kF@;$Xd26qEbKcUz9(DFEC@go8>&DSZjGQx}avX4n&r;T=
zzNY3G=(z%~?!=7)cQWNNDZ1;88GG)&2e#%MOH?aPDLZDi-)uyfkjX<~t9&KL&1J4K
zcVDxt`fr^Ism!#xquma51}_R`%MlG<6b;Ib>vO-kt#evA%a=0!QlqD@1Jm>@M5h%>
z4ZrBGA(}5GT@;l_Ep?l6oQwF?SMM%YhL$_7@%}S=V1Gc7K}CI4shhRqY-)7!4OG#R
z|1CuG<A5x;bi<oU)|30-hGUWUD3Mgq%fX)!aK4!izp?3<*6^y>k&L8oi0zcPefGLB
z_dZj_n`!f}y!t%*qN8RXx~SkSU(<-^ke8Cs+S0WXP81emvDQP|&qPZ+KL6B6zgZO&
zb4-!`XS61Xu(IS0YyFjcwDnMVP}R`aS2g4<l=BVJFl)<u=;X`4jdUv(_BJ}8v!5IP
z!@AII-s0d|MEM;<gBj#UYHwF@RC!<>*Kce7A<#qJ0Y8jBWdw8VDLjiZEa$gCG)F3C
zSS9<t3$pMu`R0%+1^o?#j=mg<6B}p)pbaFDl7(;3d{zh;9r5{-9TDR%H;+=KBV-N(
ze2IZw;~<oi3>U_@F_aSHWt~Ayc*lmnk>EKfz>Cb$s9(#M8v_-A<#=ND;*M%?wbtJr
z>n}8rNFQjP7_<Oo!%*_QH%mUK5?5Y^{f~6?|I-L00roHW$-Ep{^Q0vU10sq~#psXM
zS^oZKi&?NHW}1?*W@cJRo~t_HNs)g$;+6BfIVbLfoz$04@aCA0A+VFj(8X_87cPI%
ze2a(4JT?~$%#o8jU9NxTPr`O&n;b)1sd$>#?E^e4PcG2_o+bU8%{K1`eEDh%+tzZ1
z*tQEgUZQhZy!AU896e_SE(VtDc$~CpLOvlL6FDMxE?mJ&>R)^y*cA{t2us4QA5zDq
WCO#B$%4VV<zx1??E|qH9KK?)R+@<XR

literal 0
HcmV?d00001

diff --git a/docs/deployment/frameworks/hf_inference_endpoints.md b/docs/deployment/frameworks/hf_inference_endpoints.md
new file mode 100644
index 000000000000..50c981f42c03
--- /dev/null
+++ b/docs/deployment/frameworks/hf_inference_endpoints.md
@@ -0,0 +1,170 @@
+# Hugging Face Inference Endpoints
+
+## Overview
+
+Models compatible with vLLM can be deployed on Hugging Face Inference Endpoints, either starting from the [Hugging Face Hub](https://huggingface.co) or directly from the [Inference Endpoints](https://endpoints.huggingface.co/) interface. This allows you to serve models in a fully managed environment with GPU acceleration, auto-scaling, and monitoring, without managing the infrastructure manually.
+
+For advanced details on vLLM integration and deployment options, see [Advanced Deployment Details](#advanced-deployment-details).
+
+## Deployment Methods
+
+- [**Method 1: Deploy from the Catalog.**](#method-1-deploy-from-the-catalog) One-click deploy models from the Hugging Face Hub with ready-made optimized configurations.
+- [**Method 2: Guided Deployment (Transformers Models).**](#method-2-guided-deployment-transformers-models) Instantly deploy models tagged with `transformers` from the Hub UI using the **Deploy** button.
+- [**Method 3: Manual Deployment (Advanced Models).**](#method-3-manual-deployment-advanced-models) For models that either use custom code with the `transformers` tag, or don’t run with standard `transformers` but are supported by vLLM. This method requires manual configuration.
+
+### Method 1: Deploy from the Catalog
+
+This is the easiest way to get started with vLLM on Hugging Face Inference Endpoints. You can browse a catalog of models with verified and optimized deployment configuration at [Inference Endpoints](https://endpoints.huggingface.co/catalog) to maximize performance.
+
+1. Go to [Endpoints Catalog](https://endpoints.huggingface.co/catalog) and in the **Inference Server** options, select `vLLM`.This will display the current list of models with optimized preconfigured options.
+
+    ![Endpoints Catalog](../../assets/deployment/hf-inference-endpoints-catalog.png)
+
+1. Select the desired model and click **Create Endpoint**.
+
+    ![Create Endpoint](../../assets/deployment/hf-inference-endpoints-create-endpoint.png)
+
+1. Once the deployment is ready, you can use the endpoint. Update the `DEPLOYMENT_URL` with the URL provided in the console, remembering to append `/v1` as required.
+
+    ```python
+    # pip install openai
+    from openai import OpenAI
+    import os
+
+    client = OpenAI(
+        base_url = DEPLOYMENT_URL,
+        api_key = os.environ["HF_TOKEN"] # https://huggingface.co/settings/tokens
+    )
+
+    chat_completion = client.chat.completions.create(
+        model = "HuggingFaceTB/SmolLM3-3B",
+        messages = [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "text",
+                        "text": "Give me a brief explanation of gravity in simple terms."
+                    }
+                ]
+            }
+        ],
+        stream = True
+    )
+
+    for message in chat_completion:
+        print(message.choices[0].delta.content, end = "")
+    ```
+
+!!! note
+    The catalog provides models optimized for vLLM, including GPU settings and inference engine configurations. You can monitor the endpoint and update the **container or its configuration** from the Inference Endpoints UI.
+
+### Method 2: Guided Deployment (Transformers Models)
+
+This method applies to models with the `transformers` library tag in their metadata. It allows you to deploy a model directly from the Hub UI without manual configuration.
+
+1. Navigate to a model on [Hugging Face Hub](https://huggingface.co/models).  
+   For this example we will use the [`ibm-granite/granite-docling-258M`](https://huggingface.co/ibm-granite/granite-docling-258M) model. You can verify that the model is compatible by checking the front matter in the [README](https://huggingface.co/ibm-granite/granite-docling-258M/blob/main/README.md), where the library is tagged as `library: transformers`.
+
+2. Locate the **Deploy** button. The button appears for models tagged with `transformers` at the top right of the [model card](https://huggingface.co/ibm-granite/granite-docling-258M).
+
+    ![Locate deploy button](../../assets/deployment/hf-inference-endpoints-locate-deploy-button.png)
+
+3. Click to **Deploy** button > **HF Inference Endpoints**. You will be taken to the Inference Endpoints interface to configure the deployment.
+
+    ![Click deploy button](../../assets/deployment/hf-inference-endpoints-click-deploy-button.png)
+
+4. Select the Hardware (we choose AWS>GPU>T4 for the example) and Container Configuration. Choose `vLLM` as the container type and finalize the deployment pressing **Create Endpoint**.
+
+    ![Select Hardware](../../assets/deployment/hf-inference-endpoints-select-hardware.png)
+
+5. Use the deployed endpoint. Update the `DEPLOYMENT_URL` with the URL provided in the console (remember to add `/v1` needed). You can then use your endpoint programmatically or via the SDK.
+
+    ```python
+    # pip install openai
+    from openai import OpenAI
+    import os
+
+    client = OpenAI(
+        base_url = DEPLOYMENT_URL,
+        api_key = os.environ["HF_TOKEN"] # https://huggingface.co/settings/tokens
+    )
+
+    chat_completion = client.chat.completions.create(
+        model = "ibm-granite/granite-docling-258M",
+        messages = [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image_url",
+                        "image_url": {
+                            "url": "https://huggingface.co/ibm-granite/granite-docling-258M/resolve/main/assets/new_arxiv.png"
+                        }
+                    },
+                    {
+                        "type": "text",
+                        "text": "Convert this page to docling."
+                    }
+                ]
+            }
+        ],
+        stream = True
+    )
+
+    for message in chat_completion:
+        print(message.choices[0].delta.content, end = "")
+    ```
+
+!!! note
+    This method uses best-guess defaults. You may need to adjust the configuration to fit your specific requirements.
+
+### Method 3: Manual Deployment (Advanced Models)
+
+Some models require manual deployment because they:
+
+- Use custom code with the `transformers` tag
+- Don't run with standard `transformers` but are supported by `vLLM`
+
+These models cannot be deployed using the **Deploy** button on the model card.
+
+In this guide, we demonstrate manual deployment using the [rednote-hilab/dots.ocr](https://huggingface.co/rednote-hilab/dots.ocr) model, an OCR model integrated with vLLM (see vLLM [PR](https://github.com/vllm-project/vllm/pull/24645)).
+
+1. Start a new deployment. Go to [Inference Endpoints](https://endpoints.huggingface.co/) and click `New`.
+
+    ![New Endpoint](../../assets/deployment/hf-inference-endpoints-new-endpoint.png)
+
+2. Search the model in the Hub. In the dialog, switch to **Hub** and search for the desired model.
+
+    ![Select model](../../assets/deployment/hf-inference-endpoints-select-model.png)
+
+3. Choosing infrastructure. On the configuration page, select the cloud provider and hardware from the available options.  
+   For this demo, we choose AWS and L4 GPU. Adjust according to your hardware needs.
+
+    ![Choose Infra](../../assets/deployment/hf-inference-endpoints-choose-infra.png)
+
+4. Configure the container. Scroll to the **Container Configuration** and select `vLLM` as the container type.
+
+    ![Configure Container](../../assets/deployment/hf-inference-endpoints-configure-container.png)
+
+5. Create the endpoint. Click **Create Endpoint** to deploy the model.
+
+    Once the endpoint is ready, you can use it with the OpenAI Completion API, cURL, or other SDKs. Remember to append `/v1` to the deployment URL if needed.
+
+!!! note
+    You can adjust the **container settings** (Container URI, Container Arguments) from the Inference Endpoints UI and press **Update Endpoint**. This redeploys the endpoint with the updated container configuration. Changes to the model itself require creating a new endpoint or redeploying with a different model. For example, for this demo, you may need to update the Container URI to the nightly image (`vllm/vllm-openai:nightly`) and add the `--trust-remote-code` flag in the container arguments.
+
+## Advanced Deployment Details
+
+With the [transformers backend integration](https://blog.vllm.ai/2025/04/11/transformers-backend.html), vLLM now offers Day 0 support for any model compatible with `transformers`. This means you can deploy such models immediately, leveraging vLLM’s optimized inference without additional backend modifications.
+
+Hugging Face Inference Endpoints provides a fully managed environment for serving models via vLLM. You can deploy models without configuring servers, installing dependencies, or managing clusters. Endpoints also support deployment across multiple cloud providers (AWS, Azure, GCP) without the need for separate accounts.
+
+The platform integrates seamlessly with the Hugging Face Hub, allowing you to deploy any vLLM- or `transformers`-compatible model, track usage, and update the inference engine directly. The vLLM engine comes preconfigured, enabling optimized inference and easy switching between models or engines without modifying your code. This setup simplifies production deployment: endpoints are ready in minutes, include monitoring and logging, and let you focus on serving models rather than maintaining infrastructure.
+
+## Next Steps
+
+- Explore the [Inference Endpoints](https://endpoints.huggingface.co/catalog) model catalog
+- Read the Inference Endpoints [documentation](https://huggingface.co/docs/inference-endpoints/en/index)
+- Learn about [Inference Endpoints engines](https://huggingface.co/docs/inference-endpoints/en/engines/vllm)
+- Understand the [transformers backend integration](https://blog.vllm.ai/2025/04/11/transformers-backend.html)

From 175c835ce3e95b234083fc9f954566ba1ea09cb9 Mon Sep 17 00:00:00 2001
From: Anion <123177548+Anionex@users.noreply.github.com>
Date: Tue, 30 Sep 2025 22:38:07 +0800
Subject: [PATCH 048/193] [Bugfix][Model] Fix inference for Hunyuan dense
 models (#25354)

Signed-off-by: anion <1005128408@qq.com>
Signed-off-by: Anion <123177548+Anionex@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/hunyuan_v1.py | 106 +++++++++++++----------
 1 file changed, 59 insertions(+), 47 deletions(-)

diff --git a/vllm/model_executor/models/hunyuan_v1.py b/vllm/model_executor/models/hunyuan_v1.py
index 085e740ce226..09f124426fa1 100644
--- a/vllm/model_executor/models/hunyuan_v1.py
+++ b/vllm/model_executor/models/hunyuan_v1.py
@@ -888,7 +888,7 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         return loaded_params
 
 
-class HunYuanV1Base(nn.Module, SupportsLoRA, SupportsPP, MixtureOfExperts):
+class HunyuanV1ModelBase(nn.Module, SupportsLoRA, SupportsPP):
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -930,6 +930,56 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         else:
             self.lm_head = PPMissingLayer()
 
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+    ) -> Union[torch.Tensor, IntermediateTensors]:
+        model_output = self.model(input_ids, positions, intermediate_tensors,
+                                  inputs_embeds)
+        return model_output
+
+    def compute_logits(
+        self,
+        hidden_states: torch.Tensor,
+    ) -> Optional[torch.Tensor]:
+        logits = self.logits_processor(self.lm_head, hidden_states)
+        return logits
+
+    def make_empty_intermediate_tensors(
+            self, batch_size: int, dtype: torch.dtype,
+            device: torch.device) -> IntermediateTensors:
+        return IntermediateTensors({
+            "hidden_states":
+            torch.zeros((batch_size, self.config.hidden_size),
+                        dtype=dtype,
+                        device=device),
+            "residual":
+            torch.zeros((batch_size, self.config.hidden_size),
+                        dtype=dtype,
+                        device=device),
+        })
+
+    def load_weights(self, weights: Iterable[tuple[str,
+                                                   torch.Tensor]]) -> set[str]:
+        loader = AutoWeightsLoader(
+            self,
+            skip_prefixes=(["lm_head."]
+                           if self.config.tie_word_embeddings else None),
+        )
+        return loader.load_weights(weights)
+
+    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.model.get_input_embeddings(input_ids)
+
+
+class HunYuanMoEV1Base(HunyuanV1ModelBase, MixtureOfExperts):
+
+    def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
+        super().__init__(vllm_config=vllm_config, prefix=prefix)
+
         # Set MoE hyperparameters
         self.expert_weights = []
         self.num_expert_groups = 1
@@ -988,57 +1038,19 @@ def update_physical_experts_metadata(
                 moe.n_redundant_experts = self.num_redundant_experts
                 moe.experts.update_expert_map()
 
-    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.model.get_input_embeddings(input_ids)
+    def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
+        return self.model.get_expert_mapping()
 
-    def forward(
-        self,
-        input_ids: torch.Tensor,
-        positions: torch.Tensor,
-        intermediate_tensors: Optional[IntermediateTensors] = None,
-        inputs_embeds: Optional[torch.Tensor] = None,
-    ) -> Union[torch.Tensor, IntermediateTensors]:
-        model_output = self.model(input_ids, positions, intermediate_tensors,
-                                  inputs_embeds)
-        return model_output
 
-    def compute_logits(
-        self,
-        hidden_states: torch.Tensor,
-    ) -> Optional[torch.Tensor]:
-        logits = self.logits_processor(self.lm_head, hidden_states)
-        return logits
+class HunYuanDenseV1Base(HunyuanV1ModelBase):
 
-    def make_empty_intermediate_tensors(
-            self, batch_size: int, dtype: torch.dtype,
-            device: torch.device) -> IntermediateTensors:
-        return IntermediateTensors({
-            "hidden_states":
-            torch.zeros((batch_size, self.config.hidden_size),
-                        dtype=dtype,
-                        device=device),
-            "residual":
-            torch.zeros((batch_size, self.config.hidden_size),
-                        dtype=dtype,
-                        device=device),
-        })
-
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-        loader = AutoWeightsLoader(
-            self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
-        )
-        return loader.load_weights(weights)
-
-    def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
-        return self.model.get_expert_mapping()
+    def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
+        super().__init__(vllm_config=vllm_config, prefix=prefix)
 
 
-class HunYuanDenseV1ForCausalLM(HunYuanV1Base):
+class HunYuanDenseV1ForCausalLM(HunYuanDenseV1Base):
     pass
 
 
-class HunYuanMoEV1ForCausalLM(HunYuanV1Base):
-    pass
+class HunYuanMoEV1ForCausalLM(HunYuanMoEV1Base):
+    pass
\ No newline at end of file

From c05887276346c72ef25cc5106c5f940faf6230ef Mon Sep 17 00:00:00 2001
From: Pavani Majety <pmajety@nvidia.com>
Date: Tue, 30 Sep 2025 07:51:31 -0700
Subject: [PATCH 049/193] [Bugfix] Fix accuracy issue of TRTLLM FP8 MOE and
 improve logging (#25895)

Signed-off-by: Pavani Majety <pmajety@nvidia.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../model_executor/layers/quantization/fp8.py | 39 +++++++++++--------
 vllm/utils/deep_gemm.py                       |  7 +++-
 2 files changed, 29 insertions(+), 17 deletions(-)

diff --git a/vllm/model_executor/layers/quantization/fp8.py b/vllm/model_executor/layers/quantization/fp8.py
index fb448de3c234..a0808cb603d0 100644
--- a/vllm/model_executor/layers/quantization/fp8.py
+++ b/vllm/model_executor/layers/quantization/fp8.py
@@ -434,14 +434,9 @@ def __init__(self, quant_config: Fp8Config, layer: torch.nn.Module):
         self.weight_block_size = self.quant_config.weight_block_size
         self.block_quant = self.weight_block_size is not None
 
-        self.flashinfer_moe_backend: Optional[FlashinferMoeBackend] = None
         self.fused_experts: Optional[
             mk.FusedMoEModularKernel] = None  # type: ignore
-        if envs.VLLM_USE_FLASHINFER_MOE_FP8 and has_flashinfer_moe():
-            self.flashinfer_moe_backend = get_flashinfer_moe_backend()
-            logger.info_once(
-                f"Using FlashInfer {self.flashinfer_moe_backend.value} kernels"
-            )
+
         # For GPUs that lack FP8 hardware support, we can leverage the Marlin
         # kernel for fast weight-only FP8 quantization
         self.use_marlin = (not current_platform.has_device_capability(89)
@@ -450,14 +445,27 @@ def __init__(self, quant_config: Fp8Config, layer: torch.nn.Module):
         if current_platform.is_rocm():
             self.use_marlin = False
 
+        # First check for Flashinfer MOE on Blackwell GPUs
+        self.flashinfer_moe_backend: Optional[FlashinferMoeBackend] = None
+        if (current_platform.is_cuda()
+                and current_platform.is_device_capability(100)
+                and envs.VLLM_USE_FLASHINFER_MOE_FP8 and has_flashinfer_moe()):
+            self.flashinfer_moe_backend = get_flashinfer_moe_backend()
+            logger.info_once(
+                f"Detected Blackwell GPUs, using FlashInfer "
+                f"{self.flashinfer_moe_backend.value} kernels for FP8 MOE.")
+
         # Check for DeepGemm support.
         self.allow_deep_gemm = False
         if envs.VLLM_USE_DEEP_GEMM:
             if not has_deep_gemm():
                 logger.warning_once("Failed to import DeepGemm kernels.")
             elif not self.block_quant:
-                logger.warning_once("Model is not block quantized. Not using "
-                                    "DeepGemm kernels")
+                logger.warning_once("Model is not block quantized. Not using"
+                                    " DeepGemm kernels")
+            elif self.flashinfer_moe_backend:
+                logger.info_once("DeepGemm disabled: FlashInfer MOE is"
+                                 " enabled.")
             elif (is_deep_gemm_supported()):
                 logger.info_once("Using DeepGemm kernels for Fp8MoEMethod.")
                 self.allow_deep_gemm = True
@@ -471,15 +479,12 @@ def __init__(self, quant_config: Fp8Config, layer: torch.nn.Module):
             logger.debug_once("Model is not block quantized. Not using "
                               "CutlassBlockScaledGroupedGemm kernels")
         elif (current_platform.is_cuda()
-              and current_platform.is_device_capability(100)):
+              and current_platform.is_device_capability(100)
+              and not self.flashinfer_moe_backend):
             logger.info_once(
-                "Using CutlassBlockScaledGroupedGemm kernels for Fp8MoEMethod."
-            )
+                "Using CutlassBlockScaledGroupedGemm kernels for Fp8 MOE "
+                "on SM100.")
             self.allow_cutlass_block_scaled_grouped_gemm = True
-        else:
-            logger.warning_once(
-                "CutlassBlockScaledGroupedGemm not supported on the current "
-                "platform.")
 
     def create_weights(self, layer: Module, num_experts: int, hidden_size: int,
                        intermediate_size_per_partition: int,
@@ -934,7 +939,9 @@ def apply(
                 import vllm.model_executor.layers.fused_moe.flashinfer_trtllm_moe  # noqa: E501, F401
                 assert (renormalize and use_grouped_topk
                         and custom_routing_function is None)
-                result = torch.ops.vllm.flashinfer_fused_moe_blockscale_fp8(
+                e_score_correction_bias = (e_score_correction_bias.to(
+                    x.dtype) if e_score_correction_bias is not None else None)
+                return torch.ops.vllm.flashinfer_fused_moe_blockscale_fp8(
                     routing_logits=router_logits.to(torch.float32),
                     routing_bias=e_score_correction_bias,
                     x=x,
diff --git a/vllm/utils/deep_gemm.py b/vllm/utils/deep_gemm.py
index 0e3bdaec829e..4f05f0bc35cc 100644
--- a/vllm/utils/deep_gemm.py
+++ b/vllm/utils/deep_gemm.py
@@ -27,7 +27,8 @@ def is_deep_gemm_supported() -> bool:
     is_supported_arch = current_platform.is_cuda() and (
         current_platform.is_device_capability(90)
         or current_platform.is_device_capability(100))
-    return envs.VLLM_USE_DEEP_GEMM and has_deep_gemm() and is_supported_arch
+    return (envs.VLLM_USE_DEEP_GEMM and has_deep_gemm() and is_supported_arch
+            and not envs.VLLM_USE_FLASHINFER_MOE_FP8)
 
 
 @functools.cache
@@ -46,6 +47,10 @@ def is_deep_gemm_e8m0_used() -> bool:
         logger.info_once("DeepGEMM E8M0 disabled: _fp8_gemm_nt_impl not found")
         return False
 
+    if envs.VLLM_USE_FLASHINFER_MOE_FP8:
+        logger.info_once("DeepGEMM E8M0 disabled: FlashInfer MOE is enabled.")
+        return False
+
     if current_platform.is_device_capability(100) and \
             envs.VLLM_USE_DEEP_GEMM_E8M0:
         logger.info_once("DeepGEMM E8M0 enabled on Blackwell GPU.")

From f960f1eb2af57d7b4a6e8541c7f810b4cf318e13 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Wed, 1 Oct 2025 00:23:12 +0800
Subject: [PATCH 050/193] [Bugfix] Token type and position embeddings fail to
 be applied to `inputs_embeds` (#25922)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/bert.py    | 17 ++++++++++-------
 vllm/model_executor/models/roberta.py |  6 ++++--
 2 files changed, 14 insertions(+), 9 deletions(-)

diff --git a/vllm/model_executor/models/bert.py b/vllm/model_executor/models/bert.py
index c984845204c4..2ec3edc5a0a7 100644
--- a/vllm/model_executor/models/bert.py
+++ b/vllm/model_executor/models/bert.py
@@ -61,11 +61,13 @@ def forward(
         self,
         input_ids: torch.Tensor,
         position_ids: torch.Tensor,
+        inputs_embeds: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-
         token_type_ids = _decode_token_type_ids(input_ids)
 
-        inputs_embeds = self.word_embeddings(input_ids)
+        if inputs_embeds is None:
+            inputs_embeds = self.word_embeddings(input_ids)
+
         position_embeddings = self.position_embeddings(position_ids)
 
         token_type_embeddings = self.token_type_embeddings(token_type_ids)
@@ -358,11 +360,12 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-        if inputs_embeds is not None:
-            hidden_states = inputs_embeds
-        else:
-            hidden_states = self.embeddings(input_ids=input_ids,
-                                            position_ids=positions)
+        hidden_states = self.embeddings(
+            input_ids=input_ids,
+            position_ids=positions,
+            inputs_embeds=inputs_embeds,
+        )
+
         return self.encoder(hidden_states)
 
     def _load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
diff --git a/vllm/model_executor/models/roberta.py b/vllm/model_executor/models/roberta.py
index 53e698c4fa80..a13042a6367c 100644
--- a/vllm/model_executor/models/roberta.py
+++ b/vllm/model_executor/models/roberta.py
@@ -56,11 +56,13 @@ def forward(
         self,
         input_ids: torch.Tensor,
         position_ids: torch.Tensor,
+        inputs_embeds: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-
         token_type_ids = _decode_token_type_ids(input_ids)
 
-        inputs_embeds = self.word_embeddings(input_ids)
+        if inputs_embeds is None:
+            inputs_embeds = self.word_embeddings(input_ids)
+
         position_embeddings = self.position_embeddings(position_ids)
 
         token_type_embeddings = self.token_type_embeddings(token_type_ids)

From 2432e04bfdb84789853fb6199aae641814e9e9ff Mon Sep 17 00:00:00 2001
From: youkaichao <youkaichao@gmail.com>
Date: Wed, 1 Oct 2025 00:30:36 +0800
Subject: [PATCH 051/193] [bugfix][deepseek] fix flashmla kernel selection
 (#25956)

Signed-off-by: youkaichao <youkaichao@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/attention/ops/flashmla.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/attention/ops/flashmla.py b/vllm/attention/ops/flashmla.py
index 3cc0e4adfa0a..9654f9f6775a 100644
--- a/vllm/attention/ops/flashmla.py
+++ b/vllm/attention/ops/flashmla.py
@@ -136,7 +136,7 @@ def flash_mla_with_kvcache(
         descale_k is None
     ), "descale_q and descale_k should be both None or both not None"
 
-    if (descale_q is not None) and (descale_k is not None):
+    if indices is None and q.element_size() == 1:
         out, softmax_lse = torch.ops._flashmla_extension_C.fwd_kvcache_mla_fp8(
             q, k_cache, head_dim_v, cache_seqlens, block_table, softmax_scale,
             causal, tile_scheduler_metadata, num_splits, descale_q, descale_k)

From 1f9d23d62d78cc75761468edec7b2f10eec0f663 Mon Sep 17 00:00:00 2001
From: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Date: Tue, 30 Sep 2025 14:13:03 -0400
Subject: [PATCH 052/193] [Bug] Fix AttributeError: 'QKVParallelLinear' object
 has no attribute 'orig_dtype' (#25958)

Signed-off-by: yewentao256 <zhyanwentao@126.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py    | 1 +
 1 file changed, 1 insertion(+)

diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py
index d42ae22c5139..5ad1b15b7ed5 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py
@@ -66,6 +66,7 @@ def create_weights(self, layer: torch.nn.Module,
         output_size_per_partition = sum(output_partition_sizes)
         layer.logical_widths = output_partition_sizes
         layer.weight_block_size = None
+        layer.orig_dtype = params_dtype
 
         if self.strategy == QuantizationStrategy.BLOCK:
             assert self.weight_block_size is not None

From b85d33bc42aa80064ce070c1fd47aec724f7f60f Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Wed, 1 Oct 2025 02:58:29 +0800
Subject: [PATCH 053/193] [Doc] Improve MM Pooling model documentation (#25966)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/features/multimodal_inputs.md            |   2 +-
 docs/models/supported_models.md               |  28 ++-
 docs/serving/openai_compatible_server.md      |  58 ++++--
 .../vision_language_pooling.py                |  85 +++++++-
 ...ai_chat_embedding_client_for_multimodal.py | 195 ++++++++++++------
 ...vec.jinja => template_vlm2vec_phi3v.jinja} |   0
 examples/template_vlm2vec_qwen2vl.jinja       |  15 ++
 .../pooling/openai/test_vision_embedding.py   |   2 +-
 tests/entrypoints/test_chat_utils.py          |   3 +-
 9 files changed, 290 insertions(+), 98 deletions(-)
 rename examples/{template_vlm2vec.jinja => template_vlm2vec_phi3v.jinja} (100%)
 create mode 100644 examples/template_vlm2vec_qwen2vl.jinja

diff --git a/docs/features/multimodal_inputs.md b/docs/features/multimodal_inputs.md
index bcc48e756046..b61a54d3ca7f 100644
--- a/docs/features/multimodal_inputs.md
+++ b/docs/features/multimodal_inputs.md
@@ -428,7 +428,7 @@ Our OpenAI-compatible server accepts multi-modal data via the [Chat Completions
     If no fallback is available, an error is raised and you have to provide the chat template manually via the `--chat-template` argument.
 
     For certain models, we provide alternative chat templates inside <gh-dir:examples>.
-    For example, VLM2Vec uses <gh-file:examples/template_vlm2vec.jinja> which is different from the default one for Phi-3-Vision.
+    For example, VLM2Vec uses <gh-file:examples/template_vlm2vec_phi3v.jinja> which is different from the default one for Phi-3-Vision.
 
 ### Image Inputs
 
diff --git a/docs/models/supported_models.md b/docs/models/supported_models.md
index d720fa2458e1..18c8b7846cb2 100644
--- a/docs/models/supported_models.md
+++ b/docs/models/supported_models.md
@@ -626,7 +626,29 @@ See [this page](../features/multimodal_inputs.md) on how to pass multi-modal inp
     For hybrid-only models such as Llama-4, Step3 and Mistral-3, a text-only mode can be enabled by setting all supported multimodal modalities to 0 (e.g, `--limit-mm-per-prompt '{"image":0}`) so that their multimodal modules will not be loaded to free up more GPU memory for KV cache.
 
 !!! note
-    vLLM currently only supports adding LoRA to the language backbone of multimodal models.
+    vLLM currently only supports dynamic LoRA adapters on the language backbone of multimodal models.
+    If you wish to use a model with LoRA in the multi-modal encoder,
+    please merge the weights into the base model first before running it in vLLM like a regular model.
+
+    ```python
+    from peft import PeftConfig, PeftModel
+    from transformers import AutoModelForImageTextToText, AutoProcessor
+
+    def merge_and_save(model_id: str, output_dir: str):
+        base_model = AutoModelForImageTextToText.from_pretrained(model_id)
+        lora_model = PeftModel.from_pretrained(
+            base_model,
+            model_id,
+            config=PeftConfig.from_pretrained(model_id),
+        )
+        model = lora_model.merge_and_unload().to(dtype=base_model.dtype)
+        model._hf_peft_config_loaded = False  # Needed to save the merged model
+
+        processor = AutoProcessor.from_pretrained(model_id)
+
+        model.save_pretrained(output_dir)
+        processor.save_pretrained(output_dir)
+    ```
 
 ### Generative Models
 
@@ -805,8 +827,8 @@ The following table lists those that are tested in vLLM.
 
 | Architecture | Models | Inputs | Example HF Models | [LoRA](../features/lora.md) | [PP](../serving/parallelism_scaling.md) | [V1](gh-issue:8779) |
 |--------------|--------|--------|-------------------|----------------------|---------------------------|---------------------|
-| `LlavaNextForConditionalGeneration`<sup>C</sup> | LLaVA-NeXT-based | T / I | `royokong/e5-v` | | | |
-| `Phi3VForCausalLM`<sup>C</sup> | Phi-3-Vision-based | T + I | `TIGER-Lab/VLM2Vec-Full` | 🚧 | ✅︎ | |
+| `LlavaNextForConditionalGeneration`<sup>C</sup> | LLaVA-NeXT-based | T / I | `royokong/e5-v` | | ✅︎ | ✅︎ |
+| `Phi3VForCausalLM`<sup>C</sup> | Phi-3-Vision-based | T + I | `TIGER-Lab/VLM2Vec-Full` | | ✅︎ | ✅︎ |
 | `*ForConditionalGeneration`<sup>C</sup>, `*ForCausalLM`<sup>C</sup>, etc. | Generative models | \* | N/A | \* | \* | \* |
 
 <sup>C</sup> Automatically converted into an embedding model via `--convert embed`. ([details](./pooling_models.md#model-conversion))  
diff --git a/docs/serving/openai_compatible_server.md b/docs/serving/openai_compatible_server.md
index 1ffe9c9ade20..fe0e1e3df378 100644
--- a/docs/serving/openai_compatible_server.md
+++ b/docs/serving/openai_compatible_server.md
@@ -236,10 +236,32 @@ The following extra parameters are supported:
 Our Embeddings API is compatible with [OpenAI's Embeddings API](https://platform.openai.com/docs/api-reference/embeddings);
 you can use the [official OpenAI Python client](https://github.com/openai/openai-python) to interact with it.
 
+Code example: <gh-file:examples/online_serving/pooling/openai_embedding_client.py>
+
 If the model has a [chat template][chat-template], you can replace `inputs` with a list of `messages` (same schema as [Chat API][chat-api])
-which will be treated as a single prompt to the model.
+which will be treated as a single prompt to the model. Here is a convenience function for calling the API while retaining OpenAI's type annotations:
 
-Code example: <gh-file:examples/online_serving/pooling/openai_embedding_client.py>
+??? code
+
+    ```python
+    from openai import OpenAI
+    from openai._types import NOT_GIVEN, NotGiven
+    from openai.types.chat import ChatCompletionMessageParam
+    from openai.types.create_embedding_response import CreateEmbeddingResponse
+
+    def create_chat_embeddings(
+        client: OpenAI,
+        *,
+        messages: list[ChatCompletionMessageParam],
+        model: str,
+        encoding_format: Union[Literal["base64", "float"], NotGiven] = NOT_GIVEN,
+    ) -> CreateEmbeddingResponse:
+        return client.post(
+            "/embeddings",
+            cast_to=CreateEmbeddingResponse,
+            body={"messages": messages, "model": model, "encoding_format": encoding_format},
+        )
+    ```
 
 #### Multi-modal inputs
 
@@ -254,7 +276,7 @@ and passing a list of `messages` in the request. Refer to the examples below for
     vllm serve TIGER-Lab/VLM2Vec-Full --runner pooling \
       --trust-remote-code \
       --max-model-len 4096 \
-      --chat-template examples/template_vlm2vec.jinja
+      --chat-template examples/template_vlm2vec_phi3v.jinja
     ```
 
     !!! important
@@ -262,34 +284,36 @@ and passing a list of `messages` in the request. Refer to the examples below for
         to run this model in embedding mode instead of text generation mode.
 
         The custom chat template is completely different from the original one for this model,
-        and can be found here: <gh-file:examples/template_vlm2vec.jinja>
+        and can be found here: <gh-file:examples/template_vlm2vec_phi3v.jinja>
 
     Since the request schema is not defined by OpenAI client, we post a request to the server using the lower-level `requests` library:
 
     ??? code
 
         ```python
-        import requests
-
+        from openai import OpenAI
+        client = OpenAI(
+            base_url="http://localhost:8000/v1",
+            api_key="EMPTY",
+        )
         image_url = "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg"
 
-        response = requests.post(
-            "http://localhost:8000/v1/embeddings",
-            json={
-                "model": "TIGER-Lab/VLM2Vec-Full",
-                "messages": [{
+        response = create_chat_embeddings(
+            client,
+            model="TIGER-Lab/VLM2Vec-Full",
+            messages=[
+                {
                     "role": "user",
                     "content": [
                         {"type": "image_url", "image_url": {"url": image_url}},
                         {"type": "text", "text": "Represent the given image."},
                     ],
-                }],
-                "encoding_format": "float",
-            },
+                }
+            ],
+            encoding_format="float",
         )
-        response.raise_for_status()
-        response_json = response.json()
-        print("Embedding output:", response_json["data"][0]["embedding"])
+
+        print("Image embedding output:", response.data[0].embedding)
         ```
 
 === "DSE-Qwen2-MRL"
diff --git a/examples/offline_inference/vision_language_pooling.py b/examples/offline_inference/vision_language_pooling.py
index 0cc0c1e708b1..3d1daf4d19ff 100644
--- a/examples/offline_inference/vision_language_pooling.py
+++ b/examples/offline_inference/vision_language_pooling.py
@@ -10,6 +10,7 @@
 
 from argparse import Namespace
 from dataclasses import asdict
+from pathlib import Path
 from typing import Literal, NamedTuple, Optional, TypedDict, Union, get_args
 
 from PIL.Image import Image
@@ -19,6 +20,9 @@
 from vllm.multimodal.utils import fetch_image
 from vllm.utils import FlexibleArgumentParser
 
+ROOT_DIR = Path(__file__).parent.parent.parent
+EXAMPLES_DIR = ROOT_DIR / "examples"
+
 
 class TextQuery(TypedDict):
     modality: Literal["text"]
@@ -82,23 +86,27 @@ def run_e5_v(query: Query) -> ModelRequestData:
     )
 
 
-def run_vlm2vec(query: Query) -> ModelRequestData:
+def _get_vlm2vec_prompt_image(query: Query, image_token: str):
     if query["modality"] == "text":
         text = query["text"]
         prompt = f"Find me an everyday image that matches the given caption: {text}"  # noqa: E501
         image = None
     elif query["modality"] == "image":
-        prompt = "<|image_1|> Find a day-to-day image that looks similar to the provided image."  # noqa: E501
+        prompt = f"{image_token} Find a day-to-day image that looks similar to the provided image."  # noqa: E501
         image = query["image"]
     elif query["modality"] == "text+image":
         text = query["text"]
-        prompt = (
-            f"<|image_1|> Represent the given image with the following question: {text}"  # noqa: E501
-        )
+        prompt = f"{image_token} Represent the given image with the following question: {text}"  # noqa: E501
         image = query["image"]
     else:
         modality = query["modality"]
-        raise ValueError(f"Unsupported query modality: '{modality}'")
+        raise ValueError(f"Unsupported query modality: {modality!r}")
+
+    return prompt, image
+
+
+def run_vlm2vec_phi3v(query: Query) -> ModelRequestData:
+    prompt, image = _get_vlm2vec_prompt_image(query, "<|image_1|>")
 
     engine_args = EngineArgs(
         model="TIGER-Lab/VLM2Vec-Full",
@@ -116,6 +124,66 @@ def run_vlm2vec(query: Query) -> ModelRequestData:
     )
 
 
+def run_vlm2vec_qwen2vl(query: Query) -> ModelRequestData:
+    # vLLM does not support LoRA adapters on multi-modal encoder,
+    # so we merge the weights first
+    from huggingface_hub.constants import HF_HUB_CACHE
+    from peft import PeftConfig, PeftModel
+    from transformers import AutoModelForImageTextToText, AutoProcessor
+
+    from vllm.entrypoints.chat_utils import load_chat_template
+
+    model_id = "TIGER-Lab/VLM2Vec-Qwen2VL-2B"
+
+    base_model = AutoModelForImageTextToText.from_pretrained(model_id)
+    lora_model = PeftModel.from_pretrained(
+        base_model,
+        model_id,
+        config=PeftConfig.from_pretrained(model_id),
+    )
+    model = lora_model.merge_and_unload().to(dtype=base_model.dtype)
+    model._hf_peft_config_loaded = False  # Needed to save the merged model
+
+    processor = AutoProcessor.from_pretrained(
+        model_id,
+        # `min_pixels` and `max_pixels` are deprecated
+        size={"shortest_edge": 3136, "longest_edge": 12845056},
+    )
+    processor.chat_template = load_chat_template(
+        # The original chat template is not correct
+        EXAMPLES_DIR / "template_vlm2vec_qwen2vl.jinja",
+    )
+
+    merged_path = str(
+        Path(HF_HUB_CACHE) / ("models--" + model_id.replace("/", "--") + "-vllm")
+    )
+    print(f"Saving merged model to {merged_path}...")
+    print(
+        "NOTE: This directory is not tracked by `huggingface_hub` "
+        "so you have to delete this manually if you don't want it anymore."
+    )
+    model.save_pretrained(merged_path)
+    processor.save_pretrained(merged_path)
+    print("Done!")
+
+    prompt, image = _get_vlm2vec_prompt_image(query, "<|image_pad|>")
+
+    engine_args = EngineArgs(
+        model=merged_path,
+        runner="pooling",
+        max_model_len=4096,
+        trust_remote_code=True,
+        mm_processor_kwargs={"num_crops": 4},
+        limit_mm_per_prompt={"image": 1},
+    )
+
+    return ModelRequestData(
+        engine_args=engine_args,
+        prompt=prompt,
+        image=image,
+    )
+
+
 def run_jinavl_reranker(query: Query) -> ModelRequestData:
     if query["modality"] != "text+images":
         raise ValueError(f"Unsupported query modality: '{query['modality']}'")
@@ -232,7 +300,8 @@ def run_score(model: str, modality: QueryModality, seed: Optional[int]):
 
 model_example_map = {
     "e5_v": run_e5_v,
-    "vlm2vec": run_vlm2vec,
+    "vlm2vec_phi3v": run_vlm2vec_phi3v,
+    "vlm2vec_qwen2vl": run_vlm2vec_qwen2vl,
     "jinavl_reranker": run_jinavl_reranker,
 }
 
@@ -246,7 +315,7 @@ def parse_args():
         "--model-name",
         "-m",
         type=str,
-        default="vlm2vec",
+        default="vlm2vec_phi3v",
         choices=model_example_map.keys(),
         help="The name of the embedding model.",
     )
diff --git a/examples/online_serving/pooling/openai_chat_embedding_client_for_multimodal.py b/examples/online_serving/pooling/openai_chat_embedding_client_for_multimodal.py
index 30cb3325b9b1..6e31c3836806 100644
--- a/examples/online_serving/pooling/openai_chat_embedding_client_for_multimodal.py
+++ b/examples/online_serving/pooling/openai_chat_embedding_client_for_multimodal.py
@@ -4,69 +4,137 @@
 """Example Python client for multimodal embedding API using vLLM API server
 NOTE:
     start a supported multimodal embeddings model server with `vllm serve`, e.g.
-    vllm serve TIGER-Lab/VLM2Vec-Full --runner pooling --trust_remote_code --max_model_len=1024
+    vllm serve TIGER-Lab/VLM2Vec-Full \
+        --runner pooling \
+        --trust-remote-code \
+        --max-model-len 4096 \
+        --chat-template examples/template_vlm2vec_phi3v.jinja
 """
 
 import argparse
 import base64
 import io
+from typing import Literal, Union
 
-import requests
+from openai import OpenAI
+from openai._types import NOT_GIVEN, NotGiven
+from openai.types.chat import ChatCompletionMessageParam
+from openai.types.create_embedding_response import CreateEmbeddingResponse
 from PIL import Image
 
+# Modify OpenAI's API key and API base to use vLLM's API server.
+openai_api_key = "EMPTY"
+openai_api_base = "http://localhost:8000/v1"
+
 image_url = "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg"
 
 
-def vlm2vec():
-    response = requests.post(
-        "http://localhost:8000/v1/embeddings",
-        json={
-            "model": "TIGER-Lab/VLM2Vec-Full",
-            "messages": [
-                {
-                    "role": "user",
-                    "content": [
-                        {"type": "image_url", "image_url": {"url": image_url}},
-                        {"type": "text", "text": "Represent the given image."},
-                    ],
-                }
-            ],
-            "encoding_format": "float",
-        },
+def create_chat_embeddings(
+    client: OpenAI,
+    *,
+    messages: list[ChatCompletionMessageParam],
+    model: str,
+    encoding_format: Union[Literal["base64", "float"], NotGiven] = NOT_GIVEN,
+) -> CreateEmbeddingResponse:
+    """
+    Convenience function for accessing vLLM's Chat Embeddings API,
+    which is an extension of OpenAI's existing Embeddings API.
+    """
+    return client.post(
+        "/embeddings",
+        cast_to=CreateEmbeddingResponse,
+        body={"messages": messages, "model": model, "encoding_format": encoding_format},
+    )
+
+
+def run_vlm2vec(client: OpenAI, model: str):
+    response = create_chat_embeddings(
+        client,
+        messages=[
+            {
+                "role": "user",
+                "content": [
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {"type": "text", "text": "Represent the given image."},
+                ],
+            }
+        ],
+        model=model,
+        encoding_format="float",
+    )
+
+    print("Image embedding output:", response.data[0].embedding)
+
+    response = create_chat_embeddings(
+        client,
+        messages=[
+            {
+                "role": "user",
+                "content": [
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {
+                        "type": "text",
+                        "text": "Represent the given image with the following question: What is in the image.",
+                    },
+                ],
+            }
+        ],
+        model=model,
+        encoding_format="float",
+    )
+
+    print("Image+Text embedding output:", response.data[0].embedding)
+
+    response = create_chat_embeddings(
+        client,
+        messages=[
+            {
+                "role": "user",
+                "content": [
+                    {"type": "text", "text": "A cat and a dog"},
+                ],
+            }
+        ],
+        model=model,
+        encoding_format="float",
     )
-    response.raise_for_status()
-    response_json = response.json()
 
-    print("Embedding output:", response_json["data"][0]["embedding"])
+    print("Text embedding output:", response.data[0].embedding)
 
 
-def dse_qwen2_vl(inp: dict):
-    # Embedding an Image
-    if inp["type"] == "image":
-        messages = [
+def run_dse_qwen2_vl(client: OpenAI, model: str):
+    response = create_chat_embeddings(
+        client,
+        messages=[
             {
                 "role": "user",
                 "content": [
                     {
                         "type": "image_url",
                         "image_url": {
-                            "url": inp["image_url"],
+                            "url": image_url,
                         },
                     },
                     {"type": "text", "text": "What is shown in this image?"},
                 ],
             }
-        ]
-    # Embedding a Text Query
-    else:
-        # MrLight/dse-qwen2-2b-mrl-v1 requires a placeholder image
-        # of the minimum input size
-        buffer = io.BytesIO()
-        image_placeholder = Image.new("RGB", (56, 56))
-        image_placeholder.save(buffer, "png")
-        buffer.seek(0)
-        image_placeholder = base64.b64encode(buffer.read()).decode("utf-8")
-        messages = [
+        ],
+        model=model,
+        encoding_format="float",
+    )
+
+    print("Image embedding output:", response.data[0].embedding)
+
+    # MrLight/dse-qwen2-2b-mrl-v1 requires a placeholder image
+    # of the minimum input size
+    buffer = io.BytesIO()
+    image_placeholder = Image.new("RGB", (56, 56))
+    image_placeholder.save(buffer, "png")
+    buffer.seek(0)
+    image_placeholder = base64.b64encode(buffer.read()).decode("utf-8")
+    response = create_chat_embeddings(
+        client,
+        messages=[
             {
                 "role": "user",
                 "content": [
@@ -76,23 +144,21 @@ def dse_qwen2_vl(inp: dict):
                             "url": f"data:image/jpeg;base64,{image_placeholder}",
                         },
                     },
-                    {"type": "text", "text": f"Query: {inp['content']}"},
+                    {"type": "text", "text": "Query: What is the weather like today?"},
                 ],
             }
-        ]
-
-    response = requests.post(
-        "http://localhost:8000/v1/embeddings",
-        json={
-            "model": "MrLight/dse-qwen2-2b-mrl-v1",
-            "messages": messages,
-            "encoding_format": "float",
-        },
+        ],
+        model=model,
+        encoding_format="float",
     )
-    response.raise_for_status()
-    response_json = response.json()
 
-    print("Embedding output:", response_json["data"][0]["embedding"])
+    print("Text embedding output:", response.data[0].embedding)
+
+
+model_example_map = {
+    "vlm2vec": run_vlm2vec,
+    "dse_qwen2_vl": run_dse_qwen2_vl,
+}
 
 
 def parse_args():
@@ -103,29 +169,24 @@ def parse_args():
     parser.add_argument(
         "--model",
         type=str,
-        choices=["vlm2vec", "dse_qwen2_vl"],
+        choices=model_example_map.keys(),
         required=True,
-        help="Which model to call.",
+        help="The name of the embedding model.",
     )
     return parser.parse_args()
 
 
 def main(args):
-    if args.model == "vlm2vec":
-        vlm2vec()
-    elif args.model == "dse_qwen2_vl":
-        dse_qwen2_vl(
-            {
-                "type": "image",
-                "image_url": image_url,
-            }
-        )
-        dse_qwen2_vl(
-            {
-                "type": "text",
-                "content": "What is the weather like today?",
-            }
-        )
+    client = OpenAI(
+        # defaults to os.environ.get("OPENAI_API_KEY")
+        api_key=openai_api_key,
+        base_url=openai_api_base,
+    )
+
+    models = client.models.list()
+    model_id = models.data[0].id
+
+    model_example_map[args.model](client, model_id)
 
 
 if __name__ == "__main__":
diff --git a/examples/template_vlm2vec.jinja b/examples/template_vlm2vec_phi3v.jinja
similarity index 100%
rename from examples/template_vlm2vec.jinja
rename to examples/template_vlm2vec_phi3v.jinja
diff --git a/examples/template_vlm2vec_qwen2vl.jinja b/examples/template_vlm2vec_qwen2vl.jinja
new file mode 100644
index 000000000000..3ab099d8f546
--- /dev/null
+++ b/examples/template_vlm2vec_qwen2vl.jinja
@@ -0,0 +1,15 @@
+{%- if messages | length > 1 -%}
+    {{ raise_exception('Embedding models should only embed one message at a time') }}
+{%- endif -%}
+
+{% set vars = namespace(parts=[]) %}
+{%- for message in messages -%}
+    {%- for content in message['content'] -%}
+        {%- if content['type'] == 'text' -%}
+            {%- set vars.parts = vars.parts + [content['text']] %}
+        {%- elif content['type'] == 'image' -%}
+            {%- set vars.parts = vars.parts + ['<|image_pad|>'] %}
+        {%- endif -%}
+    {%- endfor -%}
+{%- endfor -%}
+{{ vars.parts | join(' ') }}
diff --git a/tests/entrypoints/pooling/openai/test_vision_embedding.py b/tests/entrypoints/pooling/openai/test_vision_embedding.py
index 48434e36eb26..a30413bc3298 100644
--- a/tests/entrypoints/pooling/openai/test_vision_embedding.py
+++ b/tests/entrypoints/pooling/openai/test_vision_embedding.py
@@ -14,7 +14,7 @@
 MODEL_NAME = "TIGER-Lab/VLM2Vec-Full"
 MAXIMUM_IMAGES = 2
 
-vlm2vec_jinja_path = VLLM_PATH / "examples/template_vlm2vec.jinja"
+vlm2vec_jinja_path = VLLM_PATH / "examples/template_vlm2vec_phi3v.jinja"
 assert vlm2vec_jinja_path.exists()
 
 # Test different image extensions (JPG/PNG) and formats (gray/RGB/RGBA)
diff --git a/tests/entrypoints/test_chat_utils.py b/tests/entrypoints/test_chat_utils.py
index a268f573ef90..85b305c2fa02 100644
--- a/tests/entrypoints/test_chat_utils.py
+++ b/tests/entrypoints/test_chat_utils.py
@@ -2468,7 +2468,8 @@ def test_resolve_content_format_fallbacks(model, expected_format):
      ("template_falcon.jinja", "string"),
      ("template_inkbot.jinja", "string"),
      ("template_teleflm.jinja", "string"),
-     ("template_vlm2vec.jinja", "openai"),
+     ("template_vlm2vec_phi3v.jinja", "openai"),
+     ("template_vlm2vec_qwen2vl.jinja", "openai"),
      ("tool_chat_template_granite_20b_fc.jinja", "string"),
      ("tool_chat_template_hermes.jinja", "string"),
      ("tool_chat_template_internlm2_tool.jinja", "string"),

From e6681b46c3551b8df5a46c1f83c089e40e899ff8 Mon Sep 17 00:00:00 2001
From: bnellnm <49004751+bnellnm@users.noreply.github.com>
Date: Tue, 30 Sep 2025 15:03:15 -0400
Subject: [PATCH 054/193] [Docs] Add moe kernel features doc  (#25297)

Signed-off-by: Bill Nell <bnell@redhat.com>
Signed-off-by: bnellnm <49004751+bnellnm@users.noreply.github.com>
Co-authored-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/design/fused_moe_modular_kernel.md |  26 +-----
 docs/design/moe_kernel_features.md      | 119 ++++++++++++++++++++++++
 2 files changed, 121 insertions(+), 24 deletions(-)
 create mode 100644 docs/design/moe_kernel_features.md

diff --git a/docs/design/fused_moe_modular_kernel.md b/docs/design/fused_moe_modular_kernel.md
index cb2037b575e5..ee5701989265 100644
--- a/docs/design/fused_moe_modular_kernel.md
+++ b/docs/design/fused_moe_modular_kernel.md
@@ -242,30 +242,8 @@ Example: `python3 -m tests.kernels.moe.modular_kernel_tools.profile_modular_kern
 
 ## FusedMoEPrepareAndFinalize Implementations
 
-The following table lists the `FusedMoEPrepareAndFinalize` implementations at the time of writing,
-
-| Implementation | Type | Comments |
-| :--- | :--- | :--- |
-| DeepEPHTPrepareAndFinalize | Contiguous / Non-Batched | Uses the DeepEP High-Throughput all2all kernels. |
-| DeepEPLLPrepareAndFinalize | Batched | Uses the DeepEP Low-Latency all2all kernels. |
-| PplxPrepareAndFinalize | Batched | Uses the Perplexity all2all kernels. |
-| FlashInferCutlassMoEPrepareAndFinalize | Contiguous | |
-| MoEPrepareAndFinalizeNoEP | Contiguous | This implementation is used when there is no EP. i.e. no all2all kernels are invoked. |
-| BatchedPrepareAndFinalize | Batched | A reference prepare/finalize class that reorganizes the tokens into expert batched format, i.e. E x max_num_tokens x K. (Doesn’t use any all2all kernels. This is primarily used in unit testing) |
+See [Fused MoE Kernel features](./moe_kernel_features.md#fused-moe-modular-all2all-backends) for a list of all the available modular prepare and finalize subclasses.
 
 ## FusedMoEPermuteExpertsUnpermute
 
-The following table lists the `FusedMoEPermuteExpertsUnpermute` implementations at the time of writing,
-
-| Implementation | Type | Comment |
-| :--- | :--- | :--- |
-| BatchedDeepGemmExperts | Batched | Uses the DeepGemm’s Masked Grouped Gemm kernels for the fused_moe operation. |
-| BatchedTritonExperts | Batched | Uses a Triton Kernel for the Batched matmuls. |
-| BatchedTritonOrDeepGemmExperts | Batched | Chooses either the `BatchedDeepGemmExperts` or `BatchedTritonExperts` based on environment settings. |
-| DeepGemmExperts | Contiguous / Non-Batched | Uses DeepGemm’s Grouped Gemm kernels for fused_moe operation. |
-| TritonExperts | Contiguous / Non-Batched | Uses a Triton Kernel for fused_moe matmuls. |
-| TritonOrDeepGemmExperts | Contiguous / Non-Batched | Chooses either the `DeepGemmExperts` or `TritonExperts` based on fused_moe inputs. |
-| CutlassExpertsFP8 | Supports both Batched and Contiguous formats | Uses Cutlass Grouped Gemm implementations for the fp8 matmuls. |
-| CutlassExpertsFP4 | Supports both Batched and Contiguous formats | Uses Cutlass Grouped Gemm implementations for the fp4 matmuls. |
-| FlashInferExperts | Contiguous | Uses fused_moe operation from FlashInfer |
-| NaiveBatchedExperts | Batched | Reference Batched Experts implementation. Primarily used in unit tests. |
+See [Fused MoE Kernel features](./moe_kernel_features.md#fused-moe-experts-kernels) for a list of all the available modular experts.
diff --git a/docs/design/moe_kernel_features.md b/docs/design/moe_kernel_features.md
new file mode 100644
index 000000000000..74ed34d0a474
--- /dev/null
+++ b/docs/design/moe_kernel_features.md
@@ -0,0 +1,119 @@
+# Fused MoE Kernel features
+
+The purpose of this document is to provide an overview of the various MoE kernels (both modular and non-modular) so it will be easier to select an appropriate set of kernels for any particular situation. This includes information about the all2all backends used by modular kernels.
+
+## Fused MoE Modular All2All backends
+
+There are a number of all2all communication backends that are used to implement expert parallelism (EP) for the `FusedMoE` layer. The different `FusedMoEPrepareAndFinalize` sub-classes provide an interface for each all2all backend.
+
+The following table describes the relevant features of each backend, i.e. activation format, supported quantization schemes and async support.
+
+The output activation format (standard or batched) corresponds to the output of the prepare step of the `FusedMoEPrepareAndFinalize` subclass, the finalize step requires the same format. All the backend `prepare` methods expect activations in standard format and all the `finalize methods return activations in standard format. More details on the formats can be found in the [Fused MoE Modular Kernel](./fused_moe_modular_kernel.md) document.
+
+The quantization types and formats enumerate which quantization schemes are supported by each `FusedMoEPrepareAndFinalize` class. The quantization can happen before or after the dispatch based on the format the all2all backend supports. e.g. deepep_high_throughput supports only block-quantized fp8 format, any other format will result in dispatching in higher precision and quantizing afterwards. The output of the prepare step for each backend is the quantized type.  The finalize step generally requires the same input type as the original activations, e.g. if the original input is bfloat16 and the quantization scheme is fp8 w/per-tensor scales, `prepare` will return fp8/per-tensor scale activations and `finalize` will take bfloat16 activations. See the diagrams in [Fused MoE Modular Kernel](./fused_moe_modular_kernel.md) for more details on the types and formats of activations at each step of the MoE process.  If no quantization type is specified, the kernel operates on float16 and/or bfloat16.
+
+Async backends support the use of DBO (Dual Batch Overlap) and shared expert overlap (where shared experts are computed during the combine step).
+
+Certain models require the topk weights to be applied to the input activations rather than the output activations when topk==1, e.g. llama. For modular kernels, this feature is supported by the `FusedMoEPrepareAndFinalize` subclass, for non-modular kernels, it is up to the experts function to deal with this flag.
+
+unless otherwise specified, backends are controlled via `VLLM_ALL2ALL_BACKEND`.  All backends except `flashinfer` only work with EP+DP or EP+TP. `Flashinfer` can work with EP or DP w/o EP.
+
+<style>
+td {
+  padding: 0.5rem !important;
+  white-space: nowrap;
+}
+
+th {
+  padding: 0.5rem !important;
+  min-width: 0 !important;
+}
+</style>
+
+| Backend                               | Output act. format | Quant. types    | Quant. format          | Async | Apply Weight On Input | Sub-class                                                                                                                                                     |
+|---------------------------------------|--------------------|-----------------|------------------------|-------|-----------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------|
+| naive                                 | standard           | all<sup>1</sup> | G,A,T                  | N     | <sup>6</sup>          | [layer.py][vllm.model_executor.layers.fused_moe.layer.FusedMoE.forward_impl]                                                                                  |
+| pplx                                  | batched            | fp8,int8        | G,A,T                  | Y     | Y                     | [`PplxPrepareAndFinalize`][vllm.model_executor.layers.fused_moe.pplx_prepare_finalize.PplxPrepareAndFinalize]                                                 |
+| deepep_high_throughput                | standard           | fp8             | G(128),A,T<sup>2</sup> | Y     | Y                     | [`DeepEPLLPrepareAndFinalize`][vllm.model_executor.layers.fused_moe.deepep_ll_prepare_finalize.DeepEPLLPrepareAndFinalize]                                    |
+| deepep_low_latency                    | batched            | fp8             | G(128),A,T<sup>3</sup> | Y     | Y                     | [`DeepEPHTPrepareAndFinalize`][vllm.model_executor.layers.fused_moe.deepep_ht_prepare_finalize.DeepEPHTPrepareAndFinalize]                                    |
+| flashinfer_all2allv                   | standard           | nvfp4,fp8       | G,A,T                  | N     | N                     | [`FlashInferAllToAllMoEPrepareAndFinalize`][vllm.model_executor.layers.fused_moe.flashinfer_cutlass_prepare_finalize.FlashInferAllToAllMoEPrepareAndFinalize] |
+| flashinfer<sup>4</sup>                | standard           | nvfp4,fp8       | G,A,T                  | N     | N                     | [`FlashInferCutlassMoEPrepareAndFinalize`][vllm.model_executor.layers.fused_moe.flashinfer_cutlass_prepare_finalize.FlashInferCutlassMoEPrepareAndFinalize]   |
+| flashinfer<sup>4</sup>                | standard           | nvfp4,fp8       | G,A,T                  | N     | N                     | [`FlashInferCutlassMoEPrepareAndFinalize`][vllm.model_executor.layers.fused_moe.flashinfer_cutlass_prepare_finalize.FlashInferCutlassMoEPrepareAndFinalize]   |
+| MoEPrepareAndFinalizeNoEP<sup>5</sup> | standard           | fp8,int8        | G,A,T                  | N     | Y                     | [`MoEPrepareAndFinalizeNoEP`][vllm.model_executor.layers.fused_moe.prepare_finalize.MoEPrepareAndFinalizeNoEP]                                                |
+| BatchedPrepareAndFinalize<sup>5</sup> | batched            | fp8,int8        | G,A,T                  | N     | Y                     | [`BatchedPrepareAndFinalize`][vllm.model_executor.layers.fused_moe.fused_batched_moe.BatchedPrepareAndFinalize]                                               |
+
+!!! info "Table key"
+    1. All types: mxfp4, nvfp4, int4, int8, fp8
+    2. A,T quantization occurs after dispatch.
+    3. All quantization happens after dispatch.
+    4. Controlled by different env vars (`VLLM_FLASHINFER_MOE_BACKEND` "throughput" or "latency")
+    5. This is a no-op dispatcher that can be used to pair with any modular experts to produce a modular kernel that runs w/o dispatch or combine.  These cannot be selected via environment variable.  These are generally use for testing or adapting an expert subclass to the `fused_experts` API.
+    6. This depends on the experts implementation.
+
+    ---
+
+    - G - Grouped
+    - G(N) - Grouped w/block size N
+    - A - Per activation token
+    - T - Per tensor
+
+Modular kernels are supported by the following `FusedMoEMethodBase` classes.
+
+- [`ModelOptFp8MoEMethod`][vllm.model_executor.layers.quantization.modelopt.ModelOptFp8MoEMethod]
+- [`Fp8MoEMethod`][vllm.model_executor.layers.quantization.fp8.Fp8MoEMethod]
+- [`CompressedTensorsW4A4MoeMethod`][vllm.model_executor.layers.quantization.compressed_tensors.compressed_tensors_moe.CompressedTensorsW4A4MoeMethod]
+- [`CompressedTensorsW8A8Fp8MoEMethod`][vllm.model_executor.layers.quantization.compressed_tensors.compressed_tensors_moe.CompressedTensorsW8A8Fp8MoEMethod]
+- [`Mxfp4MoEMethod`][vllm.model_executor.layers.quantization.mxfp4.Mxfp4MoEMethod]
+- [`UnquantizedFusedMoEMethod`][vllm.model_executor.layers.fused_moe.layer.UnquantizedFusedMoEMethod]
+
+## Fused MoE Experts Kernels
+
+The are a number of MoE experts kernel implementations for different quantization types and architectures. Most follow the general API of the base Triton [`fused_experts`][vllm.model_executor.layers.fused_moe.fused_moe.fused_experts] function. Many have modular kernel adatpers so they can be used with compatible all2all backends. This table lists each experts kernel and its particular properties.
+
+Each kernel must be provided with one of the supported input activation formats.  Some flavors of kernels support both standard and batched formats through different entry points, e.g. `TritonExperts` and `BatchedTritonExperts`. Batched format kernels are currently only needed for matching with certain all2all backends, e.g. `pplx`, `DeepEPLLPrepareAndFinalize`.
+
+Similar to the backend kernels, each experts kernel only supports certain quantization formats. For non-modular experts, the activations will be in the original type and quantized internally by the kernel. Modular experts will expect the activations to already be in the quantized format. Both types of experts will yield outputs in the original activation type.
+
+Each experts kernel supports one or more activation functions, e.g. silu, gelu that are applied to the intermediate results.
+
+As with the backends, some experts support applying topk weights on the input activations. The entries in the column in this table only apply to the non-modular experts.
+
+Most experts flavors include an equivalent modular interface which will be a subclass of `FusedMoEPermuteExpertsUnpermute`.
+
+To be used with a particular `FusedMoEPrepareAndFinalize` sub-class, MoE kernels must have compatible activation formats, quantization types and quantization formats.
+
+| Kernel                       | Input act. format     | Quant. types     | Quant. format | Activation function                                         | Apply Weight On Input | Modular | Source                                                                                                                                                                                                                                                                                                      |
+|------------------------------|-----------------------|------------------|---------------|-------------------------------------------------------------|-----------------------|---------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
+| triton                       | standard              | all<sup>1</sup>  | G,A,T         | silu, gelu,</br>swigluoai,</br>silu_no_mul,</br>gelu_no_mul | Y                     | Y       | [`fused_experts`][vllm.model_executor.layers.fused_moe.fused_moe.fused_experts],</br>[`TritonExperts`][vllm.model_executor.layers.fused_moe.fused_moe.TritonExperts]                                                                                                                                        |
+| triton (batched)             | batched               | all<sup>1</sup>  | G,A,T         | silu, gelu                                                  | <sup>6</sup>          | Y       | [`BatchedTritonExperts`][vllm.model_executor.layers.fused_moe.fused_batched_moe.BatchedTritonExperts]                                                                                                                                                                                                       |
+| deep gemm                    | standard,</br>batched | fp8              | G(128),A,T    | silu, gelu                                                  | <sup>6</sup>          | Y       | [`deep_gemm_moe_fp8`][vllm.model_executor.layers.fused_moe.deep_gemm_moe.deep_gemm_moe_fp8],</br>[`DeepGemmExperts`][vllm.model_executor.layers.fused_moe.deep_gemm_moe.DeepGemmExperts],</br>[`BatchedDeepGemmExperts`][vllm.model_executor.layers.fused_moe.batched_deep_gemm_moe.BatchedDeepGemmExperts] |
+| cutlass_fp4                  | standard,</br>batched | nvfp4            | A,T           | silu                                                        | Y                     | Y       | [`cutlass_moe_fp4`][vllm.model_executor.layers.fused_moe.cutlass_moe.cutlass_moe_fp4],</br>[`CutlassExpertsFp4`][vllm.model_executor.layers.fused_moe.cutlass_moe.CutlassExpertsFp4]                                                                                                                        |
+| cutlass_fp8                  | standard,</br>batched | fp8              | A,T           | silu, gelu                                                  | Y                     | Y       | [`cutlass_moe_fp8`][vllm.model_executor.layers.fused_moe.cutlass_moe.cutlass_moe_fp8],</br>[`CutlassExpertsFp8`][vllm.model_executor.layers.fused_moe.cutlass_moe.CutlassExpertsFp8],</br>[`CutlasBatchedExpertsFp8`][vllm.model_executor.layers.fused_moe.cutlass_moe.CutlassBatchedExpertsFp8]            |
+| flashinfer                   | standard              | nvfp4,</br>fp8   | T             | <sup>5</sup>                                                | N                     | Y       | [`flashinfer_cutlass_moe_fp4`][vllm.model_executor.layers.fused_moe.flashinfer_cutlass_moe.flashinfer_cutlass_moe_fp4],</br>[`FlashInferExperts`][vllm.model_executor.layers.fused_moe.flashinfer_cutlass_moe.FlashInferExperts]                                                                            |
+| gpt oss triton               | standard              | N/A              | N/A           | <sup>5</sup>                                                | Y                     | Y       | [`triton_kernel_fused_experts`][vllm.model_executor.layers.fused_moe.gpt_oss_triton_kernels_moe.triton_kernel_fused_experts],</br>[`OAITritonExperts`][vllm.model_executor.layers.fused_moe.gpt_oss_triton_kernels_moe.OAITritonExperts]                                                                    |
+| deep gemm+triton<sup>2</sup> | standard,</br>batched | all<sup>1</sup>  | G(128),A,T    | silu, gelu                                                  | <sup>6</sup>          | Y       | [`TritonOrDeepGemmExperts`][vllm.model_executor.layers.fused_moe.triton_deep_gemm_moe.TritonOrDeepGemmExperts],</br>[`BatchedTritonOrDeepGemmExperts`][vllm.model_executor.layers.fused_moe.batched_triton_or_deep_gemm_moe.BatchedTritonOrDeepGemmExperts]                                                 |
+| marlin                       | standard              | <sup>3</sup>     | <sup>3</sup>  | silu,</br>swigluoai                                         | Y                     | N       | [`fused_marlin_moe`][vllm.model_executor.layers.fused_moe.fused_marlin_moe.fused_marlin_moe]                                                                                                                                                                                                                |
+| trtllm                       | standard              | mxfp4,</br>nvfp4 | G(16),G(32)   | <sup>5</sup>                                                | N                     | Y       | [`TrtLlmGenExperts`][vllm.model_executor.layers.fused_moe.trtllm_moe.TrtLlmGenExperts]                                                                                                                                                                                                                      |
+| pallas                       | standard              | N/A              | N/A           | silu                                                        | N                     | N       | [`fused_moe`][vllm.model_executor.layers.fused_moe.moe_pallas.fused_moe]                                                                                                                                                                                                                                    |
+| iterative                    | standard              | N/A              | N/A           | silu                                                        | N                     | N       | [`fused_moe`][vllm.model_executor.layers.fused_moe.moe_torch_iterative.fused_moe]                                                                                                                                                                                                                           |
+| rocm aiter moe               | standard              | fp8              | G(128),A,T    | silu, gelu                                                  | Y                     | N       | [`rocm_aiter_fused_experts`][vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe.rocm_aiter_fused_moe_impl]                                                                                                                                                                                           |
+| cpu_fused_moe                | standard              | N/A              | N/A           | silu                                                        | N                     | N       | [`CPUFusedMOE`][vllm.model_executor.layers.fused_moe.cpu_fused_moe.CPUFusedMOE]                                                                                                                                                                                                                             |
+| naive batched<sup>4</sup>    | batched               | int8,</br>fp8    | G,A,T         | silu, gelu                                                  | <sup>6</sup>          | Y       | [`NaiveBatchedExperts`][vllm.model_executor.layers.fused_moe.fused_batched_moe.NaiveBatchedExperts]                                                                                                                                                                                                         |
+
+!!! info "Table key"
+    1. All types: mxfp4, nvfp4, int4, int8, fp8
+    2. A dispatcher wrapper around triton and deep gemm experts.  Will select based on type + shape + quantization params
+    3. uint4, uint8, fp8, fp4
+    4. This is a naive implementation of experts that supports batched format. Mainly used for testing.
+    5. The `activation` parameter is ignored and SwiGlu is used by default instead.
+    6. Only handled by or supported when used with modular kernels.
+
+## Modular Kernel "families"
+
+The following table shows "families" of modular kernels that are intended to work together. There are some combinations which may work but have not yet been tested, e.g. flashinfer with other fp8 experts. Note that the "naive" backend will work with any non-modular experts.
+
+| backend                          | `FusedMoEPrepareAndFinalize` subclasses                    | `FusedMoEPermuteExpertsUnpermute` subclasses                                                                               |
+|----------------------------------|------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------|
+| deepep_high_throughput,</br>pplx | `DeepEPHTPrepareAndFinalize`,</br>`PplxPrepareAndFinalize` | `BatchedDeepGemmExperts`,</br>`BatchedTritonExperts`,</br>`BatchedTritonOrDeepGemmExperts`,</br>`CutlassBatchedExpertsFp8` |
+| deepep_low_latency               | `DeepEPLLPrepareAndFinalize`                               | `DeepGemmExperts`,</br>`TritonExperts`,</br>`TritonOrDeepGemmExperts`,</br>`CutlassExpertsFp8`                             |
+| flashinfer                       | `FlashInferCutlassMoEPrepareAndFinalize`                   | `FlashInferExperts`                                                                                                        |

From 680223f46f7a017421acf6f2aa4bcc4adf7c02f8 Mon Sep 17 00:00:00 2001
From: Or Ozeri <oro@il.ibm.com>
Date: Tue, 30 Sep 2025 22:53:04 +0300
Subject: [PATCH 055/193] OffloadingConnector: Fix GPU block tracking bug
 (#25856)

Signed-off-by: Or Ozeri <oro@il.ibm.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../kv_transfer/kv_connector/v1/offloading_connector.py      | 5 +++--
 1 file changed, 3 insertions(+), 2 deletions(-)

diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/offloading_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/offloading_connector.py
index c23efa604544..6936638c7f4e 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/offloading_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/offloading_connector.py
@@ -278,8 +278,9 @@ def _get_reqs_to_store(self, scheduler_output: SchedulerOutput):
                 req, start_idx=start_block_idx, end_idx=num_blocks)
             store_output = self.manager.prepare_store(new_block_hashes)
             if store_output is None:
-                logger.warning("Cannot store %s blocks", num_new_blocks)
-                break
+                logger.warning("Request %s: cannot store %s blocks", req_id,
+                               num_new_blocks)
+                continue
 
             self._next_stored_block_idx[req_id] = num_blocks
 

From 055680f723b957d0036911b4c73b2a829a5e8280 Mon Sep 17 00:00:00 2001
From: cjackal <44624812+cjackal@users.noreply.github.com>
Date: Wed, 1 Oct 2025 05:35:15 +0900
Subject: [PATCH 056/193] [Llama4] [multimodal] Fix misplaced dtype cast of
 `cos_sin_cache` in `Llama4VisionRotaryEmbedding` (#25889)

Signed-off-by: cjackal <44624812+cjackal@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../layers/rotary_embedding/llama4_vision_rope.py             | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/vllm/model_executor/layers/rotary_embedding/llama4_vision_rope.py b/vllm/model_executor/layers/rotary_embedding/llama4_vision_rope.py
index 871728035306..c98a426a2a1e 100644
--- a/vllm/model_executor/layers/rotary_embedding/llama4_vision_rope.py
+++ b/vllm/model_executor/layers/rotary_embedding/llama4_vision_rope.py
@@ -59,7 +59,9 @@ def forward_native(  # type: ignore[override]
         key: Optional[torch.Tensor] = None,
     ) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
         assert key is not None
-        self._match_cos_sin_cache_dtype(query)
+        # self.cos_sin_cache here is complex tensor so we cannot cast into
+        # query's dtype directly with self._match_cos_sin_cache_dtype
+        self.cos_sin_cache: torch.Tensor = self.cos_sin_cache.to(query.device)
         query_ = torch.view_as_complex(query.float().reshape(
             *query.shape[:-1], -1, 2))
         key_ = torch.view_as_complex(key.float().reshape(

From 9be68902d7733127ac7984030c2a483d0f6365bf Mon Sep 17 00:00:00 2001
From: Jee Jee Li <pandaleefree@gmail.com>
Date: Wed, 1 Oct 2025 05:13:48 +0800
Subject: [PATCH 057/193] [Bench] Add DeepSeekV32 to MoE benchmark (#25962)

Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 benchmarks/kernels/benchmark_moe.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/benchmarks/kernels/benchmark_moe.py b/benchmarks/kernels/benchmark_moe.py
index d2beb28f7023..02c2db674d4b 100644
--- a/benchmarks/kernels/benchmark_moe.py
+++ b/benchmarks/kernels/benchmark_moe.py
@@ -584,8 +584,9 @@ def main(args: argparse.Namespace):
         topk = config.num_experts_per_tok
         intermediate_size = config.intermediate_size
     elif config.architectures[0] in (
-        "DeepseekV3ForCausalLM",
         "DeepseekV2ForCausalLM",
+        "DeepseekV3ForCausalLM",
+        "DeepseekV32ForCausalLM",
         "Glm4MoeForCausalLM",
     ):
         E = config.n_routed_experts

From 369f144d41c250119313435c4d4eddbc538961b5 Mon Sep 17 00:00:00 2001
From: David Ben-David <sdavidbd@gmail.com>
Date: Wed, 1 Oct 2025 00:57:08 +0300
Subject: [PATCH 058/193] [V1] [P/D] Add Support for KV Load Failure Recovery
 (#19330)

Signed-off-by: David Ben-David <davidb@pliops.com>
Co-authored-by: David Ben-David <davidb@pliops.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../kv_load_failure_recovery/README.md        |  30 ++
 .../decode_example.py                         |  85 +++++
 .../prefill_example.py                        |  58 +++
 .../rogue_shared_storage_connector.py         | 145 ++++++++
 .../kv_load_failure_recovery/run.sh           |  33 ++
 .../unit/test_kv_load_failure_recovery.py     | 341 ++++++++++++++++++
 .../unit/test_offloading_connector.py         |   4 +-
 .../unit/test_output_aggreagator.py           |  74 ++--
 .../unit/test_remote_decode_lifecycle.py      |   6 +-
 .../unit/test_remote_prefill_lifecycle.py     |  14 +-
 tests/v1/kv_connector/unit/utils.py           |  49 ++-
 tests/v1/worker/test_gpu_model_runner.py      |   1 +
 .../kv_transfer/kv_connector/utils.py         |   6 +-
 .../kv_transfer/kv_connector/v1/base.py       |  31 +-
 .../kv_connector/v1/multi_connector.py        |   6 +
 .../v1/shared_storage_connector.py            |   7 +-
 vllm/v1/core/block_pool.py                    |   2 +-
 vllm/v1/core/sched/output.py                  |   2 +
 vllm/v1/core/sched/scheduler.py               | 188 +++++++++-
 vllm/v1/core/single_type_kv_cache_manager.py  |   3 +
 vllm/v1/outputs.py                            |   7 +-
 vllm/v1/worker/gpu_model_runner.py            |  17 +
 vllm/v1/worker/gpu_worker.py                  |   3 +-
 .../worker/kv_connector_model_runner_mixin.py |   5 +-
 24 files changed, 1035 insertions(+), 82 deletions(-)
 create mode 100644 examples/offline_inference/kv_load_failure_recovery/README.md
 create mode 100644 examples/offline_inference/kv_load_failure_recovery/decode_example.py
 create mode 100644 examples/offline_inference/kv_load_failure_recovery/prefill_example.py
 create mode 100644 examples/offline_inference/kv_load_failure_recovery/rogue_shared_storage_connector.py
 create mode 100755 examples/offline_inference/kv_load_failure_recovery/run.sh
 create mode 100644 tests/v1/kv_connector/unit/test_kv_load_failure_recovery.py

diff --git a/examples/offline_inference/kv_load_failure_recovery/README.md b/examples/offline_inference/kv_load_failure_recovery/README.md
new file mode 100644
index 000000000000..230a16812b25
--- /dev/null
+++ b/examples/offline_inference/kv_load_failure_recovery/README.md
@@ -0,0 +1,30 @@
+# KV Load Failure Recovery Test
+
+This example builds upon the `disaggregated-prefill-v1` example in `examples/offline_inference`.
+
+It demonstrates vLLM's ability to recover from KV load failures in both synchronous and asynchronous loading modes. The goal is to verify that vLLM correctly identifies invalid KV blocks, reschedules the affected requests, and ensures successful and consistent output.
+
+## Files
+
+- `prefill_example.py` – performs the prefill stage and saves KV data (same as in `disaggregated-prefill-v1`).
+- `decode_example.py` – performs the decode stage. Accepts:
+    - `--simulate-failure`: simulates KV load failure using a custom connector.
+    - `--async-load`: enables asynchronous KV loading mode.
+- `rogue_shared_storage_connector.py` – defines `RogueSharedStorageConnector`, a subclass of `SharedStorageConnector`, that simulates missing or corrupted external KV blocks by failing to load blocks for the first decode request.
+- `run.sh` – orchestrates the test: runs the prefill stage, then three decode stages:
+    1. Normal decode (baseline).
+    2. Decode with simulated sync KV load failure.
+    3. Decode with simulated async KV load failure.
+
+    Finally, it compares the output of the baseline with the recovered outputs to verify correctness.
+
+## How It Works
+
+- The test dynamically loads `RogueSharedStorageConnector` via `KVTransferConfig.kv_connector_module_path`, enabling controlled simulation of load failures without modifying the original connector.
+- The decode stages that simulate failure are expected to trigger recovery logic in vLLM, resulting in the same output as the baseline decode.
+- If recovery fails, the script prints a unified diff of the output mismatch and exits with error.
+
+## Usage
+
+```bash
+./run.sh
diff --git a/examples/offline_inference/kv_load_failure_recovery/decode_example.py b/examples/offline_inference/kv_load_failure_recovery/decode_example.py
new file mode 100644
index 000000000000..69523f56eace
--- /dev/null
+++ b/examples/offline_inference/kv_load_failure_recovery/decode_example.py
@@ -0,0 +1,85 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import argparse
+
+from vllm import LLM, SamplingParams
+from vllm.config import KVTransferConfig
+
+
+def read_prompts():
+    """Read prompts from prefill_output.txt"""
+    prompts = []
+    try:
+        with open("prefill_output.txt") as f:
+            for line in f:
+                prompts.append(line.strip())
+        print(f"Loaded {len(prompts)} prompts from prefill_output.txt")
+        return prompts
+    except FileNotFoundError:
+        print("Error: prefill_output.txt file not found")
+        exit(-1)
+
+
+def main():
+    prompts = read_prompts()
+    sampling_params = SamplingParams(temperature=0, top_p=0.95, max_tokens=10)
+
+    parser = argparse.ArgumentParser()
+    parser.add_argument(
+        "--simulate-failure", action="store_true", help="Simulate KV load failure."
+    )
+    parser.add_argument(
+        "--async-load", action="store_true", help="Simulate async KV load"
+    )
+    args = parser.parse_args()
+
+    if args.simulate_failure:
+        ktc = KVTransferConfig(
+            kv_connector="RogueSharedStorageConnector",
+            kv_role="kv_both",
+            kv_connector_extra_config={
+                "shared_storage_path": "local_storage",
+                "async_load": args.async_load,
+            },
+            kv_connector_module_path="rogue_shared_storage_connector",
+        )
+        out_file = (
+            "async_decode_recovered_output.txt"
+            if args.async_load
+            else "sync_decode_recovered_output.txt"
+        )
+    else:
+        ktc = KVTransferConfig(
+            kv_connector="SharedStorageConnector",
+            kv_role="kv_both",
+            kv_connector_extra_config={
+                "shared_storage_path": "local_storage",
+            },
+        )
+        out_file = "decode_output.txt"
+
+    llm = LLM(
+        model="meta-llama/Llama-3.2-1B-Instruct",
+        enforce_eager=True,
+        gpu_memory_utilization=0.8,
+        max_num_batched_tokens=64,
+        max_num_seqs=16,
+        kv_transfer_config=ktc,
+    )
+
+    outputs = llm.generate(prompts, sampling_params)
+
+    sep_str = "-" * 30
+    with open(out_file, "w", encoding="utf-8") as f:
+        for output in outputs:
+            prompt = output.prompt
+            generated_text = output.outputs[0].text
+            out_str = f"Prompt: {prompt!r}\nGenerated text: {generated_text!r}"
+            print(out_str)
+            print(sep_str)
+            f.write(out_str)
+            f.write(sep_str)
+
+
+if __name__ == "__main__":
+    main()
diff --git a/examples/offline_inference/kv_load_failure_recovery/prefill_example.py b/examples/offline_inference/kv_load_failure_recovery/prefill_example.py
new file mode 100644
index 000000000000..047b81c82df5
--- /dev/null
+++ b/examples/offline_inference/kv_load_failure_recovery/prefill_example.py
@@ -0,0 +1,58 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+from vllm import LLM, SamplingParams
+from vllm.config import KVTransferConfig
+
+
+def read_prompts():
+    context = "Hi " * 1000
+    context2 = "Hey " * 500
+    return [
+        context + "Hello, my name is",
+        context + "The capital of France is",
+        context2 + "Your name is",
+        context2 + "The capital of China is",
+    ]
+
+
+def main():
+    prompts = read_prompts()
+
+    sampling_params = SamplingParams(temperature=0, top_p=0.95, max_tokens=1)
+
+    llm = LLM(
+        model="meta-llama/Llama-3.2-1B-Instruct",
+        enforce_eager=True,
+        gpu_memory_utilization=0.8,
+        kv_transfer_config=KVTransferConfig(
+            kv_connector="SharedStorageConnector",
+            kv_role="kv_both",
+            kv_connector_extra_config={"shared_storage_path": "local_storage"},
+        ),
+    )  # , max_model_len=2048, max_num_batched_tokens=2048)
+
+    # 1ST generation (prefill instance)
+    outputs = llm.generate(
+        prompts,
+        sampling_params,
+    )
+
+    new_prompts = []
+    print("-" * 30)
+    for output in outputs:
+        prompt = output.prompt
+        generated_text = output.outputs[0].text
+        new_prompts.append(prompt + generated_text)
+        print(f"Prompt: {prompt!r}\nGenerated text: {generated_text!r}")
+        print("-" * 30)
+
+    # Write new_prompts to prefill_output.txt
+    with open("prefill_output.txt", "w") as f:
+        for prompt in new_prompts:
+            f.write(prompt + "\n")
+    print(f"Saved {len(new_prompts)} prompts to prefill_output.txt")
+
+
+if __name__ == "__main__":
+    main()
diff --git a/examples/offline_inference/kv_load_failure_recovery/rogue_shared_storage_connector.py b/examples/offline_inference/kv_load_failure_recovery/rogue_shared_storage_connector.py
new file mode 100644
index 000000000000..0abe7d161261
--- /dev/null
+++ b/examples/offline_inference/kv_load_failure_recovery/rogue_shared_storage_connector.py
@@ -0,0 +1,145 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+# ruff: noqa: E501
+import logging
+from dataclasses import dataclass, field
+from typing import TYPE_CHECKING, Optional
+
+from vllm.config import VllmConfig
+from vllm.distributed.kv_transfer.kv_connector.v1.base import (
+    KVConnectorMetadata,
+    KVConnectorRole,
+)
+from vllm.distributed.kv_transfer.kv_connector.v1.shared_storage_connector import (
+    SharedStorageConnector,
+    SharedStorageConnectorMetadata,
+)
+from vllm.forward_context import ForwardContext
+from vllm.v1.core.kv_cache_manager import KVCacheBlocks
+from vllm.v1.request import Request
+
+if TYPE_CHECKING:
+    from vllm.v1.core.sched.output import SchedulerOutput
+
+logger = logging.getLogger()
+logging.basicConfig(level=logging.INFO)
+
+
+@dataclass
+class RogueSharedStorageConnectorMetadata(SharedStorageConnectorMetadata):
+    req_to_block_ids: dict[str, set[int]] = field(default_factory=dict)
+
+    @classmethod
+    def from_base(cls, base: SharedStorageConnectorMetadata):
+        return cls(requests=base.requests)
+
+
+class RogueSharedStorageConnector(SharedStorageConnector):
+    def __init__(self, vllm_config: "VllmConfig", role: KVConnectorRole):
+        super().__init__(vllm_config=vllm_config, role=role)
+        self._async_load = vllm_config.kv_transfer_config.get_from_extra_config(
+            "async_load", False
+        )
+        self._invalid_block_ids: set = None
+        self._seen_requests: set = set()
+        self._req_to_block_ids: dict[str, list[int]] = dict()
+
+    def bind_connector_metadata(self, connector_metadata: KVConnectorMetadata) -> None:
+        assert isinstance(connector_metadata, RogueSharedStorageConnectorMetadata)
+        index, failed_request = next(
+            (
+                (i, x)
+                for i, x in enumerate(connector_metadata.requests)
+                if not x.is_store
+            ),
+            (None, None),
+        )
+        if index is not None:
+            del connector_metadata.requests[index]
+            self._invalid_block_ids = set(
+                (
+                    failed_request.slot_mapping[:: self._block_size] // self._block_size
+                ).tolist()
+            )
+            logger.info(
+                "Simulating failure to load all KV blocks for the "
+                "first load request. Total blocks: %d",
+                len(self._invalid_block_ids),
+            )
+        super().bind_connector_metadata(connector_metadata)
+
+    def clear_connector_metadata(self) -> None:
+        self._invalid_block_ids = None
+        super().clear_connector_metadata()
+
+    def start_load_kv(self, forward_context: ForwardContext, **kwargs) -> None:
+        if self._async_load and forward_context.attn_metadata is None:
+            # Bypass  sanity check in super().start_load_kv
+            forward_context.attn_metadata = "None"
+
+        super().start_load_kv(forward_context, **kwargs)
+
+    def get_finished(
+        self, finished_req_ids: set[str]
+    ) -> tuple[Optional[set[str]], Optional[set[str]]]:
+        if self._async_load:
+            meta = self._get_connector_metadata()
+            assert isinstance(meta, RogueSharedStorageConnectorMetadata)
+            if meta.req_to_block_ids:
+                return None, set(meta.req_to_block_ids)
+
+        return None, None
+
+    def get_block_ids_with_load_errors(self) -> set[int]:
+        return self._invalid_block_ids
+
+    def get_num_new_matched_tokens(
+        self,
+        request: Request,
+        num_computed_tokens: int,
+    ) -> tuple[int, bool]:
+        if request.request_id in self._seen_requests:
+            return 0, False
+
+        self._seen_requests.add(request.request_id)
+
+        num_tokens, _ = super().get_num_new_matched_tokens(request, num_computed_tokens)
+        return num_tokens, self._async_load and num_tokens > 0
+
+    def update_state_after_alloc(
+        self, request: Request, blocks: KVCacheBlocks, num_external_tokens: int
+    ):
+        """
+        Update KVConnector state after block allocation.
+
+        If blocks were allocated, add to _requests_need_load,
+        such that we load the KVs in the next forward pass.
+        """
+        super().update_state_after_alloc(request, blocks, num_external_tokens)
+
+        if num_external_tokens > 0:
+            self._req_to_block_ids[request.request_id] = blocks.get_block_ids()[0]
+
+    def build_connector_meta(
+        self,
+        scheduler_output: "SchedulerOutput",
+    ) -> KVConnectorMetadata:
+        if not self._async_load:
+            base = super().build_connector_meta(scheduler_output)
+            meta = RogueSharedStorageConnectorMetadata.from_base(base)
+        else:
+            meta = RogueSharedStorageConnectorMetadata()
+            if self._requests_need_load:
+                for req_id, request in self._requests_need_load.items():
+                    meta.add_request(
+                        token_ids=request.prompt_token_ids,
+                        block_ids=self._req_to_block_ids[req_id],
+                        block_size=self._block_size,
+                        is_store=False,
+                        mm_hashes=[],
+                    )
+                # Clear state
+                self._requests_need_load.clear()
+        meta.req_to_block_ids = self._req_to_block_ids
+        self._req_to_block_ids = dict()
+        return meta
diff --git a/examples/offline_inference/kv_load_failure_recovery/run.sh b/examples/offline_inference/kv_load_failure_recovery/run.sh
new file mode 100755
index 000000000000..53fe2385d46d
--- /dev/null
+++ b/examples/offline_inference/kv_load_failure_recovery/run.sh
@@ -0,0 +1,33 @@
+#!/bin/bash
+
+# Constants
+SHARED_STORAGE_DIR="local_storage"
+PREFILL_OUTPUT="prefill_output.txt"
+DECODE_OUTPUT="decode_output.txt"
+SYNC_DECODE_RECOVERED_OUTPUT="sync_decode_recovered_output.txt"
+ASYNC_DECODE_RECOVERED_OUTPUT="async_decode_recovered_output.txt"
+
+# Cleanup
+rm -rf "$SHARED_STORAGE_DIR"
+rm -f "$PREFILL_OUTPUT" "$DECODE_OUTPUT" "$SYNC_DECODE_RECOVERED_OUTPUT" "$ASYNC_DECODE_RECOVERED_OUTPUT"
+
+# Run inference examples
+VLLM_ENABLE_V1_MULTIPROCESSING=0 CUDA_VISIBLE_DEVICES=0 python3 prefill_example.py
+VLLM_ENABLE_V1_MULTIPROCESSING=0 CUDA_VISIBLE_DEVICES=0 python3 decode_example.py
+VLLM_ENABLE_V1_MULTIPROCESSING=0 CUDA_VISIBLE_DEVICES=0 python3 decode_example.py --simulate-failure
+VLLM_ENABLE_V1_MULTIPROCESSING=0 CUDA_VISIBLE_DEVICES=0 python3 decode_example.py --simulate-failure --async-load
+
+# Compare outputs
+if ! cmp -s "$DECODE_OUTPUT" "$SYNC_DECODE_RECOVERED_OUTPUT"; then
+    echo "❌ Outputs differ: sync recovery failed."
+    diff -u "$DECODE_OUTPUT" "$SYNC_DECODE_RECOVERED_OUTPUT"
+    exit 1
+fi
+
+if ! cmp -s "$DECODE_OUTPUT" "$ASYNC_DECODE_RECOVERED_OUTPUT"; then
+    echo "❌ Outputs differ: async recovery failed."
+    diff -u "$DECODE_OUTPUT" "$ASYNC_DECODE_RECOVERED_OUTPUT"
+    exit 1
+fi
+
+echo "✅ Outputs match: recovery successful."
diff --git a/tests/v1/kv_connector/unit/test_kv_load_failure_recovery.py b/tests/v1/kv_connector/unit/test_kv_load_failure_recovery.py
new file mode 100644
index 000000000000..549e85875025
--- /dev/null
+++ b/tests/v1/kv_connector/unit/test_kv_load_failure_recovery.py
@@ -0,0 +1,341 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+from typing import Callable
+from unittest.mock import Mock
+
+import pytest
+
+from vllm.v1.core.sched.scheduler import Scheduler
+from vllm.v1.request import Request, RequestStatus
+
+from .utils import (create_model_runner_output, create_request,
+                    create_scheduler, create_vllm_config)
+
+
+def _make_get_num_new_matched_tokens(
+    req_num_new_matched_tokens: dict[str, int],
+    async_load,
+) -> Callable[[Request, int], tuple[int, bool]]:
+
+    def get_num_new_matched_tokens(request: Request,
+                                   _: int) -> tuple[int, bool]:
+        value = req_num_new_matched_tokens.get(request.request_id, 0)
+        return value, async_load
+
+    return get_num_new_matched_tokens
+
+
+@pytest.fixture
+def scheduler():
+    vllm_config = create_vllm_config()
+    return create_scheduler(vllm_config)
+
+
+@pytest.mark.parametrize(
+    "num_prompt_blocks,"
+    "num_external_computed_blocks,"
+    "invalid_block_idxs",
+    [
+        (100, 99, {0, 98}),
+        (100, 99, {50, 98}),
+        (100, 99, {98}),
+    ],
+)
+def test_async_load_failure(
+    scheduler: Scheduler,
+    num_prompt_blocks: int,
+    num_external_computed_blocks: int,
+    invalid_block_idxs: set[int],
+):
+    assert num_prompt_blocks >= num_external_computed_blocks
+
+    num_prompt_tokens = num_prompt_blocks * scheduler.block_size
+    num_external_computed_tokens = (num_external_computed_blocks *
+                                    scheduler.block_size)
+
+    request1 = create_request(num_tokens=num_prompt_tokens)
+    scheduler.add_request(request=request1)
+    request2 = create_request(num_tokens=num_prompt_tokens)
+    scheduler.add_request(request=request2)
+    request3 = create_request(num_tokens=num_prompt_tokens)
+    scheduler.add_request(request=request3)
+
+    # Mock KV connector method.
+    # req_id -> num_external_computed_tokens
+    req_num_new_matched_tokens = {
+        request1.request_id: num_external_computed_tokens,
+        request2.request_id: num_external_computed_tokens,
+        request3.request_id: num_external_computed_tokens,
+    }
+
+    scheduler.connector = Mock()
+    scheduler.connector.get_num_new_matched_tokens.side_effect = (
+        _make_get_num_new_matched_tokens(req_num_new_matched_tokens,
+                                         async_load=True))
+    scheduler.connector.take_events.return_value = ()
+
+    scheduler_output = scheduler.schedule()
+
+    assert len(scheduler.waiting) == 3
+    for request in scheduler.waiting:
+        assert request.num_computed_tokens == 0
+        assert request.status == RequestStatus.WAITING_FOR_REMOTE_KVS
+    assert scheduler.connector.get_num_new_matched_tokens.call_count == 3
+
+    # Simulate a failure in loading some of request2 blocks.
+    (req2_block_ids, ) = scheduler.kv_cache_manager.get_block_ids(
+        request2.request_id)
+    invalid_block_ids = {req2_block_ids[i] for i in invalid_block_idxs}
+    model_runner_output = create_model_runner_output(
+        reqs=[],
+        finished_recving={request1.request_id, request3.request_id},
+        invalid_block_ids=invalid_block_ids,
+        use_eos=True)
+
+    scheduler.update_from_output(scheduler_output, model_runner_output)
+
+    min_invalid_block_idx = min(invalid_block_idxs)
+
+    assert len(scheduler.waiting) == 3
+    for request in scheduler.waiting:
+        if request.request_id == request2.request_id:
+            assert request.num_computed_tokens == (min_invalid_block_idx *
+                                                   scheduler.block_size)
+        else:
+            assert request.num_computed_tokens == 0
+        assert request.status == RequestStatus.WAITING_FOR_REMOTE_KVS
+    assert scheduler.failed_recving_kv_req_ids == {request2.request_id}
+    assert scheduler.connector.get_num_new_matched_tokens.call_count == 3
+
+
+@pytest.mark.parametrize(
+    "num_prompt_blocks,"
+    "num_external_computed_blocks,"
+    "invalid_block_idxs",
+    [
+        (100, 99, {0, 98}),
+        (100, 99, {50, 98}),
+        (100, 99, {98}),
+    ],
+)
+def test_sync_load_failure(
+    scheduler: Scheduler,
+    num_prompt_blocks: int,
+    num_external_computed_blocks: int,
+    invalid_block_idxs: set[int],
+):
+    assert num_prompt_blocks >= num_external_computed_blocks
+
+    num_prompt_tokens = num_prompt_blocks * scheduler.block_size
+    num_external_computed_tokens = (num_external_computed_blocks *
+                                    scheduler.block_size)
+
+    request1 = create_request(num_tokens=num_prompt_tokens)
+    scheduler.add_request(request=request1)
+    request2 = create_request(num_tokens=num_prompt_tokens)
+    scheduler.add_request(request=request2)
+    request3 = create_request(num_tokens=num_prompt_tokens)
+    scheduler.add_request(request=request3)
+
+    # Mock KV connector method.
+    # req_id -> num_external_computed_tokens
+    req_num_new_matched_tokens = {
+        request1.request_id: num_external_computed_tokens,
+        request2.request_id: num_external_computed_tokens,
+        request3.request_id: num_external_computed_tokens,
+    }
+
+    scheduler.connector = Mock()
+    scheduler.connector.get_num_new_matched_tokens.side_effect = (
+        _make_get_num_new_matched_tokens(req_num_new_matched_tokens,
+                                         async_load=False))
+    scheduler.connector.request_finished.return_value = (False, None)
+    scheduler.connector.take_events.return_value = ()
+
+    scheduler_output = scheduler.schedule()
+
+    # req_id -> num_computed_tokens
+    expected_computed_tokens = {
+        request1.request_id: num_external_computed_tokens,
+        request2.request_id: num_external_computed_tokens,
+        request3.request_id: num_external_computed_tokens,
+    }
+
+    assert len(scheduler.running) == 3
+    assert len(scheduler_output.scheduled_new_reqs) == 3
+    for request in scheduler_output.scheduled_new_reqs:
+        assert request.num_computed_tokens == expected_computed_tokens[
+            request.req_id]
+    assert scheduler.connector.get_num_new_matched_tokens.call_count == 3
+
+    # Simulate a failure in loading some of request2 blocks.
+    req2_block_ids = scheduler_output.scheduled_new_reqs[1].block_ids[0]
+    invalid_block_ids = {req2_block_ids[i] for i in invalid_block_idxs}
+    model_runner_output = create_model_runner_output(
+        [request1, request2, request3],
+        invalid_block_ids=invalid_block_ids,
+        use_eos=True)
+
+    scheduler.update_from_output(scheduler_output, model_runner_output)
+
+    assert len(scheduler.running) == 1
+    assert scheduler.running[0].request_id == request2.request_id
+    assert scheduler.running[0].num_computed_tokens == (
+        min(invalid_block_idxs) * scheduler.block_size)
+    assert scheduler.connector.get_num_new_matched_tokens.call_count == 3
+    assert scheduler.connector.request_finished.call_count == 2
+
+
+@pytest.mark.parametrize(
+    "num_prompt_blocks,"
+    "num_external_computed_blocks,"
+    "num_common_prefix_blocks,"
+    "invalid_block_idxs",
+    [
+        (100, 99, 50, {0, 49}),
+        (100, 99, 50, {25, 49}),
+        (100, 99, 50, {49}),
+    ],
+)
+def test_sync_load_failure_with_shared_blocks(
+    scheduler: Scheduler,
+    num_prompt_blocks: int,
+    num_external_computed_blocks: int,
+    num_common_prefix_blocks: int,
+    invalid_block_idxs: set[int],
+):
+    assert (num_prompt_blocks >= num_external_computed_blocks >=
+            num_common_prefix_blocks)
+
+    num_prompt_tokens = num_prompt_blocks * scheduler.block_size
+    num_external_computed_tokens = (num_external_computed_blocks *
+                                    scheduler.block_size)
+    common_prefix_len = num_common_prefix_blocks * scheduler.block_size
+
+    request1 = create_request(num_tokens=num_prompt_tokens,
+                              common_prefix_len=common_prefix_len)
+    scheduler.add_request(request=request1)
+    request2 = create_request(num_tokens=num_prompt_tokens,
+                              common_prefix_len=common_prefix_len)
+    scheduler.add_request(request=request2)
+
+    # Mock KV connector method.
+    # req_id -> num_external_computed_tokens
+    req_num_new_matched_tokens = {
+        request1.request_id: num_external_computed_tokens,
+    }
+
+    scheduler.connector = Mock()
+    scheduler.connector.get_num_new_matched_tokens.side_effect = (
+        _make_get_num_new_matched_tokens(req_num_new_matched_tokens,
+                                         async_load=False))
+    scheduler.connector.take_events.return_value = ()
+
+    scheduler_output = scheduler.schedule()
+
+    # req_id -> num_computed_tokens
+    expected_computed_tokens = {
+        request1.request_id: num_external_computed_tokens,
+        request2.request_id: common_prefix_len,
+    }
+
+    assert len(scheduler.running) == 2
+    assert len(scheduler_output.scheduled_new_reqs) == 2
+    for request in scheduler_output.scheduled_new_reqs:
+        assert request.num_computed_tokens == expected_computed_tokens[
+            request.req_id]
+    assert scheduler.connector.get_num_new_matched_tokens.call_count == 2
+
+    # Simulate a failure in loading some of the shared blocks.
+    req1_block_ids = scheduler_output.scheduled_new_reqs[0].block_ids[0]
+    invalid_block_ids = {req1_block_ids[i] for i in invalid_block_idxs}
+    model_runner_output = create_model_runner_output(
+        [request1, request2],
+        invalid_block_ids=invalid_block_ids,
+        use_eos=True)
+
+    scheduler.update_from_output(scheduler_output, model_runner_output)
+
+    # req_id -> num_computed_tokens
+    # all the common prefix blocks will be computed by request1
+    expected_computed_tokens = {
+        request1.request_id: min(invalid_block_idxs) * scheduler.block_size,
+        request2.request_id: common_prefix_len,
+    }
+
+    assert len(scheduler.running) == 2
+    for request in scheduler.running:
+        assert request.num_computed_tokens == expected_computed_tokens[
+            request.request_id]
+    assert scheduler.connector.get_num_new_matched_tokens.call_count == 2
+
+
+@pytest.mark.parametrize(
+    "num_prompt_blocks,"
+    "num_external_computed_blocks,"
+    "invalid_block_idxs",
+    [
+        (100, 99, {0, 50, 98}),
+        (100, 99, {98, 50, 0}),
+    ],
+)
+def test_async_progressive_load_failure(
+    scheduler: Scheduler,
+    num_prompt_blocks: int,
+    num_external_computed_blocks: int,
+    invalid_block_idxs: set[int],
+):
+    assert num_prompt_blocks >= num_external_computed_blocks
+
+    num_prompt_tokens = num_prompt_blocks * scheduler.block_size
+    num_external_computed_tokens = (num_external_computed_blocks *
+                                    scheduler.block_size)
+
+    request = create_request(num_tokens=num_prompt_tokens)
+    scheduler.add_request(request=request)
+
+    # Mock KV connector method.
+    # req_id -> num_external_computed_tokens
+    req_num_new_matched_tokens = {
+        request.request_id: num_external_computed_tokens,
+    }
+
+    scheduler.connector = Mock()
+    scheduler.connector.get_num_new_matched_tokens.side_effect = (
+        _make_get_num_new_matched_tokens(req_num_new_matched_tokens,
+                                         async_load=True))
+    scheduler.connector.take_events.return_value = ()
+
+    scheduler_output = scheduler.schedule()
+
+    assert len(scheduler.waiting) == 1
+    assert scheduler.waiting.peek_request().request_id == request.request_id
+    assert request.num_computed_tokens == 0
+    assert request.status == RequestStatus.WAITING_FOR_REMOTE_KVS
+    assert scheduler.connector.get_num_new_matched_tokens.call_count == 1
+
+    min_invalid_block_idx = max(invalid_block_idxs) + 1
+    # Simulate failures when progressively loading request blocks.
+    for invalid_block_idx in invalid_block_idxs:
+        (req_block_ids, ) = scheduler.kv_cache_manager.get_block_ids(
+            request.request_id)
+        invalid_block_ids = {req_block_ids[invalid_block_idx]}
+        model_runner_output = create_model_runner_output(
+            reqs=[],
+            finished_recving=set(),
+            invalid_block_ids=invalid_block_ids,
+            use_eos=True)
+
+        scheduler.update_from_output(scheduler_output, model_runner_output)
+
+        min_invalid_block_idx = min(min_invalid_block_idx, invalid_block_idx)
+
+        assert len(scheduler.waiting) == 1
+        assert scheduler.waiting.peek_request(
+        ).request_id == request.request_id
+        assert request.num_computed_tokens == (min_invalid_block_idx *
+                                               scheduler.block_size)
+        assert request.status == RequestStatus.WAITING_FOR_REMOTE_KVS
+        assert scheduler.failed_recving_kv_req_ids == {request.request_id}
+        assert scheduler.connector.get_num_new_matched_tokens.call_count == 1
diff --git a/tests/v1/kv_connector/unit/test_offloading_connector.py b/tests/v1/kv_connector/unit/test_offloading_connector.py
index f9a4d2fb4de4..f728b25d7834 100644
--- a/tests/v1/kv_connector/unit/test_offloading_connector.py
+++ b/tests/v1/kv_connector/unit/test_offloading_connector.py
@@ -281,8 +281,8 @@ def _run(self, decoded_tokens: list[int]):
 
             model_runner_output = create_model_runner_output(
                 reqs=self.scheduler.running,
-                finished_sending=list(finished_sending),
-                finished_recving=list(finished_recving),
+                finished_sending=finished_sending,
+                finished_recving=finished_recving,
                 token_id=token_id)
 
             if self.scheduler.running:
diff --git a/tests/v1/kv_connector/unit/test_output_aggreagator.py b/tests/v1/kv_connector/unit/test_output_aggreagator.py
index 607da6425a31..8c85732297f2 100644
--- a/tests/v1/kv_connector/unit/test_output_aggreagator.py
+++ b/tests/v1/kv_connector/unit/test_output_aggreagator.py
@@ -15,26 +15,38 @@ class DummyModelRunnerOutput(ModelRunnerOutput):
 
     def __init__(self,
                  finished_sending: Optional[set[str]] = None,
-                 finished_recving: Optional[set[str]] = None):
+                 finished_recving: Optional[set[str]] = None,
+                 invalid_block_ids: Optional[set[int]] = None):
         self.kv_connector_output = KVConnectorOutput(
             finished_sending=finished_sending,
             finished_recving=finished_recving,
-        )
+            invalid_block_ids=invalid_block_ids or set())
 
     def __repr__(self):
         return (
             f"DummyModelRunnerOutput("
             f"finished_sending={self.kv_connector_output.finished_sending},"
-            f"finished_recving={self.kv_connector_output.finished_recving})")
+            f"finished_recving={self.kv_connector_output.finished_recving})"
+            f"invalid_block_ids={self.kv_connector_output.invalid_block_ids})")
 
 
 def test_aggregate_workers_output():
     aggregator = KVOutputAggregator(world_size=2)
 
+    output1 = DummyModelRunnerOutput()
+    output2 = DummyModelRunnerOutput()
+
+    aggregated = aggregator.aggregate([output1, output2])
+
+    assert aggregated is output1
+    aggregated = aggregated.kv_connector_output
+    assert aggregated.finished_sending is None
+    assert aggregated.finished_recving is None
+    assert not aggregated.invalid_block_ids
+
     output1 = DummyModelRunnerOutput(finished_sending={'req1'},
                                      finished_recving={'req2'})
-    output2 = DummyModelRunnerOutput(finished_sending=None,
-                                     finished_recving=None)
+    output2 = DummyModelRunnerOutput(invalid_block_ids={1})
 
     aggregated = aggregator.aggregate([output1, output2])
 
@@ -42,11 +54,10 @@ def test_aggregate_workers_output():
     aggregated = aggregated.kv_connector_output
     assert aggregated.finished_sending is None
     assert aggregated.finished_recving is None
+    assert aggregated.invalid_block_ids == {1}
 
-    output1 = DummyModelRunnerOutput(finished_sending=None,
-                                     finished_recving=None)
-    output2 = DummyModelRunnerOutput(finished_sending={'req1'},
-                                     finished_recving=None)
+    output1 = DummyModelRunnerOutput(invalid_block_ids={2})
+    output2 = DummyModelRunnerOutput(finished_sending={'req1'})
 
     aggregated = aggregator.aggregate([output1, output2])
 
@@ -54,11 +65,11 @@ def test_aggregate_workers_output():
     aggregated = aggregated.kv_connector_output
     assert aggregated.finished_sending == {'req1'}
     assert aggregated.finished_recving is None
+    assert aggregated.invalid_block_ids == {2}
 
-    output1 = DummyModelRunnerOutput(finished_sending=None,
-                                     finished_recving=None)
-    output2 = DummyModelRunnerOutput(finished_sending={'req1'},
-                                     finished_recving={'req2'})
+    output1 = DummyModelRunnerOutput(invalid_block_ids={3, 4})
+    output2 = DummyModelRunnerOutput(finished_recving={'req2'},
+                                     invalid_block_ids={4, 5})
 
     aggregated = aggregator.aggregate([output1, output2])
 
@@ -66,6 +77,7 @@ def test_aggregate_workers_output():
     aggregated = aggregated.kv_connector_output
     assert aggregated.finished_sending is None
     assert aggregated.finished_recving == {'req2'}
+    assert aggregated.invalid_block_ids == {3, 4, 5}
 
 
 def test_async_aggregate_workers_output():
@@ -75,10 +87,26 @@ def test_async_aggregate_workers_output():
     future2: Future[DummyModelRunnerOutput] = Future()
     result_future = aggregator.async_aggregate([future1, future2])
 
+    output1 = DummyModelRunnerOutput()
+    output2 = DummyModelRunnerOutput()
+    future1.set_result(output1)
+    future2.set_result(output2)
+
+    assert result_future.done()
+    aggregated = result_future.result()
+    assert aggregated is output1
+    aggregated = aggregated.kv_connector_output
+    assert aggregated.finished_sending is None
+    assert aggregated.finished_recving is None
+    assert not aggregated.invalid_block_ids
+
+    future1 = Future()
+    future2 = Future()
+    result_future = aggregator.async_aggregate([future1, future2])
+
     output1 = DummyModelRunnerOutput(finished_sending={'req1'},
                                      finished_recving={'req2'})
-    output2 = DummyModelRunnerOutput(finished_sending=None,
-                                     finished_recving=None)
+    output2 = DummyModelRunnerOutput(invalid_block_ids={1})
     future1.set_result(output1)
     future2.set_result(output2)
 
@@ -88,15 +116,14 @@ def test_async_aggregate_workers_output():
     aggregated = aggregated.kv_connector_output
     assert aggregated.finished_sending is None
     assert aggregated.finished_recving is None
+    assert aggregated.invalid_block_ids == {1}
 
     future1 = Future()
     future2 = Future()
     result_future = aggregator.async_aggregate([future1, future2])
 
-    output1 = DummyModelRunnerOutput(finished_sending=None,
-                                     finished_recving=None)
-    output2 = DummyModelRunnerOutput(finished_sending={'req1'},
-                                     finished_recving=None)
+    output1 = DummyModelRunnerOutput(invalid_block_ids={2})
+    output2 = DummyModelRunnerOutput(finished_sending={'req1'})
     future1.set_result(output1)
     future2.set_result(output2)
 
@@ -106,15 +133,15 @@ def test_async_aggregate_workers_output():
     aggregated = aggregated.kv_connector_output
     assert aggregated.finished_sending == {'req1'}
     assert aggregated.finished_recving is None
+    assert aggregated.invalid_block_ids == {2}
 
     future1 = Future()
     future2 = Future()
     result_future = aggregator.async_aggregate([future1, future2])
 
-    output1 = DummyModelRunnerOutput(finished_sending=None,
-                                     finished_recving=None)
-    output2 = DummyModelRunnerOutput(finished_sending={'req1'},
-                                     finished_recving={'req2'})
+    output1 = DummyModelRunnerOutput(invalid_block_ids={3, 4})
+    output2 = DummyModelRunnerOutput(finished_recving={'req2'},
+                                     invalid_block_ids={4, 5})
     future1.set_result(output1)
     future2.set_result(output2)
 
@@ -124,3 +151,4 @@ def test_async_aggregate_workers_output():
     aggregated = aggregated.kv_connector_output
     assert aggregated.finished_sending is None
     assert aggregated.finished_recving == {'req2'}
+    assert aggregated.invalid_block_ids == {3, 4, 5}
diff --git a/tests/v1/kv_connector/unit/test_remote_decode_lifecycle.py b/tests/v1/kv_connector/unit/test_remote_decode_lifecycle.py
index 79b26cf57acd..e2c4d05bba71 100644
--- a/tests/v1/kv_connector/unit/test_remote_decode_lifecycle.py
+++ b/tests/v1/kv_connector/unit/test_remote_decode_lifecycle.py
@@ -92,7 +92,7 @@ def test_basic_lifecycle():
     # (3b): execute_model()
     model_runner_output = copy.deepcopy(EMPTY_MODEL_RUNNER_OUTPUT)
     model_runner_output.kv_connector_output = KVConnectorOutput(
-        finished_sending=[request_id])
+        finished_sending={request_id})
 
     # (3c): update_from_output()
     scheduler.update_from_output(scheduler_output, model_runner_output)
@@ -139,7 +139,7 @@ def test_short_prompt_lifecycle():
     scheduler_output = scheduler.schedule()
     # Use create_model_runner_output to pass kv_connector_output along
     model_runner_output = create_model_runner_output(
-        reqs=[request], finished_sending=[request.request_id])
+        reqs=[request], finished_sending={request.request_id})
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert_scheduler_empty(scheduler)
 
@@ -195,6 +195,6 @@ def test_prefix_cache_lifecycle():
     scheduler_output = scheduler.schedule()
     model_runner_output = copy.deepcopy(EMPTY_MODEL_RUNNER_OUTPUT)
     model_runner_output.kv_connector_output = KVConnectorOutput(
-        finished_sending=[request_remote.request_id])
+        finished_sending={request_remote.request_id})
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert_scheduler_empty(scheduler)
diff --git a/tests/v1/kv_connector/unit/test_remote_prefill_lifecycle.py b/tests/v1/kv_connector/unit/test_remote_prefill_lifecycle.py
index 207cf64f4e3e..196483d76e87 100644
--- a/tests/v1/kv_connector/unit/test_remote_prefill_lifecycle.py
+++ b/tests/v1/kv_connector/unit/test_remote_prefill_lifecycle.py
@@ -78,7 +78,7 @@ def test_basic_lifecycle():
     # (2b): forward(): request finishes recv.
     model_runner_output = copy.deepcopy(EMPTY_MODEL_RUNNER_OUTPUT)
     model_runner_output.kv_connector_output = KVConnectorOutput(
-        finished_recving=[request_id])
+        finished_recving={request_id})
 
     # (2c): update_from_output():
     engine_core_outputs = scheduler.update_from_output(scheduler_output,
@@ -197,7 +197,7 @@ def test_interleaved_lifecycle():
 
     model_runner_output = create_model_runner_output(
         [request_local_a, request_local_b],
-        finished_recving=[request_remote.request_id])
+        finished_recving={request_remote.request_id})
     scheduler.update_from_output(scheduler_output, model_runner_output)
 
     # STEP 5: RECVed KVs are sent to ModelRunner.
@@ -246,16 +246,16 @@ def test_no_spurious_prefix_caching():
         request_id=1,
         block_size=BLOCK_SIZE,
         num_tokens=NUM_TOKENS,
+        common_prefix_len=NUM_TOKENS,
         do_remote_prefill=True,
-        use_all_1s_for_prompt_tokens=True,
     )
 
     request_local = create_request(
         request_id=2,
         block_size=BLOCK_SIZE,
         num_tokens=NUM_TOKENS,
+        common_prefix_len=NUM_TOKENS,
         do_remote_prefill=False,
-        use_all_1s_for_prompt_tokens=True,
     )
 
     # Schedule the remote prefill request. This should not
@@ -322,7 +322,7 @@ def test_full_block_prompt():
     scheduler_output = scheduler.schedule()
     model_runner_output = copy.deepcopy(EMPTY_MODEL_RUNNER_OUTPUT)
     model_runner_output.kv_connector_output = KVConnectorOutput(
-        finished_recving=[request_id])
+        finished_recving={request_id})
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert len(scheduler.waiting) == 1
     assert (request_id in scheduler.finished_recving_kv_req_ids)
@@ -402,7 +402,7 @@ def test_cannot_schedule_after_recv():
     # Step 3: finish recving (5 blocks in use)
     scheduler_output = scheduler.schedule()
     model_runner_output = create_model_runner_output(
-        reqs=[request_normal], finished_recving=[request_remote.request_id])
+        reqs=[request_normal], finished_recving={request_remote.request_id})
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert len(scheduler.running) == 1
     assert len(scheduler.waiting) == 1
@@ -516,7 +516,7 @@ def test_cannot_recv():
     # Step 5: finish recving (5 blocks in use)
     scheduler_output = scheduler.schedule()
     model_runner_output = create_model_runner_output(
-        reqs=[], finished_recving=[request_remote.request_id])
+        reqs=[], finished_recving={request_remote.request_id})
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert len(scheduler.running) == 0
     assert len(scheduler.waiting) == 1
diff --git a/tests/v1/kv_connector/unit/utils.py b/tests/v1/kv_connector/unit/utils.py
index de52668e3dcf..3928cdc37b9d 100644
--- a/tests/v1/kv_connector/unit/utils.py
+++ b/tests/v1/kv_connector/unit/utils.py
@@ -2,6 +2,7 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 import tempfile
 from collections import defaultdict
+from itertools import count
 from typing import Any, Callable, Optional
 
 import torch
@@ -61,12 +62,15 @@ def create_vllm_config(
     max_num_seqs: int = 16,
     max_num_batched_tokens: int = 64,
     block_size: int = 16,
+    max_model_len: int = 10000,
+    enable_chunked_prefill: bool = True,
 ) -> VllmConfig:
     """Initialize VllmConfig For Testing."""
     scheduler_config = SchedulerConfig(
         max_num_seqs=max_num_seqs,
         max_num_batched_tokens=max_num_batched_tokens,
-        max_model_len=max_num_batched_tokens,
+        max_model_len=max_model_len,
+        enable_chunked_prefill=enable_chunked_prefill,
     )
     model_config = ModelConfig(
         model=model,
@@ -117,19 +121,27 @@ def create_scheduler(
     )
 
 
+_request_count = count(1)
 _none_hash_initialized = False
 
 
-def create_request(request_id: int,
-                   num_tokens: int = 10,
-                   max_tokens: int = 16,
-                   do_remote_decode: bool = False,
-                   do_remote_prefill: bool = False,
-                   use_all_1s_for_prompt_tokens: bool = False,
-                   num_remote_blocks: int = 3,
-                   block_size: int = 16,
-                   hash_fn: Callable = sha256) -> Request:
+def create_request(
+    request_id: Optional[int] = None,
+    num_tokens: int = 10,
+    common_prefix_len=0,
+    max_tokens: int = 16,
+    do_remote_decode: bool = False,
+    do_remote_prefill: bool = False,
+    num_remote_blocks: int = 3,
+    block_size: int = 16,
+    hash_fn: Callable = sha256,
+) -> Request:
     """Make dummy request for testing."""
+    assert num_tokens >= common_prefix_len >= 0
+
+    if request_id is None:
+        request_id = next(_request_count)
+
     global _none_hash_initialized
     if not _none_hash_initialized:
         init_none_hash(hash_fn)
@@ -153,10 +165,9 @@ def create_request(request_id: int,
     max_tokens = 1 if do_remote_decode else max_tokens
     sampling_params = SamplingParams(max_tokens=max_tokens)
 
-    if use_all_1s_for_prompt_tokens:
-        prompt_token_ids = [1] * num_tokens
-    else:
-        prompt_token_ids = [i * request_id for i in range(num_tokens)]
+    common_prefix = [1] * common_prefix_len if common_prefix_len > 0 else []
+    suffix = [i * request_id for i in range(num_tokens - common_prefix_len)]
+    prompt_token_ids = common_prefix + suffix
 
     req = Request(
         request_id=f"id-{request_id}",
@@ -173,8 +184,9 @@ def create_request(request_id: int,
 
 def create_model_runner_output(
     reqs: list[Request],
-    finished_sending: Optional[list[str]] = None,
-    finished_recving: Optional[list[str]] = None,
+    finished_sending: Optional[set[str]] = None,
+    finished_recving: Optional[set[str]] = None,
+    invalid_block_ids: Optional[set[int]] = None,
     use_eos: bool = False,
     token_id: int = 0,
 ) -> ModelRunnerOutput:
@@ -189,10 +201,11 @@ def create_model_runner_output(
     sampled_token_ids = [[sampled_token] for _ in req_ids]
 
     kv_connector_output = None if (
-        finished_sending is None
-        and finished_recving is None) else KVConnectorOutput(
+        finished_sending is None and finished_recving is None
+        and invalid_block_ids is None) else KVConnectorOutput(
             finished_sending=finished_sending,
             finished_recving=finished_recving,
+            invalid_block_ids=invalid_block_ids or set(),
         )
 
     # Make output data structure.
diff --git a/tests/v1/worker/test_gpu_model_runner.py b/tests/v1/worker/test_gpu_model_runner.py
index 49a7a61e1889..23d7ce4cefa3 100644
--- a/tests/v1/worker/test_gpu_model_runner.py
+++ b/tests/v1/worker/test_gpu_model_runner.py
@@ -250,6 +250,7 @@ def test_update_states_request_resumed(model_runner, dist_init):
         new_token_ids=[[]],
         new_block_ids=([[0]], ),
         num_computed_tokens=[0],
+        num_output_tokens=[0],
     )
 
     scheduler_output = SchedulerOutput(
diff --git a/vllm/distributed/kv_transfer/kv_connector/utils.py b/vllm/distributed/kv_transfer/kv_connector/utils.py
index efa4c9abf47f..103fba41fcb4 100644
--- a/vllm/distributed/kv_transfer/kv_connector/utils.py
+++ b/vllm/distributed/kv_transfer/kv_connector/utils.py
@@ -117,7 +117,7 @@ def get_kv_connector_cache_layout():
 
 
 class KVOutputAggregator:
-    """Utility class to aggregate the output of all workers into a single 
+    """Utility class to aggregate the output of all workers into a single
     output corresponding to Rank 0 for scheduler."""
 
     def __init__(self, world_size: int):
@@ -143,6 +143,7 @@ def update_finished_set(req_ids: Optional[set[str]],
         finished_sending = set[str]()
         finished_recving = set[str]()
         aggregated_kv_connector_stats = None
+        invalid_block_ids = set[int]()
         for model_runner_output in outputs:
             output = model_runner_output.kv_connector_output
             if not output:
@@ -165,6 +166,8 @@ def update_finished_set(req_ids: Optional[set[str]],
                     aggregated_kv_connector_stats = \
                         aggregated_kv_connector_stats.aggregate(kv_connector_stats)
 
+            invalid_block_ids |= output.invalid_block_ids
+
         # select output of the worker specified by output_rank
         output = outputs[output_rank]
 
@@ -172,6 +175,7 @@ def update_finished_set(req_ids: Optional[set[str]],
             finished_sending=finished_sending or None,
             finished_recving=finished_recving or None,
             kv_connector_stats=aggregated_kv_connector_stats or None,
+            invalid_block_ids=invalid_block_ids,
         )
 
         return output
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/base.py b/vllm/distributed/kv_transfer/kv_connector/v1/base.py
index 184d0a62f2c3..e3b4bcbfd1e6 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/base.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/base.py
@@ -229,6 +229,26 @@ def get_finished(
         """
         return None, None
 
+    def get_block_ids_with_load_errors(self) -> set[int]:
+        """
+        Get the set of block IDs that failed to load.
+
+        Returns:
+            Set of block IDs that encountered load errors.
+            Empty set if no load errors occurred.
+
+        Notes:
+            - Applies to both sync- and async-loading requests.
+            - Async loading: failed blocks may be reported in any forward pass
+              up to and including the pass where the request ID is returned by
+              `get_finished()`. Even if failures occur, the request must still
+              be reported via `get_finished()`, and the failed block IDs must
+              appear here no later than that same pass.
+            - Sync loading: failed blocks should be reported in the forward
+              pass in which they are detected.
+        """
+        return set()
+
     def shutdown(self):
         """
         Shutdown the connector. This is called when the worker process
@@ -264,14 +284,21 @@ def get_num_new_matched_tokens(
 
         Returns:
             A tuple with the following elements:
-                - An optional number of tokens that can be loaded from the 
-                  external KV cache beyond what is already computed. 
+                - An optional number of tokens that can be loaded from the
+                  external KV cache beyond what is already computed.
                   If None, it means that the connector needs more time to
                   determine the number of matched tokens, and the scheduler
                   should query for this request again later.
                 - `True` if external KV cache tokens will be loaded
                   asynchronously (between scheduler steps). Must be
                   'False' if the first element is 0.
+
+        Notes:
+            The connector should only consider the largest prefix of prompt-
+            tokens for which KV cache is actually available at the time of the
+            call. If the cache cannot be loaded for some tokens (e.g., due to
+            connectivity issues or eviction), those tokens must not be taken
+            into account.
         """
         pass
 
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/multi_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/multi_connector.py
index 6836a71e58d6..a7713ba326fc 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/multi_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/multi_connector.py
@@ -189,6 +189,12 @@ def get_finished(
 
         return finished_sending or None, finished_recving or None
 
+    def get_block_ids_with_load_errors(self) -> set[int]:
+        agg_block_ids: set[int] = set()
+        for c in self._connectors:
+            agg_block_ids |= c.get_block_ids_with_load_errors()
+        return agg_block_ids
+
     # ==============================
     # Scheduler-side methods
     # ==============================
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/shared_storage_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/shared_storage_connector.py
index 48fa1a82c677..c9949d81465c 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/shared_storage_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/shared_storage_connector.py
@@ -2,7 +2,7 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 import hashlib
 import os
-from dataclasses import dataclass
+from dataclasses import dataclass, field
 from typing import TYPE_CHECKING, Any, Optional
 
 import safetensors
@@ -55,10 +55,7 @@ def make_meta(token_ids: list[int], block_ids: list[int], block_size: int,
 
 @dataclass
 class SharedStorageConnectorMetadata(KVConnectorMetadata):
-    requests: list[ReqMeta]
-
-    def __init__(self):
-        self.requests = []
+    requests: list[ReqMeta] = field(default_factory=list)
 
     def add_request(
         self,
diff --git a/vllm/v1/core/block_pool.py b/vllm/v1/core/block_pool.py
index 3cc738304821..617a724a1ad2 100644
--- a/vllm/v1/core/block_pool.py
+++ b/vllm/v1/core/block_pool.py
@@ -211,7 +211,7 @@ def cache_full_blocks(
             block_size: Number of tokens in each block.
             kv_cache_group_id: The id of the KV cache group.
         """
-        if num_cached_blocks == num_full_blocks:
+        if num_cached_blocks >= num_full_blocks:
             return
         new_full_blocks = blocks[num_cached_blocks:num_full_blocks]
         assert len(request.block_hashes) >= num_full_blocks
diff --git a/vllm/v1/core/sched/output.py b/vllm/v1/core/sched/output.py
index 209fc2a4404f..6874e713aff3 100644
--- a/vllm/v1/core/sched/output.py
+++ b/vllm/v1/core/sched/output.py
@@ -101,6 +101,7 @@ class CachedRequestData:
     new_token_ids: list[list[int]]
     new_block_ids: list[Optional[tuple[list[int], ...]]]
     num_computed_tokens: list[int]
+    num_output_tokens: list[int]
 
     @property
     def num_reqs(self) -> int:
@@ -114,6 +115,7 @@ def make_empty(cls) -> CachedRequestData:
             new_token_ids=[],
             new_block_ids=[],
             num_computed_tokens=[],
+            num_output_tokens=[],
         )
 
 
diff --git a/vllm/v1/core/sched/scheduler.py b/vllm/v1/core/sched/scheduler.py
index 8d6ea887142d..d4be1b06b3b2 100644
--- a/vllm/v1/core/sched/scheduler.py
+++ b/vllm/v1/core/sched/scheduler.py
@@ -133,6 +133,7 @@ def __init__(
 
         # KV Connector: requests in process of async KV loading or recving
         self.finished_recving_kv_req_ids: set[str] = set()
+        self.failed_recving_kv_req_ids: set[str] = set()
 
         # Encoder-related.
         # Calculate encoder cache size if applicable
@@ -671,6 +672,7 @@ def _make_cached_request_data(
         new_token_ids: list[list[int]] = []
         new_block_ids: list[Optional[tuple[list[int], ...]]] = []
         num_computed_tokens: list[int] = []
+        num_output_tokens: list[int] = []
 
         use_connector = self.connector is not None
         for req in itertools.chain(running_reqs, resumed_reqs):
@@ -695,6 +697,7 @@ def _make_cached_request_data(
             new_block_ids.append(
                 req_to_new_blocks[req_id].get_block_ids(allow_none=True))
             num_computed_tokens.append(req.num_computed_tokens)
+            num_output_tokens.append(len(req.output_token_ids))
         # Because resumed_reqs is usually empty, it is more efficient to do
         # in-place appending so that we don't need to allocate a new list.
         resumed_from_preemption = [False] * len(running_reqs)
@@ -706,6 +709,7 @@ def _make_cached_request_data(
             new_token_ids=new_token_ids,
             new_block_ids=new_block_ids,
             num_computed_tokens=num_computed_tokens,
+            num_output_tokens=num_output_tokens,
         )
 
     def _try_schedule_encoder_inputs(
@@ -878,6 +882,14 @@ def update_from_output(
         kv_connector_stats = (kv_connector_output.kv_connector_stats
                               if kv_connector_output else None)
 
+        failed_kv_load_req_ids = None
+        if kv_connector_output and kv_connector_output.invalid_block_ids:
+            # These blocks contain externally computed tokens that failed to
+            # load. Identify affected requests and adjust their computed token
+            # count to trigger recomputation of the invalid blocks.
+            failed_kv_load_req_ids = self._handle_invalid_blocks(
+                kv_connector_output.invalid_block_ids)
+
         # NOTE(woosuk): As len(num_scheduled_tokens) can be up to 1K or more,
         # the below loop can be a performance bottleneck. We should do our best
         # to avoid expensive operations inside the loop.
@@ -885,6 +897,9 @@ def update_from_output(
         stopped_preempted_reqs: set[Request] = set()
         for req_id, num_tokens_scheduled in num_scheduled_tokens.items():
             assert num_tokens_scheduled > 0
+            if failed_kv_load_req_ids and req_id in failed_kv_load_req_ids:
+                # Skip requests that were recovered from KV load failure
+                continue
             request = self.requests.get(req_id)
             if request is None:
                 # The request is already finished. This can happen if the
@@ -988,9 +1003,8 @@ def update_from_output(
             self.waiting.remove_requests(stopped_preempted_reqs)
 
         # KV Connector: update state for finished KV Transfers.
-        if model_runner_output.kv_connector_output:
-            self._update_from_kv_xfer_finished(
-                model_runner_output.kv_connector_output)
+        if kv_connector_output:
+            self._update_from_kv_xfer_finished(kv_connector_output)
 
         # Create EngineCoreOutputs for all clients that have requests with
         # outputs in this step.
@@ -1252,18 +1266,33 @@ def _update_waiting_for_remote_kv(self, request: Request) -> bool:
         if request.request_id not in self.finished_recving_kv_req_ids:
             return False
 
-        # Now that the blocks are ready, actually cache them.
-        (block_ids, ) = self.kv_cache_manager.get_block_ids(request.request_id)
-        num_computed_tokens = len(block_ids) * self.block_size
-        # Handle the case where num request tokens less than one block.
-        num_computed_tokens = min(num_computed_tokens, request.num_tokens)
-        if num_computed_tokens == request.num_tokens:
-            num_computed_tokens -= 1
-        # This will cache the blocks iff caching is enabled.
-        self.kv_cache_manager.cache_blocks(request, num_computed_tokens)
+        if request.request_id in self.failed_recving_kv_req_ids:
+            # Request had KV load failures; num_computed_tokens was already
+            # updated in _update_requests_with_invalid_blocks
+            if request.num_computed_tokens:
+                # Cache any valid computed tokens.
+                self.kv_cache_manager.cache_blocks(request,
+                                                   request.num_computed_tokens)
+            else:
+                # No valid computed tokens, release allocated blocks.
+                # There may be a local cache hit on retry.
+                self.kv_cache_manager.free(request)
 
-        # Update the request state for scheduling.
-        request.num_computed_tokens = num_computed_tokens
+            self.failed_recving_kv_req_ids.remove(request.request_id)
+        else:
+            # Now that the blocks are ready, actually cache them.
+            (block_ids, ) = self.kv_cache_manager.get_block_ids(
+                request.request_id)
+            num_computed_tokens = len(block_ids) * self.block_size
+            # Handle the case where num request tokens less than one block.
+            num_computed_tokens = min(num_computed_tokens, request.num_tokens)
+            if num_computed_tokens == request.num_tokens:
+                num_computed_tokens -= 1
+            # This will cache the blocks iff caching is enabled.
+            self.kv_cache_manager.cache_blocks(request, num_computed_tokens)
+
+            # Update the request state for scheduling.
+            request.num_computed_tokens = num_computed_tokens
 
         # Return that we are ready.
         self.finished_recving_kv_req_ids.remove(request.request_id)
@@ -1296,3 +1325,134 @@ def _update_from_kv_xfer_finished(self,
                     "but the request is already freed.", req_id)
             else:
                 self._free_blocks(self.requests[req_id])
+
+    def _update_requests_with_invalid_blocks(
+            self, requests: Iterable[Request],
+            invalid_block_ids: set[int]) -> tuple[set[str], int]:
+        """
+        Identify and update requests affected by invalid KV cache blocks.
+
+        This method scans the given requests, detects those with invalid blocks
+        and adjusts their `num_computed_tokens` to the longest valid prefix.
+        For observability, it also accumulates the total number of tokens that
+        will need to be recomputed across all affected requests.
+
+        Args:
+            requests: The set of requests to scan for invalid blocks.
+            invalid_block_ids: IDs of invalid blocks.
+
+        Returns:
+            tuple:
+                - affected_req_ids (set[str]): IDs of requests impacted by
+                invalid blocks.
+                - total_affected_tokens (int): Total number of tokens that must
+                be recomputed across all affected requests (for observability).
+        """
+        affected_req_ids: set[str] = set()
+        total_affected_tokens = 0
+        # If a block is invalid and shared by multiple requests in the batch,
+        # these requests must be rescheduled, but only the first will recompute
+        # it. This set tracks blocks already marked for recomputation.
+        marked_invalid_block_ids: set[int] = set()
+        for request in requests:
+            is_affected = False
+            marked_invalid_block = False
+            req_id = request.request_id
+            # TODO (davidb): add support for hybrid memory allocator
+            (req_block_ids, ) = self.kv_cache_manager.get_block_ids(req_id)
+            # We iterate only over blocks that may contain externally computed
+            # tokens
+            if request.status == RequestStatus.WAITING_FOR_REMOTE_KVS:
+                # Async loading. If num_computed_tokens is set it implies we
+                # already processed some block failures for it in a prior step
+                req_num_computed_tokens = (
+                    request.num_computed_tokens if req_id
+                    in self.failed_recving_kv_req_ids else len(req_block_ids) *
+                    self.block_size)
+            else:
+                # Sync loading. num_computed_tokens includes new tokens
+                req_num_computed_tokens = request.num_cached_tokens
+
+            req_num_computed_blocks = (req_num_computed_tokens +
+                                       self.block_size - 1) // self.block_size
+            for idx, block_id in zip(range(req_num_computed_blocks),
+                                     req_block_ids):
+
+                if block_id not in invalid_block_ids:
+                    continue
+
+                is_affected = True
+
+                if block_id in marked_invalid_block_ids:
+                    # This invalid block is shared with a previous request
+                    # and was already marked for recomputation.
+                    # This means this request can still consider this block
+                    # as computed when rescheduled.
+                    # Currently this only applies to sync loading; Async
+                    # loading does not yet support block sharing
+                    continue
+
+                marked_invalid_block_ids.add(block_id)
+
+                if marked_invalid_block:
+                    # This request has already marked an invalid block for
+                    # recomputation and updated its num_computed_tokens.
+                    continue
+
+                marked_invalid_block = True
+                # Truncate the computed tokens at the first failed block
+                request.num_computed_tokens = idx * self.block_size
+                total_affected_tokens += (req_num_computed_tokens -
+                                          request.num_computed_tokens)
+
+            if is_affected:
+                if not marked_invalid_block:
+                    # All invalid blocks of this request are shared with
+                    # previous requests and will be recomputed by them.
+                    # Revert to considering only cached tokens as computed.
+                    # Currently this only applies to sync loading; Async
+                    # loading does not yet support block sharing
+                    total_affected_tokens += (request.num_computed_tokens -
+                                              request.num_cached_tokens)
+                    request.num_computed_tokens = request.num_cached_tokens
+
+                affected_req_ids.add(request.request_id)
+
+        return (affected_req_ids, total_affected_tokens)
+
+    def _handle_invalid_blocks(self, invalid_block_ids: set[int]) -> set[str]:
+        total_requests_to_reschedule = 0
+        total_tokens_to_reschedule = 0
+
+        # --- Handle async KV loads (WAITING_FOR_REMOTE_KVS) ---
+        async_load_reqs = (
+            req for req in self.waiting
+            if req.status == RequestStatus.WAITING_FOR_REMOTE_KVS)
+        async_affected_req_ids, num_tokens_to_reschedule = (
+            self._update_requests_with_invalid_blocks(async_load_reqs,
+                                                      invalid_block_ids))
+
+        total_requests_to_reschedule += len(async_affected_req_ids)
+        total_tokens_to_reschedule += num_tokens_to_reschedule
+
+        # Mark requests with async KV load failures; they will be rescheduled
+        # once loading completes
+        self.failed_recving_kv_req_ids |= async_affected_req_ids
+
+        # --- Handle sync KV loads (running requests) ---
+        sync_affected_req_ids, num_tokens_to_reschedule = (
+            self._update_requests_with_invalid_blocks(self.running,
+                                                      invalid_block_ids))
+
+        total_requests_to_reschedule += len(sync_affected_req_ids)
+        total_tokens_to_reschedule += num_tokens_to_reschedule
+
+        if total_requests_to_reschedule:
+            logger.warning(
+                "Recovered from KV load failure: "
+                "%d request(s) rescheduled (%d tokens affected).",
+                total_requests_to_reschedule, total_tokens_to_reschedule)
+
+        # Return the IDs of affected running requests to skip in
+        # update_from_output.
+        return sync_affected_req_ids
diff --git a/vllm/v1/core/single_type_kv_cache_manager.py b/vllm/v1/core/single_type_kv_cache_manager.py
index e889f7804e84..4ecd9c8157e2 100644
--- a/vllm/v1/core/single_type_kv_cache_manager.py
+++ b/vllm/v1/core/single_type_kv_cache_manager.py
@@ -142,6 +142,9 @@ def cache_blocks(self, request: Request, num_tokens: int) -> None:
         num_cached_blocks = self.num_cached_block[request.request_id]
         num_full_blocks = num_tokens // self.block_size
 
+        if num_cached_blocks >= num_full_blocks:
+            return
+
         self.block_pool.cache_full_blocks(
             request=request,
             blocks=self.req_to_blocks[request.request_id],
diff --git a/vllm/v1/outputs.py b/vllm/v1/outputs.py
index 01f3676abd92..d15cdf365962 100644
--- a/vllm/v1/outputs.py
+++ b/vllm/v1/outputs.py
@@ -2,7 +2,7 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 from abc import ABC, abstractmethod
-from dataclasses import dataclass
+from dataclasses import dataclass, field
 from typing import TYPE_CHECKING, NamedTuple, Optional, Union
 
 import torch
@@ -87,10 +87,13 @@ class KVConnectorOutput:
     finished_sending: Optional[set[str]] = None
     finished_recving: Optional[set[str]] = None
     kv_connector_stats: Optional["KVConnectorStats"] = None
+    # IDs of externally computed KV blocks that failed to load.
+    # Requests referencing these blocks should be rescheduled to recompute them.
+    invalid_block_ids: set[int] = field(default_factory=set)
 
     def is_empty(self):
         return (not self.finished_sending and not self.finished_recving
-                and not self.kv_connector_stats)
+                and not self.kv_connector_stats and not self.invalid_block_ids)
 
 
 # ModelRunnerOutput is serialized and sent to the scheduler process.
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index f4c28dc24d70..9941cacae8ab 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -634,8 +634,10 @@ def _update_states(self, scheduler_output: "SchedulerOutput") -> None:
             num_computed_tokens = req_data.num_computed_tokens[i]
             new_block_ids = req_data.new_block_ids[i]
             resumed_from_preemption = req_data.resumed_from_preemption[i]
+            num_output_tokens = req_data.num_output_tokens[i]
 
             # Update the cached states.
+
             req_state.num_computed_tokens = num_computed_tokens
 
             if not is_last_rank:
@@ -653,6 +655,21 @@ def _update_states(self, scheduler_output: "SchedulerOutput") -> None:
                 elif num_new_tokens > 0:
                     req_state.output_token_ids.extend(
                         new_token_ids[-num_new_tokens:])
+            elif num_output_tokens < len(req_state.output_token_ids):
+                # Some output tokens were discarded due to a sync-KV-load
+                # failure. Align the cached state.
+                del req_state.output_token_ids[num_output_tokens:]
+
+                req_index = self.input_batch.req_id_to_index.get(req_id)
+                if req_index is not None:
+                    old_end_idx = self.input_batch.num_tokens_no_spec[
+                        req_index]
+                    end_idx = self.input_batch.num_prompt_tokens[
+                        req_index] + num_output_tokens
+                    self.input_batch.num_tokens[req_index] = end_idx
+                    self.input_batch.num_tokens_no_spec[req_index] = end_idx
+                    self.input_batch.is_token_ids[req_index,
+                                                  end_idx:old_end_idx] = False
 
             # Update the block IDs.
             if not resumed_from_preemption:
diff --git a/vllm/v1/worker/gpu_worker.py b/vllm/v1/worker/gpu_worker.py
index 8c75e8914857..a135a594ac6f 100644
--- a/vllm/v1/worker/gpu_worker.py
+++ b/vllm/v1/worker/gpu_worker.py
@@ -464,8 +464,7 @@ def execute_model(
 
         # In case of PP with kv transfer, we need to pass through the
         # kv_connector_output
-        if (not kv_connector_output.finished_sending
-                and not kv_connector_output.finished_recving):
+        if kv_connector_output.is_empty():
             return EMPTY_MODEL_RUNNER_OUTPUT
 
         output = copy.copy(EMPTY_MODEL_RUNNER_OUTPUT)
diff --git a/vllm/v1/worker/kv_connector_model_runner_mixin.py b/vllm/v1/worker/kv_connector_model_runner_mixin.py
index 7eaff924ecc1..cdc0d317fffb 100644
--- a/vllm/v1/worker/kv_connector_model_runner_mixin.py
+++ b/vllm/v1/worker/kv_connector_model_runner_mixin.py
@@ -75,8 +75,7 @@ def kv_connector_no_forward(scheduler_output: "SchedulerOutput",
                 scheduler_output, wait_for_save=False) as kv_connector_output:
             pass
 
-        if (not kv_connector_output.finished_sending
-                and not kv_connector_output.finished_recving):
+        if kv_connector_output.is_empty():
             return EMPTY_MODEL_RUNNER_OUTPUT
 
         output = copy.copy(EMPTY_MODEL_RUNNER_OUTPUT)
@@ -120,6 +119,8 @@ def _get_kv_connector_output(
 
             output.finished_sending, output.finished_recving = (
                 kv_connector.get_finished(scheduler_output.finished_req_ids))
+            output.invalid_block_ids = (
+                kv_connector.get_block_ids_with_load_errors())
 
             output.kv_connector_stats = KVConnectorModelRunnerMixin.\
             get_kv_connector_stats()

From 8e00d2ea8f103fd54fe8843d37645dc02b55c90c Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Tue, 30 Sep 2025 23:07:06 +0100
Subject: [PATCH 059/193] Add explicit pooling classes for the Transformers
 backend (#25322)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn>
Co-authored-by: Isotr0py <mozf@mail2.sysu.edu.cn>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/models/registry.py                      |   3 +-
 tests/models/test_transformers.py             |  99 ++++-----
 vllm/config/model.py                          |  33 ++-
 vllm/config/utils.py                          |  13 ++
 vllm/model_executor/models/registry.py        |   5 +-
 vllm/model_executor/models/transformers.py    |  81 +------
 .../models/transformers_pooling.py            | 200 ++++++++++++++++++
 7 files changed, 296 insertions(+), 138 deletions(-)
 create mode 100644 vllm/model_executor/models/transformers_pooling.py

diff --git a/tests/models/registry.py b/tests/models/registry.py
index b7a2514d8bc0..1068f97cb5a8 100644
--- a/tests/models/registry.py
+++ b/tests/models/registry.py
@@ -657,7 +657,8 @@ def check_available_online(
 }
 
 _TRANSFORMERS_BACKEND_MODELS = {
-    "TransformersModel": _HfExamplesInfo("Qwen/Qwen3-Embedding-0.6B"),
+    "TransformersEmbeddingModel": _HfExamplesInfo("BAAI/bge-base-en-v1.5", min_transformers_version="4.57.0.dev0"),  # noqa: E501
+    "TransformersForSequenceClassification": _HfExamplesInfo("papluca/xlm-roberta-base-language-detection", min_transformers_version="4.57.0.dev0"),  # noqa: E501
     "TransformersForCausalLM": _HfExamplesInfo("hmellor/Ilama-3.2-1B", trust_remote_code=True),  # noqa: E501
     "TransformersForMultimodalLM": _HfExamplesInfo("BAAI/Emu3-Chat-hf"),
 }
diff --git a/tests/models/test_transformers.py b/tests/models/test_transformers.py
index e4b5e7c24453..733ac8de67a3 100644
--- a/tests/models/test_transformers.py
+++ b/tests/models/test_transformers.py
@@ -9,9 +9,16 @@
 
 from ..conftest import HfRunner, VllmRunner
 from ..utils import multi_gpu_test, prep_prompts
+from .registry import HF_EXAMPLE_MODELS
 from .utils import check_embeddings_close, check_logprobs_close
 
 
+def get_model(arch: str) -> str:
+    model_info = HF_EXAMPLE_MODELS.get_hf_info(arch)
+    model_info.check_transformers_version(on_fail="skip")
+    return model_info.default
+
+
 def check_implementation(
     runner_ref: type[Union[HfRunner, VllmRunner]],
     runner_test: type[VllmRunner],
@@ -170,71 +177,47 @@ def test_embed_loading(vllm_runner, model):
 
 
 @pytest.mark.parametrize(
-    "model",
-    [
-        # Encoder model
-        "BAAI/bge-base-en-v1.5",
-    ])
-def test_embed_correctness(hf_runner, vllm_runner, example_prompts, model):
-    import transformers
-    from packaging.version import Version
-    installed = Version(transformers.__version__)
-    required = Version("4.57.0.dev0")
-    if installed < required:
-        pytest.skip("Encoder models with the Transformers backend require "
-                    f"transformers>={required}, but got {installed}")
-
-    with vllm_runner(model, max_model_len=512,
-                     model_impl="transformers") as vllm_model:
+    "arch",
+    ["TransformersEmbeddingModel", "TransformersForSequenceClassification"])
+def test_pooling(hf_runner, vllm_runner, example_prompts, arch):
+    model = get_model(arch)
+
+    vllm_kwargs = dict(
+        max_model_len=None,
+        model_impl="transformers",
+        compilation_config=dict(cudagraph_capture_sizes=[8]),
+    )
+
+    hf_kwargs = dict()
+    if arch == "TransformersEmbeddingModel":
+        hf_kwargs["is_sentence_transformer"] = True
+    elif arch == "TransformersForSequenceClassification":
+        from transformers import AutoModelForSequenceClassification
+        hf_kwargs["auto_cls"] = AutoModelForSequenceClassification
+
+    # The example_prompts has ending "\n", for example:
+    # "Write a short story about a robot that dreams for the first time.\n"
+    # sentence_transformers will strip the input texts, see:
+    # https://github.com/UKPLab/sentence-transformers/blob/v3.1.1/sentence_transformers/models/Transformer.py#L159
+    # This makes the input_ids different between hf_model and vllm_model.
+    # So we need to strip the input texts to avoid test failing.
+    example_prompts = [str(s).strip() for s in example_prompts]
+
+    with (vllm_runner(model, **vllm_kwargs) as
+          vllm_model, hf_runner(model, **hf_kwargs) as hf_model):
         model_config = vllm_model.llm.llm_engine.model_config
         assert model_config.using_transformers_backend()
 
-        vllm_outputs = vllm_model.embed(example_prompts)
-
-    with hf_runner(model, is_sentence_transformer=True) as hf_model:
-        hf_outputs = hf_model.encode(example_prompts)
+        if arch == "TransformersEmbeddingModel":
+            vllm_outputs = vllm_model.embed(example_prompts)
+            hf_outputs = hf_model.encode(example_prompts)
+        elif arch == "TransformersForSequenceClassification":
+            vllm_outputs = vllm_model.classify(example_prompts)
+            hf_outputs = hf_model.classify(example_prompts)
 
     check_embeddings_close(
         embeddings_0_lst=hf_outputs,
         embeddings_1_lst=vllm_outputs,
         name_0="hf",
         name_1="vllm",
-        tol=1e-2,
     )
-
-
-@pytest.mark.parametrize(
-    "model",
-    ["jason9693/Qwen2.5-1.5B-apeach"],
-)
-@pytest.mark.parametrize("dtype", ["float"])
-def test_classify(
-    hf_runner,
-    vllm_runner,
-    example_prompts,
-    model: str,
-    dtype: str,
-) -> None:
-    import torch
-    from transformers import AutoModelForSequenceClassification
-
-    with vllm_runner(model,
-                     max_model_len=512,
-                     dtype=dtype,
-                     model_impl="transformers") as vllm_model:
-        model_config = vllm_model.llm.llm_engine.model_config
-        assert model_config.using_transformers_backend()
-
-        vllm_outputs = vllm_model.classify(example_prompts)
-
-    with hf_runner(model,
-                   dtype=dtype,
-                   auto_cls=AutoModelForSequenceClassification) as hf_model:
-        hf_outputs = hf_model.classify(example_prompts)
-
-    for hf_output, vllm_output in zip(hf_outputs, vllm_outputs):
-        hf_output = torch.tensor(hf_output)
-        vllm_output = torch.tensor(vllm_output)
-
-        assert torch.allclose(hf_output, vllm_output,
-                              1e-3 if dtype == "float" else 1e-2)
diff --git a/vllm/config/model.py b/vllm/config/model.py
index c1392318dd8e..e9d5b58ff2c2 100644
--- a/vllm/config/model.py
+++ b/vllm/config/model.py
@@ -19,6 +19,7 @@
 from vllm.config.multimodal import (MMCacheType, MMEncoderTPMode,
                                     MultiModalConfig)
 from vllm.config.pooler import PoolerConfig
+from vllm.config.scheduler import RunnerType
 from vllm.config.utils import assert_hashable, config
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
@@ -40,7 +41,6 @@
     import vllm.model_executor.models as me_models
     from vllm.config.load import LoadConfig
     from vllm.config.parallel import ParallelConfig
-    from vllm.config.scheduler import RunnerType
     from vllm.model_executor.layers.quantization import QuantizationMethods
     from vllm.v1.sample.logits_processor import LogitsProcessor
 else:
@@ -52,13 +52,12 @@
                            "vllm.model_executor.models")
     LoadConfig = Any
     ParallelConfig = Any
-    RunnerType = Any
     QuantizationMethods = Any
     LogitsProcessor = Any
 
 logger = init_logger(__name__)
 
-RunnerOption = Literal["auto", "generate", "pooling", "draft"]
+RunnerOption = Literal["auto", RunnerType]
 ConvertType = Literal["none", "embed", "classify", "reward"]
 ConvertOption = Literal["auto", ConvertType]
 TaskOption = Literal["auto", "generate", "embedding", "embed", "classify",
@@ -668,8 +667,28 @@ def validate_model_config_after(self: "ModelConfig") -> "ModelConfig":
     def _get_transformers_backend_cls(self) -> str:
         """Determine which Transformers backend class will be used if
         `model_impl` is set to `transformers` or `auto`."""
-        if getattr(self, "runner_type", self.runner) == "pooling":
-            return "TransformersModel"
+        # Check if the architecture we're wrapping has defaults
+        runner = None
+        convert = None
+        if defaults := try_match_architecture_defaults(self.architectures[0]):
+            _, (runner, convert) = defaults
+        # Overwrite with user-specified values
+        if self.runner != "auto":
+            runner = self.runner
+        if self.convert not in {"auto", "none"}:
+            convert = self.convert
+        # Fall back to default values if still not set
+        if runner is None:
+            runner = "generate"
+        if convert in {None, "none"}:
+            convert = "embed"
+        # Resolve Transformers backend pooling classes
+        if runner == "pooling":
+            if convert == "embed":
+                return "TransformersEmbeddingModel"
+            if convert == "classify":
+                return "TransformersForSequenceClassification"
+        # Resolve Transformers backend generate classes
         if self.hf_config != self.hf_text_config:
             # If 'hf_text_config' is the same as 'hf_config'. If not, it is
             # probably a composite config, i.e. multimodal
@@ -678,7 +697,9 @@ def _get_transformers_backend_cls(self) -> str:
 
     def using_transformers_backend(self) -> bool:
         """Check if the model is using the Transformers backend class."""
-        return self.architecture == self._get_transformers_backend_cls()
+        used_cls = self._model_info.architecture
+        transformers_backend_cls = self._get_transformers_backend_cls()
+        return used_cls == transformers_backend_cls
 
     @property
     def registry(self):
diff --git a/vllm/config/utils.py b/vllm/config/utils.py
index 2da30cbf149c..d355ff3a9023 100644
--- a/vllm/config/utils.py
+++ b/vllm/config/utils.py
@@ -4,6 +4,7 @@
 import ast
 import inspect
 import textwrap
+from collections.abc import Iterable
 from dataclasses import MISSING, Field, field, fields, is_dataclass, replace
 from typing import TYPE_CHECKING, Any, Protocol, TypeVar
 
@@ -52,6 +53,18 @@ def get_field(cls: ConfigType, name: str) -> Field:
         f"{cls.__name__}.{name} must have a default value or default factory.")
 
 
+def getattr_iter(object: object, names: Iterable[str], default: Any) -> Any:
+    """
+    A helper function that retrieves an attribute from an object which may
+    have multiple possible names. This is useful when fetching attributes from
+    arbitrary `transformers.PretrainedConfig` instances.
+    """
+    for name in names:
+        if hasattr(object, name):
+            return getattr(object, name)
+    return default
+
+
 def contains_object_print(text: str) -> bool:
     """
     Check if the text looks like a printed Python object, e.g.
diff --git a/vllm/model_executor/models/registry.py b/vllm/model_executor/models/registry.py
index 732181265a97..eb572dc30810 100644
--- a/vllm/model_executor/models/registry.py
+++ b/vllm/model_executor/models/registry.py
@@ -307,9 +307,10 @@
 }
 
 _TRANSFORMERS_BACKEND_MODELS = {
-    "TransformersModel": ("transformers", "TransformersModel"),
+    "TransformersEmbeddingModel": ("transformers_pooling", "TransformersEmbeddingModel"),  # noqa: E501
+    "TransformersForSequenceClassification": ("transformers_pooling", "TransformersForSequenceClassification"),  # noqa: E501
     "TransformersForCausalLM": ("transformers", "TransformersForCausalLM"),
-    "TransformersForMultimodalLM": ("transformers", "TransformersForMultimodalLM"), # noqa: E501
+    "TransformersForMultimodalLM": ("transformers", "TransformersForMultimodalLM"),  # noqa: E501
 }
 # yapf: enable
 
diff --git a/vllm/model_executor/models/transformers.py b/vllm/model_executor/models/transformers.py
index 00d87f560e70..d168398aa182 100644
--- a/vllm/model_executor/models/transformers.py
+++ b/vllm/model_executor/models/transformers.py
@@ -31,6 +31,7 @@
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import (CacheConfig, DeviceConfig, ModelConfig,
                          ParallelConfig, VllmConfig)
+from vllm.config.utils import getattr_iter
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.distributed.utils import get_pp_indices
 from vllm.logger import init_logger
@@ -486,10 +487,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         # Input embeddings
         if not isinstance(self.model.get_input_embeddings(), PPMissingLayer):
+            names = ("embedding_size", "hidden_size")
+            embedding_dim = getattr_iter(self.text_config, names, None)
+            assert embedding_dim is not None
             self.model.set_input_embeddings(
                 VocabParallelEmbedding(
                     self.text_config.vocab_size,
-                    self.text_config.hidden_size,
+                    embedding_dim=embedding_dim,
                     org_num_embeddings=self.text_config.vocab_size,
                     quant_config=self.quant_config,
                 ))
@@ -645,7 +649,9 @@ def create_attention_instances(
                 attn_type=attn_type)
         return attention_instances
 
-    def init_parameters(self, module: nn.Module):
+    def init_parameters(self,
+                        module: nn.Module,
+                        dtype: Optional[torch.dtype] = None):
         """
         If a `parameter` is on the `meta` device, then its parent
         `module` is the original module created by:
@@ -659,11 +665,11 @@ def init_parameters(self, module: nn.Module):
             if param.device == torch.device("meta"):
                 new_param = nn.Parameter(
                     torch.empty_like(param.data,
-                                     dtype=self.model_config.dtype,
+                                     dtype=dtype or self.model_config.dtype,
                                      device=self.device_config.device))
                 setattr(module, name, new_param)
         for child in module.children():
-            self.init_parameters(child)
+            self.init_parameters(child, dtype)
 
     def forward(
         self,
@@ -712,73 +718,6 @@ def load_weights(self, weights: Iterable[tuple[str,
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
 
-@support_torch_compile(enable_if=can_enable_torch_compile)
-class TransformersModel(TransformersBase):
-    hf_to_vllm_mapper = WeightsMapper(
-        orig_to_new_prefix={
-            # Handle BERT-like models
-            "bert": "model",
-            # Add `model.` prefix for base model checkpoints
-            "": "model.",
-            # Remove `model.` prefix if it was already there
-            "model.model.": "model.",
-            # Pooling adapters will be adjacent to `model`
-            "model.pooler": "pooler",
-            "model.score": "score",
-            # Classifier adapter's classifier layer is renamed to score
-            "model.classifier": "score",
-        },
-        orig_to_new_suffix={
-            # Replace legacy suffixes used for norms
-            ".gamma": ".weight",
-            ".beta": ".bias",
-        })
-
-    def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
-        super().__init__(vllm_config=vllm_config, prefix=prefix)
-
-        # After creating a pooling model, `pooler` will be duplicated.
-        # The one inside `model` comes from the Transformers modelling code.
-        # The one after `model` is an adapter from vLLM.
-        # We want to use the adapter so we nullify the original pooler.
-        if getattr(self.model, "pooler", None) is not None:
-            self.skip_prefixes.append("pooler.")
-            self.model.pooler = torch.nn.Identity()
-
-        # Some encoder models have the position_ids buffer in the checkpoint.
-        # vLLM will always pass position_ids as an argument, so we skip loading
-        # the buffer if it exists
-        self.skip_substrs.append("position_ids")
-
-        # Some encoder models have the bias of the final classifier layer
-        # in the checkpoint. vLLM does not use this bias, so we skip loading
-        # it if it exists
-        self.skip_substrs.append("score.bias")
-
-    def create_attention_instances(
-            self, attn_type: AttentionType = AttentionType.DECODER):
-        # TODO(hmellor): Better way to detect encoder models
-        # In encoder models, the attention layers will have `is_causal=False`
-        is_encoder = lambda m: not getattr(m, "is_causal", True)
-        # vLLM does not support encoder-decoder models, so if any encoder layer
-        # is found, we assume the whole model is an encoder model
-        if any(is_encoder(m) for m in self.model.modules()):
-            attn_type = AttentionType.ENCODER_ONLY
-
-        # Check minimum transformers version for encoder models support
-        if attn_type == AttentionType.ENCODER_ONLY:
-            import transformers
-            from packaging.version import Version
-            installed = Version(transformers.__version__)
-            required = Version("4.57.0.dev0")
-            if installed < required:
-                raise ValueError(
-                    "Encoder models with the Transformers backend require "
-                    f"transformers>={required}, but got {installed}")
-
-        return super().create_attention_instances(attn_type)
-
-
 @support_torch_compile(enable_if=can_enable_torch_compile)
 class TransformersForCausalLM(TransformersBase):
 
diff --git a/vllm/model_executor/models/transformers_pooling.py b/vllm/model_executor/models/transformers_pooling.py
new file mode 100644
index 000000000000..7e262ade156a
--- /dev/null
+++ b/vllm/model_executor/models/transformers_pooling.py
@@ -0,0 +1,200 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+# Copyright 2024 The vLLM team.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+"""Wrapper around `transformers` models for pooling tasks."""
+from typing import Optional, Union
+
+import torch
+from transformers import AutoModelForSequenceClassification
+
+from vllm.attention import AttentionType
+from vllm.compilation.decorators import support_torch_compile
+from vllm.config import VllmConfig
+from vllm.model_executor.layers.pooler import (ClassifierPooler, CLSPool,
+                                               DispatchPooler, Pooler)
+from vllm.sequence import IntermediateTensors
+
+from .interfaces_base import VllmModelForPooling
+from .transformers import TransformersBase, can_enable_torch_compile
+from .utils import WeightsMapper
+
+
+class TransformersPoolingBase(TransformersBase, VllmModelForPooling):
+    hf_to_vllm_mapper = WeightsMapper(
+        # These are applied in order, so the order matters!
+        orig_to_new_prefix={
+            # Handle BERT-like models
+            "roberta": "model",
+            "bert": "model",
+            # Add `model.` prefix for base model checkpoints
+            "": "model.",
+            # Remove `model.` prefix if it was already there
+            "model.model.": "model.",
+            # Classifier/scoring heads will be adjacent to `model`
+            "model.score": "classifier",
+            "model.classifier": "classifier",
+        },
+        orig_to_new_suffix={
+            # Replace legacy suffixes used for norms
+            ".gamma": ".weight",
+            ".beta": ".bias",
+        })
+
+    def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
+        super().__init__(vllm_config=vllm_config, prefix=prefix)
+
+        # Skip unsupported/unwanted output embeddings layers
+        self.skip_prefixes.extend([
+            "model.lm_head.", "model.predictions.", "model.qa_outputs.",
+            "model.embeddings_project.", "model.discriminator_predictions."
+        ])
+
+        # Some encoder models have the position_ids buffer in the checkpoint.
+        # vLLM will always pass position_ids as an argument, so we skip loading
+        # the buffer if it exists
+        self.skip_substrs.append("position_ids")
+
+        # Some encoder models have the bias of the final classifier layer
+        # in the checkpoint. vLLM does not use this bias, so we skip loading
+        # it if it exists
+        self.skip_substrs.append("score.bias")
+
+        # roberta-like models an extra padding in positions.
+        # FIXME(Isotr0py): This is quite hacky for roberta edge case,
+        # we should find a better way to handle this.
+        self.is_roberta = "roberta" in self.text_config.model_type
+        self.padding_idx = self.text_config.pad_token_id
+
+    def create_attention_instances(
+            self, attn_type: AttentionType = AttentionType.DECODER):
+        # TODO(hmellor): Better way to detect encoder models
+        # In encoder models, the attention layers will have `is_causal=False`
+        is_encoder = lambda m: not getattr(m, "is_causal", True)
+        # vLLM does not support encoder-decoder models, so if any encoder layer
+        # is found, we assume the whole model is an encoder model
+        if any(is_encoder(m) for m in self.model.modules()):
+            attn_type = AttentionType.ENCODER_ONLY
+
+        # Check minimum transformers version for encoder models support
+        if attn_type == AttentionType.ENCODER_ONLY:
+            import transformers
+            from packaging.version import Version
+            installed = Version(transformers.__version__)
+            required = Version("4.57.0.dev0")
+            if installed < required:
+                raise ValueError(
+                    "Encoder models with the Transformers backend require "
+                    f"transformers>={required}, but got {installed}")
+
+        return super().create_attention_instances(attn_type)
+
+    def forward(
+        self,
+        input_ids: Optional[torch.Tensor],
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+    ) -> Union[torch.Tensor, IntermediateTensors]:
+        if self.is_roberta:
+            # RoBERTa-specific positions padding
+            positions += self.padding_idx + 1
+        return super().forward(input_ids=input_ids,
+                               positions=positions,
+                               intermediate_tensors=intermediate_tensors,
+                               inputs_embeds=inputs_embeds)
+
+
+@support_torch_compile(enable_if=can_enable_torch_compile)
+class TransformersEmbeddingModel(TransformersPoolingBase):
+    default_pooling_type = "CLS"
+
+    def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
+        super().__init__(vllm_config=vllm_config, prefix=prefix)
+
+        pooler_config = vllm_config.model_config.pooler_config
+        assert pooler_config is not None
+
+        self.pooler = DispatchPooler({
+            "encode": Pooler.for_encode(pooler_config),
+            "embed": Pooler.for_embed(pooler_config),
+        })
+
+
+@support_torch_compile(enable_if=can_enable_torch_compile)
+class TransformersForSequenceClassification(TransformersPoolingBase):
+    default_pooling_type = "CLS"
+
+    def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
+        super().__init__(vllm_config=vllm_config, prefix=prefix)
+
+        pooler_config = vllm_config.model_config.pooler_config
+        assert pooler_config is not None
+
+        # Certain information about the the model and classifier can only be
+        # inferred from the `ForSequenceClassification` class. Therefore, we
+        # instantiate it on the "meta" device to avoid allocating GPU memory.
+        with torch.device("meta"):
+            seq_cls_model = AutoModelForSequenceClassification.from_config(
+                self.config,
+                torch_dtype=self.model_config.dtype,
+                trust_remote_code=self.model_config.trust_remote_code,
+            )
+
+        # When used for sequence classification, some models have their
+        # pooling layers removed. Make sure this is reflected in vLLM.
+        for module in seq_cls_model.modules():
+            if hasattr(module, "pooler") and module.pooler is None:
+                self.model.pooler = None
+                break
+        if self.model.pooler is not None:
+            raise ValueError(
+                "Sequence classification models with pooling layers are not "
+                "supported yet in the Transformers backend.")
+
+        # Unlike `lm_head`, `classifier` is not always `nn.Linear`.
+        self.classifier = seq_cls_model.classifier
+        self.init_parameters(self.classifier,
+                             dtype=self.model_config.head_dtype)
+
+        class ClassifierWithReshape(self.classifier.__class__):
+            """CLSPool has already been applied in `pooling`.
+            Add dim to match expected input shape of `classifier.forward`."""
+
+            def forward(self, *args, **kwargs):
+                if len(args) > 0:
+                    args = (args[0].unsqueeze(1), *args[1:])
+                return super().forward(*args, **kwargs)
+
+        self.classifier.__class__ = ClassifierWithReshape
+
+        self.pooler = DispatchPooler({
+            "encode":
+            Pooler.for_encode(pooler_config),
+            "classify":
+            ClassifierPooler(
+                pooling=CLSPool(),
+                classifier=self.classifier,
+                act_fn=ClassifierPooler.act_fn_for_seq_cls(
+                    vllm_config.model_config),
+            ),
+            "score":
+            ClassifierPooler(
+                pooling=CLSPool(),
+                classifier=self.classifier,
+                act_fn=ClassifierPooler.act_fn_for_cross_encoder(
+                    vllm_config.model_config),
+            ),
+        })

From 8071c5a320bec706860415e91dfbac4445fa1151 Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Tue, 30 Sep 2025 23:10:02 +0100
Subject: [PATCH 060/193] [Docs] Remove API Reference from search index
 (#25949)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/api/vllm/.meta.yml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/docs/api/vllm/.meta.yml b/docs/api/vllm/.meta.yml
index c15adfec644c..d105540fee79 100644
--- a/docs/api/vllm/.meta.yml
+++ b/docs/api/vllm/.meta.yml
@@ -1,2 +1,2 @@
 search:
-  boost: 0.5
+  exclude: true

From edf0b6e7658027efd8f408d4293f30dc26e39832 Mon Sep 17 00:00:00 2001
From: Andrew Xia <axia@mit.edu>
Date: Tue, 30 Sep 2025 15:47:07 -0700
Subject: [PATCH 061/193] [gpt-oss] use vLLM instead of openai types for
 streaming (#25186)

Signed-off-by: Andrew Xia <axia@meta.com>
Signed-off-by: Andrew Xia <axia@fb.com>
Co-authored-by: Andrew Xia <axia@fb.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../openai/test_response_api_with_harmony.py  |  8 +++
 vllm/entrypoints/openai/protocol.py           | 50 ++++++++++++++-----
 vllm/entrypoints/openai/serving_responses.py  | 23 +++++----
 3 files changed, 59 insertions(+), 22 deletions(-)

diff --git a/tests/entrypoints/openai/test_response_api_with_harmony.py b/tests/entrypoints/openai/test_response_api_with_harmony.py
index c28970afc731..b882a2f9326e 100644
--- a/tests/entrypoints/openai/test_response_api_with_harmony.py
+++ b/tests/entrypoints/openai/test_response_api_with_harmony.py
@@ -379,6 +379,14 @@ async def test_streaming(client: OpenAI, model_name: str, background: bool):
             if event.type == "response.created":
                 resp_id = event.response.id
 
+            # test vllm custom types are in the response
+            if event.type in [
+                    "response.completed", "response.in_progress",
+                    "response.created"
+            ]:
+                assert 'input_messages' in event.response.model_extra
+                assert 'output_messages' in event.response.model_extra
+
             if current_event_mode != event.type:
                 current_event_mode = event.type
                 print(f"\n[{event.type}] ", end="", flush=True)
diff --git a/vllm/entrypoints/openai/protocol.py b/vllm/entrypoints/openai/protocol.py
index 8829fa4886f6..9d51372887c2 100644
--- a/vllm/entrypoints/openai/protocol.py
+++ b/vllm/entrypoints/openai/protocol.py
@@ -17,20 +17,32 @@
     ChatCompletionAudio as OpenAIChatCompletionAudio)
 from openai.types.chat.chat_completion_message import (
     Annotation as OpenAIAnnotation)
-# yapf: enable
 from openai.types.responses import (
     ResponseCodeInterpreterCallCodeDeltaEvent,
     ResponseCodeInterpreterCallCodeDoneEvent,
     ResponseCodeInterpreterCallCompletedEvent,
     ResponseCodeInterpreterCallInProgressEvent,
-    ResponseCodeInterpreterCallInterpretingEvent, ResponseCompletedEvent,
-    ResponseContentPartAddedEvent, ResponseContentPartDoneEvent,
-    ResponseCreatedEvent, ResponseFunctionToolCall, ResponseInProgressEvent,
-    ResponseInputItemParam, ResponseOutputItem, ResponseOutputItemAddedEvent,
-    ResponseOutputItemDoneEvent, ResponsePrompt, ResponseReasoningItem,
-    ResponseReasoningTextDeltaEvent, ResponseReasoningTextDoneEvent,
-    ResponseStatus, ResponseWebSearchCallCompletedEvent,
-    ResponseWebSearchCallInProgressEvent, ResponseWebSearchCallSearchingEvent)
+    ResponseCodeInterpreterCallInterpretingEvent)
+from openai.types.responses import (
+    ResponseCompletedEvent as OpenAIResponseCompletedEvent)
+from openai.types.responses import (ResponseContentPartAddedEvent,
+                                    ResponseContentPartDoneEvent)
+from openai.types.responses import (
+    ResponseCreatedEvent as OpenAIResponseCreatedEvent)
+from openai.types.responses import ResponseFunctionToolCall
+from openai.types.responses import (
+    ResponseInProgressEvent as OpenAIResponseInProgressEvent)
+from openai.types.responses import (ResponseInputItemParam, ResponseOutputItem,
+                                    ResponseOutputItemAddedEvent,
+                                    ResponseOutputItemDoneEvent,
+                                    ResponsePrompt, ResponseReasoningItem,
+                                    ResponseReasoningTextDeltaEvent,
+                                    ResponseReasoningTextDoneEvent,
+                                    ResponseStatus,
+                                    ResponseWebSearchCallCompletedEvent,
+                                    ResponseWebSearchCallInProgressEvent,
+                                    ResponseWebSearchCallSearchingEvent)
+# yapf: enable
 from openai.types.responses.response_reasoning_item import (
     Content as ResponseReasoningTextContent)
 
@@ -2077,10 +2089,24 @@ class ResponseReasoningPartAddedEvent(OpenAIBaseModel):
     """The type of the event. Always `response.reasoning_part.added`."""
 
 
+# vLLM Streaming Events
+# Note: we override the response type with the vLLM ResponsesResponse type
+class ResponseCompletedEvent(OpenAIResponseCompletedEvent):
+    response: ResponsesResponse  # type: ignore[override]
+
+
+class ResponseCreatedEvent(OpenAIResponseCreatedEvent):
+    response: ResponsesResponse  # type: ignore[override]
+
+
+class ResponseInProgressEvent(OpenAIResponseInProgressEvent):
+    response: ResponsesResponse  # type: ignore[override]
+
+
 StreamingResponsesResponse: TypeAlias = Union[
-    ResponseCreatedEvent,
-    ResponseInProgressEvent,
-    ResponseCompletedEvent,
+    "ResponseCreatedEvent",
+    "ResponseInProgressEvent",
+    "ResponseCompletedEvent",
     ResponseOutputItemAddedEvent,
     ResponseOutputItemDoneEvent,
     ResponseContentPartAddedEvent,
diff --git a/vllm/entrypoints/openai/serving_responses.py b/vllm/entrypoints/openai/serving_responses.py
index c70baba88d43..eaeab3360c60 100644
--- a/vllm/entrypoints/openai/serving_responses.py
+++ b/vllm/entrypoints/openai/serving_responses.py
@@ -22,16 +22,16 @@
     ResponseCodeInterpreterCallCompletedEvent,
     ResponseCodeInterpreterCallInProgressEvent,
     ResponseCodeInterpreterCallInterpretingEvent,
-    ResponseCodeInterpreterToolCallParam, ResponseCompletedEvent,
-    ResponseContentPartAddedEvent, ResponseContentPartDoneEvent,
-    ResponseCreatedEvent, ResponseFunctionToolCall, ResponseFunctionWebSearch,
-    ResponseInProgressEvent, ResponseOutputItem, ResponseOutputItemAddedEvent,
-    ResponseOutputItemDoneEvent, ResponseOutputMessage, ResponseOutputText,
-    ResponseReasoningItem, ResponseReasoningTextDeltaEvent,
-    ResponseReasoningTextDoneEvent, ResponseStatus, ResponseTextDeltaEvent,
-    ResponseTextDoneEvent, ResponseWebSearchCallCompletedEvent,
-    ResponseWebSearchCallInProgressEvent, ResponseWebSearchCallSearchingEvent,
-    response_function_web_search, response_text_delta_event)
+    ResponseCodeInterpreterToolCallParam, ResponseContentPartAddedEvent,
+    ResponseContentPartDoneEvent, ResponseFunctionToolCall,
+    ResponseFunctionWebSearch, ResponseOutputItem,
+    ResponseOutputItemAddedEvent, ResponseOutputItemDoneEvent,
+    ResponseOutputMessage, ResponseOutputText, ResponseReasoningItem,
+    ResponseReasoningTextDeltaEvent, ResponseReasoningTextDoneEvent,
+    ResponseStatus, ResponseTextDeltaEvent, ResponseTextDoneEvent,
+    ResponseWebSearchCallCompletedEvent, ResponseWebSearchCallInProgressEvent,
+    ResponseWebSearchCallSearchingEvent, response_function_web_search,
+    response_text_delta_event)
 from openai.types.responses.response_output_text import (Logprob,
                                                          LogprobTopLogprob)
 # yapf: enable
@@ -58,6 +58,9 @@
                                               InputTokensDetails,
                                               OutputTokensDetails,
                                               RequestResponseMetadata,
+                                              ResponseCompletedEvent,
+                                              ResponseCreatedEvent,
+                                              ResponseInProgressEvent,
                                               ResponseReasoningPartAddedEvent,
                                               ResponseReasoningPartDoneEvent,
                                               ResponsesRequest,

From 4ba37053917c88b82e1a25c5a60d858b9ae53f81 Mon Sep 17 00:00:00 2001
From: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Date: Tue, 30 Sep 2025 19:38:34 -0400
Subject: [PATCH 062/193] [Misc] Make EP kernels install script support uv
 (#25785)

Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tools/ep_kernels/install_python_libraries.sh | 12 +++++++-----
 1 file changed, 7 insertions(+), 5 deletions(-)

diff --git a/tools/ep_kernels/install_python_libraries.sh b/tools/ep_kernels/install_python_libraries.sh
index 59bfe69dc0dd..5a3d734190c1 100644
--- a/tools/ep_kernels/install_python_libraries.sh
+++ b/tools/ep_kernels/install_python_libraries.sh
@@ -10,8 +10,12 @@ if [ ! -d "$WORKSPACE" ]; then
     mkdir -p $WORKSPACE
 fi
 
+# configurable pip command (default: pip3)
+PIP_CMD=${PIP_CMD:-pip3}
+CUDA_HOME=${CUDA_HOME:-/usr/local/cuda}
+
 # install dependencies if not installed
-pip3 install cmake torch ninja
+$PIP_CMD install cmake torch ninja
 
 # build nvshmem
 pushd $WORKSPACE
@@ -110,9 +114,7 @@ clone_repo() {
 pushd $WORKSPACE
 clone_repo "https://github.com/ppl-ai/pplx-kernels" "pplx-kernels" "setup.py" "c336faf"
 cd pplx-kernels
-# see https://github.com/pypa/pip/issues/9955#issuecomment-838065925
-# PIP_NO_BUILD_ISOLATION=0 disables build isolation
-PIP_NO_BUILD_ISOLATION=0 pip install -vvv -e  .
+$PIP_CMD install --no-build-isolation -vvv -e .
 popd
 
 # build and install deepep, require pytorch installed
@@ -120,5 +122,5 @@ pushd $WORKSPACE
 clone_repo "https://github.com/deepseek-ai/DeepEP" "DeepEP" "setup.py" "e3908bf"
 cd DeepEP
 export NVSHMEM_DIR=$WORKSPACE/nvshmem_install
-PIP_NO_BUILD_ISOLATION=0 pip install -vvv -e  .
+$PIP_CMD install --no-build-isolation -vvv -e .
 popd

From 670382af18bfb0265052a07800c0056f5e6f2763 Mon Sep 17 00:00:00 2001
From: Lucia Fang <116399278+luccafong@users.noreply.github.com>
Date: Tue, 30 Sep 2025 18:53:22 -0700
Subject: [PATCH 063/193] [Model] MTP fallback to eager for DeepSeek v32
 (#25982)

Signed-off-by: Lu Fang <fanglu@fb.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/v1/spec_decode/test_eagle.py        | 11 ++++++++++-
 tests/v1/spec_decode/test_mtp.py          |  8 +++++++-
 vllm/config/speculative.py                |  8 +++++++-
 vllm/v1/attention/backends/mla/indexer.py |  2 +-
 vllm/v1/spec_decode/eagle.py              |  8 +++++++-
 5 files changed, 32 insertions(+), 5 deletions(-)

diff --git a/tests/v1/spec_decode/test_eagle.py b/tests/v1/spec_decode/test_eagle.py
index 690732eb1232..49311c0005e7 100644
--- a/tests/v1/spec_decode/test_eagle.py
+++ b/tests/v1/spec_decode/test_eagle.py
@@ -337,13 +337,19 @@ def test_load_model(mock_get_model, mock_get_layers, mock_get_pp_group, method,
         "target_attn_1": mock.MagicMock(),
         "target_attn_2": mock.MagicMock()
     }
+    target_indx_layers: dict[str, mock.MagicMock] = {}
     # Draft model has one extra attention layer compared to target model
     all_attn_layers = {
         **target_attn_layers, "draft_extra_attn": mock.MagicMock()
     }
 
+    all_indx_layers: dict[str, mock.MagicMock] = {}
+
     # Make mock_get_layers return different values for each call
-    mock_get_layers.side_effect = [target_attn_layers, all_attn_layers]
+    mock_get_layers.side_effect = [
+        target_attn_layers, target_indx_layers, all_attn_layers,
+        all_indx_layers
+    ]
 
     # Setup mock for pp group to return the appropriate value for world size
     mock_pp_group = mock.MagicMock()
@@ -658,6 +664,9 @@ def create_deterministic_logits(token_ids, k: int):
     # Mock runner for attention metadata building.
     proposer.runner = mock.MagicMock()
     proposer.runner.attn_groups.append([mock.MagicMock()])
+    proposer.runner.attn_groups[0][0].metadata_builders = [
+        attn_metadata_builder
+    ]
     proposer.runner.attn_groups[0][0].get_metadata_builder.return_value = \
         attn_metadata_builder
     proposer._get_attention_metadata_builder = mock.MagicMock(
diff --git a/tests/v1/spec_decode/test_mtp.py b/tests/v1/spec_decode/test_mtp.py
index e4881859ece1..5b9ccfc3f48b 100644
--- a/tests/v1/spec_decode/test_mtp.py
+++ b/tests/v1/spec_decode/test_mtp.py
@@ -63,7 +63,13 @@ def test_mtp_load_model_unified(mock_get_model, mock_get_layers,
 
     target_attn_layers = {"target_attn_1": mock.MagicMock()}
     all_attn_layers = {**target_attn_layers, "draft_attn_1": mock.MagicMock()}
-    mock_get_layers.side_effect = [target_attn_layers, all_attn_layers]
+    target_indexer_layers: dict = {}
+    all_indexer_layers: dict = {}
+
+    mock_get_layers.side_effect = [
+        target_attn_layers, target_indexer_layers, all_attn_layers,
+        all_indexer_layers
+    ]
 
     mock_pp_group = mock.MagicMock()
     mock_pp_group.world_size = 1
diff --git a/vllm/config/speculative.py b/vllm/config/speculative.py
index f684e4e4ccd4..d5c6d1d4d866 100644
--- a/vllm/config/speculative.py
+++ b/vllm/config/speculative.py
@@ -41,7 +41,8 @@
 @dataclass
 class SpeculativeConfig:
     """Configuration for speculative decoding."""
-
+    enforce_eager: Optional[bool] = None
+    """Override the default enforce_eager from model_config"""
     # General speculative decoding control
     num_speculative_tokens: SkipValidation[int] = None  # type: ignore
     """The number of speculative tokens, if provided. It will default to the
@@ -219,6 +220,11 @@ def __post_init__(self):
                 assert (
                     self.target_model_config
                     is not None), "target_model_config must be present for mtp"
+                if self.target_model_config.hf_text_config.model_type \
+                    == "deepseek_v32":
+                    # FIXME(luccafong): cudgraph with v32 MTP is not supported,
+                    # remove this when the issue is fixed.
+                    self.enforce_eager = True
                 # use the draft model from the same model:
                 self.model = self.target_model_config.model
                 # Align the quantization of draft model for cases such as
diff --git a/vllm/v1/attention/backends/mla/indexer.py b/vllm/v1/attention/backends/mla/indexer.py
index 4e6b974ad74d..e87b51b15191 100644
--- a/vllm/v1/attention/backends/mla/indexer.py
+++ b/vllm/v1/attention/backends/mla/indexer.py
@@ -171,7 +171,7 @@ def get_max_prefill_buffer_size(vllm_config: VllmConfig):
 
 class DeepseekV32IndexerMetadataBuilder(AttentionMetadataBuilder):
     cudagraph_support: ClassVar[AttentionCGSupport] = \
-        AttentionCGSupport.UNIFORM_BATCH
+        AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
 
     reorder_batch_threshold: int = 1
 
diff --git a/vllm/v1/spec_decode/eagle.py b/vllm/v1/spec_decode/eagle.py
index bb11a543fd8b..dc6db0138806 100644
--- a/vllm/v1/spec_decode/eagle.py
+++ b/vllm/v1/spec_decode/eagle.py
@@ -50,6 +50,7 @@ def __init__(
     ):
         self.vllm_config = vllm_config
         self.speculative_config = vllm_config.speculative_config
+        assert self.speculative_config is not None
         self.draft_model_config = self.speculative_config.draft_model_config
         self.method = self.speculative_config.method
 
@@ -74,11 +75,16 @@ def __init__(
             vllm_config.model_config)
 
         self.attn_metadata_builder: Optional[AttentionMetadataBuilder] = None
+        self.draft_indexer_metadata_builder: Optional[
+            AttentionMetadataBuilder] = None
+        self.attn_layer_names: list[str] = []
+        self.indexer_layer_names: list[str] = []
 
         self.use_cuda_graph = (not current_platform.is_xpu()
                                and self.vllm_config.compilation_config.level
                                == CompilationLevel.PIECEWISE and
-                               not self.vllm_config.model_config.enforce_eager)
+                               not self.vllm_config.model_config.enforce_eager
+                               and not self.speculative_config.enforce_eager)
         self.cudagraph_batch_sizes = list(
             reversed(self.vllm_config.compilation_config.
                      cudagraph_capture_sizes)) if self.use_cuda_graph else []

From 121258795e30ce0d022dc0cc1d3591d589e4f371 Mon Sep 17 00:00:00 2001
From: Salvatore Cena <cena@cenas.it>
Date: Wed, 1 Oct 2025 04:18:19 +0200
Subject: [PATCH 064/193] Update launch_bounds_utils.h for correct compile on
 Multiple Cuda Arch - PTXAS out of range Warning (#25843)

Signed-off-by: Salvatore Cena <cena@cenas.it>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 csrc/launch_bounds_utils.h | 32 +++++++++++++++++++++++++++++---
 1 file changed, 29 insertions(+), 3 deletions(-)

diff --git a/csrc/launch_bounds_utils.h b/csrc/launch_bounds_utils.h
index d5a89690111b..92d7ef802f97 100644
--- a/csrc/launch_bounds_utils.h
+++ b/csrc/launch_bounds_utils.h
@@ -8,11 +8,37 @@
   #define VLLM_LAUNCH_BLOCKS_CAP 4
 #endif
 
-// compile-time estimate of max threads per SM for launch bounds.
+// Compile-time estimate of max threads per SM for launch bounds.
+// Families: 1024, 1536, 2048 threads/SM.
 #ifndef VLLM_MAX_THREADS_PER_SM
-  #if defined(__CUDA_ARCH__) && __CUDA_ARCH__ < 300
-    #define VLLM_MAX_THREADS_PER_SM 1536
+  #ifdef __CUDA_ARCH__
+
+    /* 1024 thr/SM: Turing (sm_75) */
+    #if (__CUDA_ARCH__ == 750)
+      #define VLLM_MAX_THREADS_PER_SM 1024
+
+    /* 1536 thr/SM: Ampere GA10x (sm_86/87), Ada (sm_89),
+        GB20x consumer (sm_120/121), Thor (sm_101 or sm_110) */
+    #elif (__CUDA_ARCH__ == 860) || (__CUDA_ARCH__ == 870) || \
+        (__CUDA_ARCH__ == 890) || (__CUDA_ARCH__ == 1010) ||  \
+        (__CUDA_ARCH__ == 1100) || (__CUDA_ARCH__ == 1200) || \
+        (__CUDA_ARCH__ == 1210)
+      #define VLLM_MAX_THREADS_PER_SM 1536
+
+    /* 2048 thr/SM: Volta (sm_70/72), Ampere GA100 (sm_80),
+        Hopper (sm_90), Blackwell (sm_100/103) */
+    #elif (__CUDA_ARCH__ == 700) || (__CUDA_ARCH__ == 720) || \
+        (__CUDA_ARCH__ == 800) || (__CUDA_ARCH__ == 900) ||   \
+        (__CUDA_ARCH__ == 1000) || (__CUDA_ARCH__ == 1030)
+      #define VLLM_MAX_THREADS_PER_SM 2048
+
+    /* Fallback: use 2048 for unknown future CCs */
+    #else
+      #define VLLM_MAX_THREADS_PER_SM 2048
+    #endif
+
   #else
+  /* Host pass (no __CUDA_ARCH__): neutral default */
     #define VLLM_MAX_THREADS_PER_SM 2048
   #endif
 #endif

From 51ee4c954229d0386c1ccab10c7ac05031798f83 Mon Sep 17 00:00:00 2001
From: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Date: Tue, 30 Sep 2025 22:18:43 -0400
Subject: [PATCH 065/193] [Log] Optimize Log for FP8MOE (#25709)

Signed-off-by: yewentao256 <zhyanwentao@126.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/layers/quantization/fp8.py | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/vllm/model_executor/layers/quantization/fp8.py b/vllm/model_executor/layers/quantization/fp8.py
index a0808cb603d0..3ebb20de9996 100644
--- a/vllm/model_executor/layers/quantization/fp8.py
+++ b/vllm/model_executor/layers/quantization/fp8.py
@@ -467,7 +467,8 @@ def __init__(self, quant_config: Fp8Config, layer: torch.nn.Module):
                 logger.info_once("DeepGemm disabled: FlashInfer MOE is"
                                  " enabled.")
             elif (is_deep_gemm_supported()):
-                logger.info_once("Using DeepGemm kernels for Fp8MoEMethod.")
+                logger.debug_once(
+                    "DeepGemm kernels available for Fp8MoEMethod.")
                 self.allow_deep_gemm = True
             else:
                 logger.warning_once(
@@ -481,9 +482,8 @@ def __init__(self, quant_config: Fp8Config, layer: torch.nn.Module):
         elif (current_platform.is_cuda()
               and current_platform.is_device_capability(100)
               and not self.flashinfer_moe_backend):
-            logger.info_once(
-                "Using CutlassBlockScaledGroupedGemm kernels for Fp8 MOE "
-                "on SM100.")
+            logger.debug_once(
+                "CutlassBlockScaledGroupedGemm available for Fp8MoEMethod.")
             self.allow_cutlass_block_scaled_grouped_gemm = True
 
     def create_weights(self, layer: Module, num_experts: int, hidden_size: int,

From 73e138a10611747a56a2bda11cca984c615684ff Mon Sep 17 00:00:00 2001
From: Param <psch@cs.unc.edu>
Date: Tue, 30 Sep 2025 22:19:53 -0400
Subject: [PATCH 066/193] Fix INT8 quantization error on Blackwell GPUs
 (SM100+) (#25935)

Signed-off-by: padg9912 <phone.and.desktop@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 csrc/quantization/cutlass_w8a8/c3x/scaled_mm_helper.hpp | 5 ++++-
 docs/features/quantization/int8.md                      | 6 +++++-
 2 files changed, 9 insertions(+), 2 deletions(-)

diff --git a/csrc/quantization/cutlass_w8a8/c3x/scaled_mm_helper.hpp b/csrc/quantization/cutlass_w8a8/c3x/scaled_mm_helper.hpp
index 3af59267bd60..2204a49257b0 100644
--- a/csrc/quantization/cutlass_w8a8/c3x/scaled_mm_helper.hpp
+++ b/csrc/quantization/cutlass_w8a8/c3x/scaled_mm_helper.hpp
@@ -25,7 +25,10 @@ void dispatch_scaled_mm(torch::Tensor& c, torch::Tensor const& a,
       if constexpr (!std::is_same_v<Int8Func, std::nullptr_t>) {
         int8_func(c, a, b, a_scales, b_scales, bias);
       } else {
-        TORCH_CHECK(false, "Int8 not supported for this architecture");
+        int32_t version_num = get_sm_version_num();
+        TORCH_CHECK(
+            false, "Int8 not supported on SM", version_num,
+            ". Use FP8 quantization instead, or run on older arch (SM < 100).");
       }
     }
   } else {
diff --git a/docs/features/quantization/int8.md b/docs/features/quantization/int8.md
index 247d0cbdd3f1..af3650e701ad 100644
--- a/docs/features/quantization/int8.md
+++ b/docs/features/quantization/int8.md
@@ -6,7 +6,11 @@ This quantization method is particularly useful for reducing model size while ma
 Please visit the HF collection of [quantized INT8 checkpoints of popular LLMs ready to use with vLLM](https://huggingface.co/collections/neuralmagic/int8-llms-for-vllm-668ec32c049dca0369816415).
 
 !!! note
-    INT8 computation is supported on NVIDIA GPUs with compute capability > 7.5 (Turing, Ampere, Ada Lovelace, Hopper, Blackwell).
+    INT8 computation is supported on NVIDIA GPUs with compute capability > 7.5 (Turing, Ampere, Ada Lovelace, Hopper).
+
+!!! warning
+    **Blackwell GPU Limitation**: INT8 is not supported on compute capability >= 100 (e.g., RTX 6000 Blackwell).
+    Use [FP8 quantization](fp8.md) instead, or run on Hopper/Ada/Ampere architectures.
 
 ## Prerequisites
 

From c71f8efb71e6374dd57e266250f9c0199d5d489c Mon Sep 17 00:00:00 2001
From: Roger Wang <hey@rogerw.io>
Date: Tue, 30 Sep 2025 21:13:42 -0700
Subject: [PATCH 067/193] [MM] Add text-only mode for Qwen3-VL (#26000)

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/qwen3_vl.py     | 39 ++++++++++++++--------
 vllm/model_executor/models/qwen3_vl_moe.py | 32 +++++++++++-------
 2 files changed, 45 insertions(+), 26 deletions(-)

diff --git a/vllm/model_executor/models/qwen3_vl.py b/vllm/model_executor/models/qwen3_vl.py
index ce92557d6424..00de89811cc7 100644
--- a/vllm/model_executor/models/qwen3_vl.py
+++ b/vllm/model_executor/models/qwen3_vl.py
@@ -1125,14 +1125,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "model"):
         self.config = config
         self.multimodal_config = multimodal_config
         self.use_data_parallel = multimodal_config.mm_encoder_tp_mode == "data"
-
-        self.visual = Qwen3_VisionTransformer(
-            config.vision_config,
-            norm_eps=getattr(config, "rms_norm_eps", 1e-6),
-            quant_config=quant_config,
-            prefix=maybe_prefix(prefix, "visual"),
-            use_data_parallel=self.use_data_parallel,
-        )
+        if not multimodal_config.get_limit_per_prompt("image") and \
+            not multimodal_config.get_limit_per_prompt("video"):
+            self.visual = None
+        else:
+            self.visual = Qwen3_VisionTransformer(
+                config.vision_config,
+                norm_eps=getattr(config, "rms_norm_eps", 1e-6),
+                quant_config=quant_config,
+                prefix=maybe_prefix(prefix, "visual"),
+                use_data_parallel=self.use_data_parallel,
+            )
 
         self.language_model = Qwen3LLMForCausalLM(vllm_config=vllm_config,
                                                   prefix=maybe_prefix(
@@ -1148,11 +1151,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "model"):
             config.vision_config.deepstack_visual_indexes
         ) if self.use_deepstack else 0
         # register buffer for deepstack
-        self.deepstack_input_embeds = [
-            torch.zeros(vllm_config.scheduler_config.max_num_batched_tokens,
-                        config.text_config.hidden_size)
-            for _ in range(self.deepstack_num_level)
-        ] if self.use_deepstack else None
+        if self.use_deepstack and self.visual is not None:
+            self.deepstack_input_embeds = [
+                torch.zeros(
+                    vllm_config.scheduler_config.max_num_batched_tokens,
+                    config.text_config.hidden_size)
+                for _ in range(self.deepstack_num_level)
+            ]
+        else:
+            self.deepstack_input_embeds = None
         self.visual_dim = config.vision_config.out_hidden_size
         self.multiscale_dim = self.visual_dim * self.deepstack_num_level
 
@@ -1526,7 +1533,11 @@ def compute_logits(
 
     def load_weights(self, weights: Iterable[tuple[str,
                                                    torch.Tensor]]) -> set[str]:
-        loader = AutoWeightsLoader(self)
+
+        skip_prefixes = []
+        if self.visual is None:
+            skip_prefixes.extend(["visual."])
+        loader = AutoWeightsLoader(self, skip_prefixes=skip_prefixes)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
     def get_mm_mapping(self) -> MultiModelKeys:
diff --git a/vllm/model_executor/models/qwen3_vl_moe.py b/vllm/model_executor/models/qwen3_vl_moe.py
index 02cc5d6d66d1..1ed053eb2e96 100644
--- a/vllm/model_executor/models/qwen3_vl_moe.py
+++ b/vllm/model_executor/models/qwen3_vl_moe.py
@@ -319,13 +319,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.multimodal_config = multimodal_config
         self.use_data_parallel = multimodal_config.mm_encoder_tp_mode == "data"
 
-        self.visual = Qwen3_VisionTransformer(
-            config.vision_config,
-            norm_eps=getattr(config, "rms_norm_eps", 1e-6),
-            quant_config=quant_config,
-            prefix=maybe_prefix(prefix, "visual"),
-            use_data_parallel=self.use_data_parallel,
-        )
+        if not multimodal_config.get_limit_per_prompt("image") and \
+            not multimodal_config.get_limit_per_prompt("video"):
+            self.visual = None
+        else:
+            self.visual = Qwen3_VisionTransformer(
+                config.vision_config,
+                norm_eps=getattr(config, "rms_norm_eps", 1e-6),
+                quant_config=quant_config,
+                prefix=maybe_prefix(prefix, "visual"),
+                use_data_parallel=self.use_data_parallel,
+            )
 
         self.language_model = Qwen3MoeLLMForCausalLM(vllm_config=vllm_config,
                                                      prefix=maybe_prefix(
@@ -341,10 +345,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             config.vision_config.deepstack_visual_indexes
         ) if self.use_deepstack else 0
         # register buffer for deepstack
-        self.deepstack_input_embeds = [
-            torch.zeros(vllm_config.scheduler_config.max_num_batched_tokens,
-                        config.text_config.hidden_size)
-            for _ in range(self.deepstack_num_level)
-        ] if self.use_deepstack else None
+        if self.use_deepstack and self.visual is not None:
+            self.deepstack_input_embeds = [
+                torch.zeros(
+                    vllm_config.scheduler_config.max_num_batched_tokens,
+                    config.text_config.hidden_size)
+                for _ in range(self.deepstack_num_level)
+            ]
+        else:
+            self.deepstack_input_embeds = None
         self.visual_dim = config.vision_config.out_hidden_size
         self.multiscale_dim = self.visual_dim * self.deepstack_num_level

From d26bae4a640e4cfe34ddf331354a8c0a7240fff7 Mon Sep 17 00:00:00 2001
From: Zhewen Li <zhewenli@meta.com>
Date: Tue, 30 Sep 2025 21:15:11 -0700
Subject: [PATCH 068/193] [Bugfix] Fix `__syncwarp` on ROCM (#25996)

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 csrc/cache_kernels.cu | 6 +++++-
 1 file changed, 5 insertions(+), 1 deletion(-)

diff --git a/csrc/cache_kernels.cu b/csrc/cache_kernels.cu
index b1c43163c6a5..1286f5806d4b 100644
--- a/csrc/cache_kernels.cu
+++ b/csrc/cache_kernels.cu
@@ -536,7 +536,9 @@ __global__ void indexer_k_quant_and_cache_kernel(
   for (int i = 0; i < VEC_SIZE; i++) {
     amax = fmaxf(amax, fabsf(float(k_val_ptr[i])));
   }
+#ifndef USE_ROCM
   __syncwarp();
+#endif
 
   // Reduced amax
   for (int mask = 16; mask > 0; mask /= 2) {
@@ -546,7 +548,9 @@ __global__ void indexer_k_quant_and_cache_kernel(
     amax = fmaxf(amax, __shfl_xor_sync(unsigned(-1), amax, mask));
 #endif
   }
+#ifndef USE_ROCM
   __syncwarp();
+#endif
   float scale = fmaxf(amax, 1e-4) / 448.0f;
   if (use_ue8m0) {
     scale = exp2f(ceilf(log2f(scale)));
@@ -1167,4 +1171,4 @@ void indexer_k_quant_and_cache(
 
   DISPATCH_BY_KV_CACHE_DTYPE(k.dtype(), "fp8_e4m3",
                              CALL_INDEXER_K_QUANT_AND_CACHE);
-}
\ No newline at end of file
+}

From 5dd79da5eeb96e75653c503c64eb137d1f545a53 Mon Sep 17 00:00:00 2001
From: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Date: Wed, 1 Oct 2025 00:58:31 -0400
Subject: [PATCH 069/193] [BugFix] Fix default kv-cache-dtype default for
 DeepseekV3.2 (#25988)

Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/config.py | 28 ++++++++++++++--------------
 1 file changed, 14 insertions(+), 14 deletions(-)

diff --git a/vllm/model_executor/models/config.py b/vllm/model_executor/models/config.py
index 589ca0069034..5711b5ebe85e 100644
--- a/vllm/model_executor/models/config.py
+++ b/vllm/model_executor/models/config.py
@@ -400,7 +400,7 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
                 "exactly equal.", mamba_padding_pct)
 
 
-class DeepseekV3ForCausalLM(VerifyAndUpdateConfig):
+class DeepseekV32ForCausalLM(VerifyAndUpdateConfig):
 
     @classmethod
     def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
@@ -409,20 +409,20 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
         """
         hf_config = vllm_config.model_config.hf_config
 
+        # Mirror the check in vllm/model_executor/models/deepseek_v2.py
         is_v32 = hasattr(hf_config, "index_topk")
+        assert is_v32
 
-        if is_v32:
-            # For DeepSeekV3.2, we use a custom fp8 format as default (i.e.
-            #   "auto")
-            cache_config = vllm_config.cache_config
-            if cache_config.cache_dtype == "auto" or \
-                cache_config.cache_dtype.startswith("fp8"):
-                cache_config.cache_dtype = "fp8_ds_mla"
-                logger.info(
-                    "Using custom fp8 kv-cache format for DeepSeekV3.2")
-            if cache_config.cache_dtype == "bfloat16":
-                cache_config.cache_dtype = "auto"
-                logger.info("Using bfloat16 kv-cache for DeepSeekV3.2")
+        # For DeepSeekV3.2, we use a custom fp8 format as default (i.e.
+        #   "auto")
+        cache_config = vllm_config.cache_config
+        if cache_config.cache_dtype == "auto" or \
+            cache_config.cache_dtype.startswith("fp8"):
+            cache_config.cache_dtype = "fp8_ds_mla"
+            logger.info("Using custom fp8 kv-cache format for DeepSeekV3.2")
+        if cache_config.cache_dtype == "bfloat16":
+            cache_config.cache_dtype = "auto"
+            logger.info("Using bfloat16 kv-cache for DeepSeekV3.2")
 
 
 MODELS_CONFIG_MAP: dict[str, type[VerifyAndUpdateConfig]] = {
@@ -441,5 +441,5 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
     "MambaForCausalLM": MambaModelConfig,
     "Mamba2ForCausalLM": MambaModelConfig,
     "FalconMambaForCausalLM": MambaModelConfig,
-    "DeepseekV3ForCausalLM": DeepseekV3ForCausalLM,
+    "DeepseekV32ForCausalLM": DeepseekV32ForCausalLM,
 }

From 5a8a8fc940f1ed8adeb078c5f8855bc14a6bdfd9 Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Wed, 1 Oct 2025 06:07:07 +0100
Subject: [PATCH 070/193] Update to Transformers `v4.56.2` (#24638)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Co-authored-by: Cyrus Leung <tlleungac@connect.ust.hk>
Co-authored-by: Cyrus Leung <cyrus.tl.leung@gmail.com>
Co-authored-by: Isotr0py <mozf@mail2.sysu.edu.cn>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 requirements/nightly_torch_test.txt           |  4 +-
 requirements/test.in                          |  4 +-
 requirements/test.txt                         |  4 +-
 .../multimodal/generation/test_common.py      |  4 +-
 vllm/model_executor/models/transformers.py    | 38 ++++++-------------
 5 files changed, 20 insertions(+), 34 deletions(-)

diff --git a/requirements/nightly_torch_test.txt b/requirements/nightly_torch_test.txt
index 790a18f28b7f..67c66a0c03e6 100644
--- a/requirements/nightly_torch_test.txt
+++ b/requirements/nightly_torch_test.txt
@@ -29,8 +29,8 @@ opencv-python-headless >= 4.11.0 # required for video test
 datamodel_code_generator # required for minicpm3 test
 lm-eval[api] @ git+https://github.com/EleutherAI/lm-evaluation-harness.git@206b7722158f58c35b7ffcd53b035fdbdda5126d # required for model evaluation test
 mteb>=1.38.11, <2 # required for mteb test
-transformers==4.52.4
-tokenizers==0.21.1
+transformers==4.56.2
+tokenizers==0.22.0
 schemathesis>=3.39.15 # Required for openai schema test.
 # quantization
 bitsandbytes>=0.46.1
diff --git a/requirements/test.in b/requirements/test.in
index c9496c61a7e4..e0a9311af29d 100644
--- a/requirements/test.in
+++ b/requirements/test.in
@@ -37,8 +37,8 @@ datamodel_code_generator # required for minicpm3 test
 # TODO: Use lm-eval[api]==0.4.10 once released
 lm-eval[api] @ git+https://github.com/EleutherAI/lm-evaluation-harness.git@206b7722158f58c35b7ffcd53b035fdbdda5126d # required for model evaluation test
 mteb[bm25s]>=1.38.11, <2 # required for mteb test
-transformers==4.55.2
-tokenizers==0.21.1
+transformers==4.56.2
+tokenizers==0.22.0
 schemathesis>=3.39.15 # Required for openai schema test.
 # quantization
 bitsandbytes==0.46.1
diff --git a/requirements/test.txt b/requirements/test.txt
index 912e04b2606c..07457e14ccbd 100644
--- a/requirements/test.txt
+++ b/requirements/test.txt
@@ -1072,7 +1072,7 @@ timm==1.0.17
     #   segmentation-models-pytorch
     #   terratorch
     #   torchgeo
-tokenizers==0.21.1
+tokenizers==0.22.0
     # via
     #   -r requirements/test.in
     #   transformers
@@ -1153,7 +1153,7 @@ tqdm==4.66.6
     #   transformers
 tqdm-multiprocess==0.0.11
     # via lm-eval
-transformers==4.55.2
+transformers==4.56.2
     # via
     #   -r requirements/test.in
     #   genai-perf
diff --git a/tests/models/multimodal/generation/test_common.py b/tests/models/multimodal/generation/test_common.py
index e76b58e61ec1..c378ef670f91 100644
--- a/tests/models/multimodal/generation/test_common.py
+++ b/tests/models/multimodal/generation/test_common.py
@@ -214,7 +214,9 @@
         vllm_runner_kwargs={
             "model_impl": "transformers",
         },
-        marks=[large_gpu_mark(min_gb=32)],
+        # FIXME: Investigate mrope issue
+        marks=[large_gpu_mark(min_gb=32),
+               pytest.mark.skip(reason="Mrope issue")],
     ),
     #### Extended model tests
     "aria": VLMTestInfo(
diff --git a/vllm/model_executor/models/transformers.py b/vllm/model_executor/models/transformers.py
index d168398aa182..070c77073bb0 100644
--- a/vllm/model_executor/models/transformers.py
+++ b/vllm/model_executor/models/transformers.py
@@ -51,7 +51,6 @@
                                         BaseProcessingInfo)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
-from vllm.utils import is_list_of
 
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
                          SupportsMultiModal, SupportsPP, SupportsQuant)
@@ -217,9 +216,6 @@ def wrapper(*args, **kwargs):
 
 class MultiModalProcessingInfo(BaseProcessingInfo):
 
-    def get_hf_config(self):
-        return self.ctx.model_config.hf_config
-
     def get_supported_mm_limits(self):
         return {"image": None}
 
@@ -784,6 +780,7 @@ def _can_concat(x: list[torch.Tensor]):
     },
     enable_if=can_enable_torch_compile)
 class TransformersForMultimodalLM(TransformersForCausalLM, SupportsMultiModal):
+    merge_by_field_config = True
     # Backwards compatibility for prev released models. State dicts back then
     # had different formats and cannot be loaded with `AutoModel` mapping as is
     hf_to_vllm_mapper = WeightsMapper(
@@ -828,40 +825,27 @@ def get_language_model(self) -> torch.nn.Module:
         return self.model
 
     def get_multimodal_embeddings(self, **kwargs):
-        pixel_values = kwargs.pop("pixel_values", None)
-        pixel_values = pixel_values if pixel_values is not None else kwargs.pop(
-            "image_patches", None)
-        image_embeds = kwargs.pop("image_embeds", None)
+        pixel_values: Optional[torch.Tensor] = kwargs.pop("pixel_values", None)
+        image_embeds: Optional[torch.Tensor] = kwargs.pop("image_embeds", None)
+        # Model might use `image_patches` instead of `pixel_values`
+        if pixel_values is None:
+            pixel_values = kwargs.pop("image_patches", None)
 
         if image_embeds is not None:
             return image_embeds
 
-        if pixel_values is None and image_embeds is None:
+        if pixel_values is None:
             return None
 
         num_image_patches = kwargs.pop("num_image_patches")
         if pixel_values is not None:
-            if isinstance(pixel_values, torch.Tensor):
-                pixel_values = flatten_bn(pixel_values).to(self.dtype)
-            elif is_list_of(pixel_values, torch.Tensor):
-                pixel_values = flatten_and_concat(pixel_values).to(self.dtype)
-            else:
-                raise ValueError(
-                    f"Unsupported pixel_values type {type(pixel_values)}. "
-                    "Expected `torch.Tensor` or list of `torch.Tensor`.")
-
-            if isinstance(num_image_patches, list):
-                num_image_patches = torch.cat(num_image_patches)
-
             vision_embeddings = self.model.get_image_features(
-                pixel_values,
-                **{
-                    k: v.flatten(0, 1)
-                    for k, v in kwargs.items()
-                },
-            )
+                pixel_values, **kwargs)
 
             if isinstance(vision_embeddings, torch.Tensor):
+                if isinstance(num_image_patches, list):
+                    num_image_patches = torch.cat(num_image_patches)
+
                 if vision_embeddings.ndim == 2:
                     vision_embeddings = vision_embeddings.unsqueeze(0)
 

From e3136097ed1994f04370178a056d0de9b4831db0 Mon Sep 17 00:00:00 2001
From: Lucia Fang <116399278+luccafong@users.noreply.github.com>
Date: Tue, 30 Sep 2025 23:04:13 -0700
Subject: [PATCH 071/193] [Misc]allow disable pynccl (#25421)

Signed-off-by: Lu Fang <fanglu@fb.com>
Co-authored-by: Lucia (Lu) Fang <fanglu@meta.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/distributed/device_communicators/cuda_communicator.py | 4 ++++
 vllm/distributed/device_communicators/pynccl.py            | 3 ++-
 vllm/envs.py                                               | 6 ++++++
 3 files changed, 12 insertions(+), 1 deletion(-)

diff --git a/vllm/distributed/device_communicators/cuda_communicator.py b/vllm/distributed/device_communicators/cuda_communicator.py
index 30d1bf10138b..9c2bf51a813e 100644
--- a/vllm/distributed/device_communicators/cuda_communicator.py
+++ b/vllm/distributed/device_communicators/cuda_communicator.py
@@ -147,6 +147,10 @@ def all_reduce(self, input_):
             assert out is not None
             return out
         pynccl_comm = self.pynccl_comm
+        if pynccl_comm is None or pynccl_comm.disabled:
+            out = input_.clone()
+            torch.distributed.all_reduce(out, group=self.device_group)
+            return out
         assert pynccl_comm is not None
         out = pynccl_comm.all_reduce(input_)
         if out is None:
diff --git a/vllm/distributed/device_communicators/pynccl.py b/vllm/distributed/device_communicators/pynccl.py
index 76fe9a93259f..81c02d1899e5 100644
--- a/vllm/distributed/device_communicators/pynccl.py
+++ b/vllm/distributed/device_communicators/pynccl.py
@@ -8,6 +8,7 @@
 import torch.distributed as dist
 from torch.distributed import ProcessGroup, ReduceOp
 
+import vllm.envs as envs
 from vllm.distributed.device_communicators.pynccl_wrapper import (
     NCCLLibrary, buffer_type, cudaStream_t, ncclComm_t, ncclDataTypeEnum,
     ncclRedOpTypeEnum, ncclUniqueId)
@@ -83,7 +84,7 @@ def __init__(
         self.group = group
 
         # if world_size == 1, no need to create communicator
-        if self.world_size == 1:
+        if self.world_size == 1 or envs.VLLM_DISABLE_PYNCCL:
             self.available = False
             self.disabled = True
             return
diff --git a/vllm/envs.py b/vllm/envs.py
index ffa7ed5c3aa5..03a22e4b2c7e 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -98,6 +98,7 @@
     VLLM_SKIP_P2P_CHECK: bool = False
     VLLM_DISABLED_KERNELS: list[str] = []
     VLLM_DISABLE_NCCL_FOR_DP_SYNCHRONIZATION: bool = False
+    VLLM_DISABLE_PYNCCL: bool = False
     VLLM_USE_V1: bool = True
     VLLM_ROCM_USE_AITER: bool = False
     VLLM_ROCM_USE_AITER_PAGED_ATTN: bool = False
@@ -897,6 +898,11 @@ def get_vllm_port() -> Optional[int]:
     (os.getenv("VLLM_DISABLE_NCCL_FOR_DP_SYNCHRONIZATION", "False").lower() in
              ("true", "1")),
 
+    # Disable pynccl (using torch.distributed instead)
+    "VLLM_DISABLE_PYNCCL":
+    lambda:
+    (os.getenv("VLLM_DISABLE_PYNCCL", "False").lower() in ("true", "1")),
+
     # If set, use the V1 code path.
     "VLLM_USE_V1":
     lambda: bool(int(os.getenv("VLLM_USE_V1", "1"))),

From 54b8e41d726afd3ef79648a29a7ea9b0f51733fb Mon Sep 17 00:00:00 2001
From: nadathurv <work.vnadathur@gmail.com>
Date: Wed, 1 Oct 2025 00:04:56 -0700
Subject: [PATCH 072/193] [Doc] updating torch.compile doc link (#25989)

Signed-off-by: nadathurv <work.vnadathur@gmail.com>
Signed-off-by: WorldExplored <srreyansh.sethi@gmail.com>
Co-authored-by: Srreyansh Sethi <107075589+WorldExplored@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/design/torch_compile.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/docs/design/torch_compile.md b/docs/design/torch_compile.md
index 47ac4958dbf7..127768b74d7f 100644
--- a/docs/design/torch_compile.md
+++ b/docs/design/torch_compile.md
@@ -16,7 +16,7 @@ vLLM will take all the available factors into consideration, and decide a direct
 
 The factors considered include:
 
-- All the related configs (see the `compute_hash` functions in the [config.py](gh-file:vllm/config.py))
+- All the related configs (see the `compute_hash` functions in their respective configs in the [config folder](gh-file:vllm/config))
 - PyTorch configs (see the `compute_hash` functions in the [compiler_interface.py](gh-file:vllm/compilation/compiler_interface.py))
 - The model's forward function and the relevant functions called by the forward function (see below)
 

From 7e71da571a52e67c0a6787b534617af356a2c922 Mon Sep 17 00:00:00 2001
From: Wenlong Wang <wangwenlong2755@gmail.com>
Date: Wed, 1 Oct 2025 01:03:25 -0700
Subject: [PATCH 073/193] [BugFix][MM] Fix Nonetype error when video is cache
 in qwen2.5-omni-thinker (#26004)

Signed-off-by: wwl2755 <wangwenlong2755@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/qwen2_5_omni_thinker.py | 12 +++++++++---
 1 file changed, 9 insertions(+), 3 deletions(-)

diff --git a/vllm/model_executor/models/qwen2_5_omni_thinker.py b/vllm/model_executor/models/qwen2_5_omni_thinker.py
index 8f069710b0f9..b5e82c9b21cd 100644
--- a/vllm/model_executor/models/qwen2_5_omni_thinker.py
+++ b/vllm/model_executor/models/qwen2_5_omni_thinker.py
@@ -323,9 +323,15 @@ def _maybe_apply_prompt_updates(
         mm_item_counts = mm_items.get_all_counts()
         self._validate_mm_kwargs(mm_kwargs, mm_item_counts)
 
-        use_audio_in_video = (all(
-            item["use_audio_in_video"].data
-            for item in mm_kwargs["video"]) if "video" in mm_kwargs else False)
+        use_audio_in_video = False
+        if "video" in mm_kwargs:
+            video_items = [
+                item for item in mm_kwargs["video"] if item is not None
+            ]
+            # only check video items (if there are any)
+            if video_items:
+                use_audio_in_video = all(item["use_audio_in_video"].data
+                                         for item in video_items)
 
         if is_update_applied:
             mm_placeholders = self._find_mm_placeholders(

From 5d22264c4fe74045c2f16992e289c24103ed12fd Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Wed, 1 Oct 2025 16:31:03 +0800
Subject: [PATCH 074/193] [Misc] Factor out common
 `_apply_feature_select_strategy` (#26003)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/llava.py      | 19 +++-----------
 vllm/model_executor/models/llava_next.py |  5 ++--
 vllm/model_executor/models/tarsier.py    | 23 +++++------------
 vllm/model_executor/models/vision.py     | 32 +++++++++++++++++++++---
 4 files changed, 40 insertions(+), 39 deletions(-)

diff --git a/vllm/model_executor/models/llava.py b/vllm/model_executor/models/llava.py
index d823e5cb58d2..78c413b77051 100644
--- a/vllm/model_executor/models/llava.py
+++ b/vllm/model_executor/models/llava.py
@@ -41,7 +41,7 @@
 from .siglip import SiglipVisionModel
 from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
                     init_vllm_registered_model, maybe_prefix)
-from .vision import get_vision_encoder_info
+from .vision import get_num_selected_vision_tokens, get_vision_encoder_info
 
 
 class LlavaImagePixelInputs(TensorSchema):
@@ -147,19 +147,6 @@ def get_hf_processor(self, **kwargs: object) -> LlavaLikeProcessor:
     def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
         return {"image": None}
 
-    def _apply_feature_select_strategy(
-        self,
-        strategy: str,
-        encoder_num_image_tokens: int,
-    ) -> int:
-        if strategy == "default":
-            return encoder_num_image_tokens - 1
-        if strategy == "full":
-            return encoder_num_image_tokens
-
-        msg = f"Unexpected feature select strategy: {strategy!r}"
-        raise NotImplementedError(msg)
-
     def get_num_image_tokens(
         self,
         *,
@@ -169,12 +156,12 @@ def get_num_image_tokens(
         hf_config = self.get_hf_config()
         vision_encoder_info = self.get_vision_encoder_info()
 
-        return self._apply_feature_select_strategy(
-            hf_config.vision_feature_select_strategy,
+        return get_num_selected_vision_tokens(
             vision_encoder_info.get_num_image_tokens(
                 image_width=image_width,
                 image_height=image_height,
             ),
+            hf_config.vision_feature_select_strategy,
         )
 
     def get_image_size_with_most_features(self) -> ImageSize:
diff --git a/vllm/model_executor/models/llava_next.py b/vllm/model_executor/models/llava_next.py
index 3f7e39c02061..70fd0b2e5efb 100644
--- a/vllm/model_executor/models/llava_next.py
+++ b/vllm/model_executor/models/llava_next.py
@@ -27,6 +27,7 @@
 from .siglip import SiglipVisionModel
 from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
                     init_vllm_registered_model, maybe_prefix)
+from .vision import get_num_selected_vision_tokens
 
 
 class LlavaNextImagePixelInputs(TensorSchema):
@@ -95,12 +96,12 @@ def get_num_image_tokens(
         hf_config = self.get_hf_config()
         vision_encoder_info = self.get_vision_encoder_info()
 
-        base_feature_size = self._apply_feature_select_strategy(
-            hf_config.vision_feature_select_strategy,
+        base_feature_size = get_num_selected_vision_tokens(
             vision_encoder_info.get_num_image_tokens(
                 image_width=image_width,
                 image_height=image_height,
             ),
+            hf_config.vision_feature_select_strategy,
         )
 
         num_patch_height, num_patch_width = get_anyres_image_grid_shape(
diff --git a/vllm/model_executor/models/tarsier.py b/vllm/model_executor/models/tarsier.py
index ed02fe2c389f..8759c4ea4a64 100644
--- a/vllm/model_executor/models/tarsier.py
+++ b/vllm/model_executor/models/tarsier.py
@@ -40,7 +40,8 @@
 from .siglip import SiglipVisionModel
 from .utils import (AutoWeightsLoader, flatten_bn, init_vllm_registered_model,
                     maybe_prefix)
-from .vision import VisionEncoderInfo, get_vision_encoder_info
+from .vision import (VisionEncoderInfo, get_num_selected_vision_tokens,
+                     get_vision_encoder_info)
 
 
 class TarsierImagePixelInputs(TensorSchema):
@@ -201,18 +202,6 @@ def get_hf_processor(self, **kwargs: object) -> TarsierProcessor:
     def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
         return {"image": None}
 
-    def _apply_feature_select_strategy(
-        self,
-        strategy: str,
-        encoder_num_image_tokens: int,
-    ) -> int:
-        if strategy == "default":
-            return encoder_num_image_tokens - 1
-        if strategy == "full":
-            return encoder_num_image_tokens
-        msg = f"Unexpected feature select strategy: {strategy!r}"
-        raise NotImplementedError(msg)
-
     def get_num_image_tokens(
         self,
         *,
@@ -221,21 +210,21 @@ def get_num_image_tokens(
     ) -> int:
         hf_config = self.get_hf_config()
         vision_encoder_info = self.get_vision_encoder_info()
-        num_projected_patches = self._apply_feature_select_strategy(
-            hf_config.vision_feature_select_strategy,
+        num_projected_patches = get_num_selected_vision_tokens(
             vision_encoder_info.get_num_image_tokens(
                 image_width=image_width,
                 image_height=image_height,
             ),
+            hf_config.vision_feature_select_strategy,
         )
         if num_projected_patches <= 0:
             default_size = self.get_image_size_with_most_features()
-            num_projected_patches_default = self._apply_feature_select_strategy(
-                hf_config.vision_feature_select_strategy,
+            num_projected_patches_default = get_num_selected_vision_tokens(
                 vision_encoder_info.get_num_image_tokens(
                     image_width=default_size.width,
                     image_height=default_size.height,
                 ),
+                hf_config.vision_feature_select_strategy,
             )
             if num_projected_patches_default <= 0:
                 raise ValueError(
diff --git a/vllm/model_executor/models/vision.py b/vllm/model_executor/models/vision.py
index e077691fcec2..3d16d71e1764 100644
--- a/vllm/model_executor/models/vision.py
+++ b/vllm/model_executor/models/vision.py
@@ -9,7 +9,6 @@
 
 import torch
 from transformers import PretrainedConfig
-from typing_extensions import assert_never
 
 from vllm.distributed import (get_tensor_model_parallel_rank,
                               get_tensor_model_parallel_world_size,
@@ -22,9 +21,13 @@
 _C = TypeVar("_C", bound=PretrainedConfig)
 
 
+class _RootConfig(Protocol[_C]):
+    vision_config: _C
+
+
 class VisionEncoderInfo(ABC, Generic[_C]):
 
-    def __init__(self, hf_config: _C) -> None:
+    def __init__(self, hf_config: _RootConfig[_C]) -> None:
         super().__init__()
 
         self.hf_config = hf_config
@@ -95,7 +98,7 @@ def get_vit_attn_backend(head_size: int, dtype: torch.dtype) -> _Backend:
 
 
 def _get_vision_feature_selector(
-    strategy: VisionFeatureSelectStrategy,
+    strategy: Union[VisionFeatureSelectStrategy, str],
 ) -> Callable[[torch.Tensor], torch.Tensor]:
     if callable(strategy):
         return strategy
@@ -111,7 +114,28 @@ def _get_vision_feature_selector(
     if strategy == "full":
         return lambda feats: feats
 
-    assert_never(strategy)
+    raise ValueError(f"Unexpected feature select strategy: {strategy!r}")
+
+
+def get_num_selected_vision_tokens(
+    num_vision_tokens: int,
+    strategy: Union[VisionFeatureSelectStrategy, str],
+) -> int:
+    if callable(strategy):
+        dummy_features = torch.empty(1, num_vision_tokens, 64)  # [B, L, D]
+        dummy_selected_features = strategy(dummy_features)
+        return dummy_selected_features.shape[1]
+
+    if strategy == "class":
+        return 1
+
+    if strategy == "default":
+        return num_vision_tokens - 1
+
+    if strategy == "full":
+        return num_vision_tokens
+
+    raise ValueError(f"Unexpected feature select strategy: {strategy!r}")
 
 
 def resolve_visual_encoder_outputs(

From 2add6d5aa41f7332fbfdec854f5461ae3aaa75e0 Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Wed, 1 Oct 2025 10:03:44 +0100
Subject: [PATCH 075/193] [CI] Only capture a single CUDA graph size in CI by
 default (#25951)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/conftest.py | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/tests/conftest.py b/tests/conftest.py
index a50985a465e6..e3e412f90af5 100644
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -731,6 +731,9 @@ def __init__(
         init_ctx = (nullcontext() if default_torch_num_threads is None else
                     set_default_torch_num_threads(default_torch_num_threads))
 
+        if not kwargs.get("compilation_config", None):
+            kwargs["compilation_config"] = {"cudagraph_capture_sizes": [8]}
+
         with init_ctx:
             self.llm = LLM(
                 model=model_name,

From 4ef812ab627bec4b395321d1e0fc6b611fd1447c Mon Sep 17 00:00:00 2001
From: billishyahao <bill.he@amd.com>
Date: Wed, 1 Oct 2025 20:39:45 +0800
Subject: [PATCH 076/193] [MISC] Fix misleading batch_size_capture_list when
 cuda_graph_sizes < 4 (#25829)

Signed-off-by: billishyahao <bill.he@amd.com>
Co-authored-by: Luka Govedic <ProExpertProg@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/config/vllm.py | 9 ++++++---
 1 file changed, 6 insertions(+), 3 deletions(-)

diff --git a/vllm/config/vllm.py b/vllm/config/vllm.py
index 585d3997cc3a..107df502e08e 100644
--- a/vllm/config/vllm.py
+++ b/vllm/config/vllm.py
@@ -580,9 +580,12 @@ def _set_cudagraph_sizes(self):
             not self.model_config.enforce_eager:
             cuda_graph_sizes = self.scheduler_config.cuda_graph_sizes
             if len(cuda_graph_sizes) == 1:
-                batch_size_capture_list = [1, 2, 4] + [
-                    i for i in range(8, cuda_graph_sizes[0] + 1, 8)
-                ]
+                max_graph_size = cuda_graph_sizes[0]
+                assert max_graph_size >= 1, "Maximum cudagraph size should be" \
+                                            " greater than or equal to 1."
+                batch_size_capture_list = [
+                    i for i in [1, 2, 4] if i <= max_graph_size
+                ] + list(range(8, max_graph_size + 1, 8))
             elif len(cuda_graph_sizes) > 1:
                 batch_size_capture_list = sorted(cuda_graph_sizes)
             else:

From 45b3629b180a9e8ba98a33f3614b1596e5b1cbc5 Mon Sep 17 00:00:00 2001
From: Nathan Scott <natoscott@users.noreply.github.com>
Date: Wed, 1 Oct 2025 22:41:57 +1000
Subject: [PATCH 077/193] [Benchmark] Finish documented v0.11.0 deprecation of
 --endpoint-type (#26007)

Signed-off-by: Nathan Scott <nathans@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/benchmarks/serve.py | 24 ------------------------
 1 file changed, 24 deletions(-)

diff --git a/vllm/benchmarks/serve.py b/vllm/benchmarks/serve.py
index 2a042802d0d5..a327e711c208 100644
--- a/vllm/benchmarks/serve.py
+++ b/vllm/benchmarks/serve.py
@@ -52,21 +52,6 @@
                           and (shutil.which("gnuplot") is not None))
 
 
-# TODO: Remove this in v0.11.0
-class DeprecatedEndpointTypeAction(argparse.Action):
-    """Argparse action for the deprecated --endpoint-type flag.
-    """
-
-    def __call__(self, _, namespace, values, option_string=None):
-        warnings.warn(
-            "'--endpoint-type' is deprecated and will be removed in v0.11.0. "
-            "Please use '--backend' instead or remove this argument if you "
-            "have already set it.",
-            stacklevel=1,
-        )
-        setattr(namespace, self.dest, values)
-
-
 class TaskType(Enum):
     GENERATION = "generation"
     EMBEDDING = "embedding"
@@ -883,15 +868,6 @@ def add_cli_args(parser: argparse.ArgumentParser):
         choices=list(ASYNC_REQUEST_FUNCS.keys()),
         help="The type of backend or endpoint to use for the benchmark."
     )
-    parser.add_argument(
-        "--endpoint-type",
-        type=str,
-        default=None,
-        choices=list(ASYNC_REQUEST_FUNCS.keys()),
-        action=DeprecatedEndpointTypeAction,
-        help="'--endpoint-type' is deprecated and will be removed in v0.11.0. "
-        "Please use '--backend' instead.",
-    )
     parser.add_argument(
         "--base-url",
         type=str,

From efc7a1b868bf735ac7a1aa75ccc32fedc11cde19 Mon Sep 17 00:00:00 2001
From: Kenichi Maehashi <939877+kmaehashi@users.noreply.github.com>
Date: Wed, 1 Oct 2025 23:37:35 +0900
Subject: [PATCH 078/193] [Bugfix] Apply same sampling parameters for both
 `n=1` and `n>1` (#26005)

Signed-off-by: Kenichi Maehashi <maehashi@preferred.jp>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/v1/engine/async_llm.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/v1/engine/async_llm.py b/vllm/v1/engine/async_llm.py
index 757baecea9ce..574f8b19c379 100644
--- a/vllm/v1/engine/async_llm.py
+++ b/vllm/v1/engine/async_llm.py
@@ -290,7 +290,7 @@ async def add_request(
             return queue
 
         # Fan out child requests (for n>1).
-        parent_request = ParentRequest(request_id, params)
+        parent_request = ParentRequest(request_id, request.sampling_params)
         for idx in range(params.n):
             request_id, params = parent_request.get_child_info(idx)
             child_request = request if idx == params.n - 1 else copy(request)

From 4b427d8566cb02ad3f1f39902223ca6d3aa0c423 Mon Sep 17 00:00:00 2001
From: Johnny <johnnync13@gmail.com>
Date: Wed, 1 Oct 2025 19:50:54 +0200
Subject: [PATCH 079/193] [NVIDIA] Blackwell Family (#24673)

Signed-off-by: Johnny <johnnynuca14@gmail.com>
Signed-off-by: johnnynunez <johnnynuca14@gmail.com>
Signed-off-by: Johnny <johnnync13@gmail.com>
Signed-off-by: Salvatore Cena <cena@cenas.it>
Co-authored-by: Aidyn-A <31858918+Aidyn-A@users.noreply.github.com>
Co-authored-by: Salvatore Cena <cena@cenas.it>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 CMakeLists.txt                                | 63 ++++++++++++++++---
 cmake/utils.cmake                             |  8 +--
 ...scaled_mm_blockwise_sm100_fp8_dispatch.cuh | 10 +--
 .../c3x/scaled_mm_sm100_fp8_dispatch.cuh      |  2 +-
 .../cutlass_w8a8/scaled_mm_entry.cu           |  5 +-
 5 files changed, 66 insertions(+), 22 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 180b896a7aba..f07ca9282563 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -86,6 +86,9 @@ find_package(Torch REQUIRED)
 # Supported NVIDIA architectures.
 # This check must happen after find_package(Torch) because that's when CMAKE_CUDA_COMPILER_VERSION gets defined
 if(DEFINED CMAKE_CUDA_COMPILER_VERSION AND
+   CMAKE_CUDA_COMPILER_VERSION VERSION_GREATER_EQUAL 13.0)
+  set(CUDA_SUPPORTED_ARCHS "7.5;8.0;8.6;8.7;8.9;9.0;10.0;11.0;12.0")
+elseif(DEFINED CMAKE_CUDA_COMPILER_VERSION AND
    CMAKE_CUDA_COMPILER_VERSION VERSION_GREATER_EQUAL 12.8)
   set(CUDA_SUPPORTED_ARCHS "7.0;7.2;7.5;8.0;8.6;8.7;8.9;9.0;10.0;10.1;12.0")
 else()
@@ -175,6 +178,15 @@ if(NVCC_THREADS AND VLLM_GPU_LANG STREQUAL "CUDA")
   list(APPEND VLLM_GPU_FLAGS "--threads=${NVCC_THREADS}")
 endif()
 
+#
+# Set compression mode for CUDA >=13.x.
+#
+if(VLLM_GPU_LANG STREQUAL "CUDA" AND
+   DEFINED CMAKE_CUDA_COMPILER_VERSION AND
+   CMAKE_CUDA_COMPILER_VERSION VERSION_GREATER_EQUAL 13.0)
+  list(APPEND VLLM_GPU_FLAGS "--compress-mode=size")
+endif()
+
 #
 # Set CUDA include flags for CXX compiler.
 #
@@ -270,7 +282,7 @@ if(VLLM_GPU_LANG STREQUAL "CUDA")
   SET(CUTLASS_ENABLE_HEADERS_ONLY ON CACHE BOOL "Enable only the header library")
 
   # Set CUTLASS_REVISION. Used for FetchContent. Also fixes some bogus messages when building.
-  set(CUTLASS_REVISION "v4.0.0" CACHE STRING "CUTLASS revision to use")
+  set(CUTLASS_REVISION "v4.2.1" CACHE STRING "CUTLASS revision to use")
 
   # Use the specified CUTLASS source directory for compilation if VLLM_CUTLASS_SRC_DIR is provided
   if (DEFINED ENV{VLLM_CUTLASS_SRC_DIR})
@@ -305,7 +317,6 @@ if(VLLM_GPU_LANG STREQUAL "CUDA")
     "csrc/quantization/cutlass_w8a8/scaled_mm_entry.cu"
     "csrc/quantization/fp4/nvfp4_quant_entry.cu"
     "csrc/quantization/fp4/nvfp4_scaled_mm_entry.cu"
-    "csrc/quantization/fp4/nvfp4_blockwise_moe_kernel.cu"
     "csrc/sparse/cutlass/sparse_scaled_mm_entry.cu"
     "csrc/cutlass_extensions/common.cpp"
     "csrc/quantization/fp8/per_token_group_quant.cu")
@@ -440,7 +451,11 @@ if(VLLM_GPU_LANG STREQUAL "CUDA")
 
   # The cutlass_scaled_mm kernels for Geforce Blackwell SM120 (c3x, i.e. CUTLASS 3.x) require
   # CUDA 12.8 or later
-  cuda_archs_loose_intersection(SCALED_MM_ARCHS "12.0;12.0a" "${CUDA_ARCHS}")
+  if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 13.0)
+    cuda_archs_loose_intersection(SCALED_MM_ARCHS "12.0f" "${CUDA_ARCHS}")
+  else()
+    cuda_archs_loose_intersection(SCALED_MM_ARCHS "12.0a" "${CUDA_ARCHS}")
+  endif()
   if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 12.8 AND SCALED_MM_ARCHS)
     set(SRCS
       "csrc/quantization/cutlass_w8a8/scaled_mm_c3x_sm120.cu"
@@ -470,7 +485,11 @@ if(VLLM_GPU_LANG STREQUAL "CUDA")
 
   # The cutlass_scaled_mm kernels for Blackwell SM100 (c3x, i.e. CUTLASS 3.x)
   # require CUDA 12.8 or later
-  cuda_archs_loose_intersection(SCALED_MM_ARCHS "10.0a;10.1a" "${CUDA_ARCHS}")
+  if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 13.0)
+    cuda_archs_loose_intersection(SCALED_MM_ARCHS "10.0f;11.0f;12.0f" "${CUDA_ARCHS}")
+  else()
+    cuda_archs_loose_intersection(SCALED_MM_ARCHS "10.0a;10.1a;10.3a;12.0a;12.1a" "${CUDA_ARCHS}")
+  endif()
   if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 12.8 AND SCALED_MM_ARCHS)
     set(SRCS
       "csrc/quantization/cutlass_w8a8/scaled_mm_c3x_sm100.cu"
@@ -550,7 +569,11 @@ if(VLLM_GPU_LANG STREQUAL "CUDA")
 
   # The nvfp4_scaled_mm_sm120 kernels for Geforce Blackwell SM120 require
   # CUDA 12.8 or later
-  cuda_archs_loose_intersection(FP4_ARCHS "12.0;12.0a" "${CUDA_ARCHS}")
+  if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 13.0)
+    cuda_archs_loose_intersection(FP4_ARCHS "12.0f" "${CUDA_ARCHS}")
+  else()
+    cuda_archs_loose_intersection(FP4_ARCHS "12.0a" "${CUDA_ARCHS}")
+  endif()
   if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 12.8 AND FP4_ARCHS)
     set(SRCS
       "csrc/quantization/fp4/nvfp4_quant_kernels.cu"
@@ -569,7 +592,11 @@ if(VLLM_GPU_LANG STREQUAL "CUDA")
   endif()
 
   # FP4 Archs and flags
-  cuda_archs_loose_intersection(FP4_ARCHS "10.0a" "${CUDA_ARCHS}")
+  if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 13.0)
+    cuda_archs_loose_intersection(FP4_ARCHS "10.0f;11.0f;12.0f" "${CUDA_ARCHS}")
+  else()
+    cuda_archs_loose_intersection(FP4_ARCHS "10.0a;10.1a;12.0a;12.1a" "${CUDA_ARCHS}")
+  endif()
   if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 12.8 AND FP4_ARCHS)
     set(SRCS
       "csrc/quantization/fp4/nvfp4_quant_kernels.cu"
@@ -591,7 +618,11 @@ if(VLLM_GPU_LANG STREQUAL "CUDA")
   endif()
 
   # CUTLASS MLA Archs and flags
-  cuda_archs_loose_intersection(MLA_ARCHS "10.0a" "${CUDA_ARCHS}")
+  if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 13.0)
+    cuda_archs_loose_intersection(MLA_ARCHS "10.0f;11.0f;12.0f" "${CUDA_ARCHS}")
+  else()
+    cuda_archs_loose_intersection(MLA_ARCHS "10.0a;10.1a;10.3a;12.0a;12.1a" "${CUDA_ARCHS}")
+  endif()
   if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 12.8 AND MLA_ARCHS)
     set(SRCS
       "csrc/attention/mla/sm100_cutlass_mla_kernel.cu")
@@ -635,7 +666,11 @@ if(VLLM_GPU_LANG STREQUAL "CUDA")
     endif()
   endif()
 
-  cuda_archs_loose_intersection(SCALED_MM_ARCHS "10.0a" "${CUDA_ARCHS}")
+  if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 13.0)
+    cuda_archs_loose_intersection(SCALED_MM_ARCHS "10.0f" "${CUDA_ARCHS}")
+  else()
+    cuda_archs_loose_intersection(SCALED_MM_ARCHS "10.0a" "${CUDA_ARCHS}")
+  endif()
   if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 12.8 AND SCALED_MM_ARCHS)
     set(SRCS "csrc/quantization/cutlass_w8a8/moe/grouped_mm_c3x_sm100.cu")
     set_gencode_flags_for_srcs(
@@ -656,7 +691,11 @@ if(VLLM_GPU_LANG STREQUAL "CUDA")
   endif()
 
   # moe_data.cu is used by all CUTLASS MoE kernels.
-  cuda_archs_loose_intersection(CUTLASS_MOE_DATA_ARCHS "9.0a;10.0a" "${CUDA_ARCHS}")
+  if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 13.0)
+    cuda_archs_loose_intersection(CUTLASS_MOE_DATA_ARCHS "9.0a;10.0f;11.0f;12.0f" "${CUDA_ARCHS}")
+  else()
+    cuda_archs_loose_intersection(CUTLASS_MOE_DATA_ARCHS "9.0a;10.0a;10.1a;10.3a;12.0a;12.1a" "${CUDA_ARCHS}")
+  endif()
   if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 12.3 AND CUTLASS_MOE_DATA_ARCHS)
     set(SRCS "csrc/quantization/cutlass_w8a8/moe/moe_data.cu")
     set_gencode_flags_for_srcs(
@@ -675,7 +714,11 @@ if(VLLM_GPU_LANG STREQUAL "CUDA")
     endif()
   endif()
 
-  cuda_archs_loose_intersection(SCALED_MM_ARCHS "10.0a" "${CUDA_ARCHS}")
+  if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 13.0)
+    cuda_archs_loose_intersection(SCALED_MM_ARCHS "10.0f;11.0f;12.0f" "${CUDA_ARCHS}")
+  else()
+    cuda_archs_loose_intersection(SCALED_MM_ARCHS "10.0a;10.1a;10.3a;12.0a;12.1a" "${CUDA_ARCHS}")
+  endif()
   if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 12.8 AND SCALED_MM_ARCHS)
     set(SRCS "csrc/quantization/cutlass_w8a8/moe/blockwise_scaled_group_mm_sm100.cu")
     set_gencode_flags_for_srcs(
diff --git a/cmake/utils.cmake b/cmake/utils.cmake
index 8558976e2c39..f6a0d2b75be1 100644
--- a/cmake/utils.cmake
+++ b/cmake/utils.cmake
@@ -310,13 +310,13 @@ function(cuda_archs_loose_intersection OUT_CUDA_ARCHS SRC_CUDA_ARCHS TGT_CUDA_AR
   list(REMOVE_DUPLICATES _PTX_ARCHS)
   list(REMOVE_DUPLICATES _SRC_CUDA_ARCHS)
 
-  # if x.0a is in SRC_CUDA_ARCHS and x.0 is in CUDA_ARCHS then we should
-  # remove x.0a from SRC_CUDA_ARCHS and add x.0a to _CUDA_ARCHS
+  # If x.0a or x.0f is in SRC_CUDA_ARCHS and x.0 is in CUDA_ARCHS then we should
+  # remove x.0a or x.0f from SRC_CUDA_ARCHS and add x.0a or x.0f to _CUDA_ARCHS
   set(_CUDA_ARCHS)
   foreach(_arch ${_SRC_CUDA_ARCHS})
-    if(_arch MATCHES "\\a$")
+    if(_arch MATCHES "[af]$")
       list(REMOVE_ITEM _SRC_CUDA_ARCHS "${_arch}")
-      string(REPLACE "a" "" _base "${_arch}")
+      string(REGEX REPLACE "[af]$" "" _base "${_arch}")
       if ("${_base}" IN_LIST TGT_CUDA_ARCHS)
         list(REMOVE_ITEM _TGT_CUDA_ARCHS "${_base}")
         list(APPEND _CUDA_ARCHS "${_arch}")
diff --git a/csrc/quantization/cutlass_w8a8/c3x/scaled_mm_blockwise_sm100_fp8_dispatch.cuh b/csrc/quantization/cutlass_w8a8/c3x/scaled_mm_blockwise_sm100_fp8_dispatch.cuh
index dbf79a065115..e7bb061ba024 100644
--- a/csrc/quantization/cutlass_w8a8/c3x/scaled_mm_blockwise_sm100_fp8_dispatch.cuh
+++ b/csrc/quantization/cutlass_w8a8/c3x/scaled_mm_blockwise_sm100_fp8_dispatch.cuh
@@ -231,7 +231,7 @@ void cutlass_gemm_blockwise_sm100_fp8_dispatch(torch::Tensor& out,
       } else {
         cutlass_gemm_caller_blockwise<cutlass_3x_gemm_fp8_blockwise<
             OutType, 1, TILE_N, TILE_K, Shape<_64, Int<TILE_N>, Int<TILE_K>>,
-            Shape<_1, _1, _1>, cutlass::epilogue::NoSmemWarpSpecialized1Sm,
+            Shape<_1, _1, _1>, cutlass::epilogue::BlockwiseNoSmemWarpSpecialized1Sm,
             cutlass::gemm::KernelTmaWarpSpecializedBlockwise1SmSm100>>(
             out, a, b, a_scales, b_scales);
       }
@@ -245,7 +245,7 @@ void cutlass_gemm_blockwise_sm100_fp8_dispatch(torch::Tensor& out,
       } else {
         cutlass_gemm_caller_blockwise<cutlass_3x_gemm_fp8_blockwise<
             OutType, 1, TILE_N, TILE_K, Shape<_128, Int<TILE_N>, Int<TILE_K>>,
-            Shape<_1, _1, _1>, cutlass::epilogue::NoSmemWarpSpecialized1Sm,
+            Shape<_1, _1, _1>, cutlass::epilogue::BlockwiseNoSmemWarpSpecialized1Sm,
             cutlass::gemm::KernelTmaWarpSpecializedBlockwise1SmSm100>>(
             out, a, b, a_scales, b_scales);
       }
@@ -259,7 +259,7 @@ void cutlass_gemm_blockwise_sm100_fp8_dispatch(torch::Tensor& out,
       } else {
           cutlass_gemm_caller_blockwise<cutlass_3x_gemm_fp8_blockwise<
               OutType, 1, TILE_N, TILE_K, Shape<_256, Int<TILE_N>, Int<TILE_K>>,
-            Shape<_2, _1, _1>, cutlass::epilogue::NoSmemWarpSpecialized2Sm,
+            Shape<_2, _1, _1>, cutlass::epilogue::BlockwiseNoSmemWarpSpecialized2Sm,
             cutlass::gemm::KernelTmaWarpSpecializedBlockwise2SmSm100>>(
             out, a, b, a_scales, b_scales);
       }
@@ -271,10 +271,10 @@ void cutlass_gemm_blockwise_sm100_fp8_dispatch(torch::Tensor& out,
     // TMA epilogue isn't compatible with Swap A/B
     cutlass_gemm_caller_blockwise<cutlass_3x_gemm_fp8_blockwise<
         OutType, TILE_M, 1, TILE_K, Shape<Int<TILE_M>, Int<TILE_N>, Int<TILE_K>>,
-        Shape<_1, _1, _1>, cutlass::epilogue::NoSmemWarpSpecialized1Sm,
+        Shape<_1, _1, _1>, cutlass::epilogue::BlockwiseNoSmemWarpSpecialized1Sm,
         cutlass::gemm::KernelTmaWarpSpecializedBlockwise1SmSm100, true>>(
         out, a, b, a_scales, b_scales);
   }
 }
 
-}  // namespace vllm
+}  // namespace vllm
\ No newline at end of file
diff --git a/csrc/quantization/cutlass_w8a8/c3x/scaled_mm_sm100_fp8_dispatch.cuh b/csrc/quantization/cutlass_w8a8/c3x/scaled_mm_sm100_fp8_dispatch.cuh
index 24564efbd21b..f876b7d9acd8 100644
--- a/csrc/quantization/cutlass_w8a8/c3x/scaled_mm_sm100_fp8_dispatch.cuh
+++ b/csrc/quantization/cutlass_w8a8/c3x/scaled_mm_sm100_fp8_dispatch.cuh
@@ -133,4 +133,4 @@ void cutlass_scaled_mm_sm100_fp8_epilogue(torch::Tensor& out,
   }
 }
 
-}  // namespace vllm
\ No newline at end of file
+}  // namespace vllm
diff --git a/csrc/quantization/cutlass_w8a8/scaled_mm_entry.cu b/csrc/quantization/cutlass_w8a8/scaled_mm_entry.cu
index 84843ee6e094..04b64a35da37 100644
--- a/csrc/quantization/cutlass_w8a8/scaled_mm_entry.cu
+++ b/csrc/quantization/cutlass_w8a8/scaled_mm_entry.cu
@@ -67,8 +67,9 @@ void cutlass_scaled_mm_sm100(torch::Tensor& c, torch::Tensor const& a,
                              std::optional<torch::Tensor> const& bias);
 #endif
 
-#if defined(ENABLE_SCALED_MM_SM90) && ENABLE_SCALED_MM_SM90 || \
-    defined(ENABLE_SCALED_MM_SM100) && ENABLE_SCALED_MM_SM100
+#if defined(ENABLE_SCALED_MM_SM90) && ENABLE_SCALED_MM_SM90 ||   \
+    defined(ENABLE_SCALED_MM_SM100) && ENABLE_SCALED_MM_SM100 || \
+    defined(ENABLE_SCALED_MM_SM120) && ENABLE_SCALED_MM_SM120
 void get_cutlass_moe_mm_data_caller(
     const torch::Tensor& topk_ids, torch::Tensor& expert_offsets,
     torch::Tensor& problem_sizes1, torch::Tensor& problem_sizes2,

From 4d7c7ebeb37cb39c64e239e9786e70fd2d897afe Mon Sep 17 00:00:00 2001
From: Huamin Li <3ericli@gmail.com>
Date: Wed, 1 Oct 2025 11:18:36 -0700
Subject: [PATCH 080/193] Fix test_mamba_ssm_ssd.py due to missing
 _query_start_loc_to_chunk_indices_offsets (#25995)

Signed-off-by: Huamin Li <3ericli@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/kernels/mamba/test_mamba_ssm_ssd.py | 111 ++++++++++------------
 vllm/v1/attention/backends/mamba2_attn.py |  70 ++++++++++++++
 2 files changed, 118 insertions(+), 63 deletions(-)

diff --git a/tests/kernels/mamba/test_mamba_ssm_ssd.py b/tests/kernels/mamba/test_mamba_ssm_ssd.py
index 927af32588e6..9798b27cae76 100644
--- a/tests/kernels/mamba/test_mamba_ssm_ssd.py
+++ b/tests/kernels/mamba/test_mamba_ssm_ssd.py
@@ -10,7 +10,7 @@
     mamba_chunk_scan_combined_varlen)
 from vllm.platforms import current_platform
 from vllm.v1.attention.backends.mamba2_attn import (
-    _query_start_loc_to_chunk_indices_offsets)
+    compute_varlen_chunk_metadata)
 
 # Added by the IBM Team, 2024
 
@@ -225,13 +225,9 @@ def test_mamba_chunk_scan_single_example(d_head, n_heads, seq_len_chunk_size,
     Y_min, final_state_min = ssd_minimal_discrete(X * dt.unsqueeze(-1), A * dt,
                                                   B, C, chunk_size)
 
-    cu_seqlens = torch.tensor((0, seqlen), device='cuda').cumsum(dim=0)
-    seq_idx = torch.zeros(seqlen, dtype=torch.int32, device=cu_seqlens.device)
-
-    chunk_indices, chunk_offsets = \
-            _query_start_loc_to_chunk_indices_offsets(
-                cu_seqlens, chunk_size, cu_seqlens[-1])
-
+    cu_seqlens = torch.tensor((0, seqlen), device="cuda").cumsum(dim=0)
+    cu_chunk_seqlens, last_chunk_indices, seq_idx_chunks = (
+        compute_varlen_chunk_metadata(cu_seqlens, chunk_size))
     # varlen has implicit batch=1
     X = X.squeeze(0)
     dt = dt.squeeze(0)
@@ -239,18 +235,20 @@ def test_mamba_chunk_scan_single_example(d_head, n_heads, seq_len_chunk_size,
     B = B.squeeze(0)
     C = C.squeeze(0)
     Y = torch.empty_like(X)
-    final_state = mamba_chunk_scan_combined_varlen(X,
-                                                   dt,
-                                                   A,
-                                                   B,
-                                                   C,
-                                                   chunk_size,
-                                                   D=None,
-                                                   cu_seqlens=cu_seqlens,
-                                                   seq_idx=seq_idx,
-                                                   chunk_indices=chunk_indices,
-                                                   chunk_offsets=chunk_offsets,
-                                                   out=Y)
+    final_state = mamba_chunk_scan_combined_varlen(
+        X,
+        dt,
+        A,
+        B,
+        C,
+        chunk_size,
+        cu_seqlens=cu_seqlens.to(torch.int32),
+        cu_chunk_seqlens=cu_chunk_seqlens,
+        last_chunk_indices=last_chunk_indices,
+        seq_idx=seq_idx_chunks,
+        out=Y,
+        D=None,
+    )
 
     # just test the last in sequence
     torch.testing.assert_close(Y[-1], Y_min[0, -1], atol=atol, rtol=rtol)
@@ -312,14 +310,13 @@ def test_mamba_chunk_scan_cont_batch(d_head, n_heads, seq_len_chunk_size_cases,
     exhausted: dict = {}  # map: eg -> boolean indicating example is exhausted
 
     states = None
-    for Y_min, cu_seqlens, seq_idx, (
+    for Y_min, cu_seqlens, _token_seq_idx, (
             A, dt, X, B, C) in generate_continuous_batched_examples(
                 cases, num_examples, seqlen, last_taken, exhausted, n_heads,
                 d_head, itype):
 
-        chunk_indices, chunk_offsets = \
-            _query_start_loc_to_chunk_indices_offsets(
-                cu_seqlens, chunk_size, cu_seqlens[-1])
+        cu_chunk_seqlens, last_chunk_indices, seq_idx_chunks = (
+            compute_varlen_chunk_metadata(cu_seqlens, chunk_size))
 
         Y = torch.empty_like(X)
         new_states = mamba_chunk_scan_combined_varlen(
@@ -329,13 +326,13 @@ def test_mamba_chunk_scan_cont_batch(d_head, n_heads, seq_len_chunk_size_cases,
             B,
             C,
             chunk_size,
+            cu_seqlens=cu_seqlens.to(torch.int32),
+            cu_chunk_seqlens=cu_chunk_seqlens,
+            last_chunk_indices=last_chunk_indices,
+            seq_idx=seq_idx_chunks,
+            out=Y,
             D=None,
-            cu_seqlens=cu_seqlens,
-            seq_idx=seq_idx,
-            chunk_indices=chunk_indices,
-            chunk_offsets=chunk_offsets,
             initial_states=states,
-            out=Y,
         )
 
         # just test the last in sequence
@@ -403,9 +400,8 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
     device = X.device
 
     ## full seqlen computation
-    chunk_indices, chunk_offsets = \
-            _query_start_loc_to_chunk_indices_offsets(
-                cu_seqlens, chunk_size, cu_seqlens[-1])
+    cu_chunk_seqlens, last_chunk_indices, seq_idx_chunks = (
+        compute_varlen_chunk_metadata(cu_seqlens, chunk_size))
     Y_ref = torch.empty_like(X)
     state_ref = mamba_chunk_scan_combined_varlen(
         X,
@@ -414,13 +410,13 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
         B,
         C,
         chunk_size,
+        cu_seqlens=cu_seqlens.to(torch.int32),
+        cu_chunk_seqlens=cu_chunk_seqlens,
+        last_chunk_indices=last_chunk_indices,
+        seq_idx=seq_idx_chunks,
+        out=Y_ref,
         D=None,
-        cu_seqlens=cu_seqlens,
-        seq_idx=seq_idx,
-        chunk_indices=chunk_indices,
-        chunk_offsets=chunk_offsets,
         initial_states=None,
-        out=Y_ref,
     )
 
     ## chunked seqlen computation
@@ -431,10 +427,6 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
         torch.cumsum(chunked_seqlens, dim=0)
     ],
                                    dim=0)
-    chunked_seq_idx = torch.repeat_interleave(
-        torch.arange(len(chunked_seqlens), device=device),
-        chunked_seqlens,
-        output_size=chunked_cu_seqlens[-1]).to(torch.int32)
     chunked_input_seq_len = chunked_cu_seqlens[-1]
     X_chunked = torch.zeros_like(X)[:chunked_input_seq_len, ...]
     dt_chunked = torch.zeros_like(dt)[:chunked_input_seq_len, ...]
@@ -450,9 +442,8 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
         C_chunked[chunked_cu_seqlens[i]:chunked_cu_seqlens[i+1], ...] = chunk_f(C, i)  # noqa: E501
         # fmt: on
 
-    chunk_indices, chunk_offsets = \
-            _query_start_loc_to_chunk_indices_offsets(
-                chunked_cu_seqlens, chunk_size, chunked_cu_seqlens[-1])
+    cu_chunk_seqlens, last_chunk_indices, seq_idx_chunks = (
+        compute_varlen_chunk_metadata(chunked_cu_seqlens, chunk_size))
     Y_partial = torch.empty_like(X_chunked)
     partial_state = mamba_chunk_scan_combined_varlen(
         X_chunked,
@@ -461,13 +452,13 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
         B_chunked,
         C_chunked,
         chunk_size,
+        cu_seqlens=chunked_cu_seqlens.to(torch.int32),
+        cu_chunk_seqlens=cu_chunk_seqlens,
+        last_chunk_indices=last_chunk_indices,
+        seq_idx=seq_idx_chunks,
+        out=Y_partial,
         D=None,
-        cu_seqlens=chunked_cu_seqlens,
-        seq_idx=chunked_seq_idx,
-        chunk_indices=chunk_indices,
-        chunk_offsets=chunk_offsets,
         initial_states=None,
-        out=Y_partial,
     )
 
     # remaining chunk
@@ -477,10 +468,6 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
         torch.cumsum(remaining_chunked_seqlens, dim=0)
     ],
                                              dim=0)
-    remaining_chunked_seq_idx = torch.repeat_interleave(
-        torch.arange(len(remaining_chunked_seqlens), device=device),
-        remaining_chunked_seqlens,
-        output_size=remaining_chunked_cu_seqlens[-1]).to(torch.int32)
     remaining_chunked_input_seq_len = remaining_chunked_cu_seqlens[-1]
     # fmt: off
     remaining_X_chunked = torch.zeros_like(X)[:remaining_chunked_input_seq_len, ...]  # noqa: E501
@@ -509,11 +496,9 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
     assert concat_batch_f(B_chunked, remaining_B_chunked).equal(B)
     assert concat_batch_f(C_chunked, remaining_C_chunked).equal(C)
 
-    chunk_indices, chunk_offsets = \
-            _query_start_loc_to_chunk_indices_offsets(
-                remaining_chunked_cu_seqlens,
-                chunk_size,
-                remaining_chunked_cu_seqlens[-1])
+    cu_chunk_seqlens, last_chunk_indices, seq_idx_chunks = (
+        compute_varlen_chunk_metadata(remaining_chunked_cu_seqlens,
+                                      chunk_size))
 
     Y_chunked = torch.empty_like(remaining_X_chunked)
     state_chunked = mamba_chunk_scan_combined_varlen(
@@ -523,13 +508,13 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
         remaining_B_chunked,
         remaining_C_chunked,
         chunk_size,
+        cu_seqlens=remaining_chunked_cu_seqlens.to(torch.int32),
+        cu_chunk_seqlens=cu_chunk_seqlens,
+        last_chunk_indices=last_chunk_indices,
+        seq_idx=seq_idx_chunks,
+        out=Y_chunked,
         D=None,
-        cu_seqlens=remaining_chunked_cu_seqlens,
-        seq_idx=remaining_chunked_seq_idx,
-        chunk_indices=chunk_indices,
-        chunk_offsets=chunk_offsets,
         initial_states=partial_state,
-        out=Y_chunked,
     )
     Y = concat_batch_f(Y_partial, Y_chunked)
 
diff --git a/vllm/v1/attention/backends/mamba2_attn.py b/vllm/v1/attention/backends/mamba2_attn.py
index e4f16f37a430..68b6ff73ba3f 100644
--- a/vllm/v1/attention/backends/mamba2_attn.py
+++ b/vllm/v1/attention/backends/mamba2_attn.py
@@ -1,5 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import itertools
 from dataclasses import dataclass
 from typing import Optional
 
@@ -17,6 +18,75 @@
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 
+def compute_varlen_chunk_metadata(
+    query_start_loc: torch.Tensor,
+    chunk_size: int,
+) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
+    """
+    Build chunk-aligned, variable-length metadata used by Mamba2 SSD kernels.
+
+    Given per-sequence cumulative token starts `query_start_loc` of shape [B+1]
+    and a physical `chunk_size`, returns three tensors on the same device:
+      - cu_chunk_seqlens:  (nchunks+1,) int32   exclusive prefix-sum of
+        logical-chunk lengths (each logical chunk never crosses a sequence or
+        physical-chunk boundary).
+      - last_chunk_indices: (B,)       int32   index of the last logical chunk
+        for each sequence (=-1 for empty sequences).
+      - seq_idx_chunks:     (nchunks,) int32   sequence index for each logical
+        chunk in order.
+
+    This is intentionally lightweight and CPU-side; it mirrors the metadata
+    produced by the V1 Mamba2 meta-data builder and is exported so tests
+    (and other callers) can avoid duplicating the logic.
+    """
+    assert query_start_loc.ndim == 1, "query_start_loc must be 1-D [B+1]"
+    assert int(query_start_loc[0].item()) == 0, "query_start_loc[0] must be 0"
+    device = query_start_loc.device
+
+    qsl64 = query_start_loc.to(torch.int64)
+    starts = qsl64[:-1].tolist()
+    ends = qsl64[1:].tolist()
+    total = int(qsl64[-1].item())
+
+    chunk_lens: list[int] = []
+    seq_idx_chunks: list[int] = []
+    last_chunk_indices: list[int] = [-1] * len(starts)
+
+    for b, (s, e) in enumerate(zip(starts, ends)):
+        if e <= s:
+            # empty sequence
+            continue
+        pos = s
+        while pos < e:
+            # split at both sequence boundaries and physical chunk boundaries
+            room = chunk_size - (pos % chunk_size)
+            take = min(room, e - pos)
+            chunk_lens.append(int(take))
+            seq_idx_chunks.append(b)
+            last_chunk_indices[b] = len(chunk_lens) - 1
+            pos += take
+
+    # Exclusive prefix sum over logical-chunk lengths
+    if chunk_lens:
+        cu_chunk_seqlens = torch.tensor([0] +
+                                        list(itertools.accumulate(chunk_lens)),
+                                        device=device,
+                                        dtype=torch.int32)
+        # Final boundary must equal total tokens
+        assert int(cu_chunk_seqlens[-1].item()) == total
+    else:
+        cu_chunk_seqlens = torch.tensor([0], device=device, dtype=torch.int32)
+
+    last_chunk_indices_t = (torch.tensor(
+        last_chunk_indices, device=device, dtype=torch.int32)
+                            if len(starts) > 0 else torch.empty(
+                                (0, ), device=device, dtype=torch.int32))
+    seq_idx_chunks_t = torch.tensor(seq_idx_chunks,
+                                    device=device,
+                                    dtype=torch.int32)
+    return cu_chunk_seqlens, last_chunk_indices_t, seq_idx_chunks_t
+
+
 class Mamba2AttentionBackend(AttentionBackend):
 
     @staticmethod

From 04d85e2278c881cf16bf6b140445f22227631138 Mon Sep 17 00:00:00 2001
From: Michael Goin <mgoin64@gmail.com>
Date: Wed, 1 Oct 2025 15:02:17 -0400
Subject: [PATCH 081/193] [CI] Tweaks to GPT-OSS Eval (Blackwell) for stability
 (#26030)

Signed-off-by: mgoin <mgoin64@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .buildkite/test-pipeline.yaml                | 2 +-
 tests/evals/gpt_oss/test_gpqa_correctness.py | 5 ++---
 2 files changed, 3 insertions(+), 4 deletions(-)

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index b3d10f75ab50..c131192c56fc 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -845,7 +845,7 @@ steps:
   - vllm/v1/attention/backends/flashinfer.py
   commands:
     - uv pip install --system 'gpt-oss[eval]==0.0.5'
-    - pytest -s -v tests/evals/gpt_oss/test_gpqa_correctness.py --model openai/gpt-oss-20b --metric 0.58 --server-args '--tensor-parallel-size 2'
+    - pytest -s -v tests/evals/gpt_oss/test_gpqa_correctness.py --model openai/gpt-oss-20b --metric 0.58
 
 - label: Blackwell Quantized MoE Test
   timeout_in_minutes: 60
diff --git a/tests/evals/gpt_oss/test_gpqa_correctness.py b/tests/evals/gpt_oss/test_gpqa_correctness.py
index 4cc4041a60ce..07c04f00cd0d 100644
--- a/tests/evals/gpt_oss/test_gpqa_correctness.py
+++ b/tests/evals/gpt_oss/test_gpqa_correctness.py
@@ -26,7 +26,8 @@ def run_gpqa_eval(model_name: str, base_url: str) -> float:
     # Build the command to run the evaluation
     cmd = [
         sys.executable, "-m", "gpt_oss.evals", "--eval", "gpqa", "--model",
-        model_name, "--reasoning-effort", "low", "--base-url", base_url
+        model_name, "--reasoning-effort", "low", "--base-url", base_url,
+        "--n-threads", "200"
     ]
 
     try:
@@ -72,8 +73,6 @@ def test_gpqa_correctness(request):
 
     # Add standard server arguments
     server_args.extend([
-        "--max-model-len",
-        "32768",
         "--trust-remote-code",
     ])
 

From f8828035fefc6c556c3a83fc9359317f7daee8aa Mon Sep 17 00:00:00 2001
From: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Date: Wed, 1 Oct 2025 15:30:00 -0400
Subject: [PATCH 082/193] [BugFix][DP/EP] Fix CUTLASS MLA hang under load
 (#26026)

Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
Co-authored-by: Robert Shaw <robshaw@redhat.com>
Co-authored-by: rshaw@neuralmagic.com <rshaw@neuralmagic.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../sm100_fmha_mla_tma_warpspecialized.hpp    | 64 +++++++++----------
 1 file changed, 32 insertions(+), 32 deletions(-)

diff --git a/csrc/attention/mla/cutlass_sm100_mla/kernel/sm100_fmha_mla_tma_warpspecialized.hpp b/csrc/attention/mla/cutlass_sm100_mla/kernel/sm100_fmha_mla_tma_warpspecialized.hpp
index 2cbc2379579e..1f62c37ba4b7 100644
--- a/csrc/attention/mla/cutlass_sm100_mla/kernel/sm100_fmha_mla_tma_warpspecialized.hpp
+++ b/csrc/attention/mla/cutlass_sm100_mla/kernel/sm100_fmha_mla_tma_warpspecialized.hpp
@@ -580,22 +580,22 @@ struct Sm100FmhaMlaKernelTmaWarpspecialized {
       for (; tile_scheduler.is_valid(); ++tile_scheduler) {
         auto blk_coord = tile_scheduler.get_block_coord();
         auto problem_shape = params.problem_shape;
-	auto local_split_kv = params.split_kv;
+        auto local_split_kv = params.split_kv;
         if (params.mainloop.ptr_seq != nullptr) {
           get<1>(problem_shape) = params.mainloop.ptr_seq[get<2>(blk_coord)];
-	  if (params.ptr_split_kv != nullptr) {
+          if (params.ptr_split_kv != nullptr) {
             local_split_kv = params.ptr_split_kv[get<2>(blk_coord)];
           }
         }
-	if (local_split_kv <= get<3>(blk_coord))
-	  continue;
+        if (local_split_kv <= get<3>(blk_coord))
+          continue;
         load_page_table(
           blk_coord,
           problem_shape,
           params.mainloop,
           shared_storage.tensors,
           pipeline_page_table, pipeline_pt_producer_state,
-	  local_split_kv
+          local_split_kv
         );
       }
     }
@@ -604,15 +604,15 @@ struct Sm100FmhaMlaKernelTmaWarpspecialized {
         CUTLASS_PRAGMA_NO_UNROLL
         for (; tile_scheduler.is_valid(); ++tile_scheduler) {
           auto blk_coord = tile_scheduler.get_block_coord();
-	  auto problem_shape = params.problem_shape;
-	  auto local_split_kv = params.split_kv;
+          auto problem_shape = params.problem_shape;
+          auto local_split_kv = params.split_kv;
           if (params.mainloop.ptr_seq != nullptr) {
             get<1>(problem_shape) = params.mainloop.ptr_seq[get<2>(blk_coord)];
-	    if (params.ptr_split_kv != nullptr) {
+            if (params.ptr_split_kv != nullptr) {
               local_split_kv = params.ptr_split_kv[get<2>(blk_coord)];
             }
           }
-	  if (local_split_kv <= get<3>(blk_coord))
+          if (local_split_kv <= get<3>(blk_coord))
             continue;
           load_cpasync(
             blk_coord,
@@ -621,7 +621,7 @@ struct Sm100FmhaMlaKernelTmaWarpspecialized {
             params.mainloop_params,
             shared_storage.tensors,
             pipeline_load_qk, pipeline_load_qk_producer_state,
-	    local_split_kv,
+            local_split_kv,
             /* must be shared pipe */
             pipeline_page_table, pipeline_pt_consumer_state
           );
@@ -633,15 +633,15 @@ struct Sm100FmhaMlaKernelTmaWarpspecialized {
           CUTLASS_PRAGMA_NO_UNROLL
           for (; tile_scheduler.is_valid(); ++tile_scheduler) {
             auto blk_coord = tile_scheduler.get_block_coord();
-	    auto problem_shape = params.problem_shape;
-	    auto local_split_kv = params.split_kv;
+            auto problem_shape = params.problem_shape;
+            auto local_split_kv = params.split_kv;
             if (params.mainloop.ptr_seq != nullptr) {
               get<1>(problem_shape) = params.mainloop.ptr_seq[get<2>(blk_coord)];
-	      if (params.ptr_split_kv != nullptr) {
-	        local_split_kv = params.ptr_split_kv[get<2>(blk_coord)];
-	      }
+              if (params.ptr_split_kv != nullptr) {
+                local_split_kv = params.ptr_split_kv[get<2>(blk_coord)];
+              }
             }
-	    if (local_split_kv <= get<3>(blk_coord))
+            if (local_split_kv <= get<3>(blk_coord))
               continue;
             load_tma</* paged= */ true>(
               blk_coord,
@@ -651,7 +651,7 @@ struct Sm100FmhaMlaKernelTmaWarpspecialized {
               shared_storage.tensors,
               pipeline_load_qk, pipeline_load_qk_producer_state,
               pipeline_load_qk, pipeline_load_qk_producer_state,
-	      local_split_kv
+              local_split_kv
             );
             cutlass::arch::NamedBarrier((kNumComputeWarps + kNumLoadWarps) * NumThreadsPerWarp, kNamedBarrierEpilogue).arrive_and_wait();
           }
@@ -660,15 +660,15 @@ struct Sm100FmhaMlaKernelTmaWarpspecialized {
           CUTLASS_PRAGMA_NO_UNROLL
           for (; tile_scheduler.is_valid(); ++tile_scheduler) {
             auto blk_coord = tile_scheduler.get_block_coord();
-	    auto problem_shape = params.problem_shape;
-	    auto local_split_kv = params.split_kv;
+            auto problem_shape = params.problem_shape;
+            auto local_split_kv = params.split_kv;
             if (params.mainloop.ptr_seq != nullptr) {
               get<1>(problem_shape) = params.mainloop.ptr_seq[get<2>(blk_coord)];
-	      if (params.ptr_split_kv != nullptr) {
+              if (params.ptr_split_kv != nullptr) {
                 local_split_kv = params.ptr_split_kv[get<2>(blk_coord)];
-	      }
+              }
             }
-	    if (local_split_kv <= get<3>(blk_coord))
+            if (local_split_kv <= get<3>(blk_coord))
               continue;
             load_tma<false>(
               blk_coord,
@@ -678,7 +678,7 @@ struct Sm100FmhaMlaKernelTmaWarpspecialized {
               shared_storage.tensors,
               pipeline_load_qk, pipeline_load_qk_producer_state,
               pipeline_load_qk, pipeline_load_qk_producer_state,
-	      local_split_kv
+              local_split_kv
             );
             cutlass::arch::NamedBarrier((kNumComputeWarps + kNumLoadWarps) * NumThreadsPerWarp, kNamedBarrierEpilogue).arrive_and_wait();
           }
@@ -694,14 +694,14 @@ struct Sm100FmhaMlaKernelTmaWarpspecialized {
         for (; tile_scheduler.is_valid(); ++tile_scheduler) {
           auto blk_coord = tile_scheduler.get_block_coord();
           auto problem_shape = params.problem_shape;
-	  auto local_split_kv = params.split_kv;
+          auto local_split_kv = params.split_kv;
           if (params.mainloop.ptr_seq != nullptr) {
             get<1>(problem_shape) = params.mainloop.ptr_seq[get<2>(blk_coord)];
             if (params.ptr_split_kv != nullptr) {
                 local_split_kv = params.ptr_split_kv[get<2>(blk_coord)];
             }
           }
-	  if (local_split_kv <= get<3>(blk_coord))
+          if (local_split_kv <= get<3>(blk_coord))
             continue;
           mma(blk_coord,
             problem_shape,
@@ -711,7 +711,7 @@ struct Sm100FmhaMlaKernelTmaWarpspecialized {
             pipeline_mma_s, pipeline_mma_s_producer_state,
             pipeline_p_mma, pipeline_p_mma_consumer_state,
             pipeline_mma_o, pipeline_mma_o_producer_state,
-	    local_split_kv
+            local_split_kv
           );
         }
       }
@@ -726,15 +726,15 @@ struct Sm100FmhaMlaKernelTmaWarpspecialized {
       for (; tile_scheduler.is_valid(); ++tile_scheduler) {
         auto blk_coord = tile_scheduler.get_block_coord();
         auto problem_shape = params.problem_shape;
-	auto split_kv = params.split_kv;
-	auto local_split_kv = split_kv;
+        auto split_kv = params.split_kv;
+        auto local_split_kv = split_kv;
         if (params.mainloop.ptr_seq != nullptr) {
           get<1>(problem_shape) = params.mainloop.ptr_seq[get<2>(blk_coord)];
-	  if (params.ptr_split_kv != nullptr) {
+          if (params.ptr_split_kv != nullptr) {
             local_split_kv = params.ptr_split_kv[get<2>(blk_coord)];
           }
         }
-	if (local_split_kv <= get<3>(blk_coord))
+        if (local_split_kv <= get<3>(blk_coord))
           continue;
         compute(
           blk_coord,
@@ -745,7 +745,7 @@ struct Sm100FmhaMlaKernelTmaWarpspecialized {
           pipeline_mma_s, pipeline_mma_s_consumer_state,
           pipeline_p_mma, pipeline_p_mma_producer_state,
           pipeline_mma_o, pipeline_mma_o_consumer_state,
-	  local_split_kv
+          local_split_kv
         );
       }
 
@@ -1900,7 +1900,7 @@ struct Sm100FmhaMlaKernelTmaWarpspecialized {
       cutlass::arch::NamedBarrier(
           (kNumComputeWarps + kNumLoadWarps) * NumThreadsPerWarp,
           kNamedBarrierEpilogue
-      ).arrive();
+      ).arrive_and_wait();
 
       return;
     }

From 56c7852b9f4843f7a412d303b941d68fa594e4c1 Mon Sep 17 00:00:00 2001
From: Hosang <156028780+hyoon1@users.noreply.github.com>
Date: Wed, 1 Oct 2025 17:39:49 -0400
Subject: [PATCH 083/193] [ROCm][Build] Add support for AMD Ryzen AI MAX / AI
 300 Series (#25908)

Signed-off-by: Hosang Yoon <hosang.yoon@amd.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 CMakeLists.txt              | 2 +-
 csrc/rocm/attention.cu      | 3 ++-
 docker/Dockerfile.rocm_base | 4 ++--
 3 files changed, 5 insertions(+), 4 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index f07ca9282563..5f2c43fea284 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -37,7 +37,7 @@ install(CODE "set(CMAKE_INSTALL_LOCAL_ONLY TRUE)" ALL_COMPONENTS)
 set(PYTHON_SUPPORTED_VERSIONS "3.9" "3.10" "3.11" "3.12" "3.13")
 
 # Supported AMD GPU architectures.
-set(HIP_SUPPORTED_ARCHS "gfx906;gfx908;gfx90a;gfx942;gfx950;gfx1030;gfx1100;gfx1101;gfx1200;gfx1201")
+set(HIP_SUPPORTED_ARCHS "gfx906;gfx908;gfx90a;gfx942;gfx950;gfx1030;gfx1100;gfx1101;gfx1200;gfx1201;gfx1150;gfx1151")
 
 #
 # Supported/expected torch versions for CUDA/ROCm.
diff --git a/csrc/rocm/attention.cu b/csrc/rocm/attention.cu
index 133a545045b1..df3208a120f1 100644
--- a/csrc/rocm/attention.cu
+++ b/csrc/rocm/attention.cu
@@ -40,7 +40,8 @@ using __hip_fp8_e5m2 = __hip_fp8_e5m2_fnuz;
   #define __HIP__FP8MFMA__
 #endif
 
-#if defined(__HIPCC__) && (defined(__gfx1100__) || defined(__gfx1101__))
+#if defined(__HIPCC__) && (defined(__gfx1100__) || defined(__gfx1101__) || \
+                           defined(__gfx1150__) || defined(__gfx1151__))
   #define __HIP__GFX11__
 #endif
 
diff --git a/docker/Dockerfile.rocm_base b/docker/Dockerfile.rocm_base
index 87fcb18b1c03..873c2fbcd4d3 100644
--- a/docker/Dockerfile.rocm_base
+++ b/docker/Dockerfile.rocm_base
@@ -15,7 +15,7 @@ FROM ${BASE_IMAGE} AS base
 ENV PATH=/opt/rocm/llvm/bin:/opt/rocm/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin
 ENV ROCM_PATH=/opt/rocm
 ENV LD_LIBRARY_PATH=/opt/rocm/lib:/usr/local/lib:
-ARG PYTORCH_ROCM_ARCH=gfx90a;gfx942;gfx950;gfx1100;gfx1101;gfx1200;gfx1201
+ARG PYTORCH_ROCM_ARCH=gfx90a;gfx942;gfx950;gfx1100;gfx1101;gfx1200;gfx1201;gfx1150;gfx1151
 ENV PYTORCH_ROCM_ARCH=${PYTORCH_ROCM_ARCH}
 ENV AITER_ROCM_ARCH=gfx942;gfx950
 
@@ -141,4 +141,4 @@ RUN echo "BASE_IMAGE: ${BASE_IMAGE}" > /app/versions.txt \
     && echo "FA_BRANCH: ${FA_BRANCH}" >> /app/versions.txt \
     && echo "FA_REPO: ${FA_REPO}" >> /app/versions.txt \
     && echo "AITER_BRANCH: ${AITER_BRANCH}" >> /app/versions.txt \
-    && echo "AITER_REPO: ${AITER_REPO}" >> /app/versions.txt
\ No newline at end of file
+    && echo "AITER_REPO: ${AITER_REPO}" >> /app/versions.txt

From 0a212d53d27fb75453e6cd8246a0cc32f6d0efea Mon Sep 17 00:00:00 2001
From: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Date: Wed, 1 Oct 2025 18:16:26 -0400
Subject: [PATCH 084/193] [Bug] Fix Negative Cuda Memory Usage (#25683)

Signed-off-by: yewentao256 <zhyanwentao@126.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/v1/worker/gpu_model_runner.py | 6 ++++--
 1 file changed, 4 insertions(+), 2 deletions(-)

diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 9941cacae8ab..efb4a8c0054f 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -3517,7 +3517,6 @@ def capture_model(self) -> int:
         compilation_counter.num_gpu_runner_capture_triggers += 1
 
         start_time = time.perf_counter()
-        start_free_gpu_memory = torch.cuda.mem_get_info()[0]
 
         @contextmanager
         def freeze_gc():
@@ -3540,6 +3539,7 @@ def freeze_gc():
         # can reuse the memory pool allocated for the large shapes.
         set_cudagraph_capturing_enabled(True)
         with freeze_gc(), graph_capture(device=self.device):
+            start_free_gpu_memory = torch.cuda.mem_get_info()[0]
             cudagraph_mode = self.compilation_config.cudagraph_mode
             assert cudagraph_mode is not None
             if cudagraph_mode.mixed_mode() != CUDAGraphMode.NONE:
@@ -3568,6 +3568,9 @@ def freeze_gc():
                     cudagraph_runtime_mode=CUDAGraphMode.FULL,
                     uniform_decode=True)
 
+            torch.cuda.synchronize()
+            end_free_gpu_memory = torch.cuda.mem_get_info()[0]
+
         # Disable cudagraph capturing globally, so any unexpected cudagraph
         # capturing will be detected and raise an error after here.
         # Note: We don't put it into graph_capture context manager because
@@ -3576,7 +3579,6 @@ def freeze_gc():
         set_cudagraph_capturing_enabled(False)
 
         end_time = time.perf_counter()
-        end_free_gpu_memory = torch.cuda.mem_get_info()[0]
         elapsed_time = end_time - start_time
         cuda_graph_size = start_free_gpu_memory - end_free_gpu_memory
         # This usually takes 5~20 seconds.

From 4fff719dd5c5f89b02d94f30975830591b678545 Mon Sep 17 00:00:00 2001
From: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Date: Wed, 1 Oct 2025 19:28:00 -0400
Subject: [PATCH 085/193] [BugFix] ChunkedLocalAttention is currently not CG
 compatible (#26034)

Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/attention/layers/chunked_local_attention.py | 8 +++++---
 1 file changed, 5 insertions(+), 3 deletions(-)

diff --git a/vllm/attention/layers/chunked_local_attention.py b/vllm/attention/layers/chunked_local_attention.py
index 3964eca7d36b..2d11b2238e78 100644
--- a/vllm/attention/layers/chunked_local_attention.py
+++ b/vllm/attention/layers/chunked_local_attention.py
@@ -1,7 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 import functools
-from typing import List, Optional
+from typing import ClassVar, List, Optional
 
 import torch
 
@@ -12,8 +12,8 @@
 from vllm.config import CacheConfig
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.v1.attention.backends.utils import (
-    CommonAttentionMetadata, make_local_attention_virtual_batches,
-    subclass_attention_backend)
+    AttentionCGSupport, CommonAttentionMetadata,
+    make_local_attention_virtual_batches, subclass_attention_backend)
 
 from ..layer import Attention
 
@@ -29,6 +29,8 @@ def create_chunked_local_attention_backend(
     underlying_builder = underlying_attn_backend.get_builder_cls()
 
     class ChunkedLocalAttentionBuilder(underlying_builder):  # type: ignore
+        cudagraph_support: ClassVar[AttentionCGSupport] = \
+            AttentionCGSupport.NEVER
 
         def build(self,
                   common_prefix_len: int,

From ac1dec8444af059e6d309b6f32f56b6f3b03e808 Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Wed, 1 Oct 2025 16:39:29 -0700
Subject: [PATCH 086/193] Support RL online quantization with torchao (#23014)

Signed-off-by: Jerry Zhang <jerryzh168@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/quantization/test_torchao.py            | 126 +++++++++-
 .../layers/quantization/torchao.py            |  72 +++++-
 .../model_loader/default_loader.py            |  31 ++-
 .../model_loader/online_quantization.py       | 217 ++++++++++++++++++
 vllm/model_executor/model_loader/utils.py     |   9 +-
 .../model_loader/weight_utils.py              |  26 +++
 6 files changed, 465 insertions(+), 16 deletions(-)
 create mode 100644 vllm/model_executor/model_loader/online_quantization.py

diff --git a/tests/quantization/test_torchao.py b/tests/quantization/test_torchao.py
index 8e68f6a2e019..37cf7ef8417b 100644
--- a/tests/quantization/test_torchao.py
+++ b/tests/quantization/test_torchao.py
@@ -20,7 +20,6 @@ def test_pre_quantized_model(vllm_runner):
         output = llm.generate_greedy(["The capital of France is"],
                                      max_tokens=32)
     assert output
-    print(output)
 
 
 @pytest.mark.skipif(not TORCHAO_AVAILABLE, reason="torchao is not available")
@@ -42,7 +41,6 @@ def test_opt_125m_int8wo_model_loading_with_params(vllm_runner,
                                      max_tokens=32)
 
         assert output
-        print(output)
 
 
 @pytest.mark.skipif(not TORCHAO_AVAILABLE, reason="torchao is not available")
@@ -57,7 +55,6 @@ def test_opt_125m_int4wo_model_per_module_quant(vllm_runner):
                                      max_tokens=32)
 
         assert output
-        print(output)
 
 
 @pytest.mark.skipif(not TORCHAO_AVAILABLE, reason="torchao is not available")
@@ -72,7 +69,6 @@ def test_qwenvl_int8wo_model_loading_with_params(vllm_runner):
                                      max_tokens=32)
 
         assert output
-        print(output)
 
 
 @pytest.mark.skipif(not TORCHAO_AVAILABLE, reason="torchao is not available")
@@ -92,7 +88,127 @@ def test_opt_125m_awq_int4wo_model_loading_with_params(vllm_runner):
                                      max_tokens=32)
 
         assert output
-        print(output)
+
+
+@pytest.mark.skipif(not TORCHAO_AVAILABLE, reason="torchao is not available")
+def test_on_the_fly_quant_config_dict_json(vllm_runner):
+    """Testing on the fly quantization, load_weights integration point,
+    with config dict serialized to json string
+    """
+    torch._dynamo.reset()
+    model_name = "facebook/opt-125m"
+
+    import json
+
+    from torchao.core.config import config_to_dict
+    from torchao.quantization import (
+        Float8DynamicActivationFloat8WeightConfig, PerRow)
+
+    torchao_quant_config = Float8DynamicActivationFloat8WeightConfig(
+        granularity=PerRow())
+    hf_overrides = {
+        "quantization_config_dict_json":
+        json.dumps(config_to_dict(torchao_quant_config))
+    }
+    with vllm_runner(model_name=model_name,
+                     dtype="bfloat16",
+                     pt_load_map_location="cuda:0",
+                     quantization="torchao",
+                     hf_overrides=hf_overrides) as llm:
+        output = llm.generate_greedy(["The capital of France is"],
+                                     max_tokens=32)
+
+        assert output
+
+
+@pytest.mark.skipif(not TORCHAO_AVAILABLE, reason="torchao is not available")
+def test_on_the_fly_quant_config_file(vllm_runner):
+    """Testing on the fly quantization, load_weights integration point,
+    with config file
+    """
+    torch._dynamo.reset()
+    model_name = "facebook/opt-125m"
+    import json
+    from tempfile import NamedTemporaryFile
+
+    from torchao.core.config import config_to_dict
+    from torchao.quantization import (
+        Float8DynamicActivationFloat8WeightConfig, PerRow)
+
+    config = Float8DynamicActivationFloat8WeightConfig(granularity=PerRow())
+
+    with NamedTemporaryFile(mode="w", delete=False) as f:
+        f.write(json.dumps(config_to_dict(config)))
+        # close the file to save it
+        f.close()
+        config_file_name = str(f.name)
+
+        hf_overrides = {"quantization_config_file": config_file_name}
+        with vllm_runner(model_name=model_name,
+                         dtype="bfloat16",
+                         pt_load_map_location="cuda:0",
+                         quantization="torchao",
+                         hf_overrides=hf_overrides) as llm:
+            output = llm.generate_greedy(["The capital of France is"],
+                                         max_tokens=32)
+
+            assert output
+
+
+@pytest.mark.skipif(not TORCHAO_AVAILABLE, reason="torchao is not available")
+def test_reload_weights():
+    import json
+
+    from torchao.core.config import config_to_dict
+    from torchao.quantization import (
+        Float8DynamicActivationFloat8WeightConfig, PerRow)
+
+    from vllm import LLM, SamplingParams
+
+    torchao_quant_config = Float8DynamicActivationFloat8WeightConfig(
+        granularity=PerRow())
+
+    hf_overrides = {
+        "quantization_config_dict_json":
+        json.dumps(config_to_dict(torchao_quant_config))
+    }
+
+    llm = LLM(
+        model="Qwen/Qwen3-0.6B",
+        dtype="bfloat16",
+        load_format="dummy",
+        enforce_eager=True,
+        quantization="torchao",
+        hf_overrides=hf_overrides,
+    )
+    # Update load format from `dummy` to `auto`
+    llm.collective_rpc("update_config",
+                       args=({
+                           "load_config": {
+                               "load_format": "auto"
+                           }
+                       }, ))
+    # Now reload real weights inplace
+    llm.collective_rpc("reload_weights")
+    prompts = [
+        "Hello, my name is",
+        "The president of the United States is",
+        "The capital of France is",
+        "The future of AI is",
+    ]
+    # Create a sampling params object.
+    sampling_params = SamplingParams(temperature=0, top_p=0.95)
+    outputs = llm.generate(prompts, sampling_params)
+    # make sure it runs
+    for output in outputs:
+        generated_text = output.outputs[0].text
+        assert generated_text
+        # can also uncomment locally to make sure the generated
+        # output makes sense
+        # prompt = output.prompt
+        # print(f"Prompt:    {prompt!r}")
+        # print(f"Output:    {generated_text!r}")
+        # print("-" * 60)
 
 
 if __name__ == "__main__":
diff --git a/vllm/model_executor/layers/quantization/torchao.py b/vllm/model_executor/layers/quantization/torchao.py
index 2efb605f203f..7e38304ad6d9 100644
--- a/vllm/model_executor/layers/quantization/torchao.py
+++ b/vllm/model_executor/layers/quantization/torchao.py
@@ -1,5 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import json
 from typing import Any, Optional
 
 import torch
@@ -40,7 +41,8 @@ class TorchAOConfig(QuantizationConfig):
 
     def __init__(self,
                  torchao_config,
-                 skip_modules: Optional[list[str]] = None) -> None:
+                 skip_modules: Optional[list[str]] = None,
+                 is_checkpoint_torchao_serialized: bool = False) -> None:
         """
         # TorchAO quantization relies on tensor subclasses. In order,
         # to enable proper caching this needs standalone compile
@@ -58,9 +60,11 @@ def __init__(self,
         super().__init__()
         self.torchao_config = torchao_config
         self.skip_modules = skip_modules or []
+        self.is_checkpoint_torchao_serialized = is_checkpoint_torchao_serialized
 
     def __repr__(self) -> str:
-        return f"TorchAOConfig({self.torchao_config})"
+        return f"TorchAOConfig({self.torchao_config=}, {self.skip_modules=}, " \
+            f"{self.is_checkpoint_torchao_serialized=})"
 
     def get_name(self) -> QuantizationMethods:
         return "torchao"
@@ -74,7 +78,10 @@ def get_min_capability(cls) -> int:
 
     @staticmethod
     def get_config_filenames() -> list[str]:
-        return ["config.json"]
+        """torchao doesn't require additional config files, we use
+        `config.json` from huggingface: `model_config.hf_config`
+        """
+        return []
 
     @classmethod
     def from_config(cls, config: dict[str, Any]) -> "TorchAOConfig":
@@ -87,6 +94,10 @@ def from_config(cls, config: dict[str, Any]) -> "TorchAOConfig":
                 "`pip install torchao>=0.10.0` to use torchao quantization."
             ) from err
 
+        quant_method = cls.get_from_keys_or(config, ["quant_method"], None)
+        is_checkpoint_torchao_serialized = (quant_method is not None
+                                            and "torchao" in quant_method)
+
         hf_config = cls.get_from_keys_or(config, ["quant_type"], None)
         assert hf_config is not None, "quant_type must be specified"
         assert len(hf_config) == 1 and "default" in hf_config, (
@@ -110,7 +121,38 @@ def from_config(cls, config: dict[str, Any]) -> "TorchAOConfig":
             if layer_cfg is None:
                 skip_modules.append(layer)
 
-        return cls(ao_config, skip_modules)
+        return cls(ao_config, skip_modules, is_checkpoint_torchao_serialized)
+
+    @classmethod
+    def from_config_file(cls, config_file: str) -> "TorchAOConfig":
+        """Initialize class from a config file. Example:
+        ```
+        config = (
+           Float8DynamicActivationFloat8WeightConfig(granularity=PerRow())
+        )
+        fn = "torchao_config.json"
+
+        with open(fn, "w") as f:
+            f.write(json.dumps(config_to_dict(config)))
+        ```
+        """
+        with open(config_file) as f:
+            f.seek(0)
+            f_read = f.read()
+            config_dict = json.loads(f_read)
+
+        hf_config = {"quant_type": {"default": config_dict}}
+        return cls.from_config(hf_config)
+
+    @classmethod
+    def from_config_dict_json(cls, config_dict_json: str) -> "TorchAOConfig":
+        """Iniitalize class from a config_dict json string, got from
+        torchao_config_object = some AOBaseConfig object
+        json.dumps(config_to_dict(torchao_config_object))
+        """
+        config_dict = json.loads(config_dict_json)
+        hf_config = {"quant_type": {"default": config_dict}}
+        return cls.from_config(hf_config)
 
     def get_quant_method(self, layer: torch.nn.Module,
                          prefix: str) -> Optional["QuantizeMethodBase"]:
@@ -128,7 +170,9 @@ def get_quant_method(self, layer: torch.nn.Module,
             c = module_fqn_to_config.get(
                 module_fqn) or module_fqn_to_config.get("_default", None)
             if c is not None:
-                current_torchao_config = TorchAOConfig(c, self.skip_modules)
+                current_torchao_config = TorchAOConfig(
+                    c, self.skip_modules,
+                    self.is_checkpoint_torchao_serialized)
                 return TorchAOLinearMethod(current_torchao_config)
             else:
                 return UnquantizedLinearMethod()
@@ -172,7 +216,7 @@ class TorchAOLinearMethod(LinearMethodBase):
     """Linear method for torchao.
 
     Args:
-        quant_config: The torchao quantization config, a string that encodes 
+        quant_config: The torchao quantization config, a string that encodes
             the type of quantization and all relevant arguments.
     """
 
@@ -197,8 +241,9 @@ def create_weights(
             ),
             requires_grad=False,
         )
-        weight = torchao_quantize_param_data(weight,
-                                             self.quant_config.torchao_config)
+        if self.quant_config.is_checkpoint_torchao_serialized:
+            weight = torchao_quantize_param_data(
+                weight, self.quant_config.torchao_config)
 
         set_weight_attrs(weight, {"input_dim": 1, "output_dim": 0})
 
@@ -212,3 +257,14 @@ def apply(
         bias: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
         return F.linear(x, layer.weight, bias)
+
+    def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
+        if self.quant_config.is_checkpoint_torchao_serialized:
+            return
+
+        # quantize the weight on the fly if the checkpoint is not already
+        # quantized by torchao
+        weight = torchao_quantize_param_data(layer.weight,
+                                             self.quant_config.torchao_config)
+        set_weight_attrs(weight, {"input_dim": 1, "output_dim": 0})
+        layer.register_parameter("weight", weight)
diff --git a/vllm/model_executor/model_loader/default_loader.py b/vllm/model_executor/model_loader/default_loader.py
index 4b7bcd37d4bc..8e2db9292ff8 100644
--- a/vllm/model_executor/model_loader/default_loader.py
+++ b/vllm/model_executor/model_loader/default_loader.py
@@ -261,8 +261,35 @@ def download_model(self, model_config: ModelConfig) -> None:
     def load_weights(self, model: nn.Module,
                      model_config: ModelConfig) -> None:
         weights_to_load = {name for name, _ in model.named_parameters()}
-        loaded_weights = model.load_weights(
-            self.get_all_weights(model_config, model))
+
+        # if we don't have `model.weight_metadata_and_attr_saved` defined and
+        # set to True, it means that this is either offline quantization case
+        # or the first run of online quantization
+        # see online_quantization.py for detailed notes
+        offline_quantization_or_first_run_of_online_quantization = not getattr(
+            model, "weight_metadata_and_attr_saved", False)
+
+        if model_config.quantization is None:
+            # model is not quantized
+            loaded_weights = model.load_weights(
+                self.get_all_weights(model_config, model))
+        elif offline_quantization_or_first_run_of_online_quantization:
+            # case 1: offline quantized checkpoint
+            # case 2: Step I1 first run of weight loading with
+            # online quantization
+            # see online_quantization.py for detailed notes
+            loaded_weights = model.load_weights(
+                self.get_all_weights(model_config, model))
+        else:
+            # to avoid circular dependency
+            from vllm.model_executor.model_loader.online_quantization import (
+                load_weights_and_online_quantize)
+
+            # subsequent runs of weight loading with online
+            # quantization
+            loaded_weights = load_weights_and_online_quantize(
+                self, model, model_config)
+
         self.counter_after_loading_weights = time.perf_counter()
         logger.info(
             "Loading weights took %.2f seconds",
diff --git a/vllm/model_executor/model_loader/online_quantization.py b/vllm/model_executor/model_loader/online_quantization.py
new file mode 100644
index 000000000000..beec2d20ad69
--- /dev/null
+++ b/vllm/model_executor/model_loader/online_quantization.py
@@ -0,0 +1,217 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+import types
+
+import torch
+from torch import nn
+
+from vllm.config import ModelConfig
+from vllm.logger import init_logger
+from vllm.model_executor.model_loader.default_loader import DefaultModelLoader
+from vllm.model_executor.model_loader.utils import (
+    process_weights_after_loading)
+
+logger = init_logger(__name__)
+
+# Notes for Online Quantization
+# In terms of state of checkpoints, quantization config and their
+# correspondance to online quantization:
+# | Use Case      | Checkpoints          |  model_config.quantization |
+# | no quant      | high precision       |  None   |
+# | offline quant | quantized |  fp8, torchao etc. |
+# | online quant  | high precision | torchao etc. |
+#
+# The process for loading non-quantized checkpoint
+# 1. load non-quantized weights (load_weights)
+# 2. do any additional post processing (process_weights_after_loading)
+#
+# The process for loading offline quantized checkpoint
+# 1. load offline-quantized weights (load_weights)
+# 2. do any additional post processing (process_weights_after_loading)
+
+# The process for unquantized model reloading
+# (repeated run in RL training loop)
+# first run
+#   UI1. load_weights: load bfloat16 weights
+#   UI2. process_weights_after_loading: any additional post processing
+# subsequent run
+#   UC1: load_weights: load bfloat16 weights
+#      (shouldn't be any issues since we didn't change any attributes
+#       of the weights)
+#   UC2: process_weights_after_loading: any additional post processing
+
+# The process for weight reloading with online quantization
+# (repeated run in RL training loop)
+# first run
+#  I1. load_weights: load bfloat16 weights
+#  I2. process_weights_after_loading:
+#        record weight metadata and attributes for R1 and R2
+#        quantize weights to fp8
+# subsequent run
+#  (beginning model weight is in fp8)
+#  load_weights:
+#    R1. restore bfloat16 model weight metadata
+#    R2. restore the model weight attributes
+#    R3. reload bfloat16 weights
+#    R4. quantize weights (by calling process_weights_after_loading),
+#    also set `process_weights_after_loading_already_called` to
+#    True to stop it from running again
+#  process_weights_after_loading (if called):
+#    this will be skipped since it's already ran in
+#    load_weights
+
+
+def maybe_save_metadata_and_attributes_for_weight_reloading(
+        model: nn.Module, model_config: ModelConfig):
+    # following is to support on the fly quantization, currently only supported
+    # for torchao
+    if model_config.quantization != "torchao":
+        return
+
+    if getattr(model, "process_weights_after_loading_already_called", False):
+        # In case `process_weights_after_loading` is called multiple times
+        # we'll skip it at later times
+        logger.warning(
+            "process_weights_after_loading already called for model %s", model)
+        return
+
+    from vllm.model_executor.model_loader.weight_utils import get_quant_config
+    quant_config = get_quant_config(model_config, None)
+
+    # If checkpoint is already torchao serialized, this means it's
+    # pre-quantized quantization case, we'll skip saving the metadata
+    # Otherwise, this is Step I2 of initialization steps of
+    # online quantization
+    # This step record the weights metadata and weight attributes so we can
+    # restore the bfloat16 model weights during the relad step (R1 and R2)
+    # see Notes in online_quantization.py for more details
+    if not (hasattr(quant_config, "is_checkpoint_torchao_serialized") and \
+       not quant_config.is_checkpoint_torchao_serialized):
+        return
+
+    # This is the I2 step of online quantiztion that saves
+    # metadata and attributes of weights so they can be used in R1 and
+    # R2 step, note that we only save these during initialization
+
+    # Includes two things
+    # 1. save floating point metadata (shape, dtype, device) for init
+    # 2. save weight attributes, e.g. `output_dim`, `weight_loader` for init
+
+    if getattr(model, "weight_metadata_and_attr_saved", False):
+        return
+
+    # save the dtype, shape and device for model parameter, used for
+    # restoring the model high precision parameters before
+    # reloading the weights
+    assert not hasattr(model, "original_weights_rebuild_keys")
+    model.original_weights_rebuild_keys = {}
+    for name, p in model.named_parameters():
+        model.original_weights_rebuild_keys[name] = {
+            "shape": p.shape,
+            "dtype": p.dtype,
+            "device": p.device,
+        }
+
+    # record the weight attributes (loader functions etc.)
+    # so these can be recovered later when we reload the weights
+    # structure: {"weight_name": {"weight_attr_key": attr}}
+    assert not hasattr(model, "recorded_weight_attr")
+    model.recorded_weight_attr = {}
+    for name, param in model.named_parameters():
+        model.recorded_weight_attr[name] = {}
+        for key in param.__dict__:
+            if hasattr(param, key):
+                attr = getattr(param, key)
+                if not callable(attr):
+                    model.recorded_weight_attr[name][key] = attr
+                elif hasattr(attr, "__self__") and param is attr.__self__:
+                    # if attr is a bonded method for an instance, and
+                    # attr.__self__ points to the instance (param)
+                    # we'll record the underlying function object
+                    model.recorded_weight_attr[name][key] = attr.__func__
+                else:
+                    model.recorded_weight_attr[name][key] = attr
+    # mark the metadata and attributes saved so we don't run it again
+    model.weight_metadata_and_attr_saved = True
+
+
+def _bond_method_to_cls(func, obj):
+    if hasattr(func, "__self__") or not callable(func):
+        # If the function is already bound to an instance, return it as is
+        return func
+    else:
+        return types.MethodType(func, obj)
+
+
+def load_weights_and_online_quantize(model_loader: DefaultModelLoader,
+                                     model: nn.Module,
+                                     model_config: ModelConfig) -> set[str]:
+    # online quantization, right now only enabled for
+    # torchao
+    # R1, R2, R3, R4 in the Notes
+
+    # TODO: Add fp8 support
+    assert model_config.quantization == "torchao", "online " \
+        "quantization is only enabled for torchao currently"
+    # TODO: use create_weights to restore the weights to original state
+
+    # Step R1: First restore the quantized weights to original bfloat16
+    # weights, with original metadata (shape, dtype, device)
+    # and attributes, so that bfloat16 weights can be loaded properly
+    existing_param_names = dict(
+        model.named_parameters(remove_duplicate=False)).keys()
+    named_modules = dict(model.named_modules(remove_duplicate=False))
+    model_device = None
+
+    # Step R2: recover the parameter to the state before first loading
+    for name, d in model.original_weights_rebuild_keys.items():
+        _shape = d["shape"]
+        _dtype = d["dtype"]
+        _device = d["device"]
+        if model_device is not None:
+            assert model_device == _device, "Expecting all weights " \
+                "to be in the same device for now, got both: " \
+                f"{model_device} and {_device}"
+        else:
+            model_device = _device
+
+        if name in existing_param_names:
+            module_name, weight_name = name.rsplit(".", 1)
+            module = named_modules[module_name]
+            setattr(
+                module, weight_name,
+                torch.nn.Parameter(
+                    torch.empty(_shape, dtype=_dtype, device=_device)))
+
+    # recorded_weight_attr is
+    # {"weight_name": {"weight_attr_key": attr}}
+    # e.g.
+    # {
+    #   {
+    #     "layer.0.weight": {
+    #       "weight_loader": weight_loader_function_object,
+    #       "input_dim": 0, ...
+    #     },
+    #     "layer.1.weight": ...,
+    #    }
+    # }
+    for full_weight_name, weight_attr_dict in \
+            model.recorded_weight_attr.items():
+        for attr_name, attr in weight_attr_dict.items():
+            module_name, weight_name = full_weight_name.rsplit(".", 1)
+            module = named_modules[module_name]
+            weight = getattr(module, weight_name)
+            if not hasattr(weight, attr_name):
+                setattr(weight, attr_name, _bond_method_to_cls(attr, weight))
+
+    # Step I1: reload bfloat16 / high precision weights
+    loaded_weights = model.load_weights(
+        model_loader.get_all_weights(model_config, model))
+
+    # Step I2: online quantize the weights
+    # manually process weights after loading
+    model.process_weights_after_loading_already_called = False
+    process_weights_after_loading(model, model_config, model_device)
+    model.process_weights_after_loading_already_called = True
+    return loaded_weights
diff --git a/vllm/model_executor/model_loader/utils.py b/vllm/model_executor/model_loader/utils.py
index 03202e13c280..293edadcc240 100644
--- a/vllm/model_executor/model_loader/utils.py
+++ b/vllm/model_executor/model_loader/utils.py
@@ -95,6 +95,13 @@ def initialize_model(
 
 def process_weights_after_loading(model: nn.Module, model_config: ModelConfig,
                                   target_device: torch.device) -> None:
+
+    # to avoid circular dependency
+    from vllm.model_executor.model_loader.online_quantization import (
+        maybe_save_metadata_and_attributes_for_weight_reloading)
+    maybe_save_metadata_and_attributes_for_weight_reloading(
+        model, model_config)
+
     for _, module in model.named_modules():
         if isinstance(module, QKVCrossParallelLinear):
             # NOTE(Isotr0py): special case for cross QKV layer because
@@ -243,7 +250,7 @@ def get_architecture_class_name(model_config: ModelConfig) -> str:
 class ParamMapping:
     """
     A class to handle parameter mapping for model weight loading.
-    It creates a bidirectional mapping between packed parameters and their 
+    It creates a bidirectional mapping between packed parameters and their
     constituent parts.
     """
     packed_mapping: dict[str, list[str]]
diff --git a/vllm/model_executor/model_loader/weight_utils.py b/vllm/model_executor/model_loader/weight_utils.py
index f52d9dd2f534..bbed43b17543 100644
--- a/vllm/model_executor/model_loader/weight_utils.py
+++ b/vllm/model_executor/model_loader/weight_utils.py
@@ -246,8 +246,34 @@ def get_quant_config(model_config: ModelConfig,
         # compressed-tensors uses a compressions_config
         hf_quant_config = getattr(model_config.hf_config, "compression_config",
                                   None)
+
     if hf_quant_config is not None:
         return quant_cls.from_config(hf_quant_config)
+
+    # if hf_quant_config is None, we will try to get config from
+    # hf_overrides
+    hf_overrides = model_config.hf_overrides
+    quantization_config_file = hf_overrides.get("quantization_config_file",
+                                                None)
+    if quantization_config_file is not None:
+        if hasattr(quant_cls, "from_config_file"):
+            return quant_cls.from_config_file(quantization_config_file)
+        else:
+            raise NotImplementedError(
+                "from_config_file is specified in hf_override config, "
+                "but quant_cls.from_config_file is not implemented in "
+                f"{quant_cls}")
+    quantization_config_json = hf_overrides.get(
+        "quantization_config_dict_json", None)
+    if quantization_config_json is not None:
+        if hasattr(quant_cls, "from_config_dict_json"):
+            return quant_cls.from_config_dict_json(quantization_config_json)
+        else:
+            raise NotImplementedError(
+                "from_config_dict_json is specified in hf_override config, "
+                "but quant_cls.from_config_dict_json is not implemented in "
+                f"{quant_cls}")
+
     # Inflight BNB quantization
     if model_config.quantization == "bitsandbytes":
         return quant_cls.from_config({})

From abc3966f602b5333a0165eac7ac629eb0e82f552 Mon Sep 17 00:00:00 2001
From: Gregory Shtrasberg <156009573+gshtras@users.noreply.github.com>
Date: Wed, 1 Oct 2025 22:23:14 -0400
Subject: [PATCH 087/193] [ROCm][Bugfix] Add missing parameter to ROCm backend
 (#26029)

Signed-off-by: Gregory Shtrasberg <Gregory.Shtrasberg@amd.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/v1/attention/backends/rocm_attn.py | 1 +
 1 file changed, 1 insertion(+)

diff --git a/vllm/v1/attention/backends/rocm_attn.py b/vllm/v1/attention/backends/rocm_attn.py
index e973be16d779..37fc85bf351a 100644
--- a/vllm/v1/attention/backends/rocm_attn.py
+++ b/vllm/v1/attention/backends/rocm_attn.py
@@ -175,6 +175,7 @@ def get_kv_cache_shape(
         block_size: int,
         num_kv_heads: int,
         head_size: int,
+        cache_dtype_str: str = "auto",
     ) -> tuple[int, ...]:
         if block_size % 16 != 0:
             raise ValueError("Block size must be a multiple of 16.")

From 79c8bededa25e1e691553867d3ccc1ea255adaa1 Mon Sep 17 00:00:00 2001
From: Nick Hill <nhill@redhat.com>
Date: Wed, 1 Oct 2025 19:31:39 -0700
Subject: [PATCH 088/193] [Misc] Make handling of SamplingParams clearer in n>1
 case (#26032)

Signed-off-by: Nick Hill <nhill@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/v1/engine/async_llm.py | 16 +++++++++++-----
 1 file changed, 11 insertions(+), 5 deletions(-)

diff --git a/vllm/v1/engine/async_llm.py b/vllm/v1/engine/async_llm.py
index 574f8b19c379..36d0d50bf23d 100644
--- a/vllm/v1/engine/async_llm.py
+++ b/vllm/v1/engine/async_llm.py
@@ -289,13 +289,19 @@ async def add_request(
             await self._add_request(request, prompt_str, None, 0, queue)
             return queue
 
+        # Get the updated SamplingParams from the request, which
+        # were cloned/updated in processor.process_inputs above.
+        parent_params = request.sampling_params
+        assert parent_params is not None
+
         # Fan out child requests (for n>1).
-        parent_request = ParentRequest(request_id, request.sampling_params)
-        for idx in range(params.n):
-            request_id, params = parent_request.get_child_info(idx)
-            child_request = request if idx == params.n - 1 else copy(request)
+        parent_request = ParentRequest(request_id, parent_params)
+        for idx in range(parent_params.n):
+            request_id, child_params = parent_request.get_child_info(idx)
+            child_request = request if idx == parent_params.n - 1 else copy(
+                request)
             child_request.request_id = request_id
-            child_request.sampling_params = params
+            child_request.sampling_params = child_params
             await self._add_request(child_request, prompt_str, parent_request,
                                     idx, queue)
         return queue

From ec625a797878f109a205147fc8dc9738adb6be55 Mon Sep 17 00:00:00 2001
From: pwschuurman <psch@google.com>
Date: Wed, 1 Oct 2025 20:59:13 -0700
Subject: [PATCH 089/193] Run:ai model streamer add GCS package support
 (#24909)

Signed-off-by: Peter Schuurman <psch@google.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../models/extensions/runai_model_streamer.md |  7 +++++
 requirements/nightly_torch_test.txt           |  2 +-
 requirements/rocm.txt                         |  4 +--
 requirements/test.in                          |  2 +-
 requirements/test.txt                         | 21 ++++++++++++++-
 .../runai_model_streamer/test_runai_utils.py  | 27 ++++++++++++++++---
 6 files changed, 54 insertions(+), 9 deletions(-)

diff --git a/docs/models/extensions/runai_model_streamer.md b/docs/models/extensions/runai_model_streamer.md
index 992dddf385d0..8a97a49825a4 100644
--- a/docs/models/extensions/runai_model_streamer.md
+++ b/docs/models/extensions/runai_model_streamer.md
@@ -24,6 +24,13 @@ vllm serve s3://core-llm/Llama-3-8b \
     --load-format runai_streamer
 ```
 
+To run model from Google Cloud Storage run:
+
+```bash
+vllm serve gs://core-llm/Llama-3-8b \
+    --load-format runai_streamer
+```
+
 To run model from a S3 compatible object store run:
 
 ```bash
diff --git a/requirements/nightly_torch_test.txt b/requirements/nightly_torch_test.txt
index 67c66a0c03e6..33f1bc04ea90 100644
--- a/requirements/nightly_torch_test.txt
+++ b/requirements/nightly_torch_test.txt
@@ -43,6 +43,6 @@ tritonclient==2.51.0
 numba == 0.60.0; python_version == '3.9' # v0.61 doesn't support Python 3.9. Required for N-gram speculative decoding
 numba == 0.61.2; python_version > '3.9'
 numpy
-runai-model-streamer[s3]==0.14.0
+runai-model-streamer[s3,gcs]==0.14.0
 fastsafetensors>=0.1.10
 pydantic>=2.10 # 2.9 leads to error on python 3.10
diff --git a/requirements/rocm.txt b/requirements/rocm.txt
index c4aabe2a7314..9077085f2621 100644
--- a/requirements/rocm.txt
+++ b/requirements/rocm.txt
@@ -13,6 +13,6 @@ tensorizer==2.10.1
 packaging>=24.2
 setuptools>=77.0.3,<80.0.0
 setuptools-scm>=8
-runai-model-streamer[s3]==0.14.0
+runai-model-streamer[s3,gcs]==0.14.0
 conch-triton-kernels==1.2.1
-timm>=1.0.17
\ No newline at end of file
+timm>=1.0.17
diff --git a/requirements/test.in b/requirements/test.in
index e0a9311af29d..ef21d6db5b4f 100644
--- a/requirements/test.in
+++ b/requirements/test.in
@@ -51,7 +51,7 @@ tritonclient==2.51.0
 numba == 0.60.0; python_version == '3.9' # v0.61 doesn't support Python 3.9. Required for N-gram speculative decoding
 numba == 0.61.2; python_version > '3.9'
 numpy
-runai-model-streamer[s3]==0.14.0
+runai-model-streamer[s3,gcs]==0.14.0
 fastsafetensors>=0.1.10
 pydantic>=2.10 # 2.9 leads to error on python 3.10
 decord==0.6.0
diff --git a/requirements/test.txt b/requirements/test.txt
index 07457e14ccbd..9cab85ce0ef6 100644
--- a/requirements/test.txt
+++ b/requirements/test.txt
@@ -251,11 +251,27 @@ gitdb==4.0.12
 gitpython==3.1.44
     # via mlflow-skinny
 google-api-core==2.24.2
-    # via opencensus
+    # via
+    #   google-cloud-core
+    #   google-cloud-storage
+    #   opencensus
 google-auth==2.40.2
     # via
     #   databricks-sdk
     #   google-api-core
+    #   google-cloud-core
+    #   google-cloud-storage
+    #   runai-model-streamer-gcs
+google-cloud-core==2.4.3
+    # via google-cloud-storage
+google-cloud-storage==3.4.0
+    # via runai-model-streamer-gcs
+google-crc32c==1.7.1
+    # via
+    #   google-cloud-storage
+    #   google-resumable-media
+google-resumable-media==2.7.2
+    # via google-cloud-storage
 googleapis-common-protos==1.70.0
     # via google-api-core
 graphene==3.4.3
@@ -890,6 +906,7 @@ requests==2.32.3
     #   docker
     #   evaluate
     #   google-api-core
+    #   google-cloud-storage
     #   huggingface-hub
     #   lightly
     #   lm-eval
@@ -929,6 +946,8 @@ rtree==1.4.0
     # via torchgeo
 runai-model-streamer==0.14.0
     # via -r requirements/test.in
+runai-model-streamer-gcs==0.14.0
+    # via runai-model-streamer
 runai-model-streamer-s3==0.14.0
     # via runai-model-streamer
 s3transfer==0.10.3
diff --git a/tests/model_executor/model_loader/runai_model_streamer/test_runai_utils.py b/tests/model_executor/model_loader/runai_model_streamer/test_runai_utils.py
index bde77ff66506..e11e4c7289bc 100644
--- a/tests/model_executor/model_loader/runai_model_streamer/test_runai_utils.py
+++ b/tests/model_executor/model_loader/runai_model_streamer/test_runai_utils.py
@@ -2,6 +2,7 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 import glob
+import hashlib
 import os
 import tempfile
 
@@ -9,7 +10,8 @@
 
 from vllm.model_executor.model_loader.weight_utils import (
     download_weights_from_hf)
-from vllm.transformers_utils.runai_utils import (is_runai_obj_uri,
+from vllm.transformers_utils.runai_utils import (ObjectStorageModel,
+                                                 is_runai_obj_uri,
                                                  list_safetensors)
 
 
@@ -34,6 +36,23 @@ def test_runai_list_safetensors_local():
         assert len(safetensors) == len(files)
 
 
-if __name__ == "__main__":
-    test_is_runai_obj_uri()
-    test_runai_list_safetensors_local()
+def test_runai_pull_files_gcs(monkeypatch):
+    monkeypatch.setenv("RUNAI_STREAMER_GCS_USE_ANONYMOUS_CREDENTIALS", "true")
+    # Bypass default project lookup by setting GOOGLE_CLOUD_PROJECT
+    monkeypatch.setenv("GOOGLE_CLOUD_PROJECT", "fake-project")
+    filename = "LT08_L1GT_074061_20130309_20170505_01_T2_MTL.txt"
+    gcs_bucket = "gs://gcp-public-data-landsat/LT08/01/074/061/LT08_L1GT_074061_20130309_20170505_01_T2/"
+    gcs_url = f"{gcs_bucket}/{filename}"
+    model = ObjectStorageModel(gcs_url)
+    model.pull_files(gcs_bucket, allow_pattern=[f"*{filename}"])
+    # To re-generate / change URLs:
+    #   gsutil ls -L gs://<gcs-url> | grep "Hash (md5)" | tr -d ' ' \
+    #     | cut -d":" -f2 | base64 -d | xxd -p
+    expected_checksum = "f60dea775da1392434275b311b31a431"
+    hasher = hashlib.new("md5")
+    with open(os.path.join(model.dir, filename), 'rb') as f:
+        # Read the file in chunks to handle large files efficiently
+        for chunk in iter(lambda: f.read(4096), b''):
+            hasher.update(chunk)
+    actual_checksum = hasher.hexdigest()
+    assert actual_checksum == expected_checksum

From 6137ac0c594d9c19a2de50714c19bbda3403b1b1 Mon Sep 17 00:00:00 2001
From: Huy Do <huydhn@gmail.com>
Date: Thu, 2 Oct 2025 05:48:04 -0700
Subject: [PATCH 090/193] Update base image to 22.04 (jammy) (#26065)

Signed-off-by: Huy Do <huydhn@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docker/Dockerfile                             |   4 ++--
 docker/Dockerfile.nightly_torch               |   2 +-
 .../dockerfile-stages-dependency.png          | Bin 121821 -> 130446 bytes
 3 files changed, 3 insertions(+), 3 deletions(-)

diff --git a/docker/Dockerfile b/docker/Dockerfile
index a6b24f69f64e..ccc1b024316a 100644
--- a/docker/Dockerfile
+++ b/docker/Dockerfile
@@ -13,8 +13,8 @@ ARG PYTHON_VERSION=3.12
 # private registries that use a different repository naming conventions.
 #
 # Example:
-# docker build --build-arg BUILD_BASE_IMAGE=registry.acme.org/mirror/nvidia/cuda:${CUDA_VERSION}-devel-ubuntu20.04
-ARG BUILD_BASE_IMAGE=nvidia/cuda:${CUDA_VERSION}-devel-ubuntu20.04
+# docker build --build-arg BUILD_BASE_IMAGE=registry.acme.org/mirror/nvidia/cuda:${CUDA_VERSION}-devel-ubuntu22.04
+ARG BUILD_BASE_IMAGE=nvidia/cuda:${CUDA_VERSION}-devel-ubuntu22.04
 # TODO: Restore to base image after FlashInfer AOT wheel fixed
 ARG FINAL_BASE_IMAGE=nvidia/cuda:${CUDA_VERSION}-devel-ubuntu22.04
 
diff --git a/docker/Dockerfile.nightly_torch b/docker/Dockerfile.nightly_torch
index ae12ed0f7cab..6a9c3fa7dbed 100644
--- a/docker/Dockerfile.nightly_torch
+++ b/docker/Dockerfile.nightly_torch
@@ -6,7 +6,7 @@ ARG CUDA_VERSION=12.8.0
 #
 #################### BASE BUILD IMAGE ####################
 # prepare basic build environment
-FROM nvidia/cuda:${CUDA_VERSION}-devel-ubuntu20.04 AS base
+FROM nvidia/cuda:${CUDA_VERSION}-devel-ubuntu22.04 AS base
 ARG CUDA_VERSION=12.8.0
 ARG PYTHON_VERSION=3.12
 ARG TARGETPLATFORM
diff --git a/docs/assets/contributing/dockerfile-stages-dependency.png b/docs/assets/contributing/dockerfile-stages-dependency.png
index 0838bfa37fe62d60fba9adcbd18c81de0809f253..db3452650c3679464bdd3788f69a452e04365457 100644
GIT binary patch
literal 130446
zcmb5X2Ut{B+XXtts0oTDQ6v^X<ERuBMLJUK4oZ<O(k!5Kq)Hz(YHX+jNRckR3nE3D
z5`%z%QU#@`bOe+l9q!sQ1Ic&qeQufm`~OdIIA@=|-~GO8t#|G7-%wRP%*nBqgF>Nj
z(vBQZqfnNOP$)mX{b@0N($lc-KK^U*>7$1aP-e;hgyqF}Qz#oKv;%uJE(U#Ra=xco
z8@}Uf%DP|99umFmAIlxFf#Z+kD-W;A6OlYvqbM42;je{WqXK_R{^EW9K>5L6{ua2Q
zSn9)_ciKjA{Vz8ZFAe<|`+MiFzHz?c4~J%6l{qucD}*;FjSgtnYPu$+e{XK-jxf^>
zE~-z6&=B<f0b`l}ByL|RcuRTyujCJ$chpw=_Xml_in9Oxd+GxLJlnsYLfz<^h5!DQ
zLNO2c|9gSDtS;6C5+_&h(DPp*KeaQ|ZIISc85-JN=Eu$Rvr%wWvi`Ftrqx^e-e;;j
zbL_k6#kytUBKF|iHrLkHI=9_FY}?{K+8%H&q$Isk?x95U#YbH_l#xTlUOef2Pv4t7
z>w8*e;M(Ua=ROf>S{;3`m^B-9sW;W)Gz6u8WDdjO{a|~U-9X-GNAyFh($Lwd&esnm
zQo4>%I1k-gy*+KT*|qbpO<u3|F5&Unq7=A_=V#_`>A0`-abf;xOpS~_Ie(%@&$TbZ
zxi6zW-$n_8u6lI%u0>9FG;XY<n_-sWxc`Tmg_@e00rH+6&F-U3dxl=`9{*ajqQFKU
z<F)(pxY*>?y^Y;(!i#j3S@%fX%YNLcg!uUQ+iS%H{R};v<;L5*xeUx(^4%v!di^df
zTw>y<?^u$VKazA=?S~q}f&57;Ue_;=KRDFuXHWJ&8)|kPNc!r6N3m@*jcNaqUa5@1
zaVWBHu{esC`4n2B9#dmM?%x}nXQxNY?0kKFyX#X7m8H8QhX-2Z@8I4$H!2jV3HpjS
z54P#KkJJW8UO4?=`$;X2B+K_t$J>QH1H4t_r0{!-qFM8r{|EchGyQiYnqS@68shKT
zpB=NOKI_8g^$s=1rA9y4rN3N#a+UvbdfR}^n4V*U@fry$z16}7dLb>we)_ge4)swd
zGp!ayvsOR<2lfRSKd;=<_U_Ex@)uW^mf2ljZ+m1%PFI9QcKd@xTNbw7${p``nEmy|
z(xGQ9(>rFza#FAY*`IC-*?zjQb#>5k*7D6o66XmA2Zsuofm}V8?x^<JRn3pj6yIL6
zd&?3&H=F0(6rF&>yw22O9w$AM@<7cHnNNRhvMm>@k34v5HSWclxqWd<$REPObyJP@
z=Fd(KbUt6gx2=)~@wsNV$uZqbD}5soO8(84x41il>?%rPk3TA1RNj}_BInfN?j+uP
z@$=>C1<Xqsp5ABtmK|S{ax-I}zdRerZ{Mea2(o+0rQL=ARqI-yQ!Hv;w{6p5uh+On
zh`41Vl@{VQSmHL|+EONzlB;GT&AeD^**o^YE;)AwJEhedxEg=|(m-R}5pU%8-l9~h
zEYqi9BSO)te;u%Uw^1QI_j{u`jiDsoKwYutt3r-rpRUDD)|EmV*jL&}f_L%q^*TF-
zEz(N1IDdV<gv*7}bHl1Br~U0=KBc?7vW%&`SJ`CKjMN(nORiyF;A<s&udMwGflLBQ
zMSj|z5qZ>aM}WAc?$ZX7hnKw<q;7He@@|*+Ru$!e<~(nzb-}db#OOe1wq57ypk>VK
zjO}4X0DW<ohG2W_Bd^jkcV!<Sc!sACfF%+I<K?)H>N@dvMpr)ARmwJ)B_uJZyU$g;
z4%>T0O<!Lhk4rwSd~@TWw@h_NWFuEFsC|tYWqG5`54S&k7tyLgsfi}@<T*1Gn%*7#
za0`vsW9;Lyb>fNmC-Nzj*YHt{QhU3R`L|eEWHFnG?|lz@dU`apv`nfZX=`>GDZG75
z(K#Be5*pIv)FONI!8Y2#g9o=9^S`(E%3>~_rOaPloAa|{4|Dlri{++=tJmAT-W8Xe
ztjq}VoEhhkrEtFXlIi!qzv=K68t$ho`SDLT%=)4jRw`pZN6+J-3K?O$j@LBCaCh}q
zZatg5&u>upU(mJ&`xGsg*+v`0>a@S!UAay2SLR(+j|=)L9=y){vr)P0)VJcHrU4HL
zF)=aI=3M6x=Z*mT?y4vx(^YL(R>&P0?Qh!c)c=86g69aHnV#ehBE^qFS(`XN_?T;)
z>mCFK22x9eJ-#iy%1d9|zpiEM&>^q&CwN!zNQ;*F2@CIJ-CWdS?uoDW7tGEeCCSkk
z)}E8^oxi>0u10#etiC{%`%7Bc4(H*whrOwuV?}(nfB$-TRnSkYyHaIXHL2!sXQ-#g
z_!xJ=*wuY2D8}6S_Q%IBj(z>uuHVG`COzXQJ90w;<lJ4Nl^#BzcE5dec)84%)XOUu
zsQQuFnjH_F4WI_>KBwHDJ5+%mlV4RRie%L})ymuJB$D0S{#kP_GOg<Hb4p?tnMXcD
zyK=EbTbSRaUt^Zqo6DJhD-7Ia-JDCd$2gvhRI=QWx|3vD5e>0t9tazTFrRg#R$KkV
zi2!W_=glWA9v{R%l26#ifY!?0%*CzQgbb-7H~A%<T5|s|Z`_-Oh1~IpiLWmd^Z2z5
zEDF7`66uURBfRX5;nJ4;tY46i4>5wlg(XkUj20Nm%}foka+QvZAc82a>lfy|67#WM
z_FZo_+I3baJruVb{CJ%&n&!O)buw&uZ&lRMj@JQ56oF^^KV+LW<v6@0z=k9`f1?;?
z)u6k4it;lk{g7?vO?99AuGzJ~D2i-Z>WQZoCwM)lzFn?n{)R$P1bZ@7NY!iq+??mi
z?f)a);pO-D)?|2gtdbGy&MtT(e`EJ*%k?*;pSwh(=xDpmIDZ@OWIe0u<Xq6-&^C0>
zaQl#SGV=#-N^0`h)X?dQAgTF9IXt)YV{P6lrN!&4vQ9BCmRK+|Vfr@WAcHG(6Ki;V
z>g*l3wWIu@A2lv9@mSe|?Msyx7Uo2ty3uB4*#p#(nZGwGz-F56lk@jW75Qe<Oqy(p
zIOAet$6kaI1aYu9LGz(?{<vTMs92PFeX`-jY1EIT$F7BbrnT{!jI+-#FIu#f9Xu~H
zbC|;zIS{9z$Pm*NrG(8)9{zQhuadQ0jQUhr!=q^RbUnJO4CpdjgZlJ!@Armtp-;?e
z1xc|&V$HW{GEd3V@@Of#z9PkUTe?ZPV9S|zsi!h**$}U1HM@d_?VWfj>~Vi`pg<nL
zpp?`Rq2#OxfF9;YbOU=G6s~BftEa!n%E`$Iqq6_)!2G}2KVQThsS+wjVjD%le|LrC
zqkk`P=N7BfQdIx+;*l{KY%4if%(_I_r8M>bkD$~1^}-c<?mfS<BnCi$jih|Br8=;r
z6{yoUy|iNsW=2w^P%P7HwN6GEmpw3j|J3qnvrF&PSh0MCkAV73FJ^tF{0m(ZpJMge
zm&lLp{SI_=n@?U2b5(kI(bBZ@ZzEoZ$jW^F=S~^Qqt8l}J-d*$$6uK1d5pKS)|cGQ
z@L~n<;PBPnXZGELS9@Dr2l9mTim~-_{_)@o)z;MX-E?=42;k?*WCUC8aMjVc`1sPP
z@uA(w(H{^h-PJKFUUCy%ZWG-x84PA1Q0O`Ah^6Rkk5Uu3&f};<Y6Tg?Zj;xq0CsjG
zu^bB!*}R0uUe&ottX|I>g~S+%dQpsl3@IMVe&4x)WXn=J`Kga9hF)#DOCs$Aa0y9$
zD3;<9P4?;@!;kp5{8uv<gPuWSZ4=zI0N7=yQ+`$|^Mmctf9|aF8*uBCF>OdQZhT_u
zO)6Msi-&84RA<oO1fEm~Q8w$>8{|-TLcmuM{|OK^trBc<{q*;Zb~`W0Pk;F)54;KA
z@9d7K23XaezT?4pF2vb{6w<-5!7|~>a*39pV5erOB;5?f1g)gBYGs-BiQbe-PKgiq
zklZ@%dQP25GGP_EFsu1ZP==iq@cFL19FX5DzvS$$h+9?9oCXHRP%z4t3g@PZf8y$R
zT+CYr1gy<Ffa)?XKifI$);)nZ>ICAhTxXs8So{-f)>U`1_k>YKFyQa(_mP`7Z*tYu
z)YP<<3Z*3W>0DhaWqTG`(|He4rEkb?i+8Dww^{j0frp*fD2WdMfufK{h4kwSJZCWz
zk$duiL)Gzl_?AN*5rHRqP>ftvLC|^C(9<Tz_ZIj{hCd72&~w;05(^>g`du%|0pC^j
z+o50j`RY>cj;q`Tu}L~t19zP{L{K-cHG)fMRp3l8udGXr);8A0>iK2<S?s^OyWm^z
zkzeCYtwae4^itot2jxWQwzl!sN1pG_dMnl0uV??(hWX!mV$ophTmRIm$>r*|Vm{B@
z=+8Aj^SKYd<@gMknK+nj*gndFr-eD}!iv%Q`X<ac6k*{CUR?b6;;Ol{a&Rj45!XNE
zfnq1y?beBzJ&FFzx|QmZIW}otelFDg>5DAQ1g%Az<Md~z@(J!&{f#{&!TBLg*&Xj}
z0qmUN_{<4hcc)$FsYS!uXLUVhE&0<NpPh#~k_NLutIVa@>Biw6n~<jJVuL->G?*mo
zxU>K5qhjvlgxFY}Q@Ox4z6O(_OZOj~=o}S0R}rKsH<~ad#|j7?r@1jEw2ya&8b&z`
zbygaN*Hq^?^jf5siyLM=#Z857b8pj0t?Dh98Z1ljIb%6i;gs)<I-jz~qd&V-%Xw?K
z=CnI2bW^R^<%ObEhRuARK*gxu{+!-q4Q*||;_G}K7X^h1#u9EK?rpAqLkj<Hoibf_
z(z>1Cgwmqq&E*dzD#0oAc!l+{b^;(9bURz;e!IqgPKAZxY)YQ^0PyoRuk1uiGWKIO
z5LD^sLwDA;`=~3ASB>aDb5sJ8DEo{&I{m)a5Ns9SO7OqfCyAo0e*E}xUPF)|A=z_n
zukJhayR(;UuH?~ctH4|cOLK0$v?SlYywc-)`W_^m_HQUd!Tn9oJi8}=79tG`JlenU
zIDNQZZ|FI_v|c$>PL}XiX@{O+v8wtI{L8Mb!S-s-Q-upxB&u3WoO5b+KKIY<HQpF%
z(w&Q}+pan`pO(m%#T(9g6W%a8VmRv?6Y3!y>M>zT)Pp$nn2xY3%S$)=>8TmWgT?4w
z{CHI;uOC@TeMi<dgIq}flk%j@=D@ph6Z{|?<q0YIfk$^_6Tnj5`uqwKacHB<EyMTi
zeug2kqaV`u@JidCUoJoOb<g*AXHI0<oI+(CM7imBQmtG@RDg<Lna-@wUP3!}v4(1X
zYcAl_uz>po1qDmxL+kV1CkZK`ff9+>w!IqesTJC;`{YP(T~az&c_%>q5r&3_M%&ou
zyOpyu1G6T1h@Ng)Cy;ai&K-BwNhmWw%(h<VbvZANk|Ao@C>ku|MAEPKqq}m_z>V!3
zofUwsS92@nXWbZWATK9R%?v$TDm(aUlTfZW6R>wYv^EHt>=dc$tXBz={ASopHfkvN
z?(Qo~R_v&p{&v^%HRx|pUDC-I)XwgvXHLnvgQZ{afP}?WKec>6*tq%VgG8IVC#~}w
zq6#Ef4_(JOU*8iabL_hr2&(o6C#^~>Gn*bD&2JefnDt;ps>did0Lp>W6rTl)o>Hur
zC6&52`B?{c<?H<`WPK!B+;&6FX|S(WVsenJAs0_0$ov{F9yLEU)KPBt`Hn=#pDUGL
z4S3E@?iqfwpRidqAZMrwl6fv8r5mrWXY5}t6`8x6g_kHJh6jO>xOkY`k6v4!=Q^4@
z_URUZun?IHk@xC;4dG)xhw5KH`ySlNdL-8WrC&S5jy(2H>qOYOh;qJ=Fh15z!uG1o
zVMYQ1si^ORd`}kW7z0l!G62frTUmhVO)5W|tgHl-RAQj8L?WVEMJb6w1Z}p>${%Ll
ziJq~44zQlbHXR>>o+7aGXG-r)Z0bQ}*-%d})`&7x=Ds)9AyIHb4#>oB>9HRQb3P%2
zfesbZKK)<t^Z|rnX>sMAp=19Kc=~5NX#QO0<@aJmwSw$h%%7-r^B$Tlq@fs0Y|u~i
zoc{dD{-Y#-Bb^4C7sarl?7_K_od;wfbeQTq*_YW@x3I8ar2pAKN6FUEV~pYcCK(<X
z$2lr0x@`{hzoIW#SX%5kQ60*0><0yX2^7)6WUGZsmT!~fWInp+p82oNOb&!1Uu>p%
zj6Q3LijIzMJwU0^EST=IE-PNbd(jAwNj_nx=9cL&@{f<l^u%VGf#>wd2OzdZTYm`K
z;Q|1*+kIk~TH^TL($65z1y9HP&9(ECsw2`{S&$DCm{Ul_JsuspBghBIuVkKR{4e`M
z#rNKx`9UNlf5ME>21-?7^{h|JMv&5T6LjX>L(8W$NKTCz=6=vCH*G)pbel8_iiwJ@
z{4&QmMa^pX3Ac5gN)Me*EEJ{Gh;@dzTE!<McvJUZUk;{421&m>C-Lyc$HkRAeQ)&;
z`Ctpp3b|z2TG3c&6{{?JYT_Dz{2<*`LEFkjy&~jio^G<CxPp5P$?k67UbcUWiwOx-
zksFUJJb+*S_UYw#iHZlqbE>>x>5eRga2A;6n4`xkJoaz)N_{O{=uIWkV}*2YB4O5%
zhSNRT0b=G_jI-FT6)GNs-t){_>-a=*=qKjx3~P2CZE~tcgbnVH#eAGuyn<H`b5-}W
z#Ct0c!grdIk`hW`-X5r)-Jp&0<9;~LK@-mudyNkuhYntZfa?75DmTZm9}645lL|^O
zzL}XBgDO8eUJ0p+e8QHqp=4|)f#5`Np)m*{XuYzc0$g^f@}j~<RUkHi>vp1kFqW;C
z+*x#uQ%I7Fd4YRWE|6#qdsd*B)qi?<i<!|NaUNlONiAAV3S?EhW&#nTP6Dny0EyX2
z$UNgL00a{ReD8bD%~rLJh&)$jY3`f~;32l}Ei;X)l_ZoHul;vzy0VzF6xUy>yja09
z7HbS0M}Nog6Z85VVCE15$$;q62iW`W(mNoOK|DtX(OwvBWRn(nOpAEVOfdzv?fN;Q
z1aDXYcv4H4m7qUs(|fCDmd{I=k4CR#W0ms?`PfUHDxMSS5HN$O0V2kV-=V4H&dy9O
z+Pct4Ne85Y2+%}5p)p8x%4~Kq$0o|eotW2}WtZ@<OAV$m!9+J6^paJP9no+Z?GHZ8
z=l-PiEG5zFM7oJFiIBDuZ*M9p<ST+47A#!6YEJX}gT3cD-#{z~MZGt{93ExlPJe$-
zN(-owKa@B~s9!ak+=j}>2@vBpxVVv)_V&;^W6;h9$gG$@=9t{pu#!1_v02&n%-3L$
zX@JL6+JhbXf$A!<V#ov~M}_k=prLBLM2_$ylmYVp5g<&)S<+8HTOtjT+A6k?Jmxef
zC8iR+kSMy>mh%LHLr_bKR>%h-qZt4F*RMnh;!ysnkeetYgj#_v7*CCTYab`1?5^y0
zote+_Gmi@GnWHR>kLCAOjEdOL{F`cS0g!~$$3IsNHkzmSc9KLkR4FfCyx#6ups1;u
zo+O1qg}hdYti!+--H?(ysOap0vRTpf_L1GYQ`fotS=e}tV+*?&scIp<F?$kc{<%%I
zm~%cVwN!uBXIn^tG5GVMEkB<3mz(-pMA&LJlwocDAp%#3=xXgT^w1*p`C@#BIlzCF
z{#wwldt_`Yw<^Exls{zkA?w1#aJM(sN*H<k80ZYgv7c27@`ywa5MYay??5WAWNbdF
zb<rJ7n2ML&hCw`z@500WWKD$`d$YEdDG?y4XG;Ud^g&7Vbk0L2Bx;_^_b&lT5>29{
zzJmK#=Q<DlQ1wINLokXUKy_ot69h91VhuU~Rm+JoBWx}tBm`<WdA93Kcmpsu#}Squ
zo4Ao3Z;2n?TNea_)yNUfY=D+W#Ak}A<U^|*Q^Ic7L*D8}ws?DiIZk?Q3@djRYBM=L
zZkUa&GE}3k(vCRTCjFa2UNwY^;V%ul3Gytwv@jhEFe)M<0xB!{6b3$GU!lht6ETR*
zW(?siK*HL9;Dqs^PHrCa;54J>mvaFi$ycfpv{RlSkh+e16^=d@Kp<EY<huskI~`nF
zARuugq1I$d0OOumx5xqART7mv;tXqxW|;5$9I=vl`&6r5uytwsE>-*64*w9T0(*hW
z1NulFwdAi~H;I7#US9d4U;?w42Elv_jU+Y!_2|e8pa038ndnW&nsTpW1)33$F-sw&
z#BL^-yIMs)7?KA;`9y~`sSF7go;W{qSbpO8KX>^I6%=*EmU8cSO?U*B;^~xi7G$M>
zJ<hi5v_z?+&9&Q%II%UHyQBO{+sP$6yJJEtNc6b$6Tt>(nV-<krL<Ec$AYEBig{fv
zNWI?!)Y;DC#(YxBm?C@6w)S2m-LCdv&nfi$280Yr<OhIaOFMqiSt=0jxJ~y7KYpY%
zJ2QRDi_PYe*@%MfOEeuM4PPMEh$*t_iT#Ja;O=D*ozgyg$s~tIvTj%?eR_VL74+2r
z5RmnfR9nfdka=<r4S;>!Z<+a?$-!>EzENP4&^N8y4fFSq+RuxA5~+f?Yy607h+T!0
z6t<`Nv>fXm3Qg>atZ+pe;253MbEy30?H)_k+bDR9ml-Dey0R9X;-LN?d`!9d6lC23
zh{1WNT*7=r?!8625-&JE!LV8bEZvw=WBPCB*kLck(cR!Qx_QNm*IC@dHqmFJ0?J=(
zDl{ce3K#I4S$m^WplAspV0h4)(veg8BABUM^ylW}Kz<+gFS%6!f>b4*NEh>H!nQtF
zDLbn7x&Eqy67Ujm0m-H9G4j)<m@-{^7P_YIV<)u2PLTS|NC^6m>eq{$J)*ql+uvd?
zN;=y5(CM9#)Y2^)(r*90>yKw&(vF6pwKBH_5*_|q%wwVUonSyyX@jt>+h>kIw<7yE
z9eQHYrL(F1C)3W-c3|{`2Q%9=i70!7DfO8wVlIRzbq>W*W=Yd|jjYSCnc+FiZ6&CY
z49|C`IWIu;n}wm(C?^DTkr7s7J5y<$6~RM!1MVp(j?9m__U8!JA}HwBgzvvj67M)j
zV?o_GHg{<x&70J@q>pD+<w<TKrNm<-!O$3itpYT0)9Xj(Wm2^?|I@DuOZG=2Z%0<^
z<=Z?m;^_Jq_O3<imh^PLw|LHqv5OlecIy^4!lcZEBDEM3fQ3gXvqNXT5;c6-H`xwN
z8=+y=U@5a&#&20s7It2^V9NG8WW)6~g$vNc1eM$EHuiO@&)V~7rd5;HxGtf#D3-b>
zkF$P-?h-*P3+z4$<>1(GwTc~fdI#g^juPzg(jkxuL!uOvi@!%t3sN4)yWEL}!##*W
z_h{wdKxE2#Gb`3$jDjWRfR*SG((nWz3?}-ZUKdH+M1Vp4jMM9)F^IS+KlXgZOy3B$
zzQ0U=*8aJO*4fOi2crCl+Y;n$yTS!a+R)upVUV?7BW|HX;tA4g>(a`}a%&H7aB0tv
z=BOMVD5ze<1Ca4x9cxUnhV0aH{ucr{e%*BFEC>N<tLcZdAoUHRx73EmrD5svho>N%
zcf43CJmohIK%wW<<j`>HI*-|AiLV3Y!7`a$EC5O|oD(2MngLh+Lu6e$$TlJ6j|$yH
z$(AtaOG|i<)F<m}cT2|v*(#!BX21B5da8)@)e^tGE-cN1NZkPZWcT9dt%RU<NwP+4
zc!Rw=N9v#&coQk!x+R~9>=Aogr23vzi<s9XF5}%ZCZwN2YC%tYf*R5pwZU_C+V1T^
z?xb%Y3QI{ABW-kC*%lUw=yR1J1X8l$JVk5HMKV&6W?Uv>RugOA*C_V6_^xmzSVg~c
zPh1T7A#zfWxxOpGix7uD+xOOO$9GhWqwY3_{{+pP#7Cf*`2%J*51=K5sMCO}%tz4?
z%Qt0ihA;!?v5(iub_=@j&l)1}Fd~sTvcLVaZs^Va6;ZCE{R!@Ou{Lc`MvkE|rZuTs
zSYM6gv<!_*BDO#ox=ZzJ$%`Sxlf6+BqW>Gb3B8bG%1}{<uFFqtoE__WmX;<$CSXV2
zu-c;avBi)QNWVbOx!u<p-j6CgcEl#uK1h81BU^H)GbOkVu@;J*Z!$AA-aZZvbPlMB
z1OmsgC5cL;Wee)|mMunUz5KJ3UC|5cNB&-^(gqiV6=@sWhQ~kwBt{4k_X+!}yyuNp
zvG@?(VQz_ggFySJkk?!sKU^p#^n*rLlJqjt&sA2S)P|tjb%|XQ9Og4qVLZCYYveuL
z2>Wxx+_sM+aqiI8chJlq%^R45pA@6o@!eOMYmvAz#ABkHw0Na@Vjq=W4FN#uxG9wU
z3c7ys8}<zn)!BSlAy^!pk7ayvdqDMoR+XG*uukQ^+6F`f%3`Bt3dQg)J60X){``5R
zErO<FdbCBj(h}B?H8PGCq}%fYo1IV+LrU3+wNTy_S%wgSHjp<VZkIp_>yVE{*E_R2
zL)5z#)MY_3lqT&MV#$bj#M&2}2mV_`8Et?#<)|5fhO-m(CvxmfojnSsznA&%I+F%>
z17;vLh2RhiPzVxmB+Fp0v_k@&qyMS}N~!F&n8OQ_)}aS>V)Jj~c9C}K4}ud!hDG_z
z%5Mqh`<Ip$cv^lZq6(2ecNMSq2Gr$Zlcv}?!v%j$kd&PWWKoiYou^0Yy{RNGU0cBy
z0(n7hdU8})a-(X?2&7d~Z9(X?L!N!Swr&s=hTEUj<c}TrZ_`+G4_Nt$L$`mwPm&kZ
zf%b8N?qPPSSbfssxRG>Nc;L=c`$+wT1i=s2iRBzbo-n`6ULW%&^nC(=QMW_kZYi}3
zmUbv5z#rL#+ke>xA{td=L!dZDckwglTVYx(`~uq>b6&F9W3mrc8YvQU&dDSVbw_&J
zBG-`qAN)dN&y<6uxp-LH={$v<b7LI<T*@@H^?iw30z#c&<tY09h^cav27M!zZ-zpj
z6WHjwBM38Q%|neVvx8{$8agwB><2C`t~p;4h5yi8(Tfcw&MxFaNr>y(*>8xMA;_`O
zl%z`_n8dlr7S&-pAdK$BCns0Ddwj+Yy;RbxYaiElY7!%14#5c<oE2=U5^R{0`p?uz
zif8$~jr$3kdC*CmE_yc47fFrOsH>kaUFgjEKArllPk{Nygg)#j=FXM<{_c@p7kb;T
zVI~NG6xE6Hs@=6<?QIZVQ6kr}a|m6!LL!#=%Wjq={eW8eBt2~uBufmdoHvz-u9yP`
zsE`2Zsy`Q4P#5y;bMZO!n!6!vCFgx_1Xp5y9CZG(P3R7l1TPb#7!*#S$_&f*;zXFS
zD;0=|JpSkqW>jaA7$hv8Hf(`y2PUeEt(USVdJ?LU|K@hC!<!%3{*SM|fbGJ}d<B+^
z1Q!wU2mD%R3BSO81S&m$Pf$o`w?j|O)Yt3s+bWyjo#=j_Y3;mqH*<7!Pd2+W@&!8j
z0128{hD2P3yCBn2X-^x?5<Y;^XTt$Bc*ol9QL7K-CHhY8L_Z-0yY8Aebw-<C!IZI}
zko$JlVkO4@rw%AIiMxLPvTThA(^KV~44Fx)H!*z>s@}HVq)dZL-ISi_yYe%Vq~%K7
zc5~^)p>nPU<ZD2C*a6r&HBnzs0ar#D3kG@dJhXQ2JvkqRI_H$m>)EqNN)NGdkhV_=
zTAjy3h?j%FCd6iDA-h~rdh_S<pK2x)e<9-cTQ1p3w+%msJW=`eW6{vmP~|+bOI*MX
z*$uQo@H8T7WCN+Boh@MuPGLLx!FnbFX6=08BWvX;J#4LoA_5_o>;mGAEVUy98m^!K
zBH3pdvA;W_F}H>IE1>rIqA?&!hzqt5QXz8-N!dli<HP(YY=6wklnM*cu}sr*sMVAj
z$Q>fx`@yLY*Zu$qozX1k;09VpMesv(P)%-af66b-%4n)f*@fjz;jxfCQfRlnUUM$!
zILp+=gaMGy1cxa#zY?rO>}iBK5C;>x$(VZWzi2wv9XD6@fNpI<B%N&NJDtRzkOCl1
zSQP4$TQeTR7QoS`7~S8)9>{vp=oT-EX02CU*u0Ob6B_Ss7XER#x~~%2@q?HU7eT1b
zQ2S!f5Dkum6Y>v@LD)Bd6j4$**aBCg02{83yhCjMFUEoHklhhzE@E8jLmHWjw*J_9
z3-c!e4X6ZPPDlS{3yr`hV$UI!WUK&gWgRVtnb~jkoIl;<Z%y_O_;mBH8-X{ETKV5p
zepn&8*h@Pq`%*xln0jlyNcTf;|2MxYd7l<LSnViu$D~6y>v|U5RWN!D#|}FELxKE6
z#rR8&=tXW;t>alcQhI|%vj^-7yk<XK?sQ<XSXC{H<=2Z&v5mP<YAuY<o$G}ht#<l!
z#LSSn5jQvY9Ud7i;k;o+PkoBD<VH&CA^mLIgHRQHuxZ1w?tyHtFao9Y(0uEL61z`P
zQSr&?mmKB(yY@FUG}Pt7mZNy&$Q#Iwr*`tN!w~<~I!k@#uRQm6{&g_Rs=<#aX7xcb
z;mzmX-UMu6;xJ)@C*~ImZ_Jq!D0Ibs7&U;_)sVlRIP_}K809AF7cXXsh={D>;@YgO
ztz9I*s!PmYm2Wd)mmS=?{(|Is43kjcVR&+Mhr+@(Y^G9U(PCN5wumx+DfzlD3%X&7
zep5VpR6SJAU6eUM^=FQj+jUYEWE{VQ%@rH+E6QH~`HgJb_M0F|G1wLHSy}G_uV1|?
zuyNyFq@Y{RSpp>UF7$Qmb`Jg~`17--WQ1E6WZJq!n8kF{&feI!e?KQou#(S!q)Us6
zitJfV27LYN!X0eWF8;!_fvlCbk43-6n9F64tSlD~Ptx$PJ;V-rZ_dSU5kNz+Qg$7&
zsi|+~ObNJ#C%fiB;Px&pD^ovq?Dh`}7iO50uQlggy*e7$MQF>GYnt2?O2K(#H))sQ
z*wbgu)aJQ55i2KKAi(`Ml$6guRpH%+K1U2+39ac2G4rOJ46vj`V7+z67E@x6tzUjU
zP~1{bLPCOzo7=oHM7F0k!Ea`&Q@*#-b0%F+Utj4k7=*$aDffvdRn^tL!NEyELF@H%
z>`QRFSo_@E+_t{H?S_Vii+=nu7EmM_h@LK3(P1OGK6*cf!u;erwY~cF;Gsi;n>W7<
z%zpN)7hV<eaAtLhrijF_w8r#vcOi>eCspk}|7L?bI#g*57S{-FZLM#7=9Hq9q#KoC
zUT+3hW@$x*I2`Hm>#eP=7cE+3+FE#N?XJ^*UcPc={KQ%c#V6`4J00M6f8<!YbfoI2
zu)vlrhw$AxH+=c#-MiY8-}^YRS{jR9zI>^hWfN}T_U&Nbhir9-@jIDrcZqJSy5g~8
zHK_hallqrZVt<FG^A@N@?82u58K%|$kX2J1KhCzPQ7F}<os4kd-?XVHaD05+6x8MB
zUw`d{*F}{}KlkEshu%6d9s=_vHj0U9E?vFtO{uSt1J;d?XLM*t-N-2H^5x4lxz2XZ
zuC8V8-=7Q#30YkAgF?H8s%qGW4|?q#9jNO^ySuv;RaEK$Jv@hXAC^a>VPgu5^IGUX
zFRw$6(Ofjwx~1&gjPH}C7K6b^JOMvDEIL$Kcq`-8W4zc=U-$%-pi9_u{MHvo*EnbL
zCCvYw-*@eU)kzx;rDdCcq{j>6LIMH;u=M+Cr5Na&MLE#c?lhvK>`0CD)Rw94!&Kau
zp9=a-E%ZqL{PRayI3-A*Tx_5|CG@x7ep~g+FGlRVv$GHN*=4X~>j-+{v5}E~gMT#Z
zt=w|#4V2?VIJedw`-xJk?&$awUU5$Ja5Szj=Mi-H0!v5@uv_F}&b7ZQ0(=P0N!J*`
zeQ~P~vFM?Za{_gVKm#}L+|fiDvJihb|FoEn18_yeDhElPD!0mRUo8tC2&&i&6&v76
zH-*Azvyt=(3Q9yj|4=|cKwa*sqH8yA-Ks`Ai#hh#0}TCRTiIbv?`ef!0jvB5*xr=O
zMNdyp^wf(VjnAIt|KpF#?9yGUbK$~clZv1?kO!Tsyu!l5dFaeTb-o8%*eN80Rw_n_
z-TVkGLBU<Sj$=x_sqj50gYNT*c}!hw@9bPh&PNC?)S3%7x~+zqS_GJe5?HF1l~uCX
zisj4efJY)=N?FIo&_T~(Bp(Lf>VoQ@Zi4KgjiQ1!^_iV(P(|E8IRXJOnBk$SdJiT)
z&p1TsVzTYF`pvmfP*h6b{}4m)ShnOh1&&Wl2ue%q0?m5gT6!yvL^MUU$=Jk1P*k)=
zH@LW{Xus!luc4Up;MpQ{*d%%}H*d+R0!$nwH7v!)XVpm8+alsjZ;fP(^POQ&C;u7l
z9eS!78l<kB;&Q>PyeKO24G4e<k)I?^MN@PnT_79!hK5=bT%+KdYS*be()Yeza2V}+
zy-?2?sjIw{*hr7r$rf`QF@YTHO%;%lIf+h84H6qC(M2k5{#zJsORitOdGlsd*nSD)
z6dS0Dx`jxsNzfK1(J*E?I5@a!)v8GBh6MPwTma`pjS4B%k1=Gyq?#HHP9A9uZear-
z>Y^n}gf?$Jh#e#X9P#xeG9(TC&%1D<?WQrFJ$u&dIqQy%^@91>XLVTZOI)V(1w6e`
z_wM}y|4W77@YvWGFx|n%$7hz{Q52#wQBaMIjcE)oUfFn%MRPQlP#Sg<uo5=dkZBzX
zVv5;<2{{Fecf4x>T`&SvP?1J^3o1^fUA=mBt*pxvY>xBfY=VtAn;K&BC0>=39LIda
z<`oU;vMLY-TzAcyHK^r`goK3We<GdUL1R*9vldNIK;XEZUQn~!kP=x|il854D06g@
zq&;VHsRE*+8nZB7YvSYw`Df#jrY3#sypae0c<~6)N-Hbt2Rue)`Wn)UnU8<$e?gDN
zp^}mkRH49%5Lxr`#;2AEV`CRNdH1}-AreaI-J*}Gh+CMeFDzQT*bITUN(T{YrMh?T
zrG5MMk;X8MK#yTy^pdi&GTcGISwK**3f87aSTq^~c9n2!sCXnxW=+|8@896Is=}m-
z8JDg~(tlPL=<MQxnsmYiI!arAzZJ<=T%W-UY%g3mj%;}BFm4<xib|D&&i#HyO}@LU
zWpnO{k=}ZVbsQAceuN82pm1j>GH^N|+E+-s6g7rCw9)VLnK|pYv$L}cy7t4M8wr2_
zOgthdXF%!?yKyO*PQ0luP?lidFfhQRJVeegLO(t%;;gZ;fTZL*-SKHWaxL7~=ZfM0
z8BYDXvWMQG<_Ak_ZdDFSHJO>2(apX17~?U)#wQ;eN2thJ3JP>vTU#m(P~Hpq=M3}O
zNrnXm`>!oKj->UWsVM{d3skbiej6S@S)}(no}YXQ9oEaa>0npXLn2JvrvhDm)jYx>
zUufl)g%eRLyptI00n2J@kOty_c#begO@>XEWPR8kC`P{t%^kNZRC!fdscm7A2vDP`
zs%lhT^y0;ni{DP8YiP+vgY?o*(6{PA>$cLcQUNd(Y~|zQBhMeLm*=7hzwWc;>m@hP
z2+#!qSw>EcT%*p}5h?W9G~0GXK#?BQ^19cRl`610Y9Bc8=W`ZG3=_$A><dJ{Ir8@H
zWwa{T%)=l<y~jZ5rYE0T97k<ww~?%gq^;z^1OSqVlS3^Uxo5ene<sh3PvHr&K7ahN
z59gJhaL9_8)u^658woJX&uSUaAEvpD+a|oJ&a^f}TBFd^jvV>x&|Ti`G-<nz+W==4
z<iyI(tMge(!xd*}$nzM^407w|yEO#1px;Sw3{o7yF=1vd=#7eA{Ax5lHs(*dcB(tj
zc#VdGRcFQWhFs@#>=QB*lDA-i6Wp*t0Wmo^GExhJZd-f1F>&L>>Lju)m6R}-lLa1m
zsN50gHlDm1f^uvIOEgRoJV;5D(&tbvhoSNA<&n03gBda+6j34j2#xlbLl%lXH%VLq
zXibyqOYH_ZKqo14*;b5e%RFmP-R_RA3aOpwFJySmde9gTA3pqJ(<a~h_rw4C>!$__
zal#s617UUu2XW~}rOiRpiR;&2!_heP_X5~ajfNwT%iI+uZ86T925BOfWdz^5X9N!!
zW#`NP!JrBU1$OMva&ybYNuM>qV{Zc?gdP6&?OV@>>~w+;G*+BAaUxLiLIkj;ak=hO
zi#SAp^Tmt5113{c#g#+$#G(Bg9~pT72BsREPHOw~V#sd+MZPZmoQh>rjwa*Dnd0Rr
z1M8Flm<3fu<OT4+<P$3nEjO{X)d=nUCc$A87ZoURRoIUtB2@QIO-(&PQ0Ae>9dB5W
zPwj?U6;7y3{4!7w2IDtc)!4Vs0{E^+9aMs|mYz5xL>`#3a?BK=LOu$<PBT-^h?6+a
z*%^YSsU<I89{l+6W9jSHFfpu>sK-t#ggL@DBqSL=XFcEsaULM3u-8*I2Vb;I_d7AC
zP+v#KAB8uvss(PrFqc#*@PlsF*%=I#m(3`Nqj3U4Y~naLTQZ>D$d`s{wwS2O#kFcx
zEE<={`r7D#Iehy2=Ux*_3|<lFJp*%urA0-HgVM<)3pek-e#AN$f<>Ug)~<#9072m#
zmy4U5+mrKe{{Zd?W}_*7ZeVwH508AR>6@^<gpn4UM~99<y<QX!vGR9iOq<|u^O;st
zQCZmwhJzYVBxX|nA5f8<le3n6@H9UD$rDlYN%(Cf{C}jVo<M8$Wn(ku@i`Uq5Ro0g
z>hfczjh}zC;TI4f?W!td8}o7*r~X9LtC8;N;<+i%|I+lVzH#}oWumN$^?zt+R8~<T
zm!@cl&hrz&JfQFM@ar_D8Q&61(0}%n;6!L2iv9ila|y4fjSx^r@NZ6>z0z2XYz}T@
zE4e-@|1j3QcJ2fPu!2K-Dc3Y?VJYa&IdiREtvi&Oy7OgmF(L5tm+QiQtb3Z0l7c6r
zm%b=3R|0I%1cXE_I981O&NbK32I4BQ$}|UvlD_ciPqCrV(R#EbMd6pYQi3}lgzZ-i
z2pxu;(*%vtsR9xb+Et?x=UrV~)?y)Ix8>&Lk*2;XXEwX4Vg4jYJw+q(88Q4Nyirfk
z+J5lxVRHx$WHn<=$k-ja-t2{$Fut28;f%=K+&wf#OiT<G@1rON9pTv5$cO}<T&IjJ
z_MheU-G|6Hefl({ovld*d5xs5n!?F&^Tv()*RNkEfF>-0N76=tBz;827UiH=FyUT&
zKbqwav8m?2`~yW*cAm|&4u5fcM%X&AbPpgTBN94-kd)L3$7lLT1fuJ(Ieveeb>Yk%
zUfIURS%_e(e*Zld`sO<$6gSq#YT0~1DwBH=JO*VT3JB^b1HxDMt5-+Js76~n3mWLC
zAh9kZJs?~({I6MaZZ@?WG?Y}kk7wsDIVCb5MM27FSbh5R39a%a=)k$wxfRkE5QzkE
z4fK2&u`E@bg-}h1G>+GV5#0e&A=!M8NysrH1Qh<WcF)DsZpn75_EO)vkwyz~Ae#oJ
zrqFu$!<;Nnq4P}uv=G3A5f?%_t2>7FVD2A({ILwe2&LjRs4M(0zC|B*@*qVsKlF7k
zSfib#S-{rHdM^O}CFlhT3`yuX(ye=y7Zi+W1e-QpA)7sGqxi#edyJj+vHEEqChUZS
zql3&%jI0i@K$th9k`mDfzLozGja234^^~0^z>R@>oYTJdH<_0c76NxsFB0uX+T`3V
z5W<3GFHs6upIQ|JH;E9O{yce=7ed_C>(_;L?^Xv*omZM99}`Lm@0SM96fP^gV#NwF
zC$K=gf#@Fx*x6h&4p>N3NA$ei2S-P>(fiSObchoIn+_aDZ@)C8kDwLw>Z6TMH5XYE
zuF8&9!z}hN1W{LSXeH`|<773zjLiE$Xg!+nyWJ!#iA|>qt+{{sB@6^F0p6(6@^Uer
zCAE6!{EVQF+EU}n@b-3qIb!z9HzYZN%M_KAreE4Mp<4}Dp$b-&GMPi<6==DDJ~hH2
zLok6<!>1Pw!@?0L5m8=wXce!O_m~n6`F#C{AAV3wqAvG;F^U3Gt0pqPGO@o9?J&h4
zk0s6h-)V<iGofaYTq!vG<Dx~~=pFijUB+C#`~%R$5ma^!^jd&P^F~7eT9Qw0Lvi;8
z#R<pal9Hw#ee5mHR>VPsf?(APaHg)PcoVwZW*X3tI*=A=It~^XVfw;?=C`qG@(#VM
zFc3*F&;7`y-c(c}vYwkZ?Z+_?TL%ZRpx=<3oxlb;I5{-|LV=)6nBuqU7B4>e9oLIC
zqQ;<#o67;=o6od(dRX~}V9tA?gS>_LXfrK5JiIZ-A)!BS)IjX~8wFloUaWRK9G6er
zCmo>)(HP5lq$78o`6o6jYiw(!j6;tGva}*&^){U_95{%Dus!(w`vXuf5};5XOrZsU
zjOFx?%yg@GrX?3yW%@}!Md1w1HPGrtsL*NinBQk9hKFIGj5rdw?_g&EQcsWv`5{_O
z*VK_L-3HLHtwR4Oo@4=>TLC^0WlCN)YnNZ&k7Mw31S^#$Cntwm&$xcQSS3H7FyD4x
z?Zjzdx^6h`XWsS_Hj3h<Gr2-;tkuDen48Q#WPMA?CL6X;;NN-gsH&=}iBaJrr#oQu
z@ut=$>z^d*7mOY?&z!7_e#T=clET~mX>i&z)B}CTp2m!X)!TI;T>Zx6nv@}8%T#NB
zh-mEM=6eSx))At?H5%q#{C0Q7J=oV*(@b7MVl=1I-pNTD3Ex^&9OGymp5OocyS0<`
z-l8*HlXOzT9rvi)vu)e4CCk^p!TF?(MEoJ+@X*D&12spYz|a_&h+!Ps6Oxy2Aq0+6
zm`hII*35u>IPD);CvM@N;XXBX!Lsp5T+IbOzEHJEz#Z?Rk6Hav0O&k`PM}~T*T}C@
zDsHp;z!bX3sm%Aa$ki|Z`G+JjMoqNRIut8i6cnOIfBX|)udm0{^fl+5RN3?GPf{U>
z78DPF&`q3^^y9$qjezwT1O5HUP<&e6xL&z@S+UQ$AuX!L1DOat6mj!eSkMT!fa7~p
zuhVV(qJrl9NsmHnTO5NX@&)=VRgld#)3DEPdU<KNxa1I-dn;Bl>q3TEZ52+5+J9}`
z3zA#O)T#@!hzk`Zsm=pA#`>aIKe6{Vwmd#_IL;ku61`CK_!H^TVw0FX2TT@;J{KI}
z_x16K1n!)<CWNt2g1G0aVu7N8K?v$LDV@lkIs~`$wG<fc+O=!&>(`zBsIjf}=6JYn
z;{TzmOFH%I#Z80Dl$xYBy$MZCO;sC^g;(irg}hCxf@MS6L8lKF4#$l{?jOc+AVH8Z
zDBzk%Oi%2))qqcZrVkQuer=wP*i`?Y%RKa4a~xbwd*7D>TLN=B$f#9U!_=o?(n;X2
zhi!9)xi)a68BWg<>Oj27Jz3Bz%*^6pC_J8F)r4iudo4n;`j+`kVN>L_UMd25;Ca|s
zCg4fmOatI^!OJ?HI1LzZ^2vR$*+=e$k8vC_derwTSFV6|denyEnGHtMan2-x9Q=@m
zD4#zycoYuIqc|}qJQ9erUA;~Plfh^y8+6nImHiiQdK^D>Dx5S70FR;~BXx#QcLld^
zSHgBw#U(h|=4RmhwXk@Z6>QV)AD0q;sDzDP0~c8s@JcV(H=&(LpOGz)l4~)=rLx3F
ztQs=E*|L%WDFyiXk6=lTL#3gXfM+9As&Tv_8jO9NGFe7^!g7h<p~g&ht4c@>3XtHJ
zA-uA}0ltj$FmClUJ<Aj;z=Fjs`GriN@2~R#BQF3+`qy87T`PM29+)+i#%9@|{$U`G
z%%nnY;3I+V6A=g-E1^N*ajnLtfgD(PXJWEt)}ZGdP6zNqNr%;Ih`aLh$B*Ga27ZAc
z6JM^`k!w`^i-*;aj8}1U#~_V^0+a-f4zw5&!UCiPlze9AMg*swjK@?~2n-|WR|YU0
zv^wabc#gPkJ?5`!CNCv5eywE^L8&+~b7?R3-b6|LRA>0Uf=J};sPAC9)9ESG+v~}c
zYOI<EdE1a~-Vm|{#6)`Aj7WIG&x4f{G{yyC9gRWU+fH&li9<MzOu<Bn1j<5r42_<>
zvJjo*rDx##I3d*I1{pQV>&|*9HQYAiyWh4G5opd%e>&IL=je{pRgB25Uv0!J-hJI_
z==A-|38+Fd+?7tlU2oMUp=^#f)X$7wx#7_hh*B!_uw1LB5yPe5WFN}FAMsX#M_35X
z-*+m2uz6Fnv$D>=`19w|SFcndwh$oiL#Eam%S@hNGYyRmvfhN9qb9B;y<K`wGInj<
zceFS??A>suI!7ZTqqsAONW3ZKsiuz<q(^K+x!&gr^2Q*Sz$dxXIGlJQ-2{grrI0-*
z(D#&g&5eycf~U*)j%y^~pQpd{;!h{dW($_?MNO(kH)Zqmm<wWzesk_fG9~sO6u{x0
zgp_zRkx4Bq`go72@}he~0B&YxCi5A558K$JKDBPKlHEn_gA!1U;{evo_rSzIgHE9P
z9>;Cp;^aXLe0|DNQc}8)PhW+(UXw<Ul0A-(Om~sWS_^Y26<QXp3W5uIB?J<5fh!5}
z^S^<P_ykfM+2?>qgms~(NY0lb&zjViJGB-rAiXenlL+6(mP4T0_tXdwO@T}+G|f#k
z)HC9_YwPKmNbfYSiM^lWG+@;yY>=x%P#c(&$nM<)jl)txtAadc{neVN3;ZX=i#=!j
zn6JM;3CT#qK+p`M!BmoIlAoWCno);s3^`=?C4Ai@>C>mv+x4<k-@bhdNbr~dZrNIN
z%QP$(ELhN3;91a9mz02xR`mtSt)h=_0E&}9m&VQ+61WJMfcBKK{A3{17c5|dZup=J
zdY~gPKkk42{JFeyZfdHkkXGUwIKpBf>rV|HJVGQKg8D*bJ68}nmgtvz_dc)8?*PDm
z%%Mc5xp^W%ZQndE1I7mcY4W2h2=nuC;A?7$NqRSFE`c1^rk>i*Od#=INPJy5iqumb
zbC*!ju*){;;z12aR6hRxvE)TLgi_hs*|nn#LmV=L5<$!a5Ol1%^wvpO)!=m#DX5#h
zc<D-x&Bx1FG&FN!P_cV)1f(8|oANBMVg;IjNBKO)!lA20<B@>!Pim(a`1<+z5#<^M
zpc^i}TDYVfiaLGr4HtB!cupsXTf7UyOrbe)1SqkZ<OalX?<izr&d{a&Dy&DIuQ~Aq
z9!5q|%Y&rU5%cLC*v7~A?Yj)7Y0PF33blnw4HUZJl>yMN_^AI#nmz?!<BA(MZd@y2
z6{OjP42l-TEuwdEK){^;XzY}j@7eo=0-=N03qjV#CQt8xm#VHzxF8W&VXi^N{6&S4
z`JQ`h1el5#IrS^+S{DebloswpSSeearD*z<n|M<JtcqwT2Q(~P<m{|0DtY`8?tkx`
zgd$0nV(o5|+ZgQdu!g-o>0J{AjeL9_f#e)v>@du?XbR(`6bfgfAx|xN|NgxVD1hqy
z`QA+I9|Quzkl2M&@!F`JVk?#|RfmR%WtpR13L~wbKX2-u^mPF)_`4kQw+;`nse9J*
zF3Dh*=2Tp|V4+oJ0)SJXj8ig31sVw6^2Jf+DmE5f(F~`gNn3|>h(G+v*L-^#`(n+p
zA0VO(4h<!RPLtxQnm3PE1Rq0uH^+N_){2?=pqsgohQoIcA|5gIJurtgq{Pw<dtpy{
zi!dV<Kj~y<1;KANSEi<?lls71)-kV-f_%<$_Ny!Ko`(AzouDi7%gYn|#j$Kz&DK!2
z(@ZTM=V@O4{dX*0?6P<zX1z5tP|iK4B2+#F?mg45t<OmhhfFIGl*blbx^$`TJFMBu
zn7WnxRDKtcTB$^XnGZ|B0HijeNFzUM{s$^}H(Ax=@PG*^YiN;??1{upV?d6?afJv_
z#$Iey(#@gwj(;qFhYTjd)Y_)LPJX)Hu8PST`S&I_5)-!_JaFJVPWclXDm4!3%gx)j
zH4YuRMuZCjbrnt!t_C+~1^@>tC5-|4+1A@@P7--m2(~6^A2A|fnLP%X_1ek>l%OW;
zHEU*b4;?fUa$-03$lL@{wrZmbo|Pq;VclYYNUfWKv$}?~`tY;fEh=~{jqRvp5EE2&
zbpuKN7b;x<IlJI->DH}VP=~kBK;>&8H*rEbmrN&A^VR)Lj7aDagy)kX{HNsFobIhp
z(Z+EzQFxuvB{;#Td19&#iRu_aOC3mn31Jlup0ADfZ3aE5O)+e-Uxjd3NE(Qip1|i!
z1-J=#=se<K5|OB}Li{=ratKz&N5QnkZRk$O#ZNyc={(*yJI)mX$$pDUNFsc=-y)fQ
zCUlM;JbVbsBu`9AV3DPzr9`?Tyk)Dpn%W<po}PeK$9C-4LEI}iwyQ;&sR}P?CUfAf
z@CG23(2gC-IB=n@rpD0h0_M5v*#998GdGuSlq;Y!k@vn(X{e|!Xk{}e=@Aahw=kF3
z6oMC1P`ow|OO;QfICG#+j%@7k?bAV;8fqz1Uw)Um7ebAA5L@V$=)sxOjHlcz3VOv9
zK&1<`IqfOhY3G@}g{yOH&gdP`B9LAb7KONH7}S4tBBCo?_^8b`sQS`y1cWeNS{2M@
zBXHML+x$VH?>>RErgh2sLNqg2bKp|8Vs?Kn$pDQoKl_R1j)oDcj`A&T;in;W<Y~<T
zr*-q)vH^gNBsa6Z>5+tWIPo5J7s{-N|6)q(Hf)y=mmUFgPaLZw8izl!g8w|k*=YpO
z#PRdbkS{+EBj3;%{|fH<sC}Z$3DGQvfS?4eIjnJwq)ix1z1wKgZeyu4FlVksuft|B
zc{2yzpdv^k$$~f~SPiVXIa0j@X&FwiDAYY6peGy&Zdk?3oBaAU*-76-N#OWo!<KOb
z+O`XXDkZd8!y0egxs&11f|s!A@$9+yhRhWW0!c0UKuOcwhHl4q?D$Zzl%nA9vVa|)
zbdFXV$^T4M9j1&*!@|~~=44<BK@wisDB^A!2Z0L-P)5T!0T4+Ae!$0Cx3KrxQ-Hu-
za5{lXgJ9!=_iZM&a4w+4lT)}oI3mc1M8iuJLJ!$}6z}=iYPTTPsrQ*FxK#|$sTM;6
zzBD3i1O5{Hz@+uDrSOtC;7o+hBs$(?w%`Hcgd;M{1!s!K`Nk(Fk1~jjrK{_F(G5_>
zZ70$W5GjlrhvY+?N*@nEhnVjmC`b`w8xg$G-vI4>Nd)h1G}MUT4bK4)yeYBEQMD7v
z^a6h-BVaZ#8;vMeXGw0WJ&fk<Fo9Q?o_o~tQ2Efy+bJ5m<Kp6o*J3jbN$SRp8xSGx
zf7Bp1e^~U<#-H`#H_W6MWDBCnK|x45frBGNF(I}9ri&y@TE_KzA`WUsym+zC9akf7
z#Zm1eZ->HbeXfz3dlJM(6+#uRO&@fe8oO}y&p*4cK^c+oYYT~s*O4A^>yM1NH`Gv!
zaq<16(7=jhSq`sh6u#Jt*DUxDh2I_zTsX?X!J(0EqEx*LPyc|JL3$D0zEpTv4m^~w
z)<Qz$L^ssOk1P~XU}3eU((q1}7`#zRJv%#l4WS=Fl(~!)wymwR6JyaLx>aq0c9Ju?
zWCkAN#u*k3RXB^x{7BwGo8s!VYi8J)j7Xv$;N=@;ZzHaLJWHXcJ%DfS%^OvM^cXb|
zN-RHQ9Ve~<V&jnfd5-24S{rA+=UTHS4ov%GIvSDaSt_48b*kesD;pFFzy@XpdA~8w
zHIqs@Xu5eW8Gy&c*y7`hL%xTAFf^gyP~(sb&{kTy8OF}9`%892uVf9A;#-S@hGJ0A
zU{xtaH!}A4{`>duqhIid?VhBE!qJxm%`Xnbhml|K%@sGC_;gEn8M(<-{4fstP%FF`
zq#m0kiu{_#pL3ht#+%KNVdPBG%dQGs0SahpYKp-32B2j|Bt~LGEQz(i%*1L#BZP(+
zSl+$UA%b7QOB`-X0&?j2`^HK}B<6uQf6VHWgE5zs!Zq`S-RcF7bR^?W=&b7d2^&73
z678KR4JgQ@A2KHdsGcBQSC}^IaE^dVgM1da`<xfdDG5NSMcwF1Z4wqHFCDGsn;kpc
zJG+8dVqouqfYV4`F4~$nztbgJ5uNP5wF7w9|EX_1f5$bzT!-<}j2i%DMB41rBYqfo
zIKt4Qsl-JK@4SPwjhBwbgXrm`gKt}+4sos%7bWk<l9ZVb3Wxu#hhhUrGmZnzNhpW7
zN3qd9%xBnX9CkS4f@5#Tit#ta3l0vNFjx{#7ujSC`;OOZ(4o>r2O@Li-Wo^+<ItT5
z+e6_ZO$~+y8gZMqY%v=jY#$sRW~P2gng7}Al8>-vrleg7)+3gHRyE!&lY-L+2hgcu
zwm!o?!9}Bm?1=UxvA_Pda-{=aIzXEB3cd_qUvgF(Eya_&p~^sf?<K}V*a|E`Kol5w
zYf=&dfSCQjelj|yCq~qXU+t--IUy);-kq2;O^pe&^EZOVn(4b^*ApfGotK!M;&@^g
z?UAp%15*guAR~C%TjywK?Ky&-4dYc`y<kjQXyQ_7peNNhG(hNA4-TkR0RY8<!xqsN
zgt?#t_ZF1S9xq+)hH_F1Hkh<e1-M~2vtU{Yh%1JKzZJ)P3uHD14gtbXA^ZCT2V0f{
zna1PIMF-IlVtIRPmgAy0FmyRBEsaWRZf+)&9RecR!(lyeFjb?=x@z6J1T-oAq&q;0
zk)F(O_<)oV_!3OFP$?RxU{;tws?C6L08$>1wOy2#tFyBy>|w;zht4Z!6zZ9;&b%R9
zp$Z)h;sJ%$P(Ekl1B3J>Rxgq_>2@W+o9IUQg5Cc8_W@bFd5FkIs!{E2ZRhdMJz|K3
zpy4qnhEWsJ4V`5N6bracY_3Rww?G#W*t+#F5ZMG2E}sVvU|2MgNAirpoa*2;URn^m
z1SJKqnscX^QTm>N858lBkB<~z8UyMOFJARXGz796m>|T)0QD#bC(MBzhzl$1MX=<B
zeP~@0mb_=r9+I-)PmKdL8T|I`IE0e+?(P%Op(kLI#G7|DfWRlvoAr3&vVsyeg&yo-
zMCn=?$3&dVK-*fP`aVEt`+P6G7BapnuqWxqgPEN8zp<qkHt@*0Xn<7BysWQHI;o9r
z4>8svOKnFFFkzT9wuzM&en|MYqB!<JUWb@{51n^1UW~3s580{)eUM=sGlbBTuZF~p
zR+GUD_i{?@pP`|l2;ADJquiWpMUP-Nc%z~d935sh_x3Y-&sNB{nAbW0qEqF#cM@7V
zy5w|?N<HEdpF&QY*zqPD@5_*-_(Lev5qK*zQ+@#RvWK>Z#pTDMq4D)k+5!b*a2_G7
zDYQRTsJQ4PqR6|Kd<bS<jY2p349J3Y55cR*$SyG_#&kG9nrzFq&oy7e($;{LzEvYH
zG9L!eRo}aJFC*X6MhO<W+wII!_F?@zVW;0TLPG>jIy6LduadVrpNF6U-JQU9^0BGL
zBAI?kFNW<7+yN$9@>7L&_RFJSdTzuHA-)8ZG{qR@U<MUFK4MaZsEB5s*c`6+t;NxY
za0sUwUFYf$0%V)wY+y1DaA|j)W6oFU-1|adMF9&0jyeu!HsrH2Oacs_5(w}sIRBYh
z7sJqS1eIAU=XUX`y8!?`aU<fq#?u#a%zCTpF;_RjN*}-PgX!!M4(BAG5GgW{_(+vS
zKI}ziVGXhnYr@PdSdHjMsN4^4ua`>uAYWvXE+8VJ1_#>xf&$NMPv#7Sot~2e6nrnh
zU{7q@q?v=4&~2yLIyu#&wG|Fiu~wJ5I+=967V-n6U;!%i0BoKFjD1Z2WGSt#PXAER
z0^JK0TkXPy3;1Q>%u41$Y0SNViV`~v=N=dG65OQ%#K^y5y`(BCJKh0)iD~5Dh<nia
z2>Zf8Z$TQG%$i88BR~#l=$R9)ZZiZ0Obll;ZKXz+owUC^=LG;_#k+wGzoo9lB`C2G
z^OL5A9Ucr{yy&@#^=R81VGyqrI_Y?A<vE;6%VVNy$_zBrrfB4fScut-$f+qeB9!92
z0R99oe8>f4@g3)owz9G!S|w?IB2D;qXEPtLqUe8oViI^s%KwXN-s%8^3M8yyJQ)sw
z?8h8HJCJ}8klrf@lNp*nkbp)YCz7)x#x65B-lYj_77azAbU2qhA|=Lq-h%3@2>%95
z$HO?BNTmI`Tv)h>yH7!Z&N8lh+yNBfk+MAinMDk)3VNu0{|DwfL;=2W5}kCP%i8To
z-<kB@;OyJ($9ny75XT&b)!-!^1fSXB=HTm^nj-^z1p&Vv5Bl}xu9zStyBEKmTjjO;
zfz+_hgSeLUiq(lV7B>8X+p87J!k?&B|M+s(^&l>H)wi!TR+ay}>cEyo6$5uYLJt3M
z)`xS<L*K97q3%>)#=ycC*B#!Or`+Gf_1kZ!os-?h2T37<Q=f_{U0BVWY)aTpDKG*E
zQ0Q5Nf#3^4V$$S0eE2Z>xrZPZAjG^wLk*u+Xht6Sm7qFu1k==lOqs&-=Ml`fr%>8F
zNjI0&Y#ib=7;Uadd-}8vv;g^Z8#)cY&u#cc`pDrBpcCkH3PC1lGaXAe#3_6<o3sOt
zZNUzY(|LTF5lOtuW_W}7gGvOP{xpsPo55b@HOR~f9P3xJ9jY5<;U}v@KXmw?b=LfN
z>*1gq5X3NA;yoZBqHG<N!ja?e|2vKdTXX#M)0>onnRx8?=!O(Xt*A}+OU^RAOqQ0_
zU$m2S#jyWOCZ_Q2kSfqi<YJ%TG4izZ%a#Wl(~purB8eN}_(K(5NkjUuWp+`DzEy~<
z5!8&*#>U3E!{Gd}M2drgUfR-P2r5<u>Z>;L`0?Z8K*Yu(0X2^fuOLF8`WaVOS92%=
zYrflExbT)}Qsni8W#h~xy1ImY)ReNpF#E#iYdGGkPa5WU@&{C)4szfIlB7C%Pn_&N
z9{utbWE5mmRfOzvKDopvI|2lCpTuI<Z#6VDbQoyX->m5KYS0<fmS0#nWyyEEkL@a2
zl*yoP#?Ef!5f#GIE+1rz$*;Iyo1`O$#N)hpHzc_SozT(~;ZRpYjTf1pWd;B+>5&tE
zGmfT!(E6AZ;EJH?$^-;J3p;CV9r|bpql?9%No;=QkzMQ7ts~tF6wL=oNtRv}%q8Yu
zrL|KAa0ws!#~Jhm3Em<ww>|r}&5GyI+?yzvos@5Q_wIM5lTE>cd+pkI4lcpAv3(YZ
zOvmX72bj}|kO|c@2X>Emxw^VKgwzd4DrYhG<gF*=t*xzLkS<AISs)}u=W#^-?2IdF
zRY%V_^WKZr-D1}~BY$|plmbK!5?vHQ-0qBtbe|dTBq|Pb2I!YJ-~=1C3}7TNA|^nk
zt-`yg>3dfF_FDu39%2G<)nVO~Yh#Yw|D)$k_?2T@yfGe)@O@XW2gc#04+5)4{EuyM
zhoB^=9{qa1tS}iySnFevhvg=Z_A|%CYY9Oq$74FjsyP?UhFH<rE{-r8q8gz^<S?*Z
z(8<Xu59gIh`+AwOR;tgo6KW`lg8Dg66d!CewO_v{BDRxqZ+DH|hRJ4}9w4U?8E4JS
z6NrPJtO9!5<ef(=_Wx(E!VZBKjGPOc2H1$f!oE5y5(jK(>*!dKej9yXLBsr93kwTT
zyN+X|=4)wbIXilg;VN8u%nl>^9s*<W`X_U?>Id5E@bSf>M`so&gn#VlAeku^0Y=IQ
zs#3Q9ui0KM%PA|kN7lazMAji41R`^_XA?8t&Yh~hf|?@m&u_@YyD0V(<XKQq0O1br
z*NqjO1Olv2TXz={MEFuuyx}DtI5{4r_L?zs65Cw2v5xNSaf9&Fn0o38QL(XA1w};2
zqJ4eEkNrYyhB$6Pd_ZaG>AR(W<KXX+qWpf{W%=1{I2h#N;Snfee3P6{f&U!-h|mFU
z3V$IqEFq|>IDdB@DsPVKs8zh&)2B~~^x)?1UJJ!>wH;F-<5<hiW4s|yLCkPKjd%~Z
z)~*dS2?gbdN812}-w)#RO)jAanHv{`{qh&^4@}k2^of62zraJb+yiCQ1^IwT2)@FG
za(C4u!XiQzDl~_MEX>}7JOHX*jZ~&t;NkuV2qSF+%#w$_)<53X_A>{EV!9!S1VMWs
z4dg)u4RSB?Ze=<JH`J%b0&P+#_a;$YMP0vJ5XmUVdC27EUF>dMz-VHR!W;`~CtIj0
zQuuSpz<_WdojT~kv!1M%&G_^gI(jXRCE)+P%SGR9C#u4HUJW1ujkaMfDHm7${m(z7
z*+Nn?@{{^>g`EoEW;>cV-X)QsfN3k4FRlqoH9C$q7!ZmRVWbdb>Y@B>uRL+`B+i%|
zMfXJ;;KumOnKM9w7oYf-n}Aj+fwI*Tx;WaeUskN>!ygW=ud?aT?Ryy+8J7g^x2RSw
z*x(r+vXDZ5(T4s72?W%_3_K$Ii;+FJ+9PNprHFQHP9nc?9w8nMO5y%uR_#;h&jMQ_
zws)i(-H`N*j9PS?Q}9-vqev>dkr@;wI=yD`nxgyUyeoXkWkX;lgpOq?EUvMm@KZ1s
zl&}rhz{ioT$=%OY@<usitD&U_Z<Y+oBJs#2CnqnavX({VF?(6;=K8LXC(G=Bs%pvk
z2;|;1P%Q2}fN6*Hn<r5CwsXIgl$0dr&Z==J?X->b?^pj1#@+-V=X~$`zi=>v(JWcA
z#Egt2`x>RjjO7wao3g8vos<+wW{z<NkyIEVD%wPnU6`2`txB|rkfe>#f(kva&sEMj
z_w!$#$8+xcxz9PHuIu;vem~3m{r<c^+^x19xm$-&>!@E{$Qv`JDZ4!44Q>rX1`Ieg
zU!$X<Lj)gKFfu}V16kDtLVHxBWw_a7*vfr-_wHpV;k(V78}(<Yo{HCT>*kq-<apZE
z>ttMEUrW9lK|?1gOPFsq+9)*gfy?AlLNotaUFg-SO)b@CICEC*zW;Hd9Nt?~4BDS7
z#c})&0Lfd^#E<lfqg*TVc8nOKc;<+VUQQRX$Mf6~^|9WU7V+^*Xp}fISfNdl_!9`1
zLiX_Zr8$dvRbJju5kTk&E%IzkuP$UAOD!VLFt^uF+aZ*-pA3zt3WrAx9-Ip*#z^xH
znXaU~e8sx)`m5wc^$IIBx(}-#4#lswv=XB41$`@(j;D5U8zay4v~Gm>L8Kg*cqaR7
zBPLGXsV+KaLVOOASj#BuEUysxRElTDE%C?xAwfr)W!@faTCZNJ5Q=mePam(!2K1tJ
z$T0@#=uG#upg2L>CeoT=<1{q8a(&b%62({Y!k5-BkXl>R2YV79Ty{RSG&c%3Gm;ps
zm+_gRe&&B-`3GXmK-Z4f7Ev&il$7-6k%2>`<mc<{-LDEurhPwM`_TweFBV)}dxiwA
zY$)9u%Q28JCh0+ML-jKy4e3n!cHa;(?=mj2G~6+_d@4B7rf#z{x1}{gt0TSatIX!;
zMN$@*F1yCuvn6DPpBCLXPpfZ|MytMtm)vVk;;JrmlsrT<MCqRVbbpF7jv1|4`kv;<
zZNIzaeWvYVDh?(~s)OkbrBBa_Q~^%19k9)_0L17L7N+ji^w;9K&lXh>38T}jUkfK0
zwD<aBFEO0VztQ6I`lSn)Q*w26m4QPYtEhujubIFUxSIcZ7AFaE+G5YfrdEpJK>h<F
zbpVM*M2QR<{ErX;N+zUlE2XM#)4pT1&KTg39C-3CNLpS+Ku0fR9>;mrPOXM1)JG7x
zWsVH+Tt_K`xq>|cJN~l&+pz?u$5}=O?MEa%dbDt8{JRrcWw13c4omhV#>T{C!QAUA
zsR|@xI0t^EsGh!l{W)pO_^^Vx5*u^z)<U-8WBY?ixLGJLLL@-LAf$Jo0NI!mSvTX$
zMq^r>Ec*WF5Nm^eL~6H?tuJ5PpmnAnPM4FoqlC*KQ+Og`QD)<8avG#1g_7#Aeew`a
zqW&gsN8%rU{DE9}1F$7b>CDp1V+W2LS#Tk#qng?rYGeVF$ZO?bb`Vf034bYkHlve2
zzcjTg$ugND8OV56?4th>{-3`n)sly(n6~Xmb1kM(Q&ST=UojsWJOJ8l9lcrw`3#zO
zAxer_Y9D1b?{zd|zrUD&JAi}u_Y2~?Mx;f!FU6Khxj&b8yC-pw`N`dUsR2q7+DT7B
zdoRa-comB0*I-B<0Xw-MGRnUNFOq>>Ypv(aiv-}8j4!HTykV9x=naC<uVeG)N?uyo
z9R1vaI5`mj|KM|eBpPBm<;YkH9Yu9Anm1`I2T?0>wnTaaLTKlrYyVYUFNNmn9OuWk
zpzb0-p{DzCI3nrExHF_T`Q^SL&{;w{>v?~s(4+9M&G#l}8%(b-`*y&90YYtmzh6m>
zH3!uAQ>yCc*tVsLEt3gs%7G1l&&q5pBIUH${m92E#ISUf?O&fM&8P-sLI~U=<FQ4u
z<Y*%Tvc~c|LEA)it%R?&;zu}-T1XkUf%Zq44Ka|z!I$TkMxRU?zWVIdt1}$ILAtuS
z>7M+o08l}Rf|s2g^~Q~R=47UNrJC-8qP&}pE|PCN@@!n4+V&=>oQwtB`c0vj(tV=G
zCDkhuc%SO_i&_7SqN-77mFxNJBl6p5W+JjoDn>S!UF}8#rKhQ;81XeAdY3^~%g{ei
zoLhoFfmQ@sblfC5C-%0zV60=#vSnfM4dsJKu3c+YpJnlvE#@*I?7#bw`MOY|z_Vx1
zLa4K-Uj7t|)L-Vazkt&zW*S<{IU*vAz7_8C6;J80C!u%?rMUn-+>K|Il~K^cOq=$9
zP%Og`>q}C&-@jK@RY}#$sMB*>TZPYm6^js)9GDsRlCrX96Xzwpay0sJq}%wa0<)J(
zi#u1})uK`$q-!lljXz(}NwN15Kfa7>8F#*j0sa012J}4m*`Xf{+A9i)bRo1hwmsmA
zwaNe<5u-cpNpxPf?v9Fk!J|Km4thO7gl{Z(+04Lk;*M}n<_!?XFQZ%K{BvBUNLS2s
zNffbcIj^6&nNgn(|Be=yMxPWRk?3lbW`I6&l=2G-da$g^r;nSP+cKf#Lj)vf)2`F7
zabIQs$VUvJpbn{`fsUAS<|v&e;FYwDw^LGd9uzOQwC)E^k_ZoUEW(1|?4TM-cyxPz
z{y#SL18NLa@3zCQU0Tv@2%gx3xKbv*!b^+!LOZk^&$>y*CM;?x1*8H`>rYoo{1{B$
zH<HNKAX$)tQt3<Jx3|$cvOoq(s8{<d!BEAWg&=J7L}vbkNhD9om;@(sf5cvIZ*N$F
zf#g|CJ;V6nEp?ni@2{2`ayq(qQ$`TAlwf9p=-aPey&9g?$P@Ufo8)}o^D?EukpAPJ
z-i_t7_3g)LTP?qu0oeW@V*5Jsu=RSZg)u8<WIkkT*G`N;jwZFL&q5|9VTNkS<=x*)
zLO1A{v{aU~8xfSXI<rswvn6L44Vimuk&`NY4aC<fv)T;@J~?00mR9D)1SBomQs=)-
z>7)7YPry^~0R`6@NY#UiEj7!HSsF7c#{NpY=MEDwju!7$bl3qhAS!U$IID!6U8EI}
z$`o37dQ8wM63!+hu5qmUdq^wC!$V^>tmR;7YqcD##b3e0QfFvG!9vjGkjy}5?3si%
znz$c_2ujUzxDr90s4zmo9W;7(Z0bW)_0f>4$)SrEosBXZ5>s5ZdwGwgrSaAnImLGr
zy^|EE)Jj2%rMCv?7eMUhO{0hLTP9fcS-EnhkkxeeBM!}2!GOW12c~JWWM#ACmC?tq
zP|Nd0mD$vmmlWL<KHu}#MA0v%d8B7h>-|sHG!5(e@6RMILP!Y>9$t2yDy<6E`MP~}
z?cICveYC#~NL)Y?ddMsl|CO+-bnZe${XFIec#{%e#hwCY$MV>BlXr%ZZTMvT3-#m3
zz5`Xqepu@k<Vcs*SYZenfAE#T7j%60AOEEAdS4DNaYw3sr9cr>U$*PME0haq&nKK#
zL|HD@Ry#(#5mL9Q@kY~TZM!zfh8QgmWliF2(z{7bF_G5qw!Im`6=_!V#*csQG)eW_
zebk~_IyNI;KL!n$PZ*@HKOZPU9&lx4<!)HW<RlrUAeSa*WXz(hFI=tPM<V>WotyS-
z{`j$Rt!R_L7epL}XfSJErwv>&r1h_k?_Ll+Ur(%<_@lPeLy_p@>KZ_=49F2q$reV}
zN!mE;aSdq}&qa{F9Xr|^N<-_@p~hK}e7Ui-RDwBun)jaCzJpeMN=1EGR%ZeoYTQuT
zIbBYFve=f&NZ1Q%FmVbY8mx5*nW`x-(lV!Js`$S^O^=r|PHU}n%F@$}CP<dCUux9&
zc3%36*RDNd7CJqgdJ1mh5^Q$jB*9KYZoVh$Peh|cRX>fubO0H%h$+rIFKr1~(|obg
z8N3(#aK+-U6-Gb2#!=H+vwi#a&R?yYNQJ1d?^5?Z>uXpaksHW)K>_8B1=aRPlp!v~
ziC>V7W{KvEngFa{L5!I}i8yM!e1J}W@BykZi18Ca7k^;|*joJ>&y42K<fT<c-VI0s
z)ER-$Dk$jEjfI7arY`O!5g;<GbnmYev&#|7(Y}+A%p&&Aq1c8WGllrTv0(_`3;-Bk
zi`!o36{a%$D!mL!EU9-Xa!vxFV^)!qT?(=UjCmK->;(1I3tTl#N!`0UqT=(?PmsqH
z|MNIQ$7T?~$XA%M)M6&53vX%x&OZIP$%(3_&Hl%#;KWDU{s4ffj@~!5sK_v(h5}zs
zIXtY?VvL?V4Em?S^c{Vy64p4EH*(&ocnY5{b=4RVbIAxW@%<F@R7Qewjz{*Q(ER#2
zz{R!q`i2*&y`SqFss?BJ7QIHvO=U(Pu3ANl`~@m3?au;_9O?4SH^IPKFPQV5lH~qu
zHWW_&4+cX$kRa5705D7H4jgzvU&e+QqO;)^`y=7o_BqABI%N!JxC|aL8^N8q$0~r{
z21-ZElQT4a$tFnmy*S*kz1RDJ$I>(BSeM>A#0OLmAsD&Sx?NB(HzOmX-Kkazb#<^_
zpV}MaTibp5{qqTL5`%H@&0T-Xl+wJGgDRZ$CVXu#E&fc=$qfI{>)dp1k{>py1GwA|
zs$(Q^OJ%@a{sKcFg;$~K_?&q^=D%J{<D1n=0WX%WPIviAO)9OZsHp7srDbKyUGx<;
zrcu_zmD!xhPP1D7wrS5F!e5qsjDC#ofs207o#RKlbw=JK!e-u;luF8`%0E;B0dyWB
zVpz3$^%qQu`v{Fek81)Anac*BVD6XFH+s>HXspU-iR7Fq5PTuI?!D78TLnE%9$Mr4
zF+%1z_`8SF9h6No@GVJ>+T3yK%X?pS-vuC&+_~KS)<&>nhzMq6GOIVNdT`;iAn0&-
z3p#i1+zx4KNW%U5R=lZuNUWr{O|2nyn~{q})1l&3`bHi+28Ll@`#!J*LhqYtd3vs;
zLu`JvR1s6AQqR>-<35_dkG^waa>w9)t&HLs^c*Oyn?RXbRLRRI9}42PToo=4d5V#P
z-=I0O<bD&jwH+NDm1Yb&h#(z_dUusw_Mux`lMWMu{~bHzyDGd|Ycu*I{&b97_Eiy)
zz-m(M{{jVgu9)4`BDk{PKq$=^29Z*SUb=@!p%iNJf;$|zcJx?mGw7uHk%|rnx%Z++
zl31=1K9S4i8FWIamHZnQM`c~ch0_wRFFF#rVe(%pyv`5f)c!GWXz8a2$A32etlMi_
zvC??a9dXZBUw-}dci4#uCgq#MWQcG#V2ptRJX}6bF)Q#-bMxk0x(8HMd{N}vP=?F9
zUY8nKuh-J_a8J5nvMm!`c-44g%z2s~n<uWoxgDDvB0v^jw^^8o%GZMOSbo&{{nxKw
zr<Oel0zA!E=DDG3kQn694|9Te!#9J!8~R_5+H1ZqWrzUW6isvizya6A?hkR3MsK2+
zdTZ44q8R}{*HX$HIYO%bP;K(tG}}>e${?d4s#=U)gE=~V^Etoi7rEq9Q~&($H=y}5
z4F74H*eUcN`;m)?u`9I-eRmJlZ!)D{%w>?izmh|h#e*uTtXxGwdGk+uN5@mxGTER*
z_S2Hu8g0H6wTV1gh2{bt-s7yAVgGqG_4n~45#&~eqp_3o4-O8FusR*VZn1JA*1r5z
z8QE^=)kF&^iZN=ra3Hny>(=@3xzHs<6NM|_lWj7Vk2xH-<j;2EwzVSf>~ZomPEZp7
zWu}u|vH>fk#-&rTcdrC>#Cm5MU_`|1;9o(%zo)wu*pYG|2WvvXA$9k5?7LP3oph{p
zc88@qpmauavB2h|UOV;g$vF(99}_{F{M9{s_Q(+u!3EL6T<DDGz)~WakY@n(mZ8(T
zbQx&&6VXzJ??4kHnWfViGiJ=3jJ683yTHS7cwZ=eV`F34chwC9ydck%-1LMdkrp@Q
z-aSiS8JHwk_mt(tkF)-gthGRGrRSQZ&(9>PZjO?Q<1UX>P8nibjo$6|b~iCGsmhDN
zy@-=8ptU$zKv5$j3US%Hk^m&s+jM^&gLUtj)?7hTIG5;rvg>`!$7ceM9wCArSW-l5
zgo*MZ+Q`(iXDEb35GmDd7afb_vrRPU0I1fuPZ^v&#!FndxoR}>v6*~7jXfQoeP5o`
zWI^f%@!J@%XJ=ZsfA0uz;w01G$n&80c{Z-iA~kh&?27L5Qu|ywc%Q;eJ}}-^Ip>xd
z%ao{Zj&v<~XTSZ^S!=+63Jl@zAQC1Q*4&H-@{;GxNU*v7R^DQ#t(iU{oIyb@2Oh0J
zNynw|cW9#Vp<2}c(`nnaNgtA%q!gqJG~uNAhOl@~$-y6qKT_W_c#$lSo&#kXtu>m2
z5RQ9KF#&qKPr_l}l7{ylZCeUqFAqnY#YAW<L5@O5n~D@dR;2IbZ%3O;=a`{^0Cc$Y
zqD0VV8e=~npT0y}c~;2HO-U+1yDkW0g*d~<bf1=3G*Kd?{B8Sy5jz=#J{NQf>6Pe-
z`Ordp0nkg=$+bKHAcO%5jxl}2G+o29Gqcn`%1C5&0b7YqQ-YxupMG&|krgUj*)KM4
z-aN{Z3M|_!h$!dcaJVR*kAWe>oLP7ohk|J@7f%poPqSjYc9fGQ5e%N!eGzl<Vy>Jc
zyv&F}1No{_1@b?mISA=2_De1O*REaWyj(Gd6CDljQiv4>{A8+<FC)`iG(El_^V7wO
zym(EiqWU!IxrFt%?f{cqrc}_JEszb5RI3c&jqQyG@avOcqwt#Ao;ushud&9t1zVZ+
zG$U=;{SOoBE?vGXM6wt~ic_*f6VVGSCUwX}3WNKU8ADc9oPV`w{aO#Gak&#x!^Rec
z8Xr)pGU)SsLl$1&R7MC=j(rQcRLevV8=0<OFM0I}d&J05jnQzHba_N5E4)cD^ht3^
zTEL#XUpr~oE;oV61!9;P`--%bgJBS%bGonG2~_5x6UO*F2<y|d|HzR|+2$A5EWrBA
znls8E#k`Yyiz~Lhf5|r${|^e-@0G;5JIISmo;=wXaVCG&eepx&gGOLWd}UKzL`Ygy
zP7R)5Q$d3QYBTp3GIfVm&-wQ)1K1*DJ3NzQi5S4Ft|zq(BCci2kD;U^$Gf#V^X^zK
zHfMtYAQwq(%yx!=C&P^v275kR%hu0b0uL!8OppJJkj3J}PoMu{-b%6C*T*LaNtH-l
zd_#nz=g^InwP8k2lDH4+Zp;rn7Te<Tp1ep1J3c@K-WbY@Cd5wjN>_r6<`&GLH1-%^
z_T<v7c3RVXpBsyBwKm>N^cqhxxbh(v1(v%$$|2Q%t@~v;Vg6SQmV-(Ro?8IL1yDNu
z$_H|&xyKNZal@P}b<<STKahliY3JpuS0lMpzZ-0J{q^dOR&BSTuUq=VUM+?U_0roK
z_+r`>Dj%P`9njX`Pz+0^Q-9V}GE?etrQ;^8G8ud(@aR?@Shz`vMk>7F;i6-qTR)E5
zuOV6s!2oECL#)qtR2<qz{|P0RntgP_#v$E0wYu3a<JPSoWO$}zOBlE+HA>=R3j*}^
zo}Ad5H%gxWr*bROK$Qr$t(oVD9ml|~SsrMeH1<4zQRvhNTs8|<<KlUotB<WIYQ$GH
zt#^7Kmmgjmzzzeq#+@f<yt|n&Dcf+D|H~>f`!R=Q+iR!HHbIN0p<SV&9PN<SorjTX
zKVms6M&_U0-g+S9@*<Dd+e52fya+=MQnxKB@4*8pD{RJRvJJ`6y%OO9w{+s!8*y<P
zc21<!xW|b(7_kVbA%}v}ctUK^uD4yA^g+0EY|h#L`k~chPpKXIY<>T&Qh<Cp^uK%q
z^xFn?BuLP7U&z`&HvhmwP}ATc7|mTTc?%`+WepXJVLD6#u!KOu_Q<$#t&(SQ@$p66
z5xS+W+>#79<j-QU>0&NwUO{^`%^6OoK2%D{g*JMya?|rej@j4F&hedoV906YBh!3|
zS;73Xk(3Mh6W0>INpYbBN>%f)q2~EafWD<}t7s%$YG2G&HqF=St)Vfnefu4&99xa3
zSomR`tLuFXfV}tEg)zr&1xnz)KH4^6XE;xzyy(Ua*n4ear!vR+*;-heSur>7!3ZG-
z(a;o}j)MGN_DjGr1~+{iisX|}-vqb<W5ppu=#<I-`a+U?_M6&TQu70|IyUe8CU!{1
zo8jtZB>zhBuiLkWQ}ZwrloD5D?zLlE!#+c_f}(pBK1pjiSE}sgnsy4e+V_MgK{yd%
zTf$vP@kNU^C5c`@+l6vcp{dpFdFh~4eXPc*N(HY<?M3k(C%e{8%a)zJwzI)bH?J?T
zwV`B8Ef%TsgG|m0Z^JhPBK1eQ?mN&r;)hAgZC`&4l_xjH7Z2N-8G~Q!GaFL=8!9%k
z3Uu0$l1@gh1U(t<os#5c{}Y82r%ybUc@6z3zQynHh4sxg59bZrEK2;58|G81J$w4p
zH+*|L@KTekjLJT_#=JBB!a&SBd|goA^CRbWO?!xoYvv20)*Ka5PMfPXKc@zc7p1il
zgB~rwJ^OqTz~FA3XtkVfeW~cXoyQ2v@PimRxbXI6QjYt7PPLz<LvI>yulBdS>o3>+
zm_ir9AD_V#6Ng^T<AA7FZQeCE+qt23xxk7HiJIY=1noCm)B(WA2{*_ebN4X8G;`xM
z>a$2ba=;tPI|2TH;v?v}WB>shwY@WL93^6&T1JE$c{ho*^Cy?}8SkQfH>tID9?Rs8
z<1M5;Zk#n-`IMwq*#KcN>Q(Ic(!HDH@aF9=g%P1rPY~ZCCeknB1N^Vh-o1JSu87Gt
zz(e~U1%;Lp0Yb7%XT>E)9!x-z7;DL{(E5A81cUby*p1tWnVkAUs&R$J?XvfQEzFlu
zys!W2f00Lyp4fsweN-bA<Z_~d*vq6jI0sbghur`^c=M|048frsVWq&1TH>tDv8NpI
z(*pQdAm*#gpjyUz)Vm}#zKu2#C+c{bech7l0>k8w@0>hDWLXD?-FngeR~e99gX5cH
zDVD1NQsm3PqssD&d7Uwt8EW>HKmGL6PFE|}xYWv5?VF-QF^mYrh3E2&W2K%b17|}R
znHv~-yjw?hwJHBd);{$7p&n|xP?UHP7U5=_h^evut!@Ux7|kF$@ImR95tyjp`KdGr
zW;EI7k^73TEB)-<3AWsuzIO764(+@9?{3d1-gfnodhhMK)Cc;W=-s>bk%&xQeGbqh
zdd<J81A*6=>5JxihGQvrE^cOhSCvmu<^7tzNGyn7heTi}5|cr5qH}2R&1>~!W@_f)
zla#13Z6UP|h=!TBztzXe4r*$daWP(LXW?X-Fxb6kNf^0*V(nxDfKdwy50P)HsqG!L
zHGmg<<A!0c-n~a|iQ*uhY$%yL__WpO-$BA`ZLVEqa6nYFI%tY_dcJ-6*BJX`AKmL#
zU=?uUsZVcx`{S?n%a8s8ZHsIYmbrbcGEj-70*Dz6vGoMKhzd;03?HJp96>i3@G;IB
zf>Bk(M3MqHyW`WpegmfS;SpefVLtf9?PxG_!0hE>CnwV$GLt4+ysQBeCobeKWmC%d
zJ@4N1$X)L80eZdrH!5HL-KKBTKsW<{tq_Jfuo<?XVz46VTHpDlb!pLt@l=etnXg~X
zEr0duSk>Hypx&M`((3L}n$a6)_`V5AKTeud%P2lqbGmGbd>KDYvG<<<OE#Ks;Wz})
zd!Lb%lr+Nd+6_^W^(~d~IAYL%8s`?pl$S?IQO6CMT9nF@uX26{7I5ppLiU9&V7sLR
z0lkz1h~9JVFiI)3huFCZobdWJw_ZlV!uK@3?fuc&`C=<Y+g<cSu#>eYcPhvz5(H;_
zZyr7Pr+@4=<?X0fB_}7(=+pC?Z}x|Kx?37wWfqBcYHoqhAtif`WH-5%vCb<NDEqbP
z2vkr{i;HEih-wm<G_j0XNh8na&!0P7ZhS>~<WgU~R8p@(y|Wx&n|=HL>-fT6?kkJO
zJYmkxH#drA7;dUvwsV))gY(P#p|c5Wn|1<#)QlQlRSZ6@rxzM%S%l{0yU7zqjjCNT
zrHxN!US3`pu&P7_sMzmCQqj=xygqaA<0bVQk4!|PcXDq!7nQGa`t)fA3x*jtA`lC>
z8V%W@GK=$DKeZ3XiN+x{y)%IK&6geuuTEeIN?!^X+yKA*<*r1i=Fji{@V`F)dQhtw
zMc#(o(aAih`vVKct|^?B_3`bjiDgQ%<XIE&Nv;oy!^7bp#bp7}i*6ON%FuFF(V3IF
ztP4~adT!J1cMT29D~p`a=89<#FQ=%}rzx|K%gi^8>P0cr!Yw!wKxoR;HtUb<*fEud
zR^hgZIK8jz>LK{>iStT*LZFEV^74~});`-r=VG4oX7kk=U9LHlZN&V`=V%>9Zt+xH
z8i0{+^(B;o?U<5RR|gropg)oJP_@mugPNqFsFaugDGwJZsp5zZBPurnM5u2Z19iDa
zWKSnd$fxG#Y1w`c@5IdDq4EJAViht<iOhH1I#Xze!Bx06oK&gISQmRMJ036%k<-5L
zUihV0Fz28ZE>2BMzmC|@OJT=8qi-6>P(p!-C`;Hh=1t*I^ergGfSfL#r*DiVnJslI
zyxx1=h+yfeT`NAP5vBbcxuFs~OB4=DVJt^hE&@rG&NKVbC8uC<h+#%iDL%>H_w0Fi
zhGToL%@BBN+|f$4k&M(~XXC~MeZ~p?zn(=AyCF?RRE|XT4Zdo;nbZ{CApXk<y=ymC
z<{d|w*?!MvhW>S5t*?Q2a>%3DnjlO-=$5A5b6>ti%#upgmwj~nh7~7A$fDnX-g_2u
z8D{iu(|0XT%veTSsbP;ZV<_<Sz^>yI+mFDo(kL%oK0r%r8DB$9|9d2k#H5UDcV=B}
z-Fq=4!IN0(HUkz}#R2+q@Ui$k67DP(;MIAn##BhVPu4`Cd<HbsVc=Lrp>xyBcA|(@
z@h-fHFOXX+Qwq{oaQ1yB{y&cbF(`{0R|};V`oIy0LQ-caVP~bRwhM32n=pYXJ<kAF
zs4U4s$O}d#dGFqx0}+2Nu%0J!pX1yo&ymJ1;7DsxgDtxggy0TfMsjrMbzn}JC>Ypv
z*oOz49kJL}`Vzr|!Muk=4sCVwN3$5)$?}hkcl$dCt~r$B7(uS4%<Lq4iq$*LW4q!O
zj?bWnABC4>);GZQ8hfp;3SMNqS<odkQCB|f_w^k`#+Jb8D*zzW)nM~dQFiXkjpcJF
z&B$(fTRIwDczDhIZuPsOt9x53e7aI`cNw~HezxJOwM4k)$bC-d>VHM<1V%K3J*Ppv
zM-w90uF!kv?>KGIRNbPr6oVfve&tLm+u*3vcRdd?60Q+}L_74lF!!u75XC6hQ><So
ziB>%MW4p+^A<LE$T0+yHPsNZ@lt9d@i~9{fQ}Atw&J&`qPuMeolN2L^)GysA{}0fB
zmOu=bo#IQzd4dm$Yl9SR@QrbZl!&4tLWZ%iq98#)P_4V*U8lZp{k3OL5@iH^G~!(y
zycU4*(_UB`#V-bJCFIOq;f%A3jGCegpU2RHd|9lOMQ2KgoC*J#Gcr?uf61%kxByyr
zee*qqIR{0SI*1quAcnfS9IUc|LCJgccha8wY9T2=9y!*yROX!`N?#V;YOgp~{^;ci
z<i;qhM&N)E6tvFCX`f1H&`j3&^v*wYY~G<hE{Eqxp>VTbFgS`706V)4UE}`C*KXFB
z&E37;#uG;-p){|vt(~eUzfF>CK&++fjs!|kt9%P7ET0iQkmq7U;8_{*k%3;I5c4h9
z=)+{KO6YZ-n^@csleRpbHU6#N;CWV3EdT(HtQ_<qwqF)SFU7^yrFj=oGW~A2HJ;*R
z<mfRz^FUzOLZmHON7SYu3EyhG+Y}Tu4p(j=v|%3%&K7ZXMqx=HZVZiYUzx;aLJ7f;
z9kR$oGEccFI6>y$jkg5aO7xaxr|04>UF72hICHs-5D2DcclXK)>r>xxk=itk%)>;`
zqviEYY+Mnc%<oAsK+@=5J~*r?Iis|L_HL08p_4ZgZOQu2Yij(?jW4y2Zl~XCZ+W9(
zTjdyfxN~m~43wt}I&6A=+3XL0|EVU-l}uQm(k!FK1{#n#PZEXj3t_aZj18o$yG9cv
z`Xdo+h{q^2li*~&AwnKQWXr&sEJyK2jKjmuu*d*{iXhoDr*oH@<UDF~D&z`|B0~=s
z0s{kamx>@bhVufLL$ZvqO&IaP{RMbA?P(MjY&jQNib>$I2n029cSQpu!*Ey}$VmGk
z&2BgU9L~U3a6d)cL=goE$3cT7#j<c?d=TWLHsBz+A`F!81F(}naR>Wc#eRX@_5&5y
zT@s6oLcohl8;FL(g5NEw0fVOZHPQuK$S~(=$-fIY)~YgFCPDhyKQ~YrHY)yJx75)y
zqh(FKvT*rl3Lk@<z3;c5X|L!zq51WNB;37gj!&GA-{lECSP{B_Fc*8iPw0d=hdSrB
z>RodvmAwiRUd<^>%?R9oxra}qX35*F)v>E`_IA0iHbEsAR=u`=|1U4U7De;F{}a{!
z@oe~~2_!}GnArSPVvFnZBVwVJKf7Bdqr9|4)a)C=gB|jswZguDEZkp-0%qj6&k?aH
z`ff&`*z%`)i%=Q=`QN_ouSI{UWZH4K>JI;F_in%cW^hHsAb)Ol|F=khT_?JGSy8!M
zm8|w1Jh<#~Y}1Dg|40;dJ93Ioe%W45E#JsT%QC{^cJ(_7lIBteOg|uhRe;~QJvYaR
z?#T+e*!~&yut*-^V|C&3(VK*mRRp)?|MQR7N+y$;T(s>{g{^mSvEX3TRmNtPqp}<O
zxXb%u)HdP+#}A0Y>?{Rw8>h|^*-{-ER%_3$4ptO|GQ28XCEz~;2$#rwa&GylE3vp6
zkB4M{b0TvBU>!oBiDrZwe49H>&n6I)Y^7nF#eh`z{sZY<=oNjL>s`9)|CKh9C+98`
zB%I?pU>cJ0`Dk*DL@N(oe=wqni<)y|>sFqT^39t!I+hWBLS~5?fJ~xh@QN%70p}po
z$TFm{fB$|uJ9wu463}sd%&abQdHLwNOoE8uf<$FSeaJGgQ&1a`#9V;}u*^6O%d=`}
zJlb^GOd=jzpc?WVarzXwq{NOZq}vOLA1)$Al=h5tbbvO$q{0TuR(?2$a{lj4ALn_x
ztu2O?ky&<enUR_o^)QN?h=td$kl2I4Q%0D4G;~Pfu8Q%Q1P`DP9kY;s$#4YGC?z*{
zj+p)ect!`VBub0j7lfY<f)h&fFtB(jYH(><U(&1IS3{nqA~yd$ejbPV^ZyL%pM4`!
zCLO%^74udkF_5s>rPsl5DVu|jmKySOMjMY{LrdWcZ8tAk<+<@2vm58&`ZH=TO}ERH
zB+lc2bUSewD3hJ>ooe`%gA*>1j*Md$aiQ;~uYdb;K@HG@!w`_oD_hV5q$8fXxce<?
zkb__pZ*FF$!h85H`55@_Z7CY5e0{sbPO;wJ>1~`v{NzEY&?(7~G~$kTi35mYrzW*&
zBQ{ptPxk=ep0TtDE7$yo4-L$Vt<XQ~6Z)JHW}Zx3czJ#3Wg@Z0o(gcvqobDl>QQBw
z7k}3jByH-m=%3#-ifS_8$*V>tK4wQ0Pb8ML*K`IXvPiOb&2YbwmbUWM)?+%SFWW;T
z)l<H0S^Nkv!shv6=*s7`9R_E&Qs<^i0~jzd*XA{Ij0cYd296k=DXYTV$+FKW8(ori
z?cP1=2GcCh*`;T{B8`B5SgrSXztA+0p6AHq^w$-NIK~4^%$eA5WeXSiz)L+g_@s;U
za-NON(sw;j8a3R^^*L7bVA_lsqlVg?`>VP}D|jm><~gs%p<$)}p;rkUX2<eELD=`q
zoIZVo$>A~S^LbyL_HIOKHgw(v-G@=&JH~JGIG5zy*m|TpZjYOOBM;a&INOB~U618A
zJ4N(W3iDgygm6K6h_(qI>Yjca-?|vJyTWF&L3^L0)b*mh0H_5)<`hN=<VFb<LDAtG
z!c+-vtn-0LvPAwzD=0i6HyK`#V3{Sv5pZ_ur9K{iZxbTX@r>R7AK^CuluMb-EnxgV
zoH>~Gd*0$Mw~QsI_;C9`^a|`FfFGJe-Za$5C0T#LBcJAb|IDH@{0eBb_uGm;GUotu
zf1gjaboJ`f!b8(xNm&c7%`=bl{IF@m%R(Dp85E{?oX!x+>R*rjqGtHslsYEv+66qQ
zR?-b&){;$<5FV3;<2FhYL<0@P0KoU5LXM9UBW1-ie{|$4xD&#=1KgiL4<H5%;zJ&q
zN!cK<lTwf>76#ji@un=8p$J8xFVy30=nr3YMke9$PhS4hWR{SbXRg2bT{gYIBuUAJ
zZj>tJ9zhZV(35<#X3US#4Ve>TUP-wzO{^SbT@7E66%wJ6=~*^9o2-C1U4Fj&HHI>L
zLqyO^;ZJFwZt<M@IE??R0Su_Wl6WU&pZI~p`$JGK=lM(Z0!Mr7$^5Z{c`U+O*1>=#
z)2KDYY%E=3X;smbWO&#n&}g#J`Y|KZzj9UtI{g}W?uU`7**WbhM&*WAMxHtse<Y>d
zj&|n8GtG_H{c$>}RgS)%$)R7ZzSHjf<%rv7w{ESisXw>0pzm3YM`tRYUU^f{=z0Ij
zwpH$i6ITvqFPKcbHBdgviVniOurtybgxq*#Qv34ZJOD49YU?-g7wH;18@zk`i%i;U
z3Htyjn9CQJ%_+pvWdtp${<MVFks6ekX!`6`T!<JI(+qEd-t!L()P-c0(nn?-&CJck
zNMDq{yanHn6Vn~(rNw7#*XTzC$T~3cfaKdVx|o%n9u5wQ?SU3k?}?p<!#cHn`LVUa
zE5SDAU1Q@sEgPmDN}wCx%xd5DIaxhx_^|_qT~-fx95Dp*`t>Y==`rEg24Go6ZdP4+
z15w|VP`^tnl>^yv_u$j}tKDT%vUx|qruAYIb#FA{jI;WDR`<lC<DC9@int{1@ZYFj
zb%k=Mt*xE^nrIe)Wq9}361_(qdzw-oOZgc$j>eqS6z)-sM&5D5P7_AnSc?~V=i>tE
z7i59;iAV67%m#Z8F2aym{oqDq*}L<^Cg)}z#i&LMJ)6_E7(J63KYMrVb*jC;P*c0e
z&((-&dY5F_p|WR5#~SJ*quUW-TW?%>ZJ$p|mFH0fGotIO%dk@0MF0CrgRv<#k;pmz
zc#7;y4}-p=F%aJuQ$(<NUOpuEq<Z%;j-};$s`b?=x2<UIyHWuKHwolcln16{jOf)n
z@7k=XS6&kGhCQtw?_PEVNB>l`EW7i7N3Bsrc1Wv74R3X-!|1h-^o#a84#kd<@8Mm-
zE4<L47f<`!cF#T-^9?Iz5=IB#U;_DQ3<YukS99(WTl2inua;Cjnv!8SNIv|>s}J#F
zTK(5}C<t)=MIj$MHpaTazonA+2WJ<ZYC6jF#Lal;kB1n}y|AkA((s}@@b-M2y<9r=
zytf3qsHa6}js^4#rNj@AmJ`&(PHAi$`=0v8YQXz-&F)b_+0G15-0=LMr6l@QzEo3a
zn-Y?lAsC><Vc`HJ){&7v|K-tHq21%T^W*0*_>sN0+2O<hlu_Wq21jSvPe~~yG*hU*
zZ4BLybh~Lau^>@m?lYo*DJl!Pa%#N+-MSr^|5}{4xp>}h&@VA#cH7sap&ifu3hUf!
zUu|ugP;?NCL^iUj{%Q_w=)z@1#G&)ZqN_g?VuB^qX%-b$9IoEJj;jbp2ukhG_hFH9
z>m*M!RwY$c3zqHK`u_Efdzl7g5B&0`#J{H3ifgd(z;}^B^R>q*Vj$)WWf2syAXrv=
z<-05(g!0MRQ42y9{>*ixKrAeR2qSa5dwygyu1#DKwdg~nT!{m}8!M$4{o=~=#tlE^
zQ~Q*Wr+q(0AHNFbwKfXnJlV-S<fHuCip?3fkr0XZHvyx+lBhSRHY6APMz(Y=8;Tx^
z);4qGeR>>Wa_RPV`n|<<cUj=ve#%9j^`TC-8Q%P-s!&bKN7zVs&K#q5wp&TbqhIMZ
zxsYH6erwZ2q5zpV-IuXu9H~B}o{V4ZM8E+IoCEt}L1GaPMgI9`J#RovVEuDvnIRWG
z@%AnEL%2xLJgyREI}9U?!!?J2JH<It#6NV#Rs=Z)C&kobIcPA-z;l<+?A+NRh5VC_
zeRnP{88LR>V=*^GS2u0k$M+5U{?_hukTT$c?Zo!e6J<Z4DEL>;(>y3sGp~ouboa2H
z?n^s)p!7%GTp5Lkc*t;;7=k^2SFx*u@dFT)ep9C=wYC$AHnROn*-<d55!%Q8_;3+|
zFi(@U5H-h9Cl0e!6*GCQ8#k~=4urNtZ(I(GE^g{ufvu#@->tqYdzCP~bLXvw(`{p{
z8GNpsltc_vn0j8ia%Ba!*;5+f&!E1i9?z9kx7=2d^8rd&|30wmuE@xh+j{mbWYIVN
zLT5L<!u0s|*he%zq|&hk{TBp3kE-bq`C3c#ll4P_ZtogAI-Eg9M0~5xLl+-jTS-Pi
z{=4LSn>KAa7A8;f<<y+ws^<Gt6(K~78k6-mcC{4e9j~3_KfVG^>g|dJ9y_qd9!}C7
z`gRP({{D&^nb)AC65XyNY-S&1LC)46AUM^;m>MdX*OJXm?)b1!^xKImu>doGwr!g@
zfzXl=Xt?!}wbrs-Ey!B^M~&qAwa5Isw1_HyMQm35?GAAv1`~B<#ME@5*pw$$FqV}+
z{F}mm)%Q{?9`xKf$lh(!rt<j4mm>?LYD4?c;hF;tu(&S^kOE0~>b$vbz{D*L>hIh+
zIJ?w~U;!dsX+U0oJ?O-pJ9j48A@DryI`bm~$U@PSYQQU4+30p<S?j%%uc7wWT+4X1
z<XF!>m50bqF)v0KiYQLEt8x5Qbw>w>6_gWGuA-6}V{nj}$RA|``;^UyZ&}<rw068)
z^O7XMNbiIOvnPj5taZDJF8b1iv+0V;Cz!-q&=YjrecR^Lc!nG1dN~CLZdjqr4b!W*
zM%S?tCBXKD&LHx9pvd1Vr%){)NU+V4dugtDAt%IFwMIE^b$Dp#iHGL%Dc3Bw=mBdT
zj!wNi?6z&p3mk!C+-GbqdhmkjXx*;6s4EvOF5IBEbrA@F$ggMSmXspG7d09E8&AX(
z>s<9KmtMf{%CbanS5B}<!zLwNaoUy(EW9dXWZ%9)H}6IP>6U!g^m5QAqk&G82UCuJ
zpzK;nu2H=<O#yg0;rp~?$rJj@^UhO}f0MV@QQn?x7PG4QL-U}}<66r(`wW;2io3RE
z3W!d}_t&`NlXsp$q-i-};J|RV-@0t$nx#+Zy^$q_5x~_MU*G<=^wn4x!OVlm2dxdd
zpSQpLHM8>NbSJuRqOVZ~#x-cbolHgyF=oL7oCu0H%$@r?E-~|>a7R`s@}`1QM|GVP
zH8*ZLGbfp2JsCZd$!NS6Pcj>GN!LvG+#f4u-M%u5*{c}f!;ZT%ZB7Nac#pSF{xZ_s
z4#1UQlhosFamw_J-)m_Z>euxBs!Nxp_ujmHdojEzu+DA?FzbqYEC|!R-+k=!xjs8x
z*A^#k{;B@q)UyeK1R(vTF0oQGsP&=dU%DaN#dBxlW*K)De((I-%6z*T18@5C!%uZa
zwqQe1GY*YNaHCvaHNl~^Li>!Y{V1-Z7^ph<dG()?G&|MknVw@hbOWmU9#x_?MLLq1
zM<QZf=5!`G38q6L)pw=g2X!;kd19cw@il~<mREIW`PEWQ>0Mwzz^aOWzDxJ5jALJ~
ze|}gtFff`PBE39C{`dQDmy6*>;^_JhW1pZJVwU)i@+U_~#LIE3mi=~`ZjW0H26VZ(
z<L@;t#hud-N=2sUZrZ$gUR=$DI8^=$qk8`u&rBdznV5gpbMqFvov4uJkk1C!748f^
z`@8wMX!F&-@z5O{9lH&U@sQ=OO*Mv1cIO9o-6hT%QUZXMi16q<V_wWBc8hF6B3UMm
z1jzS9I*RNPbZGdTnGFRi&uHY@J2;3<mHV5Ge9rmx4^GezjVYa9IKIwdMNaklwfzhX
z76?WEqnbeo`CT^Lu@&@oUE`J4F5&NA_EUENT?C!J4-g@<Tx~mcl`)i)D~-!N*~Gq+
zLdfCn26UU}+;^vZN=}2o@y$?`X(^EtiMHv;NPI~Lkm-i)8S@q$5NTp<>29BHQcC}D
zFmqe>zM5^}w54L%;-0u*tF=yPQGQDBiKBfj%m#E04Gk^X6xRRDnTk{9U7scPcIk*l
zesJU)K2ptYW8C{B&plXkRRE)0a$6nMj4U;)f9dA2;D=*xNypU0GG%(NQ5=@URz|u9
zgwf?NHsUC8{`~pY-21UbO#M8lbsl|aMnh54heeSqi=RI2&`YKrjOv~3(pk;$UcXyk
zlAbmS3$yx1?-CY{j?fZbYRo+|v}_lyy!4;5Fbf>a1&2uM>stX1qyZ9N3iP!?1>x9q
z;m+@74OgQBN%#Wjafj!F*~z*Zf7U$S{UhXB;#q55n&-2d&cHftf78EYV%f<cr=ghJ
z)-B}Wu4=ga$oj#e%j^3WB`C+9E8RLamq{y8UR{B-k6ZU-l8`kx1({8mGUa$~L3Pnz
z-m)K^w4%}RXMSWTfLET!2k*DvkhSb;KK!$1xB2;-3~ylp_x!!ipig&i9By+}_p8}v
zoj1HE`)6zLX6i9D^agv8CU2V7dFc)!oavWDIF~|t3%STyM@Kr&iavPbV?(NSrTNi5
z0TH^rdac^3bplA<stS~D{%}B<0|KLAAywdZ)&cN{PHzrC4!x6ojCE8zP`#sbXC7BJ
zy1qDO?ZgC>$+MV-Lfe>Sv<tseoP#5-(RVv=;9B+2Xwqwd^&*LKDZk>oqq(_qc<=|F
zD!OF-IfV$f{0<!&2!u#C7^-U?^|e@viRPW`)kAN62y(JDb@g&FDY$j;df~{+_Kc2|
zuW0h`QRdkP{_Tvv@e6GAtSE$8{<QvH2t=Uvs3c&d`5k{=wV=?pqHHK7O#e-`YbS@B
zv-3HOr(K4g&__#*6h++)qOd#thxMKhE5F}D{}ax}-J$z$YsnPK)*|EX;JfJ^S5-P0
zKG_s)snJp+T;9!!DNZcYp;+Z{Rmm(Ae2bIz^yZQJYuyHFL<<&jWaK1nQY(e~5-PvF
z0GpcZ;SRoz)`vPcRmTC)S9G)@+(!fBw_&HY5sq$_6V5#RbrHTR6rDxOZg7sJ>xMd^
zxL;lK=Zx)TS;0HR+fO=os;W(RH91#RdVs$OWC}u@61%sjiKZxzoDFpCD{_%Q7(Z*2
zZrb#Mru(z6A`>)nP4-+Lf*GrH6k21BYR@D`^<Y_`RrLIDUY!n-YTCw3%Z)GdW2aKx
z<pTUvSC*1rbCGQ>J&#^CRHiNXhvp!mqbQym^<Ff9E6sQRF>8l-HNBlb+L<;nrXq)i
z(Qlb&=o23N9kPUXTXS4J1p`^=_N1-oNpf4C@%@_sl*%q=W+k!v{<!qoRwkqXmorY@
z4P0~W*q2?qT2&U^MT|fF{pP5s7N|ctf#Or#ZnHdD@h)2_Cpi2=arPp;DtPkkJa5US
zL;Vk@YwM)})b<>HtWD_J6u*ItO-^Y{Y=1KP*rS>}yS-h?)DK1cm7bn{vi*;UCQX+u
z8apIs;4}~}%L%37#@R(zJ8(mCr#t|?6MMb%58ZY!8j1^JEzNE@(1N^on5ESoYhtWx
znPYrb|JH-%D$-T?5}7VGIJPW8jHcyUeSRzk8#Ij?RRCXN^$Z0kb#B!@+wFf-l;v5R
zas?B*6JJ<ZC{B}N(jW*R(J=@~caLKOu+F7>bYIxW49MI#Lz)5Gq0esLwjXi(?%liP
z*8$89M_>1}^%-pU?ES>hltrh8G*|Ld8tDPd5EV|}kj771A#?8Vu*li;P*^6vOJhEe
zN#5;mZhiPi<KrRU%H{1V%6{?N&{EQ>ZhCpSw32c9n@5Ejp);H8E9+xu5%cx><^4?L
z@%e_#FI#b<0ZF@8Ar+IgCcYtnC1voT<gu)Nd-ZM4s7LydB=dV6uDLZv$z;nB%SKMP
zmD(U`c$V*#JpWp^HEK{Xnq=(595CgzClUuJ*aL&&d3sh=G~0fzJLNN`91k4uH^r@8
z?B``oV@|leIKBf%nYa;|ry~$YoRk$sRcuLJF?%M%po}=IPXNJu;8q1PN_zFP9y0d+
zO_}MQnJaTz&xc3MJ+i5|ES(-^aNY23Y|JCaPjA@#E%fv*(8rY?$TQBArc_L^ta@v)
z@ROy?8PJCAWA}>p0w7XyhDIxjY{RDdz0I-=svA6vGozn&`K$)#33|a4vyAp9Sr$@9
z^*_Dg#*R>tZLG{S_uE6xd~j{$-{4fI3-r2WOuO92;>v5SWA71;cj-|hU?H|m(D&OD
z5pm8vl05Lkhb@o9WrTP+rU0^d4l|)oK5yEJjwS$~ncMc~>X)e0b0sF6*(lBICcc6H
z@4rWIeOGeWxDG;v^&S}&C{GKt14G2?ck)QwE74$By?SU}%FvGX;KAw34%pAsQ3AzV
zRrOr??0qk^hbPAke0!qnyd<9xeqWE#<(Hg_SH))>-Ra!t*8QS6o-*Zk?+tUL3@6zY
zw$DgQ%i$Jx(EqK>!P5jyjLe1Iw%4gM|4pao%VwXEYMIHA1q)Lekp<+Uz^^*^l_Drg
zDpgR9V@}_=ldXgvI}$r-_An%L6fEa(gFL|}?pY-ZR6%IOv0STSvZ3|@ehU-R+M|Xr
zu}8BXo3)136w>K;+3%cduaw2|GxbEpJSIUoVwU-!G+79858`-Jbazgn$VHc-+GApA
z^_aS?L>U>3QSD?0`zkzHA*ayKM6X-bd~_AG4<pAM{fzpIt#~WW<mg=Yji_P6`RQ4^
zycvLBUfgcp%Ix-<ZZ{*YGZuC@`s%_71y8Z?^dmuJErcFV&!yeHm{>tsnD24KpiAk*
zNwZ&mn->A^D{cbbZy2U$&fqVPVi2ZPabK=Ok0W_xrXAWO5ns#Hf3mH^{Lw9TTBbp)
zGfZ|<Jf;AX<T_;GwPmGItbF?xJdk)WVof|3!9vV<c%Du?PosMY9-aLRz)K~JE<2{@
zJO$SC2GszI=o{w`xEbV9GXL?>V^kP(y6#F?W{7I#vMtosAe!yq>x6V<9bNNY!F=v=
zNlB-Ii=(EVRLpqr=>pboCXajx>SPIDu=~Q`2|pQU6GFYe*(1x$4o5cw5;EY$u*H<d
z;Jp*Gi6Q-CUjMZG0bTC#xM2GQrJ|rgNS($Ttoe=7Ch|_ha5g?b!N(2El){ra+2I91
ztY-H1_S<sBi;YTSOx;i=SkuM1i!V^aFavb?P6ZJ`Y>}t?3ebZ`W`X`mgNK)FlF3%q
zFGf$cd10Y0F&_(}-EVjZXONPW^lZYGv-=s=j7S3LI(~|kRe;RcD6wNTkG^}#6e|Qd
z6p9XY{Ah8>^sS{(QHgA(Pe12urSQu314QR!t9E&a`^`$oyTsR(VQ!QRLFJSTm8FzA
zaRonYBm(-nSw}?SL4b>&8AVR=Sm^;0|Agwm2dQ*VoCrb<-WJ-O7jYA_TOJ#y%wmr_
zv10zSK&H(jh_)q-?yR8^E3n{)bR}%k9+_#4riVogMax7~ATV=O*I^H(rn*o6sjU<!
zh0D6LVX%A|ZAXsrXcSYyTd>CwjXmX57l&;>O_oWpf#xT>4_H>(pG^u8Lwb*Nm~nK#
zxrx=u{j93QxC{fNjMz-@bm_ZM@W$%pQX>7eqL92ctmy7i>bKgPZPda@q+{L=RZ32$
zLRj03ZJLa{;!%H2gk`*GW7<cAHUYuGcKZ^~AD}2qrTbY%v}n38zW=)^;EZSM{~2-u
zsyPQ!CW}+EdKX_u7Bxi_F(W?$&7Lbb`y5a9`@GF#Yny<1B=|Y?X&?YdF=MRV7_n`_
z8~Mgwli1O)9OC~<Nx(cUWz&aOTY1vjbU*oeBiT}uoRX3)Z5n6FxS`SQ9maIx&zN!O
ziG%7E{o&C$Zw}W}{!-*yam}V(FBljcAtXIO#a*6sG;pxY<;#Lx-~n0KD0ANI;5zVn
zoh6@#-4EwHx*5jTWK3XIYGeVg(h``f3yV!K0~1SqSgU(L;o)?C<&SUuVx{(X-cuI2
zufT9prh<j%!@V0L=J5!=MXTfGr2uM~*0A|_7So>{J%Y+)OBmJNS`QOp7{!1NF&aME
zEJ^;62905}`=V!puN%bDFf!a7At=-SRQVls7=zuCVB~L^&-$yVKJ_O5rL?AWKQblF
zZw8Xe6@yy2RrsI~d;>#nn55l)W#K2Ae`V^ifO+>hoK@+?UoZ%VTYZkSxO`6{v2bUT
zBb0Dcvc(`7S&pv@ot*e}P{`b6H3z8KXvP7TbI+N;*$>6;5ctl15Egw<Z)JNXy!6rH
zzrM|76f#j}3D{C5xV`LzWF=n6gqN58wEnCHk8By&nA{`ts7(FH_O&S!h?IEoXM<_U
z%8Ws@=p4EN-2SAdCqW!fe*5Ll6Wj+3O3&<erH+@51|saah9N+So%4Q{&^%<jlvu%w
zyqC8)kXJ`lC2AuvNW*_<zEGDd;xs;AWiL@sadV1<worJ+uF9^;03L%4^ke0bu8N?4
zgq}Jzk9thAxTy|aJ$6-5{KH4fkN<-b*Qg}PV_}Q{$lu+TwtVxcpAX9lwc^a<TB*##
zEw71#G`(=;LeLqS7b>S+OBnzglVAb?-n|r!=iuz_=z7N_0KFA}6YGN4jY%N2N8}ln
z{_JVRgE+^wgL@;Oj3+sBEOwM|m4>=p<Dgk{YZoosDzj~Jzq8LQx}k6QmSfv6!^GsG
z2l*=in&;v3qRqr+T}j62hNq}o=E|ls^CGIvi+?2~bg6jTs&UCjo`ANE|La$C^eVog
zBQu7gNzd&X_gr_@g3Wy5?{ecfO4}0=wmtgSR@$A_J!Iwk*t*zw6nZ64S7(`#&U}9C
zPyW-vw13)Xi+JUcjh^*eIIXD&cm@OXu81Gb2}pC^O}8-@+wTsQHy}R(V3n+)D^EY#
zN;Y2IP_M-RkgQsTUa~u0B-;^nh3k&r;{SGY&n9{nUHosiFYKePZjX9H8BcpuUrKVc
ztw-6sI)&Ldy(yg`K4Z#$=LF3wIm*rkcUJD`^6iJz&gJ{1q8nOu8%cgm=`f@jhnsYx
ztYiK-*|aAm(l)J6s$R3yU~w!G5KAic*%Y~2N@@~w^s3bc>opXnG4JVj1SsQ@4^d(g
zc26=E?o4@lBmK01cESp&l&bq-n*bL-wgAy_jNKT^IRL?RL_`@M5NdtRjSsE@TEW_o
zqO-AOlkE@G@H6?hI_GZ)#RZ^qpYSSf3*z7}+8$?TbAS-_UcI8&a5ELY@2V!0=Hc}&
zRQ<4&E|q!1Da7Xp8!s|P5$^$BqvvG%^A2GG@Gz6PW%AvAoCwnmchDBUAdtxoAw!<x
z_lo3~zhMRx;R3iQLmm>h<2Kc;z;*FK;aG{<JHK`G9>D+<&aZjH52u_)Unu+IkN}8W
z!Jsb3Tt<e#bAeP#o<9AKP7R;F7nCHUR}9BCx^?4efM2lv2{OJemSkW-vPd1BvzRZ6
zvw|#&quv#BTLF&OzeId;hh$XuWJjL}QjGwR$WwBVn2Rm7U=2ckpd4V|WaLWJJPvoe
z%hF>WWHbUTA!tPzFKd&;TZSQ0`YQ3%k=-Y#awv#SCKpY0e+~5Wf}^|X$@XrdqvA#N
z*x)HLg5-XCwQ)g2Cn&k4>PU1KbhMI75O#^Yel+c*m_2bhIU4?ae_8Jf$@c;<<F1^l
zh*Mu!I(*NWjoHY8LV1!)(X)wCO69O2qq=ByiR_C@(-evX5xTvg0J={d)BnSV#}8nX
zN26(*;P`7csZZgrR^wiBhpp3McEop;S@!F9TPZBQOzXo>@4xHDqE_2wanrp?e#i<c
zwzbzhYd6K~Ll?V`*0+=@k8ZE;Dv0IG4jktI82eJJ$&T+Wbo;iiK2wCb2?mSQzNeak
zog`)STWV^GIqPZmO)pDdp!%b249t0U#YJ`~%{rv$^2z!-fgPpBA6R2)+4Rxi8=Kru
zT7VDzRf}2(l;N~s6-apFoLv=)dBi2v=1wRJQ8lQ%rDQt}`+V<a<R90SjGvIi*H-<x
zsVNEQS~Qbo0O3^!zc6+BRF1D={7WVk1^yroDTS@N2j?b2W0sG&W_+peIlw7ll6|Vc
zOu&Szt~K#?WmmCGXZMc%(Z+6Kd#|0p)nBW=GO>^IdQC-;Hk4=o4@LUmJYI)?+_ER)
zd$c{&O4KHEHf`E;T$Bs4K_SbNU1QH)ynxYb-DQ$f`KQUFH9L{|!FmV|DXgz=h@YRj
zz^Jm7S~&it_V#&Wl?tzr8*BUG^dTEb?gQt5kM>oHM2KeK6g|WwLV;_>*Kcm}B)YWc
z0D!a2RAz&AcyCp-!<S#cMy+t}v1<nE(xCN06Q^2s!9kO@rfc{8RK?_C3rZS)Ej9-(
z;wReLgtYhDoDiOA)7&0ve<gPfL~0ZpJni06e0CQh5YpUxNJy|_uq)MV6|_Pe8$t6=
zNjHGTJ`2KG>%;X4ccfsG3kUEK;~b!^CiV7v+lgn!15NS|e6tRq;Yci}R6Vy_!@^@z
zd7bN=!!l?4i*`u#8X}OobZH#SqwKU6#|X~IV8Be7?DVz3CsejufN{BI^w93J)BM<B
z-N242WvlCcRufSK6Gt9Q@c()P<G(V}&_K+H+S6|%aSdof`dDDe2q+NOw67I97s-<5
zG&YuuoMIvfWN><-8ttVxAjsL9rE%gKr$NzZH}TBxFK;w?79al?5Q*&NQW0T~s6tXe
z)_i3$njoGo*o4BuBd0WM1*9vG#=MY~6l76i%7jc}XlRtz&d`H(^&L)`rDOL2Y#0O^
zE?cIs8o`0Vf+)}5I$W_K;{r2xG0vXu_hhv^G!}eY7N04YLRcOT1rFA${7YmEVv~s`
zTD&}E{X9?m*^?(r)GuLCO+hWQoS%RGxfF&pqamUXryxq}QUSF?8!1yPro^HupTRm`
zlgP9uq?INQEd4p3H~IR`mx>@$V(#dLv9CG)Mz`fi6&Du=6E^8gO$uTi_sYU<kj-*J
z)D>3Qf$4mYpiY*_$hZX?4|2{dGTeOX3%@}Lr#~GuSBd!#-Aj)YU_4CrU?<7E7o+7N
zR9E|A{8^rRW+(&2!ByBCgOH2(Rl+`BRCe8ucsHy1K87LkTp;FUv6<|E1m*5|ED75R
zt|wfKYwA~uh@a=JxjdO~a*w!PKXrh*1{jf_T3V^)RMNY5?vBpA&2XFQEr;?S{F@OA
zFRskZ*dxAJ7Mi@qoyZ*{Q1l5M9lKG-XuCyWLyJMvVn=YSdql|9dooi}Mra<5+YZif
z@8@F`9liLR>j!t1)@EnpYV~9UCbC~q6vw>{J?8_&Vg)7&dZzx2m(EaxrQlvKhU!EV
z6W)&{pM-@2RHHiM<c-YZ^UlfGTKN!UxA#c7KYFFR0@aT3MuOgjfrC%BENm!*PS6eA
zr`msca}3OROyj=4xGKWJGD|u8xgC$DjCxImEU0xcDG7qx8IjpWp%Wq0A5uG6fCQQ<
z(?KZj3nmP<7*4=n=X@}8pE=SXao1w$Ci?q%NDM_Rv~jM&YrP!r28tX8y-y&=qh?Nh
zBqmxGZaF~1Cv+UP#Q(fsWq5ltLyQRFV1bdZ?lxRgIBpBlLa`o6eFxtwv`1<lU&>xG
zjOlurW^(&`F-)U1{$3)Dq#je%=z$`f6YYX(0k_JQ*mRQWNjQzHyZqzw{wmw^v);TB
zeq)Nqd{!@r`4JfYxd%Usiyi9w2LPkqxr`!QP{~SO(wGlhSQ;op8tZE0hh4aGsQIz>
zKcaf9LCZwSNl3b$me><aA0<vOcyB=dLDdhuIfhS3CO2n-nmefe%{Su2y7^RF`g>A{
z4B;G^xMeOg-mI|@#Y+|KhQcWHhb^5IXA@@LFC8?lxe!g+1{M@>dmL|1;BQLKjF!)w
z5>7Q&!C~C5g|br?dNnihvUX0y_*#tMA8af6z5nh82>D%y|9$03jL318R7+;P?L;BZ
zfTA3W2$g7w#5NW~m*P4xjwFmuaA>2@-aGN#<2J>0sFNL%X7D3*hL%HNE?IM7VvD7o
zUmFT@IzsdC+VnDg)ibcr$Bo7cR9UNx;#SJbW;&GfNT<tkKWJV6q!@S|Hk*A@r-zSy
z|JlUxuDe1*zEPDG>Mx;H#Knw|EY_*L{+#Ozf_oYm`0PPdu=na92D8M7V_M;yJvj@3
zM~+klc2V4X#1CR8dbAk+_=-i{GKAEw83fy)>Jx<WXQBTruW7M%^&0Ut$q^1l`~?Z6
zf`>2nxBss@qw_)aiM-Bbq3gFhl_b@-3e1Dz&3nLL{wPMplxBnyStE!6Tb|w^ii8wz
zp8dMuuOmK%yU_l`U<?p)sk6nq8ikQo(PVwfMd4({MlmNR=Wve$cimMFF-)JjMRsOr
zv&e|+bQk5W(A{#B&hAG-5((xfz>U^&PLWUzM`DQuVejS8>iI9`zO7b?RD%8q35fu9
zC7`bOTky!v2vH}<AK=L8uC)jkrEixn#j_5fcfQR(j%{FqW)VvVg{h@3wQ2GF?oX;8
zAd(;75b~Co{;H%r9Tba)n&`j&=j)qy+NkN@l(XtJViKo1Ib5s4d6sHzhL^3N4rovC
z2jO3Fbj|eHr5ecM!$?coz&0pBd*C>Xh|7P_8jP}uy>s_DKXGZkt~zJ<m2`Bo05W{F
zWL=5uCXz4i7e_<<lkkFC;Uo$<*?iHp0>mmJI&)^dES{2cn}I_wZ>FZib^=Hj&omK4
zixbD#c(evk|6}3_#T|PWb9ni$PN(b9`>dqFl<}2x3R(Vm?HmABNbt7=^g}8OvlGnN
zv+ADr6VrH_dzqM}0F?wKjW=PE6=$6}?G~#;O+WeKb@;k>@6~~S#V)`5J(pQT5?`6n
zr;zUk7#iOAZm(mEHN}AJ5bV|?_0#<tEGW{)*L$~4^A*&KszWqka>7ju_?*GGB5?y}
z`O41oWqh>evtQ2H_lgMj`&5$}&C=`k8uV*2w0X+d`_QU9d{I82$i-qR`0LwG2r_r6
z$qu|K4QyVpV{~r=O|>kS^wna!91kx-RS5B$=ZX>=9sUu0cQapEkSsD}VuNc&CobNK
zVEN^t>J=>oaaaLpwX8@D3)2?7UwqZ#W4LzZ`LU;*dH|NJp5Ffy&~`;kl4fd6EZyA-
zjsuMQtnl5q;_)ZtA|><}tR+S3;2R=CKLmvS7xF)2GvFnZk?lHl58|;XRU6u9$elM$
zAkyj?aV9ON4$N(_5j2gX^H>hKEa@2YWeg3DtX)O3aF5+m;u?XhjdmECN2jir$x;1q
zuJ7FIrIbGqA&ey~37t4m^>MU|aA>(l`y_Hk6t$nP#nG8p6X)!p@bdkdSz>N*Il0$2
zMCuVfw7wQ0$#jpYU`lh^)wMVeTC5?j7F^j7>C_{W6yUc=Luy{S+=teG-KCEq!uUBQ
zZe=6DKBpC5o~lv(a<87CiNayXx(zK^uyBub4t%X@CC63(Bgx>9==hYr46F)9M&+KK
zaflrKcnUe%)ZKsfmKOU~|5W;kIA#L5AN)(c5G0R#;+3mcWlx2ef?(SSN=kcgmZ(v>
z8n~!{S#TLe5>xd@Wz8RI{R`p-N)VZD){?Uzw^im4CpflKXh$<EBFnmjUD1;57_dmD
zpp8|5G9Fa@Bk#%IMC1Oa_Y?z1whVPE?};iP2OTOH|31ek`YOS)1OK{<+KSnw0H?$Y
z`P5YiP10H}Opp;68|o%MNhR0DVw@!7x}vhQ<K3K?rc{dXE=(Xbw=)p`(mr0hcCGTD
ze2`U=n*D$2{ps3-S&tYwQXK4ywT{wxYa19CWLm>xi4N}8ty^FpBC2Bz>**00xKi>b
z$b}&XQA>&n-pMuwXh6m*MC|LD(OF@7kRP)Qmkk-Gea%dLu}r1{Q9KwvlE1CqRzk)q
z*H4Kg$OHe2Y|hf|$@&~3*7K#S0#~9^pI=WMrTgb96}+jaEG3hx8Zwkd#n&b13oy_B
ztVsf3aIZ%cP={!$4BR!VE@`8PfMp4@5F^r)E3}6YIK!+f=eI;Fqk3O-*@DnECrd7=
z86INsuL&gdhEoB$27UVFDF>u+#4io3GjTIjJ?|s%V}0gURlrE=tmrFJ<-52tqWaR0
z-2Z~+CR{*T+Pw32s^9*(9LtaX`#)9Nl|#pmFBtcmBiEeaf3x@)^h|OP84D6q5fCr`
zB`4*9D->P+M3Gc0^Mp{9iJK|6B=yOTd!jVci21{RRD{i?AR`S)_bqkdp+kof9mV)k
zT0dHJIRE_N#{4k9Q9K6iMJY=@-H)YwkhwBD#MBM7AD+Vb9(D{G%UpW#sH3#`|M?(u
z(2PxFx=r8*XqpQRsPfFkN{7Nz#&y8-^9CptVSfR>h>Je5CMLEv&|Y6`xW-qKVe~o#
z;;NQDMR21~sVpiZ1OFYt8e|&=xm2>*Pd~kY?W<3`kLeaaX5_45_J)2l;TuW={uKTb
z{Q~n=Ccvkcg$LEQlLP`<P!=$6jqIGEW_7#SOR=*rqqa1RLYsgKcc!9z6<&)BbQ87u
zX!r=ggB!a?Qek^tm-tl{>Gdgo`CX&_$3_0$IB!S#Z9WRCsZ}54DW=fD)blCB=BYl7
zSH!ol9ULNIAi)kB=3i~oMls!lM<s^SV$#j*0(j)PjnnxHKD8*EM7?STPAYSrl);hI
z#sGx-`Q#`%aE@Mh!p`hi8?O(3e||bOYaad2V1}P!y?+nNF7ciw)j~ar*C(LC0jEUO
z=TcbCgK?CK4A4W?urph;ZriCrZ4^5bY2zrNp(cGff+s*EiNmui&jCxBW?+UDNjBV`
zNV#UrgelU+lc;uvz}nhnnSjvAE_tzy;<Z|J{3moD${rnTJZ0kY;lqa!Lt#@su(wCf
z{dBN$arTt30)J!P9Bpl1onLRO^0M|i!QQ1TT2D@}<WU5p+Wq?V%d}>86%gRjxZh6E
zvx7tqF5cZ74onX+d~(Ea>%x}zO6zvrT*rxiMb)x14F=&=Assx)^WNs%8(Wp~wk6>g
z=&e+A*^by;U<H={KwUF#HxR|byFwADU)f+z2Tdz+oa|UITwd?|jiMhT@3{6XLOhd{
zG!<I$KJ%Un`pa#asaH|MyUU+&<d0^JhtZS&o3N@g$q7`8KVBUe(6o^VLX9BKCgi_z
z*tW#YOdKX|u3tUFSr&oGpd1#)76TpCg3bv)Cwd%dl=#-}i7q@_2Bof4L|+xG_t1=!
zBQoTM`PK>wOq{&%;2q@~NM<U`{N}4A3dPx;%_U^=V9Ij#FAVGY`ll&V=2m_07R<HR
z81TB5=^9$-r3Y1{E)COR8C++$7%mECR`qcalZldm|0J>XQS!||J-y36CAne<8K~#X
zYUhxztGXH8^8?L-KobK_WJtfv3LLl3F%VotVjXI3ahDY4vv>xtH-Zf7$~J|YL+nJd
zBzUwXRm0WYYKpTHnm@4*(Qd>0cVZt)dCx+h?~0DJ>0dEfU#eK%U~0>)WEC#(!#&~}
zEi-vdCKc!~2Gzv0viJh5TPy>x)|FVrSaRvkaJ;Bw?*X_PKy@U81+K}A#0QmQ3mQPF
zL2yc0l}0tPLQ3cfuB#4tf3DCz(5x}Du;eF_xlrTZ7j>(59cBYq&0)tenyw%2<7_91
zGW;>Jj77g+hYj0|Bo{pV#JgL@0A?h$HQlfPV^ctS*|37dEJ!80l%P+*AwdZ*0O=$F
z{aenaS4tJL6<J8_EWfvt@k-%*McHSsuQ0ltsIssRiuf1(IV0wnuAaxw0&&ckB5U9%
zh<$VNtfUj^O@2Mp99b1+RME9XO&>4LNEBv>!e>M7f{p&S-Dm<qI;fO&P|(5%S}+rQ
z)Co3BoN(o-k;+;35~_-(VS%3Sp0r1pb;2TP*r6GlK;rA53}3$;r?|PHd1zlJlI`mJ
zxD?e(oCNcAd+dFoO|H6*o>jc$lt35!$$KClfx8>fFpgj+avcg{({j63UZ?kH8py&Z
znVIAUrBu8=igqQ^<k&>EEZ;+p#$vJ6JLFjD?4ZP!o8G^Fs71qDWJUlVr$tUVy@@Nh
zOEsHgwA2YPp+KMiTf{dfG4mn?e3zni$%W=mW^{}0i_JfSD61oK5>a4ZVUN;OaIZ5t
ziGUDwg!yGqEOO9*-TaX74NCk^lzDljV#q^sSMw>e?MQh^A~3!NeAy_I{<87)x3^y?
z!v1bKVydO#2t}}<lBSa)S$|{s{*RAVkNQt7OU1_Ko%x9xEu_Ze8va7LOhNg_bAL}$
zP;<M2EE?K-W&8O0o*;+HRtn(>p`ngCk+RHLv4IDQENY~{@OP3*q)RGSLQ1UVlt%sU
zpQ2V>xTVhWIvTfC=Q}8p)l`~Subtl!%V2DMF`ebeiE%#o?sJU_ETTaHdJ<KdSNSas
z9Nzp4*Eu8p%wc^b7QY9U-QW?)4nnDlPJC!>WP@jwREX*f;EG5PPQ^V@G`Vus`Iw^h
z5Ku|=8B0tY98L<;!ape+yBnC5F+Se}AyfgEY`J*x;@{qMRD`)SKTW?ma451-m3zSh
z6|pi0Z}9(K0h9OzX8KeCE41B3s!pA0WBWmP2dNzS!qcNn6xwRi3GzufksKlsQe3tr
znX6MAQLNEVn8BHx|52Xjo38+C=>O#^f$q{dtO(ydvSka4l)nBSTPgfIG(Xkq?*Pad
z2lvZgHD*>ZV~VLG?=#v!K*zmEBFsGi9d|c3x~Z0fStbK@B2Y);eE4N5ISWLHHg@2)
zG<r$_TcmFSeV1}kl|hgJ%%w&VwL7H*?r$27($ig8Kg8n^EgUJ$IpNv-cke}@PqjVt
zzO_I(JlE3<b3R;Epzw-l_V4hzj{Z<;4M8|jQWBo4KTI916hexR+6CH|^Bn=#`tQtQ
z`i6)u21A0u5C$%X$IAo<M>7&YtpEOAFoD#xBBPK|a-Nm!@Z%ux{3$>!$k><~pWx~r
zP#uJ^7$6(-Qp^aVf@e_YmufJUY#^D2FDcA7A7`KvV+}9xHtT0jxWk-Ag%Zwt8|!bV
z2ufL^s!dD-c%|O^-Q;OeQ<V06z+f)JJ327qVjR!qP90|6{LpWDMq?p^=;Va}QndMN
zuH4|(i+)z<=g;liE4s)^4iT#G<k5B;(~DlVm1c#KktHA&d^Q;pR-KRw;;TjxqRv0g
z$ggah$s8FixDKy~Z;V&=V76517fbLC@$N6gH;p{y*Y$B_Z4?n>nv-Q{S;KcnS=}p}
zSzs6H6B}4_N<9TUA|6EUH=94a!g3bscq#9<u=xD)thi{HZNAUkXa9?@H;>DC@7ljl
z+dOSU=5eD)Whg_2&_=c<nlqH4cD6DP86st9BXb%QQXv%?D`hBCp-ia^MIl9zArhK?
z?{((7?%(sepXc$q|G2N~qR#XC{e0Fs*0GLttkKhBUDVD!)q=$FF;Y=z>;M!C&r!RB
z(mlB5kSk_x&<;Bq&Z?q=xf|mj&sf|+>}8OWp*#)%1X8S>Hl>sJ)Dv37at{=l8lHG)
z)vLx*!U8qn;YFcyxjc9J>&iNc?=`>f>5>0tiFssinMWtN;&95%+>x=00Wn58t^R%b
zD|;1;BkqWrNo3Q524xhVgF^!Snv$n%0KD5W7m;2GpTlSWrkKAQaVxxy2!BMg&hsnX
zj+8Z0Og_1?%~>dq7lhLRzEeb$BpX7@FX@5hj9vPiDSIX>#llH)B=h};Z{^R2Eur(J
zF)*BXi&1^w&T+pf7PhOs%KQH(!^lkAe`|_g8D{E@+OX}Z(GTg6O!4JnRwhcw;z59K
z5eA8lKMOdWU&Y9v?3^50_K{^sd_B2SYJo!)R*gAV(vV?>yUE(QGA}FTeB;J_zl}S`
z>;7>&;q5BKYRJWJ4?20IeOKVH$Q7U#5=JjW4#$SnFw&zvJcsTO3W8dkZZ?>|z^nR|
ze!f)wr6s#GWGlSfYmEPaZulT2Y#-F1_E4n;(EenW(Dsn~w?Mi>(WAeVm1P|<+$+*|
znO90UX%9icBGhSbJHW*VTLE8c?XbG8zV!;0iBJT}w2lNwhNhGvTk@A|+!VpX!iyzC
zNB&Ke(zx*dIFpw-w?UdIL`dietJ-9SEBee=tDiwsVD45><M{DIzFT5NO-<fNbJfT@
zhEwKt(6$<6K53ixQk`t=K`Di^;_{!|{^!lHn~A^YoEaY1b>zq=a|-8g*6y=+<-O8&
zt+mJA`Z0aSyr=)s0xaz|;!i`3gO$~vzT{2|jL7|%S>l!uzba|w{hRN~F1=BUdi?IQ
zTe}>B(ID}&!NX^=*Zqcyh%<AQbaM3_96oTI|HtLk)7W_d;05DoZ1SzaG^U!LzXH^-
z;F&WC`ceK^nTjO_)m1E(<m9aAC;K2`q#hu}luqux-O|cR6|D+1?6a6~1mHRyno+&Y
z@N#OXs4S!`l7<bpgy0g+Vk(Pw)Iuh@+24vXHurg27u>=YJ}dtBW(_t1d5ta)I1J>J
z8k5T`xBv?=qr1ZFjKYsGyc}BOC$d0ecLngaKws&s{%H-r&l;0A0;ksD^avb<EDjCr
zWAE|G4s>Z^sz(7XGe?27O%mv2DBJZiRRVWEcEaH^Pxc)=cu<16IBH;)r~XCz4gD#i
zs{e>~KuyBzr)47)1NUy&@SAx1!(kJj9|IMPqA#Ll5uYuBEVO6Fs>TZa=H(TqdWfT4
zSI$l51<KaGL~uSiw_*=I08e$oj~x>s%~>1_MdK%O7+g2!?C-8Hb9^9r0?(j+W5&#+
z;tcm&MUU4H1+R;|Bp_QK54K%5Xb|O5Q%xIj=rV`e_Y_iWObBNJStej9@)Dj*q1`Li
z?_y$v{NcR&`%9PfNZi77B*(R2EC*HUZdQgSoUN<)U`K7vI}o2d)`nnL6c7=~1R63C
zT=t^qcu0-jPWCb1DWPDL+rwWM-RAb~+j*;_MwuS}{2gbDm_2jgHD%C;eYZ|$nkhV8
zc7;nHB2$Yw3Q4OXdBTg2it72-h6X;;aG$od52%vje~yVvrts&PJ$JYa71ccPC*eY#
zIYU=xF2rZ2QEtl<Y#)k(t&D<mU+$QnZx1uw5sWoanyZ~cKiP2dWLpx9e4U;>ndzG9
zVsCw6NqY|Si9Fp(JZ{e1DBtQMTi6L=QYcdIo)&3jQ+7UIaZp|p{jvaG-@m7Ay*YQV
ztWedBF8lOpH+2~gMASsVzbo5me9p17GNhYHh4l`dYjO%7Ly9nz&&!JGka^u*jRP&b
z<U91I!lsfhOvklQSj`6SiZR{QSq~uaPC(K7O?$&?D&|^Ie7juntaJAKdEI4*S<SkU
zGkEm@k$dn8PRzVOEgK<jfYco_g9SlRc!Y1)aj*!yLw+Wt-%x=#M`&=6&R=*eCqV4X
zC2BGO69M!nY|4w2KhKgygMbKjn%E)|7`%6g8cSMIP;5u=B(O@Y6mc96{|H|(Ej#;y
zMIpayC*-J<Q?mw2Ls6sTo3I<wgy)=#Hj4o=hxL4@7d8U7C<Xb;(f~nAVHfF2sn3VE
z=8nr24nTF_aI&6tYg6gJ##c}_iUWvFryXpM-9ZVzBqN)ydK9%*c-AT;0$6J*KfWUV
zB6G>|bHz){X>cdw?G@j@zh!ww25l(Kss_;~PG|{)=X&{#Xo0Xt=y2e=aNz_e<H6oW
zJ{X!(0ytb~weKCRjwz3ruN2tVu~`FVFl`W9tGO^APd{m%%L5jmT&~Z8P_u$`<vqQ4
zA0kE6J=1pl1H#dbc3r;Q7pD#>?K^Z(r}FJz`l~oP&(xnG>dfdwOh=HvwClWV>C%V5
zx2UA5l0|MW);HAhZK*Kpii*{G!r}B7@B6UI#?kqPH44SPnNw}DkE1UTaU7whc}Jb`
zB;h!HPR9q0+Sguu5u}a2tM}n_b)q1xEdQU^dlda_u|>MN02BNfBY~cFw`z$k#RvV_
zvqOQLN|h!3aB!yj&|DZBLB_Jds!P|d{d`+1%<QQ%AUy2}?Siv;{*kWSRf*ES&@hd+
z{llG$1e1c1ri>sbuhi<(=P!AQ9h!klB54rWyVye)NPz+mBQsUZ_uXNAbNunzXBj1S
z=#V{whJ1bxUggXmeUzP@9R<}x7(|ts++s`ZTlZWl%?C(u<t8<tO>zn=4hJ)Uj_UbO
zl6yNNba-2lo`+NRa7NW(-YLlc^CFdxkN_xsCjE!+_(Fr}ZipXHyEFvOB}T@^8GIHY
z2tju5pahOSLeeM`h#YSj4#I3Pa4*MTfihex(r`S85+iEjTE`s|*zV%%)?>njb=u*O
zB;mcg5wn4uId`_!K6=mMqY)7kg~Am&hV-JYt9$;*Dw-b>ut#C+E6!bB7QZPLKSzVe
zxpo@Z;qQSRFi}6MjI~nu@epNIJzJsY+%8A69|c<RIYOkKN6&<zHtn=$-0zc!i!)MJ
zbsjq3j5N3vCzWCm)d;GgFAKjkM{cQ=vGNREsYHVzv&F<?rT__0M;}dN6Ek@q2O3*y
zHR%p2U-qwx+H91xOz~aH6r~-7a@)@5;^J&@v622h6{rdBsO^jzE3VvywijnF8UUhg
zkl`K|drBIq(Kyjwn>O7_Pe1ceM{L>M*bZv?ag?5(OxhNQZtfNpGrW#M{ditYUPl)7
z$#$4&|J<t?Sw|6ZwKiH8U{n8qF<{hC$0_CJ!7R`;zvO%wirZN&*wa%1TO6eQi(NFk
z%mdV*8zI+GkO|<qZReHHV+@u^`!|A79_6P#nD9KS0d=6@kS2E@AjhH{NqiDV$P%y9
z$B0d}a8zn?u!X{NdSvnOXLS^28*7hqDtl1=zY~ZIX>I55%OB669)t!8f1H@kvDYrp
z!I5|+A`LMX90fB;COB_q1o)i9G=?A-imYe~CR!u?WAA~vDUbkid(WR=nGm#)St?nu
z6figFau1LPtBb@5>*FfWb?Pf_%QRpd$q_EXHz2?^46nxt(i4I>g2fW{T=HPZgu_Zn
zP22o(Q$0u~+iBCXP3JwQT|faqG~oh^f@F@#uS}BJg-AIqaczQ(0rU7G>1scTM@7VG
zJe*WrcIv{%#0o9KiDzoS-o1yZvk0)_{Ezsif9y$qlr*J?Cv+Cro3?WLmpg~X%ml;y
z%m^a(OB)-B!;1x7J1acLSWcM|!J!PaIl=zc0kQWGg=5Po`4GPwtE6@AgZh9Elg26W
z;Rh3XA-}MpTxZ-zbfXv02$tOQD=xy_{?9kjgP|5qS^Rf3hYX2*vX2xYkryraTzc1M
zL1OYYwEEyN#(5^h$pTBGi(XO{6|+{0Vu)z8TPOOY&@6DlFZ^A3r9YVmIw>=R=bsO&
zr?}D_-0GJ;cW~9A6?{7-G#1X4+fard2Q{mXWdFq~wefxay+dP8(H+ci(W5rfjgDrr
z8M--K-bI53sYp%)L;eRpW$JM@9tp4jx80sQ*uMkoig(D!yMz~UFV`On0UnO&g$wym
zqBN(1rjT(aj`p{ZHT+8CGCL7g2>KA~W>A1tVFEgeKdXRWF7V$8qZ=sn@9u%zlNz{o
z^jvU+Q6?+gDfH4ZZy|bglpqt*toE)JF;^w^2Pu=9<LKy6lMB_pXSuxlgI3W$mUYa9
zH);dD{#{vPkNczzQVvPtXS7*SCCrKl;Pv$tE%NFpUbOpvgBVFOKZk%9cvnKovnp;?
z&ax51hdaZLfWoX+=R;dWo;@+}4O&hZk-$!7`~L%3hSpx-cMz^IkmngjdcyDUJR)Oh
zbnf9U3M>XqQB^9F*nh%$kfxfNfpi^2rjON2$c=b94~*}hVrPj7>8{<xMv5!XPlbf&
zqjvEJ`7yrBo{egYchE%gG5RvvM0<LrULIvW_Snk-FXcOT5$L+n(QDJWv*yODAu{BS
zlt&}>9tv8iwmJ8nb?V}*x=3(f$N}YZj)?q4bkXAxUPz<{6wNj+xUokA!{!5Sf6eFq
zw}_aNcK5C|Jeqi202BSbuMUQMl?js_-9}AgutkERewiyf9;966b<={dK>*`*AGN|r
zITUQfHumb?Sz#87NJ*0z+hF6L)YL>{EoG$QG4gr+4jt;Qd6xXPQW<4J!bwWD*nJVJ
z;ZORK4l}1=7l{*t0cnfm^O!GKd$E7j`+pcxn2I~9j3VI6(K;U)q&R?4Zzb=oszbRZ
zc7PmFIore~21PaAKcTjzT-f!M-tdyc&=<?NOZ)}FgG3qMLx*ODh11xTbSKyb%9m#`
zU3NT2s4DNFmF=%GX8VN0BEMBpS(b4uexi(v{O?5LnKu%HL3x_85Sm%C0ov<C2}Ji(
z8vEkATI~tqpn{&vpi(9iW}08)QTe4)q-CKfYBH+7;>uDYqpXM{==YnMXh(EXkNrRi
zZVuf*q><qk(2){C4^#;fxoFg0N&7~66Aqi>{(8x|WJm9AOjR;a5&^0A-$?gjm!t|p
zuQ-QE2&-Pz_q^2K94O8oZI+%m%r_NDs7EILU-YMAukFgYw0apshc%Ya{~DEuPQSz>
zUj8La!abd4X=3IGgv^vNLODZPy<CIZ$EAVtvwfJ8wCL4VSOGV;pZ|XeC1fxOMYIAK
zbI5vLLW4s-Xh-s*h#FC8Oo8QVXG8*8*qe(-k;|_;;hUfH<cYK)A0hhg#cl<oKoqfO
zs3JlcpSq<4gHboi-5!>C<hi@M3zVWYBk4q0-fGQnwcrwuaOED#D%r@#GZZZ!O8te?
zaw5!o5u0;jI!#7s{NF0%${}_=Jw`K8Ce9#aj2rRLT$1=?%#`x$j09UVn+6+0A9iw6
zB{k~Te5|P&BZRmFHh#Xw0$%h%aj79Bv;lYuexKrQ?IXTjaM*%91@~Z+D)onF)Fvsa
zJvH8=_=H>AlRh_-7%dBu_CNZiVz30SQHNmBLDyAtP<U-aQ1R)XN$9bJ<&~0;i3OwW
z*gsgYCg}m2uX+$fnyS|0`(K+iaGz5!0~M*zb<FpgL2yqktfzSPj7YBpy5w*4#f)$q
zeMGV{!qs2yOl|)DM;VDU&S_{ww-r54yFIX<{IDRK{Dh}_ryqGYd6BF^h}?RUpDq~o
zKZMhZ`$vu)o5x0DDd~k0s=RccHkOp=^45uwp9gW6KIjPP1AY{PjdS-#vbjZEDOe9U
z@ZBYaSq24`uzPZ^;k;=ITZg5vrkN=h4!0DZfPSsrRFTir+MN*tM$h^pH-h4%>g4~V
z+*VR!(J)7~n+^r_kSezwJJ0u#Kh|c{{!k1`1-*emU#7I4#Dfi_-qLnVd5Z>bFMN-e
zysuJOqWiS7o2ql}rPb02YKMsfG;rSgFLm`zeVA3|c7urEm;Bsj{za1y8Cr+{V=u4U
zxPbfyR=o0ji;_ucdMhnWE}y7ZK-Ip}95K2Ec|^hq2>QUm&FNPzP=3zTS9B|+m}X^<
z%qCGQwH`wAOFUeFgIVZfzij4}w_Qjf-EKc7Vb9T%r_1y%3nHd!HB?yH!s64^3gH%+
z7q0@UN|Ovp>T&vlQSd~8NM$^WL#FALy+`(jUU$G_ZJDPdrsjUGh9c&7n<waCPZtH&
zE*OzQd4<`7+sz6L@F2M_*>xP&J?Z6IyPH40H-D3_dtlc){&VEXH`lQpCk`Zca-#;%
zWO9KjR%Ey291^0=j%A}y=6}i8wSKu)`BfE}e^a$cmkyJ2^^I4}TzXB0pC}7Rsx%O%
zeafG|*ZYzq&$eOztd7pZ`Cs^OV)idaG3+#jOi_i&VE%k2`C3{Cc%vQv`gJ+;b%sEy
zq0@&dBKlJq%SvzY=q7H^H`EyVL1}6{keHWBeFaoe2BxTO8d;gka152rsZ_)KZ;vm2
zOq_l)Us^J_l{h8rd|6OneR6-7bF3sdIGfB+kXR%ucNq}5-}Pf2lG3Gl%Ttw)WyHOk
zi~jqVOkGEJ7l{jfNN%}l5*^irZq4r9bX~iyGF;;TN18vLLA`Z#ZF%Hk6e3X+wyw3T
zqRr~HOD`;`vS0vTv9s=K$`(@`L@jBE^^LomoNPdzl(oWSe=7fe2pSmlPsQIHipQ42
zDViJ^JmkNj?1Z1(%d=zM*(f1f<lnAXVZ%4HX3$+4XI${)LXhMk)-3dZoRE5e>1*9L
zn_DP`Y=C`b=rM}~BU~j-w%2Qr#G8d`<z@=dCu)dKg5)P=T$GB)f`vk5N2H1%Q0DIZ
zcmCouUbN#>nC#GlpB)gp=O%Rl-4SWcp=W^b`)quMckd&{?<8a0=zWfh7R@YL#s(ZC
zBHRNaxGRc6qeCqeE*D@+MQ);LbK(KQ4e1&qpfVy$TT!@cb>;b5)wO}dH1OXyjAtw^
zp%A0SdS}M^5P6Q$yt$Q?RkriZFs6ryxKo4o(Q5TQd^o@B$3p=D$DjrSG{<4KC-SS4
zj$E6h8#=qsAI9;HZ>eG1K>4m8FB!e=`u~3SJJjyoq&eE3*$f_kwB48AlyBS0^;bm^
zeQPhYXIKgo>4LZL%|cYbr*cx_@ZL{ovdSV{IJqdwv>S4vl}-mxE#j>yVt1<iG_d7w
z&UIdV@TFj5_K#sZA&(_`$)%vv84wYB_N)a>8R^fn4>_-Lb{&Pj>zP~cO-FH2k*3Nr
zVm}`ri}@$84w0rQ&{;IX=kzYiXV!nJs-{+iu4IoYgRwI0%8@y!B^#aj6Y`4ot}_Of
zvRzBcUS;H>NhYdX(M=JNPdXEMjAGfMdKq_Lpj>j?V}xXsgVK2=2C0KYnyS_FEdIzx
zp&@frR(*g3)M;owS%v<gjE2H-f}W5@iVqHj3yKY~sqpP<DZ{}TL+8z#C%b6y#S@V=
zOR?^@74G-Sg71a<7Y$~J&mo7y#Z2OW+k}#_k;+f5NbQ63M=kV~!b-ZEVPYRD-qiBR
zJv|jRuQ{}SA7Gc<uvQ)n*awRQ#j%abj_T$CGsbY6bFOYum<<9-&!a^A$!}baiM4|x
zmId*60Mxvdfk87S78bYHnQS>3ahlTXXU3%`Uroaysl-5yPQ&LT;w<>0znPVlY>_J#
zGYx1?(;SST<&*bi{$fMXuTTDgfiIzGq!)mhDFH5e{0<ClML~tyK-wI);56^dA-{^w
za-03G1ibOZCff!4A=UA$5em=cRX=|abd+vXu+-rtut8!Vd=khpZD3b;-fdRvEGN@<
zki)}t*Rz;t#?9Pl2^SO<O%1dZ-ZY{fXj{;GB8wVPcLc?4{`cQvrs#Jg9Ic;Gd+U7{
zQb)>JLva?vkfy~vgb*g0rQ#dT#_c(i8UsGhR#vVR1<6ll?_Bf!`xDaW{;v6%lUJQG
zq=O=21Ju_LToGjUQT$S!D@ct)80KWg@TNSQEA}Bv_q(At{R-7Ah7&$w;~^1?O@0xa
z3(a{ltDu;(7+sI)!4XOlSEdZ$+@i#W?&{yQ57=VHj9`8Ye4Yek0*dc6$kma}VZ>yD
zjsHJkC!biWCnu=aUpq4?Urlm^s}SpBLU%h8WZ>Im5SDF0f|8u4^ZjFS`a~z_F8`|{
zDn6A{Y-A+6OhXydDi$jZT1_|Zy7L+Ihp6B;j5o@@pdZBEGHzWYPrlux+S1A;2<4S@
z-8sI*QCqwLBVB*N1+qp@q?dz^0T<Li@LFYrhUnJU5Q^$CD$^)jO;WDiRw&MkcZ}>J
zp^8>Dly#}3{4#XaQ-`4sj|kH^ANiM$2qt(!MX`@(I5wWbM+*s(k)#<o&B?f*&ufZv
zfH!+G9-qCce0ut^D5U=fE6E;#@vt*Hz&xULz{OlD93_%Bv!Ex))$|Pt(lC^;CJG^$
z2#}ArvRFPm6evoeK87;7C&-9FjHZ1!ch+VFx=OR0h>jG|W!w;FF}yh<v>%MU1>j5T
zKy8QAs*iX@@{VF0lAA<NIU~}tzOg5fjmt!i+!=l-m_%8gT{)CP=mjB*)1aY%EFMZ0
zMTPuU-^XbAM6E!=o8$urc1)!H=(3bACaQz7dQw;&ATdd(qp|9*`ZOo!-SJb2GWhAW
zS9u#eFHZfRRvz;)#1Q{!Z)(Ab^bKn{5p3`P2WJgwzVcm`b7GZS>S8fi>9nU#NGEne
zWKaQ?v0}(jxjPul|7DhmLh)&hvI<7u4ls4Y_)1zOh7aj=ACr=TME{>-^r2l*QIUK|
zN)x`NE1}5Zoq!3*aA|Nsq(MU|8(f|_E0I|KsHoU))1?as3QR2kLmrA%3{6+*{bICP
z-Nz7I@d#>@JK3l9Mb%Tbj1(F()~!pN;Z~$Z$7_OYij@9S(M08u32BlBxqxw`h!U~4
zLi|Mo;B;m-9+;D5cn6IOgf(YvR$&bPVr73i7qAX8V5?dL`z&g8hSTT1{2TIeDf3Cf
zYl91RtJ2ofM5IcqZ<joNPYq8cKv($n;z#h(WzchZZL7+xK6bMZajA0$yMT;DbQb9<
zVoR(_eszl&4N~%!5yPNsGvET$4EdXuD9K4>v!0rf=K`1{xD=`dvtPR-fHXo;ZtWv2
zXbOm_l<RW6P7ka-EXwb%uu9C+{d|H8&DH{CBU9Qo5C<}Q%>ml4-Ith9u#YJdahfy~
zlOpjx=4MQ1mH8Dr6sW!UY}EBL#K@`5WrpwDO`@FC+Ftv0Yky7Kk0cIZnQ+8ACe24Q
zBQziP548p$h{#2nj}#P2`oZi6wp3Z6;~HiZZ<6)_fyLpal|r!$JFSiKmkHOTQ;`58
ztcY2zrBKWoUVHRvf17#|6vr=WOEN6Yo)sC{@F3FTl5rBM73wyMI;RwQtA)~(rNA<L
zNMaqrikhZ<ep5_ImBDZ#;Y1$-h!nNTC&>Qx(=Gq+C-^LwQz%}k&|Pw#g({+Y$#9dV
zCrubyPNa{$H2!2i&OQp>D@*<R+e_cv_(I~?*?3GaX4wx|GpjGv3;<7rhN^}rH8YT?
zDDlpeMzu$|_UlzY<MIppNO&}51QfyK0oKQ_&G^Y-i~_9)7!gjI(nUDP?ZQDu{maJ`
z_aV{msfs3E;D(oF9fj5c7(n?a5Gn#?yN+_R0y)MipX<79t19`*|M|1G^YKqNZr+rG
zEdpaWLzGpkGGwQXRGGIaZ(suDhk^O;?(0O<b`c^jGV~b9ckow*Le-G#Bh@7%_D8^!
zMa&63=)CCC>>^_PmERVwIU3B@60TD=0aBYg71RP)`3SQbkj*kUeB#0>-bqAWj|)w9
zsgjJD=_->6Dx%Q<8gi+$2TkOQfA}4kAl`eNg5HMGRi{-i-#f~iA;RONRSK^F{0=2m
zk@<~f4|t(#g=QHNYh%nw9!N8h2xCiM)34Pp?F%19zdn9;2b}8%cTVCKd^uL}<mpq{
zmjkURZ(AyT`bR;11`0lykIpIl-(ccMCrG&D7^)21SjchbsOJo%qy*QURzC7M=P3(`
zdBh@PAD(b;wlNqr{>9MndqdX3_RkDk|Aqmf^UppaX11m(7Yjmp191JIxS``5h~dRf
z1lI7!(pBiUub#rpTH2WO_54+Z>XsX0R`<D$<$bUb3Q1K%x9=}Eb0@6(hRVaP{o`xT
zxQ(<gK>;}~FP5xW;g84%hQvhkGkzAC&6J1hJQ4+G8f!ix=FtE#UfW8hH0Nzm^y$hu
zMX<sIP5}S*s3UJ>(1qymVAMG8Mn27EadC{rZ~T|P{=_HH8FdDIC)>Ojjxw_7<yzf*
zgu7xwn0Z5d5;y^<4YEyc^N(D9hxWd9ZLHx#=DfZKHB~IOlm@kQyA1(;A#|!dJB8md
z9fhgN1AwiXAw&<AU{s9Re}17tafA{Eub=X`&a31o!*ixzA=l69K`0-1xf>-#{k`0w
z3p7@l&1J-LqSStLi~4nKObgyTaK9U?86Dh8-n_BxJ6nEkrj`gZ5Wg{$vU;)dH-)4e
zUQc-t;)eZoIyID<ED*C*)->4m`*HbYs6$R1Z=DgSsr)xnM=;DjaIcPT8GcSdGgyrk
zZE;P0TEuV(BBD~_0|{`Ib8q~Y@~&K&PXIODF;c8G9UOW#r(#xQjVI7hYG@eJo8Jxm
z_fp{sT)?Vg9-2wkH_P@Vn43A08Lyb6KFeGNlW%B&0)ruG2IK^Chy1&kg=mcODCf|B
zh1{s4a0p_7klbk%^!QQM&P@McT$dvF%5z*Yu71s?)w98n<hhL=(Y_fUpPt(+xxr<(
z&X6)@Uy68)K1Zl+nR}S#*GbAd{j$dxbY#3^*J_shOa4T3KqJBMlsp?TSzzo6IpRbr
z$@9-1Q_I4^NcSaj{V`6PUKTaPi~cdJ9nN?s$ENnz^I8LEe8gK-{-bAtUu5JP%JT4S
z&5`r_b&@hj|L%(qANoUyvUP(^(#!mJ%Gai#Lj*fCI&qm}{a_{`bV}Y87WO9X$tV%%
z7qGVH*s(sf&-n(R)Z`Qc(DSaUDm*V5@WxCZ-}k7g;pazGr)Fj@L-Ug{j|$VMsq&c?
zva);+p3`iPvUtCSMl64#d_Z!{vmcpKcQUOHaPq>0Me-^T@;Wrvqa`aUfQ~-=fGZXd
z^>f`yUcGWq{z5NWI0p_K5W7aM(bN(Az=4Nz78WmAzWhWCv4{unPbyUQvG_zf92MI7
z@;rrh;+o2&H(iB=38yIRVAf@jN183L&Njqb`nUZCsdA3>t$p_FK}6C#8>rH5Qe8#-
zbUaB8DPL`fyxPLTpczyw7av}Gao?S7E@(ZRBORre%{=?8!toL6V%Ezh3Zwbw&z;L4
za%k;tbXsrpfK>V*xt17VMmpxL{j!5#bLYU@dsYFv7>mOgp_g*N)r$)$U&aTcI-b;c
z)Z=p97#Wr+cs}e&lZuPVD|PHi6FuG%4>9WXYyL@mX8^RZ4|8)-WskRriytJrQP+2@
zeGoTg2W52!RJSOf3NcFvwOrqLeerDRGV3n1i*yv<Nm(r%sM}J*lxVLOX>yz~JI~_7
zCZ?kxef$pA-K{Drd$woqQ56>+K26->o>soV5?Ku(Pgqr1Ea>ZB>DpaX;<A&2(KG3u
z;mI#1i4V*AR15jeDHkJ|yX&rdn49m3W34p!Nd|~XsMcIXs!Ji)fSbn&(E?cEpzZ{f
z{Odg$&0sf4m>imzl^<uwQ)1QtN|K?|gA(U><TC#)8f@e@QSZAH>|sO-Au>W0AlfuQ
zp>Urf;HL*Wk9q@Ge(KX|u_l+S5?&6=n1NM==Gx#fmInvax&Uf@gdvyhS&>U*e?3v?
zF?z|=<yAc9X=Gy4GYz^S3mr1|!Ifr3%CN6*daZ03?=qZY^Wxik1`1_+4W@+Er2$EA
zk@}w8ou9~qb7R}CnxQ-^1jx39?oFFEmC;Eqh7niz=bJG#GE8nW@uas8i=15EE^&2@
zHrH&?k9~Syf1<~@RHS0~!3JBMN8*y`aD3hKt)1`c;0C)_l$131T<qQ4F5p-c%j1$U
zEy}G&GFw1w^q*IK_6Y}!m9}A=+kg?l`}ZHG8Ww649K$=f{FP~d<8WDi!94vD-Tk63
zc+A*$9Z#o!+&URkaQ2>bVD3}>l@S-#c2Vz7TaRw8@a`O0<7l80Hpp?($R~iwY;!T^
zk(Jx7GO}fK$GjE1z~I%TuUn`6llQ%5K8iBQ<iY6HMUxd5*Y=CrTEq<1=m>0XL1psi
zv=m4J=fH#*;Z(?mW~Lh7qN%o~xCz{ePKsURPs}-=L#xEqTl4*zCH%vX3(il^I-QyG
zL!{jl93B_$Q*sCeV)zhzn~8&A>h?zatbqo!RFCqMM02X-8w&hNJ75`^va{<vx5@bu
zCd#f^Z!sE(4+=$&p^vn`rO<w*c~8m?@!eOY9j?zY6d{dPP|+^@susCDXYOAB_rT^F
zBBNx`cx_tuC%#z-4a@Efy5A<Ju%O^5loMTdLx7o(=loB|p+t<#7@Z90D~G+Ho&;cw
zJ?kq5V*@UK^%17ne&&QVi~xyF4fM;aKLuqe8U;R(4ca#z_HriDrElbS_P6UFt-t=D
zQ8NXKP!^fHEn>&sFI_&4g-OKQ<@A~m^-dA>FI^?@)Dcv8F0yI>D?jPxejc7GOKK!n
zoBj}<j|xDPv*H{iBX($DCNZibZ<Xobi2I`}Okk)Ag4bXGpL*|J|8jXV1oQJWA2U)%
z>aNR!D-BG#FRCLnxBcK=GKxpG(EH>mVd}PEBhvm;vMWzT%}~56#ZKVA6`E(%N#a#*
zZZ0T^1p`n)7Im!~f?ASu1IijN_AA=eF=}l1n4gZ8Ej}z1n-!W9$8ifWw178fhHOUY
zvhCf+%z&iQ`u4T)$dMz3I_K<K!zYVCl*S08rFg%~I`D4n^J;RphasWk0ps9KE^jHu
zPKqx(C1Lxt!lI(Sd;vUBt+BX_q7?B(H-ZFC?pAcnoT1C;T3DyCrZZgH<vu7uqG^#N
zU)#FyBvD1iGZ7}+&c7&{1T-kJ22d`LxI>Aci+X|wdO{X&F=DAP=w^wS)br!!xYg|P
zs60I7OC)-v2|K&=g*O+aAiZ%b>Z)+Oh}oif*lron`M&kfkC0pZ@j-5<h6Bc_+WcJf
z=D>LeNEyD06chj<*q~&~9m-eG_QS67*L=9?>Oe)shu%&X)?5N7$s7{zx;H=|_1^Nw
zYnUAuFC%G^KpYE}IoeBXclmjKpaTH=VObydaF2Ha6eP*0SCQMG@#NQj2O6zp*ZEAL
zHpG#d_GU5EZ@MsU95LIsdMwKg!6?0G%;itTtm^cr%<mpv&WjecgLl6wJM&-jaY4Ca
zj7>kSI)dJva8yNAH1fno>}A3o*U^d)z2LQ_w_D#G>LDFSrV5{ZtwsUO33u}g%3r~d
z*V~OPMh_gak=i$J`H%$OOcCz5gD=lK`}bBR;@od8J9gyATjt>cgwucax%Nm$s0$s$
zic8U`d(@PB2y@6dkp{++G9Ahh%WOY$E#09hF5`BAZ)g{t;_i!!p7d7uma^Us*|E5%
zxq%)4vSODewHAN;Ucr7^<8mdOAw+u-=4_{ztMb1*tDhQU(PH6bh5=+9lJQM-=>#Jx
zip#|-)%dTz)+Q#~i^6RXNWf^PUE8|&7`4YSQQ!JV50f`CmFbib@CRP^&~x3=$&#91
zOyAeBIMz_cuMqL911N@${W2e-@ks?;mFXW;kh;<a+LybCc_=E^s0Vh1Bf2XVAETAY
zq}7b@Y@V)iO1Ws>zjP$tvJ+-cbjcwP!+AT0FMM26T|NdAy1?AY`v$(8{H`G%MSL;I
z#6Cx)CSdHTs_We<s9mtEv9Rkr^HVgQpQYD6@_2g=_~7XHW%=cR5+bwTj}C|=!u?h*
zto(o~fL**sCQ2-NC7LqCnLMv-q<LO!W;!aO^}3q7CV&#E%C@1<nUa^WYPfH-|9V>5
z@jJ1|ZNkI583NZMK7|J(W7t1qBt1fUUj7xBQ(SsdAsKUSc;`DyMk`)S5`_Rfg;SI(
zTMhvUCN<&zFuO;Z%0gzh==1P}e*t~OR?;nx(N~~O-qIw(uk8BqIU*Sibv^Xq^96S=
z!?arVk|xGUK<@KL)yf0lYe2zwCgmU}gevd+6PGvVkq=m$SaOWpg(_(q#>BzDzOVd)
zSu+NgU3n!MDW)+E1ufwnpmm^8!AnH=tcOayeLM2nE_adZP&}Q#ELueG%QaQ0jr>9*
zBHr%&M#DDhg{mLYmJmJ0ilXpG%>A}b+-M&~1p520$oRMOvO7!qaElKUQ8Oy=l#Vc|
z81?nRIC*X`qluKqa9?k6_1vQ>mOPi&ln;%rtgS{$Qt#e{AKNS$N^++lEbb|XtcOs#
zKZfxpX(+;zmY5{1q(&hVoxB10^6QWFb^FIkia}<gk}6BLp}OO0{DH3;A_imWSpbf;
zx}Fhw?=Z3*u>znPl3&a0LNC$pY}zC-f=uT>br9C-qW2TqLP(TI06Em5Y@6ks9ArQv
ziaYoG^C5TGO3A&3w2k^@ED@7bPNq1}V7X#VubO_d81hRVp^t3Ag@upWJ2KU(qfFDn
zVOq{X_yry^lYuIP8jyHtu9f6NQRBnLh-5_~Gr$3pbwi9#thm{@-MuiX8Pqqe$&kWt
zH+y%Up5t9}>=Xx0dO4~^5YYTT*ZS3HRj=yhDta3|TWh`UNw!Z9wf8{<drTUFNS;yk
zJmlS5nVJ1EyiG$1NgGrxC`qdy#+oEhnUh@3{x4|`v(o~lwK;`g7B)I?P~tb@zjK-z
zB`;jBC@V*>#+XMhe6|o+9Axn@`54ss&!~#WBMQoHdSqzkzY9wZb_6t&m0io?h50~}
z%a2novlrJer{HpY^R0M(@Q5<@;yX%N=7mf^v6sc5r}2qP%QzYt<q=LV3kz-LXLaQT
zf}0{!tL)^8UwK}HQiymPBqNeEHhDj$;Ay4G7#pe9Ek4Wq098b|OqDWH%R3E{$yl74
zm3>)gx4ZuC#0cpP4qf;xf>$D<2->lXoJI;4DUvLx!GhpE$gyOgP=42|8;xlk3-Rkl
zeOSh78)vBhm0$I<c{>6@!z-RswuvdRSlmhDmbMJ_VCumngi<0>LW@gZuN(RGI6p=h
zb6E+(!+jUGlVx^lVE^&Rv=9V_uPNgJNsa}7+H+$yzKrX1d;?UcGsj%4@hF9n|3qLr
zA#xc|)B(Pz+w_|wc~59Ym>%oEZu`Heiq6Kx`9m2}=N!W}$>mx65(=ZF=zP|$i9SiX
zl9)j*$3+9t2)%x5W}eM=bsHrca`^34aW#|pccNSsut?vw6~iaDP)u+k<j9I{kF)&f
z`<ekD=qwATAU8S`U+MAskNEa_@8sgZe}ea*5tS`FurGlr%tbSYKN?6fS;`xzK~Z(I
zzS#kim-&jSV;zH8#)(q%!jm|0@dIvOE*dTDI_(+T@XGT#4BrUa4Q~+8S#CYgb}pxm
zFp|luTb1Vcd?21JthNrzJOjwPostrsc?Q}|q~=6^8>Z*CeukL0PgrVz?28cghzfD0
zILZMeW(A&mj)1&D#yiT8YUc&Cp+sar?R4(O6i%)<mDD<E6d{xI2mDX~^&;y+Ziy;N
zrVNcoeUm`~I3(XE)zWsOFi}&s#8L5FO#Z8nJ<~B_Y#zgk^45<0OX(LPW@lEgjLIyp
zbd^WUvNx05SuqM8pB|}s1Hhurag-1!b%}^LK#B8@4vw?3_OJ^)MuVd5=)aIsLV%in
zJj@#aF;y3hrf>^?jE;xG`Q#@%YilQu8P8gF?HVnPdCW%-(8lU!I7QVY<xj5uIZw7o
zNI#sN<n|{{o~^0*ewb$`pG1sAMFB8hi-J%-vum-hG)X9C-T|G6HV+OJ9yb|q>C*;k
zRO9*Q<KiCCfw3s2H2Z4KXV_XInoxQb%W^tGa2<U-V~y$N7Tx>Djp7F~tqwK`5ep0%
zI)isV|Kz6m)0yukJ`}5AyxUvnP(+u#*x17V!hO;Gh=+%dKo;@u&b)v?pokT}8fV;p
zl`h85|AESGyUy`m_ZrhhM18Mrd0m!Oe*Wk(b^i#AWkr|pQ@1E3dCS?sT_r4IN8)qD
zcE)N0g2DN~3#Ij#S|?f(9{qPJ*~%f=FlNgkK7^kD$vmL_L1w#}Gp!&Cg_qnMXeTjp
zrRssB%6~bSpygTr00aeH`j7qIL5j?H<@O3wTtJ+U#k<af=bF6=n&u?wM}|p?pFoLI
zT=tfo_23?@p(}`oLLZ8<hi`lo5(@dircGk(kX$^O$4I1ip-b(?UT#@XlKR85+C%az
z%WW---3^6|WX=dyr0h^l<zHg(EaRw`@4ujhq<gvWiP-hwiX-rppJ{BDKN>GG5t<T0
zBbbGySe_ABeQzRmUmGN1iGKFR6IlxZ@hgfj%A8QC60tRi1Y#ZS_Ri+bFv=K2I}Ac;
z4yi%s5y5jUnEWv#UWP>E=nJ^AunoHW`JW_^i#xM2g5n8it{L<4NVI$R@1Gv&NC)O<
z?l!Y@LhE4Gqp(!?^o=Jw?r)S?KarP+d}z&@iZP>RfPQ80oA(%(S&<GPa%CD?deAkM
zZ^o425L^u2SI>x@hj5GV>*qG$-i|R9(Aw{4n4G5wItp%=fw9bf`xm2`6g|y5u_aKB
z6A~M7SQ>|ZFpDapjBR3qchVWpTNKDh=9MlVf-e4){bL*u7sOXm7O>_sg31z_EwIyU
zf{wCYn1)aIQ`>WWPf5`%BKsnDvh~;3duzI{Deu}YIjg#PWtxS-h$cM^{v7Pz(6rtf
z+Y?h9wxqOMv&%eRWsQkL<`y+tcQ5Xvs58H@L9Ly`xE-BNn9pz2#3&#)C(+}RPK$H%
zJ1*~AT)xcS?)}qIgWlxY`#(Q8ygcD%81DzM{|GeBtvYnrLI8H8;$_9^w1kvpUkXjv
z5>v-s95y`V?%n3Sd-tAbYHBcXVk6+>V){PFS@VIa6HqHctMpzi{d>C$%Ny&b-*9%-
z>}_{(MRO)}S|!>&inMG<xZAjSbHfuSPV5d0+)5ko1z=(9*&Ben#rY}CyU>CxZ9i!N
zQ~|Mb(0Id%;E5Z34z2BJ((?DFO|JtGTeWQIiO5gql-)pP$zIZ~j@9P<$GBuQp*c@i
z;wrS;Vv;fo>ko&7C_q%>|NdJQb=6dj)h`#g)>ON{JR2I?Lu%17Z8{j6Ax)azk3Ds2
z0Exdb)!Naj0e118Pz{!ITXfW^C(;f#J8N@;OZ^qIAi|%}0e<iyJ601+?2Z0GzxUpk
z9Qk3)Rr5r4@87?Tv(<C(;5HNxenZdb_36`)LFAUdKcPOH4KnytTDsxz;a;4>&o8dl
zg_3FrjWu!N#4FJF?2+}Nz_BvA<JV73tv-AvyitSEHI>Uig!L&g<UcatyB<{d0-G^*
z;ao$!x7*+UUy3xF6;F&VmmG49!9cAuI*7K}#QrQdgR|Zp@@X1{#YNS9oXYe|qlUUo
zn>1;OIOppXcS920wX5$S2W?z>hUln`N#lRukNFSGPsf5!KUvzXegguVXl%UqQulG=
z#^H;0%BtWX^vJ-~o43dxjZ9>d>GW<^ty$wpKaerz#(cje+%x)*P5EhzKioudW(LVS
zc>a@?ytIwy&J6-(ZNYp|f9A~Yx(lCOK?uKTwF!yvI*>rIXwk=|TU}!&S^h^0P{GyS
zz{oHcMxmf==?0wHLc1^&`fkg%ZP&>*XQ+QSZQh(u4asE05HWbx`=~Z>V9P^mOB;_^
z{??OuVOfwfaOltpbLXmq-q!<+DP|R9yuXMoOUQXUzMLQj)kk4GyPNE*{KS5b!_d+L
zhYT^`B=JK}&wr{zE6V}?GTyynDA*)=X)9xETIAve{Px|uUi?b-^>~`}zRt-$%_7ns
z&LSuKe&3_|@X{V>4*a;bg--MiXMt0`L;Spa|9(5!R6abU-;~R4L%?2(ffGdJ2B;nl
z$m^+X))?$gE9juNY9J-bR$i$ippA*G9<(|ZSA1JQC$<4GV}o7)%^c_8F&;Y+n?@Y$
zoPnI=B`;(U)KNVcDkS4gNz?HwKX#)i*#QStpB|L_QeehQ=HFI~o@Qp&lD-MYxoM!u
zzbFW1-PqD<Ze~O)e5!UIIItbSHk-FN%(b`;<Abb3U;Y-m-h%@IY06R6y`q(-P%wUQ
z=fH3kL|&VYAJ+sQ5nh{DLT|`rA=qdm2GV0!HxSap>#u{Hq={*-t*torh(<qvMpyoT
z;V)q9(vL!Yx^o_KkkC^sy07HNYm~16=9}lyVmIFDjG$Qg_a#(^f7gYIjQdDJ9Iq{l
z#7n_+N8P)Ra#Q^XSbIi)JBF%p<=_-?TuvVvmBLdkrL7&BCk)L1EiJ33E2(+L=JC94
zbsxPpLfhW~K-)SF(blEZbqphxl9C&_v%*H}{_Wf5PxDZ0FQ3_~XHTOtA+{p!lRbu{
zRAkxCY+Tilk<v3Yv>(SizK3Ra%A;qV%IxR(`wM7t4Blz}3?@3U6b8eu3h$2sutKY!
z^cVliPmGnVreCLkHf(Oi515(Q=5jY;zWG8&3XWS?IP}^s3X>n)3k|BFfH%N&iuTu-
z*OgLxG}dN|l|?nANgCHZwO@ZHjdwqGr)d_thJH_cL96}jA{>t{aUI6yiMGi($$M3e
zh(0$}orlb*h7>;jzJh<g?G+1uFJ-$2R3`CS`m+bYze|!8E?2ECcb}LJNSM7}cwa}4
z<cf3{?*wK;D!GhC74m`lm<Fk47cw;Ew{Fbq($b0(Uq+N4mR5E8KIwtP-zBCS<ghEw
zf3=+}LZP%O58Ktd_5=j<$@btZr^ZxK*BRs-0*IClrJ~j-J1~Cy_$}XbaR${%9>@RB
zAM44JChe@`LX>hs5~R0Jrd`TOPoTi*q93@9;<kX#UW#DD>O+2huNL%=$E+?ra&6Z?
zttHxBcBWF&YWRolph3sqo7E#tskrC1z|SJa9wPl2#n12h)l{evB{|%s*)@EShw&e&
z8N40DKQLth>bjoUDg3>H;U__^sW{eoB~oMfl|x3z(D~6XJDJehRMABL11|U4!M01t
zM60Rsyp{m*)$iZAW0kFoA~KiSF7y<=?bI*%$ws4F5b1rHA-F~7KVoV1V}gFcg$ozL
zZW=x>PoyPs8*QLhHKrcBS!SeJQt|q>N&?bR^<c7a>}So<H_1Y!G{`k~$mXkD+2yy0
z51)B&+1|98^6wp(@;f-@Q{|6k=_`xCtWnPwogt()&cVoU(!-%n)}^26x%#I4t&@P_
zB(<8G+J3<xtWgasPBA#5M{CR}iN}z-WBc|^)zXB@t|Fpay}iitqFDET?(FOF)t&}q
zb|STE>z~E%-ld6K^4U|b97*IMEArY#Yb1J*am*8P$|v|14O{WP1EQ0i)ae?RpL0=t
z>v!iPE}cp5^K?v1n`~g8j{~VlB`Rqx3#EPH_TcBG0^!j*yRfiu%B5A>%UQGY4Ik3c
zIP$Nj+Ko;Q*|~mw9hkRfUAuPmb7#tC2NP>`)ioS{fLn}mYslVSX~YAY?7#X4IO4}~
z>&~5e3WS4QMIL%_+7&S|i7TFL5Wnor@3b}4V;Elb5-H~Uj|Bx@Oi5lYT{hCAdhHYn
z?@L&Ac9k!iO#}hxhNe_?8@{w2dX2YCBFGw(m?JLMaTF&n*98RyIbbGIFx3Cd8Es_S
z>(L6dC7x|gNEj};5p>*vGh{&N@R<gp11?RhwC&H--cDlTOV*vQ`6sHk^^JEud-raD
zn4@Jj@|EkXeX{ySNEwCYOHX>Hx&5L(Se>|(H-=QRk>Jy$gsMCY%0Q!Ha-fdv`)#M(
zZ#S*o&jsx}cizV1IBs|Q=9Mc7Qn5;O%L@2Q%Gji^vA*N?A9Br|qh{;{plt)g;+~&k
zruD_1-lfihQ}NknURAdd+UR@t!OIFw{M24<Rl<X}cd=Ic!^*ja@9+sRZYbwgz6UT)
z00G{Z-RWOl=cNexWG3inh0ef%`V2p5&$^<J{bf%stsX>Yc{A2T<lUabhS8pTe+4!#
zor(4M`1nhMZVpoZuH4>Yj}&nkUAJKl=e!9<01-CPoj{Y8-9j(>KYM1U#f)#!0#Kbk
z>D%iYn$#u5nSH<i{Hbwp<=^w?Yq=e$t}36Yx2|%^@z1FROPgUuG3@?74h|c5<dJ%d
z=DN6e^NOxNU;)Z*dXX!Fy~0R_S8v^FB;BdhA2VS&Q{XO?Kl-zD0yOfw!(a^Dm3Hmg
zZ@|$uuPoVzu>owh^_4W|Uw^MNi|_h``HzPm!$1it$<^$M1UQ>MTt^FkYutjIs7udt
zbGs2RTV(^9Z!lbu)^c_7mhIbb@U}DW8BUFx-w~0H*Eg7$#UFD=?WoAbwLH6cJjXf(
zdTG-)WccQ0W+5?)rcCL;G-R)sAyr*Z*(J2bzo3)j*Yfh4Gz@x+x*UGRE#iF=`ps3V
zRy8VNCj1ZR_xxcJXA6pU414Dj6yyyV8hObc<V)$)GMj{>QPGKamv{o@>nmPlC&yt+
zUpE4BynOM(tgv->ahH)Rnt?RO=H%pbW+30?d=Ud7a~)Q%#&6q`hJMOA8VIfXLnh>D
zj5!bhF{<vXQ{Spj*@2NOe}{Bxo!#C2>z?e_ehy3tK6-LYuO#>KbYF#~PUwWTecgR=
z_a6a#k32K;_M0MJsgX*1Be$<_TM?EwFp7`f<po=vt`j|H_DxCMy?eJOr?+tlQtGRz
zsZn+}wY0Rxj~)9PyXUNXPq|gF6mdl_05~~U>+!0nAn#T7Savj(`3LE^x~QnsnFW-;
zcC~wg-Oe%9-w#_IDqUBjzWR?_+#24c<;9tJ{1@-tw{MFKpl^S(z;WKZZ4}zaOB@$0
zXpV3ow5y8BM))b;m2;iK?%p4<=r}TJ&|F=`thsZy$jIv21-8lB-Ypikw{%@Ry=`)J
zv5y-(tE}v<tDxh)UM2=j93^=XJqwJDjIIH~sRDk#vtPFb59wd(tUGt^yeKaAW~G)R
zwhL4)y~wbiIb42C2Th$eEsTe-Z`hKakddb$-kx1v)1KySyhqJw;LRo=#O!OE8q<*3
zn{7B!UjO*7g+E|f9^ld$dYRv}qv@?WHOAE)b^e~{b=Ov7n`GCLYgZs8TE^zYIQN>S
zZ)sWc>dWTrrBD^mKyY(u_5A7hYQx^WDx<5uT86p<+jI_osip`IL2ei)9eRT|6KDt?
zkI4f@j^EmmRGblidKLm^GbYkPFJrZ1*tAvqFJHfoC)io%o*ec@3p4(Q>&E<i+iQnA
zy5kL$?2SvJMl2Ff1(!vS)6-j(;ZXHppB)1h4FCl@90LwqM6j?C+Xu~(@>j`C%}2tZ
zm8@&ttl0z7`;Pnp5U%m_c@ffwTHqn?QXGet2TN^aZs69-#|@spsq~B8yL9d9CEHLZ
z;>z^&G15ifgj12(VDOuyU9SbP!xMl|HEm*#S_SO6{r6l9b{;vHrH~|`-KStPb)*{U
z(X|2^4p;`eJS(K_Wq{z#Gt5sL{i)wK&8b;+)qkE<O_rhvTX{qGSms@uQmm+C)9`K|
z)iE-kcPs;)&L;q|2aqv8bhlo+y}RD3kT?%2%g6!g7B<ci8W8)vO@dhqJ(j1L>Us%h
z3J0cb_KjTGpWxb%>?qY51UGvUTC=yoli=aNz}`d?lN%I(+SJ?f7r3njou*rxwK}y8
zX-2(z^%|8hdSz&IBPKRh+JKudKRdPuk|t{A>dPJ+DqG)61n^~sx3_s~rVt2B@`o<k
z&k398Hq%D$fo0b3G0qj|?&b6zGNdhNW$YTl)8Z8?*5#)t{xBL*&#dsihIhl9w&k`D
z$%k9ecy;L5aW(|CQ>WVMbBo3#E2}mP9h`<P(wY|2hzlqr!=1Z#XFEC72N`egG^7dX
z(UYP4ljt>E(ziIk6-b3h>F5OjzIy+D3$}ERoinF5=VA%02Km5&&(UG<+?Gh~Eu3$r
zEAvalE17(WKfuVvG<EAh+Bq-vmfv1*ytV0<Ewb(=yxRLsBW7Y}_8Zu?jpmDqhFa#2
z?gQdW_o=lXXq^ld7!&e|%jw(uCXLjonT!(pw;4xX_e!H+Hvo?xDN%$Fg<Te{baice
zw{s(=d2?#Wbd)Gzs=BU5_xhx-@Cg_?*d=pfo5LF9nsx^lalg-}dR;77I-J^gaPN(E
z46^naS(J6?dv7CaF}J3A8G6$)Y`-+23v9ThTLs6)z;LNW`@Ve>1`ajzeLaz@Z55ci
zWzZ1s?v=jgl>`0v?5U%oqH@%o%(jE{^9pK9;R(*`i6e+p{arLv8gdhkMh(7nl9Xz0
z;bqc$9Eu9n1=E+7ZHUrelDv(2CKDMz$xyyb+y2L+9$K22c_LkJynuQV%5$=X$-n>p
zE0gs{60>ok+dz#LT7vWWj~fvbi*yQ7)%tVX*}LAuybsji0x_T6_Ot!W^4?GAb1YVb
zz*<d-UpzZuXZv>T{w1_Gy*-@P!wqhmU2#)qFxUeoPrepsH3buNl=sRQ2x^aR0?Yv3
zX+!R%T5*VBM7Q-G?CWGPmgbMw*{8`hhbYW6iY;e+?CyQscksMNCKh+*%$akV;|)IW
z3_Eg>bN{xu*eJVt!5?Mr=U_I&zHwLn2uO>a;Z<O*Jk3W=pKeJZ+q(K5<-p0T`;Kjg
zOwdj?8mU$@z$o-d9w)~+DXFHqGy1wZinW*mIZf)+n|>01O3+dLHGX_OMi`8$^xVES
zqFLjVeFzXsNAp4a5=YFy>%l~ab+7&V)?zhUS)Np5KnhdL;vMfB?Cg_TjlvSkD}6r2
zi<d9W&1d^>4PTZL9v<#gd}`J2aVPSgX7Y>LtDU2Azk<`o!#F65ma)eDqoQ_Ff6P5I
z#}$HiCu~oX5`gfw;BsEk?8JIzU#qON`&+kp^CvW)p+(zv`d{qSDD|gIo%)j0s|YFc
zay1U#%i{IN#fh<@TFXqBewAuRVc?O2mPm7mZup6>Wo4nfX4OWKZrizFzfrxwebiMq
z(tzK;$$4jLxXftVPW8m!iEMqGN1_23Hey7RrU5e{6k#juzHbud>2BxGeaGAXxZ~ih
zqM8*w?RN#Iuyx|!^e11!ECLfxJWNdX>i`z0vuxS2zCDa7_j*Lto9*a$IIhclLkpeM
z*dDsN?IF}}z?Oe{o8F63l*zzx`Sq+!ca8a@+ALZlvJV?R2mhG_1${L5UDU)S$qgfC
z?yTeN@iFz;1=pqwM@Y)#AMFVaJ{j|HqG3?*F^IugQ1740$_#KZ#8yhd^t`S2sh-Rz
zIS`-}-Zp7dFn@df_|b7}Id4$pdTsoT8zJ(nY$Hu_`AtZDFAz!{b)zQJ&N$SkyK`~r
zwsU8}`(w}iWM*~mYi)#+1|_HnjyCL{nqQUgn%{rYcpTOzP>J{%S87eR$ZLT`+$@gm
zrDI3J!+TP%Id=TyZP5)J-;Ot%!W4$0O>`IV`W@Y++a0`b?`N#XDSO7})wcf4g5YS0
zj(mXmRW$5UJE#fRXw}NkdeWrdXJD?b;rxc!vx=39f$d%SN{0OdV=NEcuspxe-h7C2
z?dgnc*1Wkk_G2fe#Wqn0OC_hKX#95yRMrgD*UyT6SXbfi@9(n6)~=1ErAP7)wJ43i
zOWrW*J@9RvOYs{*M)!$hKWqbV8thXuh46jUqC@UoM$GNo<q#_02=_Plx|&xI2g1HX
z(`pWHeC^RAn@k&<`V-q?s<Xr0X!Opgs2mNq%J163ddcMjxK4!SM4OjgtZh+lzlQ-_
z)$)FUnRVNYx(VPym8@>n{P*U~4NwWDBs7WY){E#xNq&XW^vO+9^$uWIOFsSEjAJd_
zzP;ZHc=r9d#@yhHhS}7@v?tlwO$<lTz|wfrSRS19Cf%Nqf29VrPqx?<WHcxaZjTJG
z>hr7m3KnbC?SS=Tq{?h|6~r%o`I~3h)@Ru$$a=a2IK{d<Iyy$Dgqc9gNudaHsI%yJ
z(dQP;n<w)e>a?*=G>dIA;dA?RhebvP8@$&pyng-q88EzgU-QVpqb4f`Qb{%IFfim!
z#Yrvr=I?CGCR_>YNFCxlq~l~Zf!=!ogEICa0ozAIdg!gtB#u3s28{;QenUs?qLn{!
zz!5QVrwaa6b85*3X4<EkCKp@M^5XM1RNZB1@wrKVZ_eU4?GIe2#HFs0xC$iNSlowd
z|BMXP`Tcq3Ug8rHE|(6=?pdbjWA;_ow)BNLY_p$Xao=4);f)vob)@F4t62Uqx2v>*
z-CU1)cQ~w?T=S2U={<}0r{34(6BSyisMO^TDSwN~Wo4zgB}TPJk2)|6t*SOri12kz
zE${N2QjKUC0gD>h9pT(k`-s}VoNLc6=BvCwPncK571E1e?=sp3y@n2LM^mx`u-0I6
z->J7XGz!vZ`my`Y@XcyiC!WV7g{N7M$SG6boZAQAUuYp4_YOE(_$PEEPlT;tN+BY8
z%K8F8)2X!!W3}=Q`}JEM5%IcbV9>pzh{t9D#=qm>lDan6e)^lD$p?n5=Nip>&#vyJ
zp!dlOx-S@gGx<Ya(k`m6M%x_yy)N90AQcNPL(HcU)x^)&cN3?tD~EXG^5x3~k#Fxd
zsuMZSq9Vw;a(|bh^E=Ruu_@fQJ}k+wcbPCOPOE{fsg6CvOnPsGMyEmBFy!sHsb*$o
zk!OQ>f%<>`SqDLc7-P;I(jfW7*RuygG(X-B<RT{1wC=NZJ&Q<g(p`E$<M~NWPQXtK
zw|9^FiGH%Q8uf&x-3L@isp}{q!oKY{JK9ja>Y2aVhqHR;so$<4;q+>v4R!VD+qVhm
zj9<Ke-%Leiuf@z@s@lGKrxxv(3yGu(L!{AY9L_MTwnOv8-0K)n8kB%RjB?{RbYm@W
z;Oqg|8;A-aI>px7ifFiBGfcgATmS6_IUl>XZB?EVrBySiZB1d+!zLq4E~v|B7>Hq{
zXPApE(*#*R^Q~Grsy}@Ec=L`O&5=+k+PFWujh_5KNcgIdnV<itBK9spm87^r8<ZPz
z!YiVd$H<kuv#PpsIEncaMB64WuO1kU&(-Wdtrto}uZKqtqSv~bn;U$yp7Ml6T*E`+
zF!$*@B|seoK;tII)|}nE=1I^lzbT+44#$q)x6&Tly9j%K11-O@fYMRcE^1w!Dr~pg
zo~atq=Kh+f!&4R%xe~p@`1J9szl1M77!c4N3GZ(}TU^Kj-0omc`x&K~bH4@)G}F%1
zH@&ZIW_9&ACuZ!mUBSWK5FT%*nhJw{AE>K4U`TgUs-UIT$0^kFQ4Td~(&XC5q?(;5
z!ngTcdcAZwQyd%EN$~=)>~;F|8^pNlxvf)`sc@yv`;Sa6;T`i06=qhcmY<EE?H4!K
z@9Y?pc7fv4moF-&sr}W}ukbq+bCZl(n7OrG|7w`VbQ6<il$x7vv>=%?Nne+S*2C-$
z7JJ>=bU%FHK$qxbv*0$icL(f>r=9<q4ULT&j~X#z1ZmPVu(eTcZwjXGrD+2wEkv~9
zNEU7D^PsN2)zOBE0|ySME;|0?{IIKU7J%uRCf9Vt@aGDS2(hDg#^sG^lRx9!oaS_Z
zLXx*MR<F{vZDsxOZPxs}#IB40Hc-HJ{w{i+M}3A{-{=q(f8hdQTR*+{Pm8>fMhlM}
zKfVn~!<L0Dnlx!`Gg?MK7oRnVB4A#@q&%~X&*hZeLgITXb8ESoLSc>JKhgCX@MSc*
zs+a6PEv>CqBBBDBm*1U97ke9tWEPTyYbBtfaYS}*G8*&OsZG8_AD*J7hVi0Fj^?)k
z^Nt=m`ymgFU8c?UyywrWc8uH=k3igf?0q_Br`P@{HQFBG;Ow@Or>2b^Uyo2G02_iU
z|Kys*bTfuU2MRTupB>Yf5SUDuK8@H&&!gJzEpzf-Os&o$*mfAc^zTS_^=eaLE1|lw
z+)hZvUtnrsai4~;ba)h37=Wb;ys@--R2YHpdPar{lP3)oSh}{wCy-QJ&&+p~&+grd
zL4yY2w0+JlWk94>U_QJ__V0hSY}xXU>>9dTu|W@1x^~?`Tme~hu&|A@(C*udR6lRY
zr6!SmmiL2;DIscDB%RI!UhV2Wrd>8#xwZeOxIs;OQIh`#MmZf9mqNq_$XU+L*Q~bp
zS2New4jgx8gtaw}?m0T$_eE}b?DeW<duh~-u#)m!-rm!_sSLW1TULARDA!PNGSV<!
zy6@FI>-`Of%`9Jcsb9?JVefM<cZS6q<Qdl1O*+QmS%;%iI}{I|`#?b!YnM%p=I5IU
z^4iG!N+^Eo_B8tfjJL~^8b5xKhLhn)WHs!FNr57qSrosG%g535?fsq~5t3Q2gAx*j
zMV;ga2?H8D+P#SajF=4I^)mS6-G1l0^urB-%bJ>ZH11L(OqoAfBiSp4-<TG2*}*B8
z_&oPnxYpKj-WBK1o^2i5HvjP)KVNTYrt^}TmLSG<fK%~nZOpq*tt>z6J@in%FiQ!`
z{+e6<F)zukwVTny^z=VLNDTGQ)0&ys1x1>`ftIaX{}vLl^gazod_a>dzRb)0nq<fa
z4s&R$yXK6y*o_SAI~|4`-t;?+jiQb94236JsB26VzH=NoeE3!TN+Q0t?B0DBMIo()
zxzFNG%q&iQMW$*SJ3VG@XjWCgiHEYTF!uN>{(dOoa%|YRwQKc|w#JmMRrjxRm%;q_
z9hpaZCfDtxX4~??cq3;!Mc4o{&u@p0=_bQ_%0a|6<?5X~%`koS+_-U^SIR8-5<rrJ
zr$g)eIeK+Mdd_H1A=oAsv6Jd9bDQk7HPR%dsjC)~Ht0jCRcVb2Ndzg!5S!7fpZ{$d
z`EfIoS7DFCL29Y5lTzcmTbr*=oE-J)4ZHF@DqAU}kfgaf;oYID8V=1&k!}wdF=cJ}
z2YXPGdH#wP-Sk@eY1zizCElc2g=*>Ow5IXeCL4M!nfR)<XtMHrSf!(WYSpdVPKXzc
zs?}M=4?r1m41`Of0HU!z`8zU^NnZUM{8{@ia{t!pNIq7zdb9f5`;Ii}|0Na!i@U-j
z*E6$9-yCy{|6<^vLE~IpG!!o|)1`Oe8?$OYlR9rJ<B^#k`JoN|^6fH{nfQq4c(Zd3
zm0VToLQl}$Yi*4T3fJ*pmdjUi4xV9s?CzWI<brmw=x%=&ufP18y}f<2F2h<P)cO-z
z&MR3b<KaW;OE*J?l$pfn2P&ac5Bg8CQst<)Wkehb{rUUiWy@4de;We>%zJIg7lvpX
zM@-^bE=kxPed^RMZf?^OP?z4??`99<0Bn5&_IW<s`{t;X4%LwFr5b=h;{X<~gvFhr
zi4OJkN2ls0#~=Sk3-E@np-&2F*%P7%%Y9nx*DTI=?$~i_wuQzKp54Sw7s+;EeqRtQ
zsM!wK{qtEnk3ai|Pnl%ZaY6JaGi!cvOIdff*wYdHmy7L|gmqQ2j2@2_<LH#oDYu#b
z{>SIM^?U4bj{EJ43WEX`&c*ldGJ4NCRUR@C{>fvU<-<Kg^TzNG$Cr@ajdvzc_S21%
zk45`jb&+ki)Sn(hP~J|Q?`~~TGqg>2OIPbx8u{z23@G-(Zgg9aI9Wr5$f&w^*vOHN
zFc3$h0{vnDKd|q<MdQaBZ0})!2x0v3Ih-cbhbsu-ZDTcmDl}^Ijlq^(yZ*uy4(SO7
zNE$*UATSw=?-E7dcIu{3KvRbi%hj=wY{6K_0ln3&TXY|7wf}+R!i77jXlIkUaRqL`
z9Q-x_KtAGJ%%`sc^p{lqbOjANLY3^(acV*dy`KB39a@{ma*fc<wC}gh*6yI#oYIop
zh>QQxLmSuSK#hc<NgqqB$OrZN#8n~28eam(Xq??2pTE*qG2UlndYpVVMv~kYZt@ca
z{3A@n3vi6zrGs(wdAzf|tzE48CVX<RUd~-Jtb*MdZ#W8wEjo%`#a}db?Xl}0Ft|?%
z`Rze^`kt@n=fT->d}l1T=kZ0Z^L}&ZXkxHu*pH#KIrtmvrD!e@Y?gX`<e|*E`h$x`
zz&g^$Zxf{zLpf?UCWc*Ne`O}p#XnMlOw+2{ONIKuE<M%ukLlfe!o$S9K0b>9y$Vmv
z&W;r8NK+!h{_MkDBh<R5`OH+`Hg(FBE!jaDj;xP0JQ+M2y@=5iyg|n^Pn1%^K$hxc
zGusny!@eIi3jF^4yN=p0D<@i1__k?4?z2_N6K*cxXV_HpHZ?oj+D4m+XLwj#oXXB9
zA5I`-m~4`pi~jf}SI8&M)YP=C&3AIk`Xg-@#FSO1!w#8mcmNHf)?K9YL7#q}df&L(
zyT%q$GV5Ew&u0;ql?R+HbVA#xS5;59aC)|@G$iuEZr>8)#K#j?w*XKSYVIiGeK}xB
z2Iq+X+fW%OEndCKzODAZR^EmlbQICS97!puuKY6j<=OrFJB#6L|If+;*~%{fBnL8n
z31tWpypB9+pz}l3ukRkWz!e|(DX3fe7u;Y+I+D_q*x7x|PDl*GdgQb7d-k-#>g`2Q
z(N+qrYd3E;1e}cHgu^$iN0Kd!3y9_#2oR-IGie@j!u?`qDf{@X(sRP$bi<a}@J?^g
zdpV6_QgH<Ze(t^|T8n)6k>1(VI=f?@i|(KVX{cc~8-!XCk{><!Nc;>N-i6$u6|3LZ
zY(({|;jJwyk^3pU+g<BF{QTjtDbuETXY=ZP;`T1>e_n^yc2`u{ohra5CNbYXAP+XW
ztGUYW=3B8f58Bn+_0NyOb!OVc%{oR%fKTfm!w}YFM03X39<yfsA@zrE@F67wo4zlz
zZV2}~%<#BJ<>!VxmERQ*&}Ioc$$N{;CtOTQN=otjbf59cGaGKaQ=d92VwIjL9UZlj
z3dCdAHh)K*Z>TXl8?=}HcR4h(cj|2oj(jiQM=|)AjYy|^av|*VkmzZPp&N9pFLY#s
zN5r+O<dwk-&#~F}wxjQxFIErf55FiVs85kF+uA?%8^gmU2S>C;F8UxVE15=OY;dz>
z$igKrppajW-Xhyuhp49ypx^Y3s$0!;T@p8FZvAHH>0-AUQZ7t6J*y5NdJ|rxFNiU%
zKbmHl=bmb+=zthLVsIIyh}r_Nd2gaJ4#j8>=gtcfJ$&^(F%#9V=uBTNtv0_$6c-me
zFoWdO$ub97{{WX7{3Tr~j7JTNyhkh=Vly0HvzEc_Ln1EtU#J&B7B2{WT_>6>0~@$?
zA)m6nhNW2e8kMIb#(!DLQ_V_jSHltx+Y$RZ(!N}j_@e=JoIp#8=UG6@!YZq89Vihd
zfY3$TV(6hlklc&~*n@9nWia!Uh+#L&DepYWX4O`SsfHF7t!XptMD{d`(sQ5gqHYaZ
zblc9CK8#dAq-Qiq1d%uErq|(D<9i7dnjO7hE7wvV_%dU)l1f~-hPnS79IUr`1HB==
z)ur_~qyM7o!hn1m{nx9skdOqQyz<w2WwH78t~O)DFVE6=Lah6lD0q!#BoF4)ja#`h
zNGvL9J!G%9<15l*J;dF8V@582`^PjZ>%C~;=Dt6NVk7;>3wR)nl4Biez{*;ELun87
zy4EuRwS8Y^{UVoiUI2@#Vts6cN3|Z&ICG)MLvJ@txABJ?K7poofpkPge6#@IV6uN`
zwAGm8@h5p^^SUHyZMD}o58M6f+KE&G#MW#+V&cPfG9ABoI3f-z&dm6aQ0vmeQG^^j
zwwZCTxzGOP+ePSUM>aIj{9aa)V>@>Yj5u0Kq2n1`N^^Zr_h~kfWb8;nISPu{)UyXM
z1@_#v>;Ak`iKiwZ9W&5eAlJANgXK@hu!&`<SEx_-TSwO=WTvNIMdviY<l%rx^KW4e
zot;E55Z!}@CZFEaxpX%W9<69EZ&T|b{~}zNO|o+eQar<CCf&O?kjQeR;TU!GM*L5H
zmCr6*ym&n~cgEbjORH7D1GZ0V;D9>yX{MPo=eCd9mK{47;?jv*_*^5X!_1B_#@g5o
zk?F<)j(85uxgbZfv=QoSqb8vp*t1{1=E54#Ikx_WYCeTby=evHt88Q$`a=tqDV#vt
zY@NVnGuM9h%6{WPyHqrJNR3){>g3IcU6PA!pJ?yY3fDRcCUNPPgg!`IlHXt*yA@+^
zH=;_s$`FU5P1kyFF)uuFCgw+VI`}+2wL4vs>pab)XFb5mEW+8zH>{&zx^!xhiWLTQ
z<B!LQ7pl`(8oL!joSXml==kp2e@~&~blS~3Or#c5PAe$YuDK$B^+dsw>TZ)#rQQNp
z<FIegdgDu8C3RISW?t^XE+3DZz*MWiE<rv%8%SRP!_5of#QD5}(`V0_!-X8`>s{eW
zeU2vLD)EB-1Dn{1MG0f)s56DoGmwY&vL=TZzZhlUQFka%gN73A)km03s>Rc-=<qKA
zONbnSxrYD4-kXP0xxe9~uiDL}k#=*t78RutA!)8fRLYP{6_vRNp-@sg%?pVP4J5Nj
znQ4%ap)!w^F+xZvtaCrhZhtxFkKg(0T<4GNy7tgudEd|Q4EJ+C_cM+tq{N0n(2bJg
z1(aAoO-8lkENZuhF^oqYxI6Kj(S(B|8>AIeke@#dns^&gvReta1|R+rRmoIP!6%`h
z4ER`?Ekk@qNNK=}Z5fv_z^1*q20R`CMYrX?-0J4$u+FXRkB}wuQwQwQ`Ch)h*Wisp
zytybKT*K8KQ=bUbe#@BkUVwM1VcNTKcvXH#+4ru6FP{GdTXPx6;0_nLl`AJ#R#qbT
z+8f7(nHt++h>8HQU^Ci`TrXW31H-fQ2_p6tIA`wZqG%4<+Hp2m1a}i~ynOR)*Ae3c
zKLQEd1YEO(rVj<#BOkZ`)?6Mxzz)GXDs`}1-LOSjvpZ1VY-_JoaDP@`TYC^$=B5NZ
zt4RGP3Q3;aAfd;CoO>8lkqV~o`4M`+y(R!|jj9|$S#OxK?1RoZtB>W)2W@NKeRdT>
zr#*4PxzkX|e+5wS8?a%%#a^eSQ7X7HOOhYPVLiw!7qG+LvUY-0v%|RulBH>?vKKk^
z3e)nn_u{ughZc$iygkJEjC}TNJ5WrpSWkRR<(my81AwE*)SE7-{F6v9<C6L4DQxD>
zmE;F*V|pv1uH#TVLoPWUoLulOmgyQ8Tmm`295)ywqe;T=e_-m5Nn9bKjrq9e@DH#P
zX?VqNa2z;d!$D{HO+SX7)hQdBzfhh>g*31xme@P!@x8aM8LC#_zJ1z^&f`Tm@XpwK
zT)PW6DXAzu<3b#_w)S}P0wX(ltY#F@$GK*oIeq##&MHXNFAE9;@Fst|xV#{iGpHBt
zmv#qZY`5Fb&rnX(0^KNZ=dX9SKy}%Peq!}cn-O}$nZ8Ca9aeB+F0=+4AIDqNUn?~M
z<md#l^TPS_nGJh_is6oRVdOzekcAm_h84#}nGgChMIhks@J*ZZjX<}p>?4_O-i{Ne
z%~=Q5(KMC!r>45qH{DkU?t2q#8aRkCSefD^J4s?s(Q?i^{f&>xH3K~VR4`=MMt*8&
zpzu6-C-+xOPk$Q_L$Yx2Yum7ExY8G~DEA$>{ii_hMpAzcMP%Z{AlZEdK!tCbkoJyc
zVOqW@9um++Ok&1GTLA;$(m{jzhCZ5&YHHJgtvIKo$bqQ$H;PxpQbtaEx^`vYPS11P
zUn$(Fl~ZA7|3DWe)LA|vj0QO&`q6?yY$=fKG7)RJ%*}vD4k9}1m4jT{aAZj%6ciM&
z+`9NMhCwODJ>w=GC><${GdBUq;T+iPcTkDKeO(AIL^vBLjJq*xnfPPxgC&{c&{iO9
zzq=Q65?!$Di7gf3-&Q)l=lY>;-%^=04(NJJ83qr->%E;c#R`PQE10728NFl|oScSp
zka&QcP9A*6Gz_2=!g2+6{@U$H6epljAVma)&cxILeANP99fvS+J9rVedXr|%Skk-B
z?#Fl}{xj9WRknj~kI3Nyx)8uw7!I@$mDLyMH9dAfUHw?w+<`#;<~~$MmRKgo>5Z88
zJ{k4Qk4SvG(K|-;Z#3O~1QUr$loTe?Yp-8F7aRGSBcyQNMF=CPH*DCzkkE}yDD~MK
zD+-@O#+H}^v|mJK!C-P!X$~R2SBJpeaixNik{LL57fYoky0ncNG2$Mg^V_SB@+0dU
zfo6P6Rzi#PC|q2*Nc%op^u47P7ypUx4#^*(Kz9Z01_$@NMaRhe1q+5Du-XixL7oF7
zP)d8@Dbw(y?}46d{#RbGE+i?4Zi@SJ6-<JIbPMwC@)4CD2_A;hOuX+R1K4A-&|5eE
zhzLraam{GLIpfklk04K^7Z;HIKr4zc4q&DSYct*NZ&eM5M>!Zs+y&}3fE9eSH;^B!
z)XCshQvD1JzZZ!MK(C+>@BY?I0rZRTgFsaL%xoT72v(vGfBYQjX)s4=2yiDN;DTCR
zH912N^buI{-#un}FF5@i#YGFgyeV)O>*hi_?+R?da0bS3ai($MEo_BLu;imvsFDyf
zU<5N8onrgGY;vboQSa1o)6Ou<a#AtQ@+GW^E`%sf$S@Q*kZk*7zsr}$!R!Zqe+tau
zAov7^at)=$#k#QhkY=CiJ9R5^3&CJ6EK@aLl9|<1o`!`JjyJ`{0iIcKJG28X>oCN2
z?xSi<V^F)XprCgy-nj{$Fzj`dUnc7PFVoYvck70^0OA2Iyb}5<SEn`sO&bkes+cYd
zG|=4^Hxk562wfF)l-RGhSV2vg5%3t5GWU?y>6kCN1R7#vp}G0jbA_8x^<R*7lDjHU
zb>?Fry#lu9G=L$>@h`UE`xU~@x4{Zu`E%tax6sH_ZHHj3gXS0^q<f*)9Yv`qkqFy=
zAZj)eI=fxibxee%K2o%ApDxaGnPP`4eF5>DQF#~C8Xn^eUd`RUa?zqih;#1l>(S5$
zWW3}jmyR4Z?;gMx!)Kxq_0^VcT}}6kQE88amMD?Dt^@(zqJ#*+#+oX=5fL5z_jUkS
zMKsxsW)q?jJdJ=WAdVc_^DoaYgPkczJ!We$46CpR9ln3#^Tv)b%>>M<3(9gs*|X&+
z%szOMc@0trH;e;X>_K5#faW92fLaFfi^{eAVH)D6G4S-hinYj3`+cvE`e1j*WXNO!
zRX7b50z+4E=!#uL0<Zvd8+|_*80^m|h@I@7(FzXfmg`(xZkBsvp+D@Z$W$NEL*tol
zc$pPwyM1Q~ZqHU66`^J>fPZz2L@OO*j<}S{FbEt9RK4EoA!?1qqI*7V13Nw;;g{(3
zpbT8;$)NARInxoZmEb4q^DaST$&xVxP`aS~MI;O1moHt~bD&mzDhx3+3hyD)J$~ZE
zWG$-`CjjbvFgoM$7eyIBAc-7<x;`*byRfZONO)%?cy!KdG1_U3*lCTgxF#G?O~^$&
z2OSqBY*m~76o1&<(e=_7$ImziMwR?r>cMHi9FEuh#I{B6@ZX3C?zLZ$MzCcl>gZMg
z<4@TZ$f-()s}P-2bGv-K@DeBtL?5pVLpZtCqHcULx@IXnH4&%)-AxzUd)(ZdGmVSe
zvx2@G-P4D4VD^onEm&)l9<@H5`3MOER{f**DClaU3;ARPo^S;$0<kBXQSo>UeuxlB
z>pU5IEh$NsdVFBsup$Om<}h$VP;Q#QKBGXL;F-Z2DW^a-eHQNKk<Z@12M?S;k06k7
z1?rYEmALvVFj#`cVm)fEhij&aG7|bd(p{#I14qN@bY?!tF~E^tV1Jyq8jC}7aS5d_
zUrxs$&qV3`Zd<v`ZnwnmaOIy#TgN;-w9>z8B6i~a%#`5HOa2@%t#{mZtAN8%^S#j*
zOpgOSwa-X^aTXS!3+Se+>u~JqTGRt@Er>|5Q&I5*Mm3mUKZ+`0LrL@^h^kMXJ^Kp9
zEejV?!1ZW<v@mjzJg5?&^G|-C?_PI~&PPoB>6KrJn(ND=qUos0t+o5Hl)B|W8}|<g
zplZYM<Hre_T@SA4+O=zUl-7f_&_<RD#vv96FaY|Setr{SIKWVN4z4mdrgj0R_)<ad
zM#gdhb#wH89S1TBo4i@r73|@$)QSe<2WDxmTJYC*$!F})#yAO86)M*w6vbqav7jk{
zl5-bKF#s6D$)TM&)3>Vm7c}Bt;@Ce%9}@hTF0fd4)qubSB`~(Y-(HCD164_d-xV^E
z0f7U8-?QLP(tr^Xp9=dnAEf}4NYR?+?Bg>BJuFv%<=jX9O>pRwRumI(m&c%Y2}20x
z(B!g}_X2}OT8p+m#s#_uUqJVlx;TmZiy8<T3a9iR1?6o#0sf#9Xxq#N5JR{uq>|Gd
z`G!+#rDpQ!8ED}JFLVoXL+lpnn^cVc-dr{vKx@Q0RU0IN-RM_`wVXJ6{pmk}8K%Ma
z-2?Pbm^2IzXaE<`s8aYEhkqHRSV-AGU7d><Wrvc|1)zXPrg$jH?6r|Qud5JJx#G~P
z(I}Ek1Vt68{NyPXNOpL;heefFF!UhhSLCGVmu*Qy4hchY7SIWT69QgvpXZT|hn0%=
zGgR&>R-kJX@b>0iyCx!OcJ<C1&JdV|(}6;fGb&k>e<Qy_!z;$+2|}IfDiU4!^`{0>
z$<_-<aOvhK76SLli#_(YFaUidAj{n!?Jb9!UJvs1lamoVZ07Gr_o1!EYYP#q*LU}I
z`GA5Fr8V$8FHw*^4m54c)~$bmaxN$+NLdX2;8Sz+Re0f)_O&ph6udx9=L)KP)u=Kd
z6WC;HD-AVXG^3q`H#!VJk5eDXP}c<YU24W2=Oa=Mrf^R}kr#pVpR;BGnwSfYUn+eN
zTJQIHT4Yim#6bDrBZ^(1593@9XW*BJXNYkohY)`wI~xg;qn<I@s18hH;553pF5l2I
zfTuxJGw$x<o=12<V%ycEok>be{MOxe*tjBI0M+4i&^m|=`sd7<_kqkJ&)E(@hC2V?
zxptHWBISn8+GUuc&j`iWo@|%|>u>>}M>Td3?Yw7^#UkB1-{Sz(jMHlk9NP(;geepr
z!SJFQJ*GUtdLlSeRMQFw5TZ)};9eKRWfY{{p6I|9-FMloFVdM;woFcL9&iXywJ##%
z08pSEG;<_5oFpyvAYNVL(GwJU7f4Ib#BWj^7vw5LJ>zI|P}PGDzzaRsqCN1WFdwNo
zIs8c72qFhD^J7iTAOD2XuU~H)*EO*54HYls$L;f+Cfd0p=npii4X={JA5^kK^EV4r
zqX0Eo_54W-i^H1+=mWe**$V~+Vvb4Er(Yz4Cnm;Ej_}f@jVDj8p$=`}4D|alGQVQd
zqaQy$i<^xfuWM#@9hmq_%o1`-eOdj4mk9j+m-}V5?7qKpcpM#+f@?=?`u!(c{I?=r
z07-lUP)quBDCd8-M%e-)H`;dV$Zp~Kz*s~^M{h><gPXoU^C|ux%{9o-?mOFosXFMZ
z7U<{oox)Sa&{1hV?n0$Dpr6!pBgToyj3@UTd<bX`9|M!+KAXpgy9q>nCPDki^Ak_C
z4Fk3wAkst}%)kEHXmnUZLqjC&5vG_-L;?UW_Z*ZyqiR|va4mWkuWx;BqYCb_;5rA~
z%I~HexBSE4I%?*;d9(PLE^h}KDmcEr{EX&SZ~CRk7Su^mhM^iYyuz04+i86P;nVs;
z+UG_j28#r_uY`!xL3C`uRz1fiQ{y$>9bALq^ccm(cd;O36wtx+WR>v1<EV)3-Mg3B
zTE7u*xOJS!)X9^B&?z&PLCGVcW(R)uqXlgF#wAkE!%w}R!~2$ZO&G*F{9B6a0p0@Y
z6Lkc-l?YA#l9twp4K23s?~OaItT_um=6t3!)Fxh-r8VI)+znjxW%s&)ADbkEBpapp
zMz(@Nb&c_Y1ss-?)QnVa<#znYhKl)Lb{@(YW0f{<CVq)8?d_nWqAJU*7&!0!i_qL-
zpnNSVYv2auHFjejLckPDH=(as?~ORoA&2oU_<C1%uSV}H`1it{yW?zseqREXmV2cY
zOxL?My5Yj(CaLT}Tk)pO<H<^}iIvMZ99vlEcbKq<9xbA4*UlOEsHEYbP@T_0<AeL3
zykp=#9k4MzI`MSR6v(%}sKs&EBLglU&I7=esY;qg#H9cReF=#bh@FD)GXY{{*b3;g
zL45Wss%Wa|AnM}lzV&tRL61wZSbv~)8S?5F7DAD_qCS~tbWO%zu>FOdKr;pp*OH<X
z8NcU2Enl&3oj9}^W*0arC#QwfFHR6cUJKfn#`Tv70YLP;pD7hAR#sZN2_jETD+kcM
z$w8l?rK_2Y_CVA-)h@luD+@=Z1?4mMIU^@0Jp_I++9R%eJq5N~m6ZqX`pu`ZD1OHR
z_3x9vLR{vC3J4O?+-U&9pJDt^*<G$88yI_E>4Xdf_B0RSi8qP+d=8dMGePIcC-W2H
za}FP_HoxRV8;joQS@KG+f$eS++J@_G=E7;6F66oy8`035?mw6JlEKpu3JhaFT6sW9
z7qchOw%$>AY<n%(k0WprX+qYrjiV;1z26gh_rX_bKqL)c+K!9!wtsTc98f?UQR|zJ
zeR1gPoDLI#t{t6{gSd+VRxrejBdj@U;UZEq@#BJbtW%KZoooTIrAx;Hl4lrbd(1}k
z5>dl@ViCXK8gEX<S{FI&IWkMpqF59^(6k{W|7MQ|@7izP{L=jDKw;(YM<T8ndJPo`
zl2$E0M&=9u<^q&o!mJR@#8Z>uzJtC-;-a}gL6&477zS4A93}+`@r;zfCAKW@dG>t*
zaI;9$6ao2wDfB0~p8$JQG~Bdx+J9gV&@r}e#}$y}(RF$rZ1``~w*@W$yvpWoEd<&5
zq5G$zZgT$8CARacZM=`&@?D~>z5N9~n~y=>php`WbP}ykpQ12_mbWWg+&7}fG)q)w
zG;cp_pTQcB0`~eGEJrlnPn3~K$mFNj-Ju`gjXQ-tw2&m(fg>m&7;^LGo}f%AFOe@W
z%F*X|sS?(H1ZF&*MKS=;U-#g_v*5A=7>SK~iJKtu5akRIJw{KQ2#>cJy?@lDLOV8j
zPg>jIfPap~ag<Ogc|+!z<6cEaCI$+=3n6jS&4$<qY8JrFw-yQL=tP-i$V&@kgHlU@
z3O-yV=W$e&h>GI&HkgXQ7u7<%7hAC43)*j1Vq$eKqCf<6uYv3VvW?B;zx?;#!M8!7
zoxg6~Y$gwdP2umjMM+NoIN*VUp$V)PdI5m=S*!}Tolo$FleIh`bAf$PE`rX~zS1*`
zJ>3o;JV><uPf^ej%q(+p0AQ?Y@OZ$+z(0)R=idfImtnX)xei1<f1?*Ae+^Qh!5oAR
zB+|ful;#Kqjfy$#;J)X*xAO;D%H72fi=m5uJ8ZwMp57lIv>{$e1?vdr5gnyonN2_;
z51N{W|B%KT+seZ50cPAHFFzL2yEg%PB4fnE&PQPjtRk!czHcO6$(iNzxeQ>Qe1$5Q
zw<Xr&kj)@`U*>KMLWZ`;lI{D=`Q?uOV^?kp!|l9;E#PAiM#&JPH-olLg+jcOO@$K}
zYM>=93(#Tr*#h`8l@&a;FaA=k9jL14PRlak;vBEQ+Y0@3OUwaT>vn#~S83|lP*)#a
z<azscDx%$!@JW006?W~~ZfYuqIsvgP(WQ?<^}^-LCu03ySfYvx=vzPw75=5HkJA>l
zOzTp_d#T8rKZbpP_j`98@fX70Eky#0KH^7VwQx$1iC1Ur`R7=OSPLyOPKb|R0OS1g
z=TF`<t4P53qig&lA@tOkc@Wv>KW{Va-?ss~kpMmCF|W<;b1tnPIdUXP)<BK|HfVV-
zYFiiJ0&a}nclr+a&1j%zQs2Ly!koYKI;~7lZKX)1Dgu41gS(B#rN4LF|J?QTbIol|
z3X~CUpyCA1!aWy7NDc-y!Kwk_T&fwk^lYHW2XIE5oku`GT8x#Ac8D<<QD`$K60N)2
z1Cc!gR2XtE?=jsCIt{}Z5L|(Wl*?bkK^DRDmaVY*s?In9Cxk~B;ki>aV-M}1knTTj
zKt&da;wEQD&eU5U1`ZCM#l5Juw)QVvzgRkk2+#t;MKSvGYeJBK(A0Bq_;-Qbvi_i)
z0_(8J^8RPNg{bM=#sf|b<x4FupN*6OFPjI3=9C*Q&z31|5UCXG))_VhXGhI@^zh#0
zkL$RPt*Z`d6dp}ZP1!upcJixmb=7x^Z#{Z-ZSt0*yD#ZC`)*O(Sr~0}NoeKKq6c%U
z8@;ZsoLSTvwJq9l#F0s}wjAbD{93X2k>mY8{@CX7=B>Bf+r*qy#%X+_TW)>4dG;?m
zU!Ay%+eb~nK)@Ca@Kio^Isep|KCx<Pvr)U{v7-h$MG}^BO)`)QBd8I4p)UwuX@(yC
z64}HTRI!~lC{-lIe^k<njcK9jE{{`a!nxypn@`Tuqw0O_9>&K@<LcXd3Gj%juqqQs
zSjxDdQDr?FDaLBFw6HRu+2D-?OE6A^xx3>$q*NU{KR{GYSw+PiCif_ivk5QcIwMFW
z1i+Wlr&0i2Q6Q5AXdj5w-3Zc@A3$7x+^*uPI>SBF1?81Tb6EzHnBaNy<&*j63+Y%3
z$tySPbn~CI6n`{bXvs-Y!)qOm?t8VgFsi3++Uw5Eu9k8OT_YUoBqUnF6UZe2T-}KH
z-AA=jh1q}I-Y>UvFZW73qgavqsiuj^jepp3RHq_016j~R<mb+llyHbX0PG{}FSs+2
zlXeG6V^FrD!2qDH8GVa}%oO8T*YUxxe@&65g(61}UDUZ4B+=_oz%&INz9uCM5N-#@
z`{a9eTt|+~WzEUV?k(BV8_~#_0ahc9ZdY9~L=<(y)VTWJ<2|yQUaYrV9$J)i12m`?
zZ+&E*efw<J=TX?CEgumaoQdTdYt*Ez8FAnM*SR|;M&?!H(<hVmRAjZVUryTN^YgEJ
zECXQNsIlbhD)r4*_K8>8(YdU$?a|{Tj*yf5<pYJ6yE|p1#UJ)ZymV1l)9#O`O4B!J
z9JO`kUT$kwz<$-@i15uN?Tx|Xp607{Mc+$Kli?I_J(Z8P-Bs*sJ<%4a)K}Ux%Ai}L
zqH4RsFO4Eu69b(DRNnq9N>P2by&@*ffhU+6X?0u9!QQIUralpkQ*4eO$`EmwD0W#>
zfC(uB%<2dI1Q~YJ^O3V^@T*-Q%(~!@urgB{J;jYw#o}r>Z*Q+$_^i^_=u_Gvtg%Z-
zOIm-t(w~-R9pfW6Xx-4&AGU-2^7w|nq?zNUFl(O0-&N?Fq>TvcJ(g%>#j8eX%YxQ+
z6>B_S(~DDCzj#CcvO4nj?$QU)(}SwoUT6pcu?s-HU98U+>9zCrioZt9KE45!lH2eR
z<!HN*YJaovvX&sTTNBUKld;R51HoqrwmGyW>!Fjm6aGy#UK&qVxXe=PBIkn7mPYHD
zLE|P1O-SJ6w=PglaboxJFH)Q^y&&R&{U}aA0bi4Anv6_=^8wBUtx&;M5tS6Domy(1
z{s*6h1T<@LZM8-{`dJaw=y#x~BKWZ>4J~6LAO0$cuy==Ey<~<O_n;T1{w_%P8l`YE
zWSFjs9Znlo@>dNc(d0Rr$DfagYYYydrHmYT%y)M#IO7(j27v<Fk1(v~m{@Z6=NFe}
z(}zlg%v%urLA@c+UVSk;I3xsodhd}IjTc=T^DUJ%3bi{6EcY7j)Y=~KdTE4(a^Iwa
z%wu1FExDDpnI&pyqosap`ci|;p3cpyv!tKd9}{Lf<tg~2IZ3cz?pDMZ^bE-630JFL
zt-dBB22ezS1N2M=DsKCpR@yc#P#cjN+zvg8BPiZw>p*snm2q~|+}lw4IO*vyas(49
z>9r`|m4!k;E@X8NoHD3)+pClT@rq@|JpEc)mT%T5GGzfl>_8!M5t}|2m20s(X2~`;
zMTg&w%f{&e5BTl4<%u^~U!XqT|2<GH04V;}@bQfL=J96lG-WVUQqDu$)<EM)w_%n{
zOYB0Z;prP18hSNh)Q0Yau8c)~HF&VaR+xH4Uq+!Yk4K?FP-0o6<;nu~sQm+V&qPR6
z;!_>#zN5Haf7gj$<PTekijyB8qPFesDCXGRl1;MgRbYK-o_x2}SvMDgnI4zL;uj-3
zKbCVC=0iLWT8bX?dOwbe`|KjR3M$ZtJO*Ag@->Y-hiZxsI+oUF6fL)xgJ3J~hkZkA
zCpp^KG%7>b=Ii71llo}n%L~2d%bGzu4SvNF>egR{u<tYmE##sF=+3Xj^jd8w2Gu|L
zpp*rprhMSQorIQnQ5qKeIE$yI$fzGSdGc<X4a6otq&RR{8F&rzRK8I)!6D%y=K4(N
z6}y(WMR;Iq2ynh+u_3bC{%Y#3ntA=7=DBFjU?PPLf9&4Xu9EI+6p<uB8i|}l7(S_5
zx4o;N`K59K=WjO)@BStQ1>t&(T(BWa&nh{QKBq&6+o|JxS8iaruQs7EYc8ZGXPdwI
zi_HN)p!WV{vCK=0d~c&OQy@;7QGEr@q&aA}_2;K5y#aC3msN83y6h@QCm2Jferq^C
zqrTTYAN}Ux!PyW)avLWWJ0BG(5zSdEbT^2_emrL!`FvzZBQBb*cz1^%*IP6^b^(=M
zHD{p#O)T--3s7aB{_V~?&P=ElZi+>TzDI3TmY4$ED#st#YEQPAy({it{F?&4$aPTg
z)XQ00eI*f7^qh^Lo@Z{~l~5Ic0_E0F9K4qkbOP@A)`Zkh{oQx_TpR!6VF2ExpgV5y
z{oQsF3=L^Ng#iklXF%16YkNHl1?k)QeN9`?7H$4~#Ppgs3$HIVw;Wg@qX^8VnIGt5
zrEw(JS1Z=))#U9puuE_GWxnoymB}1?i%Rbeo!-yW<C?+~#yZ$*qtyxjCkADA+nXW7
znZjWq>+|>4V?=6(c#)<noUkw(u!}q7b@V<cN@~pk9Lb0pptco<*RjBL)&KOu*|{m9
z`RM^N(Z-mmu{D&Z^3CX0psbSbZCOaujTUPfL3~#Uz0sQH8A2rx!Mv<KhhewB+di)r
z=O|NAvce6$B=?V#f@v<gjl7$mmWBUaz{eQfESTQN=Ag2PlhGl!8q8-DWY<jBI{B_q
zdM3kkkHiISFSp38MN4iLMo``aGx0?dK*ySNx&9N-1q6wSvp|)k@?qy%dS1@!zk&0&
zoG34!G+?oDm@d|Am;1Q~b4*a`30a^zI?|rpF;32{JErkVfV}hkY!}3ke7RlRex00k
z9XlQD`I*qa3uZM2brhxai-W(o3$1mkUGJc;JC&woN`YJ20V5?I3(2Wpvr$Z!>Zx%>
z!$tZ66^yaqJq>6=+TkhvKQ%22R6M0DjyTyNipYYbyg4Rk9VK&k>wxKg?*)8?2T{h#
z2ElRf{{5cV#T6)?n;lO9@Y>_y(Bt8aQa)-F3O9rQU<wbVjp<x-5&9oAFm`{CY;s?-
zSs*lsL}SuXy;u!JPqV~ilrE&cM!r-HzJSn83}nkX`Q{UESEl>pWLBL@s&5m|tv2#a
zS6g>I!e*{c$GYUtHm9>Yy1nY#+{HiH5Vd^<*sxf84hvXtCXS3J&b&01K_{q`_jb&&
zcwEcchj&afX+uH1jd&*oSRezkoZi^*HApTLk@Y9(@<$E}4h~)g5i>|yh*D#MwtY`6
z{QZM>ad(WP*h<i{>cxy4C4>d476DAEv|hJHnL{VY2RUZ;9e3PIt8oCdzIZ5^;g+9<
zrK&pBCkChZe!0*3&iuV`h&j{@uY<1;k*^Twn_e{VQf=#!>v%8a^6%Rgp05XU<k?ra
znJ=h!fU)I`gT5TSVVXf+18=2%0?(Zd!T;NSa3MChq!#r)*0_`_C&YKX^_7*O8$UVZ
z5A|m_{!7T^kby!X^TaTwF!|g#CUj%(R19B>+y_3;na2tPpZc+t2DgC1rH?XwP<VI_
zWMN(50M}r?h%#o@79?VrN}AYYU7yDp!gus=>w*ydVJd?shLed`{i^Ibxp6q-rNTDB
z*W=6G!dTFD$j61}&m|WKUPY3!T_QS#DAGx3`-#d__;-hFl2LmLyRT|^9f@}Utj+&v
z?`v%a9ysy`q)JS2p<QXu&=dj5b;ZXD!_-5N3NNFr1sjQ?d$gXdhIL<Dj===_<Q}1b
zUjOL9wM?rr6SY@{e2$i>-(n>4|8?XH6Y>J=A9EDP>oE^A69w#9J|EBo<>v0L|K`SD
zWYB>PMR|qbsGDz+9e5o2ciwGWeRROC2SjA^@$9H}P!A-fBj}_<2Y)Xn;o<}Y;>v`?
zDKomuSc8A2BDK<C#)=-Y-5GNBr*W`v-QElHc;-jRB8;$;s=IwS3f6b}J^I%9gTGa@
z(aho30n7+_jzMO1cw~8Wy-l&8{nWCq5XUz!S-w2iG@<zx8KQkS0B0%p`TeD<55~fL
ziiI#U%^Wer5uid>bIJ}~UbYGx7<y|Q3E;KahT+o~b*IsoviJLIgM}^BV96w4zR5a7
z0tR0#sk&W*phF(1?6tL@|2B^ObYbhGY0TmU_b?;v_m{c~dFypp7g*;vxVc_1zlSbK
z;iSLC9{J$Bf-J?7`5L)-vd9QVb@h;Mo&!392MpQ6sHjzB9dUwY`V@iYf~O6DmH@nv
zF8oG}mngn<_>ga{fXnQF*ml7E`wPHC&c&q0cMXZ?)Yn58zC=_si!2FHyNEh@K1Y=;
zj|MCy@3CD>AS8&#-GL>=n4(K0MyBxA04C%I#&OU>q4Zc{9G&g5dkK@bbI2kqu0jTS
zWsZyl=CI8`hXnj%MMEO&@<Ti>J`Z;K4DVFY6QA3SS#!U?LW3YY=>~?UKVBB}WCtWM
zKHKU6W{X1Jf>s&cH4@0;L2<RQOz8X}Z+jpSQ=o%FLw7=681qj3ATlRZ=XUE>9h94t
z@U59yS<&yd%@UwfB{k%MO)#VTJ3=jC9A*$Ac0zZyL#Xb_v3Cm)pBceb(PU@5cG76~
zVa(M@G@|~WFUOb)RIw=x4#XNG+k68%lHZUR_Ow*w;%xIB_+C0#*s~+_#JxU4-d2I!
zDH;kN;(O^HA-R8FEc%k%l6A_jihnL4!2^?nM>uxg8uHCq(01-yha`y()xzuRI8YrB
zTNwz3N(ll)x`Fu3RorhAxx3HH^XVon7<`YKE~7qr1SL+a*W2L}*WG{zd-Bc(%fJSn
zhn2Fxoqh;Vk*=?L{g^@bAob@XfDgzIc3~?~*mTF7pXhfsvy3A*k_pFQo^9K3?@NBr
z2f9Or?7>!J!>WOsPumOj@G0!}lULrTDe1%gD&i+6cO|vzBl=mkDS(Mo8obiXOs|!P
zx1mz%f$Mi=wiKN)gOl38JLpv*hW!<}7&<lfXS)we)le9Gmeu1y_N{>sx;#!s3-Clx
zi{jqdkgev&)DBu^6p;<eo;LHISY*f(e@Ob@sq(d{^IY>o+8oro)u1fExE_U(`~p9W
zd+R9fHF$r%Ws`5TX}EV$`JX5Pp{CX$B~a}DF|c%b!5p#Ueebow-y7LZQF;1YyU@I}
zdN^LwliG;%$MX3N=U+P?E>oM{apuOs?|4jGTwL4+lHq$XYz3!o9ggtT917z3*LQ!!
zE7tzK@Y)Wf=<w-R?*Jb_1@5xeNTx|*@Ey`EAkC+_XTHCKd9I<*6dY`i+aDm}`W1`~
zvaNfz&vB=CakRU=J|^YlE(!GJIP}*$h-pk<LOTXuE60L*Y)KYHcGxnq_fSa2Ga(<u
z0o#k|cde)EWenckPcsaHDXz?tC^L3t^;C8xdths%a0?DBJ32g4d-9<B#<)EA-{G5k
z>f>1o_3@bqS$SKD9RYU^2wJsB$QO!XEpnvlr@h9x&VYozE6M1)`;1AoWe;9E_0>DQ
z*RF)IqRW8g_9Zs-%0P^V`}H+?7Z%eTv6^1>RY}vrnGm$OA=lq_eL{E)Qam-y6I*lS
zxV>&}Zflxsn9yfK-d{Yos{hBcbr@zvAG~>@tQ!IaShMCb$@JM4JINlEnI?qoYpA1j
zx-iT1HtPFP?|#A5Wg_MDogi8MZI&M&<FIJ()eS8HRq;lkudN84I1c)=tDtbdt={Bu
znjl4qgDj474h3TtpD!&Evrs~WU{PlBtTyr`|ABi+e7Y+KpYqhwT0(+wq2U+XF`>=>
zvD$q!$=q<_mtG7+R_gQL3%&BS>On!xo!9^EVr`D-k|hKR_+Uo4t+Uf+KmtQQuZe;k
zdS!B!7**8+Gk0sqLAvqR=BStaGD}z1BS_kbXp>@6VZS6C`x?Yr88{8m%8>kP5*l(s
zD^?(;Cg(!78qNjO#KML|kUIQBLzmK{eoGzx0htB;m8!lLYqjpT@No55-8YC0W20(^
zN7@fLQH8Pv1qB48D&yvWP*Q(YvhvtTZR8iLaK|agybdcXxxN+nY7YMFHhli+YFS1-
zVsLc8G$mVC+AIREeJ6QL%;egqrY8Ao2FU$qXg(3z03%AeM(X-39I}@>n4#uL&K(|r
zoI3)rJ0`6F&+8~t<Mvl^A<!q3{d76gG<(Q0^u++7?EQ98?ybqQio(!eb5FdQ99Mhm
zz<bc<j#Nx{w0!+dFfIJIo5FwZs-v056_{Q~Nf%}{=%HTgA=me1S9Y=_(=>9(XD4+6
zAF3ntN5~FBsX~~K@Fu0NEF~a5-qzilFST^2bv0ALxV(oCkGMDM0Q*%~p0oz1&J4}l
zPcn1(beo61@G~4R)hsCtDtHr~(Bg&lj=0sqsCV#y0>K1eKfk{m3rrvp@dY;<^sNMq
zTv>#_9SK!^V&LBBgw+p=+%_Y8@1WQrQu}B1JZ^01a9OrFB?-_z%fRX<mFAAr&Hii1
zs(Zj~sXU3+vHcS86`5=t#-3kR9nPc`1Q-8rQZvJZnxfqeS69=dJ_Z;x!6}&c`yRV<
z5`=U-MlNCkAK=wTB9eY&;wE?@cpxK(bV0);hA&i<W|$y5_6J3jAeLxskYIwp{*=KM
ztxyKzK{i3%rt~AIRu%N|gm9x9MG5>vnn6ZWeSm~0!g?zsN`||np}p`|CeZb`fzwS>
zbK!9J(l7Dt59v=4slmka@bhEu?myp;N7NuJ3)gGuQSTGmkVHL}PC4V)xd|T&NF{+{
zLMg<l(bzpm_4pU-3%C(_^MBhEyqgFB%cUpZlEV~{v%tWFI867nNS|X}15s4<+Iqgc
z-JnU4-Ko1M*L(0O3KWMtR%;G6xw-;gD-Le5@5$1kuof3kp&S%kYpdde7r~{IoMrN4
z4`6gRdbcM}o{TOS7U~21^fCxwi&RupJTai5@^nXbA~wzw4T4iFpaRMRhR=-?1Hv#{
z`Mja)klPtLGa|8Fo?sLBp*69UFc4p%iz)@%OrG2r#&c`%B;5+g`#vGdfy5=7JOSY(
z&-=&<lBvh|`jmKuse^a#m=c~R4v%I5|A4~N!{cWjT$RXVFY<Als<iemr0XJwoSCLT
z;KWM-#%B3gS9*foFCJ_Cp1r76E#;?*M6s?@fyxm7zrli{Q2Xx>=GDTCF4ZhMRehBl
zSq)|^DMIquh438Z18ZiM%Kzp99Jm9+uZi5%2Cj5$5i0AR1nx><bdB2f8G~&zBT7S#
z;u`K>HgAq8de|b+Oi2u2!YuAj9j+)AV2Qaiv(yxSX@-QcdU)(-7i66w$NLDjgiE@C
z5{!yX;^25CHS;!x2$CKw*6!)?Fb8gb9B|p_0@VWok5@5XpDAf0i~#)e`^QZ@w5&4V
z@9%`c8mY_?9eg#vDJH?8&%n%~0e}<0Te}(ehnW<Rh06dqMGe72Ah2gON{uWwjC4Dq
z`y;usU77;v6U-iqSPi<s>P0j%y#x&Mv1fg+N|Y`}d_JjxPhDXGvMs<h8OT}vSe^(g
z$*a?#BzNy2t~T<V@Xp&epcA796b_T*tShA^%6{K%g<y4o+Q`(*Vqj}DH}EUMI5vkO
zYJ`I`pk)^ACp7r2B8OoVZ0BsCsZ?s?_+x!&X=&&2IU6i!a7{~mQ#b<3MQkd8Q0dCy
z=LbKp&LLLcQP>uc9a_omV!FU;HV+v_kHZ;Um3=jU9F-6o=3uSM2(@Fca_H}!4Yy!Z
z>#pY2e1(IV>!nA^Cj7RqfL-Tc-0C@sn<?|)ut1N_LL>M4dz&xP>jg)_aPaVJJf16y
z!exx1>ZxnUk<bhrl-@cDuWbsA#uA%6EfKb^u=Ln4F;zMoxkKEShj*e7;Rvy5Gri3-
zmjLP8|0T(JP)5$&ss`$o0VjsB<UoP?(WfMX&`;EK4-+bg5+~V~4-nvFWuOJr9Iq1o
zJy{5LIYu;T-2YxBRk{&*b>=mh7J{dR*gV`9IuvhI_#)%40;b@0U+3ONTt~2r4d9OG
z4@xp;J~Urw8nRF0<$k`qjyJ*8-FSDDu51B7_}-dDa%|30&Da%WHj%L<x7iQ5PYNe+
z9w^0TM}4|5t8RKq_tu-D!|vYhuhr=n!t0xG^q?k8i;>)>&3p80l|KhPdi;Hav@*?4
z_M(gu#>!astek_u=?NZvw=qpRw#eVJJ>cn62~;a{aL`CVHnc(FrR5Ma^lFZE`JU0=
zzs3}450hnBY#t7Yh={!k7g`g$Qgv*e&){_zq(Uv0T>_B2JZBxErk)?qQnYG<f!b3z
zJZjF#-IR=@cuz)XXZp1{YI@^_enc1Up5QQ9{M8#9CNdMyCA5gpF%Ap9cYg~!t3c)E
zAy$7Srm-IW)PXbGw?K7Rs#hZt=jEr9v23cRk_KCp4YFV{<>2Rfvj}7`M>Z<>Y(7)C
z1Bhuh1r97501_P-EEbVxJ2-f8v_*gc&W<ZfswKAi{e9=6aK2;Zs150Kuft6h&}g!z
zs_{Qxj<#@#THWh#qj=BLa$_?;7$0oTg%pQ1&VwH)wF(oZ=hN_2R~C6E@>C1d{z&x-
zMQ2V4PzqNTfjaA9Z-pZS25(Jw0<cF}&}nyZ$WA!7jAJ6#pufq1<Bv^sfD80WR2sZW
zA6p5LeNpdYRT}iSI}`b|7@@;BKONj-;fNv52Oq6%7xvBO;vB2RhlH5WWsO|>HYgfN
z*bKoLQmZg)HSSv+3GIgd;TV&K8|Mjpj5Wbw-u}5mRxbq^PwrSh=+7v>l4sNppvORj
zBpx{A0y3Hgr#DQ$DOzXQ$+jC4;G*9Y;6WQe>f#8D>wKc2lJ<Lv@!wDrg0NUiK<mKT
z-V8aom5!<BDt-9}U5I<)U&Ww3pw`<W$KYf?qRu<07)0!E8eV9E5Nj8QI(HPc9}Eul
z@R8@uru;EvnRUau@aTl+c}iOv<{;Cn&5`?2e0W^PtfrdbM$tfnG*7psmDvAkUX78G
zR2okcyR>acl)!{;Mwh57RU_fm$!?;6;xR3OHFHS($VBo3H8x$L{p8r5n<5AI4_Ota
z@GtTtN^3uzCk7mWdgS>Id2CszA&@X=RT#!=7r+1uw20MX&%~^jEOk;Egs=j&_8Kz?
zcfm+4!@{8fYHB>Ps^m8qown+9_qUy1YnBi;j7*PWxO#tArA)kSk*+<^V#<}FT(l1J
znGKPJzDHNe*VyW7RIjA64QlDT<gTOYE=gGkRdz7>hT4`Wj)c6YCt|o|lupswK`+KU
zAg8CSs{a-av<#YIj$<3Wh%W;C7bQ9^b6^KYkcbl=^XW`FKpU*dTJqB9?D_y=g(P8I
zuV<NgqaG_s>qT@0_h4BnhojowMbNMf=F&#P1rexi_x161s%Q}kA^M~WT$NQQPOU>q
zK)bXG`91b_I#p$;_)9@Oy%}<xXYXU8k1Pp-9@H|c$%9tk=o}2@O0&eaZ4_rxT2x#c
zx|*&p>bY~Xe8{vNL7-xAycy~6TeL;Z@~MJ*P5e=6q@c;Y4u7I)*Bs;AhOpbi?uYOl
zW99DCNc8FuNF6woLnRAfhavAe9lBr6dk?hM+qN-?-pIo?2S4DBQFxp%;lETjrHtAJ
z6-N(guH$h2H{<{iW7XPEtfB##=15JCU^#H)wCl>r$AU=HGv$*%i$Y)J;mgpHl}kqe
z3xYc&<q6WQa&ALaiUaIqym4aNYsFwL^42%>Ow+Yb9gMTUj(yX_!hJ!P%7ZT8tlUIY
zjILJx!b=lDh{_z0!RS@aCC^TGVCl14m_t3Eswn7Vx=B!@bw8S7+Cy~uL;(FgSFT?g
z(XSfz{lb0~e(8q0RCWFWYe3Mio6t+OU7CY3HKy<&u9p;00WdG`l%t++gF$`mnDu@H
zy{MRv;BXN0T3+(PQ@BQuE)G%r)SK?myImVO8y$4A#1=2cESgp)*Y;{EmF`vdS5Vn*
z^7h#`<$6C&#BwPiTWgQ@>sv}yBJ_ve2E{<gy8OiUPj;sOUGWkW)W<YGMbltxs-BV|
zrwUUY>{Ax;0+4;xQMvNo@I2H5sY+arI76ewch|bME!ThxY`RO;J_=GgaEXsVNPvp>
z9TD805ro@v^uSmk^n^eff$$W(4poei==pGa{J0qyrtVI-0hZtF2kL4s5`odLM4YPL
zVvpz0CMQav2XfChyATns!vXbNd*V<f?hR2c<bIXp5{-$aW4T}^s^)+b;$GmyzYiLO
z<$r8F*|@)xa4P%+S?4xNY~cB=;+hPNjG}=c)uE#~H>JNRr4DCZv$0&IASf`IN|oE^
zSnfNRh^+M?yc~tBl%eXjU|7^maLekD{wi`HAt`p$*XD>lm<~LC2K@D{Vy<8R7e8}E
ztBZI=Z5(rZ&p8^&mk5ak2V!||OeKOk!f_8E`I=$@hH(ct0PB#H*>RA4vWR`eFI96R
zpv3{JeiYMU*c_D2YC&?#cs^>Lw@!b%2bq^c{jn#i&536dKcX2oD-N|gl)|d}c2ezN
zHvF_F&`wT7{7jfI6DsXYv5-UBM<FtfpJ+Y>@cLHaJ)IE_J`NaKviyp}k7&Qz<qkax
zra)AL3^AW@Bf7x%oqCM|wE;4MyoRp0?ucFJ_+5SI)!zYD(U`ugK~|Km2zwPQWN#Nf
z39`x>ebSww8q$NUc;q&OdLL$9Y1*_PtAn^3So>W_^v%mpq=%i$RLy}kyd4rAZ+L0L
zE)EeOo_8f7N~aJm?&G;}Gbem!W$ZudqtcxS)3^?Cb+&egfSTsJ`H5CY=Okt}u#?BO
zX<C)&lc#e%EzsUm4|rDC`YJ(O1TJWvNE1+)5D!h{`Bjif8CRXsTf3Zq!dX7({<|}e
z+nw&bVHeu4EGjIE#PNBYWlxJ2&|jLBZ-IL%5%fbEhvz_eT%Fgp&D+4!&6;Tc&FRG{
zw3XA(@OsiZ<EZ!Jd^|o8kBFFea2>QQ?!B};KRBXdLb8=)n%z*gi&-&u<)JNz5uTM>
zT7L3dcx~+ht@xAs^*hh(g@3VoiWoYevI>lrnO87e!xia?n58{{e=6_4=*Fxut)2x<
zJqRT&inOc+UQ;NIgf8-}I2qVo_U*1OP9ahubj<5?9cJ&wl`E|z40qOfdsEcnx7E|=
zZnDkes&O^!<9x2r!849QD|H(gV}uS5-N0@^B1!OCKqcfP9h}+#TbBEunFtSGo70nH
zo$QKUJAv0|sWW<C8Co(VC{Pb;v<{;pGOq2jw>?CMK=0Qb7Nxan`UX|S*2x_{`ju5D
zKPb++@(aiuxK7J0?GY_Gi9=!HOQt~VZQ_Lx0p!Hqb3z$v&u{;H?oIorxZVQAi!7fH
zXf7a-afLlh+pG!cOYK|GyItu&vvHIM#6!GMb9>5e;?$%LpQu^ahx%0T#`#}x_H^oc
z>5~yRP1t0brJQnE+2Ug2V*bHVA)^|CK3ab?7doHNn(iAwTuRCwa2?_6t@anxo>>SF
zyuYrGQj@&iv?7YxszM_JPQez=x^m}d6HSRFR*-WWk_3Ev>r!hiL>5$!6aR9>>`c>v
z39l&>o_S?Dat@fD@D)frEM1#gQ7v$4^8<xZI7}hxt<p|5(MC?<)U5~)4mNDBRD6ds
z{h}U#$(p9hY3WhFRR33<V>YZd!W~Ce7+Veqh0Q_wv5-=#j%G6lyGwC^`7^03pqJhJ
z-qnBO?FTDyVvJWn%{j}w%NXDJ$wE;vTT;|`iD2vZD4-eQHqELBOx$6l5}s>kjY}l&
zD*D9X3@9B(oZ29^hC$5bFHS{gOBm(J9@~$=sYJIIq@Xo%;i$wcw<bhytRI@#s{GFo
zB?@VP931UwGF5~$gI1?tV$!T!w8qk`(0E9e8EO^iZ7y#b|K;H(^;!TIW^3|^pR?0%
zy)1Dg;PxKJXBkKR)Y_+-)~ip&U4(|QZ>5m_W#GX$ETqiD?sWPEWYM(U28>$66~2hs
z%!`&*1|6eu%f-5hr@}5<2a$u3DA98jZq=y*TdA}rjv&_-@1Gk(^_|T*5z;-qe%uZR
ziaBd@w8~v_j%MfIAA+1l_Ll&jqZ*>%YvA+>=fyb@FV?fk#)%tEI&ww=&;;S*v8pLA
z-?lGZ{|s9hXXI7N4t(4PH`Ot+`lptys_NchY)h2(lSgkuyl@S@%aB(Ios>tY9S?2{
z@X*dAmK6?{M0XWjWtnk(^pU*5zR&UgTHLYKVB)bd5I1>Jz>2G2^{F4&un+!E0{A-d
z<6Kngq^aZ+rV+y<AQe%S1!0(Qm=5f}Q`=`BJJrI^zm`|V9c^nPRt;ov))-9)DTSlR
zqNvchO|I{QTrDDUu|r#@ISny&TQSee(fDb}5rk~!oEijXnPitXZFh?olO^8k({l5y
zL+){}Lx48l>%k*^fi}^@U4GiJ5+H|y<q^hin%?^M16+M=I5{-erUR$BfSx7(>_Tk%
z{8XFLdZTzEc4In|^9kT$#Oav+c!5hmk1Z6q|NTlG3%9XVN&1UF&tT7xu`=f9Vcts|
zA`sWp1@A7_b%vRp33+}B<$p!(gzj>HUN&(?>yZ}<x5^p3_a9k3$Ex_=^HU*VPYv_t
zKow=ZJbDIQyOuvi9e6bku;>*O*>XXEjQ?9;&(a}hcv|+DMcy~i@G$MQWra-(VtFzY
zIBALm-cAomv@FCA`k)I!*K$b%Eo{2eZlWhgq2MTHT|qR;^00ase3KQGC@apqg4^ne
z3mm;d8++7`5y}z<t*kiwZ4fi>;A17I>i40>GFu<0{Djw+truu`#Vm>4@?l8Yw|fns
zXByvquonfcdK!v+-j0@tgfZ1?!=mZvkt<$dkH@_8qy<d6Y$AhKBT;(HZlWrFpj@9p
zTn81S=IcJmmMGIB!+1!$kAD{%_1_YIX-*B!rvir(YVeed+v908q{ql=s4_?zRDd<`
zL?rXx-$T5{;$Q^gG2h|<6Tl*x5<En_(na3KH%%5jU~K~WB%R!`)dVoW?;NP}0x72#
zFwU|o$ly6dYE@j{0cMhRi}x(k*uP)`oZH}>K?2##FU6|*S@>*hH9}Bv@Ep}!`meA5
zd5jP~md=PfFfEVE#j{Nyk71VQV+a6?iW+rZ034P<;OKd<*wuoagHa2|`=!{DD3Fc?
zU!%ISgF|p<iLTQG7nMTkR@@4bqZ?O^0Mt6@`AtBPU`D3Aq4<}DFfJp)p|6Q|%#VWm
zzl_R5NDH3jOX0P$5UZ;G*^1asVS*)EMQc#Y+W|Prm4$3K6R&fVOlZ)r6kI~7dT)!d
zoy5gf3{Hx(L;{Za>PxPWO(6m>@JC<_NUFwKMw<?)0^V(Cw7wd&H^pgUb_8~sD3{Ur
zXAv8h&=*v(+Gi<!Cd9a)Xq@0JVj|#$B?bakurA`-Ges>>d|1;HN_=55GU4%!!Po=2
zH$*UlsjZ=GonD#y%Ykc#=;sNH;3BpJ)GEk78N566<?%(7GHVJCm?<Ixb7i4yU`+W`
zIriQL(R4@JbRE6QL>nG9flQk?1oSj0^;m#5q5pD%Wbeb2lcLQ><$moafvi8}fb3B&
zJQpc6vB${gp$*=fh{QygL%wknoumR`+NxJMr9aOE{c9?~tUnCTdAJgfb`tSH-p%s`
zhw-yZupg8q)`U!Y17!G4qCJ(rKqI>)(@Iz_SXo{Gbi{*xQ8!8lOoTAI1qmT-fa3bY
zFg7Jb(30UIV#|dI_hQXhcj`E1p}Xtnw8HFZBd@M)DcgtZANT#e!fNB<$W4!q7!b=`
z6TnyrHo+sI6?f1FnjVYTD9ZQ|euVTZ2Sx0Z{O~myYPs!_DLsljCsx2kVp)d+NHo9b
z@;Iu<+INQN=p(-}{oapQ+8vz;%dGu~$1+K{6d~GbI8FVWDx5&jy-Gfog2~?jD(ecs
z1+P~Xp%=D}qaa3jbURuamYqle5t%S$R~Er~V00zb7IKMAP31HXnd=W_8tyu^!)N$|
z0^%uaXSMg%_~{=82;aQbzS}_UKfKdaZmz(oL8V31bYs&^=rPoK8HH24?+&rPIux+q
zzz9-<4`p4%1tlz$?()UCwhfXke-a5$^VBD2^8ZMo>G^mW6H;*k(Z8b5C)N1q0p%#f
zS+J=hJb|cTkP%yjk|6Qg0IKX-g#r?&QxEZGgy$%OtbsBJ$=_5x>aQyVp79S|ikJ-u
zguM}evDi?V@FG(UqoG69AWSilMV)1ddD<GuA;@vRQlKw4w=(Hfu`JhNwnO%lEopCK
z_f4I#Cdh~-;6M4<lL;z83Y$bWKDo5DT5#MsXZ6wd7Z^H;J<=15nIy7JZ~V5rHR1PI
zilv;p(-$@tt`r~L?9KgL#9hqocQEm^@w=6NxYMWAvqLtbqQv{?`W3eQr<HTTVev{F
z{W?cSDk#u0bo(Hm$S@A9!H6y6c<BD%`bM*ch6aaqb=!js1*X_z{KScidiw12tp6Si
zr$0pkt3V2-S9>?iVyv)G%h()fBvja6A8aLc6X0FeW;iG{&X_sVuze=;L%_+&iEYoF
zTQa9Q-EjQ>E?;W$k@R_oan`#QF6v?uo}z8p`^4)RGH04$U6dd%_@)Yc2{s1&6s-Ak
zFIo;1>~REHc7mO22gg6U2{=|(H9wIy8+@LE9|y*7+ndg7RSOe7`ww|ZKzP#TNsxRa
zezT(H@L#tcT$2{*>+8$*<*SAJTy1^^8h))met8cmnN(bpd#xQ~s4~@qiHs<2`*kRN
z?MbyQgK^BVIrxzjQ*!juTm(wcx#c>YFY=ik*pve|243@NS?konS+a3aX(<7UEcR35
z5)RRsGcGg5cjyWBr`Vt2=mDoSFf*%a?s6Ht3s%S9ZJmBqv+KtXi4$WOy98=5sj*FO
zy<YL|{joJOAIJ{k7wGDAqQ2md;owk8$7kh2aC$YG7mnl((_OxL-8yg7#blt*y#qT-
z;SWe-Hr7@BS6qkuK$4pgjYwR@UbS}ZZ46o#UOr6M>^qQ6Jyd(y9K6C;cAhJ1^5B>2
z&48VfGw(z8uXpNH>?I?nc$O@HorOinUn}OO=nP)qZ;OzJWRV46?N6{WA^*(#8ALcf
zg7su`s8|SG@6%kl&4a%&aw?Xs^-U)%LKJ+ea5$f?*}G$F2$Q+q3nOQJ6!bs4-r0Kw
zA#<rp<QFJS;OHU!qTUwV8ONmO(7^ElYPf>E3Pfun&^vsQT8103((C2_jx5u^1VUh*
z_`9;;CS>uAntcP4*mioZ3Mh$Yj&YDA34=NC7CpC|8gyXffb7D}eBgURdGHf(tEtXR
zX*UZM9vySolB4)EMePwAqRWvcE!;@MKl%;-AB#F2Vdt)EvOkJh88WSjuBi2i+e~J%
zq1@~a<r7v08S%W$6Z^vIFAd(oei9V*$3!+VS{xqd4NQ*G8Wm=rMx41m0dOofRGOeR
z$U))0FYM^h6ZZ+2YX&hWSq5un@+zJXITDT-cJ~D$glHf)BzDK<!0X83G=8bFH&uA>
z?pSYg;GlKu9Y>%H0f(+ED#u~|J5u&?Ji`@tfDRILjER%V$^Zf4Ls5|j93Qu0yIl4E
zZt%Uc-0a_60CY7~<m0vJ0JGb1*6Kkfl7~{9s~X=5K?$=;Z-|{={X=$<&q-yB#*~=3
zaTjOHkfU>l9|b|k`_;gIC~`uf=>y2`1eEg2YV?^a4>5OL8p)Im;s$pX_33>mE4u?O
zmvR33p+|5O^iI$f?us~hWk#!9uRRXmoy75u@4lfT$Nj4qN=I*rH-jv~cAwn#A<uA;
z2-S%IR;A#RP=1y)%Yhe*#>_C`<-<R=Hng<l2zh97Ac@4vK=2WTaWLM;UyOOszn^z7
z8+Q$20(4KukYNSzi0<G(-n66GoXYGNK_)CVTz6M5>WIXodtXo>Zf*vi6cH&c&=qn$
zZTtE`i;RU$d4x(rQc@B%^}H|r>F0M;4(E<I1h%%eUWxpU6>Su5fQQn(Id3)6T*#oE
z4n60~QX1@G{uIElY~W``?Jz-C$`b(WnG=5o6&a(?s~D>~3KZcfZc~EFy;DT(kyK_u
zPP(FS9{0)+m*R#Y#yox-+U-`Do8eZY1Yk<Y7V%s!H8DFlD0=Hd&1Zl7NdtSB-J8GA
z(UJ>IJ9AVW)ZR`SY@Dt<C2Ap|ugOTmZrY)8;t6sG5mHfE*9Q)(s5$yu>na#X0a4W&
zwCTNt{o|lCaxKvcY}X^esNxWbLwi?QoIQ9)R|o>h3M4WhuVDb#6ZcaLTqJQB2<xWK
zli8N}dlWUse9J{uOs5trumkFo6cC<<!E!j&2d+J@!3B`uGK@_q=osQ@4jVwa^t$X1
zb-JuzG@lIQekd%w<*FpTWc%zBTT08y(AItv0xF*am|x-Wge&2EXUv}c79J=H*A|mW
zZ34MvB_*B&Q^SbA1#;rzac#%~?fY}?TqQge)EB)fD=WDcwiB7dfjAY2uX6CzJ_=%S
z)IMqUgEiQ+ZiqozQ47k8JiZtC<OApsiy*Hz`mxl};Yv<U&Q2d`ae{adCngfAL$PG^
z(dHe4moQQiYEqeaT8s(5f$@uoMI`N}q^_?;-I|Ar<2bErZf?%@jTRjo!Z6I@A3KeB
z{nG!Moz#@8gO3rqe23UY=I-tP{+Jf)zh&Vang5Q%z|HyZIQ(}U22KL+-~Szl|Bl0d
z$KgLGIdBI4bCLt=@Sj!u&no_B75}q}|G%(`7r6&pa~_0=HT9iMnYen`Fc+82_Z_zx
zo;~Mmo_}D|s*(KZuO^*HO*GsVpk}dQg}D49yWI%~w~Dw6%O&uyJ?9eeP|!t-wNq&R
z#%#VBdKWr=y-d3{)#-|zQ?j;^PmFKhnTNU74!Q3i7^QR#(p6wK+#E{Y{XhS@K*W;o
zbYeMJYDDysM{_QemR1rgkeU_(#D0Ie?&Z;)kt$%SEG4N2OVUS5O)my|tpJ77fv;4-
zsf`Ekl%Ux90SJaNR1_KJ^mtUSW>FDQf%nn$H&ay?=D(ESQIJ8N7W?P3QVDGaHPj>i
zcRj)}?BTYcLG2a*!gkFZLJ?vXuln!T1B*ZK@Bh~0|Ksxzr4b;;Fzdw#`$Ik0<a;-m
z-8Cq9iY5XIy+a~vhKJE4rwrZUuiz9Kpg6t0D=ydM`%kpgWm1KMIPWM=8=%_74~jHu
ztfoHIL`WlswsR3FZ79ih=38DngMKM<(A1}CcY&M^a&B=$DXzpVV$y*)LlkBd-$Aiz
zbc<*GJ{60lup-6s^n9Q&nttyFsWeoe(Gzn!M%F_iLYTzb&^Rf%wuL(HA#~IUp_{{D
z$)t}!G-9w6L$q|zbP)4%mZYgSf$AviXc=9lu4Srsf3gJs2HjPTof?U!P7p%@Rl@*q
zUa5-~eKEuohJ0^ye(mq-=LR;IFsTxG;M9RUXy$aduxmmm8kngf|EUwr|EodySqFwS
zwOpbJ&Xwq)Xfw}~uCGF!Tk6yKsZr*&nfQ(Q)MFpGzB4Ehu<;B@Q%xcr0@s%&rZlN`
zbQVgYbDJ2eJ(+6B%FRD9u*L$-il*Nx!8ACEb*H9B>c0RlNQOw?)XAf*t=;(k_X^&9
z1b&R}tYaumT^K(jYQF_ki67_0(N7?`C=w|nq6s+4?O%2|#FySior4qy_oI-538cQn
z3pc<w-{W3)=sireB4Tq;+Z(s9iW}BZ)|T?kd3g=`+OyFe@L2UxJ*q!hSOsF5Qfd5-
z<#mQ(Q*oS_%hc?R2F3T!%&Mqqm3Ul13csziqe(c=WJ=_$OrPzF{@SJNs6%NkSD?NU
zwo<a<<X);quzH?PwBNl9wJgG?!2xY$v5Cf1NAe%iT^Nsj0IL4pAm=W}5RULdYZR##
zv6FumM3|OL;A27$qE<nogVY~IGAB7`s$YeQyRyf>#gDQpV4{890CZdB7?moFI*Hf7
z=HNHbvv$bG2t(`~!rHi`+YK(#E~<;*)Ch#<-jQ4mLbI+FXu#-qwu#0N#E%aMrG{iF
zb)k|d3homrFa(JG>l~hn&?!GlEf~%}z_vROW`>Hu06hW-xFS}&DDE}Y21&4oP4ac2
z))9M^q=eY*=qP!5yqQSY(I>yWr)o}+N=RW{#UD)SHb~s4_@akm{LD3rQKLK>4}ud_
z0nmxC)Y9Ph35iUj6EdnDl}~}vtFt7-3#p@b6I3z_XK9i)3OJwxG_?cux2d}rH4S2n
zQ=yKPL81#aI%nsB06<5Enm?(SNhD+}mpcx@5$Gxfi2d6`DRDWXc$A~bN5KBsSbB-I
zbr8vu$36as(v{bO_K=ul@UxQgOe+(6Mi!Az9@k9W3q~W(bNo?3lfvy<jkZ?e=2OpF
zI|wsJP{epc=Y~WPT@6Pu#Tu9e<&AyOM|lUcXbh+)2hs|}uz(o%Qp<moqR=$7hj&L#
zfeelrSa}n!Nnz6^m*lTT0|NC2vpHyfucgMh!jzwDd{`w0fj$zks@Rrs&1mZgw=O3|
z4=`eQj3+AlV8mk`dWqT(?q_rpR)XM4)DLQ(MOECDnw+6S0cDWogLYvfXn&Cti0g*W
zE&F)8bA&D4RHfO?Pe|cb4be798Upnrf2@BG$hdcQooU=#P`7M<lz$#rjXy?qg`=6{
zUJ|N(o!4YgEr|y4td`6o5w}?xXq+yX5UzN_8;u(QVwmt*O5M))zji>F@hF-|W<cS9
z^bV+#1ucV$D70LT`bXN3VT{Mp86Amc2CZecqnDr`s?a8L7ao<mn}|MRP#)W+(MPgF
zG!-NHxh%@0swNekL0A{EN>Fq`L3AZ7;4`zNDkbWA&KF`*t#H;1$aInr4wYi48<I$`
z?(s{1pU}k+wQ+3T3AQ2qrJ9#}?a*cAicgY6rPm5V*SGMq>Wp-Lm1=ZAc7FG<<zT=%
z*@fCj=l)b0uh9%OPBsiQXX37lAo-Lv*zqxo1JI~hLo%Jvxbez8(_#@I_HX+~FlcW0
zc~@tO7fRO>w{ZugWJsjZ8`U`CQdywptvahCXxEwGJbRGfC1caQ`iyc8ctEzSuGA<Z
z8^js&#-Kpc8m-7Mm}a|y^@h3~H3$gkM`&4<2w_^!4sL&+1qcIUS-(wSWCer{9OrC+
zo(Yxl>sR~r@R~9(K6wQ-OBxoy)Mb(g#q?58$Vx{R-9e?1;}5G%8?e2_0o)^#Belk&
zh<}$^j$tC-Vf=AQc2O(b8L{U;0~bdlTjj%Fzx`Qi;qC|duzj=WVmnVgO?_$DGnJ+)
zPzOGMDbC6Ofht-rgJT&^4Lfz9x3W32A$U_3uFE)@JR&QIPd5cuoeUdM-NCG1e)eCg
zjMbm0<T}oI1NBo2lv0mk_jr;uWGHBU_ID!KQ2m&GNN)-x4BtafEvE2KIJbLepot(D
z(6US%2L;Dsj&l*oTA}1GVQ>`;uEn{~I^-Z?7bX`goUIe3$0q6XQxzawQ8eOO$S_Z7
zFU_Gg>5rCU9FwB=@aW1OfBZgRcN9e&@|XPP0-%OxH6NUf4D^WbdUjBO%)Ab10nA{I
z&EsA*JH3#4o~c)y)FP=>i3s+axI|gRh@|!G_b4~c5y@W-WAdU2Brs#uM}g36V3XEw
z_SnwQ{V&mILT&R~&GR;n3P5i=g+G+GDE}j*iYGg;^{O)ZZjHV00n^S&6XOhw2(5-P
zkjvUH>+~+bk*41G(x)bOFoCunIv=J=h&yO!_9K?TO}IhUo@`x#2|frvYK|M)WJJ*I
zUeykbvszH{CO7;(2Okfov0;Lo;6GHu6WcSX+l6FLyC5(H*BzDTK=KRZ-El5FsIZMt
ztDx?gNtuKkH1j_oKs)5Y&qQv7K-C*Eh@@Ty_ciEZJzc^J=OEqgLC?W{k5O2Pz7CLS
z(97|b3ffcsVB&l9W9U%p8b|=^;DWNTvccI+NUi!YpSYfC=U^_hV+_|(Fn_Yqui;B9
z3Lm2uaA2H&W@Tl`MO^?ROW?IxljClL8e{E*a5xktY_7sc3f7tA^oskLQ3sZ(YY~Dd
zUZ)IB1z9}wzJax;+Q|8RF77VQgrN(T*ZO1LJbK5~5XEI><l6s;_J;1BP&lYjj>-w(
zBv6yRpthu8{$hl5MByY6k^JCVneE-jj`~=tl8Ok6x_3!gYKq$LgBQ8=_0N1t7$dU_
zFc1_SJZ#8qQ6KCYFgWvtes9eN_CR7>mQU+SqOce%yu=bGcHk?rVnFumX%M0xkNDpo
z&lI=hFUBnAL0{k4L$qZWW~=bvV)=i+{(rR|WxGMNCAJ93%z%4fftYTr9O+yHWesN*
zyO5(J!51Dlz+3%DE%=mTrF9_1kramoU3(l$14t+Gul?vqR++kp5jG`M#-Z^&m-KB(
z+#Z<-g&SmG$OoXsU%NFC?WZXkZ}hVL(C@wkk*-;CyL&_p5s5*N56LF=BxQUYB+PIO
z#pc;KfLf_Q;U_q$2xauqV>63e_cb*cjSIC+I$T>{9A_F#nP1B=Zm+;}^MD~=PU<}{
zGDM;uWGsbXxON}H=Vqgsm9%z9?ID9=iMI%Ui7QR?Bx+tJ27YpXXGDZWKO~Oah;vK9
z8S(K*E|iQEQN^iKiD<tTU}77aYawdSp@@YiXkL9~^?TS6Ub9GlF8Yw9@H-q9k=<iY
zR7=Ea<N4?_Sk%rM1y5^ct|;RLvnW{kE8=vms10H|%C^9a4uA>|+J2UuaAue^apY(e
z7GpnlQ67ZOl+o*dJK=AaAVso!lc;Lw4w3*v1D`OP{t{SkHSp$H)IUS!fYcv+5aoth
zKy|5u8ch(Ra(5tG>cD^3LhMzQQUfs0NGEy!<3n4MNqkwa;URRrog>*eMAR_@YWX@6
zJ$60)=Uhr(Vy4<rOanD27Mmo{Lory~$0!AEl}JLaEXt{A=S)gx#W>l5juee)%&d%w
zXq!g&#VT>bZnfo1s*8Xq>AXCIb0JAmbI?HRL9^0sI=SPwJ?LKBk#Wdz%1;<pKfD`@
zjqIA&Uj@M<V>D=b(eWb9CbUYEzX*UeH_D!e#zPobcNS0W`B>gv%3J6lW1^xrNhQHH
z(W{BYH{1`!T*?PVMrg3<ua@gyNDAo`qO*8hd@vTLy(U<Jxb_^1J$onx&55BN06I%-
zk`_lcaP&b_@y%?{)q#1Wuro%Kk14iCa{r*TY8xFE5b7<k3W11$q|kd!ftupaGJ)T3
zX|)BBwGefgQ9~%3Lp{MW)}QXSO$SeQ6&=VJBRp<T+H(7wEXp-3Ue7ohDsBd>;w?@%
zhXsW>bL!MJGxvcn4Sm{$Kzv^qZgFldS_Vp38PH&%3ASoYe#rRAEU+@b)$>DNhpDSk
z@gBgAp?M_kGVtU)x+utR{g`xI|6<(ood6)lox!AQd-4*HzS5&ihM)}U)hF$!gK59t
zCDH`ggWH=3knxx9k7BXgDHy>+mHYRQ_y^dbt}N;UZS5szS4wT_M+zV<c~P)5WY<WI
zFzj0#ltVbI*2E4a>P9u}t3n?pW!d==I&yUFB#pRp(nd_zya9d47rBjluW<YUrWE{y
zi7OntBP<A+EP`kSUaJLNc5o&ANL~veBZ-ufN<ujdNRxL8f;m#0MQ)~qt`lW=SJDZf
zE-gYVupVI++N3cGu|V{|){T<u-U!)dKLSRmQ+YM=C4yfm!^R*fH;S3bqI~N5lhNHv
zdS9gfiFmRDidlc5iA9M75jJsQL+_9nA~j-zN1AfF<4zUH>hFHx^4k^aHklhU8!kbM
zH#x7RFsw{C*8$PzxMs=&n&zO%GQl#Z#OoSFbxDCI4jX9>+eCs-3b3TacqZ`|Hm4Pu
zIV8p?QNpc8u4*F%@eD$LUc?|RJOV3g141O_$>h%SB+-LFh92bPkf&%Z@5v>7TavpZ
z9RgZ33gM-@W+UuHh`jfdtbK1c3B*t=>IX6B7oAvSY9C$VEj@yX48nvnPiTii0*Rta
zx?FS>5Ekj<ny}Z8zjb{8ad}IDA2MHWt5O4+ws9%scdFx<UGG2FaY_$K$+PGV|G<e+
z^yQ-ea#|^DW3Fv_Gj4Yf>?Wti3~{4yD;jLjI&?1y+|O`}w@7I|Kn{E<kaaX~aNV)1
zwK7#b5Nx9M9%y_?8nw>JAPGRkQ7>{;)U;F@4kVwpiAlz<4FeaOydfdXBRCM$6@e@{
z3a5tPFe#kS!kG!^CZmpMESUn*KT-uj(7BMD4>=rfh>Nm07|nPDh*eWX2Qrfka3uXm
zRthhJC2&qci;)d%UkBigfd8w#Z;#9Q{@=gx*$gwYi8;*<w^JcQ4ykMz+Z`R~q?61k
z>aHlUbYd1ZqmR3Tk!lgrk#a|(+hLQW8afwg9q#GiPANKnuj_3!`~Cj?{_}l2=8w;Z
zO|AR=e!ZTD>v=t|%U<D&e<tcDk`6_qx(sV_ZqRq!fZCIKcHH*3QJyUDwYlmJex}jB
zcgC}GrP#&y=DqphS`Cu<l->NSP!3<-^vy?S;^L%%g><4H+<@9YVTUb#+KM?L_(5En
z^k9N{7x~=uTOTg0yO-fd38Qeo#EtI?tH{{m?FM&S)zhtlWvOf6i%Fg!bI!)=*Mas&
zYU7O|TvEwHiOAT`h1Sm8o=#(Vc?9y-2&46gm$8EM1K>O?b{esbXGZa#nM1ifs``g@
zd<dTC6Rgxit`v2DYSfmiD0_jo8sOo&1Du^CVcE?NP9me-12Su9=K~POotwJ*i54aR
z8$E+$Leg&&$@)+gqkx`V;e$*SL}_q*e2NA$0^W^Sq<HOt-HJ7@?Jv^%f!GLMym&%*
zUh)Ez!h7`7&^?YFmv-4Nd%*-A+cr4U1fiAS;?CDx{d3%NCe0fSOAZ2lGtMQ|Atbcq
zIs<)$u~#+ov%!T$B%p|8VX+@d9}BN8)HK?e`xKUS3&(GUzE~R_NvdwXYvSqIX1%UJ
zM>ht!f`>Xp(>@$1i&{dWr#^*4lF%?YSJ|D{f?mev12q7`<{)~PozOy!k#6<PbuGDT
zx$l9RT&S@iDwUtmf(3Z$^(|Gm8g=xlJUb64pJ|3??9&ODo(!&Y4QcM!t_ws2Qz8=O
z5-S5QeQM^uFP@VzOi^v7Tr9z#f+7YYW9e7j@x22i(J9CeoAi$zpnGcdIzxu?H;vzR
z#LMCm=+N*>c+X*oucxtNjzj&vxrK#GzV@Qc45yHGaLy~@`9!iamC=LYE}Q?Htz6Yb
z?|B5cF)>>^<<Gb?sU>wNI5q-K&QF-fNX6AqnIJWeJh?PKD+DrQH%DeCLN%FxeTkDT
zBt@_XTR$@X{HdO4q0l9y(#&-0N-%MuCH>pTcxdq7Zhko`x6)oGV3_BJHiB*swiA@t
zQ_W>Hh{CZ3NzQ}f@#0JZ+Y}Mu*JFRNIXKaKA}}&03&;E>#TUH^u*mo2oFShNn&VP7
zALkRvu_Wq&d%=a8L5mO*9zHJ0?+SHOH^G({JACY)&P8$Mo!%->be{Qpa!IZ0Vteqp
zDOG^2(48k=l#OAA0Grx9%!jHo1)l2J$FS42q9N#*Rz4PZPy-hIF=pNpfMN66$F?aU
z%7oB9Df27eJ-$o@%ux_KuB%T30;g@C=;@Q)`c>CE{YBCts1mn8Q{o6_6=K|TyGMBL
zj$KIhSpdopQ#Yuku8^V;%gp*3xj4h<fxr9*$mU@H?VoZ*o_7+(t8-(}aSyB6e-cY<
zITQ<71YFF5W6dgLj>Et>omUQ(dLi?5EDf-m{ZUG~>CWz}ejacAdD1&ir7X}}@MFMs
zblK8-o#-iCw+_WV`=dX9FHX4+plZ6Wrk?tLE`BDwr=CBAQ~Yu6y1JbhdkW&A3KXpr
zp++&6WbFqe<vwBz(R;ig&V7DR2YMv@+SLNBttp2oQ9Deh@pE4Aq2cc&>k;OU)Wry(
z<xmG~GLFKeZnA{?64@Ht2NHareoO)Dd1uRh!3P(N-z?WMUJC^8-kTW-PhE@7Rn(}Z
zd<a906_C+6pV@4&udL`>bT{fAgKRplH^xVzbuazR>%4B>W6#d4R+Bxrgr$pzhG!_G
z!?dIcKu_0$fsfNFrCy*%_f?_!LhKV%WdM<Xr`}f=RHDxg`Wo+~8JZ7b2}SddW0^a2
zjsm5xe=Fqy9&L4MMVSy$`m1{JVV*;{BHw05fLrdmrM|Wsw=?a7Q^+wPM1eUqVYx$r
zEcA8uPBdY<pSD9qcm?>?ra`d8`0MFqn-YlgUWs#|iJUKym2J5>6sUUjr0hlT!nluD
zF3!Z(VZp*4;2twBcwyoAXnxYC@LXQX;hQ*<6S?0Gj7oGbgY<{R{Cm+5<+PFS#jxuP
z(ruvM@%!*=Mu8$}tC^=bil1~Lt0V?&$KBx^F0hQk;BHZs%CE;uT|?uIzP+EK3ZeAm
z8Y;8HE0H|FUv=Xb;se^cXKUprAPiUkG&|>O8AV5tGwZCIsX5x&bVRXSHg3zcezYk_
zv1pT?;Y?7R$;Sr3%r|TuW>YIS`87D%Yb>?0sYjn;#02W#F=ewU+O+7IehTEJsy0^1
z@-ftyF<d=Bv`WEfifv^Ht|##)PMFwrMJmu+FMwtY{R(Q3qwnGoarT0m_C1TfQADUQ
zZrk_7l(EM*Q9_j_I8WA~cIUoS5`c6V>I{JZ>N4)yJ3zJ7DO-V>hQRtn3B`d}-y*8#
zAUksgQ3J8jY;4?6sGC3_p|{$u72cGa>T4C;e^axh;;mJR)QYNg6j2fql=unUPPsR~
zGGvIz`v%<PHJI1%=4k=59_9h;W(N~vU-nmD${Lfq`}d(_k_U+3wUk>>VLDSZ(F}t<
z&JVc|Bm`LWDY+<-6!)5ejU7Wd@e$h9EN(P2gQIB5zlCq4LDedna>%nB7V>*=(n4`2
zh;u8diEu;hDXriV*BvQrGf4eEBE2Vk*L)((by%cIv+#rF2$3)b3j$-D)|yQG>$r=g
zUTn+?P(E`1K6_sJvx6Ly!0uDnu*RrkJs@ra^a<R#p*EYfvJ-eT1?yNXQicSV&H)l;
zn^AnHKR=~eO)*<6Q(IT1od{wri*=p_M9YP$7++_F%*M_Z9ZNM9wXy-N)KpCp{UUzz
zopF~6<TxL!rjd;4<AAQkz~nD4Es<!1r4`yl^RovYS5_j3c~%Utrj!)zoQ_=j1Ru(v
zfs4n%ma9_>TJm>SvPmmOm|tcxdZ8>iM_U6rI7Tw8_Dy7F_(7wWcvAGqx-bEQ8)5i&
zXt?%69|-Avq8I$bK04nLYlSv6kM^~0y^nHD+AGTssVVl;rvdi=>({x5XIG%`dhOTa
zz@`7sj><nI39!5I@1J|SBjK_Af6pV%0<@mTl}?;uK=SG+Fl_F&OAd}H^$XbslgPGv
z0lq<E0UQF@=KSnf))CEIjP;KpZEnQBN7Z5=19d<X4aTECTKb9f4$&on@E&GDw}B>@
z;>Nv(xY-1o4D<dT4OKM~m`&YIreJKUqdn83@g?0wS`t13G=WLEwuEsGV_M_@wwSM^
zSiK?OWBlUj!y!IY6Qy*HSc1dmMx?|2AOvf)A=v)4tcn#YSI36$7*u+TAOK2>YP7u?
zJAZKi#wC0*j)1RR@jj{40^BXg#9`)38I@o654SPPz^n+RaRh6s_;k#}24hpMGZaaQ
z4up3(sCKBn6HF|e*%cZt(@D};X4f|@l4|MeHV(%`F9Z?Yx9XCn&y!`GO%ghnw*$d2
zUsZ|cUA!jRq2&@xGX3IBa=A_~W<iga5du}LMENbGLc3KbA+D&e8}Sjr5q3gi_EO1U
z76e@&nzx>A9uOL5UwJ~c2m>AVeTc86Q6|PR{+>YN?ZcnC<B^?0JsoO(6S$h&jX{$s
z^mrB>2u7PpC|%V08}-KmcfKzAHOAT@Jq^hvL@~T8hS=XGHGw(|?9F~asC@NnSNvDe
z1Ls~xM2^7xX0im0Q4=!XMzCQh3f6>VQVrcV>I_gE(&d3R+m(o}dI#!eTzsNezY2sA
z+qbr%UP!Ep497#zkuV%NAnQG<>CnZNDdio}5zL+c6uo6n61ozXnT^}=-A<!krjZa5
zuMAD3)WVSFBAl^ImatyI0^sK4f_|cxmpWcN@RUWNM-e2uq1(FwiO>o?d_sDAEl~@j
zhTi(=@w!M5IChPfurywO`@gj40bZ2N{vSl4DomP<n<@t0V=uxb&(OkIsC9{NhN=dH
zRx<G-&m0j`%z8yDN~TIT2>Dh+z{6JgGme<jro7#P#F&GFe+?6Qf0k7U(<O12PcJ`;
z3gX!T`?5GKaGIX-N>R#gG~mjQe<vG7NaoPkZiev8RHPz}<2lVo6rB@^KfB|BZ^Xko
zHEn!vuuR!+GEDjg>rMijVs3PT-Ec0u6=<tDp(d(NA-=zuTRJf1SAIlsTfM`gP-G~V
z<}QLqypGHv@IGOKy%9;uzq`D%W*$I&L!pa@&YS~Uuhzp(tw1?&ukR4HMGL$wx%L<&
ziy|Ka<<7PqfOzAWDVs=b4^v!keEr0>#%<x$@W4cjj2ehlIp*Ktb}vdF+V@Fh+%+Yr
zMu~fdf{AH;fvxC0xq+R?+x9s|aqrf6qG`U5VC0-+jK}f-zoWDY7qi_k@^cRKNwMUH
zsGwE|<&;cV9fWiGPJMVn4JevUql>0Y2fkA{2|_F@xr{tCVF5Z8iX%fW=Qa*wG7#b@
zS}>s;+^L*qePIe2MnEm$$OVC#!UZnS?X<eI<r@?mN1*FsRu>A@Eoz~NGbwb7%Z)zq
zQ6|X{7&@PUpqj8vjacE4fXio0cfhGvAUxm}sSEg+@*VlNRQO+B{dtW>((zCf$;M+9
z#JfvtIwm4=YcUc=A+Ivf5Paw0RMOO?@>|3aD4y|gT%8%j0;08W+ak!};KHvjpav!C
zAsF!#zo{fD=>PtYG7{SSTe;XeMk~f)Gu7$P$R@hS6PE-E$ouiitdbQl<^xKUQ_Ilz
zQVgeRi2chOD4kIrQe%_sAu1sgrGbDlBZ7TwNWR6slQ2VhfY}JeK)Jn4<{a&dBuzl3
zmAFgBtiDhf)+>6t$9mg~MBNWLp`M*H|Kz(h5<Q(TB~Jf_kMB0C*btMe#k<0C7^w!-
zm#Lg=H-)LZCzHK|GVy>%A7zQ8p*0%Cxcx&Ka0hmTKJ|c<hLZcg5Dl1(?q%Gz-@ho`
zrf3js3Tds$W``m&)j)QpJjZBv`ksNqa_}QmbMmys2kC=3^J;-L^Cj&jq2Izg>C`d-
zLOic#1Hb=<Qkx_lu`tyApq4VIZrG7doSm1v^B~|YB}5)_I6Xs?X*qTWD@XGDaL_Fq
z+L;u7?oqkGb4;Fq3llRXQpf|KC`n|RzRwPndMmWDldm_3MB@S^Uw&bRuhJBNO)>{z
zm2wn@hy=0FaZ!D_xT+=n<!_ob5Fg40;J_z8Dt)xC52b_4piEd-4>n8s#R54Jq07uX
zV#DL`Svc)?K}RD%(;VtM+d}282??EwBKZmB$cnt{&G^3Y@>VjxsBy}CQdm0{V)<ls
z(QXLjl{-kZgMC<8qbH{0W)vm{5<vkMZ7)5gv{eH{YYd^rkV&c=6zI^%&&u5Acaxg_
zjBmh^Q?Iwh8aGhfmb(6UwrWNVBzZLhnRL4v35U;Dzlt8c)pE_Ek1O`*v=?nY?A!0Z
zN>?ybw07P9xUwF?xnDC0U_8``oRW(?9f7kxlaLqd6>mVEf>t?eA|P~RTv1<Mt;W*a
zyc+JPQ;tueg%ZhHNEW7?8FHhadRsi`f)=IE<*b_aieY{~GYiljD4kS9MhEHuP`D6|
ztv#WHTEU)3oU0@bMhN;_UC*W}wlor%t9RwtI-Rp;KCl=VkKr4m_s9*o`DC0@{;M2v
zk*~&UK&Fo4E9NmxCV+WkxHH6Qulz&Ls>1<qxA4bgzjh@Ynk^Mwmyn+ewZ}X7><;&X
zn`+k#@T9U>y;Bef&?Buh87bMF;3>t9ti?d;Th98#65R6#fCp&t$dpsDEtckU^+o5M
z{Ie~_0>$9R2bfRG4TO@+$Jh6;-9%L;kcEVRga@3Be@-1Km%OVYQG~6a{R<&am-|n2
z>XK{D>RQ@)m}4EkHm|Sl+CE=j_grvX+wRu2$5(Bobt|SdSzyx+KI7nhpG_orpwzcV
z<29QzYBZcp5I#DM<Kju-X|%-~P~S40G)?GvHo-rY4HCQosCo(5mIYd54~ii>qJ^Cp
zI@|>YNqZG(=pz9YvvEnCNVC_9l2X^6p4O*2x9-$-4`>`Xe(M)jLGfySU)qYcj=u2p
zJN@95l_TGXciJ;$naPl#luKV;D;X&t^T*157Y%+I^F_b&GopSpA8vi{jRX6mT!tTs
z*)@Flm;U7wzOQ?G_JFr%yMI;X+5PNMbGmAQ@~V5z%t<Px@1jh6*ie!VO@2Egm4~yj
zWe%(8;+#Q0T8RWwx@iqfEl5;~)h)y^TYy^^+w_uWd%g1;M_Xbu@`4dC9B5s@Is=-!
z>w)f%hIcP}Q9+3dqu5!1SV<h9M-Wb9FdnJ&0_uo|^JtyNlLuip`?0z`;Ca%VbJe$t
zkjU^efP7^nk+k#_ccG9H>MKmJ=ap?)oVw4HUr)X4>YNDF4fInMJ5AW`gUFa={+<_%
zR+!+uF^+lybx_iH=b&G>af!50;GKslK?T&*fW|fmi=dKD<W(hyh=gQvSRj|<uYWE&
zp#Wyx)iIkr!efHsOIYf2TocpU8zIgu8D6{F8i{b&den&$8Lr}dv^CMqpBY1Wj}t)J
zt#C+7U?(S|Q;#F5k1r(Q_Mbw1OeGycgL8nr3j`sKm#x6yCc5Aj$w|Ffg5*dGsE{Gg
z#X>cLG`JDbj+!E<%LAc7sht)9g6t{VUm&Ior%O6(Vt7H!g(PAS4X+g3I*$A0f)S&m
zeIbtW(7l?JZ4*mMQ=I2{x#YJ1x}!#GChgl$aaB`D1KDSA1}4L0WKr@Z3kG479-%1j
zJ>Ri-V1y`8tZ_71*EBL_4sI#+*g>Lo_g@DbF&hj^^BI4VSAbjv7ZgUK>i)VCG96fX
zQIU^xurd@`q(=IuQ!)2O`g}A>LmJ2u0tHSMWs<rHPmWJB2{$jl_;P;`-Q-qbXVj^K
zfkx?+W1mWp4NOs@_o8Ca00Vp46%Maw;{dRPm5>R&5$V2oW2kej_Y96eC=f@67O<UC
zi&3>!i=uxg_~^8!--ZVCpnM%vrPnXz^XPYwL_QQzG24D3HwlAC<D|JF(<71L$j6o?
ztGC~!8kNOjUADJ~qqYrobGMNr*@O~lq6FJJ7qi1{JXjL&(2@V7|9HI*xX3vOKjex#
zW;+8yH%w}6P8>#{nEW*LfJ8+Nj$gQ7f)ZT5T;cK%#8Vv{$;3H%rrQIYkzuLCmV_aq
zTV;HQR91x_G#mY``Q*AE@34VTE1_m3wGXvwU(h}b#PuwB1Auf=Eu8XH=)DH3-M_;T
zx?`RS^L0uFns1_RB2~a$wkya$0I^Zyf<3;=f+tadbJNO&1_tb7+k^&K2(qKcw}Pdx
z*~`%NVR)p|sepK}-3PaU7hy0UMEu#eP!p9i1G9fC%GnxxX;HoJ`yK1XcT_HH&Dimy
zd{H`3P*P{uA5wiqoJso@3gZI>Ev~QCF}JdmpFz_LT+Fx|<?E=JR<0r-nRpSyEUf*x
z_nw-V>g$>eC4rXCUXfS9P@xS^j&@yKP|yfh8#}lI2y#252csk8DCXX+a1ajJX+1d)
z1kL&W;@!Z0GcoqJcygXnI_U0uEUV=>t&3A%)TMiRb+w|Jo+Pn|TeV^naD~FbiSwSX
zu`m8S8^<X|Cvh%aErL_#L2I^gXIoRXTzeyQSRJp%<Y8vH@>{#PjVs;`-Koj>fxO-B
z#ph3{M~e_UYT^Y;3$ps!DjpJL=NLArLQW$j2fXzx44BNSOA@33<X+fzT<!|?zL-(F
z)^0^AhQ$_}N)d$}%T%m}!D9?|T8K{BsZ0grRwK;a5Y4k!aO*<!uVY%$z>F~Hh<|eP
zd1lGGpBFo>m6JTBR#S#4@0fifLGM}h#9@Wiswi!~?#&8tfD)c5rG9Z6{Jb-|UmAV(
z;wvl0So*<&vXFjjo%3x@<Ef}jarnsl6=X|MznhTjsc$y+zMp7Kz8`+=$8ikFop6B3
zCW^$B4MHg#<00!?UP_3$^YPfEsf8r}P~VUfa9rZ}KO@8M^f!_S?PTC$T^`p{8PpgY
zx_4*6FpId3)2f&f1@?UOOVOAONh~yfd3HI9ND7itCd~>|+F)h=UW}`@o>Zc|J#C~k
z8G9$8v_0Gvy$Xfg$GPAAOsn=xx@sNz!s4p(k2frK8*5#<A;40eGH*jbaM#|hB(Jwc
zA6a!=yn!<wy1rqQSde8$Z+Rd4JKE!S0F?E_$;^_6A)+n-=b&zzZQnDP!Kj6kwgLR~
z>Jk#sNTA>+VFhso@mEbfNNThpz%c$LYt1r{vyY-*4D*ilG>5<^e@24<P*Pk1+dn`g
z4G!Kpcf_A(&(?lFrywkC!Sy&*8g7ab07G1>2Z?+*tvJd_U&t=MqwmZ~q(*&V_W7rJ
zAfT8%SJ#!G3`mnUrIzoL+l@jDiI2Tw#&d|n1PU^VW^T@PmM$gZXnjTj{7T<~9Uw4U
zv|G_2JYj_bSvcWBxkrAQ<62}YwePktZf;dvgoq`5brRy|s=tL9-8>Gb{9AG73Zu*U
zmfJ^P#35MPHK{d28?m51KsCbMk5a(w+2}qh&Lkd=9iUHW#D>Pey7IHai%8_OFhNMx
zyufJ$F=#AvIr`}IJ!5ckqa%rjBhN159uTQa-|n9_wdbQh&^5)@J3YL(YH}tq8%gB^
zkO-zupN^Tk`z%~qYtN5dO(}W_JDa6G<VS~WG<{VGccT}N)p5n8_8<6u*6Kj%&UgO+
zLWNC;kr^Ph(EH7z<1$wqMyD4sN@Hrc9>`$JhqY&?Bd8k5a6V42zLjY7-%X~4+nXNx
z#4A#qVrCSm1()WDHhAPe|E4E~>@j)MwVrmqpUDwRp#C1_bIU``HvZtgE)6bnYPWT)
zh1XAXa&A%gs;usphq|7HtyKlE?Ld>x(u@Tc+KMTB;@m((U19N3|NHC~;BTa6w}C}B
z*qOp_U_e+pc=dT9IT}O{bi58q`VoL*8!%L(z?nd0f+fk6ajsx9RI~ukiK#y$6-Cu+
zjpYfoWmqMl2${*;z11cH4WHU-1sVqP@Ojv`Gf0%&*_QzH)8a`>gm;r9IHOj-xG`hz
zjdgXXpg-jqm1h(eX_1zPc-4$qi)ETh6^fV3&PO6cWqICra`K=8T~R06N9Qfhe&CV_
zh7LbErJb&IwCg9bp|rXZmT8$FxD7V<qR|KJCem-2dzmSF!MrugKn<2xai&45WEQr7
zW@uq!F~0yfD+<VIB;qiV*PpCEU;Cf8Fk(I~%yQ5*DcCWD?igSrjIu!`z5U%ALl9>J
zszBp(Pjxh?Lq8YUco|g4>O&1saic~qXKrp45lLW_n5Dg6zCS5)KP41FaaFyUt3r3`
z-w`tu1yCkFI_>Pd@zH475c@C#YMn;`2u+q?ykqTZ9!6#*9RwwAKuz+q#>K?qzcd>C
z6aNL$$bv;}na1kJoADE^=OJx&^6I?2%93yoN><d|*lR%zdcoQ!Z<}2_I%Zs*8CMoz
zsOV^W{%ujpNbUeQUUkgHF@@`?D8Fx=sA#Qo@-x$2hWBui$P<^y$nZqbXj`$0dmXs6
zlO<%_atG!{3k`J$rHUn7j6(u3{Ll+$(EvLqGU=tJx65A*2iu^tP2WXtl$F(ojL|uQ
z&1fl$f^p>&JPm(6B93AKZDCGZNWJ(Qxyh^Uym_7e%_k1oS%BCUD8@J~W>({c&xqV3
z^Ha!|M1J{#tBzKqL=qX0t;k0;E5>unLXuf>_bEMa@Ry^?o`LxwP&Q=p>mkG<mPAz6
ztinL;8^fOv#NJJbIdm)`7U?)7^kz+htElK$3qVbpXr|WcV5+wqgcWLG8rH4@szVIK
z2ps|3VDR&D`w=O1((ip7tC6rlbG!%UDV5A83GQ^}^HUPs?r@6)uXF=YgH&`L?r3o+
zLQjJT16W!@6L5W6LrQEx5k_Il@hKdYOH=xD0!#X^I1_!6u%?4Zp2dY6VEI*4Rc3ku
zxH#&DZe1ECzOuNXiG*r|!6|tw0B3SwlPTl)1NhjIv@=}xp^?1|JVHIFk#8fGPRt6)
zitaWCW(B|-Lk}A+%Vk8@mW)nLAfHQ8@MZ%Mx1HhHr@2kk+)>`6Cusr<J(;(f&zq11
zs;ccsVa*uzZ)Amx+ilh0`s+YZ^jV|@2Ndk24i5G^5EonGj@F(%hxzJ-II>Wlo+?EA
zux<AxM66)yWT|xTMSpjdh;gwuA!AQ9t0HJi5aY&qj{iYgzuTsah=9}C72r?YE+r{7
zGjKA8HVpijIfVl6weX^?)I#?6jt#4Q|74@cRbULMH-qiVUX7!jR8TIOP`JQf7Sy*5
z$apkb*J!AuD>9j*>^trKx;z+xaJ`jinU`a>P1R8~-Ayg%BBKN>n~Zvtnp4fxrec={
z2WA1dv4L?zmph-O<|3!65;tJ-&MP8Qx!Ow}5e8gI$bamv1XdaGC-8Z0qX7{5IWQHX
zRcHH)Y|hu3HB7Y$Q=%(eenR{2o+(|{9xn1O*OC^^guM{hXs9DjDg(x7siTWCOqx5w
z!~%34(m_eo5MU1ksv1oGjW}Gx+Zh=XXC??=1JpQ%w`S>?gMwFRKO4LEy<B61nVjj$
zl``o22RW$_Vu{s58TFiP$C6QYK?K%uzt!3u@l4sN(t(OiE<R}(#Sl^6-leKHOhlyH
z^hneZHiOtj(U)tE>mwbuivZRG#Q-a^@E8xHIUZd26vy3PZl0ej2OQ<^u3op!2cC6z
zL1S;mIxwkVRv=1&7ZNI->bN9?4#gDHB=iZ!v@pSzCvc~X!*sEK&&X2lh(S+Oio1ub
zdTnFNR=jbw)vn2gEp8Wxf8p_;lPGqmKR`c6QVsW81+`CbM}eI!+q`)*Ni6#2=UeOm
zHPD6?)n!JIll{eztnO*BtBq;tI6nzb$m9c!;wv629(c%6GX#a+JY6plt+`oX-ay4<
z;+Nq3jEHF^ag?<X1z;6^J^DXSwz3JMg72c+J%4Apx_fKzUw5kYdarW}#d1023KY}w
ziUjtZ;loYrX<EfjncDA+d+p&yat|PW9BH7lN?T$%uD_^gC5IXOpn!^3Y;wYXhx)TO
zIykW)J`9Bj^9iO=;q)>mWG<s9JsFg`xxEt0zbu_(ktoHg)(H+pBr^1&3vrTSl*MMb
zXs`Z@`$(TBwD57NC-`e>oW3x*@cWV1DF%!{%S{|{t-ts0d}m_6HTwOBX|Js3;b*5#
zJh0A7JAW1mWN{|SuMk}4v~Y(3qH`YX9hoG#2r40uj;>iKat#1g)_HF4EgVg}3~Igl
zi#oSF#ARm+N<n8HxB9AfskFH(S4L@VGDawHj&8Q##Ww8W8KC^l!T#1P0O6?Q&42ET
zNfX3a4Xa%a?1ko1?cq!1;8tBSfiCy1cHE1^_V7L$L*7x9UuN$RRrqOM?*4}{foRt!
z|L}bL_s{=6kJqJy{};}K##z;%#+xlz-^hD00%vg7g#D<F3WVPaN750T4UZZyy|Zz#
zY|0<>-WvY@%SXkh(<i_FPee9jgLg)ov$93Ez2enh_q|5f<i8L8=LfY`VVr!dJ^UYs
zU%F(Hi)s1n*T3Da_=ErO(h-d~`tP4#e?b4|o=0)dfL%SK41O6~bcLTovc%}i1pPJN
F{SRUysY(C<

literal 121821
zcmcG$cU+Et-#>mLWHii(R8~kO?b0+tT4-oWXlZHhBtnw$Y0*+r+EGeri9%`bol1M}
z{e2$ind`c~*YCc6zrTLx{kSjk={(Qlc)wrcIbQGMp@N(=&3eZ5Boc|{+}TqXNhDeq
z5@}^Q^-BE9;pF$~_+!mA8R=7`CF1`=Gb3M+NGzmtrz9`i2KF}@SSock3A6@1+)qWV
zL%Z!%1PjY1n!6kK>N7nR?z@=#Zsm55u#eYbs+9X;1;fw2I~h?L&GhDmLgEqLtB0vr
z)z&F*syyhna-HtVoy~M}cB9jVUr9ge)@jsu#5)X)i90O4&rsejy3i?R?&IUL0++J<
zQdl*jxc2W4B$DfzlXKhu{iEUe{~vxj!re>$2KtES&!3lw&BdmrrA0;Q*Tico7Od#i
zsCX+|QBm<qz_dADGb8E)`B!P4PjV1{SsS>GUHS9qPxeorKH1sXF*^=R;*ZLQuGDWL
zBlT|FnCP#w7;epF3$na;=FFMOhs1ka@3Y3ge}BApBk=?M2E0>Vd||vOfJc0$;{`r{
zLgw1F->xfG6^jgg_T<VE6crWi6(oLFBJ-`&2K<@hY=UdUWjT!gVDmeAWz@&-;-yOt
z<K5=9Ivx>`kqwiZY3U;(BEEh5)>o6TG?l%SdGpuHgwHR1efh6_ePG_6&t(2}lj56I
z#D_AH28ci)O{#C(wyh#kK6~I}gV_9VUi6E1@7|sCpj}v;$`-fmE*)~7%2>B<-KK+7
zVM-brpDlaJg)IIQ1qxYIMJp+FwYRr(eIEYOV4A&<m`Ce*Y!C5~3gQMWM64ycs3q%{
z)h6k-*mVU(^VHSVsc6}Cu4d49>g&5*=UAw-{Zx|;n|$yItKQ1rzkd&3xOlO=N=4hL
zfXRl}pnQM*E#ku@GQ%i0zj(8+I!>U)acqnH2}MQ4O~FDVU$@|UCl?pyq<3wMTKZ_*
zz<=ZCKN&+=b7LjqbS0L(l?J07KZrd@&Luv|b(RuSt_weL!A^spy5hAmg-`TXM3yW}
zwTNH;{`Bn06*NWFaq7&@(`^nznKpBi18o6D@t^+Wu4TSe8KwC5b0o;o=(<o)`R-D|
z6Q*4sJFyWiGlkmCW_dJNEyb>tjBmWfX1hJa=i5HpjeW`M@9!619PthkwtB?7mADvs
z(dG4Di}kP3c3IH%7TvyQk3|tTHbcDQ>B%tJ)x4I-kxOqce44B`k~x3gjYYrW?XTD?
zAMB?FnXEX8PhmM<pGy46Yunk`shj`UZn91<FONMw?e|Cl^VI4Q3F9kSjx(RSg6G;i
znAb>R;U~MqmuB9)kb5Ldxs08Z%V7K%Bw`b6Q7puxSG>`U<?vyHpZ^^8)3P_HeC@jM
z>#gjoVzIe?tUeF5TSrF+gSO+yc!j+8@@LR2e@5b?M~^n`JA;7OAW6TUjZHp8Y@z={
z$rItNi7rPtI5NA#JQt@6#MelcMk$5|@aP5G{(h+FL4*ovZzy?}C06lU_t*Y-!M2vT
zR(`$WKr9P?@2Q-{*w3Hm*NRW)V#V*W=vT+q?K1srK3*m*%|sMB(gVKbYlvRA<=|sx
zaWQJQGhU1f6A3P&$gXfXs{W;)KYtdBPBrf2xk)AYG$7#9t-ANt1NEnu-+y@d{cmQ*
zx?F}FTG-jyJ-xj{#GGblx<Z((_O?nWUc7i4iN~dy$U^Owdw1>9!jOyng$s|D7eQpX
zez}S&tE$@Ou4eeh$7i*qSs_PiRP)NDf1W=djTB#ar(5tulK!Y_Vym9`+?D0J;QxM#
zTvTXE>hwYu{Icf{P`hoB6Kq2+$eum>KzNf`&P+}ABA@MWYk7J3^z<|?k&cn~Q12<?
z&Ltk#QlfFqp9nv#^)aad0RhNKw_XnVhgnW@&4^=3`pcIuKi<jnHaVI1@0;|=DO&n;
z>$YtR-O}RgYrMr5Z3}%l!hfyW{XO4nS53Cd5)1X{*cj4jFshySCK5L#6(vp{*ZJaZ
z)mM$%LlO~DgMvw`KQc0cDthbu`SbKtbSH*$T$biqqPCE0e9}|12IJJzLF69{JCL8u
zLbp4LgG6@m8S)}-@xpJeO;?UnGp<kWiA!xhf(_u{5S^&Jgv}$qyi&-4a>-X4ElNby
zKi*pBcD27Y$z%8Jvz6u~Hx_D>^q#i})HRaFPz6$qYR)i``$?3=a*AwJPc?D+6QJkD
za#ltrW9HAR@F%N=#nn;_C)$~p1gYJS0Alz$+zRn^y@8ZUPm?#^Q{n09d6#8}(CzCD
zAB~B3xu7JxL>{nEJCD6;`N!Ay?{}&H{jL{m^0W*{e!6hkmBZWO)KY}!`aj%dnf~p`
zrR6-+xxAoOGRs?c_18;2EdB<!P~?m>vy&xmDa)|PpS$h1yvyvR<a5L&xu#S4fW)d}
zM%A%qn+7@8DYR_db0SSCMp=^n^K5U7h|S<*VOrvM6+DtniTlte-7E=a;=E6@YrFAg
zSHlDQ_Xpnod03MER`X{eHa5292E$aIwHm)1y27?EE)`{_CCf=!S-J8GDOzQsYeiea
zQQ{-7x<pWN)F~BtBm0VfwdB*FASMO|2CLn!y-ZHyWo>)8xVY-~6Td7GwEU4-F}+E3
z)7zs;vgVqG_)QuGOUYm5x)4NJ--#yN?pDrpt3Kiao6ep++g%<ZLr;Ygtb+@{%T@Tz
z-|s~WGb@W$iqU^T>ere!GDJJXrg{kz-I1iALb>Irp+}ycd8h5|?Xhgu33g+D+QOou
z4lQ3-QyJw}vtsI{-k*DMu<W3YHcINjL8JQ{cW$<dXZ+OvzA$Ug;xB=gMo$?pCXvZL
zzgg7GD-F*co<Z-;`{v7`9wtjJT9r(cqS2dy+G4f|D?!|Xr}t8bd=vYTBmebVEZc>x
zdN0ppKM@&Bi)wdNI(_<^l8UBJaBy>m&CvY(e8T5hME1QOEw=4mPM^yz$%}5&GAs@h
znzKDj+#YG~Yw|LX=;vojT!PUd|NMGoVPWAi9?pE466&tAlz1Ys9OB|iQ1kQgIqgr*
z9anofa-fk|1g9D;q`mhvy*c+HHZ~SZ&r1mbQl<98W&HI(OG@g?KZntG0ybOGlfSxG
zgpzyYA4n3il>Yu-Kb4`<Oyzqsx5TI<pod1jd4mqzgIih{3t7^*a%HDga%QUiL~qE_
ze3vwn)n(7^9E<`cj=(NK*7XJij6gjIf3k-7*qr7H@-~seE?>D~*WxsF<HikH|6@Ae
z9&JPGIc;FjQ=ekAG#)7)gyKV>m5vwkS);xYGJg3^zk+O<XMB>R_t<sx>4rGZ_Ne63
ziq8)xc%zvPw3k>dElf>ym$eUO3~8Y^qGF)qB;mTykhIKlSKnPjqxRwEFEK4<;zC@b
zD20-wn2ti|JozDn$z^^d0niUUFv)3d^7H4<yG+tp@uGGk>hjLx9et}C?FaAgGMVm?
zcTu}|aWj=9@<|(6Khak+RGYL<Tzm;JV2jmyBEC2c<P)V!4yQx`N&vfl|Gcy~m)dOK
zmuBAnr#Og!d#ShTj`Q)Q=#>N$m9=GYGBwdP0~fu4Gc7bMEUZ^E(_tzeI~p6?`2I$r
z38!<DRn0wJ>|xz6RcB{sL2H1j%Aa%-b1h4Y05cnF^n$FazuenUBG~?Td9w!UCw$dS
zt^l%OO-w$I<g0yRB9?%}O({F1Q*RR!6OC%(=|sm%YqS~pZ`I=ZzD$Ij_OxyZjT8TP
ztM1~qj2nf%*$V@vTefV;KK{bTXCh}6o#XsS0k=H47)x+a(w`J&xiC@V;n3*ZG(FPZ
z{`>criGAKDHs>ignD$n_BepngkBIdx<Xa5WTrQn+DeA+HKjc*kt^T_s!UM?_Sv?U&
zMMday_xq4S#Qq<tY<|UWtX5?&Ag+c$9&XFieNIi>hO64Y?n5)f8f~WTS5BEUvu27`
zvc6&yTRj_~GeCKpu$WkuN`h9#&f=dxADufyyp?1aK&e*r0r<8iI?KVvPliE$ekuj#
zlT~v=+1hGqjPZ2B-J$3SO&e29Tf`2&CciK02BjfLTz|=H@P6(N@VHW(fJvh&@kSKo
z=<1%Ho($&2>Jai$yUw1Y<mrP8j`OLGrvhHSR7+`oe?x|;piTvqE=~<u)$c6G%KG{V
zr6nt{Eyv8P5rC*tAGYp{|C@tZfr)S4?EgY8#iYMwisiUAXN__USdL*6HZ3!w5X5G3
z(90njo2Jx<FlwSRZTJ}X-yi+`R&Aor)GC7HR0*@Q_pvABfBU8sXEWG1Bg-&z`(CP?
zRZsZ=yfg^T(X=p`+A{lrOfvp50n)RX?r?AG?A5nSOiZfmb6i(w+wmcsqg^vlo=wxg
zyDW}{IDJoB%gAR~iE3!3si>IbI5XO`F?((>gL@s(oJbNJ%Qa!|B}GMUe7mXrL^ePe
z+C|<3;H{R@t+>t1%puR7ZHljny)q_Sb0zU=Zq}N(Bu~!tD8mInC@X;%AM{G%=g72*
zR4GO&-z?{eh!)7SL}gG>R=(fY7oQPdAAo>7u5ncBbDH6Fp_a?S1fAIQ)ezn4%F_&*
zl~`soQM=I&)B0yN`Hy!J&8p}k88;|+{!QZj`}ZRp8qEusv|S7)`|IRSjGRi_bL?u4
zKeujl=9iwxkUg9L)gOSed)O09Y7^UjvL~GA4!vv0HJS>D@=DPBT3Rzw?0}!fMP=nl
zpMa_u6>Y03B@hg5ndK#+bXn3~9<$aQo?^jvhV1EY0eZnRvwaB++qU`q^Ur52pg^Np
z9==XXOKT5RF004xQP2`rv8-7-9+%;}%*hB>4Wc}GpBVkl7UK9GDUM1d|B62jVC3-O
z!{T#wCD*3*t<D9Fo2m#|<kcv_EnpLQZWbXjPNEunFgptZ6E<f$m;$~{Hkf+fI6_VU
zL(k>J*#OA$a87%ytAtJ-;RE<!{Pn>me1c$``<CO!j}uIGvVW%aF5UgA27vxaG~oWy
z*Leb({Gy@@TrM**pnrE+YQgd*YP4IDbPIs*Q;ZuX!#p{AYm?f+vYx+q5%WjHvYY;9
zRQ>D8;XFFJl1BT!I3?Y4=gzhLAn2DQy@qw&jkdPZ*C%6c-lt_^4E{Wr-k0^f7brRC
zn2wa8p&>n$jPFsQu_7Mz6hoiq&&xkqbd9tZAZ2a;6a|37Dvd47P0?{#{o<?X?;IoV
z0*mtUmLEa|!Ho^z0-1SkUPv`*!j0joM6CO5LCluW4_=D9I3rPQT<)P}#cO;T{n%gv
zvaSu4;Nr!L9<)qyLY@CGXxX-<)My!@{M~YXnlSxC-g$HgX!_49Q?b$S`yfdK2L?92
zKIzd8(4JJV#{oPVf15r_3Bkmn-$2jd#pDgh;ISX?jtp@YrgpPwaY{w+2f&>^<E%|Y
zYtEgVW-@;y|0+r05~W)G*G~!}__(~&8X6jZacKB5AoBx}=fsYXp<6?`l~J00`I~e9
z{aZEI8#6@>jokz~0xnw5pp>0Pe243T_c9371X@dricVQkDc_dxZhG35f;V!UFHivT
zY&@EL+i%cxZ~k>TCYO<=*>7o4aHnmVvx!oZ<6Kw(l?yb%=E{{Te}QPm2xzc}Lkpn5
zGetdee)c~7`;}eALAwM@c2nh!b{2*guN?MLj#b^nX+PP&(|9xSNuhESn4{1F)Vv$;
z78o0S8QI|_Oe-+~^u@qAJKnS9|NiY#(#Bo<M>UFqMMZ!(Tdr5fULkYg5VJ4q{_7HG
za?qUezG*Mb)&S66X6ND>3ilRU@79{u{=}$0*#H~>uYbYcRZo3<tiH2)P)Qy$ZT?Il
zIIS_k061pm`8)May&^-sD5GTxLNYfu4?p9z-YxX=XGf5EV%wL1bac^RCF$S1eTyKw
z_m}MWQWk|K55yc|m>bLVFH`3afHxp2^C9mpMViznAEtKO!1ejqzJ2?aSwqt@#Mgmj
z)+E#wxP>YgZJHqU#JjxlIZ(2AG_>tHeah~W7ysI_aI&TyVJ~yx!bZ2&V28oOM~*zg
ziqcc%LfRSm!4^U#X@(mbA8Zm?{-z*G<qys6u21Rv{%jxWK(fK5D!CV=O={WB3t;tI
zs3aX7=b3C8H(Bi_R*hx*f8+pP3i|F~Qw9OPSXtWuKqHM0-qH8k!TlQz%ZZ-KPviCv
zQ<u4hWm=YWb%?BuF+P_I5?=VtkWEcq#PRMjGQrwp*7}mqNLe-0xGK8JechI@C*)@L
z^}+HY7SRYa63mDy_t7?X0AgmV-L0ev6yU|ywc^w@D6?l#%Rsb=3;lXQ1K755C-L{I
zB}cWhKD#U}qL)h2&qIOBZgtxbCP%ef)q1c|2m%#AAv?8Og}k^Ex{e|n84z77pyV*`
ziA?(mdtj}+36y8Bl<mfQS|uz{sNAa>PNKzus(Vt{A^mcq^PUYyLEtmIOiu-LK`13-
zV`JdkyAPRUPE>;eKq-N60n&Q&`t?&mWEk~eSt*&kXl_1&x}RpzRUEbQLZF~I1W!qN
z$B}OgdG~4NAP<F~U%6Xw4-$t618O%27hS;)oFXD3%Nj)NHzj4|Gh|J`b&WyiPoJg?
z8#*_Zef!!=xqcKC-2!R`!F$DPaIt15ziIOcsF46F5FLhd*Jgw50>#Dky;`|87A<b*
z?JJY@;wmm3&!posC+nAGhfNf;d6i4)^5tacJyB6n^(sJ{AP+Xkq}`7ABxXmmNV%Zs
z?T|fFcIY;xTLCFIf@6XPH>E?z{opV)sOed=7BLVO_8WcGr9Y|QOP=;ZuL^d<DES$&
zbAM?<;*^}&Ob2?#U{6N<N8`E9<0jJ~5dF@}$TVc^K)E>qg@J)fYd4kT`SU+fzQs_T
zGc&g4)EJ}xqm|ir`lz_EJn-}+WK44GkO3&maY|PAXKK&?X0T~Amp0an1MSx~>AX)X
zHr<N&cItD0RPBhw`3!BNtqqw@$e929^H2THHM<jik6yXmY}Xa1nZZx(_Vw#my<odP
z*jH$C#P!o3pg^I?W^mywfU24vj&#eOQLwj(p_V0eHW?WiQ&58Fp?l)}iFwWoecH_6
zK~{`(wcY?3jRf_>?}ETVoWrs~Gs&LH96B9DX66t4DVgCg1YH{%rYw`wR|sOaD`W*0
zz~N-&<l<*C-Xhn)#0DBt*GkeeFbLc%@+a2V7=YB%J;(VLm~f4j!vKL4hs{buB|#Xa
zpwEWOl6!FF+T{g$K?v3aRE^V~1St##h(e*C`kgs5GlO8)N;A{3_4oC)9!RNq!YrNz
z_?hx@Q>{3MM%pk!XtqFnanqi+Z{9TCF60nsw$(*bUKV}r_li;M0^VB-vlB5*8*bjb
z2^yB|gdLlVx8FsT3k;fdHP`Lo7B+t4dR}TbTzZq!R1=ekHQ^Mf#HuRB=-gS5K6ma1
z^e^$NIj)j-*C;8O0_)Uv7W#n|i>qXkZzg(K(Q_J|Zuj=yB@nO7>ErKjTcxDZ1T+b$
zD8^?)yms~?!rr;}T_l1lMvlm{NDyfhv;~OG0QqX4HkFz|T+T$QK-CT8GpYt`jV`w7
zs~&*IaH22v!+aRA`J^l<N|$vy4hYtk=P@*A_5Q;LHrbbzk@6u<*_A4>;0cfcq2M^D
zA_ciZ<mKgu>OSZ}B*NkncqBMjOFd3Ilq}mFAzo@gKLk1lKL&6{51KFJL48UG-r`K}
z4s&;RkGf4RUlYsJ%HbxG9VUv9kPuiHUI?jXF|9=GP->HP17D5CrO4B%9O@r00AT^*
zUP-rnSMt?0K}KF)9Jk^;oySb5=YM<bvL2kJDJhu?o|~6H0G@!CQRjO!Mg~pGGE{Cf
z*-PvUu@Ap|`EmuE9|}O-`x^vMt#i6#e+UEx)$#6Hx;<i!(|}p8{`qIC)m~!3LRU}<
zODH2!T4VkIz-+WNGUp~bW)t}L?{A({<J&dUE$x0kWXnP#3|Q1=s%U7;W5>2{-Fgen
zbpH4()N<-E5}yF5D4ZY!%=q~D9#Q+<Fllz~+}Sc4Us+iRl%aS1IxiYNa0e91_zKNb
zqLsQXEIUz>^i=2{G0Jg2fBmAFO8Zq(lJL>v<<qC700@W!ybxtfR+WlSX9<l3_KU)p
zL&V#+&5)S{nk+BfzI}UOfhuRk_4a%(4<>6>cq>%_0H=fBLdZRv)PL`56uDK=2e`Sp
zH8wUTnrG;jg&|Q@M5@6c0s2+=OtP~wuA>zjI#&=#l@OCrRVRh{B_Q*x->{+U*DC?o
zJbv2FcGzb0+jEt#iIsF+buW`FRMN6QTXmQlNX^SPmXj-nGIe=C71^h(T%B`g75>qC
zk7(A!Pl($gPLp+mdRb#ZLygET#@iADM~)s1giwFOPqP|}ziid5r6QL!*M-L3su+vg
zx4+~MJU<|VK6+(9_2$h#p^|sM<Qoq)XI{E^ak86}D2GtUvwEsf8)M?rd*d?(4a?vB
z2#%nbl2Lk_!^y&`1P41Or`G%H=W5fOAeKS|Q5aA~N&E2rJ-&gvV0Q&DkkcmvtVPy4
zCkONjG=vw@*wicyvZ6!^4W<N-{xDQS2;M1XZC|jYw>y6tW)B?#wZ~3_Xy~+mL{G-9
zrTDzo&UV%oufqpJYgj6m;qvnIjEUQ|qVf?q`}nwJb`W_fGwD?ZmbMUEB_XP!pz!q7
zt6lsie#jV@4u%ECd3Zj2_<%fs#R%O^L)s34&GTo^6u}Dj<QEipGx8BM$ha)*G*i>2
ztJ;Asi!+2o2c5ptPrDh?$}&2lc}TA25_yTR08qF*yc$+-*dD8%8egCE=FJ;OP<K|X
zz3)Xp4&IyVur6pjK`hiyz%HS;qMeA}OkGpE@AT=@*i0auwl-W590!}lnJ(#9WH(3u
z(BIXb_*qy8Oah$~R}P>aW9_@}2pSB6`kq$<HXSxofuLa&RtU0VRvTouteHQchNqve
z2tA11IR?~#etbV$g@Hqj_xg8wN}~(C-%sW+3f?e4I5g9FA%+VG*x=@o(Xr%Q7Im21
zxGNQG&lFbYV+&=Yk>B6eGFg_|AoQZ{k}A*Y=(M4qP0x>&aKVlMegPV?{p<Bgl1nPf
z`3&m;d*})boEkg$O;qAFt_&3LJ$(2Owc$r`G3~BYU><MS3r=dT3m2W8vwF!+kixQO
zk)%xCM)j&Rj>CuFSs&%$;SmwZh&F%q@+D(?AhGErlB4FeN^+u3y5K6VBwagQn-(PQ
zvN$`@7sG^t*9X<0HjU|oEdg_`?b<?qldEYY<@V?PbA20Lszo*aodqz>h6tlL(DB-1
zk1)iAMDqsdT3Fa`f=5UWtZZyuAlSspR7w(`=t}+dUtsR4i-M|Z8l2)p^H(okT!QyB
zpbCBmFAW)jWL8hs--N604}bsuJuQ>4BlaEaF7x*z_Tm#`MF^p&ljIvpqR`AlKiCaE
zetv#0UTonvX#vzQEZDqdONM37asARzTo<HIw7VVBt3$W{3KSYku8@lnzSZz?AdgPm
zvF#qinH}qhD|`^KT*i3!uU@@+0|O^ESH_Q%gM%aP|FN)@L0}8s%;JkS*>jpYIy&@J
z0PIF6P|HQDHi_)m<qQ%w3OtWnjX)(!^T1QlOh%|0&!qS4<TpX%h`ql$u_Y!d$`)#8
z2oefeggy#dI`S91pCZRe>(V7<<&TC{(d6>_DkMZ(QE_A<30)Ee_NJa5axDCb@cE(j
ztvQ#qw1S^LrMDs{3X3&GdO%_RUn?`u@#EJ5m$&`<fiq;Gk!9uoceVZ3n`Y0DuTfAT
z7Ir!E<W?i+mG{@t_^Y1WxOtNnPUNk|Nsu+<a=y@t+96Sl5r6`S;E!-xa*yx#N<*!S
z;vx2-@*x!O12VquUJV3(#xGVq;R9ZR-*>B#=-_ecsZY%1NVJEBK99)(VbD{d8WN84
zHwNuS=$6aT;XvV%wJz{kQA7>fzTDGkw?-CLIgda4SN}tJ;PXH|Y9m*-=2!ytiA~n(
zDtQ<f7+{P+2!G%An9Q5|H<1fNs1Ey~L*LO#ccsFQYe>?SPSHh~BG+SUNM2sM1c-~H
zCU6zZJlK3%NIH5d*_XVB4;|7cSo<g9E?r+z$T6cozMfM%>jV}}HSsFwMb#6m6IwRS
zZoy+mn<l%<_F>VkPTjV!AQ~GKLokwKy=2ENXAh-QFuEd#yE;0sWT>}zsfhRn1PD>0
z9}o?1+R;V63)0nWza3WO3ou+RZ1`e~VW7EVnE`F!AfU5=V`9x7;ZDdeT3#}GmdI3~
zMB%*+3@G3}>?+E0UZVeFwOW3kD&>9G*RNlX8;D^{#l4ZE0x=6vaOu(|U4&k*H+*4q
z!aW)A)<7#ZTaib51SP&HWq1<fFcO-zXxw1SC=l~AW6;C22UOM6)DpBZ@h`2pcSWpv
zw>J2b6kJ4yb5;?!oE#J?8s^{bF=#;xsGtNz&YjcbP>ni?aR>l@ph%te$$`|CcrZWf
z(bAK2OoC=tYtw*TOrecj+r5p%=&qG%AE%lW)|&|Y22x{=Qsqu2b*&OFC~JAu<<kFN
z(9pcpKHl1if>uhOIg-DND|5UY-rWR5(6y3gMcf6j|A||CTt~jNS`~Bz6y3rfKi2I^
z1;*7%(WR{LPF{TlTpHjMl(xs=D|4K6e>^`xtQ;f}g4dl2BC`Y9qvS=;X+Cu5kSgd*
zZ5o;h;@RMDq$+te06G4R2-kWa%3Xx&)PA<JfC!8?e6}6w3USdIP<?SwmT1h0<|4Mk
ztx)pv1=%QDTS=k$q4xhqm%CE2qzHU%W*NA&;Lz6A*0pJ(y;0%6+uL<RmdCZOQHE@$
z#ZhI+>u-&wiuF#g28*yJY%0S>s0m;3MTs_xgvJ3;ZQq&4XXP<ZLZ*wnmx<XhMLps|
z_I?11N^Nl#xz+fmqr(vcAOD#@s5_MWaaA*iNmddhB5>e9CmKKonh7Q-+=+=Uax;-w
zMQJ8$1OJsus6qXWpFY$l{R>WD>EW*sSEi7Gh!(c&RzM51x;Z`E1_Jf?7+DtNJ+*9<
z_G&-?0i;BPs+(q}=;YluEO^Op{L;r~8^4LS&>w&JY6Zk+Mb@X9E&=(I*&+rI#FpmA
zfQJYhm~w4-x@5hnmJYZ5U!`p2)BmxQk*>wQdD8(^yb!YxQ$Qf87=EINWu-Y}e=Ns2
zEHsowKtKTb4_r|2go%=uO9>FyKY~<o7n9o}h6L3p0Kzph`TrfzftwI(Lw@zklN(Pc
z>y=D<D>*qi_&O#ggV~D{3D{(%|Ft~1F8GkaW2F(`AG$BfEHGw$nz?R@E_iJpI3-e`
zCEEprhUh<n^cOHgl+m(a0`w3@X(oz~Vq#+-3+JW6J1G%coNgDjmzf%DB6Om$8Biot
zTSsq`GBnO7Od^A2>cj*Lig2|fyo{cx@F(@*>bA;!U013C^^`1vm44Zgf6&+%yp5(3
zsu{665b?J$FsNL<e2Qsplm*BbTsq+BqVL}y2p2XVVrPdrP(@*tKYiF^7MO?r=OWpf
zlZ5b{9B2T4`ve_{&>5l4p&oCtIz+;x5NsXH{NTG_)(k+M>=l#<l981)ZvJeCGK5O8
zdCS0MYKegd26NUZ;o!#T+ZmXzn(Fof>2R2C^O)-9C^<290U!0N3x(4Kg1}%I$C)R)
z?SMIk%G5ct=SM-pUzVgARNRCO<zTs?B>K;Zn3rR*hQ%MEg(yFG=6(o!P25<T88NU1
zDg2qAUutB^t*hD3(Ei|>p-d9i_sRPk&&kO>5iS!rLT;3ChK;`e{BxPu@c?L^Ks_6G
zl)|(k$`9>zTv-t$<!IW9^74bSFD=o-r2)r6?-TomPvz43EC|^frnC(T7<qmYV*^9Y
zqU`K3fb@~U_PxO-{8S|E?Vj0Pgx!pBNo|LL6nMR0&yZRA4T!302p;s?2h)XslG;ua
zRrnEPrHuV3@d|`!3*#UJvu~M0PNp5-pMmV%1huRzbHk>_swVBd)mR)N?gCk->Ip2I
ziQXze5n2q^T#A%S@>)k4b~*ESM;W>dA=M{jPO8yUVH^6&!lem3XstI;pF)gs7IJ0J
zLs&tXexL=B2OSOJGznP@gEElrk@-&;`OecYxMnJ(4m4m-i1{EwRYRyo%R$h|N=w7k
zXXc-pp61Ls40EMRr<!2mZ_h8nev&s$ifp+DQ8`g3Z?ap{VdQk}zk>JQk*p$JVhD2@
zcm=oCSaITOIW!-v;ydEf(f((C${?I!k$}l4AjA+v;b+%=g;v>sshJHMHbABt!Ni+N
zP#`zvvUc)-HcERjT1`}`q#D(5`o8<W_`?6n5stHwas*(z2?4_q^Q<<_c6#t2&_Bq-
zO<1+)sot0bIjF|a_0X)f#X|i3YoS?iYNjUx2cs8f-Q7b=Xd4)3-Nk=P6&Xi3?aIpA
zgG<mp3kx$~)840Jc80(m2+yJH4^^nnLzISC&%SuIlwLGV4FvO2(_zkdRGKycUG$1P
zah(;eYf!3b@;vC|&z~1YvU7dvcn<yabkKtYVi{n;2*b)m2~Y}xWZZc;GVr+L^e{N>
ztiuh#oNe2;XH8VALoIp<f~Xhbq--U|!C~Bp*evia`TjksB7+NblG3g!J~pCqIL(fu
z)vsE!ahQ#)05}-ux~(QAS^fIf!^=h3?SjDckS*9B^*=Chx6TO`HQ*>{VPlYgFm6kf
zRW8$KW`I!5kUTJ<@(7c*G-n4=O(7nQ1J-0hU{q2uDGU3yQ!miG`ifqPX-k&%&}x!G
z4Pg+0ci$sM15gkru^||2^yc5DL@2J#^V2B$_dLKzA~6|;91?=t58k2wVa0^(jT@a9
zvmB|sB%e7yTBy`gT8`R)zSSNb6CWMdGVnh_nKtbxfJYFhf^Xld&J*3jbyYRcLPFMT
zFSb=Fs0ViKHWdwS!^)@~F6%azvTWVHU2I{z0@Erp5Ike#h)dqWCI|cXq<bz&pWg73
zlL(Yak3IHLhFl?N*9c9*WdkSPKD3fV&qI&{XsSz4Z_U9=+5!*-=*bgLPtrc*-$5wV
zP{X^50=Dcqc<><X_6W?tmMo~Oa*ToUw|0;1Rk)T|@wNc$vRuIN2na6@Ho4$b6d(-N
z=IiULyj<fntI}j;Wt$2q^Fd46nB#(PWj^*xz_cly??eS44lxfM`=R*#rB#Uz2yS9B
z*ctz?Z2YzqRm1^9ld$@e_tB9u6paQN2%Xq@ZXh9h(cacSICwFSd2tx;F3(s^np_3q
z`Rat-C^7Lf+#=`2$Ttf&_;#^S*QubsoC!h;!psB;O<No69fulC8)6ot{<1_K@K8u2
zK9*<>(;1>dLNf#_#ZV1ROBUoi#1@AZVBqg>WWnPtAzsdo1GVTvI6xoCMsclFv&SHQ
z6o%H>*z_Q|TQ9678P-6C;)IY06u$2S;m~W^H1S>gN}Z`5`Ul0qWh$ek3F0{huMBMe
zxNnj37jsH4v05>GFr^}EfzS+4@Q~;CJusME4yUXXl+G#pI7wn53F(Gf@u4?HPY#2h
zuS~OquqpMI*S>^Mpl<T1b8&8nZi(p?sE_&Yuju_Ey&4iH3Hc0_xT~wn!(*THlfV;p
zx7F0@Q?tzBb%LHP{`~Q87VXfu2TJJ2GbB>fD4ZO^lLcS^t{Eq^LnJ@p8_nGXG7Ln;
z($Qq)<TSw$CPuC#knmx}t9j2t>?ZP`O)d~h=_aaNLJa~rH3v7u)OV;@bkO7gF>1iP
zG+lsn2B?|)#^uZn@6IXvAcVQgYHGr`dUU+0HXUf>gf)#eapqNTP7?OyL$Pp7@7#9I
ztm)tI5oWh;tChwYK&P!hU1D6M>%bqdsOwtlR}-_|=s2S+)JU!xOwB~+8)J;%sMIPF
zuLLndfH3kfYeM^lU$}tslIXpal*knf83OAyRG$JT@h+_}!C9ek!w4#E&4hD=H9UIg
z5Zo@s@H0eL!??><fR)~$dV`iVlEd&+z$d%06{s*yaT@fb&}MtkYUha<ZR3_KQEE3x
zIwvrizqoGeDumW<lr|#USg0`wF$7o3C?S)-S0QJS=q|*7In;Q1DopWyZ~SC|PW}1S
z4D!xpzMZ*Xw?z@`x!p03fl(XKTu&I3zkvnB(ReBvAd{eKL=*pngB6Cqzdpo&F`kz9
zYzMBUbD2Jg(iBF!x}S}JbHq$KM(8E!zkd7H<g&DYd6<*v+)>(waZc($_|TZKN@|}N
zu|HE72?NQGPfR>U?FMxg#J-0pBf^!7v7w=@s88A{hD!8QK$MFOEsNF26rlLIS0Kwo
zn?;LV=N1YZfEa$J!`LAK@%v4Q@@7!+mT*|HzQjxp#)wJ0mkDPB^mI>rf!D4n)NxE2
zoZ7Xnwgj4nCPt1>1UJ%|W(<7PUL5r+JF_xW>s<=)bIzTcXc{#d7QY~E!*GMvg)JUP
z=<PcTO7fKTq%W8D9x6$=V+0u5_e5|nvEc6#6Nmq~B=@7RaD!W`NXtwy0Iad`29g2;
zv>7;W1i*o=Nuntyd`XkWG_wT^`-}rVd-2mHG82X*G5>h44-@wD9c<zc`RPa#9>nD|
zLlQ@EkAYBomj&ayg@gwO%_ZvOfGLv7nlM3-Gm`X}o14LK%n%AYaju{as;|6o&l`wd
zEYv6~AK{*1$tffGu1h0;PMVlYLK-1RhyfQ}m#y(+F!H4V{}sH2={-bh*nE`1LY
zsXr4A3ev_JBMul924KFF8E1vJ6LAK+z9nk`L8fGSC%qa)2aVNopq`J~jo3PjkpgN^
z4kKW^zZKI*yD`F(R#=Pj7Gb~PYmT?`csRw##&RKnmM}Gr*?iK38)0BfDnTYhC?TW6
zXx}rxJf`yngN=7tzJLGjkCC5}U{SKI4!=YMvJJ)VAxZ=>R7Oa~w3g@-#L1CJ5@ueZ
z`UV9pfEmE-28tI)i-%rF%YyRWMAQK)NjMn5mq>gDI8u9w!A1$u6f7Uk4ZMzxJt`))
zXo`7;cag!2IJ%HCn&7fv1bZIf7Ar|86vVg&-s!rko+Gsp;2{B0$~J`N1sNG)Mu6T3
zs{v8=7gP$jRzytzpONoS_^NB~Fie7(F94GbZddV%Xj<vnbX0;l#H@@0Gf@FBAqeFa
zqa8TO&}p37w4FFSfpO(GuvLywyP?=+O*K2f^m>TZ%UKZ}8{3bmFHWN7uwc{+WOk{{
z+u8E#Ch1eKj~@gP-ZJ6tyM@BXfTBPMSHzi!I<Q7->q(4axUpa~_zQ-lULX`GR(5YV
zd3D9-&FHB>S!OWzYC^Y)<p@-dMTqu0sB#}{+6P3m9kUrrNj6<~6ylebrnydTR@|g^
zZ&LQayF(HCWirAm-U?S4XeS5u>Yr2-j5{Bc%vE6UTB-h2^`$HI2i)~p=W0_&=GteS
zhDsK0{yBL6-3exw%*H9cnuV9#gFAT==B!qbB=*6(6~vJQC~w^Av2k%dbG*Pr`Wvt5
z>dsB{si>+R;^1J~y!p88@YQpAR3xv<`ub6@W$f%e!8C=bk(`opAZQbbbavyT9R!+c
z&DgSM&tPxwd1_EJap!r#^QJ2#h^l)^<ejapEh1dHyodNj-it3^zI^uVSzB8h<Zc8N
zi#x^{Rm;yoU6;ta0_jLchn4j@=*}Vd&g+gJJEod+Z8htg&`{En58i&eo9q#gT7nSn
zb2BrWV(V9tT0HPswY9bMQkZ=j`~7W$23Zwh0j0PCZ3**zei;0*<iz)v(tpm(EbwNQ
zr!Ffm$E@<U%&lul5*MMYSXx>(XS>K#6Py^xjB<NxqRB>J>)h|YK9QS6JEYFSDGUz_
zyMF!pe&YVQd3iU|&>V0Fs@K6R-gCLN#7*KAngn%khoD(2SSmFuuuF)bdDt7Cl_VC}
z($&?~?oSCr>fXJ!pAsb3{C8()95!#>jBeB?vW@(HsqctM{nqa82j%LdX*uAAyKBJj
zFpuST>p1y0@IPK2k&$d1nN>A4A;)yw-c+n0vAENNrQ)MEOYPme7aZ<jk0loNxZ!0d
zhxuu9Bcnbz|HCu$vvTCQ8O9G#YQ>!A{prKP!+CHL;9TS?((uwQq1$iXy*td>0i&t8
zx%ofu%FN0t;touYbeWYoHd5!$KQgGx34BZ3@4Kv7exw<;1!)Rn6gOk!O7??7%Y^O6
z57FE*Hn#iBsCi@!sq~m~f|l%Eq|P~hvI!7%50~Zc;UPm7+ot(Zv~qKE-JgQrd+p>o
zLxj$J2*xWXdn!EWH`CJ(|M|6xxKz?+1t-Zov__oop=O0{_#9%@(m%xdgg*OOT$}}6
zm-P*1QnD9kV~F*cW`6tjZGC;c`%~;P8rxZ6vh^^%rX)nX1v~-{EXs9bQxjMxIRZ$P
z810hQPqgg0_~Rz3Nfpdaxx1iMGQ^cXeb5_Yx-dUa&5EuMU>CpSNdE4Tbc-(9g*BD=
z`DYM+<jbeq<DGgnccs(=36?bHg>>R#KtfD&92xd(+LQ$F3*sZ{Jg@rxFp&u<m{!2<
zogvaGH7V(tr7(%)^D9{NRs3FO<i?{%>&drI6Zf*W0o<dzTVLud^ri-YE*9bgkl|Ky
zlg5k}0*;@4A3!2ef79^!8JIv^T&qVSP!hs&a;PO_QT6iW$`}={A8!e%zKTF`T_qvw
zSV2j!q{PODzDFQJBX~srJTP#6v{UBaUku0Rj)Vj?a^Tie@_jq=gBPQoKQI2hRzXY4
z8JdaIS!ih+H*VY?L`!m|2dM3C{KUh$|JbpoC0#O<#gBT2npYewItT3qyN;uV+KE?J
z9I?d(Wx0rniSZs25b(Qo5IqR;dpU_?7Y>TPHjFk6VCTWOtlH8K;;!Z|uUxeXzA`_)
z0Y&YcuphI;g$oz#?S)ydV@3{$iM)ni%D5abnv$27cK~%9FGrq}Cr{GRc>^7tL+J+y
z*V5NNM1wWm|7sn{^-$5eM?yDHFxwSnCyX&1$m(9uZUu*4a+Fx*X}jxsdg6AYZ*Z1}
zlT)tz(>w|MMe;5Z@H`P8wCU;TyjP3Wh;JfZ3e4RFT-aLFz~{xQNfLs_#>Nn@zx0|S
z9lh47OvFjBJn;5rbB96v8tjM0hbUw@@?o&wc^`Or`P@1v?v8T+WuXwFp8ujkue5k_
z?cblzVhte$s?oveuRBOt4j@mg?l7Y<t#MYE0rg!$qbe1@aqr$ecY1h?_kR-Qs<rEN
zT%7D(6oPa7FPK+m4tmm;f6$XB!ae7XkaVWYk`@s{h^f1WQGP55lh2EGtZsuC_ZrtB
z4frAY5QJIkE+Fadm@BpX`SYhd6gm^lbHYZ+k&gh#v|O=5EQG5^!<mGV%!_HPl<Pbz
zNUf!@S9l=Fe-Sn!Rx?L_2u>^%j1y=(@SWdS;9vER4nO23%^&iw*eb@mhNOQhE!uQ!
zbX30-*}CQ&aWJP<FFY#htSSTF3XlH&TT;~C1$nRJNz=t;?3a74kT==c9*aCUI9OIz
z_VMFKC}VJY6)#`@=gkYaAk#CQ9UY~ir#-im7j&1!%P$`JxI?dv1zB!xD;d8R77Cm_
zF8&6j4CN@LJRbo%HPE24cV_+{P<l{_oaVjk?7J8lkGykim9C)<QJkEdMA`J=CytA>
z=G@u*!(&$L!%BLQS+VtT=7w%svk{@8Iql|}tZT%de*Jn1J8^!O^y3{P@D0wrS;fLX
z{&W2}AF(z1`!RwJUH7!ESjf=e;2s8sso}PhKW@Tv8Ll|_;TUOJ@zCMJWuyTl3*)Z%
zUUlT-Dku<GnBE%9yXorcu4Bb%=Kh+5kT(@GLf;As8tUqhq?@DygMu(fq&e2`r?d0k
z{rezk`Cq>}F3txy`z1t0)uQ;odDyjUSB><!YtY42RsCTAqgeQHX^)PM+MWo8o{6_X
z0x$aY3&iHg<lT!_cCn<^S1`+|R<Fif)e(MvepuODT=EctQPSbONlO<L6~#irY!U7P
zYeg?cv<BluiJDq;baeeE3q6bz?AsR(UG~8OXGdpeQ?^S>P0bVvE<~$Gk-5T{Ag4SR
z;L)Sr-d@1Ll;q^f($c8HB0o+|@aJs(6NZ(CAYPky%!%u>8k|0TuU2nyrc`>}(1{hT
za~>8VSXYT~LV^SgkUnz;o74~1fiNueLv&xne-;=2hn<w;?ItA4%?8k*zaKHT>n@tO
zh_LY6h=>JzjVA+F{I`uToA7dfT3T8Pz<!%<J2e$2Cnt`9l$Dm&W;tcNeS4GRiK+<h
z@ohvZAiB7Qwic{;#@(=SFva;?_Ws?-$Sxcf$FxOuk8<+j1jb2F1JOZ!CSge7^%)=q
zqg$}k>fn@Nxxf0DA#^drfbteGfW5@R08l|<f~gMIA{@mfjrM%iVA5tk=FXi5&LA4`
za)0{Z!2<;OIpLtCmZ^ZM5^Pfkz8T{mp!l*8n)ptv0VYmy_+1DR9Iz;kMn*+PtGzJ5
zs0(qjrZsofWIo=9V>~V{F0!(}(6u3qYu>WC`!pv<LRwmSQi@}|amTi8Rsdq)GDp>t
z&z^b9Z)zasve^IU&%vw<D?*P$sCs+C9Fq5n6)T?qq5!7QYD+6CZzhqC7~F*xpf^7~
z@^92Z+8>*w(jqJ@jESHvQqX6)Q66Upsr!b8hI)F=QQOT;#(8=cqEGiunEBAk-o@Xp
z@#!VO&NR2QjMbF<ft^Nl{G1oOnnN-&GGbz4f{F+M2jdj8v$H7KN${nhtH9!b%*KRC
zq$Z0+bb3%D^@|s!mb>syQF}|AhQK~z)FU%96AwdJy;Ab()vK14<1H>rngxT;AE%#C
zCJoCvIywdh2I?P$sSXQDN2e^)!REk$2si}({{D#j=1&%pVPSh&SXyyB4{1119k**L
z5CS<k3=Y-rbtj$^0E=?fT3YP1r<WIs;w=RQ1w4!aP?~PfiKv7GE?)<L=p-DJv1b4w
zWdQC2-oAe02GL}{KHLId2H@_=lP6+kt**(*<Ee6k9UTPV_B}xqTf9QKVI{u%Nb?u7
zl6co>DEXt#z4g-cpkr>nx{mLdb<GsgeO7Gu96gPhAiwp5@yR`@+|(O3V7!o#gG~t^
zP<VO6_M>JtHUfNn#uab9P!qw&z&U+6HSPZt?G*kX!D41<xsi@8LAMx&4Bi+PkqW?#
z(Vtm(ASo#+J(3O+y(!KM_Ii4H>0)1yXaoKIU*Df{+riB4%KRPO6rc>RuS!p6<8Wy0
zc5BWGR1(&c_aV!lN9};BFE3wGR%Q+iH2(ZC)*k&QX|7ONNlh)?dO%Ihz5#Q#DBKuQ
zibk(KbZC4CJGQuhN)(ZYi7Xs?@JQF&vtx%XKAI5+&Ws_)Bj=t0#6rnHDU}Zt#3^5P
zsqfHgx_<v2jeDVus@GEyX(dl48<Zu*8SUbR2KC;hb+oj;mco3`{rn0#iju!!#a++1
z#mp*eYC6GlfU4XBv~%}BWe$eO8{b`GTfO=o{-Lk8w|c4#iH-WVpNp#na1Kg%)l}OK
zEF711)_!+f`bI|HsN5%W6&Owtfe8T0jT877ZOud|APCe--bO~I+KyaP8&-Sx@#7@K
z4*jF_)Ts9Xrvr_;P+%OzLh@0+1~GhE#hss@zkU05Uc^a!d$z!DC!&HEy%H!XEmi1_
z2beE;$>*7mrj01=^zVYR2z!jh9TI||u<((?hm{x;Z~kILN=uzJF^T{1!GfuR^T-ht
zayE_y0Un;1`bl-nw*s>APL7V+FV5TjVq1cki$@i#V?}hw>IQpxgoH5n{^w&?$V*9W
zGhwV-n(g9(Q^T&VuJ^C7KPqU42Pt&y*f6#ZP26bJ?q};aZhTWEbN~K*06c@l_Qi3n
zY-c9~-5rUmIy&Yvqc_k?(u??=W-Xs&u358&h;4HzDJhJ9X+GJudGnXA;2_)h9%r)i
z@+NaiZynNIP2yvNbz*G%i~DMI?3LsN4%QAdLKH_S52ztQC+wc*LnSP$u8tQ*&%B9>
z!Rw4-hX!R7BESk^Pac@l3!`<1EFa&ycN!kIL4R+r+Sm`9{#t<f$mr;FSV`&o>!KPn
zY)qk6pj^XP2J#M|a01-@w9cthrz(>|$a6}>YB-uQI!qYvYa1GpUxl9j<L2m?qLLDN
zV|MADr!9uic^g;N(l8p#{ZNBb8zG4@0)^=`O<(EjRa-DVP}%w5RIK+lQe_}40|@g%
zYhbGy85ooiMkh#~lm|XboQ=&RAK)$QCJ#TqNp<W_FGQTitH<kD-LYP__V(pzz=({D
zjA3Vv|M=`Ub6i+B{oo4-uCKJ*6V2Ptz;jSzs}ppZ9?q@8Sh$J}E(?00%I(|l3F1qB
zO~)TNc#v>0QD%#ai&63Zqs)I@Rh2594W$)2r_=+~ktm;n*Veqeyzt+65$Wj{%E1AL
z$uC2ri&d4C{{B5{uSoL^rLi11pyapeVQ11xSJUH=b?`fgaAlGA2O}A@wY3>>bnye%
zny5E~qcArafzxx|8`iJSV%7Bpo<U15Q`OcE(cSNm0FaZyqj&QrtRg@9Yleoxct}ls
z#9H^Kphb{XwJu$%`2M}SyDa>-z0Tiz`T;#T?epgoXdsaHu%AHd#5g_~UXpLyHU0TB
z%a!i*&oMC%ClqxVISRYbNMC=)&YiIJWC@!1ZowN1+>~a%Pf$=0?E-@$$bPU@Yzop8
zA--v@4FNZXYK6-_c;LXu%sg<+N3cg?D0~gg`{d-<nY&wd@75r?7KV4|3*x@y<uQxe
zZ{4{wz}GjwYi!%rtq^iEtoq)9@!#(F4ol@hmzGi&8WAunFAXejC8a71vEqRxS}H12
zul~$n`UztE-hKNJdKlNWI}r>u1<(fdlkI{(OMFIN8Q({-MD`muuJ?`?#6(2+1O%L;
z{!vm=QdG3nO1hSbCZO6sr6R|B+ewX*LsDnqL&J}9yL-1K)4?ww01{0zDk}|*7Ye$6
zKtPfwL!Y|6{Vb+X!OdPge-67B`A3X5#HkCcT6Gse@bkwHKGlO0#AFQ6AvO!M4!}Xg
z+<1Ko;auWb0+m%&2mEWjN8KjkY9kq5C+LIrY}&Mm7aL#!i&^MqA0D!Up0JJ;ZU&G5
zaps7FP=c=gM#ft_20)8UPPWAKKfzbcddedjdBFT$m2~0Y`zWN}sMFUJ9!juK<1Opg
zW7@9@V-#<(gNQ$Pq%y)>)7+;{pAN!WqTB(wVH%!jka)NPJnVz=!5RZM#E}8m`mC%h
zT-o?9JLD$D%6NfqF!z63W#AHs3vqk5JI|}Cs^a!AXc-oE4OPWs<IZd30heN@_;Ab}
za010ZTnG2X9KElfUrcl~MpTg_mhd$CZ%`)jLdzI&x)pjDvzX&q>K{LT2sut46C>*-
z^cgq;q=5<Gni>H>2h>e~MIda{RwPR*0&9||i};l^Ggh1;2DE2miv+V9-)DrdKrh0{
z-us_GGD*X_2BEzTb5ld08cOwo7&C!a*^GmjfT$1$Ecb<!5MvE6^Z=kB6xE~sP0FI<
zjgPcTzxIHs?&IY}GuDo=LQM^gXj%-_Uc_64MmJe8;4shBREtZ+aphj@9M%*o55J)X
zOLV&FDG=Q(_)&xxAnY?=-}q!j7Wzhn8U{4rCHD^?is1GGjZc!Nx7D+qGw<D7Jtg@L
z*;AHNTdUgb3Wor32U_r6U~~qJ5)%Nnh;!ht?%rOA6b<N$=g;>dC5TB{-XDY^HZ@ez
zOgy&7)s-~q3k;@_?W}n@7|{lRFgh}#V_H;Li0L#Unc>I-RIC2dJm5~hdFM_$m;#_@
zm(d_DUmnMj;GT%nL68y=2{F1WjPi6-xAmjfX}&!!AfUItXRsw(9D}K^^Y9mWP`$&L
zpikeO)b_A%=V{#AKvM=_m`^4*LK;(NfG2<}Q#b{(olC2zeL?%Axp`1Rtvc1pT%4c8
z?Wn7&e!m6J8U~DvoSZX;%Fyy5Fo?o?dD)U;dc(+Q*Y4d#&0pF_^xqw5fEEVsU8{aj
zE-(!U>*emfLPB;xO5EJsMZV9UZx#z-W@2)})GOGKn!0+8w(@WL+`aC#4Gj(s4j)pf
zsa9f?<a{1X{&b){sk7jd$TIc;&G*-TU`gxLPn<Y`$s`p6e{XMj&GR{Rk$~;#mzn69
zndJ-B&(Ro;;DmmFAV2>{>#Ed#Hqz84ph*l!sLyu!K7Fd7ruNhPToG!OzDpyVnQ#by
zDQ9E1CnqOk2Cg2fa9=3!4W5iMi(Q_c{{G`ffWN=0y86;+A(yzlj&NlNbTtMBKh$IH
zuI*Cafq_v;T01*oB|kvYpo1%R8{_d}HUsrmi}N$Te_xxNL{o5HnB_Zqw5Y18>dTkk
zfQq}>K&8K8?IDEwXL2Jqpo=1!p+In`C1X4idW$h)<CN_0&dwD33B$>%^X^Z{yy^|U
z(*)=f7A+8&Qp+&;kc&k4aqI`m9zHki(<gwC@}EDWbJI16<}y!@X_Ya!`%3kyR!UVU
zUAUn1-d|vY@U1%A+H&LRF~^9P%h(^UjEp&GEMQs(4Gjt~Xh7J?A~sK)#(*KwZ}39j
zB&OAXQjwv00=DNbT!@`rT@4j5+L;-TZL3Bmw@vNFH#?hcju+dADO+=MJfY(msAF`r
zA#?-)3WH~aUymmqSisDm)n}iJqunhCQ+zces+j|N7}y+A7vD27F(HbnXHZ<UG)`Y#
zg6UwsfcGt50y;GT_(Dp&A3aJ(1vE1=L#x09Bbtz2k$<kJI-1qlv($tp2USanX&8%-
zB&xWb3^Darh`2Ux`pT70;C8~ov#2=9i#Yp^*C-My>?cbvBzk?E7Pzo_7>i3l6}1)H
znVDVCLcr1fbakOUUlt)|>I_Puhu}a79&Ds~`ZOBzH15%6sCi;^^avN1xXYp=Kn_Ng
zGL%Q>rX~l}8F`KC2?@_Czz|Fp8s_*4aqE76l=+Vzts}Va+_?if{dxrECLBg(zkU42
zxW&S$S;2^eZ+B38VYrD8+MP*L`iSjk1fi{igZ8J}5g_b%(iqG#`0Bn8x+6vK^t)Sn
zdeWZtH?CjD*+d-!gE~YBl$q}CZo*RrTM!j>LbF57i=U<I_1+6H5S0a$f?YZG7+@a$
z8y>}S{dxxq8O$HZ-a$b@p!+x*Rg?2@;SiT<iUQ;YfB&<(V9l?CqA>?q^0mr$=Kb14
z(`ngSfy+utagz^{XFmb}L3z4ZC%jKY<dt&zuAMupjGoya0Lr7WjvbOzRD707yryuB
z6=z6I0kKU?7V|VmR!;n?tDC`~47|-EY|O;?ICLKzh()bW1xEw@1pWu5$FbD2-6ADW
zE6P;z&|r~yi#WRlA7?W)6>Lht7YyWp2u_WR?1aDqJ>K2<ZNRf<+?XChuh=A&|AYzb
zKL)R`u#2jy)A$hR;1Gb0;^+um!$;oUQ{&@X?HO<)>ytsnK}Pw2<KL>QKO)7E9_anV
z#1F0n?H0c=gT}+I5?}eoi!hduh>h4xYan{q@b4312v+SXeE#g&V>~?JnwnTAaN_ed
zUw(c6Zadx$Vo4lAId$qQYAPgDVQgPC59Inzv@-Xn_#Zs9!T?XBfG7D5@+R5`++#!`
zFo3>_rnLxEa1yEfYE>!>4ZL`(Yiby%sobA_`631J3p2LZuJjm`GTfm_RkY9DyQ^3`
zFkptj3pl2;l80^}u(!QEuQC$ji6PMEl)MFT77kruv(#=TCNymW%tH@uJ;ckbh>I!s
zr<rlrE&~1ZXrC@r@_PJuJEsOZ;!o~}etrxza=|C;#=8}tJlhD|fQEaVodwMNCuFhG
z(qVL8RJDWdC;$?er_MNd90QQz;vw|q*um)4N`P)icpPzHaR;^S#$^44woo8UWD8zE
zO9+Iz)b~kAuZ>0Sy1BtR;^-}feG`$3n&iJ%P7xiWVC#9{<YI8ux+*d*n8n4_H#F2Z
zewzUS4#pux^s8}clnJa06BFScCSbrGDTTkG@@%gfn-KXYAmE3_4*`tA2y^yAxpaaU
zuy(Bnt{w;+SAn(rgb{r_;){tx>l4Zoiu&r6cOb5yi{asyd!LAunSGspj5yeS$v(rZ
zP3rCESM=qO9x%?cap&>ts4O6nNPi%=BIbK(#VU_6HNqW{x|VkLj^o#<n>g9oWtP;M
z8XM(8#AK<>EiC#l4PNRtmo8$~O4@R)D?i#lz5#q45g9i#k43;$irNhBt~ie^w1&}v
z9Y(3RVQVYM3WaSSw4h_hjzxLLew}bTO`Sx}Ks~(!$@{p%(dEZ!aq!b@eipGO$(2di
zQZHV-h|=L>*t{8M9M7}^gRW=FGwIM6=={`w?TR8(=qJ!h?zp$OiI@S#LOFu=hDDnK
zrU81r6fj+sjZ1i4jdQxN(_BFIfnL%3pd#0w(k{2V)A8-=R}4PIYJ7U087KwjxCA8?
zBRyU?^o;T$CgzNomz0zYi}!(%muWM!XD%faWfl<?46h#sG=w!gQUMhiDWf*=k(QP=
zdAz#3d=yQgsNy|J1DgLH*atx3;EzW*-sD(A4R||ljh;GwOTGtywzn4yP3|S{J9zwf
z8}!?vUAjavk@PzfZ*t>L38nD{L#YR-RT!7($qx+;#c-y1OJZo~Rg6?7j}vDXA<|x$
zia=;#qnt3Q2jYiG6HvMjA3wsOQ;K*?hXsy^NX3@JdF8%zRbsKlCKtjFH}*r#Cg$C{
zbK)n93ky*N-t59DHsaK`ni%1&46k~Ay}bmd6TElw+<$ld8eFgAH+Yc>N~ZePu6>E!
z?$r5n+mn+Wuvx0(Fl!|<@EpTY(}eVmqevSNu+cIFfTLDuZ2*WVBJK*<9W0d;`(;G2
zj0!J3H5E{2M{q$)OUN1wSi~lyAbu$>e&XAV0cyZa8U2!Ch*XuAXqX8YPI%rU$jiEW
z&o|=q9w6sSaXcPrhHWm0TNefg`uFP*;2oj$2^crLVPGHx2@=x0d8HQb4)oxcaTtYm
zTfL!I>@_BgKYSR&!!*Ghi77jLJEl0fpv?eAen?9CWZ4613H-|g@!>Ou@0erGCGH4O
z#Eo32_z9%7fGIDf0!&&yKHNSzJbYDc>!shq+GuEY4h|Kz@Gmd)a5Ufq1Z4Bmx}YfM
z`^=XP!9`h`Zl`-Y?#s%~o}pVn3x+e>j*Jd)D_f(`#}Lc>1sp{`6qFd|!E0T8Ps`|f
zHPt^gr>I}6xH_^=#zl*2(0K3IvE%I0SNPa5#w{Cu`(TP;a1aR53<eIMCXma8@|}0w
zon}TOkeO0keB1&8NX7$Rpt0bWoQ9j#)zz(gIKojmFsm0j0(sA!^W>R?r>yRHdhMm|
zxdAK;ghs{6*Py+qZfA5)p3K82rV^8`fx(Z)XFwg&r%pY1NkfDy<z=Xcg@d`mD`q!(
zz3QI)D?TG@WL|yU5!`&QTYgc&H^k-^wW~OMt+KTenuY73=dn@kV>6gSP)Z%M{k&q;
zno@ten6C%f*$c-R9(#JWN40^g5RMJhZo*>C*pK)GE|4X79!7v)=N-J@pR=|0;l1GC
zJr;K^E8(#NywlLjF>866W(ze{@}+~Dl%3|_XW4Js!FnB7QmW<r#bkE9g%NDoPxXNE
z+Gs&*C7cEcg^+E?HP#IPbNR?W*MXbyhz(Jod~{?KRX``c6PBWA>U#Bd@mD^a=}sR`
zVWFokuc(-Dbgnx73#}M%2ZHb8#~YJ&$FM#e*=Ys-0dbuXCvQ|P7v|&Hs--JC@p}Na
z?`<CTIey!^`Nz+n<ynzRBeo}Qs$gmf^+j;7-bO}KQ?vUempeVm7Q&nn>caHQ44<lU
zigWJlBFvGpGi7L~I85&u#U|u%?$m2P!^EVurA8;Rw#_N?U5O78J)=JXSi?EcE{2IJ
zOgLBVJwWdX1ecbcj>3Zji4D!oxF;>d$yc0QOz%BlT#2E<+(1wN>OV@daO*2Mb#>dp
zR!UX7Gty8-D_Gdrq$~GdU>=Xg+Y1BVf<GSWEiy1ND*P<ks&#-&5GbLLrF8!M`ifi~
zWMo*D&MiCu2YA@P5zTdKsO7^{xmEdDV{uMcrmkn?&bSp+S61RgYFw%2h14Y+$wvXU
zKfL*sk53h(AOrSNK$~OV<ZoduFtK837Uw6Fg`tKm7Rj!iBesY+NJz>9PrmS*wMwLq
z3L;X3OR=3SLPA&I^K~bp`r#nvW-0W-YMk6Z?-1}O)SVtu!IM0i9mgcjoOv5ue*vBB
zxKS=zf9c08DGUimpc`IDaX(ZgX5a6z7y2TKzfu82l%$5=D3JHx&AfO3&#81T9rovD
zoR=`jNh54AOG{o>{MHT7Cg>G_OfagKhTHBYBn%<1;WFX{%+fzFfCqzoz1=u_FkkPo
zo!tx`0ASDv5BkYoXDh1-)PsWj{LNBmAc;VK))P8SB`UxuHw`<jtgM6#JL@z_NQ7To
z7Z)Wk<X>!_zlZypJMfQ}lcOVJze`j4=c`U7(~gS(Oa`BI^46d^EA9(8ZYgyZqbX^T
zH^i6f1Y(6I<E~$ic1idmcdmOAjAXyyU`{qR;t>{V9s9O}NyE%|E}X6k!BbM>60BDt
zK|$n1Q)#IglpG|js@;dAHe2xu&|W8}1r&06DNOHRqyfmec9lPaJuM+~GY$5vUgLuY
zC%R>w6T>+=NKWoqKX67C=l5iyO}JnlIL-2UK@J2eW<TOVjN$iGbfMb2KZOyRk&#i;
zL3tPk$@RR{$&>g+FetX3Q$(y~aY1Lg@$v$E0rSVa0s@g%>4+1E-dDNw^BqU*p+7?}
zMbu^Y{sLs45k2Zl81XHv=agFvjf_0&za8z6B^1I0wW3OlA41e?ZM`b>AUoRyrKHLv
z6jNYWhW`8)Ezxh@xK|(CEM<E_3;0=Z4Y+rTwe-8y);c(y>>Jgq4kwcFvazGOmKG?v
z1tSU?mfvD`JhUkk-FV~oRSzCLy4GtC8R?7WjVi>0VT@_afqnb(plKYwjt?p2hFN_r
zzm&PpwlrPP;?D&I1$x#~($ab$N7n*)084N-0$LCm$pK(}*dUCXf?XqzPKbR&oTGo?
zC~Yh94XpN>kbUOncAj3G=)9mu*ytAWRVcn{PBJCCz<Z10(?b$!3zaNfisM20<Ky9f
zpQlFqm&JHpRIytN#~=^!WC{OiYzCG!B`fXstIE#ReHjPnsquUSsSpmF{OfRzyRP!s
z$Jh6ENzoqE2o=x9T923?Da`%cO5W3ONXiO{=PeNr!yw{{uy4A5*9oqpazmElh0g{q
zYpAVF<Z`+bq6!@a=Q9P@05+HRs!N^K*Vm8eZFqTAZZ#nYPvNmNi@0O=ry!QdW;_^>
z7<Yr35%r@8$|WWs2?ElU#X>w50%Q;#+upryPS1!55CAHgy83zyyX|CT#3>j<v;*<R
z0w?0XOt?3_%PlQ^s=I$~LpA1!CgUN^YiHW~(1V`|g113P;?zh}_&<cb2{@K(+xCA~
ztCgmeRWxXjwIXRkniW|MNF^CclqRA<BV}GIDvCx$14%N4CLxrf!B9dfDl{i08JqC^
zPU>0D`~BbT|J~cOJ*%y_@9Vy<^E}S|*pL0#592mM>7lKt*>S)^6BCpBBOHn<%4anG
z)B^ZMT-uuRM;YuQtV7&{GRjn*(opqsZvKl*kY?%Wb@YV_O?+5v-OH-bQcur2I5;>p
zwUJFRojZ*K!=yu`_o{!6FYcsnKQ`L56mnf{g%_HH?yECsg}aquFlX`HaY3W}HA(hS
z&O!%4w2f9(z4vXg!TLQBGvcUda1%iqn0Jt@?6Z2Ykjevzn2s*&C3|7<hkrhfR*;rz
zqDDkP5}OwiwUAU}n4rsBYpmsN-MWPj)x*YnUA1@TDxdxwBz-a@<k}?J<W<Ya6vI+C
zYc4Jvae&iKe!Yof<;F-r9WmSYi_4XJN20zO-s*McV?od)=eKV<ldYh0d9p2V$8qWF
zDe6AgEo>~xw~xLRTW6E2)al#4xJ}2kv7lkgODV7*5y!0>zW?uEk!&?l9>h@9F4(ea
zqjce{V|igSdnuhRj5fJ(^X7zc<6!4)kw>YhAOIP1h`cC&NzTMYmx$Wrj@~!fvXBe&
z%*+zbo<%6Q;_B;8H`bnB_@U5|!_UCt!`Ig3ATjYG3-I#Fvm)UH3#}MwCz9oR0fpZS
z%>DM*ty#SqO^NNX;NYwDUO^PNy1F_$f1@QgE+xg{%n**ewA|_YQ|-YzN_M@Hy$?nV
zXaa5uEj7uXlmcfDA#lW=2KO5otjDg%&(54oFo*D4^4#ump9isNx)B^zqS|b}Hh$`)
z$#5$2T5f|pFH*U&8<~lWNa@h(@agBYZo@0kNlMK#A~SEi>CS+0B!}KTR;lYXcI?!t
zn4<@M37i;7<SNS<i&$2r5Z|_%4)5pt&E89akQ#DG-5HKCOBAB<b!X}ZYiMl35a49J
zAlb+#r=H1Gc3AZiO>KVkfK?P(Lh}zz2#R|Yh#^np>*0H$@vcM;Z@^e_<w)%ivW=%C
z3rBKIC-xiJ)tERNXcR?zR%NC4b0e_=?or4FIU7g;dv<Tz_E-FH&m#9(g+2Rhynp?H
z^f&tpN~7<*SMzU*?bdG`Hfji$aL4UgUuv0->-qgXSKfXnTMckH^_<jL12a)j{ZYuD
znKRMadONy(o^0~1Z46bH3<}cz^{-#Pd{kV_qPwJIV;QmxCidIQ%mcy_^ztU}MF*j$
zTv+?$&C)t3hHdT~iRbtM+!&`0|8~8bqj)vgZ9HN3xuj)CgT!MEHN#Egk8{6%*D0a0
z$k|waN(72QaVJmy(|COKonBfwSy>dGmmFE7H*;ob;`;Q=Oj}Y!GJs95S-R8?$$(%!
z7c5*ja^a=jsZ~S7@Bg*GFk$nsf1Z8XLZTcS8|%3j6EeaeZ5XP~BAJ9)gef6dKm02F
ze$j%$`hK!zv-XfMhlc(c(~b(;4dzQAWTbC8H@1;V_W0z+7{jKfCJkt`*vp5ntUonq
zVV4ZIz0r406?Yh~q+|{Ac`-T~@|m2OyG7-d$5j-+0>w#bbMXUs`BL0=QIqf^C{C$w
zDaHo2Yuh#;u~>F5cuGIozWi$$WsY8Ea&=P)2_a9b?f$WRdbeN1h&Myktg9QN>vNAa
zu8OJqvnFQH!uTN$5X^XLDR>4PIWl4V_`;VZble4bN3R*5Gr%x;e<LN9h{#CS#;^X;
z`>At6{aYTo(^Ty3nz3`IRB<<JPC2v`@wcb$hM<GH-jey+a0YFT(q?tkt!CZY-Deq_
zam5Og<nC)ehnP4QFKNzv^ZNC9$4_5e0IfiRJb54wM99hTaG`Jcv&Ox-7{!a~2YW9g
zYKc`<P`KmVn^F)xk>3VdQk8+`Mlwb4r0%&atfGg?t9ctg|0C#ST4<*rBIPzBA$6iO
z(ON~Du<F4uy}`nDVBl6TdHh-fR>|Gi2W#?Ad2id64!uYbfz8!VPA)6w7*+6O)tn=v
zE2x=1e|JdynpRg($b+YBV<L+EW!+DlF#&d$s;f6#zT|8vSGvFX!=s0)GZldU?;*T;
zZpUdfc%tL%mANrT%3`lHKA4tT(JfhTN&iv5ONpM_(69uK7`A=frHi%6vI7QOfw+ag
zA_eDM^gdU6Ncy_Q6_oiaSFY=3-R;DR#M1H5y^q|L=-)aYA0Lywdh__j=SCG>bqBMi
zSM1N+<JY)Kc3Huvo1(S&;=It1kdV;OWnDY(VkhNfTvR^P&ROzpd+8}!NOLqfpPvjK
zYJG}13Kx!ODhyIq-gzlilgchcWz?hy4my%F=gy`+y+#h$GZy;*MBorRm)1Tt&o57F
zh(3FEuQw>8D484}ApbF9>dNBy=n);>@&BRXwamie39R}gP0fJJT|Pei7&>|P=NTRA
zXFYNi&RNMk`OAaE14H53gL{E`m=_mT7~4<W@q4`yQD)!1P2o9D9&))N@nzik^VOU+
zFmFMm(H}mz@|dA+R97T|BDX-G!0Vg)h<EI3R`-ETK)bQ76xU6$W22l(m_6h{XAHgN
z<>hs5lQg3?N5`it^{Jr&!okeQNDl2~|2H<odyB&5w(sqprffYBXhXn_ACcOKj9F-T
zr-EPK{vq|=?k==MasROG0SPHO@i<U<N4xGV3hQk$$-PN)%$P$r3FKO9%Rg}FbF{#A
zojG}u8~i%};M3jQCSS9KDYu)N|9+~T^sG<s-uF*+naysk57v9?eCEL`7sV2TaWr%<
z#V7vx@dMww7@EY7E_gq9UCc<;#s_Dv%!yCzHDJJi7K#+~bvZHd?6;{K3LZS5z4NrZ
z+8`yR4XherGMb>IM=~{BL*roJ-q5d?s6uf6G(;K)0rkO8sxFGFBZvi!vY8!I`Zz7u
z^IP3vY3@vV22sYq!q8BAp<@pnnCSlf`epbVQCoumW9MBaXi}j2>NHDgJTafL1QMix
zeV`u$i;BrDwzv{We0tO2Uw9rT)ZiwJ=FZhaXrlEX_3NRKlP7hCF6Uz??Nq#eJ^ku_
zXC5ZYf~-7agABj&dHlM~DNqNH4la`ypHH2er1ta=Om{UWO|o@?%+k3HxgBNc7<82E
zjZPt7I`b1Bm-?*mYTz5GeL|IQH>q2}=LffM>#kh<SJ$pxPe-Xkx;R{2T0bEL)OT|G
zdb0+H@_a9E!q#oqsSZP?n{Wy)e|}lhX@4Dg3tOCAlVgJ&S-3XOVeNZ&&8Xq8mYY2>
zwVT}F3R;f>AsbMGd^165`nz>kx;rZ^y>_h4FKyd=cr^Te!h?p5!SG(A0td(N<qL~z
zowB0-_I~x=ypVT>f1V+Qo=XThua+ws5wu9bHT+;w+zPi)9PElJkH!6cmYzBh-*mH1
z2nk!@&^@H2kCLI2(xW%h^kw~>hCh`LF_zV7Zz*ZREiPTUlv3FRGRcD_ZK0d4P4alU
zHrQ36i02;Ys6-OJtR!Mr9=B(0=@sTG$ysNU-aKlDmNGE0I9kZrf4oiv-ERnwCw10D
z3`oX$AuRva4e@WI&F#NBKS;1&e0l^T#D&O7K|COOcCnxq`wzBfZ3&4t5;6|QTWX^6
zwOO;@mr`?WzaYPUiYx8|7*<-XUOjA+WY4X>s#cOw3rWXstp*Iz%g+l`ywo0}tYu66
zVk7w5eg_)f749mZ*Be;<G;80tDX(k3800LHN$h^P)0c*F%J0;ss9fzmeAp2X*=xT#
ztt>+RS68>nRmR~{0b3=p!-WnJ(a{gTp6EJ#cWwj-MBP6N6cAniaV@u{cH}hULi?Cp
zGd|wnI|aE)jbGaSO@R_BBP>j@;r4{6%svAtlz+SI6_w~d<bCqUi{~6Cttd>RP@E-G
z_TcM#^GwJAwz`x8XCkL@_shflNQx;(Ae-~LtLjv{Qtsg4!-9^RU`Wr>M#W4R(p9NV
zvnju##+&s5D7s;{OZCf+J+QHha@f)Clkfy5HKB;XV_jx%zqq33?Wzluh|1PR<W9~!
zYc}e3PR{bB4s)JF1)TgI1&>b64-N3Ro0!5JNSew(hrd%-v9@xOYuV-|-|Ewfi_K}&
z;5Dpy*w2T}e{VFI?tBqF^c~-!Hq@L%uU?F#nyII!RwrvBhE{MqXvEg87j$=8x5chA
zrItiJfVqGPTluFRc-zk;YSrEA*Z=Wu*RI|8>DxU$?>DY{e`Ky-tQAabzXL32V&gGs
zhO6Y}wRIq)GsvmUlJ!Y?L4IswZ(np?vB$1=x4zIzR%v>inw5d~x+zoI%m}@PUu9)f
zdj}g+hxOAH#S!s<d2pOC+*M8n6dDchi-fepX@c~(1)s=c*LOpVtk&aU*vo`#J3sZg
z@!}KYqxK8veWHQiHJ8a+1Vrh4q(OduH{vHQMr*ih$YWx}tIGM`Ys=?-{T}yGeQJH5
zGB%CQt#w)}b@F!1m8rja<$cXYR~wTVI?j7H?y;G@vS0W;?rGt=>m0J<#*Y{7ysIAG
zy>rL6QMvFK-B2}uY<_dM|J?NNjg5h$Uj@45#;3*VBV^f3={I7ZfjWuI2RMP4JyM&)
zPoKWTqyV}ip#J)4ZrS@Zt+&T4v?y2I7vC?T6sb0{l*)|N;(ziHJ}FuEl<DE~;?xxU
z<lvutibZOOqEgQ6vX8d8xf5$eWA@CMou#D8#!=?!IcbK_&LEV2($eXJi=3skwNgX)
z8u9!~WpTbg(v1x<rr_`nw~DN1!R}2VfBXBJ6sA6TngyXYyIsgEn=3<X_~Fl)-@6nh
zz_=Lr=ik`X3l>ZFsfybplCQv<0OCa_i#N6Z<rm}Ro367|V;stlo!tKA>(>ni-J!vw
zXL5(f_k7uZvdg%6xsWoW=SHWJ&la>7^0J|_HMVwk>NUH}dw!=%T3CPN`1p-V1+P9K
zy*jyl>y|C+<|rPTv1dJ}8AM)>9-;yH{&JW8hy#Vz55|-44YJrAxv{I1RDkAI66#OT
zI$jQLoVja+Ht{1x$+?ev_3nLpSR)OL!!HgTr=?YT_wHJ1rhrwBplLA$J^x%kiMl#C
z3n6a!x#Z-Dw**+o_en<xxV}qt-4|iera?mcJaJyzzsu0|c}jBw$$HEtuCY9Obb)&6
z?4e225)x*!iH1hy*`n@r&5%-nWBlEGk;R+^g}>LtC29|(UvkBzaD;?znXH58O$Rtt
z^U8QoI>8Z;S%nV{&830^T7(^^0f_n^zW(t^-8}hh_4YOtt?2uSn{b+<6h&B#2L%Po
z9M7D|c>2_pUVo0RepmefKWLZleMYOGa|`{7>YjAm$?Vo?X@4h|fsWb80nFm+KVj4D
zv^0<L9oy|Rs!O@GZvFZtcb(w_-dl=X+dTi*Uw%1j=4%CowP2Rq9b{v3@5cgH`OUmU
z>h1pZ9NmY?{p{`SbJt5@t@rg~I%WCjA4+}g_f4Q?$`WLxL|3=qNiF%+qeqRGR7MYa
zhcg5h6B|3?!Za*{;2Jf4>(T`(GbF-R%k?WYtLakZKp6^a(Z7{_P7IK~?lQ!*?!{6a
zT^<sl&hvE&Wz*tyX7|I3SfN#+-}*$^)1X6F_KX*#5-=WcvG~28GZ41WLhTWd`-ZAh
z{5!dLN^!+Ru!KuvWbCNa<%G=@dR)kpLNzq^FDtKS*KS`v!J`w>sQ8U<W}7e2?W`O<
z;>HMRDdaU%zRe(ONHH27w|jRE&ESFCOxKM1f<!=|zJ=w5sC7?Ydq!yTGVS?m`}QRE
z-ruGSz`Bj+ZTtOw(I^z?QOh{8r~0omk-NmbhEM}6BQaNN?_M_ur4+Y=M3AGEb<kIB
z>C_lulPm@UQg$WyA%_EGNBL2B`9cH!N-Wn>kV%EaKZKuvh0u8YX$w3-&##}wpfch)
zIWPYLXR*R*k^bJqpt+vX_ybd-$Q!4wzJdCxPQ^fOO&yh)?mEcS?5(YDsx9GI1kV~=
z6$-k}jUUm-QSqzbr10EJ{K8Quw%E4fBt*ACHy!bv!b(8te%{_ovJS7>i3S^%h4|xt
z>F~jWkBW*Q#|q?;>jyM1>pL)d0!Q4RJx0B<@Ra_VO&bH0e*UZgn`wMt;i_Lb2S|!c
z4opBQ=fP!m{G~0A0*cH*DP9!@31+do4p0^7bLi;Ng|=zpFM9OosKCXQo?WsnVk;dK
zq{{fWUZGeGIW%{3zHqbP7M7O^<iJ&1+G;amhr45oMalB|4kPYK@FHYz6lS*mJQCrW
z)_<bu+r^67Ca5|n<O(CW%h|VX?Qr{5UyAbVXEO65XCy$A>4=ph!^K+i)VssC&}!y<
z>$jGT)3I~s9(;U@H?-$oB)F#L+jmRnUvYJQedJhLS{kN?Qm)SH*pq17rF8&(V-SrW
zIVJEjdFyn(b*<JJx>6_ziu$%vu&=1&=t>s^Z9i+bsG|Z0V{KpMuhV3g!Ji<O4E@An
z_q=rWPEO7-4cqR)qM>=i=FPIjQDX)U)Ha?o0v7!B(IS2M1)~D&zp9Lm3z46KdI|bp
z=WSP-56WgVj503mu0y0OvV6eJ_~VfI{H%<O<)l*@ze!1b7V9k<Y`dS#KS;~H<mS!o
zxo@Do5-V@z-@Auhz+_*vLF8s{D=V@3G-MGYpuv=?Lx&FZ{rKHLPTdI=h>jHMSMQLJ
zCGk7Bt@5cJ?}?=dd#XNtg03M4$i92GzM%nmz~teY{Xy$EUPs-nLcW%_<1%1}Ey9_Z
zlbJbW`0z&Pbb=l(@k=Qw<M(R!F_B1r;mq0SXyF{hsH_Dv#mt}IyMO;i##Q1Ye+e3p
zTFdi*sc7>#1`Nt`IW|6g_yDJDf`Zn_NJy~JWC8TCH#0d(bdX67_{-R4@j2aDv+y8X
zZ*DH9a0-nrWizK^J%^iTs4WECCi{FPTh-aoh=pR#NR0^-oRBJzwt;7Pn4&hAmj^CI
zXtI{WSYfKZz8$`r24R~O4ZaLi7=%Oa_B-P$j?NF7d!P6nn6-?aQz-vQTdMFENIi3A
zckUbF<0h~xh5ELC3tItj$eH?=^D1fzsi9H&`Adqb7KGOeViJ+=2nr(9z(GN7=u_#n
zvPgFDm0pTyr&06wT~Iwt`#5^@+_`hq@mvV?$SUyRKshFqOWZ6DFz@o;=KsZHnN0j3
z)Rt}EvEvrFi-?50j-F;Qqpwe&%-z2i8pj8nj|xSct!g$B`Jt$9!|yXi#&iX`QL~sN
z(S05jrQ(aQh5!Zyo}HD2X#3-nB<g(yq?4E(Z;)?*+Q)q5R4-o|(5cR>4_=hmSF?u>
zSdxS5amZgCbZ)a|Sn$q#BRX*D1R(NI^?eOf;3<uE2gX*^)N0P=_Jy+O_vR5C2NeaM
zo7^;nX4IQT(uS+2mxPB9K`#jQM=I~(LvGrij@8|3g~$wHSojyWT_^_S<cQwXD~qzT
zE6|ZGd9b-{gaQW}N;nSh&E!2O<Jj|*;3xu$>Jw}A?E(Nx1(cM@;y>8AcP!S3=qiVl
z*V&o20c3futS(4UthKm^X|wFEp$j3=qsd6RXHOB<7A=}Ra?58dM*{sW5lbSS{{BT_
zIV~hY(o~MmU};)f8DAKBm_2YOE33M$F8<P`CU)pAZKsg4H#Iga9yUqTL-0k}bL+(i
zp~||~vsbSfTACujd|peU(^XDm=S_G{Is*|R6Jm~n2rU<FASAv2L>%VZoE)0SP=PM}
z#@)Mnx01+DYRpn*#gM8pe|C=05D7=!ey#^8B*EHV<R3Vq$$H+<GrD7k{iCzjND)kb
zLqogE{1^Z7@Ct|=NKV)kD%bW;62&$%*(fT`!QL{ru2(>0u^b0^4zozyyP!73f#4o!
zdeCH6@Z{qoZaRUbPd~Ia;i~(snvY@G!4ak-{`_+zDp2bfyATA=_BJ+y?cy$78WSVG
z6m^xbSPHzfYc)uU=MN1~`)uja37b{c9LFi7?pb<=xidC7I3T^!sCj{~jdF)+eCCKk
z$SYKUr{xDP<5CG0+}|)+T`G8d@JYYh2#L?~D4;|`oVRM0fLKwz4~x>S0tB&rdLH=z
zKttL3qO5EkcSk=N#Co5`)%rt}W~hXitXZR5{`M^?1WJkHP~-Wr`g<0wTX&Wk^gZiX
zPigQA(hSt~ChrbfuU&h0Z5oCBWB{p}dw;$Mw2#hUs!ZRZJH0BS1dj(}Y?AQp^XJvT
z9Hmibku7}njC;u;%+)XLw2n=3cW$sFG7qAkx6>JApgEPK)BEF9K;*AKPSevXhoj)2
z>@ned<(|T^zds!1gUcJwyxWX5pZEaIZ&3TH{g20@4hNo6a$8sZQm=S#oC>?HZ{MS2
z2WC;#=*JrB>wAtKzOj3gY1_ZkGBeAGMJA5ODT<4VU=GO`Pa6ICn5cPg=u|K3&4`u}
zNkc7}f49^F;9=o-O=I$zJ!jsPx356Ob@9Qa?gRFaFWO^Nv-u%ME^LVHW?M!2=DF8E
z$1_LLp>G0j*?_X30Hys;DRVbY##V-rt@1>t4lgaBe}EfG%CjM-3i-c-%@Z&ek6_*I
zhK2^m4I8>&R_?av7R90mB$-zuE25BJLqx}?ixqL8vu@OAum|&<=)nV*T+UUR0?U|r
z=MKA0=wm1KKgmu9l#yl6-&P*J57BshPj~VRDlv;tbKg^H^xR9`WpU!VDM)?ZmVi@P
zZ&$W_(s{dxMS!FntY9)>7Ib_QiaCw?y1LB{4yf%FZe7)ZWn*6*!;vhajVD6)V5CIQ
zFy3;ioTOKqn-*GH9$(h|^OR>Uf=ZQW?WIy~V<Y%;Etk)Goo{HeyFO+Sv{pvv@#c&I
z*3K{2Zbt*+07^jj{LFce<a?&-E|Z0@nF!z0WN98J3QD<7mZ8HYOep5l($oK1IYg?E
zt{E6c5T2!RuosLAj`n$#DgMxsh;Mg}nYt~w_gyo3;~(T+&^{X<KRU*ms*&-XnMHQ=
zi!DINCuIHW)>W}0ac-od5f&1nw&A5N(1GqSS|`@`UnQuITYe~~J9X>U{Q1)|8vThE
zD96F8WWC%AgSdU&vwlj`o;{;H!h>QCb>+v8@-1ylMA7IIC&1_(I6Kj)-5ayxq(P8o
z64?v!(P!t*6ES^I<FjN41UJr98}=aLv9&1ukO%DExs!U<i%(lXnm|UHqb_=T>vjFM
z?YF*TK*Fo|kuDuOdc)q;e4)mQXXX36&|5I`fG@fXjXn(Gx0->RLaAk8p}GF~)DW-r
zrGv>#S%+q3jJQ}$6}Yl<Ic*XvaiIP9v6%yb#X{2;krT+kbSW_ICCE*HF%QCetX+&9
zSQ$PVjz@U!3ACI4c>Ca38<`a=SB}G~4RrBqhYpZS6HpyM+BXH(Ry@ol{w6;-yWc!G
z4k^Lv)vNi)Eu5z4ZpjdHat!{~K7q<TCMG64ob8jieb^^TU~s-%Y$}3cVh9CBz7_rO
zeObEzw9{jsC1AUg2wX<MKs^d(7eqh~MtM&(oT5=PbM8<vBzl6FI7J9dO-Uj2t(+3$
z<D<{X%@SjJtbNE>0C@u67)lcT2&6Fxkz8zoW2GjH4zf?Zv%V)moah0`YFe!Tnn>vK
z^NlF+Q)%LRit?PV+cY|_Ytav~PB?#F=LY9mI?a?)8#9J9IoZAWN}OG}McPj-K%6}f
z8%~4Z4v{j7JID9*j>>I!F8b0_b?rM?qGRWzMbGkQI*GPz+eW>fE2CQs{fsqun5@As
zK^_Fqxm&lZB54?EMh{(i+qSG1gd*x{YJpnrZotE&Z{uko;dQU+4v!7A{P}C$Dli$>
zdHM1L*A)quF2&Z@7_$0V5A?B$J-fAf5cgh7Yq6eQBpeRM4y{y6Bg<Nwup>g300CKt
zWIQJ)Zx<bgpWTG5WNSW0$2^6(VZ(<r*Fa2d6r<+ReRfLqW-1`?3X$U;WNy@Fw78&2
zlPp<Yvu4GxFQ5<zWj*S)+M{=%&0sSuB4F&ElQ)2$GA=8CYDf|!08|Vm7He9}#%~Zf
z2#Gq$6p2+M{~`Y(;xno?JuAzOg2sFuhVhmSexRLdAF_lag!_SbpRNU>_k*)t2Xp=R
zgM&{utZAn`QV+L^veqERUmKR*o7r9BCNqwqe;Vec_rCsq#T}w#)1<E?eJ5*w7<co7
z|Gu=}8@hg*M};T+8fTW`kroT1fB(7VPieV&+m{7n{=4l}o25&@i$I2Q!HkwQv-Wf+
z5JRO$9eXS~;7_Pgl_DG^ow`5>z1jIyCrMTMHSf-N89jUFIusIW8x1l)Jx1nHJrO<t
zhd2G9B?0g2=(@R0&MKCaP2}%pNC`WUO@FjpLftFk1DJ$L3|aF&VLNqCS1mXiH^>&#
zptS%kjkLm5#L=#1b;D~+{%Evrq3W;5HoEtfH6NYFa8(^$`VJ@0Y>&Z;gTt6F?lvtm
zI6Q*)@7gt!86V&(Fv=v7O2CQkgg+54Zwkm=#L5@8HIlKfHN3j{wrTYQd3~hI<lxeQ
zKWuW4XqL;hO}rnkgyZv+ZB$!Yj9xHk+r20x>sWltS8$sQ2-xH+JTBdv8y)Fnsr^HP
zoAhhCOZ`6&2V$<G7CyvfWf#f4N9#;VVWos$!TpH2gtE0~J;htN$?54e%R4&`=w*`n
z+5P*dQSWb`Jn>Ikl_APXb}xFC{T4gwRAk+(S;HS@X^a{^I$>d??SdgkvI_OH&ubj+
zbGRbtpVJyAl~vY;C?C-|;W02L?c<(}BOl72>?J*}U5!)IX6w6ej%}UTt^ec!B{kz8
zvVA?JNyawVM7AZ4g!!@uvKT!WR0dGbw{d<JE|!yFBd}ATIC<CFx$FQ>X>60_Dz>zd
zs03m@dvQJONm~y{(hkVF8LZFiEg9xp*rOg50gV`u`6qb;<56DCMFi1vDSA<!_+8k(
z012`~4vg(0(VYEkxMOE6ar->%B9R}6IcG$DfFe*@KIw%-GR%*a0{&-dSXdl;vOrR%
zcWT#7m_TCQ;fX9eqe-?c^By#PuaCB{Ej^Tx{$ZiGpdKv~7d)l`zuXz`gSYA+M`?+N
zq7!DDUeX*V;Qb9YZ9JYorR^U5<+>YOe0T9y9zGl1KT=ch)CrN2lG;0QrYx>G8_C!e
zGN|Q*C0}mm(Wm%=%^qo;5W|Q<yCn93cp2Mp0{M>tl@7J<F4@wr+~?euw|{n)SdDLS
zaW~#cW_nD^eUVfi(n%y7NiU4sz%R1ud+9*CZF^<kCLkOvM<=6>RETLbwAQQEafA}X
z<8|c)Gm0PKjgq1#DO+FblzK6b>Jwj6q9WgN$(`1Ju3BQ-<{>aA>4I?|uZKqX$SZLn
z%7<o$ADH|&X|E8;^EmTp<cA{jlonO-?Cb**f0M}gA3d53Eu=6NuuGZcB_A8Hy2TY<
z#q;=aOTxFOw6JxUIMY9*(9T4~UwSD&sdPZEa-78QK2&v>FD|81N(S)(9z}@Zaf)?v
zaY=bHMItc?!m8rp^1m38M?NIpdYW*8fvVBjNz5`|uppC>=Y~Z;ZW3+3$k$hJejpNI
zWvah>7{?g$kqQ~;W5PamYUlA~9K}|mwwJUp*azD`SueiWsCe)Z8$1E>Cc2RH#h8op
zh+4z`%D)NY`;tNLdsM!!lmobM6D8+Q2unP}xd-*b%wrBsoF-dyv#-5wUlRL$V>?P@
zK4DO)*Vq2am(${hC6bNxq@JA>*fX_GuFxm2SY&Dnj>_~s2$`a-*Dgpaj)3WWY}H~2
zMp6CJ(ZEF%SiRv^8_8{t7Qg%)UFw1^uC89v1bbxgXSw{cQf%z5G&ec7JOQR`%8HdQ
zk-Qc&Rqz`QLr_y&1q?^}erRlW$%%JH$};)ALST<DuU2&IC;1!)<wIMF)B^%!=hi7N
z)>Ffbn4&YUI0%%SvP5#?9>Trd(?g|~A|OMyw3kQEq{=HaE}^U6@}>F}zM$|1*0fuY
z&+eNjBRSEjFKCzzD7_S5z~LsAi<CkJw}115<I*STEa2cf$X{v?=v3}3ObtB(RRax>
zIF4hrOD`q6BBkFu@ps8gN3<xYntI8|V2S{L4)rs)aw@-}UAQ+m*j_ylmhBaD0V0Y`
zV=cz7eKJmAs;=&B&g#>~=d*fC#=m;=hCPV*<fG0`j5I((nT)X<*v&eO_fQ?F;%^5=
z&WC8adi>BKCHn!Ao(P0#cvQ<DYlenuTAhey%HzX~^!QU%?IQQa&01Po3RCH(70bh~
zU0VLMsZ(_eACt`hpl-7&2lg#a5N|#aF439!L!Q#0To+6%#ZRAfWk4r--CjEQHVMBy
z9(>EI=dI#mCl+ugFC8g0@_&4Pl6tf`YXNSh@ngHRPNXs8g6T!o7hk{VV5+N_6680Y
zU-sDHib*Ibmy8a~r8SucE5|B?E>PxQw^i`;^}T~qCox8$<%2wiF@Z&$lBz-m{Jk*4
ze)7aZeAHCZC#*7=yeXrDM{{3L&4$5kCATAoT^*N`n~UvjAu%{?qP;*$ukIEUh<?-j
zdVIEJ<>g0;TlbdqvAMy$*+xCkQ<_E<TMqmu-r@@1;lwnj5)d&;*foQ?Iw`mz$|9fO
zjuBlMV2t|3OPab3C4j?XX;`nYEp=l)Cx#sp&{TtevnBz6Bm?`XEzJOkjqs#^D~1Ar
zDPPY1CG8)$E!6I1WZx|@f}QbATt8OxS2=kXx6F*jvc$3yh;o6R$Mg7Tkh&{mAkt<i
z(?oF(hOzU!ckYzdp^ciInwOcWCvJD3f0%3E0Ru)nU9%A&b`=fh)*0fRo7NC@?BdO(
zIM2KYLLlbb$E7@`0e1Roti0C}Z(xT$GyLOJb9+HMM;JoNP-*ze6Jg|BAP^KHv}H-x
zoHUIlrBYe5r{DPfm)m;ihZd9zz4#jH-WO32m5_aIG(5Ceo(i!rjF6gZXvhQpho^YR
zQHA%`mQtVw0(k^1RP@~G?cGP!N}E{?PeLTd8<h@-4oAYbjL!Wt3+9CvfQ&Nxi|~F{
zii#MnK{7g&jAEHqgjEuJ!G;}eB>{)oFtbR#q?V`$(w*Y;_MQT_DWVBq@dS9hqLmt*
z6tJYXEWhh3ksMtADX0}v8%XU74u)f`6^Gj@uFXS*Q6yBGFKh^pXp+-dc@~&FVe>mF
z1+?7-WF$njtp1&}<2h5rAR12T&I)u8z?>DMJxXdBlX7S&G%yW}U_Ii^Y3V<hKara|
zr_zweS;K57Vezc9Q%I(mLQY!EgNquKx~P;Ki7Zhe17Bpwl0lBR-X<B!V9oL2Hms+Z
zR7ifIBju&@i7+tJ)q-0xlX(rJIWVYSFp*bNRn@R^T%njbPOsH^oE8<P@+)*GE=X8w
z$;Cyig;YWfeU)G?r2wr$fAd3@!|m4lI~BJKWFAyMpsf5sA8Gw)>JyzA;RPKP2w?2-
zMy4T%J21NTsbeWE$@=DXV>C5g$RkLkTOP%(^9lA|(x73??!7K5?Ufc~BmSLyacKBz
zF53DXOeV($2XB-#S(KpMXkpl}BdQ4>uRLxsIZ<Z?jz*DCcWB?9$FE(t9wq<Z?K)uh
z)med<&OCwp+~C2x8D&5xI}}vx84uo^*XNO;dE;nb<anFzB>n(x7hBj)dF1raPZ<6}
zV}%%>k)t7yaXr~Px=6~FL_w7w{9?tOB@0}*U_m3(xOH{{7#XOU$h|;}_^Ky+IxPpy
z#m4HFndlvKcCynk*mwj@Qfb)pT0ub#BcAS+ZxRgf?c1M;<m}NR8Zx|e6dW}qCM5)&
zc=Hc1VxH2RbUb`Vdb@*MZX>ZF<1~vg-%Ot{<rFq2@#|Je$rYn&v3Vtu`4hs7A`9(M
zK%u!G;i=lY3&-y}tVpO4KFO09Z^gC4Jm%86@z<ez;J)?4j4~NeXtg%Tjvzx)&?p8D
zG&i{_0C=8KYk*M6nS;xz;T;$P5b!!u^!&fv-J4+`K_YWXj1P(4R-!C?;GWvEJS|9L
zsPF32Z4EaAZ&z{1va}8iU>2Mm50`k@T$2V1AQIkZHpVLcSFc_*k1>rdBs!xfGga}I
z?Jn2yWhBk#Fgp^XlE#iTlX~{<-B%_~`wf_M#H6p};4CEQ@K9oU#Qpom3Z5}BAH+;}
z=#(UkA9Ln@xyagLZ;25MERL`pWWQoI6^3g`#}J5WFPa{@9=*Bv-|gFbgF3<|VcHA{
z^0KRS;O^-!010Aq&02xn4RkSj$@O0j9s9*lg)>DAwq*}eJsB}cxZtpCDADZi*M!IR
zcNPW!0iJ)Tg9qsr`uyVN8Ju9*!*O91uK}Ryb8utO<$B#%!%YmMWF*!FamQZ4<T;@c
zr=xf80E{M9lP?f)_$Ns~%!XB^ofMGuz>i%aDt-U%BCt8l6o2WNcH#M}E~KO@3iC`%
ze6}JPR7gvh;;>-`C036JsXR?2k6}9qMZqj%4xF`X)(l@YLSmxr=GMds#<vus7Rm#;
zuM{m`GOtA?y$AwF=r~WF?DA{6m^*<^Y3UAT`RK2D4x_{fp3|QF7mM$u2wi;ZvZ}=D
z95w!rw69T7Gj)nER$&ckI#yc9b(ZKqhYx|t{mQoKJai6fA4=@Gs|uqOS@#}aRC4QM
zUQ)IbA49ziFB{{RBaZRbCc5V4M`njVCjVIS(KN(xrN$B7fBeLW*+;wXN6Uj;9nY%(
z1Eumn_6~w6JDQnAVl=j|q-GN&6Y$A_hE}iC$JMDmN06}f>NR-u`mVpGvubzsx5m%!
z%^Uur&~CG~wq)#Izwnts`RqNxZBc<@xpwP6!8p=5OF*q{?hK0t(G9hTzXp1VF7)d=
zb_6ma`L2=yCW)Q)EQ%W|=bL|kmCnhC!LvVCk@nr+{hO&cbT&<}M3F2`$_-jz9qnn!
zRC=&sW5WiK-+f-riV<V7rKJZhQ<WJ?{}5Fd=3NarRz#A(1DY0^R|~fWFI9cBoz-t}
zV3+JmV;@#P+<mJmzDSjXFd3cLcL$=?8V-ZKM-ri*iP$%O+qizcElqp(GpG|<j~0yZ
zi7p(-$##V*w%;&kKd!zai$jG?nG%U*@JN6oa2WhD2iDQ$Jc|y~Ksn#j>~c~zb@B0{
zUmC1gUiX!CN{SR;^@SuECaBSOY)RQROpm+E=3g0pbocJv5LW*0;Hc%PUK;i9PGNw#
zf7PFW;L2+<U-MfWjw*!;q%#P1hJ4vl61{)Vn^cwm<qx0rx5P1Bs3dN&mhHkwW4^x|
z+d%f=9i60cu!E3&+~sFx2NX%`>6eFutwo?s>4ew1b$f>n^2owM;Q$+$7Yz_B2Zm!M
z`Xo(_G^W#N*6|7Pu$=yfvX-kKr<`r2N<Y^O%$P`9FMAb*lD32?#hS+m-DG_H<}fd@
zUZO^%F4D5O+i%;ofs-z_wjz_Ri2Jx9iAWD5qkh3d!?7+QJ|1h5tyWeih<!(o9^I4|
zklejZ;le3X{@!$B90VVskdp+<`)4cUJf+c6@oPsZlXA@#<J(9~{QAV(&pAF}G_l91
ze>GT4n4%f)sAUBZj1}ceSx-dg!|xPv?h)9`sQ-EHKDYR=i{?j@%v&{!{Qs9fxV%a+
z!v_qe@|_^5n;PL}^*0Y&zKM?)Q_87Bq;7cS1Nji}Cxj$5-Q5Ewnb$9j=O8-9NO-&F
z!VY!4)`?a3BLoc<>HV16?XO+sj5o{{Yt62RaEB-zR;YpMTdxsboh1?7DdQ1h!5HWz
zvnq~F51kucfaIg{al*%EN1wLw$hdh^iMAIq7&+hVkCh}6{cQb8-cIs*CD0WN|NL8}
z$!t;+1bB2&zvqkUB?Rp8^&M_f-cP%39`S~Z+kq-3@PfsqejwL@iVylaUXZwprS=^=
zHcUi=ZP%>m^4YhYmb~da@EJ2^c7uH&DCp|$yf`kF65MKc@xf`s@Vw<k-Sd{fYr`ZS
z`F+S?5jCA!L%oW_fFmDE37Ve9O`Q0cKhQExt)!?ZDKSyEorR?(1U2>U<HwHiz3GkS
z&-@J?#MIJ2i7{u+Ah^LSrI~HRqY(Tl;Tr*k@`lc%B|UHOh-iPLU<V>C&kOCa>uFm_
zR?hC?1Zq)S$(G39hI~jpd&B*~xuIXSAj8SOG8G}MzVots`6W#O4N)(*#OeF}kN?DO
zC>c6-Y(oBkwioh6&UNRA=qHv!WETSkMK^<PgY0ES9X=_S7-M)cxcs!Rp@3+P>z;4~
zyjOybm?u5RlS~0W+M%nT^Dr*0d&E!FIi)U&>(!hz-QrOOf;`m&ONDTBU^2S#B)CWY
z;hLH$XI+nS8+b9(?BJVC>(`&7wE?IOaO930J1*LQTtGdb5W2i;o2?dDoN%J!e|_T~
z!FXeX`QU*mz}e%SHc7-lN2<oW3{%*~*hc8idP3{rt;XU^9L9-LMm;dM*%`O5<%c|?
zUXdI?v&eq!F6aB2AwBCI9pmnq!SZ@|wXh>1H@8v`WTM*QM;X2(pSigs9Zto?#of;^
zi7w=9=RzW1Mzp+}B&?7FgAO&HaTk7I5|Be>e?o*ub?a1matDmJYT);bdNfdn65c`Q
z(t)a?iD&eBw$LNA-1<MJ85(vc+FD{cofP~aH}@kTM`%Nmg8T4shjzDcDR{3>K}UK&
z!`H`0ARt^R&ZQ%d4^vu;^$VjnXysC5dYwd)a}NT3w45(o6r@zzNd%Z;B-|_KyJm}B
zHxuhcFfJ_+V6t@#uOwpa?&-^PbpE-YF}imbPST<ESDRJ*DX=ZJ6X*ZfRSygzjZNKz
zNxAkS0A$zBoohaQ+DiJ%02rH9tA>)DoHbNBkeQzTC$5ARcPSTKMBd6?Ig~9#dLDnY
zP+kIJK23EVtE4oYFhbQGE!v|c$THwiIKhx5Mu4wdzs2%A5*I`yw#l4Gf*@5}`b$Mw
zTaRJ%RbK&bg=_6Gk7)v9FhQ}pHe7rgpVl#|5=k~S8QDnhRjR!a+cDvFSO3@L<wIJI
zespyUBwhI7!a@qLV#v9e4RCdI^umNn$~gV{^?Ql!`XMoSmZk1=WR$Xu59rhxt6i!v
zulz;oxkaXhgoUp)Bh6X8`po@|Nq9W)S?AKpi_k;2o*ab#S2x8IQL$LkK@90eSb7MO
zV17hm;<$M8H5zi+4qI4RSD9Y~J$T5Tlv7eR_s2s?yQ(;N@XVG)&AMiTv>>vm=1{ml
zbO`<}!;vEf(hkn{vw5~q5@7%|gv^?7e0JQ!zFoGf2Zs~P(MP+ITV<&UJD{p@Ki*th
z?dKC0%L(9i?xA!mOb0h~>}U(sXcT$o`$c|7#B|sdT=Eh?XIv-SH0ZT4-yG3a!1#@)
z^}|%+a2JOb&$}YvhD6dVhFdc)`IJ(n(Adxq@m`f^3?bfnT98Axo)%DYcf|n<A)C7B
zDqjqox5IIWe->E~UTUAB<F2S|J#g*TEgM2VnW(I^Ahx!&j*{iV?gL!8*VnA5YH5K|
z4BxBL+Y{-HBi$3qmBi?uJ1l1k9POgGhvl1Q`1Ko-Z$x$fElO0==&s$m(RD`mp<SUc
zH&PtGhBJ}W){^kpsiUyb&>ZmNaaS4RG}ZF8_{4Fzkny<BoT1=#N&p2ka)!z>{tV|8
zFXJQhwy=DU&rU$ZMMV3<8SykS;jp}wq~l9gt@>6a_(xY}!_JwUL?Q;Dp)@=HZit9U
z`$JlXm`JkbvFVM|eKBbU2+&!<TE@4CFW2%dE#R42zoKR;5F8R=VQ5}ep}Iu*;E^Mj
z-J9L`eCqY=S=pk#($Xgi?MBPZqWu11vL-@QutJ09;guw&jP{Y~-FyDpmJc^N`QyV?
zd@`3$pc$_<=+M?o&UfxlwEzE&j1*^xhn{5xr-Zn`o;FBMe{vh$4!t}Sv8D8x9bQmT
z$Hi&L`F8tAYSX!6$GnvqVz3~#(ZS(R=vDRgSD>}dIg7zhvO`TdQ4h{p%e$U1_z^ce
z^!M-ExBlJzA(7tBWLAO@ns|nT1Jq~Sl2y{UQd?CO@ls?G+Iq-2H7LWJ?I)VsfhYCv
z3TKuWOAG@IlnMYPbxw^G*FjNc%j1%hok0!kMyP5Ynf~V2#2vEcsM`nNCOMk>QAM5S
zCC-|xc0U%vz&$TtE^mo1U4H!w+3k-&9NU5)TwCMU02|(xxV47@-+-vXcL4#tP1D*N
z3WrG)T#Mr#3fV1=Vk+k!K742vnzu5(7@5%g1q=K?C{pt<jduMUSXNd>ktl>icSRSm
z5)Te-;b{4WZe*zN?q0K=KzsC@NW-hZ3TM4}#@ZKHK$7#1fnm(#wo>g4axQ5tFlkTI
z!wsW#BSSbKJV;MARxyD-xM;ox-2jaX!A<czqNh)v3Z<N<p^880{875a0+Un3olR<;
zN6aB}mpq<`cS>n3V{vGJIhRhQh5G-{(d#LzFdIu{yr}ICq?rB)9|UU3FCn~NVe6$e
zW{hcg0m%e&!eoZ@hSwXVp<x`F$8?wE%a;#*oY_$E&>l#_x@`pZ;(NT{%3x9a4r-}b
z@dv91JV)vuosT9G?}&Og{Am60Kayw{f0+Y>K>cGIdc0GBE1fXGJiLHemuln3C*3ZY
z?mK#DIZ(BAMt~gJH(QM(;26^<%~#m>sT?;Xg-%<x7~h-8XGvDHRv6gQLYj@4#=#?r
z+%Yjoz^DJ~w{IWOpg~w;)vz8-T0k&~f*9WlJv1-wAsR>8!fKvb>W7`@E6Mpzk1k|A
z=t}|gm*F*MsI2m=r6`#HbK6CoZCPFj7+0wFreMp*v>ac5aYX;~4@Xq%t%W-yb0nr!
zY`RQ`RnMenyHitL$q?fO)q+&v;7|o|v)2CHLw46!YA6jFBr|5cFur-exf@yz9!G1q
z<SB$1E%;(97LR1_J~qBnZN#EDG4h6Sl0NTafDmABHVVp8aLfulQCtrg^<zbzZ~{24
zH89xCSxBJb)UkZ8iU<jM1z?8t3nm`P`!{k-r>Q@^;yMxCBJiSepk!D!KP!yMiBzCA
zR&CG!j#OuLLiQ?(uVJXzI#pgG>G=$T!KlYWD^*Y;<S)y=pkSWeb8afT8bof|@(||l
zg#Ma7b!r#bbxsEiT`A~z*j4h&Ehl6%yeYfrze3W;E1yr2&RKNi9(Y7~{eWF($Dz4l
znStX__`o*Z_zedyglDV+)*I2?zi$sNu<!xra4;#qplv;kB1PQb=E;p+JIrx}q)>!X
z#=y)D{{|H#d{vjn!32;EYsk%F>w$h-@2Iimk0aV648PSwM-r(W@iOZ0d@gzHyXLo#
z&V@!tuWAW0+VT4s+ub@G2!gCUPyjpt#T<9*(7Y`$1e`nEdS(Bta4iK7714c&;)!Ss
z3KHf#`%>XAS{5Xok>nfthdlWr+M~5wX1;?(uKwRBq1T-Mi4sQN5rOfbY3pD&F)xs#
zhEAT-P)3THjO7`N$1HG^84}E2cH8oTBZuTq>Kq7;i;e%|MLX4z)E5~`bQp9&Fhd|P
zpag;w6)vY0o;AY4!AyrwIWghqp;$GaRZaqO;7H<CDv7A>&ZQH(nePJ{2ESHtkY|!Z
zOJFC7a~$X#oFl7Un7hW-1~VWvf?9wTaN%wta-k;uf>_LHREG*(SNH6N3(*1hB{|dn
z8#Giuc4wpj%h)cym=bUZ(w7a20^UU_{@4T(MF!!vWSN3Ro4Z^sM2BZaA~J4VBFzjM
z!ot8%1xD;)MV(MhMEV&;8WR)5haySF*i3pUE%sn0w;RiU85sT(LNpL-r~#$kE+PBE
zNpK$Q5ETe!N3}k%_!&PQ*ok335eiYc7Ch_ofAL-(Iw27)Nlb(}6{lWua^~+x(CrN_
zVJq+|j9Xm#`0?ZH>}V$0U_%AB0?^ahiBydI`iOxN;x(A?%gM=RYh5I=(3>kDLY-3G
zc!uaer`6Lsghiunbm8QNCmX-t5*s68<&PCD$r2gNH7lS#APg;@8;6FaB^s<hIW)Fy
zgCjI)eQb)5Uyi)7&Q7MoiheCF#i;y2dV1)fu*;0mMZ4cgfhNByD%U1kEF`k!KX<jf
z=9YUaH72KI<DxZg-2BiyF$;n3()y%^N&h&(JvLak<a#4VuZQ&{>7xmL@q1nDScrz*
zyNjkfe|?k8xvU|pAb<j0WGgk~$lVbg6LL(W(n;6xBY1(S8269cgPz{laJED?W4U^N
z3i6!qbT}#~gxoF>C=2{Sj~n$C&WQ7a#G)D2@8_lX(6{@)LmMItDwHUqM9X&fSkMQR
zn^yCeISLufbQIO2gY{L=yg7t(DK*+3ME(4GO`8Y_k^?qkVfm&B$48)myj|kqA>mNS
zTgd@}3SgKBaT47h2ZO{o>i>ynJW?2aQiS@Gq9mjqUzmQY!|$pP5Nc^%Mat1h0firq
z?L(E6JT_D@un^*8MtA|zbC~^xXO=4dQBWDwC8(hRBU_(`;V(aKf~1J*A1YH>&L(2x
zd)1bs>FRZ*wc6VMu2~o2Llead1<x(zVTaMn8y2V2=!NaXpPnd?($V?{{MFW4@n4ML
zwC$SVa(f6N+8Sf?Rx)0;JuKjY?jl{>()Q=Jef^w#gG7p*irEcq<Byg=&2bt5Dd>uT
z1Mxprvz{oypiE1yENL6RZrsDG;-QL+58_E&LX7&aRS$%X-;9~0LWXEPp~&mw-SLDB
zaEfRZ{jdTR!Nm!6=@5$~=cdsg@a-f;Z+#R8|8pZYF8_a%5MC^{i`+*-*5!+-qP(nm
zmkmHNKG<^$Zmm%HGn3suu*3Nz>FfC4Q>aqEE8C{CBk>=E1o#3lQ+l41GBeBwdQD&D
zX%zCFmiwYC`}4k-XcO1r#lw^;N#&b>JWF>#aZ%-g1{8kNkT?E))RmRRxPwk!OHrbW
z0m|HNm6}3USd`*{%=^%kD5n)NI0eMu$l_7>`d~tCCUuV9FKW$)-KR?S^r99&e4{gO
z@W<67j{h?^+uH(TJkI}&{)Tl7EF&={yV`bbFFh_llRktcGBPjA$_&@<Bk6}}>~tV8
zIe8=nEh0#mWsrc-)81~njLC?CCq6vLNc5dYeI+XgI#6lBY6iay*gInb14;8CW*ExK
zh82`UJRL(WxI7NWaquDMHDDG>ul2kxEB~4GMijT4mO4v%h}(T*QPnvdEI=Jc63JXC
zF3nT%f7Sa1eT@+NBdeDq_@MGB=8XA`Bp_J*jRY36x51wCaqxnmT2P!WU?w$6DFxOO
zSCLYk+d+FL4QiZbU_JmiD%!aJ+S}W<eewH)FKO8ICsv9utt?6H+oJ~omil}(OlYr(
zIWUw|_KbQYupv1Q-Lf7ccq*rLWq@l*aq-vVjwON6dZD2&=3U{!JZ|{-`U-a!b}gr+
z2!QY3TSTQ(IIev2=J4_3Yiw)|@7-JW;>Elv<J)w`x=8l;?C^&b6od$w@+B*5Y;cP`
znYZ%SF1>L|S8O@UC9;42fLGd^9sd8wn(TGW1#r-3aB^PnTu~T3mbM2Fx_`Z(CiddC
z{rQ%>yNnLR@e4rSh!4+NiL`yvOOfD|x_w)dbgSJkfxTMMEC7*o(C7VTM@QO&6WE1?
z(HIXLXx)Xz8b4S5A#9I^lBYmZ(Y~yvcJ9#<iqe!BjCz>G2#I*gpuwVhg$h=%=Je3K
zVf6p88Nz1$#tj3O^1!gvOXCnyP`LK^akB9a{BFP*5dS8T#sjq6EMiQ}3}>H^qYtW>
zAuRxH_6ZAP*ZaD<y26zj1WMK-XK(9iVQBj^R?m-UO%7m_;g(UXwXFU+_f3pKMxdOh
zhSZOTIwI3c2}dkAuGvS&#B|B7AmYtWWP<HS3Z=btgzA8T^pIzwW+d<rBao2sqN4Yd
zMq>*Kk4-zFT}LZiBCsB4&S~;TLXWwT#*lRP?BbzgY8o02x9-fWpYTJ{nqUC<35rnk
zvd)FNVMbrRePg%6!xLmVRTVr*S?uB!-IIu7!xmn`>iNu*CZ49G=RiU))f1pmf_|7F
zIVt2mizSm{!w*(ev;-$}>Hw9v;=TF_;PO2|c0yi`b|B-uwtp?qI(AX&R|tq{L2<Av
zq~IV(Mn}DR{``-bW5kD4|ID&HPI4S`7*G-vwF-KY32x)ZxBvB5q5+stxNBXEQ^%zf
zc{-Qg5Lq)Bcy~--b~sFm28e@7R3$15J3Rmx#WQ@zjvdrZjN42PJ-05ZD$%*U@oCsa
z1W-m&&nhY&L-?X)p!J`oDwzd)YTWILFP2j?lIb+<M#e8u!eGVB%#2H-b|#AFtf_To
z(Bo)~2|ApM*q$x#(h;IlHDT*S51;y~l&1o;cln90ss<snz?}o+BnW1hj@)D8mq9aD
zyo50XC-l*BOA&P4#zPsb3@|teCWIEm1E-FN*#RACMWH>Fv<<<on0f&Tau7+|#`Wxd
z-nAcA=&fZdnvW1F4Qxk(ZEydP#Y%tM)z8m&5mX?|h4@3#d?Tg5hcvdqh;s(2s-C6e
znOX*xPLUT6i{a1W<zXaR%1PC_h|<hXKff!Gw*|p9NpFI_ao~^`G}MMWsc*Y>mN5va
zi-d4HFRuLwJAx|$MMOFGAPKV?L)+}yjIRR)F>u!_>dVMotsKY*ICI95kY;_~JXtWe
zH4c(FhJiH>KR3E^G7S#scgu--TeE6NmDtA6(YFbb7XM5d#`L2d@^165xNODnW}hWv
z^2qYsUkBR2cFeEuepZ?=#}=t%>oWF%+WW5en>TI3(V>cX8su8PV0?a?y|=D5)x|Mf
z59YMzg5OIaYf4K?8GZxJQdG1c)_K9?cZiJexq?gLCFC!++C<5c!+{)#_f#5Cg2*J*
z?a;?^G2tU;Nc#2bFZHDe&QTlqO0u{5z5ei@RbYGtLYW56REycK%FB}wTZxF7UF0bZ
zRl?T|Mj%As>KuGAA>kt)PSZon!KieK!3Awi?MI@>&Y(Ph3*cMl<cf&)S&e>JwZGY-
zK=$IOT+Kh1X-fRdsA>p)3wJJ;>3|3TG5;fY5G7j+#{=WoE{TbW6ztyCeT5uE-`=ZI
zSe%d-^RCNxcaV6zvMTwltmDfg2?amM<Ft8w*xtaI>`$IR6-#bChfi>|COL!nmvqMy
z^P&sw(fTzvmNo-NCcnyTV@y@{*n*@DuaGrx;tidI4_V`bh4zA8rQET1Y+nzbb*zts
z5~o!_Ag^2iEaDGq00$|K`mgP*g21;)<Uz<SVa;VH_u=n<{~h0{;mcG(GGkwVkm!f0
zzxl7bjD?FU>YwUK;jp(*ZB-~D7--}F3{adyPcz<fXR0Pvaz_Y-uE4VF(Mle6jMW-S
zs|K|Jlvw+MY#*H!bcS>7TLpVn$tz_oEq91i?kkg#4hD6^+Jb&z64(VY@@WSG4NkNA
z2n63)F8QNaDwOTrU-*s%(x*^oiLeexXs3K3EAT%zQ@aShG3oMUIp3Q;<F@jM$>M1A
zFpUajlmjH~7S7)CCC~ws9Ul?rKo}>!X6593f4*yE&tdaX0=bq40@ASZegmym{cF3b
zT7d)27HxgSl#u+t*!puOe_2k|?t9Y!?M$wa?6nEdLPh#=tpV#7h1ufp+5NX}Ya=mS
zqiWxws#e9RWcH7QRkA{~4hSap?aUNxzR4|PA>s6X6=s=a<wgtdmXx?5w?o!5px3K5
z2k&53GM?DRn$qo7XjjL1fd8EGDrLzWtU;{rotVO}%j!_IA^MGM*~beiEhJH=*rN!9
zNB!}K&gD1LIlja<!r@T}i40$<*>^DXQ(608mz99v6SQ=--<$|TWy)-P2<n4$@^2!J
zaC-;Pi5gh--|Q*wtNHom-nD0meIlHo!ya$l&gyRh6n2dWjsp%H_|r3jc{)IHk?ukW
ztq>Flu?9_DM+Mq}Xa?9p*NsrO`8#qu0X>|0ofQx(G0$KUu53b2Xy_#_^>>w}|8=Qj
zt<pReyEn#n=@4Zc#R?wH1@gvT!yj|CtaJPq57n<mNr_&j)TPF^b{%Mmc>U_vPm-)`
z4jQoz7=)+b3FITCC=Q*`jn7g(PQ)TE>sLJ4L_;_=$?B@Ay%S|T?8Mv+Xc_@NMPGpE
znMiFYIe>;*V$xkiqwpvH?h``?qz!D_E!QQid<3<Ti-*dt2|E-6(}u1hY5DCtclxVZ
zc~Cvpp-Y&#O25fZPO-S#MdF3`g2<xys7@{NM4lMXU0hn^kEFLaNOj3|(Q1vDWgp!a
z$h~OFMzxrqE`EYcvP73mZG6t-HpUmLkN>+Z`oLU#`TSY;F^jsSq{J)wkv<RB@T!|D
z^AUZr5ov2}sVbxB+#-x*2{*GLOrK=8IlG*I-y3p@h36&BZ#$(<Mtwz9x+#JEGdn<a
zO0m!g_Zl{TAmZY}N8Gos*E-1SJ`Q%RFQOd$>P|a}w(Rwk{@P(f;<irwng1Tl<LJWI
zV3_P0P;R)f%22Iz=mq5ALp)Krl2F)ist?s_C&@-%w8;5GJiJjy1!zNTI;);+%w^%E
z9dJS5$`f=#WTF!?A5f3XS&`ywp~aGox*>+*pHbN#;5?U@NO)5IXDt3bHw;a<LL0Pn
zzw11D^hg+gBevj(H*D<VdlRuGe3yyTv-0w-82feW*0MxO00EptEkb)D8gW{@_pYkU
z!ND%9XB{cH5f1%NvQuF1cW<32S)kdNa{LGKXHx>uF{``3QiEzUQZD?&viU%(A&}nC
z{#()QDojNd$*!?ku|kmsglW`7qYK{=9GE~(63h@wA%GqT8zQRPil1Wv;LV-+YU)l|
z|K45WNkYtCne^sVMYWJUFzf?`_xwXxO~sqLVojuw!K2ao_I?!a_PM#Yub894xWbMK
z?5B9wZw_HbL-_QbkUMouCn5st>}0cwLJs0ep_jdo4%A5r+E8-0gD6q*iVEVenHg1r
zD8-f5S0Qd+k28rogIE_XT&R%IYq5($<7sJ+FQ4CE$UWsA0L4Yo<AvF0nvL|sgbY%S
zz~(uQDM4tKhwv07IluG8s>K&uRSLY~b;9Qhm=`&`qJk%ll$<(D1`)b)9asK=xI|mV
zn&Mg^L+I1X<GoO*l4rnB`|Hd0?++30EN-76M{D{0$OD<nH{ibM`t>5R2cdvh{gaIo
z;H{qf_{+_fkK<eIr|Fl1_`>2vmp2V5TqsdL!WJZ_80m>^=XVZv`UT2LF{3ze{P=Ls
z0IW!^Uhgn4lu%o)H4?px{Mfa}L>G(d$e-`M;OALjk_puM%-WGs`1QAbpR-3^6*BuU
z2BV1?Oi04<W2ViV2s_g8kF@;qI;R-Zp`I(zA@RM*hF<Z#Pl_>>3;-py*4YVssDmvP
zTKItW9N;<nMXx`c`3XE##CQjKU|N<tK@7FDWFRFlV&p6Z^cD4Z{n3>)|1z8zxrE+h
zB+Tu_mzjutEMCyMk12p#twERn3y<Y>`09UAWrR8{sKNX8DR}l~QZNu+^a8bXNZ?#G
zSYayDl-Ta#%`cK5FuAdl0tgI~#}V|mNbBrm-~!!N3ZB=j9^vjMZr5IUKEpbq%YS`_
z90nRRkNqj)!!g=kTAFKEVWlYB6{b?$Yi;$IuVL%!qL4wFe8y1uW!H9+?kJnN$-0ld
z<mZtTs*4+A*yr_!PL*o}D+nZ4S;GCM8ZWCOFcR$@EMAXheLcNTOlYkt`<oGA>{i4~
z-0}G*A>|+^ETn#ymPYtDQgrAvV=MEVEKFx7P*Ydll#fvoAG09xzwUoj$l3KnH?M1x
z<^oG2G6$WVBw<u^dFp2k@nSnXri4eamHxI+Jh+Fif%O$Vdy=i3fmV0*N88){jGo4A
zsLLQD>aKHf&EtCDvAE!qw36Jz^i3fH*^(P0qiHni8O~hw?Cha<dR)8q3`z>|2@%Jm
znVGDY!^3S@WH=b`Y?89aP^l6h^!k5(5E<OzF{cU@+oU}qL&|*m)KcnGoO>g>DznOQ
z9yh#weP_*{-BZVN`}XRgE)wh83_AUKayDi-qN7hd$PVH`#v1?EgKP_)QCNepZy{Y}
zhQs{z`Fxtd&`?0BvU2A4JKaf=vzYGpFyHGRd$yHW*@E*_-4%oXJ<w#=F<nVvDw!}j
z&#Sv_B{znCe;QJ|ul)&ix^$-&?{%t@SZ(j5b)u8jd739Q#OAxYKlicik3f?41YPIo
z;lpQ%c0AcmUR>&lExD5#j$OR=;nd$*j+EXNJSkXle6+lK4F&}pH})_<?a)&M_8PP5
zf5UA+^7UO7!(2M29UE<%pK<Nl6vN0iDwcFLLjOyj#1CKeA`agAKbsRJC(a9OV{&la
zzu4w=C59{q#~`#5?R{I?`s)h~uV<pmm-8gr*+!rD_(isrjOvAsc8yGvJVoN{Yn-em
zbFcsR#Q;bb7BhbOFwJh7fwgM5=rL4uh-1&Re@=yk>GkDH1SDPG6M4Pc2zYt%d`zZw
z{1?GkRf>#a4T;Qc(J{&tKa*mb40t!IxdAGY2$fD+r}?jBnDqbmH#;5PduDFv_7puU
zQ;yHDEmI*75g6@4AT?+Wib~$`tg?Y@&Q$KJd}E%)@*HC8x3|b@Uf<rAa9_W=!!JSb
zbqk8EqIhcBg|;P&uG<dpp?iC%n%bwltADq2Dw@d}{*Ukb&p&N#w`CVda*i2&`50XZ
zK&@74Gfe;4)p24SSv<QXGq1hGqy5s7-%dm+Kl}GQ_E15<6<Vf+fwkDhl3|uhm!7QM
zxE1)lr|&2x9A1|%^$(1(IQX)gsQu0~Y`v6d(6E>LTvEefj>qhF{yg1VLW%f4L!+OW
z>3{ypWB*SU=0ATWIVkgUH~;7FPMrG5dj03GB#J*pUjP1;@{pg|yd=l6Rpu^~l_#da
zO(df=q76xSF$ra5dJ$>f7v`Dm*uH(t%6n-g&NAHte`*0rN(u|((VQdvGG`;fvSv@x
zq>pX}v=9vs2zJ3-@%RkZ*Sk@Fpq%rqDggP9&}hJv;H?cF<VP@hd_x`z_d8U%5Mn?J
z0X)5`VBduc9|I`(5z&FA7-&w>qkPk4qytdu%znK?@%ql47)r|Y9TyXwW+~0nYm4eu
z3`C$10k3xnIpl^7cKN3=hsLFxr*#5)pnDU>-cLkU#IGbLCF!~QkXt|*-?36XSS7@6
z%8O}b7%<xIAX?<q)KrFWlk#bOeH)5%#*SMU2-9kFj*=~+Lb7Ec2okM@xR@;JgQ-q4
z%{}z}oPe5ZWheLoh{OW9wNzY4a+==sLEx)J^%r@Vle04wL_`-(Tel*i<&16MY*XAl
z_ht17A}pLXgW={^msh4|HCC7L&oFefomnkgHV;)iwiGZ<0I(fms7q>f)==O%x0M<N
zL)D&wD-i<C-CqNp%2xUcC-I3%tqu;CkdlH5c?aQdfx(jcFK%)?H+Itp!vCqO-EsFI
zd6Vke6`%cQ9ADY%uH(p!bb1^eS(KhQg&#gdbaoCQ{i~pq@2xs66v%5J3G(C5aFX3V
z-d>$w*5OlpQd4Z97%0KflXVf77pK#p<vHX0Gnap*LiOzJ+s}y=VN`zwTG?<P(xfKw
zlW-~D@{-=xUHu)<^lorpXchE1rS0<H`}7&oSg>pN?t^q48&_(T<E&+wSkW<V;W%qH
z-!unbMz7?V(Z`U>(SW{i*B#ZR8B(En^9>Ex!EvHq={fN<OAtnMPP3ovmv*>V7qF5Z
znUS?V6CMzWHK)SE-C;vmr8fo)#Uh~@zC1|!HJShl(q_ssdnRs+kFNuCtyb+Fv~E9D
z5r?<;o^@0Miixqo>Q|R3XS|V>r0ow(&%MS9n6&o#i??s*FJE_VqZkk+)5kQiBF}bB
z$l#p4(Bog;M*q^G0}Ze)WNrE@)L@$<=e?m!l>dxkp~Jd$TQ=>6y`CNJoRxr6ixrTX
zJaLb6fu}U*IN5aOi_=A1_d;qdL8=QN%|&Ampyt3b&1cmo;9D2Pjok9Kx-6ZqI`5_N
zieyc0Mit*_@`Np*&!VE{J*nUPc0IT2JK60}iHx+f@1sBD=ISkNlRWpn<xa1R5?@P$
zrE3?~K3KWb+uP@6iSNx4hYzU(mCik!|IeeLZB<;Clxn@+`ueHO-?Fj+?cGYXs>kPy
zcYa-LdBOQZ&S;zG5Uc@}#-fXbJB19)&h8x+Y5DzYNcI@>n4Pn+8UBD9x60l=cy5}`
zPAKG=6V*e>%=62r0tapqeK?_kKyO?1Eo4qBvJPghOu?U?w>cGTeKY6##H%h}HlWun
zIR1f+{W{pVKJ(=p*`Lr~a@K;RMl=sy^xW3k$Q5Ui)LmY_8Qcof_<*Dp-N0`hJ7(q>
z!?_BjgO-~Ma#bYDj-{@SxXHi{z;_YoqCuM(h=_#s3K#O;706chA(eBMO;1#yAOJn-
z$JAw7UFIk-7;z~bOf<eBsirTOVGd%@UyttHMYk{A`nEYlg6V$!0^{cr11K$0Tf?<T
znAuTh#jSbJps7)X5DZlf4PzG^F&jg+&L`m*Y!PNeiY10bu)p_P&u3I2yq%XcIe0@|
z9m?ZuWe=iT44-4AY8+{_0;md;hOo_m37Gr~+7IgVaPs^{Df8oYTR%#$r@UVZ<LxO;
zG-3V0C@sJOQc$_1NjhGgIx2_;)QSpcstFA)NrcS3dV(*f-p*5GEbbkOI)n=`j*$DH
zvy*sw$+qA%TXMqjSW;X_PpSxx*c3xy!4(aZ%|>cPQRdU6ngnhQJyc?=QP6?T_^os2
zU4DKKD(dh+D@FNoa0!zvoZ**fRGaCzoz=mqkxTF%Nwezt6?B%&(%1L#_7>LbwC+F&
zfhQ5)(nh>EAZgCD={q_EPjWt8Xh%<K2_-Ir*aJuU@9037Vkp9r@(#L7mp&(Obm-E1
z;O66#T_-3j>q@EF-H!m=i<VrcvDCsE$l+$TkB2*<!lSxC@!@;|3xgUc0lj_xyjrwM
z0uV`3$Be0O?b!5>eFZyj#z~1CWKd>6sZf#Lr%(*l)=}g$BADWR!*ie)&6=-A9H%<L
zIWdpp2d;e7sAsG>(H94*w%J%#q_o55?;kmc;|=ruUrf318S<`!QoljG!=tJ8*?Z(j
zF=EDYzx;gFQL9Sp-{$=#hl-B%S#q(R$P(noJw3N<hhE&L=gN?yW97H<HN2$de3drN
zk=fcI*v#XPVN1HkXb$XrwY<dr!@?rS%~wm%oYvOV;P|gGfE1?r*$#RAc4*uX7R)=P
zyN`=Inu9~3jqPsw0{Zsya{BYd;Q3f&a+asMH5M;7pfQcE@-Q`mD;$o-s6Cl->HA^r
zg$0N<hL!Yf=ld0r%4rV7Hsyl{<t5!WFK|N4cO8K=YG1FJtB{8y@5}UH6(z8&^F6qk
z8XRCxx9-(*S=2^SJu3Ul00XRgj3f8U7(^O{<=Bi9L|5C3eV!T&9A&#kY1B)Y4ZUUh
zhev#P`SPH{r(!t%>>8nend;r0r0{rV0KIBZJG#qging<Mv>#OJxRi6K{5L5~<$fh!
z8~n75kv%MWe(V&)^AK_G%gP4&QVn*vJSyc=l@&@Wgg%tML_1&C>?`Tp)G^BYGDH8e
zmiEj3P%_wAEn9Y={;37io;8KRQlAeqFPC8-Nbj7+nvX;pemP7Jo#@fLLBC#DRjMy?
zAAd*2O^<on=4SKv{Kki|1?4Z@okbQtec$coyU2}MW`jN7-j6H*DdCIH3yEXOr4j!L
zg=rJNLW5Ao8WfLZ>c@(TRqEOpLeRK^#(+`pYFdRvQ10}Q_^aP4lQ$i9KZ^A$De<s)
zGFik2_D}lC$QYl}{XKG$eTn9%Z$5s0*f}1TUJ9Z7I<&1MZNvPgv6fr5e5Q+p_MP2h
z>G~0)p6wXP)LdII2d3pKouvi?zJZnWx*}#LCJfvC4q}38!Yt<(#Z<M1!!g*=V&+<N
zXKbH4Rie?gx7r^c9H`UssL;N4QlQ!#P`P0#+v9*7GP65(hJWzT_g8U+QS9@f*h-a@
za|r&GQqP#*#Ok{^_98k@oK~*fZz9&yM0g-iG*u`4AHv=|tjD!`<Gy1fGK9>Mj1`GO
zX31DGB~g)3k)cQ^qV`s1c4$zBvK5j<Buz4=0c|C75haxdB{aXEEBtoPd%VZ-_Q&(=
zV{hu)eP7pF=Q`K9&gHHjbY$Vc?bPa(HS3X-(G+HCC>TQI(3F90@}T2(*u8i!AMs37
znN#=c7Xdn1!Nr>1mzJ1dEM$@>@VfJrXJcitxN`jR&r?=@tchN6c8>p$r5)@NNHIY(
z?-(Gm{xPw>^6#goG_5!r`mcuBjT^Vh$|{0wIA{;)d-%5dP}{EES@1%rgNtj|l|Slh
zOI*e}eDe5~`I!d1!-Lj`_ikBDuO37;Cnk=QFI-7p0p&#UsdUl|Uw&Vp+5Y|dai0Qf
zr}uZG-FB%aB?Z~^jey0^=(JOR=oKO6I5m1>Le1=Y&^;sqfBGVBuV|-fee$(BV$7K!
zPj&eW;c_9q1|K#L^M?q03K)UVT@`(o84HF>>JnbUEcP40h!%>#LWc)vvXho@hz=L*
zvm^|qjd9W41AX32<NnI!WM^d9oz#q0(RJ+6w5fDUR~!^#B9wlbt=+!?f4;dM8966X
z^A;)qoj;oxiq?%u*9F+ByxLfF#MM=DT9O3^Bn-JSm!++qlW)IeiyhmTpJowoUdg~V
zdvqsdcAIs?cEO*P91Q!ZQ&HgN=(p{Na?`x$kbeE{J)9+?ru}|&Zh9%st*$;lCFYLZ
zT}Qj@jd0$gxPq*c(Ek_{MOsm#X7yQ_NQ`p+(7&+T;rX);Z@6xQ0an;~zrze5z~hWN
zV_rF+6P91I%`W;T-Q7vHvww1~TZxO~(9i=rT#draGk+A^aCkfGr)*HKNV{&vu=0@8
z)J<jUw0TojJ5D)Z*BM722A>kzB;Dc?A$IpWygVhpoX&`vms;jBAg9l>eIvWJrl|V(
zy+^lhFDaO=ZDUQzUgw={<)&At|9nZ(Ob5;e#&-He5bi0Rv}~}OKjvQmEfBjt`>&_A
ze8cGd>t;aP<$lAQ!eFaNa*7i=ck@3stZQp5+&r4Ebm+>gd5UHBTZdVG!}YdoBf#Z+
z6P3i~Zl=m^+>|wzSp0dq&$AicT`NwAJeXqYU*ucevg3fRt#?u5`1zg&BpCM1EdNs0
zt(G=8S8hUPw+qIhs{zYozw0SK%p*zK+8uW-{-bC6_RG#{GH=s664s#v!S2%uu(+J?
zbj9nS9IylOa$y28y6efyn3dj4czA5Xx8w76EvDHSRr~m5*oH5k(Aohjqwj*_?1pyT
z)w<ge+b|mBd-pOm_h^*{rG@?2bqU8S@9wmJfAa9fG2>SCIiuA3&Zm=_<+jNsp1zU!
zSfDlEc^aPD`p(e$klU?y-Y&%=_E68!X)p>Q8JmeEnaj{_a)=FST)up`=@{5An5Cmn
zvluw1_^*`GmMpl<Xd^~?pskCGhRvTdd9=|l&PcjEg+XNd*TlewiNrTOZL7!p%;`Cs
zUsb1f8)S5TuCJz5;5T|xLC*^hZkzbyUDK$qmSCLxON#cixX6M`dVDR&NO^cjup6E0
zW-a91I7IgF-<i7Vfc%~N_ouFo-CCh0cc$#yw~^^<oVUFPY~Q?FLoH|6S5s4S-Tj@5
zt9vLZmE`4VH&{FDF?f9Oc_Fro$`OQV#=AOd?L6pzcEb^5${yR=5V37nIuyMme7VaL
z`Mj@&pO}XO4-wcQM)PQGa&VaA-=8DV@!79qpUxU`52lQ^_7^|b5*$s<%w`r*<@tWK
zt}C?&()W58=Iys&cZ*raDrNe_&$rHcbg}AipZaQp>h6B0pBK{8{X$UYRU-%Z*I<?i
zQ8}^#{b=Prz4Iv&Ilu0!iUSAv&Nnv{S^m$Vr!<IC4}0rzxI=&aWBDV@D<<8vv!4c`
zJ75HQ4KyyR(+0g=IaF2E26SPgG~{GxB|DM<6c0<FX5=iB-a3Fq@@;)mpB+aW=~0q&
zoEdWWdA@UW4?JHTP1_`T1+B@vN5`K7)M-GoxP-1m$bkbrv}boe`@9f^v_Y@eu%}TL
zynL~~g9Aq^OUT5~qdc6L4vfCZ9+TBBxZMEktedB_JR<)d<%RV$dJ{RFfr@3#W`H=@
z7p&E7J@^QBPcQuubSrxvdSqaF-1qas+1u}Lvy3M^iJ+e{hE~!9xDxUaaYV>D^35;!
z9A->}QW7isP8#NKFjA^;NotRJMAOA_ZjhnZkR`7kx(+7m4Av?!vfdFGc=oJcJ7GG@
zU;Fy~J5Bhte>Q2xoYsM*cY)r?GROU=<AjW$_XdIz<$Jv4M`5AWwqd6n)9rSHY<tw3
zJvw;)ml#2^*vn(ey<Qo#?tcA}w7%*e7AR38UDQnZ5l{-OpLMnj8C1z0oVfZN?bwxQ
zjX3Jgd54yg>zn&W;`24HX1y32re}<1=zx9G@{N9TbX#>EtP;62)^S-H5R2?Zi!X{c
znvkvVsge3yKaM%Kr25&bS6itb`58WTTlkZ8s0--E5)I;K9PR^<N<CljeAJ}q4Ig$@
z{-GCYoU${00KHBr%JamtgnRcG?@b6?7+v~s)a1v*d=1vTRj<y(yu<gN9WbCQk)O+K
zbNA;~G`T{tr2(?{*Y`Y6`2fJ7jC=UGkOza}Pf#Xc_BL&hI_&lRVw0X3Nu-HYTW@OO
z==krV>vb~@i&<TK(SRu(2N=8niF2_~tDpQ9am4akCZ1Db2_gGG`qz%ON$Xd>;8j9c
z7O(hW{8suW9xaZ$R4^^1*)g>LnW|r{GuQq{x~%BvJ8H(d*w52VOPoutQ)3=qi{z)^
zZG8OGn*e~>=d_9;a!#9vegE>M5(M^k-QVzB`|YA5Q9Kkoi^XJbW*_$uLUM8h^BcN*
z_>dH?eOUg6D9^%@PVvX4c+{R`V<Yp|c@KTlp$tC+vTtKGXq-xsjJbdB-eFD_oqs-B
zBU-R>oz(h8@Nw+kRIno~xR<v7(&fOaB7}D2g^Morb+o8_BALJB-w4)>#F5r%s|_Fa
zHY3GMI>|0uu|k-RLUkdNV{YTaf#(mG#fj%yXWcexcs2IvRsc$@1eCops4}OWOCP_Z
z2D|8&KSr#jmH06ayLR7({d~uqTfXH~2;BWq`Q_IF5ldcQ^WIs2wO_-RccNoltMZUl
zv4_8eZ!`^k=3xUhFng?-fDm_U)B31%h%?v7JU!Om-%Ccy+3cKdbsDv9)VlD_&p9Kg
zMFvD*;Ojt@z`QQ?C{LwMaWkR)Gy(<0V4u+su#8ER@k5r2wFvy_eqNQy2RimsQu2Q|
zaE568@0JCg3>Fj0)bxShP+$^5axPJlqUfvI*>1ur=1p~<n0O#q7|fE~?7O>B&4@l0
z97XOW;cJWcwrNCijxs=&cjZ%DA7B`K&9n#;I-G$@K7KrF7_1q!bpQBq$8fytwh=ls
zcsygyCufUa0|@D>F=Av12LM!px{{JqWB%C#*BBpmVG-VpY3+vXsJMx9KZjC~ba|sT
zHoIW=vl5jS^%31}`itv!T-F=0cW<Am`x1+`m|wU(>M~u;;5c46a8<7e{t*x4#LUb%
z-h4?E@-_v}iSha5U#}-ESCpTtJXp9UUDJGnvAOZAGWgY`BD#ukW>40cA~k|&c)`5^
zLNExCd$kO*`k1EGzAuRvXL;}<?SpB+C*Kc9cz#N6X7;y|w{L6W+S>PZadFYgJwksm
z`O}{W>}fFwMb@4@G<o;a<hYh;F|>6z&3<ZX$&RHIx{#eJ5%~3rCa1EIcvxCw6LHQW
z_A96^-{JHsG7XLq^z5m&U^RqMn$<QQILG_Zs^C{|eiY;$i2auT>tyw|L(jPDO&$Em
zqjrZ592lN%7PEO>lw$k#Uv_M0x$N3Ue<nRjW~!V#osT!sm+@z@1w8oUY|6NDy*-O#
z2G`ly_H`Szslf9o7)fX~y;~SlQu7bkW|(A!V-x*B#!GF%5ueLw_suCTydUtBEh^QF
z&Wp`{!I%?I3$7}KQlzfCa`kFq`nkXVd19ghE`<US#sr+LG;dxwzetMXfiJpupv1RF
zD#m4GPqI0gdBCzV`*u(A($uKH7l`qwQD>fI6367GbCko$QxHa^y1*g<z<vH2dAP^Y
zxD%89gQajqgCd2x(mDsihu3Fm?fOM|NBR7g%4|2--)RsB5);VdPmTd>lUtlzcyUpC
zB_-jnjfvoSqYJ!FKYt})=>zR0AJMqIGzi=9UfE}WtTJyTr~jr|&+d&_c2ng#B|X}R
zhw96DZDN#6$n4g=v0Aq-lUNn39(Uh*b3Zq+n}fM5+#RDGf-4X6n4<PO7nuOyJPT%Y
zIfW>+n?|MYTO=K`kSiovno`DqLyp#*)4Oi7SZ>XL4_=+$JUXvkzPkm}Fw~%{taZGV
zdOei!b#8P2_>K|B*bp?VZX>dxvi;b*@tM57DU;tRs|>4=rf^0+ZfUQe(64s0<BCTP
zwvFKXQ$#Ef-ZP8%wPT$tHP0NTPc(dDhN!)L<e3f;on-6gN~6}lqgK}4L*n=CHsE=$
zI3Nn)H_gOX6z&&{lAKZD<+LI`r6Epy^p&acC9Ba3(U{cBDyEwjwwPAGme$HJ!DS_M
zg>_caid%5O=x}#hyaSdnS?u*D>&AvNm2srTX|fDpGb>w~&~UlhN0=@F1qR0<l_b~*
zp-a~VxgS^h8jP6gw>F&~udQ%pKGUt&I7f>C-5%FuPb#;GN<4LU=S%gYVW$({gzY*&
zl~_xPwm)471cuFCqnYsP6(={#uo{w32x+yJ;Q;(~vm+|s^K-LLHcjc&2xUOZ?rzg#
zKm@E9xG+u8n+2`-oM=D(_O`xm;p%($?^9EaKeG(V6>EZyLZJgFI_`U!8k_kPL;mbb
zf?MYkB8)4G$3!(0_`2gcp%W5xQ;`@_3DWQOeFwr$!w(P+-PFy2&h-f)2i)W-&$ZHp
zSKx@%&o0`eF{GZ;!HqaQVcWOCXY{U_hB}nI<FVxCb$Z8u;3+0Y`Y-iTXy5(`q$+xJ
z?D;=z>yl$8sFscAnvKp-unC_vI<wQX=Yc_1b=@x;^y)RdYwP?=FIM+SY1hs=^6v>%
ziCJ0Zt0}vN4;U~Ya~ZVjw$%RCGd)$V;8WzK-`{P9zCKFP6|V|%XkQqc58raft);a!
zw2eIs_E(SZd({>O{2yL$?~ccX^Sd3$F<}X3jHMPBh9L9`wbjH0Ob|KuqOegF?kHmi
zFtUcTHGUjE^6z6xZVqCjlW$8*TA0dLj$l|szGFu;P~8qrD?f{!hEDM<?Ii=K=Pv+}
zP@WHX%{*`4Fs0AM#S_>Ae^drR^WoQ6qYb+mauMHd;o2rv<F07UEBER=aJE=0%SfZ=
zD>R2%`Sda97)%F|y2%rbSK;}>TT7d5PZxvgy`?hX1oq);f-qFDKPj+z<bYAM8s6Q}
z>Pug8-+==LG2>Yr0sC&qaD6fowc*9gHeaD3_H@FInje%l>5maFHY?wBqR+<NE#fhh
zB&K&(GfJ#6GTGrcG=>2eQF|Izi(XQTwgxe?5s+N-42d5|I*D5JjSFW}U+Y5#00kLV
z^Adz=@V3Q_v8fawf%>Z$_@ZqW?_$yU(Es6#&dJZ7ZKjKnrn><t233DGmm!QbVXSOd
zR1`Uq{>Pl-Ba3J-4L6_Nw=ac%n#`Iw^LjXJNV;4s$LO(cjjKbq$!QEhEQzpBFt^ht
zI9Vi!9^MG$e!?K2$9`8*$y8Fw0YV1!ZZ%yW0B0?=Aw>?&`mtCvVL_Gu@iK*?Xuz4r
z-biXHt_V}k!RWmr0Jq5N#fB_?B7hANpT-QDlgKMqk_@_1C=?@8=07uDhEpfsU6}At
z+lr;QV<sypC_JSZd#&BY#ZhIb(}Fe~;-#B2_{5#birzGc-wvJ}Mpb|qP7g%{M@&qt
z(b@X$BpM8Z=ks`>mNn}0F?3*ydb1B#RA5)jzkQ=;6Gi@`KD4(l1L|w@_xSyw6k95z
zJEvl>DO+)y2abOyQtLE-P6h^md0a+hy@U|Kfzg$|{rtK1kRgw2vK}e*8n^zP4i|t5
z?i{p+(FLRYgQ@)+E+c;{`TM`ZK?A|r`Sg7JYN=kC|BvUrPzr-wm5;`Ee^?D+$%OCx
zV1AzhnmN9$1tqHyU$dNO;D%(unj_9f6)7152Cyxs3%^+ExIq}b0K&x4zxktf6~Dds
z8hku<=nDdo*P&*uZZM842&yr6L>NPBL325<2oa!fk`d{J7W!4Do~K;};NlJ_td@>m
zNt&v~Z%>0Tx!~NPH@i~@>9kKvnx}k^bK`ZWf0$E<T{JhuceH90-<$ygx@lS~VsZZt
zPFvC~#qxr~LL0AUEn3W+j}p{!c*5O~uctzPYXR<l2sJ<G;2&_?;@HS_ezAsrd-+x<
zY5JXM$)c$KVOCz=Xz}rD=6a-W#)WOZUp9w|M{~q(`tc#EaZd^>tWWW8guUEy>mx+G
zPt?YC752(Ye$x4J^}X0~aN|TxYlh=%-Wi;Y@J;e)(|j^(fU`z<#SXEFM*YK3gmK6S
zEwOaKuHr8m^>Excm0Ym?h#~6vd3O!|;f1y8GUUXQ6)B#o8)>*)8{vm2WSH-RhuM>W
zLeO$SXU`_@Zb2Pv^U*1;Jo`3;w6Bw*W_i<oM@v4USv~N58+&ySavx|ucJ$~+XtC?E
z2Mk(p!Sm~S22l?5GK2Q9c?kXX=w3N2d-n%d$vH#<zi#4~v7l>I(IC5zZ=>Y@;jma|
zMV#<SN(~u&ek+uV_;UR`AM%W12lN%XB!)|Pl{5iss>(q__7dZe|DHLr%3ve4j6Lo9
zZv9>y2M9ply%;Wt3r@y^%Ah$6d4~<wbT}o=iP?mUpqSCDq8n1=w;5z0DwhP|UxuSG
zXOjWL?-bPn@KUSLBIKe8Yi%3}4)mg*1-z`HQ#EAi%^Et5(BX3o3>-FYBpEpKkqGrm
z5FAk29DiAXCh-O~-2#{rt%>F^K*X~hcpb1MhF^`H$^eTGyqVZxah0Wa+hHR}<L?SE
zx+h!sC}vO;Ae?|Os>(S!2kr2`U_$3B_9zSzAD|!MNRoGYyLBD4J|Hby1tfY2+(0!z
z_WcZ&6@q(S8h&ZyO13|vk^9DNwS9i+Bzg|tDOY&1w1O8iH;8PN&!K>G1iNEztY1bH
zj4;LYJ@3Gf6<W*e9ZPwj%~~m_5c^j8Z+}K&peB-27B)J!VS264CYJ$fLOJV@l;XGI
zwF{p=pq26zepgs+KYkSd5uN}ClMxTz;}x`tnn}zjaxR3{h37`SjY9I`+|#<m1gr+E
z&(@79nb)m#^Pm+!Plfa_pFtLop}Ra*mzRt~{nD}}on5FQ6t1x1jn~ss8DG0M^pb<_
z%DA@v;?zt^O#RVo%JmD2uDmCy4RZUGelC^iDbKboqRa+N47+GQwBN7q{p<f+2Om9l
z%#oF>!As~OTkV`w_aA`&^+yuDn7YKf?5QoxbNKDv_5X({B-e|}hIS3yg?sAA4!xIV
z*N>8-+A1xUT%GrXO^iL>Zek7W6SeeX;eqsV#zC&SOIgyu(H**!H7i$I{F@`am4<`m
z%!4mpEVAk=BbAd#)JG7)JrDkoxbVb@6M@aqugNhUJ}7t+3a`Z7iLbv*5PfsT<!qk=
zt%b9_+vV_Zwho&<PH>M^J?b>}cMIdPgFt?LanpJ^L%J3F>C>uUWta6bi86t$Bzw8a
z75j{2B#(B7BR_2a%+4^xEu>|x!E9RPcrn!cxPtqUtSr5c^TVwvnrW9U9639ujqk(P
z>+Jgpe{;UxWimaY-zMr}8)@*-ufyP0?*Fw}XLg?jl80HM()_X(T_mZph11xqbWkod
zh@b637)f|V2)1K)m6gMiEwg6-E}I4~5ri;DN}JzbdWdsv+5;m>{LqUxDtdZsq+S{{
zVn!!v(WuH5`gQC()Tx`4b!bb+?%k`HCkN5{bMAJabA(dji#9koYF}sdD%7mk*1jy;
zuW=LOhWTR*a}@a<f`3tXu0bKxsZVdv#0ozwxpw1fd38>}a>#g0=iV-=#M9lor(0U~
z6E9*5xJelwn(6dcJr5z0J28z9@F6=}tV0683{sRWJ8bZ=Xt8s<pO0teLVQ?-r1u_n
zG~_W!v!9|*7hPwBHp$bP<V*%)vGE{gi-xAAVg4ei_jW3SZR|Q78Xe1ihMHZ7#&c7g
z8$F?u%tU}s+~wg-ZfwjuByL3&^}fakL1uG?%9JbXV@RwjJz7eZZoFZsY_sI8QU2et
zNNh$N?mvPc8nm__RxTXUR>GDVBaO2TgLQ89ed}gaHL*Q}4BHaAW7<A%WCuJvbhFyt
zDzlnkx3F95U7!CJemi_QYCuGs7rxbZ-oABVnn!<kQ|T-+@=pv#xzXjjPn_~<+ahrb
zAp{Nq8Q6RjQWQ~0+0+!<OEpS>W&qaT`}Wb;a;f?njJIA|dl@M}eD2Q0p=Fz&{d!S4
zL*~L{z`)8W^9#FhZ@Kx>d|GW@-D%2*=Q&599Zgdqo1lZtvvCb3$|4j)Z*a|Ka=yCM
z`)waIyV+T4cISRq2T`tMYRCckK0tqHXz?r5Pj_|}dxzcSiF$Y}7>?=L+n>?8u&0YI
zTl~p6(J?KXJ|D~_4yt5zII`(wOFOT~5IQm=9|%WuzAXQw*X+aIJ8Xr}!{C}qkk_C7
zhg81;WCv{PqAN7L=6`h2X{*(>HCYL<K(v04VBf(+UWa6*x(7TOF^9X|0F<~Oe?4l+
z4ybAOS6u&3<KKIW3Yk(&t;v%(#okv!o>Vs-0Smb+=o@obUTvBurjkEF$!_w^cP>N!
z*6>@3U66qbt_1$A$}!Or54><)`F{`m(gvb4Poc14EBYK}Yw&9c>f1#60!Tm5b(pSf
zdsy;yuSfD8$|7i}Lh&N6Un+}RMKJhGh4;IM9%%@bA&n+_x1<K#pp3>atDrEA^VB46
za@OPD;>^Sm7mR|5_+7*v0?*jAev-;3(ow^}3DvXc&E>Cmt$B<vySgOa=T+Zn2Uxhd
zU}P_e|HI7I+xs4~22Fx!;L3_KpO;y-`8P@DaXfMQO?Zh-RbOrRv>tEUC`}m0os)e6
z0t0)^;L+~ks6rK)$Znu`B0H%lwsozsrSM|Hq=T-blarVg5U=2}LQau1I5{S_NG*6V
z@lAXss-K0(6Z;3;5Qx*#Vyyj~!xX73nCpeUNqGub9Cp(b4FQj^x0}2Wb}>SH+d>6K
zQ%Es9RnIj11qcwjsI~AOG(M;jE6U5~izhZ%mNzf=<#D4o@59yrH#X16zbD-a2?s|$
z@f?y&fn|cnuX#3D-%cjw32(U}VY2SDl5(nF|Ng3q?OkhBIGEfXItHC}S>ouC1}SXd
z!BPIB<Y?s8-#T4;e{?d>`F_gElVk-U3U-;7zemc^;N}vl5i51n{o{{6*21{(uWOX(
zMhj;&v2TFAQ)>Zq9QxjGy8&!SSnl#Pir~jJ<_5Tmdv38I@wJRf@%Bddyja+^ilkY@
zr)K}5@k>W3N1Gb@u)ZDg5U8@#4x=Ok5|8bxYe~q*W!rb?5N@BV&x7@dXJp)9jC;wa
zPd9AR2k`4lGrI8Htm0Pw7e(!ZD4f5sMn?7vR?(2yb%>k9hm2<&<4r?ZNnyxmhk9Jd
zqt9pe?BTEs4r3~R*z;fuojP{E2z6)##DrOhvAWd<8I+HNfw{@mc}2gId+$gliEIIk
z?($-rCAMDNdhWGOmNv)@7$m1m;|YE>`@;wE?lqs1eo+F8<*!0WgX-n1I1)EeLG3_@
zwl&UN_6z>vB5d%erOOT+M0<1ZoJK#92_0HYoa)ZHsE&SARx%a8BtJmPv7-7G6VpN8
zgp(0KU9CquS8YGaGLEI2JPJU{(^pX&&+%3gQ}9kEp)s=TF1FnWMYM=Vu5bQCK0iD8
zLhQ-km3_`~uF4y9UU0E)@+j?W{tdXzlk#fYN~aelgWY@f90$>kBeEM4UrK@QPULSd
zeHLcu9-P+KZO{JwYhGV3BFKopkaZ1Y38GE7f4`-2lO|1gG|Q~+=R<aAy7Pk%CEbZV
z=>RJ#zM{;igwUgy&{$Ev2T~Oa7%Y=I1nq3%agI?C8Y3v|rpTT)3`UhQ0dEEIUrfjl
zlsbov)AVQ0h6)giV$lM69g@?@qN<&KusbPPBR?U6Ynye==BUU<8-Pj2xfhAHCZ{4p
z0#m;JB>r6&7jbRLJly2Nbv?23qMpaaSfNcT9rIFXZ<Y}Nt*48A&Q&S|qM)jxf@`Fp
z?pT5+4!Fz6)lWZR&#f}=AGh#%GKo#$Rw)=C(AAsig0m_F@_a_idQb^ODKOH%_K0Gm
z+pi%a2Y3PV+X1y=jGL#ZG{#}Z%kxssYMOGi+e+~l(YGV<hGWy9Z};b7X3N$3^|K@x
zq1x2l!@)v^%{=>_O{=9?Es9`@N37FloGWGJF{@&@$s&eGjw?B8;fufJ{x=^rP6#it
zY2+1l)P=I<ver`F;Kw|F%n&K+Av`R-3Shr#ZGK)}B>x#SuGXWI>-X=#H5Q=LsF_oB
zmBNYZegRd1cmkV5dD62d&u3YFDx+xJ@cg55Cd?bj07Y4A!n#Qxvql-}R2p3sl-ED1
zs#+;yPEX$u{(mT<G0<+%<fa~D8MG0jxxh2S{7}@hq(thkDf#Li+9*Nupu<GJsE&dB
zfXK)#^kLaC;nk+Kj&1v1y|P4kK4OjjxzYt{3qWSr;!OubNG5w?6>n`z{xkMu#IGih
zM+>TGY@%G4q2)RqxvroxH-OkGTr5G7BS%W!s>;d;k=h_Rk(HA>s?BtP1z-aPdfw2X
z(o0JUI`J&`?D43>IsB&q<|;<cy*d>>mxg*ZxOLWX)jm0lp(D4BDLZ^?meD!&I@m^X
z9e03FWR{fF=w6zLx(rH&F>Q}y$5iZu+6ikloVO-SfI+=oDlPg8<5<eb0*7c$JDuL7
z*J3RVB2unk*(8~qWgH@Y!f_no$pN_snPHy<TZ-xVi_52(6Zk7z=JFrVc_b;Uq-gdD
zL>e1M|5-HIMy>Cy#K^CuHgC-?aK?Y(x9kQf&H%2DJL2>Fw%3j5=p8@j@Xs&0^3QQr
zbB3%zljhZ`gU;iB3o9D@?VbQ_sP~h>LzI<XM~*BXcb0sPPDnTu;FDyyp-G}1OA%PS
zX~O;(7`g+I%o!}?Hxj;!7mU7uUp9)bGkug2UqhUDsu3jwFG#>A?+?4_Jx6vPLS@A2
z<gJT{vGnh^lyoLc$!e=(t=tGdcY%qG;D<A)gj&{b#d0YPUwQ1H))7nuH|a1~QV4i1
z_IL2DX%HRr^b90p4L*b&3(qsYs$fur>7)Mag0RGZ(2e-R!{nDXexwH|iaqgPaiUXK
z23yA4Ayf%v7>Z7Sn~ol+6w+c1nprqI0-ps&kz@)_D#Z{|8{Sc5wE9?@|K?#LgYARr
z=IatTlmQEDxM))c@)x9>0m$jcKp;Qe3^K#@cFPt9uUUDkw&-#Ic9B$2C$J{(*%KqS
zAQ|dOT0=BU;0P{9MzSe3fJH5QcwQQJou2x*(Ii`6hTND6<Wan)F2XA$=fy0w-^~o2
zx=tNCZbVZ=5x|+#+j2o46gNgidYQ<ZX2=EC3q}*blBjMii^fRS{rdG2+G14URW7*&
zxe;s~ds-jPKnEw9WYzfrAE?M>J3130dnFJh=n_qJB9}p^af{~7t+Si#;1^vcriUSr
z!Z**xMFlSvL>_!GtBJ79_=1rQsE-0BMT<DAt;tnb5MqrqzkJ!;Ujv~c>Ex(#++oa1
zD29n_PKD3Z^W*tjM<2K5TjVoY*bx2<Zlwt$0PgpIHTfu~7@AS(-CO6(6VE{lX9vF^
zb2|ex&eLzXUaT8x%&|qScIRbu7r@Hz>YbmaW9!8Pa<5*thO3~QG7lJkr7QiAMy+bM
zKQ!3@TL83gSet@V{qe5^as+C$svx5orJvg84<N~Qk}los)I+|+^K%eEYhMiY()Us<
zZ+ff8yvDy+6Sl&DK5h~y0d+a1uMukCLt|;bi<pX~|KON~y_=Q=GJ%O@JBB};GD_|T
zfsx#HME)#<pn$>oW#1HFLbIw=xHgX9%F1iF3?h|X0=Niwww4md{f6Y?ai;w9ys&Sd
zK7k!xix!mob>IWMXvw&9$B(~;7o+m=b>GmWa=xSE4VJ?+cry>Hj8Eg7;E5Y*EW9D8
zD)guFBi&j0An3xYn;(;Cc|CupERj_HYd~NuYUs=YBd(HI-#dHu<2yDCn9xxdB7?yv
zI^H70p+dpX3&dIu<8suT{RVXK4^Ct7Xr1l8Hd3NLy83-xG*~WFKG-*u2*GU@LKyFd
z&83pPzabI7*eyeHPBvxI!&jqu@I(UWH1CM?CLRb?Pq5W6B*PX#4-JF?aom(OFT>fq
z$G-{UBlT(DL<;bvWqi>zqM$YpU{(p6r?%k2*Sh&KI^O>=P@)o{uA-0!Pp4jJiTw}q
zpSN&)7yaa2orq~q@*PY=zmf6=ocq9c#tI#uEe1eE|Jlfm;~dC|p#2+{+8Qk;PZN4h
ztIHMXvdV7=E8bG)Dd*Dhz#YukxuH6(5)zAvW)Ig$d(I?0EY8Hh+JOTGbl<|R%jcnH
zxD`_m7=@ZH2u9eED8qtLOnt<Q{Z@)Ng56WG{8$rEP3*+~ISq!qiOZKSfA`O0q8*PK
zyDXPpQc2$-LyDnu$DFi9UPBvYWImc^T%9>`^kj%?;>hVdBZ`b?&tAhhp||Ih=LEA}
zCMw0jCYo|9nz~-p{mnD+J6V|Ef%FW8!uJzG=p$Uvz3(;cJ@c5xRBS9(QJCQ#&t4kR
z_4ye*so1}{MXZ{d6OutiSPq$0qUD9!U!XNS?pfflAX`S~*+0KY1%AZkQJg|y6ESw8
zGl3d}`uL8cWEn~x3U18;+%w#`ge6GhP+qre)r#>oL4SGfgZMGnN;e5)=P)Ldw@J_D
zU<`!<&`ebD{OpxC^+Q3FkiNKqJ=$d<(>tYclv;EG0yKttv}E&;Fz9F`mGgs*OnP;4
z9sHe)L~cYojv5JN*0KK!8%2eMDfLe!X+K$3IJ9M~Cgs{3iJ+G<V%;nJmwBfO8s>{-
z=K<Hm;wfuX`mcd&Pct*eoBh??_2T5l&v!5I9Rbek2^WxuP)fb)9H(;$)nJFtozJG{
z(<a;cA)(DtA@qWlHazo$u0=9>&cmD-_7xzxax)HrIW7dB7;NPiC@d)nGY-KHZyC+x
zHzS}YX<hjGzqx&T8EgX%dL})GOP1{#pC|lZ{l+k*!v@3Hj592&<z2NsYT81IIuz??
zv1rkv)vGUT@Hum41;0>WvkhnrgSiy0&iyqt%P=o84c$y8B{mPwfAmnl$OVnPSiE4}
zg+RB2h(_WJAG}IRwEmyFB6_?;1&Hw&5U<(z%lt3jh7rWaXKzV4vAhmc4Q36_mqOc+
zu!Jg~W`dzO(CjOlF7AxeqDB#qi<7W~dK9%Ce!|3EdNMmc7;*Crd^JHAGa@6=7jaP6
z+uJAm-H_=${eRBFAHl_&>5Zdv@zTCv<U8ifLVjIv6N8{uD_tdpj`RS!cZZ@Np`Ezy
z5X@c%tVn$SCmfaS`oFl(*uQ8HePu}V1`mSI{Pt};k<f0$M$k_ebyLgmCz+YsNquOQ
zT*3lmbXqokKFMRTA^oX<7-aXQqT(dWmB1`;{I+#hKxs^=E`lAqI(phqA7}Ey(|iXW
z+KAB~N<M#ngX$Tff~%{P{6$9c?b4&iHcUW%rX#GkIn6Ak3JE2-zDP*;n7R3MdOo)D
zUpliV5j;TlEmqvwT$<WA^Qq*MMa7sAz80}TK)Z=GrIUGs?xL85=her>d|JEjU%%3g
zbA-Fz*vDA%&Y{6gO3qjv!MmNQudi7g4!Sanyfp1h%hs)HD1*GX#}?UO7GX|O7m`CV
z3^NQ$t}elo`zFbr2A8fZW-@fF<{TTEeR7SHjLwGtc~abgdxRHAfB|;&U?20(vy7Yd
z(6khbK)s7w_n+x48idTuerw+9R(S5MzuYMV`i>Y;0nK6>Ix^FWo0$ntxnvx2bw#%d
z0HHIV7Jy<#yMrrrb+f&cxUBKd99?v8Z%2yHiR@yH%{}w?1SCa^0gQ-;lHP&x7hGI4
z&vf9!MU;=URSR-+y^6A%B=#pOBG@BX5mSj*)@f#NylgNAj<~qgH)+;NrGv7hqe>=2
z56-oMi4bE@`RcUS$ctyW*K{ATiJUcTFl+;)BdA>sQgdWc6Un}HV?^{=%(wxwIQJ@c
zY)O9QQeXYnq0rU}{g5!Z_~H$kLxv+JJs&45lF6}#cTJ1lMUDRdb&rhIbS0g(j%0kQ
z)lFkE`QN4SI}lJ=S#h}4ZMHk0QtT-^06}P0R+d4UoD?P7_~Xn*q4tylo-S*SIz31}
z#pkr3{nR6s57?Z}X@qh!tV)0KMEKSs#(0>pUM8m#N(P>4+Uf|}jy@BoS@Jj0F@zdd
zS5+CdZ6-M-0GhDorT-!)H*?mk5ykcn4k$Z)agtm$93k#pK6YZ!Z$wS5k;0!-8F2$*
zVLd9}ECyZ+DuaHA_Or}nF}}?LnudLTbSa1yCucork{I%JYb^(BB%K6MAIF(n4HdxA
zm^5h;{{X^Y*iTowRXsybuce$^dcFgH6ItCZy|AyN!=9|d;0zJ{Mbe{(Pvekd>4Q+B
zo;#4RDH3qgL(AHL>K1g8wfX{CRH&Qih5+vJInpElkn62<`1us(tpfF4x?<PL>0k+k
zj*bp7MBE||J=(ORsLx3VS5{1?ud1i9=0sDSk*BLhb{Pwi#;Nl>B>Zl4%!iV0ffy=^
z4U0x{REc`9_XQO3IcBwRci%8hWq;_cu^MWlsZlvAJ1R03nsgc9T2l;Z#Ww>oiSg}&
z2S*gMyBv{}H>y}1qbE!dFmuMjUxE2;{YM-Se(nfx;AUXzF|ru$4Z;QYIXX0h(2p9n
zZ=#bmtzzAf>pxqTstq5@HTE4%49d6pV_Jz<m)IAv+IY?paUH}x!;A^N@wh1f4#$of
z6`T67`OZH(rAU@XnZ~8DGehpZkdX#H$JAc!E<2qMhlYj<%*ZW-fe0gzBdJA!anzjl
zJnB~LDn%^_KO}%sWs8i+sIEWHaCobq|L@VCIEA<}eC<n3K`y8o1}5S&F_v0^1z1*K
zCxc(;>e{LIOeq*_rF?vfRwlw!v1`{)1qFWFm(kGvK!Hl$!~Op8%{WQtl6;pgTT0(e
zB07^a=!G2rn%rduBVmN*Y2^9dO8@WzkA~P$2xhS<3|^k6;ZgmNx5at+>nEIcw4)&>
zR%{+Dv;}pH<H69F2b8Gx=pn_5!BCVaOF?Cr=BlbD-AF-IM*#phq#)-SJuX{9QM`tz
zM_E&c0C}btKD*^jU2|hN@n9@K3QrnQ%)ywPcG<`Sc;{-Jl%<@NMsGhZx33U2JYh40
z0-i5>gwa)kV*YjDOS0h*(Wx&&YrePxv1S;`ZFY(7>QUDuQ456zCNucdvlamjm0lR4
z+XfDX#2*<RzO_CR+Q?gF-h0lT?jAUN&<4)0@%7gvk3r}grUJYpUZGp^Gulj_SlcFT
z3OKBJ^Ui~e4FpcmmF?W)S0|3omUSO>uUOIwLLAty-wZPv`9m>#BgL#N%zPo!J1;6G
z22zr*puj+EmhqM#NsGOyh9wQs=eRMn`?x<ps;k!w_alO%1&b{&21)k!%4(&|BvUVW
z`Jt3HctN~;{d(o?qcT#;Q4f#xSbl{X#}GLn#gBjWW~zgK2CeYF@QmWz4Q<?8FWt<y
zn!p95jg6e#hH?EAAU;7lzqt6)+O?8LD1ygYv=22k^i{g|>UD_?Y-2JJSh4#={yo1S
zDj-3_KsjJWWg1!xU?W*)ZPwtr{+P4#_E7FJ#}0b%5`fm^o28^<^J|>?=OO{Vfx%Xm
z+u`1Xdnz{;lQ?mWG#i%*9wvlpAfzvBEkP|v9jXDPSGTd7*Md?6^=5yJ1PpJ&*Q<gn
zKd)%dQR^)jODmZ>{yK2&S`V>K1JK1@Xf&BCzi7$0p78os(9GAlLYFx|Fog(nrPCT`
zV!LmkB4#ed_D&l3uioe6h~@yVl4@%4%NLT432Qe5flU#X9=EZI_lLAmU<QM%(Y0b{
z29~|iOUSuky@~v5jxpX};kikY&bR*y=x|oR)M!1s!+oZr`X=s@dC?yz?BxR)H%>4Q
zAwI-YKpmSCZ3b(?rD4hDzGyRP=*M^O{>9k~rjR5jriECb5t4CgoD(DXvdYv;SLp;}
zDgFOC!VfKvICQx=0;2vb2NyBmb>8U93InP4ep<GQqt@$SI}q^-CRdc=8V9GHF%A*-
ziB?uY<Q&&6jq44M2{v)B`9@P=l*|~^L>V@k8Ugqw;>4mG)J`OHVbwu65tA+?lXw>w
zB+&AGe(sxbh-MZvqjB}Rm5j6fLk^r9iCfGvfIEU0;@c=zQlaqS#6y^{()<HE64vCO
z3Hupw1g5yPt#Ktd)a!aNrmfdGkAjn@dW8^9T!NmVngs<&78imB5rKkq`6;-QToJwK
z{)|Mk^AH&q9W(9{^$zgK*Vj1gIRk9N_)q*!fPuu117##Tx(ZvFYQV%lJs&mLiZnB3
zFd!*|GYW3q(t+_3e2}Gbqx#6TUIP;rpbtm$h+UhtYt}H&6^T73kfkg+p}7?02Q%3K
zIe4{W$<GZ5_yMsiD615&$A+&+zjE+1;F@q16d&(0(yg^**BL4MyIV31RU{f-%d|mD
zOaq>*qOo8JQ7K;DXPrjHV(%#lg_$f+y~OJhKiFw6DhD)+P-sKBZ4}HlCli6_0|pL^
zzq=OtVO?f)1s9%;_LHo7xb`eZIVVhH9ipi<F>3iqM6eHBEgHf8Jc049H+~<Likl*(
z00nj;vO$S2uGD9G`=oJNns#IN-nI}kO>%NVI7&OgLvceB*Bp*@nr0*r3#D?x5?c9i
z7>tUrQW)g5Q2dO?jj5T+F8mA&<yOr80*1G!#Cg?{d}t_`U$&S;M>!nU|Npnp4HJ**
z#D8*mdLVrZY-Mhx!MS`tkxlzaw5f;z5K{0vSNo|+mByIIks(QIR37NnY|;vIa}jJm
zT^&KBgu(&Rx&GDYYU|V;nU`6_*=A1XyokO2aV{01mNa)n$x8{2{_Luyu2iZ2|5KET
zgYVk^e;$In(H1uNKIIDA$Td6<_yPyAY5jw&xE49i_4P_FOO~8GdT8)&g^vm=l+O8H
zUADq=^zc?wRr1z$J>D)nq3an>--jNLHq1^MdeP(VzaHs5z3qo|Qq|vGSXKL_ZpYjB
z!q?dy-YaI>xs2Zyx3uJWg=75dOZFA9<_m2?zX5xo6;=~~U?_tk2DoZ3!v2XEifR|y
z5t+)OcjtfZM8Xn8$k1$Tf@kn1O(uW;Jzz{)b^e;!M5kMq_U-3I%UQ2nNx7!X#Q{;k
zJq5*#a@D@e*%V|EUMYkCEGWB-G9``zE~2BO=|w&H*JHpS=~n&icE2=_B<t8D>`Tc#
zh}cfBL;7IXZr$2+)6BuF+J5t9<Kf+<cl8+lICo32r9DcgilSSb`jkaVw+dC1m9r^2
z1owo&3|nl^Y?~2k90`Mh!#mxw;DuqQ3|Zk}rId*n;@6j>7Fc7Kn;R+U>RWZz+H=+c
zWiERAq3*EqQSROQoe*CS9qOp}cawJ!^7s~^$wjl*sVl1I{H(Z`p9_g#q7;&vOOA2>
z{>LA?YU4nnziQPg7EKoKh!hXZH)3PnY*g}P&r(xTs#&JQvf2nnDm!*ODyZdi=b*-V
z4;oaMJ6^?A^A48CD1zutqV9lDjSh_@q<rR|$S4?5^<A-IMYG9GB=fNjzlV#_o;}(?
z`<+sPA<oaR;%N*&ClMC7T?IKgfon%fIvW7C`^H)#1!G{0r6<dm8zRV}2?XBj(WA%w
z`SaPm1zFCA5;yhy+}m(sd<s4e##wx#d-tYH_(C@cLaiEAM+U+Hcw(kKau%2?^11m_
zjGP7;;xmn)U?p}C^i1cEQIOtkn%ejb{lU{l1!)@VcqR7mX*|O4X`wAm!rNrULbk6k
zWH0zv`_}%$2taDwT1W>LKtQmGRZv@($;4h_PYC`!ecW!K{GL1aUm<uy*Csku^tbe<
zH<e;{eEL0=3ISbMgtS4>n($oMUk&FQzAq{o59T5jsvd8Hkcjb|pcv6WM&k(c?d9(u
zHr964szm@RZv88oXBQW7bT74h_XynTLlz>(Ajbm;<>lt;eIRM^1+Q8B<jeyOBX!e-
zwX^xr?r+gD{`xA7);BPqRhdmQHz!p-^77@b{Hh%25ToFKctx&#*jxOAG^jYic~LLg
zlfuUdav>U8`^E+#R&Vw}X09<P67L*B9XA&am|ZQ{r*Vh*;*e-V`0}jOPPUgyw+8(7
z3*{4piG9ULmPN<edy7WM+|z&k{dX$ta{jw_0S!MLMH)6PNS0?i1@a(SctsQ81CMiW
zaIg&|3CzT3KrwBDi!{%utEphS==S`%ij;mBDVb)R{=jCE=ceZR|ABGol-MZA5GEuh
zbIXCx%x2C^0Rf`Xrm>&Cw3(Fa0a?T@O)9uITMN+~17E<8{O^}DGCGG5LzTU)uhVAv
zHx)6Rl{5<k9eg<WY*>6$D3Z#D|9RutWC56j=<Sho&OEEcrYmqsh=Y#g+JwOeTAP|c
zA~x~}C+8K8j*b957<UpwT0Wm1hynM(8zpp!cDy`82`eb;7!+8BF(ZFQvg*<(pr{mb
zHpwj+aB^JMoV+|aAtU5fs8(dYdhtR<QC<o-z?gL`YbB64>&jx!h=mg2m<yG@Medz1
zCZ_1hxlp{)EMSW46_@%tO4eRjQs%FcTs8L<{~lCDfw%;K`w6bl_H7Zq#Urqj<>lh{
zz?jz{@w1KrO0a3-3Aa*4blr=&5=e5C=xQhBZWUf2m_ZX$poFo#QC_U{ff^7(7|+Me
zm<(?8D0NH}I(Ga}P*BA>jHy$mtcoyIo&u4<^JE}uqD@*Lv7+I(3q-a~uKoD&V=HCk
zO_V`<NxFluT0R~C*n@s4h7FSMGjQO8loZj^*5BPk@*LeLh6SvpmYG9F#KWcwHg6S~
z!p)nG=dfWL7)jzg>$mtrQW@O4w*_|RkVLY>c!%^`paxXL&p88T;^K8@wpgC75`q{f
zMt~cBj{2^~=h034XE-TdS~UuwBP{?70}YP7%gb8{4{kxQe2I*zPvmV%4lCYK@<*A{
zX_~`_(@+n_Nsk-rE)UotN*)`v;h!`{RIHjcIt_D=O*``vOA;NOTSOi8c5K$HMsSOA
zYS{3cIi`|p{S_v+m>?348m(Hk6y8#4dr5<V?aaHfc0ztR!&zvESWsq2_zW-@I+y<V
z@2})AX28LLG;GlzMpX!#3<|iLtV9b7(+DNYnXu4|?k=Nf^2@=r*Rq;8HbY7L9l4aO
zGGGW{KDv)Uhdz>yuTG=LtiXn#z7?6c5@J%O*L^M5l|?7i<CKQnjBt@glc|#NPT-@t
z$qSoq;zuywDEB^Fo&%Rel1?~PE(`?(b(E1jr#JfU=3+$#GbGP1EJ%6%x|*6U&4P|S
zQA?O76%<@B4ECHQE2*sEd*>WNeG;v{=(0}!6e-z90CCQ@?jAzV*OIsFtXj&ym)xH;
z%DM~t5e``%N35i<fW`A3E?oM7BaHYXt3cu<&9&xR_NIoErCWB8i`up8zeUnJFB%RM
zQ(HD~?yQUd#85oH8ovFPYL(v)T{4e`_J<Jxw;KR@R8{q4mswc+OT_0^3ws_)DsenL
zm(XjhL|f)AzdC}x&Ot;1`WS=vVj4#bCqRG5vX$)srGCQ`n$q|Q2_qm_NEjV5XCaY6
zR~83D^rj$>BD_(kD;s{sCPFj*g}QrEF$BX;e*T!Yu4N$*m;Ahrx`LdixYK_iBdP3d
z6f|NL;0aJrZnU=-g9&ik?($4Yh-p)%lsF(*O9l`jZ>{N#U&xp-rVZ^a`U~#qlFE1C
zvq<k(`JTYopI@GF=qb4_ZyYF8;U6zzheWXg1J2#+<3<CM^IStc?lWYG=~e4lK~2Fe
z?V!EU#2Ch51R*CUXH_n_MnzRZ)CURcQJVNKaS{z`jHnDred(g;ndL{#J%D90vdgTj
zs1=v;k<@wVe17p@VrOGv8Oca_OJ&pRYx5a(=TqVl4N@721VXlbj~-%|W6%d8=%hvu
zUVjoge|nAtp6_%?XKr(){bB>v!M{6>qZi{So^53%$J)WbWHnZX^k9H^ZCA+ysTVP8
zW<<?!!lqqoFC5i#jmSF?vvs3MB78hUMRvg9h^oZ?LThVluC-cri)%<?p{3r$yS&ZH
z5@Ot4yPEmeb9v|m49<Y6+sw?*P{F6s&h{w)f<Qn;^!r;*Qd!7M*Xp%v2gkj}H3tp!
zj#b0`sC=0EKSeLSmxH~16(;G^4s=~+YkP@Mc56)$WLlciQ!*St;sQ_PM?Di(T!8LE
zOhd&gEE-TT5rU+!?!>Wx17JRgu6+L$%a$F+{x^eu8)GW&dF)4sj)`&M$qN~W{bA7S
zY(gY8F)-!GG{}bL?RwQzJYQ;NYMPv$mY$wFj_Q!i-s~A%>1+_O5lgWgIGt5@n@Y*2
z3Eq^jnJkbY*|8BK6tpfr245Nr(ItS}@S50&#fuXgC3fK|?#|*Mc&NW#N|K!`>3EVF
zPIjSdJ4h;P*<40#qq|24h+Pa?NS;b07uP!gUeUVAQP$GBdS@r|Mjre4^_WCI8x$lU
z4N(rJf$`Gqe<q3E8#M+e+)e%`3s?o(6<d$#wDB?lW-k~yDxFMXMF?_{OJBB!V2`S}
zd`WL9AeM!g#~Rcy<y^61h9Tlz>IKLYzW2PWWPHd$l2;(0X+|aQtglRUVK?JY1`e@l
z6L0JIB;*j8Y!Be|u@=jMv#K+R6NU6U>G5N@;S|^-dQc57OF_J>%K$UTuNb$Z@PaU_
zHCD#P&wxLGk4hpvXNW1h40z@VehljK#zc4H*fGX2)9&7#EPL3;2kX({pm;QTthE%o
z_HIpn%2r3v7VW3#%t+{%*zMKV9X>^cDM)j(PSBq~M*$Tp$R8*_9vuefUUX~ta-7E$
z8c2|_PKt~&5#piK-xJ?0hDx`3d?a~7-gVYxU@{08LX>j-3xX5Jqn#v6v9t=<g}{B@
znD#_wO_BNDRkBU^5ni822Xyz~!^;~k>{Sa~q4A2A7CWDyXJ*Q7r%z{tzc67{aTE3$
z+@-}9kKm}OCxNYcXPzYPM2FQ;mlRTOW!{FODe%cEO!BZU0)fBBCypmilKS<wO2_e7
zDcOyfghQFB7aGYWgIgI#U)I2&HJR2mtwMy0sql_ov+xmT=5Du<Le}?IQfa~&ptt!p
zdL@RZW7IFnFNakX(R?SFr_(4ahOP~jBQgr8WD2PwNUCJyeg`o*#?s;Cy?cR#>Y$T~
z(%eIghXOqBrl(&8-B70RJd=}>=79_N3YhZ#!-v}1S{g{B@gvKh<prui(=dU4Ev+Ch
z+jtRjvvh<mcOSo<Dz@DF`c9mbG{;18E!#<Ua4Zs2SMFc4#~wLxqGxcoNT@#o(2(`|
zAbuoh?((q5s<H1}WtuYk{yfa*W(`yj#tob#TUvt!*)me@TpIUqEocG?;E-~2BS3s?
z2@IOtQ2XrL%z5D~WdzS(Nh1ppm@c|cITx3DUbyzSak2c!hVXp_wyv)mgGop0J2#iC
zW)brUDQ@zd2>q2ZQtWCj^sO~>wkDa$E@KR-9VO#}S932X`oweexySB8x?PqZK4(JZ
zy{Atd2up?<p4TRdr9ew(J4-s1oA@Wv{*9<8reZ6rs~_CE2crG;G3!J>4e24jH&^)L
zlT~i=6c0UrCNLIt_f%B$5?SCV<bi(mW4iTI@&`)+bBLsFVg^Y}V2qIyht`Ng>$!#F
zpEe-EJ;GL006&5U39XZw!_w`0{{Gu%9~5k7Cu6d~Z2t+NPgYTSiCre!&T}OY;l3r}
zLn_nJ!5ncjd4XNBwEsQd{lx{d1{+a4^Cb6!TY*~>8Ix=>@whk;QWy(H1opJB2&lPp
zM*bfNe?A|>Ab-(_6;U(y0TFFbr_Wd01{~P9VZ-S4?_A~IQ#YnfxFNaP|HX-z`vRLB
zI)z3#r^yf4j(wUqUQ25u??#j@BXCo8szH%v2#H{lvlkGoGIaiPj)%BC1Zi4W)|Qs+
zDKJ~KXk3w@hzP&5v)Xp2=x$)2g{l&O^DAKFPGxf@l?jZ1C*s_86eC-ZArbQcC#|fT
zN}k#bo%*ywrf79ka@|pu?pbq>bURRh5BHZZUWoPeiId&6Z^Dq5O^f1qk<jXClTo|_
zDuq`KRo9$TmGFA+J0Cvg=cj)kFwsg0^YNALtvd0!{n$n9_UUcBOH$bRH+Z`Hr?r=K
zmX&Q*&?qK(LJGHP-I}3}|AO7jH5<g!){)`rn}u8Ity*=y_*^a(*HdP{@Js;a-CoNL
zQyo8ki5e`CC*h$gY0i9l^>atIl-_j`;X&aU;ao_r*N0C#qk4JXCBoe9-4BpM(TfNX
z{DX?WVU8g|*^uLI^y7R~R8&YvA!mbfR9#&i*R*+e+;UAoDPFk3*-;X8#Cu0k5j&sr
z<ZnFOgg}j{d+}LayFhG2kjJnl)7vpIo=Gp%TRao^J}-7ttE7^gg5Ga(8oxf#Lz#+V
z$k48xI%Uviu1sN|>5kI3jMI}_IF%~~TpKlZY~c>SKc|FbsCD>wP|WoO!}tC7i<xVY
zX61E3CY<1ULL^|7)Cxy9Way(icXZVVd;1sXG4)|M@6DRdh>RBr2hlr^9?i;9VTx!f
z1vJJGu?*)S2U08DC3YiAx5`JupOXGKA?K>6)gn$t^%KOAOXig5WG!X2nuu>-kNTh8
z_qwZ`RC@Lw5rhZwGQK|wqhdzU`}e_vP>AWEY|7#xN*5MKg&Q$+7?v2sRG!?!!2$I3
zN%W7Bk_aWLUZr-i5EUwlGLph(Pzw;ntJsgNgm8`6NUQ|)IBLs^59hfL`(E%llgG(@
zxf2w7zQb*f(3AV?HdkOfp-l8$boZb$Z=z(SiU`VETM1DA0ec&BlX0=;40wD2(RS<6
z1H*k<UWKELA;mrRQFM@fysYWDmd11DU7s(4J-crARtUx@N=PVto5>Rxlo}tbQggV^
z5h8`GvKrqH+}dYg*B(8@We8HNoHcSw@#3JqlItC@^)9X8<_HK*cx|LH?6q3O7_{1&
z2JOITpX0}4pl?fVRu_}$%Pgq)(NN@;l-R9UaR!*eLS%AdA+zZI{u*K!+rre;4}_R@
z;zv4#*-tINY3@h+h7W9pMOVTh#TZ&&oD)*082U`R(IAulKrfoJ8kDhG&RJy+-px<F
zUgKHROt+~tcN{e?-7ZvaEn2h)x+<RYtsZ@dMG($3z{TFQaf_(<semi1s{BBz$J+2`
zqN#jir`zw?adUA~$u)deLzbgOu@1_LD+ZJjqvyHP%!sN$NM&{PB2X|Qz^CJ_00@R(
zoc)aqO@)Tw<k*23yg9X`yuE;^3c7l_vh(Ms1IEX1+VK<T8$p8kPa7hsTm@ji;YqS~
z9ENw$$p$o()e~i-P*L$Jc|_x0P`^OWvWRLf3watot^0ytL;70|lp7>(ey!odh6(T^
zsR%4y`U+Kf`S<VsJT)Nn4qDn|OT7<NdSF)*ID7yVrz|(?8T>1}k+K^a2q?<sQSNZS
z`BbJxOF7RkUseX6V*mugO-`9<Y8C*W8Z!|{OtoYfN0z{&Y@FR9>DEmA_;IGQqv~v+
z5r6&~Dpa*N+ldW>#>U>m|1k{4117tq<SjFbg0z)%{uU*5_YwN}0F!sBtvxA)RGLv6
zUkeZKplg63&%lAxyNlhl94L2r(V8bNh<<y?%d3<^f%HVlq4K(7yAWB_b>TzWgsfwR
zRHEGqTLq25yVX&}+<U{OO;ie5BtUTAiWMKIlzBdz(Zv4zL$nk|edDHR|A{OWRaIws
zc^Y(=9r6t!U2L4mWZe&b<i}5>qefkkQwg_(Xi$u&sAxz5Cs4Z-@ZcD37Noi(tAF@q
zmH-)`rcpO!Ly6?#7_o*O=ztg@l4y97{Nimyw?yUczyFH;cDj2&vp$wP$RF_O0q5rB
zUrn8WOJ35WM+f)rWkKT!CZ^<d8{C&uA3RtIp~=tNh7&Qv5!`XM0MC7wu^C=Nbq<eq
z-!@s0fX!^1I74oPhPsN|&=DillT?wwU3b`rW1QZ{l<!eF=Oju0B!n%oiDi5f>wbLb
zFd@5P4p+aJw2dC22GM>{YU~lhIGc{sF!aK(lXN8oIFKRM0L-Z!FhV%w<+XsD%XfhQ
zYTc&Zr5c3vkjW(obVyWwr&3P3kd!b)>+S6wbWA8d`4(JBF}Vv<svkszwdWTDEf(kJ
zS6+<&^QT6dJ_XBBi@8xmQ<MZ8@17VFLB{GCi_sa+JerK$9WVeOY3ujQEmZCwv$H9S
z>MnK>n~XWk2*ZbuAD{W`*|&*QQa})@&%w2d#(%?*kylxeS4S->G(gNy5i^+G_{j_K
zzR!OCsKECJIb$2oZ}eW!8lOK4pAza5n9K<kL%foMPSWRx;~LEr7O0qtc9wxb&z?O6
zfkF;}Sa`)6%N#XWrw9TjIe=f3GM|6D0QdoKLkY#tFxhMS2Q}^N{m-8vcnY$6&;NR{
zdPtI1!SHOV4`r2*STaIE8FcR4AjLNK%b2sgxs>xTpW8t8UP&W)qE)g29hyv+L&%UF
z=t=?z^v^Y=K#B{G-vtbaxnaAHCQ#vHm`YXqSKymX=a2y;?M8jGZ`)$0>SJvc$0&?q
z%S-f~zcnd}fF?XO1>e)8F4{7XFK3=OQ{GQ~ykYa^o3yBc-wZ!EO^b3uAha!o?D8gR
z%lR+L8Mu*&mGL|l?CuBKt76lS2=i0wQGfq>QU5Pmq~LRo!4+sbb?1NJ{<D*)J0GQ{
zDvh?cJUo*`u1fH^(GNf*+qyN|RW*j}mH!7oPgi+x+1K}FpW>Zs@p4hsATt157A)Qt
zLLd~$GA&52*Tfyr>!F6h`^;`9CZ2~pAo*<VJbHVT1C0IGd!Go(_yKKvdnHfjdt1rV
zY>v}(0usyLLm*oa{oq2g5$Kkcm9^E}ts%sX^T&9CDF@Ki<Kx;I;I`ic9|uE!w}bXA
z?vR};!IuXbim?XzNHK_owelO~tz|iSTefUbzDF=-o#9XjKJJ;QlZgOu`r5;WwbzBo
z{#y8)d{)wIh2_eX;9%N-6<kTmO7Q3emN+-)B&+CUVy=D3FqpO|N)+Ugrbl+CuNv;}
zT$aQiM*+N@JIZ0DHYBa-`S-2@Gr}se#WCha`ql7oB=cH)25Q-E-MY<U5*}p(7z}qH
zUIMW9oV-{}Nf(QqFY8){i6M2Wf@%zkj({k<yf#4_BNd+^&JDl8!Z&*fM}8BwZzVso
z-uBBE%vxqlo0b3vKq7&r&pbb`ukt<kRv5gE4E}Z4r8<>DpqL-U0F<NS59Abq7LYF9
zRU7b3<sk!LZuUu4_nL_rp>S3~7Dk3;;t;OSf1J~ilP866nkZyyVv_suqZqThVZ2uP
z9?0tniHQQUr7}|u;T&9kC-}6b%)}AX*_7Eyw}!YRN`3<a=i9HFNw?BfGwb%}J&0M!
z5tw_n1|Ak6Qxp~)X_HD@zi4QZImQ7xr%#yzk3H?X-FP;?Lb9TUFdCx>8~L$Q{Rn4j
zma=xw_$3Sc2ge0|EGRI|dD7)=wXu(BsQ1}8$_zp7)f9vj+lCYJ=@+~KJpVbGc5B%Q
z<{t{<qt6{#I*)M;P_f3iWfZJsAJ5XfbUM8MQ<j*+rcP9Np}Qy~gVwrm>pOLw>(j^Q
zNQvv=!%t{Vwwfcjj@+qm=KB`skQvJ`_527|6H@vyxU6Zg(S`S$+k0#KsbAg@?mSf(
zEDd1vqyoS(b%<f_IjY6m3t6^9^zV`tqm7Q2d2v6w$s6gp_-wF&k@6l0B^h7pMq6{{
zwnBnfCnt4^Df$dPodsqBi^v)LU{;ZdumQ7#k^7+P!Lrd?q<}ZeOB&i!K`<5N^v)gV
z+>dEM#<71=SJ3to@aWAOxc<RyZdN=qV^S5;6(b%KBBU3@|E<Cl{6HZ&3~LD~pL{D(
z!J)5_Q-<KHRXb7}MoGd=>Aa(26Xl`(c-|nKf?iBqfe4i&wL9r1Dte@@q<Uv^=c*As
z;XHbh?s=`d4!xC{I_CoJ95+xZ)vjT!l@qG%w2#5jd;*#?gSMDeRaSDyI#1X_P&FLS
zz3ubepq8l{;{1>d+!Yd&lhgcH(zSxtDsyQUPEjz!-8iHchl#Hj|0RKBmh3O?BsQ(E
zWn6Yc^|y7Evu|pO{PO%##O2E>L-Ae2cSSS!Cb5bJtofT(8um7nc}Ms0UQNx+x}2Iz
zufD$Sd;I<J*Nj6dN=qBGPj|33=Gdj3eH=~s5CMV-#<|WBG`S&!6}M`Q2zZqkax#-9
zfIFmuh)eplLC)+*cBA~JTV+2HZ0tCJgj(i(i5QZR>2%GNoW}PPO%o;dKZoeE@PI!6
zg|9X)iz}TuEn(T+U7b#$HiMko9?a2+U)paP<bn~TT2khDcjC{ith&u)xT@#OOqR0s
zu;4T_Q5Rc9?{d<iGn?zC4q0wt(OU^s#1X%96*%-%;h-k>w>ElAfTtmL$$H}lp<6n4
zV=^N^q987SnJ$=PSOA{h|9Zk*>cSm^ggY&-&Lrnrm#Ax0X?jzUlyBIt@N%O1%j@gR
z*coWluE$7&I&+10+)O6ngHg?2p|G}{BuVBy8};X`#1c#(4OQ|ma`Uxo!$l*mfU#1@
zQs&G*uoQznpu;o-FY>fUh7bMW-*(^o>#$4_;HfjiO^SzXAHfjKJjWEny$HjM&Sw<x
z2s@2FM|Lq3N{qb6>%l}w`DSk7a#h6EpQA;Aj@+XFT(~6Gab9XTHntum&dbCtEo8)N
z>i2&URcvCBPA~$_ok(#u>~|=9HtP~Qzbf3?>wd})@qRr9OktYiMo$KD+c^yr*?F{N
zf*o(q{*=creIf6>b4Yo4x!iY^_#Z(@>)s>RD|4CAj5W;22hme2Oi<|DdBAgom>C@>
z+cud!W5&PfdhMiJ`vn{E>nor&x_St4;ptAZovoStf_>eFjvU!*oa1`#FsMBX)E}hP
zgaR9s;C=iXV@u=>Bge;ZR>*eOu3jyiyA~dw{gkkOV=~atFdOSj6el?+=oinRNKV+e
z@(18Q*VOis`k`XC^XFB@Yl)e>yjA?rT#?VfB6Xq*b%`y|XI8eyavcG7!|69SKXobz
z6~KK(ROTN0$TI~dlO|SX&L_V``;@oxtT6^<<cxmy+{MPe#13wfi^imJ2sB2AOD7<_
zJ9g{~Bc4!IU!ETK5K*X4sWNw?ZKGziXG@R?1~-!cc4$RuN)Ozm{^Ip(_!Qz*A?juj
zx#5_;V1kRNsAf*3TfrI{Bgen44HSH1#oFqsBRG#LY(b7Ranm92i4lBA-s6Cn)4{QF
zYd1Iy{PZ?wLGgZdLyGI%Z||YCIn?8qHmt%`1K>DgurywaKx_Pl)`gZ+`|*PU&z`L#
z3iJMimKQ$;o>BfWMm>hB(-YfzG-J^GApK6`r;Dr}b!h+oLH3XLFMdTF&29c2EU=yC
z7%aqULISO6J~d~h!V+steQWEpMq|g0?a{q^f$v}!dY7QEr&=B1j2iVPUGE5ADgGMV
zG<P<sY@`J*K@=E-X?!%+WR3*TmTGcpL#dDr6<MAhpjZl9!*P-yGb=jmNNmU_xyPz$
zpri%&`IpCrtM~6eb;5mOX1!l@M~69s4YGV9M+wPBA-6K>=9ZFEi??mvS`hUI4Y$|s
zPV|+>w_CYv*}ON(PHVE?f4j(ygyp59*&X3IjgU*2OuoC_bi86}YUKBIV8MMc2DSBV
zKE-F;&s;gWK+fFHG?WEW)huhx8Oz@m>QO=fpHUd+rlyA7xU@90q=E)Rg-e(qzUMrv
zk83WyYu2dM9MHN!?K%M=X_qcOzyW3uW;B3B{u$Q-KtFpVlVUE)NUlD~w{A6LADm^t
zV!_)Sc=!-{#B?#}+9BW5hu+}xIkmM@w&=1~^^|Yb_hIUnJ#Cw3R{4G^Y3}{K!;ZEb
zQ2#NTE`05=gc6%4+lfJ(lP5znupIjFrZB#D)27?U>+<{Q1uymkC_ph>;-_`!kalUw
z*i5tSoJJb4^iJ8rbEDK{s7C&_HqtFQ!Hxa;dbc3u;ltK)a%&LSQbka31{K{NtgcRD
z1if}7p3?lTya5LTiEca@At`3JIEZDA=H^+P`hE(peq2BBZ)T4Xg9gp4x6EugCsQRd
zXQqj%X=mS+ROPQalz;u|e0bb_;m9P`%Zd<p7y2(QE{><KT5`-Rq0<)ssWwafSh$9K
zio1tVfN*c5QpvxbT?gzDox4}gR?%+@39?=_+pvDm&6^=B>9lP0Zb}R8J$L}D&LH)s
zrk04#rv(Jg$Hym+A3G+z2~pCj9A~W5K82zax8e&_0o#}m3C4=FkgP+u5MNo(ncu@7
zqEw$#znn7^Xalf2GRKL+yl%v%NR5cd$md$+!3SfbXVTSAj<7wIm(?ReLER*L$|d>)
z=H}@|K=^&t)}YeD(evs<hZIlP@3Ywk;T8plD2_p%*b&Ccl|kviPn%`>S{3n9T-~6m
zeto$vR30$kWBQzlg6Tj}PAw348-kfFc3&tSA+ZQ4^F|W4Jhnt~4d~u^t+r8m1CMhI
zBFx*shScm;NE!0U|6)wuDiG<{hb+a)*f^X9otD=83-s)OROXha5JJ{Eng0o-)^mq2
z!Ra?-?Xf=j@fr4EI8{QfMejEM7KE%1qY~OvCcR!>UbeH?jTS-T>$f-`_QmD)sTNni
zXCpY`xEBdP2aH2#$&njD<EjmP`{m0u8BD^p^w_bkluVha;B%=JZ`$k4vnc+Lij*>e
zDgF?n3s6d`$7h+~weja-f4V2)XdzTe(<-m2EZ=&F2%an&a7!2W%Cwo9wraRtTm@F6
z{Iy+mzNvY@-m;rln~glAu5<hG6K-Yx=nLE05oFb$2W_%}+q|S7#PX^kwtpe!<dg<g
zk@BK<KV7|vR}^SkwbU@RX-j2qBxbbk)iNl6zoz~ny_?!dnNVtoY++#U-T`EHUM+p9
zGz-oObt`rVOgEQq$#R<h(hX*1C|i=%)z^_b(h?$RfkPe~`X@@^8FgrshJd=fl>3ij
zdDvWwplCuoLG}67&s3QeJu`7|Tg;ufabp}G?MP&zdKxhd!rEOP2J4AdQIzlT<7hZ%
zR#2-l!LdQhj#Hx9#Pc4Mz}KGaE{_4Ctj3$)Db_)wh?3*U#%t8thLk4r-g%&fUTjCT
zRDVWPM!K@xe{Jo^bJLng@1h#rt+~leUjv%}nB2hr-_H(T^K316nOd6-S;9_GoJN&H
z*ela(GJ>+js~(XSPGD0fd$k1cd+x&&Q#|+^HlX(>t0N2%VYaSabBaZKYHAk}C&M#{
zCGCOHP>Jq6R_2aF4EOBlz=;!a!^_u|ojiFm1YWJvDKmn8(0gj(`$eUGUS7y+ANwf0
z3#NM9U+61tG66j373Bo1d-U{~U(zrG2+LcA3ehN*rDo0AVwjcu=oxKluKyt0!*IVn
z$8R-~9mdgwv=~1Em%r45jV@yv%HpfY5xIcF?XpBA2=$^XOYsCx3PhwQo|cl5!rGSn
zV~~_e5Or{L!NT{Ns183H5)u*~oZN&;%1JJbaTUx?6i!_wlrk2iSHY+$t+tCUkNDvX
zSbQcQHA|q_LTLpT8K{AE9zC_dfvJSgYW5*?GDidDLbOJ;+(p*_8iF@cRX#3K#O4YD
zXnI;&D}#Sm4Tl7XqCB42s?-Q30LB^;vsnTqc5dw{rV#158CmG6n!kcq349bNw}0Qh
zR}_Foe|H`B&#ie_Q`u&YnK^T&@)T23Q@Z?Gnwpd?kOk0V_#}S*jDLc^UkhMDBQ?#f
z{n$yJ(zX-31SYcQmZvjgCpYt%r|NvV)v$4*0v$vUmOS5p^O!ZN32GQzG9EhT<rVsx
z0!PUn{wY>~)wq|C0Hen5Pb>BftISX>y!!F%^=qM?oU;VAmWq~EIRxMw=8l}5orSZY
zelo-&{J0a77dEpkEG%f5e$7ile9ih3dL0ykb<pLUM)BAor4dn?vCKgJPDaKiYMG!-
zO0AeK-t%U)Gb99sM;(6;%I{%H3XcOZ`e*VN1Z5}ZzR%bXins11ejp+mgkh=!2j+ng
zDHJ&+%tLq3rQ-;FLA8DQ*506P{|{GZ9#?bvzVTxQlRcCrYuVC@WGO1gUY1G=sVpN)
zAtEhG%}m*&DA7=%qYYUiCCZW|YbjYOp-@ODlGN}0oXpJk^*eujUtcDtbDq!h+|PYq
z*L7d_GM<U(yQJ1Yb4?0HatDw!8ryY*?6VK&D5y5k2v)UM*~w@u9G-;NQS7rZ+O}&)
zz2LlV-4_5OP9tfW0CQs*<n#C6oOyJG3A%3Q$z=_+9p~oiZkDTInz)Eemz%WI*DVp4
zN~j!qOh3+~99KYWK0#4N#&9r2vJ-G3Ii`5Vs!M~4PD&4z?%joTSK}hDq(U_~bC)wu
z_`2mEp0S7*Z4#M2@M2at{kwcy&6P92i(^Iu`{$j`1AUD8aF?W)6Mr{5JK<ayI}X2{
znxl%!$^&NZ*t!+l{^dl(ZT8uhFRKk7ULEiC>RwdRpq(T!V6Mcpxg`Qqsz@~^YKI+Z
z2WxU~c+s=3$kSqMO4PtR0I6_KI#zX%dk!X_Q!%!~a4hY2`Ryc3wN9en5QEhv%a_}i
z*0C{gOUcr%{WF~TpQ4d=?HhBB!q@_J-&jP4)%H(lUqSE@vm}JL{TiZTK!&aEajh})
zp#Lr{>Cx<;yLrrM-W=_afS`p`o8F{%4`O%H@<Y^D#sEd)ScqIjc##V0-I>peOm68x
zoqK&+MCwN43ljq0lA92GI!mp{S-I#adugl>9igs$kl;t>4msQgA#v7mpl}94fiVP5
zdyTLYAwpEd5<n2kNd6U0TSlB}W8-Jshgn%N2pz7XnGP{lX!wZ-?F3Z>Hb%ps80cMk
zvol`Tq@RL8yna0vKoigUJDO80_v>D)g@V-{GscHb15S*onc3+xXI3EO=j?+*I*Y`6
zi|&SHTus8ynp}rB>8-3>10wV+-AfNF9)6GRF20WlsZ6Svl`%{FG^L)nzX*2lpTJ*G
z?avAe1;I;E3|jjPK>zlPd}yEX;JsmY{a<t7jDv)+=1E$xi1eDhgrGe0?Gi*l#sEBu
zFSvR+5>^HR*sbzr)M2G?Ptcm<hMR`heL5Ei5vY(+s+kYzL7mpJL8W0a!({iQ=mu@w
z%EW}jhgSP{z5H1jeE8jeN>Xz*b_oU;0#u;V98-JO@B^b?H^Ax>g@hnMyfQWar!U6e
z2wIUt;eZkV9AZqIO`_mCpvO>RkT=gq&?sK%3;(CWRC-SUq0eYGoSL8pYah;arR`-A
z=;^;7c}VeN+E1=@?urQFfBtEGANVUedfK*c&*;Ngo5Zl|f9t!902tzm=k}&e00ojB
zsNGh|J~=0T>&A`XtwO5}L0+|0-0DtQTtnQL_-O}IgItIfv&+w5KvHhs^l42-Q%e1X
z430iota@(z1yh5)IEP!z9(2p$uAhu@OQr@^{<yy+I;wv70AmaSvs<OPHVd7Cs)OtU
z0GSAOfTK+1Nq)taKTqZ{@$SwoTOOymyWlMgh%5yD41)&W9t7|j7%m{{%FU)Sw*Bdp
z6hGJ><8P(A*)2CW(bzeZbEG-}xQsk&j(r|`{0CVe*dVop@Im-I?{i{}nCHwqA979)
z^RHLl@nOGX|Aym6Gj43Mr!Ebta${mAds6<{vmbFHxN1u;al_&|%!ccbLPjGtPFYY`
zSeO+)3MP;Ht53vxa}J#<e_VpJo*KxJrvXK?LyL6vZ_7+Kyg<_4nFr;WM%nJm<Oq>o
z3~3;x+0k8ZAOo#DhHysMmw-ZPe~E3pd-nrYh46OFFfu&cgH5K^XDy+WI0~#e2L!A7
z<}l6(cR42z?z5b9i$mQeN=z#ulbfS}W9Da-GsUzK!R8Hv!k}iNJOG**F=U9M6nV^S
z8VDp~{^G*sc=94M{#yRv`jsm$87O6*m~Z-8Fi{d;k+FjrHF*wt-OtQqPODK>P0jlU
zu^k$ZH<Og)3x8-UMla6!`M}HGyop16nW;JHtG0hEP(<CxXFmM`;%F<_Is3}}ZU1Ni
zcFqLWfjXnl>>M8tV1xrwF#|UN64-A<2WAX<*L<q3PCjvB6x1@(1|(7ZjPS6g%D%i)
z3~3SLO%j@}%T)A(&>uhr{h2?B{=q;=MFsNV0oW(<B_W8+R3k@YAv#LwiV$^d@`tNt
z$@IL6wvVeEzBa?vf0a}jn9iIjxC8zI3x~Qd?+r-;$@Ai@G-PW;$j@wCO;{(RWDEws
zY+`RHZH6pH4p|`OL5Xm0GTN3cVQ6@soZ{TMQL@v~c^Fo47h9XgN=zS9<OL{F{3YeI
zTp;nc6uFWwkeS+<VtUOMfK9=4=L$-5486%bRUG+kJvPu`nCA^h@`$k@%T92P;S1iP
z7hz|j_-nIYO$>4(h}An0t<m>=BN2c|heKi>$CdniYXxC;OVrnyb7~PkA|lemV}Dnw
zk@dpnca+jRk5OBE^~x(|jP=!3{*eB8$Em3t6lDg$BC%Hp!LpR&2#kYtd*;lUcqpiO
zB#AKWZ#y+HA8%b_Ev@CO4S>ccF_)b#b?WQ>zTMF9nA-qW(DA>D>xaQ@pi4r^+L7b$
z0Xlx^x2M0Dq%MkHOY4L!qv}an0~G;($=O2Yx;ioCiwK<4YYwxK6)zVS3d%n1B?POx
zheuZ_4XPg?v<7&srT1FsuZ1w9>?7g_G-9e(DL7-!_MS@03QjGrU-={&<rDX`Bek(y
z0M^Bhm6&GX6$+68WlTeyYLGohDy$c%o-;QL_!xmt&=S;cK4LUDy<@x$m3tbtBJnj3
z*}{1HpbVxAhba=m1M^AAOLL?eV1=<lkh~-P``-FclxoJ5#pXx(^l}T-p~y$)&V8!(
z`pvp+xUx=(s{e!;ET6W^-p7pVj(@~_^H#s!IRD&{CXC(~V20SOr(0hPxcBlQH$@EB
zRZ8Z8mqjO|fIms73>%Wb@lF2%zNn0QiJ~iTCL_AVUZJj#=?aVs%M-*d-1TB+h4(y%
zX7uAk4*h)+Jx@kh^nlym`+MZf;uW?9>=`@|yLIWZjwr}KsCkp~JF8EI3ZT-Vb!+S$
z2?zJcaLqpS1|Xk3aNs~>sQ{uvmdG(+s|9V}9y4ByWz%=Dp<ahX=}k-lymLA%0*(40
zF><O&IRWv)(3Ej1M==D#GgjoV)WEP80;Q2CRiRum%Yv(v>ua}c-yXUZ(qDdwRdm<r
zMWYV1`-u2A>?+g`#}0`k)F&BE(2}FHrBh29zyGwNA!4?N@Ezj_i}rth58laKy`CI;
z^2^q$XoeqgS#>&|bd*GrO&gub)%Tlw#xyfCO`nC_5KL0y+}I@cqE~0_^HZRD*b$~`
z8qm&k?;du>)@f^CTSgJhsO*JGC+#H{lmYxW*Bf`1>U+(4E-5TCp0J&%nsfJq;ljN<
zx_<rjXr1m7^Y-jc4iYb!Oa__g%93)dsghs#`5l_Rf7D6t6e>8>a>5%l*Gt5v^ku|s
zRD^qkj)}&W-d6EeYy;LP8Q(yck2A1)%#MXGg+)bJfI+C{$dR@iHW^DoJCZaK6S|1`
zSO@~_%13dmgD$u>Q!;bjtv_s-_v-^5ro-kHAAET8W_*<e;JcVLRSS7#+N}gOC~Rv=
zvA3B=VP<AuE;gAZy}oAOOJ+n2A3SnoL2j-a&VU2#?N=kow`io{XReAEP!YNVkhWru
z>X0F;ps+zJ90`-e1Pa_QmFGXO9<!bIhhZ>|+L{9+MvK6Y?O}2$Ivwak)}3hD#qkRP
zgUjz5g|h6zrjeja6u@|mEQbEGoac^}M0`;TiAgH6%ig|y+k>7~;3lT7W!M5HG;+Pu
z(IC*GWQUc1coeaas0&lQJ})*gF(Cq=cqtQ2ie`9afmHD^zf>0e{ctX8IgIpb+4rYB
ze6Oc{CF+JEj{8bo5!<wF_gK<VlHDt^u9*_rc}E3=RI@M7>x|J`%pqvaz?~{8DlmPd
zzQ(wX2Q({na3J>2EivaaZ))2e*Y0f8nH(%wXa!Y~+o0d;q;p)%_W?1VoB)g<I|P3;
zApI#!2aJ3ja4Hv;W(QOqRvxxb5Yb>rGEO0f1X~CLitb4jXevYrF8BnZ8{3EK<Dmmz
z^_B2QS7dIm@cGIuCwh05VlD3u0z+aASO9AyFvW*{8bm9KozO)CB_%<x$=^SSmmklU
z-|+*)2oO<OilPC%4X+*aFUqY;FOb!|TP${I$s9Zr$#(R(F8H!(uCtQhFEDG5ii#4l
z<c}=BUUws(T5h-iMM1G4j>uh2-*>H0F5+|3F?%50OhTPJQDm}?f9rf(VzOlMV$(pB
zP9dFRR(nPC1}g$~C<Yu2ROHf{*pR^Z*+M>fOl&ObdMkw-90N&x!iQA!D1mOIP3-=P
z3(8WMOhMdcmiT?qZ^R`yKy+?V_Pf13rbsjPJC3a@xjj-lAi$U(e>qWggl;8Ie9Db;
zIA^$X-V~LPCxIASLh{o?RRu%Vn-J1}S(|r`Z6*GSheQ=d@vfk-IVh-IhYn)Y00Apd
zvAn#TlofSn5P~miEE+8ek4*1T)Mt^{k>)W%Jxd)#*vjzwd}Peh<;x3++g$174daAh
ztK=I~?rBN%rb^sOJ&oyO{bWsvx!~G~UxA9kHv-)<Ybj|>Gq6dHo10tAq0*?G!QtV9
zl-<5AX_hPW#dgQensm4WwL`w4p3g!W`8A|h$3GzB=X%$4oBWjQ=pHFD?s>W4KpSN%
z)~ADUcj=w?V*|ka6a`^wA~fxLnKIvl8POb&Wjl1hB;$t+8FC^ydD_gG<kPz+mD(&X
zf2l`>n@{W9t_k`hM(Es3E^uIdqn2$TE9Uz(Op7HoF>MUcOy%SmJ*cOlf#lxk!C*>h
zzlVM^-I7dqthaV6Ox(4;#n*~`z>s1MQBD$JgmNB1cU{%<@v0M?ot?S1c|iey>hmg1
z*({dUf7-w43rCPN@slT!2GI>v&Kpsdb)z;&7ixFFOCZN%HiiI|MlKyq9uGxhgmg2Y
z8zDA#4iQ1VtffX~@omobzkTP9Ov;|?YiKw(!p8G^8m!(g=i|8C5%ju{o>B|zR(7Pz
zS`Uo@@eFYddo(p*wAso`|7N)ZebSg@2KI13?e((@>pl3p7A^CgYq+1y#?IxIp~yV8
zM9L|%wA>{>yj7rd*4*My?c7{Sqhg*8*3AF3*&glD1UWnWqkHz>pvhw&_@w5fmWqzo
zqdPwxMJf<kqw3@98&zX*&UV1{3mT&<t#4lVbA3(EJm;FpLJTmu&ktyNRI{R=jD8Q<
zcofk*G~)3(ayp^0CvUm<r@Xe!zR2E%nix82R4u^9r|3Wa5cOQi+qX~2X+&=mKW47M
zFXZ3(f!=cY32h!7?xNw#1Zd9(2wu9Gq?w~Kjmt>l1kfJ6l<!KC&pk@xwOgy1CzF#y
zw{G9QU2V`9ST~Od#v$1WUQ@ItIPts@F~fAc_;Nq2yNZhG8pqt@DZH=Qv}syH_C`iJ
z7S;>Ya_m*<=J4uHeuVn!nZfJYDH#OiwIKLyIixc=Wu#r&1r`uBknx&@5=rF1kt3-Y
zE^rP+v?hD3JV-#E^7L7S*IWTT_<!n0;;N<f4#+B}$S@O}j{*;|I0RGnM9=~m{t49?
zjXyr%^%$r~VP`-UI;(M`f<!lL(&3OVrCr3#2tnE$P>@8orFd3K#NdW<&lE}C)Tt+_
zfGg^$C#DJ?$u@mR#ls!JVN*z|&lB4(niq!87sSGb3u#-Q*4ijMFDU_Gvz~vVYEp)b
zUQB6YbFV17qMc743|L`-ox-QW?%b%NS7X=h<TGcqJ47`P-LvP*w9oD--E|I%<{wNX
z=G^lhc%h-sdXL_U*54X@>wB+juC#i*g@ygESuM<_C%3i#-P~$O*Hz;(wTFi5S{<1^
zv&G_paox|gbZ*sPFA19MHa<^jXxGAyh2tk=1-ZZa_Okxs=c>5wH{8shC1u<#d~NjA
zXH-x3{i&}E#%~P$`rEgH#E*0KC!Ts~AJ*%2!n=g$_F=X>O@w2l_Ofg5Rp<y413qZa
z5nUZ`qO8O*P6`IWMKw`F?Nm>}Km4!OftQ=s9|K?OYHeTY&m_u0N}y6GBS=9I>CPj)
ze(Re=JtqbPC@fg9f{D?dsV{LL$3@BCj|rU_=!8@!SX$=t#2Vc%az!PtMxMRot8-<;
zk$pCw$%zl!e{R>dt@Dg_C%KAu?3l57^+(Qjl;JpyT`QUTU}l^}Vj20q=DR(c%)5Mv
zSD@9E1CL3J9S_|;ZjWVs!ok}+)>yA=`pype`xA#55LuYjgtGyAzI-*{u*{NqhXzaU
z_wCiI;hxBxO|V|lLMzT~EprWB;Ot!S>eUD$6LGdXDs2CRBZ-NS_;s8;Bq;(%kGB$?
zua)MKVsr9KQl?ZzDLL)%;h{5!N=l|*%V;KP2%+hO>r68ME&Yl)39j(o%N7Y7>aYkL
z=WX>Ku^`!Zw!F^G&ll{ho!t`%0OG`~AHP6!P+AWPKrZr@FAc^IG@3o^w2H<}@qA$O
zgsO$zN#M{PyK?^g5)ufxHJoCDye*|~0092x9XptvB2MYpm2}%-&OzNP;GQrvOIEQ0
zUc7ZnQ%g%rSNGnXJ1aPj>46H-b;`=hLEZHx)y*j3_aX=_o6%en+&Mo*(qO?=;$Ux2
z;)`syPxtQh0)NR1;4F|FGZt=22Oi$W_PrPhFEor)vKgFl*^=YPYZO>kaYCKHcPw57
z+B4P64C(Ph@>YD`%|0*`GHUBKrfo*dduFzjkPJbrv1<r(Mqz1l#Xu2fB+5yfuy*z#
z*O8*x{w%iWyw^C1n$J>u_u<36vfm`b_|=odXf7)&G?f^&ZAVXz19t(<7+G0ac&%K6
zHk3%5cOW0d4{RMJ12;uZ+lak;w^O5X?NeFp8VWuYoW<P>vjQ+enlqfAVs1)m=VqQS
zu@8JpXM-?T)r=4C&hwtc4(~dLh8-vpa`^YppRc9{5^6S&LY={bx9r?05)KkKhcurx
zWO#U01O^6z`jLt-&GodR8c%?V1?jz1fr~N0IpGd#&*H3O2o<>|*RO$rL2FfZ2RRRN
zv;alH{gAycnzk1X4K2YkL-=B?P4=ju46f$pp3?eESD5}xVdfA%wUs1pFG%i0%8iK=
zS%|66egrRFwv2g051?jXyhQRfRF#$Sk2rkd#43V2BqmW(mT?yAX$;2SmzOW2Kl*nr
zoW6&N)R6vJ#l=QY19Ta1e{y&2HdOK-c>~;yrX-z!AqX{3IkgGn%EuBceF{IogBUqK
z)1N+J$P%0+Gk5@~&5(m~!z)XLe!9Az%|*@l@XD2bc-N9DgW`yTTV75v&`Cb;hnxLV
zeSg;&R)QY2oUE)eNFUCEkbb15dV!FVF$O9UA-K{?kBpJ{YwRK=2Jq?Fk?d**`!)AG
z5Gx&8FoB$<(yao0i9W)}(>mUCkM6t;@1N-3i3WgxEo53jb(R}o_(uK!lCqCB5XH+6
z9z0+-6;INW6!&Bv5gn<yU&xV}C8_4xTVgUD_c4DzA*m(15(t-?+6zJ@#A5h0m;3~o
zl}7BeeV_8`A>z<uRDjACQO7}Q4u3?CFa;8<D4mYhE_EY|QQ)KR9K$pKswT2lj=&s+
z1t==GzLPH2C6J}Li8lSni-@t{2#}ATsGiTYN^=pIcN{u_o62qZh9=Wz+1ra5iI|G8
zO&w&G%dW8l@funL2*n=D771G3aB-Q^s0i^lb?Qwb)5{kxAd35Ws7sPW?zp4pXv?&W
zXJm)izN&lRcM&B2wziyEDj*jBgZLlUVp<WHYB-fAPppqJ%m8hpG``577{p`a#{EHt
zD3g_~S)$UT2eD_af(4gQ_$@+9l4ZPO&3Xg)0pX|FRa*aGu(mc#7Rk3$W8OiYAsIDF
z&W|ulvR{RgEiv)?yW14(SniS3zlsPU6QWvic8=jvh<RoUYLH#~PM3KL@(z!YBXw`7
z@?^NH;uJ4uW=3m$)-Twrc!<cXtK3;)zLFw1cJb58mlu+8Knk8E$sP*4#qpTryiSZg
zK6+H^PIP2sF_ucWmx-Y~tpm4HahU|wptGgpm=92i=m60tyAUv_Ls|P4C1;d-^e}WQ
zy#d3hpbBC68FJtz`HA@~bF#9YbkyU)@^aV=jGikqY&KWCc{9a2R`-2P?JyS#Q=yH#
zc2n0j%?jsW%EzwvyuMU+g9lt$zKLX5x!!lIj4fQ|AcoQK`*pt8Z=Lr$a;e`JFCIa;
z$KI$Zf3WG*SH6g3IQ-YT55>sI*rX%kJwmVYZRv?-RZuO&%fHK=SaWsh`0)tA=uHvb
z0eA>4zN3P`By~+Q&vrj>BxA4aYIyzP-8<UGyp2B5dBHc~?W1$Msi+u?8iff^+wQ|A
zfOA%od=hzsNi%5{KFT*_mqd)Cv62h9tW1A?ro;$qK8aIIVxsVqAnfrqxQx6!J^K$D
z#I~<bP4R2)A5I-64g;-C@r*sY%7qGepLBTq0cA?t=lCA+3KPCUDEqhIYEU>%{7qip
zh{eLjTzl}~ob5mxYiSmT)I)ibD!yx`rs?F#OSlf8`?z2_OK~sdR;wia9Q^&jm}VtW
z;>loGEtvf3`?OFomepKc>C=&4I59pud-5wx%4o%FA;!b8ykbNloqY=y<RDT*h#6mP
z!z0Vd84AtHoib#Id>UF+F0~BB39Br7x(bN8;K>sMEv;$JR;?tu<Br+j%kcEc6H{4A
zU0of)5Q)oR-rs*o&VMp9s|W%bydWPKOUJO|zRW|dfhPrSfxa3jB6d~8$1h(h^Wt~Y
z=L!JJfcn=jUv}=^UBLZ-95;Hk%hY@YF-ySXfbQwdC{=OGiWaE!c!@;63;31zQoKwC
z(5dw&1P%27l@@e@EO)M$nPyvn4wPH<x8}{wz1aa84zM)Tyx29Uj-AFVb$<Q%^Xn%~
z+L(SxlCHrj(7X5)CXa<VXwFeL($)@QKwM^<rVS+jZH|r@MRS=`igB;ts1SPKfOb#{
zSn-e{Rq&ELUA(ah6Bu7*)eBaOOl-7{&T+Pes9esFixd2~+q6KAWR^F3DVj`=v5eo)
z_`?JCL+Gap&so%+zs$%gY#Cqzpdv*m&0A{VCa#30S5nN+WC7^~rSQYH6>r}Hyn~8k
zkz~G_@0##{7!92JnI3-Ol>!FHB})VrwG9V%KON=!_Y*_0lGXK?CK;xwt`1e>3jWDV
z99sVti)MXc{KKtZyA8~{i`Bm_bpCGtrE;dGnCe7)<c*u0Shs*g1P=u;_T1gQTQ}ir
zOuPk15DF0z=RidmRQ|||{X;!PuP|Q%eOe^>b$tBbXI+1Bbag&c#|0`VM6L#IX7Sd1
zR;&Ya*D&=}jBCP6iBkARSZ7I9_QC%qP=wy($3>(8CdB68PTxB#n~7TnITb;;$q4|;
zMq}{c_!B406)eonS8*%}-{MIGMaRYp+>6`-FTG>Ov^{!q3OD{Y<D^Or!6$d?y%FbE
z6dW%KXw{i5jR;;>Y-#`33~50b#tQ`@PH6SO*&q!*q*pIqEKEJzEI5d7d-m))LgD1?
z-JYX9U%YrAw^e51*8lk(KHRcIBjGi|8Vvty<Hn8jH-P8~1-ZxrO}b<2(Uvy`xR-8*
z2jfB^gIV7=;7nGFsx*4n^nN4}n{hl5?C6Y{GaHdra!Xg@*-%<K9JgjJ(;EkrAc+5G
z>FWK^MhHY3IUAnap}lF``2oo=XnKTbIZi#rfwKzu<BxG*I4q}zhoa=uZ0v~H?s>l&
zB6!jeFGx0O{bEE6HX30-i*8HE15}br<y~3w-Rs=^jNJv&Lnv&D3bOX;<;M_$Kw+R9
z@I)6+24^Zi-RXxm)PKA#XEUb|;VG1sA#fdn6C}HOWzHc)j6s}xdHdn6ks6Zdjfej;
z`*BSpv=U3bh@jlH8uEgJ1h=wsC97^LdYdJ26Nu;T@)tpPG&U^DmkVok&=bw~f(e5Q
zV@e5i9@#ZcZs3aBgM!NLw3WpD5%;h0U`acfWjyNWoqRY7_pZvy%dSnIJ{>jrz?qSS
zNa(vm)AQK!b5Kl>yQQRbXxsMojT^M>ZV3u1!V7Kn>XV8upp)QadGWw`)Sw_L6vAZX
zh4IZK`Yot-e!kLIQ@+4X9if6>?Bukp<(cGUJZ;OVwtiMqB55K9?1s-qaFvwgifEmO
zhLDKFiAC-k;7KnAHz@6pkR&t`3vU2ZC!VZwYx(bU`_DVpf8<0$9#H{&4KzxWFqm>*
zrGB|}OQ_a|U6U&%yz-gDLk|OKG7pe=GjQNyHac&)`wNsc>H{V~1hOOGHJI9=GGx9#
zeQD|Ynn_OmXP@d{K*s3}8bI7&0fzsD9VHo1&6h72CFSHi?<fCNwex@p*>=1D0YDOW
zuo1Rwp*RS+czthJn6lt9yC5XPK6)NLm27x`$eRaLB<8-JnpB$dmw&-SY>7w;d-m=v
zL?5|=cRYZbG<*J=XE*UPj<>mcd7&@{EaYHw_Gz-AuTZ*~)DiIxFW8?m{J~U~OYilu
zl;T~6!z9t!7XJ!OGF{a5_4Pr-$vUYRa@(qO>!u!N+SKeGC{-1)gK$}f-msAAZCIv(
zT?;sfk$5>dkZql$^y&$X4Vw^_g-lgQ-(;USX4FbyhWe6d)BkR$%(pLze<ZsiUcgbA
z?tF^v5;*($^MCK#Coi=5VjX}%Eg6X?6MQ%UhcCwOBLL?XlMOZ59HVs=1IGAea1mng
zn0Q!W+x`nxj$RsJ6=>Nod3g$%X<-qvIC#kX`TuAE3Sr49;^`nDNeB^l0$A%FvI|Z$
zFKR}i?;2J}lrwGACDhN5m&u`^EQEe`<fe8#Kz#L5XZ<SCX!bw*|1uq3Cn(JXF$Az0
zF-}|iSO=rpOe!G8>7aAF<|%$x)ka#7J~1tbc|mj*QGRpacI==t>!RYJbLVPVP9%bR
zN3S_TF<=>wqn6MWNe>3Iq9p^G9$>T`;xmE-S631jh#T%StlomAYoMth#dSgt@pES)
z6q*cR%9~BcuXr|hH;gGSvLIknLI(ohr}XX0E>J!4;#`pmFh<kgGQQ{VrNKM`vBqVx
z0UiXW=DdIFKtTlYpssZTz9*E;Qdbh~3Lj3w-D_zbW#d8g*wov?1Snr^E-{$_qr>1F
zl3;{SzjI{EJINCzC+3n?ynOlK#Dei?ekl~o-Oq3r(TBZg(IU1KjayA=VqZh_;sE<F
za9qA%4;tY5Fh6#7jdPR2n2Xo3<MUUqDD=n6EW0BasM|A8;;+KcF{>~dbTk_L$ou(7
zy!V&tYPt*?Pj4buHq%4P5LL9EcHm_n;AHgwB2tF8q)__2y!@JI@V~%UIaV0eUOyYk
z#Q6I=J=F;&CjPG`Iu8&kdg(#BhwBUW@y_7VXB8Kc4zQ|a-g|@x5I_Y~pSV75Mw3@B
zXRsHnBN=Gu#Us1I!$~dmsPe(h$t!t&p890Y{rFnkW29JE6g^1axoE`-A#vn6Bd)+l
zu;R_C0z-aS61SS9h+7sJHe(oT(6F3OOLML(GV=P=f5eD~Nb4wf#oH(-;0zQtQd?3o
z&%$?G1-*2A=%fNq<U<RiTz)An#bIY^sSz<m`kHOmPMHy*-tpDnSODuE_T*)0w8YaI
z!M91QOKr%9KVVOK@MXD_PxT?5BitIM8bF6Mup{*nc8zw&Afe`m4QL^Wwu54SPFVO}
zx_c(YkygM`j8>%w6-7(({pMZ8S3gN=4n@j!jW??R4%Z~*lE@Mr_}cpo+?|`W5xYhX
z65l;q3tp+@`SXt5yYC}o3=XE_nf{SB%fd}%jK|>DEg(PvSfIz{GHKnWO<B9P5>K53
zSBo;b=VJ_{VWy%n?#7KN<$IPubR!NwdUcQ;z|?@_8*L|IU1yad)S>a4V_%@<L9_jV
zfl$UCA2@JA>q3X=7>^{*g?!>OPSHs8oqVpbMa*`K!AlrZDfjYWSnW2uV<3xoY?+Y`
zC`u2Sd*W`H?m3j)n{)f;z;k??Ok=Z|GrxZQ>dIJ|)2G)EZN$Y3Oe)$VVEw6e6*_eA
zSiAP<(UdIl^(FZ?0Vb%BU^`eO(g-_7p|cRLGCawr_=V&-Bj~Zv2;;jEw04giB8eW}
zI^En?sr5tvAc7cObyPTm0u+$+BJIes9WiWJCn+}1np6ib5})UH0>^!m1KoU>;=uZ0
zgn(1H^T^*Z_ghWN${kM&iyU?cz(^m)NP=hh8TgR3=Bn{Gx-a$U%ozU!>g}irgSwsf
z6Td|;<V?WxNjC%84ID5aaN|ZW4J0Lv6jjJZhhGv!X{4LHXJ`n81LlR0((m3aUslKt
z;lgWz(fQHb?}x-v_!s!o;oa0v#wYAa3mHjrZ0w--P-zzAP2{VXDsZj!QBqp_<=q^w
z2fs*~=cfb*V)`hwDvF%f40>R)x{{c>vsl&|`GSJGsN$$izS~g>mV}3m?ZXI;CCL|{
z(l_|9XWnm*;W(h63doa7aRwMk0D}Y+pl4KjzqiLyaQQuS)22(r_X#BLR-=rl5C6>j
z1WdOM66-~VwkygQsPcJt_VW-i-N}_71!3w)90X^gWvaHemK)YY1=+cWyL-@%9SE86
zf(otFrvB&HXw&0_Un)LgrLSJmw8Dywgb#jVZE5L-)X>kb5s`$*hA3FMWpY<ovUzq^
z%)N2t;X|7zaiPU2(#>RStyH<tuuhmaxQ$IL`*N_7kh#1AaHRwxsiD4~0XVLq5drxI
znG7(e&%Mt9Te9;4R;T<+HX()U?`YkZEgQY~cDM4gcW1(PSf~T{EF|jPtJFvNp{`_U
zoqUaFA2S}Fz5!s}56vZY(FiomXpG(53;=y*Z4*Y9ALqf42a8yISY5_lr|YpNQj?Kd
zoF%CORjH}Hjl#jiL_@?E6#RG4Wq^iDH}hs^0Sd|6d3q;Lobdc8#FSm7A{xJX)$m|H
z&9^QyZov}j-<w;vmhyA#dZEwfb0Tn1d_k6jG{J#82ECxD>iD8ddQ`r8{rb1xenYm1
zx~7g~5X6ueWX{Z3Q<=B(5jx4F2dln*6?r+JP)LXcTNv~L_+@mH%$s8c%9XLzFPlg3
zu7$R1)PZT8?RkhLgi>x?K6fSX434)rqsmqz9O0@1FQ!?QdzQ=3YmJ~_Bnd&(@|N*J
ziq9uuC!%^Q_I|5<=Vyk*U+Od1hkTc*q~L(Vj$lNiIK7K%2km2x$Le)xbO~)i5rCm8
z$606wc8YNi505V9iWc71t-ev6QHaA|AVci`UJOeBAZ5_6WnD0y?1Y1`4L{bBprOBD
z@t3i8EVY-*7M&-PrW7Fq8Zh?uy?a7@Oz_3W2((h8Y_Q{93TIgm_oPkEtWcv(PR3F6
zAS+6hx^^YTZ|^z!l<BTks~a19QPrW?D;JLqL<m`72LALWvz}rMA$DD^$AKGn@6uk%
zYc3TZ1<KpJ_|JK#s8I-&!DlgefLlqR4`}e&_U+o~>*;-`l|JDOhR^905Cd=~l;H#N
zi!_v4lNuqHXvlJ?kPSS?FZ}xHQ<_`Z*1YB(z&ga=Jx|co!X(MKX({X}rSQnjooAeg
zfCP+)s3kMhl4ml-izo_k+vSC=4r|$zyOI@!q!qs^ErnO()va4Mx_Avok8an;hyh_o
z++th$7xcN{s@h??_I#(J0n<UWnI@&cK=rMrb57J15p(fwJ_kL7JBFGlkZ#fsLOLhB
z1i^7zsbbo$UgH%uB|nW!BaU6fe&Qf;(L#l3<sXE6<erT=b!s{l0fZC46;#JZsx)A5
zO*jki3l7ho$Pr8K_N?(^AI?xo2f9iNr4i1?Mni778>oo1&4pB9fR1K>x`sv_!Wbmg
zHNdhYfUQ(v1J-?fF%jSn>evAkDr-~5=evfMTfXrH8kXG!@z;-a!oVQnwYF~>dbip?
zm*Ct==kH?BbN&~33lIqthU~nh3l=;FEvDK{G*`!A_%tX2pHVnA>>p*Ja1tsnHmw&I
zs@uBCLN8=}<zK%S%=6>cSEas#F6R=G(g?e`Yh$g%f22*SU9r(N`AzG&h8AW39=qAI
z@nB?{kEyOVRVob)+;e16%5e5#syK&oFv%xDld_7~05HAQ!$XY4N!Fx_#1NeHi3K^$
z^nkBlXU>@MYJ3+-oPpIdDRRy+T-IHsjN*dmvwC<6e(zy!t_W+?1#{-O*bKsjlME-B
z0u7x59rW)56gfuNwOIl=F&KDY{!w_=X?lJv7eI}YbotY>cQD|ja%!r<vGM1xaMuRH
zv3zcp1xwq&^I#)iJa}*ccq4f6AmtcBcr`bf?uB>QbSOFf4lh`!EDSILPMkU8Ti*7b
z`@2U&i8E|NCP+n%UbC2!EZqzh`<;tXbY<{9gx}MQOzV1d{=$W7)_Y=QGV7Hig4h{o
zM>z^$!&h>1E$7Y4ph^|p1dN_JGTD_V2I)8;fDZOcJem~@^N5WtU@HJ<PjOEsL157~
zI14_C1$#tAhDC-7zFO}=UAcxCC!-o5Y#~U;Cpy))Y$i!+$AmMgXBU_AOYZen4ItWn
z`64`P&@J6Mvm>whNFALS&R&}OmwFAEZ!*yl9*X<+I=fjYR8g?;|EM1e3+<PsbCF}W
zb&j-0D*cnrI8pGAmLFn$d#Y1-R^S3bH~KX;0O%p`nRa?4(5<?99On@8CiKCaZt86j
zTnl#XC~Q`>nC>p2+(w_cf#gVa0vf;pU(!;NlPTb6^K|4y8-7TiHRqPi-yGnIH}xO-
z++=;DxLO}{n|;t6KTn|%5D{!r>(;G>urGjCl@IGbT(I>%02%$`wQ-}^BtUK$tTQiH
zBl6Dm>(}%0lB;jfp5<3pK1fx#rI)4kSqmmGW5y1}Lx81W=iLZp=)z7AQn)VKr~<hR
z40_9+;SKqEw+8|LCl#&ZM+6i?o|b**NC<F6&z@S=cHtu+z3zOWo()ulUZnQ&b+#kj
z;=l($6Luur$vi~c#*-oFF7xxXH8gVVw?-JB;ETjnKWI>)_|X1w0!F3mhh`<RY1y_{
z$Ph5OoOfKAPx6HvAiOtPa?OI)EUs@w+6n|?+@Fta)wQ&c5iKeYVZBB`&)E;fQh(0u
z*>PUjH9A0gx*el)WHkZc&iJuoF94A3aS0@t&;5LTUM}FNn{WL$GT7-!9$Rn{V^`f$
z{_CyjWp|l{UQ!~EJbKMZ3Fo0xmp^vnFqa)WuRY!QPpFJS5+)dv_*TdBf*n5(5blp9
z%9gWdlLnsWc0*!cel2<zNgE9hZbFjw<EYqe5_MfT8d5OIR3J_Gq3hr<nCUV}(7_c>
zv}s5N5~CUf5@0P$mMp1T(#%8#&}0q!UH({Y3twUbeH#?#Vc+eMS<o*ey02Lz+Od9Q
zJESKpt8CFXAlRVD$WS;9ls`va!u*XuMNp@EI<oF?ovUP4&y2oT`cZ7h1m#YgQg(&{
zlHx9-`Z?b%#8C^U!VA@E_pFI*KsbI+Tox>#lKPgkZAyGhT}eW;xjG$y^M;I*S@vT3
zgThCupN9$7Z{shZV{=AnhX^Up_*`<VPC9pq^Q7Tl=@QFo-OzHLF^jDEV-;Zp*3>uE
zW-qW6DTsatZozMVnte>&zzp<Q6}|AUGt@{&!H;E=$q%w?I?ku3a8~RK?)q@=Dd9z^
zpUrI58QHU^?4H9iq2aZ#h}gt72)kHou?~aD{UoC0A>x8glzt@FlXH6^^p<>TczWG^
z!1J`+xP1iz=rxt?8es$q%ENy3*v~uLj3>+zaqm-iPno_d1%95E#?*`71csL$z*9s2
z3hAbUx~cjcMO8|Qm=LZ1p$X_T9|t?Y3jy!r$B#K@6oG{BT?Prryhq9Z(>kU_04=R{
za|6mMd!PENM18thrNpx{dl$!0C*-7I7u|TAOl_WPZhnGf#B`nyW!csxV^V6Z4@1h_
z>x~<7ec?@3VCD*A!$YYZ{f~IQNuB;3E&Fj`QE$5zW9Mccy=jxSWxhTSAu@RZ;n{X$
z*I*4BdOp!&CM^5`-j;Fh!E?|=Kza3s=W03Ijn{{ymssX4Up2EeL-;Jqk0~A^-3I|o
z^ejI%32qtt$QUoto=S|ge)xhVG0Dd-km09dxH_6JF5=-b!5FguNbG5riAzZt*@V&f
zC)@{rp>p9l5aQ8La1>ltRwY`-BjDqw9}$E}T`<cWIB=ki#R4Yf6u<G^rt!L@BpC1A
z08YFx7VcnNe*%;bl#tGBZ+sSHOPrU5#rL#N(Dc;_lny1Dldy=MSi;e<`EK2RJkSo)
zztB?utM`VL?%SjXkyOA!9JKP8v)ZXX-%3wF^!<3`rcrTRc4hBBsW<#>I(P2*wL@J7
z&~EX3+o1GXRwtuY?OTCaN1509_2C;H!DfFtJ_L|9*W+YkY<789cER;oL$hyXXII24
zBN(tcu1v6uw7Ud;o<0<kdRE$*FJ?Z1Z#lU(ux?voe$*|z0pt5z#UsvM6QS;#cxA^I
z9@$O%^N#{>PR1Ky|LV&2CI_PU1dgI%l+@L>*eME?<S_aL_>xn_3BoY!3CXVQDrBFM
z=n5qzC0dhd(=-B1ICpNg9)`VdUc6wij3*g%#5Wr_83NatMVJHQ*ltR~u1R0EK-Yi&
zU8uV*kfb(oUi@yrIf1BdY|E<8$S(tsGy=8nisk*EFZxJ4t<42=gyk%76qdMTjUW&R
zBir^Ib^qqgsd@*uPu!{-Nef^teSu@B<fxyNr`O-krkK$!P=#F!`+MB@S@FW~cga_J
zN94qQcJY|QM8{L7!iq>yvOS~T0*Dhs-o{@-hpwsA`iz}u-D^><Q2}Ws-As3nRZblR
zscvM|i)|D197Eb`D%ZEWxB*sJ^W2}5p)G7zxw~tBX!j;+;gTh`m-@sIua%9J$;g%M
z5B`~dNUAV-^7XDGM>X1#-|-*pZ95&;3{qL|0HWwjRt(e(7$yb*0*P{f3fQsXbIJLP
z8T&#M%{5aZeZvzM<Fl$sLM!5Y^k>N6F5~IQuG7Uu_(T{q_aAzSrzMkN#=)zrqT(tx
zGz>7+L~X5S`Ht&|J9zxOs2|AK%r(NO!pNqMRd*AtC~<-;Y2@-p^J#xAfBUP6`wO!#
z!Iuc=vW;KJP;)b0begXD;Pr^)g4;eH!<SQqbEkJxy^2~~LvvNT7_U~lLP9>iD;Dui
zrXiabzcgWwnMcw6?ZRu#^iP`s)RysQYvOkfcUBl|O|DSZ8ZWS3@sh8pUAHXWAAVZm
zZ<>SP4#2ksx@cev{7qno02c@bpLE>OI>NU%Z_#3E(h@+IkUe`SmM6>eXy<6|S&Aku
zdNJ3G$tItT!r+c*t|!}Plmra1SyRRx{R%%f8P?o*e6r|ROhe`9D;o-sx_wVdYuAF~
z2mXgyO9*|<d@e#Ss1@y+Y&aru*eNZ^jX>~?%twzrNuQ;gIiZL%E%a8>WL5Oai01gm
zhp~T_1(ADYc>a)sABflBfz0RZbBQ1+pL%R2UD;7ZiQTn)`z_=Da;d9c#U?m1!Vgj6
zYnw5)0jzuSN6=8eh|?I2x<9U;^)!#_wvDQov69_x-fD^>%M~u@5K6Oo_BFKAv{B`z
zi*dXm<7${%ai_kMM~{NIT33d98o;M~{QQ~e(qVSRUAlIq-xavyJ>ka5UX{LTUd6=?
zd`Y>1Kd1nWhawIvSSjK_J;@?Rnsr7S=Ii4lj9OM>>WR((*oo4Ke~|E|Q*#jvOq}B7
zb*l?v6S%h~@W9kheRpJJZzZKX0uj_F@jEUquB(-QXckX>c$Of|&=OOA`D~e?BQYNj
zspCZ@c2bB3HX}GR(AAx(!Yqo1<hT6-YH13I)XprzqeYHk;#j5YSP1G>T<mzvMl@LE
z?k-TI2m?pzEPcn`=Gu{YAcC#M`K7azb3tl!=Nxx;wc0Ymh~=QsLHsIf@5=;-sXYiB
zN2{~+W41jfL;#rRzEtI-SqYp;n)XZL4PXP=hYdA6jf%*!c|pC$+9`Y_3oPHIuHCn<
z$&+C3iMO1<J+?OPO8BGE+RN`RqV9t+St8yjc9ED5q@7?Cj4Qo+)z<q@jl49L*?8K5
z_ci}~fbOYh&oaQ(Sq~0u#D`=^ENzFhYW_8-3=<veROGaoB&qqobOoQzK5gwXFfdZI
zh{mV*KN+g2(dm8+B!yeQP5bsb>q909u1nU3$Vlo4MiOc4cd^rkmXf%2RF%ES1He~1
zOL_94$J^Au*rpqxh{6I{<Ohxx`q6nP2Ix3z)p_6)Su!`*O1u#>j_aPu@C606{vpxN
z1n>g38xXK+_3An3Y{|VSxuKf)=wyYX<+R4hldH?eL)io<B9kX+@C4`@H|`QgmHa<E
zIJmF2^%kP@Vw~Xv_8R+bkV-F;U1)mvPNfQy1<@#BlU1iXJ^S#nV`8LhcQM&)?Yl?R
z>{J#c8V*#4Cr(t+;6uq}Ir_Y1e0_o2I+_^B%5am<88+e)M?f???Gf2l+({e*y7%k}
zSsjl0h6n>3GFOGcb<FlQqyq>f8IPztw{Mr;X(iv^Ef5)t?1I@gWX;rK>)hS-hYk%{
zho_>L<3-s{5_#t2$yRb!#5ytG$=-`leXl*!Sm-?(%`l%_de-7}SoIO)MJ`2YXB1zc
zV7gxz)_`7(miLGG`C>#kf43BgI767?XAO$~U6AnHLbpzd=52VrM6LBf_gO1K83;Gc
z6buRfS;12>VbdYq3`JSXh)A!BV46th&Y9Cnl^b^fo-Vv6r81^`PB3c`;ih3SZhjnV
zI!YHUUW}{5GvG02BaI)qnoMADKuj2*h^XM$RVU3#zlPU-0g617@UNY_`uhHWY)W47
z)JA6Mi-Lk9#kr%T#*v%Mk8%roK=9=0#o3RVhc~VH&41$w4qO;9d)3#jUM3pf^7HkP
z)*|JFp<)p~y^@EN=-eiPy&t40S|3%_1tdcJ=lpj9D{mrVgy}Ids?MEf&7NKRXTA_;
z@gQDTVq1F?o*y;>p_T1T<6k9K0}@<Sd-UohMoG3&1;9vN^;~+V7QTtnPuT0CQU<D_
z7RT_H=)|-f6fX`=%X1Py<I2jct#e$q<0!n}&|@VsBhE6$fe#-%p!cO5F+GE$00$45
zt4Br%z?vo@bRO_V4h}_Z@bjoFV`2mlsqw-WA0XVe!KUIUyz-UrPsw=0!U04^Z;d>Z
z&NboApl#IvGPS}v6Sy=Ha9so^0izLviziQxrS#@-^IVDuMd&Wd#O#g(7tXcPX^JMh
z|9><g@5rUzaA0&N&Dz-QSjLyS{4Tb&e?cS(44fzim*6AZzskUfiMG1aElf#cX3ySB
zaY>2=D$Jx@(dOw;ni}M4_7r1Kt{~?p$96U=X`$rwp&=+@F<Z*A=s6fD^g@4+o+iE7
z2Ix_~0e-TQhIHztzEn^R;D$!l&6C5cw1tsBY9$2=E30Z@pvF$h4Ua^g!V=cu26VvK
z&oM%bBIDMAQ=IW|ud6x|m3Z9-a!E+a(jAmmeNV&vV?(omMS)_LU1xv<qGFbPP|;@j
z;q@O`2qyUgP13@J!X7^D^Fc&ONE1R$We|&VT`vr1$F=7HdD5766e@({O`n*LwzjwF
zFLC8@7kvXE$EO%I)_<nhJ3_iLXvTievoBrsaYk~<Ig|xEhn=L}f)BIG{?P(}A9-CN
zv>z5jqo5n6(3>!p2Oy?k-q}BTchXUjP4Ea*Cs6O8J_Oj}Gw82a8K_7ainxL%?5dJW
z>5Bw!MWZ3x0Q;Y<<S8)vtjDbN$BrHahow#O?W<Qdb$*4quim`r*1I?C*vstpZ6sk^
zTw9^Cpf4KEwT=~ia>{8NTZ%``=S2c@ofY!HD$jWjo30lz8H|RooI8beAe{%spWaK9
zuBE$R(&=|fUN(ys26U8ne*1%c1b;}KD!-g|g*U+zV{ED8LrtA17X$^2)|?9<*TWF)
z55txzX$P;TFjPZ&K~lvZt%JKtG}<9_aP*=f4|EXZkq;r*|Ni7T#`RTyDT;BNKK*}{
zWS(B@?k;+)kOSjP<Uz{Jgc#i)4MOT_zJjB#q^LOG$%#WE;5fjRDKBY}v<D|7$cu#V
z{reS^vaU14dP*FXNs19-IMUfpkYspQG9I)PmYmq|x!Pz8S$vYQGL5G#{3~Mcl5ks+
zX=aD~OK8s*LI?@jt)aY6%62C*I*QmpMOOI~eeL3}P4d$yc0pZe#i!gd%^2xON{NXb
zH`gfUIx4m9-dRq&R2c}{{GB`dFv|;k`qnYwJud`otYt#se2Mw$|4~9lw?>{pbnl0k
z4Pql9ui5U>)J1UR%I{#NAZfz}%Ht>X+2X}EB>CYw^n!vXi5>x=N)!O!&~6f|p8qOL
z{0klc?*Srhpnsjf64pC~1LE#}fayB)Y}+$khnHt(I2x-}fwU%ZJvQ<wN&HKno|ZVb
z|8L@WQW*K7a1h$GsSmB9)#vu@dyKOWbqgZHvTQlInAt=2B0pspI64+u!kLYj2X)je
z`hO-?r?=;}AbsXTVa4NUWfjvMs`5iYQWQNsfRY3Wr)hE<=FA>tkR_1F$B*WN>^~((
zp?wv$BipXC#8KtHFKIissqqTX4}||8nb6MedPg`PZcbvW(+8~FtCvG+8|n=Fa@TMY
z;QEH@=_M9sHH)_YPXd>|>!&0Q*cqYM!D`_WA-W%_s;Td?MSBk~%4nOcQv#GWGvoX`
zAP=3ZOr<sFKlzep7J48LDjjySEy~hyv~-hc3hImm7j4N;xtT;LC<M?yaoZ9nCo~W1
zu|8(v&0yDGB*FiP<x2Ezi#<F^TkOCwkB>(Hy_YKY_;}HH>2`+>BNQJCQ`;j?cK33<
zcr8`K@UHda)yK0%!xkvYIS48%??jo5;W*cU*E--Zjq{trYBH$UR~a{7Z+$CoVH1dU
z=HI`QLTiL2R6Nwx(P>~e5Hr|6OUMnx-GmT^3><fb__RSS%*P`|kBEqP7(eSeK>6g!
zkp{DW?wL%@=$M#Nig&~`y+<tHOZ!Ob4pB3wzB0s^v1Q9WZ-ZH6h^ElD!Amr+I12eH
zxLuh+DL2G>^7Pd9G}Vdbx>2@H*Hbmlb2oq@AvzPtJdc*#f(B1sjl&z;8QYdc+~bGB
zN7;%8RP~Aut%g_!;vOdl?1(gm&~@B8anHqzLXJ#36@(}>Ai7~87RD|iDTyn-7nXh0
zLZBTYPyB;apBak<Jh<=G<!hRxyA}22k~|U2DN#@d5p;z-hHN|WeSG{+F{QrHl}w%b
zn19Q9^WXah2%liDMCyX10d!b#jomsRj}wwHQG^*5Dr)Wo=qpF>$FSt^bfDTlH~?W?
zyJRM6-~k|4_x7T?zo2*-MF2aClsMmfqgjodf0D#)LH0^A*RX^X2P|EE>;_`)r!OY~
zKkZXrWn9&cc?LDWB_8@U&TSc}te0P~m|^vGPSXPa&z_;lFLCRdFtBn8AF`3~kpj4Y
z4CN9i)2St45IqB;1&_RR?D4~gAJAIE3;vpHG_`VEhiC)ku3brfO2og`amc=LLtRH_
z&ou-L!smh-u#Vh#KVY4gv4uw0K)Ykd)AB8381ug`D}x0>)rTvJJP*Lc=Vf_0P?nwQ
z)qm52`Xu2bM=&Mjx^e5)gSPCzSZF>Wwg!ZOlUcMKnYsBo4ii;Aa)ihcE9^vdEm8~U
z*%+v7MBz(73hr-T>f+*2o|}c=9Y>R=%C6yb_DyQy5OHtOMXJja;sQIJNcIEM6@=fl
z^%&i-2Jvo^=$7J1qcflymWhTDF&$*+!U^!$$OKCnRwXglL9{Y+$`nPZa0Nth%C8dB
z6sf_>m|@H-X*&-dc!7b2v-B1&SRh2OJB{k%DEfxA{MCHTo42CwqO`gTTmzvkT$+So
z`j0wy)vHwIe07kdblk_lhpj6=e~L%D&nvDYMbT(X{78|_WGUQ_fOe13Ig+bVNe{lj
zZ%^t;c*0%_63Np0oa-|qq$yysx!SYkZ*dP{FdB@9%+s1)E~NL^<HI74LPUkad5kTU
zImZQJ4jYz-Kv2tu7#KXk1(6XZVc#R$_OX|9Ws+|YsHk6t;YsBEM&9#Vlht(|Jl2Hb
z`TQQ;=}5Vdo^zCVY`MQ(AvY5DxRBW$Xpq0fy*l<D@CtMvXbK(k+}6-_R0<>&<Efxi
zA2f?Ar$?ASUg26JMPP|$D}00>;40)17=zNEifqc!Na|uqA5rDhe*ezcyx9sl^!@Qi
z3P*j{V*5&5s3c(~e5#u_2M-(OMluR!pzx7Ak_6xjEP@-u#zpJW8)^jt0aaUy&}?nz
zzf!Dq8@jN$dx|7mu-r5Q5==O<x!PTD*gy-IP~KwJxPO`vMu#Dd#nJN#+P_r@y6{~o
z4dT8xFGp>Oitsd7LOd0MbTiT>Jo$jfZXOUR5@{ZiI;sdKC#P1bv^k{{JEEievLvFD
z$Qp^g52XqD90HV1QhVYDdU%daTy6Hhzr6hITV1>48+b?1F870D1>sgoZ>q%H8i6Y-
zxRmj)g2hKRc8Pnov}tsveike}bEwU&tojGM!Rrrb0X$Dtw6pyMBtcbO&A2%Qi`lbj
zp%qS<t&dOr8Looo5Dy{Vhr+F-{>AsO8jauu<Shq@s{+O~7~`QR)8M^$1<!*)q-px7
zWqg1li`Y~e94tI2NjE~hAZ$cIG89A?Cntm}Z+1wFe`4_`J(`CNiM1yB2-h3#`8B+J
z|6Y5n{TXL#Sz#rnJ!Fjz6l4!VFHwfRN2!<h@Zp}3o%{=SQZqDuGj4p%7^L03TQ+a*
z!(FX=;lJDiVa^?T=P4X>*O7lyUzXmH#}~IbtTTdju^D_Qe<CiAlEk&<8-K4zOp1BW
zA>O!YQ$`^IfTlZu&v2uJ7N`i!aTFIKkmicoEzd$FH|CSAK;a^gRCxaS^+?hCO|R?^
z40dwhz{OJ0*^o?98a{hM?5SBzM~yd(o<^(}vo-`5c+mVt(}1sprvQ`SV%GNdS^-Qy
z5TgxfLoS(4zvOnZ>!V2W<KmW*je~OF$fsM-y87P^0ZH(5a2t8VkW{tQ(9vPodnvbZ
zfFj|Ps_tSTQ^DupiTR8MK-H^Ah0s3E0meLj<)5b^mRr265+N7|4I0!&l`d)Oq~zqd
zMZcOK<LKh`^_Z$l^(v4CZU1)1uY5C<@ARgB$p4!AlG9WX{#vW@^W4}1&=KEZk+X9e
zBt3CJ^(xdj_OIC+wEoQ$oBq9j1&^PbwX<pf!=Ib3gpxa=ynq;Ot%?c;4!QJHpD8~#
z>Oa3VI)bbZL(9nuIUq&U7Por+mihNxhEXABPzVVQt`c12NA>@5=B9s{Pp=tvSo5B=
zS5Sx}|48?ekbG4kzYRZY+*rTnjGe=t!~bNU)}sBHYo<~@Emge1w-t|14baw}u8_l~
zA<FYxB>{>Hsba`Iq?-{!5Rb#k6o39&6J-P6y5yv!4}ifmSN9i%p#0^3n?;Uk2QPtC
z-<46&R4V*o+1$?sdE5RG`6t{b$_FTlw&A;X_x!u+CNn6&(dJ1vlLMmwo=n4GRbx5>
zctAL?H!C{-l^ES<5cN}1Z*EN#Q^cYzAkN|Z2oFX1kswTtEF>tZuh`B2z2g3oD)}6O
z9-vWm1vh^l1pfqTDob<oz5(6Fc%A^mD8vY+>2=D2IW%Wibe58GqDiqApJ6yQ?_4~p
zSGn_X9oaT$*3WK*gsp3T8>)I0M~}X)qPbMO{L?|Y=>k;^z<nzPHktP>S;oCxiCSLq
z1z|*#{~s6qvyx%v@m8qam87uvbP8q*KhKh|YObBse&YR1${x{>ojfk1r9^)ZO2A}M
z{dT>V7hg9-{AZfih2*XA798o-y$y{oGmc!DGWp>CPHwZammRob+5h#TTMG^Zx@|vk
zs^i<_PA+q9RT`MR4c=cCY?(7~Pk*I}Yj+Jiu-G{ve(?ss!l-9IE<C$)yC`qk^p8IE
z?svu(*nf4YTzveTcTo}oqbS8;^D`yd+FIkpFSZ&_b1@eb<3w^eLmbU`!=B<lNF>Ue
zw{AV80_p7B4voEz_n(JiwY;igb({XHBu<%Su{unmTp=zWN%SR{hAmsSYS1UAsX5C-
ztLf(wKGuI*Bi#)6%LB>p#qhi32$A$gjJSL278<+XKg3&%Z1yt_Wfr_*lUN;wB>efF
zstEe~srJ{@+;;DEqT$c|=~Px)>Qi4EqPP&{PbFE$BXcJwo);C}>@?MXTQZ%Qp<<8^
zKV<IOUwoE!9e?bM+rGVR&7`I{8l6shW)TGUmpGE=zOH&WRy6DPti1702=lia*L4}K
zd|SNxi4VAR^Bcbj2fs9B&_2z`pyMVHrSp3LFd2GB92%svFS(+Bw>Sr(R01SOJ1k!T
z|BbORF%ybZGsBObI1#LP2+RakkoedViAryFWP+-qLY{aNUjCmbdE++nGvas7pFDFG
zT^CwK!M@)Is1F`|De899N=0An*g7ykk>sXbyLT7*&4q5^3~TmEK6}=PnYVT?zNxkN
z?YH$_Ue*Q(kv;*A$M@^Gv}yyFJD8odfhT!2_-EXJNP|^CX4L9d258E7CG7E3uhG+x
zgwa=WSS8OmQU0+cD#H^Te^qT>qY|2e!UQ3*l>uVIr7KoUH^xN{agVu7B*PrSGrjwm
z{2E)*E9b_=6`ABC^bjAZl;6ve60>Nwex+i`wyfu?@_PLem&v`)@=sQngJ(ROA??by
zVIRNMvj-UEy;E@*KsYGZ;D#rxHOvi+6P-&?x>etNLZ-wdCDHt@hf)Wgfkf3U)jsSx
zV3-eO2&!t}*FQ|mEi4Z5V|d8H)H2Qh%f=IXc6|s-wUL->YwUN-)1TE*N<QQc7>`pN
zIrXVi!^mzq5IYbrk;C!E`n_$`m1g`sLR(L7x3?#%IR0ybdTHbMMnhArE{W?FH9fhs
z$&Cdqw_TH%-y3{x;9u{aw!BRgguO1ZXj(#vkL>EglSEr?4-$DC;2v_|Dt6qbgP#J$
zT=Z%pmfv-u5pw~G=ZFIb#-iNg<}2v?N@d&T&C%j4x_dd6p{L{3Svo;2M|jxw+F=j7
zQ(RmOJ(2H=lh7xUbH4Ayg7yc?UW-=-=|0#LdLhu7{Qx>!UkreE1KMJvh3$A<CSJJU
z!X(|K{hY<1Cb7z&I#~arjmGn`vWeESFtm2_@US&&>%N@5gH3MC6E@B)*CEMu-SfLn
z3Vg6FZLx-Qvq|4tu3DNJZjHehoEILO;%mYbp!gf9-=m&8Yi&i-8IqVdpwuEs_^zOe
z6p^V~dmhJfL!lh7g8KSKCGFm|&v12WwVIC~$;XOM{=TVtgKy?9kDKH&EUbRVE?p+A
z$O#J$#*S${h3*q0(F#TbLMv6#Cv^5K5!-e}RLCcsDKyUC0GYac`OwN4bv4kCqtH#F
z$ab+Q5VZN2-aDP?X<iJ)0L6jrVc3x)19x6WBxQsR11bhb$71vcJ$v*xzu-#CvTfVI
z*3wc_eMKa?{CpKI3~bOx@HKR1QLqJW+9XE3-Fr>q0{H)}wwCr)`<r@}q3QqZzG3V>
z<W*>)QLwa9B`#7EzI~dKL^l`)J(Q{3jW9l&*c$J#*26I?zt@<716vxp|4ao<#$SK=
zk$zlF4GjfV_6;2)wu@t<liHp7r&T=KhQ6Lp-|BTe_ieNb+O@Kv_u^{{iuQ+eV%_wa
zc=+~R%)BiWPh58NjqFg&Wjk_;R5~~z!vOI;xBB<G&A|VF<f5B>%oxt>Bn2#GP3hbL
z5{Q|0yVI7dPoMs6dSO7o^5XP;bK-KFJWa_t=-B3^tEu_<%a`_T+YZ;)w|*5fK~~T@
zx|tX_vT4(A`IwR|rLuf$)KYnduKNg91aoUNUgKrO@KQCve8^JsW{F~*n-~BF7sEMo
z_5p(+cn5EZtt|nb<ZjtLrN3#*rYOo~w63}n9xE;O7$!^{U-a{Okz|J7ynDBj)GOAb
zW#gwuj~_GkgP13TzO23bDu9-eOr@iF*p)P0*j@gmXZhycT>3-|49g2jh*gx+o40Ly
z>6S_nz%QK}v<YhJ$;sb;(>oY+Bq=Gwr9cP9sX_?nLJJ4|;4=a#SUtUVZPKgWAKBY@
zyv9C3UJ8n5@oKwR3Q5Amzz1dycdY_~iK}D$8ulw5lF2YYwlS#La~7o%7<y-E^ItAe
zFeT{MQa5nbowGkqU(~ME|5OBVA@T9$#3f|Z4`Eig##g7>yHCyw?)&d`7>z~qaDf3J
z?S@X_OQ*KKE1ZhOM3M;;?t2Bf_k}hYJ$j#FE=en^UGUf|qa|?#Nd-g@cpHziATRIe
zM{{&H;WM-jGpIB4Ziw=h30$PdK5kJ^CCk$->WzzN`byXV6_v)6FO1oi-R{1{G)Y-v
zwXJn*c-sDWI;M8^GMsb<-M^C%PE4j~&dLgOrm7xgU|@IY5<N_-X{M3hK!*a`8MZ};
zB*n|*J=9)j1}As!{IaAZx^lKkw?+R}MgI1;FQ@cuKl#EXp9Ki0lDYVZQ#YoyN!+6`
z@-VP*pQ0n01rMj$*mNmcJk^jk(iIPncF%99F5f+DNq>zCKTl<a+mY6g=IZLvPv}nx
zE4V{}cRZ_yqGI%o8)_j-LEIOfd_=Or9?fq4&wi7%i`bL)Gj-(_uhSeeX20{JCr=Xe
zgLQ*x*9P_v?OBQ{Wb0bJp+gTo#n;~EQ_S!!6As-to&9=6VyRs-lQVIvyyL&`)9Bwn
zz!~zF$8PJG!j?oJ_>w3U5d7xN(u3x4iHWz2K4FtsoZ*+mKEZ?`?efT`<&j8y0)u~M
zwd6Z{XKP)g)s;<+Dge9pVvaVa*I@K${6{7i9sJSZ<m{f1VLf}+!_$Mw!hCZ10Yc)a
zkaz7!{x5%&fZswecoXa4T@a@Mg+kj=(cA+b#&>n_D1=>i*+L4!+d%8F8N|Lq`}T+t
zSl3xt%o7E`6WBswVfg?i0?UZ-unxmI9epK*Ey<BW^FOIR@g4G}lH~HC6tnc%FY>Fn
zIDjQ!{S6$&xVR}ZXNrE*yr;Nno=eC*Rx#{A=)Qr8&{((4A!DP3aj1aXZm&e7hd;bC
zmy6>*y<KS+Y?4vx@cY1b#an^1@jd{=JYd>jk6qH=zIAJBq$xo`Kgd>*UGkARP@)}e
zN6*Jx*mepT%_dl`r{MG91J>5of~;(r0GF7H65+Sse#1^xe^S=#&nWCrcau9I{KqFI
z2Lv2J2a`tZf-DBl<d#g>NF~f?7@RL`p)p;aZNT9<kbRL;ME=Y)#`)zu4HwESDS^fe
zHp#iCYSZI28Nd2N@mTz&`285)P|FImY4;$QahGL3GLo<0Ys8iFiOm8l2QbN^2q#A}
zE3W$1{Sc9#r{a~jwCD0TNB5ioe1=!jFkESPAI#NkT-cMHx_9>izD7odz=!f57vhI^
z@2=!tY<)bx$}^pNhWzXUmn7Txm0POlRlr{U%o+E!Yhy+}wJ3z_fG532LA1!p3A_ku
z;}Qa$OSh<wdMGJX1689nq3MO)&5H%_<>qE1CHxpC>HOc-b&*aJkn#AnRgg_=A(Zhj
zhSit&SiArr;P<Z=6&-lo$jPEzXxHcsJRK19%rV25;p%<e`3bxezKnBT<mBarj^4oF
zLj<>Mgg5=vLe!a7J9KCc0w`!!zTB{RQ(Coe|K-!CgthmxvYe3A<Q`xv3LlQoucn7g
zxjH8DZ}IBUr;i`O6B>`}E)@_~YmkiQ8}n3iTDy9!865^^E?R29(l=)<teekmWv<TW
ztp{5n%~`&3C6jY*b3u@?I>*6Czv_!U0P{K&KTlb>@KCk>W0V~bxTS$A%F3+$S@v3;
z!cH!FPwo=xPBzYD(BcH24Az9_XiP8Zh7CraM@8Lx{rMX?Cxi%kwjv@(5Bpter?)PG
zr3vfq41+^TB-`);0|9p4uE*Mhng**A%fCCiQf2@>&Aa`<f-}MdLx>+SBhAN0sgDNI
z7T&;0&G0=J0FQjf&YhT5aaQ|@U$lJrG~>j}-%M{#v3g5o4~3Pqwu)+m8+&nYHvjYq
z6PkY}gLn-8t~5Fj`L`TS9`boUt-Lt3320|#WIC9=vra-#97P;6Q5}}Wk(QG+YB9<6
z%9Xzw25y~j2t=0i)PT|y->G1Z(Lbe&a9J>&3^qi2ecTsNEcAW*?l~`AYVIYQM$*hO
z-R=kai?RJcec9#miPqyWbhfp!GGFnk-LJ!jx^|diYP#^|MFtIGvFd_W0z8YaI`3sw
zf{d1<JlFjK9=p^1XZ2-+F#s*Yr-wzUjCSkqes542VljBk(8{yE-`C|gq*MbC<eCj%
zb!7fOT7WxvaDZNXs;WBYU8CVkcp6FKFl?9@P|jpN!Vy^%c1G-x*zZl^ThjGNgrHzk
z8maM)Y9T$DJ4yEZ%OCz;V=!0X)xSUgL`-$1;Uup5GK~eaDILtcgr0_&P2M*w+#5ST
z#_({Xe&nqY$gO7UYJJ?C_2L<1BIN_E|3<Uz>@*Y=@K#Y&QYwA>_B>wE2w6>aLp|cT
z5`O*V7cy!jt&@7uc;_d+_>y}Z-n&u8&)A9kLV%!|njq$Ufe74w`O6<BeHCeiqO|~!
z;{eYJ>x*3*Qc<&T6UzSL??lV<>|&!K{}t;hG4cr9f!rBw1(nR|QTy3lID@H=7_mq3
z#p~AvTsTCwM8j!9i$FuFQ=qep3wY;xC~vZJdMzQE#!xeIXIY<fuK}JSKr5&sZ{xgm
zXEZk<;_AYWL`g!#Dk2<Tf<^G4q$A8G3=12irM2C8%94#8rObLLt*ngPzkixS4ofT-
z;xB8OZpfaUGUWzqFj36{k4nBEPeNwf!+HRGJUfz7Dj=A6M8iBYI%0?q$QTIi96gdh
zF)Svr=W7BNT<5@mRipM32w*4IF%fz0-0vJPYB|&(q{L=Zr_KRFr`1W=3EO!ao_WqT
zTRZpF%vq~RSB143>(NRT#{|m7T{Di~xp4!4);R7gsp0K2MRm(5t*X;b^CvD67OJMY
z8qcfoQYmt$Q~-8dLN$k3(e6XMi3_YnKB0xj1f>fr#uE?(2xj?F_d2v|hmnK<x<z)d
z^M~pAQB$0EPEZ53_FcO+nIRw0ZxnL6UA93aK$&;$-CHMQ3U7Dy<wv~DjxE~qu!7Zo
zfMyu(lrFp{q_SXltO!+&F=G|`cUpl^9yI=p#cvl@k_TDjo3jFkpCSo)cVJ(yy}F_6
z&`;C3+^$`a(0@Iie1qe0?b?x*O?((!bTS=CJlaOI1RO=CxZGrgNr~6hRWFm?U}0%X
zg$%C+vquPVm1`P{5Z;S`#w_>>KGFm=3*0|RpW(m;pFaB63uXk_9-ZA$Noj&Y&i(s)
zDT?9mu@UOuWgAPoo=ugo_c9cRBh$60Pc&u@>avYujxG7BynHlbCpgYOOn_;AKvPp+
zD+EgE6M!i+%^$lI=`mQ$g*C6+t4=U8LqaqW-6uCT+~)>_E!=oKDbF#*fEOhEKuQO1
ztZ&<@72^r7P|IU=N4rec%a1~XK!MDUaK*sd(dwOTzfHLE5hvr%o;g#qYk(Q6kM57A
zu_~eoJ%f}~t(*VCtQg8+)USg(wY6%qDK-4xG}{+Caj3y2H#j*0{<G6dI_SBR(FkE3
z`CZ=tVV1~;=-GbL=szc@(TjpF!hirOe#eXr4vv@Xq+&o0y8^(2Baiay@yn1o-_IUB
zx}4}i#g9-lwGcr2v}FsMEfY>ruCSY7>*+J^B*hc5L(frtbz_j)nb%Ax%fE=w1FIWB
z$WXh<9*p-IQ_NE$dMc=rUXqIJ@lcaaK{$h~h3fH~J<SSBWyenO{0KH?7xc+$N%f|>
z-e9_D2J#1ur>-OlVW(VKISd|57Uf^0h?Fr*exLKLMBl$7X$`5X-nFZfR9sw~GR?3W
zde0aSp{=f7TV3ASeGz~G$<yxM71ZZeU&Od0-piqUPRJBGM~p3$J2HNo;a8V0{_W*H
z*0&B*m>_4gb?%Tg8a;i`(OX5XCF-D7nOnZz!lBcaQgN;C?9CnYdetZ{E9Spjat)E6
z8vE8Mb?mqrsiaZVOoea6PE5ejhDJxEd~8h2cX8)SVyR-jf-%C-eWvr?$Hepp?Iw2D
zbw)`jpuQ;`!uIbULl17nmC=l*=5n@4NMoSt$)!1Jy?0JlIC<)n0p-_cdyV}`q1yu(
zDQKMVT#g88=<d}(rku$w>}+PcPxP;FNp7>U{=R2N0-J|alT0jBr|lYe1_~}Ykacrf
zq|FK|_P4C!F7DvW4m`nQr+IYYI$HJ)j98&!owJBNnj5w<QCYe30VAE$U$n7-Tb(!4
z{^pYupgAl3JWAa-!{!RAq<zSo7nSedwM+U;^*%f;f4uPyCGUCi3yX}0<;E@@uf6_5
z@v`MsxwuFoQ4rvd>{BD*=g!3*kGksi>v!eJlZYp&5chvvSY?7$FHcPPe-oEX%?tv9
z2^I#1h7ZP4O*pm3NU<L5Ub>l_mUT{F!??Ct7H23Y`YOWrl9cUv{KuT>02F6H8@b{3
z;t_KiaHxKKQUPsk0Z!xfCQ@y^BBTW<PM>}ULDG|_Pi-q!aaqH;T8s{+36DL$r+0u?
z*flOBQf?AXQ<tTbn4B{7-+5vj<i4*hAJ_^~nK>M2f5Qw&{qJkmlQ4y*xOel7hrRUV
z6OgUty4Z*M`%Ann1eyXY{kzvZay*08F9NFVvY|>L9A-#2Z`^ndbQRU$qLwtv{O;YW
z_Zip0=y1Q$;R|54qi0BQ@YW-zE^GW#P`VH9+c)#+)AN@3kEjHuM;RS(W-<W*Ga)x|
zRL}MY7F~JyQDa3v$D5>aSqo{GEOI(hta16-v#9Ku0|LZ-Vp*ZBEGDX;QjO31zpBnW
zuEx9#<Beg&OjJ{rY%R8uEg}@Dm{hc#Qb}1_D0_vn4kyGQ%PBEYIGj@wl8DOKq9R&k
zZKOh3Q=*dI?^Bj}{V|`hbe8A&J@<0m*LB^~oa*pZ_j2|Ta;D=kTsQ7*`HTsH!`zuz
zbjIxtu~w|Z5uhUF3^hna!8Ef?QfZ%PZPyiet;qg1GrLYDGC*3aYKHwAF>1V|m$R7s
z2BN4X&MqfzyLx&aP~I6Gee+R3!cH7cZUR~X;|g>+i8#)K<R(>ppr{27Dl+&GA>ekM
zxP-)8CT6@~6;X{;(F+n1k&`|Jv)rSH4h;hxgNE`F7K>wW<@^NI_Mw5!sTjBkW)r*Y
zIR6&_#72K`?nyKQ9IU)Ncg76tKb<QwwvjS?C<{al;E>dmzGLI#>a6N4H8#`2!8MFp
zVL+x7)?<qv=H_nyGO^%K5-(;F&H|tYbt~U+G7Jh?<zuC7?T>a=@8IO(Vwoacv&QM*
zp+n{=EVcBiRoQYCM_k<j1N<MJc@1Xb-@VJ%`zIyA(No4e5P<VH+a=H0wIL2?pUU`<
zNk?muvCSkNNgNio)5>Y;{Fb7IXR`UX$c{#i7;!}SIZ@xgIH?YDCbt9?;ig<Cw7&?A
zgw)Gcj8ogY($Z1ZSSQ9VKKDpCiUZmS+=XmI!9wkQ6;v0gBkurma;Qo99TiHRf6;rk
zAkbNz<aB6Vxp5<`_@uB`QeTI>Kw&!lnOhcg0rY|vihMbG3g7Lm{S>~#zPB}5ml*DG
zX?7)io5%Dck#B~;woUcYO>^kW>BecsUmT9}bAkRP<cd5OaW~7CRGfZd#SGZVqvB7G
zR0$z21M-XgYf8XK@9=l;7R70$Jr4rSpe~Z1;oK#!?zanGbi$zaK)Bp0$Jg{EH*!Yx
z6`v*&JhPJ7=ugePeR~mcPc*IAU_o$j9d$o7P^cLjmF|ISs~ImGxWlq{O==~!iDgb1
zvOh_<<bN_tT+d-3mU{a7j0s{ZM-JEIV$p<&9x^iEGW(1KRfwwY=m=HR!9lff|M0mx
z13iqqIm<}IMGXWN$)F=v&jv^=^6aQ4|9G~z!$x!8!Yy>1xg&zs<~}FcI6ZT$8LS^`
zXQ@7Ffs4o}O}6w1=);kRPG36AS{k!C*?J75_mwM+H(th=)OmhkK+CE5<Og9m(r<TU
zWcI_bQ04c0DcqBkl$4@AwDRj1ncYYlmTq76`a$9C+u^G}LC&)LNPm5}vk6ngSeq_2
zPvasY?ozju1<fwbBt3i74&~{u7=2dX*4xXA0D5D~#_V#3(7&Z~=ghfnd$RN57&a1Q
zKax#$bPRydAZnnH(bvJTR$ON;7Z395rlNAkbYau+-2b3kJ1_i|%ZNGe*ZB;b^LoJ0
zBjis`ZlXkB_7hbKd_g(Eg3lWdyT(~TLX3TxQ2VmT)<dJ0mKT@Na7^fFPB5M9VQM%1
zRg_P%YiNGTKd6LR6!e_NLYur2RQO>Q+HnJ;_hn=I^GDIXV@iNZM;^Y4wBNDiRb^#8
z+<=ghX-D)DJ!nCuOzF`0j??3`KgAi_O~<(}sOR3*)QE2EF^jzoPn=Ez#zINeauOI@
ztQhJrW5vlQk6HKi@+I`Q8L(5BJoWC|H?Hh((E8%>`%kR)0l39;Bx|f%bnFxt$JBOO
zfmR<Wb)nBi*~-1r9VYcwGDAK4VxjCbs05DU_5}HbMcyGNFSt95ejKH|Ga|xyYKiPG
z0!ZO4QO-dF##+?X_frhw?=VmMOvn{0_v?3*s;7U~W@RTQ0jIwsRA!=w|NiS)Joyzl
zr?(hL(<(AH!HN1IA|+<>;EW;p<^y6on*jg#bvMVEJnj5rv??wOHZVU?pT3}$GPY*x
z3xlob9`YhWY--%PYn2h9a*hgPgrbHMXU;?{+cJis{N0EJNssJpEAXeipq_vr$8IZ#
zB(3D*fAHcZeUnnWKa+9ow~{r$QBJh|xiIvVK%W<W%?YRd_v*=Rrh{**ecqVdyrSPx
zcVQKBl5k~%xp{{*A{TfUZy%JlUEPr;rsl&3|D_QcF)wTB)^5D4M#2@>`U%nfA(720
z7nd{ff~isNE8v;(wE?B?4smzRX+6Hyax|=$ox}2`CdR~=YVWXIhDpA9KuKX%mQ|nU
z2~m`QJ&c!!E3;JVGbO*%xu4H#(=Q4S{rdIzm~7a<8U66?9mZ7!`T0x{c$Uf4<d5!7
z8$Uq`qbk7E$NtNOAk*HecP15b2+_05tjPHi7AKR%jQd--alL+i7IrwmL-Kc`sLQ0r
z%rEA5nAJAf^igXMr)+A!@hTvL!E64C9kAnfGooK*-=0qPB{c`%M{Rc9PYwQ8+OVYc
zOqis;S7%j`z-W6I<-pFC{MO9e1i!xaNY;;Or`!B^3r%JBb4x;%wUb8pCG1T3JVh}!
z@{~ZK8MyytMTNbRx3lq{ecKVl?c-H{cA9F|6DTyo7roW^6nJS_?mzi-cnC%sF`jxh
z4{#-}N4IX-9*ZNqRq}x37G&q7JGBmo7Q2pUB{H-AKB-YCXdO@@R}C38$wy_3nI-)#
zXq3F6Kv4LB>sz%OiCHAA38gZyq2ac79QeR}((XD^kd*gJLj5)IasvNi5w7KwDV-Es
zgAN!}Ta-`lWoGH((xoum^+AMdt;F^G$v3*Ici_dO);$R#9F}JpO<z{9!w(V_){Z$E
zQ8-`2mdksY?dIktlmPVmz`JCm43x@ka^si4YJ~$q*^UNF_@<IxW^MR1&_Mt6BgJ?;
z^GjyR%3ux|jU5_veQ0&77-C7(`xg!}G?Wagoag74wLh30vjMfSF9yEC`9><2-^h!K
z+B?Z}+TNYjlJ+|Crh9Api^GX`I63b3>({4`Tu=8vw01^<;!Cl6M>&&&t=!&y8^1VY
zJA&p^hwcV@;Y+KSjhJ`uqQm88BT9jMdc^j?8)UJKxiypmG(`yoS|}I$tFdD_>Fqe@
zZUE(FCKD0|pR9?U+DdYN)e8!{z<tMC4d|Hkb9HFmiwiDMf=xhTqHRJUqvbWg>EKR=
zn*^6I#zNw7NRqT45m_p*3U+@~3+Q?R`MAf(9hQN@1P|kR@GsosG?lMsfAsF!+V7YD
zWc5j%WruVf5(JL}3K}i3TBlAdJogurT)y&FyI>eF5tlC(lPCkvXXTxV%c{`T*B9h9
z91N{tkI$$EuL9wr29ceqxpdq@TYh(1yoqX<IO<eR&oJ$)YJF70&>j(#B<`WFP~4;R
z-`#b5FcW81GV1p4e;fJTq9+O~CbYd;wcI$a_!q4!IXUy#%<w*hVKxN|Y?f+qI0FO<
zwoyh#vfdjsl*24|!-$W^s2HIlC~A>3YR31;NXogC$3%kK&vA$->O;TXQHi2%?Y1DE
ziO7lpLr+|<G0<ts;lTUqW{L-L6U!HU>6l%1`SX0~^~2L`g;|g^YI9v<f<Z#m{Xgs4
z#a<c%LaZe;P5J@Nq6fxdH+iP6(9yU(WP6~^lqttWi)(3U#DeC}e@?-NFSR)<Hb^RT
z^09X^o4;O1aHEEtZmx*jMB0&t`^5H13pY)z2+h-L{OG9>y~<jVMTkd}7Di>$rEml1
zb!{*j-gA5A&Q;l`4oa^-u(!0_1QQPXaP1w#W7^0z96X*8)e?d68vn=RpOaR!I!B61
zWs@Jy1xF=W_H8;}vO;OdFr#?)O`;q1b9t=T-p2=#PdH77hsty?j~%zfw#zTSb-6fp
z3Ry&QvMAYqYRLQ@&JGTjj=9*C8akK55g(>AGdI<_?B^svacoTO#+?P<`NE_Dgn>eM
zmPZ<V-2T0S=V#~SxZ{JkJ(D3Hy{o{AbTV8b5~)o$BAe{JTyi21;NZwZD($IGza?)x
zu41ib`P8@RmchojPCkBPCP&p-CGRK*;P&Ly#a)|vB(?HO?(AeM2DPtmigIjffaGg$
z<#dqfy+tILKnexsLnUJGH1F%hu&H^SC7Q1A%#o4kLJGLZY!rE^8rtz~iO4UON|M$0
z6pp^PF!gR;+(CEUfc`!o+WHt5UfQp8Ea$-;_#5ydZKcJCJB7XL<bR^f`VztCs%Nh_
z@q=&lhj)fgmz={~f!VA$oKpSD)vI@c$5Ba|#R|&@;BMPLQ_ER#H>%sTqWv7w^x*0Z
zek{XW2zp`It>4!nrPa82csX*ptG)er6XLA5+}u4Lb}&mJ$M<`(*+Sb}yB&sbOJ8dg
zzF|8i&19^lN_ohp%+i6le~~A$%LQe+U@uVeq#3p&tqHIlW5@VQL;Tt$y_q06UpQc_
zh&V1A-N*1q&PwS6OO4UbM91PbmwKu*`A;70h+))@;DdTPJL(|9exk54vt)TH101zc
zZ)u|TbcDKE_WE_g^<P_H_$Tp&LT#BAVj|4US;-iTE^zcsA+Cv)F{uEUiyLO~VdjDb
zj^#eyIXCC;30ma8c9hz%Uwj()Hw>t={+=K_`Us+aPc~kFFi=hHaE|k8yJ7#KfDJ_n
zOg)JtjCqc1OsD&p*RdbGSDekf88bAaZ%&j%2wUnU`Yv<4yev|pQm$u<$}49|Nc*^F
zOi4zp2k_`;tQNh>fA(yhM*WSK**$RZZP8%rm2}6#gW1Qju9Pfdt|~CUHiGVZPfyMo
z&|O*CG=*dR(9}_o%|meBxqtt0xtumtP}avUUHPovxva7YKE=LU2bjxRM`lY;y|_1Y
z+znnJZCJz7TENl3X?@<NU8|O4>Fn^ON7?LN<~Q@ePlr!7*<Ej1z1IJ;@1DwuP79qr
zZWV&f>nQfruS>Tsqb3&aolxjJu>5+O<A#GA`Q@vRJ+KCvBJCqsOKH`cN9W8HqsA;d
zzPB{K4GEK9PD^<Tx<2+9>^n{V^NRE(l3%apg#H7Vb^WiSS#6p|FXArMr|C~S^P4=y
zuWG{lkY+Ul@ABafdwUh4puzgdTdBnH;;={t|CG(YJA2kFTxfy8xc!KPa(eHtsR^vT
z71)06Rv^?n{`09tNesvD8!>%gm3eP5n&b%AHsNy8av<P*vQNLKi;P5vjvce{IH1>g
zsCveACyx?%t9DA}=9g){Pb@or02&T|0>T6$z}^MH=ty#al_YDa1G8?ty0~&?n)iYQ
zQ+%gmvyl{;A@%t!BKAdDDLs6uS-{r9<>?N=z4gYgX$)I3%(Rcw>YE6mUYrTs?>%sW
z)5jMhwL5KbUH!B$L<eB2a>fy1)f8c`kez@7SJc%p;C4_N6gg(m6Vqp!wrWGzp<Cal
z87c_9^z})P!CB;w`u&UIifNZ|2|#~G(*j0m?>Wcs+9SQ^3}atK!+NS1v8puHhKYlI
zu8*&8e*9hmM}*3hvwTmyP33!L@~I|RMjB3hZ)pCN$_Q&9?TAg3nIU{KFp73sfJ&NT
z*fB$Yop{%VLF0?1W@fFdZO0yHs;l<xW1D&5+<~+sI!+zz_G3&R#}?87i5-)sXf;gJ
z5hG?egQOXHxI7Sv*G9h+y%#&5+a&)qLHMrON!+o(IH|!@+pV8gegPPeJ3S+uEC%>9
zI8RETURuqJ({PM66)90NtcbX0;OVk(uD|~@H#dj*CtW^2yV)(`7Exw)u(P>&DOI-g
z0nn|}mtajz&9(J+?0(;2W4JHTPe--<j^~<7qkk5SJa?dRBL-WRwz`6}by?>E2T_pi
zj*&YhlB@eYZyml=Azc7>?K<;J`9wHF)eG$<*hc23c;G)1?t1cTKNPb7dY4V~Xo(*P
z@>3Eltpii;j&)|g{;Rj(dbk!9iPJi6TmEYp6iGGUzh1!+9{n}Nw?}@o%Dnul?=Ba8
zfs6*~C`y0cajR>OwXTO!c7~jfY4kSz&%L14v-<afFasdV=zZLMYl)+<%Gd_{tQJ_t
zb;&u#o04%olFrOouwamNE@v>pw?bekbqihvmS`KPC~e5zjQ}<}dU7*dtY<P|up<3w
z){0;oo8PjZh?RYw2|n<yA*VdOAd#lJE%NZ_X`O6Y8-H{VS)1bIXs2z^-K`Rf;=2c&
z6j(XhJ5B_`>WHYjRBuydTR@qdJ+^?6qHPL~>Af+`L-q;0CBu35h6JzjGxn4ltCkOK
z>S?O}FydNiRhda2Tj3B@?Zg$ie!CI}<j!r`g%KXs_PUcC9g|WA&rDYd{(YV#X~1NX
zZ1hc$SQ&e#dgsm5SvOun)tDH$b?S{o+!KUfYc=+aSvDw5aue19R(jPH`Tcm5`Az)D
zAt0>rom)Cj{Vl}=gu_V-0g{OL{UT=G?|fQ*b?9bF@e9kTMl;ig-4lw%&E4L=F>&rW
z-5^TYY~ZDAQKrAEXSeUnqKie==H}}?{-N|L#hES(8bx5mrF28d)Aitq(SBPj4ic4b
zyz1L&3x!7f=L$wd7QR<#rbWdOPwD3-vD9#+<;01<IO&`LvCi3gT5s-y)4FNz_k@RE
zv^jN5Ts&a%==iYW+Uc6gU~=Q@lUI(-$g=r|Zud@~wiMK564NJD%i$Dw_lgsc!b6Z@
zJYv}|<}krQ>X{Z|$n^v`2u6$MuUe!UYj>7m7zRLQ*BRC_k@7Pxpkv{G`1ogLU2PvV
z;0$eL>|hZL>1?N)w{E4cZX8_*l_Tfo{U`|Y#u(yZ=E=X2Uz-_!o5=)+)+(89s{cYI
z6K(Bv<tr?NIRtDTt7O`++@0zn(8}<xGrJCR;a>c`yYqyInC1U(x`~M=v{nb7155)>
z9$jV~FO!9j%(v>T3dJQZAvSg>CH?3vR+AVy2A)5BSX?KZs(*<D)aK41?M%+A)`hyL
zeZD62IN4E~m1oVEVS3;xH!tULzqvev03k;oP-M?e-13!xWw(M!xoPLYXCVksVJd0~
z3x;SM-AWxYc>Wx>zJI@@^3?SjkfQtnBbY9{nk_UX?D2T!Xx#HH@Pz0*xM^NkQlK#{
zlztTh?oajgs_0HmchYyc*wc3F(2t>b_iwwfKrkYdDy;oMvrAvXQxbT`F|N}L>6ix+
zK`BFuv76pGe=dCQ%1IXEMXzbQZsaHlg(()1f$G;PNeIbFNrxZ?E@GCG*T%g~tA8lJ
zU4Dsu+rYrhX!?TjN5GZx7tW_DH^?5q_Vh5T13gAA=>9lr1gR=@VDu1Xk8A46JNrC{
zG6sFEF{q*bIc%-D$wHeIPMnn5#oc@Ks5pbrDDdtv7yV)iZ1AcEBQ7C?7#x`KxS>(y
zoFu*<*#8jIJ_PQfYljaVDrHn6>H7NUfz^-+es3QN`10t?{CzoNxpXy|g_)WCw6w;j
zZa38g>f%KTE_253OqdoWw0jIKE?j_Fo5B;K_t8K8XV_>SDGPcOKC7<dOzkY*I}mIq
zGxKQHTPma2ahF$)T>~Ut(`IH!^)sap3BwHx+)jD5YuM8g)BCWt!FAd+$JfBM746En
zn{2{3lD%<&CAomk2O?|4>PnahHOJR6^v9uDmL%KlMdnU{%JX6=Vb1BCMe1H_NNq35
zDj-TgGqdUeZ-f;}@qf>7GD<6Gw3(n7#R`C+Zj(TCndG-=HD20*bSr(+C~TYp&+FSP
zC?F8^X+cUOA{?@>^M3aJ79ZB7r8P48k=4T6UB7<4w88!S(wl%+evp8bdW_z^DhJd#
zf!PqTT(T`PLfBTiJH0NLVh@Nxzl!ZIy{O>xO5vw`W|mmcaq*3veR7g}6z(<fZr`JX
zm#wJGup!Yz2H!Dt`hkdgCUeKPbs4&DwT%5niI%=fAc6SRILHa!b9fCPLY~qz%igMr
zt@-}&xyJ=n?oLZfBY(a>I_>1FHqo8fbQsN0kFyDc%qM{E#p!?z3vF?Scdvla4b)l@
zjqdJ)J_47$Y*uGrlmLAS(gNKsm{@-`YEOK_1^)tZIN$Cwtb{xrP|i?~c4(;q-zI~}
zgjqn#5mcL}ye5f61yI4_R|<w`ki6R_-y+mzf`h_H56diN!h_^P;0^IUgj_bKt2Y?o
zsL^G}428ngL>>_EM24-*qV)8rEQsm&tYWF_Tt4U><mH^-rU$DJcUqTKBV87r!Kfx9
z?!;exRl{UinQFo3PEbePXE}moMb`7`&iXFGsFL6rYu8^jjJZ081JGoO^uCH2YdEPA
z^#f!~mhQ|Cvv7znvRX_dQR69CJkYcCQc+>Ok|sZwpU(${F)(lJfx&Ml4`qOe4NVaR
zrSf}XGNTFB;vSYtVSp0f!Kz8e1kwy(MW{FYx^hLl>Y_&ORK4vM!Azu%j-62O2sM)%
zLwq(>p|%DTq1$C+S2`cJP$M5U1K1ZdBTg!SmcFho8WHl*G^Va(M)_E}!Nmaq@!7K7
z1=x7hcfLX|A<XOD-1hF=d5U?PUV?M|u$Y8|$xW*U>FVBi{J4=ShfebJ=^E5|8Azyk
zqVbB0NleUL;z85q7bREJ;v`_gix0Mr7=eDyzLB)^M$K;Q*REbo@JJg?S=P*GrW^;>
zJ@L0_E1nKa_;K6*DQ;ei{z+k_obh5ISWkTklyA9o>OHV7ga+-j0N|iEp*|$|Kyzne
zf~sUXoup7cUP^I1Vp9cWZ^=c_3N>|gv=O~bLWcM0Bc&{YWYxd_9EwXK*5P_=H>VW0
zAJxM)IQSe01kE&NKh^Kwlh5T7J|PJONEjy$$4nM_m$OsR_`RW_ZB}grw8Lcg0rq9I
z@yQl!BPd0mimPWu_gQvYQ+mAJ^{t2T41=-Xw_iVi(Fqn7{YNoC>73noAAXL=it|;v
z+<1S^SYqN)$Hc>c>*x~0{cQJ*nCuhRpUT}4XO|1UOjQh_E<W2qlfznp;I3x0_r!A?
zwesW}F;t|Uho$J_I{fsB6EW{M_UD<SZa!*l?94o{^vxS$vWI-cVc4tOGdf2MDReq*
zVI2%5vvuS>FZ8vaD4KE6o}PMZkT6dI4q!dQ&boOpgo*UtK5EHx?#u$L!?pmf$nly2
zdT`mQ^Luy$F1ud!&lk&=z>6s<E9;#Wzg!yMPpv&_mZezbM%`Ir)SXU+$wbJ}B@akh
zaOAC%;SD#}rB8wuExLDl?yj7lN=r-CkIg7yks*#N6{W^KZ9^J{O+eIqnj$AJQ=T}m
z5P(L|GF?#N`M~~TP{6Qddt+lu$j<ES)K1*C1fQ^^;xgg{?v=VpN8cC4rG9Q~q$IbE
z>a&Y^6XvT9&dxj$9u;zKOrA7gF1hqwRTbRDunPeY#pc4`AlW$fK2dpVYStf1P{&8?
zy-(Ex?e4FqLx)UHUwJ<>^N-ZjAzEHAHVA|Q8;2OBXA;z+1Iqd<3$Zq10(xHqYXe8m
z655#^+2wZ~S_;^T_K(!+-H5M~a_61qc{}cMa$PVRRF*RACsd|ZGh*h6(p=@P--*Y#
zk-24_E!2HzLW0{`Qy%%Ry^@mj0gYpU5#k7f8<^LNk4}@Ilyg~*KS|ks@JV0+X^_T!
zz}REPf+Q9bI4v(2E;$;no9kr-r8@v@><+O|yidD~M@d1CDQP%RuMW9iP2cmXX`cr+
z3gAv<CW6sE&l0hTt#+Hd!^Ps()Ybrb1}VC`MyY9e@oj4wYbB5d9sGrAw2?ZhTuEI+
zgAYG7VtE+@&oyvKK`Erm&ct@<+LdJIgI(hLiOWB|(@F~!!Kk3ggGgKb#bfXB<8LTR
z$+DR}bD8`iI3F8aMdAWl@`7F=G4NEsPyj<=rfW_0$B(`~zW}Jc1&EKYDgI+O451wS
z8X)FLwmJSg9{eYD-U)%*%_e8_;v`Sw`lE}=uB(KYIBPiU`>FzY;$H-8B-CVG<2TPM
z^_Wg$1kdJI5H6-&JWD(@Ks|!R8=Dv51e`Q*+~Sw>=+S5Dixx*yd_?H5#mcNNA)?VG
zE@I!G@L+cA7+Lp#(nK$8DGlM~!vay^!v``fgg*+PXgWwT9>y{O=iD6~^TDpR62D0l
z`h%Ia<B94*c(=5K2CRJ`cjS;ELxv6OX6Uz@G6E+O;`F+OD{se)M`cI;Ndx<`vTD!2
z8$KMH;c|)|<n=Sy^EPa8f+~2GuvY_(I(G%qG*4J>RhAP9+kJUIf(oNaBj|k%nv9gV
zAhlIhH?CjrB5c($T=o*4)Bzw0<_yAe;)f6SNf~VkOwj$t!Kx}MRrFYVk@l_E!P>;^
zg^C8aF#&Qe$q?^=SzW!L2P0>Jc6yLm@VYj?mPw1_u2L5X`(410;PnIZP?i!ZgbUtn
zAN>ZO&tk#^T_X{c7J<jtvJ-)$4U|z`w~|g3uNBBJs2}+FyW>*g6uqAfD4clk0tt?Q
z)c`opm%Evjr8ju+LKt;aIcS++_c<jEB@(S5XJUXzg2Y_HA?!rozI|yN_Ay$g!f-q2
z;6RK7+e4dE*ROBi4ehxgFZL}=k1|?(kb9UD39D@0gVQ(g%jEk*Hf3}VDNS%gWTOCY
z#JUQ{%!T8V)eevs8TRprhS0`S@?wfB&w9c838Djv7;5?zBSy45o2JoGbP1d_L^e##
zt%IA&n?^%_CA-@k7~4pmB7=Z!6+D|wNN-}>1lMpV-sOz>uC|5h@RB>lc?jWF3oW9r
z@5>i2z`z8~K2)L{?JMt}x`Kue+fRW(Nyp6KFo%(HK-iHWSufjs{(J*-Pa$|R2qssO
zM{)f}=5dOc#8JVrBVH8tv*_34AF49hiQ0h$O6>pAi@i;`a_iQV$0dB9m9Oo-Dvr{7
z%U1nb=^(F70J{q*{j=Wop9d*HQ*X3<Y5rR|5SW)oo+UW$Z#cb$Jp?DMZ@)|%e++jO
zG|^))g%gMKz@t-*`zBFt{>N+Ut^YGPTwC8FkBlGFp1%$M^KuCsvX&S1F3A|7aQn##
zTX#O$*Y`;_1Eo@Sz~EqqWdZ7BhANkJ)Y{7@5<Q!hz5L1A_b+;+yl8sGmMvS*5s^6@
zBWbrEG6iQlYt>mN(VV(GJ}JEHaAPW4(fY>0Cc^I!;+R3_lWj27Y!)KF`m}OvVGLs7
zAC-Hu05tl|7$|tK#QgGt#kNhyT9jRL&N7daO=L@Rh|ZshSD?0Y#+Vp)1BR@RNlF?P
zB$x^L{iRenDrEA8{b#-M;&#mt-jiQX;`8Z#h3&EQzZx268#?ocF%OU$$|urB{`hvN
zQRNfaAoWdh%yh-O;u>K*NVR#VV)Lu<pZ<O@t)a_OEs&F(zA3!*ZWAgw{ZO--Xx%Hf
zwNWrV4)}rg12x(!idX%|b}POT^O|2PX0<SX`f@R!B`!gkU)9(eR7U;8=(>mE_$pk;
z>k(8%63GO`iu+0ZR@i=rW13&0U@-CLhz6#UElP3jn^XPAx3-2TCS!`ht;^1>Y2rE~
zS^sgJg`c#`xV@&LD+{MvMBV&>gvevR6^|=H7_N!!j$&aKj2%|kZexDfxV-u8zW&El
zi&Myei{_Qbn}@9sv&>}{Eq|*=VeZ398aun&+#}*8y{deSw!+#bdme0xhjr^(5$%|!
zjh*~WM&9z1rY3Ag{};<e*v;HB?GG(N_w+7=W>MWk=mXF>;yLtdvjmEpot>#-SCmMS
zWr{K1aYNyiOw)EnMKQ&hiHH6h)0Wp3J%bJpA-cC1I!$jzy~1Pqxg#!qFdkLSXj@3X
z*NVG-pTf5MSo44FUiMa<M9Bw}|8mJ9JRt=2)|*WV3SR*8E<v`H&1GY6de#?>Amwk|
z;s5;j%5tObx2V$FX{m;Jkv=Lrv}HAP)rSw#xcd(IBFVQ%@t+?dDwr|ZCsi_JZ>L2X
z{)DSoVGk7r1=fZNUUU}P!uiK0ga<T!Wjnv`^1mOiVmh7mWkN$&$nZGcMc;WLwz-J*
zNMm~54HWqUc7|C0|Ec);!$Gtx&`Sr2!$FmxFSv2BE*8C^4}q00RwngOTj+k$>mWJ)
zEr9%ZTLrtemo8ss$*tB7OU60$N=5WDL4UMX@RUPWRMDA8T!rw2R_M1LqecI8KKT9S
z6&TLz^Wy<|C#-&PJv~Q73-$%8WJpfJIr^j_iDXoeenBSNq<qTjhU!&Vbw8reHVEdQ
zS#Xa2r?SJ>h$nowf@?)ZDO5IMOz`*cXv;ZApEQJ};Y53kR}g%2xeG%E{&=Z3f>ep7
zYdJZU@&WzG|HWq6MmA_r#BJNwK}%pQGcT~?A$S)w3ePFz42oK0JVEX|WQgo;_Kxqd
zHb`*YqU_KVqYg<ufBx4{GvVrd|5eGpvVVoS?rY)(^_OE>6<5EM3rPbcY7iW4ISlb*
zTK(sf;(I@bqlHdD91b@YhYmtQ+?f8~UsS<vJ7q0Q?48OE_V&W&BV?4#Hzl11071an
z3m5)Y7Pd67^-JTob>A69GDpl8>tQRxENiDF02M6on>jN!b-fU<WI|CzYg)OjC48AS
z3LB@Pt^IDs<d1rYdRTZ=o>+HMRW+bP5y<4%fhh<Y(~}neIDJ7kxd9*;z@Ne$>VmU2
zJDh{s3QeWmGI*yjv=5Tt(MWs`l|J1&JZB%zext?OT8Gb`y?6C$pCLo+9*_U&Vq^tQ
z%-lId1bxNy;eQ(kJD4BZF!%IcxXDR+=HDc$cBTwi7_zC+EwbNs*RJ0&LME^w=$4Hc
z#9Oa@;N;;UAPZb{bNx<~Lo^%df-y%2A+I)b4-5_I#28EV?AC2Sr!D;T&C)6q<^F%G
zw^gtMJ3F_1doCQDtFwk`c~SFF#8WLDuUh+kx~lMD$k3tGLd)@^HPys2DmA$JNP2oY
z>tQxtwqG_!c%NkLF=HNHzAT)Ag3C-EXHwF9%KVy_v@FccXG3tO8s`S}6*K>43XL>m
zBCWvV*q=<-N3zxn1fGe8V@EopU>L8ohThl8W?1V8FV8Q#Lj+hXvnnwCD!5GB!pI$o
zp-q~-&@sp&EVR#2LGtHqTKy!jjE}n}T@!pA7PmAM1!FizoQ+V+-r8ai8f<8P8ab$y
z>DEcTccP0G=m|ozAZ+6mYH@1ctnGh&KV^1F@Bx6U5FG4vJ3`!YMa;&EirX@KouG|E
zOo(a4m3@o?h+bT_k<RQ9PBMgqkV7pePnH6`f4Fzn?$f7-R|?<>eQzF}*oTR26qIh!
z&rrG^I(SgFk)b@D131&v8&AI9g0&$6pa=nt;fBr!-k)T+wNgpYHJeUiHZF8>G!j?1
zhvLg6HhYGk#=A_e<l^#Ah%WwY7yxqs{VOmheNl)fx+WdLa;%c2m>ObMzyN{?6f%!p
zjEdjj<|kCiPSHO+9PB(5LoabWtDC7cY(L=4#1rp0gnN~@T&0FjW#Gm&0{oG!XIcQ>
zqk*qz$n2KWJjawlG*0<Xsa)+kB2(c?8}h`lwPgw=astO-6^b1}JP6yLv6uk=$ApGn
zrS_cf>wEM;zz-Q(WhBB>8jdMZ1`{6t+582s!0Ca#hm@y62Vj$OX4%rEj7t2zvgKm5
zSgg((zS}Uv#;y5c(@WT%#WjzP7MPIlJO?U35aOeu-2u44Tj1#SeS7vS4-TfoJq*~S
zH%|9^JbPk|6Ot!Oh?cJz6#0;@%r9D-H%1iaHuxl*!J?w67cwk+;{cp+R~H@jTy~@<
zL_TrT?EnsW)_L>gWQXp@B~KS6s7-BK<cBVo9ZI5y_&(jgFDQD6F@+jm1MVJ>1YtQH
z*d3hQA=?Aa2`h_^(9a{88jffZdCl<QWs8g|H~+3sxz<9vq`D4b6GvG9k}NHkS3lco
z*?U$k#;DUSEI-LERkoxL4E^)_$^N7Y7WftjX!FN~bV#IxxS-8o-U7+hZSW}i7qW}`
z+a{hmpbpVXHIBH)xh3Ao9_#$2M(zWymi+f?x%Y67=OJ#WukWBS{Q8|cDl1~Y9)CMP
zdPc`=OTq%qO*g-T!dm4^<x8+P1Olcbj)B+`|2!|Q@J`E#6>h46Lb{&NhVkHRe*E=y
z{-#d_je+l}udK)oU%zf057zEIdt5v`j=#CBU^<`i4_sXX<TE@ZbQwh+Cm&`#PuQ2=
z@{&9Zas0&xbo*6b3|&?tso9HDc(Mm7M2Cbg%$^HPCQwww6&`rv=G3<3K7DLT4%le)
z+xi(@Hk@y#c<{zHyWGWR$E5zT=h&gRFNrfN-W%^X9ozWJw5#{^ZaFXh{fwUUkqIC8
z;=q@wXYRWBXP@exd1uAH9~)Ox4IK12Wq025Q}d@K7(O>{>Y6z8+UIFMzVef>;*77;
z)8>zByrKS^-50+<Sn!Qf#BY?P-yD$m&D#F|^)|DRf9nAGD^08Ksh!{1|JaeOps;E5
YPZf=B{%_`FG=G9g6Q)=kH=D8Uf82kiIRF3v


From ee5f2ad7f0e8122b6e1d5fcaa62fe3f7c0d6a320 Mon Sep 17 00:00:00 2001
From: Thomas Parnell <tpa@zurich.ibm.com>
Date: Thu, 2 Oct 2025 16:14:28 +0200
Subject: [PATCH 091/193] Change size of single CUDA graph for CI to 4 (#26089)

Signed-off-by: Thomas Parnell <tpa@zurich.ibm.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/conftest.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/tests/conftest.py b/tests/conftest.py
index e3e412f90af5..66106d1bf779 100644
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -732,7 +732,7 @@ def __init__(
                     set_default_torch_num_threads(default_torch_num_threads))
 
         if not kwargs.get("compilation_config", None):
-            kwargs["compilation_config"] = {"cudagraph_capture_sizes": [8]}
+            kwargs["compilation_config"] = {"cudagraph_capture_sizes": [4]}
 
         with init_ctx:
             self.llm = LLM(

From eeb4b156c9d87624bb14224d8601b33944a113cc Mon Sep 17 00:00:00 2001
From: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Date: Thu, 2 Oct 2025 11:06:14 -0400
Subject: [PATCH 092/193] [FA/Chore] Bump vllm-flash-attention (#25537)

Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 cmake/external_projects/vllm_flash_attn.cmake | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/cmake/external_projects/vllm_flash_attn.cmake b/cmake/external_projects/vllm_flash_attn.cmake
index 3d32121f13ac..e6686275cabb 100644
--- a/cmake/external_projects/vllm_flash_attn.cmake
+++ b/cmake/external_projects/vllm_flash_attn.cmake
@@ -38,7 +38,7 @@ else()
   FetchContent_Declare(
           vllm-flash-attn
           GIT_REPOSITORY https://github.com/vllm-project/flash-attention.git
-          GIT_TAG ee4d25bd84e0cbc7e0b9b9685085fd5db2dcb62a
+          GIT_TAG 4695e6bed5366c41e28c06cd86170166e4f43d00
           GIT_PROGRESS TRUE
           # Don't share the vllm-flash-attn build between build types
           BINARY_DIR ${CMAKE_BINARY_DIR}/vllm-flash-attn

From ff8945d094ea104e3ed364aab65a37838d523a94 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Thu, 2 Oct 2025 23:17:31 +0800
Subject: [PATCH 093/193] [Model] Use `merge_by_field_config` for MM models
 (A-C) (#26073)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/aria.py           | 19 +++++++++++++------
 vllm/model_executor/models/aya_vision.py     |  7 ++++---
 vllm/model_executor/models/blip2.py          | 13 ++++---------
 vllm/model_executor/models/chameleon.py      |  7 ++++---
 vllm/model_executor/models/cohere2_vision.py |  7 ++++---
 5 files changed, 29 insertions(+), 24 deletions(-)

diff --git a/vllm/model_executor/models/aria.py b/vllm/model_executor/models/aria.py
index 82f35d889605..e4a11a3d4a51 100644
--- a/vllm/model_executor/models/aria.py
+++ b/vllm/model_executor/models/aria.py
@@ -1,7 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from collections.abc import Iterable, Mapping, Sequence
-from typing import Annotated, Optional, Union
+from typing import Annotated, Literal, Optional, Union
 
 import torch
 import torch.nn as nn
@@ -38,8 +38,8 @@
 # yapf: enable
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsQuant
 from .llama import LlamaDecoderLayer, LlamaMLP, LlamaModel
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
-                    is_pp_missing_parameter, maybe_prefix)
+from .utils import (AutoWeightsLoader, WeightsMapper, is_pp_missing_parameter,
+                    maybe_prefix)
 
 
 class AriaImagePixelInputs(TensorSchema):
@@ -52,6 +52,8 @@ class AriaImagePixelInputs(TensorSchema):
         - w: Width of each image
     """
 
+    type: Literal["pixel_values"]
+
     pixel_values: Annotated[
         torch.Tensor,
         TensorShape("bn", 3, "h", "w"),
@@ -485,6 +487,8 @@ class AriaForConditionalGeneration(nn.Module, SupportsMultiModal):
     This model combines a vision tower, a multi-modal projector, and a language
     model to perform tasks that involve both image and text inputs.
     """
+    merge_by_field_config = True
+
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_prefix={
             # mapping for new names in checkpoint saved after transformers v4.52
@@ -551,12 +555,15 @@ def _parse_and_validate_image_input(
             return None
 
         return AriaImagePixelInputs(
-            pixel_values=flatten_bn(pixel_values, concat=True),
-            pixel_mask=flatten_bn(pixel_mask, concat=True),
+            type="pixel_values",
+            pixel_values=pixel_values,
+            pixel_mask=pixel_mask,
         )
 
     def _create_patch_attention_mask(
-            self, pixel_mask: Optional[torch.Tensor]) -> torch.Tensor:
+        self,
+        pixel_mask: Optional[torch.Tensor],
+    ) -> Optional[torch.Tensor]:
         if pixel_mask is None:
             return None
 
diff --git a/vllm/model_executor/models/aya_vision.py b/vllm/model_executor/models/aya_vision.py
index 81bab5b34bc6..04100fb8c412 100644
--- a/vllm/model_executor/models/aya_vision.py
+++ b/vllm/model_executor/models/aya_vision.py
@@ -31,7 +31,7 @@
 
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
 from .siglip import SiglipVisionModel
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
+from .utils import (AutoWeightsLoader, WeightsMapper,
                     init_vllm_registered_model, maybe_prefix)
 
 
@@ -295,6 +295,7 @@ def _get_layer_index(feature_layer_index: int, num_hidden_layers: int) -> int:
     dummy_inputs=AyaVisionDummyInputsBuilder)
 class AyaVisionForConditionalGeneration(nn.Module, SupportsMultiModal,
                                         SupportsPP):
+    merge_by_field_config = True
 
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_prefix={
@@ -379,8 +380,8 @@ def _parse_and_validate_image_input(
 
         return AyaVisionImagePixelInputs(
             type="pixel_values",
-            pixel_values=flatten_bn(pixel_values, concat=True),
-            num_patches=flatten_bn(num_patches, concat=True),
+            pixel_values=pixel_values,
+            num_patches=num_patches,
             resolve_bindings={
                 "h": self.config.vision_config.image_size,
                 "w": self.config.vision_config.image_size,
diff --git a/vllm/model_executor/models/blip2.py b/vllm/model_executor/models/blip2.py
index 334743a7358c..940d39c7a67c 100644
--- a/vllm/model_executor/models/blip2.py
+++ b/vllm/model_executor/models/blip2.py
@@ -26,12 +26,7 @@
 from .blip import BlipVisionModel
 from .interfaces import (MultiModalEmbeddings, SupportsMultiModal, SupportsPP,
                          SupportsQuant)
-from .utils import (AutoWeightsLoader, flatten_bn, init_vllm_registered_model,
-                    maybe_prefix)
-
-# We use this internally as placeholders since there is no image token
-# defined on the HuggingFace repo
-_IMAGE_TOKEN_ID = 50265
+from .utils import AutoWeightsLoader, init_vllm_registered_model, maybe_prefix
 
 
 class Blip2ImagePixelInputs(TensorSchema):
@@ -514,6 +509,7 @@ def _get_prompt_updates(
                                         dummy_inputs=Blip2DummyInputsBuilder)
 class Blip2ForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP,
                                     SupportsQuant):
+    merge_by_field_config = True
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -570,8 +566,7 @@ def _parse_and_validate_image_input(
         if pixel_values is not None:
             expected_h = expected_w = self.config.vision_config.image_size
             return Blip2ImagePixelInputs(type="pixel_values",
-                                         data=flatten_bn(pixel_values,
-                                                         concat=True),
+                                         data=pixel_values,
                                          resolve_bindings={
                                              "h": expected_h,
                                              "w": expected_w
@@ -580,7 +575,7 @@ def _parse_and_validate_image_input(
         if image_embeds is not None:
             return Blip2ImageEmbeddingInputs(
                 type="image_embeds",
-                data=flatten_bn(image_embeds, concat=True),
+                data=image_embeds,
             )
 
         raise AssertionError("This line should be unreachable.")
diff --git a/vllm/model_executor/models/chameleon.py b/vllm/model_executor/models/chameleon.py
index 86dbf63fa5df..4999f7904b14 100644
--- a/vllm/model_executor/models/chameleon.py
+++ b/vllm/model_executor/models/chameleon.py
@@ -42,7 +42,7 @@
 
 from .interfaces import (MultiModalEmbeddings, SupportsMultiModal, SupportsPP,
                          SupportsQuant)
-from .utils import (flatten_bn, is_pp_missing_parameter,
+from .utils import (is_pp_missing_parameter,
                     make_empty_intermediate_tensors_factory, make_layers,
                     maybe_prefix)
 
@@ -935,6 +935,8 @@ def forward(
     dummy_inputs=ChameleonDummyInputsBuilder)
 class ChameleonForConditionalGeneration(nn.Module, SupportsMultiModal,
                                         SupportsPP, SupportsQuant):
+    merge_by_field_config = True
+
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
         "gate_up_proj": ["gate_proj", "up_proj"]
@@ -981,8 +983,7 @@ def _parse_and_validate_image_input(
         expected_h = expected_w = vq_config.resolution
 
         return ChameleonImagePixelInputs(type="pixel_values",
-                                         data=flatten_bn(pixel_values,
-                                                         concat=True),
+                                         data=pixel_values,
                                          resolve_bindings={
                                              "h": expected_h,
                                              "w": expected_w
diff --git a/vllm/model_executor/models/cohere2_vision.py b/vllm/model_executor/models/cohere2_vision.py
index 7162571c08d9..78a7f0a52c72 100644
--- a/vllm/model_executor/models/cohere2_vision.py
+++ b/vllm/model_executor/models/cohere2_vision.py
@@ -36,7 +36,7 @@
 
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
 from .siglip import SiglipVisionModel
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
+from .utils import (AutoWeightsLoader, WeightsMapper,
                     init_vllm_registered_model, maybe_prefix)
 
 
@@ -317,6 +317,7 @@ def get_replacement(item_idx: int):
     dummy_inputs=Cohere2VisionDummyInputsBuilder)
 class Cohere2VisionForConditionalGeneration(nn.Module, SupportsMultiModal,
                                             SupportsPP):
+    merge_by_field_config = True
 
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_prefix={
@@ -399,8 +400,8 @@ def _parse_and_validate_image_input(
 
         return Cohere2VisionImagePixelInputs(
             type="pixel_values",
-            pixel_values=flatten_bn(pixel_values, concat=True),
-            num_patches=flatten_bn(num_patches, concat=True),
+            pixel_values=pixel_values,
+            num_patches=num_patches,
             resolve_bindings={
                 "h": self.config.vision_config.image_size,
                 "w": self.config.vision_config.image_size,

From 635f2773b129fb28fcb7a24f8f923053dd9714b1 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Thu, 2 Oct 2025 23:17:35 +0800
Subject: [PATCH 094/193] [Model] Use `merge_by_field_config` for MM models
 (D-F) (#26076)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/deepseek_vl2.py | 58 +++++++----------
 vllm/model_executor/models/dots_ocr.py     | 75 +++++++--------------
 vllm/model_executor/models/ernie45_vl.py   | 76 +++++++---------------
 vllm/model_executor/models/fuyu.py         | 67 ++++++++-----------
 4 files changed, 99 insertions(+), 177 deletions(-)

diff --git a/vllm/model_executor/models/deepseek_vl2.py b/vllm/model_executor/models/deepseek_vl2.py
index 0f87fb34bf32..3e3b4e59f833 100644
--- a/vllm/model_executor/models/deepseek_vl2.py
+++ b/vllm/model_executor/models/deepseek_vl2.py
@@ -20,8 +20,7 @@
 from vllm.model_executor.models.transformers import replace_linear_class
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems, MultiModalUUIDDict,
-                                    NestedTensors)
+                                    MultiModalKwargsItems, MultiModalUUIDDict)
 from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
                                    ImageSize, MultiModalDataItems)
 from vllm.multimodal.processing import (BaseMultiModalProcessor,
@@ -40,7 +39,7 @@
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
+from .utils import (AutoWeightsLoader, WeightsMapper,
                     init_vllm_registered_model, maybe_prefix)
 
 # The image token id may be various
@@ -50,15 +49,15 @@
 class DeepseekVL2ImagePixelInputs(TensorSchema):
     """
     Dimensions:
-        - bn: Batch size * number of images
+        - bnp: Batch size * number of images * number of patches
         - p: Number of patches
         - c: Number of channels (3)
         - h: Height of each image
         - w: Width of each image
     """
     type: Literal["pixel_values"]
-    data: Annotated[Union[torch.Tensor, list[torch.Tensor]],
-                    TensorShape("bn", "p", 3, "h", "w", dynamic_dims={"p"})]
+    data: Annotated[torch.Tensor,
+                    TensorShape("bnp", 3, "h", "w", dynamic_dims={"bnp"})]
     images_spatial_crop: Annotated[torch.Tensor, TensorShape("bn", 2)]
 
 
@@ -228,12 +227,8 @@ def _call_hf_processor(
             tok_kwargs=tok_kwargs,
         )
 
-        pixel_values = processed_outputs["pixel_values"]
-        # split pixel values into patches corresponding to each image
-        images_spatial_crop = processed_outputs["images_spatial_crop"]
-        patches_per_image = [x.prod().item() + 1 for x in images_spatial_crop]
-        pixel_values = pixel_values.split(patches_per_image)
-        processed_outputs["pixel_values"] = pixel_values
+        processed_outputs["num_patches"] = (
+            processed_outputs["images_spatial_crop"].prod(-1) + 1)
 
         return processed_outputs
 
@@ -242,8 +237,11 @@ def _get_mm_fields_config(
         hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
+        num_patches = hf_inputs.get("num_patches", torch.empty(0))
+
         return dict(
-            pixel_values=MultiModalFieldConfig.batched("image"),
+            pixel_values=MultiModalFieldConfig.flat_from_sizes(
+                "image", num_patches),
             images_spatial_crop=MultiModalFieldConfig.batched("image"),
             image_embeds=MultiModalFieldConfig.batched("image"),
         )
@@ -318,6 +316,7 @@ def _cached_apply_hf_processor(
     info=DeepseekVL2ProcessingInfo,
     dummy_inputs=DeepseekVL2DummyInputsBuilder)
 class DeepseekVLV2ForCausalLM(nn.Module, SupportsMultiModal, SupportsPP):
+    merge_by_field_config = True
 
     hf_to_vllm_mapper = WeightsMapper(orig_to_new_prefix={
         "language.": "language_model.",
@@ -460,37 +459,30 @@ def _parse_and_validate_image_input(
 
         if pixel_values is not None:
             expected_h = expected_w = self.vision_config.image_size
-            return DeepseekVL2ImagePixelInputs(type="pixel_values",
-                                               data=flatten_bn(pixel_values),
-                                               images_spatial_crop=flatten_bn(
-                                                   images_spatial_crop,
-                                                   concat=True),
-                                               resolve_bindings={
-                                                   "h": expected_h,
-                                                   "w": expected_w,
-                                               })
+            return DeepseekVL2ImagePixelInputs(
+                type="pixel_values",
+                data=pixel_values,
+                images_spatial_crop=images_spatial_crop,
+                resolve_bindings={
+                    "h": expected_h,
+                    "w": expected_w,
+                })
 
         if image_embeds is not None:
             return DeepseekVL2VImageEmbeddingInputs(
                 type="image_embeds",
-                data=flatten_bn(image_embeds),
+                data=image_embeds,
             )
 
         raise AssertionError("This line should be unreachable.")
 
     def _pixel_values_to_embedding(
         self,
-        pixel_values: NestedTensors,
+        pixel_values: torch.Tensor,
         images_spatial_crop: torch.Tensor,
-    ) -> NestedTensors:
-        # Pixel_values: n_image * batch_size * [patch_per_img, 3, height, width]
-        total_tiles = [x for x in pixel_values]
-
-        # [batch_all_tiles, 3, height, width]
-        total_tiles = torch.cat(total_tiles, dim=0)
-
+    ) -> list[torch.Tensor]:
         # [batch_all_tiles, vit_seq_len, c]
-        images_feature = self.vision.forward_features(total_tiles)
+        images_feature = self.vision.forward_features(pixel_values)
 
         # [batch_all_tiles, hw, D]
         images_embeds = self.projector(images_feature)
@@ -573,7 +565,7 @@ def _pixel_values_to_embedding(
         return vision_embeddings
 
     def _process_image_input(
-            self, image_input: DeepseekVL2ImageInputs) -> torch.Tensor:
+            self, image_input: DeepseekVL2ImageInputs) -> list[torch.Tensor]:
         if image_input["type"] == "image_embeds":
             image_data = image_input["data"]
             if is_list_of(image_data, torch.Tensor):
diff --git a/vllm/model_executor/models/dots_ocr.py b/vllm/model_executor/models/dots_ocr.py
index 4845f19bcbc4..e68777aab6bf 100644
--- a/vllm/model_executor/models/dots_ocr.py
+++ b/vllm/model_executor/models/dots_ocr.py
@@ -1,7 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from collections.abc import Iterable, Mapping
-from typing import Literal, Optional, TypedDict, Union
+from typing import Annotated, Literal, Optional, Union
 
 import torch
 import torch.nn as nn
@@ -42,34 +42,38 @@
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs.dotsocr import (DotsOCRConfig,
                                                      DotsVisionConfig)
+from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .vision import run_dp_sharded_mrope_vision_model
 
 IMAGE_TOKEN = "<|imgpad|>"
 
 
-class DotsOCRImagePixelInputs(TypedDict):
-    type: Literal["pixel_values", "image_grid_thw"]
+class DotsOCRImagePixelInputs(TensorSchema):
+    """
+    Dimensions:
+        - np: The total number of patches over each image over each prompt in
+              the batch
+        - ni: Number of images
+        - cps: Number of channels * patch_size * patch_size
+    """
+    type: Literal["pixel_values"]
 
-    pixel_values: torch.Tensor
-    image_grid_thw: torch.Tensor
+    pixel_values: Annotated[torch.Tensor, TensorShape("np", "cps")]
+    image_grid_thw: Annotated[torch.Tensor, TensorShape("ni", 3)]
 
 
-class DotsOCRImageEmbeddingInputs(TypedDict):
-    type: Literal["image_embeds", "image_grid_thw"]
-    image_embeds: torch.Tensor
-    """Supported types:
-    - List[`torch.Tensor`]: A list of tensors holding all images' features.
-        Each tensor holds an image's features.
-    - `torch.Tensor`: A tensor holding all images' features
-        (concatenation of all images' feature tensors).
-    Tensor shape: `(num_image_features, hidden_size)`
-    - `num_image_features` varies based on
-        the number and resolution of the images.
-    - `hidden_size` must match the hidden size of language model backbone.
+class DotsOCRImageEmbeddingInputs(TensorSchema):
     """
+    Dimensions:
+        - nf: Number of image features
+        - hs: Hidden size
+        - ni: Number of images
+    """
+    type: Literal["image_embeds"]
 
-    image_grid_thw: torch.Tensor
+    image_embeds: Annotated[torch.Tensor, TensorShape("nf", "hs")]
+    image_grid_thw: Annotated[torch.Tensor, TensorShape("ni", 3)]
 
 
 DotsOCRImageInputs = Union[DotsOCRImagePixelInputs,
@@ -654,6 +658,8 @@ def forward(self, hidden_states: torch.Tensor,
 )
 class DotsOCRForCausalLM(nn.Module, SupportsMultiModal, SupportsPP,
                          SupportsLoRA):
+    merge_by_field_config = True
+
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_substr={
             ".attn.qkv_proj.": ".attn.qkv.",
@@ -709,22 +715,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             architectures=["Qwen2ForCausalLM"],
         )
 
-    def _validate_and_reshape_mm_tensor(self, mm_input: object,
-                                        name: str) -> torch.Tensor:
-        if not isinstance(mm_input, (torch.Tensor, list)):
-            raise ValueError(f"Incorrect type of {name}. "
-                             f"Got type: {type(mm_input)}")
-        if isinstance(mm_input, torch.Tensor):
-            if mm_input.ndim == 2:
-                return mm_input
-            if mm_input.ndim != 3:
-                raise ValueError(f"{name} should be 2D or batched 3D tensor. "
-                                 f"Got ndim: {mm_input.ndim} "
-                                 f"(shape={mm_input.shape})")
-            return torch.concat(list(mm_input))
-        else:
-            return torch.concat(mm_input)
-
     def _parse_and_validate_image_input(
             self, **kwargs: object) -> Optional[DotsOCRImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
@@ -735,28 +725,11 @@ def _parse_and_validate_image_input(
             return None
 
         if pixel_values is not None:
-            pixel_values = self._validate_and_reshape_mm_tensor(
-                pixel_values, "image pixel values")
-            image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, "image grid_thw")
-
-            if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image pixel values. "
-                                 f"Got type: {type(pixel_values)}")
-
             return DotsOCRImagePixelInputs(type="pixel_values",
                                            pixel_values=pixel_values,
                                            image_grid_thw=image_grid_thw)
 
         if image_embeds is not None:
-            image_embeds = self._validate_and_reshape_mm_tensor(
-                image_embeds, "image embeds")
-            image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, "image grid_thw")
-
-            if not isinstance(image_embeds, torch.Tensor):
-                raise ValueError("Incorrect type of image embeddings. "
-                                 f"Got type: {type(image_embeds)}")
             return DotsOCRImageEmbeddingInputs(type="image_embeds",
                                                image_embeds=image_embeds,
                                                image_grid_thw=image_grid_thw)
diff --git a/vllm/model_executor/models/ernie45_vl.py b/vllm/model_executor/models/ernie45_vl.py
index a73ec4f88ffe..c62658fa4c21 100644
--- a/vllm/model_executor/models/ernie45_vl.py
+++ b/vllm/model_executor/models/ernie45_vl.py
@@ -25,7 +25,7 @@
 import math
 from collections.abc import Iterable, Mapping, Sequence
 from functools import partial
-from typing import Any, Callable, Literal, Optional, TypedDict, Union
+from typing import Annotated, Any, Callable, Literal, Optional, Union
 
 import numpy as np
 import torch
@@ -56,6 +56,7 @@
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.platforms import _Backend, current_platform
 from vllm.sequence import IntermediateTensors
+from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .ernie45_vl_moe import Ernie4_5_VLMoeForCausalLM
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
@@ -579,38 +580,38 @@ def load_weights(self, weights) -> set[str]:
 # === Vision Inputs === #
 
 
-class Ernie4_5_VLImagePixelInputs(TypedDict):
-    type: Literal["pixel_values"]
-    pixel_values: torch.Tensor
-    """Shape:
-    `(num_patches, num_channels * patch_size * patch_size)`
+class Ernie4_5_VLImagePixelInputs(TensorSchema):
     """
-
-    grid_thw: torch.Tensor
-    """Shape: `(num_images, 3)`
-    This should be in `(grid_t, grid_h, grid_w)` format.
+    Dimensions:
+        - np: The total number of patches over each image over each prompt in
+              the batch
+        - ni: Number of images
+        - cps: Number of channels * patch_size * patch_size
     """
+    type: Literal["pixel_values"]
+
+    pixel_values: Annotated[torch.Tensor, TensorShape("np", "cps")]
+    image_grid_thw: Annotated[torch.Tensor, TensorShape("ni", 3)]
 
 
 Ernie4_5_VLImageInputs = Ernie4_5_VLImagePixelInputs
 
 
-class Ernie4_5_VLVideoPixelInputs(TypedDict):
-    type: Literal["pixel_values_videos"]
-    pixel_values_videos: torch.Tensor
-    """Shape:
-    `(num_patches,
-      num_channels * temporal_patch_size * patch_size * patch_size)`
+class Ernie4_5_VLVideoPixelInputs(TensorSchema):
     """
-
-    video_grid_thw: torch.Tensor
-    """Shape: `(num_videos, 3)`
-
-    This should be in `(grid_t, grid_h, grid_w)` format.
+    Dimensions:
+        - np: The total number of patches over each image over each prompt in
+              the batch
+        - ni: Number of images
+        - cps: Number of channels * temporal_patch_size * patch_size *
+              patch_size
     """
+    type: Literal["pixel_values_videos"]
+    pixel_values_videos: Annotated[torch.Tensor, TensorShape("np", "cps")]
+    video_grid_thw: Annotated[torch.Tensor, TensorShape("ni", 3)]
 
 
-Ernie4_5_VLVideoInputs = Ernie4_5_VLImagePixelInputs
+Ernie4_5_VLVideoInputs = Ernie4_5_VLVideoPixelInputs
 
 # === Vision Processor === #
 
@@ -1213,6 +1214,7 @@ def get_dummy_mm_data(
     dummy_inputs=Ernie4_5_VLDummyInputsBuilder)
 class Ernie4_5_VLMoeForConditionalGeneration(nn.Module, SupportsMultiModal,
                                              SupportsLoRA, SupportsPP):
+    merge_by_field_config = True
 
     packed_modules_mapping = {
         "qkv_proj": [
@@ -1325,22 +1327,6 @@ def _set_visual_token_mask(self, input_ids: torch.Tensor) -> None:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def _validate_and_reshape_mm_tensor(self, mm_input: object,
-                                        name: str) -> torch.Tensor:
-        if not isinstance(mm_input, (torch.Tensor, list)):
-            raise ValueError(f"Incorrect type of {name}. "
-                             f"Got type: {type(mm_input)}")
-        if isinstance(mm_input, torch.Tensor):
-            if mm_input.ndim == 2:
-                return mm_input
-            if mm_input.ndim != 3:
-                raise ValueError(f"{name} should be 2D or batched 3D tensor. "
-                                 f"Got ndim: {mm_input.ndim} "
-                                 f"(shape={mm_input.shape})")
-            return mm_input.reshape(-1, mm_input.shape[-1])
-        else:
-            return torch.concat(mm_input)
-
     def _parse_and_validate_image_input(
             self, **kwargs: object) -> Optional[Ernie4_5_VLImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
@@ -1350,15 +1336,6 @@ def _parse_and_validate_image_input(
             return None
 
         if pixel_values is not None:
-            pixel_values = self._validate_and_reshape_mm_tensor(
-                pixel_values, "image pixel values")
-            image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, "image grid_thw")
-
-            if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image pixel values. "
-                                 f"Got type: {type(pixel_values)}")
-
             return Ernie4_5_VLImagePixelInputs(type="pixel_values",
                                                pixel_values=pixel_values,
                                                image_grid_thw=image_grid_thw)
@@ -1372,11 +1349,6 @@ def _parse_and_validate_video_input(
             return None
 
         if pixel_values_videos is not None:
-            pixel_values_videos = self._validate_and_reshape_mm_tensor(
-                pixel_values_videos, "video pixel values")
-            video_grid_thw = self._validate_and_reshape_mm_tensor(
-                video_grid_thw, "video grid_thw")
-
             return Ernie4_5_VLVideoPixelInputs(
                 type="pixel_values_videos",
                 pixel_values_videos=pixel_values_videos,
diff --git a/vllm/model_executor/models/fuyu.py b/vllm/model_executor/models/fuyu.py
index 9e491c0b50d2..2ab2cf9b17b3 100644
--- a/vllm/model_executor/models/fuyu.py
+++ b/vllm/model_executor/models/fuyu.py
@@ -59,17 +59,14 @@ class FuyuImagePatchInputs(TensorSchema):
 
     type: Literal["image_patches"] = "image_patches"
 
-    flat_data: Annotated[
-        torch.Tensor,
-        TensorShape("bnp", "fn"),
-    ]
+    image_patches_flat: Annotated[torch.Tensor, TensorShape("bnp", "fn")]
 
     patches_per_image: Annotated[list[int], TensorShape("bn")]
     """
     The number of total patches for each image in the batch.
     
     This is used to split the embeddings which has the first two dimensions
-    flattened just like `flat_data`.
+    flattened just like `image_patches_flat`.
     """
 
 
@@ -174,28 +171,10 @@ def _call_hf_processor(
             tok_kwargs=tok_kwargs,
         )
 
-        image_patches = processed_outputs.get("image_patches")
-        if image_patches is not None:
-            images = mm_data["images"]
-            assert isinstance(images, list)
-
-            # Original output: (1, num_images, Pn, Px * Py * C)
-            # New output: (num_images, Pn, Px * Py * C)
-            # image_patches is a list with shape:
-            # (1, num_images, Pn, Px * Py * C)
-            # before Transformers 4.53
-            if isinstance(image_patches, list):
-                assert len(image_patches) == 1
-                assert (isinstance(image_patches[0], torch.Tensor)
-                        and len(image_patches[0]) == len(images))
-                processed_outputs["image_patches"] = image_patches[0]
-            # image_patches is a tensor with shape:
-            # (num_images, Pn, Px * Py * C)
-            # after Transformers 4.53
-            elif isinstance(image_patches, torch.Tensor):
-                assert len(image_patches) == len(images)
-            else:
-                raise AssertionError("This line should be unreachable.")
+        image_patches = processed_outputs["image_patches"]
+        processed_outputs["image_patches"] = flatten_bn(image_patches)
+        processed_outputs["patches_per_image"] = torch.tensor(
+            [len(p) for p in image_patches])
 
         return processed_outputs
 
@@ -218,7 +197,13 @@ def _get_mm_fields_config(
         hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
-        return dict(image_patches=MultiModalFieldConfig.batched("image"))
+        patches_per_image = hf_inputs.get("patches_per_image", torch.empty(0))
+
+        return dict(
+            image_patches=MultiModalFieldConfig.flat_from_sizes(
+                "image", patches_per_image),
+            patches_per_image=MultiModalFieldConfig.batched("image"),
+        )
 
     def _get_prompt_updates(
         self,
@@ -263,6 +248,7 @@ def get_replacement_fuyu(item_idx: int):
                                         info=FuyuProcessingInfo,
                                         dummy_inputs=FuyuDummyInputsBuilder)
 class FuyuForCausalLM(nn.Module, SupportsMultiModal, SupportsPP):
+    merge_by_field_config = True
 
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_prefix={
@@ -306,29 +292,28 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
     def _parse_and_validate_image_input(
             self, **kwargs: object) -> Optional[FuyuImagePatchInputs]:
         image_patches = kwargs.pop("image_patches", None)
-        if image_patches is not None:
-            image_patches_flat = flatten_bn(image_patches)
-            flat_data = flatten_bn(image_patches_flat, concat=True)
-
-            return FuyuImagePatchInputs(
-                type="image_patches",
-                flat_data=flat_data,
-                patches_per_image=[x.size(0) for x in image_patches_flat],
-                resolve_bindings={"fn": self.image_feature_size},
-            )
+        patches_per_image = kwargs.pop("patches_per_image", None)
 
-        return None
+        if image_patches is None:
+            return None
+
+        return FuyuImagePatchInputs(
+            type="image_patches",
+            image_patches_flat=image_patches,
+            patches_per_image=patches_per_image,
+            resolve_bindings={"fn": self.image_feature_size},
+        )
 
     def _process_image_input(
             self, image_input: FuyuImagePatchInputs) -> MultiModalEmbeddings:
-        image_patches_flat = image_input["flat_data"]
+        image_patches_flat = image_input["image_patches_flat"]
         patches_per_image = image_input["patches_per_image"]
 
         assert self.vision_embed_tokens is not None
         vision_embeddings_flat, _ = self.vision_embed_tokens(
             image_patches_flat)
 
-        return vision_embeddings_flat.split(patches_per_image, dim=0)
+        return vision_embeddings_flat.split(patches_per_image.tolist(), dim=0)
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model

From a77f6942905c93a18a19c8d9de8a961c2ac42c88 Mon Sep 17 00:00:00 2001
From: leo-pony <nengjunma@outlook.com>
Date: Thu, 2 Oct 2025 23:19:22 +0800
Subject: [PATCH 095/193] [Platform][CI] Added OOT platform interface e2e test
 that running on Ascend NPU (#25470)

Signed-off-by: leo-pony <nengjunma@outlook.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../scripts/hardware_ci/run-npu-test.sh       | 191 ++++++++++++++++++
 1 file changed, 191 insertions(+)
 create mode 100644 .buildkite/scripts/hardware_ci/run-npu-test.sh

diff --git a/.buildkite/scripts/hardware_ci/run-npu-test.sh b/.buildkite/scripts/hardware_ci/run-npu-test.sh
new file mode 100644
index 000000000000..29c8f5ed5a91
--- /dev/null
+++ b/.buildkite/scripts/hardware_ci/run-npu-test.sh
@@ -0,0 +1,191 @@
+#!/bin/bash
+
+# This script build the Ascend NPU docker image and run the offline inference inside the container.
+# It serves a sanity check for compilation and basic model usage.
+set -ex
+
+# Base ubuntu image with basic ascend development libraries and python installed
+VLLM_ASCEND_REPO="https://github.com/vllm-project/vllm-ascend.git"
+CONFIG_FILE_REMOTE_PATH="tests/e2e/vllm_interface/vllm_test.cfg"
+TEST_RUN_CONFIG_FILE="vllm_test.cfg"
+VLLM_ASCEND_TMP_DIR=
+# Get the test run configuration file from the vllm-ascend repository
+fetch_vllm_test_cfg() {
+    VLLM_ASCEND_TMP_DIR=$(mktemp -d)
+    # Ensure that the temporary directory is cleaned up when an exception occurs during configuration file retrieval
+    cleanup() {
+        rm -rf "${VLLM_ASCEND_TMP_DIR}"
+    }
+    trap cleanup EXIT
+
+    GIT_TRACE=1 git clone -v --depth 1 "${VLLM_ASCEND_REPO}" "${VLLM_ASCEND_TMP_DIR}"
+    if [ ! -f "${VLLM_ASCEND_TMP_DIR}/${CONFIG_FILE_REMOTE_PATH}" ]; then
+        echo "Error: file '${CONFIG_FILE_REMOTE_PATH}' does not exist in the warehouse" >&2
+        exit 1
+    fi
+
+    # If the file already exists locally, just overwrite it
+    cp "${VLLM_ASCEND_TMP_DIR}/${CONFIG_FILE_REMOTE_PATH}" "${TEST_RUN_CONFIG_FILE}"
+    echo "Copied ${CONFIG_FILE_REMOTE_PATH} to ${TEST_RUN_CONFIG_FILE}"
+
+    # Since the trap will be overwritten later, and when it is executed here, the task of cleaning up resources
+    # when the trap is abnormal has been completed, so the temporary resources are manually deleted here.
+    rm -rf "${VLLM_ASCEND_TMP_DIR}"
+    trap - EXIT
+}
+
+# Downloads test run configuration file from a remote URL.
+# Loads the configuration into the current script environment.
+get_config() {
+    if [ ! -f "${TEST_RUN_CONFIG_FILE}" ]; then
+        echo "Error: file '${TEST_RUN_CONFIG_FILE}' does not exist in the warehouse" >&2
+        exit 1
+    fi
+    source "${TEST_RUN_CONFIG_FILE}"
+    echo "Base docker image name that get from configuration: ${BASE_IMAGE_NAME}"
+    return 0
+}
+
+# get test running configuration.
+fetch_vllm_test_cfg
+get_config
+# Check if the function call was successful. If not, exit the script.
+if [ $? -ne 0 ]; then
+  exit 1
+fi
+
+image_name="npu/vllm-ci:${BUILDKITE_COMMIT}_${EPOCHSECONDS}"
+container_name="npu_${BUILDKITE_COMMIT}_$(tr -dc A-Za-z0-9 < /dev/urandom | head -c 10; echo)"
+
+# BUILDKITE_AGENT_NAME format is {hostname}-{agent_idx}-{npu_card_num}cards
+agent_idx=$(echo "${BUILDKITE_AGENT_NAME}" | awk -F'-' '{print $(NF-1)}')
+echo "agent_idx: ${agent_idx}"
+builder_name="cachebuilder${agent_idx}"
+builder_cache_dir="/mnt/docker-cache${agent_idx}"
+mkdir -p ${builder_cache_dir}
+
+# Try building the docker image
+cat <<EOF | DOCKER_BUILDKIT=1 docker build \
+    --add-host cache-service-vllm.nginx-pypi-cache.svc.cluster.local:${PYPI_CACHE_HOST} \
+    --builder ${builder_name} --cache-from type=local,src=${builder_cache_dir} \
+                           --cache-to type=local,dest=${builder_cache_dir},mode=max \
+    --progress=plain --load -t ${image_name} -f - .
+FROM ${BASE_IMAGE_NAME}
+
+# Define environments
+ENV DEBIAN_FRONTEND=noninteractive
+
+RUN pip config set global.index-url http://cache-service-vllm.nginx-pypi-cache.svc.cluster.local:${PYPI_CACHE_PORT}/pypi/simple && \
+    pip config set global.trusted-host cache-service-vllm.nginx-pypi-cache.svc.cluster.local && \
+    apt-get update -y && \
+    apt-get install -y python3-pip git vim wget net-tools gcc g++ cmake libnuma-dev && \
+    rm -rf /var/cache/apt/* && \
+    rm -rf /var/lib/apt/lists/*
+
+# Install for pytest to make the docker build cache layer always valid
+RUN --mount=type=cache,target=/root/.cache/pip \
+    pip install pytest>=6.0  modelscope
+
+WORKDIR /workspace/vllm
+
+# Install vLLM dependencies in advance. Effect: As long as common.txt remains unchanged, the docker cache layer will be valid.
+COPY requirements/common.txt /workspace/vllm/requirements/common.txt
+RUN --mount=type=cache,target=/root/.cache/pip \
+    pip install -r requirements/common.txt
+
+COPY . .
+
+# Install vLLM
+RUN --mount=type=cache,target=/root/.cache/pip \
+    VLLM_TARGET_DEVICE="empty" python3 -m pip install -v -e /workspace/vllm/ --extra-index https://download.pytorch.org/whl/cpu/ && \
+    python3 -m pip uninstall -y triton
+
+# Install vllm-ascend
+WORKDIR /workspace
+ARG VLLM_ASCEND_REPO=https://github.com/vllm-project/vllm-ascend.git
+ARG VLLM_ASCEND_TAG=main
+RUN git config --global url."https://gh-proxy.test.osinfra.cn/https://github.com/".insteadOf "https://github.com/" && \
+    git clone --depth 1 \$VLLM_ASCEND_REPO --branch \$VLLM_ASCEND_TAG /workspace/vllm-ascend
+
+# Install vllm dependencies in advance. Effect: As long as common.txt remains unchanged, the docker cache layer will be valid.
+RUN --mount=type=cache,target=/root/.cache/pip \
+    pip install -r /workspace/vllm-ascend/requirements.txt
+
+RUN --mount=type=cache,target=/root/.cache/pip \
+    export PIP_EXTRA_INDEX_URL=https://mirrors.huaweicloud.com/ascend/repos/pypi && \
+    source /usr/local/Ascend/ascend-toolkit/set_env.sh && \
+    source /usr/local/Ascend/nnal/atb/set_env.sh && \
+    export LD_LIBRARY_PATH=\$LD_LIBRARY_PATH:/usr/local/Ascend/ascend-toolkit/latest/`uname -i`-linux/devlib && \
+    python3 -m pip install -v -e /workspace/vllm-ascend/ --extra-index https://download.pytorch.org/whl/cpu/
+
+ENV VLLM_WORKER_MULTIPROC_METHOD=spawn
+ENV VLLM_USE_MODELSCOPE=True
+
+WORKDIR /workspace/vllm-ascend
+
+CMD ["/bin/bash"]
+
+EOF
+
+# Setup cleanup
+remove_docker_container() {
+  docker rm -f "${container_name}" || true;
+  docker image rm -f "${image_name}" || true;
+  docker system prune -f || true;
+}
+trap remove_docker_container EXIT
+
+# Generate corresponding --device args based on BUILDKITE_AGENT_NAME
+# Ascend NPU BUILDKITE_AGENT_NAME format is {hostname}-{agent_idx}-{npu_card_num}cards, and agent_idx starts from 1.
+#   e.g. atlas-a2-001-1-2cards means this is the 1-th agent on atlas-a2-001 host, and it has 2 NPU cards.
+#   returns --device /dev/davinci0 --device /dev/davinci1
+parse_and_gen_devices() {
+    local input="$1"
+    local index cards_num
+    if [[ "$input" =~ ([0-9]+)-([0-9]+)cards$ ]]; then
+        index="${BASH_REMATCH[1]}"
+        cards_num="${BASH_REMATCH[2]}"
+    else
+        echo "parse error" >&2
+        return 1
+    fi
+
+    local devices=""
+    local i=0
+    while (( i < cards_num )); do
+        local dev_idx=$(((index - 1)*cards_num + i ))
+        devices="$devices --device /dev/davinci${dev_idx}"
+        ((i++))
+    done
+
+    # trim leading space
+    devices="${devices#"${devices%%[![:space:]]*}"}"
+    # Output devices: assigned to the caller variable
+    printf '%s' "$devices"
+}
+
+devices=$(parse_and_gen_devices "${BUILDKITE_AGENT_NAME}") || exit 1
+
+# Run the image and execute the Out-Of-Tree (OOT) platform interface test case on Ascend NPU hardware.
+# This test checks whether the OOT platform interface is functioning properly in conjunction with
+# the hardware plugin vllm-ascend.
+model_cache_dir=/mnt/modelscope${agent_idx}
+mkdir -p ${model_cache_dir}
+docker run \
+    ${devices} \
+    --device /dev/davinci_manager \
+    --device /dev/devmm_svm \
+    --device /dev/hisi_hdc \
+    -v /usr/local/dcmi:/usr/local/dcmi \
+    -v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi \
+    -v /usr/local/Ascend/driver/lib64/:/usr/local/Ascend/driver/lib64/ \
+    -v /usr/local/Ascend/driver/version.info:/usr/local/Ascend/driver/version.info \
+    -v /etc/ascend_install.info:/etc/ascend_install.info \
+    -v ${model_cache_dir}:/root/.cache/modelscope \
+    --entrypoint="" \
+    --name "${container_name}" \
+    "${image_name}" \
+    bash -c '
+    set -e
+    pytest -v -s tests/e2e/vllm_interface/
+'

From 37c2551e3df6453bdb36d111b660c48e06eeda1a Mon Sep 17 00:00:00 2001
From: vllmellm <vllm.ellm@embeddedllm.com>
Date: Thu, 2 Oct 2025 23:26:08 +0800
Subject: [PATCH 096/193] [Qwen][ROCm] Flash Attention Rotary Embeddings
 (#24642)

Signed-off-by: vllmellm <vllm.ellm@embeddedllm.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../layers/rotary_embedding/common.py         | 23 +++++++++++++++++++
 vllm/model_executor/models/qwen2_vl.py        | 10 ++++----
 2 files changed, 28 insertions(+), 5 deletions(-)

diff --git a/vllm/model_executor/layers/rotary_embedding/common.py b/vllm/model_executor/layers/rotary_embedding/common.py
index 861965106774..4f02c996bda1 100644
--- a/vllm/model_executor/layers/rotary_embedding/common.py
+++ b/vllm/model_executor/layers/rotary_embedding/common.py
@@ -2,15 +2,21 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 import math
+from functools import cache
+from importlib.util import find_spec
+from typing import Callable
 
 import torch
 
+from vllm.logger import init_logger
 from vllm.platforms import current_platform
 from vllm.utils import direct_register_custom_op
 
 if current_platform.is_cuda():
     from vllm.vllm_flash_attn.layers.rotary import apply_rotary_emb
 
+logger = init_logger(__name__)
+
 
 # common functions
 def rotate_neox(x: torch.Tensor) -> torch.Tensor:
@@ -65,6 +71,23 @@ def apply_rotary_emb_dispatch(x: torch.Tensor, cos: torch.Tensor,
         return apply_rotary_emb_torch(x, cos, sin, is_neox_style)
 
 
+@cache
+def dispatch_rotary_emb_function() -> Callable[..., torch.Tensor]:
+    if current_platform.is_cuda():
+        return apply_rotary_emb
+
+    if current_platform.is_rocm():
+        if find_spec("flash_attn") is not None:
+            from flash_attn.ops.triton.rotary import apply_rotary
+            return apply_rotary
+        else:
+            logger.warning(
+                "flash_attn is not installed. Falling back to PyTorch "
+                "implementation for rotary embeddings.")
+
+    return apply_rotary_emb_torch
+
+
 # yarn functions
 # Inverse dim formula to find dim based on number of rotations
 def yarn_find_correction_dim(num_rotations: int,
diff --git a/vllm/model_executor/models/qwen2_vl.py b/vllm/model_executor/models/qwen2_vl.py
index f83a411459cc..38435a69444e 100644
--- a/vllm/model_executor/models/qwen2_vl.py
+++ b/vllm/model_executor/models/qwen2_vl.py
@@ -50,6 +50,8 @@
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
                                                RowParallelLinear)
 from vllm.model_executor.layers.quantization import QuantizationConfig
+from vllm.model_executor.layers.rotary_embedding.common import (
+    dispatch_rotary_emb_function)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
@@ -63,7 +65,7 @@
                                         BaseProcessingInfo, PromptReplacement,
                                         PromptUpdate)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
-from vllm.platforms import _Backend, current_platform
+from vllm.platforms import _Backend
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
@@ -272,13 +274,11 @@ def apply_rotary_emb_torch(x: torch.Tensor,
 
 def apply_rotary_pos_emb_vision(t: torch.Tensor,
                                 freqs: torch.Tensor) -> torch.Tensor:
+    rotary_emb_function = dispatch_rotary_emb_function()
     t_ = t.float()
     cos = freqs.cos()
     sin = freqs.sin()
-    apply_rotary_emb = apply_rotary_emb_torch
-    if current_platform.is_cuda():
-        from vllm.vllm_flash_attn.layers.rotary import apply_rotary_emb
-    output = apply_rotary_emb(t_, cos, sin).type_as(t)
+    output = rotary_emb_function(t_, cos, sin).type_as(t)
     return output
 
 
From 2876b003f44c52932903051398f94e7a5eede804 Mon Sep 17 00:00:00 2001
From: Michael Goin <mgoin64@gmail.com>
Date: Thu, 2 Oct 2025 12:07:19 -0400
Subject: [PATCH 097/193] [CI] Add Blackwell DeepSeek FP8 FlashInfer MoE tests
 (#26040)

Signed-off-by: mgoin <mgoin64@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/quantization/test_blackwell_moe.py | 40 +++++++++++++++++-------
 1 file changed, 29 insertions(+), 11 deletions(-)

diff --git a/tests/quantization/test_blackwell_moe.py b/tests/quantization/test_blackwell_moe.py
index c021126720af..906693a1f401 100644
--- a/tests/quantization/test_blackwell_moe.py
+++ b/tests/quantization/test_blackwell_moe.py
@@ -3,6 +3,7 @@
 
 import json
 import os
+from typing import Optional
 
 import pytest
 
@@ -20,9 +21,10 @@
 dummy_hf_overrides = {"num_layers": 4, "num_hidden_layers": 4}
 
 
-def can_initialize(model: str, extra_args: list[str]):
+def can_initialize(model: str, extra_args: Optional[list[str]] = None):
 
     # Server arguments
+    extra_args = extra_args if extra_args is not None else []
     server_args = [
         "--max-model-len",
         "2048",
@@ -65,7 +67,7 @@ def test_llama4_fp8_tensor_moe_flashinfer_cutlass(
         monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_FP8", "1")
     monkeypatch.setenv("VLLM_FLASHINFER_MOE_BACKEND", "throughput")
-    can_initialize("nvidia/Llama-4-Scout-17B-16E-Instruct-FP8", [])
+    can_initialize("nvidia/Llama-4-Scout-17B-16E-Instruct-FP8")
 
 
 @pytest.mark.skip(reason="Works, but takes too long to run")
@@ -73,21 +75,21 @@ def test_llama4_fp8_tensor_moe_flashinfer_trtllm(
         monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_FP8", "1")
     monkeypatch.setenv("VLLM_FLASHINFER_MOE_BACKEND", "latency")
-    can_initialize("nvidia/Llama-4-Scout-17B-16E-Instruct-FP8", [])
+    can_initialize("nvidia/Llama-4-Scout-17B-16E-Instruct-FP8")
 
 
 @pytest.mark.skip(reason="Works, but takes too long to run")
 def test_llama4_nvfp4_moe_flashinfer_cutlass(monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_FP4", "1")
     monkeypatch.setenv("VLLM_FLASHINFER_MOE_BACKEND", "throughput")
-    can_initialize("nvidia/Llama-4-Scout-17B-16E-Instruct-FP4", [])
+    can_initialize("nvidia/Llama-4-Scout-17B-16E-Instruct-FP4")
 
 
 @pytest.mark.skip(reason="RuntimeError: No kernel found for the given options")
 def test_llama4_nvfp4_moe_flashinfer_trtllm(monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_FP4", "1")
     monkeypatch.setenv("VLLM_FLASHINFER_MOE_BACKEND", "latency")
-    can_initialize("nvidia/Llama-4-Scout-17B-16E-Instruct-FP4", [])
+    can_initialize("nvidia/Llama-4-Scout-17B-16E-Instruct-FP4")
 
 
 ## DeepSeekV3 ##
@@ -95,21 +97,37 @@ def test_llama4_nvfp4_moe_flashinfer_trtllm(monkeypatch: pytest.MonkeyPatch):
 
 def test_deepseek_fp8_block_moe_deep_gemm(monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_DEEP_GEMM", "1")
-    can_initialize("deepseek-ai/DeepSeek-V3.1", [])
+    can_initialize("deepseek-ai/DeepSeek-V3.1")
+
+
+@pytest.mark.skip(reason=("Known issue: lack of kernel support. "
+                          "Expected failure: assert self.block_quant is None"))
+def test_deepseek_fp8_block_moe_flashinfer_cutlass(
+        monkeypatch: pytest.MonkeyPatch):
+    monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_FP8", "1")
+    monkeypatch.setenv("VLLM_FLASHINFER_MOE_BACKEND", "throughput")
+    can_initialize("deepseek-ai/DeepSeek-V3.1")
+
+
+def test_deepseek_fp8_block_moe_flashinfer_trtllm(
+        monkeypatch: pytest.MonkeyPatch):
+    monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_FP8", "1")
+    monkeypatch.setenv("VLLM_FLASHINFER_MOE_BACKEND", "latency")
+    can_initialize("deepseek-ai/DeepSeek-V3.1")
 
 
 def test_deepseek_nvfp4_moe_flashinfer_cutlass(
         monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_FP4", "1")
     monkeypatch.setenv("VLLM_FLASHINFER_MOE_BACKEND", "throughput")
-    can_initialize("nvidia/DeepSeek-R1-0528-FP4-v2", [])
+    can_initialize("nvidia/DeepSeek-R1-0528-FP4-v2")
 
 
 @pytest.mark.skip(reason="RuntimeError: No kernel found for the given options")
 def test_deepseek_nvfp4_moe_flashinfer_trtllm(monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_FP4", "1")
     monkeypatch.setenv("VLLM_FLASHINFER_MOE_BACKEND", "latency")
-    can_initialize("nvidia/DeepSeek-R1-0528-FP4-v2", [])
+    can_initialize("nvidia/DeepSeek-R1-0528-FP4-v2")
 
 
 ## GPT-OSS ##
@@ -117,16 +135,16 @@ def test_deepseek_nvfp4_moe_flashinfer_trtllm(monkeypatch: pytest.MonkeyPatch):
 
 def test_gptoss_mxfp4bf16_moe_flashinfer(monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_MXFP4_BF16", "1")
-    can_initialize("openai/gpt-oss-20b", [])
+    can_initialize("openai/gpt-oss-20b")
 
 
 def test_gptoss_mxfp4mxfp8_moe_flashinfer_cutlass(
         monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8_CUTLASS", "1")
-    can_initialize("openai/gpt-oss-20b", [])
+    can_initialize("openai/gpt-oss-20b")
 
 
 def test_gptoss_mxfp4mxfp8_moe_flashinfer_trtllm(
         monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8", "1")
-    can_initialize("openai/gpt-oss-20b", [])
+    can_initialize("openai/gpt-oss-20b")

From 16c4ce649ce3f99b2dda757293ccebb007aa4466 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Fri, 3 Oct 2025 01:04:57 +0800
Subject: [PATCH 098/193] [CI/Build] Replace
 `vllm.entrypoints.openai.api_server` entrypoint with `vllm serve` command
 (#25967)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../scripts/launch-server.sh                  |  8 +---
 .../scripts/run-performance-benchmarks.sh     |  3 +-
 .buildkite/scripts/run-benchmarks.sh          |  2 +-
 .../disagg_overhead_benchmark.sh              |  8 +---
 .../disagg_performance_benchmark.sh           | 16 ++-----
 docker/Dockerfile                             |  2 +-
 docker/Dockerfile.cpu                         |  2 +-
 docker/Dockerfile.ppc64le                     |  2 +-
 docker/Dockerfile.s390x                       |  2 +-
 docker/Dockerfile.xpu                         |  2 +-
 docs/contributing/benchmarks.md               |  6 +--
 docs/contributing/profiling.md                |  3 +-
 docs/deployment/frameworks/autogen.md         |  3 +-
 docs/deployment/frameworks/open-webui.md      |  2 +-
 docs/deployment/frameworks/skypilot.md        | 12 ++---
 docs/design/arch_overview.md                  |  5 +++
 docs/features/sleep_mode.md                   |  3 +-
 docs/features/spec_decode.md                  |  3 +-
 .../installation/gpu/xpu.inc.md               |  3 +-
 .../online_serving/sagemaker-entrypoint.sh    |  2 +-
 tests/utils_/test_utils.py                    | 44 ++++++++++++++++---
 vllm/utils/__init__.py                        | 34 +++++++++++---
 22 files changed, 101 insertions(+), 66 deletions(-)

diff --git a/.buildkite/nightly-benchmarks/scripts/launch-server.sh b/.buildkite/nightly-benchmarks/scripts/launch-server.sh
index fb5063db8694..ebacdcbd6821 100644
--- a/.buildkite/nightly-benchmarks/scripts/launch-server.sh
+++ b/.buildkite/nightly-benchmarks/scripts/launch-server.sh
@@ -181,18 +181,14 @@ launch_vllm_server() {
   if echo "$common_params" | jq -e 'has("fp8")' >/dev/null; then
     echo "Key 'fp8' exists in common params. Use neuralmagic fp8 model for convenience."
     model=$(echo "$common_params" | jq -r '.neuralmagic_quantized_model')
-    server_command="python3 \
-        -m vllm.entrypoints.openai.api_server \
+    server_command="vllm serve $model \
         -tp $tp \
-        --model $model \
         --port $port \
         $server_args"
   else
     echo "Key 'fp8' does not exist in common params."
-    server_command="python3 \
-        -m vllm.entrypoints.openai.api_server \
+    server_command="vllm serve $model \
         -tp $tp \
-        --model $model \
         --port $port \
         $server_args"
   fi
diff --git a/.buildkite/nightly-benchmarks/scripts/run-performance-benchmarks.sh b/.buildkite/nightly-benchmarks/scripts/run-performance-benchmarks.sh
index b1b7d2d77a44..34effbb6073d 100644
--- a/.buildkite/nightly-benchmarks/scripts/run-performance-benchmarks.sh
+++ b/.buildkite/nightly-benchmarks/scripts/run-performance-benchmarks.sh
@@ -365,8 +365,7 @@ run_serving_tests() {
       continue
     fi
 
-    server_command="$server_envs python3 \
-      -m vllm.entrypoints.openai.api_server \
+    server_command="$server_envs vllm serve \
       $server_args"
 
     # run the server
diff --git a/.buildkite/scripts/run-benchmarks.sh b/.buildkite/scripts/run-benchmarks.sh
index 72812218cb66..51536b36b808 100644
--- a/.buildkite/scripts/run-benchmarks.sh
+++ b/.buildkite/scripts/run-benchmarks.sh
@@ -18,7 +18,7 @@ vllm bench throughput --input-len 256 --output-len 256 --output-json throughput_
 bench_throughput_exit_code=$?
 
 # run server-based benchmarks and upload the result to buildkite
-python3 -m vllm.entrypoints.openai.api_server --model meta-llama/Llama-2-7b-chat-hf &
+vllm serve meta-llama/Llama-2-7b-chat-hf &
 server_pid=$!
 wget https://huggingface.co/datasets/anon8231489123/ShareGPT_Vicuna_unfiltered/resolve/main/ShareGPT_V3_unfiltered_cleaned_split.json
 
diff --git a/benchmarks/disagg_benchmarks/disagg_overhead_benchmark.sh b/benchmarks/disagg_benchmarks/disagg_overhead_benchmark.sh
index 2c72941cf7e5..d683835db96a 100644
--- a/benchmarks/disagg_benchmarks/disagg_overhead_benchmark.sh
+++ b/benchmarks/disagg_benchmarks/disagg_overhead_benchmark.sh
@@ -55,9 +55,7 @@ benchmark() {
   output_len=$2
 
 
-  CUDA_VISIBLE_DEVICES=0 python3 \
-    -m vllm.entrypoints.openai.api_server \
-    --model $model \
+  CUDA_VISIBLE_DEVICES=0 vllm serve $model \
     --port 8100 \
     --max-model-len 10000 \
     --gpu-memory-utilization 0.6 \
@@ -65,9 +63,7 @@ benchmark() {
     '{"kv_connector":"P2pNcclConnector","kv_role":"kv_producer","kv_rank":0,"kv_parallel_size":2,"kv_buffer_size":5e9}' &
 
 
-  CUDA_VISIBLE_DEVICES=1 python3 \
-    -m vllm.entrypoints.openai.api_server \
-    --model $model \
+  CUDA_VISIBLE_DEVICES=1 vllm serve $model \
     --port 8200 \
     --max-model-len 10000 \
     --gpu-memory-utilization 0.6 \
diff --git a/benchmarks/disagg_benchmarks/disagg_performance_benchmark.sh b/benchmarks/disagg_benchmarks/disagg_performance_benchmark.sh
index 0bbf7cd2b1c8..35c86cc84522 100644
--- a/benchmarks/disagg_benchmarks/disagg_performance_benchmark.sh
+++ b/benchmarks/disagg_benchmarks/disagg_performance_benchmark.sh
@@ -38,16 +38,12 @@ wait_for_server() {
 launch_chunked_prefill() {
   model="meta-llama/Meta-Llama-3.1-8B-Instruct"
   # disagg prefill
-  CUDA_VISIBLE_DEVICES=0 python3 \
-    -m vllm.entrypoints.openai.api_server \
-    --model $model \
+  CUDA_VISIBLE_DEVICES=0 vllm serve $model \
     --port 8100 \
     --max-model-len 10000 \
     --enable-chunked-prefill \
     --gpu-memory-utilization 0.6 &
-  CUDA_VISIBLE_DEVICES=1 python3 \
-    -m vllm.entrypoints.openai.api_server \
-    --model $model \
+  CUDA_VISIBLE_DEVICES=1 vllm serve $model \
     --port 8200 \
     --max-model-len 10000 \
     --enable-chunked-prefill \
@@ -62,18 +58,14 @@ launch_chunked_prefill() {
 launch_disagg_prefill() {
   model="meta-llama/Meta-Llama-3.1-8B-Instruct"
   # disagg prefill
-  CUDA_VISIBLE_DEVICES=0 python3 \
-    -m vllm.entrypoints.openai.api_server \
-    --model $model \
+  CUDA_VISIBLE_DEVICES=0 vllm serve $model \
     --port 8100 \
     --max-model-len 10000 \
     --gpu-memory-utilization 0.6 \
     --kv-transfer-config \
     '{"kv_connector":"P2pNcclConnector","kv_role":"kv_producer","kv_rank":0,"kv_parallel_size":2,"kv_buffer_size":5e9}' &
 
-  CUDA_VISIBLE_DEVICES=1 python3 \
-    -m vllm.entrypoints.openai.api_server \
-    --model $model \
+  CUDA_VISIBLE_DEVICES=1 vllm serve $model \
     --port 8200 \
     --max-model-len 10000 \
     --gpu-memory-utilization 0.6 \
diff --git a/docker/Dockerfile b/docker/Dockerfile
index ccc1b024316a..56bbc3d5f1a3 100644
--- a/docker/Dockerfile
+++ b/docker/Dockerfile
@@ -565,5 +565,5 @@ ENTRYPOINT ["./sagemaker-entrypoint.sh"]
 
 FROM vllm-openai-base AS vllm-openai
 
-ENTRYPOINT ["python3", "-m", "vllm.entrypoints.openai.api_server"]
+ENTRYPOINT ["vllm", "serve"]
 #################### OPENAI API SERVER ####################
diff --git a/docker/Dockerfile.cpu b/docker/Dockerfile.cpu
index 388596efd21c..2ed02ff9e3ac 100644
--- a/docker/Dockerfile.cpu
+++ b/docker/Dockerfile.cpu
@@ -177,4 +177,4 @@ RUN --mount=type=cache,target=/root/.cache/uv \
     --mount=type=bind,from=vllm-build,src=/workspace/vllm/dist,target=dist \
     uv pip install dist/*.whl
 
-ENTRYPOINT ["python3", "-m", "vllm.entrypoints.openai.api_server"]
+ENTRYPOINT ["vllm", "serve"]
diff --git a/docker/Dockerfile.ppc64le b/docker/Dockerfile.ppc64le
index aaff240388f2..5eaef4ea980d 100644
--- a/docker/Dockerfile.ppc64le
+++ b/docker/Dockerfile.ppc64le
@@ -314,4 +314,4 @@ WORKDIR /workspace/
 
 RUN ln -s /workspace/vllm/tests && ln -s /workspace/vllm/examples && ln -s /workspace/vllm/benchmarks
 
-ENTRYPOINT ["python", "-m", "vllm.entrypoints.openai.api_server"]
+ENTRYPOINT ["vllm", "serve"]
diff --git a/docker/Dockerfile.s390x b/docker/Dockerfile.s390x
index 9942b7626f81..7fd7598b8bd9 100644
--- a/docker/Dockerfile.s390x
+++ b/docker/Dockerfile.s390x
@@ -309,4 +309,4 @@ USER 2000
 WORKDIR /home/vllm
 
 # Set the default entrypoint
-ENTRYPOINT ["python", "-m", "vllm.entrypoints.openai.api_server"]
+ENTRYPOINT ["vllm", "serve"]
diff --git a/docker/Dockerfile.xpu b/docker/Dockerfile.xpu
index ef422352509a..ffc3abd38965 100644
--- a/docker/Dockerfile.xpu
+++ b/docker/Dockerfile.xpu
@@ -69,4 +69,4 @@ RUN --mount=type=cache,target=/root/.cache/pip \
 
 # install development dependencies (for testing)
 RUN python3 -m pip install -e tests/vllm_test_utils
-ENTRYPOINT ["python3", "-m", "vllm.entrypoints.openai.api_server"]
+ENTRYPOINT ["vllm", "serve"]
diff --git a/docs/contributing/benchmarks.md b/docs/contributing/benchmarks.md
index cf14770c01a6..d53a680c9182 100644
--- a/docs/contributing/benchmarks.md
+++ b/docs/contributing/benchmarks.md
@@ -661,8 +661,7 @@ Benchmark the performance of multi-modal requests in vLLM.
 Start vLLM:
 
 ```bash
-python -m vllm.entrypoints.openai.api_server \
-  --model Qwen/Qwen2.5-VL-7B-Instruct \
+vllm serve Qwen/Qwen2.5-VL-7B-Instruct \
   --dtype bfloat16 \
   --limit-mm-per-prompt '{"image": 1}' \
   --allowed-local-media-path /path/to/sharegpt4v/images
@@ -688,8 +687,7 @@ vllm bench serve \
 Start vLLM:
 
 ```bash
-python -m vllm.entrypoints.openai.api_server \
-  --model Qwen/Qwen2.5-VL-7B-Instruct \
+vllm serve Qwen/Qwen2.5-VL-7B-Instruct \
   --dtype bfloat16 \
   --limit-mm-per-prompt '{"video": 1}' \
   --allowed-local-media-path /path/to/sharegpt4video/videos
diff --git a/docs/contributing/profiling.md b/docs/contributing/profiling.md
index b62560a58748..f6a73e99546e 100644
--- a/docs/contributing/profiling.md
+++ b/docs/contributing/profiling.md
@@ -39,8 +39,7 @@ Refer to <gh-file:examples/offline_inference/simple_profiling.py> for an example
 
 ```bash
 VLLM_TORCH_PROFILER_DIR=./vllm_profile \
-    python -m vllm.entrypoints.openai.api_server \
-    --model meta-llama/Meta-Llama-3-70B
+    vllm serve meta-llama/Meta-Llama-3-70B
 ```
 
 vllm bench command:
diff --git a/docs/deployment/frameworks/autogen.md b/docs/deployment/frameworks/autogen.md
index 7517ee771c09..5790087ed5c2 100644
--- a/docs/deployment/frameworks/autogen.md
+++ b/docs/deployment/frameworks/autogen.md
@@ -19,8 +19,7 @@ pip install -U "autogen-agentchat" "autogen-ext[openai]"
 1. Start the vLLM server with the supported chat completion model, e.g.
 
     ```bash
-    python -m vllm.entrypoints.openai.api_server \
-        --model mistralai/Mistral-7B-Instruct-v0.2
+    vllm serve mistralai/Mistral-7B-Instruct-v0.2
     ```
 
 1. Call it with AutoGen:
diff --git a/docs/deployment/frameworks/open-webui.md b/docs/deployment/frameworks/open-webui.md
index eaa51bb61328..505c129613de 100644
--- a/docs/deployment/frameworks/open-webui.md
+++ b/docs/deployment/frameworks/open-webui.md
@@ -20,7 +20,7 @@ To get started with Open WebUI using vLLM, follow these steps:
         For example:
 
         ```console
-        python -m vllm.entrypoints.openai.api_server --host 0.0.0.0 --port 8000
+        vllm serve <model> --host 0.0.0.0 --port 8000
         ```
 
 3. Start the Open WebUI Docker container:
diff --git a/docs/deployment/frameworks/skypilot.md b/docs/deployment/frameworks/skypilot.md
index 06e2fed38f05..f4a984a6433e 100644
--- a/docs/deployment/frameworks/skypilot.md
+++ b/docs/deployment/frameworks/skypilot.md
@@ -32,6 +32,7 @@ See the vLLM SkyPilot YAML for serving, [serving.yaml](https://github.com/skypil
       ports: 8081  # Expose to internet traffic.
 
     envs:
+      PYTHONUNBUFFERED: 1
       MODEL_NAME: meta-llama/Meta-Llama-3-8B-Instruct
       HF_TOKEN: <your-huggingface-token>  # Change to your own huggingface token, or use --env to pass.
 
@@ -47,9 +48,8 @@ See the vLLM SkyPilot YAML for serving, [serving.yaml](https://github.com/skypil
     run: |
       conda activate vllm
       echo 'Starting vllm api server...'
-      python -u -m vllm.entrypoints.openai.api_server \
+      vllm serve $MODEL_NAME \
         --port 8081 \
-        --model $MODEL_NAME \
         --trust-remote-code \
         --tensor-parallel-size $SKYPILOT_NUM_GPUS_PER_NODE \
         2>&1 | tee api_server.log &
@@ -131,6 +131,7 @@ SkyPilot can scale up the service to multiple service replicas with built-in aut
       ports: 8081  # Expose to internet traffic.
 
     envs:
+      PYTHONUNBUFFERED: 1
       MODEL_NAME: meta-llama/Meta-Llama-3-8B-Instruct
       HF_TOKEN: <your-huggingface-token>  # Change to your own huggingface token, or use --env to pass.
 
@@ -146,9 +147,8 @@ SkyPilot can scale up the service to multiple service replicas with built-in aut
     run: |
       conda activate vllm
       echo 'Starting vllm api server...'
-      python -u -m vllm.entrypoints.openai.api_server \
+      vllm serve $MODEL_NAME \
         --port 8081 \
-        --model $MODEL_NAME \
         --trust-remote-code \
         --tensor-parallel-size $SKYPILOT_NUM_GPUS_PER_NODE \
         2>&1 | tee api_server.log
@@ -243,6 +243,7 @@ This will scale the service up to when the QPS exceeds 2 for each replica.
       ports: 8081  # Expose to internet traffic.
 
     envs:
+      PYTHONUNBUFFERED: 1
       MODEL_NAME: meta-llama/Meta-Llama-3-8B-Instruct
       HF_TOKEN: <your-huggingface-token>  # Change to your own huggingface token, or use --env to pass.
 
@@ -258,9 +259,8 @@ This will scale the service up to when the QPS exceeds 2 for each replica.
     run: |
       conda activate vllm
       echo 'Starting vllm api server...'
-      python -u -m vllm.entrypoints.openai.api_server \
+      vllm serve $MODEL_NAME \
         --port 8081 \
-        --model $MODEL_NAME \
         --trust-remote-code \
         --tensor-parallel-size $SKYPILOT_NUM_GPUS_PER_NODE \
         2>&1 | tee api_server.log
diff --git a/docs/design/arch_overview.md b/docs/design/arch_overview.md
index 6b7086776025..f1300a73c26c 100644
--- a/docs/design/arch_overview.md
+++ b/docs/design/arch_overview.md
@@ -69,6 +69,11 @@ Sometimes you may see the API server entrypoint used directly instead of via the
 python -m vllm.entrypoints.openai.api_server --model <model>
 ```
 
+!!! warning
+
+    `python -m vllm.entrypoints.openai.api_server` is deprecated
+    and may become unsupported in a future release.
+
 That code can be found in <gh-file:vllm/entrypoints/openai/api_server.py>.
 
 More details on the API server can be found in the [OpenAI-Compatible Server](../serving/openai_compatible_server.md) document.
diff --git a/docs/features/sleep_mode.md b/docs/features/sleep_mode.md
index 5749b02d26f4..e7dd9fee12d3 100644
--- a/docs/features/sleep_mode.md
+++ b/docs/features/sleep_mode.md
@@ -64,8 +64,7 @@ To enable sleep mode in a vLLM server you need to initialize it with the flag `V
 When using the flag `VLLM_SERVER_DEV_MODE=1` you enable development endpoints, and these endpoints should not be exposed to users.
 
 ```bash
-VLLM_SERVER_DEV_MODE=1 python -m vllm.entrypoints.openai.api_server \
-  --model Qwen/Qwen3-0.6B \
+VLLM_SERVER_DEV_MODE=1 vllm serve Qwen/Qwen3-0.6B \
   --enable-sleep-mode \
   --port 8000
 ```
diff --git a/docs/features/spec_decode.md b/docs/features/spec_decode.md
index 597a8e864427..25c308a6ff20 100644
--- a/docs/features/spec_decode.md
+++ b/docs/features/spec_decode.md
@@ -48,10 +48,9 @@ The following code configures vLLM in an offline mode to use speculative decodin
 To perform the same with an online mode launch the server:
 
 ```bash
-python -m vllm.entrypoints.openai.api_server \
+vllm serve facebook/opt-6.7b \
     --host 0.0.0.0 \
     --port 8000 \
-    --model facebook/opt-6.7b \
     --seed 42 \
     -tp 1 \
     --gpu_memory_utilization 0.8 \
diff --git a/docs/getting_started/installation/gpu/xpu.inc.md b/docs/getting_started/installation/gpu/xpu.inc.md
index ed1dc0418cf7..2e73ac182569 100644
--- a/docs/getting_started/installation/gpu/xpu.inc.md
+++ b/docs/getting_started/installation/gpu/xpu.inc.md
@@ -67,8 +67,7 @@ docker run -it \
 XPU platform supports **tensor parallel** inference/serving and also supports **pipeline parallel** as a beta feature for online serving. For **pipeline parallel**, we support it on single node with mp as the backend. For example, a reference execution like following:
 
 ```bash
-python -m vllm.entrypoints.openai.api_server \
-     --model=facebook/opt-13b \
+vllm serve facebook/opt-13b \
      --dtype=bfloat16 \
      --max_model_len=1024 \
      --distributed-executor-backend=mp \
diff --git a/examples/online_serving/sagemaker-entrypoint.sh b/examples/online_serving/sagemaker-entrypoint.sh
index 75a99ffc1f15..1a6b6780ef2a 100644
--- a/examples/online_serving/sagemaker-entrypoint.sh
+++ b/examples/online_serving/sagemaker-entrypoint.sh
@@ -21,4 +21,4 @@ while IFS='=' read -r key value; do
 done < <(env | grep "^${PREFIX}")
 
 # Pass the collected arguments to the main entrypoint
-exec python3 -m vllm.entrypoints.openai.api_server "${ARGS[@]}"
\ No newline at end of file
+exec vllm serve "${ARGS[@]}"
\ No newline at end of file
diff --git a/tests/utils_/test_utils.py b/tests/utils_/test_utils.py
index 658ae7e7451a..bdd92cc8e35e 100644
--- a/tests/utils_/test_utils.py
+++ b/tests/utils_/test_utils.py
@@ -786,13 +786,43 @@ def test_model_specification(parser_with_config, cli_config_file,
         parser_with_config.parse_args(['serve', '--config', cli_config_file])
 
     # Test using --model option raises error
-    with pytest.raises(
-            ValueError,
-            match=
-        ("With `vllm serve`, you should provide the model as a positional "
-         "argument or in a config file instead of via the `--model` option."),
-    ):
-        parser_with_config.parse_args(['serve', '--model', 'my-model'])
+    # with pytest.raises(
+    #         ValueError,
+    #         match=
+    #     ("With `vllm serve`, you should provide the model as a positional "
+    #      "argument or in a config file instead of via the `--model` option."),
+    # ):
+    #     parser_with_config.parse_args(['serve', '--model', 'my-model'])
+
+    # Test using --model option back-compatibility
+    # (when back-compatibility ends, the above test should be uncommented
+    # and the below test should be removed)
+    args = parser_with_config.parse_args([
+        'serve',
+        '--tensor-parallel-size',
+        '2',
+        '--model',
+        'my-model',
+        '--trust-remote-code',
+        '--port',
+        '8001',
+    ])
+    assert args.model is None
+    assert args.tensor_parallel_size == 2
+    assert args.trust_remote_code is True
+    assert args.port == 8001
+
+    args = parser_with_config.parse_args([
+        'serve',
+        '--tensor-parallel-size=2',
+        '--model=my-model',
+        '--trust-remote-code',
+        '--port=8001',
+    ])
+    assert args.model is None
+    assert args.tensor_parallel_size == 2
+    assert args.trust_remote_code is True
+    assert args.port == 8001
 
     # Test other config values are preserved
     args = parser_with_config.parse_args([
diff --git a/vllm/utils/__init__.py b/vllm/utils/__init__.py
index 11d6686009b2..8c69870b2bc3 100644
--- a/vllm/utils/__init__.py
+++ b/vllm/utils/__init__.py
@@ -1855,13 +1855,37 @@ def parse_args(  # type: ignore[override]
 
         # Check for --model in command line arguments first
         if args and args[0] == "serve":
-            model_in_cli_args = any(arg == '--model' for arg in args)
-
-            if model_in_cli_args:
-                raise ValueError(
+            try:
+                model_idx = next(
+                    i for i, arg in enumerate(args)
+                    if arg == "--model" or arg.startswith("--model="))
+                logger.warning(
                     "With `vllm serve`, you should provide the model as a "
                     "positional argument or in a config file instead of via "
-                    "the `--model` option.")
+                    "the `--model` option. "
+                    "The `--model` option will be removed in v0.13.")
+
+                if args[model_idx] == "--model":
+                    model_tag = args[model_idx + 1]
+                    rest_start_idx = model_idx + 2
+                else:
+                    model_tag = args[model_idx].removeprefix("--model=")
+                    rest_start_idx = model_idx + 1
+
+                # Move <model> to the front, e,g:
+                # [Before]
+                # vllm serve -tp 2 --model <model> --enforce-eager --port 8001
+                # [After]
+                # vllm serve <model> -tp 2 --enforce-eager --port 8001
+                args = [
+                    "serve",
+                    model_tag,
+                    *args[1:model_idx],
+                    *args[rest_start_idx:],
+                ]
+                print("args", args)
+            except StopIteration:
+                pass
 
         if '--config' in args:
             args = self._pull_args_from_config(args)

From 6379eaeaadb9c33fe7cd37a0855978ea8e49c7f5 Mon Sep 17 00:00:00 2001
From: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Date: Thu, 2 Oct 2025 13:18:13 -0400
Subject: [PATCH 099/193] [BugFix] Fix FI accuracy issue when used for MLA
 prefill (#26063)

Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
Signed-off-by: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
Co-authored-by: mgoin <mgoin64@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/v1/attention/backends/mla/common.py | 11 +++++++++--
 1 file changed, 9 insertions(+), 2 deletions(-)

diff --git a/vllm/v1/attention/backends/mla/common.py b/vllm/v1/attention/backends/mla/common.py
index 561793b6a377..963f1c5abf2a 100755
--- a/vllm/v1/attention/backends/mla/common.py
+++ b/vllm/v1/attention/backends/mla/common.py
@@ -1211,13 +1211,18 @@ def _run_prefill_new_tokens_fi(self, prefill: MLACommonPrefillMetadata, q,
                                    k, v, return_softmax_lse):
         assert isinstance(prefill, FlashInferPrefillMetadata)
         assert prefill.prefill_main is not None
-        return prefill.prefill_main.run(
+        ret = prefill.prefill_main.run(
             q=q,
             k=k,
             v=v,
             return_lse=return_softmax_lse,
         )
 
+        if isinstance(ret, tuple):
+            # Convert from (q_len, num_heads) to (num_heads, q_len)
+            return ret[0], ret[1].transpose(0, 1).contiguous()
+        return ret
+
     def _run_prefill_new_tokens_cudnn(self, prefill: MLACommonPrefillMetadata,
                                       q, k, v, return_softmax_lse):
         assert isinstance(prefill, CudnnPrefillMetadata)
@@ -1260,12 +1265,14 @@ def _run_prefill_context_chunk_fa(self, prefill: MLACommonPrefillMetadata,
     def _run_prefill_context_chunk_fi(self, prefill: MLACommonPrefillMetadata,
                                       chunk_idx: int, q, k, v):
         assert isinstance(prefill, FlashInferPrefillMetadata)
-        return prefill.prefill_chunks[chunk_idx].run(
+        attn_out, lse = prefill.prefill_chunks[chunk_idx].run(
             q=q,
             k=k,
             v=v,
             return_lse=True,
         )
+        # Convert from (q_len, num_heads) to (num_heads, q_len)
+        return attn_out, lse.transpose(0, 1).contiguous()
 
     def _run_prefill_context_chunk_cudnn(self,
                                          prefill: MLACommonPrefillMetadata,

From a26a1d3e60ac92d66a11ff1e9c873e7a97a9c390 Mon Sep 17 00:00:00 2001
From: Chenheli Hua <huachenheli@outlook.com>
Date: Thu, 2 Oct 2025 10:27:10 -0700
Subject: [PATCH 100/193] [Small] Prevent bypassing media domain restriction
 via HTTP redirects (#26035)

Signed-off-by: Chenheli Hua <huachenheli@outlook.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/features/multimodal_inputs.md |  3 +++
 docs/usage/security.md             |  3 +++
 vllm/connections.py                | 24 ++++++++++++++++++------
 vllm/envs.py                       |  6 ++++++
 vllm/multimodal/utils.py           | 12 ++++++++++--
 5 files changed, 40 insertions(+), 8 deletions(-)

diff --git a/docs/features/multimodal_inputs.md b/docs/features/multimodal_inputs.md
index b61a54d3ca7f..dcc5ea3b9096 100644
--- a/docs/features/multimodal_inputs.md
+++ b/docs/features/multimodal_inputs.md
@@ -8,6 +8,9 @@ This page teaches you how to pass multi-modal inputs to [multi-modal models][sup
 
 !!! tip
     When serving multi-modal models, consider setting `--allowed-media-domains` to restrict domain that vLLM can access to prevent it from accessing arbitrary endpoints that can potentially be vulnerable to Server-Side Request Forgery (SSRF) attacks. You can provide a list of domains for this arg. For example: `--allowed-media-domains upload.wikimedia.org github.com www.bogotobogo.com`
+
+    Also, consider setting `VLLM_MEDIA_URL_ALLOW_REDIRECTS=0` to prevent HTTP redirects from being followed to bypass domain restrictions.
+
     This restriction is especially important if you run vLLM in a containerized environment where the vLLM pods may have unrestricted access to internal networks.
 
 ## Offline Inference
diff --git a/docs/usage/security.md b/docs/usage/security.md
index 5d85e889c80c..9d10b66a5a97 100644
--- a/docs/usage/security.md
+++ b/docs/usage/security.md
@@ -66,6 +66,9 @@ Restrict domains that vLLM can access for media URLs by setting
 `--allowed-media-domains` to prevent Server-Side Request Forgery (SSRF) attacks.
 (e.g. `--allowed-media-domains upload.wikimedia.org github.com www.bogotobogo.com`)
 
+Also, consider setting `VLLM_MEDIA_URL_ALLOW_REDIRECTS=0` to prevent HTTP
+redirects from being followed to bypass domain restrictions.
+
 ## Security and Firewalls: Protecting Exposed vLLM Systems
 
 While vLLM is designed to allow unsafe network services to be isolated to
diff --git a/vllm/connections.py b/vllm/connections.py
index 103505eb3d81..1f341719ae30 100644
--- a/vllm/connections.py
+++ b/vllm/connections.py
@@ -54,6 +54,7 @@ def get_response(
         stream: bool = False,
         timeout: Optional[float] = None,
         extra_headers: Optional[Mapping[str, str]] = None,
+        allow_redirects: bool = True,
     ):
         self._validate_http_url(url)
 
@@ -63,7 +64,8 @@ def get_response(
         return client.get(url,
                           headers=self._headers(**extra_headers),
                           stream=stream,
-                          timeout=timeout)
+                          timeout=timeout,
+                          allow_redirects=allow_redirects)
 
     async def get_async_response(
         self,
@@ -71,6 +73,7 @@ async def get_async_response(
         *,
         timeout: Optional[float] = None,
         extra_headers: Optional[Mapping[str, str]] = None,
+        allow_redirects: bool = True,
     ):
         self._validate_http_url(url)
 
@@ -79,10 +82,17 @@ async def get_async_response(
 
         return client.get(url,
                           headers=self._headers(**extra_headers),
-                          timeout=timeout)
-
-    def get_bytes(self, url: str, *, timeout: Optional[float] = None) -> bytes:
-        with self.get_response(url, timeout=timeout) as r:
+                          timeout=timeout,
+                          allow_redirects=allow_redirects)
+
+    def get_bytes(self,
+                  url: str,
+                  *,
+                  timeout: Optional[float] = None,
+                  allow_redirects: bool = True) -> bytes:
+        with self.get_response(url,
+                               timeout=timeout,
+                               allow_redirects=allow_redirects) as r:
             r.raise_for_status()
 
             return r.content
@@ -92,8 +102,10 @@ async def async_get_bytes(
         url: str,
         *,
         timeout: Optional[float] = None,
+        allow_redirects: bool = True,
     ) -> bytes:
-        async with await self.get_async_response(url, timeout=timeout) as r:
+        async with await self.get_async_response(
+                url, timeout=timeout, allow_redirects=allow_redirects) as r:
             r.raise_for_status()
 
             return await r.read()
diff --git a/vllm/envs.py b/vllm/envs.py
index 03a22e4b2c7e..3d7d3c576dab 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -68,6 +68,7 @@
     VLLM_IMAGE_FETCH_TIMEOUT: int = 5
     VLLM_VIDEO_FETCH_TIMEOUT: int = 30
     VLLM_AUDIO_FETCH_TIMEOUT: int = 10
+    VLLM_MEDIA_URL_ALLOW_REDIRECTS: bool = True
     VLLM_MEDIA_LOADING_THREAD_COUNT: int = 8
     VLLM_MAX_AUDIO_CLIP_FILESIZE_MB: int = 25
     VLLM_VIDEO_LOADER_BACKEND: str = "opencv"
@@ -733,6 +734,11 @@ def get_vllm_port() -> Optional[int]:
     "VLLM_AUDIO_FETCH_TIMEOUT":
     lambda: int(os.getenv("VLLM_AUDIO_FETCH_TIMEOUT", "10")),
 
+    # Whether to allow HTTP redirects when fetching from media URLs.
+    # Default to True
+    "VLLM_MEDIA_URL_ALLOW_REDIRECTS":
+    lambda: bool(int(os.getenv("VLLM_MEDIA_URL_ALLOW_REDIRECTS", "1"))),
+
     # Max number of workers for the thread pool handling
     # media bytes loading. Set to 1 to disable parallel processing.
     # Default is 8
diff --git a/vllm/multimodal/utils.py b/vllm/multimodal/utils.py
index 1f1eea6bfee7..bab12fd1681a 100644
--- a/vllm/multimodal/utils.py
+++ b/vllm/multimodal/utils.py
@@ -140,7 +140,11 @@ def load_from_url(
             self._assert_url_in_allowed_media_domains(url_spec)
 
             connection = self.connection
-            data = connection.get_bytes(url, timeout=fetch_timeout)
+            data = connection.get_bytes(
+                url,
+                timeout=fetch_timeout,
+                allow_redirects=envs.VLLM_MEDIA_URL_ALLOW_REDIRECTS,
+            )
 
             return media_io.load_bytes(data)
 
@@ -167,7 +171,11 @@ async def load_from_url_async(
             self._assert_url_in_allowed_media_domains(url_spec)
 
             connection = self.connection
-            data = await connection.async_get_bytes(url, timeout=fetch_timeout)
+            data = await connection.async_get_bytes(
+                url,
+                timeout=fetch_timeout,
+                allow_redirects=envs.VLLM_MEDIA_URL_ALLOW_REDIRECTS,
+            )
             future = loop.run_in_executor(global_thread_pool,
                                           media_io.load_bytes, data)
             return await future

From 3389e2aa68db583611c7fea5808c26b27ea297f9 Mon Sep 17 00:00:00 2001
From: Chen Zhang <zhangch99@outlook.com>
Date: Thu, 2 Oct 2025 10:29:12 -0700
Subject: [PATCH 101/193] [Deepseek v3.2] Support indexer prefill chunking
 (#25999)

Signed-off-by: Chen Zhang <zhangch99@outlook.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../v1/attention/test_sparse_mla_backends.py  |  22 +++
 vllm/model_executor/models/deepseek_v2.py     |  75 +++++-----
 vllm/v1/attention/backends/mla/indexer.py     | 131 ++++++++++++------
 3 files changed, 149 insertions(+), 79 deletions(-)

diff --git a/tests/v1/attention/test_sparse_mla_backends.py b/tests/v1/attention/test_sparse_mla_backends.py
index 74eea6f716fe..ddad9342fad0 100644
--- a/tests/v1/attention/test_sparse_mla_backends.py
+++ b/tests/v1/attention/test_sparse_mla_backends.py
@@ -22,6 +22,7 @@
 from vllm.v1.attention.backends.mla.flashmla_sparse import (
     FlashMLASparseBackend, FlashMLASparseDecodeAndContextMetadata,
     FlashMLASparseImpl, FlashMLASparseMetadata)
+from vllm.v1.attention.backends.mla.indexer import split_prefill_chunks
 
 SPARSE_BACKEND_BATCH_SPECS = {
     name: BATCH_SPECS[name]
@@ -424,3 +425,24 @@ def test_sparse_backend_decode_correctness(dist_init, batch_name,
                                sdpa_reference,
                                rtol=0.5,
                                atol=0.5)
+
+
+@pytest.mark.parametrize(
+    "seq_lens,max_buf,start,expected",
+    [
+        # Basic split: totals per chunk ≤ max_buf
+        (torch.tensor([2, 3, 4, 2]), 5, 0, [(0, 2), (2, 3), (3, 4)]),
+        # Non-zero start index
+        (torch.tensor([2, 3, 4, 2]), 5, 1, [(1, 2), (2, 3), (3, 4)]),
+        # Exact fits should split between items when adding the next would
+        # overflow
+        (torch.tensor([5, 5, 5]), 5, 0, [(0, 1), (1, 2), (2, 3)]),
+        # All requests fit in a single chunk
+        (torch.tensor([1, 1, 1]), 10, 0, [(0, 3)]),
+        # Large buffer with non-zero start
+        (torch.tensor([4, 4, 4]), 100, 1, [(1, 3)]),
+    ],
+)
+def test_split_prefill_chunks(seq_lens, max_buf, start, expected):
+    out = split_prefill_chunks(seq_lens, max_buf, start)
+    assert out == expected
diff --git a/vllm/model_executor/models/deepseek_v2.py b/vllm/model_executor/models/deepseek_v2.py
index 03c43654d68f..b7f96d0d1552 100644
--- a/vllm/model_executor/models/deepseek_v2.py
+++ b/vllm/model_executor/models/deepseek_v2.py
@@ -583,44 +583,43 @@ def sparse_attn_indexer(
     topk_indices_buffer[:hidden_states.shape[0]] = -1
     if has_prefill:
         prefill_metadata = attn_metadata.prefill
-        num_prefills = attn_metadata.num_prefills
-        k_fp8 = torch.empty([prefill_metadata.total_seq_lens, head_dim],
-                            device=k.device,
-                            dtype=torch.float8_e4m3fn)
-        k_scale = torch.empty([prefill_metadata.total_seq_lens, 1],
-                              device=k.device,
-                              dtype=torch.float32)
-        cp_gather_indexer_k_quant_cache(
-            kv_cache,
-            k_fp8,
-            k_scale,
-            prefill_metadata.block_table,
-            prefill_metadata.cu_seq_lens,
-            num_prefills,
-        )
-        cu_seqlen_ks = prefill_metadata.cu_seqlen_ks
-        cu_seqlen_ke = prefill_metadata.cu_seqlen_ke
-        num_tokens = attn_metadata.num_actual_tokens
-        logits = fp8_mqa_logits(
-            q_fp8[num_decode_tokens:num_tokens],
-            (k_fp8, k_scale),
-            weights[num_decode_tokens:num_tokens],
-            cu_seqlen_ks,
-            cu_seqlen_ke,
-        )
-        topk_indices = logits.topk(min(topk_tokens, logits.shape[-1]),
-                                   dim=-1)[1]
-        topk_indices -= cu_seqlen_ks[:, None]
-        mask_lo = topk_indices >= 0
-        mask_hi = topk_indices - (cu_seqlen_ke - cu_seqlen_ks)[:, None] < 0
-        mask = torch.full_like(topk_indices,
-                               False,
-                               dtype=torch.bool,
-                               device=topk_indices.device)
-        mask = mask_lo & mask_hi
-        topk_indices = topk_indices.masked_fill(~mask, -1)
-        topk_indices_buffer[num_decode_tokens:num_tokens, :topk_indices.
-                            shape[-1]] = topk_indices.to(dtype=torch.int32)
+        for chunk in prefill_metadata.chunks:
+            k_fp8 = torch.empty([chunk.total_seq_lens, head_dim],
+                                device=k.device,
+                                dtype=torch.float8_e4m3fn)
+            k_scale = torch.empty([chunk.total_seq_lens, 1],
+                                  device=k.device,
+                                  dtype=torch.float32)
+            cp_gather_indexer_k_quant_cache(
+                kv_cache,
+                k_fp8,
+                k_scale,
+                chunk.block_table,
+                chunk.cu_seq_lens,
+                chunk.num_reqs,
+            )
+            logits = fp8_mqa_logits(
+                q_fp8[chunk.token_start:chunk.token_end],
+                (k_fp8, k_scale),
+                weights[chunk.token_start:chunk.token_end],
+                chunk.cu_seqlen_ks,
+                chunk.cu_seqlen_ke,
+            )
+            topk_indices = logits.topk(min(topk_tokens, logits.shape[-1]),
+                                       dim=-1)[1]
+            topk_indices -= chunk.cu_seqlen_ks[:, None]
+            mask_lo = topk_indices >= 0
+            mask_hi = topk_indices - (chunk.cu_seqlen_ke -
+                                      chunk.cu_seqlen_ks)[:, None] < 0
+            mask = torch.full_like(topk_indices,
+                                   False,
+                                   dtype=torch.bool,
+                                   device=topk_indices.device)
+            mask = mask_lo & mask_hi
+            topk_indices = topk_indices.masked_fill(~mask, -1)
+            topk_indices_buffer[
+                chunk.token_start:chunk.token_end, :topk_indices.
+                shape[-1]] = topk_indices.to(dtype=torch.int32)
 
     if has_decode:
         decode_metadata = attn_metadata.decode
diff --git a/vllm/v1/attention/backends/mla/indexer.py b/vllm/v1/attention/backends/mla/indexer.py
index e87b51b15191..94b963f34e4a 100644
--- a/vllm/v1/attention/backends/mla/indexer.py
+++ b/vllm/v1/attention/backends/mla/indexer.py
@@ -49,14 +49,20 @@ def get_kv_cache_stride_order() -> tuple[int, ...]:
 
 
 @dataclass
-class DeepseekV32IndexerPrefillMetadata:
+class DeepseekV32IndexerPrefillChunkMetadata:
     block_table: torch.Tensor
-    query_start_loc: torch.Tensor
-    max_query_len: int
     cu_seqlen_ks: torch.Tensor
     cu_seqlen_ke: torch.Tensor
     cu_seq_lens: torch.Tensor
     total_seq_lens: int
+    token_start: int
+    token_end: int
+    num_reqs: int
+
+
+@dataclass
+class DeepseekV32IndexerPrefillMetadata:
+    chunks: list[DeepseekV32IndexerPrefillChunkMetadata]
 
 
 @dataclass
@@ -98,8 +104,8 @@ class DeepseekV32IndexerMetadata:
 
 # TODO (zyongye) optimize this, this is now vibe coded
 def kv_spans_from_batches(
-        start_seq_loc: torch.Tensor,
-        seq_len_per_batch: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+        start_seq_loc: torch.Tensor, seq_len_per_batch: torch.Tensor,
+        device: torch.device) -> tuple[torch.Tensor, torch.Tensor]:
     """
     Args:
       start_seq_loc: 1D long tensor [B+1], cumulative counts of 
@@ -122,7 +128,7 @@ def kv_spans_from_batches(
     are the **last** `counts[i]` positions of that sequence.
     """
     q = start_seq_loc.to(dtype=torch.long)
-    L = seq_len_per_batch.to(dtype=torch.long, device=q.device)
+    L = seq_len_per_batch.to(dtype=torch.long)
     assert q.dim() == 1 and L.dim() == 1
     assert q.numel() == L.numel() + 1, "start_seq_loc must have length B+1"
 
@@ -130,7 +136,6 @@ def kv_spans_from_batches(
     counts = q[1:] - q[:-1]  # [B]
     N = int(q[-1].item())  # total selected tokens
     B = L.numel()
-    device = L.device
 
     if N == 0:
         return (torch.empty(0, dtype=torch.long, device=device),
@@ -140,8 +145,7 @@ def kv_spans_from_batches(
     kv_starts_per_batch = torch.cumsum(L, dim=0) - L  # [B]
 
     # For each selected token, which batch does it belong to?
-    batch_id = torch.repeat_interleave(torch.arange(B, device=device),
-                                       counts)  # [N]
+    batch_id = torch.repeat_interleave(torch.arange(B), counts)  # [N]
 
     # Map batch KV start to each token
     start_tensor = kv_starts_per_batch[batch_id]  # [N]
@@ -151,22 +155,51 @@ def kv_spans_from_batches(
     L_expand = torch.repeat_interleave(L, counts)  # [N]
     m_expand = torch.repeat_interleave(counts, counts)  # [N]
     # position within the selected block: 1..counts[b]
-    pos_within = (torch.arange(N, device=device, dtype=torch.long) -
+    pos_within = (torch.arange(N, dtype=torch.long) -
                   torch.repeat_interleave(q[:-1], counts) + 1)
 
     local_pos = L_expand - m_expand + pos_within  # [N], 1-based
     end_location = start_tensor + local_pos  # exclusive end
 
-    return start_tensor.int(), end_location.int()
+    return start_tensor.int().to(device), end_location.int().to(device)
 
 
 def get_max_prefill_buffer_size(vllm_config: VllmConfig):
     max_model_len = vllm_config.model_config.max_model_len
-    # max_num_batched_tokens = \
-    #     vllm_config.scheduler_config.max_num_batched_tokens
-    max_num_seq = vllm_config.scheduler_config.max_num_seqs
-    # NOTE(Chen): an estimated max size of flattened_kv. Need to double check.
-    return max_model_len * max_num_seq
+    # NOTE(Chen): 2 is a magic number for controlling the prefill buffer size.
+    # May be tuned later.
+    return max_model_len * 2
+
+
+def split_prefill_chunks(seq_lens_cpu: torch.Tensor,
+                         max_prefill_buffer_size: int,
+                         reqs_start: int) -> list[tuple[int, int]]:
+    """
+    Split the prefill chunks into a list of tuples of (reqs_start, reqs_end)
+    such that the total sequence length of each chunk is less than the
+    maximum prefill buffer size.
+
+    Args:
+        seq_lens_cpu: The sequence lengths of the prefill requests.
+        max_prefill_buffer_size: The maximum prefill buffer size.
+        reqs_start: The start index of the prefill requests.
+    
+    Returns:
+        A list of tuples of (reqs_start, reqs_end).
+    """
+    chunk_seq_ids = []
+    total_seq_lens = 0
+    for i in range(reqs_start, len(seq_lens_cpu)):
+        cur_seq_len = seq_lens_cpu[i].item()
+        assert cur_seq_len <= max_prefill_buffer_size
+        total_seq_lens += cur_seq_len
+        if total_seq_lens > max_prefill_buffer_size:
+            chunk_seq_ids.append((reqs_start, i))
+            reqs_start = i
+            total_seq_lens = cur_seq_len
+    if total_seq_lens > 0:
+        chunk_seq_ids.append((reqs_start, len(seq_lens_cpu)))
+    return chunk_seq_ids
 
 
 class DeepseekV32IndexerMetadataBuilder(AttentionMetadataBuilder):
@@ -201,6 +234,33 @@ def __init__(self, *args, **kwargs):
                                                      dtype=torch.int32,
                                                      device=self.device)
 
+    def build_one_prefill_chunk(self, reqs_start, reqs_end,
+                                query_start_loc_cpu, seq_lens_cpu,
+                                block_table):
+        prefill_query_start_loc = query_start_loc_cpu[
+            reqs_start:reqs_end + 1] - query_start_loc_cpu[reqs_start]
+        cu_seqlen_ks, cu_seqlen_ke = kv_spans_from_batches(
+            prefill_query_start_loc, seq_lens_cpu[reqs_start:reqs_end],
+            self.device)
+        token_start = query_start_loc_cpu[reqs_start].item()
+        token_end = query_start_loc_cpu[reqs_end].item()
+        total_seq_lens = seq_lens_cpu[reqs_start:reqs_end].sum()
+        assert total_seq_lens <= self.max_prefill_buffer_size
+        cu_seq_lens = torch.cat([
+            torch.zeros(1, dtype=torch.int32),
+            seq_lens_cpu[reqs_start:reqs_end].cumsum(dim=0)
+        ]).to(torch.int32).to(self.device)
+        return DeepseekV32IndexerPrefillChunkMetadata(
+            cu_seqlen_ks=cu_seqlen_ks,
+            cu_seqlen_ke=cu_seqlen_ke,
+            cu_seq_lens=cu_seq_lens,
+            total_seq_lens=total_seq_lens,
+            block_table=block_table[reqs_start:reqs_end],
+            token_start=token_start,
+            token_end=token_end,
+            num_reqs=reqs_end - reqs_start,
+        )
+
     def build(self,
               common_prefix_len: int,
               common_attn_metadata: CommonAttentionMetadata,
@@ -209,11 +269,7 @@ def build(self,
         num_reqs = common_attn_metadata.num_reqs
         num_tokens = common_attn_metadata.num_actual_tokens
 
-        device = self.device
-        block_table_tensor = common_attn_metadata.block_table_tensor
-
-        query_start_loc = common_attn_metadata.query_start_loc
-
+        query_start_loc_cpu = common_attn_metadata.query_start_loc_cpu
         num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = \
             split_decodes_and_prefills(
                 common_attn_metadata,
@@ -224,27 +280,20 @@ def build(self,
 
         prefill_metadata = None
         if num_prefills > 0:
-            reqs_start = num_decodes
-            prefill_query_start_loc = query_start_loc[
-                reqs_start:] - query_start_loc[reqs_start]
-            cu_seqlen_ks, cu_seqlen_ke = kv_spans_from_batches(
-                prefill_query_start_loc,
-                common_attn_metadata.seq_lens[reqs_start:])
-            total_seq_lens = common_attn_metadata.seq_lens[reqs_start:].sum()
-            assert total_seq_lens < self.max_prefill_buffer_size
-            cu_seq_lens = torch.cat([
-                torch.zeros(1, dtype=torch.int32, device=device),
-                common_attn_metadata.seq_lens[reqs_start:].cumsum(dim=0)
-            ]).to(torch.int32).cuda()
-            prefill_metadata = DeepseekV32IndexerPrefillMetadata(
-                block_table=block_table_tensor[reqs_start:, ...],
-                query_start_loc=prefill_query_start_loc,
-                max_query_len=common_attn_metadata.max_query_len,
-                cu_seqlen_ks=cu_seqlen_ks,
-                cu_seqlen_ke=cu_seqlen_ke,
-                cu_seq_lens=cu_seq_lens,
-                total_seq_lens=total_seq_lens,
+            chunk_seq_ids = split_prefill_chunks(
+                common_attn_metadata.seq_lens_cpu,
+                self.max_prefill_buffer_size,
+                num_decodes,
             )
+            chunks = [
+                self.build_one_prefill_chunk(
+                    reqs_start, reqs_end, query_start_loc_cpu,
+                    common_attn_metadata.seq_lens_cpu,
+                    common_attn_metadata.block_table_tensor)
+                for reqs_start, reqs_end in chunk_seq_ids
+            ]
+            prefill_metadata = DeepseekV32IndexerPrefillMetadata(
+                chunks=chunks, )
 
         decode_metadata = None
         if num_decodes > 0:

From 63825a28771f1c779393e8dda93fc8f3240d7535 Mon Sep 17 00:00:00 2001
From: Ekagra Ranjan <3116519+ekagra-ranjan@users.noreply.github.com>
Date: Thu, 2 Oct 2025 14:29:35 -0400
Subject: [PATCH 102/193] EAGLE 3: Fix preamble so that measured speedup over
 Eagle 1 becomes 32% instead of 5% on MTBench (#25916)

Signed-off-by: Ekagra Ranjan <3116519+ekagra-ranjan@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/benchmarks/datasets.py | 72 ++++++++++++++++++++-----------------
 1 file changed, 39 insertions(+), 33 deletions(-)

diff --git a/vllm/benchmarks/datasets.py b/vllm/benchmarks/datasets.py
index 807e543dc0cd..62e5194504d7 100644
--- a/vllm/benchmarks/datasets.py
+++ b/vllm/benchmarks/datasets.py
@@ -1151,6 +1151,12 @@ def add_dataset_parser(parser: FlexibleArgumentParser):
         help="Do not oversample if the dataset has " \
         "fewer samples than num-prompts.",
     )
+    parser.add_argument(
+        "--skip-chat-template",
+        action="store_true",
+        help=
+        "Skip applying chat template to prompt for datasets that support it.",
+    )
 
     # group for dataset specific arguments
     custom_group = parser.add_argument_group("custom dataset options")
@@ -1161,12 +1167,6 @@ def add_dataset_parser(parser: FlexibleArgumentParser):
         help=
         "Number of output tokens per request, used only for custom dataset.",
     )
-    custom_group.add_argument(
-        "--custom-skip-chat-template",
-        action="store_true",
-        help=
-        "Skip applying chat template to prompt, used only for custom dataset.",
-    )
 
     spec_bench_group = parser.add_argument_group("spec bench dataset options")
     spec_bench_group.add_argument(
@@ -1435,7 +1435,7 @@ def get_samples(args, tokenizer) -> list[SampleRequest]:
             num_requests=args.num_prompts,
             tokenizer=tokenizer,
             output_len=args.custom_output_len,
-            skip_chat_template=args.custom_skip_chat_template,
+            skip_chat_template=args.skip_chat_template,
             request_id_prefix=args.request_id_prefix,
             no_oversample=args.no_oversample,
         )
@@ -1576,6 +1576,7 @@ def get_samples(args, tokenizer) -> list[SampleRequest]:
             output_len=args.hf_output_len,
             request_id_prefix=args.request_id_prefix,
             no_oversample=args.no_oversample,
+            skip_chat_template=args.skip_chat_template,
             **hf_kwargs
         )
 
@@ -1815,7 +1816,6 @@ def load_data(self) -> None:
 
     def sample(self, **kwargs) -> list:
         # leverage CustomDataset sample
-        kwargs["skip_chat_template"] = False
         return super().sample(**kwargs)
 
 
@@ -2221,6 +2221,7 @@ def sample(self,
                num_requests: int,
                output_len: Optional[int] = None,
                enable_multimodal_chat: bool = False,
+               skip_chat_template: bool = False,
                request_id_prefix: str = "",
                no_oversample: bool = False,
                **kwargs) -> list:
@@ -2236,14 +2237,15 @@ def sample(self,
             )
 
             # apply template
-            prompt = tokenizer.apply_chat_template(
-                [{
-                    "role": "user",
-                    "content": prompt
-                }],
-                add_generation_prompt=True,
-                tokenize=False,
-            )
+            if not skip_chat_template:
+                prompt = tokenizer.apply_chat_template(
+                    [{
+                        "role": "user",
+                        "content": prompt
+                    }],
+                    add_generation_prompt=True,
+                    tokenize=False,
+                )
 
             prompt_len = len(tokenizer(prompt).input_ids)
             sampled_requests.append(
@@ -2284,6 +2286,7 @@ def sample(
         num_requests: int,
         output_len: Optional[int] = None,
         enable_multimodal_chat: bool = False,
+        skip_chat_template: bool = False,
         request_id_prefix: str = "",
         no_oversample: bool = False,
         **kwargs,
@@ -2298,14 +2301,15 @@ def sample(
             prompt = item["turns"][0]
 
             # apply template
-            prompt = tokenizer.apply_chat_template(
-                [{
-                    "role": "user",
-                    "content": prompt
-                }],
-                add_generation_prompt=True,
-                tokenize=False,
-            )
+            if not skip_chat_template:
+                prompt = tokenizer.apply_chat_template(
+                    [{
+                        "role": "user",
+                        "content": prompt
+                    }],
+                    add_generation_prompt=True,
+                    tokenize=False,
+                )
 
             prompt_len = len(tokenizer(prompt).input_ids)
             sampled_requests.append(
@@ -2349,6 +2353,7 @@ def sample(
         tokenizer: PreTrainedTokenizerBase,
         num_requests: int,
         output_len: Optional[int] = None,
+        skip_chat_template: bool = False,
         request_id_prefix: str = "",
         no_oversample: bool = False,
         min_distance: float = 0.0,
@@ -2372,7 +2377,7 @@ def sample(
 
             # template copied from
             # https://github.com/ise-uiuc/blazedit/blob/7765137e656fd62de877422d2e4cf8de51228054/dataset/create_refined_dataset.py#L94-L105 # noqa: E501
-            instruction = f"""Given a code file, please apply the change requests and generate the new file.
+            prompt = f"""Given a code file, please apply the change requests and generate the new file.
 
 Original file:
 ```python
@@ -2385,14 +2390,15 @@ def sample(
 Please generate the new code file in the "New file" section below.""" # noqa: E501
 
             # apply template
-            prompt = tokenizer.apply_chat_template(
-                [{
-                    "role": "user",
-                    "content": instruction
-                }],
-                add_generation_prompt=True,
-                tokenize=False,
-            )
+            if not skip_chat_template:
+                prompt = tokenizer.apply_chat_template(
+                    [{
+                        "role": "user",
+                        "content": prompt
+                    }],
+                    add_generation_prompt=True,
+                    tokenize=False,
+                )
 
             prompt_len = len(tokenizer(prompt).input_ids)
 

From cc258ed59e2c07a14b24e2941dee2cf96cff0d6d Mon Sep 17 00:00:00 2001
From: Chen Zhang <zhangch99@outlook.com>
Date: Thu, 2 Oct 2025 11:48:31 -0700
Subject: [PATCH 103/193] [Mamba][KVCacheManager] Simplify kv cache manage
 logic for mamba + MTP (#25119)

Signed-off-by: Chen Zhang <zhangch99@outlook.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/v1/core/single_type_kv_cache_manager.py | 29 +++-----------------
 1 file changed, 4 insertions(+), 25 deletions(-)

diff --git a/vllm/v1/core/single_type_kv_cache_manager.py b/vllm/v1/core/single_type_kv_cache_manager.py
index 4ecd9c8157e2..27ea1c4db2a5 100644
--- a/vllm/v1/core/single_type_kv_cache_manager.py
+++ b/vllm/v1/core/single_type_kv_cache_manager.py
@@ -565,35 +565,14 @@ def get_num_common_prefix_blocks(self, request_id: str,
     def get_num_blocks_to_allocate(
             self, request_id: str, num_tokens: int,
             new_computed_blocks: list[KVCacheBlock]) -> int:
-        """
-        Get the number of blocks needed to be allocated for the request.
-
-        Args:
-            request_id: The request ID.
-            num_tokens: The total number of tokens that need a slot (including
-                tokens that are already allocated).
-            new_computed_blocks: The new computed blocks just hitting the
-                prefix caching.
-
-        Returns:
-            The number of blocks
-        """
-
+        # Allocate extra `num_speculative_blocks` blocks for
+        # speculative decoding (MTP/EAGLE) with linear attention.
         assert isinstance(self.kv_cache_spec, MambaSpec)
         if self.kv_cache_spec.num_speculative_blocks > 0:
             num_tokens += (self.kv_cache_spec.block_size *
                            self.kv_cache_spec.num_speculative_blocks)
-        num_required_blocks = cdiv(num_tokens, self.block_size)
-        num_new_blocks = (num_required_blocks - len(new_computed_blocks) -
-                          len(self.req_to_blocks[request_id]))
-        # If a computed block of a request is an eviction candidate (in the
-        # free queue and ref_cnt == 0), it will be changed from a free block
-        # to a computed block when the request is allocated, so we also count
-        # it as needed to be allocated.
-        num_evictable_computed_blocks = sum(
-            blk.ref_cnt == 0 and not blk.is_null
-            for blk in new_computed_blocks)
-        return num_new_blocks + num_evictable_computed_blocks
+        return super().get_num_blocks_to_allocate(request_id, num_tokens,
+                                                  new_computed_blocks)
 
     def allocate_new_blocks(self, request_id: str,
                             num_tokens: int) -> list[KVCacheBlock]:

From 268ef21faa3019bd461fe50d0f804e2ed540e37a Mon Sep 17 00:00:00 2001
From: ElizaWszola <ewszola@redhat.com>
Date: Thu, 2 Oct 2025 21:35:13 +0200
Subject: [PATCH 104/193] [Perf] Fix and reapply move apply w8a8 block fp8
 linear to class (#25696)
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Signed-off-by: ElizaWszola <ewszola@redhat.com>
Signed-off-by: ElizaWszola <elizaw.9289@gmail.com>
Signed-off-by: Luka Govedič <lgovedic@redhat.com>
Signed-off-by: Luka Govedič <ProExpertProg@users.noreply.github.com>
Co-authored-by: Luka Govedič <ProExpertProg@users.noreply.github.com>
Co-authored-by: Michael Goin <mgoin64@gmail.com>
Co-authored-by: Luka Govedič <lgovedic@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../cutlass_benchmarks/w8a8_benchmarks.py     |   4 +-
 .../benchmark_fp8_block_dense_gemm.py         |   4 +-
 tests/kernels/quantization/test_block_fp8.py  |   5 +-
 .../quantization/test_fp8_quant_group.py      |  30 +-
 .../model_executor/test_enabled_custom_ops.py |  30 --
 tests/quantization/test_compressed_tensors.py |  35 ++
 vllm/config/vllm.py                           |  17 +
 .../compressed_tensors/compressed_tensors.py  |   8 +
 .../schemes/compressed_tensors_w8a8_fp8.py    |  37 +-
 .../model_executor/layers/quantization/fp8.py |  40 +-
 .../layers/quantization/input_quant_fp8.py    |  24 +-
 .../layers/quantization/utils/fp8_utils.py    | 357 ++++++++++++------
 vllm/utils/deep_gemm.py                       |  21 +-
 13 files changed, 412 insertions(+), 200 deletions(-)

diff --git a/benchmarks/cutlass_benchmarks/w8a8_benchmarks.py b/benchmarks/cutlass_benchmarks/w8a8_benchmarks.py
index a5a5b52f6039..02f8c593392c 100644
--- a/benchmarks/cutlass_benchmarks/w8a8_benchmarks.py
+++ b/benchmarks/cutlass_benchmarks/w8a8_benchmarks.py
@@ -17,7 +17,7 @@
 
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    w8a8_block_fp8_matmul,
+    w8a8_triton_block_scaled_mm,
 )
 from vllm.utils import FlexibleArgumentParser, cdiv
 
@@ -158,7 +158,7 @@ def bench_fp8(
         "cutlass_fp8_fp8_fp16_scaled_mm_bias": lambda: ops.cutlass_scaled_mm(
             a, b, scale_a, scale_b, torch.float16, bias.to(dtype=torch.float16)
         ),
-        "triton_fp8_fp8_fp16_scaled_mm_blockwise": lambda: w8a8_block_fp8_matmul(
+        "triton_fp8_fp8_fp16_scaled_mm_blockwise": lambda: w8a8_triton_block_scaled_mm(
             a_cont, b.t(), block_scale_a, block_scale_b.t(), (128, 128)
         ),
         "cutlass_fp8_fp8_fp16_scaled_mm_blockwise": lambda: ops.cutlass_scaled_mm(
diff --git a/benchmarks/kernels/deepgemm/benchmark_fp8_block_dense_gemm.py b/benchmarks/kernels/deepgemm/benchmark_fp8_block_dense_gemm.py
index db2398fc40a4..2010b8038563 100644
--- a/benchmarks/kernels/deepgemm/benchmark_fp8_block_dense_gemm.py
+++ b/benchmarks/kernels/deepgemm/benchmark_fp8_block_dense_gemm.py
@@ -9,7 +9,7 @@
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
     per_token_group_quant_fp8,
-    w8a8_block_fp8_matmul,
+    w8a8_triton_block_scaled_mm,
 )
 from vllm.triton_utils import triton
 from vllm.utils.deep_gemm import (
@@ -63,7 +63,7 @@ def deepgemm_gemm():
 
     # === vLLM Triton Implementation ===
     def vllm_triton_gemm():
-        return w8a8_block_fp8_matmul(A_vllm,
+        return w8a8_triton_block_scaled_mm(A_vllm,
                                      B_vllm,
                                      A_scale_vllm,
                                      B_scale_vllm,
diff --git a/tests/kernels/quantization/test_block_fp8.py b/tests/kernels/quantization/test_block_fp8.py
index 211d1ecfe6e4..e02df540ce9d 100644
--- a/tests/kernels/quantization/test_block_fp8.py
+++ b/tests/kernels/quantization/test_block_fp8.py
@@ -11,7 +11,7 @@
                                        native_w8a8_block_matmul)
 from vllm.config import VllmConfig
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    cutlass_scaled_mm, per_token_group_quant_fp8, w8a8_block_fp8_matmul)
+    cutlass_scaled_mm, per_token_group_quant_fp8, w8a8_triton_block_scaled_mm)
 from vllm.platforms import current_platform
 from vllm.utils import has_deep_gemm
 from vllm.utils.deep_gemm import (fp8_gemm_nt,
@@ -91,7 +91,8 @@ def test_w8a8_block_fp8_matmul(M, N, K, block_size, out_dtype, seed):
 
     ref_out = native_w8a8_block_matmul(A_fp8, B_fp8, As, Bs, block_size,
                                        out_dtype)
-    out = w8a8_block_fp8_matmul(A_fp8, B_fp8, As, Bs, block_size, out_dtype)
+    out = w8a8_triton_block_scaled_mm(A_fp8, B_fp8, As, Bs, block_size,
+                                      out_dtype)
 
     rel_diff = (torch.mean(
         torch.abs(out.to(torch.float32) - ref_out.to(torch.float32))) /
diff --git a/tests/kernels/quantization/test_fp8_quant_group.py b/tests/kernels/quantization/test_fp8_quant_group.py
index 720eee62760d..8f2bc6e3cee5 100644
--- a/tests/kernels/quantization/test_fp8_quant_group.py
+++ b/tests/kernels/quantization/test_fp8_quant_group.py
@@ -20,9 +20,11 @@
         (8, 513, 64),  # Non-divisible (native only)
     ])
 @pytest.mark.parametrize("seed", [42])
+@pytest.mark.parametrize("use_ue8m0", [True, False])
 @torch.inference_mode()
 def test_quantfp8_group_functionality(batch_size: int, hidden_dim: int,
-                                      group_size: int, seed: int) -> None:
+                                      group_size: int, seed: int,
+                                      use_ue8m0: bool) -> None:
     """Test QuantFP8 group quantization with various configurations.
 
     Tests both CUDA and native implementations, column-major scales,
@@ -38,7 +40,8 @@ def test_quantfp8_group_functionality(batch_size: int, hidden_dim: int,
     group_shape = GroupShape(1, group_size)
     quant_op = QuantFP8(static=False,
                         group_shape=group_shape,
-                        column_major_scales=False)
+                        column_major_scales=False,
+                        use_ue8m0=use_ue8m0)
 
     # 1. Test native implementation (always available)
     x_quant_native, scales_native = quant_op.forward_native(x.clone())
@@ -48,9 +51,15 @@ def test_quantfp8_group_functionality(batch_size: int, hidden_dim: int,
     # 2. Test column-major scales configuration
     quant_op_col = QuantFP8(static=False,
                             group_shape=group_shape,
-                            column_major_scales=True)
+                            column_major_scales=True,
+                            use_ue8m0=use_ue8m0)
     _, scales_col = quant_op_col.forward_native(x.clone())
-    assert scales_col.shape == (expected_num_groups, batch_size)
+    assert scales_col.shape == (batch_size, expected_num_groups)
+    assert scales_col.stride(0) == 1
+    assert scales_col.stride(1) == batch_size
+
+    # Test column-major scales consistency
+    assert torch.allclose(scales_col, scales_native, rtol=1e-9, atol=1e-8)
 
     # 3. Test CUDA implementation (only for divisible dimensions)
     if is_divisible:
@@ -68,21 +77,23 @@ def test_quantfp8_group_functionality(batch_size: int, hidden_dim: int,
 
 
 @pytest.mark.parametrize("seed", [42])
+@pytest.mark.parametrize("use_ue8m0", [True, False])
 @torch.inference_mode()
-def test_quantfp8_group_multidimensional(seed: int) -> None:
+def test_quantfp8_group_multidimensional(seed: int, use_ue8m0: bool) -> None:
     current_platform.seed_everything(seed)
 
     group_size = 64
 
     # Test with 3D input
-    batch1, batch2, hidden_dim = 4, 8, 512
+    batch1, batch2, hidden_dim = 4, 8, 1024
     x_3d = torch.randn(
         (batch1, batch2, hidden_dim), dtype=torch.bfloat16, device="cuda") * 8
 
     group_shape = GroupShape(1, group_size)
     quant_op = QuantFP8(static=False,
                         group_shape=group_shape,
-                        column_major_scales=False)
+                        column_major_scales=False,
+                        use_ue8m0=use_ue8m0)
 
     x_quant, scales = quant_op.forward_native(x_3d.clone())
     assert x_quant.shape == x_3d.shape
@@ -91,9 +102,10 @@ def test_quantfp8_group_multidimensional(seed: int) -> None:
     # Test column_major_scales with multi-dim
     quant_op_col = QuantFP8(static=False,
                             group_shape=group_shape,
-                            column_major_scales=True)
+                            column_major_scales=True,
+                            use_ue8m0=use_ue8m0)
     _, scales_col = quant_op_col.forward_native(x_3d.clone())
-    assert scales_col.shape == (batch1, hidden_dim // group_size, batch2)
+    assert scales_col.shape == (batch1, batch2, hidden_dim // group_size)
 
     # Test with 4D input
     batch1, batch2, batch3, hidden_dim = 2, 3, 4, 256
diff --git a/tests/model_executor/test_enabled_custom_ops.py b/tests/model_executor/test_enabled_custom_ops.py
index 92ce10a9efc0..200b6ecd5852 100644
--- a/tests/model_executor/test_enabled_custom_ops.py
+++ b/tests/model_executor/test_enabled_custom_ops.py
@@ -17,8 +17,6 @@
 from vllm.model_executor.layers.layernorm import (RMSNorm,
                                                   dispatch_rocm_rmsnorm_func,
                                                   fused_add_rms_norm, rms_norm)
-from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    cutlass_scaled_mm, dispatch_w8a8_blockscale_func, w8a8_block_fp8_matmul)
 from vllm.platforms import current_platform
 
 RMS_NORM_SUPPORTED_DTYPES = [torch.float16, torch.bfloat16]
@@ -111,34 +109,6 @@ def test_enabled_ops_invalid(env: str):
             RMSNorm(1024).enabled()
 
 
-@pytest.mark.skipif(
-    not current_platform.is_rocm() or not current_platform.is_fp8_fnuz(),
-    reason="AITER is a feature exclusive for ROCm and FP8_FNUZ")
-@pytest.mark.parametrize("use_cutlass", [True, False])
-@pytest.mark.parametrize("use_rocm_aiter", ["0", "1"])
-@pytest.mark.parametrize("use_rocm_aiter_gemm_w8a8_blockscale", ["0", "1"])
-def test_w8a8_blockscale_dispatch(use_cutlass: bool, use_rocm_aiter: str,
-                                  use_rocm_aiter_gemm_w8a8_blockscale: str,
-                                  monkeypatch):
-
-    monkeypatch.setenv("VLLM_ROCM_USE_AITER", use_rocm_aiter)
-    monkeypatch.setenv("VLLM_ROCM_USE_AITER_LINEAR",
-                       use_rocm_aiter_gemm_w8a8_blockscale)
-
-    use_aiter_and_is_supported = (bool(int(use_rocm_aiter)) and bool(
-        int(use_rocm_aiter_gemm_w8a8_blockscale)))
-    block_scale_func = dispatch_w8a8_blockscale_func(
-        use_cutlass, use_aiter_and_is_supported=use_aiter_and_is_supported)
-    if use_cutlass:
-        assert block_scale_func == cutlass_scaled_mm
-    elif current_platform.is_rocm() and int(use_rocm_aiter) and int(
-            use_rocm_aiter_gemm_w8a8_blockscale):
-        assert block_scale_func == (
-            torch.ops.vllm.rocm_aiter_gemm_w8a8_blockscale)
-    else:
-        assert block_scale_func == w8a8_block_fp8_matmul
-
-
 @pytest.mark.parametrize("use_rocm_aiter", ["0", "1"])
 def test_topk_dispatch(use_rocm_aiter: str, monkeypatch):
     monkeypatch.setenv("VLLM_ROCM_USE_AITER", use_rocm_aiter)
diff --git a/tests/quantization/test_compressed_tensors.py b/tests/quantization/test_compressed_tensors.py
index c0ab3fbb1062..af8c7ec3b482 100644
--- a/tests/quantization/test_compressed_tensors.py
+++ b/tests/quantization/test_compressed_tensors.py
@@ -18,6 +18,9 @@
     CompressedTensorsW4A16Fp4, CompressedTensorsW4A16Sparse24,
     CompressedTensorsW8A8Fp8, CompressedTensorsW8A8Int8,
     CompressedTensorsW8A16Fp8, CompressedTensorsWNA16)
+from vllm.model_executor.layers.quantization.input_quant_fp8 import QuantFP8
+from vllm.model_executor.layers.quantization.utils.fp8_utils import (
+    W8A8BlockFp8LinearOp)
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
     cutlass_fp4_supported)
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
@@ -742,3 +745,35 @@ def test_compressed_tensors_transforms_perplexity(vllm_runner, model, prompt,
         perplexity = llm.generate_prompt_perplexity([prompt])[0]
         print(perplexity)
         assert perplexity <= exp_perplexity
+
+
+def test_compressed_tensors_fp8_block_enabled(vllm_runner):
+    model_path = "RedHatAI/Qwen3-0.6B-FP8-BLOCK"
+    with vllm_runner(model_path) as llm:
+
+        fp8_dtype = current_platform.fp8_dtype()
+
+        def check_model(model):
+            layer = model.model.layers[0]
+
+            qkv_proj = layer.self_attn.qkv_proj
+            assert isinstance(qkv_proj.quant_method,
+                              CompressedTensorsLinearMethod)
+            assert isinstance(qkv_proj.scheme, CompressedTensorsW8A8Fp8)
+            assert isinstance(qkv_proj.scheme.w8a8_block_fp8_linear,
+                              W8A8BlockFp8LinearOp)
+
+            assert qkv_proj.weight.dtype is fp8_dtype
+            assert qkv_proj.weight_scale.dtype is torch.float32
+            assert len(qkv_proj.weight.shape) == 2
+            assert len(qkv_proj.weight_scale.shape) == 2
+
+            input_quant_op = \
+                qkv_proj.scheme.w8a8_block_fp8_linear.input_quant_op
+            assert isinstance(input_quant_op, QuantFP8)
+            assert input_quant_op._forward_method == input_quant_op.forward_cuda
+
+        llm.apply_model(check_model)
+
+        output = llm.generate_greedy("Hello my name is", max_tokens=20)
+        assert output
diff --git a/vllm/config/vllm.py b/vllm/config/vllm.py
index 107df502e08e..ac40b0fd4783 100644
--- a/vllm/config/vllm.py
+++ b/vllm/config/vllm.py
@@ -516,6 +516,23 @@ def __post_init__(self):
                     " by VLLM_DEBUG_DUMP_PATH to %s", env_path)
             self.compilation_config.debug_dump_path = env_path
 
+        def has_blocked_weights():
+            if self.quant_config is not None:
+                if hasattr(self.quant_config, "weight_block_size"):
+                    return self.quant_config.weight_block_size is not None
+                elif hasattr(self.quant_config, "has_blocked_weights"):
+                    return self.quant_config.has_blocked_weights()
+            return False
+
+        # Enable quant_fp8 CUDA ops (TODO disable in follow up)
+        # On H100 the CUDA kernel is faster than
+        # native implementation
+        # https://github.com/vllm-project/vllm/issues/25094
+        if has_blocked_weights():
+            custom_ops = self.compilation_config.custom_ops
+            if "none" not in custom_ops and "-quant_fp8" not in custom_ops:
+                custom_ops.append("+quant_fp8")
+
     def update_sizes_for_sequence_parallelism(self,
                                               possible_sizes: list) -> list:
         # remove the sizes that not multiple of tp_size when
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors.py b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors.py
index d6550dd16892..3f771ea2abd1 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors.py
@@ -644,6 +644,14 @@ def get_cache_scale(self, name: str) -> Optional[str]:
         # If no matches, return None
         return None
 
+    def has_blocked_weights(self) -> bool:
+        for scheme in self.target_scheme_map.values():
+            weight_quant = scheme.get("weights")
+            if (weight_quant is not None
+                    and weight_quant.strategy == QuantizationStrategy.BLOCK):
+                return True
+        return False
+
     @staticmethod
     def supports_cutlass_24(
             weight_quant: Optional[QuantizationArgs],
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py
index 5ad1b15b7ed5..4755c17c5967 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py
@@ -11,7 +11,7 @@
 from vllm.model_executor.layers.quantization.compressed_tensors.schemes import (
     CompressedTensorsScheme)
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    apply_fp8_block_linear, check_aiter_fp8_linear_support,
+    W8A8BlockFp8LinearOp, check_aiter_fp8_linear_support,
     create_fp8_input_scale, create_fp8_scale_parameter,
     create_fp8_weight_parameter, maybe_post_process_fp8_weight_block,
     process_fp8_weight_block_strategy, process_fp8_weight_channel_strategy,
@@ -41,16 +41,30 @@ def __init__(self, weight_quant: QuantizationArgs,
         self.strategy = weight_quant.strategy
         self.out_dtype = torch.get_default_dtype()
         self.is_static_input_scheme = is_static_input_scheme
-        self.act_q_group_shape = GroupShape.PER_TENSOR \
-            if is_static_input_scheme else GroupShape.PER_TOKEN
-        self.fp8_linear = Fp8LinearOp(
-            act_quant_static=self.is_static_input_scheme,
-            act_quant_group_shape=self.act_q_group_shape)
 
         self.weight_block_size = self.weight_quant.block_structure
+        if self.weight_block_size is not None:
+            self.act_q_group_shape = GroupShape(1, self.weight_block_size[0])
+        else:
+            self.act_q_group_shape = GroupShape.PER_TENSOR \
+                if is_static_input_scheme else GroupShape.PER_TOKEN
+
         self.cutlass_block_fp8_supported = cutlass_block_fp8_supported()
         self.use_aiter_and_is_supported = check_aiter_fp8_linear_support()
 
+        if self.weight_block_size is not None:
+            assert not self.is_static_input_scheme
+            self.w8a8_block_fp8_linear = W8A8BlockFp8LinearOp(
+                weight_group_shape=GroupShape(*self.weight_block_size),
+                act_quant_group_shape=self.act_q_group_shape,
+                cutlass_block_fp8_supported=self.cutlass_block_fp8_supported,
+                use_aiter_and_is_supported=self.use_aiter_and_is_supported,
+            )
+        else:
+            self.fp8_linear = Fp8LinearOp(
+                act_quant_static=self.is_static_input_scheme,
+                act_quant_group_shape=self.act_q_group_shape)
+
     @classmethod
     def get_min_capability(cls) -> int:
         # lovelace and up
@@ -142,13 +156,14 @@ def apply_weights(self,
                       x: torch.Tensor,
                       bias: Optional[torch.Tensor] = None) -> torch.Tensor:
 
-        if layer.weight_block_size is not None:
-            return apply_fp8_block_linear(
-                layer,
+        if self.weight_block_size is not None:
+            return self.w8a8_block_fp8_linear.apply(
                 input=x,
+                weight=layer.weight,
+                weight_scale=layer.weight_scale,
+                input_scale=layer.input_scale,
                 bias=bias,
-                cutlass_block_fp8_supported=self.cutlass_block_fp8_supported,
-                use_aiter_and_is_supported=self.use_aiter_and_is_supported)
+            )
 
         return self.fp8_linear.apply(input=x,
                                      weight=layer.weight,
diff --git a/vllm/model_executor/layers/quantization/fp8.py b/vllm/model_executor/layers/quantization/fp8.py
index 3ebb20de9996..9b7b3f18baa7 100644
--- a/vllm/model_executor/layers/quantization/fp8.py
+++ b/vllm/model_executor/layers/quantization/fp8.py
@@ -33,7 +33,7 @@
     register_moe_scaling_factors, rotate_flashinfer_fp8_moe_weights,
     select_cutlass_fp8_gemm_impl, swap_w13_to_w31)
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    apply_fp8_block_linear, check_aiter_fp8_linear_support,
+    W8A8BlockFp8LinearOp, check_aiter_fp8_linear_support,
     create_fp8_input_scale, create_fp8_scale_parameter,
     create_fp8_weight_parameter, expert_weight_is_col_major,
     maybe_post_process_fp8_weight_block, process_fp8_weight_block_strategy,
@@ -242,15 +242,28 @@ def __init__(self, quant_config: Fp8Config):
         self.weight_block_size = self.quant_config.weight_block_size
         self.block_quant = self.weight_block_size is not None
         self.act_q_static = self.quant_config.activation_scheme == "static"
-        # Use per-token quantization for better perf if dynamic and cutlass
-        if not self.act_q_static and cutlass_fp8_supported():
-            self.act_q_group_shape = GroupShape.PER_TOKEN
+        if self.weight_block_size:
+            self.act_q_group_shape = GroupShape(1, self.weight_block_size[0])
         else:
-            self.act_q_group_shape = GroupShape.PER_TENSOR
+            # Use per-token quantization for better perf if dynamic and cutlass
+            if not self.act_q_static and cutlass_fp8_supported():
+                self.act_q_group_shape = GroupShape.PER_TOKEN
+            else:
+                self.act_q_group_shape = GroupShape.PER_TENSOR
 
-        self.fp8_linear = Fp8LinearOp(
-            act_quant_static=self.act_q_static,
-            act_quant_group_shape=self.act_q_group_shape)
+        if self.block_quant:
+            assert not self.act_q_static
+            assert self.weight_block_size is not None
+            self.w8a8_block_fp8_linear = W8A8BlockFp8LinearOp(
+                weight_group_shape=GroupShape(*self.weight_block_size),
+                act_quant_group_shape=self.act_q_group_shape,
+                cutlass_block_fp8_supported=self.cutlass_block_fp8_supported,
+                use_aiter_and_is_supported=self.use_aiter_and_is_supported,
+            )
+        else:
+            self.fp8_linear = Fp8LinearOp(
+                act_quant_static=self.act_q_static,
+                act_quant_group_shape=self.act_q_group_shape)
 
     def create_weights(
         self,
@@ -399,12 +412,15 @@ def apply(self,
                 bias=bias)
 
         if self.block_quant:
-            return apply_fp8_block_linear(
-                layer,
+            assert self.weight_block_size is not None
+
+            return self.w8a8_block_fp8_linear.apply(
                 input=x,
+                weight=layer.weight,
+                weight_scale=layer.weight_scale,
+                input_scale=layer.input_scale,
                 bias=bias,
-                cutlass_block_fp8_supported=self.cutlass_block_fp8_supported,
-                use_aiter_and_is_supported=self.use_aiter_and_is_supported)
+            )
 
         return self.fp8_linear.apply(input=x,
                                      weight=layer.weight,
diff --git a/vllm/model_executor/layers/quantization/input_quant_fp8.py b/vllm/model_executor/layers/quantization/input_quant_fp8.py
index 31182f40b48f..ece3e5817116 100644
--- a/vllm/model_executor/layers/quantization/input_quant_fp8.py
+++ b/vllm/model_executor/layers/quantization/input_quant_fp8.py
@@ -27,11 +27,14 @@ class QuantFP8(CustomOp):
     This CustomOp supports both static and dynamic quantization.
     """
 
-    def __init__(self,
-                 static: bool,
-                 group_shape: GroupShape,
-                 num_token_padding: Optional[int] = None,
-                 column_major_scales: bool = False):
+    def __init__(
+            self,
+            static: bool,
+            group_shape: GroupShape,
+            num_token_padding: Optional[int] = None,
+            column_major_scales: bool = False,
+            use_ue8m0: Optional[bool] = None,  # for Torch compile
+    ):
         """
         :param static: static or dynamic quantization
         :param group_shape: quantization group shape (PER_TOKEN, PER_TENSOR,
@@ -46,6 +49,7 @@ def __init__(self,
         self.group_shape = group_shape
         self.num_token_padding = num_token_padding
         self.column_major_scales = column_major_scales
+        self.use_ue8m0 = use_ue8m0
 
         self.is_group_quant = group_shape.is_per_group()
         if self.is_group_quant:
@@ -70,7 +74,8 @@ def forward_cuda(
                 x,
                 group_size=self.group_size,
                 column_major_scales=self.column_major_scales,
-                dtype=_FP8_DTYPE)
+                dtype=_FP8_DTYPE,
+                use_ue8m0=self.use_ue8m0)
 
         assert (scale is not None) == self.static
         assert scale_ub is None or (not self.static and self.group_shape
@@ -137,7 +142,10 @@ def _quantize_group_native(
 
         x_grouped = x.view(-1, num_groups, self.group_size)
         absmax = x_grouped.abs().max(dim=-1, keepdim=True)[0].float()
-        scales = (absmax / _FP8_MAX).clamp(min=_FP8_MIN_SCALING_FACTOR)
+        scales_raw = absmax / _FP8_MAX
+        if self.use_ue8m0:
+            scales_raw = torch.exp2(torch.ceil(torch.log2(scales_raw)))
+        scales = (scales_raw).clamp(min=_FP8_MIN_SCALING_FACTOR)
 
         x_scaled = x_grouped / scales
         x_quant = x_scaled.clamp(_FP8_MIN, _FP8_MAX).to(_FP8_DTYPE)
@@ -151,6 +159,6 @@ def _quantize_group_native(
         scales = scales.reshape(orig_shape[:-1] + (num_groups, ))
 
         if self.column_major_scales:
-            scales = scales.transpose(-2, -1).contiguous()
+            scales = scales.transpose(-2, -1).contiguous().transpose(-1, -2)
 
         return x_quant, scales
diff --git a/vllm/model_executor/layers/quantization/utils/fp8_utils.py b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
index 828111dc299e..13bb69190eae 100644
--- a/vllm/model_executor/layers/quantization/utils/fp8_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
@@ -13,8 +13,9 @@
 import vllm.envs as envs
 from vllm import _custom_ops as ops
 from vllm.logger import init_logger
+from vllm.model_executor.layers.quantization.input_quant_fp8 import QuantFP8
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    group_broadcast)
+    GroupShape, group_broadcast)
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
     CUTLASS_BLOCK_FP8_SUPPORTED)
 from vllm.model_executor.parameter import (BlockQuantScaleParameter,
@@ -24,6 +25,7 @@
 from vllm.triton_utils import tl, triton
 from vllm.utils import direct_register_custom_op
 from vllm.utils.deep_gemm import (fp8_gemm_nt, is_deep_gemm_e8m0_used,
+                                  is_deep_gemm_supported,
                                   should_use_deepgemm_for_fp8_linear)
 
 logger = init_logger(__name__)
@@ -35,6 +37,8 @@ def is_fp8(x: Union[torch.dtype, torch.Tensor]) -> bool:
     return x == torch.float8_e4m3fn or x == torch.float8_e4m3fnuz
 
 
+# We need to pass in the is_hopper flag as argument because the function
+# current_platform.is_device_capability() is not supported by Torch compiler.
 def cutlass_scaled_mm(
     A: torch.Tensor,
     B: torch.Tensor,
@@ -42,15 +46,17 @@ def cutlass_scaled_mm(
     Bs: torch.Tensor,
     block_size: list[int],
     output_dtype: torch.dtype = torch.float16,
+    is_hopper: Optional[bool] = None,
 ) -> torch.Tensor:
+    if is_hopper is None:
+        is_hopper = current_platform.is_device_capability(90)
     return ops.cutlass_scaled_mm(
         A,
         B.T,
         out_dtype=output_dtype,
         scale_a=As,
         # SM90 block FP8 requires row-major scale_b, which we do ahead of time
-        scale_b=Bs if block_size is not None
-        and current_platform.is_device_capability(90) else Bs.T)
+        scale_b=Bs if block_size is not None and is_hopper else Bs.T)
 
 
 def rocm_aiter_gemm_w8a8_blockscale_impl(
@@ -96,115 +102,251 @@ def rocm_aiter_gemm_w8a8_blockscale_fake(
         aiter_per1x128_quant = get_hip_quant(rocm_aiter.QuantType.per_1x128)
 
 
-def dispatch_w8a8_blockscale_func(
-    use_cutlass: bool, use_aiter_and_is_supported: bool
-) -> Callable[[
-        torch.Tensor,
-        torch.Tensor,
-        torch.Tensor,
-        torch.Tensor,
-        list[int],
-        torch.dtype,
-], torch.Tensor]:
-    if use_cutlass:
-        return cutlass_scaled_mm
-    if (use_aiter_and_is_supported):
-        return torch.ops.vllm.rocm_aiter_gemm_w8a8_blockscale
-    return w8a8_block_fp8_matmul
+# TODO we should be able to change the type of block_size to GroupShape
+# after we resolve GroupShape compilation issue
+# https://github.com/vllm-project/vllm/issues/25270
+def _w8a8_triton_block_scaled_mm_func(
+    qx: torch.Tensor,
+    weight: torch.Tensor,
+    x_scale: torch.Tensor,
+    weight_scale: torch.Tensor,
+    block_size: list[int],
+    output_dtype: torch.dtype,
+) -> torch.Tensor:
+    return w8a8_triton_block_scaled_mm(qx, weight, x_scale, weight_scale,
+                                       block_size, output_dtype)
 
 
-# TODO fix ROCm->Triton custom path:
-#  https://github.com/vllm-project/vllm/issues/14397
-def apply_w8a8_block_fp8_linear(
-    input: torch.Tensor,
+def _w8a8_triton_block_scaled_mm_fake(
+    qx: torch.Tensor,
     weight: torch.Tensor,
-    block_size: list[int],
+    x_scale: torch.Tensor,
     weight_scale: torch.Tensor,
-    input_scale: Optional[torch.Tensor] = None,
-    bias: Optional[torch.Tensor] = None,
-    cutlass_block_fp8_supported: bool = CUTLASS_BLOCK_FP8_SUPPORTED,
-    use_aiter_and_is_supported: bool = False,
+    block_size: list[int],
+    output_dtype: torch.dtype,
 ) -> torch.Tensor:
-    assert input_scale is None
-    # View input as 2D matrix for fp8 methods
-    input_2d = input.view(-1, input.shape[-1])
-    output_shape = [*input.shape[:-1], weight.shape[0]]
-    output_dtype = input.dtype
+    return torch.empty((qx.size(0), weight.size(0)),
+                       dtype=output_dtype,
+                       device=qx.device)
 
-    if should_use_deepgemm_for_fp8_linear(output_dtype, weight):
 
-        input_2d = input.view(-1, input.shape[-1])
-        output_shape = [*input.shape[:-1], weight.shape[0]]
+direct_register_custom_op(
+    "w8a8_triton_block_scaled_mm_func",
+    _w8a8_triton_block_scaled_mm_func,
+    fake_impl=_w8a8_triton_block_scaled_mm_fake,
+)
 
-        q_input, x_scale = per_token_group_quant_fp8(
-            input_2d,
-            block_size[1],
-            column_major_scales=True,
-        )
-        output = torch.empty((q_input.shape[0], weight.shape[0]),
-                             dtype=torch.bfloat16,
-                             device=q_input.device)
-        fp8_gemm_nt((q_input, x_scale), (weight, weight_scale), output)
-        if bias is not None:
-            output += bias
-        return output.to(dtype=output_dtype).view(*output_shape)
-
-    w8a8_blockscale_func = dispatch_w8a8_blockscale_func(
-        cutlass_block_fp8_supported, use_aiter_and_is_supported)
-    if cutlass_block_fp8_supported:
-        num_pad = 0
-        if current_platform.is_device_capability(90):
-            # pad first dimension to be divisible by 4 due to
-            # cutlass blockwise gemm limitation for hopper
-            num_pad = 4 - (input_2d.shape[0] % 4)
-            if num_pad > 0:
-                input_2d = torch.nn.functional.pad(input_2d,
-                                                   (0, 0, 0, num_pad),
-                                                   "constant", 0)
-        q_input, x_scale = per_token_group_quant_fp8(input_2d,
-                                                     block_size[1],
-                                                     column_major_scales=True)
-        output = w8a8_blockscale_func(q_input, weight, x_scale, weight_scale,
-                                      block_size, input.dtype)
-        if num_pad > 0:
-            output = output[:-num_pad]
-    else:
-        if use_aiter_and_is_supported:
-            q_input, x_scale = aiter_per1x128_quant(
-                input_2d.contiguous(), quant_dtype=rocm_aiter.dtypes.fp8)
-        else:
-            q_input, x_scale = per_token_group_quant_fp8(
-                input_2d, block_size[1], column_major_scales=False)
 
-        output = w8a8_blockscale_func(q_input, weight, x_scale, weight_scale,
-                                      block_size, input.dtype)
+def _padded_cutlass(
+    qx: torch.Tensor,
+    weight: torch.Tensor,
+    x_scale: torch.Tensor,
+    weight_scale: torch.Tensor,
+    block_size: list[int],
+    output_dtype: torch.dtype,
+) -> torch.Tensor:
+    pad_multiple = 4
+    dim = qx.shape[0]
+    padded = dim if dim % pad_multiple == 0 else dim + pad_multiple - (
+        dim % pad_multiple)
 
-    if bias is not None:
-        output = output + bias
-    return output.to(dtype=input.dtype).view(*output_shape)
+    padded_shape = [padded, *qx.shape[1:]]
+    padded_qx = torch.zeros(padded_shape, device=qx.device, dtype=qx.dtype)
+    padded_qx[0:qx.shape[0], ...].copy_(qx)
 
+    padded_x_scale_shape = [*x_scale.shape[1:], padded]
+    padded_x_scale = torch.ones(padded_x_scale_shape,
+                                device=x_scale.device,
+                                dtype=x_scale.dtype).permute(-1, -2)
+    padded_x_scale[0:x_scale.shape[0], ...].copy_(x_scale)
 
-def apply_w8a8_block_fp8_linear_fake(
-    input: torch.Tensor,
+    output = cutlass_scaled_mm(padded_qx, weight, padded_x_scale, weight_scale,
+                               block_size, output_dtype, True)
+    return output[0:qx.shape[0], ...]
+
+
+def _padded_cutlass_fake(
+    qx: torch.Tensor,
     weight: torch.Tensor,
-    block_size: list[int],
+    x_scale: torch.Tensor,
     weight_scale: torch.Tensor,
-    input_scale: Optional[torch.Tensor] = None,
-    bias: Optional[torch.Tensor] = None,
-    cutlass_block_fp8_supported: bool = CUTLASS_BLOCK_FP8_SUPPORTED,
-    use_aiter_and_is_supported: bool = False,
+    block_size: list[int],
+    output_dtype: torch.dtype,
 ) -> torch.Tensor:
-    output_shape = [*input.shape[:-1], weight.shape[0]]
-    return torch.empty(output_shape, dtype=input.dtype, device=input.device)
+    return torch.empty((qx.size(0), weight.size(0)),
+                       dtype=output_dtype,
+                       device=qx.device)
 
 
-if not current_platform.is_cpu():
-    direct_register_custom_op(
-        op_name="apply_w8a8_block_fp8_linear",
-        op_func=apply_w8a8_block_fp8_linear,
-        mutates_args=[],
-        fake_impl=apply_w8a8_block_fp8_linear_fake,
-    )
+direct_register_custom_op(
+    "padded_cutlass",
+    _padded_cutlass,
+    fake_impl=_padded_cutlass_fake,
+)
+
+
+def _fp8_gemm_nt_op(q_input: torch.Tensor, input_scale: torch.Tensor,
+                    weight: torch.Tensor, weight_scale: torch.Tensor,
+                    output: torch.Tensor, use_deep_gemm_e8m0: bool) -> None:
+    fp8_gemm_nt((q_input, input_scale), (weight, weight_scale),
+                output,
+                is_deep_gemm_e8m0_used=use_deep_gemm_e8m0)
+
+
+def _fp8_gemm_nt_op_fake(q_input: torch.Tensor, input_scale: torch.Tensor,
+                         weight: torch.Tensor, weight_scale: torch.Tensor,
+                         output: torch.Tensor,
+                         use_deep_gemm_e8m0: bool) -> None:
+    return None
+
+
+direct_register_custom_op(
+    "fp8_gemm_nt_op",
+    _fp8_gemm_nt_op,
+    mutates_args=["output"],
+    fake_impl=_fp8_gemm_nt_op_fake,
+)
+
+
+# TODO fix ROCm->Triton custom path:
+#  https://github.com/vllm-project/vllm/issues/14397
+class W8A8BlockFp8LinearOp:
+    """
+    This class executes a Blocked FP8 linear layer using cutlass if supported
+    and torch.scaled_mm otherwise.
+    """
+
+    def __init__(
+        self,
+        weight_group_shape: GroupShape,
+        act_quant_group_shape: GroupShape,
+        cutlass_block_fp8_supported: bool = CUTLASS_BLOCK_FP8_SUPPORTED,
+        use_aiter_and_is_supported: bool = False,
+    ):
+        self.weight_group_shape = weight_group_shape
+        self.act_quant_group_shape = act_quant_group_shape
+        self.is_deep_gemm_supported = is_deep_gemm_supported()
+        self.is_hopper = current_platform.is_device_capability(90)
+        self.use_deep_gemm_e8m0 = is_deep_gemm_e8m0_used()
+
+        # Get the correct blockscale mul and input quant operations.
+        # We can't use _dispatch_w8a8_blockscale_op to figure out if we want
+        # to use deepgemm because we don't know the shape of weights (and
+        # whether deepgemm supports it) at the init time.
+        self.w8a8_blockscale_op, self.input_quant_op = \
+         self._dispatch_w8a8_blockscale_op(
+            cutlass_block_fp8_supported, use_aiter_and_is_supported)
+        self.deepgemm_input_quant_op = (QuantFP8(
+            False,
+            self.act_quant_group_shape,
+            column_major_scales=True,
+            use_ue8m0=self.use_deep_gemm_e8m0) if self.is_deep_gemm_supported
+                                        else None)
+
+    def apply(
+        self,
+        input: torch.Tensor,
+        weight: torch.Tensor,
+        weight_scale: torch.Tensor,
+        input_scale: Optional[torch.Tensor] = None,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
+        assert input_scale is None
+        # View input as 2D matrix for fp8 methods
+        input_2d = input.view(-1, input.shape[-1])
+        output_shape = [*input.shape[:-1], weight.shape[0]]
+        output_dtype = input.dtype
+
+        if should_use_deepgemm_for_fp8_linear(output_dtype, weight,
+                                              self.is_deep_gemm_supported):
+            output = self._run_deepgemm(input_2d, weight, weight_scale)
+        else:
+            output = self.w8a8_blockscale_op(input_2d, weight, weight_scale)
+
+        if bias is not None:
+            output = output + bias
+        return output.to(dtype=input.dtype).view(*output_shape)
+
+    def _run_deepgemm(
+        self,
+        input_2d: torch.Tensor,
+        weight: torch.Tensor,
+        weight_scale: torch.Tensor,
+    ) -> torch.Tensor:
+        assert self.deepgemm_input_quant_op is not None
+        q_input, input_scale = self.deepgemm_input_quant_op(input_2d)
+        output = torch.empty((q_input.shape[0], weight.shape[0]),
+                             dtype=torch.bfloat16,
+                             device=q_input.device)
+        torch.ops.vllm.fp8_gemm_nt_op(q_input, input_scale, weight,
+                                      weight_scale, output,
+                                      self.use_deep_gemm_e8m0)
+        return output
+
+    def _run_cutlass(
+        self,
+        input_2d: torch.Tensor,
+        weight: torch.Tensor,
+        weight_scale: torch.Tensor,
+    ) -> torch.Tensor:
+        assert self.input_quant_op is not None
+        q_input, input_scale = self.input_quant_op(input_2d)
+        if self.is_hopper:
+            return torch.ops.vllm.padded_cutlass(q_input, weight, input_scale,
+                                                 weight_scale,
+                                                 list(self.weight_group_shape),
+                                                 input_2d.dtype)
+        else:
+            return cutlass_scaled_mm(q_input, weight,
+                                     input_scale, weight_scale,
+                                     list(self.weight_group_shape),
+                                     input_2d.dtype, False)
+
+    def _run_aiter(
+        self,
+        input_2d: torch.Tensor,
+        weight: torch.Tensor,
+        weight_scale: torch.Tensor,
+    ) -> torch.Tensor:
+        assert self.act_quant_group_shape == GroupShape(1, 128)
+        q_input, input_scale = aiter_per1x128_quant(
+            input_2d.contiguous(), quant_dtype=rocm_aiter.dtypes.fp8)
+        return torch.ops.vllm.rocm_aiter_gemm_w8a8_blockscale(
+            q_input, weight, input_scale, weight_scale,
+            self.weight_group_shape, input_2d.dtype)
+
+    def _run_triton(
+        self,
+        input_2d: torch.Tensor,
+        weight: torch.Tensor,
+        weight_scale: torch.Tensor,
+    ) -> torch.Tensor:
+        assert self.input_quant_op is not None
+        q_input, input_scale = self.input_quant_op(input_2d)
+        return torch.ops.vllm.w8a8_triton_block_scaled_mm_func(
+            q_input, weight, input_scale, weight_scale,
+            self.weight_group_shape, input_2d.dtype)
+
+    def _dispatch_w8a8_blockscale_op(
+        self,
+        use_cutlass: bool,
+        use_aiter_and_is_supported: bool,
+    ) -> tuple[Callable[[
+            torch.Tensor,
+            torch.Tensor,
+            torch.Tensor,
+    ], torch.Tensor], Optional[QuantFP8]]:
+        if use_cutlass:
+            return self._run_cutlass, (QuantFP8(False,
+                                                self.act_quant_group_shape,
+                                                column_major_scales=True,
+                                                use_ue8m0=False))
+        if use_aiter_and_is_supported:
+            return self._run_aiter, None
+        return self._run_triton, (QuantFP8(False,
+                                           self.act_quant_group_shape,
+                                           column_major_scales=False,
+                                           use_ue8m0=False))
 
 
 def input_to_float8(
@@ -456,7 +598,7 @@ def per_token_group_quant_fp8(
 
 
 @triton.jit
-def _w8a8_block_fp8_matmul(
+def _w8a8_triton_block_scaled_mm(
     # Pointers to inputs and output
     A,
     B,
@@ -581,7 +723,7 @@ def get_w8a8_block_fp8_configs(N: int, K: int, block_n: int,
     return None
 
 
-def w8a8_block_fp8_matmul(
+def w8a8_triton_block_scaled_mm(
     A: torch.Tensor,
     B: torch.Tensor,
     As: torch.Tensor,
@@ -641,7 +783,7 @@ def grid(META):
         return (triton.cdiv(M, META["BLOCK_SIZE_M"]) *
                 triton.cdiv(N, META["BLOCK_SIZE_N"]), )
 
-    _w8a8_block_fp8_matmul[grid](
+    _w8a8_triton_block_scaled_mm[grid](
         A,
         B,
         C,
@@ -924,25 +1066,6 @@ def maybe_post_process_fp8_weight_block(layer: torch.nn.Module,
             layer.weight_scale.data.T.contiguous(), requires_grad=False)
 
 
-def apply_fp8_block_linear(layer: torch.nn.Module, input: torch.Tensor,
-                           bias: Optional[torch.Tensor],
-                           cutlass_block_fp8_supported: bool,
-                           use_aiter_and_is_supported: bool) -> torch.Tensor:
-    """Apply block-wise FP8 linear operation."""
-    assert layer.weight_block_size is not None
-
-    return torch.ops.vllm.apply_w8a8_block_fp8_linear(
-        input=input,
-        weight=layer.weight,
-        block_size=layer.weight_block_size,
-        weight_scale=layer.weight_scale,
-        input_scale=layer.input_scale,
-        bias=bias,
-        cutlass_block_fp8_supported=cutlass_block_fp8_supported,
-        use_aiter_and_is_supported=use_aiter_and_is_supported,
-    )
-
-
 def expert_weight_is_col_major(x: torch.Tensor) -> bool:
     assert x.dim() == 3
     b, m, n = x.shape
diff --git a/vllm/utils/deep_gemm.py b/vllm/utils/deep_gemm.py
index 4f05f0bc35cc..7e28d5e452af 100644
--- a/vllm/utils/deep_gemm.py
+++ b/vllm/utils/deep_gemm.py
@@ -9,7 +9,7 @@
 import functools
 import importlib
 import os
-from typing import Any, Callable, NoReturn
+from typing import Any, Callable, NoReturn, Optional
 
 import torch
 
@@ -136,9 +136,12 @@ def fp8_gemm_nt(*args, **kwargs):
     _lazy_init()
     if _fp8_gemm_nt_impl is None:
         return _missing(*args, **kwargs)
-    return _fp8_gemm_nt_impl(*args,
-                             disable_ue8m0_cast=not is_deep_gemm_e8m0_used(),
-                             **kwargs)
+    if "is_deep_gemm_e8m0_used" in kwargs:
+        use_ue8m0 = kwargs["is_deep_gemm_e8m0_used"]
+        del kwargs["is_deep_gemm_e8m0_used"]
+    else:
+        use_ue8m0 = is_deep_gemm_e8m0_used()
+    return _fp8_gemm_nt_impl(*args, disable_ue8m0_cast=not use_ue8m0, **kwargs)
 
 
 def m_grouped_fp8_gemm_nt_contiguous(*args, **kwargs):
@@ -301,9 +304,13 @@ def calc_diff(x: torch.Tensor, y: torch.Tensor):
     return 1 - sim
 
 
-def should_use_deepgemm_for_fp8_linear(output_dtype: torch.dtype,
-                                       weight: torch.Tensor):
-    return (is_deep_gemm_supported() and output_dtype == torch.bfloat16
+def should_use_deepgemm_for_fp8_linear(
+        output_dtype: torch.dtype,
+        weight: torch.Tensor,
+        supports_deep_gemm: Optional[bool] = None):
+    if supports_deep_gemm is None:
+        supports_deep_gemm = is_deep_gemm_supported()
+    return (supports_deep_gemm and output_dtype == torch.bfloat16
             and weight.shape[0] % 128 == 0 and weight.shape[1] % 128 == 0)
 
 
From 001a19c5a5a119af2eefc3cec8250dc35b71988c Mon Sep 17 00:00:00 2001
From: Matthew Bonanni <mbonanni@redhat.com>
Date: Thu, 2 Oct 2025 17:29:49 -0400
Subject: [PATCH 105/193] Fix MTP with deepep_low_latency (#25904)

Signed-off-by: Matthew Bonanni <mbonanni@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/layers/fused_moe/layer.py | 18 ++++++++++++++++--
 1 file changed, 16 insertions(+), 2 deletions(-)

diff --git a/vllm/model_executor/layers/fused_moe/layer.py b/vllm/model_executor/layers/fused_moe/layer.py
index 8de1d14d46b3..9a7ca7b6d124 100644
--- a/vllm/model_executor/layers/fused_moe/layer.py
+++ b/vllm/model_executor/layers/fused_moe/layer.py
@@ -1899,6 +1899,15 @@ def process_chunk(chunk_start, chunk_end, skip_result_store=False):
             staged_hidden_states.copy_(hidden_states, non_blocking=True)
             staged_router_logits.copy_(router_logits, non_blocking=True)
 
+            # If there are shared experts but we are not using a modular kernel,
+            # the shared experts must be called here
+            if (not isinstance(self.quant_method.fused_experts,
+                               FusedMoEModularKernel)
+                    and self.shared_experts is not None):
+                shared_output = self.shared_experts(staged_hidden_states)
+            else:
+                shared_output = None
+
             # Matrix multiply.
             final_hidden_states = self.quant_method.apply(
                 layer=self,
@@ -1922,8 +1931,13 @@ def process_chunk(chunk_start, chunk_end, skip_result_store=False):
                 logical_replica_count=self.logical_replica_count,
             )
 
-            assert self.shared_experts is None or isinstance(
-                final_hidden_states, tuple)
+            if shared_output is not None:
+                assert not isinstance(final_hidden_states, tuple)
+                assert self.shared_experts is not None
+                final_hidden_states = (
+                    shared_output,
+                    final_hidden_states,
+                )
 
             if self.zero_expert_num is not None and self.zero_expert_num > 0:
                 assert isinstance(final_hidden_states, tuple)

From 13dcdb5a66f65dda3072d422da40b5f8f3325469 Mon Sep 17 00:00:00 2001
From: Michael Goin <mgoin64@gmail.com>
Date: Thu, 2 Oct 2025 19:30:37 -0400
Subject: [PATCH 106/193] [Bugfix] Disable cascade attention with FlashInfer
 (#26130)

Signed-off-by: mgoin <mgoin64@gmail.com>
Signed-off-by: Michael Goin <mgoin64@gmail.com>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/v1/attention/backends/flashinfer.py | 5 +++--
 1 file changed, 3 insertions(+), 2 deletions(-)

diff --git a/vllm/v1/attention/backends/flashinfer.py b/vllm/v1/attention/backends/flashinfer.py
index 688e681f0591..15a252734d4d 100755
--- a/vllm/v1/attention/backends/flashinfer.py
+++ b/vllm/v1/attention/backends/flashinfer.py
@@ -29,7 +29,6 @@
                                    flashinfer_disable_q_quantization,
                                    supports_trtllm_attention,
                                    use_trtllm_attention)
-from vllm.v1.attention.backends.flash_attn import use_cascade_attention
 # yapf conflicts with isort for this block
 # yapf: disable
 from vllm.v1.attention.backends.utils import (AttentionCGSupport,
@@ -677,7 +676,9 @@ def use_cascade_attention(self, *args, **kwargs) -> bool:
             # TODO: The cascade wrapper currently does not support setting
             # kv cache dtype to something different from query dtype.
             return False
-        return use_cascade_attention(*args, **kwargs)
+        # TODO: Cascade attention doesn't work, disable it for now
+        # return use_cascade_attention(*args, **kwargs)
+        return False
 
 
 class FlashInferImpl(AttentionImpl):

From 5508cce6a48157d49152da2ffd8d1931be81ba98 Mon Sep 17 00:00:00 2001
From: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Date: Thu, 2 Oct 2025 22:02:26 -0400
Subject: [PATCH 107/193] [Log] Optimize DeepGEMM Missing Log (#26106)

Signed-off-by: yewentao256 <zhyanwentao@126.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/utils/deep_gemm.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/vllm/utils/deep_gemm.py b/vllm/utils/deep_gemm.py
index 7e28d5e452af..125508bc4a9f 100644
--- a/vllm/utils/deep_gemm.py
+++ b/vllm/utils/deep_gemm.py
@@ -68,8 +68,8 @@ def is_deep_gemm_e8m0_used() -> bool:
 def _missing(*_: Any, **__: Any) -> NoReturn:
     """Placeholder for unavailable DeepGEMM backend."""
     raise RuntimeError(
-        "DeepGEMM backend is not available. Please install the `deep_gemm` "
-        "package to enable FP8 kernels.")
+        "DeepGEMM backend is not available or outdated. Please install or "
+        "update the `deep_gemm` to a newer version to enable FP8 kernels.")
 
 
 _fp8_gemm_nt_impl: Callable[..., Any] | None = None

From 0b5de2106033b74634eeac8b34f2e00b1f3cad4b Mon Sep 17 00:00:00 2001
From: Ekagra Ranjan <3116519+ekagra-ranjan@users.noreply.github.com>
Date: Thu, 2 Oct 2025 22:55:24 -0400
Subject: [PATCH 108/193] [Bug][Benchmark] Fix duplicate req in oversampling
 (#26140)

Signed-off-by: Ekagra Ranjan <3116519+ekagra-ranjan@users.noreply.github.com>
Co-authored-by: Roger Wang <hey@rogerw.io>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/benchmarks/datasets.py | 16 +++++++++++-----
 1 file changed, 11 insertions(+), 5 deletions(-)

diff --git a/vllm/benchmarks/datasets.py b/vllm/benchmarks/datasets.py
index 62e5194504d7..bf0defc24542 100644
--- a/vllm/benchmarks/datasets.py
+++ b/vllm/benchmarks/datasets.py
@@ -235,16 +235,22 @@ def maybe_oversample_requests(
 
         if len(requests) < num_requests:
             random.seed(self.random_seed)
-            additional = deepcopy(
-                random.choices(requests, k=num_requests - len(requests))
-            )
-            for i in range(len(additional)):
-                req = additional[i]
+            needed = num_requests - len(requests)
+            additional = []
+            for i in range(needed):
+                req = deepcopy(random.choice(requests))
                 req.request_id = request_id_prefix + str(len(requests) + i)
+                additional.append(req)
             requests.extend(additional)
             logger.info("Oversampled requests to reach %d total samples.",
                         num_requests)
 
+        ids = [req.request_id for req in requests]
+        if len(ids) != len(set(ids)):
+            raise ValueError("Duplicate request_id found in the sampled "
+                             "requests. Please ensure that each request_id "
+                             "is unique.")
+
 
 # -----------------------------------------------------------------------------
 # Utility Functions and Global Caches

From 298e7306a9e3d585f13aeeb135cdfcdb9106650b Mon Sep 17 00:00:00 2001
From: Matthew Bonanni <mbonanni@redhat.com>
Date: Thu, 2 Oct 2025 23:32:24 -0400
Subject: [PATCH 109/193] [Attention] Move Backend enum into registry (#25893)

Signed-off-by: Matthew Bonanni <mbonanni@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/compile/test_full_graph.py              |  2 +-
 tests/compile/test_fusion_attn.py             |  4 +--
 tests/kernels/attention/test_mha_attn.py      |  3 +-
 tests/kernels/utils.py                        |  2 +-
 tests/v1/attention/test_attention_backends.py |  4 +--
 tests/v1/attention/test_mla_backends.py       |  4 +--
 tests/v1/attention/utils.py                   |  3 +-
 tests/v1/spec_decode/test_eagle.py            |  4 +--
 tests/v1/spec_decode/test_mtp.py              |  4 +--
 tests/v1/spec_decode/test_tree_attention.py   |  3 +-
 vllm/attention/backends/registry.py           | 27 ++++++++++++++++
 vllm/attention/layer.py                       |  3 +-
 vllm/attention/selector.py                    |  3 +-
 .../kv_connector/v1/nixl_connector.py         |  3 +-
 vllm/envs.py                                  |  5 +--
 vllm/model_executor/models/dots_ocr.py        |  2 +-
 vllm/model_executor/models/ernie45_vl.py      |  3 +-
 vllm/model_executor/models/glm4_1v.py         |  2 +-
 vllm/model_executor/models/keye.py            |  2 +-
 vllm/model_executor/models/qwen2_5_vl.py      |  2 +-
 vllm/model_executor/models/qwen2_vl.py        |  2 +-
 vllm/model_executor/models/qwen3_vl.py        |  2 +-
 vllm/model_executor/models/siglip2navit.py    |  2 +-
 vllm/model_executor/models/vision.py          |  3 +-
 vllm/platforms/__init__.py                    |  1 -
 vllm/platforms/cpu.py                         |  7 +++--
 vllm/platforms/cuda.py                        |  9 ++++--
 vllm/platforms/interface.py                   | 31 +++----------------
 vllm/platforms/rocm.py                        |  9 ++++--
 vllm/platforms/tpu.py                         |  7 +++--
 vllm/platforms/xpu.py                         |  7 +++--
 31 files changed, 99 insertions(+), 66 deletions(-)
 create mode 100644 vllm/attention/backends/registry.py

diff --git a/tests/compile/test_full_graph.py b/tests/compile/test_full_graph.py
index f9f146810924..3ecda1a8ec33 100644
--- a/tests/compile/test_full_graph.py
+++ b/tests/compile/test_full_graph.py
@@ -11,8 +11,8 @@
 import torch
 
 from tests.quantization.utils import is_quant_method_supported
-from tests.v1.attention.utils import _Backend
 from vllm import LLM, SamplingParams
+from vllm.attention.backends.registry import _Backend
 from vllm.attention.selector import global_force_attn_backend_context_manager
 from vllm.config import (CompilationConfig, CompilationLevel, CUDAGraphMode,
                          PassConfig)
diff --git a/tests/compile/test_fusion_attn.py b/tests/compile/test_fusion_attn.py
index eb8c49135428..077cf11d048a 100644
--- a/tests/compile/test_fusion_attn.py
+++ b/tests/compile/test_fusion_attn.py
@@ -8,11 +8,11 @@
 
 from tests.compile.backend import LazyInitPass, TestBackend
 from tests.models.utils import check_outputs_equal
-from tests.v1.attention.utils import (BatchSpec, _Backend,
-                                      create_common_attn_metadata)
+from tests.v1.attention.utils import BatchSpec, create_common_attn_metadata
 from vllm import LLM, SamplingParams
 from vllm._custom_ops import cutlass_scaled_fp4_mm, scaled_fp4_quant
 from vllm.attention import Attention, AttentionMetadata
+from vllm.attention.backends.registry import _Backend
 from vllm.attention.selector import global_force_attn_backend_context_manager
 from vllm.compilation.fusion import QUANT_OPS
 from vllm.compilation.fusion_attn import ATTN_OP, AttnFusionPass
diff --git a/tests/kernels/attention/test_mha_attn.py b/tests/kernels/attention/test_mha_attn.py
index d37b968ed979..cea08e19f52d 100644
--- a/tests/kernels/attention/test_mha_attn.py
+++ b/tests/kernels/attention/test_mha_attn.py
@@ -10,8 +10,9 @@
 import pytest
 import torch
 
+from vllm.attention.backends.registry import _Backend
 from vllm.attention.layer import MultiHeadAttention
-from vllm.attention.selector import _Backend, _cached_get_attn_backend
+from vllm.attention.selector import _cached_get_attn_backend
 from vllm.platforms import current_platform
 from vllm.platforms.cpu import CpuPlatform
 from vllm.platforms.cuda import CudaPlatform
diff --git a/tests/kernels/utils.py b/tests/kernels/utils.py
index 0fdaa600aefa..db6f29c28c95 100644
--- a/tests/kernels/utils.py
+++ b/tests/kernels/utils.py
@@ -15,10 +15,10 @@
 
 from tests.kernels.quant_utils import native_w8a8_block_matmul
 from vllm.attention import AttentionBackend, AttentionMetadata, AttentionType
+from vllm.attention.backends.registry import _Backend
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe.utils import (
     moe_kernel_quantize_input)
-from vllm.platforms.interface import _Backend
 from vllm.utils import (STR_BACKEND_ENV_VAR, STR_FLASH_ATTN_VAL,
                         STR_XFORMERS_ATTN_VAL, make_tensor_with_pad)
 
diff --git a/tests/v1/attention/test_attention_backends.py b/tests/v1/attention/test_attention_backends.py
index 6c17be759ab6..24cdd8afbb3b 100644
--- a/tests/v1/attention/test_attention_backends.py
+++ b/tests/v1/attention/test_attention_backends.py
@@ -8,11 +8,11 @@
 import torch
 from torch.nn.attention.flex_attention import create_block_mask, flex_attention
 
-from tests.v1.attention.utils import (BatchSpec, _Backend,
-                                      create_common_attn_metadata,
+from tests.v1.attention.utils import (BatchSpec, create_common_attn_metadata,
                                       create_standard_kv_cache_spec,
                                       create_vllm_config,
                                       get_attention_backend)
+from vllm.attention.backends.registry import _Backend
 from vllm.config import ModelConfig
 from vllm.platforms import current_platform
 from vllm.utils import STR_DTYPE_TO_TORCH_DTYPE, cdiv, is_torch_equal_or_newer
diff --git a/tests/v1/attention/test_mla_backends.py b/tests/v1/attention/test_mla_backends.py
index 228551573ba8..f2d0a5b2407a 100644
--- a/tests/v1/attention/test_mla_backends.py
+++ b/tests/v1/attention/test_mla_backends.py
@@ -6,12 +6,12 @@
 import pytest
 import torch
 
-from tests.v1.attention.utils import (BatchSpec, _Backend,
-                                      create_common_attn_metadata,
+from tests.v1.attention.utils import (BatchSpec, create_common_attn_metadata,
                                       create_standard_kv_cache_spec,
                                       create_vllm_config,
                                       get_attention_backend)
 from vllm import _custom_ops as ops
+from vllm.attention.backends.registry import _Backend
 from vllm.utils import STR_DTYPE_TO_TORCH_DTYPE, cdiv
 from vllm.v1.attention.backends.utils import CommonAttentionMetadata
 from vllm.v1.kv_cache_interface import FullAttentionSpec
diff --git a/tests/v1/attention/utils.py b/tests/v1/attention/utils.py
index adfe2b2db040..2bea45210ff3 100644
--- a/tests/v1/attention/utils.py
+++ b/tests/v1/attention/utils.py
@@ -8,10 +8,11 @@
 import pytest
 import torch
 
+from vllm.attention.backends.registry import _Backend
 from vllm.config import (CacheConfig, CompilationConfig, DeviceConfig,
                          LoadConfig, ModelConfig, ModelDType, ParallelConfig,
                          SchedulerConfig, VllmConfig)
-from vllm.platforms import _Backend, current_platform
+from vllm.platforms import current_platform
 from vllm.utils import resolve_obj_by_qualname
 from vllm.v1.attention.backends.utils import CommonAttentionMetadata
 from vllm.v1.kv_cache_interface import FullAttentionSpec
diff --git a/tests/v1/spec_decode/test_eagle.py b/tests/v1/spec_decode/test_eagle.py
index 49311c0005e7..938c6543e9b0 100644
--- a/tests/v1/spec_decode/test_eagle.py
+++ b/tests/v1/spec_decode/test_eagle.py
@@ -8,10 +8,10 @@
 import torch
 
 from tests.utils import get_attn_backend_list_based_on_platform
-from tests.v1.attention.utils import (BatchSpec, _Backend,
-                                      create_common_attn_metadata,
+from tests.v1.attention.utils import (BatchSpec, create_common_attn_metadata,
                                       create_standard_kv_cache_spec,
                                       get_attention_backend)
+from vllm.attention.backends.registry import _Backend
 from vllm.config import (CacheConfig, DeviceConfig, ModelConfig,
                          ParallelConfig, SchedulerConfig, SpeculativeConfig,
                          VllmConfig)
diff --git a/tests/v1/spec_decode/test_mtp.py b/tests/v1/spec_decode/test_mtp.py
index 5b9ccfc3f48b..dc4a56c66de6 100644
--- a/tests/v1/spec_decode/test_mtp.py
+++ b/tests/v1/spec_decode/test_mtp.py
@@ -6,10 +6,10 @@
 import pytest
 import torch
 
-from tests.v1.attention.utils import (BatchSpec, _Backend,
-                                      create_common_attn_metadata,
+from tests.v1.attention.utils import (BatchSpec, create_common_attn_metadata,
                                       create_standard_kv_cache_spec,
                                       get_attention_backend)
+from vllm.attention.backends.registry import _Backend
 from vllm.config import (CacheConfig, DeviceConfig, ModelConfig,
                          ParallelConfig, SchedulerConfig, SpeculativeConfig,
                          VllmConfig)
diff --git a/tests/v1/spec_decode/test_tree_attention.py b/tests/v1/spec_decode/test_tree_attention.py
index 51a737496dff..ebb9a3d97861 100644
--- a/tests/v1/spec_decode/test_tree_attention.py
+++ b/tests/v1/spec_decode/test_tree_attention.py
@@ -6,9 +6,10 @@
 
 import torch
 
-from tests.v1.attention.utils import (_Backend, create_standard_kv_cache_spec,
+from tests.v1.attention.utils import (create_standard_kv_cache_spec,
                                       create_vllm_config,
                                       get_attention_backend)
+from vllm.attention.backends.registry import _Backend
 from vllm.config import ParallelConfig, SpeculativeConfig
 from vllm.v1.attention.backends.utils import CommonAttentionMetadata
 
diff --git a/vllm/attention/backends/registry.py b/vllm/attention/backends/registry.py
new file mode 100644
index 000000000000..6377e8619b3c
--- /dev/null
+++ b/vllm/attention/backends/registry.py
@@ -0,0 +1,27 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+"""Attention backend registry"""
+
+import enum
+
+
+class _Backend(enum.Enum):
+    FLASH_ATTN = enum.auto()
+    TRITON_ATTN = enum.auto()
+    XFORMERS = enum.auto()
+    ROCM_FLASH = enum.auto()
+    ROCM_AITER_MLA = enum.auto()
+    ROCM_AITER_FA = enum.auto()  # used for ViT attn backend
+    TORCH_SDPA = enum.auto()
+    FLASHINFER = enum.auto()
+    FLASHINFER_MLA = enum.auto()
+    TRITON_MLA = enum.auto()
+    CUTLASS_MLA = enum.auto()
+    FLASHMLA = enum.auto()
+    FLASH_ATTN_MLA = enum.auto()
+    PALLAS = enum.auto()
+    IPEX = enum.auto()
+    NO_ATTENTION = enum.auto()
+    FLEX_ATTENTION = enum.auto()
+    TREE_ATTN = enum.auto()
+    ROCM_ATTN = enum.auto()
diff --git a/vllm/attention/layer.py b/vllm/attention/layer.py
index 4ce6a864d7ad..113602645e89 100644
--- a/vllm/attention/layer.py
+++ b/vllm/attention/layer.py
@@ -10,6 +10,7 @@
 import vllm.envs as envs
 from vllm.attention import AttentionType
 from vllm.attention.backends.abstract import AttentionBackend
+from vllm.attention.backends.registry import _Backend
 from vllm.attention.selector import backend_name_to_enum, get_attn_backend
 from vllm.attention.utils.kv_sharing_utils import validate_kv_sharing_target
 from vllm.config import CacheConfig, get_current_vllm_config
@@ -26,7 +27,7 @@
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
     GroupShape)
 from vllm.model_executor.models.vision import get_vit_attn_backend
-from vllm.platforms import _Backend, current_platform
+from vllm.platforms import current_platform
 from vllm.utils import GiB_bytes, direct_register_custom_op
 
 logger = init_logger(__name__)
diff --git a/vllm/attention/selector.py b/vllm/attention/selector.py
index 6f048e589f7f..d3214fecfa70 100644
--- a/vllm/attention/selector.py
+++ b/vllm/attention/selector.py
@@ -11,8 +11,9 @@
 
 import vllm.envs as envs
 from vllm.attention.backends.abstract import AttentionBackend
+from vllm.attention.backends.registry import _Backend
 from vllm.logger import init_logger
-from vllm.platforms import _Backend, current_platform
+from vllm.platforms import current_platform
 from vllm.utils import STR_BACKEND_ENV_VAR, resolve_obj_by_qualname
 
 logger = init_logger(__name__)
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
index 55d87ea994b5..4706c5130899 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
@@ -20,6 +20,7 @@
 import zmq
 
 from vllm import envs
+from vllm.attention.backends.registry import _Backend
 from vllm.attention.selector import backend_name_to_enum, get_attn_backend
 from vllm.config import VllmConfig
 from vllm.distributed.kv_transfer.kv_connector.v1.base import (
@@ -32,7 +33,7 @@
 from vllm.distributed.utils import divide
 from vllm.forward_context import ForwardContext
 from vllm.logger import init_logger
-from vllm.platforms import _Backend, current_platform
+from vllm.platforms import current_platform
 from vllm.utils import make_zmq_path, make_zmq_socket
 from vllm.v1.attention.backends.utils import get_kv_cache_layout
 from vllm.v1.core.sched.output import SchedulerOutput
diff --git a/vllm/envs.py b/vllm/envs.py
index 3d7d3c576dab..6dce4bd0f94e 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -619,8 +619,9 @@ def get_vllm_port() -> Optional[int]:
     # All possible options loaded dynamically from _Backend enum
     "VLLM_ATTENTION_BACKEND":
     env_with_choices("VLLM_ATTENTION_BACKEND", None,
-                     lambda: list(__import__('vllm.platforms.interface', \
-                        fromlist=['_Backend'])._Backend.__members__.keys())),
+                     lambda: list(__import__(
+                         'vllm.attention.backends.registry',
+                         fromlist=['_Backend'])._Backend.__members__.keys())),
 
     # If set, vllm will use flashinfer sampler
     "VLLM_USE_FLASHINFER_SAMPLER":
diff --git a/vllm/model_executor/models/dots_ocr.py b/vllm/model_executor/models/dots_ocr.py
index e68777aab6bf..2445f0d784f4 100644
--- a/vllm/model_executor/models/dots_ocr.py
+++ b/vllm/model_executor/models/dots_ocr.py
@@ -9,6 +9,7 @@
 from torch.nn import LayerNorm
 from transformers.models.qwen2_vl import Qwen2VLProcessor
 
+from vllm.attention.backends.registry import _Backend
 from vllm.attention.layer import check_upstream_fa_availability
 from vllm.config import VllmConfig
 from vllm.distributed import utils as dist_utils
@@ -38,7 +39,6 @@
 from vllm.model_executor.models.vision import get_vit_attn_backend
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import MultiModalDataDict
-from vllm.platforms import _Backend
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs.dotsocr import (DotsOCRConfig,
                                                      DotsVisionConfig)
diff --git a/vllm/model_executor/models/ernie45_vl.py b/vllm/model_executor/models/ernie45_vl.py
index c62658fa4c21..0b8e24407602 100644
--- a/vllm/model_executor/models/ernie45_vl.py
+++ b/vllm/model_executor/models/ernie45_vl.py
@@ -34,6 +34,7 @@
 from einops import rearrange, repeat
 from transformers import BatchFeature
 
+from vllm.attention.backends.registry import _Backend
 from vllm.attention.layer import check_upstream_fa_availability
 from vllm.config import VllmConfig
 from vllm.distributed import parallel_state
@@ -54,7 +55,7 @@
                                         BaseProcessingInfo, PromptReplacement,
                                         PromptUpdate)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
-from vllm.platforms import _Backend, current_platform
+from vllm.platforms import current_platform
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
diff --git a/vllm/model_executor/models/glm4_1v.py b/vllm/model_executor/models/glm4_1v.py
index 722f1e428be7..315a057e6a7d 100644
--- a/vllm/model_executor/models/glm4_1v.py
+++ b/vllm/model_executor/models/glm4_1v.py
@@ -46,6 +46,7 @@
     Glm4vVideoProcessor)
 from transformers.video_utils import VideoMetadata
 
+from vllm.attention.backends.registry import _Backend
 from vllm.attention.layer import check_upstream_fa_availability
 from vllm.config import VllmConfig
 from vllm.distributed import (get_tensor_model_parallel_world_size,
@@ -69,7 +70,6 @@
                                         BaseProcessingInfo, PromptReplacement,
                                         PromptUpdate, PromptUpdateDetails)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
-from vllm.platforms import _Backend
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
diff --git a/vllm/model_executor/models/keye.py b/vllm/model_executor/models/keye.py
index 10b5c45169f4..90de0582b94a 100644
--- a/vllm/model_executor/models/keye.py
+++ b/vllm/model_executor/models/keye.py
@@ -17,6 +17,7 @@
                                            BaseModelOutputWithPooling)
 from transformers.utils import torch_int
 
+from vllm.attention.backends.registry import _Backend
 from vllm.attention.layer import check_upstream_fa_availability
 from vllm.config import VllmConfig
 from vllm.distributed import get_tensor_model_parallel_world_size
@@ -39,7 +40,6 @@
                                         BaseProcessingInfo, PromptReplacement,
                                         PromptUpdate)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
-from vllm.platforms import _Backend
 from vllm.sequence import IntermediateTensors
 from vllm.utils import is_list_of
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
diff --git a/vllm/model_executor/models/qwen2_5_vl.py b/vllm/model_executor/models/qwen2_5_vl.py
index d6e0d5f00b1e..4f3915a37b24 100644
--- a/vllm/model_executor/models/qwen2_5_vl.py
+++ b/vllm/model_executor/models/qwen2_5_vl.py
@@ -38,6 +38,7 @@
 from transformers.models.qwen2_5_vl.configuration_qwen2_5_vl import (
     Qwen2_5_VLConfig, Qwen2_5_VLVisionConfig)
 
+from vllm.attention.backends.registry import _Backend
 from vllm.attention.layer import check_upstream_fa_availability
 from vllm.config import VllmConfig
 from vllm.distributed import parallel_state
@@ -62,7 +63,6 @@
 from vllm.multimodal.inputs import MultiModalFieldConfig, MultiModalKwargs
 from vllm.multimodal.parse import MultiModalDataItems
 from vllm.multimodal.processing import PromptReplacement, PromptUpdate
-from vllm.platforms import _Backend
 from vllm.sequence import IntermediateTensors
 from vllm.utils import is_pin_memory_available
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
diff --git a/vllm/model_executor/models/qwen2_vl.py b/vllm/model_executor/models/qwen2_vl.py
index 38435a69444e..2ff79765d4be 100644
--- a/vllm/model_executor/models/qwen2_vl.py
+++ b/vllm/model_executor/models/qwen2_vl.py
@@ -41,6 +41,7 @@
 from transformers.models.qwen2_vl.video_processing_qwen2_vl import (
     Qwen2VLVideoProcessor)
 
+from vllm.attention.backends.registry import _Backend
 from vllm.attention.layer import check_upstream_fa_availability
 from vllm.config import VllmConfig
 from vllm.distributed import parallel_state, tensor_model_parallel_all_gather
@@ -65,7 +66,6 @@
                                         BaseProcessingInfo, PromptReplacement,
                                         PromptUpdate)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
-from vllm.platforms import _Backend
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
diff --git a/vllm/model_executor/models/qwen3_vl.py b/vllm/model_executor/models/qwen3_vl.py
index 00de89811cc7..fc8557131c3e 100644
--- a/vllm/model_executor/models/qwen3_vl.py
+++ b/vllm/model_executor/models/qwen3_vl.py
@@ -43,6 +43,7 @@
     smart_resize as video_smart_resize)
 from transformers.video_utils import VideoMetadata
 
+from vllm.attention.backends.registry import _Backend
 from vllm.attention.layer import check_upstream_fa_availability
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import VllmConfig
@@ -66,7 +67,6 @@
                                         PromptReplacement, PromptUpdate,
                                         PromptUpdateDetails)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
-from vllm.platforms import _Backend
 from vllm.sequence import IntermediateTensors
 from vllm.utils import is_list_of
 
diff --git a/vllm/model_executor/models/siglip2navit.py b/vllm/model_executor/models/siglip2navit.py
index 18de4b576c49..d111a10809e7 100644
--- a/vllm/model_executor/models/siglip2navit.py
+++ b/vllm/model_executor/models/siglip2navit.py
@@ -13,6 +13,7 @@
 from transformers import Siglip2VisionConfig
 from transformers.configuration_utils import PretrainedConfig
 
+from vllm.attention.backends.registry import _Backend
 from vllm.attention.layer import check_upstream_fa_availability
 from vllm.distributed import divide, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
@@ -22,7 +23,6 @@
                                                RowParallelLinear)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
-from vllm.platforms import _Backend
 
 from .vision import get_vit_attn_backend
 
diff --git a/vllm/model_executor/models/vision.py b/vllm/model_executor/models/vision.py
index 3d16d71e1764..2636942580fa 100644
--- a/vllm/model_executor/models/vision.py
+++ b/vllm/model_executor/models/vision.py
@@ -10,11 +10,12 @@
 import torch
 from transformers import PretrainedConfig
 
+from vllm.attention.backends.registry import _Backend
 from vllm.distributed import (get_tensor_model_parallel_rank,
                               get_tensor_model_parallel_world_size,
                               tensor_model_parallel_all_gather)
 from vllm.logger import init_logger
-from vllm.platforms import _Backend, current_platform
+from vllm.platforms import current_platform
 
 logger = init_logger(__name__)
 
diff --git a/vllm/platforms/__init__.py b/vllm/platforms/__init__.py
index 9b64817da648..7549de480ee6 100644
--- a/vllm/platforms/__init__.py
+++ b/vllm/platforms/__init__.py
@@ -9,7 +9,6 @@
 from vllm.plugins import load_plugins_by_group
 from vllm.utils import resolve_obj_by_qualname, supports_xccl
 
-from .interface import _Backend  # noqa: F401
 from .interface import CpuArchEnum, Platform, PlatformEnum
 
 logger = logging.getLogger(__name__)
diff --git a/vllm/platforms/cpu.py b/vllm/platforms/cpu.py
index 0b26446a87d8..436e295e58e6 100644
--- a/vllm/platforms/cpu.py
+++ b/vllm/platforms/cpu.py
@@ -15,13 +15,15 @@
 from vllm.logger import init_logger
 from vllm.utils import DEFAULT_MAX_NUM_BATCHED_TOKENS
 
-from .interface import CpuArchEnum, Platform, PlatformEnum, _Backend
+from .interface import CpuArchEnum, Platform, PlatformEnum
 
 logger = init_logger(__name__)
 
 if TYPE_CHECKING:
+    from vllm.attention.backends.registry import _Backend
     from vllm.config import VllmConfig
 else:
+    _Backend = None
     VllmConfig = None
 
 
@@ -90,10 +92,11 @@ def get_device_name(cls, device_id: int = 0) -> str:
         return "cpu"
 
     @classmethod
-    def get_attn_backend_cls(cls, selected_backend: _Backend, head_size: int,
+    def get_attn_backend_cls(cls, selected_backend: "_Backend", head_size: int,
                              dtype: torch.dtype, kv_cache_dtype: Optional[str],
                              block_size: int, use_v1: bool, use_mla: bool,
                              has_sink: bool, use_sparse: bool) -> str:
+        from vllm.attention.backends.registry import _Backend
         if selected_backend and selected_backend != _Backend.TORCH_SDPA:
             logger.info("Cannot use %s backend on CPU.", selected_backend)
         if use_mla:
diff --git a/vllm/platforms/cuda.py b/vllm/platforms/cuda.py
index a9a8d9ea2625..b7baa614957e 100644
--- a/vllm/platforms/cuda.py
+++ b/vllm/platforms/cuda.py
@@ -20,10 +20,13 @@
 from vllm.logger import init_logger
 from vllm.utils import cuda_device_count_stateless, import_pynvml
 
-from .interface import DeviceCapability, Platform, PlatformEnum, _Backend
+from .interface import DeviceCapability, Platform, PlatformEnum
 
 if TYPE_CHECKING:
+    from vllm.attention.backends.registry import _Backend
     from vllm.config import ModelConfig, VllmConfig
+else:
+    _Backend = None
 
 logger = init_logger(__name__)
 
@@ -202,7 +205,8 @@ def get_current_memory_usage(cls,
 
     @classmethod
     def get_vit_attn_backend(cls, head_size: int,
-                             dtype: torch.dtype) -> _Backend:
+                             dtype: torch.dtype) -> "_Backend":
+        from vllm.attention.backends.registry import _Backend
 
         # For Blackwell GPUs, force TORCH_SDPA for now.
         # See https://github.com/facebookresearch/xformers/issues/1317#issuecomment-3199392579 # noqa: E501
@@ -230,6 +234,7 @@ def get_vit_attn_backend(cls, head_size: int,
     def get_attn_backend_cls(cls, selected_backend, head_size, dtype,
                              kv_cache_dtype, block_size, use_v1, use_mla,
                              has_sink, use_sparse) -> str:
+        from vllm.attention.backends.registry import _Backend
         if use_mla:
             if not use_v1:
                 raise RuntimeError(
diff --git a/vllm/platforms/interface.py b/vllm/platforms/interface.py
index 1691ad62650b..df1395fa842a 100644
--- a/vllm/platforms/interface.py
+++ b/vllm/platforms/interface.py
@@ -17,12 +17,14 @@
 from vllm.logger import init_logger
 
 if TYPE_CHECKING:
+    from vllm.attention.backends.registry import _Backend
     from vllm.config import ModelConfig, VllmConfig
     from vllm.lora.request import LoRARequest
     from vllm.pooling_params import PoolingParams
     from vllm.sampling_params import SamplingParams
     from vllm.utils import FlexibleArgumentParser
 else:
+    _Backend = None
     ModelConfig = None
     VllmConfig = None
     LoRARequest = None
@@ -38,30 +40,6 @@ def in_wsl() -> bool:
     return "microsoft" in " ".join(uname()).lower()
 
 
-class _Backend(enum.Enum):
-    FLASH_ATTN = enum.auto()
-    TRITON_ATTN = enum.auto()
-    XFORMERS = enum.auto()
-    ROCM_FLASH = enum.auto()
-    ROCM_AITER_MLA = enum.auto()  # Supported by V1
-    ROCM_AITER_FA = enum.auto()  # used for ViT attn backend
-    TORCH_SDPA = enum.auto()
-    FLASHINFER = enum.auto()
-    FLASHINFER_MLA = enum.auto()
-    TRITON_MLA = enum.auto()  # Supported by V1
-    CUTLASS_MLA = enum.auto()
-    FLASHMLA = enum.auto()  # Supported by V1
-    FLASH_ATTN_MLA = enum.auto()  # Supported by V1
-    PALLAS = enum.auto()
-    IPEX = enum.auto()
-    DUAL_CHUNK_FLASH_ATTN = enum.auto()
-    DIFFERENTIAL_FLASH_ATTN = enum.auto()
-    NO_ATTENTION = enum.auto()
-    FLEX_ATTENTION = enum.auto()
-    TREE_ATTN = enum.auto()
-    ROCM_ATTN = enum.auto()
-
-
 class PlatformEnum(enum.Enum):
     CUDA = enum.auto()
     ROCM = enum.auto()
@@ -187,11 +165,12 @@ def device_id_to_physical_device_id(cls, device_id: int):
 
     @classmethod
     def get_vit_attn_backend(cls, head_size: int,
-                             dtype: torch.dtype) -> _Backend:
+                             dtype: torch.dtype) -> "_Backend":
+        from vllm.attention.backends.registry import _Backend
         return _Backend.TORCH_SDPA
 
     @classmethod
-    def get_attn_backend_cls(cls, selected_backend: _Backend, head_size: int,
+    def get_attn_backend_cls(cls, selected_backend: "_Backend", head_size: int,
                              dtype: torch.dtype, kv_cache_dtype: Optional[str],
                              block_size: int, use_v1: bool, use_mla: bool,
                              has_sink: bool, use_sparse: bool) -> str:
diff --git a/vllm/platforms/rocm.py b/vllm/platforms/rocm.py
index 14762f1b7094..e12967ad2587 100644
--- a/vllm/platforms/rocm.py
+++ b/vllm/platforms/rocm.py
@@ -14,10 +14,13 @@
 from vllm.logger import init_logger
 from vllm.utils import cuda_device_count_stateless
 
-from .interface import DeviceCapability, Platform, PlatformEnum, _Backend
+from .interface import DeviceCapability, Platform, PlatformEnum
 
 if TYPE_CHECKING:
+    from vllm.attention.backends.registry import _Backend
     from vllm.config import ModelConfig, VllmConfig
+else:
+    _Backend = None
 
 logger = init_logger(__name__)
 
@@ -182,7 +185,8 @@ class RocmPlatform(Platform):
 
     @classmethod
     def get_vit_attn_backend(cls, head_size: int,
-                             dtype: torch.dtype) -> _Backend:
+                             dtype: torch.dtype) -> "_Backend":
+        from vllm.attention.backends.registry import _Backend
         if (envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_MHA
                 and on_gfx9()):
             # Note: AITER FA is only supported for Qwen-VL models.
@@ -196,6 +200,7 @@ def get_vit_attn_backend(cls, head_size: int,
     def get_attn_backend_cls(cls, selected_backend, head_size, dtype,
                              kv_cache_dtype, block_size, use_v1, use_mla,
                              has_sink, use_sparse) -> str:
+        from vllm.attention.backends.registry import _Backend
         if use_sparse:
             raise NotImplementedError(
                 "Sparse Attention is not supported on ROCm.")
diff --git a/vllm/platforms/tpu.py b/vllm/platforms/tpu.py
index 4a4931f7f009..91a01a4f4ee9 100644
--- a/vllm/platforms/tpu.py
+++ b/vllm/platforms/tpu.py
@@ -11,9 +11,10 @@
 from vllm.sampling_params import SamplingParams, SamplingType
 from vllm.utils import DEFAULT_MAX_NUM_BATCHED_TOKENS
 
-from .interface import Platform, PlatformEnum, _Backend
+from .interface import Platform, PlatformEnum
 
 if TYPE_CHECKING:
+    from vllm.attention.backends.registry import _Backend
     from vllm.config import BlockSize, ModelConfig, VllmConfig
     from vllm.pooling_params import PoolingParams
 else:
@@ -21,6 +22,7 @@
     ModelConfig = None
     VllmConfig = None
     PoolingParams = None
+    _Backend = None
 
 logger = init_logger(__name__)
 
@@ -46,10 +48,11 @@ class TpuPlatform(Platform):
     ]
 
     @classmethod
-    def get_attn_backend_cls(cls, selected_backend: _Backend, head_size: int,
+    def get_attn_backend_cls(cls, selected_backend: "_Backend", head_size: int,
                              dtype: torch.dtype, kv_cache_dtype: Optional[str],
                              block_size: int, use_v1: bool, use_mla: bool,
                              has_sink, use_sparse) -> str:
+        from vllm.attention.backends.registry import _Backend
         if use_sparse:
             raise NotImplementedError(
                 "Sparse Attention is not supported on TPU.")
diff --git a/vllm/platforms/xpu.py b/vllm/platforms/xpu.py
index 12d6a2a2d1ba..3ccbae58726f 100644
--- a/vllm/platforms/xpu.py
+++ b/vllm/platforms/xpu.py
@@ -10,13 +10,15 @@
 from vllm.logger import init_logger
 from vllm.utils import DEFAULT_MAX_NUM_BATCHED_TOKENS
 
-from .interface import DeviceCapability, Platform, PlatformEnum, _Backend
+from .interface import DeviceCapability, Platform, PlatformEnum
 
 if TYPE_CHECKING:
+    from vllm.attention.backends.registry import _Backend
     from vllm.config import ModelConfig, VllmConfig
 else:
     ModelConfig = None
     VllmConfig = None
+    _Backend = None
 
 logger = init_logger(__name__)
 
@@ -33,10 +35,11 @@ class XPUPlatform(Platform):
     device_control_env_var: str = "ZE_AFFINITY_MASK"
 
     @classmethod
-    def get_attn_backend_cls(cls, selected_backend: _Backend, head_size: int,
+    def get_attn_backend_cls(cls, selected_backend: "_Backend", head_size: int,
                              dtype: torch.dtype, kv_cache_dtype: Optional[str],
                              block_size: int, use_v1: bool, use_mla: bool,
                              has_sink: bool, use_sparse) -> str:
+        from vllm.attention.backends.registry import _Backend
         if use_sparse:
             raise NotImplementedError(
                 "Sparse Attention is not supported on XPU.")

From c2a2acd5418c47e191c45def6fe4149343a5c03e Mon Sep 17 00:00:00 2001
From: Michael Goin <mgoin64@gmail.com>
Date: Thu, 2 Oct 2025 23:32:38 -0400
Subject: [PATCH 110/193] [CI/Build] Conditionally register
 cutlass_fp4_group_mm to fix building on Hopper (#26138)

Signed-off-by: mgoin <mgoin64@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 csrc/quantization/fp4/nvfp4_blockwise_moe_kernel.cu | 6 ++++++
 csrc/torch_bindings.cpp                             | 2 +-
 2 files changed, 7 insertions(+), 1 deletion(-)

diff --git a/csrc/quantization/fp4/nvfp4_blockwise_moe_kernel.cu b/csrc/quantization/fp4/nvfp4_blockwise_moe_kernel.cu
index 2c8df6144bf4..5b007e5ea328 100644
--- a/csrc/quantization/fp4/nvfp4_blockwise_moe_kernel.cu
+++ b/csrc/quantization/fp4/nvfp4_blockwise_moe_kernel.cu
@@ -14,6 +14,8 @@
  * limitations under the License.
  */
 
+#include "core/registration.h"
+
 #include <torch/all.h>
 #include <cutlass/arch/arch.h>
 
@@ -418,3 +420,7 @@ void cutlass_fp4_group_mm(
       "12.8 or above.");
 #endif
 }
+
+TORCH_LIBRARY_IMPL_EXPAND(TORCH_EXTENSION_NAME, CUDA, m) {
+  m.impl("cutlass_fp4_group_mm", &cutlass_fp4_group_mm);
+}
diff --git a/csrc/torch_bindings.cpp b/csrc/torch_bindings.cpp
index ebd28e735088..64a345eb66cc 100644
--- a/csrc/torch_bindings.cpp
+++ b/csrc/torch_bindings.cpp
@@ -397,7 +397,7 @@ TORCH_LIBRARY_EXPAND(TORCH_EXTENSION_NAME, ops) {
       " Tensor a_blockscale, Tensor b_blockscales, Tensor alphas,"
       " Tensor problem_sizes, Tensor expert_offsets, Tensor sf_offsets) -> ()",
       {stride_tag});
-  ops.impl("cutlass_fp4_group_mm", torch::kCUDA, &cutlass_fp4_group_mm);
+  // conditionally compiled so impl registration is in source file
 
   // CUTLASS w8a8 GEMM, supporting symmetric per-tensor or per-row/column
   // quantization, as well as bias

From 88fb7b4ef4bcabee2a6f2caef6018f0a045f919d Mon Sep 17 00:00:00 2001
From: Matthew Bonanni <mbonanni@redhat.com>
Date: Thu, 2 Oct 2025 23:35:47 -0400
Subject: [PATCH 111/193] [DeepSeek] Improve performance of DS MLA cache kernel
 (#26132)

Signed-off-by: Matthew Bonanni <mbonanni@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 csrc/cache_kernels.cu | 130 ++++++++++++++++++++----------------------
 1 file changed, 62 insertions(+), 68 deletions(-)

diff --git a/csrc/cache_kernels.cu b/csrc/cache_kernels.cu
index 1286f5806d4b..c7eeef8bfa3a 100644
--- a/csrc/cache_kernels.cu
+++ b/csrc/cache_kernels.cu
@@ -16,7 +16,6 @@
 
 #include <algorithm>
 #include <cassert>
-#include <cfloat>  // FLT_MIN
 #include <map>
 #include <vector>
 
@@ -424,84 +423,80 @@ __global__ void concat_and_cache_ds_mla_kernel(
   const int64_t dst_idx_start =
       block_idx * block_stride + block_offset * entry_stride;
 
-  // Create 4 tile scales in shared memory
-  __shared__ float smem[20];
-  float* shard_abs_max = smem;
-  float* tile_scales = smem + 16;
-
-  // For the NoPE part, each tile of 128 elements is handled by 4 warps
-  // (128 threads). There are 4 total tiles, so 16 warps (512 threads).
-  // The first thread of the first warp in each tile writes the scale
-  // value for the tile. The RoPE part (last 64 elements) is handled
-  // by another 2 warps (64 threads).
-  // So in total, we use 18 warps (576 threads) per block.
+  // For the NoPE part, each tile of 128 elements is handled by half of one warp
+  // (16 threads). There are 4 total tiles, so 2 warps (64 threads).
+  // Lanes 0 and 16 of each warp write the scale values for that warp's tiles.
+  // The RoPE part (last 64 elements) is handled by another 1 warp (32 threads).
+  // So in total, we use 3 warps (96 threads) per block.
 
   // Cast kv_cache to 16_bit for RoPE values
   scalar_t* kv_cache_16bit =
       reinterpret_cast<scalar_t*>(&kv_cache[dst_idx_start]);
 
-  // The last 64 threads handle the RoPE part
-  if (threadIdx.x >= kv_lora_rank) {
-    const int8_t pe_idx = threadIdx.x - kv_lora_rank;
-    const int64_t src_idx = token_idx * k_pe_stride + pe_idx;
+  // The last warp handles the RoPE part
+  if (threadIdx.x >= 64) {
+    // Each thread handles two elements of RoPE
+    const int8_t pe_idx_start = (threadIdx.x - 64) * 2;
+    const int64_t src_idx = token_idx * k_pe_stride + pe_idx_start;
+    // Vectorized load of two 16-bit values, performed as one 32-bit load
+    const int32_t vals = *reinterpret_cast<const int32_t*>(&k_pe[src_idx]);
     // RoPE values start after the packed 8-bit NoPE values and the
     // 32-bit scales
-    const int64_t dst_idx = kv_lora_rank / 2 + 8 + pe_idx;
-    kv_cache_16bit[dst_idx] = k_pe[src_idx];
+    const int64_t dst_idx = kv_lora_rank / 2 + 8 + pe_idx_start;
+    // Vectorized store of two 16-bit values, performed as one 32-bit store
+    *reinterpret_cast<int32_t*>(&kv_cache_16bit[dst_idx]) = vals;
     return;
   }
 
-  // Determine the scale for each chunk of NoPE
-  const int16_t tile_idx = threadIdx.x >> 7;
-  const int16_t warp_idx = (threadIdx.x & 127) >> 5;
-  const int16_t lane_idx = threadIdx.x & 31;
-
-  // Load the NoPE element for this thread into registers
-  const int64_t src_idx = token_idx * kv_c_stride + threadIdx.x;
-  const scalar_t src_val = kv_c[src_idx];
-
-  // Warp-level reduction to find the max absolute value in the warp
-  float max_abs = fabsf(src_val);
+  // The first two warps handle the NoPE part
+  const int8_t warp_idx = threadIdx.x >> 5;
+  const int8_t lane_idx = threadIdx.x & 31;
+  const int8_t tile_idx = warp_idx * 2 + (lane_idx >> 4);
+
+  // Each thread handles 8 elements of NoPE
+  // Load the NoPE elements for this thread into registers
+  const int64_t src_idx_start = token_idx * kv_c_stride + (threadIdx.x * 8);
+  // Vectorized load of eight 16-bit values, performed as an int4 load
+  const int4 vals_i4 = *reinterpret_cast<const int4*>(&kv_c[src_idx_start]);
+  const scalar_t* vals = reinterpret_cast<const scalar_t*>(&vals_i4);
+
+  // Max absolute value of this thread's elements
+  float max_abs = fmaxf(fmaxf(fmaxf(fabsf(vals[0]), fabsf(vals[1])),
+                              fmaxf(fabsf(vals[2]), fabsf(vals[3]))),
+                        fmaxf(fmaxf(fabsf(vals[4]), fabsf(vals[5])),
+                              fmaxf(fabsf(vals[6]), fabsf(vals[7]))));
+
+  // Warp-level reduction to find the max absolute value in each half-warp
 #pragma unroll
-  for (int offset = 16; offset > 0; offset /= 2) {
-#ifdef USE_ROCM
-    max_abs = fmaxf(max_abs, __shfl_down_sync(UINT64_MAX, max_abs, offset));
-#else
-    max_abs = fmaxf(max_abs, __shfl_down_sync(0xFFFFFFFF, max_abs, offset));
-#endif
+  for (int offset = 8; offset > 0; offset /= 2) {
+    max_abs = fmaxf(max_abs, VLLM_SHFL_XOR_SYNC_WIDTH(max_abs, offset, 16));
   }
 
-  // The first lane of each warp in each tile writes the max_abs of this part
-  // of the tile to shared memory
-  if (lane_idx == 0) {
-    shard_abs_max[tile_idx * 4 + warp_idx] = max_abs;
-  }
-  __syncthreads();
-
-  // The first lane of the first warp in each tile computes the scale for the
-  // tile and writes it to shared memory and to kv_cache
-  if (warp_idx == 0 && lane_idx == 0) {
-    float4 shard_abs_max_vec =
-        reinterpret_cast<float4*>(shard_abs_max)[tile_idx];
-    float tile_scale = fmaxf(fmaxf(shard_abs_max_vec.x, shard_abs_max_vec.y),
-                             fmaxf(shard_abs_max_vec.z, shard_abs_max_vec.w)) /
-                       448.f;
-
-    // Avoid division by zero in `scaled_convert`
-    tile_scales[tile_idx] = fmaxf(tile_scale, FLT_MIN);
+  // Compute the scale for the tile
+  float tile_scale = max_abs / 448.f;
+
+  // The first lane of each half-warp writes the scale to kv_cache
+  if ((lane_idx == 0) || (lane_idx == 16)) {
     float* kv_cache_32bit = reinterpret_cast<float*>(&kv_cache[dst_idx_start]);
     const uint64_t dst_idx = kv_lora_rank / 4 + tile_idx;
-    kv_cache_32bit[dst_idx] = tile_scales[tile_idx];
+    kv_cache_32bit[dst_idx] = tile_scale;
   }
 
-  __syncthreads();
+  // Now all threads in the block scale and write their elements
+  // NoPE data is packed in the first kv_lora_rank/2 bytes (first 256 bytes)
+  const int64_t dst_idx_base = dst_idx_start + (threadIdx.x * 8);
+
+  uint8_t result[8];
+#pragma unroll
+  for (int i = 0; i < 8; i++) {
+    result[i] =
+        fp8::scaled_convert<uint8_t, scalar_t, Fp8KVCacheDataType::kFp8E4M3>(
+            vals[i], tile_scale);
+  }
 
-  // Now all threads in the block scale and write their element
-  const float scale_val = tile_scales[tile_idx];
-  const int64_t dst_idx = dst_idx_start + threadIdx.x;
-  kv_cache[dst_idx] =
-      fp8::scaled_convert<uint8_t, scalar_t, Fp8KVCacheDataType::kFp8E4M3>(
-          src_val, scale_val);
+  // Store as aligned 64-bit writes
+  *reinterpret_cast<uint64_t*>(&kv_cache[dst_idx_base]) =
+      *reinterpret_cast<const uint64_t*>(result);
 }
 
 template <typename scalar_t, typename cache_t, Fp8KVCacheDataType kv_dt>
@@ -741,13 +736,12 @@ void concat_and_cache_mla(
 
   if (kv_cache_dtype == "fp8_ds_mla") {
     dim3 grid(num_tokens);
-    // For the NoPE part, each tile of 128 elements is handled by 4 warps
-    // (128 threads). There are 4 total tiles, so 16 warps (512 threads).
-    // The first thread of the first warp in each tile writes the scale
-    // value for the tile. The RoPE part (last 64 elements) is handled
-    // by another 2 warps (64 threads).
-    // So in total, we use 18 warps (576 threads) per block.
-    dim3 block(576);
+    // For the NoPE part, each tile of 128 elements is handled by half of one
+    // warp (16 threads). There are 4 total tiles, so 2 warps (64 threads).
+    // Lanes 0 and 16 of each warp write the scale values for that warp's tiles.
+    // The RoPE part (last 64 elements) is handled by another 1 warp (32
+    // threads). So in total, we use 3 warps (96 threads) per block.
+    dim3 block(96);
     DISPATCH_BY_KV_CACHE_DTYPE(kv_c.dtype(), kv_cache_dtype,
                                CALL_CONCAT_AND_CACHE_DS_MLA);
   } else {

From bf6ddfa73f4cc68b287dec9659d2eb0f1d1ea377 Mon Sep 17 00:00:00 2001
From: Benjamin Chislett <bchislett@nvidia.com>
Date: Fri, 3 Oct 2025 00:00:20 -0400
Subject: [PATCH 112/193] [Bug]: Limit num_reqs in dummy_run when max_num_seqs
 is small (#26144)

Signed-off-by: Benjamin Chislett <bchislett@nvidia.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/v1/worker/gpu_model_runner.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index efb4a8c0054f..8b92cb052efd 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -3060,7 +3060,7 @@ def _dummy_run(
             assert not uniform_decode
             # Create mixed batch:
             # first half decode tokens, second half one prefill
-            num_decode_tokens = num_tokens // 2
+            num_decode_tokens = min(max_num_reqs - 1, num_tokens // 2)
             num_prefill_tokens = num_tokens - num_decode_tokens
             num_reqs = num_decode_tokens + 1
 
@@ -3072,7 +3072,7 @@ def _dummy_run(
             max_query_len = num_prefill_tokens
         elif uniform_decode:
             assert not create_mixed_batch
-            num_reqs = cdiv(num_tokens, max_query_len)
+            num_reqs = min(max_num_reqs, cdiv(num_tokens, max_query_len))
             num_scheduled_tokens_list = [max_query_len] * num_reqs
             if num_tokens % max_query_len != 0:
                 num_scheduled_tokens_list[-1] = num_tokens % max_query_len

From 3064f88bd014f8c36ac53ad0bc25860aa5b955fc Mon Sep 17 00:00:00 2001
From: Andrew Xia <axia@meta.com>
Date: Thu, 2 Oct 2025 22:08:35 -0700
Subject: [PATCH 113/193] [gpt-oss] disable tool server initialization if no
 tool in request (#25790)

Signed-off-by: Andrew Xia <axia@meta.com>
Signed-off-by: Andrew Xia <axia@fb.com>
Co-authored-by: Andrew Xia <axia@fb.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../openai/test_serving_responses.py          | 129 ++++++++++++++++++
 vllm/entrypoints/openai/serving_responses.py  |  31 +++--
 2 files changed, 148 insertions(+), 12 deletions(-)
 create mode 100644 tests/entrypoints/openai/test_serving_responses.py

diff --git a/tests/entrypoints/openai/test_serving_responses.py b/tests/entrypoints/openai/test_serving_responses.py
new file mode 100644
index 000000000000..0cce88016092
--- /dev/null
+++ b/tests/entrypoints/openai/test_serving_responses.py
@@ -0,0 +1,129 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+from contextlib import AsyncExitStack
+from unittest.mock import AsyncMock, MagicMock
+
+import pytest
+import pytest_asyncio
+
+from vllm.entrypoints.context import ConversationContext
+from vllm.entrypoints.openai.protocol import ResponsesRequest
+from vllm.entrypoints.openai.serving_responses import OpenAIServingResponses
+from vllm.entrypoints.tool_server import ToolServer
+
+
+class MockConversationContext(ConversationContext):
+    """Mock conversation context for testing"""
+
+    def __init__(self):
+        self.init_tool_sessions_called = False
+        self.init_tool_sessions_args = None
+        self.init_tool_sessions_kwargs = None
+
+    def append_output(self, output) -> None:
+        pass
+
+    async def call_tool(self):
+        return []
+
+    def need_builtin_tool_call(self) -> bool:
+        return False
+
+    def render_for_completion(self):
+        return []
+
+    async def init_tool_sessions(self, tool_server, exit_stack, request_id,
+                                 mcp_tools):
+        self.init_tool_sessions_called = True
+        self.init_tool_sessions_args = (tool_server, exit_stack, request_id,
+                                        mcp_tools)
+
+    async def cleanup_session(self) -> None:
+        pass
+
+
+@pytest.fixture
+def mock_serving_responses():
+    """Create a mock OpenAIServingResponses instance"""
+    serving_responses = MagicMock(spec=OpenAIServingResponses)
+    serving_responses.tool_server = MagicMock(spec=ToolServer)
+    return serving_responses
+
+
+@pytest.fixture
+def mock_context():
+    """Create a mock conversation context"""
+    return MockConversationContext()
+
+
+@pytest.fixture
+def mock_exit_stack():
+    """Create a mock async exit stack"""
+    return MagicMock(spec=AsyncExitStack)
+
+
+class TestInitializeToolSessions:
+    """Test class for _initialize_tool_sessions method"""
+
+    @pytest_asyncio.fixture
+    async def serving_responses_instance(self):
+        """Create a real OpenAIServingResponses instance for testing"""
+        # Create minimal mocks for required dependencies
+        engine_client = MagicMock()
+        engine_client.get_model_config = AsyncMock()
+
+        model_config = MagicMock()
+        model_config.hf_config.model_type = "test"
+        model_config.get_diff_sampling_param.return_value = {}
+
+        models = MagicMock()
+
+        tool_server = MagicMock(spec=ToolServer)
+
+        # Create the actual instance
+        instance = OpenAIServingResponses(
+            engine_client=engine_client,
+            model_config=model_config,
+            models=models,
+            request_logger=None,
+            chat_template=None,
+            chat_template_content_format="auto",
+            tool_server=tool_server,
+        )
+
+        return instance
+
+    @pytest.mark.asyncio
+    async def test_initialize_tool_sessions(self, serving_responses_instance,
+                                            mock_context, mock_exit_stack):
+        """Test that method works correctly with only MCP tools"""
+
+        request = ResponsesRequest(input="test input", tools=[])
+
+        # Call the method
+        await serving_responses_instance._initialize_tool_sessions(
+            request, mock_context, mock_exit_stack)
+        assert mock_context.init_tool_sessions_called is False
+
+        # Create only MCP tools
+        tools = [
+            {
+                "type": "web_search_preview"
+            },
+            {
+                "type": "code_interpreter",
+                "container": {
+                    "type": "auto"
+                }
+            },
+        ]
+
+        request = ResponsesRequest(input="test input", tools=tools)
+
+        # Call the method
+        await serving_responses_instance._initialize_tool_sessions(
+            request, mock_context, mock_exit_stack)
+
+        # Verify that init_tool_sessions was called
+        assert mock_context.init_tool_sessions_called
diff --git a/vllm/entrypoints/openai/serving_responses.py b/vllm/entrypoints/openai/serving_responses.py
index eaeab3360c60..4e7418920954 100644
--- a/vllm/entrypoints/openai/serving_responses.py
+++ b/vllm/entrypoints/openai/serving_responses.py
@@ -445,6 +445,19 @@ def _make_request_with_harmony(
 
         return messages, [prompt_token_ids], [engine_prompt]
 
+    async def _initialize_tool_sessions(self, request: ResponsesRequest,
+                                        context: ConversationContext,
+                                        exit_stack: AsyncExitStack):
+        # we should only initialize the tool session if the request needs tools
+        if len(request.tools) == 0:
+            return
+        mcp_tools = {
+            tool.server_label: tool
+            for tool in request.tools if tool.type == "mcp"
+        }
+        await context.init_tool_sessions(self.tool_server, exit_stack,
+                                         request.request_id, mcp_tools)
+
     async def responses_full_generator(
         self,
         request: ResponsesRequest,
@@ -461,12 +474,8 @@ async def responses_full_generator(
 
         async with AsyncExitStack() as exit_stack:
             try:
-                mcp_tools = {
-                    tool.server_label: tool
-                    for tool in request.tools if tool.type == "mcp"
-                }
-                await context.init_tool_sessions(self.tool_server, exit_stack,
-                                                 request.request_id, mcp_tools)
+                await self._initialize_tool_sessions(request, context,
+                                                     exit_stack)
                 async for _ in result_generator:
                     pass
             except asyncio.CancelledError:
@@ -1650,12 +1659,10 @@ def _increment_sequence_number_and_return(
         async with AsyncExitStack() as exit_stack:
             processer = None
             if self.use_harmony:
-                mcp_tools = {
-                    tool.server_label: tool
-                    for tool in request.tools if tool.type == "mcp"
-                }
-                await context.init_tool_sessions(self.tool_server, exit_stack,
-                                                 request.request_id, mcp_tools)
+                # TODO: in streaming, we noticed this bug:
+                # https://github.com/vllm-project/vllm/issues/25697
+                await self._initialize_tool_sessions(request, context,
+                                                     exit_stack)
                 processer = self._process_harmony_streaming_events
             else:
                 processer = self._process_simple_streaming_events

From 63c869d1da018834460295643ccc50b966d2c6bf Mon Sep 17 00:00:00 2001
From: Tyler Michael Smith <tyler@neuralmagic.com>
Date: Fri, 3 Oct 2025 01:21:01 -0400
Subject: [PATCH 114/193] [Build/CI] Revert back to Ubuntu 20.04, install
 python 3.12 with uv (#26103)

Signed-off-by: Tyler Michael Smith <tlrmchlsmth@gmail.com>
Co-authored-by: Simon Mo <simon.mo@hey.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docker/Dockerfile                             |  52 +++++++-----------
 .../dockerfile-stages-dependency.png          | Bin 130446 -> 121821 bytes
 2 files changed, 21 insertions(+), 31 deletions(-)

diff --git a/docker/Dockerfile b/docker/Dockerfile
index 56bbc3d5f1a3..661846d3549c 100644
--- a/docker/Dockerfile
+++ b/docker/Dockerfile
@@ -13,8 +13,13 @@ ARG PYTHON_VERSION=3.12
 # private registries that use a different repository naming conventions.
 #
 # Example:
-# docker build --build-arg BUILD_BASE_IMAGE=registry.acme.org/mirror/nvidia/cuda:${CUDA_VERSION}-devel-ubuntu22.04
-ARG BUILD_BASE_IMAGE=nvidia/cuda:${CUDA_VERSION}-devel-ubuntu22.04
+# docker build --build-arg BUILD_BASE_IMAGE=registry.acme.org/mirror/nvidia/cuda:${CUDA_VERSION}-devel-ubuntu20.04
+
+# Important: We build with an old version of Ubuntu to maintain broad 
+# compatibility with other Linux OSes. The main reason for this is that the
+# glibc version is baked into the distro, and binaries built with one glibc
+# version are not backwards compatible with OSes that use an earlier version.
+ARG BUILD_BASE_IMAGE=nvidia/cuda:${CUDA_VERSION}-devel-ubuntu20.04
 # TODO: Restore to base image after FlashInfer AOT wheel fixed
 ARG FINAL_BASE_IMAGE=nvidia/cuda:${CUDA_VERSION}-devel-ubuntu22.04
 
@@ -75,34 +80,19 @@ ARG TARGETPLATFORM
 ARG INSTALL_KV_CONNECTORS=false
 ENV DEBIAN_FRONTEND=noninteractive
 
-ARG DEADSNAKES_MIRROR_URL
-ARG DEADSNAKES_GPGKEY_URL
 ARG GET_PIP_URL
 
-# Install Python and other dependencies
+# Install system dependencies and uv, then create Python virtual environment
 RUN echo 'tzdata tzdata/Areas select America' | debconf-set-selections \
     && echo 'tzdata tzdata/Zones/America select Los_Angeles' | debconf-set-selections \
     && apt-get update -y \
-    && apt-get install -y ccache software-properties-common git curl sudo \
-    && if [ ! -z ${DEADSNAKES_MIRROR_URL} ] ; then \
-        if [ ! -z "${DEADSNAKES_GPGKEY_URL}" ] ; then \
-            mkdir -p -m 0755 /etc/apt/keyrings ; \
-            curl -L ${DEADSNAKES_GPGKEY_URL} | gpg --dearmor > /etc/apt/keyrings/deadsnakes.gpg ; \
-            sudo chmod 644 /etc/apt/keyrings/deadsnakes.gpg ; \
-            echo "deb [signed-by=/etc/apt/keyrings/deadsnakes.gpg] ${DEADSNAKES_MIRROR_URL} $(lsb_release -cs) main" > /etc/apt/sources.list.d/deadsnakes.list ; \
-        fi ; \
-    else \
-        for i in 1 2 3; do \
-            add-apt-repository -y ppa:deadsnakes/ppa && break || \
-            { echo "Attempt $i failed, retrying in 5s..."; sleep 5; }; \
-        done ; \
-    fi \
-    && apt-get update -y \
-    && apt-get install -y python${PYTHON_VERSION} python${PYTHON_VERSION}-dev python${PYTHON_VERSION}-venv \
-    && update-alternatives --install /usr/bin/python3 python3 /usr/bin/python${PYTHON_VERSION} 1 \
-    && update-alternatives --set python3 /usr/bin/python${PYTHON_VERSION} \
-    && ln -sf /usr/bin/python${PYTHON_VERSION}-config /usr/bin/python3-config \
-    && curl -sS ${GET_PIP_URL} | python${PYTHON_VERSION} \
+    && apt-get install -y ccache software-properties-common git curl sudo python3-pip \
+    && curl -LsSf https://astral.sh/uv/install.sh | sh \
+    && $HOME/.local/bin/uv venv /opt/venv --python ${PYTHON_VERSION} \
+    && rm -f /usr/bin/python3 /usr/bin/python3-config /usr/bin/pip \
+    && ln -s /opt/venv/bin/python3 /usr/bin/python3 \
+    && ln -s /opt/venv/bin/python3-config /usr/bin/python3-config \
+    && ln -s /opt/venv/bin/pip /usr/bin/pip \
     && python3 --version && python3 -m pip --version
 
 ARG PIP_INDEX_URL UV_INDEX_URL
@@ -111,9 +101,9 @@ ARG PYTORCH_CUDA_INDEX_BASE_URL
 ARG PYTORCH_CUDA_NIGHTLY_INDEX_BASE_URL
 ARG PIP_KEYRING_PROVIDER UV_KEYRING_PROVIDER
 
-# Install uv for faster pip installs
-RUN --mount=type=cache,target=/root/.cache/uv \
-    python3 -m pip install uv
+# Activate virtual environment and add uv to PATH
+ENV PATH="/opt/venv/bin:/root/.local/bin:$PATH"
+ENV VIRTUAL_ENV="/opt/venv"
 
 # This timeout (in seconds) is necessary when installing some dependencies via uv since it's likely to time out
 # Reference: https://github.com/astral-sh/uv/pull/1694
@@ -142,7 +132,7 @@ WORKDIR /workspace
 COPY requirements/common.txt requirements/common.txt
 COPY requirements/cuda.txt requirements/cuda.txt
 RUN --mount=type=cache,target=/root/.cache/uv \
-    uv pip install --system -r requirements/cuda.txt \
+    uv pip install --python /opt/venv/bin/python3 -r requirements/cuda.txt \
     --extra-index-url ${PYTORCH_CUDA_INDEX_BASE_URL}/cu$(echo $CUDA_VERSION | cut -d. -f1,2 | tr -d '.')
 
 # cuda arch list used by torch
@@ -172,7 +162,7 @@ ENV UV_INDEX_STRATEGY="unsafe-best-match"
 ENV UV_LINK_MODE=copy
 
 RUN --mount=type=cache,target=/root/.cache/uv \
-    uv pip install --system -r requirements/build.txt \
+    uv pip install --python /opt/venv/bin/python3 -r requirements/build.txt \
     --extra-index-url ${PYTORCH_CUDA_INDEX_BASE_URL}/cu$(echo $CUDA_VERSION | cut -d. -f1,2 | tr -d '.')
 
 COPY . .
@@ -269,7 +259,7 @@ COPY requirements/lint.txt requirements/lint.txt
 COPY requirements/test.txt requirements/test.txt
 COPY requirements/dev.txt requirements/dev.txt
 RUN --mount=type=cache,target=/root/.cache/uv \
-    uv pip install --system -r requirements/dev.txt \
+    uv pip install --python /opt/venv/bin/python3 -r requirements/dev.txt \
     --extra-index-url ${PYTORCH_CUDA_INDEX_BASE_URL}/cu$(echo $CUDA_VERSION | cut -d. -f1,2 | tr -d '.')
 #################### DEV IMAGE ####################
 
diff --git a/docs/assets/contributing/dockerfile-stages-dependency.png b/docs/assets/contributing/dockerfile-stages-dependency.png
index db3452650c3679464bdd3788f69a452e04365457..0838bfa37fe62d60fba9adcbd18c81de0809f253 100644
GIT binary patch
literal 121821
zcmcG$cU+Et-#>mLWHii(R8~kO?b0+tT4-oWXlZHhBtnw$Y0*+r+EGeri9%`bol1M}
z{e2$ind`c~*YCc6zrTLx{kSjk={(Qlc)wrcIbQGMp@N(=&3eZ5Boc|{+}TqXNhDeq
z5@}^Q^-BE9;pF$~_+!mA8R=7`CF1`=Gb3M+NGzmtrz9`i2KF}@SSock3A6@1+)qWV
zL%Z!%1PjY1n!6kK>N7nR?z@=#Zsm55u#eYbs+9X;1;fw2I~h?L&GhDmLgEqLtB0vr
z)z&F*syyhna-HtVoy~M}cB9jVUr9ge)@jsu#5)X)i90O4&rsejy3i?R?&IUL0++J<
zQdl*jxc2W4B$DfzlXKhu{iEUe{~vxj!re>$2KtES&!3lw&BdmrrA0;Q*Tico7Od#i
zsCX+|QBm<qz_dADGb8E)`B!P4PjV1{SsS>GUHS9qPxeorKH1sXF*^=R;*ZLQuGDWL
zBlT|FnCP#w7;epF3$na;=FFMOhs1ka@3Y3ge}BApBk=?M2E0>Vd||vOfJc0$;{`r{
zLgw1F->xfG6^jgg_T<VE6crWi6(oLFBJ-`&2K<@hY=UdUWjT!gVDmeAWz@&-;-yOt
z<K5=9Ivx>`kqwiZY3U;(BEEh5)>o6TG?l%SdGpuHgwHR1efh6_ePG_6&t(2}lj56I
z#D_AH28ci)O{#C(wyh#kK6~I}gV_9VUi6E1@7|sCpj}v;$`-fmE*)~7%2>B<-KK+7
zVM-brpDlaJg)IIQ1qxYIMJp+FwYRr(eIEYOV4A&<m`Ce*Y!C5~3gQMWM64ycs3q%{
z)h6k-*mVU(^VHSVsc6}Cu4d49>g&5*=UAw-{Zx|;n|$yItKQ1rzkd&3xOlO=N=4hL
zfXRl}pnQM*E#ku@GQ%i0zj(8+I!>U)acqnH2}MQ4O~FDVU$@|UCl?pyq<3wMTKZ_*
zz<=ZCKN&+=b7LjqbS0L(l?J07KZrd@&Luv|b(RuSt_weL!A^spy5hAmg-`TXM3yW}
zwTNH;{`Bn06*NWFaq7&@(`^nznKpBi18o6D@t^+Wu4TSe8KwC5b0o;o=(<o)`R-D|
z6Q*4sJFyWiGlkmCW_dJNEyb>tjBmWfX1hJa=i5HpjeW`M@9!619PthkwtB?7mADvs
z(dG4Di}kP3c3IH%7TvyQk3|tTHbcDQ>B%tJ)x4I-kxOqce44B`k~x3gjYYrW?XTD?
zAMB?FnXEX8PhmM<pGy46Yunk`shj`UZn91<FONMw?e|Cl^VI4Q3F9kSjx(RSg6G;i
znAb>R;U~MqmuB9)kb5Ldxs08Z%V7K%Bw`b6Q7puxSG>`U<?vyHpZ^^8)3P_HeC@jM
z>#gjoVzIe?tUeF5TSrF+gSO+yc!j+8@@LR2e@5b?M~^n`JA;7OAW6TUjZHp8Y@z={
z$rItNi7rPtI5NA#JQt@6#MelcMk$5|@aP5G{(h+FL4*ovZzy?}C06lU_t*Y-!M2vT
zR(`$WKr9P?@2Q-{*w3Hm*NRW)V#V*W=vT+q?K1srK3*m*%|sMB(gVKbYlvRA<=|sx
zaWQJQGhU1f6A3P&$gXfXs{W;)KYtdBPBrf2xk)AYG$7#9t-ANt1NEnu-+y@d{cmQ*
zx?F}FTG-jyJ-xj{#GGblx<Z((_O?nWUc7i4iN~dy$U^Owdw1>9!jOyng$s|D7eQpX
zez}S&tE$@Ou4eeh$7i*qSs_PiRP)NDf1W=djTB#ar(5tulK!Y_Vym9`+?D0J;QxM#
zTvTXE>hwYu{Icf{P`hoB6Kq2+$eum>KzNf`&P+}ABA@MWYk7J3^z<|?k&cn~Q12<?
z&Ltk#QlfFqp9nv#^)aad0RhNKw_XnVhgnW@&4^=3`pcIuKi<jnHaVI1@0;|=DO&n;
z>$YtR-O}RgYrMr5Z3}%l!hfyW{XO4nS53Cd5)1X{*cj4jFshySCK5L#6(vp{*ZJaZ
z)mM$%LlO~DgMvw`KQc0cDthbu`SbKtbSH*$T$biqqPCE0e9}|12IJJzLF69{JCL8u
zLbp4LgG6@m8S)}-@xpJeO;?UnGp<kWiA!xhf(_u{5S^&Jgv}$qyi&-4a>-X4ElNby
zKi*pBcD27Y$z%8Jvz6u~Hx_D>^q#i})HRaFPz6$qYR)i``$?3=a*AwJPc?D+6QJkD
za#ltrW9HAR@F%N=#nn;_C)$~p1gYJS0Alz$+zRn^y@8ZUPm?#^Q{n09d6#8}(CzCD
zAB~B3xu7JxL>{nEJCD6;`N!Ay?{}&H{jL{m^0W*{e!6hkmBZWO)KY}!`aj%dnf~p`
zrR6-+xxAoOGRs?c_18;2EdB<!P~?m>vy&xmDa)|PpS$h1yvyvR<a5L&xu#S4fW)d}
zM%A%qn+7@8DYR_db0SSCMp=^n^K5U7h|S<*VOrvM6+DtniTlte-7E=a;=E6@YrFAg
zSHlDQ_Xpnod03MER`X{eHa5292E$aIwHm)1y27?EE)`{_CCf=!S-J8GDOzQsYeiea
zQQ{-7x<pWN)F~BtBm0VfwdB*FASMO|2CLn!y-ZHyWo>)8xVY-~6Td7GwEU4-F}+E3
z)7zs;vgVqG_)QuGOUYm5x)4NJ--#yN?pDrpt3Kiao6ep++g%<ZLr;Ygtb+@{%T@Tz
z-|s~WGb@W$iqU^T>ere!GDJJXrg{kz-I1iALb>Irp+}ycd8h5|?Xhgu33g+D+QOou
z4lQ3-QyJw}vtsI{-k*DMu<W3YHcINjL8JQ{cW$<dXZ+OvzA$Ug;xB=gMo$?pCXvZL
zzgg7GD-F*co<Z-;`{v7`9wtjJT9r(cqS2dy+G4f|D?!|Xr}t8bd=vYTBmebVEZc>x
zdN0ppKM@&Bi)wdNI(_<^l8UBJaBy>m&CvY(e8T5hME1QOEw=4mPM^yz$%}5&GAs@h
znzKDj+#YG~Yw|LX=;vojT!PUd|NMGoVPWAi9?pE466&tAlz1Ys9OB|iQ1kQgIqgr*
z9anofa-fk|1g9D;q`mhvy*c+HHZ~SZ&r1mbQl<98W&HI(OG@g?KZntG0ybOGlfSxG
zgpzyYA4n3il>Yu-Kb4`<Oyzqsx5TI<pod1jd4mqzgIih{3t7^*a%HDga%QUiL~qE_
ze3vwn)n(7^9E<`cj=(NK*7XJij6gjIf3k-7*qr7H@-~seE?>D~*WxsF<HikH|6@Ae
z9&JPGIc;FjQ=ekAG#)7)gyKV>m5vwkS);xYGJg3^zk+O<XMB>R_t<sx>4rGZ_Ne63
ziq8)xc%zvPw3k>dElf>ym$eUO3~8Y^qGF)qB;mTykhIKlSKnPjqxRwEFEK4<;zC@b
zD20-wn2ti|JozDn$z^^d0niUUFv)3d^7H4<yG+tp@uGGk>hjLx9et}C?FaAgGMVm?
zcTu}|aWj=9@<|(6Khak+RGYL<Tzm;JV2jmyBEC2c<P)V!4yQx`N&vfl|Gcy~m)dOK
zmuBAnr#Og!d#ShTj`Q)Q=#>N$m9=GYGBwdP0~fu4Gc7bMEUZ^E(_tzeI~p6?`2I$r
z38!<DRn0wJ>|xz6RcB{sL2H1j%Aa%-b1h4Y05cnF^n$FazuenUBG~?Td9w!UCw$dS
zt^l%OO-w$I<g0yRB9?%}O({F1Q*RR!6OC%(=|sm%YqS~pZ`I=ZzD$Ij_OxyZjT8TP
ztM1~qj2nf%*$V@vTefV;KK{bTXCh}6o#XsS0k=H47)x+a(w`J&xiC@V;n3*ZG(FPZ
z{`>criGAKDHs>ignD$n_BepngkBIdx<Xa5WTrQn+DeA+HKjc*kt^T_s!UM?_Sv?U&
zMMday_xq4S#Qq<tY<|UWtX5?&Ag+c$9&XFieNIi>hO64Y?n5)f8f~WTS5BEUvu27`
zvc6&yTRj_~GeCKpu$WkuN`h9#&f=dxADufyyp?1aK&e*r0r<8iI?KVvPliE$ekuj#
zlT~v=+1hGqjPZ2B-J$3SO&e29Tf`2&CciK02BjfLTz|=H@P6(N@VHW(fJvh&@kSKo
z=<1%Ho($&2>Jai$yUw1Y<mrP8j`OLGrvhHSR7+`oe?x|;piTvqE=~<u)$c6G%KG{V
zr6nt{Eyv8P5rC*tAGYp{|C@tZfr)S4?EgY8#iYMwisiUAXN__USdL*6HZ3!w5X5G3
z(90njo2Jx<FlwSRZTJ}X-yi+`R&Aor)GC7HR0*@Q_pvABfBU8sXEWG1Bg-&z`(CP?
zRZsZ=yfg^T(X=p`+A{lrOfvp50n)RX?r?AG?A5nSOiZfmb6i(w+wmcsqg^vlo=wxg
zyDW}{IDJoB%gAR~iE3!3si>IbI5XO`F?((>gL@s(oJbNJ%Qa!|B}GMUe7mXrL^ePe
z+C|<3;H{R@t+>t1%puR7ZHljny)q_Sb0zU=Zq}N(Bu~!tD8mInC@X;%AM{G%=g72*
zR4GO&-z?{eh!)7SL}gG>R=(fY7oQPdAAo>7u5ncBbDH6Fp_a?S1fAIQ)ezn4%F_&*
zl~`soQM=I&)B0yN`Hy!J&8p}k88;|+{!QZj`}ZRp8qEusv|S7)`|IRSjGRi_bL?u4
zKeujl=9iwxkUg9L)gOSed)O09Y7^UjvL~GA4!vv0HJS>D@=DPBT3Rzw?0}!fMP=nl
zpMa_u6>Y03B@hg5ndK#+bXn3~9<$aQo?^jvhV1EY0eZnRvwaB++qU`q^Ur52pg^Np
z9==XXOKT5RF004xQP2`rv8-7-9+%;}%*hB>4Wc}GpBVkl7UK9GDUM1d|B62jVC3-O
z!{T#wCD*3*t<D9Fo2m#|<kcv_EnpLQZWbXjPNEunFgptZ6E<f$m;$~{Hkf+fI6_VU
zL(k>J*#OA$a87%ytAtJ-;RE<!{Pn>me1c$``<CO!j}uIGvVW%aF5UgA27vxaG~oWy
z*Leb({Gy@@TrM**pnrE+YQgd*YP4IDbPIs*Q;ZuX!#p{AYm?f+vYx+q5%WjHvYY;9
zRQ>D8;XFFJl1BT!I3?Y4=gzhLAn2DQy@qw&jkdPZ*C%6c-lt_^4E{Wr-k0^f7brRC
zn2wa8p&>n$jPFsQu_7Mz6hoiq&&xkqbd9tZAZ2a;6a|37Dvd47P0?{#{o<?X?;IoV
z0*mtUmLEa|!Ho^z0-1SkUPv`*!j0joM6CO5LCluW4_=D9I3rPQT<)P}#cO;T{n%gv
zvaSu4;Nr!L9<)qyLY@CGXxX-<)My!@{M~YXnlSxC-g$HgX!_49Q?b$S`yfdK2L?92
zKIzd8(4JJV#{oPVf15r_3Bkmn-$2jd#pDgh;ISX?jtp@YrgpPwaY{w+2f&>^<E%|Y
zYtEgVW-@;y|0+r05~W)G*G~!}__(~&8X6jZacKB5AoBx}=fsYXp<6?`l~J00`I~e9
z{aZEI8#6@>jokz~0xnw5pp>0Pe243T_c9371X@dricVQkDc_dxZhG35f;V!UFHivT
zY&@EL+i%cxZ~k>TCYO<=*>7o4aHnmVvx!oZ<6Kw(l?yb%=E{{Te}QPm2xzc}Lkpn5
zGetdee)c~7`;}eALAwM@c2nh!b{2*guN?MLj#b^nX+PP&(|9xSNuhESn4{1F)Vv$;
z78o0S8QI|_Oe-+~^u@qAJKnS9|NiY#(#Bo<M>UFqMMZ!(Tdr5fULkYg5VJ4q{_7HG
za?qUezG*Mb)&S66X6ND>3ilRU@79{u{=}$0*#H~>uYbYcRZo3<tiH2)P)Qy$ZT?Il
zIIS_k061pm`8)May&^-sD5GTxLNYfu4?p9z-YxX=XGf5EV%wL1bac^RCF$S1eTyKw
z_m}MWQWk|K55yc|m>bLVFH`3afHxp2^C9mpMViznAEtKO!1ejqzJ2?aSwqt@#Mgmj
z)+E#wxP>YgZJHqU#JjxlIZ(2AG_>tHeah~W7ysI_aI&TyVJ~yx!bZ2&V28oOM~*zg
ziqcc%LfRSm!4^U#X@(mbA8Zm?{-z*G<qys6u21Rv{%jxWK(fK5D!CV=O={WB3t;tI
zs3aX7=b3C8H(Bi_R*hx*f8+pP3i|F~Qw9OPSXtWuKqHM0-qH8k!TlQz%ZZ-KPviCv
zQ<u4hWm=YWb%?BuF+P_I5?=VtkWEcq#PRMjGQrwp*7}mqNLe-0xGK8JechI@C*)@L
z^}+HY7SRYa63mDy_t7?X0AgmV-L0ev6yU|ywc^w@D6?l#%Rsb=3;lXQ1K755C-L{I
zB}cWhKD#U}qL)h2&qIOBZgtxbCP%ef)q1c|2m%#AAv?8Og}k^Ex{e|n84z77pyV*`
ziA?(mdtj}+36y8Bl<mfQS|uz{sNAa>PNKzus(Vt{A^mcq^PUYyLEtmIOiu-LK`13-
zV`JdkyAPRUPE>;eKq-N60n&Q&`t?&mWEk~eSt*&kXl_1&x}RpzRUEbQLZF~I1W!qN
z$B}OgdG~4NAP<F~U%6Xw4-$t618O%27hS;)oFXD3%Nj)NHzj4|Gh|J`b&WyiPoJg?
z8#*_Zef!!=xqcKC-2!R`!F$DPaIt15ziIOcsF46F5FLhd*Jgw50>#Dky;`|87A<b*
z?JJY@;wmm3&!posC+nAGhfNf;d6i4)^5tacJyB6n^(sJ{AP+Xkq}`7ABxXmmNV%Zs
z?T|fFcIY;xTLCFIf@6XPH>E?z{opV)sOed=7BLVO_8WcGr9Y|QOP=;ZuL^d<DES$&
zbAM?<;*^}&Ob2?#U{6N<N8`E9<0jJ~5dF@}$TVc^K)E>qg@J)fYd4kT`SU+fzQs_T
zGc&g4)EJ}xqm|ir`lz_EJn-}+WK44GkO3&maY|PAXKK&?X0T~Amp0an1MSx~>AX)X
zHr<N&cItD0RPBhw`3!BNtqqw@$e929^H2THHM<jik6yXmY}Xa1nZZx(_Vw#my<odP
z*jH$C#P!o3pg^I?W^mywfU24vj&#eOQLwj(p_V0eHW?WiQ&58Fp?l)}iFwWoecH_6
zK~{`(wcY?3jRf_>?}ETVoWrs~Gs&LH96B9DX66t4DVgCg1YH{%rYw`wR|sOaD`W*0
zz~N-&<l<*C-Xhn)#0DBt*GkeeFbLc%@+a2V7=YB%J;(VLm~f4j!vKL4hs{buB|#Xa
zpwEWOl6!FF+T{g$K?v3aRE^V~1St##h(e*C`kgs5GlO8)N;A{3_4oC)9!RNq!YrNz
z_?hx@Q>{3MM%pk!XtqFnanqi+Z{9TCF60nsw$(*bUKV}r_li;M0^VB-vlB5*8*bjb
z2^yB|gdLlVx8FsT3k;fdHP`Lo7B+t4dR}TbTzZq!R1=ekHQ^Mf#HuRB=-gS5K6ma1
z^e^$NIj)j-*C;8O0_)Uv7W#n|i>qXkZzg(K(Q_J|Zuj=yB@nO7>ErKjTcxDZ1T+b$
zD8^?)yms~?!rr;}T_l1lMvlm{NDyfhv;~OG0QqX4HkFz|T+T$QK-CT8GpYt`jV`w7
zs~&*IaH22v!+aRA`J^l<N|$vy4hYtk=P@*A_5Q;LHrbbzk@6u<*_A4>;0cfcq2M^D
zA_ciZ<mKgu>OSZ}B*NkncqBMjOFd3Ilq}mFAzo@gKLk1lKL&6{51KFJL48UG-r`K}
z4s&;RkGf4RUlYsJ%HbxG9VUv9kPuiHUI?jXF|9=GP->HP17D5CrO4B%9O@r00AT^*
zUP-rnSMt?0K}KF)9Jk^;oySb5=YM<bvL2kJDJhu?o|~6H0G@!CQRjO!Mg~pGGE{Cf
z*-PvUu@Ap|`EmuE9|}O-`x^vMt#i6#e+UEx)$#6Hx;<i!(|}p8{`qIC)m~!3LRU}<
zODH2!T4VkIz-+WNGUp~bW)t}L?{A({<J&dUE$x0kWXnP#3|Q1=s%U7;W5>2{-Fgen
zbpH4()N<-E5}yF5D4ZY!%=q~D9#Q+<Fllz~+}Sc4Us+iRl%aS1IxiYNa0e91_zKNb
zqLsQXEIUz>^i=2{G0Jg2fBmAFO8Zq(lJL>v<<qC700@W!ybxtfR+WlSX9<l3_KU)p
zL&V#+&5)S{nk+BfzI}UOfhuRk_4a%(4<>6>cq>%_0H=fBLdZRv)PL`56uDK=2e`Sp
zH8wUTnrG;jg&|Q@M5@6c0s2+=OtP~wuA>zjI#&=#l@OCrRVRh{B_Q*x->{+U*DC?o
zJbv2FcGzb0+jEt#iIsF+buW`FRMN6QTXmQlNX^SPmXj-nGIe=C71^h(T%B`g75>qC
zk7(A!Pl($gPLp+mdRb#ZLygET#@iADM~)s1giwFOPqP|}ziid5r6QL!*M-L3su+vg
zx4+~MJU<|VK6+(9_2$h#p^|sM<Qoq)XI{E^ak86}D2GtUvwEsf8)M?rd*d?(4a?vB
z2#%nbl2Lk_!^y&`1P41Or`G%H=W5fOAeKS|Q5aA~N&E2rJ-&gvV0Q&DkkcmvtVPy4
zCkONjG=vw@*wicyvZ6!^4W<N-{xDQS2;M1XZC|jYw>y6tW)B?#wZ~3_Xy~+mL{G-9
zrTDzo&UV%oufqpJYgj6m;qvnIjEUQ|qVf?q`}nwJb`W_fGwD?ZmbMUEB_XP!pz!q7
zt6lsie#jV@4u%ECd3Zj2_<%fs#R%O^L)s34&GTo^6u}Dj<QEipGx8BM$ha)*G*i>2
ztJ;Asi!+2o2c5ptPrDh?$}&2lc}TA25_yTR08qF*yc$+-*dD8%8egCE=FJ;OP<K|X
zz3)Xp4&IyVur6pjK`hiyz%HS;qMeA}OkGpE@AT=@*i0auwl-W590!}lnJ(#9WH(3u
z(BIXb_*qy8Oah$~R}P>aW9_@}2pSB6`kq$<HXSxofuLa&RtU0VRvTouteHQchNqve
z2tA11IR?~#etbV$g@Hqj_xg8wN}~(C-%sW+3f?e4I5g9FA%+VG*x=@o(Xr%Q7Im21
zxGNQG&lFbYV+&=Yk>B6eGFg_|AoQZ{k}A*Y=(M4qP0x>&aKVlMegPV?{p<Bgl1nPf
z`3&m;d*})boEkg$O;qAFt_&3LJ$(2Owc$r`G3~BYU><MS3r=dT3m2W8vwF!+kixQO
zk)%xCM)j&Rj>CuFSs&%$;SmwZh&F%q@+D(?AhGErlB4FeN^+u3y5K6VBwagQn-(PQ
zvN$`@7sG^t*9X<0HjU|oEdg_`?b<?qldEYY<@V?PbA20Lszo*aodqz>h6tlL(DB-1
zk1)iAMDqsdT3Fa`f=5UWtZZyuAlSspR7w(`=t}+dUtsR4i-M|Z8l2)p^H(okT!QyB
zpbCBmFAW)jWL8hs--N604}bsuJuQ>4BlaEaF7x*z_Tm#`MF^p&ljIvpqR`AlKiCaE
zetv#0UTonvX#vzQEZDqdONM37asARzTo<HIw7VVBt3$W{3KSYku8@lnzSZz?AdgPm
zvF#qinH}qhD|`^KT*i3!uU@@+0|O^ESH_Q%gM%aP|FN)@L0}8s%;JkS*>jpYIy&@J
z0PIF6P|HQDHi_)m<qQ%w3OtWnjX)(!^T1QlOh%|0&!qS4<TpX%h`ql$u_Y!d$`)#8
z2oefeggy#dI`S91pCZRe>(V7<<&TC{(d6>_DkMZ(QE_A<30)Ee_NJa5axDCb@cE(j
ztvQ#qw1S^LrMDs{3X3&GdO%_RUn?`u@#EJ5m$&`<fiq;Gk!9uoceVZ3n`Y0DuTfAT
z7Ir!E<W?i+mG{@t_^Y1WxOtNnPUNk|Nsu+<a=y@t+96Sl5r6`S;E!-xa*yx#N<*!S
z;vx2-@*x!O12VquUJV3(#xGVq;R9ZR-*>B#=-_ecsZY%1NVJEBK99)(VbD{d8WN84
zHwNuS=$6aT;XvV%wJz{kQA7>fzTDGkw?-CLIgda4SN}tJ;PXH|Y9m*-=2!ytiA~n(
zDtQ<f7+{P+2!G%An9Q5|H<1fNs1Ey~L*LO#ccsFQYe>?SPSHh~BG+SUNM2sM1c-~H
zCU6zZJlK3%NIH5d*_XVB4;|7cSo<g9E?r+z$T6cozMfM%>jV}}HSsFwMb#6m6IwRS
zZoy+mn<l%<_F>VkPTjV!AQ~GKLokwKy=2ENXAh-QFuEd#yE;0sWT>}zsfhRn1PD>0
z9}o?1+R;V63)0nWza3WO3ou+RZ1`e~VW7EVnE`F!AfU5=V`9x7;ZDdeT3#}GmdI3~
zMB%*+3@G3}>?+E0UZVeFwOW3kD&>9G*RNlX8;D^{#l4ZE0x=6vaOu(|U4&k*H+*4q
z!aW)A)<7#ZTaib51SP&HWq1<fFcO-zXxw1SC=l~AW6;C22UOM6)DpBZ@h`2pcSWpv
zw>J2b6kJ4yb5;?!oE#J?8s^{bF=#;xsGtNz&YjcbP>ni?aR>l@ph%te$$`|CcrZWf
z(bAK2OoC=tYtw*TOrecj+r5p%=&qG%AE%lW)|&|Y22x{=Qsqu2b*&OFC~JAu<<kFN
z(9pcpKHl1if>uhOIg-DND|5UY-rWR5(6y3gMcf6j|A||CTt~jNS`~Bz6y3rfKi2I^
z1;*7%(WR{LPF{TlTpHjMl(xs=D|4K6e>^`xtQ;f}g4dl2BC`Y9qvS=;X+Cu5kSgd*
zZ5o;h;@RMDq$+te06G4R2-kWa%3Xx&)PA<JfC!8?e6}6w3USdIP<?SwmT1h0<|4Mk
ztx)pv1=%QDTS=k$q4xhqm%CE2qzHU%W*NA&;Lz6A*0pJ(y;0%6+uL<RmdCZOQHE@$
z#ZhI+>u-&wiuF#g28*yJY%0S>s0m;3MTs_xgvJ3;ZQq&4XXP<ZLZ*wnmx<XhMLps|
z_I?11N^Nl#xz+fmqr(vcAOD#@s5_MWaaA*iNmddhB5>e9CmKKonh7Q-+=+=Uax;-w
zMQJ8$1OJsus6qXWpFY$l{R>WD>EW*sSEi7Gh!(c&RzM51x;Z`E1_Jf?7+DtNJ+*9<
z_G&-?0i;BPs+(q}=;YluEO^Op{L;r~8^4LS&>w&JY6Zk+Mb@X9E&=(I*&+rI#FpmA
zfQJYhm~w4-x@5hnmJYZ5U!`p2)BmxQk*>wQdD8(^yb!YxQ$Qf87=EINWu-Y}e=Ns2
zEHsowKtKTb4_r|2go%=uO9>FyKY~<o7n9o}h6L3p0Kzph`TrfzftwI(Lw@zklN(Pc
z>y=D<D>*qi_&O#ggV~D{3D{(%|Ft~1F8GkaW2F(`AG$BfEHGw$nz?R@E_iJpI3-e`
zCEEprhUh<n^cOHgl+m(a0`w3@X(oz~Vq#+-3+JW6J1G%coNgDjmzf%DB6Om$8Biot
zTSsq`GBnO7Od^A2>cj*Lig2|fyo{cx@F(@*>bA;!U013C^^`1vm44Zgf6&+%yp5(3
zsu{665b?J$FsNL<e2Qsplm*BbTsq+BqVL}y2p2XVVrPdrP(@*tKYiF^7MO?r=OWpf
zlZ5b{9B2T4`ve_{&>5l4p&oCtIz+;x5NsXH{NTG_)(k+M>=l#<l981)ZvJeCGK5O8
zdCS0MYKegd26NUZ;o!#T+ZmXzn(Fof>2R2C^O)-9C^<290U!0N3x(4Kg1}%I$C)R)
z?SMIk%G5ct=SM-pUzVgARNRCO<zTs?B>K;Zn3rR*hQ%MEg(yFG=6(o!P25<T88NU1
zDg2qAUutB^t*hD3(Ei|>p-d9i_sRPk&&kO>5iS!rLT;3ChK;`e{BxPu@c?L^Ks_6G
zl)|(k$`9>zTv-t$<!IW9^74bSFD=o-r2)r6?-TomPvz43EC|^frnC(T7<qmYV*^9Y
zqU`K3fb@~U_PxO-{8S|E?Vj0Pgx!pBNo|LL6nMR0&yZRA4T!302p;s?2h)XslG;ua
zRrnEPrHuV3@d|`!3*#UJvu~M0PNp5-pMmV%1huRzbHk>_swVBd)mR)N?gCk->Ip2I
ziQXze5n2q^T#A%S@>)k4b~*ESM;W>dA=M{jPO8yUVH^6&!lem3XstI;pF)gs7IJ0J
zLs&tXexL=B2OSOJGznP@gEElrk@-&;`OecYxMnJ(4m4m-i1{EwRYRyo%R$h|N=w7k
zXXc-pp61Ls40EMRr<!2mZ_h8nev&s$ifp+DQ8`g3Z?ap{VdQk}zk>JQk*p$JVhD2@
zcm=oCSaITOIW!-v;ydEf(f((C${?I!k$}l4AjA+v;b+%=g;v>sshJHMHbABt!Ni+N
zP#`zvvUc)-HcERjT1`}`q#D(5`o8<W_`?6n5stHwas*(z2?4_q^Q<<_c6#t2&_Bq-
zO<1+)sot0bIjF|a_0X)f#X|i3YoS?iYNjUx2cs8f-Q7b=Xd4)3-Nk=P6&Xi3?aIpA
zgG<mp3kx$~)840Jc80(m2+yJH4^^nnLzISC&%SuIlwLGV4FvO2(_zkdRGKycUG$1P
zah(;eYf!3b@;vC|&z~1YvU7dvcn<yabkKtYVi{n;2*b)m2~Y}xWZZc;GVr+L^e{N>
ztiuh#oNe2;XH8VALoIp<f~Xhbq--U|!C~Bp*evia`TjksB7+NblG3g!J~pCqIL(fu
z)vsE!ahQ#)05}-ux~(QAS^fIf!^=h3?SjDckS*9B^*=Chx6TO`HQ*>{VPlYgFm6kf
zRW8$KW`I!5kUTJ<@(7c*G-n4=O(7nQ1J-0hU{q2uDGU3yQ!miG`ifqPX-k&%&}x!G
z4Pg+0ci$sM15gkru^||2^yc5DL@2J#^V2B$_dLKzA~6|;91?=t58k2wVa0^(jT@a9
zvmB|sB%e7yTBy`gT8`R)zSSNb6CWMdGVnh_nKtbxfJYFhf^Xld&J*3jbyYRcLPFMT
zFSb=Fs0ViKHWdwS!^)@~F6%azvTWVHU2I{z0@Erp5Ike#h)dqWCI|cXq<bz&pWg73
zlL(Yak3IHLhFl?N*9c9*WdkSPKD3fV&qI&{XsSz4Z_U9=+5!*-=*bgLPtrc*-$5wV
zP{X^50=Dcqc<><X_6W?tmMo~Oa*ToUw|0;1Rk)T|@wNc$vRuIN2na6@Ho4$b6d(-N
z=IiULyj<fntI}j;Wt$2q^Fd46nB#(PWj^*xz_cly??eS44lxfM`=R*#rB#Uz2yS9B
z*ctz?Z2YzqRm1^9ld$@e_tB9u6paQN2%Xq@ZXh9h(cacSICwFSd2tx;F3(s^np_3q
z`Rat-C^7Lf+#=`2$Ttf&_;#^S*QubsoC!h;!psB;O<No69fulC8)6ot{<1_K@K8u2
zK9*<>(;1>dLNf#_#ZV1ROBUoi#1@AZVBqg>WWnPtAzsdo1GVTvI6xoCMsclFv&SHQ
z6o%H>*z_Q|TQ9678P-6C;)IY06u$2S;m~W^H1S>gN}Z`5`Ul0qWh$ek3F0{huMBMe
zxNnj37jsH4v05>GFr^}EfzS+4@Q~;CJusME4yUXXl+G#pI7wn53F(Gf@u4?HPY#2h
zuS~OquqpMI*S>^Mpl<T1b8&8nZi(p?sE_&Yuju_Ey&4iH3Hc0_xT~wn!(*THlfV;p
zx7F0@Q?tzBb%LHP{`~Q87VXfu2TJJ2GbB>fD4ZO^lLcS^t{Eq^LnJ@p8_nGXG7Ln;
z($Qq)<TSw$CPuC#knmx}t9j2t>?ZP`O)d~h=_aaNLJa~rH3v7u)OV;@bkO7gF>1iP
zG+lsn2B?|)#^uZn@6IXvAcVQgYHGr`dUU+0HXUf>gf)#eapqNTP7?OyL$Pp7@7#9I
ztm)tI5oWh;tChwYK&P!hU1D6M>%bqdsOwtlR}-_|=s2S+)JU!xOwB~+8)J;%sMIPF
zuLLndfH3kfYeM^lU$}tslIXpal*knf83OAyRG$JT@h+_}!C9ek!w4#E&4hD=H9UIg
z5Zo@s@H0eL!??><fR)~$dV`iVlEd&+z$d%06{s*yaT@fb&}MtkYUha<ZR3_KQEE3x
zIwvrizqoGeDumW<lr|#USg0`wF$7o3C?S)-S0QJS=q|*7In;Q1DopWyZ~SC|PW}1S
z4D!xpzMZ*Xw?z@`x!p03fl(XKTu&I3zkvnB(ReBvAd{eKL=*pngB6Cqzdpo&F`kz9
zYzMBUbD2Jg(iBF!x}S}JbHq$KM(8E!zkd7H<g&DYd6<*v+)>(waZc($_|TZKN@|}N
zu|HE72?NQGPfR>U?FMxg#J-0pBf^!7v7w=@s88A{hD!8QK$MFOEsNF26rlLIS0Kwo
zn?;LV=N1YZfEa$J!`LAK@%v4Q@@7!+mT*|HzQjxp#)wJ0mkDPB^mI>rf!D4n)NxE2
zoZ7Xnwgj4nCPt1>1UJ%|W(<7PUL5r+JF_xW>s<=)bIzTcXc{#d7QY~E!*GMvg)JUP
z=<PcTO7fKTq%W8D9x6$=V+0u5_e5|nvEc6#6Nmq~B=@7RaD!W`NXtwy0Iad`29g2;
zv>7;W1i*o=Nuntyd`XkWG_wT^`-}rVd-2mHG82X*G5>h44-@wD9c<zc`RPa#9>nD|
zLlQ@EkAYBomj&ayg@gwO%_ZvOfGLv7nlM3-Gm`X}o14LK%n%AYaju{as;|6o&l`wd
zEYv6~AK{*1$tffGu1h0;PMVlYLK-1RhyfQ}m#y(+F!H4V{}sH2={-bh*nE`1LY
zsXr4A3ev_JBMul924KFF8E1vJ6LAK+z9nk`L8fGSC%qa)2aVNopq`J~jo3PjkpgN^
z4kKW^zZKI*yD`F(R#=Pj7Gb~PYmT?`csRw##&RKnmM}Gr*?iK38)0BfDnTYhC?TW6
zXx}rxJf`yngN=7tzJLGjkCC5}U{SKI4!=YMvJJ)VAxZ=>R7Oa~w3g@-#L1CJ5@ueZ
z`UV9pfEmE-28tI)i-%rF%YyRWMAQK)NjMn5mq>gDI8u9w!A1$u6f7Uk4ZMzxJt`))
zXo`7;cag!2IJ%HCn&7fv1bZIf7Ar|86vVg&-s!rko+Gsp;2{B0$~J`N1sNG)Mu6T3
zs{v8=7gP$jRzytzpONoS_^NB~Fie7(F94GbZddV%Xj<vnbX0;l#H@@0Gf@FBAqeFa
zqa8TO&}p37w4FFSfpO(GuvLywyP?=+O*K2f^m>TZ%UKZ}8{3bmFHWN7uwc{+WOk{{
z+u8E#Ch1eKj~@gP-ZJ6tyM@BXfTBPMSHzi!I<Q7->q(4axUpa~_zQ-lULX`GR(5YV
zd3D9-&FHB>S!OWzYC^Y)<p@-dMTqu0sB#}{+6P3m9kUrrNj6<~6ylebrnydTR@|g^
zZ&LQayF(HCWirAm-U?S4XeS5u>Yr2-j5{Bc%vE6UTB-h2^`$HI2i)~p=W0_&=GteS
zhDsK0{yBL6-3exw%*H9cnuV9#gFAT==B!qbB=*6(6~vJQC~w^Av2k%dbG*Pr`Wvt5
z>dsB{si>+R;^1J~y!p88@YQpAR3xv<`ub6@W$f%e!8C=bk(`opAZQbbbavyT9R!+c
z&DgSM&tPxwd1_EJap!r#^QJ2#h^l)^<ejapEh1dHyodNj-it3^zI^uVSzB8h<Zc8N
zi#x^{Rm;yoU6;ta0_jLchn4j@=*}Vd&g+gJJEod+Z8htg&`{En58i&eo9q#gT7nSn
zb2BrWV(V9tT0HPswY9bMQkZ=j`~7W$23Zwh0j0PCZ3**zei;0*<iz)v(tpm(EbwNQ
zr!Ffm$E@<U%&lul5*MMYSXx>(XS>K#6Py^xjB<NxqRB>J>)h|YK9QS6JEYFSDGUz_
zyMF!pe&YVQd3iU|&>V0Fs@K6R-gCLN#7*KAngn%khoD(2SSmFuuuF)bdDt7Cl_VC}
z($&?~?oSCr>fXJ!pAsb3{C8()95!#>jBeB?vW@(HsqctM{nqa82j%LdX*uAAyKBJj
zFpuST>p1y0@IPK2k&$d1nN>A4A;)yw-c+n0vAENNrQ)MEOYPme7aZ<jk0loNxZ!0d
zhxuu9Bcnbz|HCu$vvTCQ8O9G#YQ>!A{prKP!+CHL;9TS?((uwQq1$iXy*td>0i&t8
zx%ofu%FN0t;touYbeWYoHd5!$KQgGx34BZ3@4Kv7exw<;1!)Rn6gOk!O7??7%Y^O6
z57FE*Hn#iBsCi@!sq~m~f|l%Eq|P~hvI!7%50~Zc;UPm7+ot(Zv~qKE-JgQrd+p>o
zLxj$J2*xWXdn!EWH`CJ(|M|6xxKz?+1t-Zov__oop=O0{_#9%@(m%xdgg*OOT$}}6
zm-P*1QnD9kV~F*cW`6tjZGC;c`%~;P8rxZ6vh^^%rX)nX1v~-{EXs9bQxjMxIRZ$P
z810hQPqgg0_~Rz3Nfpdaxx1iMGQ^cXeb5_Yx-dUa&5EuMU>CpSNdE4Tbc-(9g*BD=
z`DYM+<jbeq<DGgnccs(=36?bHg>>R#KtfD&92xd(+LQ$F3*sZ{Jg@rxFp&u<m{!2<
zogvaGH7V(tr7(%)^D9{NRs3FO<i?{%>&drI6Zf*W0o<dzTVLud^ri-YE*9bgkl|Ky
zlg5k}0*;@4A3!2ef79^!8JIv^T&qVSP!hs&a;PO_QT6iW$`}={A8!e%zKTF`T_qvw
zSV2j!q{PODzDFQJBX~srJTP#6v{UBaUku0Rj)Vj?a^Tie@_jq=gBPQoKQI2hRzXY4
z8JdaIS!ih+H*VY?L`!m|2dM3C{KUh$|JbpoC0#O<#gBT2npYewItT3qyN;uV+KE?J
z9I?d(Wx0rniSZs25b(Qo5IqR;dpU_?7Y>TPHjFk6VCTWOtlH8K;;!Z|uUxeXzA`_)
z0Y&YcuphI;g$oz#?S)ydV@3{$iM)ni%D5abnv$27cK~%9FGrq}Cr{GRc>^7tL+J+y
z*V5NNM1wWm|7sn{^-$5eM?yDHFxwSnCyX&1$m(9uZUu*4a+Fx*X}jxsdg6AYZ*Z1}
zlT)tz(>w|MMe;5Z@H`P8wCU;TyjP3Wh;JfZ3e4RFT-aLFz~{xQNfLs_#>Nn@zx0|S
z9lh47OvFjBJn;5rbB96v8tjM0hbUw@@?o&wc^`Or`P@1v?v8T+WuXwFp8ujkue5k_
z?cblzVhte$s?oveuRBOt4j@mg?l7Y<t#MYE0rg!$qbe1@aqr$ecY1h?_kR-Qs<rEN
zT%7D(6oPa7FPK+m4tmm;f6$XB!ae7XkaVWYk`@s{h^f1WQGP55lh2EGtZsuC_ZrtB
z4frAY5QJIkE+Fadm@BpX`SYhd6gm^lbHYZ+k&gh#v|O=5EQG5^!<mGV%!_HPl<Pbz
zNUf!@S9l=Fe-Sn!Rx?L_2u>^%j1y=(@SWdS;9vER4nO23%^&iw*eb@mhNOQhE!uQ!
zbX30-*}CQ&aWJP<FFY#htSSTF3XlH&TT;~C1$nRJNz=t;?3a74kT==c9*aCUI9OIz
z_VMFKC}VJY6)#`@=gkYaAk#CQ9UY~ir#-im7j&1!%P$`JxI?dv1zB!xD;d8R77Cm_
zF8&6j4CN@LJRbo%HPE24cV_+{P<l{_oaVjk?7J8lkGykim9C)<QJkEdMA`J=CytA>
z=G@u*!(&$L!%BLQS+VtT=7w%svk{@8Iql|}tZT%de*Jn1J8^!O^y3{P@D0wrS;fLX
z{&W2}AF(z1`!RwJUH7!ESjf=e;2s8sso}PhKW@Tv8Ll|_;TUOJ@zCMJWuyTl3*)Z%
zUUlT-Dku<GnBE%9yXorcu4Bb%=Kh+5kT(@GLf;As8tUqhq?@DygMu(fq&e2`r?d0k
z{rezk`Cq>}F3txy`z1t0)uQ;odDyjUSB><!YtY42RsCTAqgeQHX^)PM+MWo8o{6_X
z0x$aY3&iHg<lT!_cCn<^S1`+|R<Fif)e(MvepuODT=EctQPSbONlO<L6~#irY!U7P
zYeg?cv<BluiJDq;baeeE3q6bz?AsR(UG~8OXGdpeQ?^S>P0bVvE<~$Gk-5T{Ag4SR
z;L)Sr-d@1Ll;q^f($c8HB0o+|@aJs(6NZ(CAYPky%!%u>8k|0TuU2nyrc`>}(1{hT
za~>8VSXYT~LV^SgkUnz;o74~1fiNueLv&xne-;=2hn<w;?ItA4%?8k*zaKHT>n@tO
zh_LY6h=>JzjVA+F{I`uToA7dfT3T8Pz<!%<J2e$2Cnt`9l$Dm&W;tcNeS4GRiK+<h
z@ohvZAiB7Qwic{;#@(=SFva;?_Ws?-$Sxcf$FxOuk8<+j1jb2F1JOZ!CSge7^%)=q
zqg$}k>fn@Nxxf0DA#^drfbteGfW5@R08l|<f~gMIA{@mfjrM%iVA5tk=FXi5&LA4`
za)0{Z!2<;OIpLtCmZ^ZM5^Pfkz8T{mp!l*8n)ptv0VYmy_+1DR9Iz;kMn*+PtGzJ5
zs0(qjrZsofWIo=9V>~V{F0!(}(6u3qYu>WC`!pv<LRwmSQi@}|amTi8Rsdq)GDp>t
z&z^b9Z)zasve^IU&%vw<D?*P$sCs+C9Fq5n6)T?qq5!7QYD+6CZzhqC7~F*xpf^7~
z@^92Z+8>*w(jqJ@jESHvQqX6)Q66Upsr!b8hI)F=QQOT;#(8=cqEGiunEBAk-o@Xp
z@#!VO&NR2QjMbF<ft^Nl{G1oOnnN-&GGbz4f{F+M2jdj8v$H7KN${nhtH9!b%*KRC
zq$Z0+bb3%D^@|s!mb>syQF}|AhQK~z)FU%96AwdJy;Ab()vK14<1H>rngxT;AE%#C
zCJoCvIywdh2I?P$sSXQDN2e^)!REk$2si}({{D#j=1&%pVPSh&SXyyB4{1119k**L
z5CS<k3=Y-rbtj$^0E=?fT3YP1r<WIs;w=RQ1w4!aP?~PfiKv7GE?)<L=p-DJv1b4w
zWdQC2-oAe02GL}{KHLId2H@_=lP6+kt**(*<Ee6k9UTPV_B}xqTf9QKVI{u%Nb?u7
zl6co>DEXt#z4g-cpkr>nx{mLdb<GsgeO7Gu96gPhAiwp5@yR`@+|(O3V7!o#gG~t^
zP<VO6_M>JtHUfNn#uab9P!qw&z&U+6HSPZt?G*kX!D41<xsi@8LAMx&4Bi+PkqW?#
z(Vtm(ASo#+J(3O+y(!KM_Ii4H>0)1yXaoKIU*Df{+riB4%KRPO6rc>RuS!p6<8Wy0
zc5BWGR1(&c_aV!lN9};BFE3wGR%Q+iH2(ZC)*k&QX|7ONNlh)?dO%Ihz5#Q#DBKuQ
zibk(KbZC4CJGQuhN)(ZYi7Xs?@JQF&vtx%XKAI5+&Ws_)Bj=t0#6rnHDU}Zt#3^5P
zsqfHgx_<v2jeDVus@GEyX(dl48<Zu*8SUbR2KC;hb+oj;mco3`{rn0#iju!!#a++1
z#mp*eYC6GlfU4XBv~%}BWe$eO8{b`GTfO=o{-Lk8w|c4#iH-WVpNp#na1Kg%)l}OK
zEF711)_!+f`bI|HsN5%W6&Owtfe8T0jT877ZOud|APCe--bO~I+KyaP8&-Sx@#7@K
z4*jF_)Ts9Xrvr_;P+%OzLh@0+1~GhE#hss@zkU05Uc^a!d$z!DC!&HEy%H!XEmi1_
z2beE;$>*7mrj01=^zVYR2z!jh9TI||u<((?hm{x;Z~kILN=uzJF^T{1!GfuR^T-ht
zayE_y0Un;1`bl-nw*s>APL7V+FV5TjVq1cki$@i#V?}hw>IQpxgoH5n{^w&?$V*9W
zGhwV-n(g9(Q^T&VuJ^C7KPqU42Pt&y*f6#ZP26bJ?q};aZhTWEbN~K*06c@l_Qi3n
zY-c9~-5rUmIy&Yvqc_k?(u??=W-Xs&u358&h;4HzDJhJ9X+GJudGnXA;2_)h9%r)i
z@+NaiZynNIP2yvNbz*G%i~DMI?3LsN4%QAdLKH_S52ztQC+wc*LnSP$u8tQ*&%B9>
z!Rw4-hX!R7BESk^Pac@l3!`<1EFa&ycN!kIL4R+r+Sm`9{#t<f$mr;FSV`&o>!KPn
zY)qk6pj^XP2J#M|a01-@w9cthrz(>|$a6}>YB-uQI!qYvYa1GpUxl9j<L2m?qLLDN
zV|MADr!9uic^g;N(l8p#{ZNBb8zG4@0)^=`O<(EjRa-DVP}%w5RIK+lQe_}40|@g%
zYhbGy85ooiMkh#~lm|XboQ=&RAK)$QCJ#TqNp<W_FGQTitH<kD-LYP__V(pzz=({D
zjA3Vv|M=`Ub6i+B{oo4-uCKJ*6V2Ptz;jSzs}ppZ9?q@8Sh$J}E(?00%I(|l3F1qB
zO~)TNc#v>0QD%#ai&63Zqs)I@Rh2594W$)2r_=+~ktm;n*Veqeyzt+65$Wj{%E1AL
z$uC2ri&d4C{{B5{uSoL^rLi11pyapeVQ11xSJUH=b?`fgaAlGA2O}A@wY3>>bnye%
zny5E~qcArafzxx|8`iJSV%7Bpo<U15Q`OcE(cSNm0FaZyqj&QrtRg@9Yleoxct}ls
z#9H^Kphb{XwJu$%`2M}SyDa>-z0Tiz`T;#T?epgoXdsaHu%AHd#5g_~UXpLyHU0TB
z%a!i*&oMC%ClqxVISRYbNMC=)&YiIJWC@!1ZowN1+>~a%Pf$=0?E-@$$bPU@Yzop8
zA--v@4FNZXYK6-_c;LXu%sg<+N3cg?D0~gg`{d-<nY&wd@75r?7KV4|3*x@y<uQxe
zZ{4{wz}GjwYi!%rtq^iEtoq)9@!#(F4ol@hmzGi&8WAunFAXejC8a71vEqRxS}H12
zul~$n`UztE-hKNJdKlNWI}r>u1<(fdlkI{(OMFIN8Q({-MD`muuJ?`?#6(2+1O%L;
z{!vm=QdG3nO1hSbCZO6sr6R|B+ewX*LsDnqL&J}9yL-1K)4?ww01{0zDk}|*7Ye$6
zKtPfwL!Y|6{Vb+X!OdPge-67B`A3X5#HkCcT6Gse@bkwHKGlO0#AFQ6AvO!M4!}Xg
z+<1Ko;auWb0+m%&2mEWjN8KjkY9kq5C+LIrY}&Mm7aL#!i&^MqA0D!Up0JJ;ZU&G5
zaps7FP=c=gM#ft_20)8UPPWAKKfzbcddedjdBFT$m2~0Y`zWN}sMFUJ9!juK<1Opg
zW7@9@V-#<(gNQ$Pq%y)>)7+;{pAN!WqTB(wVH%!jka)NPJnVz=!5RZM#E}8m`mC%h
zT-o?9JLD$D%6NfqF!z63W#AHs3vqk5JI|}Cs^a!AXc-oE4OPWs<IZd30heN@_;Ab}
za010ZTnG2X9KElfUrcl~MpTg_mhd$CZ%`)jLdzI&x)pjDvzX&q>K{LT2sut46C>*-
z^cgq;q=5<Gni>H>2h>e~MIda{RwPR*0&9||i};l^Ggh1;2DE2miv+V9-)DrdKrh0{
z-us_GGD*X_2BEzTb5ld08cOwo7&C!a*^GmjfT$1$Ecb<!5MvE6^Z=kB6xE~sP0FI<
zjgPcTzxIHs?&IY}GuDo=LQM^gXj%-_Uc_64MmJe8;4shBREtZ+aphj@9M%*o55J)X
zOLV&FDG=Q(_)&xxAnY?=-}q!j7Wzhn8U{4rCHD^?is1GGjZc!Nx7D+qGw<D7Jtg@L
z*;AHNTdUgb3Wor32U_r6U~~qJ5)%Nnh;!ht?%rOA6b<N$=g;>dC5TB{-XDY^HZ@ez
zOgy&7)s-~q3k;@_?W}n@7|{lRFgh}#V_H;Li0L#Unc>I-RIC2dJm5~hdFM_$m;#_@
zm(d_DUmnMj;GT%nL68y=2{F1WjPi6-xAmjfX}&!!AfUItXRsw(9D}K^^Y9mWP`$&L
zpikeO)b_A%=V{#AKvM=_m`^4*LK;(NfG2<}Q#b{(olC2zeL?%Axp`1Rtvc1pT%4c8
z?Wn7&e!m6J8U~DvoSZX;%Fyy5Fo?o?dD)U;dc(+Q*Y4d#&0pF_^xqw5fEEVsU8{aj
zE-(!U>*emfLPB;xO5EJsMZV9UZx#z-W@2)})GOGKn!0+8w(@WL+`aC#4Gj(s4j)pf
zsa9f?<a{1X{&b){sk7jd$TIc;&G*-TU`gxLPn<Y`$s`p6e{XMj&GR{Rk$~;#mzn69
zndJ-B&(Ro;;DmmFAV2>{>#Ed#Hqz84ph*l!sLyu!K7Fd7ruNhPToG!OzDpyVnQ#by
zDQ9E1CnqOk2Cg2fa9=3!4W5iMi(Q_c{{G`ffWN=0y86;+A(yzlj&NlNbTtMBKh$IH
zuI*Cafq_v;T01*oB|kvYpo1%R8{_d}HUsrmi}N$Te_xxNL{o5HnB_Zqw5Y18>dTkk
zfQq}>K&8K8?IDEwXL2Jqpo=1!p+In`C1X4idW$h)<CN_0&dwD33B$>%^X^Z{yy^|U
z(*)=f7A+8&Qp+&;kc&k4aqI`m9zHki(<gwC@}EDWbJI16<}y!@X_Ya!`%3kyR!UVU
zUAUn1-d|vY@U1%A+H&LRF~^9P%h(^UjEp&GEMQs(4Gjt~Xh7J?A~sK)#(*KwZ}39j
zB&OAXQjwv00=DNbT!@`rT@4j5+L;-TZL3Bmw@vNFH#?hcju+dADO+=MJfY(msAF`r
zA#?-)3WH~aUymmqSisDm)n}iJqunhCQ+zces+j|N7}y+A7vD27F(HbnXHZ<UG)`Y#
zg6UwsfcGt50y;GT_(Dp&A3aJ(1vE1=L#x09Bbtz2k$<kJI-1qlv($tp2USanX&8%-
zB&xWb3^Darh`2Ux`pT70;C8~ov#2=9i#Yp^*C-My>?cbvBzk?E7Pzo_7>i3l6}1)H
znVDVCLcr1fbakOUUlt)|>I_Puhu}a79&Ds~`ZOBzH15%6sCi;^^avN1xXYp=Kn_Ng
zGL%Q>rX~l}8F`KC2?@_Czz|Fp8s_*4aqE76l=+Vzts}Va+_?if{dxrECLBg(zkU42
zxW&S$S;2^eZ+B38VYrD8+MP*L`iSjk1fi{igZ8J}5g_b%(iqG#`0Bn8x+6vK^t)Sn
zdeWZtH?CjD*+d-!gE~YBl$q}CZo*RrTM!j>LbF57i=U<I_1+6H5S0a$f?YZG7+@a$
z8y>}S{dxxq8O$HZ-a$b@p!+x*Rg?2@;SiT<iUQ;YfB&<(V9l?CqA>?q^0mr$=Kb14
z(`ngSfy+utagz^{XFmb}L3z4ZC%jKY<dt&zuAMupjGoya0Lr7WjvbOzRD707yryuB
z6=z6I0kKU?7V|VmR!;n?tDC`~47|-EY|O;?ICLKzh()bW1xEw@1pWu5$FbD2-6ADW
zE6P;z&|r~yi#WRlA7?W)6>Lht7YyWp2u_WR?1aDqJ>K2<ZNRf<+?XChuh=A&|AYzb
zKL)R`u#2jy)A$hR;1Gb0;^+um!$;oUQ{&@X?HO<)>ytsnK}Pw2<KL>QKO)7E9_anV
z#1F0n?H0c=gT}+I5?}eoi!hduh>h4xYan{q@b4312v+SXeE#g&V>~?JnwnTAaN_ed
zUw(c6Zadx$Vo4lAId$qQYAPgDVQgPC59Inzv@-Xn_#Zs9!T?XBfG7D5@+R5`++#!`
zFo3>_rnLxEa1yEfYE>!>4ZL`(Yiby%sobA_`631J3p2LZuJjm`GTfm_RkY9DyQ^3`
zFkptj3pl2;l80^}u(!QEuQC$ji6PMEl)MFT77kruv(#=TCNymW%tH@uJ;ckbh>I!s
zr<rlrE&~1ZXrC@r@_PJuJEsOZ;!o~}etrxza=|C;#=8}tJlhD|fQEaVodwMNCuFhG
z(qVL8RJDWdC;$?er_MNd90QQz;vw|q*um)4N`P)icpPzHaR;^S#$^44woo8UWD8zE
zO9+Iz)b~kAuZ>0Sy1BtR;^-}feG`$3n&iJ%P7xiWVC#9{<YI8ux+*d*n8n4_H#F2Z
zewzUS4#pux^s8}clnJa06BFScCSbrGDTTkG@@%gfn-KXYAmE3_4*`tA2y^yAxpaaU
zuy(Bnt{w;+SAn(rgb{r_;){tx>l4Zoiu&r6cOb5yi{asyd!LAunSGspj5yeS$v(rZ
zP3rCESM=qO9x%?cap&>ts4O6nNPi%=BIbK(#VU_6HNqW{x|VkLj^o#<n>g9oWtP;M
z8XM(8#AK<>EiC#l4PNRtmo8$~O4@R)D?i#lz5#q45g9i#k43;$irNhBt~ie^w1&}v
z9Y(3RVQVYM3WaSSw4h_hjzxLLew}bTO`Sx}Ks~(!$@{p%(dEZ!aq!b@eipGO$(2di
zQZHV-h|=L>*t{8M9M7}^gRW=FGwIM6=={`w?TR8(=qJ!h?zp$OiI@S#LOFu=hDDnK
zrU81r6fj+sjZ1i4jdQxN(_BFIfnL%3pd#0w(k{2V)A8-=R}4PIYJ7U087KwjxCA8?
zBRyU?^o;T$CgzNomz0zYi}!(%muWM!XD%faWfl<?46h#sG=w!gQUMhiDWf*=k(QP=
zdAz#3d=yQgsNy|J1DgLH*atx3;EzW*-sD(A4R||ljh;GwOTGtywzn4yP3|S{J9zwf
z8}!?vUAjavk@PzfZ*t>L38nD{L#YR-RT!7($qx+;#c-y1OJZo~Rg6?7j}vDXA<|x$
zia=;#qnt3Q2jYiG6HvMjA3wsOQ;K*?hXsy^NX3@JdF8%zRbsKlCKtjFH}*r#Cg$C{
zbK)n93ky*N-t59DHsaK`ni%1&46k~Ay}bmd6TElw+<$ld8eFgAH+Yc>N~ZePu6>E!
z?$r5n+mn+Wuvx0(Fl!|<@EpTY(}eVmqevSNu+cIFfTLDuZ2*WVBJK*<9W0d;`(;G2
zj0!J3H5E{2M{q$)OUN1wSi~lyAbu$>e&XAV0cyZa8U2!Ch*XuAXqX8YPI%rU$jiEW
z&o|=q9w6sSaXcPrhHWm0TNefg`uFP*;2oj$2^crLVPGHx2@=x0d8HQb4)oxcaTtYm
zTfL!I>@_BgKYSR&!!*Ghi77jLJEl0fpv?eAen?9CWZ4613H-|g@!>Ou@0erGCGH4O
z#Eo32_z9%7fGIDf0!&&yKHNSzJbYDc>!shq+GuEY4h|Kz@Gmd)a5Ufq1Z4Bmx}YfM
z`^=XP!9`h`Zl`-Y?#s%~o}pVn3x+e>j*Jd)D_f(`#}Lc>1sp{`6qFd|!E0T8Ps`|f
zHPt^gr>I}6xH_^=#zl*2(0K3IvE%I0SNPa5#w{Cu`(TP;a1aR53<eIMCXma8@|}0w
zon}TOkeO0keB1&8NX7$Rpt0bWoQ9j#)zz(gIKojmFsm0j0(sA!^W>R?r>yRHdhMm|
zxdAK;ghs{6*Py+qZfA5)p3K82rV^8`fx(Z)XFwg&r%pY1NkfDy<z=Xcg@d`mD`q!(
zz3QI)D?TG@WL|yU5!`&QTYgc&H^k-^wW~OMt+KTenuY73=dn@kV>6gSP)Z%M{k&q;
zno@ten6C%f*$c-R9(#JWN40^g5RMJhZo*>C*pK)GE|4X79!7v)=N-J@pR=|0;l1GC
zJr;K^E8(#NywlLjF>866W(ze{@}+~Dl%3|_XW4Js!FnB7QmW<r#bkE9g%NDoPxXNE
z+Gs&*C7cEcg^+E?HP#IPbNR?W*MXbyhz(Jod~{?KRX``c6PBWA>U#Bd@mD^a=}sR`
zVWFokuc(-Dbgnx73#}M%2ZHb8#~YJ&$FM#e*=Ys-0dbuXCvQ|P7v|&Hs--JC@p}Na
z?`<CTIey!^`Nz+n<ynzRBeo}Qs$gmf^+j;7-bO}KQ?vUempeVm7Q&nn>caHQ44<lU
zigWJlBFvGpGi7L~I85&u#U|u%?$m2P!^EVurA8;Rw#_N?U5O78J)=JXSi?EcE{2IJ
zOgLBVJwWdX1ecbcj>3Zji4D!oxF;>d$yc0QOz%BlT#2E<+(1wN>OV@daO*2Mb#>dp
zR!UX7Gty8-D_Gdrq$~GdU>=Xg+Y1BVf<GSWEiy1ND*P<ks&#-&5GbLLrF8!M`ifi~
zWMo*D&MiCu2YA@P5zTdKsO7^{xmEdDV{uMcrmkn?&bSp+S61RgYFw%2h14Y+$wvXU
zKfL*sk53h(AOrSNK$~OV<ZoduFtK837Uw6Fg`tKm7Rj!iBesY+NJz>9PrmS*wMwLq
z3L;X3OR=3SLPA&I^K~bp`r#nvW-0W-YMk6Z?-1}O)SVtu!IM0i9mgcjoOv5ue*vBB
zxKS=zf9c08DGUimpc`IDaX(ZgX5a6z7y2TKzfu82l%$5=D3JHx&AfO3&#81T9rovD
zoR=`jNh54AOG{o>{MHT7Cg>G_OfagKhTHBYBn%<1;WFX{%+fzFfCqzoz1=u_FkkPo
zo!tx`0ASDv5BkYoXDh1-)PsWj{LNBmAc;VK))P8SB`UxuHw`<jtgM6#JL@z_NQ7To
z7Z)Wk<X>!_zlZypJMfQ}lcOVJze`j4=c`U7(~gS(Oa`BI^46d^EA9(8ZYgyZqbX^T
zH^i6f1Y(6I<E~$ic1idmcdmOAjAXyyU`{qR;t>{V9s9O}NyE%|E}X6k!BbM>60BDt
zK|$n1Q)#IglpG|js@;dAHe2xu&|W8}1r&06DNOHRqyfmec9lPaJuM+~GY$5vUgLuY
zC%R>w6T>+=NKWoqKX67C=l5iyO}JnlIL-2UK@J2eW<TOVjN$iGbfMb2KZOyRk&#i;
zL3tPk$@RR{$&>g+FetX3Q$(y~aY1Lg@$v$E0rSVa0s@g%>4+1E-dDNw^BqU*p+7?}
zMbu^Y{sLs45k2Zl81XHv=agFvjf_0&za8z6B^1I0wW3OlA41e?ZM`b>AUoRyrKHLv
z6jNYWhW`8)Ezxh@xK|(CEM<E_3;0=Z4Y+rTwe-8y);c(y>>Jgq4kwcFvazGOmKG?v
z1tSU?mfvD`JhUkk-FV~oRSzCLy4GtC8R?7WjVi>0VT@_afqnb(plKYwjt?p2hFN_r
zzm&PpwlrPP;?D&I1$x#~($ab$N7n*)084N-0$LCm$pK(}*dUCXf?XqzPKbR&oTGo?
zC~Yh94XpN>kbUOncAj3G=)9mu*ytAWRVcn{PBJCCz<Z10(?b$!3zaNfisM20<Ky9f
zpQlFqm&JHpRIytN#~=^!WC{OiYzCG!B`fXstIE#ReHjPnsquUSsSpmF{OfRzyRP!s
z$Jh6ENzoqE2o=x9T923?Da`%cO5W3ONXiO{=PeNr!yw{{uy4A5*9oqpazmElh0g{q
zYpAVF<Z`+bq6!@a=Q9P@05+HRs!N^K*Vm8eZFqTAZZ#nYPvNmNi@0O=ry!QdW;_^>
z7<Yr35%r@8$|WWs2?ElU#X>w50%Q;#+upryPS1!55CAHgy83zyyX|CT#3>j<v;*<R
z0w?0XOt?3_%PlQ^s=I$~LpA1!CgUN^YiHW~(1V`|g113P;?zh}_&<cb2{@K(+xCA~
ztCgmeRWxXjwIXRkniW|MNF^CclqRA<BV}GIDvCx$14%N4CLxrf!B9dfDl{i08JqC^
zPU>0D`~BbT|J~cOJ*%y_@9Vy<^E}S|*pL0#592mM>7lKt*>S)^6BCpBBOHn<%4anG
z)B^ZMT-uuRM;YuQtV7&{GRjn*(opqsZvKl*kY?%Wb@YV_O?+5v-OH-bQcur2I5;>p
zwUJFRojZ*K!=yu`_o{!6FYcsnKQ`L56mnf{g%_HH?yECsg}aquFlX`HaY3W}HA(hS
z&O!%4w2f9(z4vXg!TLQBGvcUda1%iqn0Jt@?6Z2Ykjevzn2s*&C3|7<hkrhfR*;rz
zqDDkP5}OwiwUAU}n4rsBYpmsN-MWPj)x*YnUA1@TDxdxwBz-a@<k}?J<W<Ya6vI+C
zYc4Jvae&iKe!Yof<;F-r9WmSYi_4XJN20zO-s*McV?od)=eKV<ldYh0d9p2V$8qWF
zDe6AgEo>~xw~xLRTW6E2)al#4xJ}2kv7lkgODV7*5y!0>zW?uEk!&?l9>h@9F4(ea
zqjce{V|igSdnuhRj5fJ(^X7zc<6!4)kw>YhAOIP1h`cC&NzTMYmx$Wrj@~!fvXBe&
z%*+zbo<%6Q;_B;8H`bnB_@U5|!_UCt!`Ig3ATjYG3-I#Fvm)UH3#}MwCz9oR0fpZS
z%>DM*ty#SqO^NNX;NYwDUO^PNy1F_$f1@QgE+xg{%n**ewA|_YQ|-YzN_M@Hy$?nV
zXaa5uEj7uXlmcfDA#lW=2KO5otjDg%&(54oFo*D4^4#ump9isNx)B^zqS|b}Hh$`)
z$#5$2T5f|pFH*U&8<~lWNa@h(@agBYZo@0kNlMK#A~SEi>CS+0B!}KTR;lYXcI?!t
zn4<@M37i;7<SNS<i&$2r5Z|_%4)5pt&E89akQ#DG-5HKCOBAB<b!X}ZYiMl35a49J
zAlb+#r=H1Gc3AZiO>KVkfK?P(Lh}zz2#R|Yh#^np>*0H$@vcM;Z@^e_<w)%ivW=%C
z3rBKIC-xiJ)tERNXcR?zR%NC4b0e_=?or4FIU7g;dv<Tz_E-FH&m#9(g+2Rhynp?H
z^f&tpN~7<*SMzU*?bdG`Hfji$aL4UgUuv0->-qgXSKfXnTMckH^_<jL12a)j{ZYuD
znKRMadONy(o^0~1Z46bH3<}cz^{-#Pd{kV_qPwJIV;QmxCidIQ%mcy_^ztU}MF*j$
zTv+?$&C)t3hHdT~iRbtM+!&`0|8~8bqj)vgZ9HN3xuj)CgT!MEHN#Egk8{6%*D0a0
z$k|waN(72QaVJmy(|COKonBfwSy>dGmmFE7H*;ob;`;Q=Oj}Y!GJs95S-R8?$$(%!
z7c5*ja^a=jsZ~S7@Bg*GFk$nsf1Z8XLZTcS8|%3j6EeaeZ5XP~BAJ9)gef6dKm02F
ze$j%$`hK!zv-XfMhlc(c(~b(;4dzQAWTbC8H@1;V_W0z+7{jKfCJkt`*vp5ntUonq
zVV4ZIz0r406?Yh~q+|{Ac`-T~@|m2OyG7-d$5j-+0>w#bbMXUs`BL0=QIqf^C{C$w
zDaHo2Yuh#;u~>F5cuGIozWi$$WsY8Ea&=P)2_a9b?f$WRdbeN1h&Myktg9QN>vNAa
zu8OJqvnFQH!uTN$5X^XLDR>4PIWl4V_`;VZble4bN3R*5Gr%x;e<LN9h{#CS#;^X;
z`>At6{aYTo(^Ty3nz3`IRB<<JPC2v`@wcb$hM<GH-jey+a0YFT(q?tkt!CZY-Deq_
zam5Og<nC)ehnP4QFKNzv^ZNC9$4_5e0IfiRJb54wM99hTaG`Jcv&Ox-7{!a~2YW9g
zYKc`<P`KmVn^F)xk>3VdQk8+`Mlwb4r0%&atfGg?t9ctg|0C#ST4<*rBIPzBA$6iO
z(ON~Du<F4uy}`nDVBl6TdHh-fR>|Gi2W#?Ad2id64!uYbfz8!VPA)6w7*+6O)tn=v
zE2x=1e|JdynpRg($b+YBV<L+EW!+DlF#&d$s;f6#zT|8vSGvFX!=s0)GZldU?;*T;
zZpUdfc%tL%mANrT%3`lHKA4tT(JfhTN&iv5ONpM_(69uK7`A=frHi%6vI7QOfw+ag
zA_eDM^gdU6Ncy_Q6_oiaSFY=3-R;DR#M1H5y^q|L=-)aYA0Lywdh__j=SCG>bqBMi
zSM1N+<JY)Kc3Huvo1(S&;=It1kdV;OWnDY(VkhNfTvR^P&ROzpd+8}!NOLqfpPvjK
zYJG}13Kx!ODhyIq-gzlilgchcWz?hy4my%F=gy`+y+#h$GZy;*MBorRm)1Tt&o57F
zh(3FEuQw>8D484}ApbF9>dNBy=n);>@&BRXwamie39R}gP0fJJT|Pei7&>|P=NTRA
zXFYNi&RNMk`OAaE14H53gL{E`m=_mT7~4<W@q4`yQD)!1P2o9D9&))N@nzik^VOU+
zFmFMm(H}mz@|dA+R97T|BDX-G!0Vg)h<EI3R`-ETK)bQ76xU6$W22l(m_6h{XAHgN
z<>hs5lQg3?N5`it^{Jr&!okeQNDl2~|2H<odyB&5w(sqprffYBXhXn_ACcOKj9F-T
zr-EPK{vq|=?k==MasROG0SPHO@i<U<N4xGV3hQk$$-PN)%$P$r3FKO9%Rg}FbF{#A
zojG}u8~i%};M3jQCSS9KDYu)N|9+~T^sG<s-uF*+naysk57v9?eCEL`7sV2TaWr%<
z#V7vx@dMww7@EY7E_gq9UCc<;#s_Dv%!yCzHDJJi7K#+~bvZHd?6;{K3LZS5z4NrZ
z+8`yR4XherGMb>IM=~{BL*roJ-q5d?s6uf6G(;K)0rkO8sxFGFBZvi!vY8!I`Zz7u
z^IP3vY3@vV22sYq!q8BAp<@pnnCSlf`epbVQCoumW9MBaXi}j2>NHDgJTafL1QMix
zeV`u$i;BrDwzv{We0tO2Uw9rT)ZiwJ=FZhaXrlEX_3NRKlP7hCF6Uz??Nq#eJ^ku_
zXC5ZYf~-7agABj&dHlM~DNqNH4la`ypHH2er1ta=Om{UWO|o@?%+k3HxgBNc7<82E
zjZPt7I`b1Bm-?*mYTz5GeL|IQH>q2}=LffM>#kh<SJ$pxPe-Xkx;R{2T0bEL)OT|G
zdb0+H@_a9E!q#oqsSZP?n{Wy)e|}lhX@4Dg3tOCAlVgJ&S-3XOVeNZ&&8Xq8mYY2>
zwVT}F3R;f>AsbMGd^165`nz>kx;rZ^y>_h4FKyd=cr^Te!h?p5!SG(A0td(N<qL~z
zowB0-_I~x=ypVT>f1V+Qo=XThua+ws5wu9bHT+;w+zPi)9PElJkH!6cmYzBh-*mH1
z2nk!@&^@H2kCLI2(xW%h^kw~>hCh`LF_zV7Zz*ZREiPTUlv3FRGRcD_ZK0d4P4alU
zHrQ36i02;Ys6-OJtR!Mr9=B(0=@sTG$ysNU-aKlDmNGE0I9kZrf4oiv-ERnwCw10D
z3`oX$AuRva4e@WI&F#NBKS;1&e0l^T#D&O7K|COOcCnxq`wzBfZ3&4t5;6|QTWX^6
zwOO;@mr`?WzaYPUiYx8|7*<-XUOjA+WY4X>s#cOw3rWXstp*Iz%g+l`ywo0}tYu66
zVk7w5eg_)f749mZ*Be;<G;80tDX(k3800LHN$h^P)0c*F%J0;ss9fzmeAp2X*=xT#
ztt>+RS68>nRmR~{0b3=p!-WnJ(a{gTp6EJ#cWwj-MBP6N6cAniaV@u{cH}hULi?Cp
zGd|wnI|aE)jbGaSO@R_BBP>j@;r4{6%svAtlz+SI6_w~d<bCqUi{~6Cttd>RP@E-G
z_TcM#^GwJAwz`x8XCkL@_shflNQx;(Ae-~LtLjv{Qtsg4!-9^RU`Wr>M#W4R(p9NV
zvnju##+&s5D7s;{OZCf+J+QHha@f)Clkfy5HKB;XV_jx%zqq33?Wzluh|1PR<W9~!
zYc}e3PR{bB4s)JF1)TgI1&>b64-N3Ro0!5JNSew(hrd%-v9@xOYuV-|-|Ewfi_K}&
z;5Dpy*w2T}e{VFI?tBqF^c~-!Hq@L%uU?F#nyII!RwrvBhE{MqXvEg87j$=8x5chA
zrItiJfVqGPTluFRc-zk;YSrEA*Z=Wu*RI|8>DxU$?>DY{e`Ky-tQAabzXL32V&gGs
zhO6Y}wRIq)GsvmUlJ!Y?L4IswZ(np?vB$1=x4zIzR%v>inw5d~x+zoI%m}@PUu9)f
zdj}g+hxOAH#S!s<d2pOC+*M8n6dDchi-fepX@c~(1)s=c*LOpVtk&aU*vo`#J3sZg
z@!}KYqxK8veWHQiHJ8a+1Vrh4q(OduH{vHQMr*ih$YWx}tIGM`Ys=?-{T}yGeQJH5
zGB%CQt#w)}b@F!1m8rja<$cXYR~wTVI?j7H?y;G@vS0W;?rGt=>m0J<#*Y{7ysIAG
zy>rL6QMvFK-B2}uY<_dM|J?NNjg5h$Uj@45#;3*VBV^f3={I7ZfjWuI2RMP4JyM&)
zPoKWTqyV}ip#J)4ZrS@Zt+&T4v?y2I7vC?T6sb0{l*)|N;(ziHJ}FuEl<DE~;?xxU
z<lvutibZOOqEgQ6vX8d8xf5$eWA@CMou#D8#!=?!IcbK_&LEV2($eXJi=3skwNgX)
z8u9!~WpTbg(v1x<rr_`nw~DN1!R}2VfBXBJ6sA6TngyXYyIsgEn=3<X_~Fl)-@6nh
zz_=Lr=ik`X3l>ZFsfybplCQv<0OCa_i#N6Z<rm}Ro367|V;stlo!tKA>(>ni-J!vw
zXL5(f_k7uZvdg%6xsWoW=SHWJ&la>7^0J|_HMVwk>NUH}dw!=%T3CPN`1p-V1+P9K
zy*jyl>y|C+<|rPTv1dJ}8AM)>9-;yH{&JW8hy#Vz55|-44YJrAxv{I1RDkAI66#OT
zI$jQLoVja+Ht{1x$+?ev_3nLpSR)OL!!HgTr=?YT_wHJ1rhrwBplLA$J^x%kiMl#C
z3n6a!x#Z-Dw**+o_en<xxV}qt-4|iera?mcJaJyzzsu0|c}jBw$$HEtuCY9Obb)&6
z?4e225)x*!iH1hy*`n@r&5%-nWBlEGk;R+^g}>LtC29|(UvkBzaD;?znXH58O$Rtt
z^U8QoI>8Z;S%nV{&830^T7(^^0f_n^zW(t^-8}hh_4YOtt?2uSn{b+<6h&B#2L%Po
z9M7D|c>2_pUVo0RepmefKWLZleMYOGa|`{7>YjAm$?Vo?X@4h|fsWb80nFm+KVj4D
zv^0<L9oy|Rs!O@GZvFZtcb(w_-dl=X+dTi*Uw%1j=4%CowP2Rq9b{v3@5cgH`OUmU
z>h1pZ9NmY?{p{`SbJt5@t@rg~I%WCjA4+}g_f4Q?$`WLxL|3=qNiF%+qeqRGR7MYa
zhcg5h6B|3?!Za*{;2Jf4>(T`(GbF-R%k?WYtLakZKp6^a(Z7{_P7IK~?lQ!*?!{6a
zT^<sl&hvE&Wz*tyX7|I3SfN#+-}*$^)1X6F_KX*#5-=WcvG~28GZ41WLhTWd`-ZAh
z{5!dLN^!+Ru!KuvWbCNa<%G=@dR)kpLNzq^FDtKS*KS`v!J`w>sQ8U<W}7e2?W`O<
z;>HMRDdaU%zRe(ONHH27w|jRE&ESFCOxKM1f<!=|zJ=w5sC7?Ydq!yTGVS?m`}QRE
z-ruGSz`Bj+ZTtOw(I^z?QOh{8r~0omk-NmbhEM}6BQaNN?_M_ur4+Y=M3AGEb<kIB
z>C_lulPm@UQg$WyA%_EGNBL2B`9cH!N-Wn>kV%EaKZKuvh0u8YX$w3-&##}wpfch)
zIWPYLXR*R*k^bJqpt+vX_ybd-$Q!4wzJdCxPQ^fOO&yh)?mEcS?5(YDsx9GI1kV~=
z6$-k}jUUm-QSqzbr10EJ{K8Quw%E4fBt*ACHy!bv!b(8te%{_ovJS7>i3S^%h4|xt
z>F~jWkBW*Q#|q?;>jyM1>pL)d0!Q4RJx0B<@Ra_VO&bH0e*UZgn`wMt;i_Lb2S|!c
z4opBQ=fP!m{G~0A0*cH*DP9!@31+do4p0^7bLi;Ng|=zpFM9OosKCXQo?WsnVk;dK
zq{{fWUZGeGIW%{3zHqbP7M7O^<iJ&1+G;amhr45oMalB|4kPYK@FHYz6lS*mJQCrW
z)_<bu+r^67Ca5|n<O(CW%h|VX?Qr{5UyAbVXEO65XCy$A>4=ph!^K+i)VssC&}!y<
z>$jGT)3I~s9(;U@H?-$oB)F#L+jmRnUvYJQedJhLS{kN?Qm)SH*pq17rF8&(V-SrW
zIVJEjdFyn(b*<JJx>6_ziu$%vu&=1&=t>s^Z9i+bsG|Z0V{KpMuhV3g!Ji<O4E@An
z_q=rWPEO7-4cqR)qM>=i=FPIjQDX)U)Ha?o0v7!B(IS2M1)~D&zp9Lm3z46KdI|bp
z=WSP-56WgVj503mu0y0OvV6eJ_~VfI{H%<O<)l*@ze!1b7V9k<Y`dS#KS;~H<mS!o
zxo@Do5-V@z-@Auhz+_*vLF8s{D=V@3G-MGYpuv=?Lx&FZ{rKHLPTdI=h>jHMSMQLJ
zCGk7Bt@5cJ?}?=dd#XNtg03M4$i92GzM%nmz~teY{Xy$EUPs-nLcW%_<1%1}Ey9_Z
zlbJbW`0z&Pbb=l(@k=Qw<M(R!F_B1r;mq0SXyF{hsH_Dv#mt}IyMO;i##Q1Ye+e3p
zTFdi*sc7>#1`Nt`IW|6g_yDJDf`Zn_NJy~JWC8TCH#0d(bdX67_{-R4@j2aDv+y8X
zZ*DH9a0-nrWizK^J%^iTs4WECCi{FPTh-aoh=pR#NR0^-oRBJzwt;7Pn4&hAmj^CI
zXtI{WSYfKZz8$`r24R~O4ZaLi7=%Oa_B-P$j?NF7d!P6nn6-?aQz-vQTdMFENIi3A
zckUbF<0h~xh5ELC3tItj$eH?=^D1fzsi9H&`Adqb7KGOeViJ+=2nr(9z(GN7=u_#n
zvPgFDm0pTyr&06wT~Iwt`#5^@+_`hq@mvV?$SUyRKshFqOWZ6DFz@o;=KsZHnN0j3
z)Rt}EvEvrFi-?50j-F;Qqpwe&%-z2i8pj8nj|xSct!g$B`Jt$9!|yXi#&iX`QL~sN
z(S05jrQ(aQh5!Zyo}HD2X#3-nB<g(yq?4E(Z;)?*+Q)q5R4-o|(5cR>4_=hmSF?u>
zSdxS5amZgCbZ)a|Sn$q#BRX*D1R(NI^?eOf;3<uE2gX*^)N0P=_Jy+O_vR5C2NeaM
zo7^;nX4IQT(uS+2mxPB9K`#jQM=I~(LvGrij@8|3g~$wHSojyWT_^_S<cQwXD~qzT
zE6|ZGd9b-{gaQW}N;nSh&E!2O<Jj|*;3xu$>Jw}A?E(Nx1(cM@;y>8AcP!S3=qiVl
z*V&o20c3futS(4UthKm^X|wFEp$j3=qsd6RXHOB<7A=}Ra?58dM*{sW5lbSS{{BT_
zIV~hY(o~MmU};)f8DAKBm_2YOE33M$F8<P`CU)pAZKsg4H#Iga9yUqTL-0k}bL+(i
zp~||~vsbSfTACujd|peU(^XDm=S_G{Is*|R6Jm~n2rU<FASAv2L>%VZoE)0SP=PM}
z#@)Mnx01+DYRpn*#gM8pe|C=05D7=!ey#^8B*EHV<R3Vq$$H+<GrD7k{iCzjND)kb
zLqogE{1^Z7@Ct|=NKV)kD%bW;62&$%*(fT`!QL{ru2(>0u^b0^4zozyyP!73f#4o!
zdeCH6@Z{qoZaRUbPd~Ia;i~(snvY@G!4ak-{`_+zDp2bfyATA=_BJ+y?cy$78WSVG
z6m^xbSPHzfYc)uU=MN1~`)uja37b{c9LFi7?pb<=xidC7I3T^!sCj{~jdF)+eCCKk
z$SYKUr{xDP<5CG0+}|)+T`G8d@JYYh2#L?~D4;|`oVRM0fLKwz4~x>S0tB&rdLH=z
zKttL3qO5EkcSk=N#Co5`)%rt}W~hXitXZR5{`M^?1WJkHP~-Wr`g<0wTX&Wk^gZiX
zPigQA(hSt~ChrbfuU&h0Z5oCBWB{p}dw;$Mw2#hUs!ZRZJH0BS1dj(}Y?AQp^XJvT
z9Hmibku7}njC;u;%+)XLw2n=3cW$sFG7qAkx6>JApgEPK)BEF9K;*AKPSevXhoj)2
z>@ned<(|T^zds!1gUcJwyxWX5pZEaIZ&3TH{g20@4hNo6a$8sZQm=S#oC>?HZ{MS2
z2WC;#=*JrB>wAtKzOj3gY1_ZkGBeAGMJA5ODT<4VU=GO`Pa6ICn5cPg=u|K3&4`u}
zNkc7}f49^F;9=o-O=I$zJ!jsPx356Ob@9Qa?gRFaFWO^Nv-u%ME^LVHW?M!2=DF8E
z$1_LLp>G0j*?_X30Hys;DRVbY##V-rt@1>t4lgaBe}EfG%CjM-3i-c-%@Z&ek6_*I
zhK2^m4I8>&R_?av7R90mB$-zuE25BJLqx}?ixqL8vu@OAum|&<=)nV*T+UUR0?U|r
z=MKA0=wm1KKgmu9l#yl6-&P*J57BshPj~VRDlv;tbKg^H^xR9`WpU!VDM)?ZmVi@P
zZ&$W_(s{dxMS!FntY9)>7Ib_QiaCw?y1LB{4yf%FZe7)ZWn*6*!;vhajVD6)V5CIQ
zFy3;ioTOKqn-*GH9$(h|^OR>Uf=ZQW?WIy~V<Y%;Etk)Goo{HeyFO+Sv{pvv@#c&I
z*3K{2Zbt*+07^jj{LFce<a?&-E|Z0@nF!z0WN98J3QD<7mZ8HYOep5l($oK1IYg?E
zt{E6c5T2!RuosLAj`n$#DgMxsh;Mg}nYt~w_gyo3;~(T+&^{X<KRU*ms*&-XnMHQ=
zi!DINCuIHW)>W}0ac-od5f&1nw&A5N(1GqSS|`@`UnQuITYe~~J9X>U{Q1)|8vThE
zD96F8WWC%AgSdU&vwlj`o;{;H!h>QCb>+v8@-1ylMA7IIC&1_(I6Kj)-5ayxq(P8o
z64?v!(P!t*6ES^I<FjN41UJr98}=aLv9&1ukO%DExs!U<i%(lXnm|UHqb_=T>vjFM
z?YF*TK*Fo|kuDuOdc)q;e4)mQXXX36&|5I`fG@fXjXn(Gx0->RLaAk8p}GF~)DW-r
zrGv>#S%+q3jJQ}$6}Yl<Ic*XvaiIP9v6%yb#X{2;krT+kbSW_ICCE*HF%QCetX+&9
zSQ$PVjz@U!3ACI4c>Ca38<`a=SB}G~4RrBqhYpZS6HpyM+BXH(Ry@ol{w6;-yWc!G
z4k^Lv)vNi)Eu5z4ZpjdHat!{~K7q<TCMG64ob8jieb^^TU~s-%Y$}3cVh9CBz7_rO
zeObEzw9{jsC1AUg2wX<MKs^d(7eqh~MtM&(oT5=PbM8<vBzl6FI7J9dO-Uj2t(+3$
z<D<{X%@SjJtbNE>0C@u67)lcT2&6Fxkz8zoW2GjH4zf?Zv%V)moah0`YFe!Tnn>vK
z^NlF+Q)%LRit?PV+cY|_Ytav~PB?#F=LY9mI?a?)8#9J9IoZAWN}OG}McPj-K%6}f
z8%~4Z4v{j7JID9*j>>I!F8b0_b?rM?qGRWzMbGkQI*GPz+eW>fE2CQs{fsqun5@As
zK^_Fqxm&lZB54?EMh{(i+qSG1gd*x{YJpnrZotE&Z{uko;dQU+4v!7A{P}C$Dli$>
zdHM1L*A)quF2&Z@7_$0V5A?B$J-fAf5cgh7Yq6eQBpeRM4y{y6Bg<Nwup>g300CKt
zWIQJ)Zx<bgpWTG5WNSW0$2^6(VZ(<r*Fa2d6r<+ReRfLqW-1`?3X$U;WNy@Fw78&2
zlPp<Yvu4GxFQ5<zWj*S)+M{=%&0sSuB4F&ElQ)2$GA=8CYDf|!08|Vm7He9}#%~Zf
z2#Gq$6p2+M{~`Y(;xno?JuAzOg2sFuhVhmSexRLdAF_lag!_SbpRNU>_k*)t2Xp=R
zgM&{utZAn`QV+L^veqERUmKR*o7r9BCNqwqe;Vec_rCsq#T}w#)1<E?eJ5*w7<co7
z|Gu=}8@hg*M};T+8fTW`kroT1fB(7VPieV&+m{7n{=4l}o25&@i$I2Q!HkwQv-Wf+
z5JRO$9eXS~;7_Pgl_DG^ow`5>z1jIyCrMTMHSf-N89jUFIusIW8x1l)Jx1nHJrO<t
zhd2G9B?0g2=(@R0&MKCaP2}%pNC`WUO@FjpLftFk1DJ$L3|aF&VLNqCS1mXiH^>&#
zptS%kjkLm5#L=#1b;D~+{%Evrq3W;5HoEtfH6NYFa8(^$`VJ@0Y>&Z;gTt6F?lvtm
zI6Q*)@7gt!86V&(Fv=v7O2CQkgg+54Zwkm=#L5@8HIlKfHN3j{wrTYQd3~hI<lxeQ
zKWuW4XqL;hO}rnkgyZv+ZB$!Yj9xHk+r20x>sWltS8$sQ2-xH+JTBdv8y)Fnsr^HP
zoAhhCOZ`6&2V$<G7CyvfWf#f4N9#;VVWos$!TpH2gtE0~J;htN$?54e%R4&`=w*`n
z+5P*dQSWb`Jn>Ikl_APXb}xFC{T4gwRAk+(S;HS@X^a{^I$>d??SdgkvI_OH&ubj+
zbGRbtpVJyAl~vY;C?C-|;W02L?c<(}BOl72>?J*}U5!)IX6w6ej%}UTt^ec!B{kz8
zvVA?JNyawVM7AZ4g!!@uvKT!WR0dGbw{d<JE|!yFBd}ATIC<CFx$FQ>X>60_Dz>zd
zs03m@dvQJONm~y{(hkVF8LZFiEg9xp*rOg50gV`u`6qb;<56DCMFi1vDSA<!_+8k(
z012`~4vg(0(VYEkxMOE6ar->%B9R}6IcG$DfFe*@KIw%-GR%*a0{&-dSXdl;vOrR%
zcWT#7m_TCQ;fX9eqe-?c^By#PuaCB{Ej^Tx{$ZiGpdKv~7d)l`zuXz`gSYA+M`?+N
zq7!DDUeX*V;Qb9YZ9JYorR^U5<+>YOe0T9y9zGl1KT=ch)CrN2lG;0QrYx>G8_C!e
zGN|Q*C0}mm(Wm%=%^qo;5W|Q<yCn93cp2Mp0{M>tl@7J<F4@wr+~?euw|{n)SdDLS
zaW~#cW_nD^eUVfi(n%y7NiU4sz%R1ud+9*CZF^<kCLkOvM<=6>RETLbwAQQEafA}X
z<8|c)Gm0PKjgq1#DO+FblzK6b>Jwj6q9WgN$(`1Ju3BQ-<{>aA>4I?|uZKqX$SZLn
z%7<o$ADH|&X|E8;^EmTp<cA{jlonO-?Cb**f0M}gA3d53Eu=6NuuGZcB_A8Hy2TY<
z#q;=aOTxFOw6JxUIMY9*(9T4~UwSD&sdPZEa-78QK2&v>FD|81N(S)(9z}@Zaf)?v
zaY=bHMItc?!m8rp^1m38M?NIpdYW*8fvVBjNz5`|uppC>=Y~Z;ZW3+3$k$hJejpNI
zWvah>7{?g$kqQ~;W5PamYUlA~9K}|mwwJUp*azD`SueiWsCe)Z8$1E>Cc2RH#h8op
zh+4z`%D)NY`;tNLdsM!!lmobM6D8+Q2unP}xd-*b%wrBsoF-dyv#-5wUlRL$V>?P@
zK4DO)*Vq2am(${hC6bNxq@JA>*fX_GuFxm2SY&Dnj>_~s2$`a-*Dgpaj)3WWY}H~2
zMp6CJ(ZEF%SiRv^8_8{t7Qg%)UFw1^uC89v1bbxgXSw{cQf%z5G&ec7JOQR`%8HdQ
zk-Qc&Rqz`QLr_y&1q?^}erRlW$%%JH$};)ALST<DuU2&IC;1!)<wIMF)B^%!=hi7N
z)>Ffbn4&YUI0%%SvP5#?9>Trd(?g|~A|OMyw3kQEq{=HaE}^U6@}>F}zM$|1*0fuY
z&+eNjBRSEjFKCzzD7_S5z~LsAi<CkJw}115<I*STEa2cf$X{v?=v3}3ObtB(RRax>
zIF4hrOD`q6BBkFu@ps8gN3<xYntI8|V2S{L4)rs)aw@-}UAQ+m*j_ylmhBaD0V0Y`
zV=cz7eKJmAs;=&B&g#>~=d*fC#=m;=hCPV*<fG0`j5I((nT)X<*v&eO_fQ?F;%^5=
z&WC8adi>BKCHn!Ao(P0#cvQ<DYlenuTAhey%HzX~^!QU%?IQQa&01Po3RCH(70bh~
zU0VLMsZ(_eACt`hpl-7&2lg#a5N|#aF439!L!Q#0To+6%#ZRAfWk4r--CjEQHVMBy
z9(>EI=dI#mCl+ugFC8g0@_&4Pl6tf`YXNSh@ngHRPNXs8g6T!o7hk{VV5+N_6680Y
zU-sDHib*Ibmy8a~r8SucE5|B?E>PxQw^i`;^}T~qCox8$<%2wiF@Z&$lBz-m{Jk*4
ze)7aZeAHCZC#*7=yeXrDM{{3L&4$5kCATAoT^*N`n~UvjAu%{?qP;*$ukIEUh<?-j
zdVIEJ<>g0;TlbdqvAMy$*+xCkQ<_E<TMqmu-r@@1;lwnj5)d&;*foQ?Iw`mz$|9fO
zjuBlMV2t|3OPab3C4j?XX;`nYEp=l)Cx#sp&{TtevnBz6Bm?`XEzJOkjqs#^D~1Ar
zDPPY1CG8)$E!6I1WZx|@f}QbATt8OxS2=kXx6F*jvc$3yh;o6R$Mg7Tkh&{mAkt<i
z(?oF(hOzU!ckYzdp^ciInwOcWCvJD3f0%3E0Ru)nU9%A&b`=fh)*0fRo7NC@?BdO(
zIM2KYLLlbb$E7@`0e1Roti0C}Z(xT$GyLOJb9+HMM;JoNP-*ze6Jg|BAP^KHv}H-x
zoHUIlrBYe5r{DPfm)m;ihZd9zz4#jH-WO32m5_aIG(5Ceo(i!rjF6gZXvhQpho^YR
zQHA%`mQtVw0(k^1RP@~G?cGP!N}E{?PeLTd8<h@-4oAYbjL!Wt3+9CvfQ&Nxi|~F{
zii#MnK{7g&jAEHqgjEuJ!G;}eB>{)oFtbR#q?V`$(w*Y;_MQT_DWVBq@dS9hqLmt*
z6tJYXEWhh3ksMtADX0}v8%XU74u)f`6^Gj@uFXS*Q6yBGFKh^pXp+-dc@~&FVe>mF
z1+?7-WF$njtp1&}<2h5rAR12T&I)u8z?>DMJxXdBlX7S&G%yW}U_Ii^Y3V<hKara|
zr_zweS;K57Vezc9Q%I(mLQY!EgNquKx~P;Ki7Zhe17Bpwl0lBR-X<B!V9oL2Hms+Z
zR7ifIBju&@i7+tJ)q-0xlX(rJIWVYSFp*bNRn@R^T%njbPOsH^oE8<P@+)*GE=X8w
z$;Cyig;YWfeU)G?r2wr$fAd3@!|m4lI~BJKWFAyMpsf5sA8Gw)>JyzA;RPKP2w?2-
zMy4T%J21NTsbeWE$@=DXV>C5g$RkLkTOP%(^9lA|(x73??!7K5?Ufc~BmSLyacKBz
zF53DXOeV($2XB-#S(KpMXkpl}BdQ4>uRLxsIZ<Z?jz*DCcWB?9$FE(t9wq<Z?K)uh
z)med<&OCwp+~C2x8D&5xI}}vx84uo^*XNO;dE;nb<anFzB>n(x7hBj)dF1raPZ<6}
zV}%%>k)t7yaXr~Px=6~FL_w7w{9?tOB@0}*U_m3(xOH{{7#XOU$h|;}_^Ky+IxPpy
z#m4HFndlvKcCynk*mwj@Qfb)pT0ub#BcAS+ZxRgf?c1M;<m}NR8Zx|e6dW}qCM5)&
zc=Hc1VxH2RbUb`Vdb@*MZX>ZF<1~vg-%Ot{<rFq2@#|Je$rYn&v3Vtu`4hs7A`9(M
zK%u!G;i=lY3&-y}tVpO4KFO09Z^gC4Jm%86@z<ez;J)?4j4~NeXtg%Tjvzx)&?p8D
zG&i{_0C=8KYk*M6nS;xz;T;$P5b!!u^!&fv-J4+`K_YWXj1P(4R-!C?;GWvEJS|9L
zsPF32Z4EaAZ&z{1va}8iU>2Mm50`k@T$2V1AQIkZHpVLcSFc_*k1>rdBs!xfGga}I
z?Jn2yWhBk#Fgp^XlE#iTlX~{<-B%_~`wf_M#H6p};4CEQ@K9oU#Qpom3Z5}BAH+;}
z=#(UkA9Ln@xyagLZ;25MERL`pWWQoI6^3g`#}J5WFPa{@9=*Bv-|gFbgF3<|VcHA{
z^0KRS;O^-!010Aq&02xn4RkSj$@O0j9s9*lg)>DAwq*}eJsB}cxZtpCDADZi*M!IR
zcNPW!0iJ)Tg9qsr`uyVN8Ju9*!*O91uK}Ryb8utO<$B#%!%YmMWF*!FamQZ4<T;@c
zr=xf80E{M9lP?f)_$Ns~%!XB^ofMGuz>i%aDt-U%BCt8l6o2WNcH#M}E~KO@3iC`%
ze6}JPR7gvh;;>-`C036JsXR?2k6}9qMZqj%4xF`X)(l@YLSmxr=GMds#<vus7Rm#;
zuM{m`GOtA?y$AwF=r~WF?DA{6m^*<^Y3UAT`RK2D4x_{fp3|QF7mM$u2wi;ZvZ}=D
z95w!rw69T7Gj)nER$&ckI#yc9b(ZKqhYx|t{mQoKJai6fA4=@Gs|uqOS@#}aRC4QM
zUQ)IbA49ziFB{{RBaZRbCc5V4M`njVCjVIS(KN(xrN$B7fBeLW*+;wXN6Uj;9nY%(
z1Eumn_6~w6JDQnAVl=j|q-GN&6Y$A_hE}iC$JMDmN06}f>NR-u`mVpGvubzsx5m%!
z%^Uur&~CG~wq)#Izwnts`RqNxZBc<@xpwP6!8p=5OF*q{?hK0t(G9hTzXp1VF7)d=
zb_6ma`L2=yCW)Q)EQ%W|=bL|kmCnhC!LvVCk@nr+{hO&cbT&<}M3F2`$_-jz9qnn!
zRC=&sW5WiK-+f-riV<V7rKJZhQ<WJ?{}5Fd=3NarRz#A(1DY0^R|~fWFI9cBoz-t}
zV3+JmV;@#P+<mJmzDSjXFd3cLcL$=?8V-ZKM-ri*iP$%O+qizcElqp(GpG|<j~0yZ
zi7p(-$##V*w%;&kKd!zai$jG?nG%U*@JN6oa2WhD2iDQ$Jc|y~Ksn#j>~c~zb@B0{
zUmC1gUiX!CN{SR;^@SuECaBSOY)RQROpm+E=3g0pbocJv5LW*0;Hc%PUK;i9PGNw#
zf7PFW;L2+<U-MfWjw*!;q%#P1hJ4vl61{)Vn^cwm<qx0rx5P1Bs3dN&mhHkwW4^x|
z+d%f=9i60cu!E3&+~sFx2NX%`>6eFutwo?s>4ew1b$f>n^2owM;Q$+$7Yz_B2Zm!M
z`Xo(_G^W#N*6|7Pu$=yfvX-kKr<`r2N<Y^O%$P`9FMAb*lD32?#hS+m-DG_H<}fd@
zUZO^%F4D5O+i%;ofs-z_wjz_Ri2Jx9iAWD5qkh3d!?7+QJ|1h5tyWeih<!(o9^I4|
zklejZ;le3X{@!$B90VVskdp+<`)4cUJf+c6@oPsZlXA@#<J(9~{QAV(&pAF}G_l91
ze>GT4n4%f)sAUBZj1}ceSx-dg!|xPv?h)9`sQ-EHKDYR=i{?j@%v&{!{Qs9fxV%a+
z!v_qe@|_^5n;PL}^*0Y&zKM?)Q_87Bq;7cS1Nji}Cxj$5-Q5Ewnb$9j=O8-9NO-&F
z!VY!4)`?a3BLoc<>HV16?XO+sj5o{{Yt62RaEB-zR;YpMTdxsboh1?7DdQ1h!5HWz
zvnq~F51kucfaIg{al*%EN1wLw$hdh^iMAIq7&+hVkCh}6{cQb8-cIs*CD0WN|NL8}
z$!t;+1bB2&zvqkUB?Rp8^&M_f-cP%39`S~Z+kq-3@PfsqejwL@iVylaUXZwprS=^=
zHcUi=ZP%>m^4YhYmb~da@EJ2^c7uH&DCp|$yf`kF65MKc@xf`s@Vw<k-Sd{fYr`ZS
z`F+S?5jCA!L%oW_fFmDE37Ve9O`Q0cKhQExt)!?ZDKSyEorR?(1U2>U<HwHiz3GkS
z&-@J?#MIJ2i7{u+Ah^LSrI~HRqY(Tl;Tr*k@`lc%B|UHOh-iPLU<V>C&kOCa>uFm_
zR?hC?1Zq)S$(G39hI~jpd&B*~xuIXSAj8SOG8G}MzVots`6W#O4N)(*#OeF}kN?DO
zC>c6-Y(oBkwioh6&UNRA=qHv!WETSkMK^<PgY0ES9X=_S7-M)cxcs!Rp@3+P>z;4~
zyjOybm?u5RlS~0W+M%nT^Dr*0d&E!FIi)U&>(!hz-QrOOf;`m&ONDTBU^2S#B)CWY
z;hLH$XI+nS8+b9(?BJVC>(`&7wE?IOaO930J1*LQTtGdb5W2i;o2?dDoN%J!e|_T~
z!FXeX`QU*mz}e%SHc7-lN2<oW3{%*~*hc8idP3{rt;XU^9L9-LMm;dM*%`O5<%c|?
zUXdI?v&eq!F6aB2AwBCI9pmnq!SZ@|wXh>1H@8v`WTM*QM;X2(pSigs9Zto?#of;^
zi7w=9=RzW1Mzp+}B&?7FgAO&HaTk7I5|Be>e?o*ub?a1matDmJYT);bdNfdn65c`Q
z(t)a?iD&eBw$LNA-1<MJ85(vc+FD{cofP~aH}@kTM`%Nmg8T4shjzDcDR{3>K}UK&
z!`H`0ARt^R&ZQ%d4^vu;^$VjnXysC5dYwd)a}NT3w45(o6r@zzNd%Z;B-|_KyJm}B
zHxuhcFfJ_+V6t@#uOwpa?&-^PbpE-YF}imbPST<ESDRJ*DX=ZJ6X*ZfRSygzjZNKz
zNxAkS0A$zBoohaQ+DiJ%02rH9tA>)DoHbNBkeQzTC$5ARcPSTKMBd6?Ig~9#dLDnY
zP+kIJK23EVtE4oYFhbQGE!v|c$THwiIKhx5Mu4wdzs2%A5*I`yw#l4Gf*@5}`b$Mw
zTaRJ%RbK&bg=_6Gk7)v9FhQ}pHe7rgpVl#|5=k~S8QDnhRjR!a+cDvFSO3@L<wIJI
zespyUBwhI7!a@qLV#v9e4RCdI^umNn$~gV{^?Ql!`XMoSmZk1=WR$Xu59rhxt6i!v
zulz;oxkaXhgoUp)Bh6X8`po@|Nq9W)S?AKpi_k;2o*ab#S2x8IQL$LkK@90eSb7MO
zV17hm;<$M8H5zi+4qI4RSD9Y~J$T5Tlv7eR_s2s?yQ(;N@XVG)&AMiTv>>vm=1{ml
zbO`<}!;vEf(hkn{vw5~q5@7%|gv^?7e0JQ!zFoGf2Zs~P(MP+ITV<&UJD{p@Ki*th
z?dKC0%L(9i?xA!mOb0h~>}U(sXcT$o`$c|7#B|sdT=Eh?XIv-SH0ZT4-yG3a!1#@)
z^}|%+a2JOb&$}YvhD6dVhFdc)`IJ(n(Adxq@m`f^3?bfnT98Axo)%DYcf|n<A)C7B
zDqjqox5IIWe->E~UTUAB<F2S|J#g*TEgM2VnW(I^Ahx!&j*{iV?gL!8*VnA5YH5K|
z4BxBL+Y{-HBi$3qmBi?uJ1l1k9POgGhvl1Q`1Ko-Z$x$fElO0==&s$m(RD`mp<SUc
zH&PtGhBJ}W){^kpsiUyb&>ZmNaaS4RG}ZF8_{4Fzkny<BoT1=#N&p2ka)!z>{tV|8
zFXJQhwy=DU&rU$ZMMV3<8SykS;jp}wq~l9gt@>6a_(xY}!_JwUL?Q;Dp)@=HZit9U
z`$JlXm`JkbvFVM|eKBbU2+&!<TE@4CFW2%dE#R42zoKR;5F8R=VQ5}ep}Iu*;E^Mj
z-J9L`eCqY=S=pk#($Xgi?MBPZqWu11vL-@QutJ09;guw&jP{Y~-FyDpmJc^N`QyV?
zd@`3$pc$_<=+M?o&UfxlwEzE&j1*^xhn{5xr-Zn`o;FBMe{vh$4!t}Sv8D8x9bQmT
z$Hi&L`F8tAYSX!6$GnvqVz3~#(ZS(R=vDRgSD>}dIg7zhvO`TdQ4h{p%e$U1_z^ce
z^!M-ExBlJzA(7tBWLAO@ns|nT1Jq~Sl2y{UQd?CO@ls?G+Iq-2H7LWJ?I)VsfhYCv
z3TKuWOAG@IlnMYPbxw^G*FjNc%j1%hok0!kMyP5Ynf~V2#2vEcsM`nNCOMk>QAM5S
zCC-|xc0U%vz&$TtE^mo1U4H!w+3k-&9NU5)TwCMU02|(xxV47@-+-vXcL4#tP1D*N
z3WrG)T#Mr#3fV1=Vk+k!K742vnzu5(7@5%g1q=K?C{pt<jduMUSXNd>ktl>icSRSm
z5)Te-;b{4WZe*zN?q0K=KzsC@NW-hZ3TM4}#@ZKHK$7#1fnm(#wo>g4axQ5tFlkTI
z!wsW#BSSbKJV;MARxyD-xM;ox-2jaX!A<czqNh)v3Z<N<p^880{875a0+Un3olR<;
zN6aB}mpq<`cS>n3V{vGJIhRhQh5G-{(d#LzFdIu{yr}ICq?rB)9|UU3FCn~NVe6$e
zW{hcg0m%e&!eoZ@hSwXVp<x`F$8?wE%a;#*oY_$E&>l#_x@`pZ;(NT{%3x9a4r-}b
z@dv91JV)vuosT9G?}&Og{Am60Kayw{f0+Y>K>cGIdc0GBE1fXGJiLHemuln3C*3ZY
z?mK#DIZ(BAMt~gJH(QM(;26^<%~#m>sT?;Xg-%<x7~h-8XGvDHRv6gQLYj@4#=#?r
z+%Yjoz^DJ~w{IWOpg~w;)vz8-T0k&~f*9WlJv1-wAsR>8!fKvb>W7`@E6Mpzk1k|A
z=t}|gm*F*MsI2m=r6`#HbK6CoZCPFj7+0wFreMp*v>ac5aYX;~4@Xq%t%W-yb0nr!
zY`RQ`RnMenyHitL$q?fO)q+&v;7|o|v)2CHLw46!YA6jFBr|5cFur-exf@yz9!G1q
z<SB$1E%;(97LR1_J~qBnZN#EDG4h6Sl0NTafDmABHVVp8aLfulQCtrg^<zbzZ~{24
zH89xCSxBJb)UkZ8iU<jM1z?8t3nm`P`!{k-r>Q@^;yMxCBJiSepk!D!KP!yMiBzCA
zR&CG!j#OuLLiQ?(uVJXzI#pgG>G=$T!KlYWD^*Y;<S)y=pkSWeb8afT8bof|@(||l
zg#Ma7b!r#bbxsEiT`A~z*j4h&Ehl6%yeYfrze3W;E1yr2&RKNi9(Y7~{eWF($Dz4l
znStX__`o*Z_zedyglDV+)*I2?zi$sNu<!xra4;#qplv;kB1PQb=E;p+JIrx}q)>!X
z#=y)D{{|H#d{vjn!32;EYsk%F>w$h-@2Iimk0aV648PSwM-r(W@iOZ0d@gzHyXLo#
z&V@!tuWAW0+VT4s+ub@G2!gCUPyjpt#T<9*(7Y`$1e`nEdS(Bta4iK7714c&;)!Ss
z3KHf#`%>XAS{5Xok>nfthdlWr+M~5wX1;?(uKwRBq1T-Mi4sQN5rOfbY3pD&F)xs#
zhEAT-P)3THjO7`N$1HG^84}E2cH8oTBZuTq>Kq7;i;e%|MLX4z)E5~`bQp9&Fhd|P
zpag;w6)vY0o;AY4!AyrwIWghqp;$GaRZaqO;7H<CDv7A>&ZQH(nePJ{2ESHtkY|!Z
zOJFC7a~$X#oFl7Un7hW-1~VWvf?9wTaN%wta-k;uf>_LHREG*(SNH6N3(*1hB{|dn
z8#Giuc4wpj%h)cym=bUZ(w7a20^UU_{@4T(MF!!vWSN3Ro4Z^sM2BZaA~J4VBFzjM
z!ot8%1xD;)MV(MhMEV&;8WR)5haySF*i3pUE%sn0w;RiU85sT(LNpL-r~#$kE+PBE
zNpK$Q5ETe!N3}k%_!&PQ*ok335eiYc7Ch_ofAL-(Iw27)Nlb(}6{lWua^~+x(CrN_
zVJq+|j9Xm#`0?ZH>}V$0U_%AB0?^ahiBydI`iOxN;x(A?%gM=RYh5I=(3>kDLY-3G
zc!uaer`6Lsghiunbm8QNCmX-t5*s68<&PCD$r2gNH7lS#APg;@8;6FaB^s<hIW)Fy
zgCjI)eQb)5Uyi)7&Q7MoiheCF#i;y2dV1)fu*;0mMZ4cgfhNByD%U1kEF`k!KX<jf
z=9YUaH72KI<DxZg-2BiyF$;n3()y%^N&h&(JvLak<a#4VuZQ&{>7xmL@q1nDScrz*
zyNjkfe|?k8xvU|pAb<j0WGgk~$lVbg6LL(W(n;6xBY1(S8269cgPz{laJED?W4U^N
z3i6!qbT}#~gxoF>C=2{Sj~n$C&WQ7a#G)D2@8_lX(6{@)LmMItDwHUqM9X&fSkMQR
zn^yCeISLufbQIO2gY{L=yg7t(DK*+3ME(4GO`8Y_k^?qkVfm&B$48)myj|kqA>mNS
zTgd@}3SgKBaT47h2ZO{o>i>ynJW?2aQiS@Gq9mjqUzmQY!|$pP5Nc^%Mat1h0firq
z?L(E6JT_D@un^*8MtA|zbC~^xXO=4dQBWDwC8(hRBU_(`;V(aKf~1J*A1YH>&L(2x
zd)1bs>FRZ*wc6VMu2~o2Llead1<x(zVTaMn8y2V2=!NaXpPnd?($V?{{MFW4@n4ML
zwC$SVa(f6N+8Sf?Rx)0;JuKjY?jl{>()Q=Jef^w#gG7p*irEcq<Byg=&2bt5Dd>uT
z1Mxprvz{oypiE1yENL6RZrsDG;-QL+58_E&LX7&aRS$%X-;9~0LWXEPp~&mw-SLDB
zaEfRZ{jdTR!Nm!6=@5$~=cdsg@a-f;Z+#R8|8pZYF8_a%5MC^{i`+*-*5!+-qP(nm
zmkmHNKG<^$Zmm%HGn3suu*3Nz>FfC4Q>aqEE8C{CBk>=E1o#3lQ+l41GBeBwdQD&D
zX%zCFmiwYC`}4k-XcO1r#lw^;N#&b>JWF>#aZ%-g1{8kNkT?E))RmRRxPwk!OHrbW
z0m|HNm6}3USd`*{%=^%kD5n)NI0eMu$l_7>`d~tCCUuV9FKW$)-KR?S^r99&e4{gO
z@W<67j{h?^+uH(TJkI}&{)Tl7EF&={yV`bbFFh_llRktcGBPjA$_&@<Bk6}}>~tV8
zIe8=nEh0#mWsrc-)81~njLC?CCq6vLNc5dYeI+XgI#6lBY6iay*gInb14;8CW*ExK
zh82`UJRL(WxI7NWaquDMHDDG>ul2kxEB~4GMijT4mO4v%h}(T*QPnvdEI=Jc63JXC
zF3nT%f7Sa1eT@+NBdeDq_@MGB=8XA`Bp_J*jRY36x51wCaqxnmT2P!WU?w$6DFxOO
zSCLYk+d+FL4QiZbU_JmiD%!aJ+S}W<eewH)FKO8ICsv9utt?6H+oJ~omil}(OlYr(
zIWUw|_KbQYupv1Q-Lf7ccq*rLWq@l*aq-vVjwON6dZD2&=3U{!JZ|{-`U-a!b}gr+
z2!QY3TSTQ(IIev2=J4_3Yiw)|@7-JW;>Elv<J)w`x=8l;?C^&b6od$w@+B*5Y;cP`
znYZ%SF1>L|S8O@UC9;42fLGd^9sd8wn(TGW1#r-3aB^PnTu~T3mbM2Fx_`Z(CiddC
z{rQ%>yNnLR@e4rSh!4+NiL`yvOOfD|x_w)dbgSJkfxTMMEC7*o(C7VTM@QO&6WE1?
z(HIXLXx)Xz8b4S5A#9I^lBYmZ(Y~yvcJ9#<iqe!BjCz>G2#I*gpuwVhg$h=%=Je3K
zVf6p88Nz1$#tj3O^1!gvOXCnyP`LK^akB9a{BFP*5dS8T#sjq6EMiQ}3}>H^qYtW>
zAuRxH_6ZAP*ZaD<y26zj1WMK-XK(9iVQBj^R?m-UO%7m_;g(UXwXFU+_f3pKMxdOh
zhSZOTIwI3c2}dkAuGvS&#B|B7AmYtWWP<HS3Z=btgzA8T^pIzwW+d<rBao2sqN4Yd
zMq>*Kk4-zFT}LZiBCsB4&S~;TLXWwT#*lRP?BbzgY8o02x9-fWpYTJ{nqUC<35rnk
zvd)FNVMbrRePg%6!xLmVRTVr*S?uB!-IIu7!xmn`>iNu*CZ49G=RiU))f1pmf_|7F
zIVt2mizSm{!w*(ev;-$}>Hw9v;=TF_;PO2|c0yi`b|B-uwtp?qI(AX&R|tq{L2<Av
zq~IV(Mn}DR{``-bW5kD4|ID&HPI4S`7*G-vwF-KY32x)ZxBvB5q5+stxNBXEQ^%zf
zc{-Qg5Lq)Bcy~--b~sFm28e@7R3$15J3Rmx#WQ@zjvdrZjN42PJ-05ZD$%*U@oCsa
z1W-m&&nhY&L-?X)p!J`oDwzd)YTWILFP2j?lIb+<M#e8u!eGVB%#2H-b|#AFtf_To
z(Bo)~2|ApM*q$x#(h;IlHDT*S51;y~l&1o;cln90ss<snz?}o+BnW1hj@)D8mq9aD
zyo50XC-l*BOA&P4#zPsb3@|teCWIEm1E-FN*#RACMWH>Fv<<<on0f&Tau7+|#`Wxd
z-nAcA=&fZdnvW1F4Qxk(ZEydP#Y%tM)z8m&5mX?|h4@3#d?Tg5hcvdqh;s(2s-C6e
znOX*xPLUT6i{a1W<zXaR%1PC_h|<hXKff!Gw*|p9NpFI_ao~^`G}MMWsc*Y>mN5va
zi-d4HFRuLwJAx|$MMOFGAPKV?L)+}yjIRR)F>u!_>dVMotsKY*ICI95kY;_~JXtWe
zH4c(FhJiH>KR3E^G7S#scgu--TeE6NmDtA6(YFbb7XM5d#`L2d@^165xNODnW}hWv
z^2qYsUkBR2cFeEuepZ?=#}=t%>oWF%+WW5en>TI3(V>cX8su8PV0?a?y|=D5)x|Mf
z59YMzg5OIaYf4K?8GZxJQdG1c)_K9?cZiJexq?gLCFC!++C<5c!+{)#_f#5Cg2*J*
z?a;?^G2tU;Nc#2bFZHDe&QTlqO0u{5z5ei@RbYGtLYW56REycK%FB}wTZxF7UF0bZ
zRl?T|Mj%As>KuGAA>kt)PSZon!KieK!3Awi?MI@>&Y(Ph3*cMl<cf&)S&e>JwZGY-
zK=$IOT+Kh1X-fRdsA>p)3wJJ;>3|3TG5;fY5G7j+#{=WoE{TbW6ztyCeT5uE-`=ZI
zSe%d-^RCNxcaV6zvMTwltmDfg2?amM<Ft8w*xtaI>`$IR6-#bChfi>|COL!nmvqMy
z^P&sw(fTzvmNo-NCcnyTV@y@{*n*@DuaGrx;tidI4_V`bh4zA8rQET1Y+nzbb*zts
z5~o!_Ag^2iEaDGq00$|K`mgP*g21;)<Uz<SVa;VH_u=n<{~h0{;mcG(GGkwVkm!f0
zzxl7bjD?FU>YwUK;jp(*ZB-~D7--}F3{adyPcz<fXR0Pvaz_Y-uE4VF(Mle6jMW-S
zs|K|Jlvw+MY#*H!bcS>7TLpVn$tz_oEq91i?kkg#4hD6^+Jb&z64(VY@@WSG4NkNA
z2n63)F8QNaDwOTrU-*s%(x*^oiLeexXs3K3EAT%zQ@aShG3oMUIp3Q;<F@jM$>M1A
zFpUajlmjH~7S7)CCC~ws9Ul?rKo}>!X6593f4*yE&tdaX0=bq40@ASZegmym{cF3b
zT7d)27HxgSl#u+t*!puOe_2k|?t9Y!?M$wa?6nEdLPh#=tpV#7h1ufp+5NX}Ya=mS
zqiWxws#e9RWcH7QRkA{~4hSap?aUNxzR4|PA>s6X6=s=a<wgtdmXx?5w?o!5px3K5
z2k&53GM?DRn$qo7XjjL1fd8EGDrLzWtU;{rotVO}%j!_IA^MGM*~beiEhJH=*rN!9
zNB!}K&gD1LIlja<!r@T}i40$<*>^DXQ(608mz99v6SQ=--<$|TWy)-P2<n4$@^2!J
zaC-;Pi5gh--|Q*wtNHom-nD0meIlHo!ya$l&gyRh6n2dWjsp%H_|r3jc{)IHk?ukW
ztq>Flu?9_DM+Mq}Xa?9p*NsrO`8#qu0X>|0ofQx(G0$KUu53b2Xy_#_^>>w}|8=Qj
zt<pReyEn#n=@4Zc#R?wH1@gvT!yj|CtaJPq57n<mNr_&j)TPF^b{%Mmc>U_vPm-)`
z4jQoz7=)+b3FITCC=Q*`jn7g(PQ)TE>sLJ4L_;_=$?B@Ay%S|T?8Mv+Xc_@NMPGpE
znMiFYIe>;*V$xkiqwpvH?h``?qz!D_E!QQid<3<Ti-*dt2|E-6(}u1hY5DCtclxVZ
zc~Cvpp-Y&#O25fZPO-S#MdF3`g2<xys7@{NM4lMXU0hn^kEFLaNOj3|(Q1vDWgp!a
z$h~OFMzxrqE`EYcvP73mZG6t-HpUmLkN>+Z`oLU#`TSY;F^jsSq{J)wkv<RB@T!|D
z^AUZr5ov2}sVbxB+#-x*2{*GLOrK=8IlG*I-y3p@h36&BZ#$(<Mtwz9x+#JEGdn<a
zO0m!g_Zl{TAmZY}N8Gos*E-1SJ`Q%RFQOd$>P|a}w(Rwk{@P(f;<irwng1Tl<LJWI
zV3_P0P;R)f%22Iz=mq5ALp)Krl2F)ist?s_C&@-%w8;5GJiJjy1!zNTI;);+%w^%E
z9dJS5$`f=#WTF!?A5f3XS&`ywp~aGox*>+*pHbN#;5?U@NO)5IXDt3bHw;a<LL0Pn
zzw11D^hg+gBevj(H*D<VdlRuGe3yyTv-0w-82feW*0MxO00EptEkb)D8gW{@_pYkU
z!ND%9XB{cH5f1%NvQuF1cW<32S)kdNa{LGKXHx>uF{``3QiEzUQZD?&viU%(A&}nC
z{#()QDojNd$*!?ku|kmsglW`7qYK{=9GE~(63h@wA%GqT8zQRPil1Wv;LV-+YU)l|
z|K45WNkYtCne^sVMYWJUFzf?`_xwXxO~sqLVojuw!K2ao_I?!a_PM#Yub894xWbMK
z?5B9wZw_HbL-_QbkUMouCn5st>}0cwLJs0ep_jdo4%A5r+E8-0gD6q*iVEVenHg1r
zD8-f5S0Qd+k28rogIE_XT&R%IYq5($<7sJ+FQ4CE$UWsA0L4Yo<AvF0nvL|sgbY%S
zz~(uQDM4tKhwv07IluG8s>K&uRSLY~b;9Qhm=`&`qJk%ll$<(D1`)b)9asK=xI|mV
zn&Mg^L+I1X<GoO*l4rnB`|Hd0?++30EN-76M{D{0$OD<nH{ibM`t>5R2cdvh{gaIo
z;H{qf_{+_fkK<eIr|Fl1_`>2vmp2V5TqsdL!WJZ_80m>^=XVZv`UT2LF{3ze{P=Ls
z0IW!^Uhgn4lu%o)H4?px{Mfa}L>G(d$e-`M;OALjk_puM%-WGs`1QAbpR-3^6*BuU
z2BV1?Oi04<W2ViV2s_g8kF@;qI;R-Zp`I(zA@RM*hF<Z#Pl_>>3;-py*4YVssDmvP
zTKItW9N;<nMXx`c`3XE##CQjKU|N<tK@7FDWFRFlV&p6Z^cD4Z{n3>)|1z8zxrE+h
zB+Tu_mzjutEMCyMk12p#twERn3y<Y>`09UAWrR8{sKNX8DR}l~QZNu+^a8bXNZ?#G
zSYayDl-Ta#%`cK5FuAdl0tgI~#}V|mNbBrm-~!!N3ZB=j9^vjMZr5IUKEpbq%YS`_
z90nRRkNqj)!!g=kTAFKEVWlYB6{b?$Yi;$IuVL%!qL4wFe8y1uW!H9+?kJnN$-0ld
z<mZtTs*4+A*yr_!PL*o}D+nZ4S;GCM8ZWCOFcR$@EMAXheLcNTOlYkt`<oGA>{i4~
z-0}G*A>|+^ETn#ymPYtDQgrAvV=MEVEKFx7P*Ydll#fvoAG09xzwUoj$l3KnH?M1x
z<^oG2G6$WVBw<u^dFp2k@nSnXri4eamHxI+Jh+Fif%O$Vdy=i3fmV0*N88){jGo4A
zsLLQD>aKHf&EtCDvAE!qw36Jz^i3fH*^(P0qiHni8O~hw?Cha<dR)8q3`z>|2@%Jm
znVGDY!^3S@WH=b`Y?89aP^l6h^!k5(5E<OzF{cU@+oU}qL&|*m)KcnGoO>g>DznOQ
z9yh#weP_*{-BZVN`}XRgE)wh83_AUKayDi-qN7hd$PVH`#v1?EgKP_)QCNepZy{Y}
zhQs{z`Fxtd&`?0BvU2A4JKaf=vzYGpFyHGRd$yHW*@E*_-4%oXJ<w#=F<nVvDw!}j
z&#Sv_B{znCe;QJ|ul)&ix^$-&?{%t@SZ(j5b)u8jd739Q#OAxYKlicik3f?41YPIo
z;lpQ%c0AcmUR>&lExD5#j$OR=;nd$*j+EXNJSkXle6+lK4F&}pH})_<?a)&M_8PP5
zf5UA+^7UO7!(2M29UE<%pK<Nl6vN0iDwcFLLjOyj#1CKeA`agAKbsRJC(a9OV{&la
zzu4w=C59{q#~`#5?R{I?`s)h~uV<pmm-8gr*+!rD_(isrjOvAsc8yGvJVoN{Yn-em
zbFcsR#Q;bb7BhbOFwJh7fwgM5=rL4uh-1&Re@=yk>GkDH1SDPG6M4Pc2zYt%d`zZw
z{1?GkRf>#a4T;Qc(J{&tKa*mb40t!IxdAGY2$fD+r}?jBnDqbmH#;5PduDFv_7puU
zQ;yHDEmI*75g6@4AT?+Wib~$`tg?Y@&Q$KJd}E%)@*HC8x3|b@Uf<rAa9_W=!!JSb
zbqk8EqIhcBg|;P&uG<dpp?iC%n%bwltADq2Dw@d}{*Ukb&p&N#w`CVda*i2&`50XZ
zK&@74Gfe;4)p24SSv<QXGq1hGqy5s7-%dm+Kl}GQ_E15<6<Vf+fwkDhl3|uhm!7QM
zxE1)lr|&2x9A1|%^$(1(IQX)gsQu0~Y`v6d(6E>LTvEefj>qhF{yg1VLW%f4L!+OW
z>3{ypWB*SU=0ATWIVkgUH~;7FPMrG5dj03GB#J*pUjP1;@{pg|yd=l6Rpu^~l_#da
zO(df=q76xSF$ra5dJ$>f7v`Dm*uH(t%6n-g&NAHte`*0rN(u|((VQdvGG`;fvSv@x
zq>pX}v=9vs2zJ3-@%RkZ*Sk@Fpq%rqDggP9&}hJv;H?cF<VP@hd_x`z_d8U%5Mn?J
z0X)5`VBduc9|I`(5z&FA7-&w>qkPk4qytdu%znK?@%ql47)r|Y9TyXwW+~0nYm4eu
z3`C$10k3xnIpl^7cKN3=hsLFxr*#5)pnDU>-cLkU#IGbLCF!~QkXt|*-?36XSS7@6
z%8O}b7%<xIAX?<q)KrFWlk#bOeH)5%#*SMU2-9kFj*=~+Lb7Ec2okM@xR@;JgQ-q4
z%{}z}oPe5ZWheLoh{OW9wNzY4a+==sLEx)J^%r@Vle04wL_`-(Tel*i<&16MY*XAl
z_ht17A}pLXgW={^msh4|HCC7L&oFefomnkgHV;)iwiGZ<0I(fms7q>f)==O%x0M<N
zL)D&wD-i<C-CqNp%2xUcC-I3%tqu;CkdlH5c?aQdfx(jcFK%)?H+Itp!vCqO-EsFI
zd6Vke6`%cQ9ADY%uH(p!bb1^eS(KhQg&#gdbaoCQ{i~pq@2xs66v%5J3G(C5aFX3V
z-d>$w*5OlpQd4Z97%0KflXVf77pK#p<vHX0Gnap*LiOzJ+s}y=VN`zwTG?<P(xfKw
zlW-~D@{-=xUHu)<^lorpXchE1rS0<H`}7&oSg>pN?t^q48&_(T<E&+wSkW<V;W%qH
z-!unbMz7?V(Z`U>(SW{i*B#ZR8B(En^9>Ex!EvHq={fN<OAtnMPP3ovmv*>V7qF5Z
znUS?V6CMzWHK)SE-C;vmr8fo)#Uh~@zC1|!HJShl(q_ssdnRs+kFNuCtyb+Fv~E9D
z5r?<;o^@0Miixqo>Q|R3XS|V>r0ow(&%MS9n6&o#i??s*FJE_VqZkk+)5kQiBF}bB
z$l#p4(Bog;M*q^G0}Ze)WNrE@)L@$<=e?m!l>dxkp~Jd$TQ=>6y`CNJoRxr6ixrTX
zJaLb6fu}U*IN5aOi_=A1_d;qdL8=QN%|&Ampyt3b&1cmo;9D2Pjok9Kx-6ZqI`5_N
zieyc0Mit*_@`Np*&!VE{J*nUPc0IT2JK60}iHx+f@1sBD=ISkNlRWpn<xa1R5?@P$
zrE3?~K3KWb+uP@6iSNx4hYzU(mCik!|IeeLZB<;Clxn@+`ueHO-?Fj+?cGYXs>kPy
zcYa-LdBOQZ&S;zG5Uc@}#-fXbJB19)&h8x+Y5DzYNcI@>n4Pn+8UBD9x60l=cy5}`
zPAKG=6V*e>%=62r0tapqeK?_kKyO?1Eo4qBvJPghOu?U?w>cGTeKY6##H%h}HlWun
zIR1f+{W{pVKJ(=p*`Lr~a@K;RMl=sy^xW3k$Q5Ui)LmY_8Qcof_<*Dp-N0`hJ7(q>
z!?_BjgO-~Ma#bYDj-{@SxXHi{z;_YoqCuM(h=_#s3K#O;706chA(eBMO;1#yAOJn-
z$JAw7UFIk-7;z~bOf<eBsirTOVGd%@UyttHMYk{A`nEYlg6V$!0^{cr11K$0Tf?<T
znAuTh#jSbJps7)X5DZlf4PzG^F&jg+&L`m*Y!PNeiY10bu)p_P&u3I2yq%XcIe0@|
z9m?ZuWe=iT44-4AY8+{_0;md;hOo_m37Gr~+7IgVaPs^{Df8oYTR%#$r@UVZ<LxO;
zG-3V0C@sJOQc$_1NjhGgIx2_;)QSpcstFA)NrcS3dV(*f-p*5GEbbkOI)n=`j*$DH
zvy*sw$+qA%TXMqjSW;X_PpSxx*c3xy!4(aZ%|>cPQRdU6ngnhQJyc?=QP6?T_^os2
zU4DKKD(dh+D@FNoa0!zvoZ**fRGaCzoz=mqkxTF%Nwezt6?B%&(%1L#_7>LbwC+F&
zfhQ5)(nh>EAZgCD={q_EPjWt8Xh%<K2_-Ir*aJuU@9037Vkp9r@(#L7mp&(Obm-E1
z;O66#T_-3j>q@EF-H!m=i<VrcvDCsE$l+$TkB2*<!lSxC@!@;|3xgUc0lj_xyjrwM
z0uV`3$Be0O?b!5>eFZyj#z~1CWKd>6sZf#Lr%(*l)=}g$BADWR!*ie)&6=-A9H%<L
zIWdpp2d;e7sAsG>(H94*w%J%#q_o55?;kmc;|=ruUrf318S<`!QoljG!=tJ8*?Z(j
zF=EDYzx;gFQL9Sp-{$=#hl-B%S#q(R$P(noJw3N<hhE&L=gN?yW97H<HN2$de3drN
zk=fcI*v#XPVN1HkXb$XrwY<dr!@?rS%~wm%oYvOV;P|gGfE1?r*$#RAc4*uX7R)=P
zyN`=Inu9~3jqPsw0{Zsya{BYd;Q3f&a+asMH5M;7pfQcE@-Q`mD;$o-s6Cl->HA^r
zg$0N<hL!Yf=ld0r%4rV7Hsyl{<t5!WFK|N4cO8K=YG1FJtB{8y@5}UH6(z8&^F6qk
z8XRCxx9-(*S=2^SJu3Ul00XRgj3f8U7(^O{<=Bi9L|5C3eV!T&9A&#kY1B)Y4ZUUh
zhev#P`SPH{r(!t%>>8nend;r0r0{rV0KIBZJG#qging<Mv>#OJxRi6K{5L5~<$fh!
z8~n75kv%MWe(V&)^AK_G%gP4&QVn*vJSyc=l@&@Wgg%tML_1&C>?`Tp)G^BYGDH8e
zmiEj3P%_wAEn9Y={;37io;8KRQlAeqFPC8-Nbj7+nvX;pemP7Jo#@fLLBC#DRjMy?
zAAd*2O^<on=4SKv{Kki|1?4Z@okbQtec$coyU2}MW`jN7-j6H*DdCIH3yEXOr4j!L
zg=rJNLW5Ao8WfLZ>c@(TRqEOpLeRK^#(+`pYFdRvQ10}Q_^aP4lQ$i9KZ^A$De<s)
zGFik2_D}lC$QYl}{XKG$eTn9%Z$5s0*f}1TUJ9Z7I<&1MZNvPgv6fr5e5Q+p_MP2h
z>G~0)p6wXP)LdII2d3pKouvi?zJZnWx*}#LCJfvC4q}38!Yt<(#Z<M1!!g*=V&+<N
zXKbH4Rie?gx7r^c9H`UssL;N4QlQ!#P`P0#+v9*7GP65(hJWzT_g8U+QS9@f*h-a@
za|r&GQqP#*#Ok{^_98k@oK~*fZz9&yM0g-iG*u`4AHv=|tjD!`<Gy1fGK9>Mj1`GO
zX31DGB~g)3k)cQ^qV`s1c4$zBvK5j<Buz4=0c|C75haxdB{aXEEBtoPd%VZ-_Q&(=
zV{hu)eP7pF=Q`K9&gHHjbY$Vc?bPa(HS3X-(G+HCC>TQI(3F90@}T2(*u8i!AMs37
znN#=c7Xdn1!Nr>1mzJ1dEM$@>@VfJrXJcitxN`jR&r?=@tchN6c8>p$r5)@NNHIY(
z?-(Gm{xPw>^6#goG_5!r`mcuBjT^Vh$|{0wIA{;)d-%5dP}{EES@1%rgNtj|l|Slh
zOI*e}eDe5~`I!d1!-Lj`_ikBDuO37;Cnk=QFI-7p0p&#UsdUl|Uw&Vp+5Y|dai0Qf
zr}uZG-FB%aB?Z~^jey0^=(JOR=oKO6I5m1>Le1=Y&^;sqfBGVBuV|-fee$(BV$7K!
zPj&eW;c_9q1|K#L^M?q03K)UVT@`(o84HF>>JnbUEcP40h!%>#LWc)vvXho@hz=L*
zvm^|qjd9W41AX32<NnI!WM^d9oz#q0(RJ+6w5fDUR~!^#B9wlbt=+!?f4;dM8966X
z^A;)qoj;oxiq?%u*9F+ByxLfF#MM=DT9O3^Bn-JSm!++qlW)IeiyhmTpJowoUdg~V
zdvqsdcAIs?cEO*P91Q!ZQ&HgN=(p{Na?`x$kbeE{J)9+?ru}|&Zh9%st*$;lCFYLZ
zT}Qj@jd0$gxPq*c(Ek_{MOsm#X7yQ_NQ`p+(7&+T;rX);Z@6xQ0an;~zrze5z~hWN
zV_rF+6P91I%`W;T-Q7vHvww1~TZxO~(9i=rT#draGk+A^aCkfGr)*HKNV{&vu=0@8
z)J<jUw0TojJ5D)Z*BM722A>kzB;Dc?A$IpWygVhpoX&`vms;jBAg9l>eIvWJrl|V(
zy+^lhFDaO=ZDUQzUgw={<)&At|9nZ(Ob5;e#&-He5bi0Rv}~}OKjvQmEfBjt`>&_A
ze8cGd>t;aP<$lAQ!eFaNa*7i=ck@3stZQp5+&r4Ebm+>gd5UHBTZdVG!}YdoBf#Z+
z6P3i~Zl=m^+>|wzSp0dq&$AicT`NwAJeXqYU*ucevg3fRt#?u5`1zg&BpCM1EdNs0
zt(G=8S8hUPw+qIhs{zYozw0SK%p*zK+8uW-{-bC6_RG#{GH=s664s#v!S2%uu(+J?
zbj9nS9IylOa$y28y6efyn3dj4czA5Xx8w76EvDHSRr~m5*oH5k(Aohjqwj*_?1pyT
z)w<ge+b|mBd-pOm_h^*{rG@?2bqU8S@9wmJfAa9fG2>SCIiuA3&Zm=_<+jNsp1zU!
zSfDlEc^aPD`p(e$klU?y-Y&%=_E68!X)p>Q8JmeEnaj{_a)=FST)up`=@{5An5Cmn
zvluw1_^*`GmMpl<Xd^~?pskCGhRvTdd9=|l&PcjEg+XNd*TlewiNrTOZL7!p%;`Cs
zUsb1f8)S5TuCJz5;5T|xLC*^hZkzbyUDK$qmSCLxON#cixX6M`dVDR&NO^cjup6E0
zW-a91I7IgF-<i7Vfc%~N_ouFo-CCh0cc$#yw~^^<oVUFPY~Q?FLoH|6S5s4S-Tj@5
zt9vLZmE`4VH&{FDF?f9Oc_Fro$`OQV#=AOd?L6pzcEb^5${yR=5V37nIuyMme7VaL
z`Mj@&pO}XO4-wcQM)PQGa&VaA-=8DV@!79qpUxU`52lQ^_7^|b5*$s<%w`r*<@tWK
zt}C?&()W58=Iys&cZ*raDrNe_&$rHcbg}AipZaQp>h6B0pBK{8{X$UYRU-%Z*I<?i
zQ8}^#{b=Prz4Iv&Ilu0!iUSAv&Nnv{S^m$Vr!<IC4}0rzxI=&aWBDV@D<<8vv!4c`
zJ75HQ4KyyR(+0g=IaF2E26SPgG~{GxB|DM<6c0<FX5=iB-a3Fq@@;)mpB+aW=~0q&
zoEdWWdA@UW4?JHTP1_`T1+B@vN5`K7)M-GoxP-1m$bkbrv}boe`@9f^v_Y@eu%}TL
zynL~~g9Aq^OUT5~qdc6L4vfCZ9+TBBxZMEktedB_JR<)d<%RV$dJ{RFfr@3#W`H=@
z7p&E7J@^QBPcQuubSrxvdSqaF-1qas+1u}Lvy3M^iJ+e{hE~!9xDxUaaYV>D^35;!
z9A->}QW7isP8#NKFjA^;NotRJMAOA_ZjhnZkR`7kx(+7m4Av?!vfdFGc=oJcJ7GG@
zU;Fy~J5Bhte>Q2xoYsM*cY)r?GROU=<AjW$_XdIz<$Jv4M`5AWwqd6n)9rSHY<tw3
zJvw;)ml#2^*vn(ey<Qo#?tcA}w7%*e7AR38UDQnZ5l{-OpLMnj8C1z0oVfZN?bwxQ
zjX3Jgd54yg>zn&W;`24HX1y32re}<1=zx9G@{N9TbX#>EtP;62)^S-H5R2?Zi!X{c
znvkvVsge3yKaM%Kr25&bS6itb`58WTTlkZ8s0--E5)I;K9PR^<N<CljeAJ}q4Ig$@
z{-GCYoU${00KHBr%JamtgnRcG?@b6?7+v~s)a1v*d=1vTRj<y(yu<gN9WbCQk)O+K
zbNA;~G`T{tr2(?{*Y`Y6`2fJ7jC=UGkOza}Pf#Xc_BL&hI_&lRVw0X3Nu-HYTW@OO
z==krV>vb~@i&<TK(SRu(2N=8niF2_~tDpQ9am4akCZ1Db2_gGG`qz%ON$Xd>;8j9c
z7O(hW{8suW9xaZ$R4^^1*)g>LnW|r{GuQq{x~%BvJ8H(d*w52VOPoutQ)3=qi{z)^
zZG8OGn*e~>=d_9;a!#9vegE>M5(M^k-QVzB`|YA5Q9Kkoi^XJbW*_$uLUM8h^BcN*
z_>dH?eOUg6D9^%@PVvX4c+{R`V<Yp|c@KTlp$tC+vTtKGXq-xsjJbdB-eFD_oqs-B
zBU-R>oz(h8@Nw+kRIno~xR<v7(&fOaB7}D2g^Morb+o8_BALJB-w4)>#F5r%s|_Fa
zHY3GMI>|0uu|k-RLUkdNV{YTaf#(mG#fj%yXWcexcs2IvRsc$@1eCops4}OWOCP_Z
z2D|8&KSr#jmH06ayLR7({d~uqTfXH~2;BWq`Q_IF5ldcQ^WIs2wO_-RccNoltMZUl
zv4_8eZ!`^k=3xUhFng?-fDm_U)B31%h%?v7JU!Om-%Ccy+3cKdbsDv9)VlD_&p9Kg
zMFvD*;Ojt@z`QQ?C{LwMaWkR)Gy(<0V4u+su#8ER@k5r2wFvy_eqNQy2RimsQu2Q|
zaE568@0JCg3>Fj0)bxShP+$^5axPJlqUfvI*>1ur=1p~<n0O#q7|fE~?7O>B&4@l0
z97XOW;cJWcwrNCijxs=&cjZ%DA7B`K&9n#;I-G$@K7KrF7_1q!bpQBq$8fytwh=ls
zcsygyCufUa0|@D>F=Av12LM!px{{JqWB%C#*BBpmVG-VpY3+vXsJMx9KZjC~ba|sT
zHoIW=vl5jS^%31}`itv!T-F=0cW<Am`x1+`m|wU(>M~u;;5c46a8<7e{t*x4#LUb%
z-h4?E@-_v}iSha5U#}-ESCpTtJXp9UUDJGnvAOZAGWgY`BD#ukW>40cA~k|&c)`5^
zLNExCd$kO*`k1EGzAuRvXL;}<?SpB+C*Kc9cz#N6X7;y|w{L6W+S>PZadFYgJwksm
z`O}{W>}fFwMb@4@G<o;a<hYh;F|>6z&3<ZX$&RHIx{#eJ5%~3rCa1EIcvxCw6LHQW
z_A96^-{JHsG7XLq^z5m&U^RqMn$<QQILG_Zs^C{|eiY;$i2auT>tyw|L(jPDO&$Em
zqjrZ592lN%7PEO>lw$k#Uv_M0x$N3Ue<nRjW~!V#osT!sm+@z@1w8oUY|6NDy*-O#
z2G`ly_H`Szslf9o7)fX~y;~SlQu7bkW|(A!V-x*B#!GF%5ueLw_suCTydUtBEh^QF
z&Wp`{!I%?I3$7}KQlzfCa`kFq`nkXVd19ghE`<US#sr+LG;dxwzetMXfiJpupv1RF
zD#m4GPqI0gdBCzV`*u(A($uKH7l`qwQD>fI6367GbCko$QxHa^y1*g<z<vH2dAP^Y
zxD%89gQajqgCd2x(mDsihu3Fm?fOM|NBR7g%4|2--)RsB5);VdPmTd>lUtlzcyUpC
zB_-jnjfvoSqYJ!FKYt})=>zR0AJMqIGzi=9UfE}WtTJyTr~jr|&+d&_c2ng#B|X}R
zhw96DZDN#6$n4g=v0Aq-lUNn39(Uh*b3Zq+n}fM5+#RDGf-4X6n4<PO7nuOyJPT%Y
zIfW>+n?|MYTO=K`kSiovno`DqLyp#*)4Oi7SZ>XL4_=+$JUXvkzPkm}Fw~%{taZGV
zdOei!b#8P2_>K|B*bp?VZX>dxvi;b*@tM57DU;tRs|>4=rf^0+ZfUQe(64s0<BCTP
zwvFKXQ$#Ef-ZP8%wPT$tHP0NTPc(dDhN!)L<e3f;on-6gN~6}lqgK}4L*n=CHsE=$
zI3Nn)H_gOX6z&&{lAKZD<+LI`r6Epy^p&acC9Ba3(U{cBDyEwjwwPAGme$HJ!DS_M
zg>_caid%5O=x}#hyaSdnS?u*D>&AvNm2srTX|fDpGb>w~&~UlhN0=@F1qR0<l_b~*
zp-a~VxgS^h8jP6gw>F&~udQ%pKGUt&I7f>C-5%FuPb#;GN<4LU=S%gYVW$({gzY*&
zl~_xPwm)471cuFCqnYsP6(={#uo{w32x+yJ;Q;(~vm+|s^K-LLHcjc&2xUOZ?rzg#
zKm@E9xG+u8n+2`-oM=D(_O`xm;p%($?^9EaKeG(V6>EZyLZJgFI_`U!8k_kPL;mbb
zf?MYkB8)4G$3!(0_`2gcp%W5xQ;`@_3DWQOeFwr$!w(P+-PFy2&h-f)2i)W-&$ZHp
zSKx@%&o0`eF{GZ;!HqaQVcWOCXY{U_hB}nI<FVxCb$Z8u;3+0Y`Y-iTXy5(`q$+xJ
z?D;=z>yl$8sFscAnvKp-unC_vI<wQX=Yc_1b=@x;^y)RdYwP?=FIM+SY1hs=^6v>%
ziCJ0Zt0}vN4;U~Ya~ZVjw$%RCGd)$V;8WzK-`{P9zCKFP6|V|%XkQqc58raft);a!
zw2eIs_E(SZd({>O{2yL$?~ccX^Sd3$F<}X3jHMPBh9L9`wbjH0Ob|KuqOegF?kHmi
zFtUcTHGUjE^6z6xZVqCjlW$8*TA0dLj$l|szGFu;P~8qrD?f{!hEDM<?Ii=K=Pv+}
zP@WHX%{*`4Fs0AM#S_>Ae^drR^WoQ6qYb+mauMHd;o2rv<F07UEBER=aJE=0%SfZ=
zD>R2%`Sda97)%F|y2%rbSK;}>TT7d5PZxvgy`?hX1oq);f-qFDKPj+z<bYAM8s6Q}
z>Pug8-+==LG2>Yr0sC&qaD6fowc*9gHeaD3_H@FInje%l>5maFHY?wBqR+<NE#fhh
zB&K&(GfJ#6GTGrcG=>2eQF|Izi(XQTwgxe?5s+N-42d5|I*D5JjSFW}U+Y5#00kLV
z^Adz=@V3Q_v8fawf%>Z$_@ZqW?_$yU(Es6#&dJZ7ZKjKnrn><t233DGmm!QbVXSOd
zR1`Uq{>Pl-Ba3J-4L6_Nw=ac%n#`Iw^LjXJNV;4s$LO(cjjKbq$!QEhEQzpBFt^ht
zI9Vi!9^MG$e!?K2$9`8*$y8Fw0YV1!ZZ%yW0B0?=Aw>?&`mtCvVL_Gu@iK*?Xuz4r
z-biXHt_V}k!RWmr0Jq5N#fB_?B7hANpT-QDlgKMqk_@_1C=?@8=07uDhEpfsU6}At
z+lr;QV<sypC_JSZd#&BY#ZhIb(}Fe~;-#B2_{5#birzGc-wvJ}Mpb|qP7g%{M@&qt
z(b@X$BpM8Z=ks`>mNn}0F?3*ydb1B#RA5)jzkQ=;6Gi@`KD4(l1L|w@_xSyw6k95z
zJEvl>DO+)y2abOyQtLE-P6h^md0a+hy@U|Kfzg$|{rtK1kRgw2vK}e*8n^zP4i|t5
z?i{p+(FLRYgQ@)+E+c;{`TM`ZK?A|r`Sg7JYN=kC|BvUrPzr-wm5;`Ee^?D+$%OCx
zV1AzhnmN9$1tqHyU$dNO;D%(unj_9f6)7152Cyxs3%^+ExIq}b0K&x4zxktf6~Dds
z8hku<=nDdo*P&*uZZM842&yr6L>NPBL325<2oa!fk`d{J7W!4Do~K;};NlJ_td@>m
zNt&v~Z%>0Tx!~NPH@i~@>9kKvnx}k^bK`ZWf0$E<T{JhuceH90-<$ygx@lS~VsZZt
zPFvC~#qxr~LL0AUEn3W+j}p{!c*5O~uctzPYXR<l2sJ<G;2&_?;@HS_ezAsrd-+x<
zY5JXM$)c$KVOCz=Xz}rD=6a-W#)WOZUp9w|M{~q(`tc#EaZd^>tWWW8guUEy>mx+G
zPt?YC752(Ye$x4J^}X0~aN|TxYlh=%-Wi;Y@J;e)(|j^(fU`z<#SXEFM*YK3gmK6S
zEwOaKuHr8m^>Excm0Ym?h#~6vd3O!|;f1y8GUUXQ6)B#o8)>*)8{vm2WSH-RhuM>W
zLeO$SXU`_@Zb2Pv^U*1;Jo`3;w6Bw*W_i<oM@v4USv~N58+&ySavx|ucJ$~+XtC?E
z2Mk(p!Sm~S22l?5GK2Q9c?kXX=w3N2d-n%d$vH#<zi#4~v7l>I(IC5zZ=>Y@;jma|
zMV#<SN(~u&ek+uV_;UR`AM%W12lN%XB!)|Pl{5iss>(q__7dZe|DHLr%3ve4j6Lo9
zZv9>y2M9ply%;Wt3r@y^%Ah$6d4~<wbT}o=iP?mUpqSCDq8n1=w;5z0DwhP|UxuSG
zXOjWL?-bPn@KUSLBIKe8Yi%3}4)mg*1-z`HQ#EAi%^Et5(BX3o3>-FYBpEpKkqGrm
z5FAk29DiAXCh-O~-2#{rt%>F^K*X~hcpb1MhF^`H$^eTGyqVZxah0Wa+hHR}<L?SE
zx+h!sC}vO;Ae?|Os>(S!2kr2`U_$3B_9zSzAD|!MNRoGYyLBD4J|Hby1tfY2+(0!z
z_WcZ&6@q(S8h&ZyO13|vk^9DNwS9i+Bzg|tDOY&1w1O8iH;8PN&!K>G1iNEztY1bH
zj4;LYJ@3Gf6<W*e9ZPwj%~~m_5c^j8Z+}K&peB-27B)J!VS264CYJ$fLOJV@l;XGI
zwF{p=pq26zepgs+KYkSd5uN}ClMxTz;}x`tnn}zjaxR3{h37`SjY9I`+|#<m1gr+E
z&(@79nb)m#^Pm+!Plfa_pFtLop}Ra*mzRt~{nD}}on5FQ6t1x1jn~ss8DG0M^pb<_
z%DA@v;?zt^O#RVo%JmD2uDmCy4RZUGelC^iDbKboqRa+N47+GQwBN7q{p<f+2Om9l
z%#oF>!As~OTkV`w_aA`&^+yuDn7YKf?5QoxbNKDv_5X({B-e|}hIS3yg?sAA4!xIV
z*N>8-+A1xUT%GrXO^iL>Zek7W6SeeX;eqsV#zC&SOIgyu(H**!H7i$I{F@`am4<`m
z%!4mpEVAk=BbAd#)JG7)JrDkoxbVb@6M@aqugNhUJ}7t+3a`Z7iLbv*5PfsT<!qk=
zt%b9_+vV_Zwho&<PH>M^J?b>}cMIdPgFt?LanpJ^L%J3F>C>uUWta6bi86t$Bzw8a
z75j{2B#(B7BR_2a%+4^xEu>|x!E9RPcrn!cxPtqUtSr5c^TVwvnrW9U9639ujqk(P
z>+Jgpe{;UxWimaY-zMr}8)@*-ufyP0?*Fw}XLg?jl80HM()_X(T_mZph11xqbWkod
zh@b637)f|V2)1K)m6gMiEwg6-E}I4~5ri;DN}JzbdWdsv+5;m>{LqUxDtdZsq+S{{
zVn!!v(WuH5`gQC()Tx`4b!bb+?%k`HCkN5{bMAJabA(dji#9koYF}sdD%7mk*1jy;
zuW=LOhWTR*a}@a<f`3tXu0bKxsZVdv#0ozwxpw1fd38>}a>#g0=iV-=#M9lor(0U~
z6E9*5xJelwn(6dcJr5z0J28z9@F6=}tV0683{sRWJ8bZ=Xt8s<pO0teLVQ?-r1u_n
zG~_W!v!9|*7hPwBHp$bP<V*%)vGE{gi-xAAVg4ei_jW3SZR|Q78Xe1ihMHZ7#&c7g
z8$F?u%tU}s+~wg-ZfwjuByL3&^}fakL1uG?%9JbXV@RwjJz7eZZoFZsY_sI8QU2et
zNNh$N?mvPc8nm__RxTXUR>GDVBaO2TgLQ89ed}gaHL*Q}4BHaAW7<A%WCuJvbhFyt
zDzlnkx3F95U7!CJemi_QYCuGs7rxbZ-oABVnn!<kQ|T-+@=pv#xzXjjPn_~<+ahrb
zAp{Nq8Q6RjQWQ~0+0+!<OEpS>W&qaT`}Wb;a;f?njJIA|dl@M}eD2Q0p=Fz&{d!S4
zL*~L{z`)8W^9#FhZ@Kx>d|GW@-D%2*=Q&599Zgdqo1lZtvvCb3$|4j)Z*a|Ka=yCM
z`)waIyV+T4cISRq2T`tMYRCckK0tqHXz?r5Pj_|}dxzcSiF$Y}7>?=L+n>?8u&0YI
zTl~p6(J?KXJ|D~_4yt5zII`(wOFOT~5IQm=9|%WuzAXQw*X+aIJ8Xr}!{C}qkk_C7
zhg81;WCv{PqAN7L=6`h2X{*(>HCYL<K(v04VBf(+UWa6*x(7TOF^9X|0F<~Oe?4l+
z4ybAOS6u&3<KKIW3Yk(&t;v%(#okv!o>Vs-0Smb+=o@obUTvBurjkEF$!_w^cP>N!
z*6>@3U66qbt_1$A$}!Or54><)`F{`m(gvb4Poc14EBYK}Yw&9c>f1#60!Tm5b(pSf
zdsy;yuSfD8$|7i}Lh&N6Un+}RMKJhGh4;IM9%%@bA&n+_x1<K#pp3>atDrEA^VB46
za@OPD;>^Sm7mR|5_+7*v0?*jAev-;3(ow^}3DvXc&E>Cmt$B<vySgOa=T+Zn2Uxhd
zU}P_e|HI7I+xs4~22Fx!;L3_KpO;y-`8P@DaXfMQO?Zh-RbOrRv>tEUC`}m0os)e6
z0t0)^;L+~ks6rK)$Znu`B0H%lwsozsrSM|Hq=T-blarVg5U=2}LQau1I5{S_NG*6V
z@lAXss-K0(6Z;3;5Qx*#Vyyj~!xX73nCpeUNqGub9Cp(b4FQj^x0}2Wb}>SH+d>6K
zQ%Es9RnIj11qcwjsI~AOG(M;jE6U5~izhZ%mNzf=<#D4o@59yrH#X16zbD-a2?s|$
z@f?y&fn|cnuX#3D-%cjw32(U}VY2SDl5(nF|Ng3q?OkhBIGEfXItHC}S>ouC1}SXd
z!BPIB<Y?s8-#T4;e{?d>`F_gElVk-U3U-;7zemc^;N}vl5i51n{o{{6*21{(uWOX(
zMhj;&v2TFAQ)>Zq9QxjGy8&!SSnl#Pir~jJ<_5Tmdv38I@wJRf@%Bddyja+^ilkY@
zr)K}5@k>W3N1Gb@u)ZDg5U8@#4x=Ok5|8bxYe~q*W!rb?5N@BV&x7@dXJp)9jC;wa
zPd9AR2k`4lGrI8Htm0Pw7e(!ZD4f5sMn?7vR?(2yb%>k9hm2<&<4r?ZNnyxmhk9Jd
zqt9pe?BTEs4r3~R*z;fuojP{E2z6)##DrOhvAWd<8I+HNfw{@mc}2gId+$gliEIIk
z?($-rCAMDNdhWGOmNv)@7$m1m;|YE>`@;wE?lqs1eo+F8<*!0WgX-n1I1)EeLG3_@
zwl&UN_6z>vB5d%erOOT+M0<1ZoJK#92_0HYoa)ZHsE&SARx%a8BtJmPv7-7G6VpN8
zgp(0KU9CquS8YGaGLEI2JPJU{(^pX&&+%3gQ}9kEp)s=TF1FnWMYM=Vu5bQCK0iD8
zLhQ-km3_`~uF4y9UU0E)@+j?W{tdXzlk#fYN~aelgWY@f90$>kBeEM4UrK@QPULSd
zeHLcu9-P+KZO{JwYhGV3BFKopkaZ1Y38GE7f4`-2lO|1gG|Q~+=R<aAy7Pk%CEbZV
z=>RJ#zM{;igwUgy&{$Ev2T~Oa7%Y=I1nq3%agI?C8Y3v|rpTT)3`UhQ0dEEIUrfjl
zlsbov)AVQ0h6)giV$lM69g@?@qN<&KusbPPBR?U6Ynye==BUU<8-Pj2xfhAHCZ{4p
z0#m;JB>r6&7jbRLJly2Nbv?23qMpaaSfNcT9rIFXZ<Y}Nt*48A&Q&S|qM)jxf@`Fp
z?pT5+4!Fz6)lWZR&#f}=AGh#%GKo#$Rw)=C(AAsig0m_F@_a_idQb^ODKOH%_K0Gm
z+pi%a2Y3PV+X1y=jGL#ZG{#}Z%kxssYMOGi+e+~l(YGV<hGWy9Z};b7X3N$3^|K@x
zq1x2l!@)v^%{=>_O{=9?Es9`@N37FloGWGJF{@&@$s&eGjw?B8;fufJ{x=^rP6#it
zY2+1l)P=I<ver`F;Kw|F%n&K+Av`R-3Shr#ZGK)}B>x#SuGXWI>-X=#H5Q=LsF_oB
zmBNYZegRd1cmkV5dD62d&u3YFDx+xJ@cg55Cd?bj07Y4A!n#Qxvql-}R2p3sl-ED1
zs#+;yPEX$u{(mT<G0<+%<fa~D8MG0jxxh2S{7}@hq(thkDf#Li+9*Nupu<GJsE&dB
zfXK)#^kLaC;nk+Kj&1v1y|P4kK4OjjxzYt{3qWSr;!OubNG5w?6>n`z{xkMu#IGih
zM+>TGY@%G4q2)RqxvroxH-OkGTr5G7BS%W!s>;d;k=h_Rk(HA>s?BtP1z-aPdfw2X
z(o0JUI`J&`?D43>IsB&q<|;<cy*d>>mxg*ZxOLWX)jm0lp(D4BDLZ^?meD!&I@m^X
z9e03FWR{fF=w6zLx(rH&F>Q}y$5iZu+6ikloVO-SfI+=oDlPg8<5<eb0*7c$JDuL7
z*J3RVB2unk*(8~qWgH@Y!f_no$pN_snPHy<TZ-xVi_52(6Zk7z=JFrVc_b;Uq-gdD
zL>e1M|5-HIMy>Cy#K^CuHgC-?aK?Y(x9kQf&H%2DJL2>Fw%3j5=p8@j@Xs&0^3QQr
zbB3%zljhZ`gU;iB3o9D@?VbQ_sP~h>LzI<XM~*BXcb0sPPDnTu;FDyyp-G}1OA%PS
zX~O;(7`g+I%o!}?Hxj;!7mU7uUp9)bGkug2UqhUDsu3jwFG#>A?+?4_Jx6vPLS@A2
z<gJT{vGnh^lyoLc$!e=(t=tGdcY%qG;D<A)gj&{b#d0YPUwQ1H))7nuH|a1~QV4i1
z_IL2DX%HRr^b90p4L*b&3(qsYs$fur>7)Mag0RGZ(2e-R!{nDXexwH|iaqgPaiUXK
z23yA4Ayf%v7>Z7Sn~ol+6w+c1nprqI0-ps&kz@)_D#Z{|8{Sc5wE9?@|K?#LgYARr
z=IatTlmQEDxM))c@)x9>0m$jcKp;Qe3^K#@cFPt9uUUDkw&-#Ic9B$2C$J{(*%KqS
zAQ|dOT0=BU;0P{9MzSe3fJH5QcwQQJou2x*(Ii`6hTND6<Wan)F2XA$=fy0w-^~o2
zx=tNCZbVZ=5x|+#+j2o46gNgidYQ<ZX2=EC3q}*blBjMii^fRS{rdG2+G14URW7*&
zxe;s~ds-jPKnEw9WYzfrAE?M>J3130dnFJh=n_qJB9}p^af{~7t+Si#;1^vcriUSr
z!Z**xMFlSvL>_!GtBJ79_=1rQsE-0BMT<DAt;tnb5MqrqzkJ!;Ujv~c>Ex(#++oa1
zD29n_PKD3Z^W*tjM<2K5TjVoY*bx2<Zlwt$0PgpIHTfu~7@AS(-CO6(6VE{lX9vF^
zb2|ex&eLzXUaT8x%&|qScIRbu7r@Hz>YbmaW9!8Pa<5*thO3~QG7lJkr7QiAMy+bM
zKQ!3@TL83gSet@V{qe5^as+C$svx5orJvg84<N~Qk}los)I+|+^K%eEYhMiY()Us<
zZ+ff8yvDy+6Sl&DK5h~y0d+a1uMukCLt|;bi<pX~|KON~y_=Q=GJ%O@JBB};GD_|T
zfsx#HME)#<pn$>oW#1HFLbIw=xHgX9%F1iF3?h|X0=Niwww4md{f6Y?ai;w9ys&Sd
zK7k!xix!mob>IWMXvw&9$B(~;7o+m=b>GmWa=xSE4VJ?+cry>Hj8Eg7;E5Y*EW9D8
zD)guFBi&j0An3xYn;(;Cc|CupERj_HYd~NuYUs=YBd(HI-#dHu<2yDCn9xxdB7?yv
zI^H70p+dpX3&dIu<8suT{RVXK4^Ct7Xr1l8Hd3NLy83-xG*~WFKG-*u2*GU@LKyFd
z&83pPzabI7*eyeHPBvxI!&jqu@I(UWH1CM?CLRb?Pq5W6B*PX#4-JF?aom(OFT>fq
z$G-{UBlT(DL<;bvWqi>zqM$YpU{(p6r?%k2*Sh&KI^O>=P@)o{uA-0!Pp4jJiTw}q
zpSN&)7yaa2orq~q@*PY=zmf6=ocq9c#tI#uEe1eE|Jlfm;~dC|p#2+{+8Qk;PZN4h
ztIHMXvdV7=E8bG)Dd*Dhz#YukxuH6(5)zAvW)Ig$d(I?0EY8Hh+JOTGbl<|R%jcnH
zxD`_m7=@ZH2u9eED8qtLOnt<Q{Z@)Ng56WG{8$rEP3*+~ISq!qiOZKSfA`O0q8*PK
zyDXPpQc2$-LyDnu$DFi9UPBvYWImc^T%9>`^kj%?;>hVdBZ`b?&tAhhp||Ih=LEA}
zCMw0jCYo|9nz~-p{mnD+J6V|Ef%FW8!uJzG=p$Uvz3(;cJ@c5xRBS9(QJCQ#&t4kR
z_4ye*so1}{MXZ{d6OutiSPq$0qUD9!U!XNS?pfflAX`S~*+0KY1%AZkQJg|y6ESw8
zGl3d}`uL8cWEn~x3U18;+%w#`ge6GhP+qre)r#>oL4SGfgZMGnN;e5)=P)Ldw@J_D
zU<`!<&`ebD{OpxC^+Q3FkiNKqJ=$d<(>tYclv;EG0yKttv}E&;Fz9F`mGgs*OnP;4
z9sHe)L~cYojv5JN*0KK!8%2eMDfLe!X+K$3IJ9M~Cgs{3iJ+G<V%;nJmwBfO8s>{-
z=K<Hm;wfuX`mcd&Pct*eoBh??_2T5l&v!5I9Rbek2^WxuP)fb)9H(;$)nJFtozJG{
z(<a;cA)(DtA@qWlHazo$u0=9>&cmD-_7xzxax)HrIW7dB7;NPiC@d)nGY-KHZyC+x
zHzS}YX<hjGzqx&T8EgX%dL})GOP1{#pC|lZ{l+k*!v@3Hj592&<z2NsYT81IIuz??
zv1rkv)vGUT@Hum41;0>WvkhnrgSiy0&iyqt%P=o84c$y8B{mPwfAmnl$OVnPSiE4}
zg+RB2h(_WJAG}IRwEmyFB6_?;1&Hw&5U<(z%lt3jh7rWaXKzV4vAhmc4Q36_mqOc+
zu!Jg~W`dzO(CjOlF7AxeqDB#qi<7W~dK9%Ce!|3EdNMmc7;*Crd^JHAGa@6=7jaP6
z+uJAm-H_=${eRBFAHl_&>5Zdv@zTCv<U8ifLVjIv6N8{uD_tdpj`RS!cZZ@Np`Ezy
z5X@c%tVn$SCmfaS`oFl(*uQ8HePu}V1`mSI{Pt};k<f0$M$k_ebyLgmCz+YsNquOQ
zT*3lmbXqokKFMRTA^oX<7-aXQqT(dWmB1`;{I+#hKxs^=E`lAqI(phqA7}Ey(|iXW
z+KAB~N<M#ngX$Tff~%{P{6$9c?b4&iHcUW%rX#GkIn6Ak3JE2-zDP*;n7R3MdOo)D
zUpliV5j;TlEmqvwT$<WA^Qq*MMa7sAz80}TK)Z=GrIUGs?xL85=her>d|JEjU%%3g
zbA-Fz*vDA%&Y{6gO3qjv!MmNQudi7g4!Sanyfp1h%hs)HD1*GX#}?UO7GX|O7m`CV
z3^NQ$t}elo`zFbr2A8fZW-@fF<{TTEeR7SHjLwGtc~abgdxRHAfB|;&U?20(vy7Yd
z(6khbK)s7w_n+x48idTuerw+9R(S5MzuYMV`i>Y;0nK6>Ix^FWo0$ntxnvx2bw#%d
z0HHIV7Jy<#yMrrrb+f&cxUBKd99?v8Z%2yHiR@yH%{}w?1SCa^0gQ-;lHP&x7hGI4
z&vf9!MU;=URSR-+y^6A%B=#pOBG@BX5mSj*)@f#NylgNAj<~qgH)+;NrGv7hqe>=2
z56-oMi4bE@`RcUS$ctyW*K{ATiJUcTFl+;)BdA>sQgdWc6Un}HV?^{=%(wxwIQJ@c
zY)O9QQeXYnq0rU}{g5!Z_~H$kLxv+JJs&45lF6}#cTJ1lMUDRdb&rhIbS0g(j%0kQ
z)lFkE`QN4SI}lJ=S#h}4ZMHk0QtT-^06}P0R+d4UoD?P7_~Xn*q4tylo-S*SIz31}
z#pkr3{nR6s57?Z}X@qh!tV)0KMEKSs#(0>pUM8m#N(P>4+Uf|}jy@BoS@Jj0F@zdd
zS5+CdZ6-M-0GhDorT-!)H*?mk5ykcn4k$Z)agtm$93k#pK6YZ!Z$wS5k;0!-8F2$*
zVLd9}ECyZ+DuaHA_Or}nF}}?LnudLTbSa1yCucork{I%JYb^(BB%K6MAIF(n4HdxA
zm^5h;{{X^Y*iTowRXsybuce$^dcFgH6ItCZy|AyN!=9|d;0zJ{Mbe{(Pvekd>4Q+B
zo;#4RDH3qgL(AHL>K1g8wfX{CRH&Qih5+vJInpElkn62<`1us(tpfF4x?<PL>0k+k
zj*bp7MBE||J=(ORsLx3VS5{1?ud1i9=0sDSk*BLhb{Pwi#;Nl>B>Zl4%!iV0ffy=^
z4U0x{REc`9_XQO3IcBwRci%8hWq;_cu^MWlsZlvAJ1R03nsgc9T2l;Z#Ww>oiSg}&
z2S*gMyBv{}H>y}1qbE!dFmuMjUxE2;{YM-Se(nfx;AUXzF|ru$4Z;QYIXX0h(2p9n
zZ=#bmtzzAf>pxqTstq5@HTE4%49d6pV_Jz<m)IAv+IY?paUH}x!;A^N@wh1f4#$of
z6`T67`OZH(rAU@XnZ~8DGehpZkdX#H$JAc!E<2qMhlYj<%*ZW-fe0gzBdJA!anzjl
zJnB~LDn%^_KO}%sWs8i+sIEWHaCobq|L@VCIEA<}eC<n3K`y8o1}5S&F_v0^1z1*K
zCxc(;>e{LIOeq*_rF?vfRwlw!v1`{)1qFWFm(kGvK!Hl$!~Op8%{WQtl6;pgTT0(e
zB07^a=!G2rn%rduBVmN*Y2^9dO8@WzkA~P$2xhS<3|^k6;ZgmNx5at+>nEIcw4)&>
zR%{+Dv;}pH<H69F2b8Gx=pn_5!BCVaOF?Cr=BlbD-AF-IM*#phq#)-SJuX{9QM`tz
zM_E&c0C}btKD*^jU2|hN@n9@K3QrnQ%)ywPcG<`Sc;{-Jl%<@NMsGhZx33U2JYh40
z0-i5>gwa)kV*YjDOS0h*(Wx&&YrePxv1S;`ZFY(7>QUDuQ456zCNucdvlamjm0lR4
z+XfDX#2*<RzO_CR+Q?gF-h0lT?jAUN&<4)0@%7gvk3r}grUJYpUZGp^Gulj_SlcFT
z3OKBJ^Ui~e4FpcmmF?W)S0|3omUSO>uUOIwLLAty-wZPv`9m>#BgL#N%zPo!J1;6G
z22zr*puj+EmhqM#NsGOyh9wQs=eRMn`?x<ps;k!w_alO%1&b{&21)k!%4(&|BvUVW
z`Jt3HctN~;{d(o?qcT#;Q4f#xSbl{X#}GLn#gBjWW~zgK2CeYF@QmWz4Q<?8FWt<y
zn!p95jg6e#hH?EAAU;7lzqt6)+O?8LD1ygYv=22k^i{g|>UD_?Y-2JJSh4#={yo1S
zDj-3_KsjJWWg1!xU?W*)ZPwtr{+P4#_E7FJ#}0b%5`fm^o28^<^J|>?=OO{Vfx%Xm
z+u`1Xdnz{;lQ?mWG#i%*9wvlpAfzvBEkP|v9jXDPSGTd7*Md?6^=5yJ1PpJ&*Q<gn
zKd)%dQR^)jODmZ>{yK2&S`V>K1JK1@Xf&BCzi7$0p78os(9GAlLYFx|Fog(nrPCT`
zV!LmkB4#ed_D&l3uioe6h~@yVl4@%4%NLT432Qe5flU#X9=EZI_lLAmU<QM%(Y0b{
z29~|iOUSuky@~v5jxpX};kikY&bR*y=x|oR)M!1s!+oZr`X=s@dC?yz?BxR)H%>4Q
zAwI-YKpmSCZ3b(?rD4hDzGyRP=*M^O{>9k~rjR5jriECb5t4CgoD(DXvdYv;SLp;}
zDgFOC!VfKvICQx=0;2vb2NyBmb>8U93InP4ep<GQqt@$SI}q^-CRdc=8V9GHF%A*-
ziB?uY<Q&&6jq44M2{v)B`9@P=l*|~^L>V@k8Ugqw;>4mG)J`OHVbwu65tA+?lXw>w
zB+&AGe(sxbh-MZvqjB}Rm5j6fLk^r9iCfGvfIEU0;@c=zQlaqS#6y^{()<HE64vCO
z3Hupw1g5yPt#Ktd)a!aNrmfdGkAjn@dW8^9T!NmVngs<&78imB5rKkq`6;-QToJwK
z{)|Mk^AH&q9W(9{^$zgK*Vj1gIRk9N_)q*!fPuu117##Tx(ZvFYQV%lJs&mLiZnB3
zFd!*|GYW3q(t+_3e2}Gbqx#6TUIP;rpbtm$h+UhtYt}H&6^T73kfkg+p}7?02Q%3K
zIe4{W$<GZ5_yMsiD615&$A+&+zjE+1;F@q16d&(0(yg^**BL4MyIV31RU{f-%d|mD
zOaq>*qOo8JQ7K;DXPrjHV(%#lg_$f+y~OJhKiFw6DhD)+P-sKBZ4}HlCli6_0|pL^
zzq=OtVO?f)1s9%;_LHo7xb`eZIVVhH9ipi<F>3iqM6eHBEgHf8Jc049H+~<Likl*(
z00nj;vO$S2uGD9G`=oJNns#IN-nI}kO>%NVI7&OgLvceB*Bp*@nr0*r3#D?x5?c9i
z7>tUrQW)g5Q2dO?jj5T+F8mA&<yOr80*1G!#Cg?{d}t_`U$&S;M>!nU|Npnp4HJ**
z#D8*mdLVrZY-Mhx!MS`tkxlzaw5f;z5K{0vSNo|+mByIIks(QIR37NnY|;vIa}jJm
zT^&KBgu(&Rx&GDYYU|V;nU`6_*=A1XyokO2aV{01mNa)n$x8{2{_Luyu2iZ2|5KET
zgYVk^e;$In(H1uNKIIDA$Td6<_yPyAY5jw&xE49i_4P_FOO~8GdT8)&g^vm=l+O8H
zUADq=^zc?wRr1z$J>D)nq3an>--jNLHq1^MdeP(VzaHs5z3qo|Qq|vGSXKL_ZpYjB
z!q?dy-YaI>xs2Zyx3uJWg=75dOZFA9<_m2?zX5xo6;=~~U?_tk2DoZ3!v2XEifR|y
z5t+)OcjtfZM8Xn8$k1$Tf@kn1O(uW;Jzz{)b^e;!M5kMq_U-3I%UQ2nNx7!X#Q{;k
zJq5*#a@D@e*%V|EUMYkCEGWB-G9``zE~2BO=|w&H*JHpS=~n&icE2=_B<t8D>`Tc#
zh}cfBL;7IXZr$2+)6BuF+J5t9<Kf+<cl8+lICo32r9DcgilSSb`jkaVw+dC1m9r^2
z1owo&3|nl^Y?~2k90`Mh!#mxw;DuqQ3|Zk}rId*n;@6j>7Fc7Kn;R+U>RWZz+H=+c
zWiERAq3*EqQSROQoe*CS9qOp}cawJ!^7s~^$wjl*sVl1I{H(Z`p9_g#q7;&vOOA2>
z{>LA?YU4nnziQPg7EKoKh!hXZH)3PnY*g}P&r(xTs#&JQvf2nnDm!*ODyZdi=b*-V
z4;oaMJ6^?A^A48CD1zutqV9lDjSh_@q<rR|$S4?5^<A-IMYG9GB=fNjzlV#_o;}(?
z`<+sPA<oaR;%N*&ClMC7T?IKgfon%fIvW7C`^H)#1!G{0r6<dm8zRV}2?XBj(WA%w
z`SaPm1zFCA5;yhy+}m(sd<s4e##wx#d-tYH_(C@cLaiEAM+U+Hcw(kKau%2?^11m_
zjGP7;;xmn)U?p}C^i1cEQIOtkn%ejb{lU{l1!)@VcqR7mX*|O4X`wAm!rNrULbk6k
zWH0zv`_}%$2taDwT1W>LKtQmGRZv@($;4h_PYC`!ecW!K{GL1aUm<uy*Csku^tbe<
zH<e;{eEL0=3ISbMgtS4>n($oMUk&FQzAq{o59T5jsvd8Hkcjb|pcv6WM&k(c?d9(u
zHr964szm@RZv88oXBQW7bT74h_XynTLlz>(Ajbm;<>lt;eIRM^1+Q8B<jeyOBX!e-
zwX^xr?r+gD{`xA7);BPqRhdmQHz!p-^77@b{Hh%25ToFKctx&#*jxOAG^jYic~LLg
zlfuUdav>U8`^E+#R&Vw}X09<P67L*B9XA&am|ZQ{r*Vh*;*e-V`0}jOPPUgyw+8(7
z3*{4piG9ULmPN<edy7WM+|z&k{dX$ta{jw_0S!MLMH)6PNS0?i1@a(SctsQ81CMiW
zaIg&|3CzT3KrwBDi!{%utEphS==S`%ij;mBDVb)R{=jCE=ceZR|ABGol-MZA5GEuh
zbIXCx%x2C^0Rf`Xrm>&Cw3(Fa0a?T@O)9uITMN+~17E<8{O^}DGCGG5LzTU)uhVAv
zHx)6Rl{5<k9eg<WY*>6$D3Z#D|9RutWC56j=<Sho&OEEcrYmqsh=Y#g+JwOeTAP|c
zA~x~}C+8K8j*b957<UpwT0Wm1hynM(8zpp!cDy`82`eb;7!+8BF(ZFQvg*<(pr{mb
zHpwj+aB^JMoV+|aAtU5fs8(dYdhtR<QC<o-z?gL`YbB64>&jx!h=mg2m<yG@Medz1
zCZ_1hxlp{)EMSW46_@%tO4eRjQs%FcTs8L<{~lCDfw%;K`w6bl_H7Zq#Urqj<>lh{
zz?jz{@w1KrO0a3-3Aa*4blr=&5=e5C=xQhBZWUf2m_ZX$poFo#QC_U{ff^7(7|+Me
zm<(?8D0NH}I(Ga}P*BA>jHy$mtcoyIo&u4<^JE}uqD@*Lv7+I(3q-a~uKoD&V=HCk
zO_V`<NxFluT0R~C*n@s4h7FSMGjQO8loZj^*5BPk@*LeLh6SvpmYG9F#KWcwHg6S~
z!p)nG=dfWL7)jzg>$mtrQW@O4w*_|RkVLY>c!%^`paxXL&p88T;^K8@wpgC75`q{f
zMt~cBj{2^~=h034XE-TdS~UuwBP{?70}YP7%gb8{4{kxQe2I*zPvmV%4lCYK@<*A{
zX_~`_(@+n_Nsk-rE)UotN*)`v;h!`{RIHjcIt_D=O*``vOA;NOTSOi8c5K$HMsSOA
zYS{3cIi`|p{S_v+m>?348m(Hk6y8#4dr5<V?aaHfc0ztR!&zvESWsq2_zW-@I+y<V
z@2})AX28LLG;GlzMpX!#3<|iLtV9b7(+DNYnXu4|?k=Nf^2@=r*Rq;8HbY7L9l4aO
zGGGW{KDv)Uhdz>yuTG=LtiXn#z7?6c5@J%O*L^M5l|?7i<CKQnjBt@glc|#NPT-@t
z$qSoq;zuywDEB^Fo&%Rel1?~PE(`?(b(E1jr#JfU=3+$#GbGP1EJ%6%x|*6U&4P|S
zQA?O76%<@B4ECHQE2*sEd*>WNeG;v{=(0}!6e-z90CCQ@?jAzV*OIsFtXj&ym)xH;
z%DM~t5e``%N35i<fW`A3E?oM7BaHYXt3cu<&9&xR_NIoErCWB8i`up8zeUnJFB%RM
zQ(HD~?yQUd#85oH8ovFPYL(v)T{4e`_J<Jxw;KR@R8{q4mswc+OT_0^3ws_)DsenL
zm(XjhL|f)AzdC}x&Ot;1`WS=vVj4#bCqRG5vX$)srGCQ`n$q|Q2_qm_NEjV5XCaY6
zR~83D^rj$>BD_(kD;s{sCPFj*g}QrEF$BX;e*T!Yu4N$*m;Ahrx`LdixYK_iBdP3d
z6f|NL;0aJrZnU=-g9&ik?($4Yh-p)%lsF(*O9l`jZ>{N#U&xp-rVZ^a`U~#qlFE1C
zvq<k(`JTYopI@GF=qb4_ZyYF8;U6zzheWXg1J2#+<3<CM^IStc?lWYG=~e4lK~2Fe
z?V!EU#2Ch51R*CUXH_n_MnzRZ)CURcQJVNKaS{z`jHnDred(g;ndL{#J%D90vdgTj
zs1=v;k<@wVe17p@VrOGv8Oca_OJ&pRYx5a(=TqVl4N@721VXlbj~-%|W6%d8=%hvu
zUVjoge|nAtp6_%?XKr(){bB>v!M{6>qZi{So^53%$J)WbWHnZX^k9H^ZCA+ysTVP8
zW<<?!!lqqoFC5i#jmSF?vvs3MB78hUMRvg9h^oZ?LThVluC-cri)%<?p{3r$yS&ZH
z5@Ot4yPEmeb9v|m49<Y6+sw?*P{F6s&h{w)f<Qn;^!r;*Qd!7M*Xp%v2gkj}H3tp!
zj#b0`sC=0EKSeLSmxH~16(;G^4s=~+YkP@Mc56)$WLlciQ!*St;sQ_PM?Di(T!8LE
zOhd&gEE-TT5rU+!?!>Wx17JRgu6+L$%a$F+{x^eu8)GW&dF)4sj)`&M$qN~W{bA7S
zY(gY8F)-!GG{}bL?RwQzJYQ;NYMPv$mY$wFj_Q!i-s~A%>1+_O5lgWgIGt5@n@Y*2
z3Eq^jnJkbY*|8BK6tpfr245Nr(ItS}@S50&#fuXgC3fK|?#|*Mc&NW#N|K!`>3EVF
zPIjSdJ4h;P*<40#qq|24h+Pa?NS;b07uP!gUeUVAQP$GBdS@r|Mjre4^_WCI8x$lU
z4N(rJf$`Gqe<q3E8#M+e+)e%`3s?o(6<d$#wDB?lW-k~yDxFMXMF?_{OJBB!V2`S}
zd`WL9AeM!g#~Rcy<y^61h9Tlz>IKLYzW2PWWPHd$l2;(0X+|aQtglRUVK?JY1`e@l
z6L0JIB;*j8Y!Be|u@=jMv#K+R6NU6U>G5N@;S|^-dQc57OF_J>%K$UTuNb$Z@PaU_
zHCD#P&wxLGk4hpvXNW1h40z@VehljK#zc4H*fGX2)9&7#EPL3;2kX({pm;QTthE%o
z_HIpn%2r3v7VW3#%t+{%*zMKV9X>^cDM)j(PSBq~M*$Tp$R8*_9vuefUUX~ta-7E$
z8c2|_PKt~&5#piK-xJ?0hDx`3d?a~7-gVYxU@{08LX>j-3xX5Jqn#v6v9t=<g}{B@
znD#_wO_BNDRkBU^5ni822Xyz~!^;~k>{Sa~q4A2A7CWDyXJ*Q7r%z{tzc67{aTE3$
z+@-}9kKm}OCxNYcXPzYPM2FQ;mlRTOW!{FODe%cEO!BZU0)fBBCypmilKS<wO2_e7
zDcOyfghQFB7aGYWgIgI#U)I2&HJR2mtwMy0sql_ov+xmT=5Du<Le}?IQfa~&ptt!p
zdL@RZW7IFnFNakX(R?SFr_(4ahOP~jBQgr8WD2PwNUCJyeg`o*#?s;Cy?cR#>Y$T~
z(%eIghXOqBrl(&8-B70RJd=}>=79_N3YhZ#!-v}1S{g{B@gvKh<prui(=dU4Ev+Ch
z+jtRjvvh<mcOSo<Dz@DF`c9mbG{;18E!#<Ua4Zs2SMFc4#~wLxqGxcoNT@#o(2(`|
zAbuoh?((q5s<H1}WtuYk{yfa*W(`yj#tob#TUvt!*)me@TpIUqEocG?;E-~2BS3s?
z2@IOtQ2XrL%z5D~WdzS(Nh1ppm@c|cITx3DUbyzSak2c!hVXp_wyv)mgGop0J2#iC
zW)brUDQ@zd2>q2ZQtWCj^sO~>wkDa$E@KR-9VO#}S932X`oweexySB8x?PqZK4(JZ
zy{Atd2up?<p4TRdr9ew(J4-s1oA@Wv{*9<8reZ6rs~_CE2crG;G3!J>4e24jH&^)L
zlT~i=6c0UrCNLIt_f%B$5?SCV<bi(mW4iTI@&`)+bBLsFVg^Y}V2qIyht`Ng>$!#F
zpEe-EJ;GL006&5U39XZw!_w`0{{Gu%9~5k7Cu6d~Z2t+NPgYTSiCre!&T}OY;l3r}
zLn_nJ!5ncjd4XNBwEsQd{lx{d1{+a4^Cb6!TY*~>8Ix=>@whk;QWy(H1opJB2&lPp
zM*bfNe?A|>Ab-(_6;U(y0TFFbr_Wd01{~P9VZ-S4?_A~IQ#YnfxFNaP|HX-z`vRLB
zI)z3#r^yf4j(wUqUQ25u??#j@BXCo8szH%v2#H{lvlkGoGIaiPj)%BC1Zi4W)|Qs+
zDKJ~KXk3w@hzP&5v)Xp2=x$)2g{l&O^DAKFPGxf@l?jZ1C*s_86eC-ZArbQcC#|fT
zN}k#bo%*ywrf79ka@|pu?pbq>bURRh5BHZZUWoPeiId&6Z^Dq5O^f1qk<jXClTo|_
zDuq`KRo9$TmGFA+J0Cvg=cj)kFwsg0^YNALtvd0!{n$n9_UUcBOH$bRH+Z`Hr?r=K
zmX&Q*&?qK(LJGHP-I}3}|AO7jH5<g!){)`rn}u8Ity*=y_*^a(*HdP{@Js;a-CoNL
zQyo8ki5e`CC*h$gY0i9l^>atIl-_j`;X&aU;ao_r*N0C#qk4JXCBoe9-4BpM(TfNX
z{DX?WVU8g|*^uLI^y7R~R8&YvA!mbfR9#&i*R*+e+;UAoDPFk3*-;X8#Cu0k5j&sr
z<ZnFOgg}j{d+}LayFhG2kjJnl)7vpIo=Gp%TRao^J}-7ttE7^gg5Ga(8oxf#Lz#+V
z$k48xI%Uviu1sN|>5kI3jMI}_IF%~~TpKlZY~c>SKc|FbsCD>wP|WoO!}tC7i<xVY
zX61E3CY<1ULL^|7)Cxy9Way(icXZVVd;1sXG4)|M@6DRdh>RBr2hlr^9?i;9VTx!f
z1vJJGu?*)S2U08DC3YiAx5`JupOXGKA?K>6)gn$t^%KOAOXig5WG!X2nuu>-kNTh8
z_qwZ`RC@Lw5rhZwGQK|wqhdzU`}e_vP>AWEY|7#xN*5MKg&Q$+7?v2sRG!?!!2$I3
zN%W7Bk_aWLUZr-i5EUwlGLph(Pzw;ntJsgNgm8`6NUQ|)IBLs^59hfL`(E%llgG(@
zxf2w7zQb*f(3AV?HdkOfp-l8$boZb$Z=z(SiU`VETM1DA0ec&BlX0=;40wD2(RS<6
z1H*k<UWKELA;mrRQFM@fysYWDmd11DU7s(4J-crARtUx@N=PVto5>Rxlo}tbQggV^
z5h8`GvKrqH+}dYg*B(8@We8HNoHcSw@#3JqlItC@^)9X8<_HK*cx|LH?6q3O7_{1&
z2JOITpX0}4pl?fVRu_}$%Pgq)(NN@;l-R9UaR!*eLS%AdA+zZI{u*K!+rre;4}_R@
z;zv4#*-tINY3@h+h7W9pMOVTh#TZ&&oD)*082U`R(IAulKrfoJ8kDhG&RJy+-px<F
zUgKHROt+~tcN{e?-7ZvaEn2h)x+<RYtsZ@dMG($3z{TFQaf_(<semi1s{BBz$J+2`
zqN#jir`zw?adUA~$u)deLzbgOu@1_LD+ZJjqvyHP%!sN$NM&{PB2X|Qz^CJ_00@R(
zoc)aqO@)Tw<k*23yg9X`yuE;^3c7l_vh(Ms1IEX1+VK<T8$p8kPa7hsTm@ji;YqS~
z9ENw$$p$o()e~i-P*L$Jc|_x0P`^OWvWRLf3watot^0ytL;70|lp7>(ey!odh6(T^
zsR%4y`U+Kf`S<VsJT)Nn4qDn|OT7<NdSF)*ID7yVrz|(?8T>1}k+K^a2q?<sQSNZS
z`BbJxOF7RkUseX6V*mugO-`9<Y8C*W8Z!|{OtoYfN0z{&Y@FR9>DEmA_;IGQqv~v+
z5r6&~Dpa*N+ldW>#>U>m|1k{4117tq<SjFbg0z)%{uU*5_YwN}0F!sBtvxA)RGLv6
zUkeZKplg63&%lAxyNlhl94L2r(V8bNh<<y?%d3<^f%HVlq4K(7yAWB_b>TzWgsfwR
zRHEGqTLq25yVX&}+<U{OO;ie5BtUTAiWMKIlzBdz(Zv4zL$nk|edDHR|A{OWRaIws
zc^Y(=9r6t!U2L4mWZe&b<i}5>qefkkQwg_(Xi$u&sAxz5Cs4Z-@ZcD37Noi(tAF@q
zmH-)`rcpO!Ly6?#7_o*O=ztg@l4y97{Nimyw?yUczyFH;cDj2&vp$wP$RF_O0q5rB
zUrn8WOJ35WM+f)rWkKT!CZ^<d8{C&uA3RtIp~=tNh7&Qv5!`XM0MC7wu^C=Nbq<eq
z-!@s0fX!^1I74oPhPsN|&=DillT?wwU3b`rW1QZ{l<!eF=Oju0B!n%oiDi5f>wbLb
zFd@5P4p+aJw2dC22GM>{YU~lhIGc{sF!aK(lXN8oIFKRM0L-Z!FhV%w<+XsD%XfhQ
zYTc&Zr5c3vkjW(obVyWwr&3P3kd!b)>+S6wbWA8d`4(JBF}Vv<svkszwdWTDEf(kJ
zS6+<&^QT6dJ_XBBi@8xmQ<MZ8@17VFLB{GCi_sa+JerK$9WVeOY3ujQEmZCwv$H9S
z>MnK>n~XWk2*ZbuAD{W`*|&*QQa})@&%w2d#(%?*kylxeS4S->G(gNy5i^+G_{j_K
zzR!OCsKECJIb$2oZ}eW!8lOK4pAza5n9K<kL%foMPSWRx;~LEr7O0qtc9wxb&z?O6
zfkF;}Sa`)6%N#XWrw9TjIe=f3GM|6D0QdoKLkY#tFxhMS2Q}^N{m-8vcnY$6&;NR{
zdPtI1!SHOV4`r2*STaIE8FcR4AjLNK%b2sgxs>xTpW8t8UP&W)qE)g29hyv+L&%UF
z=t=?z^v^Y=K#B{G-vtbaxnaAHCQ#vHm`YXqSKymX=a2y;?M8jGZ`)$0>SJvc$0&?q
z%S-f~zcnd}fF?XO1>e)8F4{7XFK3=OQ{GQ~ykYa^o3yBc-wZ!EO^b3uAha!o?D8gR
z%lR+L8Mu*&mGL|l?CuBKt76lS2=i0wQGfq>QU5Pmq~LRo!4+sbb?1NJ{<D*)J0GQ{
zDvh?cJUo*`u1fH^(GNf*+qyN|RW*j}mH!7oPgi+x+1K}FpW>Zs@p4hsATt157A)Qt
zLLd~$GA&52*Tfyr>!F6h`^;`9CZ2~pAo*<VJbHVT1C0IGd!Go(_yKKvdnHfjdt1rV
zY>v}(0usyLLm*oa{oq2g5$Kkcm9^E}ts%sX^T&9CDF@Ki<Kx;I;I`ic9|uE!w}bXA
z?vR};!IuXbim?XzNHK_owelO~tz|iSTefUbzDF=-o#9XjKJJ;QlZgOu`r5;WwbzBo
z{#y8)d{)wIh2_eX;9%N-6<kTmO7Q3emN+-)B&+CUVy=D3FqpO|N)+Ugrbl+CuNv;}
zT$aQiM*+N@JIZ0DHYBa-`S-2@Gr}se#WCha`ql7oB=cH)25Q-E-MY<U5*}p(7z}qH
zUIMW9oV-{}Nf(QqFY8){i6M2Wf@%zkj({k<yf#4_BNd+^&JDl8!Z&*fM}8BwZzVso
z-uBBE%vxqlo0b3vKq7&r&pbb`ukt<kRv5gE4E}Z4r8<>DpqL-U0F<NS59Abq7LYF9
zRU7b3<sk!LZuUu4_nL_rp>S3~7Dk3;;t;OSf1J~ilP866nkZyyVv_suqZqThVZ2uP
z9?0tniHQQUr7}|u;T&9kC-}6b%)}AX*_7Eyw}!YRN`3<a=i9HFNw?BfGwb%}J&0M!
z5tw_n1|Ak6Qxp~)X_HD@zi4QZImQ7xr%#yzk3H?X-FP;?Lb9TUFdCx>8~L$Q{Rn4j
zma=xw_$3Sc2ge0|EGRI|dD7)=wXu(BsQ1}8$_zp7)f9vj+lCYJ=@+~KJpVbGc5B%Q
z<{t{<qt6{#I*)M;P_f3iWfZJsAJ5XfbUM8MQ<j*+rcP9Np}Qy~gVwrm>pOLw>(j^Q
zNQvv=!%t{Vwwfcjj@+qm=KB`skQvJ`_527|6H@vyxU6Zg(S`S$+k0#KsbAg@?mSf(
zEDd1vqyoS(b%<f_IjY6m3t6^9^zV`tqm7Q2d2v6w$s6gp_-wF&k@6l0B^h7pMq6{{
zwnBnfCnt4^Df$dPodsqBi^v)LU{;ZdumQ7#k^7+P!Lrd?q<}ZeOB&i!K`<5N^v)gV
z+>dEM#<71=SJ3to@aWAOxc<RyZdN=qV^S5;6(b%KBBU3@|E<Cl{6HZ&3~LD~pL{D(
z!J)5_Q-<KHRXb7}MoGd=>Aa(26Xl`(c-|nKf?iBqfe4i&wL9r1Dte@@q<Uv^=c*As
z;XHbh?s=`d4!xC{I_CoJ95+xZ)vjT!l@qG%w2#5jd;*#?gSMDeRaSDyI#1X_P&FLS
zz3ubepq8l{;{1>d+!Yd&lhgcH(zSxtDsyQUPEjz!-8iHchl#Hj|0RKBmh3O?BsQ(E
zWn6Yc^|y7Evu|pO{PO%##O2E>L-Ae2cSSS!Cb5bJtofT(8um7nc}Ms0UQNx+x}2Iz
zufD$Sd;I<J*Nj6dN=qBGPj|33=Gdj3eH=~s5CMV-#<|WBG`S&!6}M`Q2zZqkax#-9
zfIFmuh)eplLC)+*cBA~JTV+2HZ0tCJgj(i(i5QZR>2%GNoW}PPO%o;dKZoeE@PI!6
zg|9X)iz}TuEn(T+U7b#$HiMko9?a2+U)paP<bn~TT2khDcjC{ith&u)xT@#OOqR0s
zu;4T_Q5Rc9?{d<iGn?zC4q0wt(OU^s#1X%96*%-%;h-k>w>ElAfTtmL$$H}lp<6n4
zV=^N^q987SnJ$=PSOA{h|9Zk*>cSm^ggY&-&Lrnrm#Ax0X?jzUlyBIt@N%O1%j@gR
z*coWluE$7&I&+10+)O6ngHg?2p|G}{BuVBy8};X`#1c#(4OQ|ma`Uxo!$l*mfU#1@
zQs&G*uoQznpu;o-FY>fUh7bMW-*(^o>#$4_;HfjiO^SzXAHfjKJjWEny$HjM&Sw<x
z2s@2FM|Lq3N{qb6>%l}w`DSk7a#h6EpQA;Aj@+XFT(~6Gab9XTHntum&dbCtEo8)N
z>i2&URcvCBPA~$_ok(#u>~|=9HtP~Qzbf3?>wd})@qRr9OktYiMo$KD+c^yr*?F{N
zf*o(q{*=creIf6>b4Yo4x!iY^_#Z(@>)s>RD|4CAj5W;22hme2Oi<|DdBAgom>C@>
z+cud!W5&PfdhMiJ`vn{E>nor&x_St4;ptAZovoStf_>eFjvU!*oa1`#FsMBX)E}hP
zgaR9s;C=iXV@u=>Bge;ZR>*eOu3jyiyA~dw{gkkOV=~atFdOSj6el?+=oinRNKV+e
z@(18Q*VOis`k`XC^XFB@Yl)e>yjA?rT#?VfB6Xq*b%`y|XI8eyavcG7!|69SKXobz
z6~KK(ROTN0$TI~dlO|SX&L_V``;@oxtT6^<<cxmy+{MPe#13wfi^imJ2sB2AOD7<_
zJ9g{~Bc4!IU!ETK5K*X4sWNw?ZKGziXG@R?1~-!cc4$RuN)Ozm{^Ip(_!Qz*A?juj
zx#5_;V1kRNsAf*3TfrI{Bgen44HSH1#oFqsBRG#LY(b7Ranm92i4lBA-s6Cn)4{QF
zYd1Iy{PZ?wLGgZdLyGI%Z||YCIn?8qHmt%`1K>DgurywaKx_Pl)`gZ+`|*PU&z`L#
z3iJMimKQ$;o>BfWMm>hB(-YfzG-J^GApK6`r;Dr}b!h+oLH3XLFMdTF&29c2EU=yC
z7%aqULISO6J~d~h!V+steQWEpMq|g0?a{q^f$v}!dY7QEr&=B1j2iVPUGE5ADgGMV
zG<P<sY@`J*K@=E-X?!%+WR3*TmTGcpL#dDr6<MAhpjZl9!*P-yGb=jmNNmU_xyPz$
zpri%&`IpCrtM~6eb;5mOX1!l@M~69s4YGV9M+wPBA-6K>=9ZFEi??mvS`hUI4Y$|s
zPV|+>w_CYv*}ON(PHVE?f4j(ygyp59*&X3IjgU*2OuoC_bi86}YUKBIV8MMc2DSBV
zKE-F;&s;gWK+fFHG?WEW)huhx8Oz@m>QO=fpHUd+rlyA7xU@90q=E)Rg-e(qzUMrv
zk83WyYu2dM9MHN!?K%M=X_qcOzyW3uW;B3B{u$Q-KtFpVlVUE)NUlD~w{A6LADm^t
zV!_)Sc=!-{#B?#}+9BW5hu+}xIkmM@w&=1~^^|Yb_hIUnJ#Cw3R{4G^Y3}{K!;ZEb
zQ2#NTE`05=gc6%4+lfJ(lP5znupIjFrZB#D)27?U>+<{Q1uymkC_ph>;-_`!kalUw
z*i5tSoJJb4^iJ8rbEDK{s7C&_HqtFQ!Hxa;dbc3u;ltK)a%&LSQbka31{K{NtgcRD
z1if}7p3?lTya5LTiEca@At`3JIEZDA=H^+P`hE(peq2BBZ)T4Xg9gp4x6EugCsQRd
zXQqj%X=mS+ROPQalz;u|e0bb_;m9P`%Zd<p7y2(QE{><KT5`-Rq0<)ssWwafSh$9K
zio1tVfN*c5QpvxbT?gzDox4}gR?%+@39?=_+pvDm&6^=B>9lP0Zb}R8J$L}D&LH)s
zrk04#rv(Jg$Hym+A3G+z2~pCj9A~W5K82zax8e&_0o#}m3C4=FkgP+u5MNo(ncu@7
zqEw$#znn7^Xalf2GRKL+yl%v%NR5cd$md$+!3SfbXVTSAj<7wIm(?ReLER*L$|d>)
z=H}@|K=^&t)}YeD(evs<hZIlP@3Ywk;T8plD2_p%*b&Ccl|kviPn%`>S{3n9T-~6m
zeto$vR30$kWBQzlg6Tj}PAw348-kfFc3&tSA+ZQ4^F|W4Jhnt~4d~u^t+r8m1CMhI
zBFx*shScm;NE!0U|6)wuDiG<{hb+a)*f^X9otD=83-s)OROXha5JJ{Eng0o-)^mq2
z!Ra?-?Xf=j@fr4EI8{QfMejEM7KE%1qY~OvCcR!>UbeH?jTS-T>$f-`_QmD)sTNni
zXCpY`xEBdP2aH2#$&njD<EjmP`{m0u8BD^p^w_bkluVha;B%=JZ`$k4vnc+Lij*>e
zDgF?n3s6d`$7h+~weja-f4V2)XdzTe(<-m2EZ=&F2%an&a7!2W%Cwo9wraRtTm@F6
z{Iy+mzNvY@-m;rln~glAu5<hG6K-Yx=nLE05oFb$2W_%}+q|S7#PX^kwtpe!<dg<g
zk@BK<KV7|vR}^SkwbU@RX-j2qBxbbk)iNl6zoz~ny_?!dnNVtoY++#U-T`EHUM+p9
zGz-oObt`rVOgEQq$#R<h(hX*1C|i=%)z^_b(h?$RfkPe~`X@@^8FgrshJd=fl>3ij
zdDvWwplCuoLG}67&s3QeJu`7|Tg;ufabp}G?MP&zdKxhd!rEOP2J4AdQIzlT<7hZ%
zR#2-l!LdQhj#Hx9#Pc4Mz}KGaE{_4Ctj3$)Db_)wh?3*U#%t8thLk4r-g%&fUTjCT
zRDVWPM!K@xe{Jo^bJLng@1h#rt+~leUjv%}nB2hr-_H(T^K316nOd6-S;9_GoJN&H
z*ela(GJ>+js~(XSPGD0fd$k1cd+x&&Q#|+^HlX(>t0N2%VYaSabBaZKYHAk}C&M#{
zCGCOHP>Jq6R_2aF4EOBlz=;!a!^_u|ojiFm1YWJvDKmn8(0gj(`$eUGUS7y+ANwf0
z3#NM9U+61tG66j373Bo1d-U{~U(zrG2+LcA3ehN*rDo0AVwjcu=oxKluKyt0!*IVn
z$8R-~9mdgwv=~1Em%r45jV@yv%HpfY5xIcF?XpBA2=$^XOYsCx3PhwQo|cl5!rGSn
zV~~_e5Or{L!NT{Ns183H5)u*~oZN&;%1JJbaTUx?6i!_wlrk2iSHY+$t+tCUkNDvX
zSbQcQHA|q_LTLpT8K{AE9zC_dfvJSgYW5*?GDidDLbOJ;+(p*_8iF@cRX#3K#O4YD
zXnI;&D}#Sm4Tl7XqCB42s?-Q30LB^;vsnTqc5dw{rV#158CmG6n!kcq349bNw}0Qh
zR}_Foe|H`B&#ie_Q`u&YnK^T&@)T23Q@Z?Gnwpd?kOk0V_#}S*jDLc^UkhMDBQ?#f
z{n$yJ(zX-31SYcQmZvjgCpYt%r|NvV)v$4*0v$vUmOS5p^O!ZN32GQzG9EhT<rVsx
z0!PUn{wY>~)wq|C0Hen5Pb>BftISX>y!!F%^=qM?oU;VAmWq~EIRxMw=8l}5orSZY
zelo-&{J0a77dEpkEG%f5e$7ile9ih3dL0ykb<pLUM)BAor4dn?vCKgJPDaKiYMG!-
zO0AeK-t%U)Gb99sM;(6;%I{%H3XcOZ`e*VN1Z5}ZzR%bXins11ejp+mgkh=!2j+ng
zDHJ&+%tLq3rQ-;FLA8DQ*506P{|{GZ9#?bvzVTxQlRcCrYuVC@WGO1gUY1G=sVpN)
zAtEhG%}m*&DA7=%qYYUiCCZW|YbjYOp-@ODlGN}0oXpJk^*eujUtcDtbDq!h+|PYq
z*L7d_GM<U(yQJ1Yb4?0HatDw!8ryY*?6VK&D5y5k2v)UM*~w@u9G-;NQS7rZ+O}&)
zz2LlV-4_5OP9tfW0CQs*<n#C6oOyJG3A%3Q$z=_+9p~oiZkDTInz)Eemz%WI*DVp4
zN~j!qOh3+~99KYWK0#4N#&9r2vJ-G3Ii`5Vs!M~4PD&4z?%joTSK}hDq(U_~bC)wu
z_`2mEp0S7*Z4#M2@M2at{kwcy&6P92i(^Iu`{$j`1AUD8aF?W)6Mr{5JK<ayI}X2{
znxl%!$^&NZ*t!+l{^dl(ZT8uhFRKk7ULEiC>RwdRpq(T!V6Mcpxg`Qqsz@~^YKI+Z
z2WxU~c+s=3$kSqMO4PtR0I6_KI#zX%dk!X_Q!%!~a4hY2`Ryc3wN9en5QEhv%a_}i
z*0C{gOUcr%{WF~TpQ4d=?HhBB!q@_J-&jP4)%H(lUqSE@vm}JL{TiZTK!&aEajh})
zp#Lr{>Cx<;yLrrM-W=_afS`p`o8F{%4`O%H@<Y^D#sEd)ScqIjc##V0-I>peOm68x
zoqK&+MCwN43ljq0lA92GI!mp{S-I#adugl>9igs$kl;t>4msQgA#v7mpl}94fiVP5
zdyTLYAwpEd5<n2kNd6U0TSlB}W8-Jshgn%N2pz7XnGP{lX!wZ-?F3Z>Hb%ps80cMk
zvol`Tq@RL8yna0vKoigUJDO80_v>D)g@V-{GscHb15S*onc3+xXI3EO=j?+*I*Y`6
zi|&SHTus8ynp}rB>8-3>10wV+-AfNF9)6GRF20WlsZ6Svl`%{FG^L)nzX*2lpTJ*G
z?avAe1;I;E3|jjPK>zlPd}yEX;JsmY{a<t7jDv)+=1E$xi1eDhgrGe0?Gi*l#sEBu
zFSvR+5>^HR*sbzr)M2G?Ptcm<hMR`heL5Ei5vY(+s+kYzL7mpJL8W0a!({iQ=mu@w
z%EW}jhgSP{z5H1jeE8jeN>Xz*b_oU;0#u;V98-JO@B^b?H^Ax>g@hnMyfQWar!U6e
z2wIUt;eZkV9AZqIO`_mCpvO>RkT=gq&?sK%3;(CWRC-SUq0eYGoSL8pYah;arR`-A
z=;^;7c}VeN+E1=@?urQFfBtEGANVUedfK*c&*;Ngo5Zl|f9t!902tzm=k}&e00ojB
zsNGh|J~=0T>&A`XtwO5}L0+|0-0DtQTtnQL_-O}IgItIfv&+w5KvHhs^l42-Q%e1X
z430iota@(z1yh5)IEP!z9(2p$uAhu@OQr@^{<yy+I;wv70AmaSvs<OPHVd7Cs)OtU
z0GSAOfTK+1Nq)taKTqZ{@$SwoTOOymyWlMgh%5yD41)&W9t7|j7%m{{%FU)Sw*Bdp
z6hGJ><8P(A*)2CW(bzeZbEG-}xQsk&j(r|`{0CVe*dVop@Im-I?{i{}nCHwqA979)
z^RHLl@nOGX|Aym6Gj43Mr!Ebta${mAds6<{vmbFHxN1u;al_&|%!ccbLPjGtPFYY`
zSeO+)3MP;Ht53vxa}J#<e_VpJo*KxJrvXK?LyL6vZ_7+Kyg<_4nFr;WM%nJm<Oq>o
z3~3;x+0k8ZAOo#DhHysMmw-ZPe~E3pd-nrYh46OFFfu&cgH5K^XDy+WI0~#e2L!A7
z<}l6(cR42z?z5b9i$mQeN=z#ulbfS}W9Da-GsUzK!R8Hv!k}iNJOG**F=U9M6nV^S
z8VDp~{^G*sc=94M{#yRv`jsm$87O6*m~Z-8Fi{d;k+FjrHF*wt-OtQqPODK>P0jlU
zu^k$ZH<Og)3x8-UMla6!`M}HGyop16nW;JHtG0hEP(<CxXFmM`;%F<_Is3}}ZU1Ni
zcFqLWfjXnl>>M8tV1xrwF#|UN64-A<2WAX<*L<q3PCjvB6x1@(1|(7ZjPS6g%D%i)
z3~3SLO%j@}%T)A(&>uhr{h2?B{=q;=MFsNV0oW(<B_W8+R3k@YAv#LwiV$^d@`tNt
z$@IL6wvVeEzBa?vf0a}jn9iIjxC8zI3x~Qd?+r-;$@Ai@G-PW;$j@wCO;{(RWDEws
zY+`RHZH6pH4p|`OL5Xm0GTN3cVQ6@soZ{TMQL@v~c^Fo47h9XgN=zS9<OL{F{3YeI
zTp;nc6uFWwkeS+<VtUOMfK9=4=L$-5486%bRUG+kJvPu`nCA^h@`$k@%T92P;S1iP
z7hz|j_-nIYO$>4(h}An0t<m>=BN2c|heKi>$CdniYXxC;OVrnyb7~PkA|lemV}Dnw
zk@dpnca+jRk5OBE^~x(|jP=!3{*eB8$Em3t6lDg$BC%Hp!LpR&2#kYtd*;lUcqpiO
zB#AKWZ#y+HA8%b_Ev@CO4S>ccF_)b#b?WQ>zTMF9nA-qW(DA>D>xaQ@pi4r^+L7b$
z0Xlx^x2M0Dq%MkHOY4L!qv}an0~G;($=O2Yx;ioCiwK<4YYwxK6)zVS3d%n1B?POx
zheuZ_4XPg?v<7&srT1FsuZ1w9>?7g_G-9e(DL7-!_MS@03QjGrU-={&<rDX`Bek(y
z0M^Bhm6&GX6$+68WlTeyYLGohDy$c%o-;QL_!xmt&=S;cK4LUDy<@x$m3tbtBJnj3
z*}{1HpbVxAhba=m1M^AAOLL?eV1=<lkh~-P``-FclxoJ5#pXx(^l}T-p~y$)&V8!(
z`pvp+xUx=(s{e!;ET6W^-p7pVj(@~_^H#s!IRD&{CXC(~V20SOr(0hPxcBlQH$@EB
zRZ8Z8mqjO|fIms73>%Wb@lF2%zNn0QiJ~iTCL_AVUZJj#=?aVs%M-*d-1TB+h4(y%
zX7uAk4*h)+Jx@kh^nlym`+MZf;uW?9>=`@|yLIWZjwr}KsCkp~JF8EI3ZT-Vb!+S$
z2?zJcaLqpS1|Xk3aNs~>sQ{uvmdG(+s|9V}9y4ByWz%=Dp<ahX=}k-lymLA%0*(40
zF><O&IRWv)(3Ej1M==D#GgjoV)WEP80;Q2CRiRum%Yv(v>ua}c-yXUZ(qDdwRdm<r
zMWYV1`-u2A>?+g`#}0`k)F&BE(2}FHrBh29zyGwNA!4?N@Ezj_i}rth58laKy`CI;
z^2^q$XoeqgS#>&|bd*GrO&gub)%Tlw#xyfCO`nC_5KL0y+}I@cqE~0_^HZRD*b$~`
z8qm&k?;du>)@f^CTSgJhsO*JGC+#H{lmYxW*Bf`1>U+(4E-5TCp0J&%nsfJq;ljN<
zx_<rjXr1m7^Y-jc4iYb!Oa__g%93)dsghs#`5l_Rf7D6t6e>8>a>5%l*Gt5v^ku|s
zRD^qkj)}&W-d6EeYy;LP8Q(yck2A1)%#MXGg+)bJfI+C{$dR@iHW^DoJCZaK6S|1`
zSO@~_%13dmgD$u>Q!;bjtv_s-_v-^5ro-kHAAET8W_*<e;JcVLRSS7#+N}gOC~Rv=
zvA3B=VP<AuE;gAZy}oAOOJ+n2A3SnoL2j-a&VU2#?N=kow`io{XReAEP!YNVkhWru
z>X0F;ps+zJ90`-e1Pa_QmFGXO9<!bIhhZ>|+L{9+MvK6Y?O}2$Ivwak)}3hD#qkRP
zgUjz5g|h6zrjeja6u@|mEQbEGoac^}M0`;TiAgH6%ig|y+k>7~;3lT7W!M5HG;+Pu
z(IC*GWQUc1coeaas0&lQJ})*gF(Cq=cqtQ2ie`9afmHD^zf>0e{ctX8IgIpb+4rYB
ze6Oc{CF+JEj{8bo5!<wF_gK<VlHDt^u9*_rc}E3=RI@M7>x|J`%pqvaz?~{8DlmPd
zzQ(wX2Q({na3J>2EivaaZ))2e*Y0f8nH(%wXa!Y~+o0d;q;p)%_W?1VoB)g<I|P3;
zApI#!2aJ3ja4Hv;W(QOqRvxxb5Yb>rGEO0f1X~CLitb4jXevYrF8BnZ8{3EK<Dmmz
z^_B2QS7dIm@cGIuCwh05VlD3u0z+aASO9AyFvW*{8bm9KozO)CB_%<x$=^SSmmklU
z-|+*)2oO<OilPC%4X+*aFUqY;FOb!|TP${I$s9Zr$#(R(F8H!(uCtQhFEDG5ii#4l
z<c}=BUUws(T5h-iMM1G4j>uh2-*>H0F5+|3F?%50OhTPJQDm}?f9rf(VzOlMV$(pB
zP9dFRR(nPC1}g$~C<Yu2ROHf{*pR^Z*+M>fOl&ObdMkw-90N&x!iQA!D1mOIP3-=P
z3(8WMOhMdcmiT?qZ^R`yKy+?V_Pf13rbsjPJC3a@xjj-lAi$U(e>qWggl;8Ie9Db;
zIA^$X-V~LPCxIASLh{o?RRu%Vn-J1}S(|r`Z6*GSheQ=d@vfk-IVh-IhYn)Y00Apd
zvAn#TlofSn5P~miEE+8ek4*1T)Mt^{k>)W%Jxd)#*vjzwd}Peh<;x3++g$174daAh
ztK=I~?rBN%rb^sOJ&oyO{bWsvx!~G~UxA9kHv-)<Ybj|>Gq6dHo10tAq0*?G!QtV9
zl-<5AX_hPW#dgQensm4WwL`w4p3g!W`8A|h$3GzB=X%$4oBWjQ=pHFD?s>W4KpSN%
z)~ADUcj=w?V*|ka6a`^wA~fxLnKIvl8POb&Wjl1hB;$t+8FC^ydD_gG<kPz+mD(&X
zf2l`>n@{W9t_k`hM(Es3E^uIdqn2$TE9Uz(Op7HoF>MUcOy%SmJ*cOlf#lxk!C*>h
zzlVM^-I7dqthaV6Ox(4;#n*~`z>s1MQBD$JgmNB1cU{%<@v0M?ot?S1c|iey>hmg1
z*({dUf7-w43rCPN@slT!2GI>v&Kpsdb)z;&7ixFFOCZN%HiiI|MlKyq9uGxhgmg2Y
z8zDA#4iQ1VtffX~@omobzkTP9Ov;|?YiKw(!p8G^8m!(g=i|8C5%ju{o>B|zR(7Pz
zS`Uo@@eFYddo(p*wAso`|7N)ZebSg@2KI13?e((@>pl3p7A^CgYq+1y#?IxIp~yV8
zM9L|%wA>{>yj7rd*4*My?c7{Sqhg*8*3AF3*&glD1UWnWqkHz>pvhw&_@w5fmWqzo
zqdPwxMJf<kqw3@98&zX*&UV1{3mT&<t#4lVbA3(EJm;FpLJTmu&ktyNRI{R=jD8Q<
zcofk*G~)3(ayp^0CvUm<r@Xe!zR2E%nix82R4u^9r|3Wa5cOQi+qX~2X+&=mKW47M
zFXZ3(f!=cY32h!7?xNw#1Zd9(2wu9Gq?w~Kjmt>l1kfJ6l<!KC&pk@xwOgy1CzF#y
zw{G9QU2V`9ST~Od#v$1WUQ@ItIPts@F~fAc_;Nq2yNZhG8pqt@DZH=Qv}syH_C`iJ
z7S;>Ya_m*<=J4uHeuVn!nZfJYDH#OiwIKLyIixc=Wu#r&1r`uBknx&@5=rF1kt3-Y
zE^rP+v?hD3JV-#E^7L7S*IWTT_<!n0;;N<f4#+B}$S@O}j{*;|I0RGnM9=~m{t49?
zjXyr%^%$r~VP`-UI;(M`f<!lL(&3OVrCr3#2tnE$P>@8orFd3K#NdW<&lE}C)Tt+_
zfGg^$C#DJ?$u@mR#ls!JVN*z|&lB4(niq!87sSGb3u#-Q*4ijMFDU_Gvz~vVYEp)b
zUQB6YbFV17qMc743|L`-ox-QW?%b%NS7X=h<TGcqJ47`P-LvP*w9oD--E|I%<{wNX
z=G^lhc%h-sdXL_U*54X@>wB+juC#i*g@ygESuM<_C%3i#-P~$O*Hz;(wTFi5S{<1^
zv&G_paox|gbZ*sPFA19MHa<^jXxGAyh2tk=1-ZZa_Okxs=c>5wH{8shC1u<#d~NjA
zXH-x3{i&}E#%~P$`rEgH#E*0KC!Ts~AJ*%2!n=g$_F=X>O@w2l_Ofg5Rp<y413qZa
z5nUZ`qO8O*P6`IWMKw`F?Nm>}Km4!OftQ=s9|K?OYHeTY&m_u0N}y6GBS=9I>CPj)
ze(Re=JtqbPC@fg9f{D?dsV{LL$3@BCj|rU_=!8@!SX$=t#2Vc%az!PtMxMRot8-<;
zk$pCw$%zl!e{R>dt@Dg_C%KAu?3l57^+(Qjl;JpyT`QUTU}l^}Vj20q=DR(c%)5Mv
zSD@9E1CL3J9S_|;ZjWVs!ok}+)>yA=`pype`xA#55LuYjgtGyAzI-*{u*{NqhXzaU
z_wCiI;hxBxO|V|lLMzT~EprWB;Ot!S>eUD$6LGdXDs2CRBZ-NS_;s8;Bq;(%kGB$?
zua)MKVsr9KQl?ZzDLL)%;h{5!N=l|*%V;KP2%+hO>r68ME&Yl)39j(o%N7Y7>aYkL
z=WX>Ku^`!Zw!F^G&ll{ho!t`%0OG`~AHP6!P+AWPKrZr@FAc^IG@3o^w2H<}@qA$O
zgsO$zN#M{PyK?^g5)ufxHJoCDye*|~0092x9XptvB2MYpm2}%-&OzNP;GQrvOIEQ0
zUc7ZnQ%g%rSNGnXJ1aPj>46H-b;`=hLEZHx)y*j3_aX=_o6%en+&Mo*(qO?=;$Ux2
z;)`syPxtQh0)NR1;4F|FGZt=22Oi$W_PrPhFEor)vKgFl*^=YPYZO>kaYCKHcPw57
z+B4P64C(Ph@>YD`%|0*`GHUBKrfo*dduFzjkPJbrv1<r(Mqz1l#Xu2fB+5yfuy*z#
z*O8*x{w%iWyw^C1n$J>u_u<36vfm`b_|=odXf7)&G?f^&ZAVXz19t(<7+G0ac&%K6
zHk3%5cOW0d4{RMJ12;uZ+lak;w^O5X?NeFp8VWuYoW<P>vjQ+enlqfAVs1)m=VqQS
zu@8JpXM-?T)r=4C&hwtc4(~dLh8-vpa`^YppRc9{5^6S&LY={bx9r?05)KkKhcurx
zWO#U01O^6z`jLt-&GodR8c%?V1?jz1fr~N0IpGd#&*H3O2o<>|*RO$rL2FfZ2RRRN
zv;alH{gAycnzk1X4K2YkL-=B?P4=ju46f$pp3?eESD5}xVdfA%wUs1pFG%i0%8iK=
zS%|66egrRFwv2g051?jXyhQRfRF#$Sk2rkd#43V2BqmW(mT?yAX$;2SmzOW2Kl*nr
zoW6&N)R6vJ#l=QY19Ta1e{y&2HdOK-c>~;yrX-z!AqX{3IkgGn%EuBceF{IogBUqK
z)1N+J$P%0+Gk5@~&5(m~!z)XLe!9Az%|*@l@XD2bc-N9DgW`yTTV75v&`Cb;hnxLV
zeSg;&R)QY2oUE)eNFUCEkbb15dV!FVF$O9UA-K{?kBpJ{YwRK=2Jq?Fk?d**`!)AG
z5Gx&8FoB$<(yao0i9W)}(>mUCkM6t;@1N-3i3WgxEo53jb(R}o_(uK!lCqCB5XH+6
z9z0+-6;INW6!&Bv5gn<yU&xV}C8_4xTVgUD_c4DzA*m(15(t-?+6zJ@#A5h0m;3~o
zl}7BeeV_8`A>z<uRDjACQO7}Q4u3?CFa;8<D4mYhE_EY|QQ)KR9K$pKswT2lj=&s+
z1t==GzLPH2C6J}Li8lSni-@t{2#}ATsGiTYN^=pIcN{u_o62qZh9=Wz+1ra5iI|G8
zO&w&G%dW8l@funL2*n=D771G3aB-Q^s0i^lb?Qwb)5{kxAd35Ws7sPW?zp4pXv?&W
zXJm)izN&lRcM&B2wziyEDj*jBgZLlUVp<WHYB-fAPppqJ%m8hpG``577{p`a#{EHt
zD3g_~S)$UT2eD_af(4gQ_$@+9l4ZPO&3Xg)0pX|FRa*aGu(mc#7Rk3$W8OiYAsIDF
z&W|ulvR{RgEiv)?yW14(SniS3zlsPU6QWvic8=jvh<RoUYLH#~PM3KL@(z!YBXw`7
z@?^NH;uJ4uW=3m$)-Twrc!<cXtK3;)zLFw1cJb58mlu+8Knk8E$sP*4#qpTryiSZg
zK6+H^PIP2sF_ucWmx-Y~tpm4HahU|wptGgpm=92i=m60tyAUv_Ls|P4C1;d-^e}WQ
zy#d3hpbBC68FJtz`HA@~bF#9YbkyU)@^aV=jGikqY&KWCc{9a2R`-2P?JyS#Q=yH#
zc2n0j%?jsW%EzwvyuMU+g9lt$zKLX5x!!lIj4fQ|AcoQK`*pt8Z=Lr$a;e`JFCIa;
z$KI$Zf3WG*SH6g3IQ-YT55>sI*rX%kJwmVYZRv?-RZuO&%fHK=SaWsh`0)tA=uHvb
z0eA>4zN3P`By~+Q&vrj>BxA4aYIyzP-8<UGyp2B5dBHc~?W1$Msi+u?8iff^+wQ|A
zfOA%od=hzsNi%5{KFT*_mqd)Cv62h9tW1A?ro;$qK8aIIVxsVqAnfrqxQx6!J^K$D
z#I~<bP4R2)A5I-64g;-C@r*sY%7qGepLBTq0cA?t=lCA+3KPCUDEqhIYEU>%{7qip
zh{eLjTzl}~ob5mxYiSmT)I)ibD!yx`rs?F#OSlf8`?z2_OK~sdR;wia9Q^&jm}VtW
z;>loGEtvf3`?OFomepKc>C=&4I59pud-5wx%4o%FA;!b8ykbNloqY=y<RDT*h#6mP
z!z0Vd84AtHoib#Id>UF+F0~BB39Br7x(bN8;K>sMEv;$JR;?tu<Br+j%kcEc6H{4A
zU0of)5Q)oR-rs*o&VMp9s|W%bydWPKOUJO|zRW|dfhPrSfxa3jB6d~8$1h(h^Wt~Y
z=L!JJfcn=jUv}=^UBLZ-95;Hk%hY@YF-ySXfbQwdC{=OGiWaE!c!@;63;31zQoKwC
z(5dw&1P%27l@@e@EO)M$nPyvn4wPH<x8}{wz1aa84zM)Tyx29Uj-AFVb$<Q%^Xn%~
z+L(SxlCHrj(7X5)CXa<VXwFeL($)@QKwM^<rVS+jZH|r@MRS=`igB;ts1SPKfOb#{
zSn-e{Rq&ELUA(ah6Bu7*)eBaOOl-7{&T+Pes9esFixd2~+q6KAWR^F3DVj`=v5eo)
z_`?JCL+Gap&so%+zs$%gY#Cqzpdv*m&0A{VCa#30S5nN+WC7^~rSQYH6>r}Hyn~8k
zkz~G_@0##{7!92JnI3-Ol>!FHB})VrwG9V%KON=!_Y*_0lGXK?CK;xwt`1e>3jWDV
z99sVti)MXc{KKtZyA8~{i`Bm_bpCGtrE;dGnCe7)<c*u0Shs*g1P=u;_T1gQTQ}ir
zOuPk15DF0z=RidmRQ|||{X;!PuP|Q%eOe^>b$tBbXI+1Bbag&c#|0`VM6L#IX7Sd1
zR;&Ya*D&=}jBCP6iBkARSZ7I9_QC%qP=wy($3>(8CdB68PTxB#n~7TnITb;;$q4|;
zMq}{c_!B406)eonS8*%}-{MIGMaRYp+>6`-FTG>Ov^{!q3OD{Y<D^Or!6$d?y%FbE
z6dW%KXw{i5jR;;>Y-#`33~50b#tQ`@PH6SO*&q!*q*pIqEKEJzEI5d7d-m))LgD1?
z-JYX9U%YrAw^e51*8lk(KHRcIBjGi|8Vvty<Hn8jH-P8~1-ZxrO}b<2(Uvy`xR-8*
z2jfB^gIV7=;7nGFsx*4n^nN4}n{hl5?C6Y{GaHdra!Xg@*-%<K9JgjJ(;EkrAc+5G
z>FWK^MhHY3IUAnap}lF``2oo=XnKTbIZi#rfwKzu<BxG*I4q}zhoa=uZ0v~H?s>l&
zB6!jeFGx0O{bEE6HX30-i*8HE15}br<y~3w-Rs=^jNJv&Lnv&D3bOX;<;M_$Kw+R9
z@I)6+24^Zi-RXxm)PKA#XEUb|;VG1sA#fdn6C}HOWzHc)j6s}xdHdn6ks6Zdjfej;
z`*BSpv=U3bh@jlH8uEgJ1h=wsC97^LdYdJ26Nu;T@)tpPG&U^DmkVok&=bw~f(e5Q
zV@e5i9@#ZcZs3aBgM!NLw3WpD5%;h0U`acfWjyNWoqRY7_pZvy%dSnIJ{>jrz?qSS
zNa(vm)AQK!b5Kl>yQQRbXxsMojT^M>ZV3u1!V7Kn>XV8upp)QadGWw`)Sw_L6vAZX
zh4IZK`Yot-e!kLIQ@+4X9if6>?Bukp<(cGUJZ;OVwtiMqB55K9?1s-qaFvwgifEmO
zhLDKFiAC-k;7KnAHz@6pkR&t`3vU2ZC!VZwYx(bU`_DVpf8<0$9#H{&4KzxWFqm>*
zrGB|}OQ_a|U6U&%yz-gDLk|OKG7pe=GjQNyHac&)`wNsc>H{V~1hOOGHJI9=GGx9#
zeQD|Ynn_OmXP@d{K*s3}8bI7&0fzsD9VHo1&6h72CFSHi?<fCNwex@p*>=1D0YDOW
zuo1Rwp*RS+czthJn6lt9yC5XPK6)NLm27x`$eRaLB<8-JnpB$dmw&-SY>7w;d-m=v
zL?5|=cRYZbG<*J=XE*UPj<>mcd7&@{EaYHw_Gz-AuTZ*~)DiIxFW8?m{J~U~OYilu
zl;T~6!z9t!7XJ!OGF{a5_4Pr-$vUYRa@(qO>!u!N+SKeGC{-1)gK$}f-msAAZCIv(
zT?;sfk$5>dkZql$^y&$X4Vw^_g-lgQ-(;USX4FbyhWe6d)BkR$%(pLze<ZsiUcgbA
z?tF^v5;*($^MCK#Coi=5VjX}%Eg6X?6MQ%UhcCwOBLL?XlMOZ59HVs=1IGAea1mng
zn0Q!W+x`nxj$RsJ6=>Nod3g$%X<-qvIC#kX`TuAE3Sr49;^`nDNeB^l0$A%FvI|Z$
zFKR}i?;2J}lrwGACDhN5m&u`^EQEe`<fe8#Kz#L5XZ<SCX!bw*|1uq3Cn(JXF$Az0
zF-}|iSO=rpOe!G8>7aAF<|%$x)ka#7J~1tbc|mj*QGRpacI==t>!RYJbLVPVP9%bR
zN3S_TF<=>wqn6MWNe>3Iq9p^G9$>T`;xmE-S631jh#T%StlomAYoMth#dSgt@pES)
z6q*cR%9~BcuXr|hH;gGSvLIknLI(ohr}XX0E>J!4;#`pmFh<kgGQQ{VrNKM`vBqVx
z0UiXW=DdIFKtTlYpssZTz9*E;Qdbh~3Lj3w-D_zbW#d8g*wov?1Snr^E-{$_qr>1F
zl3;{SzjI{EJINCzC+3n?ynOlK#Dei?ekl~o-Oq3r(TBZg(IU1KjayA=VqZh_;sE<F
za9qA%4;tY5Fh6#7jdPR2n2Xo3<MUUqDD=n6EW0BasM|A8;;+KcF{>~dbTk_L$ou(7
zy!V&tYPt*?Pj4buHq%4P5LL9EcHm_n;AHgwB2tF8q)__2y!@JI@V~%UIaV0eUOyYk
z#Q6I=J=F;&CjPG`Iu8&kdg(#BhwBUW@y_7VXB8Kc4zQ|a-g|@x5I_Y~pSV75Mw3@B
zXRsHnBN=Gu#Us1I!$~dmsPe(h$t!t&p890Y{rFnkW29JE6g^1axoE`-A#vn6Bd)+l
zu;R_C0z-aS61SS9h+7sJHe(oT(6F3OOLML(GV=P=f5eD~Nb4wf#oH(-;0zQtQd?3o
z&%$?G1-*2A=%fNq<U<RiTz)An#bIY^sSz<m`kHOmPMHy*-tpDnSODuE_T*)0w8YaI
z!M91QOKr%9KVVOK@MXD_PxT?5BitIM8bF6Mup{*nc8zw&Afe`m4QL^Wwu54SPFVO}
zx_c(YkygM`j8>%w6-7(({pMZ8S3gN=4n@j!jW??R4%Z~*lE@Mr_}cpo+?|`W5xYhX
z65l;q3tp+@`SXt5yYC}o3=XE_nf{SB%fd}%jK|>DEg(PvSfIz{GHKnWO<B9P5>K53
zSBo;b=VJ_{VWy%n?#7KN<$IPubR!NwdUcQ;z|?@_8*L|IU1yad)S>a4V_%@<L9_jV
zfl$UCA2@JA>q3X=7>^{*g?!>OPSHs8oqVpbMa*`K!AlrZDfjYWSnW2uV<3xoY?+Y`
zC`u2Sd*W`H?m3j)n{)f;z;k??Ok=Z|GrxZQ>dIJ|)2G)EZN$Y3Oe)$VVEw6e6*_eA
zSiAP<(UdIl^(FZ?0Vb%BU^`eO(g-_7p|cRLGCawr_=V&-Bj~Zv2;;jEw04giB8eW}
zI^En?sr5tvAc7cObyPTm0u+$+BJIes9WiWJCn+}1np6ib5})UH0>^!m1KoU>;=uZ0
zgn(1H^T^*Z_ghWN${kM&iyU?cz(^m)NP=hh8TgR3=Bn{Gx-a$U%ozU!>g}irgSwsf
z6Td|;<V?WxNjC%84ID5aaN|ZW4J0Lv6jjJZhhGv!X{4LHXJ`n81LlR0((m3aUslKt
z;lgWz(fQHb?}x-v_!s!o;oa0v#wYAa3mHjrZ0w--P-zzAP2{VXDsZj!QBqp_<=q^w
z2fs*~=cfb*V)`hwDvF%f40>R)x{{c>vsl&|`GSJGsN$$izS~g>mV}3m?ZXI;CCL|{
z(l_|9XWnm*;W(h63doa7aRwMk0D}Y+pl4KjzqiLyaQQuS)22(r_X#BLR-=rl5C6>j
z1WdOM66-~VwkygQsPcJt_VW-i-N}_71!3w)90X^gWvaHemK)YY1=+cWyL-@%9SE86
zf(otFrvB&HXw&0_Un)LgrLSJmw8Dywgb#jVZE5L-)X>kb5s`$*hA3FMWpY<ovUzq^
z%)N2t;X|7zaiPU2(#>RStyH<tuuhmaxQ$IL`*N_7kh#1AaHRwxsiD4~0XVLq5drxI
znG7(e&%Mt9Te9;4R;T<+HX()U?`YkZEgQY~cDM4gcW1(PSf~T{EF|jPtJFvNp{`_U
zoqUaFA2S}Fz5!s}56vZY(FiomXpG(53;=y*Z4*Y9ALqf42a8yISY5_lr|YpNQj?Kd
zoF%CORjH}Hjl#jiL_@?E6#RG4Wq^iDH}hs^0Sd|6d3q;Lobdc8#FSm7A{xJX)$m|H
z&9^QyZov}j-<w;vmhyA#dZEwfb0Tn1d_k6jG{J#82ECxD>iD8ddQ`r8{rb1xenYm1
zx~7g~5X6ueWX{Z3Q<=B(5jx4F2dln*6?r+JP)LXcTNv~L_+@mH%$s8c%9XLzFPlg3
zu7$R1)PZT8?RkhLgi>x?K6fSX434)rqsmqz9O0@1FQ!?QdzQ=3YmJ~_Bnd&(@|N*J
ziq9uuC!%^Q_I|5<=Vyk*U+Od1hkTc*q~L(Vj$lNiIK7K%2km2x$Le)xbO~)i5rCm8
z$606wc8YNi505V9iWc71t-ev6QHaA|AVci`UJOeBAZ5_6WnD0y?1Y1`4L{bBprOBD
z@t3i8EVY-*7M&-PrW7Fq8Zh?uy?a7@Oz_3W2((h8Y_Q{93TIgm_oPkEtWcv(PR3F6
zAS+6hx^^YTZ|^z!l<BTks~a19QPrW?D;JLqL<m`72LALWvz}rMA$DD^$AKGn@6uk%
zYc3TZ1<KpJ_|JK#s8I-&!DlgefLlqR4`}e&_U+o~>*;-`l|JDOhR^905Cd=~l;H#N
zi!_v4lNuqHXvlJ?kPSS?FZ}xHQ<_`Z*1YB(z&ga=Jx|co!X(MKX({X}rSQnjooAeg
zfCP+)s3kMhl4ml-izo_k+vSC=4r|$zyOI@!q!qs^ErnO()va4Mx_Avok8an;hyh_o
z++th$7xcN{s@h??_I#(J0n<UWnI@&cK=rMrb57J15p(fwJ_kL7JBFGlkZ#fsLOLhB
z1i^7zsbbo$UgH%uB|nW!BaU6fe&Qf;(L#l3<sXE6<erT=b!s{l0fZC46;#JZsx)A5
zO*jki3l7ho$Pr8K_N?(^AI?xo2f9iNr4i1?Mni778>oo1&4pB9fR1K>x`sv_!Wbmg
zHNdhYfUQ(v1J-?fF%jSn>evAkDr-~5=evfMTfXrH8kXG!@z;-a!oVQnwYF~>dbip?
zm*Ct==kH?BbN&~33lIqthU~nh3l=;FEvDK{G*`!A_%tX2pHVnA>>p*Ja1tsnHmw&I
zs@uBCLN8=}<zK%S%=6>cSEas#F6R=G(g?e`Yh$g%f22*SU9r(N`AzG&h8AW39=qAI
z@nB?{kEyOVRVob)+;e16%5e5#syK&oFv%xDld_7~05HAQ!$XY4N!Fx_#1NeHi3K^$
z^nkBlXU>@MYJ3+-oPpIdDRRy+T-IHsjN*dmvwC<6e(zy!t_W+?1#{-O*bKsjlME-B
z0u7x59rW)56gfuNwOIl=F&KDY{!w_=X?lJv7eI}YbotY>cQD|ja%!r<vGM1xaMuRH
zv3zcp1xwq&^I#)iJa}*ccq4f6AmtcBcr`bf?uB>QbSOFf4lh`!EDSILPMkU8Ti*7b
z`@2U&i8E|NCP+n%UbC2!EZqzh`<;tXbY<{9gx}MQOzV1d{=$W7)_Y=QGV7Hig4h{o
zM>z^$!&h>1E$7Y4ph^|p1dN_JGTD_V2I)8;fDZOcJem~@^N5WtU@HJ<PjOEsL157~
zI14_C1$#tAhDC-7zFO}=UAcxCC!-o5Y#~U;Cpy))Y$i!+$AmMgXBU_AOYZen4ItWn
z`64`P&@J6Mvm>whNFALS&R&}OmwFAEZ!*yl9*X<+I=fjYR8g?;|EM1e3+<PsbCF}W
zb&j-0D*cnrI8pGAmLFn$d#Y1-R^S3bH~KX;0O%p`nRa?4(5<?99On@8CiKCaZt86j
zTnl#XC~Q`>nC>p2+(w_cf#gVa0vf;pU(!;NlPTb6^K|4y8-7TiHRqPi-yGnIH}xO-
z++=;DxLO}{n|;t6KTn|%5D{!r>(;G>urGjCl@IGbT(I>%02%$`wQ-}^BtUK$tTQiH
zBl6Dm>(}%0lB;jfp5<3pK1fx#rI)4kSqmmGW5y1}Lx81W=iLZp=)z7AQn)VKr~<hR
z40_9+;SKqEw+8|LCl#&ZM+6i?o|b**NC<F6&z@S=cHtu+z3zOWo()ulUZnQ&b+#kj
z;=l($6Luur$vi~c#*-oFF7xxXH8gVVw?-JB;ETjnKWI>)_|X1w0!F3mhh`<RY1y_{
z$Ph5OoOfKAPx6HvAiOtPa?OI)EUs@w+6n|?+@Fta)wQ&c5iKeYVZBB`&)E;fQh(0u
z*>PUjH9A0gx*el)WHkZc&iJuoF94A3aS0@t&;5LTUM}FNn{WL$GT7-!9$Rn{V^`f$
z{_CyjWp|l{UQ!~EJbKMZ3Fo0xmp^vnFqa)WuRY!QPpFJS5+)dv_*TdBf*n5(5blp9
z%9gWdlLnsWc0*!cel2<zNgE9hZbFjw<EYqe5_MfT8d5OIR3J_Gq3hr<nCUV}(7_c>
zv}s5N5~CUf5@0P$mMp1T(#%8#&}0q!UH({Y3twUbeH#?#Vc+eMS<o*ey02Lz+Od9Q
zJESKpt8CFXAlRVD$WS;9ls`va!u*XuMNp@EI<oF?ovUP4&y2oT`cZ7h1m#YgQg(&{
zlHx9-`Z?b%#8C^U!VA@E_pFI*KsbI+Tox>#lKPgkZAyGhT}eW;xjG$y^M;I*S@vT3
zgThCupN9$7Z{shZV{=AnhX^Up_*`<VPC9pq^Q7Tl=@QFo-OzHLF^jDEV-;Zp*3>uE
zW-qW6DTsatZozMVnte>&zzp<Q6}|AUGt@{&!H;E=$q%w?I?ku3a8~RK?)q@=Dd9z^
zpUrI58QHU^?4H9iq2aZ#h}gt72)kHou?~aD{UoC0A>x8glzt@FlXH6^^p<>TczWG^
z!1J`+xP1iz=rxt?8es$q%ENy3*v~uLj3>+zaqm-iPno_d1%95E#?*`71csL$z*9s2
z3hAbUx~cjcMO8|Qm=LZ1p$X_T9|t?Y3jy!r$B#K@6oG{BT?Prryhq9Z(>kU_04=R{
za|6mMd!PENM18thrNpx{dl$!0C*-7I7u|TAOl_WPZhnGf#B`nyW!csxV^V6Z4@1h_
z>x~<7ec?@3VCD*A!$YYZ{f~IQNuB;3E&Fj`QE$5zW9Mccy=jxSWxhTSAu@RZ;n{X$
z*I*4BdOp!&CM^5`-j;Fh!E?|=Kza3s=W03Ijn{{ymssX4Up2EeL-;Jqk0~A^-3I|o
z^ejI%32qtt$QUoto=S|ge)xhVG0Dd-km09dxH_6JF5=-b!5FguNbG5riAzZt*@V&f
zC)@{rp>p9l5aQ8La1>ltRwY`-BjDqw9}$E}T`<cWIB=ki#R4Yf6u<G^rt!L@BpC1A
z08YFx7VcnNe*%;bl#tGBZ+sSHOPrU5#rL#N(Dc;_lny1Dldy=MSi;e<`EK2RJkSo)
zztB?utM`VL?%SjXkyOA!9JKP8v)ZXX-%3wF^!<3`rcrTRc4hBBsW<#>I(P2*wL@J7
z&~EX3+o1GXRwtuY?OTCaN1509_2C;H!DfFtJ_L|9*W+YkY<789cER;oL$hyXXII24
zBN(tcu1v6uw7Ud;o<0<kdRE$*FJ?Z1Z#lU(ux?voe$*|z0pt5z#UsvM6QS;#cxA^I
z9@$O%^N#{>PR1Ky|LV&2CI_PU1dgI%l+@L>*eME?<S_aL_>xn_3BoY!3CXVQDrBFM
z=n5qzC0dhd(=-B1ICpNg9)`VdUc6wij3*g%#5Wr_83NatMVJHQ*ltR~u1R0EK-Yi&
zU8uV*kfb(oUi@yrIf1BdY|E<8$S(tsGy=8nisk*EFZxJ4t<42=gyk%76qdMTjUW&R
zBir^Ib^qqgsd@*uPu!{-Nef^teSu@B<fxyNr`O-krkK$!P=#F!`+MB@S@FW~cga_J
zN94qQcJY|QM8{L7!iq>yvOS~T0*Dhs-o{@-hpwsA`iz}u-D^><Q2}Ws-As3nRZblR
zscvM|i)|D197Eb`D%ZEWxB*sJ^W2}5p)G7zxw~tBX!j;+;gTh`m-@sIua%9J$;g%M
z5B`~dNUAV-^7XDGM>X1#-|-*pZ95&;3{qL|0HWwjRt(e(7$yb*0*P{f3fQsXbIJLP
z8T&#M%{5aZeZvzM<Fl$sLM!5Y^k>N6F5~IQuG7Uu_(T{q_aAzSrzMkN#=)zrqT(tx
zGz>7+L~X5S`Ht&|J9zxOs2|AK%r(NO!pNqMRd*AtC~<-;Y2@-p^J#xAfBUP6`wO!#
z!Iuc=vW;KJP;)b0begXD;Pr^)g4;eH!<SQqbEkJxy^2~~LvvNT7_U~lLP9>iD;Dui
zrXiabzcgWwnMcw6?ZRu#^iP`s)RysQYvOkfcUBl|O|DSZ8ZWS3@sh8pUAHXWAAVZm
zZ<>SP4#2ksx@cev{7qno02c@bpLE>OI>NU%Z_#3E(h@+IkUe`SmM6>eXy<6|S&Aku
zdNJ3G$tItT!r+c*t|!}Plmra1SyRRx{R%%f8P?o*e6r|ROhe`9D;o-sx_wVdYuAF~
z2mXgyO9*|<d@e#Ss1@y+Y&aru*eNZ^jX>~?%twzrNuQ;gIiZL%E%a8>WL5Oai01gm
zhp~T_1(ADYc>a)sABflBfz0RZbBQ1+pL%R2UD;7ZiQTn)`z_=Da;d9c#U?m1!Vgj6
zYnw5)0jzuSN6=8eh|?I2x<9U;^)!#_wvDQov69_x-fD^>%M~u@5K6Oo_BFKAv{B`z
zi*dXm<7${%ai_kMM~{NIT33d98o;M~{QQ~e(qVSRUAlIq-xavyJ>ka5UX{LTUd6=?
zd`Y>1Kd1nWhawIvSSjK_J;@?Rnsr7S=Ii4lj9OM>>WR((*oo4Ke~|E|Q*#jvOq}B7
zb*l?v6S%h~@W9kheRpJJZzZKX0uj_F@jEUquB(-QXckX>c$Of|&=OOA`D~e?BQYNj
zspCZ@c2bB3HX}GR(AAx(!Yqo1<hT6-YH13I)XprzqeYHk;#j5YSP1G>T<mzvMl@LE
z?k-TI2m?pzEPcn`=Gu{YAcC#M`K7azb3tl!=Nxx;wc0Ymh~=QsLHsIf@5=;-sXYiB
zN2{~+W41jfL;#rRzEtI-SqYp;n)XZL4PXP=hYdA6jf%*!c|pC$+9`Y_3oPHIuHCn<
z$&+C3iMO1<J+?OPO8BGE+RN`RqV9t+St8yjc9ED5q@7?Cj4Qo+)z<q@jl49L*?8K5
z_ci}~fbOYh&oaQ(Sq~0u#D`=^ENzFhYW_8-3=<veROGaoB&qqobOoQzK5gwXFfdZI
zh{mV*KN+g2(dm8+B!yeQP5bsb>q909u1nU3$Vlo4MiOc4cd^rkmXf%2RF%ES1He~1
zOL_94$J^Au*rpqxh{6I{<Ohxx`q6nP2Ix3z)p_6)Su!`*O1u#>j_aPu@C606{vpxN
z1n>g38xXK+_3An3Y{|VSxuKf)=wyYX<+R4hldH?eL)io<B9kX+@C4`@H|`QgmHa<E
zIJmF2^%kP@Vw~Xv_8R+bkV-F;U1)mvPNfQy1<@#BlU1iXJ^S#nV`8LhcQM&)?Yl?R
z>{J#c8V*#4Cr(t+;6uq}Ir_Y1e0_o2I+_^B%5am<88+e)M?f???Gf2l+({e*y7%k}
zSsjl0h6n>3GFOGcb<FlQqyq>f8IPztw{Mr;X(iv^Ef5)t?1I@gWX;rK>)hS-hYk%{
zho_>L<3-s{5_#t2$yRb!#5ytG$=-`leXl*!Sm-?(%`l%_de-7}SoIO)MJ`2YXB1zc
zV7gxz)_`7(miLGG`C>#kf43BgI767?XAO$~U6AnHLbpzd=52VrM6LBf_gO1K83;Gc
z6buRfS;12>VbdYq3`JSXh)A!BV46th&Y9Cnl^b^fo-Vv6r81^`PB3c`;ih3SZhjnV
zI!YHUUW}{5GvG02BaI)qnoMADKuj2*h^XM$RVU3#zlPU-0g617@UNY_`uhHWY)W47
z)JA6Mi-Lk9#kr%T#*v%Mk8%roK=9=0#o3RVhc~VH&41$w4qO;9d)3#jUM3pf^7HkP
z)*|JFp<)p~y^@EN=-eiPy&t40S|3%_1tdcJ=lpj9D{mrVgy}Ids?MEf&7NKRXTA_;
z@gQDTVq1F?o*y;>p_T1T<6k9K0}@<Sd-UohMoG3&1;9vN^;~+V7QTtnPuT0CQU<D_
z7RT_H=)|-f6fX`=%X1Py<I2jct#e$q<0!n}&|@VsBhE6$fe#-%p!cO5F+GE$00$45
zt4Br%z?vo@bRO_V4h}_Z@bjoFV`2mlsqw-WA0XVe!KUIUyz-UrPsw=0!U04^Z;d>Z
z&NboApl#IvGPS}v6Sy=Ha9so^0izLviziQxrS#@-^IVDuMd&Wd#O#g(7tXcPX^JMh
z|9><g@5rUzaA0&N&Dz-QSjLyS{4Tb&e?cS(44fzim*6AZzskUfiMG1aElf#cX3ySB
zaY>2=D$Jx@(dOw;ni}M4_7r1Kt{~?p$96U=X`$rwp&=+@F<Z*A=s6fD^g@4+o+iE7
z2Ix_~0e-TQhIHztzEn^R;D$!l&6C5cw1tsBY9$2=E30Z@pvF$h4Ua^g!V=cu26VvK
z&oM%bBIDMAQ=IW|ud6x|m3Z9-a!E+a(jAmmeNV&vV?(omMS)_LU1xv<qGFbPP|;@j
z;q@O`2qyUgP13@J!X7^D^Fc&ONE1R$We|&VT`vr1$F=7HdD5766e@({O`n*LwzjwF
zFLC8@7kvXE$EO%I)_<nhJ3_iLXvTievoBrsaYk~<Ig|xEhn=L}f)BIG{?P(}A9-CN
zv>z5jqo5n6(3>!p2Oy?k-q}BTchXUjP4Ea*Cs6O8J_Oj}Gw82a8K_7ainxL%?5dJW
z>5Bw!MWZ3x0Q;Y<<S8)vtjDbN$BrHahow#O?W<Qdb$*4quim`r*1I?C*vstpZ6sk^
zTw9^Cpf4KEwT=~ia>{8NTZ%``=S2c@ofY!HD$jWjo30lz8H|RooI8beAe{%spWaK9
zuBE$R(&=|fUN(ys26U8ne*1%c1b;}KD!-g|g*U+zV{ED8LrtA17X$^2)|?9<*TWF)
z55txzX$P;TFjPZ&K~lvZt%JKtG}<9_aP*=f4|EXZkq;r*|Ni7T#`RTyDT;BNKK*}{
zWS(B@?k;+)kOSjP<Uz{Jgc#i)4MOT_zJjB#q^LOG$%#WE;5fjRDKBY}v<D|7$cu#V
z{reS^vaU14dP*FXNs19-IMUfpkYspQG9I)PmYmq|x!Pz8S$vYQGL5G#{3~Mcl5ks+
zX=aD~OK8s*LI?@jt)aY6%62C*I*QmpMOOI~eeL3}P4d$yc0pZe#i!gd%^2xON{NXb
zH`gfUIx4m9-dRq&R2c}{{GB`dFv|;k`qnYwJud`otYt#se2Mw$|4~9lw?>{pbnl0k
z4Pql9ui5U>)J1UR%I{#NAZfz}%Ht>X+2X}EB>CYw^n!vXi5>x=N)!O!&~6f|p8qOL
z{0klc?*Srhpnsjf64pC~1LE#}fayB)Y}+$khnHt(I2x-}fwU%ZJvQ<wN&HKno|ZVb
z|8L@WQW*K7a1h$GsSmB9)#vu@dyKOWbqgZHvTQlInAt=2B0pspI64+u!kLYj2X)je
z`hO-?r?=;}AbsXTVa4NUWfjvMs`5iYQWQNsfRY3Wr)hE<=FA>tkR_1F$B*WN>^~((
zp?wv$BipXC#8KtHFKIissqqTX4}||8nb6MedPg`PZcbvW(+8~FtCvG+8|n=Fa@TMY
z;QEH@=_M9sHH)_YPXd>|>!&0Q*cqYM!D`_WA-W%_s;Td?MSBk~%4nOcQv#GWGvoX`
zAP=3ZOr<sFKlzep7J48LDjjySEy~hyv~-hc3hImm7j4N;xtT;LC<M?yaoZ9nCo~W1
zu|8(v&0yDGB*FiP<x2Ezi#<F^TkOCwkB>(Hy_YKY_;}HH>2`+>BNQJCQ`;j?cK33<
zcr8`K@UHda)yK0%!xkvYIS48%??jo5;W*cU*E--Zjq{trYBH$UR~a{7Z+$CoVH1dU
z=HI`QLTiL2R6Nwx(P>~e5Hr|6OUMnx-GmT^3><fb__RSS%*P`|kBEqP7(eSeK>6g!
zkp{DW?wL%@=$M#Nig&~`y+<tHOZ!Ob4pB3wzB0s^v1Q9WZ-ZH6h^ElD!Amr+I12eH
zxLuh+DL2G>^7Pd9G}Vdbx>2@H*Hbmlb2oq@AvzPtJdc*#f(B1sjl&z;8QYdc+~bGB
zN7;%8RP~Aut%g_!;vOdl?1(gm&~@B8anHqzLXJ#36@(}>Ai7~87RD|iDTyn-7nXh0
zLZBTYPyB;apBak<Jh<=G<!hRxyA}22k~|U2DN#@d5p;z-hHN|WeSG{+F{QrHl}w%b
zn19Q9^WXah2%liDMCyX10d!b#jomsRj}wwHQG^*5Dr)Wo=qpF>$FSt^bfDTlH~?W?
zyJRM6-~k|4_x7T?zo2*-MF2aClsMmfqgjodf0D#)LH0^A*RX^X2P|EE>;_`)r!OY~
zKkZXrWn9&cc?LDWB_8@U&TSc}te0P~m|^vGPSXPa&z_;lFLCRdFtBn8AF`3~kpj4Y
z4CN9i)2St45IqB;1&_RR?D4~gAJAIE3;vpHG_`VEhiC)ku3brfO2og`amc=LLtRH_
z&ou-L!smh-u#Vh#KVY4gv4uw0K)Ykd)AB8381ug`D}x0>)rTvJJP*Lc=Vf_0P?nwQ
z)qm52`Xu2bM=&Mjx^e5)gSPCzSZF>Wwg!ZOlUcMKnYsBo4ii;Aa)ihcE9^vdEm8~U
z*%+v7MBz(73hr-T>f+*2o|}c=9Y>R=%C6yb_DyQy5OHtOMXJja;sQIJNcIEM6@=fl
z^%&i-2Jvo^=$7J1qcflymWhTDF&$*+!U^!$$OKCnRwXglL9{Y+$`nPZa0Nth%C8dB
z6sf_>m|@H-X*&-dc!7b2v-B1&SRh2OJB{k%DEfxA{MCHTo42CwqO`gTTmzvkT$+So
z`j0wy)vHwIe07kdblk_lhpj6=e~L%D&nvDYMbT(X{78|_WGUQ_fOe13Ig+bVNe{lj
zZ%^t;c*0%_63Np0oa-|qq$yysx!SYkZ*dP{FdB@9%+s1)E~NL^<HI74LPUkad5kTU
zImZQJ4jYz-Kv2tu7#KXk1(6XZVc#R$_OX|9Ws+|YsHk6t;YsBEM&9#Vlht(|Jl2Hb
z`TQQ;=}5Vdo^zCVY`MQ(AvY5DxRBW$Xpq0fy*l<D@CtMvXbK(k+}6-_R0<>&<Efxi
zA2f?Ar$?ASUg26JMPP|$D}00>;40)17=zNEifqc!Na|uqA5rDhe*ezcyx9sl^!@Qi
z3P*j{V*5&5s3c(~e5#u_2M-(OMluR!pzx7Ak_6xjEP@-u#zpJW8)^jt0aaUy&}?nz
zzf!Dq8@jN$dx|7mu-r5Q5==O<x!PTD*gy-IP~KwJxPO`vMu#Dd#nJN#+P_r@y6{~o
z4dT8xFGp>Oitsd7LOd0MbTiT>Jo$jfZXOUR5@{ZiI;sdKC#P1bv^k{{JEEievLvFD
z$Qp^g52XqD90HV1QhVYDdU%daTy6Hhzr6hITV1>48+b?1F870D1>sgoZ>q%H8i6Y-
zxRmj)g2hKRc8Pnov}tsveike}bEwU&tojGM!Rrrb0X$Dtw6pyMBtcbO&A2%Qi`lbj
zp%qS<t&dOr8Looo5Dy{Vhr+F-{>AsO8jauu<Shq@s{+O~7~`QR)8M^$1<!*)q-px7
zWqg1li`Y~e94tI2NjE~hAZ$cIG89A?Cntm}Z+1wFe`4_`J(`CNiM1yB2-h3#`8B+J
z|6Y5n{TXL#Sz#rnJ!Fjz6l4!VFHwfRN2!<h@Zp}3o%{=SQZqDuGj4p%7^L03TQ+a*
z!(FX=;lJDiVa^?T=P4X>*O7lyUzXmH#}~IbtTTdju^D_Qe<CiAlEk&<8-K4zOp1BW
zA>O!YQ$`^IfTlZu&v2uJ7N`i!aTFIKkmicoEzd$FH|CSAK;a^gRCxaS^+?hCO|R?^
z40dwhz{OJ0*^o?98a{hM?5SBzM~yd(o<^(}vo-`5c+mVt(}1sprvQ`SV%GNdS^-Qy
z5TgxfLoS(4zvOnZ>!V2W<KmW*je~OF$fsM-y87P^0ZH(5a2t8VkW{tQ(9vPodnvbZ
zfFj|Ps_tSTQ^DupiTR8MK-H^Ah0s3E0meLj<)5b^mRr265+N7|4I0!&l`d)Oq~zqd
zMZcOK<LKh`^_Z$l^(v4CZU1)1uY5C<@ARgB$p4!AlG9WX{#vW@^W4}1&=KEZk+X9e
zBt3CJ^(xdj_OIC+wEoQ$oBq9j1&^PbwX<pf!=Ib3gpxa=ynq;Ot%?c;4!QJHpD8~#
z>Oa3VI)bbZL(9nuIUq&U7Por+mihNxhEXABPzVVQt`c12NA>@5=B9s{Pp=tvSo5B=
zS5Sx}|48?ekbG4kzYRZY+*rTnjGe=t!~bNU)}sBHYo<~@Emge1w-t|14baw}u8_l~
zA<FYxB>{>Hsba`Iq?-{!5Rb#k6o39&6J-P6y5yv!4}ifmSN9i%p#0^3n?;Uk2QPtC
z-<46&R4V*o+1$?sdE5RG`6t{b$_FTlw&A;X_x!u+CNn6&(dJ1vlLMmwo=n4GRbx5>
zctAL?H!C{-l^ES<5cN}1Z*EN#Q^cYzAkN|Z2oFX1kswTtEF>tZuh`B2z2g3oD)}6O
z9-vWm1vh^l1pfqTDob<oz5(6Fc%A^mD8vY+>2=D2IW%Wibe58GqDiqApJ6yQ?_4~p
zSGn_X9oaT$*3WK*gsp3T8>)I0M~}X)qPbMO{L?|Y=>k;^z<nzPHktP>S;oCxiCSLq
z1z|*#{~s6qvyx%v@m8qam87uvbP8q*KhKh|YObBse&YR1${x{>ojfk1r9^)ZO2A}M
z{dT>V7hg9-{AZfih2*XA798o-y$y{oGmc!DGWp>CPHwZammRob+5h#TTMG^Zx@|vk
zs^i<_PA+q9RT`MR4c=cCY?(7~Pk*I}Yj+Jiu-G{ve(?ss!l-9IE<C$)yC`qk^p8IE
z?svu(*nf4YTzveTcTo}oqbS8;^D`yd+FIkpFSZ&_b1@eb<3w^eLmbU`!=B<lNF>Ue
zw{AV80_p7B4voEz_n(JiwY;igb({XHBu<%Su{unmTp=zWN%SR{hAmsSYS1UAsX5C-
ztLf(wKGuI*Bi#)6%LB>p#qhi32$A$gjJSL278<+XKg3&%Z1yt_Wfr_*lUN;wB>efF
zstEe~srJ{@+;;DEqT$c|=~Px)>Qi4EqPP&{PbFE$BXcJwo);C}>@?MXTQZ%Qp<<8^
zKV<IOUwoE!9e?bM+rGVR&7`I{8l6shW)TGUmpGE=zOH&WRy6DPti1702=lia*L4}K
zd|SNxi4VAR^Bcbj2fs9B&_2z`pyMVHrSp3LFd2GB92%svFS(+Bw>Sr(R01SOJ1k!T
z|BbORF%ybZGsBObI1#LP2+RakkoedViAryFWP+-qLY{aNUjCmbdE++nGvas7pFDFG
zT^CwK!M@)Is1F`|De899N=0An*g7ykk>sXbyLT7*&4q5^3~TmEK6}=PnYVT?zNxkN
z?YH$_Ue*Q(kv;*A$M@^Gv}yyFJD8odfhT!2_-EXJNP|^CX4L9d258E7CG7E3uhG+x
zgwa=WSS8OmQU0+cD#H^Te^qT>qY|2e!UQ3*l>uVIr7KoUH^xN{agVu7B*PrSGrjwm
z{2E)*E9b_=6`ABC^bjAZl;6ve60>Nwex+i`wyfu?@_PLem&v`)@=sQngJ(ROA??by
zVIRNMvj-UEy;E@*KsYGZ;D#rxHOvi+6P-&?x>etNLZ-wdCDHt@hf)Wgfkf3U)jsSx
zV3-eO2&!t}*FQ|mEi4Z5V|d8H)H2Qh%f=IXc6|s-wUL->YwUN-)1TE*N<QQc7>`pN
zIrXVi!^mzq5IYbrk;C!E`n_$`m1g`sLR(L7x3?#%IR0ybdTHbMMnhArE{W?FH9fhs
z$&Cdqw_TH%-y3{x;9u{aw!BRgguO1ZXj(#vkL>EglSEr?4-$DC;2v_|Dt6qbgP#J$
zT=Z%pmfv-u5pw~G=ZFIb#-iNg<}2v?N@d&T&C%j4x_dd6p{L{3Svo;2M|jxw+F=j7
zQ(RmOJ(2H=lh7xUbH4Ayg7yc?UW-=-=|0#LdLhu7{Qx>!UkreE1KMJvh3$A<CSJJU
z!X(|K{hY<1Cb7z&I#~arjmGn`vWeESFtm2_@US&&>%N@5gH3MC6E@B)*CEMu-SfLn
z3Vg6FZLx-Qvq|4tu3DNJZjHehoEILO;%mYbp!gf9-=m&8Yi&i-8IqVdpwuEs_^zOe
z6p^V~dmhJfL!lh7g8KSKCGFm|&v12WwVIC~$;XOM{=TVtgKy?9kDKH&EUbRVE?p+A
z$O#J$#*S${h3*q0(F#TbLMv6#Cv^5K5!-e}RLCcsDKyUC0GYac`OwN4bv4kCqtH#F
z$ab+Q5VZN2-aDP?X<iJ)0L6jrVc3x)19x6WBxQsR11bhb$71vcJ$v*xzu-#CvTfVI
z*3wc_eMKa?{CpKI3~bOx@HKR1QLqJW+9XE3-Fr>q0{H)}wwCr)`<r@}q3QqZzG3V>
z<W*>)QLwa9B`#7EzI~dKL^l`)J(Q{3jW9l&*c$J#*26I?zt@<716vxp|4ao<#$SK=
zk$zlF4GjfV_6;2)wu@t<liHp7r&T=KhQ6Lp-|BTe_ieNb+O@Kv_u^{{iuQ+eV%_wa
zc=+~R%)BiWPh58NjqFg&Wjk_;R5~~z!vOI;xBB<G&A|VF<f5B>%oxt>Bn2#GP3hbL
z5{Q|0yVI7dPoMs6dSO7o^5XP;bK-KFJWa_t=-B3^tEu_<%a`_T+YZ;)w|*5fK~~T@
zx|tX_vT4(A`IwR|rLuf$)KYnduKNg91aoUNUgKrO@KQCve8^JsW{F~*n-~BF7sEMo
z_5p(+cn5EZtt|nb<ZjtLrN3#*rYOo~w63}n9xE;O7$!^{U-a{Okz|J7ynDBj)GOAb
zW#gwuj~_GkgP13TzO23bDu9-eOr@iF*p)P0*j@gmXZhycT>3-|49g2jh*gx+o40Ly
z>6S_nz%QK}v<YhJ$;sb;(>oY+Bq=Gwr9cP9sX_?nLJJ4|;4=a#SUtUVZPKgWAKBY@
zyv9C3UJ8n5@oKwR3Q5Amzz1dycdY_~iK}D$8ulw5lF2YYwlS#La~7o%7<y-E^ItAe
zFeT{MQa5nbowGkqU(~ME|5OBVA@T9$#3f|Z4`Eig##g7>yHCyw?)&d`7>z~qaDf3J
z?S@X_OQ*KKE1ZhOM3M;;?t2Bf_k}hYJ$j#FE=en^UGUf|qa|?#Nd-g@cpHziATRIe
zM{{&H;WM-jGpIB4Ziw=h30$PdK5kJ^CCk$->WzzN`byXV6_v)6FO1oi-R{1{G)Y-v
zwXJn*c-sDWI;M8^GMsb<-M^C%PE4j~&dLgOrm7xgU|@IY5<N_-X{M3hK!*a`8MZ};
zB*n|*J=9)j1}As!{IaAZx^lKkw?+R}MgI1;FQ@cuKl#EXp9Ki0lDYVZQ#YoyN!+6`
z@-VP*pQ0n01rMj$*mNmcJk^jk(iIPncF%99F5f+DNq>zCKTl<a+mY6g=IZLvPv}nx
zE4V{}cRZ_yqGI%o8)_j-LEIOfd_=Or9?fq4&wi7%i`bL)Gj-(_uhSeeX20{JCr=Xe
zgLQ*x*9P_v?OBQ{Wb0bJp+gTo#n;~EQ_S!!6As-to&9=6VyRs-lQVIvyyL&`)9Bwn
zz!~zF$8PJG!j?oJ_>w3U5d7xN(u3x4iHWz2K4FtsoZ*+mKEZ?`?efT`<&j8y0)u~M
zwd6Z{XKP)g)s;<+Dge9pVvaVa*I@K${6{7i9sJSZ<m{f1VLf}+!_$Mw!hCZ10Yc)a
zkaz7!{x5%&fZswecoXa4T@a@Mg+kj=(cA+b#&>n_D1=>i*+L4!+d%8F8N|Lq`}T+t
zSl3xt%o7E`6WBswVfg?i0?UZ-unxmI9epK*Ey<BW^FOIR@g4G}lH~HC6tnc%FY>Fn
zIDjQ!{S6$&xVR}ZXNrE*yr;Nno=eC*Rx#{A=)Qr8&{((4A!DP3aj1aXZm&e7hd;bC
zmy6>*y<KS+Y?4vx@cY1b#an^1@jd{=JYd>jk6qH=zIAJBq$xo`Kgd>*UGkARP@)}e
zN6*Jx*mepT%_dl`r{MG91J>5of~;(r0GF7H65+Sse#1^xe^S=#&nWCrcau9I{KqFI
z2Lv2J2a`tZf-DBl<d#g>NF~f?7@RL`p)p;aZNT9<kbRL;ME=Y)#`)zu4HwESDS^fe
zHp#iCYSZI28Nd2N@mTz&`285)P|FImY4;$QahGL3GLo<0Ys8iFiOm8l2QbN^2q#A}
zE3W$1{Sc9#r{a~jwCD0TNB5ioe1=!jFkESPAI#NkT-cMHx_9>izD7odz=!f57vhI^
z@2=!tY<)bx$}^pNhWzXUmn7Txm0POlRlr{U%o+E!Yhy+}wJ3z_fG532LA1!p3A_ku
z;}Qa$OSh<wdMGJX1689nq3MO)&5H%_<>qE1CHxpC>HOc-b&*aJkn#AnRgg_=A(Zhj
zhSit&SiArr;P<Z=6&-lo$jPEzXxHcsJRK19%rV25;p%<e`3bxezKnBT<mBarj^4oF
zLj<>Mgg5=vLe!a7J9KCc0w`!!zTB{RQ(Coe|K-!CgthmxvYe3A<Q`xv3LlQoucn7g
zxjH8DZ}IBUr;i`O6B>`}E)@_~YmkiQ8}n3iTDy9!865^^E?R29(l=)<teekmWv<TW
ztp{5n%~`&3C6jY*b3u@?I>*6Czv_!U0P{K&KTlb>@KCk>W0V~bxTS$A%F3+$S@v3;
z!cH!FPwo=xPBzYD(BcH24Az9_XiP8Zh7CraM@8Lx{rMX?Cxi%kwjv@(5Bpter?)PG
zr3vfq41+^TB-`);0|9p4uE*Mhng**A%fCCiQf2@>&Aa`<f-}MdLx>+SBhAN0sgDNI
z7T&;0&G0=J0FQjf&YhT5aaQ|@U$lJrG~>j}-%M{#v3g5o4~3Pqwu)+m8+&nYHvjYq
z6PkY}gLn-8t~5Fj`L`TS9`boUt-Lt3320|#WIC9=vra-#97P;6Q5}}Wk(QG+YB9<6
z%9Xzw25y~j2t=0i)PT|y->G1Z(Lbe&a9J>&3^qi2ecTsNEcAW*?l~`AYVIYQM$*hO
z-R=kai?RJcec9#miPqyWbhfp!GGFnk-LJ!jx^|diYP#^|MFtIGvFd_W0z8YaI`3sw
zf{d1<JlFjK9=p^1XZ2-+F#s*Yr-wzUjCSkqes542VljBk(8{yE-`C|gq*MbC<eCj%
zb!7fOT7WxvaDZNXs;WBYU8CVkcp6FKFl?9@P|jpN!Vy^%c1G-x*zZl^ThjGNgrHzk
z8maM)Y9T$DJ4yEZ%OCz;V=!0X)xSUgL`-$1;Uup5GK~eaDILtcgr0_&P2M*w+#5ST
z#_({Xe&nqY$gO7UYJJ?C_2L<1BIN_E|3<Uz>@*Y=@K#Y&QYwA>_B>wE2w6>aLp|cT
z5`O*V7cy!jt&@7uc;_d+_>y}Z-n&u8&)A9kLV%!|njq$Ufe74w`O6<BeHCeiqO|~!
z;{eYJ>x*3*Qc<&T6UzSL??lV<>|&!K{}t;hG4cr9f!rBw1(nR|QTy3lID@H=7_mq3
z#p~AvTsTCwM8j!9i$FuFQ=qep3wY;xC~vZJdMzQE#!xeIXIY<fuK}JSKr5&sZ{xgm
zXEZk<;_AYWL`g!#Dk2<Tf<^G4q$A8G3=12irM2C8%94#8rObLLt*ngPzkixS4ofT-
z;xB8OZpfaUGUWzqFj36{k4nBEPeNwf!+HRGJUfz7Dj=A6M8iBYI%0?q$QTIi96gdh
zF)Svr=W7BNT<5@mRipM32w*4IF%fz0-0vJPYB|&(q{L=Zr_KRFr`1W=3EO!ao_WqT
zTRZpF%vq~RSB143>(NRT#{|m7T{Di~xp4!4);R7gsp0K2MRm(5t*X;b^CvD67OJMY
z8qcfoQYmt$Q~-8dLN$k3(e6XMi3_YnKB0xj1f>fr#uE?(2xj?F_d2v|hmnK<x<z)d
z^M~pAQB$0EPEZ53_FcO+nIRw0ZxnL6UA93aK$&;$-CHMQ3U7Dy<wv~DjxE~qu!7Zo
zfMyu(lrFp{q_SXltO!+&F=G|`cUpl^9yI=p#cvl@k_TDjo3jFkpCSo)cVJ(yy}F_6
z&`;C3+^$`a(0@Iie1qe0?b?x*O?((!bTS=CJlaOI1RO=CxZGrgNr~6hRWFm?U}0%X
zg$%C+vquPVm1`P{5Z;S`#w_>>KGFm=3*0|RpW(m;pFaB63uXk_9-ZA$Noj&Y&i(s)
zDT?9mu@UOuWgAPoo=ugo_c9cRBh$60Pc&u@>avYujxG7BynHlbCpgYOOn_;AKvPp+
zD+EgE6M!i+%^$lI=`mQ$g*C6+t4=U8LqaqW-6uCT+~)>_E!=oKDbF#*fEOhEKuQO1
ztZ&<@72^r7P|IU=N4rec%a1~XK!MDUaK*sd(dwOTzfHLE5hvr%o;g#qYk(Q6kM57A
zu_~eoJ%f}~t(*VCtQg8+)USg(wY6%qDK-4xG}{+Caj3y2H#j*0{<G6dI_SBR(FkE3
z`CZ=tVV1~;=-GbL=szc@(TjpF!hirOe#eXr4vv@Xq+&o0y8^(2Baiay@yn1o-_IUB
zx}4}i#g9-lwGcr2v}FsMEfY>ruCSY7>*+J^B*hc5L(frtbz_j)nb%Ax%fE=w1FIWB
z$WXh<9*p-IQ_NE$dMc=rUXqIJ@lcaaK{$h~h3fH~J<SSBWyenO{0KH?7xc+$N%f|>
z-e9_D2J#1ur>-OlVW(VKISd|57Uf^0h?Fr*exLKLMBl$7X$`5X-nFZfR9sw~GR?3W
zde0aSp{=f7TV3ASeGz~G$<yxM71ZZeU&Od0-piqUPRJBGM~p3$J2HNo;a8V0{_W*H
z*0&B*m>_4gb?%Tg8a;i`(OX5XCF-D7nOnZz!lBcaQgN;C?9CnYdetZ{E9Spjat)E6
z8vE8Mb?mqrsiaZVOoea6PE5ejhDJxEd~8h2cX8)SVyR-jf-%C-eWvr?$Hepp?Iw2D
zbw)`jpuQ;`!uIbULl17nmC=l*=5n@4NMoSt$)!1Jy?0JlIC<)n0p-_cdyV}`q1yu(
zDQKMVT#g88=<d}(rku$w>}+PcPxP;FNp7>U{=R2N0-J|alT0jBr|lYe1_~}Ykacrf
zq|FK|_P4C!F7DvW4m`nQr+IYYI$HJ)j98&!owJBNnj5w<QCYe30VAE$U$n7-Tb(!4
z{^pYupgAl3JWAa-!{!RAq<zSo7nSedwM+U;^*%f;f4uPyCGUCi3yX}0<;E@@uf6_5
z@v`MsxwuFoQ4rvd>{BD*=g!3*kGksi>v!eJlZYp&5chvvSY?7$FHcPPe-oEX%?tv9
z2^I#1h7ZP4O*pm3NU<L5Ub>l_mUT{F!??Ct7H23Y`YOWrl9cUv{KuT>02F6H8@b{3
z;t_KiaHxKKQUPsk0Z!xfCQ@y^BBTW<PM>}ULDG|_Pi-q!aaqH;T8s{+36DL$r+0u?
z*flOBQf?AXQ<tTbn4B{7-+5vj<i4*hAJ_^~nK>M2f5Qw&{qJkmlQ4y*xOel7hrRUV
z6OgUty4Z*M`%Ann1eyXY{kzvZay*08F9NFVvY|>L9A-#2Z`^ndbQRU$qLwtv{O;YW
z_Zip0=y1Q$;R|54qi0BQ@YW-zE^GW#P`VH9+c)#+)AN@3kEjHuM;RS(W-<W*Ga)x|
zRL}MY7F~JyQDa3v$D5>aSqo{GEOI(hta16-v#9Ku0|LZ-Vp*ZBEGDX;QjO31zpBnW
zuEx9#<Beg&OjJ{rY%R8uEg}@Dm{hc#Qb}1_D0_vn4kyGQ%PBEYIGj@wl8DOKq9R&k
zZKOh3Q=*dI?^Bj}{V|`hbe8A&J@<0m*LB^~oa*pZ_j2|Ta;D=kTsQ7*`HTsH!`zuz
zbjIxtu~w|Z5uhUF3^hna!8Ef?QfZ%PZPyiet;qg1GrLYDGC*3aYKHwAF>1V|m$R7s
z2BN4X&MqfzyLx&aP~I6Gee+R3!cH7cZUR~X;|g>+i8#)K<R(>ppr{27Dl+&GA>ekM
zxP-)8CT6@~6;X{;(F+n1k&`|Jv)rSH4h;hxgNE`F7K>wW<@^NI_Mw5!sTjBkW)r*Y
zIR6&_#72K`?nyKQ9IU)Ncg76tKb<QwwvjS?C<{al;E>dmzGLI#>a6N4H8#`2!8MFp
zVL+x7)?<qv=H_nyGO^%K5-(;F&H|tYbt~U+G7Jh?<zuC7?T>a=@8IO(Vwoacv&QM*
zp+n{=EVcBiRoQYCM_k<j1N<MJc@1Xb-@VJ%`zIyA(No4e5P<VH+a=H0wIL2?pUU`<
zNk?muvCSkNNgNio)5>Y;{Fb7IXR`UX$c{#i7;!}SIZ@xgIH?YDCbt9?;ig<Cw7&?A
zgw)Gcj8ogY($Z1ZSSQ9VKKDpCiUZmS+=XmI!9wkQ6;v0gBkurma;Qo99TiHRf6;rk
zAkbNz<aB6Vxp5<`_@uB`QeTI>Kw&!lnOhcg0rY|vihMbG3g7Lm{S>~#zPB}5ml*DG
zX?7)io5%Dck#B~;woUcYO>^kW>BecsUmT9}bAkRP<cd5OaW~7CRGfZd#SGZVqvB7G
zR0$z21M-XgYf8XK@9=l;7R70$Jr4rSpe~Z1;oK#!?zanGbi$zaK)Bp0$Jg{EH*!Yx
z6`v*&JhPJ7=ugePeR~mcPc*IAU_o$j9d$o7P^cLjmF|ISs~ImGxWlq{O==~!iDgb1
zvOh_<<bN_tT+d-3mU{a7j0s{ZM-JEIV$p<&9x^iEGW(1KRfwwY=m=HR!9lff|M0mx
z13iqqIm<}IMGXWN$)F=v&jv^=^6aQ4|9G~z!$x!8!Yy>1xg&zs<~}FcI6ZT$8LS^`
zXQ@7Ffs4o}O}6w1=);kRPG36AS{k!C*?J75_mwM+H(th=)OmhkK+CE5<Og9m(r<TU
zWcI_bQ04c0DcqBkl$4@AwDRj1ncYYlmTq76`a$9C+u^G}LC&)LNPm5}vk6ngSeq_2
zPvasY?ozju1<fwbBt3i74&~{u7=2dX*4xXA0D5D~#_V#3(7&Z~=ghfnd$RN57&a1Q
zKax#$bPRydAZnnH(bvJTR$ON;7Z395rlNAkbYau+-2b3kJ1_i|%ZNGe*ZB;b^LoJ0
zBjis`ZlXkB_7hbKd_g(Eg3lWdyT(~TLX3TxQ2VmT)<dJ0mKT@Na7^fFPB5M9VQM%1
zRg_P%YiNGTKd6LR6!e_NLYur2RQO>Q+HnJ;_hn=I^GDIXV@iNZM;^Y4wBNDiRb^#8
z+<=ghX-D)DJ!nCuOzF`0j??3`KgAi_O~<(}sOR3*)QE2EF^jzoPn=Ez#zINeauOI@
ztQhJrW5vlQk6HKi@+I`Q8L(5BJoWC|H?Hh((E8%>`%kR)0l39;Bx|f%bnFxt$JBOO
zfmR<Wb)nBi*~-1r9VYcwGDAK4VxjCbs05DU_5}HbMcyGNFSt95ejKH|Ga|xyYKiPG
z0!ZO4QO-dF##+?X_frhw?=VmMOvn{0_v?3*s;7U~W@RTQ0jIwsRA!=w|NiS)Joyzl
zr?(hL(<(AH!HN1IA|+<>;EW;p<^y6on*jg#bvMVEJnj5rv??wOHZVU?pT3}$GPY*x
z3xlob9`YhWY--%PYn2h9a*hgPgrbHMXU;?{+cJis{N0EJNssJpEAXeipq_vr$8IZ#
zB(3D*fAHcZeUnnWKa+9ow~{r$QBJh|xiIvVK%W<W%?YRd_v*=Rrh{**ecqVdyrSPx
zcVQKBl5k~%xp{{*A{TfUZy%JlUEPr;rsl&3|D_QcF)wTB)^5D4M#2@>`U%nfA(720
z7nd{ff~isNE8v;(wE?B?4smzRX+6Hyax|=$ox}2`CdR~=YVWXIhDpA9KuKX%mQ|nU
z2~m`QJ&c!!E3;JVGbO*%xu4H#(=Q4S{rdIzm~7a<8U66?9mZ7!`T0x{c$Uf4<d5!7
z8$Uq`qbk7E$NtNOAk*HecP15b2+_05tjPHi7AKR%jQd--alL+i7IrwmL-Kc`sLQ0r
z%rEA5nAJAf^igXMr)+A!@hTvL!E64C9kAnfGooK*-=0qPB{c`%M{Rc9PYwQ8+OVYc
zOqis;S7%j`z-W6I<-pFC{MO9e1i!xaNY;;Or`!B^3r%JBb4x;%wUb8pCG1T3JVh}!
z@{~ZK8MyytMTNbRx3lq{ecKVl?c-H{cA9F|6DTyo7roW^6nJS_?mzi-cnC%sF`jxh
z4{#-}N4IX-9*ZNqRq}x37G&q7JGBmo7Q2pUB{H-AKB-YCXdO@@R}C38$wy_3nI-)#
zXq3F6Kv4LB>sz%OiCHAA38gZyq2ac79QeR}((XD^kd*gJLj5)IasvNi5w7KwDV-Es
zgAN!}Ta-`lWoGH((xoum^+AMdt;F^G$v3*Ici_dO);$R#9F}JpO<z{9!w(V_){Z$E
zQ8-`2mdksY?dIktlmPVmz`JCm43x@ka^si4YJ~$q*^UNF_@<IxW^MR1&_Mt6BgJ?;
z^GjyR%3ux|jU5_veQ0&77-C7(`xg!}G?Wagoag74wLh30vjMfSF9yEC`9><2-^h!K
z+B?Z}+TNYjlJ+|Crh9Api^GX`I63b3>({4`Tu=8vw01^<;!Cl6M>&&&t=!&y8^1VY
zJA&p^hwcV@;Y+KSjhJ`uqQm88BT9jMdc^j?8)UJKxiypmG(`yoS|}I$tFdD_>Fqe@
zZUE(FCKD0|pR9?U+DdYN)e8!{z<tMC4d|Hkb9HFmiwiDMf=xhTqHRJUqvbWg>EKR=
zn*^6I#zNw7NRqT45m_p*3U+@~3+Q?R`MAf(9hQN@1P|kR@GsosG?lMsfAsF!+V7YD
zWc5j%WruVf5(JL}3K}i3TBlAdJogurT)y&FyI>eF5tlC(lPCkvXXTxV%c{`T*B9h9
z91N{tkI$$EuL9wr29ceqxpdq@TYh(1yoqX<IO<eR&oJ$)YJF70&>j(#B<`WFP~4;R
z-`#b5FcW81GV1p4e;fJTq9+O~CbYd;wcI$a_!q4!IXUy#%<w*hVKxN|Y?f+qI0FO<
zwoyh#vfdjsl*24|!-$W^s2HIlC~A>3YR31;NXogC$3%kK&vA$->O;TXQHi2%?Y1DE
ziO7lpLr+|<G0<ts;lTUqW{L-L6U!HU>6l%1`SX0~^~2L`g;|g^YI9v<f<Z#m{Xgs4
z#a<c%LaZe;P5J@Nq6fxdH+iP6(9yU(WP6~^lqttWi)(3U#DeC}e@?-NFSR)<Hb^RT
z^09X^o4;O1aHEEtZmx*jMB0&t`^5H13pY)z2+h-L{OG9>y~<jVMTkd}7Di>$rEml1
zb!{*j-gA5A&Q;l`4oa^-u(!0_1QQPXaP1w#W7^0z96X*8)e?d68vn=RpOaR!I!B61
zWs@Jy1xF=W_H8;}vO;OdFr#?)O`;q1b9t=T-p2=#PdH77hsty?j~%zfw#zTSb-6fp
z3Ry&QvMAYqYRLQ@&JGTjj=9*C8akK55g(>AGdI<_?B^svacoTO#+?P<`NE_Dgn>eM
zmPZ<V-2T0S=V#~SxZ{JkJ(D3Hy{o{AbTV8b5~)o$BAe{JTyi21;NZwZD($IGza?)x
zu41ib`P8@RmchojPCkBPCP&p-CGRK*;P&Ly#a)|vB(?HO?(AeM2DPtmigIjffaGg$
z<#dqfy+tILKnexsLnUJGH1F%hu&H^SC7Q1A%#o4kLJGLZY!rE^8rtz~iO4UON|M$0
z6pp^PF!gR;+(CEUfc`!o+WHt5UfQp8Ea$-;_#5ydZKcJCJB7XL<bR^f`VztCs%Nh_
z@q=&lhj)fgmz={~f!VA$oKpSD)vI@c$5Ba|#R|&@;BMPLQ_ER#H>%sTqWv7w^x*0Z
zek{XW2zp`It>4!nrPa82csX*ptG)er6XLA5+}u4Lb}&mJ$M<`(*+Sb}yB&sbOJ8dg
zzF|8i&19^lN_ohp%+i6le~~A$%LQe+U@uVeq#3p&tqHIlW5@VQL;Tt$y_q06UpQc_
zh&V1A-N*1q&PwS6OO4UbM91PbmwKu*`A;70h+))@;DdTPJL(|9exk54vt)TH101zc
zZ)u|TbcDKE_WE_g^<P_H_$Tp&LT#BAVj|4US;-iTE^zcsA+Cv)F{uEUiyLO~VdjDb
zj^#eyIXCC;30ma8c9hz%Uwj()Hw>t={+=K_`Us+aPc~kFFi=hHaE|k8yJ7#KfDJ_n
zOg)JtjCqc1OsD&p*RdbGSDekf88bAaZ%&j%2wUnU`Yv<4yev|pQm$u<$}49|Nc*^F
zOi4zp2k_`;tQNh>fA(yhM*WSK**$RZZP8%rm2}6#gW1Qju9Pfdt|~CUHiGVZPfyMo
z&|O*CG=*dR(9}_o%|meBxqtt0xtumtP}avUUHPovxva7YKE=LU2bjxRM`lY;y|_1Y
z+znnJZCJz7TENl3X?@<NU8|O4>Fn^ON7?LN<~Q@ePlr!7*<Ej1z1IJ;@1DwuP79qr
zZWV&f>nQfruS>Tsqb3&aolxjJu>5+O<A#GA`Q@vRJ+KCvBJCqsOKH`cN9W8HqsA;d
zzPB{K4GEK9PD^<Tx<2+9>^n{V^NRE(l3%apg#H7Vb^WiSS#6p|FXArMr|C~S^P4=y
zuWG{lkY+Ul@ABafdwUh4puzgdTdBnH;;={t|CG(YJA2kFTxfy8xc!KPa(eHtsR^vT
z71)06Rv^?n{`09tNesvD8!>%gm3eP5n&b%AHsNy8av<P*vQNLKi;P5vjvce{IH1>g
zsCveACyx?%t9DA}=9g){Pb@or02&T|0>T6$z}^MH=ty#al_YDa1G8?ty0~&?n)iYQ
zQ+%gmvyl{;A@%t!BKAdDDLs6uS-{r9<>?N=z4gYgX$)I3%(Rcw>YE6mUYrTs?>%sW
z)5jMhwL5KbUH!B$L<eB2a>fy1)f8c`kez@7SJc%p;C4_N6gg(m6Vqp!wrWGzp<Cal
z87c_9^z})P!CB;w`u&UIifNZ|2|#~G(*j0m?>Wcs+9SQ^3}atK!+NS1v8puHhKYlI
zu8*&8e*9hmM}*3hvwTmyP33!L@~I|RMjB3hZ)pCN$_Q&9?TAg3nIU{KFp73sfJ&NT
z*fB$Yop{%VLF0?1W@fFdZO0yHs;l<xW1D&5+<~+sI!+zz_G3&R#}?87i5-)sXf;gJ
z5hG?egQOXHxI7Sv*G9h+y%#&5+a&)qLHMrON!+o(IH|!@+pV8gegPPeJ3S+uEC%>9
zI8RETURuqJ({PM66)90NtcbX0;OVk(uD|~@H#dj*CtW^2yV)(`7Exw)u(P>&DOI-g
z0nn|}mtajz&9(J+?0(;2W4JHTPe--<j^~<7qkk5SJa?dRBL-WRwz`6}by?>E2T_pi
zj*&YhlB@eYZyml=Azc7>?K<;J`9wHF)eG$<*hc23c;G)1?t1cTKNPb7dY4V~Xo(*P
z@>3Eltpii;j&)|g{;Rj(dbk!9iPJi6TmEYp6iGGUzh1!+9{n}Nw?}@o%Dnul?=Ba8
zfs6*~C`y0cajR>OwXTO!c7~jfY4kSz&%L14v-<afFasdV=zZLMYl)+<%Gd_{tQJ_t
zb;&u#o04%olFrOouwamNE@v>pw?bekbqihvmS`KPC~e5zjQ}<}dU7*dtY<P|up<3w
z){0;oo8PjZh?RYw2|n<yA*VdOAd#lJE%NZ_X`O6Y8-H{VS)1bIXs2z^-K`Rf;=2c&
z6j(XhJ5B_`>WHYjRBuydTR@qdJ+^?6qHPL~>Af+`L-q;0CBu35h6JzjGxn4ltCkOK
z>S?O}FydNiRhda2Tj3B@?Zg$ie!CI}<j!r`g%KXs_PUcC9g|WA&rDYd{(YV#X~1NX
zZ1hc$SQ&e#dgsm5SvOun)tDH$b?S{o+!KUfYc=+aSvDw5aue19R(jPH`Tcm5`Az)D
zAt0>rom)Cj{Vl}=gu_V-0g{OL{UT=G?|fQ*b?9bF@e9kTMl;ig-4lw%&E4L=F>&rW
z-5^TYY~ZDAQKrAEXSeUnqKie==H}}?{-N|L#hES(8bx5mrF28d)Aitq(SBPj4ic4b
zyz1L&3x!7f=L$wd7QR<#rbWdOPwD3-vD9#+<;01<IO&`LvCi3gT5s-y)4FNz_k@RE
zv^jN5Ts&a%==iYW+Uc6gU~=Q@lUI(-$g=r|Zud@~wiMK564NJD%i$Dw_lgsc!b6Z@
zJYv}|<}krQ>X{Z|$n^v`2u6$MuUe!UYj>7m7zRLQ*BRC_k@7Pxpkv{G`1ogLU2PvV
z;0$eL>|hZL>1?N)w{E4cZX8_*l_Tfo{U`|Y#u(yZ=E=X2Uz-_!o5=)+)+(89s{cYI
z6K(Bv<tr?NIRtDTt7O`++@0zn(8}<xGrJCR;a>c`yYqyInC1U(x`~M=v{nb7155)>
z9$jV~FO!9j%(v>T3dJQZAvSg>CH?3vR+AVy2A)5BSX?KZs(*<D)aK41?M%+A)`hyL
zeZD62IN4E~m1oVEVS3;xH!tULzqvev03k;oP-M?e-13!xWw(M!xoPLYXCVksVJd0~
z3x;SM-AWxYc>Wx>zJI@@^3?SjkfQtnBbY9{nk_UX?D2T!Xx#HH@Pz0*xM^NkQlK#{
zlztTh?oajgs_0HmchYyc*wc3F(2t>b_iwwfKrkYdDy;oMvrAvXQxbT`F|N}L>6ix+
zK`BFuv76pGe=dCQ%1IXEMXzbQZsaHlg(()1f$G;PNeIbFNrxZ?E@GCG*T%g~tA8lJ
zU4Dsu+rYrhX!?TjN5GZx7tW_DH^?5q_Vh5T13gAA=>9lr1gR=@VDu1Xk8A46JNrC{
zG6sFEF{q*bIc%-D$wHeIPMnn5#oc@Ks5pbrDDdtv7yV)iZ1AcEBQ7C?7#x`KxS>(y
zoFu*<*#8jIJ_PQfYljaVDrHn6>H7NUfz^-+es3QN`10t?{CzoNxpXy|g_)WCw6w;j
zZa38g>f%KTE_253OqdoWw0jIKE?j_Fo5B;K_t8K8XV_>SDGPcOKC7<dOzkY*I}mIq
zGxKQHTPma2ahF$)T>~Ut(`IH!^)sap3BwHx+)jD5YuM8g)BCWt!FAd+$JfBM746En
zn{2{3lD%<&CAomk2O?|4>PnahHOJR6^v9uDmL%KlMdnU{%JX6=Vb1BCMe1H_NNq35
zDj-TgGqdUeZ-f;}@qf>7GD<6Gw3(n7#R`C+Zj(TCndG-=HD20*bSr(+C~TYp&+FSP
zC?F8^X+cUOA{?@>^M3aJ79ZB7r8P48k=4T6UB7<4w88!S(wl%+evp8bdW_z^DhJd#
zf!PqTT(T`PLfBTiJH0NLVh@Nxzl!ZIy{O>xO5vw`W|mmcaq*3veR7g}6z(<fZr`JX
zm#wJGup!Yz2H!Dt`hkdgCUeKPbs4&DwT%5niI%=fAc6SRILHa!b9fCPLY~qz%igMr
zt@-}&xyJ=n?oLZfBY(a>I_>1FHqo8fbQsN0kFyDc%qM{E#p!?z3vF?Scdvla4b)l@
zjqdJ)J_47$Y*uGrlmLAS(gNKsm{@-`YEOK_1^)tZIN$Cwtb{xrP|i?~c4(;q-zI~}
zgjqn#5mcL}ye5f61yI4_R|<w`ki6R_-y+mzf`h_H56diN!h_^P;0^IUgj_bKt2Y?o
zsL^G}428ngL>>_EM24-*qV)8rEQsm&tYWF_Tt4U><mH^-rU$DJcUqTKBV87r!Kfx9
z?!;exRl{UinQFo3PEbePXE}moMb`7`&iXFGsFL6rYu8^jjJZ081JGoO^uCH2YdEPA
z^#f!~mhQ|Cvv7znvRX_dQR69CJkYcCQc+>Ok|sZwpU(${F)(lJfx&Ml4`qOe4NVaR
zrSf}XGNTFB;vSYtVSp0f!Kz8e1kwy(MW{FYx^hLl>Y_&ORK4vM!Azu%j-62O2sM)%
zLwq(>p|%DTq1$C+S2`cJP$M5U1K1ZdBTg!SmcFho8WHl*G^Va(M)_E}!Nmaq@!7K7
z1=x7hcfLX|A<XOD-1hF=d5U?PUV?M|u$Y8|$xW*U>FVBi{J4=ShfebJ=^E5|8Azyk
zqVbB0NleUL;z85q7bREJ;v`_gix0Mr7=eDyzLB)^M$K;Q*REbo@JJg?S=P*GrW^;>
zJ@L0_E1nKa_;K6*DQ;ei{z+k_obh5ISWkTklyA9o>OHV7ga+-j0N|iEp*|$|Kyzne
zf~sUXoup7cUP^I1Vp9cWZ^=c_3N>|gv=O~bLWcM0Bc&{YWYxd_9EwXK*5P_=H>VW0
zAJxM)IQSe01kE&NKh^Kwlh5T7J|PJONEjy$$4nM_m$OsR_`RW_ZB}grw8Lcg0rq9I
z@yQl!BPd0mimPWu_gQvYQ+mAJ^{t2T41=-Xw_iVi(Fqn7{YNoC>73noAAXL=it|;v
z+<1S^SYqN)$Hc>c>*x~0{cQJ*nCuhRpUT}4XO|1UOjQh_E<W2qlfznp;I3x0_r!A?
zwesW}F;t|Uho$J_I{fsB6EW{M_UD<SZa!*l?94o{^vxS$vWI-cVc4tOGdf2MDReq*
zVI2%5vvuS>FZ8vaD4KE6o}PMZkT6dI4q!dQ&boOpgo*UtK5EHx?#u$L!?pmf$nly2
zdT`mQ^Luy$F1ud!&lk&=z>6s<E9;#Wzg!yMPpv&_mZezbM%`Ir)SXU+$wbJ}B@akh
zaOAC%;SD#}rB8wuExLDl?yj7lN=r-CkIg7yks*#N6{W^KZ9^J{O+eIqnj$AJQ=T}m
z5P(L|GF?#N`M~~TP{6Qddt+lu$j<ES)K1*C1fQ^^;xgg{?v=VpN8cC4rG9Q~q$IbE
z>a&Y^6XvT9&dxj$9u;zKOrA7gF1hqwRTbRDunPeY#pc4`AlW$fK2dpVYStf1P{&8?
zy-(Ex?e4FqLx)UHUwJ<>^N-ZjAzEHAHVA|Q8;2OBXA;z+1Iqd<3$Zq10(xHqYXe8m
z655#^+2wZ~S_;^T_K(!+-H5M~a_61qc{}cMa$PVRRF*RACsd|ZGh*h6(p=@P--*Y#
zk-24_E!2HzLW0{`Qy%%Ry^@mj0gYpU5#k7f8<^LNk4}@Ilyg~*KS|ks@JV0+X^_T!
zz}REPf+Q9bI4v(2E;$;no9kr-r8@v@><+O|yidD~M@d1CDQP%RuMW9iP2cmXX`cr+
z3gAv<CW6sE&l0hTt#+Hd!^Ps()Ybrb1}VC`MyY9e@oj4wYbB5d9sGrAw2?ZhTuEI+
zgAYG7VtE+@&oyvKK`Erm&ct@<+LdJIgI(hLiOWB|(@F~!!Kk3ggGgKb#bfXB<8LTR
z$+DR}bD8`iI3F8aMdAWl@`7F=G4NEsPyj<=rfW_0$B(`~zW}Jc1&EKYDgI+O451wS
z8X)FLwmJSg9{eYD-U)%*%_e8_;v`Sw`lE}=uB(KYIBPiU`>FzY;$H-8B-CVG<2TPM
z^_Wg$1kdJI5H6-&JWD(@Ks|!R8=Dv51e`Q*+~Sw>=+S5Dixx*yd_?H5#mcNNA)?VG
zE@I!G@L+cA7+Lp#(nK$8DGlM~!vay^!v``fgg*+PXgWwT9>y{O=iD6~^TDpR62D0l
z`h%Ia<B94*c(=5K2CRJ`cjS;ELxv6OX6Uz@G6E+O;`F+OD{se)M`cI;Ndx<`vTD!2
z8$KMH;c|)|<n=Sy^EPa8f+~2GuvY_(I(G%qG*4J>RhAP9+kJUIf(oNaBj|k%nv9gV
zAhlIhH?CjrB5c($T=o*4)Bzw0<_yAe;)f6SNf~VkOwj$t!Kx}MRrFYVk@l_E!P>;^
zg^C8aF#&Qe$q?^=SzW!L2P0>Jc6yLm@VYj?mPw1_u2L5X`(410;PnIZP?i!ZgbUtn
zAN>ZO&tk#^T_X{c7J<jtvJ-)$4U|z`w~|g3uNBBJs2}+FyW>*g6uqAfD4clk0tt?Q
z)c`opm%Evjr8ju+LKt;aIcS++_c<jEB@(S5XJUXzg2Y_HA?!rozI|yN_Ay$g!f-q2
z;6RK7+e4dE*ROBi4ehxgFZL}=k1|?(kb9UD39D@0gVQ(g%jEk*Hf3}VDNS%gWTOCY
z#JUQ{%!T8V)eevs8TRprhS0`S@?wfB&w9c838Djv7;5?zBSy45o2JoGbP1d_L^e##
zt%IA&n?^%_CA-@k7~4pmB7=Z!6+D|wNN-}>1lMpV-sOz>uC|5h@RB>lc?jWF3oW9r
z@5>i2z`z8~K2)L{?JMt}x`Kue+fRW(Nyp6KFo%(HK-iHWSufjs{(J*-Pa$|R2qssO
zM{)f}=5dOc#8JVrBVH8tv*_34AF49hiQ0h$O6>pAi@i;`a_iQV$0dB9m9Oo-Dvr{7
z%U1nb=^(F70J{q*{j=Wop9d*HQ*X3<Y5rR|5SW)oo+UW$Z#cb$Jp?DMZ@)|%e++jO
zG|^))g%gMKz@t-*`zBFt{>N+Ut^YGPTwC8FkBlGFp1%$M^KuCsvX&S1F3A|7aQn##
zTX#O$*Y`;_1Eo@Sz~EqqWdZ7BhANkJ)Y{7@5<Q!hz5L1A_b+;+yl8sGmMvS*5s^6@
zBWbrEG6iQlYt>mN(VV(GJ}JEHaAPW4(fY>0Cc^I!;+R3_lWj27Y!)KF`m}OvVGLs7
zAC-Hu05tl|7$|tK#QgGt#kNhyT9jRL&N7daO=L@Rh|ZshSD?0Y#+Vp)1BR@RNlF?P
zB$x^L{iRenDrEA8{b#-M;&#mt-jiQX;`8Z#h3&EQzZx268#?ocF%OU$$|urB{`hvN
zQRNfaAoWdh%yh-O;u>K*NVR#VV)Lu<pZ<O@t)a_OEs&F(zA3!*ZWAgw{ZO--Xx%Hf
zwNWrV4)}rg12x(!idX%|b}POT^O|2PX0<SX`f@R!B`!gkU)9(eR7U;8=(>mE_$pk;
z>k(8%63GO`iu+0ZR@i=rW13&0U@-CLhz6#UElP3jn^XPAx3-2TCS!`ht;^1>Y2rE~
zS^sgJg`c#`xV@&LD+{MvMBV&>gvevR6^|=H7_N!!j$&aKj2%|kZexDfxV-u8zW&El
zi&Myei{_Qbn}@9sv&>}{Eq|*=VeZ398aun&+#}*8y{deSw!+#bdme0xhjr^(5$%|!
zjh*~WM&9z1rY3Ag{};<e*v;HB?GG(N_w+7=W>MWk=mXF>;yLtdvjmEpot>#-SCmMS
zWr{K1aYNyiOw)EnMKQ&hiHH6h)0Wp3J%bJpA-cC1I!$jzy~1Pqxg#!qFdkLSXj@3X
z*NVG-pTf5MSo44FUiMa<M9Bw}|8mJ9JRt=2)|*WV3SR*8E<v`H&1GY6de#?>Amwk|
z;s5;j%5tObx2V$FX{m;Jkv=Lrv}HAP)rSw#xcd(IBFVQ%@t+?dDwr|ZCsi_JZ>L2X
z{)DSoVGk7r1=fZNUUU}P!uiK0ga<T!Wjnv`^1mOiVmh7mWkN$&$nZGcMc;WLwz-J*
zNMm~54HWqUc7|C0|Ec);!$Gtx&`Sr2!$FmxFSv2BE*8C^4}q00RwngOTj+k$>mWJ)
zEr9%ZTLrtemo8ss$*tB7OU60$N=5WDL4UMX@RUPWRMDA8T!rw2R_M1LqecI8KKT9S
z6&TLz^Wy<|C#-&PJv~Q73-$%8WJpfJIr^j_iDXoeenBSNq<qTjhU!&Vbw8reHVEdQ
zS#Xa2r?SJ>h$nowf@?)ZDO5IMOz`*cXv;ZApEQJ};Y53kR}g%2xeG%E{&=Z3f>ep7
zYdJZU@&WzG|HWq6MmA_r#BJNwK}%pQGcT~?A$S)w3ePFz42oK0JVEX|WQgo;_Kxqd
zHb`*YqU_KVqYg<ufBx4{GvVrd|5eGpvVVoS?rY)(^_OE>6<5EM3rPbcY7iW4ISlb*
zTK(sf;(I@bqlHdD91b@YhYmtQ+?f8~UsS<vJ7q0Q?48OE_V&W&BV?4#Hzl11071an
z3m5)Y7Pd67^-JTob>A69GDpl8>tQRxENiDF02M6on>jN!b-fU<WI|CzYg)OjC48AS
z3LB@Pt^IDs<d1rYdRTZ=o>+HMRW+bP5y<4%fhh<Y(~}neIDJ7kxd9*;z@Ne$>VmU2
zJDh{s3QeWmGI*yjv=5Tt(MWs`l|J1&JZB%zext?OT8Gb`y?6C$pCLo+9*_U&Vq^tQ
z%-lId1bxNy;eQ(kJD4BZF!%IcxXDR+=HDc$cBTwi7_zC+EwbNs*RJ0&LME^w=$4Hc
z#9Oa@;N;;UAPZb{bNx<~Lo^%df-y%2A+I)b4-5_I#28EV?AC2Sr!D;T&C)6q<^F%G
zw^gtMJ3F_1doCQDtFwk`c~SFF#8WLDuUh+kx~lMD$k3tGLd)@^HPys2DmA$JNP2oY
z>tQxtwqG_!c%NkLF=HNHzAT)Ag3C-EXHwF9%KVy_v@FccXG3tO8s`S}6*K>43XL>m
zBCWvV*q=<-N3zxn1fGe8V@EopU>L8ohThl8W?1V8FV8Q#Lj+hXvnnwCD!5GB!pI$o
zp-q~-&@sp&EVR#2LGtHqTKy!jjE}n}T@!pA7PmAM1!FizoQ+V+-r8ai8f<8P8ab$y
z>DEcTccP0G=m|ozAZ+6mYH@1ctnGh&KV^1F@Bx6U5FG4vJ3`!YMa;&EirX@KouG|E
zOo(a4m3@o?h+bT_k<RQ9PBMgqkV7pePnH6`f4Fzn?$f7-R|?<>eQzF}*oTR26qIh!
z&rrG^I(SgFk)b@D131&v8&AI9g0&$6pa=nt;fBr!-k)T+wNgpYHJeUiHZF8>G!j?1
zhvLg6HhYGk#=A_e<l^#Ah%WwY7yxqs{VOmheNl)fx+WdLa;%c2m>ObMzyN{?6f%!p
zjEdjj<|kCiPSHO+9PB(5LoabWtDC7cY(L=4#1rp0gnN~@T&0FjW#Gm&0{oG!XIcQ>
zqk*qz$n2KWJjawlG*0<Xsa)+kB2(c?8}h`lwPgw=astO-6^b1}JP6yLv6uk=$ApGn
zrS_cf>wEM;zz-Q(WhBB>8jdMZ1`{6t+582s!0Ca#hm@y62Vj$OX4%rEj7t2zvgKm5
zSgg((zS}Uv#;y5c(@WT%#WjzP7MPIlJO?U35aOeu-2u44Tj1#SeS7vS4-TfoJq*~S
zH%|9^JbPk|6Ot!Oh?cJz6#0;@%r9D-H%1iaHuxl*!J?w67cwk+;{cp+R~H@jTy~@<
zL_TrT?EnsW)_L>gWQXp@B~KS6s7-BK<cBVo9ZI5y_&(jgFDQD6F@+jm1MVJ>1YtQH
z*d3hQA=?Aa2`h_^(9a{88jffZdCl<QWs8g|H~+3sxz<9vq`D4b6GvG9k}NHkS3lco
z*?U$k#;DUSEI-LERkoxL4E^)_$^N7Y7WftjX!FN~bV#IxxS-8o-U7+hZSW}i7qW}`
z+a{hmpbpVXHIBH)xh3Ao9_#$2M(zWymi+f?x%Y67=OJ#WukWBS{Q8|cDl1~Y9)CMP
zdPc`=OTq%qO*g-T!dm4^<x8+P1Olcbj)B+`|2!|Q@J`E#6>h46Lb{&NhVkHRe*E=y
z{-#d_je+l}udK)oU%zf057zEIdt5v`j=#CBU^<`i4_sXX<TE@ZbQwh+Cm&`#PuQ2=
z@{&9Zas0&xbo*6b3|&?tso9HDc(Mm7M2Cbg%$^HPCQwww6&`rv=G3<3K7DLT4%le)
z+xi(@Hk@y#c<{zHyWGWR$E5zT=h&gRFNrfN-W%^X9ozWJw5#{^ZaFXh{fwUUkqIC8
z;=q@wXYRWBXP@exd1uAH9~)Ox4IK12Wq025Q}d@K7(O>{>Y6z8+UIFMzVef>;*77;
z)8>zByrKS^-50+<Sn!Qf#BY?P-yD$m&D#F|^)|DRf9nAGD^08Ksh!{1|JaeOps;E5
YPZf=B{%_`FG=G9g6Q)=kH=D8Uf82kiIRF3v

literal 130446
zcmb5X2Ut{B+XXtts0oTDQ6v^X<ERuBMLJUK4oZ<O(k!5Kq)Hz(YHX+jNRckR3nE3D
z5`%z%QU#@`bOe+l9q!sQ1Ic&qeQufm`~OdIIA@=|-~GO8t#|G7-%wRP%*nBqgF>Nj
z(vBQZqfnNOP$)mX{b@0N($lc-KK^U*>7$1aP-e;hgyqF}Qz#oKv;%uJE(U#Ra=xco
z8@}Uf%DP|99umFmAIlxFf#Z+kD-W;A6OlYvqbM42;je{WqXK_R{^EW9K>5L6{ua2Q
zSn9)_ciKjA{Vz8ZFAe<|`+MiFzHz?c4~J%6l{qucD}*;FjSgtnYPu$+e{XK-jxf^>
zE~-z6&=B<f0b`l}ByL|RcuRTyujCJ$chpw=_Xml_in9Oxd+GxLJlnsYLfz<^h5!DQ
zLNO2c|9gSDtS;6C5+_&h(DPp*KeaQ|ZIISc85-JN=Eu$Rvr%wWvi`Ftrqx^e-e;;j
zbL_k6#kytUBKF|iHrLkHI=9_FY}?{K+8%H&q$Isk?x95U#YbH_l#xTlUOef2Pv4t7
z>w8*e;M(Ua=ROf>S{;3`m^B-9sW;W)Gz6u8WDdjO{a|~U-9X-GNAyFh($Lwd&esnm
zQo4>%I1k-gy*+KT*|qbpO<u3|F5&Unq7=A_=V#_`>A0`-abf;xOpS~_Ie(%@&$TbZ
zxi6zW-$n_8u6lI%u0>9FG;XY<n_-sWxc`Tmg_@e00rH+6&F-U3dxl=`9{*ajqQFKU
z<F)(pxY*>?y^Y;(!i#j3S@%fX%YNLcg!uUQ+iS%H{R};v<;L5*xeUx(^4%v!di^df
zTw>y<?^u$VKazA=?S~q}f&57;Ue_;=KRDFuXHWJ&8)|kPNc!r6N3m@*jcNaqUa5@1
zaVWBHu{esC`4n2B9#dmM?%x}nXQxNY?0kKFyX#X7m8H8QhX-2Z@8I4$H!2jV3HpjS
z54P#KkJJW8UO4?=`$;X2B+K_t$J>QH1H4t_r0{!-qFM8r{|EchGyQiYnqS@68shKT
zpB=NOKI_8g^$s=1rA9y4rN3N#a+UvbdfR}^n4V*U@fry$z16}7dLb>we)_ge4)swd
zGp!ayvsOR<2lfRSKd;=<_U_Ex@)uW^mf2ljZ+m1%PFI9QcKd@xTNbw7${p``nEmy|
z(xGQ9(>rFza#FAY*`IC-*?zjQb#>5k*7D6o66XmA2Zsuofm}V8?x^<JRn3pj6yIL6
zd&?3&H=F0(6rF&>yw22O9w$AM@<7cHnNNRhvMm>@k34v5HSWclxqWd<$REPObyJP@
z=Fd(KbUt6gx2=)~@wsNV$uZqbD}5soO8(84x41il>?%rPk3TA1RNj}_BInfN?j+uP
z@$=>C1<Xqsp5ABtmK|S{ax-I}zdRerZ{Mea2(o+0rQL=ARqI-yQ!Hv;w{6p5uh+On
zh`41Vl@{VQSmHL|+EONzlB;GT&AeD^**o^YE;)AwJEhedxEg=|(m-R}5pU%8-l9~h
zEYqi9BSO)te;u%Uw^1QI_j{u`jiDsoKwYutt3r-rpRUDD)|EmV*jL&}f_L%q^*TF-
zEz(N1IDdV<gv*7}bHl1Br~U0=KBc?7vW%&`SJ`CKjMN(nORiyF;A<s&udMwGflLBQ
zMSj|z5qZ>aM}WAc?$ZX7hnKw<q;7He@@|*+Ru$!e<~(nzb-}db#OOe1wq57ypk>VK
zjO}4X0DW<ohG2W_Bd^jkcV!<Sc!sACfF%+I<K?)H>N@dvMpr)ARmwJ)B_uJZyU$g;
z4%>T0O<!Lhk4rwSd~@TWw@h_NWFuEFsC|tYWqG5`54S&k7tyLgsfi}@<T*1Gn%*7#
za0`vsW9;Lyb>fNmC-Nzj*YHt{QhU3R`L|eEWHFnG?|lz@dU`apv`nfZX=`>GDZG75
z(K#Be5*pIv)FONI!8Y2#g9o=9^S`(E%3>~_rOaPloAa|{4|Dlri{++=tJmAT-W8Xe
ztjq}VoEhhkrEtFXlIi!qzv=K68t$ho`SDLT%=)4jRw`pZN6+J-3K?O$j@LBCaCh}q
zZatg5&u>upU(mJ&`xGsg*+v`0>a@S!UAay2SLR(+j|=)L9=y){vr)P0)VJcHrU4HL
zF)=aI=3M6x=Z*mT?y4vx(^YL(R>&P0?Qh!c)c=86g69aHnV#ehBE^qFS(`XN_?T;)
z>mCFK22x9eJ-#iy%1d9|zpiEM&>^q&CwN!zNQ;*F2@CIJ-CWdS?uoDW7tGEeCCSkk
z)}E8^oxi>0u10#etiC{%`%7Bc4(H*whrOwuV?}(nfB$-TRnSkYyHaIXHL2!sXQ-#g
z_!xJ=*wuY2D8}6S_Q%IBj(z>uuHVG`COzXQJ90w;<lJ4Nl^#BzcE5dec)84%)XOUu
zsQQuFnjH_F4WI_>KBwHDJ5+%mlV4RRie%L})ymuJB$D0S{#kP_GOg<Hb4p?tnMXcD
zyK=EbTbSRaUt^Zqo6DJhD-7Ia-JDCd$2gvhRI=QWx|3vD5e>0t9tazTFrRg#R$KkV
zi2!W_=glWA9v{R%l26#ifY!?0%*CzQgbb-7H~A%<T5|s|Z`_-Oh1~IpiLWmd^Z2z5
zEDF7`66uURBfRX5;nJ4;tY46i4>5wlg(XkUj20Nm%}foka+QvZAc82a>lfy|67#WM
z_FZo_+I3baJruVb{CJ%&n&!O)buw&uZ&lRMj@JQ56oF^^KV+LW<v6@0z=k9`f1?;?
z)u6k4it;lk{g7?vO?99AuGzJ~D2i-Z>WQZoCwM)lzFn?n{)R$P1bZ@7NY!iq+??mi
z?f)a);pO-D)?|2gtdbGy&MtT(e`EJ*%k?*;pSwh(=xDpmIDZ@OWIe0u<Xq6-&^C0>
zaQl#SGV=#-N^0`h)X?dQAgTF9IXt)YV{P6lrN!&4vQ9BCmRK+|Vfr@WAcHG(6Ki;V
z>g*l3wWIu@A2lv9@mSe|?Msyx7Uo2ty3uB4*#p#(nZGwGz-F56lk@jW75Qe<Oqy(p
zIOAet$6kaI1aYu9LGz(?{<vTMs92PFeX`-jY1EIT$F7BbrnT{!jI+-#FIu#f9Xu~H
zbC|;zIS{9z$Pm*NrG(8)9{zQhuadQ0jQUhr!=q^RbUnJO4CpdjgZlJ!@Armtp-;?e
z1xc|&V$HW{GEd3V@@Of#z9PkUTe?ZPV9S|zsi!h**$}U1HM@d_?VWfj>~Vi`pg<nL
zpp?`Rq2#OxfF9;YbOU=G6s~BftEa!n%E`$Iqq6_)!2G}2KVQThsS+wjVjD%le|LrC
zqkk`P=N7BfQdIx+;*l{KY%4if%(_I_r8M>bkD$~1^}-c<?mfS<BnCi$jih|Br8=;r
z6{yoUy|iNsW=2w^P%P7HwN6GEmpw3j|J3qnvrF&PSh0MCkAV73FJ^tF{0m(ZpJMge
zm&lLp{SI_=n@?U2b5(kI(bBZ@ZzEoZ$jW^F=S~^Qqt8l}J-d*$$6uK1d5pKS)|cGQ
z@L~n<;PBPnXZGELS9@Dr2l9mTim~-_{_)@o)z;MX-E?=42;k?*WCUC8aMjVc`1sPP
z@uA(w(H{^h-PJKFUUCy%ZWG-x84PA1Q0O`Ah^6Rkk5Uu3&f};<Y6Tg?Zj;xq0CsjG
zu^bB!*}R0uUe&ottX|I>g~S+%dQpsl3@IMVe&4x)WXn=J`Kga9hF)#DOCs$Aa0y9$
zD3;<9P4?;@!;kp5{8uv<gPuWSZ4=zI0N7=yQ+`$|^Mmctf9|aF8*uBCF>OdQZhT_u
zO)6Msi-&84RA<oO1fEm~Q8w$>8{|-TLcmuM{|OK^trBc<{q*;Zb~`W0Pk;F)54;KA
z@9d7K23XaezT?4pF2vb{6w<-5!7|~>a*39pV5erOB;5?f1g)gBYGs-BiQbe-PKgiq
zklZ@%dQP25GGP_EFsu1ZP==iq@cFL19FX5DzvS$$h+9?9oCXHRP%z4t3g@PZf8y$R
zT+CYr1gy<Ffa)?XKifI$);)nZ>ICAhTxXs8So{-f)>U`1_k>YKFyQa(_mP`7Z*tYu
z)YP<<3Z*3W>0DhaWqTG`(|He4rEkb?i+8Dww^{j0frp*fD2WdMfufK{h4kwSJZCWz
zk$duiL)Gzl_?AN*5rHRqP>ftvLC|^C(9<Tz_ZIj{hCd72&~w;05(^>g`du%|0pC^j
z+o50j`RY>cj;q`Tu}L~t19zP{L{K-cHG)fMRp3l8udGXr);8A0>iK2<S?s^OyWm^z
zkzeCYtwae4^itot2jxWQwzl!sN1pG_dMnl0uV??(hWX!mV$ophTmRIm$>r*|Vm{B@
z=+8Aj^SKYd<@gMknK+nj*gndFr-eD}!iv%Q`X<ac6k*{CUR?b6;;Ol{a&Rj45!XNE
zfnq1y?beBzJ&FFzx|QmZIW}otelFDg>5DAQ1g%Az<Md~z@(J!&{f#{&!TBLg*&Xj}
z0qmUN_{<4hcc)$FsYS!uXLUVhE&0<NpPh#~k_NLutIVa@>Biw6n~<jJVuL->G?*mo
zxU>K5qhjvlgxFY}Q@Ox4z6O(_OZOj~=o}S0R}rKsH<~ad#|j7?r@1jEw2ya&8b&z`
zbygaN*Hq^?^jf5siyLM=#Z857b8pj0t?Dh98Z1ljIb%6i;gs)<I-jz~qd&V-%Xw?K
z=CnI2bW^R^<%ObEhRuARK*gxu{+!-q4Q*||;_G}K7X^h1#u9EK?rpAqLkj<Hoibf_
z(z>1Cgwmqq&E*dzD#0oAc!l+{b^;(9bURz;e!IqgPKAZxY)YQ^0PyoRuk1uiGWKIO
z5LD^sLwDA;`=~3ASB>aDb5sJ8DEo{&I{m)a5Ns9SO7OqfCyAo0e*E}xUPF)|A=z_n
zukJhayR(;UuH?~ctH4|cOLK0$v?SlYywc-)`W_^m_HQUd!Tn9oJi8}=79tG`JlenU
zIDNQZZ|FI_v|c$>PL}XiX@{O+v8wtI{L8Mb!S-s-Q-upxB&u3WoO5b+KKIY<HQpF%
z(w&Q}+pan`pO(m%#T(9g6W%a8VmRv?6Y3!y>M>zT)Pp$nn2xY3%S$)=>8TmWgT?4w
z{CHI;uOC@TeMi<dgIq}flk%j@=D@ph6Z{|?<q0YIfk$^_6Tnj5`uqwKacHB<EyMTi
zeug2kqaV`u@JidCUoJoOb<g*AXHI0<oI+(CM7imBQmtG@RDg<Lna-@wUP3!}v4(1X
zYcAl_uz>po1qDmxL+kV1CkZK`ff9+>w!IqesTJC;`{YP(T~az&c_%>q5r&3_M%&ou
zyOpyu1G6T1h@Ng)Cy;ai&K-BwNhmWw%(h<VbvZANk|Ao@C>ku|MAEPKqq}m_z>V!3
zofUwsS92@nXWbZWATK9R%?v$TDm(aUlTfZW6R>wYv^EHt>=dc$tXBz={ASopHfkvN
z?(Qo~R_v&p{&v^%HRx|pUDC-I)XwgvXHLnvgQZ{afP}?WKec>6*tq%VgG8IVC#~}w
zq6#Ef4_(JOU*8iabL_hr2&(o6C#^~>Gn*bD&2JefnDt;ps>did0Lp>W6rTl)o>Hur
zC6&52`B?{c<?H<`WPK!B+;&6FX|S(WVsenJAs0_0$ov{F9yLEU)KPBt`Hn=#pDUGL
z4S3E@?iqfwpRidqAZMrwl6fv8r5mrWXY5}t6`8x6g_kHJh6jO>xOkY`k6v4!=Q^4@
z_URUZun?IHk@xC;4dG)xhw5KH`ySlNdL-8WrC&S5jy(2H>qOYOh;qJ=Fh15z!uG1o
zVMYQ1si^ORd`}kW7z0l!G62frTUmhVO)5W|tgHl-RAQj8L?WVEMJb6w1Z}p>${%Ll
ziJq~44zQlbHXR>>o+7aGXG-r)Z0bQ}*-%d})`&7x=Ds)9AyIHb4#>oB>9HRQb3P%2
zfesbZKK)<t^Z|rnX>sMAp=19Kc=~5NX#QO0<@aJmwSw$h%%7-r^B$Tlq@fs0Y|u~i
zoc{dD{-Y#-Bb^4C7sarl?7_K_od;wfbeQTq*_YW@x3I8ar2pAKN6FUEV~pYcCK(<X
z$2lr0x@`{hzoIW#SX%5kQ60*0><0yX2^7)6WUGZsmT!~fWInp+p82oNOb&!1Uu>p%
zj6Q3LijIzMJwU0^EST=IE-PNbd(jAwNj_nx=9cL&@{f<l^u%VGf#>wd2OzdZTYm`K
z;Q|1*+kIk~TH^TL($65z1y9HP&9(ECsw2`{S&$DCm{Ul_JsuspBghBIuVkKR{4e`M
z#rNKx`9UNlf5ME>21-?7^{h|JMv&5T6LjX>L(8W$NKTCz=6=vCH*G)pbel8_iiwJ@
z{4&QmMa^pX3Ac5gN)Me*EEJ{Gh;@dzTE!<McvJUZUk;{421&m>C-Lyc$HkRAeQ)&;
z`Ctpp3b|z2TG3c&6{{?JYT_Dz{2<*`LEFkjy&~jio^G<CxPp5P$?k67UbcUWiwOx-
zksFUJJb+*S_UYw#iHZlqbE>>x>5eRga2A;6n4`xkJoaz)N_{O{=uIWkV}*2YB4O5%
zhSNRT0b=G_jI-FT6)GNs-t){_>-a=*=qKjx3~P2CZE~tcgbnVH#eAGuyn<H`b5-}W
z#Ct0c!grdIk`hW`-X5r)-Jp&0<9;~LK@-mudyNkuhYntZfa?75DmTZm9}645lL|^O
zzL}XBgDO8eUJ0p+e8QHqp=4|)f#5`Np)m*{XuYzc0$g^f@}j~<RUkHi>vp1kFqW;C
z+*x#uQ%I7Fd4YRWE|6#qdsd*B)qi?<i<!|NaUNlONiAAV3S?EhW&#nTP6Dny0EyX2
z$UNgL00a{ReD8bD%~rLJh&)$jY3`f~;32l}Ei;X)l_ZoHul;vzy0VzF6xUy>yja09
z7HbS0M}Nog6Z85VVCE15$$;q62iW`W(mNoOK|DtX(OwvBWRn(nOpAEVOfdzv?fN;Q
z1aDXYcv4H4m7qUs(|fCDmd{I=k4CR#W0ms?`PfUHDxMSS5HN$O0V2kV-=V4H&dy9O
z+Pct4Ne85Y2+%}5p)p8x%4~Kq$0o|eotW2}WtZ@<OAV$m!9+J6^paJP9no+Z?GHZ8
z=l-PiEG5zFM7oJFiIBDuZ*M9p<ST+47A#!6YEJX}gT3cD-#{z~MZGt{93ExlPJe$-
zN(-owKa@B~s9!ak+=j}>2@vBpxVVv)_V&;^W6;h9$gG$@=9t{pu#!1_v02&n%-3L$
zX@JL6+JhbXf$A!<V#ov~M}_k=prLBLM2_$ylmYVp5g<&)S<+8HTOtjT+A6k?Jmxef
zC8iR+kSMy>mh%LHLr_bKR>%h-qZt4F*RMnh;!ysnkeetYgj#_v7*CCTYab`1?5^y0
zote+_Gmi@GnWHR>kLCAOjEdOL{F`cS0g!~$$3IsNHkzmSc9KLkR4FfCyx#6ups1;u
zo+O1qg}hdYti!+--H?(ysOap0vRTpf_L1GYQ`fotS=e}tV+*?&scIp<F?$kc{<%%I
zm~%cVwN!uBXIn^tG5GVMEkB<3mz(-pMA&LJlwocDAp%#3=xXgT^w1*p`C@#BIlzCF
z{#wwldt_`Yw<^Exls{zkA?w1#aJM(sN*H<k80ZYgv7c27@`ywa5MYay??5WAWNbdF
zb<rJ7n2ML&hCw`z@500WWKD$`d$YEdDG?y4XG;Ud^g&7Vbk0L2Bx;_^_b&lT5>29{
zzJmK#=Q<DlQ1wINLokXUKy_ot69h91VhuU~Rm+JoBWx}tBm`<WdA93Kcmpsu#}Squ
zo4Ao3Z;2n?TNea_)yNUfY=D+W#Ak}A<U^|*Q^Ic7L*D8}ws?DiIZk?Q3@djRYBM=L
zZkUa&GE}3k(vCRTCjFa2UNwY^;V%ul3Gytwv@jhEFe)M<0xB!{6b3$GU!lht6ETR*
zW(?siK*HL9;Dqs^PHrCa;54J>mvaFi$ycfpv{RlSkh+e16^=d@Kp<EY<huskI~`nF
zARuugq1I$d0OOumx5xqART7mv;tXqxW|;5$9I=vl`&6r5uytwsE>-*64*w9T0(*hW
z1NulFwdAi~H;I7#US9d4U;?w42Elv_jU+Y!_2|e8pa038ndnW&nsTpW1)33$F-sw&
z#BL^-yIMs)7?KA;`9y~`sSF7go;W{qSbpO8KX>^I6%=*EmU8cSO?U*B;^~xi7G$M>
zJ<hi5v_z?+&9&Q%II%UHyQBO{+sP$6yJJEtNc6b$6Tt>(nV-<krL<Ec$AYEBig{fv
zNWI?!)Y;DC#(YxBm?C@6w)S2m-LCdv&nfi$280Yr<OhIaOFMqiSt=0jxJ~y7KYpY%
zJ2QRDi_PYe*@%MfOEeuM4PPMEh$*t_iT#Ja;O=D*ozgyg$s~tIvTj%?eR_VL74+2r
z5RmnfR9nfdka=<r4S;>!Z<+a?$-!>EzENP4&^N8y4fFSq+RuxA5~+f?Yy607h+T!0
z6t<`Nv>fXm3Qg>atZ+pe;253MbEy30?H)_k+bDR9ml-Dey0R9X;-LN?d`!9d6lC23
zh{1WNT*7=r?!8625-&JE!LV8bEZvw=WBPCB*kLck(cR!Qx_QNm*IC@dHqmFJ0?J=(
zDl{ce3K#I4S$m^WplAspV0h4)(veg8BABUM^ylW}Kz<+gFS%6!f>b4*NEh>H!nQtF
zDLbn7x&Eqy67Ujm0m-H9G4j)<m@-{^7P_YIV<)u2PLTS|NC^6m>eq{$J)*ql+uvd?
zN;=y5(CM9#)Y2^)(r*90>yKw&(vF6pwKBH_5*_|q%wwVUonSyyX@jt>+h>kIw<7yE
z9eQHYrL(F1C)3W-c3|{`2Q%9=i70!7DfO8wVlIRzbq>W*W=Yd|jjYSCnc+FiZ6&CY
z49|C`IWIu;n}wm(C?^DTkr7s7J5y<$6~RM!1MVp(j?9m__U8!JA}HwBgzvvj67M)j
zV?o_GHg{<x&70J@q>pD+<w<TKrNm<-!O$3itpYT0)9Xj(Wm2^?|I@DuOZG=2Z%0<^
z<=Z?m;^_Jq_O3<imh^PLw|LHqv5OlecIy^4!lcZEBDEM3fQ3gXvqNXT5;c6-H`xwN
z8=+y=U@5a&#&20s7It2^V9NG8WW)6~g$vNc1eM$EHuiO@&)V~7rd5;HxGtf#D3-b>
zkF$P-?h-*P3+z4$<>1(GwTc~fdI#g^juPzg(jkxuL!uOvi@!%t3sN4)yWEL}!##*W
z_h{wdKxE2#Gb`3$jDjWRfR*SG((nWz3?}-ZUKdH+M1Vp4jMM9)F^IS+KlXgZOy3B$
zzQ0U=*8aJO*4fOi2crCl+Y;n$yTS!a+R)upVUV?7BW|HX;tA4g>(a`}a%&H7aB0tv
z=BOMVD5ze<1Ca4x9cxUnhV0aH{ucr{e%*BFEC>N<tLcZdAoUHRx73EmrD5svho>N%
zcf43CJmohIK%wW<<j`>HI*-|AiLV3Y!7`a$EC5O|oD(2MngLh+Lu6e$$TlJ6j|$yH
z$(AtaOG|i<)F<m}cT2|v*(#!BX21B5da8)@)e^tGE-cN1NZkPZWcT9dt%RU<NwP+4
zc!Rw=N9v#&coQk!x+R~9>=Aogr23vzi<s9XF5}%ZCZwN2YC%tYf*R5pwZU_C+V1T^
z?xb%Y3QI{ABW-kC*%lUw=yR1J1X8l$JVk5HMKV&6W?Uv>RugOA*C_V6_^xmzSVg~c
zPh1T7A#zfWxxOpGix7uD+xOOO$9GhWqwY3_{{+pP#7Cf*`2%J*51=K5sMCO}%tz4?
z%Qt0ihA;!?v5(iub_=@j&l)1}Fd~sTvcLVaZs^Va6;ZCE{R!@Ou{Lc`MvkE|rZuTs
zSYM6gv<!_*BDO#ox=ZzJ$%`Sxlf6+BqW>Gb3B8bG%1}{<uFFqtoE__WmX;<$CSXV2
zu-c;avBi)QNWVbOx!u<p-j6CgcEl#uK1h81BU^H)GbOkVu@;J*Z!$AA-aZZvbPlMB
z1OmsgC5cL;Wee)|mMunUz5KJ3UC|5cNB&-^(gqiV6=@sWhQ~kwBt{4k_X+!}yyuNp
zvG@?(VQz_ggFySJkk?!sKU^p#^n*rLlJqjt&sA2S)P|tjb%|XQ9Og4qVLZCYYveuL
z2>Wxx+_sM+aqiI8chJlq%^R45pA@6o@!eOMYmvAz#ABkHw0Na@Vjq=W4FN#uxG9wU
z3c7ys8}<zn)!BSlAy^!pk7ayvdqDMoR+XG*uukQ^+6F`f%3`Bt3dQg)J60X){``5R
zErO<FdbCBj(h}B?H8PGCq}%fYo1IV+LrU3+wNTy_S%wgSHjp<VZkIp_>yVE{*E_R2
zL)5z#)MY_3lqT&MV#$bj#M&2}2mV_`8Et?#<)|5fhO-m(CvxmfojnSsznA&%I+F%>
z17;vLh2RhiPzVxmB+Fp0v_k@&qyMS}N~!F&n8OQ_)}aS>V)Jj~c9C}K4}ud!hDG_z
z%5Mqh`<Ip$cv^lZq6(2ecNMSq2Gr$Zlcv}?!v%j$kd&PWWKoiYou^0Yy{RNGU0cBy
z0(n7hdU8})a-(X?2&7d~Z9(X?L!N!Swr&s=hTEUj<c}TrZ_`+G4_Nt$L$`mwPm&kZ
zf%b8N?qPPSSbfssxRG>Nc;L=c`$+wT1i=s2iRBzbo-n`6ULW%&^nC(=QMW_kZYi}3
zmUbv5z#rL#+ke>xA{td=L!dZDckwglTVYx(`~uq>b6&F9W3mrc8YvQU&dDSVbw_&J
zBG-`qAN)dN&y<6uxp-LH={$v<b7LI<T*@@H^?iw30z#c&<tY09h^cav27M!zZ-zpj
z6WHjwBM38Q%|neVvx8{$8agwB><2C`t~p;4h5yi8(Tfcw&MxFaNr>y(*>8xMA;_`O
zl%z`_n8dlr7S&-pAdK$BCns0Ddwj+Yy;RbxYaiElY7!%14#5c<oE2=U5^R{0`p?uz
zif8$~jr$3kdC*CmE_yc47fFrOsH>kaUFgjEKArllPk{Nygg)#j=FXM<{_c@p7kb;T
zVI~NG6xE6Hs@=6<?QIZVQ6kr}a|m6!LL!#=%Wjq={eW8eBt2~uBufmdoHvz-u9yP`
zsE`2Zsy`Q4P#5y;bMZO!n!6!vCFgx_1Xp5y9CZG(P3R7l1TPb#7!*#S$_&f*;zXFS
zD;0=|JpSkqW>jaA7$hv8Hf(`y2PUeEt(USVdJ?LU|K@hC!<!%3{*SM|fbGJ}d<B+^
z1Q!wU2mD%R3BSO81S&m$Pf$o`w?j|O)Yt3s+bWyjo#=j_Y3;mqH*<7!Pd2+W@&!8j
z0128{hD2P3yCBn2X-^x?5<Y;^XTt$Bc*ol9QL7K-CHhY8L_Z-0yY8Aebw-<C!IZI}
zko$JlVkO4@rw%AIiMxLPvTThA(^KV~44Fx)H!*z>s@}HVq)dZL-ISi_yYe%Vq~%K7
zc5~^)p>nPU<ZD2C*a6r&HBnzs0ar#D3kG@dJhXQ2JvkqRI_H$m>)EqNN)NGdkhV_=
zTAjy3h?j%FCd6iDA-h~rdh_S<pK2x)e<9-cTQ1p3w+%msJW=`eW6{vmP~|+bOI*MX
z*$uQo@H8T7WCN+Boh@MuPGLLx!FnbFX6=08BWvX;J#4LoA_5_o>;mGAEVUy98m^!K
zBH3pdvA;W_F}H>IE1>rIqA?&!hzqt5QXz8-N!dli<HP(YY=6wklnM*cu}sr*sMVAj
z$Q>fx`@yLY*Zu$qozX1k;09VpMesv(P)%-af66b-%4n)f*@fjz;jxfCQfRlnUUM$!
zILp+=gaMGy1cxa#zY?rO>}iBK5C;>x$(VZWzi2wv9XD6@fNpI<B%N&NJDtRzkOCl1
zSQP4$TQeTR7QoS`7~S8)9>{vp=oT-EX02CU*u0Ob6B_Ss7XER#x~~%2@q?HU7eT1b
zQ2S!f5Dkum6Y>v@LD)Bd6j4$**aBCg02{83yhCjMFUEoHklhhzE@E8jLmHWjw*J_9
z3-c!e4X6ZPPDlS{3yr`hV$UI!WUK&gWgRVtnb~jkoIl;<Z%y_O_;mBH8-X{ETKV5p
zepn&8*h@Pq`%*xln0jlyNcTf;|2MxYd7l<LSnViu$D~6y>v|U5RWN!D#|}FELxKE6
z#rR8&=tXW;t>alcQhI|%vj^-7yk<XK?sQ<XSXC{H<=2Z&v5mP<YAuY<o$G}ht#<l!
z#LSSn5jQvY9Ud7i;k;o+PkoBD<VH&CA^mLIgHRQHuxZ1w?tyHtFao9Y(0uEL61z`P
zQSr&?mmKB(yY@FUG}Pt7mZNy&$Q#Iwr*`tN!w~<~I!k@#uRQm6{&g_Rs=<#aX7xcb
z;mzmX-UMu6;xJ)@C*~ImZ_Jq!D0Ibs7&U;_)sVlRIP_}K809AF7cXXsh={D>;@YgO
ztz9I*s!PmYm2Wd)mmS=?{(|Is43kjcVR&+Mhr+@(Y^G9U(PCN5wumx+DfzlD3%X&7
zep5VpR6SJAU6eUM^=FQj+jUYEWE{VQ%@rH+E6QH~`HgJb_M0F|G1wLHSy}G_uV1|?
zuyNyFq@Y{RSpp>UF7$Qmb`Jg~`17--WQ1E6WZJq!n8kF{&feI!e?KQou#(S!q)Us6
zitJfV27LYN!X0eWF8;!_fvlCbk43-6n9F64tSlD~Ptx$PJ;V-rZ_dSU5kNz+Qg$7&
zsi|+~ObNJ#C%fiB;Px&pD^ovq?Dh`}7iO50uQlggy*e7$MQF>GYnt2?O2K(#H))sQ
z*wbgu)aJQ55i2KKAi(`Ml$6guRpH%+K1U2+39ac2G4rOJ46vj`V7+z67E@x6tzUjU
zP~1{bLPCOzo7=oHM7F0k!Ea`&Q@*#-b0%F+Utj4k7=*$aDffvdRn^tL!NEyELF@H%
z>`QRFSo_@E+_t{H?S_Vii+=nu7EmM_h@LK3(P1OGK6*cf!u;erwY~cF;Gsi;n>W7<
z%zpN)7hV<eaAtLhrijF_w8r#vcOi>eCspk}|7L?bI#g*57S{-FZLM#7=9Hq9q#KoC
zUT+3hW@$x*I2`Hm>#eP=7cE+3+FE#N?XJ^*UcPc={KQ%c#V6`4J00M6f8<!YbfoI2
zu)vlrhw$AxH+=c#-MiY8-}^YRS{jR9zI>^hWfN}T_U&Nbhir9-@jIDrcZqJSy5g~8
zHK_hallqrZVt<FG^A@N@?82u58K%|$kX2J1KhCzPQ7F}<os4kd-?XVHaD05+6x8MB
zUw`d{*F}{}KlkEshu%6d9s=_vHj0U9E?vFtO{uSt1J;d?XLM*t-N-2H^5x4lxz2XZ
zuC8V8-=7Q#30YkAgF?H8s%qGW4|?q#9jNO^ySuv;RaEK$Jv@hXAC^a>VPgu5^IGUX
zFRw$6(Ofjwx~1&gjPH}C7K6b^JOMvDEIL$Kcq`-8W4zc=U-$%-pi9_u{MHvo*EnbL
zCCvYw-*@eU)kzx;rDdCcq{j>6LIMH;u=M+Cr5Na&MLE#c?lhvK>`0CD)Rw94!&Kau
zp9=a-E%ZqL{PRayI3-A*Tx_5|CG@x7ep~g+FGlRVv$GHN*=4X~>j-+{v5}E~gMT#Z
zt=w|#4V2?VIJedw`-xJk?&$awUU5$Ja5Szj=Mi-H0!v5@uv_F}&b7ZQ0(=P0N!J*`
zeQ~P~vFM?Za{_gVKm#}L+|fiDvJihb|FoEn18_yeDhElPD!0mRUo8tC2&&i&6&v76
zH-*Azvyt=(3Q9yj|4=|cKwa*sqH8yA-Ks`Ai#hh#0}TCRTiIbv?`ef!0jvB5*xr=O
zMNdyp^wf(VjnAIt|KpF#?9yGUbK$~clZv1?kO!Tsyu!l5dFaeTb-o8%*eN80Rw_n_
z-TVkGLBU<Sj$=x_sqj50gYNT*c}!hw@9bPh&PNC?)S3%7x~+zqS_GJe5?HF1l~uCX
zisj4efJY)=N?FIo&_T~(Bp(Lf>VoQ@Zi4KgjiQ1!^_iV(P(|E8IRXJOnBk$SdJiT)
z&p1TsVzTYF`pvmfP*h6b{}4m)ShnOh1&&Wl2ue%q0?m5gT6!yvL^MUU$=Jk1P*k)=
zH@LW{Xus!luc4Up;MpQ{*d%%}H*d+R0!$nwH7v!)XVpm8+alsjZ;fP(^POQ&C;u7l
z9eS!78l<kB;&Q>PyeKO24G4e<k)I?^MN@PnT_79!hK5=bT%+KdYS*be()Yeza2V}+
zy-?2?sjIw{*hr7r$rf`QF@YTHO%;%lIf+h84H6qC(M2k5{#zJsORitOdGlsd*nSD)
z6dS0Dx`jxsNzfK1(J*E?I5@a!)v8GBh6MPwTma`pjS4B%k1=Gyq?#HHP9A9uZear-
z>Y^n}gf?$Jh#e#X9P#xeG9(TC&%1D<?WQrFJ$u&dIqQy%^@91>XLVTZOI)V(1w6e`
z_wM}y|4W77@YvWGFx|n%$7hz{Q52#wQBaMIjcE)oUfFn%MRPQlP#Sg<uo5=dkZBzX
zVv5;<2{{Fecf4x>T`&SvP?1J^3o1^fUA=mBt*pxvY>xBfY=VtAn;K&BC0>=39LIda
z<`oU;vMLY-TzAcyHK^r`goK3We<GdUL1R*9vldNIK;XEZUQn~!kP=x|il854D06g@
zq&;VHsRE*+8nZB7YvSYw`Df#jrY3#sypae0c<~6)N-Hbt2Rue)`Wn)UnU8<$e?gDN
zp^}mkRH49%5Lxr`#;2AEV`CRNdH1}-AreaI-J*}Gh+CMeFDzQT*bITUN(T{YrMh?T
zrG5MMk;X8MK#yTy^pdi&GTcGISwK**3f87aSTq^~c9n2!sCXnxW=+|8@896Is=}m-
z8JDg~(tlPL=<MQxnsmYiI!arAzZJ<=T%W-UY%g3mj%;}BFm4<xib|D&&i#HyO}@LU
zWpnO{k=}ZVbsQAceuN82pm1j>GH^N|+E+-s6g7rCw9)VLnK|pYv$L}cy7t4M8wr2_
zOgthdXF%!?yKyO*PQ0luP?lidFfhQRJVeegLO(t%;;gZ;fTZL*-SKHWaxL7~=ZfM0
z8BYDXvWMQG<_Ak_ZdDFSHJO>2(apX17~?U)#wQ;eN2thJ3JP>vTU#m(P~Hpq=M3}O
zNrnXm`>!oKj->UWsVM{d3skbiej6S@S)}(no}YXQ9oEaa>0npXLn2JvrvhDm)jYx>
zUufl)g%eRLyptI00n2J@kOty_c#begO@>XEWPR8kC`P{t%^kNZRC!fdscm7A2vDP`
zs%lhT^y0;ni{DP8YiP+vgY?o*(6{PA>$cLcQUNd(Y~|zQBhMeLm*=7hzwWc;>m@hP
z2+#!qSw>EcT%*p}5h?W9G~0GXK#?BQ^19cRl`610Y9Bc8=W`ZG3=_$A><dJ{Ir8@H
zWwa{T%)=l<y~jZ5rYE0T97k<ww~?%gq^;z^1OSqVlS3^Uxo5ene<sh3PvHr&K7ahN
z59gJhaL9_8)u^658woJX&uSUaAEvpD+a|oJ&a^f}TBFd^jvV>x&|Ti`G-<nz+W==4
z<iyI(tMge(!xd*}$nzM^407w|yEO#1px;Sw3{o7yF=1vd=#7eA{Ax5lHs(*dcB(tj
zc#VdGRcFQWhFs@#>=QB*lDA-i6Wp*t0Wmo^GExhJZd-f1F>&L>>Lju)m6R}-lLa1m
zsN50gHlDm1f^uvIOEgRoJV;5D(&tbvhoSNA<&n03gBda+6j34j2#xlbLl%lXH%VLq
zXibyqOYH_ZKqo14*;b5e%RFmP-R_RA3aOpwFJySmde9gTA3pqJ(<a~h_rw4C>!$__
zal#s617UUu2XW~}rOiRpiR;&2!_heP_X5~ajfNwT%iI+uZ86T925BOfWdz^5X9N!!
zW#`NP!JrBU1$OMva&ybYNuM>qV{Zc?gdP6&?OV@>>~w+;G*+BAaUxLiLIkj;ak=hO
zi#SAp^Tmt5113{c#g#+$#G(Bg9~pT72BsREPHOw~V#sd+MZPZmoQh>rjwa*Dnd0Rr
z1M8Flm<3fu<OT4+<P$3nEjO{X)d=nUCc$A87ZoURRoIUtB2@QIO-(&PQ0Ae>9dB5W
zPwj?U6;7y3{4!7w2IDtc)!4Vs0{E^+9aMs|mYz5xL>`#3a?BK=LOu$<PBT-^h?6+a
z*%^YSsU<I89{l+6W9jSHFfpu>sK-t#ggL@DBqSL=XFcEsaULM3u-8*I2Vb;I_d7AC
zP+v#KAB8uvss(PrFqc#*@PlsF*%=I#m(3`Nqj3U4Y~naLTQZ>D$d`s{wwS2O#kFcx
zEE<={`r7D#Iehy2=Ux*_3|<lFJp*%urA0-HgVM<)3pek-e#AN$f<>Ug)~<#9072m#
zmy4U5+mrKe{{Zd?W}_*7ZeVwH508AR>6@^<gpn4UM~99<y<QX!vGR9iOq<|u^O;st
zQCZmwhJzYVBxX|nA5f8<le3n6@H9UD$rDlYN%(Cf{C}jVo<M8$Wn(ku@i`Uq5Ro0g
z>hfczjh}zC;TI4f?W!td8}o7*r~X9LtC8;N;<+i%|I+lVzH#}oWumN$^?zt+R8~<T
zm!@cl&hrz&JfQFM@ar_D8Q&61(0}%n;6!L2iv9ila|y4fjSx^r@NZ6>z0z2XYz}T@
zE4e-@|1j3QcJ2fPu!2K-Dc3Y?VJYa&IdiREtvi&Oy7OgmF(L5tm+QiQtb3Z0l7c6r
zm%b=3R|0I%1cXE_I981O&NbK32I4BQ$}|UvlD_ciPqCrV(R#EbMd6pYQi3}lgzZ-i
z2pxu;(*%vtsR9xb+Et?x=UrV~)?y)Ix8>&Lk*2;XXEwX4Vg4jYJw+q(88Q4Nyirfk
z+J5lxVRHx$WHn<=$k-ja-t2{$Fut28;f%=K+&wf#OiT<G@1rON9pTv5$cO}<T&IjJ
z_MheU-G|6Hefl({ovld*d5xs5n!?F&^Tv()*RNkEfF>-0N76=tBz;827UiH=FyUT&
zKbqwav8m?2`~yW*cAm|&4u5fcM%X&AbPpgTBN94-kd)L3$7lLT1fuJ(Ieveeb>Yk%
zUfIURS%_e(e*Zld`sO<$6gSq#YT0~1DwBH=JO*VT3JB^b1HxDMt5-+Js76~n3mWLC
zAh9kZJs?~({I6MaZZ@?WG?Y}kk7wsDIVCb5MM27FSbh5R39a%a=)k$wxfRkE5QzkE
z4fK2&u`E@bg-}h1G>+GV5#0e&A=!M8NysrH1Qh<WcF)DsZpn75_EO)vkwyz~Ae#oJ
zrqFu$!<;Nnq4P}uv=G3A5f?%_t2>7FVD2A({ILwe2&LjRs4M(0zC|B*@*qVsKlF7k
zSfib#S-{rHdM^O}CFlhT3`yuX(ye=y7Zi+W1e-QpA)7sGqxi#edyJj+vHEEqChUZS
zql3&%jI0i@K$th9k`mDfzLozGja234^^~0^z>R@>oYTJdH<_0c76NxsFB0uX+T`3V
z5W<3GFHs6upIQ|JH;E9O{yce=7ed_C>(_;L?^Xv*omZM99}`Lm@0SM96fP^gV#NwF
zC$K=gf#@Fx*x6h&4p>N3NA$ei2S-P>(fiSObchoIn+_aDZ@)C8kDwLw>Z6TMH5XYE
zuF8&9!z}hN1W{LSXeH`|<773zjLiE$Xg!+nyWJ!#iA|>qt+{{sB@6^F0p6(6@^Uer
zCAE6!{EVQF+EU}n@b-3qIb!z9HzYZN%M_KAreE4Mp<4}Dp$b-&GMPi<6==DDJ~hH2
zLok6<!>1Pw!@?0L5m8=wXce!O_m~n6`F#C{AAV3wqAvG;F^U3Gt0pqPGO@o9?J&h4
zk0s6h-)V<iGofaYTq!vG<Dx~~=pFijUB+C#`~%R$5ma^!^jd&P^F~7eT9Qw0Lvi;8
z#R<pal9Hw#ee5mHR>VPsf?(APaHg)PcoVwZW*X3tI*=A=It~^XVfw;?=C`qG@(#VM
zFc3*F&;7`y-c(c}vYwkZ?Z+_?TL%ZRpx=<3oxlb;I5{-|LV=)6nBuqU7B4>e9oLIC
zqQ;<#o67;=o6od(dRX~}V9tA?gS>_LXfrK5JiIZ-A)!BS)IjX~8wFloUaWRK9G6er
zCmo>)(HP5lq$78o`6o6jYiw(!j6;tGva}*&^){U_95{%Dus!(w`vXuf5};5XOrZsU
zjOFx?%yg@GrX?3yW%@}!Md1w1HPGrtsL*NinBQk9hKFIGj5rdw?_g&EQcsWv`5{_O
z*VK_L-3HLHtwR4Oo@4=>TLC^0WlCN)YnNZ&k7Mw31S^#$Cntwm&$xcQSS3H7FyD4x
z?Zjzdx^6h`XWsS_Hj3h<Gr2-;tkuDen48Q#WPMA?CL6X;;NN-gsH&=}iBaJrr#oQu
z@ut=$>z^d*7mOY?&z!7_e#T=clET~mX>i&z)B}CTp2m!X)!TI;T>Zx6nv@}8%T#NB
zh-mEM=6eSx))At?H5%q#{C0Q7J=oV*(@b7MVl=1I-pNTD3Ex^&9OGymp5OocyS0<`
z-l8*HlXOzT9rvi)vu)e4CCk^p!TF?(MEoJ+@X*D&12spYz|a_&h+!Ps6Oxy2Aq0+6
zm`hII*35u>IPD);CvM@N;XXBX!Lsp5T+IbOzEHJEz#Z?Rk6Hav0O&k`PM}~T*T}C@
zDsHp;z!bX3sm%Aa$ki|Z`G+JjMoqNRIut8i6cnOIfBX|)udm0{^fl+5RN3?GPf{U>
z78DPF&`q3^^y9$qjezwT1O5HUP<&e6xL&z@S+UQ$AuX!L1DOat6mj!eSkMT!fa7~p
zuhVV(qJrl9NsmHnTO5NX@&)=VRgld#)3DEPdU<KNxa1I-dn;Bl>q3TEZ52+5+J9}`
z3zA#O)T#@!hzk`Zsm=pA#`>aIKe6{Vwmd#_IL;ku61`CK_!H^TVw0FX2TT@;J{KI}
z_x16K1n!)<CWNt2g1G0aVu7N8K?v$LDV@lkIs~`$wG<fc+O=!&>(`zBsIjf}=6JYn
z;{TzmOFH%I#Z80Dl$xYBy$MZCO;sC^g;(irg}hCxf@MS6L8lKF4#$l{?jOc+AVH8Z
zDBzk%Oi%2))qqcZrVkQuer=wP*i`?Y%RKa4a~xbwd*7D>TLN=B$f#9U!_=o?(n;X2
zhi!9)xi)a68BWg<>Oj27Jz3Bz%*^6pC_J8F)r4iudo4n;`j+`kVN>L_UMd25;Ca|s
zCg4fmOatI^!OJ?HI1LzZ^2vR$*+=e$k8vC_derwTSFV6|denyEnGHtMan2-x9Q=@m
zD4#zycoYuIqc|}qJQ9erUA;~Plfh^y8+6nImHiiQdK^D>Dx5S70FR;~BXx#QcLld^
zSHgBw#U(h|=4RmhwXk@Z6>QV)AD0q;sDzDP0~c8s@JcV(H=&(LpOGz)l4~)=rLx3F
ztQs=E*|L%WDFyiXk6=lTL#3gXfM+9As&Tv_8jO9NGFe7^!g7h<p~g&ht4c@>3XtHJ
zA-uA}0ltj$FmClUJ<Aj;z=Fjs`GriN@2~R#BQF3+`qy87T`PM29+)+i#%9@|{$U`G
z%%nnY;3I+V6A=g-E1^N*ajnLtfgD(PXJWEt)}ZGdP6zNqNr%;Ih`aLh$B*Ga27ZAc
z6JM^`k!w`^i-*;aj8}1U#~_V^0+a-f4zw5&!UCiPlze9AMg*swjK@?~2n-|WR|YU0
zv^wabc#gPkJ?5`!CNCv5eywE^L8&+~b7?R3-b6|LRA>0Uf=J};sPAC9)9ESG+v~}c
zYOI<EdE1a~-Vm|{#6)`Aj7WIG&x4f{G{yyC9gRWU+fH&li9<MzOu<Bn1j<5r42_<>
zvJjo*rDx##I3d*I1{pQV>&|*9HQYAiyWh4G5opd%e>&IL=je{pRgB25Uv0!J-hJI_
z==A-|38+Fd+?7tlU2oMUp=^#f)X$7wx#7_hh*B!_uw1LB5yPe5WFN}FAMsX#M_35X
z-*+m2uz6Fnv$D>=`19w|SFcndwh$oiL#Eam%S@hNGYyRmvfhN9qb9B;y<K`wGInj<
zceFS??A>suI!7ZTqqsAONW3ZKsiuz<q(^K+x!&gr^2Q*Sz$dxXIGlJQ-2{grrI0-*
z(D#&g&5eycf~U*)j%y^~pQpd{;!h{dW($_?MNO(kH)Zqmm<wWzesk_fG9~sO6u{x0
zgp_zRkx4Bq`go72@}he~0B&YxCi5A558K$JKDBPKlHEn_gA!1U;{evo_rSzIgHE9P
z9>;Cp;^aXLe0|DNQc}8)PhW+(UXw<Ul0A-(Om~sWS_^Y26<QXp3W5uIB?J<5fh!5}
z^S^<P_ykfM+2?>qgms~(NY0lb&zjViJGB-rAiXenlL+6(mP4T0_tXdwO@T}+G|f#k
z)HC9_YwPKmNbfYSiM^lWG+@;yY>=x%P#c(&$nM<)jl)txtAadc{neVN3;ZX=i#=!j
zn6JM;3CT#qK+p`M!BmoIlAoWCno);s3^`=?C4Ai@>C>mv+x4<k-@bhdNbr~dZrNIN
z%QP$(ELhN3;91a9mz02xR`mtSt)h=_0E&}9m&VQ+61WJMfcBKK{A3{17c5|dZup=J
zdY~gPKkk42{JFeyZfdHkkXGUwIKpBf>rV|HJVGQKg8D*bJ68}nmgtvz_dc)8?*PDm
z%%Mc5xp^W%ZQndE1I7mcY4W2h2=nuC;A?7$NqRSFE`c1^rk>i*Od#=INPJy5iqumb
zbC*!ju*){;;z12aR6hRxvE)TLgi_hs*|nn#LmV=L5<$!a5Ol1%^wvpO)!=m#DX5#h
zc<D-x&Bx1FG&FN!P_cV)1f(8|oANBMVg;IjNBKO)!lA20<B@>!Pim(a`1<+z5#<^M
zpc^i}TDYVfiaLGr4HtB!cupsXTf7UyOrbe)1SqkZ<OalX?<izr&d{a&Dy&DIuQ~Aq
z9!5q|%Y&rU5%cLC*v7~A?Yj)7Y0PF33blnw4HUZJl>yMN_^AI#nmz?!<BA(MZd@y2
z6{OjP42l-TEuwdEK){^;XzY}j@7eo=0-=N03qjV#CQt8xm#VHzxF8W&VXi^N{6&S4
z`JQ`h1el5#IrS^+S{DebloswpSSeearD*z<n|M<JtcqwT2Q(~P<m{|0DtY`8?tkx`
zgd$0nV(o5|+ZgQdu!g-o>0J{AjeL9_f#e)v>@du?XbR(`6bfgfAx|xN|NgxVD1hqy
z`QA+I9|Quzkl2M&@!F`JVk?#|RfmR%WtpR13L~wbKX2-u^mPF)_`4kQw+;`nse9J*
zF3Dh*=2Tp|V4+oJ0)SJXj8ig31sVw6^2Jf+DmE5f(F~`gNn3|>h(G+v*L-^#`(n+p
zA0VO(4h<!RPLtxQnm3PE1Rq0uH^+N_){2?=pqsgohQoIcA|5gIJurtgq{Pw<dtpy{
zi!dV<Kj~y<1;KANSEi<?lls71)-kV-f_%<$_Ny!Ko`(AzouDi7%gYn|#j$Kz&DK!2
z(@ZTM=V@O4{dX*0?6P<zX1z5tP|iK4B2+#F?mg45t<OmhhfFIGl*blbx^$`TJFMBu
zn7WnxRDKtcTB$^XnGZ|B0HijeNFzUM{s$^}H(Ax=@PG*^YiN;??1{upV?d6?afJv_
z#$Iey(#@gwj(;qFhYTjd)Y_)LPJX)Hu8PST`S&I_5)-!_JaFJVPWclXDm4!3%gx)j
zH4YuRMuZCjbrnt!t_C+~1^@>tC5-|4+1A@@P7--m2(~6^A2A|fnLP%X_1ek>l%OW;
zHEU*b4;?fUa$-03$lL@{wrZmbo|Pq;VclYYNUfWKv$}?~`tY;fEh=~{jqRvp5EE2&
zbpuKN7b;x<IlJI->DH}VP=~kBK;>&8H*rEbmrN&A^VR)Lj7aDagy)kX{HNsFobIhp
z(Z+EzQFxuvB{;#Td19&#iRu_aOC3mn31Jlup0ADfZ3aE5O)+e-Uxjd3NE(Qip1|i!
z1-J=#=se<K5|OB}Li{=ratKz&N5QnkZRk$O#ZNyc={(*yJI)mX$$pDUNFsc=-y)fQ
zCUlM;JbVbsBu`9AV3DPzr9`?Tyk)Dpn%W<po}PeK$9C-4LEI}iwyQ;&sR}P?CUfAf
z@CG23(2gC-IB=n@rpD0h0_M5v*#998GdGuSlq;Y!k@vn(X{e|!Xk{}e=@Aahw=kF3
z6oMC1P`ow|OO;QfICG#+j%@7k?bAV;8fqz1Uw)Um7ebAA5L@V$=)sxOjHlcz3VOv9
zK&1<`IqfOhY3G@}g{yOH&gdP`B9LAb7KONH7}S4tBBCo?_^8b`sQS`y1cWeNS{2M@
zBXHML+x$VH?>>RErgh2sLNqg2bKp|8Vs?Kn$pDQoKl_R1j)oDcj`A&T;in;W<Y~<T
zr*-q)vH^gNBsa6Z>5+tWIPo5J7s{-N|6)q(Hf)y=mmUFgPaLZw8izl!g8w|k*=YpO
z#PRdbkS{+EBj3;%{|fH<sC}Z$3DGQvfS?4eIjnJwq)ix1z1wKgZeyu4FlVksuft|B
zc{2yzpdv^k$$~f~SPiVXIa0j@X&FwiDAYY6peGy&Zdk?3oBaAU*-76-N#OWo!<KOb
z+O`XXDkZd8!y0egxs&11f|s!A@$9+yhRhWW0!c0UKuOcwhHl4q?D$Zzl%nA9vVa|)
zbdFXV$^T4M9j1&*!@|~~=44<BK@wisDB^A!2Z0L-P)5T!0T4+Ae!$0Cx3KrxQ-Hu-
za5{lXgJ9!=_iZM&a4w+4lT)}oI3mc1M8iuJLJ!$}6z}=iYPTTPsrQ*FxK#|$sTM;6
zzBD3i1O5{Hz@+uDrSOtC;7o+hBs$(?w%`Hcgd;M{1!s!K`Nk(Fk1~jjrK{_F(G5_>
zZ70$W5GjlrhvY+?N*@nEhnVjmC`b`w8xg$G-vI4>Nd)h1G}MUT4bK4)yeYBEQMD7v
z^a6h-BVaZ#8;vMeXGw0WJ&fk<Fo9Q?o_o~tQ2Efy+bJ5m<Kp6o*J3jbN$SRp8xSGx
zf7Bp1e^~U<#-H`#H_W6MWDBCnK|x45frBGNF(I}9ri&y@TE_KzA`WUsym+zC9akf7
z#Zm1eZ->HbeXfz3dlJM(6+#uRO&@fe8oO}y&p*4cK^c+oYYT~s*O4A^>yM1NH`Gv!
zaq<16(7=jhSq`sh6u#Jt*DUxDh2I_zTsX?X!J(0EqEx*LPyc|JL3$D0zEpTv4m^~w
z)<Qz$L^ssOk1P~XU}3eU((q1}7`#zRJv%#l4WS=Fl(~!)wymwR6JyaLx>aq0c9Ju?
zWCkAN#u*k3RXB^x{7BwGo8s!VYi8J)j7Xv$;N=@;ZzHaLJWHXcJ%DfS%^OvM^cXb|
zN-RHQ9Ve~<V&jnfd5-24S{rA+=UTHS4ov%GIvSDaSt_48b*kesD;pFFzy@XpdA~8w
zHIqs@Xu5eW8Gy&c*y7`hL%xTAFf^gyP~(sb&{kTy8OF}9`%892uVf9A;#-S@hGJ0A
zU{xtaH!}A4{`>duqhIid?VhBE!qJxm%`Xnbhml|K%@sGC_;gEn8M(<-{4fstP%FF`
zq#m0kiu{_#pL3ht#+%KNVdPBG%dQGs0SahpYKp-32B2j|Bt~LGEQz(i%*1L#BZP(+
zSl+$UA%b7QOB`-X0&?j2`^HK}B<6uQf6VHWgE5zs!Zq`S-RcF7bR^?W=&b7d2^&73
z678KR4JgQ@A2KHdsGcBQSC}^IaE^dVgM1da`<xfdDG5NSMcwF1Z4wqHFCDGsn;kpc
zJG+8dVqouqfYV4`F4~$nztbgJ5uNP5wF7w9|EX_1f5$bzT!-<}j2i%DMB41rBYqfo
zIKt4Qsl-JK@4SPwjhBwbgXrm`gKt}+4sos%7bWk<l9ZVb3Wxu#hhhUrGmZnzNhpW7
zN3qd9%xBnX9CkS4f@5#Tit#ta3l0vNFjx{#7ujSC`;OOZ(4o>r2O@Li-Wo^+<ItT5
z+e6_ZO$~+y8gZMqY%v=jY#$sRW~P2gng7}Al8>-vrleg7)+3gHRyE!&lY-L+2hgcu
zwm!o?!9}Bm?1=UxvA_Pda-{=aIzXEB3cd_qUvgF(Eya_&p~^sf?<K}V*a|E`Kol5w
zYf=&dfSCQjelj|yCq~qXU+t--IUy);-kq2;O^pe&^EZOVn(4b^*ApfGotK!M;&@^g
z?UAp%15*guAR~C%TjywK?Ky&-4dYc`y<kjQXyQ_7peNNhG(hNA4-TkR0RY8<!xqsN
zgt?#t_ZF1S9xq+)hH_F1Hkh<e1-M~2vtU{Yh%1JKzZJ)P3uHD14gtbXA^ZCT2V0f{
zna1PIMF-IlVtIRPmgAy0FmyRBEsaWRZf+)&9RecR!(lyeFjb?=x@z6J1T-oAq&q;0
zk)F(O_<)oV_!3OFP$?RxU{;tws?C6L08$>1wOy2#tFyBy>|w;zht4Z!6zZ9;&b%R9
zp$Z)h;sJ%$P(Ekl1B3J>Rxgq_>2@W+o9IUQg5Cc8_W@bFd5FkIs!{E2ZRhdMJz|K3
zpy4qnhEWsJ4V`5N6bracY_3Rww?G#W*t+#F5ZMG2E}sVvU|2MgNAirpoa*2;URn^m
z1SJKqnscX^QTm>N858lBkB<~z8UyMOFJARXGz796m>|T)0QD#bC(MBzhzl$1MX=<B
zeP~@0mb_=r9+I-)PmKdL8T|I`IE0e+?(P%Op(kLI#G7|DfWRlvoAr3&vVsyeg&yo-
zMCn=?$3&dVK-*fP`aVEt`+P6G7BapnuqWxqgPEN8zp<qkHt@*0Xn<7BysWQHI;o9r
z4>8svOKnFFFkzT9wuzM&en|MYqB!<JUWb@{51n^1UW~3s580{)eUM=sGlbBTuZF~p
zR+GUD_i{?@pP`|l2;ADJquiWpMUP-Nc%z~d935sh_x3Y-&sNB{nAbW0qEqF#cM@7V
zy5w|?N<HEdpF&QY*zqPD@5_*-_(Lev5qK*zQ+@#RvWK>Z#pTDMq4D)k+5!b*a2_G7
zDYQRTsJQ4PqR6|Kd<bS<jY2p349J3Y55cR*$SyG_#&kG9nrzFq&oy7e($;{LzEvYH
zG9L!eRo}aJFC*X6MhO<W+wII!_F?@zVW;0TLPG>jIy6LduadVrpNF6U-JQU9^0BGL
zBAI?kFNW<7+yN$9@>7L&_RFJSdTzuHA-)8ZG{qR@U<MUFK4MaZsEB5s*c`6+t;NxY
za0sUwUFYf$0%V)wY+y1DaA|j)W6oFU-1|adMF9&0jyeu!HsrH2Oacs_5(w}sIRBYh
z7sJqS1eIAU=XUX`y8!?`aU<fq#?u#a%zCTpF;_RjN*}-PgX!!M4(BAG5GgW{_(+vS
zKI}ziVGXhnYr@PdSdHjMsN4^4ua`>uAYWvXE+8VJ1_#>xf&$NMPv#7Sot~2e6nrnh
zU{7q@q?v=4&~2yLIyu#&wG|Fiu~wJ5I+=967V-n6U;!%i0BoKFjD1Z2WGSt#PXAER
z0^JK0TkXPy3;1Q>%u41$Y0SNViV`~v=N=dG65OQ%#K^y5y`(BCJKh0)iD~5Dh<nia
z2>Zf8Z$TQG%$i88BR~#l=$R9)ZZiZ0Obll;ZKXz+owUC^=LG;_#k+wGzoo9lB`C2G
z^OL5A9Ucr{yy&@#^=R81VGyqrI_Y?A<vE;6%VVNy$_zBrrfB4fScut-$f+qeB9!92
z0R99oe8>f4@g3)owz9G!S|w?IB2D;qXEPtLqUe8oViI^s%KwXN-s%8^3M8yyJQ)sw
z?8h8HJCJ}8klrf@lNp*nkbp)YCz7)x#x65B-lYj_77azAbU2qhA|=Lq-h%3@2>%95
z$HO?BNTmI`Tv)h>yH7!Z&N8lh+yNBfk+MAinMDk)3VNu0{|DwfL;=2W5}kCP%i8To
z-<kB@;OyJ($9ny75XT&b)!-!^1fSXB=HTm^nj-^z1p&Vv5Bl}xu9zStyBEKmTjjO;
zfz+_hgSeLUiq(lV7B>8X+p87J!k?&B|M+s(^&l>H)wi!TR+ay}>cEyo6$5uYLJt3M
z)`xS<L*K97q3%>)#=ycC*B#!Or`+Gf_1kZ!os-?h2T37<Q=f_{U0BVWY)aTpDKG*E
zQ0Q5Nf#3^4V$$S0eE2Z>xrZPZAjG^wLk*u+Xht6Sm7qFu1k==lOqs&-=Ml`fr%>8F
zNjI0&Y#ib=7;Uadd-}8vv;g^Z8#)cY&u#cc`pDrBpcCkH3PC1lGaXAe#3_6<o3sOt
zZNUzY(|LTF5lOtuW_W}7gGvOP{xpsPo55b@HOR~f9P3xJ9jY5<;U}v@KXmw?b=LfN
z>*1gq5X3NA;yoZBqHG<N!ja?e|2vKdTXX#M)0>onnRx8?=!O(Xt*A}+OU^RAOqQ0_
zU$m2S#jyWOCZ_Q2kSfqi<YJ%TG4izZ%a#Wl(~purB8eN}_(K(5NkjUuWp+`DzEy~<
z5!8&*#>U3E!{Gd}M2drgUfR-P2r5<u>Z>;L`0?Z8K*Yu(0X2^fuOLF8`WaVOS92%=
zYrflExbT)}Qsni8W#h~xy1ImY)ReNpF#E#iYdGGkPa5WU@&{C)4szfIlB7C%Pn_&N
z9{utbWE5mmRfOzvKDopvI|2lCpTuI<Z#6VDbQoyX->m5KYS0<fmS0#nWyyEEkL@a2
zl*yoP#?Ef!5f#GIE+1rz$*;Iyo1`O$#N)hpHzc_SozT(~;ZRpYjTf1pWd;B+>5&tE
zGmfT!(E6AZ;EJH?$^-;J3p;CV9r|bpql?9%No;=QkzMQ7ts~tF6wL=oNtRv}%q8Yu
zrL|KAa0ws!#~Jhm3Em<ww>|r}&5GyI+?yzvos@5Q_wIM5lTE>cd+pkI4lcpAv3(YZ
zOvmX72bj}|kO|c@2X>Emxw^VKgwzd4DrYhG<gF*=t*xzLkS<AISs)}u=W#^-?2IdF
zRY%V_^WKZr-D1}~BY$|plmbK!5?vHQ-0qBtbe|dTBq|Pb2I!YJ-~=1C3}7TNA|^nk
zt-`yg>3dfF_FDu39%2G<)nVO~Yh#Yw|D)$k_?2T@yfGe)@O@XW2gc#04+5)4{EuyM
zhoB^=9{qa1tS}iySnFevhvg=Z_A|%CYY9Oq$74FjsyP?UhFH<rE{-r8q8gz^<S?*Z
z(8<Xu59gIh`+AwOR;tgo6KW`lg8Dg66d!CewO_v{BDRxqZ+DH|hRJ4}9w4U?8E4JS
z6NrPJtO9!5<ef(=_Wx(E!VZBKjGPOc2H1$f!oE5y5(jK(>*!dKej9yXLBsr93kwTT
zyN+X|=4)wbIXilg;VN8u%nl>^9s*<W`X_U?>Id5E@bSf>M`so&gn#VlAeku^0Y=IQ
zs#3Q9ui0KM%PA|kN7lazMAji41R`^_XA?8t&Yh~hf|?@m&u_@YyD0V(<XKQq0O1br
z*NqjO1Olv2TXz={MEFuuyx}DtI5{4r_L?zs65Cw2v5xNSaf9&Fn0o38QL(XA1w};2
zqJ4eEkNrYyhB$6Pd_ZaG>AR(W<KXX+qWpf{W%=1{I2h#N;Snfee3P6{f&U!-h|mFU
z3V$IqEFq|>IDdB@DsPVKs8zh&)2B~~^x)?1UJJ!>wH;F-<5<hiW4s|yLCkPKjd%~Z
z)~*dS2?gbdN812}-w)#RO)jAanHv{`{qh&^4@}k2^of62zraJb+yiCQ1^IwT2)@FG
za(C4u!XiQzDl~_MEX>}7JOHX*jZ~&t;NkuV2qSF+%#w$_)<53X_A>{EV!9!S1VMWs
z4dg)u4RSB?Ze=<JH`J%b0&P+#_a;$YMP0vJ5XmUVdC27EUF>dMz-VHR!W;`~CtIj0
zQuuSpz<_WdojT~kv!1M%&G_^gI(jXRCE)+P%SGR9C#u4HUJW1ujkaMfDHm7${m(z7
z*+Nn?@{{^>g`EoEW;>cV-X)QsfN3k4FRlqoH9C$q7!ZmRVWbdb>Y@B>uRL+`B+i%|
zMfXJ;;KumOnKM9w7oYf-n}Aj+fwI*Tx;WaeUskN>!ygW=ud?aT?Ryy+8J7g^x2RSw
z*x(r+vXDZ5(T4s72?W%_3_K$Ii;+FJ+9PNprHFQHP9nc?9w8nMO5y%uR_#;h&jMQ_
zws)i(-H`N*j9PS?Q}9-vqev>dkr@;wI=yD`nxgyUyeoXkWkX;lgpOq?EUvMm@KZ1s
zl&}rhz{ioT$=%OY@<usitD&U_Z<Y+oBJs#2CnqnavX({VF?(6;=K8LXC(G=Bs%pvk
z2;|;1P%Q2}fN6*Hn<r5CwsXIgl$0dr&Z==J?X->b?^pj1#@+-V=X~$`zi=>v(JWcA
z#Egt2`x>RjjO7wao3g8vos<+wW{z<NkyIEVD%wPnU6`2`txB|rkfe>#f(kva&sEMj
z_w!$#$8+xcxz9PHuIu;vem~3m{r<c^+^x19xm$-&>!@E{$Qv`JDZ4!44Q>rX1`Ieg
zU!$X<Lj)gKFfu}V16kDtLVHxBWw_a7*vfr-_wHpV;k(V78}(<Yo{HCT>*kq-<apZE
z>ttMEUrW9lK|?1gOPFsq+9)*gfy?AlLNotaUFg-SO)b@CICEC*zW;Hd9Nt?~4BDS7
z#c})&0Lfd^#E<lfqg*TVc8nOKc;<+VUQQRX$Mf6~^|9WU7V+^*Xp}fISfNdl_!9`1
zLiX_Zr8$dvRbJju5kTk&E%IzkuP$UAOD!VLFt^uF+aZ*-pA3zt3WrAx9-Ip*#z^xH
znXaU~e8sx)`m5wc^$IIBx(}-#4#lswv=XB41$`@(j;D5U8zay4v~Gm>L8Kg*cqaR7
zBPLGXsV+KaLVOOASj#BuEUysxRElTDE%C?xAwfr)W!@faTCZNJ5Q=mePam(!2K1tJ
z$T0@#=uG#upg2L>CeoT=<1{q8a(&b%62({Y!k5-BkXl>R2YV79Ty{RSG&c%3Gm;ps
zm+_gRe&&B-`3GXmK-Z4f7Ev&il$7-6k%2>`<mc<{-LDEurhPwM`_TweFBV)}dxiwA
zY$)9u%Q28JCh0+ML-jKy4e3n!cHa;(?=mj2G~6+_d@4B7rf#z{x1}{gt0TSatIX!;
zMN$@*F1yCuvn6DPpBCLXPpfZ|MytMtm)vVk;;JrmlsrT<MCqRVbbpF7jv1|4`kv;<
zZNIzaeWvYVDh?(~s)OkbrBBa_Q~^%19k9)_0L17L7N+ji^w;9K&lXh>38T}jUkfK0
zwD<aBFEO0VztQ6I`lSn)Q*w26m4QPYtEhujubIFUxSIcZ7AFaE+G5YfrdEpJK>h<F
zbpVM*M2QR<{ErX;N+zUlE2XM#)4pT1&KTg39C-3CNLpS+Ku0fR9>;mrPOXM1)JG7x
zWsVH+Tt_K`xq>|cJN~l&+pz?u$5}=O?MEa%dbDt8{JRrcWw13c4omhV#>T{C!QAUA
zsR|@xI0t^EsGh!l{W)pO_^^Vx5*u^z)<U-8WBY?ixLGJLLL@-LAf$Jo0NI!mSvTX$
zMq^r>Ec*WF5Nm^eL~6H?tuJ5PpmnAnPM4FoqlC*KQ+Og`QD)<8avG#1g_7#Aeew`a
zqW&gsN8%rU{DE9}1F$7b>CDp1V+W2LS#Tk#qng?rYGeVF$ZO?bb`Vf034bYkHlve2
zzcjTg$ugND8OV56?4th>{-3`n)sly(n6~Xmb1kM(Q&ST=UojsWJOJ8l9lcrw`3#zO
zAxer_Y9D1b?{zd|zrUD&JAi}u_Y2~?Mx;f!FU6Khxj&b8yC-pw`N`dUsR2q7+DT7B
zdoRa-comB0*I-B<0Xw-MGRnUNFOq>>Ypv(aiv-}8j4!HTykV9x=naC<uVeG)N?uyo
z9R1vaI5`mj|KM|eBpPBm<;YkH9Yu9Anm1`I2T?0>wnTaaLTKlrYyVYUFNNmn9OuWk
zpzb0-p{DzCI3nrExHF_T`Q^SL&{;w{>v?~s(4+9M&G#l}8%(b-`*y&90YYtmzh6m>
zH3!uAQ>yCc*tVsLEt3gs%7G1l&&q5pBIUH${m92E#ISUf?O&fM&8P-sLI~U=<FQ4u
z<Y*%Tvc~c|LEA)it%R?&;zu}-T1XkUf%Zq44Ka|z!I$TkMxRU?zWVIdt1}$ILAtuS
z>7M+o08l}Rf|s2g^~Q~R=47UNrJC-8qP&}pE|PCN@@!n4+V&=>oQwtB`c0vj(tV=G
zCDkhuc%SO_i&_7SqN-77mFxNJBl6p5W+JjoDn>S!UF}8#rKhQ;81XeAdY3^~%g{ei
zoLhoFfmQ@sblfC5C-%0zV60=#vSnfM4dsJKu3c+YpJnlvE#@*I?7#bw`MOY|z_Vx1
zLa4K-Uj7t|)L-Vazkt&zW*S<{IU*vAz7_8C6;J80C!u%?rMUn-+>K|Il~K^cOq=$9
zP%Og`>q}C&-@jK@RY}#$sMB*>TZPYm6^js)9GDsRlCrX96Xzwpay0sJq}%wa0<)J(
zi#u1})uK`$q-!lljXz(}NwN15Kfa7>8F#*j0sa012J}4m*`Xf{+A9i)bRo1hwmsmA
zwaNe<5u-cpNpxPf?v9Fk!J|Km4thO7gl{Z(+04Lk;*M}n<_!?XFQZ%K{BvBUNLS2s
zNffbcIj^6&nNgn(|Be=yMxPWRk?3lbW`I6&l=2G-da$g^r;nSP+cKf#Lj)vf)2`F7
zabIQs$VUvJpbn{`fsUAS<|v&e;FYwDw^LGd9uzOQwC)E^k_ZoUEW(1|?4TM-cyxPz
z{y#SL18NLa@3zCQU0Tv@2%gx3xKbv*!b^+!LOZk^&$>y*CM;?x1*8H`>rYoo{1{B$
zH<HNKAX$)tQt3<Jx3|$cvOoq(s8{<d!BEAWg&=J7L}vbkNhD9om;@(sf5cvIZ*N$F
zf#g|CJ;V6nEp?ni@2{2`ayq(qQ$`TAlwf9p=-aPey&9g?$P@Ufo8)}o^D?EukpAPJ
z-i_t7_3g)LTP?qu0oeW@V*5Jsu=RSZg)u8<WIkkT*G`N;jwZFL&q5|9VTNkS<=x*)
zLO1A{v{aU~8xfSXI<rswvn6L44Vimuk&`NY4aC<fv)T;@J~?00mR9D)1SBomQs=)-
z>7)7YPry^~0R`6@NY#UiEj7!HSsF7c#{NpY=MEDwju!7$bl3qhAS!U$IID!6U8EI}
z$`o37dQ8wM63!+hu5qmUdq^wC!$V^>tmR;7YqcD##b3e0QfFvG!9vjGkjy}5?3si%
znz$c_2ujUzxDr90s4zmo9W;7(Z0bW)_0f>4$)SrEosBXZ5>s5ZdwGwgrSaAnImLGr
zy^|EE)Jj2%rMCv?7eMUhO{0hLTP9fcS-EnhkkxeeBM!}2!GOW12c~JWWM#ACmC?tq
zP|Nd0mD$vmmlWL<KHu}#MA0v%d8B7h>-|sHG!5(e@6RMILP!Y>9$t2yDy<6E`MP~}
z?cICveYC#~NL)Y?ddMsl|CO+-bnZe${XFIec#{%e#hwCY$MV>BlXr%ZZTMvT3-#m3
zz5`Xqepu@k<Vcs*SYZenfAE#T7j%60AOEEAdS4DNaYw3sr9cr>U$*PME0haq&nKK#
zL|HD@Ry#(#5mL9Q@kY~TZM!zfh8QgmWliF2(z{7bF_G5qw!Im`6=_!V#*csQG)eW_
zebk~_IyNI;KL!n$PZ*@HKOZPU9&lx4<!)HW<RlrUAeSa*WXz(hFI=tPM<V>WotyS-
z{`j$Rt!R_L7epL}XfSJErwv>&r1h_k?_Ll+Ur(%<_@lPeLy_p@>KZ_=49F2q$reV}
zN!mE;aSdq}&qa{F9Xr|^N<-_@p~hK}e7Ui-RDwBun)jaCzJpeMN=1EGR%ZeoYTQuT
zIbBYFve=f&NZ1Q%FmVbY8mx5*nW`x-(lV!Js`$S^O^=r|PHU}n%F@$}CP<dCUux9&
zc3%36*RDNd7CJqgdJ1mh5^Q$jB*9KYZoVh$Peh|cRX>fubO0H%h$+rIFKr1~(|obg
z8N3(#aK+-U6-Gb2#!=H+vwi#a&R?yYNQJ1d?^5?Z>uXpaksHW)K>_8B1=aRPlp!v~
ziC>V7W{KvEngFa{L5!I}i8yM!e1J}W@BykZi18Ca7k^;|*joJ>&y42K<fT<c-VI0s
z)ER-$Dk$jEjfI7arY`O!5g;<GbnmYev&#|7(Y}+A%p&&Aq1c8WGllrTv0(_`3;-Bk
zi`!o36{a%$D!mL!EU9-Xa!vxFV^)!qT?(=UjCmK->;(1I3tTl#N!`0UqT=(?PmsqH
z|MNIQ$7T?~$XA%M)M6&53vX%x&OZIP$%(3_&Hl%#;KWDU{s4ffj@~!5sK_v(h5}zs
zIXtY?VvL?V4Em?S^c{Vy64p4EH*(&ocnY5{b=4RVbIAxW@%<F@R7Qewjz{*Q(ER#2
zz{R!q`i2*&y`SqFss?BJ7QIHvO=U(Pu3ANl`~@m3?au;_9O?4SH^IPKFPQV5lH~qu
zHWW_&4+cX$kRa5705D7H4jgzvU&e+QqO;)^`y=7o_BqABI%N!JxC|aL8^N8q$0~r{
z21-ZElQT4a$tFnmy*S*kz1RDJ$I>(BSeM>A#0OLmAsD&Sx?NB(HzOmX-Kkazb#<^_
zpV}MaTibp5{qqTL5`%H@&0T-Xl+wJGgDRZ$CVXu#E&fc=$qfI{>)dp1k{>py1GwA|
zs$(Q^OJ%@a{sKcFg;$~K_?&q^=D%J{<D1n=0WX%WPIviAO)9OZsHp7srDbKyUGx<;
zrcu_zmD!xhPP1D7wrS5F!e5qsjDC#ofs207o#RKlbw=JK!e-u;luF8`%0E;B0dyWB
zVpz3$^%qQu`v{Fek81)Anac*BVD6XFH+s>HXspU-iR7Fq5PTuI?!D78TLnE%9$Mr4
zF+%1z_`8SF9h6No@GVJ>+T3yK%X?pS-vuC&+_~KS)<&>nhzMq6GOIVNdT`;iAn0&-
z3p#i1+zx4KNW%U5R=lZuNUWr{O|2nyn~{q})1l&3`bHi+28Ll@`#!J*LhqYtd3vs;
zLu`JvR1s6AQqR>-<35_dkG^waa>w9)t&HLs^c*Oyn?RXbRLRRI9}42PToo=4d5V#P
z-=I0O<bD&jwH+NDm1Yb&h#(z_dUusw_Mux`lMWMu{~bHzyDGd|Ycu*I{&b97_Eiy)
zz-m(M{{jVgu9)4`BDk{PKq$=^29Z*SUb=@!p%iNJf;$|zcJx?mGw7uHk%|rnx%Z++
zl31=1K9S4i8FWIamHZnQM`c~ch0_wRFFF#rVe(%pyv`5f)c!GWXz8a2$A32etlMi_
zvC??a9dXZBUw-}dci4#uCgq#MWQcG#V2ptRJX}6bF)Q#-bMxk0x(8HMd{N}vP=?F9
zUY8nKuh-J_a8J5nvMm!`c-44g%z2s~n<uWoxgDDvB0v^jw^^8o%GZMOSbo&{{nxKw
zr<Oel0zA!E=DDG3kQn694|9Te!#9J!8~R_5+H1ZqWrzUW6isvizya6A?hkR3MsK2+
zdTZ44q8R}{*HX$HIYO%bP;K(tG}}>e${?d4s#=U)gE=~V^Etoi7rEq9Q~&($H=y}5
z4F74H*eUcN`;m)?u`9I-eRmJlZ!)D{%w>?izmh|h#e*uTtXxGwdGk+uN5@mxGTER*
z_S2Hu8g0H6wTV1gh2{bt-s7yAVgGqG_4n~45#&~eqp_3o4-O8FusR*VZn1JA*1r5z
z8QE^=)kF&^iZN=ra3Hny>(=@3xzHs<6NM|_lWj7Vk2xH-<j;2EwzVSf>~ZomPEZp7
zWu}u|vH>fk#-&rTcdrC>#Cm5MU_`|1;9o(%zo)wu*pYG|2WvvXA$9k5?7LP3oph{p
zc88@qpmauavB2h|UOV;g$vF(99}_{F{M9{s_Q(+u!3EL6T<DDGz)~WakY@n(mZ8(T
zbQx&&6VXzJ??4kHnWfViGiJ=3jJ683yTHS7cwZ=eV`F34chwC9ydck%-1LMdkrp@Q
z-aSiS8JHwk_mt(tkF)-gthGRGrRSQZ&(9>PZjO?Q<1UX>P8nibjo$6|b~iCGsmhDN
zy@-=8ptU$zKv5$j3US%Hk^m&s+jM^&gLUtj)?7hTIG5;rvg>`!$7ceM9wCArSW-l5
zgo*MZ+Q`(iXDEb35GmDd7afb_vrRPU0I1fuPZ^v&#!FndxoR}>v6*~7jXfQoeP5o`
zWI^f%@!J@%XJ=ZsfA0uz;w01G$n&80c{Z-iA~kh&?27L5Qu|ywc%Q;eJ}}-^Ip>xd
z%ao{Zj&v<~XTSZ^S!=+63Jl@zAQC1Q*4&H-@{;GxNU*v7R^DQ#t(iU{oIyb@2Oh0J
zNynw|cW9#Vp<2}c(`nnaNgtA%q!gqJG~uNAhOl@~$-y6qKT_W_c#$lSo&#kXtu>m2
z5RQ9KF#&qKPr_l}l7{ylZCeUqFAqnY#YAW<L5@O5n~D@dR;2IbZ%3O;=a`{^0Cc$Y
zqD0VV8e=~npT0y}c~;2HO-U+1yDkW0g*d~<bf1=3G*Kd?{B8Sy5jz=#J{NQf>6Pe-
z`Ordp0nkg=$+bKHAcO%5jxl}2G+o29Gqcn`%1C5&0b7YqQ-YxupMG&|krgUj*)KM4
z-aN{Z3M|_!h$!dcaJVR*kAWe>oLP7ohk|J@7f%poPqSjYc9fGQ5e%N!eGzl<Vy>Jc
zyv&F}1No{_1@b?mISA=2_De1O*REaWyj(Gd6CDljQiv4>{A8+<FC)`iG(El_^V7wO
zym(EiqWU!IxrFt%?f{cqrc}_JEszb5RI3c&jqQyG@avOcqwt#Ao;ushud&9t1zVZ+
zG$U=;{SOoBE?vGXM6wt~ic_*f6VVGSCUwX}3WNKU8ADc9oPV`w{aO#Gak&#x!^Rec
z8Xr)pGU)SsLl$1&R7MC=j(rQcRLevV8=0<OFM0I}d&J05jnQzHba_N5E4)cD^ht3^
zTEL#XUpr~oE;oV61!9;P`--%bgJBS%bGonG2~_5x6UO*F2<y|d|HzR|+2$A5EWrBA
znls8E#k`Yyiz~Lhf5|r${|^e-@0G;5JIISmo;=wXaVCG&eepx&gGOLWd}UKzL`Ygy
zP7R)5Q$d3QYBTp3GIfVm&-wQ)1K1*DJ3NzQi5S4Ft|zq(BCci2kD;U^$Gf#V^X^zK
zHfMtYAQwq(%yx!=C&P^v275kR%hu0b0uL!8OppJJkj3J}PoMu{-b%6C*T*LaNtH-l
zd_#nz=g^InwP8k2lDH4+Zp;rn7Te<Tp1ep1J3c@K-WbY@Cd5wjN>_r6<`&GLH1-%^
z_T<v7c3RVXpBsyBwKm>N^cqhxxbh(v1(v%$$|2Q%t@~v;Vg6SQmV-(Ro?8IL1yDNu
z$_H|&xyKNZal@P}b<<STKahliY3JpuS0lMpzZ-0J{q^dOR&BSTuUq=VUM+?U_0roK
z_+r`>Dj%P`9njX`Pz+0^Q-9V}GE?etrQ;^8G8ud(@aR?@Shz`vMk>7F;i6-qTR)E5
zuOV6s!2oECL#)qtR2<qz{|P0RntgP_#v$E0wYu3a<JPSoWO$}zOBlE+HA>=R3j*}^
zo}Ad5H%gxWr*bROK$Qr$t(oVD9ml|~SsrMeH1<4zQRvhNTs8|<<KlUotB<WIYQ$GH
zt#^7Kmmgjmzzzeq#+@f<yt|n&Dcf+D|H~>f`!R=Q+iR!HHbIN0p<SV&9PN<SorjTX
zKVms6M&_U0-g+S9@*<Dd+e52fya+=MQnxKB@4*8pD{RJRvJJ`6y%OO9w{+s!8*y<P
zc21<!xW|b(7_kVbA%}v}ctUK^uD4yA^g+0EY|h#L`k~chPpKXIY<>T&Qh<Cp^uK%q
z^xFn?BuLP7U&z`&HvhmwP}ATc7|mTTc?%`+WepXJVLD6#u!KOu_Q<$#t&(SQ@$p66
z5xS+W+>#79<j-QU>0&NwUO{^`%^6OoK2%D{g*JMya?|rej@j4F&hedoV906YBh!3|
zS;73Xk(3Mh6W0>INpYbBN>%f)q2~EafWD<}t7s%$YG2G&HqF=St)Vfnefu4&99xa3
zSomR`tLuFXfV}tEg)zr&1xnz)KH4^6XE;xzyy(Ua*n4ear!vR+*;-heSur>7!3ZG-
z(a;o}j)MGN_DjGr1~+{iisX|}-vqb<W5ppu=#<I-`a+U?_M6&TQu70|IyUe8CU!{1
zo8jtZB>zhBuiLkWQ}ZwrloD5D?zLlE!#+c_f}(pBK1pjiSE}sgnsy4e+V_MgK{yd%
zTf$vP@kNU^C5c`@+l6vcp{dpFdFh~4eXPc*N(HY<?M3k(C%e{8%a)zJwzI)bH?J?T
zwV`B8Ef%TsgG|m0Z^JhPBK1eQ?mN&r;)hAgZC`&4l_xjH7Z2N-8G~Q!GaFL=8!9%k
z3Uu0$l1@gh1U(t<os#5c{}Y82r%ybUc@6z3zQynHh4sxg59bZrEK2;58|G81J$w4p
zH+*|L@KTekjLJT_#=JBB!a&SBd|goA^CRbWO?!xoYvv20)*Ka5PMfPXKc@zc7p1il
zgB~rwJ^OqTz~FA3XtkVfeW~cXoyQ2v@PimRxbXI6QjYt7PPLz<LvI>yulBdS>o3>+
zm_ir9AD_V#6Ng^T<AA7FZQeCE+qt23xxk7HiJIY=1noCm)B(WA2{*_ebN4X8G;`xM
z>a$2ba=;tPI|2TH;v?v}WB>shwY@WL93^6&T1JE$c{ho*^Cy?}8SkQfH>tID9?Rs8
z<1M5;Zk#n-`IMwq*#KcN>Q(Ic(!HDH@aF9=g%P1rPY~ZCCeknB1N^Vh-o1JSu87Gt
zz(e~U1%;Lp0Yb7%XT>E)9!x-z7;DL{(E5A81cUby*p1tWnVkAUs&R$J?XvfQEzFlu
zys!W2f00Lyp4fsweN-bA<Z_~d*vq6jI0sbghur`^c=M|048frsVWq&1TH>tDv8NpI
z(*pQdAm*#gpjyUz)Vm}#zKu2#C+c{bech7l0>k8w@0>hDWLXD?-FngeR~e99gX5cH
zDVD1NQsm3PqssD&d7Uwt8EW>HKmGL6PFE|}xYWv5?VF-QF^mYrh3E2&W2K%b17|}R
znHv~-yjw?hwJHBd);{$7p&n|xP?UHP7U5=_h^evut!@Ux7|kF$@ImR95tyjp`KdGr
zW;EI7k^73TEB)-<3AWsuzIO764(+@9?{3d1-gfnodhhMK)Cc;W=-s>bk%&xQeGbqh
zdd<J81A*6=>5JxihGQvrE^cOhSCvmu<^7tzNGyn7heTi}5|cr5qH}2R&1>~!W@_f)
zla#13Z6UP|h=!TBztzXe4r*$daWP(LXW?X-Fxb6kNf^0*V(nxDfKdwy50P)HsqG!L
zHGmg<<A!0c-n~a|iQ*uhY$%yL__WpO-$BA`ZLVEqa6nYFI%tY_dcJ-6*BJX`AKmL#
zU=?uUsZVcx`{S?n%a8s8ZHsIYmbrbcGEj-70*Dz6vGoMKhzd;03?HJp96>i3@G;IB
zf>Bk(M3MqHyW`WpegmfS;SpefVLtf9?PxG_!0hE>CnwV$GLt4+ysQBeCobeKWmC%d
zJ@4N1$X)L80eZdrH!5HL-KKBTKsW<{tq_Jfuo<?XVz46VTHpDlb!pLt@l=etnXg~X
zEr0duSk>Hypx&M`((3L}n$a6)_`V5AKTeud%P2lqbGmGbd>KDYvG<<<OE#Ks;Wz})
zd!Lb%lr+Nd+6_^W^(~d~IAYL%8s`?pl$S?IQO6CMT9nF@uX26{7I5ppLiU9&V7sLR
z0lkz1h~9JVFiI)3huFCZobdWJw_ZlV!uK@3?fuc&`C=<Y+g<cSu#>eYcPhvz5(H;_
zZyr7Pr+@4=<?X0fB_}7(=+pC?Z}x|Kx?37wWfqBcYHoqhAtif`WH-5%vCb<NDEqbP
z2vkr{i;HEih-wm<G_j0XNh8na&!0P7ZhS>~<WgU~R8p@(y|Wx&n|=HL>-fT6?kkJO
zJYmkxH#drA7;dUvwsV))gY(P#p|c5Wn|1<#)QlQlRSZ6@rxzM%S%l{0yU7zqjjCNT
zrHxN!US3`pu&P7_sMzmCQqj=xygqaA<0bVQk4!|PcXDq!7nQGa`t)fA3x*jtA`lC>
z8V%W@GK=$DKeZ3XiN+x{y)%IK&6geuuTEeIN?!^X+yKA*<*r1i=Fji{@V`F)dQhtw
zMc#(o(aAih`vVKct|^?B_3`bjiDgQ%<XIE&Nv;oy!^7bp#bp7}i*6ON%FuFF(V3IF
ztP4~adT!J1cMT29D~p`a=89<#FQ=%}rzx|K%gi^8>P0cr!Yw!wKxoR;HtUb<*fEud
zR^hgZIK8jz>LK{>iStT*LZFEV^74~});`-r=VG4oX7kk=U9LHlZN&V`=V%>9Zt+xH
z8i0{+^(B;o?U<5RR|gropg)oJP_@mugPNqFsFaugDGwJZsp5zZBPurnM5u2Z19iDa
zWKSnd$fxG#Y1w`c@5IdDq4EJAViht<iOhH1I#Xze!Bx06oK&gISQmRMJ036%k<-5L
zUihV0Fz28ZE>2BMzmC|@OJT=8qi-6>P(p!-C`;Hh=1t*I^ergGfSfL#r*DiVnJslI
zyxx1=h+yfeT`NAP5vBbcxuFs~OB4=DVJt^hE&@rG&NKVbC8uC<h+#%iDL%>H_w0Fi
zhGToL%@BBN+|f$4k&M(~XXC~MeZ~p?zn(=AyCF?RRE|XT4Zdo;nbZ{CApXk<y=ymC
z<{d|w*?!MvhW>S5t*?Q2a>%3DnjlO-=$5A5b6>ti%#upgmwj~nh7~7A$fDnX-g_2u
z8D{iu(|0XT%veTSsbP;ZV<_<Sz^>yI+mFDo(kL%oK0r%r8DB$9|9d2k#H5UDcV=B}
z-Fq=4!IN0(HUkz}#R2+q@Ui$k67DP(;MIAn##BhVPu4`Cd<HbsVc=Lrp>xyBcA|(@
z@h-fHFOXX+Qwq{oaQ1yB{y&cbF(`{0R|};V`oIy0LQ-caVP~bRwhM32n=pYXJ<kAF
zs4U4s$O}d#dGFqx0}+2Nu%0J!pX1yo&ymJ1;7DsxgDtxggy0TfMsjrMbzn}JC>Ypv
z*oOz49kJL}`Vzr|!Muk=4sCVwN3$5)$?}hkcl$dCt~r$B7(uS4%<Lq4iq$*LW4q!O
zj?bWnABC4>);GZQ8hfp;3SMNqS<odkQCB|f_w^k`#+Jb8D*zzW)nM~dQFiXkjpcJF
z&B$(fTRIwDczDhIZuPsOt9x53e7aI`cNw~HezxJOwM4k)$bC-d>VHM<1V%K3J*Ppv
zM-w90uF!kv?>KGIRNbPr6oVfve&tLm+u*3vcRdd?60Q+}L_74lF!!u75XC6hQ><So
ziB>%MW4p+^A<LE$T0+yHPsNZ@lt9d@i~9{fQ}Atw&J&`qPuMeolN2L^)GysA{}0fB
zmOu=bo#IQzd4dm$Yl9SR@QrbZl!&4tLWZ%iq98#)P_4V*U8lZp{k3OL5@iH^G~!(y
zycU4*(_UB`#V-bJCFIOq;f%A3jGCegpU2RHd|9lOMQ2KgoC*J#Gcr?uf61%kxByyr
zee*qqIR{0SI*1quAcnfS9IUc|LCJgccha8wY9T2=9y!*yROX!`N?#V;YOgp~{^;ci
z<i;qhM&N)E6tvFCX`f1H&`j3&^v*wYY~G<hE{Eqxp>VTbFgS`706V)4UE}`C*KXFB
z&E37;#uG;-p){|vt(~eUzfF>CK&++fjs!|kt9%P7ET0iQkmq7U;8_{*k%3;I5c4h9
z=)+{KO6YZ-n^@csleRpbHU6#N;CWV3EdT(HtQ_<qwqF)SFU7^yrFj=oGW~A2HJ;*R
z<mfRz^FUzOLZmHON7SYu3EyhG+Y}Tu4p(j=v|%3%&K7ZXMqx=HZVZiYUzx;aLJ7f;
z9kR$oGEccFI6>y$jkg5aO7xaxr|04>UF72hICHs-5D2DcclXK)>r>xxk=itk%)>;`
zqviEYY+Mnc%<oAsK+@=5J~*r?Iis|L_HL08p_4ZgZOQu2Yij(?jW4y2Zl~XCZ+W9(
zTjdyfxN~m~43wt}I&6A=+3XL0|EVU-l}uQm(k!FK1{#n#PZEXj3t_aZj18o$yG9cv
z`Xdo+h{q^2li*~&AwnKQWXr&sEJyK2jKjmuu*d*{iXhoDr*oH@<UDF~D&z`|B0~=s
z0s{kamx>@bhVufLL$ZvqO&IaP{RMbA?P(MjY&jQNib>$I2n029cSQpu!*Ey}$VmGk
z&2BgU9L~U3a6d)cL=goE$3cT7#j<c?d=TWLHsBz+A`F!81F(}naR>Wc#eRX@_5&5y
zT@s6oLcohl8;FL(g5NEw0fVOZHPQuK$S~(=$-fIY)~YgFCPDhyKQ~YrHY)yJx75)y
zqh(FKvT*rl3Lk@<z3;c5X|L!zq51WNB;37gj!&GA-{lECSP{B_Fc*8iPw0d=hdSrB
z>RodvmAwiRUd<^>%?R9oxra}qX35*F)v>E`_IA0iHbEsAR=u`=|1U4U7De;F{}a{!
z@oe~~2_!}GnArSPVvFnZBVwVJKf7Bdqr9|4)a)C=gB|jswZguDEZkp-0%qj6&k?aH
z`ff&`*z%`)i%=Q=`QN_ouSI{UWZH4K>JI;F_in%cW^hHsAb)Ol|F=khT_?JGSy8!M
zm8|w1Jh<#~Y}1Dg|40;dJ93Ioe%W45E#JsT%QC{^cJ(_7lIBteOg|uhRe;~QJvYaR
z?#T+e*!~&yut*-^V|C&3(VK*mRRp)?|MQR7N+y$;T(s>{g{^mSvEX3TRmNtPqp}<O
zxXb%u)HdP+#}A0Y>?{Rw8>h|^*-{-ER%_3$4ptO|GQ28XCEz~;2$#rwa&GylE3vp6
zkB4M{b0TvBU>!oBiDrZwe49H>&n6I)Y^7nF#eh`z{sZY<=oNjL>s`9)|CKh9C+98`
zB%I?pU>cJ0`Dk*DL@N(oe=wqni<)y|>sFqT^39t!I+hWBLS~5?fJ~xh@QN%70p}po
z$TFm{fB$|uJ9wu463}sd%&abQdHLwNOoE8uf<$FSeaJGgQ&1a`#9V;}u*^6O%d=`}
zJlb^GOd=jzpc?WVarzXwq{NOZq}vOLA1)$Al=h5tbbvO$q{0TuR(?2$a{lj4ALn_x
ztu2O?ky&<enUR_o^)QN?h=td$kl2I4Q%0D4G;~Pfu8Q%Q1P`DP9kY;s$#4YGC?z*{
zj+p)ect!`VBub0j7lfY<f)h&fFtB(jYH(><U(&1IS3{nqA~yd$ejbPV^ZyL%pM4`!
zCLO%^74udkF_5s>rPsl5DVu|jmKySOMjMY{LrdWcZ8tAk<+<@2vm58&`ZH=TO}ERH
zB+lc2bUSewD3hJ>ooe`%gA*>1j*Md$aiQ;~uYdb;K@HG@!w`_oD_hV5q$8fXxce<?
zkb__pZ*FF$!h85H`55@_Z7CY5e0{sbPO;wJ>1~`v{NzEY&?(7~G~$kTi35mYrzW*&
zBQ{ptPxk=ep0TtDE7$yo4-L$Vt<XQ~6Z)JHW}Zx3czJ#3Wg@Z0o(gcvqobDl>QQBw
z7k}3jByH-m=%3#-ifS_8$*V>tK4wQ0Pb8ML*K`IXvPiOb&2YbwmbUWM)?+%SFWW;T
z)l<H0S^Nkv!shv6=*s7`9R_E&Qs<^i0~jzd*XA{Ij0cYd296k=DXYTV$+FKW8(ori
z?cP1=2GcCh*`;T{B8`B5SgrSXztA+0p6AHq^w$-NIK~4^%$eA5WeXSiz)L+g_@s;U
za-NON(sw;j8a3R^^*L7bVA_lsqlVg?`>VP}D|jm><~gs%p<$)}p;rkUX2<eELD=`q
zoIZVo$>A~S^LbyL_HIOKHgw(v-G@=&JH~JGIG5zy*m|TpZjYOOBM;a&INOB~U618A
zJ4N(W3iDgygm6K6h_(qI>Yjca-?|vJyTWF&L3^L0)b*mh0H_5)<`hN=<VFb<LDAtG
z!c+-vtn-0LvPAwzD=0i6HyK`#V3{Sv5pZ_ur9K{iZxbTX@r>R7AK^CuluMb-EnxgV
zoH>~Gd*0$Mw~QsI_;C9`^a|`FfFGJe-Za$5C0T#LBcJAb|IDH@{0eBb_uGm;GUotu
zf1gjaboJ`f!b8(xNm&c7%`=bl{IF@m%R(Dp85E{?oX!x+>R*rjqGtHslsYEv+66qQ
zR?-b&){;$<5FV3;<2FhYL<0@P0KoU5LXM9UBW1-ie{|$4xD&#=1KgiL4<H5%;zJ&q
zN!cK<lTwf>76#ji@un=8p$J8xFVy30=nr3YMke9$PhS4hWR{SbXRg2bT{gYIBuUAJ
zZj>tJ9zhZV(35<#X3US#4Ve>TUP-wzO{^SbT@7E66%wJ6=~*^9o2-C1U4Fj&HHI>L
zLqyO^;ZJFwZt<M@IE??R0Su_Wl6WU&pZI~p`$JGK=lM(Z0!Mr7$^5Z{c`U+O*1>=#
z)2KDYY%E=3X;smbWO&#n&}g#J`Y|KZzj9UtI{g}W?uU`7**WbhM&*WAMxHtse<Y>d
zj&|n8GtG_H{c$>}RgS)%$)R7ZzSHjf<%rv7w{ESisXw>0pzm3YM`tRYUU^f{=z0Ij
zwpH$i6ITvqFPKcbHBdgviVniOurtybgxq*#Qv34ZJOD49YU?-g7wH;18@zk`i%i;U
z3Htyjn9CQJ%_+pvWdtp${<MVFks6ekX!`6`T!<JI(+qEd-t!L()P-c0(nn?-&CJck
zNMDq{yanHn6Vn~(rNw7#*XTzC$T~3cfaKdVx|o%n9u5wQ?SU3k?}?p<!#cHn`LVUa
zE5SDAU1Q@sEgPmDN}wCx%xd5DIaxhx_^|_qT~-fx95Dp*`t>Y==`rEg24Go6ZdP4+
z15w|VP`^tnl>^yv_u$j}tKDT%vUx|qruAYIb#FA{jI;WDR`<lC<DC9@int{1@ZYFj
zb%k=Mt*xE^nrIe)Wq9}361_(qdzw-oOZgc$j>eqS6z)-sM&5D5P7_AnSc?~V=i>tE
z7i59;iAV67%m#Z8F2aym{oqDq*}L<^Cg)}z#i&LMJ)6_E7(J63KYMrVb*jC;P*c0e
z&((-&dY5F_p|WR5#~SJ*quUW-TW?%>ZJ$p|mFH0fGotIO%dk@0MF0CrgRv<#k;pmz
zc#7;y4}-p=F%aJuQ$(<NUOpuEq<Z%;j-};$s`b?=x2<UIyHWuKHwolcln16{jOf)n
z@7k=XS6&kGhCQtw?_PEVNB>l`EW7i7N3Bsrc1Wv74R3X-!|1h-^o#a84#kd<@8Mm-
zE4<L47f<`!cF#T-^9?Iz5=IB#U;_DQ3<YukS99(WTl2inua;Cjnv!8SNIv|>s}J#F
zTK(5}C<t)=MIj$MHpaTazonA+2WJ<ZYC6jF#Lal;kB1n}y|AkA((s}@@b-M2y<9r=
zytf3qsHa6}js^4#rNj@AmJ`&(PHAi$`=0v8YQXz-&F)b_+0G15-0=LMr6l@QzEo3a
zn-Y?lAsC><Vc`HJ){&7v|K-tHq21%T^W*0*_>sN0+2O<hlu_Wq21jSvPe~~yG*hU*
zZ4BLybh~Lau^>@m?lYo*DJl!Pa%#N+-MSr^|5}{4xp>}h&@VA#cH7sap&ifu3hUf!
zUu|ugP;?NCL^iUj{%Q_w=)z@1#G&)ZqN_g?VuB^qX%-b$9IoEJj;jbp2ukhG_hFH9
z>m*M!RwY$c3zqHK`u_Efdzl7g5B&0`#J{H3ifgd(z;}^B^R>q*Vj$)WWf2syAXrv=
z<-05(g!0MRQ42y9{>*ixKrAeR2qSa5dwygyu1#DKwdg~nT!{m}8!M$4{o=~=#tlE^
zQ~Q*Wr+q(0AHNFbwKfXnJlV-S<fHuCip?3fkr0XZHvyx+lBhSRHY6APMz(Y=8;Tx^
z);4qGeR>>Wa_RPV`n|<<cUj=ve#%9j^`TC-8Q%P-s!&bKN7zVs&K#q5wp&TbqhIMZ
zxsYH6erwZ2q5zpV-IuXu9H~B}o{V4ZM8E+IoCEt}L1GaPMgI9`J#RovVEuDvnIRWG
z@%AnEL%2xLJgyREI}9U?!!?J2JH<It#6NV#Rs=Z)C&kobIcPA-z;l<+?A+NRh5VC_
zeRnP{88LR>V=*^GS2u0k$M+5U{?_hukTT$c?Zo!e6J<Z4DEL>;(>y3sGp~ouboa2H
z?n^s)p!7%GTp5Lkc*t;;7=k^2SFx*u@dFT)ep9C=wYC$AHnROn*-<d55!%Q8_;3+|
zFi(@U5H-h9Cl0e!6*GCQ8#k~=4urNtZ(I(GE^g{ufvu#@->tqYdzCP~bLXvw(`{p{
z8GNpsltc_vn0j8ia%Ba!*;5+f&!E1i9?z9kx7=2d^8rd&|30wmuE@xh+j{mbWYIVN
zLT5L<!u0s|*he%zq|&hk{TBp3kE-bq`C3c#ll4P_ZtogAI-Eg9M0~5xLl+-jTS-Pi
z{=4LSn>KAa7A8;f<<y+ws^<Gt6(K~78k6-mcC{4e9j~3_KfVG^>g|dJ9y_qd9!}C7
z`gRP({{D&^nb)AC65XyNY-S&1LC)46AUM^;m>MdX*OJXm?)b1!^xKImu>doGwr!g@
zfzXl=Xt?!}wbrs-Ey!B^M~&qAwa5Isw1_HyMQm35?GAAv1`~B<#ME@5*pw$$FqV}+
z{F}mm)%Q{?9`xKf$lh(!rt<j4mm>?LYD4?c;hF;tu(&S^kOE0~>b$vbz{D*L>hIh+
zIJ?w~U;!dsX+U0oJ?O-pJ9j48A@DryI`bm~$U@PSYQQU4+30p<S?j%%uc7wWT+4X1
z<XF!>m50bqF)v0KiYQLEt8x5Qbw>w>6_gWGuA-6}V{nj}$RA|``;^UyZ&}<rw068)
z^O7XMNbiIOvnPj5taZDJF8b1iv+0V;Cz!-q&=YjrecR^Lc!nG1dN~CLZdjqr4b!W*
zM%S?tCBXKD&LHx9pvd1Vr%){)NU+V4dugtDAt%IFwMIE^b$Dp#iHGL%Dc3Bw=mBdT
zj!wNi?6z&p3mk!C+-GbqdhmkjXx*;6s4EvOF5IBEbrA@F$ggMSmXspG7d09E8&AX(
z>s<9KmtMf{%CbanS5B}<!zLwNaoUy(EW9dXWZ%9)H}6IP>6U!g^m5QAqk&G82UCuJ
zpzK;nu2H=<O#yg0;rp~?$rJj@^UhO}f0MV@QQn?x7PG4QL-U}}<66r(`wW;2io3RE
z3W!d}_t&`NlXsp$q-i-};J|RV-@0t$nx#+Zy^$q_5x~_MU*G<=^wn4x!OVlm2dxdd
zpSQpLHM8>NbSJuRqOVZ~#x-cbolHgyF=oL7oCu0H%$@r?E-~|>a7R`s@}`1QM|GVP
zH8*ZLGbfp2JsCZd$!NS6Pcj>GN!LvG+#f4u-M%u5*{c}f!;ZT%ZB7Nac#pSF{xZ_s
z4#1UQlhosFamw_J-)m_Z>euxBs!Nxp_ujmHdojEzu+DA?FzbqYEC|!R-+k=!xjs8x
z*A^#k{;B@q)UyeK1R(vTF0oQGsP&=dU%DaN#dBxlW*K)De((I-%6z*T18@5C!%uZa
zwqQe1GY*YNaHCvaHNl~^Li>!Y{V1-Z7^ph<dG()?G&|MknVw@hbOWmU9#x_?MLLq1
zM<QZf=5!`G38q6L)pw=g2X!;kd19cw@il~<mREIW`PEWQ>0Mwzz^aOWzDxJ5jALJ~
ze|}gtFff`PBE39C{`dQDmy6*>;^_JhW1pZJVwU)i@+U_~#LIE3mi=~`ZjW0H26VZ(
z<L@;t#hud-N=2sUZrZ$gUR=$DI8^=$qk8`u&rBdznV5gpbMqFvov4uJkk1C!748f^
z`@8wMX!F&-@z5O{9lH&U@sQ=OO*Mv1cIO9o-6hT%QUZXMi16q<V_wWBc8hF6B3UMm
z1jzS9I*RNPbZGdTnGFRi&uHY@J2;3<mHV5Ge9rmx4^GezjVYa9IKIwdMNaklwfzhX
z76?WEqnbeo`CT^Lu@&@oUE`J4F5&NA_EUENT?C!J4-g@<Tx~mcl`)i)D~-!N*~Gq+
zLdfCn26UU}+;^vZN=}2o@y$?`X(^EtiMHv;NPI~Lkm-i)8S@q$5NTp<>29BHQcC}D
zFmqe>zM5^}w54L%;-0u*tF=yPQGQDBiKBfj%m#E04Gk^X6xRRDnTk{9U7scPcIk*l
zesJU)K2ptYW8C{B&plXkRRE)0a$6nMj4U;)f9dA2;D=*xNypU0GG%(NQ5=@URz|u9
zgwf?NHsUC8{`~pY-21UbO#M8lbsl|aMnh54heeSqi=RI2&`YKrjOv~3(pk;$UcXyk
zlAbmS3$yx1?-CY{j?fZbYRo+|v}_lyy!4;5Fbf>a1&2uM>stX1qyZ9N3iP!?1>x9q
z;m+@74OgQBN%#Wjafj!F*~z*Zf7U$S{UhXB;#q55n&-2d&cHftf78EYV%f<cr=ghJ
z)-B}Wu4=ga$oj#e%j^3WB`C+9E8RLamq{y8UR{B-k6ZU-l8`kx1({8mGUa$~L3Pnz
z-m)K^w4%}RXMSWTfLET!2k*DvkhSb;KK!$1xB2;-3~ylp_x!!ipig&i9By+}_p8}v
zoj1HE`)6zLX6i9D^agv8CU2V7dFc)!oavWDIF~|t3%STyM@Kr&iavPbV?(NSrTNi5
z0TH^rdac^3bplA<stS~D{%}B<0|KLAAywdZ)&cN{PHzrC4!x6ojCE8zP`#sbXC7BJ
zy1qDO?ZgC>$+MV-Lfe>Sv<tseoP#5-(RVv=;9B+2Xwqwd^&*LKDZk>oqq(_qc<=|F
zD!OF-IfV$f{0<!&2!u#C7^-U?^|e@viRPW`)kAN62y(JDb@g&FDY$j;df~{+_Kc2|
zuW0h`QRdkP{_Tvv@e6GAtSE$8{<QvH2t=Uvs3c&d`5k{=wV=?pqHHK7O#e-`YbS@B
zv-3HOr(K4g&__#*6h++)qOd#thxMKhE5F}D{}ax}-J$z$YsnPK)*|EX;JfJ^S5-P0
zKG_s)snJp+T;9!!DNZcYp;+Z{Rmm(Ae2bIz^yZQJYuyHFL<<&jWaK1nQY(e~5-PvF
z0GpcZ;SRoz)`vPcRmTC)S9G)@+(!fBw_&HY5sq$_6V5#RbrHTR6rDxOZg7sJ>xMd^
zxL;lK=Zx)TS;0HR+fO=os;W(RH91#RdVs$OWC}u@61%sjiKZxzoDFpCD{_%Q7(Z*2
zZrb#Mru(z6A`>)nP4-+Lf*GrH6k21BYR@D`^<Y_`RrLIDUY!n-YTCw3%Z)GdW2aKx
z<pTUvSC*1rbCGQ>J&#^CRHiNXhvp!mqbQym^<Ff9E6sQRF>8l-HNBlb+L<;nrXq)i
z(Qlb&=o23N9kPUXTXS4J1p`^=_N1-oNpf4C@%@_sl*%q=W+k!v{<!qoRwkqXmorY@
z4P0~W*q2?qT2&U^MT|fF{pP5s7N|ctf#Or#ZnHdD@h)2_Cpi2=arPp;DtPkkJa5US
zL;Vk@YwM)})b<>HtWD_J6u*ItO-^Y{Y=1KP*rS>}yS-h?)DK1cm7bn{vi*;UCQX+u
z8apIs;4}~}%L%37#@R(zJ8(mCr#t|?6MMb%58ZY!8j1^JEzNE@(1N^on5ESoYhtWx
znPYrb|JH-%D$-T?5}7VGIJPW8jHcyUeSRzk8#Ij?RRCXN^$Z0kb#B!@+wFf-l;v5R
zas?B*6JJ<ZC{B}N(jW*R(J=@~caLKOu+F7>bYIxW49MI#Lz)5Gq0esLwjXi(?%liP
z*8$89M_>1}^%-pU?ES>hltrh8G*|Ld8tDPd5EV|}kj771A#?8Vu*li;P*^6vOJhEe
zN#5;mZhiPi<KrRU%H{1V%6{?N&{EQ>ZhCpSw32c9n@5Ejp);H8E9+xu5%cx><^4?L
z@%e_#FI#b<0ZF@8Ar+IgCcYtnC1voT<gu)Nd-ZM4s7LydB=dV6uDLZv$z;nB%SKMP
zmD(U`c$V*#JpWp^HEK{Xnq=(595CgzClUuJ*aL&&d3sh=G~0fzJLNN`91k4uH^r@8
z?B``oV@|leIKBf%nYa;|ry~$YoRk$sRcuLJF?%M%po}=IPXNJu;8q1PN_zFP9y0d+
zO_}MQnJaTz&xc3MJ+i5|ES(-^aNY23Y|JCaPjA@#E%fv*(8rY?$TQBArc_L^ta@v)
z@ROy?8PJCAWA}>p0w7XyhDIxjY{RDdz0I-=svA6vGozn&`K$)#33|a4vyAp9Sr$@9
z^*_Dg#*R>tZLG{S_uE6xd~j{$-{4fI3-r2WOuO92;>v5SWA71;cj-|hU?H|m(D&OD
z5pm8vl05Lkhb@o9WrTP+rU0^d4l|)oK5yEJjwS$~ncMc~>X)e0b0sF6*(lBICcc6H
z@4rWIeOGeWxDG;v^&S}&C{GKt14G2?ck)QwE74$By?SU}%FvGX;KAw34%pAsQ3AzV
zRrOr??0qk^hbPAke0!qnyd<9xeqWE#<(Hg_SH))>-Ra!t*8QS6o-*Zk?+tUL3@6zY
zw$DgQ%i$Jx(EqK>!P5jyjLe1Iw%4gM|4pao%VwXEYMIHA1q)Lekp<+Uz^^*^l_Drg
zDpgR9V@}_=ldXgvI}$r-_An%L6fEa(gFL|}?pY-ZR6%IOv0STSvZ3|@ehU-R+M|Xr
zu}8BXo3)136w>K;+3%cduaw2|GxbEpJSIUoVwU-!G+79858`-Jbazgn$VHc-+GApA
z^_aS?L>U>3QSD?0`zkzHA*ayKM6X-bd~_AG4<pAM{fzpIt#~WW<mg=Yji_P6`RQ4^
zycvLBUfgcp%Ix-<ZZ{*YGZuC@`s%_71y8Z?^dmuJErcFV&!yeHm{>tsnD24KpiAk*
zNwZ&mn->A^D{cbbZy2U$&fqVPVi2ZPabK=Ok0W_xrXAWO5ns#Hf3mH^{Lw9TTBbp)
zGfZ|<Jf;AX<T_;GwPmGItbF?xJdk)WVof|3!9vV<c%Du?PosMY9-aLRz)K~JE<2{@
zJO$SC2GszI=o{w`xEbV9GXL?>V^kP(y6#F?W{7I#vMtosAe!yq>x6V<9bNNY!F=v=
zNlB-Ii=(EVRLpqr=>pboCXajx>SPIDu=~Q`2|pQU6GFYe*(1x$4o5cw5;EY$u*H<d
z;Jp*Gi6Q-CUjMZG0bTC#xM2GQrJ|rgNS($Ttoe=7Ch|_ha5g?b!N(2El){ra+2I91
ztY-H1_S<sBi;YTSOx;i=SkuM1i!V^aFavb?P6ZJ`Y>}t?3ebZ`W`X`mgNK)FlF3%q
zFGf$cd10Y0F&_(}-EVjZXONPW^lZYGv-=s=j7S3LI(~|kRe;RcD6wNTkG^}#6e|Qd
z6p9XY{Ah8>^sS{(QHgA(Pe12urSQu314QR!t9E&a`^`$oyTsR(VQ!QRLFJSTm8FzA
zaRonYBm(-nSw}?SL4b>&8AVR=Sm^;0|Agwm2dQ*VoCrb<-WJ-O7jYA_TOJ#y%wmr_
zv10zSK&H(jh_)q-?yR8^E3n{)bR}%k9+_#4riVogMax7~ATV=O*I^H(rn*o6sjU<!
zh0D6LVX%A|ZAXsrXcSYyTd>CwjXmX57l&;>O_oWpf#xT>4_H>(pG^u8Lwb*Nm~nK#
zxrx=u{j93QxC{fNjMz-@bm_ZM@W$%pQX>7eqL92ctmy7i>bKgPZPda@q+{L=RZ32$
zLRj03ZJLa{;!%H2gk`*GW7<cAHUYuGcKZ^~AD}2qrTbY%v}n38zW=)^;EZSM{~2-u
zsyPQ!CW}+EdKX_u7Bxi_F(W?$&7Lbb`y5a9`@GF#Yny<1B=|Y?X&?YdF=MRV7_n`_
z8~Mgwli1O)9OC~<Nx(cUWz&aOTY1vjbU*oeBiT}uoRX3)Z5n6FxS`SQ9maIx&zN!O
ziG%7E{o&C$Zw}W}{!-*yam}V(FBljcAtXIO#a*6sG;pxY<;#Lx-~n0KD0ANI;5zVn
zoh6@#-4EwHx*5jTWK3XIYGeVg(h``f3yV!K0~1SqSgU(L;o)?C<&SUuVx{(X-cuI2
zufT9prh<j%!@V0L=J5!=MXTfGr2uM~*0A|_7So>{J%Y+)OBmJNS`QOp7{!1NF&aME
zEJ^;62905}`=V!puN%bDFf!a7At=-SRQVls7=zuCVB~L^&-$yVKJ_O5rL?AWKQblF
zZw8Xe6@yy2RrsI~d;>#nn55l)W#K2Ae`V^ifO+>hoK@+?UoZ%VTYZkSxO`6{v2bUT
zBb0Dcvc(`7S&pv@ot*e}P{`b6H3z8KXvP7TbI+N;*$>6;5ctl15Egw<Z)JNXy!6rH
zzrM|76f#j}3D{C5xV`LzWF=n6gqN58wEnCHk8By&nA{`ts7(FH_O&S!h?IEoXM<_U
z%8Ws@=p4EN-2SAdCqW!fe*5Ll6Wj+3O3&<erH+@51|saah9N+So%4Q{&^%<jlvu%w
zyqC8)kXJ`lC2AuvNW*_<zEGDd;xs;AWiL@sadV1<worJ+uF9^;03L%4^ke0bu8N?4
zgq}Jzk9thAxTy|aJ$6-5{KH4fkN<-b*Qg}PV_}Q{$lu+TwtVxcpAX9lwc^a<TB*##
zEw71#G`(=;LeLqS7b>S+OBnzglVAb?-n|r!=iuz_=z7N_0KFA}6YGN4jY%N2N8}ln
z{_JVRgE+^wgL@;Oj3+sBEOwM|m4>=p<Dgk{YZoosDzj~Jzq8LQx}k6QmSfv6!^GsG
z2l*=in&;v3qRqr+T}j62hNq}o=E|ls^CGIvi+?2~bg6jTs&UCjo`ANE|La$C^eVog
zBQu7gNzd&X_gr_@g3Wy5?{ecfO4}0=wmtgSR@$A_J!Iwk*t*zw6nZ64S7(`#&U}9C
zPyW-vw13)Xi+JUcjh^*eIIXD&cm@OXu81Gb2}pC^O}8-@+wTsQHy}R(V3n+)D^EY#
zN;Y2IP_M-RkgQsTUa~u0B-;^nh3k&r;{SGY&n9{nUHosiFYKePZjX9H8BcpuUrKVc
ztw-6sI)&Ldy(yg`K4Z#$=LF3wIm*rkcUJD`^6iJz&gJ{1q8nOu8%cgm=`f@jhnsYx
ztYiK-*|aAm(l)J6s$R3yU~w!G5KAic*%Y~2N@@~w^s3bc>opXnG4JVj1SsQ@4^d(g
zc26=E?o4@lBmK01cESp&l&bq-n*bL-wgAy_jNKT^IRL?RL_`@M5NdtRjSsE@TEW_o
zqO-AOlkE@G@H6?hI_GZ)#RZ^qpYSSf3*z7}+8$?TbAS-_UcI8&a5ELY@2V!0=Hc}&
zRQ<4&E|q!1Da7Xp8!s|P5$^$BqvvG%^A2GG@Gz6PW%AvAoCwnmchDBUAdtxoAw!<x
z_lo3~zhMRx;R3iQLmm>h<2Kc;z;*FK;aG{<JHK`G9>D+<&aZjH52u_)Unu+IkN}8W
z!Jsb3Tt<e#bAeP#o<9AKP7R;F7nCHUR}9BCx^?4efM2lv2{OJemSkW-vPd1BvzRZ6
zvw|#&quv#BTLF&OzeId;hh$XuWJjL}QjGwR$WwBVn2Rm7U=2ckpd4V|WaLWJJPvoe
z%hF>WWHbUTA!tPzFKd&;TZSQ0`YQ3%k=-Y#awv#SCKpY0e+~5Wf}^|X$@XrdqvA#N
z*x)HLg5-XCwQ)g2Cn&k4>PU1KbhMI75O#^Yel+c*m_2bhIU4?ae_8Jf$@c;<<F1^l
zh*Mu!I(*NWjoHY8LV1!)(X)wCO69O2qq=ByiR_C@(-evX5xTvg0J={d)BnSV#}8nX
zN26(*;P`7csZZgrR^wiBhpp3McEop;S@!F9TPZBQOzXo>@4xHDqE_2wanrp?e#i<c
zwzbzhYd6K~Ll?V`*0+=@k8ZE;Dv0IG4jktI82eJJ$&T+Wbo;iiK2wCb2?mSQzNeak
zog`)STWV^GIqPZmO)pDdp!%b249t0U#YJ`~%{rv$^2z!-fgPpBA6R2)+4Rxi8=Kru
zT7VDzRf}2(l;N~s6-apFoLv=)dBi2v=1wRJQ8lQ%rDQt}`+V<a<R90SjGvIi*H-<x
zsVNEQS~Qbo0O3^!zc6+BRF1D={7WVk1^yroDTS@N2j?b2W0sG&W_+peIlw7ll6|Vc
zOu&Szt~K#?WmmCGXZMc%(Z+6Kd#|0p)nBW=GO>^IdQC-;Hk4=o4@LUmJYI)?+_ER)
zd$c{&O4KHEHf`E;T$Bs4K_SbNU1QH)ynxYb-DQ$f`KQUFH9L{|!FmV|DXgz=h@YRj
zz^Jm7S~&it_V#&Wl?tzr8*BUG^dTEb?gQt5kM>oHM2KeK6g|WwLV;_>*Kcm}B)YWc
z0D!a2RAz&AcyCp-!<S#cMy+t}v1<nE(xCN06Q^2s!9kO@rfc{8RK?_C3rZS)Ej9-(
z;wReLgtYhDoDiOA)7&0ve<gPfL~0ZpJni06e0CQh5YpUxNJy|_uq)MV6|_Pe8$t6=
zNjHGTJ`2KG>%;X4ccfsG3kUEK;~b!^CiV7v+lgn!15NS|e6tRq;Yci}R6Vy_!@^@z
zd7bN=!!l?4i*`u#8X}OobZH#SqwKU6#|X~IV8Be7?DVz3CsejufN{BI^w93J)BM<B
z-N242WvlCcRufSK6Gt9Q@c()P<G(V}&_K+H+S6|%aSdof`dDDe2q+NOw67I97s-<5
zG&YuuoMIvfWN><-8ttVxAjsL9rE%gKr$NzZH}TBxFK;w?79al?5Q*&NQW0T~s6tXe
z)_i3$njoGo*o4BuBd0WM1*9vG#=MY~6l76i%7jc}XlRtz&d`H(^&L)`rDOL2Y#0O^
zE?cIs8o`0Vf+)}5I$W_K;{r2xG0vXu_hhv^G!}eY7N04YLRcOT1rFA${7YmEVv~s`
zTD&}E{X9?m*^?(r)GuLCO+hWQoS%RGxfF&pqamUXryxq}QUSF?8!1yPro^HupTRm`
zlgP9uq?INQEd4p3H~IR`mx>@$V(#dLv9CG)Mz`fi6&Du=6E^8gO$uTi_sYU<kj-*J
z)D>3Qf$4mYpiY*_$hZX?4|2{dGTeOX3%@}Lr#~GuSBd!#-Aj)YU_4CrU?<7E7o+7N
zR9E|A{8^rRW+(&2!ByBCgOH2(Rl+`BRCe8ucsHy1K87LkTp;FUv6<|E1m*5|ED75R
zt|wfKYwA~uh@a=JxjdO~a*w!PKXrh*1{jf_T3V^)RMNY5?vBpA&2XFQEr;?S{F@OA
zFRskZ*dxAJ7Mi@qoyZ*{Q1l5M9lKG-XuCyWLyJMvVn=YSdql|9dooi}Mra<5+YZif
z@8@F`9liLR>j!t1)@EnpYV~9UCbC~q6vw>{J?8_&Vg)7&dZzx2m(EaxrQlvKhU!EV
z6W)&{pM-@2RHHiM<c-YZ^UlfGTKN!UxA#c7KYFFR0@aT3MuOgjfrC%BENm!*PS6eA
zr`msca}3OROyj=4xGKWJGD|u8xgC$DjCxImEU0xcDG7qx8IjpWp%Wq0A5uG6fCQQ<
z(?KZj3nmP<7*4=n=X@}8pE=SXao1w$Ci?q%NDM_Rv~jM&YrP!r28tX8y-y&=qh?Nh
zBqmxGZaF~1Cv+UP#Q(fsWq5ltLyQRFV1bdZ?lxRgIBpBlLa`o6eFxtwv`1<lU&>xG
zjOlurW^(&`F-)U1{$3)Dq#je%=z$`f6YYX(0k_JQ*mRQWNjQzHyZqzw{wmw^v);TB
zeq)Nqd{!@r`4JfYxd%Usiyi9w2LPkqxr`!QP{~SO(wGlhSQ;op8tZE0hh4aGsQIz>
zKcaf9LCZwSNl3b$me><aA0<vOcyB=dLDdhuIfhS3CO2n-nmefe%{Su2y7^RF`g>A{
z4B;G^xMeOg-mI|@#Y+|KhQcWHhb^5IXA@@LFC8?lxe!g+1{M@>dmL|1;BQLKjF!)w
z5>7Q&!C~C5g|br?dNnihvUX0y_*#tMA8af6z5nh82>D%y|9$03jL318R7+;P?L;BZ
zfTA3W2$g7w#5NW~m*P4xjwFmuaA>2@-aGN#<2J>0sFNL%X7D3*hL%HNE?IM7VvD7o
zUmFT@IzsdC+VnDg)ibcr$Bo7cR9UNx;#SJbW;&GfNT<tkKWJV6q!@S|Hk*A@r-zSy
z|JlUxuDe1*zEPDG>Mx;H#Knw|EY_*L{+#Ozf_oYm`0PPdu=na92D8M7V_M;yJvj@3
zM~+klc2V4X#1CR8dbAk+_=-i{GKAEw83fy)>Jx<WXQBTruW7M%^&0Ut$q^1l`~?Z6
zf`>2nxBss@qw_)aiM-Bbq3gFhl_b@-3e1Dz&3nLL{wPMplxBnyStE!6Tb|w^ii8wz
zp8dMuuOmK%yU_l`U<?p)sk6nq8ikQo(PVwfMd4({MlmNR=Wve$cimMFF-)JjMRsOr
zv&e|+bQk5W(A{#B&hAG-5((xfz>U^&PLWUzM`DQuVejS8>iI9`zO7b?RD%8q35fu9
zC7`bOTky!v2vH}<AK=L8uC)jkrEixn#j_5fcfQR(j%{FqW)VvVg{h@3wQ2GF?oX;8
zAd(;75b~Co{;H%r9Tba)n&`j&=j)qy+NkN@l(XtJViKo1Ib5s4d6sHzhL^3N4rovC
z2jO3Fbj|eHr5ecM!$?coz&0pBd*C>Xh|7P_8jP}uy>s_DKXGZkt~zJ<m2`Bo05W{F
zWL=5uCXz4i7e_<<lkkFC;Uo$<*?iHp0>mmJI&)^dES{2cn}I_wZ>FZib^=Hj&omK4
zixbD#c(evk|6}3_#T|PWb9ni$PN(b9`>dqFl<}2x3R(Vm?HmABNbt7=^g}8OvlGnN
zv+ADr6VrH_dzqM}0F?wKjW=PE6=$6}?G~#;O+WeKb@;k>@6~~S#V)`5J(pQT5?`6n
zr;zUk7#iOAZm(mEHN}AJ5bV|?_0#<tEGW{)*L$~4^A*&KszWqka>7ju_?*GGB5?y}
z`O41oWqh>evtQ2H_lgMj`&5$}&C=`k8uV*2w0X+d`_QU9d{I82$i-qR`0LwG2r_r6
z$qu|K4QyVpV{~r=O|>kS^wna!91kx-RS5B$=ZX>=9sUu0cQapEkSsD}VuNc&CobNK
zVEN^t>J=>oaaaLpwX8@D3)2?7UwqZ#W4LzZ`LU;*dH|NJp5Ffy&~`;kl4fd6EZyA-
zjsuMQtnl5q;_)ZtA|><}tR+S3;2R=CKLmvS7xF)2GvFnZk?lHl58|;XRU6u9$elM$
zAkyj?aV9ON4$N(_5j2gX^H>hKEa@2YWeg3DtX)O3aF5+m;u?XhjdmECN2jir$x;1q
zuJ7FIrIbGqA&ey~37t4m^>MU|aA>(l`y_Hk6t$nP#nG8p6X)!p@bdkdSz>N*Il0$2
zMCuVfw7wQ0$#jpYU`lh^)wMVeTC5?j7F^j7>C_{W6yUc=Luy{S+=teG-KCEq!uUBQ
zZe=6DKBpC5o~lv(a<87CiNayXx(zK^uyBub4t%X@CC63(Bgx>9==hYr46F)9M&+KK
zaflrKcnUe%)ZKsfmKOU~|5W;kIA#L5AN)(c5G0R#;+3mcWlx2ef?(SSN=kcgmZ(v>
z8n~!{S#TLe5>xd@Wz8RI{R`p-N)VZD){?Uzw^im4CpflKXh$<EBFnmjUD1;57_dmD
zpp8|5G9Fa@Bk#%IMC1Oa_Y?z1whVPE?};iP2OTOH|31ek`YOS)1OK{<+KSnw0H?$Y
z`P5YiP10H}Opp;68|o%MNhR0DVw@!7x}vhQ<K3K?rc{dXE=(Xbw=)p`(mr0hcCGTD
ze2`U=n*D$2{ps3-S&tYwQXK4ywT{wxYa19CWLm>xi4N}8ty^FpBC2Bz>**00xKi>b
z$b}&XQA>&n-pMuwXh6m*MC|LD(OF@7kRP)Qmkk-Gea%dLu}r1{Q9KwvlE1CqRzk)q
z*H4Kg$OHe2Y|hf|$@&~3*7K#S0#~9^pI=WMrTgb96}+jaEG3hx8Zwkd#n&b13oy_B
ztVsf3aIZ%cP={!$4BR!VE@`8PfMp4@5F^r)E3}6YIK!+f=eI;Fqk3O-*@DnECrd7=
z86INsuL&gdhEoB$27UVFDF>u+#4io3GjTIjJ?|s%V}0gURlrE=tmrFJ<-52tqWaR0
z-2Z~+CR{*T+Pw32s^9*(9LtaX`#)9Nl|#pmFBtcmBiEeaf3x@)^h|OP84D6q5fCr`
zB`4*9D->P+M3Gc0^Mp{9iJK|6B=yOTd!jVci21{RRD{i?AR`S)_bqkdp+kof9mV)k
zT0dHJIRE_N#{4k9Q9K6iMJY=@-H)YwkhwBD#MBM7AD+Vb9(D{G%UpW#sH3#`|M?(u
z(2PxFx=r8*XqpQRsPfFkN{7Nz#&y8-^9CptVSfR>h>Je5CMLEv&|Y6`xW-qKVe~o#
z;;NQDMR21~sVpiZ1OFYt8e|&=xm2>*Pd~kY?W<3`kLeaaX5_45_J)2l;TuW={uKTb
z{Q~n=Ccvkcg$LEQlLP`<P!=$6jqIGEW_7#SOR=*rqqa1RLYsgKcc!9z6<&)BbQ87u
zX!r=ggB!a?Qek^tm-tl{>Gdgo`CX&_$3_0$IB!S#Z9WRCsZ}54DW=fD)blCB=BYl7
zSH!ol9ULNIAi)kB=3i~oMls!lM<s^SV$#j*0(j)PjnnxHKD8*EM7?STPAYSrl);hI
z#sGx-`Q#`%aE@Mh!p`hi8?O(3e||bOYaad2V1}P!y?+nNF7ciw)j~ar*C(LC0jEUO
z=TcbCgK?CK4A4W?urph;ZriCrZ4^5bY2zrNp(cGff+s*EiNmui&jCxBW?+UDNjBV`
zNV#UrgelU+lc;uvz}nhnnSjvAE_tzy;<Z|J{3moD${rnTJZ0kY;lqa!Lt#@su(wCf
z{dBN$arTt30)J!P9Bpl1onLRO^0M|i!QQ1TT2D@}<WU5p+Wq?V%d}>86%gRjxZh6E
zvx7tqF5cZ74onX+d~(Ea>%x}zO6zvrT*rxiMb)x14F=&=Assx)^WNs%8(Wp~wk6>g
z=&e+A*^by;U<H={KwUF#HxR|byFwADU)f+z2Tdz+oa|UITwd?|jiMhT@3{6XLOhd{
zG!<I$KJ%Un`pa#asaH|MyUU+&<d0^JhtZS&o3N@g$q7`8KVBUe(6o^VLX9BKCgi_z
z*tW#YOdKX|u3tUFSr&oGpd1#)76TpCg3bv)Cwd%dl=#-}i7q@_2Bof4L|+xG_t1=!
zBQoTM`PK>wOq{&%;2q@~NM<U`{N}4A3dPx;%_U^=V9Ij#FAVGY`ll&V=2m_07R<HR
z81TB5=^9$-r3Y1{E)COR8C++$7%mECR`qcalZldm|0J>XQS!||J-y36CAne<8K~#X
zYUhxztGXH8^8?L-KobK_WJtfv3LLl3F%VotVjXI3ahDY4vv>xtH-Zf7$~J|YL+nJd
zBzUwXRm0WYYKpTHnm@4*(Qd>0cVZt)dCx+h?~0DJ>0dEfU#eK%U~0>)WEC#(!#&~}
zEi-vdCKc!~2Gzv0viJh5TPy>x)|FVrSaRvkaJ;Bw?*X_PKy@U81+K}A#0QmQ3mQPF
zL2yc0l}0tPLQ3cfuB#4tf3DCz(5x}Du;eF_xlrTZ7j>(59cBYq&0)tenyw%2<7_91
zGW;>Jj77g+hYj0|Bo{pV#JgL@0A?h$HQlfPV^ctS*|37dEJ!80l%P+*AwdZ*0O=$F
z{aenaS4tJL6<J8_EWfvt@k-%*McHSsuQ0ltsIssRiuf1(IV0wnuAaxw0&&ckB5U9%
zh<$VNtfUj^O@2Mp99b1+RME9XO&>4LNEBv>!e>M7f{p&S-Dm<qI;fO&P|(5%S}+rQ
z)Co3BoN(o-k;+;35~_-(VS%3Sp0r1pb;2TP*r6GlK;rA53}3$;r?|PHd1zlJlI`mJ
zxD?e(oCNcAd+dFoO|H6*o>jc$lt35!$$KClfx8>fFpgj+avcg{({j63UZ?kH8py&Z
znVIAUrBu8=igqQ^<k&>EEZ;+p#$vJ6JLFjD?4ZP!o8G^Fs71qDWJUlVr$tUVy@@Nh
zOEsHgwA2YPp+KMiTf{dfG4mn?e3zni$%W=mW^{}0i_JfSD61oK5>a4ZVUN;OaIZ5t
ziGUDwg!yGqEOO9*-TaX74NCk^lzDljV#q^sSMw>e?MQh^A~3!NeAy_I{<87)x3^y?
z!v1bKVydO#2t}}<lBSa)S$|{s{*RAVkNQt7OU1_Ko%x9xEu_Ze8va7LOhNg_bAL}$
zP;<M2EE?K-W&8O0o*;+HRtn(>p`ngCk+RHLv4IDQENY~{@OP3*q)RGSLQ1UVlt%sU
zpQ2V>xTVhWIvTfC=Q}8p)l`~Subtl!%V2DMF`ebeiE%#o?sJU_ETTaHdJ<KdSNSas
z9Nzp4*Eu8p%wc^b7QY9U-QW?)4nnDlPJC!>WP@jwREX*f;EG5PPQ^V@G`Vus`Iw^h
z5Ku|=8B0tY98L<;!ape+yBnC5F+Se}AyfgEY`J*x;@{qMRD`)SKTW?ma451-m3zSh
z6|pi0Z}9(K0h9OzX8KeCE41B3s!pA0WBWmP2dNzS!qcNn6xwRi3GzufksKlsQe3tr
znX6MAQLNEVn8BHx|52Xjo38+C=>O#^f$q{dtO(ydvSka4l)nBSTPgfIG(Xkq?*Pad
z2lvZgHD*>ZV~VLG?=#v!K*zmEBFsGi9d|c3x~Z0fStbK@B2Y);eE4N5ISWLHHg@2)
zG<r$_TcmFSeV1}kl|hgJ%%w&VwL7H*?r$27($ig8Kg8n^EgUJ$IpNv-cke}@PqjVt
zzO_I(JlE3<b3R;Epzw-l_V4hzj{Z<;4M8|jQWBo4KTI916hexR+6CH|^Bn=#`tQtQ
z`i6)u21A0u5C$%X$IAo<M>7&YtpEOAFoD#xBBPK|a-Nm!@Z%ux{3$>!$k><~pWx~r
zP#uJ^7$6(-Qp^aVf@e_YmufJUY#^D2FDcA7A7`KvV+}9xHtT0jxWk-Ag%Zwt8|!bV
z2ufL^s!dD-c%|O^-Q;OeQ<V06z+f)JJ327qVjR!qP90|6{LpWDMq?p^=;Va}QndMN
zuH4|(i+)z<=g;liE4s)^4iT#G<k5B;(~DlVm1c#KktHA&d^Q;pR-KRw;;TjxqRv0g
z$ggah$s8FixDKy~Z;V&=V76517fbLC@$N6gH;p{y*Y$B_Z4?n>nv-Q{S;KcnS=}p}
zSzs6H6B}4_N<9TUA|6EUH=94a!g3bscq#9<u=xD)thi{HZNAUkXa9?@H;>DC@7ljl
z+dOSU=5eD)Whg_2&_=c<nlqH4cD6DP86st9BXb%QQXv%?D`hBCp-ia^MIl9zArhK?
z?{((7?%(sepXc$q|G2N~qR#XC{e0Fs*0GLttkKhBUDVD!)q=$FF;Y=z>;M!C&r!RB
z(mlB5kSk_x&<;Bq&Z?q=xf|mj&sf|+>}8OWp*#)%1X8S>Hl>sJ)Dv37at{=l8lHG)
z)vLx*!U8qn;YFcyxjc9J>&iNc?=`>f>5>0tiFssinMWtN;&95%+>x=00Wn58t^R%b
zD|;1;BkqWrNo3Q524xhVgF^!Snv$n%0KD5W7m;2GpTlSWrkKAQaVxxy2!BMg&hsnX
zj+8Z0Og_1?%~>dq7lhLRzEeb$BpX7@FX@5hj9vPiDSIX>#llH)B=h};Z{^R2Eur(J
zF)*BXi&1^w&T+pf7PhOs%KQH(!^lkAe`|_g8D{E@+OX}Z(GTg6O!4JnRwhcw;z59K
z5eA8lKMOdWU&Y9v?3^50_K{^sd_B2SYJo!)R*gAV(vV?>yUE(QGA}FTeB;J_zl}S`
z>;7>&;q5BKYRJWJ4?20IeOKVH$Q7U#5=JjW4#$SnFw&zvJcsTO3W8dkZZ?>|z^nR|
ze!f)wr6s#GWGlSfYmEPaZulT2Y#-F1_E4n;(EenW(Dsn~w?Mi>(WAeVm1P|<+$+*|
znO90UX%9icBGhSbJHW*VTLE8c?XbG8zV!;0iBJT}w2lNwhNhGvTk@A|+!VpX!iyzC
zNB&Ke(zx*dIFpw-w?UdIL`dietJ-9SEBee=tDiwsVD45><M{DIzFT5NO-<fNbJfT@
zhEwKt(6$<6K53ixQk`t=K`Di^;_{!|{^!lHn~A^YoEaY1b>zq=a|-8g*6y=+<-O8&
zt+mJA`Z0aSyr=)s0xaz|;!i`3gO$~vzT{2|jL7|%S>l!uzba|w{hRN~F1=BUdi?IQ
zTe}>B(ID}&!NX^=*Zqcyh%<AQbaM3_96oTI|HtLk)7W_d;05DoZ1SzaG^U!LzXH^-
z;F&WC`ceK^nTjO_)m1E(<m9aAC;K2`q#hu}luqux-O|cR6|D+1?6a6~1mHRyno+&Y
z@N#OXs4S!`l7<bpgy0g+Vk(Pw)Iuh@+24vXHurg27u>=YJ}dtBW(_t1d5ta)I1J>J
z8k5T`xBv?=qr1ZFjKYsGyc}BOC$d0ecLngaKws&s{%H-r&l;0A0;ksD^avb<EDjCr
zWAE|G4s>Z^sz(7XGe?27O%mv2DBJZiRRVWEcEaH^Pxc)=cu<16IBH;)r~XCz4gD#i
zs{e>~KuyBzr)47)1NUy&@SAx1!(kJj9|IMPqA#Ll5uYuBEVO6Fs>TZa=H(TqdWfT4
zSI$l51<KaGL~uSiw_*=I08e$oj~x>s%~>1_MdK%O7+g2!?C-8Hb9^9r0?(j+W5&#+
z;tcm&MUU4H1+R;|Bp_QK54K%5Xb|O5Q%xIj=rV`e_Y_iWObBNJStej9@)Dj*q1`Li
z?_y$v{NcR&`%9PfNZi77B*(R2EC*HUZdQgSoUN<)U`K7vI}o2d)`nnL6c7=~1R63C
zT=t^qcu0-jPWCb1DWPDL+rwWM-RAb~+j*;_MwuS}{2gbDm_2jgHD%C;eYZ|$nkhV8
zc7;nHB2$Yw3Q4OXdBTg2it72-h6X;;aG$od52%vje~yVvrts&PJ$JYa71ccPC*eY#
zIYU=xF2rZ2QEtl<Y#)k(t&D<mU+$QnZx1uw5sWoanyZ~cKiP2dWLpx9e4U;>ndzG9
zVsCw6NqY|Si9Fp(JZ{e1DBtQMTi6L=QYcdIo)&3jQ+7UIaZp|p{jvaG-@m7Ay*YQV
ztWedBF8lOpH+2~gMASsVzbo5me9p17GNhYHh4l`dYjO%7Ly9nz&&!JGka^u*jRP&b
z<U91I!lsfhOvklQSj`6SiZR{QSq~uaPC(K7O?$&?D&|^Ie7juntaJAKdEI4*S<SkU
zGkEm@k$dn8PRzVOEgK<jfYco_g9SlRc!Y1)aj*!yLw+Wt-%x=#M`&=6&R=*eCqV4X
zC2BGO69M!nY|4w2KhKgygMbKjn%E)|7`%6g8cSMIP;5u=B(O@Y6mc96{|H|(Ej#;y
zMIpayC*-J<Q?mw2Ls6sTo3I<wgy)=#Hj4o=hxL4@7d8U7C<Xb;(f~nAVHfF2sn3VE
z=8nr24nTF_aI&6tYg6gJ##c}_iUWvFryXpM-9ZVzBqN)ydK9%*c-AT;0$6J*KfWUV
zB6G>|bHz){X>cdw?G@j@zh!ww25l(Kss_;~PG|{)=X&{#Xo0Xt=y2e=aNz_e<H6oW
zJ{X!(0ytb~weKCRjwz3ruN2tVu~`FVFl`W9tGO^APd{m%%L5jmT&~Z8P_u$`<vqQ4
zA0kE6J=1pl1H#dbc3r;Q7pD#>?K^Z(r}FJz`l~oP&(xnG>dfdwOh=HvwClWV>C%V5
zx2UA5l0|MW);HAhZK*Kpii*{G!r}B7@B6UI#?kqPH44SPnNw}DkE1UTaU7whc}Jb`
zB;h!HPR9q0+Sguu5u}a2tM}n_b)q1xEdQU^dlda_u|>MN02BNfBY~cFw`z$k#RvV_
zvqOQLN|h!3aB!yj&|DZBLB_Jds!P|d{d`+1%<QQ%AUy2}?Siv;{*kWSRf*ES&@hd+
z{llG$1e1c1ri>sbuhi<(=P!AQ9h!klB54rWyVye)NPz+mBQsUZ_uXNAbNunzXBj1S
z=#V{whJ1bxUggXmeUzP@9R<}x7(|ts++s`ZTlZWl%?C(u<t8<tO>zn=4hJ)Uj_UbO
zl6yNNba-2lo`+NRa7NW(-YLlc^CFdxkN_xsCjE!+_(Fr}ZipXHyEFvOB}T@^8GIHY
z2tju5pahOSLeeM`h#YSj4#I3Pa4*MTfihex(r`S85+iEjTE`s|*zV%%)?>njb=u*O
zB;mcg5wn4uId`_!K6=mMqY)7kg~Am&hV-JYt9$;*Dw-b>ut#C+E6!bB7QZPLKSzVe
zxpo@Z;qQSRFi}6MjI~nu@epNIJzJsY+%8A69|c<RIYOkKN6&<zHtn=$-0zc!i!)MJ
zbsjq3j5N3vCzWCm)d;GgFAKjkM{cQ=vGNREsYHVzv&F<?rT__0M;}dN6Ek@q2O3*y
zHR%p2U-qwx+H91xOz~aH6r~-7a@)@5;^J&@v622h6{rdBsO^jzE3VvywijnF8UUhg
zkl`K|drBIq(Kyjwn>O7_Pe1ceM{L>M*bZv?ag?5(OxhNQZtfNpGrW#M{ditYUPl)7
z$#$4&|J<t?Sw|6ZwKiH8U{n8qF<{hC$0_CJ!7R`;zvO%wirZN&*wa%1TO6eQi(NFk
z%mdV*8zI+GkO|<qZReHHV+@u^`!|A79_6P#nD9KS0d=6@kS2E@AjhH{NqiDV$P%y9
z$B0d}a8zn?u!X{NdSvnOXLS^28*7hqDtl1=zY~ZIX>I55%OB669)t!8f1H@kvDYrp
z!I5|+A`LMX90fB;COB_q1o)i9G=?A-imYe~CR!u?WAA~vDUbkid(WR=nGm#)St?nu
z6figFau1LPtBb@5>*FfWb?Pf_%QRpd$q_EXHz2?^46nxt(i4I>g2fW{T=HPZgu_Zn
zP22o(Q$0u~+iBCXP3JwQT|faqG~oh^f@F@#uS}BJg-AIqaczQ(0rU7G>1scTM@7VG
zJe*WrcIv{%#0o9KiDzoS-o1yZvk0)_{Ezsif9y$qlr*J?Cv+Cro3?WLmpg~X%ml;y
z%m^a(OB)-B!;1x7J1acLSWcM|!J!PaIl=zc0kQWGg=5Po`4GPwtE6@AgZh9Elg26W
z;Rh3XA-}MpTxZ-zbfXv02$tOQD=xy_{?9kjgP|5qS^Rf3hYX2*vX2xYkryraTzc1M
zL1OYYwEEyN#(5^h$pTBGi(XO{6|+{0Vu)z8TPOOY&@6DlFZ^A3r9YVmIw>=R=bsO&
zr?}D_-0GJ;cW~9A6?{7-G#1X4+fard2Q{mXWdFq~wefxay+dP8(H+ci(W5rfjgDrr
z8M--K-bI53sYp%)L;eRpW$JM@9tp4jx80sQ*uMkoig(D!yMz~UFV`On0UnO&g$wym
zqBN(1rjT(aj`p{ZHT+8CGCL7g2>KA~W>A1tVFEgeKdXRWF7V$8qZ=sn@9u%zlNz{o
z^jvU+Q6?+gDfH4ZZy|bglpqt*toE)JF;^w^2Pu=9<LKy6lMB_pXSuxlgI3W$mUYa9
zH);dD{#{vPkNczzQVvPtXS7*SCCrKl;Pv$tE%NFpUbOpvgBVFOKZk%9cvnKovnp;?
z&ax51hdaZLfWoX+=R;dWo;@+}4O&hZk-$!7`~L%3hSpx-cMz^IkmngjdcyDUJR)Oh
zbnf9U3M>XqQB^9F*nh%$kfxfNfpi^2rjON2$c=b94~*}hVrPj7>8{<xMv5!XPlbf&
zqjvEJ`7yrBo{egYchE%gG5RvvM0<LrULIvW_Snk-FXcOT5$L+n(QDJWv*yODAu{BS
zlt&}>9tv8iwmJ8nb?V}*x=3(f$N}YZj)?q4bkXAxUPz<{6wNj+xUokA!{!5Sf6eFq
zw}_aNcK5C|Jeqi202BSbuMUQMl?js_-9}AgutkERewiyf9;966b<={dK>*`*AGN|r
zITUQfHumb?Sz#87NJ*0z+hF6L)YL>{EoG$QG4gr+4jt;Qd6xXPQW<4J!bwWD*nJVJ
z;ZORK4l}1=7l{*t0cnfm^O!GKd$E7j`+pcxn2I~9j3VI6(K;U)q&R?4Zzb=oszbRZ
zc7PmFIore~21PaAKcTjzT-f!M-tdyc&=<?NOZ)}FgG3qMLx*ODh11xTbSKyb%9m#`
zU3NT2s4DNFmF=%GX8VN0BEMBpS(b4uexi(v{O?5LnKu%HL3x_85Sm%C0ov<C2}Ji(
z8vEkATI~tqpn{&vpi(9iW}08)QTe4)q-CKfYBH+7;>uDYqpXM{==YnMXh(EXkNrRi
zZVuf*q><qk(2){C4^#;fxoFg0N&7~66Aqi>{(8x|WJm9AOjR;a5&^0A-$?gjm!t|p
zuQ-QE2&-Pz_q^2K94O8oZI+%m%r_NDs7EILU-YMAukFgYw0apshc%Ya{~DEuPQSz>
zUj8La!abd4X=3IGgv^vNLODZPy<CIZ$EAVtvwfJ8wCL4VSOGV;pZ|XeC1fxOMYIAK
zbI5vLLW4s-Xh-s*h#FC8Oo8QVXG8*8*qe(-k;|_;;hUfH<cYK)A0hhg#cl<oKoqfO
zs3JlcpSq<4gHboi-5!>C<hi@M3zVWYBk4q0-fGQnwcrwuaOED#D%r@#GZZZ!O8te?
zaw5!o5u0;jI!#7s{NF0%${}_=Jw`K8Ce9#aj2rRLT$1=?%#`x$j09UVn+6+0A9iw6
zB{k~Te5|P&BZRmFHh#Xw0$%h%aj79Bv;lYuexKrQ?IXTjaM*%91@~Z+D)onF)Fvsa
zJvH8=_=H>AlRh_-7%dBu_CNZiVz30SQHNmBLDyAtP<U-aQ1R)XN$9bJ<&~0;i3OwW
z*gsgYCg}m2uX+$fnyS|0`(K+iaGz5!0~M*zb<FpgL2yqktfzSPj7YBpy5w*4#f)$q
zeMGV{!qs2yOl|)DM;VDU&S_{ww-r54yFIX<{IDRK{Dh}_ryqGYd6BF^h}?RUpDq~o
zKZMhZ`$vu)o5x0DDd~k0s=RccHkOp=^45uwp9gW6KIjPP1AY{PjdS-#vbjZEDOe9U
z@ZBYaSq24`uzPZ^;k;=ITZg5vrkN=h4!0DZfPSsrRFTir+MN*tM$h^pH-h4%>g4~V
z+*VR!(J)7~n+^r_kSezwJJ0u#Kh|c{{!k1`1-*emU#7I4#Dfi_-qLnVd5Z>bFMN-e
zysuJOqWiS7o2ql}rPb02YKMsfG;rSgFLm`zeVA3|c7urEm;Bsj{za1y8Cr+{V=u4U
zxPbfyR=o0ji;_ucdMhnWE}y7ZK-Ip}95K2Ec|^hq2>QUm&FNPzP=3zTS9B|+m}X^<
z%qCGQwH`wAOFUeFgIVZfzij4}w_Qjf-EKc7Vb9T%r_1y%3nHd!HB?yH!s64^3gH%+
z7q0@UN|Ovp>T&vlQSd~8NM$^WL#FALy+`(jUU$G_ZJDPdrsjUGh9c&7n<waCPZtH&
zE*OzQd4<`7+sz6L@F2M_*>xP&J?Z6IyPH40H-D3_dtlc){&VEXH`lQpCk`Zca-#;%
zWO9KjR%Ey291^0=j%A}y=6}i8wSKu)`BfE}e^a$cmkyJ2^^I4}TzXB0pC}7Rsx%O%
zeafG|*ZYzq&$eOztd7pZ`Cs^OV)idaG3+#jOi_i&VE%k2`C3{Cc%vQv`gJ+;b%sEy
zq0@&dBKlJq%SvzY=q7H^H`EyVL1}6{keHWBeFaoe2BxTO8d;gka152rsZ_)KZ;vm2
zOq_l)Us^J_l{h8rd|6OneR6-7bF3sdIGfB+kXR%ucNq}5-}Pf2lG3Gl%Ttw)WyHOk
zi~jqVOkGEJ7l{jfNN%}l5*^irZq4r9bX~iyGF;;TN18vLLA`Z#ZF%Hk6e3X+wyw3T
zqRr~HOD`;`vS0vTv9s=K$`(@`L@jBE^^LomoNPdzl(oWSe=7fe2pSmlPsQIHipQ42
zDViJ^JmkNj?1Z1(%d=zM*(f1f<lnAXVZ%4HX3$+4XI${)LXhMk)-3dZoRE5e>1*9L
zn_DP`Y=C`b=rM}~BU~j-w%2Qr#G8d`<z@=dCu)dKg5)P=T$GB)f`vk5N2H1%Q0DIZ
zcmCouUbN#>nC#GlpB)gp=O%Rl-4SWcp=W^b`)quMckd&{?<8a0=zWfh7R@YL#s(ZC
zBHRNaxGRc6qeCqeE*D@+MQ);LbK(KQ4e1&qpfVy$TT!@cb>;b5)wO}dH1OXyjAtw^
zp%A0SdS}M^5P6Q$yt$Q?RkriZFs6ryxKo4o(Q5TQd^o@B$3p=D$DjrSG{<4KC-SS4
zj$E6h8#=qsAI9;HZ>eG1K>4m8FB!e=`u~3SJJjyoq&eE3*$f_kwB48AlyBS0^;bm^
zeQPhYXIKgo>4LZL%|cYbr*cx_@ZL{ovdSV{IJqdwv>S4vl}-mxE#j>yVt1<iG_d7w
z&UIdV@TFj5_K#sZA&(_`$)%vv84wYB_N)a>8R^fn4>_-Lb{&Pj>zP~cO-FH2k*3Nr
zVm}`ri}@$84w0rQ&{;IX=kzYiXV!nJs-{+iu4IoYgRwI0%8@y!B^#aj6Y`4ot}_Of
zvRzBcUS;H>NhYdX(M=JNPdXEMjAGfMdKq_Lpj>j?V}xXsgVK2=2C0KYnyS_FEdIzx
zp&@frR(*g3)M;owS%v<gjE2H-f}W5@iVqHj3yKY~sqpP<DZ{}TL+8z#C%b6y#S@V=
zOR?^@74G-Sg71a<7Y$~J&mo7y#Z2OW+k}#_k;+f5NbQ63M=kV~!b-ZEVPYRD-qiBR
zJv|jRuQ{}SA7Gc<uvQ)n*awRQ#j%abj_T$CGsbY6bFOYum<<9-&!a^A$!}baiM4|x
zmId*60Mxvdfk87S78bYHnQS>3ahlTXXU3%`Uroaysl-5yPQ&LT;w<>0znPVlY>_J#
zGYx1?(;SST<&*bi{$fMXuTTDgfiIzGq!)mhDFH5e{0<ClML~tyK-wI);56^dA-{^w
za-03G1ibOZCff!4A=UA$5em=cRX=|abd+vXu+-rtut8!Vd=khpZD3b;-fdRvEGN@<
zki)}t*Rz;t#?9Pl2^SO<O%1dZ-ZY{fXj{;GB8wVPcLc?4{`cQvrs#Jg9Ic;Gd+U7{
zQb)>JLva?vkfy~vgb*g0rQ#dT#_c(i8UsGhR#vVR1<6ll?_Bf!`xDaW{;v6%lUJQG
zq=O=21Ju_LToGjUQT$S!D@ct)80KWg@TNSQEA}Bv_q(At{R-7Ah7&$w;~^1?O@0xa
z3(a{ltDu;(7+sI)!4XOlSEdZ$+@i#W?&{yQ57=VHj9`8Ye4Yek0*dc6$kma}VZ>yD
zjsHJkC!biWCnu=aUpq4?Urlm^s}SpBLU%h8WZ>Im5SDF0f|8u4^ZjFS`a~z_F8`|{
zDn6A{Y-A+6OhXydDi$jZT1_|Zy7L+Ihp6B;j5o@@pdZBEGHzWYPrlux+S1A;2<4S@
z-8sI*QCqwLBVB*N1+qp@q?dz^0T<Li@LFYrhUnJU5Q^$CD$^)jO;WDiRw&MkcZ}>J
zp^8>Dly#}3{4#XaQ-`4sj|kH^ANiM$2qt(!MX`@(I5wWbM+*s(k)#<o&B?f*&ufZv
zfH!+G9-qCce0ut^D5U=fE6E;#@vt*Hz&xULz{OlD93_%Bv!Ex))$|Pt(lC^;CJG^$
z2#}ArvRFPm6evoeK87;7C&-9FjHZ1!ch+VFx=OR0h>jG|W!w;FF}yh<v>%MU1>j5T
zKy8QAs*iX@@{VF0lAA<NIU~}tzOg5fjmt!i+!=l-m_%8gT{)CP=mjB*)1aY%EFMZ0
zMTPuU-^XbAM6E!=o8$urc1)!H=(3bACaQz7dQw;&ATdd(qp|9*`ZOo!-SJb2GWhAW
zS9u#eFHZfRRvz;)#1Q{!Z)(Ab^bKn{5p3`P2WJgwzVcm`b7GZS>S8fi>9nU#NGEne
zWKaQ?v0}(jxjPul|7DhmLh)&hvI<7u4ls4Y_)1zOh7aj=ACr=TME{>-^r2l*QIUK|
zN)x`NE1}5Zoq!3*aA|Nsq(MU|8(f|_E0I|KsHoU))1?as3QR2kLmrA%3{6+*{bICP
z-Nz7I@d#>@JK3l9Mb%Tbj1(F()~!pN;Z~$Z$7_OYij@9S(M08u32BlBxqxw`h!U~4
zLi|Mo;B;m-9+;D5cn6IOgf(YvR$&bPVr73i7qAX8V5?dL`z&g8hSTT1{2TIeDf3Cf
zYl91RtJ2ofM5IcqZ<joNPYq8cKv($n;z#h(WzchZZL7+xK6bMZajA0$yMT;DbQb9<
zVoR(_eszl&4N~%!5yPNsGvET$4EdXuD9K4>v!0rf=K`1{xD=`dvtPR-fHXo;ZtWv2
zXbOm_l<RW6P7ka-EXwb%uu9C+{d|H8&DH{CBU9Qo5C<}Q%>ml4-Ith9u#YJdahfy~
zlOpjx=4MQ1mH8Dr6sW!UY}EBL#K@`5WrpwDO`@FC+Ftv0Yky7Kk0cIZnQ+8ACe24Q
zBQziP548p$h{#2nj}#P2`oZi6wp3Z6;~HiZZ<6)_fyLpal|r!$JFSiKmkHOTQ;`58
ztcY2zrBKWoUVHRvf17#|6vr=WOEN6Yo)sC{@F3FTl5rBM73wyMI;RwQtA)~(rNA<L
zNMaqrikhZ<ep5_ImBDZ#;Y1$-h!nNTC&>Qx(=Gq+C-^LwQz%}k&|Pw#g({+Y$#9dV
zCrubyPNa{$H2!2i&OQp>D@*<R+e_cv_(I~?*?3GaX4wx|GpjGv3;<7rhN^}rH8YT?
zDDlpeMzu$|_UlzY<MIppNO&}51QfyK0oKQ_&G^Y-i~_9)7!gjI(nUDP?ZQDu{maJ`
z_aV{msfs3E;D(oF9fj5c7(n?a5Gn#?yN+_R0y)MipX<79t19`*|M|1G^YKqNZr+rG
zEdpaWLzGpkGGwQXRGGIaZ(suDhk^O;?(0O<b`c^jGV~b9ckow*Le-G#Bh@7%_D8^!
zMa&63=)CCC>>^_PmERVwIU3B@60TD=0aBYg71RP)`3SQbkj*kUeB#0>-bqAWj|)w9
zsgjJD=_->6Dx%Q<8gi+$2TkOQfA}4kAl`eNg5HMGRi{-i-#f~iA;RONRSK^F{0=2m
zk@<~f4|t(#g=QHNYh%nw9!N8h2xCiM)34Pp?F%19zdn9;2b}8%cTVCKd^uL}<mpq{
zmjkURZ(AyT`bR;11`0lykIpIl-(ccMCrG&D7^)21SjchbsOJo%qy*QURzC7M=P3(`
zdBh@PAD(b;wlNqr{>9MndqdX3_RkDk|Aqmf^UppaX11m(7Yjmp191JIxS``5h~dRf
z1lI7!(pBiUub#rpTH2WO_54+Z>XsX0R`<D$<$bUb3Q1K%x9=}Eb0@6(hRVaP{o`xT
zxQ(<gK>;}~FP5xW;g84%hQvhkGkzAC&6J1hJQ4+G8f!ix=FtE#UfW8hH0Nzm^y$hu
zMX<sIP5}S*s3UJ>(1qymVAMG8Mn27EadC{rZ~T|P{=_HH8FdDIC)>Ojjxw_7<yzf*
zgu7xwn0Z5d5;y^<4YEyc^N(D9hxWd9ZLHx#=DfZKHB~IOlm@kQyA1(;A#|!dJB8md
z9fhgN1AwiXAw&<AU{s9Re}17tafA{Eub=X`&a31o!*ixzA=l69K`0-1xf>-#{k`0w
z3p7@l&1J-LqSStLi~4nKObgyTaK9U?86Dh8-n_BxJ6nEkrj`gZ5Wg{$vU;)dH-)4e
zUQc-t;)eZoIyID<ED*C*)->4m`*HbYs6$R1Z=DgSsr)xnM=;DjaIcPT8GcSdGgyrk
zZE;P0TEuV(BBD~_0|{`Ib8q~Y@~&K&PXIODF;c8G9UOW#r(#xQjVI7hYG@eJo8Jxm
z_fp{sT)?Vg9-2wkH_P@Vn43A08Lyb6KFeGNlW%B&0)ruG2IK^Chy1&kg=mcODCf|B
zh1{s4a0p_7klbk%^!QQM&P@McT$dvF%5z*Yu71s?)w98n<hhL=(Y_fUpPt(+xxr<(
z&X6)@Uy68)K1Zl+nR}S#*GbAd{j$dxbY#3^*J_shOa4T3KqJBMlsp?TSzzo6IpRbr
z$@9-1Q_I4^NcSaj{V`6PUKTaPi~cdJ9nN?s$ENnz^I8LEe8gK-{-bAtUu5JP%JT4S
z&5`r_b&@hj|L%(qANoUyvUP(^(#!mJ%Gai#Lj*fCI&qm}{a_{`bV}Y87WO9X$tV%%
z7qGVH*s(sf&-n(R)Z`Qc(DSaUDm*V5@WxCZ-}k7g;pazGr)Fj@L-Ug{j|$VMsq&c?
zva);+p3`iPvUtCSMl64#d_Z!{vmcpKcQUOHaPq>0Me-^T@;Wrvqa`aUfQ~-=fGZXd
z^>f`yUcGWq{z5NWI0p_K5W7aM(bN(Az=4Nz78WmAzWhWCv4{unPbyUQvG_zf92MI7
z@;rrh;+o2&H(iB=38yIRVAf@jN183L&Njqb`nUZCsdA3>t$p_FK}6C#8>rH5Qe8#-
zbUaB8DPL`fyxPLTpczyw7av}Gao?S7E@(ZRBORre%{=?8!toL6V%Ezh3Zwbw&z;L4
za%k;tbXsrpfK>V*xt17VMmpxL{j!5#bLYU@dsYFv7>mOgp_g*N)r$)$U&aTcI-b;c
z)Z=p97#Wr+cs}e&lZuPVD|PHi6FuG%4>9WXYyL@mX8^RZ4|8)-WskRriytJrQP+2@
zeGoTg2W52!RJSOf3NcFvwOrqLeerDRGV3n1i*yv<Nm(r%sM}J*lxVLOX>yz~JI~_7
zCZ?kxef$pA-K{Drd$woqQ56>+K26->o>soV5?Ku(Pgqr1Ea>ZB>DpaX;<A&2(KG3u
z;mI#1i4V*AR15jeDHkJ|yX&rdn49m3W34p!Nd|~XsMcIXs!Ji)fSbn&(E?cEpzZ{f
z{Odg$&0sf4m>imzl^<uwQ)1QtN|K?|gA(U><TC#)8f@e@QSZAH>|sO-Au>W0AlfuQ
zp>Urf;HL*Wk9q@Ge(KX|u_l+S5?&6=n1NM==Gx#fmInvax&Uf@gdvyhS&>U*e?3v?
zF?z|=<yAc9X=Gy4GYz^S3mr1|!Ifr3%CN6*daZ03?=qZY^Wxik1`1_+4W@+Er2$EA
zk@}w8ou9~qb7R}CnxQ-^1jx39?oFFEmC;Eqh7niz=bJG#GE8nW@uas8i=15EE^&2@
zHrH&?k9~Syf1<~@RHS0~!3JBMN8*y`aD3hKt)1`c;0C)_l$131T<qQ4F5p-c%j1$U
zEy}G&GFw1w^q*IK_6Y}!m9}A=+kg?l`}ZHG8Ww649K$=f{FP~d<8WDi!94vD-Tk63
zc+A*$9Z#o!+&URkaQ2>bVD3}>l@S-#c2Vz7TaRw8@a`O0<7l80Hpp?($R~iwY;!T^
zk(Jx7GO}fK$GjE1z~I%TuUn`6llQ%5K8iBQ<iY6HMUxd5*Y=CrTEq<1=m>0XL1psi
zv=m4J=fH#*;Z(?mW~Lh7qN%o~xCz{ePKsURPs}-=L#xEqTl4*zCH%vX3(il^I-QyG
zL!{jl93B_$Q*sCeV)zhzn~8&A>h?zatbqo!RFCqMM02X-8w&hNJ75`^va{<vx5@bu
zCd#f^Z!sE(4+=$&p^vn`rO<w*c~8m?@!eOY9j?zY6d{dPP|+^@susCDXYOAB_rT^F
zBBNx`cx_tuC%#z-4a@Efy5A<Ju%O^5loMTdLx7o(=loB|p+t<#7@Z90D~G+Ho&;cw
zJ?kq5V*@UK^%17ne&&QVi~xyF4fM;aKLuqe8U;R(4ca#z_HriDrElbS_P6UFt-t=D
zQ8NXKP!^fHEn>&sFI_&4g-OKQ<@A~m^-dA>FI^?@)Dcv8F0yI>D?jPxejc7GOKK!n
zoBj}<j|xDPv*H{iBX($DCNZibZ<Xobi2I`}Okk)Ag4bXGpL*|J|8jXV1oQJWA2U)%
z>aNR!D-BG#FRCLnxBcK=GKxpG(EH>mVd}PEBhvm;vMWzT%}~56#ZKVA6`E(%N#a#*
zZZ0T^1p`n)7Im!~f?ASu1IijN_AA=eF=}l1n4gZ8Ej}z1n-!W9$8ifWw178fhHOUY
zvhCf+%z&iQ`u4T)$dMz3I_K<K!zYVCl*S08rFg%~I`D4n^J;RphasWk0ps9KE^jHu
zPKqx(C1Lxt!lI(Sd;vUBt+BX_q7?B(H-ZFC?pAcnoT1C;T3DyCrZZgH<vu7uqG^#N
zU)#FyBvD1iGZ7}+&c7&{1T-kJ22d`LxI>Aci+X|wdO{X&F=DAP=w^wS)br!!xYg|P
zs60I7OC)-v2|K&=g*O+aAiZ%b>Z)+Oh}oif*lron`M&kfkC0pZ@j-5<h6Bc_+WcJf
z=D>LeNEyD06chj<*q~&~9m-eG_QS67*L=9?>Oe)shu%&X)?5N7$s7{zx;H=|_1^Nw
zYnUAuFC%G^KpYE}IoeBXclmjKpaTH=VObydaF2Ha6eP*0SCQMG@#NQj2O6zp*ZEAL
zHpG#d_GU5EZ@MsU95LIsdMwKg!6?0G%;itTtm^cr%<mpv&WjecgLl6wJM&-jaY4Ca
zj7>kSI)dJva8yNAH1fno>}A3o*U^d)z2LQ_w_D#G>LDFSrV5{ZtwsUO33u}g%3r~d
z*V~OPMh_gak=i$J`H%$OOcCz5gD=lK`}bBR;@od8J9gyATjt>cgwucax%Nm$s0$s$
zic8U`d(@PB2y@6dkp{++G9Ahh%WOY$E#09hF5`BAZ)g{t;_i!!p7d7uma^Us*|E5%
zxq%)4vSODewHAN;Ucr7^<8mdOAw+u-=4_{ztMb1*tDhQU(PH6bh5=+9lJQM-=>#Jx
zip#|-)%dTz)+Q#~i^6RXNWf^PUE8|&7`4YSQQ!JV50f`CmFbib@CRP^&~x3=$&#91
zOyAeBIMz_cuMqL911N@${W2e-@ks?;mFXW;kh;<a+LybCc_=E^s0Vh1Bf2XVAETAY
zq}7b@Y@V)iO1Ws>zjP$tvJ+-cbjcwP!+AT0FMM26T|NdAy1?AY`v$(8{H`G%MSL;I
z#6Cx)CSdHTs_We<s9mtEv9Rkr^HVgQpQYD6@_2g=_~7XHW%=cR5+bwTj}C|=!u?h*
zto(o~fL**sCQ2-NC7LqCnLMv-q<LO!W;!aO^}3q7CV&#E%C@1<nUa^WYPfH-|9V>5
z@jJ1|ZNkI583NZMK7|J(W7t1qBt1fUUj7xBQ(SsdAsKUSc;`DyMk`)S5`_Rfg;SI(
zTMhvUCN<&zFuO;Z%0gzh==1P}e*t~OR?;nx(N~~O-qIw(uk8BqIU*Sibv^Xq^96S=
z!?arVk|xGUK<@KL)yf0lYe2zwCgmU}gevd+6PGvVkq=m$SaOWpg(_(q#>BzDzOVd)
zSu+NgU3n!MDW)+E1ufwnpmm^8!AnH=tcOayeLM2nE_adZP&}Q#ELueG%QaQ0jr>9*
zBHr%&M#DDhg{mLYmJmJ0ilXpG%>A}b+-M&~1p520$oRMOvO7!qaElKUQ8Oy=l#Vc|
z81?nRIC*X`qluKqa9?k6_1vQ>mOPi&ln;%rtgS{$Qt#e{AKNS$N^++lEbb|XtcOs#
zKZfxpX(+;zmY5{1q(&hVoxB10^6QWFb^FIkia}<gk}6BLp}OO0{DH3;A_imWSpbf;
zx}Fhw?=Z3*u>znPl3&a0LNC$pY}zC-f=uT>br9C-qW2TqLP(TI06Em5Y@6ks9ArQv
ziaYoG^C5TGO3A&3w2k^@ED@7bPNq1}V7X#VubO_d81hRVp^t3Ag@upWJ2KU(qfFDn
zVOq{X_yry^lYuIP8jyHtu9f6NQRBnLh-5_~Gr$3pbwi9#thm{@-MuiX8Pqqe$&kWt
zH+y%Up5t9}>=Xx0dO4~^5YYTT*ZS3HRj=yhDta3|TWh`UNw!Z9wf8{<drTUFNS;yk
zJmlS5nVJ1EyiG$1NgGrxC`qdy#+oEhnUh@3{x4|`v(o~lwK;`g7B)I?P~tb@zjK-z
zB`;jBC@V*>#+XMhe6|o+9Axn@`54ss&!~#WBMQoHdSqzkzY9wZb_6t&m0io?h50~}
z%a2novlrJer{HpY^R0M(@Q5<@;yX%N=7mf^v6sc5r}2qP%QzYt<q=LV3kz-LXLaQT
zf}0{!tL)^8UwK}HQiymPBqNeEHhDj$;Ay4G7#pe9Ek4Wq098b|OqDWH%R3E{$yl74
zm3>)gx4ZuC#0cpP4qf;xf>$D<2->lXoJI;4DUvLx!GhpE$gyOgP=42|8;xlk3-Rkl
zeOSh78)vBhm0$I<c{>6@!z-RswuvdRSlmhDmbMJ_VCumngi<0>LW@gZuN(RGI6p=h
zb6E+(!+jUGlVx^lVE^&Rv=9V_uPNgJNsa}7+H+$yzKrX1d;?UcGsj%4@hF9n|3qLr
zA#xc|)B(Pz+w_|wc~59Ym>%oEZu`Heiq6Kx`9m2}=N!W}$>mx65(=ZF=zP|$i9SiX
zl9)j*$3+9t2)%x5W}eM=bsHrca`^34aW#|pccNSsut?vw6~iaDP)u+k<j9I{kF)&f
z`<ekD=qwATAU8S`U+MAskNEa_@8sgZe}ea*5tS`FurGlr%tbSYKN?6fS;`xzK~Z(I
zzS#kim-&jSV;zH8#)(q%!jm|0@dIvOE*dTDI_(+T@XGT#4BrUa4Q~+8S#CYgb}pxm
zFp|luTb1Vcd?21JthNrzJOjwPostrsc?Q}|q~=6^8>Z*CeukL0PgrVz?28cghzfD0
zILZMeW(A&mj)1&D#yiT8YUc&Cp+sar?R4(O6i%)<mDD<E6d{xI2mDX~^&;y+Ziy;N
zrVNcoeUm`~I3(XE)zWsOFi}&s#8L5FO#Z8nJ<~B_Y#zgk^45<0OX(LPW@lEgjLIyp
zbd^WUvNx05SuqM8pB|}s1Hhurag-1!b%}^LK#B8@4vw?3_OJ^)MuVd5=)aIsLV%in
zJj@#aF;y3hrf>^?jE;xG`Q#@%YilQu8P8gF?HVnPdCW%-(8lU!I7QVY<xj5uIZw7o
zNI#sN<n|{{o~^0*ewb$`pG1sAMFB8hi-J%-vum-hG)X9C-T|G6HV+OJ9yb|q>C*;k
zRO9*Q<KiCCfw3s2H2Z4KXV_XInoxQb%W^tGa2<U-V~y$N7Tx>Djp7F~tqwK`5ep0%
zI)isV|Kz6m)0yukJ`}5AyxUvnP(+u#*x17V!hO;Gh=+%dKo;@u&b)v?pokT}8fV;p
zl`h85|AESGyUy`m_ZrhhM18Mrd0m!Oe*Wk(b^i#AWkr|pQ@1E3dCS?sT_r4IN8)qD
zcE)N0g2DN~3#Ij#S|?f(9{qPJ*~%f=FlNgkK7^kD$vmL_L1w#}Gp!&Cg_qnMXeTjp
zrRssB%6~bSpygTr00aeH`j7qIL5j?H<@O3wTtJ+U#k<af=bF6=n&u?wM}|p?pFoLI
zT=tfo_23?@p(}`oLLZ8<hi`lo5(@dircGk(kX$^O$4I1ip-b(?UT#@XlKR85+C%az
z%WW---3^6|WX=dyr0h^l<zHg(EaRw`@4ujhq<gvWiP-hwiX-rppJ{BDKN>GG5t<T0
zBbbGySe_ABeQzRmUmGN1iGKFR6IlxZ@hgfj%A8QC60tRi1Y#ZS_Ri+bFv=K2I}Ac;
z4yi%s5y5jUnEWv#UWP>E=nJ^AunoHW`JW_^i#xM2g5n8it{L<4NVI$R@1Gv&NC)O<
z?l!Y@LhE4Gqp(!?^o=Jw?r)S?KarP+d}z&@iZP>RfPQ80oA(%(S&<GPa%CD?deAkM
zZ^o425L^u2SI>x@hj5GV>*qG$-i|R9(Aw{4n4G5wItp%=fw9bf`xm2`6g|y5u_aKB
z6A~M7SQ>|ZFpDapjBR3qchVWpTNKDh=9MlVf-e4){bL*u7sOXm7O>_sg31z_EwIyU
zf{wCYn1)aIQ`>WWPf5`%BKsnDvh~;3duzI{Deu}YIjg#PWtxS-h$cM^{v7Pz(6rtf
z+Y?h9wxqOMv&%eRWsQkL<`y+tcQ5Xvs58H@L9Ly`xE-BNn9pz2#3&#)C(+}RPK$H%
zJ1*~AT)xcS?)}qIgWlxY`#(Q8ygcD%81DzM{|GeBtvYnrLI8H8;$_9^w1kvpUkXjv
z5>v-s95y`V?%n3Sd-tAbYHBcXVk6+>V){PFS@VIa6HqHctMpzi{d>C$%Ny&b-*9%-
z>}_{(MRO)}S|!>&inMG<xZAjSbHfuSPV5d0+)5ko1z=(9*&Ben#rY}CyU>CxZ9i!N
zQ~|Mb(0Id%;E5Z34z2BJ((?DFO|JtGTeWQIiO5gql-)pP$zIZ~j@9P<$GBuQp*c@i
z;wrS;Vv;fo>ko&7C_q%>|NdJQb=6dj)h`#g)>ON{JR2I?Lu%17Z8{j6Ax)azk3Ds2
z0Exdb)!Naj0e118Pz{!ITXfW^C(;f#J8N@;OZ^qIAi|%}0e<iyJ601+?2Z0GzxUpk
z9Qk3)Rr5r4@87?Tv(<C(;5HNxenZdb_36`)LFAUdKcPOH4KnytTDsxz;a;4>&o8dl
zg_3FrjWu!N#4FJF?2+}Nz_BvA<JV73tv-AvyitSEHI>Uig!L&g<UcatyB<{d0-G^*
z;ao$!x7*+UUy3xF6;F&VmmG49!9cAuI*7K}#QrQdgR|Zp@@X1{#YNS9oXYe|qlUUo
zn>1;OIOppXcS920wX5$S2W?z>hUln`N#lRukNFSGPsf5!KUvzXegguVXl%UqQulG=
z#^H;0%BtWX^vJ-~o43dxjZ9>d>GW<^ty$wpKaerz#(cje+%x)*P5EhzKioudW(LVS
zc>a@?ytIwy&J6-(ZNYp|f9A~Yx(lCOK?uKTwF!yvI*>rIXwk=|TU}!&S^h^0P{GyS
zz{oHcMxmf==?0wHLc1^&`fkg%ZP&>*XQ+QSZQh(u4asE05HWbx`=~Z>V9P^mOB;_^
z{??OuVOfwfaOltpbLXmq-q!<+DP|R9yuXMoOUQXUzMLQj)kk4GyPNE*{KS5b!_d+L
zhYT^`B=JK}&wr{zE6V}?GTyynDA*)=X)9xETIAve{Px|uUi?b-^>~`}zRt-$%_7ns
z&LSuKe&3_|@X{V>4*a;bg--MiXMt0`L;Spa|9(5!R6abU-;~R4L%?2(ffGdJ2B;nl
z$m^+X))?$gE9juNY9J-bR$i$ippA*G9<(|ZSA1JQC$<4GV}o7)%^c_8F&;Y+n?@Y$
zoPnI=B`;(U)KNVcDkS4gNz?HwKX#)i*#QStpB|L_QeehQ=HFI~o@Qp&lD-MYxoM!u
zzbFW1-PqD<Ze~O)e5!UIIItbSHk-FN%(b`;<Abb3U;Y-m-h%@IY06R6y`q(-P%wUQ
z=fH3kL|&VYAJ+sQ5nh{DLT|`rA=qdm2GV0!HxSap>#u{Hq={*-t*torh(<qvMpyoT
z;V)q9(vL!Yx^o_KkkC^sy07HNYm~16=9}lyVmIFDjG$Qg_a#(^f7gYIjQdDJ9Iq{l
z#7n_+N8P)Ra#Q^XSbIi)JBF%p<=_-?TuvVvmBLdkrL7&BCk)L1EiJ33E2(+L=JC94
zbsxPpLfhW~K-)SF(blEZbqphxl9C&_v%*H}{_Wf5PxDZ0FQ3_~XHTOtA+{p!lRbu{
zRAkxCY+Tilk<v3Yv>(SizK3Ra%A;qV%IxR(`wM7t4Blz}3?@3U6b8eu3h$2sutKY!
z^cVliPmGnVreCLkHf(Oi515(Q=5jY;zWG8&3XWS?IP}^s3X>n)3k|BFfH%N&iuTu-
z*OgLxG}dN|l|?nANgCHZwO@ZHjdwqGr)d_thJH_cL96}jA{>t{aUI6yiMGi($$M3e
zh(0$}orlb*h7>;jzJh<g?G+1uFJ-$2R3`CS`m+bYze|!8E?2ECcb}LJNSM7}cwa}4
z<cf3{?*wK;D!GhC74m`lm<Fk47cw;Ew{Fbq($b0(Uq+N4mR5E8KIwtP-zBCS<ghEw
zf3=+}LZP%O58Ktd_5=j<$@btZr^ZxK*BRs-0*IClrJ~j-J1~Cy_$}XbaR${%9>@RB
zAM44JChe@`LX>hs5~R0Jrd`TOPoTi*q93@9;<kX#UW#DD>O+2huNL%=$E+?ra&6Z?
zttHxBcBWF&YWRolph3sqo7E#tskrC1z|SJa9wPl2#n12h)l{evB{|%s*)@EShw&e&
z8N40DKQLth>bjoUDg3>H;U__^sW{eoB~oMfl|x3z(D~6XJDJehRMABL11|U4!M01t
zM60Rsyp{m*)$iZAW0kFoA~KiSF7y<=?bI*%$ws4F5b1rHA-F~7KVoV1V}gFcg$ozL
zZW=x>PoyPs8*QLhHKrcBS!SeJQt|q>N&?bR^<c7a>}So<H_1Y!G{`k~$mXkD+2yy0
z51)B&+1|98^6wp(@;f-@Q{|6k=_`xCtWnPwogt()&cVoU(!-%n)}^26x%#I4t&@P_
zB(<8G+J3<xtWgasPBA#5M{CR}iN}z-WBc|^)zXB@t|Fpay}iitqFDET?(FOF)t&}q
zb|STE>z~E%-ld6K^4U|b97*IMEArY#Yb1J*am*8P$|v|14O{WP1EQ0i)ae?RpL0=t
z>v!iPE}cp5^K?v1n`~g8j{~VlB`Rqx3#EPH_TcBG0^!j*yRfiu%B5A>%UQGY4Ik3c
zIP$Nj+Ko;Q*|~mw9hkRfUAuPmb7#tC2NP>`)ioS{fLn}mYslVSX~YAY?7#X4IO4}~
z>&~5e3WS4QMIL%_+7&S|i7TFL5Wnor@3b}4V;Elb5-H~Uj|Bx@Oi5lYT{hCAdhHYn
z?@L&Ac9k!iO#}hxhNe_?8@{w2dX2YCBFGw(m?JLMaTF&n*98RyIbbGIFx3Cd8Es_S
z>(L6dC7x|gNEj};5p>*vGh{&N@R<gp11?RhwC&H--cDlTOV*vQ`6sHk^^JEud-raD
zn4@Jj@|EkXeX{ySNEwCYOHX>Hx&5L(Se>|(H-=QRk>Jy$gsMCY%0Q!Ha-fdv`)#M(
zZ#S*o&jsx}cizV1IBs|Q=9Mc7Qn5;O%L@2Q%Gji^vA*N?A9Br|qh{;{plt)g;+~&k
zruD_1-lfihQ}NknURAdd+UR@t!OIFw{M24<Rl<X}cd=Ic!^*ja@9+sRZYbwgz6UT)
z00G{Z-RWOl=cNexWG3inh0ef%`V2p5&$^<J{bf%stsX>Yc{A2T<lUabhS8pTe+4!#
zor(4M`1nhMZVpoZuH4>Yj}&nkUAJKl=e!9<01-CPoj{Y8-9j(>KYM1U#f)#!0#Kbk
z>D%iYn$#u5nSH<i{Hbwp<=^w?Yq=e$t}36Yx2|%^@z1FROPgUuG3@?74h|c5<dJ%d
z=DN6e^NOxNU;)Z*dXX!Fy~0R_S8v^FB;BdhA2VS&Q{XO?Kl-zD0yOfw!(a^Dm3Hmg
zZ@|$uuPoVzu>owh^_4W|Uw^MNi|_h``HzPm!$1it$<^$M1UQ>MTt^FkYutjIs7udt
zbGs2RTV(^9Z!lbu)^c_7mhIbb@U}DW8BUFx-w~0H*Eg7$#UFD=?WoAbwLH6cJjXf(
zdTG-)WccQ0W+5?)rcCL;G-R)sAyr*Z*(J2bzo3)j*Yfh4Gz@x+x*UGRE#iF=`ps3V
zRy8VNCj1ZR_xxcJXA6pU414Dj6yyyV8hObc<V)$)GMj{>QPGKamv{o@>nmPlC&yt+
zUpE4BynOM(tgv->ahH)Rnt?RO=H%pbW+30?d=Ud7a~)Q%#&6q`hJMOA8VIfXLnh>D
zj5!bhF{<vXQ{Spj*@2NOe}{Bxo!#C2>z?e_ehy3tK6-LYuO#>KbYF#~PUwWTecgR=
z_a6a#k32K;_M0MJsgX*1Be$<_TM?EwFp7`f<po=vt`j|H_DxCMy?eJOr?+tlQtGRz
zsZn+}wY0Rxj~)9PyXUNXPq|gF6mdl_05~~U>+!0nAn#T7Savj(`3LE^x~QnsnFW-;
zcC~wg-Oe%9-w#_IDqUBjzWR?_+#24c<;9tJ{1@-tw{MFKpl^S(z;WKZZ4}zaOB@$0
zXpV3ow5y8BM))b;m2;iK?%p4<=r}TJ&|F=`thsZy$jIv21-8lB-Ypikw{%@Ry=`)J
zv5y-(tE}v<tDxh)UM2=j93^=XJqwJDjIIH~sRDk#vtPFb59wd(tUGt^yeKaAW~G)R
zwhL4)y~wbiIb42C2Th$eEsTe-Z`hKakddb$-kx1v)1KySyhqJw;LRo=#O!OE8q<*3
zn{7B!UjO*7g+E|f9^ld$dYRv}qv@?WHOAE)b^e~{b=Ov7n`GCLYgZs8TE^zYIQN>S
zZ)sWc>dWTrrBD^mKyY(u_5A7hYQx^WDx<5uT86p<+jI_osip`IL2ei)9eRT|6KDt?
zkI4f@j^EmmRGblidKLm^GbYkPFJrZ1*tAvqFJHfoC)io%o*ec@3p4(Q>&E<i+iQnA
zy5kL$?2SvJMl2Ff1(!vS)6-j(;ZXHppB)1h4FCl@90LwqM6j?C+Xu~(@>j`C%}2tZ
zm8@&ttl0z7`;Pnp5U%m_c@ffwTHqn?QXGet2TN^aZs69-#|@spsq~B8yL9d9CEHLZ
z;>z^&G15ifgj12(VDOuyU9SbP!xMl|HEm*#S_SO6{r6l9b{;vHrH~|`-KStPb)*{U
z(X|2^4p;`eJS(K_Wq{z#Gt5sL{i)wK&8b;+)qkE<O_rhvTX{qGSms@uQmm+C)9`K|
z)iE-kcPs;)&L;q|2aqv8bhlo+y}RD3kT?%2%g6!g7B<ci8W8)vO@dhqJ(j1L>Us%h
z3J0cb_KjTGpWxb%>?qY51UGvUTC=yoli=aNz}`d?lN%I(+SJ?f7r3njou*rxwK}y8
zX-2(z^%|8hdSz&IBPKRh+JKudKRdPuk|t{A>dPJ+DqG)61n^~sx3_s~rVt2B@`o<k
z&k398Hq%D$fo0b3G0qj|?&b6zGNdhNW$YTl)8Z8?*5#)t{xBL*&#dsihIhl9w&k`D
z$%k9ecy;L5aW(|CQ>WVMbBo3#E2}mP9h`<P(wY|2hzlqr!=1Z#XFEC72N`egG^7dX
z(UYP4ljt>E(ziIk6-b3h>F5OjzIy+D3$}ERoinF5=VA%02Km5&&(UG<+?Gh~Eu3$r
zEAvalE17(WKfuVvG<EAh+Bq-vmfv1*ytV0<Ewb(=yxRLsBW7Y}_8Zu?jpmDqhFa#2
z?gQdW_o=lXXq^ld7!&e|%jw(uCXLjonT!(pw;4xX_e!H+Hvo?xDN%$Fg<Te{baice
zw{s(=d2?#Wbd)Gzs=BU5_xhx-@Cg_?*d=pfo5LF9nsx^lalg-}dR;77I-J^gaPN(E
z46^naS(J6?dv7CaF}J3A8G6$)Y`-+23v9ThTLs6)z;LNW`@Ve>1`ajzeLaz@Z55ci
zWzZ1s?v=jgl>`0v?5U%oqH@%o%(jE{^9pK9;R(*`i6e+p{arLv8gdhkMh(7nl9Xz0
z;bqc$9Eu9n1=E+7ZHUrelDv(2CKDMz$xyyb+y2L+9$K22c_LkJynuQV%5$=X$-n>p
zE0gs{60>ok+dz#LT7vWWj~fvbi*yQ7)%tVX*}LAuybsji0x_T6_Ot!W^4?GAb1YVb
zz*<d-UpzZuXZv>T{w1_Gy*-@P!wqhmU2#)qFxUeoPrepsH3buNl=sRQ2x^aR0?Yv3
zX+!R%T5*VBM7Q-G?CWGPmgbMw*{8`hhbYW6iY;e+?CyQscksMNCKh+*%$akV;|)IW
z3_Eg>bN{xu*eJVt!5?Mr=U_I&zHwLn2uO>a;Z<O*Jk3W=pKeJZ+q(K5<-p0T`;Kjg
zOwdj?8mU$@z$o-d9w)~+DXFHqGy1wZinW*mIZf)+n|>01O3+dLHGX_OMi`8$^xVES
zqFLjVeFzXsNAp4a5=YFy>%l~ab+7&V)?zhUS)Np5KnhdL;vMfB?Cg_TjlvSkD}6r2
zi<d9W&1d^>4PTZL9v<#gd}`J2aVPSgX7Y>LtDU2Azk<`o!#F65ma)eDqoQ_Ff6P5I
z#}$HiCu~oX5`gfw;BsEk?8JIzU#qON`&+kp^CvW)p+(zv`d{qSDD|gIo%)j0s|YFc
zay1U#%i{IN#fh<@TFXqBewAuRVc?O2mPm7mZup6>Wo4nfX4OWKZrizFzfrxwebiMq
z(tzK;$$4jLxXftVPW8m!iEMqGN1_23Hey7RrU5e{6k#juzHbud>2BxGeaGAXxZ~ih
zqM8*w?RN#Iuyx|!^e11!ECLfxJWNdX>i`z0vuxS2zCDa7_j*Lto9*a$IIhclLkpeM
z*dDsN?IF}}z?Oe{o8F63l*zzx`Sq+!ca8a@+ALZlvJV?R2mhG_1${L5UDU)S$qgfC
z?yTeN@iFz;1=pqwM@Y)#AMFVaJ{j|HqG3?*F^IugQ1740$_#KZ#8yhd^t`S2sh-Rz
zIS`-}-Zp7dFn@df_|b7}Id4$pdTsoT8zJ(nY$Hu_`AtZDFAz!{b)zQJ&N$SkyK`~r
zwsU8}`(w}iWM*~mYi)#+1|_HnjyCL{nqQUgn%{rYcpTOzP>J{%S87eR$ZLT`+$@gm
zrDI3J!+TP%Id=TyZP5)J-;Ot%!W4$0O>`IV`W@Y++a0`b?`N#XDSO7})wcf4g5YS0
zj(mXmRW$5UJE#fRXw}NkdeWrdXJD?b;rxc!vx=39f$d%SN{0OdV=NEcuspxe-h7C2
z?dgnc*1Wkk_G2fe#Wqn0OC_hKX#95yRMrgD*UyT6SXbfi@9(n6)~=1ErAP7)wJ43i
zOWrW*J@9RvOYs{*M)!$hKWqbV8thXuh46jUqC@UoM$GNo<q#_02=_Plx|&xI2g1HX
z(`pWHeC^RAn@k&<`V-q?s<Xr0X!Opgs2mNq%J163ddcMjxK4!SM4OjgtZh+lzlQ-_
z)$)FUnRVNYx(VPym8@>n{P*U~4NwWDBs7WY){E#xNq&XW^vO+9^$uWIOFsSEjAJd_
zzP;ZHc=r9d#@yhHhS}7@v?tlwO$<lTz|wfrSRS19Cf%Nqf29VrPqx?<WHcxaZjTJG
z>hr7m3KnbC?SS=Tq{?h|6~r%o`I~3h)@Ru$$a=a2IK{d<Iyy$Dgqc9gNudaHsI%yJ
z(dQP;n<w)e>a?*=G>dIA;dA?RhebvP8@$&pyng-q88EzgU-QVpqb4f`Qb{%IFfim!
z#Yrvr=I?CGCR_>YNFCxlq~l~Zf!=!ogEICa0ozAIdg!gtB#u3s28{;QenUs?qLn{!
zz!5QVrwaa6b85*3X4<EkCKp@M^5XM1RNZB1@wrKVZ_eU4?GIe2#HFs0xC$iNSlowd
z|BMXP`Tcq3Ug8rHE|(6=?pdbjWA;_ow)BNLY_p$Xao=4);f)vob)@F4t62Uqx2v>*
z-CU1)cQ~w?T=S2U={<}0r{34(6BSyisMO^TDSwN~Wo4zgB}TPJk2)|6t*SOri12kz
zE${N2QjKUC0gD>h9pT(k`-s}VoNLc6=BvCwPncK571E1e?=sp3y@n2LM^mx`u-0I6
z->J7XGz!vZ`my`Y@XcyiC!WV7g{N7M$SG6boZAQAUuYp4_YOE(_$PEEPlT;tN+BY8
z%K8F8)2X!!W3}=Q`}JEM5%IcbV9>pzh{t9D#=qm>lDan6e)^lD$p?n5=Nip>&#vyJ
zp!dlOx-S@gGx<Ya(k`m6M%x_yy)N90AQcNPL(HcU)x^)&cN3?tD~EXG^5x3~k#Fxd
zsuMZSq9Vw;a(|bh^E=Ruu_@fQJ}k+wcbPCOPOE{fsg6CvOnPsGMyEmBFy!sHsb*$o
zk!OQ>f%<>`SqDLc7-P;I(jfW7*RuygG(X-B<RT{1wC=NZJ&Q<g(p`E$<M~NWPQXtK
zw|9^FiGH%Q8uf&x-3L@isp}{q!oKY{JK9ja>Y2aVhqHR;so$<4;q+>v4R!VD+qVhm
zj9<Ke-%Leiuf@z@s@lGKrxxv(3yGu(L!{AY9L_MTwnOv8-0K)n8kB%RjB?{RbYm@W
z;Oqg|8;A-aI>px7ifFiBGfcgATmS6_IUl>XZB?EVrBySiZB1d+!zLq4E~v|B7>Hq{
zXPApE(*#*R^Q~Grsy}@Ec=L`O&5=+k+PFWujh_5KNcgIdnV<itBK9spm87^r8<ZPz
z!YiVd$H<kuv#PpsIEncaMB64WuO1kU&(-Wdtrto}uZKqtqSv~bn;U$yp7Ml6T*E`+
zF!$*@B|seoK;tII)|}nE=1I^lzbT+44#$q)x6&Tly9j%K11-O@fYMRcE^1w!Dr~pg
zo~atq=Kh+f!&4R%xe~p@`1J9szl1M77!c4N3GZ(}TU^Kj-0omc`x&K~bH4@)G}F%1
zH@&ZIW_9&ACuZ!mUBSWK5FT%*nhJw{AE>K4U`TgUs-UIT$0^kFQ4Td~(&XC5q?(;5
z!ngTcdcAZwQyd%EN$~=)>~;F|8^pNlxvf)`sc@yv`;Sa6;T`i06=qhcmY<EE?H4!K
z@9Y?pc7fv4moF-&sr}W}ukbq+bCZl(n7OrG|7w`VbQ6<il$x7vv>=%?Nne+S*2C-$
z7JJ>=bU%FHK$qxbv*0$icL(f>r=9<q4ULT&j~X#z1ZmPVu(eTcZwjXGrD+2wEkv~9
zNEU7D^PsN2)zOBE0|ySME;|0?{IIKU7J%uRCf9Vt@aGDS2(hDg#^sG^lRx9!oaS_Z
zLXx*MR<F{vZDsxOZPxs}#IB40Hc-HJ{w{i+M}3A{-{=q(f8hdQTR*+{Pm8>fMhlM}
zKfVn~!<L0Dnlx!`Gg?MK7oRnVB4A#@q&%~X&*hZeLgITXb8ESoLSc>JKhgCX@MSc*
zs+a6PEv>CqBBBDBm*1U97ke9tWEPTyYbBtfaYS}*G8*&OsZG8_AD*J7hVi0Fj^?)k
z^Nt=m`ymgFU8c?UyywrWc8uH=k3igf?0q_Br`P@{HQFBG;Ow@Or>2b^Uyo2G02_iU
z|Kys*bTfuU2MRTupB>Yf5SUDuK8@H&&!gJzEpzf-Os&o$*mfAc^zTS_^=eaLE1|lw
z+)hZvUtnrsai4~;ba)h37=Wb;ys@--R2YHpdPar{lP3)oSh}{wCy-QJ&&+p~&+grd
zL4yY2w0+JlWk94>U_QJ__V0hSY}xXU>>9dTu|W@1x^~?`Tme~hu&|A@(C*udR6lRY
zr6!SmmiL2;DIscDB%RI!UhV2Wrd>8#xwZeOxIs;OQIh`#MmZf9mqNq_$XU+L*Q~bp
zS2New4jgx8gtaw}?m0T$_eE}b?DeW<duh~-u#)m!-rm!_sSLW1TULARDA!PNGSV<!
zy6@FI>-`Of%`9Jcsb9?JVefM<cZS6q<Qdl1O*+QmS%;%iI}{I|`#?b!YnM%p=I5IU
z^4iG!N+^Eo_B8tfjJL~^8b5xKhLhn)WHs!FNr57qSrosG%g535?fsq~5t3Q2gAx*j
zMV;ga2?H8D+P#SajF=4I^)mS6-G1l0^urB-%bJ>ZH11L(OqoAfBiSp4-<TG2*}*B8
z_&oPnxYpKj-WBK1o^2i5HvjP)KVNTYrt^}TmLSG<fK%~nZOpq*tt>z6J@in%FiQ!`
z{+e6<F)zukwVTny^z=VLNDTGQ)0&ys1x1>`ftIaX{}vLl^gazod_a>dzRb)0nq<fa
z4s&R$yXK6y*o_SAI~|4`-t;?+jiQb94236JsB26VzH=NoeE3!TN+Q0t?B0DBMIo()
zxzFNG%q&iQMW$*SJ3VG@XjWCgiHEYTF!uN>{(dOoa%|YRwQKc|w#JmMRrjxRm%;q_
z9hpaZCfDtxX4~??cq3;!Mc4o{&u@p0=_bQ_%0a|6<?5X~%`koS+_-U^SIR8-5<rrJ
zr$g)eIeK+Mdd_H1A=oAsv6Jd9bDQk7HPR%dsjC)~Ht0jCRcVb2Ndzg!5S!7fpZ{$d
z`EfIoS7DFCL29Y5lTzcmTbr*=oE-J)4ZHF@DqAU}kfgaf;oYID8V=1&k!}wdF=cJ}
z2YXPGdH#wP-Sk@eY1zizCElc2g=*>Ow5IXeCL4M!nfR)<XtMHrSf!(WYSpdVPKXzc
zs?}M=4?r1m41`Of0HU!z`8zU^NnZUM{8{@ia{t!pNIq7zdb9f5`;Ii}|0Na!i@U-j
z*E6$9-yCy{|6<^vLE~IpG!!o|)1`Oe8?$OYlR9rJ<B^#k`JoN|^6fH{nfQq4c(Zd3
zm0VToLQl}$Yi*4T3fJ*pmdjUi4xV9s?CzWI<brmw=x%=&ufP18y}f<2F2h<P)cO-z
z&MR3b<KaW;OE*J?l$pfn2P&ac5Bg8CQst<)Wkehb{rUUiWy@4de;We>%zJIg7lvpX
zM@-^bE=kxPed^RMZf?^OP?z4??`99<0Bn5&_IW<s`{t;X4%LwFr5b=h;{X<~gvFhr
zi4OJkN2ls0#~=Sk3-E@np-&2F*%P7%%Y9nx*DTI=?$~i_wuQzKp54Sw7s+;EeqRtQ
zsM!wK{qtEnk3ai|Pnl%ZaY6JaGi!cvOIdff*wYdHmy7L|gmqQ2j2@2_<LH#oDYu#b
z{>SIM^?U4bj{EJ43WEX`&c*ldGJ4NCRUR@C{>fvU<-<Kg^TzNG$Cr@ajdvzc_S21%
zk45`jb&+ki)Sn(hP~J|Q?`~~TGqg>2OIPbx8u{z23@G-(Zgg9aI9Wr5$f&w^*vOHN
zFc3$h0{vnDKd|q<MdQaBZ0})!2x0v3Ih-cbhbsu-ZDTcmDl}^Ijlq^(yZ*uy4(SO7
zNE$*UATSw=?-E7dcIu{3KvRbi%hj=wY{6K_0ln3&TXY|7wf}+R!i77jXlIkUaRqL`
z9Q-x_KtAGJ%%`sc^p{lqbOjANLY3^(acV*dy`KB39a@{ma*fc<wC}gh*6yI#oYIop
zh>QQxLmSuSK#hc<NgqqB$OrZN#8n~28eam(Xq??2pTE*qG2UlndYpVVMv~kYZt@ca
z{3A@n3vi6zrGs(wdAzf|tzE48CVX<RUd~-Jtb*MdZ#W8wEjo%`#a}db?Xl}0Ft|?%
z`Rze^`kt@n=fT->d}l1T=kZ0Z^L}&ZXkxHu*pH#KIrtmvrD!e@Y?gX`<e|*E`h$x`
zz&g^$Zxf{zLpf?UCWc*Ne`O}p#XnMlOw+2{ONIKuE<M%ukLlfe!o$S9K0b>9y$Vmv
z&W;r8NK+!h{_MkDBh<R5`OH+`Hg(FBE!jaDj;xP0JQ+M2y@=5iyg|n^Pn1%^K$hxc
zGusny!@eIi3jF^4yN=p0D<@i1__k?4?z2_N6K*cxXV_HpHZ?oj+D4m+XLwj#oXXB9
zA5I`-m~4`pi~jf}SI8&M)YP=C&3AIk`Xg-@#FSO1!w#8mcmNHf)?K9YL7#q}df&L(
zyT%q$GV5Ew&u0;ql?R+HbVA#xS5;59aC)|@G$iuEZr>8)#K#j?w*XKSYVIiGeK}xB
z2Iq+X+fW%OEndCKzODAZR^EmlbQICS97!puuKY6j<=OrFJB#6L|If+;*~%{fBnL8n
z31tWpypB9+pz}l3ukRkWz!e|(DX3fe7u;Y+I+D_q*x7x|PDl*GdgQb7d-k-#>g`2Q
z(N+qrYd3E;1e}cHgu^$iN0Kd!3y9_#2oR-IGie@j!u?`qDf{@X(sRP$bi<a}@J?^g
zdpV6_QgH<Ze(t^|T8n)6k>1(VI=f?@i|(KVX{cc~8-!XCk{><!Nc;>N-i6$u6|3LZ
zY(({|;jJwyk^3pU+g<BF{QTjtDbuETXY=ZP;`T1>e_n^yc2`u{ohra5CNbYXAP+XW
ztGUYW=3B8f58Bn+_0NyOb!OVc%{oR%fKTfm!w}YFM03X39<yfsA@zrE@F67wo4zlz
zZV2}~%<#BJ<>!VxmERQ*&}Ioc$$N{;CtOTQN=otjbf59cGaGKaQ=d92VwIjL9UZlj
z3dCdAHh)K*Z>TXl8?=}HcR4h(cj|2oj(jiQM=|)AjYy|^av|*VkmzZPp&N9pFLY#s
zN5r+O<dwk-&#~F}wxjQxFIErf55FiVs85kF+uA?%8^gmU2S>C;F8UxVE15=OY;dz>
z$igKrppajW-Xhyuhp49ypx^Y3s$0!;T@p8FZvAHH>0-AUQZ7t6J*y5NdJ|rxFNiU%
zKbmHl=bmb+=zthLVsIIyh}r_Nd2gaJ4#j8>=gtcfJ$&^(F%#9V=uBTNtv0_$6c-me
zFoWdO$ub97{{WX7{3Tr~j7JTNyhkh=Vly0HvzEc_Ln1EtU#J&B7B2{WT_>6>0~@$?
zA)m6nhNW2e8kMIb#(!DLQ_V_jSHltx+Y$RZ(!N}j_@e=JoIp#8=UG6@!YZq89Vihd
zfY3$TV(6hlklc&~*n@9nWia!Uh+#L&DepYWX4O`SsfHF7t!XptMD{d`(sQ5gqHYaZ
zblc9CK8#dAq-Qiq1d%uErq|(D<9i7dnjO7hE7wvV_%dU)l1f~-hPnS79IUr`1HB==
z)ur_~qyM7o!hn1m{nx9skdOqQyz<w2WwH78t~O)DFVE6=Lah6lD0q!#BoF4)ja#`h
zNGvL9J!G%9<15l*J;dF8V@582`^PjZ>%C~;=Dt6NVk7;>3wR)nl4Biez{*;ELun87
zy4EuRwS8Y^{UVoiUI2@#Vts6cN3|Z&ICG)MLvJ@txABJ?K7poofpkPge6#@IV6uN`
zwAGm8@h5p^^SUHyZMD}o58M6f+KE&G#MW#+V&cPfG9ABoI3f-z&dm6aQ0vmeQG^^j
zwwZCTxzGOP+ePSUM>aIj{9aa)V>@>Yj5u0Kq2n1`N^^Zr_h~kfWb8;nISPu{)UyXM
z1@_#v>;Ak`iKiwZ9W&5eAlJANgXK@hu!&`<SEx_-TSwO=WTvNIMdviY<l%rx^KW4e
zot;E55Z!}@CZFEaxpX%W9<69EZ&T|b{~}zNO|o+eQar<CCf&O?kjQeR;TU!GM*L5H
zmCr6*ym&n~cgEbjORH7D1GZ0V;D9>yX{MPo=eCd9mK{47;?jv*_*^5X!_1B_#@g5o
zk?F<)j(85uxgbZfv=QoSqb8vp*t1{1=E54#Ikx_WYCeTby=evHt88Q$`a=tqDV#vt
zY@NVnGuM9h%6{WPyHqrJNR3){>g3IcU6PA!pJ?yY3fDRcCUNPPgg!`IlHXt*yA@+^
zH=;_s$`FU5P1kyFF)uuFCgw+VI`}+2wL4vs>pab)XFb5mEW+8zH>{&zx^!xhiWLTQ
z<B!LQ7pl`(8oL!joSXml==kp2e@~&~blS~3Or#c5PAe$YuDK$B^+dsw>TZ)#rQQNp
z<FIegdgDu8C3RISW?t^XE+3DZz*MWiE<rv%8%SRP!_5of#QD5}(`V0_!-X8`>s{eW
zeU2vLD)EB-1Dn{1MG0f)s56DoGmwY&vL=TZzZhlUQFka%gN73A)km03s>Rc-=<qKA
zONbnSxrYD4-kXP0xxe9~uiDL}k#=*t78RutA!)8fRLYP{6_vRNp-@sg%?pVP4J5Nj
znQ4%ap)!w^F+xZvtaCrhZhtxFkKg(0T<4GNy7tgudEd|Q4EJ+C_cM+tq{N0n(2bJg
z1(aAoO-8lkENZuhF^oqYxI6Kj(S(B|8>AIeke@#dns^&gvReta1|R+rRmoIP!6%`h
z4ER`?Ekk@qNNK=}Z5fv_z^1*q20R`CMYrX?-0J4$u+FXRkB}wuQwQwQ`Ch)h*Wisp
zytybKT*K8KQ=bUbe#@BkUVwM1VcNTKcvXH#+4ru6FP{GdTXPx6;0_nLl`AJ#R#qbT
z+8f7(nHt++h>8HQU^Ci`TrXW31H-fQ2_p6tIA`wZqG%4<+Hp2m1a}i~ynOR)*Ae3c
zKLQEd1YEO(rVj<#BOkZ`)?6Mxzz)GXDs`}1-LOSjvpZ1VY-_JoaDP@`TYC^$=B5NZ
zt4RGP3Q3;aAfd;CoO>8lkqV~o`4M`+y(R!|jj9|$S#OxK?1RoZtB>W)2W@NKeRdT>
zr#*4PxzkX|e+5wS8?a%%#a^eSQ7X7HOOhYPVLiw!7qG+LvUY-0v%|RulBH>?vKKk^
z3e)nn_u{ughZc$iygkJEjC}TNJ5WrpSWkRR<(my81AwE*)SE7-{F6v9<C6L4DQxD>
zmE;F*V|pv1uH#TVLoPWUoLulOmgyQ8Tmm`295)ywqe;T=e_-m5Nn9bKjrq9e@DH#P
zX?VqNa2z;d!$D{HO+SX7)hQdBzfhh>g*31xme@P!@x8aM8LC#_zJ1z^&f`Tm@XpwK
zT)PW6DXAzu<3b#_w)S}P0wX(ltY#F@$GK*oIeq##&MHXNFAE9;@Fst|xV#{iGpHBt
zmv#qZY`5Fb&rnX(0^KNZ=dX9SKy}%Peq!}cn-O}$nZ8Ca9aeB+F0=+4AIDqNUn?~M
z<md#l^TPS_nGJh_is6oRVdOzekcAm_h84#}nGgChMIhks@J*ZZjX<}p>?4_O-i{Ne
z%~=Q5(KMC!r>45qH{DkU?t2q#8aRkCSefD^J4s?s(Q?i^{f&>xH3K~VR4`=MMt*8&
zpzu6-C-+xOPk$Q_L$Yx2Yum7ExY8G~DEA$>{ii_hMpAzcMP%Z{AlZEdK!tCbkoJyc
zVOqW@9um++Ok&1GTLA;$(m{jzhCZ5&YHHJgtvIKo$bqQ$H;PxpQbtaEx^`vYPS11P
zUn$(Fl~ZA7|3DWe)LA|vj0QO&`q6?yY$=fKG7)RJ%*}vD4k9}1m4jT{aAZj%6ciM&
z+`9NMhCwODJ>w=GC><${GdBUq;T+iPcTkDKeO(AIL^vBLjJq*xnfPPxgC&{c&{iO9
zzq=Q65?!$Di7gf3-&Q)l=lY>;-%^=04(NJJ83qr->%E;c#R`PQE10728NFl|oScSp
zka&QcP9A*6Gz_2=!g2+6{@U$H6epljAVma)&cxILeANP99fvS+J9rVedXr|%Skk-B
z?#Fl}{xj9WRknj~kI3Nyx)8uw7!I@$mDLyMH9dAfUHw?w+<`#;<~~$MmRKgo>5Z88
zJ{k4Qk4SvG(K|-;Z#3O~1QUr$loTe?Yp-8F7aRGSBcyQNMF=CPH*DCzkkE}yDD~MK
zD+-@O#+H}^v|mJK!C-P!X$~R2SBJpeaixNik{LL57fYoky0ncNG2$Mg^V_SB@+0dU
zfo6P6Rzi#PC|q2*Nc%op^u47P7ypUx4#^*(Kz9Z01_$@NMaRhe1q+5Du-XixL7oF7
zP)d8@Dbw(y?}46d{#RbGE+i?4Zi@SJ6-<JIbPMwC@)4CD2_A;hOuX+R1K4A-&|5eE
zhzLraam{GLIpfklk04K^7Z;HIKr4zc4q&DSYct*NZ&eM5M>!Zs+y&}3fE9eSH;^B!
z)XCshQvD1JzZZ!MK(C+>@BY?I0rZRTgFsaL%xoT72v(vGfBYQjX)s4=2yiDN;DTCR
zH912N^buI{-#un}FF5@i#YGFgyeV)O>*hi_?+R?da0bS3ai($MEo_BLu;imvsFDyf
zU<5N8onrgGY;vboQSa1o)6Ou<a#AtQ@+GW^E`%sf$S@Q*kZk*7zsr}$!R!Zqe+tau
zAov7^at)=$#k#QhkY=CiJ9R5^3&CJ6EK@aLl9|<1o`!`JjyJ`{0iIcKJG28X>oCN2
z?xSi<V^F)XprCgy-nj{$Fzj`dUnc7PFVoYvck70^0OA2Iyb}5<SEn`sO&bkes+cYd
zG|=4^Hxk562wfF)l-RGhSV2vg5%3t5GWU?y>6kCN1R7#vp}G0jbA_8x^<R*7lDjHU
zb>?Fry#lu9G=L$>@h`UE`xU~@x4{Zu`E%tax6sH_ZHHj3gXS0^q<f*)9Yv`qkqFy=
zAZj)eI=fxibxee%K2o%ApDxaGnPP`4eF5>DQF#~C8Xn^eUd`RUa?zqih;#1l>(S5$
zWW3}jmyR4Z?;gMx!)Kxq_0^VcT}}6kQE88amMD?Dt^@(zqJ#*+#+oX=5fL5z_jUkS
zMKsxsW)q?jJdJ=WAdVc_^DoaYgPkczJ!We$46CpR9ln3#^Tv)b%>>M<3(9gs*|X&+
z%szOMc@0trH;e;X>_K5#faW92fLaFfi^{eAVH)D6G4S-hinYj3`+cvE`e1j*WXNO!
zRX7b50z+4E=!#uL0<Zvd8+|_*80^m|h@I@7(FzXfmg`(xZkBsvp+D@Z$W$NEL*tol
zc$pPwyM1Q~ZqHU66`^J>fPZz2L@OO*j<}S{FbEt9RK4EoA!?1qqI*7V13Nw;;g{(3
zpbT8;$)NARInxoZmEb4q^DaST$&xVxP`aS~MI;O1moHt~bD&mzDhx3+3hyD)J$~ZE
zWG$-`CjjbvFgoM$7eyIBAc-7<x;`*byRfZONO)%?cy!KdG1_U3*lCTgxF#G?O~^$&
z2OSqBY*m~76o1&<(e=_7$ImziMwR?r>cMHi9FEuh#I{B6@ZX3C?zLZ$MzCcl>gZMg
z<4@TZ$f-()s}P-2bGv-K@DeBtL?5pVLpZtCqHcULx@IXnH4&%)-AxzUd)(ZdGmVSe
zvx2@G-P4D4VD^onEm&)l9<@H5`3MOER{f**DClaU3;ARPo^S;$0<kBXQSo>UeuxlB
z>pU5IEh$NsdVFBsup$Om<}h$VP;Q#QKBGXL;F-Z2DW^a-eHQNKk<Z@12M?S;k06k7
z1?rYEmALvVFj#`cVm)fEhij&aG7|bd(p{#I14qN@bY?!tF~E^tV1Jyq8jC}7aS5d_
zUrxs$&qV3`Zd<v`ZnwnmaOIy#TgN;-w9>z8B6i~a%#`5HOa2@%t#{mZtAN8%^S#j*
zOpgOSwa-X^aTXS!3+Se+>u~JqTGRt@Er>|5Q&I5*Mm3mUKZ+`0LrL@^h^kMXJ^Kp9
zEejV?!1ZW<v@mjzJg5?&^G|-C?_PI~&PPoB>6KrJn(ND=qUos0t+o5Hl)B|W8}|<g
zplZYM<Hre_T@SA4+O=zUl-7f_&_<RD#vv96FaY|Setr{SIKWVN4z4mdrgj0R_)<ad
zM#gdhb#wH89S1TBo4i@r73|@$)QSe<2WDxmTJYC*$!F})#yAO86)M*w6vbqav7jk{
zl5-bKF#s6D$)TM&)3>Vm7c}Bt;@Ce%9}@hTF0fd4)qubSB`~(Y-(HCD164_d-xV^E
z0f7U8-?QLP(tr^Xp9=dnAEf}4NYR?+?Bg>BJuFv%<=jX9O>pRwRumI(m&c%Y2}20x
z(B!g}_X2}OT8p+m#s#_uUqJVlx;TmZiy8<T3a9iR1?6o#0sf#9Xxq#N5JR{uq>|Gd
z`G!+#rDpQ!8ED}JFLVoXL+lpnn^cVc-dr{vKx@Q0RU0IN-RM_`wVXJ6{pmk}8K%Ma
z-2?Pbm^2IzXaE<`s8aYEhkqHRSV-AGU7d><Wrvc|1)zXPrg$jH?6r|Qud5JJx#G~P
z(I}Ek1Vt68{NyPXNOpL;heefFF!UhhSLCGVmu*Qy4hchY7SIWT69QgvpXZT|hn0%=
zGgR&>R-kJX@b>0iyCx!OcJ<C1&JdV|(}6;fGb&k>e<Qy_!z;$+2|}IfDiU4!^`{0>
z$<_-<aOvhK76SLli#_(YFaUidAj{n!?Jb9!UJvs1lamoVZ07Gr_o1!EYYP#q*LU}I
z`GA5Fr8V$8FHw*^4m54c)~$bmaxN$+NLdX2;8Sz+Re0f)_O&ph6udx9=L)KP)u=Kd
z6WC;HD-AVXG^3q`H#!VJk5eDXP}c<YU24W2=Oa=Mrf^R}kr#pVpR;BGnwSfYUn+eN
zTJQIHT4Yim#6bDrBZ^(1593@9XW*BJXNYkohY)`wI~xg;qn<I@s18hH;553pF5l2I
zfTuxJGw$x<o=12<V%ycEok>be{MOxe*tjBI0M+4i&^m|=`sd7<_kqkJ&)E(@hC2V?
zxptHWBISn8+GUuc&j`iWo@|%|>u>>}M>Td3?Yw7^#UkB1-{Sz(jMHlk9NP(;geepr
z!SJFQJ*GUtdLlSeRMQFw5TZ)};9eKRWfY{{p6I|9-FMloFVdM;woFcL9&iXywJ##%
z08pSEG;<_5oFpyvAYNVL(GwJU7f4Ib#BWj^7vw5LJ>zI|P}PGDzzaRsqCN1WFdwNo
zIs8c72qFhD^J7iTAOD2XuU~H)*EO*54HYls$L;f+Cfd0p=npii4X={JA5^kK^EV4r
zqX0Eo_54W-i^H1+=mWe**$V~+Vvb4Er(Yz4Cnm;Ej_}f@jVDj8p$=`}4D|alGQVQd
zqaQy$i<^xfuWM#@9hmq_%o1`-eOdj4mk9j+m-}V5?7qKpcpM#+f@?=?`u!(c{I?=r
z07-lUP)quBDCd8-M%e-)H`;dV$Zp~Kz*s~^M{h><gPXoU^C|ux%{9o-?mOFosXFMZ
z7U<{oox)Sa&{1hV?n0$Dpr6!pBgToyj3@UTd<bX`9|M!+KAXpgy9q>nCPDki^Ak_C
z4Fk3wAkst}%)kEHXmnUZLqjC&5vG_-L;?UW_Z*ZyqiR|va4mWkuWx;BqYCb_;5rA~
z%I~HexBSE4I%?*;d9(PLE^h}KDmcEr{EX&SZ~CRk7Su^mhM^iYyuz04+i86P;nVs;
z+UG_j28#r_uY`!xL3C`uRz1fiQ{y$>9bALq^ccm(cd;O36wtx+WR>v1<EV)3-Mg3B
zTE7u*xOJS!)X9^B&?z&PLCGVcW(R)uqXlgF#wAkE!%w}R!~2$ZO&G*F{9B6a0p0@Y
z6Lkc-l?YA#l9twp4K23s?~OaItT_um=6t3!)Fxh-r8VI)+znjxW%s&)ADbkEBpapp
zMz(@Nb&c_Y1ss-?)QnVa<#znYhKl)Lb{@(YW0f{<CVq)8?d_nWqAJU*7&!0!i_qL-
zpnNSVYv2auHFjejLckPDH=(as?~ORoA&2oU_<C1%uSV}H`1it{yW?zseqREXmV2cY
zOxL?My5Yj(CaLT}Tk)pO<H<^}iIvMZ99vlEcbKq<9xbA4*UlOEsHEYbP@T_0<AeL3
zykp=#9k4MzI`MSR6v(%}sKs&EBLglU&I7=esY;qg#H9cReF=#bh@FD)GXY{{*b3;g
zL45Wss%Wa|AnM}lzV&tRL61wZSbv~)8S?5F7DAD_qCS~tbWO%zu>FOdKr;pp*OH<X
z8NcU2Enl&3oj9}^W*0arC#QwfFHR6cUJKfn#`Tv70YLP;pD7hAR#sZN2_jETD+kcM
z$w8l?rK_2Y_CVA-)h@luD+@=Z1?4mMIU^@0Jp_I++9R%eJq5N~m6ZqX`pu`ZD1OHR
z_3x9vLR{vC3J4O?+-U&9pJDt^*<G$88yI_E>4Xdf_B0RSi8qP+d=8dMGePIcC-W2H
za}FP_HoxRV8;joQS@KG+f$eS++J@_G=E7;6F66oy8`035?mw6JlEKpu3JhaFT6sW9
z7qchOw%$>AY<n%(k0WprX+qYrjiV;1z26gh_rX_bKqL)c+K!9!wtsTc98f?UQR|zJ
zeR1gPoDLI#t{t6{gSd+VRxrejBdj@U;UZEq@#BJbtW%KZoooTIrAx;Hl4lrbd(1}k
z5>dl@ViCXK8gEX<S{FI&IWkMpqF59^(6k{W|7MQ|@7izP{L=jDKw;(YM<T8ndJPo`
zl2$E0M&=9u<^q&o!mJR@#8Z>uzJtC-;-a}gL6&477zS4A93}+`@r;zfCAKW@dG>t*
zaI;9$6ao2wDfB0~p8$JQG~Bdx+J9gV&@r}e#}$y}(RF$rZ1``~w*@W$yvpWoEd<&5
zq5G$zZgT$8CARacZM=`&@?D~>z5N9~n~y=>php`WbP}ykpQ12_mbWWg+&7}fG)q)w
zG;cp_pTQcB0`~eGEJrlnPn3~K$mFNj-Ju`gjXQ-tw2&m(fg>m&7;^LGo}f%AFOe@W
z%F*X|sS?(H1ZF&*MKS=;U-#g_v*5A=7>SK~iJKtu5akRIJw{KQ2#>cJy?@lDLOV8j
zPg>jIfPap~ag<Ogc|+!z<6cEaCI$+=3n6jS&4$<qY8JrFw-yQL=tP-i$V&@kgHlU@
z3O-yV=W$e&h>GI&HkgXQ7u7<%7hAC43)*j1Vq$eKqCf<6uYv3VvW?B;zx?;#!M8!7
zoxg6~Y$gwdP2umjMM+NoIN*VUp$V)PdI5m=S*!}Tolo$FleIh`bAf$PE`rX~zS1*`
zJ>3o;JV><uPf^ej%q(+p0AQ?Y@OZ$+z(0)R=idfImtnX)xei1<f1?*Ae+^Qh!5oAR
zB+|ful;#Kqjfy$#;J)X*xAO;D%H72fi=m5uJ8ZwMp57lIv>{$e1?vdr5gnyonN2_;
z51N{W|B%KT+seZ50cPAHFFzL2yEg%PB4fnE&PQPjtRk!czHcO6$(iNzxeQ>Qe1$5Q
zw<Xr&kj)@`U*>KMLWZ`;lI{D=`Q?uOV^?kp!|l9;E#PAiM#&JPH-olLg+jcOO@$K}
zYM>=93(#Tr*#h`8l@&a;FaA=k9jL14PRlak;vBEQ+Y0@3OUwaT>vn#~S83|lP*)#a
z<azscDx%$!@JW006?W~~ZfYuqIsvgP(WQ?<^}^-LCu03ySfYvx=vzPw75=5HkJA>l
zOzTp_d#T8rKZbpP_j`98@fX70Eky#0KH^7VwQx$1iC1Ur`R7=OSPLyOPKb|R0OS1g
z=TF`<t4P53qig&lA@tOkc@Wv>KW{Va-?ss~kpMmCF|W<;b1tnPIdUXP)<BK|HfVV-
zYFiiJ0&a}nclr+a&1j%zQs2Ly!koYKI;~7lZKX)1Dgu41gS(B#rN4LF|J?QTbIol|
z3X~CUpyCA1!aWy7NDc-y!Kwk_T&fwk^lYHW2XIE5oku`GT8x#Ac8D<<QD`$K60N)2
z1Cc!gR2XtE?=jsCIt{}Z5L|(Wl*?bkK^DRDmaVY*s?In9Cxk~B;ki>aV-M}1knTTj
zKt&da;wEQD&eU5U1`ZCM#l5Juw)QVvzgRkk2+#t;MKSvGYeJBK(A0Bq_;-Qbvi_i)
z0_(8J^8RPNg{bM=#sf|b<x4FupN*6OFPjI3=9C*Q&z31|5UCXG))_VhXGhI@^zh#0
zkL$RPt*Z`d6dp}ZP1!upcJixmb=7x^Z#{Z-ZSt0*yD#ZC`)*O(Sr~0}NoeKKq6c%U
z8@;ZsoLSTvwJq9l#F0s}wjAbD{93X2k>mY8{@CX7=B>Bf+r*qy#%X+_TW)>4dG;?m
zU!Ay%+eb~nK)@Ca@Kio^Isep|KCx<Pvr)U{v7-h$MG}^BO)`)QBd8I4p)UwuX@(yC
z64}HTRI!~lC{-lIe^k<njcK9jE{{`a!nxypn@`Tuqw0O_9>&K@<LcXd3Gj%juqqQs
zSjxDdQDr?FDaLBFw6HRu+2D-?OE6A^xx3>$q*NU{KR{GYSw+PiCif_ivk5QcIwMFW
z1i+Wlr&0i2Q6Q5AXdj5w-3Zc@A3$7x+^*uPI>SBF1?81Tb6EzHnBaNy<&*j63+Y%3
z$tySPbn~CI6n`{bXvs-Y!)qOm?t8VgFsi3++Uw5Eu9k8OT_YUoBqUnF6UZe2T-}KH
z-AA=jh1q}I-Y>UvFZW73qgavqsiuj^jepp3RHq_016j~R<mb+llyHbX0PG{}FSs+2
zlXeG6V^FrD!2qDH8GVa}%oO8T*YUxxe@&65g(61}UDUZ4B+=_oz%&INz9uCM5N-#@
z`{a9eTt|+~WzEUV?k(BV8_~#_0ahc9ZdY9~L=<(y)VTWJ<2|yQUaYrV9$J)i12m`?
zZ+&E*efw<J=TX?CEgumaoQdTdYt*Ez8FAnM*SR|;M&?!H(<hVmRAjZVUryTN^YgEJ
zECXQNsIlbhD)r4*_K8>8(YdU$?a|{Tj*yf5<pYJ6yE|p1#UJ)ZymV1l)9#O`O4B!J
z9JO`kUT$kwz<$-@i15uN?Tx|Xp607{Mc+$Kli?I_J(Z8P-Bs*sJ<%4a)K}Ux%Ai}L
zqH4RsFO4Eu69b(DRNnq9N>P2by&@*ffhU+6X?0u9!QQIUralpkQ*4eO$`EmwD0W#>
zfC(uB%<2dI1Q~YJ^O3V^@T*-Q%(~!@urgB{J;jYw#o}r>Z*Q+$_^i^_=u_Gvtg%Z-
zOIm-t(w~-R9pfW6Xx-4&AGU-2^7w|nq?zNUFl(O0-&N?Fq>TvcJ(g%>#j8eX%YxQ+
z6>B_S(~DDCzj#CcvO4nj?$QU)(}SwoUT6pcu?s-HU98U+>9zCrioZt9KE45!lH2eR
z<!HN*YJaovvX&sTTNBUKld;R51HoqrwmGyW>!Fjm6aGy#UK&qVxXe=PBIkn7mPYHD
zLE|P1O-SJ6w=PglaboxJFH)Q^y&&R&{U}aA0bi4Anv6_=^8wBUtx&;M5tS6Domy(1
z{s*6h1T<@LZM8-{`dJaw=y#x~BKWZ>4J~6LAO0$cuy==Ey<~<O_n;T1{w_%P8l`YE
zWSFjs9Znlo@>dNc(d0Rr$DfagYYYydrHmYT%y)M#IO7(j27v<Fk1(v~m{@Z6=NFe}
z(}zlg%v%urLA@c+UVSk;I3xsodhd}IjTc=T^DUJ%3bi{6EcY7j)Y=~KdTE4(a^Iwa
z%wu1FExDDpnI&pyqosap`ci|;p3cpyv!tKd9}{Lf<tg~2IZ3cz?pDMZ^bE-630JFL
zt-dBB22ezS1N2M=DsKCpR@yc#P#cjN+zvg8BPiZw>p*snm2q~|+}lw4IO*vyas(49
z>9r`|m4!k;E@X8NoHD3)+pClT@rq@|JpEc)mT%T5GGzfl>_8!M5t}|2m20s(X2~`;
zMTg&w%f{&e5BTl4<%u^~U!XqT|2<GH04V;}@bQfL=J96lG-WVUQqDu$)<EM)w_%n{
zOYB0Z;prP18hSNh)Q0Yau8c)~HF&VaR+xH4Uq+!Yk4K?FP-0o6<;nu~sQm+V&qPR6
z;!_>#zN5Haf7gj$<PTekijyB8qPFesDCXGRl1;MgRbYK-o_x2}SvMDgnI4zL;uj-3
zKbCVC=0iLWT8bX?dOwbe`|KjR3M$ZtJO*Ag@->Y-hiZxsI+oUF6fL)xgJ3J~hkZkA
zCpp^KG%7>b=Ii71llo}n%L~2d%bGzu4SvNF>egR{u<tYmE##sF=+3Xj^jd8w2Gu|L
zpp*rprhMSQorIQnQ5qKeIE$yI$fzGSdGc<X4a6otq&RR{8F&rzRK8I)!6D%y=K4(N
z6}y(WMR;Iq2ynh+u_3bC{%Y#3ntA=7=DBFjU?PPLf9&4Xu9EI+6p<uB8i|}l7(S_5
zx4o;N`K59K=WjO)@BStQ1>t&(T(BWa&nh{QKBq&6+o|JxS8iaruQs7EYc8ZGXPdwI
zi_HN)p!WV{vCK=0d~c&OQy@;7QGEr@q&aA}_2;K5y#aC3msN83y6h@QCm2Jferq^C
zqrTTYAN}Ux!PyW)avLWWJ0BG(5zSdEbT^2_emrL!`FvzZBQBb*cz1^%*IP6^b^(=M
zHD{p#O)T--3s7aB{_V~?&P=ElZi+>TzDI3TmY4$ED#st#YEQPAy({it{F?&4$aPTg
z)XQ00eI*f7^qh^Lo@Z{~l~5Ic0_E0F9K4qkbOP@A)`Zkh{oQx_TpR!6VF2ExpgV5y
z{oQsF3=L^Ng#iklXF%16YkNHl1?k)QeN9`?7H$4~#Ppgs3$HIVw;Wg@qX^8VnIGt5
zrEw(JS1Z=))#U9puuE_GWxnoymB}1?i%Rbeo!-yW<C?+~#yZ$*qtyxjCkADA+nXW7
znZjWq>+|>4V?=6(c#)<noUkw(u!}q7b@V<cN@~pk9Lb0pptco<*RjBL)&KOu*|{m9
z`RM^N(Z-mmu{D&Z^3CX0psbSbZCOaujTUPfL3~#Uz0sQH8A2rx!Mv<KhhewB+di)r
z=O|NAvce6$B=?V#f@v<gjl7$mmWBUaz{eQfESTQN=Ag2PlhGl!8q8-DWY<jBI{B_q
zdM3kkkHiISFSp38MN4iLMo``aGx0?dK*ySNx&9N-1q6wSvp|)k@?qy%dS1@!zk&0&
zoG34!G+?oDm@d|Am;1Q~b4*a`30a^zI?|rpF;32{JErkVfV}hkY!}3ke7RlRex00k
z9XlQD`I*qa3uZM2brhxai-W(o3$1mkUGJc;JC&woN`YJ20V5?I3(2Wpvr$Z!>Zx%>
z!$tZ66^yaqJq>6=+TkhvKQ%22R6M0DjyTyNipYYbyg4Rk9VK&k>wxKg?*)8?2T{h#
z2ElRf{{5cV#T6)?n;lO9@Y>_y(Bt8aQa)-F3O9rQU<wbVjp<x-5&9oAFm`{CY;s?-
zSs*lsL}SuXy;u!JPqV~ilrE&cM!r-HzJSn83}nkX`Q{UESEl>pWLBL@s&5m|tv2#a
zS6g>I!e*{c$GYUtHm9>Yy1nY#+{HiH5Vd^<*sxf84hvXtCXS3J&b&01K_{q`_jb&&
zcwEcchj&afX+uH1jd&*oSRezkoZi^*HApTLk@Y9(@<$E}4h~)g5i>|yh*D#MwtY`6
z{QZM>ad(WP*h<i{>cxy4C4>d476DAEv|hJHnL{VY2RUZ;9e3PIt8oCdzIZ5^;g+9<
zrK&pBCkChZe!0*3&iuV`h&j{@uY<1;k*^Twn_e{VQf=#!>v%8a^6%Rgp05XU<k?ra
znJ=h!fU)I`gT5TSVVXf+18=2%0?(Zd!T;NSa3MChq!#r)*0_`_C&YKX^_7*O8$UVZ
z5A|m_{!7T^kby!X^TaTwF!|g#CUj%(R19B>+y_3;na2tPpZc+t2DgC1rH?XwP<VI_
zWMN(50M}r?h%#o@79?VrN}AYYU7yDp!gus=>w*ydVJd?shLed`{i^Ibxp6q-rNTDB
z*W=6G!dTFD$j61}&m|WKUPY3!T_QS#DAGx3`-#d__;-hFl2LmLyRT|^9f@}Utj+&v
z?`v%a9ysy`q)JS2p<QXu&=dj5b;ZXD!_-5N3NNFr1sjQ?d$gXdhIL<Dj===_<Q}1b
zUjOL9wM?rr6SY@{e2$i>-(n>4|8?XH6Y>J=A9EDP>oE^A69w#9J|EBo<>v0L|K`SD
zWYB>PMR|qbsGDz+9e5o2ciwGWeRROC2SjA^@$9H}P!A-fBj}_<2Y)Xn;o<}Y;>v`?
zDKomuSc8A2BDK<C#)=-Y-5GNBr*W`v-QElHc;-jRB8;$;s=IwS3f6b}J^I%9gTGa@
z(aho30n7+_jzMO1cw~8Wy-l&8{nWCq5XUz!S-w2iG@<zx8KQkS0B0%p`TeD<55~fL
ziiI#U%^Wer5uid>bIJ}~UbYGx7<y|Q3E;KahT+o~b*IsoviJLIgM}^BV96w4zR5a7
z0tR0#sk&W*phF(1?6tL@|2B^ObYbhGY0TmU_b?;v_m{c~dFypp7g*;vxVc_1zlSbK
z;iSLC9{J$Bf-J?7`5L)-vd9QVb@h;Mo&!392MpQ6sHjzB9dUwY`V@iYf~O6DmH@nv
zF8oG}mngn<_>ga{fXnQF*ml7E`wPHC&c&q0cMXZ?)Yn58zC=_si!2FHyNEh@K1Y=;
zj|MCy@3CD>AS8&#-GL>=n4(K0MyBxA04C%I#&OU>q4Zc{9G&g5dkK@bbI2kqu0jTS
zWsZyl=CI8`hXnj%MMEO&@<Ti>J`Z;K4DVFY6QA3SS#!U?LW3YY=>~?UKVBB}WCtWM
zKHKU6W{X1Jf>s&cH4@0;L2<RQOz8X}Z+jpSQ=o%FLw7=681qj3ATlRZ=XUE>9h94t
z@U59yS<&yd%@UwfB{k%MO)#VTJ3=jC9A*$Ac0zZyL#Xb_v3Cm)pBceb(PU@5cG76~
zVa(M@G@|~WFUOb)RIw=x4#XNG+k68%lHZUR_Ow*w;%xIB_+C0#*s~+_#JxU4-d2I!
zDH;kN;(O^HA-R8FEc%k%l6A_jihnL4!2^?nM>uxg8uHCq(01-yha`y()xzuRI8YrB
zTNwz3N(ll)x`Fu3RorhAxx3HH^XVon7<`YKE~7qr1SL+a*W2L}*WG{zd-Bc(%fJSn
zhn2Fxoqh;Vk*=?L{g^@bAob@XfDgzIc3~?~*mTF7pXhfsvy3A*k_pFQo^9K3?@NBr
z2f9Or?7>!J!>WOsPumOj@G0!}lULrTDe1%gD&i+6cO|vzBl=mkDS(Mo8obiXOs|!P
zx1mz%f$Mi=wiKN)gOl38JLpv*hW!<}7&<lfXS)we)le9Gmeu1y_N{>sx;#!s3-Clx
zi{jqdkgev&)DBu^6p;<eo;LHISY*f(e@Ob@sq(d{^IY>o+8oro)u1fExE_U(`~p9W
zd+R9fHF$r%Ws`5TX}EV$`JX5Pp{CX$B~a}DF|c%b!5p#Ueebow-y7LZQF;1YyU@I}
zdN^LwliG;%$MX3N=U+P?E>oM{apuOs?|4jGTwL4+lHq$XYz3!o9ggtT917z3*LQ!!
zE7tzK@Y)Wf=<w-R?*Jb_1@5xeNTx|*@Ey`EAkC+_XTHCKd9I<*6dY`i+aDm}`W1`~
zvaNfz&vB=CakRU=J|^YlE(!GJIP}*$h-pk<LOTXuE60L*Y)KYHcGxnq_fSa2Ga(<u
z0o#k|cde)EWenckPcsaHDXz?tC^L3t^;C8xdths%a0?DBJ32g4d-9<B#<)EA-{G5k
z>f>1o_3@bqS$SKD9RYU^2wJsB$QO!XEpnvlr@h9x&VYozE6M1)`;1AoWe;9E_0>DQ
z*RF)IqRW8g_9Zs-%0P^V`}H+?7Z%eTv6^1>RY}vrnGm$OA=lq_eL{E)Qam-y6I*lS
zxV>&}Zflxsn9yfK-d{Yos{hBcbr@zvAG~>@tQ!IaShMCb$@JM4JINlEnI?qoYpA1j
zx-iT1HtPFP?|#A5Wg_MDogi8MZI&M&<FIJ()eS8HRq;lkudN84I1c)=tDtbdt={Bu
znjl4qgDj474h3TtpD!&Evrs~WU{PlBtTyr`|ABi+e7Y+KpYqhwT0(+wq2U+XF`>=>
zvD$q!$=q<_mtG7+R_gQL3%&BS>On!xo!9^EVr`D-k|hKR_+Uo4t+Uf+KmtQQuZe;k
zdS!B!7**8+Gk0sqLAvqR=BStaGD}z1BS_kbXp>@6VZS6C`x?Yr88{8m%8>kP5*l(s
zD^?(;Cg(!78qNjO#KML|kUIQBLzmK{eoGzx0htB;m8!lLYqjpT@No55-8YC0W20(^
zN7@fLQH8Pv1qB48D&yvWP*Q(YvhvtTZR8iLaK|agybdcXxxN+nY7YMFHhli+YFS1-
zVsLc8G$mVC+AIREeJ6QL%;egqrY8Ao2FU$qXg(3z03%AeM(X-39I}@>n4#uL&K(|r
zoI3)rJ0`6F&+8~t<Mvl^A<!q3{d76gG<(Q0^u++7?EQ98?ybqQio(!eb5FdQ99Mhm
zz<bc<j#Nx{w0!+dFfIJIo5FwZs-v056_{Q~Nf%}{=%HTgA=me1S9Y=_(=>9(XD4+6
zAF3ntN5~FBsX~~K@Fu0NEF~a5-qzilFST^2bv0ALxV(oCkGMDM0Q*%~p0oz1&J4}l
zPcn1(beo61@G~4R)hsCtDtHr~(Bg&lj=0sqsCV#y0>K1eKfk{m3rrvp@dY;<^sNMq
zTv>#_9SK!^V&LBBgw+p=+%_Y8@1WQrQu}B1JZ^01a9OrFB?-_z%fRX<mFAAr&Hii1
zs(Zj~sXU3+vHcS86`5=t#-3kR9nPc`1Q-8rQZvJZnxfqeS69=dJ_Z;x!6}&c`yRV<
z5`=U-MlNCkAK=wTB9eY&;wE?@cpxK(bV0);hA&i<W|$y5_6J3jAeLxskYIwp{*=KM
ztxyKzK{i3%rt~AIRu%N|gm9x9MG5>vnn6ZWeSm~0!g?zsN`||np}p`|CeZb`fzwS>
zbK!9J(l7Dt59v=4slmka@bhEu?myp;N7NuJ3)gGuQSTGmkVHL}PC4V)xd|T&NF{+{
zLMg<l(bzpm_4pU-3%C(_^MBhEyqgFB%cUpZlEV~{v%tWFI867nNS|X}15s4<+Iqgc
z-JnU4-Ko1M*L(0O3KWMtR%;G6xw-;gD-Le5@5$1kuof3kp&S%kYpdde7r~{IoMrN4
z4`6gRdbcM}o{TOS7U~21^fCxwi&RupJTai5@^nXbA~wzw4T4iFpaRMRhR=-?1Hv#{
z`Mja)klPtLGa|8Fo?sLBp*69UFc4p%iz)@%OrG2r#&c`%B;5+g`#vGdfy5=7JOSY(
z&-=&<lBvh|`jmKuse^a#m=c~R4v%I5|A4~N!{cWjT$RXVFY<Als<iemr0XJwoSCLT
z;KWM-#%B3gS9*foFCJ_Cp1r76E#;?*M6s?@fyxm7zrli{Q2Xx>=GDTCF4ZhMRehBl
zSq)|^DMIquh438Z18ZiM%Kzp99Jm9+uZi5%2Cj5$5i0AR1nx><bdB2f8G~&zBT7S#
z;u`K>HgAq8de|b+Oi2u2!YuAj9j+)AV2Qaiv(yxSX@-QcdU)(-7i66w$NLDjgiE@C
z5{!yX;^25CHS;!x2$CKw*6!)?Fb8gb9B|p_0@VWok5@5XpDAf0i~#)e`^QZ@w5&4V
z@9%`c8mY_?9eg#vDJH?8&%n%~0e}<0Te}(ehnW<Rh06dqMGe72Ah2gON{uWwjC4Dq
z`y;usU77;v6U-iqSPi<s>P0j%y#x&Mv1fg+N|Y`}d_JjxPhDXGvMs<h8OT}vSe^(g
z$*a?#BzNy2t~T<V@Xp&epcA796b_T*tShA^%6{K%g<y4o+Q`(*Vqj}DH}EUMI5vkO
zYJ`I`pk)^ACp7r2B8OoVZ0BsCsZ?s?_+x!&X=&&2IU6i!a7{~mQ#b<3MQkd8Q0dCy
z=LbKp&LLLcQP>uc9a_omV!FU;HV+v_kHZ;Um3=jU9F-6o=3uSM2(@Fca_H}!4Yy!Z
z>#pY2e1(IV>!nA^Cj7RqfL-Tc-0C@sn<?|)ut1N_LL>M4dz&xP>jg)_aPaVJJf16y
z!exx1>ZxnUk<bhrl-@cDuWbsA#uA%6EfKb^u=Ln4F;zMoxkKEShj*e7;Rvy5Gri3-
zmjLP8|0T(JP)5$&ss`$o0VjsB<UoP?(WfMX&`;EK4-+bg5+~V~4-nvFWuOJr9Iq1o
zJy{5LIYu;T-2YxBRk{&*b>=mh7J{dR*gV`9IuvhI_#)%40;b@0U+3ONTt~2r4d9OG
z4@xp;J~Urw8nRF0<$k`qjyJ*8-FSDDu51B7_}-dDa%|30&Da%WHj%L<x7iQ5PYNe+
z9w^0TM}4|5t8RKq_tu-D!|vYhuhr=n!t0xG^q?k8i;>)>&3p80l|KhPdi;Hav@*?4
z_M(gu#>!astek_u=?NZvw=qpRw#eVJJ>cn62~;a{aL`CVHnc(FrR5Ma^lFZE`JU0=
zzs3}450hnBY#t7Yh={!k7g`g$Qgv*e&){_zq(Uv0T>_B2JZBxErk)?qQnYG<f!b3z
zJZjF#-IR=@cuz)XXZp1{YI@^_enc1Up5QQ9{M8#9CNdMyCA5gpF%Ap9cYg~!t3c)E
zAy$7Srm-IW)PXbGw?K7Rs#hZt=jEr9v23cRk_KCp4YFV{<>2Rfvj}7`M>Z<>Y(7)C
z1Bhuh1r97501_P-EEbVxJ2-f8v_*gc&W<ZfswKAi{e9=6aK2;Zs150Kuft6h&}g!z
zs_{Qxj<#@#THWh#qj=BLa$_?;7$0oTg%pQ1&VwH)wF(oZ=hN_2R~C6E@>C1d{z&x-
zMQ2V4PzqNTfjaA9Z-pZS25(Jw0<cF}&}nyZ$WA!7jAJ6#pufq1<Bv^sfD80WR2sZW
zA6p5LeNpdYRT}iSI}`b|7@@;BKONj-;fNv52Oq6%7xvBO;vB2RhlH5WWsO|>HYgfN
z*bKoLQmZg)HSSv+3GIgd;TV&K8|Mjpj5Wbw-u}5mRxbq^PwrSh=+7v>l4sNppvORj
zBpx{A0y3Hgr#DQ$DOzXQ$+jC4;G*9Y;6WQe>f#8D>wKc2lJ<Lv@!wDrg0NUiK<mKT
z-V8aom5!<BDt-9}U5I<)U&Ww3pw`<W$KYf?qRu<07)0!E8eV9E5Nj8QI(HPc9}Eul
z@R8@uru;EvnRUau@aTl+c}iOv<{;Cn&5`?2e0W^PtfrdbM$tfnG*7psmDvAkUX78G
zR2okcyR>acl)!{;Mwh57RU_fm$!?;6;xR3OHFHS($VBo3H8x$L{p8r5n<5AI4_Ota
z@GtTtN^3uzCk7mWdgS>Id2CszA&@X=RT#!=7r+1uw20MX&%~^jEOk;Egs=j&_8Kz?
zcfm+4!@{8fYHB>Ps^m8qown+9_qUy1YnBi;j7*PWxO#tArA)kSk*+<^V#<}FT(l1J
znGKPJzDHNe*VyW7RIjA64QlDT<gTOYE=gGkRdz7>hT4`Wj)c6YCt|o|lupswK`+KU
zAg8CSs{a-av<#YIj$<3Wh%W;C7bQ9^b6^KYkcbl=^XW`FKpU*dTJqB9?D_y=g(P8I
zuV<NgqaG_s>qT@0_h4BnhojowMbNMf=F&#P1rexi_x161s%Q}kA^M~WT$NQQPOU>q
zK)bXG`91b_I#p$;_)9@Oy%}<xXYXU8k1Pp-9@H|c$%9tk=o}2@O0&eaZ4_rxT2x#c
zx|*&p>bY~Xe8{vNL7-xAycy~6TeL;Z@~MJ*P5e=6q@c;Y4u7I)*Bs;AhOpbi?uYOl
zW99DCNc8FuNF6woLnRAfhavAe9lBr6dk?hM+qN-?-pIo?2S4DBQFxp%;lETjrHtAJ
z6-N(guH$h2H{<{iW7XPEtfB##=15JCU^#H)wCl>r$AU=HGv$*%i$Y)J;mgpHl}kqe
z3xYc&<q6WQa&ALaiUaIqym4aNYsFwL^42%>Ow+Yb9gMTUj(yX_!hJ!P%7ZT8tlUIY
zjILJx!b=lDh{_z0!RS@aCC^TGVCl14m_t3Eswn7Vx=B!@bw8S7+Cy~uL;(FgSFT?g
z(XSfz{lb0~e(8q0RCWFWYe3Mio6t+OU7CY3HKy<&u9p;00WdG`l%t++gF$`mnDu@H
zy{MRv;BXN0T3+(PQ@BQuE)G%r)SK?myImVO8y$4A#1=2cESgp)*Y;{EmF`vdS5Vn*
z^7h#`<$6C&#BwPiTWgQ@>sv}yBJ_ve2E{<gy8OiUPj;sOUGWkW)W<YGMbltxs-BV|
zrwUUY>{Ax;0+4;xQMvNo@I2H5sY+arI76ewch|bME!ThxY`RO;J_=GgaEXsVNPvp>
z9TD805ro@v^uSmk^n^eff$$W(4poei==pGa{J0qyrtVI-0hZtF2kL4s5`odLM4YPL
zVvpz0CMQav2XfChyATns!vXbNd*V<f?hR2c<bIXp5{-$aW4T}^s^)+b;$GmyzYiLO
z<$r8F*|@)xa4P%+S?4xNY~cB=;+hPNjG}=c)uE#~H>JNRr4DCZv$0&IASf`IN|oE^
zSnfNRh^+M?yc~tBl%eXjU|7^maLekD{wi`HAt`p$*XD>lm<~LC2K@D{Vy<8R7e8}E
ztBZI=Z5(rZ&p8^&mk5ak2V!||OeKOk!f_8E`I=$@hH(ct0PB#H*>RA4vWR`eFI96R
zpv3{JeiYMU*c_D2YC&?#cs^>Lw@!b%2bq^c{jn#i&536dKcX2oD-N|gl)|d}c2ezN
zHvF_F&`wT7{7jfI6DsXYv5-UBM<FtfpJ+Y>@cLHaJ)IE_J`NaKviyp}k7&Qz<qkax
zra)AL3^AW@Bf7x%oqCM|wE;4MyoRp0?ucFJ_+5SI)!zYD(U`ugK~|Km2zwPQWN#Nf
z39`x>ebSww8q$NUc;q&OdLL$9Y1*_PtAn^3So>W_^v%mpq=%i$RLy}kyd4rAZ+L0L
zE)EeOo_8f7N~aJm?&G;}Gbem!W$ZudqtcxS)3^?Cb+&egfSTsJ`H5CY=Okt}u#?BO
zX<C)&lc#e%EzsUm4|rDC`YJ(O1TJWvNE1+)5D!h{`Bjif8CRXsTf3Zq!dX7({<|}e
z+nw&bVHeu4EGjIE#PNBYWlxJ2&|jLBZ-IL%5%fbEhvz_eT%Fgp&D+4!&6;Tc&FRG{
zw3XA(@OsiZ<EZ!Jd^|o8kBFFea2>QQ?!B};KRBXdLb8=)n%z*gi&-&u<)JNz5uTM>
zT7L3dcx~+ht@xAs^*hh(g@3VoiWoYevI>lrnO87e!xia?n58{{e=6_4=*Fxut)2x<
zJqRT&inOc+UQ;NIgf8-}I2qVo_U*1OP9ahubj<5?9cJ&wl`E|z40qOfdsEcnx7E|=
zZnDkes&O^!<9x2r!849QD|H(gV}uS5-N0@^B1!OCKqcfP9h}+#TbBEunFtSGo70nH
zo$QKUJAv0|sWW<C8Co(VC{Pb;v<{;pGOq2jw>?CMK=0Qb7Nxan`UX|S*2x_{`ju5D
zKPb++@(aiuxK7J0?GY_Gi9=!HOQt~VZQ_Lx0p!Hqb3z$v&u{;H?oIorxZVQAi!7fH
zXf7a-afLlh+pG!cOYK|GyItu&vvHIM#6!GMb9>5e;?$%LpQu^ahx%0T#`#}x_H^oc
z>5~yRP1t0brJQnE+2Ug2V*bHVA)^|CK3ab?7doHNn(iAwTuRCwa2?_6t@anxo>>SF
zyuYrGQj@&iv?7YxszM_JPQez=x^m}d6HSRFR*-WWk_3Ev>r!hiL>5$!6aR9>>`c>v
z39l&>o_S?Dat@fD@D)frEM1#gQ7v$4^8<xZI7}hxt<p|5(MC?<)U5~)4mNDBRD6ds
z{h}U#$(p9hY3WhFRR33<V>YZd!W~Ce7+Veqh0Q_wv5-=#j%G6lyGwC^`7^03pqJhJ
z-qnBO?FTDyVvJWn%{j}w%NXDJ$wE;vTT;|`iD2vZD4-eQHqELBOx$6l5}s>kjY}l&
zD*D9X3@9B(oZ29^hC$5bFHS{gOBm(J9@~$=sYJIIq@Xo%;i$wcw<bhytRI@#s{GFo
zB?@VP931UwGF5~$gI1?tV$!T!w8qk`(0E9e8EO^iZ7y#b|K;H(^;!TIW^3|^pR?0%
zy)1Dg;PxKJXBkKR)Y_+-)~ip&U4(|QZ>5m_W#GX$ETqiD?sWPEWYM(U28>$66~2hs
z%!`&*1|6eu%f-5hr@}5<2a$u3DA98jZq=y*TdA}rjv&_-@1Gk(^_|T*5z;-qe%uZR
ziaBd@w8~v_j%MfIAA+1l_Ll&jqZ*>%YvA+>=fyb@FV?fk#)%tEI&ww=&;;S*v8pLA
z-?lGZ{|s9hXXI7N4t(4PH`Ot+`lptys_NchY)h2(lSgkuyl@S@%aB(Ios>tY9S?2{
z@X*dAmK6?{M0XWjWtnk(^pU*5zR&UgTHLYKVB)bd5I1>Jz>2G2^{F4&un+!E0{A-d
z<6Kngq^aZ+rV+y<AQe%S1!0(Qm=5f}Q`=`BJJrI^zm`|V9c^nPRt;ov))-9)DTSlR
zqNvchO|I{QTrDDUu|r#@ISny&TQSee(fDb}5rk~!oEijXnPitXZFh?olO^8k({l5y
zL+){}Lx48l>%k*^fi}^@U4GiJ5+H|y<q^hin%?^M16+M=I5{-erUR$BfSx7(>_Tk%
z{8XFLdZTzEc4In|^9kT$#Oav+c!5hmk1Z6q|NTlG3%9XVN&1UF&tT7xu`=f9Vcts|
zA`sWp1@A7_b%vRp33+}B<$p!(gzj>HUN&(?>yZ}<x5^p3_a9k3$Ex_=^HU*VPYv_t
zKow=ZJbDIQyOuvi9e6bku;>*O*>XXEjQ?9;&(a}hcv|+DMcy~i@G$MQWra-(VtFzY
zIBALm-cAomv@FCA`k)I!*K$b%Eo{2eZlWhgq2MTHT|qR;^00ase3KQGC@apqg4^ne
z3mm;d8++7`5y}z<t*kiwZ4fi>;A17I>i40>GFu<0{Djw+truu`#Vm>4@?l8Yw|fns
zXByvquonfcdK!v+-j0@tgfZ1?!=mZvkt<$dkH@_8qy<d6Y$AhKBT;(HZlWrFpj@9p
zTn81S=IcJmmMGIB!+1!$kAD{%_1_YIX-*B!rvir(YVeed+v908q{ql=s4_?zRDd<`
zL?rXx-$T5{;$Q^gG2h|<6Tl*x5<En_(na3KH%%5jU~K~WB%R!`)dVoW?;NP}0x72#
zFwU|o$ly6dYE@j{0cMhRi}x(k*uP)`oZH}>K?2##FU6|*S@>*hH9}Bv@Ep}!`meA5
zd5jP~md=PfFfEVE#j{Nyk71VQV+a6?iW+rZ034P<;OKd<*wuoagHa2|`=!{DD3Fc?
zU!%ISgF|p<iLTQG7nMTkR@@4bqZ?O^0Mt6@`AtBPU`D3Aq4<}DFfJp)p|6Q|%#VWm
zzl_R5NDH3jOX0P$5UZ;G*^1asVS*)EMQc#Y+W|Prm4$3K6R&fVOlZ)r6kI~7dT)!d
zoy5gf3{Hx(L;{Za>PxPWO(6m>@JC<_NUFwKMw<?)0^V(Cw7wd&H^pgUb_8~sD3{Ur
zXAv8h&=*v(+Gi<!Cd9a)Xq@0JVj|#$B?bakurA`-Ges>>d|1;HN_=55GU4%!!Po=2
zH$*UlsjZ=GonD#y%Ykc#=;sNH;3BpJ)GEk78N566<?%(7GHVJCm?<Ixb7i4yU`+W`
zIriQL(R4@JbRE6QL>nG9flQk?1oSj0^;m#5q5pD%Wbeb2lcLQ><$moafvi8}fb3B&
zJQpc6vB${gp$*=fh{QygL%wknoumR`+NxJMr9aOE{c9?~tUnCTdAJgfb`tSH-p%s`
zhw-yZupg8q)`U!Y17!G4qCJ(rKqI>)(@Iz_SXo{Gbi{*xQ8!8lOoTAI1qmT-fa3bY
zFg7Jb(30UIV#|dI_hQXhcj`E1p}Xtnw8HFZBd@M)DcgtZANT#e!fNB<$W4!q7!b=`
z6TnyrHo+sI6?f1FnjVYTD9ZQ|euVTZ2Sx0Z{O~myYPs!_DLsljCsx2kVp)d+NHo9b
z@;Iu<+INQN=p(-}{oapQ+8vz;%dGu~$1+K{6d~GbI8FVWDx5&jy-Gfog2~?jD(ecs
z1+P~Xp%=D}qaa3jbURuamYqle5t%S$R~Er~V00zb7IKMAP31HXnd=W_8tyu^!)N$|
z0^%uaXSMg%_~{=82;aQbzS}_UKfKdaZmz(oL8V31bYs&^=rPoK8HH24?+&rPIux+q
zzz9-<4`p4%1tlz$?()UCwhfXke-a5$^VBD2^8ZMo>G^mW6H;*k(Z8b5C)N1q0p%#f
zS+J=hJb|cTkP%yjk|6Qg0IKX-g#r?&QxEZGgy$%OtbsBJ$=_5x>aQyVp79S|ikJ-u
zguM}evDi?V@FG(UqoG69AWSilMV)1ddD<GuA;@vRQlKw4w=(Hfu`JhNwnO%lEopCK
z_f4I#Cdh~-;6M4<lL;z83Y$bWKDo5DT5#MsXZ6wd7Z^H;J<=15nIy7JZ~V5rHR1PI
zilv;p(-$@tt`r~L?9KgL#9hqocQEm^@w=6NxYMWAvqLtbqQv{?`W3eQr<HTTVev{F
z{W?cSDk#u0bo(Hm$S@A9!H6y6c<BD%`bM*ch6aaqb=!js1*X_z{KScidiw12tp6Si
zr$0pkt3V2-S9>?iVyv)G%h()fBvja6A8aLc6X0FeW;iG{&X_sVuze=;L%_+&iEYoF
zTQa9Q-EjQ>E?;W$k@R_oan`#QF6v?uo}z8p`^4)RGH04$U6dd%_@)Yc2{s1&6s-Ak
zFIo;1>~REHc7mO22gg6U2{=|(H9wIy8+@LE9|y*7+ndg7RSOe7`ww|ZKzP#TNsxRa
zezT(H@L#tcT$2{*>+8$*<*SAJTy1^^8h))met8cmnN(bpd#xQ~s4~@qiHs<2`*kRN
z?MbyQgK^BVIrxzjQ*!juTm(wcx#c>YFY=ik*pve|243@NS?konS+a3aX(<7UEcR35
z5)RRsGcGg5cjyWBr`Vt2=mDoSFf*%a?s6Ht3s%S9ZJmBqv+KtXi4$WOy98=5sj*FO
zy<YL|{joJOAIJ{k7wGDAqQ2md;owk8$7kh2aC$YG7mnl((_OxL-8yg7#blt*y#qT-
z;SWe-Hr7@BS6qkuK$4pgjYwR@UbS}ZZ46o#UOr6M>^qQ6Jyd(y9K6C;cAhJ1^5B>2
z&48VfGw(z8uXpNH>?I?nc$O@HorOinUn}OO=nP)qZ;OzJWRV46?N6{WA^*(#8ALcf
zg7su`s8|SG@6%kl&4a%&aw?Xs^-U)%LKJ+ea5$f?*}G$F2$Q+q3nOQJ6!bs4-r0Kw
zA#<rp<QFJS;OHU!qTUwV8ONmO(7^ElYPf>E3Pfun&^vsQT8103((C2_jx5u^1VUh*
z_`9;;CS>uAntcP4*mioZ3Mh$Yj&YDA34=NC7CpC|8gyXffb7D}eBgURdGHf(tEtXR
zX*UZM9vySolB4)EMePwAqRWvcE!;@MKl%;-AB#F2Vdt)EvOkJh88WSjuBi2i+e~J%
zq1@~a<r7v08S%W$6Z^vIFAd(oei9V*$3!+VS{xqd4NQ*G8Wm=rMx41m0dOofRGOeR
z$U))0FYM^h6ZZ+2YX&hWSq5un@+zJXITDT-cJ~D$glHf)BzDK<!0X83G=8bFH&uA>
z?pSYg;GlKu9Y>%H0f(+ED#u~|J5u&?Ji`@tfDRILjER%V$^Zf4Ls5|j93Qu0yIl4E
zZt%Uc-0a_60CY7~<m0vJ0JGb1*6Kkfl7~{9s~X=5K?$=;Z-|{={X=$<&q-yB#*~=3
zaTjOHkfU>l9|b|k`_;gIC~`uf=>y2`1eEg2YV?^a4>5OL8p)Im;s$pX_33>mE4u?O
zmvR33p+|5O^iI$f?us~hWk#!9uRRXmoy75u@4lfT$Nj4qN=I*rH-jv~cAwn#A<uA;
z2-S%IR;A#RP=1y)%Yhe*#>_C`<-<R=Hng<l2zh97Ac@4vK=2WTaWLM;UyOOszn^z7
z8+Q$20(4KukYNSzi0<G(-n66GoXYGNK_)CVTz6M5>WIXodtXo>Zf*vi6cH&c&=qn$
zZTtE`i;RU$d4x(rQc@B%^}H|r>F0M;4(E<I1h%%eUWxpU6>Su5fQQn(Id3)6T*#oE
z4n60~QX1@G{uIElY~W``?Jz-C$`b(WnG=5o6&a(?s~D>~3KZcfZc~EFy;DT(kyK_u
zPP(FS9{0)+m*R#Y#yox-+U-`Do8eZY1Yk<Y7V%s!H8DFlD0=Hd&1Zl7NdtSB-J8GA
z(UJ>IJ9AVW)ZR`SY@Dt<C2Ap|ugOTmZrY)8;t6sG5mHfE*9Q)(s5$yu>na#X0a4W&
zwCTNt{o|lCaxKvcY}X^esNxWbLwi?QoIQ9)R|o>h3M4WhuVDb#6ZcaLTqJQB2<xWK
zli8N}dlWUse9J{uOs5trumkFo6cC<<!E!j&2d+J@!3B`uGK@_q=osQ@4jVwa^t$X1
zb-JuzG@lIQekd%w<*FpTWc%zBTT08y(AItv0xF*am|x-Wge&2EXUv}c79J=H*A|mW
zZ34MvB_*B&Q^SbA1#;rzac#%~?fY}?TqQge)EB)fD=WDcwiB7dfjAY2uX6CzJ_=%S
z)IMqUgEiQ+ZiqozQ47k8JiZtC<OApsiy*Hz`mxl};Yv<U&Q2d`ae{adCngfAL$PG^
z(dHe4moQQiYEqeaT8s(5f$@uoMI`N}q^_?;-I|Ar<2bErZf?%@jTRjo!Z6I@A3KeB
z{nG!Moz#@8gO3rqe23UY=I-tP{+Jf)zh&Vang5Q%z|HyZIQ(}U22KL+-~Szl|Bl0d
z$KgLGIdBI4bCLt=@Sj!u&no_B75}q}|G%(`7r6&pa~_0=HT9iMnYen`Fc+82_Z_zx
zo;~Mmo_}D|s*(KZuO^*HO*GsVpk}dQg}D49yWI%~w~Dw6%O&uyJ?9eeP|!t-wNq&R
z#%#VBdKWr=y-d3{)#-|zQ?j;^PmFKhnTNU74!Q3i7^QR#(p6wK+#E{Y{XhS@K*W;o
zbYeMJYDDysM{_QemR1rgkeU_(#D0Ie?&Z;)kt$%SEG4N2OVUS5O)my|tpJ77fv;4-
zsf`Ekl%Ux90SJaNR1_KJ^mtUSW>FDQf%nn$H&ay?=D(ESQIJ8N7W?P3QVDGaHPj>i
zcRj)}?BTYcLG2a*!gkFZLJ?vXuln!T1B*ZK@Bh~0|Ksxzr4b;;Fzdw#`$Ik0<a;-m
z-8Cq9iY5XIy+a~vhKJE4rwrZUuiz9Kpg6t0D=ydM`%kpgWm1KMIPWM=8=%_74~jHu
ztfoHIL`WlswsR3FZ79ih=38DngMKM<(A1}CcY&M^a&B=$DXzpVV$y*)LlkBd-$Aiz
zbc<*GJ{60lup-6s^n9Q&nttyFsWeoe(Gzn!M%F_iLYTzb&^Rf%wuL(HA#~IUp_{{D
z$)t}!G-9w6L$q|zbP)4%mZYgSf$AviXc=9lu4Srsf3gJs2HjPTof?U!P7p%@Rl@*q
zUa5-~eKEuohJ0^ye(mq-=LR;IFsTxG;M9RUXy$aduxmmm8kngf|EUwr|EodySqFwS
zwOpbJ&Xwq)Xfw}~uCGF!Tk6yKsZr*&nfQ(Q)MFpGzB4Ehu<;B@Q%xcr0@s%&rZlN`
zbQVgYbDJ2eJ(+6B%FRD9u*L$-il*Nx!8ACEb*H9B>c0RlNQOw?)XAf*t=;(k_X^&9
z1b&R}tYaumT^K(jYQF_ki67_0(N7?`C=w|nq6s+4?O%2|#FySior4qy_oI-538cQn
z3pc<w-{W3)=sireB4Tq;+Z(s9iW}BZ)|T?kd3g=`+OyFe@L2UxJ*q!hSOsF5Qfd5-
z<#mQ(Q*oS_%hc?R2F3T!%&Mqqm3Ul13csziqe(c=WJ=_$OrPzF{@SJNs6%NkSD?NU
zwo<a<<X);quzH?PwBNl9wJgG?!2xY$v5Cf1NAe%iT^Nsj0IL4pAm=W}5RULdYZR##
zv6FumM3|OL;A27$qE<nogVY~IGAB7`s$YeQyRyf>#gDQpV4{890CZdB7?moFI*Hf7
z=HNHbvv$bG2t(`~!rHi`+YK(#E~<;*)Ch#<-jQ4mLbI+FXu#-qwu#0N#E%aMrG{iF
zb)k|d3homrFa(JG>l~hn&?!GlEf~%}z_vROW`>Hu06hW-xFS}&DDE}Y21&4oP4ac2
z))9M^q=eY*=qP!5yqQSY(I>yWr)o}+N=RW{#UD)SHb~s4_@akm{LD3rQKLK>4}ud_
z0nmxC)Y9Ph35iUj6EdnDl}~}vtFt7-3#p@b6I3z_XK9i)3OJwxG_?cux2d}rH4S2n
zQ=yKPL81#aI%nsB06<5Enm?(SNhD+}mpcx@5$Gxfi2d6`DRDWXc$A~bN5KBsSbB-I
zbr8vu$36as(v{bO_K=ul@UxQgOe+(6Mi!Az9@k9W3q~W(bNo?3lfvy<jkZ?e=2OpF
zI|wsJP{epc=Y~WPT@6Pu#Tu9e<&AyOM|lUcXbh+)2hs|}uz(o%Qp<moqR=$7hj&L#
zfeelrSa}n!Nnz6^m*lTT0|NC2vpHyfucgMh!jzwDd{`w0fj$zks@Rrs&1mZgw=O3|
z4=`eQj3+AlV8mk`dWqT(?q_rpR)XM4)DLQ(MOECDnw+6S0cDWogLYvfXn&Cti0g*W
zE&F)8bA&D4RHfO?Pe|cb4be798Upnrf2@BG$hdcQooU=#P`7M<lz$#rjXy?qg`=6{
zUJ|N(o!4YgEr|y4td`6o5w}?xXq+yX5UzN_8;u(QVwmt*O5M))zji>F@hF-|W<cS9
z^bV+#1ucV$D70LT`bXN3VT{Mp86Amc2CZecqnDr`s?a8L7ao<mn}|MRP#)W+(MPgF
zG!-NHxh%@0swNekL0A{EN>Fq`L3AZ7;4`zNDkbWA&KF`*t#H;1$aInr4wYi48<I$`
z?(s{1pU}k+wQ+3T3AQ2qrJ9#}?a*cAicgY6rPm5V*SGMq>Wp-Lm1=ZAc7FG<<zT=%
z*@fCj=l)b0uh9%OPBsiQXX37lAo-Lv*zqxo1JI~hLo%Jvxbez8(_#@I_HX+~FlcW0
zc~@tO7fRO>w{ZugWJsjZ8`U`CQdywptvahCXxEwGJbRGfC1caQ`iyc8ctEzSuGA<Z
z8^js&#-Kpc8m-7Mm}a|y^@h3~H3$gkM`&4<2w_^!4sL&+1qcIUS-(wSWCer{9OrC+
zo(Yxl>sR~r@R~9(K6wQ-OBxoy)Mb(g#q?58$Vx{R-9e?1;}5G%8?e2_0o)^#Belk&
zh<}$^j$tC-Vf=AQc2O(b8L{U;0~bdlTjj%Fzx`Qi;qC|duzj=WVmnVgO?_$DGnJ+)
zPzOGMDbC6Ofht-rgJT&^4Lfz9x3W32A$U_3uFE)@JR&QIPd5cuoeUdM-NCG1e)eCg
zjMbm0<T}oI1NBo2lv0mk_jr;uWGHBU_ID!KQ2m&GNN)-x4BtafEvE2KIJbLepot(D
z(6US%2L;Dsj&l*oTA}1GVQ>`;uEn{~I^-Z?7bX`goUIe3$0q6XQxzawQ8eOO$S_Z7
zFU_Gg>5rCU9FwB=@aW1OfBZgRcN9e&@|XPP0-%OxH6NUf4D^WbdUjBO%)Ab10nA{I
z&EsA*JH3#4o~c)y)FP=>i3s+axI|gRh@|!G_b4~c5y@W-WAdU2Brs#uM}g36V3XEw
z_SnwQ{V&mILT&R~&GR;n3P5i=g+G+GDE}j*iYGg;^{O)ZZjHV00n^S&6XOhw2(5-P
zkjvUH>+~+bk*41G(x)bOFoCunIv=J=h&yO!_9K?TO}IhUo@`x#2|frvYK|M)WJJ*I
zUeykbvszH{CO7;(2Okfov0;Lo;6GHu6WcSX+l6FLyC5(H*BzDTK=KRZ-El5FsIZMt
ztDx?gNtuKkH1j_oKs)5Y&qQv7K-C*Eh@@Ty_ciEZJzc^J=OEqgLC?W{k5O2Pz7CLS
z(97|b3ffcsVB&l9W9U%p8b|=^;DWNTvccI+NUi!YpSYfC=U^_hV+_|(Fn_Yqui;B9
z3Lm2uaA2H&W@Tl`MO^?ROW?IxljClL8e{E*a5xktY_7sc3f7tA^oskLQ3sZ(YY~Dd
zUZ)IB1z9}wzJax;+Q|8RF77VQgrN(T*ZO1LJbK5~5XEI><l6s;_J;1BP&lYjj>-w(
zBv6yRpthu8{$hl5MByY6k^JCVneE-jj`~=tl8Ok6x_3!gYKq$LgBQ8=_0N1t7$dU_
zFc1_SJZ#8qQ6KCYFgWvtes9eN_CR7>mQU+SqOce%yu=bGcHk?rVnFumX%M0xkNDpo
z&lI=hFUBnAL0{k4L$qZWW~=bvV)=i+{(rR|WxGMNCAJ93%z%4fftYTr9O+yHWesN*
zyO5(J!51Dlz+3%DE%=mTrF9_1kramoU3(l$14t+Gul?vqR++kp5jG`M#-Z^&m-KB(
z+#Z<-g&SmG$OoXsU%NFC?WZXkZ}hVL(C@wkk*-;CyL&_p5s5*N56LF=BxQUYB+PIO
z#pc;KfLf_Q;U_q$2xauqV>63e_cb*cjSIC+I$T>{9A_F#nP1B=Zm+;}^MD~=PU<}{
zGDM;uWGsbXxON}H=Vqgsm9%z9?ID9=iMI%Ui7QR?Bx+tJ27YpXXGDZWKO~Oah;vK9
z8S(K*E|iQEQN^iKiD<tTU}77aYawdSp@@YiXkL9~^?TS6Ub9GlF8Yw9@H-q9k=<iY
zR7=Ea<N4?_Sk%rM1y5^ct|;RLvnW{kE8=vms10H|%C^9a4uA>|+J2UuaAue^apY(e
z7GpnlQ67ZOl+o*dJK=AaAVso!lc;Lw4w3*v1D`OP{t{SkHSp$H)IUS!fYcv+5aoth
zKy|5u8ch(Ra(5tG>cD^3LhMzQQUfs0NGEy!<3n4MNqkwa;URRrog>*eMAR_@YWX@6
zJ$60)=Uhr(Vy4<rOanD27Mmo{Lory~$0!AEl}JLaEXt{A=S)gx#W>l5juee)%&d%w
zXq!g&#VT>bZnfo1s*8Xq>AXCIb0JAmbI?HRL9^0sI=SPwJ?LKBk#Wdz%1;<pKfD`@
zjqIA&Uj@M<V>D=b(eWb9CbUYEzX*UeH_D!e#zPobcNS0W`B>gv%3J6lW1^xrNhQHH
z(W{BYH{1`!T*?PVMrg3<ua@gyNDAo`qO*8hd@vTLy(U<Jxb_^1J$onx&55BN06I%-
zk`_lcaP&b_@y%?{)q#1Wuro%Kk14iCa{r*TY8xFE5b7<k3W11$q|kd!ftupaGJ)T3
zX|)BBwGefgQ9~%3Lp{MW)}QXSO$SeQ6&=VJBRp<T+H(7wEXp-3Ue7ohDsBd>;w?@%
zhXsW>bL!MJGxvcn4Sm{$Kzv^qZgFldS_Vp38PH&%3ASoYe#rRAEU+@b)$>DNhpDSk
z@gBgAp?M_kGVtU)x+utR{g`xI|6<(ood6)lox!AQd-4*HzS5&ihM)}U)hF$!gK59t
zCDH`ggWH=3knxx9k7BXgDHy>+mHYRQ_y^dbt}N;UZS5szS4wT_M+zV<c~P)5WY<WI
zFzj0#ltVbI*2E4a>P9u}t3n?pW!d==I&yUFB#pRp(nd_zya9d47rBjluW<YUrWE{y
zi7OntBP<A+EP`kSUaJLNc5o&ANL~veBZ-ufN<ujdNRxL8f;m#0MQ)~qt`lW=SJDZf
zE-gYVupVI++N3cGu|V{|){T<u-U!)dKLSRmQ+YM=C4yfm!^R*fH;S3bqI~N5lhNHv
zdS9gfiFmRDidlc5iA9M75jJsQL+_9nA~j-zN1AfF<4zUH>hFHx^4k^aHklhU8!kbM
zH#x7RFsw{C*8$PzxMs=&n&zO%GQl#Z#OoSFbxDCI4jX9>+eCs-3b3TacqZ`|Hm4Pu
zIV8p?QNpc8u4*F%@eD$LUc?|RJOV3g141O_$>h%SB+-LFh92bPkf&%Z@5v>7TavpZ
z9RgZ33gM-@W+UuHh`jfdtbK1c3B*t=>IX6B7oAvSY9C$VEj@yX48nvnPiTii0*Rta
zx?FS>5Ekj<ny}Z8zjb{8ad}IDA2MHWt5O4+ws9%scdFx<UGG2FaY_$K$+PGV|G<e+
z^yQ-ea#|^DW3Fv_Gj4Yf>?Wti3~{4yD;jLjI&?1y+|O`}w@7I|Kn{E<kaaX~aNV)1
zwK7#b5Nx9M9%y_?8nw>JAPGRkQ7>{;)U;F@4kVwpiAlz<4FeaOydfdXBRCM$6@e@{
z3a5tPFe#kS!kG!^CZmpMESUn*KT-uj(7BMD4>=rfh>Nm07|nPDh*eWX2Qrfka3uXm
zRthhJC2&qci;)d%UkBigfd8w#Z;#9Q{@=gx*$gwYi8;*<w^JcQ4ykMz+Z`R~q?61k
z>aHlUbYd1ZqmR3Tk!lgrk#a|(+hLQW8afwg9q#GiPANKnuj_3!`~Cj?{_}l2=8w;Z
zO|AR=e!ZTD>v=t|%U<D&e<tcDk`6_qx(sV_ZqRq!fZCIKcHH*3QJyUDwYlmJex}jB
zcgC}GrP#&y=DqphS`Cu<l->NSP!3<-^vy?S;^L%%g><4H+<@9YVTUb#+KM?L_(5En
z^k9N{7x~=uTOTg0yO-fd38Qeo#EtI?tH{{m?FM&S)zhtlWvOf6i%Fg!bI!)=*Mas&
zYU7O|TvEwHiOAT`h1Sm8o=#(Vc?9y-2&46gm$8EM1K>O?b{esbXGZa#nM1ifs``g@
zd<dTC6Rgxit`v2DYSfmiD0_jo8sOo&1Du^CVcE?NP9me-12Su9=K~POotwJ*i54aR
z8$E+$Leg&&$@)+gqkx`V;e$*SL}_q*e2NA$0^W^Sq<HOt-HJ7@?Jv^%f!GLMym&%*
zUh)Ez!h7`7&^?YFmv-4Nd%*-A+cr4U1fiAS;?CDx{d3%NCe0fSOAZ2lGtMQ|Atbcq
zIs<)$u~#+ov%!T$B%p|8VX+@d9}BN8)HK?e`xKUS3&(GUzE~R_NvdwXYvSqIX1%UJ
zM>ht!f`>Xp(>@$1i&{dWr#^*4lF%?YSJ|D{f?mev12q7`<{)~PozOy!k#6<PbuGDT
zx$l9RT&S@iDwUtmf(3Z$^(|Gm8g=xlJUb64pJ|3??9&ODo(!&Y4QcM!t_ws2Qz8=O
z5-S5QeQM^uFP@VzOi^v7Tr9z#f+7YYW9e7j@x22i(J9CeoAi$zpnGcdIzxu?H;vzR
z#LMCm=+N*>c+X*oucxtNjzj&vxrK#GzV@Qc45yHGaLy~@`9!iamC=LYE}Q?Htz6Yb
z?|B5cF)>>^<<Gb?sU>wNI5q-K&QF-fNX6AqnIJWeJh?PKD+DrQH%DeCLN%FxeTkDT
zBt@_XTR$@X{HdO4q0l9y(#&-0N-%MuCH>pTcxdq7Zhko`x6)oGV3_BJHiB*swiA@t
zQ_W>Hh{CZ3NzQ}f@#0JZ+Y}Mu*JFRNIXKaKA}}&03&;E>#TUH^u*mo2oFShNn&VP7
zALkRvu_Wq&d%=a8L5mO*9zHJ0?+SHOH^G({JACY)&P8$Mo!%->be{Qpa!IZ0Vteqp
zDOG^2(48k=l#OAA0Grx9%!jHo1)l2J$FS42q9N#*Rz4PZPy-hIF=pNpfMN66$F?aU
z%7oB9Df27eJ-$o@%ux_KuB%T30;g@C=;@Q)`c>CE{YBCts1mn8Q{o6_6=K|TyGMBL
zj$KIhSpdopQ#Yuku8^V;%gp*3xj4h<fxr9*$mU@H?VoZ*o_7+(t8-(}aSyB6e-cY<
zITQ<71YFF5W6dgLj>Et>omUQ(dLi?5EDf-m{ZUG~>CWz}ejacAdD1&ir7X}}@MFMs
zblK8-o#-iCw+_WV`=dX9FHX4+plZ6Wrk?tLE`BDwr=CBAQ~Yu6y1JbhdkW&A3KXpr
zp++&6WbFqe<vwBz(R;ig&V7DR2YMv@+SLNBttp2oQ9Deh@pE4Aq2cc&>k;OU)Wry(
z<xmG~GLFKeZnA{?64@Ht2NHareoO)Dd1uRh!3P(N-z?WMUJC^8-kTW-PhE@7Rn(}Z
zd<a906_C+6pV@4&udL`>bT{fAgKRplH^xVzbuazR>%4B>W6#d4R+Bxrgr$pzhG!_G
z!?dIcKu_0$fsfNFrCy*%_f?_!LhKV%WdM<Xr`}f=RHDxg`Wo+~8JZ7b2}SddW0^a2
zjsm5xe=Fqy9&L4MMVSy$`m1{JVV*;{BHw05fLrdmrM|Wsw=?a7Q^+wPM1eUqVYx$r
zEcA8uPBdY<pSD9qcm?>?ra`d8`0MFqn-YlgUWs#|iJUKym2J5>6sUUjr0hlT!nluD
zF3!Z(VZp*4;2twBcwyoAXnxYC@LXQX;hQ*<6S?0Gj7oGbgY<{R{Cm+5<+PFS#jxuP
z(ruvM@%!*=Mu8$}tC^=bil1~Lt0V?&$KBx^F0hQk;BHZs%CE;uT|?uIzP+EK3ZeAm
z8Y;8HE0H|FUv=Xb;se^cXKUprAPiUkG&|>O8AV5tGwZCIsX5x&bVRXSHg3zcezYk_
zv1pT?;Y?7R$;Sr3%r|TuW>YIS`87D%Yb>?0sYjn;#02W#F=ewU+O+7IehTEJsy0^1
z@-ftyF<d=Bv`WEfifv^Ht|##)PMFwrMJmu+FMwtY{R(Q3qwnGoarT0m_C1TfQADUQ
zZrk_7l(EM*Q9_j_I8WA~cIUoS5`c6V>I{JZ>N4)yJ3zJ7DO-V>hQRtn3B`d}-y*8#
zAUksgQ3J8jY;4?6sGC3_p|{$u72cGa>T4C;e^axh;;mJR)QYNg6j2fql=unUPPsR~
zGGvIz`v%<PHJI1%=4k=59_9h;W(N~vU-nmD${Lfq`}d(_k_U+3wUk>>VLDSZ(F}t<
z&JVc|Bm`LWDY+<-6!)5ejU7Wd@e$h9EN(P2gQIB5zlCq4LDedna>%nB7V>*=(n4`2
zh;u8diEu;hDXriV*BvQrGf4eEBE2Vk*L)((by%cIv+#rF2$3)b3j$-D)|yQG>$r=g
zUTn+?P(E`1K6_sJvx6Ly!0uDnu*RrkJs@ra^a<R#p*EYfvJ-eT1?yNXQicSV&H)l;
zn^AnHKR=~eO)*<6Q(IT1od{wri*=p_M9YP$7++_F%*M_Z9ZNM9wXy-N)KpCp{UUzz
zopF~6<TxL!rjd;4<AAQkz~nD4Es<!1r4`yl^RovYS5_j3c~%Utrj!)zoQ_=j1Ru(v
zfs4n%ma9_>TJm>SvPmmOm|tcxdZ8>iM_U6rI7Tw8_Dy7F_(7wWcvAGqx-bEQ8)5i&
zXt?%69|-Avq8I$bK04nLYlSv6kM^~0y^nHD+AGTssVVl;rvdi=>({x5XIG%`dhOTa
zz@`7sj><nI39!5I@1J|SBjK_Af6pV%0<@mTl}?;uK=SG+Fl_F&OAd}H^$XbslgPGv
z0lq<E0UQF@=KSnf))CEIjP;KpZEnQBN7Z5=19d<X4aTECTKb9f4$&on@E&GDw}B>@
z;>Nv(xY-1o4D<dT4OKM~m`&YIreJKUqdn83@g?0wS`t13G=WLEwuEsGV_M_@wwSM^
zSiK?OWBlUj!y!IY6Qy*HSc1dmMx?|2AOvf)A=v)4tcn#YSI36$7*u+TAOK2>YP7u?
zJAZKi#wC0*j)1RR@jj{40^BXg#9`)38I@o654SPPz^n+RaRh6s_;k#}24hpMGZaaQ
z4up3(sCKBn6HF|e*%cZt(@D};X4f|@l4|MeHV(%`F9Z?Yx9XCn&y!`GO%ghnw*$d2
zUsZ|cUA!jRq2&@xGX3IBa=A_~W<iga5du}LMENbGLc3KbA+D&e8}Sjr5q3gi_EO1U
z76e@&nzx>A9uOL5UwJ~c2m>AVeTc86Q6|PR{+>YN?ZcnC<B^?0JsoO(6S$h&jX{$s
z^mrB>2u7PpC|%V08}-KmcfKzAHOAT@Jq^hvL@~T8hS=XGHGw(|?9F~asC@NnSNvDe
z1Ls~xM2^7xX0im0Q4=!XMzCQh3f6>VQVrcV>I_gE(&d3R+m(o}dI#!eTzsNezY2sA
z+qbr%UP!Ep497#zkuV%NAnQG<>CnZNDdio}5zL+c6uo6n61ozXnT^}=-A<!krjZa5
zuMAD3)WVSFBAl^ImatyI0^sK4f_|cxmpWcN@RUWNM-e2uq1(FwiO>o?d_sDAEl~@j
zhTi(=@w!M5IChPfurywO`@gj40bZ2N{vSl4DomP<n<@t0V=uxb&(OkIsC9{NhN=dH
zRx<G-&m0j`%z8yDN~TIT2>Dh+z{6JgGme<jro7#P#F&GFe+?6Qf0k7U(<O12PcJ`;
z3gX!T`?5GKaGIX-N>R#gG~mjQe<vG7NaoPkZiev8RHPz}<2lVo6rB@^KfB|BZ^Xko
zHEn!vuuR!+GEDjg>rMijVs3PT-Ec0u6=<tDp(d(NA-=zuTRJf1SAIlsTfM`gP-G~V
z<}QLqypGHv@IGOKy%9;uzq`D%W*$I&L!pa@&YS~Uuhzp(tw1?&ukR4HMGL$wx%L<&
ziy|Ka<<7PqfOzAWDVs=b4^v!keEr0>#%<x$@W4cjj2ehlIp*Ktb}vdF+V@Fh+%+Yr
zMu~fdf{AH;fvxC0xq+R?+x9s|aqrf6qG`U5VC0-+jK}f-zoWDY7qi_k@^cRKNwMUH
zsGwE|<&;cV9fWiGPJMVn4JevUql>0Y2fkA{2|_F@xr{tCVF5Z8iX%fW=Qa*wG7#b@
zS}>s;+^L*qePIe2MnEm$$OVC#!UZnS?X<eI<r@?mN1*FsRu>A@Eoz~NGbwb7%Z)zq
zQ6|X{7&@PUpqj8vjacE4fXio0cfhGvAUxm}sSEg+@*VlNRQO+B{dtW>((zCf$;M+9
z#JfvtIwm4=YcUc=A+Ivf5Paw0RMOO?@>|3aD4y|gT%8%j0;08W+ak!};KHvjpav!C
zAsF!#zo{fD=>PtYG7{SSTe;XeMk~f)Gu7$P$R@hS6PE-E$ouiitdbQl<^xKUQ_Ilz
zQVgeRi2chOD4kIrQe%_sAu1sgrGbDlBZ7TwNWR6slQ2VhfY}JeK)Jn4<{a&dBuzl3
zmAFgBtiDhf)+>6t$9mg~MBNWLp`M*H|Kz(h5<Q(TB~Jf_kMB0C*btMe#k<0C7^w!-
zm#Lg=H-)LZCzHK|GVy>%A7zQ8p*0%Cxcx&Ka0hmTKJ|c<hLZcg5Dl1(?q%Gz-@ho`
zrf3js3Tds$W``m&)j)QpJjZBv`ksNqa_}QmbMmys2kC=3^J;-L^Cj&jq2Izg>C`d-
zLOic#1Hb=<Qkx_lu`tyApq4VIZrG7doSm1v^B~|YB}5)_I6Xs?X*qTWD@XGDaL_Fq
z+L;u7?oqkGb4;Fq3llRXQpf|KC`n|RzRwPndMmWDldm_3MB@S^Uw&bRuhJBNO)>{z
zm2wn@hy=0FaZ!D_xT+=n<!_ob5Fg40;J_z8Dt)xC52b_4piEd-4>n8s#R54Jq07uX
zV#DL`Svc)?K}RD%(;VtM+d}282??EwBKZmB$cnt{&G^3Y@>VjxsBy}CQdm0{V)<ls
z(QXLjl{-kZgMC<8qbH{0W)vm{5<vkMZ7)5gv{eH{YYd^rkV&c=6zI^%&&u5Acaxg_
zjBmh^Q?Iwh8aGhfmb(6UwrWNVBzZLhnRL4v35U;Dzlt8c)pE_Ek1O`*v=?nY?A!0Z
zN>?ybw07P9xUwF?xnDC0U_8``oRW(?9f7kxlaLqd6>mVEf>t?eA|P~RTv1<Mt;W*a
zyc+JPQ;tueg%ZhHNEW7?8FHhadRsi`f)=IE<*b_aieY{~GYiljD4kS9MhEHuP`D6|
ztv#WHTEU)3oU0@bMhN;_UC*W}wlor%t9RwtI-Rp;KCl=VkKr4m_s9*o`DC0@{;M2v
zk*~&UK&Fo4E9NmxCV+WkxHH6Qulz&Ls>1<qxA4bgzjh@Ynk^Mwmyn+ewZ}X7><;&X
zn`+k#@T9U>y;Bef&?Buh87bMF;3>t9ti?d;Th98#65R6#fCp&t$dpsDEtckU^+o5M
z{Ie~_0>$9R2bfRG4TO@+$Jh6;-9%L;kcEVRga@3Be@-1Km%OVYQG~6a{R<&am-|n2
z>XK{D>RQ@)m}4EkHm|Sl+CE=j_grvX+wRu2$5(Bobt|SdSzyx+KI7nhpG_orpwzcV
z<29QzYBZcp5I#DM<Kju-X|%-~P~S40G)?GvHo-rY4HCQosCo(5mIYd54~ii>qJ^Cp
zI@|>YNqZG(=pz9YvvEnCNVC_9l2X^6p4O*2x9-$-4`>`Xe(M)jLGfySU)qYcj=u2p
zJN@95l_TGXciJ;$naPl#luKV;D;X&t^T*157Y%+I^F_b&GopSpA8vi{jRX6mT!tTs
z*)@Flm;U7wzOQ?G_JFr%yMI;X+5PNMbGmAQ@~V5z%t<Px@1jh6*ie!VO@2Egm4~yj
zWe%(8;+#Q0T8RWwx@iqfEl5;~)h)y^TYy^^+w_uWd%g1;M_Xbu@`4dC9B5s@Is=-!
z>w)f%hIcP}Q9+3dqu5!1SV<h9M-Wb9FdnJ&0_uo|^JtyNlLuip`?0z`;Ca%VbJe$t
zkjU^efP7^nk+k#_ccG9H>MKmJ=ap?)oVw4HUr)X4>YNDF4fInMJ5AW`gUFa={+<_%
zR+!+uF^+lybx_iH=b&G>af!50;GKslK?T&*fW|fmi=dKD<W(hyh=gQvSRj|<uYWE&
zp#Wyx)iIkr!efHsOIYf2TocpU8zIgu8D6{F8i{b&den&$8Lr}dv^CMqpBY1Wj}t)J
zt#C+7U?(S|Q;#F5k1r(Q_Mbw1OeGycgL8nr3j`sKm#x6yCc5Aj$w|Ffg5*dGsE{Gg
z#X>cLG`JDbj+!E<%LAc7sht)9g6t{VUm&Ior%O6(Vt7H!g(PAS4X+g3I*$A0f)S&m
zeIbtW(7l?JZ4*mMQ=I2{x#YJ1x}!#GChgl$aaB`D1KDSA1}4L0WKr@Z3kG479-%1j
zJ>Ri-V1y`8tZ_71*EBL_4sI#+*g>Lo_g@DbF&hj^^BI4VSAbjv7ZgUK>i)VCG96fX
zQIU^xurd@`q(=IuQ!)2O`g}A>LmJ2u0tHSMWs<rHPmWJB2{$jl_;P;`-Q-qbXVj^K
zfkx?+W1mWp4NOs@_o8Ca00Vp46%Maw;{dRPm5>R&5$V2oW2kej_Y96eC=f@67O<UC
zi&3>!i=uxg_~^8!--ZVCpnM%vrPnXz^XPYwL_QQzG24D3HwlAC<D|JF(<71L$j6o?
ztGC~!8kNOjUADJ~qqYrobGMNr*@O~lq6FJJ7qi1{JXjL&(2@V7|9HI*xX3vOKjex#
zW;+8yH%w}6P8>#{nEW*LfJ8+Nj$gQ7f)ZT5T;cK%#8Vv{$;3H%rrQIYkzuLCmV_aq
zTV;HQR91x_G#mY``Q*AE@34VTE1_m3wGXvwU(h}b#PuwB1Auf=Eu8XH=)DH3-M_;T
zx?`RS^L0uFns1_RB2~a$wkya$0I^Zyf<3;=f+tadbJNO&1_tb7+k^&K2(qKcw}Pdx
z*~`%NVR)p|sepK}-3PaU7hy0UMEu#eP!p9i1G9fC%GnxxX;HoJ`yK1XcT_HH&Dimy
zd{H`3P*P{uA5wiqoJso@3gZI>Ev~QCF}JdmpFz_LT+Fx|<?E=JR<0r-nRpSyEUf*x
z_nw-V>g$>eC4rXCUXfS9P@xS^j&@yKP|yfh8#}lI2y#252csk8DCXX+a1ajJX+1d)
z1kL&W;@!Z0GcoqJcygXnI_U0uEUV=>t&3A%)TMiRb+w|Jo+Pn|TeV^naD~FbiSwSX
zu`m8S8^<X|Cvh%aErL_#L2I^gXIoRXTzeyQSRJp%<Y8vH@>{#PjVs;`-Koj>fxO-B
z#ph3{M~e_UYT^Y;3$ps!DjpJL=NLArLQW$j2fXzx44BNSOA@33<X+fzT<!|?zL-(F
z)^0^AhQ$_}N)d$}%T%m}!D9?|T8K{BsZ0grRwK;a5Y4k!aO*<!uVY%$z>F~Hh<|eP
zd1lGGpBFo>m6JTBR#S#4@0fifLGM}h#9@Wiswi!~?#&8tfD)c5rG9Z6{Jb-|UmAV(
z;wvl0So*<&vXFjjo%3x@<Ef}jarnsl6=X|MznhTjsc$y+zMp7Kz8`+=$8ikFop6B3
zCW^$B4MHg#<00!?UP_3$^YPfEsf8r}P~VUfa9rZ}KO@8M^f!_S?PTC$T^`p{8PpgY
zx_4*6FpId3)2f&f1@?UOOVOAONh~yfd3HI9ND7itCd~>|+F)h=UW}`@o>Zc|J#C~k
z8G9$8v_0Gvy$Xfg$GPAAOsn=xx@sNz!s4p(k2frK8*5#<A;40eGH*jbaM#|hB(Jwc
zA6a!=yn!<wy1rqQSde8$Z+Rd4JKE!S0F?E_$;^_6A)+n-=b&zzZQnDP!Kj6kwgLR~
z>Jk#sNTA>+VFhso@mEbfNNThpz%c$LYt1r{vyY-*4D*ilG>5<^e@24<P*Pk1+dn`g
z4G!Kpcf_A(&(?lFrywkC!Sy&*8g7ab07G1>2Z?+*tvJd_U&t=MqwmZ~q(*&V_W7rJ
zAfT8%SJ#!G3`mnUrIzoL+l@jDiI2Tw#&d|n1PU^VW^T@PmM$gZXnjTj{7T<~9Uw4U
zv|G_2JYj_bSvcWBxkrAQ<62}YwePktZf;dvgoq`5brRy|s=tL9-8>Gb{9AG73Zu*U
zmfJ^P#35MPHK{d28?m51KsCbMk5a(w+2}qh&Lkd=9iUHW#D>Pey7IHai%8_OFhNMx
zyufJ$F=#AvIr`}IJ!5ckqa%rjBhN159uTQa-|n9_wdbQh&^5)@J3YL(YH}tq8%gB^
zkO-zupN^Tk`z%~qYtN5dO(}W_JDa6G<VS~WG<{VGccT}N)p5n8_8<6u*6Kj%&UgO+
zLWNC;kr^Ph(EH7z<1$wqMyD4sN@Hrc9>`$JhqY&?Bd8k5a6V42zLjY7-%X~4+nXNx
z#4A#qVrCSm1()WDHhAPe|E4E~>@j)MwVrmqpUDwRp#C1_bIU``HvZtgE)6bnYPWT)
zh1XAXa&A%gs;usphq|7HtyKlE?Ld>x(u@Tc+KMTB;@m((U19N3|NHC~;BTa6w}C}B
z*qOp_U_e+pc=dT9IT}O{bi58q`VoL*8!%L(z?nd0f+fk6ajsx9RI~ukiK#y$6-Cu+
zjpYfoWmqMl2${*;z11cH4WHU-1sVqP@Ojv`Gf0%&*_QzH)8a`>gm;r9IHOj-xG`hz
zjdgXXpg-jqm1h(eX_1zPc-4$qi)ETh6^fV3&PO6cWqICra`K=8T~R06N9Qfhe&CV_
zh7LbErJb&IwCg9bp|rXZmT8$FxD7V<qR|KJCem-2dzmSF!MrugKn<2xai&45WEQr7
zW@uq!F~0yfD+<VIB;qiV*PpCEU;Cf8Fk(I~%yQ5*DcCWD?igSrjIu!`z5U%ALl9>J
zszBp(Pjxh?Lq8YUco|g4>O&1saic~qXKrp45lLW_n5Dg6zCS5)KP41FaaFyUt3r3`
z-w`tu1yCkFI_>Pd@zH475c@C#YMn;`2u+q?ykqTZ9!6#*9RwwAKuz+q#>K?qzcd>C
z6aNL$$bv;}na1kJoADE^=OJx&^6I?2%93yoN><d|*lR%zdcoQ!Z<}2_I%Zs*8CMoz
zsOV^W{%ujpNbUeQUUkgHF@@`?D8Fx=sA#Qo@-x$2hWBui$P<^y$nZqbXj`$0dmXs6
zlO<%_atG!{3k`J$rHUn7j6(u3{Ll+$(EvLqGU=tJx65A*2iu^tP2WXtl$F(ojL|uQ
z&1fl$f^p>&JPm(6B93AKZDCGZNWJ(Qxyh^Uym_7e%_k1oS%BCUD8@J~W>({c&xqV3
z^Ha!|M1J{#tBzKqL=qX0t;k0;E5>unLXuf>_bEMa@Ry^?o`LxwP&Q=p>mkG<mPAz6
ztinL;8^fOv#NJJbIdm)`7U?)7^kz+htElK$3qVbpXr|WcV5+wqgcWLG8rH4@szVIK
z2ps|3VDR&D`w=O1((ip7tC6rlbG!%UDV5A83GQ^}^HUPs?r@6)uXF=YgH&`L?r3o+
zLQjJT16W!@6L5W6LrQEx5k_Il@hKdYOH=xD0!#X^I1_!6u%?4Zp2dY6VEI*4Rc3ku
zxH#&DZe1ECzOuNXiG*r|!6|tw0B3SwlPTl)1NhjIv@=}xp^?1|JVHIFk#8fGPRt6)
zitaWCW(B|-Lk}A+%Vk8@mW)nLAfHQ8@MZ%Mx1HhHr@2kk+)>`6Cusr<J(;(f&zq11
zs;ccsVa*uzZ)Amx+ilh0`s+YZ^jV|@2Ndk24i5G^5EonGj@F(%hxzJ-II>Wlo+?EA
zux<AxM66)yWT|xTMSpjdh;gwuA!AQ9t0HJi5aY&qj{iYgzuTsah=9}C72r?YE+r{7
zGjKA8HVpijIfVl6weX^?)I#?6jt#4Q|74@cRbULMH-qiVUX7!jR8TIOP`JQf7Sy*5
z$apkb*J!AuD>9j*>^trKx;z+xaJ`jinU`a>P1R8~-Ayg%BBKN>n~Zvtnp4fxrec={
z2WA1dv4L?zmph-O<|3!65;tJ-&MP8Qx!Ow}5e8gI$bamv1XdaGC-8Z0qX7{5IWQHX
zRcHH)Y|hu3HB7Y$Q=%(eenR{2o+(|{9xn1O*OC^^guM{hXs9DjDg(x7siTWCOqx5w
z!~%34(m_eo5MU1ksv1oGjW}Gx+Zh=XXC??=1JpQ%w`S>?gMwFRKO4LEy<B61nVjj$
zl``o22RW$_Vu{s58TFiP$C6QYK?K%uzt!3u@l4sN(t(OiE<R}(#Sl^6-leKHOhlyH
z^hneZHiOtj(U)tE>mwbuivZRG#Q-a^@E8xHIUZd26vy3PZl0ej2OQ<^u3op!2cC6z
zL1S;mIxwkVRv=1&7ZNI->bN9?4#gDHB=iZ!v@pSzCvc~X!*sEK&&X2lh(S+Oio1ub
zdTnFNR=jbw)vn2gEp8Wxf8p_;lPGqmKR`c6QVsW81+`CbM}eI!+q`)*Ni6#2=UeOm
zHPD6?)n!JIll{eztnO*BtBq;tI6nzb$m9c!;wv629(c%6GX#a+JY6plt+`oX-ay4<
z;+Nq3jEHF^ag?<X1z;6^J^DXSwz3JMg72c+J%4Apx_fKzUw5kYdarW}#d1023KY}w
ziUjtZ;loYrX<EfjncDA+d+p&yat|PW9BH7lN?T$%uD_^gC5IXOpn!^3Y;wYXhx)TO
zIykW)J`9Bj^9iO=;q)>mWG<s9JsFg`xxEt0zbu_(ktoHg)(H+pBr^1&3vrTSl*MMb
zXs`Z@`$(TBwD57NC-`e>oW3x*@cWV1DF%!{%S{|{t-ts0d}m_6HTwOBX|Js3;b*5#
zJh0A7JAW1mWN{|SuMk}4v~Y(3qH`YX9hoG#2r40uj;>iKat#1g)_HF4EgVg}3~Igl
zi#oSF#ARm+N<n8HxB9AfskFH(S4L@VGDawHj&8Q##Ww8W8KC^l!T#1P0O6?Q&42ET
zNfX3a4Xa%a?1ko1?cq!1;8tBSfiCy1cHE1^_V7L$L*7x9UuN$RRrqOM?*4}{foRt!
z|L}bL_s{=6kJqJy{};}K##z;%#+xlz-^hD00%vg7g#D<F3WVPaN750T4UZZyy|Zz#
zY|0<>-WvY@%SXkh(<i_FPee9jgLg)ov$93Ez2enh_q|5f<i8L8=LfY`VVr!dJ^UYs
zU%F(Hi)s1n*T3Da_=ErO(h-d~`tP4#e?b4|o=0)dfL%SK41O6~bcLTovc%}i1pPJN
F{SRUysY(C<


From 4e88df03ac7add96fe99936d3a9c607c081d0dda Mon Sep 17 00:00:00 2001
From: TJian <tunjian.tan@embeddedllm.com>
Date: Thu, 2 Oct 2025 22:34:53 -0700
Subject: [PATCH 115/193] [ROCm] [VL] [Bugfix] Fix vit flash attn dispatcher
 logic for ROCm (#26104)

Signed-off-by: tjtanaa <tunjian.tan@embeddedllm.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/attention/layer.py                    | 72 +++++++++++++++-------
 vllm/model_executor/models/dots_ocr.py     | 41 ++++++------
 vllm/model_executor/models/ernie45_vl.py   | 49 +++++++--------
 vllm/model_executor/models/glm4_1v.py      | 31 +++++-----
 vllm/model_executor/models/qwen2_5_vl.py   | 34 +++++-----
 vllm/model_executor/models/qwen2_vl.py     | 40 ++++++------
 vllm/model_executor/models/qwen3_vl.py     |  4 +-
 vllm/model_executor/models/siglip2navit.py | 22 +++----
 vllm/platforms/rocm.py                     |  2 -
 9 files changed, 154 insertions(+), 141 deletions(-)

diff --git a/vllm/attention/layer.py b/vllm/attention/layer.py
index 113602645e89..ac34f279d0b5 100644
--- a/vllm/attention/layer.py
+++ b/vllm/attention/layer.py
@@ -1,7 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Attention layer."""
-from typing import List, Optional
+from typing import Callable, List, Optional
 
 import torch
 import torch.nn as nn
@@ -68,9 +68,39 @@ def check_upstream_fa_availability(dtype: torch.dtype):
     ) and current_platform.has_device_capability(80):
         from transformers.utils import is_flash_attn_2_available
         return is_flash_attn_2_available()
+    if current_platform.is_rocm():
+        from importlib.util import find_spec
+        return find_spec("flash_attn") is not None
     return False
 
 
+def maybe_get_vit_flash_attn_backend(
+        attn_backend: _Backend,
+        use_upstream_fa: bool) -> tuple[_Backend, Callable]:
+    if attn_backend != _Backend.FLASH_ATTN and \
+        attn_backend != _Backend.ROCM_AITER_FA and \
+                check_upstream_fa_availability(torch.get_default_dtype()):
+        attn_backend = _Backend.FLASH_ATTN
+        use_upstream_fa = True
+
+    if current_platform.is_rocm() and \
+        attn_backend == _Backend.FLASH_ATTN:
+        use_upstream_fa = True
+
+    if (attn_backend in {_Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA}):
+        if attn_backend == _Backend.ROCM_AITER_FA:
+            from aiter import flash_attn_varlen_func
+        else:
+            if use_upstream_fa:
+                from flash_attn import flash_attn_varlen_func
+            else:
+                from vllm.vllm_flash_attn import flash_attn_varlen_func
+    else:
+        flash_attn_varlen_func = None
+
+    return attn_backend, flash_attn_varlen_func
+
+
 class Attention(nn.Module, AttentionLayerBase):
     """Attention layer.
 
@@ -410,13 +440,9 @@ def __init__(
         # to upstream flash attention if available.
         # If vllm native fa is selected, we use it directly.
         use_upstream_fa = False
-        if backend != _Backend.FLASH_ATTN and check_upstream_fa_availability(
-                dtype):
-            backend = _Backend.FLASH_ATTN
-            use_upstream_fa = True
 
-        if current_platform.is_rocm() or current_platform.is_xpu():
-            # currently, only torch_sdpa is supported on rocm/xpu
+        if current_platform.is_xpu():
+            # currently, only torch_sdpa is supported on xpu
             self.attn_backend = _Backend.TORCH_SDPA
         else:
 
@@ -428,17 +454,25 @@ def __init__(
                 _Backend.FLASH_ATTN,
             } else _Backend.TORCH_SDPA
 
+        self.attn_backend, self._flash_attn_varlen_func \
+            = maybe_get_vit_flash_attn_backend(
+                self.attn_backend,
+                use_upstream_fa,
+            )
+
         if (self.attn_backend == _Backend.XFORMERS
                 and not check_xformers_availability()):
             self.attn_backend = _Backend.TORCH_SDPA
 
-        if self.attn_backend == _Backend.FLASH_ATTN:
-            if use_upstream_fa:
-                from flash_attn import flash_attn_varlen_func
-                self._flash_attn_varlen_func = flash_attn_varlen_func
-            else:
-                from vllm.vllm_flash_attn import flash_attn_varlen_func
-                self._flash_attn_varlen_func = flash_attn_varlen_func
+        self.is_flash_attn_backend = self.attn_backend in {
+            _Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA
+        }
+
+        # this condition is just to make sure that the
+        # use_upstream_fa in the log is correct
+        if current_platform.is_rocm() \
+            and self.attn_backend == _Backend.FLASH_ATTN:
+            use_upstream_fa = True
 
         logger.info_once(
             f"MultiHeadAttention attn_backend: {self.attn_backend}, "
@@ -466,7 +500,7 @@ def forward(
             key = torch.repeat_interleave(key, num_repeat, dim=2)
             value = torch.repeat_interleave(value, num_repeat, dim=2)
 
-        if self.attn_backend == _Backend.FLASH_ATTN:
+        if self.is_flash_attn_backend:
             cu_seqlens_q = torch.arange(0, (bsz + 1) * q_len,
                                         step=q_len,
                                         dtype=torch.int32,
@@ -507,14 +541,6 @@ def forward(
             from torch_xla.experimental.custom_kernel import flash_attention
             out = flash_attention(query, key, value, sm_scale=self.scale)
             out = out.transpose(1, 2)
-        elif self.attn_backend == _Backend.ROCM_AITER_FA:
-            from aiter import flash_attn_varlen_func
-
-            # ROCm Flash Attention expects (batch, seq, heads, head_dim)
-            out = flash_attn_varlen_func(query,
-                                         key,
-                                         value,
-                                         softmax_scale=self.scale)
         else:
             # ViT attention hasn't supported this backend yet
             raise NotImplementedError(
diff --git a/vllm/model_executor/models/dots_ocr.py b/vllm/model_executor/models/dots_ocr.py
index 2445f0d784f4..86888c10ee39 100644
--- a/vllm/model_executor/models/dots_ocr.py
+++ b/vllm/model_executor/models/dots_ocr.py
@@ -10,7 +10,8 @@
 from transformers.models.qwen2_vl import Qwen2VLProcessor
 
 from vllm.attention.backends.registry import _Backend
-from vllm.attention.layer import check_upstream_fa_availability
+from vllm.attention.layer import (check_upstream_fa_availability,
+                                  maybe_get_vit_flash_attn_backend)
 from vllm.config import VllmConfig
 from vllm.distributed import utils as dist_utils
 from vllm.distributed.parallel_state import (
@@ -267,10 +268,12 @@ def __init__(self,
         self.attn_backend = get_vit_attn_backend(
             self.hidden_size_per_attention_head, torch.get_default_dtype())
         self.use_upstream_fa = False
-        if self.attn_backend != _Backend.FLASH_ATTN and \
-                check_upstream_fa_availability(torch.get_default_dtype()):
-            self.attn_backend = _Backend.FLASH_ATTN
-            self.use_upstream_fa = True
+
+        self.attn_backend, self.flash_attn_varlen_func \
+            = maybe_get_vit_flash_attn_backend(
+                self.attn_backend,
+                self.use_upstream_fa,
+            )
         if self.attn_backend not in {
                 _Backend.FLASH_ATTN, _Backend.TORCH_SDPA, _Backend.XFORMERS,
                 _Backend.ROCM_AITER_FA
@@ -306,25 +309,18 @@ def forward(
             q, k = torch.chunk(qk_rotated, 2, dim=0)
 
         if self.is_flash_attn_backend:
-            if self.attn_backend == _Backend.ROCM_AITER_FA:
-                from aiter import flash_attn_varlen_func
-            else:
-                if self.use_upstream_fa:
-                    from flash_attn import flash_attn_varlen_func
-                else:
-                    from vllm.vllm_flash_attn import flash_attn_varlen_func
             q_ = q.reshape(bs * q.shape[1], q.shape[2], q.shape[3])
             k_ = k.reshape(bs * k.shape[1], k.shape[2], k.shape[3])
             v_ = v.reshape(bs * v.shape[1], v.shape[2], v.shape[3])
-            output = flash_attn_varlen_func(q_,
-                                            k_,
-                                            v_,
-                                            cu_seqlens_q=cu_seqlens,
-                                            cu_seqlens_k=cu_seqlens,
-                                            max_seqlen_q=max_seqlen,
-                                            max_seqlen_k=max_seqlen,
-                                            dropout_p=0.0,
-                                            causal=False)
+            output = self.flash_attn_varlen_func(q_,
+                                                 k_,
+                                                 v_,
+                                                 cu_seqlens_q=cu_seqlens,
+                                                 cu_seqlens_k=cu_seqlens,
+                                                 max_seqlen_q=max_seqlen,
+                                                 max_seqlen_k=max_seqlen,
+                                                 dropout_p=0.0,
+                                                 causal=False)
             context_layer = output.view(bs, -1,
                                         self.num_attention_heads_per_partition,
                                         self.hidden_size_per_attention_head)
@@ -611,7 +607,8 @@ def compute_attn_mask_seqlen(
             self, cu_seqlens: torch.Tensor
     ) -> tuple[Optional[int], Optional[list[int]]]:
         max_seqlen, seqlens = None, None
-        if self.attn_backend == _Backend.FLASH_ATTN:
+        if (self.attn_backend == _Backend.FLASH_ATTN
+                or self.attn_backend == _Backend.ROCM_AITER_FA):
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
         elif self.attn_backend == _Backend.XFORMERS:
             seqlens = (cu_seqlens[1:] - cu_seqlens[:-1]).tolist()
diff --git a/vllm/model_executor/models/ernie45_vl.py b/vllm/model_executor/models/ernie45_vl.py
index 0b8e24407602..8da7b9f2c3e0 100644
--- a/vllm/model_executor/models/ernie45_vl.py
+++ b/vllm/model_executor/models/ernie45_vl.py
@@ -35,7 +35,8 @@
 from transformers import BatchFeature
 
 from vllm.attention.backends.registry import _Backend
-from vllm.attention.layer import check_upstream_fa_availability
+from vllm.attention.layer import (check_upstream_fa_availability,
+                                  maybe_get_vit_flash_attn_backend)
 from vllm.config import VllmConfig
 from vllm.distributed import parallel_state
 from vllm.distributed import utils as dist_utils
@@ -176,14 +177,18 @@ def __init__(
             dtype=torch.get_default_dtype())
 
         self.use_upstream_fa = False
-        if self.attn_backend != _Backend.FLASH_ATTN and \
-            check_upstream_fa_availability(torch.get_default_dtype()):
-            self.attn_backend = _Backend.FLASH_ATTN
-            self.use_upstream_fa = True
+
+        self.attn_backend, self.flash_attn_varlen_func \
+            = maybe_get_vit_flash_attn_backend(
+                self.attn_backend,
+                self.use_upstream_fa,
+            )
 
         if self.attn_backend not in {
-                _Backend.FLASH_ATTN, _Backend.TORCH_SDPA, _Backend.XFORMERS,
-                _Backend.ROCM_AITER_FA
+                _Backend.FLASH_ATTN,
+                _Backend.TORCH_SDPA,
+                _Backend.XFORMERS,
+                _Backend.ROCM_AITER_FA,
         }:
             raise RuntimeError(
                 f"Ernie45-VL does not support {self.attn_backend} backend now."
@@ -239,27 +244,18 @@ def forward(
             q, k = torch.chunk(qk_rotated, 2, dim=0)
 
         if self.is_flash_attn_backend:
-            # from vllm_flash_attn.flash_attn_interface import (
-            #   flash_attn_varlen_func)
-            if self.attn_backend == _Backend.ROCM_AITER_FA:
-                from aiter import flash_attn_varlen_func
-            else:
-                if self.use_upstream_fa:
-                    from flash_attn import flash_attn_varlen_func
-                else:
-                    from vllm.vllm_flash_attn import flash_attn_varlen_func
 
             q, k, v = (rearrange(x, "b s ... -> (b s) ...") for x in [q, k, v])
 
-            output = flash_attn_varlen_func(q,
-                                            k,
-                                            v,
-                                            cu_seqlens_q=cu_seqlens,
-                                            cu_seqlens_k=cu_seqlens,
-                                            max_seqlen_q=max_seqlen,
-                                            max_seqlen_k=max_seqlen,
-                                            dropout_p=0.0,
-                                            causal=False)
+            output = self.flash_attn_varlen_func(q,
+                                                 k,
+                                                 v,
+                                                 cu_seqlens_q=cu_seqlens,
+                                                 cu_seqlens_k=cu_seqlens,
+                                                 max_seqlen_q=max_seqlen,
+                                                 max_seqlen_k=max_seqlen,
+                                                 dropout_p=0.0,
+                                                 causal=False)
 
             context_layer = rearrange(output,
                                       "(b s) h d -> s b (h d)",
@@ -516,7 +512,8 @@ def compute_attn_mask_seqlen(
             self, cu_seqlens: torch.Tensor
     ) -> tuple[Optional[int], Optional[list[int]]]:
         max_seqlen, seqlens = None, None
-        if self.attn_backend == _Backend.FLASH_ATTN:
+        if (self.attn_backend == _Backend.FLASH_ATTN
+                or self.attn_backend == _Backend.ROCM_AITER_FA):
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
         elif self.attn_backend == _Backend.XFORMERS:
             seqlens = (cu_seqlens[1:] - cu_seqlens[:-1]).tolist()
diff --git a/vllm/model_executor/models/glm4_1v.py b/vllm/model_executor/models/glm4_1v.py
index 315a057e6a7d..e6e294a14349 100644
--- a/vllm/model_executor/models/glm4_1v.py
+++ b/vllm/model_executor/models/glm4_1v.py
@@ -47,7 +47,8 @@
 from transformers.video_utils import VideoMetadata
 
 from vllm.attention.backends.registry import _Backend
-from vllm.attention.layer import check_upstream_fa_availability
+from vllm.attention.layer import (check_upstream_fa_availability,
+                                  maybe_get_vit_flash_attn_backend)
 from vllm.config import VllmConfig
 from vllm.distributed import (get_tensor_model_parallel_world_size,
                               parallel_state)
@@ -263,19 +264,26 @@ def __init__(
             head_size=self.hidden_size_per_attention_head,
             dtype=torch.get_default_dtype())
         self.use_upstream_fa = False
-        if self.attn_backend != _Backend.FLASH_ATTN and \
-            check_upstream_fa_availability(torch.get_default_dtype()):
-            self.attn_backend = _Backend.FLASH_ATTN
-            self.use_upstream_fa = True
+
+        self.attn_backend, self.flash_attn_varlen_func \
+            = maybe_get_vit_flash_attn_backend(
+                self.attn_backend,
+                self.use_upstream_fa,
+            )
 
         if self.attn_backend not in {
                 _Backend.FLASH_ATTN,
                 _Backend.TORCH_SDPA,
                 _Backend.XFORMERS,
+                _Backend.ROCM_AITER_FA,
         }:
             raise RuntimeError(
                 f"GLM-4V does not support {self.attn_backend} backend now.")
 
+        self.is_flash_attn_backend = self.attn_backend in {
+            _Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA
+        }
+
     def split_qkv(self, qkv: torch.Tensor) -> tuple[torch.Tensor, ...]:
         # [s, b, 3 * head * head_dim]
         seq_len, bs, _ = qkv.shape
@@ -316,17 +324,11 @@ def forward(
             qk_rotated = apply_rotary_pos_emb_vision(qk_concat, rotary_pos_emb)
             q, k = torch.chunk(qk_rotated, 2, dim=0)
 
-        if self.attn_backend == _Backend.FLASH_ATTN:
-            # from vllm_flash_attn.flash_attn_interface import (
-            #   flash_attn_varlen_func)
-            if self.use_upstream_fa:
-                from flash_attn import flash_attn_varlen_func
-            else:
-                from vllm.vllm_flash_attn import flash_attn_varlen_func
+        if self.is_flash_attn_backend:
 
             q, k, v = (rearrange(x, "b s ... -> (b s) ...") for x in [q, k, v])
 
-            output = flash_attn_varlen_func(
+            output = self.flash_attn_varlen_func(
                 q,
                 k,
                 v,
@@ -774,7 +776,8 @@ def compute_attn_mask_seqlen(
     ) -> tuple[Optional[int], Optional[list[int]]]:
         max_seqlen, seqlens = None, None
         seqlens = (cu_seqlens[1:] - cu_seqlens[:-1]).tolist()
-        if self.attn_backend == _Backend.FLASH_ATTN:
+        if (self.attn_backend == _Backend.FLASH_ATTN
+                or self.attn_backend == _Backend.ROCM_AITER_FA):
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
         return max_seqlen, seqlens
 
diff --git a/vllm/model_executor/models/qwen2_5_vl.py b/vllm/model_executor/models/qwen2_5_vl.py
index 4f3915a37b24..f7078197da48 100644
--- a/vllm/model_executor/models/qwen2_5_vl.py
+++ b/vllm/model_executor/models/qwen2_5_vl.py
@@ -39,7 +39,8 @@
     Qwen2_5_VLConfig, Qwen2_5_VLVisionConfig)
 
 from vllm.attention.backends.registry import _Backend
-from vllm.attention.layer import check_upstream_fa_availability
+from vllm.attention.layer import (check_upstream_fa_availability,
+                                  maybe_get_vit_flash_attn_backend)
 from vllm.config import VllmConfig
 from vllm.distributed import parallel_state
 from vllm.distributed import utils as dist_utils
@@ -302,6 +303,11 @@ def __init__(
                                       disable_tp=use_data_parallel)
         self.attn_backend = attn_backend
         self.use_upstream_fa = use_upstream_fa
+        self.attn_backend, self.flash_attn_varlen_func \
+            = maybe_get_vit_flash_attn_backend(
+                self.attn_backend,
+                self.use_upstream_fa,
+            )
         self.is_flash_attn_backend = self.attn_backend in {
             _Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA
         }
@@ -354,25 +360,18 @@ def forward(
             q, k = torch.chunk(qk_rotated, 2, dim=0)
 
         if self.is_flash_attn_backend:
-            if self.attn_backend == _Backend.ROCM_AITER_FA:
-                from aiter import flash_attn_varlen_func
-            else:
-                if self.use_upstream_fa:
-                    from flash_attn import flash_attn_varlen_func
-                else:
-                    from vllm.vllm_flash_attn import flash_attn_varlen_func
 
             q, k, v = (rearrange(x, "b s ... -> (b s) ...") for x in [q, k, v])
 
-            output = flash_attn_varlen_func(q,
-                                            k,
-                                            v,
-                                            cu_seqlens_q=cu_seqlens,
-                                            cu_seqlens_k=cu_seqlens,
-                                            max_seqlen_q=max_seqlen,
-                                            max_seqlen_k=max_seqlen,
-                                            dropout_p=0.0,
-                                            causal=False)
+            output = self.flash_attn_varlen_func(q,
+                                                 k,
+                                                 v,
+                                                 cu_seqlens_q=cu_seqlens,
+                                                 cu_seqlens_k=cu_seqlens,
+                                                 max_seqlen_q=max_seqlen,
+                                                 max_seqlen_k=max_seqlen,
+                                                 dropout_p=0.0,
+                                                 causal=False)
 
             context_layer = rearrange(output,
                                       "(b s) h d -> s b (h d)",
@@ -618,6 +617,7 @@ def __init__(
         self.attn_backend = get_vit_attn_backend(
             head_size=head_dim, dtype=torch.get_default_dtype())
         if self.attn_backend != _Backend.FLASH_ATTN and \
+            self.attn_backend != _Backend.ROCM_AITER_FA and \
             check_upstream_fa_availability(
                 torch.get_default_dtype()):
             self.attn_backend = _Backend.FLASH_ATTN
diff --git a/vllm/model_executor/models/qwen2_vl.py b/vllm/model_executor/models/qwen2_vl.py
index 2ff79765d4be..48dec351bd90 100644
--- a/vllm/model_executor/models/qwen2_vl.py
+++ b/vllm/model_executor/models/qwen2_vl.py
@@ -42,7 +42,8 @@
     Qwen2VLVideoProcessor)
 
 from vllm.attention.backends.registry import _Backend
-from vllm.attention.layer import check_upstream_fa_availability
+from vllm.attention.layer import (check_upstream_fa_availability,
+                                  maybe_get_vit_flash_attn_backend)
 from vllm.config import VllmConfig
 from vllm.distributed import parallel_state, tensor_model_parallel_all_gather
 from vllm.distributed import utils as dist_utils
@@ -319,11 +320,12 @@ def __init__(
             head_size=self.hidden_size_per_attention_head,
             dtype=torch.get_default_dtype())
         self.use_upstream_fa = False
-        if self.attn_backend != _Backend.FLASH_ATTN and \
-            check_upstream_fa_availability(
-                torch.get_default_dtype()):
-            self.attn_backend = _Backend.FLASH_ATTN
-            self.use_upstream_fa = True
+
+        self.attn_backend, self.flash_attn_varlen_func \
+            = maybe_get_vit_flash_attn_backend(
+                self.attn_backend,
+                self.use_upstream_fa,
+            )
 
         if self.attn_backend not in {
                 _Backend.FLASH_ATTN, _Backend.TORCH_SDPA, _Backend.XFORMERS,
@@ -331,6 +333,7 @@ def __init__(
         }:
             raise RuntimeError(
                 f"Qwen2-VL does not support {self.attn_backend} backend now.")
+
         self.is_flash_attn_backend = self.attn_backend in {
             _Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA
         }
@@ -383,25 +386,18 @@ def forward(
             q, k = torch.chunk(qk_rotated, 2, dim=0)
 
         if self.is_flash_attn_backend:
-            if self.attn_backend == _Backend.ROCM_AITER_FA:
-                from aiter import flash_attn_varlen_func
-            else:
-                if self.use_upstream_fa:
-                    from flash_attn import flash_attn_varlen_func
-                else:
-                    from vllm.vllm_flash_attn import flash_attn_varlen_func
 
             q, k, v = (rearrange(x, "b s ... -> (b s) ...") for x in [q, k, v])
 
-            output = flash_attn_varlen_func(q,
-                                            k,
-                                            v,
-                                            cu_seqlens_q=cu_seqlens,
-                                            cu_seqlens_k=cu_seqlens,
-                                            max_seqlen_q=max_seqlen,
-                                            max_seqlen_k=max_seqlen,
-                                            dropout_p=0.0,
-                                            causal=False)
+            output = self.flash_attn_varlen_func(q,
+                                                 k,
+                                                 v,
+                                                 cu_seqlens_q=cu_seqlens,
+                                                 cu_seqlens_k=cu_seqlens,
+                                                 max_seqlen_q=max_seqlen,
+                                                 max_seqlen_k=max_seqlen,
+                                                 dropout_p=0.0,
+                                                 causal=False)
 
             context_layer = rearrange(output,
                                       "(b s) h d -> s b (h d)",
diff --git a/vllm/model_executor/models/qwen3_vl.py b/vllm/model_executor/models/qwen3_vl.py
index fc8557131c3e..da6ca7940700 100644
--- a/vllm/model_executor/models/qwen3_vl.py
+++ b/vllm/model_executor/models/qwen3_vl.py
@@ -323,6 +323,7 @@ def __init__(
             head_size=head_dim, dtype=torch.get_default_dtype())
         use_upstream_fa = False
         if self.attn_backend != _Backend.FLASH_ATTN and \
+            self.attn_backend != _Backend.ROCM_AITER_FA and \
             check_upstream_fa_availability(
                 torch.get_default_dtype()):
             self.attn_backend = _Backend.FLASH_ATTN
@@ -476,7 +477,8 @@ def compute_attn_mask_seqlen(
         cu_seqlens: torch.Tensor,
     ) -> tuple[Optional[int], Optional[list[int]]]:
         max_seqlen, seqlens = None, None
-        if self.attn_backend == _Backend.FLASH_ATTN:
+        if (self.attn_backend == _Backend.FLASH_ATTN
+                or self.attn_backend == _Backend.ROCM_AITER_FA):
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
         elif self.attn_backend == _Backend.XFORMERS:
             seqlens = (cu_seqlens[1:] - cu_seqlens[:-1]).tolist()
diff --git a/vllm/model_executor/models/siglip2navit.py b/vllm/model_executor/models/siglip2navit.py
index d111a10809e7..5bea5b1daf4d 100644
--- a/vllm/model_executor/models/siglip2navit.py
+++ b/vllm/model_executor/models/siglip2navit.py
@@ -14,7 +14,7 @@
 from transformers.configuration_utils import PretrainedConfig
 
 from vllm.attention.backends.registry import _Backend
-from vllm.attention.layer import check_upstream_fa_availability
+from vllm.attention.layer import maybe_get_vit_flash_attn_backend
 from vllm.distributed import divide, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
@@ -240,11 +240,12 @@ def __init__(
         self.attn_backend = get_vit_attn_backend(
             head_size=self.head_dim, dtype=torch.get_default_dtype())
         self.use_upstream_fa = False
-        if self.attn_backend != _Backend.FLASH_ATTN and \
-            check_upstream_fa_availability(
-                torch.get_default_dtype()):
-            self.attn_backend = _Backend.FLASH_ATTN
-            self.use_upstream_fa = True
+
+        self.attn_backend, self.flash_attn_varlen_func \
+            = maybe_get_vit_flash_attn_backend(
+                self.attn_backend,
+                self.use_upstream_fa,
+            )
 
         if self.attn_backend not in {
                 _Backend.FLASH_ATTN, _Backend.TORCH_SDPA,
@@ -286,14 +287,7 @@ def forward(
 
         max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
         if self.is_flash_attn_backend:
-            if self.attn_backend == _Backend.ROCM_AITER_FA:
-                from aiter import flash_attn_varlen_func
-            else:
-                if self.use_upstream_fa:
-                    from flash_attn import flash_attn_varlen_func
-                else:
-                    from vllm.vllm_flash_attn import flash_attn_varlen_func
-            attn_output = flash_attn_varlen_func(
+            attn_output = self.flash_attn_varlen_func(
                 queries, keys, values, cu_seqlens, cu_seqlens, max_seqlen,
                 max_seqlen).reshape(seq_length, -1)
         elif self.attn_backend == _Backend.TORCH_SDPA:
diff --git a/vllm/platforms/rocm.py b/vllm/platforms/rocm.py
index e12967ad2587..de3df03d1fa0 100644
--- a/vllm/platforms/rocm.py
+++ b/vllm/platforms/rocm.py
@@ -189,8 +189,6 @@ def get_vit_attn_backend(cls, head_size: int,
         from vllm.attention.backends.registry import _Backend
         if (envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_MHA
                 and on_gfx9()):
-            # Note: AITER FA is only supported for Qwen-VL models.
-            # TODO: Add support for other VL models in their model class.
             return _Backend.ROCM_AITER_FA
         if on_gfx9():
             return _Backend.FLASH_ATTN

From a2079d6a2db1a3566ec8ef6e6050a44662732f98 Mon Sep 17 00:00:00 2001
From: Zhewen Li <zhewenli@meta.com>
Date: Thu, 2 Oct 2025 22:37:25 -0700
Subject: [PATCH 116/193] [Bugfix] Fix import `gemm_afp4wfp4` failure on AMD
 (#26068)

Signed-off-by: zhewenli <zhewenli@meta.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../layers/quantization/quark/schemes/quark_w4a4_mxfp4.py       | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/model_executor/layers/quantization/quark/schemes/quark_w4a4_mxfp4.py b/vllm/model_executor/layers/quantization/quark/schemes/quark_w4a4_mxfp4.py
index f8628a82277b..bcf3911095ac 100644
--- a/vllm/model_executor/layers/quantization/quark/schemes/quark_w4a4_mxfp4.py
+++ b/vllm/model_executor/layers/quantization/quark/schemes/quark_w4a4_mxfp4.py
@@ -97,7 +97,7 @@ def gemm_with_dynamic_quant_fake(
         dispatch_key=current_platform.dispatch_key,
     )
 
-except ImportError:
+except (ImportError, AttributeError):
     dynamic_mxfp4_quant = gemm_afp4wfp4 = None
 
 __all__ = ["QuarkW4A4MXFP4"]

From 82e112e359405c26eef0984a9d76224b4ba35cfa Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Fri, 3 Oct 2025 13:38:29 +0800
Subject: [PATCH 117/193] [Model] Use `merge_by_field_config` for MM models (G)
 (#26117)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/gemma3_mm.py      | 35 ++++------
 vllm/model_executor/models/gemma3n_mm.py     | 69 +++++++++-----------
 vllm/model_executor/models/glm4_1v.py        | 38 +----------
 vllm/model_executor/models/glm4v.py          | 15 ++---
 vllm/model_executor/models/granite_speech.py |  7 +-
 5 files changed, 56 insertions(+), 108 deletions(-)

diff --git a/vllm/model_executor/models/gemma3_mm.py b/vllm/model_executor/models/gemma3_mm.py
index 36f8651371ba..b6aa78ac53e0 100644
--- a/vllm/model_executor/models/gemma3_mm.py
+++ b/vllm/model_executor/models/gemma3_mm.py
@@ -36,7 +36,7 @@
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
                          SupportsMultiModal, SupportsPP)
 from .siglip import SiglipVisionModel
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
+from .utils import (AutoWeightsLoader, WeightsMapper,
                     init_vllm_registered_model, maybe_prefix)
 
 logger = init_logger(__name__)
@@ -289,7 +289,7 @@ def _call_hf_processor(
                                         processor=hf_processor)
                 for size in image_sizes
             ]
-            processed_outputs["num_crops"] = torch.tensor(num_crops)
+            processed_outputs["num_patches"] = torch.tensor(num_crops) + 1
 
         return processed_outputs
 
@@ -298,12 +298,12 @@ def _get_mm_fields_config(
         hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
-        num_crops = hf_inputs.get("num_crops", torch.empty(0))
+        num_patches = hf_inputs.get("num_patches", torch.empty(0))
 
         return dict(
             pixel_values=MultiModalFieldConfig.flat_from_sizes(
-                "image", num_crops + 1),
-            num_crops=MultiModalFieldConfig.batched("image"),
+                "image", num_patches),
+            num_patches=MultiModalFieldConfig.batched("image"),
         )
 
     def _get_prompt_updates(
@@ -460,6 +460,8 @@ def forward(self, vision_outputs: torch.Tensor):
                                         dummy_inputs=Gemma3DummyInputsBuilder)
 class Gemma3ForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP,
                                      SupportsLoRA):
+    merge_by_field_config = True
+
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -526,29 +528,20 @@ def dtype(self):
     def _parse_and_validate_image_input(
             self, **kwargs: object) -> Optional[Gemma3ImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
-        num_crops = kwargs.pop("num_crops", None)
+        num_patches = kwargs.pop("num_patches", None)
         image_embeds = kwargs.pop("image_embeds", None)
         assert image_embeds is None, "Gemma3 does not support image_embeds."
         if pixel_values is None:
             return None
 
-        if not isinstance(pixel_values, (torch.Tensor, list)):
-            raise ValueError("Incorrect type of pixel values. "
-                             f"Got type: {type(pixel_values)}")
-
-        if not isinstance(num_crops, (torch.Tensor, list)):
-            raise ValueError("Incorrect type of num_crops. "
-                             f"Got type: {type(num_crops)}")
-
         image_size = self.config.vision_config.image_size
 
-        return Gemma3ImagePixelInputs(
-            pixel_values=flatten_bn(pixel_values, concat=True),
-            num_patches=flatten_bn(num_crops, concat=True) + 1,
-            resolve_bindings={
-                "h": image_size,
-                "w": image_size
-            })
+        return Gemma3ImagePixelInputs(pixel_values=pixel_values,
+                                      num_patches=num_patches,
+                                      resolve_bindings={
+                                          "h": image_size,
+                                          "w": image_size
+                                      })
 
     def _image_pixels_to_features(
         self,
diff --git a/vllm/model_executor/models/gemma3n_mm.py b/vllm/model_executor/models/gemma3n_mm.py
index 101e083ac123..83b9d7fa4133 100644
--- a/vllm/model_executor/models/gemma3n_mm.py
+++ b/vllm/model_executor/models/gemma3n_mm.py
@@ -1,7 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from collections.abc import Iterable, Mapping, Sequence
-from typing import Any, Literal, Optional, TypedDict, Union, cast
+from typing import Annotated, Any, Literal, Optional, Union, cast
 
 import numpy as np
 import torch
@@ -41,6 +41,7 @@
 # yapf: enable
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
+from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .interfaces import (MultiModalEmbeddings, SupportsMultiModal,
                          SupportsTranscription)
@@ -54,17 +55,28 @@
 TOKENS_PER_AUDIO = 188
 
 
-class Gemma3nImagePixelInputs(TypedDict):
-    pixel_values: torch.Tensor
-    """Shape: `(batch_size * num_images, num_channels, height, width)`"""
+class Gemma3nImagePixelInputs(TensorSchema):
+    """
+    Dimensions:
+        - bn: Batch size * number of images
+        - c: Number of channels (3)
+        - h: Height of each patch
+        - w: Width of each patch
+    """
+    type: Literal["pixel_values"] = "pixel_values"
+    pixel_values: Annotated[torch.Tensor, TensorShape("bn", 3, "h", "w")]
 
 
-class Gemma3nAudioInputs(TypedDict):
-    input_features: Union[torch.Tensor, list[torch.Tensor]]
-    input_features_padded: torch.Tensor
-    """Shape: `(batch_size * num_audio, seq_length, num_features)`"""
-    input_features_mask: torch.Tensor
-    """Shape: `(batch_size * num_audio, seq_length)`"""
+class Gemma3nAudioInputs(TensorSchema):
+    """
+    Dimensions:
+        - bn: Batch size * number of audios
+        - s: seq_length
+        - f: num_features
+    """
+    type: Literal["audio"] = "audio"
+    input_features_padded: Annotated[torch.Tensor, TensorShape("bn", "s", "f")]
+    input_features_mask: Annotated[torch.Tensor, TensorShape("bn", "s")]
 
 
 Gemma3nImageInputs = Gemma3nImagePixelInputs
@@ -212,9 +224,9 @@ def _get_mm_fields_config(
 
         return dict(
             pixel_values=MultiModalFieldConfig.batched("image"),
-            input_features=MultiModalFieldConfig.batched("audio"),
             input_features_padded=MultiModalFieldConfig.batched("audio"),
-            input_features_mask=MultiModalFieldConfig.batched("audio"))
+            input_features_mask=MultiModalFieldConfig.batched("audio"),
+        )
 
     def _get_prompt_updates(
         self,
@@ -422,6 +434,7 @@ def forward(
                                         dummy_inputs=Gemma3nDummyInputsBuilder)
 class Gemma3nForConditionalGeneration(nn.Module, SupportsMultiModal,
                                       SupportsTranscription):
+    merge_by_field_config = True
     supported_languages = ISO639_1_SUPPORTED_LANGS
 
     packed_modules_mapping = {
@@ -482,14 +495,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             device=self.language_model.model.embed_tokens.weight.device,
             dtype=self.language_model.model.embed_tokens.weight.dtype)
 
-    @property
-    def dtype(self):
-        return next(self.parameters()).dtype
-
-    def _validate_pixel_values(self, data: torch.Tensor) -> torch.Tensor:
-        # TODO check if there are any
-        return data
-
     def _parse_and_validate_image_input(
             self, **kwargs: object) -> Optional[Gemma3nImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
@@ -499,34 +504,22 @@ def _parse_and_validate_image_input(
         if pixel_values is None:
             return None
 
-        if not isinstance(pixel_values, (torch.Tensor, list)):
-            raise ValueError("Incorrect type of pixel values. "
-                             f"Got type: {type(pixel_values)}")
-
-        pixel_values = flatten_bn(pixel_values, concat=True)
-        pixel_values = pixel_values.contiguous()
-
-        return Gemma3nImagePixelInputs(
-            pixel_values=self._validate_pixel_values(pixel_values), )
+        return Gemma3nImagePixelInputs(pixel_values=pixel_values)
 
     def _parse_and_validate_audio_input(
             self, **kwargs: object) -> Optional[Gemma3nAudioInputs]:
-        input_features = kwargs.pop("input_features", None)
-        if input_features is None:
+
+        input_features_padded = kwargs.pop("input_features_padded", None)
+        if input_features_padded is None:
             return None
 
         input_features_mask = kwargs.pop("input_features_mask", None)
         if input_features_mask is None:
             return None
 
-        input_features_padded = kwargs.pop("input_features_padded", None)
-        if input_features_padded is None:
-            return None
-
         return Gemma3nAudioInputs(
-            input_features=input_features,
-            input_features_mask=input_features_mask,
             input_features_padded=input_features_padded,
+            input_features_mask=input_features_mask,
         )
 
     def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
@@ -539,7 +532,7 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
                              ) and "image" not in mm_input_by_modality:
                 mm_input_by_modality[
                     "image"] = self._parse_and_validate_image_input(**kwargs)
-            if input_key == "input_features" \
+            if input_key == "input_features_padded" \
                 and "audio" not in mm_input_by_modality:
                 mm_input_by_modality[
                     "audio"] = self._parse_and_validate_audio_input(**kwargs)
diff --git a/vllm/model_executor/models/glm4_1v.py b/vllm/model_executor/models/glm4_1v.py
index e6e294a14349..5b64941762c6 100644
--- a/vllm/model_executor/models/glm4_1v.py
+++ b/vllm/model_executor/models/glm4_1v.py
@@ -1319,6 +1319,8 @@ def get_video_replacement_glm4v(item_idx: int):
 )
 class Glm4vForConditionalGeneration(nn.Module, SupportsMultiModal,
                                     SupportsLoRA, SupportsPP):
+    merge_by_field_config = True
+
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -1381,22 +1383,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.make_empty_intermediate_tensors = (
             self.language_model.make_empty_intermediate_tensors)
 
-    def _validate_and_reshape_mm_tensor(self, mm_input: object,
-                                        name: str) -> torch.Tensor:
-        if not isinstance(mm_input, (torch.Tensor, list)):
-            raise ValueError(
-                f"Incorrect type of {name}. Got type: {type(mm_input)}")
-        if isinstance(mm_input, torch.Tensor):
-            if mm_input.ndim == 2:
-                return mm_input
-            if mm_input.ndim != 3:
-                raise ValueError(f"{name} should be 2D or batched 3D tensor. "
-                                 f"Got ndim: {mm_input.ndim} "
-                                 f"(shape={mm_input.shape})")
-            return mm_input.reshape(-1, mm_input.shape[-1])
-        else:
-            return torch.concat(mm_input)
-
     def _parse_and_validate_image_input(
             self, **kwargs: object) -> Optional[Glm4vImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
@@ -1407,11 +1393,6 @@ def _parse_and_validate_image_input(
             return None
 
         if pixel_values is not None:
-            pixel_values = self._validate_and_reshape_mm_tensor(
-                pixel_values, "image pixel values")
-            image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, "image grid_thw")
-
             return Glm4vImagePixelInputs(
                 type="pixel_values",
                 pixel_values=pixel_values,
@@ -1419,11 +1400,6 @@ def _parse_and_validate_image_input(
             )
 
         if image_embeds is not None:
-            image_embeds = self._validate_and_reshape_mm_tensor(
-                image_embeds, "image embeds")
-            image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, "image grid_thw")
-
             return Glm4vImageEmbeddingInputs(
                 type="image_embeds",
                 image_embeds=image_embeds,
@@ -1440,11 +1416,6 @@ def _parse_and_validate_video_input(
             return None
 
         if pixel_values_videos is not None:
-            pixel_values_videos = self._validate_and_reshape_mm_tensor(
-                pixel_values_videos, "video pixel values")
-            video_grid_thw = self._validate_and_reshape_mm_tensor(
-                video_grid_thw, "video grid_thw")
-
             return Glm4vVideoPixelInputs(
                 type="pixel_values_videos",
                 pixel_values_videos=pixel_values_videos,
@@ -1452,11 +1423,6 @@ def _parse_and_validate_video_input(
             )
 
         if video_embeds is not None:
-            video_embeds = self._validate_and_reshape_mm_tensor(
-                video_embeds, "video embeds")
-            video_grid_thw = self._validate_and_reshape_mm_tensor(
-                video_grid_thw, "video grid_thw")
-
             return Glm4vVideoEmbeddingInputs(
                 type="video_embeds",
                 video_embeds=video_embeds,
diff --git a/vllm/model_executor/models/glm4v.py b/vllm/model_executor/models/glm4v.py
index 22ddb1d75160..213c3b2769eb 100644
--- a/vllm/model_executor/models/glm4v.py
+++ b/vllm/model_executor/models/glm4v.py
@@ -43,7 +43,6 @@
 from .chatglm import ChatGLMBaseModel, ChatGLMModel
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
                          SupportsMultiModal, SupportsPP)
-from .utils import flatten_bn
 
 
 class GLMVImagePixelInputs(TensorSchema):
@@ -529,8 +528,9 @@ def get_replacement(item_idx: int):
 @MULTIMODAL_REGISTRY.register_processor(GLM4VMultiModalProcessor,
                                         info=GLM4VProcessingInfo,
                                         dummy_inputs=GLM4VDummyInputsBuilder)
-class GLM4VForCausalLM(ChatGLMBaseModel, SupportsLoRA, SupportsPP,
-                       SupportsMultiModal):
+class GLM4VForCausalLM(ChatGLMBaseModel, SupportsMultiModal, SupportsLoRA,
+                       SupportsPP):
+    merge_by_field_config = True
 
     packed_modules_mapping = {
         "query_key_value": ["query_key_value"],
@@ -574,14 +574,9 @@ def _parse_and_validate_image_input(
         pixel_values = kwargs.pop("pixel_values", None)
 
         if pixel_values is not None:
-            if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values)}")
-
             expected_h = expected_w = self.config.vision_config["image_size"]
             return GLMVImagePixelInputs(type="pixel_values",
-                                        data=flatten_bn(pixel_values,
-                                                        concat=True),
+                                        data=pixel_values,
                                         resolve_bindings={
                                             "h": expected_h,
                                             "w": expected_w
@@ -598,6 +593,8 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.transformer
 
+    get_input_embeddings = SupportsMultiModal.get_input_embeddings
+
     def get_multimodal_embeddings(self,
                                   **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
diff --git a/vllm/model_executor/models/granite_speech.py b/vllm/model_executor/models/granite_speech.py
index 0ec451356f5e..ea9f67723b12 100644
--- a/vllm/model_executor/models/granite_speech.py
+++ b/vllm/model_executor/models/granite_speech.py
@@ -168,10 +168,8 @@ def _call_hf_processor(
             # Calculate the number of audio tokens per entry in the batch;
             # This is used to split the batch back out after padding.
             audio_token_index = self.info.get_hf_config().audio_token_index
-            processed_outputs["audio_embed_sizes"] = [
-                torch.sum(indices == audio_token_index).item()
-                for indices in processed_outputs["input_ids"]
-            ]
+            processed_outputs["audio_embed_sizes"] = (
+                processed_outputs["input_ids"] == audio_token_index).sum(-1)
 
         return processed_outputs
 
@@ -527,6 +525,7 @@ class GraniteSpeechForConditionalGeneration(
         SupportsPP,
         SupportsLoRA,
 ):
+    merge_by_field_config = True
 
     packed_modules_mapping = {
         "qkv_proj": [

From 9fba170ff0a5f5661210eb66a6c0444187a9b351 Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Fri, 3 Oct 2025 07:12:15 +0100
Subject: [PATCH 118/193] `FusedMoE` support for the Transformers backend
 (#22650)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/models/supported_models.md               |   5 +-
 tests/models/registry.py                      |   4 +
 tests/models/test_transformers.py             |   9 +
 tests/models/utils.py                         |  23 +-
 vllm/config/model.py                          |  39 +--
 vllm/model_executor/layers/fused_moe/layer.py |  31 ++
 vllm/model_executor/models/registry.py        |   8 +-
 vllm/model_executor/models/transformers.py    | 161 +++++++----
 .../model_executor/models/transformers_moe.py | 268 ++++++++++++++++++
 .../models/transformers_pooling.py            |  28 +-
 10 files changed, 485 insertions(+), 91 deletions(-)
 create mode 100644 vllm/model_executor/models/transformers_moe.py

diff --git a/docs/models/supported_models.md b/docs/models/supported_models.md
index 18c8b7846cb2..5ca2156c08b5 100644
--- a/docs/models/supported_models.md
+++ b/docs/models/supported_models.md
@@ -17,12 +17,12 @@ These models are what we list in [supported-text-models][supported-text-models]
 
 ### Transformers
 
-vLLM also supports model implementations that are available in Transformers. You should expect the performance of a Transformers model implementation used in vLLM to be within <1% of the performance of a dedicated vLLM model implementation. We call this feature the "Transformers backend".
+vLLM also supports model implementations that are available in Transformers. You should expect the performance of a Transformers model implementation used in vLLM to be within <5% of the performance of a dedicated vLLM model implementation. We call this feature the "Transformers backend".
 
 Currently, the Transformers backend works for the following:
 
 - Modalities: embedding models, language models and vision-language models*
-- Architectures: encoder-only, decoder-only
+- Architectures: encoder-only, decoder-only, mixture-of-experts
 - Attention types: full attention and/or sliding attention
 
 _*Vision-language models currently accept only image inputs. Support for video inputs will be added in a future release._
@@ -31,6 +31,7 @@ If the Transformers model implementation follows all the steps in [writing a cus
 
 - All the features listed in the [compatibility matrix](../features/README.md#feature-x-feature)
 - Any combination of the following vLLM parallelisation schemes:
+    - Data parallel
     - Pipeline parallel
     - Tensor parallel
 
diff --git a/tests/models/registry.py b/tests/models/registry.py
index 1068f97cb5a8..86a835975227 100644
--- a/tests/models/registry.py
+++ b/tests/models/registry.py
@@ -661,6 +661,10 @@ def check_available_online(
     "TransformersForSequenceClassification": _HfExamplesInfo("papluca/xlm-roberta-base-language-detection", min_transformers_version="4.57.0.dev0"),  # noqa: E501
     "TransformersForCausalLM": _HfExamplesInfo("hmellor/Ilama-3.2-1B", trust_remote_code=True),  # noqa: E501
     "TransformersForMultimodalLM": _HfExamplesInfo("BAAI/Emu3-Chat-hf"),
+    "TransformersMoEForCausalLM": _HfExamplesInfo("allenai/OLMoE-1B-7B-0924", min_transformers_version="4.57.0.dev0"),  # noqa: E501
+    "TransformersMoEForMultimodalLM": _HfExamplesInfo("Qwen/Qwen3-VL-30B-A3B-Instruct", min_transformers_version="4.57.0.dev0"),  # noqa: E501
+    "TransformersMoEEmbeddingModel": _HfExamplesInfo("Qwen/Qwen3-30B-A3B", min_transformers_version="4.57.0.dev0"),  # noqa: E501
+    "TransformersMoEForSequenceClassification": _HfExamplesInfo("Qwen/Qwen3-30B-A3B", min_transformers_version="4.57.0.dev0"),  # noqa: E501
 }
 
 _EXAMPLE_MODELS = {
diff --git a/tests/models/test_transformers.py b/tests/models/test_transformers.py
index 733ac8de67a3..bd443575127f 100644
--- a/tests/models/test_transformers.py
+++ b/tests/models/test_transformers.py
@@ -66,6 +66,7 @@ def check_implementation(
     [
         ("meta-llama/Llama-3.2-1B-Instruct", "transformers"),
         ("hmellor/Ilama-3.2-1B", "auto"),  # CUSTOM CODE
+        ("allenai/OLMoE-1B-7B-0924", "transformers"),  # MoE
     ])  # trust_remote_code=True by default
 def test_models(
     hf_runner: type[HfRunner],
@@ -74,6 +75,14 @@ def test_models(
     model: str,
     model_impl: str,
 ) -> None:
+    import transformers
+    from packaging.version import Version
+    installed = Version(transformers.__version__)
+    required = Version("4.57.0.dev0")
+    if model == "allenai/OLMoE-1B-7B-0924" and installed < required:
+        pytest.skip("MoE models with the Transformers backend require "
+                    f"transformers>={required}, but got {installed}")
+
     check_implementation(hf_runner,
                          vllm_runner,
                          example_prompts,
diff --git a/tests/models/utils.py b/tests/models/utils.py
index 7e731cffc047..50936114865a 100644
--- a/tests/models/utils.py
+++ b/tests/models/utils.py
@@ -430,17 +430,26 @@ def dummy_hf_overrides(
 
     update_dict = {
         "num_layers": num_layers,
-        "num_experts": num_experts,
-        "num_experts_per_tok": 2,
-        "num_local_experts": num_experts,
-        # Otherwise there will not be any expert layers
-        "first_k_dense_replace": 0,
-        # To avoid OOM on DeepSeek-V3
-        "n_routed_experts": num_experts,
         # For Gemma-3n
         "num_kv_shared_layers": 1,
     }
 
+    class DummyConfig:
+        hf_text_config = text_config
+
+    # Only set MoE related config when the model has MoE layers.
+    # Otherwise all models detected as MoE by _get_transformers_backend_cls.
+    if ModelConfig.get_num_experts(DummyConfig) > 0:
+        update_dict.update({
+            "num_experts": num_experts,
+            "num_experts_per_tok": 2,
+            "num_local_experts": num_experts,
+            # Otherwise there will not be any expert layers
+            "first_k_dense_replace": 0,
+            # To avoid OOM on DeepSeek-V3
+            "n_routed_experts": num_experts,
+        })
+
     # Update num_hidden_layers for non-Longcat architectures
     if model_arch != "LongcatFlashForCausalLM" \
             and model_arch != "LongCatFlashMTPModel":
diff --git a/vllm/config/model.py b/vllm/config/model.py
index e9d5b58ff2c2..2bf6a1671188 100644
--- a/vllm/config/model.py
+++ b/vllm/config/model.py
@@ -20,7 +20,7 @@
                                     MultiModalConfig)
 from vllm.config.pooler import PoolerConfig
 from vllm.config.scheduler import RunnerType
-from vllm.config.utils import assert_hashable, config
+from vllm.config.utils import assert_hashable, config, getattr_iter
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 from vllm.transformers_utils.config import (
@@ -667,6 +667,8 @@ def validate_model_config_after(self: "ModelConfig") -> "ModelConfig":
     def _get_transformers_backend_cls(self) -> str:
         """Determine which Transformers backend class will be used if
         `model_impl` is set to `transformers` or `auto`."""
+        prefix = "Transformers"
+        prefix += "MoE" if self.get_num_experts() > 1 else ""
         # Check if the architecture we're wrapping has defaults
         runner = None
         convert = None
@@ -685,15 +687,15 @@ def _get_transformers_backend_cls(self) -> str:
         # Resolve Transformers backend pooling classes
         if runner == "pooling":
             if convert == "embed":
-                return "TransformersEmbeddingModel"
+                return prefix + "EmbeddingModel"
             if convert == "classify":
-                return "TransformersForSequenceClassification"
+                return prefix + "ForSequenceClassification"
         # Resolve Transformers backend generate classes
         if self.hf_config != self.hf_text_config:
             # If 'hf_text_config' is the same as 'hf_config'. If not, it is
             # probably a composite config, i.e. multimodal
-            return "TransformersForMultimodalLM"
-        return "TransformersForCausalLM"
+            return prefix + "ForMultimodalLM"
+        return prefix + "ForCausalLM"
 
     def using_transformers_backend(self) -> bool:
         """Check if the model is using the Transformers backend class."""
@@ -1025,17 +1027,7 @@ def _verify_bnb_config(self) -> None:
             self.enforce_eager = True
 
     def _verify_with_expert_parallelism(self) -> None:
-        num_expert_names = [
-            "moe_num_experts",  # Dbrx
-            "num_experts",  # Jamba
-            "n_routed_experts",  # DeepSeek
-            "num_local_experts",  # Mixtral
-        ]
-        num_experts = 0
-        for name in num_expert_names:
-            num_experts = getattr(self.hf_text_config, name, 0)
-            if num_experts > 0:
-                break
+        num_experts = self.get_num_experts()
         if num_experts < 1:
             raise ValueError(
                 "Number of experts in the model must be greater than 0 "
@@ -1220,6 +1212,21 @@ def get_num_attention_heads(self, parallel_config: ParallelConfig) -> int:
         num_heads = getattr(self.hf_text_config, "num_attention_heads", 0)
         return num_heads // parallel_config.tensor_parallel_size
 
+    def get_num_experts(self) -> int:
+        """Returns the number of experts in the model."""
+        num_expert_names = [
+            "num_experts",  # Jamba
+            "moe_num_experts",  # Dbrx
+            "n_routed_experts",  # DeepSeek
+            "num_local_experts",  # Mixtral
+        ]
+        num_experts = getattr_iter(self.hf_text_config, num_expert_names, 0)
+        if isinstance(num_experts, list):
+            # Ernie VL's remote code uses list[int]...
+            # The values are always the same so we just take the first one.
+            return num_experts[0]
+        return num_experts
+
     def get_layers_start_end_indices(
             self, parallel_config: ParallelConfig) -> tuple[int, int]:
         from vllm.distributed.utils import get_pp_indices
diff --git a/vllm/model_executor/layers/fused_moe/layer.py b/vllm/model_executor/layers/fused_moe/layer.py
index 9a7ca7b6d124..3b5ef78b37b0 100644
--- a/vllm/model_executor/layers/fused_moe/layer.py
+++ b/vllm/model_executor/layers/fused_moe/layer.py
@@ -960,6 +960,7 @@ def __init__(
         is_sequence_parallel=False,
         zero_expert_num: Optional[int] = 0,
         zero_expert_type: Optional[str] = None,
+        expert_mapping: Optional[list[tuple[str, str, int, str]]] = None,
     ):
         super().__init__()
         if params_dtype is None:
@@ -996,6 +997,9 @@ def __init__(
         self.zero_expert_num = zero_expert_num
         self.zero_expert_type = zero_expert_type
 
+        # Expert mapping used in self.load_weights
+        self.expert_mapping = expert_mapping
+
         # Round up hidden size if needed.
         hidden_size = maybe_roundup_hidden_size(hidden_size, moe_in_dtype,
                                                 quant_config,
@@ -1617,6 +1621,33 @@ def weight_loader(self,
 
         return False if return_success else None
 
+    def load_weights(
+            self, weights: Iterable[tuple[str,
+                                          torch.Tensor]]) -> Iterable[str]:
+        if (expert_mapping := self.expert_mapping) is None:
+            raise ValueError("`self.expert_mapping` must be provided to "
+                             "load weights using `self.load_weights`.")
+        for expert_name, loaded_weight in weights:
+            qual_name = f"{self.layer_name}.{expert_name}"
+            for param_name, weight_name, expert_id, shard_id in expert_mapping:
+                if weight_name not in qual_name:
+                    continue
+                weight_name = qual_name.replace(weight_name, param_name)
+                param_name = weight_name.removeprefix(f"{self.layer_name}.")
+                param = getattr(self, param_name)
+                success = self.weight_loader(
+                    param=param,
+                    loaded_weight=loaded_weight,
+                    weight_name=weight_name,
+                    shard_id=shard_id,
+                    expert_id=expert_id,
+                    return_success=True,
+                )
+                if success:
+                    logger.debug("Loaded %s for expert %d into %s", param_name,
+                                 expert_id, self.layer_name)
+                    yield param_name
+
     def get_expert_weights(self) -> Iterable[torch.Tensor]:
         weights = list(self.named_parameters())
         assert all(weight.is_contiguous() for _, weight in weights)
diff --git a/vllm/model_executor/models/registry.py b/vllm/model_executor/models/registry.py
index eb572dc30810..94744fe558bd 100644
--- a/vllm/model_executor/models/registry.py
+++ b/vllm/model_executor/models/registry.py
@@ -307,10 +307,14 @@
 }
 
 _TRANSFORMERS_BACKEND_MODELS = {
-    "TransformersEmbeddingModel": ("transformers_pooling", "TransformersEmbeddingModel"),  # noqa: E501
-    "TransformersForSequenceClassification": ("transformers_pooling", "TransformersForSequenceClassification"),  # noqa: E501
     "TransformersForCausalLM": ("transformers", "TransformersForCausalLM"),
     "TransformersForMultimodalLM": ("transformers", "TransformersForMultimodalLM"),  # noqa: E501
+    "TransformersMoEForCausalLM": ("transformers_moe", "TransformersMoEForCausalLM"),  # noqa: E501
+    "TransformersMoEForMultimodalLM": ("transformers_moe", "TransformersMoEForMultimodalLM"),  # noqa: E501
+    "TransformersEmbeddingModel": ("transformers_pooling", "TransformersEmbeddingModel"),  # noqa: E501
+    "TransformersForSequenceClassification": ("transformers_pooling", "TransformersForSequenceClassification"),  # noqa: E501
+    "TransformersMoEForSequenceClassification": ("transformers_pooling", "TransformersMoEForSequenceClassification"),  # noqa: E501
+    "TransformersMoEEmbeddingModel": ("transformers_pooling", "TransformersMoEEmbeddingModel"),  # noqa: E501
 }
 # yapf: enable
 
diff --git a/vllm/model_executor/models/transformers.py b/vllm/model_executor/models/transformers.py
index 070c77073bb0..18a0dafd001d 100644
--- a/vllm/model_executor/models/transformers.py
+++ b/vllm/model_executor/models/transformers.py
@@ -22,6 +22,8 @@
 
 import regex as re
 import torch
+import transformers
+from packaging.version import Version
 from torch import nn
 from transformers import (AutoModel, BatchFeature, PretrainedConfig,
                           PreTrainedModel)
@@ -35,6 +37,7 @@
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.distributed.utils import get_pp_indices
 from vllm.logger import init_logger
+from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
                                                ReplicatedLinear,
                                                RowParallelLinear)
@@ -121,10 +124,14 @@ def can_enable_torch_compile(vllm_config: VllmConfig) -> bool:
     return enable
 
 
+Style = Literal["colwise", "colwise_rep", "rowwise", "rowwise_rep",
+                "replicate"]
+
+
 def replace_linear_class(
     linear: nn.Linear,
-    style: Literal["colwise", "rowwise"],
-    quant_config: QuantizationConfig,
+    style: Style = "replicate",
+    quant_config: Optional[QuantizationConfig] = None,
     *,
     prefix: str = "",
 ) -> Union[ColumnParallelLinear, RowParallelLinear, ReplicatedLinear]:
@@ -132,11 +139,11 @@ def replace_linear_class(
     Replace nn.Linear with one of vLLM's tensor parallel linear classes.
 
     Args:
-        linear (nn.Linear): `nn.Linear` to be replaced.
-        style (str): Tensor parallel style of the new linear, e.g. "colwise".
-        quant_config (QuantConfig): Quantization config for the new linear.
+        linear: `nn.Linear` to be replaced.
+        style: Tensor parallel style of the new linear, e.g. "colwise".
+        quant_config: Quantization config for the new linear.
     Returns:
-        Union[ColumnParallelLinear, RowParallelLinear]: The new linear.
+        The new linear.
     """
 
     if not isinstance(style, str):
@@ -166,6 +173,31 @@ def replace_linear_class(
     )
 
 
+def replace_rms_norm_class(rms_norm: nn.Module, hidden_size: int) -> RMSNorm:
+    """Replace a Transformers RMSNorm with vLLM's RMSNorm.
+
+    This method assumes:
+    - Weight is stored as `weight`.
+    - Epsilon is stored as `eps` or `variance_epsilon`.
+    - `with_scale` indicates whether the layer has a weight (Gemma3n only).
+    - `var_hidden_size` is only ever used for Intern vision encoder in vLLM
+    and Transformers doesn't appear to have the same concept.
+    """
+    kwargs = {
+        "hidden_size": hidden_size,
+        "eps": getattr_iter(rms_norm, ("eps", "variance_epsilon"), 1e-6),
+        "has_weight": getattr(rms_norm, "with_scale", True)
+    }
+    if (weight := getattr(rms_norm, "weight", None)) is not None:
+        # If weight is a Parameter, get its data tensor
+        weight = getattr(weight, "data", weight)
+        kwargs["dtype"] = weight.dtype
+    else:
+        # No weight, fall back to weightless RMSNorm
+        kwargs["has_weight"] = False
+    return RMSNorm(**kwargs)
+
+
 # Copied from `accelerate`
 @contextmanager
 def init_on_device_without_buffers(device: torch.device):
@@ -463,9 +495,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.ignore_unexpected_suffixes: list[str] = []
         """Ignore unexpected weights whose qualname ends with these suffixes."""
 
-        # Skip loading extra bias for GPTQ models.
-        if self.quant_config and "gptq" in self.quant_config.get_name():
-            self.ignore_unexpected_suffixes.append(".bias")
+        if self.quant_config:
+            quant_method_name = self.quant_config.get_name()
+            # Check for unsupported quantization methods.
+            if quant_method_name == "mxfp4":
+                raise NotImplementedError("Transformers backend does not "
+                                          "support MXFP4 quantization yet.")
+            # Skip loading extra bias for GPTQ models.
+            if "gptq" in quant_method_name:
+                self.ignore_unexpected_suffixes.append(".bias")
 
         # Set correct attn and init on "meta" to delay allocating GPU tensors
         # TODO: @raushan, use the public `model.set_attn_implementation()`
@@ -478,8 +516,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 trust_remote_code=self.model_config.trust_remote_code,
             )
 
+        # Remove layers not on this pipeline parallel rank
         self.pipeline_parallel()
-        self.tensor_parallel()
+        # Substitute remaining layers with vLLM's layers as needed
+        self.recursive_replace()
+        # Create attention instances for KV cache allocation
+        self.attention_instances = self.create_attention_instances()
 
         # Input embeddings
         if not isinstance(self.model.get_input_embeddings(), PPMissingLayer):
@@ -494,12 +536,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                     quant_config=self.quant_config,
                 ))
 
-        # Attention layers
-        self.attention_instances = self.create_attention_instances()
-
         # Initialize any parameters that have not had their modules replaced
         self.init_parameters(self.model)
 
+        # Pipeline parallel intermediate tensors
         self.make_empty_intermediate_tensors = (
             make_empty_intermediate_tensors_factory(
                 ["hidden_states"], self.text_config.hidden_size))
@@ -558,56 +598,53 @@ def pipeline_parallel(self):
             if not self.pp_group.is_last_rank:
                 setattr(self.model, name, PPMissingLayer())
 
-    def tensor_parallel(self):
-        """
-        Apply the model's tensor parallelization plan.
-        Currently only supports linear layers.
+    def recursive_replace(self):
+        """Recursively replace modules in the model as needed.
+
+        Currently, this replaces:
+
+        - `nn.Linear` with vLLM's tensor parallel linear classes
+        - `*RMSNorm` with vLLM's `RMSNorm`
         """
-        # Look for tp plans in all of the PreTrainedModels found in self.model
-        is_pretrained_model = lambda m: isinstance(m, PreTrainedModel)
-        supports_tp_plan = lambda m: m.config.base_model_tp_plan is not None
-        pretrained_models = filter(is_pretrained_model, self.model.modules())
-        models_with_tp_plan = filter(supports_tp_plan, pretrained_models)
+        tp_plan = self.model.tp_plan
 
-        if not any(models_with_tp_plan) and self.tp_size > 1:
+        if not tp_plan and self.tp_size > 1:
             tip = get_feature_request_tip(self.model_config.model,
                                           self.model_config.trust_remote_code)
             raise ValueError(
                 f"{type(self.model)} does not support tensor parallel. {tip}")
 
-        def _tensor_parallel(module: nn.Module, prefix: str, tp_plan=None):
-            tp_plan = tp_plan or {}
-
-            # If the current module is a PreTrainedModel, set the tp_plan for
-            # all of its children
-            if isinstance(module, PreTrainedModel):
-                tp_plan = module.config.base_model_tp_plan or {}
-                tp_plan = {
-                    maybe_prefix(prefix, k): v
-                    for k, v in tp_plan.items()
-                }
-
-            # Some weight loaders expect linear layers to inherit from vLLM's
-            # LinearBase class, so we set a default style which causes any
-            # unspecified linear layers to be replaced with ReplicatedLinear
+        # Prefix the patterns because we always start from `self.model`
+        tp_plan = {maybe_prefix("model", k): v for k, v in tp_plan.items()}
+
+        def _recursive_replace(module: nn.Module, prefix: str):
             for child_name, child_module in module.named_children():
+                new_module = child_module
                 qual_name = maybe_prefix(prefix, child_name)
                 if isinstance(child_module, nn.Linear):
                     generator = (p for p in tp_plan if re.match(p, qual_name))
                     pattern = next(generator, None)
+                    # Some weight loaders expect all linear layers to inherit
+                    # LinearBase, so we set a default style which causes any
+                    # unspecified layers to be replaced with ReplicatedLinear
                     style = tp_plan.get(pattern, "replicate")
                     new_module = replace_linear_class(child_module,
                                                       style,
                                                       self.quant_config,
                                                       prefix=qual_name)
+                # TODO(hmellor): Enable RMSNorm replacement once we have a way
+                # to choose RMSNorm vs GemmaRMSNorm
+                # elif child_module.__class__.__name__.endswith("RMSNorm"):
+                #     new_module = replace_rms_norm_class(
+                #         child_module, self.config.hidden_size)
+                else:
+                    _recursive_replace(child_module, prefix=qual_name)
+
+                if new_module is not child_module:
                     setattr(module, child_name, new_module)
                     log_replacement(qual_name, child_module, new_module)
-                else:
-                    _tensor_parallel(child_module,
-                                     prefix=qual_name,
-                                     tp_plan=tp_plan)
 
-        _tensor_parallel(self.model, prefix="model")
+        _recursive_replace(self.model, prefix="model")
 
     def create_attention_instances(
         self,
@@ -657,15 +694,21 @@ def init_parameters(self,
             self.model: PreTrainedModel = AutoModel.from_config(...)
         ```
         """
-        for name, param in module.named_parameters(recurse=False):
-            if param.device == torch.device("meta"):
-                new_param = nn.Parameter(
-                    torch.empty_like(param.data,
-                                     dtype=dtype or self.model_config.dtype,
-                                     device=self.device_config.device))
-                setattr(module, name, new_param)
-        for child in module.children():
-            self.init_parameters(child, dtype)
+
+        def _init_parameters(module: nn.Module, dtype: Optional[torch.dtype]):
+            for name, param in module.named_parameters(recurse=False):
+                if param.device == torch.device("meta"):
+                    new_param = nn.Parameter(
+                        torch.empty_like(
+                            param.data,
+                            dtype=dtype or self.model_config.dtype,
+                            device=self.device_config.device,
+                        ))
+                    setattr(module, name, new_param)
+            for child in module.children():
+                _init_parameters(child, dtype)
+
+        _init_parameters(module, dtype)
 
     def forward(
         self,
@@ -702,8 +745,10 @@ def forward(
 
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(
+        self,
+        weights: Iterable[tuple[str, torch.Tensor]],
+    ) -> set[str]:
         loader = AutoWeightsLoader(
             self,
             skip_prefixes=self.skip_prefixes,
@@ -713,6 +758,14 @@ def load_weights(self, weights: Iterable[tuple[str,
         )
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
+    def check_version(self, min_version: str, feature: str):
+        installed = Version(transformers.__version__)
+        required = Version(min_version)
+        if installed < required:
+            raise ImportError(
+                f"Transformers backend requires transformers>={required} "
+                f"for {feature}, but got {installed}")
+
 
 @support_torch_compile(enable_if=can_enable_torch_compile)
 class TransformersForCausalLM(TransformersBase):
diff --git a/vllm/model_executor/models/transformers_moe.py b/vllm/model_executor/models/transformers_moe.py
new file mode 100644
index 000000000000..cb966256b350
--- /dev/null
+++ b/vllm/model_executor/models/transformers_moe.py
@@ -0,0 +1,268 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+# Copyright 2024 The vLLM team.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+"""Wrapper around `transformers` MoE models."""
+from typing import Any
+
+import torch
+import torch.nn as nn
+
+from vllm.compilation.decorators import support_torch_compile
+from vllm.config.utils import getattr_iter
+from vllm.forward_context import ForwardContext, get_forward_context
+from vllm.model_executor.custom_op import CustomOp
+from vllm.model_executor.layers.fused_moe import FusedMoE
+from vllm.platforms import current_platform
+from vllm.utils import direct_register_custom_op
+
+from .transformers import (TransformersBase, TransformersForCausalLM,
+                           TransformersForMultimodalLM,
+                           can_enable_torch_compile, log_replacement)
+from .utils import maybe_prefix
+
+
+@CustomOp.register("transformers_fused_moe")
+class TransformersFusedMoE(FusedMoE):
+    """Custom FusedMoE for the Transformers backend."""
+
+    def __init__(self, *args, **kwargs):
+        super().__init__(*args, **kwargs)
+        self._top_k_index: torch.Tensor = None
+
+        def custom_routing_function(hidden_states, gating_output, topk,
+                                    renormalize):
+            """Return `top_k_weights` from `gating_output` and the
+            `top_k_index` we stored in the layer earlier."""
+            return gating_output, self._top_k_index
+
+        self.custom_routing_function = custom_routing_function
+
+    def forward(self, hidden_states: torch.Tensor, top_k_index: torch.Tensor,
+                top_k_weights: torch.Tensor, **kwargs: Any) -> torch.Tensor:
+        """In Transformers `experts.forward` will have this signature.
+
+        We discard any extra kwargs because we cannot use them here."""
+        return torch.ops.vllm.transformers_moe_forward(hidden_states,
+                                                       top_k_index,
+                                                       top_k_weights,
+                                                       self.layer_name)
+
+
+def transformers_moe_forward(hidden_states: torch.Tensor,
+                             top_k_index: torch.Tensor,
+                             top_k_weights: torch.Tensor,
+                             layer_name: str) -> torch.Tensor:
+    """Store the `top_k_index` in the layer and call the actual forward."""
+    forward_context: ForwardContext = get_forward_context()
+    self = forward_context.no_compile_layers[layer_name]
+    self._top_k_index = top_k_index
+    # Clone hidden_states because it will be mutated in-place in FusedMoE
+    return self.forward_impl(hidden_states.clone(), top_k_weights)
+
+
+def transformers_moe_forward_fake(hidden_states: torch.Tensor,
+                                  top_k_index: torch.Tensor,
+                                  top_k_weights: torch.Tensor,
+                                  layer_name: str) -> torch.Tensor:
+    return torch.empty_like(hidden_states)
+
+
+direct_register_custom_op(
+    op_name="transformers_moe_forward",
+    op_func=transformers_moe_forward,
+    mutates_args=["hidden_states"],
+    fake_impl=transformers_moe_forward_fake,
+    dispatch_key=current_platform.dispatch_key,
+    tags=(torch.Tag.needs_fixed_stride_order, ),
+)
+
+
+class TransformersMoEBase(TransformersBase):
+
+    def __init__(self, *, vllm_config, prefix=""):
+        self.check_version("4.57.0.dev0", "MoE models support")
+        super().__init__(vllm_config=vllm_config, prefix=prefix)
+
+        if self.parallel_config.enable_expert_parallel:
+            raise NotImplementedError(
+                "Transformers backend does not support expert parallel yet.")
+        if self.parallel_config.enable_eplb:
+            raise NotImplementedError(
+                "Transformers backend does not support expert parallel load "
+                "balancing yet.")
+
+    def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
+        """
+        Params for weights, fp8 weight scales, fp8 activation scales
+        (param_name, weight_name, expert_id, shard_id)
+        """
+        ckpt_names = [
+            # (ckpt_gate_proj_name, ckpt_down_proj_name, ckpt_up_proj_name)
+            ("gate_proj", "down_proj", "up_proj"),  # Most common MoE style
+            ("w1", "w2", "w3"),  # Granite, Mixtral, Phi MoE style
+            ("linear", "linear_1", "linear_v"),  # Grok1 style
+        ]
+        expert_mapping = []
+        for gate_proj, down_proj, up_proj in ckpt_names:
+            expert_mapping.extend(
+                FusedMoE.make_expert_params_mapping(
+                    ckpt_gate_proj_name=gate_proj,
+                    ckpt_down_proj_name=down_proj,
+                    ckpt_up_proj_name=up_proj,
+                    num_experts=self.model_config.get_num_experts(),
+                    num_redundant_experts=0,  # TODO: enable EPLB
+                ))
+        return expert_mapping
+
+    def recursive_replace(self):
+        """Initialize the MoE layers."""
+        text_config = self.text_config
+
+        # Positional arguments
+        num_experts = self.model_config.get_num_experts()
+        top_k = getattr_iter(text_config, ["num_experts_per_tok", "top_k"],
+                             None)
+        assert top_k is not None
+        hidden_size = text_config.hidden_size
+        intermediate_size = getattr_iter(
+            text_config, ["moe_intermediate_size", "intermediate_size"], None)
+        assert intermediate_size is not None
+
+        # If there are shared experts, the results are
+        # reduced after mlp.forward() not inside FusedMoE
+        num_experts_shared = getattr_iter(text_config, [
+            "num_experts_shared", "n_shared_experts", "moe_num_shared_experts"
+        ], 0)
+        reduce_results = num_experts_shared == 0
+
+        def add_all_reduce(mlp: nn.Module):
+            """Adds an all-reduce to the output of `mlp.forward()`."""
+
+            class MLPWithAllReduce(mlp.__class__):
+
+                def forward(self, *args, **kwargs):
+                    output = super().forward(*args, **kwargs)
+                    return self.experts.maybe_all_reduce_tensor_model_parallel(
+                        output)
+
+            mlp.__class__ = MLPWithAllReduce
+
+        # Unused kwargs since we use custom_routing_function:
+        # - `scoring_func` and `e_score_correction_bias` only used for grouped
+        #    topk routing inside vLLM and are non-trivial to infer
+        #    and hard code `use_grouped_topk=False`
+        # - `renormalize` passed anyway because it's easy to infer
+        # - `num_expert_group` and `topk_group` used for inferring expert
+        #    placement strategy in FusedMoE
+        # - `apply_router_weight_on_input` is already applied in Transformers
+        renormalize = getattr(text_config, "norm_topk_prob", top_k > 1)
+        num_expert_group = getattr(text_config, "n_group", None)
+        topk_group = getattr(text_config, "topk_group", None)
+
+        # MoE activation function
+        activation = "silu"
+        wrapped_arch = self.config.architectures[0].lower()
+        if "gptoss" in wrapped_arch:
+            activation = "swigluoai"
+        elif "grok1" in wrapped_arch:
+            activation = "gelu"
+
+        # Expert mapping for `AutoWeightsLoader`
+        expert_mapping = self.get_expert_mapping()
+
+        # Configs
+        parallel_config = self.parallel_config
+        eplb_config = parallel_config.eplb_config
+
+        # Expert parallel load balancing kwargs
+        enable_eplb = parallel_config.enable_eplb
+        num_redundant_experts = eplb_config.num_redundant_experts
+
+        # Recursively fuse MoE layers
+        def _recursive_replace(module: nn.Module, prefix: str):
+            for child_name, child_module in module.named_children():
+                qual_name = maybe_prefix(prefix, child_name)
+                if (child_name == "experts"
+                        and isinstance(child_module, nn.ModuleList)):
+                    # Alias for readability
+                    mlp = module
+                    experts = child_module
+                    # Do the experts have biases
+                    has_bias = False
+                    for experts_param_name, _ in experts.named_parameters():
+                        if "bias" in experts_param_name:
+                            has_bias = True
+                            break
+                    # Double check there are no shared experts
+                    nonlocal reduce_results
+                    if reduce_results:
+                        for mlp_param_name, _ in mlp.named_parameters():
+                            if "shared_expert" in mlp_param_name:
+                                reduce_results = False
+                                break
+                    # Replace experts module with FusedMoE
+                    fused_experts = TransformersFusedMoE(
+                        num_experts=num_experts,
+                        top_k=top_k,
+                        hidden_size=hidden_size,
+                        intermediate_size=intermediate_size,
+                        reduce_results=reduce_results,
+                        renormalize=renormalize,
+                        # Hard coded because topk happens in Transformers
+                        use_grouped_topk=False,
+                        num_expert_group=num_expert_group,
+                        topk_group=topk_group,
+                        quant_config=self.quant_config,
+                        prefix=qual_name,
+                        activation=activation,
+                        enable_eplb=enable_eplb,
+                        num_redundant_experts=num_redundant_experts,
+                        has_bias=has_bias,
+                        expert_mapping=expert_mapping,
+                    )
+                    mlp.experts = fused_experts
+                    log_replacement(qual_name, experts, fused_experts)
+                    # If results are not all-reduced in FusedMoE, ensure they
+                    # are all-reduced at the end of mlp.forward() if tensor
+                    # parallel or expert parallel is enabled
+                    if not reduce_results and (fused_experts.tp_size > 1
+                                               or fused_experts.ep_size > 1):
+                        add_all_reduce(mlp)
+                else:
+                    _recursive_replace(child_module, prefix=qual_name)
+
+        _recursive_replace(self.model, prefix="model")
+        # Continue with the replacement of layers in TransformersBase
+        super().recursive_replace()
+
+
+@support_torch_compile(enable_if=can_enable_torch_compile)
+class TransformersMoEForCausalLM(TransformersMoEBase, TransformersForCausalLM):
+    pass
+
+
+@support_torch_compile(
+    # set `positions` to last dim to support Qwen-mrope
+    dynamic_arg_dims={
+        "input_ids": 0,
+        "positions": -1,
+        "intermediate_tensors": 0,
+        "inputs_embeds": 0,
+    },
+    enable_if=can_enable_torch_compile)
+class TransformersMoEForMultimodalLM(TransformersMoEForCausalLM,
+                                     TransformersForMultimodalLM):
+    pass
diff --git a/vllm/model_executor/models/transformers_pooling.py b/vllm/model_executor/models/transformers_pooling.py
index 7e262ade156a..27fd40999fe2 100644
--- a/vllm/model_executor/models/transformers_pooling.py
+++ b/vllm/model_executor/models/transformers_pooling.py
@@ -20,7 +20,7 @@
 import torch
 from transformers import AutoModelForSequenceClassification
 
-from vllm.attention import AttentionType
+from vllm.attention import Attention, AttentionType
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import VllmConfig
 from vllm.model_executor.layers.pooler import (ClassifierPooler, CLSPool,
@@ -29,6 +29,7 @@
 
 from .interfaces_base import VllmModelForPooling
 from .transformers import TransformersBase, can_enable_torch_compile
+from .transformers_moe import TransformersMoEBase
 from .utils import WeightsMapper
 
 
@@ -79,7 +80,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.padding_idx = self.text_config.pad_token_id
 
     def create_attention_instances(
-            self, attn_type: AttentionType = AttentionType.DECODER):
+        self,
+        attn_type: AttentionType = AttentionType.DECODER
+    ) -> dict[int, Attention]:
         # TODO(hmellor): Better way to detect encoder models
         # In encoder models, the attention layers will have `is_causal=False`
         is_encoder = lambda m: not getattr(m, "is_causal", True)
@@ -90,14 +93,7 @@ def create_attention_instances(
 
         # Check minimum transformers version for encoder models support
         if attn_type == AttentionType.ENCODER_ONLY:
-            import transformers
-            from packaging.version import Version
-            installed = Version(transformers.__version__)
-            required = Version("4.57.0.dev0")
-            if installed < required:
-                raise ValueError(
-                    "Encoder models with the Transformers backend require "
-                    f"transformers>={required}, but got {installed}")
+            self.check_version("4.57.0.dev0", "encoder models support")
 
         return super().create_attention_instances(attn_type)
 
@@ -198,3 +194,15 @@ def forward(self, *args, **kwargs):
                     vllm_config.model_config),
             ),
         })
+
+
+@support_torch_compile(enable_if=can_enable_torch_compile)
+class TransformersMoEEmbeddingModel(TransformersMoEBase,
+                                    TransformersEmbeddingModel):
+    pass
+
+
+@support_torch_compile(enable_if=can_enable_torch_compile)
+class TransformersMoEForSequenceClassification(
+        TransformersMoEBase, TransformersForSequenceClassification):
+    pass

From 0e13c0a003d4048acaa60b8895471e8967b87692 Mon Sep 17 00:00:00 2001
From: ahao-anyscale <ahao@anyscale.com>
Date: Thu, 2 Oct 2025 23:59:36 -0700
Subject: [PATCH 119/193] [BUG] Reorder model config creation (#26124)

Signed-off-by: ahao-anyscale <ahao@anyscale.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/engine/arg_utils.py | 5 ++++-
 1 file changed, 4 insertions(+), 1 deletion(-)

diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index ec61fc4b9b06..7763dbc392e4 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -1131,6 +1131,10 @@ def create_engine_config(
         device_config = DeviceConfig(
             device=cast(Device, current_platform.device_type))
 
+        model_config = self.create_model_config()
+        self.model = model_config.model
+        self.tokenizer = model_config.tokenizer
+
         (self.model, self.tokenizer,
          self.speculative_config) = maybe_override_with_speculators(
              model=self.model,
@@ -1139,7 +1143,6 @@ def create_engine_config(
              trust_remote_code=self.trust_remote_code,
              vllm_speculative_config=self.speculative_config,
          )
-        model_config = self.create_model_config()
 
         # * If VLLM_USE_V1 is unset, we enable V1 for "supported features"
         #   and fall back to V0 for experimental or unsupported features.

From a9e50dd3031cd46a25fad7f83937c291d677e4d4 Mon Sep 17 00:00:00 2001
From: Varun Sundar Rabindranath <varunsundar08@gmail.com>
Date: Fri, 3 Oct 2025 03:00:33 -0400
Subject: [PATCH 120/193] [Misc] Remove typing.List (#26150)

Signed-off-by: Varun Sundar Rabindranath <vsundarr@redhat.com>
Co-authored-by: Varun Sundar Rabindranath <vsundarr@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/layers/fused_moe/fused_moe.py | 9 +++------
 1 file changed, 3 insertions(+), 6 deletions(-)

diff --git a/vllm/model_executor/layers/fused_moe/fused_moe.py b/vllm/model_executor/layers/fused_moe/fused_moe.py
index 0fd1b60f3bdf..49f278c72007 100644
--- a/vllm/model_executor/layers/fused_moe/fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_moe.py
@@ -4,9 +4,6 @@
 import functools
 import json
 import os
-# torch.compile needs typing.List. It will fail torch.library.infer_schema
-# otherwise
-from typing import List  # noqa: UP035
 from typing import Any, Callable, Optional, Union
 
 import torch
@@ -1229,7 +1226,7 @@ def inplace_fused_experts(
     w2_zp: Optional[torch.Tensor] = None,
     a1_scale: Optional[torch.Tensor] = None,
     a2_scale: Optional[torch.Tensor] = None,
-    block_shape: Optional[List[int]] = None,  #noqa: UP006
+    block_shape: Optional[list[int]] = None,
     w1_bias: Optional[torch.Tensor] = None,
     w2_bias: Optional[torch.Tensor] = None,
 ) -> None:
@@ -1263,7 +1260,7 @@ def inplace_fused_experts_fake(
     w2_zp: Optional[torch.Tensor] = None,
     a1_scale: Optional[torch.Tensor] = None,
     a2_scale: Optional[torch.Tensor] = None,
-    block_shape: Optional[List[int]] = None,  #noqa: UP006
+    block_shape: Optional[list[int]] = None,
     w1_bias: Optional[torch.Tensor] = None,
     w2_bias: Optional[torch.Tensor] = None,
 ) -> None:
@@ -1302,7 +1299,7 @@ def outplace_fused_experts(
     w2_zp: Optional[torch.Tensor] = None,
     a1_scale: Optional[torch.Tensor] = None,
     a2_scale: Optional[torch.Tensor] = None,
-    block_shape: Optional[List[int]] = None,  #noqa: UP006
+    block_shape: Optional[list[int]] = None,
     w1_bias: Optional[torch.Tensor] = None,
     w2_bias: Optional[torch.Tensor] = None,
 ) -> torch.Tensor:

From f7502c51133619ca03156dc70dc236bc5d604a36 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Fri, 3 Oct 2025 15:23:21 +0800
Subject: [PATCH 121/193] [Input] Remove unused `prompt` field (#26097)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../processing/test_transformers.py           |  3 +-
 vllm/engine/protocol.py                       | 11 ++++--
 vllm/inputs/data.py                           |  8 ----
 vllm/inputs/preprocess.py                     | 37 +++++++++----------
 vllm/model_executor/models/llava.py           |  3 +-
 vllm/model_executor/models/paligemma.py       |  1 -
 vllm/model_executor/models/phi3v.py           | 10 ++---
 .../models/qwen2_5_omni_thinker.py            | 24 ++++--------
 vllm/model_executor/models/terratorch.py      |  1 -
 vllm/model_executor/models/transformers.py    |  1 -
 vllm/multimodal/inputs.py                     |  6 ---
 vllm/multimodal/processing.py                 | 28 ++++----------
 vllm/v1/engine/async_llm.py                   | 14 ++++---
 vllm/v1/engine/llm_engine.py                  | 13 ++++---
 vllm/v1/engine/processor.py                   |  8 +---
 15 files changed, 67 insertions(+), 101 deletions(-)

diff --git a/tests/models/multimodal/processing/test_transformers.py b/tests/models/multimodal/processing/test_transformers.py
index 54a0be99384a..c0e043ade736 100644
--- a/tests/models/multimodal/processing/test_transformers.py
+++ b/tests/models/multimodal/processing/test_transformers.py
@@ -37,4 +37,5 @@ def test_multimodal_processor(model_id):
         hf_processor_mm_kwargs={},
     )
 
-    assert str_processed_inputs["prompt"] == ids_processed_inputs["prompt"]
+    assert (str_processed_inputs["prompt_token_ids"]
+            == ids_processed_inputs["prompt_token_ids"])
diff --git a/vllm/engine/protocol.py b/vllm/engine/protocol.py
index 9aea74d0c8f3..997c99af2408 100644
--- a/vllm/engine/protocol.py
+++ b/vllm/engine/protocol.py
@@ -94,10 +94,15 @@ async def beam_search(
         #    this happens again in generation, so the double expansion causes
         #    a mismatch.
         # TODO - would be ideal to handle this more gracefully.
-        prompt_token_ids = prompt.get("prompt_token_ids")
-        multi_modal_data = prompt.get("multi_modal_data")
+        if isinstance(prompt, str):
+            prompt_text = prompt
+            prompt_token_ids = []
+            multi_modal_data = None
+        else:
+            prompt_text = prompt.get("prompt")
+            prompt_token_ids = prompt.get("prompt_token_ids", [])
+            multi_modal_data = prompt.get("multi_modal_data")
 
-        prompt_text = processed_inputs.get("prompt")
         mm_processor_kwargs = processed_inputs.get("mm_processor_kwargs")
 
         tokenized_length = len(prompt_token_ids)
diff --git a/vllm/inputs/data.py b/vllm/inputs/data.py
index 1718c0767ab6..562e73eead66 100644
--- a/vllm/inputs/data.py
+++ b/vllm/inputs/data.py
@@ -205,11 +205,6 @@ class TokenInputs(TypedDict):
     prompt_token_ids: list[int]
     """The token IDs of the prompt."""
 
-    prompt: NotRequired[str]
-    """
-    The original prompt text corresponding to the token IDs, if available.
-    """
-
     cache_salt: NotRequired[str]
     """
     Optional cache salt to be used for prefix caching.
@@ -218,15 +213,12 @@ class TokenInputs(TypedDict):
 
 def token_inputs(
     prompt_token_ids: list[int],
-    prompt: Optional[str] = None,
     cache_salt: Optional[str] = None,
 ) -> TokenInputs:
     """Construct [`TokenInputs`][vllm.inputs.data.TokenInputs] from optional
     values."""
     inputs = TokenInputs(type="token", prompt_token_ids=prompt_token_ids)
 
-    if prompt is not None:
-        inputs["prompt"] = prompt
     if cache_salt is not None:
         inputs["cache_salt"] = cache_salt
 
diff --git a/vllm/inputs/preprocess.py b/vllm/inputs/preprocess.py
index 7518cd8fc897..65460b46cb5a 100644
--- a/vllm/inputs/preprocess.py
+++ b/vllm/inputs/preprocess.py
@@ -16,9 +16,10 @@
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
 from .data import (DecoderOnlyInputs, EmbedsInputs, EmbedsPrompt,
-                   EncoderDecoderInputs, ProcessorInputs, PromptType,
-                   SingletonInputs, SingletonPrompt, TextPrompt, TokenInputs,
-                   TokensPrompt, embeds_inputs, token_inputs)
+                   EncoderDecoderInputs, ExplicitEncoderDecoderPrompt,
+                   ProcessorInputs, PromptType, SingletonInputs,
+                   SingletonPrompt, TextPrompt, TokenInputs, TokensPrompt,
+                   embeds_inputs, token_inputs)
 from .parse import is_explicit_encoder_decoder_prompt, parse_singleton_prompt
 
 logger = init_logger(__name__)
@@ -322,7 +323,7 @@ def _process_tokens(
                 mm_uuids=mm_uuids,
             )
         else:
-            inputs = token_inputs(prompt_token_ids=prompt_token_ids)
+            inputs = token_inputs(prompt_token_ids)
 
         if cache_salt := parsed_content.get("cache_salt"):
             inputs["cache_salt"] = cache_salt
@@ -352,10 +353,7 @@ def _process_text(
                 prompt_text,
                 tokenization_kwargs=tokenization_kwargs,
             )
-            inputs = token_inputs(
-                prompt=prompt_text,
-                prompt_token_ids=prompt_token_ids,
-            )
+            inputs = token_inputs(prompt_token_ids)
 
         if cache_salt := parsed_content.get("cache_salt"):
             inputs["cache_salt"] = cache_salt
@@ -473,22 +471,17 @@ def _split_enc_dec_mm_inputs(
         decoder_inputs: SingletonInputs
 
         if inputs["type"] == "multimodal":  # Multimodal data inputs
-            if not ("encoder_prompt" in inputs
-                    and "encoder_prompt_token_ids" in inputs):
+            if "encoder_prompt_token_ids" not in inputs:
                 raise RuntimeError("You should register an encoder-decoder "
                                    "multi-modal processor for encoder-decoder "
                                    "models.")
             inputs = cast(MultiModalEncDecInputs, inputs)
 
-            encoder_inputs = token_inputs(
-                prompt=inputs["encoder_prompt"],
-                prompt_token_ids=inputs["encoder_prompt_token_ids"],
-            )
+            encoder_inputs = token_inputs(inputs["encoder_prompt_token_ids"])
 
             decoder_prompt_inputs = decoder_inputs_to_override or inputs
             decoder_inputs = MultiModalInputs(
                 type="multimodal",
-                prompt=decoder_prompt_inputs.get("prompt", ""),
                 prompt_token_ids=decoder_prompt_inputs["prompt_token_ids"],
                 mm_kwargs=inputs["mm_kwargs"],
                 mm_hashes=inputs["mm_hashes"],
@@ -498,7 +491,7 @@ def _split_enc_dec_mm_inputs(
                 decoder_inputs["cache_salt"] = cache_salt
 
         elif inputs["type"] == "token":  # Text-only inputs
-            encoder_inputs = token_inputs(prompt="", prompt_token_ids=[])
+            encoder_inputs = token_inputs(prompt_token_ids=[])
             decoder_inputs = decoder_inputs_to_override or inputs
         else:
             assert_never(inputs)  # type: ignore[arg-type]
@@ -549,12 +542,14 @@ def _process_encoder_decoder_prompt(
         decoder_inputs: Optional[SingletonInputs]
 
         if is_explicit_encoder_decoder_prompt(prompt):
+            # `cast` is needed for mypy, but not pyright
+            prompt_ = cast(ExplicitEncoderDecoderPrompt, prompt)
             encoder_inputs = self._prompt_to_llm_inputs(
-                prompt["encoder_prompt"],
+                prompt_["encoder_prompt"],
                 tokenization_kwargs=tokenization_kwargs,
                 mm_uuids=mm_uuids,
             )
-            if (decoder_input := prompt["decoder_prompt"]) is None:
+            if (decoder_input := prompt_["decoder_prompt"]) is None:
                 decoder_inputs = None
             else:
                 decoder_inputs = self._prompt_to_llm_inputs(decoder_input)
@@ -565,8 +560,9 @@ def _process_encoder_decoder_prompt(
                     self._split_enc_dec_mm_inputs(encoder_inputs,
                                                   decoder_inputs))
         else:
+            # `cast` is needed for mypy, but not pyright
             inputs = self._prompt_to_llm_inputs(
-                prompt,
+                cast(SingletonPrompt, prompt),
                 tokenization_kwargs=tokenization_kwargs,
                 mm_uuids=mm_uuids,
             )
@@ -641,8 +637,9 @@ def preprocess(
                              "to decoder-only models")
 
         # Decoder-only operation
+        # `cast` is needed for mypy, but not pyright
         return self._process_decoder_only_prompt(
-            prompt,
+            cast(SingletonPrompt, prompt),
             tokenization_kwargs=tokenization_kwargs,
             mm_uuids=mm_uuids,
         )
diff --git a/vllm/model_executor/models/llava.py b/vllm/model_executor/models/llava.py
index 78c413b77051..9f338f2ae3fb 100644
--- a/vllm/model_executor/models/llava.py
+++ b/vllm/model_executor/models/llava.py
@@ -778,7 +778,7 @@ def get_replacement_mantis(item_idx: int):
             )
         ], mm_item_counts)
 
-        prompt_ids, prompt, _ = self._apply_prompt_updates(
+        prompt_ids, _ = self._apply_prompt_updates(
             result["prompt_token_ids"],
             mantis_mm_repls,
         )
@@ -798,7 +798,6 @@ def get_replacement_mantis(item_idx: int):
 
         return MultiModalInputs(
             type="multimodal",
-            prompt=prompt,
             prompt_token_ids=prompt_ids,
             mm_kwargs=mm_kwargs,
             mm_hashes=mm_hashes,
diff --git a/vllm/model_executor/models/paligemma.py b/vllm/model_executor/models/paligemma.py
index d118e6c89ab5..d7108a5e5feb 100644
--- a/vllm/model_executor/models/paligemma.py
+++ b/vllm/model_executor/models/paligemma.py
@@ -219,7 +219,6 @@ def apply(
         if len(prompt_token_ids) and prompt_token_ids[-1] != newline_token_id:
             prompt_token_ids.append(newline_token_id)
             mm_inputs["prompt_token_ids"] = prompt_token_ids
-            mm_inputs["prompt"] += newline_prompt
 
         return mm_inputs
 
diff --git a/vllm/model_executor/models/phi3v.py b/vllm/model_executor/models/phi3v.py
index 59977796e2af..a6baeaa526e7 100644
--- a/vllm/model_executor/models/phi3v.py
+++ b/vllm/model_executor/models/phi3v.py
@@ -461,7 +461,7 @@ def _apply_prompt_updates(
         self,
         token_ids: list[int],
         mm_prompt_updates: MultiModalPromptUpdates,
-    ) -> tuple[list[int], str, Mapping[str, list[PlaceholderFeaturesInfo]]]:
+    ) -> tuple[list[int], Mapping[str, list[PlaceholderFeaturesInfo]]]:
         # align to hf behavior when there are images
         if len(mm_prompt_updates):
             tokenizer = self.info.get_tokenizer()
@@ -496,14 +496,14 @@ def _apply_prompt_updates(
                 for ele in sublist for e in ele
             ]
 
-        token_ids, text, placeholders = super()._apply_prompt_updates(
+        token_ids, placeholders = super()._apply_prompt_updates(
             token_ids=token_ids,
             mm_prompt_updates=mm_prompt_updates,
         )
 
         # Keep the behavior in line with HF processor
-        if text.startswith("<s> <|image|>"):
-            text = text.replace("<s> <|image|>", "<s><|image|>", 1)
+        if token_ids[:2] == tokenizer.encode("<s> <|image|>",
+                                             add_special_tokens=False):
             token_ids = [token_ids[0], *token_ids[2:]]
             placeholders = {
                 modality: [
@@ -518,7 +518,7 @@ def _apply_prompt_updates(
                 for modality, ps in placeholders.items()
             }
 
-        return token_ids, text, placeholders
+        return token_ids, placeholders
 
 
 @MULTIMODAL_REGISTRY.register_processor(Phi3VMultiModalProcessor,
diff --git a/vllm/model_executor/models/qwen2_5_omni_thinker.py b/vllm/model_executor/models/qwen2_5_omni_thinker.py
index b5e82c9b21cd..af0a97e3c867 100644
--- a/vllm/model_executor/models/qwen2_5_omni_thinker.py
+++ b/vllm/model_executor/models/qwen2_5_omni_thinker.py
@@ -63,7 +63,7 @@
                                         PromptReplacement, PromptUpdate)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
-from vllm.transformers_utils.tokenizer import decode_tokens, encode_tokens
+from vllm.transformers_utils.tokenizer import encode_tokens
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
@@ -316,7 +316,7 @@ def _maybe_apply_prompt_updates(
         mm_kwargs: MultiModalKwargsItems,
         mm_prompt_updates: MultiModalPromptUpdates,
         is_update_applied: bool,
-    ) -> tuple[list[int], str, Mapping[str, list[PlaceholderFeaturesInfo]]]:
+    ) -> tuple[list[int], Mapping[str, list[PlaceholderFeaturesInfo]]]:
         """
         Qwen2.5-Omni reimplements this function to handle `use_audio_in_video`.
         """
@@ -341,28 +341,20 @@ def _maybe_apply_prompt_updates(
             self._validate_mm_placeholders(
                 mm_placeholders,
                 mm_item_counts,
-                use_audio_in_video=use_audio_in_video)
-
-            tokenizer = self.info.get_tokenizer()
-            prompt = decode_tokens(tokenizer, prompt_ids)
+                use_audio_in_video=use_audio_in_video,
+            )
         else:
-            (
-                prompt_ids,
-                prompt,
-                mm_placeholders,
-            ) = self._apply_prompt_updates(
+            prompt_ids, mm_placeholders = self._apply_prompt_updates(
                 prompt_ids,
                 mm_prompt_updates,
             )
             self._validate_mm_placeholders(
                 mm_placeholders,
                 mm_item_counts,
-                use_audio_in_video=use_audio_in_video)
-
-        tokenizer = self.info.get_tokenizer()
-        prompt = decode_tokens(tokenizer, prompt_ids)
+                use_audio_in_video=use_audio_in_video,
+            )
 
-        return prompt_ids, prompt, mm_placeholders
+        return prompt_ids, mm_placeholders
 
     def _get_prompt_updates(
         self,
diff --git a/vllm/model_executor/models/terratorch.py b/vllm/model_executor/models/terratorch.py
index 938b02e3e04b..5082054596d8 100644
--- a/vllm/model_executor/models/terratorch.py
+++ b/vllm/model_executor/models/terratorch.py
@@ -190,7 +190,6 @@ def apply(
 
         return MultiModalInputs(
             type="multimodal",
-            prompt=prompt,
             prompt_token_ids=[1],
             mm_kwargs=mm_kwargs,
             mm_hashes=mm_hashes,
diff --git a/vllm/model_executor/models/transformers.py b/vllm/model_executor/models/transformers.py
index 18a0dafd001d..fffdbd00babb 100644
--- a/vllm/model_executor/models/transformers.py
+++ b/vllm/model_executor/models/transformers.py
@@ -453,7 +453,6 @@ def apply(
 
         return MultiModalInputs(
             type="multimodal",
-            prompt=prompt,
             prompt_token_ids=prompt_ids,
             mm_kwargs=mm_kwargs,
             mm_hashes=mm_hashes,
diff --git a/vllm/multimodal/inputs.py b/vllm/multimodal/inputs.py
index 3539517ed45e..14d0c8dda78e 100644
--- a/vllm/multimodal/inputs.py
+++ b/vllm/multimodal/inputs.py
@@ -949,9 +949,6 @@ class MultiModalInputs(TypedDict):
     type: Literal["multimodal"]
     """The type of inputs."""
 
-    prompt: str
-    """The processed prompt text."""
-
     prompt_token_ids: list[int]
     """The processed token IDs which includes placeholder tokens."""
 
@@ -980,8 +977,5 @@ class MultiModalEncDecInputs(MultiModalInputs):
     ready to be passed to vLLM internals.
     """
 
-    encoder_prompt: str
-    """The processed encoder prompt text."""
-
     encoder_prompt_token_ids: list[int]
     """The processed token IDs of the encoder prompt."""
diff --git a/vllm/multimodal/processing.py b/vllm/multimodal/processing.py
index ce671479b1ae..bc998dc2785f 100644
--- a/vllm/multimodal/processing.py
+++ b/vllm/multimodal/processing.py
@@ -1878,7 +1878,7 @@ def _apply_prompt_updates(
         self,
         token_ids: list[int],
         mm_prompt_updates: MultiModalPromptUpdates,
-    ) -> tuple[list[int], str, Mapping[str, list[PlaceholderFeaturesInfo]]]:
+    ) -> tuple[list[int], Mapping[str, list[PlaceholderFeaturesInfo]]]:
         tokenizer = self.info.get_tokenizer()
 
         new_token_ids, match_result = self._apply_token_matches(
@@ -1896,11 +1896,9 @@ def _apply_prompt_updates(
         # Since it is inefficient to search for all possible tokenizations
         # of the search text in the prompt, we instead perform string-based
         # updates on the decoded token IDs, then encode them back.
-        if all(
+        if not all(
                 all(update_idx is not None for update_idx in update_idxs)
                 for update_idxs in match_result.values()):
-            new_text = decode_tokens(tokenizer, new_token_ids)
-        else:
             new_text, match_result = self._apply_text_matches(
                 decode_tokens(tokenizer, token_ids),
                 mm_prompt_updates,
@@ -1928,7 +1926,7 @@ def _apply_prompt_updates(
             dict(matched_updates),
         )
 
-        return new_token_ids, new_text, placeholders
+        return new_token_ids, placeholders
 
     def _validate_mm_kwargs(
         self,
@@ -1976,7 +1974,7 @@ def _maybe_apply_prompt_updates(
         mm_kwargs: MultiModalKwargsOptionalItems,
         mm_prompt_updates: MultiModalPromptUpdates,
         is_update_applied: bool,
-    ) -> tuple[list[int], str, Mapping[str, list[PlaceholderFeaturesInfo]]]:
+    ) -> tuple[list[int], Mapping[str, list[PlaceholderFeaturesInfo]]]:
         mm_item_counts = mm_items.get_all_counts()
         self._validate_mm_kwargs(mm_kwargs, mm_item_counts)
 
@@ -1986,21 +1984,14 @@ def _maybe_apply_prompt_updates(
                 mm_prompt_updates,
             )
             self._validate_mm_placeholders(mm_placeholders, mm_item_counts)
-
-            tokenizer = self.info.get_tokenizer()
-            prompt = decode_tokens(tokenizer, prompt_ids)
         else:
-            (
-                prompt_ids,
-                prompt,
-                mm_placeholders,
-            ) = self._apply_prompt_updates(
+            prompt_ids, mm_placeholders = self._apply_prompt_updates(
                 prompt_ids,
                 mm_prompt_updates,
             )
             self._validate_mm_placeholders(mm_placeholders, mm_item_counts)
 
-        return prompt_ids, prompt, mm_placeholders
+        return prompt_ids, mm_placeholders
 
     def apply(
         self,
@@ -2042,7 +2033,7 @@ def apply(
         )
 
         # NOTE: tokenization_kwargs are not required to init processor
-        prompt_ids, prompt, mm_placeholders = self._maybe_apply_prompt_updates(
+        prompt_ids, mm_placeholders = self._maybe_apply_prompt_updates(
             mm_items=mm_items,
             prompt_ids=prompt_ids,
             mm_kwargs=mm_info.kwargs,
@@ -2057,7 +2048,6 @@ def apply(
 
         return MultiModalInputs(
             type="multimodal",
-            prompt=prompt,
             prompt_token_ids=prompt_ids,
             mm_kwargs=mm_info.kwargs,
             mm_hashes=mm_info.hashes,
@@ -2100,19 +2090,15 @@ def _get_enc_dec_inputs(
         tokenizer = self.info.get_tokenizer()
         decoder_prompt_raw = self.create_decoder_prompt(prompt, mm_data)
         if isinstance(decoder_prompt_raw, str):
-            decoder_prompt = decoder_prompt_raw
             decoder_prompt_ids = encode_tokens(tokenizer,
                                                decoder_prompt_raw,
                                                add_special_tokens=False)
         else:
-            decoder_prompt = decode_tokens(tokenizer, decoder_prompt_raw)
             decoder_prompt_ids = decoder_prompt_raw
 
         mm_inputs = MultiModalEncDecInputs(
-            encoder_prompt=encoder_inputs["prompt"],
             encoder_prompt_token_ids=encoder_inputs["prompt_token_ids"],
             **encoder_inputs)
-        mm_inputs["prompt"] = decoder_prompt
         mm_inputs["prompt_token_ids"] = decoder_prompt_ids
         return mm_inputs
 
diff --git a/vllm/v1/engine/async_llm.py b/vllm/v1/engine/async_llm.py
index 36d0d50bf23d..e88b4c5346c3 100644
--- a/vllm/v1/engine/async_llm.py
+++ b/vllm/v1/engine/async_llm.py
@@ -281,12 +281,16 @@ async def add_request(
         queue = RequestOutputCollector(output_kind=params.output_kind)
 
         # Convert Input --> Request.
-        prompt_str, request = self.processor.process_inputs(
-            request_id, prompt, params, arrival_time, lora_request,
-            tokenization_kwargs, trace_headers, priority, data_parallel_rank)
+        request = self.processor.process_inputs(request_id, prompt, params,
+                                                arrival_time, lora_request,
+                                                tokenization_kwargs,
+                                                trace_headers, priority,
+                                                data_parallel_rank)
+        prompt_text = prompt if isinstance(prompt,
+                                           str) else prompt.get("prompt")
 
         if is_pooling or params.n == 1:
-            await self._add_request(request, prompt_str, None, 0, queue)
+            await self._add_request(request, prompt_text, None, 0, queue)
             return queue
 
         # Get the updated SamplingParams from the request, which
@@ -302,7 +306,7 @@ async def add_request(
                 request)
             child_request.request_id = request_id
             child_request.sampling_params = child_params
-            await self._add_request(child_request, prompt_str, parent_request,
+            await self._add_request(child_request, prompt_text, parent_request,
                                     idx, queue)
         return queue
 
diff --git a/vllm/v1/engine/llm_engine.py b/vllm/v1/engine/llm_engine.py
index 2738776e3d37..f81427161d7d 100644
--- a/vllm/v1/engine/llm_engine.py
+++ b/vllm/v1/engine/llm_engine.py
@@ -227,15 +227,18 @@ def add_request(
                 f"request_id must be a string, got {type(request_id)}")
 
         # Process raw inputs into the request.
-        prompt_str, request = self.processor.process_inputs(
-            request_id, prompt, params, arrival_time, lora_request,
-            tokenization_kwargs, trace_headers, priority)
+        request = self.processor.process_inputs(request_id, prompt, params,
+                                                arrival_time, lora_request,
+                                                tokenization_kwargs,
+                                                trace_headers, priority)
+        prompt_text = prompt if isinstance(prompt,
+                                           str) else prompt.get("prompt")
 
         n = params.n if isinstance(params, SamplingParams) else 1
 
         if n == 1:
             # Make a new RequestState and queue.
-            self.output_processor.add_request(request, prompt_str, None, 0)
+            self.output_processor.add_request(request, prompt_text, None, 0)
             # Add the request to EngineCore.
             self.engine_core.add_request(request)
             return
@@ -249,7 +252,7 @@ def add_request(
             child_request.sampling_params = params
 
             # Make a new RequestState and queue.
-            self.output_processor.add_request(child_request, prompt_str,
+            self.output_processor.add_request(child_request, prompt_text,
                                               parent_req, idx)
             # Add the request to EngineCore.
             self.engine_core.add_request(child_request)
diff --git a/vllm/v1/engine/processor.py b/vllm/v1/engine/processor.py
index 843ca9ad68e3..c30ceb96a5e0 100644
--- a/vllm/v1/engine/processor.py
+++ b/vllm/v1/engine/processor.py
@@ -334,9 +334,7 @@ def process_inputs(
         trace_headers: Optional[Mapping[str, str]] = None,
         priority: int = 0,
         data_parallel_rank: Optional[int] = None,
-    ) -> tuple[Optional[str], EngineCoreRequest]:
-
-        # TODO(woosuk): Support pooling models.
+    ) -> EngineCoreRequest:
         self._validate_lora(lora_request)
         self._validate_params(params)
 
@@ -395,8 +393,6 @@ def process_inputs(
         # discriminated unions of TypedDicts, because of how it handles
         # inheritance of TypedDict. If we explicitly extract the items we want
         # we can avoid type errors from using `dict.get` later in the method.
-        prompt_str: Optional[str] = None if decoder_inputs[
-            "type"] == "embeds" else decoder_inputs.get("prompt")
         prompt_token_ids = decoder_inputs[
             "prompt_token_ids"] if decoder_inputs["type"] != "embeds" else None
         prompt_embeds = decoder_inputs["prompt_embeds"] if decoder_inputs[
@@ -442,7 +438,7 @@ def process_inputs(
                         identifier=decoder_mm_hashes[modality][idx],
                         mm_position=decoder_mm_positions[modality][idx]))
 
-        return prompt_str, EngineCoreRequest(
+        return EngineCoreRequest(
             request_id=request_id,
             prompt_token_ids=prompt_token_ids,
             prompt_embeds=prompt_embeds,

From f021439b095b224a4255a1684831c6c022f450eb Mon Sep 17 00:00:00 2001
From: Jiangyun Zhu <riverclouds.zhu@qq.com>
Date: Fri, 3 Oct 2025 16:33:46 +0800
Subject: [PATCH 122/193] [Perf] Optimize `reshape_and_cache` CUDA Kernel
 (#25955)

Signed-off-by: zjy0516 <riverclouds.zhu@qq.com>
Co-authored-by: Liu-congo <1502632128@qq.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../kernels/benchmark_reshape_and_cache.py    | 174 ++++++++++++++++++
 csrc/cache_kernels.cu                         |  96 +++++-----
 2 files changed, 225 insertions(+), 45 deletions(-)
 create mode 100644 benchmarks/kernels/benchmark_reshape_and_cache.py

diff --git a/benchmarks/kernels/benchmark_reshape_and_cache.py b/benchmarks/kernels/benchmark_reshape_and_cache.py
new file mode 100644
index 000000000000..af9841daadf2
--- /dev/null
+++ b/benchmarks/kernels/benchmark_reshape_and_cache.py
@@ -0,0 +1,174 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+from __future__ import annotations
+
+import random
+import time
+
+import torch
+from tabulate import tabulate
+
+from vllm import _custom_ops as ops
+from vllm.logger import init_logger
+from vllm.platforms import current_platform
+from vllm.utils import (
+    STR_DTYPE_TO_TORCH_DTYPE,
+    FlexibleArgumentParser,
+    create_kv_caches_with_random,
+)
+
+logger = init_logger(__name__)
+
+
+@torch.inference_mode()
+def run_benchmark(
+    num_tokens: int,
+    num_heads: int,
+    head_size: int,
+    block_size: int,
+    num_blocks: int,
+    dtype: torch.dtype,
+    kv_cache_dtype: str,
+    num_iters: int,
+    benchmark_mode: str,
+    device: str = "cuda",
+) -> float:
+    """Return latency (seconds) for given num_tokens."""
+
+    if kv_cache_dtype == "fp8" and head_size % 16:
+        raise ValueError("fp8 kv-cache requires head_size to be a multiple of 16.")
+
+    current_platform.seed_everything(42)
+    torch.set_default_device(device)
+
+    # create random key / value tensors [T, H, D].
+    key = torch.randn(num_tokens, num_heads, head_size, dtype=dtype, device=device)
+    value = torch.randn_like(key)
+
+    # prepare the slot mapping.
+    # each token is assigned a unique slot in the KV-cache.
+    num_slots = block_size * num_blocks
+    if num_tokens > num_slots:
+        raise ValueError("num_tokens cannot exceed the total number of cache slots")
+    slot_mapping_lst = random.sample(range(num_slots), num_tokens)
+    slot_mapping = torch.tensor(slot_mapping_lst, dtype=torch.long, device=device)
+
+    key_caches, value_caches = create_kv_caches_with_random(
+        num_blocks,
+        block_size,
+        1,  # num_layers
+        num_heads,
+        head_size,
+        kv_cache_dtype,
+        dtype,
+        device=device,
+    )
+    key_cache, value_cache = key_caches[0], value_caches[0]
+    # to free unused memory
+    del key_caches, value_caches
+
+    # compute per-kernel scaling factors for fp8 conversion (if used).
+    k_scale = (key.amax() / 64.0).to(torch.float32)
+    v_scale = (value.amax() / 64.0).to(torch.float32)
+
+    function_under_test = lambda: ops.reshape_and_cache(
+        key,  # noqa: F821
+        value,  # noqa: F821
+        key_cache,  # noqa: F821
+        value_cache,  # noqa: F821
+        slot_mapping,  # noqa: F821
+        kv_cache_dtype,
+        k_scale,
+        v_scale,
+    )
+
+    if benchmark_mode == "cudagraph":
+        g = torch.cuda.CUDAGraph()
+        with torch.cuda.graph(g):
+            function_under_test()
+        torch.cuda.synchronize()
+        function_under_test = lambda: g.replay()
+
+    def run_cuda_benchmark(n_iters: int) -> float:
+        nonlocal key, value, key_cache, value_cache, slot_mapping
+        torch.cuda.synchronize()
+        start = time.perf_counter()
+        for _ in range(n_iters):
+            function_under_test()
+            torch.cuda.synchronize()
+        end = time.perf_counter()
+        return (end - start) / n_iters
+
+    # warm-up
+    run_cuda_benchmark(3)
+
+    lat = run_cuda_benchmark(num_iters)
+
+    # free tensors to mitigate OOM when sweeping
+    del key, value, key_cache, value_cache, slot_mapping
+    torch.cuda.empty_cache()
+
+    return lat
+
+
+def main(args):
+    rows = []
+    for exp in range(1, 17):
+        n_tok = 2**exp
+        lat = run_benchmark(
+            num_tokens=n_tok,
+            num_heads=args.num_heads,
+            head_size=args.head_size,
+            block_size=args.block_size,
+            num_blocks=args.num_blocks,
+            dtype=STR_DTYPE_TO_TORCH_DTYPE[args.dtype],
+            kv_cache_dtype=args.kv_cache_dtype,
+            num_iters=args.iters,
+            benchmark_mode=args.mode,
+            device="cuda",
+        )
+        rows.append([n_tok, lat * 1e6])  # convert to microseconds
+
+    print(f"Benchmark results for implementation cuda (measuring with {args.mode}):")
+    print(tabulate(rows, headers=["num_tokens", "latency (µs)"], floatfmt=".3f"))
+
+
+if __name__ == "__main__":
+    parser = FlexibleArgumentParser()
+
+    parser.add_argument("--num-heads", type=int, default=128)
+    parser.add_argument(
+        "--head-size",
+        type=int,
+        choices=[64, 80, 96, 112, 120, 128, 192, 256],
+        default=128,
+    )
+    parser.add_argument("--block-size", type=int, choices=[16, 32], default=16)
+    parser.add_argument("--num-blocks", type=int, default=128 * 128)
+
+    parser.add_argument(
+        "--dtype",
+        type=str,
+        choices=["half", "bfloat16", "float"],
+        default="bfloat16",
+    )
+
+    parser.add_argument(
+        "--kv-cache-dtype",
+        type=str,
+        choices=["auto", "fp8"],
+        default="auto",
+    )
+
+    parser.add_argument("--iters", type=int, default=200)
+
+    parser.add_argument(
+        "--mode",
+        type=str,
+        choices=["cudagraph", "no_graph"],
+        default="cudagraph",
+    )
+
+    args = parser.parse_args()
+
+    main(args)
diff --git a/csrc/cache_kernels.cu b/csrc/cache_kernels.cu
index c7eeef8bfa3a..6b3480091f28 100644
--- a/csrc/cache_kernels.cu
+++ b/csrc/cache_kernels.cu
@@ -16,8 +16,7 @@
 
 #include <algorithm>
 #include <cassert>
-#include <map>
-#include <vector>
+#include <cfloat>  // FLT_MIN
 
 #ifdef USE_ROCM
   #include <hip/hip_bf16.h>
@@ -209,6 +208,20 @@ void copy_blocks_mla(std::vector<torch::Tensor> const& kv_caches,
 
 namespace vllm {
 
+// Used to copy/convert one element
+template <typename OutT, typename InT, Fp8KVCacheDataType kv_dt>
+struct CopyWithScaleOp {
+  float scale;
+
+  __device__ __forceinline__ void operator()(OutT& dst, const InT src) const {
+    if constexpr (kv_dt == Fp8KVCacheDataType::kAuto) {
+      dst = static_cast<OutT>(src);
+    } else {
+      dst = fp8::scaled_convert<OutT, InT, kv_dt>(src, scale);
+    }
+  }
+};
+
 template <typename scalar_t, typename cache_t, Fp8KVCacheDataType kv_dt>
 __global__ void reshape_and_cache_kernel(
     const scalar_t* __restrict__ key,    // [num_tokens, num_heads, head_size]
@@ -224,58 +237,50 @@ __global__ void reshape_and_cache_kernel(
   const int64_t token_idx = blockIdx.x;
   const int64_t slot_idx = slot_mapping[token_idx];
   if (slot_idx < 0) {
-    // Padding token that should be ignored.
     return;
   }
 
   const int64_t block_idx = slot_idx / block_size;
   const int64_t block_offset = slot_idx % block_size;
+  const int h_block_count = head_size / x;  // head_size//x
 
-  const int n = num_heads * head_size;
-  for (int i = threadIdx.x; i < n; i += blockDim.x) {
-    const int64_t src_key_idx = token_idx * key_stride + i;
-    const int64_t src_value_idx = token_idx * value_stride + i;
-
-    const int head_idx = i / head_size;
-    const int head_offset = i % head_size;
-    const int x_idx = head_offset / x;
-    const int x_offset = head_offset % x;
-
-    const int64_t tgt_key_idx =
-        block_idx * num_heads * (head_size / x) * block_size * x +
-        head_idx * (head_size / x) * block_size * x + x_idx * block_size * x +
-        block_offset * x + x_offset;
-    const int64_t tgt_value_idx =
-        block_idx * num_heads * head_size * block_size +
-        head_idx * head_size * block_size + head_offset * block_size +
-        block_offset;
-    scalar_t tgt_key = key[src_key_idx];
-    scalar_t tgt_value = value[src_value_idx];
-    if constexpr (kv_dt == Fp8KVCacheDataType::kAuto) {
-      key_cache[tgt_key_idx] = tgt_key;
-      value_cache[tgt_value_idx] = tgt_value;
-    } else {
-      key_cache[tgt_key_idx] =
-          fp8::scaled_convert<cache_t, scalar_t, kv_dt>(tgt_key, *k_scale);
-      value_cache[tgt_value_idx] =
-          fp8::scaled_convert<cache_t, scalar_t, kv_dt>(tgt_value, *v_scale);
-    }
+  const int h_block_idx = threadIdx.x;
+  if (h_block_idx >= num_heads * h_block_count) {
+    return;
   }
-}
 
-// Used by vectorization_utils to copy/convert one element
-template <typename OutT, typename InT, Fp8KVCacheDataType kv_dt>
-struct CopyWithScaleOp {
-  float scale;
+  const int head_idx = h_block_idx / h_block_count;
+  const int h_block = h_block_idx % h_block_count;
 
-  __device__ __forceinline__ void operator()(OutT& dst, const InT src) const {
-    if constexpr (kv_dt == Fp8KVCacheDataType::kAuto) {
-      dst = static_cast<OutT>(src);
-    } else {
-      dst = fp8::scaled_convert<OutT, InT, kv_dt>(src, scale);
-    }
+  const scalar_t* __restrict__ key_src =
+      key + token_idx * key_stride + head_idx * head_size + h_block * x;
+  const int64_t src_value_start =
+      token_idx * value_stride + head_idx * head_size + h_block * x;
+
+  cache_t* __restrict__ key_dst =
+      key_cache + block_idx * num_heads * h_block_count * block_size * x +
+      head_idx * h_block_count * block_size * x + h_block * block_size * x +
+      block_offset * x;
+  const int64_t tgt_value_start =
+      block_idx * num_heads * h_block_count * x * block_size +
+      head_idx * h_block_count * x * block_size + h_block * x * block_size +
+      block_offset;
+
+  constexpr int VEC_SIZE = (sizeof(scalar_t) == 2) ? 8 : 4;
+  float k_scale_val = (kv_dt == Fp8KVCacheDataType::kAuto) ? 0.f : *k_scale;
+  CopyWithScaleOp<cache_t, scalar_t, kv_dt> k_op{k_scale_val};
+  float v_scale_val = (kv_dt == Fp8KVCacheDataType::kAuto) ? 0.f : *v_scale;
+  CopyWithScaleOp<cache_t, scalar_t, kv_dt> v_op{v_scale_val};
+
+  vectorize_with_alignment<VEC_SIZE>(key_src, key_dst, x, 0, 1, k_op);
+
+  const scalar_t* __restrict__ value_src = value + src_value_start;
+  cache_t* __restrict__ value_dst = value_cache + tgt_value_start;
+#pragma unroll
+  for (int i = 0; i < x; i++) {
+    v_op(value_dst[i * block_size], value_src[i]);
   }
-};
+}
 
 template <typename scalar_t, typename cache_t, Fp8KVCacheDataType kv_dt>
 __global__ void reshape_and_cache_flash_kernel(
@@ -601,9 +606,10 @@ void reshape_and_cache(
 
   int key_stride = key.stride(0);
   int value_stride = value.stride(0);
+  int head_div_x = head_size / x;
 
   dim3 grid(num_tokens);
-  dim3 block(std::min(num_heads * head_size, 512));
+  dim3 block(std::min(num_heads * head_div_x, 512));
   const at::cuda::OptionalCUDAGuard device_guard(device_of(key));
   const cudaStream_t stream = at::cuda::getCurrentCUDAStream();
 

From 09ffe07e14d9714c4f62fa403327b3ec8cc4dbe8 Mon Sep 17 00:00:00 2001
From: HUIJONG JEONG <64083281+huijjj@users.noreply.github.com>
Date: Fri, 3 Oct 2025 17:56:25 +0900
Subject: [PATCH 123/193] add(v1): RequestStatesStats to RequestOutput (#24947)

Signed-off-by: huijjj <huijong.jeong@squeezebits.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/entrypoints/llm/test_generate.py | 13 +++++++++++++
 vllm/outputs.py                        |  3 ++-
 vllm/v1/engine/output_processor.py     | 19 +++++++++----------
 3 files changed, 24 insertions(+), 11 deletions(-)

diff --git a/tests/entrypoints/llm/test_generate.py b/tests/entrypoints/llm/test_generate.py
index e0ecb02d4f56..5af4327b65d0 100644
--- a/tests/entrypoints/llm/test_generate.py
+++ b/tests/entrypoints/llm/test_generate.py
@@ -86,3 +86,16 @@ def test_max_model_len():
         # It can be less if generation finishes due to other reasons (e.g., EOS)
         # before reaching the absolute model length limit.
         assert num_total_tokens <= max_model_len
+
+
+def test_log_stats():
+    llm = LLM(
+        model=MODEL_NAME,
+        disable_log_stats=False,
+        gpu_memory_utilization=0.10,
+        enforce_eager=True,  # reduce test time
+    )
+    outputs = llm.generate(PROMPTS, sampling_params=None)
+
+    # disable_log_stats is False, every output should have metrics
+    assert all(output.metrics is not None for output in outputs)
diff --git a/vllm/outputs.py b/vllm/outputs.py
index 4d8206bb2d83..1ed20461def1 100644
--- a/vllm/outputs.py
+++ b/vllm/outputs.py
@@ -14,6 +14,7 @@
 from vllm.lora.request import LoRARequest
 from vllm.multimodal.inputs import MultiModalPlaceholderDict
 from vllm.sequence import RequestMetrics
+from vllm.v1.metrics.stats import RequestStateStats
 
 logger = init_logger(__name__)
 
@@ -108,7 +109,7 @@ def __init__(
         prompt_logprobs: Optional[PromptLogprobs],
         outputs: list[CompletionOutput],
         finished: bool,
-        metrics: Optional[RequestMetrics] = None,
+        metrics: Optional[Union[RequestMetrics, RequestStateStats]] = None,
         lora_request: Optional[LoRARequest] = None,
         encoder_prompt: Optional[str] = None,
         encoder_prompt_token_ids: Optional[list[int]] = None,
diff --git a/vllm/v1/engine/output_processor.py b/vllm/v1/engine/output_processor.py
index 38b2d6824b47..46cb97d4e7b5 100644
--- a/vllm/v1/engine/output_processor.py
+++ b/vllm/v1/engine/output_processor.py
@@ -248,16 +248,15 @@ def _new_request_output(
         if prompt_token_ids is None and self.prompt_embeds is not None:
             prompt_token_ids = [0] * len(self.prompt_embeds)
 
-        return RequestOutput(
-            request_id=request_id,
-            prompt=self.prompt,
-            prompt_token_ids=prompt_token_ids,
-            prompt_logprobs=prompt_logprobs,
-            outputs=cast(list[CompletionOutput], outputs),
-            finished=finished,
-            kv_transfer_params=kv_transfer_params,
-            num_cached_tokens=self.num_cached_tokens,
-        )
+        return RequestOutput(request_id=request_id,
+                             prompt=self.prompt,
+                             prompt_token_ids=prompt_token_ids,
+                             prompt_logprobs=prompt_logprobs,
+                             outputs=cast(list[CompletionOutput], outputs),
+                             finished=finished,
+                             kv_transfer_params=kv_transfer_params,
+                             num_cached_tokens=self.num_cached_tokens,
+                             metrics=self.stats)
 
     def _new_completion_output(
         self,

From 0a3b75c6a1708a494b8c54e1b5c3ec08c0728c8f Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Fri, 3 Oct 2025 16:59:06 +0800
Subject: [PATCH 124/193] [Model] Use `merge_by_field_config` for MM models
 (InternVL family) (#26153)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/models/supported_models.md               |  2 +-
 examples/offline_inference/vision_language.py |  2 +-
 .../vision_language_multi_image.py            |  2 +-
 vllm/model_executor/models/interns1.py        | 72 +++++------------
 vllm/model_executor/models/internvl.py        | 81 +++++++------------
 .../model_executor/models/nano_nemotron_vl.py | 37 ++++-----
 vllm/model_executor/models/nemotron_vl.py     | 26 ++----
 vllm/model_executor/models/nvlm_d.py          |  2 +-
 vllm/model_executor/models/skyworkr1v.py      | 42 +++-------
 9 files changed, 84 insertions(+), 182 deletions(-)

diff --git a/docs/models/supported_models.md b/docs/models/supported_models.md
index 5ca2156c08b5..c705a70b93f5 100644
--- a/docs/models/supported_models.md
+++ b/docs/models/supported_models.md
@@ -677,7 +677,7 @@ These models primarily accept the [`LLM.generate`](./generative_models.md#llmgen
 | `GraniteSpeechForConditionalGeneration` | Granite Speech | T + A | `ibm-granite/granite-speech-3.3-8b` | ✅︎ | ✅︎ | ✅︎ |
 | `H2OVLChatModel` | H2OVL | T + I<sup>E+</sup> | `h2oai/h2ovl-mississippi-800m`, `h2oai/h2ovl-mississippi-2b`, etc. | | ✅︎ | ✅︎ |
 | `Idefics3ForConditionalGeneration` | Idefics3 | T + I | `HuggingFaceM4/Idefics3-8B-Llama3`, etc. | ✅︎ | | ✅︎ |
-| `InternS1ForConditionalGeneration` | Intern-S1 | T + I<sup>E+</sup> + V<sup>E+</sup> | `internlm/Intern-S1`, etc. | ✅︎ | ✅︎ | ✅︎ |
+| `InternS1ForConditionalGeneration` | Intern-S1 | T + I<sup>E+</sup> + V<sup>E+</sup> | `internlm/Intern-S1`, `internlm/Intern-S1-mini`, etc. | ✅︎ | ✅︎ | ✅︎ |
 | `InternVLChatModel` | InternVL 3.5, InternVL 3.0, InternVideo 2.5, InternVL 2.5, Mono-InternVL, InternVL 2.0 | T + I<sup>E+</sup> + (V<sup>E+</sup>) | `OpenGVLab/InternVL3_5-14B`, `OpenGVLab/InternVL3-9B`, `OpenGVLab/InternVideo2_5_Chat_8B`, `OpenGVLab/InternVL2_5-4B`, `OpenGVLab/Mono-InternVL-2B`, `OpenGVLab/InternVL2-4B`, etc. | ✅︎ | ✅︎ | ✅︎ |
 | `InternVLForConditionalGeneration` | InternVL 3.0 (HF format) | T + I<sup>E+</sup> + V<sup>E+</sup> | `OpenGVLab/InternVL3-1B-hf`, etc. | ✅︎ | ✅︎ | ✅︎ |
 | `KeyeForConditionalGeneration` | Keye-VL-8B-Preview | T + I<sup>E+</sup> + V<sup>E+</sup> | `Kwai-Keye/Keye-VL-8B-Preview` | ✅︎ | ✅︎ | ✅︎ |
diff --git a/examples/offline_inference/vision_language.py b/examples/offline_inference/vision_language.py
index f8ddb5a22b31..1d6d819ff58a 100644
--- a/examples/offline_inference/vision_language.py
+++ b/examples/offline_inference/vision_language.py
@@ -576,7 +576,7 @@ def run_idefics3(questions: list[str], modality: str) -> ModelRequestData:
 
 # Intern-S1
 def run_interns1(questions: list[str], modality: str) -> ModelRequestData:
-    model_name = "internlm/Intern-S1"
+    model_name = "internlm/Intern-S1-mini"
 
     engine_args = EngineArgs(
         model=model_name,
diff --git a/examples/offline_inference/vision_language_multi_image.py b/examples/offline_inference/vision_language_multi_image.py
index 51b41f34b2ff..e0d95758a822 100644
--- a/examples/offline_inference/vision_language_multi_image.py
+++ b/examples/offline_inference/vision_language_multi_image.py
@@ -309,7 +309,7 @@ def load_idefics3(question: str, image_urls: list[str]) -> ModelRequestData:
 
 
 def load_interns1(question: str, image_urls: list[str]) -> ModelRequestData:
-    model_name = "internlm/Intern-S1"
+    model_name = "internlm/Intern-S1-mini"
 
     engine_args = EngineArgs(
         model=model_name,
diff --git a/vllm/model_executor/models/interns1.py b/vllm/model_executor/models/interns1.py
index 0292845f819c..e5caf0eae37d 100644
--- a/vllm/model_executor/models/interns1.py
+++ b/vllm/model_executor/models/interns1.py
@@ -25,7 +25,7 @@
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems, NestedTensors)
+                                    MultiModalKwargsItems)
 from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
                                    ImageSize, MultiModalDataItems)
 from vllm.multimodal.processing import (BaseMultiModalProcessor,
@@ -39,7 +39,7 @@
 
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
                          SupportsMultiModal, SupportsPP)
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
+from .utils import (AutoWeightsLoader, WeightsMapper,
                     init_vllm_registered_model, maybe_prefix)
 
 
@@ -304,7 +304,7 @@ def _call_hf_processor(
         mm_data: Mapping[str, object],
         mm_kwargs: Mapping[str, object],
         tok_kwargs: Mapping[str, object],
-    ) -> Mapping[str, NestedTensors]:
+    ) -> BatchFeature:
         mm_data = dict(mm_data)
         videos = mm_data.pop("videos", [])
         images = mm_data.pop("images", [])
@@ -342,7 +342,7 @@ def _call_hf_processor(
                                         image_placeholder, 1)
 
             num_patches = [len(item) for item in image_pixel_values]
-            image_outputs: dict[str, NestedTensors] = {
+            image_outputs = {
                 "pixel_values": torch.concat(image_pixel_values),
                 "image_num_patches": torch.tensor(num_patches),
                 "image_token_id": torch.tensor(hf_processor.image_token_id),
@@ -370,7 +370,7 @@ def _call_hf_processor(
                                         video_placeholder, 1)
 
             num_frames = [len(item) for item in video_pixel_values]
-            video_outputs: dict[str, NestedTensors] = {
+            video_outputs = {
                 "pixel_values_videos": torch.concat(video_pixel_values),
                 "video_num_patches": torch.tensor(num_frames),
                 "video_token_id": torch.tensor(video_token_id),
@@ -382,16 +382,11 @@ def _call_hf_processor(
                         prompt)
         text_outputs = tokenizer(prompt, **tok_kwargs, return_tensors="pt")
 
-        combined_outputs = dict(
-            **text_outputs,
-            **image_outputs,
-            **video_outputs,
-        )
-        return BatchFeature(combined_outputs)
+        return BatchFeature({**text_outputs, **image_outputs, **video_outputs})
 
     def _get_mm_fields_config(
         self,
-        hf_inputs: Mapping[str, NestedTensors],
+        hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
 
@@ -487,6 +482,7 @@ def get_replacement_interns1_video(item_idx: int):
     dummy_inputs=InternS1DummyInputsBuilder)
 class InternS1ForConditionalGeneration(nn.Module, SupportsMultiModal,
                                        SupportsPP, SupportsLoRA):
+    merge_by_field_config = True
 
     # To ensure correct weight loading and mapping.
     hf_to_vllm_mapper = WeightsMapper(
@@ -561,7 +557,7 @@ def _init_vision_model(
             prefix=prefix,
         )
 
-    def _init_mlp1(self, config: PretrainedConfig) -> nn.Sequential:
+    def _init_mlp1(self, config: PretrainedConfig) -> nn.Module:
         return InternS1MultiModalProjector(config)
 
     def pixel_shuffle(self, x, scale_factor=0.5):
@@ -599,13 +595,9 @@ def _parse_and_validate_image_input(
             return None
 
         if image_embeds is not None:
-            if not isinstance(image_embeds, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image embeddings. "
-                                 f"Got type: {type(image_embeds)}")
-
             return InternS1ImageEmbeddingInputs(
                 type="image_embeds",
-                data=flatten_bn(image_embeds),
+                data=image_embeds,
             )
 
         image_token_id = kwargs["image_token_id"]
@@ -613,17 +605,6 @@ def _parse_and_validate_image_input(
         self.img_context_token_id = image_token_id.flatten().unique().item()
 
         if pixel_values is not None:
-            if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values)}")
-
-            if not isinstance(image_num_patches, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image_num_patches. "
-                                 f"Got type: {type(image_num_patches)}")
-
-            pixel_values = flatten_bn(pixel_values, concat=True)
-            image_num_patches = flatten_bn(image_num_patches, concat=True)
-
             h, w = self.config.vision_config.image_size
             return InternS1ImagePixelInputs(
                 type="pixel_values",
@@ -638,7 +619,7 @@ def _parse_and_validate_image_input(
         raise AssertionError("This line should be unreachable.")
 
     def _parse_and_validate_video_input(
-            self, **kwargs: object) -> Optional[InternS1VideoPixelInputs]:
+            self, **kwargs: object) -> Optional[InternS1VideoInputs]:
         pixel_values_flat_video = kwargs.pop("pixel_values_videos", None)
         video_num_patches = kwargs.pop("video_num_patches", None)
         video_embeds = kwargs.pop("video_embeds", None)
@@ -647,13 +628,9 @@ def _parse_and_validate_video_input(
             return None
 
         if video_embeds is not None:
-            if not isinstance(video_embeds, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of video embeddings. "
-                                 f"Got type: {type(video_embeds)}")
-
-            return InternS1ImageEmbeddingInputs(
+            return InternS1VideoEmbeddingInputs(
                 type="video_embeds",
-                data=flatten_bn(video_embeds),
+                data=video_embeds,
             )
 
         video_token_id = kwargs["video_token_id"]
@@ -661,18 +638,6 @@ def _parse_and_validate_video_input(
         self.video_context_token_id = video_token_id.flatten().unique().item()
 
         if pixel_values_flat_video is not None:
-            if not isinstance(pixel_values_flat_video, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values_flat_video)}")
-
-            if not isinstance(video_num_patches, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image_num_patches. "
-                                 f"Got type: {type(video_num_patches)}")
-
-            pixel_values_flat_video = flatten_bn(pixel_values_flat_video,
-                                                 concat=True)
-            video_num_patches = flatten_bn(video_num_patches, concat=True)
-
             h, w = self.config.vision_config.image_size
             return InternS1VideoPixelInputs(
                 type="pixel_values_videos",
@@ -686,11 +651,12 @@ def _parse_and_validate_video_input(
 
         raise AssertionError("This line should be unreachable.")
 
-    def _process_image_input(
+    def _process_vision_input(
         self,
-        image_input: Union[InternS1ImageInputs, InternS1VideoPixelInputs],
+        image_input: Union[InternS1ImageInputs, InternS1VideoInputs],
     ) -> tuple[torch.Tensor, ...]:
-        if image_input["type"] == "image_embeds":
+        if (image_input["type"] == "image_embeds"
+                or image_input["type"] == "video_embeds"):
             return image_input["data"]
 
         assert self.vision_tower is not None
@@ -753,11 +719,11 @@ def get_multimodal_embeddings(self,
         for modality in modalities:
             if modality == "images":
                 image_input = modalities["images"]
-                vision_embeddings = self._process_image_input(image_input)
+                vision_embeddings = self._process_vision_input(image_input)
                 multimodal_embeddings += vision_embeddings
             if modality == "videos":
                 video_input = modalities["videos"]
-                video_embeddings = self._process_image_input(video_input)
+                video_embeddings = self._process_vision_input(video_input)
                 multimodal_embeddings += video_embeddings
 
         return multimodal_embeddings
diff --git a/vllm/model_executor/models/internvl.py b/vllm/model_executor/models/internvl.py
index 0c95c49f90b1..1f3224f9ac58 100644
--- a/vllm/model_executor/models/internvl.py
+++ b/vllm/model_executor/models/internvl.py
@@ -17,7 +17,7 @@
 import torch.nn as nn
 import torchvision.transforms as T
 from PIL import Image
-from transformers import BatchEncoding, PretrainedConfig, TensorType
+from transformers import BatchFeature, PretrainedConfig, TensorType
 
 from vllm.config import VllmConfig
 from vllm.model_executor.layers.quantization import QuantizationConfig
@@ -28,7 +28,7 @@
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.image import convert_image_mode
 from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems, NestedTensors)
+                                    MultiModalKwargsItems)
 from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
                                    ImageSize, MultiModalDataItems)
 from vllm.multimodal.processing import (BaseMultiModalProcessor,
@@ -42,8 +42,7 @@
 
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
                          SupportsMultiModal, SupportsPP)
-from .utils import (AutoWeightsLoader, flatten_bn, init_vllm_registered_model,
-                    maybe_prefix)
+from .utils import AutoWeightsLoader, init_vllm_registered_model, maybe_prefix
 
 IMG_START = '<img>'
 IMG_END = '</img>'
@@ -471,7 +470,7 @@ def _preprocess_image(
                 max_dynamic_patch=max_dynamic_patch,
                 dynamic_image_size=dynamic_image_size,
             )
-            image_inputs: dict[str, NestedTensors] = {
+            image_inputs = {
                 "pixel_values_flat":
                 torch.cat(pixel_values_lst),
                 "image_num_patches":
@@ -502,7 +501,7 @@ def __call__(
         max_dynamic_patch: Optional[int] = None,
         dynamic_image_size: Optional[bool] = None,
         return_tensors: Optional[Union[str, TensorType]] = None,
-    ) -> Mapping[str, NestedTensors]:
+    ) -> BatchFeature:
         text, images = [self._make_batch_input(x) for x in (text, images)]
 
         text, image_inputs = self._preprocess_image(
@@ -515,10 +514,9 @@ def __call__(
 
         text_inputs = self.tokenizer(text)
 
-        return {
-            **BatchEncoding(text_inputs, tensor_type=return_tensors),
-            **image_inputs,
-        }
+        combined_outputs = {**text_inputs, **image_inputs}
+
+        return BatchFeature(combined_outputs, tensor_type=return_tensors)
 
 
 class InternVLProcessor(BaseInternVLProcessor):
@@ -598,7 +596,7 @@ def _preprocess_video(
                 videos,
                 dynamic_image_size=dynamic_image_size,
             )
-            video_inputs: dict[str, NestedTensors] = {
+            video_inputs = {
                 "pixel_values_flat_video":
                 torch.cat(pixel_values_lst_video),
                 "video_num_patches":
@@ -622,7 +620,7 @@ def __call__(
         max_dynamic_patch: Optional[int] = None,
         dynamic_image_size: Optional[bool] = None,
         return_tensors: Optional[Union[str, TensorType]] = None,
-    ) -> Mapping[str, NestedTensors]:
+    ) -> BatchFeature:
         text, images, videos = [
             self._make_batch_input(x) for x in (text, images, videos)
         ]
@@ -643,11 +641,9 @@ def __call__(
 
         text_inputs = self.tokenizer(text)
 
-        return {
-            **BatchEncoding(text_inputs, tensor_type=return_tensors),
-            **image_inputs,
-            **video_inputs,
-        }
+        combined_outputs = {**text_inputs, **image_inputs, **video_inputs}
+
+        return BatchFeature(combined_outputs, tensor_type=return_tensors)
 
     def get_image_repl(
         self,
@@ -773,7 +769,7 @@ def _call_hf_processor(
         mm_data: Mapping[str, object],
         mm_kwargs: Mapping[str, object],
         tok_kwargs: Mapping[str, object],
-    ) -> Mapping[str, NestedTensors]:
+    ) -> BatchFeature:
         processed_outputs = super()._call_hf_processor(
             prompt=prompt,
             mm_data=mm_data,
@@ -793,7 +789,7 @@ def _call_hf_processor(
 
     def _get_mm_fields_config(
         self,
-        hf_inputs: Mapping[str, NestedTensors],
+        hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
         image_num_patches = hf_inputs.get("image_num_patches", torch.empty(0))
@@ -948,7 +944,7 @@ def _call_hf_processor(
         mm_data: Mapping[str, object],
         mm_kwargs: Mapping[str, object],
         tok_kwargs: Mapping[str, object],
-    ) -> Mapping[str, NestedTensors]:
+    ) -> BatchFeature:
         processed_outputs = super()._call_hf_processor(prompt, mm_data,
                                                        mm_kwargs, tok_kwargs)
 
@@ -960,7 +956,7 @@ def _call_hf_processor(
 
     def _get_mm_fields_config(
         self,
-        hf_inputs: Mapping[str, NestedTensors],
+        hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
         image_fields = super()._get_mm_fields_config(hf_inputs,
@@ -1033,6 +1029,7 @@ def get_video_replacement_internvl(item_idx: int):
     dummy_inputs=InternVLDummyInputsBuilder)
 class InternVLChatModel(nn.Module, SupportsMultiModal, SupportsPP,
                         SupportsLoRA):
+    merge_by_field_config = True
 
     supports_encoder_tp_data = True
 
@@ -1126,7 +1123,7 @@ def _init_vision_model(
         else:
             return InternVisionPatchModel(config.vision_config)
 
-    def _init_mlp1(self, config: PretrainedConfig) -> nn.Sequential:
+    def _init_mlp1(self, config: PretrainedConfig) -> nn.Module:
         vit_hidden_size = config.vision_config.hidden_size
         llm_hidden_size = config.text_config.hidden_size
 
@@ -1175,13 +1172,9 @@ def _parse_and_validate_image_input(
             return None
 
         if image_embeds is not None:
-            if not isinstance(image_embeds, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image embeddings. "
-                                 f"Got type: {type(image_embeds)}")
-
             return InternVLImageEmbeddingInputs(
                 type="image_embeds",
-                data=flatten_bn(image_embeds),
+                data=image_embeds,
             )
 
         image_token_id = kwargs["image_token_id"]
@@ -1189,16 +1182,6 @@ def _parse_and_validate_image_input(
         self.img_context_token_id = image_token_id.flatten().unique().item()
 
         if pixel_values_flat is not None:
-            if not isinstance(pixel_values_flat, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values_flat)}")
-
-            if not isinstance(image_num_patches, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image_num_patches. "
-                                 f"Got type: {type(image_num_patches)}")
-
-            pixel_values_flat = flatten_bn(pixel_values_flat, concat=True)
-            image_num_patches = flatten_bn(image_num_patches, concat=True)
             expected_h = expected_w = self.config.vision_config.image_size
             resolve_bindings = {"h": expected_h, "w": expected_w}
 
@@ -1223,7 +1206,7 @@ def _parse_and_validate_video_input(
         if video_embeds is not None:
             return InternVLVideoEmbeddingInputs(
                 type="video_embeds",
-                data=flatten_bn(video_embeds),
+                data=video_embeds,
             )
 
         video_token_id = kwargs["video_token_id"]
@@ -1231,17 +1214,6 @@ def _parse_and_validate_video_input(
         self.video_context_token_id = video_token_id.flatten().unique().item()
 
         if pixel_values_flat_video is not None:
-            if not isinstance(pixel_values_flat_video, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values_flat_video)}")
-
-            if not isinstance(video_num_patches, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image_num_patches. "
-                                 f"Got type: {type(video_num_patches)}")
-
-            pixel_values_flat_video = flatten_bn(pixel_values_flat_video,
-                                                 concat=True)
-            video_num_patches = flatten_bn(video_num_patches, concat=True)
             expected_h = expected_w = self.config.vision_config.image_size
             resolve_bindings = {"h": expected_h, "w": expected_w}
 
@@ -1254,11 +1226,12 @@ def _parse_and_validate_video_input(
 
         raise AssertionError("This line should be unreachable.")
 
-    def _process_image_input(
+    def _process_vision_input(
         self,
-        image_input: Union[InternVLImageInputs, InternVLVideoPixelInputs],
+        image_input: Union[InternVLImageInputs, InternVLVideoInputs],
     ) -> tuple[torch.Tensor, ...]:
-        if image_input["type"] == "image_embeds":
+        if (image_input["type"] == "image_embeds"
+                or image_input["type"] == "video_embeds"):
             return image_input["data"]
 
         assert self.vision_model is not None
@@ -1326,11 +1299,11 @@ def get_multimodal_embeddings(self,
         for modality in modalities:
             if modality == "images":
                 image_input = modalities["images"]
-                vision_embeddings = self._process_image_input(image_input)
+                vision_embeddings = self._process_vision_input(image_input)
                 multimodal_embeddings += vision_embeddings
             if modality == "videos":
                 video_input = modalities["videos"]
-                video_embeddings = self._process_image_input(video_input)
+                video_embeddings = self._process_vision_input(video_input)
                 multimodal_embeddings += video_embeddings
 
         return multimodal_embeddings
diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index 649eba063cfe..f28b149151b5 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -18,8 +18,7 @@
 import torch.nn as nn
 import torchvision.transforms as T
 from PIL import Image
-from transformers import (BatchEncoding, BatchFeature, PretrainedConfig,
-                          TensorType)
+from transformers import BatchFeature, PretrainedConfig, TensorType
 
 from vllm.config import VllmConfig
 from vllm.model_executor.layers.activation import ReLUSquaredActivation
@@ -40,8 +39,7 @@
 from vllm.multimodal.evs import (compute_retained_tokens_count,
                                  compute_retention_mask)
 from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargs, MultiModalKwargsItems,
-                                    NestedTensors)
+                                    MultiModalKwargs, MultiModalKwargsItems)
 from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
                                    ImageSize, MultiModalDataItems)
 from vllm.multimodal.processing import (BaseMultiModalProcessor,
@@ -307,7 +305,7 @@ def _preprocess_image(
         else:
             pixel_values_lst = self._images_to_pixel_values_lst(
                 images, max_num_tiles)
-            image_inputs: dict[str, NestedTensors] = {
+            image_inputs = {
                 "pixel_values_flat":
                 torch.cat(pixel_values_lst),
                 "image_num_patches":
@@ -335,7 +333,7 @@ def __call__(
         images: Optional[Union[Image.Image, list[Image.Image]]] = None,
         return_tensors: Optional[Union[str, TensorType]] = None,
         max_num_tiles: Optional[int] = None,
-    ) -> Mapping[str, NestedTensors]:
+    ) -> BatchFeature:
         # Use default if not provided
         if max_num_tiles is None:
             max_num_tiles = 12
@@ -350,10 +348,9 @@ def __call__(
 
         text_inputs = self.tokenizer(text, add_special_tokens=False)
 
-        return {
-            **BatchEncoding(text_inputs, tensor_type=return_tensors),
-            **image_inputs,
-        }
+        combined_outputs = {**text_inputs, **image_inputs}
+
+        return BatchFeature(combined_outputs, tensor_type=return_tensors)
 
 
 class NanoNemotronVLProcessor(BaseNanoNemotronVLProcessor):
@@ -429,7 +426,7 @@ def _preprocess_video(
                 dynamic_image_size=dynamic_image_size,
             )
 
-            video_inputs: dict[str, NestedTensors] = {
+            video_inputs = {
                 "pixel_values_flat_video":
                 torch.cat(pixel_values_lst_video),
                 "video_num_patches":
@@ -473,7 +470,7 @@ def __call__(
         return_tensors: Optional[Union[str, TensorType]] = None,
         max_num_tiles: Optional[int] = None,
         dynamic_image_size: Optional[bool] = None,
-    ) -> Mapping[str, NestedTensors]:
+    ) -> BatchFeature:
         # Use default if not provided
         if max_num_tiles is None:
             max_num_tiles = 12
@@ -497,11 +494,9 @@ def __call__(
 
         text_inputs = self.tokenizer(text, add_special_tokens=False)
 
-        return BatchFeature({
-            **BatchEncoding(text_inputs, tensor_type=return_tensors),
-            **image_inputs,
-            **video_inputs,
-        })
+        combined_outputs = {**text_inputs, **image_inputs, **video_inputs}
+
+        return BatchFeature(combined_outputs, tensor_type=return_tensors)
 
     def get_image_repl(
         self,
@@ -694,7 +689,7 @@ def _call_hf_processor(
         mm_data: Mapping[str, object],
         mm_kwargs: Mapping[str, object],
         tok_kwargs: Mapping[str, object],
-    ) -> Mapping[str, NestedTensors]:
+    ) -> BatchFeature:
         processed_outputs = super()._call_hf_processor(
             prompt=prompt,
             mm_data=mm_data,
@@ -714,7 +709,7 @@ def _call_hf_processor(
 
     def _get_mm_fields_config(
         self,
-        hf_inputs: Mapping[str, NestedTensors],
+        hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
         image_num_patches = hf_inputs.get("image_num_patches", torch.empty(0))
@@ -793,7 +788,7 @@ def _call_hf_processor(
         mm_data: Mapping[str, object],
         mm_kwargs: Mapping[str, object],
         tok_kwargs: Mapping[str, object],
-    ) -> Mapping[str, NestedTensors]:
+    ) -> BatchFeature:
         processed_outputs = super()._call_hf_processor(prompt, mm_data,
                                                        mm_kwargs, tok_kwargs)
 
@@ -805,7 +800,7 @@ def _call_hf_processor(
 
     def _get_mm_fields_config(
         self,
-        hf_inputs: Mapping[str, NestedTensors],
+        hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
         image_fields = super()._get_mm_fields_config(hf_inputs,
diff --git a/vllm/model_executor/models/nemotron_vl.py b/vllm/model_executor/models/nemotron_vl.py
index 0e7ec8e458cf..e6c4c5b022dc 100644
--- a/vllm/model_executor/models/nemotron_vl.py
+++ b/vllm/model_executor/models/nemotron_vl.py
@@ -28,7 +28,6 @@
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.image import convert_image_mode
-from vllm.multimodal.inputs import NestedTensors
 from vllm.multimodal.processing import PromptUpdateDetails
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.processor import (
@@ -37,8 +36,7 @@
 
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
                          SupportsMultiModal, SupportsPP)
-from .utils import (AutoWeightsLoader, flatten_bn, init_vllm_registered_model,
-                    maybe_prefix)
+from .utils import AutoWeightsLoader, init_vllm_registered_model, maybe_prefix
 
 IMG_START = '<img>'
 IMG_END = '</img>'
@@ -289,7 +287,7 @@ def _preprocess_image(
                 max_dynamic_patch=max_dynamic_patch,
                 dynamic_image_size=dynamic_image_size,
             )
-            image_inputs: dict[str, NestedTensors] = {
+            image_inputs = {
                 "pixel_values_flat":
                 torch.cat(pixel_values_lst),
                 "image_num_patches":
@@ -344,6 +342,7 @@ def get_image_processor(self, **kwargs: object):
     dummy_inputs=BaseInternVLDummyInputsBuilder[NemotronVLProcessingInfo])
 class LlamaNemotronVLChatModel(nn.Module, SupportsMultiModal, SupportsPP,
                                SupportsLoRA):
+    merge_by_field_config = True
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -414,7 +413,7 @@ def _init_vision_model(
         return AutoModel.from_config(config.vision_config,
                                      trust_remote_code=True)
 
-    def _init_mlp1(self, config: PretrainedConfig) -> nn.Sequential:
+    def _init_mlp1(self, config: PretrainedConfig) -> nn.Module:
         vit_hidden_size = config.vit_hidden_size
         vision_projection_hidden_size = config.projector_hidden_size
         llm_hidden_size = config.text_config.hidden_size
@@ -467,13 +466,9 @@ def _parse_and_validate_image_input(
             return None
 
         if image_embeds is not None:
-            if not isinstance(image_embeds, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image embeddings. "
-                                 f"Got type: {type(image_embeds)}")
-
             return InternVLImageEmbeddingInputs(
                 type="image_embeds",
-                data=flatten_bn(image_embeds),
+                data=image_embeds,
             )
 
         image_token_id = kwargs["image_token_id"]
@@ -481,17 +476,6 @@ def _parse_and_validate_image_input(
         self.img_context_token_id = image_token_id.flatten().unique().item()
 
         if pixel_values_flat is not None:
-            if not isinstance(pixel_values_flat, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values_flat)}")
-
-            if not isinstance(image_num_patches, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image_num_patches. "
-                                 f"Got type: {type(image_num_patches)}")
-
-            pixel_values_flat = flatten_bn(pixel_values_flat, concat=True)
-            image_num_patches = flatten_bn(image_num_patches, concat=True)
-
             return InternVLImagePixelInputs(
                 type="pixel_values",
                 pixel_values_flat=pixel_values_flat,
diff --git a/vllm/model_executor/models/nvlm_d.py b/vllm/model_executor/models/nvlm_d.py
index 3bbf4c67604c..0f993b0dc62f 100644
--- a/vllm/model_executor/models/nvlm_d.py
+++ b/vllm/model_executor/models/nvlm_d.py
@@ -159,7 +159,7 @@ def get_replacement_nvlm(item_idx: int):
                                         dummy_inputs=NVLMDummyInputsBuilder)
 class NVLM_D_Model(InternVLChatModel):
 
-    def _init_mlp1(self, config: PretrainedConfig) -> nn.Sequential:
+    def _init_mlp1(self, config: PretrainedConfig) -> nn.Module:
         vit_hidden_size = config.vision_config.hidden_size
         llm_intermediate_size = config.text_config.intermediate_size
         llm_hidden_size = config.text_config.hidden_size
diff --git a/vllm/model_executor/models/skyworkr1v.py b/vllm/model_executor/models/skyworkr1v.py
index f03022aa719c..8556c3847041 100644
--- a/vllm/model_executor/models/skyworkr1v.py
+++ b/vllm/model_executor/models/skyworkr1v.py
@@ -14,7 +14,7 @@
 import torch.nn as nn
 import torchvision.transforms as T
 from PIL import Image
-from transformers import BatchEncoding, PretrainedConfig, TensorType
+from transformers import BatchFeature, PretrainedConfig, TensorType
 
 from vllm.config import VllmConfig
 from vllm.model_executor.layers.linear import ReplicatedLinear
@@ -25,7 +25,7 @@
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.image import convert_image_mode
 from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems, NestedTensors)
+                                    MultiModalKwargsItems)
 from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
                                    ImageSize, MultiModalDataItems)
 from vllm.multimodal.processing import (BaseMultiModalProcessor,
@@ -37,8 +37,7 @@
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
-from .utils import (AutoWeightsLoader, flatten_bn, init_vllm_registered_model,
-                    maybe_prefix)
+from .utils import AutoWeightsLoader, init_vllm_registered_model, maybe_prefix
 
 IMG_START = '<img>'
 IMG_END = '</img>'
@@ -399,7 +398,7 @@ def __call__(
         max_dynamic_patch: Optional[int] = None,
         dynamic_image_size: Optional[bool] = None,
         return_tensors: Optional[Union[str, TensorType]] = None,
-    ) -> Mapping[str, NestedTensors]:
+    ) -> BatchFeature:
         if text is None:
             text = []
         if not isinstance(text, list):
@@ -418,7 +417,7 @@ def __call__(
                 max_dynamic_patch=max_dynamic_patch,
                 dynamic_image_size=dynamic_image_size,
             )
-            image_inputs: dict[str, NestedTensors] = {
+            image_inputs = {
                 "pixel_values_flat":
                 torch.cat(pixel_values_lst),
                 "image_num_patches":
@@ -435,10 +434,9 @@ def __call__(
 
         text_inputs = self.tokenizer(text)
 
-        return {
-            **BatchEncoding(text_inputs, tensor_type=return_tensors),
-            **image_inputs,
-        }
+        combined_outputs = {**text_inputs, **image_inputs}
+
+        return BatchFeature(combined_outputs, tensor_type=return_tensors)
 
 
 class SkyworkR1VProcessingInfo(BaseProcessingInfo):
@@ -529,7 +527,7 @@ def _call_hf_processor(
         mm_data: Mapping[str, object],
         mm_kwargs: Mapping[str, object],
         tok_kwargs: Mapping[str, object],
-    ) -> Mapping[str, NestedTensors]:
+    ) -> BatchFeature:
         processed_outputs = super()._call_hf_processor(
             prompt=prompt,
             mm_data=mm_data,
@@ -549,7 +547,7 @@ def _call_hf_processor(
 
     def _get_mm_fields_config(
         self,
-        hf_inputs: Mapping[str, NestedTensors],
+        hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
         image_num_patches = hf_inputs.get("image_num_patches", torch.empty(0))
@@ -617,6 +615,7 @@ def get_replacement_skyworkr1v(item_idx: int):
     info=SkyworkR1VProcessingInfo,
     dummy_inputs=SkyworkR1VDummyInputsBuilder)
 class SkyworkR1VChatModel(nn.Module, SupportsMultiModal, SupportsPP):
+    merge_by_field_config = True
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -703,7 +702,7 @@ def _init_vision_model(
         else:
             return InternVisionPatchModel(config.vision_config)
 
-    def _init_mlp1(self, config: PretrainedConfig) -> nn.Sequential:
+    def _init_mlp1(self, config: PretrainedConfig) -> nn.Module:
         vit_hidden_size = config.vision_config.hidden_size
         llm_hidden_size = config.text_config.hidden_size
 
@@ -756,13 +755,9 @@ def _parse_and_validate_image_input(
             return None
 
         if image_embeds is not None:
-            if not isinstance(image_embeds, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image embeddings. "
-                                 f"Got type: {type(image_embeds)}")
-
             return SkyworkR1VImageEmbeddingInputs(
                 type="image_embeds",
-                data=flatten_bn(image_embeds),
+                data=image_embeds,
             )
 
         image_token_id = kwargs["image_token_id"]
@@ -770,17 +765,6 @@ def _parse_and_validate_image_input(
         self.img_context_token_id = image_token_id.flatten().unique().item()
 
         if pixel_values_flat is not None:
-            if not isinstance(pixel_values_flat, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values_flat)}")
-
-            if not isinstance(image_num_patches, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image_num_patches. "
-                                 f"Got type: {type(image_num_patches)}")
-
-            pixel_values_flat = flatten_bn(pixel_values_flat, concat=True)
-            image_num_patches = flatten_bn(image_num_patches, concat=True)
-
             return SkyworkR1VImagePixelInputs(
                 type="pixel_values",
                 pixel_values_flat=pixel_values_flat,

From 60e9d4fa909434929fdc96e38d323feff59cea28 Mon Sep 17 00:00:00 2001
From: Yannick Schnider <Yannick.Schnider1@ibm.com>
Date: Fri, 3 Oct 2025 11:11:49 +0200
Subject: [PATCH 125/193] [test utils] correct wrong typing (#26159)

Signed-off-by: Yannick Schnider <yannick.schnider1@ibm.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/conftest.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/tests/conftest.py b/tests/conftest.py
index 66106d1bf779..c61a8f8dd539 100644
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -756,7 +756,7 @@ def __init__(
 
     def get_inputs(
         self,
-        prompts: Union[list[str], list[torch.Tensor], list[int]],
+        prompts: Union[list[str], list[torch.Tensor], list[list[int]]],
         images: Optional[PromptImageInput] = None,
         videos: Optional[PromptVideoInput] = None,
         audios: Optional[PromptAudioInput] = None,

From a05aa921635438424ba7b4da818849a17440dd10 Mon Sep 17 00:00:00 2001
From: Thomas Parnell <tpa@zurich.ibm.com>
Date: Fri, 3 Oct 2025 11:14:18 +0200
Subject: [PATCH 126/193] [CI] Fix distributed hybrid tests in CI (#26155)

Signed-off-by: Thomas Parnell <tpa@zurich.ibm.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/models/language/generation/test_hybrid.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/tests/models/language/generation/test_hybrid.py b/tests/models/language/generation/test_hybrid.py
index e60a86075b8b..9d67b46f2e3e 100644
--- a/tests/models/language/generation/test_hybrid.py
+++ b/tests/models/language/generation/test_hybrid.py
@@ -240,12 +240,12 @@ def test_distributed_correctness(
     num_logprobs: int,
 ) -> None:
     with vllm_runner(model, tensor_parallel_size=1,
-                     max_num_seqs=2) as vllm_model:
+                     max_num_seqs=MAX_NUM_SEQS) as vllm_model:
         vllm_outputs_tp_1 = vllm_model.generate_greedy_logprobs(
             example_prompts, max_tokens, num_logprobs)
 
     with vllm_runner(model, tensor_parallel_size=2,
-                     max_num_seqs=2) as vllm_model:
+                     max_num_seqs=MAX_NUM_SEQS) as vllm_model:
         vllm_outputs_tp_2 = vllm_model.generate_greedy_logprobs(
             example_prompts, max_tokens, num_logprobs)
 

From 48f70310c93cd354e4dc49159079000a6d06b10a Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Nicol=C3=B2=20Lucchesi?= <nlucches@redhat.com>
Date: Fri, 3 Oct 2025 12:47:59 +0200
Subject: [PATCH 127/193] [NIXL][Misc] Expose metrics from NIXL for logging to
 CLI (#25388)

Signed-off-by: NickLucche <nlucches@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 requirements/kv_connectors.txt                |  2 +-
 .../kv_connector/unit/test_nixl_connector.py  | 65 ++++++++++++---
 .../kv_connector/v1/nixl_connector.py         | 82 ++++++++++++++++---
 vllm/v1/metrics/loggers.py                    |  6 +-
 4 files changed, 127 insertions(+), 28 deletions(-)

diff --git a/requirements/kv_connectors.txt b/requirements/kv_connectors.txt
index 3b610e0d9736..b1f3269cd381 100644
--- a/requirements/kv_connectors.txt
+++ b/requirements/kv_connectors.txt
@@ -1,2 +1,2 @@
 lmcache
-nixl >= 0.5.1 # Required for disaggregated prefill
+nixl >= 0.6.0 # Required for disaggregated prefill
diff --git a/tests/v1/kv_connector/unit/test_nixl_connector.py b/tests/v1/kv_connector/unit/test_nixl_connector.py
index 578bf02eb519..21953b5533ec 100644
--- a/tests/v1/kv_connector/unit/test_nixl_connector.py
+++ b/tests/v1/kv_connector/unit/test_nixl_connector.py
@@ -57,6 +57,26 @@ def clear_kv_transfer():
         ensure_kv_transfer_shutdown()
 
 
+def get_default_xfer_telemetry(xferDurationS: float = 1,
+                               postDurationS: float = 1,
+                               totalBytes: int = 1,
+                               descCount: int = 1) -> dict:
+
+    class AttributeDict(dict):
+        __slots__ = ()
+        __getattr__ = dict.__getitem__
+        __setattr__ = dict.__setitem__  # type: ignore[assignment]
+
+    # We can't instantiate nixlXferTelemetry because it's read only and
+    # ray env does not have NIXL, so we must fake it
+    return AttributeDict(
+        xferDuration=xferDurationS * 1e6,  # in us
+        postDuration=postDurationS * 1e6,  # in us
+        totalBytes=totalBytes,
+        descCount=descCount,
+    )
+
+
 class FakeNixlWrapper:
     """Mock implementation of NixlWrapper for testing.
 
@@ -132,6 +152,9 @@ def make_prepped_xfer(self,
     def transfer(self, handle: int) -> str:
         return "PROC"
 
+    def get_xfer_telemetry(self, handle: int) -> dict:
+        return get_default_xfer_telemetry()
+
     ############################################################
     # Follow are for changing the behavior during testing.
     ############################################################
@@ -169,6 +192,11 @@ def _make_fake_nixl_pkg():
         with open(os.path.join(pkg_root, "__init__.py"), "w") as f:
             f.write(stub)
 
+        # Mock nixlXferTelemetry class
+        pkg_root2 = os.path.join(td, "nixl", "_bindings")
+        os.makedirs(pkg_root2, exist_ok=True)
+        with open(os.path.join(pkg_root2, "__init__.py"), "w") as f:
+            f.write("class nixlXferTelemetry: pass")
         # touch parent package
         open(os.path.join(td, "nixl", "__init__.py"), "w").close()
         yield td
@@ -575,7 +603,7 @@ def test_kv_connector_stats(dist_init):
 
     # Verify stats values are recorded
     assert not stats_after_transfer.is_empty()
-    assert stats_after_transfer.data["num_successful_transfers"] == 1
+    assert stats_after_transfer.num_successful_transfers == 1
 
     # Verify stats are reset after retrieval
     stats_after_reset = connector.get_kv_connector_stats()
@@ -599,16 +627,21 @@ def test_kv_connector_stats_aggregation():
 
     # Record different transfers on each worker
     # Worker 1: 2 transfers
-    worker1_stats.record_transfer()
-    worker1_stats.record_transfer()
+    stats = get_default_xfer_telemetry()
+    worker1_stats.record_transfer(stats)
+    worker1_stats.record_transfer(stats)
 
     # Worker 2: 1 transfer
-    worker2_stats.record_transfer()
+    worker2_stats.record_transfer(stats)
 
     # Worker 3: 3 transfers
-    worker3_stats.record_transfer()
-    worker3_stats.record_transfer()
-    worker3_stats.record_transfer()
+    stats = get_default_xfer_telemetry(xferDurationS=2,
+                                       postDurationS=2,
+                                       totalBytes=2,
+                                       descCount=2)
+    worker3_stats.record_transfer(stats)
+    worker3_stats.record_transfer(stats)
+    worker3_stats.record_transfer(stats)
 
     # Create ModelRunnerOutput instances for each worker
     worker_outputs = []
@@ -636,7 +669,12 @@ def test_kv_connector_stats_aggregation():
         aggregated_output.kv_connector_output.kv_connector_stats
     assert isinstance(kv_connector_stats, NixlKVConnectorStats)
     # Number of total transfers across all workers.
-    assert kv_connector_stats.data["num_successful_transfers"] == 6
+    assert kv_connector_stats.num_successful_transfers == 6
+    # Logging proc, call reduce() to get CLI-friendly stats.
+    cli_stats = kv_connector_stats.reduce()
+    assert cli_stats["Avg xfer time (ms)"] == 1500.0
+    assert cli_stats["Avg post time (ms)"] == 1500.0
+    assert cli_stats["Avg number of descriptors"] == 1.5
 
 
 def test_multi_kv_connector_stats_aggregation():
@@ -649,6 +687,7 @@ def test_multi_kv_connector_stats_aggregation():
 
     from dataclasses import dataclass
 
+    # Mock a KVConnectorStats class for testing aggregation over connectors.
     @dataclass
     class FooKVConnectorStats(KVConnectorStats):
 
@@ -676,7 +715,7 @@ def make_multi_stats(nixl_count: int,
         if nixl_count > 0:
             nixl_stats = NixlKVConnectorStats()
             for _ in range(nixl_count):
-                nixl_stats.record_transfer()
+                nixl_stats.record_transfer(get_default_xfer_telemetry())
             data["NixlConnector"] = nixl_stats
         if foo_count > 0:
             foo_stats = FooKVConnectorStats()
@@ -712,8 +751,10 @@ def make_multi_stats(nixl_count: int,
     assert isinstance(kv_connector_stats, MultiKVConnectorStats)
 
     # Validate per-connector totals across workers
-    assert kv_connector_stats["NixlConnector"].data[
-        "num_successful_transfers"] == 5
+    assert isinstance(kv_connector_stats["NixlConnector"],
+                      NixlKVConnectorStats)
+    assert kv_connector_stats["NixlConnector"].num_successful_transfers == 5
+    assert isinstance(kv_connector_stats["FooConnector"], FooKVConnectorStats)
     assert kv_connector_stats["FooConnector"].data["num_foo_transfers"] == 6
 
 
@@ -755,6 +796,8 @@ def test_abort_timeout_on_prefiller(monkeypatch, distributed_executor_backend):
                 "working_dir": working_dir,  # ship fake nixl package
                 "env_vars": {
                     "VLLM_NIXL_ABORT_REQUEST_TIMEOUT": str(timeout),
+                    # TODO: for ray to carry over, remove once we set
+                    "NIXL_TELEMETRY_ENABLE": "1",
                 },
             }
             ray.init(runtime_env=runtime_env)
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
index 4706c5130899..fdfcc39666ad 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
@@ -4,6 +4,7 @@
 import copy
 import logging
 import math
+import os
 import queue
 import threading
 import time
@@ -54,10 +55,12 @@
 # Lazy import nixl_wrapper to avoid loading nixl_bindings if nixl is not used
 try:
     from nixl._api import nixl_agent as NixlWrapper
+    from nixl._bindings import nixlXferTelemetry
     logger.info("NIXL is available")
 except ImportError:
     logger.warning("NIXL is not available")
     NixlWrapper = None
+    nixlXferTelemetry = None
 
 try:
     from nixl._api import nixl_agent_config
@@ -476,6 +479,9 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
         self.nixl_backends = \
             vllm_config.kv_transfer_config.get_from_extra_config(
                 "backends", ["UCX"])
+        # TODO temporary, once nixl allows for telemetry flag in config
+        # (next release), we can remove this env var.
+        os.environ["NIXL_TELEMETRY_ENABLE"] = "1"
         # Agent.
         non_ucx_backends = [b for b in self.nixl_backends if b != "UCX"]
         if nixl_agent_config is None:
@@ -1175,9 +1181,10 @@ def _pop_done_transfers(
             for handle, _xfer_stime in handles:
                 xfer_state = self.nixl_wrapper.check_xfer_state(handle)
                 if xfer_state == "DONE":
+                    # Get telemetry from NIXL
+                    res = self.nixl_wrapper.get_xfer_telemetry(handle)
+                    self.xfer_stats.record_transfer(res)
                     self.nixl_wrapper.release_xfer_handle(handle)
-                    # TODO (NickLucche) Get from NIXL telemetry once integrated
-                    self.xfer_stats.record_transfer()
                 elif xfer_state == "PROC":
                     in_progress = True
                     continue
@@ -1449,15 +1456,25 @@ class NixlKVConnectorStats(KVConnectorStats):
     """Container for transfer performance metrics"""
 
     def __post_init__(self):
-        if "num_successful_transfers" not in self.data:
-            self.data["num_successful_transfers"] = 0
+        if not self.data:
+            # Empty container init, no data is passed in.
+            self.reset()
 
     def reset(self):
-        self.data = {"num_successful_transfers": 0}
+        # Must be serializable
+        self.data: dict[str, list[float]] = {
+            "transfer_duration": [],
+            "post_duration": [],
+            "bytes_transferred": [],
+            "num_descriptors": [],
+        }
 
-    def record_transfer(self):
-        # TODO: record actual transfer stats when available
-        self.data["num_successful_transfers"] += 1
+    def record_transfer(self, res: nixlXferTelemetry):
+        # Keep metrics units consistent with rest of the code: time us->s
+        self.data["transfer_duration"].append(res.xferDuration / 1e6)
+        self.data["post_duration"].append(res.postDuration / 1e6)
+        self.data["bytes_transferred"].append(res.totalBytes)
+        self.data["num_descriptors"].append(res.descCount)
 
     def clone_and_reset(self) -> "NixlKVConnectorStats":
         old = copy.copy(self)
@@ -1465,16 +1482,55 @@ def clone_and_reset(self) -> "NixlKVConnectorStats":
         return old
 
     def is_empty(self) -> bool:
-        return self.data["num_successful_transfers"] == 0
+        return self.num_successful_transfers == 0
 
     def aggregate(self, other: KVConnectorStats) -> KVConnectorStats:
         if not other.is_empty():
-            self.data["num_successful_transfers"] += other.data[
-                "num_successful_transfers"]
+            for k, v in other.data.items():
+                accumulator = self.data[k]
+                assert isinstance(accumulator, list)
+                accumulator.extend(v)
         return self
 
     def reduce(self) -> dict[str, Union[int, float]]:
-        # TODO: reduce stats to a single value, calculate latency/throughput
+        # Compute compact representative stats suitable for CLI logging
+        if self.is_empty():
+            return {
+                "Num successful transfers": 0,
+                "Avg xfer time (ms)": 0,
+                "P90 xfer time (ms)": 0,
+                "Avg post time (ms)": 0,
+                "P90 post time (ms)": 0,
+                "Avg MB per transfer": 0,
+                "Throughput (MB/s)": 0,
+                "Avg number of descriptors": 0,
+            }
+
+        xfer_time = np.asarray(self.data["transfer_duration"])
+        post_time = np.asarray(self.data["post_duration"])
+        # Convert to MB for CLI logging.
+        mb = np.asarray(self.data["bytes_transferred"]) / 2**20
+        descs = np.asarray(self.data["num_descriptors"], dtype=np.uint32)
+        n = len(descs)
+        assert n == self.num_successful_transfers
+
+        total_mb = mb.sum()
+        avg_mb = total_mb / n
+
+        total_time_seconds = xfer_time.sum()
+        throughput_mb_s = total_mb / total_time_seconds
+
         return {
-            "num_successful_transfers": self.data["num_successful_transfers"]
+            "Num successful transfers": n,
+            "Avg xfer time (ms)": round(xfer_time.mean() * 1e3, 3),
+            "P90 xfer time (ms)": round(np.percentile(xfer_time, 90) * 1e3, 3),
+            "Avg post time (ms)": round(post_time.mean() * 1e3, 3),
+            "P90 post time (ms)": round(np.percentile(post_time, 90) * 1e3, 3),
+            "Avg MB per transfer": round(avg_mb, 3),
+            "Throughput (MB/s)": round(throughput_mb_s, 3),
+            "Avg number of descriptors": round(descs.mean(), 1),
         }
+
+    @property
+    def num_successful_transfers(self) -> int:
+        return len(self.data["transfer_duration"])
\ No newline at end of file
diff --git a/vllm/v1/metrics/loggers.py b/vllm/v1/metrics/loggers.py
index d68d111c67ca..ef95f03e8882 100644
--- a/vllm/v1/metrics/loggers.py
+++ b/vllm/v1/metrics/loggers.py
@@ -62,7 +62,7 @@ def __init__(self, vllm_config: VllmConfig, engine_index: int = 0):
         self.prefix_caching_metrics = PrefixCachingMetrics()
         self.spec_decoding_logging = SpecDecodingLogging()
         kv_tranfer_config = self.vllm_config.kv_transfer_config
-        self.kv_transfer_logging = KVConnectorLogging(kv_tranfer_config)
+        self.kv_connector_logging = KVConnectorLogging(kv_tranfer_config)
         self.last_prompt_throughput: float = 0.0
         self.last_generation_throughput: float = 0.0
 
@@ -101,7 +101,7 @@ def record(self,
                 self.spec_decoding_logging.observe(
                     scheduler_stats.spec_decoding_stats)
             if kv_connector_stats := scheduler_stats.kv_connector_stats:
-                self.kv_transfer_logging.observe(kv_connector_stats)
+                self.kv_connector_logging.observe(kv_connector_stats)
             self.last_scheduler_stats = scheduler_stats
 
     def log(self):
@@ -140,7 +140,7 @@ def log(self):
             self.prefix_caching_metrics.hit_rate * 100,
         )
         self.spec_decoding_logging.log(log_fn=log_fn)
-        self.kv_transfer_logging.log(log_fn=log_fn)
+        self.kv_connector_logging.log(log_fn=log_fn)
 
     def log_engine_initialized(self):
         if self.vllm_config.cache_config.num_gpu_blocks:

From 2b4eadc4f1d0e4932781549e7e883b01be9d8f3a Mon Sep 17 00:00:00 2001
From: kyt <eluban4532@gmail.com>
Date: Fri, 3 Oct 2025 19:55:44 +0900
Subject: [PATCH 128/193] [openai] Fix missing tool usage check (system
 message) (#24768)

Signed-off-by: kyt <eluban4532@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../openai/test_response_api_with_harmony.py     | 16 ++++++++++++++++
 vllm/entrypoints/openai/serving_chat.py          |  4 +++-
 2 files changed, 19 insertions(+), 1 deletion(-)

diff --git a/tests/entrypoints/openai/test_response_api_with_harmony.py b/tests/entrypoints/openai/test_response_api_with_harmony.py
index b882a2f9326e..400779064ef5 100644
--- a/tests/entrypoints/openai/test_response_api_with_harmony.py
+++ b/tests/entrypoints/openai/test_response_api_with_harmony.py
@@ -698,6 +698,22 @@ async def test_function_calling_required(client: OpenAI, model_name: str):
         )
 
 
+@pytest.mark.asyncio
+@pytest.mark.parametrize("model_name", [MODEL_NAME])
+async def test_system_message_with_tools(client: OpenAI, model_name: str):
+    from vllm.entrypoints.harmony_utils import get_system_message
+
+    # Test with custom tools enabled - commentary channel should be available
+    sys_msg = get_system_message(with_custom_tools=True)
+    valid_channels = sys_msg.content[0].channel_config.valid_channels
+    assert "commentary" in valid_channels
+
+    # Test with custom tools disabled - commentary channel should be removed
+    sys_msg = get_system_message(with_custom_tools=False)
+    valid_channels = sys_msg.content[0].channel_config.valid_channels
+    assert "commentary" not in valid_channels
+
+
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 async def test_function_calling_full_history(client: OpenAI, model_name: str):
diff --git a/vllm/entrypoints/openai/serving_chat.py b/vllm/entrypoints/openai/serving_chat.py
index ab4bf75102f4..2336158ac51b 100644
--- a/vllm/entrypoints/openai/serving_chat.py
+++ b/vllm/entrypoints/openai/serving_chat.py
@@ -1575,7 +1575,9 @@ def _make_request_with_harmony(
         sys_msg = get_system_message(
             reasoning_effort=request.reasoning_effort,
             browser_description=None,
-            python_description=None)
+            python_description=None,
+            with_custom_tools=request.tools is not None
+            )
         messages.append(sys_msg)
 
         # Add developer message.

From 40234286a02c1b28fd7a5cbbdcc2a350ba603a55 Mon Sep 17 00:00:00 2001
From: Wenlong Wang <wangwenlong2755@gmail.com>
Date: Fri, 3 Oct 2025 03:59:10 -0700
Subject: [PATCH 129/193] [Multi Modal] Configurable MM Profiling (#25631)

Signed-off-by: wwl2755 <wangwenlong2755@gmail.com>
Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Co-authored-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/contributing/model/multimodal.md         | 12 ++-
 .../multimodal/processing/test_common.py      | 22 ++++-
 .../multimodal/processing/test_mllama4.py     | 10 +-
 .../processing/test_tensor_schema.py          | 17 +++-
 vllm/config/model.py                          |  4 +-
 vllm/config/multimodal.py                     | 95 ++++++++++++++++---
 vllm/engine/arg_utils.py                      |  2 +-
 vllm/model_executor/models/aria.py            |  7 +-
 vllm/model_executor/models/aya_vision.py      |  7 +-
 vllm/model_executor/models/blip2.py           |  7 +-
 vllm/model_executor/models/chameleon.py       |  7 +-
 vllm/model_executor/models/cohere2_vision.py  |  7 +-
 vllm/model_executor/models/deepseek_vl2.py    |  7 +-
 vllm/model_executor/models/dots_ocr.py        |  7 +-
 vllm/model_executor/models/ernie45_vl.py      | 11 ++-
 vllm/model_executor/models/fuyu.py            |  7 +-
 vllm/model_executor/models/gemma3_mm.py       |  7 +-
 vllm/model_executor/models/gemma3n_mm.py      | 12 ++-
 vllm/model_executor/models/glm4_1v.py         | 36 ++++++-
 vllm/model_executor/models/glm4v.py           |  7 +-
 vllm/model_executor/models/granite_speech.py  |  5 +
 .../models/hyperclovax_vision.py              |  8 ++
 vllm/model_executor/models/idefics3.py        |  7 +-
 vllm/model_executor/models/interns1.py        | 11 ++-
 vllm/model_executor/models/internvl.py        | 15 ++-
 vllm/model_executor/models/keye.py            |  7 ++
 vllm/model_executor/models/kimi_vl.py         |  7 +-
 vllm/model_executor/models/llava.py           |  7 +-
 .../model_executor/models/llava_next_video.py |  5 +
 vllm/model_executor/models/llava_onevision.py |  9 +-
 vllm/model_executor/models/midashenglm.py     |  7 +-
 vllm/model_executor/models/minicpmo.py        | 10 +-
 vllm/model_executor/models/minicpmv.py        | 11 ++-
 vllm/model_executor/models/mistral3.py        |  7 +-
 vllm/model_executor/models/mllama4.py         |  7 +-
 vllm/model_executor/models/molmo.py           |  7 +-
 .../model_executor/models/nano_nemotron_vl.py | 15 ++-
 vllm/model_executor/models/nvlm_d.py          |  7 +-
 vllm/model_executor/models/ovis.py            |  7 +-
 vllm/model_executor/models/ovis2_5.py         | 10 +-
 vllm/model_executor/models/paligemma.py       |  7 +-
 vllm/model_executor/models/phi3v.py           |  7 +-
 vllm/model_executor/models/phi4_multimodal.py | 11 ++-
 vllm/model_executor/models/phi4mm.py          | 11 ++-
 vllm/model_executor/models/pixtral.py         | 10 +-
 .../models/qwen2_5_omni_thinker.py            | 15 ++-
 vllm/model_executor/models/qwen2_audio.py     |  8 +-
 vllm/model_executor/models/qwen2_vl.py        |  9 +-
 vllm/model_executor/models/qwen3_vl.py        | 10 +-
 vllm/model_executor/models/qwen_vl.py         |  7 +-
 vllm/model_executor/models/rvl.py             |  8 +-
 vllm/model_executor/models/skyworkr1v.py      |  7 +-
 vllm/model_executor/models/step3_vl.py        |  7 +-
 vllm/model_executor/models/terratorch.py      | 11 +++
 vllm/model_executor/models/transformers.py    |  7 +-
 vllm/model_executor/models/ultravox.py        |  8 +-
 vllm/model_executor/models/voxtral.py         | 11 ++-
 vllm/model_executor/models/whisper.py         |  8 +-
 vllm/multimodal/profiling.py                  | 80 +++++++++++++++-
 vllm/multimodal/registry.py                   | 51 ++++++++--
 60 files changed, 654 insertions(+), 99 deletions(-)

diff --git a/docs/contributing/model/multimodal.md b/docs/contributing/model/multimodal.md
index 1d72fe97b966..724dc2284e28 100644
--- a/docs/contributing/model/multimodal.md
+++ b/docs/contributing/model/multimodal.md
@@ -258,17 +258,21 @@ Assuming that the memory usage increases with the number of tokens, the dummy in
             self,
             seq_len: int,
             mm_counts: Mapping[str, int],
+            mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
         ) -> MultiModalDataDict:
             num_images = mm_counts.get("image", 0)
 
             target_width, target_height = \
                 self.info.get_image_size_with_most_features()
 
+            image_overrides = mm_options.get("image") if mm_options else None
+
             return {
                 "image":
                 self._get_dummy_images(width=target_width,
                                     height=target_height,
-                                    num_images=num_images)
+                                    num_images=num_images,
+                                    overrides=image_overrides)
             }
         ```
 
@@ -438,16 +442,20 @@ Assuming that the memory usage increases with the number of tokens, the dummy in
             self,
             seq_len: int,
             mm_counts: Mapping[str, int],
+            mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
         ) -> MultiModalDataDict:
             target_width, target_height = \
                 self.info.get_image_size_with_most_features()
             num_images = mm_counts.get("image", 0)
 
+            image_overrides = mm_options.get("image") if mm_options else None
+
             return {
                 "image":
                 self._get_dummy_images(width=target_width,
                                     height=target_height,
-                                    num_images=num_images)
+                                    num_images=num_images,
+                                    overrides=image_overrides)
             }
         ```
 
diff --git a/tests/models/multimodal/processing/test_common.py b/tests/models/multimodal/processing/test_common.py
index ddc675b0849c..e8c28afee7e3 100644
--- a/tests/models/multimodal/processing/test_common.py
+++ b/tests/models/multimodal/processing/test_common.py
@@ -12,6 +12,8 @@
 from PIL import Image
 
 from vllm.config import ModelConfig
+from vllm.config.multimodal import (AudioDummyOptions, BaseDummyOptions,
+                                    ImageDummyOptions, VideoDummyOptions)
 from vllm.multimodal import MULTIMODAL_REGISTRY, MultiModalDataDict
 from vllm.multimodal.cache import MultiModalProcessorOnlyCache
 from vllm.multimodal.inputs import MultiModalInputs
@@ -112,12 +114,26 @@ def _test_processing_correctness(
 
     processing_info = factories.info(ctx)
     supported_mm_limits = processing_info.get_supported_mm_limits()
-    limit_mm_per_prompt = {
+    # Keep integer limits for local data generation
+    limit_mm_per_prompt_ints = {
         modality: 3 if limit is None else limit
         for modality, limit in supported_mm_limits.items()
     }
 
-    model_config.get_multimodal_config().limit_per_prompt = limit_mm_per_prompt
+    def _to_dummy_options(modality: str, count: int) -> BaseDummyOptions:
+        if modality == "video":
+            return VideoDummyOptions(count=count)
+        if modality == "image":
+            return ImageDummyOptions(count=count)
+        if modality == "audio":
+            return AudioDummyOptions(count=count)
+        return BaseDummyOptions(count=count)
+
+    # Assign normalized DummyOptions to the model config
+    model_config.get_multimodal_config().limit_per_prompt = {
+        modality: _to_dummy_options(modality, count)
+        for modality, count in limit_mm_per_prompt_ints.items()
+    }
 
     baseline_processor = factories.build_processor(ctx, cache=None)
     cached_processor = factories.build_processor(ctx, cache=cache)
@@ -150,7 +166,7 @@ def _test_processing_correctness(
             k:
             [(input_to_hit[k] if rng.rand() < hit_rate else input_factory[k]())
              for _ in range(rng.randint(limit + 1))]
-            for k, limit in limit_mm_per_prompt.items()
+            for k, limit in limit_mm_per_prompt_ints.items()
         }
 
         mm_counts = {k: len(vs) for k, vs in mm_data.items()}
diff --git a/tests/models/multimodal/processing/test_mllama4.py b/tests/models/multimodal/processing/test_mllama4.py
index e7b28ff8ec7f..a155ada35e92 100644
--- a/tests/models/multimodal/processing/test_mllama4.py
+++ b/tests/models/multimodal/processing/test_mllama4.py
@@ -17,23 +17,23 @@ def test_profiling(model_id: str, max_model_len: int):
     model_config_kwargs = {
         "max_model_len": max_model_len,
     }
+    mm_counts = {"image": 1}
     ctx = build_model_context(
         model_id,
         model_config_kwargs=model_config_kwargs,
-        limit_mm_per_prompt={"image": 1},
+        limit_mm_per_prompt=mm_counts,
     )
 
-    mm_config = ctx.get_mm_config()
     processor = MULTIMODAL_REGISTRY.create_processor(ctx.model_config)
     profiler = MultiModalProfiler(processor)
 
     decoder_dummy_data = profiler.get_decoder_dummy_data(
         max_model_len,
-        mm_counts=mm_config.limit_per_prompt,
+        mm_counts=mm_counts,
     )
     dummy_mm_data = processor.dummy_inputs.get_dummy_processor_inputs(
         max_model_len,
-        mm_counts=mm_config.limit_per_prompt,
+        mm_counts=mm_counts,
     )
 
     hf_config = ctx.get_hf_config(Llama4Config)
@@ -58,7 +58,7 @@ def test_profiling(model_id: str, max_model_len: int):
 
     profiled_tokens = profiler.get_mm_max_contiguous_tokens(
         max_model_len,
-        mm_counts=mm_config.limit_per_prompt,
+        mm_counts=mm_counts,
     )
 
     assert total_tokens == profiled_tokens["image"]
diff --git a/tests/models/multimodal/processing/test_tensor_schema.py b/tests/models/multimodal/processing/test_tensor_schema.py
index 9d132ecc34b7..6061e4538c95 100644
--- a/tests/models/multimodal/processing/test_tensor_schema.py
+++ b/tests/models/multimodal/processing/test_tensor_schema.py
@@ -15,6 +15,8 @@
 from PIL import Image
 
 from vllm.config import ModelConfig, VllmConfig, set_current_vllm_config
+from vllm.config.multimodal import (AudioDummyOptions, BaseDummyOptions,
+                                    ImageDummyOptions, VideoDummyOptions)
 from vllm.distributed import (cleanup_dist_env_and_memory,
                               init_distributed_environment,
                               initialize_model_parallel)
@@ -236,7 +238,20 @@ def test_model_tensor_schema(model_arch: str, model_id: str):
         modality: 3 if limit is None else limit
         for modality, limit in supported_mm_limits.items()
     }
-    model_config.get_multimodal_config().limit_per_prompt = limit_mm_per_prompt
+
+    def _to_dummy_options(modality: str, count: int) -> BaseDummyOptions:
+        if modality == "video":
+            return VideoDummyOptions(count=count)
+        if modality == "image":
+            return ImageDummyOptions(count=count)
+        if modality == "audio":
+            return AudioDummyOptions(count=count)
+        return BaseDummyOptions(count=count)
+
+    model_config.get_multimodal_config().limit_per_prompt = {
+        modality: _to_dummy_options(modality, count)
+        for modality, count in limit_mm_per_prompt.items()
+    }
     processor = factories.build_processor(ctx, cache=None)
 
     with initialize_dummy_model(model_cls, model_config) as model:
diff --git a/vllm/config/model.py b/vllm/config/model.py
index 2bf6a1671188..0bf8a9fe1f0f 100644
--- a/vllm/config/model.py
+++ b/vllm/config/model.py
@@ -276,7 +276,9 @@ class ModelConfig:
     multimodal_config: Optional[MultiModalConfig] = None
     """Configuration for multimodal model. If `None`, this will be inferred
     from the architecture of `self.model`."""
-    limit_mm_per_prompt: InitVar[Optional[dict[str, int]]] = None
+    limit_mm_per_prompt: InitVar[Optional[dict[str, Union[int,
+                                                          dict[str,
+                                                               int]]]]] = None
     media_io_kwargs: InitVar[Optional[dict[str, dict[str, Any]]]] = None
     mm_processor_kwargs: InitVar[Optional[dict[str, Any]]] = None
     mm_processor_cache_gb: InitVar[Optional[float]] = None
diff --git a/vllm/config/multimodal.py b/vllm/config/multimodal.py
index 569de9579900..fd62d2411ade 100644
--- a/vllm/config/multimodal.py
+++ b/vllm/config/multimodal.py
@@ -4,15 +4,45 @@
 import hashlib
 from collections.abc import Mapping
 from dataclasses import field
-from typing import Any, Literal, Optional
+from typing import Any, Literal, Optional, Union
 
+from pydantic import ConfigDict, Field, field_validator
 from pydantic.dataclasses import dataclass
 
-import vllm.envs as envs
 from vllm.config.utils import config
 
+
+@dataclass
+class BaseDummyOptions:
+    """Base options for generating dummy data during profiling."""
+    count: int = Field(999, ge=0)
+
+
+@dataclass(config=ConfigDict(extra="forbid"))
+class VideoDummyOptions(BaseDummyOptions):
+    """Options for generating dummy video data during profiling."""
+    num_frames: Optional[int] = Field(None, gt=0)
+    width: Optional[int] = Field(None, gt=0)
+    height: Optional[int] = Field(None, gt=0)
+
+
+@dataclass(config=ConfigDict(extra="forbid"))
+class ImageDummyOptions(BaseDummyOptions):
+    """Options for generating dummy image data during profiling."""
+    width: Optional[int] = Field(None, gt=0)
+    height: Optional[int] = Field(None, gt=0)
+
+
+@dataclass(config=ConfigDict(extra="forbid"))
+class AudioDummyOptions(BaseDummyOptions):
+    """Options for generating dummy audio data during profiling."""
+    length: Optional[int] = Field(None, gt=0)
+
+
 MMEncoderTPMode = Literal["weights", "data"]
 MMCacheType = Literal["shm", "lru"]
+DummyOptions = Union[BaseDummyOptions, VideoDummyOptions, ImageDummyOptions,
+                     AudioDummyOptions]
 
 
 @config
@@ -20,12 +50,22 @@
 class MultiModalConfig:
     """Controls the behavior of multimodal models."""
 
-    limit_per_prompt: dict[str, int] = field(default_factory=dict)
-    """The maximum number of input items allowed per prompt for each modality.
-    Defaults to 1 (V0) or 999 (V1) for each modality.
+    limit_per_prompt: dict[str, DummyOptions] = field(default_factory=dict)
+    """The maximum number of input items and options allowed per 
+        prompt for each modality.
+    Defaults to 999 for each modality.
+
+    Legacy format (count only):
+        {"image": 16, "video": 2}
+
+    Configurable format (with options):
+        {"video": {"count": 1, "num_frames": 32, "width": 512, "height": 512}, 
+        "image": {"count": 5, "width": 512, "height": 512}}
 
-    For example, to allow up to 16 images and 2 videos per prompt:
-    `{"image": 16, "video": 2}`"""
+    Mixed format (combining both):
+        {"image": 16, "video": {"count": 1, "num_frames": 32, "width": 512, 
+        "height": 512}}
+    """
     media_io_kwargs: dict[str, dict[str, Any]] = field(default_factory=dict)
     """Additional args passed to process media inputs, keyed by modalities.
     For example, to set num_frames for video, set
@@ -84,6 +124,27 @@ class MultiModalConfig:
     from each video to be pruned.
     """
 
+    @field_validator("limit_per_prompt", mode="before")
+    @classmethod
+    def _validate_limit_per_prompt(
+        cls, value: dict[str, Union[int,
+                                    dict[str,
+                                         int]]]) -> dict[str, DummyOptions]:
+        for k, v in value.items():
+            # Handle legacy format where only count is specified
+            if isinstance(v, int):
+                v = {"count": v}
+            # Convert to the appropriate DummyOptions subclass
+            if k == "video":
+                value[k] = VideoDummyOptions(**v)
+            elif k == "image":
+                value[k] = ImageDummyOptions(**v)
+            elif k == "audio":
+                value[k] = AudioDummyOptions(**v)
+            else:
+                value[k] = BaseDummyOptions(**v)
+        return value
+
     def compute_hash(self) -> str:
         """
         WARNING: Whenever a new field is added to this config,
@@ -106,12 +167,22 @@ def compute_hash(self) -> str:
     def get_limit_per_prompt(self, modality: str) -> int:
         """
         Get the maximum number of input items allowed per prompt
-        for the given modality.
+        for the given modality (backward compatible).
+        """
+        limit_data = self.limit_per_prompt.get(modality)
+
+        if limit_data is None:
+            # Unspecified modality is set to 999 by default
+            return 999
+        return limit_data.count
+
+    def get_dummy_options(self, modality: str) -> Optional[BaseDummyOptions]:
+        """
+        Get the configurable dummy data options for a modality.
+        Returns None if no options are configured for this modality.
         """
-        return self.limit_per_prompt.get(
-            modality,
-            999 if envs.VLLM_USE_V1 else 1,
-        )
+        # All values are now DummyOptions after normalization
+        return self.limit_per_prompt.get(modality)
 
     def merge_mm_processor_kwargs(
         self,
diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index 7763dbc392e4..bf293a4d2aa9 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -376,7 +376,7 @@ class EngineArgs:
     quantization: Optional[QuantizationMethods] = ModelConfig.quantization
     enforce_eager: bool = ModelConfig.enforce_eager
     disable_custom_all_reduce: bool = ParallelConfig.disable_custom_all_reduce
-    limit_mm_per_prompt: dict[str, int] = \
+    limit_mm_per_prompt: dict[str, Union[int, dict[str, int]]] = \
         get_field(MultiModalConfig, "limit_per_prompt")
     interleave_mm_strings: bool = MultiModalConfig.interleave_mm_strings
     media_io_kwargs: dict[str, dict[str,
diff --git a/vllm/model_executor/models/aria.py b/vllm/model_executor/models/aria.py
index e4a11a3d4a51..188624e606ff 100644
--- a/vllm/model_executor/models/aria.py
+++ b/vllm/model_executor/models/aria.py
@@ -10,6 +10,7 @@
 from transformers.models.aria.processing_aria import AriaProcessor
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_tensor_model_parallel_rank
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.fused_moe import FusedMoE
@@ -431,17 +432,21 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         vision_config = self.info.get_vision_config()
 
         max_image_size = vision_config.image_size
         num_images = mm_counts.get("image", 0)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=max_image_size,
                                    height=max_image_size,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/aya_vision.py b/vllm/model_executor/models/aya_vision.py
index 04100fb8c412..a682252f4a2b 100644
--- a/vllm/model_executor/models/aya_vision.py
+++ b/vllm/model_executor/models/aya_vision.py
@@ -16,6 +16,7 @@
     get_optimal_tiled_canvas)
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import MultiModalDataDict, MultiModalKwargsItems
 from vllm.multimodal.parse import (ImageProcessorItems, ImageSize,
@@ -166,16 +167,20 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
         image_size = \
             self.info.get_image_size_with_most_features()
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=image_size.width,
                                    height=image_size.height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/blip2.py b/vllm/model_executor/models/blip2.py
index 940d39c7a67c..3d057654cca7 100644
--- a/vllm/model_executor/models/blip2.py
+++ b/vllm/model_executor/models/blip2.py
@@ -10,6 +10,7 @@
                           apply_chunking_to_forward)
 
 from vllm.config import CacheConfig, VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
@@ -435,6 +436,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         hf_config = self.info.get_hf_config()
         vision_config = hf_config.vision_config
@@ -442,11 +444,14 @@ def get_dummy_mm_data(
         max_image_size = vision_config.image_size
         num_images = mm_counts.get("image", 0)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=max_image_size,
                                    height=max_image_size,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/chameleon.py b/vllm/model_executor/models/chameleon.py
index 4999f7904b14..b1432dcb9d6d 100644
--- a/vllm/model_executor/models/chameleon.py
+++ b/vllm/model_executor/models/chameleon.py
@@ -14,6 +14,7 @@
 
 from vllm.attention import Attention
 from vllm.config import CacheConfig, VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import SiluAndMul
@@ -92,17 +93,21 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         config = self.info.get_hf_config()
 
         width = height = config.vq_config.resolution
         num_images = mm_counts.get("image", 0)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=width,
                                    height=height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/cohere2_vision.py b/vllm/model_executor/models/cohere2_vision.py
index 78a7f0a52c72..70f2a3fd339a 100644
--- a/vllm/model_executor/models/cohere2_vision.py
+++ b/vllm/model_executor/models/cohere2_vision.py
@@ -16,6 +16,7 @@
     Cohere2VisionProcessor)
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import MulAndSilu
 from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
                                                RowParallelLinear)
@@ -209,16 +210,20 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
         image_size = \
             self.info.get_image_size_with_most_features()
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=image_size.width,
                                    height=image_size.height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/deepseek_vl2.py b/vllm/model_executor/models/deepseek_vl2.py
index 3e3b4e59f833..107949df2270 100644
--- a/vllm/model_executor/models/deepseek_vl2.py
+++ b/vllm/model_executor/models/deepseek_vl2.py
@@ -14,6 +14,7 @@
 from transformers import BatchFeature
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.utils import set_default_torch_dtype
@@ -191,16 +192,20 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
         max_image_size = self.info.get_image_size_with_most_features()
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=max_image_size.width,
                                    height=max_image_size.height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/dots_ocr.py b/vllm/model_executor/models/dots_ocr.py
index 86888c10ee39..cda46d123901 100644
--- a/vllm/model_executor/models/dots_ocr.py
+++ b/vllm/model_executor/models/dots_ocr.py
@@ -13,6 +13,7 @@
 from vllm.attention.layer import (check_upstream_fa_availability,
                                   maybe_get_vit_flash_attn_backend)
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import utils as dist_utils
 from vllm.distributed.parallel_state import (
     get_tensor_model_parallel_rank, get_tensor_model_parallel_world_size)
@@ -91,17 +92,21 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
         target_width, target_height = self.info.get_image_size_with_most_features(  # noqa: E501
         )
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
         }
 
 
diff --git a/vllm/model_executor/models/ernie45_vl.py b/vllm/model_executor/models/ernie45_vl.py
index 8da7b9f2c3e0..903ddf7953ea 100644
--- a/vllm/model_executor/models/ernie45_vl.py
+++ b/vllm/model_executor/models/ernie45_vl.py
@@ -38,6 +38,7 @@
 from vllm.attention.layer import (check_upstream_fa_availability,
                                   maybe_get_vit_flash_attn_backend)
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import parallel_state
 from vllm.distributed import utils as dist_utils
 from vllm.logger import init_logger
@@ -1184,6 +1185,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -1193,16 +1195,21 @@ def get_dummy_mm_data(
         target_num_frames = \
             self.info.get_num_frames_with_most_features(seq_len, mm_counts)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+        video_overrides = mm_options.get("video") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
             "video":
             self._get_dummy_videos(width=target_width,
                                    height=target_height,
                                    num_frames=target_num_frames,
-                                   num_videos=num_videos)
+                                   num_videos=num_videos,
+                                   overrides=video_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/fuyu.py b/vllm/model_executor/models/fuyu.py
index 2ab2cf9b17b3..a0f8d0659c59 100644
--- a/vllm/model_executor/models/fuyu.py
+++ b/vllm/model_executor/models/fuyu.py
@@ -27,6 +27,7 @@
                           FuyuProcessor)
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.linear import ColumnParallelLinear
 from vllm.model_executor.models.persimmon import PersimmonForCausalLM
 from vllm.multimodal import MULTIMODAL_REGISTRY
@@ -136,16 +137,20 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
         num_images = mm_counts.get("image", 0)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/gemma3_mm.py b/vllm/model_executor/models/gemma3_mm.py
index b6aa78ac53e0..e1956b94cdc8 100644
--- a/vllm/model_executor/models/gemma3_mm.py
+++ b/vllm/model_executor/models/gemma3_mm.py
@@ -11,6 +11,7 @@
 
 import vllm.envs as envs
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.logger import init_logger
 from vllm.model_executor.layers.layernorm import GemmaRMSNorm
 from vllm.model_executor.models.module_mapping import MultiModelKeys
@@ -241,17 +242,21 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/gemma3n_mm.py b/vllm/model_executor/models/gemma3n_mm.py
index 83b9d7fa4133..22f9967ebdcf 100644
--- a/vllm/model_executor/models/gemma3n_mm.py
+++ b/vllm/model_executor/models/gemma3n_mm.py
@@ -16,6 +16,7 @@
 from transformers.models.siglip import SiglipImageProcessorFast
 
 from vllm.config import ModelConfig, SpeechToTextConfig, VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.inputs.data import PromptType
 from vllm.logger import init_logger
 from vllm.model_executor.layers.layernorm import RMSNorm
@@ -153,6 +154,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
         num_audios = mm_counts.get("audio", 0)
@@ -163,13 +165,19 @@ def get_dummy_mm_data(
         img_width = image_processor.size.get("width", 224)
         img_height = image_processor.size.get("height", 224)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+        audio_overrides = mm_options.get("audio") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=img_width,
                                    height=img_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
             "audio":
-            self._get_dummy_audios(length=audio_len, num_audios=num_audios)
+            self._get_dummy_audios(length=audio_len,
+                                   num_audios=num_audios,
+                                   overrides=audio_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/glm4_1v.py b/vllm/model_executor/models/glm4_1v.py
index 5b64941762c6..c253631eb8b4 100644
--- a/vllm/model_executor/models/glm4_1v.py
+++ b/vllm/model_executor/models/glm4_1v.py
@@ -29,7 +29,7 @@
 import math
 from collections.abc import Iterable, Mapping, Sequence
 from functools import partial
-from typing import Annotated, Any, Callable, Literal, Optional, Union
+from typing import Annotated, Any, Callable, Literal, Optional, Union, override
 
 import numpy as np
 import torch
@@ -50,6 +50,7 @@
 from vllm.attention.layer import (check_upstream_fa_availability,
                                   maybe_get_vit_flash_attn_backend)
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions, VideoDummyOptions
 from vllm.distributed import (get_tensor_model_parallel_world_size,
                               parallel_state)
 from vllm.distributed import utils as dist_utils
@@ -1110,6 +1111,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -1118,17 +1120,23 @@ def get_dummy_mm_data(
             self.info.get_image_size_with_most_features())
         target_num_frames = self.info.get_num_frames_with_most_features(
             seq_len, mm_counts)
+
+        image_overrides = mm_options.get("image") if mm_options else None
+        video_overrides = mm_options.get("video") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
             "video":
             self._get_dummy_videos(
                 width=target_width,
                 height=target_height,
                 num_frames=target_num_frames,
                 num_videos=num_videos,
+                overrides=video_overrides,
             ),
         }
 
@@ -1139,7 +1147,31 @@ def _get_dummy_videos(
         height: int,
         num_frames: int,
         num_videos: int,
+        overrides: Optional[VideoDummyOptions] = None,
     ) -> list[VideoItem]:
+        if overrides:
+            if overrides.num_frames:
+                if overrides.num_frames > num_frames:
+                    logger.warning(
+                        "video.num_frames override (%d) exceeds model's "
+                        "maximum number of frames (%d), will be ignored",
+                        overrides.num_frames, num_frames)
+                num_frames = min(num_frames, overrides.num_frames)
+            if overrides.width:
+                if overrides.width > width:
+                    logger.warning(
+                        "video.width override (%d) exceeds model's "
+                        "maximum width (%d), will be ignored", overrides.width,
+                        width)
+                width = min(width, overrides.width)
+            if overrides.height:
+                if overrides.height > height:
+                    logger.warning(
+                        "video.height override (%d) exceeds model's "
+                        "maximum height (%d), will be ignored",
+                        overrides.height, height)
+                height = min(height, override.height)
+
         video = np.full((num_frames, width, height, 3), 255, dtype=np.uint8)
         video_items = []
         for i in range(num_videos):
diff --git a/vllm/model_executor/models/glm4v.py b/vllm/model_executor/models/glm4v.py
index 213c3b2769eb..bc898105cbcb 100644
--- a/vllm/model_executor/models/glm4v.py
+++ b/vllm/model_executor/models/glm4v.py
@@ -19,6 +19,7 @@
 
 from vllm.attention.layer import MultiHeadAttention
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul, get_act_fn
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
@@ -465,6 +466,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         hf_config = self.info.get_hf_config()
         vision_config = hf_config.vision_config
@@ -472,11 +474,14 @@ def get_dummy_mm_data(
         target_width = target_height = vision_config["image_size"]
         num_images = mm_counts.get("image", 0)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/granite_speech.py b/vllm/model_executor/models/granite_speech.py
index ea9f67723b12..e543c6040fc0 100644
--- a/vllm/model_executor/models/granite_speech.py
+++ b/vllm/model_executor/models/granite_speech.py
@@ -33,6 +33,7 @@
 from transformers import BatchFeature, PretrainedConfig
 
 from vllm.config import CacheConfig, VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
                                                RowParallelLinear)
 from vllm.model_executor.layers.quantization import QuantizationConfig
@@ -181,13 +182,17 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_audios = mm_counts.get("audio", 0)
+        audio_overrides = mm_options.get("audio") if mm_options else None
+
         return {
             "audio":
             self._get_dummy_audios(
                 length=self.info.get_max_audio_len(),
                 num_audios=num_audios,
+                overrides=audio_overrides,
             )
         }
 
diff --git a/vllm/model_executor/models/hyperclovax_vision.py b/vllm/model_executor/models/hyperclovax_vision.py
index b0f9d5e2657e..10d3bc8464ba 100644
--- a/vllm/model_executor/models/hyperclovax_vision.py
+++ b/vllm/model_executor/models/hyperclovax_vision.py
@@ -29,6 +29,7 @@
 from transformers.modeling_utils import no_init_weights
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.cache import BaseMultiModalProcessorCache
@@ -149,6 +150,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -156,12 +158,17 @@ def get_dummy_mm_data(
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
         target_num_frames = 32
+
+        image_overrides = mm_options.get("image") if mm_options else None
+        video_overrides = mm_options.get("video") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(
                 width=target_width,
                 height=target_height,
                 num_images=num_images,
+                overrides=image_overrides,
             ),
             "video":
             self._get_dummy_videos(
@@ -169,6 +176,7 @@ def get_dummy_mm_data(
                 height=target_height - 1,
                 num_frames=target_num_frames,
                 num_videos=num_videos,
+                overrides=video_overrides,
             )
         }
 
diff --git a/vllm/model_executor/models/idefics3.py b/vllm/model_executor/models/idefics3.py
index dddf1c6fb626..567793e9b7ee 100644
--- a/vllm/model_executor/models/idefics3.py
+++ b/vllm/model_executor/models/idefics3.py
@@ -26,6 +26,7 @@
                           Idefics3Processor)
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.linear import ReplicatedLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
@@ -292,17 +293,21 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
         hf_processor = self.info.get_hf_processor()
         image_processor: Idefics3ImageProcessor = hf_processor.image_processor
         longest_edge = image_processor.max_image_size['longest_edge']
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=longest_edge,
                                    height=longest_edge,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/interns1.py b/vllm/model_executor/models/interns1.py
index e5caf0eae37d..7d82dad34a7a 100644
--- a/vllm/model_executor/models/interns1.py
+++ b/vllm/model_executor/models/interns1.py
@@ -20,6 +20,7 @@
     InternVLVideoProcessor)
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.models.interns1_vit import InternS1VisionModel
 from vllm.model_executor.models.module_mapping import MultiModelKeys
@@ -270,6 +271,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
@@ -281,16 +283,21 @@ def get_dummy_mm_data(
         config = self.info.get_hf_config()
         image_size_h, image_size_w = config.vision_config.image_size
 
+        image_overrides = mm_options.get("image") if mm_options else None
+        video_overrides = mm_options.get("video") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
             "video":
             self._get_dummy_videos(width=image_size_w,
                                    height=image_size_h,
                                    num_frames=target_num_frames,
-                                   num_videos=num_videos),
+                                   num_videos=num_videos,
+                                   overrides=video_overrides),
         }
 
 
diff --git a/vllm/model_executor/models/internvl.py b/vllm/model_executor/models/internvl.py
index 1f3224f9ac58..48ea5a18a22d 100644
--- a/vllm/model_executor/models/internvl.py
+++ b/vllm/model_executor/models/internvl.py
@@ -20,6 +20,7 @@
 from transformers import BatchFeature, PretrainedConfig, TensorType
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.awq import AWQConfig
 from vllm.model_executor.models.intern_vit import (InternVisionModel,
@@ -747,16 +748,20 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
         num_images = mm_counts.get("image", 0)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
@@ -913,21 +918,25 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         dummy_image = super().get_dummy_mm_data(seq_len=seq_len,
-                                                mm_counts=mm_counts)
+                                                mm_counts=mm_counts,
+                                                mm_options=mm_options)
         if self.info.supports_video:
             config = self.info.get_hf_config()
             image_size: int = config.vision_config.image_size
             target_num_frames = \
                 self.info.get_num_frames_with_most_features(seq_len, mm_counts)
             num_videos = mm_counts.get("video", 0)
+            video_overrides = mm_options.get("video") if mm_options else None
             dummy_video = {
                 "video":
                 self._get_dummy_videos(width=image_size,
                                        height=image_size,
                                        num_frames=target_num_frames,
-                                       num_videos=num_videos)
+                                       num_videos=num_videos,
+                                       overrides=video_overrides)
             }
         else:
             dummy_video = {}
diff --git a/vllm/model_executor/models/keye.py b/vllm/model_executor/models/keye.py
index 90de0582b94a..20f705cca8e6 100644
--- a/vllm/model_executor/models/keye.py
+++ b/vllm/model_executor/models/keye.py
@@ -20,6 +20,7 @@
 from vllm.attention.backends.registry import _Backend
 from vllm.attention.layer import check_upstream_fa_availability
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.logger import init_logger
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
@@ -1170,6 +1171,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -1179,12 +1181,16 @@ def get_dummy_mm_data(
         target_num_frames = self.info.get_num_frames_with_most_features(
             seq_len)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+        video_overrides = mm_options.get("video") if mm_options else None
+
         mm_data = {
             "image":
             self._get_dummy_images(
                 width=target_width,
                 height=target_height,
                 num_images=num_images,
+                overrides=image_overrides,
             ),
             "video":
             self._get_dummy_videos(
@@ -1192,6 +1198,7 @@ def get_dummy_mm_data(
                 height=target_height,
                 num_frames=target_num_frames,
                 num_videos=num_videos,
+                overrides=video_overrides,
             ),
         }
 
diff --git a/vllm/model_executor/models/kimi_vl.py b/vllm/model_executor/models/kimi_vl.py
index 30ec9029f74f..a47bdd2f5ab5 100644
--- a/vllm/model_executor/models/kimi_vl.py
+++ b/vllm/model_executor/models/kimi_vl.py
@@ -54,6 +54,7 @@
 from transformers.activations import GELUActivation
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_pp_group
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.linear import ReplicatedLinear
@@ -212,14 +213,18 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=MaxImageTokenMeta.width,
                                    height=MaxImageTokenMeta.height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/llava.py b/vllm/model_executor/models/llava.py
index 9f338f2ae3fb..725468ddef86 100644
--- a/vllm/model_executor/models/llava.py
+++ b/vllm/model_executor/models/llava.py
@@ -15,6 +15,7 @@
 from transformers.models.pixtral import PixtralProcessor
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
                                                RowParallelLinear)
@@ -195,17 +196,21 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/llava_next_video.py b/vllm/model_executor/models/llava_next_video.py
index 697b8e819707..7aabef32b4a9 100644
--- a/vllm/model_executor/models/llava_next_video.py
+++ b/vllm/model_executor/models/llava_next_video.py
@@ -11,6 +11,7 @@
                           LlavaNextVideoProcessor)
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.models.clip import CLIPVisionModel
 from vllm.multimodal import MULTIMODAL_REGISTRY
@@ -150,6 +151,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_videos = mm_counts.get("video", 0)
 
@@ -158,6 +160,8 @@ def get_dummy_mm_data(
         target_num_frames = \
             self.info.get_num_frames_with_most_features(seq_len, mm_counts)
 
+        video_overrides = mm_options.get("video") if mm_options else None
+
         return {
             "video":
             self._get_dummy_videos(
@@ -165,6 +169,7 @@ def get_dummy_mm_data(
                 height=target_height,
                 num_frames=target_num_frames,
                 num_videos=num_videos,
+                overrides=video_overrides,
             )
         }
 
diff --git a/vllm/model_executor/models/llava_onevision.py b/vllm/model_executor/models/llava_onevision.py
index 924f8ba3585f..4379f24da1bf 100644
--- a/vllm/model_executor/models/llava_onevision.py
+++ b/vllm/model_executor/models/llava_onevision.py
@@ -13,6 +13,7 @@
     get_anyres_image_grid_shape, unpad_image)
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
@@ -254,6 +255,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -264,17 +266,22 @@ def get_dummy_mm_data(
             self.info.get_num_frames_with_most_features(seq_len,
                                                         mm_counts)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+        video_overrides = mm_options.get("video") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
             "video":
             self._get_dummy_videos(
                 width=target_width,
                 height=target_height,
                 num_frames=target_num_frames,
                 num_videos=num_videos,
+                overrides=video_overrides,
             )
         }
 
diff --git a/vllm/model_executor/models/midashenglm.py b/vllm/model_executor/models/midashenglm.py
index 33bd64df5b53..65b3ee1c0e18 100644
--- a/vllm/model_executor/models/midashenglm.py
+++ b/vllm/model_executor/models/midashenglm.py
@@ -36,6 +36,7 @@
 from transformers import BatchFeature
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
@@ -539,13 +540,17 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_audios = mm_counts.get("audio", 0)
 
+        audio_overrides = mm_options.get("audio") if mm_options else None
+
         return {
             "audio":
             self._get_dummy_audios(length=self.info.get_max_audio_len(),
-                                   num_audios=num_audios)
+                                   num_audios=num_audios,
+                                   overrides=audio_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/minicpmo.py b/vllm/model_executor/models/minicpmo.py
index e5333fb652b1..74b2a2e62cd5 100644
--- a/vllm/model_executor/models/minicpmo.py
+++ b/vllm/model_executor/models/minicpmo.py
@@ -36,6 +36,7 @@
                                                           WhisperEncoder)
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.multimodal import MULTIMODAL_REGISTRY, MultiModalKwargsItems
 from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
                                     NestedTensors)
@@ -237,18 +238,23 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_audios = mm_counts.get("audio", 0)
         audio_len = self.info.get_max_audio_chunks_with_most_features() * \
             self.info.get_default_audio_sampling_rate()
 
+        audio_overrides = mm_options.get("audio") if mm_options else None
+
         audio_mm_data = {
             "audio":
-            self._get_dummy_audios(length=audio_len, num_audios=num_audios)
+            self._get_dummy_audios(length=audio_len,
+                                   num_audios=num_audios,
+                                   overrides=audio_overrides)
         }
 
         return {
-            **super().get_dummy_mm_data(seq_len, mm_counts),
+            **super().get_dummy_mm_data(seq_len, mm_counts, mm_options),
             **audio_mm_data,
         }
 
diff --git a/vllm/model_executor/models/minicpmv.py b/vllm/model_executor/models/minicpmv.py
index eaa3839af37b..8bef1ec514ab 100644
--- a/vllm/model_executor/models/minicpmv.py
+++ b/vllm/model_executor/models/minicpmv.py
@@ -39,6 +39,7 @@
 from typing_extensions import TypeVar
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.awq import AWQConfig
 from vllm.model_executor.layers.quantization.awq_marlin import AWQMarlinConfig
@@ -679,6 +680,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -690,15 +692,20 @@ def get_dummy_mm_data(
         num_video_frames = \
             self.info.get_num_frames_with_most_features(seq_len, mm_counts)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+        video_overrides = mm_options.get("video") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=image_width,
                                    height=image_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
             "video": [
                 self._get_dummy_images(width=video_width,
                                        height=video_height,
-                                       num_images=num_video_frames)
+                                       num_images=num_video_frames,
+                                       overrides=video_overrides)
             ] * num_videos,
         }
 
diff --git a/vllm/model_executor/models/mistral3.py b/vllm/model_executor/models/mistral3.py
index e932f7f007f5..d7c48758cca7 100644
--- a/vllm/model_executor/models/mistral3.py
+++ b/vllm/model_executor/models/mistral3.py
@@ -13,6 +13,7 @@
 from transformers.models.pixtral import PixtralProcessor
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
@@ -208,17 +209,21 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/mllama4.py b/vllm/model_executor/models/mllama4.py
index db5a9fbc6a33..9864ca2dc474 100644
--- a/vllm/model_executor/models/mllama4.py
+++ b/vllm/model_executor/models/mllama4.py
@@ -31,6 +31,7 @@
 
 from vllm.attention.layer import MultiHeadAttention
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
                                                QKVParallelLinear,
@@ -689,17 +690,21 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
         (target_width,
          target_height) = self.info.get_image_size_with_most_features()
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/molmo.py b/vllm/model_executor/models/molmo.py
index 0227a83a1f55..a77a2eb0f5a8 100644
--- a/vllm/model_executor/models/molmo.py
+++ b/vllm/model_executor/models/molmo.py
@@ -22,6 +22,7 @@
 from vllm.attention.layer import MultiHeadAttention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import (get_pp_group, get_tensor_model_parallel_rank,
                               get_tensor_model_parallel_world_size,
                               split_tensor_along_last_dim,
@@ -1226,16 +1227,20 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
         num_images = mm_counts.get("image", 0)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index f28b149151b5..6f1c9f513f08 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -21,6 +21,7 @@
 from transformers import BatchFeature, PretrainedConfig, TensorType
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import ReLUSquaredActivation
 from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
@@ -891,6 +892,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         # Use default max_num_tiles for dummy data generation
         max_num_tiles = 12
@@ -898,11 +900,14 @@ def get_dummy_mm_data(
             self.info.get_image_size_with_most_features(max_num_tiles))
         num_images = mm_counts.get("image", 0)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
@@ -919,21 +924,25 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         dummy_image = super().get_dummy_mm_data(seq_len=seq_len,
-                                                mm_counts=mm_counts)
+                                                mm_counts=mm_counts,
+                                                mm_options=mm_options)
         if self.info.supports_video:
             config = self.info.get_hf_config()
             image_size: int = config.force_image_size
             target_num_frames = \
                 self.info.get_num_frames_with_most_features(seq_len, mm_counts)
             num_videos = mm_counts.get("video", 0)
+            video_overrides = mm_options.get("video") if mm_options else None
             dummy_video = {
                 "video":
                 self._get_dummy_videos(width=image_size,
                                        height=image_size,
                                        num_frames=target_num_frames,
-                                       num_videos=num_videos)
+                                       num_videos=num_videos,
+                                       overrides=video_overrides)
             }
         else:
             dummy_video = {}
diff --git a/vllm/model_executor/models/nvlm_d.py b/vllm/model_executor/models/nvlm_d.py
index 0f993b0dc62f..03b77823e969 100644
--- a/vllm/model_executor/models/nvlm_d.py
+++ b/vllm/model_executor/models/nvlm_d.py
@@ -14,6 +14,7 @@
 import torch.nn as nn
 from transformers import PretrainedConfig
 
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import MultiModalDataDict, MultiModalKwargsItems
@@ -86,16 +87,20 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
         num_images = mm_counts.get("image", 0)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/ovis.py b/vllm/model_executor/models/ovis.py
index 2e8e4a44102f..f8674b4f0e3f 100644
--- a/vllm/model_executor/models/ovis.py
+++ b/vllm/model_executor/models/ovis.py
@@ -28,6 +28,7 @@
 from transformers import BatchFeature, PretrainedConfig
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.linear import ReplicatedLinear
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.models.aimv2 import AIMv2Model
@@ -283,17 +284,21 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         mm_data = {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
         }
         return mm_data
 
diff --git a/vllm/model_executor/models/ovis2_5.py b/vllm/model_executor/models/ovis2_5.py
index 9c8adb617310..18dea14379a6 100644
--- a/vllm/model_executor/models/ovis2_5.py
+++ b/vllm/model_executor/models/ovis2_5.py
@@ -10,6 +10,7 @@
 from transformers import BaseImageProcessor, BatchFeature, PretrainedConfig
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.linear import ReplicatedLinear
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.models.ovis import (OvisImagePatchInputs,
@@ -290,6 +291,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -298,17 +300,23 @@ def get_dummy_mm_data(
             self.info.get_image_size_with_most_features()
         target_num_frames = \
             self.info.get_num_frames_with_most_features(seq_len, mm_counts)
+
+        image_overrides = mm_options.get("image") if mm_options else None
+        video_overrides = mm_options.get("video") if mm_options else None
+
         mm_data = {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
             "video":
             self._get_dummy_videos(
                 width=target_width,
                 height=target_height,
                 num_frames=target_num_frames,
                 num_videos=num_videos,
+                overrides=video_overrides,
             )
         }
         return mm_data
diff --git a/vllm/model_executor/models/paligemma.py b/vllm/model_executor/models/paligemma.py
index d7108a5e5feb..ff6b8e4b9b4f 100644
--- a/vllm/model_executor/models/paligemma.py
+++ b/vllm/model_executor/models/paligemma.py
@@ -8,6 +8,7 @@
 from transformers import BatchFeature, PaliGemmaConfig
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.logger import init_logger
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
@@ -106,6 +107,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         hf_config = self.info.get_hf_config()
         vision_config = hf_config.vision_config
@@ -113,11 +115,14 @@ def get_dummy_mm_data(
 
         num_images = mm_counts.get("image", 0)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=max_image_size,
                                    height=max_image_size,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/phi3v.py b/vllm/model_executor/models/phi3v.py
index a6baeaa526e7..f5720e726c48 100644
--- a/vllm/model_executor/models/phi3v.py
+++ b/vllm/model_executor/models/phi3v.py
@@ -25,6 +25,7 @@
                           ProcessorMixin)
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
@@ -356,17 +357,21 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/phi4_multimodal.py b/vllm/model_executor/models/phi4_multimodal.py
index a4f9f96cb951..a5cc87d327b5 100644
--- a/vllm/model_executor/models/phi4_multimodal.py
+++ b/vllm/model_executor/models/phi4_multimodal.py
@@ -17,6 +17,7 @@
     Phi4MultimodalAudioRelativeAttentionBias, adaptive_enc_mask, unfold_tensor)
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import (divide, get_tensor_model_parallel_rank,
                               get_tensor_model_parallel_world_size)
 from vllm.model_executor.layers.activation import MulAndSilu, get_act_fn
@@ -980,6 +981,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_audios = mm_counts.get("audio", 0)
         num_images = mm_counts.get("image", 0)
@@ -987,14 +989,19 @@ def get_dummy_mm_data(
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
 
+        image_overrides = mm_options.get("image") if mm_options else None
+        audio_overrides = mm_options.get("audio") if mm_options else None
+
         mm_data = {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
             "audio":
             self._get_dummy_audios(length=_AUDIO_MAX_SOUNDFILE_SIZE,
-                                   num_audios=num_audios),
+                                   num_audios=num_audios,
+                                   overrides=audio_overrides),
         }
 
         return mm_data
diff --git a/vllm/model_executor/models/phi4mm.py b/vllm/model_executor/models/phi4mm.py
index 8ccc7129ddb2..e3529dc393cf 100644
--- a/vllm/model_executor/models/phi4mm.py
+++ b/vllm/model_executor/models/phi4mm.py
@@ -11,6 +11,7 @@
                           SequenceFeatureExtractor, SiglipVisionConfig)
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_pp_group
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
@@ -749,6 +750,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_audios = mm_counts.get("audio", 0)
         num_images = mm_counts.get("image", 0)
@@ -756,14 +758,19 @@ def get_dummy_mm_data(
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
 
+        image_overrides = mm_options.get("image") if mm_options else None
+        audio_overrides = mm_options.get("audio") if mm_options else None
+
         mm_data = {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
             "audio":
             self._get_dummy_audios(length=_AUDIO_MAX_SOUNDFILE_SIZE,
-                                   num_audios=num_audios),
+                                   num_audios=num_audios,
+                                   overrides=audio_overrides),
         }
 
         return mm_data
diff --git a/vllm/model_executor/models/pixtral.py b/vllm/model_executor/models/pixtral.py
index bf451c5005b7..1c6e3a31d985 100644
--- a/vllm/model_executor/models/pixtral.py
+++ b/vllm/model_executor/models/pixtral.py
@@ -24,6 +24,7 @@
 from transformers.tokenization_utils_base import TextInput
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import divide, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_and_mul_fn
 from vllm.model_executor.layers.layernorm import RMSNorm
@@ -228,28 +229,33 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
     def get_dummy_processor_inputs(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> ProcessorInputs:
         tokenizer = self.info.get_tokenizer()
 
         dummy_text = self.get_dummy_text(mm_counts)
-        dummy_mm_data = self.get_dummy_mm_data(seq_len, mm_counts)
+        dummy_mm_data = self.get_dummy_mm_data(seq_len, mm_counts, mm_options)
         dummy_images = dummy_mm_data.get("image", [])
         tokenization_kwargs = {"truncation": False}
 
diff --git a/vllm/model_executor/models/qwen2_5_omni_thinker.py b/vllm/model_executor/models/qwen2_5_omni_thinker.py
index af0a97e3c867..b5c2aee7f231 100644
--- a/vllm/model_executor/models/qwen2_5_omni_thinker.py
+++ b/vllm/model_executor/models/qwen2_5_omni_thinker.py
@@ -39,6 +39,7 @@
 from transformers.models.whisper import WhisperFeatureExtractor
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.logger import init_logger
 from vllm.model_executor.layers.rotary_embedding import MRotaryEmbedding
 from vllm.model_executor.models.module_mapping import MultiModelKeys
@@ -212,6 +213,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_audios = mm_counts.get("audio", 0)
         num_images = mm_counts.get("image", 0)
@@ -228,19 +230,26 @@ def get_dummy_mm_data(
         target_num_frames = \
             self.info.get_num_frames_with_most_features(seq_len, mm_counts)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+        video_overrides = mm_options.get("video") if mm_options else None
+        audio_overrides = mm_options.get("audio") if mm_options else None
+
         mm_data = {
             "audio":
             self._get_dummy_audios(length=target_audio_length,
-                                   num_audios=num_audios),
+                                   num_audios=num_audios,
+                                   overrides=audio_overrides),
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
             "video":
             self._get_dummy_videos(width=target_width,
                                    height=target_height,
                                    num_frames=target_num_frames,
-                                   num_videos=num_videos),
+                                   num_videos=num_videos,
+                                   overrides=video_overrides),
         }
 
         return mm_data
diff --git a/vllm/model_executor/models/qwen2_audio.py b/vllm/model_executor/models/qwen2_audio.py
index f9136863b8d6..f407692e1151 100644
--- a/vllm/model_executor/models/qwen2_audio.py
+++ b/vllm/model_executor/models/qwen2_audio.py
@@ -34,6 +34,7 @@
 from transformers.models.whisper import WhisperFeatureExtractor
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import (AudioItem, ModalityData,
                                     MultiModalDataDict, MultiModalFieldConfig,
@@ -144,6 +145,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         feature_extractor = self.info.get_feature_extractor()
 
@@ -151,9 +153,13 @@ def get_dummy_mm_data(
         audio_len = feature_extractor.chunk_length * sampling_rate
         num_audios = mm_counts.get("audio", 0)
 
+        audio_overrides = mm_options.get("audio") if mm_options else None
+
         return {
             "audio":
-            self._get_dummy_audios(length=audio_len, num_audios=num_audios)
+            self._get_dummy_audios(length=audio_len,
+                                   num_audios=num_audios,
+                                   overrides=audio_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/qwen2_vl.py b/vllm/model_executor/models/qwen2_vl.py
index 48dec351bd90..6f15a7f4ef38 100644
--- a/vllm/model_executor/models/qwen2_vl.py
+++ b/vllm/model_executor/models/qwen2_vl.py
@@ -45,6 +45,7 @@
 from vllm.attention.layer import (check_upstream_fa_availability,
                                   maybe_get_vit_flash_attn_backend)
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import parallel_state, tensor_model_parallel_all_gather
 from vllm.distributed import utils as dist_utils
 from vllm.logger import init_logger
@@ -1034,6 +1035,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -1043,17 +1045,22 @@ def get_dummy_mm_data(
         target_num_frames = \
             self.info.get_num_frames_with_most_features(seq_len, mm_counts)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+        video_overrides = mm_options.get("video") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
             "video":
             self._get_dummy_videos(
                 width=target_width,
                 height=target_height,
                 num_frames=target_num_frames,
                 num_videos=num_videos,
+                overrides=video_overrides,
             )
         }
 
diff --git a/vllm/model_executor/models/qwen3_vl.py b/vllm/model_executor/models/qwen3_vl.py
index da6ca7940700..517e2c54096e 100644
--- a/vllm/model_executor/models/qwen3_vl.py
+++ b/vllm/model_executor/models/qwen3_vl.py
@@ -47,6 +47,7 @@
 from vllm.attention.layer import check_upstream_fa_availability
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_pp_group
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import _ACTIVATION_REGISTRY
@@ -736,6 +737,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -750,17 +752,23 @@ def get_dummy_mm_data(
             num_frames=target_num_frames,
             image_processor=self.info.get_video_processor(),
         )
+
+        image_overrides = mm_options.get("image") if mm_options else None
+        video_overrides = mm_options.get("video") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
             "video":
             self._get_dummy_videos(
                 width=target_video_size.width,
                 height=target_video_size.height,
                 num_frames=target_num_frames,
                 num_videos=num_videos,
+                overrides=video_overrides,
             ),
         }
 
diff --git a/vllm/model_executor/models/qwen_vl.py b/vllm/model_executor/models/qwen_vl.py
index 924119ed63ab..a94e1e700c67 100644
--- a/vllm/model_executor/models/qwen_vl.py
+++ b/vllm/model_executor/models/qwen_vl.py
@@ -24,6 +24,7 @@
 from transformers.tokenization_utils_base import TextInput
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
                                                ReplicatedLinear,
@@ -567,6 +568,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         hf_config = self.info.get_hf_config()
         vision_config = hf_config.visual
@@ -574,11 +576,14 @@ def get_dummy_mm_data(
         target_width = target_height = vision_config["image_size"]
         num_images = mm_counts.get("image", 0)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/rvl.py b/vllm/model_executor/models/rvl.py
index efdb01004663..594d018f6bb6 100644
--- a/vllm/model_executor/models/rvl.py
+++ b/vllm/model_executor/models/rvl.py
@@ -2,12 +2,14 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 from collections.abc import Mapping
+from typing import Optional
 
 import torch
 import torch.nn as nn
 from transformers.activations import GELUActivation
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import MultiModalDataDict
 
@@ -38,17 +40,21 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
         target_width, target_height = (
             self.info.get_image_size_with_most_features())
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
         }
 
 
diff --git a/vllm/model_executor/models/skyworkr1v.py b/vllm/model_executor/models/skyworkr1v.py
index 8556c3847041..af99e4953b1a 100644
--- a/vllm/model_executor/models/skyworkr1v.py
+++ b/vllm/model_executor/models/skyworkr1v.py
@@ -17,6 +17,7 @@
 from transformers import BatchFeature, PretrainedConfig, TensorType
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.linear import ReplicatedLinear
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.awq import AWQConfig
@@ -505,16 +506,20 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
         num_images = mm_counts.get("image", 0)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/step3_vl.py b/vllm/model_executor/models/step3_vl.py
index ad295ef44732..da507e0d9732 100644
--- a/vllm/model_executor/models/step3_vl.py
+++ b/vllm/model_executor/models/step3_vl.py
@@ -17,6 +17,7 @@
 
 from vllm.attention.layer import MultiHeadAttention
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
@@ -496,16 +497,20 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         target_width, target_height = \
             self.info.get_image_size_with_most_features()
         num_images = mm_counts.get("image", 0)
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images)
+                                   num_images=num_images,
+                                   overrides=image_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/terratorch.py b/vllm/model_executor/models/terratorch.py
index 5082054596d8..cc71adbebd33 100644
--- a/vllm/model_executor/models/terratorch.py
+++ b/vllm/model_executor/models/terratorch.py
@@ -28,6 +28,8 @@
 from transformers import BatchFeature
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
+from vllm.logger import init_logger
 from vllm.model_executor.layers.pooler import DispatchPooler, Pooler
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.utils import AutoWeightsLoader
@@ -48,6 +50,8 @@
                          SupportsMultiModal)
 from .interfaces_base import default_pooling_type
 
+logger = init_logger(__name__)
+
 
 def _terratorch_field_names(pretrained_cfg: dict):
     input_definition = InputDefinition(**pretrained_cfg["input"])
@@ -97,9 +101,16 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         # Dummy data is generated based on the 'input' section
         # defined in the HF configuration file
+
+        if mm_options:
+            logger.warning("Configurable multimodal profiling "
+                           "options are not supported for Terratorch. "
+                           "They are ignored for now.")
+
         return self.dummy_data_generator.get_dummy_mm_data()
 
 
diff --git a/vllm/model_executor/models/transformers.py b/vllm/model_executor/models/transformers.py
index fffdbd00babb..99114a39295a 100644
--- a/vllm/model_executor/models/transformers.py
+++ b/vllm/model_executor/models/transformers.py
@@ -33,6 +33,7 @@
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import (CacheConfig, DeviceConfig, ModelConfig,
                          ParallelConfig, VllmConfig)
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.config.utils import getattr_iter
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.distributed.utils import get_pp_indices
@@ -285,16 +286,20 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
         target_width, target_height = self.info.get_max_image_size()
 
+        image_overrides = mm_options.get("image") if mm_options else None
+
         return {
             "image":
             self._get_dummy_images(width=target_width,
                                    height=target_height,
-                                   num_images=num_images),
+                                   num_images=num_images,
+                                   overrides=image_overrides),
         }
 
 
diff --git a/vllm/model_executor/models/ultravox.py b/vllm/model_executor/models/ultravox.py
index 70aabf6dfe78..7744a19946a2 100644
--- a/vllm/model_executor/models/ultravox.py
+++ b/vllm/model_executor/models/ultravox.py
@@ -14,6 +14,7 @@
 from transformers.models.whisper.modeling_whisper import WhisperEncoder
 
 from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import MulAndSilu, get_act_fn
 from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.model_loader import DefaultModelLoader
@@ -114,6 +115,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         feature_extractor = self.info.get_feature_extractor()
 
@@ -122,9 +124,13 @@ def get_dummy_mm_data(
                      _MAX_ENCODER_BATCH_SIZE)
         num_audios = mm_counts.get("audio", 0)
 
+        audio_overrides = mm_options.get("audio") if mm_options else None
+
         return {
             "audio":
-            self._get_dummy_audios(length=audio_len, num_audios=num_audios)
+            self._get_dummy_audios(length=audio_len,
+                                   num_audios=num_audios,
+                                   overrides=audio_overrides)
         }
 
 
diff --git a/vllm/model_executor/models/voxtral.py b/vllm/model_executor/models/voxtral.py
index 1edeaeb0f319..ad494a7a7ec9 100644
--- a/vllm/model_executor/models/voxtral.py
+++ b/vllm/model_executor/models/voxtral.py
@@ -21,6 +21,7 @@
 from transformers.tokenization_utils_base import TextInput
 
 from vllm.config import ModelConfig, SpeechToTextConfig, VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.inputs.data import PromptType
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization import QuantizationConfig
@@ -204,25 +205,31 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_audios = mm_counts.get("audio", 0)
 
         target_length = self.info.get_max_audio_array_len()
 
+        audio_overrides = mm_options.get("audio") if mm_options else None
+
         return {
             "audio":
-            self._get_dummy_audios(length=target_length, num_audios=num_audios)
+            self._get_dummy_audios(length=target_length,
+                                   num_audios=num_audios,
+                                   overrides=audio_overrides)
         }
 
     def get_dummy_processor_inputs(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> ProcessorInputs:
         tokenizer = self.info.get_tokenizer()
 
         dummy_text = self.get_dummy_text(mm_counts)
-        dummy_mm_data = self.get_dummy_mm_data(seq_len, mm_counts)
+        dummy_mm_data = self.get_dummy_mm_data(seq_len, mm_counts, mm_options)
         dummy_audios = dummy_mm_data.get("audio", [])
 
         audio_chunks: list[AudioChunk] = []
diff --git a/vllm/model_executor/models/whisper.py b/vllm/model_executor/models/whisper.py
index 1eecac7ed76b..d349d91dfd76 100644
--- a/vllm/model_executor/models/whisper.py
+++ b/vllm/model_executor/models/whisper.py
@@ -18,6 +18,7 @@
 from vllm.attention.layers.cross_attention import CrossAttention
 from vllm.config import (CacheConfig, ModelConfig, SpeechToTextConfig,
                          VllmConfig)
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.inputs.data import PromptType
 from vllm.logger import init_logger
@@ -691,6 +692,7 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         feature_extractor = self.info.get_feature_extractor()
 
@@ -698,9 +700,13 @@ def get_dummy_mm_data(
         audio_len = feature_extractor.chunk_length * sampling_rate
         num_audios = mm_counts.get("audio", 0)
 
+        audio_overrides = mm_options.get("audio") if mm_options else None
+
         return {
             "audio":
-            self._get_dummy_audios(length=audio_len, num_audios=num_audios)
+            self._get_dummy_audios(length=audio_len,
+                                   num_audios=num_audios,
+                                   overrides=audio_overrides)
         }
 
 
diff --git a/vllm/multimodal/profiling.py b/vllm/multimodal/profiling.py
index 26c5d188964c..74dc2314d2eb 100644
--- a/vllm/multimodal/profiling.py
+++ b/vllm/multimodal/profiling.py
@@ -10,6 +10,8 @@
 from PIL import Image
 
 import vllm.envs as envs
+from vllm.config.multimodal import (AudioDummyOptions, BaseDummyOptions,
+                                    ImageDummyOptions, VideoDummyOptions)
 from vllm.logger import init_logger
 
 from .inputs import (MultiModalDataDict, MultiModalEncDecInputs,
@@ -73,10 +75,19 @@ def get_dummy_mm_data(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         """
         Build the multimodal input which, after processing, results in
         the maximum possible number of placeholder tokens.
+
+        Args:
+            seq_len: Sequence length
+            mm_counts: Count of items per modality
+            mm_options: Configurable options per modality (optional).
+                       If None, use model defaults for backward compatibility.
+                       If provided, models can use these to customize dummy 
+                       data generation.
         """
         raise NotImplementedError
 
@@ -84,13 +95,22 @@ def get_dummy_processor_inputs(
         self,
         seq_len: int,
         mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> ProcessorInputs:
         """
         Build the input which, after processing, results in
         the maximum possible number of placeholder tokens.
+
+        Args:
+            seq_len: Sequence length
+            mm_counts: Count of items per modality
+            mm_options: Configurable options per modality (optional)
         """
         dummy_text = self.get_dummy_text(mm_counts)
-        dummy_mm_data = self.get_dummy_mm_data(seq_len, mm_counts)
+
+        # Use the unified function for both legacy and configurable cases
+        dummy_mm_data = self.get_dummy_mm_data(seq_len, mm_counts, mm_options)
+
         tokenization_kwargs = {"truncation": False}
 
         return ProcessorInputs(prompt=dummy_text,
@@ -102,9 +122,17 @@ def _get_dummy_audios(
         *,
         length: int,
         num_audios: int,
+        overrides: Optional[AudioDummyOptions] = None,
     ) -> list[npt.NDArray]:
         if num_audios == 0:
             return []
+        if overrides and overrides.length:
+            if overrides.length > length:
+                logger.warning(
+                    "audio.length override (%d) exceeds model's "
+                    "maximum length (%d), will be ignored", overrides.length,
+                    length)
+            length = min(length, overrides.length)
         audio = np.zeros((length, ))
         return [audio] * num_audios
 
@@ -114,9 +142,25 @@ def _get_dummy_images(
         width: int,
         height: int,
         num_images: int,
+        overrides: Optional[ImageDummyOptions] = None,
     ) -> list[Image.Image]:
         if num_images == 0:
             return []
+        if overrides:
+            if overrides.width:
+                if overrides.width > width:
+                    logger.warning(
+                        "image.width override (%d) exceeds model's "
+                        "maximum width (%d), will be ignored", overrides.width,
+                        width)
+                width = min(width, overrides.width)
+            if overrides.height:
+                if overrides.height > height:
+                    logger.warning(
+                        "image.height override (%d) exceeds model's "
+                        "maximum height (%d), will be ignored",
+                        overrides.height, height)
+                height = min(height, overrides.height)
         image = Image.new("RGB", (width, height), color=255)
         return [image] * num_images
 
@@ -127,9 +171,32 @@ def _get_dummy_videos(
         height: int,
         num_frames: int,
         num_videos: int,
+        overrides: Optional[VideoDummyOptions] = None,
     ) -> list[npt.NDArray]:
         if num_videos == 0:
             return []
+        if overrides:
+            if overrides.num_frames:
+                if overrides.num_frames > num_frames:
+                    logger.warning(
+                        "video.num_frames override (%d) exceeds model's "
+                        "maximum number of frames (%d), will be ignored",
+                        overrides.num_frames, num_frames)
+                num_frames = min(num_frames, overrides.num_frames)
+            if overrides.width:
+                if overrides.width > width:
+                    logger.warning(
+                        "video.width override (%d) exceeds model's "
+                        "maximum width (%d), will be ignored", overrides.width,
+                        width)
+                width = min(width, overrides.width)
+            if overrides.height:
+                if overrides.height > height:
+                    logger.warning(
+                        "video.height override (%d) exceeds model's "
+                        "maximum height (%d), will be ignored",
+                        overrides.height, height)
+                height = min(height, overrides.height)
         video = np.full((num_frames, width, height, 3), 255)
         return [video] * num_videos
 
@@ -162,13 +229,14 @@ def _get_dummy_mm_inputs(
         self,
         seq_len: int,
         mm_counts: Optional[Mapping[str, int]] = None,
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalInputs:
         if mm_counts is None:
             mm_counts = self.get_mm_limits()
 
         factory = self.dummy_inputs
         processor_inputs = factory.get_dummy_processor_inputs(
-            seq_len, mm_counts)
+            seq_len, mm_counts, mm_options)
 
         return self.processor.apply(
             prompt=processor_inputs.prompt,
@@ -195,8 +263,9 @@ def get_encoder_dummy_data(
         self,
         seq_len: int,
         mm_counts: Optional[Mapping[str, int]] = None,
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> DummyEncoderData:
-        mm_inputs = self._get_dummy_mm_inputs(seq_len, mm_counts)
+        mm_inputs = self._get_dummy_mm_inputs(seq_len, mm_counts, mm_options)
         mm_inputs = cast(MultiModalEncDecInputs, mm_inputs)
 
         # For encoder-decoder models, use encoder prompt token ids instead of
@@ -228,8 +297,9 @@ def get_decoder_dummy_data(
         self,
         seq_len: int,
         mm_counts: Optional[Mapping[str, int]] = None,
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> DummyDecoderData:
-        mm_inputs = self._get_dummy_mm_inputs(seq_len, mm_counts)
+        mm_inputs = self._get_dummy_mm_inputs(seq_len, mm_counts, mm_options)
 
         prompt_token_ids = mm_inputs["prompt_token_ids"]
         total_len = len(prompt_token_ids)
@@ -274,7 +344,7 @@ def get_mm_max_contiguous_tokens(
 
         `<im_start> [IMG] [IMG] [IMG] <row_break> [IMG] [IMG] [IMG] <im_end>`
         Returns 9, even when the number of image embeddings is 6.
-        
+
         This is important to take into account when profiling and
         initializing the encoder cache size.
         """
diff --git a/vllm/multimodal/registry.py b/vllm/multimodal/registry.py
index 2bbc0078ad13..24d3baa9b4e7 100644
--- a/vllm/multimodal/registry.py
+++ b/vllm/multimodal/registry.py
@@ -6,6 +6,7 @@
 
 import torch.nn as nn
 
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import (AnyTokenizer,
                                                cached_tokenizer_from_config)
@@ -52,7 +53,7 @@ def __call__(self, info: _I) -> BaseDummyInputsBuilder[_I]:
         ...
 
 
-class MultiModalProcessorFactory(Protocol[_I]):
+class MultiModalProcessorFactory(Protocol[_I]):  # type: ignore[misc]
     """
     Constructs a
     [`BaseMultiModalProcessor`][vllm.multimodal.processing.BaseMultiModalProcessor]
@@ -95,6 +96,28 @@ def __init__(self) -> None:
         self._processor_factories = ClassRegistry[nn.Module,
                                                   _ProcessorFactories]()
 
+    def _extract_mm_options(
+        self,
+        model_config: "ModelConfig",
+    ) -> Optional[Mapping[str, BaseDummyOptions]]:
+        """
+        Extract multimodal dummy options from model config.
+
+        Returns None if no configurable options are found, otherwise returns
+        a mapping of modality names to their dummy options.
+        """
+        if not model_config.multimodal_config:
+            return None
+
+        mm_options = {
+            m: opt
+            for m in model_config.multimodal_config.limit_per_prompt
+            if (opt := model_config.multimodal_config.get_dummy_options(m)
+                ) is not None
+        }
+
+        return mm_options if len(mm_options) > 0 else None
+
     def supports_multimodal_inputs(self, model_config: "ModelConfig") -> bool:
         """
         Checks if the model supports multimodal inputs.
@@ -135,7 +158,7 @@ def get_max_tokens_per_item_by_modality(
             return {}
 
         processor = self.create_processor(model_config, cache=cache)
-        profiler = MultiModalProfiler(processor)
+        profiler: MultiModalProfiler = MultiModalProfiler(processor)
 
         seq_len = model_config.max_model_len
         mm_limits = self.get_mm_limits_per_prompt(model_config, cache=cache)
@@ -189,7 +212,7 @@ def get_mm_limits_per_prompt(
             return {}
 
         processor = self.create_processor(model_config, cache=cache)
-        profiler = MultiModalProfiler(processor)
+        profiler: MultiModalProfiler = MultiModalProfiler(processor)
         return profiler.get_mm_limits()
 
     def register_processor(
@@ -285,8 +308,15 @@ def get_decoder_dummy_data(
         The model is identified by ``model_config``.
         """
         processor = self.create_processor(model_config, cache=cache)
-        profiler = MultiModalProfiler(processor)
-        dummy_data = profiler.get_decoder_dummy_data(seq_len, mm_counts)
+        profiler: MultiModalProfiler = MultiModalProfiler(processor)
+
+        # Extract configurable options from multimodal config.
+        # Only include modalities that use advanced option types so legacy
+        # count-only behavior remains unchanged.
+        mm_options = self._extract_mm_options(model_config)
+
+        dummy_data = profiler.get_decoder_dummy_data(seq_len, mm_counts,
+                                                     mm_options)
 
         # Having more tokens is over-conservative but otherwise fine
         token_ids = dummy_data.prompt_token_ids
@@ -311,8 +341,15 @@ def get_encoder_dummy_data(
         The model is identified by ``model_config``.
         """
         processor = self.create_processor(model_config, cache=cache)
-        profiler = MultiModalProfiler(processor)
-        dummy_data = profiler.get_encoder_dummy_data(seq_len, mm_counts)
+        profiler: MultiModalProfiler = MultiModalProfiler(processor)
+
+        # Extract configurable options from multimodal config.
+        # Only include modalities that use advanced option types so legacy
+        # count-only behavior remains unchanged.
+        mm_options = self._extract_mm_options(model_config)
+
+        dummy_data = profiler.get_encoder_dummy_data(seq_len, mm_counts,
+                                                     mm_options)
 
         # Having more tokens is over-conservative but otherwise fine
         token_ids = dummy_data.prompt_token_ids

From d0b6bef3a26ce827395b06756ab09c76a8ca6060 Mon Sep 17 00:00:00 2001
From: Egor <e.a.krivov@gmail.com>
Date: Fri, 3 Oct 2025 13:00:23 +0200
Subject: [PATCH 130/193] [Doc] Fixed shape description for
 fused_batched_moe.py (#25668)

Signed-off-by: Egor <e.a.krivov@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/layers/fused_moe/fused_batched_moe.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/model_executor/layers/fused_moe/fused_batched_moe.py b/vllm/model_executor/layers/fused_moe/fused_batched_moe.py
index 660bae314602..e49750bc92b3 100644
--- a/vllm/model_executor/layers/fused_moe/fused_batched_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_batched_moe.py
@@ -355,7 +355,7 @@ def batched_triton_kernel(
 
 def invoke_moe_batched_triton_kernel(
         A: torch.Tensor,  # [E, max_tokens, K]
-        B: torch.Tensor,  # [E, K, N]
+        B: torch.Tensor,  # [E, N, K]
         C: torch.Tensor,  # [E, max_tokens, N]
         expert_num_tokens: torch.Tensor,  # [E]
         compute_type: tl.dtype,

From 7a9f450b1c466b8c53c6604c6d5a2eaef8b24728 Mon Sep 17 00:00:00 2001
From: Sage Moore <sage@neuralmagic.com>
Date: Fri, 3 Oct 2025 04:28:22 -0700
Subject: [PATCH 131/193] Quick fix for IMA with the Prefix Prefill kernel
 during graph capture (#25983)

Signed-off-by: Sage Moore <sage@neuralmagic.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/v1/attention/backends/rocm_attn.py | 8 ++++++++
 1 file changed, 8 insertions(+)

diff --git a/vllm/v1/attention/backends/rocm_attn.py b/vllm/v1/attention/backends/rocm_attn.py
index 37fc85bf351a..1748a48168d4 100644
--- a/vllm/v1/attention/backends/rocm_attn.py
+++ b/vllm/v1/attention/backends/rocm_attn.py
@@ -83,6 +83,14 @@ def build_for_cudagraph_capture(
         # max_model_len will cause graph capture to be extremely
         # slow, so here we set it to 1.
         attn_metadata.seq_lens.fill_(1)
+
+        if envs.VLLM_V1_USE_PREFILL_DECODE_ATTENTION:
+            # Here we set the query start locs to 0. This is to
+            # cover up an invalid memory access in the prefix_prefil kernel
+            # that we run into during graph capture (#25985)
+            common_attn_metadata.query_start_loc.zero_()
+            common_attn_metadata.query_start_loc_cpu.zero_()
+
         return attn_metadata
 
     def build(self,

From 16414a00eaee860440fc1f2315d9b1661ddf90d4 Mon Sep 17 00:00:00 2001
From: Yang Liu <127183760+KKSK-DON@users.noreply.github.com>
Date: Fri, 3 Oct 2025 04:29:45 -0700
Subject: [PATCH 132/193] [Renderer] Move Processor out of AsyncLLM  (#24138)

Signed-off-by: Yang <lymailforjob@gmail.com>
Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Co-authored-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../entrypoints/openai/test_lora_resolvers.py |   3 +
 tests/entrypoints/openai/test_serving_chat.py |  98 ++++++-----------
 vllm/engine/protocol.py                       |   7 +-
 vllm/entrypoints/openai/serving_chat.py       |  18 ++-
 vllm/entrypoints/openai/serving_completion.py |  44 ++++----
 vllm/entrypoints/openai/serving_engine.py     | 103 ++++++++++++++++--
 vllm/v1/engine/async_llm.py                   |  71 +++++++-----
 7 files changed, 217 insertions(+), 127 deletions(-)

diff --git a/tests/entrypoints/openai/test_lora_resolvers.py b/tests/entrypoints/openai/test_lora_resolvers.py
index 0561158dcf65..45aa2070d0a2 100644
--- a/tests/entrypoints/openai/test_lora_resolvers.py
+++ b/tests/entrypoints/openai/test_lora_resolvers.py
@@ -122,6 +122,9 @@ async def mock_generate(*args, **kwargs):
                                                  models,
                                                  request_logger=None)
 
+    serving_completion._process_inputs = AsyncMock(return_value=(MagicMock(
+        name="engine_request"), {}))
+
     return mock_engine, serving_completion
 
 
diff --git a/tests/entrypoints/openai/test_serving_chat.py b/tests/entrypoints/openai/test_serving_chat.py
index 07f39fe2b9bd..81683854e177 100644
--- a/tests/entrypoints/openai/test_serving_chat.py
+++ b/tests/entrypoints/openai/test_serving_chat.py
@@ -7,7 +7,7 @@
 from contextlib import suppress
 from dataclasses import dataclass, field
 from typing import TYPE_CHECKING, Any, Optional
-from unittest.mock import MagicMock
+from unittest.mock import AsyncMock, MagicMock
 
 import pytest
 import pytest_asyncio
@@ -230,6 +230,7 @@ class MockHFConfig:
 @dataclass
 class MockModelConfig:
     task = "generate"
+    runner_type = "generate"
     tokenizer = MODEL_NAME
     trust_remote_code = False
     tokenizer_mode = "auto"
@@ -244,11 +245,33 @@ class MockModelConfig:
     encoder_config = None
     generation_config: str = "auto"
     media_io_kwargs: dict[str, dict[str, Any]] = field(default_factory=dict)
+    skip_tokenizer_init = False
 
     def get_diff_sampling_param(self):
         return self.diff_sampling_param or {}
 
 
+def _build_serving_chat(engine: AsyncLLM,
+                        model_config: MockModelConfig) -> OpenAIServingChat:
+    models = OpenAIServingModels(engine_client=engine,
+                                 base_model_paths=BASE_MODEL_PATHS,
+                                 model_config=model_config)
+    serving_chat = OpenAIServingChat(engine,
+                                     model_config,
+                                     models,
+                                     response_role="assistant",
+                                     chat_template=CHAT_TEMPLATE,
+                                     chat_template_content_format="auto",
+                                     request_logger=None)
+
+    async def _fake_process_inputs(request_id, engine_prompt, sampling_params,
+                                   *, lora_request, trace_headers, priority):
+        return dict(engine_prompt), {}
+
+    serving_chat._process_inputs = AsyncMock(side_effect=_fake_process_inputs)
+    return serving_chat
+
+
 @dataclass
 class MockEngine:
 
@@ -282,16 +305,7 @@ async def test_serving_chat_returns_correct_model_name():
     mock_engine.get_tokenizer.return_value = get_tokenizer(MODEL_NAME)
     mock_engine.errored = False
 
-    models = OpenAIServingModels(engine_client=mock_engine,
-                                 base_model_paths=BASE_MODEL_PATHS,
-                                 model_config=MockModelConfig())
-    serving_chat = OpenAIServingChat(mock_engine,
-                                     MockModelConfig(),
-                                     models,
-                                     response_role="assistant",
-                                     chat_template=CHAT_TEMPLATE,
-                                     chat_template_content_format="auto",
-                                     request_logger=None)
+    serving_chat = _build_serving_chat(mock_engine, MockModelConfig())
     messages = [{"role": "user", "content": "what is 1+1?"}]
 
     async def return_model_name(*args):
@@ -318,16 +332,7 @@ async def test_serving_chat_should_set_correct_max_tokens():
     mock_engine.get_tokenizer.return_value = get_tokenizer(MODEL_NAME)
     mock_engine.errored = False
 
-    models = OpenAIServingModels(engine_client=mock_engine,
-                                 base_model_paths=BASE_MODEL_PATHS,
-                                 model_config=MockModelConfig())
-    serving_chat = OpenAIServingChat(mock_engine,
-                                     MockModelConfig(),
-                                     models,
-                                     response_role="assistant",
-                                     chat_template=CHAT_TEMPLATE,
-                                     chat_template_content_format="auto",
-                                     request_logger=None)
+    serving_chat = _build_serving_chat(mock_engine, MockModelConfig())
 
     req = ChatCompletionRequest(
         model=MODEL_NAME,
@@ -361,16 +366,7 @@ async def test_serving_chat_should_set_correct_max_tokens():
     mock_engine.errored = False
 
     # Initialize the serving chat
-    models = OpenAIServingModels(engine_client=mock_engine,
-                                 base_model_paths=BASE_MODEL_PATHS,
-                                 model_config=mock_model_config)
-    serving_chat = OpenAIServingChat(mock_engine,
-                                     mock_model_config,
-                                     models,
-                                     response_role="assistant",
-                                     chat_template=CHAT_TEMPLATE,
-                                     chat_template_content_format="auto",
-                                     request_logger=None)
+    serving_chat = _build_serving_chat(mock_engine, mock_model_config)
 
     # Test Case 1: No max_tokens specified in request
     req = ChatCompletionRequest(
@@ -415,16 +411,7 @@ async def test_serving_chat_should_set_correct_max_tokens():
     mock_engine.errored = False
 
     # Initialize the serving chat
-    models = OpenAIServingModels(engine_client=mock_engine,
-                                 base_model_paths=BASE_MODEL_PATHS,
-                                 model_config=mock_model_config)
-    serving_chat = OpenAIServingChat(mock_engine,
-                                     mock_model_config,
-                                     models,
-                                     response_role="assistant",
-                                     chat_template=CHAT_TEMPLATE,
-                                     chat_template_content_format="auto",
-                                     request_logger=None)
+    serving_chat = _build_serving_chat(mock_engine, mock_model_config)
 
     # Test case 1: No max_tokens specified, defaults to context_window
     req = ChatCompletionRequest(
@@ -471,16 +458,7 @@ async def test_serving_chat_could_load_correct_generation_config():
     mock_engine.errored = False
 
     # Initialize the serving chat
-    models = OpenAIServingModels(engine_client=mock_engine,
-                                 base_model_paths=BASE_MODEL_PATHS,
-                                 model_config=mock_model_config)
-    serving_chat = OpenAIServingChat(mock_engine,
-                                     mock_model_config,
-                                     models,
-                                     response_role="assistant",
-                                     chat_template=CHAT_TEMPLATE,
-                                     chat_template_content_format="auto",
-                                     request_logger=None)
+    serving_chat = _build_serving_chat(mock_engine, mock_model_config)
 
     req = ChatCompletionRequest(
         model=MODEL_NAME,
@@ -525,17 +503,7 @@ async def test_serving_chat_did_set_correct_cache_salt(model_type):
     mock_engine.get_tokenizer.return_value = get_tokenizer(MODEL_NAME)
     mock_engine.errored = False
 
-    # Initialize the serving chat
-    models = OpenAIServingModels(engine_client=mock_engine,
-                                 base_model_paths=BASE_MODEL_PATHS,
-                                 model_config=mock_model_config)
-    serving_chat = OpenAIServingChat(mock_engine,
-                                     mock_model_config,
-                                     models,
-                                     response_role="assistant",
-                                     chat_template=CHAT_TEMPLATE,
-                                     chat_template_content_format="auto",
-                                     request_logger=None)
+    serving_chat = _build_serving_chat(mock_engine, mock_model_config)
 
     # Test cache_salt
     req = ChatCompletionRequest(
@@ -549,10 +517,12 @@ async def test_serving_chat_did_set_correct_cache_salt(model_type):
     # By default, cache_salt in the engine prompt is not set
     with suppress(Exception):
         await serving_chat.create_chat_completion(req)
-    assert "cache_salt" not in mock_engine.generate.call_args.args[0]
+    engine_prompt = serving_chat._process_inputs.await_args_list[0].args[1]
+    assert "cache_salt" not in engine_prompt
 
     # Test with certain cache_salt
     req.cache_salt = "test_salt"
     with suppress(Exception):
         await serving_chat.create_chat_completion(req)
-    assert mock_engine.generate.call_args.args[0]["cache_salt"] == "test_salt"
+    engine_prompt = serving_chat._process_inputs.await_args_list[1].args[1]
+    assert engine_prompt.get("cache_salt") == "test_salt"
diff --git a/vllm/engine/protocol.py b/vllm/engine/protocol.py
index 997c99af2408..bc917f2f57f0 100644
--- a/vllm/engine/protocol.py
+++ b/vllm/engine/protocol.py
@@ -19,6 +19,7 @@
 from vllm.tasks import SupportedTask
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 from vllm.utils import Device, collect_from_async_generator, random_uuid
+from vllm.v1.engine import EngineCoreRequest
 
 logger = init_logger(__name__)
 
@@ -49,12 +50,16 @@ def dead_error(self) -> BaseException:
     @abstractmethod
     def generate(
         self,
-        prompt: PromptType,
+        prompt: Union[EngineCoreRequest, PromptType],
         sampling_params: SamplingParams,
         request_id: str,
+        *,
+        prompt_text: Optional[str] = None,
         lora_request: Optional[LoRARequest] = None,
+        tokenization_kwargs: Optional[dict[str, Any]] = None,
         trace_headers: Optional[Mapping[str, str]] = None,
         priority: int = 0,
+        data_parallel_rank: Optional[int] = None,
     ) -> AsyncGenerator[RequestOutput, None]:
         """Generate outputs for a request."""
         ...
diff --git a/vllm/entrypoints/openai/serving_chat.py b/vllm/entrypoints/openai/serving_chat.py
index 2336158ac51b..54eb60a8589d 100644
--- a/vllm/entrypoints/openai/serving_chat.py
+++ b/vllm/entrypoints/openai/serving_chat.py
@@ -274,7 +274,8 @@ async def create_chat_completion(
         generators: list[AsyncGenerator[RequestOutput, None]] = []
         try:
             for i, engine_prompt in enumerate(engine_prompts):
-                sampling_params: Union[SamplingParams, BeamSearchParams]
+                prompt_text, _, _ = (self._get_prompt_components(
+                    request_prompts[i]))
 
                 if self.default_sampling_params is None:
                     self.default_sampling_params = {}
@@ -285,6 +286,7 @@ async def create_chat_completion(
                     input_length=len(engine_prompt["prompt_token_ids"]),
                     default_sampling_params=self.default_sampling_params)
 
+                sampling_params: Union[SamplingParams, BeamSearchParams]
                 if request.use_beam_search:
                     sampling_params = request.to_beam_search_params(
                         max_tokens, self.default_sampling_params)
@@ -309,13 +311,25 @@ async def create_chat_completion(
                         lora_request=lora_request,
                     )
                 else:
+                    engine_request, tokenization_kwargs = (
+                        await self._process_inputs(
+                            request_id,
+                            engine_prompt,
+                            sampling_params,
+                            lora_request=lora_request,
+                            trace_headers=trace_headers,
+                            priority=request.priority,
+                        ))
+
                     generator = self.engine_client.generate(
-                        engine_prompt,
+                        engine_request,
                         sampling_params,
                         request_id,
                         lora_request=lora_request,
                         trace_headers=trace_headers,
                         priority=request.priority,
+                        prompt_text=prompt_text,
+                        tokenization_kwargs=tokenization_kwargs,
                     )
 
                 generators.append(generator)
diff --git a/vllm/entrypoints/openai/serving_completion.py b/vllm/entrypoints/openai/serving_completion.py
index 0c61c48da0bc..d0756e42b796 100644
--- a/vllm/entrypoints/openai/serving_completion.py
+++ b/vllm/entrypoints/openai/serving_completion.py
@@ -9,7 +9,6 @@
 
 import jinja2
 from fastapi import Request
-from typing_extensions import assert_never
 
 from vllm.config import ModelConfig
 from vllm.engine.protocol import EngineClient
@@ -32,8 +31,7 @@
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
 from vllm.entrypoints.renderer import RenderConfig
 from vllm.entrypoints.utils import get_max_tokens
-from vllm.inputs.data import (EmbedsPrompt, TokensPrompt, is_embeds_prompt,
-                              is_tokens_prompt)
+from vllm.inputs.data import EmbedsPrompt, TokensPrompt, is_embeds_prompt
 from vllm.logger import init_logger
 from vllm.logprobs import Logprob
 from vllm.outputs import RequestOutput
@@ -157,23 +155,16 @@ async def create_completion(
         generators: list[AsyncGenerator[RequestOutput, None]] = []
         try:
             for i, engine_prompt in enumerate(engine_prompts):
-                sampling_params: Union[SamplingParams, BeamSearchParams]
-                # Mypy does not infer that engine_prompt will have only one of
-                # "prompt_token_ids" or "prompt_embeds" defined, and both of
-                # these as Union[object, the expected type], where it infers
-                # object if engine_prompt is a subclass of one of the
-                # typeddicts that defines both keys. Worse, because of
-                # https://github.com/python/mypy/issues/8586, mypy does not
-                # infer the type of engine_prompt correctly because of the
-                # enumerate. So we need an unnecessary cast here.
-                engine_prompt = cast(Union[EmbedsPrompt, TokensPrompt],
-                                     engine_prompt)
-                if is_embeds_prompt(engine_prompt):
-                    input_length = len(engine_prompt["prompt_embeds"])
-                elif is_tokens_prompt(engine_prompt):
-                    input_length = len(engine_prompt["prompt_token_ids"])
+                prompt_text, prompt_token_ids, prompt_embeds = (
+                    self._get_prompt_components(engine_prompt))
+
+                input_length = None
+                if prompt_token_ids is not None:
+                    input_length = len(prompt_token_ids)
+                elif prompt_embeds is not None:
+                    input_length = len(prompt_embeds)
                 else:
-                    assert_never(engine_prompt)
+                    raise NotImplementedError
 
                 if self.default_sampling_params is None:
                     self.default_sampling_params = {}
@@ -185,6 +176,7 @@ async def create_completion(
                     default_sampling_params=self.default_sampling_params,
                 )
 
+                sampling_params: Union[SamplingParams, BeamSearchParams]
                 if request.use_beam_search:
                     sampling_params = request.to_beam_search_params(
                         max_tokens, self.default_sampling_params)
@@ -220,13 +212,25 @@ async def create_completion(
                         lora_request=lora_request,
                     )
                 else:
+                    engine_request, tokenization_kwargs = (
+                        await self._process_inputs(
+                            request_id_item,
+                            engine_prompt,
+                            sampling_params,
+                            lora_request=lora_request,
+                            trace_headers=trace_headers,
+                            priority=request.priority,
+                        ))
+
                     generator = self.engine_client.generate(
-                        engine_prompt,
+                        engine_request,
                         sampling_params,
                         request_id_item,
                         lora_request=lora_request,
                         trace_headers=trace_headers,
                         priority=request.priority,
+                        prompt_text=prompt_text,
+                        tokenization_kwargs=tokenization_kwargs,
                     )
 
                 generators.append(generator)
diff --git a/vllm/entrypoints/openai/serving_engine.py b/vllm/entrypoints/openai/serving_engine.py
index 4eb1f8b89d64..dc41723800d0 100644
--- a/vllm/entrypoints/openai/serving_engine.py
+++ b/vllm/entrypoints/openai/serving_engine.py
@@ -7,7 +7,8 @@
 from collections.abc import AsyncGenerator, Iterable, Mapping, Sequence
 from concurrent.futures import ThreadPoolExecutor
 from http import HTTPStatus
-from typing import Any, Callable, ClassVar, Generic, Optional, TypeVar, Union
+from typing import (Any, Callable, ClassVar, Generic, NamedTuple, Optional,
+                    TypeVar, Union)
 
 import torch
 from fastapi import Request
@@ -15,6 +16,11 @@
 from starlette.datastructures import Headers
 from typing_extensions import TypeIs
 
+from vllm.entrypoints.utils import _validate_truncation_size
+from vllm.transformers_utils.tokenizer import init_tokenizer_from_configs
+from vllm.v1.engine import EngineCoreRequest
+from vllm.v1.engine.processor import Processor
+
 if sys.version_info >= (3, 12):
     from typing import TypedDict
 else:
@@ -134,6 +140,12 @@ def is_embeds_prompt(prompt: RequestPrompt) -> TypeIs[EmbedsPrompt]:
             and "prompt_embeds" in prompt)
 
 
+class PromptComponents(NamedTuple):
+    text: Optional[str] = None
+    token_ids: Optional[list[int]] = None
+    embeds: Optional[torch.Tensor] = None
+
+
 RequestT = TypeVar("RequestT", bound=AnyRequest)
 
 
@@ -239,6 +251,16 @@ def __init__(
                                          AsyncMicrobatchTokenizer] = {}
         self.log_error_stack = log_error_stack
 
+    async def _get_processor(self) -> Processor:
+        if not hasattr(self, "_processor"):
+            vllm_config = await self.engine_client.get_vllm_config()
+            if self.model_config.skip_tokenizer_init:
+                tokenizer = None
+            else:
+                tokenizer = init_tokenizer_from_configs(self.model_config)
+            self._processor = Processor(vllm_config, tokenizer)
+        return self._processor
+
     def _get_renderer(self, tokenizer: Optional[AnyTokenizer]) -> BaseRenderer:
         """
         Get a Renderer instance with the provided tokenizer.
@@ -850,6 +872,36 @@ async def _preprocess_chat(
 
         return conversation, [request_prompt], [engine_prompt]
 
+    async def _process_inputs(
+        self,
+        request_id: str,
+        engine_prompt: PromptType,
+        sampling_params: SamplingParams,
+        *,
+        lora_request: Optional[LoRARequest],
+        trace_headers: Optional[Mapping[str, str]],
+        priority: int,
+    ) -> tuple[EngineCoreRequest, dict[str, Any]]:
+        """
+        using the Processor to process inputs for AsyncLLM
+        """
+        tokenization_kwargs: dict[str, Any] = {}
+        _validate_truncation_size(self.max_model_len,
+                                  sampling_params.truncate_prompt_tokens,
+                                  tokenization_kwargs)
+
+        processor = await self._get_processor()
+        engine_request = processor.process_inputs(
+            request_id,
+            engine_prompt,
+            sampling_params,
+            lora_request=lora_request,
+            tokenization_kwargs=tokenization_kwargs,
+            trace_headers=trace_headers,
+            priority=priority,
+        )
+        return engine_request, tokenization_kwargs
+
     async def _generate_with_builtin_tools(
         self,
         request_id: str,
@@ -861,6 +913,7 @@ async def _generate_with_builtin_tools(
         priority: int = 0,
         **kwargs,
     ):
+        prompt_text, _, _ = self._get_prompt_components(request_prompt)
         orig_priority = priority
         while True:
             self._log_inputs(
@@ -869,14 +922,27 @@ async def _generate_with_builtin_tools(
                 params=sampling_params,
                 lora_request=lora_request,
             )
-            generator = self.engine_client.generate(
+            trace_headers = kwargs.get("trace_headers")
+            engine_request, tokenization_kwargs = (await self._process_inputs(
+                request_id,
                 engine_prompt,
                 sampling_params,
+                lora_request=lora_request,
+                trace_headers=trace_headers,
+                priority=priority,
+            ))
+
+            generator = self.engine_client.generate(
+                engine_request,
+                sampling_params,
                 request_id,
                 lora_request=lora_request,
                 priority=priority,
+                prompt_text=prompt_text,
+                tokenization_kwargs=tokenization_kwargs,
                 **kwargs,
             )
+
             async for res in generator:
                 context.append_output(res)
                 # NOTE(woosuk): The stop condition is handled by the engine.
@@ -905,6 +971,28 @@ async def _generate_with_builtin_tools(
             # OPTIMIZATION
             priority = orig_priority - 1
 
+    def _get_prompt_components(
+        self,
+        inputs: Union[RequestPrompt, PromptType],
+    ) -> PromptComponents:
+        if isinstance(inputs, str):
+            return PromptComponents(text=inputs)
+        if isinstance(inputs, list):
+            return PromptComponents(token_ids=inputs)
+        if isinstance(inputs, dict):
+            return PromptComponents(
+                text=inputs.get("prompt"),  # type: ignore[arg-type]
+                token_ids=inputs.get(
+                    "prompt_token_ids"),  # type: ignore[arg-type]
+                embeds=inputs.get("prompt_embeds"),
+            )
+
+        return PromptComponents(
+            text=getattr(inputs, "prompt", None),
+            token_ids=getattr(inputs, "prompt_token_ids", None),
+            embeds=getattr(inputs, "prompt_embeds", None),
+        )
+
     def _log_inputs(
         self,
         request_id: str,
@@ -915,14 +1003,9 @@ def _log_inputs(
     ) -> None:
         if self.request_logger is None:
             return
-        prompt, prompt_token_ids, prompt_embeds = None, None, None
-        if isinstance(inputs, str):
-            prompt = inputs
-        elif isinstance(inputs, list):
-            prompt_token_ids = inputs
-        else:
-            prompt = getattr(inputs, 'prompt', None)
-            prompt_token_ids = getattr(inputs, 'prompt_token_ids', None)
+
+        prompt, prompt_token_ids, prompt_embeds = (
+            self._get_prompt_components(inputs))
 
         self.request_logger.log_inputs(
             request_id,
diff --git a/vllm/v1/engine/async_llm.py b/vllm/v1/engine/async_llm.py
index e88b4c5346c3..ab3a4e5e6fe5 100644
--- a/vllm/v1/engine/async_llm.py
+++ b/vllm/v1/engine/async_llm.py
@@ -261,7 +261,7 @@ async def get_supported_tasks(self) -> tuple[SupportedTask, ...]:
     async def add_request(
         self,
         request_id: str,
-        prompt: PromptType,
+        prompt: Union[EngineCoreRequest, PromptType],
         params: Union[SamplingParams, PoolingParams],
         arrival_time: Optional[float] = None,
         lora_request: Optional[LoRARequest] = None,
@@ -269,6 +269,7 @@ async def add_request(
         trace_headers: Optional[Mapping[str, str]] = None,
         priority: int = 0,
         data_parallel_rank: Optional[int] = None,
+        prompt_text: Optional[str] = None,
     ) -> RequestOutputCollector:
         """Add new request to the AsyncLLM."""
 
@@ -281,13 +282,20 @@ async def add_request(
         queue = RequestOutputCollector(output_kind=params.output_kind)
 
         # Convert Input --> Request.
-        request = self.processor.process_inputs(request_id, prompt, params,
-                                                arrival_time, lora_request,
-                                                tokenization_kwargs,
-                                                trace_headers, priority,
-                                                data_parallel_rank)
-        prompt_text = prompt if isinstance(prompt,
-                                           str) else prompt.get("prompt")
+        if isinstance(prompt, EngineCoreRequest):
+            request = prompt
+        else:
+            assert prompt_text is None
+            logger.warning_once(
+                "Processor has been moved under OpenAIServing and will "
+                "be removed from AsyncLLM in v0.13.")
+            request = self.processor.process_inputs(request_id, prompt, params,
+                                                    arrival_time, lora_request,
+                                                    tokenization_kwargs,
+                                                    trace_headers, priority,
+                                                    data_parallel_rank)
+            prompt_text = (prompt if isinstance(prompt, str) else
+                           prompt.get("prompt"))
 
         if is_pooling or params.n == 1:
             await self._add_request(request, prompt_text, None, 0, queue)
@@ -332,10 +340,13 @@ async def _add_request(self, request: EngineCoreRequest,
     # re-multiplexed in the API server anyhow.
     async def generate(
         self,
-        prompt: PromptType,
+        prompt: Union[EngineCoreRequest, PromptType],
         sampling_params: SamplingParams,
         request_id: str,
+        *,
+        prompt_text: Optional[str] = None,
         lora_request: Optional[LoRARequest] = None,
+        tokenization_kwargs: Optional[dict[str, Any]] = None,
         trace_headers: Optional[Mapping[str, str]] = None,
         priority: int = 0,
         data_parallel_rank: Optional[int] = None,
@@ -368,25 +379,25 @@ async def generate(
             # to handle startup failure gracefully in the OpenAI server.
             self._run_output_handler()
 
-            tokenization_kwargs: dict[str, Any] = {}
-            truncate_prompt_tokens = sampling_params.truncate_prompt_tokens
-
-            _validate_truncation_size(
-                self.model_config.max_model_len,
-                truncate_prompt_tokens,
-                tokenization_kwargs,
-            )
-
-            q = await self.add_request(
-                request_id,
-                prompt,
-                sampling_params,
-                lora_request=lora_request,
-                trace_headers=trace_headers,
-                priority=priority,
-                tokenization_kwargs=tokenization_kwargs,
-                data_parallel_rank=data_parallel_rank,
-            )
+            if tokenization_kwargs is None:
+                tokenization_kwargs = {}
+                truncate_prompt_tokens = sampling_params.truncate_prompt_tokens
+
+                _validate_truncation_size(
+                    self.model_config.max_model_len,
+                    truncate_prompt_tokens,
+                    tokenization_kwargs,
+                )
+
+            q = await self.add_request(request_id,
+                                       prompt,
+                                       sampling_params,
+                                       lora_request=lora_request,
+                                       tokenization_kwargs=tokenization_kwargs,
+                                       trace_headers=trace_headers,
+                                       priority=priority,
+                                       data_parallel_rank=data_parallel_rank,
+                                       prompt_text=prompt_text)
 
             # The output_handler task pushes items into the queue.
             # This task pulls from the queue and yields to caller.
@@ -535,7 +546,7 @@ async def encode(
             self._run_output_handler()
 
             if tokenization_kwargs is None:
-                tokenization_kwargs = dict[str, Any]()
+                tokenization_kwargs = {}
             _validate_truncation_size(
                 self.model_config.max_model_len,
                 truncate_prompt_tokens,
@@ -547,9 +558,9 @@ async def encode(
                 prompt,
                 pooling_params,
                 lora_request=lora_request,
+                tokenization_kwargs=tokenization_kwargs,
                 trace_headers=trace_headers,
                 priority=priority,
-                tokenization_kwargs=tokenization_kwargs,
             )
 
             # The output_handler task pushes items into the queue.

From ec37d88f4582673dd2bb8c943a5c7725beb17450 Mon Sep 17 00:00:00 2001
From: Yannick Schnider <Yannick.Schnider1@ibm.com>
Date: Fri, 3 Oct 2025 14:13:34 +0200
Subject: [PATCH 133/193] [Bugfix] Re-enable prefill of max model length
 (#24446)

Signed-off-by: Yannick Schnider <yannick.schnider1@ibm.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/v1/e2e/test_context_length.py | 91 +++++++++++++++++++++++++++++
 vllm/v1/worker/gpu_model_runner.py  | 30 +++++++---
 2 files changed, 113 insertions(+), 8 deletions(-)
 create mode 100644 tests/v1/e2e/test_context_length.py

diff --git a/tests/v1/e2e/test_context_length.py b/tests/v1/e2e/test_context_length.py
new file mode 100644
index 000000000000..67a6c7be4432
--- /dev/null
+++ b/tests/v1/e2e/test_context_length.py
@@ -0,0 +1,91 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+"""
+end-to-end tests for context length corner cases of vLLM v1 model runner
+versus HuggingFace's transformers.
+
+This test verifies the following behavior: allow a prefill that fills the
+model's maximum context length and then request a single new token.
+
+Test strategy
+- Build a textual prompt that tokenizes to exactly ``max_model_len`` tokens.
+- Run vLLM generation requesting a single new token (max_tokens=1).
+- Run HF generation on the same prompt requesting a single token too.
+- Assert both return the same number of generated tokens and the same ids.
+
+"""
+
+import pytest
+import torch
+from transformers import AutoModelForCausalLM
+
+from tests.models.utils import check_outputs_equal
+from tests.utils import create_new_process_for_each_test
+from vllm import LLM, SamplingParams
+from vllm.inputs import TokensPrompt
+
+
+@create_new_process_for_each_test()
+@pytest.mark.parametrize("model", ["JackFram/llama-160m"])
+@pytest.mark.parametrize("max_model_len", [2048])
+@pytest.mark.parametrize("max_tokens", [1])
+def test_prefill_max_context_length(
+    model: str,
+    max_model_len: int,
+    max_tokens: int,
+) -> None:
+    """Compare vLLM and HuggingFace when the prompt already fills the
+    model's maximum context length and we request a single new token.
+
+    The test ensures vLLM does not raise the "Sampled token IDs exceed the
+    max model length" assertion and that both vLLM and HF produce the same
+    single token when given the same inputs.
+    """
+
+    # Construct a prompt of size max_model_len
+    prompt_ids = [[43] * max_model_len]
+
+    # Generate max_tokens new tokens deterministically.
+    sampling_params = [
+        SamplingParams(max_tokens=max_tokens, temperature=0.0, ignore_eos=True)
+    ]
+
+    # --- vLLM generation ---
+    llm = LLM(
+        model=model,
+        tokenizer=model,
+        max_num_seqs=1,
+        tensor_parallel_size=1,
+    )
+
+    vllm_token_prompts = [TokensPrompt(prompt_token_ids=prompt_ids[0])]
+    vllm_results = llm.generate(vllm_token_prompts, sampling_params)
+
+    vllm_output_ids = vllm_results[0].outputs[0].token_ids
+
+    # --- HuggingFace generation ---
+    with torch.no_grad():
+        hf_model = AutoModelForCausalLM.from_pretrained(model)
+
+        # HF expects a tensor of input ids shaped (batch, seq_len).
+        hf_input_tokens = torch.tensor(prompt_ids[0]).unsqueeze(0)
+
+        # Generate max_tokens new tokens deterministically.
+        hf_generated = hf_model.generate(
+            hf_input_tokens,
+            do_sample=False,
+            min_new_tokens=max_tokens,
+            max_new_tokens=max_tokens,
+        )
+
+        # HF returns the prompt + generated tokens. Slice off the prompt.
+        hf_output_ids = hf_generated.cpu().tolist()[0][len(prompt_ids[0]):]
+
+    # check that vLLM outputs (token ids) match HF outputs
+    # Note: for simplicity don't pass detokenized string
+    check_outputs_equal(
+        outputs_0_lst=[(hf_output_ids, "")],
+        outputs_1_lst=[(vllm_output_ids, "")],
+        name_0="hf",
+        name_1="vllm",
+    )
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 8b92cb052efd..ff95acf0c016 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -2247,14 +2247,28 @@ def _bookkeeping_sync(
 
             start_idx = self.input_batch.num_tokens_no_spec[req_idx]
             end_idx = start_idx + len(sampled_ids)
-            assert end_idx <= self.max_model_len, (
-                "Sampled token IDs exceed the max model length. "
-                f"Total number of tokens: {end_idx} > max_model_len: "
-                f"{self.max_model_len}")
-
-            self.input_batch.token_ids_cpu[req_idx,
-                                           start_idx:end_idx] = sampled_ids
-            self.input_batch.is_token_ids[req_idx, start_idx:end_idx] = True
+            assert end_idx <= self.max_model_len + 1, (
+                "Sampled token IDs exceed the max model length + 1. "
+                f"Total number of tokens: {end_idx} > max_model_len + 1: "
+                f"{self.max_model_len + 1}")
+
+            n_tokens_cache = len(sampled_ids)
+
+            # Sampled token IDs exceed the max model length by 1. This is
+            # legitimate as we can still sample 1 last token when the context
+            # length equals the max model length. Note that we do not need to
+            # cache this token ID as the sequence finishes after this step.
+            # Additionally, the buffers token_ids_cpu and is_token_ids are of
+            # size max model length only.
+            if end_idx == self.max_model_len + 1:
+                n_tokens_cache -= 1
+
+            self.input_batch.token_ids_cpu[req_idx, start_idx:(
+                start_idx + n_tokens_cache)] = sampled_ids[:n_tokens_cache]
+            self.input_batch.is_token_ids[req_idx,
+                                          start_idx:(start_idx +
+                                                     n_tokens_cache)] = True
+
             self.input_batch.num_tokens_no_spec[req_idx] = end_idx
             self.input_batch.num_tokens[req_idx] = end_idx
 

From cf7f947ac36085337135f4d36f2b5a8c78f0bf4b Mon Sep 17 00:00:00 2001
From: Paul Pak <52512091+paulpak58@users.noreply.github.com>
Date: Fri, 3 Oct 2025 21:59:48 +0900
Subject: [PATCH 134/193] [backends][short_conv] CUDA graph piecewise edits
 (#24215)

Signed-off-by: Paul Pak <paulpak58@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../model_executor/layers/mamba/short_conv.py |  2 +-
 vllm/v1/attention/backends/short_conv_attn.py | 40 +++++++++----------
 2 files changed, 21 insertions(+), 21 deletions(-)

diff --git a/vllm/model_executor/layers/mamba/short_conv.py b/vllm/model_executor/layers/mamba/short_conv.py
index cc424760e229..eb4223ade5f0 100644
--- a/vllm/model_executor/layers/mamba/short_conv.py
+++ b/vllm/model_executor/layers/mamba/short_conv.py
@@ -115,7 +115,7 @@ def forward_cuda(
             self_kv_cache = self.kv_cache[forward_context.virtual_engine]
             conv_state = self_kv_cache[0].transpose(-1, -2)
             state_indices_tensor = attn_metadata.state_indices_tensor
-            has_initial_states_p = attn_metadata.has_initial_states
+            has_initial_states_p = attn_metadata.has_initial_states_p
 
         BCx, _ = self.in_proj(hidden_states)
 
diff --git a/vllm/v1/attention/backends/short_conv_attn.py b/vllm/v1/attention/backends/short_conv_attn.py
index df7f0d2310ab..ba0fba4281e5 100644
--- a/vllm/v1/attention/backends/short_conv_attn.py
+++ b/vllm/v1/attention/backends/short_conv_attn.py
@@ -6,12 +6,12 @@
 import torch
 
 from vllm.attention.backends.abstract import AttentionBackend
-from vllm.config import VllmConfig
-from vllm.v1.attention.backends.utils import (AttentionMetadataBuilder,
+from vllm.v1.attention.backends.mamba_attn import (
+    BaseMambaAttentionMetadataBuilder)
+from vllm.v1.attention.backends.utils import (PAD_SLOT_ID,
                                               CommonAttentionMetadata,
                                               compute_causal_conv1d_metadata,
                                               split_decodes_and_prefills)
-from vllm.v1.kv_cache_interface import AttentionSpec, MambaSpec
 
 
 class ShortConvAttentionBackend(AttentionBackend):
@@ -29,8 +29,8 @@ class ShortConvAttentionMetadata:
     num_decode_tokens: int
 
     query_start_loc: torch.Tensor
-    has_initial_states: torch.Tensor
-    state_indices_tensor: torch.Tensor  # shape: [batch,]
+    state_indices_tensor: torch.Tensor
+    has_initial_states_p: Optional[torch.Tensor]
 
     # For causal_conv1d
     nums_dict: Optional[dict] = None
@@ -39,14 +39,7 @@ class ShortConvAttentionMetadata:
 
 
 class ShortConvAttentionMetadataBuilder(
-        AttentionMetadataBuilder[ShortConvAttentionMetadata]):
-
-    reorder_batch_threshold: int = 1
-
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
-        super().__init__(kv_cache_spec, layer_names, vllm_config, device)
-        assert isinstance(kv_cache_spec, MambaSpec)
+        BaseMambaAttentionMetadataBuilder[ShortConvAttentionMetadata]):
 
     def build(self,
               common_prefix_len: int,
@@ -54,7 +47,6 @@ def build(self,
               fast_build: bool = False) -> ShortConvAttentionMetadata:
         num_reqs = common_attn_metadata.num_reqs
         query_start_loc = common_attn_metadata.query_start_loc
-
         state_indices_tensor = common_attn_metadata.block_table_tensor[:, 0]
 
         # for causal_conv1d
@@ -64,13 +56,13 @@ def build(self,
             split_decodes_and_prefills(
                 common_attn_metadata,
                 decode_threshold=self.reorder_batch_threshold))
-        has_initial_states = None
+
+        has_initial_states_p = None
         if num_prefills > 0:
-            #[batch,]
             has_initial_states_cpu = (
                 common_attn_metadata.
                 num_computed_tokens_cpu[num_reqs - num_prefills:num_reqs] > 0)
-            has_initial_states = has_initial_states_cpu.to(
+            has_initial_states_p = has_initial_states_cpu.to(
                 query_start_loc.device)
 
             query_start_loc_p = common_attn_metadata.query_start_loc[
@@ -79,14 +71,22 @@ def build(self,
             nums_dict, batch_ptr, token_chunk_offset_ptr = \
                 compute_causal_conv1d_metadata(query_start_loc_p)
 
+        elif (num_decodes > 0 and num_decodes <= self.decode_cudagraph_max_bs
+              and self.compilation_config.full_cuda_graph):
+            num_input_tokens = self.vllm_config.pad_for_cudagraph(num_decodes)
+            self.state_indices_tensor[:num_decodes].copy_(state_indices_tensor,
+                                                          non_blocking=True)
+            state_indices_tensor = self.state_indices_tensor[:num_input_tokens]
+            state_indices_tensor[num_decodes:] = PAD_SLOT_ID
+
         attn_metadata = ShortConvAttentionMetadata(
+            query_start_loc=query_start_loc,
+            state_indices_tensor=state_indices_tensor,
+            has_initial_states_p=has_initial_states_p,
             num_prefills=num_prefills,
             num_prefill_tokens=num_prefill_tokens,
             num_decodes=num_decodes,
             num_decode_tokens=num_decode_tokens,
-            query_start_loc=query_start_loc,
-            has_initial_states=has_initial_states,
-            state_indices_tensor=state_indices_tensor,
             nums_dict=nums_dict,
             batch_ptr=batch_ptr,
             token_chunk_offset_ptr=token_chunk_offset_ptr,

From e0ad480228efbe032c84508fd99c2fc0bf8e4571 Mon Sep 17 00:00:00 2001
From: whx <56632993+whx-sjtu@users.noreply.github.com>
Date: Fri, 3 Oct 2025 21:34:53 +0800
Subject: [PATCH 135/193] [Model] Supplement to PR 24862: Pass param prefix to
 LLMHead (#25805)

Signed-off-by: whx-sjtu <2952154980@qq.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/deepseek_mtp.py     |  8 ++++++--
 vllm/model_executor/models/glm4_moe_mtp.py     |  8 ++++++--
 vllm/model_executor/models/gpt_neox.py         |  1 +
 .../model_executor/models/longcat_flash_mtp.py |  1 +
 vllm/model_executor/models/medusa.py           |  3 ++-
 vllm/model_executor/models/mlp_speculator.py   | 18 ++++++++++++++----
 vllm/model_executor/models/qwen3_vl_moe.py     |  3 ++-
 vllm/model_executor/models/whisper.py          |  5 +++--
 8 files changed, 35 insertions(+), 12 deletions(-)

diff --git a/vllm/model_executor/models/deepseek_mtp.py b/vllm/model_executor/models/deepseek_mtp.py
index 788e561ac394..02a25ab762e5 100644
--- a/vllm/model_executor/models/deepseek_mtp.py
+++ b/vllm/model_executor/models/deepseek_mtp.py
@@ -28,13 +28,15 @@ class SharedHead(nn.Module):
     def __init__(
         self,
         config: PretrainedConfig,
+        prefix: str,
         quant_config: Optional[QuantizationConfig] = None,
     ) -> None:
         super().__init__()
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         self.head = ParallelLMHead(config.vocab_size,
                                    config.hidden_size,
-                                   quant_config=quant_config)
+                                   quant_config=quant_config,
+                                   prefix=maybe_prefix(prefix, "head"))
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         return self.norm(hidden_states)
@@ -64,7 +66,9 @@ def __init__(self, vllm_config: VllmConfig, prefix: str) -> None:
                 device="cuda")
         else:
             topk_indices_buffer = None
-        self.shared_head = SharedHead(config=config, quant_config=quant_config)
+        self.shared_head = SharedHead(config=config,
+                                      prefix=prefix,
+                                      quant_config=quant_config)
         self.mtp_block = DeepseekV2DecoderLayer(vllm_config, prefix,
                                                 topk_indices_buffer)
 
diff --git a/vllm/model_executor/models/glm4_moe_mtp.py b/vllm/model_executor/models/glm4_moe_mtp.py
index 826d541e571b..57b698e239ec 100644
--- a/vllm/model_executor/models/glm4_moe_mtp.py
+++ b/vllm/model_executor/models/glm4_moe_mtp.py
@@ -50,13 +50,15 @@ class SharedHead(nn.Module):
     def __init__(
         self,
         config: PretrainedConfig,
+        prefix: str,
         quant_config: Optional[QuantizationConfig] = None,
     ) -> None:
         super().__init__()
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         self.head = ParallelLMHead(config.vocab_size,
                                    config.hidden_size,
-                                   quant_config=quant_config)
+                                   quant_config=quant_config,
+                                   prefix=maybe_prefix(prefix, "head"))
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         return self.norm(hidden_states)
@@ -77,7 +79,9 @@ def __init__(
         self.eh_proj = nn.Linear(config.hidden_size * 2,
                                  config.hidden_size,
                                  bias=False)
-        self.shared_head = SharedHead(config=config, quant_config=quant_config)
+        self.shared_head = SharedHead(config=config,
+                                      prefix=prefix,
+                                      quant_config=quant_config)
         self.mtp_block = Glm4MoeDecoderLayer(config=config,
                                              cache_config=cache_config,
                                              quant_config=quant_config,
diff --git a/vllm/model_executor/models/gpt_neox.py b/vllm/model_executor/models/gpt_neox.py
index 7570aefb6e96..45519a94d854 100644
--- a/vllm/model_executor/models/gpt_neox.py
+++ b/vllm/model_executor/models/gpt_neox.py
@@ -296,6 +296,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             config.vocab_size,
             config.hidden_size,
             quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "embed_out"),
         )
         if self.config.tie_word_embeddings:
             self.embed_out.weight = self.gpt_neox.embed_in.weight
diff --git a/vllm/model_executor/models/longcat_flash_mtp.py b/vllm/model_executor/models/longcat_flash_mtp.py
index eebc2ee15597..e288658a7ebf 100644
--- a/vllm/model_executor/models/longcat_flash_mtp.py
+++ b/vllm/model_executor/models/longcat_flash_mtp.py
@@ -140,6 +140,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.config.vocab_size,
             self.config.hidden_size,
             quant_config=self.quant_config,
+            prefix=maybe_prefix(prefix, "lm_head"),
         )
         self.logits_processor = LogitsProcessor(self.config.vocab_size)
 
diff --git a/vllm/model_executor/models/medusa.py b/vllm/model_executor/models/medusa.py
index 0ae59dc8dfc2..f083c2cb0380 100644
--- a/vllm/model_executor/models/medusa.py
+++ b/vllm/model_executor/models/medusa.py
@@ -82,7 +82,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
                     config.hidden_size,
                     org_num_embeddings=self.truncated_vocab_size,
                     padding_size=DEFAULT_VOCAB_PADDING_SIZE,
-                ) for _ in range(self.config.num_heads)
+                    prefix=maybe_prefix(prefix, f"lm_heads.{i}"),
+                ) for i in range(self.config.num_heads)
             ])
 
         logit_scale = getattr(config, "logit_scale", 1.0)
diff --git a/vllm/model_executor/models/mlp_speculator.py b/vllm/model_executor/models/mlp_speculator.py
index d057eb49a62d..0f375134ef00 100644
--- a/vllm/model_executor/models/mlp_speculator.py
+++ b/vllm/model_executor/models/mlp_speculator.py
@@ -13,6 +13,8 @@
     ParallelLMHead, VocabParallelEmbedding)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 
+from .utils import maybe_prefix
+
 SQRT2 = 2**0.5
 
 
@@ -97,8 +99,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
             self.proj = nn.ModuleList([proj_first] + [proj_tied] *
                                       (self.max_speculative_tokens - 1))
 
-            head = ParallelLMHead(self.vocab_size, self.inner_dim, bias=False)
-            self.head = nn.ModuleList([head] * self.max_speculative_tokens)
+            self.head = nn.ModuleList([
+                ParallelLMHead(self.vocab_size,
+                               self.inner_dim,
+                               bias=False,
+                               prefix=maybe_prefix(prefix, f"head.{i}"))
+                for i in range(self.max_speculative_tokens)
+            ])
 
             ln = MLPSpeculatorLayerNorm(self.inner_dim,
                                         elementwise_scale_and_shift=True)
@@ -120,8 +127,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
             ])
 
             self.head = nn.ModuleList([
-                ParallelLMHead(self.vocab_size, self.inner_dim, bias=False)
-                for _ in range(self.max_speculative_tokens)
+                ParallelLMHead(self.vocab_size,
+                               self.inner_dim,
+                               bias=False,
+                               prefix=maybe_prefix(prefix, f"head.{i}"))
+                for i in range(self.max_speculative_tokens)
             ])
             self.ln = nn.ModuleList([
                 MLPSpeculatorLayerNorm(self.inner_dim,
diff --git a/vllm/model_executor/models/qwen3_vl_moe.py b/vllm/model_executor/models/qwen3_vl_moe.py
index 1ed053eb2e96..bd4aae7404c6 100644
--- a/vllm/model_executor/models/qwen3_vl_moe.py
+++ b/vllm/model_executor/models/qwen3_vl_moe.py
@@ -296,7 +296,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                                       prefix=maybe_prefix(prefix, "model"))
         self.lm_head = ParallelLMHead(self.config.vocab_size,
                                       self.config.hidden_size,
-                                      quant_config=self.quant_config)
+                                      quant_config=self.quant_config,
+                                      prefix=maybe_prefix(prefix, "lm_head"))
         if self.config.tie_word_embeddings:
             self.lm_head.weight = self.model.embed_tokens.weight
         self.logits_processor = LogitsProcessor(self.config.vocab_size)
diff --git a/vllm/model_executor/models/whisper.py b/vllm/model_executor/models/whisper.py
index d349d91dfd76..84686b8b1941 100644
--- a/vllm/model_executor/models/whisper.py
+++ b/vllm/model_executor/models/whisper.py
@@ -45,7 +45,7 @@
 from .interfaces import (MultiModalEmbeddings, SupportsMultiModal,
                          SupportsTranscription)
 from .utils import (AutoWeightsLoader, WeightsMapper, cast_overflow_tensors,
-                    make_layers)
+                    make_layers, maybe_prefix)
 
 logger = init_logger(__name__)
 
@@ -885,7 +885,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.unpadded_vocab_size = config.vocab_size
         self.proj_out = ParallelLMHead(config.vocab_size,
                                        config.d_model,
-                                       quant_config=quant_config)
+                                       quant_config=quant_config,
+                                       prefix=maybe_prefix(prefix, "proj_out"))
         self.proj_out = self.proj_out.tie_weights(
             self.model.decoder.embed_tokens)
         logit_scale = getattr(config, "logit_scale", 1.0)

From 03386b2186a13ddf74da2bc84cfa290e42200327 Mon Sep 17 00:00:00 2001
From: Xiang Si <sixiang@google.com>
Date: Fri, 3 Oct 2025 06:38:42 -0700
Subject: [PATCH 136/193] [CI/Build] do not enforce precompilation on tpu ci
 tests (#25992)

Signed-off-by: Xiang Si <sixiang@google.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/v1/entrypoints/llm/test_struct_output_generate.py | 5 +----
 1 file changed, 1 insertion(+), 4 deletions(-)

diff --git a/tests/v1/entrypoints/llm/test_struct_output_generate.py b/tests/v1/entrypoints/llm/test_struct_output_generate.py
index 5017c83025ba..83493e25b7a6 100644
--- a/tests/v1/entrypoints/llm/test_struct_output_generate.py
+++ b/tests/v1/entrypoints/llm/test_struct_output_generate.py
@@ -123,13 +123,10 @@ def test_structured_output(
     if current_platform.is_tpu() and speculative_config:
         pytest.skip("TPU does not support speculative decoding")
 
-    # Don't use eager execution on TPUs because we want to test for no
-    # recompilation at runtime
-    enforce_eager = bool(not current_platform.is_tpu())
     # Use a single LLM instance for several scenarios to
     # speed up the test suite.
     llm = LLM(model=model_name,
-              enforce_eager=enforce_eager,
+              enforce_eager=True,
               max_model_len=1024,
               structured_outputs_config=dict(backend=backend,
                                              disable_any_whitespace=backend

From 9c3d84f832adb8c4c26c1ea051e19906c6e22051 Mon Sep 17 00:00:00 2001
From: Aleksandr Samarin <samarin_ad@mail.ru>
Date: Fri, 3 Oct 2025 15:43:41 +0200
Subject: [PATCH 137/193] [Model] Fixed stream generator for gpt-oss +
 spec-decoding (#26027)

Signed-off-by: Aleksandr Samarin <astrlrd@nebius.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/entrypoints/openai/serving_chat.py | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/vllm/entrypoints/openai/serving_chat.py b/vllm/entrypoints/openai/serving_chat.py
index 54eb60a8589d..a646b16da82c 100644
--- a/vllm/entrypoints/openai/serving_chat.py
+++ b/vllm/entrypoints/openai/serving_chat.py
@@ -691,11 +691,13 @@ async def chat_completion_stream_generator(
                     if self.use_harmony:
                         harmony_parser = harmony_parsers[i]
                         prev_recipient = harmony_parser.current_recipient
+                        delta_text = ""
                         for token_id in output.token_ids:
                             harmony_parser.process(token_id)
+                            delta_text += (harmony_parser.last_content_delta
+                                           or "")
                         cur_channel = harmony_parser.current_channel
                         cur_recipient = harmony_parser.current_recipient
-                        delta_text = harmony_parser.last_content_delta or ""
                     else:
                         delta_text = output.text
 

From 5a0dcdf35b7d72f8a03e7655a818e6de6b957835 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Fri, 3 Oct 2025 23:08:22 +0800
Subject: [PATCH 138/193] [Renderer] Move Processor out of LLMEngine (#26165)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/entrypoints/llm.py                   | 70 ++++++++++++++++++-----
 vllm/entrypoints/openai/serving_engine.py | 41 ++++---------
 vllm/inputs/parse.py                      | 26 ++++++++-
 vllm/v1/engine/llm_engine.py              | 22 ++++---
 4 files changed, 107 insertions(+), 52 deletions(-)

diff --git a/vllm/entrypoints/llm.py b/vllm/entrypoints/llm.py
index 862f383e4ecb..705a72f657a2 100644
--- a/vllm/entrypoints/llm.py
+++ b/vllm/entrypoints/llm.py
@@ -37,6 +37,7 @@
                                     log_non_default_args)
 from vllm.inputs import (DataPrompt, PromptType, SingletonPrompt, TextPrompt,
                          TokensPrompt)
+from vllm.inputs.parse import get_prompt_components
 from vllm.logger import init_logger
 from vllm.lora.request import LoRARequest
 from vllm.model_executor.layers.quantization import QuantizationMethods
@@ -49,10 +50,13 @@
                                   SamplingParams)
 from vllm.tasks import PoolingTask
 from vllm.transformers_utils.tokenizer import (AnyTokenizer, MistralTokenizer,
-                                               get_cached_tokenizer)
+                                               get_cached_tokenizer,
+                                               init_tokenizer_from_configs)
 from vllm.usage.usage_lib import UsageContext
 from vllm.utils import Counter, Device, as_iter, is_list_of
+from vllm.v1.engine import EngineCoreRequest
 from vllm.v1.engine.llm_engine import LLMEngine
+from vllm.v1.engine.processor import Processor
 from vllm.v1.sample.logits_processor import LogitsProcessor
 
 if TYPE_CHECKING:
@@ -312,6 +316,10 @@ def __init__(
         self.io_processor = get_io_processor(self.llm_engine.vllm_config,
                                              io_processor_plugin)
 
+    @property
+    def model_config(self):
+        return self.llm_engine.model_config
+
     def get_tokenizer(self) -> AnyTokenizer:
         return self.llm_engine.get_tokenizer()
 
@@ -324,6 +332,16 @@ def set_tokenizer(self, tokenizer: AnyTokenizer) -> None:
         else:
             self.llm_engine.tokenizer = get_cached_tokenizer(tokenizer)
 
+    def _get_processor(self) -> Processor:
+        if not hasattr(self, "_processor"):
+            vllm_config = self.llm_engine.vllm_config
+            if self.model_config.skip_tokenizer_init:
+                tokenizer = None
+            else:
+                tokenizer = init_tokenizer_from_configs(self.model_config)
+            self._processor = Processor(vllm_config, tokenizer)
+        return self._processor
+
     def get_default_sampling_params(self) -> SamplingParams:
         if self.default_sampling_params is None:
             self.default_sampling_params = (
@@ -1497,8 +1515,6 @@ def _validate_and_add_requests(
             tqdm_func = use_tqdm if callable(use_tqdm) else tqdm
             it = tqdm_func(it, desc="Adding requests")
 
-        model_config = self.llm_engine.model_config
-
         for i, prompt in enumerate(it):
 
             if isinstance(prompt, dict):
@@ -1506,17 +1522,9 @@ def _validate_and_add_requests(
                     prompt.get("multi_modal_data"),
                     prompt.get("multi_modal_uuids"))
 
-            param = params[i] if isinstance(params, Sequence) else params
-
-            tokenization_kwargs: dict[str, Any] = {}
-            _validate_truncation_size(model_config.max_model_len,
-                                      param.truncate_prompt_tokens,
-                                      tokenization_kwargs)
-
             self._add_request(
                 prompt,
                 params[i] if isinstance(params, Sequence) else params,
-                tokenization_kwargs=tokenization_kwargs,
                 lora_request=lora_request[i] if isinstance(
                     lora_request, Sequence) else lora_request,
                 priority=priority[i] if priority else 0,
@@ -1557,22 +1565,58 @@ def _validate_mm_data_and_uuids(
                     raise ValueError(f"Multi-modal data for {modality} is None"
                                      f" but UUID is not provided")
 
+    def _process_inputs(
+        self,
+        request_id: str,
+        engine_prompt: PromptType,
+        params: Union[SamplingParams, PoolingParams],
+        *,
+        lora_request: Optional[LoRARequest],
+        priority: int,
+    ) -> tuple[EngineCoreRequest, dict[str, Any]]:
+        """Use the Processor to process inputs for LLMEngine."""
+        tokenization_kwargs: dict[str, Any] = {}
+        _validate_truncation_size(self.model_config.max_model_len,
+                                  params.truncate_prompt_tokens,
+                                  tokenization_kwargs)
+
+        processor = self._get_processor()
+        engine_request = processor.process_inputs(
+            request_id,
+            engine_prompt,
+            params,
+            lora_request=lora_request,
+            tokenization_kwargs=tokenization_kwargs,
+            priority=priority,
+        )
+        return engine_request, tokenization_kwargs
+
     def _add_request(
         self,
         prompt: PromptType,
         params: Union[SamplingParams, PoolingParams],
-        tokenization_kwargs: Optional[dict[str, Any]] = None,
         lora_request: Optional[LoRARequest] = None,
         priority: int = 0,
     ) -> None:
+        prompt_text, _, _ = get_prompt_components(prompt)
         request_id = str(next(self.request_counter))
-        self.llm_engine.add_request(
+
+        engine_request, tokenization_kwargs = self._process_inputs(
             request_id,
             prompt,
             params,
             lora_request=lora_request,
+            priority=priority,
+        )
+
+        self.llm_engine.add_request(
+            request_id,
+            engine_request,
+            params,
+            lora_request=lora_request,
             tokenization_kwargs=tokenization_kwargs,
             priority=priority,
+            prompt_text=prompt_text,
         )
 
     def _run_engine(
diff --git a/vllm/entrypoints/openai/serving_engine.py b/vllm/entrypoints/openai/serving_engine.py
index dc41723800d0..0e5279baed29 100644
--- a/vllm/entrypoints/openai/serving_engine.py
+++ b/vllm/entrypoints/openai/serving_engine.py
@@ -7,8 +7,7 @@
 from collections.abc import AsyncGenerator, Iterable, Mapping, Sequence
 from concurrent.futures import ThreadPoolExecutor
 from http import HTTPStatus
-from typing import (Any, Callable, ClassVar, Generic, NamedTuple, Optional,
-                    TypeVar, Union)
+from typing import Any, Callable, ClassVar, Generic, Optional, TypeVar, Union
 
 import torch
 from fastapi import Request
@@ -69,6 +68,7 @@
 # yapf: enable
 from vllm.inputs.data import PromptType
 from vllm.inputs.data import TokensPrompt as EngineTokensPrompt
+from vllm.inputs.parse import PromptComponents, get_prompt_components
 from vllm.logger import init_logger
 from vllm.logprobs import Logprob, PromptLogprobs
 from vllm.lora.request import LoRARequest
@@ -140,12 +140,6 @@ def is_embeds_prompt(prompt: RequestPrompt) -> TypeIs[EmbedsPrompt]:
             and "prompt_embeds" in prompt)
 
 
-class PromptComponents(NamedTuple):
-    text: Optional[str] = None
-    token_ids: Optional[list[int]] = None
-    embeds: Optional[torch.Tensor] = None
-
-
 RequestT = TypeVar("RequestT", bound=AnyRequest)
 
 
@@ -876,25 +870,23 @@ async def _process_inputs(
         self,
         request_id: str,
         engine_prompt: PromptType,
-        sampling_params: SamplingParams,
+        params: Union[SamplingParams, PoolingParams],
         *,
         lora_request: Optional[LoRARequest],
         trace_headers: Optional[Mapping[str, str]],
         priority: int,
     ) -> tuple[EngineCoreRequest, dict[str, Any]]:
-        """
-        using the Processor to process inputs for AsyncLLM
-        """
+        """Use the Processor to process inputs for AsyncLLM."""
         tokenization_kwargs: dict[str, Any] = {}
         _validate_truncation_size(self.max_model_len,
-                                  sampling_params.truncate_prompt_tokens,
+                                  params.truncate_prompt_tokens,
                                   tokenization_kwargs)
 
         processor = await self._get_processor()
         engine_request = processor.process_inputs(
             request_id,
             engine_prompt,
-            sampling_params,
+            params,
             lora_request=lora_request,
             tokenization_kwargs=tokenization_kwargs,
             trace_headers=trace_headers,
@@ -973,25 +965,12 @@ async def _generate_with_builtin_tools(
 
     def _get_prompt_components(
         self,
-        inputs: Union[RequestPrompt, PromptType],
+        prompt: Union[RequestPrompt, PromptType],
     ) -> PromptComponents:
-        if isinstance(inputs, str):
-            return PromptComponents(text=inputs)
-        if isinstance(inputs, list):
-            return PromptComponents(token_ids=inputs)
-        if isinstance(inputs, dict):
-            return PromptComponents(
-                text=inputs.get("prompt"),  # type: ignore[arg-type]
-                token_ids=inputs.get(
-                    "prompt_token_ids"),  # type: ignore[arg-type]
-                embeds=inputs.get("prompt_embeds"),
-            )
+        if isinstance(prompt, list):
+            return PromptComponents(token_ids=prompt)
 
-        return PromptComponents(
-            text=getattr(inputs, "prompt", None),
-            token_ids=getattr(inputs, "prompt_token_ids", None),
-            embeds=getattr(inputs, "prompt_embeds", None),
-        )
+        return get_prompt_components(prompt)  # type: ignore[arg-type]
 
     def _log_inputs(
         self,
diff --git a/vllm/inputs/parse.py b/vllm/inputs/parse.py
index 8c3700799e4a..123c81173120 100644
--- a/vllm/inputs/parse.py
+++ b/vllm/inputs/parse.py
@@ -1,7 +1,8 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from collections.abc import Sequence
-from typing import Literal, Optional, TypedDict, Union, cast, overload
+from typing import (TYPE_CHECKING, Literal, NamedTuple, Optional, TypedDict,
+                    Union, cast, overload)
 
 from typing_extensions import TypeIs
 
@@ -11,6 +12,9 @@
                    PromptType, SingletonInputs, SingletonPrompt, TextPrompt,
                    TokensPrompt)
 
+if TYPE_CHECKING:
+    import torch
+
 
 class ParsedText(TypedDict):
     content: str
@@ -149,3 +153,23 @@ def split_enc_dec_inputs(
         )
 
     return None, inputs
+
+
+class PromptComponents(NamedTuple):
+    text: Optional[str] = None
+    token_ids: Optional[list[int]] = None
+    embeds: Optional["torch.Tensor"] = None
+
+
+def get_prompt_components(prompt: PromptType) -> PromptComponents:
+    if isinstance(prompt, str):
+        return PromptComponents(text=prompt)
+
+    if (encoder_prompt := prompt.get("encoder_prompt")):
+        return get_prompt_components(encoder_prompt)  # type: ignore[arg-type]
+
+    return PromptComponents(
+        text=prompt.get("prompt"),  # type: ignore[arg-type]
+        token_ids=prompt.get("prompt_token_ids"),  # type: ignore[arg-type]
+        embeds=prompt.get("prompt_embeds"),
+    )
diff --git a/vllm/v1/engine/llm_engine.py b/vllm/v1/engine/llm_engine.py
index f81427161d7d..3734c208004a 100644
--- a/vllm/v1/engine/llm_engine.py
+++ b/vllm/v1/engine/llm_engine.py
@@ -27,6 +27,7 @@
                                                init_tokenizer_from_configs)
 from vllm.usage.usage_lib import UsageContext
 from vllm.utils import Device
+from vllm.v1.engine import EngineCoreRequest
 from vllm.v1.engine.core_client import EngineCoreClient
 from vllm.v1.engine.output_processor import OutputProcessor
 from vllm.v1.engine.parallel_sampling import ParentRequest
@@ -213,13 +214,14 @@ def abort_request(self, request_ids: list[str]) -> None:
     def add_request(
         self,
         request_id: str,
-        prompt: PromptType,
+        prompt: Union[EngineCoreRequest, PromptType],
         params: Union[SamplingParams, PoolingParams],
         arrival_time: Optional[float] = None,
         lora_request: Optional[LoRARequest] = None,
         tokenization_kwargs: Optional[dict[str, Any]] = None,
         trace_headers: Optional[Mapping[str, str]] = None,
         priority: int = 0,
+        prompt_text: Optional[str] = None,
     ) -> None:
         # Validate the request_id type.
         if not isinstance(request_id, str):
@@ -227,12 +229,18 @@ def add_request(
                 f"request_id must be a string, got {type(request_id)}")
 
         # Process raw inputs into the request.
-        request = self.processor.process_inputs(request_id, prompt, params,
-                                                arrival_time, lora_request,
-                                                tokenization_kwargs,
-                                                trace_headers, priority)
-        prompt_text = prompt if isinstance(prompt,
-                                           str) else prompt.get("prompt")
+        if isinstance(prompt, EngineCoreRequest):
+            request = prompt
+        else:
+            assert prompt_text is None
+            logger.warning_once("Processor has been moved under LLM and will "
+                                "be removed from LLMEngine in v0.13.")
+            request = self.processor.process_inputs(request_id, prompt, params,
+                                                    arrival_time, lora_request,
+                                                    tokenization_kwargs,
+                                                    trace_headers, priority)
+            prompt_text = (prompt if isinstance(prompt, str) else
+                           prompt.get("prompt"))
 
         n = params.n if isinstance(params, SamplingParams) else 1
 

From 4298159b6eef1b0ced3c7bd75e46af3b71d73dbd Mon Sep 17 00:00:00 2001
From: Jun Jiang <jasl9187@hotmail.com>
Date: Fri, 3 Oct 2025 23:48:32 +0800
Subject: [PATCH 139/193] Fix undefined symbol: cutlass_moe_mm_sm100 (#26098)
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Signed-off-by: Jun Jiang <jasl9187@hotmail.com>
Co-authored-by: Luka Govedič <ProExpertProg@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 CMakeLists.txt                                |  2 +-
 .../cutlass_w8a8/scaled_mm_entry.cu           |  4 ++--
 vllm/utils/__init__.py                        | 20 +++++++++++++++++++
 3 files changed, 23 insertions(+), 3 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 5f2c43fea284..5ebea1c42e9a 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -667,7 +667,7 @@ if(VLLM_GPU_LANG STREQUAL "CUDA")
   endif()
 
   if(${CMAKE_CUDA_COMPILER_VERSION} VERSION_GREATER_EQUAL 13.0)
-    cuda_archs_loose_intersection(SCALED_MM_ARCHS "10.0f" "${CUDA_ARCHS}")
+    cuda_archs_loose_intersection(SCALED_MM_ARCHS "10.0f;11.0f" "${CUDA_ARCHS}")
   else()
     cuda_archs_loose_intersection(SCALED_MM_ARCHS "10.0a" "${CUDA_ARCHS}")
   endif()
diff --git a/csrc/quantization/cutlass_w8a8/scaled_mm_entry.cu b/csrc/quantization/cutlass_w8a8/scaled_mm_entry.cu
index 04b64a35da37..1001af05ff00 100644
--- a/csrc/quantization/cutlass_w8a8/scaled_mm_entry.cu
+++ b/csrc/quantization/cutlass_w8a8/scaled_mm_entry.cu
@@ -254,7 +254,7 @@ void cutlass_moe_mm(
     bool per_act_token, bool per_out_ch) {
   int32_t version_num = get_sm_version_num();
 #if defined ENABLE_CUTLASS_MOE_SM100 && ENABLE_CUTLASS_MOE_SM100
-  if (version_num >= 100) {
+  if (version_num >= 100 && version_num < 110) {
     cutlass_moe_mm_sm100(out_tensors, a_tensors, b_tensors, a_scales, b_scales,
                          expert_offsets, problem_sizes, a_strides, b_strides,
                          c_strides, per_act_token, per_out_ch);
@@ -262,7 +262,7 @@ void cutlass_moe_mm(
   }
 #endif
 #if defined ENABLE_CUTLASS_MOE_SM90 && ENABLE_CUTLASS_MOE_SM90
-  if (version_num >= 90) {
+  if (version_num >= 90 && version_num < 100) {
     cutlass_moe_mm_sm90(out_tensors, a_tensors, b_tensors, a_scales, b_scales,
                         expert_offsets, problem_sizes, a_strides, b_strides,
                         c_strides, per_act_token, per_out_ch);
diff --git a/vllm/utils/__init__.py b/vllm/utils/__init__.py
index 8c69870b2bc3..6b208bca6986 100644
--- a/vllm/utils/__init__.py
+++ b/vllm/utils/__init__.py
@@ -2747,6 +2747,8 @@ def __post_init__(self):
             self.measure()
 
     def measure(self):
+        from vllm.platforms import current_platform
+
         # we measure the torch peak memory usage via allocated_bytes,
         # rather than `torch.cuda.memory_reserved()` .
         # After `torch.cuda.reset_peak_memory_stats()`,
@@ -2756,6 +2758,24 @@ def measure(self):
             "allocated_bytes.all.peak", 0)
 
         self.free_memory, self.total_memory = torch.cuda.mem_get_info()
+        shared_sysmem_device_mem_sms = (
+            (8, 7), (11, 0), (12, 1))  # Orin, Thor, Spark
+        if current_platform.is_cuda() and \
+            current_platform.get_device_capability() in \
+            shared_sysmem_device_mem_sms:
+            # On UMA (Orin, Thor and Spark) platform,
+            # where both CPU and GPU rely on system memory,
+            # the cudaMemGetInfo function shows the amount of free system memory
+            # rather than what’s actually available.
+            # In the case,
+            # torch.cuda.mem_get_info() only reports "free" memory,
+            # which can be lower than what is actually
+            # available due to not including cache memory.
+            # There’s also a comprehensive reference page
+            # that explains how you can compute the proper value yourself.
+            # https://docs.nvidia.com/cuda/cuda-for-tegra-appnote/#estimating-total-allocatable-device-memory-on-an-integrated-gpu-device
+            self.free_memory = psutil.virtual_memory().available
+
         self.cuda_memory = self.total_memory - self.free_memory
 
         # torch.cuda.memory_reserved() is how many bytes

From fe4577d0c6c609d8cee654ba42a6528f52d5e958 Mon Sep 17 00:00:00 2001
From: "Chendi.Xue" <chendi.xue@intel.com>
Date: Fri, 3 Oct 2025 10:52:26 -0500
Subject: [PATCH 140/193] [BugFix][QWEN-VL]fix wrong apply_rotary_emb_torch
 selection introduced by #24642 (#26123)

Signed-off-by: Chendi Xue <Chendi.Xue@intel.com>
Signed-off-by: Chendi.Xue <chendi.xue@intel.com>
Co-authored-by: Roger Wang <hey@rogerw.io>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/layers/rotary_embedding/common.py | 11 ++++++++---
 vllm/model_executor/models/qwen2_vl.py                |  3 ++-
 2 files changed, 10 insertions(+), 4 deletions(-)

diff --git a/vllm/model_executor/layers/rotary_embedding/common.py b/vllm/model_executor/layers/rotary_embedding/common.py
index 4f02c996bda1..0d11d1ffea9f 100644
--- a/vllm/model_executor/layers/rotary_embedding/common.py
+++ b/vllm/model_executor/layers/rotary_embedding/common.py
@@ -4,7 +4,7 @@
 import math
 from functools import cache
 from importlib.util import find_spec
-from typing import Callable
+from typing import Callable, Optional
 
 import torch
 
@@ -72,7 +72,9 @@ def apply_rotary_emb_dispatch(x: torch.Tensor, cos: torch.Tensor,
 
 
 @cache
-def dispatch_rotary_emb_function() -> Callable[..., torch.Tensor]:
+def dispatch_rotary_emb_function(
+    default: Optional[Callable[..., torch.Tensor]] = None
+) -> Callable[..., torch.Tensor]:
     if current_platform.is_cuda():
         return apply_rotary_emb
 
@@ -85,7 +87,10 @@ def dispatch_rotary_emb_function() -> Callable[..., torch.Tensor]:
                 "flash_attn is not installed. Falling back to PyTorch "
                 "implementation for rotary embeddings.")
 
-    return apply_rotary_emb_torch
+    if default is not None:
+        return default
+    else:
+        return apply_rotary_emb_torch
 
 
 # yarn functions
diff --git a/vllm/model_executor/models/qwen2_vl.py b/vllm/model_executor/models/qwen2_vl.py
index 6f15a7f4ef38..ab9bfe4d0f19 100644
--- a/vllm/model_executor/models/qwen2_vl.py
+++ b/vllm/model_executor/models/qwen2_vl.py
@@ -276,7 +276,8 @@ def apply_rotary_emb_torch(x: torch.Tensor,
 
 def apply_rotary_pos_emb_vision(t: torch.Tensor,
                                 freqs: torch.Tensor) -> torch.Tensor:
-    rotary_emb_function = dispatch_rotary_emb_function()
+    rotary_emb_function = dispatch_rotary_emb_function(
+        default=apply_rotary_emb_torch)
     t_ = t.float()
     cos = freqs.cos()
     sin = freqs.sin()

From 55e7e7e9714f52c0d42c3db76c15f498a672eae3 Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Fri, 3 Oct 2025 17:42:34 +0100
Subject: [PATCH 141/193] Stop mergify from keeping stale PRs alive (#26169)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .github/mergify.yml | 30 ++++++++++++++++++++++++++----
 1 file changed, 26 insertions(+), 4 deletions(-)

diff --git a/.github/mergify.yml b/.github/mergify.yml
index 04ad6a5be8df..5b08dbef8e13 100644
--- a/.github/mergify.yml
+++ b/.github/mergify.yml
@@ -2,6 +2,7 @@ pull_request_rules:
 - name: label-documentation
   description: Automatically apply documentation label
   conditions:
+    - label != stale
     - or:
       - files~=^[^/]+\.md$
       - files~=^docs/
@@ -14,6 +15,7 @@ pull_request_rules:
 - name: label-ci-build
   description: Automatically apply ci/build label
   conditions:
+    - label != stale
     - or:
       - files~=^\.github/
       - files~=\.buildkite/
@@ -30,6 +32,7 @@ pull_request_rules:
 - name: label-deepseek
   description: Automatically apply deepseek label
   conditions:
+    - label != stale
     - or:
       - files~=^examples/.*deepseek.*\.py
       - files~=^tests/.*deepseek.*\.py
@@ -46,6 +49,7 @@ pull_request_rules:
 - name: label-frontend
   description: Automatically apply frontend label
   conditions:
+    - label != stale
     - files~=^vllm/entrypoints/
   actions:
     label:
@@ -55,6 +59,7 @@ pull_request_rules:
 - name: label-llama
   description: Automatically apply llama label
   conditions:
+    - label != stale
     - or:
       - files~=^examples/.*llama.*\.py
       - files~=^tests/.*llama.*\.py
@@ -70,6 +75,7 @@ pull_request_rules:
 - name: label-multi-modality
   description: Automatically apply multi-modality label
   conditions:
+    - label != stale
     - or:
       - files~=^vllm/multimodal/
       - files~=^tests/multimodal/
@@ -83,6 +89,7 @@ pull_request_rules:
 - name: label-new-model
   description: Automatically apply new-model label
   conditions:
+    - label != stale
     - and:
       - files~=^vllm/model_executor/models/
       - files=vllm/model_executor/models/registry.py
@@ -94,6 +101,7 @@ pull_request_rules:
 - name: label-performance
   description: Automatically apply performance label
   conditions:
+    - label != stale
     - or:
       - files~=^benchmarks/
       - files~=^vllm/benchmarks/
@@ -107,6 +115,7 @@ pull_request_rules:
 - name: label-qwen
   description: Automatically apply qwen label
   conditions:
+    - label != stale
     - or:
       - files~=^examples/.*qwen.*\.py
       - files~=^tests/.*qwen.*\.py
@@ -121,6 +130,7 @@ pull_request_rules:
 - name: label-gpt-oss
   description: Automatically apply gpt-oss label
   conditions:
+    - label != stale
     - or:
       - files~=^examples/.*gpt[-_]?oss.*\.py
       - files~=^tests/.*gpt[-_]?oss.*\.py
@@ -142,6 +152,7 @@ pull_request_rules:
 - name: label-rocm
   description: Automatically apply rocm label
   conditions:
+    - label != stale
     - or:
       - files~=^csrc/rocm/
       - files~=^docker/Dockerfile.rocm
@@ -162,6 +173,7 @@ pull_request_rules:
 - name: label-structured-output
   description: Automatically apply structured-output label
   conditions:
+    - label != stale
     - or:
       - files~=^benchmarks/structured_schemas/
       - files=benchmarks/benchmark_serving_structured_output.py
@@ -181,6 +193,7 @@ pull_request_rules:
 - name: label-speculative-decoding
   description: Automatically apply speculative-decoding label
   conditions:
+    - label != stale
     - or:
       - files~=^vllm/v1/spec_decode/
       - files~=^tests/v1/spec_decode/
@@ -196,6 +209,7 @@ pull_request_rules:
 - name: label-v1
   description: Automatically apply v1 label
   conditions:
+    - label != stale
     - or:
       - files~=^vllm/v1/
       - files~=^tests/v1/
@@ -208,6 +222,7 @@ pull_request_rules:
   description: Automatically apply tpu label
   # Keep this list in sync with `label-tpu-remove` conditions
   conditions:
+    - label != stale
     - or:
       - files~=tpu.py
       - files~=_tpu
@@ -223,6 +238,7 @@ pull_request_rules:
   description: Automatically remove tpu label
   # Keep this list in sync with `label-tpu` conditions
   conditions:
+    - label != stale
     - and:
       - -files~=tpu.py
       - -files~=_tpu
@@ -237,6 +253,7 @@ pull_request_rules:
 - name: label-tool-calling
   description: Automatically add tool-calling label
   conditions:
+    - label != stale
     - or:
       - files~=^tests/tool_use/
       - files~=^tests/entrypoints/openai/tool_parsers/
@@ -255,8 +272,9 @@ pull_request_rules:
 
 - name: ping author on conflicts and add 'needs-rebase' label
   conditions:
-      - conflict
-      - -closed
+    - label != stale
+    - conflict
+    - -closed
   actions:
     label:
       add:
@@ -270,6 +288,8 @@ pull_request_rules:
 
 - name: assign reviewer for tensorizer changes
   conditions:
+    - label != stale
+    - or:
       - files~=^vllm/model_executor/model_loader/tensorizer.py
       - files~=^vllm/model_executor/model_loader/tensorizer_loader.py
       - files~=^tests/entrypoints/openai/test_tensorizer_entrypoint.py
@@ -281,6 +301,7 @@ pull_request_rules:
 
 - name: assign reviewer for modelopt changes
   conditions:
+    - label != stale
     - or:
         - files~=^vllm/model_executor/layers/quantization/modelopt\.py$
         - files~=^vllm/model_executor/layers/quantization/__init__\.py$
@@ -295,8 +316,8 @@ pull_request_rules:
 
 - name: remove 'needs-rebase' label when conflict is resolved
   conditions:
-      - -conflict
-      - -closed
+    - -conflict
+    - -closed
   actions:
     label:
       remove:
@@ -305,6 +326,7 @@ pull_request_rules:
 - name: label-kv-connector
   description: Automatically apply kv-connector label
   conditions:
+    - label != stale
     - or:
       - files~=^examples/online_serving/disaggregated[^/]*/.*
       - files~=^examples/offline_inference/disaggregated[^/]*/.*

From 6d4463ddc23f0c22a67ff02f14ddb40ca44ccacf Mon Sep 17 00:00:00 2001
From: Matthew Bonanni <mbonanni@redhat.com>
Date: Fri, 3 Oct 2025 13:35:17 -0400
Subject: [PATCH 142/193] Avoid division by zero in cache DS MLA kernel
 (#26174)

Signed-off-by: Matthew Bonanni <mbonanni@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 csrc/cache_kernels.cu | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/csrc/cache_kernels.cu b/csrc/cache_kernels.cu
index 6b3480091f28..84c2345b44d8 100644
--- a/csrc/cache_kernels.cu
+++ b/csrc/cache_kernels.cu
@@ -16,7 +16,7 @@
 
 #include <algorithm>
 #include <cassert>
-#include <cfloat>  // FLT_MIN
+#include <cfloat>
 
 #ifdef USE_ROCM
   #include <hip/hip_bf16.h>
@@ -479,6 +479,7 @@ __global__ void concat_and_cache_ds_mla_kernel(
 
   // Compute the scale for the tile
   float tile_scale = max_abs / 448.f;
+  tile_scale = fmaxf(tile_scale, FLT_MIN);
 
   // The first lane of each half-warp writes the scale to kv_cache
   if ((lane_idx == 0) || (lane_idx == 16)) {

From 7cf2f77f6a62bd48221b1d6f33e33e64f33c1584 Mon Sep 17 00:00:00 2001
From: Nikhil G <nrghosh@users.noreply.github.com>
Date: Fri, 3 Oct 2025 11:39:45 -0700
Subject: [PATCH 143/193] Fix V1 engine serialization error with Ray
 distributed executor (#26148)

Signed-off-by: Nikhil Ghosh <nikhil@anyscale.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/executor/ray_utils.py | 6 ++++++
 1 file changed, 6 insertions(+)

diff --git a/vllm/executor/ray_utils.py b/vllm/executor/ray_utils.py
index d8eb7977dbde..5b76334722e9 100644
--- a/vllm/executor/ray_utils.py
+++ b/vllm/executor/ray_utils.py
@@ -16,6 +16,7 @@
 from vllm.platforms import current_platform
 from vllm.sequence import ExecuteModelRequest, IntermediateTensors
 from vllm.utils import get_ip
+from vllm.v1.outputs import AsyncModelRunnerOutput
 from vllm.v1.worker.worker_base import WorkerWrapperBase
 
 if TYPE_CHECKING:
@@ -142,6 +143,11 @@ def execute_model_ray(
                 # but may still be finished requests.
                 assert not output or not output.req_ids
                 output = scheduler_output, None
+            # Ensure outputs crossing Ray compiled DAG are serializable.
+            # AsyncModelRunnerOutput holds CUDA events and cannot be
+            # pickled.
+            if isinstance(output, AsyncModelRunnerOutput):
+                output = output.get_output()
             return output
 
         def override_env_vars(self, vars: Dict[str, str]):

From c9ae9400888c588d9046ff22cb4880ce73cdf971 Mon Sep 17 00:00:00 2001
From: Pavani Majety <pmajety@nvidia.com>
Date: Fri, 3 Oct 2025 12:35:06 -0700
Subject: [PATCH 144/193] [Quantization/NVFP4] Speed up TRTLLM NVFP4 MOE weight
 loading and fix K/V scale loading for MLA Attn (#25968)

Signed-off-by: Pavani Majety <pmajety@nvidia.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../layers/quantization/kv_cache.py           |   8 +-
 .../layers/quantization/modelopt.py           | 116 ++++++++++--------
 .../model_loader/weight_utils.py              |   8 +-
 3 files changed, 77 insertions(+), 55 deletions(-)

diff --git a/vllm/model_executor/layers/quantization/kv_cache.py b/vllm/model_executor/layers/quantization/kv_cache.py
index 275a1c43fdd2..27e2b7846d38 100644
--- a/vllm/model_executor/layers/quantization/kv_cache.py
+++ b/vllm/model_executor/layers/quantization/kv_cache.py
@@ -86,7 +86,7 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
                 logger.warning_once(
                     "Checkpoint does not provide a q scaling factor. "
                     "Setting it to k_scale. This only matters for "
-                    "the flash-attn backend.")
+                    "FP8 Attention backends (flash-attn or flashinfer).")
                 layer._q_scale.copy_(k_scale)
                 layer._q_scale_float = k_scale
 
@@ -98,9 +98,9 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             if (k_scale == 1.0 and v_scale == 1.0
                     and "e5m2" not in layer.kv_cache_dtype):
                 logger.warning_once(
-                    "Using KV cache scaling factor 1.0 for fp8_e4m3. This "
-                    "may cause accuracy issues. Please make sure k/v_scale "
-                    "scaling factors are available in the fp8 checkpoint.")
+                    "Using KV cache scaling factor 1.0 for fp8_e4m3. "
+                    "If this is unintended, verify that k/v_scale "
+                    "scaling factors are properly set in the checkpoint.")
 
         if layer.q_scale > 0.0:
             q_scale = layer.q_scale
diff --git a/vllm/model_executor/layers/quantization/modelopt.py b/vllm/model_executor/layers/quantization/modelopt.py
index 20704439eaa9..1ca82cdcbc78 100644
--- a/vllm/model_executor/layers/quantization/modelopt.py
+++ b/vllm/model_executor/layers/quantization/modelopt.py
@@ -1064,7 +1064,7 @@ def __init__(
         self.allow_flashinfer = _nvfp4.allow_flashinfer
         self.use_marlin = _nvfp4.use_marlin
         self.flashinfer_moe_backend = None
-
+        self._cache_permute_indices: dict[torch.Size, torch.Tensor] = {}
         if self.allow_flashinfer:
             self.flashinfer_moe_backend = get_flashinfer_moe_backend()
             logger.info_once(
@@ -1197,19 +1197,23 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
                                                  weight_loader=weight_loader)
         layer.register_parameter("w2_input_scale", w2_input_scale)
 
-    def prepare_static_weight_layouts_for_trtllm_moe(
+    def prepare_static_weights_for_trtllm_fp4_moe(
         self,
-        gemm1_weights: torch.Tensor,
-        gemm2_weights: torch.Tensor,
-        gemm1_scales_linear_fp4_bytes: torch.Tensor,
-        gemm2_scales_linear_fp4_bytes: torch.Tensor,
-        hidden_size: int,
-        intermediate_size: int,
-        num_experts: int,
-    ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor, torch.Tensor]:
+        # args_dequant,
+        # args,
+        gemm1_weights,
+        gemm2_weights,
+        gemm1_scales_linear_fp4_bytes,
+        gemm2_scales_linear_fp4_bytes,
+        hidden_size,
+        intermediate_size,
+        num_experts,
+    ):
+        from flashinfer import nvfp4_block_scale_interleave
+        from flashinfer.fused_moe.core import (
+            _maybe_get_cached_w2_permute_indices,
+            _maybe_get_cached_w3_w1_permute_indices)
         """Prepare quantized weights for kernel (done offline with weights)."""
-        from flashinfer import (reorder_rows_for_gated_act_gemm,
-                                shuffle_matrix_a, shuffle_matrix_sf_a)
         epilogue_tile_m = 128  # FIXME: this depends on the kernel internals
 
         # Convert quantized weights to proper formats
@@ -1227,48 +1231,54 @@ def prepare_static_weight_layouts_for_trtllm_moe(
                                          intermediate_size //
                                          16)  # fp8 scaling factors
 
-        # Reorder rows of W1 and scales for fused gated activation
-        gemm1_weights_fp4_interleaved = []
-        gemm1_scales_fp4_interleaved = []
-        for i in range(num_experts):
-            gemm1_weights_fp4_interleaved.append(
-                reorder_rows_for_gated_act_gemm(gemm1_weights_fp4[i].clone()))
-            gemm1_scales_fp4_interleaved.append(
-                reorder_rows_for_gated_act_gemm(
-                    gemm1_scales_linear_fp4[i].clone()))
-
-        # Stack weights and scales for all experts
-        gemm1_weights_fp4_interleaved = torch.stack(
-            gemm1_weights_fp4_interleaved).reshape(num_experts,
-                                                   2 * intermediate_size,
-                                                   hidden_size // 2)
-        gemm1_scales_fp4_interleaved = torch.stack(
-            gemm1_scales_fp4_interleaved).reshape(num_experts,
-                                                  2 * intermediate_size,
-                                                  hidden_size // 16)
-
-        # Shuffle weights and scaling factors for transposed mma output
         gemm1_weights_fp4_shuffled = []
         gemm1_scales_fp4_shuffled = []
         gemm2_weights_fp4_shuffled = []
         gemm2_scales_fp4_shuffled = []
         for i in range(num_experts):
-            gemm1_weights_fp4_shuffled.append(
-                shuffle_matrix_a(
-                    gemm1_weights_fp4_interleaved[i].view(torch.uint8),
-                    epilogue_tile_m))
+            # Calculate the permute indices for the following:
+            # 1. Reorder rows of W1 and scales for fused gated activation
+            # 2. Shuffle weights and scaling factors for transposed mma output
+            # for both w3_w1 and w2 weights and scale factors
+            permute_indices = _maybe_get_cached_w3_w1_permute_indices(
+                self._cache_permute_indices,
+                gemm1_weights_fp4[i].view(torch.uint8),
+                epilogue_tile_m,
+            )
+            gemm1_weights_fp4_shuffled.append(gemm1_weights_fp4[i].view(
+                torch.uint8)[permute_indices.to(
+                    gemm1_weights_fp4.device)].contiguous())
+
+            permute_sf_indices = _maybe_get_cached_w3_w1_permute_indices(
+                self._cache_permute_indices,
+                gemm1_scales_linear_fp4[i].view(torch.uint8),
+                epilogue_tile_m,
+                num_elts_per_sf=16,
+            )
             gemm1_scales_fp4_shuffled.append(
-                shuffle_matrix_sf_a(
-                    gemm1_scales_fp4_interleaved[i].view(torch.uint8),
-                    epilogue_tile_m))
-
-            gemm2_weights_fp4_shuffled.append(
-                shuffle_matrix_a(gemm2_weights_fp4[i].view(torch.uint8),
-                                 epilogue_tile_m))
+                nvfp4_block_scale_interleave(gemm1_scales_linear_fp4[i].view(
+                    torch.uint8)[permute_sf_indices.to(
+                        gemm1_scales_linear_fp4.device)].contiguous()))
+
+            permute_indices = _maybe_get_cached_w2_permute_indices(
+                self._cache_permute_indices,
+                gemm2_weights_fp4[i].view(torch.uint8),
+                epilogue_tile_m,
+            )
+            gemm2_weights_fp4_shuffled.append(gemm2_weights_fp4[i].view(
+                torch.uint8)[permute_indices.to(
+                    gemm2_weights_fp4.device)].contiguous())
+
+            permute_sf_indices = _maybe_get_cached_w2_permute_indices(
+                self._cache_permute_indices,
+                gemm2_scales_linear_fp4[i].view(torch.uint8),
+                epilogue_tile_m,
+                num_elts_per_sf=16,
+            )
             gemm2_scales_fp4_shuffled.append(
-                shuffle_matrix_sf_a(
-                    gemm2_scales_linear_fp4[i].view(torch.uint8),
-                    epilogue_tile_m))
+                nvfp4_block_scale_interleave(gemm2_scales_linear_fp4[i].view(
+                    torch.uint8)[permute_sf_indices.to(
+                        gemm2_scales_linear_fp4.device)].contiguous()))
 
         # Stack weights for all experts
         gemm1_weights_fp4_shuffled = torch.stack(gemm1_weights_fp4_shuffled)
@@ -1283,8 +1293,12 @@ def prepare_static_weight_layouts_for_trtllm_moe(
             torch.stack(gemm2_scales_fp4_shuffled).view(
                 torch.float8_e4m3fn).reshape(num_experts, hidden_size,
                                              intermediate_size // 16))
-        return (gemm1_weights_fp4_shuffled, gemm1_scales_fp4_shuffled,
-                gemm2_weights_fp4_shuffled, gemm2_scales_fp4_shuffled)
+        return (
+            gemm1_weights_fp4_shuffled,
+            gemm1_scales_fp4_shuffled,
+            gemm2_weights_fp4_shuffled,
+            gemm2_scales_fp4_shuffled,
+        )
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         # GEMM 1 processing
@@ -1334,9 +1348,10 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         if self.allow_flashinfer and \
             self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM:
             # Prepare static weights for TRT-LLM kernel
+            # alternate: prepare_static_weight_layouts_for_trtllm_moe
             (gemm1_weights_fp4_shuffled, gemm1_scales_fp4_shuffled,
              gemm2_weights_fp4_shuffled, gemm2_scales_fp4_shuffled
-             ) = self.prepare_static_weight_layouts_for_trtllm_moe(
+             ) = self.prepare_static_weights_for_trtllm_fp4_moe(
                  layer.w13_weight,
                  layer.w2_weight,
                  layer.w13_weight_scale,
@@ -1345,6 +1360,7 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
                  layer.w13_weight.size(-2) // 2,  # intermediate_size
                  layer.w13_weight.size(0),  # num_experts
              )
+            logger.debug_once("Finished shuffling weights for TRT-LLM MOE")
 
             layer.gemm1_weights_fp4_shuffled = Parameter(
                 gemm1_weights_fp4_shuffled, requires_grad=False)
diff --git a/vllm/model_executor/model_loader/weight_utils.py b/vllm/model_executor/model_loader/weight_utils.py
index bbed43b17543..6c5f7bbcc8aa 100644
--- a/vllm/model_executor/model_loader/weight_utils.py
+++ b/vllm/model_executor/model_loader/weight_utils.py
@@ -1003,12 +1003,18 @@ def maybe_remap_kv_scale_name(name: str, params_dict: dict) -> Optional[str]:
             return None
         return remapped_name
 
+    if any("mla_attn" in key for key in params_dict):
+        attn_str = "mla_attn.mla_attn"
+        logger.debug_once(f"Found mla_attn with k_scale and v_scale in "
+                          f"the checkpoint, using {attn_str} as attn_str")
+    else:
+        attn_str = "attn"
     # Define scale name mapping patterns in order of precedence
     scale_mapping_patterns = [
         # ModelOpt format: .self_attn.{k,v}_proj.{k,v}_scale ->
         # .self_attn.attn.{k,v}_scale
         (r"\.self_attn\.([kv])_proj\.([kv])_scale$",
-         r".self_attn.attn.\2_scale"),
+         rf".self_attn.{attn_str}.\2_scale"),
         # QKV proj format: .self_attn.qkv_proj.{k,v}_scale ->
         # .self_attn.attn.{k,v}_scale
         (r"\.self_attn\.qkv_proj\.([kv])_scale$", r".self_attn.attn.\1_scale"),

From 17546d5078e4c029c0460866313e8bccd0b24ff7 Mon Sep 17 00:00:00 2001
From: Corey Lowman <clowman1993@gmail.com>
Date: Fri, 3 Oct 2025 16:38:50 -0400
Subject: [PATCH 145/193] [Perf] Remove hardcoded num_warps=1 (#26183)

Signed-off-by: Corey Lowman <clowman1993@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/v1/sample/rejection_sampler.py | 7 ++-----
 1 file changed, 2 insertions(+), 5 deletions(-)

diff --git a/vllm/v1/sample/rejection_sampler.py b/vllm/v1/sample/rejection_sampler.py
index 8f0b38ecb34d..37ce5bef8403 100644
--- a/vllm/v1/sample/rejection_sampler.py
+++ b/vllm/v1/sample/rejection_sampler.py
@@ -164,12 +164,12 @@ def rejection_sample(
     assert target_probs.shape == (num_tokens, vocab_size)
 
     # Create output buffer.
-    output_token_ids = torch.empty(
+    output_token_ids = torch.full(
         (batch_size, max_spec_len + 1),
+        PLACEHOLDER_TOKEN_ID,
         dtype=torch.int32,  # Consistent with SamplerOutput.sampled_token_ids.
         device=device,
     )
-    output_token_ids.fill_(PLACEHOLDER_TOKEN_ID)
 
     if sampling_metadata.all_greedy:
         is_greedy = None
@@ -186,7 +186,6 @@ def rejection_sample(
             bonus_token_ids,
             is_greedy,
             max_spec_len,
-            num_warps=1,
         )
         if sampling_metadata.all_greedy:
             return output_token_ids
@@ -227,7 +226,6 @@ def rejection_sample(
         max_spec_len,
         vocab_size,
         NO_DRAFT_PROBS=draft_probs is None,
-        num_warps=1,
     )
     return output_token_ids
 
@@ -329,7 +327,6 @@ def expand_batch_to_tokens(
         replace_from,
         replace_to,
         MAX_NUM_TOKENS=MAX_SPEC_LEN,  # To avoid recompilation.
-        num_warps=1,
     )
     return expanded_x
 

From 3642f77ebb2dddf0763b85eb7525f8e66f70ca14 Mon Sep 17 00:00:00 2001
From: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Date: Fri, 3 Oct 2025 17:23:42 -0400
Subject: [PATCH 146/193] [Refactor] Optimize FP8 MOE Backend Choice and Log
 (#26044)

Signed-off-by: yewentao256 <zhyanwentao@126.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../model_executor/layers/quantization/fp8.py | 117 +++++++++++-------
 1 file changed, 71 insertions(+), 46 deletions(-)

diff --git a/vllm/model_executor/layers/quantization/fp8.py b/vllm/model_executor/layers/quantization/fp8.py
index 9b7b3f18baa7..dbcf4b2fbee5 100644
--- a/vllm/model_executor/layers/quantization/fp8.py
+++ b/vllm/model_executor/layers/quantization/fp8.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
+from enum import Enum
 from typing import TYPE_CHECKING, Any, Callable, Optional, Union
 
 import torch
@@ -68,6 +69,65 @@
 logger = init_logger(__name__)
 
 
+class Fp8MoeBackend(Enum):
+    NONE = 0
+    FLASHINFER_TRTLLM = 1
+    FLASHINFER_CUTLASS = 2
+    DEEPGEMM = 3
+    CUTLASS_BLOCK_SCALED_GROUPED_GEMM = 4
+    MARLIN = 5
+    TRITON = 6
+
+
+def get_fp8_moe_backend(block_quant: bool) -> Fp8MoeBackend:
+    """
+    Select the primary FP8 MoE backend
+    Note: Shape-specific fallbacks may still occur at runtime.
+    """
+    # prefer FlashInfer backends when available and enabled on supported GPUs
+    if (current_platform.is_cuda()
+            and current_platform.is_device_capability(100)
+            and envs.VLLM_USE_FLASHINFER_MOE_FP8 and has_flashinfer_moe()):
+        backend = get_flashinfer_moe_backend()
+        if backend == FlashinferMoeBackend.TENSORRT_LLM:
+            logger.info_once(
+                "Using FlashInfer FP8 MoE TRTLLM backend for SM100")
+            return Fp8MoeBackend.FLASHINFER_TRTLLM
+        else:
+            logger.info_once(
+                "Using FlashInfer FP8 MoE CUTLASS backend for SM100")
+            return Fp8MoeBackend.FLASHINFER_CUTLASS
+
+    # weight-only path for older GPUs without native FP8
+    use_marlin = (not current_platform.has_device_capability(89)
+                  or envs.VLLM_TEST_FORCE_FP8_MARLIN)
+    if current_platform.is_rocm():
+        use_marlin = False
+    if use_marlin:
+        logger.info_once("Using Marlin backend for FP8 MoE")
+        return Fp8MoeBackend.MARLIN
+
+    # deepGEMM on supported platforms with block-quantized weights
+    if envs.VLLM_USE_DEEP_GEMM and block_quant:
+        if not has_deep_gemm():
+            logger.warning_once(
+                "DeepGEMM backend requested but not available.")
+        elif is_deep_gemm_supported():
+            logger.info_once("Using DeepGEMM backend for FP8 MoE")
+            return Fp8MoeBackend.DEEPGEMM
+
+    # CUTLASS BlockScaled GroupedGemm on SM100 with block-quantized weights
+    if (current_platform.is_cuda()
+            and current_platform.is_device_capability(100) and block_quant):
+        logger.info_once(
+            "Using Cutlass BlockScaled GroupedGemm backend for FP8 MoE")
+        return Fp8MoeBackend.CUTLASS_BLOCK_SCALED_GROUPED_GEMM
+
+    # default to Triton
+    logger.info_once("Using Triton backend for FP8 MoE")
+    return Fp8MoeBackend.TRITON
+
+
 class Fp8Config(QuantizationConfig):
     """Config class for FP8."""
 
@@ -453,54 +513,19 @@ def __init__(self, quant_config: Fp8Config, layer: torch.nn.Module):
         self.fused_experts: Optional[
             mk.FusedMoEModularKernel] = None  # type: ignore
 
-        # For GPUs that lack FP8 hardware support, we can leverage the Marlin
-        # kernel for fast weight-only FP8 quantization
-        self.use_marlin = (not current_platform.has_device_capability(89)
-                           or envs.VLLM_TEST_FORCE_FP8_MARLIN)
-        # Disable marlin for rocm
-        if current_platform.is_rocm():
-            self.use_marlin = False
+        self.fp8_backend = get_fp8_moe_backend(self.block_quant)
 
-        # First check for Flashinfer MOE on Blackwell GPUs
+        self.use_marlin = (self.fp8_backend == Fp8MoeBackend.MARLIN)
         self.flashinfer_moe_backend: Optional[FlashinferMoeBackend] = None
-        if (current_platform.is_cuda()
-                and current_platform.is_device_capability(100)
-                and envs.VLLM_USE_FLASHINFER_MOE_FP8 and has_flashinfer_moe()):
-            self.flashinfer_moe_backend = get_flashinfer_moe_backend()
-            logger.info_once(
-                f"Detected Blackwell GPUs, using FlashInfer "
-                f"{self.flashinfer_moe_backend.value} kernels for FP8 MOE.")
-
-        # Check for DeepGemm support.
-        self.allow_deep_gemm = False
-        if envs.VLLM_USE_DEEP_GEMM:
-            if not has_deep_gemm():
-                logger.warning_once("Failed to import DeepGemm kernels.")
-            elif not self.block_quant:
-                logger.warning_once("Model is not block quantized. Not using"
-                                    " DeepGemm kernels")
-            elif self.flashinfer_moe_backend:
-                logger.info_once("DeepGemm disabled: FlashInfer MOE is"
-                                 " enabled.")
-            elif (is_deep_gemm_supported()):
-                logger.debug_once(
-                    "DeepGemm kernels available for Fp8MoEMethod.")
-                self.allow_deep_gemm = True
-            else:
-                logger.warning_once(
-                    "DeepGemm not supported on the current platform.")
-
-        # Check for CutlassBlockScaledGroupedGemm support.
-        self.allow_cutlass_block_scaled_grouped_gemm = False
-        if not self.block_quant:
-            logger.debug_once("Model is not block quantized. Not using "
-                              "CutlassBlockScaledGroupedGemm kernels")
-        elif (current_platform.is_cuda()
-              and current_platform.is_device_capability(100)
-              and not self.flashinfer_moe_backend):
-            logger.debug_once(
-                "CutlassBlockScaledGroupedGemm available for Fp8MoEMethod.")
-            self.allow_cutlass_block_scaled_grouped_gemm = True
+        if self.fp8_backend == Fp8MoeBackend.FLASHINFER_TRTLLM:
+            self.flashinfer_moe_backend = FlashinferMoeBackend.TENSORRT_LLM
+        elif self.fp8_backend == Fp8MoeBackend.FLASHINFER_CUTLASS:
+            self.flashinfer_moe_backend = FlashinferMoeBackend.CUTLASS
+
+        self.allow_deep_gemm = (self.fp8_backend == Fp8MoeBackend.DEEPGEMM)
+        self.allow_cutlass_block_scaled_grouped_gemm = (
+            self.fp8_backend == Fp8MoeBackend.CUTLASS_BLOCK_SCALED_GROUPED_GEMM
+        )
 
     def create_weights(self, layer: Module, num_experts: int, hidden_size: int,
                        intermediate_size_per_partition: int,

From 674a6cdf255a6c6e30a49dd747778211b0061c2d Mon Sep 17 00:00:00 2001
From: Andrew Xia <axia@meta.com>
Date: Fri, 3 Oct 2025 14:33:13 -0700
Subject: [PATCH 147/193] [responsesAPI] add better error messaging for long
 prompts (#25724)

Signed-off-by: Andrew Xia <axia@meta.com>
Signed-off-by: Andrew Xia <axia@fb.com>
Co-authored-by: Andrew Xia <axia@fb.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../openai/test_serving_responses.py          | 63 ++++++++++++++++++-
 vllm/entrypoints/openai/serving_responses.py  | 22 +++++++
 2 files changed, 84 insertions(+), 1 deletion(-)

diff --git a/tests/entrypoints/openai/test_serving_responses.py b/tests/entrypoints/openai/test_serving_responses.py
index 0cce88016092..58d92f72dfae 100644
--- a/tests/entrypoints/openai/test_serving_responses.py
+++ b/tests/entrypoints/openai/test_serving_responses.py
@@ -8,9 +8,10 @@
 import pytest_asyncio
 
 from vllm.entrypoints.context import ConversationContext
-from vllm.entrypoints.openai.protocol import ResponsesRequest
+from vllm.entrypoints.openai.protocol import ErrorResponse, ResponsesRequest
 from vllm.entrypoints.openai.serving_responses import OpenAIServingResponses
 from vllm.entrypoints.tool_server import ToolServer
+from vllm.inputs.data import TokensPrompt as EngineTokensPrompt
 
 
 class MockConversationContext(ConversationContext):
@@ -127,3 +128,63 @@ async def test_initialize_tool_sessions(self, serving_responses_instance,
 
         # Verify that init_tool_sessions was called
         assert mock_context.init_tool_sessions_called
+
+
+class TestValidateGeneratorInput:
+    """Test class for _validate_generator_input method"""
+
+    @pytest_asyncio.fixture
+    async def serving_responses_instance(self):
+        """Create a real OpenAIServingResponses instance for testing"""
+        # Create minimal mocks for required dependencies
+        engine_client = MagicMock()
+        engine_client.get_model_config = AsyncMock()
+
+        model_config = MagicMock()
+        model_config.hf_config.model_type = "test"
+        model_config.get_diff_sampling_param.return_value = {}
+
+        models = MagicMock()
+
+        # Create the actual instance
+        instance = OpenAIServingResponses(
+            engine_client=engine_client,
+            model_config=model_config,
+            models=models,
+            request_logger=None,
+            chat_template=None,
+            chat_template_content_format="auto",
+        )
+
+        # Set max_model_len for testing
+        instance.max_model_len = 100
+
+        return instance
+
+    def test_validate_generator_input(self, serving_responses_instance):
+        """Test _validate_generator_input with valid prompt length"""
+        # Create an engine prompt with valid length (less than max_model_len)
+        valid_prompt_token_ids = list(range(5))  # 5 tokens < 100 max_model_len
+        engine_prompt = EngineTokensPrompt(
+            prompt_token_ids=valid_prompt_token_ids)
+
+        # Call the method
+        result = serving_responses_instance._validate_generator_input(
+            engine_prompt)
+
+        # Should return None for valid input
+        assert result is None
+
+        # create an invalid engine prompt
+        invalid_prompt_token_ids = list(
+            range(200))  # 100 tokens >= 100 max_model_len
+        engine_prompt = EngineTokensPrompt(
+            prompt_token_ids=invalid_prompt_token_ids)
+
+        # Call the method
+        result = serving_responses_instance._validate_generator_input(
+            engine_prompt)
+
+        # Should return an ErrorResponse
+        assert result is not None
+        assert isinstance(result, ErrorResponse)
diff --git a/vllm/entrypoints/openai/serving_responses.py b/vllm/entrypoints/openai/serving_responses.py
index 4e7418920954..faaed2fca392 100644
--- a/vllm/entrypoints/openai/serving_responses.py
+++ b/vllm/entrypoints/openai/serving_responses.py
@@ -192,6 +192,23 @@ def __init__(
 
         self.tool_server = tool_server
 
+    def _validate_generator_input(
+            self,
+            engine_prompt: EngineTokensPrompt) -> Optional[ErrorResponse]:
+        """Add validations to the input to the generator here."""
+        if self.max_model_len <= len(engine_prompt["prompt_token_ids"]):
+            error_message = (
+                "The engine prompt length"
+                f" {len(engine_prompt['prompt_token_ids'])} "
+                f"exceeds the max_model_len {self.max_model_len}. "
+                "Please reduce prompt.")
+            return self.create_error_response(
+                err_type="invalid_request_error",
+                message=error_message,
+                status_code=HTTPStatus.BAD_REQUEST,
+            )
+        return None
+
     async def create_responses(
         self,
         request: ResponsesRequest,
@@ -287,8 +304,13 @@ async def create_responses(
             available_tools = []
         try:
             for i, engine_prompt in enumerate(engine_prompts):
+                maybe_error = self._validate_generator_input(engine_prompt)
+                if maybe_error is not None:
+                    return maybe_error
+
                 default_max_tokens = self.max_model_len - len(
                     engine_prompt["prompt_token_ids"])
+
                 sampling_params = request.to_sampling_params(
                     default_max_tokens, self.default_sampling_params)
 

From a0862bfa3befdfe661b65e69d51fb19fdde3f5e2 Mon Sep 17 00:00:00 2001
From: Bowen Bao <bowenbao@amd.com>
Date: Fri, 3 Oct 2025 15:31:59 -0700
Subject: [PATCH 148/193] [Bugfix] Relax tokenizer regex for mixtral to include
 'tokenizer.model' (#25964)

Signed-off-by: Bowen Bao <bowenbao@amd.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/transformers_utils/tokenizers/mistral.py | 16 +++++++++++-----
 1 file changed, 11 insertions(+), 5 deletions(-)

diff --git a/vllm/transformers_utils/tokenizers/mistral.py b/vllm/transformers_utils/tokenizers/mistral.py
index d8a8d19391cd..ed9f28d54448 100644
--- a/vllm/transformers_utils/tokenizers/mistral.py
+++ b/vllm/transformers_utils/tokenizers/mistral.py
@@ -122,15 +122,21 @@ def list_local_repo_files(repo_id: str, revision: Optional[str]) -> list[str]:
 
 
 def find_tokenizer_file(files: list[str]):
+    # Accept both versioned (tokenizer.model.v3) and unversioned
+    # (tokenizer.model) forms, plus tekken.json and tokenizer.mm.model
+    # variants. Previous pattern only matched the versioned variants.
     file_pattern = re.compile(
-        r"^tokenizer\.model\.v.*$|^tekken\.json$|^tokenizer\.mm\.model\.v.*$")
+        r"^tokenizer\.model(\.v.*)?|tekken\.json|tokenizer\.mm\.model(\.v.*)?$"
+    )
 
     matched_files = [file for file in files if file_pattern.match(file)]
     if len(matched_files) > 1:
-        raise OSError(
-            f"Found {len(matched_files)} files matching the "
-            f"pattern: `{file_pattern.pattern}`. Make sure only one Mistral "
-            f"tokenizer is present in {files}.")
+        logger.warning(
+            "Multiple files matched pattern `%s`: %s. Using %s.",
+            file_pattern.pattern,
+            matched_files,
+            matched_files[0],
+        )
     elif len(matched_files) == 0:
         raise OSError(
             f"Found {len(matched_files)} files matching the "

From 35ea5afdd586bc2b01630bf1075682ca5e27f5dd Mon Sep 17 00:00:00 2001
From: Sahithi Chigurupati <58884509+csahithi@users.noreply.github.com>
Date: Fri, 3 Oct 2025 15:42:55 -0700
Subject: [PATCH 149/193] [CI] Push multiarch manifests as nightly builds
 (#25764)

Signed-off-by: Sahithi Chigurupati <chigurupati.sahithi@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .buildkite/release-pipeline.yaml             | 16 +++++++----
 .buildkite/scripts/cleanup-nightly-builds.sh | 29 ++++++++++++++++++--
 2 files changed, 37 insertions(+), 8 deletions(-)

diff --git a/.buildkite/release-pipeline.yaml b/.buildkite/release-pipeline.yaml
index 7677d783fabc..9cee502015c7 100644
--- a/.buildkite/release-pipeline.yaml
+++ b/.buildkite/release-pipeline.yaml
@@ -150,11 +150,16 @@ steps:
       queue: cpu_queue_postmerge
     commands:
       - "aws ecr-public get-login-password --region us-east-1 | docker login --username AWS --password-stdin public.ecr.aws/q9t5s3a7"
-      - "docker pull public.ecr.aws/q9t5s3a7/vllm-release-repo:$BUILDKITE_COMMIT"
-      - "docker tag public.ecr.aws/q9t5s3a7/vllm-release-repo:$BUILDKITE_COMMIT vllm/vllm-openai:nightly"
-      - "docker tag public.ecr.aws/q9t5s3a7/vllm-release-repo:$BUILDKITE_COMMIT vllm/vllm-openai:nightly-$BUILDKITE_COMMIT"
-      - "docker push vllm/vllm-openai:nightly"
-      - "docker push vllm/vllm-openai:nightly-$BUILDKITE_COMMIT"
+      - "docker pull public.ecr.aws/q9t5s3a7/vllm-release-repo:$BUILDKITE_COMMIT-x86_64"
+      - "docker pull public.ecr.aws/q9t5s3a7/vllm-release-repo:$BUILDKITE_COMMIT-aarch64"
+      - "docker tag public.ecr.aws/q9t5s3a7/vllm-release-repo:$BUILDKITE_COMMIT-x86_64 vllm/vllm-openai:nightly-x86_64"
+      - "docker tag public.ecr.aws/q9t5s3a7/vllm-release-repo:$BUILDKITE_COMMIT-aarch64 vllm/vllm-openai:nightly-aarch64"
+      - "docker push vllm/vllm-openai:nightly-x86_64"
+      - "docker push vllm/vllm-openai:nightly-aarch64"
+      - "docker manifest create vllm/vllm-openai:nightly vllm/vllm-openai:nightly-x86_64 vllm/vllm-openai:nightly-aarch64 --amend"
+      - "docker manifest create vllm/vllm-openai:nightly-$BUILDKITE_COMMIT vllm/vllm-openai:nightly-x86_64 vllm/vllm-openai:nightly-aarch64 --amend"
+      - "docker manifest push vllm/vllm-openai:nightly"
+      - "docker manifest push vllm/vllm-openai:nightly-$BUILDKITE_COMMIT"
       # Clean up old nightly builds (keep only last 14)
       - "bash .buildkite/scripts/cleanup-nightly-builds.sh"
     plugins:
@@ -163,3 +168,4 @@ steps:
           password-env: DOCKERHUB_TOKEN
     env:
       DOCKER_BUILDKIT: "1"
+      DOCKERHUB_USERNAME: "vllmbot"
diff --git a/.buildkite/scripts/cleanup-nightly-builds.sh b/.buildkite/scripts/cleanup-nightly-builds.sh
index 1a82f7d08523..f02a128c6772 100755
--- a/.buildkite/scripts/cleanup-nightly-builds.sh
+++ b/.buildkite/scripts/cleanup-nightly-builds.sh
@@ -8,20 +8,41 @@ set -ex
 # DockerHub API endpoint for vllm/vllm-openai repository
 REPO_API_URL="https://hub.docker.com/v2/repositories/vllm/vllm-openai/tags"
 
-# Get DockerHub token from environment
+# Get DockerHub credentials from environment
 if [ -z "$DOCKERHUB_TOKEN" ]; then
     echo "Error: DOCKERHUB_TOKEN environment variable is not set"
     exit 1
 fi
 
+if [ -z "$DOCKERHUB_USERNAME" ]; then
+    echo "Error: DOCKERHUB_USERNAME environment variable is not set"
+    exit 1
+fi
+
+# Get DockerHub bearer token
+echo "Getting DockerHub bearer token..."
+set +x
+BEARER_TOKEN=$(curl -s -X POST \
+    -H "Content-Type: application/json" \
+    -d "{\"username\": \"$DOCKERHUB_USERNAME\", \"password\": \"$DOCKERHUB_TOKEN\"}" \
+    "https://hub.docker.com/v2/users/login" | jq -r '.token')
+set -x
+
+if [ -z "$BEARER_TOKEN" ] || [ "$BEARER_TOKEN" = "null" ]; then
+    echo "Error: Failed to get DockerHub bearer token"
+    exit 1
+fi
+
 # Function to get all tags from DockerHub
 get_all_tags() {
     local page=1
     local all_tags=""
     
     while true; do
-        local response=$(curl -s -H "Authorization: Bearer $DOCKERHUB_TOKEN" \
+        set +x
+        local response=$(curl -s -H "Authorization: Bearer $BEARER_TOKEN" \
             "$REPO_API_URL?page=$page&page_size=100")
+        set -x
         
         # Get both last_updated timestamp and tag name, separated by |
         local tags=$(echo "$response" | jq -r '.results[] | select(.name | startswith("nightly-")) | "\(.last_updated)|\(.name)"')
@@ -43,7 +64,9 @@ delete_tag() {
     echo "Deleting tag: $tag_name"
     
     local delete_url="https://hub.docker.com/v2/repositories/vllm/vllm-openai/tags/$tag_name"
-    local response=$(curl -s -X DELETE -H "Authorization: Bearer $DOCKERHUB_TOKEN" "$delete_url")
+    set +x
+    local response=$(curl -s -X DELETE -H "Authorization: Bearer $BEARER_TOKEN" "$delete_url")
+    set -x
     
     if echo "$response" | jq -e '.detail' > /dev/null 2>&1; then
         echo "Warning: Failed to delete tag $tag_name: $(echo "$response" | jq -r '.detail')"

From 0ee10398448f173a75b228a3196efbe8248ddeb9 Mon Sep 17 00:00:00 2001
From: Sergei Skvortsov <yvorott@gmail.com>
Date: Fri, 3 Oct 2025 23:43:14 +0100
Subject: [PATCH 150/193] [Misc] Add penalties sampling parameters to serve
 tool (#25974)

Signed-off-by: Sergei Skvortsov <sergeyskv@nebius.com>
Co-authored-by: Sergei Skvortsov <sergeyskv@nebius.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/benchmarks/serve.py | 24 ++++++++++++++++++++++++
 1 file changed, 24 insertions(+)

diff --git a/vllm/benchmarks/serve.py b/vllm/benchmarks/serve.py
index a327e711c208..2371bbf27079 100644
--- a/vllm/benchmarks/serve.py
+++ b/vllm/benchmarks/serve.py
@@ -1077,6 +1077,27 @@ def add_cli_args(parser: argparse.ArgumentParser):
         "openai-compatible backends. If not specified, default to greedy "
         "decoding (i.e. temperature==0.0).",
     )
+    sampling_group.add_argument(
+        "--frequency-penalty",
+        type=float,
+        default=None,
+        help="Frequency penalty sampling parameter. Only has effect on "
+        "openai-compatible backends.",
+    )
+    sampling_group.add_argument(
+        "--presence-penalty",
+        type=float,
+        default=None,
+        help="Presence penalty sampling parameter. Only has effect on "
+        "openai-compatible backends.",
+    )
+    sampling_group.add_argument(
+        "--repetition-penalty",
+        type=float,
+        default=None,
+        help="Repetition penalty sampling parameter. Only has effect on "
+        "openai-compatible backends.",
+    )
 
     parser.add_argument(
         '--tokenizer-mode',
@@ -1211,6 +1232,9 @@ async def main_async(args: argparse.Namespace) -> dict[str, Any]:
             "top_k": args.top_k,
             "min_p": args.min_p,
             "temperature": args.temperature,
+            "frequency_penalty": args.frequency_penalty,
+            "presence_penalty": args.presence_penalty,
+            "repetition_penalty": args.repetition_penalty,
         }.items() if v is not None
     }
 

From f68af1486c88ba80d242e6d2c2436b2c91f445e6 Mon Sep 17 00:00:00 2001
From: Angela Yi <yiangela7@gmail.com>
Date: Fri, 3 Oct 2025 15:44:18 -0700
Subject: [PATCH 151/193] [BugFix] Fix de-functionalization pass for
 rotary_embedding (#23953)

Signed-off-by: angelayi <yiangela7@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .buildkite/test-pipeline.yaml             |   1 +
 tests/compile/test_functionalization.py   | 298 +++++++++++++++++-----
 vllm/compilation/fix_functionalization.py |  54 ++--
 3 files changed, 266 insertions(+), 87 deletions(-)

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index c131192c56fc..9c200a577167 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -397,6 +397,7 @@ steps:
     - pytest -v -s compile/test_pass_manager.py
     - pytest -v -s compile/test_fusion.py
     - pytest -v -s compile/test_fusion_attn.py
+    - pytest -v -s compile/test_functionalization.py
     - pytest -v -s compile/test_silu_mul_quant_fusion.py
     - pytest -v -s compile/test_sequence_parallelism.py
     - pytest -v -s compile/test_async_tp.py
diff --git a/tests/compile/test_functionalization.py b/tests/compile/test_functionalization.py
index 2ee9aa7476be..0c8d610bc9c5 100644
--- a/tests/compile/test_functionalization.py
+++ b/tests/compile/test_functionalization.py
@@ -5,54 +5,237 @@
 import torch
 
 import vllm.envs as envs
-from vllm import LLM, SamplingParams
 from vllm.compilation.activation_quant_fusion import ActivationQuantFusionPass
 from vllm.compilation.fix_functionalization import FixFunctionalizationPass
-from vllm.compilation.fusion import FUSED_OPS, RMSNormQuantFusionPass
+from vllm.compilation.fusion import RMSNormQuantFusionPass
 from vllm.compilation.fx_utils import find_auto_fn, find_auto_fn_maybe, is_func
 from vllm.compilation.noop_elimination import NoOpEliminationPass
 from vllm.compilation.post_cleanup import PostCleanupPass
 from vllm.config import CompilationConfig, PassConfig, VllmConfig
+from vllm.model_executor.layers.activation import SiluAndMul
+from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    QuantKey, kFp8DynamicTokenSym, kFp8StaticTensorSym)
+    GroupShape)
+from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
+    Fp8LinearOp)
+from vllm.model_executor.layers.rotary_embedding import get_rope
+from vllm.platforms import current_platform
 
 from .backend import TestBackend
 
-OPS_IN_MODEL = [
-    torch.ops._C.rotary_embedding.default,
-    torch.ops._C.fused_add_rms_norm.default,
-]
+TEST_FP8 = current_platform.supports_fp8()
+FP8_DTYPE = current_platform.fp8_dtype()
+
+
+class TestSiluMul(torch.nn.Module):
+
+    def __init__(self, hidden_size: int = 128):
+        super().__init__()
+        self.silu_and_mul = SiluAndMul()
+        self.wscale = torch.rand(1, dtype=torch.float32)
+        self.scale = torch.rand(1, dtype=torch.float32)
+
+        if TEST_FP8:
+            self.w = torch.rand(hidden_size,
+                                hidden_size).to(dtype=FP8_DTYPE).t()
+            self.fp8_linear = Fp8LinearOp(
+                act_quant_static=True,
+                act_quant_group_shape=GroupShape.PER_TENSOR,
+            )
+
+    def forward(self, x):
+        y = self.silu_and_mul(x)
+        if TEST_FP8:
+            x2 = self.fp8_linear.apply(y,
+                                       self.w,
+                                       self.wscale,
+                                       input_scale=self.wscale)
+            return x2
+        else:
+            return y
+
+    def example_inputs(self, num_tokens=32, hidden_size=128):
+        dtype = torch.float16 if TEST_FP8 else torch.float32
+        return (torch.rand(num_tokens, hidden_size * 2, dtype=dtype), )
+
+    def ops_in_model(self, do_fusion):
+        if TEST_FP8 and do_fusion:
+            return [torch.ops._C.silu_and_mul_quant.default]
+        else:
+            return [torch.ops._C.silu_and_mul.default]
+
+    def ops_not_in_model(self):
+        return []
+
+
+class TestFusedAddRMSNorm(torch.nn.Module):
+
+    def __init__(self, hidden_size=16, intermediate_size=32):
+        super().__init__()
+        self.hidden_size = hidden_size
+        self.intermediate_size = intermediate_size
+
+        dtype = torch.float16 if TEST_FP8 else torch.float32
+
+        self.gate_proj = torch.nn.Parameter(
+            torch.empty((intermediate_size, hidden_size), dtype=dtype))
+        self.norm = RMSNorm(intermediate_size, 1e-05)
+        self.norm.weight = torch.nn.Parameter(
+            torch.ones(intermediate_size, dtype=dtype))
+
+        torch.nn.init.normal_(self.gate_proj, std=0.02)
+
+        if TEST_FP8:
+            self.fp8_linear = Fp8LinearOp(act_quant_static=True)
+
+            self.scale = torch.rand(1, dtype=torch.float32)
+            self.w = torch.rand(hidden_size,
+                                intermediate_size).to(dtype=FP8_DTYPE).t()
+            self.wscale = torch.rand(1, dtype=torch.float32)
+
+    def forward(self, hidden_states, residual):
+        # Reshape input
+        view = hidden_states.reshape(-1, self.hidden_size)
+
+        # matrix multiplication
+        permute = self.gate_proj.permute(1, 0)
+        mm = torch.mm(view, permute)
+
+        # layer normalization
+        norm_output, residual_output = self.norm(mm, residual)
+
+        if TEST_FP8:
+            # scaled_mm with static input quantization
+            fp8_linear_result = self.fp8_linear.apply(
+                norm_output,
+                self.w,
+                self.wscale,
+                input_scale=self.scale.to(norm_output.device),
+            )
+
+            return fp8_linear_result, residual_output
+
+        else:
+            return norm_output, residual_output
+
+    def example_inputs(self, batch_size=8, hidden_size=16, seq_len=16):
+        dtype = torch.float16 if TEST_FP8 else torch.float32
+        hidden_states = torch.randn((batch_size * seq_len, hidden_size),
+                                    dtype=dtype)
+        residual = torch.randn((batch_size * seq_len, hidden_size),
+                               dtype=dtype)
+        return (hidden_states, residual)
 
-RMS_OP = torch.ops._C.rms_norm.default
+    def ops_in_model(self, do_fusion):
+        if TEST_FP8 and do_fusion:
+            return [torch.ops._C.fused_add_rms_norm_static_fp8_quant.default]
+        else:
+            return [torch.ops._C.fused_add_rms_norm.default]
 
-RMS_QUANT_OPS = {
-    "static_fp8": [
-        torch.ops._C.rms_norm_static_fp8_quant.default,
-        torch.ops._C.fused_add_rms_norm_static_fp8_quant.default
-    ],
-}
+    def ops_not_in_model(self):
+        return []
 
-SILU_MUL_OP = torch.ops._C.silu_and_mul.default
 
-SILU_MUL_QUANT_OP = torch.ops._C.silu_and_mul_quant.default
-prompts = [
-    "Hello, my name is",
-    "The president of the United States is",
-    "The capital of France is",
-    "The future of AI is",
+class TestRotaryEmbedding(torch.nn.Module):
+
+    def __init__(self,
+                 head_dim=64,
+                 rotary_dim=None,
+                 max_position=2048,
+                 base=10000):
+        super().__init__()
+        self.head_dim = head_dim
+        self.rotary_dim = rotary_dim or head_dim
+
+        self.rotary_emb = get_rope(
+            self.head_dim,
+            rotary_dim=self.rotary_dim,
+            max_position=max_position,
+            base=base,
+        )
+
+    def forward(self, positions, q, k):
+        q_rotated, k_rotated = self.rotary_emb(positions, q, k)
+        return q_rotated, k_rotated
+
+    def example_inputs(self, num_tokens=32, head_dim=64):
+        dtype = torch.float16
+        positions = torch.arange(num_tokens, dtype=torch.long)
+        q = torch.randn(num_tokens, head_dim, dtype=dtype)
+        k = torch.randn(num_tokens, head_dim, dtype=dtype)
+        return (positions, q, k)
+
+    def ops_in_model(self, do_fusion):
+        return [torch.ops._C.rotary_embedding.default]
+
+    def ops_not_in_model(self):
+        return []
+
+
+class TestRotaryEmbeddingSliceScatter(torch.nn.Module):
+
+    def __init__(self,
+                 head_dim=64,
+                 num_heads=4,
+                 max_position=2048,
+                 base=10000):
+        super().__init__()
+        self.head_dim = head_dim
+        self.num_heads = num_heads
+        self.hidden_size = head_dim * num_heads
+
+        self.qkv_proj = torch.nn.Linear(self.hidden_size,
+                                        self.hidden_size * 3,
+                                        bias=False,
+                                        dtype=torch.float16)
+
+        self.rotary_emb = get_rope(
+            self.head_dim,
+            rotary_dim=self.head_dim,
+            max_position=max_position,
+            base=base,
+        )
+
+    def forward(self, positions, hidden_states):
+        # Simulate the pattern: mm -> split_with_sizes -> rotary_embedding
+        # -> slice_scatter -> split_with_sizes
+
+        qkv = self.qkv_proj(hidden_states)
+        split_sizes = [self.hidden_size, self.hidden_size, self.hidden_size]
+        q, k, v = torch.split(qkv, split_sizes, dim=-1)
+
+        q_rotated, k_rotated = self.rotary_emb(positions, q, k)
+
+        qkv_updated = torch.cat([q_rotated, k_rotated, v], dim=-1)
+        return qkv_updated
+
+    def example_inputs(self, num_tokens=32, head_dim=64, num_heads=4):
+        dtype = torch.float16
+        hidden_size = head_dim * num_heads
+        positions = torch.arange(num_tokens, dtype=torch.long)
+        hidden_states = torch.randn(num_tokens, hidden_size, dtype=dtype)
+        return (positions, hidden_states)
+
+    def ops_in_model(self, do_fusion):
+        return [torch.ops._C.rotary_embedding.default]
+
+    def ops_not_in_model(self):
+        return [torch.ops.aten.slice_scatter.default]
+
+
+MODELS = [
+    TestSiluMul,
+    TestFusedAddRMSNorm,
+    TestRotaryEmbedding,
+    TestRotaryEmbeddingSliceScatter,
 ]
 
 
-@pytest.mark.parametrize(
-    "model, quant_key",
-    [("nm-testing/TinyLlama-1.1B-Chat-v1.0-FP8-e2e", kFp8StaticTensorSym),
-     ("nm-testing/TinyLlama-1.1B-Chat-v1.0-FP8_DYNAMIC-e2e",
-      kFp8DynamicTokenSym)])
+@pytest.mark.parametrize("model_class", MODELS)
 @pytest.mark.parametrize("do_fusion", [True, False])
 @pytest.mark.skipif(envs.VLLM_TARGET_DEVICE != "cuda",
                     reason="Only test on CUDA")
-def test_fix_functionalization(model: str, quant_key: QuantKey,
-                               do_fusion: bool):
+def test_fix_functionalization(model_class: torch.nn.Module, do_fusion: bool):
     torch.set_default_device("cuda")
 
     vllm_config = VllmConfig()
@@ -63,56 +246,31 @@ def test_fix_functionalization(model: str, quant_key: QuantKey,
     cleanup_pass = PostCleanupPass(vllm_config)
     act_quant_fusion_pass = ActivationQuantFusionPass(vllm_config)
 
-    passes = [noop_pass, fusion_pass, act_quant_fusion_pass, cleanup_pass
-              ] if do_fusion else [noop_pass, cleanup_pass]
+    passes = ([noop_pass, fusion_pass, act_quant_fusion_pass, cleanup_pass]
+              if do_fusion else [noop_pass, cleanup_pass])
     func_pass = FixFunctionalizationPass(vllm_config)
+
     backend_func = TestBackend(*passes, func_pass)
     backend_no_func = TestBackend(*passes)
 
-    # instantiate a full engine and manually compile the model 2x
-    # (with and without FixFunctionalizationPass)
-    llm = LLM(model=model, enforce_eager=True)
-    model_runner = llm.llm_engine.model_executor.driver_worker.model_runner
-    orig_model = model_runner.model
-    # TODO mark inputs dynamic? (currently torch.compile is triggered 4x)
-    # Can only do that by using the decorator but then we'd have to instantiate
-    # 2 LLM instances.
-
-    sampling_params = SamplingParams(temperature=0.0, top_p=1.0)
-    model_runner.model = torch.compile(orig_model,
-                                       fullgraph=True,
-                                       backend=backend_func)
-    gen_func = llm.generate(prompts, sampling_params)
-
-    model_runner.model = torch.compile(orig_model,
-                                       fullgraph=True,
-                                       backend=backend_no_func)
-
-    gen_no_func = llm.generate(prompts, sampling_params)
-
-    for output_func, output_no_func in zip(gen_func, gen_no_func):
-        assert output_func.outputs[0].text == output_no_func.outputs[0].text
-
-    # OPS_IN_MODEL always appear. RMS_OP is fused away if we run fusion,
-    # and replaced by fused quantized ops in RMS_QUANT_OPS.
-    rms_ops = [FUSED_OPS[(quant_key, True)], FUSED_OPS[(quant_key, False)]
-               ] if do_fusion else [RMS_OP]
-    silu_mul_ops = [SILU_MUL_QUANT_OP] if do_fusion and \
-        quant_key == kFp8StaticTensorSym else [
-        SILU_MUL_OP
-    ]
-
-    ops = OPS_IN_MODEL + rms_ops + silu_mul_ops
-
-    for op in ops:
+    model = model_class()
+    torch.compile(model, backend=backend_func)(*model.example_inputs())
+    torch.compile(model, backend=backend_no_func)(*model.example_inputs())
+
+    # check if the functionalization pass is applied
+    for op in model.ops_in_model(do_fusion):
         find_auto_fn(backend_no_func.graph_post_pass.nodes, op)
-        assert find_auto_fn_maybe(backend_func.graph_post_pass.nodes,
-                                  op) is None  # noqa: E501
+        assert (find_auto_fn_maybe(backend_func.graph_post_pass.nodes, op)
+                is None)  # noqa: E501
 
     # make sure the ops were all de-functionalized
     found = dict()
     for node in backend_func.graph_post_pass.nodes:
-        for op in ops:
+        for op in model.ops_in_model(do_fusion):
+            if is_func(node, op):
+                found[op] = True
+        for op in model.ops_not_in_model():
             if is_func(node, op):
                 found[op] = True
-    assert all(found[op] for op in ops)
+    assert all(found[op] for op in model.ops_in_model(do_fusion))
+    assert all(not found.get(op) for op in model.ops_not_in_model())
diff --git a/vllm/compilation/fix_functionalization.py b/vllm/compilation/fix_functionalization.py
index 54403c1f7ca3..ce6db9c1ebca 100644
--- a/vllm/compilation/fix_functionalization.py
+++ b/vllm/compilation/fix_functionalization.py
@@ -46,23 +46,43 @@ def __call__(self, graph: torch.fx.Graph):
 
             if at_target == torch.ops._C.rotary_embedding.default:
                 query = kwargs['query']
-                mm_node = query.args[0].args[0]
-
-                # rotary_embedding is a special case: the two mutating inputs
-                # are query and key, which are slices of mm_node.
-                # While functionalized, results at[1] and at[2] are scattered
-                # back into mm_node. After de-functionalization, we can just
-                # use mm_node directly.
-                for idx, user in self.getitem_users(node).items():
-                    for user_of_getitem in user.users:
-                        if is_func(user_of_getitem,
-                                   torch.ops.aten.slice_scatter.default):
-                            user_of_getitem.replace_all_uses_with(mm_node)
-                            self._remove(user_of_getitem)
-                    self._remove(user)
-
-                self.insert_defunctionalized(graph, node)
-                self._remove(node)
+                key = kwargs['key']
+                getitem_nodes = self.getitem_users(node)
+
+                if (is_func(query, operator.getitem)
+                        and is_func(key, operator.getitem)
+                        and query.args[0] == key.args[0]
+                        and is_func(query.args[0],
+                                    torch.ops.aten.split_with_sizes.default)
+                        and all(
+                            is_func(user, torch.ops.aten.slice_scatter.default)
+                            for getitem_node in getitem_nodes.values()
+                            for user in getitem_node.users)):
+                    # Pattern where query and key are slices of an mm_node.
+                    # While functionalized, results at [1] and [2] are scattered
+                    # back into mm_node. So after de-functionalization, we can
+                    # just use mm_node directly.
+
+                    mm_node = query.args[0].args[0]
+                    for user in getitem_nodes.values():
+                        for user_of_getitem in user.users:
+                            if is_func(user_of_getitem,
+                                       torch.ops.aten.slice_scatter.default):
+                                user_of_getitem.replace_all_uses_with(mm_node)
+                                self._remove(user_of_getitem)
+                        self._remove(user)
+
+                    self.insert_defunctionalized(graph, node)
+                    self._remove(node)
+
+                else:
+                    # Directly replace the auto_functionalize(rotary_embedding)
+                    # with the inplace rotary_embedding. In theory, we shouldn't
+                    # do this blindly, but in practice in vLLM it's ok. The best
+                    # solution is to use auto_functionalization_v2 and then use
+                    # inductor's builtin defunctionalization (reinplacing) pass.
+                    mutated_args = {1: 'query', 2: 'key'}
+                    self.defunctionalize(graph, node, mutated_args)
 
             # rms_norm replacements avoid the most copies for LLaMa.
             elif at_target == torch.ops._C.fused_add_rms_norm.default:

From 43b6959d582c4bb36861e04cb45bf2f8e1ccf7c1 Mon Sep 17 00:00:00 2001
From: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Date: Fri, 3 Oct 2025 19:08:03 -0400
Subject: [PATCH 152/193] [CI] Fix Pre-commit Mypy Error (#26181)

Signed-off-by: yewentao256 <zhyanwentao@126.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/transformers_utils/config.py | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/vllm/transformers_utils/config.py b/vllm/transformers_utils/config.py
index 86345287f988..8d340f88fa25 100644
--- a/vllm/transformers_utils/config.py
+++ b/vllm/transformers_utils/config.py
@@ -515,17 +515,17 @@ def maybe_override_with_speculators(
     from vllm.transformers_utils.configs.speculators.base import (
         SpeculatorsConfig)
 
-    vllm_speculative_config = SpeculatorsConfig.extract_vllm_speculative_config(
+    speculative_config = SpeculatorsConfig.extract_vllm_speculative_config(
         config_dict=config_dict)
 
     # Set the draft model to the speculators model
-    vllm_speculative_config["model"] = model
+    speculative_config["model"] = model
 
     # Override model and tokenizer with the verifier model from config
     verifier_model = speculators_config["verifier"]["name_or_path"]
     model = tokenizer = verifier_model
 
-    return model, tokenizer, vllm_speculative_config
+    return model, tokenizer, speculative_config
 
 
 def get_config(

From 07f7a9ad3518eb523062a9096d1536bd5aa1ae02 Mon Sep 17 00:00:00 2001
From: Varun Sundar Rabindranath <varunsundar08@gmail.com>
Date: Fri, 3 Oct 2025 20:13:13 -0400
Subject: [PATCH 153/193] [GPTOSS][DP/EP][Marlin] Enable GPTOSS DP/EP using
 Marlin kernels (#25488)

Signed-off-by: Varun Sundar Rabindranath <vsundarr@redhat.com>
Co-authored-by: Varun Sundar Rabindranath <vsundarr@redhat.com>
Co-authored-by: mgoin <mgoin64@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/design/moe_kernel_features.md            |   6 +-
 .../layers/fused_moe/batched_deep_gemm_moe.py |   2 +-
 .../layers/fused_moe/cutlass_moe.py           |   2 +-
 .../layers/fused_moe/fused_batched_moe.py     |   2 +-
 .../layers/fused_moe/fused_marlin_moe.py      | 190 +++++++++++++++---
 .../layers/fused_moe/fused_moe.py             |   2 +-
 .../layers/fused_moe/modular_kernel.py        |  90 +++++----
 .../layers/quantization/mxfp4.py              |  61 +++---
 .../layers/quantization/utils/marlin_utils.py |  10 +
 9 files changed, 264 insertions(+), 101 deletions(-)

diff --git a/docs/design/moe_kernel_features.md b/docs/design/moe_kernel_features.md
index 74ed34d0a474..2b195b3dd15d 100644
--- a/docs/design/moe_kernel_features.md
+++ b/docs/design/moe_kernel_features.md
@@ -93,6 +93,8 @@ To be used with a particular `FusedMoEPrepareAndFinalize` sub-class, MoE kernels
 | gpt oss triton               | standard              | N/A              | N/A           | <sup>5</sup>                                                | Y                     | Y       | [`triton_kernel_fused_experts`][vllm.model_executor.layers.fused_moe.gpt_oss_triton_kernels_moe.triton_kernel_fused_experts],</br>[`OAITritonExperts`][vllm.model_executor.layers.fused_moe.gpt_oss_triton_kernels_moe.OAITritonExperts]                                                                    |
 | deep gemm+triton<sup>2</sup> | standard,</br>batched | all<sup>1</sup>  | G(128),A,T    | silu, gelu                                                  | <sup>6</sup>          | Y       | [`TritonOrDeepGemmExperts`][vllm.model_executor.layers.fused_moe.triton_deep_gemm_moe.TritonOrDeepGemmExperts],</br>[`BatchedTritonOrDeepGemmExperts`][vllm.model_executor.layers.fused_moe.batched_triton_or_deep_gemm_moe.BatchedTritonOrDeepGemmExperts]                                                 |
 | marlin                       | standard              | <sup>3</sup>     | <sup>3</sup>  | silu,</br>swigluoai                                         | Y                     | N       | [`fused_marlin_moe`][vllm.model_executor.layers.fused_moe.fused_marlin_moe.fused_marlin_moe]                                                                                                                                                                                                                |
+
+| marlin experts               | standard              | N/A              | N/A           | silu,</br>swigluoai                                         | Y                     | Y       | [`MarlinExperts`][vllm.model_executor.layers.fused_moe.fused_marlin_moe.MarlinExperts]                                                                                                                                                                                                                      |
 | trtllm                       | standard              | mxfp4,</br>nvfp4 | G(16),G(32)   | <sup>5</sup>                                                | N                     | Y       | [`TrtLlmGenExperts`][vllm.model_executor.layers.fused_moe.trtllm_moe.TrtLlmGenExperts]                                                                                                                                                                                                                      |
 | pallas                       | standard              | N/A              | N/A           | silu                                                        | N                     | N       | [`fused_moe`][vllm.model_executor.layers.fused_moe.moe_pallas.fused_moe]                                                                                                                                                                                                                                    |
 | iterative                    | standard              | N/A              | N/A           | silu                                                        | N                     | N       | [`fused_moe`][vllm.model_executor.layers.fused_moe.moe_torch_iterative.fused_moe]                                                                                                                                                                                                                           |
@@ -114,6 +116,6 @@ The following table shows "families" of modular kernels that are intended to wor
 
 | backend                          | `FusedMoEPrepareAndFinalize` subclasses                    | `FusedMoEPermuteExpertsUnpermute` subclasses                                                                               |
 |----------------------------------|------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------|
-| deepep_high_throughput,</br>pplx | `DeepEPHTPrepareAndFinalize`,</br>`PplxPrepareAndFinalize` | `BatchedDeepGemmExperts`,</br>`BatchedTritonExperts`,</br>`BatchedTritonOrDeepGemmExperts`,</br>`CutlassBatchedExpertsFp8` |
-| deepep_low_latency               | `DeepEPLLPrepareAndFinalize`                               | `DeepGemmExperts`,</br>`TritonExperts`,</br>`TritonOrDeepGemmExperts`,</br>`CutlassExpertsFp8`                             |
+| deepep_high_throughput           | `DeepEPHTPrepareAndFinalize`                               |  `DeepGemmExperts`,</br>`TritonExperts`,</br>`TritonOrDeepGemmExperts`,</br>`CutlassExpertsFp8`, </br>`MarlinExperts`      |
+| deepep_low_latency,</br>pplx     | `DeepEPLLPrepareAndFinalize`,</br>`PplxPrepareAndFinalize` |  `BatchedDeepGemmExperts`,</br>`BatchedTritonExperts`,</br>`BatchedTritonOrDeepGemmExperts`,</br>`CutlassBatchedExpertsFp8`|
 | flashinfer                       | `FlashInferCutlassMoEPrepareAndFinalize`                   | `FlashInferExperts`                                                                                                        |
diff --git a/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py b/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py
index cf0b965cc8c5..2017a01475b2 100644
--- a/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py
+++ b/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py
@@ -303,7 +303,7 @@ def apply(
 
         assert w2.size(1) == K
 
-        E, max_num_tokens, N, K, top_k_num = mk._moe_problem_size(
+        E, max_num_tokens, N, K, top_k_num = self.moe_problem_size(
             hidden_states, w1, w2, topk_ids)
 
         workspace1 = _resize_cache(workspace13, (E, max_num_tokens, N))
diff --git a/vllm/model_executor/layers/fused_moe/cutlass_moe.py b/vllm/model_executor/layers/fused_moe/cutlass_moe.py
index 8c2ff580575f..1578e4822765 100644
--- a/vllm/model_executor/layers/fused_moe/cutlass_moe.py
+++ b/vllm/model_executor/layers/fused_moe/cutlass_moe.py
@@ -712,7 +712,7 @@ def apply(
         expert_tokens_meta: Optional[mk.ExpertTokensMetadata],
         apply_router_weight_on_input: bool,
     ):
-        e, m, n, k, _ = mk._moe_problem_size(hidden_states, w1, w2, topk_ids)
+        e, m, n, k, _ = self.moe_problem_size(hidden_states, w1, w2, topk_ids)
         n = w2.shape[2] * 2
 
         run_cutlass_moe_fp4(
diff --git a/vllm/model_executor/layers/fused_moe/fused_batched_moe.py b/vllm/model_executor/layers/fused_moe/fused_batched_moe.py
index e49750bc92b3..fee628eae4d8 100644
--- a/vllm/model_executor/layers/fused_moe/fused_batched_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_batched_moe.py
@@ -906,7 +906,7 @@ def apply(
 
         expert_num_tokens = expert_tokens_meta.expert_num_tokens
 
-        E, max_num_tokens, N, K, top_k_num = mk._moe_problem_size(
+        E, max_num_tokens, N, K, top_k_num = self.moe_problem_size(
             hidden_states, w1, w2, topk_ids)
 
         assert w1.size(0) == E
diff --git a/vllm/model_executor/layers/fused_moe/fused_marlin_moe.py b/vllm/model_executor/layers/fused_moe/fused_marlin_moe.py
index eb12a9b0a233..617d871a5b3d 100644
--- a/vllm/model_executor/layers/fused_moe/fused_marlin_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_marlin_moe.py
@@ -4,11 +4,18 @@
 from typing import Optional
 
 import torch
+from typing_extensions import override
 
 import vllm._custom_ops as ops
+import vllm.model_executor.layers.fused_moe.modular_kernel as mk
+from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.fused_moe.fused_moe import moe_align_block_size
+from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
+    TopKWeightAndReduceNoOP)
+from vllm.model_executor.layers.fused_moe.utils import _resize_cache
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-    marlin_make_workspace_new, maybe_warn_marlin_atomic_add)
+    marlin_make_workspace_new, marlin_moe_intermediate_size,
+    maybe_warn_marlin_atomic_add)
 from vllm.scalar_type import ScalarType, scalar_types
 from vllm.utils import direct_register_custom_op
 
@@ -20,7 +27,7 @@ def fused_marlin_moe(hidden_states: torch.Tensor,
                      bias2: Optional[torch.Tensor],
                      w1_scale: torch.Tensor,
                      w2_scale: torch.Tensor,
-                     gating_output: torch.Tensor,
+                     gating_output: Optional[torch.Tensor],
                      topk_weights: torch.Tensor,
                      topk_ids: torch.Tensor,
                      quant_type_id: int,
@@ -37,7 +44,10 @@ def fused_marlin_moe(hidden_states: torch.Tensor,
                      w1_zeros: Optional[torch.Tensor] = None,
                      w2_zeros: Optional[torch.Tensor] = None,
                      workspace: Optional[torch.Tensor] = None,
+                     intermediate_cache13: Optional[torch.Tensor] = None,
+                     intermediate_cache2: Optional[torch.Tensor] = None,
                      is_k_full: bool = True,
+                     output: Optional[torch.Tensor] = None,
                      inplace: bool = False) -> torch.Tensor:
     """
     This function computes a Mixture of Experts (MoE) layer using two sets of
@@ -49,8 +59,8 @@ def fused_marlin_moe(hidden_states: torch.Tensor,
     - w2 (torch.Tensor): The second set of expert weights.
     - w1_scale (torch.Tensor): Scale to be used for w1.
     - w2_scale (torch.Tensor): Scale to be used for w2.
-    - gating_output (torch.Tensor): The output of the gating operation
-        (before softmax).
+    - gating_output (Optional[torch.Tensor]): The output of the gating
+        operation (before softmax).
     - g_idx1 (Optional[torch.Tensor]): The first set of act_order indices.
     - g_idx2 (Optional[torch.Tensor]): The second set of act_order indices.
     - sort_indices1 (Optional[torch.Tensor]): The first act_order input
@@ -78,8 +88,9 @@ def fused_marlin_moe(hidden_states: torch.Tensor,
     num_bits = 4 if quant_type in bit4_scalar_types else 8
 
     # Check constraints.
-    assert hidden_states.shape[0] == gating_output.shape[
-        0], "Number of tokens mismatch"
+    if gating_output is not None:
+        assert hidden_states.shape[0] == gating_output.shape[
+            0], "Number of tokens mismatch"
     assert hidden_states.shape[
         1] == w1.shape[1] * 16, "Hidden size mismatch w1"
     assert hidden_states.shape[1] == w2.shape[2] // (
@@ -93,7 +104,7 @@ def fused_marlin_moe(hidden_states: torch.Tensor,
 
     M, K = hidden_states.shape
     E = w1.shape[0]
-    N = w2.shape[1] * 16
+    N = marlin_moe_intermediate_size(w1, w2)
     topk = topk_ids.shape[1]
 
     # M block size selection logic
@@ -111,20 +122,24 @@ def fused_marlin_moe(hidden_states: torch.Tensor,
     if workspace is None:
         workspace = marlin_make_workspace_new(hidden_states.device, 4)
 
-    intermediate_cache2 = torch.empty(
-        (M * topk_ids.shape[1], N),
-        device=hidden_states.device,
-        dtype=hidden_states.dtype,
-    )
-    intermediate_cache13 = torch.empty(
-        (M * topk_ids.shape[1] * max(2 * N, K), ),
-        device=hidden_states.device,
-        dtype=hidden_states.dtype,
-    )
-    intermediate_cache1 = intermediate_cache13[:M * topk_ids.shape[1] * 2 * N]
-    intermediate_cache1 = intermediate_cache1.view(-1, 2 * N)
-    intermediate_cache3 = intermediate_cache13[:M * topk_ids.shape[1] * K]
-    intermediate_cache3 = intermediate_cache3.view(-1, K)
+    if intermediate_cache2 is None:
+        intermediate_cache2 = torch.empty(
+            (M * topk, N),
+            device=hidden_states.device,
+            dtype=hidden_states.dtype,
+        )
+
+    if intermediate_cache13 is None:
+        intermediate_cache13 = torch.empty(
+            (M * topk * max(2 * N, K), ),
+            device=hidden_states.device,
+            dtype=hidden_states.dtype,
+        )
+
+    intermediate_cache1 = _resize_cache(intermediate_cache13,
+                                        (M * topk, 2 * N))
+    intermediate_cache3 = _resize_cache(intermediate_cache13, (M * topk, K))
+    intermediate_cache2 = _resize_cache(intermediate_cache2, (M * topk, N))
 
     maybe_warn_marlin_atomic_add(hidden_states.device, hidden_states.dtype)
     use_atomic_add = hidden_states.dtype == torch.half or \
@@ -200,10 +215,9 @@ def fused_marlin_moe(hidden_states: torch.Tensor,
         use_fp32_reduce=True,
         is_zp_float=False).view(-1, topk, K)
 
-    output = hidden_states if inplace else torch.empty_like(hidden_states)
-    return torch.sum(intermediate_cache3.view(*intermediate_cache3.shape),
-                     dim=1,
-                     out=output)
+    if output is None:
+        output = hidden_states if inplace else torch.empty_like(hidden_states)
+    return torch.sum(intermediate_cache3.view(-1, topk, K), dim=1, out=output)
 
 
 def fused_marlin_moe_fake(hidden_states: torch.Tensor,
@@ -211,7 +225,7 @@ def fused_marlin_moe_fake(hidden_states: torch.Tensor,
                           w2: torch.Tensor,
                           w1_scale: torch.Tensor,
                           w2_scale: torch.Tensor,
-                          gating_output: torch.Tensor,
+                          gating_output: Optional[torch.Tensor],
                           topk_weights: torch.Tensor,
                           topk_ids: torch.Tensor,
                           quant_type_id: int,
@@ -227,7 +241,10 @@ def fused_marlin_moe_fake(hidden_states: torch.Tensor,
                           w1_zeros: Optional[torch.Tensor] = None,
                           w2_zeros: Optional[torch.Tensor] = None,
                           workspace: Optional[torch.Tensor] = None,
+                          intermediate_cache13: Optional[torch.Tensor] = None,
+                          intermediate_cache2: Optional[torch.Tensor] = None,
                           is_k_full: bool = True,
+                          output: Optional[torch.Tensor] = None,
                           inplace: bool = False) -> torch.Tensor:
     return torch.empty_like(hidden_states)
 
@@ -237,3 +254,124 @@ def fused_marlin_moe_fake(hidden_states: torch.Tensor,
     op_func=fused_marlin_moe,
     fake_impl=fused_marlin_moe_fake,
 )
+
+
+class MarlinExperts(mk.FusedMoEPermuteExpertsUnpermute):
+
+    def __init__(self, quant_config: FusedMoEQuantConfig):
+        # TODO (varun) : Enable activation quantization
+        assert quant_config.use_mxfp4_w4a16, "Supports only mxfp4_w4a16"
+        super().__init__(quant_config)
+
+    @override
+    def moe_problem_size(
+        self,
+        a1: torch.Tensor,
+        w1: torch.Tensor,
+        w2: torch.Tensor,
+        topk_ids: torch.Tensor,
+    ) -> tuple[int, int, int, int, int]:
+        assert w1.dim() == 3 and w2.dim() == 3
+
+        E = w1.size(0)
+        K = a1.size(-1)
+        N = marlin_moe_intermediate_size(w1, w2)
+
+        if a1.dim() == 2:
+            # Make sure we are using the correct a1 (pre-permute).
+            assert topk_ids.size(0) == a1.size(0), \
+                f"{topk_ids.size(0)} != {a1.size(0)}"
+            M = a1.size(0)
+        else:
+            assert a1.dim() == 3
+            assert a1.size(0) == E, f"{a1.size(0)} == {E}"
+            M = a1.size(1)  # This is max_num_tokens
+
+        assert topk_ids.dim() == 2
+        topk = topk_ids.size(1)
+
+        return E, M, N, K, topk
+
+    def supports_expert_map(self) -> bool:
+        return True
+
+    def finalize_weight_and_reduce_impl(self) -> mk.TopKWeightAndReduce:
+        return TopKWeightAndReduceNoOP()
+
+    @property
+    def activation_formats(
+        self
+    ) -> tuple[mk.FusedMoEActivationFormat, mk.FusedMoEActivationFormat]:
+        return (mk.FusedMoEActivationFormat.Standard,
+                mk.FusedMoEActivationFormat.Standard)
+
+    def supports_chunking(self) -> bool:
+        return True
+
+    def workspace_shapes(
+        self, a: torch.Tensor, aq: torch.Tensor, M: int, N: int, K: int,
+        topk: int, global_num_experts: int, local_num_experts: int,
+        expert_tokens_meta: Optional[mk.ExpertTokensMetadata]
+    ) -> tuple[tuple[int, ...], tuple[int, ...], tuple[int, ...], torch.dtype]:
+        # Modular Kernel provisions output buffer from workspace1. However in
+        # the fused_marlin_moe() function, the final torch.sum(), is defined
+        # essentially as,
+        # `torch.sum(workspace1, dim=1, out=output)`
+        # Having overlapping input and output tensors for torch.sum seems
+        # error prone and depends on how the torch.sum is implemented.
+        # For this reason we swap let the output buffer provision from
+        # workspace2.
+
+        # Workspace/IntermediateCache allocation matching fused_marlin_moe()
+        #workspace1 = (M * topk * max(2 * N, K),)
+        #workspace2 = (M * topk, N)
+
+        # Workspace/IntermediateCache allocation accounting for output buffer
+        # provisioning
+        workspace1 = (M * topk, max(N, K))
+        workspace2 = (M * topk * max(2 * N, K), )
+        output = (M, K)
+
+        return (workspace1, workspace2, output, a.dtype)
+
+    def apply(
+        self,
+        output: torch.Tensor,
+        hidden_states: torch.Tensor,
+        w1: torch.Tensor,
+        w2: torch.Tensor,
+        topk_weights: torch.Tensor,
+        topk_ids: torch.Tensor,
+        activation: str,
+        global_num_experts: int,
+        expert_map: Optional[torch.Tensor],
+        a1q_scale: Optional[torch.Tensor],
+        a2_scale: Optional[torch.Tensor],
+        workspace13: torch.Tensor,
+        workspace2: torch.Tensor,
+        expert_tokens_meta: Optional[mk.ExpertTokensMetadata],
+        apply_router_weight_on_input: bool,
+    ):
+        assert self.w1_scale is not None
+        assert self.w2_scale is not None
+        return fused_marlin_moe(
+            hidden_states=hidden_states,
+            w1=w1,
+            w2=w2,
+            bias1=self.w1_bias,
+            bias2=self.w2_bias,
+            w1_scale=self.w1_scale,
+            w2_scale=self.w2_scale,
+            gating_output=None,
+            topk_weights=topk_weights,
+            topk_ids=topk_ids,
+            quant_type_id=scalar_types.float4_e2m1f.id,  # works only for w4a16
+            apply_router_weight_on_input=apply_router_weight_on_input,
+            global_num_experts=global_num_experts,
+            activation=activation,
+            expert_map=expert_map,
+            output=output,
+            # Workspaces are swapped in workspace_shapes() to account for proper
+            # output buffer allocation. Please refer to workspace_shapes().
+            intermediate_cache13=workspace2,
+            intermediate_cache2=workspace13)
diff --git a/vllm/model_executor/layers/fused_moe/fused_moe.py b/vllm/model_executor/layers/fused_moe/fused_moe.py
index 49f278c72007..f96525734fd9 100644
--- a/vllm/model_executor/layers/fused_moe/fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_moe.py
@@ -1780,7 +1780,7 @@ def apply(
             torch.float32, torch.float16, torch.bfloat16, torch.float8_e4m3fn
         ]
 
-        E, num_tokens, N, K, top_k_num = mk._moe_problem_size(
+        E, num_tokens, N, K, top_k_num = self.moe_problem_size(
             hidden_states, w1, w2, topk_ids)
 
         if global_num_experts == -1:
diff --git a/vllm/model_executor/layers/fused_moe/modular_kernel.py b/vllm/model_executor/layers/fused_moe/modular_kernel.py
index b6afc8651e36..a7617f8b7297 100644
--- a/vllm/model_executor/layers/fused_moe/modular_kernel.py
+++ b/vllm/model_executor/layers/fused_moe/modular_kernel.py
@@ -55,46 +55,6 @@
 #
 
 
-def _moe_problem_size(
-    a1: torch.Tensor,
-    w1: torch.Tensor,
-    w2: torch.Tensor,
-    topk_ids: torch.Tensor,
-) -> tuple[int, int, int, int, int]:
-    """
-    Extract the MoE problem size from the given tensor arguments:
-    - a: The hidden states, input to the MoE layer.
-    - w1: The first set of expert weights.
-    - w2: The second set of expert weights.
-    - topk_ids: The topk ids.
-
-    Note: extracting the problem shape from the weight and activation tensors is
-    not obvious.  It needs to be done this way specifically due to subtle issues
-    with particular kernels, e.g. the int4 kernels divide the trailing dimension
-    by two, so it's not "correct" to extract N or K from the trailing dimension
-    of w1 or w2.  Similarly, some kernels transpose the weights, so this needs
-    to be kept in mind.
-    """
-    assert w1.dim() == 3 and w2.dim() == 3
-    E, N, _ = w1.size()
-    K = a1.size(-1)
-
-    if a1.dim() == 2:
-        # Make sure we are using the correct a1 (pre-permute).
-        assert topk_ids.size(0) == a1.size(0), \
-            f"{topk_ids.size(0)} != {a1.size(0)}"
-        M = a1.size(0)
-    else:
-        assert a1.dim() == 3
-        assert a1.size(0) == E, f"{a1.size(0)} == {E}"
-        M = a1.size(1)  # This is max_num_tokens
-
-    assert topk_ids.dim() == 2
-    topk = topk_ids.size(1)
-
-    return E, M, N, K, topk
-
-
 class FusedMoEActivationFormat(Enum):
     """
     The standard activation format (num_tokens, hidden dim).
@@ -391,6 +351,50 @@ def activation_formats(
         """
         raise NotImplementedError
 
+    def moe_problem_size(
+        self,
+        a1: torch.Tensor,
+        w1: torch.Tensor,
+        w2: torch.Tensor,
+        topk_ids: torch.Tensor,
+    ) -> tuple[int, int, int, int, int]:
+        """
+        Extract the MoE problem size from the given tensor arguments:
+        - a: The hidden states, input to the MoE layer.
+        - w1: The first set of expert weights.
+        - w2: The second set of expert weights.
+        - topk_ids: The topk ids.
+
+        Note: extracting the problem shape from the weight and activation
+        tensors is not obvious.  It needs to be done this way specifically
+        due to subtle issues with particular kernels, e.g. the int4 kernels
+        divide the trailing dimension by two, so it's not "correct" to
+        extract N or K from the trailing dimension of w1 or w2.  Similarly,
+        some kernels transpose the weights, so this needs to be kept in mind.
+
+        Note: This implementation covers most cases. However, if experts
+        require a specialized implementation, like MarlinExperts, they are free
+        to override this function.
+        """
+        assert w1.dim() == 3 and w2.dim() == 3
+        E, N, _ = w1.size()
+        K = a1.size(-1)
+
+        if a1.dim() == 2:
+            # Make sure we are using the correct a1 (pre-permute).
+            assert topk_ids.size(0) == a1.size(0), \
+                f"{topk_ids.size(0)} != {a1.size(0)}"
+            M = a1.size(0)
+        else:
+            assert a1.dim() == 3
+            assert a1.size(0) == E, f"{a1.size(0)} == {E}"
+            M = a1.size(1)  # This is max_num_tokens
+
+        assert topk_ids.dim() == 2
+        topk = topk_ids.size(1)
+
+        return E, M, N, K, topk
+
     #
     # Various helpers for accessing quantization parameters from the
     # quant_config.
@@ -674,7 +678,8 @@ def _do_fused_experts(
         apply_router_weight_on_input: bool,
     ) -> torch.Tensor:
 
-        _, M, N, K, top_k = _moe_problem_size(a1q, w1, w2, topk_ids)
+        _, M, N, K, top_k = self.fused_experts.moe_problem_size(
+            a1q, w1, w2, topk_ids)
 
         (workspace13_shape, workspace2_shape, fused_out_shape,
          workspace_dtype) = self.fused_experts.workspace_shapes(
@@ -737,7 +742,8 @@ def _maybe_chunk_fused_experts(
         apply_router_weight_on_input: bool,
     ) -> torch.Tensor:
 
-        _, M, N, K, top_k = _moe_problem_size(a1q, w1, w2, topk_ids)
+        _, M, N, K, top_k = self.fused_experts.moe_problem_size(
+            a1q, w1, w2, topk_ids)
 
         CHUNK_SIZE = envs.VLLM_FUSED_MOE_CHUNK_SIZE
         num_chunks = cdiv(M, CHUNK_SIZE)
diff --git a/vllm/model_executor/layers/quantization/mxfp4.py b/vllm/model_executor/layers/quantization/mxfp4.py
index 54194b2e7d5b..950bf33dbf01 100644
--- a/vllm/model_executor/layers/quantization/mxfp4.py
+++ b/vllm/model_executor/layers/quantization/mxfp4.py
@@ -15,6 +15,7 @@
 from vllm.model_executor.layers.fused_moe.config import (
     FusedMoEQuantConfig, mxfp4_w4a4_moe_quant_config,
     mxfp4_w4a16_moe_quant_config)
+from vllm.model_executor.layers.fused_moe.fused_marlin_moe import MarlinExperts
 from vllm.model_executor.layers.fused_moe.gpt_oss_triton_kernels_moe import (
     OAITritonExperts)
 from vllm.model_executor.layers.fused_moe.trtllm_moe import TrtLlmGenExperts
@@ -92,7 +93,7 @@ def get_mxfp4_backend():
                 "Please `pip install vllm[flashinfer]` for best results.")
 
         # If FlashInfer is not available, try either Marlin or Triton
-        if current_platform.get_device_capability(
+        if envs.VLLM_MXFP4_USE_MARLIN or current_platform.get_device_capability(
         )[0] < 9 or not has_triton_kernels() or not is_torch_equal_or_newer(
                 "2.8.0"):
             logger.info_once("Using Marlin backend")
@@ -646,9 +647,13 @@ def get_fused_moe_quant_config(
             self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
 
         if self.mxfp4_backend == Mxfp4Backend.MARLIN:
-            return None
-
-        if self.mxfp4_backend == Mxfp4Backend.TRITON:
+            return mxfp4_w4a16_moe_quant_config(
+                w1_bias=layer.w13_bias,
+                w2_bias=layer.w2_bias,
+                w1_scale=layer.w13_weight_scale,
+                w2_scale=layer.w2_weight_scale,
+            )
+        elif self.mxfp4_backend == Mxfp4Backend.TRITON:
             w1_scale = self.w13_precision_config
             w2_scale = self.w2_precision_config
             return mxfp4_w4a16_moe_quant_config(
@@ -690,6 +695,8 @@ def select_gemm_impl(
                 }
                 return TrtLlmGenExperts(self.moe, self.moe_quant_config,
                                         **kwargs)
+            elif (self.mxfp4_backend == Mxfp4Backend.MARLIN):
+                return MarlinExperts(self.moe_quant_config)
             else:
                 return OAITritonExperts(self.moe_quant_config)
 
@@ -782,6 +789,29 @@ def apply(
         if enable_eplb:
             raise NotImplementedError("EPLB is not supported for mxfp4")
 
+        if self.fused_experts is not None:
+            return self._route_and_experts(
+                layer,
+                x,
+                router_logits,
+                top_k,
+                renormalize,
+                use_grouped_topk,
+                topk_group,
+                num_expert_group,
+                global_num_experts,
+                expert_map,
+                custom_routing_function,
+                scoring_func,
+                e_score_correction_bias,
+                apply_router_weight_on_input,
+                activation,
+                enable_eplb,
+                expert_load_view,
+                logical_to_physical_map,
+                logical_replica_count,
+            )
+
         if self.mxfp4_backend == Mxfp4Backend.MARLIN:
             topk_weights, topk_ids, _ = FusedMoE.select_experts(
                 hidden_states=x,
@@ -815,29 +845,6 @@ def apply(
                 activation=activation,
                 expert_map=expert_map)
 
-        if self.fused_experts is not None:
-            return self._route_and_experts(
-                layer,
-                x,
-                router_logits,
-                top_k,
-                renormalize,
-                use_grouped_topk,
-                topk_group,
-                num_expert_group,
-                global_num_experts,
-                expert_map,
-                custom_routing_function,
-                scoring_func,
-                e_score_correction_bias,
-                apply_router_weight_on_input,
-                activation,
-                enable_eplb,
-                expert_load_view,
-                logical_to_physical_map,
-                logical_replica_count,
-            )
-
         assert _can_support_mxfp4(
             use_grouped_topk, topk_group, num_expert_group, expert_map,
             custom_routing_function, e_score_correction_bias,
diff --git a/vllm/model_executor/layers/quantization/utils/marlin_utils.py b/vllm/model_executor/layers/quantization/utils/marlin_utils.py
index 317ad079b392..6c7604cc9d04 100644
--- a/vllm/model_executor/layers/quantization/utils/marlin_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/marlin_utils.py
@@ -187,6 +187,16 @@ def check_moe_marlin_supports_layer(layer: LinearBase, group_size: int) \
         supports_router_weight and supports_activation
 
 
+def marlin_moe_intermediate_size(w1_packed: torch.Tensor,
+                                 w2_packed: torch.Tensor):
+    """
+    Given Marlin packed weight matrices w1_packed, and w2_packed,
+    return the MoE intermediate size N 
+    """
+    marlin_tile_size = 16
+    return w2_packed.size(1) * marlin_tile_size
+
+
 def marlin_make_workspace(output_size_per_partition: int,
                           device: torch.device) -> torch.Tensor:
     max_workspace_size = (output_size_per_partition //

From 7fe088c609644b9e1aedb57d8c97a1ead8fb9ed3 Mon Sep 17 00:00:00 2001
From: Eugene Khvedchenya <ekhvedchenia@nvidia.com>
Date: Sat, 4 Oct 2025 03:21:00 +0300
Subject: [PATCH 154/193] Fix issue of using only the part of video frame
 [Nemotron Nano] (#26186)

Signed-off-by: Eugene Khvedchenia <ekhvedchenia@nvidia.com>
---
 vllm/model_executor/models/nano_nemotron_vl.py | 2 --
 1 file changed, 2 deletions(-)

diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index 6f1c9f513f08..22f6ddef9336 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -215,8 +215,6 @@ def video_to_pixel_values(
         )
         # dynamic_preprocess returns tensors already; take the single tile
         assert len(pil_frame) >= 1
-        # frames_tensors.append(pil_frame[0])
-        # (ekvhedchenia) I think what we meant is take thumbnail tile (Which happen to be last one)
         frames_tensors.append(pil_frame[-1])
 
     return torch.stack(frames_tensors)

From c47afb02d8c0b850565ac5e3ef51d1de034fe33f Mon Sep 17 00:00:00 2001
From: Roger Wang <hey@rogerw.io>
Date: Fri, 3 Oct 2025 18:40:20 -0700
Subject: [PATCH 155/193] [Bugfix] Fix qwen3 vl dummy data generation with
 overrides (#26193)

Signed-off-by: Roger Wang <hey@rogerw.io>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/qwen3_vl.py | 63 ++++++++++++++++++--------
 1 file changed, 43 insertions(+), 20 deletions(-)

diff --git a/vllm/model_executor/models/qwen3_vl.py b/vllm/model_executor/models/qwen3_vl.py
index 517e2c54096e..822c8d6d5f30 100644
--- a/vllm/model_executor/models/qwen3_vl.py
+++ b/vllm/model_executor/models/qwen3_vl.py
@@ -47,7 +47,7 @@
 from vllm.attention.layer import check_upstream_fa_availability
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import VllmConfig
-from vllm.config.multimodal import BaseDummyOptions
+from vllm.config.multimodal import BaseDummyOptions, VideoDummyOptions
 from vllm.distributed import get_pp_group
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import _ACTIVATION_REGISTRY
@@ -741,20 +741,57 @@ def get_dummy_mm_data(
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
+        image_overrides = mm_options.get("image") if mm_options else None
+        video_overrides = mm_options.get("video") if mm_options else None
 
         target_width, target_height = (
             self.info.get_image_size_with_most_features())
         target_num_frames = self.info.get_num_frames_with_most_features(
             seq_len, mm_counts)
+
+        if video_overrides:
+            assert isinstance(video_overrides, VideoDummyOptions)
+            num_frames_override = video_overrides.num_frames
+            if num_frames_override:
+                if num_frames_override > target_num_frames:
+                    logger.warning(
+                        "video.num_frames override (%d) exceeds model's "
+                        "maximum number of frames (%d), will be ignored",
+                        num_frames_override, target_num_frames)
+                if num_frames_override < 2:
+                    logger.warning(
+                        "video.num_frames override (%d) cannot be less "
+                        "than 2, will be ignored", num_frames_override)
+                target_num_frames = min(target_num_frames, num_frames_override)
+        target_num_frames = max(target_num_frames, 2)
+
         target_video_size, _ = self.info._get_vision_info(
             image_width=target_width,
             image_height=target_height,
             num_frames=target_num_frames,
             image_processor=self.info.get_video_processor(),
         )
-
-        image_overrides = mm_options.get("image") if mm_options else None
-        video_overrides = mm_options.get("video") if mm_options else None
+        # NOTE: we need to do this check here since Qwen3-VL resizes video
+        # frames depending on how many frames there are.
+        width, height = target_video_size.width, target_video_size.height
+        if video_overrides:
+            assert isinstance(video_overrides, VideoDummyOptions)
+            width_override = video_overrides.width
+            if width_override:
+                if width_override > width:
+                    logger.warning(
+                        "video.width override (%d) exceeds model's "
+                        "maximum width (%d), will be ignored", width_override,
+                        width)
+                width = min(width, width_override)
+            height_override = video_overrides.height
+            if height_override:
+                if height_override > height:
+                    logger.warning(
+                        "video.height override (%d) exceeds model's "
+                        "maximum height (%d), will be ignored",
+                        height_override, height)
+                height = min(height, height_override)
 
         return {
             "image":
@@ -764,11 +801,10 @@ def get_dummy_mm_data(
                                    overrides=image_overrides),
             "video":
             self._get_dummy_videos(
-                width=target_video_size.width,
-                height=target_video_size.height,
+                width=width,
+                height=height,
                 num_frames=target_num_frames,
                 num_videos=num_videos,
-                overrides=video_overrides,
             ),
         }
 
@@ -780,7 +816,6 @@ def _get_dummy_videos(
         num_frames: int,
         num_videos: int,
     ) -> list[VideoItem]:
-        num_frames = max(num_frames, 2)
         video = np.full((num_frames, width, height, 3), 255, dtype=np.uint8)
         video_items = []
         for i in range(num_videos):
@@ -796,18 +831,6 @@ def _get_dummy_videos(
             video_items.append(video_item)
         return video_items
 
-    def get_dummy_processor_inputs(self, seq_len, mm_counts):
-        processor_inputs = super().get_dummy_processor_inputs(
-            seq_len, mm_counts)
-        # HACK(Isotr0py): We set do_resize to False here to reuse Qwen2-VL's
-        # profiling logic, which will be problematic for configurable mm
-        # profiling.
-        # TODO(Isotr0py): Switch to the implementation in
-        # https://github.com/vllm-project/vllm/pull/25557
-        # after supporting configurable mm profiling.
-        processor_inputs.hf_processor_mm_kwargs = {"do_resize": False}
-        return processor_inputs
-
 
 class Qwen3VLMultiModalProcessor(BaseMultiModalProcessor[Qwen3VLProcessingInfo]
                                  ):

From 1e50901fb14b08fb69134f25ff813cb8fb1b4669 Mon Sep 17 00:00:00 2001
From: Ben Browning <bbrownin@redhat.com>
Date: Fri, 3 Oct 2025 21:42:08 -0400
Subject: [PATCH 156/193] [BugFix] Use async Mistral Tokenizer in Chat
 Completions (#26134)

Signed-off-by: Ben Browning <bbrownin@redhat.com>
Co-authored-by: Cyrus Leung <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../entrypoints/openai/test_serving_engine.py | 69 +++++++++++++++++++
 vllm/entrypoints/openai/serving_engine.py     |  6 +-
 2 files changed, 73 insertions(+), 2 deletions(-)
 create mode 100644 tests/entrypoints/openai/test_serving_engine.py

diff --git a/tests/entrypoints/openai/test_serving_engine.py b/tests/entrypoints/openai/test_serving_engine.py
new file mode 100644
index 000000000000..ba6f10891159
--- /dev/null
+++ b/tests/entrypoints/openai/test_serving_engine.py
@@ -0,0 +1,69 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+import asyncio
+import time
+from unittest.mock import Mock
+
+import pytest
+
+from vllm.config import ModelConfig
+from vllm.entrypoints.openai.serving_engine import OpenAIServing
+from vllm.entrypoints.openai.serving_models import OpenAIServingModels
+from vllm.transformers_utils.tokenizers.mistral import MistralTokenizer
+
+
+@pytest.fixture()
+def serving() -> OpenAIServing:
+    """Create a minimal OpenAIServing instance for testing."""
+
+    # Create minimal mocks
+    engine_client = Mock()
+    model_config = Mock(spec=ModelConfig)
+    model_config.max_model_len = 32768
+    models = Mock(spec=OpenAIServingModels)
+
+    serving = OpenAIServing(
+        engine_client=engine_client,
+        model_config=model_config,
+        models=models,
+        request_logger=None,
+    )
+    return serving
+
+
+@pytest.mark.asyncio
+async def test_async_mistral_tokenizer_does_not_block_event_loop(
+        serving: OpenAIServing):
+    expected_tokens = [1, 2, 3]
+
+    # Mock the blocking version to sleep
+    def mocked_apply_chat_template(*_args, **_kwargs):
+        time.sleep(2)
+        return expected_tokens
+
+    mock_tokenizer = Mock(spec=MistralTokenizer)
+    mock_tokenizer.apply_chat_template.side_effect = mocked_apply_chat_template
+
+    task = serving._apply_mistral_chat_template_async(tokenizer=mock_tokenizer,
+                                                      messages=[],
+                                                      chat_template=None,
+                                                      tools=[])
+
+    # Ensure the event loop is not blocked
+    blocked_count = 0
+    for _i in range(20):  # Check over ~2 seconds
+        start = time.perf_counter()
+        await asyncio.sleep(0)
+        elapsed = time.perf_counter() - start
+
+        # an overly generous elapsed time for slow machines
+        if elapsed >= 0.5:
+            blocked_count += 1
+
+        await asyncio.sleep(0.1)
+
+    # Ensure task completes
+    tokens = await task
+    assert tokens == expected_tokens, "Mocked blocking tokenizer was not called"
+    assert blocked_count == 0, ("Event loop blocked during tokenization")
diff --git a/vllm/entrypoints/openai/serving_engine.py b/vllm/entrypoints/openai/serving_engine.py
index 0e5279baed29..e58d943d3f7f 100644
--- a/vllm/entrypoints/openai/serving_engine.py
+++ b/vllm/entrypoints/openai/serving_engine.py
@@ -80,7 +80,7 @@
 from vllm.tracing import (contains_trace_headers, extract_trace_headers,
                           log_tracing_disabled_warning)
 from vllm.transformers_utils.tokenizer import AnyTokenizer, MistralTokenizer
-from vllm.utils import (AsyncMicrobatchTokenizer, is_list_of,
+from vllm.utils import (AsyncMicrobatchTokenizer, is_list_of, make_async,
                         merge_async_iterators, random_uuid)
 
 logger = init_logger(__name__)
@@ -240,6 +240,8 @@ def __init__(
         self.enable_force_include_usage = enable_force_include_usage
 
         self._tokenizer_executor = ThreadPoolExecutor(max_workers=1)
+        self._apply_mistral_chat_template_async = make_async(
+            apply_mistral_chat_template, executor=self._tokenizer_executor)
 
         self._async_tokenizer_pool: dict[AnyTokenizer,
                                          AsyncMicrobatchTokenizer] = {}
@@ -798,7 +800,7 @@ async def _preprocess_chat(
         if tokenizer is None:
             request_prompt = "placeholder"
         elif isinstance(tokenizer, MistralTokenizer):
-            request_prompt = apply_mistral_chat_template(
+            request_prompt = await self._apply_mistral_chat_template_async(
                 tokenizer,
                 messages=messages,
                 **_chat_template_kwargs,

From 0505a944b1b7691463369f8d88f100ccb4b34c7d Mon Sep 17 00:00:00 2001
From: Bram Wasti <bwasti@fb.com>
Date: Fri, 3 Oct 2025 21:49:30 -0500
Subject: [PATCH 157/193] Add batch invariant kernel override for FlashInfer
 backend [2/n] (#25769)

Signed-off-by: Bram Wasti <bwasti@meta.com>
Signed-off-by: Bram Wasti <bwasti@fb.com>
Co-authored-by: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/v1/generation/test_batch_invariance.py  | 63 ++++++++++++-------
 vllm/model_executor/layers/batch_invariant.py | 13 +++-
 vllm/v1/attention/backends/flashinfer.py      | 37 +++++++++--
 3 files changed, 84 insertions(+), 29 deletions(-)

diff --git a/tests/v1/generation/test_batch_invariance.py b/tests/v1/generation/test_batch_invariance.py
index b864f9a31836..5cc6fcfd9ac9 100644
--- a/tests/v1/generation/test_batch_invariance.py
+++ b/tests/v1/generation/test_batch_invariance.py
@@ -76,18 +76,21 @@ def test_v1_generation_is_deterministic_across_batch_sizes_with_needle():
       seed.
     - Keep max_tokens and max_model_len bounded for speed and memory use.
     """
-    random.seed(12345)
+    seed = int(os.getenv("VLLM_TEST_SEED", "12345"))
+    random.seed(seed)
 
     # Allow overrides from environment (useful for CI tuning)
     # "facebook/opt-125m" is too small, doesn't reliably test determinism
     model = os.getenv("VLLM_TEST_MODEL", "Qwen/Qwen3-1.7B")
     num_trials = int(os.getenv("VLLM_NEEDLE_TRIALS", "5"))
-    batch_size = int(os.getenv("VLLM_NEEDLE_BATCH_SIZE", "64"))
-    assert batch_size >= 2, "Batch size should be >= 2 to mix needle."
+    max_batch_size = int(os.getenv("VLLM_NEEDLE_BATCH_SIZE", "128"))
+    min_random_prompt = int(os.getenv("VLLM_MIN_PROMPT", "1024"))
+    max_random_prompt = int(os.getenv("VLLM_MAX_PROMPT", "2048"))
+    assert max_batch_size >= 2, "Batch size should be >= 2 to mix needle."
 
     # Keep GPU memory usage low to avoid startup allocation failures.
-    gpu_mem_util = float(os.getenv("VLLM_GPU_MEMORY_UTILIZATION", "0.3"))
-    max_model_len = int(os.getenv("VLLM_MAX_MODEL_LEN", "4096"))
+    gpu_mem_util = float(os.getenv("VLLM_GPU_MEMORY_UTILIZATION", "0.4"))
+    max_model_len = int(os.getenv("VLLM_MAX_MODEL_LEN", "5120"))
     swap_space_gb = int(os.getenv("VLLM_SWAP_SPACE_GB", "4"))
 
     # Sampling parameters: longer outputs with a more random-sounding
@@ -111,7 +114,7 @@ def test_v1_generation_is_deterministic_across_batch_sizes_with_needle():
         # Engine with bs=1 behavior
         llm_bs1 = LLM_with_max_seqs(
             model=model,
-            max_num_seqs=1,
+            max_num_seqs=128,
             gpu_memory_utilization=gpu_mem_util,
             max_model_len=max_model_len,
             swap_space=swap_space_gb,
@@ -126,7 +129,7 @@ def test_v1_generation_is_deterministic_across_batch_sizes_with_needle():
         # Engine with larger batch limit (e.g., 64)
         llm_bsN = LLM_with_max_seqs(
             model=model,
-            max_num_seqs=batch_size,
+            max_num_seqs=128,
             gpu_memory_utilization=gpu_mem_util,
             max_model_len=max_model_len,
             swap_space=swap_space_gb,
@@ -135,15 +138,17 @@ def test_v1_generation_is_deterministic_across_batch_sizes_with_needle():
         mismatches = 0
 
         for trial in range(num_trials):
-            # Create a batch of size `batch_size` and insert the needle at
+            # Create a batch of size `max_batch_size` and insert the needle at
             # a random index
             prompts: list[str] = []
+            batch_size = random.randint(max_batch_size // 2, max_batch_size)
             needle_pos = random.randint(0, batch_size - 1)
             for i in range(batch_size):
                 if i == needle_pos:
                     prompts.append(needle_prompt)
                 else:
-                    prompts.append(_random_prompt())
+                    prompts.append(
+                        _random_prompt(min_random_prompt, max_random_prompt))
 
             # Generate with the larger-batch engine
             outputs = llm_bsN.generate(prompts, sampling)
@@ -154,17 +159,19 @@ def test_v1_generation_is_deterministic_across_batch_sizes_with_needle():
             text = needle_output.outputs[0].text
 
             if text != baseline_text:
+                print(
+                    f"{text}\n\n== Not the same as ==\n\n{baseline_text}\n\n")
                 mismatches += 1
 
         passes = num_trials - mismatches
         # Dump how many passed vs failed
         print(f"[determinism] total={num_trials}, passed={passes}, "
-              f"failed={mismatches}, batch_size={batch_size}")
+              f"failed={mismatches}, max_batch_size={max_batch_size}")
 
         if mismatches > 0:
             pytest.fail(
                 f"Nondeterministic outputs detected: {mismatches} failed out "
-                f"of {num_trials} trials (batch_size={batch_size}).")
+                f"of {num_trials} trials (max_batch_size={max_batch_size}).")
 
     finally:
         # Ensure engines are shutdown to free GPU/VRAM across test sessions
@@ -196,9 +203,14 @@ def _extract_step_logprobs(request_output):
     not torch.cuda.is_available(),
     reason="Requires CUDA to match production inference path.",
 )
-def test_logprobs_bitwise_batch_invariance_bs1_vs_bs2():
+@pytest.mark.parametrize("backend", ["FLEX_ATTENTION", "FLASHINFER"])
+def test_logprobs_bitwise_batch_invariance_bs1_vs_bsN(backend):
 
-    #model_name = os.getenv("VLLM_TEST_MODEL", "facebook/opt-125m")
+    backend = os.getenv("VLLM_ATTENTION_BACKEND", backend)
+    os.environ["VLLM_ATTENTION_BACKEND"] = backend
+
+    seed = int(os.getenv("VLLM_TEST_SEED", "12345"))
+    random.seed(seed)
     model_name = os.getenv("VLLM_TEST_MODEL", "Qwen/Qwen3-1.7B")
     tp_size = int(os.getenv("VLLM_TEST_TP_SIZE", "1"))
 
@@ -212,10 +224,15 @@ def test_logprobs_bitwise_batch_invariance_bs1_vs_bs2():
     prompts = [
         "The capital of France is",
         "The capital of Germany is",
+        _random_prompt(10, 1024),
+        _random_prompt(10, 1024),
+        _random_prompt(10, 1024),
+        _random_prompt(10, 1024),
+        _random_prompt(10, 1024),
     ]
 
     sp = SamplingParams(
-        temperature=0.0,
+        temperature=0.6,
         top_p=1.0,
         max_tokens=8,
         # Seed shouldn't matter at temperature=0, but keeping it stable anyway.
@@ -234,25 +251,25 @@ def test_logprobs_bitwise_batch_invariance_bs1_vs_bs2():
                         "enable logprobs return to run this test.")
         bs1_logprobs_per_prompt.append(step_logprobs)
 
-    # BS=2: run prompts in a batch and collect logprobs per step for each
+    # BS=N: run prompts in a batch and collect logprobs per step for each
     # prompt.
     outs_batched = llm.generate(prompts, sp, use_tqdm=False)
     assert len(outs_batched) == len(prompts)
-    bs2_logprobs_per_prompt = []
+    bsN_logprobs_per_prompt = []
     for o in outs_batched:
         step_logprobs = _extract_step_logprobs(o)
         if step_logprobs is None:
             pytest.skip("Logits are not available on RequestOutput; "
                         "enable logprobs return to run this test.")
-        bs2_logprobs_per_prompt.append(step_logprobs)
+        bsN_logprobs_per_prompt.append(step_logprobs)
 
-    # Compare step-by-step logprobs for each prompt between BS=1 and BS=2 runs.
-    for i, (logprobs_bs1, logprobs_bs2) in enumerate(
-            zip(bs1_logprobs_per_prompt, bs2_logprobs_per_prompt)):
-        assert len(logprobs_bs1) == len(logprobs_bs2), (
+    # Compare step-by-step logprobs for each prompt between BS=1 and BS=N runs.
+    for i, (logprobs_bs1, logprobs_bsN) in enumerate(
+            zip(bs1_logprobs_per_prompt, bsN_logprobs_per_prompt)):
+        assert len(logprobs_bs1) == len(logprobs_bsN), (
             f"Different number of generation steps for prompt index {i}: "
-            f"{len(logprobs_bs1)} (BS=1) vs {len(logprobs_bs2)} (BS=2)")
-        for t, (a, b) in enumerate(zip(logprobs_bs1, logprobs_bs2)):
+            f"{len(logprobs_bs1)} (BS=1) vs {len(logprobs_bsN)} (BS=N)")
+        for t, (a, b) in enumerate(zip(logprobs_bs1, logprobs_bsN)):
             assert a.shape == b.shape, (
                 f"Logits shape mismatch at prompt {i}, step {t}: "
                 f"{a.shape} vs {b.shape}")
diff --git a/vllm/model_executor/layers/batch_invariant.py b/vllm/model_executor/layers/batch_invariant.py
index c025d509d862..150c48c0e880 100644
--- a/vllm/model_executor/layers/batch_invariant.py
+++ b/vllm/model_executor/layers/batch_invariant.py
@@ -8,8 +8,12 @@
 
 import torch
 
+import vllm.envs as envs
+from vllm.logger import init_logger
 from vllm.triton_utils import tl, triton
 
+logger = init_logger(__name__)
+
 
 def _matmul_launch_metadata(grid: Callable[..., Any], kernel: Any,
                             args: dict[str, Any]) -> dict[str, Any]:
@@ -557,5 +561,12 @@ def vllm_kernel_override_batch_invariant():
 def init_batch_invariance():
     # this will hit all the csrc overrides as well
     if vllm_kernel_override_batch_invariant():
-        os.environ["VLLM_ATTENTION_BACKEND"] = "FLEX_ATTENTION"
+        curr_attn_backend = envs.VLLM_ATTENTION_BACKEND
+        supported_backends = ["FLEX_ATTENTION", "FLASHINFER"]
+        if curr_attn_backend not in supported_backends:
+            warning = "Forcibly updating attention backend to" \
+                f" {supported_backends[0]} for batch_invariant. " \
+                f" Supported backends: {supported_backends}."
+            logger.warning_once(warning)
+            os.environ["VLLM_ATTENTION_BACKEND"] = supported_backends[0]
         enable_batch_invariant_mode()
diff --git a/vllm/v1/attention/backends/flashinfer.py b/vllm/v1/attention/backends/flashinfer.py
index 15a252734d4d..13f18d103b53 100755
--- a/vllm/v1/attention/backends/flashinfer.py
+++ b/vllm/v1/attention/backends/flashinfer.py
@@ -20,6 +20,8 @@
                                               AttentionType)
 from vllm.config import CUDAGraphMode, VllmConfig
 from vllm.logger import init_logger
+from vllm.model_executor.layers.batch_invariant import (
+    vllm_kernel_override_batch_invariant)
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
     QuantKey, kFp8StaticTensorSym, kNvfp4Quant)
 from vllm.platforms import current_platform
@@ -42,6 +44,7 @@
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 FLASHINFER_WORKSPACE_BUFFER_SIZE = 256 * 1024 * 1024
+FLASHINFER_WORKSPACE_BUFFER_SIZE_BATCH_INVARIANT = 2048 * 1024 * 1024
 
 FP8_DTYPE = current_platform.fp8_dtype()
 FP4_DTYPE = torch.uint8
@@ -263,6 +266,15 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
         self._prefill_wrapper = None  # Wrapper for prefill/append
         self._decode_wrapper = None  # Wrapper for decode (general shape)
 
+        if vllm_kernel_override_batch_invariant():
+            self.decode_fixed_split_size = 2048
+            self.prefill_fixed_split_size = 4096
+            self.disable_split_kv = True
+        else:
+            self.decode_fixed_split_size = -1
+            self.prefill_fixed_split_size = -1
+            self.disable_split_kv = False
+
         self.compilation_config = vllm_config.compilation_config
         max_num_pages_per_req = cdiv(self.model_config.max_model_len,
                                      self.kv_cache_spec.block_size)
@@ -356,10 +368,12 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
 
     def _get_workspace_buffer(self):
         if self._workspace_buffer is None:
-            self._workspace_buffer = torch.zeros(
-                FLASHINFER_WORKSPACE_BUFFER_SIZE,
-                dtype=torch.uint8,
-                device=self.device)
+            buffer_size = FLASHINFER_WORKSPACE_BUFFER_SIZE
+            if vllm_kernel_override_batch_invariant():
+                buffer_size = FLASHINFER_WORKSPACE_BUFFER_SIZE_BATCH_INVARIANT
+            self._workspace_buffer = torch.zeros(buffer_size,
+                                                 dtype=torch.uint8,
+                                                 device=self.device)
         return self._workspace_buffer
 
     def _get_prefill_wrapper(self):
@@ -615,6 +629,8 @@ def build(self,
                         logits_soft_cap=self.logits_soft_cap,
                         q_data_type=self.q_data_type,
                         kv_data_type=self.kv_cache_dtype,
+                        fixed_split_size=self.prefill_fixed_split_size,
+                        disable_split_kv=self.disable_split_kv,
                     )
                 else:
                     attn_metadata.qo_indptr_gpu = qo_indptr_cpu.to(
@@ -668,6 +684,8 @@ def build(self,
                         logits_soft_cap=self.logits_soft_cap,
                         q_data_type=self.q_data_type,
                         kv_data_type=self.kv_cache_dtype,
+                        fixed_split_size=self.decode_fixed_split_size,
+                        disable_split_kv=self.disable_split_kv,
                     )
         return attn_metadata
 
@@ -1048,6 +1066,8 @@ def fast_plan_decode(
     rope_scale: Optional[float] = None,
     rope_theta: Optional[float] = None,
     non_blocking: bool = True,
+    fixed_split_size: int = -1,
+    disable_split_kv: bool = False,
 ) -> None:
     """
     A faster version of BatchDecodeWithPagedKVCacheWrapper::plan used for
@@ -1085,6 +1105,10 @@ def fast_plan_decode(
             rope_scale,
             rope_theta,
             non_blocking,
+            None,  # block_tables
+            None,  # seq_lens
+            fixed_split_size,
+            disable_split_kv,
         )
         self.vllm_first_call = False
         return
@@ -1130,7 +1154,7 @@ def fast_plan_decode(
     qo_indptr_host = _get_range_buf(batch_size + 1, "cpu")
 
     try:
-        # Make sure we pass exactly 15 arguments for tensor core version
+        # Make sure we pass exactly 18 arguments for tensor core version
         self._plan_info = self._cached_module.plan(
             self._float_workspace_buffer,
             self._int_workspace_buffer,
@@ -1147,6 +1171,9 @@ def fast_plan_decode(
             head_dim,
             head_dim,
             False,  # causal
+            window_left,
+            fixed_split_size,
+            disable_split_kv,
         )
     except Exception as e:
         raise RuntimeError(f"Error in tensor core plan: {e}") from e

From 46e1130f58cb41be7ad86698d7a8d0fed717aba0 Mon Sep 17 00:00:00 2001
From: Fadi Arafeh <115173828+fadara01@users.noreply.github.com>
Date: Sat, 4 Oct 2025 05:16:38 +0100
Subject: [PATCH 158/193] [cpu][perf] Accelerate unquantized-linear for AArch64
 through oneDNN/ACL and weight prepack (#25948)

Signed-off-by: Fadi Arafeh <fadi.arafeh@arm.com>
Co-authored-by: Li, Jiang <jiang1.li@intel.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 cmake/cpu_extension.cmake           |  3 +-
 csrc/cpu/dnnl_helper.cpp            | 80 +++++++++++++++++++++++++----
 csrc/cpu/dnnl_helper.h              |  2 +-
 csrc/cpu/dnnl_kernels.cpp           | 23 ++++++++-
 csrc/cpu/torch_bindings.cpp         |  5 ++
 setup.py                            |  5 ++
 vllm/_custom_ops.py                 |  4 ++
 vllm/model_executor/layers/utils.py |  5 +-
 8 files changed, 111 insertions(+), 16 deletions(-)

diff --git a/cmake/cpu_extension.cmake b/cmake/cpu_extension.cmake
index e6d0012c1a4b..c962564c8da0 100644
--- a/cmake/cpu_extension.cmake
+++ b/cmake/cpu_extension.cmake
@@ -213,6 +213,7 @@ if ((AVX512_FOUND AND NOT AVX512_DISABLED) OR (ASIMD_FOUND AND NOT APPLE_SILICON
         endif()
         set(ONEDNN_AARCH64_USE_ACL "ON")
         set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -Wl,-rpath,$ENV{ACL_ROOT_DIR}/build/")
+        add_compile_definitions(VLLM_USE_ACL)
     endif()
 
     set(ONEDNN_LIBRARY_TYPE "STATIC")
@@ -226,7 +227,7 @@ if ((AVX512_FOUND AND NOT AVX512_DISABLED) OR (ASIMD_FOUND AND NOT APPLE_SILICON
     set(ONEDNN_ENABLE_ITT_TASKS "OFF")
     set(ONEDNN_ENABLE_MAX_CPU_ISA "OFF")
     set(ONEDNN_ENABLE_CPU_ISA_HINTS "OFF")
-    set(ONEDNN_VERBOSE "OFF")
+    set(ONEDNN_VERBOSE "ON")
     set(CMAKE_POLICY_DEFAULT_CMP0077 NEW)
 
     FetchContent_MakeAvailable(oneDNN)
diff --git a/csrc/cpu/dnnl_helper.cpp b/csrc/cpu/dnnl_helper.cpp
index 6def0e061fa9..0f0cc34602b3 100644
--- a/csrc/cpu/dnnl_helper.cpp
+++ b/csrc/cpu/dnnl_helper.cpp
@@ -137,9 +137,8 @@ DNNLMatMulPrimitiveHandler::DNNLMatMulPrimitiveHandler(
 }
 
 void DNNLMatMulPrimitiveHandler::prepack_weight(
-    void* original_b_ptr, dnnl::memory::desc b_target_mem_desc) {
-  dnnl::memory::desc original_b_md({b_k_size_, b_n_size_}, b_type_,
-                                   {b_k_stride_, b_n_stride_});
+    void* original_b_ptr, dnnl::memory::desc original_b_md,
+    dnnl::memory::desc b_target_mem_desc) {
   dnnl::memory original_weight(original_b_md, default_engine(), original_b_ptr);
   dnnl::memory packed_weight(b_target_mem_desc, default_engine());
   {
@@ -250,7 +249,9 @@ W8A8MatMulPrimitiveHandler::W8A8MatMulPrimitiveHandler(const Args& args)
   if (a_qs_ == QuantizationStrategy::PER_TOKEN) {
     assert(!use_azp_);
   };
-  prepack_weight(args.b_ptr,
+  dnnl::memory::desc original_b_md({b_k_size_, b_n_size_}, b_type_,
+                                   {b_k_stride_, b_n_stride_});
+  prepack_weight(args.b_ptr, original_b_md,
                  create_primitive_desc(
                      MSizeCacheKey{.a_m_size = DNNL_RUNTIME_DIM_VAL,
                                    .use_bias = false,
@@ -412,12 +413,25 @@ MatMulPrimitiveHandler::MatMulPrimitiveHandler(const Args& args)
   assert(ab_type_ == dnnl::memory::data_type::f32 ||
          ab_type_ == dnnl::memory::data_type::bf16 ||
          ab_type_ == dnnl::memory::data_type::f16);
-  prepack_weight(args.b_ptr,
+
+  dnnl::memory::desc original_b_md({b_k_size_, b_n_size_}, b_type_,
+                                   {b_k_stride_, b_n_stride_});
+
+  prepack_weight(args.b_ptr, original_b_md,
                  create_primitive_desc(
-                     MSizeCacheKey{.a_m_size = DNNL_RUNTIME_DIM_VAL,
-                                   .a_m_stride = DNNL_RUNTIME_DIM_VAL,
-                                   .use_bias = false,
-                                   .bias_type = dnnl::memory::data_type::undef},
+                     MSizeCacheKey{
+#ifdef VLLM_USE_ACL
+                         // Arm Compute Library (ACL) backend for oneDNN does
+                         // not support runtime
+                         // dimensions, so we set M to a default value
+                         .a_m_size = 128,
+                         .a_m_stride = b_k_size_,
+#else
+                         .a_m_size = DNNL_RUNTIME_DIM_VAL,
+                         .a_m_stride = DNNL_RUNTIME_DIM_VAL,
+#endif
+                         .use_bias = false,
+                         .bias_type = dnnl::memory::data_type::undef},
                      true)
                      .weights_desc());
   init_runtime_memory_cache(args);
@@ -443,13 +457,31 @@ void MatMulPrimitiveHandler::execute(ExecArgs& args) {
   c_storage->set_data_handle((void*)args.c_ptr);
   c_mem_desc->dims[0] = args.a_m_size;
 
+#ifndef VLLM_USE_ACL
+  // We do not support in ACL backend of oneDNN, we handle bias by:
+  // 1. copying it into the result tensor
+  // 2. attaching a fused-sum post-op to the matmul primitive
   if (args.use_bias) {
     auto&& [bias_storage, bias_mem_desc] = get_runtime_memory_ptr(2);
     bias_storage->set_data_handle((void*)args.bias_ptr);
   }
-
+#endif
   dnnl::matmul matmul = get_matmul_cache(args);
 
+// With ACL backend of oneDNN, the required memory format might change when the
+// source tensor dims change. This does not really happen in practice, so isn't
+// a performance hit, but we need to support it because the API allows for it.
+#ifdef VLLM_USE_ACL
+  auto new_expected_wei_desc =
+      dnnl::matmul::primitive_desc(
+          const_cast<dnnl_primitive_desc_t>(matmul.get_primitive_desc()))
+          .weights_desc();
+  if (new_expected_wei_desc != b_target_mem_desc_) {
+    prepack_weight(memory_cache_[DNNL_ARG_WEIGHTS].get_data_handle(),
+                   b_target_mem_desc_, new_expected_wei_desc);
+  }
+#endif
+
   auto&& [scratchpad_storage, scratchpad_mem_desc] = get_runtime_memory_ptr(3);
   scratchpad_storage->set_data_handle(
       DNNLScratchPadManager::get_dnnl_scratchpad_manager()->get_data<void>());
@@ -484,7 +516,13 @@ dnnl::matmul::primitive_desc MatMulPrimitiveHandler::create_primitive_desc(
   } else {
     a_md = dnnl::memory::desc({key.a_m_size, b_k_size_}, b_type_,
                               {key.a_m_stride, 1});
+#ifdef VLLM_USE_ACL
+    // ACL's backend of oneDNN always expects the weight format to be "any"
+    b_md = dnnl::memory::desc({b_k_size_, b_n_size_}, b_type_,
+                              dnnl::memory::format_tag::any);
+#else
     b_md = b_target_mem_desc_;
+#endif
   }
   dnnl::memory::desc c_md({key.a_m_size, b_n_size_}, c_type_,
                           dnnl::memory::format_tag::ab);
@@ -494,8 +532,18 @@ dnnl::matmul::primitive_desc MatMulPrimitiveHandler::create_primitive_desc(
 
   if (key.use_bias) {
     dnnl::memory::desc bias_md({1, b_n_size_}, key.bias_type, {b_n_size_, 1});
+// Since ACL's matmuls don't support passing a bias_md, we apply the bias
+// through a fused-sum post-op
+#ifdef VLLM_USE_ACL
+    dnnl::post_ops post_ops;
+    post_ops.append_sum();
+    attr.set_post_ops(post_ops);
+    return dnnl::matmul::primitive_desc(default_engine(), a_md, b_md, c_md,
+                                        attr);
+#else
     return dnnl::matmul::primitive_desc(default_engine(), a_md, b_md, bias_md,
                                         c_md, attr);
+#endif
   } else {
     return dnnl::matmul::primitive_desc(default_engine(), a_md, b_md, c_md,
                                         attr);
@@ -511,13 +559,23 @@ void MatMulPrimitiveHandler::init_runtime_memory_cache(const Args& args) {
                    default_engine(), nullptr);
   set_runtime_memory_ptr(1, memory_cache_[DNNL_ARG_DST].get());
 
+// ACL matmuls don't support bias_md, so we don't need these
+#ifndef VLLM_USE_ACL
   memory_cache_[DNNL_ARG_BIAS] =
       dnnl::memory({{b_n_size_}, dnnl::memory::data_type::f32, {1}},
                    default_engine(), nullptr);
   set_runtime_memory_ptr(2, memory_cache_[DNNL_ARG_BIAS].get());
-
+#endif
   memory_cache_[DNNL_ARG_SCRATCHPAD] =
       dnnl::memory({{b_n_size_}, dnnl::memory::data_type::f32, {1}},
                    default_engine(), nullptr);
   set_runtime_memory_ptr(3, memory_cache_[DNNL_ARG_SCRATCHPAD].get());
 }
+
+bool is_onednn_acl_supported() {
+#ifdef VLLM_USE_ACL
+  return true;
+#else
+  return false;
+#endif
+}
diff --git a/csrc/cpu/dnnl_helper.h b/csrc/cpu/dnnl_helper.h
index ad6773d2b9fd..f0cb197d81a3 100644
--- a/csrc/cpu/dnnl_helper.h
+++ b/csrc/cpu/dnnl_helper.h
@@ -101,7 +101,7 @@ class DNNLMatMulPrimitiveHandler {
  protected:
   DNNLMatMulPrimitiveHandler(const Args& args, dnnl::memory::data_type b_type);
 
-  void prepack_weight(void* original_b_ptr,
+  void prepack_weight(void* original_b_ptr, dnnl::memory::desc original_b_md,
                       dnnl::memory::desc b_target_mem_desc);
 
   void set_runtime_memory_ptr(size_t index, dnnl_memory* memory_ptr);
diff --git a/csrc/cpu/dnnl_kernels.cpp b/csrc/cpu/dnnl_kernels.cpp
index 1c42a75bc2d6..6d062c71e767 100644
--- a/csrc/cpu/dnnl_kernels.cpp
+++ b/csrc/cpu/dnnl_kernels.cpp
@@ -527,21 +527,42 @@ void onednn_mm(torch::Tensor& c,        // [M, OC], row-major
   MatMulPrimitiveHandler* ptr =
       reinterpret_cast<MatMulPrimitiveHandler*>(handler);
 
+// ACL matmuls expect contiguous source tensors
+#ifdef VLLM_USE_ACL
+  torch::Tensor a_contig = a.contiguous();
+#endif
+
   MatMulPrimitiveHandler::ExecArgs exec_args;
+
+#ifdef VLLM_USE_ACL
+  exec_args.a_m_size = a_contig.size(0);
+  exec_args.a_m_stride = a_contig.stride(0);
+#else
   exec_args.a_m_size = a.size(0);
   exec_args.a_m_stride = a.stride(0);
-
+#endif
   VLLM_DISPATCH_FLOATING_TYPES(a.scalar_type(), "onednn_mm", [&] {
     if (bias.has_value()) {
       exec_args.use_bias = true;
       exec_args.bias_type = get_dnnl_type<scalar_t>();
+#ifdef VLLM_USE_ACL
+      // ACL matmuls in oneDNN do not support a bias.
+      // We handle a matmul with bias by doing: c = bias; c += matmul(a, b)
+      c.copy_(bias.value());
+#else
       exec_args.bias_ptr = bias->data_ptr<scalar_t>();
+#endif
     } else {
       exec_args.use_bias = false;
       exec_args.bias_type = get_dnnl_type<void>();
       exec_args.bias_ptr = nullptr;
     }
+#ifdef VLLM_USE_ACL
+    exec_args.a_ptr = a_contig.data_ptr<scalar_t>();
+#else
     exec_args.a_ptr = a.data_ptr<scalar_t>();
+
+#endif
     exec_args.c_ptr = c.data_ptr<scalar_t>();
 
     ptr->execute(exec_args);
diff --git a/csrc/cpu/torch_bindings.cpp b/csrc/cpu/torch_bindings.cpp
index d279c03e0b59..9df19d1ac392 100644
--- a/csrc/cpu/torch_bindings.cpp
+++ b/csrc/cpu/torch_bindings.cpp
@@ -27,6 +27,8 @@ int64_t create_onednn_mm_handler(const torch::Tensor& b,
 void onednn_mm(torch::Tensor& c, const torch::Tensor& a,
                const std::optional<torch::Tensor>& bias, int64_t handler);
 
+bool is_onednn_acl_supported();
+
 void mla_decode_kvcache(torch::Tensor& out, torch::Tensor& query,
                         torch::Tensor& kv_cache, double scale,
                         torch::Tensor& block_tables, torch::Tensor& seq_lens);
@@ -181,6 +183,9 @@ TORCH_LIBRARY_EXPAND(TORCH_EXTENSION_NAME, ops) {
       "int handler) -> ()");
   ops.impl("onednn_mm", torch::kCPU, &onednn_mm);
 
+  // Check if oneDNN was built with ACL backend
+  ops.def("is_onednn_acl_supported() -> bool", &is_onednn_acl_supported);
+
   // Create oneDNN W8A8 handler
   ops.def(
       "create_onednn_scaled_mm_handler(Tensor b, Tensor b_scales, ScalarType "
diff --git a/setup.py b/setup.py
index 5491046991ca..fcd9570beae1 100644
--- a/setup.py
+++ b/setup.py
@@ -205,6 +205,11 @@ def configure(self, ext: CMakeExtension) -> None:
         # Make sure we use the nvcc from CUDA_HOME
         if _is_cuda():
             cmake_args += [f'-DCMAKE_CUDA_COMPILER={CUDA_HOME}/bin/nvcc']
+
+        other_cmake_args = os.environ.get("CMAKE_ARGS")
+        if other_cmake_args:
+            cmake_args += other_cmake_args.split()
+
         subprocess.check_call(
             ['cmake', ext.cmake_lists_dir, *build_tool, *cmake_args],
             cwd=self.build_temp)
diff --git a/vllm/_custom_ops.py b/vllm/_custom_ops.py
index f07fa1e4e7be..84d96ee3a84d 100644
--- a/vllm/_custom_ops.py
+++ b/vllm/_custom_ops.py
@@ -1926,6 +1926,10 @@ def __del__(self):
     _supports_onednn = False
 
 
+def is_onednn_acl_supported():
+    return torch.ops._C.is_onednn_acl_supported()
+
+
 def create_onednn_mm(
     weight: torch.Tensor,  # [K, N]
     primitive_cache_size: int = 128,
diff --git a/vllm/model_executor/layers/utils.py b/vllm/model_executor/layers/utils.py
index 96dd58c0e4d2..ac3a604a5a3b 100644
--- a/vllm/model_executor/layers/utils.py
+++ b/vllm/model_executor/layers/utils.py
@@ -165,8 +165,9 @@ def dispatch_cpu_unquantized_gemm(
         if remove_weight:
             layer.weight = torch.nn.Parameter(torch.empty(0),
                                               requires_grad=False)
-    elif (ops._supports_onednn
-          and current_platform.get_cpu_architecture() == CpuArchEnum.X86):
+    elif ops._supports_onednn and (current_platform.get_cpu_architecture()
+                                   == CpuArchEnum.X86
+                                   or ops.is_onednn_acl_supported()):
         origin_weight = layer.weight
         if remove_weight:
             layer.weight = torch.nn.Parameter(torch.empty(0),

From cf788274aeda5137539c2d8a284853e20db0ffdb Mon Sep 17 00:00:00 2001
From: Stan Wozniak <77159600+s3woz@users.noreply.github.com>
Date: Sat, 4 Oct 2025 06:34:22 +0200
Subject: [PATCH 159/193] [V1] [Hybrid] Mamba2 Automatic Prefix Caching
 (#25752)

Signed-off-by: Stanislaw Wozniak <stw@zurich.ibm.com>
Signed-off-by: Thomas Ortner <boh@zurich.ibm.com>
Signed-off-by: Thomas Parnell <tpa@zurich.ibm.com>
Co-authored-by: Thomas Ortner <boh@zurich.ibm.com>
Co-authored-by: Thomas Parnell <tpa@zurich.ibm.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../models/language/generation/test_hybrid.py | 414 +++++++++++++++++-
 vllm/config/cache.py                          |   3 +-
 vllm/engine/arg_utils.py                      |   7 +-
 .../layers/mamba/mamba_mixer2.py              | 113 ++++-
 .../layers/mamba/ops/causal_conv1d.py         | 242 +++++++---
 .../layers/mamba/ops/mamba_ssm.py             |  18 +-
 .../layers/mamba/ops/ssd_combined.py          |  44 +-
 vllm/model_executor/models/bamba.py           |   4 -
 vllm/model_executor/models/config.py          |  69 ++-
 vllm/model_executor/models/falcon_h1.py       |   3 -
 .../model_executor/models/granitemoehybrid.py |   5 -
 vllm/model_executor/models/mamba2.py          |   3 -
 vllm/model_executor/models/nemotron_h.py      |   3 -
 vllm/model_executor/models/zamba2.py          |   3 -
 vllm/v1/attention/backends/mamba2_attn.py     |  91 +++-
 vllm/v1/core/single_type_kv_cache_manager.py  |  26 +-
 vllm/v1/kv_cache_interface.py                 |   6 +-
 vllm/v1/worker/gpu_model_runner.py            |  10 +-
 18 files changed, 917 insertions(+), 147 deletions(-)

diff --git a/tests/models/language/generation/test_hybrid.py b/tests/models/language/generation/test_hybrid.py
index 9d67b46f2e3e..bd7157568e84 100644
--- a/tests/models/language/generation/test_hybrid.py
+++ b/tests/models/language/generation/test_hybrid.py
@@ -1,6 +1,8 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
+from typing import Callable
+
 import pytest
 
 from tests.models.registry import HF_EXAMPLE_MODELS
@@ -8,7 +10,7 @@
 from vllm.engine.arg_utils import EngineArgs
 from vllm.sampling_params import SamplingParams
 
-from ...utils import check_logprobs_close
+from ...utils import check_logprobs_close, check_outputs_equal
 
 # Mark all tests as hybrid
 pytestmark = pytest.mark.hybrid_model
@@ -332,3 +334,413 @@ def test_fp32_cache_state(
         name_0="hf",
         name_1="vllm",
     )
+
+
+# Helper functions for the APC tests
+def _get_vllm_runner_params(model, max_model_len, tensor_parallel_size=1):
+    return {
+        'model_name': model,
+        'enable_prefix_caching': False,
+        'max_model_len': max_model_len,
+        'tensor_parallel_size': tensor_parallel_size,
+        'gpu_memory_utilization': 0.4
+    }
+
+
+def _get_vLLM_output(vllm_runner,
+                     kwargs,
+                     prompts,
+                     max_tokens,
+                     num_logprobs,
+                     num_repetitions=1,
+                     vllm_model=None):
+    outs = []
+    if vllm_model is None:
+        vllm_model = vllm_runner(**kwargs)
+    for _ in range(num_repetitions):
+        if num_logprobs < 0:
+            vllm_output = vllm_model.generate_greedy(prompts, max_tokens)
+        else:
+            vllm_output = vllm_model.generate_greedy_logprobs(
+                prompts, max_tokens, num_logprobs)
+        outs.append(vllm_output)
+
+    return outs, vllm_model
+
+
+@pytest.mark.parametrize("model", [HYBRID_MODELS[3]])
+@pytest.mark.parametrize("max_tokens", [64])
+@pytest.mark.parametrize("n_repetitions", [2])
+# If num_logprobs is set to -1, then the stringent version
+# of the test is executed using `check_outputs_equal`
+# instead of `check_logprobs_close`
+@pytest.mark.parametrize("num_logprobs", [5])
+@pytest.mark.parametrize("tensor_parallel_size", [1])
+def test_apc_single_prompt(
+    hf_runner,
+    vllm_runner,
+    example_prompts,
+    monkeypatch,
+    model: str,
+    max_tokens: int,
+    n_repetitions: int,
+    num_logprobs: int,
+    tensor_parallel_size: int,
+) -> None:
+
+    try:
+        model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
+        model_info.check_available_online(on_fail="skip")
+        model_info.check_transformers_version(on_fail="skip")
+    except ValueError:
+        pass
+
+    compare_operator: Callable = check_logprobs_close \
+          if num_logprobs > 0 else check_outputs_equal # type: ignore
+
+    MULTIPLE = 300
+
+    # Sample prompts.
+    generated_prompts = [MULTIPLE * example_prompts[0]]
+
+    max_model_len = max(
+        len(prompt) + max_tokens for prompt in generated_prompts)
+    vllm_runner_kwargs = _get_vllm_runner_params(
+        model, max_model_len, tensor_parallel_size=tensor_parallel_size)
+    vllm_runner_kwargs['mamba_ssm_cache_dtype'] = "float32"
+    vllm_outputs_no_cache, _ = _get_vLLM_output(vllm_runner,
+                                                vllm_runner_kwargs,
+                                                generated_prompts, max_tokens,
+                                                num_logprobs)
+
+    vllm_runner_kwargs['enable_prefix_caching'] = True
+    vllm_outputs_cache_rep, _ = _get_vLLM_output(vllm_runner,
+                                                 vllm_runner_kwargs,
+                                                 generated_prompts, max_tokens,
+                                                 num_logprobs, n_repetitions)
+
+    for r_idx, vllm_outputs_cache_itn in enumerate(vllm_outputs_cache_rep):
+        # In the first repetition, the caches are filled
+        # In the second repetition, these caches are reused
+
+        compare_operator(
+            outputs_0_lst=vllm_outputs_no_cache[0],
+            outputs_1_lst=vllm_outputs_cache_itn,
+            name_0="vllm_no_cache",
+            name_1=f"vllm_cache_it_{r_idx + 1}",
+        )
+
+
+@pytest.mark.parametrize("model", [HYBRID_MODELS[3]])
+@pytest.mark.parametrize("max_tokens", [64])
+@pytest.mark.parametrize("n_repetitions", [2])
+# If num_logprobs is set to -1, then the stringent version
+# of the test is executed using `check_outputs_equal`
+# instead of `check_logprobs_close`
+@pytest.mark.parametrize("num_logprobs", [5])
+@pytest.mark.parametrize("tensor_parallel_size", [1])
+def test_apc_single_prompt_block_align_alignment(
+    hf_runner,
+    vllm_runner,
+    example_prompts,
+    monkeypatch,
+    model: str,
+    max_tokens: int,
+    n_repetitions: int,
+    num_logprobs: int,
+    tensor_parallel_size: int,
+) -> None:
+
+    try:
+        model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
+        model_info.check_available_online(on_fail="skip")
+        model_info.check_transformers_version(on_fail="skip")
+    except ValueError:
+        pass
+
+    compare_operator: Callable = check_logprobs_close \
+                    if num_logprobs > 0 else check_outputs_equal # type: ignore
+
+    MULTIPLE = 300
+
+    # Sample prompts. This custom prompt is used, as it causes the most issues
+    generated_prompts = ["The president of the United States is " * MULTIPLE]
+
+    max_model_len = max(
+        len(prompt) + max_tokens for prompt in generated_prompts)
+    vllm_runner_kwargs = _get_vllm_runner_params(
+        model, max_model_len, tensor_parallel_size=tensor_parallel_size)
+    vllm_runner_kwargs['mamba_ssm_cache_dtype'] = "float32"
+
+    vllm_outputs_no_cache, _ = _get_vLLM_output(vllm_runner,
+                                                vllm_runner_kwargs,
+                                                generated_prompts, max_tokens,
+                                                num_logprobs)
+
+    vllm_runner_kwargs['enable_prefix_caching'] = True
+    with vllm_runner(**vllm_runner_kwargs) as vllm_model:
+        # Retrieve the default mamba state block size
+        mamba_block_size = vllm_model.llm.llm_engine.cache_config. \
+            mamba_block_size
+
+    # In case the hybrid model does not have the
+    # "mamba_block_size" assume a fixed constant
+    if mamba_block_size is None:
+        mamba_block_size = 512
+
+    mamba_block_size_multiplier = 10
+    for offsets in [
+            -3, 3, mamba_block_size // 4 + 3, mamba_block_size // 2 - 3
+    ]:
+
+        vllm_runner_kwargs[
+            'max_num_batched_tokens'] = mamba_block_size_multiplier * \
+                                        mamba_block_size - offsets
+        vllm_outputs_cache_rep, _ = _get_vLLM_output(vllm_runner,
+                                                     vllm_runner_kwargs,
+                                                     generated_prompts,
+                                                     max_tokens, num_logprobs,
+                                                     n_repetitions)
+
+        # Check alignment of the output logits when using APC
+        for r_idx, vllm_outputs_cache_itn in enumerate(vllm_outputs_cache_rep):
+            # In the first repetition, the caches are filled
+            # In the second repetition, these caches are reused
+
+            compare_operator(
+                outputs_0_lst=vllm_outputs_no_cache[0],
+                outputs_1_lst=vllm_outputs_cache_itn,
+                name_0="vllm_no_cache",
+                name_1=f"vllm_cache_it_{r_idx + 1}",
+            )
+
+
+@pytest.mark.parametrize("model", [HYBRID_MODELS[3]])
+@pytest.mark.parametrize("max_tokens", [64])
+@pytest.mark.parametrize("n_repetitions", [2])
+# If num_logprobs is set to -1, then the stringent version
+# of the test is executed using `check_outputs_equal`
+# instead of `check_logprobs_close`
+@pytest.mark.parametrize("num_logprobs", [5])
+@pytest.mark.parametrize("tensor_parallel_size", [1])
+def test_apc_multiple_prompts_all_cached_outputs(
+    hf_runner,
+    vllm_runner,
+    example_prompts,
+    monkeypatch,
+    model: str,
+    max_tokens: int,
+    n_repetitions: int,
+    num_logprobs: int,
+    tensor_parallel_size: int,
+) -> None:
+
+    try:
+        model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
+        model_info.check_available_online(on_fail="skip")
+        model_info.check_transformers_version(on_fail="skip")
+    except ValueError:
+        pass
+
+    compare_operator: Callable = check_logprobs_close \
+        if num_logprobs > 0 else check_outputs_equal # type: ignore
+
+    MULTIPLE = 300
+
+    # Sample prompts.
+    generated_prompts = [MULTIPLE * prompt for prompt in example_prompts]
+
+    max_model_len = max(
+        len(prompt) + max_tokens for prompt in generated_prompts)
+    vllm_runner_kwargs = _get_vllm_runner_params(
+        model, max_model_len, tensor_parallel_size=tensor_parallel_size)
+    vllm_runner_kwargs['mamba_ssm_cache_dtype'] = "float32"
+
+    vllm_outputs_no_cache, _ = _get_vLLM_output(vllm_runner,
+                                                vllm_runner_kwargs,
+                                                generated_prompts, max_tokens,
+                                                num_logprobs)
+
+    vllm_runner_kwargs['enable_prefix_caching'] = True
+    vllm_outputs_cache_rep, _ = _get_vLLM_output(vllm_runner,
+                                                 vllm_runner_kwargs,
+                                                 generated_prompts, max_tokens,
+                                                 num_logprobs, n_repetitions)
+
+    for r_idx, vllm_outputs_cache_itn in enumerate(vllm_outputs_cache_rep):
+        # In the first repetition, the caches are filled
+        # In the second repetition, these caches are reused
+
+        compare_operator(
+            outputs_0_lst=vllm_outputs_no_cache[0],
+            outputs_1_lst=vllm_outputs_cache_itn,
+            name_0="vllm_no_cache",
+            name_1=f"vllm_cache_it_{r_idx + 1}",
+        )
+
+
+@pytest.mark.parametrize("model", [HYBRID_MODELS[3]])
+@pytest.mark.parametrize("max_tokens", [64])
+@pytest.mark.parametrize("n_repetitions", [2])
+# If num_logprobs is set to -1, then the stringent version
+# of the test is executed using `check_outputs_equal`
+# instead of `check_logprobs_close`
+@pytest.mark.parametrize("num_logprobs", [5])
+@pytest.mark.parametrize("tensor_parallel_size", [1])
+def test_apc_multiple_prompts_block_align_alignment(
+    hf_runner,
+    vllm_runner,
+    example_prompts,
+    monkeypatch,
+    model: str,
+    max_tokens: int,
+    n_repetitions: int,
+    num_logprobs: int,
+    tensor_parallel_size: int,
+) -> None:
+
+    try:
+        model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
+        model_info.check_available_online(on_fail="skip")
+        model_info.check_transformers_version(on_fail="skip")
+    except ValueError:
+        pass
+
+    compare_operator: Callable = check_logprobs_close \
+        if num_logprobs > 0 else check_outputs_equal # type: ignore
+
+    MULTIPLE = 300
+
+    # Sample prompts. This custom prompt is used, as it causes the most issues
+    prompt_text = "The president of the United States is "
+    prompt_offsets = [0, 3, 7, 13, 17, 22, 25, 31]
+    generated_prompts = [
+        prompt_text[offset:] * MULTIPLE for offset in prompt_offsets
+    ]
+
+    max_model_len = max(
+        len(prompt) + max_tokens for prompt in generated_prompts)
+    vllm_runner_kwargs = _get_vllm_runner_params(model, max_model_len,
+                                                 tensor_parallel_size)
+    vllm_runner_kwargs['mamba_ssm_cache_dtype'] = "float32"
+
+    vllm_outputs_no_cache, _ = _get_vLLM_output(vllm_runner,
+                                                vllm_runner_kwargs,
+                                                generated_prompts, max_tokens,
+                                                num_logprobs)
+
+    vllm_runner_kwargs['enable_prefix_caching'] = True
+    with vllm_runner(**vllm_runner_kwargs) as vllm_model:
+        # Retrieve the default mamba state block size
+        mamba_block_size = vllm_model.llm.llm_engine.cache_config. \
+            mamba_block_size
+
+    # In case the hybrid model does not have the
+    # "mamba_block_size" assume a fixed constant
+    if mamba_block_size is None:
+        mamba_block_size = 512
+
+    mamba_block_size_multiplier = 10
+    for offsets in [
+            -3, 3, mamba_block_size // 4 + 3, mamba_block_size // 2 - 3
+    ]:
+
+        vllm_runner_kwargs[
+            'max_num_batched_tokens'] = mamba_block_size_multiplier * \
+                                        mamba_block_size - offsets
+        vllm_outputs_cache_rep, _ = _get_vLLM_output(vllm_runner,
+                                                     vllm_runner_kwargs,
+                                                     generated_prompts,
+                                                     max_tokens, num_logprobs,
+                                                     n_repetitions)
+
+        # Check alignment of the output logits when using APC
+        for r_idx, vllm_outputs_cache_itn in enumerate(vllm_outputs_cache_rep):
+            # In the first repetition, the caches are filled
+            # In the second repetition, these caches are reused
+
+            compare_operator(
+                outputs_0_lst=vllm_outputs_no_cache[0],
+                outputs_1_lst=vllm_outputs_cache_itn,
+                name_0="vllm_no_cache",
+                name_1=f"vllm_cache_it_{r_idx + 1}",
+            )
+
+
+@pytest.mark.parametrize("model", [HYBRID_MODELS[3]])
+@pytest.mark.parametrize("max_tokens", [64])
+@pytest.mark.parametrize("n_repetitions", [2])
+# If num_logprobs is set to -1, then the stringent version
+# of the test is executed using `check_outputs_equal`
+# instead of `check_logprobs_close`
+@pytest.mark.parametrize("num_logprobs", [5])
+@pytest.mark.parametrize("tensor_parallel_size", [1])
+def test_apc_multiple_prompts_partial_cached_outputs(
+    hf_runner,
+    vllm_runner,
+    example_prompts,
+    monkeypatch,
+    model: str,
+    max_tokens: int,
+    n_repetitions: int,
+    num_logprobs: int,
+    tensor_parallel_size: int,
+) -> None:
+
+    try:
+        model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
+        model_info.check_available_online(on_fail="skip")
+        model_info.check_transformers_version(on_fail="skip")
+    except ValueError:
+        pass
+
+    compare_operator: Callable = check_logprobs_close \
+        if num_logprobs > 0 else check_outputs_equal # type: ignore
+
+    MULTIPLE = 300
+
+    # Sample prompts.
+    generated_prompts = [MULTIPLE * prompt for prompt in example_prompts]
+
+    max_model_len = max(
+        len(prompt) + max_tokens for prompt in generated_prompts)
+    vllm_runner_kwargs = _get_vllm_runner_params(
+        model, max_model_len, tensor_parallel_size=tensor_parallel_size)
+    vllm_runner_kwargs['mamba_ssm_cache_dtype'] = "float32"
+
+    vllm_outputs_no_cache, _ = _get_vLLM_output(vllm_runner,
+                                                vllm_runner_kwargs,
+                                                generated_prompts, max_tokens,
+                                                num_logprobs)
+
+    # Cache only part of all the prompts
+    vllm_runner_kwargs['enable_prefix_caching'] = True
+    vllm_outputs_partial_cache, vllm_model = _get_vLLM_output(
+        vllm_runner, vllm_runner_kwargs, generated_prompts[:3], max_tokens,
+        num_logprobs)
+
+    compare_operator(
+        outputs_0_lst=vllm_outputs_no_cache[0][:3],
+        outputs_1_lst=vllm_outputs_partial_cache[0],
+        name_0="vllm_no_cache",
+        name_1="vllm_partial_cache",
+    )
+
+    vllm_outputs_cache_rep, _ = _get_vLLM_output(vllm_runner,
+                                                 vllm_runner_kwargs,
+                                                 generated_prompts,
+                                                 max_tokens,
+                                                 num_logprobs,
+                                                 n_repetitions,
+                                                 vllm_model=vllm_model)
+
+    for r_idx, vllm_outputs_cache_itn in enumerate(vllm_outputs_cache_rep):
+        # In the first repetition, the caches are filled
+        # In the second repetition, these caches are reused
+
+        compare_operator(
+            outputs_0_lst=vllm_outputs_no_cache[0],
+            outputs_1_lst=vllm_outputs_cache_itn,
+            name_0="vllm_no_cache",
+            name_1=f"vllm_cache_it_{r_idx + 1}",
+        )
diff --git a/vllm/config/cache.py b/vllm/config/cache.py
index 58770649a8af..bdfa99cd79a3 100644
--- a/vllm/config/cache.py
+++ b/vllm/config/cache.py
@@ -92,7 +92,8 @@ class CacheConfig:
     mamba_page_size_padded: Optional[int] = None
     """ Optional override for mamba page size; used by hybrid mamba/attention
     models to ensure exact alignment with attention page size."""
-
+    mamba_block_size: Optional[int] = None
+    """Size of a contiguous cache block in number of tokens for mamba cache."""
     mamba_cache_dtype: MambaDType = "auto"
     """The data type to use for the Mamba cache (both the conv as well as the
     ssm state). If set to 'auto', the data type will be inferred from the model
diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index bf293a4d2aa9..89a881675ad6 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -1563,7 +1563,12 @@ def _set_default_args(self, usage_context: UsageContext,
                 self.enable_prefix_caching = False
 
             if self.enable_prefix_caching is None:
-                self.enable_prefix_caching = True
+                # Disable prefix caching default for hybrid models
+                # since the feature is still experimental.
+                if model_config.is_hybrid:
+                    self.enable_prefix_caching = False
+                else:
+                    self.enable_prefix_caching = True
         else:
 
             pooling_type = model_config.pooler_config.pooling_type
diff --git a/vllm/model_executor/layers/mamba/mamba_mixer2.py b/vllm/model_executor/layers/mamba/mamba_mixer2.py
index bfb0666d361f..56df9cf511e6 100644
--- a/vllm/model_executor/layers/mamba/mamba_mixer2.py
+++ b/vllm/model_executor/layers/mamba/mamba_mixer2.py
@@ -489,6 +489,9 @@ def forward_cuda(
         # stay the same and reused for all mamba layers in the same iteration
         attn_metadata: AttentionMetadata = forward_context.attn_metadata
 
+        assert self.cache_config is not None
+        mamba_block_size = self.cache_config.mamba_block_size
+        prefix_caching_enabled = self.cache_config.enable_prefix_caching
         if attn_metadata is not None:
             assert isinstance(attn_metadata, dict)
             attn_metadata = attn_metadata[self.prefix]
@@ -573,6 +576,25 @@ def forward_cuda(
             dim=0,
         )
 
+        if prefix_caching_enabled:
+            # If prefix caching is enabled, retrieve the relevant variables
+            # for prefill and decode
+            last_state_idx_d, last_state_idx_p = torch.split(
+                attn_metadata.last_state_idx, [num_decodes, num_prefills],
+                dim=0)
+            current_last_idx_d, current_last_idx_p = torch.split(
+                attn_metadata.current_last_idx, [num_decodes, num_prefills],
+                dim=0)
+            # Prefill-only variables:
+            current_first_idx_p = attn_metadata.current_first_idx_p
+            context_lens_p = attn_metadata.context_lens_p
+            last_computed_offset_p = attn_metadata.last_computed_offset_p
+        else:
+            last_state_idx_d, last_state_idx_p = None, None
+            current_last_idx_d, current_last_idx_p = None, None
+            current_first_idx_p = None
+            context_lens_p = None
+
         # Preallocate output tensor to avoid memcpy cost for merging prefill
         # and decode outputs
         preallocated_ssm_out = torch.empty(
@@ -592,8 +614,17 @@ def forward_cuda(
         # Process prefill requests
         if has_prefill:
             # 2. Convolution sequence transformation
-            # - "cache_indices" updates the conv_state cache in positions
-            #   pointed to by "state_indices_tensor"
+            # - It will read the initial states for every sequence,
+            #   that has "has_initial_states_p" == True,
+            #   from "cache_indices", using "state_indices_tensor_p".
+            # - It updates the "conv_state" cache in positions pointed
+            #   to by "state_indices_tensor_p".
+            #   In particular, it will always write the state at the
+            #   sequence end.
+            #   In addition, "current_first_idx_p" and "current_last_idx_p"
+            #   are provided (which are pointers into
+            #   "state_indices_tensor_p"), it will write additional cache
+            #   states aligned at "block_size_to_align".
             x = hidden_states_B_C_p.transpose(
                 0, 1)  # this is the form that causal-conv see
             hidden_states_B_C_p = causal_conv1d_fn(
@@ -604,6 +635,11 @@ def forward_cuda(
                 conv_states=conv_state,
                 has_initial_state=has_initial_states_p,
                 cache_indices=state_indices_tensor_p,
+                current_first_idx=current_first_idx_p,
+                current_last_idx=current_last_idx_p,
+                initial_state_idx=last_state_idx_p,
+                context_lens=context_lens_p,
+                block_size_to_align=mamba_block_size,
                 metadata=attn_metadata,
                 query_start_loc=query_start_loc_p).transpose(
                     0, 1)[:num_prefill_tokens]
@@ -614,9 +650,13 @@ def forward_cuda(
             # 3. State Space Model sequence transformation
             initial_states = None
             if (has_initial_states_p is not None and prep_initial_states):
+                kernel_ssm_indices = state_indices_tensor_p
+                if prefix_caching_enabled:
+                    kernel_ssm_indices = state_indices_tensor_p.gather(
+                        1, last_state_idx_p.unsqueeze(1)).squeeze(1)
                 initial_states = torch.where(
                     has_initial_states_p[:, None, None, None],
-                    ssm_state[state_indices_tensor_p], 0)
+                    ssm_state[kernel_ssm_indices], 0)
 
             # NOTE: final output is an in-place update of out tensor
             varlen_states = mamba_chunk_scan_combined_varlen(
@@ -638,18 +678,71 @@ def forward_cuda(
                 cu_chunk_seqlens=cu_chunk_seqlen_p,
                 last_chunk_indices=last_chunk_indices_p,
                 initial_states=initial_states,
+                return_intermediate_states=prefix_caching_enabled,
                 dt_softplus=True,
                 dt_limit=(0.0, float("inf")),
                 out=preallocated_ssm_out_p.view(num_prefill_tokens, -1,
                                                 self.head_dim),
                 state_dtype=ssm_state.dtype)
 
-            # update ssm states
-            # - varlen state is a (num_prefills, nheads, headdim, dstate) tensor
-            ssm_state[state_indices_tensor_p] = varlen_states
+            if prefix_caching_enabled:
+                # Save states for sequences with more than just the final state:
+                n_blocks_to_fill = current_last_idx_p - current_first_idx_p
+                for seq_idx in (n_blocks_to_fill > 0).nonzero().squeeze(1):
+                    cache_blocks_to_fill = state_indices_tensor_p[
+                        seq_idx, current_first_idx_p[seq_idx]:
+                        current_first_idx_p[seq_idx] +
+                        n_blocks_to_fill[seq_idx]]
+                    # chunks = [0 1 2 3 4 5 6 ...]
+                    # First aligned chunk would typically be:
+                    #  mamba_block_size = 1024, chunk_size = 256
+                    #  1024 // 256 - 1 --> chunks[3]
+                    # But when last chunk wasn't block aligned:
+                    # - last_computed_offset_p[seq_idx] // chunk_size
+                    # e.g. 1000 // 256 -> 3 completed --> store chunk[0]
+                    # e.g. 513 // 256 -> 2 completed --> store chunk[1] (skip 1)
+                    # e.g. 256 // 256 -> 1 completed --> store chunk[2] (skip 2)
+                    # e.g. 10 // 256 -> 0 completed --> store chunk[3] (skip 3)
+                    chunk_stride = mamba_block_size // chunk_size
+                    first_aligned_chunk = \
+                      torch.concat([torch.zeros(1, \
+                                    dtype=last_chunk_indices_p.dtype, \
+                                    device=last_chunk_indices_p.device), \
+                                    last_chunk_indices_p + 1])[seq_idx] \
+                       + chunk_stride - 1 \
+                       - last_computed_offset_p[seq_idx] // chunk_size
+                    from_where = varlen_states[
+                        first_aligned_chunk:first_aligned_chunk +
+                        n_blocks_to_fill[seq_idx] * chunk_stride:chunk_stride]
+                    ssm_state[cache_blocks_to_fill] = from_where
+
+                #For all seqs, store the last state (Note: might be partial):
+                ssm_state[state_indices_tensor_p.gather(1,
+                        current_last_idx_p.unsqueeze(1)).squeeze(1)] = \
+                    varlen_states[last_chunk_indices_p]
+            else:
+                # update ssm states
+                # - varlen state is a (num_prefills, nheads, headdim, dstate)
+                #   tensor
+                ssm_state[state_indices_tensor_p] = varlen_states
 
         # Process decode requests
         if has_decode:
+            if prefix_caching_enabled:
+                state_indices_tensor_d_input = \
+                    state_indices_tensor_d.gather(1,
+                        last_state_idx_d.unsqueeze(1)).squeeze(1)
+                state_indices_tensor_d_output = \
+                    state_indices_tensor_d.gather(1,
+                        current_last_idx_d.unsqueeze(1)).squeeze(1)
+                #Note:
+                # for decode always: current_first_idx_d == current_last_idx_d
+                # at block boundaries: current_first_idx_d > last_state_idx_d
+            else:
+                # Without caching, read and write in-place to the same blocks:
+                state_indices_tensor_d_input = state_indices_tensor_d
+                state_indices_tensor_d_output = state_indices_tensor_d
+
             # 2. Convolution sequence transformation
             hidden_states_B_C_d = causal_conv1d_update(
                 hidden_states_B_C_d,
@@ -657,7 +750,10 @@ def forward_cuda(
                 conv_weights,
                 self.conv1d.bias,
                 self.activation,
-                conv_state_indices=state_indices_tensor_d)
+                conv_state_indices=state_indices_tensor_d,
+                current_last_idx=current_last_idx_d,
+                initial_state_idx=last_state_idx_d,
+            )
 
             hidden_states_d, B_d, C_d = split_hidden_states_B_C_fn(
                 hidden_states_B_C_d)
@@ -689,7 +785,8 @@ def forward_cuda(
                 z=None,
                 dt_bias=dt_bias,
                 dt_softplus=True,
-                state_batch_indices=state_indices_tensor_d,
+                state_batch_indices=state_indices_tensor_d_input,
+                dst_state_batch_indices=state_indices_tensor_d_output,
                 out=preallocated_ssm_out_d.view(num_decodes, -1,
                                                 self.head_dim),
             )
diff --git a/vllm/model_executor/layers/mamba/ops/causal_conv1d.py b/vllm/model_executor/layers/mamba/ops/causal_conv1d.py
index c4102c4753c7..a02bba5d4ddd 100644
--- a/vllm/model_executor/layers/mamba/ops/causal_conv1d.py
+++ b/vllm/model_executor/layers/mamba/ops/causal_conv1d.py
@@ -20,19 +20,23 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
     w_ptr,  # (dim, width)
     bias_ptr,
     initial_states_ptr,  # conv_states_ptr
-    cache_indices_ptr,  # conv_state_indices_ptr
+    cache_indices_ptr,  # (batch, n_blocks + padding) The second dimension contains
+    # the block indices relevant for each sequence
+    # plus potential 0-padding at the beginning and at the end
     has_initial_states_ptr,
     query_start_loc_ptr,
     batch_ptr,
     token_chunk_offset_ptr,
+    current_first_idx,  # (batch,)
+    current_last_idx,  # (batch,)
+    initial_state_idx,  # (batch,)
+    context_lens,  # (batch,)
     o_ptr,  # (dim, seqlen) - actually pointing to x_ptr
     # Matrix dimensions
-    batch: tl.int32,  # actually padded_batch
     dim: tl.constexpr,
     seqlen: tl.int32,  # cu_seqlen
     num_cache_lines: tl.constexpr,  # added to support vLLM larger cache lines
     # Strides
-    stride_x_seq: tl.constexpr,  # stride to get to next sequence,
     stride_x_dim: tl.constexpr,  # stride to get to next feature-value,
     stride_x_token: tl.
     constexpr,  # stride to get to next token (same feature-index, same sequence-index)
@@ -42,18 +46,16 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
     stride_istate_dim: tl.constexpr,
     stride_istate_token: tl.constexpr,
     stride_cache_indices: tl.constexpr,
-    stride_o_seq: tl.constexpr,
     stride_o_dim: tl.constexpr,
     stride_o_token: tl.constexpr,
+    stride_block_m: tl.constexpr,  # Stride block to align divided by BLOCK_M
     # others
     pad_slot_id: tl.constexpr,
     # Meta-parameters
     HAS_BIAS: tl.constexpr,
     KERNEL_WIDTH: tl.constexpr,
     SILU_ACTIVATION: tl.constexpr,
-    HAS_INITIAL_STATES: tl.constexpr,
-    HAS_CACHE: tl.constexpr,
-    IS_CONTINUOUS_BATCHING: tl.constexpr,
+    IS_APC_ENABLED: tl.constexpr,
     USE_PAD_SLOT: tl.constexpr,
     NP2_STATELEN: tl.constexpr,
     BLOCK_M: tl.constexpr,
@@ -84,26 +86,57 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
     # find the actual sequence length
     seqlen = sequence_end_index - sequence_start_index
 
+    B_size: tl.constexpr = (stride_block_m * BLOCK_M)
+
+    if IS_APC_ENABLED:
+        # Handle the case if prefix caching is enabled.
+        # In particular, if prefix caching is enabled, the program write additional cache states to "cache_indices_ptr"
+
+        # Get the length of the completed sequence so far and compute the offset.
+        current_first_index = tl.load(current_first_idx + idx_seq)
+        current_last_index = tl.load(current_last_idx + idx_seq)
+        sequence_completed_index = tl.load(context_lens + idx_seq)
+
+        # Compute the offset where the first stride_block_m-aligned first full block is
+        # Value in "token-space"
+        sequence_completed_offset_token = sequence_completed_index % B_size
+        seq_completed_offset = B_size - sequence_completed_offset_token
+        seq_end_offset = (seqlen - seq_completed_offset) % B_size
+        last_full_block_token_index = sequence_end_index - seq_end_offset
+        # If the sequence without the sequence_offset_index is stride_cache_chunk-aligned, then the last full chunk is the second-to-last one
+        if seq_end_offset == 0:
+            last_full_block_token_index = last_full_block_token_index - B_size
+
+        # Get the number of blocks to be filled for the current sequence
+        # If n_block_to_fill = 0, then only the state at the sequence end is stored
+        n_block_to_fill = current_last_index - current_first_index
+
+        # Get the index of the init block
+        conv_state_init_index = tl.load(initial_state_idx + idx_seq)
+    else:
+        n_block_to_fill = 0
+        current_last_index = 0
+        conv_state_init_index = 0
+        current_first_index = 0
+        last_full_block_token_index = 0
+
     token_offset = BLOCK_M * chunk_offset
     segment_len = min(BLOCK_M, seqlen - token_offset)
 
     # base of the sequence
     x_base = x_ptr + sequence_start_index * stride_x_token + idx_feats * stride_x_dim  # [BLOCK_N,]
 
-    if IS_CONTINUOUS_BATCHING:
-        # cache_idx
-        conv_state_batch_coord = tl.load(conv_state_indices_ptr +
-                                         idx_seq * stride_cache_indices).to(
-                                             tl.int64)
-    else:
-        # cache_idx
-        conv_state_batch_coord = idx_seq
+    # cache_idx
+    conv_states_input_coord = tl.load(conv_state_indices_ptr +
+                                      idx_seq * stride_cache_indices +
+                                      conv_state_init_index).to(tl.int64)
+
     if USE_PAD_SLOT:  # noqa
-        if conv_state_batch_coord == pad_slot_id:
+        if conv_states_input_coord == pad_slot_id:
             # not processing as this is not the actual sequence
             return
     conv_states_base = (conv_states_ptr +
-                        (conv_state_batch_coord * stride_conv_state_seq) +
+                        (conv_states_input_coord * stride_conv_state_seq) +
                         (idx_feats * stride_conv_state_dim))  # [BLOCK_N,]
 
     w_base = w_ptr + (idx_feats * stride_w_dim)  # [BLOCK_N,]
@@ -113,10 +146,7 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
     # 2. update conv_state with new data [only by the Triton program handles chunk_offset=0]
     if chunk_offset == 0:
         # read from conv_states
-        load_init_state = False
-        if HAS_INITIAL_STATES:  # the new HAS_INITIAL_STATES
-            load_init_state = tl.load(has_initial_states_ptr + idx_seq).to(
-                tl.int1)
+        load_init_state = tl.load(has_initial_states_ptr + idx_seq).to(tl.int1)
         if load_init_state:
             # load from conv_states
             prior_tokens = conv_states_base + (state_len -
@@ -175,15 +205,23 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
                       (idx_feats < dim)[None, :]
                       )  # token-index  # token-index  # feature-index
             loaded_x = tl.load(x_ptrs, mask_x, 0.0)
-            new_conv_state = tl.load(x_ptrs, mask_x, 0.0)
             idx_tokens_conv = tl.arange(0, NP2_STATELEN)  # [BLOCK_M]
-            conv_states_ptrs_target = conv_states_base[None, :] + (
-                idx_tokens_conv * stride_conv_state_tok)[:, None]
+
+            # Compute the offset where the last block should be written in the conv_states
+            conv_states_output_coord = tl.load(conv_state_indices_ptr +
+                                               idx_seq * stride_cache_indices +
+                                               current_last_index).to(tl.int64)
+
+            conv_states_ptrs_target = (
+                conv_states_ptr + (conv_states_output_coord *
+                                   stride_conv_state_seq) +  # Offset from seq
+                (idx_feats * stride_conv_state_dim))[None, :] + (  # [BLOCK_N,]
+                    idx_tokens_conv * stride_conv_state_tok)[:, None]
 
             mask = (idx_tokens_conv < state_len)[:, None] & (idx_feats
                                                              < dim)[None, :]
             tl.debug_barrier()  #  NOTE: use this due to bug in Triton compiler
-            tl.store(conv_states_ptrs_target, new_conv_state, mask)
+            tl.store(conv_states_ptrs_target, loaded_x, mask)
 
         else:
             if load_init_state:
@@ -192,12 +230,12 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
 
                 conv_states_ptrs_source = (
                     conv_states_ptr +
-                    (conv_state_batch_coord * stride_conv_state_seq) +
+                    (conv_states_input_coord * stride_conv_state_seq) +
                     (idx_feats * stride_conv_state_dim)[None, :] +
                     ((idx_tokens_conv + seqlen) * stride_conv_state_tok)[:,
                                                                          None]
                 )  # [BLOCK_M, BLOCK_N]
-                mask = ((conv_state_batch_coord < num_cache_lines)
+                mask = ((conv_states_input_coord < num_cache_lines)
                         & ((idx_tokens_conv + seqlen) < state_len)[:, None]
                         & (idx_feats < dim)[None, :])
                 conv_state = tl.load(conv_states_ptrs_source, mask, other=0.0)
@@ -280,6 +318,45 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
             conv_states_ptrs = prior_tokens - 3 * stride_x_token  # [BLOCK_N]
             col0 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier='.ca')
 
+        # Store intermediate states aligned with stride_block_m
+        # The additional states are cached starting from the last stride_block_m.
+        # For example:
+        # If n_block_to_fill = 0, then only the state at the sequence end is cached and the process below is not involved.
+        # If n_block_to_fill > 0, then the states at the sequence end and at the n_block_to_fill-last
+        # stride_block_m are cached.
+        # For example chunk_offset = n_block_to_fill stores the state at last_full_block
+        if (chunk_offset - 1) < n_block_to_fill:
+            # Store the states at the chunk boundaries from the start of the sequence
+            idx_tokens_last = (last_full_block_token_index -
+                               (n_block_to_fill - chunk_offset) * B_size -
+                               state_len) + tl.arange(
+                                   0, NP2_STATELEN)  # [BLOCK_M]
+            x_ptrs = x_ptr + (idx_tokens_last * stride_x_token)[:, None] + (
+                idx_feats * stride_x_dim)[None, :]  # [BLOCK_M,BLOCK_N,]
+
+            mask_x = (
+                (idx_tokens_last >= 0)[:, None] & (idx_feats < dim)[None, :]
+            )  # token-index  # token-index  # feature-index
+            loaded_x = tl.load(x_ptrs, mask_x, 0.0)
+            idx_tokens_conv = tl.arange(0, NP2_STATELEN)  # [BLOCK_M]
+
+            # cache_idx
+            conv_states_output_coord = tl.load(conv_state_indices_ptr +
+                                               idx_seq * stride_cache_indices +
+                                               current_first_index +
+                                               (chunk_offset - 1)).to(tl.int64)
+
+            conv_states_ptrs_target = (
+                conv_states_ptr + (conv_states_output_coord *
+                                   stride_conv_state_seq) +  # Offset from seq
+                (idx_feats * stride_conv_state_dim))[None, :] + (  # [BLOCK_N,]
+                    idx_tokens_conv * stride_conv_state_tok)[:, None]
+
+            mask = (idx_tokens_conv < state_len)[:, None] & \
+                   (idx_feats < dim)[None, :]
+            tl.debug_barrier()  #  NOTE: use this due to bug in Triton compiler
+            tl.store(conv_states_ptrs_target, loaded_x, mask)
+
     if HAS_BIAS:
         bias = bias_ptr + idx_feats
         mask_bias = idx_feats < dim
@@ -368,6 +445,11 @@ def causal_conv1d_fn(
     has_initial_state: Optional[torch.Tensor] = None,
     activation: Optional[str] = "silu",
     pad_slot_id: int = PAD_SLOT_ID,
+    current_first_idx: Optional[torch.Tensor] = None,
+    current_last_idx: Optional[torch.Tensor] = None,
+    initial_state_idx: Optional[torch.Tensor] = None,
+    context_lens: Optional[torch.Tensor] = None,
+    block_size_to_align=0,
     metadata=None,
     validate_data=False,
 ):
@@ -378,7 +460,7 @@ def causal_conv1d_fn(
         sequences are concatenated from left to right for varlen
     weight: (dim, width)
     conv_states: (...,dim,width - 1) itype
-        updated inplace if provided
+        updated inplace if cache_indices are not provided
         [it use `cache_indices` to get the index to the cache of conv_state for that sequence
 
         conv_state[cache_indices[i]] for seq-i - to be used as initial_state when has_initial_state[i] = True
@@ -410,7 +492,16 @@ def causal_conv1d_fn(
         for example: cache_indices = [pad_slot_id, 1, 20, pad_slot_id]
         in this case, the kernel will not process entries at
         indices 0 and 3
-
+    current_first_idx: (batch,), dtype int32
+        The pointer into cache_indices, where the first cache block to be filled is located.
+    current_last_idx: (batch,), dtype int32
+        The pointer into cache_indices, where the last cache block to be filled is located.
+    initial_state_idx: (batch,), dtype int32
+        The pointer into cache_indices, where the cache block containing the initial state is located.
+    context_lens: (batch,), dtype int32
+        The number of tokens already completed for each sequence
+    block_size_to_align: int
+        The block size to align the cached states to
     out: same shape as `x`
     """
     if isinstance(activation, bool) and activation:
@@ -451,7 +542,6 @@ def causal_conv1d_fn(
     np2_statelen = triton.next_power_of_2(state_len)
 
     padded_batch = query_start_loc.size(0) - 1
-    stride_x_seq = 0
     stride_x_dim = x.stride(0)
     stride_x_token = x.stride(1)
     stride_w_dim = weight.stride(0)
@@ -460,6 +550,7 @@ def causal_conv1d_fn(
     stride_istate_dim = 0
     stride_istate_token = 0
     num_cache_lines = 0
+    BLOCK_M = 8
     if conv_states is not None:
         # extensions to support vLLM:
         # 1. conv_states is used to replaced initial_states
@@ -475,11 +566,9 @@ def causal_conv1d_fn(
         stride_istate_token = conv_states.stride(2)
         assert stride_istate_dim == 1
     if out.dim() == 2:
-        stride_o_seq = 0
         stride_o_dim = out.stride(0)
         stride_o_token = out.stride(1)
     else:
-        stride_o_seq = out.stride(0)
         stride_o_dim = out.stride(1)
         stride_o_token = out.stride(2)
     stride_cache_indices = cache_indices.stride(
@@ -502,6 +591,12 @@ def causal_conv1d_fn(
         assert weight.stride(1) == 1
         assert (dim, width) == weight.shape
         assert is_channel_last, "Need to run in channel-last layout"
+        if block_size_to_align is not None and block_size_to_align > 0:
+            assert (
+                block_size_to_align % BLOCK_M
+            ) == 0, "The mamba block size needs to be divisible by the BLOCK_M"
+        else:
+            block_size_to_align = BLOCK_M
 
     if metadata is None:
 
@@ -584,14 +679,16 @@ def grid(META):
         query_start_loc,
         batch_ptr,
         token_chunk_offset_ptr,
+        current_first_idx,
+        current_last_idx,
+        initial_state_idx,
+        context_lens,
         out,
         # Matrix dimensions
-        padded_batch,
         dim,
         cu_seqlen,
         num_cache_lines,
         # stride
-        stride_x_seq,
         stride_x_dim,
         stride_x_token,
         stride_w_dim,
@@ -600,22 +697,20 @@ def grid(META):
         stride_istate_dim,
         stride_istate_token,
         stride_cache_indices,
-        stride_o_seq,
         stride_o_dim,
         stride_o_token,
+        block_size_to_align // BLOCK_M,
         # others
         pad_slot_id,
         # META
         HAS_BIAS=bias is not None,
         KERNEL_WIDTH=width,
         SILU_ACTIVATION=activation in ["silu", "swish"],
-        HAS_INITIAL_STATES=has_initial_state is not None,
-        HAS_CACHE=conv_states is not None,
-        IS_CONTINUOUS_BATCHING=cache_indices is not None,
+        IS_APC_ENABLED=current_last_idx is not None,
         USE_PAD_SLOT=pad_slot_id is not None,
         NP2_STATELEN=np2_statelen,
         #launch_cooperative_grid=True
-        BLOCK_M=8,
+        BLOCK_M=BLOCK_M,
         BLOCK_N=256,
         num_stages=2,
     )
@@ -629,10 +724,11 @@ def _causal_conv1d_update_kernel(
     w_ptr,  # (dim, width)
     bias_ptr,
     conv_state_ptr,
-    cache_seqlens_ptr,  # circular buffer
     conv_state_indices_ptr,
     num_accepted_tokens_ptr,
     query_start_loc_ptr,  # (batch + 1)
+    current_last_idx,  # (batch,)
+    initial_state_idx,  #(batch,)
     o_ptr,  # (batch, dim, seqlen)
     # Matrix dimensions
     batch: int,
@@ -660,7 +756,7 @@ def _causal_conv1d_update_kernel(
     KERNEL_WIDTH: tl.constexpr,
     SILU_ACTIVATION: tl.constexpr,
     IS_VARLEN: tl.constexpr,
-    IS_CONTINUOUS_BATCHING: tl.constexpr,
+    IS_APC_ENABLED: tl.constexpr,
     IS_SPEC_DECODING: tl.constexpr,
     NP2_STATELEN: tl.constexpr,
     USE_PAD_SLOT: tl.constexpr,
@@ -674,15 +770,21 @@ def _causal_conv1d_update_kernel(
     # [BLOCK_N,] elements along the feature-dimension (channel)
     idx_feats = tl.program_id(1) * BLOCK_N + tl.arange(0, BLOCK_N)
 
-    if IS_CONTINUOUS_BATCHING:
-        # mask = idx_seq < batch
-        conv_state_batch_coord = tl.load(conv_state_indices_ptr +
-                                         idx_seq * stride_state_indices).to(
-                                             tl.int64)
+    if IS_APC_ENABLED:
+        # Get the state from the initial_state_idx
+        conv_state_init = tl.load(initial_state_idx + idx_seq)
+        current_last_index = tl.load(current_last_idx + idx_seq)
     else:
-        conv_state_batch_coord = idx_seq
+        conv_state_init = 0
+        current_last_index = 0
+
+    # cache_idx
+    conv_states_input_coord = tl.load(conv_state_indices_ptr +
+                                      idx_seq * stride_state_indices +
+                                      conv_state_init).to(tl.int64)
+
     if USE_PAD_SLOT:  # noqa
-        if conv_state_batch_coord == pad_slot_id:
+        if conv_states_input_coord == pad_slot_id:
             # not processing as this is not the actual sequence
             return
 
@@ -726,7 +828,7 @@ def _causal_conv1d_update_kernel(
 
     # STEP 1: READ init_state data
     conv_states_base = (conv_state_ptr +
-                        (conv_state_batch_coord * stride_conv_state_seq) +
+                        (conv_states_input_coord * stride_conv_state_seq) +
                         (idx_feats * stride_conv_state_dim))
     mask_w = idx_feats < dim
 
@@ -754,12 +856,12 @@ def _causal_conv1d_update_kernel(
     # window manner, at each forward pass, the tokens are shift by 1, so we
     # load since idx_tokens + 1.
     conv_state_ptrs_source = (
-        conv_state_ptr + (conv_state_batch_coord * stride_conv_state_seq) +
+        conv_state_ptr + (conv_states_input_coord * stride_conv_state_seq) +
         conv_state_token_offset * stride_conv_state_tok +
         (idx_feats * stride_conv_state_dim)[None, :] +
         ((idx_tokens + (1 if IS_SPEC_DECODING else seqlen)) *
          stride_conv_state_tok)[:, None])  # [BLOCK_M, BLOCK_N]
-    mask = ((conv_state_batch_coord < num_cache_lines)
+    mask = ((conv_states_input_coord < num_cache_lines)
             & ((idx_tokens + seqlen) < state_len)[:, None]
             & (idx_feats < dim)[None, :])
     conv_state = tl.load(conv_state_ptrs_source, mask, other=0.0)
@@ -778,11 +880,16 @@ def _causal_conv1d_update_kernel(
 
     new_conv_state = tl.where(mask, conv_state, loaded_x)
 
-    conv_state_base = (conv_state_ptr +
-                       (conv_state_batch_coord * stride_conv_state_seq) +
-                       (idx_feats * stride_conv_state_dim))  # [BLOCK_N,]
-    conv_state_ptrs_target = conv_state_base + (
-        idx_tokens * stride_conv_state_tok)[:, None]  # [BLOCK_M, BLOCK_N]
+    # Get the state from the initial_state_idx
+    # cache_idx
+    conv_states_offset = tl.load(conv_state_indices_ptr +
+                                 idx_seq * stride_state_indices +
+                                 current_last_index).to(tl.int64)
+    conv_state_ptrs_target = (
+        conv_state_ptr +
+        (conv_states_offset * stride_conv_state_seq) +  # Offset from seq
+        (idx_feats * stride_conv_state_dim))[None, :] + (  # [BLOCK_N,]
+            idx_tokens * stride_conv_state_tok)[:, None]
     mask = (idx_tokens < state_len)[:, None] & (idx_feats < dim)[None, :]
     tl.store(conv_state_ptrs_target, new_conv_state, mask)
 
@@ -923,12 +1030,13 @@ def causal_conv1d_update(
     weight: torch.Tensor,
     bias: Optional[torch.Tensor] = None,
     activation: Union[bool, str, None] = None,
-    cache_seqlens: Optional[torch.Tensor] = None,
     conv_state_indices: Optional[torch.Tensor] = None,
     num_accepted_tokens: Optional[torch.Tensor] = None,
     query_start_loc: Optional[torch.Tensor] = None,
     max_query_len: int = -1,
     pad_slot_id: int = PAD_SLOT_ID,
+    current_last_idx: Optional[torch.Tensor] = None,
+    initial_state_idx: Optional[torch.Tensor] = None,
     validate_data=False,
 ):
     """
@@ -942,15 +1050,14 @@ def causal_conv1d_update(
     conv_state: (..., dim, state_len), where state_len >= width - 1
     weight: (dim, width)
     bias: (dim,)
-    cache_seqlens: (batch,), dtype int32.
-        If not None, the conv_state is treated as a circular buffer.
-        The conv_state will be updated by copying x to the conv_state
-        starting at the index
-        @cache_seqlens % state_len.
     conv_state_indices: (batch,), dtype int32
         If not None, the conv_state is a larger tensor along the batch dim,
         and we are selecting the batch coords specified by conv_state_indices.
         Useful for a continuous batching scenario.
+    current_last_idx: (batch,), dtype int32
+        The pointer into conv_state_indices, where the last cache block to be filled is located.
+    initial_state_idx: (batch,), dtype int32
+        The pointer into conv_state_indices, where the cache block containing the initial state is located.
     num_accepted_tokens: (batch,), dtype int32
         If not None, it indicates the number of accepted tokens for each
         sequence in the batch.
@@ -963,15 +1070,14 @@ def causal_conv1d_update(
         If query_start_loc is not None, this indicates the maximum query
         length in the batch.
     pad_slot_id: int
-            if cache_indices is passed, lets the kernel identify padded
+            if conv_state_indices is passed, lets the kernel identify padded
             entries that will not be processed,
-            for example: cache_indices = [pad_slot_id, 1 ,20 ,pad_slot_id]
+            for example: conv_state_indices = [pad_slot_id, 1 ,20 ,pad_slot_id]
             in this case, the kernel will not process entries at
             indices 0 and 3
     out: (batch, dim) or (batch, dim, seqlen) or (num_tokens, dim), same shape as `x`
     """
     if validate_data:
-        assert cache_seqlens is None  # not implemented yet - ok for vLLM
         assert pad_slot_id is not None
         assert x.stride(1) == 1
     if isinstance(activation, bool):
@@ -1011,7 +1117,6 @@ def causal_conv1d_update(
 
         assert num_cache_lines >= batch
         assert weight.stride(1) == 1  # Need this
-        assert cache_seqlens is None  # not needed for vLLM - circular buffer
 
     # adopt the strategy in vLLM that overwrite on 'x' directly, rather than creating a new tensor 'o'
     out = x
@@ -1050,10 +1155,11 @@ def grid(META):
         weight,
         bias,
         conv_state,
-        cache_seqlens,
         conv_state_indices,
         num_accepted_tokens,
         query_start_loc,
+        current_last_idx,
+        initial_state_idx,
         out,
         # Matrix dimensions
         batch,
@@ -1081,7 +1187,7 @@ def grid(META):
         KERNEL_WIDTH=width,
         SILU_ACTIVATION=activation in ["silu", "swish"],
         IS_VARLEN=query_start_loc is not None,
-        IS_CONTINUOUS_BATCHING=conv_state_indices is not None,
+        IS_APC_ENABLED=current_last_idx is not None,
         IS_SPEC_DECODING=num_accepted_tokens is not None,
         NP2_STATELEN=np2_statelen,
         USE_PAD_SLOT=pad_slot_id is not None,
diff --git a/vllm/model_executor/layers/mamba/ops/mamba_ssm.py b/vllm/model_executor/layers/mamba/ops/mamba_ssm.py
index 838290a9f5fb..21bc32ddecd4 100644
--- a/vllm/model_executor/layers/mamba/ops/mamba_ssm.py
+++ b/vllm/model_executor/layers/mamba/ops/mamba_ssm.py
@@ -52,6 +52,7 @@ def _selective_scan_update_kernel(
     z_ptr,
     out_ptr,
     state_batch_indices_ptr,
+    dst_state_batch_indices_ptr,
     pad_slot_id,
     # Matrix dimensions
     batch,
@@ -107,11 +108,17 @@ def _selective_scan_update_kernel(
     # is taken from the state_batch_indices_ptr Otherwise, the state coordinate
     # is the same as the batch id.
     if HAS_STATE_BATCH_INDICES:
+        dst_state_batch_indices_ptr += pid_b
+        dst_state_batch_idx = tl.load(dst_state_batch_indices_ptr).to(tl.int64)
+        dst_state_ptr = state_ptr + (dst_state_batch_idx * stride_state_batch +
+                                     pid_h * stride_state_head)
         state_batch_indices_ptr += pid_b
         state_batch_idx = tl.load(state_batch_indices_ptr).to(tl.int64)
         state_ptr += (state_batch_idx * stride_state_batch +
                       pid_h * stride_state_head)
     else:
+        dst_state_ptr = state_ptr + pid_b * stride_state_batch + \
+            pid_h * stride_state_head
         state_ptr += pid_b * stride_state_batch + pid_h * stride_state_head
 
     x_ptr += pid_b * stride_x_batch + pid_h * stride_x_head
@@ -131,6 +138,8 @@ def _selective_scan_update_kernel(
     offs_n = tl.arange(0, BLOCK_SIZE_DSTATE)
     state_ptrs = state_ptr + (offs_m[:, None] * stride_state_dim +
                               offs_n[None, :] * stride_state_dstate)
+    dst_state_ptrs = dst_state_ptr + (offs_m[:, None] * stride_state_dim +
+                                      offs_n[None, :] * stride_state_dstate)
     x_ptrs = x_ptr + offs_m * stride_x_dim
     dt_ptrs = dt_ptr + offs_m * stride_dt_dim
     if HAS_DT_BIAS:
@@ -185,7 +194,7 @@ def _selective_scan_update_kernel(
     mask = (offs_m[:, None] < dim) & (offs_n[None, :] < dstate)
     if HAS_STATE_BATCH_INDICES:
         mask &= (state_batch_idx != pad_slot_id)
-    tl.store(state_ptrs, state, mask=mask)
+    tl.store(dst_state_ptrs, state, mask=mask)
     out = tl.sum(state * C[None, :], axis=1)
     if HAS_D:
         out += x * D
@@ -205,6 +214,7 @@ def selective_state_update(state,
                            dt_bias=None,
                            dt_softplus=False,
                            state_batch_indices=None,
+                           dst_state_batch_indices=None,
                            pad_slot_id=PAD_SLOT_ID,
                            out=None):
     """
@@ -266,6 +276,11 @@ def selective_state_update(state,
         assert dt_bias.shape == (nheads, dim)
     if state_batch_indices is not None:
         assert state_batch_indices.shape == (batch, )
+    if dst_state_batch_indices is not None:
+        assert dst_state_batch_indices.shape == (batch, )
+    else:
+        # revert to the default behavior of in-place state updates
+        dst_state_batch_indices = state_batch_indices
     assert out.shape == x.shape
 
     grid = lambda META: (triton.cdiv(dim, META['BLOCK_SIZE_M']), batch, nheads)
@@ -292,6 +307,7 @@ def selective_state_update(state,
             z,
             out,
             state_batch_indices,
+            dst_state_batch_indices,
             pad_slot_id,
             batch,
             nheads,
diff --git a/vllm/model_executor/layers/mamba/ops/ssd_combined.py b/vllm/model_executor/layers/mamba/ops/ssd_combined.py
index f3eb61d5840e..e9e589115b8a 100644
--- a/vllm/model_executor/layers/mamba/ops/ssd_combined.py
+++ b/vllm/model_executor/layers/mamba/ops/ssd_combined.py
@@ -35,6 +35,7 @@ def _mamba_chunk_scan_combined_fwd(x,
                                    z=None,
                                    dt_bias=None,
                                    initial_states=None,
+                                   return_intermediate_states=False,
                                    seq_idx=None,
                                    cu_seqlens=None,
                                    cu_chunk_seqlens=None,
@@ -151,28 +152,32 @@ def _mamba_chunk_scan_combined_fwd(x,
         initial_states=initial_states,
     )
 
-    return states[last_chunk_indices]
+    if return_intermediate_states:
+        return states
+    else:
+        return states[last_chunk_indices]
 
 
 def mamba_chunk_scan_combined_varlen(
-        x,
-        dt,
-        A,
-        B,
-        C,
-        chunk_size,
-        cu_seqlens,
-        cu_chunk_seqlens,
-        last_chunk_indices,
-        seq_idx,
-        out,
-        D=None,
-        z=None,
-        dt_bias=None,
-        initial_states=None,
-        dt_softplus=False,
-        dt_limit=(0.0, float("inf")),
-        state_dtype=None,
+    x,
+    dt,
+    A,
+    B,
+    C,
+    chunk_size,
+    cu_seqlens,
+    cu_chunk_seqlens,
+    last_chunk_indices,
+    seq_idx,
+    out,
+    D=None,
+    z=None,
+    dt_bias=None,
+    initial_states=None,
+    dt_softplus=False,
+    dt_limit=(0.0, float("inf")),
+    return_intermediate_states=False,
+    state_dtype=None,
 ):
     """
     Argument:
@@ -213,6 +218,7 @@ def mamba_chunk_scan_combined_varlen(
         z=z,
         dt_bias=dt_bias,
         initial_states=initial_states,
+        return_intermediate_states=return_intermediate_states,
         seq_idx=seq_idx,
         cu_seqlens=cu_seqlens,
         cu_chunk_seqlens=cu_chunk_seqlens,
diff --git a/vllm/model_executor/models/bamba.py b/vllm/model_executor/models/bamba.py
index 4a6154dc548a..c58d6eaa19cb 100644
--- a/vllm/model_executor/models/bamba.py
+++ b/vllm/model_executor/models/bamba.py
@@ -453,12 +453,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         self.vllm_config = vllm_config
         self.model_config = vllm_config.model_config
-        cache_config = vllm_config.cache_config
         lora_config = vllm_config.lora_config
         scheduler_config = vllm_config.scheduler_config
-        assert not cache_config.enable_prefix_caching, \
-            "Bamba currently does not support prefix caching"
-
         self.quant_config = vllm_config.quant_config
 
         super().__init__()
diff --git a/vllm/model_executor/models/config.py b/vllm/model_executor/models/config.py
index 5711b5ebe85e..283cd2bb8b41 100644
--- a/vllm/model_executor/models/config.py
+++ b/vllm/model_executor/models/config.py
@@ -292,10 +292,33 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
         cache_config = vllm_config.cache_config
         compilation_config = vllm_config.compilation_config
 
-        # TODO(tdoublep): remove once prefix caching is enabled
-        cache_config.enable_prefix_caching = False
-        logger.info("Hybrid or mamba-based model detected: disabling prefix "
-                    "caching since it is not yet supported.")
+        # Set mamba block size to max_model_len (this may get
+        # override by prefix caching logic later)
+        cache_config.mamba_block_size = model_config.max_model_len
+
+        # TODO(@tdoublep) find a better way to do this than whitelist
+        MAMBA2_MODELS = [
+            "BambaForCausalLM",
+            "FalconH1ForCausalLM",
+            "GraniteMoeHybridForCausalLM",
+            "Mamba2ForCausalLM",
+            "NemotronHForCausalLM",
+            "Zamba2ForCausalLM",
+        ]
+        if cache_config.enable_prefix_caching:
+            if model_config.architecture in MAMBA2_MODELS:
+                logger.info("Warning: Prefix caching is currently enabled. "
+                            "Its support for Mamba2 layers is experimental. "
+                            "Please report any issues you may observe.")
+            else:
+                logger.info("Hybrid or mamba-based model detected without "
+                            "support for prefix caching: disabling.")
+                cache_config.enable_prefix_caching = False
+
+        # TODO(tdoublep): remove once cascade attention is supported
+        logger.info("Disabling cascade attention since it is not supported "
+                    "for hybrid models.")
+        model_config.disable_cascade_attn = True
 
         # TODO(tdoublep): remove as full cuda graph support is added
         FCG_NOT_SUPPORTED_MODELS = [
@@ -360,12 +383,38 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
             block_size=model_config.max_model_len,
         ).page_size_bytes
 
-        # some attention backends (e.g. FA) only support setting
-        # block size to multiple of 16, so let's suggest a value
-        # that would work (note: FA is currently not compatible
-        # with mamba layers, use FlashInfer instead).
-        attn_block_size = 16 * cdiv(mamba_page_size,
-                                    16 * attn_page_size_1_token)
+        if cache_config.enable_prefix_caching:
+            # With prefix caching, select attention block size to
+            # optimize for mamba kernel performance
+
+            # mamba SSD kernel uses a chunk_size, e.g. 256
+            # Align the block to the kernel: use lowest multiple of chunk_size
+            # of attention tokens that would fit mamba_page_size:
+            # e.g. for mamba page size = 788kB
+            #          attn_1_token = 2kB -> fits ~394 tokens
+            #      then round up to a mulitple of 256 -> 512 tokens
+            # End result:
+            #  attn_block_size = 512
+            #  mamba_block_size = 512 (aligned to a multiple of chunk_size)
+            # TODO(tdoublep): this constraint can be relaxed fairly
+            # easily by changing the way we layout chunks in the
+            # mamba2 kernels.
+            chunk_size = model_config.get_mamba_chunk_size()
+            attn_tokens_per_mamba_state = \
+                cdiv(mamba_page_size, attn_page_size_1_token)
+            attn_block_size = chunk_size * \
+                cdiv(attn_tokens_per_mamba_state, chunk_size)
+            cache_config.mamba_block_size = attn_block_size
+        else:
+            # Without prefix caching, select minimum valid attention block size
+            # to minimize mamba state padding
+
+            # some attention backends (e.g. FA) only support setting
+            # block size to multiple of 16, so let's suggest a value
+            # that would work (note: FA is currently not compatible
+            # with mamba layers, use FlashInfer instead).
+            attn_block_size = 16 * cdiv(mamba_page_size,
+                                        16 * attn_page_size_1_token)
 
         # override attention block size if either (a) the
         # user has not set it or (b) the user has set it
diff --git a/vllm/model_executor/models/falcon_h1.py b/vllm/model_executor/models/falcon_h1.py
index f382018e2222..ccea9add093f 100644
--- a/vllm/model_executor/models/falcon_h1.py
+++ b/vllm/model_executor/models/falcon_h1.py
@@ -540,11 +540,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         self.vllm_config = vllm_config
         self.model_config = vllm_config.model_config
-        cache_config = vllm_config.cache_config
         lora_config = vllm_config.lora_config
         scheduler_config = vllm_config.scheduler_config
-        assert (not cache_config.enable_prefix_caching
-                ), "FalconH1 currently does not support prefix caching"
 
         self.quant_config = vllm_config.quant_config
 
diff --git a/vllm/model_executor/models/granitemoehybrid.py b/vllm/model_executor/models/granitemoehybrid.py
index f5751fe47bb8..dc213e029cd5 100644
--- a/vllm/model_executor/models/granitemoehybrid.py
+++ b/vllm/model_executor/models/granitemoehybrid.py
@@ -549,13 +549,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         self.vllm_config = vllm_config
         self.model_config = vllm_config.model_config
-        cache_config = vllm_config.cache_config
         lora_config = vllm_config.lora_config
         scheduler_config = vllm_config.scheduler_config
-        if cache_config.enable_prefix_caching:
-            raise RuntimeError(
-                "GraniteMoeHybrid currently does not support prefix caching")
-
         self.quant_config = vllm_config.quant_config
         self.config = config
         self.scheduler_config = scheduler_config
diff --git a/vllm/model_executor/models/mamba2.py b/vllm/model_executor/models/mamba2.py
index f8a5a8f6081b..250698a61387 100644
--- a/vllm/model_executor/models/mamba2.py
+++ b/vllm/model_executor/models/mamba2.py
@@ -222,11 +222,8 @@ def get_mamba_state_shape_from_config(
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
-        cache_config = vllm_config.cache_config
         lora_config = vllm_config.lora_config
         scheduler_config = vllm_config.scheduler_config
-        assert not cache_config.enable_prefix_caching, \
-            "Mamba does not support prefix caching"
 
         super().__init__()
         self.config = config
diff --git a/vllm/model_executor/models/nemotron_h.py b/vllm/model_executor/models/nemotron_h.py
index 987920ecc331..c89550923938 100644
--- a/vllm/model_executor/models/nemotron_h.py
+++ b/vllm/model_executor/models/nemotron_h.py
@@ -505,11 +505,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         self.vllm_config = vllm_config
         self.model_config = vllm_config.model_config
-        cache_config = vllm_config.cache_config
         lora_config = vllm_config.lora_config
         scheduler_config = vllm_config.scheduler_config
-        assert not cache_config.enable_prefix_caching, \
-            "NemotronH currently does not support prefix caching"
 
         self.quant_config = vllm_config.quant_config
 
diff --git a/vllm/model_executor/models/zamba2.py b/vllm/model_executor/models/zamba2.py
index 1d68320bd9b2..1803fa259cf4 100644
--- a/vllm/model_executor/models/zamba2.py
+++ b/vllm/model_executor/models/zamba2.py
@@ -868,11 +868,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
                 (not supported by Mamba)
         """
         config = vllm_config.model_config.hf_config
-        cache_config = vllm_config.cache_config
         lora_config = vllm_config.lora_config
         scheduler_config = vllm_config.scheduler_config
-        assert not cache_config.enable_prefix_caching, \
-            "Mamba does not support prefix caching"
 
         super().__init__()
         self.config = config
diff --git a/vllm/v1/attention/backends/mamba2_attn.py b/vllm/v1/attention/backends/mamba2_attn.py
index 68b6ff73ba3f..49fe1584e79c 100644
--- a/vllm/v1/attention/backends/mamba2_attn.py
+++ b/vllm/v1/attention/backends/mamba2_attn.py
@@ -122,6 +122,11 @@ class Mamba2AttentionMetadata:
     last_chunk_indices_p: Optional[torch.Tensor]
 
     state_indices_tensor: torch.Tensor  # shape: [batch,]
+    current_last_idx: torch.Tensor
+    current_first_idx_p: torch.Tensor
+    last_state_idx: torch.Tensor
+    context_lens_p: torch.Tensor
+    last_computed_offset_p: torch.Tensor
 
     # The following attributes are for triton implementation of causal_conv1d
     nums_dict: Optional[dict] = None
@@ -138,6 +143,24 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
         self.chunk_size = vllm_config.model_config.get_mamba_chunk_size()
         assert self.chunk_size is not None, (
             "chunk_size needs to be set in the model config for Mamba2 models")
+        if self.vllm_config.cache_config.enable_prefix_caching:
+            self.state_indices_tensor = torch.empty(
+                (self.decode_cudagraph_max_bs,
+                 cdiv(vllm_config.model_config.max_model_len,
+                      kv_cache_spec.block_size)),
+                dtype=torch.int32,
+                device=device,
+            )
+            self.current_last_idx = torch.empty(
+                (self.decode_cudagraph_max_bs, ),
+                dtype=torch.int32,
+                device=device,
+            )
+            self.last_state_idx = torch.empty(
+                (self.decode_cudagraph_max_bs, ),
+                dtype=torch.int32,
+                device=device,
+            )
 
     def build(self,
               common_prefix_len: int,
@@ -158,7 +181,45 @@ def build(self,
         # for causal_conv1d
         nums_dict, batch_ptr, token_chunk_offset_ptr = None, None, None
 
-        state_indices_tensor = common_attn_metadata.block_table_tensor[:, 0]
+        context_lens, context_lens_p = None, None
+        current_first_idx, current_first_idx_p = None, None
+        last_computed_offset, last_computed_offset_p = None, None
+
+        if self.vllm_config.cache_config.enable_prefix_caching:
+            # Return a tensor of shape (#requests, #max blocks)
+            state_indices_tensor = common_attn_metadata.block_table_tensor
+
+            # Additional cache-related varaiables:
+            mamba_block_size = self.kv_cache_spec.block_size
+            seq_lens_pending = (
+                torch.roll(common_attn_metadata.query_start_loc, -1, -1) -
+                common_attn_metadata.query_start_loc)[:-1]
+            context_lens = common_attn_metadata.seq_lens - \
+                                 seq_lens_pending
+            last_computed_offset = \
+                context_lens % mamba_block_size
+            # Indices: last_computed <= current_first <= current_last
+            # Cases:
+            #  last_computed == current_first  if last state was partially
+            #                                  computed and needs to be updated
+            #  current_first == current_last   if no block crossing occurs, and
+            #                                  only one state will be stored
+            # 0th based indexing leads to "-1" -> e.g. 16 computed -> state[15]:
+            current_last_idx = cdiv(context_lens + seq_lens_pending,
+                                    mamba_block_size) - 1
+            current_first_idx = cdiv(context_lens + 1, mamba_block_size) - 1
+            last_state_idx = cdiv(context_lens, mamba_block_size) - 1
+            # -1 in case it's non-computed and causes later issues with indexing
+            last_state_idx = \
+                last_state_idx.clamp(min=0)
+
+        else:
+            # Always return just a single block per each request:
+            state_indices_tensor = common_attn_metadata.block_table_tensor[:,
+                                                                           0]
+            # Additional cache-related varaiables:
+            current_last_idx = None
+            last_state_idx = None
 
         num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
             split_decodes_and_prefills(
@@ -178,6 +239,16 @@ def build(self,
             query_start_loc_p = common_attn_metadata.query_start_loc[
                 -num_prefills - 1:] - num_decode_tokens
 
+            if self.vllm_config.cache_config.enable_prefix_caching:
+                assert context_lens is not None
+                context_lens_p = context_lens[num_reqs - num_prefills:num_reqs]
+                assert last_computed_offset is not None
+                last_computed_offset_p = last_computed_offset[
+                    num_reqs - num_prefills:num_reqs]
+                assert current_first_idx is not None
+                current_first_idx_p = current_first_idx[num_reqs -
+                                                        num_prefills:num_reqs]
+
             num_computed_tokens_p = \
                 common_attn_metadata.num_computed_tokens_cpu[
                     num_reqs - num_prefills:num_reqs]
@@ -252,6 +323,19 @@ def build(self,
             state_indices_tensor = self.state_indices_tensor[:num_input_tokens]
             state_indices_tensor[num_decodes:] = PAD_SLOT_ID
 
+            if self.vllm_config.cache_config.enable_prefix_caching:
+                self.current_last_idx[:num_decodes].copy_(current_last_idx,
+                                                          non_blocking=True)
+                current_last_idx = \
+                    self.current_last_idx[:num_input_tokens]
+                current_last_idx[num_decodes:] = 0
+
+                self.last_state_idx[:num_decodes].copy_(last_state_idx,
+                                                        non_blocking=True)
+                last_state_idx = \
+                    self.last_state_idx[:num_input_tokens]
+                last_state_idx[num_decodes:] = 0
+
         attn_metadata = Mamba2AttentionMetadata(
             num_prefills=num_prefills,
             num_prefill_tokens=num_prefill_tokens,
@@ -269,5 +353,10 @@ def build(self,
             nums_dict=nums_dict,
             batch_ptr=batch_ptr,
             token_chunk_offset_ptr=token_chunk_offset_ptr,
+            current_last_idx=current_last_idx,
+            current_first_idx_p=current_first_idx_p,
+            last_state_idx=last_state_idx,
+            context_lens_p=context_lens_p,
+            last_computed_offset_p=last_computed_offset_p,
         )
         return attn_metadata
diff --git a/vllm/v1/core/single_type_kv_cache_manager.py b/vllm/v1/core/single_type_kv_cache_manager.py
index 27ea1c4db2a5..07777efc3281 100644
--- a/vllm/v1/core/single_type_kv_cache_manager.py
+++ b/vllm/v1/core/single_type_kv_cache_manager.py
@@ -546,20 +546,38 @@ def find_longest_cache_hit(
             kv_cache_spec,
             MambaSpec), ("MambaManager can only be used for mamba groups")
         assert dcp_world_size == 1, "DCP not support mamba now."
-        # Prefix caching is not supported for mamba now. Always return empty
-        # list.
         computed_blocks: tuple[list[KVCacheBlock], ...] = tuple(
             [] for _ in range(len(kv_cache_group_ids)))
+
+        max_num_blocks = max_length // kv_cache_spec.block_size
+        # Search from right to left and early stop when a match is found.
+        for i in range(max_num_blocks - 1, -1, -1):
+            if cached_block := block_pool.get_cached_block(
+                    block_hashes[i], kv_cache_group_ids):
+                for computed, cached in zip(computed_blocks, cached_block):
+                    # the hit length logic later assumes:
+                    #  hit_length = len(hit_blocks_other_attn[0])
+                    #               * self.other_block_size
+                    # so we insert dummy blocks at the beginning:
+                    if i > 0:
+                        computed.extend([block_pool.null_block] * i)
+                    computed.append(cached)
+                break  # we just need the last match - early stopping
+
         return computed_blocks
 
     def remove_skipped_blocks(self, request_id: str,
                               num_computed_tokens: int) -> None:
-        # Each request will always have 1 block at this moment, so no need to
-        # remove blocks.
+        # Here unused blocks may be freed up for running requests.
+        # TODO(@s3woz) Free up all blocks that aren't needed by Mamba2
+        #  (for which find_longest_cache_hit returns block_pool.null_block)
         pass
 
     def get_num_common_prefix_blocks(self, request_id: str,
                                      num_running_requests: int) -> int:
+        """
+        cascade attention is not supported by mamba
+        """
         return 0
 
     def get_num_blocks_to_allocate(
diff --git a/vllm/v1/kv_cache_interface.py b/vllm/v1/kv_cache_interface.py
index 281816653540..054ab591b817 100644
--- a/vllm/v1/kv_cache_interface.py
+++ b/vllm/v1/kv_cache_interface.py
@@ -233,10 +233,8 @@ def page_size_bytes(self) -> int:
         return page_size
 
     def max_memory_usage_bytes(self, vllm_config: VllmConfig) -> int:
-        # We allocate 1 block for each request now, so max_memory_usage_bytes is
-        # the same as page_size_bytes.
-        # Need to update this when supporting prefix caching.
-        return self.page_size_bytes
+        max_model_len = vllm_config.model_config.max_model_len
+        return cdiv(max_model_len, self.block_size) * self.page_size_bytes
 
 
 @dataclass(frozen=True)
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index ff95acf0c016..11e24e4d13dc 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -4240,21 +4240,15 @@ def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
                     not in ["qwen3_next"]):
                 raise NotImplementedError(
                     "Mamba with speculative decoding is not supported yet.")
-            if self.vllm_config.cache_config.enable_prefix_caching:
-                raise NotImplementedError(
-                    "Prefix caching is not supported for Mamba yet.")
-            max_model_len = self.vllm_config.model_config.max_model_len
-
+            mamba_block_size = self.vllm_config.cache_config.mamba_block_size
             page_size_padded = (
                 self.vllm_config.cache_config.mamba_page_size_padded)
 
-            # Set block_size to max_model_len, so that mamba model will always
-            # have only one block in the KV cache.
             for layer_name, mamba_module in mamba_layers.items():
                 kv_cache_spec[layer_name] = MambaSpec(
                     shapes=mamba_module.get_state_shape(),
                     dtypes=mamba_module.get_state_dtype(),
-                    block_size=max_model_len,
+                    block_size=mamba_block_size,
                     page_size_padded=page_size_padded,
                     mamba_type=mamba_module.mamba_type,
                     num_speculative_blocks=(

From 505ce807bd254196e553ecefc6498f68caa8fdc8 Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Sat, 4 Oct 2025 05:35:04 +0100
Subject: [PATCH 160/193] Support expert parallel in Transformers backend
 (#26162)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Co-authored-by: Isotr0py <mozf@mail2.sysu.edu.cn>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/models/supported_models.md               |  3 +-
 .../model_executor/models/transformers_moe.py | 50 +++++++++++--------
 2 files changed, 32 insertions(+), 21 deletions(-)

diff --git a/docs/models/supported_models.md b/docs/models/supported_models.md
index c705a70b93f5..fdfcf89d9ab3 100644
--- a/docs/models/supported_models.md
+++ b/docs/models/supported_models.md
@@ -32,8 +32,9 @@ If the Transformers model implementation follows all the steps in [writing a cus
 - All the features listed in the [compatibility matrix](../features/README.md#feature-x-feature)
 - Any combination of the following vLLM parallelisation schemes:
     - Data parallel
-    - Pipeline parallel
     - Tensor parallel
+    - Expert parallel
+    - Pipeline parallel
 
 Checking if the modeling backend is Transformers is as simple as:
 
diff --git a/vllm/model_executor/models/transformers_moe.py b/vllm/model_executor/models/transformers_moe.py
index cb966256b350..f4ae015fdc64 100644
--- a/vllm/model_executor/models/transformers_moe.py
+++ b/vllm/model_executor/models/transformers_moe.py
@@ -22,6 +22,7 @@
 
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config.utils import getattr_iter
+from vllm.distributed import get_dp_group, get_ep_group
 from vllm.forward_context import ForwardContext, get_forward_context
 from vllm.model_executor.custom_op import CustomOp
 from vllm.model_executor.layers.fused_moe import FusedMoE
@@ -40,42 +41,54 @@ class TransformersFusedMoE(FusedMoE):
 
     def __init__(self, *args, **kwargs):
         super().__init__(*args, **kwargs)
-        self._top_k_index: torch.Tensor = None
+        self._topk_ids: torch.Tensor = None
 
         def custom_routing_function(hidden_states, gating_output, topk,
                                     renormalize):
-            """Return `top_k_weights` from `gating_output` and the
-            `top_k_index` we stored in the layer earlier."""
-            return gating_output, self._top_k_index
+            """Return `topk_weights` from `gating_output` and the
+            `topk_ids` we stored in the layer earlier."""
+            topk_weights = gating_output
+            topk_ids = self._topk_ids
+            # Handle all gather in expert parallel
+            if topk_ids.size(0) != hidden_states.size(0):
+                dp_metadata = get_forward_context().dp_metadata
+                sizes = dp_metadata.get_chunk_sizes_across_dp_rank()
+                is_sp = self.is_sequence_parallel
+                dist_group = get_ep_group() if is_sp else get_dp_group()
+                assert sizes[dist_group.rank_in_group] == topk_ids.shape[0]
+                topk_ids, = dist_group.all_gatherv([topk_ids], 0, sizes)
+            return topk_weights, topk_ids
 
         self.custom_routing_function = custom_routing_function
 
-    def forward(self, hidden_states: torch.Tensor, top_k_index: torch.Tensor,
-                top_k_weights: torch.Tensor, **kwargs: Any) -> torch.Tensor:
+    def forward(self, hidden_states: torch.Tensor, topk_ids: torch.Tensor,
+                topk_weights: torch.Tensor, **kwargs: Any) -> torch.Tensor:
         """In Transformers `experts.forward` will have this signature.
 
         We discard any extra kwargs because we cannot use them here."""
-        return torch.ops.vllm.transformers_moe_forward(hidden_states,
-                                                       top_k_index,
-                                                       top_k_weights,
-                                                       self.layer_name)
+        return torch.ops.vllm.transformers_moe_forward(
+            hidden_states,
+            topk_ids.to(torch.int32),
+            topk_weights.to(torch.float32),
+            self.layer_name,
+        )
 
 
 def transformers_moe_forward(hidden_states: torch.Tensor,
-                             top_k_index: torch.Tensor,
-                             top_k_weights: torch.Tensor,
+                             topk_ids: torch.Tensor,
+                             topk_weights: torch.Tensor,
                              layer_name: str) -> torch.Tensor:
-    """Store the `top_k_index` in the layer and call the actual forward."""
+    """Store the `topk_ids` in the layer and call the actual forward."""
     forward_context: ForwardContext = get_forward_context()
     self = forward_context.no_compile_layers[layer_name]
-    self._top_k_index = top_k_index
+    self._topk_ids = topk_ids
     # Clone hidden_states because it will be mutated in-place in FusedMoE
-    return self.forward_impl(hidden_states.clone(), top_k_weights)
+    return self.forward_impl(hidden_states.clone(), topk_weights)
 
 
 def transformers_moe_forward_fake(hidden_states: torch.Tensor,
-                                  top_k_index: torch.Tensor,
-                                  top_k_weights: torch.Tensor,
+                                  topk_ids: torch.Tensor,
+                                  topk_weights: torch.Tensor,
                                   layer_name: str) -> torch.Tensor:
     return torch.empty_like(hidden_states)
 
@@ -96,9 +109,6 @@ def __init__(self, *, vllm_config, prefix=""):
         self.check_version("4.57.0.dev0", "MoE models support")
         super().__init__(vllm_config=vllm_config, prefix=prefix)
 
-        if self.parallel_config.enable_expert_parallel:
-            raise NotImplementedError(
-                "Transformers backend does not support expert parallel yet.")
         if self.parallel_config.enable_eplb:
             raise NotImplementedError(
                 "Transformers backend does not support expert parallel load "

From 151293b5771d7e348d0a9169cef5b0497537fa1e Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Sat, 4 Oct 2025 16:20:32 +0800
Subject: [PATCH 161/193] [Model] Support nested structures for TensorSchema
 (#26212)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/utils_/test_tensor_schema.py            |  68 +--
 vllm/model_executor/models/glm4_1v.py         |   4 +-
 .../models/hyperclovax_vision.py              | 387 ++++++++----------
 vllm/model_executor/models/phi3v.py           |   6 +-
 vllm/utils/tensor_schema.py                   | 101 ++---
 5 files changed, 274 insertions(+), 292 deletions(-)

diff --git a/tests/utils_/test_tensor_schema.py b/tests/utils_/test_tensor_schema.py
index 6aa781c1564d..102d58ec452b 100644
--- a/tests/utils_/test_tensor_schema.py
+++ b/tests/utils_/test_tensor_schema.py
@@ -6,37 +6,39 @@
 
 from vllm.model_executor.models.glm4_1v import Glm4vImageEmbeddingInputs
 from vllm.model_executor.models.granite_speech import GraniteSpeechAudioInputs
+from vllm.model_executor.models.hyperclovax_vision import (
+    HCXVisionVideoPixelInputs)
 from vllm.model_executor.models.phi3v import Phi3VImagePixelInputs
 
 
 def test_tensor_schema_valid_tensor():
     Phi3VImagePixelInputs(
-        data=torch.randn(16, 64, 3, 32, 32),
+        pixel_values=torch.randn(16, 64, 3, 32, 32),
         image_sizes=torch.randint(0, 256, (16, 2)),
     )
 
 
 def test_tensor_schema_optional_fields():
     Phi3VImagePixelInputs(
-        data=torch.randn(16, 64, 3, 32, 32),
+        pixel_values=torch.randn(16, 64, 3, 32, 32),
         image_sizes=None,
     )
 
-    Phi3VImagePixelInputs(data=torch.randn(16, 64, 3, 32, 32), )
+    Phi3VImagePixelInputs(pixel_values=torch.randn(16, 64, 3, 32, 32))
 
 
 def test_tensor_schema_constant_dim_failure():
     with pytest.raises(ValueError, match="dim\\[2\\] expected 3, got 4"):
         Phi3VImagePixelInputs(
-            data=torch.randn(16, 64, 4, 32, 32),  # dim[2] = 4
+            pixel_values=torch.randn(16, 64, 4, 32, 32),  # dim[2] = 4
             image_sizes=torch.randint(0, 256, (16, 2)),
         )
 
 
 def test_tensor_schema_invalid_types_in_list():
-    with pytest.raises(ValueError, match="is not a torch.Tensor"):
+    with pytest.raises(TypeError, match="is not one of the expected types"):
         Phi3VImagePixelInputs(
-            data=[
+            pixel_values=[
                 torch.randn(64, 3, 32, 32),
                 "not_a_tensor",
                 torch.randn(64, 3, 32, 32),
@@ -48,27 +50,28 @@ def test_tensor_schema_invalid_types_in_list():
 def test_tensor_schema_rank_mismatch():
     with pytest.raises(ValueError, match="has rank 3 but expected 5"):
         Phi3VImagePixelInputs(
-            data=torch.randn(16, 64, 3),
+            pixel_values=torch.randn(16, 64, 3),
             image_sizes=torch.randint(0, 256, (16, 2)),
         )
 
 
 def test_tensor_schema_missing_required_field():
-    with pytest.raises(ValueError, match="Required field 'data' is missing"):
+    with pytest.raises(ValueError,
+                       match="Required field 'pixel_values' is missing"):
         Phi3VImagePixelInputs(image_sizes=torch.randint(0, 256, (16, 2)), )
 
 
 def test_tensor_schema_symbolic_dim_mismatch():
     with pytest.raises(ValueError, match="expected 'bn'=12, got 16"):
         Phi3VImagePixelInputs(
-            data=torch.randn(12, 64, 3, 32, 32),
+            pixel_values=torch.randn(12, 64, 3, 32, 32),
             image_sizes=torch.randint(0, 256, (16, 2)),
         )
 
 
 def test_tensor_schema_list_tensor_valid():
     Phi3VImagePixelInputs(
-        data=[torch.randn(64, 3, 32, 32) for _ in range(16)],
+        pixel_values=[torch.randn(64, 3, 32, 32) for _ in range(16)],
         image_sizes=torch.randint(0, 256, (16, 2)),
     )
 
@@ -76,39 +79,46 @@ def test_tensor_schema_list_tensor_valid():
 def test_tensor_schema_variable_patch_counts_valid():
     # Each image has a different number of patches (p)
     # Each tensor has shape (p, 3, 32, 32)
-    data = [
-        torch.randn(16, 3, 32, 32),  # p = 16
-        torch.randn(32, 3, 32, 32),  # p = 32
-        torch.randn(64, 3, 32, 32),  # p = 64
-    ]
-    image_sizes = torch.randint(0, 256, (3, 2))  # bn = 3
     Phi3VImagePixelInputs(
-        data=data,
-        image_sizes=image_sizes,
+        pixel_values=[
+            torch.randn(16, 3, 32, 32),  # p = 16
+            torch.randn(32, 3, 32, 32),  # p = 32
+            torch.randn(64, 3, 32, 32),  # p = 64
+        ],
+        image_sizes=torch.randint(0, 256, (3, 2)),  # bn = 3
     )
 
 
 def test_tensor_schema_tuple_tensor_valid():
     Phi3VImagePixelInputs(
-        data=tuple(torch.randn(64, 3, 32, 32) for _ in range(16)),
+        pixel_values=tuple(torch.randn(64, 3, 32, 32) for _ in range(16)),
         image_sizes=torch.randint(0, 256, (16, 2)),
     )
 
 
+def test_tensor_schema_double_nested_tensors():
+    x = torch.rand(4, 3, 32, 32)
+    y = torch.rand(2, 3, 32, 32)
+
+    HCXVisionVideoPixelInputs(pixel_values_videos=([x, y, x], [y], [x, y]))
+
+
 def test_tensor_schema_inconsistent_shapes_in_list():
     with pytest.raises(ValueError, match="contains inconsistent shapes"):
         Phi3VImagePixelInputs(
-            data=[torch.randn(64, 3, 32, 32),
-                  torch.randn(64, 3, 16, 16)] +
-            [torch.randn(64, 3, 32, 32) for _ in range(14)],
+            pixel_values=[
+                torch.randn(64, 3, 32, 32),
+                torch.randn(64, 3, 16, 16),
+                *(torch.randn(64, 3, 32, 32) for _ in range(14)),
+            ],
             image_sizes=torch.randint(0, 256, (16, 2)),
         )
 
 
 def test_tensor_schema_empty_list():
-    with pytest.raises(ValueError, match="is an empty list"):
+    with pytest.raises(ValueError, match="is an empty sequence"):
         Phi3VImagePixelInputs(
-            data=[],
+            pixel_values=[],
             image_sizes=torch.randint(0, 256, (0, 2)),
         )
 
@@ -117,18 +127,18 @@ def test_tensor_schema_validation_disabled_skips_shape_check():
     # This should NOT raise, because validation is turned off
     # This would normally fail (dim[2] should be 3, not 4)
     Phi3VImagePixelInputs(
-        data=torch.randn(16, 64, 4, 32, 32),
+        pixel_values=torch.randn(16, 64, 4, 32, 32),
         image_sizes=torch.randint(0, 256, (16, 2)),
         validate=False,
     )
 
 
 def test_tensor_schema_with_valid_resolve_binding_dims():
-    data = torch.randn(16, 64, 3, 336, 336)  # h=336, w=336
+    pixel_values = torch.randn(16, 64, 3, 336, 336)  # h=336, w=336
     image_sizes = torch.randint(0, 256, (16, 2))
 
     Phi3VImagePixelInputs(
-        data=data,
+        pixel_values=pixel_values,
         image_sizes=image_sizes,
         resolve_bindings={
             "h": 336,
@@ -138,13 +148,13 @@ def test_tensor_schema_with_valid_resolve_binding_dims():
 
 
 def test_tensor_schema_with_invalid_resolve_binding_dims():
-    data = torch.randn(16, 64, 3, 36, 36)  # h=36, w=36
+    pixel_values = torch.randn(16, 64, 3, 36, 36)  # h=36, w=36
     image_sizes = torch.randint(0, 256, (16, 2))
 
     # Should raise because 'h' and 'w' don't match resolve bindings
     with pytest.raises(ValueError, match="dim\\[3\\] expected 336, got 36"):
         Phi3VImagePixelInputs(
-            data=data,
+            pixel_values=pixel_values,
             image_sizes=image_sizes,
             resolve_bindings={
                 "h": 336,
diff --git a/vllm/model_executor/models/glm4_1v.py b/vllm/model_executor/models/glm4_1v.py
index c253631eb8b4..36e2e2995184 100644
--- a/vllm/model_executor/models/glm4_1v.py
+++ b/vllm/model_executor/models/glm4_1v.py
@@ -29,7 +29,7 @@
 import math
 from collections.abc import Iterable, Mapping, Sequence
 from functools import partial
-from typing import Annotated, Any, Callable, Literal, Optional, Union, override
+from typing import Annotated, Any, Callable, Literal, Optional, Union
 
 import numpy as np
 import torch
@@ -1170,7 +1170,7 @@ def _get_dummy_videos(
                         "video.height override (%d) exceeds model's "
                         "maximum height (%d), will be ignored",
                         overrides.height, height)
-                height = min(height, override.height)
+                height = min(height, overrides.height)
 
         video = np.full((num_frames, width, height, 3), 255, dtype=np.uint8)
         video_items = []
diff --git a/vllm/model_executor/models/hyperclovax_vision.py b/vllm/model_executor/models/hyperclovax_vision.py
index 10d3bc8464ba..4d1ab3aad3b4 100644
--- a/vllm/model_executor/models/hyperclovax_vision.py
+++ b/vllm/model_executor/models/hyperclovax_vision.py
@@ -2,27 +2,16 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 # copied from : https://github.com/huggingface/transformers
 import ast
-import sys
 from collections import defaultdict
 from collections.abc import Iterable, Mapping, Sequence
 from functools import partial
-from itertools import chain
-from typing import Any, Literal, Optional, TypedDict, Union
+from itertools import accumulate
+from typing import Annotated, Any, Literal, Optional, Union
 
 import numpy as np
-import PIL
-from einops import rearrange
-from PIL import Image
-
-if sys.version_info >= (3, 11):
-    import typing
-    Unpack = typing.Unpack
-else:
-    import typing_extensions
-    Unpack = typing_extensions.Unpack
-
 import torch
 import torch.nn as nn
+from einops import rearrange
 from timm.layers import LayerNorm, LayerNorm2d
 from timm.models.regnet import RegStage
 from transformers import BatchFeature, CLIPVisionConfig, SiglipVisionConfig
@@ -42,11 +31,13 @@
                                         PromptReplacement, PromptUpdate)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
+from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .clip import CLIPVisionModel
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
 from .siglip import SiglipVisionModel
-from .utils import AutoWeightsLoader, init_vllm_registered_model, maybe_prefix
+from .utils import (AutoWeightsLoader, flatten_bn, init_vllm_registered_model,
+                    maybe_prefix)
 from .vision import get_vision_encoder_info
 
 EOT = "<|endofturn|>"
@@ -69,28 +60,42 @@ def get_num_combined_frames(
     return num_canvases + (leftover_frames > 0)
 
 
-class HCXVisionMultimodalPixelInputs(TypedDict):
-    type: Literal["pixel_values"]
-    pixel_values_images: list[torch.Tensor]
+class HCXVisionImagePixelInputs(TensorSchema):
     """
-    Shape: `[(num_grids, num_channels, height, width), ...]` if anyres
-    
-    Note that `height` or `width` may be different per batch and image,
-    in which case the data is passed as a list instead of a batched tensor.
+    Dimensions:
+        - n: Number of images
+        - g: Number of grids
+        - c: Number of channels (3)
+        - h: Height
+        - w: Width
     """
-    image_sizes_images: list[tuple[Union[int, float]]]
-    """
-    Shape: `[(height, width), ...]`
-    """
-    vision_query_lengths_images: list[Union[int, float]]
-    pixel_values_videos: list[tuple[Union[int, float]]]
+    type: Literal["pixel_values"] = "pixel_values"
+    pixel_values_images: Annotated[
+        list[torch.Tensor],
+        TensorShape("n", "g", 3, "h", "w", dynamic_dims={"g"})]
+    image_sizes_images: Annotated[torch.Tensor, TensorShape("n", 2)]
+
+
+HCXVisionImageInputs = HCXVisionImagePixelInputs
+
+
+class HCXVisionVideoPixelInputs(TensorSchema):
     """
-    Shape: `[(num_grids, num_channels, height, width), ...]` if anyres
+    Dimensions:
+        - n: Number of videos
+        - f: Number of frames
+        - g: Number of grids
+        - c: Number of channels (3)
+        - h: Height
+        - w: Width
     """
-    vision_query_lengths_videos: list[Union[int, float]]
+    type: Literal["pixel_values_videos"] = "pixel_values_videos"
+    pixel_values_videos: Annotated[
+        list[list[torch.Tensor]],
+        TensorShape("n", "f", "g", 3, "h", "w", dynamic_dims={"f", "g"})]
 
 
-HCXVisionMultimodalInputs = Union[HCXVisionMultimodalPixelInputs]
+HCXVisionVideoInputs = HCXVisionVideoPixelInputs
 
 
 class HCXVisionProcessingInfo(BaseProcessingInfo):
@@ -191,27 +196,9 @@ def _call_hf_processor(
         mm_kwargs: Mapping[str, object],
         tok_kwargs: Mapping[str, object],
     ) -> BatchFeature:
-
-        def replace_multimodal_token(
-            token_ids: torch.Tensor,
-            target_token: int,
-            repeats: list[int],
-        ):
-            output = list[int]()
-            _repeats_idx = 0
-            for token_id in token_ids:
-                if token_id == target_token:
-                    output += [token_id.item()] * repeats[_repeats_idx]
-                    _repeats_idx += 1
-                else:
-                    output += [token_id.item()]
-
-            return torch.tensor(output, device=token_ids.device)
-
         for video_idx, video_arr in enumerate(mm_data.get("videos", [])):
-            if video_arr.dtype == np.uint8:
-                continue
-            mm_data["videos"][video_idx] = video_arr.astype(np.uint8)
+            if video_arr.dtype != np.uint8:
+                mm_data["videos"][video_idx] = video_arr.astype(np.uint8)
 
         processed_outputs = self.info.ctx.call_hf_processor(
             hf_processor=self.info.get_hf_processor(**mm_kwargs),
@@ -223,20 +210,16 @@ def replace_multimodal_token(
         )  # text-only
 
         if len(mm_data) > 0:
-            # batchify input as a single item
-            images = mm_data.get("images", None)
-            batched_images = None if images is None else [images]
-
-            # list of video in single conversation
-            videos = mm_data.get("videos", None)
-            batched_videos = None if videos is None else [videos]
+            images = mm_data.get("images")
+            videos = mm_data.get("videos")
 
+            # batchify input as a single item
             _processed_outputs = self.info.ctx.call_hf_processor(
                 hf_processor=self.info.get_hf_processor(**mm_kwargs),
                 data=dict(
                     text=None,
-                    images=batched_images,
-                    videos=batched_videos,
+                    images=None if images is None else [images],
+                    videos=None if videos is None else [videos],
                 ),
             )  # mm-only
 
@@ -246,51 +229,43 @@ def replace_multimodal_token(
                     _processed_outputs[k] = v[0]
 
             if images:
-                tokenizer = self.info.get_tokenizer()
-                image_token_id = tokenizer.convert_tokens_to_ids(IMAGE_TOKEN)
-                processed_outputs["input_ids"] = torch.stack([
-                    replace_multimodal_token(
-                        token_ids=_input_ids,
-                        target_token=image_token_id,
-                        repeats=_processed_outputs[
-                            "vision_query_lengths_images"],
-                    ) for _input_ids in processed_outputs["input_ids"]
-                ],
-                                                             dim=0)
+                _processed_outputs["image_sizes_images"] = torch.tensor(
+                    _processed_outputs["image_sizes_images"])
+                _processed_outputs[
+                    "vision_query_lengths_images"] = torch.tensor(
+                        _processed_outputs["vision_query_lengths_images"])
 
             if videos:
-                _num_per_videos = [
-                    get_num_combined_frames(len(video)) for video in videos
+                _idx_per_video = [
+                    0, *accumulate(
+                        get_num_combined_frames(len(video))
+                        for video in videos)
                 ]
                 _processed_outputs["pixel_values_videos"] = [
                     _processed_outputs["pixel_values_videos"]
-                    [sum(_num_per_videos[:_i]):sum(_num_per_videos[:_i + 1])]
-                    for _i in range(len(videos))
+                    [_idx_per_video[i]:_idx_per_video[i + 1]]
+                    for i in range(len(videos))
                 ]
                 _processed_outputs["vision_query_lengths_videos"] = [
-                    _processed_outputs["vision_query_lengths_videos"]
-                    [sum(_num_per_videos[:_i]):sum(_num_per_videos[:_i + 1])]
-                    for _i in range(len(videos))
+                    torch.tensor(
+                        _processed_outputs["vision_query_lengths_videos"]
+                        [_idx_per_video[i]:_idx_per_video[i + 1]])
+                    for i in range(len(videos))
                 ]
 
-                tokenizer = self.info.get_tokenizer()
-                video_token_id = tokenizer.convert_tokens_to_ids(VIDEO_TOKEN)
-                processed_outputs["input_ids"] = torch.stack([
-                    replace_multimodal_token(
-                        token_ids=_input_ids,
-                        target_token=video_token_id,
-                        repeats=[
-                            sum(lens) for lens in
-                            _processed_outputs["vision_query_lengths_videos"]
-                        ],
-                    ) for _input_ids in processed_outputs["input_ids"]
-                ],
-                                                             dim=0)
-
             processed_outputs.update(_processed_outputs)
 
         return processed_outputs
 
+    def _hf_processor_applies_updates(
+        self,
+        prompt_text: str,
+        mm_items: MultiModalDataItems,
+        hf_processor_mm_kwargs: Mapping[str, object],
+        tokenization_kwargs: Mapping[str, object],
+    ) -> bool:
+        return False
+
     def _get_prompt_updates(
         self,
         mm_items: MultiModalDataItems,
@@ -311,11 +286,11 @@ def get_replacement_hyperclovax(
             out_item = out_mm_kwargs[modality][item_idx]
 
             if modality == "image":
-                lens = out_item["vision_query_lengths_images"].data
+                lens = out_item["vision_query_lengths_images"].data.tolist()
                 num_tokens = self.info.get_num_image_tokens(
                     vision_query_length=lens)
             elif modality == "video":
-                lens = out_item["vision_query_lengths_videos"].data
+                lens = out_item["vision_query_lengths_videos"].data.tolist()
                 num_tokens = self.info.get_num_video_tokens(
                     vision_query_length=lens)
             else:
@@ -343,26 +318,11 @@ def _get_mm_fields_config(
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
         return dict(
-            # image
             pixel_values_images=MultiModalFieldConfig.batched("image"),
             image_sizes_images=MultiModalFieldConfig.batched("image"),
             vision_query_lengths_images=MultiModalFieldConfig.batched("image"),
-            num_queries_vis_abstractors_images=MultiModalFieldConfig.batched(
-                "image"),
-            num_queries_vis_abstractors_slow_images=MultiModalFieldConfig.
-            batched("image"),
-            first_last_frames_slows_images=MultiModalFieldConfig.batched(
-                "image"),
-            # video
             pixel_values_videos=MultiModalFieldConfig.batched("video"),
-            image_sizes_videos=MultiModalFieldConfig.batched("video"),
             vision_query_lengths_videos=MultiModalFieldConfig.batched("video"),
-            num_queries_vis_abstractors_videos=MultiModalFieldConfig.batched(
-                "video"),
-            num_queries_vis_abstractors_slow_videos=MultiModalFieldConfig.
-            batched("video"),
-            first_last_frames_slows_videos=MultiModalFieldConfig.batched(
-                "video"),
         )
 
 
@@ -617,6 +577,7 @@ def build_mlp(
     info=_build_hcxvision_hf_info,
     dummy_inputs=HCXVisionDummyInputsBuilder)
 class HCXVisionForCausalLM(nn.Module, SupportsMultiModal, SupportsPP):
+    merge_by_field_config = True
 
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
@@ -692,55 +653,94 @@ def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
 
         raise ValueError("Only image or video modality is supported")
 
+    def _parse_and_validate_image_input(
+        self,
+        **kwargs: object,
+    ) -> Optional[HCXVisionImageInputs]:
+        pixel_values_images = kwargs.pop("pixel_values_images", None)
+
+        if pixel_values_images is None:
+            return None
+
+        image_sizes_images = kwargs.pop("image_sizes_images")
+
+        return HCXVisionImagePixelInputs(
+            pixel_values_images=pixel_values_images,
+            image_sizes_images=image_sizes_images,
+        )
+
+    def _parse_and_validate_video_input(
+        self,
+        **kwargs: object,
+    ) -> Optional[HCXVisionVideoInputs]:
+        pixel_values_videos = kwargs.pop("pixel_values_videos", None)
+
+        if pixel_values_videos is None:
+            return None
+
+        return HCXVisionVideoPixelInputs(
+            pixel_values_videos=pixel_values_videos, )
+
+    def _process_image_input(
+        self,
+        image_input: HCXVisionImageInputs,
+    ) -> tuple[torch.Tensor, ...]:
+        return self.forward_images(
+            pixel_values_images=image_input["pixel_values_images"],
+            image_sizes_images=image_input["image_sizes_images"],
+        )
+
+    def _process_video_input(
+        self,
+        video_input: HCXVisionVideoInputs,
+    ) -> tuple[torch.Tensor, ...]:
+        return self.forward_videos(
+            pixel_values_videos=video_input["pixel_values_videos"], )
+
+    def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
+        modalities = {}
+
+        # Preserve the order of modalities if there are multiple of them
+        # from the order of kwargs.
+        for input_key in kwargs:
+            if (input_key == "pixel_values_images"
+                    and "images" not in modalities):
+                modalities["images"] = self._parse_and_validate_image_input(
+                    **kwargs)
+            if (input_key == "pixel_values_videos"
+                    and "videos" not in modalities):
+                modalities["videos"] = self._parse_and_validate_video_input(
+                    **kwargs)
+
+        return modalities
+
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
     def get_multimodal_embeddings(
         self,
-        **kwargs: Unpack[HCXVisionMultimodalInputs],
+        **kwargs: object,
     ) -> MultiModalEmbeddings:
+        modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
+        if not modalities:
+            return []
+
+        # The result multimodal_embeddings is tuple of tensors, with each
+        # tensor correspoending to a multimodal data item (image or video).
+        multimodal_embeddings: tuple[torch.Tensor, ...] = ()
+
+        # NOTE: It is important to iterate over the keys in this dictionary
+        # to preserve the order of the modalities.
+        for modality in modalities:
+            if modality == "images":
+                image_input = modalities["images"]
+                vision_embeddings = self._process_image_input(image_input)
+                multimodal_embeddings += vision_embeddings
+            if modality == "videos":
+                video_input = modalities["videos"]
+                video_embeddings = self._process_video_input(video_input)
+                multimodal_embeddings += video_embeddings
 
-        multimodal_embeddings = list()
-        if kwargs.get("pixel_values_images") is not None:
-            for _pixel_values_images, _image_sizes_images in zip(
-                    kwargs["pixel_values_images"],
-                    kwargs["image_sizes_images"]):
-                _pixel_values_images = _pixel_values_images.unsqueeze(dim=0)
-                _image_sizes_images = _image_sizes_images.unsqueeze(dim=0)
-                _len_pixel_values_images = [
-                    len(pixel_value) for pixel_value in _pixel_values_images
-                ]
-                if isinstance(_image_sizes_images, torch.Tensor):
-                    _image_sizes_images = _image_sizes_images.detach().cpu(
-                    ).tolist()
-                _multimodal_embeddings_images = self.forward_images(
-                    pixel_values_images=_pixel_values_images,
-                    image_sizes_images=_image_sizes_images,
-                    len_pixel_values_images=_len_pixel_values_images,
-                )
-                _multimodal_embeddings_images = torch.cat(
-                    _multimodal_embeddings_images, dim=0)
-                multimodal_embeddings.append(_multimodal_embeddings_images)
-
-        if kwargs.get("pixel_values_videos") is not None:
-            for _pixel_values_videos, _vision_query_lengths_videos in zip(
-                    kwargs["pixel_values_videos"],
-                    kwargs["vision_query_lengths_videos"]):
-                _len_pixel_values_videos = [
-                    len(_vision_query_lengths)
-                    for _vision_query_lengths in _vision_query_lengths_videos
-                ]
-                _c, _w, _h = _pixel_values_videos.shape[-3:]
-                _pixel_values_videos = _pixel_values_videos.reshape(
-                    sum(_len_pixel_values_videos), -1, _c, _w,
-                    _h).unsqueeze(dim=0)
-                _multimodal_embeddings_videos = self.forward_videos(
-                    pixel_values_videos=_pixel_values_videos,
-                    len_pixel_values_videos=_len_pixel_values_videos,
-                )
-                _multimodal_embeddings_videos = torch.cat(
-                    _multimodal_embeddings_videos, dim=0)
-                multimodal_embeddings.append(_multimodal_embeddings_videos)
         return multimodal_embeddings
 
     def forward(
@@ -762,28 +762,20 @@ def forward(
 
     def forward_images(
         self,
-        pixel_values_images: list[list[torch.FloatTensor]],
-        image_sizes_images: list[list[tuple[int, int]]],
-        len_pixel_values_images: list[int],
-    ) -> list[list[torch.Tensor]]:
-        if sum(len_pixel_values_images) == 0:
-            return None
-
-        concat_pixel_values_images = torch.cat(list(
-            chain(*pixel_values_images)),
-                                               dim=0)
+        pixel_values_images: list[torch.Tensor],
+        image_sizes_images: torch.Tensor,
+    ) -> tuple[torch.Tensor, ...]:
+        pixel_values_image_flat = flatten_bn(pixel_values_images, concat=True)
 
         visual_token_idx = 0 if "siglip" in self.vision_config.model_type else 1
         image_forward_outs = self.vision_model(
-            concat_pixel_values_images)[:, visual_token_idx:]
+            pixel_values_image_flat)[:, visual_token_idx:]
 
         image_forward_outs = image_forward_outs.to(
             dtype=self.mm_projector.dtype)
         image_forward_outs = self.mm_projector(image_forward_outs)  # b (h w) d
 
-        split_sizes = [
-            pixel_value.shape[0] for pixel_value in chain(*pixel_values_images)
-        ]
+        split_sizes = [len(item) for item in pixel_values_images]
         image_forward_outs = torch.split(image_forward_outs,
                                          split_sizes,
                                          dim=0)
@@ -791,10 +783,7 @@ def forward_images(
         # newline for anyres postprocessing
         image_features = anyres_postprocessing(
             image_forward_outs=image_forward_outs,
-            image_sizes=[
-                image_size for image_sizes in image_sizes_images
-                for image_size in image_sizes
-            ],
+            image_sizes=image_sizes_images.tolist(),
             num_queries_vis_abstractor=self.config.
             num_queries_vis_abstractor_image,
             unpad=self.config.unpad,
@@ -803,26 +792,21 @@ def forward_images(
             image_newline=self.image_newline,
             possible_resolutions=self.config.possible_resolutions,
         )
-        return image_features
+
+        return tuple(image_features)
 
     def forward_videos(
         self,
-        pixel_values_videos: list[list[torch.FloatTensor]],
-        len_pixel_values_videos: list[int],
-    ) -> list[torch.Tensor]:
-
-        len_video_grids = sum(len_pixel_values_videos)
-        if len_video_grids == 0:
-            return None
-
-        # Run Vision Model
-        concat_pixel_values_videos = torch.cat(list(
-            chain(*pixel_values_videos)),
-                                               dim=0)
+        pixel_values_videos: list[list[torch.Tensor]],
+    ) -> tuple[torch.Tensor, ...]:
+        pixel_values_videos_flat = flatten_bn(
+            [frame for frames in pixel_values_videos for frame in frames],
+            concat=True,
+        )
 
         visual_token_idx = 0 if "siglip" in self.vision_config.model_type else 1
         video_forward_outs = self.vision_model(
-            concat_pixel_values_videos)[:, visual_token_idx:]
+            pixel_values_videos_flat)[:, visual_token_idx:]
 
         video_forward_outs = video_forward_outs.to(
             dtype=self.mm_projector.dtype)
@@ -905,7 +889,11 @@ def forward_videos(
                    ) == 0, f"target_features is not empty!! {target_features}"
         assert len(video_groups) == len(video_features)
 
-        return video_features
+        feats_per_video = [len(video) for video in pixel_values_videos]
+        idxs_per_video = [0, *accumulate(feats_per_video)]
+        return tuple(
+            torch.cat(video_features[idxs_per_video[i]:idxs_per_video[i + 1]])
+            for i in range(len(feats_per_video)))
 
     def _prepare_multimodal_kwargs(self, **kwargs: object):
         output = defaultdict(list)
@@ -1111,15 +1099,15 @@ def reshape_and_unpad_image_features(
 
 
 def anyres_postprocessing(
-    image_forward_outs: list[torch.FloatTensor],
+    image_forward_outs: list[torch.Tensor],
     image_sizes: list[list[int]],
     possible_resolutions: list[tuple[int, int]],
     patch_size: int,
     grid_size: int,
-    image_newline: torch.FloatTensor,
+    image_newline: torch.Tensor,
     num_queries_vis_abstractor: int = -1,
     unpad: bool = False,
-) -> list[torch.FloatTensor]:
+) -> list[torch.Tensor]:
     height = width = grid_size // patch_size
 
     if num_queries_vis_abstractor > 0:
@@ -1147,26 +1135,5 @@ def anyres_postprocessing(
                 (image_feature, image_newline[None].to(image_feature.device)),
                 dim=0)
         new_image_features.append(image_feature)
-    image_features = new_image_features
-    return image_features
-
-
-def resize_image(
-    image: Union[np.ndarray, PIL.Image.Image],
-    max_side: int = 378,
-) -> np.ndarray:
-    image_arr = image
-    if isinstance(image, np.ndarray):
-        image = Image.fromarray(image)
-
-    width, height = image.size
-    cur_max_size = max(width, height)
-    if cur_max_size <= max_side:
-        return image_arr
-
-    scale = max_side / cur_max_size
-    width = int(width * scale)
-    height = int(height * scale)
-    image = image.resize((width, height), Image.LANCZOS)
-    image_arr = np.array(image)
-    return image_arr
+
+    return new_image_features
diff --git a/vllm/model_executor/models/phi3v.py b/vllm/model_executor/models/phi3v.py
index f5720e726c48..2415f3696f00 100644
--- a/vllm/model_executor/models/phi3v.py
+++ b/vllm/model_executor/models/phi3v.py
@@ -109,7 +109,7 @@ class Phi3VImagePixelInputs(TensorSchema):
     type: Literal["pixel_values", "image_embeds"] = "pixel_values"
 
     # Supports either a stacked tensor or a list of (p, 3, h, w) tensors
-    data: Annotated[
+    pixel_values: Annotated[
         Union[torch.Tensor, list[torch.Tensor]],
         TensorShape("bn", "p", 3, "h", "w", dynamic_dims={"p"}
                     ),  # 'p' may vary across items
@@ -594,7 +594,7 @@ def _parse_and_validate_image_input(
         if pixel_values is not None:
             return Phi3VImagePixelInputs(
                 type="pixel_values",
-                data=flatten_bn(pixel_values),
+                pixel_values=flatten_bn(pixel_values),
                 image_sizes=flatten_bn(image_sizes, concat=True),
                 resolve_bindings={
                     "h": CLIP_VIT_LARGE_PATCH14_336_CONFIG.image_size,
@@ -628,7 +628,7 @@ def _process_image_input(
             )
 
         assert self.vision_embed_tokens is not None
-        image_embeds = self.vision_embed_tokens(image_input["data"],
+        image_embeds = self.vision_embed_tokens(image_input["pixel_values"],
                                                 image_input["image_sizes"])
 
         return image_embeds
diff --git a/vllm/utils/tensor_schema.py b/vllm/utils/tensor_schema.py
index d75dbcd5401b..44688467b899 100644
--- a/vllm/utils/tensor_schema.py
+++ b/vllm/utils/tensor_schema.py
@@ -94,34 +94,63 @@ def _match_shape_with_dynamic(
                 return False
         return True
 
-    def _validate_nested_tensors(
-        self,
-        value: Union[list[torch.Tensor], tuple[torch.Tensor, ...]],
-        field_name: str,
-        expected_shape: tuple[Union[int, str], ...],
-        dynamic_dims: set[str],
+    def _fmt_indexer(self, idxs: tuple[int, ...]) -> str:
+        if not idxs:
+            return ""
+
+        return str(list(idxs))
+
+    def _validate_field(
+            self,
+            value: object,
+            field_name: str,
+            expected_shape: tuple[Union[int, str], ...],
+            dynamic_dims: set[str],
+            leading_idxs: tuple[int, ...] = (),
     ) -> tuple[int, ...]:
-        """Validate a list/tuple of tensors and return the actual shape."""
+        """Validate a field and return the actual shape."""
+        if isinstance(value, (int, float)):
+            return ()  # Scalar
+        if isinstance(value, torch.Tensor):
+            return value.shape
+
+        if not isinstance(value, (list, tuple)):
+            raise TypeError(
+                f"{field_name}{self._fmt_indexer(leading_idxs)} is not "
+                f"one of the expected types: int, float, Tensor, list, tuple. "
+                f"Got: {type(value)}")
+
+        if len(value) == 0:
+            raise ValueError(f"{field_name}{self._fmt_indexer(leading_idxs)} "
+                             f"is an empty sequence")
+
         # Ensure all tensors in the list have the same
         # shape, besides dynamic dimensions
-        first = value[0]
         for i, v in enumerate(value):
-            if not isinstance(v, torch.Tensor):
-                raise ValueError(f"{field_name}[{i}] is not a "
-                                 f"torch.Tensor")
-            if not self._match_shape_with_dynamic(
-                    v.shape,
-                    first.shape,
+            shape = self._validate_field(
+                v,
+                field_name,
+                expected_shape[1:],
+                dynamic_dims,
+                leading_idxs=leading_idxs + (i, ),
+            )
+
+            if i == 0:
+                first_shape = shape
+            elif not self._match_shape_with_dynamic(
+                    shape,
+                    first_shape,
                     expected_shape,
                     dynamic_dims,
             ):
-                raise ValueError(f"{field_name} contains inconsistent "
-                                 f"shapes: {first.shape} vs {v.shape} "
-                                 f"at index {i}")
+                raise ValueError(
+                    f"{field_name}{self._fmt_indexer(leading_idxs)} "
+                    f"contains inconsistent shapes: {first_shape} "
+                    f"(index 0) vs {shape} (index {i})")
 
         # Treat the list as a stacked tensor:
         # shape = (len(list), *tensor.shape)
-        return (len(value), ) + first.shape
+        return (len(value), ) + first_shape
 
     def _validate_tensor_shape_expected(
         self,
@@ -187,36 +216,12 @@ def validate(self) -> None:
                 for arg in args:
                     if isinstance(arg, TensorShape):
                         expected_shape = arg.resolve(**self._resolve_bindings)
-                        if isinstance(value, (list, tuple)):
-                            # list/tuple of Tensors → shape = (len(value), ...)
-                            if value and isinstance(value[0], torch.Tensor):
-                                actual_shape = self._validate_nested_tensors(
-                                    value, field_name, expected_shape,
-                                    arg.dynamic_dims)
-                            elif value:
-                                # list/tuple of scalars → shape = (len(value),)
-                                actual_shape = (len(value), )
-                            else:
-                                raise ValueError(
-                                    f"{field_name} is an empty list")
-
-                        # Tensor → shape = tensor.shape
-                        elif isinstance(value, torch.Tensor):
-                            actual_shape = value.shape
-
-                        # Otherwise, it's an unsupported type
-                        else:
-                            type_names = []
-                            for arg in args:
-                                if hasattr(arg, "__name__"):
-                                    type_names.append(str(arg.__name__))
-                                else:
-                                    type_names.append(str(arg))
-
-                            expected_types = ", ".join(type_names)
-                            raise ValueError(
-                                f"{field_name} is not one of the expected "
-                                f"types: {expected_types}")
+                        actual_shape = self._validate_field(
+                            value,
+                            field_name,
+                            expected_shape,
+                            arg.dynamic_dims,
+                        )
 
                         self._validate_tensor_shape_expected(
                             actual_shape, expected_shape, field_name,

From 85b632d0309773753722b77e1f70757712fac551 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Sat, 4 Oct 2025 16:40:14 +0800
Subject: [PATCH 162/193] [Misc] Require `merge_by_field_config` argument
 (#26214)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/multimodal/utils.py          | 42 +++++++------------------------
 vllm/v1/worker/gpu_input_batch.py | 13 +---------
 2 files changed, 10 insertions(+), 45 deletions(-)

diff --git a/vllm/multimodal/utils.py b/vllm/multimodal/utils.py
index bab12fd1681a..735d8b403c15 100644
--- a/vllm/multimodal/utils.py
+++ b/vllm/multimodal/utils.py
@@ -15,7 +15,6 @@
 import numpy.typing as npt
 import torch
 from PIL import Image, UnidentifiedImageError
-from typing_extensions import deprecated
 
 import vllm.envs as envs
 from vllm.connections import HTTPConnection, global_http_connection
@@ -376,39 +375,12 @@ def argsort_mm_positions(
     return [(modality, idx) for modality, idx, _ in sorted_flat_items]
 
 
-# Temporary back-compatibility for plugins that define model runner
-@deprecated("`group_mm_inputs_by_modality` is superseded by "
-            "`group_mm_kwargs_by_modality` and will be removed in v0.13. "
-            "Please use `group_mm_kwargs_by_modality` instead.")
-def group_mm_inputs_by_modality(
-    mm_inputs: list[MultiModalKwargsItems]
-) -> list[list[MultiModalKwargsItems]]:
-    if not mm_inputs:
-        return []
-
-    def modality_group_func(
-            mm_input: MultiModalKwargsItems) -> Union[str, int]:
-        # If the input has multiple modalities, return an id as the unique key
-        # for the mm_input input.
-        if len(mm_input) > 1:
-            return id(mm_input)
-
-        elif len(mm_input) == 1:
-            return next(iter(mm_input.keys()))
-
-        raise AssertionError("This line should be unreachable.")
-
-    return [
-        list(group) for _, group in groupby(mm_inputs, key=modality_group_func)
-    ]
-
-
 def group_mm_kwargs_by_modality(
     mm_kwargs: list[MultiModalKwargsItem],
     *,
     device: torch.types.Device = None,
     pin_memory: bool = False,
-    merge_by_field_config: bool = False,
+    merge_by_field_config: Optional[bool] = None,
 ) -> Iterable[tuple[str, int, BatchedTensorInputs]]:
     """Group consecutive `MultiModalKwargsItem`s from `mm_kwargs` with the same
     modality together into the same `MultiModalKwargs` instance.
@@ -421,15 +393,19 @@ def group_mm_kwargs_by_modality(
     Yields:
         A tuple `(modality, num_items, grouped_kwargs)`.
     """
+    if merge_by_field_config is None:
+        raise RuntimeError(
+            "`group_mm_kwargs_by_modality` now requires "
+            "`merge_by_field_config` arg, please update your model runner "
+            "according to https://github.com/vllm-project/vllm/pull/25676.")
+
     from vllm.multimodal.inputs import MultiModalKwargs, MultiModalKwargsItems
 
     for modality, items in groupby(mm_kwargs, key=lambda item: item.modality):
         items_lst = list(items)
 
-        # TODO: Enable `merge_by_field_config` for all models
-        # to avoid creating an extra batch dimension (except for fields
-        # that are meant to be stacked anyway).
-        # We will also need to update each model to remove `flatten_bn`.
+        # TODO: Deprecate `merge_by_field_config` once
+        # we have migrated all in-tree models
         if merge_by_field_config:
             mm_kwargs_group: BatchedTensorInputs = dict(
                 MultiModalKwargsItems.from_seq(items_lst).get_data(
diff --git a/vllm/v1/worker/gpu_input_batch.py b/vllm/v1/worker/gpu_input_batch.py
index 67fb9864b19c..7848283a9096 100644
--- a/vllm/v1/worker/gpu_input_batch.py
+++ b/vllm/v1/worker/gpu_input_batch.py
@@ -7,10 +7,9 @@
 
 import numpy as np
 import torch
-from typing_extensions import deprecated
 
 from vllm.lora.request import LoRARequest
-from vllm.multimodal.inputs import MultiModalFeatureSpec, MultiModalKwargsItems
+from vllm.multimodal.inputs import MultiModalFeatureSpec
 from vllm.pooling_params import PoolingParams
 from vllm.sampling_params import SamplingParams, SamplingType
 from vllm.utils import length_from_prompt_token_ids_or_embeds, swap_dict_values
@@ -53,16 +52,6 @@ def __post_init__(self):
     def num_tokens(self) -> int:
         return self.num_prompt_tokens + len(self.output_token_ids)
 
-    # Temporary back-compatibility for plugins that define model runner
-    @property
-    @deprecated("`mm_inputs` is superseded by `mm_kwargs` and will be "
-                "removed in v0.13. Please use `mm_kwargs` instead.")
-    def mm_inputs(self) -> list[MultiModalKwargsItems]:
-        return [
-            MultiModalKwargsItems.from_seq([f.data]) for f in self.mm_features
-            if f.data is not None
-        ]
-
     def get_token_id(self, idx: int) -> int:
         if idx < self.num_prompt_tokens:
             if self.prompt_token_ids is None:

From 371651bcc896ece72901a2b83d16ddcee5fbfcd3 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Sat, 4 Oct 2025 16:45:53 +0800
Subject: [PATCH 163/193] [Misc] Remove unused `executor.apply_model` (#26215)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/executor/executor_base.py | 13 +------------
 1 file changed, 1 insertion(+), 12 deletions(-)

diff --git a/vllm/executor/executor_base.py b/vllm/executor/executor_base.py
index fe80be61410c..a4e25dcfe4d7 100644
--- a/vllm/executor/executor_base.py
+++ b/vllm/executor/executor_base.py
@@ -7,8 +7,7 @@
 from functools import cached_property
 from typing import Any, Awaitable, Callable, List, Optional, Set, Union
 
-import torch.nn as nn
-from typing_extensions import TypeVar, deprecated
+from typing_extensions import TypeVar
 
 import vllm.platforms
 from vllm.config import VllmConfig
@@ -127,16 +126,6 @@ def initialize_cache(self, num_gpu_blocks: int, num_cpu_blocks) -> None:
         self.collective_rpc("initialize_cache",
                             args=(num_gpu_blocks, num_cpu_blocks))
 
-    @deprecated("`llm_engine.model_executor.apply_model` will no longer work "
-                "in V1 Engine. Please replace with `llm_engine.apply_model` "
-                "and set `VLLM_ALLOW_INSECURE_SERIALIZATION=1`.")
-    def apply_model(self, func: Callable[[nn.Module], _R]) -> list[_R]:
-        """
-        Run a function directly on the model inside each worker,
-        returning the result for each of them.
-        """
-        return self.collective_rpc("apply_model", args=(func, ))
-
     @cached_property  # Avoid unnecessary RPC calls
     def supported_tasks(self) -> tuple[SupportedTask, ...]:
         output = self.collective_rpc("get_supported_tasks")

From abe8a6145c8ab90724d02770f5ec1ba002c69c98 Mon Sep 17 00:00:00 2001
From: Huamin Li <3ericli@gmail.com>
Date: Sat, 4 Oct 2025 02:44:49 -0700
Subject: [PATCH 164/193] [CI Failure] fix_test_auto_prefix_cache_support
 (#26053)

Signed-off-by: Huamin Li <3ericli@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/v1/core/test_scheduler.py |  4 ++--
 vllm/config/vllm.py             | 17 ++++++++++++-----
 2 files changed, 14 insertions(+), 7 deletions(-)

diff --git a/tests/v1/core/test_scheduler.py b/tests/v1/core/test_scheduler.py
index 3de6dffc3395..92fa1eb8ac2b 100644
--- a/tests/v1/core/test_scheduler.py
+++ b/tests/v1/core/test_scheduler.py
@@ -1917,7 +1917,7 @@ def test_priority_scheduling_preemption_when_out_of_kv():
 def test_chunked_prefill_disabled_for_encoder_decoder(
         enable_chunked_prefill: bool, is_encoder_decoder: bool,
         expect_enabled: bool) -> None:
-    """Validate that chunked prefill is appropriately disabled for 
+    """Validate that chunked prefill is appropriately disabled for
     encoder-decoder models."""
     scheduler_config = SchedulerConfig(
         enable_chunked_prefill=enable_chunked_prefill,
@@ -1942,7 +1942,7 @@ def test_chunked_prefill_disabled_for_encoder_decoder(
 def _validate_chunked_prefill_settings_for_encoder_decoder(
         scheduler_config: SchedulerConfig, is_encoder_decoder: bool,
         expect_enabled: bool) -> None:
-    """Validate chunked prefill settings in the scheduler config for 
+    """Validate chunked prefill settings in the scheduler config for
     encoder-decoder models."""
     assert scheduler_config.chunked_prefill_enabled is expect_enabled
     assert scheduler_config.enable_chunked_prefill is expect_enabled
diff --git a/vllm/config/vllm.py b/vllm/config/vllm.py
index ac40b0fd4783..17d1055ace46 100644
--- a/vllm/config/vllm.py
+++ b/vllm/config/vllm.py
@@ -396,10 +396,17 @@ def __post_init__(self):
                         "try setting 'VLLM_WORKER_MULTIPROC_METHOD' "
                         "to 'spawn'.")
 
-        # Disable prefix caching only if chunked prefill is explicitly disabled
-        # (and not merely unset)
-        if (self.scheduler_config.chunked_prefill_enabled is False
-                or disable_chunked_prefill_reasons):
+        # Final off-switch for CP/APC:
+        # Disable for (a) collected blockers, (b) encoder–decoder, or
+        # (c) explicit CP=False when APC wasn't requested.
+        # Do NOT disable merely because the resolved CP flag is False.
+        apc_requested = (self.cache_config is not None
+                         and self.cache_config.enable_prefix_caching)
+        if (disable_chunked_prefill_reasons
+                or (self.model_config is not None
+                    and self.model_config.is_encoder_decoder)
+                or (self.scheduler_config.enable_chunked_prefill is False
+                    and not apc_requested)):
             for reason in disable_chunked_prefill_reasons:
                 logger.info(reason)
             self.scheduler_config.chunked_prefill_enabled = False
@@ -668,7 +675,7 @@ def try_verify_and_update_config(self):
                                  f"Model: {self.model_config.model}")
 
     def compile_debug_dump_path(self) -> Optional[Path]:
-        """Returns a rank-aware path for dumping 
+        """Returns a rank-aware path for dumping
         torch.compile debug information.
         """
         if self.compilation_config.debug_dump_path is None:

From 030ccbf03d5eae7fc8770d5e97a9c942dd300427 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Sat, 4 Oct 2025 17:45:08 +0800
Subject: [PATCH 165/193] Revert "Add batch invariant kernel override for
 FlashInfer backend [2/n]" (#26220)

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/v1/generation/test_batch_invariance.py  | 63 +++++++------------
 vllm/model_executor/layers/batch_invariant.py | 13 +---
 vllm/v1/attention/backends/flashinfer.py      | 37 ++---------
 3 files changed, 29 insertions(+), 84 deletions(-)

diff --git a/tests/v1/generation/test_batch_invariance.py b/tests/v1/generation/test_batch_invariance.py
index 5cc6fcfd9ac9..b864f9a31836 100644
--- a/tests/v1/generation/test_batch_invariance.py
+++ b/tests/v1/generation/test_batch_invariance.py
@@ -76,21 +76,18 @@ def test_v1_generation_is_deterministic_across_batch_sizes_with_needle():
       seed.
     - Keep max_tokens and max_model_len bounded for speed and memory use.
     """
-    seed = int(os.getenv("VLLM_TEST_SEED", "12345"))
-    random.seed(seed)
+    random.seed(12345)
 
     # Allow overrides from environment (useful for CI tuning)
     # "facebook/opt-125m" is too small, doesn't reliably test determinism
     model = os.getenv("VLLM_TEST_MODEL", "Qwen/Qwen3-1.7B")
     num_trials = int(os.getenv("VLLM_NEEDLE_TRIALS", "5"))
-    max_batch_size = int(os.getenv("VLLM_NEEDLE_BATCH_SIZE", "128"))
-    min_random_prompt = int(os.getenv("VLLM_MIN_PROMPT", "1024"))
-    max_random_prompt = int(os.getenv("VLLM_MAX_PROMPT", "2048"))
-    assert max_batch_size >= 2, "Batch size should be >= 2 to mix needle."
+    batch_size = int(os.getenv("VLLM_NEEDLE_BATCH_SIZE", "64"))
+    assert batch_size >= 2, "Batch size should be >= 2 to mix needle."
 
     # Keep GPU memory usage low to avoid startup allocation failures.
-    gpu_mem_util = float(os.getenv("VLLM_GPU_MEMORY_UTILIZATION", "0.4"))
-    max_model_len = int(os.getenv("VLLM_MAX_MODEL_LEN", "5120"))
+    gpu_mem_util = float(os.getenv("VLLM_GPU_MEMORY_UTILIZATION", "0.3"))
+    max_model_len = int(os.getenv("VLLM_MAX_MODEL_LEN", "4096"))
     swap_space_gb = int(os.getenv("VLLM_SWAP_SPACE_GB", "4"))
 
     # Sampling parameters: longer outputs with a more random-sounding
@@ -114,7 +111,7 @@ def test_v1_generation_is_deterministic_across_batch_sizes_with_needle():
         # Engine with bs=1 behavior
         llm_bs1 = LLM_with_max_seqs(
             model=model,
-            max_num_seqs=128,
+            max_num_seqs=1,
             gpu_memory_utilization=gpu_mem_util,
             max_model_len=max_model_len,
             swap_space=swap_space_gb,
@@ -129,7 +126,7 @@ def test_v1_generation_is_deterministic_across_batch_sizes_with_needle():
         # Engine with larger batch limit (e.g., 64)
         llm_bsN = LLM_with_max_seqs(
             model=model,
-            max_num_seqs=128,
+            max_num_seqs=batch_size,
             gpu_memory_utilization=gpu_mem_util,
             max_model_len=max_model_len,
             swap_space=swap_space_gb,
@@ -138,17 +135,15 @@ def test_v1_generation_is_deterministic_across_batch_sizes_with_needle():
         mismatches = 0
 
         for trial in range(num_trials):
-            # Create a batch of size `max_batch_size` and insert the needle at
+            # Create a batch of size `batch_size` and insert the needle at
             # a random index
             prompts: list[str] = []
-            batch_size = random.randint(max_batch_size // 2, max_batch_size)
             needle_pos = random.randint(0, batch_size - 1)
             for i in range(batch_size):
                 if i == needle_pos:
                     prompts.append(needle_prompt)
                 else:
-                    prompts.append(
-                        _random_prompt(min_random_prompt, max_random_prompt))
+                    prompts.append(_random_prompt())
 
             # Generate with the larger-batch engine
             outputs = llm_bsN.generate(prompts, sampling)
@@ -159,19 +154,17 @@ def test_v1_generation_is_deterministic_across_batch_sizes_with_needle():
             text = needle_output.outputs[0].text
 
             if text != baseline_text:
-                print(
-                    f"{text}\n\n== Not the same as ==\n\n{baseline_text}\n\n")
                 mismatches += 1
 
         passes = num_trials - mismatches
         # Dump how many passed vs failed
         print(f"[determinism] total={num_trials}, passed={passes}, "
-              f"failed={mismatches}, max_batch_size={max_batch_size}")
+              f"failed={mismatches}, batch_size={batch_size}")
 
         if mismatches > 0:
             pytest.fail(
                 f"Nondeterministic outputs detected: {mismatches} failed out "
-                f"of {num_trials} trials (max_batch_size={max_batch_size}).")
+                f"of {num_trials} trials (batch_size={batch_size}).")
 
     finally:
         # Ensure engines are shutdown to free GPU/VRAM across test sessions
@@ -203,14 +196,9 @@ def _extract_step_logprobs(request_output):
     not torch.cuda.is_available(),
     reason="Requires CUDA to match production inference path.",
 )
-@pytest.mark.parametrize("backend", ["FLEX_ATTENTION", "FLASHINFER"])
-def test_logprobs_bitwise_batch_invariance_bs1_vs_bsN(backend):
+def test_logprobs_bitwise_batch_invariance_bs1_vs_bs2():
 
-    backend = os.getenv("VLLM_ATTENTION_BACKEND", backend)
-    os.environ["VLLM_ATTENTION_BACKEND"] = backend
-
-    seed = int(os.getenv("VLLM_TEST_SEED", "12345"))
-    random.seed(seed)
+    #model_name = os.getenv("VLLM_TEST_MODEL", "facebook/opt-125m")
     model_name = os.getenv("VLLM_TEST_MODEL", "Qwen/Qwen3-1.7B")
     tp_size = int(os.getenv("VLLM_TEST_TP_SIZE", "1"))
 
@@ -224,15 +212,10 @@ def test_logprobs_bitwise_batch_invariance_bs1_vs_bsN(backend):
     prompts = [
         "The capital of France is",
         "The capital of Germany is",
-        _random_prompt(10, 1024),
-        _random_prompt(10, 1024),
-        _random_prompt(10, 1024),
-        _random_prompt(10, 1024),
-        _random_prompt(10, 1024),
     ]
 
     sp = SamplingParams(
-        temperature=0.6,
+        temperature=0.0,
         top_p=1.0,
         max_tokens=8,
         # Seed shouldn't matter at temperature=0, but keeping it stable anyway.
@@ -251,25 +234,25 @@ def test_logprobs_bitwise_batch_invariance_bs1_vs_bsN(backend):
                         "enable logprobs return to run this test.")
         bs1_logprobs_per_prompt.append(step_logprobs)
 
-    # BS=N: run prompts in a batch and collect logprobs per step for each
+    # BS=2: run prompts in a batch and collect logprobs per step for each
     # prompt.
     outs_batched = llm.generate(prompts, sp, use_tqdm=False)
     assert len(outs_batched) == len(prompts)
-    bsN_logprobs_per_prompt = []
+    bs2_logprobs_per_prompt = []
     for o in outs_batched:
         step_logprobs = _extract_step_logprobs(o)
         if step_logprobs is None:
             pytest.skip("Logits are not available on RequestOutput; "
                         "enable logprobs return to run this test.")
-        bsN_logprobs_per_prompt.append(step_logprobs)
+        bs2_logprobs_per_prompt.append(step_logprobs)
 
-    # Compare step-by-step logprobs for each prompt between BS=1 and BS=N runs.
-    for i, (logprobs_bs1, logprobs_bsN) in enumerate(
-            zip(bs1_logprobs_per_prompt, bsN_logprobs_per_prompt)):
-        assert len(logprobs_bs1) == len(logprobs_bsN), (
+    # Compare step-by-step logprobs for each prompt between BS=1 and BS=2 runs.
+    for i, (logprobs_bs1, logprobs_bs2) in enumerate(
+            zip(bs1_logprobs_per_prompt, bs2_logprobs_per_prompt)):
+        assert len(logprobs_bs1) == len(logprobs_bs2), (
             f"Different number of generation steps for prompt index {i}: "
-            f"{len(logprobs_bs1)} (BS=1) vs {len(logprobs_bsN)} (BS=N)")
-        for t, (a, b) in enumerate(zip(logprobs_bs1, logprobs_bsN)):
+            f"{len(logprobs_bs1)} (BS=1) vs {len(logprobs_bs2)} (BS=2)")
+        for t, (a, b) in enumerate(zip(logprobs_bs1, logprobs_bs2)):
             assert a.shape == b.shape, (
                 f"Logits shape mismatch at prompt {i}, step {t}: "
                 f"{a.shape} vs {b.shape}")
diff --git a/vllm/model_executor/layers/batch_invariant.py b/vllm/model_executor/layers/batch_invariant.py
index 150c48c0e880..c025d509d862 100644
--- a/vllm/model_executor/layers/batch_invariant.py
+++ b/vllm/model_executor/layers/batch_invariant.py
@@ -8,12 +8,8 @@
 
 import torch
 
-import vllm.envs as envs
-from vllm.logger import init_logger
 from vllm.triton_utils import tl, triton
 
-logger = init_logger(__name__)
-
 
 def _matmul_launch_metadata(grid: Callable[..., Any], kernel: Any,
                             args: dict[str, Any]) -> dict[str, Any]:
@@ -561,12 +557,5 @@ def vllm_kernel_override_batch_invariant():
 def init_batch_invariance():
     # this will hit all the csrc overrides as well
     if vllm_kernel_override_batch_invariant():
-        curr_attn_backend = envs.VLLM_ATTENTION_BACKEND
-        supported_backends = ["FLEX_ATTENTION", "FLASHINFER"]
-        if curr_attn_backend not in supported_backends:
-            warning = "Forcibly updating attention backend to" \
-                f" {supported_backends[0]} for batch_invariant. " \
-                f" Supported backends: {supported_backends}."
-            logger.warning_once(warning)
-            os.environ["VLLM_ATTENTION_BACKEND"] = supported_backends[0]
+        os.environ["VLLM_ATTENTION_BACKEND"] = "FLEX_ATTENTION"
         enable_batch_invariant_mode()
diff --git a/vllm/v1/attention/backends/flashinfer.py b/vllm/v1/attention/backends/flashinfer.py
index 13f18d103b53..15a252734d4d 100755
--- a/vllm/v1/attention/backends/flashinfer.py
+++ b/vllm/v1/attention/backends/flashinfer.py
@@ -20,8 +20,6 @@
                                               AttentionType)
 from vllm.config import CUDAGraphMode, VllmConfig
 from vllm.logger import init_logger
-from vllm.model_executor.layers.batch_invariant import (
-    vllm_kernel_override_batch_invariant)
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
     QuantKey, kFp8StaticTensorSym, kNvfp4Quant)
 from vllm.platforms import current_platform
@@ -44,7 +42,6 @@
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 FLASHINFER_WORKSPACE_BUFFER_SIZE = 256 * 1024 * 1024
-FLASHINFER_WORKSPACE_BUFFER_SIZE_BATCH_INVARIANT = 2048 * 1024 * 1024
 
 FP8_DTYPE = current_platform.fp8_dtype()
 FP4_DTYPE = torch.uint8
@@ -266,15 +263,6 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
         self._prefill_wrapper = None  # Wrapper for prefill/append
         self._decode_wrapper = None  # Wrapper for decode (general shape)
 
-        if vllm_kernel_override_batch_invariant():
-            self.decode_fixed_split_size = 2048
-            self.prefill_fixed_split_size = 4096
-            self.disable_split_kv = True
-        else:
-            self.decode_fixed_split_size = -1
-            self.prefill_fixed_split_size = -1
-            self.disable_split_kv = False
-
         self.compilation_config = vllm_config.compilation_config
         max_num_pages_per_req = cdiv(self.model_config.max_model_len,
                                      self.kv_cache_spec.block_size)
@@ -368,12 +356,10 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
 
     def _get_workspace_buffer(self):
         if self._workspace_buffer is None:
-            buffer_size = FLASHINFER_WORKSPACE_BUFFER_SIZE
-            if vllm_kernel_override_batch_invariant():
-                buffer_size = FLASHINFER_WORKSPACE_BUFFER_SIZE_BATCH_INVARIANT
-            self._workspace_buffer = torch.zeros(buffer_size,
-                                                 dtype=torch.uint8,
-                                                 device=self.device)
+            self._workspace_buffer = torch.zeros(
+                FLASHINFER_WORKSPACE_BUFFER_SIZE,
+                dtype=torch.uint8,
+                device=self.device)
         return self._workspace_buffer
 
     def _get_prefill_wrapper(self):
@@ -629,8 +615,6 @@ def build(self,
                         logits_soft_cap=self.logits_soft_cap,
                         q_data_type=self.q_data_type,
                         kv_data_type=self.kv_cache_dtype,
-                        fixed_split_size=self.prefill_fixed_split_size,
-                        disable_split_kv=self.disable_split_kv,
                     )
                 else:
                     attn_metadata.qo_indptr_gpu = qo_indptr_cpu.to(
@@ -684,8 +668,6 @@ def build(self,
                         logits_soft_cap=self.logits_soft_cap,
                         q_data_type=self.q_data_type,
                         kv_data_type=self.kv_cache_dtype,
-                        fixed_split_size=self.decode_fixed_split_size,
-                        disable_split_kv=self.disable_split_kv,
                     )
         return attn_metadata
 
@@ -1066,8 +1048,6 @@ def fast_plan_decode(
     rope_scale: Optional[float] = None,
     rope_theta: Optional[float] = None,
     non_blocking: bool = True,
-    fixed_split_size: int = -1,
-    disable_split_kv: bool = False,
 ) -> None:
     """
     A faster version of BatchDecodeWithPagedKVCacheWrapper::plan used for
@@ -1105,10 +1085,6 @@ def fast_plan_decode(
             rope_scale,
             rope_theta,
             non_blocking,
-            None,  # block_tables
-            None,  # seq_lens
-            fixed_split_size,
-            disable_split_kv,
         )
         self.vllm_first_call = False
         return
@@ -1154,7 +1130,7 @@ def fast_plan_decode(
     qo_indptr_host = _get_range_buf(batch_size + 1, "cpu")
 
     try:
-        # Make sure we pass exactly 18 arguments for tensor core version
+        # Make sure we pass exactly 15 arguments for tensor core version
         self._plan_info = self._cached_module.plan(
             self._float_workspace_buffer,
             self._int_workspace_buffer,
@@ -1171,9 +1147,6 @@ def fast_plan_decode(
             head_dim,
             head_dim,
             False,  # causal
-            window_left,
-            fixed_split_size,
-            disable_split_kv,
         )
     except Exception as e:
         raise RuntimeError(f"Error in tensor core plan: {e}") from e

From 4aa7dd67c04bcfa3fc0b5b313cc9b6fca431e1b0 Mon Sep 17 00:00:00 2001
From: Luca Soldaini <luca@soldaini.net>
Date: Sat, 4 Oct 2025 02:48:29 -0700
Subject: [PATCH 166/193] Add Olmo 3 reasoning parser (#26054)

Signed-off-by: Luca Soldaini <luca@soldaini.net>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../reasoning/test_olmo3_reasoning_parser.py  | 157 ++++++++++
 vllm/reasoning/__init__.py                    |   2 +
 vllm/reasoning/olmo3_reasoning_parser.py      | 294 ++++++++++++++++++
 3 files changed, 453 insertions(+)
 create mode 100644 tests/reasoning/test_olmo3_reasoning_parser.py
 create mode 100644 vllm/reasoning/olmo3_reasoning_parser.py

diff --git a/tests/reasoning/test_olmo3_reasoning_parser.py b/tests/reasoning/test_olmo3_reasoning_parser.py
new file mode 100644
index 000000000000..067be1ea2996
--- /dev/null
+++ b/tests/reasoning/test_olmo3_reasoning_parser.py
@@ -0,0 +1,157 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+import pytest
+from transformers import AutoTokenizer
+
+from tests.reasoning.utils import run_reasoning_extraction
+from vllm.reasoning import ReasoningParser, ReasoningParserManager
+
+parser_name = "olmo3"
+START_REASONING = "<think>"
+END_REASONING = "</think>"
+
+NO_REASONING = {
+    "output": f"{START_REASONING}{END_REASONING}No thoughts, head empty!",
+    "reasoning_content": None,
+    "content": "No thoughts, head empty!",
+}
+
+NO_REASONING_WITH_NEWLINE = {
+    "output":
+    f"{START_REASONING}\n{END_REASONING}\n\nNo thoughts, head empty!",
+    "reasoning_content": "\n",
+    "content": "\n\nNo thoughts, head empty!",
+}
+
+SIMPLE_REASONING = {
+    "output":
+    f"{START_REASONING}This is a reasoning section{END_REASONING}This is the rest",  # noqa: E501
+    "reasoning_content": "This is a reasoning section",
+    "content": "This is the rest",
+}
+
+SIMPLE_REASONING_WITH_NEWLINE = {
+    "output":
+    f"{START_REASONING} Look!\n\nI'm thinking...{END_REASONING}\nThis is the rest",  # noqa: E501
+    "reasoning_content": " Look!\n\nI'm thinking...",
+    "content": "\nThis is the rest",
+}
+
+SIMPLE_REASONING_WITH_MULTIPLE_NEWLINES = {
+    "output":
+    f"{START_REASONING}\nLook!\nI'm thinking...\n\n{END_REASONING}\n\n\nThis is the rest",  # noqa: E501
+    "reasoning_content": "\nLook!\nI'm thinking...\n\n",
+    "content": "\n\n\nThis is the rest",
+}
+
+NO_REASONING_ONLY_END_THINK = {
+    "output": f"{END_REASONING}\n\nNo thoughts, head empty!",
+    "reasoning_content": None,
+    "content": "\n\nNo thoughts, head empty!",
+}
+
+REASONING_ONLY_END_THINK = {
+    "output":
+    f"The user is asking me not to think.{END_REASONING}No thoughts!",
+    "reasoning_content": "The user is asking me not to think.",
+    "content": "No thoughts!",
+}
+
+TEST_CASES = [
+    pytest.param(
+        False,  # not streaming
+        NO_REASONING,
+        id="no_reasoning",
+    ),
+    pytest.param(
+        False,  # not streaming
+        NO_REASONING_WITH_NEWLINE,
+        id="no_reasoning_with_newline",
+    ),
+    pytest.param(
+        False,  # not streaming
+        SIMPLE_REASONING,
+        id="simple_reasoning",
+    ),
+    pytest.param(
+        False,  # not streaming
+        SIMPLE_REASONING_WITH_NEWLINE,
+        id="simple_reasoning_with_newline",
+    ),
+    pytest.param(
+        True,  # enable streaming
+        SIMPLE_REASONING_WITH_MULTIPLE_NEWLINES,
+        id="simple_reasoning_with_multiple_newlines",
+    ),
+    pytest.param(
+        False,  # not streaming
+        NO_REASONING_ONLY_END_THINK,
+        id="no_reasoning_only_end_think",
+    ),
+    pytest.param(
+        False,  # not streaming
+        REASONING_ONLY_END_THINK,
+        id="yes_reasoning_only_end_think",
+    ),
+    pytest.param(
+        True,  # enable streaming
+        NO_REASONING,
+        id="no_reasoning_streaming",
+    ),
+    pytest.param(
+        True,  # enable streaming
+        NO_REASONING_WITH_NEWLINE,
+        id="no_reasoning_with_newline_streaming",
+    ),
+    pytest.param(
+        True,  # enable streaming
+        SIMPLE_REASONING,
+        id="simple_reasoning_streaming",
+    ),
+    pytest.param(
+        True,  # enable streaming
+        SIMPLE_REASONING_WITH_NEWLINE,
+        id="simple_reasoning_with_newline_streaming",
+    ),
+    pytest.param(
+        True,  # enable streaming
+        SIMPLE_REASONING_WITH_MULTIPLE_NEWLINES,
+        id="simple_reasoning_with_multiple_newlines_streaming",
+    ),
+    pytest.param(
+        True,  # enable streaming
+        NO_REASONING_ONLY_END_THINK,
+        id="no_reasoning_only_end_think_streaming",
+    ),
+    pytest.param(
+        True,  # enable streaming
+        REASONING_ONLY_END_THINK,
+        id="yes_reasoning_only_end_think_streaming",
+    ),
+]
+
+# Global tokenizer initialization to avoid repeated loading
+tokenizer = AutoTokenizer.from_pretrained("allenai/dolma2-tokenizer")
+
+
+@pytest.mark.parametrize("streaming, param_dict", TEST_CASES)
+def test_reasoning(
+    streaming: bool,
+    param_dict: dict[str, str],
+):
+    output = tokenizer.tokenize(param_dict["output"])
+
+    # decode everything to tokens
+    model_output: list[str] = [
+        tokenizer.convert_tokens_to_string([token]) for token in output
+    ]
+    parser_cls = ReasoningParserManager.get_reasoning_parser(parser_name)
+    parser: ReasoningParser = parser_cls(tokenizer)
+
+    reasoning, content = run_reasoning_extraction(reasoning_parser=parser,
+                                                  model_output=model_output,
+                                                  streaming=streaming)
+
+    assert reasoning == param_dict["reasoning_content"]
+    assert content == param_dict["content"]
diff --git a/vllm/reasoning/__init__.py b/vllm/reasoning/__init__.py
index 3c8a9c6ae0d3..78d3bf35f2a3 100644
--- a/vllm/reasoning/__init__.py
+++ b/vllm/reasoning/__init__.py
@@ -9,6 +9,7 @@
 from .granite_reasoning_parser import GraniteReasoningParser
 from .hunyuan_a13b_reasoning_parser import HunyuanA13BReasoningParser
 from .mistral_reasoning_parser import MistralReasoningParser
+from .olmo3_reasoning_parser import Olmo3ReasoningParser
 from .qwen3_reasoning_parser import Qwen3ReasoningParser
 from .seedoss_reasoning_parser import SeedOSSReasoningParser
 from .step3_reasoning_parser import Step3ReasoningParser
@@ -23,6 +24,7 @@
     "Qwen3ReasoningParser",
     "Glm4MoeModelReasoningParser",
     "MistralReasoningParser",
+    "Olmo3ReasoningParser",
     "Step3ReasoningParser",
     "GptOssReasoningParser",
     "SeedOSSReasoningParser",
diff --git a/vllm/reasoning/olmo3_reasoning_parser.py b/vllm/reasoning/olmo3_reasoning_parser.py
new file mode 100644
index 000000000000..e37b6d887515
--- /dev/null
+++ b/vllm/reasoning/olmo3_reasoning_parser.py
@@ -0,0 +1,294 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+import dataclasses as dt
+import enum
+from collections.abc import Sequence
+from typing import TYPE_CHECKING, Optional, Union
+
+import regex as re
+
+if TYPE_CHECKING:
+    from vllm.transformers_utils.tokenizer import AnyTokenizer
+
+from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
+                                              DeltaMessage, ResponsesRequest)
+from vllm.logger import init_logger
+from vllm.reasoning import ReasoningParser, ReasoningParserManager
+
+logger = init_logger(__name__)
+
+
+class Olmo3ReasoningState(enum.Enum):
+    REASONING = 1
+    CONTENT = 2
+
+
+@dt.dataclass(frozen=True)
+class Indices:
+    start: int
+    end: int
+
+    def __len__(self):
+        return self.end - self.start
+
+
+def string_overlap(a: str,
+                   b: str) -> tuple[Optional[Indices], Optional[Indices]]:
+    """
+    Find the longest overlap where the end of string a matches the start
+    of string b.
+
+    Args:
+        a: First string
+        b: Second string
+
+    Returns:
+        Tuple of IndicesTuples representing the overlapping portions in each
+        string, or a tuple of None if no overlap exists
+    """
+
+    # swap so a is always the shorter string
+    a, b, swap = (a, b, False) if len(a) < len(b) else (b, a, True)
+
+    # first check: is a fully contained in b?
+    if a in b:
+        ind_a = Indices(0, len(a))
+        ind_b = Indices(b.index(a), b.index(a) + len(a))
+        return (ind_b, ind_a) if swap else (ind_a, ind_b)
+
+    # second check: does the end of a overlap with the
+    #               beginning of b?
+    for i in range(len(a) - 1, 0, -1):
+        if a[-i:] == b[:i]:
+            ind_a = Indices(len(a) - i, len(a))
+            ind_b = Indices(0, i)
+            return (ind_b, ind_a) if swap else (ind_a, ind_b)
+
+    # third check: does the beginning of a overlap with
+    #              the end of b?
+    for i in range(len(a) - 1, 0, -1):
+        if b[-i:] == a[:i]:
+            ind_a = Indices(0, i)
+            ind_b = Indices(len(b) - i, len(b))
+            return (ind_b, ind_a) if swap else (ind_a, ind_b)
+
+    return None, None
+
+
+@dt.dataclass
+class Olmo3ReasoningBuffer:
+    think_start: str = "<think>"
+    think_end: str = "</think>"
+    buffer: str = ""
+
+    # we start in reasoning state to support cases where we hardcode
+    # <think> as the start of the reasoning block.
+    # In those cases, the only token we will see is </think>, which
+    # is when we switch to content state.
+    state: Olmo3ReasoningState = Olmo3ReasoningState.REASONING
+
+    def process_buffer(self) -> Optional[DeltaMessage]:
+        start_think_idx = self.buffer.find(self.think_start)
+
+        if start_think_idx >= 0:
+            self.state = Olmo3ReasoningState.REASONING
+            pretext, self.buffer = (
+                self.buffer[:start_think_idx],
+                self.buffer[start_think_idx + len(self.think_start):],
+            )
+            if start_think_idx > 0:
+                # this covers the case there's content before
+                # the start of the reasoning block
+                return DeltaMessage(content=pretext)
+
+        end_think_idx = self.buffer.rfind(self.think_end)
+
+        if end_think_idx >= 0:
+            self.state = Olmo3ReasoningState.CONTENT
+            pretext, self.buffer = (
+                self.buffer[:end_think_idx],
+                self.buffer[end_think_idx + len(self.think_end):],
+            )
+            if end_think_idx > 0:
+                # this covers the case there's content before
+                # the end of the reasoning block
+                return DeltaMessage(reasoning_content=pretext)
+
+        if self.state == Olmo3ReasoningState.REASONING:
+            # we are inside reasoning block, return and empty
+            # the text buffer
+            (
+                text_buffer,
+                self.buffer,
+            ) = self.buffer, ""
+            return DeltaMessage(reasoning_content=text_buffer)
+
+        if self.state == Olmo3ReasoningState.CONTENT:
+            # we are outside reasoning block, return and empty
+            # the text buffer
+            (
+                text_buffer,
+                self.buffer,
+            ) = self.buffer, ""
+            return DeltaMessage(content=text_buffer)
+
+        # nothing to return unless we are in reasoning or content state
+        return None
+
+    def __len__(self):
+        # is the length of the text buffer
+        return len(self.buffer)
+
+    def add_text(self, delta_text: str) -> Optional[DeltaMessage]:
+        # we start by adding the delta text to the buffer
+        self.buffer += delta_text
+
+        # setting this to empty before starting
+        delta_message: Optional[DeltaMessage] = None
+
+        # we start by computing the overlap between the delta_text
+        # and start/end of think tokens.
+        _, overlap_think_start = string_overlap(delta_text, self.think_start)
+        _, overlap_think_end = string_overlap(delta_text, self.think_end)
+
+        partial_overlap_start = overlap_think_start is not None and len(
+            overlap_think_start) < len(self.think_start)
+        partial_overlap_end = overlap_think_end is not None and len(
+            overlap_think_end) < len(self.think_end)
+
+        if (partial_overlap_start and self.think_start in self.buffer
+                and not partial_overlap_end):
+            # we can only process the buffer if partial overlap
+            # is the last part of think token (thus causing
+            # text_buffer to contain the start of think token)
+            # and there are no partial overlaps with end think
+            delta_message = self.process_buffer()
+
+        elif partial_overlap_end and self.think_end in self.buffer:
+            # same as before (partial overlap only allowed)
+            # if the buffer contains the end think token,
+            # but we don't have to check for partial overlap
+            # with start think token because they are handled
+            # by the previous condition
+            delta_message = self.process_buffer()
+
+        elif partial_overlap_start or partial_overlap_end:
+            # in general, if there are overlaps, we don't
+            # process the buffer because we want to wait until
+            # the think token is fully completed.
+            return None
+        else:
+            # we process the buffer as normal
+            delta_message = self.process_buffer()
+
+        return delta_message
+
+
+@ReasoningParserManager.register_module("olmo3")
+class Olmo3ReasoningParser(ReasoningParser):
+    """
+    Reasoning parser for Olmo 3 model
+
+    Olmo3ReasoningParser
+
+    This class implements a reasoning parser specifically designed for the
+    Olmo 3 family of models. Olmo 3 models do not use special tokens to
+    indicate reasoning; rather, reasoning trace is wrapped in `<think>` and
+    `</think>`, which are tokenized using standard vocabulary entries.
+    Because of this, the parser operates in string space, accumulating the
+    characters in a buffer until it sees `<think>` or `</think>`. tokens
+    to switch modes.
+
+    Key Features:
+        - For non-stream output, Recognizes and extracts reasoning (text
+          bracketed by `<think>` and `</think>`) and content (everything
+          after the first `</think>`).
+        - For stream process, it uses a buffer to accumulate delta text,
+          and output progressive delta messages as soon as thinking starts
+          or ends.
+        - For reliability, some Olmo 3 models may hardcode the first
+          `<think>` token is the input text (similar to Deepseek R1,
+          or reasoning-only Qwen models). To support such variants, the
+          parser can optionally work in cases where the first `<think>`
+          token is missing from generation.
+    """
+
+    def __init__(self, tokenizer: "AnyTokenizer", *args, **kwargs):
+        super().__init__(tokenizer, *args, **kwargs)
+
+        self.think_start = r"<think>"
+        self.think_end = r"</think>"
+
+        # notice that the first think is optional; this allows template to
+        # work in cases when we hardcode a <think> at the beginning of the
+        # reasoning template.
+        reasoning_expr = (rf"^(?:{self.think_start})?(?P<reasoning>.*?)" +
+                          rf"{self.think_end}(?P<content>.*)$")
+        self.reasoning_regex = re.compile(reasoning_expr, re.DOTALL)
+
+        self.buffer = Olmo3ReasoningBuffer(think_start=self.think_start,
+                                           think_end=self.think_end)
+
+    def is_reasoning_end(self, input_ids: list[int]) -> bool:
+        text = self.model_tokenizer.decode(input_ids)
+        return self.think_end in text
+
+    def extract_content_ids(self, input_ids: list[int]) -> list[int]:
+        # for Olmo 3 streaming reason parsing, the stream parse
+        # will call first, and the same token will be called in
+        # is_reasoning_end and extract_content_ids
+        # this id is not part of content, so just return [] here.
+        return []
+
+    def extract_reasoning_content(
+        self,
+        model_output: str,
+        request: Union[ChatCompletionRequest, ResponsesRequest],
+    ) -> tuple[Optional[str], Optional[str]]:
+        """Extract the reasoning content & content sections, respectively.
+        If the sequence doesn't match what we expect, i.e., the model generates
+        something else, all content is considered non-reasoning content.
+
+        Args:
+            model_output (str): Output of the model to be parsed.
+            request (ChatCompletionRequest | ResponsesRequest): Request being
+                processed.
+
+        Returns:
+            tuple[Optional[str], Optional[str]]: Tuple pair containing the
+            reasoning content and non-reasoning content.
+        """
+
+        re_match = self.reasoning_regex.match(model_output)
+        if re_match:
+            reasoning_content = re_match.group("reasoning") or None
+            content = re_match.group("content") or None
+            return reasoning_content, content
+
+        # no reasoning content
+        return None, model_output
+
+    def extract_reasoning_content_streaming(
+        self,
+        previous_text: str,
+        current_text: str,
+        delta_text: str,
+        previous_token_ids: Sequence[int],
+        current_token_ids: Sequence[int],
+        delta_token_ids: Sequence[int],
+    ) -> Union[DeltaMessage, None]:
+        """Extract content using token ID sequence state machine"""
+
+        delta_message = self.buffer.add_text(delta_text)
+        if (delta_message is None
+                and self.buffer.think_end in self.buffer.buffer):
+            # this is a bit hacky, but, because of how the buffer is
+            # constructed, if the last delta_text contains characters that
+            # marks the end of thinking tokens, then messages in the buffer
+            # would never be processed because we get no other turn. To get
+            # around that, we check if the text buffer contains the end of
+            # thinking tokens, and, if so, we reprocess the buffer again.
+            delta_message = self.buffer.process_buffer()
+
+        return delta_message

From 2bbd103739dccb902348df6c49caec189dab8c13 Mon Sep 17 00:00:00 2001
From: Yannick Schnider <Yannick.Schnider1@ibm.com>
Date: Sat, 4 Oct 2025 11:59:26 +0200
Subject: [PATCH 167/193] [Core] Enable decode of context length equal to max
 model length (#26168)

Signed-off-by: Yannick Schnider <yannick.schnider1@ibm.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/entrypoints/llm/test_generate.py |  5 ++--
 tests/v1/e2e/test_context_length.py    | 38 ++++++++++++++++++--------
 vllm/v1/core/sched/scheduler.py        |  2 +-
 vllm/v1/core/sched/utils.py            |  2 +-
 4 files changed, 32 insertions(+), 15 deletions(-)

diff --git a/tests/entrypoints/llm/test_generate.py b/tests/entrypoints/llm/test_generate.py
index 5af4327b65d0..3be4530452fa 100644
--- a/tests/entrypoints/llm/test_generate.py
+++ b/tests/entrypoints/llm/test_generate.py
@@ -82,10 +82,11 @@ def test_max_model_len():
     for output in outputs:
         num_total_tokens = len(output.prompt_token_ids) + len(
             output.outputs[0].token_ids)
-        # Total tokens must not exceed max_model_len.
+        # Total tokens must not exceed max_model_len + 1 (the last token can be
+        # generated with the context length equal to the max model length)
         # It can be less if generation finishes due to other reasons (e.g., EOS)
         # before reaching the absolute model length limit.
-        assert num_total_tokens <= max_model_len
+        assert num_total_tokens <= max_model_len + 1
 
 
 def test_log_stats():
diff --git a/tests/v1/e2e/test_context_length.py b/tests/v1/e2e/test_context_length.py
index 67a6c7be4432..b8891d961906 100644
--- a/tests/v1/e2e/test_context_length.py
+++ b/tests/v1/e2e/test_context_length.py
@@ -4,15 +4,22 @@
 end-to-end tests for context length corner cases of vLLM v1 model runner
 versus HuggingFace's transformers.
 
-This test verifies the following behavior: allow a prefill that fills the
-model's maximum context length and then request a single new token.
+This test verifies the following behavior: allow prefill and decodes on the
+model's maximum context length ``max_model_len`` and get one more token.
 
 Test strategy
-- Build a textual prompt that tokenizes to exactly ``max_model_len`` tokens.
-- Run vLLM generation requesting a single new token (max_tokens=1).
-- Run HF generation on the same prompt requesting a single token too.
+- Build a prompt consisting of exactly ``prompt_len`` tokens.
+- Run vLLM generation requesting ``max_tokens`` new tokens.
+- Run HF generation on the same prompt requesting the same number of tokens.
 - Assert both return the same number of generated tokens and the same ids.
 
+Test cases
+- Prefill a prompt of ``max_model_len`` (2048) and request a single token which
+will be sampled after the prefill (context length ``max_model_len``).
+- Prefill a prompt of ``max_model_len`` - 1 (2047) and request two tokens where
+the 1st will be sampled after the prefill and the 2nd after the first decode
+(context length ``max_model_len``).
+
 """
 
 import pytest
@@ -27,11 +34,16 @@
 
 @create_new_process_for_each_test()
 @pytest.mark.parametrize("model", ["JackFram/llama-160m"])
-@pytest.mark.parametrize("max_model_len", [2048])
-@pytest.mark.parametrize("max_tokens", [1])
-def test_prefill_max_context_length(
+@pytest.mark.parametrize(
+    "prompt_len, max_tokens",
+    [
+        (2048, 1),  # prompt_len = max_model_len
+        (2047, 2),  # prompt_len = max_model_len - 1
+    ],
+)
+def test_max_context_length(
     model: str,
-    max_model_len: int,
+    prompt_len: int,
     max_tokens: int,
 ) -> None:
     """Compare vLLM and HuggingFace when the prompt already fills the
@@ -42,8 +54,8 @@ def test_prefill_max_context_length(
     single token when given the same inputs.
     """
 
-    # Construct a prompt of size max_model_len
-    prompt_ids = [[43] * max_model_len]
+    # Construct a prompt of size prompt_len
+    prompt_ids = [[43] * prompt_len]
 
     # Generate max_tokens new tokens deterministically.
     sampling_params = [
@@ -54,6 +66,7 @@ def test_prefill_max_context_length(
     llm = LLM(
         model=model,
         tokenizer=model,
+        max_model_len=2048,
         max_num_seqs=1,
         tensor_parallel_size=1,
     )
@@ -81,6 +94,9 @@ def test_prefill_max_context_length(
         # HF returns the prompt + generated tokens. Slice off the prompt.
         hf_output_ids = hf_generated.cpu().tolist()[0][len(prompt_ids[0]):]
 
+    # check that exactly max_tokens tokens were generated with vLLM and HF
+    assert len(vllm_output_ids) == len(hf_output_ids) == max_tokens
+
     # check that vLLM outputs (token ids) match HF outputs
     # Note: for simplicity don't pass detokenized string
     check_outputs_equal(
diff --git a/vllm/v1/core/sched/scheduler.py b/vllm/v1/core/sched/scheduler.py
index d4be1b06b3b2..6983ccca51f4 100644
--- a/vllm/v1/core/sched/scheduler.py
+++ b/vllm/v1/core/sched/scheduler.py
@@ -224,7 +224,7 @@ def schedule(self) -> SchedulerOutput:
             # This is necessary when using spec decoding.
             num_new_tokens = min(
                 num_new_tokens,
-                self.max_model_len - 1 - request.num_computed_tokens)
+                self.max_model_len - request.num_computed_tokens)
 
             # Schedule encoder inputs.
             encoder_inputs_to_schedule = None
diff --git a/vllm/v1/core/sched/utils.py b/vllm/v1/core/sched/utils.py
index c431843de6ba..6b321f4ebbef 100644
--- a/vllm/v1/core/sched/utils.py
+++ b/vllm/v1/core/sched/utils.py
@@ -43,7 +43,7 @@ def remove_all(lst: list, items_to_remove: set) -> list:
 def check_stop(request: Request,
                max_model_len: int,
                pooler_output: Optional[torch.Tensor] = None) -> bool:
-    if (request.num_tokens >= max_model_len
+    if (request.num_tokens > max_model_len
             or request.num_output_tokens >= request.max_tokens):
         request.status = RequestStatus.FINISHED_LENGTH_CAPPED
         return True

From 516f1068b7a90b4b54a053211cbd7d5167f81edb Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Nicol=C3=B2=20Lucchesi?= <nlucches@redhat.com>
Date: Sat, 4 Oct 2025 13:39:31 +0200
Subject: [PATCH 168/193] [Bugfix] Fix `_reqs_to_process` leak on abort
 (#26012)

Signed-off-by: NickLucche <nlucches@redhat.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../kv_connector/unit/test_nixl_connector.py  | 66 +++++++++++++++++++
 .../kv_connector/v1/nixl_connector.py         | 18 ++++-
 2 files changed, 82 insertions(+), 2 deletions(-)

diff --git a/tests/v1/kv_connector/unit/test_nixl_connector.py b/tests/v1/kv_connector/unit/test_nixl_connector.py
index 21953b5533ec..08c0fdefdfc9 100644
--- a/tests/v1/kv_connector/unit/test_nixl_connector.py
+++ b/tests/v1/kv_connector/unit/test_nixl_connector.py
@@ -33,6 +33,7 @@
 from vllm.sampling_params import SamplingParams
 from vllm.v1.attention.backends.flash_attn import FlashAttentionBackend
 from vllm.v1.outputs import KVConnectorOutput, ModelRunnerOutput
+from vllm.v1.request import RequestStatus
 
 from .utils import create_request, create_scheduler, create_vllm_config
 
@@ -1023,3 +1024,68 @@ def test_shutdown_cleans_up_resources(dist_init):
         assert mock_dereg.call_count == 2
         mock_dereg.assert_any_call("desc1")
         mock_dereg.assert_any_call("desc2")
+
+
+@patch(
+    "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.NixlWrapper",
+    FakeNixlWrapper)
+def test_aborted_request_removed_from_worker_in_batch(dist_init):
+    """
+    Create and schedule a request so that P adds it to in-batch tracking via
+    the real scheduler, then simulate an abort (request not in next scheduler
+    iteration) and verify the worker no longer tracks it as in-batch.
+    """
+    vllm_config = create_vllm_config()
+
+    scheduler = create_scheduler(vllm_config)
+    # KVConnector Worker in P
+    connector = NixlConnector(vllm_config, KVConnectorRole.WORKER)
+    connector.connector_worker = FakeNixlConnectorWorker(vllm_config,
+                                                         connector.engine_id,
+                                                         hand_shake_latency=0)
+
+    # Create a request that triggers do_remote_decode so that
+    # the scheduler adds it to reqs_in_batch
+    req = create_request(request_id=1, do_remote_decode=True, max_tokens=1)
+    scheduler.add_request(req)
+
+    # First scheduling pass - examinate build_connector_meta output
+    sched_out = scheduler.schedule()
+    kv_meta = sched_out.kv_connector_metadata
+    assert kv_meta is not None
+    assert isinstance(kv_meta, NixlConnectorMetadata)
+    assert req.request_id in kv_meta.reqs_in_batch
+
+    #### Model Runner start ####
+    # Bind scheduler-produced metadata and start worker processing.
+    connector.bind_connector_metadata(kv_meta)
+
+    dummy_ctx = ForwardContext(
+        no_compile_layers={},
+        attn_metadata={},
+        virtual_engine=0,
+    )
+    connector.start_load_kv(dummy_ctx)
+
+    # Ensure it was tracked by the worker
+    assert req.request_id in connector.connector_worker._reqs_to_process
+
+    #### Model Runner end ####
+
+    # Abort request - request_finished call in connector scheduler
+    scheduler.finish_requests(req.request_id, RequestStatus.FINISHED_ABORTED)
+    # Second scheduling pass - build metadata with aborted request
+    sched_out2 = scheduler.schedule()
+    kv_meta2 = sched_out2.kv_connector_metadata
+    assert kv_meta2 is not None
+    assert isinstance(kv_meta2, NixlConnectorMetadata)
+    assert req.request_id not in kv_meta2.reqs_in_batch
+
+    # Bind empty/abort metadata and run worker step
+    #### Model Runner start ####
+    connector.bind_connector_metadata(kv_meta2)
+    connector.start_load_kv(dummy_ctx)
+
+    # After abort, the worker should not keep tracking it as "in-batch"
+    assert req.request_id not in connector.connector_worker._reqs_to_process
+    #### Model Runner end ####
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
index fdfcc39666ad..c9a472ce86cb 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
@@ -113,6 +113,7 @@ def __init__(self):
         self.reqs_to_save: dict[ReqId, ReqMeta] = {}
         self.reqs_to_send: dict[ReqId, float] = {}
         self.reqs_in_batch: set[ReqId] = set()
+        self.reqs_not_processed: set[ReqId] = set()
 
     def add_new_req(
         self,
@@ -287,6 +288,9 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
         # Reqs to send and their expiration time
         self._reqs_need_send: dict[ReqId, float] = {}
         self._reqs_in_batch: set[ReqId] = set()
+        # Reqs to remove from processed set because they're not to send after
+        # remote prefill or aborted.
+        self._reqs_not_processed: set[ReqId] = set()
 
     def get_num_new_matched_tokens(
             self, request: "Request",
@@ -401,11 +405,13 @@ def build_connector_meta(
 
         meta.reqs_to_send = self._reqs_need_send
         meta.reqs_in_batch = self._reqs_in_batch
+        meta.reqs_not_processed = self._reqs_not_processed
 
         # Clear the list once workers start the transfers
         self._reqs_need_recv.clear()
         self._reqs_need_save.clear()
         self._reqs_in_batch = set()
+        self._reqs_not_processed = set()
         self._reqs_need_send = {}
 
         return meta
@@ -439,8 +445,12 @@ def request_finished(
             params["do_remote_prefill"] = False
             return False, None
 
-        if (not params.get("do_remote_decode")
-                or request.status != RequestStatus.FINISHED_LENGTH_CAPPED):
+        if not params.get("do_remote_decode"):
+            return False, None
+        if request.status != RequestStatus.FINISHED_LENGTH_CAPPED:
+            # Also include the case of a P/D Prefill request with immediate
+            # block free (eg abort). Stop tracking this request.
+            self._reqs_not_processed.add(request.request_id)
             return False, None
 
         # TODO: check whether block_ids actually ever be 0. If not we could
@@ -1234,6 +1244,10 @@ def start_load_kv(self, metadata: NixlConnectorMetadata):
         for req_id in metadata.reqs_in_batch:
             self._reqs_to_process.add(req_id)
 
+        # Remove all requests that are not to be processed (eg aborted).
+        for req_id in metadata.reqs_not_processed:
+            self._reqs_to_process.discard(req_id)
+
         # Add to requests that are waiting to be read and track expiration.
         for req_id, expiration_time in metadata.reqs_to_send.items():
             if req_id in self._reqs_to_process:

From a63a36ae89a7cbfa3ec5603f68be63aeb3a777ff Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Sat, 4 Oct 2025 21:21:42 +0800
Subject: [PATCH 169/193] [Model] CLIP Embedding Support (#26010)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/models/supported_models.md               |   1 +
 .../vision_language_pooling.py                |  34 +-
 ...ai_chat_embedding_client_for_multimodal.py |  72 +-
 tests/models/multimodal/pooling/test_clip.py  | 138 ++++
 tests/models/registry.py                      |  10 +-
 vllm/attention/layer.py                       |   6 +-
 vllm/model_executor/models/bert.py            |   2 +-
 vllm/model_executor/models/clip.py            | 657 ++++++++++++++++--
 vllm/model_executor/models/registry.py        |   1 +
 vllm/model_executor/models/vision.py          |   6 +-
 .../chat_templates/registry.py                |   1 +
 11 files changed, 850 insertions(+), 78 deletions(-)
 create mode 100644 tests/models/multimodal/pooling/test_clip.py

diff --git a/docs/models/supported_models.md b/docs/models/supported_models.md
index fdfcf89d9ab3..60fe5b887952 100644
--- a/docs/models/supported_models.md
+++ b/docs/models/supported_models.md
@@ -829,6 +829,7 @@ The following table lists those that are tested in vLLM.
 
 | Architecture | Models | Inputs | Example HF Models | [LoRA](../features/lora.md) | [PP](../serving/parallelism_scaling.md) | [V1](gh-issue:8779) |
 |--------------|--------|--------|-------------------|----------------------|---------------------------|---------------------|
+| `CLIPModel` | CLIP | T / I | `openai/clip-vit-base-patch32`, `openai/clip-vit-large-patch14`, etc. | | | ✅︎ |
 | `LlavaNextForConditionalGeneration`<sup>C</sup> | LLaVA-NeXT-based | T / I | `royokong/e5-v` | | ✅︎ | ✅︎ |
 | `Phi3VForCausalLM`<sup>C</sup> | Phi-3-Vision-based | T + I | `TIGER-Lab/VLM2Vec-Full` | | ✅︎ | ✅︎ |
 | `*ForConditionalGeneration`<sup>C</sup>, `*ForCausalLM`<sup>C</sup>, etc. | Generative models | \* | N/A | \* | \* | \* |
diff --git a/examples/offline_inference/vision_language_pooling.py b/examples/offline_inference/vision_language_pooling.py
index 3d1daf4d19ff..6f8679918c27 100644
--- a/examples/offline_inference/vision_language_pooling.py
+++ b/examples/offline_inference/vision_language_pooling.py
@@ -58,6 +58,30 @@ class ModelRequestData(NamedTuple):
     documents: Optional[ScoreMultiModalParam] = None
 
 
+def run_clip(query: Query) -> ModelRequestData:
+    if query["modality"] == "text":
+        prompt = query["text"]
+        image = None
+    elif query["modality"] == "image":
+        prompt = ""  # For image input, make sure that the prompt text is empty
+        image = query["image"]
+    else:
+        modality = query["modality"]
+        raise ValueError(f"Unsupported query modality: '{modality}'")
+
+    engine_args = EngineArgs(
+        model="openai/clip-vit-base-patch32",
+        runner="pooling",
+        limit_mm_per_prompt={"image": 1},
+    )
+
+    return ModelRequestData(
+        engine_args=engine_args,
+        prompt=prompt,
+        image=image,
+    )
+
+
 def run_e5_v(query: Query) -> ModelRequestData:
     llama3_template = "<|start_header_id|>user<|end_header_id|>\n\n{}<|eot_id|><|start_header_id|>assistant<|end_header_id|>\n\n \n"  # noqa: E501
 
@@ -146,7 +170,8 @@ def run_vlm2vec_qwen2vl(query: Query) -> ModelRequestData:
 
     processor = AutoProcessor.from_pretrained(
         model_id,
-        # `min_pixels` and `max_pixels` are deprecated
+        # `min_pixels` and `max_pixels` are deprecated for
+        # transformers `preprocessor_config.json`
         size={"shortest_edge": 3136, "longest_edge": 12845056},
     )
     processor.chat_template = load_chat_template(
@@ -172,8 +197,10 @@ def run_vlm2vec_qwen2vl(query: Query) -> ModelRequestData:
         model=merged_path,
         runner="pooling",
         max_model_len=4096,
-        trust_remote_code=True,
-        mm_processor_kwargs={"num_crops": 4},
+        mm_processor_kwargs={
+            "min_pixels": 3136,
+            "max_pixels": 12845056,
+        },
         limit_mm_per_prompt={"image": 1},
     )
 
@@ -299,6 +326,7 @@ def run_score(model: str, modality: QueryModality, seed: Optional[int]):
 
 
 model_example_map = {
+    "clip": run_clip,
     "e5_v": run_e5_v,
     "vlm2vec_phi3v": run_vlm2vec_phi3v,
     "vlm2vec_qwen2vl": run_vlm2vec_qwen2vl,
diff --git a/examples/online_serving/pooling/openai_chat_embedding_client_for_multimodal.py b/examples/online_serving/pooling/openai_chat_embedding_client_for_multimodal.py
index 6e31c3836806..16ac4378c686 100644
--- a/examples/online_serving/pooling/openai_chat_embedding_client_for_multimodal.py
+++ b/examples/online_serving/pooling/openai_chat_embedding_client_for_multimodal.py
@@ -1,14 +1,9 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 # ruff: noqa: E501
-"""Example Python client for multimodal embedding API using vLLM API server
-NOTE:
-    start a supported multimodal embeddings model server with `vllm serve`, e.g.
-    vllm serve TIGER-Lab/VLM2Vec-Full \
-        --runner pooling \
-        --trust-remote-code \
-        --max-model-len 4096 \
-        --chat-template examples/template_vlm2vec_phi3v.jinja
+"""Example Python client for multimodal embedding API using vLLM API server.
+
+Refer to each `run_*` function for the command to run the server for that model.
 """
 
 import argparse
@@ -47,7 +42,58 @@ def create_chat_embeddings(
     )
 
 
+def run_clip(client: OpenAI, model: str):
+    """
+    Start the server using:
+
+    vllm serve openai/clip-vit-base-patch32 \
+        --runner pooling
+    """
+
+    response = create_chat_embeddings(
+        client,
+        messages=[
+            {
+                "role": "user",
+                "content": [
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                ],
+            }
+        ],
+        model=model,
+        encoding_format="float",
+    )
+
+    print("Image embedding output:", response.data[0].embedding)
+
+    response = create_chat_embeddings(
+        client,
+        messages=[
+            {
+                "role": "user",
+                "content": [
+                    {"type": "text", "text": "a photo of a cat"},
+                ],
+            }
+        ],
+        model=model,
+        encoding_format="float",
+    )
+
+    print("Text embedding output:", response.data[0].embedding)
+
+
 def run_vlm2vec(client: OpenAI, model: str):
+    """
+    Start the server using:
+
+    vllm serve TIGER-Lab/VLM2Vec-Full \
+        --runner pooling \
+        --trust-remote-code \
+        --max-model-len 4096 \
+        --chat-template examples/template_vlm2vec_phi3v.jinja
+    """
+
     response = create_chat_embeddings(
         client,
         messages=[
@@ -103,6 +149,15 @@ def run_vlm2vec(client: OpenAI, model: str):
 
 
 def run_dse_qwen2_vl(client: OpenAI, model: str):
+    """
+    Start the server using:
+
+    vllm serve MrLight/dse-qwen2-2b-mrl-v1 \
+        --runner pooling \
+        --trust-remote-code \
+        --max-model-len 8192 \
+        --chat-template examples/template_dse_qwen2_vl.jinja
+    """
     response = create_chat_embeddings(
         client,
         messages=[
@@ -156,6 +211,7 @@ def run_dse_qwen2_vl(client: OpenAI, model: str):
 
 
 model_example_map = {
+    "clip": run_clip,
     "vlm2vec": run_vlm2vec,
     "dse_qwen2_vl": run_dse_qwen2_vl,
 }
diff --git a/tests/models/multimodal/pooling/test_clip.py b/tests/models/multimodal/pooling/test_clip.py
new file mode 100644
index 000000000000..0aaf6877c2a6
--- /dev/null
+++ b/tests/models/multimodal/pooling/test_clip.py
@@ -0,0 +1,138 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+import pytest
+from transformers import CLIPModel
+
+from ....conftest import IMAGE_ASSETS, HfRunner, PromptImageInput, VllmRunner
+from ...utils import check_embeddings_close
+
+HF_TEXT_PROMPTS = [
+    "a photo of a stop sign",
+    "a photo of a cherry blossom",
+]
+
+HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts({
+    "stop_sign": "",
+    "cherry_blossom": "",
+})
+
+MODELS = ["openai/clip-vit-base-patch32"]
+
+
+def _run_test(
+    hf_runner: type[HfRunner],
+    vllm_runner: type[VllmRunner],
+    input_texts: list[str],
+    input_images: PromptImageInput,
+    model: str,
+    *,
+    dtype: str,
+) -> None:
+    # NOTE: take care of the order. run vLLM first, and then run HF.
+    # vLLM needs a fresh new process without cuda initialization.
+    # if we run HF first, the cuda initialization will be done and it
+    # will hurt multiprocessing backend with fork method (the default method).
+    with vllm_runner(model,
+                     runner="pooling",
+                     dtype=dtype,
+                     enforce_eager=True,
+                     max_model_len=77) as vllm_model:
+        vllm_outputs = vllm_model.embed(input_texts, images=input_images)
+
+    with hf_runner(model, dtype=dtype, auto_cls=CLIPModel) as hf_model:
+        all_inputs = hf_model.get_inputs(input_texts, images=input_images)
+
+        all_outputs = []
+        for inputs in all_inputs:
+            if "pixel_values" in inputs:
+                inputs.pop("input_ids")
+                pooled_output = hf_model.model.get_image_features(
+                    **hf_model.wrap_device(inputs)).squeeze(0)
+            else:
+                pooled_output = hf_model.model.get_text_features(
+                    **hf_model.wrap_device(inputs)).squeeze(0)
+
+            all_outputs.append(pooled_output.tolist())
+
+        hf_outputs = all_outputs
+
+    check_embeddings_close(
+        embeddings_0_lst=hf_outputs,
+        embeddings_1_lst=vllm_outputs,
+        name_0="hf",
+        name_1="vllm",
+    )
+
+
+@pytest.mark.parametrize("model", MODELS)
+@pytest.mark.parametrize("dtype", ["float"])
+def test_models_text(
+    hf_runner,
+    vllm_runner,
+    image_assets,
+    model: str,
+    dtype: str,
+) -> None:
+    input_texts_images = [(text, None) for text in HF_TEXT_PROMPTS]
+    input_texts = [text for text, _ in input_texts_images]
+    input_images = [image for _, image in input_texts_images]
+
+    _run_test(
+        hf_runner,
+        vllm_runner,
+        input_texts,
+        input_images,  # type: ignore
+        model,
+        dtype=dtype,
+    )
+
+
+@pytest.mark.parametrize("model", MODELS)
+@pytest.mark.parametrize("dtype", ["float"])
+def test_models_image(
+    hf_runner,
+    vllm_runner,
+    image_assets,
+    model: str,
+    dtype: str,
+) -> None:
+    input_texts_images = [
+        (text, asset.pil_image)
+        for text, asset in zip(HF_IMAGE_PROMPTS, image_assets)
+    ]
+    input_texts = [text for text, _ in input_texts_images]
+    input_images = [image for _, image in input_texts_images]
+
+    _run_test(
+        hf_runner,
+        vllm_runner,
+        input_texts,
+        input_images,
+        model,
+        dtype=dtype,
+    )
+
+
+@pytest.mark.parametrize("model", MODELS)
+@pytest.mark.parametrize("dtype", ["float"])
+def test_models_text_image_no_crash(
+    vllm_runner,
+    image_assets,
+    model: str,
+    dtype: str,
+) -> None:
+    texts = [HF_TEXT_PROMPTS[0]]
+    images = [image_assets[0].pil_image]
+
+    with vllm_runner(model,
+                     runner="pooling",
+                     dtype=dtype,
+                     enforce_eager=True,
+                     max_model_len=77) as vllm_model:
+        with pytest.raises(ValueError, match="not both"):
+            vllm_model.embed(texts, images=images)
+
+        # Should still be able to run subsequent requests
+        vllm_model.embed(texts)
+        vllm_model.embed([""], images=images)
diff --git a/tests/models/registry.py b/tests/models/registry.py
index 86a835975227..182654cdf3c7 100644
--- a/tests/models/registry.py
+++ b/tests/models/registry.py
@@ -389,6 +389,7 @@ def check_available_online(
     "RobertaForMaskedLM": _HfExamplesInfo("sentence-transformers/all-roberta-large-v1"),  # noqa: E501
     "XLMRobertaModel": _HfExamplesInfo("intfloat/multilingual-e5-small"),  # noqa: E501
     # [Multimodal]
+    "CLIPModel": _HfExamplesInfo("openai/clip-vit-base-patch32"),
     "LlavaNextForConditionalGeneration": _HfExamplesInfo("royokong/e5-v"),
     "Phi3VForCausalLM": _HfExamplesInfo("TIGER-Lab/VLM2Vec-Full",
                                          trust_remote_code=True),
@@ -687,7 +688,11 @@ def get_supported_archs(self) -> Set[str]:
         return self.hf_models.keys()
 
     def get_hf_info(self, model_arch: str) -> _HfExamplesInfo:
-        return self.hf_models[model_arch]
+        try:
+            return self.hf_models[model_arch]
+        except KeyError:
+            raise ValueError(f"No example model defined for {model_arch}; "
+                             f"please update this file.") from None
 
     def find_hf_info(self, model_id: str) -> _HfExamplesInfo:
         for info in self.hf_models.values():
@@ -699,7 +704,8 @@ def find_hf_info(self, model_id: str) -> _HfExamplesInfo:
             if any(extra == model_id for extra in info.extras.values()):
                 return info
 
-        raise ValueError(f"No example model defined for {model_id}")
+        raise ValueError(f"No example model defined for {model_id}; "
+                         f"please update this file.")
 
 
 HF_EXAMPLE_MODELS = HfExampleModels(_EXAMPLE_MODELS)
diff --git a/vllm/attention/layer.py b/vllm/attention/layer.py
index ac34f279d0b5..6632ee6b0dc3 100644
--- a/vllm/attention/layer.py
+++ b/vllm/attention/layer.py
@@ -417,12 +417,16 @@ def __init__(
         head_size: int,
         scale: float,
         num_kv_heads: Optional[int] = None,
-    ):
+        # This has no effect, it is only here to make it easier to swap
+        # between Attention and MultiHeadAttention
+        prefix: str = "",
+    ) -> None:
         super().__init__()
         self.num_heads = num_heads
         self.head_size = head_size
         self.scale = scale
         self.num_kv_heads = num_heads if num_kv_heads is None else num_kv_heads
+        self.layer_name = prefix
 
         assert self.num_heads % self.num_kv_heads == 0, \
             f"num_heads ({self.num_heads}) is not " \
diff --git a/vllm/model_executor/models/bert.py b/vllm/model_executor/models/bert.py
index 2ec3edc5a0a7..10e718667122 100644
--- a/vllm/model_executor/models/bert.py
+++ b/vllm/model_executor/models/bert.py
@@ -351,7 +351,7 @@ def __init__(
                                    prefix=f"{prefix}.encoder")
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
-        return self.embeddings(input_ids)
+        return self.embeddings.word_embeddings(input_ids)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/clip.py b/vllm/model_executor/models/clip.py
index 451da2120048..7ec366a2e4aa 100644
--- a/vllm/model_executor/models/clip.py
+++ b/vllm/model_executor/models/clip.py
@@ -1,28 +1,63 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-"""Minimal implementation of CLIPVisionModel intended to be only used
-within a vision language model."""
-from collections.abc import Iterable
-from typing import Optional, Union
+from collections.abc import Iterable, Mapping, Sequence
+from functools import cached_property
+from typing import Annotated, Literal, Optional, Union
 
 import torch
 import torch.nn as nn
-from transformers import CLIPVisionConfig
+from transformers import (BatchFeature, CLIPConfig, CLIPProcessor,
+                          CLIPTextConfig, CLIPVisionConfig)
 
+from vllm.attention import Attention
 from vllm.attention.layer import MultiHeadAttention
+from vllm.config import VllmConfig
+from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import divide, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
                                                QKVParallelLinear,
                                                RowParallelLinear)
+from vllm.model_executor.layers.pooler import DispatchPooler, Pooler
 from vllm.model_executor.layers.quantization import QuantizationConfig
+from vllm.model_executor.layers.vocab_parallel_embedding import (
+    VocabParallelEmbedding)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.interfaces import SupportsQuant
-
+from vllm.multimodal import MULTIMODAL_REGISTRY
+from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
+                                    MultiModalInputs, MultiModalKwargsItems,
+                                    MultiModalUUIDDict)
+from vllm.multimodal.parse import (ImageProcessorItems, ImageSize,
+                                   MultiModalDataItems)
+from vllm.multimodal.processing import (BaseMultiModalProcessor,
+                                        BaseProcessingInfo, PromptIndexTargets,
+                                        PromptReplacement, PromptUpdate)
+from vllm.multimodal.profiling import BaseDummyInputsBuilder
+from vllm.sequence import IntermediateTensors
+from vllm.utils.tensor_schema import TensorSchema, TensorShape
+
+from .interfaces import MultiModalEmbeddings, SupportsMultiModal
+from .interfaces_base import default_pooling_type
+from .utils import AutoWeightsLoader, maybe_prefix
 from .vision import (VisionEncoderInfo, VisionFeatureSelectStrategy,
+                     VisionFeatureSelectStrategyStr,
+                     get_num_selected_vision_tokens,
                      resolve_visual_encoder_outputs)
 
 
+class CLIPImagePixelInputs(TensorSchema):
+    """
+    Dimensions:
+        - bn: Batch size * number of images
+        - c: Number of channels (3)
+        - h: Height of each image
+        - w: Width of each image
+    """
+    type: Literal["pixel_values"]
+    data: Annotated[torch.Tensor, TensorShape("bn", 3, "h", "w")]
+
+
 class CLIPEncoderInfo(VisionEncoderInfo[CLIPVisionConfig]):
 
     def get_num_image_tokens(
@@ -45,7 +80,214 @@ def get_patch_grid_length(self) -> int:
         return image_size // patch_size
 
 
-# Adapted from https://github.com/huggingface/transformers/blob/v4.39.0/src/transformers/models/clip/modeling_clip.py#L164 # noqa
+_POOLING_TYPE_TO_STRATEGY: dict[str, VisionFeatureSelectStrategyStr] = {
+    "MEAN": "full",
+    "ALL": "full",
+    "CLS": "class",
+    # This lets us use the same pooling type for both text and image
+    "LAST": "class",
+}
+
+
+def _get_vision_feature_select_strategy(pooling_type: str):
+    try:
+        return _POOLING_TYPE_TO_STRATEGY[pooling_type]
+    except KeyError:
+        raise ValueError(f"No feature selection strategy is defined for "
+                         f"pooling_type: {pooling_type!r}") from None
+
+
+class CLIPProcessingInfo(BaseProcessingInfo):
+
+    def get_hf_config(self):
+        return self.ctx.get_hf_config(CLIPConfig)
+
+    def get_vision_encoder_info(self):
+        return CLIPEncoderInfo(self.get_hf_config())
+
+    def get_hf_processor(self, **kwargs: object):
+        return self.ctx.get_hf_processor(CLIPProcessor, **kwargs)
+
+    def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
+        return {"image": 1}
+
+    def get_num_image_tokens(
+        self,
+        *,
+        image_width: int,
+        image_height: int,
+    ) -> int:
+        vision_encoder_info = self.get_vision_encoder_info()
+
+        pooler_config = self.ctx.model_config.pooler_config
+        assert pooler_config is not None
+
+        return get_num_selected_vision_tokens(
+            vision_encoder_info.get_num_image_tokens(
+                image_width=image_width,
+                image_height=image_height,
+            ),
+            _get_vision_feature_select_strategy(pooler_config.pooling_type),
+        )
+
+    def get_image_size_with_most_features(self) -> ImageSize:
+        vision_encoder_info = self.get_vision_encoder_info()
+        width = height = vision_encoder_info.get_image_size()
+        return ImageSize(width=width, height=height)
+
+    def get_max_image_tokens(self) -> int:
+        target_width, target_height = self.get_image_size_with_most_features()
+
+        return self.get_num_image_tokens(
+            image_width=target_width,
+            image_height=target_height,
+        )
+
+
+class CLIPDummyInputsBuilder(BaseDummyInputsBuilder[CLIPProcessingInfo]):
+
+    def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
+        return ""
+
+    def get_dummy_mm_data(
+        self,
+        seq_len: int,
+        mm_counts: Mapping[str, int],
+        mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
+    ) -> MultiModalDataDict:
+        num_images = mm_counts.get("image", 0)
+
+        target_width, target_height = \
+            self.info.get_image_size_with_most_features()
+
+        image_overrides = mm_options.get("image") if mm_options else None
+
+        return {
+            "image":
+            self._get_dummy_images(width=target_width,
+                                   height=target_height,
+                                   num_images=num_images,
+                                   overrides=image_overrides)
+        }
+
+
+class CLIPMultiModalProcessor(BaseMultiModalProcessor[CLIPProcessingInfo]):
+
+    @cached_property
+    def image_token_id(self) -> int:
+        tokenizer = self.info.get_tokenizer()
+        dummy_token_id = 0
+
+        assert dummy_token_id not in tokenizer.all_special_ids
+
+        return dummy_token_id
+
+    def apply(
+        self,
+        prompt: Union[str, list[int]],
+        mm_data: MultiModalDataDict,
+        hf_processor_mm_kwargs: Mapping[str, object],
+        tokenization_kwargs: Optional[Mapping[str, object]] = None,
+        *,
+        mm_uuids: Optional[MultiModalUUIDDict] = None,
+    ) -> MultiModalInputs:
+        if prompt and mm_data:
+            raise ValueError(
+                "CLIP accepts text-only or image-only inputs, not both! "
+                "Image-only inputs means passing an image with an empty text "
+                "prompt.")
+
+        if mm_data:
+            # For multi-modal data, the prompt after processing should
+            # only contain the dummy image tokens
+            tokenization_kwargs = {
+                **(tokenization_kwargs or {}),
+                "add_special_tokens": False,
+            }
+
+        return super().apply(
+            prompt=prompt,
+            mm_data=mm_data,
+            hf_processor_mm_kwargs=hf_processor_mm_kwargs,
+            tokenization_kwargs=tokenization_kwargs,
+            mm_uuids=mm_uuids,
+        )
+
+    def _hf_processor_applies_updates(
+        self,
+        prompt_text: str,
+        mm_items: MultiModalDataItems,
+        hf_processor_mm_kwargs: Mapping[str, object],
+        tokenization_kwargs: Mapping[str, object],
+    ) -> bool:
+        return False
+
+    def _get_mm_fields_config(
+        self,
+        hf_inputs: BatchFeature,
+        hf_processor_mm_kwargs: Mapping[str, object],
+    ) -> Mapping[str, MultiModalFieldConfig]:
+        return dict(pixel_values=MultiModalFieldConfig.batched("image"))
+
+    def _get_prompt_updates(
+        self,
+        mm_items: MultiModalDataItems,
+        hf_processor_mm_kwargs: Mapping[str, object],
+        out_mm_kwargs: MultiModalKwargsItems,
+    ) -> Sequence[PromptUpdate]:
+        image_token_id = self.image_token_id
+
+        def get_replacement(item_idx: int):
+            images = mm_items.get_items("image", ImageProcessorItems)
+            image_size = images.get_image_size(item_idx)
+
+            num_image_tokens = self.info.get_num_image_tokens(
+                image_width=image_size.width,
+                image_height=image_size.height,
+            )
+            return [image_token_id] * num_image_tokens
+
+        return [
+            PromptReplacement(
+                modality="image",
+                target=PromptIndexTargets.start(),
+                replacement=get_replacement,
+            ),
+        ]
+
+
+# Adapted from: https://github.com/huggingface/transformers/blob/v4.56.2/src/transformers/models/clip/modeling_clip.py
+class CLIPTextEmbeddings(nn.Module):
+
+    def __init__(self, config: CLIPTextConfig):
+        super().__init__()
+
+        embed_dim = config.hidden_size
+
+        self.token_embedding = VocabParallelEmbedding(config.vocab_size,
+                                                      embed_dim)
+        self.position_embedding = VocabParallelEmbedding(
+            config.max_position_embeddings, embed_dim)
+
+    def forward(
+        self,
+        input_ids: Optional[torch.Tensor],
+        position_ids: torch.Tensor,
+        inputs_embeds: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
+        if inputs_embeds is None:
+            if input_ids is None:
+                raise ValueError(
+                    "Either `input_ids` or `input_embeds` must be provided")
+
+            inputs_embeds = self.token_embedding(input_ids)
+
+        position_embeddings = self.position_embedding(position_ids)
+        embeddings = inputs_embeds + position_embeddings
+
+        return embeddings
+
+
 class CLIPVisionEmbeddings(nn.Module):
 
     def __init__(self, config: CLIPVisionConfig):
@@ -89,15 +331,17 @@ def forward(self, pixel_values: torch.Tensor) -> torch.Tensor:
 
 
 class CLIPAttention(nn.Module):
-    """Multi-headed attention from 'Attention Is All You Need' paper"""
 
     def __init__(
         self,
-        config: CLIPVisionConfig,
+        config: Union[CLIPTextConfig, CLIPVisionConfig],
         quant_config: Optional[QuantizationConfig] = None,
+        *,
         prefix: str = "",
-    ):
+        attn_cls: Union[type[Attention], type[MultiHeadAttention]],
+    ) -> None:
         super().__init__()
+
         self.config = config
         self.embed_dim = config.hidden_size
         self.num_heads = config.num_attention_heads
@@ -127,8 +371,12 @@ def __init__(
         self.tp_size = get_tensor_model_parallel_world_size()
         self.num_heads_per_partition = divide(self.num_heads, self.tp_size)
 
-        self.attn = MultiHeadAttention(self.num_heads_per_partition,
-                                       self.head_dim, self.scale)
+        self.attn = attn_cls(
+            self.num_heads_per_partition,
+            self.head_dim,
+            self.scale,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -148,7 +396,7 @@ class CLIPMLP(nn.Module):
 
     def __init__(
         self,
-        config: CLIPVisionConfig,
+        config: Union[CLIPTextConfig, CLIPVisionConfig],
         quant_config: Optional[QuantizationConfig] = None,
         prefix: str = "",
     ) -> None:
@@ -178,15 +426,18 @@ class CLIPEncoderLayer(nn.Module):
 
     def __init__(
         self,
-        config: CLIPVisionConfig,
+        config: Union[CLIPTextConfig, CLIPVisionConfig],
         quant_config: Optional[QuantizationConfig] = None,
+        *,
         prefix: str = "",
+        attn_cls: Union[type[Attention], type[MultiHeadAttention]],
     ) -> None:
         super().__init__()
         self.self_attn = CLIPAttention(
             config,
             quant_config=quant_config,
             prefix=f"{prefix}.self_attn",
+            attn_cls=attn_cls,
         )
         self.layer_norm1 = nn.LayerNorm(config.hidden_size,
                                         eps=config.layer_norm_eps)
@@ -223,10 +474,12 @@ class CLIPEncoder(nn.Module):
 
     def __init__(
         self,
-        config: CLIPVisionConfig,
+        config: Union[CLIPTextConfig, CLIPVisionConfig],
         quant_config: Optional[QuantizationConfig] = None,
         num_hidden_layers_override: Optional[int] = None,
+        *,
         prefix: str = "",
+        attn_cls: Union[type[Attention], type[MultiHeadAttention]],
     ) -> None:
         super().__init__()
 
@@ -239,12 +492,15 @@ def __init__(
         self.layers = nn.ModuleList([
             CLIPEncoderLayer(config=config,
                              quant_config=quant_config,
-                             prefix=f"{prefix}.layers.{layer_idx}")
+                             prefix=f"{prefix}.layers.{layer_idx}",
+                             attn_cls=attn_cls)
             for layer_idx in range(num_hidden_layers)
         ])
 
     def forward(
-        self, inputs_embeds: torch.Tensor, return_all_hidden_states: bool
+        self,
+        inputs_embeds: torch.Tensor,
+        return_all_hidden_states: bool,
     ) -> Union[torch.Tensor, list[torch.Tensor]]:
         hidden_states_pool = [inputs_embeds]
         hidden_states = inputs_embeds
@@ -260,6 +516,87 @@ def forward(
         return hidden_states
 
 
+class CLIPTextTransformer(nn.Module):
+
+    def __init__(
+        self,
+        config: CLIPTextConfig,
+        quant_config: Optional[QuantizationConfig] = None,
+        *,
+        prefix: str = "",
+    ) -> None:
+        super().__init__()
+
+        self.config = config
+        embed_dim = config.hidden_size
+
+        self.embeddings = CLIPTextEmbeddings(config)
+
+        self.encoder = CLIPEncoder(
+            config=config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.encoder",
+            attn_cls=Attention,
+        )
+
+        self.final_layer_norm = nn.LayerNorm(
+            embed_dim,
+            eps=config.layer_norm_eps,
+        )
+
+    def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
+        return self.embeddings.token_embedding(input_ids)
+
+    def forward(
+        self,
+        input_ids: Optional[torch.Tensor],
+        position_ids: torch.Tensor,
+        inputs_embeds: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
+        hidden_states = self.embeddings(
+            input_ids=input_ids,
+            position_ids=position_ids,
+            inputs_embeds=inputs_embeds,
+        )
+
+        last_hidden_state = self.encoder(
+            inputs_embeds=hidden_states,
+            return_all_hidden_states=False,
+        )
+        last_hidden_state = self.final_layer_norm(last_hidden_state)
+
+        return last_hidden_state
+
+    def load_weights(self, weights: Iterable[tuple[str,
+                                                   torch.Tensor]]) -> set[str]:
+        stacked_params_mapping = [
+            # (param_name, shard_name, shard_id)
+            ("qkv_proj", "q_proj", "q"),
+            ("qkv_proj", "k_proj", "k"),
+            ("qkv_proj", "v_proj", "v"),
+        ]
+        params_dict = dict(self.named_parameters())
+        loaded_params: set[str] = set()
+
+        for name, loaded_weight in weights:
+            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+                if weight_name not in name:
+                    continue
+                name = name.replace(weight_name, param_name)
+
+                param = params_dict[name]
+                weight_loader = param.weight_loader
+                weight_loader(param, loaded_weight, shard_id)
+                break
+            else:
+                param = params_dict[name]
+                weight_loader = getattr(param, "weight_loader",
+                                        default_weight_loader)
+                weight_loader(param, loaded_weight)
+            loaded_params.add(name)
+        return loaded_params
+
+
 class CLIPVisionTransformer(nn.Module):
 
     def __init__(
@@ -287,6 +624,7 @@ def __init__(
             quant_config=quant_config,
             num_hidden_layers_override=num_hidden_layers_override,
             prefix=f"{prefix}.encoder",
+            attn_cls=MultiHeadAttention,
         )
 
         num_hidden_layers = config.num_hidden_layers
@@ -306,6 +644,14 @@ def __init__(
         else:
             self.post_layernorm = None
 
+    @property
+    def dtype(self):
+        return next(self.parameters()).dtype
+
+    @property
+    def device(self):
+        return next(self.parameters()).device
+
     def forward(
         self,
         pixel_values: torch.Tensor,
@@ -335,11 +681,49 @@ def forward(
 
         return encoder_outputs
 
+    def load_weights(self, weights: Iterable[tuple[str,
+                                                   torch.Tensor]]) -> set[str]:
+        stacked_params_mapping = [
+            # (param_name, shard_name, shard_id)
+            ("qkv_proj", "q_proj", "q"),
+            ("qkv_proj", "k_proj", "k"),
+            ("qkv_proj", "v_proj", "v"),
+        ]
+        params_dict = dict(self.named_parameters())
+        loaded_params: set[str] = set()
+        layer_count = len(self.encoder.layers)
 
-class CLIPVisionModel(nn.Module, SupportsQuant):
-    config_class = CLIPVisionConfig
-    main_input_name = "pixel_values"
-    packed_modules_mapping = {"qkv_proj": ["q_proj", "k_proj", "v_proj"]}
+        for name, loaded_weight in weights:
+            # post_layernorm is not needed in CLIPVisionModel
+            if (name.startswith("post_layernorm")
+                    and self.post_layernorm is None):
+                continue
+
+            # omit layers when num_hidden_layers_override is set
+            if name.startswith("encoder.layers"):
+                layer_idx = int(name.split(".")[2])
+                if layer_idx >= layer_count:
+                    continue
+
+            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+                if weight_name not in name:
+                    continue
+                name = name.replace(weight_name, param_name)
+
+                param = params_dict[name]
+                weight_loader = param.weight_loader
+                weight_loader(param, loaded_weight, shard_id)
+                break
+            else:
+                param = params_dict[name]
+                weight_loader = getattr(param, "weight_loader",
+                                        default_weight_loader)
+                weight_loader(param, loaded_weight)
+            loaded_params.add(name)
+        return loaded_params
+
+
+class CLIPVisionModel(nn.Module):
 
     def __init__(
         self,
@@ -351,12 +735,14 @@ def __init__(
         prefix: str = "",
     ) -> None:
         super().__init__()
+
         self.vision_model = CLIPVisionTransformer(
             config=config,
             quant_config=quant_config,
             num_hidden_layers_override=num_hidden_layers_override,
             require_post_norm=require_post_norm,
-            prefix=f"{prefix}.vision_model")
+            prefix=f"{prefix}.vision_model",
+        )
 
     def forward(
         self,
@@ -370,49 +756,198 @@ def forward(
             feature_select_strategy=feature_select_strategy,
         )
 
+    @property
+    def dtype(self):
+        return self.vision_model.dtype
+
     @property
     def device(self):
-        return next(self.parameters()).device
+        return self.vision_model.device
 
-    # (TODO) Add prefix argument for filtering out weights to be loaded
-    #        ref: https://github.com/vllm-project/vllm/pull/7186#discussion_r1734163986
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-        stacked_params_mapping = [
-            # (param_name, shard_name, shard_id)
-            ("qkv_proj", "q_proj", "q"),
-            ("qkv_proj", "k_proj", "k"),
-            ("qkv_proj", "v_proj", "v"),
-        ]
-        params_dict = dict(self.named_parameters())
-        loaded_params: set[str] = set()
-        layer_count = len(self.vision_model.encoder.layers)
 
-        for name, loaded_weight in weights:
-            # post_layernorm is not needed in CLIPVisionModel
-            if (name.startswith("vision_model.post_layernorm")
-                    and self.vision_model.post_layernorm is None):
-                continue
+# Assume EOS token corresponds to LAST token in text model
+@default_pooling_type("LAST")
+@MULTIMODAL_REGISTRY.register_processor(CLIPMultiModalProcessor,
+                                        info=CLIPProcessingInfo,
+                                        dummy_inputs=CLIPDummyInputsBuilder)
+class CLIPEmbeddingModel(nn.Module, SupportsMultiModal, SupportsQuant):
 
-            # omit layers when num_hidden_layers_override is set
-            if name.startswith("vision_model.encoder.layers"):
-                layer_idx = int(name.split(".")[3])
-                if layer_idx >= layer_count:
-                    continue
+    is_pooling_model = True
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
-                if weight_name not in name:
-                    continue
-                name = name.replace(weight_name, param_name)
+    packed_modules_mapping = {"qkv_proj": ["q_proj", "k_proj", "v_proj"]}
+    merge_by_field_config = True
 
-                param = params_dict[name]
-                weight_loader = param.weight_loader
-                weight_loader(param, loaded_weight, shard_id)
-                break
-            else:
-                param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                weight_loader(param, loaded_weight)
-            loaded_params.add(name)
-        return loaded_params
+    @classmethod
+    def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
+        if modality.startswith("image"):
+            return None
+
+        raise ValueError("Only image modality is supported")
+
+    def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
+        super().__init__()
+
+        config: CLIPConfig = vllm_config.model_config.hf_config
+        quant_config = vllm_config.quant_config
+        multimodal_config = vllm_config.model_config.multimodal_config
+        self.config = config
+        self.multimodal_config = multimodal_config
+
+        text_config = config.text_config
+        vision_config = config.vision_config
+
+        self.projection_dim = config.projection_dim
+        self.text_embed_dim = text_config.hidden_size
+        self.vision_embed_dim = vision_config.hidden_size
+
+        self.text_model = CLIPTextTransformer(
+            text_config,
+            quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "text_model"),
+        )
+        self.vision_model = CLIPVisionTransformer(
+            vision_config,
+            quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "vision_model"),
+        )
+
+        self.visual_projection = nn.Linear(
+            self.vision_embed_dim,
+            self.projection_dim,
+            bias=False,
+        )
+        self.text_projection = nn.Linear(
+            self.text_embed_dim,
+            self.projection_dim,
+            bias=False,
+        )
+
+        pooler_config = vllm_config.model_config.pooler_config
+        assert pooler_config is not None
+        self.pooler_config = pooler_config
+
+        self.pooler = DispatchPooler({
+            "encode": Pooler.for_encode(pooler_config),
+            "embed": Pooler.for_embed(pooler_config),
+        })
+
+        # Assumes that self.forward is called after self.get_input_embeddings
+        self._is_text_input = True
+
+    def get_text_features(
+        self,
+        input_ids: Optional[torch.Tensor],
+        position_ids: torch.Tensor,
+        inputs_embeds: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
+        pooled_output = self.text_model(
+            input_ids=input_ids,
+            position_ids=position_ids,
+            inputs_embeds=inputs_embeds,
+        )
+
+        text_features = self.text_projection(pooled_output)
+
+        return text_features
+
+    def get_image_features(
+        self,
+        pixel_values: torch.Tensor,
+        feature_select_strategy: Optional[VisionFeatureSelectStrategy] = None,
+    ) -> torch.Tensor:
+        if feature_select_strategy is None:
+            feature_select_strategy = _get_vision_feature_select_strategy(
+                self.pooler_config.pooling_type)
+
+        pooled_output = self.vision_model(
+            pixel_values=pixel_values,
+            select_layers=None,
+            feature_select_strategy=feature_select_strategy,
+        )
+
+        image_features = self.visual_projection(pooled_output)
+
+        return image_features
+
+    def _parse_and_validate_image_input(
+            self, **kwargs: object) -> Optional[CLIPImagePixelInputs]:
+        pixel_values = kwargs.pop("pixel_values", None)
+        if pixel_values is None:
+            return None
+
+        expected_h = expected_w = self.config.vision_config.image_size
+        return CLIPImagePixelInputs(type="pixel_values",
+                                    data=pixel_values,
+                                    resolve_bindings={
+                                        "h": expected_h,
+                                        "w": expected_w
+                                    })
+
+    def _process_image_inputs(self,
+                              inputs: CLIPImagePixelInputs) -> torch.Tensor:
+        pixel_values = inputs["data"]
+
+        return self.get_image_features(pixel_values)
+
+    def get_language_model(self) -> torch.nn.Module:
+        return self.text_model
+
+    def get_input_embeddings(
+        self,
+        input_ids: torch.Tensor,
+        multimodal_embeddings: Optional[MultiModalEmbeddings] = None,
+        *,
+        is_multimodal: Optional[torch.Tensor] = None,
+        handle_oov_mm_token: bool = False,
+    ) -> torch.Tensor:
+        self._is_text_input = (multimodal_embeddings is None
+                               or len(multimodal_embeddings) == 0)
+
+        # This is to satisfy the type checker for each overload
+        if multimodal_embeddings is None or is_multimodal is None:
+            return super().get_input_embeddings(input_ids)
+
+        return super().get_input_embeddings(
+            input_ids,
+            multimodal_embeddings=multimodal_embeddings,
+            is_multimodal=is_multimodal,
+            handle_oov_mm_token=handle_oov_mm_token,
+        )
+
+    def get_multimodal_embeddings(self,
+                                  **kwargs: object) -> MultiModalEmbeddings:
+        image_input = self._parse_and_validate_image_input(**kwargs)
+        if image_input is None:
+            return []
+
+        vision_embeddings = self._process_image_inputs(image_input)
+        return vision_embeddings
+
+    def forward(
+        self,
+        input_ids: Optional[torch.Tensor],
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs: object,
+    ) -> torch.Tensor:
+        if intermediate_tensors is not None:
+            raise RuntimeError("PP is not supported for this model")
+
+        # Multimodal inputs
+        if not self._is_text_input:
+            return inputs_embeds
+
+        # Text inputs
+        return self.get_text_features(input_ids=input_ids,
+                                      position_ids=positions,
+                                      inputs_embeds=inputs_embeds)
+
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
+        loader = AutoWeightsLoader(
+            self,
+            skip_substrs=[".position_ids"],
+            ignore_unexpected_prefixes=["logit_scale."],
+        )
+
+        return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/registry.py b/vllm/model_executor/models/registry.py
index 94744fe558bd..bc2dc697d1c5 100644
--- a/vllm/model_executor/models/registry.py
+++ b/vllm/model_executor/models/registry.py
@@ -187,6 +187,7 @@
     "TeleChat2ForCausalLM": ("telechat2", "TeleChat2ForCausalLM"),
     "XLMRobertaModel": ("roberta", "RobertaEmbeddingModel"),
     # [Multimodal]
+    "CLIPModel": ("clip", "CLIPEmbeddingModel"),
     "LlavaNextForConditionalGeneration": ("llava_next", "LlavaNextForConditionalGeneration"),  # noqa: E501
     "Phi3VForCausalLM": ("phi3v", "Phi3VForCausalLM"),
     "Qwen2VLForConditionalGeneration": ("qwen2_vl", "Qwen2VLForConditionalGeneration"),  # noqa: E501
diff --git a/vllm/model_executor/models/vision.py b/vllm/model_executor/models/vision.py
index 2636942580fa..b4007ff2e1cf 100644
--- a/vllm/model_executor/models/vision.py
+++ b/vllm/model_executor/models/vision.py
@@ -92,8 +92,10 @@ def get_vit_attn_backend(head_size: int, dtype: torch.dtype) -> _Backend:
     return current_platform.get_vit_attn_backend(head_size, dtype)
 
 
+VisionFeatureSelectStrategyStr = Literal["class", "default", "full"]
+
 VisionFeatureSelectStrategy = Union[
-    Literal["class", "default", "full"],
+    VisionFeatureSelectStrategyStr,
     Callable[[torch.Tensor], torch.Tensor],
 ]
 
@@ -106,7 +108,7 @@ def _get_vision_feature_selector(
 
     # https://github.com/huggingface/transformers/blob/cd74917ffc3e8f84e4a886052c5ab32b7ac623cc/src/transformers/models/clip/modeling_clip.py#L762
     if strategy == "class":
-        return lambda feats: feats[:, 0, :]
+        return lambda feats: feats[:, :1, :]
 
     # https://github.com/huggingface/transformers/blob/4a02bc7004285bdb12cc033e87ad2578ce2fa900/src/transformers/models/llava/modeling_llava.py#L196
     if strategy == "default":
diff --git a/vllm/transformers_utils/chat_templates/registry.py b/vllm/transformers_utils/chat_templates/registry.py
index 3a97f2c05618..d24a0946bdde 100644
--- a/vllm/transformers_utils/chat_templates/registry.py
+++ b/vllm/transformers_utils/chat_templates/registry.py
@@ -33,6 +33,7 @@ def _get_minicpmv_chat_template_fallback(
 # yapf: disable
 _MODEL_TYPE_TO_CHAT_TEMPLATE_FALLBACK: dict[str, ChatTemplatePath] = {
     "blip-2": CHAT_TEMPLATES_DIR / "template_blip2.jinja",
+    "clip": CHAT_TEMPLATES_DIR / "template_basic.jinja",
     "chameleon": CHAT_TEMPLATES_DIR / "template_basic.jinja",
     "deepseek_vl_v2": CHAT_TEMPLATES_DIR / "template_deepseek_vl2.jinja",
     "fuyu": CHAT_TEMPLATES_DIR / "template_fuyu.jinja",

From e3b1d98c7d760e81b4677731a9eeb35c1999d1bf Mon Sep 17 00:00:00 2001
From: yuafng <77liyuanfeng@gmail.com>
Date: Sat, 4 Oct 2025 06:41:39 -0700
Subject: [PATCH 170/193] Fix tensor device and dtype placement in Qwen2VL
 model (#26219)

Signed-off-by: Cyrus Leung <cyrus.tl.leung@gmail.com>
Co-authored-by: Yuanfeng Li <yuanfengli@meta.com>
Co-authored-by: Cyrus Leung <cyrus.tl.leung@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/qwen2_vl.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/model_executor/models/qwen2_vl.py b/vllm/model_executor/models/qwen2_vl.py
index ab9bfe4d0f19..11d6a0c8dc19 100644
--- a/vllm/model_executor/models/qwen2_vl.py
+++ b/vllm/model_executor/models/qwen2_vl.py
@@ -720,7 +720,7 @@ def forward(
         rotary_pos_emb = self.rot_pos_emb(grid_thw)
 
         # compute cu_seqlens
-        grid_thw_ = torch.tensor(grid_thw)
+        grid_thw_ = torch.tensor(grid_thw, device=x.device, dtype=torch.long)
         cu_seqlens = torch.repeat_interleave(grid_thw_[:, 1] * grid_thw_[:, 2],
                                              grid_thw_[:, 0]).cumsum(
                                                  dim=0, dtype=torch.int32)

From 0e8da6c976f0b3cd99defcf4a345876f33ddc1e9 Mon Sep 17 00:00:00 2001
From: Thomas Parnell <tpa@zurich.ibm.com>
Date: Sat, 4 Oct 2025 15:47:48 +0200
Subject: [PATCH 171/193] [V1] [Hybrid] Remove code to override default CUDA
 graph configuration (#26226)

Signed-off-by: Thomas Parnell <tpa@zurich.ibm.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/models/config.py | 15 ---------------
 1 file changed, 15 deletions(-)

diff --git a/vllm/model_executor/models/config.py b/vllm/model_executor/models/config.py
index 283cd2bb8b41..c49db74885c1 100644
--- a/vllm/model_executor/models/config.py
+++ b/vllm/model_executor/models/config.py
@@ -4,7 +4,6 @@
 from typing import TYPE_CHECKING
 
 import vllm.envs as envs
-from vllm.config.compilation import CUDAGraphMode
 from vllm.logger import init_logger
 from vllm.model_executor.models import ModelRegistry
 from vllm.utils import STR_DTYPE_TO_TORCH_DTYPE, cdiv
@@ -290,7 +289,6 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
 
         model_config = vllm_config.model_config
         cache_config = vllm_config.cache_config
-        compilation_config = vllm_config.compilation_config
 
         # Set mamba block size to max_model_len (this may get
         # override by prefix caching logic later)
@@ -320,19 +318,6 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
                     "for hybrid models.")
         model_config.disable_cascade_attn = True
 
-        # TODO(tdoublep): remove as full cuda graph support is added
-        FCG_NOT_SUPPORTED_MODELS = [
-            "Lfm2ForCausalLM",
-            "MiniMaxText01ForCausalLM",
-        ]
-
-        if (model_config.architecture not in FCG_NOT_SUPPORTED_MODELS
-                and compilation_config.cudagraph_mode is None):
-            logger.info(
-                "Hybrid or mamba-based model detected: setting cudagraph mode "
-                "to FULL_AND_PIECEWISE in order to optimize performance.")
-            compilation_config.cudagraph_mode = CUDAGraphMode.FULL_AND_PIECEWISE
-
 
 class HybridAttentionMambaModelConfig(VerifyAndUpdateConfig):
 

From f82a350b57acce7d2a03307e079dcb7018ffcfba Mon Sep 17 00:00:00 2001
From: "Li, Jiang" <jiang1.li@intel.com>
Date: Sat, 4 Oct 2025 21:54:35 +0800
Subject: [PATCH 172/193] [CPU] Refine batch reorder of CPU attention backend
 (#26096)

Signed-off-by: jiang1.li <jiang1.li@intel.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/v1/attention/backends/cpu_attn.py | 129 ++++++++-----------------
 vllm/v1/worker/cpu_model_runner.py     |  43 +--------
 2 files changed, 44 insertions(+), 128 deletions(-)

diff --git a/vllm/v1/attention/backends/cpu_attn.py b/vllm/v1/attention/backends/cpu_attn.py
index 6ca0c63f6b59..369f7062005c 100644
--- a/vllm/v1/attention/backends/cpu_attn.py
+++ b/vllm/v1/attention/backends/cpu_attn.py
@@ -14,10 +14,9 @@
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.v1.attention.backends.utils import (AttentionMetadataBuilder,
-                                              CommonAttentionMetadata)
-from vllm.v1.core.sched.output import SchedulerOutput
+                                              CommonAttentionMetadata,
+                                              split_decodes_and_prefills)
 from vllm.v1.kv_cache_interface import AttentionSpec
-from vllm.v1.worker.gpu_input_batch import InputBatch
 
 try:
     import intel_extension_for_pytorch.llm.modules as ipex_modules
@@ -102,16 +101,16 @@ class TorchSDPAMetadata(AttentionMetadata):
     """Metadata for PagedAttention."""
     # (batch_size,). The length of sequences (entire tokens seen so far) per
     # sequence.
-    seq_lens_tensor: Optional[torch.Tensor]
+    decode_seq_lens_tensor: Optional[torch.Tensor]
     # Maximum sequence length in the batch. 0 if it is prefill-only batch.
-    max_decode_seq_len: int
+    decode_max_seq_len: int
     # (batch_size, max_blocks_per_seq).
     # Block addresses per sequence. (Seq id -> list of physical block)
     # E.g., [0, 1, 2] means tokens are stored in 0th, 1st, and 2nd blocks
     # in the kv cache. Each block can contain up to block_size tokens.
     # 2nd dimensions are padded up to max_blocks_per_seq if it is cuda-graph
     # captured.
-    block_tables: Optional[torch.Tensor]
+    decode_block_tables: Optional[torch.Tensor]
     """Metadata for TorchSDPABackend.
     """
     # Currently, input sequences can only contain all prompts
@@ -121,9 +120,9 @@ class TorchSDPAMetadata(AttentionMetadata):
 
     # For chunked prefill only
     max_query_len: Optional[int] = None
-    max_kv_len: Optional[int] = None
+    prefill_max_seq_len: Optional[int] = None
     prefill_query_start_loc: Optional[torch.Tensor] = None
-    kv_start_loc: Optional[torch.Tensor] = None
+    prefill_seq_start_loc: Optional[torch.Tensor] = None
     prefill_block_tables: Optional[torch.Tensor] = None
 
     # For V1 logits index only
@@ -307,8 +306,8 @@ def get_seq_len_block_table_args(
                 or attn_type == AttentionType.ENCODER_ONLY):
             # Decoder self-attention
             # Choose max_seq_len based on whether we are in prompt_run
-            return (self.seq_lens_tensor, self.max_decode_seq_len,
-                    self.block_tables)
+            return (self.decode_seq_lens_tensor, self.decode_max_seq_len,
+                    self.decode_block_tables)
         elif attn_type == AttentionType.ENCODER_DECODER:
             # Enc/dec cross-attention KVs match encoder sequence length;
             # cross-attention utilizes special "cross" block tables
@@ -323,19 +322,14 @@ def get_seq_len_block_table_args(
 
 
 class TorchSDPAMetadataBuilderV1(AttentionMetadataBuilder[TorchSDPAMetadata]):
+    reorder_batch_threshold: int = 1
 
     def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
                  vllm_config: VllmConfig, device: torch.device) -> None:
         super().__init__(kv_cache_spec, layer_names, vllm_config, device)
 
         self.scheduler_config = vllm_config.scheduler_config
-
-        # For reorder
-        self.reorder_prompt_req_index_list = np.empty(
-            vllm_config.scheduler_config.max_num_seqs, dtype=np.int64)
-        self.reorder_decode_req_index_list = np.empty(
-            vllm_config.scheduler_config.max_num_seqs, dtype=np.int64)
-        self.num_prompt_req: int = 0
+        self._init_reorder_batch_threshold(1, False)
 
         self.seq_start_loc_cpu = torch.zeros(
             vllm_config.scheduler_config.max_num_seqs + 1,
@@ -344,50 +338,6 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
         )
         self.seq_start_loc_np = self.seq_start_loc_cpu.numpy()
 
-    def reorder_batch(self, input_batch: InputBatch,
-                      scheduler_output: SchedulerOutput) -> bool:
-        prompt_list_idx = 0
-        decode_list_idx = 0
-        for req_index in range(input_batch.num_reqs):
-            if input_batch.num_computed_tokens_cpu[
-                    req_index] < input_batch.num_prompt_tokens[req_index]:
-                # prompt stage
-                self.reorder_prompt_req_index_list[prompt_list_idx] = req_index
-                prompt_list_idx += 1
-            else:
-                # decode stage
-                self.reorder_decode_req_index_list[decode_list_idx] = req_index
-                decode_list_idx += 1
-        assert decode_list_idx + prompt_list_idx == input_batch.num_reqs
-
-        # Update prompt requests number
-        self.num_prompt_req = prompt_list_idx
-
-        reorder_req_num = 0
-        for req_index in range(decode_list_idx):
-            if self.reorder_decode_req_index_list[req_index] < prompt_list_idx:
-                reorder_req_num += 1
-            else:
-                break
-
-        if reorder_req_num == 0:
-            return False
-
-        reorder_prompt_list = (
-            self.reorder_prompt_req_index_list[:prompt_list_idx]
-            [-reorder_req_num:])
-        reorder_decode_list = (
-            self.reorder_decode_req_index_list[:decode_list_idx]
-            [:reorder_req_num])
-        assert reorder_decode_list.size == reorder_prompt_list.size
-
-        for idx in range(reorder_req_num):
-            prompt_req_index = reorder_prompt_list[idx].item()
-            decode_req_index = reorder_decode_list[idx].item()
-            input_batch.swap_states(prompt_req_index, decode_req_index)
-
-        return True
-
     def build(self,
               common_prefix_len: int,
               common_attn_metadata: CommonAttentionMetadata,
@@ -397,41 +347,46 @@ def build(self,
 
         seq_lens_cpu = common_attn_metadata.seq_lens_cpu
         seq_lens_np = seq_lens_cpu.numpy()
-        num_prompt_req = self.num_prompt_req
-        max_prefill_seq_len = seq_lens_np[:num_prompt_req].max().item(
-        ) if num_prompt_req > 0 else 0
-        max_decode_seq_len = seq_lens_np[num_prompt_req:num_reqs].max().item(
-        ) if num_prompt_req < num_reqs else 0
-        self.seq_start_loc_np[0] = 0
-        np.cumsum(seq_lens_np, out=self.seq_start_loc_np[1:num_reqs + 1])
 
         query_start_loc_cpu = common_attn_metadata.query_start_loc_cpu
-        num_prefill_tokens = int(query_start_loc_cpu[num_prompt_req].item())
-        num_decode_tokens = int(query_start_loc_cpu[num_reqs].item() -
-                                num_prefill_tokens)
+        query_start_loc_np = query_start_loc_cpu.numpy()
+
+        num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens =\
+            split_decodes_and_prefills(common_attn_metadata,
+                                       decode_threshold=self.reorder_batch_threshold,
+                                       require_uniform=True)
+
+        max_prefill_seq_len = seq_lens_np[num_decodes:num_reqs].max().item(
+        ) if num_prefills > 0 else 0
+        max_decode_seq_len = seq_lens_np[:num_decodes].max().item(
+        ) if num_prefills < num_reqs else 0
+        self.seq_start_loc_np[0] = 0
+        np.cumsum(seq_lens_np, out=self.seq_start_loc_np[1:num_reqs + 1])
 
         slot_mapping = common_attn_metadata.slot_mapping.long()
         block_table_tensor = common_attn_metadata.block_table_tensor
+        query_start_loc_np = query_start_loc_cpu.numpy()
+        query_start_loc_np[num_decodes:num_reqs + 1] -= num_decode_tokens
 
         attn_metadata = TorchSDPAMetadata(
-            num_prefills=num_prompt_req,
+            num_prefills=num_prefills,
             num_prefill_tokens=num_prefill_tokens,
             num_decode_tokens=num_decode_tokens,
             slot_mapping=slot_mapping,
             # to ensure inference when chunked_prefill is disabled
             seq_lens=seq_lens_cpu.tolist(),
-            seq_lens_tensor=seq_lens_cpu[num_prompt_req:num_reqs],  # decode
-            max_decode_seq_len=max_decode_seq_len,  # decode
-            block_tables=block_table_tensor[num_prompt_req:num_reqs],  # decode
+            decode_seq_lens_tensor=seq_lens_cpu[:num_decodes],  # decode
+            decode_max_seq_len=max_decode_seq_len,  # decode
+            decode_block_tables=block_table_tensor[:num_decodes],  # decode
             chunked_prefill=self.scheduler_config.chunked_prefill_enabled,
             max_query_len=max_query_len,
-            max_kv_len=max_prefill_seq_len,
-            prefill_query_start_loc=query_start_loc_cpu[:num_prompt_req +
+            prefill_max_seq_len=max_prefill_seq_len,
+            prefill_query_start_loc=query_start_loc_cpu[num_decodes:num_reqs +
                                                         1],  # prefill
-            kv_start_loc=self.seq_start_loc_cpu[:num_prompt_req +
-                                                1],  # prefill
-            prefill_block_tables=block_table_tensor[:
-                                                    num_prompt_req],  # prefill
+            prefill_seq_start_loc=self.seq_start_loc_cpu[num_decodes:num_reqs +
+                                                         1],  # prefill
+            prefill_block_tables=block_table_tensor[
+                num_decodes:num_reqs],  # prefill
             query_start_loc=query_start_loc_cpu[:num_reqs +
                                                 1],  # for logits index
         )
@@ -596,14 +551,14 @@ def forward(
                 import intel_extension_for_pytorch.llm.modules as ipex_modules
                 output = torch.empty_like(query)
                 ipex_modules.PagedAttention.flash_attn_varlen_func(
-                    output[:prefill_meta.num_prefill_tokens, :, :],
-                    query[:prefill_meta.num_prefill_tokens, :, :],
+                    output[prefill_meta.num_decode_tokens:, :, :],
+                    query[prefill_meta.num_decode_tokens:, :, :],
                     key_cache,
                     value_cache,
                     prefill_meta.prefill_query_start_loc,
-                    prefill_meta.kv_start_loc,
+                    prefill_meta.prefill_seq_start_loc,
                     prefill_meta.max_query_len,
-                    prefill_meta.max_kv_len,
+                    prefill_meta.prefill_max_seq_len,
                     self.scale,
                     True,
                     prefill_meta.prefill_block_tables,
@@ -621,8 +576,8 @@ def forward(
             ) = decode_meta.get_seq_len_block_table_args(attn_type)
 
             self.paged_attn_impl.forward_decode(
-                output[attn_metadata.num_prefill_tokens:, :, :],
-                query[attn_metadata.num_prefill_tokens:, :, :],
+                output[:attn_metadata.num_decode_tokens, :, :],
+                query[:attn_metadata.num_decode_tokens, :, :],
                 key_cache,
                 value_cache,
                 block_tables_arg,
diff --git a/vllm/v1/worker/cpu_model_runner.py b/vllm/v1/worker/cpu_model_runner.py
index 6a97f7ebc3fc..964e4c6b2383 100644
--- a/vllm/v1/worker/cpu_model_runner.py
+++ b/vllm/v1/worker/cpu_model_runner.py
@@ -9,7 +9,6 @@
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.model_executor.model_loader import get_model
-from vllm.v1.attention.backends.cpu_attn import TorchSDPAMetadataBuilderV1
 from vllm.v1.utils import CpuGpuBuffer
 from vllm.v1.worker.gpu_model_runner import GPUModelRunner
 
@@ -33,50 +32,12 @@ def __init__(self, vllm_config: VllmConfig, device: torch.device):
 
         self._postprocess_tensors()
 
+    # Note: Remove the override after new attention backend finished
     def _may_reorder_batch(self, scheduler_output: "SchedulerOutput") -> None:
-        """
-        Update the order of requests in the batch based on the attention
-        backend's needs. For example, some attention backends (namely MLA) may
-        want to separate requests based on if the attention computation will be
-        compute-bound or memory-bound.
-
-        Args:
-            scheduler_output: The scheduler output.
-        """
-        # Attention free models have zero kv_cache_groups, however models
-        # like Mamba are also attention free but use the kv_cache for
-        # keeping its internal state. This is why we check the number
-        # of kv_cache groups instead of solely checking
-        # for self.model_config.is_attention_free.
-        if len(self.kv_cache_config.kv_cache_groups) == 0:
-            return
-
         if len(self.kv_cache_config.kv_cache_groups) > 1:
             raise ValueError("Multiple KVCacheGroups is not"
                              "currently supported with CPU model runner.")
-
-        # Guard against encoder-only / pooling models where `attn_groups`
-        # may be empty or lack the expected metadata_builder.
-        # Without this check, accessing `attn_groups[0][0]` would trigger
-        # an AssertionError on CPU backend.
-        if not hasattr(self, "attn_groups") or not self.attn_groups:
-            return
-        if not self.attn_groups[0]:
-            return
-
-        mb = getattr(self.attn_groups[0][0], "metadata_builders", None)
-        if isinstance(mb, list):
-            if not isinstance(mb[0], TorchSDPAMetadataBuilderV1):
-                return
-            mb[0].reorder_batch(self.input_batch, scheduler_output)
-            return
-        elif not isinstance(mb, TorchSDPAMetadataBuilderV1):
-            # Encoder-only / rerank models do not benefit from reordering,
-            # so we safely skip here.
-            return
-
-        # Safe path for decoder/attention-heavy models
-        mb.reorder_batch(self.input_batch, scheduler_output)
+        super()._may_reorder_batch(scheduler_output)
 
     def _postprocess_tensors(self) -> None:
         # Note: replace device tensors with cpu tensors

From 334ca272ce27c81a46348a4320dbf94422619f47 Mon Sep 17 00:00:00 2001
From: Isotr0py <mozf@mail2.sysu.edu.cn>
Date: Sat, 4 Oct 2025 23:32:30 +0800
Subject: [PATCH 173/193] [Frontend] Cache chat template kwargs resolution
 (#26227)

Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/entrypoints/chat_utils.py                | 24 +++++++++++++------
 vllm/entrypoints/openai/api_server.py         |  3 +++
 vllm/entrypoints/openai/serving_chat.py       | 20 +++++++---------
 vllm/entrypoints/openai/serving_embedding.py  | 16 +++++++++++++
 vllm/entrypoints/openai/serving_engine.py     | 16 +++++++++++++
 vllm/entrypoints/openai/serving_pooling.py    | 10 ++++++++
 .../openai/serving_tokenization.py            | 10 ++++++++
 7 files changed, 81 insertions(+), 18 deletions(-)

diff --git a/vllm/entrypoints/chat_utils.py b/vllm/entrypoints/chat_utils.py
index 6b0ed23277d3..f8119d89ac49 100644
--- a/vllm/entrypoints/chat_utils.py
+++ b/vllm/entrypoints/chat_utils.py
@@ -1572,6 +1572,22 @@ def parse(self, parser: jinja2.parser.Parser) -> jinja2.nodes.CallBlock:
         return call_block.set_lineno(lineno)
 
 
+def _resolve_chat_template_kwargs(
+    chat_template: str,
+):
+    env = jinja2.sandbox.ImmutableSandboxedEnvironment(
+        trim_blocks=True,
+        lstrip_blocks=True,
+        extensions=[AssistantTracker, jinja2.ext.loopcontrols],
+    )
+    parsed_content = env.parse(chat_template)
+    template_vars = jinja2.meta.find_undeclared_variables(parsed_content)
+    return template_vars
+
+
+_cached_resolve_chat_template_kwargs = lru_cache(_resolve_chat_template_kwargs)
+
+
 def resolve_chat_template_kwargs(
     tokenizer: Union[PreTrainedTokenizer, PreTrainedTokenizerFast],
     chat_template: str,
@@ -1582,13 +1598,7 @@ def resolve_chat_template_kwargs(
         if supports_kw(tokenizer.apply_chat_template, k, allow_var_kwargs=False)
     }
 
-    env = jinja2.sandbox.ImmutableSandboxedEnvironment(
-        trim_blocks=True,
-        lstrip_blocks=True,
-        extensions=[AssistantTracker, jinja2.ext.loopcontrols],
-    )
-    parsed_content = env.parse(chat_template)
-    template_vars = jinja2.meta.find_undeclared_variables(parsed_content)
+    template_vars = _cached_resolve_chat_template_kwargs(chat_template)
 
     # We exclude chat_template from kwargs here, because
     # chat template has been already resolved at this stage
diff --git a/vllm/entrypoints/openai/api_server.py b/vllm/entrypoints/openai/api_server.py
index 15844d3162fe..2f05e10639f5 100644
--- a/vllm/entrypoints/openai/api_server.py
+++ b/vllm/entrypoints/openai/api_server.py
@@ -1745,6 +1745,7 @@ async def init_app_state(
         request_logger=request_logger,
         chat_template=resolved_chat_template,
         chat_template_content_format=args.chat_template_content_format,
+        trust_request_chat_template=args.trust_request_chat_template,
         log_error_stack=args.log_error_stack,
     ) if "encode" in supported_tasks else None
     state.openai_serving_embedding = OpenAIServingEmbedding(
@@ -1754,6 +1755,7 @@ async def init_app_state(
         request_logger=request_logger,
         chat_template=resolved_chat_template,
         chat_template_content_format=args.chat_template_content_format,
+        trust_request_chat_template=args.trust_request_chat_template,
         log_error_stack=args.log_error_stack,
     ) if "embed" in supported_tasks else None
     state.openai_serving_classification = ServingClassification(
@@ -1777,6 +1779,7 @@ async def init_app_state(
         request_logger=request_logger,
         chat_template=resolved_chat_template,
         chat_template_content_format=args.chat_template_content_format,
+        trust_request_chat_template=args.trust_request_chat_template,
         log_error_stack=args.log_error_stack,
     )
     state.openai_serving_transcription = OpenAIServingTranscription(
diff --git a/vllm/entrypoints/openai/serving_chat.py b/vllm/entrypoints/openai/serving_chat.py
index a646b16da82c..0a04d76b2d69 100644
--- a/vllm/entrypoints/openai/serving_chat.py
+++ b/vllm/entrypoints/openai/serving_chat.py
@@ -222,16 +222,14 @@ async def create_chat_completion(
 
             if not self.use_harmony:
                 # Common case.
-                request_chat_template = request.chat_template
-                chat_template_kwargs = request.chat_template_kwargs
-                if not self.trust_request_chat_template and (
-                        request_chat_template is not None or
-                    (chat_template_kwargs and
-                     chat_template_kwargs.get("chat_template") is not None)):
-                    return self.create_error_response(
-                        "Chat template is passed with request, but "
-                        "--trust-request-chat-template is not set. "
-                        "Refused request with untrusted chat template.")
+                error_check_ret = self._validate_chat_template(
+                    request_chat_template=request.chat_template,
+                    chat_template_kwargs=request.chat_template_kwargs,
+                    trust_request_chat_template=self.
+                    trust_request_chat_template,
+                )
+                if error_check_ret is not None:
+                    return error_check_ret
                 (
                     conversation,
                     request_prompts,
@@ -240,7 +238,7 @@ async def create_chat_completion(
                     request,
                     tokenizer,
                     request.messages,
-                    chat_template=request_chat_template or self.chat_template,
+                    chat_template=request.chat_template or self.chat_template,
                     chat_template_content_format=self.
                     chat_template_content_format,
                     add_generation_prompt=request.add_generation_prompt,
diff --git a/vllm/entrypoints/openai/serving_embedding.py b/vllm/entrypoints/openai/serving_embedding.py
index 647e7daed659..85493f121993 100644
--- a/vllm/entrypoints/openai/serving_embedding.py
+++ b/vllm/entrypoints/openai/serving_embedding.py
@@ -576,6 +576,7 @@ def __init__(
         request_logger: Optional[RequestLogger],
         chat_template: Optional[str],
         chat_template_content_format: ChatTemplateContentFormatOption,
+        trust_request_chat_template: bool = False,
         log_error_stack: bool = False,
     ) -> None:
         super().__init__(engine_client=engine_client,
@@ -586,6 +587,7 @@ def __init__(
 
         self.chat_template = chat_template
         self.chat_template_content_format: Final = chat_template_content_format
+        self.trust_request_chat_template = trust_request_chat_template
 
     async def create_embedding(
         self,
@@ -629,3 +631,17 @@ def _create_pooling_params(
             return self.create_error_response(str(e))
 
         return pooling_params
+
+    async def _preprocess(
+        self,
+        ctx: ServeContext,
+    ) -> Optional[ErrorResponse]:
+        if isinstance(ctx.request, EmbeddingChatRequest):
+            error_check_ret = self._validate_chat_template(
+                request_chat_template=ctx.request.chat_template,
+                chat_template_kwargs=ctx.request.chat_template_kwargs,
+                trust_request_chat_template=self.trust_request_chat_template,
+            )
+            if error_check_ret is not None:
+                return error_check_ret
+        return await super()._preprocess(ctx)
diff --git a/vllm/entrypoints/openai/serving_engine.py b/vllm/entrypoints/openai/serving_engine.py
index e58d943d3f7f..151888afd8da 100644
--- a/vllm/entrypoints/openai/serving_engine.py
+++ b/vllm/entrypoints/openai/serving_engine.py
@@ -751,6 +751,22 @@ async def _tokenize_prompt_inputs_async(
                     tokenizer=tokenizer,
                 )
 
+    def _validate_chat_template(
+        self,
+        request_chat_template: Optional[str],
+        chat_template_kwargs: Optional[dict[str, Any]],
+        trust_request_chat_template: bool,
+    ) -> Optional[ErrorResponse]:
+        if not trust_request_chat_template and (
+                request_chat_template is not None or
+            (chat_template_kwargs
+             and chat_template_kwargs.get("chat_template") is not None)):
+            return self.create_error_response(
+                "Chat template is passed with request, but "
+                "--trust-request-chat-template is not set. "
+                "Refused request with untrusted chat template.")
+        return None
+
     async def _preprocess_chat(
         self,
         request: Union[ChatLikeRequest, ResponsesRequest],
diff --git a/vllm/entrypoints/openai/serving_pooling.py b/vllm/entrypoints/openai/serving_pooling.py
index 0750c7ec3e9f..3a41c2613624 100644
--- a/vllm/entrypoints/openai/serving_pooling.py
+++ b/vllm/entrypoints/openai/serving_pooling.py
@@ -65,6 +65,7 @@ def __init__(
         request_logger: Optional[RequestLogger],
         chat_template: Optional[str],
         chat_template_content_format: ChatTemplateContentFormatOption,
+        trust_request_chat_template: bool = False,
         log_error_stack: bool = False,
     ) -> None:
         super().__init__(engine_client=engine_client,
@@ -75,6 +76,7 @@ def __init__(
 
         self.chat_template = chat_template
         self.chat_template_content_format: Final = chat_template_content_format
+        self.trust_request_chat_template = trust_request_chat_template
         io_processor_plugin = self.model_config.io_processor_plugin
         self.io_processor = get_io_processor(vllm_config, io_processor_plugin)
 
@@ -129,6 +131,14 @@ async def create_pooling(
                     prompt=validated_prompt, request_id=request_id)
 
             elif isinstance(request, PoolingChatRequest):
+                error_check_ret = self._validate_chat_template(
+                    request_chat_template=request.chat_template,
+                    chat_template_kwargs=request.chat_template_kwargs,
+                    trust_request_chat_template=self.
+                    trust_request_chat_template,
+                )
+                if error_check_ret is not None:
+                    return error_check_ret
                 (
                     _,
                     _,
diff --git a/vllm/entrypoints/openai/serving_tokenization.py b/vllm/entrypoints/openai/serving_tokenization.py
index 3918d08ebf81..1a39fb123210 100644
--- a/vllm/entrypoints/openai/serving_tokenization.py
+++ b/vllm/entrypoints/openai/serving_tokenization.py
@@ -40,6 +40,7 @@ def __init__(
         request_logger: Optional[RequestLogger],
         chat_template: Optional[str],
         chat_template_content_format: ChatTemplateContentFormatOption,
+        trust_request_chat_template: bool = False,
         log_error_stack: bool = False,
     ) -> None:
         super().__init__(engine_client=engine_client,
@@ -50,6 +51,7 @@ def __init__(
 
         self.chat_template = chat_template
         self.chat_template_content_format: Final = chat_template_content_format
+        self.trust_request_chat_template = trust_request_chat_template
 
     async def create_tokenize(
         self,
@@ -71,6 +73,14 @@ async def create_tokenize(
             if isinstance(request, TokenizeChatRequest):
                 tool_dicts = (None if request.tools is None else
                               [tool.model_dump() for tool in request.tools])
+                error_check_ret = self._validate_chat_template(
+                    request_chat_template=request.chat_template,
+                    chat_template_kwargs=request.chat_template_kwargs,
+                    trust_request_chat_template=self.
+                    trust_request_chat_template,
+                )
+                if error_check_ret is not None:
+                    return error_check_ret
                 (
                     _,
                     _,

From 5bdc29b8e95de887fb8b49289502ce58a5147c53 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Sun, 5 Oct 2025 01:05:29 +0800
Subject: [PATCH 174/193] [Renderer] Clean up renderer code (#26216)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../openai/test_token_in_token_out.py         |   2 +-
 tests/test_inputs.py                          |  26 ++--
 vllm/entrypoints/openai/serving_completion.py |   3 +-
 vllm/entrypoints/renderer.py                  | 136 +++++++++---------
 vllm/inputs/parse.py                          |  61 +-------
 5 files changed, 94 insertions(+), 134 deletions(-)

diff --git a/tests/entrypoints/openai/test_token_in_token_out.py b/tests/entrypoints/openai/test_token_in_token_out.py
index ed003939c44b..f84605690c53 100644
--- a/tests/entrypoints/openai/test_token_in_token_out.py
+++ b/tests/entrypoints/openai/test_token_in_token_out.py
@@ -54,7 +54,7 @@ async def test_token_in_token_out_and_logprobs(server):
             prompt=token_ids,
             max_tokens=20,
             temperature=0,
-            echo=True,
+            echo=False,
             extra_body={
                 "return_token_ids": True,
             },
diff --git a/tests/test_inputs.py b/tests/test_inputs.py
index b61b95bc4333..10a18e2d871f 100644
--- a/tests/test_inputs.py
+++ b/tests/test_inputs.py
@@ -4,7 +4,7 @@
 import pytest
 
 from vllm.inputs import zip_enc_dec_prompts
-from vllm.inputs.parse import parse_and_batch_prompt
+from vllm.inputs.parse import parse_raw_prompts
 
 pytestmark = pytest.mark.cpu_test
 
@@ -31,30 +31,30 @@
 ]
 
 
-def test_parse_single_batch_empty():
+def test_parse_raw_single_batch_empty():
     with pytest.raises(ValueError, match="at least one prompt"):
-        parse_and_batch_prompt([])
+        parse_raw_prompts([])
 
     with pytest.raises(ValueError, match="at least one prompt"):
-        parse_and_batch_prompt([[]])
+        parse_raw_prompts([[]])
 
 
 @pytest.mark.parametrize('string_input', STRING_INPUTS)
-def test_parse_single_batch_string_consistent(string_input: str):
-    assert parse_and_batch_prompt(string_input) \
-        == parse_and_batch_prompt([string_input])
+def test_parse_raw_single_batch_string_consistent(string_input: str):
+    assert parse_raw_prompts(string_input) \
+        == parse_raw_prompts([string_input])
 
 
 @pytest.mark.parametrize('token_input', TOKEN_INPUTS)
-def test_parse_single_batch_token_consistent(token_input: list[int]):
-    assert parse_and_batch_prompt(token_input) \
-        == parse_and_batch_prompt([token_input])
+def test_parse_raw_single_batch_token_consistent(token_input: list[int]):
+    assert parse_raw_prompts(token_input) \
+        == parse_raw_prompts([token_input])
 
 
 @pytest.mark.parametrize('inputs_slice', INPUTS_SLICES)
-def test_parse_single_batch_string_slice(inputs_slice: slice):
-    assert parse_and_batch_prompt(STRING_INPUTS)[inputs_slice] \
-        == parse_and_batch_prompt(STRING_INPUTS[inputs_slice])
+def test_parse_raw_single_batch_string_slice(inputs_slice: slice):
+    assert parse_raw_prompts(STRING_INPUTS)[inputs_slice] \
+        == parse_raw_prompts(STRING_INPUTS[inputs_slice])
 
 
 # yapf: disable
diff --git a/vllm/entrypoints/openai/serving_completion.py b/vllm/entrypoints/openai/serving_completion.py
index d0756e42b796..6e4113e6cf1e 100644
--- a/vllm/entrypoints/openai/serving_completion.py
+++ b/vllm/entrypoints/openai/serving_completion.py
@@ -691,6 +691,5 @@ def _build_render_config(
             truncate_prompt_tokens=request.truncate_prompt_tokens,
             add_special_tokens=request.add_special_tokens,
             cache_salt=request.cache_salt,
-            needs_detokenization=bool(request.echo
-                                      and not request.return_token_ids),
+            needs_detokenization=bool(request.echo),
         )
diff --git a/vllm/entrypoints/renderer.py b/vllm/entrypoints/renderer.py
index d7ce57c728ba..f6fc045a1877 100644
--- a/vllm/entrypoints/renderer.py
+++ b/vllm/entrypoints/renderer.py
@@ -13,8 +13,9 @@
 
 from vllm.config import ModelConfig
 from vllm.inputs.data import EmbedsPrompt as EngineEmbedsPrompt
+from vllm.inputs.data import TextPrompt as EngineTextPrompt
 from vllm.inputs.data import TokensPrompt as EngineTokensPrompt
-from vllm.inputs.parse import parse_and_batch_prompt
+from vllm.inputs.parse import get_prompt_components, parse_raw_prompts
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 from vllm.utils import AsyncMicrobatchTokenizer
 
@@ -41,6 +42,27 @@ class RenderConfig:
     needs_detokenization: Optional[bool] = False
     """If True, detokenize IDs back to text for inclusion in outputs."""
 
+    def verify_truncate_prompt_tokens(
+            self, model_config: ModelConfig) -> Optional[int]:
+        """Validate and normalize `truncate_prompt_tokens` parameter."""
+        truncate_prompt_tokens = self.truncate_prompt_tokens
+        if truncate_prompt_tokens is None:
+            return None
+
+        if truncate_prompt_tokens == 0:
+            return 0
+
+        if truncate_prompt_tokens < 0:
+            truncate_prompt_tokens = model_config.max_model_len
+
+        max_length = self.max_length
+        if max_length is not None and truncate_prompt_tokens > max_length:  # type: ignore[operator]
+            raise ValueError(
+                f"{truncate_prompt_tokens=} cannot be greater than "
+                f"{max_length=}. Please select a smaller truncation size.")
+
+        return truncate_prompt_tokens
+
 
 class BaseRenderer(ABC):
     """
@@ -74,7 +96,7 @@ async def render_prompt(
         self,
         *,
         prompt_or_prompts: Union[str, list[str], list[int], list[list[int]]],
-        config: "RenderConfig",
+        config: RenderConfig,
     ) -> list[EngineTokensPrompt]:
         """
         Convert text or token inputs into engine-ready TokensPrompt objects.
@@ -107,7 +129,7 @@ async def render_prompt_and_embeds(
         prompt_or_prompts: Optional[Union[str, list[str], list[int],
                                           list[list[int]]]] = None,
         prompt_embeds: Optional[Union[bytes, list[bytes]]] = None,
-        config: "RenderConfig",
+        config: RenderConfig,
     ) -> list[Union[EngineTokensPrompt, EngineEmbedsPrompt]]:
         """
         Convert text/token and/or base64-encoded embeddings inputs into
@@ -189,47 +211,25 @@ async def render_prompt(
         self,
         *,
         prompt_or_prompts: Union[str, list[str], list[int], list[list[int]]],
-        config: "RenderConfig",
+        config: RenderConfig,
     ) -> list[EngineTokensPrompt]:
         """Implementation of prompt rendering for completion-style requests.
         
         Uses async tokenizer pooling for improved performance. See base class
         for detailed parameter documentation.
         """
-        truncate_prompt_tokens = self._validate_and_normalize_truncate_tokens(
-            config.truncate_prompt_tokens, config.max_length)
+        truncate_prompt_tokens = config.verify_truncate_prompt_tokens(
+            self.model_config)
         if truncate_prompt_tokens == 0:
             return []
 
-        # Parse and batch the input prompts
-        batch_inputs = parse_and_batch_prompt(prompt_or_prompts)
-
-        tasks = []
-        for prompt_input in batch_inputs:
-            if prompt_input["is_tokens"] is True:
-                # Token input
-                # Note: detokenization is needed when echo is enabled,
-                # where the input token IDs are decoded back to text.
-                task = self._maybe_detokenize(prompt_input["content"],
-                                              config.max_length,
-                                              truncate_prompt_tokens,
-                                              config.cache_salt,
-                                              config.needs_detokenization)
-            else:
-                # Text input
-                task = self._tokenize(prompt_input["content"],
-                                      config.max_length,
-                                      truncate_prompt_tokens,
-                                      config.add_special_tokens,
-                                      config.cache_salt)
-            tasks.append(task)
-
-        # Wait for all text tokenization to finish
-        if tasks:
-            tokenized_text_prompts = await asyncio.gather(*tasks)
-            return tokenized_text_prompts
-
-        return []
+        tasks = (self._create_prompt(
+            prompt_input,
+            config=config,
+            truncate_prompt_tokens=truncate_prompt_tokens,
+        ) for prompt_input in parse_raw_prompts(prompt_or_prompts))
+
+        return await asyncio.gather(*tasks)
 
     async def render_prompt_and_embeds(
         self,
@@ -237,14 +237,14 @@ async def render_prompt_and_embeds(
         prompt_or_prompts: Optional[Union[str, list[str], list[int],
                                           list[list[int]]]] = None,
         prompt_embeds: Optional[Union[bytes, list[bytes]]] = None,
-        config: "RenderConfig",
+        config: RenderConfig,
     ) -> list[Union[EngineTokensPrompt, EngineEmbedsPrompt]]:
         """
         Render text/token prompts and/or precomputed embedding prompts. At
         least one of `prompt_or_prompts` or `prompt_embeds` must be provided.
         """
-        truncate_prompt_tokens = self._validate_and_normalize_truncate_tokens(
-            config.truncate_prompt_tokens, config.max_length)
+        truncate_prompt_tokens = config.verify_truncate_prompt_tokens(
+            self.model_config)
         if truncate_prompt_tokens == 0:
             return []
 
@@ -265,29 +265,6 @@ async def render_prompt_and_embeds(
 
         return rendered
 
-    def _validate_and_normalize_truncate_tokens(
-        self,
-        truncate_prompt_tokens: Optional[int],
-        max_length: Optional[int],
-    ) -> Optional[int]:
-        """Validate and normalize truncate_prompt_tokens parameter."""
-        if truncate_prompt_tokens is None:
-            return None
-
-        if truncate_prompt_tokens == 0:
-            return 0
-
-        if truncate_prompt_tokens < 0:
-            truncate_prompt_tokens = self.model_config.max_model_len
-
-        if max_length is not None and truncate_prompt_tokens > max_length:  # type: ignore[operator]
-            raise ValueError(
-                f"truncate_prompt_tokens ({truncate_prompt_tokens}) "
-                f"cannot be greater than max_length ({max_length}). "
-                f"Please select a smaller truncation size.")
-
-        return truncate_prompt_tokens
-
     def _maybe_apply_truncation(
             self, token_ids: list[int],
             truncate_prompt_tokens: Optional[int]) -> list[int]:
@@ -299,7 +276,38 @@ def _maybe_apply_truncation(
 
         return token_ids[-truncate_prompt_tokens:]
 
-    async def _tokenize(
+    async def _create_prompt(
+        self,
+        prompt_input: Union[EngineTextPrompt, EngineTokensPrompt],
+        config: RenderConfig,
+        truncate_prompt_tokens: Optional[int],
+    ) -> EngineTokensPrompt:
+        prompt, prompt_token_ids, _ = get_prompt_components(prompt_input)
+
+        if prompt_token_ids is not None:
+            # NOTE: detokenization is needed when echo is enabled,
+            # where the input token IDs are decoded back to text.
+            return await self._create_prompt_from_token_ids(
+                prompt_token_ids,
+                config.max_length,
+                truncate_prompt_tokens,
+                config.cache_salt,
+                config.needs_detokenization,
+            )
+
+        if prompt is not None:
+            return await self._create_prompt_from_text(
+                prompt,
+                config.max_length,
+                truncate_prompt_tokens,
+                config.add_special_tokens,
+                config.cache_salt,
+            )
+
+        # TODO: Also handle embeds prompt using this method
+        raise NotImplementedError
+
+    async def _create_prompt_from_text(
         self,
         text: str,
         max_length: Optional[int],
@@ -330,7 +338,7 @@ async def _tokenize(
         return self._create_tokens_prompt(encoded.input_ids, max_length,
                                           cache_salt, text)
 
-    async def _maybe_detokenize(
+    async def _create_prompt_from_token_ids(
         self,
         token_ids: list[int],
         max_length: Optional[int],
@@ -343,7 +351,7 @@ async def _maybe_detokenize(
                                                  truncate_prompt_tokens)
 
         prompt = None
-        if needs_detokenization is True:
+        if needs_detokenization:
             async_tokenizer = self._get_async_tokenizer()
             prompt = await async_tokenizer.decode(token_ids)
 
diff --git a/vllm/inputs/parse.py b/vllm/inputs/parse.py
index 123c81173120..f93817bd463d 100644
--- a/vllm/inputs/parse.py
+++ b/vllm/inputs/parse.py
@@ -2,7 +2,7 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from collections.abc import Sequence
 from typing import (TYPE_CHECKING, Literal, NamedTuple, Optional, TypedDict,
-                    Union, cast, overload)
+                    Union, cast)
 
 from typing_extensions import TypeIs
 
@@ -16,34 +16,12 @@
     import torch
 
 
-class ParsedText(TypedDict):
-    content: str
-    is_tokens: Literal[False]
-
-
-class ParsedTokens(TypedDict):
-    content: list[int]
-    is_tokens: Literal[True]
-
-
-@overload
-def parse_and_batch_prompt(
-    prompt: Union[str, list[str]], ) -> Sequence[ParsedText]:
-    ...
-
-
-@overload
-def parse_and_batch_prompt(
-    prompt: Union[list[int], list[list[int]]], ) -> Sequence[ParsedTokens]:
-    ...
-
-
-def parse_and_batch_prompt(
+def parse_raw_prompts(
     prompt: Union[str, list[str], list[int], list[list[int]]],
-) -> Union[Sequence[ParsedText], Sequence[ParsedTokens]]:
+) -> Union[Sequence[TextPrompt], Sequence[TokensPrompt]]:
     if isinstance(prompt, str):
         # case 1: a string
-        return [ParsedText(content=prompt, is_tokens=False)]
+        return [TextPrompt(prompt=prompt)]
 
     if isinstance(prompt, list):
         if len(prompt) == 0:
@@ -52,13 +30,11 @@ def parse_and_batch_prompt(
         if is_list_of(prompt, str):
             # case 2: array of strings
             prompt = cast(list[str], prompt)
-            return [
-                ParsedText(content=elem, is_tokens=False) for elem in prompt
-            ]
+            return [TextPrompt(prompt=elem) for elem in prompt]
         if is_list_of(prompt, int):
             # case 3: array of tokens
             prompt = cast(list[int], prompt)
-            return [ParsedTokens(content=prompt, is_tokens=True)]
+            return [TokensPrompt(prompt_token_ids=prompt)]
         if is_list_of(prompt, list):
             prompt = cast(list[list[int]], prompt)
             if len(prompt[0]) == 0:
@@ -66,10 +42,7 @@ def parse_and_batch_prompt(
 
             if is_list_of(prompt[0], int):
                 # case 4: array of token arrays
-                return [
-                    ParsedTokens(content=elem, is_tokens=True)
-                    for elem in prompt
-                ]
+                return [TokensPrompt(prompt_token_ids=elem) for elem in prompt]
 
     raise TypeError("prompt must be a string, array of strings, "
                     "array of tokens, or array of token arrays")
@@ -99,26 +72,6 @@ class ParsedEmbedsPrompt(TypedDict):
                               ParsedTokensPrompt, ParsedEmbedsPrompt]
 
 
-@overload
-def parse_singleton_prompt(prompt: str) -> ParsedStrPrompt:
-    ...
-
-
-@overload
-def parse_singleton_prompt(prompt: TextPrompt) -> ParsedTextPrompt:
-    ...
-
-
-@overload
-def parse_singleton_prompt(prompt: TokensPrompt) -> ParsedTokensPrompt:
-    ...
-
-
-@overload
-def parse_singleton_prompt(prompt: EmbedsPrompt) -> ParsedEmbedsPrompt:
-    ...
-
-
 def parse_singleton_prompt(prompt: SingletonPrompt) -> ParsedSingletonPrompt:
     if isinstance(prompt, str):
         return ParsedStrPrompt(type="str", content=prompt)

From 70d9843ede489e6e0b3951e37703c579c1f27e15 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Sun, 5 Oct 2025 11:54:17 +0800
Subject: [PATCH 175/193] [Model] Use `merge_by_field_config` for MM models
 (H-L) (#26230)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../vision_language_multi_image.py            |  2 +-
 vllm/model_executor/models/idefics3.py        | 32 +++-------
 vllm/model_executor/models/keye.py            | 59 +++----------------
 vllm/model_executor/models/keye_vl1_5.py      | 56 ++----------------
 vllm/model_executor/models/kimi_vl.py         | 33 +----------
 vllm/utils/tensor_schema.py                   |  8 ++-
 6 files changed, 29 insertions(+), 161 deletions(-)

diff --git a/examples/offline_inference/vision_language_multi_image.py b/examples/offline_inference/vision_language_multi_image.py
index e0d95758a822..c584dce79354 100644
--- a/examples/offline_inference/vision_language_multi_image.py
+++ b/examples/offline_inference/vision_language_multi_image.py
@@ -548,7 +548,7 @@ def load_keye_vl1_5(question: str, image_urls: list[str]) -> ModelRequestData:
     engine_args = EngineArgs(
         model=model_name,
         trust_remote_code=True,
-        max_model_len=8192,
+        max_model_len=32768,
         max_num_seqs=5,
         limit_mm_per_prompt={"image": len(image_urls)},
     )
diff --git a/vllm/model_executor/models/idefics3.py b/vllm/model_executor/models/idefics3.py
index 567793e9b7ee..5e69c10b4024 100644
--- a/vllm/model_executor/models/idefics3.py
+++ b/vllm/model_executor/models/idefics3.py
@@ -53,7 +53,7 @@
 # yapf: enable
 from .interfaces import MultiModalEmbeddings, SupportsLoRA, SupportsMultiModal
 from .llama import LlamaModel
-from .utils import AutoWeightsLoader, flatten_bn, maybe_prefix
+from .utils import AutoWeightsLoader, maybe_prefix
 
 
 class Idefics3ImagePixelInputs(TensorSchema):
@@ -67,7 +67,7 @@ class Idefics3ImagePixelInputs(TensorSchema):
     """
     type: Literal["pixel_values"]
     pixel_values: Annotated[torch.Tensor, TensorShape("bnp", 3, "h", "w")]
-    pixel_attention_mask: torch.Tensor
+    pixel_attention_mask: Annotated[torch.Tensor, TensorShape("bnp", "h", "w")]
     num_patches: Annotated[torch.Tensor, TensorShape("bn")]
 
 
@@ -569,6 +569,8 @@ def forward(
     dummy_inputs=Idefics3DummyInputsBuilder)
 class Idefics3ForConditionalGeneration(nn.Module, SupportsMultiModal,
                                        SupportsLoRA):
+    merge_by_field_config = True
+
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -621,37 +623,21 @@ def _parse_and_validate_image_input(
             return None
 
         if image_embeds is not None:
-            if not isinstance(image_embeds, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image embeddings. "
-                                 f"Got type: {type(image_embeds)}")
-
             return Idefics3ImageEmbeddingInputs(
                 type="image_embeds",
-                data=flatten_bn(image_embeds, concat=True),
+                data=image_embeds,
             )
 
         if pixel_values is not None:
-            if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values)}")
-
             pixel_attention_mask = kwargs.pop("pixel_attention_mask")
-            if not isinstance(pixel_attention_mask, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel_attention_mask. "
-                                 f"Got type: {type(pixel_attention_mask)}")
-
             num_patches = kwargs.pop("num_patches")
-            if not isinstance(num_patches, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of num_patches. "
-                                 f"Got type: {type(num_patches)}")
-
             expected_h = expected_w = self.config.vision_config.image_size
+
             return Idefics3ImagePixelInputs(
                 type="pixel_values",
-                pixel_values=flatten_bn(pixel_values, concat=True),
-                pixel_attention_mask=flatten_bn(pixel_attention_mask,
-                                                concat=True),
-                num_patches=flatten_bn(num_patches, concat=True),
+                pixel_values=pixel_values,
+                pixel_attention_mask=pixel_attention_mask,
+                num_patches=num_patches,
                 resolve_bindings={
                     "h": expected_h,
                     "w": expected_w
diff --git a/vllm/model_executor/models/keye.py b/vllm/model_executor/models/keye.py
index 20f705cca8e6..dda24bb78491 100644
--- a/vllm/model_executor/models/keye.py
+++ b/vllm/model_executor/models/keye.py
@@ -30,7 +30,7 @@
 from vllm.model_executor.model_loader.weight_utils import (
     default_weight_loader, maybe_remap_kv_scale_name)
 from vllm.model_executor.models.module_mapping import MultiModelKeys
-from vllm.multimodal import MULTIMODAL_REGISTRY, NestedTensors
+from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import (ImageItem, ModalityData,
                                     MultiModalDataDict, MultiModalFieldConfig,
                                     MultiModalKwargsItems, VideoItem)
@@ -42,7 +42,6 @@
                                         PromptUpdate)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
-from vllm.utils import is_list_of
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
@@ -100,8 +99,7 @@ def smart_resize(
 class KeyeImagePixelInputs(TensorSchema):
     """
     Dimensions:
-        - b: Batch size
-        - np: Number of patches
+        - bnp: Batch size * Number of patches
         - c: Number of channels
         - ps: Patch size
         - ni: Number of images
@@ -110,7 +108,7 @@ class KeyeImagePixelInputs(TensorSchema):
     type: Literal["pixel_values"]
     pixel_values: Annotated[
         torch.Tensor,
-        TensorShape("b", "np", 3, "ps", "ps", dynamic_dims={"np"})]
+        TensorShape("bnp", 3, "ps", "ps", dynamic_dims={"bnp"})]
     image_grid_thw: Annotated[torch.Tensor, TensorShape("ni", 3)]
 
 
@@ -134,8 +132,7 @@ class KeyeImageEmbeddingInputs(TensorSchema):
 class KeyeVideoPixelInputs(TensorSchema):
     """
     Dimensions:
-        - b: Batch size
-        - np: Number of patches
+        - bnp: Batch size * Number of patches
         - c: Number of channels
         - ps: Patch size
         - ni: Number of images
@@ -144,7 +141,7 @@ class KeyeVideoPixelInputs(TensorSchema):
     type: Literal["pixel_values_videos"]
     pixel_values_videos: Annotated[
         torch.Tensor,
-        TensorShape("b", "np", 3, "ps", "ps", dynamic_dims={"np"})]
+        TensorShape("bnp", 3, "ps", "ps", dynamic_dims={"bnp"})]
     video_grid_thw: Annotated[torch.Tensor, TensorShape("nv", 3)]
 
 
@@ -1258,6 +1255,8 @@ def _get_mm_fields_config(
 
 
 class BaseKeyeModule(nn.Module):
+    merge_by_field_config = True
+
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -1524,28 +1523,6 @@ def _build_projector(self,
                          prefix: str = "") -> nn.Module:
         return Projector(text_config, vision_config, quant_config, prefix)
 
-    def _validate_and_reshape_mm_tensor(
-            self, mm_input: NestedTensors,
-            name: str) -> Union[torch.Tensor, list[torch.Tensor]]:
-        if not isinstance(mm_input, (torch.Tensor, list)):
-            raise ValueError(f"Incorrect type of {name}. "
-                             f"Got type: {type(mm_input)}")
-        if isinstance(mm_input, torch.Tensor):
-            if mm_input.ndim == 2:
-                return mm_input
-            if mm_input.ndim == 5:
-                return mm_input
-            if mm_input.ndim != 3:
-                raise ValueError(f"{name} should be 2D or batched 3D tensor. "
-                                 f"Got ndim: {mm_input.ndim} "
-                                 f"(shape={mm_input.shape})")
-            return mm_input.reshape(-1, mm_input.shape[-1])
-        elif is_list_of(mm_input, torch.Tensor):
-            if all(p.dim() == 4 for p in mm_input) or all(p.dim() == 2
-                                                          for p in mm_input):
-                return mm_input
-        return torch.concat(mm_input)
-
     def _parse_and_validate_image_input(
             self, **kwargs: object) -> Optional[KeyeImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
@@ -1556,11 +1533,6 @@ def _parse_and_validate_image_input(
             return None
 
         if pixel_values is not None:
-            pixel_values = self._validate_and_reshape_mm_tensor(
-                pixel_values, "image pixel values")
-            image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, "image grid_thw")
-
             return KeyeImagePixelInputs(
                 type="pixel_values",
                 pixel_values=pixel_values,
@@ -1568,11 +1540,6 @@ def _parse_and_validate_image_input(
             )
 
         if image_embeds is not None:
-            image_embeds = self._validate_and_reshape_mm_tensor(
-                image_embeds, "image embeds")
-            image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, "image grid_thw")
-
             return KeyeImageEmbeddingInputs(
                 type="image_embeds",
                 image_embeds=image_embeds,
@@ -1589,13 +1556,6 @@ def _parse_and_validate_video_input(
             return None
 
         if pixel_values_videos is not None:
-            pixel_values_videos = self._validate_and_reshape_mm_tensor(
-                pixel_values_videos,
-                "video pixel values",
-            )
-            video_grid_thw = self._validate_and_reshape_mm_tensor(
-                video_grid_thw, "video grid_thw")
-
             return KeyeVideoPixelInputs(
                 type="pixel_values_videos",
                 pixel_values_videos=pixel_values_videos,
@@ -1603,11 +1563,6 @@ def _parse_and_validate_video_input(
             )
 
         if video_embeds is not None:
-            video_embeds = self._validate_and_reshape_mm_tensor(
-                video_embeds, "video embeds")
-            video_grid_thw = self._validate_and_reshape_mm_tensor(
-                video_grid_thw, "video grid_thw")
-
             return KeyeVideoEmbeddingInputs(
                 type="video_embeds",
                 video_embeds=video_embeds,
diff --git a/vllm/model_executor/models/keye_vl1_5.py b/vllm/model_executor/models/keye_vl1_5.py
index 93a3bf5f98f7..6e34230878d3 100644
--- a/vllm/model_executor/models/keye_vl1_5.py
+++ b/vllm/model_executor/models/keye_vl1_5.py
@@ -18,7 +18,7 @@
 from vllm.model_executor.layers.linear import (ColumnParallelLinear,
                                                RowParallelLinear)
 from vllm.model_executor.layers.quantization import QuantizationConfig
-from vllm.multimodal import MULTIMODAL_REGISTRY, NestedTensors
+from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import (ImageItem, ModalityData,
                                     MultiModalFieldConfig,
                                     MultiModalKwargsItems, VideoItem)
@@ -100,8 +100,7 @@ def get_num_patches(grid_thw: torch.Tensor,
 class KeyeVL1_5ImagePixelInputs(TensorSchema):
     """
     Dimensions:
-        - b: Batch size
-        - np: Number of patches
+        - bnp: Batch size * Number of patches
         - c: Number of channels
         - ps: Patch size
         - ni: Number of images
@@ -111,7 +110,7 @@ class KeyeVL1_5ImagePixelInputs(TensorSchema):
 
     pixel_values: Annotated[
         torch.Tensor,
-        TensorShape("np", 3, "ps", "ps", dynamic_dims={"np"})]
+        TensorShape("bnp", 3, "ps", "ps", dynamic_dims={"bnp"})]
 
     image_grid_thw: Annotated[torch.Tensor, TensorShape("ni", 3)]
 
@@ -137,8 +136,7 @@ class KeyeVL1_5ImageEmbeddingInputs(TensorSchema):
 class KeyeVL1_5VideoPixelInputs(TensorSchema):
     """
     Dimensions:
-        - b: Batch size
-        - np: Number of patches
+        - bnp: Batch size * Number of patches
         - c: Number of channels
         - ps: Patch size
         - ni: Number of images
@@ -147,7 +145,7 @@ class KeyeVL1_5VideoPixelInputs(TensorSchema):
     type: Literal["pixel_values_videos"]
     pixel_values_videos: Annotated[
         torch.Tensor,
-        TensorShape("np", 3, "ps", "ps", dynamic_dims={"np"})]
+        TensorShape("bnp", 3, "ps", "ps", dynamic_dims={"bnp"})]
     video_grid_thw: Annotated[torch.Tensor, TensorShape("nv", 3)]
 
     num_frames: torch.Tensor
@@ -483,24 +481,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.merge_size = config.vision_config.spatial_merge_size
         super().__init__(vllm_config=vllm_config, prefix=prefix)
 
-    def _validate_and_reshape_mm_tensor(self, mm_input: NestedTensors,
-                                        expected_dim: int, name: str):
-        if not isinstance(mm_input, (torch.Tensor, list)):
-            raise ValueError(f"Incorrect type of {name}. "
-                             f"Got type: {type(mm_input)}")
-        if isinstance(mm_input, torch.Tensor):
-            if mm_input.ndim == expected_dim:
-                return mm_input
-            elif mm_input.ndim == expected_dim + 1:
-                return mm_input.reshape(-1, *mm_input.shape[2:])
-            else:
-                raise ValueError(
-                    f"{name} should be {expected_dim}D or "
-                    f"batched {expected_dim}D tensor."
-                    f"Got ndim: {mm_input.ndim} (shape={mm_input.shape})")
-        else:
-            return torch.concat(mm_input)
-
     def _parse_and_validate_image_input(
             self, **kwargs: object) -> Optional[KeyeVL1_5ImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
@@ -511,11 +491,6 @@ def _parse_and_validate_image_input(
             return None
 
         if pixel_values is not None:
-            pixel_values = self._validate_and_reshape_mm_tensor(
-                pixel_values, expected_dim=4, name="image pixel values")
-            image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, expected_dim=2, name="image grid_thw")
-
             return KeyeVL1_5ImagePixelInputs(
                 type="pixel_values",
                 pixel_values=pixel_values,
@@ -523,11 +498,6 @@ def _parse_and_validate_image_input(
             )
 
         if image_embeds is not None:
-            image_embeds = self._validate_and_reshape_mm_tensor(
-                image_embeds, expected_dim=2, name="image embeds")
-            image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, expected_dim=2, name="image grid_thw")
-
             return KeyeVL1_5ImageEmbeddingInputs(
                 type="image_embeds",
                 image_embeds=image_embeds,
@@ -545,17 +515,6 @@ def _parse_and_validate_video_input(
             return None
 
         if pixel_values_videos is not None:
-            pixel_values_videos = self._validate_and_reshape_mm_tensor(
-                pixel_values_videos,
-                expected_dim=4,
-                name="video pixel values",
-            )
-            video_grid_thw = self._validate_and_reshape_mm_tensor(
-                video_grid_thw, expected_dim=2, name="video grid_thw")
-
-            num_frames = self._validate_and_reshape_mm_tensor(
-                num_frames, expected_dim=1, name="video num frames")
-
             return KeyeVL1_5VideoPixelInputs(
                 type="pixel_values_videos",
                 pixel_values_videos=pixel_values_videos,
@@ -563,11 +522,6 @@ def _parse_and_validate_video_input(
                 num_frames=num_frames)
 
         if video_embeds is not None:
-            video_embeds = self._validate_and_reshape_mm_tensor(
-                video_embeds, expected_dim=2, name="video embeds")
-            video_grid_thw = self._validate_and_reshape_mm_tensor(
-                video_grid_thw, expected_dim=2, name="video grid_thw")
-
             return KeyeVL1_5VideoEmbeddingInputs(type="video_embeds",
                                                  video_embeds=video_embeds,
                                                  video_grid_thw=video_grid_thw,
diff --git a/vllm/model_executor/models/kimi_vl.py b/vllm/model_executor/models/kimi_vl.py
index a47bdd2f5ab5..60404376f276 100644
--- a/vllm/model_executor/models/kimi_vl.py
+++ b/vllm/model_executor/models/kimi_vl.py
@@ -283,6 +283,7 @@ def get_replacement(item_idx: int):
                                         dummy_inputs=KimiVLDummyInputsBuilder)
 class KimiVLForConditionalGeneration(nn.Module, SupportsMultiModal,
                                      SupportsPP):
+    merge_by_field_config = True
 
     supports_encoder_tp_data = True
 
@@ -342,23 +343,6 @@ def __init__(
                                                 config.vocab_size, logit_scale)
         self.media_placeholder: int = self.config.media_placeholder_token_id
 
-    # ref: qwen2_vl.py
-    def _validate_and_reshape_mm_tensor(self, mm_input: object,
-                                        name: str) -> torch.Tensor:
-        if not isinstance(mm_input, (torch.Tensor, list)):
-            raise ValueError(f"Incorrect type of {name}. "
-                             f"Got type: {type(mm_input)}")
-        if isinstance(mm_input, torch.Tensor):
-            if mm_input.ndim == 2:
-                return mm_input
-            if mm_input.ndim != 3:
-                raise ValueError(f"{name} should be 2D or batched 3D tensor. "
-                                 f"Got ndim: {mm_input.ndim} "
-                                 f"(shape={mm_input.shape})")
-            return mm_input.reshape(-1, mm_input.shape[-1])
-        else:
-            return torch.concat(mm_input)
-
     def _parse_and_validate_image_input(
             self, **kwargs: object) -> Optional[KimiVLImageInputs]:
         # image input type must be pixel values now
@@ -368,21 +352,6 @@ def _parse_and_validate_image_input(
         if pixel_values is None:
             return None
 
-        image_grid_hws = self._validate_and_reshape_mm_tensor(
-            image_grid_hws, "image grid hws")
-        # pixel_values may have complex shapes
-        num_channels = 3
-        patch_size = self.config.vision_config.patch_size
-        if isinstance(pixel_values, list):
-            pixel_values = torch.cat([
-                x.reshape(-1, num_channels, patch_size, patch_size)
-                for x in pixel_values
-            ])
-        else:
-            pixel_values = pixel_values.reshape(-1, num_channels, patch_size,
-                                                patch_size)
-        pixel_values = pixel_values.to(self.vision_tower.dtype)
-
         return KimiVLImagePixelInputs(
             type="pixel_values",
             pixel_values=pixel_values,
diff --git a/vllm/utils/tensor_schema.py b/vllm/utils/tensor_schema.py
index 44688467b899..81daca7dfbef 100644
--- a/vllm/utils/tensor_schema.py
+++ b/vllm/utils/tensor_schema.py
@@ -164,7 +164,9 @@ def _validate_tensor_shape_expected(
 
         if len(actual_shape) != len(expected_shape):
             raise ValueError(f"{field_name} has rank {len(actual_shape)} "
-                             f"but expected {len(expected_shape)}")
+                             f"but expected {len(expected_shape)}. "
+                             f"Expected shape: {expected_shape}, "
+                             f"but got {actual_shape}")
 
         for i, dim in enumerate(expected_shape):
             if dim in dynamic_dims:
@@ -172,7 +174,9 @@ def _validate_tensor_shape_expected(
             elif isinstance(dim, int):
                 if actual_shape[i] != dim:
                     raise ValueError(f"{field_name} dim[{i}] expected "
-                                     f"{dim}, got {actual_shape[i]}")
+                                     f"{dim}, got {actual_shape[i]}. "
+                                     f"Expected shape: {expected_shape}, "
+                                     f"but got {actual_shape}")
             elif isinstance(dim, str):
                 if dim in shape_env:
                     if actual_shape[i] != shape_env[dim]:

From b950e54ba5a92e30dce1d47115b0b0f5f0eda8a3 Mon Sep 17 00:00:00 2001
From: 22quinn <33176974+22quinn@users.noreply.github.com>
Date: Sat, 4 Oct 2025 22:00:21 -0700
Subject: [PATCH 176/193] [Easy] Add str repr for IterationStats (#26232)

Signed-off-by: 22quinn <33176974+22quinn@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/v1/metrics/test_stats.py | 21 +++++++++++++++++++++
 vllm/v1/metrics/stats.py       |  5 +++++
 2 files changed, 26 insertions(+)
 create mode 100644 tests/v1/metrics/test_stats.py

diff --git a/tests/v1/metrics/test_stats.py b/tests/v1/metrics/test_stats.py
new file mode 100644
index 000000000000..3a25c69c5a2f
--- /dev/null
+++ b/tests/v1/metrics/test_stats.py
@@ -0,0 +1,21 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+from vllm.v1.metrics.stats import IterationStats
+
+
+def test_iteration_stats_repr():
+    iteration_stats = IterationStats()
+    iteration_stats.iteration_timestamp = 0
+    expected_repr = ("IterationStats("
+                     "iteration_timestamp=0, "
+                     "num_generation_tokens=0, "
+                     "num_prompt_tokens=0, "
+                     "num_preempted_reqs=0, "
+                     "finished_requests=[], "
+                     "max_num_generation_tokens_iter=[], "
+                     "n_params_iter=[], "
+                     "time_to_first_tokens_iter=[], "
+                     "inter_token_latencies_iter=[], "
+                     "waiting_lora_adapters={}, "
+                     "running_lora_adapters={})")
+    assert repr(iteration_stats) == expected_repr
diff --git a/vllm/v1/metrics/stats.py b/vllm/v1/metrics/stats.py
index a0d571318ba0..489b8da5c04e 100644
--- a/vllm/v1/metrics/stats.py
+++ b/vllm/v1/metrics/stats.py
@@ -111,6 +111,11 @@ def __init__(self):
         self.waiting_lora_adapters: dict[str, int] = {}
         self.running_lora_adapters: dict[str, int] = {}
 
+    def __repr__(self) -> str:
+        field_to_value_str = ", ".join(f"{k}={v}"
+                                       for k, v in vars(self).items())
+        return f"{self.__class__.__name__}({field_to_value_str})"
+
     def _time_since(self, start: float) -> float:
         """Calculate an interval relative to this iteration's timestamp."""
         return self.iteration_timestamp - start

From e33893e7b933d21486d236ed366b09ec2653efc1 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Sun, 5 Oct 2025 13:38:53 +0800
Subject: [PATCH 177/193] [Bugfix] Allow `--skip-tokenizer-init` with `echo and
 return_token_ids` (#26238)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/entrypoints/openai/test_token_in_token_out.py | 2 +-
 vllm/entrypoints/openai/serving_completion.py       | 3 ++-
 2 files changed, 3 insertions(+), 2 deletions(-)

diff --git a/tests/entrypoints/openai/test_token_in_token_out.py b/tests/entrypoints/openai/test_token_in_token_out.py
index f84605690c53..ed003939c44b 100644
--- a/tests/entrypoints/openai/test_token_in_token_out.py
+++ b/tests/entrypoints/openai/test_token_in_token_out.py
@@ -54,7 +54,7 @@ async def test_token_in_token_out_and_logprobs(server):
             prompt=token_ids,
             max_tokens=20,
             temperature=0,
-            echo=False,
+            echo=True,
             extra_body={
                 "return_token_ids": True,
             },
diff --git a/vllm/entrypoints/openai/serving_completion.py b/vllm/entrypoints/openai/serving_completion.py
index 6e4113e6cf1e..d0756e42b796 100644
--- a/vllm/entrypoints/openai/serving_completion.py
+++ b/vllm/entrypoints/openai/serving_completion.py
@@ -691,5 +691,6 @@ def _build_render_config(
             truncate_prompt_tokens=request.truncate_prompt_tokens,
             add_special_tokens=request.add_special_tokens,
             cache_salt=request.cache_salt,
-            needs_detokenization=bool(request.echo),
+            needs_detokenization=bool(request.echo
+                                      and not request.return_token_ids),
         )

From d7ccd65700ae679980d36029f282546f90118b00 Mon Sep 17 00:00:00 2001
From: Maximilien de Bayser <mbayser@br.ibm.com>
Date: Sun, 5 Oct 2025 04:35:42 -0300
Subject: [PATCH 178/193] Add documentation for granite 4 tool calling (#26175)

Signed-off-by: Max de Bayser <mbayser@br.ibm.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 docs/features/tool_calling.md | 6 +++++-
 1 file changed, 5 insertions(+), 1 deletion(-)

diff --git a/docs/features/tool_calling.md b/docs/features/tool_calling.md
index 241438ae5578..6a0bcfac66d0 100644
--- a/docs/features/tool_calling.md
+++ b/docs/features/tool_calling.md
@@ -191,10 +191,14 @@ VLLM also provides a pythonic and JSON-based chat template for Llama 4, but pyth
 
 For Llama 4 model, use `--tool-call-parser llama4_pythonic --chat-template examples/tool_chat_template_llama4_pythonic.jinja`.
 
-#### IBM Granite
+### IBM Granite
 
 Supported models:
 
+* `ibm-granite/granite-4.0-h-small` and other Granite 4.0 models
+
+    Recommended flags: `--tool-call-parser hermes`
+
 * `ibm-granite/granite-3.0-8b-instruct`
 
     Recommended flags: `--tool-call-parser granite --chat-template examples/tool_chat_template_granite.jinja`

From 668ba11cedf7770b6e4b701c87b6b9892012559e Mon Sep 17 00:00:00 2001
From: Jialin Ouyang <Jialin.Ouyang@gmail.com>
Date: Sun, 5 Oct 2025 01:46:03 -0700
Subject: [PATCH 179/193] [Perf][Easy] Early stop in request_block_hasher
 (#26112)

Signed-off-by: Jialin Ouyang <Jialin.Ouyang@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/v1/core/kv_cache_utils.py | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/vllm/v1/core/kv_cache_utils.py b/vllm/v1/core/kv_cache_utils.py
index 2ff1bb681d80..bbfd93413fbc 100644
--- a/vllm/v1/core/kv_cache_utils.py
+++ b/vllm/v1/core/kv_cache_utils.py
@@ -585,6 +585,10 @@ def request_block_hasher(request: Request) -> list[BlockHash]:
         start_token_idx = len(request.block_hashes) * block_size
         num_tokens = request.num_tokens
 
+        if start_token_idx + block_size > num_tokens:
+            # Early stop when there no new full blocks created.
+            return []
+
         curr_mm_idx = 0
         if start_token_idx > 0:
             # Set curr_mm_idx = -1 to indicate the last mm input.

From 2aa85d7f256864f8897ed05378bcaaf9f5c8cebb Mon Sep 17 00:00:00 2001
From: Simon Danielsson <70206058+simondanielsson@users.noreply.github.com>
Date: Sun, 5 Oct 2025 09:46:36 +0100
Subject: [PATCH 180/193] [Bugfix]: Assertion error when using FlashInfer
 backend (#25933)

Signed-off-by: simondanielsson <simon.danielsson99@hotmail.com>
Co-authored-by: Cyrus Leung <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/model_executor/layers/quantization/fp8.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/vllm/model_executor/layers/quantization/fp8.py b/vllm/model_executor/layers/quantization/fp8.py
index dbcf4b2fbee5..4c4f3a8b0f47 100644
--- a/vllm/model_executor/layers/quantization/fp8.py
+++ b/vllm/model_executor/layers/quantization/fp8.py
@@ -508,7 +508,7 @@ def __init__(self, quant_config: Fp8Config, layer: torch.nn.Module):
         self.layer = layer
         self.quant_config = quant_config
         self.weight_block_size = self.quant_config.weight_block_size
-        self.block_quant = self.weight_block_size is not None
+        self.block_quant: bool = self.weight_block_size is not None
 
         self.fused_experts: Optional[
             mk.FusedMoEModularKernel] = None  # type: ignore
@@ -1094,7 +1094,7 @@ def apply(
                 expert_map=expert_map,
             )
         elif self.flashinfer_moe_backend == FlashinferMoeBackend.CUTLASS:
-            assert self.block_quant is None
+            assert not self.block_quant
             assert (not renormalize and custom_routing_function is not None)
             assert activation == 'silu', (
                 f"Expected 'silu' activation but got {activation}")

From bad8d59798b7ace246b445bd6893b88349bf688e Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Sun, 5 Oct 2025 18:10:20 +0800
Subject: [PATCH 181/193] [Bugfix] Always apply MM processor even when no MM
 items are passed (#26240)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/conftest.py                             | 29 ++++++-----
 tests/test_inputs.py                          | 50 +++++++++++++++++++
 vllm/inputs/preprocess.py                     | 16 ++++--
 vllm/model_executor/models/phi3v.py           |  4 +-
 .../models/qwen2_5_omni_thinker.py            |  1 +
 vllm/multimodal/processing.py                 | 26 +++++++---
 6 files changed, 99 insertions(+), 27 deletions(-)

diff --git a/tests/conftest.py b/tests/conftest.py
index c61a8f8dd539..fd48c66341bb 100644
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -46,7 +46,6 @@
 from vllm.distributed import (cleanup_dist_env_and_memory,
                               init_distributed_environment,
                               initialize_model_parallel)
-from vllm.inputs import TextPrompt
 from vllm.logger import init_logger
 from vllm.logprobs import Logprob
 from vllm.multimodal.utils import fetch_image
@@ -760,17 +759,24 @@ def get_inputs(
         images: Optional[PromptImageInput] = None,
         videos: Optional[PromptVideoInput] = None,
         audios: Optional[PromptAudioInput] = None,
-    ) -> list[TextPrompt]:
-
+    ) -> list[dict[str, Any]]:
         if any(x is not None and len(x) != len(prompts)
                for x in [images, videos, audios]):
             raise ValueError(
                 "All non-None multimodal inputs must have the same length as "
                 "prompts")
 
-        inputs = []
+        inputs = list[dict[str, Any]]()
         for i, prompt in enumerate(prompts):
-            multi_modal_data = {}
+            prompt_dict = dict[str, Any]()
+            if isinstance(prompt, str):
+                prompt_dict["prompt"] = prompt
+            elif isinstance(prompt, list):
+                prompt_dict["prompt_token_ids"] = prompt
+            else:
+                prompt_dict["prompt_embeds"] = prompt
+
+            multi_modal_data = dict[str, Any]()
             if images is not None and (image := images[i]) is not None:
                 multi_modal_data["image"] = image
             if videos is not None and (video := videos[i]) is not None:
@@ -778,17 +784,10 @@ def get_inputs(
             if audios is not None and (audio := audios[i]) is not None:
                 multi_modal_data["audio"] = audio
 
-            text_prompt_kwargs: dict[str, Any] = {
-                "multi_modal_data": multi_modal_data or None
-            }
-            if isinstance(prompt, str):
-                text_prompt_kwargs["prompt"] = prompt
-            elif isinstance(prompt, list):
-                text_prompt_kwargs["prompt_token_ids"] = prompt
-            else:
-                text_prompt_kwargs["prompt_embeds"] = prompt
+            if multi_modal_data:
+                prompt_dict["multi_modal_data"] = multi_modal_data
 
-            inputs.append(TextPrompt(**text_prompt_kwargs))
+            inputs.append(prompt_dict)
 
         return inputs
 
diff --git a/tests/test_inputs.py b/tests/test_inputs.py
index 10a18e2d871f..02cd10379574 100644
--- a/tests/test_inputs.py
+++ b/tests/test_inputs.py
@@ -3,8 +3,11 @@
 
 import pytest
 
+from vllm.config import ModelConfig
 from vllm.inputs import zip_enc_dec_prompts
 from vllm.inputs.parse import parse_raw_prompts
+from vllm.inputs.preprocess import InputPreprocessor
+from vllm.transformers_utils.tokenizer import init_tokenizer_from_configs
 
 pytestmark = pytest.mark.cpu_test
 
@@ -80,3 +83,50 @@ def test_zip_enc_dec_prompts(mm_processor_kwargs, expected_mm_kwargs):
         assert zipped['encoder_prompt'] == enc
         assert zipped['decoder_prompt'] == dec
         assert zipped['mm_processor_kwargs'] == exp_kwargs
+
+
+@pytest.mark.parametrize("model_id", [
+    "facebook/opt-125m",
+])
+@pytest.mark.parametrize("prompt", [
+    {
+        "prompt": "",
+        "multi_modal_data": {
+            "dummy": []
+        },
+    },
+    {
+        "prompt_token_ids": [],
+        "multi_modal_data": {
+            "dummy": []
+        },
+    },
+])
+def test_preprocessor_text_no_mm_inputs(model_id, prompt):
+    model_config = ModelConfig(model=model_id)
+    tokenizer = init_tokenizer_from_configs(model_config)
+    input_preprocessor = InputPreprocessor(model_config, tokenizer)
+
+    with pytest.raises(ValueError, match="does not support multimodal inputs"):
+        input_preprocessor.preprocess(prompt)
+
+
+@pytest.mark.parametrize("model_id", [
+    "facebook/chameleon-7b",
+])
+@pytest.mark.parametrize("prompt", [
+    "",
+    {
+        "prompt_token_ids": []
+    },
+])
+def test_preprocessor_always_mm_code_path(model_id, prompt):
+    model_config = ModelConfig(model=model_id)
+    tokenizer = init_tokenizer_from_configs(model_config)
+    input_preprocessor = InputPreprocessor(model_config, tokenizer)
+
+    # HF processor adds sep token
+    sep_token_id = tokenizer.vocab[tokenizer.sep_token]
+
+    processed_inputs = input_preprocessor.preprocess(prompt)
+    assert sep_token_id in processed_inputs["prompt_token_ids"]
diff --git a/vllm/inputs/preprocess.py b/vllm/inputs/preprocess.py
index 65460b46cb5a..c82daf39be7a 100644
--- a/vllm/inputs/preprocess.py
+++ b/vllm/inputs/preprocess.py
@@ -314,15 +314,19 @@ def _process_tokens(
             parsed_content["prompt_token_ids"], tokenization_kwargs)
 
         inputs: Union[TokenInputs, MultiModalInputs]
-        if multi_modal_data := parsed_content.get("multi_modal_data"):
+        if self.model_config.is_multimodal_model:
             inputs = self._process_multimodal(
                 prompt_token_ids,
-                multi_modal_data,
+                parsed_content.get("multi_modal_data", {}),
                 parsed_content.get("mm_processor_kwargs"),
                 tokenization_kwargs=tokenization_kwargs,
                 mm_uuids=mm_uuids,
             )
         else:
+            if parsed_content.get("multi_modal_data"):
+                raise ValueError(
+                    "This model does not support multimodal inputs")
+
             inputs = token_inputs(prompt_token_ids)
 
         if cache_salt := parsed_content.get("cache_salt"):
@@ -340,15 +344,19 @@ def _process_text(
         prompt_text = parsed_content["prompt"]
 
         inputs: Union[TokenInputs, MultiModalInputs]
-        if multi_modal_data := parsed_content.get("multi_modal_data"):
+        if self.model_config.is_multimodal_model:
             inputs = self._process_multimodal(
                 prompt_text,
-                multi_modal_data,
+                parsed_content.get("multi_modal_data", {}),
                 parsed_content.get("mm_processor_kwargs"),
                 tokenization_kwargs=tokenization_kwargs,
                 mm_uuids=mm_uuids,
             )
         else:
+            if parsed_content.get("multi_modal_data"):
+                raise ValueError(
+                    "This model does not support multimodal inputs")
+
             prompt_token_ids = self._tokenize_prompt(
                 prompt_text,
                 tokenization_kwargs=tokenization_kwargs,
diff --git a/vllm/model_executor/models/phi3v.py b/vllm/model_executor/models/phi3v.py
index 2415f3696f00..df5f0f0039d3 100644
--- a/vllm/model_executor/models/phi3v.py
+++ b/vllm/model_executor/models/phi3v.py
@@ -507,8 +507,8 @@ def _apply_prompt_updates(
         )
 
         # Keep the behavior in line with HF processor
-        if token_ids[:2] == tokenizer.encode("<s> <|image|>",
-                                             add_special_tokens=False):
+        if len(mm_prompt_updates) and (token_ids[:2] == tokenizer.encode(
+                "<s> <|image|>", add_special_tokens=False)):
             token_ids = [token_ids[0], *token_ids[2:]]
             placeholders = {
                 modality: [
diff --git a/vllm/model_executor/models/qwen2_5_omni_thinker.py b/vllm/model_executor/models/qwen2_5_omni_thinker.py
index b5c2aee7f231..219769b07b08 100644
--- a/vllm/model_executor/models/qwen2_5_omni_thinker.py
+++ b/vllm/model_executor/models/qwen2_5_omni_thinker.py
@@ -331,6 +331,7 @@ def _maybe_apply_prompt_updates(
         """
         mm_item_counts = mm_items.get_all_counts()
         self._validate_mm_kwargs(mm_kwargs, mm_item_counts)
+        self._validate_mm_updates(mm_prompt_updates, mm_item_counts)
 
         use_audio_in_video = False
         if "video" in mm_kwargs:
diff --git a/vllm/multimodal/processing.py b/vllm/multimodal/processing.py
index bc998dc2785f..21fa467b3331 100644
--- a/vllm/multimodal/processing.py
+++ b/vllm/multimodal/processing.py
@@ -1946,18 +1946,15 @@ def _validate_mm_kwargs(
                     "model (usually arising from an inconsistency between "
                     "`_call_hf_processor` and `_get_mm_fields_config`).")
 
-    def _validate_mm_placeholders(
+    def _validate_mm_updates(
         self,
-        mm_placeholders: Mapping[str, list[PlaceholderFeaturesInfo]],
+        mm_updates: MultiModalPromptUpdates,
         mm_item_counts: Mapping[str, int],
     ) -> None:
         for modality, item_count in mm_item_counts.items():
-            placeholders = mm_placeholders.get(modality, [])
+            placeholders = mm_updates.get(modality, [])
 
             if len(placeholders) != item_count:
-                # NOTE: If you are a model developer, this can also arise from
-                # an inconsistency between `_call_hf_processor` and
-                # `_get_mm_fields_config` implementations
                 raise RuntimeError(
                     f"Expected there to be {item_count} prompt updates "
                     f"corresponding to {item_count} {modality} items, but "
@@ -1967,6 +1964,22 @@ def _validate_mm_placeholders(
                     "in the prompt. If the model has a chat template, make "
                     "sure you have applied it before calling `LLM.generate`.")
 
+    def _validate_mm_placeholders(
+        self,
+        mm_placeholders: Mapping[str, list[PlaceholderFeaturesInfo]],
+        mm_item_counts: Mapping[str, int],
+    ) -> None:
+        for modality, item_count in mm_item_counts.items():
+            placeholders = mm_placeholders.get(modality, [])
+
+            if len(placeholders) != item_count:
+                raise RuntimeError(
+                    f"Expected there to be {item_count} prompt placeholders "
+                    f"corresponding to {item_count} {modality} items, but "
+                    f"instead found {len(placeholders)} prompt placeholders! "
+                    "Make sure the implementation of `_call_hf_processor` and "
+                    "`_get_mm_fields_config` are consistent with each other.")
+
     def _maybe_apply_prompt_updates(
         self,
         mm_items: MultiModalDataItems,
@@ -1977,6 +1990,7 @@ def _maybe_apply_prompt_updates(
     ) -> tuple[list[int], Mapping[str, list[PlaceholderFeaturesInfo]]]:
         mm_item_counts = mm_items.get_all_counts()
         self._validate_mm_kwargs(mm_kwargs, mm_item_counts)
+        self._validate_mm_updates(mm_prompt_updates, mm_item_counts)
 
         if is_update_applied:
             mm_placeholders = self._find_mm_placeholders(

From 318f3eb1425986731d9ee1ecf51d1580893b0857 Mon Sep 17 00:00:00 2001
From: ihb2032 <40718643+ihb2032@users.noreply.github.com>
Date: Sun, 5 Oct 2025 18:36:54 +0800
Subject: [PATCH 182/193] [Bugfix][Hardware][RISC-V] Limit supported dtypes to
 float32 to avoid scheduler segfault (#26228)

Signed-off-by: lyd1992 <liuyudong@iscas.ac.cn>
Signed-off-by: ihb2032 <1355790728@qq.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/platforms/cpu.py | 25 +++++++++++++++++++++++++
 1 file changed, 25 insertions(+)

diff --git a/vllm/platforms/cpu.py b/vllm/platforms/cpu.py
index 436e295e58e6..4f96cf93aad7 100644
--- a/vllm/platforms/cpu.py
+++ b/vllm/platforms/cpu.py
@@ -84,6 +84,31 @@ def supported_dtypes(self) -> list[torch.dtype]:
                     shell=True).strip() == b"1"):
                 return [torch.bfloat16, torch.float16, torch.float32]
             return [torch.float16, torch.float32]
+        elif self.get_cpu_architecture() == CpuArchEnum.RISCV:
+            # Workaround for Issue #25655: RISC-V scheduler bug with float16
+            #
+            # Background:
+            # - RISC-V currently uses scalar code path
+            # - There is a latent bug in the vLLM scheduler that provides
+            # invalid
+            #   physical_block_idx values under certain conditions
+            # - This bug causes segmentation faults when using float16
+            # dtype on RISC-V
+            # - Testing shows that forcing float32 successfully bypasses
+            # this issue
+            #
+            # Technical details:
+            # - The bug manifests as out-of-bounds physical_block_idx in
+            # block_tables
+            # - Only occurs on RISC-V hardware
+            # tested on Sophgo SG2044
+            # - Does not reproduce on x86 or other architectures
+            # - Root cause is in Python-level scheduling logic,
+            # not C++ kernels
+            #
+            # This is a temporary workaround until the scheduler bug is fixed.
+            # See: https://github.com/vllm-project/vllm/issues/25655
+            return [torch.float32]
         # x86/aarch64 CPU has supported both bf16 and fp16 natively.
         return [torch.bfloat16, torch.float16, torch.float32]
 

From 652a3593ef5d9b9c13eb58259ec0d3db3b654393 Mon Sep 17 00:00:00 2001
From: Hank_ <37239608+ILikeIneine@users.noreply.github.com>
Date: Sun, 5 Oct 2025 19:25:15 +0800
Subject: [PATCH 183/193] [Platform][Kernel] platform-specific kernel loading
 (#25823)

Signed-off-by: Hank <hcc.mayday@gmail.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 vllm/_custom_ops.py         | 13 ++-----------
 vllm/platforms/interface.py | 17 +++++++++++++++++
 vllm/platforms/tpu.py       |  4 ++++
 vllm/platforms/xpu.py       |  4 ++++
 4 files changed, 27 insertions(+), 11 deletions(-)

diff --git a/vllm/_custom_ops.py b/vllm/_custom_ops.py
index 84d96ee3a84d..0a83faba513f 100644
--- a/vllm/_custom_ops.py
+++ b/vllm/_custom_ops.py
@@ -1,7 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-import contextlib
 from typing import TYPE_CHECKING, Optional, Union
 
 import torch
@@ -13,16 +12,8 @@
 
 logger = init_logger(__name__)
 
-if not current_platform.is_tpu() and not current_platform.is_xpu():
-    try:
-        import vllm._C
-    except ImportError as e:
-        logger.warning("Failed to import from vllm._C with %r", e)
-
-supports_moe_ops = False
-with contextlib.suppress(ImportError):
-    import vllm._moe_C  # noqa: F401
-    supports_moe_ops = True
+current_platform.import_core_kernels()
+supports_moe_ops = current_platform.try_import_moe_kernels()
 
 if TYPE_CHECKING:
 
diff --git a/vllm/platforms/interface.py b/vllm/platforms/interface.py
index df1395fa842a..dd51030e4d5c 100644
--- a/vllm/platforms/interface.py
+++ b/vllm/platforms/interface.py
@@ -1,5 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import contextlib
 import enum
 import os
 import platform
@@ -163,6 +164,22 @@ def device_id_to_physical_device_id(cls, device_id: int):
         else:
             return device_id
 
+    @classmethod
+    def import_core_kernels(cls) -> None:
+        """ Import any platform-specific C kernels. """
+        try:
+            import vllm._C  # noqa: F401
+        except ImportError as e:
+            logger.warning("Failed to import from vllm._C: %r", e)
+
+    @classmethod
+    def try_import_moe_kernels(cls) -> bool:
+        """ Import any platform-specific MoE kernels. """
+        with contextlib.suppress(ImportError):
+            import vllm._moe_C  # noqa: F401
+            return True
+        return False
+
     @classmethod
     def get_vit_attn_backend(cls, head_size: int,
                              dtype: torch.dtype) -> "_Backend":
diff --git a/vllm/platforms/tpu.py b/vllm/platforms/tpu.py
index 91a01a4f4ee9..34b7dedbecc7 100644
--- a/vllm/platforms/tpu.py
+++ b/vllm/platforms/tpu.py
@@ -47,6 +47,10 @@ class TpuPlatform(Platform):
         "TPU_CHIPS_PER_HOST_BOUNDS", "TPU_HOST_BOUNDS"
     ]
 
+    @classmethod
+    def import_core_kernels(cls) -> None:
+        pass
+
     @classmethod
     def get_attn_backend_cls(cls, selected_backend: "_Backend", head_size: int,
                              dtype: torch.dtype, kv_cache_dtype: Optional[str],
diff --git a/vllm/platforms/xpu.py b/vllm/platforms/xpu.py
index 3ccbae58726f..3efd498cf58e 100644
--- a/vllm/platforms/xpu.py
+++ b/vllm/platforms/xpu.py
@@ -34,6 +34,10 @@ class XPUPlatform(Platform):
     dist_backend: str = "ccl"  # ccl | xccl
     device_control_env_var: str = "ZE_AFFINITY_MASK"
 
+    @classmethod
+    def import_core_kernels(cls) -> None:
+        pass
+
     @classmethod
     def get_attn_backend_cls(cls, selected_backend: "_Backend", head_size: int,
                              dtype: torch.dtype, kv_cache_dtype: Optional[str],

From 1b2424fcd50d2965d2f6496705bddaa77a09632a Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Sun, 5 Oct 2025 15:06:22 +0100
Subject: [PATCH 184/193] Convert formatting to use `ruff` instead of `yapf` +
 `isort` (#26247)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
---
 .buildkite/pyproject.toml                     |   46 -
 .pre-commit-config.yaml                       |   12 -
 benchmarks/benchmark_block_pool.py            |    2 +-
 benchmarks/benchmark_ngram_proposer.py        |    2 +-
 .../benchmark_serving_structured_output.py    |    5 +-
 benchmarks/pyproject.toml                     |   49 -
 cmake/hipify.py                               |   43 +-
 .../vllm_cutlass_library_extension.py         |   28 +-
 csrc/moe/marlin_moe_wna16/generate_kernels.py |   42 +-
 .../gptq_marlin/generate_kernels.py           |   48 +-
 csrc/quantization/machete/generate.py         |  166 +-
 docs/mkdocs/hooks/generate_argparse.py        |   63 +-
 docs/mkdocs/hooks/generate_examples.py        |   34 +-
 docs/mkdocs/hooks/remove_announcement.py      |    2 +-
 docs/mkdocs/hooks/url_schemes.py              |   15 +-
 examples/pyproject.toml                       |   54 -
 pyproject.toml                                |  127 +-
 setup.py                                      |  255 ++-
 .../test_basic_correctness.py                 |  122 +-
 tests/basic_correctness/test_cpu_offload.py   |    5 +-
 tests/basic_correctness/test_cumem.py         |   23 +-
 tests/benchmarks/test_latency_cli.py          |   14 +-
 tests/benchmarks/test_random_dataset.py       |  121 +-
 tests/benchmarks/test_serve_cli.py            |    5 +-
 tests/benchmarks/test_throughput_cli.py       |   14 +-
 tests/compile/backend.py                      |   18 +-
 .../compile/piecewise/test_full_cudagraph.py  |   82 +-
 .../compile/piecewise/test_multiple_graphs.py |  238 +-
 tests/compile/piecewise/test_simple.py        |  103 +-
 tests/compile/piecewise/test_toy_llama.py     |  323 +--
 tests/compile/silly_attention.py              |   12 +-
 tests/compile/test_async_tp.py                |  239 +-
 tests/compile/test_basic_correctness.py       |   28 +-
 tests/compile/test_config.py                  |  172 +-
 tests/compile/test_decorator.py               |  220 +-
 tests/compile/test_full_graph.py              |  134 +-
 tests/compile/test_functionalization.py       |   70 +-
 tests/compile/test_fusion.py                  |   76 +-
 tests/compile/test_fusion_all_reduce.py       |  142 +-
 tests/compile/test_fusion_attn.py             |  420 ++--
 tests/compile/test_noop_elimination.py        |   30 +-
 tests/compile/test_pass_manager.py            |    9 +-
 tests/compile/test_sequence_parallelism.py    |  202 +-
 tests/compile/test_silu_mul_quant_fusion.py   |   84 +-
 tests/compile/test_wrapper.py                 |   13 +-
 tests/config/test_config_generation.py        |   24 +-
 tests/config/test_mp_reducer.py               |   14 +-
 tests/conftest.py                             |  375 +--
 tests/cuda/test_cuda_context.py               |   45 +-
 .../test_disable_detokenization.py            |   20 +-
 tests/detokenizer/test_min_tokens.py          |   38 +-
 tests/detokenizer/test_stop_reason.py         |   37 +-
 ...stop_string_while_stop_model_terminates.py |   23 +-
 tests/detokenizer/test_stop_strings.py        |  100 +-
 tests/distributed/conftest.py                 |    6 +-
 tests/distributed/test_ca_buffer_sharing.py   |    6 +-
 tests/distributed/test_comm_ops.py            |   98 +-
 tests/distributed/test_context_parallel.py    |  106 +-
 tests/distributed/test_custom_all_reduce.py   |   36 +-
 tests/distributed/test_distributed_oot.py     |    3 +-
 tests/distributed/test_eplb_algo.py           |  178 +-
 tests/distributed/test_eplb_execute.py        |  181 +-
 tests/distributed/test_events.py              |   53 +-
 tests/distributed/test_expert_parallel.py     |   57 +-
 tests/distributed/test_expert_placement.py    |  159 +-
 tests/distributed/test_kvlayout.py            |   58 +-
 .../distributed/test_multi_node_assignment.py |   10 +-
 .../test_nccl_symm_mem_allreduce.py           |   56 +-
 tests/distributed/test_node_count.py          |   15 +-
 tests/distributed/test_pipeline_parallel.py   |  130 +-
 tests/distributed/test_pipeline_partition.py  |    4 +-
 tests/distributed/test_pp_cudagraph.py        |   18 +-
 tests/distributed/test_pynccl.py              |  234 +-
 tests/distributed/test_quick_all_reduce.py    |   67 +-
 tests/distributed/test_same_node.py           |    6 +-
 tests/distributed/test_sequence_parallel.py   |  135 +-
 tests/distributed/test_shm_broadcast.py       |   24 +-
 tests/distributed/test_shm_buffer.py          |   34 +-
 tests/distributed/test_shm_storage.py         |   38 +-
 tests/distributed/test_symm_mem_allreduce.py  |  107 +-
 tests/distributed/test_torchrun_example.py    |   30 +-
 .../distributed/test_torchrun_example_moe.py  |   41 +-
 tests/distributed/test_utils.py               |   67 +-
 tests/engine/test_arg_utils.py                |  186 +-
 tests/engine/test_short_mm_context.py         |   21 +-
 tests/entrypoints/conftest.py                 |  144 +-
 tests/entrypoints/llm/test_accuracy.py        |   29 +-
 tests/entrypoints/llm/test_chat.py            |   88 +-
 tests/entrypoints/llm/test_collective_rpc.py  |   12 +-
 tests/entrypoints/llm/test_generate.py        |   15 +-
 tests/entrypoints/llm/test_gpu_utilization.py |    5 +-
 .../entrypoints/llm/test_prompt_validation.py |    4 +-
 .../offline_mode/test_offline_mode.py         |   10 +-
 tests/entrypoints/openai/conftest.py          |    6 +-
 .../openai/correctness/test_lmeval.py         |   28 +-
 .../test_transcription_api_correctness.py     |   59 +-
 .../openai/test_async_tokenization.py         |   28 +-
 tests/entrypoints/openai/test_audio.py        |  274 ++-
 tests/entrypoints/openai/test_basic.py        |   58 +-
 tests/entrypoints/openai/test_chat.py         |  690 +++---
 tests/entrypoints/openai/test_chat_echo.py    |   45 +-
 .../openai/test_chat_logit_bias_validation.py |   10 +-
 .../entrypoints/openai/test_chat_template.py  |   77 +-
 .../openai/test_chat_with_tool_reasoning.py   |  101 +-
 .../entrypoints/openai/test_chunked_prompt.py |   27 +-
 tests/entrypoints/openai/test_cli_args.py     |  159 +-
 .../entrypoints/openai/test_collective_rpc.py |   30 +-
 .../test_completion_with_function_calling.py  |  169 +-
 .../test_completion_with_prompt_embeds.py     |   83 +-
 .../openai/test_default_mm_loras.py           |   45 +-
 .../entrypoints/openai/test_lora_adapters.py  |  170 +-
 .../entrypoints/openai/test_lora_resolvers.py |   66 +-
 tests/entrypoints/openai/test_metrics.py      |  185 +-
 tests/entrypoints/openai/test_models.py       |    3 +-
 .../openai/test_oot_registration.py           |   11 +-
 .../entrypoints/openai/test_openai_schema.py  |   32 +-
 .../openai/test_optional_middleware.py        |   12 +-
 .../openai/test_prompt_validation.py          |   49 +-
 .../openai/test_response_api_mcp_tools.py     |   58 +-
 .../openai/test_response_api_with_harmony.py  |  277 +--
 .../openai/test_return_token_ids.py           |  125 +-
 .../openai/test_return_tokens_as_ids.py       |   30 +-
 tests/entrypoints/openai/test_root_path.py    |   37 +-
 tests/entrypoints/openai/test_run_batch.py    |  124 +-
 tests/entrypoints/openai/test_serving_chat.py |  237 +-
 .../entrypoints/openai/test_serving_engine.py |   12 +-
 .../entrypoints/openai/test_serving_models.py |   59 +-
 .../openai/test_serving_responses.py          |   43 +-
 tests/entrypoints/openai/test_shutdown.py     |    9 +-
 .../entrypoints/openai/test_skip_tokenizer.py |   44 +-
 tests/entrypoints/openai/test_sleep.py        |   27 +-
 .../openai/test_tensorizer_entrypoint.py      |   29 +-
 .../openai/test_token_in_token_out.py         |   15 +-
 tests/entrypoints/openai/test_tokenization.py |  166 +-
 .../openai/test_transcription_validation.py   |  117 +-
 .../openai/test_translation_validation.py     |   59 +-
 tests/entrypoints/openai/test_video.py        |  276 ++-
 tests/entrypoints/openai/test_vision.py       |  369 ++-
 .../tool_parsers/test_hermes_tool_parser.py   |  125 +-
 .../test_hunyuan_a13b_tool_parser.py          |  190 +-
 .../test_llama3_json_tool_parser.py           |   24 +-
 .../test_llama4_pythonic_tool_parser.py       |  249 +-
 .../tool_parsers/test_pythonic_tool_parser.py |  189 +-
 .../entrypoints/openai/tool_parsers/utils.py  |   92 +-
 .../pooling/correctness/test_mteb_embed.py    |   12 +-
 .../pooling/correctness/test_mteb_score.py    |   20 +-
 .../entrypoints/pooling/llm/test_classify.py  |   37 +-
 .../entrypoints/pooling/llm/test_embedding.py |   35 +-
 tests/entrypoints/pooling/llm/test_encode.py  |   14 +-
 tests/entrypoints/pooling/llm/test_reward.py  |   37 +-
 tests/entrypoints/pooling/llm/test_score.py   |   35 +-
 .../pooling/openai/test_classification.py     |  111 +-
 .../pooling/openai/test_embedding.py          |  251 +-
 .../openai/test_embedding_dimensions.py       |   36 +-
 .../openai/test_embedding_long_text.py        |  100 +-
 .../pooling/openai/test_pooling.py            |  175 +-
 .../entrypoints/pooling/openai/test_rerank.py |  105 +-
 .../entrypoints/pooling/openai/test_score.py  |  186 +-
 .../pooling/openai/test_truncation.py         |   28 +-
 .../pooling/openai/test_vision_embedding.py   |   48 +-
 .../test_api_server_process_manager.py        |   70 +-
 tests/entrypoints/test_chat_utils.py          | 1885 ++++++---------
 tests/entrypoints/test_context.py             |   94 +-
 tests/entrypoints/test_renderer.py            |  124 +-
 tests/entrypoints/test_ssl_cert_refresher.py  |    3 +-
 tests/evals/gpt_oss/__init__.py               |    2 +-
 tests/evals/gpt_oss/conftest.py               |   14 +-
 tests/evals/gpt_oss/test_gpqa_correctness.py  |   41 +-
 tests/evals/gsm8k/__init__.py                 |    2 +-
 tests/evals/gsm8k/conftest.py                 |   25 +-
 tests/evals/gsm8k/gsm8k_eval.py               |  101 +-
 tests/evals/gsm8k/test_gsm8k_correctness.py   |    9 +-
 tests/kernels/allclose_default.py             |    6 +-
 tests/kernels/attention/conftest.py           |    3 +-
 .../attention/test_aiter_flash_attn.py        |   63 +-
 tests/kernels/attention/test_attention.py     |  189 +-
 .../attention/test_attention_selector.py      |  189 +-
 tests/kernels/attention/test_cache.py         |  543 +++--
 .../attention/test_cascade_flash_attn.py      |   62 +-
 .../attention/test_cutlass_mla_decode.py      |  118 +-
 .../attention/test_deepgemm_attention.py      |  133 +-
 tests/kernels/attention/test_flash_attn.py    |  132 +-
 tests/kernels/attention/test_flashinfer.py    |  248 +-
 .../attention/test_flashinfer_mla_decode.py   |   41 +-
 .../test_flashinfer_trtllm_attention.py       |  198 +-
 tests/kernels/attention/test_flashmla.py      |  116 +-
 .../kernels/attention/test_flashmla_sparse.py |   82 +-
 .../kernels/attention/test_lightning_attn.py  |  100 +-
 .../attention/test_merge_attn_states.py       |  218 +-
 tests/kernels/attention/test_mha_attn.py      |   80 +-
 .../kernels/attention/test_mla_decode_cpu.py  |   34 +-
 .../attention/test_pack_unpack_triton.py      |   35 +-
 .../kernels/attention/test_prefix_prefill.py  |  394 ++--
 .../attention/test_rocm_attention_selector.py |   37 +-
 .../attention/test_triton_decode_attention.py |   12 +-
 .../test_triton_unified_attention.py          |   62 +-
 tests/kernels/core/test_activation.py         |   57 +-
 .../core/test_fused_quant_layernorm.py        |  116 +-
 tests/kernels/core/test_layernorm.py          |   75 +-
 tests/kernels/core/test_mrope.py              |  154 +-
 tests/kernels/core/test_permute_cols.py       |    6 +-
 tests/kernels/core/test_pos_encoding.py       |  113 +-
 tests/kernels/core/test_rotary_embedding.py   |   56 +-
 tests/kernels/core/test_uva.py                |   18 +-
 tests/kernels/mamba/test_causal_conv1d.py     |  260 ++-
 tests/kernels/mamba/test_mamba_mixer2.py      |   84 +-
 tests/kernels/mamba/test_mamba_ssm.py         |  598 ++---
 tests/kernels/mamba/test_mamba_ssm_ssd.py     |  293 +--
 .../moe/modular_kernel_tools/cli_args.py      |   95 +-
 .../moe/modular_kernel_tools/common.py        |  314 +--
 .../make_feature_matrix.py                    |  127 +-
 .../moe/modular_kernel_tools/mk_objects.py    |  166 +-
 .../modular_kernel_tools/parallel_utils.py    |   28 +-
 .../profile_modular_kernel.py                 |   51 +-
 tests/kernels/moe/parallel_utils.py           |  105 +-
 tests/kernels/moe/test_batched_deepgemm.py    |   21 +-
 tests/kernels/moe/test_batched_moe.py         |   99 +-
 tests/kernels/moe/test_block_fp8.py           |   87 +-
 tests/kernels/moe/test_block_int8.py          |   57 +-
 .../moe/test_count_expert_num_tokens.py       |  111 +-
 .../kernels/moe/test_cutlass_grouped_gemm.py  |   44 +-
 tests/kernels/moe/test_cutlass_moe.py         |  365 +--
 tests/kernels/moe/test_deepep_deepgemm_moe.py |  315 +--
 tests/kernels/moe/test_deepep_moe.py          |  259 ++-
 tests/kernels/moe/test_deepgemm.py            |   74 +-
 tests/kernels/moe/test_flashinfer.py          |   64 +-
 tests/kernels/moe/test_flashinfer_moe.py      |   82 +-
 .../moe/test_gpt_oss_triton_kernels.py        |   73 +-
 tests/kernels/moe/test_grouped_topk.py        |   65 +-
 .../moe/test_modular_kernel_combinations.py   |  119 +-
 tests/kernels/moe/test_moe.py                 |  455 ++--
 .../kernels/moe/test_moe_align_block_size.py  |  205 +-
 .../kernels/moe/test_moe_permute_unpermute.py |  325 +--
 tests/kernels/moe/test_mxfp4_moe.py           |  676 +++---
 tests/kernels/moe/test_nvfp4_moe.py           |  105 +-
 tests/kernels/moe/test_pplx_cutlass_moe.py    |  196 +-
 tests/kernels/moe/test_pplx_moe.py            |  332 +--
 tests/kernels/moe/test_rocm_aiter_topk.py     |  199 +-
 .../moe/test_silu_mul_fp8_quant_deep_gemm.py  |   33 +-
 tests/kernels/moe/test_triton_moe_ptpc_fp8.py |   45 +-
 tests/kernels/moe/utils.py                    |  215 +-
 tests/kernels/quant_utils.py                  |  156 +-
 tests/kernels/quantization/nvfp4_utils.py     |   19 +-
 .../quantization/test_allspark_gemm.py        |   78 +-
 tests/kernels/quantization/test_awq.py        |   50 +-
 tests/kernels/quantization/test_awq_triton.py |  105 +-
 tests/kernels/quantization/test_block_fp8.py  |   92 +-
 tests/kernels/quantization/test_block_int8.py |   21 +-
 .../quantization/test_cutlass_2of4_sparse.py  |  177 +-
 .../quantization/test_cutlass_scaled_mm.py    |  587 ++---
 .../kernels/quantization/test_cutlass_w4a8.py |  168 +-
 .../test_flashinfer_nvfp4_scaled_mm.py        |   60 +-
 .../quantization/test_flashinfer_scaled_mm.py |    5 +-
 tests/kernels/quantization/test_fp8_quant.py  |   79 +-
 .../quantization/test_fp8_quant_group.py      |   94 +-
 tests/kernels/quantization/test_ggml.py       |   51 +-
 tests/kernels/quantization/test_gguf.py       |  108 +-
 tests/kernels/quantization/test_gptq.py       |   27 +-
 tests/kernels/quantization/test_hadacore.py   |    3 +-
 .../kernels/quantization/test_int8_kernel.py  |   52 +-
 tests/kernels/quantization/test_int8_quant.py |   96 +-
 tests/kernels/quantization/test_machete_mm.py |  258 ++-
 .../kernels/quantization/test_marlin_gemm.py  |  285 ++-
 .../kernels/quantization/test_nvfp4_quant.py  |   44 +-
 .../quantization/test_nvfp4_scaled_mm.py      |   85 +-
 .../test_per_token_group_quant.py             |   11 +-
 .../quantization/test_rocm_skinny_gemms.py    |   67 +-
 .../quantization/test_silu_mul_nvfp4_quant.py |   51 +-
 .../quantization/test_triton_scaled_mm.py     |   55 +-
 .../test_apply_repetition_penalties.py        |   64 +-
 tests/kernels/test_flex_attention.py          |  114 +-
 tests/kernels/test_fused_quant_activation.py  |   20 +-
 tests/kernels/test_onednn.py                  |   66 +-
 tests/kernels/test_shuffle_rows.py            |   88 +-
 tests/kernels/test_triton_flash_attention.py  |  530 ++---
 tests/kernels/utils.py                        |  690 +++---
 tests/kv_transfer/test_lookup_buffer.py       |   23 +-
 tests/kv_transfer/test_module.py              |   25 +-
 tests/kv_transfer/test_send_recv.py           |   30 +-
 tests/lora/conftest.py                        |  119 +-
 tests/lora/test_add_lora.py                   |   47 +-
 tests/lora/test_chatglm3_tp.py                |   68 +-
 tests/lora/test_default_mm_loras.py           |   13 +-
 tests/lora/test_layers.py                     |  806 ++++---
 tests/lora/test_llama_tp.py                   |  139 +-
 tests/lora/test_llm_with_multi_loras.py       |   26 +-
 tests/lora/test_lora_checkpoints.py           |   42 +-
 tests/lora/test_lora_functions.py             |   44 +-
 tests/lora/test_lora_huggingface.py           |   11 +-
 tests/lora/test_lora_manager.py               |  445 ++--
 tests/lora/test_minicpmv_tp.py                |   53 +-
 tests/lora/test_mixtral.py                    |   29 +-
 tests/lora/test_peft_helper.py                |   27 +-
 tests/lora/test_punica_ops.py                 |  236 +-
 tests/lora/test_quant_model.py                |   68 +-
 tests/lora/test_qwen2vl.py                    |  127 +-
 tests/lora/test_resolver.py                   |   11 +-
 tests/lora/test_transformers_model.py         |   76 +-
 tests/lora/test_utils.py                      |  115 +-
 tests/lora/test_worker.py                     |   37 +-
 tests/lora/utils.py                           |  100 +-
 .../test_weight_utils.py                      |   26 +-
 .../runai_model_streamer/test_runai_utils.py  |   27 +-
 .../runai_model_streamer/test_weight_utils.py |   15 +-
 .../tensorizer_loader/conftest.py             |   21 +-
 .../tensorizer_loader/test_tensorizer.py      |  244 +-
 .../model_loader/test_registry.py             |    7 +-
 .../model_loader/test_sharded_state_loader.py |   82 +-
 .../model_executor/test_enabled_custom_ops.py |   85 +-
 .../test_model_load_with_params.py            |   70 +-
 tests/model_executor/test_weight_utils.py     |   39 +-
 .../models/language/generation/test_common.py |   69 +-
 .../models/language/generation/test_gemma.py  |   12 +-
 .../language/generation/test_granite.py       |    6 +-
 .../models/language/generation/test_hybrid.py |  359 +--
 .../language/generation/test_mistral.py       |  291 ++-
 .../models/language/generation/test_phimoe.py |   78 +-
 .../language/generation_ppl_test/ppl_utils.py |   65 +-
 tests/models/language/pooling/embed_utils.py  |   31 +-
 .../pooling/test_auto_prefix_cache_support.py |   49 +-
 .../language/pooling/test_classification.py   |   27 +-
 .../models/language/pooling/test_embedding.py |   36 +-
 tests/models/language/pooling/test_gritlm.py  |   20 +-
 .../pooling/test_mm_classifier_conversion.py  |  117 +-
 .../test_multilabel_classification_support.py |   11 +-
 .../pooling/test_nomic_max_model_len.py       |   83 +-
 .../test_pooler_config_init_behaviour.py      |   96 +-
 tests/models/language/pooling/test_reward.py  |   27 +-
 tests/models/language/pooling/test_scoring.py |   69 +-
 .../pooling/test_token_classification.py      |    6 +-
 .../pooling/test_truncation_control.py        |   52 +-
 .../language/pooling_mteb_test/mteb_utils.py  |  198 +-
 .../language/pooling_mteb_test/test_baai.py   |  143 +-
 .../test_bge_reranker_v2_gemma.py             |   82 +-
 .../pooling_mteb_test/test_cross_encoder.py   |   28 +-
 .../language/pooling_mteb_test/test_gte.py    |  150 +-
 .../pooling_mteb_test/test_intfloat.py        |   69 +-
 .../language/pooling_mteb_test/test_jina.py   |   86 +-
 .../pooling_mteb_test/test_mxbai_rerank.py    |   57 +-
 .../language/pooling_mteb_test/test_nomic.py  |   49 +-
 .../pooling_mteb_test/test_qwen3_reranker.py  |   67 +-
 .../test_snowflake_arctic_embed.py            |  105 +-
 .../pooling_mteb_test/test_st_projector.py    |   21 +-
 .../multimodal/generation/test_common.py      |   67 +-
 .../generation/test_granite_speech.py         |   73 +-
 .../multimodal/generation/test_interleaved.py |   38 +-
 .../multimodal/generation/test_maverick.py    |  318 +--
 .../generation/test_phi4_multimodal.py        |  155 +-
 .../multimodal/generation/test_phi4mm.py      |  177 +-
 .../multimodal/generation/test_pixtral.py     |  111 +-
 .../multimodal/generation/test_qwen2_5_vl.py  |   92 +-
 .../multimodal/generation/test_qwen2_vl.py    |  279 ++-
 .../multimodal/generation/test_ultravox.py    |  146 +-
 .../multimodal/generation/test_voxtral.py     |   70 +-
 .../multimodal/generation/test_whisper.py     |   30 +-
 .../generation/vlm_utils/builders.py          |  168 +-
 .../generation/vlm_utils/case_filtering.py    |   94 +-
 .../multimodal/generation/vlm_utils/core.py   |   66 +-
 .../generation/vlm_utils/custom_inputs.py     |   36 +-
 .../generation/vlm_utils/model_utils.py       |  293 +--
 .../generation/vlm_utils/runners.py           |   99 +-
 .../multimodal/generation/vlm_utils/types.py  |   25 +-
 tests/models/multimodal/pooling/test_clip.py  |   35 +-
 .../multimodal/pooling/test_dse_qwen2_vl.py   |  117 +-
 .../multimodal/pooling/test_intern_vit.py     |   26 +-
 .../pooling/test_jinavl_reranker.py           |   78 +-
 .../multimodal/pooling/test_llava_next.py     |   53 +-
 tests/models/multimodal/pooling/test_phi3v.py |   47 +-
 .../multimodal/pooling/test_prithvi_mae.py    |   22 +-
 tests/models/multimodal/pooling/test_radio.py |   29 +-
 .../multimodal/processing/test_common.py      |   92 +-
 .../multimodal/processing/test_glm4_1v.py     |   29 +-
 .../multimodal/processing/test_h2ovl.py       |   29 +-
 .../multimodal/processing/test_idefics3.py    |   14 +-
 .../multimodal/processing/test_internvl.py    |   16 +-
 .../multimodal/processing/test_llama4.py      |   37 +-
 .../multimodal/processing/test_llava_next.py  |   47 +-
 .../processing/test_llava_onevision.py        |   56 +-
 .../processing/test_minimax_vl_01.py          |   26 +-
 .../multimodal/processing/test_mllama4.py     |   21 +-
 .../multimodal/processing/test_nemotron_vl.py |   19 +-
 .../multimodal/processing/test_phi3v.py       |    4 +-
 .../multimodal/processing/test_phi4mm.py      |   10 +-
 .../multimodal/processing/test_qwen2_vl.py    |    9 +-
 .../multimodal/processing/test_smolvlm.py     |   14 +-
 .../processing/test_tensor_schema.py          |  105 +-
 tests/models/multimodal/test_mapping.py       |   10 +-
 tests/models/quantization/test_awq.py         |   85 +-
 tests/models/quantization/test_bitblas.py     |   26 +-
 .../models/quantization/test_bitsandbytes.py  |  260 ++-
 tests/models/quantization/test_fp8.py         |   99 +-
 tests/models/quantization/test_gguf.py        |   72 +-
 .../models/quantization/test_gptq_bitblas.py  |   20 +-
 tests/models/quantization/test_gptq_marlin.py |   50 +-
 .../quantization/test_gptq_marlin_24.py       |   41 +-
 tests/models/quantization/test_modelopt.py    |   37 +-
 tests/models/quantization/test_mxfp4.py       |   21 +-
 tests/models/quantization/test_nvfp4.py       |   43 +-
 tests/models/registry.py                      |   20 +-
 tests/models/test_initialization.py           |   86 +-
 tests/models/test_oot_registration.py         |   41 +-
 tests/models/test_registry.py                 |   63 +-
 tests/models/test_terratorch.py               |   35 +-
 tests/models/test_transformers.py             |  127 +-
 tests/models/test_utils.py                    |   38 +-
 tests/models/test_vision.py                   |  214 +-
 tests/models/utils.py                         |  204 +-
 tests/multimodal/test_audio.py                |   37 +-
 tests/multimodal/test_cache.py                |   42 +-
 tests/multimodal/test_hasher.py               |    6 +-
 tests/multimodal/test_image.py                |   45 +-
 tests/multimodal/test_inputs.py               |   34 +-
 tests/multimodal/test_processing.py           |   22 +-
 tests/multimodal/test_registry.py             |   14 +-
 tests/multimodal/test_utils.py                |   84 +-
 tests/multimodal/test_video.py                |   41 +-
 tests/multimodal/utils.py                     |   15 +-
 .../test_filesystem_resolver.py               |    5 +-
 .../prithvi_io_processor/prithvi_processor.py |  118 +-
 .../prithvi_io_processor/types.py             |    6 +-
 tests/plugins/vllm_add_dummy_model/setup.py   |   15 +-
 .../vllm_add_dummy_model/__init__.py          |    3 +-
 .../my_gemma_embedding.py                     |   25 +-
 .../vllm_add_dummy_model/my_llava.py          |   22 +-
 .../vllm_add_dummy_model/my_opt.py            |    4 +-
 .../plugins/vllm_add_dummy_platform/setup.py  |   16 +-
 .../dummy_attention_backend.py                |    4 +-
 .../dummy_custom_ops.py                       |    3 +-
 .../vllm_add_dummy_platform/dummy_platform.py |   15 +-
 .../test_io_processor_plugins.py              |   32 +-
 tests/plugins_tests/test_platform_plugins.py  |   17 +-
 tests/plugins_tests/test_scheduler_plugins.py |    5 +-
 tests/quantization/reference_mxfp4.py         |  125 +-
 tests/quantization/test_auto_round.py         |   21 +-
 tests/quantization/test_blackwell_moe.py      |   55 +-
 tests/quantization/test_compressed_tensors.py |  284 ++-
 tests/quantization/test_configs.py            |    4 +-
 tests/quantization/test_cpu_offload.py        |  183 +-
 tests/quantization/test_experts_int8.py       |   12 +-
 tests/quantization/test_fp8.py                |  108 +-
 tests/quantization/test_gptq_dynamic.py       |   63 +-
 tests/quantization/test_ipex_quant.py         |   18 +-
 tests/quantization/test_lm_head.py            |   24 +-
 tests/quantization/test_modelopt.py           |   44 +-
 tests/quantization/test_ptpc_fp8.py           |   26 +-
 tests/quantization/test_quark.py              |  101 +-
 .../test_register_quantization_config.py      |   53 +-
 tests/quantization/test_rtn.py                |   10 +-
 tests/quantization/test_torchao.py            |  141 +-
 .../test_base_thinking_reasoning_parser.py    |  104 +-
 .../test_deepseekr1_reasoning_parser.py       |   17 +-
 .../test_glm4_moe_reasoning_parser.py         |   36 +-
 .../test_granite_reasoning_parser.py          |   48 +-
 .../test_hunyuan_reasoning_parser.py          |   35 +-
 .../test_mistral_reasoning_parser.py          |   64 +-
 .../reasoning/test_olmo3_reasoning_parser.py  |   21 +-
 .../reasoning/test_qwen3_reasoning_parser.py  |   14 +-
 .../test_seedoss_reasoning_parser.py          |   45 +-
 tests/reasoning/utils.py                      |   33 +-
 tests/samplers/test_beam_search.py            |   66 +-
 tests/samplers/test_ignore_eos.py             |    6 +-
 tests/samplers/test_no_bad_words.py           |  108 +-
 tests/samplers/test_ranks.py                  |   24 +-
 .../speculators/test_eagle3.py                |   52 +-
 tests/standalone_tests/lazy_imports.py        |    3 +-
 tests/test_config.py                          |  216 +-
 tests/test_embedded_commit.py                 |   16 +-
 tests/test_envs.py                            |  122 +-
 tests/test_inputs.py                          |   27 +-
 tests/test_logger.py                          |   64 +-
 tests/test_outputs.py                         |   16 +-
 tests/test_pooling_params.py                  |   11 +-
 tests/test_regression.py                      |   25 +-
 tests/test_routing_simulator.py               |   41 +-
 tests/test_scalartype.py                      |   33 +-
 tests/test_seed_behavior.py                   |   48 +-
 tests/test_sequence.py                        |   34 +-
 tests/test_triton_utils.py                    |    7 +-
 tests/test_version.py                         |    3 +-
 tests/test_vllm_port.py                       |   13 +-
 tests/tokenization/test_cached_tokenizer.py   |   19 +-
 tests/tokenization/test_detokenize.py         |  135 +-
 tests/tokenization/test_do_lower_case.py      |    2 +-
 tests/tokenization/test_get_eos.py            |    7 +-
 tests/tokenization/test_mistral_tokenizer.py  |  335 +--
 tests/tokenization/test_tokenizer.py          |    2 +-
 tests/tokenization/test_tokenizer_registry.py |   30 +-
 tests/tool_use/conftest.py                    |   30 +-
 tests/tool_use/mistral/conftest.py            |   10 +-
 .../mistral/test_mistral_tool_calls.py        |    6 +-
 tests/tool_use/mistral/utils.py               |   13 +-
 ...est_chat_completion_request_validations.py |  104 +-
 tests/tool_use/test_chat_completions.py       |   38 +-
 .../tool_use/test_deepseekv31_tool_parser.py  |   25 +-
 tests/tool_use/test_glm4_moe_tool_parser.py   |  177 +-
 tests/tool_use/test_jamba_tool_parser.py      |  248 +-
 tests/tool_use/test_kimi_k2_tool_parser.py    |  110 +-
 tests/tool_use/test_minimax_tool_parser.py    |  783 +++----
 tests/tool_use/test_openai_tool_parser.py     |  264 ++-
 tests/tool_use/test_parallel_tool_calls.py    |   73 +-
 tests/tool_use/test_qwen3coder_tool_parser.py |  671 +++---
 tests/tool_use/test_seed_oss_tool_parser.py   |  268 ++-
 tests/tool_use/test_tool_calls.py             |   37 +-
 tests/tool_use/test_tool_choice_required.py   |  348 ++-
 tests/tool_use/test_xlam_tool_parser.py       |  380 +--
 tests/tool_use/utils.py                       |  410 ++--
 tests/tools/test_config_validator.py          |   23 +-
 tests/tpu/lora/test_lora.py                   |   76 +-
 tests/tpu/test_compilation.py                 |   29 +-
 tests/tpu/test_custom_dispatcher.py           |   31 +-
 tests/tpu/test_moe_pallas.py                  |    9 +-
 tests/tpu/test_quantization_accuracy.py       |   14 +-
 .../test_config_parser_registry.py            |   21 +-
 tests/utils.py                                |  695 +++---
 tests/utils_/test_gc_utils.py                 |   68 +-
 tests/utils_/test_tensor_schema.py            |   20 +-
 tests/utils_/test_utils.py                    |  280 ++-
 tests/v1/attention/test_attention_backends.py |  320 +--
 .../test_attention_backends_selection.py      |   49 +-
 .../v1/attention/test_attention_splitting.py  |  106 +-
 .../attention/test_chunked_local_attention.py |   77 +-
 tests/v1/attention/test_mla_backends.py       |  354 +--
 .../v1/attention/test_sparse_mla_backends.py  |  279 ++-
 tests/v1/attention/utils.py                   |  296 +--
 tests/v1/core/test_async_scheduler.py         |   75 +-
 tests/v1/core/test_encoder_cache_manager.py   |   10 +-
 tests/v1/core/test_kv_cache_utils.py          |  788 ++++---
 tests/v1/core/test_kv_sharing.py              |   26 +-
 tests/v1/core/test_prefix_caching.py          |  741 +++---
 tests/v1/core/test_scheduler.py               |  571 ++---
 tests/v1/core/test_scheduler_e2e.py           |   16 +-
 .../core/test_single_type_kv_cache_manager.py |  152 +-
 tests/v1/core/utils.py                        |   78 +-
 tests/v1/cudagraph/test_cudagraph_dispatch.py |  242 +-
 tests/v1/cudagraph/test_cudagraph_mode.py     |   65 +-
 tests/v1/distributed/test_async_llm_dp.py     |   83 +-
 tests/v1/distributed/test_external_lb_dp.py   |  172 +-
 tests/v1/distributed/test_hybrid_lb_dp.py     |  194 +-
 tests/v1/distributed/test_internal_lb_dp.py   |  406 ++--
 tests/v1/e2e/test_cascade_attention.py        |    6 +-
 tests/v1/e2e/test_context_length.py           |    2 +-
 .../v1/e2e/test_correctness_sliding_window.py |   51 +-
 tests/v1/e2e/test_kv_sharing_fast_prefill.py  |   22 +-
 tests/v1/e2e/test_min_tokens.py               |  203 +-
 tests/v1/e2e/test_spec_decode.py              |  165 +-
 tests/v1/engine/conftest.py                   |   34 +-
 tests/v1/engine/test_async_llm.py             |  190 +-
 tests/v1/engine/test_engine_args.py           |   15 +-
 tests/v1/engine/test_engine_core.py           |   96 +-
 tests/v1/engine/test_engine_core_client.py    |  296 ++-
 .../v1/engine/test_fast_incdec_prefix_err.py  |  145 +-
 tests/v1/engine/test_llm_engine.py            |   60 +-
 tests/v1/engine/test_output_processor.py      |  495 ++--
 .../test_processor_multi_modal_uuids.py       |  114 +-
 tests/v1/engine/utils.py                      |   69 +-
 tests/v1/entrypoints/conftest.py              |  114 +-
 .../llm/test_struct_output_generate.py        |  385 ++--
 .../entrypoints/openai/responses/conftest.py  |    6 +-
 .../openai/responses/test_basic.py            |   49 +-
 .../openai/responses/test_image.py            |  120 +-
 .../openai/responses/test_stateful.py         |   18 +-
 .../responses/test_structured_output.py       |   24 +-
 .../openai/test_chat_completion.py            |   82 +-
 .../v1/entrypoints/openai/test_completion.py  |  385 ++--
 .../test_completion_with_image_embeds.py      |   22 +-
 .../openai/test_multi_api_servers.py          |   56 +-
 tests/v1/executor/test_executor.py            |   58 +-
 tests/v1/generation/test_batch_invariance.py  |   45 +-
 .../nixl_integration/test_accuracy.py         |   33 +-
 .../nixl_integration/test_disagg_accuracy.py  |   59 +-
 .../nixl_integration/test_edge_cases.py       |   39 +-
 .../nixl_integration/toy_proxy_server.py      |  166 +-
 .../unit/test_kv_connector_lifecyle.py        |   15 +-
 .../unit/test_kv_load_failure_recovery.py     |  112 +-
 .../kv_connector/unit/test_multi_connector.py |  114 +-
 .../kv_connector/unit/test_nixl_connector.py  |  493 ++--
 .../unit/test_offloading_connector.py         |  245 +-
 .../unit/test_output_aggreagator.py           |   49 +-
 .../unit/test_remote_decode_lifecycle.py      |   77 +-
 .../unit/test_remote_prefill_lifecycle.py     |  200 +-
 .../unit/test_shared_storage_connector.py     |  194 +-
 tests/v1/kv_connector/unit/utils.py           |  131 +-
 tests/v1/kv_offload/test_cpu_gpu.py           |   59 +-
 tests/v1/kv_offload/test_cpu_manager.py       |   79 +-
 tests/v1/kv_offload/test_cpu_offloading.py    |    5 +-
 tests/v1/kv_offload/test_worker.py            |   27 +-
 .../v1/logits_processors/test_correctness.py  |  401 ++--
 .../logits_processors/test_custom_offline.py  |  106 +-
 .../logits_processors/test_custom_online.py   |   43 +-
 tests/v1/logits_processors/utils.py           |   44 +-
 tests/v1/metrics/test_engine_logger_apis.py   |   23 +-
 tests/v1/metrics/test_metrics_reader.py       |   44 +-
 tests/v1/metrics/test_ray_metrics.py          |   48 +-
 tests/v1/metrics/test_stats.py                |   26 +-
 tests/v1/sample/test_logprobs.py              |  206 +-
 tests/v1/sample/test_logprobs_e2e.py          |   29 +-
 tests/v1/sample/test_rejection_sampler.py     |  250 +-
 tests/v1/sample/test_sampler.py               |  190 +-
 tests/v1/sample/test_sampling_params_e2e.py   |   16 +-
 tests/v1/sample/test_topk_topp_sampler.py     |   43 +-
 tests/v1/sample/utils.py                      |   42 +-
 tests/v1/shutdown/test_delete.py              |   48 +-
 tests/v1/shutdown/test_forward_error.py       |   52 +-
 tests/v1/shutdown/test_processor_error.py     |   17 +-
 tests/v1/shutdown/test_startup_error.py       |   45 +-
 tests/v1/spec_decode/test_eagle.py            |  386 ++--
 tests/v1/spec_decode/test_max_len.py          |   16 +-
 tests/v1/spec_decode/test_mtp.py              |  109 +-
 tests/v1/spec_decode/test_ngram.py            |   98 +-
 tests/v1/spec_decode/test_tree_attention.py   |   59 +-
 tests/v1/structured_output/test_utils.py      |  153 +-
 tests/v1/test_oracle.py                       |    1 -
 tests/v1/test_serial_utils.py                 |   75 +-
 tests/v1/tpu/test_basic.py                    |   90 +-
 tests/v1/tpu/test_kv_cache_update_kernel.py   |   70 +-
 tests/v1/tpu/test_mha_attn.py                 |   23 +-
 tests/v1/tpu/test_multimodal.py               |   49 +-
 tests/v1/tpu/test_pallas.py                   |   20 +-
 tests/v1/tpu/test_perf.py                     |   68 +-
 tests/v1/tpu/test_sampler.py                  |   59 +-
 .../v1/tpu/test_spmd_model_weight_loading.py  |   23 +-
 tests/v1/tpu/test_topk_topp_sampler.py        |   82 +-
 tests/v1/tpu/test_tpu_int8.py                 |   35 +-
 tests/v1/tpu/test_tpu_qkv_linear.py           |   13 +-
 tests/v1/tpu/worker/test_tpu_model_runner.py  |  131 +-
 tests/v1/tracing/test_tracing.py              |   85 +-
 tests/v1/utils.py                             |   32 +-
 tests/v1/worker/test_gpu_input_batch.py       |  145 +-
 tests/v1/worker/test_gpu_model_runner.py      |  317 +--
 tests/v1/worker/test_utils.py                 |   54 +-
 .../v1/worker/test_worker_memory_snapshot.py  |   72 +-
 tests/vllm_test_utils/setup.py                |    6 +-
 .../vllm_test_utils/vllm_test_utils/blame.py  |    4 +-
 .../vllm_test_utils/monitor.py                |   27 +-
 tests/weight_loading/test_weight_loading.py   |   32 +-
 tools/check_init_lazy_imports.py              |   58 +-
 tools/check_spdx_header.py                    |    9 +-
 tools/check_triton_import.py                  |   21 +-
 tools/enforce_regex_import.py                 |   26 +-
 tools/generate_cmake_presets.py               |   76 +-
 tools/pre_commit/check_pickle_imports.py      |   70 +-
 tools/pre_commit/mypy.py                      |   15 +-
 .../nsys_profile_tools/gputrc2graph.py        |  297 +--
 tools/profiler/print_layerwise_table.py       |   67 +-
 tools/profiler/visualize_layerwise_profile.py |  432 ++--
 tools/report_build_time_ninja.py              |  117 +-
 tools/validate_config.py                      |   74 +-
 use_existing_torch.py                         |    8 +-
 vllm/__init__.py                              |   21 +-
 vllm/_bc_linter.py                            |   12 +-
 vllm/_custom_ops.py                           | 1927 ++++++++++------
 vllm/_ipex_ops.py                             |  170 +-
 vllm/assets/audio.py                          |    6 +-
 vllm/assets/base.py                           |    6 +-
 vllm/assets/image.py                          |   29 +-
 vllm/assets/video.py                          |   11 +-
 vllm/attention/__init__.py                    |    7 +-
 vllm/attention/backends/abstract.py           |   14 +-
 vllm/attention/backends/utils.py              |    1 +
 vllm/attention/layer.py                       |  284 +--
 .../layers/chunked_local_attention.py         |   71 +-
 vllm/attention/layers/cross_attention.py      |  107 +-
 .../layers/encoder_only_attention.py          |   81 +-
 .../ops/chunked_prefill_paged_decode.py       |  188 +-
 vllm/attention/ops/common.py                  |  201 +-
 vllm/attention/ops/flashmla.py                |  120 +-
 vllm/attention/ops/merge_attn_states.py       |   23 +-
 vllm/attention/ops/paged_attn.py              |   23 +-
 vllm/attention/ops/pallas_kv_cache_update.py  |   28 +-
 vllm/attention/ops/prefix_prefill.py          |  638 +++---
 vllm/attention/ops/rocm_aiter_mla.py          |   82 +-
 vllm/attention/ops/rocm_aiter_paged_attn.py   |   56 +-
 vllm/attention/ops/triton_decode_attention.py |  147 +-
 vllm/attention/ops/triton_flash_attention.py  |  212 +-
 .../attention/ops/triton_merge_attn_states.py |   35 +-
 .../ops/triton_reshape_and_cache_flash.py     |   60 +-
 .../attention/ops/triton_unified_attention.py |  479 ++--
 vllm/attention/selector.py                    |   78 +-
 vllm/attention/utils/fa_utils.py              |   46 +-
 vllm/attention/utils/kv_sharing_utils.py      |   24 +-
 vllm/beam_search.py                           |    9 +-
 vllm/benchmarks/datasets.py                   |  790 +++----
 vllm/benchmarks/latency.py                    |   52 +-
 vllm/benchmarks/lib/endpoint_request_func.py  |  135 +-
 vllm/benchmarks/lib/ready_checker.py          |   23 +-
 vllm/benchmarks/lib/utils.py                  |   15 +-
 vllm/benchmarks/serve.py                      |  559 +++--
 vllm/benchmarks/throughput.py                 |  458 ++--
 vllm/collect_env.py                           |  434 ++--
 vllm/compilation/activation_quant_fusion.py   |  135 +-
 vllm/compilation/backends.py                  |  297 ++-
 vllm/compilation/collective_fusion.py         |  687 +++---
 vllm/compilation/compiler_interface.py        |  176 +-
 vllm/compilation/counter.py                   |    3 +-
 vllm/compilation/cuda_graph.py                |   58 +-
 vllm/compilation/decorators.py                |  164 +-
 vllm/compilation/fix_functionalization.py     |  138 +-
 vllm/compilation/fusion.py                    |  394 ++--
 vllm/compilation/fusion_attn.py               |  245 +-
 vllm/compilation/fx_utils.py                  |    8 +-
 vllm/compilation/inductor_pass.py             |   16 +-
 vllm/compilation/monitor.py                   |   12 +-
 vllm/compilation/noop_elimination.py          |    9 +-
 vllm/compilation/piecewise_backend.py         |   27 +-
 vllm/compilation/post_cleanup.py              |    1 +
 vllm/compilation/sequence_parallelism.py      |  261 ++-
 vllm/compilation/torch25_custom_graph_pass.py |    8 +-
 vllm/compilation/vllm_inductor_pass.py        |   56 +-
 vllm/compilation/wrapper.py                   |   46 +-
 vllm/config/__init__.py                       |   62 +-
 vllm/config/cache.py                          |   38 +-
 vllm/config/compilation.py                    |  244 +-
 vllm/config/device.py                         |    7 +-
 vllm/config/kv_transfer.py                    |   24 +-
 vllm/config/load.py                           |    9 +-
 vllm/config/lora.py                           |   28 +-
 vllm/config/model.py                          |  705 +++---
 vllm/config/multimodal.py                     |   20 +-
 vllm/config/observability.py                  |   36 +-
 vllm/config/parallel.py                       |  166 +-
 vllm/config/pooler.py                         |    3 +-
 vllm/config/scheduler.py                      |   77 +-
 vllm/config/speculative.py                    |  336 +--
 vllm/config/structured_outputs.py             |   25 +-
 vllm/config/utils.py                          |   38 +-
 vllm/config/vllm.py                           |  377 +--
 vllm/connections.py                           |   46 +-
 vllm/device_allocator/cumem.py                |   79 +-
 vllm/distributed/communication_op.py          |   22 +-
 .../device_communicators/all2all.py           |  199 +-
 .../device_communicators/all_reduce_utils.py  |  102 +-
 .../base_device_communicator.py               |  136 +-
 .../device_communicators/cpu_communicator.py  |  110 +-
 .../device_communicators/cuda_communicator.py |  149 +-
 .../device_communicators/cuda_wrapper.py      |   78 +-
 .../device_communicators/custom_all_reduce.py |  133 +-
 .../device_communicators/mnnvl_compat.py      |    3 +-
 .../device_communicators/pynccl.py            |  165 +-
 .../device_communicators/pynccl_allocator.py  |   47 +-
 .../device_communicators/pynccl_wrapper.py    |  349 ++-
 .../device_communicators/quick_all_reduce.py  |  103 +-
 .../device_communicators/ray_communicator.py  |   35 +-
 .../device_communicators/shm_broadcast.py     |  142 +-
 .../shm_object_storage.py                     |  189 +-
 .../device_communicators/symm_mem.py          |   65 +-
 .../device_communicators/tpu_communicator.py  |   26 +-
 .../device_communicators/xpu_communicator.py  |   62 +-
 vllm/distributed/eplb/__init__.py             |    4 +-
 vllm/distributed/eplb/eplb_state.py           |  191 +-
 vllm/distributed/eplb/rebalance_algo.py       |   85 +-
 vllm/distributed/eplb/rebalance_execute.py    |   40 +-
 vllm/distributed/kv_events.py                 |   78 +-
 vllm/distributed/kv_transfer/__init__.py      |   19 +-
 .../kv_transfer/kv_connector/factory.py       |   43 +-
 .../kv_transfer/kv_connector/utils.py         |  108 +-
 .../kv_transfer/kv_connector/v1/__init__.py   |    4 +-
 .../kv_transfer/kv_connector/v1/base.py       |   83 +-
 .../kv_connector/v1/lmcache_connector.py      |   53 +-
 .../kv_transfer/kv_connector/v1/metrics.py    |   42 +-
 .../kv_connector/v1/multi_connector.py        |  113 +-
 .../kv_connector/v1/nixl_connector.py         |  569 +++--
 .../kv_connector/v1/offloading_connector.py   |  152 +-
 .../kv_connector/v1/p2p/p2p_nccl_connector.py |  188 +-
 .../kv_connector/v1/p2p/p2p_nccl_engine.py    |  286 ++-
 .../kv_connector/v1/p2p/tensor_memory_pool.py |   62 +-
 .../v1/shared_storage_connector.py            |  150 +-
 .../kv_transfer/kv_lookup_buffer/base.py      |   45 +-
 .../kv_lookup_buffer/mooncake_store.py        |   60 +-
 .../kv_lookup_buffer/simple_buffer.py         |  108 +-
 vllm/distributed/kv_transfer/kv_pipe/base.py  |   12 +-
 .../kv_transfer/kv_pipe/mooncake_pipe.py      |  125 +-
 .../kv_transfer/kv_pipe/pynccl_pipe.py        |   70 +-
 .../kv_transfer/kv_transfer_state.py          |   24 +-
 vllm/distributed/parallel_state.py            |  603 ++---
 vllm/distributed/tpu_distributed_utils.py     |  108 +-
 vllm/distributed/utils.py                     |  140 +-
 vllm/engine/arg_utils.py                      | 1205 +++++-----
 vllm/engine/metrics.py                        |  425 ++--
 vllm/engine/metrics_types.py                  |    3 +-
 vllm/engine/protocol.py                       |  153 +-
 vllm/entrypoints/api_server.py                |   36 +-
 vllm/entrypoints/chat_utils.py                |  220 +-
 vllm/entrypoints/cli/__init__.py              |    5 +-
 vllm/entrypoints/cli/benchmark/base.py        |    2 +-
 vllm/entrypoints/cli/benchmark/latency.py     |    2 +-
 vllm/entrypoints/cli/benchmark/main.py        |   15 +-
 vllm/entrypoints/cli/benchmark/serve.py       |    2 +-
 vllm/entrypoints/cli/benchmark/throughput.py  |    2 +-
 vllm/entrypoints/cli/collect_env.py           |   10 +-
 vllm/entrypoints/cli/main.py                  |   16 +-
 vllm/entrypoints/cli/openai.py                |  105 +-
 vllm/entrypoints/cli/run_batch.py             |   19 +-
 vllm/entrypoints/cli/serve.py                 |  102 +-
 vllm/entrypoints/cli/types.py                 |    4 +-
 vllm/entrypoints/context.py                   |  192 +-
 vllm/entrypoints/harmony_utils.py             |  150 +-
 vllm/entrypoints/launcher.py                  |   55 +-
 vllm/entrypoints/llm.py                       |  587 +++--
 vllm/entrypoints/logger.py                    |   16 +-
 vllm/entrypoints/openai/api_server.py         | 1311 ++++++-----
 vllm/entrypoints/openai/cli_args.py           |   63 +-
 vllm/entrypoints/openai/logits_processors.py  |   27 +-
 vllm/entrypoints/openai/protocol.py           |  871 ++++---
 vllm/entrypoints/openai/run_batch.py          |  312 +--
 vllm/entrypoints/openai/serving_chat.py       | 1013 ++++----
 .../openai/serving_classification.py          |   41 +-
 vllm/entrypoints/openai/serving_completion.py |  203 +-
 vllm/entrypoints/openai/serving_embedding.py  |  285 ++-
 vllm/entrypoints/openai/serving_engine.py     |  336 +--
 vllm/entrypoints/openai/serving_models.py     |  155 +-
 vllm/entrypoints/openai/serving_pooling.py    |   86 +-
 vllm/entrypoints/openai/serving_responses.py  |  744 +++---
 vllm/entrypoints/openai/serving_score.py      |  202 +-
 .../openai/serving_tokenization.py            |   77 +-
 .../openai/serving_transcription.py           |   78 +-
 vllm/entrypoints/openai/speech_to_text.py     |  174 +-
 .../tool_parsers/abstract_tool_parser.py      |   65 +-
 .../tool_parsers/deepseekv31_tool_parser.py   |  296 +--
 .../tool_parsers/deepseekv3_tool_parser.py    |  299 +--
 .../tool_parsers/glm4_moe_tool_parser.py      |  115 +-
 .../granite_20b_fc_tool_parser.py             |  185 +-
 .../tool_parsers/granite_tool_parser.py       |  183 +-
 .../openai/tool_parsers/hermes_tool_parser.py |  337 +--
 .../tool_parsers/hunyuan_a13b_tool_parser.py  |  298 ++-
 .../tool_parsers/internlm2_tool_parser.py     |  173 +-
 .../openai/tool_parsers/jamba_tool_parser.py  |  254 ++-
 .../tool_parsers/kimi_k2_tool_parser.py       |  309 +--
 .../llama4_pythonic_tool_parser.py            |  181 +-
 .../openai/tool_parsers/llama_tool_parser.py  |  219 +-
 .../tool_parsers/longcat_tool_parser.py       |   16 +-
 .../tool_parsers/minimax_tool_parser.py       |  409 ++--
 .../tool_parsers/mistral_tool_parser.py       |  249 +-
 .../openai/tool_parsers/openai_tool_parser.py |   22 +-
 .../tool_parsers/phi4mini_tool_parser.py      |   70 +-
 .../tool_parsers/pythonic_tool_parser.py      |  158 +-
 .../tool_parsers/qwen3coder_tool_parser.py    |  446 ++--
 .../tool_parsers/qwen3xml_tool_parser.py      |  774 ++++---
 .../tool_parsers/seed_oss_tool_parser.py      |  445 ++--
 .../openai/tool_parsers/step3_tool_parser.py  |  160 +-
 vllm/entrypoints/openai/tool_parsers/utils.py |   10 +-
 .../openai/tool_parsers/xlam_tool_parser.py   |  348 +--
 vllm/entrypoints/renderer.py                  |   98 +-
 vllm/entrypoints/score_utils.py               |   63 +-
 vllm/entrypoints/ssl.py                       |   31 +-
 vllm/entrypoints/tool.py                      |   21 +-
 vllm/entrypoints/tool_server.py               |   89 +-
 vllm/entrypoints/utils.py                     |   78 +-
 vllm/env_override.py                          |    4 +-
 vllm/envs.py                                  | 1269 +++++------
 vllm/executor/executor_base.py                |  108 +-
 vllm/executor/msgspec_utils.py                |    3 +-
 vllm/executor/ray_distributed_executor.py     |  315 +--
 vllm/executor/ray_utils.py                    |  122 +-
 vllm/executor/uniproc_executor.py             |   59 +-
 vllm/forward_context.py                       |  210 +-
 vllm/inputs/__init__.py                       |   26 +-
 vllm/inputs/data.py                           |   59 +-
 vllm/inputs/parse.py                          |   41 +-
 vllm/inputs/preprocess.py                     |  174 +-
 vllm/logger.py                                |   53 +-
 vllm/logging_utils/dump_input.py              |   39 +-
 vllm/logging_utils/formatter.py               |    4 +-
 vllm/logging_utils/log_time.py                |    8 +-
 vllm/logits_process.py                        |   28 +-
 vllm/logprobs.py                              |    1 +
 vllm/lora/layers/__init__.py                  |   19 +-
 vllm/lora/layers/base.py                      |    1 -
 vllm/lora/layers/base_linear.py               |   10 +-
 vllm/lora/layers/column_parallel_linear.py    |  283 ++-
 vllm/lora/layers/logits_processor.py          |   95 +-
 vllm/lora/layers/qkv_x_parallel_linear.py     |    2 +-
 vllm/lora/layers/replicated_linear.py         |   11 +-
 vllm/lora/layers/row_parallel_linear.py       |    7 +-
 vllm/lora/layers/utils.py                     |    8 +-
 vllm/lora/layers/vocal_parallel_embedding.py  |   78 +-
 vllm/lora/lora_weights.py                     |   78 +-
 vllm/lora/models.py                           |  378 +--
 vllm/lora/ops/ipex_ops/__init__.py            |    3 +-
 vllm/lora/ops/ipex_ops/lora_ops.py            |   71 +-
 vllm/lora/ops/torch_ops/__init__.py           |   12 +-
 vllm/lora/ops/torch_ops/lora_ops.py           |  145 +-
 vllm/lora/ops/triton_ops/kernel_utils.py      |  132 +-
 vllm/lora/ops/triton_ops/lora_expand_op.py    |  101 +-
 .../ops/triton_ops/lora_kernel_metadata.py    |   83 +-
 vllm/lora/ops/triton_ops/lora_shrink_op.py    |   64 +-
 vllm/lora/ops/triton_ops/utils.py             |   57 +-
 vllm/lora/ops/xla_ops/__init__.py             |    3 +-
 vllm/lora/ops/xla_ops/lora_ops.py             |   13 +-
 vllm/lora/peft_helper.py                      |   47 +-
 vllm/lora/punica_wrapper/punica_base.py       |  300 +--
 vllm/lora/punica_wrapper/punica_cpu.py        |  211 +-
 vllm/lora/punica_wrapper/punica_gpu.py        |  210 +-
 vllm/lora/punica_wrapper/punica_selector.py   |    3 +-
 vllm/lora/punica_wrapper/punica_tpu.py        |  234 +-
 vllm/lora/punica_wrapper/punica_xpu.py        |  175 +-
 vllm/lora/punica_wrapper/utils.py             |   56 +-
 vllm/lora/request.py                          |   20 +-
 vllm/lora/resolver.py                         |   14 +-
 vllm/lora/utils.py                            |  113 +-
 vllm/lora/worker_manager.py                   |   73 +-
 vllm/model_executor/__init__.py               |    3 +-
 vllm/model_executor/custom_op.py              |   29 +-
 vllm/model_executor/layers/activation.py      |  140 +-
 .../layers/attention_layer_base.py            |    7 +-
 vllm/model_executor/layers/batch_invariant.py |  124 +-
 vllm/model_executor/layers/fla/ops/chunk.py   |  122 +-
 .../layers/fla/ops/chunk_delta_h.py           |  209 +-
 vllm/model_executor/layers/fla/ops/chunk_o.py |   92 +-
 .../layers/fla/ops/chunk_scaled_dot_kkt.py    |   79 +-
 vllm/model_executor/layers/fla/ops/cumsum.py  |  255 ++-
 .../layers/fla/ops/fused_recurrent.py         |   81 +-
 vllm/model_executor/layers/fla/ops/index.py   |   30 +-
 vllm/model_executor/layers/fla/ops/l2norm.py  |   36 +-
 .../layers/fla/ops/layernorm_guard.py         |  194 +-
 vllm/model_executor/layers/fla/ops/op.py      |    4 +-
 .../layers/fla/ops/solve_tril.py              |  517 +++--
 vllm/model_executor/layers/fla/ops/utils.py   |   61 +-
 vllm/model_executor/layers/fla/ops/wy_fast.py |  109 +-
 .../layers/fused_moe/__init__.py              |   44 +-
 .../layers/fused_moe/batched_deep_gemm_moe.py |   89 +-
 .../batched_triton_or_deep_gemm_moe.py        |  113 +-
 .../model_executor/layers/fused_moe/config.py |  164 +-
 .../layers/fused_moe/cpu_fused_moe.py         |   93 +-
 .../layers/fused_moe/cutlass_moe.py           |  470 ++--
 .../layers/fused_moe/deep_gemm_moe.py         |  161 +-
 .../layers/fused_moe/deep_gemm_utils.py       |  217 +-
 .../fused_moe/deepep_ht_prepare_finalize.py   |  140 +-
 .../fused_moe/deepep_ll_prepare_finalize.py   |  139 +-
 .../fused_moe/flashinfer_cutlass_moe.py       |   78 +-
 .../flashinfer_cutlass_prepare_finalize.py    |   91 +-
 .../layers/fused_moe/flashinfer_trtllm_moe.py |  184 +-
 .../layers/fused_moe/fused_batched_moe.py     |  256 ++-
 .../layers/fused_moe/fused_marlin_moe.py      |  221 +-
 .../layers/fused_moe/fused_moe.py             | 1056 +++++----
 .../fused_moe/gpt_oss_triton_kernels_moe.py   |  100 +-
 vllm/model_executor/layers/fused_moe/layer.py | 1167 ++++++----
 .../layers/fused_moe/modular_kernel.py        |  267 ++-
 .../layers/fused_moe/moe_align_block_size.py  |   23 +-
 .../layers/fused_moe/moe_pallas.py            |   23 +-
 .../layers/fused_moe/moe_permute_unpermute.py |  145 +-
 .../layers/fused_moe/moe_torch_iterative.py   |    2 +-
 .../layers/fused_moe/pplx_prepare_finalize.py |  112 +-
 .../layers/fused_moe/prepare_finalize.py      |   23 +-
 .../layers/fused_moe/rocm_aiter_fused_moe.py  |  302 +--
 .../layers/fused_moe/routing_simulator.py     |   61 +-
 .../fused_moe/topk_weight_and_reduce.py       |   92 +-
 .../layers/fused_moe/triton_deep_gemm_moe.py  |   83 +-
 .../layers/fused_moe/trtllm_moe.py            |  117 +-
 vllm/model_executor/layers/fused_moe/utils.py |   80 +-
 vllm/model_executor/layers/layernorm.py       |  111 +-
 vllm/model_executor/layers/lightning_attn.py  |  268 ++-
 vllm/model_executor/layers/linear.py          |  847 +++----
 .../model_executor/layers/logits_processor.py |   30 +-
 .../layers/mamba/linear_attn.py               |  188 +-
 .../layers/mamba/mamba_mixer.py               |  220 +-
 .../layers/mamba/mamba_mixer2.py              |  318 +--
 .../layers/mamba/mamba_utils.py               |   51 +-
 .../layers/mamba/ops/causal_conv1d.py         |  427 ++--
 .../layers/mamba/ops/layernorm_gated.py       |  106 +-
 .../layers/mamba/ops/mamba_ssm.py             |  218 +-
 .../layers/mamba/ops/ssd_bmm.py               |  159 +-
 .../layers/mamba/ops/ssd_chunk_scan.py        |  325 +--
 .../layers/mamba/ops/ssd_chunk_state.py       |  516 ++---
 .../layers/mamba/ops/ssd_combined.py          |  102 +-
 .../layers/mamba/ops/ssd_state_passing.py     |   60 +-
 .../model_executor/layers/mamba/short_conv.py |   77 +-
 vllm/model_executor/layers/mla.py             |   36 +-
 vllm/model_executor/layers/pooler.py          |  160 +-
 .../layers/quantization/__init__.py           |   22 +-
 .../layers/quantization/auto_round.py         |  173 +-
 .../model_executor/layers/quantization/awq.py |  111 +-
 .../layers/quantization/awq_marlin.py         |  342 +--
 .../layers/quantization/awq_triton.py         |  171 +-
 .../layers/quantization/base_config.py        |   46 +-
 .../layers/quantization/bitblas.py            |  203 +-
 .../layers/quantization/bitsandbytes.py       |  348 +--
 .../compressed_tensors/compressed_tensors.py  |  577 +++--
 .../compressed_tensors_moe.py                 | 1303 ++++++-----
 .../compressed_tensors/schemes/__init__.py    |   29 +-
 .../schemes/compressed_tensors_24.py          |  131 +-
 .../schemes/compressed_tensors_scheme.py      |   15 +-
 .../schemes/compressed_tensors_w4a16_24.py    |  164 +-
 .../schemes/compressed_tensors_w4a16_nvfp4.py |  109 +-
 .../schemes/compressed_tensors_w4a4_nvfp4.py  |  132 +-
 .../schemes/compressed_tensors_w4a8_fp8.py    |  147 +-
 .../schemes/compressed_tensors_w4a8_int.py    |  122 +-
 .../schemes/compressed_tensors_w8a16_fp8.py   |  127 +-
 .../schemes/compressed_tensors_w8a8_fp8.py    |  155 +-
 .../schemes/compressed_tensors_w8a8_int8.py   |  102 +-
 .../schemes/compressed_tensors_wNa16.py       |  205 +-
 .../compressed_tensors/transform/linear.py    |  149 +-
 .../compressed_tensors/transform/module.py    |   77 +-
 .../transform/schemes/linear_qutlass_nvfp4.py |   65 +-
 .../compressed_tensors/triton_scaled_mm.py    |  131 +-
 .../quantization/compressed_tensors/utils.py  |   58 +-
 .../layers/quantization/deepspeedfp.py        |  111 +-
 .../layers/quantization/experts_int8.py       |  148 +-
 .../layers/quantization/fbgemm_fp8.py         |  123 +-
 .../model_executor/layers/quantization/fp8.py |  752 +++---
 .../layers/quantization/gguf.py               |  309 +--
 .../layers/quantization/gptq.py               |  166 +-
 .../layers/quantization/gptq_bitblas.py       |  209 +-
 .../layers/quantization/gptq_marlin.py        |  381 ++--
 .../layers/quantization/gptq_marlin_24.py     |  176 +-
 .../layers/quantization/hqq_marlin.py         |  210 +-
 .../model_executor/layers/quantization/inc.py |   16 +-
 .../layers/quantization/input_quant_fp8.py    |   48 +-
 .../layers/quantization/ipex_quant.py         |  290 +--
 .../kernels/mixed_precision/MPLinearKernel.py |   51 +-
 .../kernels/mixed_precision/__init__.py       |   54 +-
 .../kernels/mixed_precision/allspark.py       |   62 +-
 .../kernels/mixed_precision/bitblas.py        |  127 +-
 .../kernels/mixed_precision/conch.py          |   48 +-
 .../kernels/mixed_precision/cutlass.py        |   65 +-
 .../kernels/mixed_precision/dynamic_4bit.py   |   70 +-
 .../kernels/mixed_precision/exllama.py        |   94 +-
 .../kernels/mixed_precision/machete.py        |  120 +-
 .../kernels/mixed_precision/marlin.py         |  108 +-
 .../kernels/scaled_mm/ScaledMMLinearKernel.py |   41 +-
 .../kernels/scaled_mm/__init__.py             |   53 +-
 .../quantization/kernels/scaled_mm/aiter.py   |  100 +-
 .../quantization/kernels/scaled_mm/cpu.py     |  118 +-
 .../quantization/kernels/scaled_mm/cutlass.py |   98 +-
 .../quantization/kernels/scaled_mm/triton.py  |   26 +-
 .../quantization/kernels/scaled_mm/xla.py     |   42 +-
 .../layers/quantization/kv_cache.py           |   67 +-
 .../layers/quantization/modelopt.py           |  875 ++++---
 .../layers/quantization/moe_wna16.py          |  338 +--
 .../layers/quantization/mxfp4.py              |  648 +++---
 .../layers/quantization/petit.py              |   82 +-
 .../layers/quantization/ptpc_fp8.py           |   90 +-
 .../layers/quantization/quark/quark.py        |  281 ++-
 .../layers/quantization/quark/quark_moe.py    |  380 +--
 .../quark/schemes/quark_scheme.py             |   15 +-
 .../quark/schemes/quark_w4a4_mxfp4.py         |  131 +-
 .../quark/schemes/quark_w8a8_fp8.py           |  143 +-
 .../quark/schemes/quark_w8a8_int8.py          |  117 +-
 .../layers/quantization/quark/utils.py        |   29 +-
 .../model_executor/layers/quantization/rtn.py |  262 ++-
 .../layers/quantization/schema.py             |   18 +-
 .../layers/quantization/torchao.py            |   67 +-
 .../layers/quantization/tpu_int8.py           |   81 +-
 .../layers/quantization/utils/__init__.py     |    6 +-
 .../quantization/utils/allspark_utils.py      |   67 +-
 .../quantization/utils/bitblas_utils.py       |  164 +-
 .../quantization/utils/flashinfer_fp4_moe.py  |   45 +-
 .../quantization/utils/flashinfer_utils.py    |  114 +-
 .../layers/quantization/utils/fp8_utils.py    |  467 ++--
 .../layers/quantization/utils/gptq_utils.py   |   56 +-
 .../layers/quantization/utils/int8_utils.py   |   93 +-
 .../layers/quantization/utils/layer_utils.py  |   16 +-
 .../quantization/utils/machete_utils.py       |   19 +-
 .../layers/quantization/utils/marlin_utils.py |  418 ++--
 .../quantization/utils/marlin_utils_fp4.py    |  220 +-
 .../quantization/utils/marlin_utils_fp8.py    |  139 +-
 .../quantization/utils/marlin_utils_test.py   |   64 +-
 .../utils/marlin_utils_test_24.py             |  133 +-
 .../layers/quantization/utils/mxfp4_utils.py  |  132 +-
 .../layers/quantization/utils/mxfp8_utils.py  |    9 +-
 .../utils/nvfp4_emulation_utils.py            |   39 +-
 .../quantization/utils/nvfp4_moe_support.py   |   20 +-
 .../layers/quantization/utils/petit_utils.py  |   40 +-
 .../layers/quantization/utils/quant_utils.py  |  195 +-
 .../layers/quantization/utils/w8a8_utils.py   |  335 +--
 vllm/model_executor/layers/resampler.py       |  159 +-
 .../layers/rotary_embedding/__init__.py       |  185 +-
 .../layers/rotary_embedding/base.py           |   86 +-
 .../layers/rotary_embedding/common.py         |   59 +-
 .../rotary_embedding/deepseek_scaling_rope.py |   85 +-
 .../rotary_embedding/dual_chunk_rope.py       |  115 +-
 .../dynamic_ntk_alpha_rope.py                 |   10 +-
 .../dynamic_ntk_scaling_rope.py               |   11 +-
 .../rotary_embedding/ernie45_vl_rope.py       |   42 +-
 .../rotary_embedding/linear_scaling_rope.py   |    5 +-
 .../layers/rotary_embedding/llama3_rope.py    |   14 +-
 .../rotary_embedding/llama4_vision_rope.py    |   34 +-
 .../layers/rotary_embedding/mrope.py          |  718 +++---
 .../rotary_embedding/ntk_scaling_rope.py      |   42 +-
 .../phi3_long_rope_scaled_rope.py             |   53 +-
 .../rotary_embedding/rocm_aiter_rope_ops.py   |   22 +-
 .../rotary_embedding/yarn_scaling_rope.py     |   46 +-
 .../layers/shared_fused_moe/__init__.py       |    3 +-
 .../shared_fused_moe/shared_fused_moe.py      |    7 +-
 vllm/model_executor/layers/utils.py           |  129 +-
 .../layers/vocab_parallel_embedding.py        |  380 +--
 vllm/model_executor/model_loader/__init__.py  |   46 +-
 .../model_loader/base_loader.py               |   25 +-
 .../model_loader/bitsandbytes_loader.py       |  428 ++--
 .../model_loader/default_loader.py            |  117 +-
 .../model_loader/dummy_loader.py              |   12 +-
 .../model_loader/gguf_loader.py               |   81 +-
 .../model_loader/online_quantization.py       |   49 +-
 .../model_loader/runai_streamer_loader.py     |   79 +-
 .../model_loader/sharded_state_loader.py      |   47 +-
 .../model_executor/model_loader/tensorizer.py |  363 +--
 .../model_loader/tensorizer_loader.py         |   47 +-
 vllm/model_executor/model_loader/tpu.py       |   55 +-
 vllm/model_executor/model_loader/utils.py     |   96 +-
 .../model_loader/weight_utils.py              |  280 +--
 vllm/model_executor/models/__init__.py        |   29 +-
 vllm/model_executor/models/adapters.py        |  207 +-
 vllm/model_executor/models/aimv2.py           |  107 +-
 vllm/model_executor/models/apertus.py         |  245 +-
 vllm/model_executor/models/arcee.py           |  235 +-
 vllm/model_executor/models/arctic.py          |  377 +--
 vllm/model_executor/models/aria.py            |  178 +-
 vllm/model_executor/models/aya_vision.py      |  185 +-
 vllm/model_executor/models/baichuan.py        |  225 +-
 vllm/model_executor/models/bailing_moe.py     |  197 +-
 vllm/model_executor/models/bamba.py           |  209 +-
 vllm/model_executor/models/bert.py            |  408 ++--
 vllm/model_executor/models/bert_with_rope.py  |  432 ++--
 vllm/model_executor/models/blip.py            |  117 +-
 vllm/model_executor/models/blip2.py           |  236 +-
 vllm/model_executor/models/bloom.py           |  150 +-
 vllm/model_executor/models/chameleon.py       |  518 +++--
 vllm/model_executor/models/chatglm.py         |  159 +-
 vllm/model_executor/models/clip.py            |  253 +-
 vllm/model_executor/models/cohere2_vision.py  |  173 +-
 vllm/model_executor/models/commandr.py        |  202 +-
 vllm/model_executor/models/config.py          |  130 +-
 vllm/model_executor/models/dbrx.py            |  163 +-
 vllm/model_executor/models/deepseek.py        |  208 +-
 vllm/model_executor/models/deepseek_eagle.py  |   94 +-
 vllm/model_executor/models/deepseek_mtp.py    |  138 +-
 vllm/model_executor/models/deepseek_v2.py     |  752 +++---
 vllm/model_executor/models/deepseek_vl2.py    |  303 +--
 vllm/model_executor/models/dots1.py           |  230 +-
 vllm/model_executor/models/dots_ocr.py        |  473 ++--
 vllm/model_executor/models/ernie45.py         |    2 +-
 vllm/model_executor/models/ernie45_moe.py     |  308 +--
 vllm/model_executor/models/ernie45_vl.py      |  744 +++---
 vllm/model_executor/models/ernie45_vl_moe.py  |  351 +--
 vllm/model_executor/models/ernie_mtp.py       |  118 +-
 vllm/model_executor/models/exaone.py          |  128 +-
 vllm/model_executor/models/exaone4.py         |  136 +-
 vllm/model_executor/models/fairseq2_llama.py  |   48 +-
 vllm/model_executor/models/falcon.py          |  267 ++-
 vllm/model_executor/models/falcon_h1.py       |  174 +-
 vllm/model_executor/models/fuyu.py            |   89 +-
 vllm/model_executor/models/gemma.py           |  116 +-
 vllm/model_executor/models/gemma2.py          |  177 +-
 vllm/model_executor/models/gemma3.py          |  186 +-
 vllm/model_executor/models/gemma3_mm.py       |  248 +-
 vllm/model_executor/models/gemma3n.py         |  365 +--
 vllm/model_executor/models/gemma3n_mm.py      |  267 ++-
 vllm/model_executor/models/glm.py             |    2 +-
 vllm/model_executor/models/glm4.py            |  130 +-
 vllm/model_executor/models/glm4_1v.py         |  639 +++---
 vllm/model_executor/models/glm4_moe.py        |  313 +--
 vllm/model_executor/models/glm4_moe_mtp.py    |  139 +-
 vllm/model_executor/models/glm4v.py           |  256 ++-
 vllm/model_executor/models/gpt2.py            |  156 +-
 vllm/model_executor/models/gpt_bigcode.py     |  130 +-
 vllm/model_executor/models/gpt_j.py           |  109 +-
 vllm/model_executor/models/gpt_neox.py        |  123 +-
 vllm/model_executor/models/gpt_oss.py         |  328 ++-
 vllm/model_executor/models/granite.py         |  196 +-
 vllm/model_executor/models/granite_speech.py  |  271 ++-
 vllm/model_executor/models/granitemoe.py      |  289 ++-
 .../model_executor/models/granitemoehybrid.py |  375 +--
 .../model_executor/models/granitemoeshared.py |  153 +-
 vllm/model_executor/models/gritlm.py          |   87 +-
 vllm/model_executor/models/grok1.py           |  282 +--
 vllm/model_executor/models/h2ovl.py           |   87 +-
 vllm/model_executor/models/hunyuan_v1.py      |  300 +--
 .../models/hyperclovax_vision.py              |  317 +--
 .../models/idefics2_vision_model.py           |  132 +-
 vllm/model_executor/models/idefics3.py        |  220 +-
 vllm/model_executor/models/interfaces.py      |  247 +-
 vllm/model_executor/models/interfaces_base.py |   61 +-
 vllm/model_executor/models/intern_vit.py      |  253 +-
 vllm/model_executor/models/internlm2.py       |  160 +-
 vllm/model_executor/models/internlm2_ve.py    |   51 +-
 vllm/model_executor/models/interns1.py        |  307 +--
 vllm/model_executor/models/interns1_vit.py    |  224 +-
 vllm/model_executor/models/internvl.py        |  383 ++--
 vllm/model_executor/models/jais.py            |  167 +-
 vllm/model_executor/models/jamba.py           |  361 +--
 vllm/model_executor/models/jina_vl.py         |   84 +-
 vllm/model_executor/models/keye.py            |  468 ++--
 vllm/model_executor/models/keye_vl1_5.py      |  263 ++-
 vllm/model_executor/models/kimi_vl.py         |  238 +-
 vllm/model_executor/models/lfm2.py            |  141 +-
 vllm/model_executor/models/llama.py           |  301 +--
 vllm/model_executor/models/llama4.py          |  378 +--
 vllm/model_executor/models/llama4_eagle.py    |  101 +-
 vllm/model_executor/models/llama_eagle.py     |   68 +-
 vllm/model_executor/models/llama_eagle3.py    |  127 +-
 vllm/model_executor/models/llava.py           |  281 ++-
 vllm/model_executor/models/llava_next.py      |  224 +-
 .../model_executor/models/llava_next_video.py |  170 +-
 vllm/model_executor/models/llava_onevision.py |  360 +--
 vllm/model_executor/models/longcat_flash.py   |  326 +--
 .../models/longcat_flash_mtp.py               |  253 +-
 vllm/model_executor/models/mamba.py           |  181 +-
 vllm/model_executor/models/mamba2.py          |  171 +-
 vllm/model_executor/models/medusa.py          |  121 +-
 vllm/model_executor/models/midashenglm.py     |  209 +-
 vllm/model_executor/models/mimo.py            |   57 +-
 vllm/model_executor/models/mimo_mtp.py        |  125 +-
 vllm/model_executor/models/minicpm.py         |  289 ++-
 vllm/model_executor/models/minicpm3.py        |  124 +-
 vllm/model_executor/models/minicpm_eagle.py   |  166 +-
 vllm/model_executor/models/minicpmo.py        |  303 +--
 vllm/model_executor/models/minicpmv.py        |  758 +++---
 vllm/model_executor/models/minimax_text_01.py |  487 ++--
 vllm/model_executor/models/minimax_vl_01.py   |  186 +-
 vllm/model_executor/models/mistral3.py        |  250 +-
 vllm/model_executor/models/mixtral.py         |  280 ++-
 vllm/model_executor/models/mllama4.py         |  319 +--
 vllm/model_executor/models/mlp_speculator.py  |  136 +-
 vllm/model_executor/models/modernbert.py      |  210 +-
 vllm/model_executor/models/module_mapping.py  |   25 +-
 vllm/model_executor/models/molmo.py           |  414 ++--
 vllm/model_executor/models/moonvit.py         |  289 +--
 vllm/model_executor/models/mpt.py             |  100 +-
 .../model_executor/models/nano_nemotron_vl.py |  392 ++--
 vllm/model_executor/models/nemotron.py        |  219 +-
 vllm/model_executor/models/nemotron_h.py      |  129 +-
 vllm/model_executor/models/nemotron_nas.py    |  177 +-
 vllm/model_executor/models/nemotron_vl.py     |  189 +-
 vllm/model_executor/models/nvlm_d.py          |   81 +-
 vllm/model_executor/models/olmo.py            |  123 +-
 vllm/model_executor/models/olmo2.py           |   90 +-
 vllm/model_executor/models/olmoe.py           |  200 +-
 vllm/model_executor/models/opt.py             |  158 +-
 vllm/model_executor/models/orion.py           |  128 +-
 vllm/model_executor/models/ovis.py            |  191 +-
 vllm/model_executor/models/ovis2_5.py         |  234 +-
 vllm/model_executor/models/paligemma.py       |  149 +-
 vllm/model_executor/models/persimmon.py       |  162 +-
 vllm/model_executor/models/phi.py             |  161 +-
 vllm/model_executor/models/phi3.py            |    1 -
 vllm/model_executor/models/phi3v.py           |  328 +--
 vllm/model_executor/models/phi4_multimodal.py |  581 ++---
 vllm/model_executor/models/phi4mm.py          |  624 ++---
 vllm/model_executor/models/phi4mm_audio.py    |  456 ++--
 vllm/model_executor/models/phi4mm_utils.py    |  533 +++--
 vllm/model_executor/models/phimoe.py          |  156 +-
 vllm/model_executor/models/pixtral.py         |  423 ++--
 vllm/model_executor/models/plamo2.py          |  344 +--
 vllm/model_executor/models/qwen.py            |  145 +-
 vllm/model_executor/models/qwen2.py           |  174 +-
 .../models/qwen2_5_omni_thinker.py            |  488 ++--
 vllm/model_executor/models/qwen2_5_vl.py      |  716 +++---
 vllm/model_executor/models/qwen2_audio.py     |  205 +-
 vllm/model_executor/models/qwen2_moe.py       |  290 +--
 vllm/model_executor/models/qwen2_rm.py        |   56 +-
 vllm/model_executor/models/qwen2_vl.py        |  859 ++++---
 vllm/model_executor/models/qwen3.py           |   83 +-
 vllm/model_executor/models/qwen3_moe.py       |  346 +--
 vllm/model_executor/models/qwen3_next.py      |  557 +++--
 vllm/model_executor/models/qwen3_next_mtp.py  |  145 +-
 vllm/model_executor/models/qwen3_vl.py        |  899 ++++----
 vllm/model_executor/models/qwen3_vl_moe.py    |  227 +-
 vllm/model_executor/models/qwen_vl.py         |  299 +--
 vllm/model_executor/models/radio.py           |  227 +-
 vllm/model_executor/models/registry.py        |  242 +-
 vllm/model_executor/models/roberta.py         |  217 +-
 vllm/model_executor/models/rvl.py             |   31 +-
 vllm/model_executor/models/seed_oss.py        |  153 +-
 vllm/model_executor/models/siglip.py          |  160 +-
 vllm/model_executor/models/siglip2navit.py    |  307 +--
 vllm/model_executor/models/skyworkr1v.py      |  264 ++-
 vllm/model_executor/models/smolvlm.py         |   16 +-
 vllm/model_executor/models/solar.py           |  143 +-
 vllm/model_executor/models/stablelm.py        |  187 +-
 vllm/model_executor/models/starcoder2.py      |  152 +-
 vllm/model_executor/models/step3_text.py      |  361 +--
 vllm/model_executor/models/step3_vl.py        |  614 ++---
 vllm/model_executor/models/swin.py            |  346 +--
 vllm/model_executor/models/tarsier.py         |  285 +--
 vllm/model_executor/models/telechat2.py       |   48 +-
 vllm/model_executor/models/teleflm.py         |   19 +-
 vllm/model_executor/models/terratorch.py      |  100 +-
 vllm/model_executor/models/transformers.py    |  316 +--
 .../model_executor/models/transformers_moe.py |   88 +-
 .../models/transformers_pooling.py            |   97 +-
 vllm/model_executor/models/ultravox.py        |  250 +-
 vllm/model_executor/models/utils.py           |  216 +-
 vllm/model_executor/models/vision.py          |  192 +-
 vllm/model_executor/models/voxtral.py         |  320 +--
 vllm/model_executor/models/whisper.py         |  269 +--
 vllm/model_executor/models/zamba2.py          |  383 ++--
 vllm/model_executor/parameter.py              |  251 +-
 vllm/model_executor/utils.py                  |   15 +-
 .../model_executor/warmup/deep_gemm_warmup.py |  151 +-
 vllm/model_executor/warmup/kernel_warmup.py   |   23 +-
 vllm/multimodal/__init__.py                   |   15 +-
 vllm/multimodal/audio.py                      |   26 +-
 vllm/multimodal/base.py                       |    1 -
 vllm/multimodal/cache.py                      |   92 +-
 vllm/multimodal/evs.py                        |   94 +-
 vllm/multimodal/hasher.py                     |   45 +-
 vllm/multimodal/image.py                      |   27 +-
 vllm/multimodal/inputs.py                     |  184 +-
 vllm/multimodal/parse.py                      |  124 +-
 vllm/multimodal/processing.py                 |  329 +--
 vllm/multimodal/profiling.py                  |   85 +-
 vllm/multimodal/registry.py                   |   70 +-
 vllm/multimodal/utils.py                      |  117 +-
 vllm/multimodal/video.py                      |   86 +-
 vllm/outputs.py                               |   85 +-
 vllm/platforms/__init__.py                    |  104 +-
 vllm/platforms/cpu.py                         |  170 +-
 vllm/platforms/cuda.py                        |  245 +-
 vllm/platforms/interface.py                   |   77 +-
 vllm/platforms/rocm.py                        |  286 ++-
 vllm/platforms/tpu.py                         |  103 +-
 vllm/platforms/xpu.py                         |   74 +-
 vllm/plugins/__init__.py                      |   11 +-
 vllm/plugins/io_processors/__init__.py        |   17 +-
 vllm/plugins/io_processors/interface.py       |   23 +-
 .../lora_resolvers/filesystem_resolver.py     |   35 +-
 vllm/pooling_params.py                        |   73 +-
 vllm/profiler/layerwise_profile.py            |  213 +-
 vllm/profiler/utils.py                        |   39 +-
 vllm/ray/lazy_utils.py                        |    8 +-
 vllm/ray/ray_env.py                           |   32 +-
 vllm/reasoning/abs_reasoning_parsers.py       |   32 +-
 vllm/reasoning/basic_parsers.py               |   50 +-
 .../reasoning/deepseek_r1_reasoning_parser.py |    9 +-
 vllm/reasoning/glm4_moe_reasoning_parser.py   |   63 +-
 vllm/reasoning/gptoss_reasoning_parser.py     |   21 +-
 vllm/reasoning/granite_reasoning_parser.py    |  114 +-
 .../hunyuan_a13b_reasoning_parser.py          |   68 +-
 vllm/reasoning/mistral_reasoning_parser.py    |   20 +-
 vllm/reasoning/olmo3_reasoning_parser.py      |   43 +-
 vllm/reasoning/qwen3_reasoning_parser.py      |   16 +-
 vllm/reasoning/seedoss_reasoning_parser.py    |    6 +-
 vllm/reasoning/step3_reasoning_parser.py      |   32 +-
 vllm/sampling_params.py                       |  202 +-
 vllm/scalar_type.py                           |   82 +-
 vllm/scripts.py                               |    6 +-
 vllm/sequence.py                              |   18 +-
 vllm/tracing.py                               |   44 +-
 vllm/transformers_utils/__init__.py           |   10 +-
 .../chat_templates/registry.py                |   12 +-
 vllm/transformers_utils/config.py             |  516 +++--
 vllm/transformers_utils/config_parser_base.py |   15 +-
 vllm/transformers_utils/configs/__init__.py   |    9 +-
 vllm/transformers_utils/configs/chatglm.py    |   59 +-
 .../transformers_utils/configs/deepseek_v3.py |    5 +-
 .../configs/deepseek_vl2.py                   |   70 +-
 vllm/transformers_utils/configs/dotsocr.py    |   14 +-
 vllm/transformers_utils/configs/eagle.py      |   47 +-
 vllm/transformers_utils/configs/falcon.py     |    5 +-
 vllm/transformers_utils/configs/jais.py       |   38 +-
 vllm/transformers_utils/configs/kimi_vl.py    |   16 +-
 vllm/transformers_utils/configs/medusa.py     |   35 +-
 .../transformers_utils/configs/midashenglm.py |   13 +-
 vllm/transformers_utils/configs/mistral.py    |   42 +-
 .../configs/mlp_speculator.py                 |   22 +-
 vllm/transformers_utils/configs/moonvit.py    |   20 +-
 vllm/transformers_utils/configs/nemotron.py   |   37 +-
 vllm/transformers_utils/configs/nemotron_h.py |   15 +-
 vllm/transformers_utils/configs/olmo3.py      |    1 -
 vllm/transformers_utils/configs/qwen3_next.py |    3 +-
 vllm/transformers_utils/configs/radio.py      |   12 +-
 .../configs/speculators/algos.py              |    6 +-
 .../configs/speculators/base.py               |   27 +-
 vllm/transformers_utils/configs/step3_vl.py   |   65 +-
 vllm/transformers_utils/configs/ultravox.py   |   12 +-
 vllm/transformers_utils/detokenizer_utils.py  |   34 +-
 vllm/transformers_utils/processor.py          |   39 +-
 .../transformers_utils/processors/__init__.py |    3 +-
 vllm/transformers_utils/processors/ovis.py    |    3 +-
 vllm/transformers_utils/processors/ovis2_5.py |  172 +-
 vllm/transformers_utils/runai_utils.py        |   25 +-
 vllm/transformers_utils/s3_utils.py           |   38 +-
 vllm/transformers_utils/tokenizer.py          |   81 +-
 vllm/transformers_utils/tokenizer_base.py     |   29 +-
 .../transformers_utils/tokenizers/__init__.py |   14 +-
 vllm/transformers_utils/tokenizers/mistral.py |  203 +-
 vllm/transformers_utils/utils.py              |   25 +-
 vllm/triton_utils/__init__.py                 |    7 +-
 vllm/triton_utils/importing.py                |   30 +-
 vllm/usage/usage_lib.py                       |   76 +-
 vllm/utils/__init__.py                        |  787 ++++---
 vllm/utils/deep_gemm.py                       |  115 +-
 vllm/utils/flashinfer.py                      |  132 +-
 vllm/utils/gc_utils.py                        |   16 +-
 vllm/utils/jsontree.py                        |   38 +-
 vllm/utils/tensor_schema.py                   |   87 +-
 vllm/v1/attention/backends/cpu_attn.py        |  336 +--
 vllm/v1/attention/backends/flash_attn.py      |  242 +-
 vllm/v1/attention/backends/flashinfer.py      |  509 +++--
 vllm/v1/attention/backends/flex_attention.py  |  257 ++-
 vllm/v1/attention/backends/gdn_attn.py        |  252 +-
 vllm/v1/attention/backends/linear_attn.py     |   37 +-
 vllm/v1/attention/backends/mamba1_attn.py     |   32 +-
 vllm/v1/attention/backends/mamba2_attn.py     |  196 +-
 vllm/v1/attention/backends/mamba_attn.py      |   35 +-
 vllm/v1/attention/backends/mla/common.py      |  778 ++++---
 vllm/v1/attention/backends/mla/cutlass_mla.py |  162 +-
 .../attention/backends/mla/flashattn_mla.py   |  167 +-
 .../attention/backends/mla/flashinfer_mla.py  |   70 +-
 vllm/v1/attention/backends/mla/flashmla.py    |  132 +-
 .../attention/backends/mla/flashmla_sparse.py |  256 ++-
 vllm/v1/attention/backends/mla/indexer.py     |  153 +-
 .../attention/backends/mla/rocm_aiter_mla.py  |  229 +-
 vllm/v1/attention/backends/mla/triton_mla.py  |  139 +-
 vllm/v1/attention/backends/pallas.py          |  170 +-
 vllm/v1/attention/backends/rocm_aiter_fa.py   |  238 +-
 vllm/v1/attention/backends/rocm_attn.py       |  123 +-
 vllm/v1/attention/backends/short_conv_attn.py |   68 +-
 vllm/v1/attention/backends/tree_attn.py       |   93 +-
 vllm/v1/attention/backends/triton_attn.py     |   97 +-
 vllm/v1/attention/backends/utils.py           |  370 +--
 vllm/v1/attention/backends/xformers.py        |  151 +-
 vllm/v1/core/block_pool.py                    |  106 +-
 vllm/v1/core/encoder_cache_manager.py         |   84 +-
 vllm/v1/core/kv_cache_coordinator.py          |  289 ++-
 vllm/v1/core/kv_cache_manager.py              |   89 +-
 vllm/v1/core/kv_cache_utils.py                |  458 ++--
 vllm/v1/core/sched/async_scheduler.py         |   14 +-
 vllm/v1/core/sched/interface.py               |    5 +-
 vllm/v1/core/sched/output.py                  |   62 +-
 vllm/v1/core/sched/request_queue.py           |   21 +-
 vllm/v1/core/sched/scheduler.py               |  432 ++--
 vllm/v1/core/sched/utils.py                   |   15 +-
 vllm/v1/core/single_type_kv_cache_manager.py  |  259 ++-
 vllm/v1/cudagraph_dispatcher.py               |   72 +-
 vllm/v1/engine/__init__.py                    |   59 +-
 vllm/v1/engine/async_llm.py                   |  226 +-
 vllm/v1/engine/coordinator.py                 |  124 +-
 vllm/v1/engine/core.py                        |  666 +++---
 vllm/v1/engine/core_client.py                 |  620 ++---
 vllm/v1/engine/detokenizer.py                 |  100 +-
 vllm/v1/engine/exceptions.py                  |    1 +
 vllm/v1/engine/llm_engine.py                  |  134 +-
 vllm/v1/engine/logprobs.py                    |   53 +-
 vllm/v1/engine/output_processor.py            |  269 ++-
 vllm/v1/engine/parallel_sampling.py           |   37 +-
 vllm/v1/engine/processor.py                   |  163 +-
 vllm/v1/engine/utils.py                       |  438 ++--
 vllm/v1/executor/abstract.py                  |   58 +-
 vllm/v1/executor/multiproc_executor.py        |  252 +-
 vllm/v1/executor/ray_distributed_executor.py  |   18 +-
 vllm/v1/executor/utils.py                     |    3 +-
 vllm/v1/kv_cache_interface.py                 |  134 +-
 vllm/v1/kv_offload/abstract.py                |    9 +-
 vllm/v1/kv_offload/backend.py                 |    9 +-
 vllm/v1/kv_offload/backends/cpu.py            |   29 +-
 vllm/v1/kv_offload/cpu.py                     |   38 +-
 vllm/v1/kv_offload/factory.py                 |    9 +-
 vllm/v1/kv_offload/lru_manager.py             |   60 +-
 vllm/v1/kv_offload/spec.py                    |    9 +-
 vllm/v1/kv_offload/worker/cpu_gpu.py          |   72 +-
 vllm/v1/kv_offload/worker/worker.py           |   32 +-
 vllm/v1/metrics/loggers.py                    |  548 +++--
 vllm/v1/metrics/prometheus.py                 |   29 +-
 vllm/v1/metrics/ray_wrappers.py               |   66 +-
 vllm/v1/metrics/reader.py                     |   56 +-
 vllm/v1/metrics/stats.py                      |  103 +-
 vllm/v1/outputs.py                            |   51 +-
 vllm/v1/pool/metadata.py                      |   46 +-
 vllm/v1/request.py                            |   52 +-
 vllm/v1/sample/logits_processor/__init__.py   |  110 +-
 vllm/v1/sample/logits_processor/builtin.py    |  115 +-
 vllm/v1/sample/logits_processor/interface.py  |    7 +-
 vllm/v1/sample/logits_processor/state.py      |   28 +-
 vllm/v1/sample/metadata.py                    |    1 -
 vllm/v1/sample/ops/bad_words.py               |    3 +-
 vllm/v1/sample/ops/logprobs.py                |    3 +-
 vllm/v1/sample/ops/penalties.py               |   19 +-
 vllm/v1/sample/ops/topk_topp_sampler.py       |   42 +-
 vllm/v1/sample/rejection_sampler.py           |   93 +-
 vllm/v1/sample/sampler.py                     |   64 +-
 vllm/v1/sample/tpu/metadata.py                |   51 +-
 vllm/v1/sample/tpu/sampler.py                 |   22 +-
 vllm/v1/serial_utils.py                       |  135 +-
 vllm/v1/spec_decode/eagle.py                  |  575 ++---
 vllm/v1/spec_decode/medusa.py                 |   26 +-
 vllm/v1/spec_decode/metadata.py               |   26 +-
 vllm/v1/spec_decode/metrics.py                |   80 +-
 vllm/v1/spec_decode/ngram_proposer.py         |  101 +-
 vllm/v1/spec_decode/utils.py                  |   12 +-
 vllm/v1/structured_output/__init__.py         |   88 +-
 vllm/v1/structured_output/backend_guidance.py |   80 +-
 .../backend_lm_format_enforcer.py             |   74 +-
 vllm/v1/structured_output/backend_outlines.py |   88 +-
 vllm/v1/structured_output/backend_types.py    |    5 +-
 vllm/v1/structured_output/backend_xgrammar.py |  116 +-
 vllm/v1/structured_output/request.py          |   27 +-
 vllm/v1/structured_output/utils.py            |  156 +-
 vllm/v1/utils.py                              |  155 +-
 vllm/v1/worker/block_table.py                 |   96 +-
 vllm/v1/worker/cpu_model_runner.py            |   19 +-
 vllm/v1/worker/cpu_worker.py                  |   94 +-
 vllm/v1/worker/gpu_input_batch.py             |  400 ++--
 vllm/v1/worker/gpu_model_runner.py            | 2028 ++++++++++-------
 vllm/v1/worker/gpu_ubatch_wrapper.py          |  225 +-
 vllm/v1/worker/gpu_worker.py                  |  376 +--
 .../worker/kv_connector_model_runner_mixin.py |   74 +-
 vllm/v1/worker/lora_model_runner_mixin.py     |  109 +-
 vllm/v1/worker/tpu_input_batch.py             |  331 +--
 vllm/v1/worker/tpu_model_runner.py            | 1031 +++++----
 vllm/v1/worker/tpu_worker.py                  |   80 +-
 vllm/v1/worker/ubatch_splitting.py            |   75 +-
 vllm/v1/worker/ubatch_utils.py                |    9 +-
 vllm/v1/worker/ubatching.py                   |   76 +-
 vllm/v1/worker/utils.py                       |   47 +-
 vllm/v1/worker/worker_base.py                 |   51 +-
 vllm/v1/worker/xpu_model_runner.py            |    2 -
 vllm/v1/worker/xpu_worker.py                  |   91 +-
 vllm/version.py                               |    4 +-
 1508 files changed, 115562 insertions(+), 94462 deletions(-)
 delete mode 100644 .buildkite/pyproject.toml
 delete mode 100644 benchmarks/pyproject.toml
 delete mode 100644 examples/pyproject.toml

diff --git a/.buildkite/pyproject.toml b/.buildkite/pyproject.toml
deleted file mode 100644
index d5cad1c73c6f..000000000000
--- a/.buildkite/pyproject.toml
+++ /dev/null
@@ -1,46 +0,0 @@
-# This local pyproject file is part of the migration from yapf to ruff format.
-# It uses the same core rules as the main pyproject.toml file, but with the
-# following differences:
-# - ruff line length is overridden to 88
-# - deprecated typing ignores (UP006, UP035) have been removed
-
-[tool.ruff]
-line-length = 88
-
-[tool.ruff.lint.per-file-ignores]
-"vllm/third_party/**" = ["ALL"]
-"vllm/version.py" = ["F401"]
-"vllm/_version.py" = ["ALL"]
-
-[tool.ruff.lint]
-select = [
-    # pycodestyle
-    "E",
-    # Pyflakes
-    "F",
-    # pyupgrade
-    "UP",
-    # flake8-bugbear
-    "B",
-    # flake8-simplify
-    "SIM",
-    # isort
-    "I",
-    # flake8-logging-format
-    "G",
-]
-ignore = [
-    # star imports
-    "F405", "F403",
-    # lambda expression assignment
-    "E731",
-    # Loop control variable not used within loop body
-    "B007",
-    # f-string format
-    "UP032",
-    # Can remove once 3.10+ is the minimum Python version
-    "UP007",
-]
-
-[tool.ruff.format]
-docstring-code-format = true
diff --git a/.pre-commit-config.yaml b/.pre-commit-config.yaml
index 8ca414ee4269..ea63ef1f528c 100644
--- a/.pre-commit-config.yaml
+++ b/.pre-commit-config.yaml
@@ -6,28 +6,16 @@ default_stages:
   - manual # Run in CI
 exclude: 'vllm/third_party/.*'
 repos:
-- repo: https://github.com/google/yapf
-  rev: v0.43.0
-  hooks:
-  - id: yapf
-    args: [--in-place, --verbose]
-    # Keep the same list from yapfignore here to avoid yapf failing without any inputs
-    exclude: '(.buildkite|benchmarks|build|examples)/.*'
 - repo: https://github.com/astral-sh/ruff-pre-commit
   rev: v0.11.7
   hooks:
   - id: ruff
     args: [--output-format, github, --fix]
   - id: ruff-format
-    files: ^(.buildkite|benchmarks|examples)/.*
 - repo: https://github.com/crate-ci/typos
   rev: v1.35.5
   hooks:
   - id: typos
-- repo: https://github.com/PyCQA/isort
-  rev: 6.0.1
-  hooks:
-  - id: isort
 - repo: https://github.com/pre-commit/mirrors-clang-format
   rev: v20.1.3
   hooks:
diff --git a/benchmarks/benchmark_block_pool.py b/benchmarks/benchmark_block_pool.py
index eae8d9927ea3..5434f8b6a4e4 100644
--- a/benchmarks/benchmark_block_pool.py
+++ b/benchmarks/benchmark_block_pool.py
@@ -2,9 +2,9 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 import gc
 
+from benchmark_utils import TimeCollector
 from tabulate import tabulate
 
-from benchmark_utils import TimeCollector
 from vllm.utils import FlexibleArgumentParser
 from vllm.v1.core.block_pool import BlockPool
 
diff --git a/benchmarks/benchmark_ngram_proposer.py b/benchmarks/benchmark_ngram_proposer.py
index d4b83edbd940..291d87d6085a 100644
--- a/benchmarks/benchmark_ngram_proposer.py
+++ b/benchmarks/benchmark_ngram_proposer.py
@@ -5,9 +5,9 @@
 from unittest import mock
 
 import numpy as np
+from benchmark_utils import TimeCollector
 from tabulate import tabulate
 
-from benchmark_utils import TimeCollector
 from vllm.config import (
     CacheConfig,
     DeviceConfig,
diff --git a/benchmarks/benchmark_serving_structured_output.py b/benchmarks/benchmark_serving_structured_output.py
index a0350625491f..f6b48ad524f2 100644
--- a/benchmarks/benchmark_serving_structured_output.py
+++ b/benchmarks/benchmark_serving_structured_output.py
@@ -37,14 +37,13 @@
 import datasets
 import numpy as np
 import pandas as pd
-from tqdm.asyncio import tqdm
-from transformers import PreTrainedTokenizerBase
-
 from backend_request_func import (
     ASYNC_REQUEST_FUNCS,
     RequestFuncInput,
     RequestFuncOutput,
 )
+from tqdm.asyncio import tqdm
+from transformers import PreTrainedTokenizerBase
 
 try:
     from vllm.transformers_utils.tokenizer import get_tokenizer
diff --git a/benchmarks/pyproject.toml b/benchmarks/pyproject.toml
deleted file mode 100644
index 65b1e09a247e..000000000000
--- a/benchmarks/pyproject.toml
+++ /dev/null
@@ -1,49 +0,0 @@
-# This local pyproject file is part of the migration from yapf to ruff format.
-# It uses the same core rules as the main pyproject.toml file, but with the
-# following differences:
-# - ruff line length is overridden to 88
-# - deprecated typing ignores (UP006, UP035) have been removed
-
-[tool.ruff]
-line-length = 88
-
-[tool.ruff.lint.per-file-ignores]
-"vllm/third_party/**" = ["ALL"]
-"vllm/version.py" = ["F401"]
-"vllm/_version.py" = ["ALL"]
-
-[tool.ruff.lint]
-select = [
-    # pycodestyle
-    "E",
-    # Pyflakes
-    "F",
-    # pyupgrade
-    "UP",
-    # flake8-bugbear
-    "B",
-    # flake8-simplify
-    "SIM",
-    # isort
-    "I",
-    # flake8-logging-format
-    "G",
-]
-ignore = [
-    # star imports
-    "F405", "F403",
-    # lambda expression assignment
-    "E731",
-    # Loop control variable not used within loop body
-    "B007",
-    # f-string format
-    "UP032",
-    # Can remove once 3.10+ is the minimum Python version
-    "UP007",
-]
-
-[tool.ruff.lint.isort]
-known-first-party = ["vllm"]
-
-[tool.ruff.format]
-docstring-code-format = true
\ No newline at end of file
diff --git a/cmake/hipify.py b/cmake/hipify.py
index 55d378f5b111..8504f9defee9 100755
--- a/cmake/hipify.py
+++ b/cmake/hipify.py
@@ -16,7 +16,7 @@
 
 from torch.utils.hipify.hipify_python import hipify
 
-if __name__ == '__main__':
+if __name__ == "__main__":
     parser = argparse.ArgumentParser()
 
     # Project directory where all the source + include files live.
@@ -34,15 +34,14 @@
     )
 
     # Source files to convert.
-    parser.add_argument("sources",
-                        help="Source files to hipify.",
-                        nargs="*",
-                        default=[])
+    parser.add_argument(
+        "sources", help="Source files to hipify.", nargs="*", default=[]
+    )
 
     args = parser.parse_args()
 
     # Limit include scope to project_dir only
-    includes = [os.path.join(args.project_dir, '*')]
+    includes = [os.path.join(args.project_dir, "*")]
 
     # Get absolute path for all source files.
     extra_files = [os.path.abspath(s) for s in args.sources]
@@ -51,25 +50,31 @@
     # The directory might already exist to hold object files so we ignore that.
     shutil.copytree(args.project_dir, args.output_dir, dirs_exist_ok=True)
 
-    hipify_result = hipify(project_directory=args.project_dir,
-                           output_directory=args.output_dir,
-                           header_include_dirs=[],
-                           includes=includes,
-                           extra_files=extra_files,
-                           show_detailed=True,
-                           is_pytorch_extension=True,
-                           hipify_extra_files_only=True)
+    hipify_result = hipify(
+        project_directory=args.project_dir,
+        output_directory=args.output_dir,
+        header_include_dirs=[],
+        includes=includes,
+        extra_files=extra_files,
+        show_detailed=True,
+        is_pytorch_extension=True,
+        hipify_extra_files_only=True,
+    )
 
     hipified_sources = []
     for source in args.sources:
         s_abs = os.path.abspath(source)
-        hipified_s_abs = (hipify_result[s_abs].hipified_path if
-                          (s_abs in hipify_result
-                           and hipify_result[s_abs].hipified_path is not None)
-                          else s_abs)
+        hipified_s_abs = (
+            hipify_result[s_abs].hipified_path
+            if (
+                s_abs in hipify_result
+                and hipify_result[s_abs].hipified_path is not None
+            )
+            else s_abs
+        )
         hipified_sources.append(hipified_s_abs)
 
-    assert (len(hipified_sources) == len(args.sources))
+    assert len(hipified_sources) == len(args.sources)
 
     # Print hipified source files.
     print("\n".join(hipified_sources))
diff --git a/csrc/cutlass_extensions/vllm_cutlass_library_extension.py b/csrc/cutlass_extensions/vllm_cutlass_library_extension.py
index 1dd7101acc27..7a81dd40c84e 100644
--- a/csrc/cutlass_extensions/vllm_cutlass_library_extension.py
+++ b/csrc/cutlass_extensions/vllm_cutlass_library_extension.py
@@ -27,7 +27,7 @@ class MixedInputKernelScheduleType(enum.Enum):
     **{
         VLLMDataType.u4b8: "u4b8",
         VLLMDataType.u8b128: "u8b128",
-    }
+    },
 }
 
 VLLMDataTypeTag: dict[Union[VLLMDataType, DataType], str] = {
@@ -35,7 +35,7 @@ class MixedInputKernelScheduleType(enum.Enum):
     **{
         VLLMDataType.u4b8: "cutlass::vllm_uint4b8_t",
         VLLMDataType.u8b128: "cutlass::vllm_uint8b128_t",
-    }
+    },
 }
 
 VLLMDataTypeSize: dict[Union[VLLMDataType, DataType], int] = {
@@ -43,7 +43,7 @@ class MixedInputKernelScheduleType(enum.Enum):
     **{
         VLLMDataType.u4b8: 4,
         VLLMDataType.u8b128: 8,
-    }
+    },
 }
 
 VLLMDataTypeVLLMScalarTypeTag: dict[Union[VLLMDataType, DataType], str] = {
@@ -67,15 +67,13 @@ class MixedInputKernelScheduleType(enum.Enum):
     DataType.f32: "at::ScalarType::Float",
 }
 
-VLLMKernelScheduleTag: dict[Union[
-    MixedInputKernelScheduleType, KernelScheduleType], str] = {
-        **KernelScheduleTag,  # type: ignore
-        **{
-            MixedInputKernelScheduleType.TmaWarpSpecialized:
-            "cutlass::gemm::KernelTmaWarpSpecialized",
-            MixedInputKernelScheduleType.TmaWarpSpecializedPingpong:
-            "cutlass::gemm::KernelTmaWarpSpecializedPingpong",
-            MixedInputKernelScheduleType.TmaWarpSpecializedCooperative:
-            "cutlass::gemm::KernelTmaWarpSpecializedCooperative",
-        }
-    }
+VLLMKernelScheduleTag: dict[
+    Union[MixedInputKernelScheduleType, KernelScheduleType], str
+] = {
+    **KernelScheduleTag,  # type: ignore
+    **{
+        MixedInputKernelScheduleType.TmaWarpSpecialized: "cutlass::gemm::KernelTmaWarpSpecialized",
+        MixedInputKernelScheduleType.TmaWarpSpecializedPingpong: "cutlass::gemm::KernelTmaWarpSpecializedPingpong",
+        MixedInputKernelScheduleType.TmaWarpSpecializedCooperative: "cutlass::gemm::KernelTmaWarpSpecializedCooperative",
+    },
+}
diff --git a/csrc/moe/marlin_moe_wna16/generate_kernels.py b/csrc/moe/marlin_moe_wna16/generate_kernels.py
index 698deb107cc0..be5b68cc53e6 100644
--- a/csrc/moe/marlin_moe_wna16/generate_kernels.py
+++ b/csrc/moe/marlin_moe_wna16/generate_kernels.py
@@ -17,25 +17,30 @@
 namespace MARLIN_NAMESPACE_NAME {
 """.strip()
 
-TEMPLATE = ("template __global__ void Marlin<"
-            "{{scalar_t}}, "
-            "{{w_type_id}}, "
-            "{{s_type_id}}, "
-            "{{threads}}, "
-            "{{thread_m_blocks}}, "
-            "{{thread_n_blocks}}, "
-            "{{thread_k_blocks}}, "
-            "{{'true' if m_block_size_8 else 'false'}}, "
-            "{{stages}}, "
-            "{{group_blocks}}, "
-            "{{'true' if is_zp_float else 'false'}}>"
-            "( MARLIN_KERNEL_PARAMS );")
+TEMPLATE = (
+    "template __global__ void Marlin<"
+    "{{scalar_t}}, "
+    "{{w_type_id}}, "
+    "{{s_type_id}}, "
+    "{{threads}}, "
+    "{{thread_m_blocks}}, "
+    "{{thread_n_blocks}}, "
+    "{{thread_k_blocks}}, "
+    "{{'true' if m_block_size_8 else 'false'}}, "
+    "{{stages}}, "
+    "{{group_blocks}}, "
+    "{{'true' if is_zp_float else 'false'}}>"
+    "( MARLIN_KERNEL_PARAMS );"
+)
 
 # int8 with zero point case (vllm::kU8) is also supported,
 # we don't add it to reduce wheel size.
 SCALAR_TYPES = [
-    "vllm::kU4", "vllm::kU4B8", "vllm::kU8B128", "vllm::kFE4M3fn",
-    "vllm::kFE2M1f"
+    "vllm::kU4",
+    "vllm::kU4B8",
+    "vllm::kU8B128",
+    "vllm::kFE4M3fn",
+    "vllm::kFE2M1f",
 ]
 THREAD_CONFIGS = [(128, 128, 256), (64, 256, 256), (64, 128, 128)]
 
@@ -58,11 +63,12 @@ def generate_new_kernels():
         all_template_str_list = []
 
         for group_blocks, m_blocks, thread_configs in itertools.product(
-                GROUP_BLOCKS, THREAD_M_BLOCKS, THREAD_CONFIGS):
-
+            GROUP_BLOCKS, THREAD_M_BLOCKS, THREAD_CONFIGS
+        ):
             # act order case only support gptq-int4 and gptq-int8
             if group_blocks == 0 and scalar_type not in [
-                    "vllm::kU4B8", "vllm::kU8B128"
+                "vllm::kU4B8",
+                "vllm::kU8B128",
             ]:
                 continue
             if thread_configs[2] == 256:
diff --git a/csrc/quantization/gptq_marlin/generate_kernels.py b/csrc/quantization/gptq_marlin/generate_kernels.py
index 7576e0548abe..42d3b456096e 100644
--- a/csrc/quantization/gptq_marlin/generate_kernels.py
+++ b/csrc/quantization/gptq_marlin/generate_kernels.py
@@ -17,28 +17,32 @@
 namespace MARLIN_NAMESPACE_NAME {
 """.strip()
 
-TEMPLATE = ("template __global__ void Marlin<"
-            "{{scalar_t}}, "
-            "{{w_type_id}}, "
-            "{{s_type_id}}, "
-            "{{threads}}, "
-            "{{thread_m_blocks}}, "
-            "{{thread_n_blocks}}, "
-            "{{thread_k_blocks}}, "
-            "{{'true' if m_block_size_8 else 'false'}}, "
-            "{{stages}}, "
-            "{{group_blocks}}, "
-            "{{'true' if is_zp_float else 'false'}}>"
-            "( MARLIN_KERNEL_PARAMS );")
+TEMPLATE = (
+    "template __global__ void Marlin<"
+    "{{scalar_t}}, "
+    "{{w_type_id}}, "
+    "{{s_type_id}}, "
+    "{{threads}}, "
+    "{{thread_m_blocks}}, "
+    "{{thread_n_blocks}}, "
+    "{{thread_k_blocks}}, "
+    "{{'true' if m_block_size_8 else 'false'}}, "
+    "{{stages}}, "
+    "{{group_blocks}}, "
+    "{{'true' if is_zp_float else 'false'}}>"
+    "( MARLIN_KERNEL_PARAMS );"
+)
 
 # int8 with zero point case (vllm::kU8) is also supported,
 # we don't add it to reduce wheel size.
 SCALAR_TYPES = [
-    "vllm::kU4", "vllm::kU4B8", "vllm::kU8B128", "vllm::kFE4M3fn",
-    "vllm::kFE2M1f"
+    "vllm::kU4",
+    "vllm::kU4B8",
+    "vllm::kU8B128",
+    "vllm::kFE4M3fn",
+    "vllm::kFE2M1f",
 ]
-THREAD_CONFIGS = [(128, 128, 256), (64, 256, 256), (64, 128, 128),
-                  (128, 64, 128)]
+THREAD_CONFIGS = [(128, 128, 256), (64, 256, 256), (64, 128, 128), (128, 64, 128)]
 
 THREAD_M_BLOCKS = [0.5, 1, 2, 3, 4]
 # group_blocks:
@@ -59,11 +63,12 @@ def generate_new_kernels():
         all_template_str_list = []
 
         for group_blocks, m_blocks, thread_configs in itertools.product(
-                GROUP_BLOCKS, THREAD_M_BLOCKS, THREAD_CONFIGS):
-
+            GROUP_BLOCKS, THREAD_M_BLOCKS, THREAD_CONFIGS
+        ):
             # act order case only support gptq-int4 and gptq-int8
             if group_blocks == 0 and scalar_type not in [
-                    "vllm::kU4B8", "vllm::kU8B128"
+                "vllm::kU4B8",
+                "vllm::kU8B128",
             ]:
                 continue
             if thread_configs[2] == 256:
@@ -93,8 +98,7 @@ def generate_new_kernels():
             c_dtype = "half" if dtype == "fp16" else "nv_bfloat16"
 
             is_zp_float_list = [False]
-            if dtype == "fp16" and scalar_type == "vllm::kU4" and \
-                    group_blocks == 4:
+            if dtype == "fp16" and scalar_type == "vllm::kU4" and group_blocks == 4:
                 # HQQ (is_zp_float = true) only supports
                 # 4bit quantization and fp16
                 is_zp_float_list.append(True)
diff --git a/csrc/quantization/machete/generate.py b/csrc/quantization/machete/generate.py
index 8fd536ef46e3..f7106f016b3e 100644
--- a/csrc/quantization/machete/generate.py
+++ b/csrc/quantization/machete/generate.py
@@ -12,18 +12,24 @@
 from typing import Optional, Union
 
 import jinja2
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm_cutlass_library_extension import (DataType, EpilogueScheduleTag,
-                                            EpilogueScheduleType,
-                                            MixedInputKernelScheduleType,
-                                            TileSchedulerTag,
-                                            TileSchedulerType, VLLMDataType,
-                                            VLLMDataTypeNames,
-                                            VLLMDataTypeSize, VLLMDataTypeTag,
-                                            VLLMDataTypeTorchDataTypeTag,
-                                            VLLMDataTypeVLLMScalarTypeTag,
-                                            VLLMKernelScheduleTag)
+from vllm_cutlass_library_extension import (
+    DataType,
+    EpilogueScheduleTag,
+    EpilogueScheduleType,
+    MixedInputKernelScheduleType,
+    TileSchedulerTag,
+    TileSchedulerType,
+    VLLMDataType,
+    VLLMDataTypeNames,
+    VLLMDataTypeSize,
+    VLLMDataTypeTag,
+    VLLMDataTypeTorchDataTypeTag,
+    VLLMDataTypeVLLMScalarTypeTag,
+    VLLMKernelScheduleTag,
+)
 
 # yapf: enable
 
@@ -286,18 +292,23 @@ def generate_sch_sig(schedule_config: ScheduleConfig) -> str:
     tile_shape = (
         f"{schedule_config.tile_shape_mn[0]}x{schedule_config.tile_shape_mn[1]}"
     )
-    cluster_shape = (f"{schedule_config.cluster_shape_mnk[0]}" +
-                     f"x{schedule_config.cluster_shape_mnk[1]}" +
-                     f"x{schedule_config.cluster_shape_mnk[2]}")
-    kernel_schedule = VLLMKernelScheduleTag[schedule_config.kernel_schedule]\
-        .split("::")[-1]
-    epilogue_schedule = EpilogueScheduleTag[
-        schedule_config.epilogue_schedule].split("::")[-1]
-    tile_scheduler = TileSchedulerTag[schedule_config.tile_scheduler]\
-        .split("::")[-1]
-
-    return (f"{tile_shape}_{cluster_shape}_{kernel_schedule}" +
-            f"_{epilogue_schedule}_{tile_scheduler}")
+    cluster_shape = (
+        f"{schedule_config.cluster_shape_mnk[0]}"
+        + f"x{schedule_config.cluster_shape_mnk[1]}"
+        + f"x{schedule_config.cluster_shape_mnk[2]}"
+    )
+    kernel_schedule = VLLMKernelScheduleTag[schedule_config.kernel_schedule].split(
+        "::"
+    )[-1]
+    epilogue_schedule = EpilogueScheduleTag[schedule_config.epilogue_schedule].split(
+        "::"
+    )[-1]
+    tile_scheduler = TileSchedulerTag[schedule_config.tile_scheduler].split("::")[-1]
+
+    return (
+        f"{tile_shape}_{cluster_shape}_{kernel_schedule}"
+        + f"_{epilogue_schedule}_{tile_scheduler}"
+    )
 
 
 # mostly unique shorter sch_sig
@@ -316,18 +327,24 @@ def generate_terse_sch_sig(schedule_config: ScheduleConfig) -> str:
 
 # unique type_name
 def generate_type_signature(kernel_types: TypeConfig):
-    return str("".join([
-        VLLMDataTypeNames[getattr(kernel_types, field.name)]
-        for field in fields(TypeConfig)
-    ]))
+    return str(
+        "".join(
+            [
+                VLLMDataTypeNames[getattr(kernel_types, field.name)]
+                for field in fields(TypeConfig)
+            ]
+        )
+    )
 
 
 def generate_type_option_name(kernel_types: TypeConfig):
-    return ", ".join([
-        f"{field.name.replace('b_', 'with_')+'_type'}=" +
-        VLLMDataTypeNames[getattr(kernel_types, field.name)]
-        for field in fields(TypeConfig)
-    ])
+    return ", ".join(
+        [
+            f"{field.name.replace('b_', 'with_') + '_type'}="
+            + VLLMDataTypeNames[getattr(kernel_types, field.name)]
+            for field in fields(TypeConfig)
+        ]
+    )
 
 
 def is_power_of_two(n):
@@ -335,7 +352,6 @@ def is_power_of_two(n):
 
 
 def to_cute_constant(value: list[int]):
-
     def _to_cute_constant(value: int):
         if is_power_of_two(value):
             return f"_{value}"
@@ -350,11 +366,11 @@ def _to_cute_constant(value: int):
 
 def unique_schedules(impl_configs: list[ImplConfig]):
     # Use dict over set for deterministic ordering
-    return list({
-        sch: None
-        for impl_config in impl_configs
-        for sch in impl_config.schedules
-    }.keys())
+    return list(
+        {
+            sch: None for impl_config in impl_configs for sch in impl_config.schedules
+        }.keys()
+    )
 
 
 def unsigned_type_with_bitwidth(num_bits):
@@ -380,7 +396,7 @@ def unsigned_type_with_bitwidth(num_bits):
     "gen_type_sig": generate_type_signature,
     "unique_schedules": unique_schedules,
     "unsigned_type_with_bitwidth": unsigned_type_with_bitwidth,
-    "gen_type_option_name": generate_type_option_name
+    "gen_type_option_name": generate_type_option_name,
 }
 
 
@@ -398,23 +414,28 @@ def create_template(template_str):
 def create_sources(impl_configs: list[ImplConfig], num_impl_files=8):
     sources = []
 
-    sources.append((
-        "machete_mm_dispatch",
-        mm_dispatch_template.render(impl_configs=impl_configs),
-    ))
+    sources.append(
+        (
+            "machete_mm_dispatch",
+            mm_dispatch_template.render(impl_configs=impl_configs),
+        )
+    )
 
     prepack_types = []
     for impl_config in impl_configs:
-        convert_type = impl_config.types.a \
-             if impl_config.types.b_group_scale == DataType.void \
-             else impl_config.types.b_group_scale
+        convert_type = (
+            impl_config.types.a
+            if impl_config.types.b_group_scale == DataType.void
+            else impl_config.types.b_group_scale
+        )
         prepack_types.append(
             PrepackTypeConfig(
                 a=impl_config.types.a,
                 b_num_bits=VLLMDataTypeSize[impl_config.types.b],
                 convert=convert_type,
                 accumulator=impl_config.types.accumulator,
-            ))
+            )
+        )
 
     def prepacked_type_key(prepack_type: PrepackTypeConfig):
         # For now, we can just use the first accumulator type seen since
@@ -430,10 +451,14 @@ def prepacked_type_key(prepack_type: PrepackTypeConfig):
             unique_prepack_types.append(prepack_type)
             prepack_types_seen.add(key)
 
-    sources.append((
-        "machete_prepack",
-        prepack_dispatch_template.render(types=unique_prepack_types, ),
-    ))
+    sources.append(
+        (
+            "machete_prepack",
+            prepack_dispatch_template.render(
+                types=unique_prepack_types,
+            ),
+        )
+    )
 
     # Split up impls across files
     num_impls = reduce(lambda x, y: x + len(y.schedules), impl_configs, 0)
@@ -466,10 +491,12 @@ def prepacked_type_key(prepack_type: PrepackTypeConfig):
         curr_impl_in_file += len(files_impls[-1][-1].schedules)
 
     for part, file_impls in enumerate(files_impls):
-        sources.append((
-            f"machete_mm_impl_part{part+1}",
-            mm_impl_template.render(impl_configs=file_impls),
-        ))
+        sources.append(
+            (
+                f"machete_mm_impl_part{part + 1}",
+                mm_impl_template.render(impl_configs=file_impls),
+            )
+        )
 
     return sources
 
@@ -514,8 +541,7 @@ def generate():
     # For now we use the same heuristic for all types
     # Heuristic is currently tuned for H100s
     default_heuristic = [
-        (cond, ScheduleConfig(*tile_config,
-                              **sch_common_params))  # type: ignore
+        (cond, ScheduleConfig(*tile_config, **sch_common_params))  # type: ignore
         for cond, tile_config in default_tile_heuristic_config.items()
     ]
 
@@ -541,14 +567,18 @@ def get_unique_schedules(heuristic: dict[str, ScheduleConfig]):
             a_token_scale=DataType.void,
             out=a,
             accumulator=DataType.f32,
-        ) for b in (VLLMDataType.u4b8, VLLMDataType.u8b128)
-        for a in (DataType.f16, DataType.bf16))
+        )
+        for b in (VLLMDataType.u4b8, VLLMDataType.u8b128)
+        for a in (DataType.f16, DataType.bf16)
+    )
 
     impl_configs += [
         ImplConfig(x[0], x[1], x[2])
-        for x in zip(GPTQ_kernel_type_configs,
-                     itertools.repeat(get_unique_schedules(default_heuristic)),
-                     itertools.repeat(default_heuristic))
+        for x in zip(
+            GPTQ_kernel_type_configs,
+            itertools.repeat(get_unique_schedules(default_heuristic)),
+            itertools.repeat(default_heuristic),
+        )
     ]
 
     AWQ_kernel_type_configs = list(
@@ -561,14 +591,18 @@ def get_unique_schedules(heuristic: dict[str, ScheduleConfig]):
             a_token_scale=DataType.void,
             out=a,
             accumulator=DataType.f32,
-        ) for b in (DataType.u4, DataType.u8)
-        for a in (DataType.f16, DataType.bf16))
+        )
+        for b in (DataType.u4, DataType.u8)
+        for a in (DataType.f16, DataType.bf16)
+    )
 
     impl_configs += [
         ImplConfig(x[0], x[1], x[2])
-        for x in zip(AWQ_kernel_type_configs,
-                     itertools.repeat(get_unique_schedules(default_heuristic)),
-                     itertools.repeat(default_heuristic))
+        for x in zip(
+            AWQ_kernel_type_configs,
+            itertools.repeat(get_unique_schedules(default_heuristic)),
+            itertools.repeat(default_heuristic),
+        )
     ]
 
     # TODO: Support W4A8 when ready
diff --git a/docs/mkdocs/hooks/generate_argparse.py b/docs/mkdocs/hooks/generate_argparse.py
index d026235dd9d5..ecd71ee1f3f6 100644
--- a/docs/mkdocs/hooks/generate_argparse.py
+++ b/docs/mkdocs/hooks/generate_argparse.py
@@ -33,8 +33,11 @@ def auto_mock(module, attr, max_mocks=50):
         try:
             # First treat attr as an attr, then as a submodule
             with patch("importlib.metadata.version", return_value="0.0.0"):
-                return getattr(importlib.import_module(module), attr,
-                               importlib.import_module(f"{module}.{attr}"))
+                return getattr(
+                    importlib.import_module(module),
+                    attr,
+                    importlib.import_module(f"{module}.{attr}"),
+                )
         except importlib.metadata.PackageNotFoundError as e:
             raise e
         except ModuleNotFoundError as e:
@@ -42,7 +45,8 @@ def auto_mock(module, attr, max_mocks=50):
             sys.modules[e.name] = PydanticMagicMock()
 
     raise ImportError(
-        f"Failed to import {module}.{attr} after mocking {max_mocks} imports")
+        f"Failed to import {module}.{attr} after mocking {max_mocks} imports"
+    )
 
 
 latency = auto_mock("vllm.benchmarks", "latency")
@@ -61,9 +65,7 @@ class MarkdownFormatter(HelpFormatter):
     """Custom formatter that generates markdown for argument groups."""
 
     def __init__(self, prog, starting_heading_level=3):
-        super().__init__(prog,
-                         max_help_position=float('inf'),
-                         width=float('inf'))
+        super().__init__(prog, max_help_position=float("inf"), width=float("inf"))
         self._section_heading_prefix = "#" * starting_heading_level
         self._argument_heading_prefix = "#" * (starting_heading_level + 1)
         self._markdown_output = []
@@ -85,23 +87,19 @@ def add_usage(self, usage, actions, groups, prefix=None):
 
     def add_arguments(self, actions):
         for action in actions:
-            if (len(action.option_strings) == 0
-                    or "--help" in action.option_strings):
+            if len(action.option_strings) == 0 or "--help" in action.option_strings:
                 continue
 
-            option_strings = f'`{"`, `".join(action.option_strings)}`'
+            option_strings = f"`{'`, `'.join(action.option_strings)}`"
             heading_md = f"{self._argument_heading_prefix} {option_strings}\n\n"
             self._markdown_output.append(heading_md)
 
             if choices := action.choices:
-                choices = f'`{"`, `".join(str(c) for c in choices)}`'
-                self._markdown_output.append(
-                    f"Possible choices: {choices}\n\n")
-            elif ((metavar := action.metavar)
-                  and isinstance(metavar, (list, tuple))):
-                metavar = f'`{"`, `".join(str(m) for m in metavar)}`'
-                self._markdown_output.append(
-                    f"Possible choices: {metavar}\n\n")
+                choices = f"`{'`, `'.join(str(c) for c in choices)}`"
+                self._markdown_output.append(f"Possible choices: {choices}\n\n")
+            elif (metavar := action.metavar) and isinstance(metavar, (list, tuple)):
+                metavar = f"`{'`, `'.join(str(m) for m in metavar)}`"
+                self._markdown_output.append(f"Possible choices: {metavar}\n\n")
 
             if action.help:
                 self._markdown_output.append(f"{action.help}\n\n")
@@ -116,7 +114,7 @@ def format_help(self):
 
 def create_parser(add_cli_args, **kwargs) -> FlexibleArgumentParser:
     """Create a parser for the given class with markdown formatting.
-    
+
     Args:
         cls: The class to create a parser for
         **kwargs: Additional keyword arguments to pass to `cls.add_cli_args`.
@@ -143,24 +141,17 @@ def on_startup(command: Literal["build", "gh-deploy", "serve"], dirty: bool):
 
     # Create parsers to document
     parsers = {
-        "engine_args":
-        create_parser(EngineArgs.add_cli_args),
-        "async_engine_args":
-        create_parser(AsyncEngineArgs.add_cli_args, async_args_only=True),
-        "serve":
-        create_parser(cli_args.make_arg_parser),
-        "chat":
-        create_parser(ChatCommand.add_cli_args),
-        "complete":
-        create_parser(CompleteCommand.add_cli_args),
-        "bench_latency":
-        create_parser(latency.add_cli_args),
-        "bench_throughput":
-        create_parser(throughput.add_cli_args),
-        "bench_serve":
-        create_parser(serve.add_cli_args),
-        "run-batch":
-        create_parser(run_batch.make_arg_parser),
+        "engine_args": create_parser(EngineArgs.add_cli_args),
+        "async_engine_args": create_parser(
+            AsyncEngineArgs.add_cli_args, async_args_only=True
+        ),
+        "serve": create_parser(cli_args.make_arg_parser),
+        "chat": create_parser(ChatCommand.add_cli_args),
+        "complete": create_parser(CompleteCommand.add_cli_args),
+        "bench_latency": create_parser(latency.add_cli_args),
+        "bench_throughput": create_parser(throughput.add_cli_args),
+        "bench_serve": create_parser(serve.add_cli_args),
+        "run-batch": create_parser(run_batch.make_arg_parser),
     }
 
     # Generate documentation for each parser
diff --git a/docs/mkdocs/hooks/generate_examples.py b/docs/mkdocs/hooks/generate_examples.py
index 0cbaebb598a3..ed8277f628d4 100644
--- a/docs/mkdocs/hooks/generate_examples.py
+++ b/docs/mkdocs/hooks/generate_examples.py
@@ -11,7 +11,7 @@
 logger = logging.getLogger("mkdocs")
 
 ROOT_DIR = Path(__file__).parent.parent.parent.parent
-ROOT_DIR_RELATIVE = '../../../../..'
+ROOT_DIR_RELATIVE = "../../../../.."
 EXAMPLE_DIR = ROOT_DIR / "examples"
 EXAMPLE_DOC_DIR = ROOT_DIR / "docs/examples"
 
@@ -36,7 +36,7 @@ def fix_case(text: str) -> str:
         r"int\d+": lambda x: x.group(0).upper(),  # e.g. int8, int16
     }
     for pattern, repl in subs.items():
-        text = re.sub(rf'\b{pattern}\b', repl, text, flags=re.IGNORECASE)
+        text = re.sub(rf"\b{pattern}\b", repl, text, flags=re.IGNORECASE)
     return text
 
 
@@ -58,7 +58,8 @@ class Example:
         determine_other_files() -> list[Path]: Determines other files in the directory excluding the main file.
         determine_title() -> str: Determines the title of the document.
         generate() -> str: Generates the documentation content.
-    """ # noqa: E501
+    """  # noqa: E501
+
     path: Path
     category: str = None
     main_file: Path = field(init=False)
@@ -84,9 +85,8 @@ def determine_main_file(self) -> Path:
             Markdown file found in the directory.
         Raises:
             IndexError: If no Markdown files are found in the directory.
-        """ # noqa: E501
-        return self.path if self.path.is_file() else list(
-            self.path.glob("*.md")).pop()
+        """  # noqa: E501
+        return self.path if self.path.is_file() else list(self.path.glob("*.md")).pop()
 
     def determine_other_files(self) -> list[Path]:
         """
@@ -98,7 +98,7 @@ def determine_other_files(self) -> list[Path]:
 
         Returns:
             list[Path]: A list of Path objects representing the other files in the directory.
-        """ # noqa: E501
+        """  # noqa: E501
         if self.path.is_file():
             return []
         is_other_file = lambda file: file.is_file() and file != self.main_file
@@ -109,25 +109,25 @@ def determine_title(self) -> str:
             # Specify encoding for building on Windows
             with open(self.main_file, encoding="utf-8") as f:
                 first_line = f.readline().strip()
-            match = re.match(r'^#\s+(?P<title>.+)$', first_line)
+            match = re.match(r"^#\s+(?P<title>.+)$", first_line)
             if match:
-                return match.group('title')
+                return match.group("title")
         return fix_case(self.path.stem.replace("_", " ").title())
 
     def fix_relative_links(self, content: str) -> str:
         """
         Fix relative links in markdown content by converting them to gh-file
         format.
-        
+
         Args:
             content (str): The markdown content to process
-            
+
         Returns:
             str: Content with relative links converted to gh-file format
         """
         # Regex to match markdown links [text](relative_path)
         # This matches links that don't start with http, https, ftp, or #
-        link_pattern = r'\[([^\]]*)\]\((?!(?:https?|ftp)://|#)([^)]+)\)'
+        link_pattern = r"\[([^\]]*)\]\((?!(?:https?|ftp)://|#)([^)]+)\)"
 
         def replace_link(match):
             link_text = match.group(1)
@@ -137,7 +137,7 @@ def replace_link(match):
             gh_file = (self.main_file.parent / relative_path).resolve()
             gh_file = gh_file.relative_to(ROOT_DIR)
 
-            return f'[{link_text}](gh-file:{gh_file})'
+            return f"[{link_text}](gh-file:{gh_file})"
 
         return re.sub(link_pattern, replace_link, content)
 
@@ -150,9 +150,11 @@ def generate(self) -> str:
         code_fence = "``````"
 
         if self.is_code:
-            content += (f"{code_fence}{self.main_file.suffix[1:]}\n"
-                        f'--8<-- "{self.main_file}"\n'
-                        f"{code_fence}\n")
+            content += (
+                f"{code_fence}{self.main_file.suffix[1:]}\n"
+                f'--8<-- "{self.main_file}"\n'
+                f"{code_fence}\n"
+            )
         else:
             with open(self.main_file) as f:
                 # Skip the title from md snippets as it's been included above
diff --git a/docs/mkdocs/hooks/remove_announcement.py b/docs/mkdocs/hooks/remove_announcement.py
index 1a84039abc14..12db2265b9f8 100644
--- a/docs/mkdocs/hooks/remove_announcement.py
+++ b/docs/mkdocs/hooks/remove_announcement.py
@@ -7,7 +7,7 @@
 
 def on_startup(command: Literal["build", "gh-deploy", "serve"], dirty: bool):
     # see https://docs.readthedocs.io/en/stable/reference/environment-variables.html # noqa
-    if os.getenv('READTHEDOCS_VERSION_TYPE') == "tag":
+    if os.getenv("READTHEDOCS_VERSION_TYPE") == "tag":
         # remove the warning banner if the version is a tagged release
         mkdocs_dir = Path(__file__).parent.parent
         announcement_path = mkdocs_dir / "overrides/main.html"
diff --git a/docs/mkdocs/hooks/url_schemes.py b/docs/mkdocs/hooks/url_schemes.py
index 6fce6bd8130e..53b1fbca26b9 100644
--- a/docs/mkdocs/hooks/url_schemes.py
+++ b/docs/mkdocs/hooks/url_schemes.py
@@ -25,8 +25,9 @@
 from mkdocs.structure.pages import Page
 
 
-def on_page_markdown(markdown: str, *, page: Page, config: MkDocsConfig,
-                     files: Files) -> str:
+def on_page_markdown(
+    markdown: str, *, page: Page, config: MkDocsConfig, files: Files
+) -> str:
     """
     Custom MkDocs plugin hook to rewrite special GitHub reference links
     in Markdown.
@@ -35,7 +36,7 @@ def on_page_markdown(markdown: str, *, page: Page, config: MkDocsConfig,
     GitHub shorthand links, such as:
       - `[Link text](gh-issue:123)`
       - `<gh-pr:456>`
-    
+
     And rewrites them into fully-qualified GitHub URLs with GitHub icons:
       - `[:octicons-mark-github-16: Link text](https://github.com/vllm-project/vllm/issues/123)`
       - `[:octicons-mark-github-16: Pull Request #456](https://github.com/vllm-project/vllm/pull/456)`
@@ -88,21 +89,21 @@ def replace_inline_link(match: re.Match) -> str:
         """
         Replaces a matched inline-style GitHub shorthand link
         with a full Markdown link.
-        
+
         Example:
             [My issue](gh-issue:123) → [:octicons-mark-github-16: My issue](https://github.com/vllm-project/vllm/issues/123)
         """
-        url = f'{urls[match.group("type")]}/{match.group("path")}'
+        url = f"{urls[match.group('type')]}/{match.group('path')}"
         if fragment := match.group("fragment"):
             url += f"#{fragment}"
 
-        return f'[{gh_icon} {match.group("title")}]({url})'
+        return f"[{gh_icon} {match.group('title')}]({url})"
 
     def replace_auto_link(match: re.Match) -> str:
         """
         Replaces a matched autolink-style GitHub shorthand
         with a full Markdown link.
-        
+
         Example:
             <gh-pr:456> → [:octicons-mark-github-16: Pull Request #456](https://github.com/vllm-project/vllm/pull/456)
         """
diff --git a/examples/pyproject.toml b/examples/pyproject.toml
deleted file mode 100644
index f825cb203269..000000000000
--- a/examples/pyproject.toml
+++ /dev/null
@@ -1,54 +0,0 @@
-# This local pyproject file is part of the migration from yapf to ruff format.
-# It uses the same core rules as the main pyproject.toml file, but with the
-# following differences:
-# - ruff line length is overridden to 88
-# - deprecated typing ignores (UP006, UP035) have been removed
-
-[tool.ruff]
-line-length = 88
-exclude = [
-    # External file, leaving license intact
-    "examples/other/fp8/quantizer/quantize.py",
-    "vllm/vllm_flash_attn/flash_attn_interface.pyi"
-]
-
-[tool.ruff.lint.per-file-ignores]
-"vllm/third_party/**" = ["ALL"]
-"vllm/version.py" = ["F401"]
-"vllm/_version.py" = ["ALL"]
-
-[tool.ruff.lint]
-select = [
-    # pycodestyle
-    "E",
-    # Pyflakes
-    "F",
-    # pyupgrade
-    "UP",
-    # flake8-bugbear
-    "B",
-    # flake8-simplify
-    "SIM",
-    # isort
-    "I",
-    # flake8-logging-format
-    "G",
-]
-ignore = [
-    # star imports
-    "F405", "F403",
-    # lambda expression assignment
-    "E731",
-    # Loop control variable not used within loop body
-    "B007",
-    # f-string format
-    "UP032",
-    # Can remove once 3.10+ is the minimum Python version
-    "UP007",
-]
-
-[tool.ruff.lint.isort]
-known-first-party = ["vllm"]
-
-[tool.ruff.format]
-docstring-code-format = true
\ No newline at end of file
diff --git a/pyproject.toml b/pyproject.toml
index 034a21f1c12b..2b416d3206c2 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -52,27 +52,106 @@ lora_filesystem_resolver = "vllm.plugins.lora_resolvers.filesystem_resolver:regi
 where = ["."]
 include = ["vllm*"]
 
-[tool.yapfignore]
-ignore_patterns = [
-    ".buildkite/**",
-    "benchmarks/**",
-    "build/**",
-    "examples/**",
-]
-
-[tool.ruff]
-# Allow lines to be as long as 80.
-line-length = 80
-
 [tool.ruff.lint.per-file-ignores]
 "vllm/third_party/**" = ["ALL"]
 "vllm/version.py" = ["F401"]
 "vllm/_version.py" = ["ALL"]
-# Python 3.8 typing - skip V0 code
-"vllm/attention/**/*.py" = ["UP006", "UP035"]
-"vllm/engine/**/*.py" = ["UP006", "UP035"]
-"vllm/executor/**/*.py" = ["UP006", "UP035"]
-"vllm/worker/**/*.py" = ["UP006", "UP035"]
+# TEMPORARY! These ignores will be fixed forward
+## Line length violations
+"csrc/cutlass_extensions/vllm_cutlass_library_extension.py" = ["E501"]
+"tests/compile/piecewise/test_simple.py" = ["E501"]
+"tests/compile/piecewise/test_toy_llama.py" = ["E501", "B023"]
+"tests/entrypoints/conftest.py" = ["E501"]
+"tests/entrypoints/openai/test_audio.py" = ["E501"]
+"tests/entrypoints/openai/test_chat.py" = ["E501"]
+"tests/entrypoints/openai/test_chat_template.py" = ["E501"]
+"tests/entrypoints/openai/test_chat_with_tool_reasoning.py" = ["E501"]
+"tests/entrypoints/openai/test_completion_with_function_calling.py" = ["E501"]
+"tests/entrypoints/openai/test_video.py" = ["E501"]
+"tests/entrypoints/openai/test_vision.py" = ["E501"]
+"tests/entrypoints/test_chat_utils.py" = ["E501"]
+"tests/kernels/moe/modular_kernel_tools/common.py" = ["E501"]
+"tests/models/language/generation/test_gemma.py" = ["E501"]
+"tests/models/language/generation/test_mistral.py" = ["E501"]
+"tests/models/multimodal/generation/test_ultravox.py" = ["E501"]
+"tests/models/multimodal/generation/test_voxtral.py" = ["E501"]
+"tests/models/multimodal/generation/vlm_utils/custom_inputs.py" = ["E501"]
+"tests/tool_use/test_tool_choice_required.py" = ["E501"]
+"tests/v1/attention/utils.py" = ["E501"]
+"tests/v1/entrypoints/openai/responses/test_image.py" = ["E501"]
+"tests/v1/kv_connector/nixl_integration/test_accuracy.py" = ["E501"]
+"tests/v1/kv_connector/unit/test_offloading_connector.py" = ["E501"]
+"tests/v1/logits_processors/test_custom_offline.py" = ["E501"]
+"vllm/attention/ops/pallas_kv_cache_update.py" = ["E501"]
+"vllm/compilation/collective_fusion.py" = ["E501"]
+"vllm/compilation/wrapper.py" = ["E501"]
+"vllm/config/vllm.py" = ["E501"]
+"vllm/distributed/device_communicators/all2all.py" = ["E501"]
+"vllm/entrypoints/openai/protocol.py" = ["E501"]
+"vllm/lora/layers/vocal_parallel_embedding.py" = ["E501"]
+"vllm/model_executor/model_loader/bitsandbytes_loader.py" = ["E501"]
+"vllm/model_executor/models/bailing_moe.py" = ["E501"]
+"vllm/model_executor/models/hyperclovax_vision.py" = ["E501"]
+"vllm/model_executor/models/llama4_eagle.py" = ["E501"]
+"vllm/model_executor/models/longcat_flash_mtp.py" = ["E501"]
+"vllm/model_executor/models/phi4mm.py" = ["E501"]
+"vllm/model_executor/models/qwen3_next.py" = ["E501"]
+"vllm/model_executor/layers/quantization/ptpc_fp8.py" = ["E501"]
+"vllm/v1/attention/backends/mla/common.py" = ["E501"]
+"vllm/v1/engine/utils.py" = ["E501"]
+"vllm/v1/utils.py" = ["E501"]
+"vllm/v1/worker/gpu_model_runner.py" = ["E501"]
+## Simplification rules
+"tests/distributed/test_expert_placement.py" = ["SIM108"]
+"tests/kernels/attention/test_cutlass_mla_decode.py" = ["SIM108"]
+"tests/kernels/attention/test_flashmla.py" = ["SIM108"]
+"tests/kernels/attention/test_lightning_attn.py" = ["SIM108"]
+"tests/kernels/moe/test_pplx_moe.py" = ["SIM108"]
+"tests/kernels/quantization/test_cutlass_scaled_mm.py" = ["SIM108"]
+"tests/kernels/test_onednn.py" = ["SIM108"]
+"tests/kernels/utils.py" = ["SIM108"]
+"tests/multimodal/test_processing.py" = ["SIM108"]
+"vllm/attention/ops/triton_reshape_and_cache_flash.py" = ["SIM108"]
+"vllm/distributed/parallel_state.py" = ["SIM108"]
+"vllm/entrypoints/chat_utils.py" = ["SIM108"]
+"vllm/entrypoints/llm.py" = ["SIM108"]
+"vllm/model_executor/layers/batch_invariant.py" = ["SIM108"]
+"vllm/model_executor/layers/fla/ops/chunk_o.py" = ["SIM108"]
+"vllm/model_executor/layers/fused_moe/fused_moe.py" = ["SIM108"]
+"vllm/model_executor/layers/fused_moe/layer.py" = ["SIM108"]
+"vllm/model_executor/layers/fused_moe/modular_kernel.py" = ["SIM108"]
+"vllm/model_executor/layers/fused_moe/rocm_aiter_fused_moe.py" = ["SIM108"]
+"vllm/model_executor/layers/layernorm.py" = ["SIM108"]
+"vllm/model_executor/layers/lightning_attn.py" = ["SIM108"]
+"vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors.py" = ["SIM103"]
+"vllm/model_executor/layers/quantization/compressed_tensors/utils.py" = ["SIM110"]
+"vllm/model_executor/layers/quantization/quark/utils.py" = ["SIM110"]
+"vllm/utils/__init__.py" = ["SIM108"]
+"vllm/v1/sample/ops/bad_words.py" = ["SIM108"]
+"vllm/v1/sample/rejection_sampler.py" = ["SIM108"]
+"vllm/v1/worker/tpu_model_runner.py" = ["SIM108"]
+"vllm/_custom_ops.py" = ["SIM108"]
+"tools/profiler/print_layerwise_table.py" = ["SIM118"]
+## Loop variable binding issues
+"tests/kernels/mamba/test_mamba_ssm_ssd.py" = ["B023"]
+## Type annotation modernization and other rules
+"vllm/attention/backends/abstract.py" = ["UP035", "UP006"]
+"vllm/attention/layer.py" = ["UP035", "UP006"]
+"vllm/attention/layers/chunked_local_attention.py" = ["UP035", "UP006"]
+"vllm/attention/ops/flashmla.py" = ["UP035", "UP006"]
+"vllm/attention/ops/paged_attn.py" = ["UP035", "UP006"]
+"vllm/engine/arg_utils.py" = ["UP035", "UP006"]
+"vllm/engine/metrics.py" = ["UP035", "UP006"]
+"vllm/engine/metrics_types.py" = ["UP035", "UP006"]
+"vllm/executor/executor_base.py" = ["UP035", "UP006"]
+"vllm/executor/msgspec_utils.py" = ["UP035", "UP006"]
+"vllm/executor/ray_distributed_executor.py" = ["UP035", "UP006", "SIM108", "SIM112"]
+"vllm/executor/ray_utils.py" = ["UP035", "UP006"]
+"vllm/executor/uniproc_executor.py" = ["UP035", "UP006"]
+"vllm/model_executor/layers/fused_moe/flashinfer_trtllm_moe.py" = ["UP035"]
+## Type comparison issues
+"vllm/multimodal/inputs.py" = ["E721"]
+# End of temporary ignores
 
 [tool.ruff.lint]
 select = [
@@ -87,7 +166,7 @@ select = [
     # flake8-simplify
     "SIM",
     # isort
-    # "I",
+    "I",
     # flake8-logging-format
     "G",
 ]
@@ -104,21 +183,15 @@ ignore = [
     "UP007",
 ]
 
+[tool.ruff.format]
+docstring-code-format = true
+
 [tool.mypy]
 plugins = ['pydantic.mypy']
 ignore_missing_imports = true
 check_untyped_defs = true
 follow_imports = "silent"
 
-[tool.isort]
-skip_glob = [
-    ".buildkite/*",
-    "benchmarks/*",
-    "examples/*",
-]
-use_parentheses = true
-skip_gitignore = true
-
 [tool.pytest.ini_options]
 markers = [
     "slow_test",
diff --git a/setup.py b/setup.py
index fcd9570beae1..53c460d2c5b8 100644
--- a/setup.py
+++ b/setup.py
@@ -34,32 +34,36 @@ def load_module_from_path(module_name, path):
 
 # cannot import envs directly because it depends on vllm,
 #  which is not installed yet
-envs = load_module_from_path('envs', os.path.join(ROOT_DIR, 'vllm', 'envs.py'))
+envs = load_module_from_path("envs", os.path.join(ROOT_DIR, "vllm", "envs.py"))
 
 VLLM_TARGET_DEVICE = envs.VLLM_TARGET_DEVICE
 
 if sys.platform.startswith("darwin") and VLLM_TARGET_DEVICE != "cpu":
-    logger.warning(
-        "VLLM_TARGET_DEVICE automatically set to `cpu` due to macOS")
+    logger.warning("VLLM_TARGET_DEVICE automatically set to `cpu` due to macOS")
     VLLM_TARGET_DEVICE = "cpu"
-elif not (sys.platform.startswith("linux")
-          or sys.platform.startswith("darwin")):
+elif not (sys.platform.startswith("linux") or sys.platform.startswith("darwin")):
     logger.warning(
         "vLLM only supports Linux platform (including WSL) and MacOS."
         "Building on %s, "
-        "so vLLM may not be able to run correctly", sys.platform)
+        "so vLLM may not be able to run correctly",
+        sys.platform,
+    )
     VLLM_TARGET_DEVICE = "empty"
-elif (sys.platform.startswith("linux") and torch.version.cuda is None
-      and os.getenv("VLLM_TARGET_DEVICE") is None
-      and torch.version.hip is None):
+elif (
+    sys.platform.startswith("linux")
+    and torch.version.cuda is None
+    and os.getenv("VLLM_TARGET_DEVICE") is None
+    and torch.version.hip is None
+):
     # if cuda or hip is not available and VLLM_TARGET_DEVICE is not set,
     # fallback to cpu
     VLLM_TARGET_DEVICE = "cpu"
 
 
 def is_sccache_available() -> bool:
-    return which("sccache") is not None and \
-        not bool(int(os.getenv("VLLM_DISABLE_SCCACHE", "0")))
+    return which("sccache") is not None and not bool(
+        int(os.getenv("VLLM_DISABLE_SCCACHE", "0"))
+    )
 
 
 def is_ccache_available() -> bool:
@@ -83,8 +87,7 @@ def is_url_available(url: str) -> bool:
 
 
 class CMakeExtension(Extension):
-
-    def __init__(self, name: str, cmake_lists_dir: str = '.', **kwa) -> None:
+    def __init__(self, name: str, cmake_lists_dir: str = ".", **kwa) -> None:
         super().__init__(name, sources=[], py_limited_api=True, **kwa)
         self.cmake_lists_dir = os.path.abspath(cmake_lists_dir)
 
@@ -121,8 +124,8 @@ def compute_num_jobs(self):
             if nvcc_threads is not None:
                 nvcc_threads = int(nvcc_threads)
                 logger.info(
-                    "Using NVCC_THREADS=%d as the number of nvcc threads.",
-                    nvcc_threads)
+                    "Using NVCC_THREADS=%d as the number of nvcc threads.", nvcc_threads
+                )
             else:
                 nvcc_threads = 1
             num_jobs = max(1, num_jobs // nvcc_threads)
@@ -146,36 +149,36 @@ def configure(self, ext: CMakeExtension) -> None:
         cfg = envs.CMAKE_BUILD_TYPE or default_cfg
 
         cmake_args = [
-            '-DCMAKE_BUILD_TYPE={}'.format(cfg),
-            '-DVLLM_TARGET_DEVICE={}'.format(VLLM_TARGET_DEVICE),
+            "-DCMAKE_BUILD_TYPE={}".format(cfg),
+            "-DVLLM_TARGET_DEVICE={}".format(VLLM_TARGET_DEVICE),
         ]
 
         verbose = envs.VERBOSE
         if verbose:
-            cmake_args += ['-DCMAKE_VERBOSE_MAKEFILE=ON']
+            cmake_args += ["-DCMAKE_VERBOSE_MAKEFILE=ON"]
 
         if is_sccache_available():
             cmake_args += [
-                '-DCMAKE_C_COMPILER_LAUNCHER=sccache',
-                '-DCMAKE_CXX_COMPILER_LAUNCHER=sccache',
-                '-DCMAKE_CUDA_COMPILER_LAUNCHER=sccache',
-                '-DCMAKE_HIP_COMPILER_LAUNCHER=sccache',
+                "-DCMAKE_C_COMPILER_LAUNCHER=sccache",
+                "-DCMAKE_CXX_COMPILER_LAUNCHER=sccache",
+                "-DCMAKE_CUDA_COMPILER_LAUNCHER=sccache",
+                "-DCMAKE_HIP_COMPILER_LAUNCHER=sccache",
             ]
         elif is_ccache_available():
             cmake_args += [
-                '-DCMAKE_C_COMPILER_LAUNCHER=ccache',
-                '-DCMAKE_CXX_COMPILER_LAUNCHER=ccache',
-                '-DCMAKE_CUDA_COMPILER_LAUNCHER=ccache',
-                '-DCMAKE_HIP_COMPILER_LAUNCHER=ccache',
+                "-DCMAKE_C_COMPILER_LAUNCHER=ccache",
+                "-DCMAKE_CXX_COMPILER_LAUNCHER=ccache",
+                "-DCMAKE_CUDA_COMPILER_LAUNCHER=ccache",
+                "-DCMAKE_HIP_COMPILER_LAUNCHER=ccache",
             ]
 
         # Pass the python executable to cmake so it can find an exact
         # match.
-        cmake_args += ['-DVLLM_PYTHON_EXECUTABLE={}'.format(sys.executable)]
+        cmake_args += ["-DVLLM_PYTHON_EXECUTABLE={}".format(sys.executable)]
 
         # Pass the python path to cmake so it can reuse the build dependencies
         # on subsequent calls to python.
-        cmake_args += ['-DVLLM_PYTHON_PATH={}'.format(":".join(sys.path))]
+        cmake_args += ["-DVLLM_PYTHON_PATH={}".format(":".join(sys.path))]
 
         # Override the base directory for FetchContent downloads to $ROOT/.deps
         # This allows sharing dependencies between profiles,
@@ -183,7 +186,7 @@ def configure(self, ext: CMakeExtension) -> None:
         # To override this, set the FETCHCONTENT_BASE_DIR environment variable.
         fc_base_dir = os.path.join(ROOT_DIR, ".deps")
         fc_base_dir = os.environ.get("FETCHCONTENT_BASE_DIR", fc_base_dir)
-        cmake_args += ['-DFETCHCONTENT_BASE_DIR={}'.format(fc_base_dir)]
+        cmake_args += ["-DFETCHCONTENT_BASE_DIR={}".format(fc_base_dir)]
 
         #
         # Setup parallelism and build tool
@@ -191,35 +194,36 @@ def configure(self, ext: CMakeExtension) -> None:
         num_jobs, nvcc_threads = self.compute_num_jobs()
 
         if nvcc_threads:
-            cmake_args += ['-DNVCC_THREADS={}'.format(nvcc_threads)]
+            cmake_args += ["-DNVCC_THREADS={}".format(nvcc_threads)]
 
         if is_ninja_available():
-            build_tool = ['-G', 'Ninja']
+            build_tool = ["-G", "Ninja"]
             cmake_args += [
-                '-DCMAKE_JOB_POOL_COMPILE:STRING=compile',
-                '-DCMAKE_JOB_POOLS:STRING=compile={}'.format(num_jobs),
+                "-DCMAKE_JOB_POOL_COMPILE:STRING=compile",
+                "-DCMAKE_JOB_POOLS:STRING=compile={}".format(num_jobs),
             ]
         else:
             # Default build tool to whatever cmake picks.
             build_tool = []
         # Make sure we use the nvcc from CUDA_HOME
         if _is_cuda():
-            cmake_args += [f'-DCMAKE_CUDA_COMPILER={CUDA_HOME}/bin/nvcc']
+            cmake_args += [f"-DCMAKE_CUDA_COMPILER={CUDA_HOME}/bin/nvcc"]
 
         other_cmake_args = os.environ.get("CMAKE_ARGS")
         if other_cmake_args:
             cmake_args += other_cmake_args.split()
 
         subprocess.check_call(
-            ['cmake', ext.cmake_lists_dir, *build_tool, *cmake_args],
-            cwd=self.build_temp)
+            ["cmake", ext.cmake_lists_dir, *build_tool, *cmake_args],
+            cwd=self.build_temp,
+        )
 
     def build_extensions(self) -> None:
         # Ensure that CMake is present and working
         try:
-            subprocess.check_output(['cmake', '--version'])
+            subprocess.check_output(["cmake", "--version"])
         except OSError as e:
-            raise RuntimeError('Cannot find CMake executable') from e
+            raise RuntimeError("Cannot find CMake executable") from e
 
         # Create build directory if it does not exist.
         if not os.path.exists(self.build_temp):
@@ -258,13 +262,18 @@ def target_name(s: str) -> str:
             # CMake appends the extension prefix to the install path,
             # and outdir already contains that prefix, so we need to remove it.
             prefix = outdir
-            for _ in range(ext.name.count('.')):
+            for _ in range(ext.name.count(".")):
                 prefix = prefix.parent
 
             # prefix here should actually be the same for all components
             install_args = [
-                "cmake", "--install", ".", "--prefix", prefix, "--component",
-                target_name(ext.name)
+                "cmake",
+                "--install",
+                ".",
+                "--prefix",
+                prefix,
+                "--component",
+                target_name(ext.name),
             ]
             subprocess.check_call(install_args, cwd=self.build_temp)
 
@@ -275,12 +284,15 @@ def run(self):
         # copy vllm/vllm_flash_attn/**/*.py from self.build_lib to current
         # directory so that they can be included in the editable build
         import glob
-        files = glob.glob(os.path.join(self.build_lib, "vllm",
-                                       "vllm_flash_attn", "**", "*.py"),
-                          recursive=True)
+
+        files = glob.glob(
+            os.path.join(self.build_lib, "vllm", "vllm_flash_attn", "**", "*.py"),
+            recursive=True,
+        )
         for file in files:
-            dst_file = os.path.join("vllm/vllm_flash_attn",
-                                    file.split("vllm/vllm_flash_attn/")[-1])
+            dst_file = os.path.join(
+                "vllm/vllm_flash_attn", file.split("vllm/vllm_flash_attn/")[-1]
+            )
             print(f"Copying {file} to {dst_file}")
             os.makedirs(os.path.dirname(dst_file), exist_ok=True)
             self.copy_file(file, dst_file)
@@ -290,8 +302,7 @@ class precompiled_build_ext(build_ext):
     """Disables extension building when using precompiled binaries."""
 
     def run(self) -> None:
-        assert _is_cuda(
-        ), "VLLM_USE_PRECOMPILED is only supported for CUDA builds"
+        assert _is_cuda(), "VLLM_USE_PRECOMPILED is only supported for CUDA builds"
 
     def build_extensions(self) -> None:
         print("Skipping build_ext: using precompiled extensions.")
@@ -312,9 +323,9 @@ def extract_precompiled_and_patch_package(wheel_url_or_path: str) -> dict:
                 wheel_filename = wheel_url_or_path.split("/")[-1]
                 temp_dir = tempfile.mkdtemp(prefix="vllm-wheels")
                 wheel_path = os.path.join(temp_dir, wheel_filename)
-                print(f"Downloading wheel from {wheel_url_or_path} "
-                      f"to {wheel_path}")
+                print(f"Downloading wheel from {wheel_url_or_path} to {wheel_path}")
                 from urllib.request import urlretrieve
+
                 urlretrieve(wheel_url_or_path, filename=wheel_path)
             else:
                 wheel_path = wheel_url_or_path
@@ -335,25 +346,29 @@ def extract_precompiled_and_patch_package(wheel_url_or_path: str) -> dict:
                 ]
 
                 compiled_regex = re.compile(
-                    r"vllm/vllm_flash_attn/(?:[^/.][^/]*/)*(?!\.)[^/]*\.py")
+                    r"vllm/vllm_flash_attn/(?:[^/.][^/]*/)*(?!\.)[^/]*\.py"
+                )
                 file_members = list(
-                    filter(lambda x: x.filename in files_to_copy,
-                           wheel.filelist))
+                    filter(lambda x: x.filename in files_to_copy, wheel.filelist)
+                )
                 file_members += list(
-                    filter(lambda x: compiled_regex.match(x.filename),
-                           wheel.filelist))
+                    filter(lambda x: compiled_regex.match(x.filename), wheel.filelist)
+                )
 
                 for file in file_members:
                     print(f"[extract] {file.filename}")
                     target_path = os.path.join(".", file.filename)
                     os.makedirs(os.path.dirname(target_path), exist_ok=True)
-                    with wheel.open(file.filename) as src, open(
-                            target_path, "wb") as dst:
+                    with (
+                        wheel.open(file.filename) as src,
+                        open(target_path, "wb") as dst,
+                    ):
                         shutil.copyfileobj(src, dst)
 
                     pkg = os.path.dirname(file.filename).replace("/", ".")
                     package_data_patch.setdefault(pkg, []).append(
-                        os.path.basename(file.filename))
+                        os.path.basename(file.filename)
+                    )
 
             return package_data_patch
         finally:
@@ -369,10 +384,13 @@ def get_base_commit_in_main_branch() -> str:
 
         try:
             # Get the latest commit hash of the upstream main branch.
-            resp_json = subprocess.check_output([
-                "curl", "-s",
-                "https://api.github.com/repos/vllm-project/vllm/commits/main"
-            ]).decode("utf-8")
+            resp_json = subprocess.check_output(
+                [
+                    "curl",
+                    "-s",
+                    "https://api.github.com/repos/vllm-project/vllm/commits/main",
+                ]
+            ).decode("utf-8")
             upstream_main_commit = json.loads(resp_json)["sha"]
 
             # In Docker build context, .git may be immutable or missing.
@@ -382,25 +400,32 @@ def get_base_commit_in_main_branch() -> str:
             # Check if the upstream_main_commit exists in the local repo
             try:
                 subprocess.check_output(
-                    ["git", "cat-file", "-e", f"{upstream_main_commit}"])
+                    ["git", "cat-file", "-e", f"{upstream_main_commit}"]
+                )
             except subprocess.CalledProcessError:
                 # If not present, fetch it from the remote repository.
                 # Note that this does not update any local branches,
                 # but ensures that this commit ref and its history are
                 # available in our local repo.
-                subprocess.check_call([
-                    "git", "fetch", "https://github.com/vllm-project/vllm",
-                    "main"
-                ])
+                subprocess.check_call(
+                    ["git", "fetch", "https://github.com/vllm-project/vllm", "main"]
+                )
 
             # Then get the commit hash of the current branch that is the same as
             # the upstream main commit.
-            current_branch = subprocess.check_output(
-                ["git", "branch", "--show-current"]).decode("utf-8").strip()
+            current_branch = (
+                subprocess.check_output(["git", "branch", "--show-current"])
+                .decode("utf-8")
+                .strip()
+            )
 
-            base_commit = subprocess.check_output([
-                "git", "merge-base", f"{upstream_main_commit}", current_branch
-            ]).decode("utf-8").strip()
+            base_commit = (
+                subprocess.check_output(
+                    ["git", "merge-base", f"{upstream_main_commit}", current_branch]
+                )
+                .decode("utf-8")
+                .strip()
+            )
             return base_commit
         except ValueError as err:
             raise ValueError(err) from None
@@ -408,7 +433,9 @@ def get_base_commit_in_main_branch() -> str:
             logger.warning(
                 "Failed to get the base commit in the main branch. "
                 "Using the nightly wheel. The libraries in this "
-                "wheel may not be compatible with your dev branch: %s", err)
+                "wheel may not be compatible with your dev branch: %s",
+                err,
+            )
             return "nightly"
 
 
@@ -418,12 +445,13 @@ def _no_device() -> bool:
 
 def _is_cuda() -> bool:
     has_cuda = torch.version.cuda is not None
-    return (VLLM_TARGET_DEVICE == "cuda" and has_cuda and not _is_tpu())
+    return VLLM_TARGET_DEVICE == "cuda" and has_cuda and not _is_tpu()
 
 
 def _is_hip() -> bool:
-    return (VLLM_TARGET_DEVICE == "cuda"
-            or VLLM_TARGET_DEVICE == "rocm") and torch.version.hip is not None
+    return (
+        VLLM_TARGET_DEVICE == "cuda" or VLLM_TARGET_DEVICE == "rocm"
+    ) and torch.version.hip is not None
 
 
 def _is_tpu() -> bool:
@@ -462,8 +490,12 @@ def get_rocm_version():
         minor = ctypes.c_uint32()
         patch = ctypes.c_uint32()
 
-        if (get_rocm_core_version(ctypes.byref(major), ctypes.byref(minor),
-                                  ctypes.byref(patch)) == 0):
+        if (
+            get_rocm_core_version(
+                ctypes.byref(major), ctypes.byref(minor), ctypes.byref(patch)
+            )
+            == 0
+        ):
             return f"{major.value}.{minor.value}.{patch.value}"
         return None
     except Exception:
@@ -476,8 +508,9 @@ def get_nvcc_cuda_version() -> Version:
     Adapted from https://github.com/NVIDIA/apex/blob/8b7a1ff183741dd8f9b87e7bafd04cfde99cea28/setup.py
     """
     assert CUDA_HOME is not None, "CUDA_HOME is not set"
-    nvcc_output = subprocess.check_output([CUDA_HOME + "/bin/nvcc", "-V"],
-                                          universal_newlines=True)
+    nvcc_output = subprocess.check_output(
+        [CUDA_HOME + "/bin/nvcc", "-V"], universal_newlines=True
+    )
     output = nvcc_output.split()
     release_idx = output.index("release") + 1
     nvcc_cuda_version = parse(output[release_idx].split(",")[0])
@@ -489,14 +522,20 @@ def get_gaudi_sw_version():
     Returns the driver version.
     """
     # Enable console printing for `hl-smi` check
-    output = subprocess.run("hl-smi",
-                            shell=True,
-                            text=True,
-                            capture_output=True,
-                            env={"ENABLE_CONSOLE": "true"})
+    output = subprocess.run(
+        "hl-smi",
+        shell=True,
+        text=True,
+        capture_output=True,
+        env={"ENABLE_CONSOLE": "true"},
+    )
     if output.returncode == 0 and output.stdout:
-        return output.stdout.split("\n")[2].replace(
-            " ", "").split(":")[1][:-1].split("-")[0]
+        return (
+            output.stdout.split("\n")[2]
+            .replace(" ", "")
+            .split(":")[1][:-1]
+            .split("-")[0]
+        )
     return "0.0.0"  # when hl-smi is not available
 
 
@@ -546,8 +585,11 @@ def _read_requirements(filename: str) -> list[str]:
         for line in requirements:
             if line.startswith("-r "):
                 resolved_requirements += _read_requirements(line.split()[1])
-            elif not line.startswith("--") and not line.startswith(
-                    "#") and line.strip() != "":
+            elif (
+                not line.startswith("--")
+                and not line.startswith("#")
+                and line.strip() != ""
+            ):
                 resolved_requirements.append(line)
         return resolved_requirements
 
@@ -558,7 +600,7 @@ def _read_requirements(filename: str) -> list[str]:
         cuda_major, cuda_minor = torch.version.cuda.split(".")
         modified_requirements = []
         for req in requirements:
-            if ("vllm-flash-attn" in req and cuda_major != "12"):
+            if "vllm-flash-attn" in req and cuda_major != "12":
                 # vllm-flash-attn is built only for CUDA 12.x.
                 # Skip for other versions.
                 continue
@@ -573,8 +615,7 @@ def _read_requirements(filename: str) -> list[str]:
     elif _is_xpu():
         requirements = _read_requirements("xpu.txt")
     else:
-        raise ValueError(
-            "Unsupported platform, please use CUDA, ROCm, or CPU.")
+        raise ValueError("Unsupported platform, please use CUDA, ROCm, or CPU.")
     return requirements
 
 
@@ -590,14 +631,13 @@ def _read_requirements(filename: str) -> list[str]:
     ext_modules.append(CMakeExtension(name="vllm.vllm_flash_attn._vllm_fa2_C"))
     if envs.VLLM_USE_PRECOMPILED or get_nvcc_cuda_version() >= Version("12.3"):
         # FA3 requires CUDA 12.3 or later
-        ext_modules.append(
-            CMakeExtension(name="vllm.vllm_flash_attn._vllm_fa3_C"))
+        ext_modules.append(CMakeExtension(name="vllm.vllm_flash_attn._vllm_fa3_C"))
         # Optional since this doesn't get built (produce an .so file) when
         # not targeting a hopper system
+        ext_modules.append(CMakeExtension(name="vllm._flashmla_C", optional=True))
         ext_modules.append(
-            CMakeExtension(name="vllm._flashmla_C", optional=True))
-        ext_modules.append(
-            CMakeExtension(name="vllm._flashmla_extension_C", optional=True))
+            CMakeExtension(name="vllm._flashmla_extension_C", optional=True)
+        )
     ext_modules.append(CMakeExtension(name="vllm.cumem_allocator"))
 
 if _build_custom_ops():
@@ -619,6 +659,7 @@ def _read_requirements(filename: str) -> list[str]:
         wheel_url = wheel_location
     else:
         import platform
+
         arch = platform.machine()
         if arch == "x86_64":
             wheel_tag = "manylinux1_x86_64"
@@ -628,8 +669,11 @@ def _read_requirements(filename: str) -> list[str]:
             raise ValueError(f"Unsupported architecture: {arch}")
         base_commit = precompiled_wheel_utils.get_base_commit_in_main_branch()
         wheel_url = f"https://wheels.vllm.ai/{base_commit}/vllm-1.0.0.dev-cp38-abi3-{wheel_tag}.whl"
-        nightly_wheel_url = f"https://wheels.vllm.ai/nightly/vllm-1.0.0.dev-cp38-abi3-{wheel_tag}.whl"
+        nightly_wheel_url = (
+            f"https://wheels.vllm.ai/nightly/vllm-1.0.0.dev-cp38-abi3-{wheel_tag}.whl"
+        )
         from urllib.request import urlopen
+
         try:
             with urlopen(wheel_url) as resp:
                 if resp.status != 200:
@@ -638,8 +682,7 @@ def _read_requirements(filename: str) -> list[str]:
             print(f"[warn] Falling back to nightly wheel: {e}")
             wheel_url = nightly_wheel_url
 
-    patch = precompiled_wheel_utils.extract_precompiled_and_patch_package(
-        wheel_url)
+    patch = precompiled_wheel_utils.extract_precompiled_and_patch_package(wheel_url)
     for pkg, files in patch.items():
         package_data.setdefault(pkg, []).extend(files)
 
@@ -650,8 +693,9 @@ def _read_requirements(filename: str) -> list[str]:
     cmdclass = {}
 else:
     cmdclass = {
-        "build_ext":
-        precompiled_build_ext if envs.VLLM_USE_PRECOMPILED else cmake_build_ext
+        "build_ext": precompiled_build_ext
+        if envs.VLLM_USE_PRECOMPILED
+        else cmake_build_ext
     }
 
 setup(
@@ -664,8 +708,11 @@ def _read_requirements(filename: str) -> list[str]:
         "tensorizer": ["tensorizer==2.10.1"],
         "fastsafetensors": ["fastsafetensors >= 0.1.10"],
         "runai": ["runai-model-streamer[s3,gcs] >= 0.14.0"],
-        "audio": ["librosa", "soundfile",
-                  "mistral_common[audio]"],  # Required for audio processing
+        "audio": [
+            "librosa",
+            "soundfile",
+            "mistral_common[audio]",
+        ],  # Required for audio processing
         "video": [],  # Kept for backwards compatibility
         # FlashInfer should be updated together with the Dockerfile
         "flashinfer": ["flashinfer-python==0.3.1"],
diff --git a/tests/basic_correctness/test_basic_correctness.py b/tests/basic_correctness/test_basic_correctness.py
index 411f3e01bc2c..d63c82102b6b 100644
--- a/tests/basic_correctness/test_basic_correctness.py
+++ b/tests/basic_correctness/test_basic_correctness.py
@@ -4,6 +4,7 @@
 
 Run `pytest tests/basic_correctness/test_basic_correctness.py`.
 """
+
 import os
 import weakref
 from unittest.mock import Mock
@@ -37,16 +38,21 @@ def test_vllm_gc_ed():
 
 
 def _fix_prompt_embed_outputs(
-        vllm_outputs: list[tuple[list[int], str]], hf_model: HfRunner,
-        example_prompts: list[str]) -> list[tuple[list[int], str]]:
+    vllm_outputs: list[tuple[list[int], str]],
+    hf_model: HfRunner,
+    example_prompts: list[str],
+) -> list[tuple[list[int], str]]:
     fixed_vllm_outputs = []
     for vllm_output, hf_input, prompt in zip(
-            vllm_outputs, hf_model.get_inputs(example_prompts),
-            example_prompts):
+        vllm_outputs, hf_model.get_inputs(example_prompts), example_prompts
+    ):
         hf_input_ids = hf_input["input_ids"].tolist()[0]
         fixed_vllm_outputs.append(
-            (hf_input_ids + vllm_output[0][len(hf_input_ids):],
-             prompt + vllm_output[1]))
+            (
+                hf_input_ids + vllm_output[0][len(hf_input_ids) :],
+                prompt + vllm_output[1],
+            )
+        )
     return fixed_vllm_outputs
 
 
@@ -69,8 +75,7 @@ def test_models(
     enable_prompt_embeds: bool,
 ) -> None:
     if backend == "XFORMERS" and model == "google/gemma-2-2b-it":
-        pytest.skip(
-            f"{backend} does not support gemma2 with full context length.")
+        pytest.skip(f"{backend} does not support gemma2 with full context length.")
 
     with monkeypatch.context() as m:
         m.setenv("VLLM_ATTENTION_BACKEND", backend)
@@ -78,34 +83,35 @@ def test_models(
         # 5042 tokens for gemma2
         # gemma2 has alternating sliding window size of 4096
         # we need a prompt with more than 4096 tokens to test the sliding window
-        prompt = "The following numbers of the sequence " + ", ".join(
-            str(i) for i in range(1024)) + " are:"
+        prompt = (
+            "The following numbers of the sequence "
+            + ", ".join(str(i) for i in range(1024))
+            + " are:"
+        )
         example_prompts = [prompt]
 
         with hf_runner(model) as hf_model:
             hf_outputs = hf_model.generate_greedy(example_prompts, max_tokens)
             if enable_prompt_embeds:
                 with torch.no_grad():
-                    prompt_embeds = hf_model.get_prompt_embeddings(
-                        example_prompts)
+                    prompt_embeds = hf_model.get_prompt_embeddings(example_prompts)
 
         with VllmRunner(
-                model,
-                max_model_len=8192,
-                enforce_eager=enforce_eager,
-                enable_prompt_embeds=enable_prompt_embeds,
-                gpu_memory_utilization=0.7,
-                async_scheduling=async_scheduling,
-                distributed_executor_backend=model_executor,
+            model,
+            max_model_len=8192,
+            enforce_eager=enforce_eager,
+            enable_prompt_embeds=enable_prompt_embeds,
+            gpu_memory_utilization=0.7,
+            async_scheduling=async_scheduling,
+            distributed_executor_backend=model_executor,
         ) as vllm_model:
             if enable_prompt_embeds:
-                vllm_outputs = vllm_model.generate_greedy(
-                    prompt_embeds, max_tokens)
+                vllm_outputs = vllm_model.generate_greedy(prompt_embeds, max_tokens)
                 vllm_outputs = _fix_prompt_embed_outputs(
-                    vllm_outputs, hf_model, example_prompts)
+                    vllm_outputs, hf_model, example_prompts
+                )
             else:
-                vllm_outputs = vllm_model.generate_greedy(
-                    example_prompts, max_tokens)
+                vllm_outputs = vllm_model.generate_greedy(example_prompts, max_tokens)
 
         check_outputs_equal(
             outputs_0_lst=hf_outputs,
@@ -117,21 +123,18 @@ def test_models(
 
 @multi_gpu_test(num_gpus=2)
 @pytest.mark.parametrize(
-    "model, distributed_executor_backend, attention_backend, "
-    "test_suite, extra_env", [
+    "model, distributed_executor_backend, attention_backend, test_suite, extra_env",
+    [
         ("distilbert/distilgpt2", "ray", "", "L4", {}),
         ("distilbert/distilgpt2", "mp", "", "L4", {}),
-        ("distilbert/distilgpt2", "ray", "", "L4", {
-            "VLLM_SLEEP_WHEN_IDLE": "1"
-        }),
-        ("distilbert/distilgpt2", "mp", "", "L4", {
-            "VLLM_SLEEP_WHEN_IDLE": "1"
-        }),
+        ("distilbert/distilgpt2", "ray", "", "L4", {"VLLM_SLEEP_WHEN_IDLE": "1"}),
+        ("distilbert/distilgpt2", "mp", "", "L4", {"VLLM_SLEEP_WHEN_IDLE": "1"}),
         ("meta-llama/Llama-3.2-1B-Instruct", "ray", "", "L4", {}),
         ("meta-llama/Llama-3.2-1B-Instruct", "mp", "", "L4", {}),
         ("distilbert/distilgpt2", "ray", "", "A100", {}),
         ("distilbert/distilgpt2", "mp", "", "A100", {}),
-    ])
+    ],
+)
 @pytest.mark.parametrize("enable_prompt_embeds", [True, False])
 def test_models_distributed(
     monkeypatch: pytest.MonkeyPatch,
@@ -149,11 +152,14 @@ def test_models_distributed(
         pytest.skip(f"Skip test for {test_suite}")
 
     with monkeypatch.context() as monkeypatch_context:
-        if model == "meta-llama/Llama-3.2-1B-Instruct" and distributed_executor_backend == "ray" and attention_backend == "" and test_suite == "L4":  # noqa
+        if (
+            model == "meta-llama/Llama-3.2-1B-Instruct"
+            and distributed_executor_backend == "ray"
+            and attention_backend == ""
+            and test_suite == "L4"
+        ):  # noqa
             if enable_prompt_embeds:
-                pytest.skip(
-                    "enable_prompt_embeds does not work with ray compiled dag."
-                )
+                pytest.skip("enable_prompt_embeds does not work with ray compiled dag.")
             monkeypatch_context.setenv("VLLM_USE_RAY_SPMD_WORKER", "1")
             monkeypatch_context.setenv("VLLM_USE_RAY_COMPILED_DAG", "1")
 
@@ -175,30 +181,26 @@ def test_models_distributed(
         # will hurt multiprocessing backend with fork method
         # (the default method).
         with vllm_runner(
-                model,
-                dtype=dtype,
-                tensor_parallel_size=2,
-                distributed_executor_backend=distributed_executor_backend,
-                enable_prompt_embeds=enable_prompt_embeds,
-                gpu_memory_utilization=0.7,
+            model,
+            dtype=dtype,
+            tensor_parallel_size=2,
+            distributed_executor_backend=distributed_executor_backend,
+            enable_prompt_embeds=enable_prompt_embeds,
+            gpu_memory_utilization=0.7,
         ) as vllm_model:
             if enable_prompt_embeds:
                 with hf_runner(model, dtype=dtype) as hf_model:
                     with torch.no_grad():
-                        prompt_embeds = hf_model.get_prompt_embeddings(
-                            example_prompts)
-                    vllm_outputs = vllm_model.generate_greedy(
-                        prompt_embeds, max_tokens)
+                        prompt_embeds = hf_model.get_prompt_embeddings(example_prompts)
+                    vllm_outputs = vllm_model.generate_greedy(prompt_embeds, max_tokens)
                     vllm_outputs = _fix_prompt_embed_outputs(
-                        vllm_outputs, hf_model, example_prompts)
-                    hf_outputs = hf_model.generate_greedy(
-                        example_prompts, max_tokens)
+                        vllm_outputs, hf_model, example_prompts
+                    )
+                    hf_outputs = hf_model.generate_greedy(example_prompts, max_tokens)
             else:
-                vllm_outputs = vllm_model.generate_greedy(
-                    example_prompts, max_tokens)
+                vllm_outputs = vllm_model.generate_greedy(example_prompts, max_tokens)
                 with hf_runner(model, dtype=dtype) as hf_model:
-                    hf_outputs = hf_model.generate_greedy(
-                        example_prompts, max_tokens)
+                    hf_outputs = hf_model.generate_greedy(example_prompts, max_tokens)
 
     check_outputs_equal(
         outputs_0_lst=hf_outputs,
@@ -209,27 +211,23 @@ def test_models_distributed(
 
 
 def test_failed_model_execution(vllm_runner, monkeypatch) -> None:
-
     from vllm.envs import VLLM_USE_V1
 
     if not VLLM_USE_V1:
         pytest.skip("Skipping V0 test, dump input not supported")
 
     # Needed to mock an error in the same process
-    monkeypatch.setenv('VLLM_ENABLE_V1_MULTIPROCESSING', '0')
+    monkeypatch.setenv("VLLM_ENABLE_V1_MULTIPROCESSING", "0")
 
-    with vllm_runner('facebook/opt-125m', enforce_eager=True) as vllm_model:
+    with vllm_runner("facebook/opt-125m", enforce_eager=True) as vllm_model:
         if isinstance(vllm_model.llm.llm_engine, LLMEngineV1):
             v1_test_failed_model_execution(vllm_model)
 
 
 def v1_test_failed_model_execution(vllm_model):
-
     engine = vllm_model.llm.llm_engine
-    mocked_execute_model = Mock(
-        side_effect=RuntimeError("Mocked Critical Error"))
-    engine.engine_core.engine_core.model_executor.execute_model =\
-                mocked_execute_model
+    mocked_execute_model = Mock(side_effect=RuntimeError("Mocked Critical Error"))
+    engine.engine_core.engine_core.model_executor.execute_model = mocked_execute_model
 
     with pytest.raises(RuntimeError) as exc_info:
         prompts = [
diff --git a/tests/basic_correctness/test_cpu_offload.py b/tests/basic_correctness/test_cpu_offload.py
index 28bfe9e7c802..3c1e01d072b9 100644
--- a/tests/basic_correctness/test_cpu_offload.py
+++ b/tests/basic_correctness/test_cpu_offload.py
@@ -5,5 +5,6 @@
 
 
 def test_cpu_offload():
-    compare_two_settings("meta-llama/Llama-3.2-1B-Instruct", [],
-                         ["--cpu-offload-gb", "1"])
+    compare_two_settings(
+        "meta-llama/Llama-3.2-1B-Instruct", [], ["--cpu-offload-gb", "1"]
+    )
diff --git a/tests/basic_correctness/test_cumem.py b/tests/basic_correctness/test_cumem.py
index 508740ab2938..b7cd98e27403 100644
--- a/tests/basic_correctness/test_cumem.py
+++ b/tests/basic_correctness/test_cumem.py
@@ -23,13 +23,13 @@ def test_python_error():
     tensors = []
     with allocator.use_memory_pool():
         # allocate 70% of the total memory
-        x = torch.empty(alloc_bytes, dtype=torch.uint8, device='cuda')
+        x = torch.empty(alloc_bytes, dtype=torch.uint8, device="cuda")
         tensors.append(x)
     # release the memory
     allocator.sleep()
 
     # allocate more memory than the total memory
-    y = torch.empty(alloc_bytes, dtype=torch.uint8, device='cuda')
+    y = torch.empty(alloc_bytes, dtype=torch.uint8, device="cuda")
     tensors.append(y)
     with pytest.raises(RuntimeError):
         # when the allocator is woken up, it should raise an error
@@ -41,17 +41,17 @@ def test_python_error():
 def test_basic_cumem():
     # some tensors from default memory pool
     shape = (1024, 1024)
-    x = torch.empty(shape, device='cuda')
+    x = torch.empty(shape, device="cuda")
     x.zero_()
 
     # some tensors from custom memory pool
     allocator = CuMemAllocator.get_instance()
     with allocator.use_memory_pool():
         # custom memory pool
-        y = torch.empty(shape, device='cuda')
+        y = torch.empty(shape, device="cuda")
         y.zero_()
         y += 1
-        z = torch.empty(shape, device='cuda')
+        z = torch.empty(shape, device="cuda")
         z.zero_()
         z += 2
 
@@ -74,16 +74,16 @@ def test_basic_cumem():
 def test_cumem_with_cudagraph():
     allocator = CuMemAllocator.get_instance()
     with allocator.use_memory_pool():
-        weight = torch.eye(1024, device='cuda')
+        weight = torch.eye(1024, device="cuda")
     with allocator.use_memory_pool(tag="discard"):
-        cache = torch.empty(1024, 1024, device='cuda')
+        cache = torch.empty(1024, 1024, device="cuda")
 
     def model(x):
         out = x @ weight
-        cache[:out.size(0)].copy_(out)
+        cache[: out.size(0)].copy_(out)
         return out + 1
 
-    x = torch.empty(128, 1024, device='cuda')
+    x = torch.empty(128, 1024, device="cuda")
 
     # warmup
     model(x)
@@ -109,7 +109,7 @@ def model(x):
     model_graph.replay()
 
     # cache content is as expected
-    assert torch.allclose(x, cache[:x.size(0)])
+    assert torch.allclose(x, cache[: x.size(0)])
 
     # output content is as expected
     assert torch.allclose(y, x + 1)
@@ -123,7 +123,8 @@ def model(x):
         ("meta-llama/Llama-3.2-1B", True),
         # sleep mode with pytorch checkpoint
         ("facebook/opt-125m", True),
-    ])
+    ],
+)
 def test_end_to_end(monkeypatch: pytest.MonkeyPatch, model: str, use_v1: bool):
     with monkeypatch.context() as m:
         assert use_v1
diff --git a/tests/benchmarks/test_latency_cli.py b/tests/benchmarks/test_latency_cli.py
index 2279c846e01c..54075a3a15e6 100644
--- a/tests/benchmarks/test_latency_cli.py
+++ b/tests/benchmarks/test_latency_cli.py
@@ -10,8 +10,18 @@
 @pytest.mark.benchmark
 def test_bench_latency():
     command = [
-        "vllm", "bench", "latency", "--model", MODEL_NAME, "--input-len", "32",
-        "--output-len", "1", "--enforce-eager", "--load-format", "dummy"
+        "vllm",
+        "bench",
+        "latency",
+        "--model",
+        MODEL_NAME,
+        "--input-len",
+        "32",
+        "--output-len",
+        "1",
+        "--enforce-eager",
+        "--load-format",
+        "dummy",
     ]
     result = subprocess.run(command, capture_output=True, text=True)
     print(result.stdout)
diff --git a/tests/benchmarks/test_random_dataset.py b/tests/benchmarks/test_random_dataset.py
index 26cae369cdd5..90527dbeae28 100644
--- a/tests/benchmarks/test_random_dataset.py
+++ b/tests/benchmarks/test_random_dataset.py
@@ -7,8 +7,11 @@
 import pytest
 from transformers import AutoTokenizer, PreTrainedTokenizerBase
 
-from vllm.benchmarks.datasets import (RandomDataset, RandomMultiModalDataset,
-                                      SampleRequest)
+from vllm.benchmarks.datasets import (
+    RandomDataset,
+    RandomMultiModalDataset,
+    SampleRequest,
+)
 
 
 @pytest.fixture(scope="session")
@@ -27,11 +30,9 @@ class Params(NamedTuple):
 
 @pytest.fixture(scope="session")
 def random_dataset_params() -> Params:
-    return Params(num_requests=16,
-                  prefix_len=7,
-                  range_ratio=0.3,
-                  input_len=50,
-                  output_len=20)
+    return Params(
+        num_requests=16, prefix_len=7, range_ratio=0.3, input_len=50, output_len=20
+    )
 
 
 def _fingerprint_sample(req: SampleRequest) -> tuple[str, int, int]:
@@ -39,13 +40,15 @@ def _fingerprint_sample(req: SampleRequest) -> tuple[str, int, int]:
     return (req.prompt, req.prompt_len, req.expected_output_len)
 
 
-def _collect_samples(dataset: RandomDataset,
-                    tokenizer: PreTrainedTokenizerBase,
-                     num_requests: int = 16,
-                     prefix_len: int = 7,
-                     range_ratio: float = 0.3,
-                     input_len: int = 50,
-                     output_len: int = 20) -> list[tuple[str, int, int]]:
+def _collect_samples(
+    dataset: RandomDataset,
+    tokenizer: PreTrainedTokenizerBase,
+    num_requests: int = 16,
+    prefix_len: int = 7,
+    range_ratio: float = 0.3,
+    input_len: int = 50,
+    output_len: int = 20,
+) -> list[tuple[str, int, int]]:
     samples = dataset.sample(
         tokenizer=tokenizer,
         num_requests=num_requests,
@@ -59,8 +62,8 @@ def _collect_samples(dataset: RandomDataset,
 
 @pytest.mark.benchmark
 def test_random_dataset_same_seed(
-        hf_tokenizer: PreTrainedTokenizerBase,
-        random_dataset_params: Params) -> None:
+    hf_tokenizer: PreTrainedTokenizerBase, random_dataset_params: Params
+) -> None:
     """Same seed should yield identical outputs, even if global RNGs change.
 
     This guards against accidental reliance on Python's random or np.random
@@ -70,13 +73,15 @@ def test_random_dataset_same_seed(
     common_seed = 123
     dataset_a = RandomDataset(random_seed=common_seed)
     dataset_b = RandomDataset(random_seed=common_seed)
-    a = _collect_samples(dataset_a,
-                         hf_tokenizer,
-                         num_requests=p.num_requests,
-                         prefix_len=p.prefix_len,
-                         range_ratio=p.range_ratio,
-                         input_len=p.input_len,
-                         output_len=p.output_len)
+    a = _collect_samples(
+        dataset_a,
+        hf_tokenizer,
+        num_requests=p.num_requests,
+        prefix_len=p.prefix_len,
+        range_ratio=p.range_ratio,
+        input_len=p.input_len,
+        output_len=p.output_len,
+    )
 
     # Perturb global RNG state to ensure isolation
     random.seed(999)
@@ -84,43 +89,50 @@ def test_random_dataset_same_seed(
     np.random.seed(888)
     _ = [np.random.random() for _ in range(100)]
 
-    b = _collect_samples(dataset_b,
-                         hf_tokenizer,
-                         num_requests=p.num_requests,
-                         prefix_len=p.prefix_len,
-                         range_ratio=p.range_ratio,
-                         input_len=p.input_len,
-                         output_len=p.output_len)
+    b = _collect_samples(
+        dataset_b,
+        hf_tokenizer,
+        num_requests=p.num_requests,
+        prefix_len=p.prefix_len,
+        range_ratio=p.range_ratio,
+        input_len=p.input_len,
+        output_len=p.output_len,
+    )
     assert a == b
 
+
 @pytest.mark.benchmark
 def test_random_dataset_different_seeds(
-        hf_tokenizer: PreTrainedTokenizerBase,
-        random_dataset_params: Params) -> None:
+    hf_tokenizer: PreTrainedTokenizerBase, random_dataset_params: Params
+) -> None:
     """Different seeds should change outputs with overwhelming likelihood."""
     p = random_dataset_params
     seed_a = 0
     dataset_a = RandomDataset(random_seed=seed_a)
-    a = _collect_samples(dataset_a,
-                         hf_tokenizer,
-                         num_requests=p.num_requests,
-                         prefix_len=p.prefix_len,
-                         range_ratio=p.range_ratio,
-                         input_len=p.input_len,
-                         output_len=p.output_len)
+    a = _collect_samples(
+        dataset_a,
+        hf_tokenizer,
+        num_requests=p.num_requests,
+        prefix_len=p.prefix_len,
+        range_ratio=p.range_ratio,
+        input_len=p.input_len,
+        output_len=p.output_len,
+    )
 
     seed_b = 999
     dataset_b = RandomDataset(random_seed=seed_b)
     # Perturb global RNG with same seed as dataset_a to ensure isolation
     random.seed(seed_a)
     np.random.seed(seed_a)
-    b = _collect_samples(dataset_b,
-                         hf_tokenizer,
-                         num_requests=p.num_requests,
-                         prefix_len=p.prefix_len,
-                         range_ratio=p.range_ratio,
-                         input_len=p.input_len,
-                         output_len=p.output_len)
+    b = _collect_samples(
+        dataset_b,
+        hf_tokenizer,
+        num_requests=p.num_requests,
+        prefix_len=p.prefix_len,
+        range_ratio=p.range_ratio,
+        input_len=p.input_len,
+        output_len=p.output_len,
+    )
     assert a != b
 
 
@@ -128,6 +140,7 @@ def test_random_dataset_different_seeds(
 # RandomMultiModalDataset tests
 # -----------------------------
 
+
 def _mm_fingerprint_sample(
     req: SampleRequest,
 ) -> tuple[str, int, int, int, list[str]]:
@@ -152,8 +165,13 @@ def _mm_fingerprint_sample(
             item_prefixes.append(f"video:{url[:22]}")
         else:
             item_prefixes.append("unknown:")
-    return (req.prompt, req.prompt_len, req.expected_output_len, len(items),
-            item_prefixes)
+    return (
+        req.prompt,
+        req.prompt_len,
+        req.expected_output_len,
+        len(items),
+        item_prefixes,
+    )
 
 
 def _collect_mm_samples(
@@ -214,6 +232,7 @@ def test_random_mm_different_seeds(
     fb = [_mm_fingerprint_sample(s) for s in b]
     assert fa != fb
 
+
 @pytest.mark.benchmark
 def test_random_mm_respects_limits(
     hf_tokenizer: PreTrainedTokenizerBase,
@@ -271,9 +290,9 @@ def test_random_mm_zero_items(hf_tokenizer: PreTrainedTokenizerBase) -> None:
     for s in samples:
         assert s.multi_modal_data == []
 
+
 @pytest.mark.benchmark
-def test_random_mm_num_items_per_prompt(
-    hf_tokenizer: PreTrainedTokenizerBase) -> None:
+def test_random_mm_num_items_per_prompt(hf_tokenizer: PreTrainedTokenizerBase) -> None:
     ds = RandomMultiModalDataset(random_seed=0)
     # Fixed number of images per prompt
     # set num_mm_items_range_ratio to 0.0
@@ -300,7 +319,6 @@ def test_random_mm_num_items_per_prompt(
 def test_random_mm_bucket_config_not_mutated(
     hf_tokenizer: PreTrainedTokenizerBase,
 ) -> None:
-
     ds = RandomMultiModalDataset(random_seed=0)
     # This bucket config is not normalized to sum to 1
     # and has more buckets than requested images
@@ -321,7 +339,6 @@ def test_random_mm_bucket_config_not_mutated(
     # Ensure the original dict content is unchanged
     assert original == snapshot
 
-
     # Vary number of mm items per prompt
     # set num_mm_items_range_ratio to 0.5
     samples_varying_items = _collect_mm_samples(
diff --git a/tests/benchmarks/test_serve_cli.py b/tests/benchmarks/test_serve_cli.py
index fafbef5f3718..90d685c966d3 100644
--- a/tests/benchmarks/test_serve_cli.py
+++ b/tests/benchmarks/test_serve_cli.py
@@ -11,9 +11,7 @@
 
 @pytest.fixture(scope="module")
 def server():
-    args = [
-        "--max-model-len", "1024", "--enforce-eager", "--load-format", "dummy"
-    ]
+    args = ["--max-model-len", "1024", "--enforce-eager", "--load-format", "dummy"]
 
     with RemoteOpenAIServer(MODEL_NAME, args) as remote_server:
         yield remote_server
@@ -46,6 +44,7 @@ def test_bench_serve(server):
 
     assert result.returncode == 0, f"Benchmark failed: {result.stderr}"
 
+
 @pytest.mark.benchmark
 def test_bench_serve_chat(server):
     command = [
diff --git a/tests/benchmarks/test_throughput_cli.py b/tests/benchmarks/test_throughput_cli.py
index b61e51db4fbe..a579b59e8af4 100644
--- a/tests/benchmarks/test_throughput_cli.py
+++ b/tests/benchmarks/test_throughput_cli.py
@@ -10,8 +10,18 @@
 @pytest.mark.benchmark
 def test_bench_throughput():
     command = [
-        "vllm", "bench", "throughput", "--model", MODEL_NAME, "--input-len",
-        "32", "--output-len", "1", "--enforce-eager", "--load-format", "dummy"
+        "vllm",
+        "bench",
+        "throughput",
+        "--model",
+        MODEL_NAME,
+        "--input-len",
+        "32",
+        "--output-len",
+        "1",
+        "--enforce-eager",
+        "--load-format",
+        "dummy",
     ]
     result = subprocess.run(command, capture_output=True, text=True)
     print(result.stdout)
diff --git a/tests/compile/backend.py b/tests/compile/backend.py
index f25c367433f4..36bc832a1329 100644
--- a/tests/compile/backend.py
+++ b/tests/compile/backend.py
@@ -23,8 +23,7 @@ class LazyInitPass(InductorPass):
     and then immediately invoke it.
     """
 
-    def __init__(self, pass_cls: type[VllmInductorPass],
-                 vllm_config: VllmConfig):
+    def __init__(self, pass_cls: type[VllmInductorPass], vllm_config: VllmConfig):
         self.pass_cls = pass_cls
         self.vllm_config = weakref.proxy(vllm_config)  # avoid cycle
 
@@ -45,20 +44,18 @@ class TestBackend:
     Inductor config is default-initialized from VllmConfig.CompilationConfig.
     """
 
-    def __init__(self, *passes: Union[InductorPass, Callable[[fx.Graph],
-                                                             None]]):
+    def __init__(self, *passes: Union[InductorPass, Callable[[fx.Graph], None]]):
         self.custom_passes = list(passes)
         compile_config = get_current_vllm_config().compilation_config
         self.inductor_config = compile_config.inductor_compile_config
-        self.inductor_config['force_disable_caches'] = True
-        self.inductor_config['post_grad_custom_post_pass'] = self.post_pass
+        self.inductor_config["force_disable_caches"] = True
+        self.inductor_config["post_grad_custom_post_pass"] = self.post_pass
 
     def __call__(self, graph: fx.GraphModule, example_inputs):
         self.graph_pre_compile = deepcopy(graph)
         from torch._inductor.compile_fx import compile_fx
-        return compile_fx(graph,
-                          example_inputs,
-                          config_patches=self.inductor_config)
+
+        return compile_fx(graph, example_inputs, config_patches=self.inductor_config)
 
     @with_pattern_match_debug
     def post_pass(self, graph: fx.Graph):
@@ -82,8 +79,7 @@ def check_before_ops(self, ops: Sequence[OpOverload], fully_replaced=True):
             assert num_pre > 0, f"Op {op.name()} not found in pre-pass graph"
             assert num_pre > num_post, f"All nodes remain for op {op.name()}"
             if fully_replaced:
-                assert num_post == 0, \
-                    f"Unexpected op {op.name()} in post-pass graph"
+                assert num_post == 0, f"Unexpected op {op.name()} in post-pass graph"
 
     def check_after_ops(self, ops: Sequence[OpOverload]):
         for op in ops:
diff --git a/tests/compile/piecewise/test_full_cudagraph.py b/tests/compile/piecewise/test_full_cudagraph.py
index 9906e49bb110..927c838ae74e 100644
--- a/tests/compile/piecewise/test_full_cudagraph.py
+++ b/tests/compile/piecewise/test_full_cudagraph.py
@@ -38,8 +38,8 @@ def temporary_environ(env_vars):
 MLA_backends = ["FlashMLA", "FlashAttentionMLA", "CutlassMLA"]
 for mla_backend in MLA_backends:
     test_params_full_cudagraph.append(
-        pytest.param(
-            ("deepseek-ai/DeepSeek-V2-Lite", backend_configs[mla_backend])))
+        pytest.param(("deepseek-ai/DeepSeek-V2-Lite", backend_configs[mla_backend]))
+    )
 
 # Qwen/Qwen2-1.5B-Instruct with other backends
 other_backend_configs = [
@@ -47,7 +47,8 @@ def temporary_environ(env_vars):
 ]
 for backend_config in other_backend_configs:
     test_params_full_cudagraph.append(
-        pytest.param(("Qwen/Qwen2-1.5B-Instruct", backend_config)))
+        pytest.param(("Qwen/Qwen2-1.5B-Instruct", backend_config))
+    )
 
 
 @pytest.fixture(scope="class")
@@ -55,8 +56,10 @@ def llm_pair(request):
     model, backend_config = request.param
 
     # Dynamically skip test if GPU capability is not met
-    if backend_config.specific_gpu_arch and backend_config.specific_gpu_arch\
-        != current_platform.get_device_capability():
+    if (
+        backend_config.specific_gpu_arch
+        and backend_config.specific_gpu_arch != current_platform.get_device_capability()
+    ):
         if backend_config.specific_gpu_arch == (9, 0):
             pytest.skip("Only Hopper GPUs support FA3 and FlashMLA")
         elif backend_config.specific_gpu_arch == (10, 0):
@@ -76,8 +79,7 @@ def llm_pair(request):
             trust_remote_code=True,
             max_model_len=1024,
             max_num_seqs=128,
-            compilation_config=\
-                CompilationConfig(**backend_config.comp_config),
+            compilation_config=CompilationConfig(**backend_config.comp_config),
             generation_config="vllm",
             seed=42,
         )
@@ -113,20 +115,22 @@ class TestFullCUDAGraph:
     meaning there would be multiple LLM instances hogging memory simultaneously.
     """
 
-    @pytest.mark.parametrize(("batch_size", "max_tokens"), [
-        (1, 10),
-        (7, 10),
-        (16, 10),
-        (25, 10),
-        (32, 10),
-        (45, 10),
-        (64, 10),
-        (123, 10),
-        (8, 5),
-        (8, 30),
-    ])
-    def test_full_cudagraph(self, batch_size, max_tokens,
-                            llm_pair: tuple[LLM, LLM]):
+    @pytest.mark.parametrize(
+        ("batch_size", "max_tokens"),
+        [
+            (1, 10),
+            (7, 10),
+            (16, 10),
+            (25, 10),
+            (32, 10),
+            (45, 10),
+            (64, 10),
+            (123, 10),
+            (8, 5),
+            (8, 30),
+        ],
+    )
+    def test_full_cudagraph(self, batch_size, max_tokens, llm_pair: tuple[LLM, LLM]):
         """
         Test various batch sizes and max_tokens to ensure that the
         full cudagraph compilation works for padded cases too.
@@ -137,26 +141,34 @@ def test_full_cudagraph(self, batch_size, max_tokens,
         prompts = ["the quick brown fox"] * batch_size
         # Use purely greedy decoding to avoid top-p truncation sensitivity
         # that can amplify tiny numeric differences across runtimes.
-        sampling_params = SamplingParams(temperature=0.0,
-                                         max_tokens=max_tokens,
-                                         top_p=1.0)
+        sampling_params = SamplingParams(
+            temperature=0.0, max_tokens=max_tokens, top_p=1.0
+        )
 
         piecewise_responses = piecewise_llm.generate(prompts, sampling_params)
         full_responses = full_cudagraph_llm.generate(prompts, sampling_params)
 
         # Check that all responses are the same
-        for piecewise_res, full_res in zip(piecewise_responses,
-                                           full_responses):
-            assert piecewise_res.outputs[0].text.lower() == \
-                full_res.outputs[0].text.lower()
+        for piecewise_res, full_res in zip(piecewise_responses, full_responses):
+            assert (
+                piecewise_res.outputs[0].text.lower()
+                == full_res.outputs[0].text.lower()
+            )
 
 
 @pytest.mark.skipif(not current_platform.is_cuda(), reason="Skip if not cuda")
 def test_full_cudagraph_with_invalid_backend():
-    with temporary_environ({
-            "VLLM_USE_V1": "1",
-            "VLLM_ATTENTION_BACKEND": "FLEX_ATTENTION"
-            # Flex_Attention is not supported with full cuda graph
-    }), pytest.raises(RuntimeError):
-        LLM(model="Qwen/Qwen2-1.5B-Instruct",
-            compilation_config=CompilationConfig(cudagraph_mode="FULL"))
+    with (
+        temporary_environ(
+            {
+                "VLLM_USE_V1": "1",
+                "VLLM_ATTENTION_BACKEND": "FLEX_ATTENTION",
+                # Flex_Attention is not supported with full cuda graph
+            }
+        ),
+        pytest.raises(RuntimeError),
+    ):
+        LLM(
+            model="Qwen/Qwen2-1.5B-Instruct",
+            compilation_config=CompilationConfig(cudagraph_mode="FULL"),
+        )
diff --git a/tests/compile/piecewise/test_multiple_graphs.py b/tests/compile/piecewise/test_multiple_graphs.py
index 5cfebfce9ea2..7372dc99bc79 100644
--- a/tests/compile/piecewise/test_multiple_graphs.py
+++ b/tests/compile/piecewise/test_multiple_graphs.py
@@ -10,10 +10,14 @@
 
 from vllm.compilation.backends import set_model_tag
 from vllm.compilation.counter import compilation_counter
-from vllm.compilation.decorators import (ignore_torch_compile,
-                                         support_torch_compile)
-from vllm.config import (CompilationConfig, CompilationLevel, CUDAGraphMode,
-                         VllmConfig, set_current_vllm_config)
+from vllm.compilation.decorators import ignore_torch_compile, support_torch_compile
+from vllm.config import (
+    CompilationConfig,
+    CompilationLevel,
+    CUDAGraphMode,
+    VllmConfig,
+    set_current_vllm_config,
+)
 from vllm.forward_context import BatchDescriptor, set_forward_context
 
 # This import automatically registers `torch.ops.silly.attention`
@@ -27,12 +31,7 @@
 
 @support_torch_compile
 class ParentModel(nn.Module):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = '',
-                 **kwargs) -> None:
+    def __init__(self, *, vllm_config: VllmConfig, prefix: str = "", **kwargs) -> None:
         super().__init__()
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -40,7 +39,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class Attention(nn.Module):
-
     def __init__(self, mlp_size: int, hidden_size: int) -> None:
         super().__init__()
         self.pre_attn = nn.Linear(mlp_size, hidden_size, bias=False)
@@ -51,17 +49,21 @@ def __init__(self, mlp_size: int, hidden_size: int) -> None:
         nn.init.xavier_normal_(
             self.pre_attn.weight.data,
             generator=torch.Generator().manual_seed(RANDOM_SEED),
-            gain=0.001)
+            gain=0.001,
+        )
         nn.init.xavier_normal_(
             self.post_attn.weight.data,
             generator=torch.Generator().manual_seed(RANDOM_SEED),
-            gain=0.001)
+            gain=0.001,
+        )
 
     def rms_norm_ref(self, x: torch.Tensor) -> torch.Tensor:
         x_f32 = x.float()
-        return (x_f32 * torch.rsqrt(
-            torch.mean(x_f32.square(), dim=-1, keepdim=True) + 1e-6) *
-                self.rms_norm_weight).to(x.dtype)
+        return (
+            x_f32
+            * torch.rsqrt(torch.mean(x_f32.square(), dim=-1, keepdim=True) + 1e-6)
+            * self.rms_norm_weight
+        ).to(x.dtype)
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         x = self.pre_attn(x)
@@ -76,14 +78,15 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 @support_torch_compile
 class CompiledAttention(nn.Module):
-
-    def __init__(self,
-                 *,
-                 mlp_size: int,
-                 hidden_size: int,
-                 vllm_config: VllmConfig,
-                 prefix: str = '',
-                 **kwargs) -> None:
+    def __init__(
+        self,
+        *,
+        mlp_size: int,
+        hidden_size: int,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        **kwargs,
+    ) -> None:
         super().__init__()
         self.attn = Attention(mlp_size, hidden_size)
 
@@ -93,21 +96,21 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 @support_torch_compile
 class CompiledAttentionTwo(CompiledAttention):
-
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         return self.attn(x) + x
 
 
 @ignore_torch_compile
 class SimpleModelWithTwoGraphs(ParentModel):
-
-    def __init__(self,
-                 *,
-                 mlp_size: int,
-                 hidden_size: int,
-                 vllm_config: VllmConfig,
-                 prefix: str = '',
-                 **kwargs) -> None:
+    def __init__(
+        self,
+        *,
+        mlp_size: int,
+        hidden_size: int,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        **kwargs,
+    ) -> None:
         super().__init__(vllm_config=vllm_config, prefix=prefix)
         # Test will fail without set_model_tag here with error:
         # "ValueError: too many values to unpack (expected 3)"
@@ -142,32 +145,45 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 @torch.inference_mode
-def run_model(vllm_config: VllmConfig, model: nn.Module, inputs: torch.Tensor,
-              cudagraph_runtime_mode: CUDAGraphMode):
+def run_model(
+    vllm_config: VllmConfig,
+    model: nn.Module,
+    inputs: torch.Tensor,
+    cudagraph_runtime_mode: CUDAGraphMode,
+):
     with set_forward_context({}, vllm_config=vllm_config):
         # warmup for the model with cudagraph_mode NONE
         model(inputs)
 
         # simulate cudagraphs capturing
-        with set_forward_context({},
-                                 vllm_config=vllm_config,
-                                 cudagraph_runtime_mode=cudagraph_runtime_mode,
-                                 batch_descriptor=BatchDescriptor(
-                                     num_tokens=2, )):
+        with set_forward_context(
+            {},
+            vllm_config=vllm_config,
+            cudagraph_runtime_mode=cudagraph_runtime_mode,
+            batch_descriptor=BatchDescriptor(
+                num_tokens=2,
+            ),
+        ):
             model(inputs[:2])
-        with set_forward_context({},
-                                 vllm_config=vllm_config,
-                                 cudagraph_runtime_mode=cudagraph_runtime_mode,
-                                 batch_descriptor=BatchDescriptor(
-                                     num_tokens=1, )):
+        with set_forward_context(
+            {},
+            vllm_config=vllm_config,
+            cudagraph_runtime_mode=cudagraph_runtime_mode,
+            batch_descriptor=BatchDescriptor(
+                num_tokens=1,
+            ),
+        ):
             model(inputs[:1])
 
         # simulate cudagraphs replay
-        with set_forward_context({},
-                                 vllm_config=vllm_config,
-                                 cudagraph_runtime_mode=cudagraph_runtime_mode,
-                                 batch_descriptor=BatchDescriptor(
-                                     num_tokens=2, )):
+        with set_forward_context(
+            {},
+            vllm_config=vllm_config,
+            cudagraph_runtime_mode=cudagraph_runtime_mode,
+            batch_descriptor=BatchDescriptor(
+                num_tokens=2,
+            ),
+        ):
             output = model(inputs[:2])
 
         output = output.cpu()
@@ -178,82 +194,104 @@ def test_multi_graph_piecewise_compile_outputs_equal():
     outputs = []
 
     # piecewise compile
-    vllm_config = VllmConfig(compilation_config=CompilationConfig(
-        level=CompilationLevel.PIECEWISE,
-        use_cudagraph=True,
-        splitting_ops=["silly.attention"],
-        cudagraph_capture_sizes=[1, 2],
-    ))
+    vllm_config = VllmConfig(
+        compilation_config=CompilationConfig(
+            level=CompilationLevel.PIECEWISE,
+            use_cudagraph=True,
+            splitting_ops=["silly.attention"],
+            cudagraph_capture_sizes=[1, 2],
+        )
+    )
     cudagraph_runtime_mode = CUDAGraphMode.PIECEWISE
 
     with set_current_vllm_config(vllm_config):
-        model = SimpleModelWithTwoGraphs(mlp_size=MLP_SIZE,
-                                         hidden_size=HIDDEN_SIZE,
-                                         vllm_config=vllm_config,
-                                         prefix='').eval().cuda()
+        model = (
+            SimpleModelWithTwoGraphs(
+                mlp_size=MLP_SIZE,
+                hidden_size=HIDDEN_SIZE,
+                vllm_config=vllm_config,
+                prefix="",
+            )
+            .eval()
+            .cuda()
+        )
 
     # Pre-allocate memory for CUDAGraph which expects
     # static tensor addresses
     inputs = torch.randn(BATCH_SIZE, MLP_SIZE).cuda()
 
     with compilation_counter.expect(
-            num_graphs_seen=2,  # two graphs for the model
-            num_piecewise_graphs_seen=6,
-            # attn_one, attn_two each has 3 piecewise graphs
-            # (pre attn, post attn, silly_attention) each
-            num_piecewise_capturable_graphs_seen=4,
-            # attn_one, attn_two has pre attn and post attn each, total=4
-            num_backend_compilations=4,  # num_piecewise_capturable_graphs_seen
-            num_cudagraph_captured=8,
-            # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
+        num_graphs_seen=2,  # two graphs for the model
+        num_piecewise_graphs_seen=6,
+        # attn_one, attn_two each has 3 piecewise graphs
+        # (pre attn, post attn, silly_attention) each
+        num_piecewise_capturable_graphs_seen=4,
+        # attn_one, attn_two has pre attn and post attn each, total=4
+        num_backend_compilations=4,  # num_piecewise_capturable_graphs_seen
+        num_cudagraph_captured=8,
+        # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
     ):
-        outputs.append(
-            run_model(vllm_config, model, inputs, cudagraph_runtime_mode))
+        outputs.append(run_model(vllm_config, model, inputs, cudagraph_runtime_mode))
 
     # no compile or cudagraph
-    vllm_config = VllmConfig(compilation_config=CompilationConfig(
-        level=CompilationLevel.NO_COMPILATION, ))
+    vllm_config = VllmConfig(
+        compilation_config=CompilationConfig(
+            level=CompilationLevel.NO_COMPILATION,
+        )
+    )
     cudagraph_runtime_mode = CUDAGraphMode.NONE
 
     with set_current_vllm_config(vllm_config):
-        model = SimpleModelWithTwoGraphs(mlp_size=MLP_SIZE,
-                                         hidden_size=HIDDEN_SIZE,
-                                         vllm_config=vllm_config,
-                                         prefix='').eval().cuda()
+        model = (
+            SimpleModelWithTwoGraphs(
+                mlp_size=MLP_SIZE,
+                hidden_size=HIDDEN_SIZE,
+                vllm_config=vllm_config,
+                prefix="",
+            )
+            .eval()
+            .cuda()
+        )
 
     with compilation_counter.expect(
-            num_graphs_seen=0,
-            num_piecewise_graphs_seen=0,
-            num_piecewise_capturable_graphs_seen=0,
-            num_backend_compilations=0,
-            num_cudagraph_captured=0,
+        num_graphs_seen=0,
+        num_piecewise_graphs_seen=0,
+        num_piecewise_capturable_graphs_seen=0,
+        num_backend_compilations=0,
+        num_cudagraph_captured=0,
     ):
-        outputs.append(
-            run_model(vllm_config, model, inputs, cudagraph_runtime_mode))
+        outputs.append(run_model(vllm_config, model, inputs, cudagraph_runtime_mode))
 
     # piecewise compile without CUDA graph
-    vllm_config = VllmConfig(compilation_config=CompilationConfig(
-        level=CompilationLevel.PIECEWISE,
-        use_cudagraph=False,
-        splitting_ops=["silly.attention"],
-    ))
+    vllm_config = VllmConfig(
+        compilation_config=CompilationConfig(
+            level=CompilationLevel.PIECEWISE,
+            use_cudagraph=False,
+            splitting_ops=["silly.attention"],
+        )
+    )
     cudagraph_runtime_mode = CUDAGraphMode.PIECEWISE
 
     with set_current_vllm_config(vllm_config):
-        model = SimpleModelWithTwoGraphs(mlp_size=MLP_SIZE,
-                                         hidden_size=HIDDEN_SIZE,
-                                         vllm_config=vllm_config,
-                                         prefix='').eval().cuda()
+        model = (
+            SimpleModelWithTwoGraphs(
+                mlp_size=MLP_SIZE,
+                hidden_size=HIDDEN_SIZE,
+                vllm_config=vllm_config,
+                prefix="",
+            )
+            .eval()
+            .cuda()
+        )
 
     with compilation_counter.expect(
-            num_graphs_seen=2,
-            num_piecewise_graphs_seen=6,
-            num_piecewise_capturable_graphs_seen=4,
-            num_backend_compilations=4,
-            num_cudagraph_captured=0,  # no cudagraph captured
+        num_graphs_seen=2,
+        num_piecewise_graphs_seen=6,
+        num_piecewise_capturable_graphs_seen=4,
+        num_backend_compilations=4,
+        num_cudagraph_captured=0,  # no cudagraph captured
     ):
-        outputs.append(
-            run_model(vllm_config, model, inputs, cudagraph_runtime_mode))
+        outputs.append(run_model(vllm_config, model, inputs, cudagraph_runtime_mode))
 
     # Generally don't expect outputs with and without inductor
     # to be bitwise equivalent
diff --git a/tests/compile/piecewise/test_simple.py b/tests/compile/piecewise/test_simple.py
index 41055f431569..ea80c43c9da7 100644
--- a/tests/compile/piecewise/test_simple.py
+++ b/tests/compile/piecewise/test_simple.py
@@ -11,8 +11,13 @@
 
 from vllm.compilation.counter import compilation_counter
 from vllm.compilation.decorators import support_torch_compile
-from vllm.config import (CompilationConfig, CompilationLevel, CUDAGraphMode,
-                         VllmConfig, set_current_vllm_config)
+from vllm.config import (
+    CompilationConfig,
+    CompilationLevel,
+    CUDAGraphMode,
+    VllmConfig,
+    set_current_vllm_config,
+)
 from vllm.envs import VLLM_USE_V1
 from vllm.forward_context import BatchDescriptor, set_forward_context
 from vllm.utils import is_torch_equal_or_newer
@@ -23,12 +28,7 @@
 
 @support_torch_compile
 class SillyModel(nn.Module):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = '',
-                 **kwargs) -> None:
+    def __init__(self, *, vllm_config: VllmConfig, prefix: str = "", **kwargs) -> None:
         super().__init__()
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -60,53 +60,65 @@ def _run_simple_model(
     expected_num_backend_compilations,
     expected_num_cudagraph_captured,
 ):
-    vllm_config = VllmConfig(compilation_config=CompilationConfig(
-        level=CompilationLevel.PIECEWISE,
-        use_cudagraph=True,
-        use_inductor=use_inductor,
-        splitting_ops=splitting_ops,
-        use_inductor_graph_partition=use_inductor_graph_partition,
-        cudagraph_copy_inputs=True,
-        cudagraph_capture_sizes=[1, 2],
-    ))
+    vllm_config = VllmConfig(
+        compilation_config=CompilationConfig(
+            level=CompilationLevel.PIECEWISE,
+            use_cudagraph=True,
+            use_inductor=use_inductor,
+            splitting_ops=splitting_ops,
+            use_inductor_graph_partition=use_inductor_graph_partition,
+            cudagraph_copy_inputs=True,
+            cudagraph_capture_sizes=[1, 2],
+        )
+    )
     with set_current_vllm_config(vllm_config):
-        model = SillyModel(vllm_config=vllm_config, prefix='')
+        model = SillyModel(vllm_config=vllm_config, prefix="")
 
     inputs = torch.randn(100).cuda()
 
-    with compilation_counter.expect(
+    with (
+        compilation_counter.expect(
             num_graphs_seen=1,  # one graph for the model
             num_piecewise_graphs_seen=expected_num_piecewise_graphs_seen,
-            num_piecewise_capturable_graphs_seen=
-            expected_num_piecewise_capturable_graphs_seen,
+            num_piecewise_capturable_graphs_seen=expected_num_piecewise_capturable_graphs_seen,
             num_backend_compilations=expected_num_backend_compilations,
             num_cudagraph_captured=expected_num_cudagraph_captured,
-    ), set_forward_context(None,
-                           vllm_config=vllm_config):  # background context
+        ),
+        set_forward_context(None, vllm_config=vllm_config),
+    ):  # background context
         # warm up with background context
         model(inputs)
 
         # capturing/replaying should under context of cudagraph dispatching
         with set_forward_context(
-                None,
-                vllm_config=vllm_config,
-                cudagraph_runtime_mode=CUDAGraphMode.PIECEWISE,
-                batch_descriptor=BatchDescriptor(num_tokens=2, )):
+            None,
+            vllm_config=vllm_config,
+            cudagraph_runtime_mode=CUDAGraphMode.PIECEWISE,
+            batch_descriptor=BatchDescriptor(
+                num_tokens=2,
+            ),
+        ):
             model(torch.randn(2).cuda())
         with set_forward_context(
-                None,
-                vllm_config=vllm_config,
-                cudagraph_runtime_mode=CUDAGraphMode.PIECEWISE,
-                batch_descriptor=BatchDescriptor(num_tokens=1, )):
+            None,
+            vllm_config=vllm_config,
+            cudagraph_runtime_mode=CUDAGraphMode.PIECEWISE,
+            batch_descriptor=BatchDescriptor(
+                num_tokens=1,
+            ),
+        ):
             model(torch.randn(1).cuda())
 
         input = torch.zeros(2).cuda()
         reset_global_counter()
         with set_forward_context(
-                None,
-                vllm_config=vllm_config,
-                cudagraph_runtime_mode=CUDAGraphMode.PIECEWISE,
-                batch_descriptor=BatchDescriptor(num_tokens=2, )):
+            None,
+            vllm_config=vllm_config,
+            cudagraph_runtime_mode=CUDAGraphMode.PIECEWISE,
+            batch_descriptor=BatchDescriptor(
+                num_tokens=2,
+            ),
+        ):
             output = model(input)
         assert get_global_counter() == 2
         assert torch.allclose(output.cpu(), torch.tensor([19.0, 19.0]))
@@ -122,10 +134,8 @@ def test_simple_piecewise_compile(use_inductor):
         use_inductor=use_inductor,
         expected_num_piecewise_graphs_seen=5,  # 2 * num_layers + 1
         expected_num_piecewise_capturable_graphs_seen=3,  # 1 + num_layers
-        expected_num_backend_compilations=
-        3,  # num_piecewise_capturable_graphs_seen
-        expected_num_cudagraph_captured=
-        6,  # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
+        expected_num_backend_compilations=3,  # num_piecewise_capturable_graphs_seen
+        expected_num_cudagraph_captured=6,  # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
     )
 
 
@@ -134,8 +144,7 @@ def test_simple_piecewise_compile(use_inductor):
 def test_simple_inductor_graph_partition(splitting_ops):
     assert VLLM_USE_V1
     if not is_torch_equal_or_newer("2.9.0.dev"):
-        pytest.skip("inductor graph partition is only available "
-                    "in PyTorch 2.9+")
+        pytest.skip("inductor graph partition is only available in PyTorch 2.9+")
 
     _run_simple_model(
         # inductor graph partition automatically resets splitting_ops
@@ -143,13 +152,9 @@ def test_simple_inductor_graph_partition(splitting_ops):
         splitting_ops=splitting_ops,
         use_inductor_graph_partition=True,
         use_inductor=True,
-        expected_num_piecewise_graphs_seen=
-        1,  # since not splitting at fx graph level
-        expected_num_piecewise_capturable_graphs_seen=
-        1,  # since not splitting at fx graph level
-        expected_num_backend_compilations=
-        1,  # since not splitting at fx graph level
-        expected_num_cudagraph_captured=
-        6,  # inductor graph partition still captures 6
+        expected_num_piecewise_graphs_seen=1,  # since not splitting at fx graph level
+        expected_num_piecewise_capturable_graphs_seen=1,  # since not splitting at fx graph level
+        expected_num_backend_compilations=1,  # since not splitting at fx graph level
+        expected_num_cudagraph_captured=6,  # inductor graph partition still captures 6
         # graph, same as fx graph partition.
     )
diff --git a/tests/compile/piecewise/test_toy_llama.py b/tests/compile/piecewise/test_toy_llama.py
index cba7517647e5..46b9e4bf8d2c 100644
--- a/tests/compile/piecewise/test_toy_llama.py
+++ b/tests/compile/piecewise/test_toy_llama.py
@@ -8,6 +8,7 @@
 if the config `tractable_init` is set to True. Otherwise, the weights are
 initialized randomly with a fixed seed.
 """
+
 from dataclasses import dataclass
 from typing import Any, Optional
 
@@ -17,8 +18,13 @@
 
 from vllm.compilation.counter import compilation_counter
 from vllm.compilation.decorators import support_torch_compile
-from vllm.config import (CompilationConfig, CompilationLevel, CUDAGraphMode,
-                         VllmConfig, set_current_vllm_config)
+from vllm.config import (
+    CompilationConfig,
+    CompilationLevel,
+    CUDAGraphMode,
+    VllmConfig,
+    set_current_vllm_config,
+)
 from vllm.forward_context import BatchDescriptor, set_forward_context
 
 # This import automatically registers `torch.ops.silly.attention`
@@ -43,15 +49,14 @@ def compute_hash(self) -> str:
             factors.append((k, v))
         factors.sort()
         import hashlib
-        return hashlib.md5(str(factors).encode(),
-                           usedforsecurity=False).hexdigest()
+
+        return hashlib.md5(str(factors).encode(), usedforsecurity=False).hexdigest()
 
     def __post_init__(self):
         assert self.mlp_size >= self.hidden_size
 
 
 class LlamaMLP(nn.Module):
-
     def __init__(self, config: LlamaConfig) -> None:
         super().__init__()
         self.gate_up_projection = nn.Linear(
@@ -66,31 +71,31 @@ def __init__(self, config: LlamaConfig) -> None:
         )
 
         if config.tractable_init:
-            nn.init.eye_(self.gate_up_projection.weight.data[:config.mlp_size])
-            nn.init.eye_(self.gate_up_projection.weight.data[config.mlp_size:])
+            nn.init.eye_(self.gate_up_projection.weight.data[: config.mlp_size])
+            nn.init.eye_(self.gate_up_projection.weight.data[config.mlp_size :])
             nn.init.eye_(self.down_projection.weight.data)
         else:
-            nn.init.xavier_normal_(self.gate_up_projection.weight.data,
-                                   generator=torch.Generator().manual_seed(
-                                       config.random_seed),
-                                   gain=0.001)
-            nn.init.xavier_normal_(self.down_projection.weight.data,
-                                   generator=torch.Generator().manual_seed(
-                                       config.random_seed),
-                                   gain=0.001)
+            nn.init.xavier_normal_(
+                self.gate_up_projection.weight.data,
+                generator=torch.Generator().manual_seed(config.random_seed),
+                gain=0.001,
+            )
+            nn.init.xavier_normal_(
+                self.down_projection.weight.data,
+                generator=torch.Generator().manual_seed(config.random_seed),
+                gain=0.001,
+            )
 
     def forward(self, x):
         # for tractable_init and positive input, this is
         # essentially an elementwise-square
         x = self.gate_up_projection(x)
-        x = x[:, :x.size(1) // 2] * torch.nn.functional.relu(
-            x[:, x.size(1) // 2:])
+        x = x[:, : x.size(1) // 2] * torch.nn.functional.relu(x[:, x.size(1) // 2 :])
         x = self.down_projection(x)
         return x
 
 
 class LlamaAttention(nn.Module):
-
     def __init__(self, config: LlamaConfig) -> None:
         super().__init__()
         self.qkv_projection = nn.Linear(
@@ -106,21 +111,25 @@ def __init__(self, config: LlamaConfig) -> None:
         )
 
         if config.tractable_init:
-            nn.init.eye_(self.qkv_projection.weight.data[:config.hidden_size])
-            nn.init.eye_(self.qkv_projection.weight.data[config.hidden_size:2 *
-                                                         config.hidden_size])
-            nn.init.eye_(self.qkv_projection.weight.data[2 *
-                                                         config.hidden_size:])
+            nn.init.eye_(self.qkv_projection.weight.data[: config.hidden_size])
+            nn.init.eye_(
+                self.qkv_projection.weight.data[
+                    config.hidden_size : 2 * config.hidden_size
+                ]
+            )
+            nn.init.eye_(self.qkv_projection.weight.data[2 * config.hidden_size :])
             nn.init.eye_(self.output_projection.weight.data)
         else:
-            nn.init.xavier_normal_(self.qkv_projection.weight.data,
-                                   generator=torch.Generator().manual_seed(
-                                       config.random_seed),
-                                   gain=0.001)
-            nn.init.xavier_normal_(self.output_projection.weight.data,
-                                   generator=torch.Generator().manual_seed(
-                                       config.random_seed),
-                                   gain=0.001)
+            nn.init.xavier_normal_(
+                self.qkv_projection.weight.data,
+                generator=torch.Generator().manual_seed(config.random_seed),
+                gain=0.001,
+            )
+            nn.init.xavier_normal_(
+                self.output_projection.weight.data,
+                generator=torch.Generator().manual_seed(config.random_seed),
+                gain=0.001,
+            )
 
     def forward(
         self,
@@ -144,7 +153,6 @@ def forward(
 
 
 class LlamaDecoderLayer(nn.Module):
-
     def __init__(self, config: LlamaConfig) -> None:
         super().__init__()
         self.self_attention = LlamaAttention(config)
@@ -164,7 +172,7 @@ def forward(
         - if residual is not None, the outputs are:
             - residual = (hidden_states + residual + 1) * 3 + positions * 2 + hidden_states + residual = (hidden_states + residual) * 4 + positions * 2 + 3
             - hidden_states = (residual + 1) ** 2
-        """ # noqa
+        """  # noqa
         if residual is None:
             residual = hidden_states
             hidden_states = hidden_states + 1
@@ -173,8 +181,9 @@ def forward(
             residual = hidden_states
             hidden_states = hidden_states + 1
 
-        hidden_states = self.self_attention(positions=positions,
-                                            hidden_states=hidden_states)
+        hidden_states = self.self_attention(
+            positions=positions, hidden_states=hidden_states
+        )
 
         hidden_states = hidden_states + residual
         residual = hidden_states
@@ -186,20 +195,22 @@ def forward(
 
 @support_torch_compile
 class LlamaModel(nn.Module):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 config: LlamaConfig,
-                 prefix: str = '',
-                 **kwargs) -> None:
+    def __init__(
+        self,
+        *,
+        vllm_config: VllmConfig,
+        config: LlamaConfig,
+        prefix: str = "",
+        **kwargs,
+    ) -> None:
         super().__init__()
         self.embedding_tokens = nn.Embedding(
             num_embeddings=config.vocab_size,
             embedding_dim=config.hidden_size,
         )
         self.layers = nn.ModuleList(
-            [LlamaDecoderLayer(config) for _ in range(config.num_layers)])
+            [LlamaDecoderLayer(config) for _ in range(config.num_layers)]
+        )
 
         # this is the initial value of the hidden states
         self.embedding_tokens.weight.data.fill_(config.init_value)
@@ -216,34 +227,39 @@ def forward(
         return hidden_states
 
 
-def tractable_computation(input_ids: torch.Tensor,
-                          positions: torch.Tensor,
-                          config: LlamaConfig,
-                          init_value: float = 1.0) -> torch.Tensor:
-    hidden_states = torch.ones(input_ids.size(0),
-                               config.hidden_size,
-                               device=input_ids.device,
-                               dtype=input_ids.dtype) * init_value
+def tractable_computation(
+    input_ids: torch.Tensor,
+    positions: torch.Tensor,
+    config: LlamaConfig,
+    init_value: float = 1.0,
+) -> torch.Tensor:
+    hidden_states = (
+        torch.ones(
+            input_ids.size(0),
+            config.hidden_size,
+            device=input_ids.device,
+            dtype=input_ids.dtype,
+        )
+        * init_value
+    )
 
     # first layer
     residual = hidden_states * 4 + positions.unsqueeze(1) * 2 + 3
-    hidden_states = (residual + 1)**2
+    hidden_states = (residual + 1) ** 2
 
     # following layers
     for _ in range(config.num_layers - 1):
         hidden_states = hidden_states + residual
         residual = hidden_states * 4 + positions.unsqueeze(1) * 2 + 3
-        hidden_states = (residual + 1)**2
+        hidden_states = (residual + 1) ** 2
 
     return hidden_states
 
 
 @torch.inference_mode
-def run_model(llama_config,
-              use_compile: bool,
-              use_inductor: bool,
-              split_attn: bool = False) -> torch.Tensor:
-
+def run_model(
+    llama_config, use_compile: bool, use_inductor: bool, split_attn: bool = False
+) -> torch.Tensor:
     if use_compile:
         compilation_config = CompilationConfig(
             level=CompilationLevel.PIECEWISE,
@@ -256,54 +272,66 @@ def run_model(llama_config,
         cudagraph_runtime_mode = CUDAGraphMode.PIECEWISE
     else:
         compilation_config = CompilationConfig(
-            level=CompilationLevel.NO_COMPILATION, )
+            level=CompilationLevel.NO_COMPILATION,
+        )
         cudagraph_runtime_mode = CUDAGraphMode.NONE
 
-    vllm_config = VllmConfig(compilation_config=compilation_config,
-                             additional_config=llama_config)
+    vllm_config = VllmConfig(
+        compilation_config=compilation_config, additional_config=llama_config
+    )
     with set_current_vllm_config(vllm_config):
-        model = LlamaModel(config=llama_config,
-                           vllm_config=vllm_config,
-                           prefix="").eval().cuda()
+        model = (
+            LlamaModel(config=llama_config, vllm_config=vllm_config, prefix="")
+            .eval()
+            .cuda()
+        )
 
-    with set_forward_context({},
-                             vllm_config=vllm_config):  # background context
+    with set_forward_context({}, vllm_config=vllm_config):  # background context
         B = 16  # max batch size
-        input_ids = torch.randint(0, llama_config.vocab_size, (B, )).cuda()
+        input_ids = torch.randint(0, llama_config.vocab_size, (B,)).cuda()
         positions = torch.arange(B).cuda()
 
         # warmup for the model with cudagraph_mode NONE
         model(input_ids, positions)
 
         # simulate cudagraphs capturing
-        with set_forward_context({},
-                                 vllm_config=vllm_config,
-                                 cudagraph_runtime_mode=cudagraph_runtime_mode,
-                                 batch_descriptor=BatchDescriptor(
-                                     num_tokens=2, )):
+        with set_forward_context(
+            {},
+            vllm_config=vllm_config,
+            cudagraph_runtime_mode=cudagraph_runtime_mode,
+            batch_descriptor=BatchDescriptor(
+                num_tokens=2,
+            ),
+        ):
             model(input_ids[:2], positions[:2])
-        with set_forward_context({},
-                                 vllm_config=vllm_config,
-                                 cudagraph_runtime_mode=cudagraph_runtime_mode,
-                                 batch_descriptor=BatchDescriptor(
-                                     num_tokens=1, )):
+        with set_forward_context(
+            {},
+            vllm_config=vllm_config,
+            cudagraph_runtime_mode=cudagraph_runtime_mode,
+            batch_descriptor=BatchDescriptor(
+                num_tokens=1,
+            ),
+        ):
             model(input_ids[:1], positions[:1])
 
         input_ids[:2].zero_()
         # simulate cudagraphs replay
-        with set_forward_context({},
-                                 vllm_config=vllm_config,
-                                 cudagraph_runtime_mode=cudagraph_runtime_mode,
-                                 batch_descriptor=BatchDescriptor(
-                                     num_tokens=2, )):
+        with set_forward_context(
+            {},
+            vllm_config=vllm_config,
+            cudagraph_runtime_mode=cudagraph_runtime_mode,
+            batch_descriptor=BatchDescriptor(
+                num_tokens=2,
+            ),
+        ):
             output = model(input_ids[:2], positions[:2])
 
         output = output.cpu()
 
         if llama_config.tractable_init:
-            expected_output = tractable_computation(input_ids[:2],
-                                                    positions[:2],
-                                                    llama_config).cpu()
+            expected_output = tractable_computation(
+                input_ids[:2], positions[:2], llama_config
+            ).cpu()
 
             assert torch.allclose(output, expected_output)
         else:
@@ -314,27 +342,23 @@ def run_model(llama_config,
 def test_toy_llama(use_inductor: bool):
     # compare output with and without piecewise compilation
 
-    llama_config = LlamaConfig(hidden_size=128,
-                               mlp_size=256,
-                               vocab_size=128,
-                               num_layers=12)
+    llama_config = LlamaConfig(
+        hidden_size=128, mlp_size=256, vocab_size=128, num_layers=12
+    )
 
-    tractable_config = LlamaConfig(hidden_size=128,
-                                   mlp_size=256,
-                                   vocab_size=128,
-                                   num_layers=2,
-                                   tractable_init=True)
+    tractable_config = LlamaConfig(
+        hidden_size=128, mlp_size=256, vocab_size=128, num_layers=2, tractable_init=True
+    )
 
     outputs = []
     with compilation_counter.expect(
-            num_graphs_seen=0,
-            num_piecewise_graphs_seen=0,
-            num_piecewise_capturable_graphs_seen=0,
-            num_backend_compilations=0,
-            num_cudagraph_captured=0,
+        num_graphs_seen=0,
+        num_piecewise_graphs_seen=0,
+        num_piecewise_capturable_graphs_seen=0,
+        num_backend_compilations=0,
+        num_cudagraph_captured=0,
     ):
-        outputs.append(
-            run_model(llama_config, use_inductor=False, use_compile=False))
+        outputs.append(run_model(llama_config, use_inductor=False, use_compile=False))
     run_model(tractable_config, use_inductor=False, use_compile=False)
 
     if use_inductor:
@@ -343,41 +367,41 @@ def test_toy_llama(use_inductor: bool):
         kwargs = {"num_eager_compiles": 1, "num_inductor_compiles": 0}
 
     with compilation_counter.expect(
-            num_graphs_seen=1,  # one graph for the model
-            num_piecewise_graphs_seen=1,
-            num_piecewise_capturable_graphs_seen=1,
-            num_backend_compilations=1,  # num_piecewise_capturable_graphs_seen
-            num_cudagraph_captured=
-            2,  # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
-            **kwargs,
+        num_graphs_seen=1,  # one graph for the model
+        num_piecewise_graphs_seen=1,
+        num_piecewise_capturable_graphs_seen=1,
+        num_backend_compilations=1,  # num_piecewise_capturable_graphs_seen
+        num_cudagraph_captured=2,  # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
+        **kwargs,
     ):
         outputs.append(
-            run_model(llama_config,
-                      use_inductor=use_inductor,
-                      use_compile=True))
+            run_model(llama_config, use_inductor=use_inductor, use_compile=True)
+        )
     run_model(tractable_config, use_inductor=use_inductor, use_compile=True)
 
     with compilation_counter.expect(
-            num_graphs_seen=1,  # one graph for the model
-            num_piecewise_graphs_seen=2 * llama_config.num_layers +
-            1,  # 2 * num_layers + 1
-            num_piecewise_capturable_graphs_seen=1 +
-            llama_config.num_layers,  # 1 + num_layers
-            num_backend_compilations=1 +
-            llama_config.num_layers,  # num_piecewise_capturable_graphs_seen
-            num_cudagraph_captured=2 *
-        (1 + llama_config.num_layers
-         ),  # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
+        num_graphs_seen=1,  # one graph for the model
+        num_piecewise_graphs_seen=2 * llama_config.num_layers + 1,  # 2 * num_layers + 1
+        num_piecewise_capturable_graphs_seen=1
+        + llama_config.num_layers,  # 1 + num_layers
+        num_backend_compilations=1
+        + llama_config.num_layers,  # num_piecewise_capturable_graphs_seen
+        num_cudagraph_captured=2
+        * (
+            1 + llama_config.num_layers
+        ),  # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
     ):
         outputs.append(
-            run_model(llama_config,
-                      use_inductor=use_inductor,
-                      use_compile=True,
-                      split_attn=True))
-    run_model(tractable_config,
-              use_inductor=use_inductor,
-              use_compile=True,
-              split_attn=True)
+            run_model(
+                llama_config,
+                use_inductor=use_inductor,
+                use_compile=True,
+                split_attn=True,
+            )
+        )
+    run_model(
+        tractable_config, use_inductor=use_inductor, use_compile=True, split_attn=True
+    )
 
     for i in range(1, len(outputs)):
         assert torch.allclose(outputs[0], outputs[i])
@@ -388,17 +412,15 @@ def benchmark():
     from triton.testing import do_bench
 
     # similar to llama 3.1-8B
-    llama_config = LlamaConfig(hidden_size=4096,
-                               mlp_size=14336,
-                               vocab_size=128 * 1024,
-                               num_layers=32)
+    llama_config = LlamaConfig(
+        hidden_size=4096, mlp_size=14336, vocab_size=128 * 1024, num_layers=32
+    )
 
     # a tiny model to measure the overhead
     # of piecewise cudagraph
-    llama_config = LlamaConfig(hidden_size=40,
-                               mlp_size=80,
-                               vocab_size=128,
-                               num_layers=2)
+    llama_config = LlamaConfig(
+        hidden_size=40, mlp_size=80, vocab_size=128, num_layers=2
+    )
 
     cudagraph_sizes = [1, 2, 4] + [i * 8 for i in range(1, 33)]
 
@@ -424,12 +446,15 @@ def benchmark():
 
         vllm_config = VllmConfig(compilation_config=compilation_config)
         with set_current_vllm_config(vllm_config):
-            model = LlamaModel(config=llama_config,
-                               vllm_config=vllm_config,
-                               prefix="").eval().cuda().to(torch.bfloat16)
+            model = (
+                LlamaModel(config=llama_config, vllm_config=vllm_config, prefix="")
+                .eval()
+                .cuda()
+                .to(torch.bfloat16)
+            )
 
         B = 256  # max batch size
-        input_ids = torch.randint(0, llama_config.vocab_size, (B, )).cuda()
+        input_ids = torch.randint(0, llama_config.vocab_size, (B,)).cuda()
         positions = torch.arange(B).cuda().to(torch.bfloat16)
 
         graphs = {}
@@ -451,21 +476,25 @@ def benchmark():
                 # and use it later, because it will look up the name `b` in the
                 # enclosing scope, and the value of `b` will always be 256.
                 # it is fine here, because we only use the lambda function once.
-                runtime = do_bench(lambda: graphs[b][0]  # noqa
-                                   (input_ids[:b], positions[:b]))  # noqa
+                runtime = do_bench(
+                    lambda: graphs[b][0](  # noqa
+                        input_ids[:b], positions[:b]
+                    )
+                )  # noqa
                 piecewise_cudagraph_time[b] = runtime
             else:
                 runtime = do_bench(lambda: graphs[b][0].replay())  # noqa
-                eager_runtime = do_bench(
-                    lambda: model(input_ids[:b], positions[:b]))  # noqa
+                eager_runtime = do_bench(lambda: model(input_ids[:b], positions[:b]))  # noqa
                 full_cudagraph_time[b] = runtime
                 eager_time[b] = eager_runtime
 
     # print in tabular format
     print("batch size\teager mode\tfull cudagraph\tpiecewise cudagraph")
     for b in cudagraph_sizes:
-        print(f"{b}\t{eager_time[b]:.3f}\t{full_cudagraph_time[b]:.3f}"
-              f"\t{piecewise_cudagraph_time[b]:.3f}")
+        print(
+            f"{b}\t{eager_time[b]:.3f}\t{full_cudagraph_time[b]:.3f}"
+            f"\t{piecewise_cudagraph_time[b]:.3f}"
+        )
 
 
 if __name__ == "__main__":
diff --git a/tests/compile/silly_attention.py b/tests/compile/silly_attention.py
index baedafbae99f..c0d3f908149f 100644
--- a/tests/compile/silly_attention.py
+++ b/tests/compile/silly_attention.py
@@ -31,8 +31,9 @@ def reset_global_counter():
     _global_counter = 0
 
 
-def silly_attention(q: torch.Tensor, k: torch.Tensor, v: torch.Tensor,
-                    out: torch.Tensor) -> None:
+def silly_attention(
+    q: torch.Tensor, k: torch.Tensor, v: torch.Tensor, out: torch.Tensor
+) -> None:
     """
     Unified attention implementation that depends on
     all inputs and affects the output.
@@ -47,8 +48,9 @@ def silly_attention(q: torch.Tensor, k: torch.Tensor, v: torch.Tensor,
     out.copy_(q + k + v)
 
 
-def silly_attention_fake(q: torch.Tensor, k: torch.Tensor, v: torch.Tensor,
-                         out: torch.Tensor) -> None:
+def silly_attention_fake(
+    q: torch.Tensor, k: torch.Tensor, v: torch.Tensor, out: torch.Tensor
+) -> None:
     """Fake implementation for testing"""
     return
 
@@ -60,5 +62,5 @@ def silly_attention_fake(q: torch.Tensor, k: torch.Tensor, v: torch.Tensor,
     mutates_args=["out"],
     fake_impl=silly_attention_fake,
     target_lib=silly_lib,
-    tags=(torch._C.Tag.cudagraph_unsafe, ),
+    tags=(torch._C.Tag.cudagraph_unsafe,),
 )
diff --git a/tests/compile/test_async_tp.py b/tests/compile/test_async_tp.py
index 1dc21365d557..03cd510eb5d0 100644
--- a/tests/compile/test_async_tp.py
+++ b/tests/compile/test_async_tp.py
@@ -8,18 +8,30 @@
 
 import vllm.envs as envs
 from vllm.compilation.collective_fusion import AsyncTPPass
-from vllm.config import (CompilationConfig, DeviceConfig, ModelConfig,
-                         PassConfig, VllmConfig)
-from vllm.distributed import (tensor_model_parallel_all_gather,
-                              tensor_model_parallel_reduce_scatter)
-from vllm.distributed.parallel_state import (init_distributed_environment,
-                                             initialize_model_parallel)
+from vllm.config import (
+    CompilationConfig,
+    DeviceConfig,
+    ModelConfig,
+    PassConfig,
+    VllmConfig,
+)
+from vllm.distributed import (
+    tensor_model_parallel_all_gather,
+    tensor_model_parallel_reduce_scatter,
+)
+from vllm.distributed.parallel_state import (
+    init_distributed_environment,
+    initialize_model_parallel,
+)
 from vllm.platforms import current_platform
 from vllm.utils import update_environment_variables
 
 from ..models.registry import HF_EXAMPLE_MODELS
-from ..utils import (compare_two_settings, create_new_process_for_each_test,
-                     multi_gpu_test)
+from ..utils import (
+    compare_two_settings,
+    create_new_process_for_each_test,
+    multi_gpu_test,
+)
 from .backend import TestBackend
 
 FP8_DTYPE = current_platform.fp8_dtype()
@@ -33,21 +45,20 @@
 
 
 class TestMMRSModel(torch.nn.Module):
-
     def __init__(self, hidden_size=16, dtype=torch.float16):
         super().__init__()
         self.hidden_size = hidden_size
         self.dtype = dtype
-        self.gate_proj = torch.nn.Parameter(torch.empty(
-            (self.hidden_size * 2, hidden_size)),
-                                            requires_grad=False)
+        self.gate_proj = torch.nn.Parameter(
+            torch.empty((self.hidden_size * 2, hidden_size)), requires_grad=False
+        )
         # Initialize weights
         torch.nn.init.normal_(self.gate_proj, std=0.02)
 
     def forward(self, hidden_states):
         """
         Forward pass implementing the mm + reduce scatter in the FX graph
-    
+
         """
         # Reshape input
         view = hidden_states.reshape(-1, self.hidden_size)
@@ -66,14 +77,13 @@ def ops_in_model_after(self):
 
 
 class TestAGMMModel(torch.nn.Module):
-
     def __init__(self, hidden_size=16, dtype=torch.float16):
         super().__init__()
         self.hidden_size = hidden_size
         self.dtype = dtype
-        self.weight = torch.nn.Parameter(torch.empty(
-            (hidden_size, hidden_size)),
-                                         requires_grad=False)
+        self.weight = torch.nn.Parameter(
+            torch.empty((hidden_size, hidden_size)), requires_grad=False
+        )
         # Initialize weights
         torch.nn.init.normal_(self.weight, std=0.02)
 
@@ -96,32 +106,35 @@ def ops_in_model_after(self):
 
 
 class _BaseScaledMMModel(torch.nn.Module):
-
     def __init__(self, hidden_size=16, dtype=torch.float16):
         super().__init__()
         self.hidden_size = hidden_size
         self.dtype = dtype
-        self.weight = torch.empty([hidden_size, hidden_size], dtype=FP8_DTYPE)\
-            .contiguous().transpose(0, 1)
+        self.weight = (
+            torch.empty([hidden_size, hidden_size], dtype=FP8_DTYPE)
+            .contiguous()
+            .transpose(0, 1)
+        )
 
         # Initialize scale_b for _scaled_mm.
         self.scale_b = torch.ones(1, self.hidden_size, dtype=torch.float32)
 
 
 class TestScaledMMRSModel(_BaseScaledMMModel):
-
     def forward(self, input: torch.Tensor):
         """
         Forward pass implementing the scaled_mm + reduce scatter in the FX graph
-    
+
         """
         fp8_input = input.to(FP8_DTYPE)
         scale_a = torch.ones(input.shape[0], 1, dtype=torch.float32)
-        scaled_mm = torch._scaled_mm(fp8_input,
-                                     self.weight,
-                                     scale_a=scale_a,
-                                     scale_b=self.scale_b,
-                                     out_dtype=self.dtype)
+        scaled_mm = torch._scaled_mm(
+            fp8_input,
+            self.weight,
+            scale_a=scale_a,
+            scale_b=self.scale_b,
+            out_dtype=self.dtype,
+        )
         reduce_scatter = tensor_model_parallel_reduce_scatter(scaled_mm, dim=0)
         return reduce_scatter
 
@@ -133,7 +146,6 @@ def ops_in_model_after(self):
 
 
 class TestAGScaledMMModel(_BaseScaledMMModel):
-
     def forward(self, input: torch.Tensor):
         """
         Forward pass implementing the all gather + scaled_mm in the FX graph
@@ -143,11 +155,13 @@ def forward(self, input: torch.Tensor):
         all_gather = tensor_model_parallel_all_gather(fp8_input, dim=0)
 
         scale_a = torch.ones(all_gather.shape[0], 1, dtype=torch.float32)
-        scaled_mm = torch._scaled_mm(all_gather,
-                                     self.weight,
-                                     scale_a=scale_a,
-                                     scale_b=self.scale_b,
-                                     out_dtype=self.dtype)
+        scaled_mm = torch._scaled_mm(
+            all_gather,
+            self.weight,
+            scale_a=scale_a,
+            scale_b=self.scale_b,
+            out_dtype=self.dtype,
+        )
         return scaled_mm
 
     def ops_in_model_before(self):
@@ -158,20 +172,22 @@ def ops_in_model_after(self):
 
 
 class TestCutlassScaledMMRSModel(_BaseScaledMMModel):
-
     def forward(self, input: torch.Tensor):
         """
         Forward pass implementing the cutlass_scaled_mm + reduce scatter
         in the FX graph
-    
+
         """
         fp8_input = input.to(FP8_DTYPE)
         scale_a = torch.ones(input.shape[0], 1, dtype=torch.float32)
-        mm_out = torch.empty((fp8_input.shape[0], self.weight.shape[1]),
-                             dtype=self.dtype,
-                             device=input.device)
-        torch.ops._C.cutlass_scaled_mm(mm_out, fp8_input, self.weight, scale_a,
-                                       self.scale_b, None)
+        mm_out = torch.empty(
+            (fp8_input.shape[0], self.weight.shape[1]),
+            dtype=self.dtype,
+            device=input.device,
+        )
+        torch.ops._C.cutlass_scaled_mm(
+            mm_out, fp8_input, self.weight, scale_a, self.scale_b, None
+        )
         reduce_scatter = tensor_model_parallel_reduce_scatter(mm_out, dim=0)
         return reduce_scatter
 
@@ -183,10 +199,9 @@ def ops_in_model_after(self):
 
 
 class TestAGCutlassScaledMMModel(_BaseScaledMMModel):
-
     def forward(self, input: torch.Tensor):
         """
-        Forward pass implementing the all gather + cutlass_scaled_mm 
+        Forward pass implementing the all gather + cutlass_scaled_mm
         in the FX graph
         """
         # Reshape input
@@ -195,11 +210,14 @@ def forward(self, input: torch.Tensor):
 
         scale_a = torch.ones(all_gather.shape[0], 1, dtype=torch.float32)
 
-        mm_out = torch.empty((all_gather.shape[0], self.weight.shape[1]),
-                             dtype=self.dtype,
-                             device=all_gather.device)
-        torch.ops._C.cutlass_scaled_mm(mm_out, all_gather, self.weight,
-                                       scale_a, self.scale_b, None)
+        mm_out = torch.empty(
+            (all_gather.shape[0], self.weight.shape[1]),
+            dtype=self.dtype,
+            device=all_gather.device,
+        )
+        torch.ops._C.cutlass_scaled_mm(
+            mm_out, all_gather, self.weight, scale_a, self.scale_b, None
+        )
         return mm_out
 
     def ops_in_model_before(self):
@@ -210,23 +228,37 @@ def ops_in_model_after(self):
 
 
 @multi_gpu_test(num_gpus=2)
-@pytest.mark.parametrize("test_model", [
-    TestMMRSModel, TestAGMMModel, TestScaledMMRSModel, TestAGScaledMMModel,
-    TestCutlassScaledMMRSModel, TestAGCutlassScaledMMModel
-])
+@pytest.mark.parametrize(
+    "test_model",
+    [
+        TestMMRSModel,
+        TestAGMMModel,
+        TestScaledMMRSModel,
+        TestAGScaledMMModel,
+        TestCutlassScaledMMRSModel,
+        TestAGCutlassScaledMMModel,
+    ],
+)
 @pytest.mark.parametrize("batch_size", [8])
 @pytest.mark.parametrize("seq_len", [16])
 @pytest.mark.parametrize("hidden_size", [16])
 @pytest.mark.parametrize("dtype", [torch.float16, torch.bfloat16])
-@pytest.mark.skipif(envs.VLLM_TARGET_DEVICE not in ["cuda"],
-                    reason="Only test on CUDA")
-def test_async_tp_pass_replace(test_model: str, batch_size: int, seq_len: int,
-                               hidden_size: int, dtype: torch.dtype):
-    if test_model in (TestScaledMMRSModel, TestAGScaledMMModel,
-                      TestCutlassScaledMMRSModel,
-                      TestAGCutlassScaledMMModel) and dtype == torch.float16:
+@pytest.mark.skipif(envs.VLLM_TARGET_DEVICE not in ["cuda"], reason="Only test on CUDA")
+def test_async_tp_pass_replace(
+    test_model: str, batch_size: int, seq_len: int, hidden_size: int, dtype: torch.dtype
+):
+    if (
+        test_model
+        in (
+            TestScaledMMRSModel,
+            TestAGScaledMMModel,
+            TestCutlassScaledMMRSModel,
+            TestAGCutlassScaledMMModel,
+        )
+        and dtype == torch.float16
+    ):
         pytest.skip(
-            "Only bf16 high precision output types are supported for " \
+            "Only bf16 high precision output types are supported for "
             "per-token (row-wise) scaling"
         )
 
@@ -235,19 +267,24 @@ def test_async_tp_pass_replace(test_model: str, batch_size: int, seq_len: int,
     def run_torch_spawn(fn, nprocs):
         # need to use torch.mp.spawn otherwise will have problems with
         # torch.distributed and cuda
-        torch.multiprocessing.spawn(fn,
-                                    args=(num_processes, test_model,
-                                          batch_size, seq_len, hidden_size,
-                                          dtype),
-                                    nprocs=nprocs)
+        torch.multiprocessing.spawn(
+            fn,
+            args=(num_processes, test_model, batch_size, seq_len, hidden_size, dtype),
+            nprocs=nprocs,
+        )
 
     run_torch_spawn(async_tp_pass_on_test_model, num_processes)
 
 
-def async_tp_pass_on_test_model(local_rank: int, world_size: int,
-                                test_model_cls: torch.nn.Module,
-                                batch_size: int, seq_len: int,
-                                hidden_size: int, dtype: torch.dtype):
+def async_tp_pass_on_test_model(
+    local_rank: int,
+    world_size: int,
+    test_model_cls: torch.nn.Module,
+    batch_size: int,
+    seq_len: int,
+    hidden_size: int,
+    dtype: torch.dtype,
+):
     current_platform.seed_everything(0)
 
     device = torch.device(f"cuda:{local_rank}")
@@ -255,13 +292,15 @@ def async_tp_pass_on_test_model(local_rank: int, world_size: int,
     torch.set_default_device(device)
     torch.set_default_dtype(dtype)
 
-    update_environment_variables({
-        'RANK': str(local_rank),
-        'LOCAL_RANK': str(local_rank),
-        'WORLD_SIZE': str(world_size),
-        'MASTER_ADDR': 'localhost',
-        'MASTER_PORT': '12345',
-    })
+    update_environment_variables(
+        {
+            "RANK": str(local_rank),
+            "LOCAL_RANK": str(local_rank),
+            "WORLD_SIZE": str(world_size),
+            "MASTER_ADDR": "localhost",
+            "MASTER_PORT": "12345",
+        }
+    )
 
     # initialize distributed
     init_distributed_environment()
@@ -269,27 +308,28 @@ def async_tp_pass_on_test_model(local_rank: int, world_size: int,
 
     # configure vllm config for SequenceParallelismPass
     vllm_config = VllmConfig()
-    vllm_config.compilation_config = CompilationConfig(pass_config=PassConfig(
-        enable_async_tp=True, ), )
+    vllm_config.compilation_config = CompilationConfig(
+        pass_config=PassConfig(
+            enable_async_tp=True,
+        ),
+    )
     vllm_config.device_config = DeviceConfig(device=torch.device("cuda"))
 
     # this is a fake model name to construct the model config
     # in the vllm_config, it's not really used.
     model_name = "nm-testing/TinyLlama-1.1B-Chat-v1.0-FP8-e2e"
-    vllm_config.model_config = ModelConfig(model=model_name,
-                                           trust_remote_code=True,
-                                           dtype=dtype,
-                                           seed=42)
+    vllm_config.model_config = ModelConfig(
+        model=model_name, trust_remote_code=True, dtype=dtype, seed=42
+    )
 
     async_tp_pass = AsyncTPPass(vllm_config)
     backend = TestBackend(async_tp_pass)
 
-    model = test_model_cls(hidden_size,
-                           dtype)  # Pass dtype to model constructor
+    model = test_model_cls(hidden_size, dtype)  # Pass dtype to model constructor
 
-    hidden_states = torch.randn((batch_size * seq_len, hidden_size),
-                                dtype=dtype,
-                                requires_grad=False)
+    hidden_states = torch.randn(
+        (batch_size * seq_len, hidden_size), dtype=dtype, requires_grad=False
+    )
 
     compiled_model = torch.compile(model, backend=backend)
     compiled_model(hidden_states)
@@ -306,10 +346,10 @@ def async_tp_pass_on_test_model(local_rank: int, world_size: int,
 
 
 @create_new_process_for_each_test()
-@pytest.mark.parametrize("model_id", [
-    "meta-llama/Llama-3.2-1B-Instruct",
-    "RedHatAI/Meta-Llama-3.1-8B-Instruct-FP8"
-])
+@pytest.mark.parametrize(
+    "model_id",
+    ["meta-llama/Llama-3.2-1B-Instruct", "RedHatAI/Meta-Llama-3.1-8B-Instruct-FP8"],
+)
 @pytest.mark.parametrize("tp_size", [2])
 @pytest.mark.parametrize("async_tp_enabled", [True])
 @pytest.mark.parametrize("distributed_backend", ["mp"])
@@ -342,12 +382,10 @@ def test_async_tp_pass_correctness(
         common_args.append("--enforce-eager")
 
     compilation_config = {
-        'level': 3,
-        'compile_sizes': [2, 4, 8],
-        'splitting_ops': [],
-        'pass_config': {
-            'enable_async_tp': async_tp_enabled
-        },
+        "level": 3,
+        "compile_sizes": [2, 4, 8],
+        "splitting_ops": [],
+        "pass_config": {"enable_async_tp": async_tp_enabled},
     }
 
     async_tp_env = tp_env = {
@@ -372,9 +410,6 @@ def test_async_tp_pass_correctness(
         "mp",
     ]
 
-    compare_two_settings(model_id,
-                         async_tp_args,
-                         tp_args,
-                         async_tp_env,
-                         tp_env,
-                         method="generate")
+    compare_two_settings(
+        model_id, async_tp_args, tp_args, async_tp_env, tp_env, method="generate"
+    )
diff --git a/tests/compile/test_basic_correctness.py b/tests/compile/test_basic_correctness.py
index a1e5127ebeeb..4bcefb30b2e6 100644
--- a/tests/compile/test_basic_correctness.py
+++ b/tests/compile/test_basic_correctness.py
@@ -103,23 +103,28 @@ def test_compile_correctness(
     attn_backend = test_setting.attn_backend
     method = test_setting.method
     if cuda_device_count_stateless() < pp_size * tp_size:
-        pytest.skip(f"Need at least {pp_size}*{tp_size} CUDA gpus but got "
-                    f"{cuda_device_count_stateless()}")
+        pytest.skip(
+            f"Need at least {pp_size}*{tp_size} CUDA gpus but got "
+            f"{cuda_device_count_stateless()}"
+        )
 
     with monkeypatch.context() as m:
         m.setenv("VLLM_ATTENTION_BACKEND", attn_backend)
         final_args = [
-            "--enforce-eager", *model_args, "-pp",
-            str(pp_size), "-tp",
-            str(tp_size)
+            "--enforce-eager",
+            *model_args,
+            "-pp",
+            str(pp_size),
+            "-tp",
+            str(tp_size),
         ]
 
         all_args: list[list[str]] = []
         all_envs: list[dict[str, str] | None] = []
 
         for level in [
-                CompilationLevel.NO_COMPILATION,
-                CompilationLevel.PIECEWISE,
+            CompilationLevel.NO_COMPILATION,
+            CompilationLevel.PIECEWISE,
         ]:
             all_args.append(final_args + [f"-O{level}"])
             all_envs.append({})
@@ -130,14 +135,15 @@ def test_compile_correctness(
             model,
             all_args,
             all_envs,
-            method=method if method != "generate" else "generate_close")
+            method=method if method != "generate" else "generate_close",
+        )
         all_envs.clear()
         all_args.clear()
 
         for level in [
-                CompilationLevel.NO_COMPILATION,
-                CompilationLevel.DYNAMO_AS_IS,
-                CompilationLevel.DYNAMO_ONCE,
+            CompilationLevel.NO_COMPILATION,
+            CompilationLevel.DYNAMO_AS_IS,
+            CompilationLevel.DYNAMO_ONCE,
         ]:
             all_args.append(final_args + [f"-O{level}"])
             all_envs.append({})
diff --git a/tests/compile/test_config.py b/tests/compile/test_config.py
index 17d3f0b37768..d055a41af4c4 100644
--- a/tests/compile/test_config.py
+++ b/tests/compile/test_config.py
@@ -9,11 +9,11 @@
 
 
 def test_version():
-    assert _is_torch_equal_or_newer('2.8.0.dev20250624+cu128', '2.8.0.dev')
-    assert _is_torch_equal_or_newer('2.8.0a0+gitc82a174', '2.8.0.dev')
-    assert _is_torch_equal_or_newer('2.8.0', '2.8.0.dev')
-    assert _is_torch_equal_or_newer('2.8.1', '2.8.0.dev')
-    assert not _is_torch_equal_or_newer('2.7.1', '2.8.0.dev')
+    assert _is_torch_equal_or_newer("2.8.0.dev20250624+cu128", "2.8.0.dev")
+    assert _is_torch_equal_or_newer("2.8.0a0+gitc82a174", "2.8.0.dev")
+    assert _is_torch_equal_or_newer("2.8.0", "2.8.0.dev")
+    assert _is_torch_equal_or_newer("2.8.1", "2.8.0.dev")
+    assert not _is_torch_equal_or_newer("2.7.1", "2.8.0.dev")
 
 
 def test_use_cudagraphs_dynamic(monkeypatch):
@@ -21,7 +21,7 @@ def test_use_cudagraphs_dynamic(monkeypatch):
     vllm_config = VllmConfig()
     assert vllm_config.compilation_config.use_cudagraph
 
-    monkeypatch.setenv('VLLM_USE_V1', '0')
+    monkeypatch.setenv("VLLM_USE_V1", "0")
     vllm_config = VllmConfig()
     assert not vllm_config.compilation_config.use_cudagraph
 
@@ -44,19 +44,23 @@ def test_VLLM_DISABLE_COMPILE_CACHE(vllm_runner, monkeypatch, val):
     assert vllm.envs.VLLM_USE_V1
 
     # Disable multiprocessing so that the counter is in the same process
-    monkeypatch.setenv('VLLM_ENABLE_V1_MULTIPROCESSING', '0')
-    monkeypatch.setenv('VLLM_DISABLE_COMPILE_CACHE', val)
+    monkeypatch.setenv("VLLM_ENABLE_V1_MULTIPROCESSING", "0")
+    monkeypatch.setenv("VLLM_DISABLE_COMPILE_CACHE", val)
 
     compilation_config = {
         "use_cudagraph": False,  # speed things up a bit
     }
     with (
-            compilation_counter.expect(num_cache_entries_updated=0,
-                                       num_compiled_artifacts_saved=0),
-            # loading the model causes compilation (if enabled) to happen
-            vllm_runner('facebook/opt-125m',
-                        compilation_config=compilation_config,
-                        gpu_memory_utilization=0.4) as _):
+        compilation_counter.expect(
+            num_cache_entries_updated=0, num_compiled_artifacts_saved=0
+        ),
+        # loading the model causes compilation (if enabled) to happen
+        vllm_runner(
+            "facebook/opt-125m",
+            compilation_config=compilation_config,
+            gpu_memory_utilization=0.4,
+        ) as _,
+    ):
         pass
 
 
@@ -67,22 +71,25 @@ def test_use_cudagraphs(vllm_runner, monkeypatch, enabled):
     assert vllm.envs.VLLM_USE_V1
 
     # Disable multiprocessing so that the counter is in the same process
-    monkeypatch.setenv('VLLM_ENABLE_V1_MULTIPROCESSING', '0')
+    monkeypatch.setenv("VLLM_ENABLE_V1_MULTIPROCESSING", "0")
 
     compilation_config = {
         "cudagraph_capture_sizes": [100],
         "use_cudagraph": enabled,
     }
     with (
-            compilation_counter.expect(
-                num_graphs_seen=1,
-                num_gpu_runner_capture_triggers=1 if enabled else 0,
-                num_cudagraph_captured=13 if enabled else 0,
-            ),
-            # loading the model causes compilation (if enabled) to happen
-            vllm_runner('facebook/opt-125m',
-                        compilation_config=compilation_config,
-                        gpu_memory_utilization=0.4) as _):
+        compilation_counter.expect(
+            num_graphs_seen=1,
+            num_gpu_runner_capture_triggers=1 if enabled else 0,
+            num_cudagraph_captured=13 if enabled else 0,
+        ),
+        # loading the model causes compilation (if enabled) to happen
+        vllm_runner(
+            "facebook/opt-125m",
+            compilation_config=compilation_config,
+            gpu_memory_utilization=0.4,
+        ) as _,
+    ):
         pass
 
 
@@ -90,14 +97,17 @@ def test_use_cudagraphs(vllm_runner, monkeypatch, enabled):
 @pytest.mark.forked
 def test_dynamo_as_is(vllm_runner, monkeypatch):
     # Disable multiprocessing so that the counter is in the same process
-    monkeypatch.setenv('VLLM_ENABLE_V1_MULTIPROCESSING', '0')
+    monkeypatch.setenv("VLLM_ENABLE_V1_MULTIPROCESSING", "0")
 
     with (
-            compilation_counter.expect(dynamo_as_is_count=1),
-            # loading the model causes compilation (if enabled) to happen
-            vllm_runner('facebook/opt-125m',
-                        compilation_config={"level": 1},
-                        gpu_memory_utilization=0.4) as _):
+        compilation_counter.expect(dynamo_as_is_count=1),
+        # loading the model causes compilation (if enabled) to happen
+        vllm_runner(
+            "facebook/opt-125m",
+            compilation_config={"level": 1},
+            gpu_memory_utilization=0.4,
+        ) as _,
+    ):
         pass
 
 
@@ -105,14 +115,16 @@ def test_dynamo_as_is(vllm_runner, monkeypatch):
 @pytest.mark.forked
 def test_no_compilation(vllm_runner, monkeypatch):
     # Disable multiprocessing so that the counter is in the same process
-    monkeypatch.setenv('VLLM_ENABLE_V1_MULTIPROCESSING', '0')
+    monkeypatch.setenv("VLLM_ENABLE_V1_MULTIPROCESSING", "0")
     with (
-            compilation_counter.expect(num_graphs_seen=0,
-                                       dynamo_as_is_count=0),
-            # loading the model causes compilation (if enabled) to happen
-            vllm_runner('facebook/opt-125m',
-                        compilation_config={"level": 0},
-                        gpu_memory_utilization=0.4) as _):
+        compilation_counter.expect(num_graphs_seen=0, dynamo_as_is_count=0),
+        # loading the model causes compilation (if enabled) to happen
+        vllm_runner(
+            "facebook/opt-125m",
+            compilation_config={"level": 0},
+            gpu_memory_utilization=0.4,
+        ) as _,
+    ):
         pass
 
 
@@ -120,77 +132,73 @@ def test_no_compilation(vllm_runner, monkeypatch):
 @pytest.mark.forked
 def test_enforce_eager(vllm_runner, monkeypatch):
     # Disable multiprocessing so that the counter is in the same process
-    monkeypatch.setenv('VLLM_ENABLE_V1_MULTIPROCESSING', '0')
+    monkeypatch.setenv("VLLM_ENABLE_V1_MULTIPROCESSING", "0")
 
     with (
-            compilation_counter.expect(num_graphs_seen=0,
-                                       dynamo_as_is_count=0),
-            # loading the model causes compilation (if enabled) to happen
-            vllm_runner('facebook/opt-125m',
-                        enforce_eager=True,
-                        gpu_memory_utilization=0.4) as _):
+        compilation_counter.expect(num_graphs_seen=0, dynamo_as_is_count=0),
+        # loading the model causes compilation (if enabled) to happen
+        vllm_runner(
+            "facebook/opt-125m", enforce_eager=True, gpu_memory_utilization=0.4
+        ) as _,
+    ):
         pass
 
 
 def test_splitting_ops_dynamic():
     # Default config
     config = VllmConfig()
-    assert config.compilation_config.cudagraph_mode == \
-        CUDAGraphMode.FULL_AND_PIECEWISE
+    assert config.compilation_config.cudagraph_mode == CUDAGraphMode.FULL_AND_PIECEWISE
     assert config.compilation_config.splitting_ops_contain_attention()
 
     # When use_inductor_graph_partition=True
-    if _is_torch_equal_or_newer('2.9.0.dev'):
+    if _is_torch_equal_or_newer("2.9.0.dev"):
         # inductor graph partition is only available in PyTorch 2.9+.
         # this is a fast config check so we are not using pytest.skip.
-        config = VllmConfig(compilation_config=CompilationConfig(
-            use_inductor_graph_partition=True,
-            splitting_ops=["silly_attention"]))
+        config = VllmConfig(
+            compilation_config=CompilationConfig(
+                use_inductor_graph_partition=True, splitting_ops=["silly_attention"]
+            )
+        )
         # should ignore splitting_ops
         assert config.compilation_config.splitting_ops == []
 
     # When attn_fusion pass enabled.
-    config = VllmConfig(compilation_config=CompilationConfig(
-        pass_config={
-            "enable_attn_fusion": True,
-            "enable_noop": True
-        },
-        custom_ops=["+quant_fp8"],
-        cudagraph_mode=CUDAGraphMode.PIECEWISE,
-    ))
+    config = VllmConfig(
+        compilation_config=CompilationConfig(
+            pass_config={"enable_attn_fusion": True, "enable_noop": True},
+            custom_ops=["+quant_fp8"],
+            cudagraph_mode=CUDAGraphMode.PIECEWISE,
+        )
+    )
     assert config.compilation_config.splitting_ops == []
     # cudagraph mode also fall back to FULL
-    assert config.compilation_config.cudagraph_mode == \
-        CUDAGraphMode.FULL
+    assert config.compilation_config.cudagraph_mode == CUDAGraphMode.FULL
 
     # splitting_ops can not contain attention ops when attn_fusion
     # pass enabled.
     with pytest.raises(AssertionError):
-        config = VllmConfig(compilation_config=CompilationConfig(
-            pass_config={
-                "enable_attn_fusion": True,
-                "enable_noop": True
-            },
-            custom_ops=["+quant_fp8"],
-            cudagraph_mode=CUDAGraphMode.PIECEWISE,
-            # work around for accessing all attntion ops
-            splitting_ops=CompilationConfig()._attention_ops,
-        ))
+        config = VllmConfig(
+            compilation_config=CompilationConfig(
+                pass_config={"enable_attn_fusion": True, "enable_noop": True},
+                custom_ops=["+quant_fp8"],
+                cudagraph_mode=CUDAGraphMode.PIECEWISE,
+                # work around for accessing all attntion ops
+                splitting_ops=CompilationConfig()._attention_ops,
+            )
+        )
 
     # When both use_inductor_graph_partition and attn_fusion pass enabled.
-    if _is_torch_equal_or_newer('2.9.0.dev'):
-        config = VllmConfig(compilation_config=CompilationConfig(
-            use_inductor_graph_partition=True,
-            pass_config={
-                "enable_attn_fusion": True,
-                "enable_noop": True
-            },
-            custom_ops=["+quant_fp8"],
-            cudagraph_mode=CUDAGraphMode.PIECEWISE,
-        ))
+    if _is_torch_equal_or_newer("2.9.0.dev"):
+        config = VllmConfig(
+            compilation_config=CompilationConfig(
+                use_inductor_graph_partition=True,
+                pass_config={"enable_attn_fusion": True, "enable_noop": True},
+                custom_ops=["+quant_fp8"],
+                cudagraph_mode=CUDAGraphMode.PIECEWISE,
+            )
+        )
         assert config.compilation_config.splitting_ops == []
         # enable_attn_fusion is directly support under
         # use_inductor_graph_partition=True, and cudagraph_mode
         # is unchanged.
-        assert config.compilation_config.cudagraph_mode == \
-            CUDAGraphMode.PIECEWISE
+        assert config.compilation_config.cudagraph_mode == CUDAGraphMode.PIECEWISE
diff --git a/tests/compile/test_decorator.py b/tests/compile/test_decorator.py
index d73586d53ff3..d7048821bb60 100644
--- a/tests/compile/test_decorator.py
+++ b/tests/compile/test_decorator.py
@@ -4,10 +4,15 @@
 from torch import nn
 
 from vllm.compilation.counter import compilation_counter
-from vllm.compilation.decorators import (ignore_torch_compile,
-                                         support_torch_compile)
-from vllm.config import (CacheConfig, CompilationConfig, CompilationLevel,
-                         CUDAGraphMode, VllmConfig, set_current_vllm_config)
+from vllm.compilation.decorators import ignore_torch_compile, support_torch_compile
+from vllm.config import (
+    CacheConfig,
+    CompilationConfig,
+    CompilationLevel,
+    CUDAGraphMode,
+    VllmConfig,
+    set_current_vllm_config,
+)
 from vllm.forward_context import BatchDescriptor, set_forward_context
 
 # This import automatically registers `torch.ops.silly.attention`
@@ -18,32 +23,42 @@
 
 
 @torch.inference_mode
-def run_model(vllm_config: VllmConfig, model: nn.Module,
-              cudagraph_runtime_mode: CUDAGraphMode):
+def run_model(
+    vllm_config: VllmConfig, model: nn.Module, cudagraph_runtime_mode: CUDAGraphMode
+):
     with set_forward_context({}, vllm_config=vllm_config):
         # warmup for the model with cudagraph_mode NONE
         model(torch.randn(BATCH_SIZE, MLP_SIZE).cuda())
 
         # simulate cudagraphs capturing
-        with set_forward_context({},
-                                 vllm_config=vllm_config,
-                                 cudagraph_runtime_mode=cudagraph_runtime_mode,
-                                 batch_descriptor=BatchDescriptor(
-                                     num_tokens=2, )):
+        with set_forward_context(
+            {},
+            vllm_config=vllm_config,
+            cudagraph_runtime_mode=cudagraph_runtime_mode,
+            batch_descriptor=BatchDescriptor(
+                num_tokens=2,
+            ),
+        ):
             model(torch.randn(2, MLP_SIZE).cuda())
-        with set_forward_context({},
-                                 vllm_config=vllm_config,
-                                 cudagraph_runtime_mode=cudagraph_runtime_mode,
-                                 batch_descriptor=BatchDescriptor(
-                                     num_tokens=1, )):
+        with set_forward_context(
+            {},
+            vllm_config=vllm_config,
+            cudagraph_runtime_mode=cudagraph_runtime_mode,
+            batch_descriptor=BatchDescriptor(
+                num_tokens=1,
+            ),
+        ):
             model(torch.randn(1, MLP_SIZE).cuda())
 
         # simulate cudagraphs replay
-        with set_forward_context({},
-                                 vllm_config=vllm_config,
-                                 cudagraph_runtime_mode=cudagraph_runtime_mode,
-                                 batch_descriptor=BatchDescriptor(
-                                     num_tokens=2, )):
+        with set_forward_context(
+            {},
+            vllm_config=vllm_config,
+            cudagraph_runtime_mode=cudagraph_runtime_mode,
+            batch_descriptor=BatchDescriptor(
+                num_tokens=2,
+            ),
+        ):
             output = model(torch.randn(2, MLP_SIZE).cuda())
 
         output = output.cpu()
@@ -52,22 +67,21 @@ def run_model(vllm_config: VllmConfig, model: nn.Module,
 
 def test_ignore_torch_compile_decorator():
     # piecewise
-    vllm_config = VllmConfig(compilation_config=CompilationConfig(
-        level=CompilationLevel.PIECEWISE,
-        use_cudagraph=True,
-        splitting_ops=["silly.attention"],
-        cudagraph_capture_sizes=[1, 2],
-    ))
+    vllm_config = VllmConfig(
+        compilation_config=CompilationConfig(
+            level=CompilationLevel.PIECEWISE,
+            use_cudagraph=True,
+            splitting_ops=["silly.attention"],
+            cudagraph_capture_sizes=[1, 2],
+        )
+    )
     cudagraph_runtime_mode = CUDAGraphMode.PIECEWISE
 
     @support_torch_compile
     class A(nn.Module):
-
-        def __init__(self,
-                     *,
-                     vllm_config: VllmConfig,
-                     prefix: str = '',
-                     **kwargs) -> None:
+        def __init__(
+            self, *, vllm_config: VllmConfig, prefix: str = "", **kwargs
+        ) -> None:
             super().__init__()
 
         def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -79,66 +93,60 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
             return x
 
     @ignore_torch_compile
-    class B(A):
-        ...
+    class B(A): ...
 
     @support_torch_compile
-    class C(B):
-        ...
+    class C(B): ...
 
     with set_current_vllm_config(vllm_config):
-        mod_A = A(vllm_config=vllm_config, prefix='').eval().cuda()
+        mod_A = A(vllm_config=vllm_config, prefix="").eval().cuda()
 
     # A has support_torch_compile
     with compilation_counter.expect(
-            num_graphs_seen=1,
-            num_piecewise_graphs_seen=3,
-            num_piecewise_capturable_graphs_seen=2,
-            num_backend_compilations=2,
-            num_cudagraph_captured=4,
-            # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
+        num_graphs_seen=1,
+        num_piecewise_graphs_seen=3,
+        num_piecewise_capturable_graphs_seen=2,
+        num_backend_compilations=2,
+        num_cudagraph_captured=4,
+        # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
     ):
         run_model(vllm_config, mod_A, cudagraph_runtime_mode)
 
     with set_current_vllm_config(vllm_config):
-        mod_B = B(vllm_config=vllm_config, prefix='').eval().cuda()
+        mod_B = B(vllm_config=vllm_config, prefix="").eval().cuda()
 
     # B's ignore_torch_compile should override A's support_torch_compile
     with compilation_counter.expect(
-            num_graphs_seen=0,
-            num_piecewise_graphs_seen=0,
-            num_piecewise_capturable_graphs_seen=0,
-            num_backend_compilations=0,
-            num_cudagraph_captured=0,
+        num_graphs_seen=0,
+        num_piecewise_graphs_seen=0,
+        num_piecewise_capturable_graphs_seen=0,
+        num_backend_compilations=0,
+        num_cudagraph_captured=0,
     ):
         run_model(vllm_config, mod_B, cudagraph_runtime_mode)
 
     with set_current_vllm_config(vllm_config):
-        mod_C = C(vllm_config=vllm_config, prefix='').eval().cuda()
+        mod_C = C(vllm_config=vllm_config, prefix="").eval().cuda()
 
     # C's support_torch_compile should override B's ignore_torch_compile
     with compilation_counter.expect(
-            num_graphs_seen=1,
-            num_piecewise_graphs_seen=3,
-            num_piecewise_capturable_graphs_seen=2,
-            num_backend_compilations=2,
-            num_cudagraph_captured=4,
-            # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
+        num_graphs_seen=1,
+        num_piecewise_graphs_seen=3,
+        num_piecewise_capturable_graphs_seen=2,
+        num_backend_compilations=2,
+        num_cudagraph_captured=4,
+        # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
     ):
         run_model(vllm_config, mod_C, cudagraph_runtime_mode)
 
 
 # Only enable torch.compile if
 # vllm_config.cache_config.kv_sharing_fast_prefill=True
-@support_torch_compile(enable_if=lambda vllm_config: vllm_config.cache_config.
-                       kv_sharing_fast_prefill)
+@support_torch_compile(
+    enable_if=lambda vllm_config: vllm_config.cache_config.kv_sharing_fast_prefill
+)
 class B(nn.Module):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = '',
-                 **kwargs) -> None:
+    def __init__(self, *, vllm_config: VllmConfig, prefix: str = "", **kwargs) -> None:
         super().__init__()
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -152,15 +160,11 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 # Only enable torch.compile if
 # vllm_config.cache_config.kv_sharing_fast_prefill=False
-@support_torch_compile(enable_if=lambda vllm_config: not vllm_config.
-                       cache_config.kv_sharing_fast_prefill)
+@support_torch_compile(
+    enable_if=lambda vllm_config: not vllm_config.cache_config.kv_sharing_fast_prefill
+)
 class A(nn.Module):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = '',
-                 **kwargs) -> None:
+    def __init__(self, *, vllm_config: VllmConfig, prefix: str = "", **kwargs) -> None:
         super().__init__()
         self.mod1 = B(vllm_config=vllm_config, prefix=prefix, **kwargs)
         self.mod2 = B(vllm_config=vllm_config, prefix=prefix, **kwargs)
@@ -175,54 +179,60 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 def test_conditional_compile_enable_if():
-    vllm_config = VllmConfig(cache_config=CacheConfig(
-        kv_sharing_fast_prefill=True, ),
-                             compilation_config=CompilationConfig(
-                                 level=CompilationLevel.PIECEWISE,
-                                 use_cudagraph=True,
-                                 splitting_ops=["silly.attention"],
-                                 cudagraph_capture_sizes=[1, 2],
-                             ))
+    vllm_config = VllmConfig(
+        cache_config=CacheConfig(
+            kv_sharing_fast_prefill=True,
+        ),
+        compilation_config=CompilationConfig(
+            level=CompilationLevel.PIECEWISE,
+            use_cudagraph=True,
+            splitting_ops=["silly.attention"],
+            cudagraph_capture_sizes=[1, 2],
+        ),
+    )
     cudagraph_runtime_mode = CUDAGraphMode.PIECEWISE
 
     with set_current_vllm_config(vllm_config):
-        mod_A = A(vllm_config=vllm_config, prefix='').eval().cuda()
+        mod_A = A(vllm_config=vllm_config, prefix="").eval().cuda()
 
     # A has support_torch_compile but enable_if fn returns False
     # enalbe_if will be True for B, so we expect mod1 and mod2
     # to be compiled
     with compilation_counter.expect(
-            num_graphs_seen=2,
-            num_piecewise_graphs_seen=6,
-            # 3 piecewise graphs per instance of B()
-            num_piecewise_capturable_graphs_seen=4,
-            num_backend_compilations=4,
-            num_cudagraph_captured=8,
-            # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
+        num_graphs_seen=2,
+        num_piecewise_graphs_seen=6,
+        # 3 piecewise graphs per instance of B()
+        num_piecewise_capturable_graphs_seen=4,
+        num_backend_compilations=4,
+        num_cudagraph_captured=8,
+        # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
     ):
         run_model(vllm_config, mod_A, cudagraph_runtime_mode)
 
     # Set kv_sharing_fast_prefill=False
     # which will cause A to be compiled and B to not be compiled
-    vllm_config = VllmConfig(cache_config=CacheConfig(
-        kv_sharing_fast_prefill=False, ),
-                             compilation_config=CompilationConfig(
-                                 level=CompilationLevel.PIECEWISE,
-                                 use_cudagraph=True,
-                                 splitting_ops=["silly.attention"],
-                                 cudagraph_capture_sizes=[1, 2],
-                             ))
+    vllm_config = VllmConfig(
+        cache_config=CacheConfig(
+            kv_sharing_fast_prefill=False,
+        ),
+        compilation_config=CompilationConfig(
+            level=CompilationLevel.PIECEWISE,
+            use_cudagraph=True,
+            splitting_ops=["silly.attention"],
+            cudagraph_capture_sizes=[1, 2],
+        ),
+    )
 
     with set_current_vllm_config(vllm_config):
-        mod_A = A(vllm_config=vllm_config, prefix='').eval().cuda()
+        mod_A = A(vllm_config=vllm_config, prefix="").eval().cuda()
 
     with compilation_counter.expect(
-            num_graphs_seen=1,
-            num_piecewise_graphs_seen=7,
-            # 3 attn ops and 4 non-attn ops
-            num_piecewise_capturable_graphs_seen=4,
-            num_backend_compilations=4,
-            num_cudagraph_captured=8,
-            # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
+        num_graphs_seen=1,
+        num_piecewise_graphs_seen=7,
+        # 3 attn ops and 4 non-attn ops
+        num_piecewise_capturable_graphs_seen=4,
+        num_backend_compilations=4,
+        num_cudagraph_captured=8,
+        # num_cudagraph_sizes * num_piecewise_capturable_graphs_seen
     ):
         run_model(vllm_config, mod_A, cudagraph_runtime_mode)
diff --git a/tests/compile/test_full_graph.py b/tests/compile/test_full_graph.py
index 3ecda1a8ec33..319b31d3a90d 100644
--- a/tests/compile/test_full_graph.py
+++ b/tests/compile/test_full_graph.py
@@ -14,8 +14,7 @@
 from vllm import LLM, SamplingParams
 from vllm.attention.backends.registry import _Backend
 from vllm.attention.selector import global_force_attn_backend_context_manager
-from vllm.config import (CompilationConfig, CompilationLevel, CUDAGraphMode,
-                         PassConfig)
+from vllm.config import CompilationConfig, CompilationLevel, CUDAGraphMode, PassConfig
 from vllm.platforms import current_platform
 from vllm.utils import is_torch_equal_or_newer
 
@@ -25,43 +24,54 @@
 def models_list(*, all: bool = True, keywords: Optional[list[str]] = None):
     TEST_MODELS: list[tuple[str, dict[str, Any]]] = [
         ("facebook/opt-125m", {}),
-        ("nm-testing/tinyllama-oneshot-w8w8-test-static-shape-change", {
-            "dtype": torch.float16,
-        }),
-        ("neuralmagic/Llama-3.2-1B-Instruct-FP8-dynamic", {
-            "dtype": torch.float16,
-        }),
+        (
+            "nm-testing/tinyllama-oneshot-w8w8-test-static-shape-change",
+            {
+                "dtype": torch.float16,
+            },
+        ),
+        (
+            "neuralmagic/Llama-3.2-1B-Instruct-FP8-dynamic",
+            {
+                "dtype": torch.float16,
+            },
+        ),
         ("neuralmagic/Llama-3.2-1B-Instruct-quantized.w8a8", {}),
         ("meta-llama/Llama-3.2-1B-Instruct", {}),
     ]
 
     if all:
-
         # TODO: figure out why this fails.
         if False and is_quant_method_supported("gguf"):  # noqa: SIM223
-            TEST_MODELS.append(("TheBloke/TinyLlama-1.1B-Chat-v1.0-GGUF", {
-                "quantization": "gguf"
-            }))
+            TEST_MODELS.append(
+                ("TheBloke/TinyLlama-1.1B-Chat-v1.0-GGUF", {"quantization": "gguf"})
+            )
 
         if is_quant_method_supported("gptq"):
-            TEST_MODELS.append(("TheBloke/TinyLlama-1.1B-Chat-v0.3-GPTQ", {
-                "quantization": "gptq"
-            }))
+            TEST_MODELS.append(
+                ("TheBloke/TinyLlama-1.1B-Chat-v0.3-GPTQ", {"quantization": "gptq"})
+            )
 
         if is_quant_method_supported("gptq_marlin"):
-            TEST_MODELS.append(("TheBloke/TinyLlama-1.1B-Chat-v1.0-GPTQ", {
-                "quantization": "gptq_marlin"
-            }))
+            TEST_MODELS.append(
+                (
+                    "TheBloke/TinyLlama-1.1B-Chat-v1.0-GPTQ",
+                    {"quantization": "gptq_marlin"},
+                )
+            )
 
         if is_quant_method_supported("gptq_marlin_24"):
-            TEST_MODELS.append(("alexm-nm/tinyllama-24-marlin24-4bit-g128", {
-                "quantization": "gptq_marlin_24"
-            }))
+            TEST_MODELS.append(
+                (
+                    "alexm-nm/tinyllama-24-marlin24-4bit-g128",
+                    {"quantization": "gptq_marlin_24"},
+                )
+            )
 
         if not current_platform.is_rocm() and is_quant_method_supported("awq"):
-            TEST_MODELS.append(("TheBloke/TinyLlama-1.1B-Chat-v0.3-AWQ", {
-                "quantization": "AWQ"
-            }))
+            TEST_MODELS.append(
+                ("TheBloke/TinyLlama-1.1B-Chat-v0.3-AWQ", {"quantization": "AWQ"})
+            )
 
     if keywords is None:
         return TEST_MODELS
@@ -95,22 +105,34 @@ def test_full_graph(
     "compilation_config, model_info",
     [
         # additional compile sizes, only some of the models
-        (CompilationConfig(level=CompilationLevel.PIECEWISE,
-                           compile_sizes=[1, 2]), model)
+        (
+            CompilationConfig(level=CompilationLevel.PIECEWISE, compile_sizes=[1, 2]),
+            model,
+        )
         for model in models_list(all=False)
-    ] + [
+    ]
+    + [
         # RMSNorm + quant fusion, only 8-bit quant models
-        (CompilationConfig(level=CompilationLevel.PIECEWISE,
-                           custom_ops=["+rms_norm"],
-                           pass_config=PassConfig(enable_fusion=True,
-                                                  enable_noop=True)), model)
+        (
+            CompilationConfig(
+                level=CompilationLevel.PIECEWISE,
+                custom_ops=["+rms_norm"],
+                pass_config=PassConfig(enable_fusion=True, enable_noop=True),
+            ),
+            model,
+        )
         for model in models_list(keywords=["FP8-dynamic", "quantized.w8a8"])
-    ] + [
+    ]
+    + [
         # Test depyf integration works
-        (CompilationConfig(level=CompilationLevel.PIECEWISE,
-                           debug_dump_path=tempfile.gettempdir()),
-         ("facebook/opt-125m", {})),
-    ] + [
+        (
+            CompilationConfig(
+                level=CompilationLevel.PIECEWISE, debug_dump_path=tempfile.gettempdir()
+            ),
+            ("facebook/opt-125m", {}),
+        ),
+    ]
+    + [
         # graph inductor partition
         (
             CompilationConfig(
@@ -119,20 +141,24 @@ def test_full_graph(
                 # torch._C.Tag.cudagraph_unsafe to specify splitting ops
                 use_inductor_graph_partition=True,
                 cudagraph_mode=CUDAGraphMode.PIECEWISE,
-                compile_sizes=[1, 2]),
-            model) for model in models_list(all=False)
+                compile_sizes=[1, 2],
+            ),
+            model,
+        )
+        for model in models_list(all=False)
         if is_torch_equal_or_newer("2.9.0.dev")
-    ])
+    ],
+)
 # only test some of the models
 @create_new_process_for_each_test()
 def test_custom_compile_config(
     compilation_config: CompilationConfig,
     model_info: tuple[str, dict[str, Any]],
 ):
-    if (compilation_config.use_inductor_graph_partition
-            and not is_torch_equal_or_newer("2.9.0.dev")):
-        pytest.skip("inductor graph partition is only available "
-                    "in PyTorch 2.9+")
+    if compilation_config.use_inductor_graph_partition and not is_torch_equal_or_newer(
+        "2.9.0.dev"
+    ):
+        pytest.skip("inductor graph partition is only available in PyTorch 2.9+")
 
     model, model_kwargs = model_info
     print(f"MODEL={model}")
@@ -156,8 +182,7 @@ def test_fp8_kv_scale_compile(optimization_level: int):
 
 def test_inductor_graph_partition_attn_fusion(caplog_vllm):
     if not is_torch_equal_or_newer("2.9.0.dev"):
-        pytest.skip("inductor graph partition is only available "
-                    "in PyTorch 2.9+")
+        pytest.skip("inductor graph partition is only available in PyTorch 2.9+")
 
     model = "nvidia/Llama-4-Scout-17B-16E-Instruct-FP8"
     compilation_config = CompilationConfig(
@@ -171,14 +196,16 @@ def test_inductor_graph_partition_attn_fusion(caplog_vllm):
         "kv_cache_dtype": "fp8",
         "max_model_len": 1024,
     }
-    with caplog_vllm.at_level(
-            logging.DEBUG), global_force_attn_backend_context_manager(
-                _Backend.FLASHINFER):
+    with (
+        caplog_vllm.at_level(logging.DEBUG),
+        global_force_attn_backend_context_manager(_Backend.FLASHINFER),
+    ):
         run_model(compilation_config, model, model_kwargs)
 
     try:
-        assert ("Fused quantization onto 48 attention nodes"
-                in caplog_vllm.text), caplog_vllm.text
+        assert "Fused quantization onto 48 attention nodes" in caplog_vllm.text, (
+            caplog_vllm.text
+        )
     except AssertionError:
         # Note: this message is only triggered when the compilation goes
         # through the custom pass. Due to multiple layers of cache on
@@ -189,8 +216,11 @@ def test_inductor_graph_partition_attn_fusion(caplog_vllm):
         assert "Fused quantization" not in caplog_vllm.text
 
 
-def run_model(compile_config: Union[int, CompilationConfig], model: str,
-              model_kwargs: dict[str, Any]):
+def run_model(
+    compile_config: Union[int, CompilationConfig],
+    model: str,
+    model_kwargs: dict[str, Any],
+):
     prompts = [
         "Hello, my name is",
         "The president of the United States is",
diff --git a/tests/compile/test_functionalization.py b/tests/compile/test_functionalization.py
index 0c8d610bc9c5..95e92a87807f 100644
--- a/tests/compile/test_functionalization.py
+++ b/tests/compile/test_functionalization.py
@@ -14,10 +14,8 @@
 from vllm.config import CompilationConfig, PassConfig, VllmConfig
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape)
-from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    Fp8LinearOp)
+from vllm.model_executor.layers.quantization.utils.quant_utils import GroupShape
+from vllm.model_executor.layers.quantization.utils.w8a8_utils import Fp8LinearOp
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.platforms import current_platform
 
@@ -28,7 +26,6 @@
 
 
 class TestSiluMul(torch.nn.Module):
-
     def __init__(self, hidden_size: int = 128):
         super().__init__()
         self.silu_and_mul = SiluAndMul()
@@ -36,8 +33,7 @@ def __init__(self, hidden_size: int = 128):
         self.scale = torch.rand(1, dtype=torch.float32)
 
         if TEST_FP8:
-            self.w = torch.rand(hidden_size,
-                                hidden_size).to(dtype=FP8_DTYPE).t()
+            self.w = torch.rand(hidden_size, hidden_size).to(dtype=FP8_DTYPE).t()
             self.fp8_linear = Fp8LinearOp(
                 act_quant_static=True,
                 act_quant_group_shape=GroupShape.PER_TENSOR,
@@ -46,17 +42,14 @@ def __init__(self, hidden_size: int = 128):
     def forward(self, x):
         y = self.silu_and_mul(x)
         if TEST_FP8:
-            x2 = self.fp8_linear.apply(y,
-                                       self.w,
-                                       self.wscale,
-                                       input_scale=self.wscale)
+            x2 = self.fp8_linear.apply(y, self.w, self.wscale, input_scale=self.wscale)
             return x2
         else:
             return y
 
     def example_inputs(self, num_tokens=32, hidden_size=128):
         dtype = torch.float16 if TEST_FP8 else torch.float32
-        return (torch.rand(num_tokens, hidden_size * 2, dtype=dtype), )
+        return (torch.rand(num_tokens, hidden_size * 2, dtype=dtype),)
 
     def ops_in_model(self, do_fusion):
         if TEST_FP8 and do_fusion:
@@ -69,7 +62,6 @@ def ops_not_in_model(self):
 
 
 class TestFusedAddRMSNorm(torch.nn.Module):
-
     def __init__(self, hidden_size=16, intermediate_size=32):
         super().__init__()
         self.hidden_size = hidden_size
@@ -78,10 +70,12 @@ def __init__(self, hidden_size=16, intermediate_size=32):
         dtype = torch.float16 if TEST_FP8 else torch.float32
 
         self.gate_proj = torch.nn.Parameter(
-            torch.empty((intermediate_size, hidden_size), dtype=dtype))
+            torch.empty((intermediate_size, hidden_size), dtype=dtype)
+        )
         self.norm = RMSNorm(intermediate_size, 1e-05)
         self.norm.weight = torch.nn.Parameter(
-            torch.ones(intermediate_size, dtype=dtype))
+            torch.ones(intermediate_size, dtype=dtype)
+        )
 
         torch.nn.init.normal_(self.gate_proj, std=0.02)
 
@@ -89,8 +83,7 @@ def __init__(self, hidden_size=16, intermediate_size=32):
             self.fp8_linear = Fp8LinearOp(act_quant_static=True)
 
             self.scale = torch.rand(1, dtype=torch.float32)
-            self.w = torch.rand(hidden_size,
-                                intermediate_size).to(dtype=FP8_DTYPE).t()
+            self.w = torch.rand(hidden_size, intermediate_size).to(dtype=FP8_DTYPE).t()
             self.wscale = torch.rand(1, dtype=torch.float32)
 
     def forward(self, hidden_states, residual):
@@ -120,10 +113,8 @@ def forward(self, hidden_states, residual):
 
     def example_inputs(self, batch_size=8, hidden_size=16, seq_len=16):
         dtype = torch.float16 if TEST_FP8 else torch.float32
-        hidden_states = torch.randn((batch_size * seq_len, hidden_size),
-                                    dtype=dtype)
-        residual = torch.randn((batch_size * seq_len, hidden_size),
-                               dtype=dtype)
+        hidden_states = torch.randn((batch_size * seq_len, hidden_size), dtype=dtype)
+        residual = torch.randn((batch_size * seq_len, hidden_size), dtype=dtype)
         return (hidden_states, residual)
 
     def ops_in_model(self, do_fusion):
@@ -137,12 +128,7 @@ def ops_not_in_model(self):
 
 
 class TestRotaryEmbedding(torch.nn.Module):
-
-    def __init__(self,
-                 head_dim=64,
-                 rotary_dim=None,
-                 max_position=2048,
-                 base=10000):
+    def __init__(self, head_dim=64, rotary_dim=None, max_position=2048, base=10000):
         super().__init__()
         self.head_dim = head_dim
         self.rotary_dim = rotary_dim or head_dim
@@ -173,21 +159,15 @@ def ops_not_in_model(self):
 
 
 class TestRotaryEmbeddingSliceScatter(torch.nn.Module):
-
-    def __init__(self,
-                 head_dim=64,
-                 num_heads=4,
-                 max_position=2048,
-                 base=10000):
+    def __init__(self, head_dim=64, num_heads=4, max_position=2048, base=10000):
         super().__init__()
         self.head_dim = head_dim
         self.num_heads = num_heads
         self.hidden_size = head_dim * num_heads
 
-        self.qkv_proj = torch.nn.Linear(self.hidden_size,
-                                        self.hidden_size * 3,
-                                        bias=False,
-                                        dtype=torch.float16)
+        self.qkv_proj = torch.nn.Linear(
+            self.hidden_size, self.hidden_size * 3, bias=False, dtype=torch.float16
+        )
 
         self.rotary_emb = get_rope(
             self.head_dim,
@@ -233,21 +213,24 @@ def ops_not_in_model(self):
 
 @pytest.mark.parametrize("model_class", MODELS)
 @pytest.mark.parametrize("do_fusion", [True, False])
-@pytest.mark.skipif(envs.VLLM_TARGET_DEVICE != "cuda",
-                    reason="Only test on CUDA")
+@pytest.mark.skipif(envs.VLLM_TARGET_DEVICE != "cuda", reason="Only test on CUDA")
 def test_fix_functionalization(model_class: torch.nn.Module, do_fusion: bool):
     torch.set_default_device("cuda")
 
     vllm_config = VllmConfig()
     vllm_config.compilation_config = CompilationConfig(
-        pass_config=PassConfig(enable_fusion=do_fusion, enable_noop=True))
+        pass_config=PassConfig(enable_fusion=do_fusion, enable_noop=True)
+    )
     noop_pass = NoOpEliminationPass(vllm_config)
     fusion_pass = RMSNormQuantFusionPass(vllm_config)
     cleanup_pass = PostCleanupPass(vllm_config)
     act_quant_fusion_pass = ActivationQuantFusionPass(vllm_config)
 
-    passes = ([noop_pass, fusion_pass, act_quant_fusion_pass, cleanup_pass]
-              if do_fusion else [noop_pass, cleanup_pass])
+    passes = (
+        [noop_pass, fusion_pass, act_quant_fusion_pass, cleanup_pass]
+        if do_fusion
+        else [noop_pass, cleanup_pass]
+    )
     func_pass = FixFunctionalizationPass(vllm_config)
 
     backend_func = TestBackend(*passes, func_pass)
@@ -260,8 +243,7 @@ def test_fix_functionalization(model_class: torch.nn.Module, do_fusion: bool):
     # check if the functionalization pass is applied
     for op in model.ops_in_model(do_fusion):
         find_auto_fn(backend_no_func.graph_post_pass.nodes, op)
-        assert (find_auto_fn_maybe(backend_func.graph_post_pass.nodes, op)
-                is None)  # noqa: E501
+        assert find_auto_fn_maybe(backend_func.graph_post_pass.nodes, op) is None  # noqa: E501
 
     # make sure the ops were all de-functionalized
     found = dict()
diff --git a/tests/compile/test_fusion.py b/tests/compile/test_fusion.py
index 3d8897d3f18b..7c2233643229 100644
--- a/tests/compile/test_fusion.py
+++ b/tests/compile/test_fusion.py
@@ -5,17 +5,26 @@
 import torch
 
 import vllm.plugins
-from vllm.compilation.fusion import (FUSED_OPS, QUANT_OPS, FusedRMSQuantKey,
-                                     RMSNormQuantFusionPass)
+from vllm.compilation.fusion import (
+    FUSED_OPS,
+    QUANT_OPS,
+    FusedRMSQuantKey,
+    RMSNormQuantFusionPass,
+)
 from vllm.compilation.noop_elimination import NoOpEliminationPass
 from vllm.compilation.post_cleanup import PostCleanupPass
-from vllm.config import (CompilationConfig, CompilationLevel, PassConfig,
-                         VllmConfig)
+from vllm.config import CompilationConfig, CompilationLevel, PassConfig, VllmConfig
 from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape, QuantKey, ScaleDesc)
+    GroupShape,
+    QuantKey,
+    ScaleDesc,
+)
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    Fp8LinearOp, cutlass_fp8_supported, maybe_create_device_identity)
+    Fp8LinearOp,
+    cutlass_fp8_supported,
+    maybe_create_device_identity,
+)
 from vllm.platforms import current_platform
 
 from ..utils import override_cutlass_fp8_supported
@@ -25,9 +34,15 @@
 
 
 class TestModel(torch.nn.Module):
-
-    def __init__(self, hidden_size: int, eps: float, static: bool,
-                 cuda_force_torch: bool, *args, **kwargs):
+    def __init__(
+        self,
+        hidden_size: int,
+        eps: float,
+        static: bool,
+        cuda_force_torch: bool,
+        *args,
+        **kwargs,
+    ):
         super().__init__(*args, **kwargs)
         self.cuda_force_torch = cuda_force_torch
         self.norm = [RMSNorm(hidden_size, eps) for _ in range(3)]
@@ -54,17 +69,15 @@ def forward(self, x):
         resid = torch.sqrt(x)
         y = self.norm[0](x)
 
-        x2 = self.fp8_linear.apply(y,
-                                   self.w[0],
-                                   self.wscale[0],
-                                   input_scale=self.scale[0])
+        x2 = self.fp8_linear.apply(
+            y, self.w[0], self.wscale[0], input_scale=self.scale[0]
+        )
         # make sure resid is used for replacement to work
         y2, resid = self.norm[1](x2, resid)
 
-        x3 = self.fp8_linear.apply(y2,
-                                   self.w[1],
-                                   self.wscale[1],
-                                   input_scale=self.scale[1])
+        x3 = self.fp8_linear.apply(
+            y2, self.w[1], self.wscale[1], input_scale=self.scale[1]
+        )
         y3, resid = self.norm[2](x3, resid)  # use resid here
         return y3
 
@@ -74,7 +87,7 @@ def ops_in_model_before(self):
     def ops_in_model_after(self):
         return [
             FUSED_OPS[FusedRMSQuantKey(self.key, False)],
-            FUSED_OPS[FusedRMSQuantKey(self.key, True)]
+            FUSED_OPS[FusedRMSQuantKey(self.key, True)],
         ]
 
 
@@ -85,22 +98,27 @@ def ops_in_model_after(self):
 @pytest.mark.parametrize("static", [True, False])
 # cuda_force_torch used to test torch code path on platforms that
 # cutlass_fp8_supported() == True.
-@pytest.mark.parametrize("cuda_force_torch",
-                         [True, False] if cutlass_fp8_supported() else [True])
-@pytest.mark.skipif(not current_platform.is_cuda_alike(),
-                    reason="Only test on CUDA and ROCm")
-def test_fusion_rmsnorm_quant(dtype, hidden_size, num_tokens, eps, static,
-                              cuda_force_torch):
+@pytest.mark.parametrize(
+    "cuda_force_torch", [True, False] if cutlass_fp8_supported() else [True]
+)
+@pytest.mark.skipif(
+    not current_platform.is_cuda_alike(), reason="Only test on CUDA and ROCm"
+)
+def test_fusion_rmsnorm_quant(
+    dtype, hidden_size, num_tokens, eps, static, cuda_force_torch
+):
     torch.set_default_device("cuda")
     torch.set_default_dtype(dtype)
     torch.manual_seed(1)
     maybe_create_device_identity()  # needed for certain non-cutlass fp8 paths
 
-    vllm_config = VllmConfig(compilation_config=CompilationConfig(
-        level=CompilationLevel.PIECEWISE,
-        custom_ops=["+rms_norm", "+quant_fp8"],
-        pass_config=PassConfig(enable_fusion=True, enable_noop=True),
-    ))
+    vllm_config = VllmConfig(
+        compilation_config=CompilationConfig(
+            level=CompilationLevel.PIECEWISE,
+            custom_ops=["+rms_norm", "+quant_fp8"],
+            pass_config=PassConfig(enable_fusion=True, enable_noop=True),
+        )
+    )
     with vllm.config.set_current_vllm_config(vllm_config):
         # Reshape pass is needed for the fusion pass to work
         noop_pass = NoOpEliminationPass(vllm_config)
diff --git a/tests/compile/test_fusion_all_reduce.py b/tests/compile/test_fusion_all_reduce.py
index 60f32c863208..7e5c460db174 100644
--- a/tests/compile/test_fusion_all_reduce.py
+++ b/tests/compile/test_fusion_all_reduce.py
@@ -10,14 +10,24 @@
 from vllm.compilation.fix_functionalization import FixFunctionalizationPass
 from vllm.compilation.noop_elimination import NoOpEliminationPass
 from vllm.compilation.post_cleanup import PostCleanupPass
-from vllm.config import (CompilationConfig, CompilationLevel, DeviceConfig,
-                         ModelConfig, PassConfig, VllmConfig)
+from vllm.config import (
+    CompilationConfig,
+    CompilationLevel,
+    DeviceConfig,
+    ModelConfig,
+    PassConfig,
+    VllmConfig,
+)
 from vllm.distributed import tensor_model_parallel_all_reduce
-from vllm.distributed.parallel_state import (init_distributed_environment,
-                                             initialize_model_parallel)
+from vllm.distributed.parallel_state import (
+    init_distributed_environment,
+    initialize_model_parallel,
+)
 from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    GroupShape, QuantFP8)
+    GroupShape,
+    QuantFP8,
+)
 from vllm.platforms import current_platform
 from vllm.utils import update_environment_variables
 
@@ -26,7 +36,6 @@
 
 
 class TestAllReduceRMSNormModel(torch.nn.Module):
-
     def __init__(self, hidden_size=16, token_num=16, eps=1e-6):
         super().__init__()
         self.hidden_size = hidden_size
@@ -47,7 +56,6 @@ def ops_in_model_after(self):
 
 
 class TestAllReduceFusedAddRMSNormModel(torch.nn.Module):
-
     def __init__(self, hidden_size=16, token_num=16, eps=1e-6):
         super().__init__()
         self.hidden_size = hidden_size
@@ -68,25 +76,22 @@ def ops_in_model_after(self):
 
 
 class TestAllReduceFusedAddRMSNormStaticQuantFP8Model(torch.nn.Module):
-
     def __init__(self, hidden_size=16, token_num=16, eps=1e-6):
         super().__init__()
         self.hidden_size = hidden_size
         self.eps = eps
         self.norm = RMSNorm(hidden_size, eps)
-        self.quant_fp8 = QuantFP8(static=True,
-                                  group_shape=GroupShape.PER_TENSOR)
+        self.quant_fp8 = QuantFP8(static=True, group_shape=GroupShape.PER_TENSOR)
         self.scale = torch.rand(1, dtype=torch.float32)
-        self.output = torch.empty((token_num, hidden_size),
-                                  dtype=torch.float32)
+        self.output = torch.empty((token_num, hidden_size), dtype=torch.float32)
 
     def forward(self, hidden_states, residual):
         view = hidden_states.reshape(-1, self.hidden_size)
         all_reduce = tensor_model_parallel_all_reduce(view)
         norm_output, residual_output = self.norm(all_reduce, residual)
-        torch.ops._C.static_scaled_fp8_quant(self.output,
-                                             norm_output.contiguous(),
-                                             self.scale)
+        torch.ops._C.static_scaled_fp8_quant(
+            self.output, norm_output.contiguous(), self.scale
+        )
         return self.output, residual_output
 
     def ops_in_model_after(self):
@@ -95,35 +100,33 @@ def ops_in_model_after(self):
     def ops_in_model_before(self):
         return [
             torch.ops.vllm.all_reduce.default,
-            torch.ops._C.static_scaled_fp8_quant.default
+            torch.ops._C.static_scaled_fp8_quant.default,
         ]
 
 
 class TestAllReduceFusedAddRMSNormStaticQuantFP4Model(torch.nn.Module):
-
     def __init__(self, hidden_size=16, token_num=16, eps=1e-6):
         super().__init__()
         self.hidden_size = hidden_size
         self.eps = eps
         self.norm = RMSNorm(hidden_size, eps)
         self.scale = torch.rand(1, dtype=torch.float32)
-        self.output = torch.empty((token_num, hidden_size),
-                                  dtype=torch.float32)
+        self.output = torch.empty((token_num, hidden_size), dtype=torch.float32)
 
         round_up = lambda x, y: (x + y - 1) // y * y
         rounded_m = round_up(token_num, 128)
         scale_n = hidden_size // 16
         rounded_n = round_up(scale_n, 4)
-        self.output_scale = torch.empty((rounded_m, rounded_n // 4),
-                                        dtype=torch.int32)
+        self.output_scale = torch.empty((rounded_m, rounded_n // 4), dtype=torch.int32)
 
     def forward(self, hidden_states, residual):
         view = hidden_states.reshape(-1, self.hidden_size)
         all_reduce = tensor_model_parallel_all_reduce(view)
         norm_output, residual_output = self.norm(all_reduce, residual)
         norm_output = norm_output.reshape(-1, norm_output.shape[-1])
-        torch.ops._C.scaled_fp4_quant(self.output, norm_output,
-                                      self.output_scale, self.scale)
+        torch.ops._C.scaled_fp4_quant(
+            self.output, norm_output, self.output_scale, self.scale
+        )
         return self.output, residual_output, self.output_scale
 
     def ops_in_model_after(self):
@@ -132,7 +135,7 @@ def ops_in_model_after(self):
     def ops_in_model_before(self):
         return [
             torch.ops.vllm.all_reduce.default,
-            torch.ops._C.scaled_fp4_quant.default
+            torch.ops._C.scaled_fp4_quant.default,
         ]
 
 
@@ -145,41 +148,55 @@ def ops_in_model_before(self):
         TestAllReduceFusedAddRMSNormStaticQuantFP8Model,
         # TODO: Enable with torch==2.8.0
         # TestAllReduceFusedAddRMSNormStaticQuantFP4Model,
-    ])
+    ],
+)
 @pytest.mark.parametrize("batch_size", [8])
 @pytest.mark.parametrize("seq_len", [8])
 @pytest.mark.parametrize("hidden_size", [16])
 @pytest.mark.parametrize("dtype", [torch.bfloat16])
-@pytest.mark.skipif(envs.VLLM_TARGET_DEVICE not in ["cuda"],
-                    reason="Only test on CUDA")
+@pytest.mark.skipif(envs.VLLM_TARGET_DEVICE not in ["cuda"], reason="Only test on CUDA")
 @pytest.mark.skipif(
     not find_spec("flashinfer")
     or not has_module_attribute("flashinfer.comm", "trtllm_allreduce_fusion"),
     reason="flashinfer is not found or flashinfer "
-    "is not compiled with trtllm_allreduce_fusion")
-def test_all_reduce_fusion_pass_replace(test_model: torch.nn.Module,
-                                        batch_size: int, seq_len: int,
-                                        hidden_size: int, dtype: torch.dtype):
+    "is not compiled with trtllm_allreduce_fusion",
+)
+def test_all_reduce_fusion_pass_replace(
+    test_model: torch.nn.Module,
+    batch_size: int,
+    seq_len: int,
+    hidden_size: int,
+    dtype: torch.dtype,
+):
     num_processes = 2
-    if (test_model == TestAllReduceFusedAddRMSNormStaticQuantFP4Model
-            and not current_platform.has_device_capability(100)):
-        pytest.skip("Skip as nvfp4 is only supported on "
-                    "devices with compute capability 10.0 (Blackwell)")
+    if (
+        test_model == TestAllReduceFusedAddRMSNormStaticQuantFP4Model
+        and not current_platform.has_device_capability(100)
+    ):
+        pytest.skip(
+            "Skip as nvfp4 is only supported on "
+            "devices with compute capability 10.0 (Blackwell)"
+        )
 
     def run_torch_spawn(fn, nprocs):
-        torch.multiprocessing.spawn(fn,
-                                    args=(num_processes, test_model,
-                                          batch_size, seq_len, hidden_size,
-                                          dtype),
-                                    nprocs=nprocs)
+        torch.multiprocessing.spawn(
+            fn,
+            args=(num_processes, test_model, batch_size, seq_len, hidden_size, dtype),
+            nprocs=nprocs,
+        )
 
     run_torch_spawn(all_reduce_fusion_pass_on_test_model, num_processes)
 
 
-def all_reduce_fusion_pass_on_test_model(local_rank: int, world_size: int,
-                                         test_model_cls: torch.nn.Module,
-                                         batch_size: int, seq_len: int,
-                                         hidden_size: int, dtype: torch.dtype):
+def all_reduce_fusion_pass_on_test_model(
+    local_rank: int,
+    world_size: int,
+    test_model_cls: torch.nn.Module,
+    batch_size: int,
+    seq_len: int,
+    hidden_size: int,
+    dtype: torch.dtype,
+):
     current_platform.seed_everything(0)
 
     device = torch.device(f"cuda:{local_rank}")
@@ -187,39 +204,42 @@ def all_reduce_fusion_pass_on_test_model(local_rank: int, world_size: int,
     torch.set_default_device(device)
     torch.set_default_dtype(dtype)
 
-    update_environment_variables({
-        'RANK': str(local_rank),
-        'LOCAL_RANK': str(local_rank),
-        'WORLD_SIZE': str(world_size),
-        'MASTER_ADDR': 'localhost',
-        'MASTER_PORT': '12345',
-    })
+    update_environment_variables(
+        {
+            "RANK": str(local_rank),
+            "LOCAL_RANK": str(local_rank),
+            "WORLD_SIZE": str(world_size),
+            "MASTER_ADDR": "localhost",
+            "MASTER_PORT": "12345",
+        }
+    )
 
     init_distributed_environment()
     initialize_model_parallel(tensor_model_parallel_size=world_size)
 
-    vllm_config = VllmConfig(compilation_config=CompilationConfig(
-        level=CompilationLevel.PIECEWISE,
-        custom_ops=["+rms_norm", "+quant_fp8"]))
+    vllm_config = VllmConfig(
+        compilation_config=CompilationConfig(
+            level=CompilationLevel.PIECEWISE, custom_ops=["+rms_norm", "+quant_fp8"]
+        )
+    )
     vllm_config.compilation_config.pass_config = PassConfig(
-        enable_fi_allreduce_fusion=True, enable_noop=True)
+        enable_fi_allreduce_fusion=True, enable_noop=True
+    )
     vllm_config.device_config = DeviceConfig(device=torch.device("cuda"))
 
     # this is a fake model name to construct the model config
     # in the vllm_config, it's not really used.
     model_name = "nm-testing/TinyLlama-1.1B-Chat-v1.0-FP8-e2e"
-    vllm_config.model_config = ModelConfig(model=model_name,
-                                           trust_remote_code=True,
-                                           dtype=dtype,
-                                           seed=42)
+    vllm_config.model_config = ModelConfig(
+        model=model_name, trust_remote_code=True, dtype=dtype, seed=42
+    )
 
     all_reduce_fusion_pass = AllReduceFusionPass(vllm_config)
     noop_pass = NoOpEliminationPass(vllm_config)
     func_pass = FixFunctionalizationPass(vllm_config)
     cleanup_pass = PostCleanupPass(vllm_config)
 
-    backend = TestBackend(all_reduce_fusion_pass, noop_pass, func_pass,
-                          cleanup_pass)
+    backend = TestBackend(all_reduce_fusion_pass, noop_pass, func_pass, cleanup_pass)
 
     token_num = batch_size * seq_len
     model = test_model_cls(hidden_size, token_num)
diff --git a/tests/compile/test_fusion_attn.py b/tests/compile/test_fusion_attn.py
index 077cf11d048a..25b3f16bd94e 100644
--- a/tests/compile/test_fusion_attn.py
+++ b/tests/compile/test_fusion_attn.py
@@ -19,14 +19,23 @@
 from vllm.compilation.fx_utils import find_op_nodes
 from vllm.compilation.noop_elimination import NoOpEliminationPass
 from vllm.compilation.post_cleanup import PostCleanupPass
-from vllm.config import (CacheConfig, CompilationConfig, CompilationLevel,
-                         ModelConfig, PassConfig, SchedulerConfig, VllmConfig,
-                         set_current_vllm_config)
+from vllm.config import (
+    CacheConfig,
+    CompilationConfig,
+    CompilationLevel,
+    ModelConfig,
+    PassConfig,
+    SchedulerConfig,
+    VllmConfig,
+    set_current_vllm_config,
+)
 from vllm.forward_context import get_forward_context, set_forward_context
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    QuantKey, kFp8StaticTensorSym, kNvfp4Quant)
-from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    Fp8LinearOp)
+    QuantKey,
+    kFp8StaticTensorSym,
+    kNvfp4Quant,
+)
+from vllm.model_executor.layers.quantization.utils.w8a8_utils import Fp8LinearOp
 from vllm.platforms import current_platform
 from vllm.utils import is_torch_equal_or_newer
 from vllm.v1.kv_cache_interface import AttentionSpec
@@ -40,14 +49,16 @@
 
 
 @pytest.mark.parametrize(
-    "model, quant_key",
-    [("amd/Llama-3.1-8B-Instruct-FP8-KV", kFp8StaticTensorSym)])
+    "model, quant_key", [("amd/Llama-3.1-8B-Instruct-FP8-KV", kFp8StaticTensorSym)]
+)
 @pytest.mark.parametrize("use_triton_fa", [True, False])
 @pytest.mark.skipif(not current_platform.supports_fp8(), reason="Need FP8")
-@pytest.mark.skipif(not current_platform.is_rocm(),
-                    reason="V0 attn quant fusion only on ROCm")
-def test_attention_fusion_v0(example_prompts, monkeypatch, model: str,
-                             quant_key: QuantKey, use_triton_fa: bool):
+@pytest.mark.skipif(
+    not current_platform.is_rocm(), reason="V0 attn quant fusion only on ROCm"
+)
+def test_attention_fusion_v0(
+    example_prompts, monkeypatch, model: str, quant_key: QuantKey, use_triton_fa: bool
+):
     # Clean Dynamo cache to avoid reusing other test cases
     # (for some reason the reset at the end is not enough)
     torch._dynamo.reset()
@@ -69,22 +80,24 @@ def test_attention_fusion_v0(example_prompts, monkeypatch, model: str,
         backend="tests.compile.test_fusion_attn.backend_unfused",
         custom_ops=["+quant_fp8"],
     )
-    vllm_config = VllmConfig(compilation_config=compile_config,
-                             model_config=ModelConfig(
-                                 model=model,
-                                 dtype=torch.bfloat16,
-                             ))
+    vllm_config = VllmConfig(
+        compilation_config=compile_config,
+        model_config=ModelConfig(
+            model=model,
+            dtype=torch.bfloat16,
+        ),
+    )
     backend_unfused = TestBackend(NoOpEliminationPass(vllm_config))
 
-    llm = LLM(model,
-              enforce_eager=True,
-              compilation_config=compile_config,
-              gpu_memory_utilization=0.5,
-              max_model_len=2048)
+    llm = LLM(
+        model,
+        enforce_eager=True,
+        compilation_config=compile_config,
+        gpu_memory_utilization=0.5,
+        max_model_len=2048,
+    )
 
-    sampling_params = SamplingParams(temperature=0.0,
-                                     max_tokens=10,
-                                     top_p=0.95)
+    sampling_params = SamplingParams(temperature=0.0, max_tokens=10, top_p=0.95)
 
     unfused_output = llm.generate(prompts, sampling_params)
     backend_unfused = None  # Reset backend to make sure llm gets released
@@ -97,21 +110,25 @@ def test_attention_fusion_v0(example_prompts, monkeypatch, model: str,
         backend="tests.compile.test_fusion_attn.backend",
         custom_ops=["+quant_fp8"],
     )
-    vllm_config = VllmConfig(compilation_config=compile_config,
-                             model_config=ModelConfig(
-                                 model=model,
-                                 dtype=torch.bfloat16,
-                             ))
+    vllm_config = VllmConfig(
+        compilation_config=compile_config,
+        model_config=ModelConfig(
+            model=model,
+            dtype=torch.bfloat16,
+        ),
+    )
 
     # AttnFusionPass needs attention layers to be registered in config upon init
     # so we initialize it during compilation.
     attn_pass = LazyInitPass(AttnFusionPass, vllm_config)
     backend = TestBackend(NoOpEliminationPass(vllm_config), attn_pass)
-    llm2 = LLM(model,
-               enforce_eager=True,
-               compilation_config=compile_config,
-               gpu_memory_utilization=0.5,
-               max_model_len=2048)
+    llm2 = LLM(
+        model,
+        enforce_eager=True,
+        compilation_config=compile_config,
+        gpu_memory_utilization=0.5,
+        max_model_len=2048,
+    )
 
     # check support
     attn_fusion_supported = [
@@ -132,9 +149,9 @@ def test_attention_fusion_v0(example_prompts, monkeypatch, model: str,
     for i in range(len(attn_nodes_pre)):
         assert attn_nodes_pre[i].kwargs["output_scale"] is None
         fused = attn_nodes_post[i].kwargs["output_scale"] is not None
-        assert fused == attn_fusion_supported[i], \
-            f"Node {i} {'' if fused else 'not '} expected " \
-            f"to have fused output quant"
+        assert fused == attn_fusion_supported[i], (
+            f"Node {i} {'' if fused else 'not '} expected to have fused output quant"
+        )
 
     # check outputs
     fused_output = llm2.generate(prompts, sampling_params)
@@ -160,9 +177,16 @@ def test_attention_fusion_v0(example_prompts, monkeypatch, model: str,
 class AttentionQuantPatternModel(torch.nn.Module):
     """Base model for AttentionQuantPattern fusion."""
 
-    def __init__(self, num_qo_heads: int, num_kv_heads: int, head_size: int,
-                 kv_cache_dtype: torch.dtype, device: torch.device,
-                 vllm_config: VllmConfig, **kwargs):
+    def __init__(
+        self,
+        num_qo_heads: int,
+        num_kv_heads: int,
+        head_size: int,
+        kv_cache_dtype: torch.dtype,
+        device: torch.device,
+        vllm_config: VllmConfig,
+        **kwargs,
+    ):
         super().__init__()
         self.num_qo_heads = num_qo_heads
         self.num_kv_heads = num_kv_heads
@@ -197,33 +221,30 @@ def __init__(self, num_qo_heads: int, num_kv_heads: int, head_size: int,
             device=self.device,
         )
 
-    def build_attn_metadata(self, batch_size: int, use_hnd: bool) \
-            -> AttentionMetadata:
+    def build_attn_metadata(self, batch_size: int, use_hnd: bool) -> AttentionMetadata:
         """Initialize attention metadata."""
 
         # Create common attn metadata
-        batch_spec = BatchSpec(seq_lens=[1] * batch_size,
-                               query_lens=[1] * batch_size)
+        batch_spec = BatchSpec(seq_lens=[1] * batch_size, query_lens=[1] * batch_size)
         common_attn_metadata = create_common_attn_metadata(
-            batch_spec,
-            self.block_size,
-            self.device,
-            arange_block_indices=True)
+            batch_spec, self.block_size, self.device, arange_block_indices=True
+        )
 
-        max_blocks = (max(batch_spec.seq_lens) + self.block_size -
-                      1) // self.block_size
+        max_blocks = (max(batch_spec.seq_lens) + self.block_size - 1) // self.block_size
         num_blocks = batch_size * max_blocks
 
         # Create dummy KV cache for FlashInfer TRTLLM
         #   - NHD: [num_blocks, block_size, num_kv_heads, head_size]
         #   - HND: [num_blocks, num_kv_heads, block_size, head_size]
-        kv_cache = torch.zeros(num_blocks,
-                               2,
-                               self.num_kv_heads,
-                               self.block_size,
-                               self.head_size,
-                               dtype=self.kv_cache_dtype,
-                               device=self.device)
+        kv_cache = torch.zeros(
+            num_blocks,
+            2,
+            self.num_kv_heads,
+            self.block_size,
+            self.head_size,
+            dtype=self.kv_cache_dtype,
+            device=self.device,
+        )
         if current_platform.is_rocm():
             # k/v as 1st dimention
             if use_hnd:
@@ -239,7 +260,8 @@ def build_attn_metadata(self, batch_size: int, use_hnd: bool) \
 
         # Build attn metadata
         self.attn_metadata = self.builder.build(
-            common_prefix_len=0, common_attn_metadata=common_attn_metadata)
+            common_prefix_len=0, common_attn_metadata=common_attn_metadata
+        )
 
         return self.attn_metadata
 
@@ -254,27 +276,30 @@ def __init__(self, *args, **kwargs):
 
         self.fp8_linear = Fp8LinearOp(
             act_quant_static=self.quant_key.scale.static,
-            act_quant_group_shape=self.quant_key.scale.group_shape)
+            act_quant_group_shape=self.quant_key.scale.group_shape,
+        )
 
         hidden_size = self.num_qo_heads * self.head_size
         self.w = kwargs.get(
-            "w", {
-                "weight":
-                torch.randn(hidden_size, hidden_size).to(
-                    dtype=FP8_DTYPE, device=self.device).t(),
-                "wscale":
-                torch.tensor([1.0], dtype=torch.float32, device=self.device),
-                "scale":
-                torch.tensor([1.0], dtype=torch.float32, device=self.device),
-            })
+            "w",
+            {
+                "weight": torch.randn(hidden_size, hidden_size)
+                .to(dtype=FP8_DTYPE, device=self.device)
+                .t(),
+                "wscale": torch.tensor([1.0], dtype=torch.float32, device=self.device),
+                "scale": torch.tensor([1.0], dtype=torch.float32, device=self.device),
+            },
+        )
 
     def forward(self, q: torch.Tensor, k: torch.Tensor, v: torch.Tensor):
         """Forward pass that creates the pattern to be fused."""
         attn_output = self.attn(q, k, v)
-        return self.fp8_linear.apply(input=attn_output,
-                                     weight=self.w["weight"],
-                                     weight_scale=self.w["wscale"],
-                                     input_scale=self.w["scale"])
+        return self.fp8_linear.apply(
+            input=attn_output,
+            weight=self.w["weight"],
+            weight_scale=self.w["wscale"],
+            input_scale=self.w["scale"],
+        )
 
 
 class TestAttentionNvfp4QuantPatternModel(AttentionQuantPatternModel):
@@ -287,42 +312,54 @@ def __init__(self, *args, **kwargs):
 
         hidden_size = self.num_qo_heads * self.head_size
         self.w = kwargs.get(
-            "w", {
-                "weight":
-                torch.randint(256, (hidden_size, hidden_size // 2),
-                              dtype=FP4_DTYPE,
-                              device=self.device),
-                "wscale_swizzled":
-                torch.randn(hidden_size, hidden_size // 16).to(
-                    dtype=FP8_DTYPE, device=self.device),
-                "wscale":
-                torch.tensor([500], dtype=torch.float32, device=self.device),
-                "scale":
-                torch.tensor([0.002], dtype=torch.float32, device=self.device),
-            })
+            "w",
+            {
+                "weight": torch.randint(
+                    256,
+                    (hidden_size, hidden_size // 2),
+                    dtype=FP4_DTYPE,
+                    device=self.device,
+                ),
+                "wscale_swizzled": torch.randn(hidden_size, hidden_size // 16).to(
+                    dtype=FP8_DTYPE, device=self.device
+                ),
+                "wscale": torch.tensor([500], dtype=torch.float32, device=self.device),
+                "scale": torch.tensor([0.002], dtype=torch.float32, device=self.device),
+            },
+        )
 
     def forward(self, q: torch.Tensor, k: torch.Tensor, v: torch.Tensor):
         """Forward pass that creates the pattern to be fused."""
         attn_output = self.attn(q, k, v)
         quant_output, output_block_scale = scaled_fp4_quant(
-            attn_output, 1 / self.w["scale"])
-        return cutlass_scaled_fp4_mm(a=quant_output,
-                                     b=self.w["weight"],
-                                     block_scale_a=output_block_scale,
-                                     block_scale_b=self.w["wscale_swizzled"],
-                                     alpha=self.w["scale"] * self.w["wscale"],
-                                     out_dtype=attn_output.dtype)
+            attn_output, 1 / self.w["scale"]
+        )
+        return cutlass_scaled_fp4_mm(
+            a=quant_output,
+            b=self.w["weight"],
+            block_scale_a=output_block_scale,
+            block_scale_b=self.w["wscale_swizzled"],
+            alpha=self.w["scale"] * self.w["wscale"],
+            out_dtype=attn_output.dtype,
+        )
 
 
 if current_platform.is_cuda():
-    MODELS = [("nvidia/Llama-4-Scout-17B-16E-Instruct-FP8",
-               TestAttentionFp8StaticQuantPatternModel),
-              ("nvidia/Llama-4-Scout-17B-16E-Instruct-FP4",
-               TestAttentionNvfp4QuantPatternModel)]
+    MODELS = [
+        (
+            "nvidia/Llama-4-Scout-17B-16E-Instruct-FP8",
+            TestAttentionFp8StaticQuantPatternModel,
+        ),
+        (
+            "nvidia/Llama-4-Scout-17B-16E-Instruct-FP4",
+            TestAttentionNvfp4QuantPatternModel,
+        ),
+    ]
     HEADS = [(64, 8), (40, 8)]
 elif current_platform.is_rocm():
-    MODELS = [("amd/Llama-3.1-8B-Instruct-FP8-KV",
-               TestAttentionFp8StaticQuantPatternModel)]
+    MODELS = [
+        ("amd/Llama-3.1-8B-Instruct-FP8-KV", TestAttentionFp8StaticQuantPatternModel)
+    ]
     HEADS = [(32, 8), (40, 8)]
 else:
     MODELS = []
@@ -331,41 +368,53 @@ def forward(self, q: torch.Tensor, k: torch.Tensor, v: torch.Tensor):
 
 @pytest.mark.parametrize("num_qo_heads, num_kv_heads", HEADS)
 @pytest.mark.parametrize("head_size", [128])
-@pytest.mark.parametrize("batch_size",
-                         [7, 256, 533] if current_platform.is_cuda() else [8])
+@pytest.mark.parametrize(
+    "batch_size", [7, 256, 533] if current_platform.is_cuda() else [8]
+)
 @pytest.mark.parametrize("dtype", [torch.bfloat16, torch.float16])
 @pytest.mark.parametrize("model_name, model_class", MODELS)
-@pytest.mark.parametrize("backend",
-                         [_Backend.FLASHINFER] if current_platform.is_cuda()
-                         else [_Backend.TRITON_ATTN])
 @pytest.mark.parametrize(
-    "split_attention",
-    [False, True] if current_platform.is_rocm() else [False])
+    "backend",
+    [_Backend.FLASHINFER] if current_platform.is_cuda() else [_Backend.TRITON_ATTN],
+)
+@pytest.mark.parametrize(
+    "split_attention", [False, True] if current_platform.is_rocm() else [False]
+)
 # TODO(boyuan): test inductor graph partition on rocm
 @pytest.mark.parametrize(
     "use_inductor_graph_partition",
-    [False] if current_platform.is_rocm() else [False, True])
-@pytest.mark.skipif(not current_platform.is_cuda_alike(),
-                    reason="Only test ROCm or CUDA")
+    [False] if current_platform.is_rocm() else [False, True],
+)
+@pytest.mark.skipif(
+    not current_platform.is_cuda_alike(), reason="Only test ROCm or CUDA"
+)
 @pytest.mark.skipif(not current_platform.supports_fp8(), reason="Need FP8")
-@pytest.mark.skipif(current_platform.is_cuda()
-                    and not current_platform.is_device_capability((10, 0)),
-                    reason="On CUDA only test on SM100(Blackwell)")
-@pytest.mark.skipif(not current_platform.is_cuda_alike(),
-                    reason="Only test ROCm or CUDA")
-def test_attention_quant_pattern(num_qo_heads: int, num_kv_heads: int,
-                                 head_size: int, batch_size: int,
-                                 dtype: torch.dtype, model_name: str,
-                                 model_class: type[AttentionQuantPatternModel],
-                                 backend: _Backend, split_attention: bool,
-                                 use_inductor_graph_partition: bool,
-                                 monkeypatch, dist_init, caplog_vllm):
+@pytest.mark.skipif(
+    current_platform.is_cuda() and not current_platform.is_device_capability((10, 0)),
+    reason="On CUDA only test on SM100(Blackwell)",
+)
+@pytest.mark.skipif(
+    not current_platform.is_cuda_alike(), reason="Only test ROCm or CUDA"
+)
+def test_attention_quant_pattern(
+    num_qo_heads: int,
+    num_kv_heads: int,
+    head_size: int,
+    batch_size: int,
+    dtype: torch.dtype,
+    model_name: str,
+    model_class: type[AttentionQuantPatternModel],
+    backend: _Backend,
+    split_attention: bool,
+    use_inductor_graph_partition: bool,
+    monkeypatch,
+    dist_init,
+    caplog_vllm,
+):
     """Test AttentionStaticQuantPattern fusion pass"""
 
-    if use_inductor_graph_partition and not is_torch_equal_or_newer(
-            "2.9.0.dev"):
-        pytest.skip("inductor graph partition is only available "
-                    "in PyTorch 2.9+")
+    if use_inductor_graph_partition and not is_torch_equal_or_newer("2.9.0.dev"):
+        pytest.skip("inductor graph partition is only available in PyTorch 2.9+")
 
     monkeypatch.setenv("VLLM_USE_V1", "1")
     if split_attention:
@@ -386,21 +435,13 @@ def test_attention_quant_pattern(num_qo_heads: int, num_kv_heads: int,
             custom_ops=["+quant_fp8"],
             use_inductor_graph_partition=use_inductor_graph_partition,
         ),
-        cache_config=CacheConfig(cache_dtype="fp8"))
+        cache_config=CacheConfig(cache_dtype="fp8"),
+    )
 
     # Create test inputs
-    q = torch.randn(batch_size,
-                    num_qo_heads * head_size,
-                    dtype=dtype,
-                    device=device)
-    k = torch.randn(batch_size,
-                    num_kv_heads * head_size,
-                    dtype=dtype,
-                    device=device)
-    v = torch.randn(batch_size,
-                    num_kv_heads * head_size,
-                    dtype=dtype,
-                    device=device)
+    q = torch.randn(batch_size, num_qo_heads * head_size, dtype=dtype, device=device)
+    k = torch.randn(batch_size, num_kv_heads * head_size, dtype=dtype, device=device)
+    v = torch.randn(batch_size, num_kv_heads * head_size, dtype=dtype, device=device)
 
     # Mark first dimension as dynamic for realistic testing
     torch._dynamo.mark_dynamic(q, 0)
@@ -409,42 +450,53 @@ def test_attention_quant_pattern(num_qo_heads: int, num_kv_heads: int,
 
     # Run model directly without compilation and fusion
     vllm_config_unfused = copy.deepcopy(vllm_config)
-    with set_current_vllm_config(vllm_config_unfused), set_forward_context(
-            attn_metadata=None, vllm_config=vllm_config_unfused
-    ), global_force_attn_backend_context_manager(backend):
-        model_unfused = model_class(num_qo_heads=num_qo_heads,
-                                    num_kv_heads=num_kv_heads,
-                                    head_size=head_size,
-                                    kv_cache_dtype=FP8_DTYPE,
-                                    device=device,
-                                    vllm_config=vllm_config_unfused)
+    with (
+        set_current_vllm_config(vllm_config_unfused),
+        set_forward_context(attn_metadata=None, vllm_config=vllm_config_unfused),
+        global_force_attn_backend_context_manager(backend),
+    ):
+        model_unfused = model_class(
+            num_qo_heads=num_qo_heads,
+            num_kv_heads=num_kv_heads,
+            head_size=head_size,
+            kv_cache_dtype=FP8_DTYPE,
+            device=device,
+            vllm_config=vllm_config_unfused,
+        )
         model_unfused = model_unfused.to(device)
 
         forward_ctx = get_forward_context()
         forward_ctx.attn_metadata = model_unfused.build_attn_metadata(
-            batch_size, use_hnd=split_attention)
+            batch_size, use_hnd=split_attention
+        )
 
         # Run model directly without compilation and fusion
         result_unfused = model_unfused(q, k, v)
 
     # Run model with attn fusion enabled
     vllm_config.compilation_config.pass_config = PassConfig(
-        enable_attn_fusion=True, enable_noop=True)
-    with set_current_vllm_config(vllm_config), set_forward_context(
-            attn_metadata=None, vllm_config=vllm_config
-    ), global_force_attn_backend_context_manager(backend):
-        model_fused = model_class(num_qo_heads=num_qo_heads,
-                                  num_kv_heads=num_kv_heads,
-                                  head_size=head_size,
-                                  kv_cache_dtype=FP8_DTYPE,
-                                  device=device,
-                                  vllm_config=vllm_config,
-                                  w=model_unfused.w)
+        enable_attn_fusion=True, enable_noop=True
+    )
+    with (
+        set_current_vllm_config(vllm_config),
+        set_forward_context(attn_metadata=None, vllm_config=vllm_config),
+        global_force_attn_backend_context_manager(backend),
+    ):
+        model_fused = model_class(
+            num_qo_heads=num_qo_heads,
+            num_kv_heads=num_kv_heads,
+            head_size=head_size,
+            kv_cache_dtype=FP8_DTYPE,
+            device=device,
+            vllm_config=vllm_config,
+            w=model_unfused.w,
+        )
         model_fused = model_fused.to(device)
 
         forward_ctx = get_forward_context()
         forward_ctx.attn_metadata = model_fused.build_attn_metadata(
-            batch_size, use_hnd=split_attention)
+            batch_size, use_hnd=split_attention
+        )
 
         # Create test backend with fusion passes enabled
         noop_pass = NoOpEliminationPass(vllm_config)
@@ -454,9 +506,9 @@ def test_attention_quant_pattern(num_qo_heads: int, num_kv_heads: int,
         test_backend = TestBackend(noop_pass, attn_pass, cleanup_pass)
 
         # Compile model with fusion enabled
-        model_compiled = torch.compile(model_fused,
-                                       backend=test_backend,
-                                       fullgraph=True)
+        model_compiled = torch.compile(
+            model_fused, backend=test_backend, fullgraph=True
+        )
         assert model_compiled.attn._o_scale_float is None
 
         result_fused_1 = model_compiled(q, k, v)
@@ -471,49 +523,49 @@ def test_attention_quant_pattern(num_qo_heads: int, num_kv_heads: int,
 
             assert model_compiled.attn._o_scale_float is not None
 
-            torch.testing.assert_close(result_unfused,
-                                       result_fused_2,
-                                       atol=1e-2,
-                                       rtol=1e-2)
+            torch.testing.assert_close(
+                result_unfused, result_fused_2, atol=1e-2, rtol=1e-2
+            )
 
     # Check attn fusion support
     quant_key = model_class.quant_key
     attn_fusion_supported = [
-        layer.impl.fused_output_quant_supported(quant_key) for key, layer in
-        vllm_config.compilation_config.static_forward_context.items()
+        layer.impl.fused_output_quant_supported(quant_key)
+        for key, layer in vllm_config.compilation_config.static_forward_context.items()
     ]
     if any(attn_fusion_supported):
         # Check quantization ops in the graph before and after fusion
-        test_backend.check_before_ops([QUANT_OPS[quant_key]],
-                                      fully_replaced=True)
+        test_backend.check_before_ops([QUANT_OPS[quant_key]], fully_replaced=True)
 
     # access the underlying `AttnFusionPass` on the `LazyInitPass`
     assert attn_pass.pass_.matched_count == sum(attn_fusion_supported)
 
     # Check attention ops in the graph before and after fusion
     attn_nodes_pre = list(find_op_nodes(ATTN_OP, test_backend.graph_pre_pass))
-    attn_nodes_post = list(find_op_nodes(ATTN_OP,
-                                         test_backend.graph_post_pass))
+    attn_nodes_post = list(find_op_nodes(ATTN_OP, test_backend.graph_post_pass))
 
     assert len(attn_nodes_pre) > 0, "Should have attention nodes before fusion"
-    assert len(attn_nodes_pre) == len(attn_nodes_post), \
+    assert len(attn_nodes_pre) == len(attn_nodes_post), (
         "Should have same number of attention nodes before and after fusion"
-    assert attn_nodes_pre[0].kwargs.get("output_scale") is None, \
+    )
+    assert attn_nodes_pre[0].kwargs.get("output_scale") is None, (
         "Attention should not have output_scale before fusion"
-    assert attn_nodes_post[0].kwargs.get("output_scale") is not None, \
+    )
+    assert attn_nodes_post[0].kwargs.get("output_scale") is not None, (
         "Attention should have output_scale after fusion"
+    )
 
-    assert attn_nodes_pre[0].kwargs.get("output_block_scale") is None, \
+    assert attn_nodes_pre[0].kwargs.get("output_block_scale") is None, (
         "Attention should not have output_block_scale before fusion"
+    )
     if quant_key.dtype == FP8_DTYPE:
-        assert attn_nodes_post[0].kwargs.get("output_block_scale") is None, \
+        assert attn_nodes_post[0].kwargs.get("output_block_scale") is None, (
             "Attention should not have output_block_scale after FP8 fusion"
+        )
     elif quant_key.dtype == FP4_DTYPE:
-        assert attn_nodes_post[0].kwargs.get("output_block_scale") is not None, \
-            "Attention should have output_block_scale after FP4 fusion"  # noqa: E501
+        assert attn_nodes_post[0].kwargs.get("output_block_scale") is not None, (
+            "Attention should have output_block_scale after FP4 fusion"
+        )  # noqa: E501
 
     # Check that results are close
-    torch.testing.assert_close(result_unfused,
-                               result_fused_1,
-                               atol=1e-2,
-                               rtol=1e-2)
+    torch.testing.assert_close(result_unfused, result_fused_1, atol=1e-2, rtol=1e-2)
diff --git a/tests/compile/test_noop_elimination.py b/tests/compile/test_noop_elimination.py
index 242d53131267..fda7f4e3bafa 100644
--- a/tests/compile/test_noop_elimination.py
+++ b/tests/compile/test_noop_elimination.py
@@ -6,14 +6,12 @@
 
 import vllm
 from vllm.compilation.noop_elimination import NoOpEliminationPass
-from vllm.config import (CompilationConfig, CompilationLevel, PassConfig,
-                         VllmConfig)
+from vllm.config import CompilationConfig, CompilationLevel, PassConfig, VllmConfig
 
 from .backend import TestBackend
 
 
-@pytest.mark.parametrize("dtype",
-                         [torch.float16, torch.bfloat16, torch.float32])
+@pytest.mark.parametrize("dtype", [torch.float16, torch.bfloat16, torch.float32])
 @pytest.mark.parametrize("num_tokens", [256, 1024])
 @pytest.mark.parametrize("hidden_size", [64, 4096])
 def test_noop_elimination(dtype, num_tokens, hidden_size):
@@ -22,7 +20,6 @@ def test_noop_elimination(dtype, num_tokens, hidden_size):
     torch.manual_seed(1)
 
     class Model(torch.nn.Module):
-
         def forward(self, x):
             # Chain of reshapes
             y = x.reshape(-1, 128, 32)
@@ -32,7 +29,7 @@ def forward(self, x):
             # Final reshape that should remain
             b = a.reshape(-1, 128, 32)
             # No-op slice
-            c = b[0:b.shape[0]]
+            c = b[0 : b.shape[0]]
             # The pass should replace the result of this op with `c`.
             d = torch.slice_scatter(
                 torch.ones_like(c),  # Dummy tensor to be scattered into
@@ -43,10 +40,12 @@ def forward(self, x):
             )
             return d
 
-    vllm_config = VllmConfig(compilation_config=CompilationConfig(
-        level=CompilationLevel.PIECEWISE,
-        pass_config=PassConfig(enable_noop=True),
-    ))
+    vllm_config = VllmConfig(
+        compilation_config=CompilationConfig(
+            level=CompilationLevel.PIECEWISE,
+            pass_config=PassConfig(enable_noop=True),
+        )
+    )
     with vllm.config.set_current_vllm_config(vllm_config):
         noop_pass = NoOpEliminationPass(vllm_config)
 
@@ -82,17 +81,18 @@ def test_non_noop_slice_preserved():
     x = torch.randn(16, 16)
 
     class SliceModel(torch.nn.Module):
-
         def forward(self, x):
             base = x.clone()
             src = torch.ones(15, 16)
             y = torch.slice_scatter(base, src, dim=0, start=0, end=-1)
             return x[0:-1, :], y
 
-    vllm_config = VllmConfig(compilation_config=CompilationConfig(
-        level=CompilationLevel.PIECEWISE,
-        pass_config=PassConfig(enable_noop=True),
-    ))
+    vllm_config = VllmConfig(
+        compilation_config=CompilationConfig(
+            level=CompilationLevel.PIECEWISE,
+            pass_config=PassConfig(enable_noop=True),
+        )
+    )
     with vllm.config.set_current_vllm_config(vllm_config):
         noop_pass = NoOpEliminationPass(vllm_config)
         backend = TestBackend(noop_pass)
diff --git a/tests/compile/test_pass_manager.py b/tests/compile/test_pass_manager.py
index 251cc46e9e98..ac561d2e8f84 100644
--- a/tests/compile/test_pass_manager.py
+++ b/tests/compile/test_pass_manager.py
@@ -28,7 +28,6 @@ def test_bad_callable():
 
 # Pass that inherits from InductorPass
 class ProperPass(InductorPass):
-
     def __call__(self, graph: torch.fx.graph.Graph) -> None:
         pass
 
@@ -39,8 +38,7 @@ def __call__(self, graph: torch.fx.graph.Graph) -> None:
         ProperPass(),
         # Can also wrap callables in CallableInductorPass for compliance
         CallableInductorPass(simple_callable),
-        CallableInductorPass(simple_callable,
-                             InductorPass.hash_source(__file__))
+        CallableInductorPass(simple_callable, InductorPass.hash_source(__file__)),
     ],
 )
 def test_pass_manager_uuid(callable):
@@ -65,8 +63,9 @@ def test_pass_manager_uuid(callable):
 
     # UUID should be different due to config change
     config2 = copy.deepcopy(config)
-    config2.compilation_config.pass_config.enable_fusion = not \
-        config2.compilation_config.pass_config.enable_fusion
+    config2.compilation_config.pass_config.enable_fusion = (
+        not config2.compilation_config.pass_config.enable_fusion
+    )
     pass_manager3 = PostGradPassManager()
     pass_manager3.configure(config2)
     pass_manager3.add(callable)
diff --git a/tests/compile/test_sequence_parallelism.py b/tests/compile/test_sequence_parallelism.py
index b2734e915bbb..1d14a89c3a14 100644
--- a/tests/compile/test_sequence_parallelism.py
+++ b/tests/compile/test_sequence_parallelism.py
@@ -12,14 +12,20 @@
 from vllm.compilation.post_cleanup import PostCleanupPass
 from vllm.compilation.sequence_parallelism import SequenceParallelismPass
 from vllm.compilation.vllm_inductor_pass import VllmInductorPass
-from vllm.config import (CompilationConfig, DeviceConfig, ModelConfig,
-                         PassConfig, VllmConfig)
+from vllm.config import (
+    CompilationConfig,
+    DeviceConfig,
+    ModelConfig,
+    PassConfig,
+    VllmConfig,
+)
 from vllm.distributed import tensor_model_parallel_all_reduce
-from vllm.distributed.parallel_state import (init_distributed_environment,
-                                             initialize_model_parallel)
+from vllm.distributed.parallel_state import (
+    init_distributed_environment,
+    initialize_model_parallel,
+)
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    Fp8LinearOp)
+from vllm.model_executor.layers.quantization.utils.w8a8_utils import Fp8LinearOp
 from vllm.platforms import current_platform
 from vllm.utils import update_environment_variables
 
@@ -36,16 +42,15 @@
 
 
 class TestModel(torch.nn.Module):
-
-    def __init__(self,
-                 hidden_size=16,
-                 intermediate_size=32,
-                 vllm_config: VllmConfig = None):
+    def __init__(
+        self, hidden_size=16, intermediate_size=32, vllm_config: VllmConfig = None
+    ):
         super().__init__()
         self.hidden_size = hidden_size
         self.intermediate_size = intermediate_size
         self.gate_proj = torch.nn.Parameter(
-            torch.empty((intermediate_size, hidden_size)))
+            torch.empty((intermediate_size, hidden_size))
+        )
         self.norm = RMSNorm(intermediate_size, 1e-05)
         # Initialize weights
         torch.nn.init.normal_(self.gate_proj, std=0.02)
@@ -53,18 +58,18 @@ def __init__(self,
     def forward(self, hidden_states, residual):
         """
         Forward pass implementing the operations in the FX graph
-        
+
         Args:
             hidden_states: Input tensor
             residual: Residual tensor from previous layer
-            
+
         Returns:
             Tuple containing the output tensor
         """
         # Reshape input
         view = hidden_states.reshape(-1, self.hidden_size)
 
-        #matrix multiplication
+        # matrix multiplication
         permute = self.gate_proj.permute(1, 0)
         mm = torch.mm(view, permute)
 
@@ -82,7 +87,7 @@ def ops_in_model_before(self):
     def ops_in_model_after(self):
         return [
             torch.ops.vllm.reduce_scatter.default,
-            torch.ops.vllm.all_gather.default
+            torch.ops.vllm.all_gather.default,
         ]
 
     def ops_in_model(self):
@@ -90,18 +95,16 @@ def ops_in_model(self):
 
 
 class TestQuantModel(torch.nn.Module):
-
-    def __init__(self,
-                 hidden_size=16,
-                 intermediate_size=32,
-                 vllm_config: VllmConfig = None):
+    def __init__(
+        self, hidden_size=16, intermediate_size=32, vllm_config: VllmConfig = None
+    ):
         super().__init__()
         self.hidden_size = hidden_size
         self.intermediate_size = intermediate_size
         self.vllm_config = vllm_config
-        self.gate_proj = torch.nn.Parameter(torch.empty(
-            (intermediate_size, hidden_size)),
-                                            requires_grad=False)
+        self.gate_proj = torch.nn.Parameter(
+            torch.empty((intermediate_size, hidden_size)), requires_grad=False
+        )
         self.norm = RMSNorm(intermediate_size, 1e-05)
         # Initialize weights
         torch.nn.init.normal_(self.gate_proj, std=0.02)
@@ -111,25 +114,24 @@ def __init__(self,
         self.scale = torch.rand(1, dtype=torch.float32)
         # Create a weight that is compatible with torch._scaled_mm,
         # which expects a column-major layout.
-        self.w = torch.rand(hidden_size,
-                            intermediate_size).to(dtype=FP8_DTYPE).t()
+        self.w = torch.rand(hidden_size, intermediate_size).to(dtype=FP8_DTYPE).t()
         self.wscale = torch.rand(1, dtype=torch.float32)
 
     def forward(self, hidden_states, residual):
         """
         Forward pass implementing the operations in the FX graph
-        
+
         Args:
             hidden_states: Input tensor
             residual: Residual tensor from previous layer
-            
+
         Returns:
             Tuple containing the output tensor
         """
         # Reshape input
         view = hidden_states.reshape(-1, self.hidden_size)
 
-        #matrix multiplication
+        # matrix multiplication
         permute = self.gate_proj.permute(1, 0)
         mm = torch.mm(view, permute)
 
@@ -140,45 +142,51 @@ def forward(self, hidden_states, residual):
         norm_output, residual_output = self.norm(all_reduce, residual)
 
         # scaled_mm with static input quantization
-        fp8_linear_result = self.fp8_linear.apply(norm_output,
-                                                  self.w,
-                                                  self.wscale,
-                                                  input_scale=self.scale.to(
-                                                      norm_output.device))
+        fp8_linear_result = self.fp8_linear.apply(
+            norm_output,
+            self.w,
+            self.wscale,
+            input_scale=self.scale.to(norm_output.device),
+        )
 
         return fp8_linear_result, residual_output
 
     def ops_in_model_before(self):
-        ops_to_remove = [torch.ops.vllm.all_reduce.default
-                         ]  # Always removed by SP
+        ops_to_remove = [torch.ops.vllm.all_reduce.default]  # Always removed by SP
         # The following are only removed if fusion happens
-        if self.vllm_config and self.vllm_config.compilation_config \
-            .pass_config.enable_fusion:
-            ops_to_remove.extend([
-                torch.ops._C.fused_add_rms_norm.default,
-                torch.ops._C.static_scaled_fp8_quant.default,
-            ])
+        if (
+            self.vllm_config
+            and self.vllm_config.compilation_config.pass_config.enable_fusion
+        ):
+            ops_to_remove.extend(
+                [
+                    torch.ops._C.fused_add_rms_norm.default,
+                    torch.ops._C.static_scaled_fp8_quant.default,
+                ]
+            )
         return ops_to_remove
 
     def ops_in_model_after(self):
         ops_to_add = [
             torch.ops.vllm.reduce_scatter.default,
-            torch.ops.vllm.all_gather.default
+            torch.ops.vllm.all_gather.default,
         ]
         # The following is only added if fusion happens
-        if self.vllm_config and self.vllm_config.compilation_config \
-            .pass_config.enable_fusion:
-            ops_to_add.append(
-                torch.ops._C.fused_add_rms_norm_static_fp8_quant.default)
+        if (
+            self.vllm_config
+            and self.vllm_config.compilation_config.pass_config.enable_fusion
+        ):
+            ops_to_add.append(torch.ops._C.fused_add_rms_norm_static_fp8_quant.default)
         return ops_to_add
 
     def ops_in_model(self):
-        if self.vllm_config and self.vllm_config.compilation_config \
-            .pass_config.enable_fusion:
+        if (
+            self.vllm_config
+            and self.vllm_config.compilation_config.pass_config.enable_fusion
+        ):
             # If fusion happens, the fused op is the one
             # we check for (de)functionalization
-            return [torch.ops._C.fused_add_rms_norm_static_fp8_quant.default
-                    ]  # noqa: E501
+            return [torch.ops._C.fused_add_rms_norm_static_fp8_quant.default]  # noqa: E501
         else:
             # If no fusion, the original ops are checked
             return [
@@ -195,30 +203,47 @@ def ops_in_model(self):
 @pytest.mark.parametrize("hidden_size", [16])
 @pytest.mark.parametrize("dtype", [torch.float16, torch.bfloat16])
 @pytest.mark.parametrize("enable_fusion", [True, False])
-@pytest.mark.skipif(envs.VLLM_TARGET_DEVICE not in ["cuda"],
-                    reason="Only test on CUDA")
-def test_sequence_parallelism_pass(test_model_cls: type[torch.nn.Module],
-                                   batch_size: int, seq_len: int,
-                                   hidden_size: int, dtype: torch.dtype,
-                                   enable_fusion: bool):
+@pytest.mark.skipif(envs.VLLM_TARGET_DEVICE not in ["cuda"], reason="Only test on CUDA")
+def test_sequence_parallelism_pass(
+    test_model_cls: type[torch.nn.Module],
+    batch_size: int,
+    seq_len: int,
+    hidden_size: int,
+    dtype: torch.dtype,
+    enable_fusion: bool,
+):
     num_processes = 2
 
     def run_torch_spawn(fn, nprocs):
         # need to use torch.mp.spawn otherwise will have problems with
         # torch.distributed and cuda
-        torch.multiprocessing.spawn(fn,
-                                    args=(num_processes, test_model_cls,
-                                          batch_size, seq_len, hidden_size,
-                                          dtype, enable_fusion),
-                                    nprocs=nprocs)
+        torch.multiprocessing.spawn(
+            fn,
+            args=(
+                num_processes,
+                test_model_cls,
+                batch_size,
+                seq_len,
+                hidden_size,
+                dtype,
+                enable_fusion,
+            ),
+            nprocs=nprocs,
+        )
 
     run_torch_spawn(sequence_parallelism_pass_on_test_model, num_processes)
 
 
 def sequence_parallelism_pass_on_test_model(
-        local_rank: int, world_size: int,
-        test_model_cls: type[torch.nn.Module], batch_size: int, seq_len: int,
-        hidden_size: int, dtype: torch.dtype, enable_fusion: bool):
+    local_rank: int,
+    world_size: int,
+    test_model_cls: type[torch.nn.Module],
+    batch_size: int,
+    seq_len: int,
+    hidden_size: int,
+    dtype: torch.dtype,
+    enable_fusion: bool,
+):
     current_platform.seed_everything(0)
 
     device = torch.device(f"cuda:{local_rank}")
@@ -226,13 +251,15 @@ def sequence_parallelism_pass_on_test_model(
     torch.set_default_device(device)
     torch.set_default_dtype(dtype)
 
-    update_environment_variables({
-        'RANK': str(local_rank),
-        'LOCAL_RANK': str(local_rank),
-        'WORLD_SIZE': str(world_size),
-        'MASTER_ADDR': 'localhost',
-        'MASTER_PORT': '12345',
-    })
+    update_environment_variables(
+        {
+            "RANK": str(local_rank),
+            "LOCAL_RANK": str(local_rank),
+            "WORLD_SIZE": str(world_size),
+            "MASTER_ADDR": "localhost",
+            "MASTER_PORT": "12345",
+        }
+    )
 
     # initialize distributed
     init_distributed_environment()
@@ -240,27 +267,28 @@ def sequence_parallelism_pass_on_test_model(
 
     # configure vllm config for SequenceParallelismPass
     vllm_config = VllmConfig()
-    vllm_config.compilation_config = CompilationConfig(pass_config=PassConfig(
-        enable_sequence_parallelism=True,
-        enable_fusion=enable_fusion,
-        enable_noop=True))  # NoOp needed for fusion
+    vllm_config.compilation_config = CompilationConfig(
+        pass_config=PassConfig(
+            enable_sequence_parallelism=True,
+            enable_fusion=enable_fusion,
+            enable_noop=True,
+        )
+    )  # NoOp needed for fusion
     vllm_config.device_config = DeviceConfig(device=torch.device("cuda"))
 
     # this is a fake model name to construct the model config
     # in the vllm_config, it's not really used.
     model_name = "nm-testing/TinyLlama-1.1B-Chat-v1.0-FP8-e2e"
-    vllm_config.model_config = ModelConfig(model=model_name,
-                                           trust_remote_code=True,
-                                           dtype=dtype,
-                                           seed=42)
+    vllm_config.model_config = ModelConfig(
+        model=model_name, trust_remote_code=True, dtype=dtype, seed=42
+    )
 
     noop_pass = NoOpEliminationPass(vllm_config)
     sequence_parallelism_pass = SequenceParallelismPass(vllm_config)
     func_pass = FixFunctionalizationPass(vllm_config)
     cleanup_pass = PostCleanupPass(vllm_config)
 
-    passes_for_backend: list[VllmInductorPass] = \
-        [noop_pass, sequence_parallelism_pass]
+    passes_for_backend: list[VllmInductorPass] = [noop_pass, sequence_parallelism_pass]
 
     if enable_fusion:
         fusion_pass = RMSNormQuantFusionPass(vllm_config)
@@ -271,12 +299,9 @@ def sequence_parallelism_pass_on_test_model(
     backend_no_func = TestBackend(*passes_for_backend)
     backend_func = TestBackend(*passes_for_backend, func_pass)
 
-    model = test_model_cls(hidden_size,
-                           hidden_size * 2,
-                           vllm_config=vllm_config)
+    model = test_model_cls(hidden_size, hidden_size * 2, vllm_config=vllm_config)
 
-    hidden_states = torch.randn((batch_size * seq_len, hidden_size),
-                                dtype=dtype)
+    hidden_states = torch.randn((batch_size * seq_len, hidden_size), dtype=dtype)
     residual = torch.randn((batch_size * seq_len, hidden_size), dtype=dtype)
 
     compiled_model_no_func = torch.compile(model, backend=backend_no_func)
@@ -297,8 +322,7 @@ def sequence_parallelism_pass_on_test_model(
     # check if the functionalization pass is applied
     for op in model.ops_in_model():
         find_auto_fn(backend_no_func.graph_post_pass.nodes, op)
-        assert find_auto_fn_maybe(backend_func.graph_post_pass.nodes,
-                                  op) is None  # noqa: E501
+        assert find_auto_fn_maybe(backend_func.graph_post_pass.nodes, op) is None  # noqa: E501
 
     # make sure the ops were all de-functionalized
     found = dict()
diff --git a/tests/compile/test_silu_mul_quant_fusion.py b/tests/compile/test_silu_mul_quant_fusion.py
index c445f4dde2cc..7e3a230b5f62 100644
--- a/tests/compile/test_silu_mul_quant_fusion.py
+++ b/tests/compile/test_silu_mul_quant_fusion.py
@@ -8,10 +8,15 @@
 import vllm.envs as envs
 from tests.kernels.quantization.nvfp4_utils import quant_nvfp4_tensor
 from vllm._custom_ops import cutlass_scaled_fp4_mm, scaled_fp4_quant
+
 # yapf conflicts with isort for this block
 # yapf: disable
 from vllm.compilation.activation_quant_fusion import (
-    FUSED_OPS, SILU_MUL_OP, ActivationQuantFusionPass)
+    FUSED_OPS,
+    SILU_MUL_OP,
+    ActivationQuantFusionPass,
+)
+
 # yapf: enable
 from vllm.compilation.fusion import QUANT_OPS
 from vllm.compilation.noop_elimination import NoOpEliminationPass
@@ -19,9 +24,14 @@
 from vllm.config import CompilationConfig, PassConfig, VllmConfig
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape, kFp8StaticTensorSym, kNvfp4Quant)
+    GroupShape,
+    kFp8StaticTensorSym,
+    kNvfp4Quant,
+)
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    Fp8LinearOp, cutlass_fp8_supported)
+    Fp8LinearOp,
+    cutlass_fp8_supported,
+)
 from vllm.platforms import current_platform
 
 from ..utils import override_cutlass_fp8_supported
@@ -36,7 +46,6 @@ def is_nvfp4_supported():
 
 
 class TestSiluMulFp8QuantModel(torch.nn.Module):
-
     def __init__(self, hidden_size: int, cuda_force_torch: bool, **kwargs):
         super().__init__()
         self.silu_and_mul = SiluAndMul()
@@ -53,10 +62,7 @@ def __init__(self, hidden_size: int, cuda_force_torch: bool, **kwargs):
 
     def forward(self, x):
         y = self.silu_and_mul(x)
-        x2 = self.fp8_linear.apply(y,
-                                   self.w,
-                                   self.wscale,
-                                   input_scale=self.wscale)
+        x2 = self.fp8_linear.apply(y, self.w, self.wscale, input_scale=self.wscale)
         return x2
 
     def ops_in_model_before(self):
@@ -67,11 +73,12 @@ def ops_in_model_after(self):
 
 
 class TestSiluMulNvfp4QuantModel(torch.nn.Module):
-
     def __init__(self, hidden_size: int, x: torch.Tensor, **kwargs):
         super().__init__()
         from vllm.compilation.activation_quant_fusion import (
-            silu_and_mul_nvfp4_quant_supported)
+            silu_and_mul_nvfp4_quant_supported,
+        )
+
         assert silu_and_mul_nvfp4_quant_supported
 
         self.silu_and_mul = SiluAndMul()
@@ -88,12 +95,14 @@ def __init__(self, hidden_size: int, x: torch.Tensor, **kwargs):
     def forward(self, x):
         y = self.silu_and_mul(x)
         y_quant, y_block_scale = scaled_fp4_quant(y, self.y_global_scale)
-        out = cutlass_scaled_fp4_mm(a=y_quant,
-                                    b=self.w,
-                                    block_scale_a=y_block_scale,
-                                    block_scale_b=self.w_block_scale,
-                                    alpha=self.alpha,
-                                    out_dtype=y.dtype)
+        out = cutlass_scaled_fp4_mm(
+            a=y_quant,
+            b=self.w,
+            block_scale_a=y_block_scale,
+            block_scale_b=self.w_block_scale,
+            alpha=self.alpha,
+            out_dtype=y.dtype,
+        )
         return out
 
     def ops_in_model_before(self):
@@ -108,16 +117,24 @@ def ops_in_model_after(self):
 @pytest.mark.parametrize("dtype", [torch.bfloat16, torch.float16])
 @pytest.mark.parametrize(
     "model_class",
-    cast(list[type], [TestSiluMulFp8QuantModel, TestSiluMulNvfp4QuantModel]
-         if is_nvfp4_supported() else [TestSiluMulFp8QuantModel]))
+    cast(
+        list[type],
+        [TestSiluMulFp8QuantModel, TestSiluMulNvfp4QuantModel]
+        if is_nvfp4_supported()
+        else [TestSiluMulFp8QuantModel],
+    ),
+)
 # cuda_force_torch used to test torch code path on platforms that
 # cutlass_fp8_supported() == True.
-@pytest.mark.parametrize("cuda_force_torch",
-                         [True, False] if cutlass_fp8_supported() else [True])
-@pytest.mark.skipif(envs.VLLM_TARGET_DEVICE not in ["cuda", "rocm"],
-                    reason="Only test on CUDA and ROCm")
-def test_fusion_silu_and_mul_quant(num_tokens, hidden_size, dtype, model_class,
-                                   cuda_force_torch):
+@pytest.mark.parametrize(
+    "cuda_force_torch", [True, False] if cutlass_fp8_supported() else [True]
+)
+@pytest.mark.skipif(
+    envs.VLLM_TARGET_DEVICE not in ["cuda", "rocm"], reason="Only test on CUDA and ROCm"
+)
+def test_fusion_silu_and_mul_quant(
+    num_tokens, hidden_size, dtype, model_class, cuda_force_torch
+):
     if model_class == TestSiluMulNvfp4QuantModel and cuda_force_torch:
         pytest.skip("Duplicate tests for NVFP4")
 
@@ -129,17 +146,13 @@ def test_fusion_silu_and_mul_quant(num_tokens, hidden_size, dtype, model_class,
     # Reshape pass is needed for the fusion pass to work
     config = VllmConfig()
     config.compilation_config = CompilationConfig(
-        pass_config=PassConfig(enable_fusion=True, enable_noop=True))
+        pass_config=PassConfig(enable_fusion=True, enable_noop=True)
+    )
     fusion_pass = ActivationQuantFusionPass(config)
 
-    passes = [
-        NoOpEliminationPass(config), fusion_pass,
-        PostCleanupPass(config)
-    ]
+    passes = [NoOpEliminationPass(config), fusion_pass, PostCleanupPass(config)]
     backend = TestBackend(*passes)
-    model = model_class(hidden_size=hidden_size,
-                        cuda_force_torch=cuda_force_torch,
-                        x=x)
+    model = model_class(hidden_size=hidden_size, cuda_force_torch=cuda_force_torch, x=x)
 
     # First dimension dynamic
     torch._dynamo.mark_dynamic(x, 0)
@@ -155,10 +168,9 @@ def test_fusion_silu_and_mul_quant(num_tokens, hidden_size, dtype, model_class,
     elif model_class == TestSiluMulNvfp4QuantModel:
         atol, rtol = 1e-1, 1e-1
 
-    torch.testing.assert_close(result[0].to(dtype=dtype),
-                               result2[0].to(dtype=dtype),
-                               atol=atol,
-                               rtol=rtol)
+    torch.testing.assert_close(
+        result[0].to(dtype=dtype), result2[0].to(dtype=dtype), atol=atol, rtol=rtol
+    )
 
     assert fusion_pass.matched_count == 1
 
diff --git a/tests/compile/test_wrapper.py b/tests/compile/test_wrapper.py
index 5e39f6821d16..34db5a999cbd 100644
--- a/tests/compile/test_wrapper.py
+++ b/tests/compile/test_wrapper.py
@@ -10,7 +10,6 @@
 
 
 class MyMod(torch.nn.Module):
-
     def forward(self, x: torch.Tensor, cache: Optional[torch.Tensor] = None):
         if cache is not None:
             return x + cache
@@ -18,12 +17,12 @@ def forward(self, x: torch.Tensor, cache: Optional[torch.Tensor] = None):
 
 
 class MyWrapper(TorchCompileWrapperWithCustomDispatcher):
-
     def __init__(self, model):
         self.model = model
         compiled_callable = torch.compile(self.forward, backend="eager")
-        super().__init__(compiled_callable,
-                         compilation_level=CompilationLevel.DYNAMO_ONCE)
+        super().__init__(
+            compiled_callable, compilation_level=CompilationLevel.DYNAMO_ONCE
+        )
 
     def forward(self, x: torch.Tensor, cache: Optional[torch.Tensor] = None):
         # this is the function to be compiled
@@ -54,10 +53,8 @@ def test_torch_compile_wrapper():
 
         # for new input, dispatch to the compiled code directly
         new_x = torch.tensor([3])
-        assert wrapper(new_x,
-                       None).item() == 6  # dispatch to the first compiled code
-        assert wrapper(
-            new_x, cache).item() == 5  # dispatch to the second compiled code
+        assert wrapper(new_x, None).item() == 6  # dispatch to the first compiled code
+        assert wrapper(new_x, cache).item() == 5  # dispatch to the second compiled code
 
     for wrapper in wrappers:
         # make sure they have independent compiled codes
diff --git a/tests/config/test_config_generation.py b/tests/config/test_config_generation.py
index e37b6b95941e..61c3df0a2348 100644
--- a/tests/config/test_config_generation.py
+++ b/tests/config/test_config_generation.py
@@ -14,8 +14,9 @@ def test_cuda_empty_vs_unset_configs(monkeypatch: pytest.MonkeyPatch):
     """
 
     def create_config():
-        engine_args = EngineArgs(model="deepseek-ai/DeepSeek-V2-Lite",
-                                 trust_remote_code=True)
+        engine_args = EngineArgs(
+            model="deepseek-ai/DeepSeek-V2-Lite", trust_remote_code=True
+        )
         return engine_args.create_engine_config()
 
     # Create config with CUDA_VISIBLE_DEVICES set normally
@@ -34,16 +35,18 @@ def create_config():
     empty_config_dict.pop("instance_id", None)
 
     assert deep_compare(normal_config_dict, empty_config_dict), (
-        "Configs with normal CUDA_VISIBLE_DEVICES and CUDA_VISIBLE_DEVICES=\"\""
-        " should be equivalent")
+        'Configs with normal CUDA_VISIBLE_DEVICES and CUDA_VISIBLE_DEVICES=""'
+        " should be equivalent"
+    )
 
 
 def test_ray_runtime_env(monkeypatch: pytest.MonkeyPatch):
     # In testing, this method needs to be nested inside as ray does not
     # see the test module.
     def create_config():
-        engine_args = EngineArgs(model="deepseek-ai/DeepSeek-V2-Lite",
-                                 trust_remote_code=True)
+        engine_args = EngineArgs(
+            model="deepseek-ai/DeepSeek-V2-Lite", trust_remote_code=True
+        )
         return engine_args.create_engine_config()
 
     config = create_config()
@@ -51,6 +54,7 @@ def create_config():
     assert parallel_config.ray_runtime_env is None
 
     import ray
+
     ray.init()
 
     runtime_env = {
@@ -59,13 +63,13 @@ def create_config():
         },
     }
 
-    config_ref = ray.remote(create_config).options(
-        runtime_env=runtime_env).remote()
+    config_ref = ray.remote(create_config).options(runtime_env=runtime_env).remote()
 
     config = ray.get(config_ref)
     parallel_config = config.parallel_config
     assert parallel_config.ray_runtime_env is not None
-    assert parallel_config.ray_runtime_env.env_vars().get(
-        "TEST_ENV_VAR") == "test_value"
+    assert (
+        parallel_config.ray_runtime_env.env_vars().get("TEST_ENV_VAR") == "test_value"
+    )
 
     ray.shutdown()
diff --git a/tests/config/test_mp_reducer.py b/tests/config/test_mp_reducer.py
index d4d4be293280..9c03f26c504e 100644
--- a/tests/config/test_mp_reducer.py
+++ b/tests/config/test_mp_reducer.py
@@ -16,13 +16,13 @@ def test_mp_reducer(monkeypatch):
     """
 
     # Use V1 AsyncLLM which calls maybe_register_config_serialize_by_value
-    monkeypatch.setenv('VLLM_USE_V1', '1')
+    monkeypatch.setenv("VLLM_USE_V1", "1")
 
     # Ensure transformers_modules is not in sys.modules
-    if 'transformers_modules' in sys.modules:
-        del sys.modules['transformers_modules']
+    if "transformers_modules" in sys.modules:
+        del sys.modules["transformers_modules"]
 
-    with patch('multiprocessing.reducer.register') as mock_register:
+    with patch("multiprocessing.reducer.register") as mock_register:
         engine_args = AsyncEngineArgs(
             model="facebook/opt-125m",
             max_model_len=32,
@@ -36,7 +36,8 @@ def test_mp_reducer(monkeypatch):
         )
 
         assert mock_register.called, (
-            "multiprocessing.reducer.register should have been called")
+            "multiprocessing.reducer.register should have been called"
+        )
 
         vllm_config_registered = False
         for call_args in mock_register.call_args_list:
@@ -45,8 +46,7 @@ def test_mp_reducer(monkeypatch):
                 vllm_config_registered = True
 
                 reducer_func = call_args[0][1]
-                assert callable(
-                    reducer_func), "Reducer function should be callable"
+                assert callable(reducer_func), "Reducer function should be callable"
                 break
 
         assert vllm_config_registered, (
diff --git a/tests/conftest.py b/tests/conftest.py
index fd48c66341bb..3ff3e061cdf3 100644
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -30,22 +30,27 @@
 import torch.nn.functional as F
 from huggingface_hub import snapshot_download
 from PIL import Image
-from transformers import (AutoConfig, AutoModelForCausalLM, AutoTokenizer,
-                          BatchEncoding, BatchFeature)
+from transformers import (
+    AutoConfig,
+    AutoModelForCausalLM,
+    AutoTokenizer,
+    BatchEncoding,
+    BatchFeature,
+)
 from transformers.models.auto.auto_factory import _BaseAutoModelClass
 
-from tests.models.utils import (TokensTextLogprobs,
-                                TokensTextLogprobsPromptLogprobs)
+from tests.models.utils import TokensTextLogprobs, TokensTextLogprobsPromptLogprobs
 from vllm import LLM, SamplingParams
 from vllm.assets.audio import AudioAsset
 from vllm.assets.image import ImageAsset
 from vllm.assets.video import VideoAsset
-from vllm.config.model import (ConvertOption, RunnerOption,
-                               _get_and_verify_dtype)
+from vllm.config.model import ConvertOption, RunnerOption, _get_and_verify_dtype
 from vllm.connections import global_http_connection
-from vllm.distributed import (cleanup_dist_env_and_memory,
-                              init_distributed_environment,
-                              initialize_model_parallel)
+from vllm.distributed import (
+    cleanup_dist_env_and_memory,
+    init_distributed_environment,
+    initialize_model_parallel,
+)
 from vllm.logger import init_logger
 from vllm.logprobs import Logprob
 from vllm.multimodal.utils import fetch_image
@@ -82,12 +87,13 @@ class ImageAssetPrompts(TypedDict):
 
 
 class ImageTestAssets(list[ImageAsset]):
-
     def __init__(self) -> None:
-        super().__init__([
-            ImageAsset("stop_sign"),
-            ImageAsset("cherry_blossom"),
-        ])
+        super().__init__(
+            [
+                ImageAsset("stop_sign"),
+                ImageAsset("cherry_blossom"),
+            ]
+        )
 
     def prompts(self, prompts: ImageAssetPrompts) -> list[str]:
         """
@@ -104,11 +110,12 @@ class VideoAssetPrompts(TypedDict):
 
 
 class VideoTestAssets(list[VideoAsset]):
-
     def __init__(self) -> None:
-        super().__init__([
-            VideoAsset("baby_reading"),
-        ])
+        super().__init__(
+            [
+                VideoAsset("baby_reading"),
+            ]
+        )
 
     def prompts(self, prompts: VideoAssetPrompts) -> list[str]:
         return [prompts["baby_reading"]]
@@ -120,12 +127,13 @@ class AudioAssetPrompts(TypedDict):
 
 
 class AudioTestAssets(list[AudioAsset]):
-
     def __init__(self) -> None:
-        super().__init__([
-            AudioAsset("mary_had_lamb"),
-            AudioAsset("winning_call"),
-        ])
+        super().__init__(
+            [
+                AudioAsset("mary_had_lamb"),
+                AudioAsset("winning_call"),
+            ]
+        )
 
     def prompts(self, prompts: AudioAssetPrompts) -> list[str]:
         return [prompts["mary_had_lamb"], prompts["winning_call"]]
@@ -220,6 +228,7 @@ def example_system_message() -> str:
 
 class DecoderPromptType(Enum):
     """For encoder/decoder models only."""
+
     CUSTOM = 1
     NONE = 2
     EMPTY_STR = 3
@@ -253,15 +262,13 @@ def audio_assets() -> AudioTestAssets:
 
 
 class HfRunner:
-
     def get_default_device(self):
         from vllm.platforms import current_platform
 
-        return ("cpu"
-                if current_platform.is_cpu() else current_platform.device_type)
+        return "cpu" if current_platform.is_cpu() else current_platform.device_type
 
     def wrap_device(self, x: _T, device: Optional[str] = None) -> _T:
-        if x is None or isinstance(x, (bool, )):
+        if x is None or isinstance(x, (bool,)):
             return x
 
         if device is None:
@@ -289,8 +296,11 @@ def __init__(
         # Set this to avoid hanging issue
         default_torch_num_threads: Optional[int] = None,
     ) -> None:
-        init_ctx = (nullcontext() if default_torch_num_threads is None else
-                    set_default_torch_num_threads(default_torch_num_threads))
+        init_ctx = (
+            nullcontext()
+            if default_torch_num_threads is None
+            else set_default_torch_num_threads(default_torch_num_threads)
+        )
 
         with init_ctx:
             self._init(
@@ -362,14 +372,15 @@ def _init(
             )
 
             # in case some unquantized custom models are not in same dtype
-            if (getattr(model, "quantization_method", None) is None
-                    and any(p.dtype != self.dtype
-                            for p in model.parameters())):
+            if getattr(model, "quantization_method", None) is None and any(
+                p.dtype != self.dtype for p in model.parameters()
+            ):
                 model = model.to(dtype=self.dtype)
 
-            if (getattr(model, "quantization_method", None) != "bitsandbytes"
-                    and len({p.device
-                             for p in model.parameters()}) < 2):
+            if (
+                getattr(model, "quantization_method", None) != "bitsandbytes"
+                and len({p.device for p in model.parameters()}) < 2
+            ):
                 model = model.to(device=self.device)
 
             self.model = model
@@ -384,6 +395,7 @@ def _init(
         # don't put this import at the top level
         # it will call torch.cuda.device_count()
         from transformers import AutoProcessor  # noqa: F401
+
         self.processor = AutoProcessor.from_pretrained(
             model_name,
             torch_dtype=torch_dtype,
@@ -471,10 +483,9 @@ def generate(
         audios: Optional[PromptAudioInput] = None,
         **kwargs: Any,
     ) -> list[tuple[list[list[int]], list[str]]]:
-        all_inputs = self.get_inputs(prompts,
-                                     images=images,
-                                     videos=videos,
-                                     audios=audios)
+        all_inputs = self.get_inputs(
+            prompts, images=images, videos=videos, audios=audios
+        )
 
         outputs: list[tuple[list[list[int]], list[str]]] = []
         for inputs in all_inputs:
@@ -501,16 +512,17 @@ def generate_greedy(
         audios: Optional[PromptAudioInput] = None,
         **kwargs: Any,
     ) -> list[tuple[list[int], str]]:
-        outputs = self.generate(prompts,
-                                do_sample=False,
-                                max_new_tokens=max_tokens,
-                                images=images,
-                                videos=videos,
-                                audios=audios,
-                                **kwargs)
+        outputs = self.generate(
+            prompts,
+            do_sample=False,
+            max_new_tokens=max_tokens,
+            images=images,
+            videos=videos,
+            audios=audios,
+            **kwargs,
+        )
 
-        return [(output_ids[0], output_str[0])
-                for output_ids, output_str in outputs]
+        return [(output_ids[0], output_str[0]) for output_ids, output_str in outputs]
 
     def generate_beam_search(
         self,
@@ -521,21 +533,22 @@ def generate_beam_search(
         videos: Optional[PromptVideoInput] = None,
         audios: Optional[PromptAudioInput] = None,
     ) -> list[tuple[list[list[int]], list[str]]]:
-        outputs = self.generate(prompts,
-                                do_sample=False,
-                                max_new_tokens=max_tokens,
-                                num_beams=beam_width,
-                                num_return_sequences=beam_width,
-                                images=images,
-                                videos=videos,
-                                audios=audios)
+        outputs = self.generate(
+            prompts,
+            do_sample=False,
+            max_new_tokens=max_tokens,
+            num_beams=beam_width,
+            num_return_sequences=beam_width,
+            images=images,
+            videos=videos,
+            audios=audios,
+        )
 
         for i in range(len(outputs)):
             output_ids, output_str = outputs[i]
             for j in range(len(output_ids)):
                 output_ids[j] = [
-                    x for x in output_ids[j]
-                    if x != self.tokenizer.pad_token_id
+                    x for x in output_ids[j] if x != self.tokenizer.pad_token_id
                 ]
             outputs[i] = (output_ids, output_str)
         return outputs
@@ -549,10 +562,9 @@ def generate_greedy_logprobs(
         audios: Optional[PromptAudioInput] = None,
         **kwargs: Any,
     ) -> list[list[torch.Tensor]]:
-        all_inputs = self.get_inputs(prompts,
-                                     images=images,
-                                     videos=videos,
-                                     audios=audios)
+        all_inputs = self.get_inputs(
+            prompts, images=images, videos=videos, audios=audios
+        )
 
         all_logprobs: list[list[torch.Tensor]] = []
         for inputs in all_inputs:
@@ -565,8 +577,7 @@ def generate_greedy_logprobs(
                 return_dict_in_generate=True,
                 **kwargs,
             )
-            seq_logprobs = self._hidden_states_to_seq_logprobs(
-                output.hidden_states)
+            seq_logprobs = self._hidden_states_to_seq_logprobs(output.hidden_states)
             all_logprobs.append(seq_logprobs)
         return all_logprobs
 
@@ -630,10 +641,9 @@ def generate_greedy_logprobs_limit(
         videos: Optional[PromptVideoInput] = None,
         **kwargs: Any,
     ) -> list[TokensTextLogprobs]:
-        all_inputs = self.get_inputs(prompts,
-                                     images=images,
-                                     videos=videos,
-                                     audios=audios)
+        all_inputs = self.get_inputs(
+            prompts, images=images, videos=videos, audios=audios
+        )
 
         all_logprobs: list[list[dict[int, float]]] = []
         all_output_ids: list[list[int]] = []
@@ -653,8 +663,7 @@ def generate_greedy_logprobs_limit(
             (
                 seq_logprobs_lst,
                 output_len,
-            ) = self._hidden_states_to_logprobs(output.hidden_states,
-                                                num_logprobs)
+            ) = self._hidden_states_to_logprobs(output.hidden_states, num_logprobs)
 
             all_logprobs.append(seq_logprobs_lst)
             seq_ids = output.sequences[0]
@@ -664,19 +673,16 @@ def generate_greedy_logprobs_limit(
             all_output_strs.append(self.tokenizer.decode(output_ids))
 
         outputs = zip(all_output_ids, all_output_strs, all_logprobs)
-        return [(output_ids, output_str, output_logprobs)
-                for output_ids, output_str, output_logprobs in outputs]
+        return [
+            (output_ids, output_str, output_logprobs)
+            for output_ids, output_str, output_logprobs in outputs
+        ]
 
-    def encode(self, prompts: list[str], *args,
-               **kwargs) -> list[list[torch.Tensor]]:
+    def encode(self, prompts: list[str], *args, **kwargs) -> list[list[torch.Tensor]]:
         return self.model.encode(prompts, *args, **kwargs)
 
-    def predict(self, prompts: list[list[str]], *args,
-                **kwargs) -> torch.Tensor:
-        return self.model.predict(prompts,
-                                  *args,
-                                  convert_to_tensor=True,
-                                  **kwargs)
+    def predict(self, prompts: list[list[str]], *args, **kwargs) -> torch.Tensor:
+        return self.model.predict(prompts, *args, convert_to_tensor=True, **kwargs)
 
     def __enter__(self):
         return self
@@ -727,8 +733,11 @@ def __init__(
         default_torch_num_threads: Optional[int] = None,
         **kwargs,
     ) -> None:
-        init_ctx = (nullcontext() if default_torch_num_threads is None else
-                    set_default_torch_num_threads(default_torch_num_threads))
+        init_ctx = (
+            nullcontext()
+            if default_torch_num_threads is None
+            else set_default_torch_num_threads(default_torch_num_threads)
+        )
 
         if not kwargs.get("compilation_config", None):
             kwargs["compilation_config"] = {"cudagraph_capture_sizes": [4]}
@@ -760,11 +769,12 @@ def get_inputs(
         videos: Optional[PromptVideoInput] = None,
         audios: Optional[PromptAudioInput] = None,
     ) -> list[dict[str, Any]]:
-        if any(x is not None and len(x) != len(prompts)
-               for x in [images, videos, audios]):
+        if any(
+            x is not None and len(x) != len(prompts) for x in [images, videos, audios]
+        ):
             raise ValueError(
-                "All non-None multimodal inputs must have the same length as "
-                "prompts")
+                "All non-None multimodal inputs must have the same length as prompts"
+            )
 
         inputs = list[dict[str, Any]]()
         for i, prompt in enumerate(prompts):
@@ -800,14 +810,11 @@ def generate(
         audios: Optional[PromptAudioInput] = None,
         **kwargs: Any,
     ) -> list[tuple[list[list[int]], list[str]]]:
-        inputs = self.get_inputs(prompts,
-                                 images=images,
-                                 videos=videos,
-                                 audios=audios)
+        inputs = self.get_inputs(prompts, images=images, videos=videos, audios=audios)
 
-        req_outputs = self.llm.generate(inputs,
-                                        sampling_params=sampling_params,
-                                        **kwargs)
+        req_outputs = self.llm.generate(
+            inputs, sampling_params=sampling_params, **kwargs
+        )
 
         outputs: list[tuple[list[list[int]], list[str]]] = []
         for req_output in req_outputs:
@@ -834,8 +841,9 @@ def _final_steps_generate_w_logprobs(
                 output_str = sample.text
                 output_ids = list(sample.token_ids)
                 output_logprobs = sample.logprobs
-            outputs.append((output_ids, output_str, output_logprobs,
-                            req_output.prompt_logprobs))
+            outputs.append(
+                (output_ids, output_str, output_logprobs, req_output.prompt_logprobs)
+            )
         return outputs
 
     def generate_w_logprobs(
@@ -846,23 +854,22 @@ def generate_w_logprobs(
         audios: Optional[PromptAudioInput] = None,
         videos: Optional[PromptVideoInput] = None,
         **kwargs: Any,
-    ) -> Union[list[TokensTextLogprobs],
-               list[TokensTextLogprobsPromptLogprobs]]:
-        inputs = self.get_inputs(prompts,
-                                 images=images,
-                                 videos=videos,
-                                 audios=audios)
-
-        req_outputs = self.llm.generate(inputs,
-                                        sampling_params=sampling_params,
-                                        **kwargs)
-
-        toks_str_logsprobs_prompt_logprobs = (
-            self._final_steps_generate_w_logprobs(req_outputs))
+    ) -> Union[list[TokensTextLogprobs], list[TokensTextLogprobsPromptLogprobs]]:
+        inputs = self.get_inputs(prompts, images=images, videos=videos, audios=audios)
+
+        req_outputs = self.llm.generate(
+            inputs, sampling_params=sampling_params, **kwargs
+        )
+
+        toks_str_logsprobs_prompt_logprobs = self._final_steps_generate_w_logprobs(
+            req_outputs
+        )
         # Omit prompt logprobs if not required by sampling params
-        return ([x[0:-1] for x in toks_str_logsprobs_prompt_logprobs]
-                if sampling_params.prompt_logprobs is None else
-                toks_str_logsprobs_prompt_logprobs)
+        return (
+            [x[0:-1] for x in toks_str_logsprobs_prompt_logprobs]
+            if sampling_params.prompt_logprobs is None
+            else toks_str_logsprobs_prompt_logprobs
+        )
 
     def generate_greedy(
         self,
@@ -874,14 +881,15 @@ def generate_greedy(
         **kwargs: Any,
     ) -> list[tuple[list[int], str]]:
         greedy_params = SamplingParams(temperature=0.0, max_tokens=max_tokens)
-        outputs = self.generate(prompts,
-                                greedy_params,
-                                images=images,
-                                videos=videos,
-                                audios=audios,
-                                **kwargs)
-        return [(output_ids[0], output_str[0])
-                for output_ids, output_str in outputs]
+        outputs = self.generate(
+            prompts,
+            greedy_params,
+            images=images,
+            videos=videos,
+            audios=audios,
+            **kwargs,
+        )
+        return [(output_ids[0], output_str[0]) for output_ids, output_str in outputs]
 
     def generate_greedy_logprobs(
         self,
@@ -895,22 +903,24 @@ def generate_greedy_logprobs(
         stop_token_ids: Optional[list[int]] = None,
         stop: Optional[list[str]] = None,
         **kwargs: Any,
-    ) -> Union[list[TokensTextLogprobs],
-               list[TokensTextLogprobsPromptLogprobs]]:
+    ) -> Union[list[TokensTextLogprobs], list[TokensTextLogprobsPromptLogprobs]]:
         greedy_logprobs_params = SamplingParams(
             temperature=0.0,
             max_tokens=max_tokens,
             logprobs=num_logprobs,
             prompt_logprobs=num_prompt_logprobs,
             stop_token_ids=stop_token_ids,
-            stop=stop)
+            stop=stop,
+        )
 
-        return self.generate_w_logprobs(prompts,
-                                        greedy_logprobs_params,
-                                        images=images,
-                                        audios=audios,
-                                        videos=videos,
-                                        **kwargs)
+        return self.generate_w_logprobs(
+            prompts,
+            greedy_logprobs_params,
+            images=images,
+            audios=audios,
+            videos=videos,
+            **kwargs,
+        )
 
     def generate_prompt_perplexity(self, prompts: list[str]) -> list[float]:
         """
@@ -919,10 +929,9 @@ def generate_prompt_perplexity(self, prompts: list[str]) -> list[float]:
         :param prompts: list of prompts to score
         :return: perplexity score of each prompt
         """
-        outputs = self.generate_greedy_logprobs(prompts,
-                                                max_tokens=1,
-                                                num_logprobs=None,
-                                                num_prompt_logprobs=0)
+        outputs = self.generate_greedy_logprobs(
+            prompts, max_tokens=1, num_logprobs=None, num_prompt_logprobs=0
+        )
 
         perplexities = []
         for output in outputs:
@@ -951,15 +960,13 @@ def generate_beam_search(
         audios: Optional[PromptAudioInput] = None,
         concurrency_limit: Optional[int] = None,
     ) -> list[tuple[list[list[int]], list[str]]]:
-        inputs = self.get_inputs(prompts,
-                                 images=images,
-                                 videos=videos,
-                                 audios=audios)
-
-        outputs = self.llm.beam_search(inputs,
-                                       BeamSearchParams(beam_width=beam_width,
-                                                        max_tokens=max_tokens),
-                                       concurrency_limit=concurrency_limit)
+        inputs = self.get_inputs(prompts, images=images, videos=videos, audios=audios)
+
+        outputs = self.llm.beam_search(
+            inputs,
+            BeamSearchParams(beam_width=beam_width, max_tokens=max_tokens),
+            concurrency_limit=concurrency_limit,
+        )
         returned_outputs = []
         for output in outputs:
             token_ids = [x.tokens for x in output.sequences]
@@ -971,17 +978,16 @@ def classify(self, prompts: list[str]) -> list[list[float]]:
         req_outputs = self.llm.classify(prompts)
         return [req_output.outputs.probs for req_output in req_outputs]
 
-    def embed(self,
-              prompts: list[str],
-              images: Optional[PromptImageInput] = None,
-              videos: Optional[PromptVideoInput] = None,
-              audios: Optional[PromptAudioInput] = None,
-              *args,
-              **kwargs) -> list[list[float]]:
-        inputs = self.get_inputs(prompts,
-                                 images=images,
-                                 videos=videos,
-                                 audios=audios)
+    def embed(
+        self,
+        prompts: list[str],
+        images: Optional[PromptImageInput] = None,
+        videos: Optional[PromptVideoInput] = None,
+        audios: Optional[PromptAudioInput] = None,
+        *args,
+        **kwargs,
+    ) -> list[list[float]]:
+        inputs = self.get_inputs(prompts, images=images, videos=videos, audios=audios)
 
         req_outputs = self.llm.embed(inputs, *args, **kwargs)
         return [req_output.outputs.embedding for req_output in req_outputs]
@@ -1026,6 +1032,7 @@ def vllm_runner():
 @pytest.fixture()
 def temporary_enable_log_propagate():
     import logging
+
     logger = logging.getLogger("vllm")
     logger.propagate = True
     yield
@@ -1045,6 +1052,7 @@ def num_gpus_available():
     in current process."""
 
     from vllm.platforms import current_platform
+
     return current_platform.device_count()
 
 
@@ -1058,12 +1066,11 @@ def num_gpus_available():
 def dummy_opt_path():
     json_path = os.path.join(_dummy_opt_path, "config.json")
     if not os.path.exists(_dummy_opt_path):
-        snapshot_download(repo_id="facebook/opt-125m",
-                          local_dir=_dummy_opt_path,
-                          ignore_patterns=[
-                              "*.bin", "*.bin.index.json", "*.pt", "*.h5",
-                              "*.msgpack"
-                          ])
+        snapshot_download(
+            repo_id="facebook/opt-125m",
+            local_dir=_dummy_opt_path,
+            ignore_patterns=["*.bin", "*.bin.index.json", "*.pt", "*.h5", "*.msgpack"],
+        )
         assert os.path.exists(json_path)
         with open(json_path) as f:
             config = json.load(f)
@@ -1077,12 +1084,18 @@ def dummy_opt_path():
 def dummy_llava_path():
     json_path = os.path.join(_dummy_llava_path, "config.json")
     if not os.path.exists(_dummy_llava_path):
-        snapshot_download(repo_id="llava-hf/llava-1.5-7b-hf",
-                          local_dir=_dummy_llava_path,
-                          ignore_patterns=[
-                              "*.bin", "*.bin.index.json", "*.pt", "*.h5",
-                              "*.msgpack", "*.safetensors"
-                          ])
+        snapshot_download(
+            repo_id="llava-hf/llava-1.5-7b-hf",
+            local_dir=_dummy_llava_path,
+            ignore_patterns=[
+                "*.bin",
+                "*.bin.index.json",
+                "*.pt",
+                "*.h5",
+                "*.msgpack",
+                "*.safetensors",
+            ],
+        )
         assert os.path.exists(json_path)
         with open(json_path) as f:
             config = json.load(f)
@@ -1096,12 +1109,18 @@ def dummy_llava_path():
 def dummy_gemma2_embedding_path():
     json_path = os.path.join(_dummy_gemma2_embedding_path, "config.json")
     if not os.path.exists(_dummy_gemma2_embedding_path):
-        snapshot_download(repo_id="BAAI/bge-multilingual-gemma2",
-                          local_dir=_dummy_gemma2_embedding_path,
-                          ignore_patterns=[
-                              "*.bin", "*.bin.index.json", "*.pt", "*.h5",
-                              "*.msgpack", "*.safetensors"
-                          ])
+        snapshot_download(
+            repo_id="BAAI/bge-multilingual-gemma2",
+            local_dir=_dummy_gemma2_embedding_path,
+            ignore_patterns=[
+                "*.bin",
+                "*.bin.index.json",
+                "*.pt",
+                "*.h5",
+                "*.msgpack",
+                "*.safetensors",
+            ],
+        )
         assert os.path.exists(json_path)
         with open(json_path) as f:
             config = json.load(f)
@@ -1114,10 +1133,9 @@ def dummy_gemma2_embedding_path():
 # Add the flag `--optional` to allow run tests
 # that are marked with @pytest.mark.optional
 def pytest_addoption(parser):
-    parser.addoption("--optional",
-                     action="store_true",
-                     default=False,
-                     help="run optional test")
+    parser.addoption(
+        "--optional", action="store_true", default=False, help="run optional test"
+    )
 
 
 def pytest_collection_modifyitems(config, items):
@@ -1185,7 +1203,6 @@ def _find_free_port() -> int:
 
 
 class LocalAssetServer:
-
     address: str
     port: int
     server: Optional[http.server.ThreadingHTTPServer]
@@ -1200,9 +1217,9 @@ def __init__(self, address: str = "127.0.0.1") -> None:
     def __enter__(self):
         self.port = _find_free_port()
         self.server = http.server.ThreadingHTTPServer(
-            (self.address, self.port), AssetHandler)
-        self.thread = threading.Thread(target=self.server.serve_forever,
-                                       daemon=True)
+            (self.address, self.port), AssetHandler
+        )
+        self.thread = threading.Thread(target=self.server.serve_forever, daemon=True)
         self.thread.start()
         return self
 
@@ -1236,7 +1253,7 @@ def get_image_asset(self, name: str) -> Image.Image:
 @pytest.fixture(scope="session")
 def local_asset_server() -> Generator[LocalAssetServer, None, None]:
     """
-    Starts a thread based HTTP server bound to 127.0.0.1 on a random free port. 
+    Starts a thread based HTTP server bound to 127.0.0.1 on a random free port.
     The server currently servers images at:
     http://127.0.0.1:<port>/<name>.<ext>
     """
diff --git a/tests/cuda/test_cuda_context.py b/tests/cuda/test_cuda_context.py
index f973b284b87e..6336f2112c66 100644
--- a/tests/cuda/test_cuda_context.py
+++ b/tests/cuda/test_cuda_context.py
@@ -13,7 +13,7 @@
 def check_cuda_context():
     """Check CUDA driver context status"""
     try:
-        cuda = ctypes.CDLL('libcuda.so')
+        cuda = ctypes.CDLL("libcuda.so")
         device = ctypes.c_int()
         result = cuda.cuCtxGetDevice(ctypes.byref(device))
         return (True, device.value) if result == 0 else (False, None)
@@ -27,9 +27,11 @@ def run_cuda_test_in_thread(device_input, expected_device_id):
         # New thread should have no CUDA context initially
         valid_before, device_before = check_cuda_context()
         if valid_before:
-            return False, \
-                "CUDA context should not exist in new thread, " \
-                f"got device {device_before}"
+            return (
+                False,
+                "CUDA context should not exist in new thread, "
+                f"got device {device_before}",
+            )
 
         # Test setting CUDA context
         current_platform.set_device(device_input)
@@ -39,8 +41,7 @@ def run_cuda_test_in_thread(device_input, expected_device_id):
         if not valid_after:
             return False, "CUDA context should be valid after set_cuda_context"
         if device_id != expected_device_id:
-            return False, \
-                f"Expected device {expected_device_id}, got {device_id}"
+            return False, f"Expected device {expected_device_id}, got {device_id}"
 
         return True, "Success"
     except Exception as e:
@@ -50,30 +51,30 @@ def run_cuda_test_in_thread(device_input, expected_device_id):
 class TestSetCudaContext:
     """Test suite for the set_cuda_context function."""
 
-    @pytest.mark.skipif(not current_platform.is_cuda(),
-                        reason="CUDA not available")
-    @pytest.mark.parametrize(argnames="device_input,expected_device_id",
-                             argvalues=[
-                                 (0, 0),
-                                 (torch.device('cuda:0'), 0),
-                                 ('cuda:0', 0),
-                             ],
-                             ids=["int", "torch_device", "string"])
-    def test_set_cuda_context_parametrized(self, device_input,
-                                           expected_device_id):
+    @pytest.mark.skipif(not current_platform.is_cuda(), reason="CUDA not available")
+    @pytest.mark.parametrize(
+        argnames="device_input,expected_device_id",
+        argvalues=[
+            (0, 0),
+            (torch.device("cuda:0"), 0),
+            ("cuda:0", 0),
+        ],
+        ids=["int", "torch_device", "string"],
+    )
+    def test_set_cuda_context_parametrized(self, device_input, expected_device_id):
         """Test setting CUDA context in isolated threads."""
         with ThreadPoolExecutor(max_workers=1) as executor:
-            future = executor.submit(run_cuda_test_in_thread, device_input,
-                                     expected_device_id)
+            future = executor.submit(
+                run_cuda_test_in_thread, device_input, expected_device_id
+            )
             success, message = future.result(timeout=30)
         assert success, message
 
-    @pytest.mark.skipif(not current_platform.is_cuda(),
-                        reason="CUDA not available")
+    @pytest.mark.skipif(not current_platform.is_cuda(), reason="CUDA not available")
     def test_set_cuda_context_invalid_device_type(self):
         """Test error handling for invalid device type."""
         with pytest.raises(ValueError, match="Expected a cuda device"):
-            current_platform.set_device(torch.device('cpu'))
+            current_platform.set_device(torch.device("cpu"))
 
 
 if __name__ == "__main__":
diff --git a/tests/detokenizer/test_disable_detokenization.py b/tests/detokenizer/test_disable_detokenization.py
index ae06a985c7ec..a77626df5dc7 100644
--- a/tests/detokenizer/test_disable_detokenization.py
+++ b/tests/detokenizer/test_disable_detokenization.py
@@ -17,20 +17,16 @@ def test_computed_prefix_blocks(model: str):
     prompt = (
         "You are a helpful assistant. How do I build a car from cardboard and "
         "paper clips? Is there an easy to follow video tutorial available "
-        "online for free?")
+        "online for free?"
+    )
 
     llm = LLM(model=model)
-    sampling_params = SamplingParams(max_tokens=10,
-                                     temperature=0.0,
-                                     detokenize=False)
+    sampling_params = SamplingParams(max_tokens=10, temperature=0.0, detokenize=False)
 
-    outputs_no_detokenization = llm.generate(prompt,
-                                             sampling_params)[0].outputs[0]
+    outputs_no_detokenization = llm.generate(prompt, sampling_params)[0].outputs[0]
     sampling_params.detokenize = True
-    outputs_with_detokenization = llm.generate(prompt,
-                                               sampling_params)[0].outputs[0]
+    outputs_with_detokenization = llm.generate(prompt, sampling_params)[0].outputs[0]
 
-    assert outputs_no_detokenization.text == ''
-    assert outputs_with_detokenization.text != ''
-    assert outputs_no_detokenization.token_ids == \
-        outputs_with_detokenization.token_ids
+    assert outputs_no_detokenization.text == ""
+    assert outputs_with_detokenization.text != ""
+    assert outputs_no_detokenization.token_ids == outputs_with_detokenization.token_ids
diff --git a/tests/detokenizer/test_min_tokens.py b/tests/detokenizer/test_min_tokens.py
index 26003373c569..1f8e944695bd 100644
--- a/tests/detokenizer/test_min_tokens.py
+++ b/tests/detokenizer/test_min_tokens.py
@@ -8,15 +8,17 @@
 from vllm.v1.engine import EngineCoreRequest
 from vllm.v1.engine.detokenizer import FastIncrementalDetokenizer
 
-PROMPT = "Hello, my name is Lee, and I'm a student in the " + \
-         "college of engineering"
+PROMPT = "Hello, my name is Lee, and I'm a student in the " + "college of engineering"
 
 
-@pytest.mark.parametrize("min_tokens,stop,truth", [
-    (0, None, " is Lee, and I'm a student in the college of engineering"),
-    (0, "e", " is L"),
-    (5, "e", " is Lee, and I'm a stud"),
-])
+@pytest.mark.parametrize(
+    "min_tokens,stop,truth",
+    [
+        (0, None, " is Lee, and I'm a student in the college of engineering"),
+        (0, "e", " is L"),
+        (5, "e", " is Lee, and I'm a stud"),
+    ],
+)
 def test_min_tokens_with_stop(min_tokens: int, stop: str, truth: str):
     """Test for a specific min_tokens and stop.
 
@@ -31,16 +33,18 @@ def test_min_tokens_with_stop(min_tokens: int, stop: str, truth: str):
         stop=stop,
         min_tokens=min_tokens,
     )
-    request = EngineCoreRequest(request_id="",
-                                prompt_token_ids=prompt_token_ids,
-                                mm_features=None,
-                                sampling_params=params,
-                                pooling_params=None,
-                                eos_token_id=None,
-                                arrival_time=0.0,
-                                lora_request=None,
-                                cache_salt=None,
-                                data_parallel_rank=None)
+    request = EngineCoreRequest(
+        request_id="",
+        prompt_token_ids=prompt_token_ids,
+        mm_features=None,
+        sampling_params=params,
+        pooling_params=None,
+        eos_token_id=None,
+        arrival_time=0.0,
+        lora_request=None,
+        cache_salt=None,
+        data_parallel_rank=None,
+    )
 
     detokenizer = FastIncrementalDetokenizer(tokenizer, request)
 
diff --git a/tests/detokenizer/test_stop_reason.py b/tests/detokenizer/test_stop_reason.py
index 1ff679789c95..6565949cc50f 100644
--- a/tests/detokenizer/test_stop_reason.py
+++ b/tests/detokenizer/test_stop_reason.py
@@ -31,34 +31,39 @@ def test_stop_reason(vllm_model, example_prompts):
     llm = vllm_model.llm
 
     # test stop token
-    outputs = llm.generate(example_prompts,
-                           sampling_params=SamplingParams(
-                               ignore_eos=True,
-                               seed=SEED,
-                               max_tokens=MAX_TOKENS,
-                               stop_token_ids=[stop_token_id]))
+    outputs = llm.generate(
+        example_prompts,
+        sampling_params=SamplingParams(
+            ignore_eos=True,
+            seed=SEED,
+            max_tokens=MAX_TOKENS,
+            stop_token_ids=[stop_token_id],
+        ),
+    )
     for output in outputs:
         output = output.outputs[0]
         assert output.finish_reason == "stop"
         assert output.stop_reason == stop_token_id
 
     # test stop string
-    outputs = llm.generate(example_prompts,
-                           sampling_params=SamplingParams(
-                               ignore_eos=True,
-                               seed=SEED,
-                               max_tokens=MAX_TOKENS,
-                               stop="."))
+    outputs = llm.generate(
+        example_prompts,
+        sampling_params=SamplingParams(
+            ignore_eos=True, seed=SEED, max_tokens=MAX_TOKENS, stop="."
+        ),
+    )
     for output in outputs:
         output = output.outputs[0]
         assert output.finish_reason == "stop"
         assert output.stop_reason == STOP_STR
 
     # test EOS token
-    outputs = llm.generate(example_prompts,
-                           sampling_params=SamplingParams(
-                               seed=SEED, max_tokens=MAX_TOKENS))
+    outputs = llm.generate(
+        example_prompts,
+        sampling_params=SamplingParams(seed=SEED, max_tokens=MAX_TOKENS),
+    )
     for output in outputs:
         output = output.outputs[0]
         assert output.finish_reason == "length" or (
-            output.finish_reason == "stop" and output.stop_reason is None)
+            output.finish_reason == "stop" and output.stop_reason is None
+        )
diff --git a/tests/detokenizer/test_stop_string_while_stop_model_terminates.py b/tests/detokenizer/test_stop_string_while_stop_model_terminates.py
index 9b32a2927f2d..5624332ef71d 100644
--- a/tests/detokenizer/test_stop_string_while_stop_model_terminates.py
+++ b/tests/detokenizer/test_stop_string_while_stop_model_terminates.py
@@ -14,7 +14,6 @@ def include_stop_str_in_output(request):
 
 
 class _DummyDetokenizer(BaseIncrementalDetokenizer):
-
     def __init__(self, request: EngineCoreRequest):
         super().__init__(request)
 
@@ -27,7 +26,8 @@ def _make_request(stop, include_stop_str_in_output: bool, min_tokens: int = 0):
     params = SamplingParams(
         stop=stop,
         include_stop_str_in_output=include_stop_str_in_output,
-        min_tokens=min_tokens)
+        min_tokens=min_tokens,
+    )
     # Keep other fields minimal for unit test purposes.
     req = EngineCoreRequest(
         request_id="test",
@@ -44,26 +44,25 @@ def _make_request(stop, include_stop_str_in_output: bool, min_tokens: int = 0):
     return req
 
 
-def test_stop_string_while_stop_token_terminates(
-        include_stop_str_in_output: bool):
+def test_stop_string_while_stop_token_terminates(include_stop_str_in_output: bool):
     """
     This test verifies that the detokenizer correctly handles the case where
     the generated token sequence contains both:
     - a stop token
     - an <eos> token
-    
+
     The detokenizer should respect the stop string and truncate the output
     accordingly.
-    
+
     Imagine the following sequence:
     - "abcdeZ" is generated, where "Z" is the <eos> token.
     - "cd" is the stop string.
-    
+
     If include_stop_str_in_output=False, the detokenizer should truncate the
     output to "ab" because the stop string "cd" is excluded.
     If include_stop_str_in_output=True, the detokenizer should include the stop
     string "cd" in the output, resulting in "abcd".
-    
+
 
     This verifies the behavioral change introduced in BaseIncrementalDetokenizer
     where stop-string evaluation occurs before the early-return on
@@ -78,8 +77,9 @@ def test_stop_string_while_stop_token_terminates(
     token_ids = [ord(c) for c in generated_text]
 
     # Create a request with the stop string and initialize the detokenizer.
-    req = _make_request(stop=[stop_string],
-                        include_stop_str_in_output=include_stop_str_in_output)
+    req = _make_request(
+        stop=[stop_string], include_stop_str_in_output=include_stop_str_in_output
+    )
     detok = _DummyDetokenizer(req)
 
     # Simulate that the last token ('Z') is a stop token (stop_terminated=True).
@@ -99,5 +99,4 @@ def test_stop_string_while_stop_token_terminates(
 
     # get_next_output_text should return the full text when finished=True.
     # (Buffering only applies during streaming when finished=False.)
-    assert detok.get_next_output_text(finished=True,
-                                      delta=False) == expected_text
+    assert detok.get_next_output_text(finished=True, delta=False) == expected_text
diff --git a/tests/detokenizer/test_stop_strings.py b/tests/detokenizer/test_stop_strings.py
index 46f7d58c438c..70cc7e31b8ad 100644
--- a/tests/detokenizer/test_stop_strings.py
+++ b/tests/detokenizer/test_stop_strings.py
@@ -11,12 +11,14 @@
 MAX_TOKENS = 200
 
 
-def _test_stopping(llm: LLM,
-                   expected_output: str,
-                   expected_reason: Any,
-                   stop: Optional[list[str]] = None,
-                   stop_token_ids: Optional[list[int]] = None,
-                   include_in_output: bool = False) -> None:
+def _test_stopping(
+    llm: LLM,
+    expected_output: str,
+    expected_reason: Any,
+    stop: Optional[list[str]] = None,
+    stop_token_ids: Optional[list[int]] = None,
+    include_in_output: bool = False,
+) -> None:
     output = llm.generate(
         "A story about vLLM:\n",
         SamplingParams(
@@ -25,7 +27,8 @@ def _test_stopping(llm: LLM,
             stop=stop,
             stop_token_ids=stop_token_ids,
             include_stop_str_in_output=include_in_output,
-        ))[0].outputs[0]
+        ),
+    )[0].outputs[0]
 
     assert output is not None
     assert output.text == expected_output
@@ -33,17 +36,21 @@ def _test_stopping(llm: LLM,
 
 
 def _stop_basic(llm):
-    _test_stopping(llm,
-                   stop=["."],
-                   include_in_output=False,
-                   expected_output="VLLM is a 100% volunteer organization",
-                   expected_reason=".")
+    _test_stopping(
+        llm,
+        stop=["."],
+        include_in_output=False,
+        expected_output="VLLM is a 100% volunteer organization",
+        expected_reason=".",
+    )
 
-    _test_stopping(llm,
-                   stop=["."],
-                   include_in_output=True,
-                   expected_output="VLLM is a 100% volunteer organization.",
-                   expected_reason=".")
+    _test_stopping(
+        llm,
+        stop=["."],
+        include_in_output=True,
+        expected_output="VLLM is a 100% volunteer organization.",
+        expected_reason=".",
+    )
 
 
 def _stop_multi_tokens(llm):
@@ -52,45 +59,54 @@ def _stop_multi_tokens(llm):
         stop=["group of peo", "short"],
         include_in_output=False,
         expected_output="VLLM is a 100% volunteer organization. We are a ",
-        expected_reason="group of peo")
+        expected_reason="group of peo",
+    )
 
     _test_stopping(
         llm,
         stop=["group of peo", "short"],
         include_in_output=True,
-        expected_output=
-        "VLLM is a 100% volunteer organization. We are a group of peo",
-        expected_reason="group of peo")
+        expected_output="VLLM is a 100% volunteer organization. We are a group of peo",
+        expected_reason="group of peo",
+    )
 
 
 def _stop_partial_token(llm):
-    _test_stopping(llm,
-                   stop=["gani"],
-                   include_in_output=False,
-                   expected_output="VLLM is a 100% volunteer or",
-                   expected_reason="gani")
+    _test_stopping(
+        llm,
+        stop=["gani"],
+        include_in_output=False,
+        expected_output="VLLM is a 100% volunteer or",
+        expected_reason="gani",
+    )
 
-    _test_stopping(llm,
-                   stop=["gani"],
-                   include_in_output=True,
-                   expected_output="VLLM is a 100% volunteer organi",
-                   expected_reason="gani")
+    _test_stopping(
+        llm,
+        stop=["gani"],
+        include_in_output=True,
+        expected_output="VLLM is a 100% volunteer organi",
+        expected_reason="gani",
+    )
 
 
 def _stop_token_id(llm):
     # token id 13013 => " organization"
 
-    _test_stopping(llm,
-                   stop_token_ids=[13013],
-                   include_in_output=False,
-                   expected_output="VLLM is a 100% volunteer",
-                   expected_reason=13013)
-
-    _test_stopping(llm,
-                   stop_token_ids=[13013],
-                   include_in_output=True,
-                   expected_output="VLLM is a 100% volunteer organization",
-                   expected_reason=13013)
+    _test_stopping(
+        llm,
+        stop_token_ids=[13013],
+        include_in_output=False,
+        expected_output="VLLM is a 100% volunteer",
+        expected_reason=13013,
+    )
+
+    _test_stopping(
+        llm,
+        stop_token_ids=[13013],
+        include_in_output=True,
+        expected_output="VLLM is a 100% volunteer organization",
+        expected_reason=13013,
+    )
 
 
 @pytest.mark.skip_global_cleanup
diff --git a/tests/distributed/conftest.py b/tests/distributed/conftest.py
index 7dc4a0cc3d58..47ceb45057c9 100644
--- a/tests/distributed/conftest.py
+++ b/tests/distributed/conftest.py
@@ -111,8 +111,7 @@ def __init__(
         self.last_seq = -1
         self.decoder = msgspec.msgpack.Decoder(type=decode_type)
 
-    def receive_one(self,
-                    timeout=1000) -> Union[tuple[int, SampleBatch], None]:
+    def receive_one(self, timeout=1000) -> Union[tuple[int, SampleBatch], None]:
         """Receive a single message with timeout"""
         if not self.sub.poll(timeout):
             return None
@@ -135,8 +134,7 @@ def request_replay(self, start_seq: int, socket_idx: int = 0) -> None:
 
         self.replay_sockets[socket_idx].send(start_seq.to_bytes(8, "big"))
 
-    def receive_replay(self,
-                       socket_idx: int = 0) -> list[tuple[int, SampleBatch]]:
+    def receive_replay(self, socket_idx: int = 0) -> list[tuple[int, SampleBatch]]:
         """Receive replayed messages from a specific replay socket"""
         if not self.replay_sockets:
             raise ValueError("Replay sockets not initialized")
diff --git a/tests/distributed/test_ca_buffer_sharing.py b/tests/distributed/test_ca_buffer_sharing.py
index e2de462612b4..1ddce64f8e61 100644
--- a/tests/distributed/test_ca_buffer_sharing.py
+++ b/tests/distributed/test_ca_buffer_sharing.py
@@ -12,7 +12,8 @@
 
 from vllm.distributed.device_communicators.cuda_wrapper import CudaRTLibrary
 from vllm.distributed.device_communicators.custom_all_reduce import (  # noqa
-    CustomAllreduce)
+    CustomAllreduce,
+)
 
 # create a cpu process group for communicating metadata (ipc handle)
 dist.init_process_group(backend="gloo")
@@ -52,7 +53,8 @@
         assert ord(host_data[i]) == byte_value, (
             f"Rank {rank} failed"
             f" to verify buffer {p}. Expected {byte_value}, "
-            f"got {ord(host_data[i])}")
+            f"got {ord(host_data[i])}"
+        )
 
 print(f"Rank {rank} verified all buffers")
 
diff --git a/tests/distributed/test_comm_ops.py b/tests/distributed/test_comm_ops.py
index 8d84cc2d0ffe..c61c4584d837 100644
--- a/tests/distributed/test_comm_ops.py
+++ b/tests/distributed/test_comm_ops.py
@@ -13,13 +13,19 @@
 import ray
 import torch
 
-from vllm.distributed import (broadcast_tensor_dict, get_pp_group,
-                              tensor_model_parallel_all_gather,
-                              tensor_model_parallel_all_reduce,
-                              tensor_model_parallel_reduce_scatter)
+from vllm.distributed import (
+    broadcast_tensor_dict,
+    get_pp_group,
+    tensor_model_parallel_all_gather,
+    tensor_model_parallel_all_reduce,
+    tensor_model_parallel_reduce_scatter,
+)
 
-from ..utils import (init_test_distributed_environment, multi_gpu_test,
-                     multi_process_parallel)
+from ..utils import (
+    init_test_distributed_environment,
+    multi_gpu_test,
+    multi_process_parallel,
+)
 
 
 @ray.remote(num_gpus=1, max_calls=1)
@@ -37,12 +43,11 @@ def all_reduce_test_worker(
 
     device = torch.device(f"cuda:{rank}")
     torch.cuda.set_device(device)
-    init_test_distributed_environment(tp_size, pp_size, rank,
-                                      distributed_init_port)
+    init_test_distributed_environment(tp_size, pp_size, rank, distributed_init_port)
     num_elements = 8
     all_tensors = [
-        torch.arange(num_elements, dtype=torch.float32, device="cuda") *
-        (r + 1) for r in range(tp_size)
+        torch.arange(num_elements, dtype=torch.float32, device="cuda") * (r + 1)
+        for r in range(tp_size)
     ]
     expected = torch.sum(torch.stack(all_tensors, dim=0), dim=0)
     t = all_tensors[rank % tp_size]
@@ -51,28 +56,31 @@ def all_reduce_test_worker(
 
 
 @ray.remote(num_gpus=1, max_calls=1)
-def reduce_scatter_test_worker(monkeypatch: pytest.MonkeyPatch, tp_size: int,
-                               pp_size: int, rank: int,
-                               distributed_init_port: str):
+def reduce_scatter_test_worker(
+    monkeypatch: pytest.MonkeyPatch,
+    tp_size: int,
+    pp_size: int,
+    rank: int,
+    distributed_init_port: str,
+):
     # it is important to delete the CUDA_VISIBLE_DEVICES environment variable
     # so that each worker can see all the GPUs
     # they will be able to set the device to the correct GPU
     monkeypatch.delenv("CUDA_VISIBLE_DEVICES", raising=False)
     device = torch.device(f"cuda:{rank}")
     torch.cuda.set_device(device)
-    init_test_distributed_environment(tp_size, pp_size, rank,
-                                      distributed_init_port)
+    init_test_distributed_environment(tp_size, pp_size, rank, distributed_init_port)
 
     num_elements = 8
     all_tensors = [
-        torch.arange(num_elements, dtype=torch.float32, device="cuda") *
-        (r + 1) for r in range(tp_size)
+        torch.arange(num_elements, dtype=torch.float32, device="cuda") * (r + 1)
+        for r in range(tp_size)
     ]
 
     index = rank % tp_size
     partition_size = num_elements // tp_size
     all_reduce = torch.sum(torch.stack(all_tensors, dim=0), dim=0)
-    expected = all_reduce[index * partition_size:(index + 1) * partition_size]
+    expected = all_reduce[index * partition_size : (index + 1) * partition_size]
     t = all_tensors[index]
     t = tensor_model_parallel_reduce_scatter(t, 0)
     torch.testing.assert_close(t, expected)
@@ -92,8 +100,7 @@ def all_gather_test_worker(
     monkeypatch.delenv("CUDA_VISIBLE_DEVICES", raising=False)
     device = torch.device(f"cuda:{rank}")
     torch.cuda.set_device(device)
-    init_test_distributed_environment(tp_size, pp_size, rank,
-                                      distributed_init_port)
+    init_test_distributed_environment(tp_size, pp_size, rank, distributed_init_port)
     num_dimensions = 3
     tensor_size = list(range(2, num_dimensions + 2))
     total_size = 1
@@ -101,8 +108,10 @@ def all_gather_test_worker(
         total_size *= s
     for all_gather_dimension in range(num_dimensions):
         all_tensors = [
-            torch.arange(total_size, dtype=torch.float32,
-                         device="cuda").reshape(tensor_size) * (r + 1)
+            torch.arange(total_size, dtype=torch.float32, device="cuda").reshape(
+                tensor_size
+            )
+            * (r + 1)
             for r in range(tp_size)
         ]
         expected = torch.cat(all_tensors, dim=all_gather_dimension)
@@ -125,8 +134,7 @@ def broadcast_tensor_dict_test_worker(
     monkeypatch.delenv("CUDA_VISIBLE_DEVICES", raising=False)
     device = torch.device(f"cuda:{rank}")
     torch.cuda.set_device(device)
-    init_test_distributed_environment(tp_size, pp_size, rank,
-                                      distributed_init_port)
+    init_test_distributed_environment(tp_size, pp_size, rank, distributed_init_port)
     test_dict = {
         # device tensor
         "a": torch.arange(8, dtype=torch.float32, device="cuda"),
@@ -134,10 +142,7 @@ def broadcast_tensor_dict_test_worker(
         "b": torch.arange(16, dtype=torch.int8, device="cpu"),
         "c": "test",
         "d": [1, 2, 3],
-        "e": {
-            "a": 1,
-            "b": 2
-        },
+        "e": {"a": 1, "b": 2},
         # empty tensor
         "f": torch.tensor([], dtype=torch.float32, device="cuda"),
     }
@@ -166,8 +171,7 @@ def send_recv_tensor_dict_test_worker(
     monkeypatch.delenv("CUDA_VISIBLE_DEVICES", raising=False)
     device = torch.device(f"cuda:{rank}")
     torch.cuda.set_device(device)
-    init_test_distributed_environment(tp_size, pp_size, rank,
-                                      distributed_init_port)
+    init_test_distributed_environment(tp_size, pp_size, rank, distributed_init_port)
 
     test_dict = {
         # device tensor
@@ -176,10 +180,7 @@ def send_recv_tensor_dict_test_worker(
         "b": torch.arange(16, dtype=torch.int8, device="cpu"),
         "c": "test",
         "d": [1, 2, 3],
-        "e": {
-            "a": 1,
-            "b": 2
-        },
+        "e": {"a": 1, "b": 2},
         # empty tensor
         "f": torch.tensor([], dtype=torch.float32, device="cuda"),
     }
@@ -211,8 +212,7 @@ def send_recv_test_worker(
     monkeypatch.delenv("CUDA_VISIBLE_DEVICES", raising=False)
     device = torch.device(f"cuda:{rank}")
     torch.cuda.set_device(device)
-    init_test_distributed_environment(tp_size, pp_size, rank,
-                                      distributed_init_port)
+    init_test_distributed_environment(tp_size, pp_size, rank, distributed_init_port)
 
     size = 64
     test_tensor = torch.arange(64, dtype=torch.float32, device="cuda")
@@ -229,10 +229,10 @@ def send_recv_test_worker(
 
 @multi_gpu_test(num_gpus=2)
 @pytest.mark.parametrize("tp_size", [2])
-@pytest.mark.parametrize("test_target", [
-    all_reduce_test_worker, all_gather_test_worker,
-    broadcast_tensor_dict_test_worker
-])
+@pytest.mark.parametrize(
+    "test_target",
+    [all_reduce_test_worker, all_gather_test_worker, broadcast_tensor_dict_test_worker],
+)
 def test_multi_process_tensor_parallel(
     monkeypatch: pytest.MonkeyPatch,
     tp_size: int,
@@ -244,7 +244,8 @@ def test_multi_process_tensor_parallel(
 @multi_gpu_test(num_gpus=2)
 @pytest.mark.parametrize("pp_size", [2])
 @pytest.mark.parametrize(
-    "test_target", [send_recv_test_worker, send_recv_tensor_dict_test_worker])
+    "test_target", [send_recv_test_worker, send_recv_tensor_dict_test_worker]
+)
 def test_multi_process_pipeline_parallel(
     monkeypatch: pytest.MonkeyPatch,
     pp_size: int,
@@ -256,11 +257,16 @@ def test_multi_process_pipeline_parallel(
 @multi_gpu_test(num_gpus=4)
 @pytest.mark.parametrize("tp_size", [2])
 @pytest.mark.parametrize("pp_size", [2])
-@pytest.mark.parametrize("test_target", [
-    send_recv_test_worker, send_recv_tensor_dict_test_worker,
-    all_reduce_test_worker, all_gather_test_worker,
-    broadcast_tensor_dict_test_worker
-])
+@pytest.mark.parametrize(
+    "test_target",
+    [
+        send_recv_test_worker,
+        send_recv_tensor_dict_test_worker,
+        all_reduce_test_worker,
+        all_gather_test_worker,
+        broadcast_tensor_dict_test_worker,
+    ],
+)
 def test_multi_process_tensor_parallel_pipeline_parallel(
     tp_size: int,
     pp_size: int,
diff --git a/tests/distributed/test_context_parallel.py b/tests/distributed/test_context_parallel.py
index 11685bc90c41..c8b6dc9781df 100644
--- a/tests/distributed/test_context_parallel.py
+++ b/tests/distributed/test_context_parallel.py
@@ -7,6 +7,7 @@
  all workers in a node other than the head node, which can cause the test
  to fail.
 """
+
 import json
 import os
 from dataclasses import dataclass
@@ -56,7 +57,8 @@ def __post_init__(self):
             raise ValueError(
                 f"Length mismatch: distributed_backends "
                 f"({len(self.distributed_backends)}) != "
-                f"vllm_major_versions ({len(self.vllm_major_versions)})")
+                f"vllm_major_versions ({len(self.vllm_major_versions)})"
+            )
 
     @staticmethod
     def detailed(
@@ -74,29 +76,39 @@ def detailed(
                 for dcp_multiplier in [0.5, 1]:
                     for chunked_prefill_val in [True]:
                         parallel_setups.append(
-                            ParallelSetup(tp_size=tp_base,
-                                          pp_size=pp_multiplier * pp_base,
-                                          dcp_size=int(dcp_multiplier *
-                                                       tp_base),
-                                          eager_mode=eager_mode_val,
-                                          chunked_prefill=chunked_prefill_val))
+                            ParallelSetup(
+                                tp_size=tp_base,
+                                pp_size=pp_multiplier * pp_base,
+                                dcp_size=int(dcp_multiplier * tp_base),
+                                eager_mode=eager_mode_val,
+                                chunked_prefill=chunked_prefill_val,
+                            )
+                        )
         return CPTestSettings(
             parallel_setups=parallel_setups,
             distributed_backends=["mp"],
             vllm_major_versions=["1"],
             runner=runner,
-            test_options=CPTestOptions(multi_node_only=multi_node_only,
-                                       load_format=load_format),
+            test_options=CPTestOptions(
+                multi_node_only=multi_node_only, load_format=load_format
+            ),
         )
 
     def iter_params(self, model_id: str):
         opts = self.test_options
 
         for parallel_setup in self.parallel_setups:
-            for backend, vllm_major_version in zip(self.distributed_backends,
-                                                   self.vllm_major_versions):
-                yield (model_id, parallel_setup, backend, vllm_major_version,
-                       self.runner, opts)
+            for backend, vllm_major_version in zip(
+                self.distributed_backends, self.vllm_major_versions
+            ):
+                yield (
+                    model_id,
+                    parallel_setup,
+                    backend,
+                    vllm_major_version,
+                    self.runner,
+                    opts,
+                )
 
 
 def _compare_cp_with_tp(
@@ -148,8 +160,10 @@ def _compare_cp_with_tp(
     if num_gpus_available < tp_size * pp_size:
         pytest.skip(f"Need at least {tp_size} x {pp_size} GPUs")
     if VLLM_MULTI_NODE and distributed_backend == "mp":
-        pytest.skip("Skipping multi-node pipeline parallel test for "
-                    "multiprocessing distributed backend")
+        pytest.skip(
+            "Skipping multi-node pipeline parallel test for "
+            "multiprocessing distributed backend"
+        )
     if multi_node_only and not VLLM_MULTI_NODE:
         pytest.skip("Not in multi-node setting")
 
@@ -178,8 +192,7 @@ def _compare_cp_with_tp(
         common_args.extend(["--hf-overrides", json.dumps(hf_overrides)])
 
     cp_env = tp_env = {
-        "VLLM_USE_V1":
-        vllm_major_version,  # Note(hc): DCP only support V1 engine only
+        "VLLM_USE_V1": vllm_major_version,  # Note(hc): DCP only support V1 engine only
     }
 
     cp_args = [
@@ -205,13 +218,15 @@ def _compare_cp_with_tp(
     ]
 
     try:
-        compare_two_settings(model_id,
-                             cp_args,
-                             tp_args,
-                             cp_env,
-                             tp_env,
-                             method=method,
-                             max_wait_seconds=720)
+        compare_two_settings(
+            model_id,
+            cp_args,
+            tp_args,
+            cp_env,
+            tp_env,
+            method=method,
+            max_wait_seconds=720,
+        )
     except Exception:
         testing_ray_compiled_graph = cp_env is not None
         if testing_ray_compiled_graph and vllm_major_version == "0":
@@ -224,9 +239,10 @@ def _compare_cp_with_tp(
 
 CP_TEXT_GENERATION_MODELS = {
     # [MLA attention only]
-    "deepseek-ai/DeepSeek-V2-Lite-Chat":
-    [CPTestSettings.detailed(),
-     CPTestSettings.detailed(tp_base=2)],
+    "deepseek-ai/DeepSeek-V2-Lite-Chat": [
+        CPTestSettings.detailed(),
+        CPTestSettings.detailed(tp_base=2),
+    ],
 }
 
 CP_TEST_MODELS = [
@@ -237,11 +253,19 @@ def _compare_cp_with_tp(
 
 
 @pytest.mark.parametrize(
-    ("model_id", "parallel_setup", "distributed_backend", "vllm_major_version",
-     "runner", "test_options"),
+    (
+        "model_id",
+        "parallel_setup",
+        "distributed_backend",
+        "vllm_major_version",
+        "runner",
+        "test_options",
+    ),
     [
-        params for model_id, settings in CP_TEXT_GENERATION_MODELS.items()
-        for setting in settings for params in setting.iter_params(model_id)
+        params
+        for model_id, settings in CP_TEXT_GENERATION_MODELS.items()
+        for setting in settings
+        for params in setting.iter_params(model_id)
         if model_id in CP_TEST_MODELS
     ],
 )
@@ -255,12 +279,14 @@ def test_cp_generation(
     test_options: CPTestOptions,
     num_gpus_available,
 ):
-    _compare_cp_with_tp(model_id,
-                        parallel_setup,
-                        distributed_backend,
-                        vllm_major_version,
-                        runner,
-                        test_options,
-                        num_gpus_available,
-                        method="generate",
-                        is_multimodal=False)
+    _compare_cp_with_tp(
+        model_id,
+        parallel_setup,
+        distributed_backend,
+        vllm_major_version,
+        runner,
+        test_options,
+        num_gpus_available,
+        method="generate",
+        is_multimodal=False,
+    )
diff --git a/tests/distributed/test_custom_all_reduce.py b/tests/distributed/test_custom_all_reduce.py
index 9212c04deec9..f6e274be9384 100644
--- a/tests/distributed/test_custom_all_reduce.py
+++ b/tests/distributed/test_custom_all_reduce.py
@@ -8,12 +8,14 @@
 import torch
 import torch.distributed as dist
 
-from vllm.distributed.communication_op import (  # noqa
-    tensor_model_parallel_all_reduce)
+from vllm.distributed.communication_op import tensor_model_parallel_all_reduce  # noqa
 from vllm.distributed.parallel_state import get_tp_group, graph_capture
 
-from ..utils import (ensure_model_parallel_initialized,
-                     init_test_distributed_environment, multi_process_parallel)
+from ..utils import (
+    ensure_model_parallel_initialized,
+    init_test_distributed_environment,
+    multi_process_parallel,
+)
 
 random.seed(42)
 test_sizes = [random.randint(1024, 2048 * 1024) for _ in range(8)]
@@ -33,8 +35,7 @@ def graph_allreduce(
         m.delenv("CUDA_VISIBLE_DEVICES", raising=False)
         device = torch.device(f"cuda:{rank}")
         torch.cuda.set_device(device)
-        init_test_distributed_environment(tp_size, pp_size, rank,
-                                          distributed_init_port)
+        init_test_distributed_environment(tp_size, pp_size, rank, distributed_init_port)
         ensure_model_parallel_initialized(tp_size, pp_size)
         group = get_tp_group().device_group
 
@@ -60,18 +61,15 @@ def graph_allreduce(
             for dtype in [torch.float32, torch.float16, torch.bfloat16]:
                 with graph_capture(device=device) as graph_capture_context:
                     # use integers so result matches NCCL exactly
-                    inp1 = torch.randint(1,
-                                         16, (sz, ),
-                                         dtype=dtype,
-                                         device=torch.cuda.current_device())
-                    inp2 = torch.randint(1,
-                                         16, (sz, ),
-                                         dtype=dtype,
-                                         device=torch.cuda.current_device())
+                    inp1 = torch.randint(
+                        1, 16, (sz,), dtype=dtype, device=torch.cuda.current_device()
+                    )
+                    inp2 = torch.randint(
+                        1, 16, (sz,), dtype=dtype, device=torch.cuda.current_device()
+                    )
                     torch.cuda.synchronize()
                     graph = torch.cuda.CUDAGraph()
-                    with torch.cuda.graph(graph,
-                                          stream=graph_capture_context.stream):
+                    with torch.cuda.graph(graph, stream=graph_capture_context.stream):
                         for i in range(num_communication):
                             out1 = tensor_model_parallel_all_reduce(inp1)
                             # the input buffer is immediately modified to test
@@ -96,8 +94,7 @@ def eager_allreduce(
         m.delenv("CUDA_VISIBLE_DEVICES", raising=False)
         device = torch.device(f"cuda:{rank}")
         torch.cuda.set_device(device)
-        init_test_distributed_environment(tp_size, pp_size, rank,
-                                          distributed_init_port)
+        init_test_distributed_environment(tp_size, pp_size, rank, distributed_init_port)
 
         # we use the first group to communicate once
         # and the second group to communicate twice
@@ -132,5 +129,4 @@ def test_custom_allreduce(
     world_size = tp_size * pipeline_parallel_size
     if world_size > torch.cuda.device_count():
         pytest.skip("Not enough GPUs to run the test.")
-    multi_process_parallel(monkeypatch, tp_size, pipeline_parallel_size,
-                           test_target)
+    multi_process_parallel(monkeypatch, tp_size, pipeline_parallel_size, test_target)
diff --git a/tests/distributed/test_distributed_oot.py b/tests/distributed/test_distributed_oot.py
index b93696e4be0e..ea7a88abda24 100644
--- a/tests/distributed/test_distributed_oot.py
+++ b/tests/distributed/test_distributed_oot.py
@@ -1,8 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from ..entrypoints.openai.test_oot_registration import (
-    run_and_test_dummy_opt_api_server)
+from ..entrypoints.openai.test_oot_registration import run_and_test_dummy_opt_api_server
 
 
 def test_distributed_oot(dummy_opt_path: str):
diff --git a/tests/distributed/test_eplb_algo.py b/tests/distributed/test_eplb_algo.py
index e47ccba99c81..79805a7cce53 100644
--- a/tests/distributed/test_eplb_algo.py
+++ b/tests/distributed/test_eplb_algo.py
@@ -10,10 +10,12 @@
 def test_basic_rebalance():
     """Test basic rebalancing functionality"""
     # Example from https://github.com/deepseek-ai/eplb
-    weight = torch.tensor([
-        [90, 132, 40, 61, 104, 165, 39, 4, 73, 56, 183, 86],
-        [20, 107, 104, 64, 19, 197, 187, 157, 172, 86, 16, 27],
-    ])
+    weight = torch.tensor(
+        [
+            [90, 132, 40, 61, 104, 165, 39, 4, 73, 56, 183, 86],
+            [20, 107, 104, 64, 19, 197, 187, 157, 172, 86, 16, 27],
+        ]
+    )
 
     num_layers = weight.shape[0]
     num_replicas = 16
@@ -21,45 +23,49 @@ def test_basic_rebalance():
     num_nodes = 2
     num_gpus = 8
 
-    phy2log, log2phy, logcnt = rebalance_experts(weight, num_replicas,
-                                                 num_groups, num_nodes,
-                                                 num_gpus)
+    phy2log, log2phy, logcnt = rebalance_experts(
+        weight, num_replicas, num_groups, num_nodes, num_gpus
+    )
 
     # Verify output shapes
     assert phy2log.shape == (
         2,
         16,
     ), f"Expected `phy2log` shape (2, 16), got {phy2log.shape}"
-    assert (log2phy.shape[0] == 2
-            ), f"Expected `log2phy` first dimension 2, got {log2phy.shape[0]}"
-    assert (
-        log2phy.shape[1] == 12
-    ), f"Expected `log2phy` second dimension 12, got {log2phy.shape[1]}"
+    assert log2phy.shape[0] == 2, (
+        f"Expected `log2phy` first dimension 2, got {log2phy.shape[0]}"
+    )
+    assert log2phy.shape[1] == 12, (
+        f"Expected `log2phy` second dimension 12, got {log2phy.shape[1]}"
+    )
     assert logcnt.shape == (
         2,
         12,
     ), f"Expected `logcnt` shape (2, 12), got {logcnt.shape}"
 
     # Verify physical to logical expert mapping range is correct
-    assert torch.all(phy2log >= 0) and torch.all(
-        phy2log < 12), "Physical to logical mapping should be in range [0, 12)"
+    assert torch.all(phy2log >= 0) and torch.all(phy2log < 12), (
+        "Physical to logical mapping should be in range [0, 12)"
+    )
 
     # Verify expert count reasonableness
-    assert torch.all(
-        logcnt >= 1), "Each logical expert should have at least 1 replica"
-    assert (
-        torch.sum(logcnt, dim=1).sum() == num_replicas *
-        num_layers), f"Total replicas should be {num_replicas * num_layers}"
+    assert torch.all(logcnt >= 1), "Each logical expert should have at least 1 replica"
+    assert torch.sum(logcnt, dim=1).sum() == num_replicas * num_layers, (
+        f"Total replicas should be {num_replicas * num_layers}"
+    )
 
     # Verify expected output
-    expected_phy2log = torch.tensor([
-        [5, 6, 5, 7, 8, 4, 3, 4, 10, 9, 10, 2, 0, 1, 11, 1],
-        [7, 10, 6, 8, 6, 11, 8, 9, 2, 4, 5, 1, 5, 0, 3, 1],
-    ])
+    expected_phy2log = torch.tensor(
+        [
+            [5, 6, 5, 7, 8, 4, 3, 4, 10, 9, 10, 2, 0, 1, 11, 1],
+            [7, 10, 6, 8, 6, 11, 8, 9, 2, 4, 5, 1, 5, 0, 3, 1],
+        ]
+    )
     assert torch.all(phy2log == expected_phy2log)
 
-    expected_logcnt = torch.tensor([[1, 2, 1, 1, 2, 2, 1, 1, 1, 1, 2, 1],
-                                    [1, 2, 1, 1, 1, 2, 2, 1, 2, 1, 1, 1]])
+    expected_logcnt = torch.tensor(
+        [[1, 2, 1, 1, 2, 2, 1, 1, 1, 1, 2, 1], [1, 2, 1, 1, 1, 2, 2, 1, 2, 1, 1, 1]]
+    )
     assert torch.all(logcnt == expected_logcnt)
 
 
@@ -71,9 +77,9 @@ def test_single_gpu_case():
     num_nodes = 1
     num_gpus = 1
 
-    phy2log, log2phy, logcnt = rebalance_experts(weight, num_replicas,
-                                                 num_groups, num_nodes,
-                                                 num_gpus)
+    phy2log, log2phy, logcnt = rebalance_experts(
+        weight, num_replicas, num_groups, num_nodes, num_gpus
+    )
 
     # Verify shapes
     assert phy2log.shape == (1, 4)
@@ -93,19 +99,19 @@ def test_equal_weights():
     num_nodes = 2
     num_gpus = 4
 
-    phy2log, log2phy, logcnt = rebalance_experts(weight, num_replicas,
-                                                 num_groups, num_nodes,
-                                                 num_gpus)
+    phy2log, log2phy, logcnt = rebalance_experts(
+        weight, num_replicas, num_groups, num_nodes, num_gpus
+    )
 
     # Verify shapes
     assert phy2log.shape == (1, 8)
     assert logcnt.shape == (1, 8)
 
     # With equal weights, each expert should have exactly one replica
-    assert torch.all(
-        logcnt == 1
-    ), "With equal weights and no replication, " \
-       "each expert should have exactly 1 replica"
+    assert torch.all(logcnt == 1), (
+        "With equal weights and no replication, "
+        "each expert should have exactly 1 replica"
+    )
 
 
 def test_extreme_weight_imbalance():
@@ -116,35 +122,37 @@ def test_extreme_weight_imbalance():
     num_nodes = 2
     num_gpus = 4
 
-    phy2log, log2phy, logcnt = rebalance_experts(weight, num_replicas,
-                                                 num_groups, num_nodes,
-                                                 num_gpus)
+    phy2log, log2phy, logcnt = rebalance_experts(
+        weight, num_replicas, num_groups, num_nodes, num_gpus
+    )
 
     # Verify shapes
     assert phy2log.shape == (1, 12)
     assert logcnt.shape == (1, 8)
 
     # Expert with highest weight (index 0) should have more replicas
-    assert (
-        logcnt[0, 0]
-        > logcnt[0, 1]), "Expert with highest weight should have more replicas"
+    assert logcnt[0, 0] > logcnt[0, 1], (
+        "Expert with highest weight should have more replicas"
+    )
 
 
 def test_multiple_layers():
     """Test multiple layers case"""
-    weight = torch.tensor([
-        [10, 20, 30, 40, 50, 60],  # First layer
-        [60, 50, 40, 30, 20, 10],  # Second layer (opposite weight pattern)
-        [25, 25, 25, 25, 25, 25],  # Third layer (equal weights)
-    ])
+    weight = torch.tensor(
+        [
+            [10, 20, 30, 40, 50, 60],  # First layer
+            [60, 50, 40, 30, 20, 10],  # Second layer (opposite weight pattern)
+            [25, 25, 25, 25, 25, 25],  # Third layer (equal weights)
+        ]
+    )
     num_replicas = 8
     num_groups = 2
     num_nodes = 2
     num_gpus = 4
 
-    phy2log, log2phy, logcnt = rebalance_experts(weight, num_replicas,
-                                                 num_groups, num_nodes,
-                                                 num_gpus)
+    phy2log, log2phy, logcnt = rebalance_experts(
+        weight, num_replicas, num_groups, num_nodes, num_gpus
+    )
 
     # Verify shapes
     assert phy2log.shape == (3, 8)
@@ -152,12 +160,12 @@ def test_multiple_layers():
 
     # Verify expert allocation is reasonable for each layer
     for layer in range(3):
-        assert torch.all(phy2log[layer] >= 0) and torch.all(
-            phy2log[layer] < 6
-        ), f"Layer {layer} physical to logical mapping" \
-            "should be in range [0, 6)"
-        assert (torch.sum(logcnt[layer]) == num_replicas
-                ), f"Layer {layer} total replicas should be {num_replicas}"
+        assert torch.all(phy2log[layer] >= 0) and torch.all(phy2log[layer] < 6), (
+            f"Layer {layer} physical to logical mappingshould be in range [0, 6)"
+        )
+        assert torch.sum(logcnt[layer]) == num_replicas, (
+            f"Layer {layer} total replicas should be {num_replicas}"
+        )
 
 
 def test_parameter_validation():
@@ -179,17 +187,19 @@ def test_parameter_validation():
 
 def test_small_scale_hierarchical():
     """Test small-scale hierarchical load balancing"""
-    weight = torch.tensor([
-        [100, 50, 200, 75, 150, 25, 300, 80],  # 8 experts
-    ])
+    weight = torch.tensor(
+        [
+            [100, 50, 200, 75, 150, 25, 300, 80],  # 8 experts
+        ]
+    )
     num_replicas = 12
     num_groups = 4  # 4 groups, 2 experts each
     num_nodes = 2  # 2 nodes
     num_gpus = 4  # 4 GPUs
 
-    phy2log, log2phy, logcnt = rebalance_experts(weight, num_replicas,
-                                                 num_groups, num_nodes,
-                                                 num_gpus)
+    phy2log, log2phy, logcnt = rebalance_experts(
+        weight, num_replicas, num_groups, num_nodes, num_gpus
+    )
 
     # Verify basic constraints
     assert phy2log.shape == (1, 12)
@@ -199,8 +209,9 @@ def test_small_scale_hierarchical():
 
     # Expert with highest weight should have more replicas
     max_weight_expert = torch.argmax(weight[0])
-    assert (logcnt[0, max_weight_expert]
-            >= 2), "Highest weight expert should have multiple replicas"
+    assert logcnt[0, max_weight_expert] >= 2, (
+        "Highest weight expert should have multiple replicas"
+    )
 
 
 def test_global_load_balance_fallback():
@@ -213,9 +224,9 @@ def test_global_load_balance_fallback():
     num_nodes = 2
     num_gpus = 4
 
-    phy2log, log2phy, logcnt = rebalance_experts(weight, num_replicas,
-                                                 num_groups, num_nodes,
-                                                 num_gpus)
+    phy2log, log2phy, logcnt = rebalance_experts(
+        weight, num_replicas, num_groups, num_nodes, num_gpus
+    )
 
     # Should work normally, just using global load balancing strategy
     assert phy2log.shape == (1, 8)
@@ -235,9 +246,9 @@ def test_device_compatibility(device):
     num_nodes = 1
     num_gpus = 2
 
-    phy2log, log2phy, logcnt = rebalance_experts(weight, num_replicas,
-                                                 num_groups, num_nodes,
-                                                 num_gpus)
+    phy2log, log2phy, logcnt = rebalance_experts(
+        weight, num_replicas, num_groups, num_nodes, num_gpus
+    )
 
     # Function will convert to CPU internally, but should handle different
     # device inputs normally
@@ -250,7 +261,8 @@ def test_additional_cases():
 
     # Test case 1: Large-scale distributed setup
     weight1 = torch.tensor(
-        [[50, 100, 75, 120, 90, 60, 80, 110, 40, 70, 95, 85, 65, 55, 45, 35]])
+        [[50, 100, 75, 120, 90, 60, 80, 110, 40, 70, 95, 85, 65, 55, 45, 35]]
+    )
     phy2log1, log2phy1, logcnt1 = rebalance_experts(weight1, 24, 8, 4, 8)
 
     assert phy2log1.shape == (1, 24)
@@ -258,10 +270,12 @@ def test_additional_cases():
     assert torch.sum(logcnt1) == 24
 
     # Test case 2: Different weight distributions
-    weight2 = torch.tensor([
-        [200, 150, 100, 50, 25, 12],  # Decreasing weights
-        [12, 25, 50, 100, 150, 200],  # Increasing weights
-    ])
+    weight2 = torch.tensor(
+        [
+            [200, 150, 100, 50, 25, 12],  # Decreasing weights
+            [12, 25, 50, 100, 150, 200],  # Increasing weights
+        ]
+    )
     phy2log2, log2phy2, logcnt2 = rebalance_experts(weight2, 10, 3, 1, 2)
 
     assert phy2log2.shape == (2, 10)
@@ -274,19 +288,21 @@ def test_additional_cases():
 
 
 if __name__ == "__main__":
-    weight = torch.tensor([
-        [90, 132, 40, 61, 104, 165, 39, 4, 73, 56, 183, 86],
-        [20, 107, 104, 64, 19, 197, 187, 157, 172, 86, 16, 27],
-    ])
+    weight = torch.tensor(
+        [
+            [90, 132, 40, 61, 104, 165, 39, 4, 73, 56, 183, 86],
+            [20, 107, 104, 64, 19, 197, 187, 157, 172, 86, 16, 27],
+        ]
+    )
 
     num_replicas = 16
     num_groups = 4
     num_nodes = 2
     num_gpus = 8
 
-    phy2log, log2phy, logcnt = rebalance_experts(weight, num_replicas,
-                                                 num_groups, num_nodes,
-                                                 num_gpus)
+    phy2log, log2phy, logcnt = rebalance_experts(
+        weight, num_replicas, num_groups, num_nodes, num_gpus
+    )
     print(phy2log)
 
     test_basic_rebalance()
diff --git a/tests/distributed/test_eplb_execute.py b/tests/distributed/test_eplb_execute.py
index de9ed1eabbac..7ca3d3d27b56 100644
--- a/tests/distributed/test_eplb_execute.py
+++ b/tests/distributed/test_eplb_execute.py
@@ -9,11 +9,12 @@
 import torch
 import torch.distributed
 
-from vllm.distributed.eplb.rebalance_execute import (
-    rearrange_expert_weights_inplace)
-from vllm.distributed.parallel_state import (ensure_model_parallel_initialized,
-                                             get_tp_group,
-                                             init_distributed_environment)
+from vllm.distributed.eplb.rebalance_execute import rearrange_expert_weights_inplace
+from vllm.distributed.parallel_state import (
+    ensure_model_parallel_initialized,
+    get_tp_group,
+    init_distributed_environment,
+)
 from vllm.utils import update_environment_variables
 
 
@@ -22,13 +23,13 @@ def distributed_run(fn, world_size):
     processes: list[multiprocessing.Process] = []
     for i in range(number_of_processes):
         env: dict[str, str] = {}
-        env['RANK'] = str(i)
-        env['LOCAL_RANK'] = str(i)
-        env['WORLD_SIZE'] = str(number_of_processes)
-        env['LOCAL_WORLD_SIZE'] = str(number_of_processes)
-        env['MASTER_ADDR'] = 'localhost'
-        env['MASTER_PORT'] = '12345'
-        p = multiprocessing.Process(target=fn, args=(env, ))
+        env["RANK"] = str(i)
+        env["LOCAL_RANK"] = str(i)
+        env["WORLD_SIZE"] = str(number_of_processes)
+        env["LOCAL_WORLD_SIZE"] = str(number_of_processes)
+        env["MASTER_ADDR"] = "localhost"
+        env["MASTER_PORT"] = "12345"
+        p = multiprocessing.Process(target=fn, args=(env,))
         processes.append(p)
         p.start()
 
@@ -45,7 +46,7 @@ def worker_fn_wrapper(fn):
     # and update the environment variables in the function
     def wrapped_fn(env):
         update_environment_variables(env)
-        local_rank = os.environ['LOCAL_RANK']
+        local_rank = os.environ["LOCAL_RANK"]
         device = torch.device(f"cuda:{local_rank}")
         torch.cuda.set_device(device)
         init_distributed_environment()
@@ -60,20 +61,20 @@ def wrapped_fn(env):
 
 
 def create_expert_indices_with_redundancy(
-        num_layers: int,
-        num_logical_experts: int,
-        total_physical_experts: int,
-        redundancy_config: list[int],  # redundancy for each logical expert
+    num_layers: int,
+    num_logical_experts: int,
+    total_physical_experts: int,
+    redundancy_config: list[int],  # redundancy for each logical expert
 ) -> torch.Tensor:
     """
     Create expert indices with redundancy.
-    
+
     Args:
         num_layers: number of layers
         num_logical_experts: number of logical experts
         total_physical_experts: total number of physical experts
         redundancy_config: redundancy for each logical expert
-    
+
     Returns:
         indices: Shape (num_layers, total_physical_experts)
     """
@@ -106,11 +107,11 @@ def create_expert_weights(
 ) -> list[list[torch.Tensor]]:
     """
     Create fake expert weights tensor for testing.
-    
+
     Use `arange` to generate predictable weights values, based on logical
     expert ID.
     All replicas of the same logical expert should have the same weights.
-    
+
     Args:
         physical_to_logical_mapping: Shape (num_layers, num_local_experts)
             mapping[layer, physical_pos] = logical_expert_id
@@ -120,27 +121,27 @@ def create_expert_weights(
     for layer in range(num_layers):
         layer_weights = []
         for weight_idx, hidden_size in enumerate(hidden_sizes):
-            weight_tensor = torch.zeros(num_local_experts,
-                                        hidden_size,
-                                        device=device,
-                                        dtype=torch.float32)
+            weight_tensor = torch.zeros(
+                num_local_experts, hidden_size, device=device, dtype=torch.float32
+            )
 
             for local_expert in range(num_local_experts):
                 # Get the logical expert ID for this physical expert
                 global_pos = rank * num_local_experts + local_expert
                 logical_expert_id = physical_to_logical_mapping[
-                    layer, global_pos].item()
+                    layer, global_pos
+                ].item()
 
                 # Generate weights based on logical expert ID
                 # (so that all replicas of the same logical expert have the
                 # same weights)
-                base_value = (logical_expert_id * 1000 + layer * 100 +
-                              weight_idx * 10)
-                weight_tensor[local_expert] = torch.arange(base_value,
-                                                           base_value +
-                                                           hidden_size,
-                                                           device=device,
-                                                           dtype=torch.float32)
+                base_value = logical_expert_id * 1000 + layer * 100 + weight_idx * 10
+                weight_tensor[local_expert] = torch.arange(
+                    base_value,
+                    base_value + hidden_size,
+                    device=device,
+                    dtype=torch.float32,
+                )
 
             layer_weights.append(weight_tensor)
         expert_weights.append(layer_weights)
@@ -182,12 +183,15 @@ def verify_expert_weights_after_shuffle(
 
                 # Check if the weights are correct
                 actual_weights = weight_tensor[local_expert]
-                expected_base = (expected_logical_expert * 1000 + layer * 100 +
-                                 weight_idx * 10)
-                expected_weights = torch.arange(expected_base,
-                                                expected_base + hidden_size,
-                                                device=actual_weights.device,
-                                                dtype=actual_weights.dtype)
+                expected_base = (
+                    expected_logical_expert * 1000 + layer * 100 + weight_idx * 10
+                )
+                expected_weights = torch.arange(
+                    expected_base,
+                    expected_base + hidden_size,
+                    device=actual_weights.device,
+                    dtype=actual_weights.dtype,
+                )
 
                 torch.testing.assert_close(
                     actual_weights,
@@ -195,7 +199,8 @@ def verify_expert_weights_after_shuffle(
                     msg=f"Layer {layer}, weight {weight_idx},"
                     f"local expert {local_expert}: "
                     f"weights do not match. "
-                    f"Expected logical expert {expected_logical_expert}")
+                    f"Expected logical expert {expected_logical_expert}",
+                )
 
 
 def verify_redundant_experts_have_same_weights(
@@ -222,23 +227,23 @@ def verify_redundant_experts_have_same_weights(
                 total_physical_experts,
                 hidden_size,
                 device=expert_weights[layer][weight_idx].device,
-                dtype=expert_weights[layer][weight_idx].dtype)
+                dtype=expert_weights[layer][weight_idx].dtype,
+            )
 
             # Use all_gather to collect expert weights from current node
             # expert_weights[layer][weight_idx] shape:
             # [num_local_experts, hidden_size]
             local_weights = expert_weights[layer][
-                weight_idx]  # [num_local_experts, hidden_size]
+                weight_idx
+            ]  # [num_local_experts, hidden_size]
 
             # Split tensor along dim 0 into a list for all_gather
-            gathered_weights_list = torch.chunk(gathered_weights,
-                                                world_size,
-                                                dim=0)
+            gathered_weights_list = torch.chunk(gathered_weights, world_size, dim=0)
 
             torch.distributed.all_gather(
                 # Output list: each element corresponds to one rank's weights
                 list(gathered_weights_list),
-                local_weights  # Input: current rank's local weights
+                local_weights,  # Input: current rank's local weights
             )
 
             all_weights.append(gathered_weights)
@@ -266,7 +271,8 @@ def verify_redundant_experts_have_same_weights(
                         msg=f"Layer {layer}, weight {weight_idx},"
                         f"logical expert {logical_expert_id}: "
                         f"Physical expert {physical_pos} has different weights"
-                        f"than expected")
+                        f"than expected",
+                    )
 
 
 @pytest.mark.parametrize(
@@ -290,10 +296,11 @@ def verify_redundant_experts_have_same_weights(
         # 4 GPU, 8 experts per GPU
         # 16 logical experts, 32 physical experts, 16 redundant experts
         (4, 8, 8, 16),
-    ])
-def test_rearrange_expert_weights_with_redundancy(world_size, num_layers,
-                                                  num_local_experts,
-                                                  num_logical_experts):
+    ],
+)
+def test_rearrange_expert_weights_with_redundancy(
+    world_size, num_layers, num_local_experts, num_logical_experts
+):
     """Test the functionality of rearranging expert weights with redundancy."""
 
     if torch.cuda.device_count() < world_size:
@@ -304,8 +311,8 @@ def worker_fn():
         # Initialize model parallel (using tensor parallel as an entrypoint
         # to expert parallel)
         ensure_model_parallel_initialized(
-            tensor_model_parallel_size=world_size,
-            pipeline_model_parallel_size=1)
+            tensor_model_parallel_size=world_size, pipeline_model_parallel_size=1
+        )
 
         ep_group = get_tp_group().cpu_group
         ep_rank = torch.distributed.get_rank()
@@ -316,8 +323,9 @@ def worker_fn():
         hidden_sizes = [32, 64]  # Two different weight matrices
 
         # Create old expert indices (with redundancy)
-        redundancy_config = create_redundancy_config(num_logical_experts,
-                                                     total_physical_experts)
+        redundancy_config = create_redundancy_config(
+            num_logical_experts, total_physical_experts
+        )
 
         old_indices = create_expert_indices_with_redundancy(
             num_layers,
@@ -328,7 +336,8 @@ def worker_fn():
 
         # Create new expert indices (with redundancy)
         new_redundancy_config = create_redundancy_config(
-            num_logical_experts, total_physical_experts)
+            num_logical_experts, total_physical_experts
+        )
         new_indices = create_expert_indices_with_redundancy(
             num_layers,
             num_logical_experts,
@@ -337,9 +346,9 @@ def worker_fn():
         )
 
         # Create expert weights
-        expert_weights = create_expert_weights(num_layers, num_local_experts,
-                                               hidden_sizes, ep_rank, device,
-                                               old_indices)
+        expert_weights = create_expert_weights(
+            num_layers, num_local_experts, hidden_sizes, ep_rank, device, old_indices
+        )
 
         # Execute weight rearrangement
         rearrange_expert_weights_inplace(
@@ -383,8 +392,8 @@ def test_rearrange_expert_weights_no_change(world_size):
     @worker_fn_wrapper
     def worker_fn():
         ensure_model_parallel_initialized(
-            tensor_model_parallel_size=world_size,
-            pipeline_model_parallel_size=1)
+            tensor_model_parallel_size=world_size, pipeline_model_parallel_size=1
+        )
 
         ep_group = get_tp_group().cpu_group
         ep_rank = torch.distributed.get_rank()
@@ -401,12 +410,12 @@ def worker_fn():
 
         # Same indices - no change
         indices = create_expert_indices_with_redundancy(
-            num_layers, num_logical_experts, total_physical_experts,
-            redundancy_config)
+            num_layers, num_logical_experts, total_physical_experts, redundancy_config
+        )
 
-        expert_weights = create_expert_weights(num_layers, num_local_experts,
-                                               hidden_sizes, ep_rank, device,
-                                               indices)
+        expert_weights = create_expert_weights(
+            num_layers, num_local_experts, hidden_sizes, ep_rank, device, indices
+        )
 
         # Save original weights
         original_weights = []
@@ -422,7 +431,8 @@ def worker_fn():
             indices,  # Same indices
             expert_weights,
             ep_group,
-            is_profile=False)
+            is_profile=False,
+        )
 
         # Verify that the weights have not changed
         for layer in range(num_layers):
@@ -430,8 +440,8 @@ def worker_fn():
                 torch.testing.assert_close(
                     expert_weights[layer][weight_idx],
                     original_weights[layer][weight_idx],
-                    msg=f"Layer {layer}, weight {weight_idx} should remain "
-                    f"unchanged")
+                    msg=f"Layer {layer}, weight {weight_idx} should remain unchanged",
+                )
 
     distributed_run(worker_fn, world_size)
 
@@ -446,8 +456,8 @@ def test_rearrange_expert_weights_profile_mode(world_size):
     @worker_fn_wrapper
     def worker_fn():
         ensure_model_parallel_initialized(
-            tensor_model_parallel_size=world_size,
-            pipeline_model_parallel_size=1)
+            tensor_model_parallel_size=world_size, pipeline_model_parallel_size=1
+        )
 
         ep_group = get_tp_group().cpu_group
         ep_rank = torch.distributed.get_rank()
@@ -460,21 +470,23 @@ def worker_fn():
         hidden_sizes = [32]
 
         # Create different index distributions
-        old_redundancy = create_redundancy_config(num_logical_experts,
-                                                  total_physical_experts)
-        new_redundancy = create_redundancy_config(num_logical_experts,
-                                                  total_physical_experts)
+        old_redundancy = create_redundancy_config(
+            num_logical_experts, total_physical_experts
+        )
+        new_redundancy = create_redundancy_config(
+            num_logical_experts, total_physical_experts
+        )
 
         old_indices = create_expert_indices_with_redundancy(
-            num_layers, num_logical_experts, total_physical_experts,
-            old_redundancy)
+            num_layers, num_logical_experts, total_physical_experts, old_redundancy
+        )
         new_indices = create_expert_indices_with_redundancy(
-            num_layers, num_logical_experts, total_physical_experts,
-            new_redundancy)
+            num_layers, num_logical_experts, total_physical_experts, new_redundancy
+        )
 
-        expert_weights = create_expert_weights(num_layers, num_local_experts,
-                                               hidden_sizes, ep_rank, device,
-                                               old_indices)
+        expert_weights = create_expert_weights(
+            num_layers, num_local_experts, hidden_sizes, ep_rank, device, old_indices
+        )
 
         # Save original weights
         original_weights = []
@@ -490,7 +502,7 @@ def worker_fn():
             new_indices,
             expert_weights,
             ep_group,
-            is_profile=True  # Profile mode
+            is_profile=True,  # Profile mode
         )
 
         # In profile mode, the weights should remain unchanged
@@ -499,6 +511,7 @@ def worker_fn():
                 torch.testing.assert_close(
                     expert_weights[layer][weight_idx],
                     original_weights[layer][weight_idx],
-                    msg="In profile mode, the weights should remain unchanged")
+                    msg="In profile mode, the weights should remain unchanged",
+                )
 
     distributed_run(worker_fn, world_size)
diff --git a/tests/distributed/test_events.py b/tests/distributed/test_events.py
index 8be9ee0a1889..f06f6771a4a0 100644
--- a/tests/distributed/test_events.py
+++ b/tests/distributed/test_events.py
@@ -6,24 +6,29 @@
 import msgspec
 import pytest
 
-from vllm.distributed.kv_events import (EventBatch, EventPublisherFactory,
-                                        NullEventPublisher)
+from vllm.distributed.kv_events import (
+    EventBatch,
+    EventPublisherFactory,
+    NullEventPublisher,
+)
 
 DP_RANK = 0
 
 
 class EventSample(
-        msgspec.Struct,
-        tag=True,  # type: ignore
-        array_like=True  # type: ignore
+    msgspec.Struct,
+    tag=True,  # type: ignore
+    array_like=True,  # type: ignore
 ):
     """Test event for publisher testing"""
+
     id: int
     value: str
 
 
 class SampleBatch(EventBatch):
     """Test event batch for publisher testing"""
+
     events: list[EventSample]
 
 
@@ -44,10 +49,8 @@ def test_basic_publishing(publisher, subscriber):
 
     seq, received = result
     assert seq == 0, "Sequence number mismatch"
-    assert received.ts == pytest.approx(test_batch.ts,
-                                        abs=0.1), ("Timestamp mismatch")
-    assert len(received.events) == len(
-        test_batch.events), ("Number of events mismatch")
+    assert received.ts == pytest.approx(test_batch.ts, abs=0.1), "Timestamp mismatch"
+    assert len(received.events) == len(test_batch.events), "Number of events mismatch"
 
     for i, event in enumerate(received.events):
         assert event.id == i, "Event id mismatch"
@@ -88,9 +91,9 @@ def test_replay_mechanism(publisher, subscriber):
     assert len(replayed) > 0, "No replayed messages received"
     seqs = [seq for seq, _ in replayed]
     assert all(seq >= 10 for seq in seqs), "Replayed messages not in order"
-    assert seqs == list(range(min(seqs),
-                              max(seqs) +
-                              1)), ("Replayed messages not consecutive")
+    assert seqs == list(range(min(seqs), max(seqs) + 1)), (
+        "Replayed messages not consecutive"
+    )
 
 
 def test_buffer_limit(publisher, subscriber, publisher_config):
@@ -126,6 +129,7 @@ def test_topic_filtering(publisher_config):
     pub = EventPublisherFactory.create(publisher_config, DP_RANK)
 
     from .conftest import MockSubscriber
+
     sub_foo = MockSubscriber(publisher_config.endpoint, None, "foo")
     sub_bar = MockSubscriber(publisher_config.endpoint, None, "bar")
 
@@ -137,11 +141,13 @@ def test_topic_filtering(publisher_config):
 
         foo_received = [sub_foo.receive_one(timeout=200) for _ in range(3)]
         assert all(msg is not None for msg in foo_received), (
-            "Subscriber with matching topic should receive messages")
+            "Subscriber with matching topic should receive messages"
+        )
 
         bar_received = [sub_bar.receive_one(timeout=200) for _ in range(3)]
         assert all(msg is None for msg in bar_received), (
-            "Subscriber with non-matching topic should receive no messages")
+            "Subscriber with non-matching topic should receive no messages"
+        )
     finally:
         pub.shutdown()
         sub_foo.close()
@@ -178,8 +184,7 @@ def publish_events():
 
     publisher_thread.join()
 
-    assert len(received) >= num_batches * 0.9, (
-        "We should have received most messages")
+    assert len(received) >= num_batches * 0.9, "We should have received most messages"
 
     seqs = [seq for seq, _ in received]
     assert sorted(seqs) == seqs, "Sequence numbers should be in order"
@@ -209,13 +214,15 @@ def test_data_parallel_rank_tagging(publisher_config):
         # For TCP endpoints: tcp://localhost:5557 -> tcp://localhost:5557, tcp://localhost:5558
         expected_endpoint_0 = base_endpoint  # rank 0 gets port + 0 = same port
         expected_endpoint_1 = base_endpoint.replace(
-            ":5557", ":5558")  # rank 1 gets port + 1
+            ":5557", ":5558"
+        )  # rank 1 gets port + 1
     else:
         # For inproc endpoints: inproc://test -> inproc://test_dp0, inproc://test_dp1
         expected_endpoint_0 = base_endpoint  # rank 0 gets base
         expected_endpoint_1 = base_endpoint + "_dp1"  # rank 1 gets _dp1
 
     from .conftest import MockSubscriber
+
     sub_0 = MockSubscriber(expected_endpoint_0, None, publisher_config.topic)
     sub_1 = MockSubscriber(expected_endpoint_1, None, publisher_config.topic)
 
@@ -241,15 +248,15 @@ def test_data_parallel_rank_tagging(publisher_config):
 
         # Verify DP rank tagging
         assert received_0.data_parallel_rank == 0, (
-            f"Expected DP rank 0, got {received_0.data_parallel_rank}")
+            f"Expected DP rank 0, got {received_0.data_parallel_rank}"
+        )
         assert received_1.data_parallel_rank == 1, (
-            f"Expected DP rank 1, got {received_1.data_parallel_rank}")
+            f"Expected DP rank 1, got {received_1.data_parallel_rank}"
+        )
 
         # Verify event content is correct
-        assert len(
-            received_0.events) == 2, "Wrong number of events from rank 0"
-        assert len(
-            received_1.events) == 3, "Wrong number of events from rank 1"
+        assert len(received_0.events) == 2, "Wrong number of events from rank 0"
+        assert len(received_1.events) == 3, "Wrong number of events from rank 1"
 
     finally:
         pub_0.shutdown()
diff --git a/tests/distributed/test_expert_parallel.py b/tests/distributed/test_expert_parallel.py
index f273f302e72e..68ac52af3061 100644
--- a/tests/distributed/test_expert_parallel.py
+++ b/tests/distributed/test_expert_parallel.py
@@ -46,28 +46,24 @@ def detailed(
     ):
         return EPTestSettings(
             parallel_setups=[
-                ParallelSetup(tp_size=tp_base,
-                              eager_mode=False,
-                              chunked_prefill=False),
-                ParallelSetup(tp_size=tp_base,
-                              eager_mode=False,
-                              chunked_prefill=True),
-                ParallelSetup(tp_size=tp_base,
-                              eager_mode=True,
-                              chunked_prefill=False),
-                ParallelSetup(tp_size=2 * tp_base,
-                              eager_mode=False,
-                              chunked_prefill=True),
-                ParallelSetup(tp_size=2 * tp_base,
-                              eager_mode=True,
-                              chunked_prefill=False),
+                ParallelSetup(tp_size=tp_base, eager_mode=False, chunked_prefill=False),
+                ParallelSetup(tp_size=tp_base, eager_mode=False, chunked_prefill=True),
+                ParallelSetup(tp_size=tp_base, eager_mode=True, chunked_prefill=False),
+                ParallelSetup(
+                    tp_size=2 * tp_base, eager_mode=False, chunked_prefill=True
+                ),
+                ParallelSetup(
+                    tp_size=2 * tp_base, eager_mode=True, chunked_prefill=False
+                ),
             ],
             distributed_backends=["mp", "ray"],
             runner=runner,
-            test_options=EPTestOptions(trust_remote_code=trust_remote_code,
-                                       tokenizer_mode=tokenizer_mode,
-                                       load_format=load_format,
-                                       hf_overrides=hf_overrides),
+            test_options=EPTestOptions(
+                trust_remote_code=trust_remote_code,
+                tokenizer_mode=tokenizer_mode,
+                load_format=load_format,
+                hf_overrides=hf_overrides,
+            ),
         )
 
     @staticmethod
@@ -82,16 +78,16 @@ def fast(
     ):
         return EPTestSettings(
             parallel_setups=[
-                ParallelSetup(tp_size=tp_base,
-                              eager_mode=True,
-                              chunked_prefill=False),
+                ParallelSetup(tp_size=tp_base, eager_mode=True, chunked_prefill=False),
             ],
             distributed_backends=["mp"],
             runner=runner,
-            test_options=EPTestOptions(trust_remote_code=trust_remote_code,
-                                       tokenizer_mode=tokenizer_mode,
-                                       load_format=load_format,
-                                       hf_overrides=hf_overrides),
+            test_options=EPTestOptions(
+                trust_remote_code=trust_remote_code,
+                tokenizer_mode=tokenizer_mode,
+                load_format=load_format,
+                hf_overrides=hf_overrides,
+            ),
         )
 
     def iter_params(self, model_name: str):
@@ -99,8 +95,13 @@ def iter_params(self, model_name: str):
 
         for parallel_setup in self.parallel_setups:
             for distributed_backend in self.distributed_backends:
-                yield (model_name, parallel_setup, distributed_backend,
-                       self.runner, opts)
+                yield (
+                    model_name,
+                    parallel_setup,
+                    distributed_backend,
+                    self.runner,
+                    opts,
+                )
 
 
 # NOTE: You can adjust tp_base locally to fit the model in GPU
diff --git a/tests/distributed/test_expert_placement.py b/tests/distributed/test_expert_placement.py
index a3b1b3193deb..49e672c3516d 100644
--- a/tests/distributed/test_expert_placement.py
+++ b/tests/distributed/test_expert_placement.py
@@ -6,8 +6,7 @@
 from vllm.model_executor.layers.fused_moe.layer import determine_expert_map
 
 
-def verify_round_robin_pattern(expert_map, ep_rank, ep_size,
-                               global_num_experts):
+def verify_round_robin_pattern(expert_map, ep_rank, ep_size, global_num_experts):
     """Verify that the expert map follows the round_robin pattern."""
     # Calculate expected local experts (supporting non-divisible cases)
     base_experts = global_num_experts // ep_size
@@ -30,24 +29,21 @@ def verify_round_robin_pattern(expert_map, ep_rank, ep_size,
         if global_expert_id in expected_expert_ids:
             local_expert_id = expert_map[global_expert_id]
             expected_local_id = expected_expert_ids.index(global_expert_id)
-            assert (
-                local_expert_id == expected_local_id
-            ), f"Global expert {global_expert_id} should map to local expert " \
+            assert local_expert_id == expected_local_id, (
+                f"Global expert {global_expert_id} should map to local expert "
                 f"{expected_local_id}, got {local_expert_id}"
+            )
         else:
-            assert (
-                expert_map[global_expert_id] == -1
-            ), f"Global expert {global_expert_id} should not be mapped to " \
-                f"this rank"
+            assert expert_map[global_expert_id] == -1, (
+                f"Global expert {global_expert_id} should not be mapped to this rank"
+            )
 
     # Verify that all local expert IDs are consecutive starting from 0
-    local_expert_ids = [
-        expert_map[global_id] for global_id in expected_expert_ids
-    ]
+    local_expert_ids = [expert_map[global_id] for global_id in expected_expert_ids]
     expected_local_ids = list(range(local_num_experts))
-    assert (
-        local_expert_ids == expected_local_ids
-    ), f"Expected local expert IDs {expected_local_ids}, got {local_expert_ids}"
+    assert local_expert_ids == expected_local_ids, (
+        f"Expected local expert IDs {expected_local_ids}, got {local_expert_ids}"
+    )
 
 
 @pytest.mark.parametrize("expert_placement_strategy", ["round_robin"])
@@ -78,8 +74,9 @@ def test_expert_placement_various_sizes(expert_placement_strategy, world_size):
 
     for test_global_experts, test_ep_size in test_cases:
         # Ensure ep_size matches world_size
-        assert (test_ep_size == world_size
-                ), f"ep_size {test_ep_size} must equal world_size {world_size}"
+        assert test_ep_size == world_size, (
+            f"ep_size {test_ep_size} must equal world_size {world_size}"
+        )
 
         # Test each rank
         for ep_rank in range(world_size):
@@ -98,21 +95,22 @@ def test_expert_placement_various_sizes(expert_placement_strategy, world_size):
                 expert_placement_strategy=expert_placement_strategy,
             )
 
-            assert (
-                test_local_experts == expected_test_local
-            ), f"For {test_global_experts} experts on {test_ep_size} ranks, " \
-                f"rank {ep_rank}: expected {expected_test_local} local" \
+            assert test_local_experts == expected_test_local, (
+                f"For {test_global_experts} experts on {test_ep_size} ranks, "
+                f"rank {ep_rank}: expected {expected_test_local} local"
                 f"experts, got {test_local_experts}"
+            )
 
             if test_expert_map is not None:
-                assert test_expert_map.shape == (
-                    test_global_experts,
-                ), f"Expected expert map shape ({test_global_experts},), " \
+                assert test_expert_map.shape == (test_global_experts,), (
+                    f"Expected expert map shape ({test_global_experts},), "
                     f"got {test_expert_map.shape}"
+                )
 
                 # Verify round_robin pattern for this test case
-                verify_round_robin_pattern(test_expert_map, ep_rank,
-                                           test_ep_size, test_global_experts)
+                verify_round_robin_pattern(
+                    test_expert_map, ep_rank, test_ep_size, test_global_experts
+                )
 
 
 @pytest.mark.parametrize("expert_placement_strategy", ["round_robin"])
@@ -147,28 +145,81 @@ def test_determine_expert_map_comprehensive():
     # expert_placement_strategy, expected_local, expected_map_pattern)
     test_cases = [
         # Round robin placement tests
-        (2, 0, 8, "round_robin", 4, [0, -1, 1, -1, 2, -1, 3,
-                                     -1]),  # rank 0 gets even experts
-        (2, 1, 8, "round_robin", 4, [-1, 0, -1, 1, -1, 2, -1,
-                                     3]),  # rank 1 gets odd experts
-        (2, 0, 9, "round_robin", 5, [0, -1, 1, -1, 2, -1, 3, -1, 4
-                                     ]),  # rank 0 gets 5 experts (even + last)
-        (2, 1, 9, "round_robin", 4, [-1, 0, -1, 1, -1, 2, -1, 3,
-                                     -1]),  # rank 1 gets 4 experts (odd)
-
+        (
+            2,
+            0,
+            8,
+            "round_robin",
+            4,
+            [0, -1, 1, -1, 2, -1, 3, -1],
+        ),  # rank 0 gets even experts
+        (
+            2,
+            1,
+            8,
+            "round_robin",
+            4,
+            [-1, 0, -1, 1, -1, 2, -1, 3],
+        ),  # rank 1 gets odd experts
+        (
+            2,
+            0,
+            9,
+            "round_robin",
+            5,
+            [0, -1, 1, -1, 2, -1, 3, -1, 4],
+        ),  # rank 0 gets 5 experts (even + last)
+        (
+            2,
+            1,
+            9,
+            "round_robin",
+            4,
+            [-1, 0, -1, 1, -1, 2, -1, 3, -1],
+        ),  # rank 1 gets 4 experts (odd)
         # 4-rank tests
-        (4, 0, 8, "round_robin", 2, [0, -1, -1, -1, 1, -1, -1,
-                                     -1]),  # rank 0 gets experts 0, 4
-        (4, 1, 8, "round_robin", 2, [-1, 0, -1, -1, -1, 1, -1,
-                                     -1]),  # rank 1 gets experts 1, 5
-        (4, 2, 8, "round_robin", 2, [-1, -1, 0, -1, -1, -1, 1,
-                                     -1]),  # rank 2 gets experts 2, 6
-        (4, 3, 8, "round_robin", 2, [-1, -1, -1, 0, -1, -1, -1,
-                                     1]),  # rank 3 gets experts 3, 7
+        (
+            4,
+            0,
+            8,
+            "round_robin",
+            2,
+            [0, -1, -1, -1, 1, -1, -1, -1],
+        ),  # rank 0 gets experts 0, 4
+        (
+            4,
+            1,
+            8,
+            "round_robin",
+            2,
+            [-1, 0, -1, -1, -1, 1, -1, -1],
+        ),  # rank 1 gets experts 1, 5
+        (
+            4,
+            2,
+            8,
+            "round_robin",
+            2,
+            [-1, -1, 0, -1, -1, -1, 1, -1],
+        ),  # rank 2 gets experts 2, 6
+        (
+            4,
+            3,
+            8,
+            "round_robin",
+            2,
+            [-1, -1, -1, 0, -1, -1, -1, 1],
+        ),  # rank 3 gets experts 3, 7
     ]
 
-    for ep_size, ep_rank, global_num_experts, expert_placement_strategy, \
-        expected_local, expected_map_pattern in test_cases:
+    for (
+        ep_size,
+        ep_rank,
+        global_num_experts,
+        expert_placement_strategy,
+        expected_local,
+        expected_map_pattern,
+    ) in test_cases:
         local_num_experts, expert_map = determine_expert_map(
             ep_size=ep_size,
             ep_rank=ep_rank,
@@ -176,19 +227,21 @@ def test_determine_expert_map_comprehensive():
             expert_placement_strategy=expert_placement_strategy,
         )
 
-        assert local_num_experts == expected_local, \
-            f"ep_size={ep_size}, ep_rank={ep_rank}, " \
-            f"global_num_experts={global_num_experts}, " \
-            f"expert_placement_strategy={expert_placement_strategy}: " \
+        assert local_num_experts == expected_local, (
+            f"ep_size={ep_size}, ep_rank={ep_rank}, "
+            f"global_num_experts={global_num_experts}, "
+            f"expert_placement_strategy={expert_placement_strategy}: "
             f"expected {expected_local} local experts, got {local_num_experts}"
+        )
 
         if expected_map_pattern is None:
             assert expert_map is None, "Expected expert_map to be None"
         else:
             assert expert_map is not None, "Expected expert_map to not be None"
             actual_map = expert_map.tolist()
-            assert actual_map == expected_map_pattern, \
-                f"ep_size={ep_size}, ep_rank={ep_rank}, " \
-                f"global_num_experts={global_num_experts}, " \
-                f"expert_placement_strategy={expert_placement_strategy}: " \
+            assert actual_map == expected_map_pattern, (
+                f"ep_size={ep_size}, ep_rank={ep_rank}, "
+                f"global_num_experts={global_num_experts}, "
+                f"expert_placement_strategy={expert_placement_strategy}: "
                 f"expected map {expected_map_pattern}, got {actual_map}"
+            )
diff --git a/tests/distributed/test_kvlayout.py b/tests/distributed/test_kvlayout.py
index d447876f6cc7..b190b2820451 100644
--- a/tests/distributed/test_kvlayout.py
+++ b/tests/distributed/test_kvlayout.py
@@ -1,10 +1,16 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from vllm.config import (DeviceConfig, KVTransferConfig, ModelConfig,
-                         VllmConfig, set_current_vllm_config)
+from vllm.config import (
+    DeviceConfig,
+    KVTransferConfig,
+    ModelConfig,
+    VllmConfig,
+    set_current_vllm_config,
+)
 from vllm.distributed.kv_transfer.kv_connector.utils import (
-    get_kv_connector_cache_layout)
+    get_kv_connector_cache_layout,
+)
 from vllm.logger import init_logger
 
 logger = init_logger("test_expert_parallel")
@@ -23,8 +29,9 @@ def test_get_kv_connector_cache_layout_with_lmcache_connector():
         kv_connector="LMCacheConnectorV1",
         kv_role="kv_both",
     )
-    vllm_config = VllmConfig(device_config=DeviceConfig("cpu"),
-                             kv_transfer_config=kv_transfer_config)
+    vllm_config = VllmConfig(
+        device_config=DeviceConfig("cpu"), kv_transfer_config=kv_transfer_config
+    )
     with set_current_vllm_config(vllm_config):
         # Test with default settings
         layout = get_kv_connector_cache_layout()
@@ -37,9 +44,11 @@ def test_get_kv_connector_cache_layout_with_nixl_connector():
         kv_role="kv_both",
     )
     model_config = ModelConfig()
-    vllm_config = VllmConfig(device_config=DeviceConfig("cpu"),
-                             model_config=model_config,
-                             kv_transfer_config=kv_transfer_config)
+    vllm_config = VllmConfig(
+        device_config=DeviceConfig("cpu"),
+        model_config=model_config,
+        kv_transfer_config=kv_transfer_config,
+    )
     with set_current_vllm_config(vllm_config):
         # Test with default settings
         layout = get_kv_connector_cache_layout()
@@ -47,25 +56,22 @@ def test_get_kv_connector_cache_layout_with_nixl_connector():
 
 
 def test_get_kv_connector_cache_layout_with_multi_connector():
-    kv_transfer_config = KVTransferConfig(kv_connector="MultiConnector",
-                                          kv_role="kv_both",
-                                          kv_connector_extra_config={
-                                              "connectors": [{
-                                                  "kv_connector":
-                                                  "SharedStorageConnector",
-                                                  "kv_role":
-                                                  "kv_both"
-                                              }, {
-                                                  "kv_connector":
-                                                  "NixlConnector",
-                                                  "kv_role":
-                                                  "kv_both"
-                                              }]
-                                          })
+    kv_transfer_config = KVTransferConfig(
+        kv_connector="MultiConnector",
+        kv_role="kv_both",
+        kv_connector_extra_config={
+            "connectors": [
+                {"kv_connector": "SharedStorageConnector", "kv_role": "kv_both"},
+                {"kv_connector": "NixlConnector", "kv_role": "kv_both"},
+            ]
+        },
+    )
     model_config = ModelConfig()
-    vllm_config = VllmConfig(device_config=DeviceConfig("cpu"),
-                             model_config=model_config,
-                             kv_transfer_config=kv_transfer_config)
+    vllm_config = VllmConfig(
+        device_config=DeviceConfig("cpu"),
+        model_config=model_config,
+        kv_transfer_config=kv_transfer_config,
+    )
     with set_current_vllm_config(vllm_config):
         # Test with default settings
         layout = get_kv_connector_cache_layout()
diff --git a/tests/distributed/test_multi_node_assignment.py b/tests/distributed/test_multi_node_assignment.py
index ef17a51fff0e..8d818edbb3bd 100644
--- a/tests/distributed/test_multi_node_assignment.py
+++ b/tests/distributed/test_multi_node_assignment.py
@@ -24,14 +24,13 @@
 VLLM_MULTI_NODE = os.getenv("VLLM_MULTI_NODE", "0") == "1"
 
 
-@pytest.mark.skipif(not VLLM_MULTI_NODE,
-                    reason="Need at least 2 nodes to run the test.")
+@pytest.mark.skipif(
+    not VLLM_MULTI_NODE, reason="Need at least 2 nodes to run the test."
+)
 def test_multi_node_assignment() -> None:
-
     # NOTE: important to keep this class definition here
     # to let ray use cloudpickle to serialize it.
     class Actor:
-
         def get_ip(self):
             return get_ip()
 
@@ -41,8 +40,7 @@ def get_ip(self):
 
         current_ip = get_ip()
         workers = []
-        for bundle_id, bundle in enumerate(
-                config.placement_group.bundle_specs):
+        for bundle_id, bundle in enumerate(config.placement_group.bundle_specs):
             if not bundle.get("GPU", 0):
                 continue
             scheduling_strategy = PlacementGroupSchedulingStrategy(
diff --git a/tests/distributed/test_nccl_symm_mem_allreduce.py b/tests/distributed/test_nccl_symm_mem_allreduce.py
index ffc913742620..40dcf7567c92 100644
--- a/tests/distributed/test_nccl_symm_mem_allreduce.py
+++ b/tests/distributed/test_nccl_symm_mem_allreduce.py
@@ -11,15 +11,17 @@
 
 import vllm.envs as envs
 from vllm.distributed import cleanup_dist_env_and_memory
-from vllm.distributed.device_communicators.cuda_communicator import (
-    CudaCommunicator)
-from vllm.distributed.device_communicators.pynccl import (
-    register_nccl_symmetric_ops)
+from vllm.distributed.device_communicators.cuda_communicator import CudaCommunicator
+from vllm.distributed.device_communicators.pynccl import register_nccl_symmetric_ops
 from vllm.distributed.device_communicators.pynccl_allocator import (
-    get_nccl_mem_pool, is_symmetric_memory_enabled)
-from vllm.distributed.parallel_state import (get_tp_group,
-                                             init_distributed_environment,
-                                             initialize_model_parallel)
+    get_nccl_mem_pool,
+    is_symmetric_memory_enabled,
+)
+from vllm.distributed.parallel_state import (
+    get_tp_group,
+    init_distributed_environment,
+    initialize_model_parallel,
+)
 from vllm.platforms import current_platform
 from vllm.utils import update_environment_variables
 
@@ -38,31 +40,32 @@ def nccl_symm_mem_allreduce_worker(local_rank: int, world_size: int):
         torch.cuda.set_device(device)
         torch.set_default_device(device)
         torch.set_default_dtype(dtype)
-        update_environment_variables({
-            "RANK": str(local_rank),
-            "LOCAL_RANK": str(local_rank),
-            "WORLD_SIZE": str(world_size),
-            "MASTER_ADDR": "localhost",
-            "MASTER_PORT": "12345",
-        })
+        update_environment_variables(
+            {
+                "RANK": str(local_rank),
+                "LOCAL_RANK": str(local_rank),
+                "WORLD_SIZE": str(world_size),
+                "MASTER_ADDR": "localhost",
+                "MASTER_PORT": "12345",
+            }
+        )
 
         init_distributed_environment()
         initialize_model_parallel(tensor_model_parallel_size=world_size)
 
-        cuda_communicator = typing.cast(CudaCommunicator,
-                                        get_tp_group().device_communicator)
+        cuda_communicator = typing.cast(
+            CudaCommunicator, get_tp_group().device_communicator
+        )
         pynccl_comm = cuda_communicator.pynccl_comm
         if get_nccl_mem_pool() is None:
-            pytest.skip("NCCL allocator compilation failed "
-                        "(probably missing NCCL headers).")
+            pytest.skip(
+                "NCCL allocator compilation failed (probably missing NCCL headers)."
+            )
         if not is_symmetric_memory_enabled():
             pytest.skip("NCCL symmetric memory allreduce is disabled.")
 
         register_nccl_symmetric_ops(pynccl_comm)
-        input = torch.randint(1,
-                              23, (test_size_elements, ),
-                              dtype=dtype,
-                              device=device)
+        input = torch.randint(1, 23, (test_size_elements,), dtype=dtype, device=device)
         input_clone = input.clone()
         output = torch.ops.vllm.all_reduce_symmetric_with_copy(input)
         assert output is not None
@@ -77,8 +80,7 @@ def nccl_symm_mem_allreduce_worker(local_rank: int, world_size: int):
     reason="NCCLSymmMemAllreduce is only available for CUDA platforms.",
 )
 @pytest.mark.parametrize("world_size", [2])
-@pytest.mark.skipif(envs.VLLM_TARGET_DEVICE not in ["cuda"],
-                    reason="Only test on CUDA")
+@pytest.mark.skipif(envs.VLLM_TARGET_DEVICE not in ["cuda"], reason="Only test on CUDA")
 def test_nccl_symm_mem_allreduce(monkeypatch: pytest.MonkeyPatch, world_size):
     if world_size > torch.cuda.device_count():
         pytest.skip("Not enough GPUs to run the test.")
@@ -88,7 +90,5 @@ def test_nccl_symm_mem_allreduce(monkeypatch: pytest.MonkeyPatch, world_size):
     monkeypatch.setenv("NCCL_NVLS_ENABLE", "1")
     monkeypatch.setenv("NCCL_CUMEM_ENABLE", "1")
 
-    mp.spawn(nccl_symm_mem_allreduce_worker,
-             args=(world_size, ),
-             nprocs=world_size)
+    mp.spawn(nccl_symm_mem_allreduce_worker, args=(world_size,), nprocs=world_size)
     cleanup_dist_env_and_memory()
diff --git a/tests/distributed/test_node_count.py b/tests/distributed/test_node_count.py
index e3c36ef5ef37..b48c025aa1a2 100644
--- a/tests/distributed/test_node_count.py
+++ b/tests/distributed/test_node_count.py
@@ -32,12 +32,15 @@
         # Expected node count based on environment variable)
         expected = int(os.environ.get("NUM_NODES", "1"))
 
-        assert test_result == expected, \
-            f"Expected {expected} nodes, got {test_result}"
+        assert test_result == expected, f"Expected {expected} nodes, got {test_result}"
 
         if pg == dist.group.WORLD:
-            print(f"Node count test passed! Got {test_result} nodes "
-                  f"when using torch distributed!")
+            print(
+                f"Node count test passed! Got {test_result} nodes "
+                f"when using torch distributed!"
+            )
         else:
-            print(f"Node count test passed! Got {test_result} nodes "
-                  f"when using StatelessProcessGroup!")
+            print(
+                f"Node count test passed! Got {test_result} nodes "
+                f"when using StatelessProcessGroup!"
+            )
diff --git a/tests/distributed/test_pipeline_parallel.py b/tests/distributed/test_pipeline_parallel.py
index aa28ed9ce25e..26ee60c150c1 100644
--- a/tests/distributed/test_pipeline_parallel.py
+++ b/tests/distributed/test_pipeline_parallel.py
@@ -7,6 +7,7 @@
  all workers in a node other than the head node, which can cause the test
  to fail.
 """
+
 import json
 import os
 from dataclasses import dataclass
@@ -55,26 +56,17 @@ def detailed(
     ):
         return PPTestSettings(
             parallel_setups=[
-                ParallelSetup(tp_size=tp_base,
-                              pp_size=pp_base,
-                              eager_mode=False),
-                ParallelSetup(tp_size=tp_base,
-                              pp_size=2 * pp_base,
-                              eager_mode=False),
-                ParallelSetup(tp_size=tp_base,
-                              pp_size=2 * pp_base,
-                              eager_mode=True),
-                ParallelSetup(tp_size=2 * tp_base,
-                              pp_size=pp_base,
-                              eager_mode=False),
-                ParallelSetup(tp_size=2 * tp_base,
-                              pp_size=pp_base,
-                              eager_mode=True),
+                ParallelSetup(tp_size=tp_base, pp_size=pp_base, eager_mode=False),
+                ParallelSetup(tp_size=tp_base, pp_size=2 * pp_base, eager_mode=False),
+                ParallelSetup(tp_size=tp_base, pp_size=2 * pp_base, eager_mode=True),
+                ParallelSetup(tp_size=2 * tp_base, pp_size=pp_base, eager_mode=False),
+                ParallelSetup(tp_size=2 * tp_base, pp_size=pp_base, eager_mode=True),
             ],
             distributed_backends=["mp", "ray"],
             runner=runner,
-            test_options=PPTestOptions(multi_node_only=multi_node_only,
-                                       load_format=load_format),
+            test_options=PPTestOptions(
+                multi_node_only=multi_node_only, load_format=load_format
+            ),
         )
 
     @staticmethod
@@ -86,17 +78,15 @@ def fast(
         multi_node_only: bool = False,
         load_format: Optional[str] = None,
     ):
-
         return PPTestSettings(
             parallel_setups=[
-                ParallelSetup(tp_size=tp_base,
-                              pp_size=pp_base,
-                              eager_mode=True),
+                ParallelSetup(tp_size=tp_base, pp_size=pp_base, eager_mode=True),
             ],
             distributed_backends=["mp"],
             runner=runner,
-            test_options=PPTestOptions(multi_node_only=multi_node_only,
-                                       load_format=load_format),
+            test_options=PPTestOptions(
+                multi_node_only=multi_node_only, load_format=load_format
+            ),
         )
 
     def iter_params(self, model_id: str):
@@ -281,8 +271,10 @@ def _compare_tp(
     if num_gpus_available < tp_size * pp_size:
         pytest.skip(f"Need at least {tp_size} x {pp_size} GPUs")
     if VLLM_MULTI_NODE and distributed_backend == "mp":
-        pytest.skip("Skipping multi-node pipeline parallel test for "
-                    "multiprocessing distributed backend")
+        pytest.skip(
+            "Skipping multi-node pipeline parallel test for "
+            "multiprocessing distributed backend"
+        )
     if multi_node_only and not VLLM_MULTI_NODE:
         pytest.skip("Not in multi-node setting")
 
@@ -357,20 +349,16 @@ def _compare_tp(
         "mp",
     ]
 
-    compare_two_settings(model_id,
-                         pp_args,
-                         tp_args,
-                         pp_env,
-                         tp_env,
-                         method=method)
+    compare_two_settings(model_id, pp_args, tp_args, pp_env, tp_env, method=method)
 
 
 @pytest.mark.parametrize(
-    ("model_id", "parallel_setup", "distributed_backend", "runner",
-     "test_options"),
+    ("model_id", "parallel_setup", "distributed_backend", "runner", "test_options"),
     [
-        params for model_id, settings in TEXT_GENERATION_MODELS.items()
-        for params in settings.iter_params(model_id) if model_id in TEST_MODELS
+        params
+        for model_id, settings in TEXT_GENERATION_MODELS.items()
+        for params in settings.iter_params(model_id)
+        if model_id in TEST_MODELS
     ],
 )
 @create_new_process_for_each_test()
@@ -382,22 +370,25 @@ def test_tp_language_generation(
     test_options: PPTestOptions,
     num_gpus_available,
 ):
-    _compare_tp(model_id,
-                parallel_setup,
-                distributed_backend,
-                runner,
-                test_options,
-                num_gpus_available,
-                method="generate",
-                is_multimodal=False)
+    _compare_tp(
+        model_id,
+        parallel_setup,
+        distributed_backend,
+        runner,
+        test_options,
+        num_gpus_available,
+        method="generate",
+        is_multimodal=False,
+    )
 
 
 @pytest.mark.parametrize(
-    ("model_id", "parallel_setup", "distributed_backend", "runner",
-     "test_options"),
+    ("model_id", "parallel_setup", "distributed_backend", "runner", "test_options"),
     [
-        params for model_id, settings in EMBEDDING_MODELS.items()
-        for params in settings.iter_params(model_id) if model_id in TEST_MODELS
+        params
+        for model_id, settings in EMBEDDING_MODELS.items()
+        for params in settings.iter_params(model_id)
+        if model_id in TEST_MODELS
     ],
 )
 @create_new_process_for_each_test()
@@ -409,22 +400,25 @@ def test_tp_language_embedding(
     test_options: PPTestOptions,
     num_gpus_available,
 ):
-    _compare_tp(model_id,
-                parallel_setup,
-                distributed_backend,
-                runner,
-                test_options,
-                num_gpus_available,
-                method="encode",
-                is_multimodal=False)
+    _compare_tp(
+        model_id,
+        parallel_setup,
+        distributed_backend,
+        runner,
+        test_options,
+        num_gpus_available,
+        method="encode",
+        is_multimodal=False,
+    )
 
 
 @pytest.mark.parametrize(
-    ("model_id", "parallel_setup", "distributed_backend", "runner",
-     "test_options"),
+    ("model_id", "parallel_setup", "distributed_backend", "runner", "test_options"),
     [
-        params for model_id, settings in MULTIMODAL_MODELS.items()
-        for params in settings.iter_params(model_id) if model_id in TEST_MODELS
+        params
+        for model_id, settings in MULTIMODAL_MODELS.items()
+        for params in settings.iter_params(model_id)
+        if model_id in TEST_MODELS
     ],
 )
 @create_new_process_for_each_test()
@@ -436,11 +430,13 @@ def test_tp_multimodal_generation(
     test_options: PPTestOptions,
     num_gpus_available,
 ):
-    _compare_tp(model_id,
-                parallel_setup,
-                distributed_backend,
-                runner,
-                test_options,
-                num_gpus_available,
-                method="generate",
-                is_multimodal=True)
+    _compare_tp(
+        model_id,
+        parallel_setup,
+        distributed_backend,
+        runner,
+        test_options,
+        num_gpus_available,
+        method="generate",
+        is_multimodal=True,
+    )
diff --git a/tests/distributed/test_pipeline_partition.py b/tests/distributed/test_pipeline_partition.py
index 69ceedd345a8..4df6f43970d7 100644
--- a/tests/distributed/test_pipeline_partition.py
+++ b/tests/distributed/test_pipeline_partition.py
@@ -9,7 +9,6 @@
 
 
 def test_custom_layer_partition(monkeypatch: pytest.MonkeyPatch):
-
     with monkeypatch.context() as m:
 
         def _verify(partition_str, num_layers, pp_size, goldens):
@@ -57,7 +56,8 @@ def _verify(partition_str, num_layers, pp_size, goldens):
         (5, 3, 0, (0, 2)),
         (5, 3, 1, (2, 4)),
         (5, 3, 2, (4, 5)),
-    ])
+    ],
+)
 def test_uneven_auto_partition(
     num_hidden_layers: int,
     pp_size: int,
diff --git a/tests/distributed/test_pp_cudagraph.py b/tests/distributed/test_pp_cudagraph.py
index 5ca65a0e8d2c..2c9f47464008 100644
--- a/tests/distributed/test_pp_cudagraph.py
+++ b/tests/distributed/test_pp_cudagraph.py
@@ -12,12 +12,18 @@
     from typing_extensions import LiteralString
 
 
-@pytest.mark.parametrize("PP_SIZE, MODEL_NAME", [
-    (2, "JackFram/llama-160m"),
-])
-@pytest.mark.parametrize("ATTN_BACKEND", [
-    "FLASH_ATTN",
-])
+@pytest.mark.parametrize(
+    "PP_SIZE, MODEL_NAME",
+    [
+        (2, "JackFram/llama-160m"),
+    ],
+)
+@pytest.mark.parametrize(
+    "ATTN_BACKEND",
+    [
+        "FLASH_ATTN",
+    ],
+)
 @create_new_process_for_each_test()
 def test_pp_cudagraph(
     monkeypatch: pytest.MonkeyPatch,
diff --git a/tests/distributed/test_pynccl.py b/tests/distributed/test_pynccl.py
index abfad9ebfe7d..4bab709fb589 100644
--- a/tests/distributed/test_pynccl.py
+++ b/tests/distributed/test_pynccl.py
@@ -9,13 +9,15 @@
 import torch
 import torch.distributed
 
-from vllm.distributed.communication_op import (  # noqa
-    tensor_model_parallel_all_reduce)
+from vllm.distributed.communication_op import tensor_model_parallel_all_reduce  # noqa
 from vllm.distributed.device_communicators.pynccl import PyNcclCommunicator
 from vllm.distributed.device_communicators.pynccl_wrapper import NCCLLibrary
-from vllm.distributed.parallel_state import (ensure_model_parallel_initialized,
-                                             get_world_group, graph_capture,
-                                             init_distributed_environment)
+from vllm.distributed.parallel_state import (
+    ensure_model_parallel_initialized,
+    get_world_group,
+    graph_capture,
+    init_distributed_environment,
+)
 from vllm.utils import update_environment_variables
 
 
@@ -24,13 +26,13 @@ def distributed_run(fn, world_size):
     processes: list[multiprocessing.Process] = []
     for i in range(number_of_processes):
         env: dict[str, str] = {}
-        env['RANK'] = str(i)
-        env['LOCAL_RANK'] = str(i)
-        env['WORLD_SIZE'] = str(number_of_processes)
-        env['LOCAL_WORLD_SIZE'] = str(number_of_processes)
-        env['MASTER_ADDR'] = 'localhost'
-        env['MASTER_PORT'] = '12345'
-        p = multiprocessing.Process(target=fn, args=(env, ))
+        env["RANK"] = str(i)
+        env["LOCAL_RANK"] = str(i)
+        env["WORLD_SIZE"] = str(number_of_processes)
+        env["LOCAL_WORLD_SIZE"] = str(number_of_processes)
+        env["MASTER_ADDR"] = "localhost"
+        env["MASTER_PORT"] = "12345"
+        p = multiprocessing.Process(target=fn, args=(env,))
         processes.append(p)
         p.start()
 
@@ -47,7 +49,7 @@ def worker_fn_wrapper(fn):
     # and update the environment variables in the function
     def wrapped_fn(env):
         update_environment_variables(env)
-        local_rank = os.environ['LOCAL_RANK']
+        local_rank = os.environ["LOCAL_RANK"]
         device = torch.device(f"cuda:{local_rank}")
         torch.cuda.set_device(device)
         init_distributed_environment()
@@ -58,17 +60,18 @@ def wrapped_fn(env):
 
 @worker_fn_wrapper
 def worker_fn():
-    pynccl_comm = PyNcclCommunicator(get_world_group().cpu_group,
-                                     device=get_world_group().device)
-    tensor = torch.ones(16, 1024, 1024,
-                        dtype=torch.float32).cuda(pynccl_comm.rank)
+    pynccl_comm = PyNcclCommunicator(
+        get_world_group().cpu_group, device=get_world_group().device
+    )
+    tensor = torch.ones(16, 1024, 1024, dtype=torch.float32).cuda(pynccl_comm.rank)
     tensor = pynccl_comm.all_reduce(tensor)
     torch.cuda.synchronize()
     assert torch.all(tensor == pynccl_comm.world_size).cpu().item()
 
 
-@pytest.mark.skipif(torch.cuda.device_count() < 2,
-                    reason="Need at least 2 GPUs to run the test.")
+@pytest.mark.skipif(
+    torch.cuda.device_count() < 2, reason="Need at least 2 GPUs to run the test."
+)
 def test_pynccl():
     distributed_run(worker_fn, 2)
 
@@ -78,7 +81,7 @@ def multiple_allreduce_worker_fn():
     device = torch.device(f"cuda:{torch.distributed.get_rank()}")
     groups = [
         torch.distributed.new_group(ranks=[0, 1], backend="gloo"),
-        torch.distributed.new_group(ranks=[2, 3], backend="gloo")
+        torch.distributed.new_group(ranks=[2, 3], backend="gloo"),
     ]
     group = groups[0] if torch.distributed.get_rank() in [0, 1] else groups[1]
     pynccl_comm = PyNcclCommunicator(group=group, device=device)
@@ -95,8 +98,9 @@ def multiple_allreduce_worker_fn():
         assert torch.all(tensor == 2).cpu().item()
 
 
-@pytest.mark.skipif(torch.cuda.device_count() < 4,
-                    reason="Need at least 4 GPUs to run the test.")
+@pytest.mark.skipif(
+    torch.cuda.device_count() < 4, reason="Need at least 4 GPUs to run the test."
+)
 def test_pynccl_multiple_allreduce():
     # this tests pynccl for multiple tp groups, in a standalone way
     # i.e. call `pynccl_comm.all_reduce` directly
@@ -121,8 +125,9 @@ def multiple_allreduce_with_vllm_worker_fn():
             assert torch.all(tensor == 2).cpu().item()
 
 
-@pytest.mark.skipif(torch.cuda.device_count() < 4,
-                    reason="Need at least 4 GPUs to run the test.")
+@pytest.mark.skipif(
+    torch.cuda.device_count() < 4, reason="Need at least 4 GPUs to run the test."
+)
 def test_pynccl_multiple_allreduce_with_vllm():
     # this tests pynccl for multiple tp groups, together with vllm
     # i.e. call `tensor_model_parallel_all_reduce`
@@ -133,10 +138,11 @@ def test_pynccl_multiple_allreduce_with_vllm():
 def worker_fn_with_cudagraph():
     with torch.no_grad():
         graph = torch.cuda.CUDAGraph()
-        pynccl_comm = PyNcclCommunicator(get_world_group().cpu_group,
-                                         device=get_world_group().device)
+        pynccl_comm = PyNcclCommunicator(
+            get_world_group().cpu_group, device=get_world_group().device
+        )
         # run something in the default stream to initialize torch engine
-        a = torch.ones((4, 4), device=f'cuda:{pynccl_comm.rank}')
+        a = torch.ones((4, 4), device=f"cuda:{pynccl_comm.rank}")
         torch.cuda.synchronize()
         with torch.cuda.graph(graph):
             a_out = pynccl_comm.all_reduce(a)
@@ -148,84 +154,90 @@ def worker_fn_with_cudagraph():
 
 @worker_fn_wrapper
 def all_gather_worker_fn():
-    pynccl_comm = PyNcclCommunicator(get_world_group().cpu_group,
-                                     device=get_world_group().device)
+    pynccl_comm = PyNcclCommunicator(
+        get_world_group().cpu_group, device=get_world_group().device
+    )
 
     rank = pynccl_comm.rank
     world_size = pynccl_comm.world_size
-    device = f'cuda:{pynccl_comm.rank}'
+    device = f"cuda:{pynccl_comm.rank}"
 
     num_elems = 1000
-    tensor = torch.arange(num_elems, dtype=torch.float32,
-                          device=device) + rank * num_elems
-    result = torch.zeros(num_elems * world_size,
-                         dtype=torch.float32,
-                         device=device)
-
-    expected = torch.cat([
-        torch.arange(num_elems, dtype=torch.float32) + r * num_elems
-        for r in range(world_size)
-    ]).to(device)
+    tensor = (
+        torch.arange(num_elems, dtype=torch.float32, device=device) + rank * num_elems
+    )
+    result = torch.zeros(num_elems * world_size, dtype=torch.float32, device=device)
+
+    expected = torch.cat(
+        [
+            torch.arange(num_elems, dtype=torch.float32) + r * num_elems
+            for r in range(world_size)
+        ]
+    ).to(device)
 
     pynccl_comm.all_gather(result, tensor)
     torch.cuda.synchronize()
     torch.testing.assert_close(result, expected, rtol=1e-5, atol=1e-8)
 
 
-@pytest.mark.skipif(torch.cuda.device_count() < 2,
-                    reason="Need at least 2 GPUs to run the test.")
+@pytest.mark.skipif(
+    torch.cuda.device_count() < 2, reason="Need at least 2 GPUs to run the test."
+)
 def test_pynccl_all_gather():
     distributed_run(all_gather_worker_fn, 2)
 
 
 @worker_fn_wrapper
 def all_gatherv_worker_fn():
-    pynccl_comm = PyNcclCommunicator(get_world_group().cpu_group,
-                                     device=get_world_group().device)
+    pynccl_comm = PyNcclCommunicator(
+        get_world_group().cpu_group, device=get_world_group().device
+    )
 
     rank = pynccl_comm.rank
     world_size = pynccl_comm.world_size
-    device = f'cuda:{pynccl_comm.rank}'
+    device = f"cuda:{pynccl_comm.rank}"
 
     assert world_size <= 8
     sizes = [81, 20, 57, 52, 81, 5, 49, 49][:world_size]
     num_elems = sizes[rank]
-    tensor = torch.arange(num_elems, dtype=torch.float32,
-                          device=device) + rank * 100
+    tensor = torch.arange(num_elems, dtype=torch.float32, device=device) + rank * 100
     result = torch.zeros(sum(sizes), dtype=torch.float32, device=device)
 
-    expected = torch.cat([
-        torch.arange(sizes[r], dtype=torch.float32) + r * 100
-        for r in range(world_size)
-    ]).to(device)
+    expected = torch.cat(
+        [
+            torch.arange(sizes[r], dtype=torch.float32) + r * 100
+            for r in range(world_size)
+        ]
+    ).to(device)
 
     pynccl_comm.all_gatherv(result, tensor, sizes=sizes)
     torch.cuda.synchronize()
     torch.testing.assert_close(result, expected, rtol=1e-5, atol=1e-8)
 
 
-@pytest.mark.skipif(torch.cuda.device_count() < 2,
-                    reason="Need at least 2 GPUs to run the test.")
+@pytest.mark.skipif(
+    torch.cuda.device_count() < 2, reason="Need at least 2 GPUs to run the test."
+)
 def test_pynccl_all_gatherv():
     distributed_run(all_gatherv_worker_fn, 2)
 
 
 @worker_fn_wrapper
 def reduce_scatter_worker_fn():
-    pynccl_comm = PyNcclCommunicator(get_world_group().cpu_group,
-                                     device=get_world_group().device)
+    pynccl_comm = PyNcclCommunicator(
+        get_world_group().cpu_group, device=get_world_group().device
+    )
 
     rank = pynccl_comm.rank
     world_size = pynccl_comm.world_size
-    device = f'cuda:{pynccl_comm.rank}'
+    device = f"cuda:{pynccl_comm.rank}"
 
     num_elems = 1000
-    tensor = torch.arange(num_elems, dtype=torch.float32,
-                          device=device) + rank * num_elems
-    assert (num_elems % world_size == 0)
-    result = torch.zeros(num_elems // world_size,
-                         dtype=torch.float32,
-                         device=device)
+    tensor = (
+        torch.arange(num_elems, dtype=torch.float32, device=device) + rank * num_elems
+    )
+    assert num_elems % world_size == 0
+    result = torch.zeros(num_elems // world_size, dtype=torch.float32, device=device)
 
     # Calculate expected result for this rank's chunk
     scattered_size = num_elems // world_size
@@ -233,34 +245,37 @@ def reduce_scatter_worker_fn():
         torch.arange(num_elems, dtype=torch.float32) + r * num_elems
         for r in range(world_size)
     ]
-    expected = sum(tensor[rank * scattered_size:(rank + 1) * scattered_size]
-                   for tensor in all_tensors).to(device)
+    expected = sum(
+        tensor[rank * scattered_size : (rank + 1) * scattered_size]
+        for tensor in all_tensors
+    ).to(device)
 
     pynccl_comm.reduce_scatter(result, tensor)
     torch.cuda.synchronize()
     torch.testing.assert_close(result, expected, rtol=1e-5, atol=1e-8)
 
 
-@pytest.mark.skipif(torch.cuda.device_count() < 2,
-                    reason="Need at least 2 GPUs to run the test.")
+@pytest.mark.skipif(
+    torch.cuda.device_count() < 2, reason="Need at least 2 GPUs to run the test."
+)
 def test_pynccl_reduce_scatter():
     distributed_run(reduce_scatter_worker_fn, 2)
 
 
 @worker_fn_wrapper
 def reduce_scatterv_worker_fn():
-    pynccl_comm = PyNcclCommunicator(get_world_group().cpu_group,
-                                     device=get_world_group().device)
+    pynccl_comm = PyNcclCommunicator(
+        get_world_group().cpu_group, device=get_world_group().device
+    )
 
     rank = pynccl_comm.rank
     world_size = pynccl_comm.world_size
-    device = f'cuda:{pynccl_comm.rank}'
+    device = f"cuda:{pynccl_comm.rank}"
 
     assert world_size <= 8
     sizes = [81, 20, 57, 52, 81, 5, 49, 49][:world_size]
     num_elems = sum(sizes)
-    tensor = torch.arange(num_elems, dtype=torch.float32,
-                          device=device) + rank * 100
+    tensor = torch.arange(num_elems, dtype=torch.float32, device=device) + rank * 100
     result = torch.zeros(sizes[rank], dtype=torch.float32, device=device)
 
     # Calculate expected result for this rank's chunk
@@ -278,41 +293,41 @@ def reduce_scatterv_worker_fn():
     torch.testing.assert_close(result, expected, rtol=1e-5, atol=1e-8)
 
 
-@pytest.mark.skipif(torch.cuda.device_count() < 2,
-                    reason="Need at least 2 GPUs to run the test.")
+@pytest.mark.skipif(
+    torch.cuda.device_count() < 2, reason="Need at least 2 GPUs to run the test."
+)
 def test_pynccl_reduce_scatterv():
     distributed_run(reduce_scatterv_worker_fn, 2)
 
 
-@pytest.mark.skipif(torch.cuda.device_count() < 2,
-                    reason="Need at least 2 GPUs to run the test.")
+@pytest.mark.skipif(
+    torch.cuda.device_count() < 2, reason="Need at least 2 GPUs to run the test."
+)
 def test_pynccl_with_cudagraph():
     distributed_run(worker_fn_with_cudagraph, 2)
 
 
 @worker_fn_wrapper
 def send_recv_worker_fn():
-    pynccl_comm = PyNcclCommunicator(get_world_group().cpu_group,
-                                     device=get_world_group().device)
+    pynccl_comm = PyNcclCommunicator(
+        get_world_group().cpu_group, device=get_world_group().device
+    )
     if pynccl_comm.rank == 0:
-        tensor = torch.ones(16, 1024, 1024,
-                            dtype=torch.float32).cuda(pynccl_comm.rank)
+        tensor = torch.ones(16, 1024, 1024, dtype=torch.float32).cuda(pynccl_comm.rank)
     else:
-        tensor = torch.empty(16, 1024, 1024,
-                             dtype=torch.float32).cuda(pynccl_comm.rank)
+        tensor = torch.empty(16, 1024, 1024, dtype=torch.float32).cuda(pynccl_comm.rank)
 
     if pynccl_comm.rank == 0:
-        pynccl_comm.send(tensor,
-                         dst=(pynccl_comm.rank + 1) % pynccl_comm.world_size)
+        pynccl_comm.send(tensor, dst=(pynccl_comm.rank + 1) % pynccl_comm.world_size)
     else:
-        pynccl_comm.recv(tensor,
-                         src=(pynccl_comm.rank - 1) % pynccl_comm.world_size)
+        pynccl_comm.recv(tensor, src=(pynccl_comm.rank - 1) % pynccl_comm.world_size)
     torch.cuda.synchronize()
     assert torch.all(tensor == 1).cpu().item()
 
 
-@pytest.mark.skipif(torch.cuda.device_count() < 2,
-                    reason="Need at least 2 GPUs to run the test.")
+@pytest.mark.skipif(
+    torch.cuda.device_count() < 2, reason="Need at least 2 GPUs to run the test."
+)
 def test_pynccl_send_recv():
     distributed_run(send_recv_worker_fn, 2)
 
@@ -322,27 +337,20 @@ def multiple_send_recv_worker_fn():
     device = torch.device(f"cuda:{torch.distributed.get_rank()}")
     groups = [
         torch.distributed.new_group(ranks=[0, 2], backend="gloo"),
-        torch.distributed.new_group(ranks=[1, 3], backend="gloo")
+        torch.distributed.new_group(ranks=[1, 3], backend="gloo"),
     ]
     group = groups[0] if torch.distributed.get_rank() in [0, 2] else groups[1]
     pynccl_comm = PyNcclCommunicator(group=group, device=device)
     if torch.distributed.get_rank() == 0:
         tensor = torch.ones(16, 1024, 1024, dtype=torch.float32, device=device)
     elif torch.distributed.get_rank() == 1:
-        tensor = 2 * torch.ones(
-            16, 1024, 1024, dtype=torch.float32, device=device)
+        tensor = 2 * torch.ones(16, 1024, 1024, dtype=torch.float32, device=device)
     else:
-        tensor = torch.empty(16,
-                             1024,
-                             1024,
-                             dtype=torch.float32,
-                             device=device)
+        tensor = torch.empty(16, 1024, 1024, dtype=torch.float32, device=device)
     if torch.distributed.get_rank() in [0, 1]:
-        pynccl_comm.send(tensor,
-                         dst=(pynccl_comm.rank + 1) % pynccl_comm.world_size)
+        pynccl_comm.send(tensor, dst=(pynccl_comm.rank + 1) % pynccl_comm.world_size)
     else:
-        pynccl_comm.recv(tensor,
-                         src=(pynccl_comm.rank - 1) % pynccl_comm.world_size)
+        pynccl_comm.recv(tensor, src=(pynccl_comm.rank - 1) % pynccl_comm.world_size)
     torch.cuda.synchronize()
     if torch.distributed.get_rank() in [0, 2]:
         assert torch.all(tensor == 1).cpu().item()
@@ -350,14 +358,16 @@ def multiple_send_recv_worker_fn():
         assert torch.all(tensor == 2).cpu().item()
 
 
-@pytest.mark.skipif(torch.cuda.device_count() < 4,
-                    reason="Need at least 4 GPUs to run the test.")
+@pytest.mark.skipif(
+    torch.cuda.device_count() < 4, reason="Need at least 4 GPUs to run the test."
+)
 def test_pynccl_multiple_send_recv():
     distributed_run(multiple_send_recv_worker_fn, 4)
 
 
-@pytest.mark.skipif(torch.cuda.device_count() < 4,
-                    reason="Need at least 4 GPUs to run the test.")
+@pytest.mark.skipif(
+    torch.cuda.device_count() < 4, reason="Need at least 4 GPUs to run the test."
+)
 def test_pynccl_broadcast():
     distributed_run(broadcast_worker_fn, 4)
 
@@ -366,19 +376,17 @@ def test_pynccl_broadcast():
 def broadcast_worker_fn():
     # Test broadcast for every root rank.
     # Essentially this is an all-gather operation.
-    pynccl_comm = PyNcclCommunicator(get_world_group().cpu_group,
-                                     device=get_world_group().device)
+    pynccl_comm = PyNcclCommunicator(
+        get_world_group().cpu_group, device=get_world_group().device
+    )
     recv_tensors = [
-        torch.empty(16,
-                    1024,
-                    1024,
-                    dtype=torch.float32,
-                    device=pynccl_comm.device)
+        torch.empty(16, 1024, 1024, dtype=torch.float32, device=pynccl_comm.device)
         for i in range(pynccl_comm.world_size)
     ]
-    recv_tensors[pynccl_comm.rank] = torch.ones(
-        16, 1024, 1024, dtype=torch.float32,
-        device=pynccl_comm.device) * pynccl_comm.rank
+    recv_tensors[pynccl_comm.rank] = (
+        torch.ones(16, 1024, 1024, dtype=torch.float32, device=pynccl_comm.device)
+        * pynccl_comm.rank
+    )
 
     for i in range(pynccl_comm.world_size):
         pynccl_comm.broadcast(recv_tensors[i], src=i)
diff --git a/tests/distributed/test_quick_all_reduce.py b/tests/distributed/test_quick_all_reduce.py
index 6245ccbeca87..2df88377345d 100644
--- a/tests/distributed/test_quick_all_reduce.py
+++ b/tests/distributed/test_quick_all_reduce.py
@@ -8,20 +8,20 @@
 import torch
 import torch.distributed as dist
 
-from vllm.distributed.communication_op import (  # noqa
-    tensor_model_parallel_all_reduce)
+from vllm.distributed.communication_op import tensor_model_parallel_all_reduce  # noqa
 from vllm.distributed.parallel_state import get_tp_group, graph_capture
 from vllm.platforms import current_platform
 
-from ..utils import (ensure_model_parallel_initialized,
-                     init_test_distributed_environment, multi_process_parallel)
+from ..utils import (
+    ensure_model_parallel_initialized,
+    init_test_distributed_environment,
+    multi_process_parallel,
+)
 
 torch.manual_seed(42)
 random.seed(44)
 # Size over 8MB is sufficient for custom quick allreduce.
-test_sizes = [
-    random.randint(8 * 1024 * 1024, 10 * 1024 * 1024) for _ in range(8)
-]
+test_sizes = [random.randint(8 * 1024 * 1024, 10 * 1024 * 1024) for _ in range(8)]
 for i, v in enumerate(test_sizes):
     test_sizes[i] -= v % 8
 
@@ -38,8 +38,7 @@ def graph_quickreduce(
         m.delenv("CUDA_VISIBLE_DEVICES", raising=False)
         device = torch.device(f"cuda:{rank}")
         torch.cuda.set_device(device)
-        init_test_distributed_environment(tp_size, pp_size, rank,
-                                          distributed_init_port)
+        init_test_distributed_environment(tp_size, pp_size, rank, distributed_init_port)
         ensure_model_parallel_initialized(tp_size, pp_size)
         group = get_tp_group().device_group
 
@@ -64,18 +63,15 @@ def graph_quickreduce(
         for sz in test_sizes:
             for dtype in [torch.float16, torch.bfloat16]:
                 with graph_capture(device=device) as graph_capture_context:
-                    inp1 = torch.randint(1,
-                                         23, (sz, ),
-                                         dtype=dtype,
-                                         device=torch.cuda.current_device())
-                    inp2 = torch.randint(-23,
-                                         1, (sz, ),
-                                         dtype=dtype,
-                                         device=torch.cuda.current_device())
+                    inp1 = torch.randint(
+                        1, 23, (sz,), dtype=dtype, device=torch.cuda.current_device()
+                    )
+                    inp2 = torch.randint(
+                        -23, 1, (sz,), dtype=dtype, device=torch.cuda.current_device()
+                    )
                     torch.cuda.synchronize()
                     graph = torch.cuda.CUDAGraph()
-                    with torch.cuda.graph(graph,
-                                          stream=graph_capture_context.stream):
+                    with torch.cuda.graph(graph, stream=graph_capture_context.stream):
                         for _ in range(num_communication):
                             out1 = tensor_model_parallel_all_reduce(inp1)
                             dist.all_reduce(inp1, group=group)
@@ -99,39 +95,42 @@ def eager_quickreduce(
         device = torch.device(f"cuda:{rank}")
         torch.cuda.set_device(device)
 
-        init_test_distributed_environment(tp_size, pp_size, rank,
-                                          distributed_init_port)
+        init_test_distributed_environment(tp_size, pp_size, rank, distributed_init_port)
 
         # Size over 8MB is sufficient for custom quick allreduce.
         sz = 16 * 1024 * 1024
         fa = get_tp_group().device_communicator.qr_comm
-        inp = torch.tensor([1.0 * ((i) % 23) for i in range(sz)],
-                           dtype=torch.float16,
-                           device=device)
+        inp = torch.tensor(
+            [1.0 * ((i) % 23) for i in range(sz)], dtype=torch.float16, device=device
+        )
         out = fa.quick_all_reduce(inp)
         torch.testing.assert_close(out, inp * tp_size, atol=2.5, rtol=0.1)
 
-        inp = torch.tensor([1.0 * ((i) % 23) for i in range(sz)],
-                           dtype=torch.bfloat16,
-                           device=device)
+        inp = torch.tensor(
+            [1.0 * ((i) % 23) for i in range(sz)], dtype=torch.bfloat16, device=device
+        )
         out = fa.quick_all_reduce(inp)
         torch.testing.assert_close(out, inp * tp_size, atol=2.5, rtol=0.1)
 
 
-@pytest.mark.skipif(not current_platform.is_rocm(),
-                    reason="only test quick allreduce for rocm")
+@pytest.mark.skipif(
+    not current_platform.is_rocm(), reason="only test quick allreduce for rocm"
+)
 @pytest.mark.parametrize("quant_mode", ["FP", "INT8", "INT6", "INT4"])
 @pytest.mark.parametrize("tp_size", [2])
 @pytest.mark.parametrize("pipeline_parallel_size", [1, 2])
 @pytest.mark.parametrize("test_target", [graph_quickreduce, eager_quickreduce])
-def test_custom_quick_allreduce(monkeypatch: pytest.MonkeyPatch, tp_size,
-                                pipeline_parallel_size, test_target,
-                                quant_mode):
+def test_custom_quick_allreduce(
+    monkeypatch: pytest.MonkeyPatch,
+    tp_size,
+    pipeline_parallel_size,
+    test_target,
+    quant_mode,
+):
     world_size = tp_size * pipeline_parallel_size
     if world_size > torch.cuda.device_count():
         pytest.skip("Not enough GPUs to run the test.")
 
     monkeypatch.setenv("VLLM_ROCM_QUICK_REDUCE_QUANTIZATION", quant_mode)
 
-    multi_process_parallel(monkeypatch, tp_size, pipeline_parallel_size,
-                           test_target)
+    multi_process_parallel(monkeypatch, tp_size, pipeline_parallel_size, test_target)
diff --git a/tests/distributed/test_same_node.py b/tests/distributed/test_same_node.py
index 94ad8f4f1213..baf75fd48c63 100644
--- a/tests/distributed/test_same_node.py
+++ b/tests/distributed/test_same_node.py
@@ -22,15 +22,13 @@
         dist.broadcast_object_list(recv, src=0)
         ip, port = recv
 
-    stateless_pg = StatelessProcessGroup.create(ip, port, rank,
-                                                dist.get_world_size())
+    stateless_pg = StatelessProcessGroup.create(ip, port, rank, dist.get_world_size())
 
     for pg in [dist.group.WORLD, stateless_pg]:
         test_result = all(in_the_same_node_as(pg, source_rank=0))
 
         expected = os.environ.get("VLLM_TEST_SAME_HOST", "1") == "1"
-        assert test_result == expected, \
-            f"Expected {expected}, got {test_result}"
+        assert test_result == expected, f"Expected {expected}, got {test_result}"
         if pg == dist.group.WORLD:
             print("Same node test passed! when using torch distributed!")
         else:
diff --git a/tests/distributed/test_sequence_parallel.py b/tests/distributed/test_sequence_parallel.py
index ded3d834faf0..82eaed66717c 100644
--- a/tests/distributed/test_sequence_parallel.py
+++ b/tests/distributed/test_sequence_parallel.py
@@ -7,6 +7,7 @@
  all workers in a node other than the head node, which can cause the test
  to fail.
 """
+
 import json
 import os
 from dataclasses import dataclass
@@ -56,7 +57,8 @@ def __post_init__(self):
             raise ValueError(
                 f"Length mismatch: distributed_backends "
                 f"({len(self.distributed_backends)}) != "
-                f"vllm_major_versions ({len(self.vllm_major_versions)})")
+                f"vllm_major_versions ({len(self.vllm_major_versions)})"
+            )
 
     @staticmethod
     def detailed(
@@ -72,18 +74,22 @@ def detailed(
             for pp_multiplier in [1, 2]:
                 for chunked_prefill_val in [False, True]:
                     parallel_setups.append(
-                        ParallelSetup(tp_size=tp_base,
-                                      pp_size=pp_multiplier * pp_base,
-                                      enable_fusion=False,
-                                      eager_mode=eager_mode_val,
-                                      chunked_prefill=chunked_prefill_val))
+                        ParallelSetup(
+                            tp_size=tp_base,
+                            pp_size=pp_multiplier * pp_base,
+                            enable_fusion=False,
+                            eager_mode=eager_mode_val,
+                            chunked_prefill=chunked_prefill_val,
+                        )
+                    )
         return SPTestSettings(
             parallel_setups=parallel_setups,
             distributed_backends=["mp", "ray"],
             vllm_major_versions=["1", "1"],
             runner=runner,
-            test_options=SPTestOptions(multi_node_only=multi_node_only,
-                                       load_format=load_format),
+            test_options=SPTestOptions(
+                multi_node_only=multi_node_only, load_format=load_format
+            ),
         )
 
     @staticmethod
@@ -100,18 +106,22 @@ def fast(
             for pp_multiplier in [1, 2]:
                 for chunked_prefill_val in [False, True]:
                     parallel_setups.append(
-                        ParallelSetup(tp_size=tp_base,
-                                      pp_size=pp_multiplier * pp_base,
-                                      enable_fusion=False,
-                                      eager_mode=eager_mode_val,
-                                      chunked_prefill=chunked_prefill_val))
+                        ParallelSetup(
+                            tp_size=tp_base,
+                            pp_size=pp_multiplier * pp_base,
+                            enable_fusion=False,
+                            eager_mode=eager_mode_val,
+                            chunked_prefill=chunked_prefill_val,
+                        )
+                    )
         return SPTestSettings(
             parallel_setups=parallel_setups,
             distributed_backends=["mp", "ray"],
             vllm_major_versions=["1", "1"],
             runner=runner,
-            test_options=SPTestOptions(multi_node_only=multi_node_only,
-                                       load_format=load_format),
+            test_options=SPTestOptions(
+                multi_node_only=multi_node_only, load_format=load_format
+            ),
         )
 
     @staticmethod
@@ -126,28 +136,39 @@ def fp8_quant(
         parallel_setups = []
         for fusion_val in [False, True]:
             parallel_setups.append(
-                ParallelSetup(tp_size=tp_base,
-                              pp_size=pp_base,
-                              enable_fusion=fusion_val,
-                              eager_mode=True,
-                              chunked_prefill=False))
+                ParallelSetup(
+                    tp_size=tp_base,
+                    pp_size=pp_base,
+                    enable_fusion=fusion_val,
+                    eager_mode=True,
+                    chunked_prefill=False,
+                )
+            )
         return SPTestSettings(
             parallel_setups=parallel_setups,
             distributed_backends=["mp", "ray"],
             vllm_major_versions=["1", "1"],
             runner=runner,
-            test_options=SPTestOptions(multi_node_only=multi_node_only,
-                                       load_format=load_format),
+            test_options=SPTestOptions(
+                multi_node_only=multi_node_only, load_format=load_format
+            ),
         )
 
     def iter_params(self, model_id: str):
         opts = self.test_options
 
         for parallel_setup in self.parallel_setups:
-            for backend, vllm_major_version in zip(self.distributed_backends,
-                                                   self.vllm_major_versions):
-                yield (model_id, parallel_setup, backend, vllm_major_version,
-                       self.runner, opts)
+            for backend, vllm_major_version in zip(
+                self.distributed_backends, self.vllm_major_versions
+            ):
+                yield (
+                    model_id,
+                    parallel_setup,
+                    backend,
+                    vllm_major_version,
+                    self.runner,
+                    opts,
+                )
 
 
 def _compare_sp(
@@ -200,8 +221,10 @@ def _compare_sp(
     if num_gpus_available < tp_size * pp_size:
         pytest.skip(f"Need at least {tp_size} x {pp_size} GPUs")
     if VLLM_MULTI_NODE and distributed_backend == "mp":
-        pytest.skip("Skipping multi-node pipeline parallel test for "
-                    "multiprocessing distributed backend")
+        pytest.skip(
+            "Skipping multi-node pipeline parallel test for "
+            "multiprocessing distributed backend"
+        )
     if multi_node_only and not VLLM_MULTI_NODE:
         pytest.skip("Not in multi-node setting")
 
@@ -232,13 +255,13 @@ def _compare_sp(
         common_args.append("--skip-tokenizer-init")
 
     compilation_config = {
-        'level': 3,
-        'custom_ops': ["+rms_norm"],
-        'compile_sizes': [4, 8],
-        'pass_config': {
-            'enable_sequence_parallelism': True,
-            'enable_fusion': enable_fusion,
-            'enable_noop': True,
+        "level": 3,
+        "custom_ops": ["+rms_norm"],
+        "compile_sizes": [4, 8],
+        "pass_config": {
+            "enable_sequence_parallelism": True,
+            "enable_fusion": enable_fusion,
+            "enable_noop": True,
         },
     }
 
@@ -270,12 +293,9 @@ def _compare_sp(
     ]
 
     try:
-        compare_two_settings(model_id,
-                             tp_sp_args,
-                             tp_args,
-                             tp_sp_env,
-                             tp_env,
-                             method=method)
+        compare_two_settings(
+            model_id, tp_sp_args, tp_args, tp_sp_env, tp_env, method=method
+        )
     except Exception:
         testing_ray_compiled_graph = tp_sp_env is not None
         if testing_ray_compiled_graph and vllm_major_version == "0":
@@ -301,10 +321,17 @@ def _compare_sp(
 
 
 @pytest.mark.parametrize(
-    ("model_id", "parallel_setup", "distributed_backend", "vllm_major_version",
-     "runner", "test_options"),
+    (
+        "model_id",
+        "parallel_setup",
+        "distributed_backend",
+        "vllm_major_version",
+        "runner",
+        "test_options",
+    ),
     [
-        params for model_id, settings in SP_TEXT_GENERATION_MODELS.items()
+        params
+        for model_id, settings in SP_TEXT_GENERATION_MODELS.items()
         for params in settings.iter_params(model_id)
         if model_id in SP_TEST_MODELS
     ],
@@ -319,12 +346,14 @@ def test_tp_sp_generation(
     test_options: SPTestOptions,
     num_gpus_available,
 ):
-    _compare_sp(model_id,
-                parallel_setup,
-                distributed_backend,
-                vllm_major_version,
-                runner,
-                test_options,
-                num_gpus_available,
-                method="generate",
-                is_multimodal=False)
+    _compare_sp(
+        model_id,
+        parallel_setup,
+        distributed_backend,
+        vllm_major_version,
+        runner,
+        test_options,
+        num_gpus_available,
+        method="generate",
+        is_multimodal=False,
+    )
diff --git a/tests/distributed/test_shm_broadcast.py b/tests/distributed/test_shm_broadcast.py
index e1357b4a34e9..cdea1bfe8f28 100644
--- a/tests/distributed/test_shm_broadcast.py
+++ b/tests/distributed/test_shm_broadcast.py
@@ -26,13 +26,13 @@ def distributed_run(fn, world_size):
     processes = []
     for i in range(number_of_processes):
         env = {}
-        env['RANK'] = str(i)
-        env['LOCAL_RANK'] = str(i)
-        env['WORLD_SIZE'] = str(number_of_processes)
-        env['LOCAL_WORLD_SIZE'] = str(number_of_processes)
-        env['MASTER_ADDR'] = 'localhost'
-        env['MASTER_PORT'] = '12345'
-        p = multiprocessing.Process(target=fn, args=(env, ))
+        env["RANK"] = str(i)
+        env["LOCAL_RANK"] = str(i)
+        env["WORLD_SIZE"] = str(number_of_processes)
+        env["LOCAL_WORLD_SIZE"] = str(number_of_processes)
+        env["MASTER_ADDR"] = "localhost"
+        env["MASTER_PORT"] = "12345"
+        p = multiprocessing.Process(target=fn, args=(env,))
         processes.append(p)
         p.start()
 
@@ -57,25 +57,23 @@ def wrapped_fn(env):
 
 @worker_fn_wrapper
 def worker_fn():
-
     rank = dist.get_rank()
     if rank == 0:
         port = get_open_port()
-        ip = '127.0.0.1'
+        ip = "127.0.0.1"
         dist.broadcast_object_list([ip, port], src=0)
     else:
         recv = [None, None]
         dist.broadcast_object_list(recv, src=0)
         ip, port = recv  # type: ignore
 
-    stateless_pg = StatelessProcessGroup.create(ip, port, rank,
-                                                dist.get_world_size())
+    stateless_pg = StatelessProcessGroup.create(ip, port, rank, dist.get_world_size())
 
     for pg in [dist.group.WORLD, stateless_pg]:
-
         writer_rank = 2
         broadcaster = MessageQueue.create_from_process_group(
-            pg, 40 * 1024, 2, writer_rank)
+            pg, 40 * 1024, 2, writer_rank
+        )
         if rank == writer_rank:
             seed = random.randint(0, 1000)
             dist.broadcast_object_list([seed], writer_rank)
diff --git a/tests/distributed/test_shm_buffer.py b/tests/distributed/test_shm_buffer.py
index f70028b87960..c6ceab181ff5 100644
--- a/tests/distributed/test_shm_buffer.py
+++ b/tests/distributed/test_shm_buffer.py
@@ -5,7 +5,8 @@
 import unittest
 
 from vllm.distributed.device_communicators.shm_object_storage import (
-    SingleWriterShmRingBuffer)
+    SingleWriterShmRingBuffer,
+)
 
 
 class TestSingleWriterShmRingBuffer(unittest.TestCase):
@@ -25,18 +26,21 @@ def test_buffer_opening(self):
         """Test opening an existing buffer"""
         # First create a buffer
         self.ring_buffer = SingleWriterShmRingBuffer(
-            data_buffer_size=self.buffer_size, create=True)
+            data_buffer_size=self.buffer_size, create=True
+        )
 
         # Then open it with another instance
         reader_buffer = SingleWriterShmRingBuffer(*self.ring_buffer.handle())
         self.assertFalse(reader_buffer.is_writer)
-        self.assertEqual(reader_buffer.shared_memory.name,
-                         self.ring_buffer.shared_memory.name)
+        self.assertEqual(
+            reader_buffer.shared_memory.name, self.ring_buffer.shared_memory.name
+        )
 
     def test_buffer_access(self):
         """Test accessing allocated buffers"""
         self.ring_buffer = SingleWriterShmRingBuffer(
-            data_buffer_size=self.buffer_size, create=True)
+            data_buffer_size=self.buffer_size, create=True
+        )
 
         size = 100
         address, monotonic_id = self.ring_buffer.allocate_buf(size)
@@ -44,11 +48,11 @@ def test_buffer_access(self):
         # Write some test data
         test_data = b"Hello, World!" * 7  # 91 bytes
         with self.ring_buffer.access_buf(address) as (data_buf, metadata):
-            data_buf[0:len(test_data)] = test_data
+            data_buf[0 : len(test_data)] = test_data
 
         # Read it back
         with self.ring_buffer.access_buf(address) as (data_buf2, metadata2):
-            read_data = bytes(data_buf2[0:len(test_data)])
+            read_data = bytes(data_buf2[0 : len(test_data)])
             read_id = metadata2[0]
 
         self.assertEqual(read_data, test_data)
@@ -58,7 +62,8 @@ def test_memory_error_on_full_buffer(self):
         """Test that MemoryError is raised when buffer is full"""
         small_buffer_size = 200
         self.ring_buffer = SingleWriterShmRingBuffer(
-            data_buffer_size=small_buffer_size, create=True)
+            data_buffer_size=small_buffer_size, create=True
+        )
 
         # Fill up the buffer
         self.ring_buffer.allocate_buf(100)
@@ -72,7 +77,8 @@ def test_allocation_and_free(self):
         """Test allocation and freeing of buffers"""
         small_buffer_size = 200
         self.ring_buffer = SingleWriterShmRingBuffer(
-            data_buffer_size=small_buffer_size, create=True)
+            data_buffer_size=small_buffer_size, create=True
+        )
 
         size = 80
         # Write some data
@@ -81,7 +87,7 @@ def test_allocation_and_free(self):
             address, monotonic_id = self.ring_buffer.allocate_buf(size)
             with self.ring_buffer.access_buf(address) as (data_buf, metadata):
                 data_buf[0:4] = (0).to_bytes(4, "little")  # 0 for not in-use
-                data_buf[4:len(test_data) + 4] = test_data
+                data_buf[4 : len(test_data) + 4] = test_data
             print(self.ring_buffer.metadata)
             freed_ids = self.ring_buffer.free_buf(lambda *args: True)
             print(f"  Freed IDs: {freed_ids}")
@@ -90,7 +96,8 @@ def test_allocation_and_free(self):
     def test_clear_buffer(self):
         """Test clearing the buffer"""
         self.ring_buffer = SingleWriterShmRingBuffer(
-            data_buffer_size=self.buffer_size, create=True)
+            data_buffer_size=self.buffer_size, create=True
+        )
 
         # Allocate some buffers
         for _ in range(3):
@@ -121,8 +128,7 @@ def main():
     # Manual demonstration
     try:
         print("Creating ring buffer...")
-        writer_buffer = SingleWriterShmRingBuffer(data_buffer_size=2048,
-                                                  create=True)
+        writer_buffer = SingleWriterShmRingBuffer(data_buffer_size=2048, create=True)
         reader_buffer = SingleWriterShmRingBuffer(*writer_buffer.handle())
 
         print(f"Buffer created with name: {writer_buffer.shared_memory.name}")
@@ -140,7 +146,7 @@ def main():
                 # Write some test data
                 with writer_buffer.access_buf(address) as (data_buf, metadata):
                     test_message = f"Test message {i}".encode()
-                    data_buf[0:len(test_message)] = test_message
+                    data_buf[0 : len(test_message)] = test_message
 
             except MemoryError as e:
                 print(f"  Failed to allocate {size} bytes: {e}")
diff --git a/tests/distributed/test_shm_storage.py b/tests/distributed/test_shm_storage.py
index 03495222bc1b..b9a5c22447fd 100644
--- a/tests/distributed/test_shm_storage.py
+++ b/tests/distributed/test_shm_storage.py
@@ -12,28 +12,33 @@
 
 # Assuming these are imported from your module
 from vllm.distributed.device_communicators.shm_object_storage import (
-    MsgpackSerde, SingleWriterShmObjectStorage, SingleWriterShmRingBuffer)
-from vllm.multimodal.inputs import (MultiModalFieldElem, MultiModalKwargsItem,
-                                    MultiModalSharedField)
+    MsgpackSerde,
+    SingleWriterShmObjectStorage,
+    SingleWriterShmRingBuffer,
+)
+from vllm.multimodal.inputs import (
+    MultiModalFieldElem,
+    MultiModalKwargsItem,
+    MultiModalSharedField,
+)
 
 
 def _dummy_elem(modality: str, key: str, size: int):
     return MultiModalFieldElem(
         modality=modality,
         key=key,
-        data=torch.empty((size, ), dtype=torch.int8),
+        data=torch.empty((size,), dtype=torch.int8),
         field=MultiModalSharedField(1),
     )
 
 
 def _dummy_item(modality: str, size_by_key: dict[str, int]):
-    return MultiModalKwargsItem.from_elems([
-        _dummy_elem(modality, key, size) for key, size in size_by_key.items()
-    ])
+    return MultiModalKwargsItem.from_elems(
+        [_dummy_elem(modality, key, size) for key, size in size_by_key.items()]
+    )
 
 
 class TestSingleWriterShmObjectStorage(unittest.TestCase):
-
     def setUp(self):
         """Set up test fixtures before each test method."""
         ring_buffer = SingleWriterShmRingBuffer(
@@ -208,8 +213,7 @@ def test_invalid_get_operations(self):
         with self.assertRaises(ValueError) as context:
             self.storage.get(address, monotonic_id + 100)
 
-        self.assertIn("has been modified or is invalid", \
-            str(context.exception))
+        self.assertIn("has been modified or is invalid", str(context.exception))
 
     def test_clear_storage(self):
         """Test clearing the storage."""
@@ -234,8 +238,7 @@ def test_clear_storage(self):
 # Reader process function
 def reader_process(process_id, storage_handle, items_to_read):
     """Reader process that connects to existing shared memory and reads data."""
-    reader_storage = SingleWriterShmObjectStorage.create_from_handle(
-        storage_handle)
+    reader_storage = SingleWriterShmObjectStorage.create_from_handle(storage_handle)
 
     print(f"Reader {process_id} started")
 
@@ -276,11 +279,7 @@ def run_multiprocess_example():
 
         # Test basic data types
         test_data = [
-            ("user_data", {
-                "name": "Alice",
-                "age": 30,
-                "scores": [95, 87, 92]
-            }),
+            ("user_data", {"name": "Alice", "age": 30, "scores": [95, 87, 92]}),
             ("simple_string", "Hello, World!"),
             ("number", 42),
             ("list_data", [1, 2, 3, "four", 5.0]),
@@ -301,8 +300,9 @@ def run_multiprocess_example():
         # initialize lock for reader processes
         handle.reader_lock = Lock()
         for i in range(storage.n_readers):
-            p = multiprocessing.Process(target=reader_process,
-                                        args=(i, handle, stored_items))
+            p = multiprocessing.Process(
+                target=reader_process, args=(i, handle, stored_items)
+            )
             processes.append(p)
             p.start()
 
diff --git a/tests/distributed/test_symm_mem_allreduce.py b/tests/distributed/test_symm_mem_allreduce.py
index 83e1fe47aeec..e669b81b04f0 100644
--- a/tests/distributed/test_symm_mem_allreduce.py
+++ b/tests/distributed/test_symm_mem_allreduce.py
@@ -14,11 +14,12 @@
 from vllm.config import ParallelConfig, VllmConfig, set_current_vllm_config
 from vllm.distributed import cleanup_dist_env_and_memory
 from vllm.distributed.communication_op import tensor_model_parallel_all_reduce
-from vllm.distributed.device_communicators.cuda_communicator import (
-    CudaCommunicator)
-from vllm.distributed.parallel_state import (get_tp_group,
-                                             init_distributed_environment,
-                                             initialize_model_parallel)
+from vllm.distributed.device_communicators.cuda_communicator import CudaCommunicator
+from vllm.distributed.parallel_state import (
+    get_tp_group,
+    init_distributed_environment,
+    initialize_model_parallel,
+)
 from vllm.engine.arg_utils import EngineArgs
 from vllm.engine.llm_engine import LLMEngine
 from vllm.platforms import current_platform
@@ -32,8 +33,7 @@
 
 def symm_mem_allreduce_worker(local_rank: int, world_size: int, q: mp.Queue):
     monkeypatch = pytest.MonkeyPatch()
-    config = VllmConfig(parallel_config=ParallelConfig(
-        tensor_parallel_size=world_size))
+    config = VllmConfig(parallel_config=ParallelConfig(tensor_parallel_size=world_size))
 
     with monkeypatch.context() as m, set_current_vllm_config(config):
         m.delenv("CUDA_VISIBLE_DEVICES", raising=False)
@@ -42,34 +42,34 @@ def symm_mem_allreduce_worker(local_rank: int, world_size: int, q: mp.Queue):
         torch.cuda.set_device(device)
         torch.set_default_device(device)
         torch.set_default_dtype(dtype)
-        update_environment_variables({
-            'RANK': str(local_rank),
-            'LOCAL_RANK': str(local_rank),
-            'WORLD_SIZE': str(world_size),
-            'MASTER_ADDR': 'localhost',
-            'MASTER_PORT': '12345',
-        })
+        update_environment_variables(
+            {
+                "RANK": str(local_rank),
+                "LOCAL_RANK": str(local_rank),
+                "WORLD_SIZE": str(world_size),
+                "MASTER_ADDR": "localhost",
+                "MASTER_PORT": "12345",
+            }
+        )
 
         init_distributed_environment()
         initialize_model_parallel(tensor_model_parallel_size=world_size)
 
-        cuda_communicator = typing.cast(CudaCommunicator,
-                                        get_tp_group().device_communicator)
+        cuda_communicator = typing.cast(
+            CudaCommunicator, get_tp_group().device_communicator
+        )
         symm_mem_comm = cuda_communicator.symm_mem_comm
         if symm_mem_comm is None or symm_mem_comm.disabled:
             # can't use skip under multiprocessing
             q.put("SymmMemCommunicator is not available or disabled.")
             return
 
-        inp_direct_symm_mem = torch.randint(1,
-                                            23, (test_size_elements, ),
-                                            dtype=dtype,
-                                            device=device)
+        inp_direct_symm_mem = torch.randint(
+            1, 23, (test_size_elements,), dtype=dtype, device=device
+        )
         if not symm_mem_comm.should_use_symm_mem(inp_direct_symm_mem):
             # can't use skip under multiprocessing
-            q.put(
-                "SymmMemCommunicator isn't used for this world and input size."
-            )
+            q.put("SymmMemCommunicator isn't used for this world and input size.")
             return
 
         original_inp_direct_symm_mem = inp_direct_symm_mem.clone()
@@ -78,42 +78,37 @@ def symm_mem_allreduce_worker(local_rank: int, world_size: int, q: mp.Queue):
 
         group = get_tp_group().device_group
         dist.all_reduce(original_inp_direct_symm_mem, group=group)
-        torch.testing.assert_close(out_direct_symm_mem,
-                                   original_inp_direct_symm_mem,
-                                   atol=2.5,
-                                   rtol=0.1)
+        torch.testing.assert_close(
+            out_direct_symm_mem, original_inp_direct_symm_mem, atol=2.5, rtol=0.1
+        )
 
         # Test tensor_model_parallel_all_reduce which should use symm_mem
-        inp_tensor_parallel = torch.randint(-23,
-                                            1, (test_size_elements, ),
-                                            dtype=dtype,
-                                            device=device)
+        inp_tensor_parallel = torch.randint(
+            -23, 1, (test_size_elements,), dtype=dtype, device=device
+        )
         original_inp_tensor_parallel = inp_tensor_parallel.clone()
-        out_tensor_parallel = tensor_model_parallel_all_reduce(
-            inp_tensor_parallel)
+        out_tensor_parallel = tensor_model_parallel_all_reduce(inp_tensor_parallel)
         dist.all_reduce(original_inp_tensor_parallel, group=group)
-        torch.testing.assert_close(out_tensor_parallel,
-                                   original_inp_tensor_parallel,
-                                   atol=2.5,
-                                   rtol=0.1)
+        torch.testing.assert_close(
+            out_tensor_parallel, original_inp_tensor_parallel, atol=2.5, rtol=0.1
+        )
 
 
 @pytest.mark.skipif(
     not current_platform.is_cuda(),
-    reason="SymmMemAllreduce is only available for CUDA platforms.")
+    reason="SymmMemAllreduce is only available for CUDA platforms.",
+)
 @pytest.mark.parametrize("tp_size", [2])
 @pytest.mark.parametrize("pipeline_parallel_size", [1])
-@pytest.mark.skipif(envs.VLLM_TARGET_DEVICE not in ["cuda"],
-                    reason="Only test on CUDA")
-def test_symm_mem_allreduce(monkeypatch: pytest.MonkeyPatch, tp_size,
-                            pipeline_parallel_size):
+@pytest.mark.skipif(envs.VLLM_TARGET_DEVICE not in ["cuda"], reason="Only test on CUDA")
+def test_symm_mem_allreduce(
+    monkeypatch: pytest.MonkeyPatch, tp_size, pipeline_parallel_size
+):
     world_size = tp_size * pipeline_parallel_size
     if world_size > torch.cuda.device_count():
         pytest.skip("Not enough GPUs to run the test.")
-    q = mp.get_context('spawn').Queue()
-    mp.spawn(symm_mem_allreduce_worker,
-             args=(world_size, q),
-             nprocs=world_size)
+    q = mp.get_context("spawn").Queue()
+    mp.spawn(symm_mem_allreduce_worker, args=(world_size, q), nprocs=world_size)
     try:
         val = q.get(timeout=1)
     except queue.Empty:
@@ -126,18 +121,20 @@ def test_symm_mem_allreduce(monkeypatch: pytest.MonkeyPatch, tp_size,
 
 @pytest.mark.skipif(
     not current_platform.is_cuda(),
-    reason="SymmMemAllreduce is only available for CUDA platforms.")
-@pytest.mark.skipif(envs.VLLM_TARGET_DEVICE not in ["cuda"],
-                    reason="Only test on CUDA")
+    reason="SymmMemAllreduce is only available for CUDA platforms.",
+)
+@pytest.mark.skipif(envs.VLLM_TARGET_DEVICE not in ["cuda"], reason="Only test on CUDA")
 def test_dp_with_symm_mem_allreduce(monkeypatch: pytest.MonkeyPatch):
     world_size = 4
     if world_size > torch.cuda.device_count():
         pytest.skip("Not enough GPUs to run the test.")
     # Verify that the DataParallel runs without error
-    engine_args = EngineArgs(model="distilbert/distilgpt2",
-                             enforce_eager=True,
-                             enable_prefix_caching=True,
-                             data_parallel_size=2,
-                             tensor_parallel_size=2,
-                             data_parallel_backend="mp")
+    engine_args = EngineArgs(
+        model="distilbert/distilgpt2",
+        enforce_eager=True,
+        enable_prefix_caching=True,
+        data_parallel_size=2,
+        tensor_parallel_size=2,
+        data_parallel_backend="mp",
+    )
     LLMEngine.from_engine_args(engine_args)
diff --git a/tests/distributed/test_torchrun_example.py b/tests/distributed/test_torchrun_example.py
index 9f2c3eaec359..f415409d7b37 100644
--- a/tests/distributed/test_torchrun_example.py
+++ b/tests/distributed/test_torchrun_example.py
@@ -24,13 +24,15 @@
 
 # set different `gpu_memory_utilization` and `swap_space` for different ranks,
 # to test if all ranks agree on the same kv cache configuration.
-llm = LLM(model="facebook/opt-125m",
-          tensor_parallel_size=2,
-          pipeline_parallel_size=int(os.getenv("PP_SIZE", 1)),
-          distributed_executor_backend="external_launcher",
-          gpu_memory_utilization=random.uniform(0.7, 0.9),
-          swap_space=random.randint(1, 4),
-          seed=0)
+llm = LLM(
+    model="facebook/opt-125m",
+    tensor_parallel_size=2,
+    pipeline_parallel_size=int(os.getenv("PP_SIZE", 1)),
+    distributed_executor_backend="external_launcher",
+    gpu_memory_utilization=random.uniform(0.7, 0.9),
+    swap_space=random.randint(1, 4),
+    seed=0,
+)
 
 outputs = llm.generate(prompts, sampling_params)
 
@@ -48,15 +50,14 @@ def test_consistent_across_ranks(obj):
         assert container[0] == obj
 
 
-test_consistent_across_ranks(
-    llm.llm_engine.vllm_config.cache_config.num_cpu_blocks)
-test_consistent_across_ranks(
-    llm.llm_engine.vllm_config.cache_config.num_gpu_blocks)
+test_consistent_across_ranks(llm.llm_engine.vllm_config.cache_config.num_cpu_blocks)
+test_consistent_across_ranks(llm.llm_engine.vllm_config.cache_config.num_gpu_blocks)
 
 # make sure we can access the model parameters from the calling process
 # of the `LLM` instance.
-params = list(llm.llm_engine.model_executor.driver_worker.worker.model_runner.
-              model.parameters())
+params = list(
+    llm.llm_engine.model_executor.driver_worker.worker.model_runner.model.parameters()
+)
 test_consistent_across_ranks(len(params))
 
 # all ranks should have the same outputs
@@ -65,5 +66,4 @@ def test_consistent_across_ranks(obj):
     generated_text = output.outputs[0].text
     test_consistent_across_ranks(prompt)
     test_consistent_across_ranks(generated_text)
-    print(f"Rank {torch_rank}, Prompt: {prompt!r}, "
-          f"Generated text: {generated_text!r}")
+    print(f"Rank {torch_rank}, Prompt: {prompt!r}, Generated text: {generated_text!r}")
diff --git a/tests/distributed/test_torchrun_example_moe.py b/tests/distributed/test_torchrun_example_moe.py
index 2d6b930fcc07..1aa7f1793570 100644
--- a/tests/distributed/test_torchrun_example_moe.py
+++ b/tests/distributed/test_torchrun_example_moe.py
@@ -24,23 +24,22 @@
 
 if dp_size > 1:
     # distribute the prompts across the data parallel ranks
-    prompts = [
-        prompt for idx, prompt in enumerate(prompts)
-        if idx % dp_size == dp_rank
-    ]
+    prompts = [prompt for idx, prompt in enumerate(prompts) if idx % dp_size == dp_rank]
 
 sampling_params = SamplingParams(temperature=0.8, top_p=0.95)
 
 # set different `gpu_memory_utilization` and `swap_space` for different ranks,
 # to test if all ranks agree on the same kv cache configuration.
-llm = LLM(model="microsoft/Phi-mini-MoE-instruct",
-          tensor_parallel_size=int(os.getenv("TP_SIZE", "1")),
-          pipeline_parallel_size=int(os.getenv("PP_SIZE", "1")),
-          enable_expert_parallel=int(os.getenv("ENABLE_EP", "0")) == 1,
-          distributed_executor_backend="external_launcher",
-          gpu_memory_utilization=random.uniform(0.7, 0.9),
-          swap_space=random.randint(1, 4),
-          seed=0)
+llm = LLM(
+    model="microsoft/Phi-mini-MoE-instruct",
+    tensor_parallel_size=int(os.getenv("TP_SIZE", "1")),
+    pipeline_parallel_size=int(os.getenv("PP_SIZE", "1")),
+    enable_expert_parallel=int(os.getenv("ENABLE_EP", "0")) == 1,
+    distributed_executor_backend="external_launcher",
+    gpu_memory_utilization=random.uniform(0.7, 0.9),
+    swap_space=random.randint(1, 4),
+    seed=0,
+)
 
 outputs = llm.generate(prompts, sampling_params)
 
@@ -54,21 +53,18 @@ def test_consistent_across_ranks(obj):
         dist.broadcast_object_list([obj], src=group.ranks[0], group=cpu_group)
     else:
         container = [None]
-        dist.broadcast_object_list(container,
-                                   src=group.ranks[0],
-                                   group=cpu_group)
+        dist.broadcast_object_list(container, src=group.ranks[0], group=cpu_group)
         assert container[0] == obj
 
 
-test_consistent_across_ranks(
-    llm.llm_engine.vllm_config.cache_config.num_cpu_blocks)
-test_consistent_across_ranks(
-    llm.llm_engine.vllm_config.cache_config.num_gpu_blocks)
+test_consistent_across_ranks(llm.llm_engine.vllm_config.cache_config.num_cpu_blocks)
+test_consistent_across_ranks(llm.llm_engine.vllm_config.cache_config.num_gpu_blocks)
 
 # make sure we can access the model parameters from the calling process
 # of the `LLM` instance.
-params = list(llm.llm_engine.model_executor.driver_worker.worker.model_runner.
-              model.parameters())
+params = list(
+    llm.llm_engine.model_executor.driver_worker.worker.model_runner.model.parameters()
+)
 test_consistent_across_ranks(len(params))
 
 # all ranks should have the same outputs
@@ -77,5 +73,4 @@ def test_consistent_across_ranks(obj):
     generated_text = output.outputs[0].text
     test_consistent_across_ranks(prompt)
     test_consistent_across_ranks(generated_text)
-    print(f"Rank {group_rank}, Prompt: {prompt!r}, "
-          f"Generated text: {generated_text!r}")
+    print(f"Rank {group_rank}, Prompt: {prompt!r}, Generated text: {generated_text!r}")
diff --git a/tests/distributed/test_utils.py b/tests/distributed/test_utils.py
index 0287ad94e388..2a6936fcd4c2 100644
--- a/tests/distributed/test_utils.py
+++ b/tests/distributed/test_utils.py
@@ -10,21 +10,22 @@
 import vllm.envs as envs
 from vllm.distributed.device_communicators.pynccl import PyNcclCommunicator
 from vllm.distributed.utils import StatelessProcessGroup
-from vllm.utils import (cuda_device_count_stateless, get_open_port,
-                        update_environment_variables)
+from vllm.utils import (
+    cuda_device_count_stateless,
+    get_open_port,
+    update_environment_variables,
+)
 
 from ..utils import multi_gpu_test
 
 
 @ray.remote
 class _CUDADeviceCountStatelessTestActor:
-
     def get_count(self):
         return cuda_device_count_stateless()
 
     def set_cuda_visible_devices(self, cuda_visible_devices: str):
-        update_environment_variables(
-            {"CUDA_VISIBLE_DEVICES": cuda_visible_devices})
+        update_environment_variables({"CUDA_VISIBLE_DEVICES": cuda_visible_devices})
 
     def get_cuda_visible_devices(self):
         return envs.CUDA_VISIBLE_DEVICES
@@ -34,10 +35,9 @@ def test_cuda_device_count_stateless():
     """Test that cuda_device_count_stateless changes return value if
     CUDA_VISIBLE_DEVICES is changed."""
     actor = _CUDADeviceCountStatelessTestActor.options(  # type: ignore
-        num_gpus=2).remote()
-    assert len(
-        sorted(ray.get(
-            actor.get_cuda_visible_devices.remote()).split(","))) == 2
+        num_gpus=2
+    ).remote()
+    assert len(sorted(ray.get(actor.get_cuda_visible_devices.remote()).split(","))) == 2
     assert ray.get(actor.get_count.remote()) == 2
     ray.get(actor.set_cuda_visible_devices.remote("0"))
     assert ray.get(actor.get_count.remote()) == 1
@@ -46,15 +46,13 @@ def test_cuda_device_count_stateless():
 
 
 def cpu_worker(rank, WORLD_SIZE, port1, port2):
-    pg1 = StatelessProcessGroup.create(host="127.0.0.1",
-                                       port=port1,
-                                       rank=rank,
-                                       world_size=WORLD_SIZE)
+    pg1 = StatelessProcessGroup.create(
+        host="127.0.0.1", port=port1, rank=rank, world_size=WORLD_SIZE
+    )
     if rank <= 2:
-        pg2 = StatelessProcessGroup.create(host="127.0.0.1",
-                                           port=port2,
-                                           rank=rank,
-                                           world_size=3)
+        pg2 = StatelessProcessGroup.create(
+            host="127.0.0.1", port=port2, rank=rank, world_size=3
+        )
     data = torch.tensor([rank])
     data = pg1.broadcast_obj(data, src=2)
     assert data.item() == 2
@@ -68,16 +66,14 @@ def cpu_worker(rank, WORLD_SIZE, port1, port2):
 
 def gpu_worker(rank, WORLD_SIZE, port1, port2):
     torch.cuda.set_device(rank)
-    pg1 = StatelessProcessGroup.create(host="127.0.0.1",
-                                       port=port1,
-                                       rank=rank,
-                                       world_size=WORLD_SIZE)
+    pg1 = StatelessProcessGroup.create(
+        host="127.0.0.1", port=port1, rank=rank, world_size=WORLD_SIZE
+    )
     pynccl1 = PyNcclCommunicator(pg1, device=rank)
     if rank <= 2:
-        pg2 = StatelessProcessGroup.create(host="127.0.0.1",
-                                           port=port2,
-                                           rank=rank,
-                                           world_size=3)
+        pg2 = StatelessProcessGroup.create(
+            host="127.0.0.1", port=port2, rank=rank, world_size=3
+        )
         pynccl2 = PyNcclCommunicator(pg2, device=rank)
     data = torch.tensor([rank]).cuda()
     pynccl1.all_reduce(data)
@@ -96,10 +92,9 @@ def gpu_worker(rank, WORLD_SIZE, port1, port2):
 
 
 def broadcast_worker(rank, WORLD_SIZE, port1, port2):
-    pg1 = StatelessProcessGroup.create(host="127.0.0.1",
-                                       port=port1,
-                                       rank=rank,
-                                       world_size=WORLD_SIZE)
+    pg1 = StatelessProcessGroup.create(
+        host="127.0.0.1", port=port1, rank=rank, world_size=WORLD_SIZE
+    )
     if rank == 2:
         pg1.broadcast_obj("secret", src=2)
     else:
@@ -109,10 +104,9 @@ def broadcast_worker(rank, WORLD_SIZE, port1, port2):
 
 
 def allgather_worker(rank, WORLD_SIZE, port1, port2):
-    pg1 = StatelessProcessGroup.create(host="127.0.0.1",
-                                       port=port1,
-                                       rank=rank,
-                                       world_size=WORLD_SIZE)
+    pg1 = StatelessProcessGroup.create(
+        host="127.0.0.1", port=port1, rank=rank, world_size=WORLD_SIZE
+    )
     data = pg1.all_gather_obj(rank)
     assert data == list(range(WORLD_SIZE))
     pg1.barrier()
@@ -121,7 +115,8 @@ def allgather_worker(rank, WORLD_SIZE, port1, port2):
 @pytest.mark.skip(reason="This test is flaky and prone to hang.")
 @multi_gpu_test(num_gpus=4)
 @pytest.mark.parametrize(
-    "worker", [cpu_worker, gpu_worker, broadcast_worker, allgather_worker])
+    "worker", [cpu_worker, gpu_worker, broadcast_worker, allgather_worker]
+)
 def test_stateless_process_group(worker):
     port1 = get_open_port()
     with socket.socket(socket.AF_INET, socket.SOCK_STREAM) as s:
@@ -129,12 +124,14 @@ def test_stateless_process_group(worker):
         port2 = get_open_port()
     WORLD_SIZE = 4
     from multiprocessing import get_context
+
     ctx = get_context("fork")
     processes = []
     for i in range(WORLD_SIZE):
         rank = i
         processes.append(
-            ctx.Process(target=worker, args=(rank, WORLD_SIZE, port1, port2)))
+            ctx.Process(target=worker, args=(rank, WORLD_SIZE, port1, port2))
+        )
     for p in processes:
         p.start()
     for p in processes:
diff --git a/tests/engine/test_arg_utils.py b/tests/engine/test_arg_utils.py
index 33888f008f04..c0eb0e5ac564 100644
--- a/tests/engine/test_arg_utils.py
+++ b/tests/engine/test_arg_utils.py
@@ -10,22 +10,30 @@
 import pytest
 
 from vllm.config import CompilationConfig, config
-from vllm.engine.arg_utils import (EngineArgs, contains_type, get_kwargs,
-                                   get_type, get_type_hints, is_not_builtin,
-                                   is_type, literal_to_kwargs, optional_type,
-                                   parse_type)
+from vllm.engine.arg_utils import (
+    EngineArgs,
+    contains_type,
+    get_kwargs,
+    get_type,
+    get_type_hints,
+    is_not_builtin,
+    is_type,
+    literal_to_kwargs,
+    optional_type,
+    parse_type,
+)
 from vllm.utils import FlexibleArgumentParser
 
 
-@pytest.mark.parametrize(("type", "value", "expected"), [
-    (int, "42", 42),
-    (float, "3.14", 3.14),
-    (str, "Hello World!", "Hello World!"),
-    (json.loads, '{"foo":1,"bar":2}', {
-        "foo": 1,
-        "bar": 2
-    }),
-])
+@pytest.mark.parametrize(
+    ("type", "value", "expected"),
+    [
+        (int, "42", 42),
+        (float, "3.14", 3.14),
+        (str, "Hello World!", "Hello World!"),
+        (json.loads, '{"foo":1,"bar":2}', {"foo": 1, "bar": 2}),
+    ],
+)
 def test_parse_type(type, value, expected):
     parse_type_func = parse_type(type)
     assert parse_type_func(value) == expected
@@ -37,50 +45,56 @@ def test_optional_type():
     assert optional_type_func("42") == 42
 
 
-@pytest.mark.parametrize(("type_hint", "type", "expected"), [
-    (int, int, True),
-    (int, float, False),
-    (list[int], list, True),
-    (list[int], tuple, False),
-    (Literal[0, 1], Literal, True),
-])
+@pytest.mark.parametrize(
+    ("type_hint", "type", "expected"),
+    [
+        (int, int, True),
+        (int, float, False),
+        (list[int], list, True),
+        (list[int], tuple, False),
+        (Literal[0, 1], Literal, True),
+    ],
+)
 def test_is_type(type_hint, type, expected):
     assert is_type(type_hint, type) == expected
 
 
-@pytest.mark.parametrize(("type_hints", "type", "expected"), [
-    ({float, int}, int, True),
-    ({int, tuple}, int, True),
-    ({int, tuple[int]}, int, True),
-    ({int, tuple[int, ...]}, int, True),
-    ({int, tuple[int]}, float, False),
-    ({int, tuple[int, ...]}, float, False),
-    ({str, Literal["x", "y"]}, Literal, True),
-])
+@pytest.mark.parametrize(
+    ("type_hints", "type", "expected"),
+    [
+        ({float, int}, int, True),
+        ({int, tuple}, int, True),
+        ({int, tuple[int]}, int, True),
+        ({int, tuple[int, ...]}, int, True),
+        ({int, tuple[int]}, float, False),
+        ({int, tuple[int, ...]}, float, False),
+        ({str, Literal["x", "y"]}, Literal, True),
+    ],
+)
 def test_contains_type(type_hints, type, expected):
     assert contains_type(type_hints, type) == expected
 
 
-@pytest.mark.parametrize(("type_hints", "type", "expected"), [
-    ({int, float}, int, int),
-    ({int, float}, str, None),
-    ({str, Literal["x", "y"]}, Literal, Literal["x", "y"]),
-])
+@pytest.mark.parametrize(
+    ("type_hints", "type", "expected"),
+    [
+        ({int, float}, int, int),
+        ({int, float}, str, None),
+        ({str, Literal["x", "y"]}, Literal, Literal["x", "y"]),
+    ],
+)
 def test_get_type(type_hints, type, expected):
     assert get_type(type_hints, type) == expected
 
 
-@pytest.mark.parametrize(("type_hints", "expected"), [
-    ({Literal[1, 2]}, {
-        "type": int,
-        "choices": [1, 2]
-    }),
-    ({str, Literal["x", "y"]}, {
-        "type": str,
-        "metavar": ["x", "y"]
-    }),
-    ({Literal[1, "a"]}, Exception),
-])
+@pytest.mark.parametrize(
+    ("type_hints", "expected"),
+    [
+        ({Literal[1, 2]}, {"type": int, "choices": [1, 2]}),
+        ({str, Literal["x", "y"]}, {"type": str, "metavar": ["x", "y"]}),
+        ({Literal[1, "a"]}, Exception),
+    ],
+)
 def test_literal_to_kwargs(type_hints, expected):
     context = nullcontext()
     if expected is Exception:
@@ -123,22 +137,27 @@ class DummyConfig:
     """Nested config"""
 
 
-@pytest.mark.parametrize(("type_hint", "expected"), [
-    (int, False),
-    (DummyConfig, True),
-])
+@pytest.mark.parametrize(
+    ("type_hint", "expected"),
+    [
+        (int, False),
+        (DummyConfig, True),
+    ],
+)
 def test_is_not_builtin(type_hint, expected):
     assert is_not_builtin(type_hint) == expected
 
 
 @pytest.mark.parametrize(
-    ("type_hint", "expected"), [
+    ("type_hint", "expected"),
+    [
         (Annotated[int, "annotation"], {int}),
         (Optional[int], {int, type(None)}),
         (Annotated[Optional[int], "annotation"], {int, type(None)}),
         (Optional[Annotated[int, "annotation"]], {int, type(None)}),
     ],
-    ids=["Annotated", "Optional", "Annotated_Optional", "Optional_Annotated"])
+    ids=["Annotated", "Optional", "Annotated_Optional", "Optional_Annotated"],
+)
 def test_get_type_hints(type_hint, expected):
     assert get_type_hints(type_hint) == expected
 
@@ -178,24 +197,16 @@ def test_get_kwargs():
     ("arg", "expected"),
     [
         (None, dict()),
-        ('{"video": {"num_frames": 123} }', {
-            "video": {
-                "num_frames": 123
-            }
-        }),
+        ('{"video": {"num_frames": 123} }', {"video": {"num_frames": 123}}),
         (
             '{"video": {"num_frames": 123, "fps": 1.0, "foo": "bar"}, "image": {"foo": "bar"} }',  # noqa
             {
-                "video": {
-                    "num_frames": 123,
-                    "fps": 1.0,
-                    "foo": "bar"
-                },
-                "image": {
-                    "foo": "bar"
-                }
-            }),
-    ])
+                "video": {"num_frames": 123, "fps": 1.0, "foo": "bar"},
+                "image": {"foo": "bar"},
+            },
+        ),
+    ],
+)
 def test_media_io_kwargs_parser(arg, expected):
     parser = EngineArgs.add_cli_args(FlexibleArgumentParser())
     if arg is None:
@@ -230,24 +241,32 @@ def test_compilation_config():
     assert args.compilation_config.level == 3
 
     # set to string form of a dict
-    args = parser.parse_args([
-        "-O",
-        '{"level": 3, "cudagraph_capture_sizes": [1, 2, 4, 8], '
-        '"use_inductor": false}',
-    ])
-    assert (args.compilation_config.level == 3 and
-            args.compilation_config.cudagraph_capture_sizes == [1, 2, 4, 8]
-            and not args.compilation_config.use_inductor)
+    args = parser.parse_args(
+        [
+            "-O",
+            '{"level": 3, "cudagraph_capture_sizes": [1, 2, 4, 8], '
+            '"use_inductor": false}',
+        ]
+    )
+    assert (
+        args.compilation_config.level == 3
+        and args.compilation_config.cudagraph_capture_sizes == [1, 2, 4, 8]
+        and not args.compilation_config.use_inductor
+    )
 
     # set to string form of a dict
-    args = parser.parse_args([
-        "--compilation-config="
-        '{"level": 3, "cudagraph_capture_sizes": [1, 2, 4, 8], '
-        '"use_inductor": true}',
-    ])
-    assert (args.compilation_config.level == 3 and
-            args.compilation_config.cudagraph_capture_sizes == [1, 2, 4, 8]
-            and args.compilation_config.use_inductor)
+    args = parser.parse_args(
+        [
+            "--compilation-config="
+            '{"level": 3, "cudagraph_capture_sizes": [1, 2, 4, 8], '
+            '"use_inductor": true}',
+        ]
+    )
+    assert (
+        args.compilation_config.level == 3
+        and args.compilation_config.cudagraph_capture_sizes == [1, 2, 4, 8]
+        and args.compilation_config.use_inductor
+    )
 
 
 def test_prefix_cache_default():
@@ -255,8 +274,7 @@ def test_prefix_cache_default():
     args = parser.parse_args([])
 
     engine_args = EngineArgs.from_cli_args(args=args)
-    assert (not engine_args.enable_prefix_caching
-            ), "prefix caching defaults to off."
+    assert not engine_args.enable_prefix_caching, "prefix caching defaults to off."
 
     # with flag to turn it on.
     args = parser.parse_args(["--enable-prefix-caching"])
diff --git a/tests/engine/test_short_mm_context.py b/tests/engine/test_short_mm_context.py
index 9eb3dfc09224..54a88586d8ed 100644
--- a/tests/engine/test_short_mm_context.py
+++ b/tests/engine/test_short_mm_context.py
@@ -5,12 +5,12 @@
 
 from ..conftest import IMAGE_ASSETS
 
-HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts({
-    "stop_sign":
-    "USER: <image>\nWhat's the content of the image?\nASSISTANT:",
-    "cherry_blossom":
-    "USER: <image>\nWhat is the season?\nASSISTANT:",
-})
+HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts(
+    {
+        "stop_sign": "USER: <image>\nWhat's the content of the image?\nASSISTANT:",
+        "cherry_blossom": "USER: <image>\nWhat is the season?\nASSISTANT:",
+    }
+)
 
 models = ["llava-hf/llava-1.5-7b-hf"]
 
@@ -19,8 +19,7 @@
 def test_context_length_too_short(vllm_runner, image_assets, model):
     images = [asset.pil_image for asset in image_assets]
 
-    with pytest.raises(ValueError,
-                       match="longer than the maximum model length"):
+    with pytest.raises(ValueError, match="longer than the maximum model length"):
         vllm_model = vllm_runner(
             model,
             max_model_len=128,  # LLaVA has a feature size of 576
@@ -29,6 +28,6 @@ def test_context_length_too_short(vllm_runner, image_assets, model):
         )
 
         with vllm_model:
-            vllm_model.generate_greedy([HF_IMAGE_PROMPTS[0]],
-                                       max_tokens=1,
-                                       images=[images[0]])
+            vllm_model.generate_greedy(
+                [HF_IMAGE_PROMPTS[0]], max_tokens=1, images=[images[0]]
+            )
diff --git a/tests/entrypoints/conftest.py b/tests/entrypoints/conftest.py
index 7daf62595b1b..e03d34ac8f32 100644
--- a/tests/entrypoints/conftest.py
+++ b/tests/entrypoints/conftest.py
@@ -26,8 +26,10 @@ def sample_token_ids():
 
 @pytest.fixture
 def sample_regex():
-    return (r"((25[0-5]|(2[0-4]|1\d|[1-9]|)\d)\.){3}"
-            r"(25[0-5]|(2[0-4]|1\d|[1-9]|)\d)")
+    return (
+        r"((25[0-5]|(2[0-4]|1\d|[1-9]|)\d)\.){3}"
+        r"(25[0-5]|(2[0-4]|1\d|[1-9]|)\d)"
+    )
 
 
 @pytest.fixture
@@ -35,40 +37,27 @@ def sample_json_schema():
     return {
         "type": "object",
         "properties": {
-            "name": {
-                "type": "string"
-            },
-            "age": {
-                "type": "integer"
-            },
+            "name": {"type": "string"},
+            "age": {"type": "integer"},
             "skills": {
                 "type": "array",
-                "items": {
-                    "type": "string",
-                    "maxLength": 10
-                },
-                "minItems": 3
+                "items": {"type": "string", "maxLength": 10},
+                "minItems": 3,
             },
             "work_history": {
                 "type": "array",
                 "items": {
                     "type": "object",
                     "properties": {
-                        "company": {
-                            "type": "string"
-                        },
-                        "duration": {
-                            "type": "number"
-                        },
-                        "position": {
-                            "type": "string"
-                        }
+                        "company": {"type": "string"},
+                        "duration": {"type": "number"},
+                        "position": {"type": "string"},
                     },
-                    "required": ["company", "position"]
-                }
-            }
+                    "required": ["company", "position"],
+                },
+            },
         },
-        "required": ["name", "age", "skills", "work_history"]
+        "required": ["name", "age", "skills", "work_history"],
     }
 
 
@@ -80,65 +69,53 @@ def sample_complex_json_schema():
             "score": {
                 "type": "integer",
                 "minimum": 0,
-                "maximum": 100  # Numeric range
+                "maximum": 100,  # Numeric range
             },
             "grade": {
                 "type": "string",
-                "pattern": "^[A-D]$"  # Regex pattern
+                "pattern": "^[A-D]$",  # Regex pattern
             },
             "email": {
                 "type": "string",
-                "pattern": "^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,}$"
+                "pattern": "^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,}$",
             },
             "tags": {
                 "type": "array",
                 "items": {
                     "type": "string",
-                    "pattern":
-                    "^[a-z]{1,10}$"  # Combining length and pattern restrictions
-                }
-            }
+                    "pattern": "^[a-z]{1,10}$",  # Combining length and pattern restrictions
+                },
+            },
         },
-        "required": ["score", "grade", "email", "tags"]
+        "required": ["score", "grade", "email", "tags"],
     }
 
 
 @pytest.fixture
 def sample_definition_json_schema():
     return {
-        '$defs': {
-            'Step': {
-                'properties': {
-                    'explanation': {
-                        'title': 'Explanation',
-                        'type': 'string'
-                    },
-                    'output': {
-                        'title': 'Output',
-                        'type': 'string'
-                    }
+        "$defs": {
+            "Step": {
+                "properties": {
+                    "explanation": {"title": "Explanation", "type": "string"},
+                    "output": {"title": "Output", "type": "string"},
                 },
-                'required': ['explanation', 'output'],
-                'title': 'Step',
-                'type': 'object'
+                "required": ["explanation", "output"],
+                "title": "Step",
+                "type": "object",
             }
         },
-        'properties': {
-            'steps': {
-                'items': {
-                    '$ref': '#/$defs/Step'
-                },
-                'title': 'Steps',
-                'type': 'array'
+        "properties": {
+            "steps": {
+                "items": {"$ref": "#/$defs/Step"},
+                "title": "Steps",
+                "type": "array",
             },
-            'final_answer': {
-                'title': 'Final Answer',
-                'type': 'string'
-            }
+            "final_answer": {"title": "Final Answer", "type": "string"},
         },
-        'required': ['steps', 'final_answer'],
-        'title': 'MathReasoning',
-        'type': 'object'
+        "required": ["steps", "final_answer"],
+        "title": "MathReasoning",
+        "type": "object",
     }
 
 
@@ -149,64 +126,71 @@ def sample_enum_json_schema():
         "properties": {
             "status": {
                 "type": "string",
-                "enum": ["active", "inactive",
-                         "pending"]  # Literal values using enum
+                "enum": ["active", "inactive", "pending"],  # Literal values using enum
             },
             "priority": {
                 "type": "string",
-                "enum": ["low", "medium", "high", "critical"]
+                "enum": ["low", "medium", "high", "critical"],
             },
             "category": {
                 "type": "object",
                 "properties": {
                     "type": {
                         "type": "string",
-                        "enum": ["bug", "feature", "improvement"]
+                        "enum": ["bug", "feature", "improvement"],
                     },
                     "severity": {
                         "type": "integer",
-                        "enum": [1, 2, 3, 4,
-                                 5]  # Enum can also contain numbers
-                    }
+                        "enum": [1, 2, 3, 4, 5],  # Enum can also contain numbers
+                    },
                 },
-                "required": ["type", "severity"]
+                "required": ["type", "severity"],
             },
             "flags": {
                 "type": "array",
                 "items": {
                     "type": "string",
-                    "enum": ["urgent", "blocked", "needs_review", "approved"]
-                }
-            }
+                    "enum": ["urgent", "blocked", "needs_review", "approved"],
+                },
+            },
         },
-        "required": ["status", "priority", "category", "flags"]
+        "required": ["status", "priority", "category", "flags"],
     }
 
 
 @pytest.fixture
 def sample_structured_outputs_choices():
     return [
-        "Python", "Java", "JavaScript", "C++", "C#", "PHP", "TypeScript",
-        "Ruby", "Swift", "Kotlin"
+        "Python",
+        "Java",
+        "JavaScript",
+        "C++",
+        "C#",
+        "PHP",
+        "TypeScript",
+        "Ruby",
+        "Swift",
+        "Kotlin",
     ]
 
 
 @pytest.fixture
 def sample_sql_statements():
-    return ("""
+    return """
 start: select_statement
 select_statement: "SELECT" column "from" table "where" condition
 column: "col_1" | "col_2"
 table: "table_1" | "table_2"
 condition: column "=" number
 number: "1" | "2"
-""")
+"""
 
 
 @pytest.fixture(scope="session")
 def zephyr_lora_files():
     """Download zephyr LoRA files once per test session."""
     from huggingface_hub import snapshot_download
+
     return snapshot_download(repo_id="typeof/zephyr-7b-beta-lora")
 
 
@@ -214,5 +198,5 @@ def zephyr_lora_files():
 def opt125_lora_files() -> str:
     """Download opt-125m LoRA files once per test session."""
     from huggingface_hub import snapshot_download
-    return snapshot_download(
-        repo_id="peft-internal-testing/opt-125m-dummy-lora")
+
+    return snapshot_download(repo_id="peft-internal-testing/opt-125m-dummy-lora")
diff --git a/tests/entrypoints/llm/test_accuracy.py b/tests/entrypoints/llm/test_accuracy.py
index 5d605e906e81..e2d107b60586 100644
--- a/tests/entrypoints/llm/test_accuracy.py
+++ b/tests/entrypoints/llm/test_accuracy.py
@@ -48,20 +48,23 @@ def run_test(model_name, more_args=None):
 
     measured_value = results["results"][TASK][FILTER]
     assert model_name in EXPECTED_VALUES, (
-        f"Cannot find the expected value for the model {model_name=}")
+        f"Cannot find the expected value for the model {model_name=}"
+    )
     expected_value = EXPECTED_VALUES[model_name]
-    assert (measured_value - RTOL < expected_value
-            and measured_value + RTOL > expected_value
-            ), f"Expected: {expected_value} |  Measured: {measured_value}"
+    assert (
+        measured_value - RTOL < expected_value
+        and measured_value + RTOL > expected_value
+    ), f"Expected: {expected_value} |  Measured: {measured_value}"
 
 
 # TODO: [AlexM] Fix it with new CI/CD tests
-TPU_TP_TEST_STR = ""  #"tensor_parallel_size=4"
+TPU_TP_TEST_STR = ""  # "tensor_parallel_size=4"
 
 
-@pytest.mark.skipif(not current_platform.is_cuda()
-                    and not current_platform.is_tpu(),
-                    reason="V1 is currently only supported on CUDA and TPU")
+@pytest.mark.skipif(
+    not current_platform.is_cuda() and not current_platform.is_tpu(),
+    reason="V1 is currently only supported on CUDA and TPU",
+)
 @pytest.mark.parametrize("model", MODEL_NAMES)
 def test_lm_eval_accuracy_v1_engine(model, monkeypatch: pytest.MonkeyPatch):
     """Run with the V1 Engine."""
@@ -82,12 +85,14 @@ def test_lm_eval_accuracy_v1_engine(model, monkeypatch: pytest.MonkeyPatch):
         run_test(model, more_args)
 
 
-@pytest.mark.skipif(not current_platform.is_cuda()
-                    and not current_platform.is_tpu(),
-                    reason="V1 is currently only supported on CUDA and TPU")
+@pytest.mark.skipif(
+    not current_platform.is_cuda() and not current_platform.is_tpu(),
+    reason="V1 is currently only supported on CUDA and TPU",
+)
 @pytest.mark.parametrize("model", FP8_KV_MODEL_NAMES)
 def test_lm_eval_accuracy_v1_engine_fp8_kv_cache(
-        model, monkeypatch: pytest.MonkeyPatch):
+    model, monkeypatch: pytest.MonkeyPatch
+):
     """Run with the V1 Engine."""
 
     with monkeypatch.context() as m:
diff --git a/tests/entrypoints/llm/test_chat.py b/tests/entrypoints/llm/test_chat.py
index bf460d0fb25d..b2a958a992a6 100644
--- a/tests/entrypoints/llm/test_chat.py
+++ b/tests/entrypoints/llm/test_chat.py
@@ -14,9 +14,7 @@
 def text_llm():
     # pytest caches the fixture so we use weakref.proxy to
     # enable garbage collection
-    llm = LLM(model="meta-llama/Llama-3.2-1B-Instruct",
-              enforce_eager=True,
-              seed=0)
+    llm = LLM(model="meta-llama/Llama-3.2-1B-Instruct", enforce_eager=True, seed=0)
 
     yield weakref.proxy(llm)
 
@@ -28,14 +26,8 @@ def text_llm():
 def test_chat(text_llm):
     prompt1 = "Explain the concept of entropy."
     messages = [
-        {
-            "role": "system",
-            "content": "You are a helpful assistant"
-        },
-        {
-            "role": "user",
-            "content": prompt1
-        },
+        {"role": "system", "content": "You are a helpful assistant"},
+        {"role": "user", "content": prompt1},
     ]
     outputs = text_llm.chat(messages)
     assert len(outputs) == 1
@@ -46,25 +38,13 @@ def test_multi_chat(text_llm):
     prompt2 = "Explain what among us is."
 
     conversation1 = [
-        {
-            "role": "system",
-            "content": "You are a helpful assistant"
-        },
-        {
-            "role": "user",
-            "content": prompt1
-        },
+        {"role": "system", "content": "You are a helpful assistant"},
+        {"role": "user", "content": prompt1},
     ]
 
     conversation2 = [
-        {
-            "role": "system",
-            "content": "You are a helpful assistant"
-        },
-        {
-            "role": "user",
-            "content": prompt2
-        },
+        {"role": "system", "content": "You are a helpful assistant"},
+        {"role": "user", "content": prompt2},
     ]
 
     messages = [conversation1, conversation2]
@@ -94,26 +74,22 @@ def vision_llm():
     cleanup_dist_env_and_memory()
 
 
-@pytest.mark.parametrize("image_urls",
-                         [[TEST_IMAGE_ASSETS[0], TEST_IMAGE_ASSETS[1]]],
-                         indirect=True)
+@pytest.mark.parametrize(
+    "image_urls", [[TEST_IMAGE_ASSETS[0], TEST_IMAGE_ASSETS[1]]], indirect=True
+)
 def test_chat_multi_image(vision_llm, image_urls: list[str]):
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            *({
-                "type": "image_url",
-                "image_url": {
-                    "url": image_url
-                }
-            } for image_url in image_urls),
-            {
-                "type": "text",
-                "text": "What's in this image?"
-            },
-        ],
-    }]
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                *(
+                    {"type": "image_url", "image_url": {"url": image_url}}
+                    for image_url in image_urls
+                ),
+                {"type": "text", "text": "What's in this image?"},
+            ],
+        }
+    ]
     outputs = vision_llm.chat(messages)
     assert len(outputs) >= 0
 
@@ -124,14 +100,8 @@ def test_llm_chat_tokenization_no_double_bos(text_llm):
     Check we get a single BOS token for llama chat.
     """
     messages = [
-        {
-            "role": "system",
-            "content": "You are a helpful assistant"
-        },
-        {
-            "role": "user",
-            "content": "Hello!"
-        },
+        {"role": "system", "content": "You are a helpful assistant"},
+        {"role": "user", "content": "Hello!"},
     ]
     outputs = text_llm.chat(messages)
     assert len(outputs) == 1
@@ -167,14 +137,8 @@ def thinking_llm():
 @pytest.mark.parametrize("enable_thinking", [True, False])
 def test_chat_extra_kwargs(thinking_llm, enable_thinking):
     messages = [
-        {
-            "role": "system",
-            "content": "You are a helpful assistant"
-        },
-        {
-            "role": "user",
-            "content": "What is 1+1?"
-        },
+        {"role": "system", "content": "You are a helpful assistant"},
+        {"role": "user", "content": "What is 1+1?"},
     ]
 
     outputs = thinking_llm.chat(
diff --git a/tests/entrypoints/llm/test_collective_rpc.py b/tests/entrypoints/llm/test_collective_rpc.py
index 3a13f8c979f2..937aa5c13246 100644
--- a/tests/entrypoints/llm/test_collective_rpc.py
+++ b/tests/entrypoints/llm/test_collective_rpc.py
@@ -23,9 +23,11 @@ def echo_rank(self):
         return self.rank
 
     monkeypatch.setenv("VLLM_ALLOW_INSECURE_SERIALIZATION", "1")
-    llm = LLM(model="meta-llama/Llama-3.2-1B-Instruct",
-              enforce_eager=True,
-              load_format="dummy",
-              tensor_parallel_size=tp_size,
-              distributed_executor_backend=backend)
+    llm = LLM(
+        model="meta-llama/Llama-3.2-1B-Instruct",
+        enforce_eager=True,
+        load_format="dummy",
+        tensor_parallel_size=tp_size,
+        distributed_executor_backend=backend,
+    )
     assert llm.collective_rpc(echo_rank) == list(range(tp_size))
diff --git a/tests/entrypoints/llm/test_generate.py b/tests/entrypoints/llm/test_generate.py
index 3be4530452fa..af9cc0afd26b 100644
--- a/tests/entrypoints/llm/test_generate.py
+++ b/tests/entrypoints/llm/test_generate.py
@@ -29,11 +29,13 @@
 def llm():
     # pytest caches the fixture so we use weakref.proxy to
     # enable garbage collection
-    llm = LLM(model=MODEL_NAME,
-              max_num_batched_tokens=4096,
-              tensor_parallel_size=1,
-              gpu_memory_utilization=0.10,
-              enforce_eager=True)
+    llm = LLM(
+        model=MODEL_NAME,
+        max_num_batched_tokens=4096,
+        tensor_parallel_size=1,
+        gpu_memory_utilization=0.10,
+        enforce_eager=True,
+    )
 
     yield weakref.proxy(llm)
 
@@ -81,7 +83,8 @@ def test_max_model_len():
     outputs = llm.generate(PROMPTS, sampling_params)
     for output in outputs:
         num_total_tokens = len(output.prompt_token_ids) + len(
-            output.outputs[0].token_ids)
+            output.outputs[0].token_ids
+        )
         # Total tokens must not exceed max_model_len + 1 (the last token can be
         # generated with the context length equal to the max model length)
         # It can be less if generation finishes due to other reasons (e.g., EOS)
diff --git a/tests/entrypoints/llm/test_gpu_utilization.py b/tests/entrypoints/llm/test_gpu_utilization.py
index 533da9e6d6ea..896091533ad2 100644
--- a/tests/entrypoints/llm/test_gpu_utilization.py
+++ b/tests/entrypoints/llm/test_gpu_utilization.py
@@ -16,9 +16,8 @@ def test_gpu_memory_utilization():
     # makes sure gpu_memory_utilization is per-instance limit,
     # not a global limit
     llms = [
-        LLM(model="facebook/opt-125m",
-            gpu_memory_utilization=0.3,
-            enforce_eager=True) for i in range(3)
+        LLM(model="facebook/opt-125m", gpu_memory_utilization=0.3, enforce_eager=True)
+        for i in range(3)
     ]
     for llm in llms:
         outputs = llm.generate(prompts, sampling_params)
diff --git a/tests/entrypoints/llm/test_prompt_validation.py b/tests/entrypoints/llm/test_prompt_validation.py
index b219b33d1760..81126a4f16f9 100644
--- a/tests/entrypoints/llm/test_prompt_validation.py
+++ b/tests/entrypoints/llm/test_prompt_validation.py
@@ -8,12 +8,12 @@
 
 def test_empty_prompt():
     llm = LLM(model="openai-community/gpt2", enforce_eager=True)
-    with pytest.raises(ValueError, match='decoder prompt cannot be empty'):
+    with pytest.raises(ValueError, match="decoder prompt cannot be empty"):
         llm.generate([""])
 
 
 @pytest.mark.skip_v1
 def test_out_of_vocab_token():
     llm = LLM(model="openai-community/gpt2", enforce_eager=True)
-    with pytest.raises(ValueError, match='out of vocabulary'):
+    with pytest.raises(ValueError, match="out of vocabulary"):
         llm.generate({"prompt_token_ids": [999999]})
diff --git a/tests/entrypoints/offline_mode/test_offline_mode.py b/tests/entrypoints/offline_mode/test_offline_mode.py
index f8ed5dda260f..25e663f3af0e 100644
--- a/tests/entrypoints/offline_mode/test_offline_mode.py
+++ b/tests/entrypoints/offline_mode/test_offline_mode.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Tests for HF_HUB_OFFLINE mode"""
+
 import dataclasses
 import importlib
 import sys
@@ -91,12 +92,11 @@ def disable_connect(*args, **kwargs):
 
 
 def _re_import_modules():
-    hf_hub_module_names = [
-        k for k in sys.modules if k.startswith("huggingface_hub")
-    ]
+    hf_hub_module_names = [k for k in sys.modules if k.startswith("huggingface_hub")]
     transformers_module_names = [
-        k for k in sys.modules if k.startswith("transformers")
-        and not k.startswith("transformers_modules")
+        k
+        for k in sys.modules
+        if k.startswith("transformers") and not k.startswith("transformers_modules")
     ]
 
     reload_exception = None
diff --git a/tests/entrypoints/openai/conftest.py b/tests/entrypoints/openai/conftest.py
index 0ecdd4245df4..b40079d8dc3d 100644
--- a/tests/entrypoints/openai/conftest.py
+++ b/tests/entrypoints/openai/conftest.py
@@ -7,14 +7,14 @@
 
 @pytest.fixture
 def mary_had_lamb():
-    path = AudioAsset('mary_had_lamb').get_local_path()
+    path = AudioAsset("mary_had_lamb").get_local_path()
     with open(str(path), "rb") as f:
         yield f
 
 
 @pytest.fixture
 def winning_call():
-    path = AudioAsset('winning_call').get_local_path()
+    path = AudioAsset("winning_call").get_local_path()
     with open(str(path), "rb") as f:
         yield f
 
@@ -22,6 +22,6 @@ def winning_call():
 @pytest.fixture
 def foscolo():
     # Test translation it->en
-    path = AudioAsset('azacinto_foscolo').get_local_path()
+    path = AudioAsset("azacinto_foscolo").get_local_path()
     with open(str(path), "rb") as f:
         yield f
diff --git a/tests/entrypoints/openai/correctness/test_lmeval.py b/tests/entrypoints/openai/correctness/test_lmeval.py
index 624acd5ffde7..919b7793628e 100644
--- a/tests/entrypoints/openai/correctness/test_lmeval.py
+++ b/tests/entrypoints/openai/correctness/test_lmeval.py
@@ -44,14 +44,15 @@ def run_test(more_args):
     print(f"Running with: {args}")
 
     with RemoteOpenAIServer(
-            MODEL_NAME, args,
-            max_wait_seconds=MAX_WAIT_SECONDS) as remote_server:
+        MODEL_NAME, args, max_wait_seconds=MAX_WAIT_SECONDS
+    ) as remote_server:
         url = f"{remote_server.url_for('v1')}/completions"
 
         model_args = (
             f"model={MODEL_NAME},"
             f"base_url={url},"
-            f"num_concurrent={NUM_CONCURRENT},tokenized_requests=False")
+            f"num_concurrent={NUM_CONCURRENT},tokenized_requests=False"
+        )
 
         results = lm_eval.simple_evaluate(
             model="local-completions",
@@ -60,15 +61,18 @@ def run_test(more_args):
         )
 
         measured_value = results["results"][TASK][FILTER]
-        assert (measured_value - RTOL < EXPECTED_VALUE
-                and measured_value + RTOL > EXPECTED_VALUE
-                ), f"Expected: {EXPECTED_VALUE} |  Measured: {measured_value}"
-
-
-@pytest.mark.skipif(not current_platform.is_cuda()
-                    and not current_platform.is_tpu()
-                    and not current_platform.is_xpu(),
-                    reason="V1 currently only supported on CUDA, XPU and TPU")
+        assert (
+            measured_value - RTOL < EXPECTED_VALUE
+            and measured_value + RTOL > EXPECTED_VALUE
+        ), f"Expected: {EXPECTED_VALUE} |  Measured: {measured_value}"
+
+
+@pytest.mark.skipif(
+    not current_platform.is_cuda()
+    and not current_platform.is_tpu()
+    and not current_platform.is_xpu(),
+    reason="V1 currently only supported on CUDA, XPU and TPU",
+)
 def test_lm_eval_accuracy_v1_engine(monkeypatch: pytest.MonkeyPatch):
     """Run with the V1 Engine."""
 
diff --git a/tests/entrypoints/openai/correctness/test_transcription_api_correctness.py b/tests/entrypoints/openai/correctness/test_transcription_api_correctness.py
index 9122b7003bf9..7821ade63ac3 100644
--- a/tests/entrypoints/openai/correctness/test_transcription_api_correctness.py
+++ b/tests/entrypoints/openai/correctness/test_transcription_api_correctness.py
@@ -7,6 +7,7 @@
 This simulates real work usage of the API and makes sure that the frontend and
 AsyncLLMEngine are working correctly.
 """
+
 import asyncio
 import io
 import time
@@ -45,7 +46,8 @@ async def transcribe_audio(client, tokenizer, y, sr):
         # NOTE there's no streaming in transcriptions, can't measure ttft
     latency = end_time - start_time
     num_output_tokens = len(
-        tokenizer(transcription.text, add_special_tokens=False).input_ids)
+        tokenizer(transcription.text, add_special_tokens=False).input_ids
+    )
     return latency, num_output_tokens, transcription.text
 
 
@@ -73,8 +75,8 @@ async def process_dataset(model, client, data, concurrent_request):
     for sample in data:
         audio, sr = sample["audio"]["array"], sample["audio"]["sampling_rate"]
         task = asyncio.create_task(
-            bound_transcribe(sem, client, tokenizer, (audio, sr),
-                             sample["text"]))
+            bound_transcribe(sem, client, tokenizer, (audio, sr), sample["text"])
+        )
         tasks.append(task)
     return await asyncio.gather(*tasks)
 
@@ -98,34 +100,35 @@ def print_performance_metrics(results, total_time):
 
 
 def add_duration(sample):
-    y, sr = sample['audio']["array"], sample['audio']["sampling_rate"]
-    sample['duration_ms'] = librosa.get_duration(y=y, sr=sr) * 1000
+    y, sr = sample["audio"]["array"], sample["audio"]["sampling_rate"]
+    sample["duration_ms"] = librosa.get_duration(y=y, sr=sr) * 1000
     return sample
 
 
-def load_hf_dataset(dataset_repo: str, split='validation', **hf_kwargs):
+def load_hf_dataset(dataset_repo: str, split="validation", **hf_kwargs):
     ## Load and filter the dataset
     dataset = load_dataset(dataset_repo, split=split, **hf_kwargs)
-    if 'duration_ms' not in dataset[0]:
+    if "duration_ms" not in dataset[0]:
         # compute duration to filter
         dataset = dataset.map(add_duration)
 
     # Whisper max supported duration
-    dataset = dataset.filter(lambda example: example['duration_ms'] < 30000)
+    dataset = dataset.filter(lambda example: example["duration_ms"] < 30000)
     return dataset
 
 
-def run_evaluation(model: str,
-                   client,
-                   dataset,
-                   max_concurrent_reqs: int,
-                   n_examples: int = -1,
-                   print_metrics: bool = True):
+def run_evaluation(
+    model: str,
+    client,
+    dataset,
+    max_concurrent_reqs: int,
+    n_examples: int = -1,
+    print_metrics: bool = True,
+):
     if n_examples > 0:
         dataset = dataset.select(range(n_examples))
     start = time.perf_counter()
-    results = asyncio.run(
-        process_dataset(model, client, dataset, max_concurrent_reqs))
+    results = asyncio.run(process_dataset(model, client, dataset, max_concurrent_reqs))
     end = time.perf_counter()
     total_time = end - start
     print(f"Total Test Time: {total_time:.4f} seconds")
@@ -135,8 +138,7 @@ def run_evaluation(model: str,
     predictions = [res[2] for res in results]
     references = [res[3] for res in results]
     wer = load("wer")
-    wer_score = 100 * wer.compute(references=references,
-                                  predictions=predictions)
+    wer_score = 100 * wer.compute(references=references, predictions=predictions)
     print("WER:", wer_score)
     return wer_score
 
@@ -145,26 +147,25 @@ def run_evaluation(model: str,
 @pytest.mark.parametrize("model_name", ["openai/whisper-large-v3"])
 # Original dataset is 20GB+ in size, hence we use a pre-filtered slice.
 @pytest.mark.parametrize(
-    "dataset_repo", ["D4nt3/esb-datasets-earnings22-validation-tiny-filtered"])
+    "dataset_repo", ["D4nt3/esb-datasets-earnings22-validation-tiny-filtered"]
+)
 # NOTE: Expected WER measured with equivalent hf.transformers args:
 # whisper-large-v3 + esb-datasets-earnings22-validation-tiny-filtered.
 @pytest.mark.parametrize("expected_wer", [12.744980])
-def test_wer_correctness(model_name,
-                         dataset_repo,
-                         expected_wer,
-                         n_examples=-1,
-                         max_concurrent_request=None):
+def test_wer_correctness(
+    model_name, dataset_repo, expected_wer, n_examples=-1, max_concurrent_request=None
+):
     # TODO refactor to use `ASRDataset`
-    with RemoteOpenAIServer(model_name, ['--enforce-eager']) as remote_server:
+    with RemoteOpenAIServer(model_name, ["--enforce-eager"]) as remote_server:
         dataset = load_hf_dataset(dataset_repo)
 
         if not max_concurrent_request:
             # No max concurrency
-            max_concurrent_request = n_examples if n_examples > 0\
-                else len(dataset)
+            max_concurrent_request = n_examples if n_examples > 0 else len(dataset)
 
         client = remote_server.get_async_client()
-        wer = run_evaluation(model_name, client, dataset,
-                             max_concurrent_request, n_examples)
+        wer = run_evaluation(
+            model_name, client, dataset, max_concurrent_request, n_examples
+        )
         if expected_wer:
             torch.testing.assert_close(wer, expected_wer, atol=1e-1, rtol=1e-2)
diff --git a/tests/entrypoints/openai/test_async_tokenization.py b/tests/entrypoints/openai/test_async_tokenization.py
index 80261597b11a..5df859df42da 100644
--- a/tests/entrypoints/openai/test_async_tokenization.py
+++ b/tests/entrypoints/openai/test_async_tokenization.py
@@ -44,15 +44,11 @@ async def client(server):
     ids=["completion", "chat"],
     argnames=["create_func_gen", "content_body"],
     argvalues=[
-        (lambda x: x.completions.create, {
-            "prompt": " ".join(['A'] * 10_000)
-        }),
-        (lambda x: x.chat.completions.create, {
-            "messages": [{
-                "role": "user",
-                "content": " ".join(['A'] * 10_000)
-            }]
-        }),
+        (lambda x: x.completions.create, {"prompt": " ".join(["A"] * 10_000)}),
+        (
+            lambda x: x.chat.completions.create,
+            {"messages": [{"role": "user", "content": " ".join(["A"] * 10_000)}]},
+        ),
     ],
 )
 async def test_with_and_without_truncate(
@@ -65,15 +61,15 @@ async def test_with_and_without_truncate(
     body = {"model": MODEL_NAME, **content_body, "max_tokens": 10}
 
     num_requests = 10
-    truncate_prompt_tokens = ([1000] * (num_requests // 2) + [None] *
-                              (num_requests - num_requests // 2))
+    truncate_prompt_tokens = [1000] * (num_requests // 2) + [None] * (
+        num_requests - num_requests // 2
+    )
     random.shuffle(truncate_prompt_tokens)
 
-    bodies = [{
-        **body, "extra_body": {
-            'truncate_prompt_tokens': t
-        }
-    } for t in truncate_prompt_tokens]
+    bodies = [
+        {**body, "extra_body": {"truncate_prompt_tokens": t}}
+        for t in truncate_prompt_tokens
+    ]
 
     async def get_status_code(**kwargs):
         try:
diff --git a/tests/entrypoints/openai/test_audio.py b/tests/entrypoints/openai/test_audio.py
index 2d33d3c3a6b5..f3e89f48f9f4 100644
--- a/tests/entrypoints/openai/test_audio.py
+++ b/tests/entrypoints/openai/test_audio.py
@@ -56,24 +56,18 @@ def base64_encoded_audio() -> dict[str, str]:
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("audio_url", [TEST_AUDIO_URLS[0]])
-async def test_single_chat_session_audio(client: openai.AsyncOpenAI,
-                                         model_name: str, audio_url: str):
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "audio_url",
-                "audio_url": {
-                    "url": audio_url
-                }
-            },
-            {
-                "type": "text",
-                "text": "What's happening in this audio?"
-            },
-        ],
-    }]
+async def test_single_chat_session_audio(
+    client: openai.AsyncOpenAI, model_name: str, audio_url: str
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {"type": "audio_url", "audio_url": {"url": audio_url}},
+                {"type": "text", "text": "What's happening in this audio?"},
+            ],
+        }
+    ]
 
     # test single completion
     chat_completion = await client.chat.completions.create(
@@ -82,13 +76,15 @@ async def test_single_chat_session_audio(client: openai.AsyncOpenAI,
         max_completion_tokens=10,
         logprobs=True,
         temperature=0.0,
-        top_logprobs=5)
+        top_logprobs=5,
+    )
     assert len(chat_completion.choices) == 1
 
     choice = chat_completion.choices[0]
     assert choice.finish_reason == "length"
     assert chat_completion.usage == openai.types.CompletionUsage(
-        completion_tokens=10, prompt_tokens=202, total_tokens=212)
+        completion_tokens=10, prompt_tokens=202, total_tokens=212
+    )
 
     message = choice.message
     message = chat_completion.choices[0].message
@@ -110,56 +106,52 @@ async def test_single_chat_session_audio(client: openai.AsyncOpenAI,
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("audio_url", [TEST_AUDIO_URLS[0]])
-async def test_error_on_invalid_audio_url_type(client: openai.AsyncOpenAI,
-                                               model_name: str,
-                                               audio_url: str):
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "audio_url",
-                "audio_url": audio_url
-            },
-            {
-                "type": "text",
-                "text": "What's happening in this audio?"
-            },
-        ],
-    }]
+async def test_error_on_invalid_audio_url_type(
+    client: openai.AsyncOpenAI, model_name: str, audio_url: str
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {"type": "audio_url", "audio_url": audio_url},
+                {"type": "text", "text": "What's happening in this audio?"},
+            ],
+        }
+    ]
 
     # audio_url should be a dict {"url": "some url"}, not directly a string
     with pytest.raises(openai.BadRequestError):
-        _ = await client.chat.completions.create(model=model_name,
-                                                 messages=messages,
-                                                 max_completion_tokens=10,
-                                                 temperature=0.0)
+        _ = await client.chat.completions.create(
+            model=model_name,
+            messages=messages,
+            max_completion_tokens=10,
+            temperature=0.0,
+        )
 
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("audio_url", [TEST_AUDIO_URLS[0]])
 async def test_single_chat_session_audio_base64encoded(
-        client: openai.AsyncOpenAI, model_name: str, audio_url: str,
-        base64_encoded_audio: dict[str, str]):
-
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "audio_url",
-                "audio_url": {
-                    "url":
-                    f"data:audio/wav;base64,{base64_encoded_audio[audio_url]}"
-                }
-            },
-            {
-                "type": "text",
-                "text": "What's happening in this audio?"
-            },
-        ],
-    }]
+    client: openai.AsyncOpenAI,
+    model_name: str,
+    audio_url: str,
+    base64_encoded_audio: dict[str, str],
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {
+                    "type": "audio_url",
+                    "audio_url": {
+                        "url": f"data:audio/wav;base64,{base64_encoded_audio[audio_url]}"
+                    },
+                },
+                {"type": "text", "text": "What's happening in this audio?"},
+            ],
+        }
+    ]
 
     # test single completion
     chat_completion = await client.chat.completions.create(
@@ -168,13 +160,15 @@ async def test_single_chat_session_audio_base64encoded(
         max_completion_tokens=10,
         logprobs=True,
         temperature=0.0,
-        top_logprobs=5)
+        top_logprobs=5,
+    )
     assert len(chat_completion.choices) == 1
 
     choice = chat_completion.choices[0]
     assert choice.finish_reason == "length"
     assert chat_completion.usage == openai.types.CompletionUsage(
-        completion_tokens=10, prompt_tokens=202, total_tokens=212)
+        completion_tokens=10, prompt_tokens=202, total_tokens=212
+    )
 
     message = choice.message
     message = chat_completion.choices[0].message
@@ -198,25 +192,26 @@ async def test_single_chat_session_audio_base64encoded(
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("audio_url", [TEST_AUDIO_URLS[0]])
 async def test_single_chat_session_input_audio(
-        client: openai.AsyncOpenAI, model_name: str, audio_url: str,
-        base64_encoded_audio: dict[str, str]):
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "input_audio",
-                "input_audio": {
-                    "data": base64_encoded_audio[audio_url],
-                    "format": "wav"
-                }
-            },
-            {
-                "type": "text",
-                "text": "What's happening in this audio?"
-            },
-        ],
-    }]
+    client: openai.AsyncOpenAI,
+    model_name: str,
+    audio_url: str,
+    base64_encoded_audio: dict[str, str],
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {
+                    "type": "input_audio",
+                    "input_audio": {
+                        "data": base64_encoded_audio[audio_url],
+                        "format": "wav",
+                    },
+                },
+                {"type": "text", "text": "What's happening in this audio?"},
+            ],
+        }
+    ]
 
     # test single completion
     chat_completion = await client.chat.completions.create(
@@ -224,13 +219,15 @@ async def test_single_chat_session_input_audio(
         messages=messages,
         max_completion_tokens=10,
         logprobs=True,
-        top_logprobs=5)
+        top_logprobs=5,
+    )
     assert len(chat_completion.choices) == 1
 
     choice = chat_completion.choices[0]
     assert choice.finish_reason == "length"
     assert chat_completion.usage == openai.types.CompletionUsage(
-        completion_tokens=10, prompt_tokens=202, total_tokens=212)
+        completion_tokens=10, prompt_tokens=202, total_tokens=212
+    )
 
     message = choice.message
     message = chat_completion.choices[0].message
@@ -252,24 +249,18 @@ async def test_single_chat_session_input_audio(
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("audio_url", TEST_AUDIO_URLS)
-async def test_chat_streaming_audio(client: openai.AsyncOpenAI,
-                                    model_name: str, audio_url: str):
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "audio_url",
-                "audio_url": {
-                    "url": audio_url
-                }
-            },
-            {
-                "type": "text",
-                "text": "What's happening in this audio?"
-            },
-        ],
-    }]
+async def test_chat_streaming_audio(
+    client: openai.AsyncOpenAI, model_name: str, audio_url: str
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {"type": "audio_url", "audio_url": {"url": audio_url}},
+                {"type": "text", "text": "What's happening in this audio?"},
+            ],
+        }
+    ]
 
     # test single completion
     chat_completion = await client.chat.completions.create(
@@ -309,27 +300,27 @@ async def test_chat_streaming_audio(client: openai.AsyncOpenAI,
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("audio_url", TEST_AUDIO_URLS)
-async def test_chat_streaming_input_audio(client: openai.AsyncOpenAI,
-                                          model_name: str, audio_url: str,
-                                          base64_encoded_audio: dict[str,
-                                                                     str]):
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "input_audio",
-                "input_audio": {
-                    "data": base64_encoded_audio[audio_url],
-                    "format": "wav"
-                }
-            },
-            {
-                "type": "text",
-                "text": "What's happening in this audio?"
-            },
-        ],
-    }]
+async def test_chat_streaming_input_audio(
+    client: openai.AsyncOpenAI,
+    model_name: str,
+    audio_url: str,
+    base64_encoded_audio: dict[str, str],
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {
+                    "type": "input_audio",
+                    "input_audio": {
+                        "data": base64_encoded_audio[audio_url],
+                        "format": "wav",
+                    },
+                },
+                {"type": "text", "text": "What's happening in this audio?"},
+            ],
+        }
+    ]
 
     # test single completion
     chat_completion = await client.chat.completions.create(
@@ -369,26 +360,23 @@ async def test_chat_streaming_input_audio(client: openai.AsyncOpenAI,
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize(
-    "audio_urls", [TEST_AUDIO_URLS, TEST_AUDIO_URLS + [TEST_AUDIO_URLS[0]]])
-async def test_multi_audio_input(client: openai.AsyncOpenAI, model_name: str,
-                                 audio_urls: list[str]):
-
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            *({
-                "type": "audio_url",
-                "audio_url": {
-                    "url": audio_url
-                }
-            } for audio_url in audio_urls),
-            {
-                "type": "text",
-                "text": "What's happening in this audio?"
-            },
-        ],
-    }]
+    "audio_urls", [TEST_AUDIO_URLS, TEST_AUDIO_URLS + [TEST_AUDIO_URLS[0]]]
+)
+async def test_multi_audio_input(
+    client: openai.AsyncOpenAI, model_name: str, audio_urls: list[str]
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                *(
+                    {"type": "audio_url", "audio_url": {"url": audio_url}}
+                    for audio_url in audio_urls
+                ),
+                {"type": "text", "text": "What's happening in this audio?"},
+            ],
+        }
+    ]
 
     if len(audio_urls) > MAXIMUM_AUDIOS:
         with pytest.raises(openai.BadRequestError):  # test multi-audio input
diff --git a/tests/entrypoints/openai/test_basic.py b/tests/entrypoints/openai/test_basic.py
index a55941976cd8..50ec87b4464f 100644
--- a/tests/entrypoints/openai/test_basic.py
+++ b/tests/entrypoints/openai/test_basic.py
@@ -16,9 +16,9 @@
 MODEL_NAME = "HuggingFaceH4/zephyr-7b-beta"
 
 
-@pytest.fixture(scope='module')
+@pytest.fixture(scope="module")
 def server_args(request: pytest.FixtureRequest) -> list[str]:
-    """ Provide extra arguments to the server via indirect parametrization
+    """Provide extra arguments to the server via indirect parametrization
 
     Usage:
 
@@ -80,8 +80,10 @@ async def client(server):
     "server_args",
     [
         pytest.param([], id="default-frontend-multiprocessing"),
-        pytest.param(["--disable-frontend-multiprocessing"],
-                     id="disable-frontend-multiprocessing")
+        pytest.param(
+            ["--disable-frontend-multiprocessing"],
+            id="disable-frontend-multiprocessing",
+        ),
     ],
     indirect=True,
 )
@@ -97,8 +99,10 @@ async def test_show_version(server: RemoteOpenAIServer):
     "server_args",
     [
         pytest.param([], id="default-frontend-multiprocessing"),
-        pytest.param(["--disable-frontend-multiprocessing"],
-                     id="disable-frontend-multiprocessing")
+        pytest.param(
+            ["--disable-frontend-multiprocessing"],
+            id="disable-frontend-multiprocessing",
+        ),
     ],
     indirect=True,
 )
@@ -112,11 +116,13 @@ async def test_check_health(server: RemoteOpenAIServer):
 @pytest.mark.parametrize(
     "server_args",
     [
-        pytest.param(["--max-model-len", "10100"],
-                     id="default-frontend-multiprocessing"),
+        pytest.param(
+            ["--max-model-len", "10100"], id="default-frontend-multiprocessing"
+        ),
         pytest.param(
             ["--disable-frontend-multiprocessing", "--max-model-len", "10100"],
-            id="disable-frontend-multiprocessing")
+            id="disable-frontend-multiprocessing",
+        ),
     ],
     indirect=True,
 )
@@ -131,14 +137,16 @@ async def test_request_cancellation(server: RemoteOpenAIServer):
     # Request about 2 million tokens
     for _ in range(200):
         task = asyncio.create_task(
-            client.chat.completions.create(messages=chat_input,
-                                           model=MODEL_NAME,
-                                           max_tokens=10000,
-                                           extra_body={"min_tokens": 10000}))
+            client.chat.completions.create(
+                messages=chat_input,
+                model=MODEL_NAME,
+                max_tokens=10000,
+                extra_body={"min_tokens": 10000},
+            )
+        )
         tasks.append(task)
 
-    done, pending = await asyncio.wait(tasks,
-                                       return_when=asyncio.ALL_COMPLETED)
+    done, pending = await asyncio.wait(tasks, return_when=asyncio.ALL_COMPLETED)
 
     # Make sure all requests were sent to the server and timed out
     # (We don't want to hide other errors like 400s that would invalidate this
@@ -151,16 +159,15 @@ async def test_request_cancellation(server: RemoteOpenAIServer):
     # If the server had not cancelled all the other requests, then it would not
     # be able to respond to this one within the timeout
     client = server.get_async_client(timeout=5)
-    response = await client.chat.completions.create(messages=chat_input,
-                                                    model=MODEL_NAME,
-                                                    max_tokens=10)
+    response = await client.chat.completions.create(
+        messages=chat_input, model=MODEL_NAME, max_tokens=10
+    )
 
     assert len(response.choices) == 1
 
 
 @pytest.mark.asyncio
 async def test_request_wrong_content_type(server: RemoteOpenAIServer):
-
     chat_input = [{"role": "user", "content": "Write a long story"}]
     client = server.get_async_client()
 
@@ -169,17 +176,13 @@ async def test_request_wrong_content_type(server: RemoteOpenAIServer):
             messages=chat_input,
             model=MODEL_NAME,
             max_tokens=10000,
-            extra_headers={
-                "Content-Type": "application/x-www-form-urlencoded"
-            })
+            extra_headers={"Content-Type": "application/x-www-form-urlencoded"},
+        )
 
 
 @pytest.mark.parametrize(
     "server_args",
-    [
-        pytest.param(["--enable-server-load-tracking"],
-                     id="enable-server-load-tracking")
-    ],
+    [pytest.param(["--enable-server-load-tracking"], id="enable-server-load-tracking")],
     indirect=True,
 )
 @pytest.mark.asyncio
@@ -202,7 +205,8 @@ def make_long_completion_request():
 
     # Start the completion request in a background thread.
     completion_future = asyncio.create_task(
-        asyncio.to_thread(make_long_completion_request))
+        asyncio.to_thread(make_long_completion_request)
+    )
 
     # Give a short delay to ensure the request has started.
     await asyncio.sleep(0.1)
diff --git a/tests/entrypoints/openai/test_chat.py b/tests/entrypoints/openai/test_chat.py
index 3bdfef7b4adb..e1d5971052bc 100644
--- a/tests/entrypoints/openai/test_chat.py
+++ b/tests/entrypoints/openai/test_chat.py
@@ -23,14 +23,15 @@
 @pytest.fixture(scope="module")
 def monkeypatch_module():
     from _pytest.monkeypatch import MonkeyPatch
+
     mpatch = MonkeyPatch()
     yield mpatch
     mpatch.undo()
 
 
 @pytest.fixture(scope="module")
-def server(monkeypatch_module, zephyr_lora_files):  #noqa: F811
-    monkeypatch_module.setenv('VLLM_USE_V1', '1')
+def server(monkeypatch_module, zephyr_lora_files):  # noqa: F811
+    monkeypatch_module.setenv("VLLM_USE_V1", "1")
 
     args = [
         # use half precision for speed and memory savings in CI environment
@@ -68,20 +69,18 @@ async def client(server):
     [MODEL_NAME, "zephyr-lora"],
 )
 async def test_no_logprobs_chat(client: openai.AsyncOpenAI, model_name: str):
-    messages = [{
-        "role": "system",
-        "content": "you are a helpful assistant"
-    }, {
-        "role": "user",
-        "content": "what is 1+1?"
-    }]
+    messages = [
+        {"role": "system", "content": "you are a helpful assistant"},
+        {"role": "user", "content": "what is 1+1?"},
+    ]
 
     chat_completion = await client.chat.completions.create(
         model=model_name,
         messages=messages,
         max_completion_tokens=5,
         temperature=0.0,
-        logprobs=False)
+        logprobs=False,
+    )
 
     choice = chat_completion.choices[0]
     assert choice.logprobs is None
@@ -94,13 +93,10 @@ async def test_no_logprobs_chat(client: openai.AsyncOpenAI, model_name: str):
     [MODEL_NAME, "zephyr-lora"],
 )
 async def test_zero_logprobs_chat(client: openai.AsyncOpenAI, model_name: str):
-    messages = [{
-        "role": "system",
-        "content": "you are a helpful assistant"
-    }, {
-        "role": "user",
-        "content": "what is 1+1?"
-    }]
+    messages = [
+        {"role": "system", "content": "you are a helpful assistant"},
+        {"role": "user", "content": "what is 1+1?"},
+    ]
 
     chat_completion = await client.chat.completions.create(
         model=model_name,
@@ -108,7 +104,8 @@ async def test_zero_logprobs_chat(client: openai.AsyncOpenAI, model_name: str):
         max_completion_tokens=5,
         temperature=0.0,
         logprobs=True,
-        top_logprobs=0)
+        top_logprobs=0,
+    )
 
     choice = chat_completion.choices[0]
     assert choice.logprobs is not None
@@ -122,13 +119,10 @@ async def test_zero_logprobs_chat(client: openai.AsyncOpenAI, model_name: str):
     [MODEL_NAME, "zephyr-lora"],
 )
 async def test_some_logprobs_chat(client: openai.AsyncOpenAI, model_name: str):
-    messages = [{
-        "role": "system",
-        "content": "you are a helpful assistant"
-    }, {
-        "role": "user",
-        "content": "what is 1+1?"
-    }]
+    messages = [
+        {"role": "system", "content": "you are a helpful assistant"},
+        {"role": "user", "content": "what is 1+1?"},
+    ]
 
     chat_completion = await client.chat.completions.create(
         model=model_name,
@@ -136,7 +130,8 @@ async def test_some_logprobs_chat(client: openai.AsyncOpenAI, model_name: str):
         max_completion_tokens=5,
         temperature=0.0,
         logprobs=True,
-        top_logprobs=5)
+        top_logprobs=5,
+    )
 
     choice = chat_completion.choices[0]
     assert choice.logprobs is not None
@@ -149,41 +144,39 @@ async def test_some_logprobs_chat(client: openai.AsyncOpenAI, model_name: str):
     "model_name",
     [MODEL_NAME, "zephyr-lora"],
 )
-async def test_too_many_chat_logprobs(client: openai.AsyncOpenAI,
-                                      model_name: str):
-    messages = [{
-        "role": "system",
-        "content": "you are a helpful assistant"
-    }, {
-        "role": "user",
-        "content": "what is 1+1?"
-    }]
+async def test_too_many_chat_logprobs(client: openai.AsyncOpenAI, model_name: str):
+    messages = [
+        {"role": "system", "content": "you are a helpful assistant"},
+        {"role": "user", "content": "what is 1+1?"},
+    ]
 
     # Default max_logprobs is 20, so this should raise an error
     with pytest.raises((openai.BadRequestError, openai.APIError)):
-        stream = await client.chat.completions.create(model=model_name,
-                                                      messages=messages,
-                                                      max_completion_tokens=10,
-                                                      logprobs=True,
-                                                      top_logprobs=21,
-                                                      stream=True)
+        stream = await client.chat.completions.create(
+            model=model_name,
+            messages=messages,
+            max_completion_tokens=10,
+            logprobs=True,
+            top_logprobs=21,
+            stream=True,
+        )
         async for chunk in stream:
             ...
 
     with pytest.raises(openai.BadRequestError):
-        await client.chat.completions.create(model=model_name,
-                                             messages=messages,
-                                             max_completion_tokens=10,
-                                             logprobs=True,
-                                             top_logprobs=30,
-                                             stream=False)
+        await client.chat.completions.create(
+            model=model_name,
+            messages=messages,
+            max_completion_tokens=10,
+            logprobs=True,
+            top_logprobs=30,
+            stream=False,
+        )
 
     # the server should still work afterwards
     chat_completion = await client.chat.completions.create(
-        model=model_name,
-        messages=messages,
-        max_completion_tokens=10,
-        stream=False)
+        model=model_name, messages=messages, max_completion_tokens=10, stream=False
+    )
     message = chat_completion.choices[0].message
     assert message.content is not None and len(message.content) >= 0
 
@@ -193,27 +186,20 @@ async def test_too_many_chat_logprobs(client: openai.AsyncOpenAI,
     "model_name, prompt_logprobs",
     [(MODEL_NAME, 1), (MODEL_NAME, 0), (MODEL_NAME, -1), (MODEL_NAME, None)],
 )
-async def test_prompt_logprobs_chat(client: openai.AsyncOpenAI,
-                                    model_name: str,
-                                    prompt_logprobs: Optional[int]):
+async def test_prompt_logprobs_chat(
+    client: openai.AsyncOpenAI, model_name: str, prompt_logprobs: Optional[int]
+):
     params: dict = {
-        "messages": [{
-            "role": "system",
-            "content": "You are a helpful assistant."
-        }, {
-            "role": "user",
-            "content": "Who won the world series in 2020?"
-        }, {
-            "role":
-            "assistant",
-            "content":
-            "The Los Angeles Dodgers won the World Series in 2020."
-        }, {
-            "role": "user",
-            "content": "Where was it played?"
-        }],
-        "model":
-        model_name
+        "messages": [
+            {"role": "system", "content": "You are a helpful assistant."},
+            {"role": "user", "content": "Who won the world series in 2020?"},
+            {
+                "role": "assistant",
+                "content": "The Los Angeles Dodgers won the World Series in 2020.",
+            },
+            {"role": "user", "content": "Where was it played?"},
+        ],
+        "model": model_name,
     }
 
     if prompt_logprobs is not None:
@@ -236,29 +222,21 @@ async def test_prompt_logprobs_chat(client: openai.AsyncOpenAI,
     "model_name",
     [MODEL_NAME],
 )
-async def test_more_than_one_prompt_logprobs_chat(client: openai.AsyncOpenAI,
-                                                  model_name: str):
+async def test_more_than_one_prompt_logprobs_chat(
+    client: openai.AsyncOpenAI, model_name: str
+):
     params: dict = {
-        "messages": [{
-            "role": "system",
-            "content": "You are a helpful assistant."
-        }, {
-            "role": "user",
-            "content": "Who won the world series in 2020?"
-        }, {
-            "role":
-            "assistant",
-            "content":
-            "The Los Angeles Dodgers won the World Series in 2020."
-        }, {
-            "role": "user",
-            "content": "Where was it played?"
-        }],
-        "model":
-        model_name,
-        "extra_body": {
-            "prompt_logprobs": 1
-        }
+        "messages": [
+            {"role": "system", "content": "You are a helpful assistant."},
+            {"role": "user", "content": "Who won the world series in 2020?"},
+            {
+                "role": "assistant",
+                "content": "The Los Angeles Dodgers won the World Series in 2020.",
+            },
+            {"role": "user", "content": "Where was it played?"},
+        ],
+        "model": model_name,
+        "extra_body": {"prompt_logprobs": 1},
     }
 
     completion_1 = await client.chat.completions.create(**params)
@@ -275,15 +253,11 @@ async def test_more_than_one_prompt_logprobs_chat(client: openai.AsyncOpenAI,
     "model_name",
     [MODEL_NAME, "zephyr-lora"],
 )
-async def test_single_chat_session(client: openai.AsyncOpenAI,
-                                   model_name: str):
-    messages = [{
-        "role": "system",
-        "content": "you are a helpful assistant"
-    }, {
-        "role": "user",
-        "content": "what is 1+1?"
-    }]
+async def test_single_chat_session(client: openai.AsyncOpenAI, model_name: str):
+    messages = [
+        {"role": "system", "content": "you are a helpful assistant"},
+        {"role": "user", "content": "what is 1+1?"},
+    ]
 
     # test single completion
     chat_completion = await client.chat.completions.create(
@@ -291,14 +265,16 @@ async def test_single_chat_session(client: openai.AsyncOpenAI,
         messages=messages,
         max_completion_tokens=10,
         logprobs=True,
-        top_logprobs=5)
+        top_logprobs=5,
+    )
     assert chat_completion.id is not None
     assert len(chat_completion.choices) == 1
 
     choice = chat_completion.choices[0]
     assert choice.finish_reason == "length"
     assert chat_completion.usage == openai.types.CompletionUsage(
-        completion_tokens=10, prompt_tokens=37, total_tokens=47)
+        completion_tokens=10, prompt_tokens=37, total_tokens=47
+    )
 
     message = choice.message
     assert message.content is not None and len(message.content) >= 10
@@ -323,13 +299,10 @@ async def test_single_chat_session(client: openai.AsyncOpenAI,
     [MODEL_NAME, "zephyr-lora"],
 )
 async def test_chat_streaming(client: openai.AsyncOpenAI, model_name: str):
-    messages = [{
-        "role": "system",
-        "content": "you are a helpful assistant"
-    }, {
-        "role": "user",
-        "content": "what is 1+1?"
-    }]
+    messages = [
+        {"role": "system", "content": "you are a helpful assistant"},
+        {"role": "user", "content": "what is 1+1?"},
+    ]
 
     # test single completion
     chat_completion = await client.chat.completions.create(
@@ -371,15 +344,13 @@ async def test_chat_streaming(client: openai.AsyncOpenAI, model_name: str):
     "model_name",
     ["HuggingFaceH4/zephyr-7b-beta", "zephyr-lora"],
 )
-async def test_chat_completion_stream_options(client: openai.AsyncOpenAI,
-                                              model_name: str):
-    messages = [{
-        "role": "system",
-        "content": "You are a helpful assistant."
-    }, {
-        "role": "user",
-        "content": "What is the capital of France?"
-    }]
+async def test_chat_completion_stream_options(
+    client: openai.AsyncOpenAI, model_name: str
+):
+    messages = [
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "What is the capital of France?"},
+    ]
 
     # Test stream=True, stream_options={"include_usage": False}
     stream = await client.chat.completions.create(
@@ -388,23 +359,21 @@ async def test_chat_completion_stream_options(client: openai.AsyncOpenAI,
         max_completion_tokens=10,
         temperature=0.0,
         stream=True,
-        stream_options={"include_usage": False})
+        stream_options={"include_usage": False},
+    )
     async for chunk in stream:
         assert chunk.usage is None
 
     # Test stream=True, stream_options={"include_usage": True,
     #                                   "continuous_usage_stats": False}}
-    stream = await client.chat.completions.create(model=model_name,
-                                                  messages=messages,
-                                                  max_completion_tokens=10,
-                                                  temperature=0.0,
-                                                  stream=True,
-                                                  stream_options={
-                                                      "include_usage":
-                                                      True,
-                                                      "continuous_usage_stats":
-                                                      False
-                                                  })
+    stream = await client.chat.completions.create(
+        model=model_name,
+        messages=messages,
+        max_completion_tokens=10,
+        temperature=0.0,
+        stream=True,
+        stream_options={"include_usage": True, "continuous_usage_stats": False},
+    )
 
     async for chunk in stream:
         if chunk.choices[0].finish_reason is None:
@@ -416,8 +385,8 @@ async def test_chat_completion_stream_options(client: openai.AsyncOpenAI,
             assert final_chunk.usage.prompt_tokens > 0
             assert final_chunk.usage.completion_tokens > 0
             assert final_chunk.usage.total_tokens == (
-                final_chunk.usage.prompt_tokens +
-                final_chunk.usage.completion_tokens)
+                final_chunk.usage.prompt_tokens + final_chunk.usage.completion_tokens
+            )
             assert final_chunk.choices == []
 
     # Test stream=False, stream_options={"include_usage": None}
@@ -428,7 +397,8 @@ async def test_chat_completion_stream_options(client: openai.AsyncOpenAI,
             max_completion_tokens=10,
             temperature=0.0,
             stream=False,
-            stream_options={"include_usage": None})
+            stream_options={"include_usage": None},
+        )
 
     # Test stream=False, stream_options={"include_usage": True}
     with pytest.raises(BadRequestError):
@@ -438,7 +408,8 @@ async def test_chat_completion_stream_options(client: openai.AsyncOpenAI,
             max_completion_tokens=10,
             temperature=0.0,
             stream=False,
-            stream_options={"include_usage": True})
+            stream_options={"include_usage": True},
+        )
 
     # Test stream=True, stream_options={"include_usage": True,
     #                           "continuous_usage_stats": True}
@@ -457,14 +428,17 @@ async def test_chat_completion_stream_options(client: openai.AsyncOpenAI,
     last_completion_tokens = 0
     async for chunk in stream:
         assert chunk.usage.prompt_tokens >= 0
-        assert last_completion_tokens == 0 or \
-               chunk.usage.completion_tokens > last_completion_tokens or \
-               (
-                   not chunk.choices and
-                   chunk.usage.completion_tokens == last_completion_tokens
-               )
-        assert chunk.usage.total_tokens == (chunk.usage.prompt_tokens +
-                                            chunk.usage.completion_tokens)
+        assert (
+            last_completion_tokens == 0
+            or chunk.usage.completion_tokens > last_completion_tokens
+            or (
+                not chunk.choices
+                and chunk.usage.completion_tokens == last_completion_tokens
+            )
+        )
+        assert chunk.usage.total_tokens == (
+            chunk.usage.prompt_tokens + chunk.usage.completion_tokens
+        )
         last_completion_tokens = chunk.usage.completion_tokens
 
     assert last_completion_tokens == 10
@@ -475,37 +449,36 @@ async def test_structured_outputs_choice_chat(
     client: openai.AsyncOpenAI,
     sample_structured_outputs_choices,
 ):
-    messages = [{
-        "role": "system",
-        "content": "you are a helpful assistant"
-    }, {
-        "role":
-        "user",
-        "content":
-        "The best language for type-safe systems programming is "
-    }]
+    messages = [
+        {"role": "system", "content": "you are a helpful assistant"},
+        {
+            "role": "user",
+            "content": "The best language for type-safe systems programming is ",
+        },
+    ]
     chat_completion = await client.chat.completions.create(
         model=MODEL_NAME,
         messages=messages,
         max_completion_tokens=10,
         temperature=0.7,
         extra_body=dict(
-            structured_outputs={"choice": sample_structured_outputs_choices}))
+            structured_outputs={"choice": sample_structured_outputs_choices}
+        ),
+    )
     choice1 = chat_completion.choices[0].message.content
     assert choice1 in sample_structured_outputs_choices
 
     messages.append({"role": "assistant", "content": choice1})
-    messages.append({
-        "role": "user",
-        "content": "I disagree, pick another one"
-    })
+    messages.append({"role": "user", "content": "I disagree, pick another one"})
     chat_completion = await client.chat.completions.create(
         model=MODEL_NAME,
         messages=messages,
         max_completion_tokens=10,
         temperature=0.7,
         extra_body=dict(
-            structured_outputs={"choice": sample_structured_outputs_choices}))
+            structured_outputs={"choice": sample_structured_outputs_choices}
+        ),
+    )
     choice2 = chat_completion.choices[0].message.content
     assert choice2 in sample_structured_outputs_choices
     assert choice1 != choice2
@@ -516,38 +489,35 @@ async def test_structured_outputs_json_chat(
     client: openai.AsyncOpenAI,
     sample_json_schema,
 ):
-    messages = [{
-        "role": "system",
-        "content": "you are a helpful assistant"
-    }, {
-        "role":
-        "user",
-        "content":
-        f"Give an example JSON for an employee profile that "
-        f"fits this schema: {sample_json_schema}"
-    }]
+    messages = [
+        {"role": "system", "content": "you are a helpful assistant"},
+        {
+            "role": "user",
+            "content": f"Give an example JSON for an employee profile that "
+            f"fits this schema: {sample_json_schema}",
+        },
+    ]
     chat_completion = await client.chat.completions.create(
         model=MODEL_NAME,
         messages=messages,
         max_completion_tokens=1000,
-        extra_body=dict(structured_outputs={"json": sample_json_schema}))
+        extra_body=dict(structured_outputs={"json": sample_json_schema}),
+    )
     message = chat_completion.choices[0].message
     assert message.content is not None
     json1 = json.loads(message.content)
     jsonschema.validate(instance=json1, schema=sample_json_schema)
 
     messages.append({"role": "assistant", "content": message.content})
-    messages.append({
-        "role":
-        "user",
-        "content":
-        "Give me another one with a different name and age"
-    })
+    messages.append(
+        {"role": "user", "content": "Give me another one with a different name and age"}
+    )
     chat_completion = await client.chat.completions.create(
         model=MODEL_NAME,
         messages=messages,
         max_completion_tokens=1000,
-        extra_body=dict(structured_outputs={"json": sample_json_schema}))
+        extra_body=dict(structured_outputs={"json": sample_json_schema}),
+    )
     message = chat_completion.choices[0].message
     assert message.content is not None
     json2 = json.loads(message.content)
@@ -561,21 +531,19 @@ async def test_structured_outputs_regex_chat(
     client: openai.AsyncOpenAI,
     sample_regex,
 ):
-
-    messages = [{
-        "role": "system",
-        "content": "you are a helpful assistant"
-    }, {
-        "role":
-        "user",
-        "content":
-        f"Give an example IP address with this regex: {sample_regex}"
-    }]
+    messages = [
+        {"role": "system", "content": "you are a helpful assistant"},
+        {
+            "role": "user",
+            "content": f"Give an example IP address with this regex: {sample_regex}",
+        },
+    ]
     chat_completion = await client.chat.completions.create(
         model=MODEL_NAME,
         messages=messages,
         max_completion_tokens=20,
-        extra_body=dict(structured_outputs={"regex": sample_regex}))
+        extra_body=dict(structured_outputs={"regex": sample_regex}),
+    )
     ip1 = chat_completion.choices[0].message.content
     assert ip1 is not None
     assert re.fullmatch(sample_regex, ip1) is not None
@@ -586,7 +554,8 @@ async def test_structured_outputs_regex_chat(
         model=MODEL_NAME,
         messages=messages,
         max_completion_tokens=20,
-        extra_body=dict(structured_outputs={"regex": sample_regex}))
+        extra_body=dict(structured_outputs={"regex": sample_regex}),
+    )
     ip2 = chat_completion.choices[0].message.content
     assert ip2 is not None
     assert re.fullmatch(sample_regex, ip2) is not None
@@ -595,40 +564,33 @@ async def test_structured_outputs_regex_chat(
 
 @pytest.mark.asyncio
 async def test_structured_outputs_type_error(client: openai.AsyncOpenAI):
-    messages = [{
-        "role": "system",
-        "content": "you are a helpful assistant"
-    }, {
-        "role":
-        "user",
-        "content":
-        "The best language for type-safe systems programming is "
-    }]
+    messages = [
+        {"role": "system", "content": "you are a helpful assistant"},
+        {
+            "role": "user",
+            "content": "The best language for type-safe systems programming is ",
+        },
+    ]
 
     with pytest.raises(openai.BadRequestError):
         _ = await client.chat.completions.create(
             model=MODEL_NAME,
             messages=messages,
-            extra_body=dict(
-                structured_outputs={"regex": {
-                    1: "Python",
-                    2: "C++"
-                }}))
+            extra_body=dict(structured_outputs={"regex": {1: "Python", 2: "C++"}}),
+        )
 
 
 @pytest.mark.asyncio
 async def test_structured_outputs_choice_chat_logprobs(
-        client: openai.AsyncOpenAI, sample_structured_outputs_choices):
-
-    messages = [{
-        "role": "system",
-        "content": "you are a helpful assistant"
-    }, {
-        "role":
-        "user",
-        "content":
-        "The best language for type-safe systems programming is "
-    }]
+    client: openai.AsyncOpenAI, sample_structured_outputs_choices
+):
+    messages = [
+        {"role": "system", "content": "you are a helpful assistant"},
+        {
+            "role": "user",
+            "content": "The best language for type-safe systems programming is ",
+        },
+    ]
     chat_completion = await client.chat.completions.create(
         model=MODEL_NAME,
         messages=messages,
@@ -636,7 +598,9 @@ async def test_structured_outputs_choice_chat_logprobs(
         logprobs=True,
         top_logprobs=5,
         extra_body=dict(
-            structured_outputs={"choice": sample_structured_outputs_choices}))
+            structured_outputs={"choice": sample_structured_outputs_choices}
+        ),
+    )
 
     assert chat_completion.choices[0].logprobs is not None
     assert chat_completion.choices[0].logprobs.content is not None
@@ -652,29 +616,26 @@ async def test_named_tool_use(
     client: openai.AsyncOpenAI,
     sample_json_schema,
 ):
-    messages = [{
-        "role": "system",
-        "content": "you are a helpful assistant"
-    }, {
-        "role":
-        "user",
-        "content": ("Give an example JSON for an employee "
-                    "profile using the specified tool.")
-    }]
-    tools = [{
-        "type": "function",
-        "function": {
-            "name": "dummy_function_name",
-            "description": "This is a dummy function",
-            "parameters": sample_json_schema
-        }
-    }]
-    tool_choice = {
-        "type": "function",
-        "function": {
-            "name": "dummy_function_name"
+    messages = [
+        {"role": "system", "content": "you are a helpful assistant"},
+        {
+            "role": "user",
+            "content": (
+                "Give an example JSON for an employee profile using the specified tool."
+            ),
+        },
+    ]
+    tools = [
+        {
+            "type": "function",
+            "function": {
+                "name": "dummy_function_name",
+                "description": "This is a dummy function",
+                "parameters": sample_json_schema,
+            },
         }
-    }
+    ]
+    tool_choice = {"type": "function", "function": {"name": "dummy_function_name"}}
 
     # non-streaming
 
@@ -692,21 +653,20 @@ async def test_named_tool_use(
     jsonschema.validate(instance=json1, schema=sample_json_schema)
 
     messages.append({"role": "assistant", "content": json_string})
-    messages.append({
-        "role":
-        "user",
-        "content":
-        "Give me another one with a different name and age"
-    })
+    messages.append(
+        {"role": "user", "content": "Give me another one with a different name and age"}
+    )
 
     # streaming
 
-    stream = await client.chat.completions.create(model=MODEL_NAME,
-                                                  messages=messages,
-                                                  max_completion_tokens=1000,
-                                                  tools=tools,
-                                                  tool_choice=tool_choice,
-                                                  stream=True)
+    stream = await client.chat.completions.create(
+        model=MODEL_NAME,
+        messages=messages,
+        max_completion_tokens=1000,
+        tools=tools,
+        tool_choice=tool_choice,
+        stream=True,
+    )
 
     output = []
     finish_reason_count = 0
@@ -728,64 +688,66 @@ async def test_named_tool_use(
 
 
 @pytest.mark.asyncio
-async def test_inconsistent_tool_choice_and_tools(client: openai.AsyncOpenAI,
-                                                  sample_json_schema):
-    messages = [{
-        "role": "system",
-        "content": "you are a helpful assistant"
-    }, {
-        "role":
-        "user",
-        "content":
-        f"Give an example JSON for an employee profile that "
-        f"fits this schema: {sample_json_schema}"
-    }]
+async def test_inconsistent_tool_choice_and_tools(
+    client: openai.AsyncOpenAI, sample_json_schema
+):
+    messages = [
+        {"role": "system", "content": "you are a helpful assistant"},
+        {
+            "role": "user",
+            "content": f"Give an example JSON for an employee profile that "
+            f"fits this schema: {sample_json_schema}",
+        },
+    ]
 
     with pytest.raises(openai.BadRequestError):
-        await client.chat.completions.create(model=MODEL_NAME,
-                                             messages=messages,
-                                             max_completion_tokens=1000,
-                                             tool_choice={
-                                                 "type": "function",
-                                                 "function": {
-                                                     "name":
-                                                     "dummy_function_name"
-                                                 }
-                                             })
+        await client.chat.completions.create(
+            model=MODEL_NAME,
+            messages=messages,
+            max_completion_tokens=1000,
+            tool_choice={
+                "type": "function",
+                "function": {"name": "dummy_function_name"},
+            },
+        )
 
     with pytest.raises(openai.BadRequestError):
         await client.chat.completions.create(
             model=MODEL_NAME,
             messages=messages,
             max_completion_tokens=1000,
-            tools=[{
-                "type": "function",
-                "function": {
-                    "name": "dummy_function_name",
-                    "description": "This is a dummy function",
-                    "parameters": sample_json_schema
+            tools=[
+                {
+                    "type": "function",
+                    "function": {
+                        "name": "dummy_function_name",
+                        "description": "This is a dummy function",
+                        "parameters": sample_json_schema,
+                    },
                 }
-            }],
+            ],
             tool_choice={
                 "type": "function",
-                "function": {
-                    "name": "nondefined_function_name"
-                }
-            })
+                "function": {"name": "nondefined_function_name"},
+            },
+        )
     with pytest.raises(openai.BadRequestError):
         await client.chat.completions.create(
             model=MODEL_NAME,
             messages=messages,
             max_completion_tokens=1000,
-            tools=[{
-                "type": "function",
-                "function": {
-                    "name": "dummy_function_name",
-                    "description": "This is a dummy function",
-                    "parameters": sample_json_schema
+            tools=[
+                {
+                    "type": "function",
+                    "function": {
+                        "name": "dummy_function_name",
+                        "description": "This is a dummy function",
+                        "parameters": sample_json_schema,
+                    },
                 }
-            }],
-            tool_choice={})
+            ],
+            tool_choice={},
+        )
 
 
 @pytest.mark.asyncio
@@ -793,13 +755,17 @@ async def test_response_format_json_object(client: openai.AsyncOpenAI):
     for _ in range(2):
         resp = await client.chat.completions.create(
             model=MODEL_NAME,
-            messages=[{
-                "role":
-                "user",
-                "content": ('what is 1+1? please respond with a JSON object, '
-                            'the format is {"result": 2}')
-            }],
-            response_format={"type": "json_object"})
+            messages=[
+                {
+                    "role": "user",
+                    "content": (
+                        "what is 1+1? please respond with a JSON object, "
+                        'the format is {"result": 2}'
+                    ),
+                }
+            ],
+            response_format={"type": "json_object"},
+        )
 
         content = resp.choices[0].message.content
         assert content is not None
@@ -815,10 +781,7 @@ async def test_response_format_json_schema(client: openai.AsyncOpenAI):
     for _ in range(2):
         resp = await client.chat.completions.create(
             model=MODEL_NAME,
-            messages=[{
-                "role": "user",
-                "content": prompt
-            }],
+            messages=[{"role": "user", "content": prompt}],
         )
         content = resp.choices[0].message.content
         assert content is not None
@@ -829,10 +792,7 @@ async def test_response_format_json_schema(client: openai.AsyncOpenAI):
     for _ in range(2):
         resp = await client.chat.completions.create(
             model=MODEL_NAME,
-            messages=[{
-                "role": "user",
-                "content": prompt
-            }],
+            messages=[{"role": "user", "content": prompt}],
             response_format={
                 "type": "json_schema",
                 "json_schema": {
@@ -840,13 +800,12 @@ async def test_response_format_json_schema(client: openai.AsyncOpenAI):
                     "schema": {
                         "type": "object",
                         "properties": {
-                            "result": {
-                                "type": "integer"
-                            },
+                            "result": {"type": "integer"},
                         },
                     },
-                }
-            })
+                },
+            },
+        )
 
         content = resp.choices[0].message.content
         assert content is not None
@@ -859,13 +818,16 @@ async def test_response_format_json_schema(client: openai.AsyncOpenAI):
 async def test_extra_fields_allowed(client: openai.AsyncOpenAI):
     resp = await client.chat.completions.create(
         model=MODEL_NAME,
-        messages=[{
-            "role": "user",
-            "content": "what is 1+1?",
-            "extra_field": "0",
-        }],  # type: ignore
+        messages=[
+            {
+                "role": "user",
+                "content": "what is 1+1?",
+                "extra_field": "0",
+            }
+        ],  # type: ignore
         temperature=0,
-        seed=0)
+        seed=0,
+    )
 
     content = resp.choices[0].message.content
     assert content is not None
@@ -875,18 +837,20 @@ async def test_extra_fields_allowed(client: openai.AsyncOpenAI):
 async def test_complex_message_content(client: openai.AsyncOpenAI):
     resp = await client.chat.completions.create(
         model=MODEL_NAME,
-        messages=[{
-            "role":
-            "user",
-            "content": [{
-                "type":
-                "text",
-                "text":
-                "what is 1+1? please provide the result without any other text."
-            }]
-        }],
+        messages=[
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "text",
+                        "text": "what is 1+1? please provide the result without any other text.",
+                    }
+                ],
+            }
+        ],
         temperature=0,
-        seed=0)
+        seed=0,
+    )
     content = resp.choices[0].message.content
     assert content == "2"
 
@@ -898,24 +862,27 @@ async def test_custom_role(client: openai.AsyncOpenAI):
 
     resp1 = await client.chat.completions.create(
         model=MODEL_NAME,
-        messages=[{
-            "role": "my-custom-role",
-            "content": "what is 1+1?",
-        }],  # type: ignore
+        messages=[
+            {
+                "role": "my-custom-role",
+                "content": "what is 1+1?",
+            }
+        ],  # type: ignore
         temperature=0,
-        seed=0)
+        seed=0,
+    )
 
     resp2 = await client.chat.completions.create(
         model=MODEL_NAME,
-        messages=[{
-            "role": "my-custom-role",
-            "content": [{
-                "type": "text",
-                "text": "what is 1+1?"
-            }]
-        }],  # type: ignore
+        messages=[
+            {
+                "role": "my-custom-role",
+                "content": [{"type": "text", "text": "what is 1+1?"}],
+            }
+        ],  # type: ignore
         temperature=0,
-        seed=0)
+        seed=0,
+    )
 
     content1 = resp1.choices[0].message.content
     content2 = resp2.choices[0].message.content
@@ -924,34 +891,32 @@ async def test_custom_role(client: openai.AsyncOpenAI):
 
 @pytest.mark.asyncio
 async def test_long_seed(client: openai.AsyncOpenAI):
-    for seed in [
-            torch.iinfo(torch.long).min - 1,
-            torch.iinfo(torch.long).max + 1
-    ]:
+    for seed in [torch.iinfo(torch.long).min - 1, torch.iinfo(torch.long).max + 1]:
         with pytest.raises(BadRequestError) as exc_info:
             await client.chat.completions.create(
                 model=MODEL_NAME,
-                messages=[{
-                    "role": "system",
-                    "content": "You are a helpful assistant.",
-                }],
+                messages=[
+                    {
+                        "role": "system",
+                        "content": "You are a helpful assistant.",
+                    }
+                ],
                 temperature=0,
-                seed=seed)
+                seed=seed,
+            )
 
-        assert ("greater_than_equal" in exc_info.value.message
-                or "less_than_equal" in exc_info.value.message)
+        assert (
+            "greater_than_equal" in exc_info.value.message
+            or "less_than_equal" in exc_info.value.message
+        )
 
 
 @pytest.mark.asyncio
-async def test_invocations(server: RemoteOpenAIServer,
-                           client: openai.AsyncOpenAI):
-    messages = [{
-        "role": "system",
-        "content": "you are a helpful assistant"
-    }, {
-        "role": "user",
-        "content": "what is 1+1?"
-    }]
+async def test_invocations(server: RemoteOpenAIServer, client: openai.AsyncOpenAI):
+    messages = [
+        {"role": "system", "content": "you are a helpful assistant"},
+        {"role": "user", "content": "what is 1+1?"},
+    ]
 
     request_args = {
         "model": MODEL_NAME,
@@ -963,8 +928,9 @@ async def test_invocations(server: RemoteOpenAIServer,
 
     chat_completion = await client.chat.completions.create(**request_args)
 
-    invocation_response = requests.post(server.url_for("invocations"),
-                                        json=request_args)
+    invocation_response = requests.post(
+        server.url_for("invocations"), json=request_args
+    )
     invocation_response.raise_for_status()
 
     chat_output = chat_completion.model_dump()
diff --git a/tests/entrypoints/openai/test_chat_echo.py b/tests/entrypoints/openai/test_chat_echo.py
index ce965eb82924..a9c9c8e3dfe8 100644
--- a/tests/entrypoints/openai/test_chat_echo.py
+++ b/tests/entrypoints/openai/test_chat_echo.py
@@ -23,7 +23,7 @@ def server():
         "--max-model-len",
         "4080",
         "--max-logprobs",  # test prompt_logprobs equal to -1
-        "151936"
+        "151936",
     ]
 
     with RemoteOpenAIServer(MODEL_NAME, args) as remote_server:
@@ -46,27 +46,26 @@ class TestCase(NamedTuple):
     "test_case",
     [
         TestCase(model_name=MODEL_NAME, echo=True),
-        TestCase(model_name=MODEL_NAME, echo=False)
+        TestCase(model_name=MODEL_NAME, echo=False),
     ],
 )
 async def test_chat_session_with_echo_and_continue_final_message(
-        client: openai.AsyncOpenAI, test_case: TestCase):
+    client: openai.AsyncOpenAI, test_case: TestCase
+):
     saying: str = "Here is a common saying about apple. An apple a day, keeps"
     # test echo with continue_final_message parameter
     chat_completion = await client.chat.completions.create(
         model=test_case.model_name,
-        messages=[{
-            "role": "user",
-            "content": "tell me a common saying"
-        }, {
-            "role": "assistant",
-            "content": saying
-        }],
+        messages=[
+            {"role": "user", "content": "tell me a common saying"},
+            {"role": "assistant", "content": saying},
+        ],
         extra_body={
             "echo": test_case.echo,
             "continue_final_message": True,
-            "add_generation_prompt": False
-        })
+            "add_generation_prompt": False,
+        },
+    )
     assert chat_completion.id is not None
     assert len(chat_completion.choices) == 1
 
@@ -83,13 +82,10 @@ async def test_chat_session_with_echo_and_continue_final_message(
 
 @pytest.mark.asyncio
 async def test_prompt_logprobs(client: openai.AsyncOpenAI):
-    messages = [{
-        "role": "system",
-        "content": "You are a helpful assistant."
-    }, {
-        "role": "user",
-        "content": "Beijing is the capital of which country?"
-    }]
+    messages = [
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Beijing is the capital of which country?"},
+    ]
 
     completion = await client.chat.completions.create(
         model=MODEL_NAME,
@@ -103,13 +99,10 @@ async def test_prompt_logprobs(client: openai.AsyncOpenAI):
 
 @pytest.mark.asyncio
 async def test_top_logprobs(client: openai.AsyncOpenAI):
-    messages = [{
-        "role": "system",
-        "content": "You are a helpful assistant."
-    }, {
-        "role": "user",
-        "content": "Beijing is the capital of which country?"
-    }]
+    messages = [
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Beijing is the capital of which country?"},
+    ]
 
     completion = await client.chat.completions.create(
         model=MODEL_NAME,
diff --git a/tests/entrypoints/openai/test_chat_logit_bias_validation.py b/tests/entrypoints/openai/test_chat_logit_bias_validation.py
index 9fa7ab83555a..6539613ed17b 100644
--- a/tests/entrypoints/openai/test_chat_logit_bias_validation.py
+++ b/tests/entrypoints/openai/test_chat_logit_bias_validation.py
@@ -49,10 +49,7 @@ async def test_chat_logit_bias_valid(client):
 
     completion = await client.chat.completions.create(
         model=MODEL_NAME,
-        messages=[{
-            "role": "user",
-            "content": "Testing valid logit bias"
-        }],
+        messages=[{"role": "user", "content": "Testing valid logit bias"}],
         max_tokens=5,
         logit_bias={str(valid_token_id): 1.0},
     )
@@ -69,10 +66,7 @@ async def test_chat_logit_bias_invalid(client):
     with pytest.raises(openai.BadRequestError) as excinfo:
         await client.chat.completions.create(
             model=MODEL_NAME,
-            messages=[{
-                "role": "user",
-                "content": "Testing invalid logit bias"
-            }],
+            messages=[{"role": "user", "content": "Testing invalid logit bias"}],
             max_tokens=5,
             logit_bias={str(invalid_token_id): 1.0},
         )
diff --git a/tests/entrypoints/openai/test_chat_template.py b/tests/entrypoints/openai/test_chat_template.py
index ce90a67c0151..adaeb96fbfb5 100644
--- a/tests/entrypoints/openai/test_chat_template.py
+++ b/tests/entrypoints/openai/test_chat_template.py
@@ -4,8 +4,7 @@
 import pytest
 
 from vllm.config import ModelConfig
-from vllm.entrypoints.chat_utils import (apply_hf_chat_template,
-                                         load_chat_template)
+from vllm.entrypoints.chat_utils import apply_hf_chat_template, load_chat_template
 from vllm.entrypoints.openai.protocol import ChatCompletionRequest
 from vllm.transformers_utils.tokenizer import get_tokenizer
 
@@ -17,48 +16,54 @@
 
 # Define models, templates, and their corresponding expected outputs
 MODEL_TEMPLATE_GENERATION_OUTPUT = [
-    ("facebook/opt-125m", chatml_jinja_path, True, False, """<|im_start|>user
+    (
+        "facebook/opt-125m",
+        chatml_jinja_path,
+        True,
+        False,
+        """<|im_start|>user
 Hello<|im_end|>
 <|im_start|>assistant
 Hi there!<|im_end|>
 <|im_start|>user
 What is the capital of<|im_end|>
 <|im_start|>assistant
-"""),
-    ("facebook/opt-125m", chatml_jinja_path, False, False, """<|im_start|>user
+""",
+    ),
+    (
+        "facebook/opt-125m",
+        chatml_jinja_path,
+        False,
+        False,
+        """<|im_start|>user
 Hello<|im_end|>
 <|im_start|>assistant
 Hi there!<|im_end|>
 <|im_start|>user
-What is the capital of"""),
-    ("facebook/opt-125m", chatml_jinja_path, False, True, """<|im_start|>user
+What is the capital of""",
+    ),
+    (
+        "facebook/opt-125m",
+        chatml_jinja_path,
+        False,
+        True,
+        """<|im_start|>user
 Hello<|im_end|>
 <|im_start|>assistant
 Hi there!<|im_end|>
 <|im_start|>user
 What is the capital of<|im_end|>
 <|im_start|>assistant
-The capital of"""),
+The capital of""",
+    ),
 ]
 
 TEST_MESSAGES = [
-    {
-        'role': 'user',
-        'content': 'Hello'
-    },
-    {
-        'role': 'assistant',
-        'content': 'Hi there!'
-    },
-    {
-        'role': 'user',
-        'content': 'What is the capital of'
-    },
+    {"role": "user", "content": "Hello"},
+    {"role": "assistant", "content": "Hi there!"},
+    {"role": "user", "content": "What is the capital of"},
 ]
-ASSISTANT_MESSAGE_TO_CONTINUE = {
-    'role': 'assistant',
-    'content': 'The capital of'
-}
+ASSISTANT_MESSAGE_TO_CONTINUE = {"role": "assistant", "content": "The capital of"}
 
 
 def test_load_chat_template():
@@ -68,8 +73,11 @@ def test_load_chat_template():
     # Test assertions
     assert template_content is not None
     # Hard coded value for template_chatml.jinja
-    assert template_content == """{% for message in messages %}{{'<|im_start|>' + message['role'] + '\\n' + message['content']}}{% if (loop.last and add_generation_prompt) or not loop.last %}{{ '<|im_end|>' + '\\n'}}{% endif %}{% endfor %}
-{% if add_generation_prompt and messages[-1]['role'] != 'assistant' %}{{ '<|im_start|>assistant\\n' }}{% endif %}"""  # noqa: E501
+    assert (
+        template_content
+        == """{% for message in messages %}{{'<|im_start|>' + message['role'] + '\\n' + message['content']}}{% if (loop.last and add_generation_prompt) or not loop.last %}{{ '<|im_end|>' + '\\n'}}{% endif %}{% endfor %}
+{% if add_generation_prompt and messages[-1]['role'] != 'assistant' %}{{ '<|im_start|>assistant\\n' }}{% endif %}"""
+    )  # noqa: E501
 
 
 def test_no_load_chat_template_filelike():
@@ -91,9 +99,11 @@ def test_no_load_chat_template_literallike():
 
 @pytest.mark.parametrize(
     "model,template,add_generation_prompt,continue_final_message,expected_output",
-    MODEL_TEMPLATE_GENERATION_OUTPUT)
-def test_get_gen_prompt(model, template, add_generation_prompt,
-                        continue_final_message, expected_output):
+    MODEL_TEMPLATE_GENERATION_OUTPUT,
+)
+def test_get_gen_prompt(
+    model, template, add_generation_prompt, continue_final_message, expected_output
+):
     model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
     model_info.check_available_online(on_fail="skip")
 
@@ -106,7 +116,8 @@ def test_get_gen_prompt(model, template, add_generation_prompt,
         hf_overrides=model_info.hf_overrides,
         skip_tokenizer_init=model_info.skip_tokenizer_init,
         enforce_eager=model_info.enforce_eager,
-        dtype=model_info.dtype)
+        dtype=model_info.dtype,
+    )
 
     # Initialize the tokenizer
     tokenizer = get_tokenizer(
@@ -119,7 +130,8 @@ def test_get_gen_prompt(model, template, add_generation_prompt,
     mock_request = ChatCompletionRequest(
         model=model,
         messages=TEST_MESSAGES + [ASSISTANT_MESSAGE_TO_CONTINUE]
-        if continue_final_message else TEST_MESSAGES,
+        if continue_final_message
+        else TEST_MESSAGES,
         add_generation_prompt=add_generation_prompt,
         continue_final_message=continue_final_message,
     )
@@ -138,4 +150,5 @@ def test_get_gen_prompt(model, template, add_generation_prompt,
     # Test assertion
     assert result == expected_output, (
         f"The generated prompt does not match the expected output for "
-        f"model {model} and template {template}")
+        f"model {model} and template {template}"
+    )
diff --git a/tests/entrypoints/openai/test_chat_with_tool_reasoning.py b/tests/entrypoints/openai/test_chat_with_tool_reasoning.py
index 03730b67283c..4f23eee46211 100644
--- a/tests/entrypoints/openai/test_chat_with_tool_reasoning.py
+++ b/tests/entrypoints/openai/test_chat_with_tool_reasoning.py
@@ -14,9 +14,14 @@
 @pytest.fixture(scope="module")
 def server():  # noqa: F811
     args = [
-        "--max-model-len", "8192", "--enforce-eager", "--reasoning-parser",
-        "deepseek_r1", "--enable-auto-tool-choice", "--tool-call-parser",
-        "hermes"
+        "--max-model-len",
+        "8192",
+        "--enforce-eager",
+        "--reasoning-parser",
+        "deepseek_r1",
+        "--enable-auto-tool-choice",
+        "--tool-call-parser",
+        "hermes",
     ]
 
     with RemoteOpenAIServer(MODEL_NAME, args) as remote_server:
@@ -29,50 +34,44 @@ async def client(server):
         yield async_client
 
 
-TOOLS = [{
-    "type": "function",
-    "function": {
-        "name": "get_current_weather",
-        "description": "Get the current weather in a given location",
-        "parameters": {
-            "type": "object",
-            "properties": {
-                "city": {
-                    "type":
-                    "string",
-                    "description":
-                    "The city to find the weather for, e.g. 'San Francisco'"
+TOOLS = [
+    {
+        "type": "function",
+        "function": {
+            "name": "get_current_weather",
+            "description": "Get the current weather in a given location",
+            "parameters": {
+                "type": "object",
+                "properties": {
+                    "city": {
+                        "type": "string",
+                        "description": "The city to find the weather for, e.g. 'San Francisco'",
+                    },
+                    "state": {
+                        "type": "string",
+                        "description": "the two-letter abbreviation for the state that the city is"
+                        " in, e.g. 'CA' which would mean 'California'",
+                    },
+                    "unit": {
+                        "type": "string",
+                        "description": "The unit to fetch the temperature in",
+                        "enum": ["celsius", "fahrenheit"],
+                    },
                 },
-                "state": {
-                    "type":
-                    "string",
-                    "description":
-                    "the two-letter abbreviation for the state that the city is"
-                    " in, e.g. 'CA' which would mean 'California'"
-                },
-                "unit": {
-                    "type": "string",
-                    "description": "The unit to fetch the temperature in",
-                    "enum": ["celsius", "fahrenheit"]
-                }
+                "required": ["city", "state", "unit"],
             },
-            "required": ["city", "state", "unit"]
-        }
+        },
     }
-}]
-
-MESSAGES = [{
-    "role": "user",
-    "content": "Hi! How are you doing today?"
-}, {
-    "role": "assistant",
-    "content": "I'm doing well! How can I help you?"
-}, {
-    "role":
-    "user",
-    "content":
-    "Can you tell me what the temperate will be in Dallas, in fahrenheit?"
-}]
+]
+
+MESSAGES = [
+    {"role": "user", "content": "Hi! How are you doing today?"},
+    {"role": "assistant", "content": "I'm doing well! How can I help you?"},
+    {
+        "role": "user",
+        "content": "Can you tell me what the temperate will be in Dallas, in fahrenheit?",
+    },
+]
 
 FUNC_NAME = "get_current_weather"
 FUNC_ARGS = """{"city": "Dallas", "state": "TX", "unit": "fahrenheit"}"""
@@ -105,9 +104,7 @@ def extract_reasoning_and_calls(chunks: list):
 
 # test streaming
 @pytest.mark.asyncio
-async def test_chat_streaming_of_tool_and_reasoning(
-        client: openai.AsyncOpenAI):
-
+async def test_chat_streaming_of_tool_and_reasoning(client: openai.AsyncOpenAI):
     stream = await client.chat.completions.create(
         model=MODEL_NAME,
         messages=MESSAGES,
@@ -120,8 +117,7 @@ async def test_chat_streaming_of_tool_and_reasoning(
     async for chunk in stream:
         chunks.append(chunk)
 
-    reasoning_content, arguments, function_names = extract_reasoning_and_calls(
-        chunks)
+    reasoning_content, arguments, function_names = extract_reasoning_and_calls(chunks)
     assert len(reasoning_content) > 0
     assert len(function_names) > 0 and function_names[0] == FUNC_NAME
     assert len(arguments) > 0 and arguments[0] == FUNC_ARGS
@@ -130,7 +126,6 @@ async def test_chat_streaming_of_tool_and_reasoning(
 # test full generate
 @pytest.mark.asyncio
 async def test_chat_full_of_tool_and_reasoning(client: openai.AsyncOpenAI):
-
     tool_calls = await client.chat.completions.create(
         model=MODEL_NAME,
         messages=MESSAGES,
@@ -140,7 +135,5 @@ async def test_chat_full_of_tool_and_reasoning(client: openai.AsyncOpenAI):
     )
 
     assert len(tool_calls.choices[0].message.reasoning_content) > 0
-    assert tool_calls.choices[0].message.tool_calls[0].function.name \
-          == FUNC_NAME
-    assert tool_calls.choices[0].message.tool_calls[0].function.arguments \
-          == FUNC_ARGS
+    assert tool_calls.choices[0].message.tool_calls[0].function.name == FUNC_NAME
+    assert tool_calls.choices[0].message.tool_calls[0].function.arguments == FUNC_ARGS
diff --git a/tests/entrypoints/openai/test_chunked_prompt.py b/tests/entrypoints/openai/test_chunked_prompt.py
index c8160c5f2d0e..608e509e59e8 100644
--- a/tests/entrypoints/openai/test_chunked_prompt.py
+++ b/tests/entrypoints/openai/test_chunked_prompt.py
@@ -40,7 +40,8 @@ async def client(server):
 
 @pytest.mark.asyncio
 async def test_completion_stream_options_and_logprobs_with_long_prompts(
-        client: openai.AsyncOpenAI):
+    client: openai.AsyncOpenAI,
+):
     # Test stream with long prompt
     prompt = "What is the capital of France?" * 400
 
@@ -62,8 +63,9 @@ async def test_completion_stream_options_and_logprobs_with_long_prompts(
     async for chunk in stream:
         assert chunk.usage.prompt_tokens >= 0
         assert chunk.usage.completion_tokens >= 0
-        assert chunk.usage.total_tokens == (chunk.usage.prompt_tokens +
-                                            chunk.usage.completion_tokens)
+        assert chunk.usage.total_tokens == (
+            chunk.usage.prompt_tokens + chunk.usage.completion_tokens
+        )
         if not finished:
             tokens_received += 1
             assert chunk.choices[0].text
@@ -77,15 +79,13 @@ async def test_completion_stream_options_and_logprobs_with_long_prompts(
 
 @pytest.mark.asyncio
 async def test_chat_completion_stream_options_and_logprobs_with_long_prompts(
-        client: openai.AsyncOpenAI):
+    client: openai.AsyncOpenAI,
+):
     # Test stream with long prompt
-    messages = [{
-        "role": "system",
-        "content": "You are a helpful assistant."
-    }, {
-        "role": "user",
-        "content": "What is the capital of France?" * 400
-    }]
+    messages = [
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "What is the capital of France?" * 400},
+    ]
     stream = await client.chat.completions.create(
         model=MODEL_NAME,
         messages=messages,
@@ -106,8 +106,9 @@ async def test_chat_completion_stream_options_and_logprobs_with_long_prompts(
     async for chunk in stream:
         assert chunk.usage.prompt_tokens >= 0
         assert chunk.usage.completion_tokens >= 0
-        assert chunk.usage.total_tokens == (chunk.usage.prompt_tokens +
-                                            chunk.usage.completion_tokens)
+        assert chunk.usage.total_tokens == (
+            chunk.usage.prompt_tokens + chunk.usage.completion_tokens
+        )
 
         if not finished:
             if chunk.choices[0].delta.content == "":
diff --git a/tests/entrypoints/openai/test_cli_args.py b/tests/entrypoints/openai/test_cli_args.py
index 9a1c0ea13b54..0b9d171aa481 100644
--- a/tests/entrypoints/openai/test_cli_args.py
+++ b/tests/entrypoints/openai/test_cli_args.py
@@ -5,8 +5,7 @@
 
 import pytest
 
-from vllm.entrypoints.openai.cli_args import (make_arg_parser,
-                                              validate_parsed_serve_args)
+from vllm.entrypoints.openai.cli_args import make_arg_parser, validate_parsed_serve_args
 from vllm.entrypoints.openai.serving_models import LoRAModulePath
 from vllm.utils import FlexibleArgumentParser
 
@@ -15,7 +14,7 @@
 LORA_MODULE = {
     "name": "module2",
     "path": "/path/to/module2",
-    "base_model_name": "llama"
+    "base_model_name": "llama",
 }
 CHATML_JINJA_PATH = VLLM_PATH / "examples/template_chatml.jinja"
 assert CHATML_JINJA_PATH.exists()
@@ -31,45 +30,51 @@ def serve_parser():
 def test_config_arg_parsing(serve_parser, cli_config_file):
     args = serve_parser.parse_args([])
     assert args.port == 8000
-    args = serve_parser.parse_args(['--config', cli_config_file])
+    args = serve_parser.parse_args(["--config", cli_config_file])
     assert args.port == 12312
-    args = serve_parser.parse_args([
-        '--config',
-        cli_config_file,
-        '--port',
-        '9000',
-    ])
+    args = serve_parser.parse_args(
+        [
+            "--config",
+            cli_config_file,
+            "--port",
+            "9000",
+        ]
+    )
     assert args.port == 9000
-    args = serve_parser.parse_args([
-        '--port',
-        '9000',
-        '--config',
-        cli_config_file,
-    ])
+    args = serve_parser.parse_args(
+        [
+            "--port",
+            "9000",
+            "--config",
+            cli_config_file,
+        ]
+    )
     assert args.port == 9000
 
 
 ### Tests for LoRA module parsing
 def test_valid_key_value_format(serve_parser):
     # Test old format: name=path
-    args = serve_parser.parse_args([
-        '--lora-modules',
-        'module1=/path/to/module1',
-    ])
-    expected = [LoRAModulePath(name='module1', path='/path/to/module1')]
+    args = serve_parser.parse_args(
+        [
+            "--lora-modules",
+            "module1=/path/to/module1",
+        ]
+    )
+    expected = [LoRAModulePath(name="module1", path="/path/to/module1")]
     assert args.lora_modules == expected
 
 
 def test_valid_json_format(serve_parser):
     # Test valid JSON format input
-    args = serve_parser.parse_args([
-        '--lora-modules',
-        json.dumps(LORA_MODULE),
-    ])
+    args = serve_parser.parse_args(
+        [
+            "--lora-modules",
+            json.dumps(LORA_MODULE),
+        ]
+    )
     expected = [
-        LoRAModulePath(name='module2',
-                       path='/path/to/module2',
-                       base_model_name='llama')
+        LoRAModulePath(name="module2", path="/path/to/module2", base_model_name="llama")
     ]
     assert args.lora_modules == expected
 
@@ -77,47 +82,53 @@ def test_valid_json_format(serve_parser):
 def test_invalid_json_format(serve_parser):
     # Test invalid JSON format input, missing closing brace
     with pytest.raises(SystemExit):
-        serve_parser.parse_args([
-            '--lora-modules', '{"name": "module3", "path": "/path/to/module3"'
-        ])
+        serve_parser.parse_args(
+            ["--lora-modules", '{"name": "module3", "path": "/path/to/module3"']
+        )
 
 
 def test_invalid_type_error(serve_parser):
     # Test type error when values are not JSON or key=value
     with pytest.raises(SystemExit):
-        serve_parser.parse_args([
-            '--lora-modules',
-            'invalid_format'  # This is not JSON or key=value format
-        ])
+        serve_parser.parse_args(
+            [
+                "--lora-modules",
+                "invalid_format",  # This is not JSON or key=value format
+            ]
+        )
 
 
 def test_invalid_json_field(serve_parser):
     # Test valid JSON format but missing required fields
     with pytest.raises(SystemExit):
-        serve_parser.parse_args([
-            '--lora-modules',
-            '{"name": "module4"}'  # Missing required 'path' field
-        ])
+        serve_parser.parse_args(
+            [
+                "--lora-modules",
+                '{"name": "module4"}',  # Missing required 'path' field
+            ]
+        )
 
 
 def test_empty_values(serve_parser):
     # Test when no LoRA modules are provided
-    args = serve_parser.parse_args(['--lora-modules', ''])
+    args = serve_parser.parse_args(["--lora-modules", ""])
     assert args.lora_modules == []
 
 
 def test_multiple_valid_inputs(serve_parser):
     # Test multiple valid inputs (both old and JSON format)
-    args = serve_parser.parse_args([
-        '--lora-modules',
-        'module1=/path/to/module1',
-        json.dumps(LORA_MODULE),
-    ])
+    args = serve_parser.parse_args(
+        [
+            "--lora-modules",
+            "module1=/path/to/module1",
+            json.dumps(LORA_MODULE),
+        ]
+    )
     expected = [
-        LoRAModulePath(name='module1', path='/path/to/module1'),
-        LoRAModulePath(name='module2',
-                       path='/path/to/module2',
-                       base_model_name='llama')
+        LoRAModulePath(name="module1", path="/path/to/module1"),
+        LoRAModulePath(
+            name="module2", path="/path/to/module2", base_model_name="llama"
+        ),
     ]
     assert args.lora_modules == expected
 
@@ -133,40 +144,46 @@ def test_enable_auto_choice_passes_without_tool_call_parser(serve_parser):
 
 def test_enable_auto_choice_passes_with_tool_call_parser(serve_parser):
     """Ensure validation passes with tool choice enabled with a call parser"""
-    args = serve_parser.parse_args(args=[
-        "--enable-auto-tool-choice",
-        "--tool-call-parser",
-        "mistral",
-    ])
+    args = serve_parser.parse_args(
+        args=[
+            "--enable-auto-tool-choice",
+            "--tool-call-parser",
+            "mistral",
+        ]
+    )
     validate_parsed_serve_args(args)
 
 
 def test_enable_auto_choice_fails_with_enable_reasoning(serve_parser):
     """Ensure validation fails if reasoning is enabled with auto tool choice"""
-    args = serve_parser.parse_args(args=[
-        "--enable-auto-tool-choice",
-        "--reasoning-parser",
-        "deepseek_r1",
-    ])
+    args = serve_parser.parse_args(
+        args=[
+            "--enable-auto-tool-choice",
+            "--reasoning-parser",
+            "deepseek_r1",
+        ]
+    )
     with pytest.raises(TypeError):
         validate_parsed_serve_args(args)
 
 
 def test_passes_with_reasoning_parser(serve_parser):
-    """Ensure validation passes if reasoning is enabled 
+    """Ensure validation passes if reasoning is enabled
     with a reasoning parser"""
-    args = serve_parser.parse_args(args=[
-        "--reasoning-parser",
-        "deepseek_r1",
-    ])
+    args = serve_parser.parse_args(
+        args=[
+            "--reasoning-parser",
+            "deepseek_r1",
+        ]
+    )
     validate_parsed_serve_args(args)
 
 
 def test_chat_template_validation_for_happy_paths(serve_parser):
     """Ensure validation passes if the chat template exists"""
     args = serve_parser.parse_args(
-        args=["--chat-template",
-              CHATML_JINJA_PATH.absolute().as_posix()])
+        args=["--chat-template", CHATML_JINJA_PATH.absolute().as_posix()]
+    )
     validate_parsed_serve_args(args)
 
 
@@ -179,8 +196,14 @@ def test_chat_template_validation_for_sad_paths(serve_parser):
 
 @pytest.mark.parametrize(
     "cli_args, expected_middleware",
-    [(["--middleware", "middleware1", "--middleware", "middleware2"
-       ], ["middleware1", "middleware2"]), ([], [])])
+    [
+        (
+            ["--middleware", "middleware1", "--middleware", "middleware2"],
+            ["middleware1", "middleware2"],
+        ),
+        ([], []),
+    ],
+)
 def test_middleware(serve_parser, cli_args, expected_middleware):
     """Ensure multiple middleware args are parsed properly"""
     args = serve_parser.parse_args(args=cli_args)
diff --git a/tests/entrypoints/openai/test_collective_rpc.py b/tests/entrypoints/openai/test_collective_rpc.py
index 37c0b7a900ac..cbd6b02f05dc 100644
--- a/tests/entrypoints/openai/test_collective_rpc.py
+++ b/tests/entrypoints/openai/test_collective_rpc.py
@@ -12,7 +12,6 @@
 
 
 class TestWorkerExtension:
-
     def get_model_name(self) -> str:
         """Test non-pydantic return type."""
         return MODEL_NAME
@@ -41,20 +40,18 @@ def server():
         "tests.entrypoints.openai.test_collective_rpc.TestWorkerExtension",
     ]
     with RemoteOpenAIServer(
-            MODEL_NAME,
-            args,
-            env_dict={
-                "VLLM_SERVER_DEV_MODE": "1",
-                "CUDA_VISIBLE_DEVICES": "0"
-            },
+        MODEL_NAME,
+        args,
+        env_dict={"VLLM_SERVER_DEV_MODE": "1", "CUDA_VISIBLE_DEVICES": "0"},
     ) as remote_server:
         yield remote_server
 
 
 def test_get_model_name(server):
     """Test basic response"""
-    response = requests.post(server.url_for("collective_rpc"),
-                             json={"method": "get_model_name"})
+    response = requests.post(
+        server.url_for("collective_rpc"), json={"method": "get_model_name"}
+    )
     assert response.status_code == 200
     results = response.json()
     assert "results" in results
@@ -63,8 +60,9 @@ def test_get_model_name(server):
 
 def test_return_none(server):
     """Test return none"""
-    response = requests.post(server.url_for("collective_rpc"),
-                             json={"method": "return_none"})
+    response = requests.post(
+        server.url_for("collective_rpc"), json={"method": "return_none"}
+    )
     assert response.status_code == 200
     results = response.json()
     assert results["results"] == [None]
@@ -74,12 +72,10 @@ def test_echo_args_kwargs(server):
     """Test args, kwargs, and dict response"""
     args = ["arg1", "arg2"]
     kwargs = {"key1": "value1", "key2": "value2"}
-    response = requests.post(server.url_for("collective_rpc"),
-                             json={
-                                 "method": "echo_args_kwargs",
-                                 "args": args,
-                                 "kwargs": kwargs
-                             })
+    response = requests.post(
+        server.url_for("collective_rpc"),
+        json={"method": "echo_args_kwargs", "args": args, "kwargs": kwargs},
+    )
     assert response.status_code == 200
     results = response.json()
     result = results["results"][0]
diff --git a/tests/entrypoints/openai/test_completion_with_function_calling.py b/tests/entrypoints/openai/test_completion_with_function_calling.py
index 4355603fcd70..599d65187e81 100644
--- a/tests/entrypoints/openai/test_completion_with_function_calling.py
+++ b/tests/entrypoints/openai/test_completion_with_function_calling.py
@@ -25,15 +25,12 @@
                 "properties": {
                     "city": {
                         "type": "string",
-                        "description":
-                        "The city to find the weather for, e.g. 'Vienna'",
+                        "description": "The city to find the weather for, e.g. 'Vienna'",
                         "default": "Vienna",
                     },
                     "country": {
-                        "type":
-                        "string",
-                        "description":
-                        "The country that the city is in, e.g. 'Austria'",
+                        "type": "string",
+                        "description": "The country that the city is in, e.g. 'Austria'",
                     },
                     "unit": {
                         "type": "string",
@@ -62,8 +59,7 @@
                             "include_forecast": {
                                 "type": "boolean",
                                 "default": False,
-                                "description":
-                                "Whether to include a 24-hour forecast",
+                                "description": "Whether to include a 24-hour forecast",
                                 "title": "Include Forecast",
                             },
                             "language": {
@@ -89,21 +85,16 @@
                 "properties": {
                     "city": {
                         "type": "string",
-                        "description":
-                        "The city to get the forecast for, e.g. 'Vienna'",
+                        "description": "The city to get the forecast for, e.g. 'Vienna'",
                         "default": "Vienna",
                     },
                     "country": {
-                        "type":
-                        "string",
-                        "description":
-                        "The country that the city is in, e.g. 'Austria'",
+                        "type": "string",
+                        "description": "The country that the city is in, e.g. 'Austria'",
                     },
                     "days": {
-                        "type":
-                        "integer",
-                        "description":
-                        "Number of days to get the forecast for (1-7)",
+                        "type": "integer",
+                        "description": "Number of days to get the forecast for (1-7)",
                     },
                     "unit": {
                         "type": "string",
@@ -118,19 +109,11 @@
 ]
 
 messages = [
+    {"role": "user", "content": "Hi! How are you doing today?"},
+    {"role": "assistant", "content": "I'm doing well! How can I help you?"},
     {
         "role": "user",
-        "content": "Hi! How are you doing today?"
-    },
-    {
-        "role": "assistant",
-        "content": "I'm doing well! How can I help you?"
-    },
-    {
-        "role":
-        "user",
-        "content":
-        "Can you tell me what the current weather is in Berlin and the "\
+        "content": "Can you tell me what the current weather is in Berlin and the "
         "forecast for the next 5 days, in fahrenheit?",
     },
 ]
@@ -150,7 +133,7 @@ def server():  # noqa: F811
         "--reasoning-parser",
         "qwen3",
         "--gpu-memory-utilization",
-        "0.4"
+        "0.4",
     ]
 
     with RemoteOpenAIServer(MODEL_NAME, args) as remote_server:
@@ -166,18 +149,22 @@ async def client(server):
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("stream", [True, False])
-@pytest.mark.parametrize("tool_choice", [
-    "auto", "required", {
-        "type": "function",
-        "function": {
-            "name": "get_current_weather"
-        }
-    }
-])
+@pytest.mark.parametrize(
+    "tool_choice",
+    [
+        "auto",
+        "required",
+        {"type": "function", "function": {"name": "get_current_weather"}},
+    ],
+)
 @pytest.mark.parametrize("enable_thinking", [True, False])
-async def test_function_tool_use(client: openai.AsyncOpenAI, model_name: str,
-                                 stream: bool, tool_choice: Union[str, dict],
-                                 enable_thinking: bool):
+async def test_function_tool_use(
+    client: openai.AsyncOpenAI,
+    model_name: str,
+    stream: bool,
+    tool_choice: Union[str, dict],
+    enable_thinking: bool,
+):
     if not stream:
         # Non-streaming test
         chat_completion = await client.chat.completions.create(
@@ -185,16 +172,11 @@ async def test_function_tool_use(client: openai.AsyncOpenAI, model_name: str,
             model=model_name,
             tools=tools,
             tool_choice=tool_choice,
-            extra_body={
-                "chat_template_kwargs": {
-                    "enable_thinking": enable_thinking
-                }
-            })
+            extra_body={"chat_template_kwargs": {"enable_thinking": enable_thinking}},
+        )
         if enable_thinking:
-            assert chat_completion.choices[0].message.\
-                reasoning_content is not None
-            assert chat_completion.choices[0].message.\
-                reasoning_content != ""
+            assert chat_completion.choices[0].message.reasoning_content is not None
+            assert chat_completion.choices[0].message.reasoning_content != ""
         assert chat_completion.choices[0].message.tool_calls is not None
         assert len(chat_completion.choices[0].message.tool_calls) > 0
     else:
@@ -205,11 +187,8 @@ async def test_function_tool_use(client: openai.AsyncOpenAI, model_name: str,
             tools=tools,
             tool_choice=tool_choice,
             stream=True,
-            extra_body={
-                "chat_template_kwargs": {
-                    "enable_thinking": enable_thinking
-                }
-            })
+            extra_body={"chat_template_kwargs": {"enable_thinking": enable_thinking}},
+        )
 
         output = []
         async for chunk in output_stream:
@@ -237,12 +216,11 @@ def k2_server():  # noqa: F811
     ]
     # hack to test kimi_k2 tool use tool_id format.
     # avoid error in is_deepseek_mla check by setting kv_lora_rank=null
-    with RemoteOpenAIServer(MODEL_NAME,
-                            args,
-                            override_hf_configs={
-                                "model_type": 'kimi_k2',
-                                'kv_lora_rank': None
-                            }) as remote_server:
+    with RemoteOpenAIServer(
+        MODEL_NAME,
+        args,
+        override_hf_configs={"model_type": "kimi_k2", "kv_lora_rank": None},
+    ) as remote_server:
         yield remote_server
 
 
@@ -256,20 +234,20 @@ async def k2_client(k2_server):
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("stream", [True, False])
 @pytest.mark.parametrize("tool_choice", ["required"])
-async def test_tool_id_kimi_k2(k2_client: openai.AsyncOpenAI, model_name: str,
-                               stream: bool, tool_choice: str):
-
+async def test_tool_id_kimi_k2(
+    k2_client: openai.AsyncOpenAI, model_name: str, stream: bool, tool_choice: str
+):
     if not stream:
         # Non-streaming test
         chat_completion = await k2_client.chat.completions.create(
-            messages=messages,
-            model=model_name,
-            tools=tools,
-            tool_choice=tool_choice)
+            messages=messages, model=model_name, tools=tools, tool_choice=tool_choice
+        )
         assert chat_completion.choices[0].message.tool_calls is not None
         assert len(chat_completion.choices[0].message.tool_calls) > 0
-        assert chat_completion.choices[0].message.tool_calls[
-            0].id == 'functions.get_current_weather:0'
+        assert (
+            chat_completion.choices[0].message.tool_calls[0].id
+            == "functions.get_current_weather:0"
+        )
     else:
         # Streaming test
         output_stream = await k2_client.chat.completions.create(
@@ -277,42 +255,45 @@ async def test_tool_id_kimi_k2(k2_client: openai.AsyncOpenAI, model_name: str,
             model=model_name,
             tools=tools,
             tool_choice=tool_choice,
-            stream=True)
+            stream=True,
+        )
 
         output = []
         async for chunk in output_stream:
             if chunk.choices and chunk.choices[0].delta.tool_calls:
                 output.extend(chunk.choices[0].delta.tool_calls)
         for o in output:
-            assert o.id is None or o.id == 'functions.get_current_weather:0'
+            assert o.id is None or o.id == "functions.get_current_weather:0"
 
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
-@pytest.mark.parametrize("arguments", ["{}", ''])
-async def test_no_args_tool_call(client: openai.AsyncOpenAI, model_name: str,
-                                 arguments: str):
+@pytest.mark.parametrize("arguments", ["{}", ""])
+async def test_no_args_tool_call(
+    client: openai.AsyncOpenAI, model_name: str, arguments: str
+):
     # Step 1: Define a tool that requires no parameters
-    tools = [{
-        "type": "function",
-        "function": {
-            "name": "get_current_time",
-            "description":
-            "Get the current date and time. No parameters needed.",
-            "parameters": {
-                "type": "object",
-                "properties": {},  # No parameters
-                "required": []  # No required fields
-            }
+    tools = [
+        {
+            "type": "function",
+            "function": {
+                "name": "get_current_time",
+                "description": "Get the current date and time. No parameters needed.",
+                "parameters": {
+                    "type": "object",
+                    "properties": {},  # No parameters
+                    "required": [],  # No required fields
+                },
+            },
         }
-    }]
+    ]
     messages = [{"role": "user", "content": "What time is it now?"}]
     # Step 2: Send user message and let model decide whether to call the tool
     response = await client.chat.completions.create(
         model=model_name,
         messages=messages,
         tools=tools,
-        tool_choice="auto"  # Let model choose automatically
+        tool_choice="auto",  # Let model choose automatically
     )
 
     # Step 3: Check if model wants to call a tool
@@ -328,11 +309,13 @@ async def test_no_args_tool_call(client: openai.AsyncOpenAI, model_name: str,
             messages.append(message)
             current_time = datetime.datetime.now()
             result = current_time.isoformat()
-            messages.append({
-                "role": "tool",
-                "tool_call_id": tool_call.id,
-                "content": result,
-            })
+            messages.append(
+                {
+                    "role": "tool",
+                    "tool_call_id": tool_call.id,
+                    "content": result,
+                }
+            )
             # Step 5: Send tool result back to model to continue conversation
             final_response = await client.chat.completions.create(
                 model=model_name,
diff --git a/tests/entrypoints/openai/test_completion_with_prompt_embeds.py b/tests/entrypoints/openai/test_completion_with_prompt_embeds.py
index cad914282306..3ed98ffe0e39 100644
--- a/tests/entrypoints/openai/test_completion_with_prompt_embeds.py
+++ b/tests/entrypoints/openai/test_completion_with_prompt_embeds.py
@@ -9,6 +9,7 @@
 import pytest
 import pytest_asyncio
 import torch
+
 # downloading lora to test lora requests
 from openai import BadRequestError
 from transformers import AutoConfig
@@ -23,8 +24,9 @@
 
 
 @pytest.fixture(scope="module", params=["use-lora"])
-def default_server_args(request: pytest.FixtureRequest,
-                        opt125_lora_files: str) -> list[str]:
+def default_server_args(
+    request: pytest.FixtureRequest, opt125_lora_files: str
+) -> list[str]:
     args = [
         # use half precision for speed and memory savings in CI environment
         "--dtype",
@@ -42,18 +44,20 @@ def default_server_args(request: pytest.FixtureRequest,
         lora_module_1 = {
             "name": LORA_SERVING_MODEL_NAME,
             "path": opt125_lora_files,
-            "base_model_name": MODEL_NAME
+            "base_model_name": MODEL_NAME,
         }
 
-        args.extend([
-            "--enable-lora",
-            "--lora-module",
-            json.dumps(lora_module_1),
-            "--max-lora-rank",
-            "64",
-            "--max-cpu-loras",
-            "2",
-        ])
+        args.extend(
+            [
+                "--enable-lora",
+                "--lora-module",
+                json.dumps(lora_module_1),
+                "--max-lora-rank",
+                "64",
+                "--max-cpu-loras",
+                "2",
+            ]
+        )
 
     return args
 
@@ -67,7 +71,7 @@ def default_server_args(request: pytest.FixtureRequest,
 def _encode_embeds(embeds: torch.Tensor):
     buffer = io.BytesIO()
     torch.save(embeds, buffer)
-    return base64.b64encode(buffer.getvalue()).decode('utf-8')
+    return base64.b64encode(buffer.getvalue()).decode("utf-8")
 
 
 @pytest.fixture(scope="module")
@@ -79,8 +83,7 @@ def example_prompt_embeds(hf_runner):
     return [_encode_embeds(item) for item in example_embeddings]
 
 
-@pytest.fixture(scope="module",
-                params=["", "--disable-frontend-multiprocessing"])
+@pytest.fixture(scope="module", params=["", "--disable-frontend-multiprocessing"])
 def server_with_prompt_embeds(default_server_args, request):
     if request.param:
         default_server_args.append(request.param)
@@ -110,7 +113,8 @@ async def test_completions_with_prompt_embeds(
         prompt="",  # Add empty prompt as required parameter
         max_tokens=5,
         temperature=0.0,
-        extra_body={"prompt_embeds": encoded_embeds})
+        extra_body={"prompt_embeds": encoded_embeds},
+    )
     assert len(completion.choices[0].text) >= 1
     assert completion.choices[0].prompt_logprobs is None
 
@@ -120,7 +124,8 @@ async def test_completions_with_prompt_embeds(
         prompt="",  # Add empty prompt as required parameter
         max_tokens=5,
         temperature=0.0,
-        extra_body={"prompt_embeds": [encoded_embeds, encoded_embeds2]})
+        extra_body={"prompt_embeds": [encoded_embeds, encoded_embeds2]},
+    )
     assert len(completion.choices) == 2
     assert len(completion.choices[0].text) >= 1
     assert len(completion.choices[1].text) >= 1
@@ -131,7 +136,8 @@ async def test_completions_with_prompt_embeds(
         prompt="",  # Add empty prompt as required parameter
         max_tokens=5,
         temperature=0.0,
-        extra_body={"prompt_embeds": encoded_embeds})
+        extra_body={"prompt_embeds": encoded_embeds},
+    )
     single_output = single_completion.choices[0].text
 
     stream = await client_with_prompt_embeds.completions.create(
@@ -140,7 +146,8 @@ async def test_completions_with_prompt_embeds(
         max_tokens=5,
         temperature=0.0,
         stream=True,
-        extra_body={"prompt_embeds": encoded_embeds})
+        extra_body={"prompt_embeds": encoded_embeds},
+    )
     chunks = []
     finish_reason_count = 0
     async for chunk in stream:
@@ -159,12 +166,12 @@ async def test_completions_with_prompt_embeds(
         max_tokens=5,
         temperature=0.0,
         stream=True,
-        extra_body={"prompt_embeds": [encoded_embeds, encoded_embeds2]})
+        extra_body={"prompt_embeds": [encoded_embeds, encoded_embeds2]},
+    )
     chunks_stream_embeds: list[list[str]] = [[], []]
     finish_reason_count = 0
     async for chunk in stream:
-        chunks_stream_embeds[chunk.choices[0].index].append(
-            chunk.choices[0].text)
+        chunks_stream_embeds[chunk.choices[0].index].append(chunk.choices[0].text)
         if chunk.choices[0].finish_reason is not None:
             finish_reason_count += 1
     assert finish_reason_count == 2
@@ -179,7 +186,8 @@ async def test_completions_with_prompt_embeds(
         prompt="This is a prompt",
         max_tokens=5,
         temperature=0.0,
-        extra_body={"prompt_embeds": encoded_embeds})
+        extra_body={"prompt_embeds": encoded_embeds},
+    )
     assert len(completion.choices) == 2
     completion_text_only = await client_with_prompt_embeds.completions.create(
         model=model_name,
@@ -192,18 +200,18 @@ async def test_completions_with_prompt_embeds(
         prompt="",
         max_tokens=5,
         temperature=0.0,
-        extra_body={"prompt_embeds": encoded_embeds})
+        extra_body={"prompt_embeds": encoded_embeds},
+    )
     # Embeddings responses should be handled first
-    assert completion_mixed.choices[0].text == completion_embeds_only.choices[
-        0].text
-    assert completion_mixed.choices[1].text == completion_text_only.choices[
-        0].text
+    assert completion_mixed.choices[0].text == completion_embeds_only.choices[0].text
+    assert completion_mixed.choices[1].text == completion_text_only.choices[0].text
 
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME, LORA_SERVING_MODEL_NAME])
 async def test_completions_errors_with_prompt_embeds(
-        client_with_prompt_embeds: openai.AsyncOpenAI, model_name: str):
+    client_with_prompt_embeds: openai.AsyncOpenAI, model_name: str
+):
     # Test error case: invalid prompt_embeds
     with pytest.raises(BadRequestError):
         await client_with_prompt_embeds.completions.create(
@@ -211,7 +219,8 @@ async def test_completions_errors_with_prompt_embeds(
             model=model_name,
             max_tokens=5,
             temperature=0.0,
-            extra_body={"prompt_embeds": "invalid_base64"})
+            extra_body={"prompt_embeds": "invalid_base64"},
+        )
 
 
 @pytest.mark.asyncio
@@ -233,7 +242,8 @@ async def test_completions_with_logprobs_and_prompt_embeds(
         temperature=0.0,
         echo=False,
         logprobs=logprobs_arg,
-        extra_body={"prompt_embeds": encoded_embeds})
+        extra_body={"prompt_embeds": encoded_embeds},
+    )
 
     logprobs = completion.choices[0].logprobs
     assert logprobs is not None
@@ -252,7 +262,8 @@ async def test_completions_with_logprobs_and_prompt_embeds(
         temperature=0.0,
         echo=False,
         logprobs=logprobs_arg,
-        extra_body={"prompt_embeds": [encoded_embeds, encoded_embeds2]})
+        extra_body={"prompt_embeds": [encoded_embeds, encoded_embeds2]},
+    )
 
     assert len(completion.choices) == 2
     for choice in completion.choices:
@@ -262,8 +273,7 @@ async def test_completions_with_logprobs_and_prompt_embeds(
         assert len(logprobs.token_logprobs) == 5
         assert len(logprobs.top_logprobs) == 5
         for top_logprobs in logprobs.top_logprobs[1:]:
-            assert max(logprobs_arg,
-                       1) <= len(top_logprobs) <= logprobs_arg + 1
+            assert max(logprobs_arg, 1) <= len(top_logprobs) <= logprobs_arg + 1
         assert len(logprobs.tokens) == 5
 
 
@@ -280,8 +290,5 @@ async def test_prompt_logprobs_raises_error(
             prompt="",
             max_tokens=5,
             temperature=0.0,
-            extra_body={
-                "prompt_embeds": encoded_embeds,
-                "prompt_logprobs": True
-            },
+            extra_body={"prompt_embeds": encoded_embeds, "prompt_logprobs": True},
         )
diff --git a/tests/entrypoints/openai/test_default_mm_loras.py b/tests/entrypoints/openai/test_default_mm_loras.py
index b9c466a6fbeb..336bda81a9ef 100644
--- a/tests/entrypoints/openai/test_default_mm_loras.py
+++ b/tests/entrypoints/openai/test_default_mm_loras.py
@@ -16,8 +16,7 @@
 # need a multimodal model for these tests.
 
 # Contains a modality specific lora alongside the base model
-MULTIMODAL_MODEL_NAME = snapshot_download(
-    "microsoft/Phi-4-multimodal-instruct")
+MULTIMODAL_MODEL_NAME = snapshot_download("microsoft/Phi-4-multimodal-instruct")
 AUDIO_LORA_PATH = os.path.join(MULTIMODAL_MODEL_NAME, "speech-lora")
 
 ACTIVE_MM_LORA_RESPONSE = "Spoken text: The first words I spoke in the original chronograph, a little piece of practical poetry. Mary had a little lamb, it slept with quite a snow, and everywhere that Mary went, the lamb was sure to go."  # noqa: E501
@@ -25,7 +24,6 @@
 
 @pytest.fixture(scope="module")
 def multimodal_server():  # noqa: F811
-
     args = [
         # use half precision for speed and memory savings in CI environment
         "--dtype",
@@ -45,11 +43,12 @@ def multimodal_server():  # noqa: F811
         "--gpu-memory-utilization",
         "0.8",
         "--default-mm-loras",
-        f"{{\"audio\": \"{AUDIO_LORA_PATH}\"}}",
+        f'{{"audio": "{AUDIO_LORA_PATH}"}}',
     ]
 
-    with RemoteOpenAIServer(MULTIMODAL_MODEL_NAME, args,
-                            max_wait_seconds=480) as remote_server:
+    with RemoteOpenAIServer(
+        MULTIMODAL_MODEL_NAME, args, max_wait_seconds=480
+    ) as remote_server:
         yield remote_server
 
 
@@ -70,25 +69,25 @@ async def test_default_mm_lora_chat_completions(
     multi_modal_client: openai.AsyncOpenAI,
     audio_assets: AudioTestAssets,
 ):
-    messages = [{
-        "role":
-        "user",
-        "content": [{
-            "type": "text",
-            "text": "Can you transcribe this audio?",
-        }, {
-            "type": "audio_url",
-            "audio_url": {
-                "url": audio_assets[0].url
-            },
-        }]
-    }]
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {
+                    "type": "text",
+                    "text": "Can you transcribe this audio?",
+                },
+                {
+                    "type": "audio_url",
+                    "audio_url": {"url": audio_assets[0].url},
+                },
+            ],
+        }
+    ]
 
     chat_completion = await multi_modal_client.chat.completions.create(
-        model=model_name,
-        messages=messages,
-        max_completion_tokens=128,
-        temperature=0.0)
+        model=model_name, messages=messages, max_completion_tokens=128, temperature=0.0
+    )
 
     assert len(chat_completion.choices) > 0
 
diff --git a/tests/entrypoints/openai/test_lora_adapters.py b/tests/entrypoints/openai/test_lora_adapters.py
index 6f2addd3649d..379e7d36d9e1 100644
--- a/tests/entrypoints/openai/test_lora_adapters.py
+++ b/tests/entrypoints/openai/test_lora_adapters.py
@@ -20,26 +20,18 @@
 BADREQUEST_CASES = [
     (
         "test_rank",
-        {
-            "r": 1024
-        },
+        {"r": 1024},
         "is greater than max_lora_rank",
     ),
     (
         "test_bias",
-        {
-            "bias": "all"
-        },
+        {"bias": "all"},
         "Adapter bias cannot be used without bias_enabled",
     ),
-    ("test_dora", {
-        "use_dora": True
-    }, "does not yet support DoRA"),
+    ("test_dora", {"use_dora": True}, "does not yet support DoRA"),
     (
         "test_modules_to_save",
-        {
-            "modules_to_save": ["lm_head"]
-        },
+        {"modules_to_save": ["lm_head"]},
         "only supports modules_to_save being None",
     ),
 ]
@@ -48,24 +40,23 @@
 @pytest.fixture(scope="module")
 def monkeypatch_module():
     from _pytest.monkeypatch import MonkeyPatch
+
     mpatch = MonkeyPatch()
     yield mpatch
     mpatch.undo()
 
 
 @pytest.fixture(scope="module", params=[True])
-def server_with_lora_modules_json(request, monkeypatch_module,
-                                  zephyr_lora_files):
-
+def server_with_lora_modules_json(request, monkeypatch_module, zephyr_lora_files):
     use_v1 = request.param
     assert use_v1
-    monkeypatch_module.setenv('VLLM_USE_V1', '1')
+    monkeypatch_module.setenv("VLLM_USE_V1", "1")
 
     # Define the json format LoRA module configurations
     lora_module_1 = {
         "name": "zephyr-lora",
         "path": zephyr_lora_files,
-        "base_model_name": MODEL_NAME
+        "base_model_name": MODEL_NAME,
     }
 
     args = [
@@ -96,14 +87,12 @@ def server_with_lora_modules_json(request, monkeypatch_module,
 
 @pytest_asyncio.fixture
 async def client(server_with_lora_modules_json):
-    async with server_with_lora_modules_json.get_async_client(
-    ) as async_client:
+    async with server_with_lora_modules_json.get_async_client() as async_client:
         yield async_client
 
 
 @pytest.mark.asyncio
-async def test_static_lora_lineage(client: openai.AsyncOpenAI,
-                                   zephyr_lora_files):
+async def test_static_lora_lineage(client: openai.AsyncOpenAI, zephyr_lora_files):
     models = await client.models.list()
     models = models.data
     served_model = models[0]
@@ -111,22 +100,18 @@ async def test_static_lora_lineage(client: openai.AsyncOpenAI,
     assert served_model.id == MODEL_NAME
     assert served_model.root == MODEL_NAME
     assert served_model.parent is None
-    assert all(lora_model.root == zephyr_lora_files
-               for lora_model in lora_models)
+    assert all(lora_model.root == zephyr_lora_files for lora_model in lora_models)
     assert all(lora_model.parent == MODEL_NAME for lora_model in lora_models)
     assert lora_models[0].id == "zephyr-lora"
 
 
 @pytest.mark.asyncio
-async def test_dynamic_lora_lineage(client: openai.AsyncOpenAI,
-                                    zephyr_lora_files):
-
-    response = await client.post("load_lora_adapter",
-                                 cast_to=str,
-                                 body={
-                                     "lora_name": "zephyr-lora-3",
-                                     "lora_path": zephyr_lora_files
-                                 })
+async def test_dynamic_lora_lineage(client: openai.AsyncOpenAI, zephyr_lora_files):
+    response = await client.post(
+        "load_lora_adapter",
+        cast_to=str,
+        body={"lora_name": "zephyr-lora-3", "lora_path": zephyr_lora_files},
+    )
     # Ensure adapter loads before querying /models
     assert "success" in response
 
@@ -141,37 +126,37 @@ async def test_dynamic_lora_lineage(client: openai.AsyncOpenAI,
 @pytest.mark.asyncio
 async def test_dynamic_lora_not_found(client: openai.AsyncOpenAI):
     with pytest.raises(openai.NotFoundError):
-        await client.post("load_lora_adapter",
-                          cast_to=str,
-                          body={
-                              "lora_name": "notfound",
-                              "lora_path": "/not/an/adapter"
-                          })
+        await client.post(
+            "load_lora_adapter",
+            cast_to=str,
+            body={"lora_name": "notfound", "lora_path": "/not/an/adapter"},
+        )
 
 
 @pytest.mark.asyncio
-async def test_dynamic_lora_invalid_files(client: openai.AsyncOpenAI,
-                                          tmp_path):
+async def test_dynamic_lora_invalid_files(client: openai.AsyncOpenAI, tmp_path):
     invalid_files = tmp_path / "invalid_files"
     invalid_files.mkdir()
     (invalid_files / "adapter_config.json").write_text("this is not json")
 
     with pytest.raises(openai.BadRequestError):
-        await client.post("load_lora_adapter",
-                          cast_to=str,
-                          body={
-                              "lora_name": "invalid-json",
-                              "lora_path": str(invalid_files)
-                          })
+        await client.post(
+            "load_lora_adapter",
+            cast_to=str,
+            body={"lora_name": "invalid-json", "lora_path": str(invalid_files)},
+        )
 
 
 @pytest.mark.asyncio
-@pytest.mark.parametrize("test_name,config_change,expected_error",
-                         BADREQUEST_CASES)
-async def test_dynamic_lora_badrequests(client: openai.AsyncOpenAI, tmp_path,
-                                        zephyr_lora_files, test_name: str,
-                                        config_change: dict,
-                                        expected_error: str):
+@pytest.mark.parametrize("test_name,config_change,expected_error", BADREQUEST_CASES)
+async def test_dynamic_lora_badrequests(
+    client: openai.AsyncOpenAI,
+    tmp_path,
+    zephyr_lora_files,
+    test_name: str,
+    config_change: dict,
+    expected_error: str,
+):
     # Create test directory
     test_dir = tmp_path / test_name
 
@@ -191,29 +176,28 @@ async def test_dynamic_lora_badrequests(client: openai.AsyncOpenAI, tmp_path,
 
     # Test loading the adapter
     with pytest.raises(openai.BadRequestError, match=expected_error):
-        await client.post("load_lora_adapter",
-                          cast_to=str,
-                          body={
-                              "lora_name": test_name,
-                              "lora_path": str(test_dir)
-                          })
+        await client.post(
+            "load_lora_adapter",
+            cast_to=str,
+            body={"lora_name": test_name, "lora_path": str(test_dir)},
+        )
 
 
 @pytest.mark.asyncio
-async def test_multiple_lora_adapters(client: openai.AsyncOpenAI, tmp_path,
-                                      zephyr_lora_files):
+async def test_multiple_lora_adapters(
+    client: openai.AsyncOpenAI, tmp_path, zephyr_lora_files
+):
     """Validate that many loras can be dynamically registered and inferenced
     with concurrently"""
 
     # This test file configures the server with --max-cpu-loras=2 and this test
     # will concurrently load 10 adapters, so it should flex the LRU cache
     async def load_and_run_adapter(adapter_name: str):
-        await client.post("load_lora_adapter",
-                          cast_to=str,
-                          body={
-                              "lora_name": adapter_name,
-                              "lora_path": str(zephyr_lora_files)
-                          })
+        await client.post(
+            "load_lora_adapter",
+            cast_to=str,
+            body={"lora_name": adapter_name, "lora_path": str(zephyr_lora_files)},
+        )
         for _ in range(3):
             await client.completions.create(
                 model=adapter_name,
@@ -223,8 +207,7 @@ async def load_and_run_adapter(adapter_name: str):
 
     lora_tasks = []
     for i in range(10):
-        lora_tasks.append(
-            asyncio.create_task(load_and_run_adapter(f"adapter_{i}")))
+        lora_tasks.append(asyncio.create_task(load_and_run_adapter(f"adapter_{i}")))
 
     results, _ = await asyncio.wait(lora_tasks)
 
@@ -234,8 +217,8 @@ async def load_and_run_adapter(adapter_name: str):
 
 @pytest.mark.asyncio
 async def test_loading_invalid_adapters_does_not_break_others(
-        client: openai.AsyncOpenAI, tmp_path, zephyr_lora_files):
-
+    client: openai.AsyncOpenAI, tmp_path, zephyr_lora_files
+):
     invalid_files = tmp_path / "invalid_files"
     invalid_files.mkdir()
     (invalid_files / "adapter_config.json").write_text("this is not json")
@@ -266,20 +249,18 @@ async def run_good_requests(client):
     # Run a bunch of bad adapter loads
     for _ in range(25):
         with suppress(openai.NotFoundError):
-            await client.post("load_lora_adapter",
-                              cast_to=str,
-                              body={
-                                  "lora_name": "notfound",
-                                  "lora_path": "/not/an/adapter"
-                              })
+            await client.post(
+                "load_lora_adapter",
+                cast_to=str,
+                body={"lora_name": "notfound", "lora_path": "/not/an/adapter"},
+            )
     for _ in range(25):
         with suppress(openai.BadRequestError):
-            await client.post("load_lora_adapter",
-                              cast_to=str,
-                              body={
-                                  "lora_name": "invalid",
-                                  "lora_path": str(invalid_files)
-                              })
+            await client.post(
+                "load_lora_adapter",
+                cast_to=str,
+                body={"lora_name": "invalid", "lora_path": str(invalid_files)},
+            )
 
     # Ensure all the running requests with lora adapters succeeded
     stop_good_requests_event.set()
@@ -288,12 +269,11 @@ async def run_good_requests(client):
         assert not isinstance(r, Exception), f"Got exception {r}"
 
     # Ensure we can load another adapter and run it
-    await client.post("load_lora_adapter",
-                      cast_to=str,
-                      body={
-                          "lora_name": "valid",
-                          "lora_path": zephyr_lora_files
-                      })
+    await client.post(
+        "load_lora_adapter",
+        cast_to=str,
+        body={"lora_name": "valid", "lora_path": zephyr_lora_files},
+    )
     await client.completions.create(
         model="valid",
         prompt=["Hello there", "Foo bar bazz buzz"],
@@ -310,12 +290,11 @@ async def test_beam_search_with_lora_adapters(
     """Validate that async beam search can be used with lora."""
 
     async def load_and_run_adapter(adapter_name: str):
-        await client.post("load_lora_adapter",
-                          cast_to=str,
-                          body={
-                              "lora_name": adapter_name,
-                              "lora_path": str(zephyr_lora_files)
-                          })
+        await client.post(
+            "load_lora_adapter",
+            cast_to=str,
+            body={"lora_name": adapter_name, "lora_path": str(zephyr_lora_files)},
+        )
         for _ in range(3):
             await client.completions.create(
                 model=adapter_name,
@@ -326,8 +305,7 @@ async def load_and_run_adapter(adapter_name: str):
 
     lora_tasks = []
     for i in range(3):
-        lora_tasks.append(
-            asyncio.create_task(load_and_run_adapter(f"adapter_{i}")))
+        lora_tasks.append(asyncio.create_task(load_and_run_adapter(f"adapter_{i}")))
 
     results, _ = await asyncio.wait(lora_tasks)
 
diff --git a/tests/entrypoints/openai/test_lora_resolvers.py b/tests/entrypoints/openai/test_lora_resolvers.py
index 45aa2070d0a2..2a15848ba447 100644
--- a/tests/entrypoints/openai/test_lora_resolvers.py
+++ b/tests/entrypoints/openai/test_lora_resolvers.py
@@ -12,8 +12,7 @@
 from vllm.config.multimodal import MultiModalConfig
 from vllm.entrypoints.openai.protocol import CompletionRequest, ErrorResponse
 from vllm.entrypoints.openai.serving_completion import OpenAIServingCompletion
-from vllm.entrypoints.openai.serving_models import (BaseModelPath,
-                                                    OpenAIServingModels)
+from vllm.entrypoints.openai.serving_models import BaseModelPath, OpenAIServingModels
 from vllm.lora.request import LoRARequest
 from vllm.lora.resolver import LoRAResolver, LoRAResolverRegistry
 from vllm.transformers_utils.tokenizer import get_tokenizer
@@ -33,14 +32,14 @@ class MockHFConfig:
 @dataclass
 class MockModelConfig:
     """Minimal mock ModelConfig for testing."""
+
     model: str = MODEL_NAME
     tokenizer: str = MODEL_NAME
     trust_remote_code: bool = False
     tokenizer_mode: str = "auto"
     max_model_len: int = 100
     tokenizer_revision: Optional[str] = None
-    multimodal_config: MultiModalConfig = field(
-        default_factory=MultiModalConfig)
+    multimodal_config: MultiModalConfig = field(default_factory=MultiModalConfig)
     hf_config: MockHFConfig = field(default_factory=MockHFConfig)
     logits_processor_pattern: Optional[str] = None
     diff_sampling_param: Optional[dict] = None
@@ -55,17 +54,21 @@ def get_diff_sampling_param(self):
 
 
 class MockLoRAResolver(LoRAResolver):
-
-    async def resolve_lora(self, base_model_name: str,
-                           lora_name: str) -> Optional[LoRARequest]:
+    async def resolve_lora(
+        self, base_model_name: str, lora_name: str
+    ) -> Optional[LoRARequest]:
         if lora_name == "test-lora":
-            return LoRARequest(lora_name="test-lora",
-                               lora_int_id=1,
-                               lora_local_path="/fake/path/test-lora")
+            return LoRARequest(
+                lora_name="test-lora",
+                lora_int_id=1,
+                lora_local_path="/fake/path/test-lora",
+            )
         elif lora_name == "invalid-lora":
-            return LoRARequest(lora_name="invalid-lora",
-                               lora_int_id=2,
-                               lora_local_path="/fake/path/invalid-lora")
+            return LoRARequest(
+                lora_name="invalid-lora",
+                lora_int_id=2,
+                lora_local_path="/fake/path/invalid-lora",
+            )
         return None
 
 
@@ -96,8 +99,7 @@ async def mock_add_lora_side_effect(lora_request: LoRARequest):
             return True
         if lora_request.lora_name == "invalid-lora":
             # Simulate failure during addition (e.g. invalid format)
-            raise ValueError(f"Simulated failure adding LoRA: "
-                             f"{lora_request.lora_name}")
+            raise ValueError(f"Simulated failure adding LoRA: {lora_request.lora_name}")
         return True
 
     mock_engine.add_lora = AsyncMock(side_effect=mock_add_lora_side_effect)
@@ -106,31 +108,31 @@ async def mock_generate(*args, **kwargs):
         for _ in []:
             yield _
 
-    mock_engine.generate = MagicMock(spec=AsyncLLM.generate,
-                                     side_effect=mock_generate)
+    mock_engine.generate = MagicMock(spec=AsyncLLM.generate, side_effect=mock_generate)
 
     mock_engine.generate.reset_mock()
     mock_engine.add_lora.reset_mock()
 
     mock_model_config = MockModelConfig()
-    models = OpenAIServingModels(engine_client=mock_engine,
-                                 base_model_paths=BASE_MODEL_PATHS,
-                                 model_config=mock_model_config)
+    models = OpenAIServingModels(
+        engine_client=mock_engine,
+        base_model_paths=BASE_MODEL_PATHS,
+        model_config=mock_model_config,
+    )
 
-    serving_completion = OpenAIServingCompletion(mock_engine,
-                                                 mock_model_config,
-                                                 models,
-                                                 request_logger=None)
+    serving_completion = OpenAIServingCompletion(
+        mock_engine, mock_model_config, models, request_logger=None
+    )
 
-    serving_completion._process_inputs = AsyncMock(return_value=(MagicMock(
-        name="engine_request"), {}))
+    serving_completion._process_inputs = AsyncMock(
+        return_value=(MagicMock(name="engine_request"), {})
+    )
 
     return mock_engine, serving_completion
 
 
 @pytest.mark.asyncio
-async def test_serving_completion_with_lora_resolver(mock_serving_setup,
-                                                     monkeypatch):
+async def test_serving_completion_with_lora_resolver(mock_serving_setup, monkeypatch):
     monkeypatch.setenv("VLLM_ALLOW_RUNTIME_LORA_UPDATING", "true")
 
     mock_engine, serving_completion = mock_serving_setup
@@ -152,14 +154,13 @@ async def test_serving_completion_with_lora_resolver(mock_serving_setup,
     assert called_lora_request.lora_name == lora_model_name
 
     mock_engine.generate.assert_called_once()
-    called_lora_request = mock_engine.generate.call_args[1]['lora_request']
+    called_lora_request = mock_engine.generate.call_args[1]["lora_request"]
     assert isinstance(called_lora_request, LoRARequest)
     assert called_lora_request.lora_name == lora_model_name
 
 
 @pytest.mark.asyncio
-async def test_serving_completion_resolver_not_found(mock_serving_setup,
-                                                     monkeypatch):
+async def test_serving_completion_resolver_not_found(mock_serving_setup, monkeypatch):
     monkeypatch.setenv("VLLM_ALLOW_RUNTIME_LORA_UPDATING", "true")
 
     mock_engine, serving_completion = mock_serving_setup
@@ -182,7 +183,8 @@ async def test_serving_completion_resolver_not_found(mock_serving_setup,
 
 @pytest.mark.asyncio
 async def test_serving_completion_resolver_add_lora_fails(
-        mock_serving_setup, monkeypatch):
+    mock_serving_setup, monkeypatch
+):
     monkeypatch.setenv("VLLM_ALLOW_RUNTIME_LORA_UPDATING", "true")
 
     mock_engine, serving_completion = mock_serving_setup
diff --git a/tests/entrypoints/openai/test_metrics.py b/tests/entrypoints/openai/test_metrics.py
index f0b61902eb56..711505c74bca 100644
--- a/tests/entrypoints/openai/test_metrics.py
+++ b/tests/entrypoints/openai/test_metrics.py
@@ -54,19 +54,22 @@ def default_server_args():
     ]
 
 
-@pytest.fixture(scope="module",
-                params=[
-                    "",
-                    "--enable-chunked-prefill",
-                    "--disable-frontend-multiprocessing",
-                    f"--show-hidden-metrics-for-version={PREV_MINOR_VERSION}",
-                ])
+@pytest.fixture(
+    scope="module",
+    params=[
+        "",
+        "--enable-chunked-prefill",
+        "--disable-frontend-multiprocessing",
+        f"--show-hidden-metrics-for-version={PREV_MINOR_VERSION}",
+    ],
+)
 def server(use_v1, default_server_args, request):
     if request.param:
         default_server_args.append(request.param)
-    env_dict = dict(VLLM_USE_V1='1' if use_v1 else '0')
-    with RemoteOpenAIServer(MODEL_NAME, default_server_args,
-                            env_dict=env_dict) as remote_server:
+    env_dict = dict(VLLM_USE_V1="1" if use_v1 else "0")
+    with RemoteOpenAIServer(
+        MODEL_NAME, default_server_args, env_dict=env_dict
+    ) as remote_server:
         yield remote_server
 
 
@@ -87,30 +90,36 @@ async def client(server):
 # {metric_family: [(suffix, expected_value)]}
 EXPECTED_VALUES = {
     "vllm:time_to_first_token_seconds": [("_count", _NUM_REQUESTS)],
-    "vllm:time_per_output_token_seconds":
-    [("_count", _NUM_REQUESTS * (_NUM_GENERATION_TOKENS_PER_REQUEST - 1))],
+    "vllm:time_per_output_token_seconds": [
+        ("_count", _NUM_REQUESTS * (_NUM_GENERATION_TOKENS_PER_REQUEST - 1))
+    ],
     "vllm:e2e_request_latency_seconds": [("_count", _NUM_REQUESTS)],
     "vllm:request_queue_time_seconds": [("_count", _NUM_REQUESTS)],
     "vllm:request_inference_time_seconds": [("_count", _NUM_REQUESTS)],
     "vllm:request_prefill_time_seconds": [("_count", _NUM_REQUESTS)],
     "vllm:request_decode_time_seconds": [("_count", _NUM_REQUESTS)],
-    "vllm:request_prompt_tokens":
-    [("_sum", _NUM_REQUESTS * _NUM_PROMPT_TOKENS_PER_REQUEST),
-     ("_count", _NUM_REQUESTS)],
-    "vllm:request_generation_tokens":
-    [("_sum", _NUM_REQUESTS * _NUM_GENERATION_TOKENS_PER_REQUEST),
-     ("_count", _NUM_REQUESTS)],
+    "vllm:request_prompt_tokens": [
+        ("_sum", _NUM_REQUESTS * _NUM_PROMPT_TOKENS_PER_REQUEST),
+        ("_count", _NUM_REQUESTS),
+    ],
+    "vllm:request_generation_tokens": [
+        ("_sum", _NUM_REQUESTS * _NUM_GENERATION_TOKENS_PER_REQUEST),
+        ("_count", _NUM_REQUESTS),
+    ],
     "vllm:request_params_n": [("_count", _NUM_REQUESTS)],
     "vllm:request_params_max_tokens": [
         ("_sum", _NUM_REQUESTS * _NUM_GENERATION_TOKENS_PER_REQUEST),
-        ("_count", _NUM_REQUESTS)
+        ("_count", _NUM_REQUESTS),
+    ],
+    "vllm:iteration_tokens_total": [
+        (
+            "_sum",
+            _NUM_REQUESTS
+            * (_NUM_PROMPT_TOKENS_PER_REQUEST + _NUM_GENERATION_TOKENS_PER_REQUEST),
+        ),
+        ("_count", _NUM_REQUESTS * _NUM_GENERATION_TOKENS_PER_REQUEST),
     ],
-    "vllm:iteration_tokens_total":
-    [("_sum", _NUM_REQUESTS *
-      (_NUM_PROMPT_TOKENS_PER_REQUEST + _NUM_GENERATION_TOKENS_PER_REQUEST)),
-     ("_count", _NUM_REQUESTS * _NUM_GENERATION_TOKENS_PER_REQUEST)],
-    "vllm:prompt_tokens": [("_total",
-                            _NUM_REQUESTS * _NUM_PROMPT_TOKENS_PER_REQUEST)],
+    "vllm:prompt_tokens": [("_total", _NUM_REQUESTS * _NUM_PROMPT_TOKENS_PER_REQUEST)],
     "vllm:generation_tokens": [
         ("_total", _NUM_REQUESTS * _NUM_PROMPT_TOKENS_PER_REQUEST)
     ],
@@ -119,14 +128,16 @@ async def client(server):
 
 
 @pytest.mark.asyncio
-async def test_metrics_counts(server: RemoteOpenAIServer,
-                              client: openai.AsyncClient, use_v1: bool):
+async def test_metrics_counts(
+    server: RemoteOpenAIServer, client: openai.AsyncClient, use_v1: bool
+):
     for _ in range(_NUM_REQUESTS):
         # sending a request triggers the metrics to be logged.
         await client.completions.create(
             model=MODEL_NAME,
             prompt=_TOKENIZED_PROMPT,
-            max_tokens=_NUM_GENERATION_TOKENS_PER_REQUEST)
+            max_tokens=_NUM_GENERATION_TOKENS_PER_REQUEST,
+        )
 
     response = requests.get(server.url_for("metrics"))
     print(response.text)
@@ -134,9 +145,10 @@ async def test_metrics_counts(server: RemoteOpenAIServer,
 
     # Loop over all expected metric_families
     for metric_family, suffix_values_list in EXPECTED_VALUES.items():
-        if ((use_v1 and metric_family not in EXPECTED_METRICS_V1)
-                or (not server.show_hidden_metrics
-                    and metric_family in HIDDEN_DEPRECATED_METRICS)):
+        if (use_v1 and metric_family not in EXPECTED_METRICS_V1) or (
+            not server.show_hidden_metrics
+            and metric_family in HIDDEN_DEPRECATED_METRICS
+        ):
             continue
 
         found_metric = False
@@ -160,14 +172,15 @@ async def test_metrics_counts(server: RemoteOpenAIServer,
                             assert sample.value == expected_value, (
                                 f"{metric_name_w_suffix} expected value of "
                                 f"{expected_value} did not match found value "
-                                f"{sample.value}")
+                                f"{sample.value}"
+                            )
                             break
                     assert found_suffix, (
                         f"Did not find {metric_name_w_suffix} in prom endpoint"
                     )
                 break
 
-        assert found_metric, (f"Did not find {metric_family} in prom endpoint")
+        assert found_metric, f"Did not find {metric_family} in prom endpoint"
 
 
 EXPECTED_METRICS = [
@@ -290,30 +303,30 @@ async def test_metrics_counts(server: RemoteOpenAIServer,
 
 
 @pytest.mark.asyncio
-async def test_metrics_exist(server: RemoteOpenAIServer,
-                             client: openai.AsyncClient, use_v1: bool):
+async def test_metrics_exist(
+    server: RemoteOpenAIServer, client: openai.AsyncClient, use_v1: bool
+):
     # sending a request triggers the metrics to be logged.
-    await client.completions.create(model=MODEL_NAME,
-                                    prompt="Hello, my name is",
-                                    max_tokens=5,
-                                    temperature=0.0)
+    await client.completions.create(
+        model=MODEL_NAME, prompt="Hello, my name is", max_tokens=5, temperature=0.0
+    )
 
     response = requests.get(server.url_for("metrics"))
     assert response.status_code == HTTPStatus.OK
 
-    for metric in (EXPECTED_METRICS_V1 if use_v1 else EXPECTED_METRICS):
-        if (metric in HIDDEN_DEPRECATED_METRICS
-                and not server.show_hidden_metrics):
+    for metric in EXPECTED_METRICS_V1 if use_v1 else EXPECTED_METRICS:
+        if metric in HIDDEN_DEPRECATED_METRICS and not server.show_hidden_metrics:
             continue
         assert metric in response.text
 
 
 @pytest.mark.asyncio
-async def test_abort_metrics_reset(server: RemoteOpenAIServer,
-                                   client: openai.AsyncClient, use_v1: bool):
-
-    running_requests, waiting_requests, kv_cache_usage = (
-        _get_running_metrics_from_api(server, use_v1))
+async def test_abort_metrics_reset(
+    server: RemoteOpenAIServer, client: openai.AsyncClient, use_v1: bool
+):
+    running_requests, waiting_requests, kv_cache_usage = _get_running_metrics_from_api(
+        server, use_v1
+    )
 
     # Expect no running requests or kvcache usage
     assert running_requests == 0
@@ -328,15 +341,18 @@ async def test_abort_metrics_reset(server: RemoteOpenAIServer,
                 model=MODEL_NAME,
                 prompt=_TOKENIZED_PROMPT,
                 max_tokens=100,  # Long generation to give time to abort
-                temperature=0.0))
+                temperature=0.0,
+            )
+        )
         tasks.append(task)
 
     # Wait a bit for requests to start processing
     await asyncio.sleep(0.5)
 
     # Check that we have running requests
-    running_requests, waiting_requests, kv_cache_usage = (
-        _get_running_metrics_from_api(server, use_v1))
+    running_requests, waiting_requests, kv_cache_usage = _get_running_metrics_from_api(
+        server, use_v1
+    )
 
     # Expect running requests and kvcache usage
     assert running_requests > 0
@@ -355,17 +371,18 @@ async def test_abort_metrics_reset(server: RemoteOpenAIServer,
 
     # Verify running and waiting requests counts and KV cache usage are zero
     running_requests_after, waiting_requests_after, kv_cache_usage_after = (
-        _get_running_metrics_from_api(server, use_v1))
+        _get_running_metrics_from_api(server, use_v1)
+    )
 
-    assert running_requests_after == 0,\
-        (f"Expected 0 running requests after abort, got "
-         f"{running_requests_after}")
-    assert waiting_requests_after == 0,\
-        (f"Expected 0 waiting requests after abort, got "
-         f"{waiting_requests_after}")
-    assert kv_cache_usage_after == 0,\
-        (f"Expected 0% KV cache usage after abort, got "
-         f"{kv_cache_usage_after}")
+    assert running_requests_after == 0, (
+        f"Expected 0 running requests after abort, got {running_requests_after}"
+    )
+    assert waiting_requests_after == 0, (
+        f"Expected 0 waiting requests after abort, got {waiting_requests_after}"
+    )
+    assert kv_cache_usage_after == 0, (
+        f"Expected 0% KV cache usage after abort, got {kv_cache_usage_after}"
+    )
 
 
 def _get_running_metrics_from_api(server: RemoteOpenAIServer, use_v1: bool):
@@ -377,8 +394,9 @@ def _get_running_metrics_from_api(server: RemoteOpenAIServer, use_v1: bool):
     # Verify running and waiting requests counts and KV cache usage are zero
     running_requests, waiting_requests, kv_cache_usage = None, None, None
 
-    kv_cache_usage_metric = ("vllm:kv_cache_usage_perc"
-                             if use_v1 else "vllm:gpu_cache_usage_perc")
+    kv_cache_usage_metric = (
+        "vllm:kv_cache_usage_perc" if use_v1 else "vllm:gpu_cache_usage_perc"
+    )
 
     for family in text_string_to_metric_families(response.text):
         if family.name == "vllm:num_requests_running":
@@ -411,28 +429,31 @@ def test_metrics_exist_run_batch(use_v1: bool):
     port = "8001"
     server_url = f"http://{base_url}:{port}"
 
-    with tempfile.NamedTemporaryFile(
-            "w") as input_file, tempfile.NamedTemporaryFile(
-                "r") as output_file:
+    with (
+        tempfile.NamedTemporaryFile("w") as input_file,
+        tempfile.NamedTemporaryFile("r") as output_file,
+    ):
         input_file.write(input_batch)
         input_file.flush()
-        proc = subprocess.Popen([
-            sys.executable,
-            "-m",
-            "vllm.entrypoints.openai.run_batch",
-            "-i",
-            input_file.name,
-            "-o",
-            output_file.name,
-            "--model",
-            "intfloat/multilingual-e5-small",
-            "--enable-metrics",
-            "--url",
-            base_url,
-            "--port",
-            port,
-        ],
-                                env={"VLLM_USE_V1": "1"})
+        proc = subprocess.Popen(
+            [
+                sys.executable,
+                "-m",
+                "vllm.entrypoints.openai.run_batch",
+                "-i",
+                input_file.name,
+                "-o",
+                output_file.name,
+                "--model",
+                "intfloat/multilingual-e5-small",
+                "--enable-metrics",
+                "--url",
+                base_url,
+                "--port",
+                port,
+            ],
+            env={"VLLM_USE_V1": "1"},
+        )
 
         def is_server_up(url):
             try:
diff --git a/tests/entrypoints/openai/test_models.py b/tests/entrypoints/openai/test_models.py
index 4ee34b19dea3..7d2968d96506 100644
--- a/tests/entrypoints/openai/test_models.py
+++ b/tests/entrypoints/openai/test_models.py
@@ -52,6 +52,5 @@ async def test_check_models(client: openai.AsyncOpenAI, zephyr_lora_files):
     lora_models = models[1:]
     assert served_model.id == MODEL_NAME
     assert served_model.root == MODEL_NAME
-    assert all(lora_model.root == zephyr_lora_files
-               for lora_model in lora_models)
+    assert all(lora_model.root == zephyr_lora_files for lora_model in lora_models)
     assert lora_models[0].id == "zephyr-lora"
diff --git a/tests/entrypoints/openai/test_oot_registration.py b/tests/entrypoints/openai/test_oot_registration.py
index f0ce50debe49..ba463be1d5cd 100644
--- a/tests/entrypoints/openai/test_oot_registration.py
+++ b/tests/entrypoints/openai/test_oot_registration.py
@@ -25,13 +25,10 @@ def run_and_test_dummy_opt_api_server(model, tp=1):
         client = server.get_client()
         completion = client.chat.completions.create(
             model=model,
-            messages=[{
-                "role": "system",
-                "content": "You are a helpful assistant."
-            }, {
-                "role": "user",
-                "content": "Hello!"
-            }],
+            messages=[
+                {"role": "system", "content": "You are a helpful assistant."},
+                {"role": "user", "content": "Hello!"},
+            ],
             temperature=0,
         )
         generated_text = completion.choices[0].message.content
diff --git a/tests/entrypoints/openai/test_openai_schema.py b/tests/entrypoints/openai/test_openai_schema.py
index 73f79ac28d11..64fdaf08893a 100644
--- a/tests/entrypoints/openai/test_openai_schema.py
+++ b/tests/entrypoints/openai/test_openai_schema.py
@@ -75,10 +75,11 @@ def no_invalid_types(case: schemathesis.models.Case):
             http://localhost:8000/v1/chat/completions
         """  # noqa: E501
         if hasattr(case, "body") and isinstance(case.body, dict):
-            if ("messages" in case.body
-                    and isinstance(case.body["messages"], list)
-                    and len(case.body["messages"]) > 0):
-
+            if (
+                "messages" in case.body
+                and isinstance(case.body["messages"], list)
+                and len(case.body["messages"]) > 0
+            ):
                 for message in case.body["messages"]:
                     if not isinstance(message, dict):
                         continue
@@ -86,10 +87,11 @@ def no_invalid_types(case: schemathesis.models.Case):
                     # Check for invalid file type in tokenize endpoint
                     if op.method.lower() == "post" and op.path == "/tokenize":
                         content = message.get("content", [])
-                        if (isinstance(content, list) and len(content) > 0
-                                and any(
-                                    item.get("type") == "file"
-                                    for item in content)):
+                        if (
+                            isinstance(content, list)
+                            and len(content) > 0
+                            and any(item.get("type") == "file" for item in content)
+                        ):
                             return False
 
                     # Check for invalid tool_calls with non-function types
@@ -106,10 +108,13 @@ def no_invalid_types(case: schemathesis.models.Case):
             # Causing a server error in EBNF grammar parsing
             # https://github.com/vllm-project/vllm/pull/22587#issuecomment-3195253421
             structured_outputs = case.body.get("structured_outputs", {})
-            grammar = structured_outputs.get("grammar") if isinstance(
-                structured_outputs, dict) else None
+            grammar = (
+                structured_outputs.get("grammar")
+                if isinstance(structured_outputs, dict)
+                else None
+            )
 
-            if grammar == '':
+            if grammar == "":
                 # Allow None (will be handled as no grammar)
                 # But skip empty strings
                 return False
@@ -133,9 +138,8 @@ def test_openapi_stateless(case: schemathesis.Case):
 
     timeout = {
         # requires a longer timeout
-        ("POST", "/v1/chat/completions"):
-        LONG_TIMEOUT_SECONDS,
+        ("POST", "/v1/chat/completions"): LONG_TIMEOUT_SECONDS,
     }.get(key, DEFAULT_TIMEOUT_SECONDS)
 
-    #No need to verify SSL certificate for localhost
+    # No need to verify SSL certificate for localhost
     case.call_and_validate(verify=False, timeout=timeout)
diff --git a/tests/entrypoints/openai/test_optional_middleware.py b/tests/entrypoints/openai/test_optional_middleware.py
index eb387998c2cc..b67d6147937d 100644
--- a/tests/entrypoints/openai/test_optional_middleware.py
+++ b/tests/entrypoints/openai/test_optional_middleware.py
@@ -37,7 +37,7 @@ def server(request: pytest.FixtureRequest):
         "--enforce-eager",
         "--max-num-seqs",
         "2",
-        *passed_params
+        *passed_params,
     ]
     with RemoteOpenAIServer(MODEL_NAME, args) as remote_server:
         yield remote_server
@@ -73,8 +73,9 @@ async def test_missing_api_token(server: RemoteOpenAIServer):
 )
 @pytest.mark.asyncio
 async def test_passed_api_token(server: RemoteOpenAIServer):
-    response = requests.get(server.url_for("v1/models"),
-                            headers={"Authorization": "Bearer test"})
+    response = requests.get(
+        server.url_for("v1/models"), headers={"Authorization": "Bearer test"}
+    )
     assert response.status_code == HTTPStatus.OK
 
 
@@ -110,7 +111,8 @@ async def test_enable_request_id_header(server: RemoteOpenAIServer):
 )
 @pytest.mark.asyncio
 async def test_custom_request_id_header(server: RemoteOpenAIServer):
-    response = requests.get(server.url_for("health"),
-                            headers={"X-Request-Id": "Custom"})
+    response = requests.get(
+        server.url_for("health"), headers={"X-Request-Id": "Custom"}
+    )
     assert "X-Request-Id" in response.headers
     assert response.headers.get("X-Request-Id") == "Custom"
diff --git a/tests/entrypoints/openai/test_prompt_validation.py b/tests/entrypoints/openai/test_prompt_validation.py
index bb4c633e5e50..81e2b52dfa71 100644
--- a/tests/entrypoints/openai/test_prompt_validation.py
+++ b/tests/entrypoints/openai/test_prompt_validation.py
@@ -17,7 +17,7 @@
 
 @pytest.fixture(scope="function", autouse=True)
 def use_v1_only(monkeypatch):
-    monkeypatch.setenv('VLLM_USE_V1', '1')
+    monkeypatch.setenv("VLLM_USE_V1", "1")
 
 
 @pytest.mark.asyncio
@@ -28,15 +28,16 @@ async def test_empty_prompt():
         client = remote_server.get_async_client()
 
         with pytest.raises(
-                openai.BadRequestError,
-                match=
-                "Either prompt or prompt_embeds must be provided and non-empty."
+            openai.BadRequestError,
+            match="Either prompt or prompt_embeds must be provided and non-empty.",
         ):
-            await client.completions.create(model=model_name,
-                                            prompt="",
-                                            max_tokens=5,
-                                            temperature=0.0,
-                                            extra_body={"prompt_embeds": []})
+            await client.completions.create(
+                model=model_name,
+                prompt="",
+                max_tokens=5,
+                temperature=0.0,
+                extra_body={"prompt_embeds": []},
+            )
 
 
 @pytest.mark.asyncio
@@ -46,23 +47,23 @@ async def test_out_of_vocab_token_ids():
     with RemoteOpenAIServer(model_name, server_args) as remote_server:
         client = remote_server.get_async_client()
 
-        with pytest.raises(openai.BadRequestError,
-                           match=re.compile('.*out of vocabulary.*').pattern):
-            await client.completions.create(model=model_name,
-                                            prompt=[999999],
-                                            max_tokens=5,
-                                            temperature=0.0)
+        with pytest.raises(
+            openai.BadRequestError, match=re.compile(".*out of vocabulary.*").pattern
+        ):
+            await client.completions.create(
+                model=model_name, prompt=[999999], max_tokens=5, temperature=0.0
+            )
 
 
-@pytest.mark.parametrize("dtype",
-                         [torch.float32, torch.bfloat16, torch.float16])
+@pytest.mark.parametrize("dtype", [torch.float32, torch.bfloat16, torch.float16])
 @pytest.mark.parametrize(
-    "layout",
-    [torch.strided, torch.sparse_coo, torch.sparse_csc, torch.sparse_csr])
+    "layout", [torch.strided, torch.sparse_coo, torch.sparse_csc, torch.sparse_csr]
+)
 @pytest.mark.parametrize("seq_len", [2, 10])
 @pytest.mark.parametrize("hidden_size", [2, 10])
-def test_load_prompt_embeds(dtype: torch.dtype, layout: torch.layout,
-                            seq_len: int, hidden_size: int):
+def test_load_prompt_embeds(
+    dtype: torch.dtype, layout: torch.layout, seq_len: int, hidden_size: int
+):
     # construct arbitrary tensors of various dtypes, layouts, and sizes.
     # We need to check against different layouts to make sure that if a user
     # uses sparse tensors to reduce the transmission size of prompt embeddings,
@@ -92,6 +93,6 @@ def test_load_prompt_embeds(dtype: torch.dtype, layout: torch.layout,
     loaded_tensor = loaded_prompt_embeds[0]["prompt_embeds"]
     assert loaded_tensor.device.type == "cpu"
     assert loaded_tensor.layout == torch.strided
-    torch.testing.assert_close(loaded_tensor,
-                               tensor.to("cpu").to_dense(),
-                               equal_nan=True)
+    torch.testing.assert_close(
+        loaded_tensor, tensor.to("cpu").to_dense(), equal_nan=True
+    )
diff --git a/tests/entrypoints/openai/test_response_api_mcp_tools.py b/tests/entrypoints/openai/test_response_api_mcp_tools.py
index b0eb84712c19..653d44f20b44 100644
--- a/tests/entrypoints/openai/test_response_api_mcp_tools.py
+++ b/tests/entrypoints/openai/test_response_api_mcp_tools.py
@@ -13,6 +13,7 @@
 @pytest.fixture(scope="module")
 def monkeypatch_module():
     from _pytest.monkeypatch import MonkeyPatch
+
     mpatch = MonkeyPatch()
     yield mpatch
     mpatch.undo()
@@ -36,8 +37,7 @@ def mcp_enabled_server(monkeypatch_module: pytest.MonkeyPatch):
     with monkeypatch_module.context() as m:
         m.setenv("VLLM_ENABLE_RESPONSES_API_STORE", "1")
         m.setenv("PYTHON_EXECUTION_BACKEND", "dangerously_use_uv")
-        m.setenv("GPT_OSS_SYSTEM_TOOL_MCP_LABELS",
-                 "code_interpreter,container")
+        m.setenv("GPT_OSS_SYSTEM_TOOL_MCP_LABELS", "code_interpreter,container")
         with RemoteOpenAIServer(MODEL_NAME, args) as remote_server:
             yield remote_server
 
@@ -57,23 +57,26 @@ async def mcp_enabled_client(mcp_enabled_server):
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.skip(reason="Code interpreter tool is not available in CI yet.")
-async def test_mcp_tool_env_flag_enabled(mcp_enabled_client: OpenAI,
-                                         model_name: str):
+async def test_mcp_tool_env_flag_enabled(mcp_enabled_client: OpenAI, model_name: str):
     response = await mcp_enabled_client.responses.create(
         model=model_name,
         # TODO: Ideally should be able to set max tool calls
         # to prevent multi-turn, but it is not currently supported
         # would speed up the test
-        input=("What's the first 4 digits after the decimal point of "
-               "cube root of `19910212 * 20250910`? "
-               "Show only the digits. The python interpreter is not stateful "
-               "and you must print to see the output."),
-        tools=[{
-            "type": "mcp",
-            "server_label": "code_interpreter",
-            # URL unused for DemoToolServer
-            "server_url": "http://localhost:8888"
-        }],
+        input=(
+            "What's the first 4 digits after the decimal point of "
+            "cube root of `19910212 * 20250910`? "
+            "Show only the digits. The python interpreter is not stateful "
+            "and you must print to see the output."
+        ),
+        tools=[
+            {
+                "type": "mcp",
+                "server_label": "code_interpreter",
+                # URL unused for DemoToolServer
+                "server_url": "http://localhost:8888",
+            }
+        ],
     )
     assert response is not None
     assert response.status == "completed"
@@ -83,23 +86,26 @@ async def test_mcp_tool_env_flag_enabled(mcp_enabled_client: OpenAI,
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.skip(reason="Code interpreter tool is not available in CI yet.")
-async def test_mcp_tool_env_flag_disabled(mcp_disabled_client: OpenAI,
-                                          model_name: str):
+async def test_mcp_tool_env_flag_disabled(mcp_disabled_client: OpenAI, model_name: str):
     response = await mcp_disabled_client.responses.create(
         model=model_name,
         # TODO: Ideally should be able to set max tool calls
         # to prevent multi-turn, but it is not currently supported
         # would speed up the test
-        input=("What's the first 4 digits after the decimal point of "
-               "cube root of `19910212 * 20250910`? "
-               "Show only the digits. The python interpreter is not stateful "
-               "and you must print to see the output."),
-        tools=[{
-            "type": "mcp",
-            "server_label": "code_interpreter",
-            # URL unused for DemoToolServer
-            "server_url": "http://localhost:8888"
-        }],
+        input=(
+            "What's the first 4 digits after the decimal point of "
+            "cube root of `19910212 * 20250910`? "
+            "Show only the digits. The python interpreter is not stateful "
+            "and you must print to see the output."
+        ),
+        tools=[
+            {
+                "type": "mcp",
+                "server_label": "code_interpreter",
+                # URL unused for DemoToolServer
+                "server_url": "http://localhost:8888",
+            }
+        ],
     )
     assert response is not None
     assert response.status == "completed"
diff --git a/tests/entrypoints/openai/test_response_api_with_harmony.py b/tests/entrypoints/openai/test_response_api_with_harmony.py
index 400779064ef5..3a564bef0d12 100644
--- a/tests/entrypoints/openai/test_response_api_with_harmony.py
+++ b/tests/entrypoints/openai/test_response_api_with_harmony.py
@@ -17,6 +17,7 @@
 @pytest.fixture(scope="module")
 def monkeypatch_module():
     from _pytest.monkeypatch import MonkeyPatch
+
     mpatch = MonkeyPatch()
     yield mpatch
     mpatch.undo()
@@ -94,22 +95,10 @@ async def test_chat(client: OpenAI, model_name: str):
     response = await client.responses.create(
         model=model_name,
         input=[
-            {
-                "role": "system",
-                "content": "Respond in Korean."
-            },
-            {
-                "role": "user",
-                "content": "Hello!"
-            },
-            {
-                "role": "assistant",
-                "content": "Hello! How can I help you today?"
-            },
-            {
-                "role": "user",
-                "content": "What is 13 * 24? Explain your answer."
-            },
+            {"role": "system", "content": "Respond in Korean."},
+            {"role": "user", "content": "Hello!"},
+            {"role": "assistant", "content": "Hello! How can I help you today?"},
+            {"role": "user", "content": "What is 13 * 24? Explain your answer."},
         ],
     )
     assert response is not None
@@ -124,10 +113,7 @@ async def test_chat_with_input_type(client: OpenAI, model_name: str):
         input=[
             {
                 "role": "user",
-                "content": [{
-                    "type": "input_text",
-                    "text": "What is 13*24?"
-                }],
+                "content": [{"type": "input_text", "text": "What is 13*24?"}],
             },
         ],
     )
@@ -141,14 +127,10 @@ async def test_structured_output(client: OpenAI, model_name: str):
     response = await client.responses.create(
         model=model_name,
         input=[
-            {
-                "role": "system",
-                "content": "Extract the event information."
-            },
+            {"role": "system", "content": "Extract the event information."},
             {
                 "role": "user",
-                "content":
-                "Alice and Bob are going to a science fair on Friday.",
+                "content": "Alice and Bob are going to a science fair on Friday.",
             },
         ],
         text={
@@ -158,18 +140,9 @@ async def test_structured_output(client: OpenAI, model_name: str):
                 "schema": {
                     "type": "object",
                     "properties": {
-                        "name": {
-                            "type": "string"
-                        },
-                        "date": {
-                            "type": "string"
-                        },
-                        "participants": {
-                            "type": "array",
-                            "items": {
-                                "type": "string"
-                            }
-                        },
+                        "name": {"type": "string"},
+                        "date": {"type": "string"},
+                        "participants": {"type": "array", "items": {"type": "string"}},
                     },
                     "required": ["name", "date", "participants"],
                     "additionalProperties": False,
@@ -319,11 +292,10 @@ async def test_streaming_types(client: OpenAI, model_name: str):
 
         stack_of_event_types = []
         async for event in response:
-            if event.type == 'response.created':
+            if event.type == "response.created":
                 stack_of_event_types.append(event.type)
-            elif event.type == 'response.completed':
-                assert stack_of_event_types[-1] == pairs_of_event_types[
-                    event.type]
+            elif event.type == "response.completed":
+                assert stack_of_event_types[-1] == pairs_of_event_types[event.type]
                 stack_of_event_types.pop()
             if event.type.endswith("added"):
                 stack_of_event_types.append(event.type)
@@ -332,8 +304,7 @@ async def test_streaming_types(client: OpenAI, model_name: str):
                     continue
                 stack_of_event_types.append(event.type)
             elif event.type.endswith("done"):
-                assert stack_of_event_types[-1] == pairs_of_event_types[
-                    event.type]
+                assert stack_of_event_types[-1] == pairs_of_event_types[event.type]
                 stack_of_event_types.pop()
         assert len(stack_of_event_types) == 0
 
@@ -381,11 +352,12 @@ async def test_streaming(client: OpenAI, model_name: str, background: bool):
 
             # test vllm custom types are in the response
             if event.type in [
-                    "response.completed", "response.in_progress",
-                    "response.created"
+                "response.completed",
+                "response.in_progress",
+                "response.created",
             ]:
-                assert 'input_messages' in event.response.model_extra
-                assert 'output_messages' in event.response.model_extra
+                assert "input_messages" in event.response.model_extra
+                assert "output_messages" in event.response.model_extra
 
             if current_event_mode != event.type:
                 current_event_mode = event.type
@@ -396,21 +368,21 @@ async def test_streaming(client: OpenAI, model_name: str, background: bool):
                 assert event.item.id != current_item_id
                 current_item_id = event.item.id
             elif event.type in [
-                    "response.output_text.delta",
-                    "response.reasoning_text.delta"
+                "response.output_text.delta",
+                "response.reasoning_text.delta",
             ]:
                 assert event.item_id == current_item_id
 
             # verify content_index_id is correct
             if event.type in [
-                    "response.content_part.added",
-                    "response.reasoning_part.added"
+                "response.content_part.added",
+                "response.reasoning_part.added",
             ]:
                 assert event.content_index != current_content_index
                 current_content_index = event.content_index
             elif event.type in [
-                    "response.output_text.delta",
-                    "response.reasoning_text.delta"
+                "response.output_text.delta",
+                "response.reasoning_text.delta",
             ]:
                 assert event.content_index == current_content_index
 
@@ -420,8 +392,10 @@ async def test_streaming(client: OpenAI, model_name: str, background: bool):
                 print(f"{event.delta}", end="", flush=True)
             elif "response.code_interpreter_call_code.done" in event.type:
                 print(f"Code: {event.code}", end="", flush=True)
-            elif ("response.output_item.added" in event.type
-                  and event.item.type == "web_search_call"):
+            elif (
+                "response.output_item.added" in event.type
+                and event.item.type == "web_search_call"
+            ):
                 print(f"Web search: {event.item.action}", end="", flush=True)
             events.append(event)
 
@@ -432,9 +406,8 @@ async def test_streaming(client: OpenAI, model_name: str, background: bool):
         if background:
             starting_after = 5
             async with await client.responses.retrieve(
-                    response_id=resp_id,
-                    stream=True,
-                    starting_after=starting_after) as stream:
+                response_id=resp_id, stream=True, starting_after=starting_after
+            ) as stream:
                 counter = starting_after
                 async for event in stream:
                     counter += 1
@@ -448,9 +421,7 @@ async def test_web_search(client: OpenAI, model_name: str):
     response = await client.responses.create(
         model=model_name,
         input="Who is the president of South Korea as of now?",
-        tools=[{
-            "type": "web_search_preview"
-        }],
+        tools=[{"type": "web_search_preview"}],
     )
     assert response is not None
     assert response.status == "completed"
@@ -465,16 +436,13 @@ async def test_code_interpreter(client: OpenAI, model_name: str):
         # TODO: Ideally should be able to set max tool calls
         # to prevent multi-turn, but it is not currently supported
         # would speed up the test
-        input=("What's the first 4 digits after the decimal point of "
-               "cube root of `19910212 * 20250910`? "
-               "Show only the digits. The python interpreter is not stateful "
-               "and you must print to see the output."),
-        tools=[{
-            "type": "code_interpreter",
-            "container": {
-                "type": "auto"
-            }
-        }],
+        input=(
+            "What's the first 4 digits after the decimal point of "
+            "cube root of `19910212 * 20250910`? "
+            "Show only the digits. The python interpreter is not stateful "
+            "and you must print to see the output."
+        ),
+        tools=[{"type": "code_interpreter", "container": {"type": "auto"}}],
     )
     assert response is not None
     assert response.status == "completed"
@@ -505,26 +473,23 @@ def call_function(name, args):
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 async def test_function_calling(client: OpenAI, model_name: str):
-    tools = [{
-        "type": "function",
-        "name": "get_weather",
-        "description":
-        "Get current temperature for provided coordinates in celsius.",  # noqa
-        "parameters": {
-            "type": "object",
-            "properties": {
-                "latitude": {
-                    "type": "number"
-                },
-                "longitude": {
-                    "type": "number"
+    tools = [
+        {
+            "type": "function",
+            "name": "get_weather",
+            "description": "Get current temperature for provided coordinates in celsius.",  # noqa
+            "parameters": {
+                "type": "object",
+                "properties": {
+                    "latitude": {"type": "number"},
+                    "longitude": {"type": "number"},
                 },
+                "required": ["latitude", "longitude"],
+                "additionalProperties": False,
             },
-            "required": ["latitude", "longitude"],
-            "additionalProperties": False,
-        },
-        "strict": True,
-    }]
+            "strict": True,
+        }
+    ]
 
     response = await client.responses.create(
         model=model_name,
@@ -547,11 +512,13 @@ async def test_function_calling(client: OpenAI, model_name: str):
 
     response_2 = await client.responses.create(
         model=model_name,
-        input=[{
-            "type": "function_call_output",
-            "call_id": tool_call.call_id,
-            "output": str(result),
-        }],
+        input=[
+            {
+                "type": "function_call_output",
+                "call_id": tool_call.call_id,
+                "output": str(result),
+            }
+        ],
         tools=tools,
         previous_response_id=response.id,
     )
@@ -591,17 +558,12 @@ async def test_function_calling_multi_turn(client: OpenAI, model_name: str):
         {
             "type": "function",
             "name": "get_weather",
-            "description":
-            "Get current temperature for provided coordinates in celsius.",  # noqa
+            "description": "Get current temperature for provided coordinates in celsius.",  # noqa
             "parameters": {
                 "type": "object",
                 "properties": {
-                    "latitude": {
-                        "type": "number"
-                    },
-                    "longitude": {
-                        "type": "number"
-                    },
+                    "latitude": {"type": "number"},
+                    "longitude": {"type": "number"},
                 },
                 "required": ["latitude", "longitude"],
                 "additionalProperties": False,
@@ -612,8 +574,7 @@ async def test_function_calling_multi_turn(client: OpenAI, model_name: str):
 
     response = await client.responses.create(
         model=model_name,
-        input=
-        "Help me plan a trip to a random place. And tell me the weather there.",
+        input="Help me plan a trip to a random place. And tell me the weather there.",
         tools=tools,
     )
     assert response is not None
@@ -630,11 +591,13 @@ async def test_function_calling_multi_turn(client: OpenAI, model_name: str):
 
     response_2 = await client.responses.create(
         model=model_name,
-        input=[{
-            "type": "function_call_output",
-            "call_id": tool_call.call_id,
-            "output": str(result),
-        }],
+        input=[
+            {
+                "type": "function_call_output",
+                "call_id": tool_call.call_id,
+                "output": str(result),
+            }
+        ],
         tools=tools,
         previous_response_id=response.id,
     )
@@ -652,11 +615,13 @@ async def test_function_calling_multi_turn(client: OpenAI, model_name: str):
 
     response_3 = await client.responses.create(
         model=model_name,
-        input=[{
-            "type": "function_call_output",
-            "call_id": tool_call.call_id,
-            "output": str(result),
-        }],
+        input=[
+            {
+                "type": "function_call_output",
+                "call_id": tool_call.call_id,
+                "output": str(result),
+            }
+        ],
         tools=tools,
         previous_response_id=response_2.id,
     )
@@ -668,26 +633,23 @@ async def test_function_calling_multi_turn(client: OpenAI, model_name: str):
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 async def test_function_calling_required(client: OpenAI, model_name: str):
-    tools = [{
-        "type": "function",
-        "name": "get_weather",
-        "description":
-        "Get current temperature for provided coordinates in celsius.",  # noqa
-        "parameters": {
-            "type": "object",
-            "properties": {
-                "latitude": {
-                    "type": "number"
-                },
-                "longitude": {
-                    "type": "number"
+    tools = [
+        {
+            "type": "function",
+            "name": "get_weather",
+            "description": "Get current temperature for provided coordinates in celsius.",  # noqa
+            "parameters": {
+                "type": "object",
+                "properties": {
+                    "latitude": {"type": "number"},
+                    "longitude": {"type": "number"},
                 },
+                "required": ["latitude", "longitude"],
+                "additionalProperties": False,
             },
-            "required": ["latitude", "longitude"],
-            "additionalProperties": False,
-        },
-        "strict": True,
-    }]
+            "strict": True,
+        }
+    ]
 
     with pytest.raises(BadRequestError):
         await client.responses.create(
@@ -717,31 +679,27 @@ async def test_system_message_with_tools(client: OpenAI, model_name: str):
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 async def test_function_calling_full_history(client: OpenAI, model_name: str):
-    tools = [{
-        "type": "function",
-        "name": "get_weather",
-        "description":
-        "Get current temperature for provided coordinates in celsius.",  # noqa
-        "parameters": {
-            "type": "object",
-            "properties": {
-                "latitude": {
-                    "type": "number"
-                },
-                "longitude": {
-                    "type": "number"
+    tools = [
+        {
+            "type": "function",
+            "name": "get_weather",
+            "description": "Get current temperature for provided coordinates in celsius.",  # noqa
+            "parameters": {
+                "type": "object",
+                "properties": {
+                    "latitude": {"type": "number"},
+                    "longitude": {"type": "number"},
                 },
+                "required": ["latitude", "longitude"],
+                "additionalProperties": False,
             },
-            "required": ["latitude", "longitude"],
-            "additionalProperties": False,
-        },
-        "strict": True,
-    }]
+            "strict": True,
+        }
+    ]
 
-    input_messages = [{
-        "role": "user",
-        "content": "What's the weather like in Paris today?"
-    }]
+    input_messages = [
+        {"role": "user", "content": "What's the weather like in Paris today?"}
+    ]
 
     response = await client.responses.create(
         model=model_name,
@@ -758,8 +716,7 @@ async def test_function_calling_full_history(client: OpenAI, model_name: str):
 
     result = call_function(name, args)
 
-    input_messages.extend(
-        response.output)  # append model's function call message
+    input_messages.extend(response.output)  # append model's function call message
     input_messages.append(
         {  # append result message
             "type": "function_call_output",
@@ -780,12 +737,12 @@ async def test_function_calling_full_history(client: OpenAI, model_name: str):
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
-async def test_output_messages_enabled(client: OpenAI, model_name: str,
-                                       server):
+async def test_output_messages_enabled(client: OpenAI, model_name: str, server):
     response = await client.responses.create(
         model=model_name,
         input="What is the capital of South Korea?",
-        extra_body={"enable_response_messages": True})
+        extra_body={"enable_response_messages": True},
+    )
 
     assert response is not None
     assert response.status == "completed"
diff --git a/tests/entrypoints/openai/test_return_token_ids.py b/tests/entrypoints/openai/test_return_token_ids.py
index ff8f193fec55..60a80210fb76 100644
--- a/tests/entrypoints/openai/test_return_token_ids.py
+++ b/tests/entrypoints/openai/test_return_token_ids.py
@@ -50,13 +50,16 @@ async def test_basic_completion_with_emoji(server):
         # Check against the expected prompt token IDs
         tokenizer = get_tokenizer(tokenizer_name=MODEL_NAME)
         encoded_tokens = tokenizer.encode(
-            "Complete this sentence with emojis: I love coding 🚀")
+            "Complete this sentence with emojis: I love coding 🚀"
+        )
         # Check that encoded_tokens is a subsequence of prompt_token_ids
-        assert any(completion.choices[0].prompt_token_ids[i:i +
-                                                          len(encoded_tokens)]
-                   == encoded_tokens for i in range(
-                       len(completion.choices[0].prompt_token_ids) -
-                       len(encoded_tokens) + 1))
+        assert any(
+            completion.choices[0].prompt_token_ids[i : i + len(encoded_tokens)]
+            == encoded_tokens
+            for i in range(
+                len(completion.choices[0].prompt_token_ids) - len(encoded_tokens) + 1
+            )
+        )
 
         # Verify token_ids field is present in the choice
         assert completion.choices[0].token_ids is not None
@@ -86,44 +89,38 @@ async def test_basic_completion_with_emoji(server):
 @pytest.mark.asyncio
 async def test_chat_completion_with_tool_use(server):
     """Test chat completion with tool use (get_weather function)."""
-    tools = [{
-        "type": "function",
-        "function": {
-            "name": "get_weather",
-            "description": "Get the current weather in a given location",
-            "parameters": {
-                "type": "object",
-                "properties": {
-                    "location": {
-                        "type":
-                        "string",
-                        "description":
-                        "The city and state, e.g. San Francisco, CA",
-                    },
-                    "unit": {
-                        "type": "string",
-                        "enum": ["celsius", "fahrenheit"],
-                        "description": "The unit of temperature",
+    tools = [
+        {
+            "type": "function",
+            "function": {
+                "name": "get_weather",
+                "description": "Get the current weather in a given location",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "location": {
+                            "type": "string",
+                            "description": "The city and state, e.g. San Francisco, CA",
+                        },
+                        "unit": {
+                            "type": "string",
+                            "enum": ["celsius", "fahrenheit"],
+                            "description": "The unit of temperature",
+                        },
                     },
+                    "required": ["location"],
                 },
-                "required": ["location"],
             },
-        },
-    }]
+        }
+    ]
 
     async with server.get_async_client() as client:
         # Test with return_token_ids enabled
         response = await client.chat.completions.create(
             model=MODEL_NAME,
             messages=[
-                {
-                    "role": "system",
-                    "content": "You are a helpful assistant."
-                },
-                {
-                    "role": "user",
-                    "content": "What's the weather like in Paris?"
-                },
+                {"role": "system", "content": "You are a helpful assistant."},
+                {"role": "user", "content": "What's the weather like in Paris?"},
             ],
             tools=tools,
             tool_choice="auto",
@@ -145,10 +142,11 @@ async def test_chat_completion_with_tool_use(server):
         tokenizer = get_tokenizer(tokenizer_name=MODEL_NAME)
         prompt_text = tokenizer.decode(response.prompt_token_ids)
         assert prompt_text.startswith(
-            "<|im_start|>system\nYou are a helpful assistant.")
+            "<|im_start|>system\nYou are a helpful assistant."
+        )
         assert prompt_text.endswith(
-            "What's the weather like in Paris?<|im_end|>\n"
-            "<|im_start|>assistant\n")
+            "What's the weather like in Paris?<|im_end|>\n<|im_start|>assistant\n"
+        )
 
         response_text = tokenizer.decode(response.choices[0].token_ids)
         assert response_text.startswith('<tool_call>\n{"name": "get_weather"')
@@ -164,14 +162,8 @@ async def test_chat_completion_with_tool_use(server):
         response_without = await client.chat.completions.create(
             model=MODEL_NAME,
             messages=[
-                {
-                    "role": "system",
-                    "content": "You are a helpful assistant."
-                },
-                {
-                    "role": "user",
-                    "content": "What's the weather like in Paris?"
-                },
+                {"role": "system", "content": "You are a helpful assistant."},
+                {"role": "user", "content": "What's the weather like in Paris?"},
             ],
             tools=tools,
             tool_choice="auto",
@@ -203,7 +195,7 @@ async def test_comparison_with_prompt_logprobs_and_logprobs(server):
             extra_body={
                 "return_token_ids": True,
                 "return_tokens_as_token_ids": True,
-                "prompt_logprobs": 1
+                "prompt_logprobs": 1,
             },
         )
 
@@ -228,16 +220,17 @@ async def test_comparison_with_prompt_logprobs_and_logprobs(server):
         # The prompt_token_ids should match the prompt portion
         assert len(completion.choices[0].token_ids) < len(logprobs_token_ids)
         response_token_ids_length = len(completion.choices[0].token_ids)
-        assert logprobs_token_ids[-response_token_ids_length:] == \
-            completion.choices[0].token_ids
+        assert (
+            logprobs_token_ids[-response_token_ids_length:]
+            == completion.choices[0].token_ids
+        )
 
         # Verify tokenizer consistency
         tokenizer = get_tokenizer(tokenizer_name=MODEL_NAME)
 
         # Decode prompt tokens
         if completion.choices[0].prompt_token_ids:
-            prompt_text = tokenizer.decode(
-                completion.choices[0].prompt_token_ids)
+            prompt_text = tokenizer.decode(completion.choices[0].prompt_token_ids)
             # The decoded prompt should match or close to original prompt
             assert "Hello, world" in prompt_text
 
@@ -255,10 +248,7 @@ async def test_comparison_with_prompt_logprobs_and_logprobs(server):
             stream=True,
             echo=False,
             logprobs=1,
-            extra_body={
-                "return_token_ids": True,
-                "return_tokens_as_token_ids": True
-            },
+            extra_body={"return_token_ids": True, "return_tokens_as_token_ids": True},
         )
 
         # Collect streamed tokens
@@ -287,14 +277,8 @@ async def test_comparison_with_prompt_logprobs_and_logprobs(server):
 async def test_chat_completion_with_emoji_and_token_ids(server):
     """Test chat completion with emojis to verify token_ids handling."""
     chat_messages = [
-        {
-            "role": "system",
-            "content": "You like to use emojis in your responses."
-        },
-        {
-            "role": "user",
-            "content": "Repeat after me: I love cats 🐱"
-        },
+        {"role": "system", "content": "You like to use emojis in your responses."},
+        {"role": "user", "content": "Repeat after me: I love cats 🐱"},
     ]
     async with server.get_async_client() as client:
         response = await client.chat.completions.create(
@@ -319,15 +303,16 @@ async def test_chat_completion_with_emoji_and_token_ids(server):
 
         decoded_prompt = tokenizer.decode(response.prompt_token_ids)
         assert decoded_prompt.startswith(
-            "<|im_start|>system\nYou like to use emojis in your responses.")
+            "<|im_start|>system\nYou like to use emojis in your responses."
+        )
         assert decoded_prompt.endswith(
-            "I love cats 🐱<|im_end|>\n<|im_start|>assistant\n")
+            "I love cats 🐱<|im_end|>\n<|im_start|>assistant\n"
+        )
 
         decoded_response = tokenizer.decode(response.choices[0].token_ids)
         # The content should match the response text
         # except the ending <|im_end|>
-        assert decoded_response == response.choices[
-            0].message.content + "<|im_end|>"
+        assert decoded_response == response.choices[0].message.content + "<|im_end|>"
 
         # Test with streaming
         stream = await client.chat.completions.create(
@@ -348,14 +333,14 @@ async def test_chat_completion_with_emoji_and_token_ids(server):
                 assert chunk.prompt_token_ids is not None
                 assert isinstance(chunk.prompt_token_ids, list)
                 # Check the prompt_token_ids match the initial prompt
-                decoded_prompt_stream = tokenizer.decode(
-                    chunk.prompt_token_ids)
+                decoded_prompt_stream = tokenizer.decode(chunk.prompt_token_ids)
                 assert decoded_prompt_stream == decoded_prompt
                 first_chunk = False
             else:
                 chunk_dump = chunk.model_dump()
-                assert "prompt_token_ids" not in chunk_dump, \
+                assert "prompt_token_ids" not in chunk_dump, (
                     "Subsequent chunks should not have prompt_token_ids"
+                )
 
             if chunk.choices:
                 if chunk.choices[0].delta.content:
diff --git a/tests/entrypoints/openai/test_return_tokens_as_ids.py b/tests/entrypoints/openai/test_return_tokens_as_ids.py
index ef9d5234f231..adbcc1f2430c 100644
--- a/tests/entrypoints/openai/test_return_tokens_as_ids.py
+++ b/tests/entrypoints/openai/test_return_tokens_as_ids.py
@@ -44,22 +44,19 @@ def server_fixture(request, default_server_args):  # noqa: F811
         with RemoteOpenAIServer(MODEL_NAME, args_with_flag) as remote_server:
             yield (remote_server, True)
     else:
-        with RemoteOpenAIServer(MODEL_NAME,
-                                default_server_args) as remote_server:
+        with RemoteOpenAIServer(MODEL_NAME, default_server_args) as remote_server:
             yield (remote_server, False)
 
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("server_fixture", [True, False], indirect=True)
-async def test_completion_return_tokens_as_token_ids_completion(
-        server_fixture):
+async def test_completion_return_tokens_as_token_ids_completion(server_fixture):
     server, use_server_flag = server_fixture
     request_args = {}
     if not use_server_flag:
         request_args["return_tokens_as_token_ids"] = True
 
     async with server.get_async_client() as client:
-
         completion = await client.completions.create(
             model=MODEL_NAME,
             # Include Unicode characters to test for dividing a single
@@ -70,7 +67,8 @@ async def test_completion_return_tokens_as_token_ids_completion(
             temperature=0,
             max_tokens=10,
             logprobs=1,
-            extra_body=request_args)
+            extra_body=request_args,
+        )
 
         text = completion.choices[0].text
         token_strs = completion.choices[0].logprobs.tokens
@@ -104,22 +102,22 @@ async def test_chat_return_tokens_as_token_ids_completion(server_fixture):
             # Include Unicode characters to test for dividing a single
             # character across multiple tokens: 🎉 is [28705, 31862] for the
             # Zephyr tokenizer
-            messages=[{
-                "role": "system",
-                "content": "You like to respond in only emojis, like 🎉"
-            }, {
-                "role": "user",
-                "content": "Please write some emojis: 🐱🐶🎉"
-            }],
+            messages=[
+                {
+                    "role": "system",
+                    "content": "You like to respond in only emojis, like 🎉",
+                },
+                {"role": "user", "content": "Please write some emojis: 🐱🐶🎉"},
+            ],
             temperature=0,
             max_tokens=8,
             logprobs=True,
-            extra_body=request_args)
+            extra_body=request_args,
+        )
 
         text = response.choices[0].message.content
         tokenizer = get_tokenizer(tokenizer_name=MODEL_NAME)
         token_ids = []
         for logprob_content in response.choices[0].logprobs.content:
-            token_ids.append(
-                int(logprob_content.token.removeprefix("token_id:")))
+            token_ids.append(int(logprob_content.token.removeprefix("token_id:")))
         assert tokenizer.decode(token_ids, skip_special_tokens=True) == text
diff --git a/tests/entrypoints/openai/test_root_path.py b/tests/entrypoints/openai/test_root_path.py
index 7b4966848b9d..6bcb80878f07 100644
--- a/tests/entrypoints/openai/test_root_path.py
+++ b/tests/entrypoints/openai/test_root_path.py
@@ -51,26 +51,31 @@ class TestCase(NamedTuple):
             model_name=MODEL_NAME,
             base_url=["v1"],  # http://localhost:8000/v1
             api_key=ERROR_API_KEY,
-            expected_error=openai.AuthenticationError),
+            expected_error=openai.AuthenticationError,
+        ),
         TestCase(
             model_name=MODEL_NAME,
             base_url=[ROOT_PATH, "v1"],  # http://localhost:8000/llm/v1
             api_key=ERROR_API_KEY,
-            expected_error=openai.AuthenticationError),
+            expected_error=openai.AuthenticationError,
+        ),
         TestCase(
             model_name=MODEL_NAME,
             base_url=["v1"],  # http://localhost:8000/v1
             api_key=API_KEY,
-            expected_error=None),
+            expected_error=None,
+        ),
         TestCase(
             model_name=MODEL_NAME,
             base_url=[ROOT_PATH, "v1"],  # http://localhost:8000/llm/v1
             api_key=API_KEY,
-            expected_error=None),
+            expected_error=None,
+        ),
     ],
 )
-async def test_chat_session_root_path_with_api_key(server: RemoteOpenAIServer,
-                                                   test_case: TestCase):
+async def test_chat_session_root_path_with_api_key(
+    server: RemoteOpenAIServer, test_case: TestCase
+):
     saying: str = "Here is a common saying about apple. An apple a day, keeps"
     ctx = contextlib.nullcontext()
     if test_case.expected_error is not None:
@@ -79,20 +84,16 @@ async def test_chat_session_root_path_with_api_key(server: RemoteOpenAIServer,
         client = openai.AsyncOpenAI(
             api_key=test_case.api_key,
             base_url=server.url_for(*test_case.base_url),
-            max_retries=0)
+            max_retries=0,
+        )
         chat_completion = await client.chat.completions.create(
             model=test_case.model_name,
-            messages=[{
-                "role": "user",
-                "content": "tell me a common saying"
-            }, {
-                "role": "assistant",
-                "content": saying
-            }],
-            extra_body={
-                "continue_final_message": True,
-                "add_generation_prompt": False
-            })
+            messages=[
+                {"role": "user", "content": "tell me a common saying"},
+                {"role": "assistant", "content": saying},
+            ],
+            extra_body={"continue_final_message": True, "add_generation_prompt": False},
+        )
 
         assert chat_completion.id is not None
         assert len(chat_completion.choices) == 1
diff --git a/tests/entrypoints/openai/test_run_batch.py b/tests/entrypoints/openai/test_run_batch.py
index e23f41e983b0..d31dadf90679 100644
--- a/tests/entrypoints/openai/test_run_batch.py
+++ b/tests/entrypoints/openai/test_run_batch.py
@@ -35,15 +35,24 @@
 
 
 def test_empty_file():
-    with tempfile.NamedTemporaryFile(
-            "w") as input_file, tempfile.NamedTemporaryFile(
-                "r") as output_file:
+    with (
+        tempfile.NamedTemporaryFile("w") as input_file,
+        tempfile.NamedTemporaryFile("r") as output_file,
+    ):
         input_file.write("")
         input_file.flush()
-        proc = subprocess.Popen([
-            "vllm", "run-batch", "-i", input_file.name, "-o", output_file.name,
-            "--model", "intfloat/multilingual-e5-small"
-        ], )
+        proc = subprocess.Popen(
+            [
+                "vllm",
+                "run-batch",
+                "-i",
+                input_file.name,
+                "-o",
+                output_file.name,
+                "--model",
+                "intfloat/multilingual-e5-small",
+            ],
+        )
         proc.communicate()
         proc.wait()
         assert proc.returncode == 0, f"{proc=}"
@@ -53,15 +62,24 @@ def test_empty_file():
 
 
 def test_completions():
-    with tempfile.NamedTemporaryFile(
-            "w") as input_file, tempfile.NamedTemporaryFile(
-                "r") as output_file:
+    with (
+        tempfile.NamedTemporaryFile("w") as input_file,
+        tempfile.NamedTemporaryFile("r") as output_file,
+    ):
         input_file.write(INPUT_BATCH)
         input_file.flush()
-        proc = subprocess.Popen([
-            "vllm", "run-batch", "-i", input_file.name, "-o", output_file.name,
-            "--model", "NousResearch/Meta-Llama-3-8B-Instruct"
-        ], )
+        proc = subprocess.Popen(
+            [
+                "vllm",
+                "run-batch",
+                "-i",
+                input_file.name,
+                "-o",
+                output_file.name,
+                "--model",
+                "NousResearch/Meta-Llama-3-8B-Instruct",
+            ],
+        )
         proc.communicate()
         proc.wait()
         assert proc.returncode == 0, f"{proc=}"
@@ -77,30 +95,48 @@ def test_completions_invalid_input():
     """
     Ensure that we fail when the input doesn't conform to the openai api.
     """
-    with tempfile.NamedTemporaryFile(
-            "w") as input_file, tempfile.NamedTemporaryFile(
-                "r") as output_file:
+    with (
+        tempfile.NamedTemporaryFile("w") as input_file,
+        tempfile.NamedTemporaryFile("r") as output_file,
+    ):
         input_file.write(INVALID_INPUT_BATCH)
         input_file.flush()
-        proc = subprocess.Popen([
-            "vllm", "run-batch", "-i", input_file.name, "-o", output_file.name,
-            "--model", "NousResearch/Meta-Llama-3-8B-Instruct"
-        ], )
+        proc = subprocess.Popen(
+            [
+                "vllm",
+                "run-batch",
+                "-i",
+                input_file.name,
+                "-o",
+                output_file.name,
+                "--model",
+                "NousResearch/Meta-Llama-3-8B-Instruct",
+            ],
+        )
         proc.communicate()
         proc.wait()
         assert proc.returncode != 0, f"{proc=}"
 
 
 def test_embeddings():
-    with tempfile.NamedTemporaryFile(
-            "w") as input_file, tempfile.NamedTemporaryFile(
-                "r") as output_file:
+    with (
+        tempfile.NamedTemporaryFile("w") as input_file,
+        tempfile.NamedTemporaryFile("r") as output_file,
+    ):
         input_file.write(INPUT_EMBEDDING_BATCH)
         input_file.flush()
-        proc = subprocess.Popen([
-            "vllm", "run-batch", "-i", input_file.name, "-o", output_file.name,
-            "--model", "intfloat/multilingual-e5-small"
-        ], )
+        proc = subprocess.Popen(
+            [
+                "vllm",
+                "run-batch",
+                "-i",
+                input_file.name,
+                "-o",
+                output_file.name,
+                "--model",
+                "intfloat/multilingual-e5-small",
+            ],
+        )
         proc.communicate()
         proc.wait()
         assert proc.returncode == 0, f"{proc=}"
@@ -112,24 +148,26 @@ def test_embeddings():
             BatchRequestOutput.model_validate_json(line)
 
 
-@pytest.mark.parametrize("input_batch",
-                         [INPUT_SCORE_BATCH, INPUT_RERANK_BATCH])
+@pytest.mark.parametrize("input_batch", [INPUT_SCORE_BATCH, INPUT_RERANK_BATCH])
 def test_score(input_batch):
-    with tempfile.NamedTemporaryFile(
-            "w") as input_file, tempfile.NamedTemporaryFile(
-                "r") as output_file:
+    with (
+        tempfile.NamedTemporaryFile("w") as input_file,
+        tempfile.NamedTemporaryFile("r") as output_file,
+    ):
         input_file.write(input_batch)
         input_file.flush()
-        proc = subprocess.Popen([
-            "vllm",
-            "run-batch",
-            "-i",
-            input_file.name,
-            "-o",
-            output_file.name,
-            "--model",
-            "BAAI/bge-reranker-v2-m3",
-        ], )
+        proc = subprocess.Popen(
+            [
+                "vllm",
+                "run-batch",
+                "-i",
+                input_file.name,
+                "-o",
+                output_file.name,
+                "--model",
+                "BAAI/bge-reranker-v2-m3",
+            ],
+        )
         proc.communicate()
         proc.wait()
         assert proc.returncode == 0, f"{proc=}"
diff --git a/tests/entrypoints/openai/test_serving_chat.py b/tests/entrypoints/openai/test_serving_chat.py
index 81683854e177..a52b9a436f6d 100644
--- a/tests/entrypoints/openai/test_serving_chat.py
+++ b/tests/entrypoints/openai/test_serving_chat.py
@@ -15,8 +15,7 @@
 from vllm.config.multimodal import MultiModalConfig
 from vllm.entrypoints.openai.protocol import ChatCompletionRequest
 from vllm.entrypoints.openai.serving_chat import OpenAIServingChat
-from vllm.entrypoints.openai.serving_models import (BaseModelPath,
-                                                    OpenAIServingModels)
+from vllm.entrypoints.openai.serving_models import BaseModelPath, OpenAIServingModels
 from vllm.transformers_utils.tokenizer import get_tokenizer
 from vllm.v1.engine.async_llm import AsyncLLM
 
@@ -31,14 +30,17 @@
 @pytest.fixture(scope="module")
 def monkeypatch_module():
     from _pytest.monkeypatch import MonkeyPatch
+
     mpatch = MonkeyPatch()
     yield mpatch
     mpatch.undo()
 
 
-@pytest.fixture(scope="module",
-                params=[True, False],
-                ids=["with_tool_parser", "without_tool_parser"])
+@pytest.fixture(
+    scope="module",
+    params=[True, False],
+    ids=["with_tool_parser", "without_tool_parser"],
+)
 def with_tool_parser(request) -> bool:
     return request.param
 
@@ -56,21 +58,25 @@ def default_server_args(with_tool_parser: bool):
         "0.8",
     ]
     if with_tool_parser:
-        args.extend([
-            "--tool-call-parser",
-            "openai",
-            "--enable-auto-tool-choice",
-        ])
+        args.extend(
+            [
+                "--tool-call-parser",
+                "openai",
+                "--enable-auto-tool-choice",
+            ]
+        )
     return args
 
 
 @pytest.fixture(scope="module")
-def gptoss_server(monkeypatch_module: pytest.MonkeyPatch,
-                  default_server_args: list[str]):
+def gptoss_server(
+    monkeypatch_module: pytest.MonkeyPatch, default_server_args: list[str]
+):
     with monkeypatch_module.context() as m:
         m.setenv("VLLM_ATTENTION_BACKEND", "TRITON_ATTN")
-        with RemoteOpenAIServer(GPT_OSS_MODEL_NAME,
-                                default_server_args) as remote_server:
+        with RemoteOpenAIServer(
+            GPT_OSS_MODEL_NAME, default_server_args
+        ) as remote_server:
             yield remote_server
 
 
@@ -81,44 +87,41 @@ async def gptoss_client(gptoss_server):
 
 
 @pytest.mark.asyncio
-async def test_gpt_oss_chat_tool_call_streaming(gptoss_client: OpenAI,
-                                                with_tool_parser: bool):
-    tools = [{
-        "type": "function",
-        "function": {
-            "name": "get_current_weather",
-            "description": "Get the current weather in a given location",
-            "parameters": {
-                "type": "object",
-                "properties": {
-                    "city": {
-                        "type": "string"
-                    },
-                    "state": {
-                        "type": "string"
-                    },
-                    "unit": {
-                        "type": "string",
-                        "enum": ["celsius", "fahrenheit"],
+async def test_gpt_oss_chat_tool_call_streaming(
+    gptoss_client: OpenAI, with_tool_parser: bool
+):
+    tools = [
+        {
+            "type": "function",
+            "function": {
+                "name": "get_current_weather",
+                "description": "Get the current weather in a given location",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "city": {"type": "string"},
+                        "state": {"type": "string"},
+                        "unit": {
+                            "type": "string",
+                            "enum": ["celsius", "fahrenheit"],
+                        },
                     },
+                    "required": ["city", "state", "unit"],
                 },
-                "required": ["city", "state", "unit"],
             },
-        },
-    }]
+        }
+    ]
 
     messages = [
-        {
-            "role": "user",
-            "content": "What is the weather in Dallas, TX?"
-        },
+        {"role": "user", "content": "What is the weather in Dallas, TX?"},
     ]
 
     stream = await gptoss_client.chat.completions.create(
         model=GPT_OSS_MODEL_NAME,
         messages=messages,
         tools=tools if with_tool_parser else None,
-        stream=True)
+        stream=True,
+    )
 
     name = None
     args_buf = ""
@@ -143,43 +146,34 @@ async def test_gpt_oss_chat_tool_call_streaming(gptoss_client: OpenAI,
 
 
 @pytest.mark.asyncio
-async def test_gpt_oss_multi_turn_chat(gptoss_client: OpenAI,
-                                       with_tool_parser: bool):
+async def test_gpt_oss_multi_turn_chat(gptoss_client: OpenAI, with_tool_parser: bool):
     if not with_tool_parser:
         pytest.skip("skip non-tool for multi-turn tests")
-    tools = [{
-        "type": "function",
-        "function": {
-            "name": "get_current_weather",
-            "description": "Get the current weather in a given location",
-            "parameters": {
-                "type": "object",
-                "properties": {
-                    "city": {
-                        "type": "string"
-                    },
-                    "state": {
-                        "type": "string"
-                    },
-                    "unit": {
-                        "type": "string",
-                        "enum": ["celsius", "fahrenheit"],
+    tools = [
+        {
+            "type": "function",
+            "function": {
+                "name": "get_current_weather",
+                "description": "Get the current weather in a given location",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "city": {"type": "string"},
+                        "state": {"type": "string"},
+                        "unit": {
+                            "type": "string",
+                            "enum": ["celsius", "fahrenheit"],
+                        },
                     },
+                    "required": ["city", "state", "unit"],
                 },
-                "required": ["city", "state", "unit"],
             },
-        },
-    }]
+        }
+    ]
 
     messages = [
-        {
-            "role": "system",
-            "content": "you are a helpful assistant"
-        },
-        {
-            "role": "user",
-            "content": "What is the weather in Dallas, TX with celsius?"
-        },
+        {"role": "system", "content": "you are a helpful assistant"},
+        {"role": "user", "content": "What is the weather in Dallas, TX with celsius?"},
     ]
 
     first = await gptoss_client.chat.completions.create(
@@ -197,10 +191,9 @@ async def test_gpt_oss_multi_turn_chat(gptoss_client: OpenAI,
     assert not first_msg.content
 
     messages.append({"role": "assistant", "content": args1})
-    messages.append({
-        "role": "user",
-        "content": "Now convert to celsius and return JSON only"
-    })
+    messages.append(
+        {"role": "user", "content": "Now convert to celsius and return JSON only"}
+    )
 
     second = await gptoss_client.chat.completions.create(
         model=GPT_OSS_MODEL_NAME,
@@ -209,8 +202,9 @@ async def test_gpt_oss_multi_turn_chat(gptoss_client: OpenAI,
         temperature=0.0,
     )
     second_msg = second.choices[0].message
-    assert (second_msg.content is not None and len(second_msg.content) > 0) or \
-        (second_msg.tool_calls is not None and len(second_msg.tool_calls) > 0)
+    assert (second_msg.content is not None and len(second_msg.content) > 0) or (
+        second_msg.tool_calls is not None and len(second_msg.tool_calls) > 0
+    )
 
 
 MODEL_NAME = "openai-community/gpt2"
@@ -218,7 +212,7 @@ async def test_gpt_oss_multi_turn_chat(gptoss_client: OpenAI,
 CHAT_TEMPLATE = "Dummy chat template for testing {}"
 BASE_MODEL_PATHS = [
     BaseModelPath(name=MODEL_NAME, model_path=MODEL_NAME),
-    BaseModelPath(name=MODEL_NAME_SHORT, model_path=MODEL_NAME_SHORT)
+    BaseModelPath(name=MODEL_NAME_SHORT, model_path=MODEL_NAME_SHORT),
 ]
 
 
@@ -251,21 +245,33 @@ def get_diff_sampling_param(self):
         return self.diff_sampling_param or {}
 
 
-def _build_serving_chat(engine: AsyncLLM,
-                        model_config: MockModelConfig) -> OpenAIServingChat:
-    models = OpenAIServingModels(engine_client=engine,
-                                 base_model_paths=BASE_MODEL_PATHS,
-                                 model_config=model_config)
-    serving_chat = OpenAIServingChat(engine,
-                                     model_config,
-                                     models,
-                                     response_role="assistant",
-                                     chat_template=CHAT_TEMPLATE,
-                                     chat_template_content_format="auto",
-                                     request_logger=None)
-
-    async def _fake_process_inputs(request_id, engine_prompt, sampling_params,
-                                   *, lora_request, trace_headers, priority):
+def _build_serving_chat(
+    engine: AsyncLLM, model_config: MockModelConfig
+) -> OpenAIServingChat:
+    models = OpenAIServingModels(
+        engine_client=engine,
+        base_model_paths=BASE_MODEL_PATHS,
+        model_config=model_config,
+    )
+    serving_chat = OpenAIServingChat(
+        engine,
+        model_config,
+        models,
+        response_role="assistant",
+        chat_template=CHAT_TEMPLATE,
+        chat_template_content_format="auto",
+        request_logger=None,
+    )
+
+    async def _fake_process_inputs(
+        request_id,
+        engine_prompt,
+        sampling_params,
+        *,
+        lora_request,
+        trace_headers,
+        priority,
+    ):
         return dict(engine_prompt), {}
 
     serving_chat._process_inputs = AsyncMock(side_effect=_fake_process_inputs)
@@ -274,7 +280,6 @@ async def _fake_process_inputs(request_id, engine_prompt, sampling_params,
 
 @dataclass
 class MockEngine:
-
     async def get_model_config(self):
         return MockModelConfig()
 
@@ -284,13 +289,15 @@ async def _async_serving_chat_init():
     model_config = await engine.get_model_config()
 
     models = OpenAIServingModels(engine, model_config, BASE_MODEL_PATHS)
-    serving_completion = OpenAIServingChat(engine,
-                                           model_config,
-                                           models,
-                                           response_role="assistant",
-                                           chat_template=CHAT_TEMPLATE,
-                                           chat_template_content_format="auto",
-                                           request_logger=None)
+    serving_completion = OpenAIServingChat(
+        engine,
+        model_config,
+        models,
+        response_role="assistant",
+        chat_template=CHAT_TEMPLATE,
+        chat_template_content_format="auto",
+        request_logger=None,
+    )
     return serving_completion
 
 
@@ -336,10 +343,7 @@ async def test_serving_chat_should_set_correct_max_tokens():
 
     req = ChatCompletionRequest(
         model=MODEL_NAME,
-        messages=[{
-            "role": "user",
-            "content": "what is 1+1?"
-        }],
+        messages=[{"role": "user", "content": "what is 1+1?"}],
     )
 
     with suppress(Exception):
@@ -371,10 +375,7 @@ async def test_serving_chat_should_set_correct_max_tokens():
     # Test Case 1: No max_tokens specified in request
     req = ChatCompletionRequest(
         model=MODEL_NAME,
-        messages=[{
-            "role": "user",
-            "content": "what is 1+1?"
-        }],
+        messages=[{"role": "user", "content": "what is 1+1?"}],
     )
 
     with suppress(Exception):
@@ -416,10 +417,7 @@ async def test_serving_chat_should_set_correct_max_tokens():
     # Test case 1: No max_tokens specified, defaults to context_window
     req = ChatCompletionRequest(
         model=MODEL_NAME,
-        messages=[{
-            "role": "user",
-            "content": "what is 1+1?"
-        }],
+        messages=[{"role": "user", "content": "what is 1+1?"}],
     )
 
     with suppress(Exception):
@@ -446,11 +444,10 @@ async def test_serving_chat_should_set_correct_max_tokens():
 
 @pytest.mark.asyncio
 async def test_serving_chat_could_load_correct_generation_config():
-
     mock_model_config = MockModelConfig()
     mock_model_config.diff_sampling_param = {
         "temperature": 0.5,
-        "repetition_penalty": 1.05
+        "repetition_penalty": 1.05,
     }
 
     mock_engine = MagicMock(spec=AsyncLLM)
@@ -462,10 +459,7 @@ async def test_serving_chat_could_load_correct_generation_config():
 
     req = ChatCompletionRequest(
         model=MODEL_NAME,
-        messages=[{
-            "role": "user",
-            "content": "what is 1+1?"
-        }],
+        messages=[{"role": "user", "content": "what is 1+1?"}],
     )
 
     with suppress(Exception):
@@ -508,10 +502,7 @@ async def test_serving_chat_did_set_correct_cache_salt(model_type):
     # Test cache_salt
     req = ChatCompletionRequest(
         model=MODEL_NAME,
-        messages=[{
-            "role": "user",
-            "content": "what is 1+1?"
-        }],
+        messages=[{"role": "user", "content": "what is 1+1?"}],
     )
 
     # By default, cache_salt in the engine prompt is not set
diff --git a/tests/entrypoints/openai/test_serving_engine.py b/tests/entrypoints/openai/test_serving_engine.py
index ba6f10891159..0c52270c13af 100644
--- a/tests/entrypoints/openai/test_serving_engine.py
+++ b/tests/entrypoints/openai/test_serving_engine.py
@@ -34,7 +34,8 @@ def serving() -> OpenAIServing:
 
 @pytest.mark.asyncio
 async def test_async_mistral_tokenizer_does_not_block_event_loop(
-        serving: OpenAIServing):
+    serving: OpenAIServing,
+):
     expected_tokens = [1, 2, 3]
 
     # Mock the blocking version to sleep
@@ -45,10 +46,9 @@ def mocked_apply_chat_template(*_args, **_kwargs):
     mock_tokenizer = Mock(spec=MistralTokenizer)
     mock_tokenizer.apply_chat_template.side_effect = mocked_apply_chat_template
 
-    task = serving._apply_mistral_chat_template_async(tokenizer=mock_tokenizer,
-                                                      messages=[],
-                                                      chat_template=None,
-                                                      tools=[])
+    task = serving._apply_mistral_chat_template_async(
+        tokenizer=mock_tokenizer, messages=[], chat_template=None, tools=[]
+    )
 
     # Ensure the event loop is not blocked
     blocked_count = 0
@@ -66,4 +66,4 @@ def mocked_apply_chat_template(*_args, **_kwargs):
     # Ensure task completes
     tokens = await task
     assert tokens == expected_tokens, "Mocked blocking tokenizer was not called"
-    assert blocked_count == 0, ("Event loop blocked during tokenization")
+    assert blocked_count == 0, "Event loop blocked during tokenization"
diff --git a/tests/entrypoints/openai/test_serving_models.py b/tests/entrypoints/openai/test_serving_models.py
index bc6a0341f59f..ed9dedcc6f08 100644
--- a/tests/entrypoints/openai/test_serving_models.py
+++ b/tests/entrypoints/openai/test_serving_models.py
@@ -8,19 +8,20 @@
 
 from vllm.config import ModelConfig
 from vllm.engine.protocol import EngineClient
-from vllm.entrypoints.openai.protocol import (ErrorResponse,
-                                              LoadLoRAAdapterRequest,
-                                              UnloadLoRAAdapterRequest)
-from vllm.entrypoints.openai.serving_models import (BaseModelPath,
-                                                    OpenAIServingModels)
+from vllm.entrypoints.openai.protocol import (
+    ErrorResponse,
+    LoadLoRAAdapterRequest,
+    UnloadLoRAAdapterRequest,
+)
+from vllm.entrypoints.openai.serving_models import BaseModelPath, OpenAIServingModels
 from vllm.lora.request import LoRARequest
 
 MODEL_NAME = "meta-llama/Llama-3.2-1B-Instruct"
 BASE_MODEL_PATHS = [BaseModelPath(name=MODEL_NAME, model_path=MODEL_NAME)]
-LORA_LOADING_SUCCESS_MESSAGE = (
-    "Success: LoRA adapter '{lora_name}' added successfully.")
+LORA_LOADING_SUCCESS_MESSAGE = "Success: LoRA adapter '{lora_name}' added successfully."
 LORA_UNLOADING_SUCCESS_MESSAGE = (
-    "Success: LoRA adapter '{lora_name}' removed successfully.")
+    "Success: LoRA adapter '{lora_name}' removed successfully."
+)
 
 
 async def _async_serving_models_init() -> OpenAIServingModels:
@@ -29,10 +30,12 @@ async def _async_serving_models_init() -> OpenAIServingModels:
     # Set the max_model_len attribute to avoid missing attribute
     mock_model_config.max_model_len = 2048
 
-    serving_models = OpenAIServingModels(engine_client=mock_engine_client,
-                                         base_model_paths=BASE_MODEL_PATHS,
-                                         model_config=mock_model_config,
-                                         lora_modules=None)
+    serving_models = OpenAIServingModels(
+        engine_client=mock_engine_client,
+        base_model_paths=BASE_MODEL_PATHS,
+        model_config=mock_model_config,
+        lora_modules=None,
+    )
     await serving_models.init_static_loras()
 
     return serving_models
@@ -42,19 +45,18 @@ async def _async_serving_models_init() -> OpenAIServingModels:
 async def test_serving_model_name():
     serving_models = await _async_serving_models_init()
     assert serving_models.model_name(None) == MODEL_NAME
-    request = LoRARequest(lora_name="adapter",
-                          lora_path="/path/to/adapter2",
-                          lora_int_id=1)
+    request = LoRARequest(
+        lora_name="adapter", lora_path="/path/to/adapter2", lora_int_id=1
+    )
     assert serving_models.model_name(request) == request.lora_name
 
 
 @pytest.mark.asyncio
 async def test_load_lora_adapter_success():
     serving_models = await _async_serving_models_init()
-    request = LoadLoRAAdapterRequest(lora_name="adapter",
-                                     lora_path="/path/to/adapter2")
+    request = LoadLoRAAdapterRequest(lora_name="adapter", lora_path="/path/to/adapter2")
     response = await serving_models.load_lora_adapter(request)
-    assert response == LORA_LOADING_SUCCESS_MESSAGE.format(lora_name='adapter')
+    assert response == LORA_LOADING_SUCCESS_MESSAGE.format(lora_name="adapter")
     assert len(serving_models.lora_requests) == 1
     assert "adapter" in serving_models.lora_requests
     assert serving_models.lora_requests["adapter"].lora_name == "adapter"
@@ -73,15 +75,16 @@ async def test_load_lora_adapter_missing_fields():
 @pytest.mark.asyncio
 async def test_load_lora_adapter_duplicate():
     serving_models = await _async_serving_models_init()
-    request = LoadLoRAAdapterRequest(lora_name="adapter1",
-                                     lora_path="/path/to/adapter1")
+    request = LoadLoRAAdapterRequest(
+        lora_name="adapter1", lora_path="/path/to/adapter1"
+    )
     response = await serving_models.load_lora_adapter(request)
-    assert response == LORA_LOADING_SUCCESS_MESSAGE.format(
-        lora_name='adapter1')
+    assert response == LORA_LOADING_SUCCESS_MESSAGE.format(lora_name="adapter1")
     assert len(serving_models.lora_requests) == 1
 
-    request = LoadLoRAAdapterRequest(lora_name="adapter1",
-                                     lora_path="/path/to/adapter1")
+    request = LoadLoRAAdapterRequest(
+        lora_name="adapter1", lora_path="/path/to/adapter1"
+    )
     response = await serving_models.load_lora_adapter(request)
     assert isinstance(response, ErrorResponse)
     assert response.error.type == "InvalidUserInput"
@@ -92,15 +95,15 @@ async def test_load_lora_adapter_duplicate():
 @pytest.mark.asyncio
 async def test_unload_lora_adapter_success():
     serving_models = await _async_serving_models_init()
-    request = LoadLoRAAdapterRequest(lora_name="adapter1",
-                                     lora_path="/path/to/adapter1")
+    request = LoadLoRAAdapterRequest(
+        lora_name="adapter1", lora_path="/path/to/adapter1"
+    )
     response = await serving_models.load_lora_adapter(request)
     assert len(serving_models.lora_requests) == 1
 
     request = UnloadLoRAAdapterRequest(lora_name="adapter1")
     response = await serving_models.unload_lora_adapter(request)
-    assert response == LORA_UNLOADING_SUCCESS_MESSAGE.format(
-        lora_name='adapter1')
+    assert response == LORA_UNLOADING_SUCCESS_MESSAGE.format(lora_name="adapter1")
     assert len(serving_models.lora_requests) == 0
 
 
diff --git a/tests/entrypoints/openai/test_serving_responses.py b/tests/entrypoints/openai/test_serving_responses.py
index 58d92f72dfae..cd7bb06ad320 100644
--- a/tests/entrypoints/openai/test_serving_responses.py
+++ b/tests/entrypoints/openai/test_serving_responses.py
@@ -34,11 +34,9 @@ def need_builtin_tool_call(self) -> bool:
     def render_for_completion(self):
         return []
 
-    async def init_tool_sessions(self, tool_server, exit_stack, request_id,
-                                 mcp_tools):
+    async def init_tool_sessions(self, tool_server, exit_stack, request_id, mcp_tools):
         self.init_tool_sessions_called = True
-        self.init_tool_sessions_args = (tool_server, exit_stack, request_id,
-                                        mcp_tools)
+        self.init_tool_sessions_args = (tool_server, exit_stack, request_id, mcp_tools)
 
     async def cleanup_session(self) -> None:
         pass
@@ -96,35 +94,31 @@ async def serving_responses_instance(self):
         return instance
 
     @pytest.mark.asyncio
-    async def test_initialize_tool_sessions(self, serving_responses_instance,
-                                            mock_context, mock_exit_stack):
+    async def test_initialize_tool_sessions(
+        self, serving_responses_instance, mock_context, mock_exit_stack
+    ):
         """Test that method works correctly with only MCP tools"""
 
         request = ResponsesRequest(input="test input", tools=[])
 
         # Call the method
         await serving_responses_instance._initialize_tool_sessions(
-            request, mock_context, mock_exit_stack)
+            request, mock_context, mock_exit_stack
+        )
         assert mock_context.init_tool_sessions_called is False
 
         # Create only MCP tools
         tools = [
-            {
-                "type": "web_search_preview"
-            },
-            {
-                "type": "code_interpreter",
-                "container": {
-                    "type": "auto"
-                }
-            },
+            {"type": "web_search_preview"},
+            {"type": "code_interpreter", "container": {"type": "auto"}},
         ]
 
         request = ResponsesRequest(input="test input", tools=tools)
 
         # Call the method
         await serving_responses_instance._initialize_tool_sessions(
-            request, mock_context, mock_exit_stack)
+            request, mock_context, mock_exit_stack
+        )
 
         # Verify that init_tool_sessions was called
         assert mock_context.init_tool_sessions_called
@@ -165,25 +159,20 @@ def test_validate_generator_input(self, serving_responses_instance):
         """Test _validate_generator_input with valid prompt length"""
         # Create an engine prompt with valid length (less than max_model_len)
         valid_prompt_token_ids = list(range(5))  # 5 tokens < 100 max_model_len
-        engine_prompt = EngineTokensPrompt(
-            prompt_token_ids=valid_prompt_token_ids)
+        engine_prompt = EngineTokensPrompt(prompt_token_ids=valid_prompt_token_ids)
 
         # Call the method
-        result = serving_responses_instance._validate_generator_input(
-            engine_prompt)
+        result = serving_responses_instance._validate_generator_input(engine_prompt)
 
         # Should return None for valid input
         assert result is None
 
         # create an invalid engine prompt
-        invalid_prompt_token_ids = list(
-            range(200))  # 100 tokens >= 100 max_model_len
-        engine_prompt = EngineTokensPrompt(
-            prompt_token_ids=invalid_prompt_token_ids)
+        invalid_prompt_token_ids = list(range(200))  # 100 tokens >= 100 max_model_len
+        engine_prompt = EngineTokensPrompt(prompt_token_ids=invalid_prompt_token_ids)
 
         # Call the method
-        result = serving_responses_instance._validate_generator_input(
-            engine_prompt)
+        result = serving_responses_instance._validate_generator_input(engine_prompt)
 
         # Should return an ErrorResponse
         assert result is not None
diff --git a/tests/entrypoints/openai/test_shutdown.py b/tests/entrypoints/openai/test_shutdown.py
index 29a94c852bba..ff46df81d0ff 100644
--- a/tests/entrypoints/openai/test_shutdown.py
+++ b/tests/entrypoints/openai/test_shutdown.py
@@ -24,16 +24,13 @@ async def test_shutdown_on_engine_failure():
 
     with RemoteOpenAIServer(MODEL_NAME, args) as remote_server:
         async with remote_server.get_async_client() as client:
-
-            with pytest.raises(
-                (openai.APIConnectionError, openai.InternalServerError)):
+            with pytest.raises((openai.APIConnectionError, openai.InternalServerError)):
                 # Asking for lots of prompt logprobs will currently crash the
                 # engine. This may change in the future when that bug is fixed
                 prompt = "Hello " * 4000
                 await client.completions.create(
-                    model=MODEL_NAME,
-                    prompt=prompt,
-                    extra_body={"prompt_logprobs": 10})
+                    model=MODEL_NAME, prompt=prompt, extra_body={"prompt_logprobs": 10}
+                )
 
             # Now the server should shut down
             return_code = remote_server.proc.wait(timeout=8)
diff --git a/tests/entrypoints/openai/test_skip_tokenizer.py b/tests/entrypoints/openai/test_skip_tokenizer.py
index b469fc76fc7a..6998566c03d0 100644
--- a/tests/entrypoints/openai/test_skip_tokenizer.py
+++ b/tests/entrypoints/openai/test_skip_tokenizer.py
@@ -29,7 +29,7 @@ def server():
         "--max-num-seqs",
         "32",
         "--model-impl",
-        "terratorch"
+        "terratorch",
     ]
 
     with RemoteOpenAIServer(MODEL_NAME, args) as remote_server:
@@ -39,7 +39,6 @@ def server():
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 async def test_single_request(server: RemoteOpenAIServer, model_name: str):
-
     pixel_values = torch.full((6, 512, 512), 1.0, dtype=torch.float16)
     location_coords = torch.full((1, 2), 1.0, dtype=torch.float16)
 
@@ -47,40 +46,39 @@ async def test_single_request(server: RemoteOpenAIServer, model_name: str):
     torch.save(pixel_values, buffer_tiff)
     buffer_tiff.seek(0)
     binary_data = buffer_tiff.read()
-    base64_tensor_embedding = base64.b64encode(binary_data).decode('utf-8')
+    base64_tensor_embedding = base64.b64encode(binary_data).decode("utf-8")
 
     buffer_coord = io.BytesIO()
     torch.save(location_coords, buffer_coord)
     buffer_coord.seek(0)
     binary_data = buffer_coord.read()
-    base64_coord_embedding = base64.b64encode(binary_data).decode('utf-8')
+    base64_coord_embedding = base64.b64encode(binary_data).decode("utf-8")
 
     prompt = {
-        "model":
-        model_name,
-        "additional_data": {
-            "prompt_token_ids": [1]
-        },
-        "encoding_format":
-        "base64",
-        "messages": [{
-            "role":
-            "user",
-            "content": [{
-                "type": "image_embeds",
-                "image_embeds": {
-                    "pixel_values": base64_tensor_embedding,
-                    "location_coords": base64_coord_embedding,
-                },
-            }],
-        }]
+        "model": model_name,
+        "additional_data": {"prompt_token_ids": [1]},
+        "encoding_format": "base64",
+        "messages": [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image_embeds",
+                        "image_embeds": {
+                            "pixel_values": base64_tensor_embedding,
+                            "location_coords": base64_coord_embedding,
+                        },
+                    }
+                ],
+            }
+        ],
     }
 
     # test single pooling
     response = requests.post(server.url_for("pooling"), json=prompt)
     response.raise_for_status()
 
-    output = response.json()["data"][0]['data']
+    output = response.json()["data"][0]["data"]
 
     np_response = np.frombuffer(base64.b64decode(output), dtype=np.float32)
 
diff --git a/tests/entrypoints/openai/test_sleep.py b/tests/entrypoints/openai/test_sleep.py
index 0dd6af17ef22..e07436f89d2d 100644
--- a/tests/entrypoints/openai/test_sleep.py
+++ b/tests/entrypoints/openai/test_sleep.py
@@ -20,14 +20,12 @@ def test_sleep_mode():
         "--enable-sleep-mode",
     ]
 
-    with RemoteOpenAIServer(MODEL_NAME,
-                            args,
-                            env_dict={
-                                "VLLM_SERVER_DEV_MODE": "1",
-                                "CUDA_VISIBLE_DEVICES": "0"
-                            }) as remote_server:
-        response = requests.post(remote_server.url_for("sleep"),
-                                 params={"level": "1"})
+    with RemoteOpenAIServer(
+        MODEL_NAME,
+        args,
+        env_dict={"VLLM_SERVER_DEV_MODE": "1", "CUDA_VISIBLE_DEVICES": "0"},
+    ) as remote_server:
+        response = requests.post(remote_server.url_for("sleep"), params={"level": "1"})
         assert response.status_code == 200
         response = requests.get(remote_server.url_for("is_sleeping"))
         assert response.status_code == 200
@@ -40,12 +38,12 @@ def test_sleep_mode():
         assert response.json().get("is_sleeping") is False
 
         # test wake up with tags
-        response = requests.post(remote_server.url_for("sleep"),
-                                 params={"level": "1"})
+        response = requests.post(remote_server.url_for("sleep"), params={"level": "1"})
         assert response.status_code == 200
 
-        response = requests.post(remote_server.url_for("wake_up"),
-                                 params={"tags": ["weights"]})
+        response = requests.post(
+            remote_server.url_for("wake_up"), params={"tags": ["weights"]}
+        )
         assert response.status_code == 200
 
         # is sleeping should be false after waking up any part of the engine
@@ -53,8 +51,9 @@ def test_sleep_mode():
         assert response.status_code == 200
         assert response.json().get("is_sleeping") is True
 
-        response = requests.post(remote_server.url_for("wake_up"),
-                                 params={"tags": ["kv_cache"]})
+        response = requests.post(
+            remote_server.url_for("wake_up"), params={"tags": ["kv_cache"]}
+        )
         assert response.status_code == 200
 
         response = requests.get(remote_server.url_for("is_sleeping"))
diff --git a/tests/entrypoints/openai/test_tensorizer_entrypoint.py b/tests/entrypoints/openai/test_tensorizer_entrypoint.py
index 058e96f203c3..80b7cd9f4cbc 100644
--- a/tests/entrypoints/openai/test_tensorizer_entrypoint.py
+++ b/tests/entrypoints/openai/test_tensorizer_entrypoint.py
@@ -11,7 +11,10 @@
 
 from vllm.engine.arg_utils import EngineArgs
 from vllm.model_executor.model_loader.tensorizer import (
-    TensorizerConfig, tensorize_lora_adapter, tensorize_vllm_model)
+    TensorizerConfig,
+    tensorize_lora_adapter,
+    tensorize_vllm_model,
+)
 
 from ...utils import RemoteOpenAIServer
 
@@ -29,21 +32,20 @@ def cleanup():
     _cleanup()
 
 
-@pytest.fixture(scope='module')
+@pytest.fixture(scope="module")
 def tmp_dir():
     with tempfile.TemporaryDirectory() as path:
         yield path
 
 
-@pytest.fixture(scope='module')
+@pytest.fixture(scope="module")
 def model_uri(tmp_dir):
     yield f"{tmp_dir}/model.tensors"
 
 
 @pytest.fixture(scope="module")
 def tensorize_model_and_lora(tmp_dir, model_uri):
-    tensorizer_config = TensorizerConfig(tensorizer_uri=model_uri,
-                                         lora_dir=tmp_dir)
+    tensorizer_config = TensorizerConfig(tensorizer_uri=model_uri, lora_dir=tmp_dir)
     args = EngineArgs(model=MODEL_NAME)
 
     tensorize_lora_adapter(LORA_PATH, tensorizer_config)
@@ -66,8 +68,11 @@ def server(model_uri, tensorize_model_and_lora):
 
     ## Start OpenAI API server
     args = [
-        "--load-format", "tensorizer", "--served-model-name", MODEL_NAME,
-        "--enable-lora"
+        "--load-format",
+        "tensorizer",
+        "--served-model-name",
+        MODEL_NAME,
+        "--enable-lora",
     ]
 
     model_dir = os.path.dirname(model_uri)
@@ -85,10 +90,9 @@ async def client(server):
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 async def test_single_completion(client: openai.AsyncOpenAI, model_name: str):
     _cleanup()
-    completion = await client.completions.create(model=model_name,
-                                                 prompt="Hello, my name is",
-                                                 max_tokens=5,
-                                                 temperature=0.0)
+    completion = await client.completions.create(
+        model=model_name, prompt="Hello, my name is", max_tokens=5, temperature=0.0
+    )
 
     assert completion.id is not None
     assert completion.choices is not None and len(completion.choices) == 1
@@ -97,4 +101,5 @@ async def test_single_completion(client: openai.AsyncOpenAI, model_name: str):
     assert len(completion.choices[0].text) >= 5
     assert completion.choices[0].finish_reason == "length"
     assert completion.usage == openai.types.CompletionUsage(
-        completion_tokens=5, prompt_tokens=6, total_tokens=11)
+        completion_tokens=5, prompt_tokens=6, total_tokens=11
+    )
diff --git a/tests/entrypoints/openai/test_token_in_token_out.py b/tests/entrypoints/openai/test_token_in_token_out.py
index ed003939c44b..25eb5882be89 100644
--- a/tests/entrypoints/openai/test_token_in_token_out.py
+++ b/tests/entrypoints/openai/test_token_in_token_out.py
@@ -6,8 +6,7 @@
 
 import pytest
 
-from vllm.model_executor.model_loader.weight_utils import (
-    download_weights_from_hf)
+from vllm.model_executor.model_loader.weight_utils import download_weights_from_hf
 from vllm.transformers_utils.tokenizer import get_tokenizer
 
 from ...utils import RemoteOpenAIServer
@@ -23,7 +22,8 @@ def server():
         MODEL_NAME,
         allow_patterns=["*"],
         cache_dir=MODEL_PATH,
-        ignore_patterns=["tokenizer*", "vocab*", "*.safetensors"])
+        ignore_patterns=["tokenizer*", "vocab*", "*.safetensors"],
+    )
     args = [
         "--max-model-len",
         "2048",
@@ -61,13 +61,14 @@ async def test_token_in_token_out_and_logprobs(server):
         )
 
         # Verify all fields are present
-        assert (completion.choices[0].token_ids is not None
-                and 0 < len(completion.choices[0].token_ids) <= 20)
+        assert (
+            completion.choices[0].token_ids is not None
+            and 0 < len(completion.choices[0].token_ids) <= 20
+        )
         assert completion.choices[0].prompt_token_ids is not None
 
         # Decode prompt tokens
         if completion.choices[0].prompt_token_ids:
-            prompt_text = tokenizer.decode(
-                completion.choices[0].prompt_token_ids)
+            prompt_text = tokenizer.decode(completion.choices[0].prompt_token_ids)
             # The decoded prompt should match or close to original prompt
             assert prompt_text == text
diff --git a/tests/entrypoints/openai/test_tokenization.py b/tests/entrypoints/openai/test_tokenization.py
index ecb7f50fa740..7fd32e1c7be1 100644
--- a/tests/entrypoints/openai/test_tokenization.py
+++ b/tests/entrypoints/openai/test_tokenization.py
@@ -53,19 +53,20 @@ async def test_tokenize_completions(
     model_name: str,
     tokenizer_name: str,
 ):
-    tokenizer = get_tokenizer(tokenizer_name=tokenizer_name,
-                              tokenizer_mode="fast")
+    tokenizer = get_tokenizer(tokenizer_name=tokenizer_name, tokenizer_mode="fast")
 
     for add_special in [False, True]:
         prompt = "vllm1 This is a test prompt."
         tokens = tokenizer.encode(prompt, add_special_tokens=add_special)
 
-        response = requests.post(server.url_for("tokenize"),
-                                 json={
-                                     "add_special_tokens": add_special,
-                                     "model": model_name,
-                                     "prompt": prompt
-                                 })
+        response = requests.post(
+            server.url_for("tokenize"),
+            json={
+                "add_special_tokens": add_special,
+                "model": model_name,
+                "prompt": prompt,
+            },
+        )
         response.raise_for_status()
 
         result = response.json()
@@ -86,48 +87,39 @@ async def test_tokenize_chat(
     model_name: str,
     tokenizer_name: str,
 ):
-    tokenizer = get_tokenizer(tokenizer_name=tokenizer_name,
-                              tokenizer_mode="fast")
+    tokenizer = get_tokenizer(tokenizer_name=tokenizer_name, tokenizer_mode="fast")
 
     for add_generation in [False, True]:
         for add_special in [False, True]:
-            conversation = [{
-                "role": "user",
-                "content": "Hi there!"
-            }, {
-                "role": "assistant",
-                "content": "Nice to meet you!"
-            }, {
-                "role": "user",
-                "content": "Can I ask a question? vllm1"
-            }]
+            conversation = [
+                {"role": "user", "content": "Hi there!"},
+                {"role": "assistant", "content": "Nice to meet you!"},
+                {"role": "user", "content": "Can I ask a question? vllm1"},
+            ]
             for continue_final in [False, True]:
                 if add_generation and continue_final:
                     continue
                 if continue_final:
-                    conversation.append({
-                        "role": "assistant",
-                        "content": "Sure,"
-                    })
+                    conversation.append({"role": "assistant", "content": "Sure,"})
 
                 prompt = tokenizer.apply_chat_template(
                     add_generation_prompt=add_generation,
                     continue_final_message=continue_final,
                     conversation=conversation,
-                    tokenize=False)
-                tokens = tokenizer.encode(prompt,
-                                          add_special_tokens=add_special)
-
-                response = requests.post(server.url_for("tokenize"),
-                                         json={
-                                             "add_generation_prompt":
-                                             add_generation,
-                                             "continue_final_message":
-                                             continue_final,
-                                             "add_special_tokens": add_special,
-                                             "messages": conversation,
-                                             "model": model_name
-                                         })
+                    tokenize=False,
+                )
+                tokens = tokenizer.encode(prompt, add_special_tokens=add_special)
+
+                response = requests.post(
+                    server.url_for("tokenize"),
+                    json={
+                        "add_generation_prompt": add_generation,
+                        "continue_final_message": continue_final,
+                        "add_special_tokens": add_special,
+                        "messages": conversation,
+                        "model": model_name,
+                    },
+                )
                 response.raise_for_status()
 
                 result = response.json()
@@ -148,41 +140,35 @@ async def test_tokenize_chat_with_tools(
     model_name: str,
     tokenizer_name: str,
 ):
-    tokenizer = get_tokenizer(tokenizer_name=tokenizer_name,
-                              tokenizer_mode="fast")
+    tokenizer = get_tokenizer(tokenizer_name=tokenizer_name, tokenizer_mode="fast")
 
     for add_generation in [False, True]:
         for add_special in [False, True]:
-            conversation = [{
-                "role":
-                "user",
-                "content":
-                "What's the weather like in Paris today?",
-            }]
-
-            tools = [{
-                "type": "function",
-                "function": {
-                    "name": "get_weather",
-                    "parameters": {
-                        "type": "object",
-                        "properties": {
-                            "location": {
-                                "type": "string"
-                            }
+            conversation = [
+                {
+                    "role": "user",
+                    "content": "What's the weather like in Paris today?",
+                }
+            ]
+
+            tools = [
+                {
+                    "type": "function",
+                    "function": {
+                        "name": "get_weather",
+                        "parameters": {
+                            "type": "object",
+                            "properties": {"location": {"type": "string"}},
                         },
                     },
-                },
-            }]
+                }
+            ]
 
             for continue_final in [False, True]:
                 if add_generation and continue_final:
                     continue
                 if continue_final:
-                    conversation.append({
-                        "role": "assistant",
-                        "content": "Sure,"
-                    })
+                    conversation.append({"role": "assistant", "content": "Sure,"})
 
                 prompt = tokenizer.apply_chat_template(
                     add_generation_prompt=add_generation,
@@ -191,8 +177,7 @@ async def test_tokenize_chat_with_tools(
                     tools=tools,
                     tokenize=False,
                 )
-                tokens = tokenizer.encode(prompt,
-                                          add_special_tokens=add_special)
+                tokens = tokenizer.encode(prompt, add_special_tokens=add_special)
 
                 response = requests.post(
                     server.url_for("tokenize"),
@@ -225,17 +210,12 @@ async def test_tokenize_with_return_token_strs(
     model_name: str,
     tokenizer_name: str,
 ):
-    tokenizer = get_tokenizer(tokenizer_name=tokenizer_name,
-                              tokenizer_mode="fast")
+    tokenizer = get_tokenizer(tokenizer_name=tokenizer_name, tokenizer_mode="fast")
 
     prompt = "This is a token_strs test prompt! vllm1"
     response = requests.post(
         server.url_for("tokenize"),
-        json={
-            "prompt": prompt,
-            "model": model_name,
-            "return_token_strs": True
-        },
+        json={"prompt": prompt, "model": model_name, "return_token_strs": True},
     )
     response.raise_for_status()
 
@@ -260,17 +240,14 @@ async def test_detokenize(
     model_name: str,
     tokenizer_name: str,
 ):
-    tokenizer = get_tokenizer(tokenizer_name=tokenizer_name,
-                              tokenizer_mode="fast")
+    tokenizer = get_tokenizer(tokenizer_name=tokenizer_name, tokenizer_mode="fast")
 
     prompt = "This is a test prompt. vllm1"
     tokens = tokenizer.encode(prompt, add_special_tokens=False)
 
-    response = requests.post(server.url_for("detokenize"),
-                             json={
-                                 "model": model_name,
-                                 "tokens": tokens
-                             })
+    response = requests.post(
+        server.url_for("detokenize"), json={"model": model_name, "tokens": tokens}
+    )
     response.raise_for_status()
 
     assert response.json() == {"prompt": prompt}
@@ -319,14 +296,15 @@ async def test_tokenizer_info_schema(server: RemoteOpenAIServer):
     }
     for field, expected_type in field_types.items():
         if field in result and result[field] is not None:
-            assert isinstance(
-                result[field],
-                expected_type), (f"{field} should be {expected_type.__name__}")
+            assert isinstance(result[field], expected_type), (
+                f"{field} should be {expected_type.__name__}"
+            )
 
 
 @pytest.mark.asyncio
 async def test_tokenizer_info_added_tokens_structure(
-    server: RemoteOpenAIServer, ):
+    server: RemoteOpenAIServer,
+):
     """Test added_tokens_decoder structure if present."""
     response = requests.get(server.url_for("tokenizer_info"))
     response.raise_for_status()
@@ -337,25 +315,23 @@ async def test_tokenizer_info_added_tokens_structure(
             assert isinstance(token_id, str), "Token IDs should be strings"
             assert isinstance(token_info, dict), "Token info should be a dict"
             assert "content" in token_info, "Token info should have content"
-            assert "special" in token_info, (
-                "Token info should have special flag")
-            assert isinstance(token_info["special"],
-                              bool), ("Special flag should be boolean")
+            assert "special" in token_info, "Token info should have special flag"
+            assert isinstance(token_info["special"], bool), (
+                "Special flag should be boolean"
+            )
 
 
 @pytest.mark.asyncio
 async def test_tokenizer_info_consistency_with_tokenize(
-    server: RemoteOpenAIServer, ):
+    server: RemoteOpenAIServer,
+):
     """Test that tokenizer info is consistent with tokenization endpoint."""
     info_response = requests.get(server.url_for("tokenizer_info"))
     info_response.raise_for_status()
     info = info_response.json()
     tokenize_response = requests.post(
         server.url_for("tokenize"),
-        json={
-            "model": MODEL_NAME,
-            "prompt": "Hello world!"
-        },
+        json={"model": MODEL_NAME, "prompt": "Hello world!"},
     )
     tokenize_response.raise_for_status()
     tokenize_result = tokenize_response.json()
@@ -363,7 +339,8 @@ async def test_tokenizer_info_consistency_with_tokenize(
     tokenize_max_len = tokenize_result.get("max_model_len")
     if info_max_len and tokenize_max_len:
         assert info_max_len >= tokenize_max_len, (
-            "Info max length should be >= tokenize max length")
+            "Info max length should be >= tokenize max length"
+        )
 
 
 @pytest.mark.asyncio
@@ -374,6 +351,5 @@ async def test_tokenizer_info_chat_template(server: RemoteOpenAIServer):
     result = response.json()
     chat_template = result.get("chat_template")
     if chat_template:
-        assert isinstance(chat_template,
-                          str), ("Chat template should be a string")
+        assert isinstance(chat_template, str), "Chat template should be a string"
         assert chat_template.strip(), "Chat template should not be empty"
diff --git a/tests/entrypoints/openai/test_transcription_validation.py b/tests/entrypoints/openai/test_transcription_validation.py
index 23c99da97ad3..6ef932392d09 100644
--- a/tests/entrypoints/openai/test_transcription_validation.py
+++ b/tests/entrypoints/openai/test_transcription_validation.py
@@ -17,8 +17,12 @@
 MODEL_NAME = "openai/whisper-large-v3-turbo"
 SERVER_ARGS = ["--enforce-eager"]
 MISTRAL_FORMAT_ARGS = [
-    "--tokenizer_mode", "mistral", "--config_format", "mistral",
-    "--load_format", "mistral"
+    "--tokenizer_mode",
+    "mistral",
+    "--config_format",
+    "mistral",
+    "--load_format",
+    "mistral",
 ]
 
 
@@ -36,8 +40,8 @@ async def client(server):
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize(
-    "model_name",
-    ["openai/whisper-large-v3-turbo", "mistralai/Voxtral-Mini-3B-2507"])
+    "model_name", ["openai/whisper-large-v3-turbo", "mistralai/Voxtral-Mini-3B-2507"]
+)
 async def test_basic_audio(mary_had_lamb, model_name):
     server_args = ["--enforce-eager"]
 
@@ -52,10 +56,11 @@ async def test_basic_audio(mary_had_lamb, model_name):
             file=mary_had_lamb,
             language="en",
             response_format="text",
-            temperature=0.0)
+            temperature=0.0,
+        )
         out = json.loads(transcription)
-        out_text = out['text']
-        out_usage = out['usage']
+        out_text = out["text"]
+        out_usage = out["usage"]
         assert "Mary had a little lamb," in out_text
         assert out_usage["seconds"] == 16, out_usage["seconds"]
 
@@ -74,8 +79,9 @@ async def test_basic_audio_gemma(foscolo):
             file=foscolo,
             language="it",
             response_format="text",
-            temperature=0.0)
-        out = json.loads(transcription)['text']
+            temperature=0.0,
+        )
+        out = json.loads(transcription)["text"]
         assert "da cui vergine nacque Venere" in out
 
 
@@ -85,24 +91,21 @@ async def test_non_asr_model(winning_call):
     model_name = "JackFram/llama-68m"
     with RemoteOpenAIServer(model_name, SERVER_ARGS) as remote_server:
         client = remote_server.get_async_client()
-        res = await client.audio.transcriptions.create(model=model_name,
-                                                       file=winning_call,
-                                                       language="en",
-                                                       temperature=0.0)
+        res = await client.audio.transcriptions.create(
+            model=model_name, file=winning_call, language="en", temperature=0.0
+        )
         err = res.error
         assert err["code"] == 400 and not res.text
-        assert err[
-            "message"] == "The model does not support Transcriptions API"
+        assert err["message"] == "The model does not support Transcriptions API"
 
 
 @pytest.mark.asyncio
 async def test_bad_requests(mary_had_lamb, client):
     # invalid language
     with pytest.raises(openai.BadRequestError):
-        await client.audio.transcriptions.create(model=MODEL_NAME,
-                                                 file=mary_had_lamb,
-                                                 language="hh",
-                                                 temperature=0.0)
+        await client.audio.transcriptions.create(
+            model=MODEL_NAME, file=mary_had_lamb, language="hh", temperature=0.0
+        )
 
 
 @pytest.mark.asyncio
@@ -114,17 +117,18 @@ async def test_long_audio_request(mary_had_lamb, client):
     repeated_audio = np.tile(audio, 10)
     # Repeated audio to buffer
     buffer = io.BytesIO()
-    sf.write(buffer, repeated_audio, sr, format='WAV')
+    sf.write(buffer, repeated_audio, sr, format="WAV")
     buffer.seek(0)
     transcription = await client.audio.transcriptions.create(
         model=MODEL_NAME,
         file=buffer,
         language="en",
         response_format="text",
-        temperature=0.0)
+        temperature=0.0,
+    )
     out = json.loads(transcription)
-    out_text = out['text']
-    out_usage = out['usage']
+    out_text = out["text"]
+    out_usage = out["usage"]
     counts = out_text.count("Mary had a little lamb")
     assert counts == 10, counts
     assert out_usage["seconds"] == 161, out_usage["seconds"]
@@ -135,10 +139,8 @@ async def test_completion_endpoints(client):
     # text to text model
     res = await client.chat.completions.create(
         model=MODEL_NAME,
-        messages=[{
-            "role": "system",
-            "content": "You are a helpful assistant."
-        }])
+        messages=[{"role": "system", "content": "You are a helpful assistant."}],
+    )
     err = res.error
     assert err["code"] == 400
     assert err["message"] == "The model does not support Chat Completions API"
@@ -157,16 +159,19 @@ async def test_streaming_response(winning_call, client):
         file=winning_call,
         response_format="json",
         language="en",
-        temperature=0.0)
-    res = await client.audio.transcriptions.create(model=MODEL_NAME,
-                                                   file=winning_call,
-                                                   language="en",
-                                                   temperature=0.0,
-                                                   stream=True,
-                                                   timeout=30)
+        temperature=0.0,
+    )
+    res = await client.audio.transcriptions.create(
+        model=MODEL_NAME,
+        file=winning_call,
+        language="en",
+        temperature=0.0,
+        stream=True,
+        timeout=30,
+    )
     # Reconstruct from chunks and validate
     async for chunk in res:
-        text = chunk.choices[0]['delta']['content']
+        text = chunk.choices[0]["delta"]["content"]
         transcription += text
 
     assert transcription == res_no_stream.text
@@ -180,9 +185,9 @@ async def test_stream_options(winning_call, client):
         language="en",
         temperature=0.0,
         stream=True,
-        extra_body=dict(stream_include_usage=True,
-                        stream_continuous_usage_stats=True),
-        timeout=30)
+        extra_body=dict(stream_include_usage=True, stream_continuous_usage_stats=True),
+        timeout=30,
+    )
     final = False
     continuous = True
     async for chunk in res:
@@ -190,7 +195,7 @@ async def test_stream_options(winning_call, client):
             # final usage sent
             final = True
         else:
-            continuous = continuous and hasattr(chunk, 'usage')
+            continuous = continuous and hasattr(chunk, "usage")
     assert final and continuous
 
 
@@ -198,27 +203,31 @@ async def test_stream_options(winning_call, client):
 async def test_sampling_params(mary_had_lamb, client):
     """
     Compare sampling with params and greedy sampling to assert results
-    are different when extreme sampling parameters values are picked. 
+    are different when extreme sampling parameters values are picked.
     """
     transcription = await client.audio.transcriptions.create(
         model=MODEL_NAME,
         file=mary_had_lamb,
         language="en",
         temperature=0.8,
-        extra_body=dict(seed=42,
-                        repetition_penalty=1.9,
-                        top_k=12,
-                        top_p=0.4,
-                        min_p=0.5,
-                        frequency_penalty=1.8,
-                        presence_penalty=2.0))
+        extra_body=dict(
+            seed=42,
+            repetition_penalty=1.9,
+            top_k=12,
+            top_p=0.4,
+            min_p=0.5,
+            frequency_penalty=1.8,
+            presence_penalty=2.0,
+        ),
+    )
 
     greedy_transcription = await client.audio.transcriptions.create(
         model=MODEL_NAME,
         file=mary_had_lamb,
         language="en",
         temperature=0.0,
-        extra_body=dict(seed=42))
+        extra_body=dict(seed=42),
+    )
 
     assert greedy_transcription.text != transcription.text
 
@@ -226,15 +235,16 @@ async def test_sampling_params(mary_had_lamb, client):
 @pytest.mark.asyncio
 async def test_audio_prompt(mary_had_lamb, client):
     prompt = "This is a speech, recorded in a phonograph."
-    #Prompts should not omit the part of original prompt while transcribing.
+    # Prompts should not omit the part of original prompt while transcribing.
     prefix = "The first words I spoke in the original phonograph"
     transcription = await client.audio.transcriptions.create(
         model=MODEL_NAME,
         file=mary_had_lamb,
         language="en",
         response_format="text",
-        temperature=0.0)
-    out = json.loads(transcription)['text']
+        temperature=0.0,
+    )
+    out = json.loads(transcription)["text"]
     assert prefix in out
     transcription_wprompt = await client.audio.transcriptions.create(
         model=MODEL_NAME,
@@ -242,6 +252,7 @@ async def test_audio_prompt(mary_had_lamb, client):
         language="en",
         response_format="text",
         prompt=prompt,
-        temperature=0.0)
-    out_prompt = json.loads(transcription_wprompt)['text']
+        temperature=0.0,
+    )
+    out_prompt = json.loads(transcription_wprompt)["text"]
     assert prefix in out_prompt
diff --git a/tests/entrypoints/openai/test_translation_validation.py b/tests/entrypoints/openai/test_translation_validation.py
index eb7879927b9b..f35742e166fe 100644
--- a/tests/entrypoints/openai/test_translation_validation.py
+++ b/tests/entrypoints/openai/test_translation_validation.py
@@ -2,6 +2,7 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 import io
+
 # imports for structured outputs tests
 import json
 
@@ -17,8 +18,9 @@
 SERVER_ARGS = ["--enforce-eager"]
 
 
-@pytest.fixture(scope="module",
-                params=["openai/whisper-small", "google/gemma-3n-E2B-it"])
+@pytest.fixture(
+    scope="module", params=["openai/whisper-small", "google/gemma-3n-E2B-it"]
+)
 def server(request):
     # Parametrize over model name
     with RemoteOpenAIServer(request.param, SERVER_ARGS) as remote_server:
@@ -38,9 +40,9 @@ async def test_non_asr_model(foscolo):
     model_name = "JackFram/llama-68m"
     with RemoteOpenAIServer(model_name, SERVER_ARGS) as remote_server:
         client = remote_server.get_async_client()
-        res = await client.audio.translations.create(model=model_name,
-                                                     file=foscolo,
-                                                     temperature=0.0)
+        res = await client.audio.translations.create(
+            model=model_name, file=foscolo, temperature=0.0
+        )
         err = res.error
         assert err["code"] == 400 and not res.text
         assert err["message"] == "The model does not support Translations API"
@@ -56,8 +58,9 @@ async def test_basic_audio(foscolo, client_and_model):
         response_format="text",
         # TODO remove `language="it"` once language detection is implemented
         extra_body=dict(language="it", to_language="en"),
-        temperature=0.0)
-    out = json.loads(translation)['text'].strip().lower()
+        temperature=0.0,
+    )
+    out = json.loads(translation)["text"].strip().lower()
     assert "greek sea" in out
 
 
@@ -72,8 +75,9 @@ async def test_audio_prompt(foscolo, client_and_model):
         prompt=prompt,
         extra_body=dict(language="it", to_language="en"),
         response_format="text",
-        temperature=0.0)
-    out = json.loads(transcription)['text']
+        temperature=0.0,
+    )
+    out = json.loads(transcription)["text"]
     assert "Nor will I ever touch the sacred" not in out
     assert prompt not in out
 
@@ -87,7 +91,8 @@ async def test_streaming_response(foscolo, client_and_model, server):
         file=foscolo,
         response_format="json",
         extra_body=dict(language="it", to_language="en", seed=42),
-        temperature=0.0)
+        temperature=0.0,
+    )
 
     # Stream via HTTPX since OpenAI translation client doesn't expose streaming
     server, model_name = server
@@ -104,16 +109,14 @@ async def test_streaming_response(foscolo, client_and_model, server):
     foscolo.seek(0)
     async with httpx.AsyncClient() as http_client:
         files = {"file": foscolo}
-        async with http_client.stream("POST",
-                                      url,
-                                      headers=headers,
-                                      data=data,
-                                      files=files) as response:
+        async with http_client.stream(
+            "POST", url, headers=headers, data=data, files=files
+        ) as response:
             async for line in response.aiter_lines():
                 if not line:
                     continue
                 if line.startswith("data: "):
-                    line = line[len("data: "):]
+                    line = line[len("data: ") :]
                 if line.strip() == "[DONE]":
                     break
                 chunk = json.loads(line)
@@ -124,9 +127,10 @@ async def test_streaming_response(foscolo, client_and_model, server):
     # NOTE There's a small non-deterministic issue here, likely in the attn
     # computation, which will cause a few tokens to be different, while still
     # being very close semantically.
-    assert sum([
-        x == y for x, y in zip(res_stream, res_no_stream.text.split())
-    ]) >= len(res_stream) * 0.9
+    assert (
+        sum([x == y for x, y in zip(res_stream, res_no_stream.text.split())])
+        >= len(res_stream) * 0.9
+    )
 
 
 @pytest.mark.asyncio
@@ -148,16 +152,14 @@ async def test_stream_options(foscolo, server):
     continuous = True
     async with httpx.AsyncClient() as http_client:
         files = {"file": foscolo}
-        async with http_client.stream("POST",
-                                      url,
-                                      headers=headers,
-                                      data=data,
-                                      files=files) as response:
+        async with http_client.stream(
+            "POST", url, headers=headers, data=data, files=files
+        ) as response:
             async for line in response.aiter_lines():
                 if not line:
                     continue
                 if line.startswith("data: "):
-                    line = line[len("data: "):]
+                    line = line[len("data: ") :]
                 if line.strip() == "[DONE]":
                     break
                 chunk = json.loads(line)
@@ -180,13 +182,14 @@ async def test_long_audio_request(foscolo, client_and_model):
     repeated_audio = np.tile(audio, 2)
     # Repeated audio to buffer
     buffer = io.BytesIO()
-    sf.write(buffer, repeated_audio, sr, format='WAV')
+    sf.write(buffer, repeated_audio, sr, format="WAV")
     buffer.seek(0)
     translation = await client.audio.translations.create(
         model=model_name,
         file=buffer,
         extra_body=dict(language="it", to_language="en"),
         response_format="text",
-        temperature=0.0)
-    out = json.loads(translation)['text'].strip().lower()
+        temperature=0.0,
+    )
+    out = json.loads(translation)["text"].strip().lower()
     assert out.count("greek sea") == 2
diff --git a/tests/entrypoints/openai/test_video.py b/tests/entrypoints/openai/test_video.py
index ad4dff00daaa..a0d118743e3e 100644
--- a/tests/entrypoints/openai/test_video.py
+++ b/tests/entrypoints/openai/test_video.py
@@ -58,24 +58,18 @@ def base64_encoded_video() -> dict[str, str]:
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("video_url", TEST_VIDEO_URLS)
-async def test_single_chat_session_video(client: openai.AsyncOpenAI,
-                                         model_name: str, video_url: str):
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "video_url",
-                "video_url": {
-                    "url": video_url
-                }
-            },
-            {
-                "type": "text",
-                "text": "What's in this video?"
-            },
-        ],
-    }]
+async def test_single_chat_session_video(
+    client: openai.AsyncOpenAI, model_name: str, video_url: str
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {"type": "video_url", "video_url": {"url": video_url}},
+                {"type": "text", "text": "What's in this video?"},
+            ],
+        }
+    ]
 
     # test single completion
     chat_completion = await client.chat.completions.create(
@@ -84,13 +78,15 @@ async def test_single_chat_session_video(client: openai.AsyncOpenAI,
         max_completion_tokens=10,
         logprobs=True,
         temperature=0.0,
-        top_logprobs=5)
+        top_logprobs=5,
+    )
     assert len(chat_completion.choices) == 1
 
     choice = chat_completion.choices[0]
     assert choice.finish_reason == "length"
     assert chat_completion.usage == openai.types.CompletionUsage(
-        completion_tokens=10, prompt_tokens=6287, total_tokens=6297)
+        completion_tokens=10, prompt_tokens=6287, total_tokens=6297
+    )
 
     message = choice.message
     message = chat_completion.choices[0].message
@@ -112,54 +108,44 @@ async def test_single_chat_session_video(client: openai.AsyncOpenAI,
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("video_url", TEST_VIDEO_URLS)
-async def test_error_on_invalid_video_url_type(client: openai.AsyncOpenAI,
-                                               model_name: str,
-                                               video_url: str):
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "video_url",
-                "video_url": video_url
-            },
-            {
-                "type": "text",
-                "text": "What's in this video?"
-            },
-        ],
-    }]
+async def test_error_on_invalid_video_url_type(
+    client: openai.AsyncOpenAI, model_name: str, video_url: str
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {"type": "video_url", "video_url": video_url},
+                {"type": "text", "text": "What's in this video?"},
+            ],
+        }
+    ]
 
     # video_url should be a dict {"url": "some url"}, not directly a string
     with pytest.raises(openai.BadRequestError):
-        _ = await client.chat.completions.create(model=model_name,
-                                                 messages=messages,
-                                                 max_completion_tokens=10,
-                                                 temperature=0.0)
+        _ = await client.chat.completions.create(
+            model=model_name,
+            messages=messages,
+            max_completion_tokens=10,
+            temperature=0.0,
+        )
 
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("video_url", TEST_VIDEO_URLS)
-async def test_single_chat_session_video_beamsearch(client: openai.AsyncOpenAI,
-                                                    model_name: str,
-                                                    video_url: str):
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "video_url",
-                "video_url": {
-                    "url": video_url
-                }
-            },
-            {
-                "type": "text",
-                "text": "What's in this video?"
-            },
-        ],
-    }]
+async def test_single_chat_session_video_beamsearch(
+    client: openai.AsyncOpenAI, model_name: str, video_url: str
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {"type": "video_url", "video_url": {"url": video_url}},
+                {"type": "text", "text": "What's in this video?"},
+            ],
+        }
+    ]
 
     chat_completion = await client.chat.completions.create(
         model=model_name,
@@ -168,36 +154,38 @@ async def test_single_chat_session_video_beamsearch(client: openai.AsyncOpenAI,
         max_completion_tokens=10,
         logprobs=True,
         top_logprobs=5,
-        extra_body=dict(use_beam_search=True))
+        extra_body=dict(use_beam_search=True),
+    )
     assert len(chat_completion.choices) == 2
-    assert chat_completion.choices[
-        0].message.content != chat_completion.choices[1].message.content
+    assert (
+        chat_completion.choices[0].message.content
+        != chat_completion.choices[1].message.content
+    )
 
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("video_url", TEST_VIDEO_URLS)
 async def test_single_chat_session_video_base64encoded(
-        client: openai.AsyncOpenAI, model_name: str, video_url: str,
-        base64_encoded_video: dict[str, str]):
-
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "video_url",
-                "video_url": {
-                    "url":
-                    f"data:video/jpeg;base64,{base64_encoded_video[video_url]}"
-                }
-            },
-            {
-                "type": "text",
-                "text": "What's in this video?"
-            },
-        ],
-    }]
+    client: openai.AsyncOpenAI,
+    model_name: str,
+    video_url: str,
+    base64_encoded_video: dict[str, str],
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {
+                    "type": "video_url",
+                    "video_url": {
+                        "url": f"data:video/jpeg;base64,{base64_encoded_video[video_url]}"
+                    },
+                },
+                {"type": "text", "text": "What's in this video?"},
+            ],
+        }
+    ]
 
     # test single completion
     chat_completion = await client.chat.completions.create(
@@ -206,13 +194,15 @@ async def test_single_chat_session_video_base64encoded(
         max_completion_tokens=10,
         logprobs=True,
         temperature=0.0,
-        top_logprobs=5)
+        top_logprobs=5,
+    )
     assert len(chat_completion.choices) == 1
 
     choice = chat_completion.choices[0]
     assert choice.finish_reason == "length"
     assert chat_completion.usage == openai.types.CompletionUsage(
-        completion_tokens=10, prompt_tokens=6287, total_tokens=6297)
+        completion_tokens=10, prompt_tokens=6287, total_tokens=6297
+    )
 
     message = choice.message
     message = chat_completion.choices[0].message
@@ -236,58 +226,54 @@ async def test_single_chat_session_video_base64encoded(
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("video_url", TEST_VIDEO_URLS)
 async def test_single_chat_session_video_base64encoded_beamsearch(
-        client: openai.AsyncOpenAI, model_name: str, video_url: str,
-        base64_encoded_video: dict[str, str]):
-
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "video_url",
-                "video_url": {
-                    "url":
-                    f"data:video/jpeg;base64,{base64_encoded_video[video_url]}"
-                }
-            },
-            {
-                "type": "text",
-                "text": "What's in this video?"
-            },
-        ],
-    }]
+    client: openai.AsyncOpenAI,
+    model_name: str,
+    video_url: str,
+    base64_encoded_video: dict[str, str],
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {
+                    "type": "video_url",
+                    "video_url": {
+                        "url": f"data:video/jpeg;base64,{base64_encoded_video[video_url]}"
+                    },
+                },
+                {"type": "text", "text": "What's in this video?"},
+            ],
+        }
+    ]
     chat_completion = await client.chat.completions.create(
         model=model_name,
         messages=messages,
         n=2,
         max_completion_tokens=10,
-        extra_body=dict(use_beam_search=True))
+        extra_body=dict(use_beam_search=True),
+    )
     assert len(chat_completion.choices) == 2
-    assert chat_completion.choices[
-        0].message.content != chat_completion.choices[1].message.content
+    assert (
+        chat_completion.choices[0].message.content
+        != chat_completion.choices[1].message.content
+    )
 
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("video_url", TEST_VIDEO_URLS)
-async def test_chat_streaming_video(client: openai.AsyncOpenAI,
-                                    model_name: str, video_url: str):
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "video_url",
-                "video_url": {
-                    "url": video_url
-                }
-            },
-            {
-                "type": "text",
-                "text": "What's in this video?"
-            },
-        ],
-    }]
+async def test_chat_streaming_video(
+    client: openai.AsyncOpenAI, model_name: str, video_url: str
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {"type": "video_url", "video_url": {"url": video_url}},
+                {"type": "text", "text": "What's in this video?"},
+            ],
+        }
+    ]
 
     # test single completion
     chat_completion = await client.chat.completions.create(
@@ -327,27 +313,23 @@ async def test_chat_streaming_video(client: openai.AsyncOpenAI,
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize(
-    "video_urls",
-    [TEST_VIDEO_URLS[:i] for i in range(2, len(TEST_VIDEO_URLS))])
-async def test_multi_video_input(client: openai.AsyncOpenAI, model_name: str,
-                                 video_urls: list[str]):
-
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            *({
-                "type": "video_url",
-                "video_url": {
-                    "url": video_url
-                }
-            } for video_url in video_urls),
-            {
-                "type": "text",
-                "text": "What's in this video?"
-            },
-        ],
-    }]
+    "video_urls", [TEST_VIDEO_URLS[:i] for i in range(2, len(TEST_VIDEO_URLS))]
+)
+async def test_multi_video_input(
+    client: openai.AsyncOpenAI, model_name: str, video_urls: list[str]
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                *(
+                    {"type": "video_url", "video_url": {"url": video_url}}
+                    for video_url in video_urls
+                ),
+                {"type": "text", "text": "What's in this video?"},
+            ],
+        }
+    ]
 
     if len(video_urls) > MAXIMUM_VIDEOS:
         with pytest.raises(openai.BadRequestError):  # test multi-video input
diff --git a/tests/entrypoints/openai/test_vision.py b/tests/entrypoints/openai/test_vision.py
index a324e8666605..cab23d1e2f73 100644
--- a/tests/entrypoints/openai/test_vision.py
+++ b/tests/entrypoints/openai/test_vision.py
@@ -71,26 +71,30 @@ async def client(server):
 @pytest.fixture(scope="session")
 def base64_encoded_image(local_asset_server) -> dict[str, str]:
     return {
-        image_asset:
-        encode_image_base64(local_asset_server.get_image_asset(image_asset))
+        image_asset: encode_image_base64(
+            local_asset_server.get_image_asset(image_asset)
+        )
         for image_asset in TEST_IMAGE_ASSETS
     }
 
 
 def get_hf_prompt_tokens(model_name, content, image_url):
-    processor = AutoProcessor.from_pretrained(model_name,
-                                              trust_remote_code=True,
-                                              num_crops=4)
+    processor = AutoProcessor.from_pretrained(
+        model_name, trust_remote_code=True, num_crops=4
+    )
 
     placeholder = "<|image_1|>\n"
-    messages = [{
-        "role": "user",
-        "content": f"{placeholder}{content}",
-    }]
+    messages = [
+        {
+            "role": "user",
+            "content": f"{placeholder}{content}",
+        }
+    ]
     images = [fetch_image(image_url)]
 
     prompt = processor.tokenizer.apply_chat_template(
-        messages, tokenize=False, add_generation_prompt=True)
+        messages, tokenize=False, add_generation_prompt=True
+    )
     inputs = processor(prompt, images, return_tensors="pt")
 
     return inputs.input_ids.shape[1]
@@ -99,25 +103,19 @@ def get_hf_prompt_tokens(model_name, content, image_url):
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("image_url", TEST_IMAGE_ASSETS, indirect=True)
-async def test_single_chat_session_image(client: openai.AsyncOpenAI,
-                                         model_name: str, image_url: str):
+async def test_single_chat_session_image(
+    client: openai.AsyncOpenAI, model_name: str, image_url: str
+):
     content_text = "What's in this image?"
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "image_url",
-                "image_url": {
-                    "url": image_url
-                }
-            },
-            {
-                "type": "text",
-                "text": content_text
-            },
-        ],
-    }]
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {"type": "image_url", "image_url": {"url": image_url}},
+                {"type": "text", "text": content_text},
+            ],
+        }
+    ]
 
     max_completion_tokens = 10
     # test single completion
@@ -127,17 +125,18 @@ async def test_single_chat_session_image(client: openai.AsyncOpenAI,
         max_completion_tokens=max_completion_tokens,
         logprobs=True,
         temperature=0.0,
-        top_logprobs=5)
+        top_logprobs=5,
+    )
     assert len(chat_completion.choices) == 1
 
     choice = chat_completion.choices[0]
     assert choice.finish_reason == "length"
-    hf_prompt_tokens = get_hf_prompt_tokens(model_name, content_text,
-                                            image_url)
+    hf_prompt_tokens = get_hf_prompt_tokens(model_name, content_text, image_url)
     assert chat_completion.usage == openai.types.CompletionUsage(
         completion_tokens=max_completion_tokens,
         prompt_tokens=hf_prompt_tokens,
-        total_tokens=hf_prompt_tokens + max_completion_tokens)
+        total_tokens=hf_prompt_tokens + max_completion_tokens,
+    )
 
     message = choice.message
     message = chat_completion.choices[0].message
@@ -159,55 +158,45 @@ async def test_single_chat_session_image(client: openai.AsyncOpenAI,
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("image_url", TEST_IMAGE_ASSETS, indirect=True)
-async def test_error_on_invalid_image_url_type(client: openai.AsyncOpenAI,
-                                               model_name: str,
-                                               image_url: str):
+async def test_error_on_invalid_image_url_type(
+    client: openai.AsyncOpenAI, model_name: str, image_url: str
+):
     content_text = "What's in this image?"
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "image_url",
-                "image_url": image_url
-            },
-            {
-                "type": "text",
-                "text": content_text
-            },
-        ],
-    }]
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {"type": "image_url", "image_url": image_url},
+                {"type": "text", "text": content_text},
+            ],
+        }
+    ]
 
     # image_url should be a dict {"url": "some url"}, not directly a string
     with pytest.raises(openai.BadRequestError):
-        _ = await client.chat.completions.create(model=model_name,
-                                                 messages=messages,
-                                                 max_completion_tokens=10,
-                                                 temperature=0.0)
+        _ = await client.chat.completions.create(
+            model=model_name,
+            messages=messages,
+            max_completion_tokens=10,
+            temperature=0.0,
+        )
 
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("image_url", TEST_IMAGE_ASSETS, indirect=True)
-async def test_single_chat_session_image_beamsearch(client: openai.AsyncOpenAI,
-                                                    model_name: str,
-                                                    image_url: str):
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "image_url",
-                "image_url": {
-                    "url": image_url
-                }
-            },
-            {
-                "type": "text",
-                "text": "What's in this image?"
-            },
-        ],
-    }]
+async def test_single_chat_session_image_beamsearch(
+    client: openai.AsyncOpenAI, model_name: str, image_url: str
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {"type": "image_url", "image_url": {"url": image_url}},
+                {"type": "text", "text": "What's in this image?"},
+            ],
+        }
+    ]
 
     chat_completion = await client.chat.completions.create(
         model=model_name,
@@ -216,10 +205,13 @@ async def test_single_chat_session_image_beamsearch(client: openai.AsyncOpenAI,
         max_completion_tokens=10,
         logprobs=True,
         top_logprobs=5,
-        extra_body=dict(use_beam_search=True))
+        extra_body=dict(use_beam_search=True),
+    )
     assert len(chat_completion.choices) == 2
-    assert chat_completion.choices[
-        0].message.content != chat_completion.choices[1].message.content
+    assert (
+        chat_completion.choices[0].message.content
+        != chat_completion.choices[1].message.content
+    )
 
 
 @pytest.mark.asyncio
@@ -227,27 +219,27 @@ async def test_single_chat_session_image_beamsearch(client: openai.AsyncOpenAI,
 @pytest.mark.parametrize("raw_image_url", TEST_IMAGE_ASSETS)
 @pytest.mark.parametrize("image_url", TEST_IMAGE_ASSETS, indirect=True)
 async def test_single_chat_session_image_base64encoded(
-        client: openai.AsyncOpenAI, model_name: str, raw_image_url: str,
-        image_url: str, base64_encoded_image: dict[str, str]):
-
+    client: openai.AsyncOpenAI,
+    model_name: str,
+    raw_image_url: str,
+    image_url: str,
+    base64_encoded_image: dict[str, str],
+):
     content_text = "What's in this image?"
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "image_url",
-                "image_url": {
-                    "url":
-                    f"data:image/jpeg;base64,{base64_encoded_image[raw_image_url]}"
-                }
-            },
-            {
-                "type": "text",
-                "text": content_text
-            },
-        ],
-    }]
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {
+                    "type": "image_url",
+                    "image_url": {
+                        "url": f"data:image/jpeg;base64,{base64_encoded_image[raw_image_url]}"
+                    },
+                },
+                {"type": "text", "text": content_text},
+            ],
+        }
+    ]
 
     max_completion_tokens = 10
     # test single completion
@@ -257,17 +249,18 @@ async def test_single_chat_session_image_base64encoded(
         max_completion_tokens=max_completion_tokens,
         logprobs=True,
         temperature=0.0,
-        top_logprobs=5)
+        top_logprobs=5,
+    )
     assert len(chat_completion.choices) == 1
 
     choice = chat_completion.choices[0]
     assert choice.finish_reason == "length"
-    hf_prompt_tokens = get_hf_prompt_tokens(model_name, content_text,
-                                            image_url)
+    hf_prompt_tokens = get_hf_prompt_tokens(model_name, content_text, image_url)
     assert chat_completion.usage == openai.types.CompletionUsage(
         completion_tokens=max_completion_tokens,
         prompt_tokens=hf_prompt_tokens,
-        total_tokens=hf_prompt_tokens + max_completion_tokens)
+        total_tokens=hf_prompt_tokens + max_completion_tokens,
+    )
 
     message = choice.message
     message = chat_completion.choices[0].message
@@ -291,36 +284,37 @@ async def test_single_chat_session_image_base64encoded(
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("image_idx", list(range(len(TEST_IMAGE_ASSETS))))
 async def test_single_chat_session_image_base64encoded_beamsearch(
-        client: openai.AsyncOpenAI, model_name: str, image_idx: int,
-        base64_encoded_image: dict[str, str]):
+    client: openai.AsyncOpenAI,
+    model_name: str,
+    image_idx: int,
+    base64_encoded_image: dict[str, str],
+):
     # NOTE: This test also validates that we pass MM data through beam search
     raw_image_url = TEST_IMAGE_ASSETS[image_idx]
     expected_res = EXPECTED_MM_BEAM_SEARCH_RES[image_idx]
 
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "image_url",
-                "image_url": {
-                    "url":
-                    f"data:image/jpeg;base64,{base64_encoded_image[raw_image_url]}"
-                }
-            },
-            {
-                "type": "text",
-                "text": "What's in this image?"
-            },
-        ],
-    }]
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {
+                    "type": "image_url",
+                    "image_url": {
+                        "url": f"data:image/jpeg;base64,{base64_encoded_image[raw_image_url]}"
+                    },
+                },
+                {"type": "text", "text": "What's in this image?"},
+            ],
+        }
+    ]
     chat_completion = await client.chat.completions.create(
         model=model_name,
         messages=messages,
         n=2,
         max_completion_tokens=10,
         temperature=0.0,
-        extra_body=dict(use_beam_search=True))
+        extra_body=dict(use_beam_search=True),
+    )
     assert len(chat_completion.choices) == 2
     for actual, expected_str in zip(chat_completion.choices, expected_res):
         assert actual.message.content == expected_str
@@ -329,24 +323,18 @@ async def test_single_chat_session_image_base64encoded_beamsearch(
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("image_url", TEST_IMAGE_ASSETS, indirect=True)
-async def test_chat_streaming_image(client: openai.AsyncOpenAI,
-                                    model_name: str, image_url: str):
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "image_url",
-                "image_url": {
-                    "url": image_url
-                }
-            },
-            {
-                "type": "text",
-                "text": "What's in this image?"
-            },
-        ],
-    }]
+async def test_chat_streaming_image(
+    client: openai.AsyncOpenAI, model_name: str, image_url: str
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {"type": "image_url", "image_url": {"url": image_url}},
+                {"type": "text", "text": "What's in this image?"},
+            ],
+        }
+    ]
 
     # test single completion
     chat_completion = await client.chat.completions.create(
@@ -388,26 +376,23 @@ async def test_chat_streaming_image(client: openai.AsyncOpenAI,
 @pytest.mark.parametrize(
     "image_urls",
     [TEST_IMAGE_ASSETS[:i] for i in range(2, len(TEST_IMAGE_ASSETS))],
-    indirect=True)
-async def test_multi_image_input(client: openai.AsyncOpenAI, model_name: str,
-                                 image_urls: list[str]):
-
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            *({
-                "type": "image_url",
-                "image_url": {
-                    "url": image_url
-                }
-            } for image_url in image_urls),
-            {
-                "type": "text",
-                "text": "What's in this image?"
-            },
-        ],
-    }]
+    indirect=True,
+)
+async def test_multi_image_input(
+    client: openai.AsyncOpenAI, model_name: str, image_urls: list[str]
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                *(
+                    {"type": "image_url", "image_url": {"url": image_url}}
+                    for image_url in image_urls
+                ),
+                {"type": "text", "text": "What's in this image?"},
+            ],
+        }
+    ]
 
     if len(image_urls) > MAXIMUM_IMAGES:
         with pytest.raises(openai.BadRequestError):  # test multi-image input
@@ -443,7 +428,8 @@ async def test_multi_image_input(client: openai.AsyncOpenAI, model_name: str,
 @pytest.mark.parametrize(
     "image_urls",
     [TEST_IMAGE_ASSETS[:i] for i in range(2, len(TEST_IMAGE_ASSETS))],
-    indirect=True)
+    indirect=True,
+)
 async def test_completions_with_image(
     client: openai.AsyncOpenAI,
     model_name: str,
@@ -452,13 +438,9 @@ async def test_completions_with_image(
     for image_url in image_urls:
         chat_completion = await client.chat.completions.create(
             messages=[
+                {"role": "system", "content": "You are a helpful assistant."},
                 {
-                    "role": "system",
-                    "content": "You are a helpful assistant."
-                },
-                {
-                    "role":
-                    "user",
+                    "role": "user",
                     "content": [
                         {
                             "type": "text",
@@ -468,7 +450,7 @@ async def test_completions_with_image(
                             "type": "image_url",
                             "image_url": {
                                 "url": image_url,
-                            }
+                            },
                         },
                     ],
                 },
@@ -485,7 +467,8 @@ async def test_completions_with_image(
 @pytest.mark.parametrize(
     "image_urls",
     [TEST_IMAGE_ASSETS[:i] for i in range(2, len(TEST_IMAGE_ASSETS))],
-    indirect=True)
+    indirect=True,
+)
 async def test_completions_with_image_with_uuid(
     client: openai.AsyncOpenAI,
     model_name: str,
@@ -494,13 +477,9 @@ async def test_completions_with_image_with_uuid(
     for image_url in image_urls:
         chat_completion = await client.chat.completions.create(
             messages=[
+                {"role": "system", "content": "You are a helpful assistant."},
                 {
-                    "role": "system",
-                    "content": "You are a helpful assistant."
-                },
-                {
-                    "role":
-                    "user",
+                    "role": "user",
                     "content": [
                         {
                             "type": "text",
@@ -511,7 +490,7 @@ async def test_completions_with_image_with_uuid(
                             "image_url": {
                                 "url": image_url,
                             },
-                            "uuid": image_url
+                            "uuid": image_url,
                         },
                     ],
                 },
@@ -525,34 +504,25 @@ async def test_completions_with_image_with_uuid(
         # Second request, with empty image but the same uuid.
         chat_completion_with_empty_image = await client.chat.completions.create(
             messages=[
+                {"role": "system", "content": "You are a helpful assistant."},
                 {
-                    "role": "system",
-                    "content": "You are a helpful assistant."
-                },
-                {
-                    "role":
-                    "user",
+                    "role": "user",
                     "content": [
                         {
                             "type": "text",
                             "text": "Describe this image.",
                         },
-                        {
-                            "type": "image_url",
-                            "image_url": {},
-                            "uuid": image_url
-                        },
+                        {"type": "image_url", "image_url": {}, "uuid": image_url},
                     ],
                 },
             ],
             model=model_name,
         )
-        assert chat_completion_with_empty_image.choices[
-            0].message.content is not None
+        assert chat_completion_with_empty_image.choices[0].message.content is not None
         assert isinstance(
-            chat_completion_with_empty_image.choices[0].message.content, str)
-        assert len(
-            chat_completion_with_empty_image.choices[0].message.content) > 0
+            chat_completion_with_empty_image.choices[0].message.content, str
+        )
+        assert len(chat_completion_with_empty_image.choices[0].message.content) > 0
 
 
 @pytest.mark.asyncio
@@ -564,13 +534,9 @@ async def test_completions_with_empty_image_with_uuid_without_cache_hit(
     with pytest.raises(openai.BadRequestError):
         _ = await client.chat.completions.create(
             messages=[
+                {"role": "system", "content": "You are a helpful assistant."},
                 {
-                    "role": "system",
-                    "content": "You are a helpful assistant."
-                },
-                {
-                    "role":
-                    "user",
+                    "role": "user",
                     "content": [
                         {
                             "type": "text",
@@ -579,7 +545,7 @@ async def test_completions_with_empty_image_with_uuid_without_cache_hit(
                         {
                             "type": "image_url",
                             "image_url": {},
-                            "uuid": "uuid_not_previously_seen"
+                            "uuid": "uuid_not_previously_seen",
                         },
                     ],
                 },
@@ -593,7 +559,8 @@ async def test_completions_with_empty_image_with_uuid_without_cache_hit(
 @pytest.mark.parametrize(
     "image_urls",
     [TEST_IMAGE_ASSETS[:i] for i in range(2, len(TEST_IMAGE_ASSETS))],
-    indirect=True)
+    indirect=True,
+)
 async def test_completions_with_image_with_incorrect_uuid_format(
     client: openai.AsyncOpenAI,
     model_name: str,
@@ -602,13 +569,9 @@ async def test_completions_with_image_with_incorrect_uuid_format(
     for image_url in image_urls:
         chat_completion = await client.chat.completions.create(
             messages=[
+                {"role": "system", "content": "You are a helpful assistant."},
                 {
-                    "role": "system",
-                    "content": "You are a helpful assistant."
-                },
-                {
-                    "role":
-                    "user",
+                    "role": "user",
                     "content": [
                         {
                             "type": "text",
diff --git a/tests/entrypoints/openai/tool_parsers/test_hermes_tool_parser.py b/tests/entrypoints/openai/tool_parsers/test_hermes_tool_parser.py
index 1da06be2eba9..38008dafe32b 100644
--- a/tests/entrypoints/openai/tool_parsers/test_hermes_tool_parser.py
+++ b/tests/entrypoints/openai/tool_parsers/test_hermes_tool_parser.py
@@ -6,8 +6,7 @@
 import pytest
 
 from vllm.entrypoints.openai.protocol import ChatCompletionRequest
-from vllm.entrypoints.openai.tool_parsers.hermes_tool_parser import (
-    Hermes2ProToolParser)
+from vllm.entrypoints.openai.tool_parsers.hermes_tool_parser import Hermes2ProToolParser
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
 from ....utils import RemoteOpenAIServer
@@ -27,61 +26,64 @@
     f"{LORA_MODEL}",
 ]
 
-TOOLS = [{
-    "type": "function",
-    "function": {
-        "name": "get_current_weather",
-        "description": "Get the current weather in a given location",
-        "parameters": {
-            "type": "object",
-            "properties": {
-                "location": {
-                    "type": "string",
-                    "description":
-                    "The city and state, e.g. San Francisco, CA",
-                },
-                "unit": {
-                    "type": "string",
-                    "enum": ["celsius", "fahrenheit"],
+TOOLS = [
+    {
+        "type": "function",
+        "function": {
+            "name": "get_current_weather",
+            "description": "Get the current weather in a given location",
+            "parameters": {
+                "type": "object",
+                "properties": {
+                    "location": {
+                        "type": "string",
+                        "description": "The city and state, e.g. San Francisco, CA",
+                    },
+                    "unit": {
+                        "type": "string",
+                        "enum": ["celsius", "fahrenheit"],
+                    },
                 },
+                "required": ["location"],
             },
-            "required": ["location"],
         },
-    },
-}]
-
-PRODUCT_TOOLS = [{
-    "type": "function",
-    "function": {
-        "name": "get_product_info",
-        "description": "Get detailed information of a product based on its "
-        "product ID.",
-        "parameters": {
-            "type": "object",
-            "properties": {
-                "inserted": {
-                    "type": "boolean",
-                    "description": "inserted.",
-                },
-                "product_id": {
-                    "type": "integer",
-                    "description": "The product ID of the product.",
+    }
+]
+
+PRODUCT_TOOLS = [
+    {
+        "type": "function",
+        "function": {
+            "name": "get_product_info",
+            "description": "Get detailed information of a product based on its "
+            "product ID.",
+            "parameters": {
+                "type": "object",
+                "properties": {
+                    "inserted": {
+                        "type": "boolean",
+                        "description": "inserted.",
+                    },
+                    "product_id": {
+                        "type": "integer",
+                        "description": "The product ID of the product.",
+                    },
                 },
+                "required": ["product_id", "inserted"],
             },
-            "required": ["product_id", "inserted"],
         },
-    },
-}]
+    }
+]
 
 MESSAGES = [{"role": "user", "content": "What's the weather like in Boston?"}]
 
-PRODUCT_MESSAGES = [{
-    "role":
-    "user",
-    "content":
-    "Hi! Do you have any detailed information about the product id "
-    "7355608 and inserted true?",
-}]
+PRODUCT_MESSAGES = [
+    {
+        "role": "user",
+        "content": "Hi! Do you have any detailed information about the product id "
+        "7355608 and inserted true?",
+    }
+]
 
 
 @pytest.mark.asyncio
@@ -150,7 +152,8 @@ async def test_streaming_tool_call():
                     tool_call_chunks[index]["name"] += tool_chunk.function.name
                 if tool_chunk.function.arguments:
                     tool_call_chunks[index]["arguments"] += (
-                        tool_chunk.function.arguments)
+                        tool_chunk.function.arguments
+                    )
 
         assert len(tool_call_chunks) == 1
         reconstructed_tool_call = tool_call_chunks[0]
@@ -240,7 +243,8 @@ async def test_streaming_product_tool_call():
                     tool_call_chunks[index]["name"] += tool_chunk.function.name
                 if tool_chunk.function.arguments:
                     tool_call_chunks[index]["arguments"] += (
-                        tool_chunk.function.arguments)
+                        tool_chunk.function.arguments
+                    )
 
         assert len(tool_call_chunks) == 1
         reconstructed_tool_call = tool_call_chunks[0]
@@ -291,9 +295,7 @@ def test_hermes_parser_streaming_just_forward_text(
     hermes_parser: Hermes2ProToolParser,
     any_chat_request: ChatCompletionRequest,
 ) -> None:
-    text = (
-        """This is some prior text that has nothing to do with tool calling."""
-    )
+    text = """This is some prior text that has nothing to do with tool calling."""
     tokens = qwen_tokenizer.encode(text)
     previous_text = ""
     delta_messages = []
@@ -348,8 +350,9 @@ def test_hermes_parser_streaming_failure_case_bug_19056(
             delta_messages.append(delta)
 
     assert delta_messages[0].tool_calls[0].function.name == "final_answer"
-    tool_call_args = "".join(delta.tool_calls[0].function.arguments or ""
-                             for delta in delta_messages)
+    tool_call_args = "".join(
+        delta.tool_calls[0].function.arguments or "" for delta in delta_messages
+    )
     assert tool_call_args == '{"trigger": true}'
 
 
@@ -383,13 +386,13 @@ def test_hermes_parser_streaming(
         if delta is not None:
             delta_messages.append(delta)
     print(delta_messages)
-    assert (delta_messages[0].tool_calls[0].function.name ==
-            "get_current_temperature")
-    tool_call_args = "".join(delta.tool_calls[0].function.arguments or ""
-                             for delta in delta_messages)
+    assert delta_messages[0].tool_calls[0].function.name == "get_current_temperature"
+    tool_call_args = "".join(
+        delta.tool_calls[0].function.arguments or "" for delta in delta_messages
+    )
     assert tool_call_args == (
-        '{"location":"San Francisco, California, United States", '
-        '"unit": "celsius"}')
+        '{"location":"San Francisco, California, United States", "unit": "celsius"}'
+    )
 
 
 def test_hermes_parser_non_streaming_no_tool_call(
diff --git a/tests/entrypoints/openai/tool_parsers/test_hunyuan_a13b_tool_parser.py b/tests/entrypoints/openai/tool_parsers/test_hunyuan_a13b_tool_parser.py
index bd8e06513e13..bdd5344652c4 100644
--- a/tests/entrypoints/openai/tool_parsers/test_hunyuan_a13b_tool_parser.py
+++ b/tests/entrypoints/openai/tool_parsers/test_hunyuan_a13b_tool_parser.py
@@ -8,15 +8,18 @@
 import pytest
 
 from tests.entrypoints.openai.tool_parsers.utils import (
-    run_tool_extraction, run_tool_extraction_streaming)
+    run_tool_extraction,
+    run_tool_extraction_streaming,
+)
 from vllm.entrypoints.openai.protocol import FunctionCall, ToolCall
 from vllm.entrypoints.openai.tool_parsers import ToolParser, ToolParserManager
 
 
 def make_tool_call(name, arguments):
-    return ToolCall(type="function",
-                    function=FunctionCall(name=name,
-                                          arguments=json.dumps(arguments)))
+    return ToolCall(
+        type="function",
+        function=FunctionCall(name=name, arguments=json.dumps(arguments)),
+    )
 
 
 # TODO: add reason prefix and suffix.
@@ -29,70 +32,68 @@ def make_tool_call(name, arguments):
         ("How can I help you today?", [], "How can I help you today?"),
         # Single tool call, no content
         (
-            "<tool_calls>[{\"name\": \"get_weather\", \"arguments\": {\"city\": \"San Francisco\", \"metric\": \"celsius\"}}]</tool_calls>",  #noqa: E501
+            '<tool_calls>[{"name": "get_weather", "arguments": {"city": "San Francisco", "metric": "celsius"}}]</tool_calls>',  # noqa: E501
             [
-                make_tool_call("get_weather", {
-                    "city": "San Francisco",
-                    "metric": "celsius"
-                })
+                make_tool_call(
+                    "get_weather", {"city": "San Francisco", "metric": "celsius"}
+                )
             ],
-            None),
+            None,
+        ),
         # Multiple tool calls
         (
-            "<tool_calls>[{\"name\": \"get_weather\", \"arguments\": {\"city\": \"San Francisco\", \"metric\": \"celsius\"}}, {\"name\": \"register_user\", \"arguments\": {\"name\": \"John Doe\", \"age\": 37, \"address\": {\"city\": \"San Francisco\", \"state\": \"CA\"}, \"role\": null, \"passed_test\": true, \"aliases\": [\"John\", \"Johnny\"]}}]</tool_calls>",  #noqa: E501
+            '<tool_calls>[{"name": "get_weather", "arguments": {"city": "San Francisco", "metric": "celsius"}}, {"name": "register_user", "arguments": {"name": "John Doe", "age": 37, "address": {"city": "San Francisco", "state": "CA"}, "role": null, "passed_test": true, "aliases": ["John", "Johnny"]}}]</tool_calls>',  # noqa: E501
             [
-                make_tool_call("get_weather", {
-                    "city": "San Francisco",
-                    "metric": "celsius"
-                }),
                 make_tool_call(
-                    "register_user", {
+                    "get_weather", {"city": "San Francisco", "metric": "celsius"}
+                ),
+                make_tool_call(
+                    "register_user",
+                    {
                         "name": "John Doe",
                         "age": 37,
-                        "address": {
-                            "city": "San Francisco",
-                            "state": "CA"
-                        },
+                        "address": {"city": "San Francisco", "state": "CA"},
                         "role": None,
                         "passed_test": True,
-                        "aliases": ["John", "Johnny"]
-                    })
+                        "aliases": ["John", "Johnny"],
+                    },
+                ),
             ],
-            None),
+            None,
+        ),
         # Content before tool call
         (
-            "I will call the tool now. <tool_calls>[{\"name\": \"get_weather\", \"arguments\": {\"city\": \"Boston\"}}]</tool_calls>",  #noqa: E501
+            'I will call the tool now. <tool_calls>[{"name": "get_weather", "arguments": {"city": "Boston"}}]</tool_calls>',  # noqa: E501
             [make_tool_call("get_weather", {"city": "Boston"})],
-            "I will call the tool now. "),
+            "I will call the tool now. ",
+        ),
         # Content after tool call (should be stripped)
         (
-            "<tool_calls>[{\"name\": \"get_weather\", \"arguments\": {\"city\": \"Seattle\"}}]</tool_calls>\nThank you!",  #noqa: E501
+            '<tool_calls>[{"name": "get_weather", "arguments": {"city": "Seattle"}}]</tool_calls>\nThank you!',  # noqa: E501
             [make_tool_call("get_weather", {"city": "Seattle"})],
-            None),
+            None,
+        ),
         (
-            "<tool_calls>[{\"name\": \"complex_tool\", \"arguments\": {\"level1\": {\"level2\": {\"level3\": {\"value\": 123}}}}}]</tool_calls>",
+            '<tool_calls>[{"name": "complex_tool", "arguments": {"level1": {"level2": {"level3": {"value": 123}}}}}]</tool_calls>',
             [
                 make_tool_call(
-                    "complex_tool",
-                    {"level1": {
-                        "level2": {
-                            "level3": {
-                                "value": 123
-                            }
-                        }
-                    }})
+                    "complex_tool", {"level1": {"level2": {"level3": {"value": 123}}}}
+                )
             ],
             None,
         ),
-    ])
-def test_hunyuan_a13b_tool_parser_extract(model_output, expected_tool_calls,
-                                          expected_content):
+    ],
+)
+def test_hunyuan_a13b_tool_parser_extract(
+    model_output, expected_tool_calls, expected_content
+):
     mock_tokenizer = MagicMock()
-    tool_parser: ToolParser = ToolParserManager.get_tool_parser(
-        "hunyuan_a13b")(mock_tokenizer)
-    content, tool_calls = run_tool_extraction(tool_parser,
-                                              model_output,
-                                              streaming=False)
+    tool_parser: ToolParser = ToolParserManager.get_tool_parser("hunyuan_a13b")(
+        mock_tokenizer
+    )
+    content, tool_calls = run_tool_extraction(
+        tool_parser, model_output, streaming=False
+    )
 
     # align the random id.
     for idx in range(len(tool_calls)):
@@ -102,49 +103,74 @@ def test_hunyuan_a13b_tool_parser_extract(model_output, expected_tool_calls,
 
 
 # Streaming test: simulate incremental output
-@pytest.mark.parametrize("model_deltas,expected_tool_calls", [
-    ([
-        "<tool_calls>[{\"name\": \"get_weather\", ",
-        "\"arguments\": {\"city\": \"San Francisco\", ",
-        "\"metric\": \"celsius\"}}]", "</tool_calls>"
-    ], [
-        make_tool_call("get_weather", {
-            "city": "San Francisco",
-            "metric": "celsius"
-        })
-    ]),
-    ([
-        "<tool_calls>[{\"name\":", " \"get_weather\",", " \"arguments\":",
-        " {\"city\": \"Boston\"}", "}]", "</tool_calls>"
-    ], [make_tool_call("get_weather", {"city": "Boston"})]),
-    ([
-        "", "<tool_calls>[{\"name\":", " \"get_weather\",", " \"arguments\":",
-        " {\"city\": \"Boston\"}", "}]", "</tool_calls>", "\n</answer>"
-    ], [make_tool_call("get_weather", {"city": "Boston"})]),
-    pytest.param([
-        "<tool_calls>[{\"name\": \"complex_tool\",", " \"arguments\": ",
-        " {\"level1\": {\"level2\": ", "{\"level3\": {\"value\": 123}}}}}",
-        "]</tool_calls>"
-    ], [
-        make_tool_call("complex_tool",
-                       {"level1": {
-                           "level2": {
-                               "level3": {
-                                   "value": 123
-                               }
-                           }
-                       }})
+@pytest.mark.parametrize(
+    "model_deltas,expected_tool_calls",
+    [
+        (
+            [
+                '<tool_calls>[{"name": "get_weather", ',
+                '"arguments": {"city": "San Francisco", ',
+                '"metric": "celsius"}}]',
+                "</tool_calls>",
+            ],
+            [
+                make_tool_call(
+                    "get_weather", {"city": "San Francisco", "metric": "celsius"}
+                )
+            ],
+        ),
+        (
+            [
+                '<tool_calls>[{"name":',
+                ' "get_weather",',
+                ' "arguments":',
+                ' {"city": "Boston"}',
+                "}]",
+                "</tool_calls>",
+            ],
+            [make_tool_call("get_weather", {"city": "Boston"})],
+        ),
+        (
+            [
+                "",
+                '<tool_calls>[{"name":',
+                ' "get_weather",',
+                ' "arguments":',
+                ' {"city": "Boston"}',
+                "}]",
+                "</tool_calls>",
+                "\n</answer>",
+            ],
+            [make_tool_call("get_weather", {"city": "Boston"})],
+        ),
+        pytest.param(
+            [
+                '<tool_calls>[{"name": "complex_tool",',
+                ' "arguments": ',
+                ' {"level1": {"level2": ',
+                '{"level3": {"value": 123}}}}}',
+                "]</tool_calls>",
+            ],
+            [
+                make_tool_call(
+                    "complex_tool", {"level1": {"level2": {"level3": {"value": 123}}}}
+                )
+            ],
+            marks=pytest.mark.xfail(
+                reason="stream parsing not support nested json yet."
+            ),
+        ),
     ],
-                 marks=pytest.mark.xfail(
-                     reason="stream parsing not support nested json yet.")),
-])
+)
 def test_hunyuan_a13b_tool_parser_streaming(model_deltas, expected_tool_calls):
     mock_tokenizer = MagicMock()
 
-    tool_parser: ToolParser = ToolParserManager.get_tool_parser(
-        "hunyuan_a13b")(mock_tokenizer)
+    tool_parser: ToolParser = ToolParserManager.get_tool_parser("hunyuan_a13b")(
+        mock_tokenizer
+    )
     reconstructor = run_tool_extraction_streaming(
-        tool_parser, model_deltas, assert_one_tool_per_delta=False)
+        tool_parser, model_deltas, assert_one_tool_per_delta=False
+    )
 
     # align the random id.
     for idx in range(len(reconstructor.tool_calls)):
diff --git a/tests/entrypoints/openai/tool_parsers/test_llama3_json_tool_parser.py b/tests/entrypoints/openai/tool_parsers/test_llama3_json_tool_parser.py
index 09726c7e3e5b..c7a8ef83cf71 100644
--- a/tests/entrypoints/openai/tool_parsers/test_llama3_json_tool_parser.py
+++ b/tests/entrypoints/openai/tool_parsers/test_llama3_json_tool_parser.py
@@ -5,8 +5,7 @@
 from transformers import AutoTokenizer
 
 from vllm.entrypoints.openai.protocol import ExtractedToolCallInformation
-from vllm.entrypoints.openai.tool_parsers.llama_tool_parser import (
-    Llama3JsonToolParser)
+from vllm.entrypoints.openai.tool_parsers.llama_tool_parser import Llama3JsonToolParser
 
 
 @pytest.fixture
@@ -18,8 +17,10 @@ def parser():
 
 def test_extract_tool_calls_simple(parser):
     # Test with a simple tool call
-    model_output = ('Here is the result: {"name": "getOpenIncidentsTool", '
-                    '"parameters": {}} Would you like to know more?')
+    model_output = (
+        'Here is the result: {"name": "getOpenIncidentsTool", '
+        '"parameters": {}} Would you like to know more?'
+    )
     result = parser.extract_tool_calls(model_output, None)
 
     assert isinstance(result, ExtractedToolCallInformation)
@@ -34,8 +35,8 @@ def test_extract_tool_calls_simple(parser):
 def test_extract_tool_calls_with_arguments(parser):
     # Test with a tool call that has arguments
     model_output = (
-        '{"name": "searchTool", "parameters": {"query": "test query", '
-        '"limit": 10}}')
+        '{"name": "searchTool", "parameters": {"query": "test query", "limit": 10}}'
+    )
     result = parser.extract_tool_calls(model_output, None)
 
     assert result.tools_called is True
@@ -81,7 +82,8 @@ def test_extract_tool_calls_multiple_json(parser):
     model_output = (
         '{"name": "searchTool", "parameters": {"query": "test1"}}; '
         '{"name": "getOpenIncidentsTool", "parameters": {}}; '
-        '{"name": "searchTool", "parameters": {"query": "test2"}}')
+        '{"name": "searchTool", "parameters": {"query": "test2"}}'
+    )
     result = parser.extract_tool_calls(model_output, None)
 
     assert result.tools_called is True
@@ -105,7 +107,8 @@ def test_extract_tool_calls_multiple_json_with_whitespace(parser):
     model_output = (
         '{"name": "searchTool", "parameters": {"query": "test1"}} ; '
         '{"name": "getOpenIncidentsTool", "parameters": {}} ; '
-        '{"name": "searchTool", "parameters": {"query": "test2"}}')
+        '{"name": "searchTool", "parameters": {"query": "test2"}}'
+    )
     result = parser.extract_tool_calls(model_output, None)
 
     assert result.tools_called is True
@@ -118,11 +121,12 @@ def test_extract_tool_calls_multiple_json_with_whitespace(parser):
 def test_extract_tool_calls_multiple_json_with_surrounding_text(parser):
     # Test with multiple JSONs and surrounding text
     model_output = (
-        'Here are the results: '
+        "Here are the results: "
         '{"name": "searchTool", "parameters": {"query": "test1"}}; '
         '{"name": "getOpenIncidentsTool", "parameters": {}}; '
         '{"name": "searchTool", "parameters": {"query": "test2"}} '
-        'Would you like to know more?')
+        "Would you like to know more?"
+    )
     result = parser.extract_tool_calls(model_output, None)
 
     assert result.tools_called is True
diff --git a/tests/entrypoints/openai/tool_parsers/test_llama4_pythonic_tool_parser.py b/tests/entrypoints/openai/tool_parsers/test_llama4_pythonic_tool_parser.py
index 8c86b4889e15..94277980f229 100644
--- a/tests/entrypoints/openai/tool_parsers/test_llama4_pythonic_tool_parser.py
+++ b/tests/entrypoints/openai/tool_parsers/test_llama4_pythonic_tool_parser.py
@@ -6,7 +6,9 @@
 import pytest
 
 from tests.entrypoints.openai.tool_parsers.utils import (
-    run_tool_extraction, run_tool_extraction_streaming)
+    run_tool_extraction,
+    run_tool_extraction_streaming,
+)
 from vllm.entrypoints.openai.protocol import FunctionCall
 from vllm.entrypoints.openai.tool_parsers import ToolParser, ToolParserManager
 
@@ -16,12 +18,14 @@
     name="get_weather",
     arguments='{"city": "LA", "metric": "C"}',
 )
-MORE_TYPES_FUNCTION_OUTPUT = ("[register_user(name='Doe', "
-                              "age=9, "
-                              "address={'city': 'LA', 'state': 'CA'}, "
-                              "role=None, "
-                              "passed_test=True, "
-                              "aliases=['John', 'Johnny'])]")
+MORE_TYPES_FUNCTION_OUTPUT = (
+    "[register_user(name='Doe', "
+    "age=9, "
+    "address={'city': 'LA', 'state': 'CA'}, "
+    "role=None, "
+    "passed_test=True, "
+    "aliases=['John', 'Johnny'])]"
+)
 MORE_TYPES_FUNCTION_CALL = FunctionCall(
     name="register_user",
     arguments='{"name": "Doe", '
@@ -34,7 +38,7 @@
 PARAMETERLESS_FUNCTION_OUTPUT = "[get_weather()]"
 PARAMETERLESS_FUNCTION_CALL = FunctionCall(
     name="get_weather",
-    arguments='{}',
+    arguments="{}",
 )
 EMPTY_DICT_FUNCTION_OUTPUT = "[do_something_cool(additional_data={})]"
 EMPTY_DICT_FUNCTION_CALL = FunctionCall(
@@ -47,25 +51,28 @@
     arguments='{"steps": []}',
 )
 ESCAPED_STRING_FUNCTION_OUTPUT = (
-    r"[get_weather(city='Martha\'s Vineyard', metric='\"cool units\"')]")
+    r"[get_weather(city='Martha\'s Vineyard', metric='\"cool units\"')]"
+)
 ESCAPED_STRING_FUNCTION_CALL = FunctionCall(
     name="get_weather",
     arguments='{"city": "Martha\'s Vineyard", "metric": "\\"cool units\\""}',
 )
 PYTHON_TAG_FUNCTION_OUTPUT = (
-    "<|python_start|>[get_weather(city='LA', metric='C')]<|python_end|>")
+    "<|python_start|>[get_weather(city='LA', metric='C')]<|python_end|>"
+)
 
 
 @pytest.mark.parametrize("streaming", [True, False])
 def test_no_tool_call(streaming: bool):
     mock_tokenizer = MagicMock()
-    tool_parser: ToolParser = ToolParserManager.get_tool_parser(
-        "llama4_pythonic")(mock_tokenizer)
+    tool_parser: ToolParser = ToolParserManager.get_tool_parser("llama4_pythonic")(
+        mock_tokenizer
+    )
     model_output = "How can I help you today?"
 
-    content, tool_calls = run_tool_extraction(tool_parser,
-                                              model_output,
-                                              streaming=streaming)
+    content, tool_calls = run_tool_extraction(
+        tool_parser, model_output, streaming=streaming
+    )
 
     assert content == model_output
     assert len(tool_calls) == 0
@@ -75,98 +82,139 @@ def test_no_tool_call(streaming: bool):
 test_str += "[get_weather(city='LA', metric='C'),"
 test_str += "register_user(name='Doe', age=9)]"
 TEST_CASES = [
-    pytest.param(True,
-                 ESCAPED_STRING_FUNCTION_OUTPUT,
-                 [ESCAPED_STRING_FUNCTION_CALL],
-                 id="simple_streaming"),
-    pytest.param(False,
-                 SIMPLE_FUNCTION_OUTPUT, [SIMPLE_FUNCTION_CALL],
-                 id="simple_nonstreaming"),
-    pytest.param(True,
-                 MORE_TYPES_FUNCTION_OUTPUT, [MORE_TYPES_FUNCTION_CALL],
-                 id="more_types_streaming"),
-    pytest.param(False,
-                 MORE_TYPES_FUNCTION_OUTPUT, [MORE_TYPES_FUNCTION_CALL],
-                 id="more_types_nonstreaming"),
-    pytest.param(True,
-                 PARAMETERLESS_FUNCTION_OUTPUT, [PARAMETERLESS_FUNCTION_CALL],
-                 id="parameterless_streaming"),
-    pytest.param(False,
-                 PARAMETERLESS_FUNCTION_OUTPUT, [PARAMETERLESS_FUNCTION_CALL],
-                 id="parameterless_nonstreaming"),
-    pytest.param(True,
-                 EMPTY_DICT_FUNCTION_OUTPUT, [EMPTY_DICT_FUNCTION_CALL],
-                 id="empty_dict_streaming"),
-    pytest.param(False,
-                 EMPTY_DICT_FUNCTION_OUTPUT, [EMPTY_DICT_FUNCTION_CALL],
-                 id="empty_dict_nonstreaming"),
-    pytest.param(True,
-                 EMPTY_LIST_FUNCTION_OUTPUT, [EMPTY_LIST_FUNCTION_CALL],
-                 id="empty_list_streaming"),
-    pytest.param(False,
-                 EMPTY_LIST_FUNCTION_OUTPUT, [EMPTY_LIST_FUNCTION_CALL],
-                 id="empty_list_nonstreaming"),
-    pytest.param(True,
-                 ESCAPED_STRING_FUNCTION_OUTPUT,
-                 [ESCAPED_STRING_FUNCTION_CALL],
-                 id="escaped_string_streaming"),
-    pytest.param(False,
-                 ESCAPED_STRING_FUNCTION_OUTPUT,
-                 [ESCAPED_STRING_FUNCTION_CALL],
-                 id="escaped_string_nonstreaming"),
+    pytest.param(
+        True,
+        ESCAPED_STRING_FUNCTION_OUTPUT,
+        [ESCAPED_STRING_FUNCTION_CALL],
+        id="simple_streaming",
+    ),
+    pytest.param(
+        False, SIMPLE_FUNCTION_OUTPUT, [SIMPLE_FUNCTION_CALL], id="simple_nonstreaming"
+    ),
+    pytest.param(
+        True,
+        MORE_TYPES_FUNCTION_OUTPUT,
+        [MORE_TYPES_FUNCTION_CALL],
+        id="more_types_streaming",
+    ),
+    pytest.param(
+        False,
+        MORE_TYPES_FUNCTION_OUTPUT,
+        [MORE_TYPES_FUNCTION_CALL],
+        id="more_types_nonstreaming",
+    ),
+    pytest.param(
+        True,
+        PARAMETERLESS_FUNCTION_OUTPUT,
+        [PARAMETERLESS_FUNCTION_CALL],
+        id="parameterless_streaming",
+    ),
+    pytest.param(
+        False,
+        PARAMETERLESS_FUNCTION_OUTPUT,
+        [PARAMETERLESS_FUNCTION_CALL],
+        id="parameterless_nonstreaming",
+    ),
+    pytest.param(
+        True,
+        EMPTY_DICT_FUNCTION_OUTPUT,
+        [EMPTY_DICT_FUNCTION_CALL],
+        id="empty_dict_streaming",
+    ),
+    pytest.param(
+        False,
+        EMPTY_DICT_FUNCTION_OUTPUT,
+        [EMPTY_DICT_FUNCTION_CALL],
+        id="empty_dict_nonstreaming",
+    ),
+    pytest.param(
+        True,
+        EMPTY_LIST_FUNCTION_OUTPUT,
+        [EMPTY_LIST_FUNCTION_CALL],
+        id="empty_list_streaming",
+    ),
+    pytest.param(
+        False,
+        EMPTY_LIST_FUNCTION_OUTPUT,
+        [EMPTY_LIST_FUNCTION_CALL],
+        id="empty_list_nonstreaming",
+    ),
+    pytest.param(
+        True,
+        ESCAPED_STRING_FUNCTION_OUTPUT,
+        [ESCAPED_STRING_FUNCTION_CALL],
+        id="escaped_string_streaming",
+    ),
+    pytest.param(
+        False,
+        ESCAPED_STRING_FUNCTION_OUTPUT,
+        [ESCAPED_STRING_FUNCTION_CALL],
+        id="escaped_string_nonstreaming",
+    ),
     pytest.param(
         True,
         "[get_weather(city='LA',metric='C'),register_user(name='Doe',age=9)]",
         [
             SIMPLE_FUNCTION_CALL,
-            FunctionCall(name="register_user",
-                         arguments='{"name": "Doe", "age": 9}')
+            FunctionCall(name="register_user", arguments='{"name": "Doe", "age": 9}'),
         ],
-        id="parallel_calls_streaming"),
+        id="parallel_calls_streaming",
+    ),
     pytest.param(
         False,
         "[get_weather(city='LA',metric='C'),register_user(name='Doe',age=9)]",
         [
             SIMPLE_FUNCTION_CALL,
-            FunctionCall(name="register_user",
-                         arguments='{"name": "Doe", "age": 9}')
+            FunctionCall(name="register_user", arguments='{"name": "Doe", "age": 9}'),
+        ],
+        id="parallel_calls_nonstreaming",
+    ),
+    pytest.param(
+        True,
+        PYTHON_TAG_FUNCTION_OUTPUT,
+        [SIMPLE_FUNCTION_CALL],
+        id="python_tag_streaming",
+    ),
+    pytest.param(
+        False,
+        PYTHON_TAG_FUNCTION_OUTPUT,
+        [SIMPLE_FUNCTION_CALL],
+        id="python_tag_nonstreaming",
+    ),
+    pytest.param(
+        True,
+        test_str,
+        [
+            SIMPLE_FUNCTION_CALL,
+            FunctionCall(name="register_user", arguments='{"name": "Doe", "age": 9}'),
+        ],
+        id="parallel_calls_streaming",
+    ),
+    pytest.param(
+        False,
+        "<|python_start|>[get_weather(city='LA', metric='C'), "
+        + "register_user(name='Doe', age=9)]",
+        [
+            SIMPLE_FUNCTION_CALL,
+            FunctionCall(name="register_user", arguments='{"name": "Doe", "age": 9}'),
         ],
-        id="parallel_calls_nonstreaming"),
-    pytest.param(True,
-                 PYTHON_TAG_FUNCTION_OUTPUT, [SIMPLE_FUNCTION_CALL],
-                 id="python_tag_streaming"),
-    pytest.param(False,
-                 PYTHON_TAG_FUNCTION_OUTPUT, [SIMPLE_FUNCTION_CALL],
-                 id="python_tag_nonstreaming"),
-    pytest.param(True,
-                 test_str, [
-                     SIMPLE_FUNCTION_CALL,
-                     FunctionCall(name="register_user",
-                                  arguments='{"name": "Doe", "age": 9}')
-                 ],
-                 id="parallel_calls_streaming"),
-    pytest.param(False,
-                 "<|python_start|>[get_weather(city='LA', metric='C'), " +
-                 "register_user(name='Doe', age=9)]", [
-                     SIMPLE_FUNCTION_CALL,
-                     FunctionCall(name="register_user",
-                                  arguments='{"name": "Doe", "age": 9}')
-                 ],
-                 id="parallel_calls_nonstreaming"),
+        id="parallel_calls_nonstreaming",
+    ),
 ]
 
 
-@pytest.mark.parametrize("streaming, model_output, expected_tool_calls",
-                         TEST_CASES)
-def test_tool_call(streaming: bool, model_output: str,
-                   expected_tool_calls: list[FunctionCall]):
+@pytest.mark.parametrize("streaming, model_output, expected_tool_calls", TEST_CASES)
+def test_tool_call(
+    streaming: bool, model_output: str, expected_tool_calls: list[FunctionCall]
+):
     mock_tokenizer = MagicMock()
-    tool_parser: ToolParser = ToolParserManager.get_tool_parser(
-        "llama4_pythonic")(mock_tokenizer)
+    tool_parser: ToolParser = ToolParserManager.get_tool_parser("llama4_pythonic")(
+        mock_tokenizer
+    )
 
-    content, tool_calls = run_tool_extraction(tool_parser,
-                                              model_output,
-                                              streaming=streaming)
+    content, tool_calls = run_tool_extraction(
+        tool_parser, model_output, streaming=streaming
+    )
 
     assert len(tool_calls) == len(expected_tool_calls)
     for actual, expected in zip(tool_calls, expected_tool_calls):
@@ -176,8 +224,9 @@ def test_tool_call(streaming: bool, model_output: str,
 
 def test_streaming_tool_call_with_large_steps():
     mock_tokenizer = MagicMock()
-    tool_parser: ToolParser = ToolParserManager.get_tool_parser(
-        "llama4_pythonic")(mock_tokenizer)
+    tool_parser: ToolParser = ToolParserManager.get_tool_parser("llama4_pythonic")(
+        mock_tokenizer
+    )
     model_output_deltas = [
         "<|python_start|>[get_weather(city='LA', metric='C'), "
         "get_weather(), "
@@ -185,7 +234,8 @@ def test_streaming_tool_call_with_large_steps():
     ]
 
     reconstructor = run_tool_extraction_streaming(
-        tool_parser, model_output_deltas, assert_one_tool_per_delta=False)
+        tool_parser, model_output_deltas, assert_one_tool_per_delta=False
+    )
 
     assert reconstructor.other_content == ""
     assert len(reconstructor.tool_calls) == 3
@@ -198,8 +248,9 @@ def test_streaming_tool_call_with_large_steps():
 def test_regex_timeout_handling(streaming: bool):
     """test regex timeout is handled gracefully"""
     mock_tokenizer = MagicMock()
-    tool_parser: ToolParser = ToolParserManager.get_tool_parser(
-        "llama4_pythonic")(mock_tokenizer)
+    tool_parser: ToolParser = ToolParserManager.get_tool_parser("llama4_pythonic")(
+        mock_tokenizer
+    )
 
     fake_problematic_input = "hello world[A(A=" + "\t)A(A=,\t" * 2
 
@@ -207,10 +258,10 @@ def test_regex_timeout_handling(streaming: bool):
     mock_regex = MagicMock()
     mock_regex.match.side_effect = TimeoutError("Regex timeout")
 
-    with patch.object(tool_parser, 'TOOL_CALL_REGEX', mock_regex):
-        content, tool_calls = run_tool_extraction(tool_parser,
-                                                  fake_problematic_input,
-                                                  streaming=streaming)
+    with patch.object(tool_parser, "TOOL_CALL_REGEX", mock_regex):
+        content, tool_calls = run_tool_extraction(
+            tool_parser, fake_problematic_input, streaming=streaming
+        )
 
         # should treat as regular text when regex times out
         assert content == fake_problematic_input
diff --git a/tests/entrypoints/openai/tool_parsers/test_pythonic_tool_parser.py b/tests/entrypoints/openai/tool_parsers/test_pythonic_tool_parser.py
index d83137472598..ccd6abbac4c9 100644
--- a/tests/entrypoints/openai/tool_parsers/test_pythonic_tool_parser.py
+++ b/tests/entrypoints/openai/tool_parsers/test_pythonic_tool_parser.py
@@ -6,7 +6,9 @@
 import pytest
 
 from tests.entrypoints.openai.tool_parsers.utils import (
-    run_tool_extraction, run_tool_extraction_streaming)
+    run_tool_extraction,
+    run_tool_extraction_streaming,
+)
 from vllm.entrypoints.openai.protocol import FunctionCall
 from vllm.entrypoints.openai.tool_parsers import ToolParser, ToolParserManager
 
@@ -22,7 +24,8 @@
     "address={'city': 'San Francisco', 'state': 'CA'}, "
     "role=None, "
     "passed_test=True, "
-    "aliases=['John', 'Johnny'])")
+    "aliases=['John', 'Johnny'])"
+)
 MORE_TYPES_FUNCTION_CALL = FunctionCall(
     name="register_user",
     arguments='{"name": "John Doe", '
@@ -35,7 +38,7 @@
 PARAMETERLESS_FUNCTION_OUTPUT = "get_weather()"
 PARAMETERLESS_FUNCTION_CALL = FunctionCall(
     name="get_weather",
-    arguments='{}',
+    arguments="{}",
 )
 EMPTY_DICT_FUNCTION_OUTPUT = "do_something_cool(additional_data={})"
 EMPTY_DICT_FUNCTION_CALL = FunctionCall(
@@ -48,7 +51,8 @@
     arguments='{"steps": []}',
 )
 ESCAPED_STRING_FUNCTION_OUTPUT = (
-    r"get_weather(city='Martha\'s Vineyard', metric='\"cool units\"')")
+    r"get_weather(city='Martha\'s Vineyard', metric='\"cool units\"')"
+)
 ESCAPED_STRING_FUNCTION_CALL = FunctionCall(
     name="get_weather",
     arguments='{"city": "Martha\'s Vineyard", "metric": "\\"cool units\\""}',
@@ -59,80 +63,118 @@
 def test_no_tool_call(streaming: bool):
     mock_tokenizer = MagicMock()
     tool_parser: ToolParser = ToolParserManager.get_tool_parser("pythonic")(
-        mock_tokenizer)
+        mock_tokenizer
+    )
     model_output = "How can I help you today?"
 
-    content, tool_calls = run_tool_extraction(tool_parser,
-                                              model_output,
-                                              streaming=streaming)
+    content, tool_calls = run_tool_extraction(
+        tool_parser, model_output, streaming=streaming
+    )
 
     assert content == model_output
     assert len(tool_calls) == 0
 
 
 TEST_CASES = [
-    pytest.param(True,
-                 f"[{SIMPLE_FUNCTION_OUTPUT}]", [SIMPLE_FUNCTION_CALL],
-                 id="simple_streaming"),
-    pytest.param(False,
-                 f"[{SIMPLE_FUNCTION_OUTPUT}]", [SIMPLE_FUNCTION_CALL],
-                 id="simple_nonstreaming"),
-    pytest.param(True,
-                 f"[{MORE_TYPES_FUNCTION_OUTPUT}]", [MORE_TYPES_FUNCTION_CALL],
-                 id="more_types_streaming"),
-    pytest.param(False,
-                 f"[{MORE_TYPES_FUNCTION_OUTPUT}]", [MORE_TYPES_FUNCTION_CALL],
-                 id="more_types_nonstreaming"),
-    pytest.param(True,
-                 f"[{PARAMETERLESS_FUNCTION_OUTPUT}]",
-                 [PARAMETERLESS_FUNCTION_CALL],
-                 id="parameterless_streaming"),
-    pytest.param(False,
-                 f"[{PARAMETERLESS_FUNCTION_OUTPUT}]",
-                 [PARAMETERLESS_FUNCTION_CALL],
-                 id="parameterless_nonstreaming"),
-    pytest.param(True,
-                 f"[{EMPTY_DICT_FUNCTION_OUTPUT}]", [EMPTY_DICT_FUNCTION_CALL],
-                 id="empty_dict_streaming"),
-    pytest.param(False,
-                 f"[{EMPTY_DICT_FUNCTION_OUTPUT}]", [EMPTY_DICT_FUNCTION_CALL],
-                 id="empty_dict_nonstreaming"),
-    pytest.param(True,
-                 f"[{EMPTY_LIST_FUNCTION_OUTPUT}]", [EMPTY_LIST_FUNCTION_CALL],
-                 id="empty_list_streaming"),
-    pytest.param(False,
-                 f"[{EMPTY_LIST_FUNCTION_OUTPUT}]", [EMPTY_LIST_FUNCTION_CALL],
-                 id="empty_list_nonstreaming"),
-    pytest.param(True,
-                 f"[{ESCAPED_STRING_FUNCTION_OUTPUT}]",
-                 [ESCAPED_STRING_FUNCTION_CALL],
-                 id="escaped_string_streaming"),
-    pytest.param(False,
-                 f"[{ESCAPED_STRING_FUNCTION_OUTPUT}]",
-                 [ESCAPED_STRING_FUNCTION_CALL],
-                 id="escaped_string_nonstreaming"),
-    pytest.param(True,
-                 f"[{SIMPLE_FUNCTION_OUTPUT}, {MORE_TYPES_FUNCTION_OUTPUT}]",
-                 [SIMPLE_FUNCTION_CALL, MORE_TYPES_FUNCTION_CALL],
-                 id="parallel_calls_streaming"),
-    pytest.param(False,
-                 f"[{SIMPLE_FUNCTION_OUTPUT}, {MORE_TYPES_FUNCTION_OUTPUT}]",
-                 [SIMPLE_FUNCTION_CALL, MORE_TYPES_FUNCTION_CALL],
-                 id="parallel_calls_nonstreaming"),
+    pytest.param(
+        True,
+        f"[{SIMPLE_FUNCTION_OUTPUT}]",
+        [SIMPLE_FUNCTION_CALL],
+        id="simple_streaming",
+    ),
+    pytest.param(
+        False,
+        f"[{SIMPLE_FUNCTION_OUTPUT}]",
+        [SIMPLE_FUNCTION_CALL],
+        id="simple_nonstreaming",
+    ),
+    pytest.param(
+        True,
+        f"[{MORE_TYPES_FUNCTION_OUTPUT}]",
+        [MORE_TYPES_FUNCTION_CALL],
+        id="more_types_streaming",
+    ),
+    pytest.param(
+        False,
+        f"[{MORE_TYPES_FUNCTION_OUTPUT}]",
+        [MORE_TYPES_FUNCTION_CALL],
+        id="more_types_nonstreaming",
+    ),
+    pytest.param(
+        True,
+        f"[{PARAMETERLESS_FUNCTION_OUTPUT}]",
+        [PARAMETERLESS_FUNCTION_CALL],
+        id="parameterless_streaming",
+    ),
+    pytest.param(
+        False,
+        f"[{PARAMETERLESS_FUNCTION_OUTPUT}]",
+        [PARAMETERLESS_FUNCTION_CALL],
+        id="parameterless_nonstreaming",
+    ),
+    pytest.param(
+        True,
+        f"[{EMPTY_DICT_FUNCTION_OUTPUT}]",
+        [EMPTY_DICT_FUNCTION_CALL],
+        id="empty_dict_streaming",
+    ),
+    pytest.param(
+        False,
+        f"[{EMPTY_DICT_FUNCTION_OUTPUT}]",
+        [EMPTY_DICT_FUNCTION_CALL],
+        id="empty_dict_nonstreaming",
+    ),
+    pytest.param(
+        True,
+        f"[{EMPTY_LIST_FUNCTION_OUTPUT}]",
+        [EMPTY_LIST_FUNCTION_CALL],
+        id="empty_list_streaming",
+    ),
+    pytest.param(
+        False,
+        f"[{EMPTY_LIST_FUNCTION_OUTPUT}]",
+        [EMPTY_LIST_FUNCTION_CALL],
+        id="empty_list_nonstreaming",
+    ),
+    pytest.param(
+        True,
+        f"[{ESCAPED_STRING_FUNCTION_OUTPUT}]",
+        [ESCAPED_STRING_FUNCTION_CALL],
+        id="escaped_string_streaming",
+    ),
+    pytest.param(
+        False,
+        f"[{ESCAPED_STRING_FUNCTION_OUTPUT}]",
+        [ESCAPED_STRING_FUNCTION_CALL],
+        id="escaped_string_nonstreaming",
+    ),
+    pytest.param(
+        True,
+        f"[{SIMPLE_FUNCTION_OUTPUT}, {MORE_TYPES_FUNCTION_OUTPUT}]",
+        [SIMPLE_FUNCTION_CALL, MORE_TYPES_FUNCTION_CALL],
+        id="parallel_calls_streaming",
+    ),
+    pytest.param(
+        False,
+        f"[{SIMPLE_FUNCTION_OUTPUT}, {MORE_TYPES_FUNCTION_OUTPUT}]",
+        [SIMPLE_FUNCTION_CALL, MORE_TYPES_FUNCTION_CALL],
+        id="parallel_calls_nonstreaming",
+    ),
 ]
 
 
-@pytest.mark.parametrize("streaming, model_output, expected_tool_calls",
-                         TEST_CASES)
-def test_tool_call(streaming: bool, model_output: str,
-                   expected_tool_calls: list[FunctionCall]):
+@pytest.mark.parametrize("streaming, model_output, expected_tool_calls", TEST_CASES)
+def test_tool_call(
+    streaming: bool, model_output: str, expected_tool_calls: list[FunctionCall]
+):
     mock_tokenizer = MagicMock()
     tool_parser: ToolParser = ToolParserManager.get_tool_parser("pythonic")(
-        mock_tokenizer)
+        mock_tokenizer
+    )
 
-    content, tool_calls = run_tool_extraction(tool_parser,
-                                              model_output,
-                                              streaming=streaming)
+    content, tool_calls = run_tool_extraction(
+        tool_parser, model_output, streaming=streaming
+    )
 
     assert content is None
     assert len(tool_calls) == len(expected_tool_calls)
@@ -144,7 +186,8 @@ def test_tool_call(streaming: bool, model_output: str,
 def test_streaming_tool_call_with_large_steps():
     mock_tokenizer = MagicMock()
     tool_parser: ToolParser = ToolParserManager.get_tool_parser("pythonic")(
-        mock_tokenizer)
+        mock_tokenizer
+    )
     model_output_deltas = [
         "[get_weather(city='San",
         " Francisco', metric='celsius'), "
@@ -153,7 +196,8 @@ def test_streaming_tool_call_with_large_steps():
     ]
 
     reconstructor = run_tool_extraction_streaming(
-        tool_parser, model_output_deltas, assert_one_tool_per_delta=False)
+        tool_parser, model_output_deltas, assert_one_tool_per_delta=False
+    )
 
     assert reconstructor.other_content == ""
     assert len(reconstructor.tool_calls) == 3
@@ -166,8 +210,9 @@ def test_streaming_tool_call_with_large_steps():
 def test_regex_timeout_handling(streaming: bool):
     """test regex timeout is handled gracefully"""
     mock_tokenizer = MagicMock()
-    tool_parser: ToolParser = ToolParserManager.get_tool_parser(
-        "llama4_pythonic")(mock_tokenizer)
+    tool_parser: ToolParser = ToolParserManager.get_tool_parser("llama4_pythonic")(
+        mock_tokenizer
+    )
 
     fake_problematic_input = "hello world[A(A=" + "\t)A(A=,\t" * 2
 
@@ -175,10 +220,10 @@ def test_regex_timeout_handling(streaming: bool):
     mock_regex = MagicMock()
     mock_regex.match.side_effect = TimeoutError("Regex timeout")
 
-    with patch.object(tool_parser, 'TOOL_CALL_REGEX', mock_regex):
-        content, tool_calls = run_tool_extraction(tool_parser,
-                                                  fake_problematic_input,
-                                                  streaming=streaming)
+    with patch.object(tool_parser, "TOOL_CALL_REGEX", mock_regex):
+        content, tool_calls = run_tool_extraction(
+            tool_parser, fake_problematic_input, streaming=streaming
+        )
 
         # should treat as regular text when regex times out
         assert content == fake_problematic_input
diff --git a/tests/entrypoints/openai/tool_parsers/utils.py b/tests/entrypoints/openai/tool_parsers/utils.py
index e1b41f45f554..cfa4d3584e70 100644
--- a/tests/entrypoints/openai/tool_parsers/utils.py
+++ b/tests/entrypoints/openai/tool_parsers/utils.py
@@ -4,15 +4,17 @@
 from collections.abc import Iterable
 from typing import Union
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaMessage,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaMessage,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers import ToolParser
 
 
 class StreamingToolReconstructor:
-
     def __init__(self, assert_one_tool_per_delta: bool = True):
         self.tool_calls: list[ToolCall] = []
         self.other_content: str = ""
@@ -23,49 +25,60 @@ def append_delta(self, delta: DeltaMessage):
             self.other_content += delta.content
         else:
             assert delta.tool_calls, (
-                "Streaming results should have either content or tool calls "
-                "(or both)")
+                "Streaming results should have either content or tool calls (or both)"
+            )
         if self._assert_one_tool_per_delta:
             # Note: This isn't strictly required by the API and may not be
             # possible to adhere to depending on the token space and number of
             # tokens per streamed response from the model, but it is required
             # by tool_use tests, so we enforce it here by default also.
             assert len(delta.tool_calls) < 2, (
-                "Streaming should include only one tool call per update.")
+                "Streaming should include only one tool call per update."
+            )
         for call_delta in delta.tool_calls:
             assert call_delta.type is None or call_delta.type == "function", (
                 "Streaming tool calls should only emit function calls. Got "
-                f"{call_delta.type}")
-            current_tool_call = self.tool_calls[
-                call_delta.index] if call_delta.index < len(
-                    self.tool_calls) else None
+                f"{call_delta.type}"
+            )
+            current_tool_call = (
+                self.tool_calls[call_delta.index]
+                if call_delta.index < len(self.tool_calls)
+                else None
+            )
             if current_tool_call:
-                assert (not call_delta.function.name), (
+                assert not call_delta.function.name, (
                     "Streaming tool calls should emit the full function name "
-                    f"exactly once. Got {call_delta.function.name}")
-                assert (not call_delta.id), (
+                    f"exactly once. Got {call_delta.function.name}"
+                )
+                assert not call_delta.id, (
                     "Streaming tool calls must emit function id only once. Got "
-                    f"{call_delta.id}")
-                assert (call_delta.index == len(self.tool_calls) - 1), (
+                    f"{call_delta.id}"
+                )
+                assert call_delta.index == len(self.tool_calls) - 1, (
                     f"Incorrect index for tool delta. Got {call_delta.index}, "
-                    f"expected {len(self.tool_calls) - 1}")
-                current_tool_call.function.arguments += (
-                    call_delta.function.arguments)
+                    f"expected {len(self.tool_calls) - 1}"
+                )
+                current_tool_call.function.arguments += call_delta.function.arguments
             else:
                 assert call_delta.id is not None, (
-                    "Streaming tool calls must have an id on first appearance")
+                    "Streaming tool calls must have an id on first appearance"
+                )
                 assert call_delta.function.name is not None, (
-                    "Streaming tool calls must have a function name on first "
-                    "appearance")
+                    "Streaming tool calls must have a function name on first appearance"
+                )
                 assert call_delta.index == len(self.tool_calls), (
                     f"Incorrect index for tool delta. Got {call_delta.index}, "
-                    f"expected {len(self.tool_calls)}")
+                    f"expected {len(self.tool_calls)}"
+                )
                 self.tool_calls.append(
-                    ToolCall(id=call_delta.id,
-                             function=FunctionCall(
-                                 name=call_delta.function.name,
-                                 arguments=call_delta.function.arguments
-                                 or "")))
+                    ToolCall(
+                        id=call_delta.id,
+                        function=FunctionCall(
+                            name=call_delta.function.name,
+                            arguments=call_delta.function.arguments or "",
+                        ),
+                    )
+                )
 
 
 def run_tool_extraction(
@@ -80,11 +93,11 @@ def run_tool_extraction(
             tool_parser,
             model_output,
             request,
-            assert_one_tool_per_delta=assert_one_tool_per_delta)
+            assert_one_tool_per_delta=assert_one_tool_per_delta,
+        )
         return reconstructor.other_content or None, reconstructor.tool_calls
     else:
-        extracted = run_tool_extraction_nonstreaming(tool_parser, model_output,
-                                                     request)
+        extracted = run_tool_extraction_nonstreaming(tool_parser, model_output, request)
         assert extracted.tools_called == bool(extracted.tool_calls)
         return extracted.content, extracted.tool_calls
 
@@ -92,7 +105,7 @@ def run_tool_extraction(
 def run_tool_extraction_nonstreaming(
     tool_parser: ToolParser,
     model_output: str,
-    request: Union[ChatCompletionRequest, None] = None
+    request: Union[ChatCompletionRequest, None] = None,
 ) -> ExtractedToolCallInformation:
     request = request or ChatCompletionRequest(messages=[], model="test-model")
     return tool_parser.extract_tool_calls(model_output, request)
@@ -106,7 +119,8 @@ def run_tool_extraction_streaming(
 ) -> StreamingToolReconstructor:
     request = request or ChatCompletionRequest(messages=[], model="test-model")
     reconstructor = StreamingToolReconstructor(
-        assert_one_tool_per_delta=assert_one_tool_per_delta)
+        assert_one_tool_per_delta=assert_one_tool_per_delta
+    )
     previous_text = ""
     previous_tokens: list[int] = []
     for delta in model_deltas:
@@ -118,8 +132,14 @@ def run_tool_extraction_streaming(
         current_text = previous_text + delta
         current_tokens = previous_tokens + token_delta
         delta_message = tool_parser.extract_tool_calls_streaming(
-            previous_text, current_text, delta, previous_tokens,
-            current_tokens, token_delta, request)
+            previous_text,
+            current_text,
+            delta,
+            previous_tokens,
+            current_tokens,
+            token_delta,
+            request,
+        )
         if delta_message is not None:
             reconstructor.append_delta(delta_message)
         previous_text = current_text
diff --git a/tests/entrypoints/pooling/correctness/test_mteb_embed.py b/tests/entrypoints/pooling/correctness/test_mteb_embed.py
index 12a4875bdacf..7f16638e51e2 100644
--- a/tests/entrypoints/pooling/correctness/test_mteb_embed.py
+++ b/tests/entrypoints/pooling/correctness/test_mteb_embed.py
@@ -5,8 +5,11 @@
 import pytest
 
 from tests.models.language.pooling_mteb_test.mteb_utils import (
-    MTEB_EMBED_TASKS, MTEB_EMBED_TOL, OpenAIClientMtebEncoder,
-    run_mteb_embed_task)
+    MTEB_EMBED_TASKS,
+    MTEB_EMBED_TOL,
+    OpenAIClientMtebEncoder,
+    run_mteb_embed_task,
+)
 from tests.utils import RemoteOpenAIServer
 
 os.environ["VLLM_LOGGING_LEVEL"] = "WARNING"
@@ -17,10 +20,7 @@
 
 @pytest.fixture(scope="module")
 def server():
-    args = [
-        "--runner", "pooling", "--enforce-eager",
-        "--disable-uvicorn-access-log"
-    ]
+    args = ["--runner", "pooling", "--enforce-eager", "--disable-uvicorn-access-log"]
 
     with RemoteOpenAIServer(MODEL_NAME, args) as remote_server:
         yield remote_server
diff --git a/tests/entrypoints/pooling/correctness/test_mteb_score.py b/tests/entrypoints/pooling/correctness/test_mteb_score.py
index 7c059d16b386..1afe68b189db 100644
--- a/tests/entrypoints/pooling/correctness/test_mteb_score.py
+++ b/tests/entrypoints/pooling/correctness/test_mteb_score.py
@@ -5,8 +5,13 @@
 import pytest
 
 from tests.models.language.pooling_mteb_test.mteb_utils import (
-    MTEB_RERANK_LANGS, MTEB_RERANK_TASKS, MTEB_RERANK_TOL,
-    RerankClientMtebEncoder, ScoreClientMtebEncoder, run_mteb_rerank)
+    MTEB_RERANK_LANGS,
+    MTEB_RERANK_TASKS,
+    MTEB_RERANK_TOL,
+    RerankClientMtebEncoder,
+    ScoreClientMtebEncoder,
+    run_mteb_rerank,
+)
 from tests.utils import RemoteOpenAIServer
 
 os.environ["VLLM_LOGGING_LEVEL"] = "WARNING"
@@ -17,10 +22,7 @@
 
 @pytest.fixture(scope="module")
 def server():
-    args = [
-        "--runner", "pooling", "--enforce-eager",
-        "--disable-uvicorn-access-log"
-    ]
+    args = ["--runner", "pooling", "--enforce-eager", "--disable-uvicorn-access-log"]
 
     with RemoteOpenAIServer(MODEL_NAME, args) as remote_server:
         yield remote_server
@@ -29,8 +31,7 @@ def server():
 def test_mteb_score(server):
     url = server.url_for("score")
     encoder = ScoreClientMtebEncoder(MODEL_NAME, url)
-    vllm_main_score = run_mteb_rerank(encoder, MTEB_RERANK_TASKS,
-                                      MTEB_RERANK_LANGS)
+    vllm_main_score = run_mteb_rerank(encoder, MTEB_RERANK_TASKS, MTEB_RERANK_LANGS)
 
     print("VLLM main score: ", vllm_main_score)
     print("SentenceTransformer main score: ", st_main_score)
@@ -44,8 +45,7 @@ def test_mteb_score(server):
 def test_mteb_rerank(server):
     url = server.url_for("rerank")
     encoder = RerankClientMtebEncoder(MODEL_NAME, url)
-    vllm_main_score = run_mteb_rerank(encoder, MTEB_RERANK_TASKS,
-                                      MTEB_RERANK_LANGS)
+    vllm_main_score = run_mteb_rerank(encoder, MTEB_RERANK_TASKS, MTEB_RERANK_LANGS)
 
     print("VLLM main score: ", vllm_main_score)
     print("SentenceTransformer main score: ", st_main_score)
diff --git a/tests/entrypoints/pooling/llm/test_classify.py b/tests/entrypoints/pooling/llm/test_classify.py
index ff5cea11a918..ae216c464a5b 100644
--- a/tests/entrypoints/pooling/llm/test_classify.py
+++ b/tests/entrypoints/pooling/llm/test_classify.py
@@ -19,12 +19,14 @@
 def llm():
     # pytest caches the fixture so we use weakref.proxy to
     # enable garbage collection
-    llm = LLM(model=MODEL_NAME,
-              max_num_batched_tokens=32768,
-              tensor_parallel_size=1,
-              gpu_memory_utilization=0.75,
-              enforce_eager=True,
-              seed=0)
+    llm = LLM(
+        model=MODEL_NAME,
+        max_num_batched_tokens=32768,
+        tensor_parallel_size=1,
+        gpu_memory_utilization=0.75,
+        enforce_eager=True,
+        seed=0,
+    )
 
     yield weakref.proxy(llm)
 
@@ -35,26 +37,25 @@ def llm():
 
 @pytest.mark.skip_global_cleanup
 def test_pooling_params(llm: LLM):
-
     def get_outputs(activation):
         outputs = llm.classify(
-            prompts,
-            pooling_params=PoolingParams(activation=activation),
-            use_tqdm=False)
+            prompts, pooling_params=PoolingParams(activation=activation), use_tqdm=False
+        )
         return torch.tensor([x.outputs.probs for x in outputs])
 
     default = get_outputs(activation=None)
     w_activation = get_outputs(activation=True)
     wo_activation = get_outputs(activation=False)
 
-    assert torch.allclose(default, w_activation,
-                          atol=1e-2), "Default should use activation."
-    assert not torch.allclose(
-        w_activation, wo_activation,
-        atol=1e-2), "wo_activation should not use activation."
-    assert torch.allclose(
-        softmax(wo_activation), w_activation, atol=1e-2
-    ), "w_activation should be close to activation(wo_activation)."
+    assert torch.allclose(default, w_activation, atol=1e-2), (
+        "Default should use activation."
+    )
+    assert not torch.allclose(w_activation, wo_activation, atol=1e-2), (
+        "wo_activation should not use activation."
+    )
+    assert torch.allclose(softmax(wo_activation), w_activation, atol=1e-2), (
+        "w_activation should be close to activation(wo_activation)."
+    )
 
 
 def test_encode_api(llm: LLM):
diff --git a/tests/entrypoints/pooling/llm/test_embedding.py b/tests/entrypoints/pooling/llm/test_embedding.py
index 485f04ed6d84..aa24a70fd18b 100644
--- a/tests/entrypoints/pooling/llm/test_embedding.py
+++ b/tests/entrypoints/pooling/llm/test_embedding.py
@@ -19,12 +19,14 @@
 def llm():
     # pytest caches the fixture so we use weakref.proxy to
     # enable garbage collection
-    llm = LLM(model=MODEL_NAME,
-              max_num_batched_tokens=32768,
-              tensor_parallel_size=1,
-              gpu_memory_utilization=0.75,
-              enforce_eager=True,
-              seed=0)
+    llm = LLM(
+        model=MODEL_NAME,
+        max_num_batched_tokens=32768,
+        tensor_parallel_size=1,
+        gpu_memory_utilization=0.75,
+        enforce_eager=True,
+        seed=0,
+    )
 
     yield weakref.proxy(llm)
 
@@ -35,21 +37,20 @@ def llm():
 
 @pytest.mark.skip_global_cleanup
 def test_pooling_params(llm: LLM):
-
     def get_outputs(normalize):
-        outputs = llm.embed(prompts,
-                            pooling_params=PoolingParams(normalize=normalize),
-                            use_tqdm=False)
+        outputs = llm.embed(
+            prompts, pooling_params=PoolingParams(normalize=normalize), use_tqdm=False
+        )
         return torch.tensor([x.outputs.embedding for x in outputs])
 
     default = get_outputs(normalize=None)
     w_normal = get_outputs(normalize=True)
     wo_normal = get_outputs(normalize=False)
 
-    assert torch.allclose(default, w_normal,
-                          atol=1e-2), "Default should use normal."
-    assert not torch.allclose(w_normal, wo_normal,
-                              atol=1e-2), "wo_normal should not use normal."
-    assert torch.allclose(
-        w_normal, F.normalize(wo_normal, p=2, dim=-1),
-        atol=1e-2), "w_normal should be close to normal(wo_normal)."
+    assert torch.allclose(default, w_normal, atol=1e-2), "Default should use normal."
+    assert not torch.allclose(w_normal, wo_normal, atol=1e-2), (
+        "wo_normal should not use normal."
+    )
+    assert torch.allclose(w_normal, F.normalize(wo_normal, p=2, dim=-1), atol=1e-2), (
+        "w_normal should be close to normal(wo_normal)."
+    )
diff --git a/tests/entrypoints/pooling/llm/test_encode.py b/tests/entrypoints/pooling/llm/test_encode.py
index eae3e234378f..d6aae99944f8 100644
--- a/tests/entrypoints/pooling/llm/test_encode.py
+++ b/tests/entrypoints/pooling/llm/test_encode.py
@@ -31,12 +31,14 @@
 def llm():
     # pytest caches the fixture so we use weakref.proxy to
     # enable garbage collection
-    llm = LLM(model=MODEL_NAME,
-              max_num_batched_tokens=32768,
-              tensor_parallel_size=1,
-              gpu_memory_utilization=0.75,
-              enforce_eager=True,
-              seed=0)
+    llm = LLM(
+        model=MODEL_NAME,
+        max_num_batched_tokens=32768,
+        tensor_parallel_size=1,
+        gpu_memory_utilization=0.75,
+        enforce_eager=True,
+        seed=0,
+    )
 
     yield weakref.proxy(llm)
 
diff --git a/tests/entrypoints/pooling/llm/test_reward.py b/tests/entrypoints/pooling/llm/test_reward.py
index 11d164c978a9..8312ff180b36 100644
--- a/tests/entrypoints/pooling/llm/test_reward.py
+++ b/tests/entrypoints/pooling/llm/test_reward.py
@@ -19,13 +19,15 @@
 def llm():
     # pytest caches the fixture so we use weakref.proxy to
     # enable garbage collection
-    llm = LLM(model=MODEL_NAME,
-              max_num_batched_tokens=32768,
-              tensor_parallel_size=1,
-              gpu_memory_utilization=0.75,
-              enforce_eager=True,
-              trust_remote_code=True,
-              seed=0)
+    llm = LLM(
+        model=MODEL_NAME,
+        max_num_batched_tokens=32768,
+        tensor_parallel_size=1,
+        gpu_memory_utilization=0.75,
+        enforce_eager=True,
+        trust_remote_code=True,
+        seed=0,
+    )
 
     yield weakref.proxy(llm)
 
@@ -36,21 +38,20 @@ def llm():
 
 @pytest.mark.skip_global_cleanup
 def test_pooling_params(llm: LLM):
-
     def get_outputs(softmax):
-        outputs = llm.reward(prompts,
-                             pooling_params=PoolingParams(softmax=softmax),
-                             use_tqdm=False)
+        outputs = llm.reward(
+            prompts, pooling_params=PoolingParams(softmax=softmax), use_tqdm=False
+        )
         return torch.cat([x.outputs.data for x in outputs])
 
     default = get_outputs(softmax=None)
     w_softmax = get_outputs(softmax=True)
     wo_softmax = get_outputs(softmax=False)
 
-    assert torch.allclose(default, w_softmax,
-                          atol=1e-2), "Default should use softmax."
-    assert not torch.allclose(w_softmax, wo_softmax,
-                              atol=1e-2), "wo_softmax should not use softmax."
-    assert torch.allclose(
-        softmax(wo_softmax), w_softmax,
-        atol=1e-2), "w_softmax should be close to softmax(wo_softmax)."
+    assert torch.allclose(default, w_softmax, atol=1e-2), "Default should use softmax."
+    assert not torch.allclose(w_softmax, wo_softmax, atol=1e-2), (
+        "wo_softmax should not use softmax."
+    )
+    assert torch.allclose(softmax(wo_softmax), w_softmax, atol=1e-2), (
+        "w_softmax should be close to softmax(wo_softmax)."
+    )
diff --git a/tests/entrypoints/pooling/llm/test_score.py b/tests/entrypoints/pooling/llm/test_score.py
index 447378f989d0..9bf74fce906b 100644
--- a/tests/entrypoints/pooling/llm/test_score.py
+++ b/tests/entrypoints/pooling/llm/test_score.py
@@ -17,12 +17,14 @@
 def llm():
     # pytest caches the fixture so we use weakref.proxy to
     # enable garbage collection
-    llm = LLM(model=MODEL_NAME,
-              max_num_batched_tokens=32768,
-              tensor_parallel_size=1,
-              gpu_memory_utilization=0.75,
-              enforce_eager=True,
-              seed=0)
+    llm = LLM(
+        model=MODEL_NAME,
+        max_num_batched_tokens=32768,
+        tensor_parallel_size=1,
+        gpu_memory_utilization=0.75,
+        enforce_eager=True,
+        seed=0,
+    )
 
     yield weakref.proxy(llm)
 
@@ -33,7 +35,6 @@ def llm():
 
 @pytest.mark.skip_global_cleanup
 def test_pooling_params(llm: LLM):
-
     def get_outputs(activation):
         text_1 = "What is the capital of France?"
         text_2 = "The capital of France is Paris."
@@ -42,18 +43,20 @@ def get_outputs(activation):
             text_1,
             text_2,
             pooling_params=PoolingParams(activation=activation),
-            use_tqdm=False)
+            use_tqdm=False,
+        )
         return torch.tensor([x.outputs.score for x in outputs])
 
     default = get_outputs(activation=None)
     w_activation = get_outputs(activation=True)
     wo_activation = get_outputs(activation=False)
 
-    assert torch.allclose(default, w_activation,
-                          atol=1e-2), "Default should use activation."
-    assert not torch.allclose(
-        w_activation, wo_activation,
-        atol=1e-2), "wo_activation should not use activation."
-    assert torch.allclose(
-        softmax(wo_activation), w_activation, atol=1e-2
-    ), "w_activation should be close to activation(wo_activation)."
+    assert torch.allclose(default, w_activation, atol=1e-2), (
+        "Default should use activation."
+    )
+    assert not torch.allclose(w_activation, wo_activation, atol=1e-2), (
+        "wo_activation should not use activation."
+    )
+    assert torch.allclose(softmax(wo_activation), w_activation, atol=1e-2), (
+        "w_activation should be close to activation(wo_activation)."
+    )
diff --git a/tests/entrypoints/pooling/openai/test_classification.py b/tests/entrypoints/pooling/openai/test_classification.py
index 26c2c8e6af17..92d40efad21c 100644
--- a/tests/entrypoints/pooling/openai/test_classification.py
+++ b/tests/entrypoints/pooling/openai/test_classification.py
@@ -28,21 +28,16 @@ def server():
 
 
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
-def test_single_input_classification(server: RemoteOpenAIServer,
-                                     model_name: str):
+def test_single_input_classification(server: RemoteOpenAIServer, model_name: str):
     input_text = "This product was excellent and exceeded my expectations"
 
     classification_response = requests.post(
         server.url_for("classify"),
-        json={
-            "model": model_name,
-            "input": input_text
-        },
+        json={"model": model_name, "input": input_text},
     )
 
     classification_response.raise_for_status()
-    output = ClassificationResponse.model_validate(
-        classification_response.json())
+    output = ClassificationResponse.model_validate(classification_response.json())
 
     assert output.object == "list"
     assert output.model == MODEL_NAME
@@ -52,8 +47,7 @@ def test_single_input_classification(server: RemoteOpenAIServer,
 
 
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
-def test_multiple_inputs_classification(server: RemoteOpenAIServer,
-                                        model_name: str):
+def test_multiple_inputs_classification(server: RemoteOpenAIServer, model_name: str):
     input_texts = [
         "The product arrived on time and works perfectly",
         "I'm very satisfied with my purchase, would buy again",
@@ -65,13 +59,9 @@ def test_multiple_inputs_classification(server: RemoteOpenAIServer,
 
     classification_response = requests.post(
         server.url_for("classify"),
-        json={
-            "model": model_name,
-            "input": input_texts
-        },
+        json={"model": model_name, "input": input_texts},
     )
-    output = ClassificationResponse.model_validate(
-        classification_response.json())
+    output = ClassificationResponse.model_validate(classification_response.json())
 
     assert len(output.data) == len(input_texts)
     for i, item in enumerate(output.data):
@@ -88,16 +78,11 @@ def test_truncate_prompt_tokens(server: RemoteOpenAIServer, model_name: str):
 
     classification_response = requests.post(
         server.url_for("classify"),
-        json={
-            "model": model_name,
-            "input": long_text,
-            "truncate_prompt_tokens": 5
-        },
+        json={"model": model_name, "input": long_text, "truncate_prompt_tokens": 5},
     )
 
     classification_response.raise_for_status()
-    output = ClassificationResponse.model_validate(
-        classification_response.json())
+    output = ClassificationResponse.model_validate(classification_response.json())
 
     assert len(output.data) == 1
     assert output.data[0].index == 0
@@ -107,15 +92,12 @@ def test_truncate_prompt_tokens(server: RemoteOpenAIServer, model_name: str):
 
 
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
-def test_invalid_truncate_prompt_tokens_error(server: RemoteOpenAIServer,
-                                              model_name: str):
+def test_invalid_truncate_prompt_tokens_error(
+    server: RemoteOpenAIServer, model_name: str
+):
     classification_response = requests.post(
         server.url_for("classify"),
-        json={
-            "model": model_name,
-            "input": "test",
-            "truncate_prompt_tokens": 513
-        },
+        json={"model": model_name, "input": "test", "truncate_prompt_tokens": 513},
     )
 
     error = classification_response.json()
@@ -127,10 +109,7 @@ def test_invalid_truncate_prompt_tokens_error(server: RemoteOpenAIServer,
 def test_empty_input_error(server: RemoteOpenAIServer, model_name: str):
     classification_response = requests.post(
         server.url_for("classify"),
-        json={
-            "model": model_name,
-            "input": ""
-        },
+        json={"model": model_name, "input": ""},
     )
 
     error = classification_response.json()
@@ -139,18 +118,13 @@ def test_empty_input_error(server: RemoteOpenAIServer, model_name: str):
 
 
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
-def test_batch_classification_empty_list(server: RemoteOpenAIServer,
-                                         model_name: str):
+def test_batch_classification_empty_list(server: RemoteOpenAIServer, model_name: str):
     classification_response = requests.post(
         server.url_for("classify"),
-        json={
-            "model": model_name,
-            "input": []
-        },
+        json={"model": model_name, "input": []},
     )
     classification_response.raise_for_status()
-    output = ClassificationResponse.model_validate(
-        classification_response.json())
+    output = ClassificationResponse.model_validate(classification_response.json())
 
     assert output.object == "list"
     assert isinstance(output.data, list)
@@ -161,15 +135,17 @@ def test_batch_classification_empty_list(server: RemoteOpenAIServer,
 async def test_invocations(server: RemoteOpenAIServer):
     request_args = {
         "model": MODEL_NAME,
-        "input": "This product was excellent and exceeded my expectations"
+        "input": "This product was excellent and exceeded my expectations",
     }
 
-    classification_response = requests.post(server.url_for("classify"),
-                                            json=request_args)
+    classification_response = requests.post(
+        server.url_for("classify"), json=request_args
+    )
     classification_response.raise_for_status()
 
-    invocation_response = requests.post(server.url_for("invocations"),
-                                        json=request_args)
+    invocation_response = requests.post(
+        server.url_for("invocations"), json=request_args
+    )
     invocation_response.raise_for_status()
 
     classification_output = classification_response.json()
@@ -177,10 +153,12 @@ async def test_invocations(server: RemoteOpenAIServer):
 
     assert classification_output.keys() == invocation_output.keys()
     for classification_data, invocation_data in zip(
-            classification_output["data"], invocation_output["data"]):
+        classification_output["data"], invocation_output["data"]
+    ):
         assert classification_data.keys() == invocation_data.keys()
         assert classification_data["probs"] == pytest.approx(
-            invocation_data["probs"], rel=0.01)
+            invocation_data["probs"], rel=0.01
+        )
 
 
 @pytest.mark.asyncio
@@ -189,27 +167,26 @@ async def test_activation(server: RemoteOpenAIServer, model_name: str):
     input_text = ["This product was excellent and exceeded my expectations"]
 
     async def get_outputs(activation):
-        response = requests.post(server.url_for("classify"),
-                                 json={
-                                     "model": model_name,
-                                     "input": input_text,
-                                     "activation": activation
-                                 })
+        response = requests.post(
+            server.url_for("classify"),
+            json={"model": model_name, "input": input_text, "activation": activation},
+        )
         outputs = response.json()
-        return torch.tensor([x['probs'] for x in outputs["data"]])
+        return torch.tensor([x["probs"] for x in outputs["data"]])
 
     default = await get_outputs(activation=None)
     w_activation = await get_outputs(activation=True)
     wo_activation = await get_outputs(activation=False)
 
-    assert torch.allclose(default, w_activation,
-                          atol=1e-2), "Default should use activation."
-    assert not torch.allclose(
-        w_activation, wo_activation,
-        atol=1e-2), "wo_activation should not use activation."
-    assert torch.allclose(
-        F.softmax(wo_activation, dim=-1), w_activation, atol=1e-2
-    ), "w_activation should be close to activation(wo_activation)."
+    assert torch.allclose(default, w_activation, atol=1e-2), (
+        "Default should use activation."
+    )
+    assert not torch.allclose(w_activation, wo_activation, atol=1e-2), (
+        "wo_activation should not use activation."
+    )
+    assert torch.allclose(F.softmax(wo_activation, dim=-1), w_activation, atol=1e-2), (
+        "w_activation should be close to activation(wo_activation)."
+    )
 
 
 @pytest.mark.asyncio
@@ -218,11 +195,7 @@ def test_pooling(server: RemoteOpenAIServer, model_name: str):
     # pooling api uses ALL pooling, which does not support chunked prefill.
     response = requests.post(
         server.url_for("pooling"),
-        json={
-            "model": model_name,
-            "input": "test",
-            "encoding_format": "float"
-        },
+        json={"model": model_name, "input": "test", "encoding_format": "float"},
     )
     assert response.json()["error"]["type"] == "BadRequestError"
 
diff --git a/tests/entrypoints/pooling/openai/test_embedding.py b/tests/entrypoints/pooling/openai/test_embedding.py
index 37a10e79d4fc..6f6559a961a1 100644
--- a/tests/entrypoints/pooling/openai/test_embedding.py
+++ b/tests/entrypoints/pooling/openai/test_embedding.py
@@ -11,8 +11,7 @@
 import torch
 import torch.nn.functional as F
 
-from tests.models.language.pooling.embed_utils import (
-    run_embedding_correctness_test)
+from tests.models.language.pooling.embed_utils import run_embedding_correctness_test
 from tests.models.utils import check_embeddings_close
 from tests.utils import RemoteOpenAIServer
 from vllm.entrypoints.openai.protocol import EmbeddingResponse
@@ -50,15 +49,13 @@ async def client(server):
 
 @pytest.fixture(scope="module")
 def hf_model(hf_runner):
-    with hf_runner(MODEL_NAME, dtype=DTYPE,
-                   is_sentence_transformer=True) as hf_model:
+    with hf_runner(MODEL_NAME, dtype=DTYPE, is_sentence_transformer=True) as hf_model:
         yield hf_model
 
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
-async def test_single_embedding(hf_model, client: openai.AsyncOpenAI,
-                                model_name: str):
+async def test_single_embedding(hf_model, client: openai.AsyncOpenAI, model_name: str):
     input_texts = [
         "The chef prepared a delicious meal.",
     ]
@@ -70,7 +67,8 @@ async def test_single_embedding(hf_model, client: openai.AsyncOpenAI,
         encoding_format="float",
     )
     embeddings = EmbeddingResponse.model_validate(
-        embedding_response.model_dump(mode="json"))
+        embedding_response.model_dump(mode="json")
+    )
 
     assert embeddings.id is not None
     assert len(embeddings.data) == 1
@@ -90,7 +88,8 @@ async def test_single_embedding(hf_model, client: openai.AsyncOpenAI,
         encoding_format="float",
     )
     embeddings = EmbeddingResponse.model_validate(
-        embedding_response.model_dump(mode="json"))
+        embedding_response.model_dump(mode="json")
+    )
 
     assert embeddings.id is not None
     assert len(embeddings.data) == 1
@@ -102,12 +101,12 @@ async def test_single_embedding(hf_model, client: openai.AsyncOpenAI,
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
-async def test_batch_embedding(hf_model, client: openai.AsyncOpenAI,
-                               model_name: str):
+async def test_batch_embedding(hf_model, client: openai.AsyncOpenAI, model_name: str):
     # test list[str]
     input_texts = [
-        "The cat sat on the mat.", "A feline was resting on a rug.",
-        "Stars twinkle brightly in the night sky."
+        "The cat sat on the mat.",
+        "A feline was resting on a rug.",
+        "Stars twinkle brightly in the night sky.",
     ]
     embedding_response = await client.embeddings.create(
         model=model_name,
@@ -115,7 +114,8 @@ async def test_batch_embedding(hf_model, client: openai.AsyncOpenAI,
         encoding_format="float",
     )
     embeddings = EmbeddingResponse.model_validate(
-        embedding_response.model_dump(mode="json"))
+        embedding_response.model_dump(mode="json")
+    )
 
     assert embeddings.id is not None
     assert len(embeddings.data) == 3
@@ -128,15 +128,20 @@ async def test_batch_embedding(hf_model, client: openai.AsyncOpenAI,
     run_embedding_correctness_test(hf_model, input_texts, vllm_outputs)
 
     # test list[list[int]]
-    input_tokens = [[4, 5, 7, 9, 20], [15, 29, 499], [24, 24, 24, 24, 24],
-                    [25, 32, 64, 77]]
+    input_tokens = [
+        [4, 5, 7, 9, 20],
+        [15, 29, 499],
+        [24, 24, 24, 24, 24],
+        [25, 32, 64, 77],
+    ]
     embedding_response = await client.embeddings.create(
         model=model_name,
         input=input_tokens,
         encoding_format="float",
     )
     embeddings = EmbeddingResponse.model_validate(
-        embedding_response.model_dump(mode="json"))
+        embedding_response.model_dump(mode="json")
+    )
 
     assert embeddings.id is not None
     assert len(embeddings.data) == 4
@@ -148,19 +153,23 @@ async def test_batch_embedding(hf_model, client: openai.AsyncOpenAI,
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
-async def test_conversation_embedding(server: RemoteOpenAIServer,
-                                      client: openai.AsyncOpenAI,
-                                      model_name: str):
-    messages = [{
-        "role": "user",
-        "content": "The cat sat on the mat.",
-    }, {
-        "role": "assistant",
-        "content": "A feline was resting on a rug.",
-    }, {
-        "role": "user",
-        "content": "Stars twinkle brightly in the night sky.",
-    }]
+async def test_conversation_embedding(
+    server: RemoteOpenAIServer, client: openai.AsyncOpenAI, model_name: str
+):
+    messages = [
+        {
+            "role": "user",
+            "content": "The cat sat on the mat.",
+        },
+        {
+            "role": "assistant",
+            "content": "A feline was resting on a rug.",
+        },
+        {
+            "role": "user",
+            "content": "Stars twinkle brightly in the night sky.",
+        },
+    ]
 
     chat_response = requests.post(
         server.url_for("v1/embeddings"),
@@ -189,64 +198,66 @@ async def test_conversation_embedding(server: RemoteOpenAIServer,
         extra_body={"add_special_tokens": False},
     )
     completion_embeddings = EmbeddingResponse.model_validate(
-        completion_response.model_dump(mode="json"))
+        completion_response.model_dump(mode="json")
+    )
 
     assert chat_embeddings.id is not None
     assert completion_embeddings.id is not None
     assert chat_embeddings.created <= completion_embeddings.created
-    assert chat_embeddings.model_dump(
-        exclude={"id", "created"}) == (completion_embeddings.model_dump(
-            exclude={"id", "created"}))
+    assert chat_embeddings.model_dump(exclude={"id", "created"}) == (
+        completion_embeddings.model_dump(exclude={"id", "created"})
+    )
 
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
-async def test_batch_base64_embedding(hf_model, client: openai.AsyncOpenAI,
-                                      model_name: str):
+async def test_batch_base64_embedding(
+    hf_model, client: openai.AsyncOpenAI, model_name: str
+):
     input_texts = [
         "Hello my name is",
-        "The best thing about vLLM is that it supports many different models"
+        "The best thing about vLLM is that it supports many different models",
     ]
 
-    responses_float = await client.embeddings.create(input=input_texts,
-                                                     model=model_name,
-                                                     encoding_format="float")
+    responses_float = await client.embeddings.create(
+        input=input_texts, model=model_name, encoding_format="float"
+    )
     float_data = [d.embedding for d in responses_float.data]
     run_embedding_correctness_test(hf_model, input_texts, float_data)
 
-    responses_base64 = await client.embeddings.create(input=input_texts,
-                                                      model=model_name,
-                                                      encoding_format="base64")
+    responses_base64 = await client.embeddings.create(
+        input=input_texts, model=model_name, encoding_format="base64"
+    )
     base64_data = []
     for data in responses_base64.data:
         base64_data.append(
-            np.frombuffer(base64.b64decode(data.embedding),
-                          dtype="float32").tolist())
+            np.frombuffer(base64.b64decode(data.embedding), dtype="float32").tolist()
+        )
 
     run_embedding_correctness_test(hf_model, input_texts, base64_data)
 
     # Default response is float32 decoded from base64 by OpenAI Client
-    responses_default = await client.embeddings.create(input=input_texts,
-                                                       model=model_name)
+    responses_default = await client.embeddings.create(
+        input=input_texts, model=model_name
+    )
     default_data = [d.embedding for d in responses_default.data]
     run_embedding_correctness_test(hf_model, input_texts, default_data)
 
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
-async def test_single_embedding_truncation(client: openai.AsyncOpenAI,
-                                           model_name: str):
+async def test_single_embedding_truncation(client: openai.AsyncOpenAI, model_name: str):
     input_texts = [
         "Como o Brasil pode fomentar o desenvolvimento de modelos de IA?",
     ]
 
     # test single embedding
     embedding_response = await client.embeddings.create(
-        model=model_name,
-        input=input_texts,
-        extra_body={"truncate_prompt_tokens": 10})
+        model=model_name, input=input_texts, extra_body={"truncate_prompt_tokens": 10}
+    )
     embeddings = EmbeddingResponse.model_validate(
-        embedding_response.model_dump(mode="json"))
+        embedding_response.model_dump(mode="json")
+    )
 
     assert embeddings.id is not None
     assert len(embeddings.data) == 1
@@ -256,15 +267,34 @@ async def test_single_embedding_truncation(client: openai.AsyncOpenAI,
     assert embeddings.usage.total_tokens == 10
 
     input_tokens = [
-        1, 24428, 289, 18341, 26165, 285, 19323, 283, 289, 26789, 3871, 28728,
-        9901, 340, 2229, 385, 340, 315, 28741, 28804, 2
+        1,
+        24428,
+        289,
+        18341,
+        26165,
+        285,
+        19323,
+        283,
+        289,
+        26789,
+        3871,
+        28728,
+        9901,
+        340,
+        2229,
+        385,
+        340,
+        315,
+        28741,
+        28804,
+        2,
     ]
     embedding_response = await client.embeddings.create(
-        model=model_name,
-        input=input_tokens,
-        extra_body={"truncate_prompt_tokens": 10})
+        model=model_name, input=input_tokens, extra_body={"truncate_prompt_tokens": 10}
+    )
     embeddings = EmbeddingResponse.model_validate(
-        embedding_response.model_dump(mode="json"))
+        embedding_response.model_dump(mode="json")
+    )
 
     assert embeddings.id is not None
     assert len(embeddings.data) == 1
@@ -276,8 +306,9 @@ async def test_single_embedding_truncation(client: openai.AsyncOpenAI,
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
-async def test_single_embedding_truncation_invalid(client: openai.AsyncOpenAI,
-                                                   model_name: str):
+async def test_single_embedding_truncation_invalid(
+    client: openai.AsyncOpenAI, model_name: str
+):
     input_texts = [
         "Como o Brasil pode fomentar o desenvolvimento de modelos de IA?",
     ]
@@ -286,15 +317,17 @@ async def test_single_embedding_truncation_invalid(client: openai.AsyncOpenAI,
         response = await client.embeddings.create(
             model=model_name,
             input=input_texts,
-            extra_body={"truncate_prompt_tokens": 8193})
+            extra_body={"truncate_prompt_tokens": 8193},
+        )
         assert "error" in response.object
-        assert "truncate_prompt_tokens value is greater than max_model_len. "\
-               "Please, select a smaller truncation size." in response.message
+        assert (
+            "truncate_prompt_tokens value is greater than max_model_len. "
+            "Please, select a smaller truncation size." in response.message
+        )
 
 
 @pytest.mark.asyncio
-async def test_invocations(server: RemoteOpenAIServer,
-                           client: openai.AsyncOpenAI):
+async def test_invocations(server: RemoteOpenAIServer, client: openai.AsyncOpenAI):
     input_texts = [
         "The chef prepared a delicious meal.",
     ]
@@ -307,35 +340,43 @@ async def test_invocations(server: RemoteOpenAIServer,
 
     completion_response = await client.embeddings.create(**request_args)
 
-    invocation_response = requests.post(server.url_for("invocations"),
-                                        json=request_args)
+    invocation_response = requests.post(
+        server.url_for("invocations"), json=request_args
+    )
     invocation_response.raise_for_status()
 
     completion_output = completion_response.model_dump()
     invocation_output = invocation_response.json()
 
     assert completion_output.keys() == invocation_output.keys()
-    for completion_data, invocation_data in zip(completion_output["data"],
-                                                invocation_output["data"]):
+    for completion_data, invocation_data in zip(
+        completion_output["data"], invocation_output["data"]
+    ):
         assert completion_data.keys() == invocation_data.keys()
-        check_embeddings_close(embeddings_0_lst=[completion_data["embedding"]],
-                               embeddings_1_lst=[invocation_data["embedding"]],
-                               name_0="completion",
-                               name_1="invocation")
+        check_embeddings_close(
+            embeddings_0_lst=[completion_data["embedding"]],
+            embeddings_1_lst=[invocation_data["embedding"]],
+            name_0="completion",
+            name_1="invocation",
+        )
 
 
 @pytest.mark.asyncio
 async def test_invocations_conversation(server: RemoteOpenAIServer):
-    messages = [{
-        "role": "user",
-        "content": "The cat sat on the mat.",
-    }, {
-        "role": "assistant",
-        "content": "A feline was resting on a rug.",
-    }, {
-        "role": "user",
-        "content": "Stars twinkle brightly in the night sky.",
-    }]
+    messages = [
+        {
+            "role": "user",
+            "content": "The cat sat on the mat.",
+        },
+        {
+            "role": "assistant",
+            "content": "A feline was resting on a rug.",
+        },
+        {
+            "role": "user",
+            "content": "Stars twinkle brightly in the night sky.",
+        },
+    ]
 
     request_args = {
         "model": MODEL_NAME,
@@ -343,25 +384,28 @@ async def test_invocations_conversation(server: RemoteOpenAIServer):
         "encoding_format": "float",
     }
 
-    chat_response = requests.post(server.url_for("v1/embeddings"),
-                                  json=request_args)
+    chat_response = requests.post(server.url_for("v1/embeddings"), json=request_args)
     chat_response.raise_for_status()
 
-    invocation_response = requests.post(server.url_for("invocations"),
-                                        json=request_args)
+    invocation_response = requests.post(
+        server.url_for("invocations"), json=request_args
+    )
     invocation_response.raise_for_status()
 
     chat_output = chat_response.json()
     invocation_output = invocation_response.json()
 
     assert chat_output.keys() == invocation_output.keys()
-    for chat_data, invocation_data in zip(chat_output["data"],
-                                          invocation_output["data"]):
+    for chat_data, invocation_data in zip(
+        chat_output["data"], invocation_output["data"]
+    ):
         assert chat_data.keys() == invocation_data.keys()
-        check_embeddings_close(embeddings_0_lst=[chat_data["embedding"]],
-                               embeddings_1_lst=[invocation_data["embedding"]],
-                               name_0="chat",
-                               name_1="invocation")
+        check_embeddings_close(
+            embeddings_0_lst=[chat_data["embedding"]],
+            embeddings_1_lst=[invocation_data["embedding"]],
+            name_0="chat",
+            name_1="invocation",
+        )
 
 
 @pytest.mark.asyncio
@@ -374,23 +418,22 @@ async def get_outputs(normalize):
             "model": MODEL_NAME,
             "input": input_text,
             "encoding_format": "float",
-            "normalize": normalize
+            "normalize": normalize,
         }
 
-        response = requests.post(server.url_for("v1/embeddings"),
-                                 json=request_args)
+        response = requests.post(server.url_for("v1/embeddings"), json=request_args)
         outputs = response.json()
 
-        return torch.tensor([x['embedding'] for x in outputs["data"]])
+        return torch.tensor([x["embedding"] for x in outputs["data"]])
 
     default = await get_outputs(normalize=None)
     w_normal = await get_outputs(normalize=True)
     wo_normal = await get_outputs(normalize=False)
 
-    assert torch.allclose(default, w_normal,
-                          atol=1e-2), "Default should use normal."
-    assert not torch.allclose(w_normal, wo_normal,
-                              atol=1e-2), "wo_normal should not use normal."
-    assert torch.allclose(
-        w_normal, F.normalize(wo_normal, p=2, dim=-1),
-        atol=1e-2), "w_normal should be close to normal(wo_normal)."
+    assert torch.allclose(default, w_normal, atol=1e-2), "Default should use normal."
+    assert not torch.allclose(w_normal, wo_normal, atol=1e-2), (
+        "wo_normal should not use normal."
+    )
+    assert torch.allclose(w_normal, F.normalize(wo_normal, p=2, dim=-1), atol=1e-2), (
+        "w_normal should be close to normal(wo_normal)."
+    )
diff --git a/tests/entrypoints/pooling/openai/test_embedding_dimensions.py b/tests/entrypoints/pooling/openai/test_embedding_dimensions.py
index 3c7e88daa8ff..92df43d7dbdc 100644
--- a/tests/entrypoints/pooling/openai/test_embedding_dimensions.py
+++ b/tests/entrypoints/pooling/openai/test_embedding_dimensions.py
@@ -10,17 +10,18 @@
 import pytest
 
 from tests.conftest import HfRunner
-from tests.models.language.pooling.embed_utils import (
-    run_embedding_correctness_test)
+from tests.models.language.pooling.embed_utils import run_embedding_correctness_test
 from tests.models.utils import EmbedModelInfo
 from tests.utils import RemoteOpenAIServer
 from vllm.entrypoints.openai.protocol import EmbeddingResponse
 
 MODELS = [
     EmbedModelInfo("intfloat/multilingual-e5-small", is_matryoshka=False),
-    EmbedModelInfo("Snowflake/snowflake-arctic-embed-m-v1.5",
-                   is_matryoshka=True,
-                   matryoshka_dimensions=[256]),
+    EmbedModelInfo(
+        "Snowflake/snowflake-arctic-embed-m-v1.5",
+        is_matryoshka=True,
+        matryoshka_dimensions=[256],
+    ),
 ]
 
 input_texts = [
@@ -48,15 +49,14 @@ def server(model_info, dtype: str):
         dtype,
         "--enforce-eager",
         "--max-model-len",
-        "512"
+        "512",
     ]
 
     if model_info.name == "Snowflake/snowflake-arctic-embed-m-v1.5":
         # Manually enable Matryoshka Embeddings
-        args.extend([
-            "--trust_remote_code", "--hf_overrides",
-            '{"matryoshka_dimensions":[256]}'
-        ])
+        args.extend(
+            ["--trust_remote_code", "--hf_overrides", '{"matryoshka_dimensions":[256]}']
+        )
 
     with RemoteOpenAIServer(model_info.name, args) as remote_server:
         yield remote_server
@@ -64,14 +64,16 @@ def server(model_info, dtype: str):
 
 @pytest.fixture(scope="module")
 def hf_model(hf_runner, model_info, dtype: str):
-    with hf_runner(model_info.name, dtype=dtype,
-                   is_sentence_transformer=True) as hf_model:
+    with hf_runner(
+        model_info.name, dtype=dtype, is_sentence_transformer=True
+    ) as hf_model:
         yield hf_model
 
 
 @pytest.mark.asyncio
-async def test_matryoshka(model_info: EmbedModelInfo,
-                          server: RemoteOpenAIServer, hf_model: HfRunner):
+async def test_matryoshka(
+    model_info: EmbedModelInfo, server: RemoteOpenAIServer, hf_model: HfRunner
+):
     client = server.get_async_client()
 
     async def make_request_and_correctness_test(dimensions):
@@ -84,7 +86,8 @@ async def make_request_and_correctness_test(dimensions):
             encoding_format="float",
         )
         embeddings = EmbeddingResponse.model_validate(
-            embedding_response.model_dump(mode="json"))
+            embedding_response.model_dump(mode="json")
+        )
 
         assert embeddings.id is not None
         assert len(embeddings.data) == 3
@@ -97,8 +100,7 @@ async def make_request_and_correctness_test(dimensions):
             assert len(embeddings.data[0].embedding) == dimensions
 
         vllm_outputs = [d.embedding for d in embeddings.data]
-        run_embedding_correctness_test(hf_model, prompts, vllm_outputs,
-                                       dimensions)
+        run_embedding_correctness_test(hf_model, prompts, vllm_outputs, dimensions)
 
     if model_info.is_matryoshka:
         valid_dimensions: list[Optional[int]] = [None]
diff --git a/tests/entrypoints/pooling/openai/test_embedding_long_text.py b/tests/entrypoints/pooling/openai/test_embedding_long_text.py
index ab5f765c28ed..f977c81a9084 100644
--- a/tests/entrypoints/pooling/openai/test_embedding_long_text.py
+++ b/tests/entrypoints/pooling/openai/test_embedding_long_text.py
@@ -31,7 +31,6 @@ def _generate_random_text(word_count: int) -> str:
         "that",
         "these",
         "those",
-
         # Action verbs
         "create",
         "build",
@@ -80,7 +79,6 @@ def _generate_random_text(word_count: int) -> str:
         "finish",
         "deliver",
         "provide",
-
         # Technology and science nouns
         "system",
         "application",
@@ -132,7 +130,6 @@ def _generate_random_text(word_count: int) -> str:
         "optimization",
         "performance",
         "efficiency",
-
         # General nouns
         "project",
         "team",
@@ -175,7 +172,7 @@ def _generate_random_text(word_count: int) -> str:
         "session",
         "meeting",
         "discussion",
-        "decision"
+        "decision",
     ]
 
     words = []
@@ -189,7 +186,7 @@ def _generate_random_text(word_count: int) -> str:
     result = []
     for i, word in enumerate(words_list):
         result.append(word)
-        if ((i + 1) % random.randint(10, 20) == 0 and i < len(words_list) - 1):
+        if (i + 1) % random.randint(10, 20) == 0 and i < len(words_list) - 1:
             result[-1] += "."
 
     return " ".join(result)
@@ -216,9 +213,11 @@ def server_with_chunked_processing():
         "--enforce-eager",
         "--max-model-len",
         "512",  # Set smaller max_model_len to trigger chunking mechanism
-        '--pooler-config',
-        ('{"pooling_type": "MEAN", "normalize": true, '
-         '"enable_chunked_processing": true, "max_embed_len": 10000}'),
+        "--pooler-config",
+        (
+            '{"pooling_type": "MEAN", "normalize": true, '
+            '"enable_chunked_processing": true, "max_embed_len": 10000}'
+        ),
         "--gpu-memory-utilization",
         "0.8",
     ]
@@ -230,23 +229,22 @@ def server_with_chunked_processing():
 @pytest_asyncio.fixture
 async def client_with_chunked_processing(server_with_chunked_processing):
     """Create async client with chunking processing support."""
-    async with server_with_chunked_processing.get_async_client(
-    ) as async_client:
+    async with server_with_chunked_processing.get_async_client() as async_client:
         yield async_client
 
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 async def test_long_text_embedding_1500_chars(
-        client_with_chunked_processing: openai.AsyncOpenAI, model_name: str):
-    """Test embedding processing for ~1500 character long text 
+    client_with_chunked_processing: openai.AsyncOpenAI, model_name: str
+):
+    """Test embedding processing for ~1500 character long text
     (~1028 tokens, exceeding 512 token limit)."""
 
     # Verify text length
     # Verify text has sufficient word count (approximately 1500 words)
     word_count = len(LONG_TEXT_1500_WORDS.split())
-    assert word_count >= 1400, (
-        f"Test text word count insufficient: {word_count} words")
+    assert word_count >= 1400, f"Test text word count insufficient: {word_count} words"
 
     # Send embedding request
     embedding_response = await client_with_chunked_processing.embeddings.create(
@@ -257,12 +255,14 @@ async def test_long_text_embedding_1500_chars(
 
     # Verify response structure
     embeddings = EmbeddingResponse.model_validate(
-        embedding_response.model_dump(mode="json"))
+        embedding_response.model_dump(mode="json")
+    )
 
     assert embeddings.id is not None
     assert len(embeddings.data) == 1
-    assert len(embeddings.data[0].embedding
-               ) == 384  # multilingual-e5-small embedding dimension
+    assert (
+        len(embeddings.data[0].embedding) == 384
+    )  # multilingual-e5-small embedding dimension
     assert embeddings.usage.completion_tokens == 0
     # Due to chunked processing, token count should
     # reflect actual processed tokens
@@ -274,26 +274,26 @@ async def test_long_text_embedding_1500_chars(
 
     # Verify embedding vector validity
     embedding_vector = embeddings.data[0].embedding
-    assert all(
-        isinstance(x, float)
-        for x in embedding_vector), "Embedding vector should contain floats"
-    assert not all(
-        x == 0
-        for x in embedding_vector), "Embedding vector should not be all zeros"
+    assert all(isinstance(x, float) for x in embedding_vector), (
+        "Embedding vector should contain floats"
+    )
+    assert not all(x == 0 for x in embedding_vector), (
+        "Embedding vector should not be all zeros"
+    )
 
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 async def test_long_text_embedding_2500_chars(
-        client_with_chunked_processing: openai.AsyncOpenAI, model_name: str):
+    client_with_chunked_processing: openai.AsyncOpenAI, model_name: str
+):
     """Test embedding processing for ~2500 character long text
     (~2048 tokens, requiring multiple chunks)."""
 
     # Verify text length
     # Verify text has sufficient word count (approximately 2500 words)
     word_count = len(LONG_TEXT_2500_WORDS.split())
-    assert word_count >= 2300, (
-        f"Test text word count insufficient: {word_count} words")
+    assert word_count >= 2300, f"Test text word count insufficient: {word_count} words"
 
     # Send embedding request
     embedding_response = await client_with_chunked_processing.embeddings.create(
@@ -304,12 +304,14 @@ async def test_long_text_embedding_2500_chars(
 
     # Verify response structure
     embeddings = EmbeddingResponse.model_validate(
-        embedding_response.model_dump(mode="json"))
+        embedding_response.model_dump(mode="json")
+    )
 
     assert embeddings.id is not None
     assert len(embeddings.data) == 1
-    assert len(embeddings.data[0].embedding
-               ) == 384  # multilingual-e5-small embedding dimension
+    assert (
+        len(embeddings.data[0].embedding) == 384
+    )  # multilingual-e5-small embedding dimension
     assert embeddings.usage.completion_tokens == 0
     # Due to chunked processing, token count should
     # reflect actual processed tokens
@@ -321,18 +323,19 @@ async def test_long_text_embedding_2500_chars(
 
     # Verify embedding vector validity
     embedding_vector = embeddings.data[0].embedding
-    assert all(
-        isinstance(x, float)
-        for x in embedding_vector), "Embedding vector should contain floats"
-    assert not all(
-        x == 0
-        for x in embedding_vector), "Embedding vector should not be all zeros"
+    assert all(isinstance(x, float) for x in embedding_vector), (
+        "Embedding vector should contain floats"
+    )
+    assert not all(x == 0 for x in embedding_vector), (
+        "Embedding vector should not be all zeros"
+    )
 
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 async def test_batch_long_text_embedding(
-        client_with_chunked_processing: openai.AsyncOpenAI, model_name: str):
+    client_with_chunked_processing: openai.AsyncOpenAI, model_name: str
+):
     """Test batch long text embedding processing."""
 
     input_texts = [
@@ -350,7 +353,8 @@ async def test_batch_long_text_embedding(
 
     # Verify response structure
     embeddings = EmbeddingResponse.model_validate(
-        embedding_response.model_dump(mode="json"))
+        embedding_response.model_dump(mode="json")
+    )
 
     assert embeddings.id is not None
     assert len(embeddings.data) == 3  # Three input texts
@@ -375,13 +379,16 @@ async def test_batch_long_text_embedding(
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 async def test_chunked_vs_normal_consistency(
-        client_with_chunked_processing: openai.AsyncOpenAI, model_name: str):
+    client_with_chunked_processing: openai.AsyncOpenAI, model_name: str
+):
     """Test consistency between chunked and
     normal processing (using short text)."""
 
     # Use a short text within the 512 token limit
-    short_text = ("Artificial intelligence technology is changing our world, "
-                  "bringing unprecedented opportunities and challenges.")
+    short_text = (
+        "Artificial intelligence technology is changing our world, "
+        "bringing unprecedented opportunities and challenges."
+    )
 
     # Send embedding request
     embedding_response = await client_with_chunked_processing.embeddings.create(
@@ -392,7 +399,8 @@ async def test_chunked_vs_normal_consistency(
 
     # Verify response structure
     embeddings = EmbeddingResponse.model_validate(
-        embedding_response.model_dump(mode="json"))
+        embedding_response.model_dump(mode="json")
+    )
 
     assert embeddings.id is not None
     assert len(embeddings.data) == 1
@@ -411,7 +419,8 @@ async def test_chunked_vs_normal_consistency(
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 async def test_chunked_processing_response_format(
-        client_with_chunked_processing: openai.AsyncOpenAI, model_name: str):
+    client_with_chunked_processing: openai.AsyncOpenAI, model_name: str
+):
     """Test response format and structure during chunked processing."""
 
     # Test with long text to trigger chunking
@@ -423,7 +432,8 @@ async def test_chunked_processing_response_format(
 
     # Verify response structure
     embeddings = EmbeddingResponse.model_validate(
-        embedding_response.model_dump(mode="json"))
+        embedding_response.model_dump(mode="json")
+    )
 
     assert embeddings.id is not None
     assert len(embeddings.data) == 1
@@ -433,8 +443,10 @@ async def test_chunked_processing_response_format(
     # Verify embedding vector properties
     embedding_vector = embeddings.data[0].embedding
     import math
+
     vector_norm = math.sqrt(sum(x * x for x in embedding_vector))
     # Check that the vector is normalized
     # (default behavior for most embedding models)
     assert 0.8 < vector_norm < 1.2, (
-        f"Vector norm should be reasonable, actual: {vector_norm}")
+        f"Vector norm should be reasonable, actual: {vector_norm}"
+    )
diff --git a/tests/entrypoints/pooling/openai/test_pooling.py b/tests/entrypoints/pooling/openai/test_pooling.py
index 9f58955cfb40..3439c556ccc4 100644
--- a/tests/entrypoints/pooling/openai/test_pooling.py
+++ b/tests/entrypoints/pooling/openai/test_pooling.py
@@ -46,11 +46,7 @@ async def test_single_pooling(server: RemoteOpenAIServer, model_name: str):
     # test single pooling
     response = requests.post(
         server.url_for("pooling"),
-        json={
-            "model": model_name,
-            "input": input_texts,
-            "encoding_format": "float"
-        },
+        json={"model": model_name, "input": input_texts, "encoding_format": "float"},
     )
     response.raise_for_status()
     poolings = PoolingResponse.model_validate(response.json())
@@ -66,11 +62,7 @@ async def test_single_pooling(server: RemoteOpenAIServer, model_name: str):
     input_tokens = [1, 1, 1, 1, 1]
     response = requests.post(
         server.url_for("pooling"),
-        json={
-            "model": model_name,
-            "input": input_tokens,
-            "encoding_format": "float"
-        },
+        json={"model": model_name, "input": input_tokens, "encoding_format": "float"},
     )
     response.raise_for_status()
     poolings = PoolingResponse.model_validate(response.json())
@@ -88,16 +80,13 @@ async def test_single_pooling(server: RemoteOpenAIServer, model_name: str):
 async def test_batch_pooling(server: RemoteOpenAIServer, model_name: str):
     # test list[str]
     input_texts = [
-        "The cat sat on the mat.", "A feline was resting on a rug.",
-        "Stars twinkle brightly in the night sky."
+        "The cat sat on the mat.",
+        "A feline was resting on a rug.",
+        "Stars twinkle brightly in the night sky.",
     ]
     response = requests.post(
         server.url_for("pooling"),
-        json={
-            "model": model_name,
-            "input": input_texts,
-            "encoding_format": "float"
-        },
+        json={"model": model_name, "input": input_texts, "encoding_format": "float"},
     )
     response.raise_for_status()
     poolings = PoolingResponse.model_validate(response.json())
@@ -110,15 +99,15 @@ async def test_batch_pooling(server: RemoteOpenAIServer, model_name: str):
     assert poolings.usage.total_tokens == 29
 
     # test list[list[int]]
-    input_tokens = [[4, 5, 7, 9, 20], [15, 29, 499], [24, 24, 24, 24, 24],
-                    [25, 32, 64, 77]]
+    input_tokens = [
+        [4, 5, 7, 9, 20],
+        [15, 29, 499],
+        [24, 24, 24, 24, 24],
+        [25, 32, 64, 77],
+    ]
     response = requests.post(
         server.url_for("pooling"),
-        json={
-            "model": model_name,
-            "input": input_tokens,
-            "encoding_format": "float"
-        },
+        json={"model": model_name, "input": input_tokens, "encoding_format": "float"},
     )
     response.raise_for_status()
     poolings = PoolingResponse.model_validate(response.json())
@@ -133,18 +122,21 @@ async def test_batch_pooling(server: RemoteOpenAIServer, model_name: str):
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
-async def test_conversation_pooling(server: RemoteOpenAIServer,
-                                    model_name: str):
-    messages = [{
-        "role": "user",
-        "content": "The cat sat on the mat.",
-    }, {
-        "role": "assistant",
-        "content": "A feline was resting on a rug.",
-    }, {
-        "role": "user",
-        "content": "Stars twinkle brightly in the night sky.",
-    }]
+async def test_conversation_pooling(server: RemoteOpenAIServer, model_name: str):
+    messages = [
+        {
+            "role": "user",
+            "content": "The cat sat on the mat.",
+        },
+        {
+            "role": "assistant",
+            "content": "A feline was resting on a rug.",
+        },
+        {
+            "role": "user",
+            "content": "Stars twinkle brightly in the night sky.",
+        },
+    ]
 
     chat_response = requests.post(
         server.url_for("pooling"),
@@ -180,24 +172,22 @@ async def test_conversation_pooling(server: RemoteOpenAIServer,
         },
     )
     completions_response.raise_for_status()
-    completion_poolings = PoolingResponse.model_validate(
-        completions_response.json())
+    completion_poolings = PoolingResponse.model_validate(completions_response.json())
 
     assert chat_poolings.id is not None
     assert completion_poolings.id is not None
     assert chat_poolings.created <= completion_poolings.created
-    assert chat_poolings.model_dump(
-        exclude={"id", "created"}) == (completion_poolings.model_dump(
-            exclude={"id", "created"}))
+    assert chat_poolings.model_dump(exclude={"id", "created"}) == (
+        completion_poolings.model_dump(exclude={"id", "created"})
+    )
 
 
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
-async def test_batch_base64_pooling(server: RemoteOpenAIServer,
-                                    model_name: str):
+async def test_batch_base64_pooling(server: RemoteOpenAIServer, model_name: str):
     input_texts = [
         "Hello my name is",
-        "The best thing about vLLM is that it supports many different models"
+        "The best thing about vLLM is that it supports many different models",
     ]
 
     float_response = requests.post(
@@ -210,9 +200,7 @@ async def test_batch_base64_pooling(server: RemoteOpenAIServer,
     )
     float_response.raise_for_status()
     responses_float = PoolingResponse.model_validate(float_response.json())
-    float_data = [
-        np.array(d.data).squeeze(-1).tolist() for d in responses_float.data
-    ]
+    float_data = [np.array(d.data).squeeze(-1).tolist() for d in responses_float.data]
 
     base64_response = requests.post(
         server.url_for("pooling"),
@@ -228,13 +216,15 @@ async def test_batch_base64_pooling(server: RemoteOpenAIServer,
     decoded_responses_base64_data = []
     for data in responses_base64.data:
         decoded_responses_base64_data.append(
-            np.frombuffer(base64.b64decode(data.data),
-                          dtype="float32").tolist())
-
-    check_embeddings_close(embeddings_0_lst=float_data,
-                           embeddings_1_lst=decoded_responses_base64_data,
-                           name_0="float32",
-                           name_1="base64")
+            np.frombuffer(base64.b64decode(data.data), dtype="float32").tolist()
+        )
+
+    check_embeddings_close(
+        embeddings_0_lst=float_data,
+        embeddings_1_lst=decoded_responses_base64_data,
+        name_0="float32",
+        name_1="base64",
+    )
 
     # Default response is float32 decoded from base64 by OpenAI Client
     default_response = requests.post(
@@ -250,10 +240,12 @@ async def test_batch_base64_pooling(server: RemoteOpenAIServer,
         np.array(d.data).squeeze(-1).tolist() for d in responses_default.data
     ]
 
-    check_embeddings_close(embeddings_0_lst=float_data,
-                           embeddings_1_lst=default_data,
-                           name_0="float32",
-                           name_1="default")
+    check_embeddings_close(
+        embeddings_0_lst=float_data,
+        embeddings_1_lst=default_data,
+        name_0="float32",
+        name_1="default",
+    )
 
 
 @pytest.mark.asyncio
@@ -268,39 +260,46 @@ async def test_invocations(server: RemoteOpenAIServer):
         "encoding_format": "float",
     }
 
-    completion_response = requests.post(server.url_for("pooling"),
-                                        json=request_args)
+    completion_response = requests.post(server.url_for("pooling"), json=request_args)
     completion_response.raise_for_status()
 
-    invocation_response = requests.post(server.url_for("invocations"),
-                                        json=request_args)
+    invocation_response = requests.post(
+        server.url_for("invocations"), json=request_args
+    )
     invocation_response.raise_for_status()
 
     completion_output = completion_response.json()
     invocation_output = invocation_response.json()
 
     assert completion_output.keys() == invocation_output.keys()
-    for completion_data, invocation_data in zip(completion_output["data"],
-                                                invocation_output["data"]):
+    for completion_data, invocation_data in zip(
+        completion_output["data"], invocation_output["data"]
+    ):
         assert completion_data.keys() == invocation_data.keys()
-        check_embeddings_close(embeddings_0_lst=completion_data["data"],
-                               embeddings_1_lst=invocation_data["data"],
-                               name_0="completion",
-                               name_1="invocation")
+        check_embeddings_close(
+            embeddings_0_lst=completion_data["data"],
+            embeddings_1_lst=invocation_data["data"],
+            name_0="completion",
+            name_1="invocation",
+        )
 
 
 @pytest.mark.asyncio
 async def test_invocations_conversation(server: RemoteOpenAIServer):
-    messages = [{
-        "role": "user",
-        "content": "The cat sat on the mat.",
-    }, {
-        "role": "assistant",
-        "content": "A feline was resting on a rug.",
-    }, {
-        "role": "user",
-        "content": "Stars twinkle brightly in the night sky.",
-    }]
+    messages = [
+        {
+            "role": "user",
+            "content": "The cat sat on the mat.",
+        },
+        {
+            "role": "assistant",
+            "content": "A feline was resting on a rug.",
+        },
+        {
+            "role": "user",
+            "content": "Stars twinkle brightly in the night sky.",
+        },
+    ]
 
     request_args = {
         "model": MODEL_NAME,
@@ -311,18 +310,22 @@ async def test_invocations_conversation(server: RemoteOpenAIServer):
     chat_response = requests.post(server.url_for("pooling"), json=request_args)
     chat_response.raise_for_status()
 
-    invocation_response = requests.post(server.url_for("invocations"),
-                                        json=request_args)
+    invocation_response = requests.post(
+        server.url_for("invocations"), json=request_args
+    )
     invocation_response.raise_for_status()
 
     chat_output = chat_response.json()
     invocation_output = invocation_response.json()
 
     assert chat_output.keys() == invocation_output.keys()
-    for chat_data, invocation_data in zip(chat_output["data"],
-                                          invocation_output["data"]):
+    for chat_data, invocation_data in zip(
+        chat_output["data"], invocation_output["data"]
+    ):
         assert chat_data.keys() == invocation_data.keys()
-        check_embeddings_close(embeddings_0_lst=chat_data["data"],
-                               embeddings_1_lst=invocation_data["data"],
-                               name_0="chat",
-                               name_1="invocation")
+        check_embeddings_close(
+            embeddings_0_lst=chat_data["data"],
+            embeddings_1_lst=invocation_data["data"],
+            name_0="chat",
+            name_1="invocation",
+        )
diff --git a/tests/entrypoints/pooling/openai/test_rerank.py b/tests/entrypoints/pooling/openai/test_rerank.py
index 992cb5147ef0..9980fcff16c1 100644
--- a/tests/entrypoints/pooling/openai/test_rerank.py
+++ b/tests/entrypoints/pooling/openai/test_rerank.py
@@ -25,15 +25,18 @@ def server():
 def test_rerank_texts(server: RemoteOpenAIServer, model_name: str):
     query = "What is the capital of France?"
     documents = [
-        "The capital of Brazil is Brasilia.", "The capital of France is Paris."
+        "The capital of Brazil is Brasilia.",
+        "The capital of France is Paris.",
     ]
 
-    rerank_response = requests.post(server.url_for("rerank"),
-                                    json={
-                                        "model": model_name,
-                                        "query": query,
-                                        "documents": documents,
-                                    })
+    rerank_response = requests.post(
+        server.url_for("rerank"),
+        json={
+            "model": model_name,
+            "query": query,
+            "documents": documents,
+        },
+    )
     rerank_response.raise_for_status()
     rerank = RerankResponse.model_validate(rerank_response.json())
 
@@ -49,16 +52,14 @@ def test_top_n(server: RemoteOpenAIServer, model_name: str):
     query = "What is the capital of France?"
     documents = [
         "The capital of Brazil is Brasilia.",
-        "The capital of France is Paris.", "Cross-encoder models are neat"
+        "The capital of France is Paris.",
+        "Cross-encoder models are neat",
     ]
 
-    rerank_response = requests.post(server.url_for("rerank"),
-                                    json={
-                                        "model": model_name,
-                                        "query": query,
-                                        "documents": documents,
-                                        "top_n": 2
-                                    })
+    rerank_response = requests.post(
+        server.url_for("rerank"),
+        json={"model": model_name, "query": query, "documents": documents, "top_n": 2},
+    )
     rerank_response.raise_for_status()
     rerank = RerankResponse.model_validate(rerank_response.json())
 
@@ -71,28 +72,26 @@ def test_top_n(server: RemoteOpenAIServer, model_name: str):
 
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 def test_rerank_max_model_len(server: RemoteOpenAIServer, model_name: str):
-
     query = "What is the capital of France?" * 100
     documents = [
-        "The capital of Brazil is Brasilia.", "The capital of France is Paris."
+        "The capital of Brazil is Brasilia.",
+        "The capital of France is Paris.",
     ]
 
-    rerank_response = requests.post(server.url_for("rerank"),
-                                    json={
-                                        "model": model_name,
-                                        "query": query,
-                                        "documents": documents
-                                    })
+    rerank_response = requests.post(
+        server.url_for("rerank"),
+        json={"model": model_name, "query": query, "documents": documents},
+    )
     assert rerank_response.status_code == 400
     # Assert just a small fragments of the response
-    assert "Please reduce the length of the input." in \
-        rerank_response.text
+    assert "Please reduce the length of the input." in rerank_response.text
 
 
 def test_invocations(server: RemoteOpenAIServer):
     query = "What is the capital of France?"
     documents = [
-        "The capital of Brazil is Brasilia.", "The capital of France is Paris."
+        "The capital of Brazil is Brasilia.",
+        "The capital of France is Paris.",
     ]
 
     request_args = {
@@ -101,23 +100,25 @@ def test_invocations(server: RemoteOpenAIServer):
         "documents": documents,
     }
 
-    rerank_response = requests.post(server.url_for("rerank"),
-                                    json=request_args)
+    rerank_response = requests.post(server.url_for("rerank"), json=request_args)
     rerank_response.raise_for_status()
 
-    invocation_response = requests.post(server.url_for("invocations"),
-                                        json=request_args)
+    invocation_response = requests.post(
+        server.url_for("invocations"), json=request_args
+    )
     invocation_response.raise_for_status()
 
     rerank_output = rerank_response.json()
     invocation_output = invocation_response.json()
 
     assert rerank_output.keys() == invocation_output.keys()
-    for rerank_result, invocations_result in zip(rerank_output["results"],
-                                                 invocation_output["results"]):
+    for rerank_result, invocations_result in zip(
+        rerank_output["results"], invocation_output["results"]
+    ):
         assert rerank_result.keys() == invocations_result.keys()
         assert rerank_result["relevance_score"] == pytest.approx(
-            invocations_result["relevance_score"], rel=0.05)
+            invocations_result["relevance_score"], rel=0.05
+        )
         # TODO: reset this tolerance to 0.01 once we find
         # an alternative to flash_attn with bfloat16
 
@@ -125,34 +126,36 @@ def test_invocations(server: RemoteOpenAIServer):
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 async def test_activation(server: RemoteOpenAIServer, model_name: str):
-
     async def get_outputs(activation):
         query = "What is the capital of France?"
         documents = [
             "The capital of Brazil is Brasilia.",
-            "The capital of France is Paris."
+            "The capital of France is Paris.",
         ]
 
-        response = requests.post(server.url_for("rerank"),
-                                 json={
-                                     "model": model_name,
-                                     "query": query,
-                                     "documents": documents,
-                                     "activation": activation
-                                 })
+        response = requests.post(
+            server.url_for("rerank"),
+            json={
+                "model": model_name,
+                "query": query,
+                "documents": documents,
+                "activation": activation,
+            },
+        )
         outputs = response.json()
 
-        return torch.tensor([x['relevance_score'] for x in outputs["results"]])
+        return torch.tensor([x["relevance_score"] for x in outputs["results"]])
 
     default = await get_outputs(activation=None)
     w_activation = await get_outputs(activation=True)
     wo_activation = await get_outputs(activation=False)
 
-    assert torch.allclose(default, w_activation,
-                          atol=1e-2), "Default should use activation."
-    assert not torch.allclose(
-        w_activation, wo_activation,
-        atol=1e-2), "wo_activation should not use activation."
-    assert torch.allclose(
-        F.sigmoid(wo_activation), w_activation, atol=1e-2
-    ), "w_activation should be close to activation(wo_activation)."
+    assert torch.allclose(default, w_activation, atol=1e-2), (
+        "Default should use activation."
+    )
+    assert not torch.allclose(w_activation, wo_activation, atol=1e-2), (
+        "wo_activation should not use activation."
+    )
+    assert torch.allclose(F.sigmoid(wo_activation), w_activation, atol=1e-2), (
+        "w_activation should be close to activation(wo_activation)."
+    )
diff --git a/tests/entrypoints/pooling/openai/test_score.py b/tests/entrypoints/pooling/openai/test_score.py
index d676ecccbc87..ef213ab0ea18 100644
--- a/tests/entrypoints/pooling/openai/test_score.py
+++ b/tests/entrypoints/pooling/openai/test_score.py
@@ -12,14 +12,8 @@
 from vllm.entrypoints.openai.protocol import ScoreResponse
 
 MODELS = [
-    {
-        "name": "BAAI/bge-reranker-v2-m3",
-        "is_cross_encoder": True
-    },
-    {
-        "name": "BAAI/bge-base-en-v1.5",
-        "is_cross_encoder": False
-    },
+    {"name": "BAAI/bge-reranker-v2-m3", "is_cross_encoder": True},
+    {"name": "BAAI/bge-base-en-v1.5", "is_cross_encoder": False},
 ]
 DTYPE = "half"
 
@@ -28,9 +22,7 @@ def run_transformers(hf_model, model, text_pairs):
     if model["is_cross_encoder"]:
         return hf_model.predict(text_pairs).tolist()
     else:
-        hf_embeddings = [
-            hf_model.encode(text_pair) for text_pair in text_pairs
-        ]
+        hf_embeddings = [hf_model.encode(text_pair) for text_pair in text_pairs]
         return [
             F.cosine_similarity(tensor(pair[0]), tensor(pair[1]), dim=0)
             for pair in hf_embeddings
@@ -54,8 +46,9 @@ def server(model: dict[str, Any]):
 def runner(model: dict[str, Any], hf_runner):
     kwargs = {
         "dtype": DTYPE,
-        "is_cross_encoder" if model["is_cross_encoder"]\
-              else "is_sentence_transformer": True
+        "is_cross_encoder"
+        if model["is_cross_encoder"]
+        else "is_sentence_transformer": True,
     }
 
     with hf_runner(model["name"], **kwargs) as hf_model:
@@ -63,21 +56,23 @@ def runner(model: dict[str, Any], hf_runner):
 
 
 class TestModel:
-
-    def test_text_1_str_text_2_list(self, server: RemoteOpenAIServer,
-                                    model: dict[str, Any], runner):
+    def test_text_1_str_text_2_list(
+        self, server: RemoteOpenAIServer, model: dict[str, Any], runner
+    ):
         text_1 = "What is the capital of France?"
         text_2 = [
             "The capital of Brazil is Brasilia.",
-            "The capital of France is Paris."
+            "The capital of France is Paris.",
         ]
 
-        score_response = requests.post(server.url_for("score"),
-                                       json={
-                                           "model": model["name"],
-                                           "text_1": text_1,
-                                           "text_2": text_2,
-                                       })
+        score_response = requests.post(
+            server.url_for("score"),
+            json={
+                "model": model["name"],
+                "text_1": text_1,
+                "text_2": text_2,
+            },
+        )
         score_response.raise_for_status()
         score = ScoreResponse.model_validate(score_response.json())
 
@@ -93,23 +88,26 @@ def test_text_1_str_text_2_list(self, server: RemoteOpenAIServer,
         for i in range(len(vllm_outputs)):
             assert hf_outputs[i] == pytest.approx(vllm_outputs[i], rel=0.01)
 
-    def test_text_1_list_text_2_list(self, server: RemoteOpenAIServer,
-                                     model: dict[str, Any], runner):
+    def test_text_1_list_text_2_list(
+        self, server: RemoteOpenAIServer, model: dict[str, Any], runner
+    ):
         text_1 = [
             "What is the capital of the United States?",
-            "What is the capital of France?"
+            "What is the capital of France?",
         ]
         text_2 = [
             "The capital of Brazil is Brasilia.",
-            "The capital of France is Paris."
+            "The capital of France is Paris.",
         ]
 
-        score_response = requests.post(server.url_for("score"),
-                                       json={
-                                           "model": model["name"],
-                                           "text_1": text_1,
-                                           "text_2": text_2,
-                                       })
+        score_response = requests.post(
+            server.url_for("score"),
+            json={
+                "model": model["name"],
+                "text_1": text_1,
+                "text_2": text_2,
+            },
+        )
         score_response.raise_for_status()
         score = ScoreResponse.model_validate(score_response.json())
 
@@ -125,17 +123,20 @@ def test_text_1_list_text_2_list(self, server: RemoteOpenAIServer,
         for i in range(len(vllm_outputs)):
             assert hf_outputs[i] == pytest.approx(vllm_outputs[i], rel=0.01)
 
-    def test_text_1_str_text_2_str(self, server: RemoteOpenAIServer,
-                                   model: dict[str, Any], runner):
+    def test_text_1_str_text_2_str(
+        self, server: RemoteOpenAIServer, model: dict[str, Any], runner
+    ):
         text_1 = "What is the capital of France?"
         text_2 = "The capital of France is Paris."
 
-        score_response = requests.post(server.url_for("score"),
-                                       json={
-                                           "model": model["name"],
-                                           "text_1": text_1,
-                                           "text_2": text_2,
-                                       })
+        score_response = requests.post(
+            server.url_for("score"),
+            json={
+                "model": model["name"],
+                "text_1": text_1,
+                "text_2": text_2,
+            },
+        )
         score_response.raise_for_status()
         score = ScoreResponse.model_validate(score_response.json())
 
@@ -151,40 +152,41 @@ def test_text_1_str_text_2_str(self, server: RemoteOpenAIServer,
         for i in range(len(vllm_outputs)):
             assert hf_outputs[i] == pytest.approx(vllm_outputs[i], rel=0.01)
 
-    def test_score_max_model_len(self, server: RemoteOpenAIServer,
-                                 model: dict[str, Any]):
-
+    def test_score_max_model_len(
+        self, server: RemoteOpenAIServer, model: dict[str, Any]
+    ):
         text_1 = "What is the capital of France?" * 20
         text_2 = [
             "The capital of Brazil is Brasilia.",
-            "The capital of France is Paris."
+            "The capital of France is Paris.",
         ]
 
-        score_response = requests.post(server.url_for("score"),
-                                       json={
-                                           "model": model["name"],
-                                           "text_1": text_1,
-                                           "text_2": text_2,
-                                       })
+        score_response = requests.post(
+            server.url_for("score"),
+            json={
+                "model": model["name"],
+                "text_1": text_1,
+                "text_2": text_2,
+            },
+        )
         assert score_response.status_code == 400
         # Assert just a small fragments of the response
-        assert "Please reduce the length of the input." in \
-            score_response.text
+        assert "Please reduce the length of the input." in score_response.text
 
         # Test truncation
-        score_response = requests.post(server.url_for("score"),
-                                       json={
-                                           "model": model["name"],
-                                           "text_1": text_1,
-                                           "text_2": text_2,
-                                           "truncate_prompt_tokens": 101
-                                       })
+        score_response = requests.post(
+            server.url_for("score"),
+            json={
+                "model": model["name"],
+                "text_1": text_1,
+                "text_2": text_2,
+                "truncate_prompt_tokens": 101,
+            },
+        )
         assert score_response.status_code == 400
-        assert "Please, select a smaller truncation size." in \
-            score_response.text
+        assert "Please, select a smaller truncation size." in score_response.text
 
-    def test_invocations(self, server: RemoteOpenAIServer, model: dict[str,
-                                                                       Any]):
+    def test_invocations(self, server: RemoteOpenAIServer, model: dict[str, Any]):
         text_1 = "What is the capital of France?"
         text_2 = "The capital of France is Paris."
 
@@ -194,59 +196,61 @@ def test_invocations(self, server: RemoteOpenAIServer, model: dict[str,
             "text_2": text_2,
         }
 
-        score_response = requests.post(server.url_for("score"),
-                                       json=request_args)
+        score_response = requests.post(server.url_for("score"), json=request_args)
         score_response.raise_for_status()
 
-        invocation_response = requests.post(server.url_for("invocations"),
-                                            json=request_args)
+        invocation_response = requests.post(
+            server.url_for("invocations"), json=request_args
+        )
         invocation_response.raise_for_status()
 
         score_output = score_response.json()
         invocation_output = invocation_response.json()
 
         assert score_output.keys() == invocation_output.keys()
-        for score_data, invocation_data in zip(score_output["data"],
-                                               invocation_output["data"]):
+        for score_data, invocation_data in zip(
+            score_output["data"], invocation_output["data"]
+        ):
             assert score_data.keys() == invocation_data.keys()
             assert score_data["score"] == pytest.approx(
-                invocation_data["score"], rel=0.05)
+                invocation_data["score"], rel=0.05
+            )
             # TODO: reset this tolerance to 0.01 once we find
             # an alternative to flash_attn with bfloat16
 
-    def test_activation(self, server: RemoteOpenAIServer, model: dict[str,
-                                                                      Any]):
-
+    def test_activation(self, server: RemoteOpenAIServer, model: dict[str, Any]):
         def get_outputs(activation):
             text_1 = "What is the capital of France?"
             text_2 = "The capital of France is Paris."
-            response = requests.post(server.url_for("score"),
-                                     json={
-                                         "model": model["name"],
-                                         "text_1": text_1,
-                                         "text_2": text_2,
-                                         "activation": activation
-                                     })
+            response = requests.post(
+                server.url_for("score"),
+                json={
+                    "model": model["name"],
+                    "text_1": text_1,
+                    "text_2": text_2,
+                    "activation": activation,
+                },
+            )
             if response.status_code != 200:
                 return response
 
             outputs = response.json()
-            return torch.tensor([x['score'] for x in outputs["data"]])
+            return torch.tensor([x["score"] for x in outputs["data"]])
 
         if model["is_cross_encoder"]:
-
             default = get_outputs(activation=None)
             w_activation = get_outputs(activation=True)
             wo_activation = get_outputs(activation=False)
 
-            assert torch.allclose(default, w_activation,
-                                  atol=1e-2), "Default should use activation."
-            assert not torch.allclose(
-                w_activation, wo_activation,
-                atol=1e-2), "wo_activation should not use activation."
-            assert torch.allclose(
-                F.sigmoid(wo_activation), w_activation, atol=1e-2
-            ), "w_activation should be close to activation(wo_activation)."
+            assert torch.allclose(default, w_activation, atol=1e-2), (
+                "Default should use activation."
+            )
+            assert not torch.allclose(w_activation, wo_activation, atol=1e-2), (
+                "wo_activation should not use activation."
+            )
+            assert torch.allclose(F.sigmoid(wo_activation), w_activation, atol=1e-2), (
+                "w_activation should be close to activation(wo_activation)."
+            )
         else:
             get_outputs(activation=None)
 
diff --git a/tests/entrypoints/pooling/openai/test_truncation.py b/tests/entrypoints/pooling/openai/test_truncation.py
index 6bdf5ce7c4a6..6889628dc914 100644
--- a/tests/entrypoints/pooling/openai/test_truncation.py
+++ b/tests/entrypoints/pooling/openai/test_truncation.py
@@ -54,12 +54,10 @@ async def test_smaller_truncation_size(client: openai.AsyncOpenAI):
     kwargs: dict[str, Any] = {
         "model": MODEL_NAME,
         "input": input,
-        "truncate_prompt_tokens": truncation_size
+        "truncate_prompt_tokens": truncation_size,
     }
 
-    response = await client.post(path="embeddings",
-                                 cast_to=object,
-                                 body={**kwargs})
+    response = await client.post(path="embeddings", cast_to=object, body={**kwargs})
 
     assert response["usage"]["prompt_tokens"] == truncation_size
 
@@ -70,12 +68,10 @@ async def test_zero_truncation_size(client: openai.AsyncOpenAI):
     kwargs: dict[str, Any] = {
         "model": MODEL_NAME,
         "input": input,
-        "truncate_prompt_tokens": truncation_size
+        "truncate_prompt_tokens": truncation_size,
     }
 
-    response = await client.post(path="embeddings",
-                                 cast_to=object,
-                                 body={**kwargs})
+    response = await client.post(path="embeddings", cast_to=object, body={**kwargs})
 
     assert response["usage"]["prompt_tokens"] == truncation_size
 
@@ -86,7 +82,7 @@ async def test_bigger_truncation_size(client: openai.AsyncOpenAI):
     kwargs: dict[str, Any] = {
         "model": MODEL_NAME,
         "input": input,
-        "truncate_prompt_tokens": truncation_size
+        "truncate_prompt_tokens": truncation_size,
     }
 
     with pytest.raises(openai.BadRequestError) as err:
@@ -95,9 +91,11 @@ async def test_bigger_truncation_size(client: openai.AsyncOpenAI):
     assert err.value.status_code == 400
     error_details = err.value.response.json()["error"]
     assert error_details["type"] == "BadRequestError"
-    expected_message = ("truncate_prompt_tokens value is "
-                        "greater than max_model_len."
-                        " Please, select a smaller truncation size.")
+    expected_message = (
+        "truncate_prompt_tokens value is "
+        "greater than max_model_len."
+        " Please, select a smaller truncation size."
+    )
     assert error_details["message"] == expected_message
 
 
@@ -107,11 +105,9 @@ async def test_max_truncation_size(client: openai.AsyncOpenAI):
     kwargs: dict[str, Any] = {
         "model": MODEL_NAME,
         "input": input,
-        "truncate_prompt_tokens": truncation_size
+        "truncate_prompt_tokens": truncation_size,
     }
 
-    response = await client.post(path="embeddings",
-                                 cast_to=object,
-                                 body={**kwargs})
+    response = await client.post(path="embeddings", cast_to=object, body={**kwargs})
 
     assert response["usage"]["prompt_tokens"] == max_model_len
diff --git a/tests/entrypoints/pooling/openai/test_vision_embedding.py b/tests/entrypoints/pooling/openai/test_vision_embedding.py
index a30413bc3298..944392d66fa5 100644
--- a/tests/entrypoints/pooling/openai/test_vision_embedding.py
+++ b/tests/entrypoints/pooling/openai/test_vision_embedding.py
@@ -50,16 +50,15 @@ def server():
 @pytest.fixture(scope="session")
 def base64_encoded_image(local_asset_server) -> dict[str, str]:
     return {
-        image_url:
-        encode_image_base64(local_asset_server.get_image_asset(image_url))
+        image_url: encode_image_base64(local_asset_server.get_image_asset(image_url))
         for image_url in TEST_IMAGE_ASSETS
     }
 
 
 def get_hf_prompt_tokens(model_name, content, image_url):
-    processor = AutoProcessor.from_pretrained(model_name,
-                                              trust_remote_code=True,
-                                              num_crops=4)
+    processor = AutoProcessor.from_pretrained(
+        model_name, trust_remote_code=True, num_crops=4
+    )
 
     placeholder = "<|image_1|> "
     prompt = f"{placeholder}{content}"
@@ -71,39 +70,28 @@ def get_hf_prompt_tokens(model_name, content, image_url):
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("image_url", TEST_IMAGE_ASSETS, indirect=True)
-async def test_image_embedding(server: RemoteOpenAIServer, model_name: str,
-                               image_url: str):
+async def test_image_embedding(
+    server: RemoteOpenAIServer, model_name: str, image_url: str
+):
     content_text = "Represent the given image."
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "image_url",
-                "image_url": {
-                    "url": image_url
-                }
-            },
-            {
-                "type": "text",
-                "text": content_text
-            },
-        ],
-    }]
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {"type": "image_url", "image_url": {"url": image_url}},
+                {"type": "text", "text": content_text},
+            ],
+        }
+    ]
 
     response = requests.post(
         server.url_for("v1/embeddings"),
-        json={
-            "model": model_name,
-            "messages": messages,
-            "encoding_format": "float"
-        },
+        json={"model": model_name, "messages": messages, "encoding_format": "float"},
     )
     response.raise_for_status()
     embeddings = EmbeddingResponse.model_validate(response.json())
 
-    hf_prompt_tokens = get_hf_prompt_tokens(model_name, content_text,
-                                            image_url)
+    hf_prompt_tokens = get_hf_prompt_tokens(model_name, content_text, image_url)
 
     assert embeddings.id is not None
     assert len(embeddings.data) == 1
diff --git a/tests/entrypoints/test_api_server_process_manager.py b/tests/entrypoints/test_api_server_process_manager.py
index 34b05ad17b02..e548f52e1e94 100644
--- a/tests/entrypoints/test_api_server_process_manager.py
+++ b/tests/entrypoints/test_api_server_process_manager.py
@@ -10,8 +10,7 @@
 
 import pytest
 
-from vllm.v1.utils import (APIServerProcessManager,
-                           wait_for_completion_or_failure)
+from vllm.v1.utils import APIServerProcessManager, wait_for_completion_or_failure
 
 # Global variables to control worker behavior
 WORKER_RUNTIME_SECONDS = 0.5
@@ -30,26 +29,22 @@ def api_server_args():
     """Fixture to provide arguments for APIServerProcessManager."""
     sock = socket.socket()
     return {
-        "target_server_fn":
-        mock_run_api_server_worker,
-        "listen_address":
-        "localhost:8000",
-        "sock":
-        sock,
-        "args":
-        "test_args",  # Simple string to avoid pickling issues
-        "num_servers":
-        3,
+        "target_server_fn": mock_run_api_server_worker,
+        "listen_address": "localhost:8000",
+        "sock": sock,
+        "args": "test_args",  # Simple string to avoid pickling issues
+        "num_servers": 3,
         "input_addresses": [
-            "tcp://127.0.0.1:5001", "tcp://127.0.0.1:5002",
-            "tcp://127.0.0.1:5003"
+            "tcp://127.0.0.1:5001",
+            "tcp://127.0.0.1:5002",
+            "tcp://127.0.0.1:5003",
         ],
         "output_addresses": [
-            "tcp://127.0.0.1:6001", "tcp://127.0.0.1:6002",
-            "tcp://127.0.0.1:6003"
+            "tcp://127.0.0.1:6001",
+            "tcp://127.0.0.1:6002",
+            "tcp://127.0.0.1:6003",
         ],
-        "stats_update_address":
-        "tcp://127.0.0.1:7000",
+        "stats_update_address": "tcp://127.0.0.1:7000",
     }
 
 
@@ -95,8 +90,9 @@ def test_api_server_process_manager_init(api_server_args, with_stats_update):
             assert not proc.is_alive()
 
 
-@patch("vllm.entrypoints.cli.serve.run_api_server_worker_proc",
-       mock_run_api_server_worker)
+@patch(
+    "vllm.entrypoints.cli.serve.run_api_server_worker_proc", mock_run_api_server_worker
+)
 def test_wait_for_completion_or_failure(api_server_args):
     """Test that wait_for_completion_or_failure works with failures."""
     global WORKER_RUNTIME_SECONDS
@@ -118,8 +114,7 @@ def run_with_exception_capture():
                 result["exception"] = e
 
         # Start a thread to run wait_for_completion_or_failure
-        wait_thread = threading.Thread(target=run_with_exception_capture,
-                                       daemon=True)
+        wait_thread = threading.Thread(target=run_with_exception_capture, daemon=True)
         wait_thread.start()
 
         # Let all processes run for a short time
@@ -174,8 +169,7 @@ def test_normal_completion(api_server_args):
 
         # Verify all processes have terminated
         for i, proc in enumerate(manager.processes):
-            assert not proc.is_alive(
-            ), f"Process {i} still alive after terminate()"
+            assert not proc.is_alive(), f"Process {i} still alive after terminate()"
 
         # Now call wait_for_completion_or_failure
         # since all processes have already
@@ -198,13 +192,13 @@ def test_external_process_monitoring(api_server_args):
     # Create and start the external process
     # (simulates local_engine_manager or coordinator)
     spawn_context = multiprocessing.get_context("spawn")
-    external_proc = spawn_context.Process(target=mock_run_api_server_worker,
-                                          name="MockExternalProcess")
+    external_proc = spawn_context.Process(
+        target=mock_run_api_server_worker, name="MockExternalProcess"
+    )
     external_proc.start()
 
     # Create the class to simulate a coordinator
     class MockCoordinator:
-
         def __init__(self, proc):
             self.proc = proc
 
@@ -228,14 +222,14 @@ def close(self):
 
         def run_with_exception_capture():
             try:
-                wait_for_completion_or_failure(api_server_manager=manager,
-                                               coordinator=mock_coordinator)
+                wait_for_completion_or_failure(
+                    api_server_manager=manager, coordinator=mock_coordinator
+                )
             except Exception as e:
                 result["exception"] = e
 
         # Start a thread to run wait_for_completion_or_failure
-        wait_thread = threading.Thread(target=run_with_exception_capture,
-                                       daemon=True)
+        wait_thread = threading.Thread(target=run_with_exception_capture, daemon=True)
         wait_thread.start()
 
         # Terminate the external process to trigger a failure
@@ -246,21 +240,23 @@ def run_with_exception_capture():
         wait_thread.join(timeout=1.0)
 
         # The wait thread should have completed
-        assert not wait_thread.is_alive(
-        ), "wait_for_completion_or_failure thread still running"
+        assert not wait_thread.is_alive(), (
+            "wait_for_completion_or_failure thread still running"
+        )
 
         # Verify that an exception was raised with appropriate error message
         assert result["exception"] is not None, "No exception was raised"
         error_message = str(result["exception"])
-        assert "died with exit code" in error_message, \
+        assert "died with exit code" in error_message, (
             f"Unexpected error message: {error_message}"
-        assert "MockExternalProcess" in error_message, \
+        )
+        assert "MockExternalProcess" in error_message, (
             f"Error doesn't mention external process: {error_message}"
+        )
 
         # Verify that all API server processes were terminated as a result
         for i, proc in enumerate(manager.processes):
-            assert not proc.is_alive(
-            ), f"API server process {i} was not terminated"
+            assert not proc.is_alive(), f"API server process {i} was not terminated"
 
     finally:
         # Clean up
diff --git a/tests/entrypoints/test_chat_utils.py b/tests/entrypoints/test_chat_utils.py
index 85b305c2fa02..7ddad4d513ec 100644
--- a/tests/entrypoints/test_chat_utils.py
+++ b/tests/entrypoints/test_chat_utils.py
@@ -6,24 +6,28 @@
 from typing import Literal, Optional
 
 import pytest
-from mistral_common.tokens.tokenizers.base import (SpecialTokenPolicy,
-                                                   SpecialTokens)
-from mistral_common.tokens.tokenizers.tekken import (SpecialTokenInfo,
-                                                     Tekkenizer)
+from mistral_common.tokens.tokenizers.base import SpecialTokenPolicy, SpecialTokens
+from mistral_common.tokens.tokenizers.tekken import SpecialTokenInfo, Tekkenizer
 
 from vllm.assets.audio import AudioAsset
 from vllm.assets.image import ImageAsset
 from vllm.assets.video import VideoAsset
 from vllm.config import ModelConfig
-from vllm.entrypoints.chat_utils import (_try_extract_ast, load_chat_template,
-                                         parse_chat_messages,
-                                         parse_chat_messages_futures,
-                                         resolve_chat_template_content_format,
-                                         resolve_chat_template_kwargs,
-                                         resolve_hf_chat_template)
+from vllm.entrypoints.chat_utils import (
+    _try_extract_ast,
+    load_chat_template,
+    parse_chat_messages,
+    parse_chat_messages_futures,
+    resolve_chat_template_content_format,
+    resolve_chat_template_kwargs,
+    resolve_hf_chat_template,
+)
 from vllm.multimodal import MultiModalDataDict, MultiModalUUIDDict
-from vllm.multimodal.utils import (encode_audio_base64, encode_image_base64,
-                                   encode_video_base64)
+from vllm.multimodal.utils import (
+    encode_audio_base64,
+    encode_image_base64,
+    encode_video_base64,
+)
 from vllm.transformers_utils.tokenizer import get_tokenizer
 from vllm.transformers_utils.tokenizers.mistral import MistralTokenizer
 
@@ -177,8 +181,7 @@ def _assert_mm_uuids(
         image_uuids = mm_uuids.get(modality)
         assert image_uuids is not None
 
-        assert isinstance(image_uuids,
-                          list) and len(image_uuids) == media_count
+        assert isinstance(image_uuids, list) and len(image_uuids) == media_count
 
         assert image_uuids == expected_uuids
     else:
@@ -190,10 +193,9 @@ def _assert_mm_uuids(
 
 
 def _assert_mm_data_inputs(
-        mm_data: Optional[MultiModalDataDict],
-        data_count: MultiModalDataCounts,
-        skipped_media_indices: Optional[dict[
-            str, list]] = None,  # modality -> list[int]
+    mm_data: Optional[MultiModalDataDict],
+    data_count: MultiModalDataCounts,
+    skipped_media_indices: Optional[dict[str, list]] = None,  # modality -> list[int]
 ) -> None:
     assert mm_data is not None
     assert set(data_count.keys()) == (set(mm_data.keys()))
@@ -204,8 +206,7 @@ def _assert_mm_data_inputs(
         assert isinstance(modality_data, list) and len(modality_data) == n
 
         if skipped_media_indices is not None:
-            skipped_media_indices_for_modality = skipped_media_indices.get(
-                modality)
+            skipped_media_indices_for_modality = skipped_media_indices.get(modality)
             assert skipped_media_indices_for_modality is not None
             for i in skipped_media_indices_for_modality:
                 assert modality_data[i] is None
@@ -217,31 +218,23 @@ def test_parse_chat_messages_single_image(
     image_url,
 ):
     conversation, mm_data, mm_uuids = parse_chat_messages(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
-                    }
-                },
-                {
-                    "type": "text",
-                    "text": "What's in the image?"
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {"type": "text", "text": "What's in the image?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role": "user",
-        "content": "<|image_1|>\nWhat's in the image?"
-    }]
+    assert conversation == [
+        {"role": "user", "content": "<|image_1|>\nWhat's in the image?"}
+    ]
     _assert_mm_data_is_image_input(mm_data, 1)
     _assert_mm_uuids(mm_uuids, 1, expected_uuids=[None])
 
@@ -253,32 +246,29 @@ def test_parse_chat_messages_single_image_with_uuid(
 ):
     image_uuid = str(hash(image_url))
     conversation, mm_data, mm_uuids = parse_chat_messages(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url,
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image_url",
+                        "image_url": {
+                            "url": image_url,
+                        },
+                        "uuid": image_uuid,
                     },
-                    "uuid": image_uuid,
-                },
-                {
-                    "type": "text",
-                    "text": "What's in the image?"
-                },
-            ],
-        }],
+                    {"type": "text", "text": "What's in the image?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role": "user",
-        "content": "<|image_1|>\nWhat's in the image?"
-    }]
+    assert conversation == [
+        {"role": "user", "content": "<|image_1|>\nWhat's in the image?"}
+    ]
     _assert_mm_data_is_image_input(mm_data, 1)
     _assert_mm_uuids(mm_uuids, 1, expected_uuids=[image_uuid])
 
@@ -290,30 +280,27 @@ def test_parse_chat_messages_single_empty_image_with_uuid(
 ):
     image_uuid = str(hash(image_url))
     conversation, mm_data, mm_uuids = parse_chat_messages(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": None,
-                    "uuid": image_uuid,
-                },
-                {
-                    "type": "text",
-                    "text": "What's in the image?"
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image_url",
+                        "image_url": None,
+                        "uuid": image_uuid,
+                    },
+                    {"type": "text", "text": "What's in the image?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role": "user",
-        "content": "<|image_1|>\nWhat's in the image?"
-    }]
+    assert conversation == [
+        {"role": "user", "content": "<|image_1|>\nWhat's in the image?"}
+    ]
     _assert_mm_data_is_image_input(mm_data, 1, skipped_image_indices=[0])
     _assert_mm_uuids(mm_uuids, 1, expected_uuids=[image_uuid])
 
@@ -325,33 +312,30 @@ def test_parse_chat_messages_single_image_with_bad_uuid_format(
 ):
     image_uuid = str(hash(image_url))
     conversation, mm_data, mm_uuids = parse_chat_messages(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url,
-                        "uuid": image_uuid,
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image_url",
+                        "image_url": {
+                            "url": image_url,
+                            "uuid": image_uuid,
+                        },
+                        "bad_uuid_key": image_uuid,
                     },
-                    "bad_uuid_key": image_uuid,
-                },
-                {
-                    "type": "text",
-                    "text": "What's in the image?"
-                },
-            ],
-        }],
+                    {"type": "text", "text": "What's in the image?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role": "user",
-        "content": "<|image_1|>\nWhat's in the image?"
-    }]
+    assert conversation == [
+        {"role": "user", "content": "<|image_1|>\nWhat's in the image?"}
+    ]
     _assert_mm_data_is_image_input(mm_data, 1)
     _assert_mm_uuids(mm_uuids, 1, expected_uuids=[None])
 
@@ -365,41 +349,39 @@ def test_parse_chat_messages_multiple_images_with_uuids(
     image_uuid2 = "my_uuid_2"
 
     conversation, mm_data, mm_uuids = parse_chat_messages(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url,
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image_url",
+                        "image_url": {
+                            "url": image_url,
+                        },
+                        "uuid": image_uuid1,
                     },
-                    "uuid": image_uuid1,
-                },
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url,
+                    {
+                        "type": "image_url",
+                        "image_url": {
+                            "url": image_url,
+                        },
+                        "uuid": image_uuid2,
                     },
-                    "uuid": image_uuid2,
-                },
-                {
-                    "type": "text",
-                    "text": "What's in the image?"
-                },
-            ],
-        }],
+                    {"type": "text", "text": "What's in the image?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "<|image_1|>\n<|image_2|>\nWhat's in the image?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "<|image_1|>\n<|image_2|>\nWhat's in the image?",
+        }
+    ]
     _assert_mm_data_is_image_input(mm_data, 2)
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[image_uuid1, image_uuid2])
 
@@ -413,37 +395,35 @@ def test_parse_chat_messages_multiple_empty_images_with_uuids(
     image_uuid2 = "my_uuid_2"
 
     conversation, mm_data, mm_uuids = parse_chat_messages(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": None,
-                    "uuid": image_uuid1,
-                },
-                {
-                    "type": "image_url",
-                    "image_url": None,
-                    "uuid": image_uuid2,
-                },
-                {
-                    "type": "text",
-                    "text": "What's in the image?"
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image_url",
+                        "image_url": None,
+                        "uuid": image_uuid1,
+                    },
+                    {
+                        "type": "image_url",
+                        "image_url": None,
+                        "uuid": image_uuid2,
+                    },
+                    {"type": "text", "text": "What's in the image?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "<|image_1|>\n<|image_2|>\nWhat's in the image?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "<|image_1|>\n<|image_2|>\nWhat's in the image?",
+        }
+    ]
     _assert_mm_data_is_image_input(mm_data, 2, skipped_image_indices=[0, 1])
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[image_uuid1, image_uuid2])
 
@@ -457,39 +437,37 @@ def test_parse_chat_messages_mixed_empty_images_with_uuids(
     image_uuid2 = "my_uuid_2"
 
     conversation, mm_data, mm_uuids = parse_chat_messages(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url,
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image_url",
+                        "image_url": {
+                            "url": image_url,
+                        },
+                        "uuid": image_uuid1,
                     },
-                    "uuid": image_uuid1,
-                },
-                {
-                    "type": "image_url",
-                    "image_url": None,
-                    "uuid": image_uuid2,
-                },
-                {
-                    "type": "text",
-                    "text": "What's in the image?"
-                },
-            ],
-        }],
+                    {
+                        "type": "image_url",
+                        "image_url": None,
+                        "uuid": image_uuid2,
+                    },
+                    {"type": "text", "text": "What's in the image?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "<|image_1|>\n<|image_2|>\nWhat's in the image?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "<|image_1|>\n<|image_2|>\nWhat's in the image?",
+        }
+    ]
     _assert_mm_data_is_image_input(mm_data, 2, skipped_image_indices=[1])
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[image_uuid1, image_uuid2])
 
@@ -502,32 +480,27 @@ async def test_parse_chat_messages_single_image_with_uuid_async(
 ):
     image_uuid = str(hash(image_url))
     conversation, mm_future, mm_uuids = parse_chat_messages_futures(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image_url",
+                        "image_url": {"url": image_url},
+                        "uuid": image_uuid,
                     },
-                    "uuid": image_uuid,
-                },
-                {
-                    "type": "text",
-                    "text": "What's in the image?"
-                },
-            ],
-        }],
+                    {"type": "text", "text": "What's in the image?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role": "user",
-        "content": "<|image_1|>\nWhat's in the image?"
-    }]
+    assert conversation == [
+        {"role": "user", "content": "<|image_1|>\nWhat's in the image?"}
+    ]
     _assert_mm_data_is_image_input(await mm_future, 1)
     _assert_mm_uuids(mm_uuids, 1, expected_uuids=[image_uuid])
 
@@ -540,33 +513,28 @@ async def test_parse_chat_messages_empty_image_with_uuid_async(
 ):
     image_uuid = str(hash(image_url))
     conversation, mm_future, mm_uuids = parse_chat_messages_futures(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": None,
-                    "uuid": image_uuid,
-                },
-                {
-                    "type": "text",
-                    "text": "What's in the image?"
-                },
-            ],
-        }],
-        phi3v_model_config,
-        phi3v_tokenizer,
-        content_format="string",
-    )
-
-    assert conversation == [{
-        "role": "user",
-        "content": "<|image_1|>\nWhat's in the image?"
-    }]
-    _assert_mm_data_is_image_input(await mm_future,
-                                   1,
-                                   skipped_image_indices=[0])
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image_url",
+                        "image_url": None,
+                        "uuid": image_uuid,
+                    },
+                    {"type": "text", "text": "What's in the image?"},
+                ],
+            }
+        ],
+        phi3v_model_config,
+        phi3v_tokenizer,
+        content_format="string",
+    )
+
+    assert conversation == [
+        {"role": "user", "content": "<|image_1|>\nWhat's in the image?"}
+    ]
+    _assert_mm_data_is_image_input(await mm_future, 1, skipped_image_indices=[0])
     _assert_mm_uuids(mm_uuids, 1, expected_uuids=[image_uuid])
 
 
@@ -580,39 +548,35 @@ async def test_parse_chat_messages_multiple_images_with_uuids_async(
     image_uuid2 = "my_uuid_2"
 
     conversation, mm_future, mm_uuids = parse_chat_messages_futures(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image_url",
+                        "image_url": {"url": image_url},
+                        "uuid": image_uuid1,
                     },
-                    "uuid": image_uuid1,
-                },
-                {
-                    "type": "image_pil",
-                    "image_pil": ImageAsset("cherry_blossom").pil_image,
-                    "uuid": image_uuid2,
-                },
-                {
-                    "type": "text",
-                    "text": "What's in these images?"
-                },
-            ],
-        }],
+                    {
+                        "type": "image_pil",
+                        "image_pil": ImageAsset("cherry_blossom").pil_image,
+                        "uuid": image_uuid2,
+                    },
+                    {"type": "text", "text": "What's in these images?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "<|image_1|>\n<|image_2|>\nWhat's in these images?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "<|image_1|>\n<|image_2|>\nWhat's in these images?",
+        }
+    ]
     _assert_mm_data_is_image_input(await mm_future, 2)
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[image_uuid1, image_uuid2])
 
@@ -627,40 +591,36 @@ async def test_parse_chat_messages_multiple_empty_images_with_uuids_async(
     image_uuid2 = "my_uuid_2"
 
     conversation, mm_future, mm_uuids = parse_chat_messages_futures(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": None,
-                    "uuid": image_uuid1,
-                },
-                {
-                    "type": "image_pil",
-                    "image_pil": None,
-                    "uuid": image_uuid2,
-                },
-                {
-                    "type": "text",
-                    "text": "What's in these images?"
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image_url",
+                        "image_url": None,
+                        "uuid": image_uuid1,
+                    },
+                    {
+                        "type": "image_pil",
+                        "image_pil": None,
+                        "uuid": image_uuid2,
+                    },
+                    {"type": "text", "text": "What's in these images?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "<|image_1|>\n<|image_2|>\nWhat's in these images?",
-    }]
-    _assert_mm_data_is_image_input(await mm_future,
-                                   2,
-                                   skipped_image_indices=[0, 1])
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "<|image_1|>\n<|image_2|>\nWhat's in these images?",
+        }
+    ]
+    _assert_mm_data_is_image_input(await mm_future, 2, skipped_image_indices=[0, 1])
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[image_uuid1, image_uuid2])
 
 
@@ -673,38 +633,34 @@ async def test_parse_chat_messages_multiple_images_with_partial_uuids_async(
     image_uuid2 = "my_uuid_2"
 
     conversation, mm_future, mm_uuids = parse_chat_messages_futures(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image_url",
+                        "image_url": {"url": image_url},
                     },
-                },
-                {
-                    "type": "image_pil",
-                    "image_pil": ImageAsset("cherry_blossom").pil_image,
-                    "uuid": image_uuid2,
-                },
-                {
-                    "type": "text",
-                    "text": "What's in these images?"
-                },
-            ],
-        }],
+                    {
+                        "type": "image_pil",
+                        "image_pil": ImageAsset("cherry_blossom").pil_image,
+                        "uuid": image_uuid2,
+                    },
+                    {"type": "text", "text": "What's in these images?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "<|image_1|>\n<|image_2|>\nWhat's in these images?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "<|image_1|>\n<|image_2|>\nWhat's in these images?",
+        }
+    ]
     _assert_mm_data_is_image_input(await mm_future, 2)
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[None, image_uuid2])
 
@@ -716,16 +672,10 @@ def test_parse_chat_messages_empty_system(
     # Test string format
     conversation, _, _ = parse_chat_messages(
         [
-            {
-                "role": "system",
-                "content": ""
-            },
+            {"role": "system", "content": ""},
             {
                 "role": "user",
-                "content": [{
-                    "type": "text",
-                    "text": "Who are you?"
-                }],
+                "content": [{"type": "text", "text": "Who are you?"}],
             },
         ],
         mistral_model_config,
@@ -733,29 +683,17 @@ def test_parse_chat_messages_empty_system(
         content_format="string",
     )
     assert conversation == [
-        {
-            "role": "system",
-            "content": ""
-        },
-        {
-            "role": "user",
-            "content": "Who are you?"
-        },
+        {"role": "system", "content": ""},
+        {"role": "user", "content": "Who are you?"},
     ]
 
     # Test openai format
     conversation, _, _ = parse_chat_messages(
         [
-            {
-                "role": "system",
-                "content": ""
-            },
+            {"role": "system", "content": ""},
             {
                 "role": "user",
-                "content": [{
-                    "type": "text",
-                    "text": "Who are you?"
-                }],
+                "content": [{"type": "text", "text": "Who are you?"}],
             },
         ],
         mistral_model_config,
@@ -763,20 +701,8 @@ def test_parse_chat_messages_empty_system(
         content_format="openai",
     )
     assert conversation == [
-        {
-            "role": "system",
-            "content": [{
-                "type": "text",
-                "text": ""
-            }]
-        },
-        {
-            "role": "user",
-            "content": [{
-                "type": "text",
-                "text": "Who are you?"
-            }]
-        },
+        {"role": "system", "content": [{"type": "text", "text": ""}]},
+        {"role": "user", "content": [{"type": "text", "text": "Who are you?"}]},
     ]
 
 
@@ -787,31 +713,23 @@ async def test_parse_chat_messages_single_image_async(
     image_url,
 ):
     conversation, mm_future, mm_uuids = parse_chat_messages_futures(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
-                    }
-                },
-                {
-                    "type": "text",
-                    "text": "What's in the image?"
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {"type": "text", "text": "What's in the image?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role": "user",
-        "content": "<|image_1|>\nWhat's in the image?"
-    }]
+    assert conversation == [
+        {"role": "user", "content": "<|image_1|>\nWhat's in the image?"}
+    ]
     _assert_mm_data_is_image_input(await mm_future, 1)
     _assert_mm_uuids(mm_uuids, 1, expected_uuids=[None])
 
@@ -822,37 +740,30 @@ def test_parse_chat_messages_multiple_images(
     image_url,
 ):
     conversation, mm_data, mm_uuids = parse_chat_messages(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
-                    }
-                },
-                {
-                    "type": "image_pil",
-                    "image_pil": ImageAsset("cherry_blossom").pil_image,
-                },
-                {
-                    "type": "text",
-                    "text": "What's in these images?"
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {
+                        "type": "image_pil",
+                        "image_pil": ImageAsset("cherry_blossom").pil_image,
+                    },
+                    {"type": "text", "text": "What's in these images?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "<|image_1|>\n<|image_2|>\nWhat's in these images?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "<|image_1|>\n<|image_2|>\nWhat's in these images?",
+        }
+    ]
     _assert_mm_data_is_image_input(mm_data, 2)
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[None, None])
 
@@ -863,30 +774,26 @@ def test_parse_chat_messages_empty_pil_image_with_uuid(
 ):
     uuid = "abcd"
     conversation, mm_data, mm_uuids = parse_chat_messages(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_pil",
-                    "image_pil": None,
-                    "uuid": uuid
-                },
-                {
-                    "type": "text",
-                    "text": "What's in this image?"
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {"type": "image_pil", "image_pil": None, "uuid": uuid},
+                    {"type": "text", "text": "What's in this image?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role": "user",
-        "content": "<|image_1|>\nWhat's in this image?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "<|image_1|>\nWhat's in this image?",
+        }
+    ]
     _assert_mm_data_is_image_input(mm_data, 1, skipped_image_indices=[0])
     _assert_mm_uuids(mm_uuids, 1, expected_uuids=[uuid])
 
@@ -897,30 +804,26 @@ def test_parse_chat_messages_empty_image_embeds_with_uuid(
 ):
     uuid = "abcd"
     conversation, mm_data, mm_uuids = parse_chat_messages(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_embeds",
-                    "image_embeds": None,
-                    "uuid": uuid
-                },
-                {
-                    "type": "text",
-                    "text": "What's in this image?"
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {"type": "image_embeds", "image_embeds": None, "uuid": uuid},
+                    {"type": "text", "text": "What's in this image?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role": "user",
-        "content": "<|image_1|>\nWhat's in this image?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "<|image_1|>\nWhat's in this image?",
+        }
+    ]
     assert mm_data is not None
     assert "image" in mm_data
     assert mm_data["image"] is None
@@ -934,30 +837,26 @@ async def test_parse_chat_messages_empty_image_embeds_with_uuid_async(
 ):
     uuid = "abcd"
     conversation, mm_future, mm_uuids = parse_chat_messages_futures(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_embeds",
-                    "image_embeds": None,
-                    "uuid": uuid
-                },
-                {
-                    "type": "text",
-                    "text": "What's in this image?"
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {"type": "image_embeds", "image_embeds": None, "uuid": uuid},
+                    {"type": "text", "text": "What's in this image?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role": "user",
-        "content": "<|image_1|>\nWhat's in this image?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "<|image_1|>\nWhat's in this image?",
+        }
+    ]
     mm_data = await mm_future
     assert mm_data is not None
     assert "image" in mm_data
@@ -972,37 +871,30 @@ async def test_parse_chat_messages_multiple_images_async(
     image_url,
 ):
     conversation, mm_future, mm_uuids = parse_chat_messages_futures(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
-                    }
-                },
-                {
-                    "type": "image_pil",
-                    "image_pil": ImageAsset("cherry_blossom").pil_image,
-                },
-                {
-                    "type": "text",
-                    "text": "What's in these images?"
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {
+                        "type": "image_pil",
+                        "image_pil": ImageAsset("cherry_blossom").pil_image,
+                    },
+                    {"type": "text", "text": "What's in these images?"},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "<|image_1|>\n<|image_2|>\nWhat's in these images?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "<|image_1|>\n<|image_2|>\nWhat's in these images?",
+        }
+    ]
     _assert_mm_data_is_image_input(await mm_future, 2)
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[None, None])
 
@@ -1013,40 +905,29 @@ def test_parse_chat_messages_placeholder_already_in_prompt(
     image_url,
 ):
     conversation, mm_data, mm_uuids = parse_chat_messages(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
-                    }
-                },
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
-                    }
-                },
-                {
-                    "type":
-                    "text",
-                    "text":
-                    "What's in <|image_1|> and how does it compare to <|image_2|>?",  # noqa: E501
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {
+                        "type": "text",
+                        "text": "What's in <|image_1|> and how does it compare to <|image_2|>?",  # noqa: E501
+                    },
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "What's in <|image_1|> and how does it compare to <|image_2|>?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "What's in <|image_1|> and how does it compare to <|image_2|>?",
+        }
+    ]
     _assert_mm_data_is_image_input(mm_data, 2)
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[None, None])
 
@@ -1057,42 +938,31 @@ def test_parse_chat_messages_placeholder_one_already_in_prompt(
     image_url,
 ):
     conversation, mm_data, mm_uuids = parse_chat_messages(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
-                    }
-                },
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
-                    }
-                },
-                {
-                    "type":
-                    "text",
-                    "text":
-                    "What's in <|image_1|> and how does it compare to the other one?",  # noqa: E501
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {
+                        "type": "text",
+                        "text": "What's in <|image_1|> and how does it compare to the other one?",  # noqa: E501
+                    },
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "<|image_2|>\nWhat's in <|image_1|> and how does it compare to the "
-        "other one?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "<|image_2|>\nWhat's in <|image_1|> and how does it compare to the "
+            "other one?",
+        }
+    ]
     _assert_mm_data_is_image_input(mm_data, 2)
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[None, None])
 
@@ -1105,39 +975,18 @@ def test_parse_chat_messages_multiple_images_across_messages(
     conversation, mm_data, mm_uuids = parse_chat_messages(
         [
             {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
-                    {
-                        "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        }
-                    },
-                    {
-                        "type": "text",
-                        "text": "What's in this image?"
-                    },
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {"type": "text", "text": "What's in this image?"},
                 ],
             },
+            {"role": "assistant", "content": "Some stuff."},
             {
-                "role": "assistant",
-                "content": "Some stuff."
-            },
-            {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
-                    {
-                        "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        }
-                    },
-                    {
-                        "type": "text",
-                        "text": "What about this one?"
-                    },
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {"type": "text", "text": "What about this one?"},
                 ],
             },
         ],
@@ -1147,18 +996,9 @@ def test_parse_chat_messages_multiple_images_across_messages(
     )
 
     assert conversation == [
-        {
-            "role": "user",
-            "content": "<|image_1|>\nWhat's in this image?"
-        },
-        {
-            "role": "assistant",
-            "content": "Some stuff."
-        },
-        {
-            "role": "user",
-            "content": "<|image_2|>\nWhat about this one?"
-        },
+        {"role": "user", "content": "<|image_1|>\nWhat's in this image?"},
+        {"role": "assistant", "content": "Some stuff."},
+        {"role": "user", "content": "<|image_2|>\nWhat about this one?"},
     ]
     _assert_mm_data_is_image_input(mm_data, 2)
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[None, None])
@@ -1173,41 +1013,26 @@ def test_parse_chat_messages_multiple_images_with_uuids_across_messages(
     conversation, mm_data, mm_uuids = parse_chat_messages(
         [
             {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
                     {
                         "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        },
+                        "image_url": {"url": image_url},
                         "uuid": image_uuid,
                     },
-                    {
-                        "type": "text",
-                        "text": "What's in this image?"
-                    },
+                    {"type": "text", "text": "What's in this image?"},
                 ],
             },
+            {"role": "assistant", "content": "Some stuff."},
             {
-                "role": "assistant",
-                "content": "Some stuff."
-            },
-            {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
                     {
                         "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        },
+                        "image_url": {"url": image_url},
                         "uuid": image_uuid,
                     },
-                    {
-                        "type": "text",
-                        "text": "What about this one?"
-                    },
+                    {"type": "text", "text": "What about this one?"},
                 ],
             },
         ],
@@ -1217,18 +1042,9 @@ def test_parse_chat_messages_multiple_images_with_uuids_across_messages(
     )
 
     assert conversation == [
-        {
-            "role": "user",
-            "content": "<|image_1|>\nWhat's in this image?"
-        },
-        {
-            "role": "assistant",
-            "content": "Some stuff."
-        },
-        {
-            "role": "user",
-            "content": "<|image_2|>\nWhat about this one?"
-        },
+        {"role": "user", "content": "<|image_1|>\nWhat's in this image?"},
+        {"role": "assistant", "content": "Some stuff."},
+        {"role": "user", "content": "<|image_2|>\nWhat about this one?"},
     ]
     _assert_mm_data_is_image_input(mm_data, 2)
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[image_uuid, image_uuid])
@@ -1242,19 +1058,10 @@ def test_parse_chat_messages_context_text_format(
         [
             {
                 "role": "user",
-                "content": [{
-                    "type": "text",
-                    "text": "What's in this text?"
-                }],
-            },
-            {
-                "role": "assistant",
-                "content": "Some stuff."
-            },
-            {
-                "role": "user",
-                "content": "What about this one?"
+                "content": [{"type": "text", "text": "What's in this text?"}],
             },
+            {"role": "assistant", "content": "Some stuff."},
+            {"role": "user", "content": "What about this one?"},
         ],
         phi3v_model_config,
         phi3v_tokenizer,
@@ -1264,24 +1071,15 @@ def test_parse_chat_messages_context_text_format(
     assert conversation == [
         {
             "role": "user",
-            "content": [{
-                "type": "text",
-                "text": "What's in this text?"
-            }],
+            "content": [{"type": "text", "text": "What's in this text?"}],
         },
         {
             "role": "assistant",
-            "content": [{
-                "type": "text",
-                "text": "Some stuff."
-            }],
+            "content": [{"type": "text", "text": "Some stuff."}],
         },
         {
             "role": "user",
-            "content": [{
-                "type": "text",
-                "text": "What about this one?"
-            }],
+            "content": [{"type": "text", "text": "What about this one?"}],
         },
     ]
     assert mm_data is None
@@ -1300,34 +1098,26 @@ def test_parse_chat_messages_rejects_too_many_images_in_one_message(
         )
         with pytest.raises(ValueError, match="At most"):
             parse_chat_messages(
-                [{
-                    "role":
-                    "user",
-                    "content": [
-                        {
-                            "type": "image_url",
-                            "image_url": {
-                                "url": image_url
+                [
+                    {
+                        "role": "user",
+                        "content": [
+                            {
+                                "type": "image_url",
+                                "image_url": {"url": image_url},
                             },
-                        },
-                        {
-                            "type": "image_url",
-                            "image_url": {
-                                "url": image_url
+                            {
+                                "type": "image_url",
+                                "image_url": {"url": image_url},
                             },
-                        },
-                        {
-                            "type": "image_url",
-                            "image_url": {
-                                "url": image_url
+                            {
+                                "type": "image_url",
+                                "image_url": {"url": image_url},
                             },
-                        },
-                        {
-                            "type": "text",
-                            "text": "What's in these images?"
-                        },
-                    ],
-                }],
+                            {"type": "text", "text": "What's in these images?"},
+                        ],
+                    }
+                ],
                 phi3v_model_config,
                 phi3v_tokenizer,
                 content_format="string",
@@ -1348,45 +1138,28 @@ def test_parse_chat_messages_rejects_too_many_images_across_messages(
             parse_chat_messages(
                 [
                     {
-                        "role":
-                        "user",
+                        "role": "user",
                         "content": [
                             {
                                 "type": "image_url",
-                                "image_url": {
-                                    "url": image_url
-                                },
-                            },
-                            {
-                                "type": "text",
-                                "text": "What's in this image?"
+                                "image_url": {"url": image_url},
                             },
+                            {"type": "text", "text": "What's in this image?"},
                         ],
                     },
+                    {"role": "assistant", "content": "Some stuff."},
                     {
-                        "role": "assistant",
-                        "content": "Some stuff."
-                    },
-                    {
-                        "role":
-                        "user",
+                        "role": "user",
                         "content": [
                             {
                                 "type": "image_url",
-                                "image_url": {
-                                    "url": image_url
-                                },
+                                "image_url": {"url": image_url},
                             },
                             {
                                 "type": "image_url",
-                                "image_url": {
-                                    "url": image_url
-                                },
-                            },
-                            {
-                                "type": "text",
-                                "text": "What about these two?"
+                                "image_url": {"url": image_url},
                             },
+                            {"type": "text", "text": "What about these two?"},
                         ],
                     },
                 ],
@@ -1402,30 +1175,27 @@ def test_parse_chat_messages_multiple_images_uncommon_input(
     image_url,
 ):
     conversation, mm_data, mm_uuids = parse_chat_messages(
-        [{
-            "role":
-            "user",
-            "content": [
-                "What's in these images?",
-                {
-                    "image_url": image_url
-                },
-                {
-                    "image_url": image_url
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    "What's in these images?",
+                    {"image_url": image_url},
+                    {"image_url": image_url},
+                ],
+            }
+        ],
         phi3v_model_config,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "<|image_1|>\n<|image_2|>\nWhat's in these images?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "<|image_1|>\n<|image_2|>\nWhat's in these images?",
+        }
+    ]
     _assert_mm_data_is_image_input(mm_data, 2)
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[None, None])
 
@@ -1436,48 +1206,33 @@ def test_parse_chat_messages_multiple_images_interleave(
     image_url,
 ):
     conversation, mm_data, mm_uuids = parse_chat_messages(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "text",
-                    "text": "I need you to compare this image",
-                },
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
-                    }
-                },
-                {
-                    "type": "text",
-                    "text": "and this one"
-                },
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
-                    }
-                },
-                {
-                    "type": "text",
-                    "text": "Do they have differences?"
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "text",
+                        "text": "I need you to compare this image",
+                    },
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {"type": "text", "text": "and this one"},
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {"type": "text", "text": "Do they have differences?"},
+                ],
+            }
+        ],
         phi3v_model_config_mm_interleaved,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "I need you to compare this image\n<|image_1|>\nand this one\n<|image_2|>\n"  # noqa: E501
-        "Do they have differences?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "I need you to compare this image\n<|image_1|>\nand this one\n<|image_2|>\n"  # noqa: E501
+            "Do they have differences?",
+        }
+    ]
     _assert_mm_data_is_image_input(mm_data, 2)
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[None, None])
 
@@ -1489,48 +1244,33 @@ async def test_parse_chat_messages_multiple_images_interleave_async(
     image_url,
 ):
     conversation, mm_data, mm_uuids = parse_chat_messages_futures(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "text",
-                    "text": "I need you to compare this image",
-                },
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
-                    }
-                },
-                {
-                    "type": "text",
-                    "text": "and this one"
-                },
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
-                    }
-                },
-                {
-                    "type": "text",
-                    "text": "Do they have differences?"
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "text",
+                        "text": "I need you to compare this image",
+                    },
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {"type": "text", "text": "and this one"},
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {"type": "text", "text": "Do they have differences?"},
+                ],
+            }
+        ],
         phi3v_model_config_mm_interleaved,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "I need you to compare this image\n<|image_1|>\nand this one\n<|image_2|>\n"  # noqa: E501
-        "Do they have differences?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "I need you to compare this image\n<|image_1|>\nand this one\n<|image_2|>\n"  # noqa: E501
+            "Do they have differences?",
+        }
+    ]
     _assert_mm_data_is_image_input(await mm_data, 2)
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[None, None])
 
@@ -1543,50 +1283,41 @@ async def test_parse_chat_messages_multiple_images_with_uuids_interleave_async(
 ):
     image_uuid = str(hash(image_url))
     conversation, mm_data, mm_uuids = parse_chat_messages_futures(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "text",
-                    "text": "I need you to compare this image",
-                },
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "text",
+                        "text": "I need you to compare this image",
                     },
-                    "uuid": image_uuid,
-                },
-                {
-                    "type": "text",
-                    "text": "and this one"
-                },
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": image_url
+                    {
+                        "type": "image_url",
+                        "image_url": {"url": image_url},
+                        "uuid": image_uuid,
                     },
-                    "uuid": image_uuid,
-                },
-                {
-                    "type": "text",
-                    "text": "Do they have differences?"
-                },
-            ],
-        }],
+                    {"type": "text", "text": "and this one"},
+                    {
+                        "type": "image_url",
+                        "image_url": {"url": image_url},
+                        "uuid": image_uuid,
+                    },
+                    {"type": "text", "text": "Do they have differences?"},
+                ],
+            }
+        ],
         phi3v_model_config_mm_interleaved,
         phi3v_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "I need you to compare this image\n<|image_1|>\nand this one\n<|image_2|>\n"  # noqa: E501
-        "Do they have differences?",
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "I need you to compare this image\n<|image_1|>\nand this one\n<|image_2|>\n"  # noqa: E501
+            "Do they have differences?",
+        }
+    ]
     _assert_mm_data_is_image_input(await mm_data, 2)
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[image_uuid, image_uuid])
 
@@ -1599,43 +1330,19 @@ def test_parse_chat_messages_multiple_images_multiple_messages_interleave(
     conversation, mm_data, mm_uuids = parse_chat_messages(
         [
             {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
-                    {
-                        "type": "text",
-                        "text": "What's on this image?"
-                    },
-                    {
-                        "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        }
-                    },
-                    {
-                        "type": "text",
-                        "text": "Be accurate."
-                    },
+                    {"type": "text", "text": "What's on this image?"},
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {"type": "text", "text": "Be accurate."},
                 ],
             },
+            {"role": "assistant", "content": "Some stuff."},
             {
-                "role": "assistant",
-                "content": "Some stuff."
-            },
-            {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
-                    {
-                        "type": "text",
-                        "text": "What's on this image?"
-                    },
-                    {
-                        "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        }
-                    },
+                    {"type": "text", "text": "What's on this image?"},
+                    {"type": "image_url", "image_url": {"url": image_url}},
                 ],
             },
         ],
@@ -1649,14 +1356,8 @@ def test_parse_chat_messages_multiple_images_multiple_messages_interleave(
             "role": "user",
             "content": "What's on this image?\n<|image_1|>\nBe accurate.",
         },
-        {
-            "role": "assistant",
-            "content": "Some stuff."
-        },
-        {
-            "role": "user",
-            "content": "What's on this image?\n<|image_2|>"
-        },
+        {"role": "assistant", "content": "Some stuff."},
+        {"role": "user", "content": "What's on this image?\n<|image_2|>"},
     ]
     _assert_mm_data_is_image_input(mm_data, 2)
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[None, None])
@@ -1671,43 +1372,25 @@ def test_parse_chat_messages_multiple_images_with_uuids_multiple_messages_interl
     conversation, mm_data, mm_uuids = parse_chat_messages(
         [
             {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
-                    {
-                        "type": "text",
-                        "text": "What's on this image?"
-                    },
+                    {"type": "text", "text": "What's on this image?"},
                     {
                         "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        },
+                        "image_url": {"url": image_url},
                         "uuid": image_uuid,
                     },
-                    {
-                        "type": "text",
-                        "text": "Be accurate."
-                    },
+                    {"type": "text", "text": "Be accurate."},
                 ],
             },
+            {"role": "assistant", "content": "Some stuff."},
             {
-                "role": "assistant",
-                "content": "Some stuff."
-            },
-            {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
-                    {
-                        "type": "text",
-                        "text": "What's on this image?"
-                    },
+                    {"type": "text", "text": "What's on this image?"},
                     {
                         "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        },
+                        "image_url": {"url": image_url},
                         "uuid": image_uuid,
                     },
                 ],
@@ -1723,14 +1406,8 @@ def test_parse_chat_messages_multiple_images_with_uuids_multiple_messages_interl
             "role": "user",
             "content": "What's on this image?\n<|image_1|>\nBe accurate.",
         },
-        {
-            "role": "assistant",
-            "content": "Some stuff."
-        },
-        {
-            "role": "user",
-            "content": "What's on this image?\n<|image_2|>"
-        },
+        {"role": "assistant", "content": "Some stuff."},
+        {"role": "user", "content": "What's on this image?\n<|image_2|>"},
     ]
     _assert_mm_data_is_image_input(mm_data, 2)
     _assert_mm_uuids(mm_uuids, 2, expected_uuids=[image_uuid, image_uuid])
@@ -1746,59 +1423,22 @@ def test_parse_chat_messages_multiple_modals_multiple_messages_interleave(
     conversation, mm_data, mm_uuids = parse_chat_messages(
         [
             {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
-                    {
-                        "type": "text",
-                        "text": "What's on this image?"
-                    },
-                    {
-                        "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        }
-                    },
-                    {
-                        "type": "text",
-                        "text": "Now listen to this audio"
-                    },
-                    {
-                        "type": "audio_url",
-                        "audio_url": {
-                            "url": audio_url
-                        }
-                    },
+                    {"type": "text", "text": "What's on this image?"},
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {"type": "text", "text": "Now listen to this audio"},
+                    {"type": "audio_url", "audio_url": {"url": audio_url}},
                 ],
             },
+            {"role": "assistant", "content": "Some stuff."},
             {
-                "role": "assistant",
-                "content": "Some stuff."
-            },
-            {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
-                    {
-                        "type": "text",
-                        "text": "What's on this image?"
-                    },
-                    {
-                        "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        }
-                    },
-                    {
-                        "type": "text",
-                        "text": "And what's in the video?"
-                    },
-                    {
-                        "type": "video_url",
-                        "video_url": {
-                            "url": video_url
-                        }
-                    },
+                    {"type": "text", "text": "What's on this image?"},
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {"type": "text", "text": "And what's in the video?"},
+                    {"type": "video_url", "video_url": {"url": video_url}},
                 ],
             },
         ],
@@ -1809,30 +1449,20 @@ def test_parse_chat_messages_multiple_modals_multiple_messages_interleave(
 
     assert conversation == [
         {
-            "role":
-            "user",
-            "content":
-            "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
+            "role": "user",
+            "content": "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
             "Now listen to this audio\nAudio 1: <|audio_bos|><|AUDIO|><|audio_eos|>",  # noqa: E501
         },
+        {"role": "assistant", "content": "Some stuff."},
         {
-            "role": "assistant",
-            "content": "Some stuff."
-        },
-        {
-            "role":
-            "user",
-            "content":
-            "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
+            "role": "user",
+            "content": "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
             "And what's in the video?\n<|vision_start|><|VIDEO|><|vision_end|>",
         },
     ]
 
     _assert_mm_data_inputs(mm_data, {"image": 2, "video": 1, "audio": 1})
-    _assert_mm_uuids(mm_uuids,
-                     2,
-                     modality="image",
-                     expected_uuids=[None, None])
+    _assert_mm_uuids(mm_uuids, 2, modality="image", expected_uuids=[None, None])
     _assert_mm_uuids(mm_uuids, 1, modality="video", expected_uuids=[None])
     _assert_mm_uuids(mm_uuids, 1, modality="audio", expected_uuids=[None])
 
@@ -1847,61 +1477,36 @@ def test_parse_chat_messages_multiple_modals_with_uuids_multiple_messages_interl
     conversation, mm_data, mm_uuids = parse_chat_messages(
         [
             {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
-                    {
-                        "type": "text",
-                        "text": "What's on this image?"
-                    },
+                    {"type": "text", "text": "What's on this image?"},
                     {
                         "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        },
+                        "image_url": {"url": image_url},
                         "uuid": "image_123",
                     },
-                    {
-                        "type": "text",
-                        "text": "Now listen to this audio"
-                    },
+                    {"type": "text", "text": "Now listen to this audio"},
                     {
                         "type": "audio_url",
-                        "audio_url": {
-                            "url": audio_url
-                        },
+                        "audio_url": {"url": audio_url},
                         "uuid": "audio_123",
                     },
                 ],
             },
+            {"role": "assistant", "content": "Some stuff."},
             {
-                "role": "assistant",
-                "content": "Some stuff."
-            },
-            {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
-                    {
-                        "type": "text",
-                        "text": "What's on this image?"
-                    },
+                    {"type": "text", "text": "What's on this image?"},
                     {
                         "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        },
+                        "image_url": {"url": image_url},
                         "uuid": "image_123",
                     },
-                    {
-                        "type": "text",
-                        "text": "And what's in the video?"
-                    },
+                    {"type": "text", "text": "And what's in the video?"},
                     {
                         "type": "video_url",
-                        "video_url": {
-                            "url": video_url
-                        },
+                        "video_url": {"url": video_url},
                         "uuid": "video_123",
                     },
                 ],
@@ -1914,38 +1519,24 @@ def test_parse_chat_messages_multiple_modals_with_uuids_multiple_messages_interl
 
     assert conversation == [
         {
-            "role":
-            "user",
-            "content":
-            "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
+            "role": "user",
+            "content": "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
             "Now listen to this audio\nAudio 1: <|audio_bos|><|AUDIO|><|audio_eos|>",  # noqa: E501
         },
+        {"role": "assistant", "content": "Some stuff."},
         {
-            "role": "assistant",
-            "content": "Some stuff."
-        },
-        {
-            "role":
-            "user",
-            "content":
-            "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
+            "role": "user",
+            "content": "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
             "And what's in the video?\n<|vision_start|><|VIDEO|><|vision_end|>",
         },
     ]
 
     _assert_mm_data_inputs(mm_data, {"image": 2, "video": 1, "audio": 1})
-    _assert_mm_uuids(mm_uuids,
-                     2,
-                     modality="image",
-                     expected_uuids=["image_123", "image_123"])
-    _assert_mm_uuids(mm_uuids,
-                     1,
-                     modality="video",
-                     expected_uuids=["video_123"])
-    _assert_mm_uuids(mm_uuids,
-                     1,
-                     modality="audio",
-                     expected_uuids=["audio_123"])
+    _assert_mm_uuids(
+        mm_uuids, 2, modality="image", expected_uuids=["image_123", "image_123"]
+    )
+    _assert_mm_uuids(mm_uuids, 1, modality="video", expected_uuids=["video_123"])
+    _assert_mm_uuids(mm_uuids, 1, modality="audio", expected_uuids=["audio_123"])
 
 
 def test_parse_chat_messages_multiple_modals_with_uuids_multiple_empty_media_messages_interleave(  # noqa: E501
@@ -1958,22 +1549,15 @@ def test_parse_chat_messages_multiple_modals_with_uuids_multiple_empty_media_mes
     conversation, mm_data, mm_uuids = parse_chat_messages(
         [
             {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
-                    {
-                        "type": "text",
-                        "text": "What's on this image?"
-                    },
+                    {"type": "text", "text": "What's on this image?"},
                     {
                         "type": "image_url",
                         "image_url": None,
                         "uuid": "image_123",
                     },
-                    {
-                        "type": "text",
-                        "text": "Now listen to this audio"
-                    },
+                    {"type": "text", "text": "Now listen to this audio"},
                     {
                         "type": "audio_url",
                         "audio_url": None,
@@ -1981,27 +1565,17 @@ def test_parse_chat_messages_multiple_modals_with_uuids_multiple_empty_media_mes
                     },
                 ],
             },
+            {"role": "assistant", "content": "Some stuff."},
             {
-                "role": "assistant",
-                "content": "Some stuff."
-            },
-            {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
-                    {
-                        "type": "text",
-                        "text": "What's on this image?"
-                    },
+                    {"type": "text", "text": "What's on this image?"},
                     {
                         "type": "image_url",
                         "image_url": None,
                         "uuid": "image_123",
                     },
-                    {
-                        "type": "text",
-                        "text": "And what's in the video?"
-                    },
+                    {"type": "text", "text": "And what's in the video?"},
                     {
                         "type": "video_url",
                         "video_url": None,
@@ -2017,47 +1591,28 @@ def test_parse_chat_messages_multiple_modals_with_uuids_multiple_empty_media_mes
 
     assert conversation == [
         {
-            "role":
-            "user",
-            "content":
-            "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
+            "role": "user",
+            "content": "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
             "Now listen to this audio\nAudio 1: <|audio_bos|><|AUDIO|><|audio_eos|>",  # noqa: E501
         },
+        {"role": "assistant", "content": "Some stuff."},
         {
-            "role": "assistant",
-            "content": "Some stuff."
-        },
-        {
-            "role":
-            "user",
-            "content":
-            "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
+            "role": "user",
+            "content": "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
             "And what's in the video?\n<|vision_start|><|VIDEO|><|vision_end|>",
         },
     ]
 
-    _assert_mm_data_inputs(mm_data, {
-        "image": 2,
-        "video": 1,
-        "audio": 1
-    },
-                           skipped_media_indices={
-                               "image": [0, 1],
-                               "video": [0],
-                               "audio": [0]
-                           })
-    _assert_mm_uuids(mm_uuids,
-                     2,
-                     modality="image",
-                     expected_uuids=["image_123", "image_123"])
-    _assert_mm_uuids(mm_uuids,
-                     1,
-                     modality="video",
-                     expected_uuids=["video_123"])
-    _assert_mm_uuids(mm_uuids,
-                     1,
-                     modality="audio",
-                     expected_uuids=["audio_123"])
+    _assert_mm_data_inputs(
+        mm_data,
+        {"image": 2, "video": 1, "audio": 1},
+        skipped_media_indices={"image": [0, 1], "video": [0], "audio": [0]},
+    )
+    _assert_mm_uuids(
+        mm_uuids, 2, modality="image", expected_uuids=["image_123", "image_123"]
+    )
+    _assert_mm_uuids(mm_uuids, 1, modality="video", expected_uuids=["video_123"])
+    _assert_mm_uuids(mm_uuids, 1, modality="audio", expected_uuids=["audio_123"])
 
 
 def test_parse_chat_messages_multiple_modals_with_partial_uuids_multiple_messages_interleave(  # noqa: E501
@@ -2070,59 +1625,28 @@ def test_parse_chat_messages_multiple_modals_with_partial_uuids_multiple_message
     conversation, mm_data, mm_uuids = parse_chat_messages(
         [
             {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
-                    {
-                        "type": "text",
-                        "text": "What's on this image?"
-                    },
+                    {"type": "text", "text": "What's on this image?"},
                     {
                         "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        },
+                        "image_url": {"url": image_url},
                         "uuid": "image_123",
                     },
-                    {
-                        "type": "text",
-                        "text": "Now listen to this audio"
-                    },
-                    {
-                        "type": "audio_url",
-                        "audio_url": {
-                            "url": audio_url
-                        }
-                    },
+                    {"type": "text", "text": "Now listen to this audio"},
+                    {"type": "audio_url", "audio_url": {"url": audio_url}},
                 ],
             },
+            {"role": "assistant", "content": "Some stuff."},
             {
-                "role": "assistant",
-                "content": "Some stuff."
-            },
-            {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
-                    {
-                        "type": "text",
-                        "text": "What's on this image?"
-                    },
-                    {
-                        "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        }
-                    },
-                    {
-                        "type": "text",
-                        "text": "And what's in the video?"
-                    },
+                    {"type": "text", "text": "What's on this image?"},
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                    {"type": "text", "text": "And what's in the video?"},
                     {
                         "type": "video_url",
-                        "video_url": {
-                            "url": video_url
-                        },
+                        "video_url": {"url": video_url},
                         "uuid": "video_123",
                     },
                 ],
@@ -2135,34 +1659,21 @@ def test_parse_chat_messages_multiple_modals_with_partial_uuids_multiple_message
 
     assert conversation == [
         {
-            "role":
-            "user",
-            "content":
-            "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
+            "role": "user",
+            "content": "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
             "Now listen to this audio\nAudio 1: <|audio_bos|><|AUDIO|><|audio_eos|>",  # noqa: E501
         },
+        {"role": "assistant", "content": "Some stuff."},
         {
-            "role": "assistant",
-            "content": "Some stuff."
-        },
-        {
-            "role":
-            "user",
-            "content":
-            "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
+            "role": "user",
+            "content": "What's on this image?\n<|vision_start|><|IMAGE|><|vision_end|>\n"
             "And what's in the video?\n<|vision_start|><|VIDEO|><|vision_end|>",
         },
     ]
 
     _assert_mm_data_inputs(mm_data, {"image": 2, "video": 1, "audio": 1})
-    _assert_mm_uuids(mm_uuids,
-                     2,
-                     modality="image",
-                     expected_uuids=["image_123", None])
-    _assert_mm_uuids(mm_uuids,
-                     1,
-                     modality="video",
-                     expected_uuids=["video_123"])
+    _assert_mm_uuids(mm_uuids, 2, modality="image", expected_uuids=["image_123", None])
+    _assert_mm_uuids(mm_uuids, 1, modality="video", expected_uuids=["video_123"])
     _assert_mm_uuids(mm_uuids, 1, modality="audio", expected_uuids=[None])
 
 
@@ -2172,36 +1683,25 @@ def test_parse_chat_messages_multiple_images_interleave_with_placeholders(
     image_url,
 ):
     with pytest.raises(
-            ValueError,
-            match=r"Found more '<|image_1|>' placeholders in input prompt "
-            "than actual multimodal data items.",
+        ValueError,
+        match=r"Found more '<|image_1|>' placeholders in input prompt "
+        "than actual multimodal data items.",
     ):
         parse_chat_messages(
-            [{
-                "role":
-                "user",
-                "content": [
-                    {
-                        "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        }
-                    },
-                    {
-                        "type": "image_url",
-                        "image_url": {
-                            "url": image_url
-                        }
-                    },
-                    {
-                        "type":
-                        "text",
-                        "text":
-                        "I need you to compare this image\n<|image_1|>\nand this one\n<|image_2|>\n"  # noqa: E501
-                        "Do they have differences?",
-                    },
-                ],
-            }],
+            [
+                {
+                    "role": "user",
+                    "content": [
+                        {"type": "image_url", "image_url": {"url": image_url}},
+                        {"type": "image_url", "image_url": {"url": image_url}},
+                        {
+                            "type": "text",
+                            "text": "I need you to compare this image\n<|image_1|>\nand this one\n<|image_2|>\n"  # noqa: E501
+                            "Do they have differences?",
+                        },
+                    ],
+                }
+            ],
             phi3v_model_config_mm_interleaved,
             phi3v_tokenizer,
             content_format="string",
@@ -2230,7 +1730,8 @@ def test_resolve_hf_chat_template(sample_json_schema, model, use_tools):
         hf_overrides=model_info.hf_overrides,
         skip_tokenizer_init=model_info.skip_tokenizer_init,
         enforce_eager=model_info.enforce_eager,
-        dtype=model_info.dtype)
+        dtype=model_info.dtype,
+    )
 
     # Build the tokenizer
     tokenizer = get_tokenizer(
@@ -2238,14 +1739,20 @@ def test_resolve_hf_chat_template(sample_json_schema, model, use_tools):
         trust_remote_code=model_config.trust_remote_code,
     )
 
-    tools = ([{
-        "type": "function",
-        "function": {
-            "name": "dummy_function_name",
-            "description": "This is a dummy function",
-            "parameters": sample_json_schema,
-        },
-    }] if use_tools else None)
+    tools = (
+        [
+            {
+                "type": "function",
+                "function": {
+                    "name": "dummy_function_name",
+                    "description": "This is a dummy function",
+                    "parameters": sample_json_schema,
+                },
+            }
+        ]
+        if use_tools
+        else None
+    )
 
     # Test detecting the tokenizer's chat_template
     chat_template = resolve_hf_chat_template(
@@ -2263,33 +1770,38 @@ def test_resolve_hf_chat_template(sample_json_schema, model, use_tools):
         (
             QWEN2VL_MODEL_ID,
             {
-                "add_vision_id", "add_generation_prompt",
-                "continue_final_message", "tools"
+                "add_vision_id",
+                "add_generation_prompt",
+                "continue_final_message",
+                "tools",
             },
         ),
         (
             QWEN3_MODEL_ID,
             {
-                "enable_thinking", "add_generation_prompt",
-                "continue_final_message", "tools"
+                "enable_thinking",
+                "add_generation_prompt",
+                "continue_final_message",
+                "tools",
             },
         ),
     ],
 )
-def test_resolve_hf_chat_template_kwargs(sample_json_schema, model,
-                                         expected_kwargs):
+def test_resolve_hf_chat_template_kwargs(sample_json_schema, model, expected_kwargs):
     """checks that chat_template is a dict type for HF models."""
     model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
     model_info.check_available_online(on_fail="skip")
 
-    tools = ([{
-        "type": "function",
-        "function": {
-            "name": "dummy_function_name",
-            "description": "This is a dummy function",
-            "parameters": sample_json_schema,
-        },
-    }])
+    tools = [
+        {
+            "type": "function",
+            "function": {
+                "name": "dummy_function_name",
+                "description": "This is a dummy function",
+                "parameters": sample_json_schema,
+            },
+        }
+    ]
 
     chat_template_kwargs = {
         # both unused
@@ -2317,7 +1829,8 @@ def test_resolve_hf_chat_template_kwargs(sample_json_schema, model,
         hf_overrides=model_info.hf_overrides,
         skip_tokenizer_init=model_info.skip_tokenizer_init,
         enforce_eager=model_info.enforce_eager,
-        dtype=model_info.dtype)
+        dtype=model_info.dtype,
+    )
 
     # Build the tokenizer
     tokenizer = get_tokenizer(
diff --git a/tests/entrypoints/test_context.py b/tests/entrypoints/test_context.py
index 2afe9758c2ad..6ad18fa08bc4 100644
--- a/tests/entrypoints/test_context.py
+++ b/tests/entrypoints/test_context.py
@@ -48,10 +48,9 @@ def create_mock_request_output(
     )
 
 
-async def generate_mock_outputs(num_turns,
-                                prompt_token_counts,
-                                output_token_counts,
-                                cached_token_counts=None):
+async def generate_mock_outputs(
+    num_turns, prompt_token_counts, output_token_counts, cached_token_counts=None
+):
     """Generate a sequence of mock RequestOutput objects to simulate multiple
     turns."""
     if cached_token_counts is None:
@@ -73,8 +72,9 @@ async def generate_mock_outputs(num_turns,
 @pytest.fixture
 def mock_parser():
     """Set up a mock parser for tests."""
-    with patch("vllm.entrypoints.context.get_streamable_parser_for_assistant"
-               ) as mock_parser_factory:
+    with patch(
+        "vllm.entrypoints.context.get_streamable_parser_for_assistant"
+    ) as mock_parser_factory:
         # Create a mock parser object
         parser = MagicMock()
         parser.messages = []
@@ -124,9 +124,9 @@ async def test_multi_turn_token_counting():
     prompt_token_counts = [5, 15, 20]
     output_token_counts = [3, 4, 5]
     cached_token_counts = [0, 5, 15]
-    mock_generator = generate_mock_outputs(3, prompt_token_counts,
-                                           output_token_counts,
-                                           cached_token_counts)
+    mock_generator = generate_mock_outputs(
+        3, prompt_token_counts, output_token_counts, cached_token_counts
+    )
 
     # First turn - initial prompt and response
     mock_output1 = await async_next(mock_generator)
@@ -251,7 +251,7 @@ async def test_single_turn_no_tool_output():
     """Test that first turn never generates tool output tokens."""
     context = HarmonyContext(
         messages=[],
-        available_tools=["browser"]  # Tools available
+        available_tools=["browser"],  # Tools available
     )
 
     # Even with large prompt in first turn, no tool tokens should be counted
@@ -333,21 +333,24 @@ async def test_streaming_multi_turn_token_counting(mock_parser):
             output_token_ids=[101],  # Single token
             num_cached_tokens=0,
             finished=False,  # Not end of message yet
-        ))
+        )
+    )
 
     # Second token of first turn
     context.append_output(
         create_mock_request_output(
             output_token_ids=[102],
             finished=False,
-        ))
+        )
+    )
 
     # Last token of first turn (finished=True signals end of message)
     context.append_output(
         create_mock_request_output(
             output_token_ids=[103],
             finished=True,  # End of message
-        ))
+        )
+    )
 
     # Check token counts after first turn
     assert context.num_prompt_tokens == 3  # Initial prompt tokens
@@ -362,25 +365,36 @@ async def test_streaming_multi_turn_token_counting(mock_parser):
     # First token of second turn
     context.append_output(
         create_mock_request_output(
-            prompt_token_ids=[1, 2, 3, 101, 102, 103, 4,
-                              5],  # 8 tokens (includes previous)
+            prompt_token_ids=[
+                1,
+                2,
+                3,
+                101,
+                102,
+                103,
+                4,
+                5,
+            ],  # 8 tokens (includes previous)
             output_token_ids=[201],
             num_cached_tokens=3,  # Some tokens cached
             finished=False,
-        ))
+        )
+    )
 
     # More tokens in reasoning channel
     context.append_output(
         create_mock_request_output(
             output_token_ids=[202],
             finished=False,
-        ))
+        )
+    )
 
     context.append_output(
         create_mock_request_output(
             output_token_ids=[203],
             finished=True,  # End of reasoning message
-        ))
+        )
+    )
 
     # Check counts after second turn (reasoning message)
     assert context.num_prompt_tokens == 3 + 8  # Initial + second prompt
@@ -399,18 +413,32 @@ async def test_streaming_multi_turn_token_counting(mock_parser):
     context.append_output(
         create_mock_request_output(
             prompt_token_ids=[
-                1, 2, 3, 101, 102, 103, 4, 5, 201, 202, 203, 6, 7
+                1,
+                2,
+                3,
+                101,
+                102,
+                103,
+                4,
+                5,
+                201,
+                202,
+                203,
+                6,
+                7,
             ],  # 13 tokens
             output_token_ids=[301],
             num_cached_tokens=8,  # More cached tokens
             finished=False,
-        ))
+        )
+    )
 
     context.append_output(
         create_mock_request_output(
             output_token_ids=[302],
             finished=True,
-        ))
+        )
+    )
 
     # Final token counts check
     assert context.num_prompt_tokens == 3 + 8 + 13  # All prompts
@@ -421,8 +449,9 @@ async def test_streaming_multi_turn_token_counting(mock_parser):
     # Additional tool tokens from third turn
     # Formula: this turn prompt - last turn prompt - last turn output
     additional_tool_tokens = 13 - 8 - 3  # = 2
-    assert context.num_tool_output_tokens == expected_tool_tokens \
-        + additional_tool_tokens
+    assert (
+        context.num_tool_output_tokens == expected_tool_tokens + additional_tool_tokens
+    )
 
 
 @pytest.mark.asyncio
@@ -442,8 +471,7 @@ async def test_streaming_message_synchronization(mock_parser):
             recipient=Role.ASSISTANT,
         )
     ]
-    context = StreamingHarmonyContext(messages=initial_messages,
-                                      available_tools=[])
+    context = StreamingHarmonyContext(messages=initial_messages, available_tools=[])
 
     # Verify initial state
     assert len(context._messages) == 1
@@ -461,9 +489,10 @@ async def test_streaming_message_synchronization(mock_parser):
 
     # This should trigger the message synchronization logic
     context.append_output(
-        create_mock_request_output(prompt_token_ids=[1, 2, 3],
-                                   output_token_ids=[101],
-                                   finished=False))
+        create_mock_request_output(
+            prompt_token_ids=[1, 2, 3], output_token_ids=[101], finished=False
+        )
+    )
 
     # Verify that messages were synchronized
     assert len(context._messages) == 2
@@ -485,12 +514,13 @@ async def test_streaming_message_synchronization(mock_parser):
             author=Author(role=Role.ASSISTANT, name="assistant"),
             content=[TextContent(text="Response 4")],
             recipient=Role.USER,
-        ))
+        )
+    )
 
     # Create another output to trigger synchronization again
-    mock_output2 = create_mock_request_output(prompt_token_ids=[1, 2, 3],
-                                              output_token_ids=[102],
-                                              finished=True)
+    mock_output2 = create_mock_request_output(
+        prompt_token_ids=[1, 2, 3], output_token_ids=[102], finished=True
+    )
 
     context.append_output(mock_output2)
 
diff --git a/tests/entrypoints/test_renderer.py b/tests/entrypoints/test_renderer.py
index 1f55b1fba613..f93978c3e6e7 100644
--- a/tests/entrypoints/test_renderer.py
+++ b/tests/entrypoints/test_renderer.py
@@ -21,7 +21,6 @@ class MockModelConfig:
 
 
 class MockTokenizerResult:
-
     def __init__(self, input_ids):
         self.input_ids = input_ids
 
@@ -45,9 +44,11 @@ def mock_async_tokenizer():
 
 @pytest.fixture
 def renderer(mock_model_config, mock_tokenizer):
-    return CompletionRenderer(model_config=mock_model_config,
-                              tokenizer=mock_tokenizer,
-                              async_tokenizer_pool={})
+    return CompletionRenderer(
+        model_config=mock_model_config,
+        tokenizer=mock_tokenizer,
+        async_tokenizer_pool={},
+    )
 
 
 class TestRenderPrompt:
@@ -57,7 +58,8 @@ class TestRenderPrompt:
     async def test_token_input(self, renderer):
         tokens = [101, 7592, 2088]
         results = await renderer.render_prompt(
-            prompt_or_prompts=tokens, config=RenderConfig(max_length=100))
+            prompt_or_prompts=tokens, config=RenderConfig(max_length=100)
+        )
 
         assert len(results) == 1
         assert results[0]["prompt_token_ids"] == tokens
@@ -66,7 +68,8 @@ async def test_token_input(self, renderer):
     async def test_token_list_input(self, renderer):
         token_lists = [[101, 7592, 2088], [102, 1234, 5678, 9012], [103, 4567]]
         results = await renderer.render_prompt(
-            prompt_or_prompts=token_lists, config=RenderConfig(max_length=100))
+            prompt_or_prompts=token_lists, config=RenderConfig(max_length=100)
+        )
 
         assert len(results) == 3
         assert results[0]["prompt_token_ids"] == [101, 7592, 2088]
@@ -75,14 +78,12 @@ async def test_token_list_input(self, renderer):
 
     @pytest.mark.asyncio
     async def test_text_input(self, renderer, mock_async_tokenizer):
-        mock_async_tokenizer.return_value = MockTokenizerResult(
-            [101, 7592, 2088])
-        renderer.async_tokenizer_pool[
-            renderer.tokenizer] = mock_async_tokenizer
+        mock_async_tokenizer.return_value = MockTokenizerResult([101, 7592, 2088])
+        renderer.async_tokenizer_pool[renderer.tokenizer] = mock_async_tokenizer
 
         results = await renderer.render_prompt(
-            prompt_or_prompts="Hello world",
-            config=RenderConfig(max_length=100))
+            prompt_or_prompts="Hello world", config=RenderConfig(max_length=100)
+        )
 
         assert len(results) == 1
         assert results[0]["prompt_token_ids"] == [101, 7592, 2088]
@@ -90,15 +91,13 @@ async def test_text_input(self, renderer, mock_async_tokenizer):
 
     @pytest.mark.asyncio
     async def test_text_list_input(self, renderer, mock_async_tokenizer):
-        mock_async_tokenizer.return_value = MockTokenizerResult(
-            [101, 7592, 2088])
-        renderer.async_tokenizer_pool[
-            renderer.tokenizer] = mock_async_tokenizer
+        mock_async_tokenizer.return_value = MockTokenizerResult([101, 7592, 2088])
+        renderer.async_tokenizer_pool[renderer.tokenizer] = mock_async_tokenizer
 
         text_list_input = ["Hello world", "How are you?", "Good morning"]
         results = await renderer.render_prompt(
-            prompt_or_prompts=text_list_input,
-            config=RenderConfig(max_length=100))
+            prompt_or_prompts=text_list_input, config=RenderConfig(max_length=100)
+        )
 
         assert len(results) == 3
         for result in results:
@@ -107,31 +106,31 @@ async def test_text_list_input(self, renderer, mock_async_tokenizer):
 
     @pytest.mark.asyncio
     async def test_no_truncation(self, renderer, mock_async_tokenizer):
-        mock_async_tokenizer.return_value = MockTokenizerResult(
-            [101, 7592, 2088])
-        renderer.async_tokenizer_pool[
-            renderer.tokenizer] = mock_async_tokenizer
+        mock_async_tokenizer.return_value = MockTokenizerResult([101, 7592, 2088])
+        renderer.async_tokenizer_pool[renderer.tokenizer] = mock_async_tokenizer
 
         results = await renderer.render_prompt(
-            prompt_or_prompts="Hello world",
-            config=RenderConfig(max_length=100))
+            prompt_or_prompts="Hello world", config=RenderConfig(max_length=100)
+        )
 
         assert len(results) == 1
         call_args = mock_async_tokenizer.call_args
-        assert "truncation" not in call_args.kwargs or call_args.kwargs[
-            "truncation"] is False
+        assert (
+            "truncation" not in call_args.kwargs
+            or call_args.kwargs["truncation"] is False
+        )
 
     @pytest.mark.asyncio
     async def test_truncation_positive(self, renderer, mock_async_tokenizer):
         mock_async_tokenizer.return_value = MockTokenizerResult(
-            [101, 7592, 2088])  # Truncated
-        renderer.async_tokenizer_pool[
-            renderer.tokenizer] = mock_async_tokenizer
+            [101, 7592, 2088]
+        )  # Truncated
+        renderer.async_tokenizer_pool[renderer.tokenizer] = mock_async_tokenizer
 
-        results = await renderer.render_prompt(prompt_or_prompts="Hello world",
-                                               config=RenderConfig(
-                                                   max_length=100,
-                                                   truncate_prompt_tokens=50))
+        results = await renderer.render_prompt(
+            prompt_or_prompts="Hello world",
+            config=RenderConfig(max_length=100, truncate_prompt_tokens=50),
+        )
 
         assert len(results) == 1
         call_args = mock_async_tokenizer.call_args
@@ -142,14 +141,14 @@ async def test_truncation_positive(self, renderer, mock_async_tokenizer):
     async def test_truncation_negative(self, renderer, mock_async_tokenizer):
         # Test that negative truncation uses model's max_model_len
         mock_async_tokenizer.return_value = MockTokenizerResult(
-            [101, 7592, 2088])  # Truncated to max_model_len
-        renderer.async_tokenizer_pool[
-            renderer.tokenizer] = mock_async_tokenizer
+            [101, 7592, 2088]
+        )  # Truncated to max_model_len
+        renderer.async_tokenizer_pool[renderer.tokenizer] = mock_async_tokenizer
 
-        results = await renderer.render_prompt(prompt_or_prompts="Hello world",
-                                               config=RenderConfig(
-                                                   max_length=200,
-                                                   truncate_prompt_tokens=-1))
+        results = await renderer.render_prompt(
+            prompt_or_prompts="Hello world",
+            config=RenderConfig(max_length=200, truncate_prompt_tokens=-1),
+        )
 
         assert len(results) == 1
         call_args = mock_async_tokenizer.call_args
@@ -159,12 +158,11 @@ async def test_truncation_negative(self, renderer, mock_async_tokenizer):
     @pytest.mark.asyncio
     async def test_token_truncation_last_elements(self, renderer):
         # Test that token truncation keeps the last N elements
-        long_tokens = [100, 101, 102, 103, 104, 105, 106, 107, 108,
-                       109]  # 10 tokens
-        results = await renderer.render_prompt(prompt_or_prompts=long_tokens,
-                                               config=RenderConfig(
-                                                   max_length=100,
-                                                   truncate_prompt_tokens=5))
+        long_tokens = [100, 101, 102, 103, 104, 105, 106, 107, 108, 109]  # 10 tokens
+        results = await renderer.render_prompt(
+            prompt_or_prompts=long_tokens,
+            config=RenderConfig(max_length=100, truncate_prompt_tokens=5),
+        )
 
         assert len(results) == 1
         # Should keep the last 5 tokens: [105, 106, 107, 108, 109]
@@ -175,30 +173,30 @@ async def test_max_length_exceeded(self, renderer):
         long_tokens = list(range(150))  # Exceeds max_model_len=100
 
         with pytest.raises(ValueError, match="maximum context length"):
-            await renderer.render_prompt(prompt_or_prompts=long_tokens,
-                                         config=RenderConfig(max_length=100))
+            await renderer.render_prompt(
+                prompt_or_prompts=long_tokens, config=RenderConfig(max_length=100)
+            )
 
     @pytest.mark.asyncio
     async def test_no_tokenizer_for_text(self, mock_model_config):
         renderer_no_tokenizer = CompletionRenderer(
-            model_config=mock_model_config,
-            tokenizer=None,
-            async_tokenizer_pool={})
+            model_config=mock_model_config, tokenizer=None, async_tokenizer_pool={}
+        )
 
         with pytest.raises(ValueError, match="No tokenizer available"):
             await renderer_no_tokenizer.render_prompt(
-                prompt_or_prompts="Hello world",
-                config=RenderConfig(max_length=100))
+                prompt_or_prompts="Hello world", config=RenderConfig(max_length=100)
+            )
 
     @pytest.mark.asyncio
     async def test_token_input_with_needs_detokenization(
-            self, renderer, mock_async_tokenizer):
+        self, renderer, mock_async_tokenizer
+    ):
         # When needs_detokenization=True for token inputs, renderer should
         # use the async tokenizer to decode and include the original text
         # in the returned prompt object.
         mock_async_tokenizer.decode = AsyncMock(return_value="decoded text")
-        renderer.async_tokenizer_pool[
-            renderer.tokenizer] = mock_async_tokenizer
+        renderer.async_tokenizer_pool[renderer.tokenizer] = mock_async_tokenizer
 
         tokens = [1, 2, 3, 4]
         results = await renderer.render_prompt(
@@ -213,7 +211,6 @@ async def test_token_input_with_needs_detokenization(
 
 
 class TestRenderEmbedPrompt:
-
     def _create_test_embed_bytes(self, tensor: torch.Tensor) -> bytes:
         """Helper to create base64-encoded tensor bytes"""
         buffer = io.BytesIO()
@@ -244,9 +241,7 @@ async def test_multiple_prompt_embeds(self, renderer):
             torch.randn(8, 512, dtype=torch.float32),
             torch.randn(12, 512, dtype=torch.float32),
         ]
-        embed_bytes_list = [
-            self._create_test_embed_bytes(t) for t in test_tensors
-        ]
+        embed_bytes_list = [self._create_test_embed_bytes(t) for t in test_tensors]
 
         results = await renderer.render_prompt_and_embeds(
             prompt_embeds=embed_bytes_list,
@@ -307,13 +302,10 @@ async def test_prompt_embed_squeeze_batch_dim(self, renderer):
         assert results[0]["prompt_embeds"].shape == (10, 768)
 
     @pytest.mark.asyncio
-    async def test_both_prompts_and_embeds(self, renderer,
-                                           mock_async_tokenizer):
+    async def test_both_prompts_and_embeds(self, renderer, mock_async_tokenizer):
         # Set up text tokenization
-        mock_async_tokenizer.return_value = MockTokenizerResult(
-            [101, 102, 103])
-        renderer.async_tokenizer_pool[
-            renderer.tokenizer] = mock_async_tokenizer
+        mock_async_tokenizer.return_value = MockTokenizerResult([101, 102, 103])
+        renderer.async_tokenizer_pool[renderer.tokenizer] = mock_async_tokenizer
 
         # Create embed
         test_tensor = torch.randn(5, 256, dtype=torch.float32)
diff --git a/tests/entrypoints/test_ssl_cert_refresher.py b/tests/entrypoints/test_ssl_cert_refresher.py
index 33ad2cfd3a33..b56fbd9fee7e 100644
--- a/tests/entrypoints/test_ssl_cert_refresher.py
+++ b/tests/entrypoints/test_ssl_cert_refresher.py
@@ -11,7 +11,6 @@
 
 
 class MockSSLContext(SSLContext):
-
     def __init__(self):
         self.load_cert_chain_count = 0
         self.load_ca_count = 0
@@ -34,7 +33,7 @@ def load_verify_locations(
 
 
 def create_file() -> str:
-    with tempfile.NamedTemporaryFile(dir='/tmp', delete=False) as f:
+    with tempfile.NamedTemporaryFile(dir="/tmp", delete=False) as f:
         return f.name
 
 
diff --git a/tests/evals/gpt_oss/__init__.py b/tests/evals/gpt_oss/__init__.py
index 0fec1fe5bcdf..208f01a7cb5e 100644
--- a/tests/evals/gpt_oss/__init__.py
+++ b/tests/evals/gpt_oss/__init__.py
@@ -1,2 +1,2 @@
 # SPDX-License-Identifier: Apache-2.0
-# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
\ No newline at end of file
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
diff --git a/tests/evals/gpt_oss/conftest.py b/tests/evals/gpt_oss/conftest.py
index 35528c0a6a36..2f140ae2c8e9 100644
--- a/tests/evals/gpt_oss/conftest.py
+++ b/tests/evals/gpt_oss/conftest.py
@@ -8,11 +8,9 @@
 def pytest_addoption(parser):
     """Add command line options for pytest."""
     parser.addoption("--model", action="store", help="Model name to evaluate")
-    parser.addoption("--metric",
-                     action="store",
-                     type=float,
-                     help="Expected metric threshold")
-    parser.addoption("--server-args",
-                     action="store",
-                     default="",
-                     help="Additional server arguments")
+    parser.addoption(
+        "--metric", action="store", type=float, help="Expected metric threshold"
+    )
+    parser.addoption(
+        "--server-args", action="store", default="", help="Additional server arguments"
+    )
diff --git a/tests/evals/gpt_oss/test_gpqa_correctness.py b/tests/evals/gpt_oss/test_gpqa_correctness.py
index 07c04f00cd0d..151deaa059f0 100644
--- a/tests/evals/gpt_oss/test_gpqa_correctness.py
+++ b/tests/evals/gpt_oss/test_gpqa_correctness.py
@@ -25,9 +25,19 @@ def run_gpqa_eval(model_name: str, base_url: str) -> float:
 
     # Build the command to run the evaluation
     cmd = [
-        sys.executable, "-m", "gpt_oss.evals", "--eval", "gpqa", "--model",
-        model_name, "--reasoning-effort", "low", "--base-url", base_url,
-        "--n-threads", "200"
+        sys.executable,
+        "-m",
+        "gpt_oss.evals",
+        "--eval",
+        "gpqa",
+        "--model",
+        model_name,
+        "--reasoning-effort",
+        "low",
+        "--base-url",
+        base_url,
+        "--n-threads",
+        "200",
     ]
 
     try:
@@ -37,7 +47,8 @@ def run_gpqa_eval(model_name: str, base_url: str) -> float:
             text=True,
             capture_output=True,
             timeout=1800,  # 30 minute timeout
-            env={"OPENAI_API_KEY": "dummy"})
+            env={"OPENAI_API_KEY": "dummy"},
+        )
 
         print("Evaluation process output:\n", result.stdout)
 
@@ -48,14 +59,16 @@ def run_gpqa_eval(model_name: str, base_url: str) -> float:
 
         # If we still can't find it, raise an error
         raise ValueError(
-            f"Could not parse score from evaluation output:\n{result.stdout}")
+            f"Could not parse score from evaluation output:\n{result.stdout}"
+        )
 
     except subprocess.TimeoutExpired as e:
         raise RuntimeError("Evaluation timed out") from e
     except subprocess.CalledProcessError as e:
         raise RuntimeError(
             f"Evaluation failed with exit code {e.returncode}:\n"
-            f"stdout: {e.stdout}\nstderr: {e.stderr}") from e
+            f"stdout: {e.stdout}\nstderr: {e.stderr}"
+        ) from e
 
 
 def test_gpqa_correctness(request):
@@ -72,17 +85,20 @@ def test_gpqa_correctness(request):
         server_args = server_args_str.split()
 
     # Add standard server arguments
-    server_args.extend([
-        "--trust-remote-code",
-    ])
+    server_args.extend(
+        [
+            "--trust-remote-code",
+        ]
+    )
 
     print(f"Starting GPQA evaluation for model: {model_name}")
     print(f"Expected metric threshold: {expected_metric}")
     print(f"Server args: {' '.join(server_args)}")
 
     # Launch server and run evaluation
-    with RemoteOpenAIServer(model_name, server_args,
-                            max_wait_seconds=1800) as remote_server:
+    with RemoteOpenAIServer(
+        model_name, server_args, max_wait_seconds=1800
+    ) as remote_server:
         base_url = remote_server.url_for("v1")
         print(f"Server started at: {base_url}")
 
@@ -96,6 +112,7 @@ def test_gpqa_correctness(request):
         # Verify metric is within tolerance
         assert measured_metric >= expected_metric - TOL, (
             f"GPQA metric too low: {measured_metric:.4f} < "
-            f"{expected_metric:.4f} - {TOL:.4f} = {expected_metric - TOL:.4f}")
+            f"{expected_metric:.4f} - {TOL:.4f} = {expected_metric - TOL:.4f}"
+        )
 
         print(f"✅ GPQA test passed for {model_name}")
diff --git a/tests/evals/gsm8k/__init__.py b/tests/evals/gsm8k/__init__.py
index 0fec1fe5bcdf..208f01a7cb5e 100644
--- a/tests/evals/gsm8k/__init__.py
+++ b/tests/evals/gsm8k/__init__.py
@@ -1,2 +1,2 @@
 # SPDX-License-Identifier: Apache-2.0
-# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
\ No newline at end of file
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
diff --git a/tests/evals/gsm8k/conftest.py b/tests/evals/gsm8k/conftest.py
index d96b0a66ede2..1932a13cdfc6 100644
--- a/tests/evals/gsm8k/conftest.py
+++ b/tests/evals/gsm8k/conftest.py
@@ -6,13 +6,12 @@
 
 def pytest_addoption(parser):
     """Add custom command line options."""
-    parser.addoption("--config-list-file",
-                     default="configs/models-small.txt",
-                     help="File containing list of config files to test")
-    parser.addoption("--tp-size",
-                     default=1,
-                     type=int,
-                     help="Tensor parallel size")
+    parser.addoption(
+        "--config-list-file",
+        default="configs/models-small.txt",
+        help="File containing list of config files to test",
+    )
+    parser.addoption("--tp-size", default=1, type=int, help="Tensor parallel size")
 
 
 def pytest_generate_tests(metafunc):
@@ -55,12 +54,10 @@ def pytest_generate_tests(metafunc):
 
         # Generate test parameters
         if config_files:
-            metafunc.parametrize(["config_filename", "tp_size"],
-                                 [(config_file, int(tp_size))
-                                  for config_file in config_files],
-                                 ids=[
-                                     f"{config_file.stem}-tp{tp_size}"
-                                     for config_file in config_files
-                                 ])
+            metafunc.parametrize(
+                ["config_filename", "tp_size"],
+                [(config_file, int(tp_size)) for config_file in config_files],
+                ids=[f"{config_file.stem}-tp{tp_size}" for config_file in config_files],
+            )
         else:
             print("No config files found, test will be skipped")
diff --git a/tests/evals/gsm8k/gsm8k_eval.py b/tests/evals/gsm8k/gsm8k_eval.py
index 7d0ce25f75dd..9edec7a78ca2 100644
--- a/tests/evals/gsm8k/gsm8k_eval.py
+++ b/tests/evals/gsm8k/gsm8k_eval.py
@@ -76,13 +76,15 @@ def get_answer_value(answer_str: str) -> int:
         return INVALID
 
 
-async def call_vllm_api(session: aiohttp.ClientSession,
-                        prompt: str,
-                        temperature: float,
-                        max_tokens: int,
-                        stop: Optional[list[str]] = None,
-                        url: Optional[str] = None,
-                        seed: Optional[int] = None) -> str:
+async def call_vllm_api(
+    session: aiohttp.ClientSession,
+    prompt: str,
+    temperature: float,
+    max_tokens: int,
+    stop: Optional[list[str]] = None,
+    url: Optional[str] = None,
+    seed: Optional[int] = None,
+) -> str:
     """Call vLLM's OpenAI-compatible completions endpoint."""
     data = {
         "prompt": prompt,
@@ -94,8 +96,7 @@ async def call_vllm_api(session: aiohttp.ClientSession,
         data["seed"] = seed
 
     try:
-        async with session.post(f"{url}/v1/completions",
-                                json=data) as response:
+        async with session.post(f"{url}/v1/completions", json=data) as response:
             response.raise_for_status()
             result = await response.json()
             return result["choices"][0]["text"]
@@ -104,16 +105,18 @@ async def call_vllm_api(session: aiohttp.ClientSession,
         return ""
 
 
-def evaluate_gsm8k(num_questions: int = 1319,
-                   num_shots: int = 5,
-                   max_tokens: int = 256,
-                   host: str = "http://127.0.0.1",
-                   port: int = 8000,
-                   temperature: float = 0.0,
-                   seed: Optional[int] = 42) -> dict[str, Union[float, int]]:
+def evaluate_gsm8k(
+    num_questions: int = 1319,
+    num_shots: int = 5,
+    max_tokens: int = 256,
+    host: str = "http://127.0.0.1",
+    port: int = 8000,
+    temperature: float = 0.0,
+    seed: Optional[int] = 42,
+) -> dict[str, Union[float, int]]:
     """
     Evaluate GSM8K accuracy using vLLM serve endpoint.
-    
+
     Returns dict with accuracy, invalid_rate, latency, etc.
     """
     base_url = f"{host}:{port}"
@@ -127,8 +130,10 @@ def evaluate_gsm8k(num_questions: int = 1319,
     # Build few-shot examples from train split (like lm-eval does)
     few_shot_examples = ""
     for i in range(num_shots):
-        few_shot_examples += (f"Question: {train_data[i]['question']}\n"
-                              f"Answer: {train_data[i]['answer']}\n\n")
+        few_shot_examples += (
+            f"Question: {train_data[i]['question']}\n"
+            f"Answer: {train_data[i]['answer']}\n\n"
+        )
 
     # Prepare test questions and labels from test split
     questions = []
@@ -157,15 +162,15 @@ async def get_answer(session: aiohttp.ClientSession, i: int) -> str:
             states[i] = answer
             return answer
 
-        async with aiohttp.ClientSession(timeout=aiohttp.ClientTimeout(
-                total=600)) as session:
+        async with aiohttp.ClientSession(
+            timeout=aiohttp.ClientTimeout(total=600)
+        ) as session:
             tasks = [get_answer(session, i) for i in range(num_questions)]
             await tqdm.gather(*tasks, desc="Evaluating")
 
         return states
 
-    print(f"Running GSM8K evaluation: {num_questions} questions, "
-          f"{num_shots}-shot")
+    print(f"Running GSM8K evaluation: {num_questions} questions, {num_shots}-shot")
 
     tic = time.perf_counter()
     states = asyncio.run(run_async_evaluation())
@@ -191,36 +196,28 @@ async def get_answer(session: aiohttp.ClientSession, i: int) -> str:
 
 
 def main() -> None:
-    parser = argparse.ArgumentParser(
-        description="GSM8K evaluation for vLLM serve")
-    parser.add_argument("--num-shots",
-                        type=int,
-                        default=5,
-                        help="Number of few-shot examples")
-    parser.add_argument("--num-questions",
-                        type=int,
-                        default=1319,
-                        help="Number of questions to evaluate")
-    parser.add_argument("--max-tokens",
-                        type=int,
-                        default=256,
-                        help="Max tokens for generation")
-    parser.add_argument("--host",
-                        type=str,
-                        default="http://127.0.0.1",
-                        help="Host URL")
+    parser = argparse.ArgumentParser(description="GSM8K evaluation for vLLM serve")
+    parser.add_argument(
+        "--num-shots", type=int, default=5, help="Number of few-shot examples"
+    )
+    parser.add_argument(
+        "--num-questions",
+        type=int,
+        default=1319,
+        help="Number of questions to evaluate",
+    )
+    parser.add_argument(
+        "--max-tokens", type=int, default=256, help="Max tokens for generation"
+    )
+    parser.add_argument("--host", type=str, default="http://127.0.0.1", help="Host URL")
     parser.add_argument("--port", type=int, default=8000, help="Port number")
-    parser.add_argument("--temperature",
-                        type=float,
-                        default=0.0,
-                        help="Temperature for generation")
-    parser.add_argument("--seed",
-                        type=int,
-                        default=42,
-                        help="Random seed for reproducibility")
-    parser.add_argument("--save-results",
-                        type=str,
-                        help="Save results to JSON file")
+    parser.add_argument(
+        "--temperature", type=float, default=0.0, help="Temperature for generation"
+    )
+    parser.add_argument(
+        "--seed", type=int, default=42, help="Random seed for reproducibility"
+    )
+    parser.add_argument("--save-results", type=str, help="Save results to JSON file")
 
     args = parser.parse_args()
 
diff --git a/tests/evals/gsm8k/test_gsm8k_correctness.py b/tests/evals/gsm8k/test_gsm8k_correctness.py
index a12dd49dbea6..ce3ab8096b45 100644
--- a/tests/evals/gsm8k/test_gsm8k_correctness.py
+++ b/tests/evals/gsm8k/test_gsm8k_correctness.py
@@ -63,9 +63,9 @@ def test_gsm8k_correctness_param(config_filename, tp_size):
     ]
 
     # Launch server and run evaluation
-    with RemoteOpenAIServer(eval_config["model_name"],
-                            server_args,
-                            max_wait_seconds=480) as remote_server:
+    with RemoteOpenAIServer(
+        eval_config["model_name"], server_args, max_wait_seconds=480
+    ) as remote_server:
         server_url = remote_server.url_for("v1")
 
         results = launch_gsm8k_eval(eval_config, server_url, tp_size)
@@ -85,6 +85,7 @@ def test_gsm8k_correctness_param(config_filename, tp_size):
         # Verify accuracy is within tolerance
         assert measured_accuracy >= expected_accuracy - RTOL, (
             f"Accuracy too low: {measured_accuracy:.3f} < "
-            f"{expected_accuracy:.3f} - {RTOL:.3f}")
+            f"{expected_accuracy:.3f} - {RTOL:.3f}"
+        )
 
         print(f"✅ GSM8K test passed for {eval_config['model_name']}")
diff --git a/tests/kernels/allclose_default.py b/tests/kernels/allclose_default.py
index 9d65159bf64f..6561e9556fa7 100644
--- a/tests/kernels/allclose_default.py
+++ b/tests/kernels/allclose_default.py
@@ -6,11 +6,7 @@
 # Reference default values of atol and rtol are from
 # https://github.com/pytorch/pytorch/blob/6d96beb6bec24d73ee3f080bac54d2104068f675/test/test_transformers.py#L67
 default_atol = {torch.float16: 1e-3, torch.bfloat16: 1e-3, torch.float: 1e-5}
-default_rtol = {
-    torch.float16: 1e-3,
-    torch.bfloat16: 1.6e-2,
-    torch.float: 1.3e-6
-}
+default_rtol = {torch.float16: 1e-3, torch.bfloat16: 1.6e-2, torch.float: 1.3e-6}
 
 
 def get_default_atol(output) -> float:
diff --git a/tests/kernels/attention/conftest.py b/tests/kernels/attention/conftest.py
index 88a2fb62b254..b080a71bd54e 100644
--- a/tests/kernels/attention/conftest.py
+++ b/tests/kernels/attention/conftest.py
@@ -3,8 +3,7 @@
 
 import pytest
 
-from vllm.utils import (create_kv_caches_with_random,
-                        create_kv_caches_with_random_flash)
+from vllm.utils import create_kv_caches_with_random, create_kv_caches_with_random_flash
 
 
 @pytest.fixture()
diff --git a/tests/kernels/attention/test_aiter_flash_attn.py b/tests/kernels/attention/test_aiter_flash_attn.py
index 2d882bdf4066..88b21a9b84d6 100644
--- a/tests/kernels/attention/test_aiter_flash_attn.py
+++ b/tests/kernels/attention/test_aiter_flash_attn.py
@@ -39,7 +39,7 @@ def ref_paged_attn(
     for i in range(num_seqs):
         query_len = query_lens[i]
         kv_len = kv_lens[i]
-        q = query[start_idx:start_idx + query_len]
+        q = query[start_idx : start_idx + query_len]
         q *= scale
 
         num_kv_blocks = (kv_len + block_size - 1) // block_size
@@ -57,10 +57,13 @@ def ref_paged_attn(
         empty_mask = torch.ones(query_len, kv_len)
         mask = torch.triu(empty_mask, diagonal=kv_len - query_len + 1).bool()
         if sliding_window is not None:
-            sliding_window_mask = torch.triu(empty_mask,
-                                             diagonal=kv_len -
-                                             (query_len + sliding_window) +
-                                             1).bool().logical_not()
+            sliding_window_mask = (
+                torch.triu(
+                    empty_mask, diagonal=kv_len - (query_len + sliding_window) + 1
+                )
+                .bool()
+                .logical_not()
+            )
             mask |= sliding_window_mask
         if soft_cap is not None:
             attn = soft_cap * torch.tanh(attn / soft_cap)
@@ -74,11 +77,10 @@ def ref_paged_attn(
     return torch.cat(outputs, dim=0)
 
 
-@pytest.mark.skipif(not current_platform.is_rocm(),
-                    reason="Only ROCm is supported")
-@pytest.mark.parametrize("seq_lens",
-                         [[(10, 1328), (5, 18),
-                           (129, 463)], [(8, 523), (24, 37), (3, 2011)]])
+@pytest.mark.skipif(not current_platform.is_rocm(), reason="Only ROCm is supported")
+@pytest.mark.parametrize(
+    "seq_lens", [[(10, 1328), (5, 18), (129, 463)], [(8, 523), (24, 37), (3, 2011)]]
+)
 @pytest.mark.parametrize("num_heads", NUM_HEADS)
 @pytest.mark.parametrize("head_size", HEAD_SIZES)
 @pytest.mark.parametrize("block_size", BLOCK_SIZES)
@@ -109,34 +111,27 @@ def test_varlen_with_paged_kv(
     assert num_query_heads % num_kv_heads == 0
     max_query_len = max(query_lens)
     max_kv_len = max(kv_lens)
-    window_size = ((sliding_window - 1, 0) if sliding_window is not None else
-                   (-1, -1))
+    window_size = (sliding_window - 1, 0) if sliding_window is not None else (-1, -1)
     scale = head_size**-0.5
 
-    query = torch.randn(sum(query_lens),
-                        num_query_heads,
-                        head_size,
-                        dtype=dtype)
-    key_cache = torch.randn(num_blocks,
-                            block_size,
-                            num_kv_heads,
-                            head_size,
-                            dtype=dtype)
+    query = torch.randn(sum(query_lens), num_query_heads, head_size, dtype=dtype)
+    key_cache = torch.randn(
+        num_blocks, block_size, num_kv_heads, head_size, dtype=dtype
+    )
     value_cache = torch.randn_like(key_cache)
-    cu_query_lens = torch.tensor([0] + query_lens,
-                                 dtype=torch.int32).cumsum(dim=0,
-                                                           dtype=torch.int32)
+    cu_query_lens = torch.tensor([0] + query_lens, dtype=torch.int32).cumsum(
+        dim=0, dtype=torch.int32
+    )
 
-    cu_seq_lens = torch.tensor([0] + kv_lens,
-                               dtype=torch.int32).cumsum(dim=0,
-                                                         dtype=torch.int32)
+    cu_seq_lens = torch.tensor([0] + kv_lens, dtype=torch.int32).cumsum(
+        dim=0, dtype=torch.int32
+    )
     kv_lens = torch.tensor(kv_lens, dtype=torch.int32)
 
     max_num_blocks_per_seq = (max_kv_len + block_size - 1) // block_size
-    block_tables = torch.randint(0,
-                                 num_blocks,
-                                 (num_seqs, max_num_blocks_per_seq),
-                                 dtype=torch.int32)
+    block_tables = torch.randint(
+        0, num_blocks, (num_seqs, max_num_blocks_per_seq), dtype=torch.int32
+    )
 
     output = torch.empty_like(query)
 
@@ -187,5 +182,7 @@ def test_varlen_with_paged_kv(
     atol, rtol = 2e-2, 2e-2
     if q_dtype is not None:
         atol, rtol = 1.5e-1, 1.5e-1
-    torch.testing.assert_close(output, ref_output, atol=atol, rtol=rtol), \
-        f"{torch.max(torch.abs(output - ref_output))}"
+    (
+        torch.testing.assert_close(output, ref_output, atol=atol, rtol=rtol),
+        f"{torch.max(torch.abs(output - ref_output))}",
+    )
diff --git a/tests/kernels/attention/test_attention.py b/tests/kernels/attention/test_attention.py
index c7abf652f111..16e544eb3cf9 100644
--- a/tests/kernels/attention/test_attention.py
+++ b/tests/kernels/attention/test_attention.py
@@ -42,9 +42,7 @@
 USE_ALIBI = [False, True]
 KV_CACHE_DTYPE = ["auto", "fp8"]
 SEEDS = [0]
-CUDA_DEVICES = [
-    f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)
-]
+CUDA_DEVICES = [f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)]
 
 
 def ref_masked_attention(
@@ -110,8 +108,7 @@ def ref_single_query_cached_kv_attention(
             # Create the ALiBi bias used in the paged attention kernel.
             position_ids = torch.arange(seq_len).int()
             alibi_bias = (position_ids - seq_len + 1).float()
-            alibi_bias = alibi_slopes.view(-1, 1, 1) * alibi_bias.view(
-                1, 1, -1)
+            alibi_bias = alibi_slopes.view(-1, 1, 1) * alibi_bias.view(1, 1, -1)
 
         out = ref_masked_attention(q, keys, values, scale, alibi_bias)
         out = out.view(num_query_heads, head_size)
@@ -119,8 +116,8 @@ def ref_single_query_cached_kv_attention(
 
 
 @pytest.mark.parametrize(
-    "version",
-    ["v1", "v2"] if not current_platform.is_rocm() else ["v1", "v2", "rocm"])
+    "version", ["v1", "v2"] if not current_platform.is_rocm() else ["v1", "v2", "rocm"]
+)
 @pytest.mark.parametrize("num_seqs", NUM_GEN_SEQS)
 @pytest.mark.parametrize("num_heads", NUM_HEADS)
 @pytest.mark.parametrize("head_size", HEAD_SIZES)
@@ -143,13 +140,18 @@ def test_paged_attention(
     seed: int,
     device: str,
 ) -> None:
-    if ((kv_cache_dtype == "fp8" and head_size % 16)
-            or (version == "rocm" and head_size not in (64, 128))):
+    if (kv_cache_dtype == "fp8" and head_size % 16) or (
+        version == "rocm" and head_size not in (64, 128)
+    ):
         pytest.skip()
 
-    if (version == "rocm" and current_platform.is_navi()
-            and (kv_cache_dtype == "fp8" or head_size != 128
-                 or block_size != 16 or use_alibi)):
+    if (
+        version == "rocm"
+        and current_platform.is_navi()
+        and (
+            kv_cache_dtype == "fp8" or head_size != 128 or block_size != 16 or use_alibi
+        )
+    ):
         pytest.skip()
 
     global PARTITION_SIZE
@@ -177,18 +179,24 @@ def test_paged_attention(
     block_tables_lst: list[list[int]] = []
     for _ in range(num_seqs):
         block_table = [
-            random.randint(0, NUM_BLOCKS - 1)
-            for _ in range(max_num_blocks_per_seq)
+            random.randint(0, NUM_BLOCKS - 1) for _ in range(max_num_blocks_per_seq)
         ]
         block_tables_lst.append(block_table)
 
     block_tables = torch.tensor(block_tables_lst, dtype=torch.int)
 
     # Create the KV caches.
-    key_caches, value_caches = kv_cache_factory(NUM_BLOCKS, block_size, 1,
-                                                num_kv_heads, head_size,
-                                                kv_cache_dtype, dtype, seed,
-                                                device)
+    key_caches, value_caches = kv_cache_factory(
+        NUM_BLOCKS,
+        block_size,
+        1,
+        num_kv_heads,
+        head_size,
+        kv_cache_dtype,
+        dtype,
+        seed,
+        device,
+    )
     key_cache, value_cache = key_caches[0], value_caches[0]
 
     # Using default kv_scale
@@ -214,18 +222,37 @@ def test_paged_attention(
             v_scale,
         )
 
-        opcheck(torch.ops._C.paged_attention_v1,
-                (output, query, key_cache, value_cache, num_kv_heads, scale,
-                 block_tables, seq_lens, block_size, max_seq_len, alibi_slopes,
-                 kv_cache_dtype, k_scale, v_scale, 0, 0, 0, 64, 0),
-                cond=(head_size == HEAD_SIZES[0]
-                      and block_size == BLOCK_SIZES[0]))
+        opcheck(
+            torch.ops._C.paged_attention_v1,
+            (
+                output,
+                query,
+                key_cache,
+                value_cache,
+                num_kv_heads,
+                scale,
+                block_tables,
+                seq_lens,
+                block_size,
+                max_seq_len,
+                alibi_slopes,
+                kv_cache_dtype,
+                k_scale,
+                v_scale,
+                0,
+                0,
+                0,
+                64,
+                0,
+            ),
+            cond=(head_size == HEAD_SIZES[0] and block_size == BLOCK_SIZES[0]),
+        )
 
     elif version in ("v2", "rocm"):
         if current_platform.is_rocm() and version == "rocm":
             PARTITION_SIZE = PARTITION_SIZE_ROCM
 
-        num_partitions = ((max_seq_len + PARTITION_SIZE - 1) // PARTITION_SIZE)
+        num_partitions = (max_seq_len + PARTITION_SIZE - 1) // PARTITION_SIZE
         assert PARTITION_SIZE % block_size == 0
         num_seqs, num_heads, head_size = output.shape
         tmp_output = torch.empty(
@@ -258,13 +285,34 @@ def test_paged_attention(
                 v_scale,
             )
 
-            opcheck(torch.ops._C.paged_attention_v2,
-                    (output, exp_sums, max_logits, tmp_output, query,
-                     key_cache, value_cache, num_kv_heads, scale, block_tables,
-                     seq_lens, block_size, max_seq_len, alibi_slopes,
-                     kv_cache_dtype, k_scale, v_scale, 0, 0, 0, 64, 0),
-                    cond=(head_size == HEAD_SIZES[0]
-                          and block_size == BLOCK_SIZES[0]))
+            opcheck(
+                torch.ops._C.paged_attention_v2,
+                (
+                    output,
+                    exp_sums,
+                    max_logits,
+                    tmp_output,
+                    query,
+                    key_cache,
+                    value_cache,
+                    num_kv_heads,
+                    scale,
+                    block_tables,
+                    seq_lens,
+                    block_size,
+                    max_seq_len,
+                    alibi_slopes,
+                    kv_cache_dtype,
+                    k_scale,
+                    v_scale,
+                    0,
+                    0,
+                    0,
+                    64,
+                    0,
+                ),
+                cond=(head_size == HEAD_SIZES[0] and block_size == BLOCK_SIZES[0]),
+            )
 
         else:
             ops.paged_attention_rocm(
@@ -288,13 +336,30 @@ def test_paged_attention(
                 v_scale,
             )
 
-            opcheck(torch.ops._rocm_C.paged_attention,
-                    (output, exp_sums, max_logits, tmp_output, query,
-                     key_cache, value_cache, num_kv_heads, scale, block_tables,
-                     seq_lens, None, block_size, max_seq_len, alibi_slopes,
-                     kv_cache_dtype, k_scale, v_scale),
-                    cond=(head_size == HEAD_SIZES[0]
-                          and block_size == BLOCK_SIZES[0]))
+            opcheck(
+                torch.ops._rocm_C.paged_attention,
+                (
+                    output,
+                    exp_sums,
+                    max_logits,
+                    tmp_output,
+                    query,
+                    key_cache,
+                    value_cache,
+                    num_kv_heads,
+                    scale,
+                    block_tables,
+                    seq_lens,
+                    None,
+                    block_size,
+                    max_seq_len,
+                    alibi_slopes,
+                    kv_cache_dtype,
+                    k_scale,
+                    v_scale,
+                ),
+                cond=(head_size == HEAD_SIZES[0] and block_size == BLOCK_SIZES[0]),
+            )
 
     else:
         raise AssertionError(f"Unknown version: {version}")
@@ -303,18 +368,17 @@ def test_paged_attention(
     if kv_cache_dtype == "fp8":
         # Convert cache data back to dtype.
         x = 16 // torch.tensor([], dtype=dtype).element_size()
-        key_cache_shape = (NUM_BLOCKS, num_kv_heads, head_size // x,
-                           block_size, x)
-        dequantized_key_cache = torch.empty(size=key_cache_shape,
-                                            dtype=dtype,
-                                            device=device)
+        key_cache_shape = (NUM_BLOCKS, num_kv_heads, head_size // x, block_size, x)
+        dequantized_key_cache = torch.empty(
+            size=key_cache_shape, dtype=dtype, device=device
+        )
         ops.convert_fp8(dequantized_key_cache, key_cache)
         key_cache = dequantized_key_cache
 
         value_cache_shape = value_cache.shape
-        dequantized_value_cache = torch.empty(size=value_cache_shape,
-                                              dtype=dtype,
-                                              device=device)
+        dequantized_value_cache = torch.empty(
+            size=value_cache_shape, dtype=dtype, device=device
+        )
         ops.convert_fp8(dequantized_value_cache, value_cache)
         value_cache = dequantized_value_cache
 
@@ -367,8 +431,9 @@ def ref_multi_query_kv_attention(
         if alibi_bias:
             attn_mask = alibi_bias[i]
         else:
-            attn_mask = torch.triu(torch.ones(seq_len, seq_len, dtype=dtype),
-                                   diagonal=1)
+            attn_mask = torch.triu(
+                torch.ones(seq_len, seq_len, dtype=dtype), diagonal=1
+            )
             attn_mask = attn_mask * torch.finfo(dtype).min
             attn_mask = attn_mask.to(dtype=dtype)
 
@@ -390,8 +455,9 @@ def ref_multi_query_kv_attention(
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("seed", SEEDS)
 @pytest.mark.parametrize("device", CUDA_DEVICES)
-@pytest.mark.skipif(current_platform.is_rocm(),
-                    reason="Xformers backend is not supported on ROCm.")
+@pytest.mark.skipif(
+    current_platform.is_rocm(), reason="Xformers backend is not supported on ROCm."
+)
 @torch.inference_mode()
 def test_multi_query_kv_attention(
     num_seqs: int,
@@ -413,13 +479,11 @@ def test_multi_query_kv_attention(
 
     scale = float(1.0 / (head_size**0.5))
     num_query_heads, num_kv_heads = num_heads
-    qkv = torch.empty(num_tokens,
-                      num_query_heads + 2 * num_kv_heads,
-                      head_size,
-                      dtype=dtype)
+    qkv = torch.empty(
+        num_tokens, num_query_heads + 2 * num_kv_heads, head_size, dtype=dtype
+    )
     qkv.uniform_(-scale, scale)
-    query, key, value = qkv.split(
-        [num_query_heads, num_kv_heads, num_kv_heads], dim=1)
+    query, key, value = qkv.split([num_query_heads, num_kv_heads, num_kv_heads], dim=1)
 
     num_queries_per_kv = num_query_heads // num_kv_heads
     if num_queries_per_kv > 1:
@@ -429,8 +493,7 @@ def test_multi_query_kv_attention(
     alibi_bias = None
     if use_alibi:
         alibi_slopes = torch.randn(num_query_heads, dtype=torch.float)
-        attn_bias = make_alibi_bias(alibi_slopes, num_kv_heads, dtype,
-                                    seq_lens)
+        attn_bias = make_alibi_bias(alibi_slopes, num_kv_heads, dtype, seq_lens)
         output = torch.empty_like(query)
         start = 0
         # Dynamic sequence length not supported with custom attn_bias.
@@ -442,7 +505,8 @@ def test_multi_query_kv_attention(
                 value[None, start:end],
                 attn_bias=attn_bias[i],
                 p=0.0,
-                scale=scale)
+                scale=scale,
+            )
             output[start:end].copy_(out.view_as(query[start:end]))
             start += seq_len
         # xformers.AttentionBias to Tensor for use in reference impl.
@@ -485,8 +549,9 @@ def test_multi_query_kv_attention(
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("seed", SEEDS)
 @pytest.mark.parametrize("device", CUDA_DEVICES)
-@pytest.mark.skipif(current_platform.is_rocm(),
-                    reason="Xformers backend is not supported on ROCm.")
+@pytest.mark.skipif(
+    current_platform.is_rocm(), reason="Xformers backend is not supported on ROCm."
+)
 @torch.inference_mode()
 def test_multi_query_kv_attention_with_alibi(
     num_seqs: int,
diff --git a/tests/kernels/attention/test_attention_selector.py b/tests/kernels/attention/test_attention_selector.py
index 0ff2517f7ba2..6037424bde16 100644
--- a/tests/kernels/attention/test_attention_selector.py
+++ b/tests/kernels/attention/test_attention_selector.py
@@ -15,16 +15,18 @@
 
 @pytest.fixture(autouse=True)
 def clear_cache():
-    """Clear lru cache to ensure each test case runs without caching.
-    """
+    """Clear lru cache to ensure each test case runs without caching."""
     _cached_get_attn_backend.cache_clear()
 
 
 # Define MLA and non-MLA backends separately
 DEVICE_MLA_BACKENDS = {
     "cuda": [
-        "TRITON_MLA", "FLASHMLA", "FLASHINFER_MLA", "FLASH_ATTN_MLA",
-        "CUTLASS_MLA"
+        "TRITON_MLA",
+        "FLASHMLA",
+        "FLASHINFER_MLA",
+        "FLASH_ATTN_MLA",
+        "CUTLASS_MLA",
     ],
     "hip": ["TRITON_MLA", "ROCM_AITER_MLA"],
     "cpu": [],
@@ -40,7 +42,7 @@ def clear_cache():
     "cuda": [16, 64],  # CUDA supports both standard and extended block sizes
     "hip": [16, 1],  # HIP requires special handling for block_size=1
     # "cpu": [16]  # CPU uses fixed block size from test cases
-    "cpu": []  # FIXME(woosuk): Temporarily disable CPU tests
+    "cpu": [],  # FIXME(woosuk): Temporarily disable CPU tests
 }
 
 
@@ -48,12 +50,13 @@ def generate_params():
     params = []
     for use_mla in [True, False]:
         for device in ["cuda", "hip", "cpu"]:
-            backends = DEVICE_MLA_BACKENDS[
-                device] if use_mla else DEVICE_REGULAR_ATTN_BACKENDS[device]
+            backends = (
+                DEVICE_MLA_BACKENDS[device]
+                if use_mla
+                else DEVICE_REGULAR_ATTN_BACKENDS[device]
+            )
             for name in backends:
-                block_sizes = DEVICE_MLA_BLOCK_SIZES[device] if use_mla else [
-                    16
-                ]
+                block_sizes = DEVICE_MLA_BLOCK_SIZES[device] if use_mla else [16]
                 for block_size in block_sizes:
                     params.append(
                         pytest.param(
@@ -61,14 +64,13 @@ def generate_params():
                             name,
                             use_mla,
                             block_size,
-                            id=
-                            f"{device}_{name}_mla_{str(use_mla)[0]}_blks{block_size}"
-                        ))
+                            id=f"{device}_{name}_mla_{str(use_mla)[0]}_blks{block_size}",
+                        )
+                    )
     return params
 
 
-@pytest.mark.parametrize("device, name, use_mla, block_size",
-                         generate_params())
+@pytest.mark.parametrize("device, name, use_mla, block_size", generate_params())
 def test_env(
     device: str,
     name: str,
@@ -83,14 +85,12 @@ def test_env(
         m.setenv("VLLM_MLA_DISABLE", "1" if use_mla else "0")
 
         if device == "cpu":
-            with patch("vllm.attention.selector.current_platform",
-                       CpuPlatform()):
+            with patch("vllm.attention.selector.current_platform", CpuPlatform()):
                 backend = get_attn_backend(16, torch.float16, None, block_size)
             assert backend.get_name() == "TORCH_SDPA"
 
         elif device == "hip":
-            with patch("vllm.attention.selector.current_platform",
-                       RocmPlatform()):
+            with patch("vllm.attention.selector.current_platform", RocmPlatform()):
                 if use_mla:
                     # ROCm MLA backend logic:
                     # - TRITON_MLA: supported when block_size != 1
@@ -101,44 +101,33 @@ def test_env(
                     if name == "TRITON_MLA" and block_size == 1:
                         # TRITON_MLA doesn't support block_size == 1
                         with pytest.raises(ValueError) as exc_info:
-                            get_attn_backend(16,
-                                             torch.float16,
-                                             None,
-                                             block_size,
-                                             use_mla=use_mla)
-                        assert f"The selected backend, {name}" in str(
-                            exc_info.value)
+                            get_attn_backend(
+                                16, torch.float16, None, block_size, use_mla=use_mla
+                            )
+                        assert f"The selected backend, {name}" in str(exc_info.value)
                     elif name == "ROCM_AITER_MLA" and block_size != 1:
                         # ROCM_AITER_MLA only supports block_size == 1
                         with pytest.raises(ValueError) as exc_info:
-                            get_attn_backend(16,
-                                             torch.float16,
-                                             None,
-                                             block_size,
-                                             use_mla=use_mla)
-                        assert f"The selected backend, {name}" in str(
-                            exc_info.value)
+                            get_attn_backend(
+                                16, torch.float16, None, block_size, use_mla=use_mla
+                            )
+                        assert f"The selected backend, {name}" in str(exc_info.value)
                     else:
                         # Valid backend-block_size combination
-                        backend = get_attn_backend(16,
-                                                   torch.float16,
-                                                   None,
-                                                   block_size,
-                                                   use_mla=use_mla)
+                        backend = get_attn_backend(
+                            16, torch.float16, None, block_size, use_mla=use_mla
+                        )
                         expected = name
                         assert backend.get_name() == expected
                 else:
-                    backend = get_attn_backend(16,
-                                               torch.float16,
-                                               None,
-                                               block_size,
-                                               use_mla=use_mla)
+                    backend = get_attn_backend(
+                        16, torch.float16, None, block_size, use_mla=use_mla
+                    )
                     expected = "TRITON_ATTN"
                     assert backend.get_name() == expected
 
         elif device == "cuda":
-            with patch("vllm.attention.selector.current_platform",
-                       CudaPlatform()):
+            with patch("vllm.attention.selector.current_platform", CudaPlatform()):
                 if use_mla:
                     # CUDA MLA backend logic:
                     # - CUTLASS_MLA: only supported with block_size == 128
@@ -152,28 +141,23 @@ def test_env(
                     if name == "CUTLASS_MLA":
                         if block_size != 128:
                             # CUTLASS_MLA only supports block_size == 128
-                            pytest.skip(
-                                "CUTLASS_MLA only supports block_size 128")
+                            pytest.skip("CUTLASS_MLA only supports block_size 128")
                         else:
-                            backend = get_attn_backend(16,
-                                                       torch.float16,
-                                                       None,
-                                                       block_size,
-                                                       use_mla=use_mla)
+                            backend = get_attn_backend(
+                                16, torch.float16, None, block_size, use_mla=use_mla
+                            )
                             expected = "CUTLASS_MLA"
                             assert backend.get_name() == expected
                     elif name == "FLASHINFER_MLA":
                         if block_size not in [32, 64]:
                             # FlashInfer MLA only supports block_size 32 or 64
                             pytest.skip(
-                                "FlashInfer MLA only supports block_size 32 "
-                                "or 64")
+                                "FlashInfer MLA only supports block_size 32 or 64"
+                            )
                         else:
-                            backend = get_attn_backend(16,
-                                                       torch.float16,
-                                                       None,
-                                                       block_size,
-                                                       use_mla=use_mla)
+                            backend = get_attn_backend(
+                                16, torch.float16, None, block_size, use_mla=use_mla
+                            )
                             expected = "FLASHINFER_MLA"
                             assert backend.get_name() == expected
                     elif name == "FLASHMLA":
@@ -182,58 +166,47 @@ def test_env(
                             pytest.skip("FlashMLA only supports block_size 64")
                         else:
                             from vllm.v1.attention.backends.mla.flashmla import (  # noqa: E501
-                                is_flashmla_supported)
+                                is_flashmla_supported,
+                            )
+
                             is_supported, _ = is_flashmla_supported()
                             if not is_supported:
-                                pytest.skip(
-                                    "FlashMLA not supported on this platform")
+                                pytest.skip("FlashMLA not supported on this platform")
                             else:
-                                backend = get_attn_backend(16,
-                                                           torch.float16,
-                                                           None,
-                                                           block_size,
-                                                           use_mla=use_mla)
+                                backend = get_attn_backend(
+                                    16, torch.float16, None, block_size, use_mla=use_mla
+                                )
                                 expected = name
                                 assert backend.get_name() == expected
                     elif name == "FLASH_ATTN_MLA":
-                        backend = get_attn_backend(16,
-                                                   torch.float16,
-                                                   None,
-                                                   block_size,
-                                                   use_mla=use_mla)
+                        backend = get_attn_backend(
+                            16, torch.float16, None, block_size, use_mla=use_mla
+                        )
                         expected = "FLASH_ATTN_MLA"
                         assert backend.get_name() == expected
                     else:
                         # TRITON_MLA or other fallback
-                        backend = get_attn_backend(16,
-                                                   torch.float16,
-                                                   None,
-                                                   block_size,
-                                                   use_mla=use_mla)
+                        backend = get_attn_backend(
+                            16, torch.float16, None, block_size, use_mla=use_mla
+                        )
                         expected = "TRITON_MLA"
                         assert backend.get_name() == expected
                 elif name == "FLASHINFER":
-                    backend = get_attn_backend(16,
-                                               torch.float16,
-                                               None,
-                                               block_size,
-                                               use_mla=use_mla)
+                    backend = get_attn_backend(
+                        16, torch.float16, None, block_size, use_mla=use_mla
+                    )
                     expected = "FLASHINFER"
                     assert backend.get_name() == expected
                 elif name == "XFORMERS":
-                    backend = get_attn_backend(32,
-                                               torch.float16,
-                                               None,
-                                               block_size,
-                                               use_mla=use_mla)
+                    backend = get_attn_backend(
+                        32, torch.float16, None, block_size, use_mla=use_mla
+                    )
                     expected = "XFORMERS"
                     assert backend.get_name() == expected
                 elif name == "FLASH_ATTN":
-                    backend = get_attn_backend(32,
-                                               torch.float16,
-                                               None,
-                                               block_size,
-                                               use_mla=use_mla)
+                    backend = get_attn_backend(
+                        32, torch.float16, None, block_size, use_mla=use_mla
+                    )
                     expected = "FLASH_ATTN"
                     assert backend.get_name() == expected
 
@@ -248,14 +221,12 @@ def test_fp32_fallback(
         m.setenv("VLLM_USE_V1", "1")
 
         if device == "cpu":
-            with patch("vllm.attention.selector.current_platform",
-                       CpuPlatform()):
+            with patch("vllm.attention.selector.current_platform", CpuPlatform()):
                 backend = get_attn_backend(16, torch.float32, None, 16)
             assert backend.get_name() == "TORCH_SDPA"
 
         elif device == "cuda":
-            with patch("vllm.attention.selector.current_platform",
-                       CudaPlatform()):
+            with patch("vllm.attention.selector.current_platform", CudaPlatform()):
                 backend = get_attn_backend(16, torch.float32, None, 16)
             assert backend.get_name() == "FLEX_ATTENTION"
 
@@ -265,16 +236,16 @@ def test_flash_attn(monkeypatch: pytest.MonkeyPatch):
     # TODO: When testing for v1, pipe in `use_v1` as an argument to
     # get_attn_backend
 
-    pytest.skip("Skipping as current backend selector does not " \
-                "handle fallbacks when a backend is set via env var.")
+    pytest.skip(
+        "Skipping as current backend selector does not "
+        "handle fallbacks when a backend is set via env var."
+    )
 
     with monkeypatch.context() as m:
         m.setenv(STR_BACKEND_ENV_VAR, STR_FLASH_ATTN_VAL)
 
         # Unsupported CUDA arch
-        monkeypatch.setattr(torch.cuda,
-                            "get_device_capability",
-                            lambda _=None: (7, 5))
+        monkeypatch.setattr(torch.cuda, "get_device_capability", lambda _=None: (7, 5))
         backend = get_attn_backend(16, torch.float16, None, 16)
         assert backend.get_name() != STR_FLASH_ATTN_VAL
 
@@ -295,17 +266,17 @@ def test_flash_attn(monkeypatch: pytest.MonkeyPatch):
 
         # flash-attn is not installed
         import sys
-        original_module = sys.modules.get('vllm_flash_attn')
-        monkeypatch.setitem(sys.modules, 'vllm_flash_attn', None)
+
+        original_module = sys.modules.get("vllm_flash_attn")
+        monkeypatch.setitem(sys.modules, "vllm_flash_attn", None)
         backend = get_attn_backend(16, torch.float16, None, 16)
         assert backend.get_name() != STR_FLASH_ATTN_VAL
 
         # Restore the original module if it existed
         if original_module is not None:
-            monkeypatch.setitem(sys.modules, 'vllm_flash_attn',
-                                original_module)
+            monkeypatch.setitem(sys.modules, "vllm_flash_attn", original_module)
         else:
-            monkeypatch.delitem(sys.modules, 'vllm_flash_attn', raising=False)
+            monkeypatch.delitem(sys.modules, "vllm_flash_attn", raising=False)
 
         # Unsupported head size
         backend = get_attn_backend(17, torch.float16, None, 16)
@@ -314,8 +285,10 @@ def test_flash_attn(monkeypatch: pytest.MonkeyPatch):
 
 def test_invalid_env(monkeypatch: pytest.MonkeyPatch):
     """Test that invalid attention backend names raise ValueError."""
-    with monkeypatch.context() as m, patch(
-            "vllm.attention.selector.current_platform", CudaPlatform()):
+    with (
+        monkeypatch.context() as m,
+        patch("vllm.attention.selector.current_platform", CudaPlatform()),
+    ):
         m.setenv("VLLM_USE_V1", "1")
         m.setenv(STR_BACKEND_ENV_VAR, STR_INVALID_VAL)
 
diff --git a/tests/kernels/attention/test_cache.py b/tests/kernels/attention/test_cache.py
index 6e096a4c3999..f33a27d1fd85 100644
--- a/tests/kernels/attention/test_cache.py
+++ b/tests/kernels/attention/test_cache.py
@@ -10,7 +10,7 @@
 from vllm import _custom_ops as ops
 from vllm.platforms import current_platform
 
-COPYING_DIRECTION = [('cuda', 'cpu'), ('cuda', 'cuda'), ('cpu', 'cuda')]
+COPYING_DIRECTION = [("cuda", "cpu"), ("cuda", "cuda"), ("cpu", "cuda")]
 DTYPES = [torch.bfloat16, torch.float]
 NUM_TOKENS = [42]  # Arbitrary values for testing
 NUM_LAYERS = [1]  # Arbitrary values for testing
@@ -32,9 +32,7 @@
 
 NUM_MAPPINGS = [256]  # Arbitrary values for testing
 SEEDS = [0]
-CUDA_DEVICES = [
-    f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)
-]
+CUDA_DEVICES = [f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)]
 
 # We assume fp8 is always enabled for testing.
 KV_CACHE_DTYPE = ["auto", "fp8"]
@@ -85,24 +83,33 @@ def test_copy_blocks(
         block_mapping.append((src, dst2))
 
     # Create the KV caches.
-    key_caches, value_caches = kv_cache_factory(num_blocks, block_size,
-                                                num_layers, num_heads,
-                                                head_size, kv_cache_dtype,
-                                                dtype, seed, device)
+    key_caches, value_caches = kv_cache_factory(
+        num_blocks,
+        block_size,
+        num_layers,
+        num_heads,
+        head_size,
+        kv_cache_dtype,
+        dtype,
+        seed,
+        device,
+    )
 
     # Clone the KV caches.
     cloned_key_caches = [key_cache.clone() for key_cache in key_caches]
     cloned_value_caches = [value_cache.clone() for value_cache in value_caches]
 
     # Call the copy blocks kernel.
-    block_mapping_tensor = torch.tensor(block_mapping,
-                                        dtype=torch.int64,
-                                        device=device).view(-1, 2)
-
-    opcheck(torch.ops._C_cache_ops.copy_blocks,
-            (key_caches, value_caches, block_mapping_tensor),
-            test_utils=DEFAULT_OPCHECK_TEST_UTILS,
-            cond=(head_size == HEAD_SIZES[0]))
+    block_mapping_tensor = torch.tensor(
+        block_mapping, dtype=torch.int64, device=device
+    ).view(-1, 2)
+
+    opcheck(
+        torch.ops._C_cache_ops.copy_blocks,
+        (key_caches, value_caches, block_mapping_tensor),
+        test_utils=DEFAULT_OPCHECK_TEST_UTILS,
+        cond=(head_size == HEAD_SIZES[0]),
+    )
     ops.copy_blocks(key_caches, value_caches, block_mapping_tensor)
 
     # Run the reference implementation.
@@ -115,8 +122,7 @@ def test_copy_blocks(
     # Compare the results.
     for key_cache, cloned_key_cache in zip(key_caches, cloned_key_caches):
         torch.testing.assert_close(key_cache, cloned_key_cache)
-    for value_cache, cloned_value_cache in zip(value_caches,
-                                               cloned_value_caches):
+    for value_cache, cloned_value_cache in zip(value_caches, cloned_value_caches):
         torch.testing.assert_close(value_cache, cloned_value_cache)
 
 
@@ -155,10 +161,17 @@ def test_reshape_and_cache(
     _, key, value = qkv.unbind(dim=1)
 
     # Create the KV caches.
-    key_caches, value_caches = kv_cache_factory(num_blocks, block_size, 1,
-                                                num_heads, head_size,
-                                                kv_cache_dtype, dtype, seed,
-                                                device)
+    key_caches, value_caches = kv_cache_factory(
+        num_blocks,
+        block_size,
+        1,
+        num_heads,
+        head_size,
+        kv_cache_dtype,
+        dtype,
+        seed,
+        device,
+    )
     key_cache, value_cache = key_caches[0], value_caches[0]
 
     # Using default kv_scale
@@ -176,12 +189,30 @@ def test_reshape_and_cache(
         cloned_value_cache = value_cache.clone()
 
     # Call the reshape_and_cache kernel.
-    opcheck(torch.ops._C_cache_ops.reshape_and_cache,
-            (key, value, key_cache, value_cache, slot_mapping, kv_cache_dtype,
-             k_scale, v_scale),
-            cond=(head_size == HEAD_SIZES[0]))
-    ops.reshape_and_cache(key, value, key_cache, value_cache, slot_mapping,
-                          kv_cache_dtype, k_scale, v_scale)
+    opcheck(
+        torch.ops._C_cache_ops.reshape_and_cache,
+        (
+            key,
+            value,
+            key_cache,
+            value_cache,
+            slot_mapping,
+            kv_cache_dtype,
+            k_scale,
+            v_scale,
+        ),
+        cond=(head_size == HEAD_SIZES[0]),
+    )
+    ops.reshape_and_cache(
+        key,
+        value,
+        key_cache,
+        value_cache,
+        slot_mapping,
+        kv_cache_dtype,
+        k_scale,
+        v_scale,
+    )
 
     if kv_cache_dtype == "fp8":
         result_key_cache = torch.empty_like(key_cache, dtype=torch.float16)
@@ -202,14 +233,12 @@ def test_reshape_and_cache(
         cloned_value_cache[block_idx, :, :, block_offset] = value[i]
 
     if kv_cache_dtype == "fp8":
-        torch.testing.assert_close(result_key_cache,
-                                   cloned_key_cache,
-                                   atol=0.001,
-                                   rtol=0.1)
-        torch.testing.assert_close(result_value_cache,
-                                   cloned_value_cache,
-                                   atol=0.001,
-                                   rtol=0.1)
+        torch.testing.assert_close(
+            result_key_cache, cloned_key_cache, atol=0.001, rtol=0.1
+        )
+        torch.testing.assert_close(
+            result_value_cache, cloned_value_cache, atol=0.001, rtol=0.1
+        )
     else:
         torch.testing.assert_close(key_cache, cloned_key_cache)
         torch.testing.assert_close(value_cache, cloned_value_cache)
@@ -254,15 +283,8 @@ def test_reshape_and_cache_flash(
     # Create a random slot mapping.
     num_slots = block_size * num_blocks
     slot_mapping_lst = random.sample(range(num_slots), num_tokens)
-    slot_mapping = torch.tensor(slot_mapping_lst,
-                                dtype=torch.long,
-                                device=device)
-    qkv = torch.randn(num_tokens,
-                      3,
-                      num_heads,
-                      head_size,
-                      dtype=dtype,
-                      device=device)
+    slot_mapping = torch.tensor(slot_mapping_lst, dtype=torch.long, device=device)
+    qkv = torch.randn(num_tokens, 3, num_heads, head_size, dtype=dtype, device=device)
     _, key, value = qkv.unbind(dim=1)
 
     # Create the KV caches.
@@ -293,48 +315,73 @@ def permute_and_compact(x):
 
     # Clone the KV caches.
     if kv_cache_dtype == "fp8":
-        cloned_key_cache = torch.empty_like(key_cache_compact,
-                                            dtype=torch.float16)
-        ops.convert_fp8(cloned_key_cache, key_cache_compact, k_scale.item(),
-                        kv_cache_dtype)
-        cloned_value_cache = torch.empty_like(value_cache_compact,
-                                              dtype=torch.float16)
-        ops.convert_fp8(cloned_value_cache, value_cache_compact,
-                        v_scale.item(), kv_cache_dtype)
+        cloned_key_cache = torch.empty_like(key_cache_compact, dtype=torch.float16)
+        ops.convert_fp8(
+            cloned_key_cache, key_cache_compact, k_scale.item(), kv_cache_dtype
+        )
+        cloned_value_cache = torch.empty_like(value_cache_compact, dtype=torch.float16)
+        ops.convert_fp8(
+            cloned_value_cache, value_cache_compact, v_scale.item(), kv_cache_dtype
+        )
     else:
         cloned_key_cache = key_cache_compact.clone()
         cloned_value_cache = value_cache_compact.clone()
     # Call the reshape_and_cache kernel.
     if implementation == "cuda":
-        opcheck(torch.ops._C_cache_ops.reshape_and_cache_flash,
-                (key, value, key_cache, value_cache, slot_mapping,
-                 kv_cache_dtype, k_scale, v_scale),
-                cond=(head_size == HEAD_SIZES[0]))
-        ops.reshape_and_cache_flash(key, value, key_cache, value_cache,
-                                    slot_mapping, kv_cache_dtype, k_scale,
-                                    v_scale)
+        opcheck(
+            torch.ops._C_cache_ops.reshape_and_cache_flash,
+            (
+                key,
+                value,
+                key_cache,
+                value_cache,
+                slot_mapping,
+                kv_cache_dtype,
+                k_scale,
+                v_scale,
+            ),
+            cond=(head_size == HEAD_SIZES[0]),
+        )
+        ops.reshape_and_cache_flash(
+            key,
+            value,
+            key_cache,
+            value_cache,
+            slot_mapping,
+            kv_cache_dtype,
+            k_scale,
+            v_scale,
+        )
     elif implementation == "triton":
         from vllm.attention.ops.triton_reshape_and_cache_flash import (
-            triton_reshape_and_cache_flash)
-        triton_reshape_and_cache_flash(key, value, key_cache, value_cache,
-                                       slot_mapping, kv_cache_dtype, k_scale,
-                                       v_scale)
+            triton_reshape_and_cache_flash,
+        )
+
+        triton_reshape_and_cache_flash(
+            key,
+            value,
+            key_cache,
+            value_cache,
+            slot_mapping,
+            kv_cache_dtype,
+            k_scale,
+            v_scale,
+        )
     key_cache_compact = permute_and_compact(key_cache)
     value_cache_compact = permute_and_compact(value_cache)
 
     if kv_cache_dtype == "fp8":
-        result_key_cache = torch.empty_like(key_cache_compact,
-                                            dtype=torch.float16)
-        ops.convert_fp8(result_key_cache,
-                        key_cache_compact,
-                        k_scale.item(),
-                        kv_dtype=kv_cache_dtype)
-        result_value_cache = torch.empty_like(value_cache_compact,
-                                              dtype=torch.float16)
-        ops.convert_fp8(result_value_cache,
-                        value_cache_compact,
-                        v_scale.item(),
-                        kv_dtype=kv_cache_dtype)
+        result_key_cache = torch.empty_like(key_cache_compact, dtype=torch.float16)
+        ops.convert_fp8(
+            result_key_cache, key_cache_compact, k_scale.item(), kv_dtype=kv_cache_dtype
+        )
+        result_value_cache = torch.empty_like(value_cache_compact, dtype=torch.float16)
+        ops.convert_fp8(
+            result_value_cache,
+            value_cache_compact,
+            v_scale.item(),
+            kv_dtype=kv_cache_dtype,
+        )
 
     # Run the reference implementation.
     block_indices = torch.div(slot_mapping, block_size, rounding_mode="floor")
@@ -352,14 +399,12 @@ def permute_and_compact(x):
             cloned_value_cache[block_idx, :, block_offset, :] = value[i]
 
     if kv_cache_dtype == "fp8":
-        torch.testing.assert_close(result_key_cache,
-                                   cloned_key_cache,
-                                   atol=0.001,
-                                   rtol=0.1)
-        torch.testing.assert_close(result_value_cache,
-                                   cloned_value_cache,
-                                   atol=0.001,
-                                   rtol=0.1)
+        torch.testing.assert_close(
+            result_key_cache, cloned_key_cache, atol=0.001, rtol=0.1
+        )
+        torch.testing.assert_close(
+            result_value_cache, cloned_value_cache, atol=0.001, rtol=0.1
+        )
     else:
         torch.testing.assert_close(key_cache_compact, cloned_key_cache)
         torch.testing.assert_close(value_cache_compact, cloned_value_cache)
@@ -396,8 +441,8 @@ def test_swap_blocks(
 
     current_platform.seed_everything(seed)
 
-    src_device = device if direction[0] == "cuda" else 'cpu'
-    dst_device = device if direction[1] == "cuda" else 'cpu'
+    src_device = device if direction[0] == "cuda" else "cpu"
+    dst_device = device if direction[1] == "cuda" else "cpu"
 
     src_blocks = random.sample(range(num_blocks), num_mappings)
     # For the same device, mapping must not overlap
@@ -408,42 +453,62 @@ def test_swap_blocks(
         dst_blocks = random.sample(range(num_blocks), num_mappings)
 
     block_mapping = list(zip(src_blocks, dst_blocks))
-    block_mapping_tensor = torch.tensor(block_mapping,
-                                        dtype=torch.int64,
-                                        device="cpu").view(-1, 2)
+    block_mapping_tensor = torch.tensor(
+        block_mapping, dtype=torch.int64, device="cpu"
+    ).view(-1, 2)
 
     # Create the KV caches on the first device.
     src_key_caches, src_value_caches = kv_cache_factory(
-        num_blocks, block_size, 1, num_heads, head_size, kv_cache_dtype, dtype,
-        seed, src_device)
+        num_blocks,
+        block_size,
+        1,
+        num_heads,
+        head_size,
+        kv_cache_dtype,
+        dtype,
+        seed,
+        src_device,
+    )
 
     # Create the KV caches on the second device.
     dist_key_caches, dist_value_caches = kv_cache_factory(
-        num_blocks, block_size, 1, num_heads, head_size, kv_cache_dtype, dtype,
-        seed, dst_device)
+        num_blocks,
+        block_size,
+        1,
+        num_heads,
+        head_size,
+        kv_cache_dtype,
+        dtype,
+        seed,
+        dst_device,
+    )
 
     src_key_caches_clone = src_key_caches[0].clone()
     src_value_caches_clone = src_value_caches[0].clone()
 
     # Call the swap_blocks kernel.
-    do_opcheck = (head_size == HEAD_SIZES[0])
-    opcheck(torch.ops._C_cache_ops.swap_blocks,
-            (src_key_caches[0], dist_key_caches[0], block_mapping_tensor),
-            cond=do_opcheck)
-    opcheck(torch.ops._C_cache_ops.swap_blocks,
-            (src_value_caches[0], dist_value_caches[0], block_mapping_tensor),
-            cond=do_opcheck)
-
-    ops.swap_blocks(src_key_caches[0], dist_key_caches[0],
-                    block_mapping_tensor)
-    ops.swap_blocks(src_value_caches[0], dist_value_caches[0],
-                    block_mapping_tensor)
+    do_opcheck = head_size == HEAD_SIZES[0]
+    opcheck(
+        torch.ops._C_cache_ops.swap_blocks,
+        (src_key_caches[0], dist_key_caches[0], block_mapping_tensor),
+        cond=do_opcheck,
+    )
+    opcheck(
+        torch.ops._C_cache_ops.swap_blocks,
+        (src_value_caches[0], dist_value_caches[0], block_mapping_tensor),
+        cond=do_opcheck,
+    )
+
+    ops.swap_blocks(src_key_caches[0], dist_key_caches[0], block_mapping_tensor)
+    ops.swap_blocks(src_value_caches[0], dist_value_caches[0], block_mapping_tensor)
 
     for src, dst in block_mapping:
-        torch.testing.assert_close(src_key_caches_clone[src].cpu(),
-                                   dist_key_caches[0][dst].cpu())
-        torch.testing.assert_close(src_value_caches_clone[src].cpu(),
-                                   dist_value_caches[0][dst].cpu())
+        torch.testing.assert_close(
+            src_key_caches_clone[src].cpu(), dist_key_caches[0][dst].cpu()
+        )
+        torch.testing.assert_close(
+            src_value_caches_clone[src].cpu(), dist_value_caches[0][dst].cpu()
+        )
 
 
 @pytest.mark.parametrize("num_heads", NUM_HEADS)
@@ -489,11 +554,9 @@ def _create_mla_cache(
     device: str,
 ) -> torch.Tensor:
     cache_dtype = torch.uint8 if kv_cache_dtype == "fp8" else dtype
-    return torch.zeros(num_blocks,
-                       block_size,
-                       entry_size,
-                       dtype=cache_dtype,
-                       device=device)
+    return torch.zeros(
+        num_blocks, block_size, entry_size, dtype=cache_dtype, device=device
+    )
 
 
 def _fill_mla_cache(cache: torch.Tensor, kv_cache_dtype: str):
@@ -533,20 +596,16 @@ def test_concat_and_cache_mla(
 
     total_slots = num_blocks * block_size
     slot_mapping_lst = random.sample(range(total_slots), num_tokens)
-    slot_mapping = torch.tensor(slot_mapping_lst,
-                                dtype=torch.long,
-                                device=device)
+    slot_mapping = torch.tensor(slot_mapping_lst, dtype=torch.long, device=device)
 
     kv_c = torch.randn(num_tokens, kv_lora_rank, dtype=dtype, device=device)
-    k_pe = torch.randn(num_tokens,
-                       qk_rope_head_dim,
-                       dtype=dtype,
-                       device=device)
+    k_pe = torch.randn(num_tokens, qk_rope_head_dim, dtype=dtype, device=device)
     entry_size = kv_lora_rank + qk_rope_head_dim
 
     scale = torch.tensor(0.1, dtype=torch.float32, device=device)
-    kv_cache = _create_mla_cache(num_blocks, block_size, entry_size, dtype,
-                                 kv_cache_dtype, device)
+    kv_cache = _create_mla_cache(
+        num_blocks, block_size, entry_size, dtype, kv_cache_dtype, device
+    )
     ref_temp = torch.zeros(*kv_cache.shape, dtype=dtype, device=device)
 
     for i in range(num_tokens):
@@ -558,10 +617,7 @@ def test_concat_and_cache_mla(
 
     if kv_cache_dtype == "fp8":
         ref_kv_cache = torch.empty_like(ref_temp, dtype=kv_cache.dtype)
-        ops.convert_fp8(ref_kv_cache,
-                        ref_temp,
-                        scale.item(),
-                        kv_dtype=kv_cache_dtype)
+        ops.convert_fp8(ref_kv_cache, ref_temp, scale.item(), kv_dtype=kv_cache_dtype)
     else:
         ref_kv_cache = ref_temp
 
@@ -571,24 +627,18 @@ def test_concat_and_cache_mla(
         test_utils=DEFAULT_OPCHECK_TEST_UTILS,
     )
 
-    ops.concat_and_cache_mla(kv_c, k_pe, kv_cache, slot_mapping,
-                             kv_cache_dtype, scale)
+    ops.concat_and_cache_mla(kv_c, k_pe, kv_cache, slot_mapping, kv_cache_dtype, scale)
 
     if kv_cache_dtype == "fp8":
         result_temp = torch.empty_like(kv_cache, dtype=torch.float16)
-        ops.convert_fp8(result_temp,
-                        kv_cache.contiguous(),
-                        scale.item(),
-                        kv_dtype=kv_cache_dtype)
+        ops.convert_fp8(
+            result_temp, kv_cache.contiguous(), scale.item(), kv_dtype=kv_cache_dtype
+        )
         expected_temp = torch.empty_like(ref_kv_cache, dtype=torch.float16)
-        ops.convert_fp8(expected_temp,
-                        ref_kv_cache,
-                        scale.item(),
-                        kv_dtype=kv_cache_dtype)
-        torch.testing.assert_close(result_temp,
-                                   expected_temp,
-                                   atol=0.001,
-                                   rtol=0.1)
+        ops.convert_fp8(
+            expected_temp, ref_kv_cache, scale.item(), kv_dtype=kv_cache_dtype
+        )
+        torch.testing.assert_close(result_temp, expected_temp, atol=0.001, rtol=0.1)
     else:
         torch.testing.assert_close(kv_cache, ref_kv_cache)
 
@@ -620,24 +670,21 @@ def test_concat_and_cache_ds_mla(
 
     total_slots = num_blocks * block_size
     slot_mapping_lst = random.sample(range(total_slots), num_tokens)
-    slot_mapping = torch.tensor(slot_mapping_lst,
-                                dtype=torch.long,
-                                device=device)
+    slot_mapping = torch.tensor(slot_mapping_lst, dtype=torch.long, device=device)
 
     kv_c = torch.randn(num_tokens, kv_lora_rank, dtype=dtype, device=device)
-    k_pe = torch.randn(num_tokens,
-                       qk_rope_head_dim,
-                       dtype=dtype,
-                       device=device)
+    k_pe = torch.randn(num_tokens, qk_rope_head_dim, dtype=dtype, device=device)
     entry_size = kv_lora_rank + (4 * 4) + (2 * qk_rope_head_dim)
 
     scale = torch.tensor(1.0, dtype=torch.float32, device=device)
-    kv_cache = _create_mla_cache(num_blocks,
-                                 block_size,
-                                 entry_size,
-                                 dtype=torch.uint8,
-                                 kv_cache_dtype=kv_cache_dtype,
-                                 device=device)
+    kv_cache = _create_mla_cache(
+        num_blocks,
+        block_size,
+        entry_size,
+        dtype=torch.uint8,
+        kv_cache_dtype=kv_cache_dtype,
+        device=device,
+    )
 
     ref_cache = torch.zeros_like(kv_cache, dtype=kv_cache.dtype)
     tile_data = torch.zeros(128, dtype=dtype, device=device)
@@ -664,14 +711,16 @@ def test_concat_and_cache_ds_mla(
             manual_max = abs(tile_data_float[0])
             for j in range(1, 128):
                 manual_max = max(manual_max, abs(tile_data_float[j]))
-            tile_scale = manual_max / 448.
+            tile_scale = manual_max / 448.0
 
             ref_cache_32bit[kv_lora_rank // 4 + tile_idx] = tile_scale
 
-            ops.convert_fp8(ref_cache_slice[tile_start:tile_end],
-                            tile_data,
-                            tile_scale.item(),
-                            kv_dtype="fp8")
+            ops.convert_fp8(
+                ref_cache_slice[tile_start:tile_end],
+                tile_data,
+                tile_scale.item(),
+                kv_dtype="fp8",
+            )
 
         for j in range(qk_rope_head_dim):
             ref_cache_16bit[kv_lora_rank // 2 + 8 + j] = k_pe[i, j]
@@ -682,8 +731,7 @@ def test_concat_and_cache_ds_mla(
         test_utils=DEFAULT_OPCHECK_TEST_UTILS,
     )
 
-    ops.concat_and_cache_mla(kv_c, k_pe, kv_cache, slot_mapping,
-                             kv_cache_dtype, scale)
+    ops.concat_and_cache_mla(kv_c, k_pe, kv_cache, slot_mapping, kv_cache_dtype, scale)
 
     for i in range(num_tokens):
         slot = slot_mapping[i].item()
@@ -694,12 +742,14 @@ def test_concat_and_cache_ds_mla(
 
         kv_nope = kv_cache_slice[:kv_lora_rank]
         ref_nope = ref_cache_slice[:kv_lora_rank]
-        kv_scales = kv_cache_slice.view(torch.float32)[kv_lora_rank //
-                                                       4:kv_lora_rank // 4 + 4]
-        ref_scales = ref_cache_slice.view(
-            torch.float32)[kv_lora_rank // 4:kv_lora_rank // 4 + 4]
-        kv_rope = kv_cache_slice.view(dtype)[kv_lora_rank // 2 + 8:]
-        ref_rope = ref_cache_slice.view(dtype)[kv_lora_rank // 2 + 8:]
+        kv_scales = kv_cache_slice.view(torch.float32)[
+            kv_lora_rank // 4 : kv_lora_rank // 4 + 4
+        ]
+        ref_scales = ref_cache_slice.view(torch.float32)[
+            kv_lora_rank // 4 : kv_lora_rank // 4 + 4
+        ]
+        kv_rope = kv_cache_slice.view(dtype)[kv_lora_rank // 2 + 8 :]
+        ref_rope = ref_cache_slice.view(dtype)[kv_lora_rank // 2 + 8 :]
 
         torch.testing.assert_close(kv_nope, ref_nope, atol=0.001, rtol=0.1)
         torch.testing.assert_close(kv_scales, ref_scales, atol=0.001, rtol=0.1)
@@ -734,8 +784,9 @@ def test_copy_blocks_mla(
 
     kv_caches = []
     for _ in range(num_layers):
-        kv_cache = _create_mla_cache(num_blocks, block_size, entry_size, dtype,
-                                     kv_cache_dtype, device)
+        kv_cache = _create_mla_cache(
+            num_blocks, block_size, entry_size, dtype, kv_cache_dtype, device
+        )
         _fill_mla_cache(kv_cache, kv_cache_dtype=kv_cache_dtype)
         kv_caches.append(kv_cache)
 
@@ -752,9 +803,9 @@ def test_copy_blocks_mla(
         dst2 = dst_blocks[2 * i + 1]
         block_mapping.append((src, dst1))
         block_mapping.append((src, dst2))
-    block_mapping_tensor = torch.tensor(block_mapping,
-                                        dtype=torch.int64,
-                                        device=device).view(-1, 2)
+    block_mapping_tensor = torch.tensor(
+        block_mapping, dtype=torch.int64, device=device
+    ).view(-1, 2)
 
     for src, dst in block_mapping:
         for ref_cache in ref_caches:
@@ -795,10 +846,12 @@ def test_swap_blocks_mla(
 
     entry_size = kv_lora_rank + qk_rope_head_dim
 
-    src_cache = _create_mla_cache(num_blocks, block_size, entry_size, dtype,
-                                  kv_cache_dtype, device)
-    dst_cache = _create_mla_cache(num_blocks, block_size, entry_size, dtype,
-                                  kv_cache_dtype, device)
+    src_cache = _create_mla_cache(
+        num_blocks, block_size, entry_size, dtype, kv_cache_dtype, device
+    )
+    dst_cache = _create_mla_cache(
+        num_blocks, block_size, entry_size, dtype, kv_cache_dtype, device
+    )
 
     _fill_mla_cache(src_cache, kv_cache_dtype)
     _fill_mla_cache(dst_cache, kv_cache_dtype)
@@ -810,9 +863,9 @@ def test_swap_blocks_mla(
     remaining_blocks = list(set(range(num_blocks)) - set(src_blocks))
     dst_blocks = random.sample(remaining_blocks, num_mappings)
     block_mapping = list(zip(src_blocks, dst_blocks))
-    block_mapping_tensor = torch.tensor(block_mapping,
-                                        dtype=torch.int64,
-                                        device="cpu").view(-1, 2)
+    block_mapping_tensor = torch.tensor(
+        block_mapping, dtype=torch.int64, device="cpu"
+    ).view(-1, 2)
 
     opcheck(
         torch.ops._C_cache_ops.swap_blocks,
@@ -827,7 +880,8 @@ def test_swap_blocks_mla(
             src_cache_clone[src].cpu(),
             dst_cache[dst].cpu(),
             msg=f"Block {src} from src should have been swapped to block "
-            f"{dst} in dst_cache.")
+            f"{dst} in dst_cache.",
+        )
 
 
 @pytest.mark.parametrize("kv_lora_rank", [512])
@@ -840,32 +894,36 @@ def test_swap_blocks_mla(
 @pytest.mark.parametrize("kv_cache_dtype", ["auto", "fp8"])
 @pytest.mark.parametrize("device", CUDA_DEVICES)
 @torch.inference_mode()
-def test_gather_and_maybe_dequant_cache_mla(kv_lora_rank, qk_rope_head_dim,
-                                            block_size, num_blocks,
-                                            max_seq_len, batch_size, dtype,
-                                            kv_cache_dtype, device):
+def test_gather_and_maybe_dequant_cache_mla(
+    kv_lora_rank,
+    qk_rope_head_dim,
+    block_size,
+    num_blocks,
+    max_seq_len,
+    batch_size,
+    dtype,
+    kv_cache_dtype,
+    device,
+):
     entry_size = kv_lora_rank + qk_rope_head_dim
     scale = torch.tensor(0.1, dtype=torch.float32, device=device)
-    src_cache = _create_mla_cache(num_blocks, block_size, entry_size, dtype,
-                                  kv_cache_dtype, device)
+    src_cache = _create_mla_cache(
+        num_blocks, block_size, entry_size, dtype, kv_cache_dtype, device
+    )
     _fill_mla_cache(src_cache, kv_cache_dtype=kv_cache_dtype)
 
-    seq_len_tensor = torch.randint(0,
-                                   max_seq_len + 1, (batch_size, ),
-                                   device=device)
+    seq_len_tensor = torch.randint(0, max_seq_len + 1, (batch_size,), device=device)
 
     total_tokens = seq_len_tensor.sum()
-    cu_seq_lens = torch.empty((batch_size + 1),
-                              dtype=torch.int32,
-                              device=device)
+    cu_seq_lens = torch.empty((batch_size + 1), dtype=torch.int32, device=device)
     cu_seq_lens[0] = 0
     cu_seq_lens[1:] = seq_len_tensor.cumsum(dim=0).to(dtype=torch.int32)
     print("seq_len_tensor", seq_len_tensor)
 
     tot_blocks_tensor = (seq_len_tensor + block_size - 1) // block_size
-    block_table = torch.empty((batch_size, num_blocks),
-                              dtype=torch.int32,
-                              device=device)
+    block_table = torch.empty(
+        (batch_size, num_blocks), dtype=torch.int32, device=device
+    )
 
     for b in range(batch_size):
         perm = torch.randperm(num_blocks, device=device)
@@ -893,10 +951,8 @@ def test_gather_and_maybe_dequant_cache_mla(kv_lora_rank, qk_rope_head_dim,
         remaining = s - (tot - 1) * block_size
         last_block_data = src_cache[blocks[-1], :remaining, :]
         if kv_cache_dtype == "fp8":
-            dequantized_last_block = torch.empty_like(last_block_data,
-                                                      dtype=dtype)
-            ops.convert_fp8(dequantized_last_block, last_block_data,
-                            scale.item())
+            dequantized_last_block = torch.empty_like(last_block_data, dtype=dtype)
+            ops.convert_fp8(dequantized_last_block, last_block_data, scale.item())
             gathered_rows.append(dequantized_last_block)
         else:
             gathered_rows.append(last_block_data)
@@ -907,14 +963,29 @@ def test_gather_and_maybe_dequant_cache_mla(kv_lora_rank, qk_rope_head_dim,
 
     opcheck(
         torch.ops._C_cache_ops.gather_and_maybe_dequant_cache,
-        (src_cache, dst, block_table, cu_seq_lens, batch_size, kv_cache_dtype,
-         scale, None),
+        (
+            src_cache,
+            dst,
+            block_table,
+            cu_seq_lens,
+            batch_size,
+            kv_cache_dtype,
+            scale,
+            None,
+        ),
         test_utils=DEFAULT_OPCHECK_TEST_UTILS,
     )
 
-    ops.gather_and_maybe_dequant_cache(src_cache, dst, block_table,
-                                       cu_seq_lens, batch_size, kv_cache_dtype,
-                                       scale, None)
+    ops.gather_and_maybe_dequant_cache(
+        src_cache,
+        dst,
+        block_table,
+        cu_seq_lens,
+        batch_size,
+        kv_cache_dtype,
+        scale,
+        None,
+    )
     torch.testing.assert_close(dst, expected)
 
 
@@ -925,42 +996,46 @@ def test_gather_and_maybe_dequant_cache_mla(kv_lora_rank, qk_rope_head_dim,
 @pytest.mark.parametrize("max_seq_len", [512])
 @pytest.mark.parametrize("batch_size", [8])
 @pytest.mark.parametrize("dtype", [torch.float32])
-@pytest.mark.parametrize("kv_cache_dtype",
-                         ["auto"])  # You can also test "fp8" if needed.
+@pytest.mark.parametrize(
+    "kv_cache_dtype", ["auto"]
+)  # You can also test "fp8" if needed.
 @pytest.mark.parametrize("device", CUDA_DEVICES)
 @torch.inference_mode()
-def test_cp_gather_cache_mla(kv_lora_rank, qk_rope_head_dim, block_size,
-                             num_blocks, max_seq_len, batch_size, dtype,
-                             kv_cache_dtype, device):
+def test_cp_gather_cache_mla(
+    kv_lora_rank,
+    qk_rope_head_dim,
+    block_size,
+    num_blocks,
+    max_seq_len,
+    batch_size,
+    dtype,
+    kv_cache_dtype,
+    device,
+):
     entry_size = kv_lora_rank + qk_rope_head_dim
-    src_cache = _create_mla_cache(num_blocks, block_size, entry_size, dtype,
-                                  kv_cache_dtype, device)
+    src_cache = _create_mla_cache(
+        num_blocks, block_size, entry_size, dtype, kv_cache_dtype, device
+    )
     _fill_mla_cache(src_cache, kv_cache_dtype=kv_cache_dtype)
 
-    seq_len_tensor = torch.randint(0,
-                                   max_seq_len + 1, (batch_size, ),
-                                   device=device)
+    seq_len_tensor = torch.randint(0, max_seq_len + 1, (batch_size,), device=device)
 
     total_tokens = seq_len_tensor.sum()
-    cu_seq_lens = torch.empty((batch_size + 1),
-                              dtype=torch.int32,
-                              device=device)
+    cu_seq_lens = torch.empty((batch_size + 1), dtype=torch.int32, device=device)
     cu_seq_lens[0] = 0
     cu_seq_lens[1:] = seq_len_tensor.cumsum(dim=0).to(dtype=torch.int32)
     print("seq_len_tensor", seq_len_tensor)
 
     tot_blocks_tensor = (seq_len_tensor + block_size - 1) // block_size
-    block_table = torch.empty((batch_size, num_blocks),
-                              dtype=torch.int32,
-                              device=device)
+    block_table = torch.empty(
+        (batch_size, num_blocks), dtype=torch.int32, device=device
+    )
 
     for b in range(batch_size):
         perm = torch.randperm(num_blocks, device=device)
         block_table[b, :] = perm
 
-    dst = torch.zeros((total_tokens, entry_size),
-                      dtype=src_cache.dtype,
-                      device=device)
+    dst = torch.zeros((total_tokens, entry_size), dtype=src_cache.dtype, device=device)
 
     expected_batches = []
     for b in range(batch_size):
@@ -1016,20 +1091,16 @@ def test_concat_and_cache_mla_cpu(
 
     total_slots = num_blocks * block_size
     slot_mapping_lst = random.sample(range(total_slots), num_tokens)
-    slot_mapping = torch.tensor(slot_mapping_lst,
-                                dtype=torch.long,
-                                device=device)
+    slot_mapping = torch.tensor(slot_mapping_lst, dtype=torch.long, device=device)
 
     kv_c = torch.randn(num_tokens, kv_lora_rank, dtype=dtype, device=device)
-    k_pe = torch.randn(num_tokens,
-                       qk_rope_head_dim,
-                       dtype=dtype,
-                       device=device)
+    k_pe = torch.randn(num_tokens, qk_rope_head_dim, dtype=dtype, device=device)
     entry_size = kv_lora_rank + qk_rope_head_dim
 
     scale = torch.tensor(0.1, dtype=torch.float32, device=device)
-    kv_cache = _create_mla_cache(num_blocks, block_size, entry_size, dtype,
-                                 kv_cache_dtype, device)
+    kv_cache = _create_mla_cache(
+        num_blocks, block_size, entry_size, dtype, kv_cache_dtype, device
+    )
     ref_temp = torch.zeros(*kv_cache.shape, dtype=dtype, device=device)
 
     for i in range(num_tokens):
@@ -1041,10 +1112,7 @@ def test_concat_and_cache_mla_cpu(
 
     if kv_cache_dtype == "fp8":
         ref_kv_cache = torch.empty_like(ref_temp, dtype=kv_cache.dtype)
-        ops.convert_fp8(ref_kv_cache,
-                        ref_temp,
-                        scale.item(),
-                        kv_dtype=kv_cache_dtype)
+        ops.convert_fp8(ref_kv_cache, ref_temp, scale.item(), kv_dtype=kv_cache_dtype)
     else:
         ref_kv_cache = ref_temp
 
@@ -1054,6 +1122,5 @@ def test_concat_and_cache_mla_cpu(
         test_utils=DEFAULT_OPCHECK_TEST_UTILS,
     )
 
-    ops.concat_and_cache_mla(kv_c, k_pe, kv_cache, slot_mapping,
-                             kv_cache_dtype, scale)
+    ops.concat_and_cache_mla(kv_c, k_pe, kv_cache, slot_mapping, kv_cache_dtype, scale)
     torch.testing.assert_close(kv_cache, ref_kv_cache)
diff --git a/tests/kernels/attention/test_cascade_flash_attn.py b/tests/kernels/attention/test_cascade_flash_attn.py
index 1e7e7e0a7f84..58e8bd592ba4 100755
--- a/tests/kernels/attention/test_cascade_flash_attn.py
+++ b/tests/kernels/attention/test_cascade_flash_attn.py
@@ -7,11 +7,12 @@
 import torch
 
 from vllm.platforms import current_platform
-from vllm.v1.attention.backends.flash_attn import (cascade_attention,
-                                                   merge_attn_states)
-from vllm.vllm_flash_attn import (fa_version_unsupported_reason,
-                                  flash_attn_varlen_func,
-                                  is_fa_version_supported)
+from vllm.v1.attention.backends.flash_attn import cascade_attention, merge_attn_states
+from vllm.vllm_flash_attn import (
+    fa_version_unsupported_reason,
+    flash_attn_varlen_func,
+    is_fa_version_supported,
+)
 
 NUM_HEADS = [(4, 4), (8, 2), (16, 2)]
 HEAD_SIZES = [128, 192, 256]
@@ -37,21 +38,14 @@ def test_merge_kernel(
     assert num_query_heads % num_kv_heads == 0
 
     # Prepare inputs.
-    prefix_output = torch.randn(num_tokens,
-                                num_query_heads,
-                                head_size,
-                                dtype=dtype)
-    suffix_output = torch.randn(num_tokens,
-                                num_query_heads,
-                                head_size,
-                                dtype=dtype)
+    prefix_output = torch.randn(num_tokens, num_query_heads, head_size, dtype=dtype)
+    suffix_output = torch.randn(num_tokens, num_query_heads, head_size, dtype=dtype)
     prefix_lse = torch.randn(num_query_heads, num_tokens, dtype=torch.float32)
     suffix_lse = torch.randn(num_query_heads, num_tokens, dtype=torch.float32)
 
     # Run the kernel.
     output = torch.empty(num_tokens, num_query_heads, head_size, dtype=dtype)
-    merge_attn_states(output, prefix_output, prefix_lse, suffix_output,
-                      suffix_lse)
+    merge_attn_states(output, prefix_output, prefix_lse, suffix_output, suffix_lse)
 
     # Reference implementation.
     max_lse = torch.maximum(prefix_lse, suffix_lse)
@@ -97,8 +91,10 @@ def test_cascade(
 ) -> None:
     torch.set_default_device("cuda")
     if not is_fa_version_supported(fa_version):
-        pytest.skip(f"Flash attention version {fa_version} not supported due "
-                    f"to: \"{fa_version_unsupported_reason(fa_version)}\"")
+        pytest.skip(
+            f"Flash attention version {fa_version} not supported due "
+            f'to: "{fa_version_unsupported_reason(fa_version)}"'
+        )
 
     current_platform.seed_everything(0)
 
@@ -107,11 +103,9 @@ def test_cascade(
     num_query_heads = num_heads[0]
     num_kv_heads = num_heads[1]
     assert num_query_heads % num_kv_heads == 0
-    key_cache = torch.randn(num_blocks,
-                            block_size,
-                            num_kv_heads,
-                            head_size,
-                            dtype=dtype)
+    key_cache = torch.randn(
+        num_blocks, block_size, num_kv_heads, head_size, dtype=dtype
+    )
     value_cache = torch.randn_like(key_cache)
 
     seq_lens, common_prefix_len = seq_lens_and_common_prefix
@@ -122,26 +116,21 @@ def test_cascade(
     max_kv_len = max(kv_lens)
 
     total_num_query_tokens = sum(query_lens)
-    query = torch.randn(total_num_query_tokens,
-                        num_query_heads,
-                        head_size,
-                        dtype=dtype)
-    cu_query_lens = torch.tensor([0] + query_lens,
-                                 dtype=torch.int32).cumsum(dim=0,
-                                                           dtype=torch.int32)
+    query = torch.randn(total_num_query_tokens, num_query_heads, head_size, dtype=dtype)
+    cu_query_lens = torch.tensor([0] + query_lens, dtype=torch.int32).cumsum(
+        dim=0, dtype=torch.int32
+    )
     kv_lens_tensor = torch.tensor(kv_lens, dtype=torch.int32)
     max_num_blocks_per_seq = (max_kv_len + block_size - 1) // block_size
-    block_tables = torch.randint(0,
-                                 num_blocks,
-                                 (num_seqs, max_num_blocks_per_seq),
-                                 dtype=torch.int32)
+    block_tables = torch.randint(
+        0, num_blocks, (num_seqs, max_num_blocks_per_seq), dtype=torch.int32
+    )
 
     assert common_prefix_len > 0
     assert common_prefix_len % block_size == 0
     num_common_kv_blocks = common_prefix_len // block_size
     # Make sure the first `num_common_kv_blocks` blocks are the same.
-    block_tables[:, :num_common_kv_blocks] = \
-        block_tables[0, :num_common_kv_blocks]
+    block_tables[:, :num_common_kv_blocks] = block_tables[0, :num_common_kv_blocks]
 
     # Run the regular attention.
     ref_output = flash_attn_varlen_func(
@@ -161,8 +150,7 @@ def test_cascade(
 
     # Run cascade attention.
     assert all(common_prefix_len < kv_len for kv_len in kv_lens)
-    cu_prefix_query_lens = torch.tensor([0, total_num_query_tokens],
-                                        dtype=torch.int32)
+    cu_prefix_query_lens = torch.tensor([0, total_num_query_tokens], dtype=torch.int32)
     prefix_kv_lens = torch.tensor([common_prefix_len], dtype=torch.int32)
     suffix_kv_lens = kv_lens_tensor - common_prefix_len
     output = torch.empty_like(query)
diff --git a/tests/kernels/attention/test_cutlass_mla_decode.py b/tests/kernels/attention/test_cutlass_mla_decode.py
index 5078bd730a1a..16a573e0b326 100644
--- a/tests/kernels/attention/test_cutlass_mla_decode.py
+++ b/tests/kernels/attention/test_cutlass_mla_decode.py
@@ -12,33 +12,37 @@
 from vllm.triton_utils import triton
 
 
-def cal_diff(x: torch.Tensor,
-             y: torch.Tensor,
-             name: str,
-             use_fp8: bool = False,
-             diff_threshold: Optional[float] = None) -> None:
+def cal_diff(
+    x: torch.Tensor,
+    y: torch.Tensor,
+    name: str,
+    use_fp8: bool = False,
+    diff_threshold: Optional[float] = None,
+) -> None:
     x, y = x.double(), y.double()
-    cos_diff = 1 - 2 * (x * y).sum().item() / max(
-        (x * x + y * y).sum().item(), 1e-12)
+    cos_diff = 1 - 2 * (x * y).sum().item() / max((x * x + y * y).sum().item(), 1e-12)
     if diff_threshold is not None:
         # directly compare the cos_diff with the threshold
         assert cos_diff < diff_threshold
     else:
         # use the default threshold
-        if (use_fp8):
+        if use_fp8:
             assert cos_diff < 1e-4
         else:
             assert cos_diff < 1e-5
 
 
-CUTLASS_MLA_UNSUPPORTED_REASON = \
-    "Cutlass MLA Requires compute capability of 10 or above." \
-    if not current_platform.is_device_capability(100) \
+CUTLASS_MLA_UNSUPPORTED_REASON = (
+    "Cutlass MLA Requires compute capability of 10 or above."
+    if not current_platform.is_device_capability(100)
     else "Cutlass MLA is supported"
+)
 
 
-@pytest.mark.skipif(not current_platform.has_device_capability(100),
-                    reason=CUTLASS_MLA_UNSUPPORTED_REASON)
+@pytest.mark.skipif(
+    not current_platform.has_device_capability(100),
+    reason=CUTLASS_MLA_UNSUPPORTED_REASON,
+)
 @pytest.mark.parametrize("b", [128])
 @pytest.mark.parametrize("s_q", [1])
 @pytest.mark.parametrize("mean_sk", [4096, 8192, 16384])
@@ -54,11 +58,13 @@ def cal_diff(x: torch.Tensor,
     [
         torch.bfloat16,
         # fp8 can have occasional precision-related failures.
-        pytest.param(torch.float8_e4m3fn, marks=pytest.mark.flaky(reruns=2))
-    ])
+        pytest.param(torch.float8_e4m3fn, marks=pytest.mark.flaky(reruns=2)),
+    ],
+)
 @torch.inference_mode()
-def test_cutlass_mla_decode(b, s_q, mean_sk, h_q, h_kv, d, dv, block_size,
-                            causal, varlen, torch_dtype):
+def test_cutlass_mla_decode(
+    b, s_q, mean_sk, h_q, h_kv, d, dv, block_size, causal, varlen, torch_dtype
+):
     device = torch.device("cuda:0")
     if torch_dtype == torch.float8_e4m3fn:
         init_dtype = torch.bfloat16
@@ -70,24 +76,25 @@ def test_cutlass_mla_decode(b, s_q, mean_sk, h_q, h_kv, d, dv, block_size,
     torch.manual_seed(42)
     random.seed(42)
 
-    print(f"{b=}, {s_q=}, {mean_sk=}, {h_q=}, {h_kv=}, "
-          f"{d=}, {dv=}, {causal=}, {varlen=}, {torch_dtype=}")
+    print(
+        f"{b=}, {s_q=}, {mean_sk=}, {h_q=}, {h_kv=}, "
+        f"{d=}, {dv=}, {causal=}, {varlen=}, {torch_dtype=}"
+    )
 
     use_fp8 = torch_dtype == torch.float8_e4m3fn
-    scale = math.sqrt(d)**(-1)
-    cache_seqlens = torch.full((b, ), mean_sk, dtype=torch.int32)
+    scale = math.sqrt(d) ** (-1)
+    cache_seqlens = torch.full((b,), mean_sk, dtype=torch.int32)
     if varlen:
         for i in range(b):
-            cache_seqlens[i] = max(random.normalvariate(mean_sk, mean_sk / 2),
-                                   s_q)
+            cache_seqlens[i] = max(random.normalvariate(mean_sk, mean_sk / 2), s_q)
     total_seqlens = cache_seqlens.sum().item()
     max_seqlen = cache_seqlens.max().item()
     max_seqlen_pad = triton.cdiv(max_seqlen, 256) * 256
 
     q = torch.randn(b, s_q, h_q, d)
-    block_table = torch.arange(b * max_seqlen_pad // block_size,
-                               dtype=torch.int32).view(
-                                   b, max_seqlen_pad // block_size)
+    block_table = torch.arange(
+        b * max_seqlen_pad // block_size, dtype=torch.int32
+    ).view(b, max_seqlen_pad // block_size)
     blocked_k = torch.randn(block_table.numel(), block_size, h_kv, d)
     blocked_v = blocked_k[..., :dv]
 
@@ -121,22 +128,29 @@ def cutlass_mla():
             q_pe = q_pe_padded
 
         kv_cache_flat = blocked_k.squeeze(2)
-        device_properties = torch.cuda.get_device_properties(
-            torch.device("cuda:0"))
+        device_properties = torch.cuda.get_device_properties(torch.device("cuda:0"))
         sm_count = device_properties.multi_processor_count
         workspace_size = ops.sm100_cutlass_mla_get_workspace_size(
-            max_seqlen * block_size, b, sm_count, num_kv_splits=1)
-        workspace = torch.empty(workspace_size,
-                                device="cuda",
-                                dtype=torch.uint8)
+            max_seqlen * block_size, b, sm_count, num_kv_splits=1
+        )
+        workspace = torch.empty(workspace_size, device="cuda", dtype=torch.uint8)
 
         out_ans = torch.empty(b, MAX_HEADS, dv, dtype=init_dtype)
-        output_lse = torch.empty((b, MAX_HEADS),
-                                 dtype=torch.float32,
-                                 device=q_nope.device)
-        ops.sm100_cutlass_mla_decode(out_ans, output_lse, q_nope, q_pe,
-                                     kv_cache_flat, cache_seqlens, block_table,
-                                     workspace, scale, 1)
+        output_lse = torch.empty(
+            (b, MAX_HEADS), dtype=torch.float32, device=q_nope.device
+        )
+        ops.sm100_cutlass_mla_decode(
+            out_ans,
+            output_lse,
+            q_nope,
+            q_pe,
+            kv_cache_flat,
+            cache_seqlens,
+            block_table,
+            workspace,
+            scale,
+            1,
+        )
         return out_ans[:, :h_q].contiguous(), output_lse[:, :h_q].contiguous()
 
     def scaled_dot_product_attention(query, key, value, is_causal=False):
@@ -150,8 +164,7 @@ def scaled_dot_product_attention(query, key, value, is_causal=False):
             s_q = query.shape[-2]
             s_k = key.shape[-2]
             attn_bias = torch.zeros(s_q, s_k, dtype=query.dtype)
-            temp_mask = torch.ones(s_q, s_k,
-                                   dtype=torch.bool).tril(diagonal=s_k - s_q)
+            temp_mask = torch.ones(s_q, s_k, dtype=torch.bool).tril(diagonal=s_k - s_q)
             attn_bias.masked_fill_(temp_mask.logical_not(), float("-inf"))
             attn_bias.to(query.dtype)
             attn_weight += attn_bias
@@ -161,10 +174,16 @@ def scaled_dot_product_attention(query, key, value, is_causal=False):
 
     def ref_mla():
         q_ = (q.to(torch.float) * descale_q).to(init_dtype) if use_fp8 else q
-        blocked_k_ = (blocked_k.to(torch.float) *
-                      descale_k).to(init_dtype) if use_fp8 else blocked_k
-        blocked_v_ = (blocked_v.to(torch.float) *
-                      descale_k).to(init_dtype) if use_fp8 else blocked_v
+        blocked_k_ = (
+            (blocked_k.to(torch.float) * descale_k).to(init_dtype)
+            if use_fp8
+            else blocked_k
+        )
+        blocked_v_ = (
+            (blocked_v.to(torch.float) * descale_k).to(init_dtype)
+            if use_fp8
+            else blocked_v
+        )
         out = torch.empty(b, s_q, h_q, dv, dtype=torch.float32)
         lse = torch.empty(b, h_q, s_q, dtype=torch.float32)
         for i in range(b):
@@ -191,8 +210,9 @@ def ref_mla():
 
     t = triton.testing.do_bench(cutlass_mla)
     FLOPS = s_q * total_seqlens * h_q * (d + dv) * 2
-    bytes = (total_seqlens * h_kv * d +
-             b * s_q * h_q * d) * (torch.finfo(torch_dtype).bits // 8) + (
-                 b * s_q * h_q * dv) * (torch.finfo(init_dtype).bits // 8)
-    print(f"{t:.3f} ms, {FLOPS / 10 ** 9 / t:.0f} TFLOPS,",
-          f"{bytes / 10 ** 6 / t:.0f} GB/s")
+    bytes = (total_seqlens * h_kv * d + b * s_q * h_q * d) * (
+        torch.finfo(torch_dtype).bits // 8
+    ) + (b * s_q * h_q * dv) * (torch.finfo(init_dtype).bits // 8)
+    print(
+        f"{t:.3f} ms, {FLOPS / 10**9 / t:.0f} TFLOPS,", f"{bytes / 10**6 / t:.0f} GB/s"
+    )
diff --git a/tests/kernels/attention/test_deepgemm_attention.py b/tests/kernels/attention/test_deepgemm_attention.py
index 2d901e408b27..4873afa649c9 100644
--- a/tests/kernels/attention/test_deepgemm_attention.py
+++ b/tests/kernels/attention/test_deepgemm_attention.py
@@ -7,9 +7,14 @@
 
 from vllm.platforms import current_platform
 from vllm.utils import cdiv, has_deep_gemm
-from vllm.utils.deep_gemm import (_ceil_to_ue8m0, calc_diff, fp8_mqa_logits,
-                                  fp8_paged_mqa_logits, get_num_sms,
-                                  get_paged_mqa_logits_metadata)
+from vllm.utils.deep_gemm import (
+    _ceil_to_ue8m0,
+    calc_diff,
+    fp8_mqa_logits,
+    fp8_paged_mqa_logits,
+    get_num_sms,
+    get_paged_mqa_logits_metadata,
+)
 
 
 def kv_cache_cast_to_fp8(x: torch.Tensor) -> torch.Tensor:
@@ -24,17 +29,18 @@ def kv_cache_cast_to_fp8(x: torch.Tensor) -> torch.Tensor:
         device=x.device,
         dtype=torch.uint8,
     )
-    x_fp8[:, :block_size * head_dim] = x_scaled.view(
-        num_blocks, block_size * head_dim).view(dtype=torch.uint8)
-    x_fp8[:,
-          block_size * head_dim:] = sf.view(num_blocks,
-                                            block_size).view(dtype=torch.uint8)
+    x_fp8[:, : block_size * head_dim] = x_scaled.view(
+        num_blocks, block_size * head_dim
+    ).view(dtype=torch.uint8)
+    x_fp8[:, block_size * head_dim :] = sf.view(num_blocks, block_size).view(
+        dtype=torch.uint8
+    )
     return x_fp8.view(num_blocks, block_size, num_heads, head_dim + 4)
 
 
 def per_custom_dims_cast_to_fp8(
-        x: torch.Tensor, dims: tuple,
-        use_ue8m0: bool) -> tuple[torch.Tensor, torch.Tensor]:
+    x: torch.Tensor, dims: tuple, use_ue8m0: bool
+) -> tuple[torch.Tensor, torch.Tensor]:
     excluded_dims = tuple([i for i in range(x.dim()) if i not in set(dims)])
     x_amax = x.abs().float().amax(dim=excluded_dims, keepdim=True).clamp(1e-4)
     sf = x_amax / 448.0
@@ -69,10 +75,12 @@ def _ref_fp8_mqa_logits(
     q = q.float()
     k = k.float()
 
-    mask_lo = (torch.arange(0, seq_len_kv, device="cuda")[None, :]
-               >= cu_seqlen_ks[:, None])
-    mask_hi = (torch.arange(0, seq_len_kv, device="cuda")[None, :]
-               < cu_seqlen_ke[:, None])
+    mask_lo = (
+        torch.arange(0, seq_len_kv, device="cuda")[None, :] >= cu_seqlen_ks[:, None]
+    )
+    mask_hi = (
+        torch.arange(0, seq_len_kv, device="cuda")[None, :] < cu_seqlen_ke[:, None]
+    )
     mask = mask_lo & mask_hi
 
     score = torch.einsum("mhd,and->hmn", q, k)
@@ -84,14 +92,15 @@ def _ref_fp8_mqa_logits(
 
 @pytest.mark.skipif(not current_platform.is_cuda(), reason="CUDA only")
 @pytest.mark.skipif(not has_deep_gemm(), reason="DeepGEMM not available")
-@pytest.mark.skipif(not current_platform.has_device_capability(90),
-                    reason="SM90 and SM100 only")
+@pytest.mark.skipif(
+    not current_platform.has_device_capability(90), reason="SM90 and SM100 only"
+)
 def test_deepgemm_fp8_mqa_logits():
     torch.manual_seed(0)
     random.seed(0)
     num_heads, head_dim = 32, 128
-    for seq_len in (512, ):
-        for seq_len_kv in (1024, ):
+    for seq_len in (512,):
+        for seq_len_kv in (1024,):
             for disable_cp in (False, True):
                 q = torch.randn(
                     seq_len,
@@ -100,24 +109,23 @@ def test_deepgemm_fp8_mqa_logits():
                     device="cuda",
                     dtype=torch.bfloat16,
                 )
-                kv = torch.randn(seq_len_kv,
-                                 head_dim,
-                                 device="cuda",
-                                 dtype=torch.bfloat16)
-                weights = torch.randn(seq_len,
-                                      num_heads,
-                                      device="cuda",
-                                      dtype=torch.float32)
+                kv = torch.randn(
+                    seq_len_kv, head_dim, device="cuda", dtype=torch.bfloat16
+                )
+                weights = torch.randn(
+                    seq_len, num_heads, device="cuda", dtype=torch.float32
+                )
 
                 if disable_cp:
                     ks = torch.zeros(seq_len, dtype=torch.int, device="cuda")
-                    ke = torch.arange(seq_len, dtype=torch.int,
-                                      device="cuda") + (seq_len_kv - seq_len)
+                    ke = torch.arange(seq_len, dtype=torch.int, device="cuda") + (
+                        seq_len_kv - seq_len
+                    )
                 else:
                     ks, ke = _generate_cp_test_data(seq_len, seq_len_kv)
 
                 q_fp8 = q.to(torch.float8_e4m3fn)
-                kv_fp8 = per_custom_dims_cast_to_fp8(kv, (0, ), False)
+                kv_fp8 = per_custom_dims_cast_to_fp8(kv, (0,), False)
                 logits = fp8_mqa_logits(q_fp8, kv_fp8, weights, ks, ke)
 
                 ref_logits = _ref_fp8_mqa_logits(
@@ -157,11 +165,10 @@ def _ref_fp8_paged_mqa_logits(
     context_lens_list = context_lens.tolist()
     for i in range(batch_size):
         context_len = context_lens_list[i]
-        q_offsets = torch.arange(context_len - next_n,
-                                 context_len,
-                                 device="cuda")
-        weight_slice = (weights[i * next_n:(i + 1) * next_n, :].transpose(
-            0, 1).contiguous())
+        q_offsets = torch.arange(context_len - next_n, context_len, device="cuda")
+        weight_slice = (
+            weights[i * next_n : (i + 1) * next_n, :].transpose(0, 1).contiguous()
+        )
         for block_rk in range(cdiv(context_len, block_size)):
             block_idx = block_tables[i][block_rk]
             qx, kx = q[i], kv_cache[block_idx]
@@ -170,28 +177,30 @@ def _ref_fp8_paged_mqa_logits(
                 (block_rk + 1) * block_size,
                 device="cuda",
             )
-            mask = (k_offsets[None, :] < context_len) & (k_offsets[None, :]
-                                                         <= q_offsets[:, None])
+            mask = (k_offsets[None, :] < context_len) & (
+                k_offsets[None, :] <= q_offsets[:, None]
+            )
             s = torch.where(
                 mask[None, :, :],
                 (qx.transpose(0, 1) @ kx.transpose(0, 1).transpose(1, 2)).to(
-                    logits.dtype),
+                    logits.dtype
+                ),
                 float("-inf"),
             )
             s = torch.relu(s) * weight_slice[..., None]
             s = s.sum(dim=0)
             logits[
-                i * next_n:(i + 1) * next_n,
-                block_rk * block_size:(block_rk + 1) * block_size,
-            ] = torch.where(k_offsets[None, :] <= q_offsets[:, None], s,
-                            float("-inf"))
+                i * next_n : (i + 1) * next_n,
+                block_rk * block_size : (block_rk + 1) * block_size,
+            ] = torch.where(k_offsets[None, :] <= q_offsets[:, None], s, float("-inf"))
     return logits
 
 
 @pytest.mark.skipif(not current_platform.is_cuda(), reason="CUDA only")
 @pytest.mark.skipif(not has_deep_gemm(), reason="DeepGEMM not available")
-@pytest.mark.skipif(not current_platform.has_device_capability(90),
-                    reason="SM90 and SM100 only")
+@pytest.mark.skipif(
+    not current_platform.has_device_capability(90), reason="SM90 and SM100 only"
+)
 def test_deepgemm_fp8_paged_mqa_logits():
     torch.manual_seed(0)
     random.seed(0)
@@ -199,7 +208,7 @@ def test_deepgemm_fp8_paged_mqa_logits():
     max_model_len = 4096
     for batch_size, next_n in [(4, 1), (2, 2)]:
         for heads, index_dim in [(32, 128)]:
-            for avg_kv in (2048, ):
+            for avg_kv in (2048,):
                 num_blocks, blocksize = max_model_len * 2, 64
 
                 q = torch.randn(
@@ -218,12 +227,14 @@ def test_deepgemm_fp8_paged_mqa_logits():
                     dtype=torch.float32,
                 )
 
-                context_lens = (torch.randint(int(0.8 * avg_kv),
-                                              int(1.2 * avg_kv),
-                                              (batch_size, )).cuda().to(
-                                                  torch.int32))
-                max_block_len = ((context_lens.max().item() + blocksize - 1) //
-                                 blocksize * blocksize)
+                context_lens = (
+                    torch.randint(int(0.8 * avg_kv), int(1.2 * avg_kv), (batch_size,))
+                    .cuda()
+                    .to(torch.int32)
+                )
+                max_block_len = (
+                    (context_lens.max().item() + blocksize - 1) // blocksize * blocksize
+                )
                 block_tables = torch.zeros(
                     (batch_size, max_block_len),
                     device="cuda",
@@ -243,7 +254,8 @@ def test_deepgemm_fp8_paged_mqa_logits():
                 kv_cache_fp8 = kv_cache_cast_to_fp8(kv_cache)
 
                 schedule_metadata = get_paged_mqa_logits_metadata(
-                    context_lens, blocksize, get_num_sms())
+                    context_lens, blocksize, get_num_sms()
+                )
                 logits = fp8_paged_mqa_logits(
                     q_fp8,
                     kv_cache_fp8,
@@ -263,15 +275,18 @@ def test_deepgemm_fp8_paged_mqa_logits():
                     max_model_len,
                 )
 
-                positions = (torch.arange(max_model_len,
-                                          device="cuda").unsqueeze(0).expand(
-                                              batch_size * next_n, -1))
-                row_indices = (
-                    torch.arange(batch_size * next_n, device="cuda") // next_n)
+                positions = (
+                    torch.arange(max_model_len, device="cuda")
+                    .unsqueeze(0)
+                    .expand(batch_size * next_n, -1)
+                )
+                row_indices = torch.arange(batch_size * next_n, device="cuda") // next_n
                 next_n_offset = (
-                    torch.arange(batch_size * next_n, device="cuda") % next_n)
-                mask = positions <= (context_lens[row_indices] - next_n +
-                                     next_n_offset).unsqueeze(1)
+                    torch.arange(batch_size * next_n, device="cuda") % next_n
+                )
+                mask = positions <= (
+                    context_lens[row_indices] - next_n + next_n_offset
+                ).unsqueeze(1)
 
                 logits = logits.masked_fill(~mask, 0)
                 ref_logits = ref_logits.masked_fill(~mask, 0)
diff --git a/tests/kernels/attention/test_flash_attn.py b/tests/kernels/attention/test_flash_attn.py
index 2544703f8bf9..d39f0a593ed4 100644
--- a/tests/kernels/attention/test_flash_attn.py
+++ b/tests/kernels/attention/test_flash_attn.py
@@ -7,10 +7,12 @@
 import torch
 
 from vllm.platforms import current_platform
-from vllm.vllm_flash_attn import (fa_version_unsupported_reason,
-                                  flash_attn_varlen_func,
-                                  flash_attn_with_kvcache,
-                                  is_fa_version_supported)
+from vllm.vllm_flash_attn import (
+    fa_version_unsupported_reason,
+    flash_attn_varlen_func,
+    flash_attn_with_kvcache,
+    is_fa_version_supported,
+)
 
 NUM_HEADS = [(4, 4), (8, 2)]
 HEAD_SIZES = [128, 256]
@@ -44,7 +46,7 @@ def ref_paged_attn(
     for i in range(num_seqs):
         query_len = query_lens[i]
         kv_len = kv_lens[i]
-        q = query[start_idx:start_idx + query_len]
+        q = query[start_idx : start_idx + query_len]
         q *= scale
 
         num_kv_blocks = (kv_len + block_size - 1) // block_size
@@ -62,10 +64,13 @@ def ref_paged_attn(
         empty_mask = torch.ones(query_len, kv_len)
         mask = torch.triu(empty_mask, diagonal=kv_len - query_len + 1).bool()
         if sliding_window is not None:
-            sliding_window_mask = torch.triu(empty_mask,
-                                             diagonal=kv_len -
-                                             (query_len + sliding_window) +
-                                             1).bool().logical_not()
+            sliding_window_mask = (
+                torch.triu(
+                    empty_mask, diagonal=kv_len - (query_len + sliding_window) + 1
+                )
+                .bool()
+                .logical_not()
+            )
             mask |= sliding_window_mask
         if soft_cap is not None:
             attn = soft_cap * torch.tanh(attn / soft_cap)
@@ -106,11 +111,15 @@ def test_flash_attn_with_paged_kv(
 ) -> None:
     torch.set_default_device("cuda")
     if not is_fa_version_supported(fa_version):
-        pytest.skip(f"Flash attention version {fa_version} not supported due "
-                    f"to: \"{fa_version_unsupported_reason(fa_version)}\"")
+        pytest.skip(
+            f"Flash attention version {fa_version} not supported due "
+            f'to: "{fa_version_unsupported_reason(fa_version)}"'
+        )
     if q_dtype is not None and (dtype != torch.bfloat16 or fa_version == 2):
-        pytest.skip("Flash attention with quantized inputs is only "
-                    "supported on version 3 with bfloat16 base type")
+        pytest.skip(
+            "Flash attention with quantized inputs is only "
+            "supported on version 3 with bfloat16 base type"
+        )
 
     current_platform.seed_everything(0)
     num_seqs = len(kv_lens)
@@ -119,23 +128,19 @@ def test_flash_attn_with_paged_kv(
     assert num_query_heads % num_kv_heads == 0
     max_kv_len = max(kv_lens)
     scale = head_size**-0.5
-    window_size = ((sliding_window - 1, 0) if sliding_window is not None else
-                   (-1, -1))
+    window_size = (sliding_window - 1, 0) if sliding_window is not None else (-1, -1)
 
     query = torch.randn(num_seqs, num_query_heads, head_size, dtype=dtype)
-    key_cache = torch.randn(num_blocks,
-                            block_size,
-                            num_kv_heads,
-                            head_size,
-                            dtype=dtype)
+    key_cache = torch.randn(
+        num_blocks, block_size, num_kv_heads, head_size, dtype=dtype
+    )
     value_cache = torch.randn_like(key_cache)
     kv_lens_tensor = torch.tensor(kv_lens, dtype=torch.int32)
 
     max_num_blocks_per_seq = (max_kv_len + block_size - 1) // block_size
-    block_tables = torch.randint(0,
-                                 num_blocks,
-                                 (num_seqs, max_num_blocks_per_seq),
-                                 dtype=torch.int32)
+    block_tables = torch.randint(
+        0, num_blocks, (num_seqs, max_num_blocks_per_seq), dtype=torch.int32
+    )
 
     q = query.unsqueeze(1)
     out = torch.empty_like(q) if use_out else None
@@ -180,23 +185,27 @@ def test_flash_attn_with_paged_kv(
     if q_dtype is not None:
         atol, rtol = 1.5e-1, 1.5e-1
 
-    ref_output = ref_paged_attn(query=query,
-                                key_cache=key_cache,
-                                value_cache=value_cache,
-                                query_lens=[1] * num_seqs,
-                                kv_lens=kv_lens,
-                                block_tables=block_tables,
-                                scale=scale,
-                                soft_cap=soft_cap,
-                                sliding_window=sliding_window)
-    torch.testing.assert_close(output, ref_output, atol=atol, rtol=rtol), \
-        f"{torch.max(torch.abs(output - ref_output))}"
+    ref_output = ref_paged_attn(
+        query=query,
+        key_cache=key_cache,
+        value_cache=value_cache,
+        query_lens=[1] * num_seqs,
+        kv_lens=kv_lens,
+        block_tables=block_tables,
+        scale=scale,
+        soft_cap=soft_cap,
+        sliding_window=sliding_window,
+    )
+    (
+        torch.testing.assert_close(output, ref_output, atol=atol, rtol=rtol),
+        f"{torch.max(torch.abs(output - ref_output))}",
+    )
 
 
 @pytest.mark.parametrize("use_out", [True, False])
-@pytest.mark.parametrize("seq_lens",
-                         [[(1, 1328), (5, 18),
-                           (129, 463)], [(1, 523), (1, 37), (1, 2011)]])
+@pytest.mark.parametrize(
+    "seq_lens", [[(1, 1328), (5, 18), (129, 463)], [(1, 523), (1, 37), (1, 2011)]]
+)
 @pytest.mark.parametrize("num_heads", NUM_HEADS)
 @pytest.mark.parametrize("head_size", HEAD_SIZES)
 @pytest.mark.parametrize("block_size", BLOCK_SIZES)
@@ -222,11 +231,15 @@ def test_varlen_with_paged_kv(
 ) -> None:
     torch.set_default_device("cuda")
     if not is_fa_version_supported(fa_version):
-        pytest.skip(f"Flash attention version {fa_version} not supported due "
-                    f"to: \"{fa_version_unsupported_reason(fa_version)}\"")
+        pytest.skip(
+            f"Flash attention version {fa_version} not supported due "
+            f'to: "{fa_version_unsupported_reason(fa_version)}"'
+        )
     if q_dtype is not None and (dtype != torch.bfloat16 or fa_version == 2):
-        pytest.skip("Flash attention with quantized inputs is only "
-                    "supported on version 3 with bfloat16 base type")
+        pytest.skip(
+            "Flash attention with quantized inputs is only "
+            "supported on version 3 with bfloat16 base type"
+        )
     current_platform.seed_everything(0)
     num_seqs = len(seq_lens)
     query_lens = [x[0] for x in seq_lens]
@@ -236,30 +249,23 @@ def test_varlen_with_paged_kv(
     assert num_query_heads % num_kv_heads == 0
     max_query_len = max(query_lens)
     max_kv_len = max(kv_lens)
-    window_size = ((sliding_window - 1, 0) if sliding_window is not None else
-                   (-1, -1))
+    window_size = (sliding_window - 1, 0) if sliding_window is not None else (-1, -1)
     scale = head_size**-0.5
 
-    query = torch.randn(sum(query_lens),
-                        num_query_heads,
-                        head_size,
-                        dtype=dtype)
-    key_cache = torch.randn(num_blocks,
-                            block_size,
-                            num_kv_heads,
-                            head_size,
-                            dtype=dtype)
+    query = torch.randn(sum(query_lens), num_query_heads, head_size, dtype=dtype)
+    key_cache = torch.randn(
+        num_blocks, block_size, num_kv_heads, head_size, dtype=dtype
+    )
     value_cache = torch.randn_like(key_cache)
-    cu_query_lens = torch.tensor([0] + query_lens,
-                                 dtype=torch.int32).cumsum(dim=0,
-                                                           dtype=torch.int32)
+    cu_query_lens = torch.tensor([0] + query_lens, dtype=torch.int32).cumsum(
+        dim=0, dtype=torch.int32
+    )
     kv_lens = torch.tensor(kv_lens, dtype=torch.int32)
 
     max_num_blocks_per_seq = (max_kv_len + block_size - 1) // block_size
-    block_tables = torch.randint(0,
-                                 num_blocks,
-                                 (num_seqs, max_num_blocks_per_seq),
-                                 dtype=torch.int32)
+    block_tables = torch.randint(
+        0, num_blocks, (num_seqs, max_num_blocks_per_seq), dtype=torch.int32
+    )
 
     out = torch.empty_like(query) if use_out else None
 
@@ -315,5 +321,7 @@ def test_varlen_with_paged_kv(
     atol, rtol = 1.5e-2, 1e-2
     if q_dtype is not None:
         atol, rtol = 1.5e-1, 1.5e-1
-    torch.testing.assert_close(output, ref_output, atol=atol, rtol=rtol), \
-        f"{torch.max(torch.abs(output - ref_output))}"
+    (
+        torch.testing.assert_close(output, ref_output, atol=atol, rtol=rtol),
+        f"{torch.max(torch.abs(output - ref_output))}",
+    )
diff --git a/tests/kernels/attention/test_flashinfer.py b/tests/kernels/attention/test_flashinfer.py
index a821a74aba93..52cd10fdc5be 100644
--- a/tests/kernels/attention/test_flashinfer.py
+++ b/tests/kernels/attention/test_flashinfer.py
@@ -38,7 +38,7 @@ def ref_paged_attn(
     for i in range(num_seqs):
         query_len = query_lens[i]
         kv_len = kv_lens[i]
-        q = query[start_idx:start_idx + query_len]
+        q = query[start_idx : start_idx + query_len]
         q *= scale
 
         num_kv_blocks = (kv_len + block_size - 1) // block_size
@@ -56,10 +56,13 @@ def ref_paged_attn(
         empty_mask = torch.ones(query_len, kv_len)
         mask = torch.triu(empty_mask, diagonal=kv_len - query_len + 1).bool()
         if sliding_window is not None:
-            sliding_window_mask = torch.triu(empty_mask,
-                                             diagonal=kv_len -
-                                             (query_len + sliding_window) +
-                                             1).bool().logical_not()
+            sliding_window_mask = (
+                torch.triu(
+                    empty_mask, diagonal=kv_len - (query_len + sliding_window) + 1
+                )
+                .bool()
+                .logical_not()
+            )
             mask |= sliding_window_mask
         if soft_cap is not None:
             attn = soft_cap * torch.tanh(attn / soft_cap)
@@ -101,20 +104,16 @@ def test_flashinfer_decode_with_paged_kv(
 
     query = torch.randn(num_seqs, num_query_heads, head_size, dtype=dtype)
 
-    key_value_cache = torch.randn(NUM_BLOCKS,
-                                  2,
-                                  block_size,
-                                  num_kv_heads,
-                                  head_size,
-                                  dtype=dtype)
+    key_value_cache = torch.randn(
+        NUM_BLOCKS, 2, block_size, num_kv_heads, head_size, dtype=dtype
+    )
     key_cache = key_value_cache[:, 0, :, :, :].squeeze(1)
     value_cache = key_value_cache[:, 1, :, :, :].squeeze(1)
 
     max_num_blocks_per_seq = (max_kv_len + block_size - 1) // block_size
-    block_tables = torch.randint(0,
-                                 NUM_BLOCKS,
-                                 (num_seqs, max_num_blocks_per_seq),
-                                 dtype=torch.int32)
+    block_tables = torch.randint(
+        0, NUM_BLOCKS, (num_seqs, max_num_blocks_per_seq), dtype=torch.int32
+    )
 
     kv_indptr = [0]
     kv_indices = []
@@ -135,9 +134,9 @@ def test_flashinfer_decode_with_paged_kv(
     kv_last_page_lens = torch.tensor(kv_last_page_lens, dtype=torch.int32)
 
     workspace_buffer = torch.empty(128 * 1024 * 1024, dtype=torch.int8)
-    wrapper = flashinfer.\
-        BatchDecodeWithPagedKVCacheWrapper(workspace_buffer, "NHD",
-                use_tensor_cores=True)
+    wrapper = flashinfer.BatchDecodeWithPagedKVCacheWrapper(
+        workspace_buffer, "NHD", use_tensor_cores=True
+    )
     wrapper.plan(
         kv_indptr,
         kv_indices,
@@ -155,17 +154,21 @@ def test_flashinfer_decode_with_paged_kv(
 
     output = wrapper.run(query, key_value_cache)
 
-    ref_output = ref_paged_attn(query=query,
-                                key_cache=key_cache,
-                                value_cache=value_cache,
-                                query_lens=[1] * num_seqs,
-                                kv_lens=kv_lens,
-                                block_tables=block_tables,
-                                scale=scale,
-                                soft_cap=soft_cap,
-                                sliding_window=sliding_window)
-    torch.testing.assert_close(output, ref_output, atol=1e-2, rtol=1e-2), \
-        f"{torch.max(torch.abs(output - ref_output))}"
+    ref_output = ref_paged_attn(
+        query=query,
+        key_cache=key_cache,
+        value_cache=value_cache,
+        query_lens=[1] * num_seqs,
+        kv_lens=kv_lens,
+        block_tables=block_tables,
+        scale=scale,
+        soft_cap=soft_cap,
+        sliding_window=sliding_window,
+    )
+    (
+        torch.testing.assert_close(output, ref_output, atol=1e-2, rtol=1e-2),
+        f"{torch.max(torch.abs(output - ref_output))}",
+    )
 
 
 @pytest.mark.parametrize("seq_lens", [[(1, 1328), (5, 18), (129, 463)]])
@@ -196,16 +199,10 @@ def test_flashinfer_prefill_with_paged_kv(
     max_kv_len = max(kv_lens)
     scale = head_size**-0.5
 
-    query = torch.randn(sum(query_lens),
-                        num_query_heads,
-                        head_size,
-                        dtype=dtype)
-    key_value_cache = torch.randn(NUM_BLOCKS,
-                                  2,
-                                  block_size,
-                                  num_kv_heads,
-                                  head_size,
-                                  dtype=dtype)
+    query = torch.randn(sum(query_lens), num_query_heads, head_size, dtype=dtype)
+    key_value_cache = torch.randn(
+        NUM_BLOCKS, 2, block_size, num_kv_heads, head_size, dtype=dtype
+    )
     key_cache = key_value_cache[:, 0, :, :, :].squeeze(1)
     value_cache = key_value_cache[:, 1, :, :, :].squeeze(1)
 
@@ -215,10 +212,9 @@ def test_flashinfer_prefill_with_paged_kv(
     value_cache /= head_size**0.5
 
     max_num_blocks_per_seq = (max_kv_len + block_size - 1) // block_size
-    block_tables = torch.randint(0,
-                                 NUM_BLOCKS,
-                                 (num_seqs, max_num_blocks_per_seq),
-                                 dtype=torch.int32)
+    block_tables = torch.randint(
+        0, NUM_BLOCKS, (num_seqs, max_num_blocks_per_seq), dtype=torch.int32
+    )
 
     qo_indptr = [0]
     kv_indptr = [0]
@@ -242,8 +238,7 @@ def test_flashinfer_prefill_with_paged_kv(
     kv_last_page_lens = torch.tensor(kv_last_page_lens, dtype=torch.int32)
 
     workspace_buffer = torch.empty(128 * 1024 * 1024, dtype=torch.int8)
-    wrapper = flashinfer.BatchPrefillWithPagedKVCacheWrapper(
-        workspace_buffer, "NHD")
+    wrapper = flashinfer.BatchPrefillWithPagedKVCacheWrapper(workspace_buffer, "NHD")
     wrapper.plan(
         qo_indptr,
         kv_indptr,
@@ -264,17 +259,21 @@ def test_flashinfer_prefill_with_paged_kv(
         key_value_cache,
     )
 
-    ref_output = ref_paged_attn(query=query,
-                                key_cache=key_cache,
-                                value_cache=value_cache,
-                                query_lens=query_lens,
-                                kv_lens=kv_lens,
-                                block_tables=block_tables,
-                                scale=scale,
-                                soft_cap=soft_cap,
-                                sliding_window=sliding_window)
-    torch.testing.assert_close(output, ref_output, atol=5e-2, rtol=1e-2), \
-        f"{torch.max(torch.abs(output - ref_output))}"
+    ref_output = ref_paged_attn(
+        query=query,
+        key_cache=key_cache,
+        value_cache=value_cache,
+        query_lens=query_lens,
+        kv_lens=kv_lens,
+        block_tables=block_tables,
+        scale=scale,
+        soft_cap=soft_cap,
+        sliding_window=sliding_window,
+    )
+    (
+        torch.testing.assert_close(output, ref_output, atol=5e-2, rtol=1e-2),
+        f"{torch.max(torch.abs(output - ref_output))}",
+    )
 
 
 @pytest.mark.parametrize("seq_lens", [[(1, 132), (5, 18)]])
@@ -284,9 +283,13 @@ def test_flashinfer_prefill_with_paged_kv(
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("soft_cap", SOFT_CAPS)
 def test_flashinfer_prefill_with_paged_fp8_kv(
-        seq_lens: list[tuple[int, int]], num_heads: tuple[int, int],
-        head_size: int, dtype: torch.dtype, block_size: int,
-        soft_cap: Optional[float]) -> None:
+    seq_lens: list[tuple[int, int]],
+    num_heads: tuple[int, int],
+    head_size: int,
+    dtype: torch.dtype,
+    block_size: int,
+    soft_cap: Optional[float],
+) -> None:
     pytest.skip("TODO: fix the accuracy issue")
     torch.set_default_device("cuda")
     current_platform.seed_everything(0)
@@ -301,17 +304,11 @@ def test_flashinfer_prefill_with_paged_fp8_kv(
 
     kv_cache_dtype = torch.float8_e4m3fn
 
-    query = torch.randn(sum(query_lens),
-                        num_query_heads,
-                        head_size,
-                        dtype=dtype)
+    query = torch.randn(sum(query_lens), num_query_heads, head_size, dtype=dtype)
     NUM_BLOCKS_FP8 = 2048
-    key_value_cache = torch.randn(NUM_BLOCKS_FP8,
-                                  2,
-                                  block_size,
-                                  num_kv_heads,
-                                  head_size,
-                                  dtype=dtype)
+    key_value_cache = torch.randn(
+        NUM_BLOCKS_FP8, 2, block_size, num_kv_heads, head_size, dtype=dtype
+    )
     key_cache, value_cache = torch.chunk(key_value_cache, 2, dim=1)
     key_cache /= head_size**0.5
     value_cache /= head_size**0.5
@@ -319,15 +316,15 @@ def test_flashinfer_prefill_with_paged_fp8_kv(
     k_scale = key_cache.amax().item() / 448.0
     v_scale = value_cache.amax().item() / 448.0
 
-    kv_cache_fp8 = torch.cat([key_cache / k_scale, value_cache / v_scale],
-                             dim=1).to(kv_cache_dtype)
+    kv_cache_fp8 = torch.cat([key_cache / k_scale, value_cache / v_scale], dim=1).to(
+        kv_cache_dtype
+    )
 
-    assert (kv_cache_fp8.shape == key_value_cache.shape)
+    assert kv_cache_fp8.shape == key_value_cache.shape
     max_num_blocks_per_seq = (max_kv_len + block_size - 1) // block_size
-    block_tables = torch.randint(0,
-                                 NUM_BLOCKS_FP8,
-                                 (num_seqs, max_num_blocks_per_seq),
-                                 dtype=torch.int32)
+    block_tables = torch.randint(
+        0, NUM_BLOCKS_FP8, (num_seqs, max_num_blocks_per_seq), dtype=torch.int32
+    )
 
     qo_indptr = [0]
     kv_indptr = [0]
@@ -351,8 +348,7 @@ def test_flashinfer_prefill_with_paged_fp8_kv(
     kv_last_page_lens = torch.tensor(kv_last_page_lens, dtype=torch.int32)
 
     workspace_buffer = torch.empty(128 * 1024 * 1024, dtype=torch.int8)
-    wrapper = flashinfer.BatchPrefillWithPagedKVCacheWrapper(
-        workspace_buffer, "NHD")
+    wrapper = flashinfer.BatchPrefillWithPagedKVCacheWrapper(workspace_buffer, "NHD")
     wrapper.plan(
         qo_indptr,
         kv_indptr,
@@ -369,19 +365,23 @@ def test_flashinfer_prefill_with_paged_fp8_kv(
 
     output = wrapper.run(query, kv_cache_fp8, k_scale=k_scale, v_scale=v_scale)
 
-    ref_output = ref_paged_attn(query=query,
-                                key_cache=key_cache.squeeze(1),
-                                value_cache=value_cache.squeeze(1),
-                                query_lens=query_lens,
-                                kv_lens=kv_lens,
-                                block_tables=block_tables,
-                                scale=scale,
-                                soft_cap=soft_cap)
+    ref_output = ref_paged_attn(
+        query=query,
+        key_cache=key_cache.squeeze(1),
+        value_cache=value_cache.squeeze(1),
+        query_lens=query_lens,
+        kv_lens=kv_lens,
+        block_tables=block_tables,
+        scale=scale,
+        soft_cap=soft_cap,
+    )
     del query
     del block_tables
     # verify prefill fp8
-    torch.testing.assert_close(output, ref_output, atol=5e-2, rtol=1e-2), \
-        f"{torch.max(torch.abs(output - ref_output))}"
+    (
+        torch.testing.assert_close(output, ref_output, atol=5e-2, rtol=1e-2),
+        f"{torch.max(torch.abs(output - ref_output))}",
+    )
 
 
 @pytest.mark.parametrize("kv_lens", [[1328, 18, 463], [1, 54, 293, 70]])
@@ -414,12 +414,9 @@ def test_flashinfer_decode_with_paged_fp8_kv(
 
     query = torch.randn(num_seqs, num_query_heads, head_size, dtype=dtype)
     NUM_BLOCKS_FP8 = 2048
-    key_value_cache = torch.randn(NUM_BLOCKS_FP8,
-                                  2,
-                                  block_size,
-                                  num_kv_heads,
-                                  head_size,
-                                  dtype=dtype)
+    key_value_cache = torch.randn(
+        NUM_BLOCKS_FP8, 2, block_size, num_kv_heads, head_size, dtype=dtype
+    )
     key_cache, value_cache = torch.chunk(key_value_cache, 2, dim=1)
     key_cache /= head_size**0.5
     value_cache /= head_size**0.5
@@ -429,14 +426,13 @@ def test_flashinfer_decode_with_paged_fp8_kv(
 
     key_cache_fp8 = (key_cache / k_scale).to(kv_cache_dtype)
     value_cache_fp8 = (value_cache / v_scale).to(kv_cache_dtype)
-    assert (key_cache_fp8.shape[1] == 1 and value_cache_fp8.shape[1] == 1)
+    assert key_cache_fp8.shape[1] == 1 and value_cache_fp8.shape[1] == 1
     kv_cache_fp8 = torch.cat([key_cache_fp8, value_cache_fp8], dim=1)
 
     max_num_blocks_per_seq = (max_kv_len + block_size - 1) // block_size
-    block_tables = torch.randint(0,
-                                 NUM_BLOCKS_FP8,
-                                 (num_seqs, max_num_blocks_per_seq),
-                                 dtype=torch.int32)
+    block_tables = torch.randint(
+        0, NUM_BLOCKS_FP8, (num_seqs, max_num_blocks_per_seq), dtype=torch.int32
+    )
 
     kv_indptr = [0]
     kv_indices = []
@@ -457,32 +453,38 @@ def test_flashinfer_decode_with_paged_fp8_kv(
     kv_last_page_lens = torch.tensor(kv_last_page_lens, dtype=torch.int32)
 
     workspace_buffer = torch.empty(128 * 1024 * 1024, dtype=torch.int8)
-    wrapper = flashinfer.\
-        BatchDecodeWithPagedKVCacheWrapper(workspace_buffer, "NHD",
-                    use_tensor_cores=use_tensor_cores)
-    wrapper.plan(kv_indptr,
-                 kv_indices,
-                 kv_last_page_lens,
-                 num_query_heads,
-                 num_kv_heads,
-                 head_size,
-                 block_size,
-                 "NONE",
-                 q_data_type=dtype,
-                 kv_data_type=kv_cache_dtype,
-                 logits_soft_cap=soft_cap)
+    wrapper = flashinfer.BatchDecodeWithPagedKVCacheWrapper(
+        workspace_buffer, "NHD", use_tensor_cores=use_tensor_cores
+    )
+    wrapper.plan(
+        kv_indptr,
+        kv_indices,
+        kv_last_page_lens,
+        num_query_heads,
+        num_kv_heads,
+        head_size,
+        block_size,
+        "NONE",
+        q_data_type=dtype,
+        kv_data_type=kv_cache_dtype,
+        logits_soft_cap=soft_cap,
+    )
     output = wrapper.run(query, kv_cache_fp8, k_scale=k_scale, v_scale=v_scale)
     key_cache = key_value_cache[:, 0, :, :, :].squeeze(1)
     value_cache = key_value_cache[:, 1, :, :, :].squeeze(1)
 
-    ref_output = ref_paged_attn(query=query,
-                                key_cache=key_cache,
-                                value_cache=value_cache,
-                                query_lens=[1] * num_seqs,
-                                kv_lens=kv_lens,
-                                block_tables=block_tables,
-                                scale=scale,
-                                soft_cap=soft_cap)
+    ref_output = ref_paged_attn(
+        query=query,
+        key_cache=key_cache,
+        value_cache=value_cache,
+        query_lens=[1] * num_seqs,
+        kv_lens=kv_lens,
+        block_tables=block_tables,
+        scale=scale,
+        soft_cap=soft_cap,
+    )
     # Temporary fix: Increasing the tolerance. Seems like a flashinfer issue
-    torch.testing.assert_close(output, ref_output, atol=2e-2, rtol=1e-2), \
-        f"{torch.max(torch.abs(output - ref_output))}"
+    (
+        torch.testing.assert_close(output, ref_output, atol=2e-2, rtol=1e-2),
+        f"{torch.max(torch.abs(output - ref_output))}",
+    )
diff --git a/tests/kernels/attention/test_flashinfer_mla_decode.py b/tests/kernels/attention/test_flashinfer_mla_decode.py
index 02225432f77f..0350136677c6 100644
--- a/tests/kernels/attention/test_flashinfer_mla_decode.py
+++ b/tests/kernels/attention/test_flashinfer_mla_decode.py
@@ -13,34 +13,29 @@
 if not current_platform.has_device_capability(100):
     pytest.skip(
         reason="FlashInfer MLA Requires compute capability of 10 or above.",
-        allow_module_level=True)
+        allow_module_level=True,
+    )
 
 
 def ref_mla(
-        out: Tensor,  # (bs, num_heads, v_head_dim)
-        query: Tensor,  # (bs, num_heads, head_dim)
-        kv_cache: Tensor,  # (num_blocks, block_size, head_dim)
-        scale: float,
-        block_tables: Tensor,  # (bs, max_num_blocks)
-        seq_lens: Tensor,  # (bs,)
+    out: Tensor,  # (bs, num_heads, v_head_dim)
+    query: Tensor,  # (bs, num_heads, head_dim)
+    kv_cache: Tensor,  # (num_blocks, block_size, head_dim)
+    scale: float,
+    block_tables: Tensor,  # (bs, max_num_blocks)
+    seq_lens: Tensor,  # (bs,)
 ):
     bs, num_heads, v_head_dim = out.shape
     head_dim = query.shape[2]
 
     for i in range(bs):
         # gather and flatten KV-cache
-        kv = kv_cache[
-            block_tables[i]]  # (max_num_blocks, block_size, head_dim)
-        kv = kv.view(1, -1,
-                     head_dim)[:, :seq_lens[i]]  # (1, seq_len, head_dim)
+        kv = kv_cache[block_tables[i]]  # (max_num_blocks, block_size, head_dim)
+        kv = kv.view(1, -1, head_dim)[:, : seq_lens[i]]  # (1, seq_len, head_dim)
         v = kv[:, :, :v_head_dim]
 
         q = query[i].view(num_heads, 1, head_dim)
-        o = F.scaled_dot_product_attention(q,
-                                           kv,
-                                           v,
-                                           scale=scale,
-                                           enable_gqa=True)
+        o = F.scaled_dot_product_attention(q, kv, v, scale=scale, enable_gqa=True)
         out[i] = o.view(num_heads, v_head_dim)
 
     return out
@@ -50,7 +45,7 @@ def ref_mla(
 @pytest.mark.parametrize("bs", [1, 2, 4, 16])
 @pytest.mark.parametrize("block_size", [32, 64])
 def test_flashinfer_mla_decode(dtype: torch.dtype, bs: int, block_size: int):
-    torch.set_default_device('cuda')
+    torch.set_default_device("cuda")
     torch.manual_seed(42)
 
     # Deepseek R1 config
@@ -59,11 +54,11 @@ def test_flashinfer_mla_decode(dtype: torch.dtype, bs: int, block_size: int):
     qk_nope_head_dim = 128
     qk_rope_head_dim = 64
     qk_head_dim = kv_lora_rank + qk_rope_head_dim
-    scale = (qk_nope_head_dim + qk_rope_head_dim)**-0.5
+    scale = (qk_nope_head_dim + qk_rope_head_dim) ** -0.5
 
     MAX_SEQ_LEN = 1024
 
-    seq_lens = [torch.randint(2, MAX_SEQ_LEN, (1, )).item() for _ in range(bs)]
+    seq_lens = [torch.randint(2, MAX_SEQ_LEN, (1,)).item() for _ in range(bs)]
     seq_lens[-1] = MAX_SEQ_LEN
     max_seq_len = max(seq_lens)
     seq_lens_tensor = torch.tensor(seq_lens, dtype=torch.int32)
@@ -86,12 +81,12 @@ def test_flashinfer_mla_decode(dtype: torch.dtype, bs: int, block_size: int):
     block_id = 0
     for i in range(bs):
         num_blocks_needed = blocks_per_seq[i]
-        block_tables[i, :num_blocks_needed] = all_block_ids[block_id:block_id +
-                                                            num_blocks_needed]
+        block_tables[i, :num_blocks_needed] = all_block_ids[
+            block_id : block_id + num_blocks_needed
+        ]
         block_id += num_blocks_needed
 
-    kv_cache = torch.randn(block_tables.numel(), block_size,
-                           qk_head_dim).to(dtype)
+    kv_cache = torch.randn(block_tables.numel(), block_size, qk_head_dim).to(dtype)
     q = torch.randn(bs, num_heads, qk_head_dim).to(dtype)
 
     out_ref = q.new_zeros(bs, num_heads, kv_lora_rank)
diff --git a/tests/kernels/attention/test_flashinfer_trtllm_attention.py b/tests/kernels/attention/test_flashinfer_trtllm_attention.py
index bd3ba554b32e..62d94f0bb751 100644
--- a/tests/kernels/attention/test_flashinfer_trtllm_attention.py
+++ b/tests/kernels/attention/test_flashinfer_trtllm_attention.py
@@ -6,15 +6,18 @@
 import pytest
 import torch
 
-from tests.kernels.quantization.nvfp4_utils import (FLOAT4_E2M1_MAX,
-                                                    FLOAT8_E4M3_MAX,
-                                                    dequantize_nvfp4_to_dtype)
+from tests.kernels.quantization.nvfp4_utils import (
+    FLOAT4_E2M1_MAX,
+    FLOAT8_E4M3_MAX,
+    dequantize_nvfp4_to_dtype,
+)
 from vllm.platforms import current_platform
 from vllm.utils import round_up
 
 if not current_platform.is_device_capability(100):
-    pytest.skip("This TRTLLM kernel requires NVIDIA Blackwell.",
-                allow_module_level=True)
+    pytest.skip(
+        "This TRTLLM kernel requires NVIDIA Blackwell.", allow_module_level=True
+    )
 
 FLOAT32_BYTES = torch.finfo(torch.float).bits // 8
 FP8_DTYPE = current_platform.fp8_dtype()
@@ -64,8 +67,9 @@ def to_float8(x, dtype=torch.float8_e4m3fn):
 @torch.inference_mode
 def test_flashinfer_trtllm_decode_with_baseline(
     dtype: torch.dtype,
-    quant_dtypes: tuple[Optional[torch.dtype], Optional[torch.dtype],
-                        Optional[torch.dtype]],
+    quant_dtypes: tuple[
+        Optional[torch.dtype], Optional[torch.dtype], Optional[torch.dtype]
+    ],
     batch_size: int,
     max_seq_lens: tuple[int, int],
     num_heads: tuple[int, int],
@@ -106,7 +110,7 @@ def test_flashinfer_trtllm_decode_with_baseline(
         q_scale = 1.0
         ref_query = query
 
-    kv_lens = torch.randint(1, max_kv_len, (batch_size, ), dtype=torch.int32)
+    kv_lens = torch.randint(1, max_kv_len, (batch_size,), dtype=torch.int32)
     kv_lens[-1] = max_kv_len
 
     seq_lens = kv_lens
@@ -122,10 +126,9 @@ def test_flashinfer_trtllm_decode_with_baseline(
     k_scale = v_scale = kv_scale
 
     max_num_blocks_per_seq = (max_seq_len + block_size - 1) // block_size
-    block_tables = torch.randint(0,
-                                 NUM_BLOCKS,
-                                 (batch_size, max_num_blocks_per_seq),
-                                 dtype=torch.int32)
+    block_tables = torch.randint(
+        0, NUM_BLOCKS, (batch_size, max_num_blocks_per_seq), dtype=torch.int32
+    )
     kv_indptr = [0]
     kv_indices = []
     kv_last_page_lens = []
@@ -147,20 +150,23 @@ def test_flashinfer_trtllm_decode_with_baseline(
 
     # Baseline Decode
     wrapper = flashinfer.BatchDecodeWithPagedKVCacheWrapper(
-        workspace_buffer, kv_layout, use_tensor_cores=True)
-    wrapper.plan(kv_indptr,
-                 kv_indices,
-                 kv_last_page_lens,
-                 num_qo_heads,
-                 num_kv_heads,
-                 head_size,
-                 block_size,
-                 "NONE",
-                 sm_scale=sm_scale,
-                 q_data_type=dtype,
-                 kv_data_type=dtype,
-                 window_left=window_left,
-                 logits_soft_cap=soft_cap)
+        workspace_buffer, kv_layout, use_tensor_cores=True
+    )
+    wrapper.plan(
+        kv_indptr,
+        kv_indices,
+        kv_last_page_lens,
+        num_qo_heads,
+        num_kv_heads,
+        head_size,
+        block_size,
+        "NONE",
+        sm_scale=sm_scale,
+        q_data_type=dtype,
+        kv_data_type=dtype,
+        window_left=window_left,
+        logits_soft_cap=soft_cap,
+    )
 
     output = torch.empty(ref_query.shape, dtype=dtype)
     wrapper.run(ref_query, ref_kv_cache, out=output)
@@ -169,17 +175,21 @@ def test_flashinfer_trtllm_decode_with_baseline(
     if o_quant_dtype == FP8_DTYPE:
         _, o_scale = to_float8(output)
     elif o_quant_dtype == FP4_DTYPE:
-        o_sf_scale = ((FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) /
-                      torch.amax(output.flatten(), dim=-1)).to(torch.float32)
+        o_sf_scale = (
+            (FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) / torch.amax(output.flatten(), dim=-1)
+        ).to(torch.float32)
 
     # TRTLLM Decode
     if o_quant_dtype == FP4_DTYPE:
         output_trtllm = flashinfer.utils.FP4Tensor(
-            torch.empty(query.shape[:-1] + (query.shape[-1] // 2, ),
-                        dtype=torch.uint8),
-            torch.empty((round_up(query.shape[0], 128),
-                         round_up(query.shape[1] * query.shape[2] // 16, 4)),
-                        dtype=torch.float8_e4m3fn),
+            torch.empty(query.shape[:-1] + (query.shape[-1] // 2,), dtype=torch.uint8),
+            torch.empty(
+                (
+                    round_up(query.shape[0], 128),
+                    round_up(query.shape[1] * query.shape[2] // 16, 4),
+                ),
+                dtype=torch.float8_e4m3fn,
+            ),
         )
     else:
         output_trtllm = torch.empty(query.shape, dtype=o_quant_dtype)
@@ -201,13 +211,12 @@ def test_flashinfer_trtllm_decode_with_baseline(
         output_trtllm = output_trtllm.to(dtype) * o_scale
     elif o_quant_dtype == FP4_DTYPE:
         output_trtllm.data = output_trtllm.data.reshape(
-            -1, query.shape[1] * query.shape[2] // 2)
-        output_trtllm = dequantize_nvfp4_to_dtype(output_trtllm.data,
-                                                  output_trtllm.scale,
-                                                  o_sf_scale, dtype,
-                                                  query.device)
-        output_trtllm = output_trtllm.reshape(-1, query.shape[1],
-                                              query.shape[2])
+            -1, query.shape[1] * query.shape[2] // 2
+        )
+        output_trtllm = dequantize_nvfp4_to_dtype(
+            output_trtllm.data, output_trtllm.scale, o_sf_scale, dtype, query.device
+        )
+        output_trtllm = output_trtllm.reshape(-1, query.shape[1], query.shape[2])
 
     if q_quant_dtype == FP8_DTYPE and o_quant_dtype == FP4_DTYPE:
         rtol, atol = 3e-1, 1e0
@@ -216,8 +225,10 @@ def test_flashinfer_trtllm_decode_with_baseline(
     else:
         rtol, atol = 1e-2, 2e-2
 
-    torch.testing.assert_close(output, output_trtllm, atol=atol, rtol=rtol), \
-        f"{torch.max(torch.abs(output - output_trtllm))}"
+    (
+        torch.testing.assert_close(output, output_trtllm, atol=atol, rtol=rtol),
+        f"{torch.max(torch.abs(output - output_trtllm))}",
+    )
 
 
 @pytest.mark.parametrize("dtype", DTYPE)
@@ -233,8 +244,9 @@ def test_flashinfer_trtllm_decode_with_baseline(
 @torch.inference_mode
 def test_flashinfer_trtllm_prefill_with_baseline(
     dtype: torch.dtype,
-    quant_dtypes: tuple[Optional[torch.dtype], Optional[torch.dtype],
-                        Optional[torch.dtype]],
+    quant_dtypes: tuple[
+        Optional[torch.dtype], Optional[torch.dtype], Optional[torch.dtype]
+    ],
     batch_size: int,
     max_seq_lens: tuple[int, int],
     num_heads: tuple[int, int],
@@ -270,17 +282,16 @@ def test_flashinfer_trtllm_prefill_with_baseline(
     else:
         raise ValueError(f"Invalid kv_layout: {kv_layout}")
 
-    q_lens = torch.randint(1, max_q_len, (batch_size, ), dtype=torch.int32)
+    q_lens = torch.randint(1, max_q_len, (batch_size,), dtype=torch.int32)
     q_lens[-1] = max_q_len
-    q_indptr = torch.cat([
-        torch.tensor([0], dtype=torch.int32),
-        torch.cumsum(q_lens, dim=0, dtype=torch.int32),
-    ])
-
-    query = torch.randn(torch.sum(q_lens).item(),
-                        num_qo_heads,
-                        head_size,
-                        dtype=dtype)
+    q_indptr = torch.cat(
+        [
+            torch.tensor([0], dtype=torch.int32),
+            torch.cumsum(q_lens, dim=0, dtype=torch.int32),
+        ]
+    )
+
+    query = torch.randn(torch.sum(q_lens).item(), num_qo_heads, head_size, dtype=dtype)
     if q_quant_dtype == FP8_DTYPE:
         query, q_scale = to_float8(query)
         ref_query = query.to(dtype) * q_scale
@@ -288,7 +299,7 @@ def test_flashinfer_trtllm_prefill_with_baseline(
         q_scale = 1.0
         ref_query = query
 
-    kv_lens = torch.randint(0, max_kv_len, (batch_size, ), dtype=torch.int32)
+    kv_lens = torch.randint(0, max_kv_len, (batch_size,), dtype=torch.int32)
     kv_lens[-1] = max_kv_len
 
     seq_lens = kv_lens + q_lens
@@ -304,10 +315,9 @@ def test_flashinfer_trtllm_prefill_with_baseline(
     k_scale = v_scale = kv_scale
 
     max_num_blocks_per_seq = (max_seq_len + block_size - 1) // block_size
-    block_tables = torch.randint(0,
-                                 NUM_BLOCKS,
-                                 (batch_size, max_num_blocks_per_seq),
-                                 dtype=torch.int32)
+    block_tables = torch.randint(
+        0, NUM_BLOCKS, (batch_size, max_num_blocks_per_seq), dtype=torch.int32
+    )
     kv_indptr = [0]
     kv_indices = []
     kv_last_page_lens = []
@@ -329,21 +339,24 @@ def test_flashinfer_trtllm_prefill_with_baseline(
 
     # Baseline Prefill
     wrapper = flashinfer.BatchPrefillWithPagedKVCacheWrapper(
-        workspace_buffer, kv_layout)
-    wrapper.plan(q_indptr,
-                 kv_indptr,
-                 kv_indices,
-                 kv_last_page_lens,
-                 num_qo_heads,
-                 num_kv_heads,
-                 head_size,
-                 block_size,
-                 causal=True,
-                 sm_scale=sm_scale,
-                 q_data_type=dtype,
-                 kv_data_type=dtype,
-                 window_left=window_left,
-                 logits_soft_cap=soft_cap)
+        workspace_buffer, kv_layout
+    )
+    wrapper.plan(
+        q_indptr,
+        kv_indptr,
+        kv_indices,
+        kv_last_page_lens,
+        num_qo_heads,
+        num_kv_heads,
+        head_size,
+        block_size,
+        causal=True,
+        sm_scale=sm_scale,
+        q_data_type=dtype,
+        kv_data_type=dtype,
+        window_left=window_left,
+        logits_soft_cap=soft_cap,
+    )
 
     output = torch.empty(ref_query.shape, dtype=dtype)
     wrapper.run(ref_query, ref_kv_cache, out=output)
@@ -352,17 +365,21 @@ def test_flashinfer_trtllm_prefill_with_baseline(
     if o_quant_dtype == FP8_DTYPE:
         _, o_scale = to_float8(output)
     elif o_quant_dtype == FP4_DTYPE:
-        o_sf_scale = ((FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) /
-                      torch.amax(output.flatten(), dim=-1)).to(torch.float32)
+        o_sf_scale = (
+            (FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) / torch.amax(output.flatten(), dim=-1)
+        ).to(torch.float32)
 
     # TRTLLM Prefill
     if o_quant_dtype == FP4_DTYPE:
         output_trtllm = flashinfer.utils.FP4Tensor(
-            torch.empty(query.shape[:-1] + (query.shape[-1] // 2, ),
-                        dtype=torch.uint8),
-            torch.empty((round_up(query.shape[0], 128),
-                         round_up(query.shape[1] * query.shape[2] // 16, 4)),
-                        dtype=torch.float8_e4m3fn),
+            torch.empty(query.shape[:-1] + (query.shape[-1] // 2,), dtype=torch.uint8),
+            torch.empty(
+                (
+                    round_up(query.shape[0], 128),
+                    round_up(query.shape[1] * query.shape[2] // 16, 4),
+                ),
+                dtype=torch.float8_e4m3fn,
+            ),
         )
     else:
         output_trtllm = torch.empty(query.shape, dtype=o_quant_dtype)
@@ -388,13 +405,12 @@ def test_flashinfer_trtllm_prefill_with_baseline(
         output_trtllm = output_trtllm.to(dtype) * o_scale
     elif o_quant_dtype == FP4_DTYPE:
         output_trtllm.data = output_trtllm.data.reshape(
-            -1, query.shape[1] * query.shape[2] // 2)
-        output_trtllm = dequantize_nvfp4_to_dtype(output_trtllm.data,
-                                                  output_trtllm.scale,
-                                                  o_sf_scale, dtype,
-                                                  query.device)
-        output_trtllm = output_trtllm.reshape(-1, query.shape[1],
-                                              query.shape[2])
+            -1, query.shape[1] * query.shape[2] // 2
+        )
+        output_trtllm = dequantize_nvfp4_to_dtype(
+            output_trtllm.data, output_trtllm.scale, o_sf_scale, dtype, query.device
+        )
+        output_trtllm = output_trtllm.reshape(-1, query.shape[1], query.shape[2])
 
     if q_quant_dtype == FP8_DTYPE and o_quant_dtype == FP4_DTYPE:
         rtol, atol = 4e-1, 1e0
@@ -405,5 +421,7 @@ def test_flashinfer_trtllm_prefill_with_baseline(
     else:
         rtol, atol = 1e-2, 1e-2
 
-    torch.testing.assert_close(output, output_trtllm, atol=atol, rtol=rtol), \
-        f"{torch.max(torch.abs(output - output_trtllm))}"
+    (
+        torch.testing.assert_close(output, output_trtllm, atol=atol, rtol=rtol),
+        f"{torch.max(torch.abs(output - output_trtllm))}",
+    )
diff --git a/tests/kernels/attention/test_flashmla.py b/tests/kernels/attention/test_flashmla.py
index bddd7e5c50ed..57fd195d55f8 100644
--- a/tests/kernels/attention/test_flashmla.py
+++ b/tests/kernels/attention/test_flashmla.py
@@ -7,30 +7,33 @@
 import pytest
 import torch
 
-from vllm.attention.ops.flashmla import (flash_mla_with_kvcache,
-                                         get_mla_metadata,
-                                         is_flashmla_supported)
+from vllm.attention.ops.flashmla import (
+    flash_mla_with_kvcache,
+    get_mla_metadata,
+    is_flashmla_supported,
+)
 from vllm.triton_utils import triton
 
 
-def cal_diff(x: torch.Tensor,
-             y: torch.Tensor,
-             name: str,
-             use_fp8: bool = False) -> None:
+def cal_diff(
+    x: torch.Tensor, y: torch.Tensor, name: str, use_fp8: bool = False
+) -> None:
     x, y = x.double(), y.double()
-    cos_diff = 1 - 2 * (x * y).sum().item() / max(
-        (x * x + y * y).sum().item(), 1e-12)
-    if (use_fp8):
+    cos_diff = 1 - 2 * (x * y).sum().item() / max((x * x + y * y).sum().item(), 1e-12)
+    if use_fp8:
         assert cos_diff < 1e-4
     else:
         assert cos_diff < 1e-5
 
-FLASH_MLA_UNSUPPORTED_REASON = is_flashmla_supported()[1] \
-    if not is_flashmla_supported()[0] else "FlashMLA is supported"
+
+FLASH_MLA_UNSUPPORTED_REASON = (
+    is_flashmla_supported()[1]
+    if not is_flashmla_supported()[0]
+    else "FlashMLA is supported"
+)
 
 
-@pytest.mark.skipif(not is_flashmla_supported()[0],
-                    reason=FLASH_MLA_UNSUPPORTED_REASON)
+@pytest.mark.skipif(not is_flashmla_supported()[0], reason=FLASH_MLA_UNSUPPORTED_REASON)
 @pytest.mark.parametrize("b", [128])
 @pytest.mark.parametrize("s_q", [1, 2])
 @pytest.mark.parametrize("mean_sk", [4096, 8192, 16384])
@@ -41,11 +44,13 @@ def cal_diff(x: torch.Tensor,
 @pytest.mark.parametrize("block_size", [64])
 @pytest.mark.parametrize("causal", [True])
 @pytest.mark.parametrize("varlen", [False, True])
-@pytest.mark.parametrize("torch_dtype",
-                         [torch.bfloat16, torch.float16, torch.float8_e4m3fn])
+@pytest.mark.parametrize(
+    "torch_dtype", [torch.bfloat16, torch.float16, torch.float8_e4m3fn]
+)
 @torch.inference_mode()
-def test_flash_mla(b, s_q, mean_sk, h_q, h_kv, d, dv, block_size, causal,
-                   varlen, torch_dtype):
+def test_flash_mla(
+    b, s_q, mean_sk, h_q, h_kv, d, dv, block_size, causal, varlen, torch_dtype
+):
     device = torch.device("cuda:0")
     if torch_dtype == torch.float8_e4m3fn:
         init_dtype = torch.bfloat16
@@ -57,31 +62,34 @@ def test_flash_mla(b, s_q, mean_sk, h_q, h_kv, d, dv, block_size, causal,
     torch.manual_seed(0)
     random.seed(0)
 
-    print(f"{b=}, {s_q=}, {mean_sk=}, {h_q=}, {h_kv=}, "
-          f"{d=}, {dv=}, {causal=}, {varlen=}, {torch_dtype=}")
+    print(
+        f"{b=}, {s_q=}, {mean_sk=}, {h_q=}, {h_kv=}, "
+        f"{d=}, {dv=}, {causal=}, {varlen=}, {torch_dtype=}"
+    )
 
     use_fp8 = torch_dtype == torch.float8_e4m3fn
-    cache_seqlens = torch.full((b, ), mean_sk, dtype=torch.int32)
+    cache_seqlens = torch.full((b,), mean_sk, dtype=torch.int32)
     if varlen:
         for i in range(b):
-            cache_seqlens[i] = max(random.normalvariate(mean_sk, mean_sk / 2),
-                                   s_q)
+            cache_seqlens[i] = max(random.normalvariate(mean_sk, mean_sk / 2), s_q)
     total_seqlens = cache_seqlens.sum().item()
     max_seqlen = cache_seqlens.max().item()
     max_seqlen_pad = triton.cdiv(max_seqlen, 256) * 256
 
     q = torch.randn(b, s_q, h_q, d)
-    block_table = torch.arange(b * max_seqlen_pad // block_size,
-                               dtype=torch.int32).view(
-                                   b, max_seqlen_pad // block_size)
+    block_table = torch.arange(
+        b * max_seqlen_pad // block_size, dtype=torch.int32
+    ).view(b, max_seqlen_pad // block_size)
     blocked_k = torch.randn(block_table.numel(), block_size, h_kv, d)
     for i in range(b):
-        blocked_k.view(b, max_seqlen_pad, h_kv,
-                       d)[i, cache_seqlens[i].item():] = float("nan")
+        blocked_k.view(b, max_seqlen_pad, h_kv, d)[i, cache_seqlens[i].item() :] = (
+            float("nan")
+        )
     blocked_v = blocked_k[..., :dv]
 
     tile_scheduler_metadata, num_splits = get_mla_metadata(
-        cache_seqlens, s_q * h_q // h_kv, h_kv)
+        cache_seqlens, s_q * h_q // h_kv, h_kv
+    )
 
     init_dtype = q.dtype
     if use_fp8:
@@ -97,16 +105,18 @@ def test_flash_mla(b, s_q, mean_sk, h_q, h_kv, d, dv, block_size, causal,
         descale_k = None
 
     def flash_mla():
-        return flash_mla_with_kvcache(q,
-                                      blocked_k,
-                                      block_table,
-                                      cache_seqlens,
-                                      dv,
-                                      tile_scheduler_metadata,
-                                      num_splits,
-                                      causal=causal,
-                                      descale_q=descale_q,
-                                      descale_k=descale_k)
+        return flash_mla_with_kvcache(
+            q,
+            blocked_k,
+            block_table,
+            cache_seqlens,
+            dv,
+            tile_scheduler_metadata,
+            num_splits,
+            causal=causal,
+            descale_q=descale_q,
+            descale_k=descale_k,
+        )
 
     def scaled_dot_product_attention(query, key, value, is_causal=False):
         query = query.float()
@@ -119,8 +129,7 @@ def scaled_dot_product_attention(query, key, value, is_causal=False):
             s_q = query.shape[-2]
             s_k = key.shape[-2]
             attn_bias = torch.zeros(s_q, s_k, dtype=query.dtype)
-            temp_mask = torch.ones(s_q, s_k,
-                                   dtype=torch.bool).tril(diagonal=s_k - s_q)
+            temp_mask = torch.ones(s_q, s_k, dtype=torch.bool).tril(diagonal=s_k - s_q)
             attn_bias.masked_fill_(temp_mask.logical_not(), float("-inf"))
             attn_bias.to(query.dtype)
             attn_weight += attn_bias
@@ -130,10 +139,16 @@ def scaled_dot_product_attention(query, key, value, is_causal=False):
 
     def ref_mla():
         q_ = (q.to(torch.float) * descale_q).to(init_dtype) if use_fp8 else q
-        blocked_k_ = (blocked_k.to(torch.float) *
-                      descale_k).to(init_dtype) if use_fp8 else blocked_k
-        blocked_v_ = (blocked_v.to(torch.float) *
-                      descale_k).to(init_dtype) if use_fp8 else blocked_v
+        blocked_k_ = (
+            (blocked_k.to(torch.float) * descale_k).to(init_dtype)
+            if use_fp8
+            else blocked_k
+        )
+        blocked_v_ = (
+            (blocked_v.to(torch.float) * descale_k).to(init_dtype)
+            if use_fp8
+            else blocked_v
+        )
         out = torch.empty(b, s_q, h_q, dv, dtype=torch.float32)
         lse = torch.empty(b, h_q, s_q, dtype=torch.float32)
         for i in range(b):
@@ -156,8 +171,9 @@ def ref_mla():
 
     t = triton.testing.do_bench(flash_mla)
     FLOPS = s_q * total_seqlens * h_q * (d + dv) * 2
-    bytes = (total_seqlens * h_kv * d +
-             b * s_q * h_q * d) * (torch.finfo(torch_dtype).bits // 8) + (
-                 b * s_q * h_q * dv) * (torch.finfo(init_dtype).bits // 8)
-    print(f"{t:.3f} ms, {FLOPS / 10 ** 9 / t:.0f} TFLOPS,",
-          f"{bytes / 10 ** 6 / t:.0f} GB/s")
+    bytes = (total_seqlens * h_kv * d + b * s_q * h_q * d) * (
+        torch.finfo(torch_dtype).bits // 8
+    ) + (b * s_q * h_q * dv) * (torch.finfo(init_dtype).bits // 8)
+    print(
+        f"{t:.3f} ms, {FLOPS / 10**9 / t:.0f} TFLOPS,", f"{bytes / 10**6 / t:.0f} GB/s"
+    )
diff --git a/tests/kernels/attention/test_flashmla_sparse.py b/tests/kernels/attention/test_flashmla_sparse.py
index 9036e4e7800b..562ae3009e41 100644
--- a/tests/kernels/attention/test_flashmla_sparse.py
+++ b/tests/kernels/attention/test_flashmla_sparse.py
@@ -13,6 +13,7 @@ def _cuda_sm90_available() -> bool:
 
 def test_sparse_flashmla_metadata_smoke():
     import vllm.attention.ops.flashmla as fm
+
     ok, reason = fm.is_flashmla_supported()
     if not ok or not _cuda_sm90_available():
         pytest.skip(reason or "SM90 not available")
@@ -27,18 +28,21 @@ def test_sparse_flashmla_metadata_smoke():
 
     cache_seqlens = torch.zeros(batch_size, dtype=torch.int32, device=device)
 
-    tile_md, num_splits = fm.get_mla_metadata(cache_seqlens,
-                                              q_seq_per_hk,
-                                              num_heads_k,
-                                              num_heads_q=num_heads_q,
-                                              topk=topk,
-                                              is_fp8_kvcache=True)
+    tile_md, num_splits = fm.get_mla_metadata(
+        cache_seqlens,
+        q_seq_per_hk,
+        num_heads_k,
+        num_heads_q=num_heads_q,
+        topk=topk,
+        is_fp8_kvcache=True,
+    )
     assert tile_md.dtype == torch.int32
     assert num_splits.dtype == torch.int32
 
 
 def test_sparse_flashmla_decode_smoke():
     import vllm.attention.ops.flashmla as fm
+
     ok, reason = fm.is_flashmla_supported()
     if not ok or not _cuda_sm90_available():
         pytest.skip(reason or "SM90 not available")
@@ -58,36 +62,42 @@ def test_sparse_flashmla_decode_smoke():
     q_seq_per_hk = seqlen_q * num_heads_q // num_heads_k
     # q_heads_per_hk = num_heads_q // num_heads_k
     cache_seqlens = torch.zeros(batch_size, dtype=torch.int32, device=device)
-    tile_md, num_splits = fm.get_mla_metadata(cache_seqlens,
-                                              q_seq_per_hk,
-                                              num_heads_k,
-                                              num_heads_q=num_heads_q,
-                                              topk=topk,
-                                              is_fp8_kvcache=True)
+    tile_md, num_splits = fm.get_mla_metadata(
+        cache_seqlens,
+        q_seq_per_hk,
+        num_heads_k,
+        num_heads_q=num_heads_q,
+        topk=topk,
+        is_fp8_kvcache=True,
+    )
 
     # Inputs
-    q = torch.zeros((batch_size, seqlen_q, num_heads_q, head_dim_k),
-                    dtype=torch.bfloat16,
-                    device=device)
-    k_cache = torch.zeros((1, page_block_size, num_heads_k, bytes_per_token),
-                          dtype=torch.uint8,
-                          device=device)
-    indices = torch.zeros((batch_size, seqlen_q, topk),
-                          dtype=torch.int32,
-                          device=device)
-
-    block_table = torch.zeros((batch_size, 128),
-                              dtype=torch.int32,
-                              device=device)
-    out, lse = fm.flash_mla_with_kvcache(q,
-                                         k_cache,
-                                         block_table,
-                                         cache_seqlens,
-                                         head_dim_v,
-                                         tile_md,
-                                         num_splits,
-                                         indices=indices,
-                                         is_fp8_kvcache=True)
+    q = torch.zeros(
+        (batch_size, seqlen_q, num_heads_q, head_dim_k),
+        dtype=torch.bfloat16,
+        device=device,
+    )
+    k_cache = torch.zeros(
+        (1, page_block_size, num_heads_k, bytes_per_token),
+        dtype=torch.uint8,
+        device=device,
+    )
+    indices = torch.zeros(
+        (batch_size, seqlen_q, topk), dtype=torch.int32, device=device
+    )
+
+    block_table = torch.zeros((batch_size, 128), dtype=torch.int32, device=device)
+    out, lse = fm.flash_mla_with_kvcache(
+        q,
+        k_cache,
+        block_table,
+        cache_seqlens,
+        head_dim_v,
+        tile_md,
+        num_splits,
+        indices=indices,
+        is_fp8_kvcache=True,
+    )
     assert out.shape[0] == batch_size
     assert out.shape[-1] == head_dim_v
     assert lse.shape[0] == batch_size
@@ -95,6 +105,7 @@ def test_sparse_flashmla_decode_smoke():
 
 def test_sparse_flashmla_prefill_smoke():
     import vllm.attention.ops.flashmla as fm
+
     ok, reason = fm.is_flashmla_supported()
     if not ok or not _cuda_sm90_available():
         pytest.skip(reason or "SM90 not available")
@@ -112,8 +123,7 @@ def test_sparse_flashmla_prefill_smoke():
     kv = torch.zeros((s_kv, h_kv, d_qk), dtype=torch.bfloat16, device=device)
     indices = torch.zeros((s_q, h_kv, topk), dtype=torch.int32, device=device)
 
-    out, max_logits, lse = fm.flash_mla_sparse_prefill(q, kv, indices, 1.0,
-                                                       d_v)
+    out, max_logits, lse = fm.flash_mla_sparse_prefill(q, kv, indices, 1.0, d_v)
     assert out.shape == (s_q, h_q, d_v)
     assert max_logits.shape == (s_q, h_q)
     assert lse.shape == (s_q, h_q)
diff --git a/tests/kernels/attention/test_lightning_attn.py b/tests/kernels/attention/test_lightning_attn.py
index de45ee1ed5cc..0e3da986299e 100644
--- a/tests/kernels/attention/test_lightning_attn.py
+++ b/tests/kernels/attention/test_lightning_attn.py
@@ -4,8 +4,7 @@
 import pytest
 import torch
 
-from vllm.model_executor.layers.lightning_attn import (
-    linear_decode_forward_triton)
+from vllm.model_executor.layers.lightning_attn import linear_decode_forward_triton
 from vllm.platforms import current_platform
 
 NUM_HEADS = [4, 8]
@@ -17,8 +16,8 @@
 
 def reference_lightning_attention(q, k, v, ed, block_size, kv_history):
     """Reference implementation of lightning attention core algorithm
-    
-    The difference from the main implementation is that this processes 
+
+    The difference from the main implementation is that this processes
     each step sequentially, instead of using parallelized triton kernels
     """
     B, H, S, D = q.shape
@@ -62,8 +61,7 @@ def reference_lightning_attention(q, k, v, ed, block_size, kv_history):
     # The actual implementation returns a tensor of shape [B, H, 2, D, E]
     # where dimension 2 contains both KV and KV history
     kv_reshaped = kv_cache.unsqueeze(2)  # [B, H, 1, D, E]
-    final_kv_cache = torch.cat([kv_reshaped, kv_reshaped],
-                               dim=2)  # [B, H, 2, D, E]
+    final_kv_cache = torch.cat([kv_reshaped, kv_reshaped], dim=2)  # [B, H, 2, D, E]
 
     return output, final_kv_cache
 
@@ -109,7 +107,7 @@ def reference_linear_decode(q, k, v, kv_caches, slope_rate, slot_idx):
             out_h = torch.matmul(q_bh, kv_new)
 
             # Update output and cache
-            output[b, h * D:(h + 1) * D] = out_h
+            output[b, h * D : (h + 1) * D] = out_h
             kv_caches[b, h] = kv_new
 
     return output
@@ -135,12 +133,9 @@ def test_linear_decode_forward_triton(
     k = base * torch.randn(batch_size, num_heads, 1, head_size, dtype=dtype)
     v = base * torch.randn(batch_size, num_heads, 1, head_size, dtype=dtype)
 
-    kv_caches = base * torch.randn(batch_size,
-                                   num_heads,
-                                   head_size,
-                                   head_size,
-                                   dtype=dtype,
-                                   device="cuda")
+    kv_caches = base * torch.randn(
+        batch_size, num_heads, head_size, head_size, dtype=dtype, device="cuda"
+    )
 
     kv_caches_copy = kv_caches.clone()
 
@@ -150,15 +145,14 @@ def test_linear_decode_forward_triton(
 
     slot_idx = torch.arange(batch_size, device="cuda")
 
-    triton_output = linear_decode_forward_triton(q, k, v, kv_caches,
-                                                 slope_rate, slot_idx)
+    triton_output = linear_decode_forward_triton(
+        q, k, v, kv_caches, slope_rate, slot_idx
+    )
 
-    reference_output = reference_linear_decode(q, k, v, kv_caches_copy,
-                                               slope_rate, slot_idx)
-    torch.testing.assert_close(triton_output,
-                               reference_output,
-                               rtol=1e-1,
-                               atol=1e-1)
+    reference_output = reference_linear_decode(
+        q, k, v, kv_caches_copy, slope_rate, slot_idx
+    )
+    torch.testing.assert_close(triton_output, reference_output, rtol=1e-1, atol=1e-1)
     torch.testing.assert_close(kv_caches, kv_caches_copy, rtol=1e-1, atol=1e-1)
 
     assert triton_output.shape == (batch_size, num_heads * head_size)
@@ -184,12 +178,9 @@ def test_linear_decode_forward_triton_with_padding(
     k = base * torch.randn(batch_size, num_heads, 1, head_size, dtype=dtype)
     v = base * torch.randn(batch_size, num_heads, 1, head_size, dtype=dtype)
 
-    kv_caches = base * torch.randn(batch_size,
-                                   num_heads,
-                                   head_size,
-                                   head_size,
-                                   dtype=dtype,
-                                   device="cuda")
+    kv_caches = base * torch.randn(
+        batch_size, num_heads, head_size, head_size, dtype=dtype, device="cuda"
+    )
 
     kv_caches_copy = kv_caches.clone()
 
@@ -199,14 +190,15 @@ def test_linear_decode_forward_triton_with_padding(
 
     slot_idx = torch.tensor([0, 1, -1, 2], device="cuda")
 
-    triton_output = linear_decode_forward_triton(q, k, v, kv_caches,
-                                                 slope_rate, slot_idx)
+    triton_output = linear_decode_forward_triton(
+        q, k, v, kv_caches, slope_rate, slot_idx
+    )
 
-    reference_output = reference_linear_decode(q, k, v, kv_caches_copy,
-                                               slope_rate, slot_idx)
+    reference_output = reference_linear_decode(
+        q, k, v, kv_caches_copy, slope_rate, slot_idx
+    )
 
-    padding_mask = (slot_idx
-                    != -1).unsqueeze(1).expand(-1, num_heads * head_size)
+    padding_mask = (slot_idx != -1).unsqueeze(1).expand(-1, num_heads * head_size)
 
     triton_masked = triton_output[padding_mask]
     reference_masked = reference_output[padding_mask]
@@ -217,15 +209,11 @@ def test_linear_decode_forward_triton_with_padding(
 
     for i in range(batch_size):
         if valid_indices[i] > 0:
-            torch.testing.assert_close(kv_caches[i],
-                                       kv_caches_copy[i],
-                                       rtol=rtol,
-                                       atol=atol)
+            torch.testing.assert_close(
+                kv_caches[i], kv_caches_copy[i], rtol=rtol, atol=atol
+            )
 
-    torch.testing.assert_close(triton_masked,
-                               reference_masked,
-                               rtol=rtol,
-                               atol=atol)
+    torch.testing.assert_close(triton_masked, reference_masked, rtol=rtol, atol=atol)
 
     assert triton_output.shape == (batch_size, num_heads * head_size)
 
@@ -249,39 +237,33 @@ def test_lightning_attention_reference(
     current_platform.seed_everything(42)
 
     base = 0.01
-    q = base * torch.randn(
-        batch_size, num_heads, seq_len, head_size, dtype=dtype)
-    k = base * torch.randn(
-        batch_size, num_heads, seq_len, head_size, dtype=dtype)
-    v = base * torch.randn(
-        batch_size, num_heads, seq_len, head_size, dtype=dtype)
+    q = base * torch.randn(batch_size, num_heads, seq_len, head_size, dtype=dtype)
+    k = base * torch.randn(batch_size, num_heads, seq_len, head_size, dtype=dtype)
+    v = base * torch.randn(batch_size, num_heads, seq_len, head_size, dtype=dtype)
 
     ed = torch.zeros(num_heads, device="cuda")
     for h in range(num_heads):
         ed[h] = 0.1 * (h + 1)
 
-    kv_history = base * torch.randn(batch_size,
-                                    num_heads,
-                                    head_size,
-                                    head_size,
-                                    dtype=dtype,
-                                    device="cuda")
+    kv_history = base * torch.randn(
+        batch_size, num_heads, head_size, head_size, dtype=dtype, device="cuda"
+    )
 
     kv_history_clone = kv_history.clone()
 
     ref_output, ref_kv_cache = reference_lightning_attention(
-        q, k, v, ed, 256, kv_history)
+        q, k, v, ed, 256, kv_history
+    )
 
     from vllm.model_executor.layers.lightning_attn import lightning_attention
+
     actual_output, actual_kv_cache = lightning_attention(
-        q, k, v, ed, 256, kv_history_clone)
+        q, k, v, ed, 256, kv_history_clone
+    )
 
     atol, rtol = 1.5e-1, 1.5e-1
     torch.testing.assert_close(ref_output, actual_output, rtol=rtol, atol=atol)
-    torch.testing.assert_close(ref_kv_cache,
-                               actual_kv_cache,
-                               rtol=rtol,
-                               atol=atol)
+    torch.testing.assert_close(ref_kv_cache, actual_kv_cache, rtol=rtol, atol=atol)
 
     assert ref_output.shape == (batch_size, num_heads, seq_len, head_size)
     assert ref_kv_cache.shape == actual_kv_cache.shape
diff --git a/tests/kernels/attention/test_merge_attn_states.py b/tests/kernels/attention/test_merge_attn_states.py
index 9d1a301ebe30..eb9204dfaf15 100644
--- a/tests/kernels/attention/test_merge_attn_states.py
+++ b/tests/kernels/attention/test_merge_attn_states.py
@@ -7,19 +7,20 @@
 
 from vllm._custom_ops import merge_attn_states as merge_attn_states_cuda
 from vllm.attention.ops.triton_merge_attn_states import (
-    merge_attn_states as merge_attn_states_triton)
+    merge_attn_states as merge_attn_states_triton,
+)
 from vllm.platforms import current_platform
 
 
 # Naive PyTorch Implements section 2.2 of https://www.arxiv.org/pdf/2501.01005
 # can be used to combine partial attention results (in the split-KV case)
 def merge_attn_states_torch(
-        output: torch.Tensor,  # [NUM_TOKENS, NUM_HEADS, HEAD_SIZE]
-        prefix_output: torch.Tensor,  # [NUM_TOKENS, NUM_HEADS, HEAD_SIZE]
-        prefix_lse: torch.Tensor,  # [NUM_HEADS, NUM_TOKENS]
-        suffix_output: torch.Tensor,  # [NUM_TOKENS, NUM_HEADS, HEAD_SIZE]
-        suffix_lse: torch.Tensor,  # [NUM_HEADS, NUM_TOKENS]
-        output_lse: Optional[torch.Tensor] = None,  # [NUM_HEADS, NUM_TOKENS]
+    output: torch.Tensor,  # [NUM_TOKENS, NUM_HEADS, HEAD_SIZE]
+    prefix_output: torch.Tensor,  # [NUM_TOKENS, NUM_HEADS, HEAD_SIZE]
+    prefix_lse: torch.Tensor,  # [NUM_HEADS, NUM_TOKENS]
+    suffix_output: torch.Tensor,  # [NUM_TOKENS, NUM_HEADS, HEAD_SIZE]
+    suffix_lse: torch.Tensor,  # [NUM_HEADS, NUM_TOKENS]
+    output_lse: Optional[torch.Tensor] = None,  # [NUM_HEADS, NUM_TOKENS]
 ):
     p_lse = prefix_lse
     s_lse = suffix_lse
@@ -32,15 +33,13 @@ def merge_attn_states_torch(
     s_lse = s_lse - max_lse
     p_lse_exp = torch.exp(p_lse)
     s_lse_exp = torch.exp(s_lse)
-    out_se = (p_lse_exp + s_lse_exp)
+    out_se = p_lse_exp + s_lse_exp
     if output_lse is not None:
         output_lse = torch.log(out_se) + max_lse
     p_scale = p_lse_exp / out_se  # [NUM_HEADS, NUM_TOKENS]
     s_scale = s_lse_exp / out_se  # [NUM_HEADS, NUM_TOKENS]
-    p_scale = torch.transpose(p_scale, 0,
-                              1).unsqueeze(2)  # [NUM_TOKENS, NUM_HEADS, 1]
-    s_scale = torch.transpose(s_scale, 0,
-                              1).unsqueeze(2)  # [NUM_TOKENS, NUM_HEADS, 1]
+    p_scale = torch.transpose(p_scale, 0, 1).unsqueeze(2)  # [NUM_TOKENS, NUM_HEADS, 1]
+    s_scale = torch.transpose(s_scale, 0, 1).unsqueeze(2)  # [NUM_TOKENS, NUM_HEADS, 1]
     output = prefix_output * p_scale + suffix_output * s_scale
     return output, output_lse
 
@@ -55,8 +54,10 @@ def merge_attn_states_torch(
 
 def generate_markdown_table():
     global all_case_info
-    table_header = ("| tokens | heads | headsize | dtype "
-                    "| device | torch | triton | cuda | speedup |")
+    table_header = (
+        "| tokens | heads | headsize | dtype "
+        "| device | torch | triton | cuda | speedup |"
+    )
     table_separator = "| --- | --- | --- | --- | --- | --- | --- | --- | --- |"
 
     def shortly_dtype(dtype: torch.dtype) -> str:
@@ -68,16 +69,26 @@ def shortly_device(device: str) -> str:
     print(table_header)
     print(table_separator)
     for info in all_case_info:
-        (num_tokens, num_heads, head_size, dtype, device,
-         avg_time_torch_kernel, avg_time_triton_kernel, avg_time_cuda_kernel,
-         performance_improved) = info
+        (
+            num_tokens,
+            num_heads,
+            head_size,
+            dtype,
+            device,
+            avg_time_torch_kernel,
+            avg_time_triton_kernel,
+            avg_time_cuda_kernel,
+            performance_improved,
+        ) = info
         dtype = shortly_dtype(dtype)
         device = shortly_device(device)
-        print(f"| {num_tokens} | {num_heads} | {head_size} "
-              f"| {dtype} | {device} | {avg_time_torch_kernel:.5f}ms "
-              f"| {avg_time_triton_kernel:.5f}ms "
-              f"| {avg_time_cuda_kernel:.5f}ms "
-              f"| {performance_improved:.4f}x |")
+        print(
+            f"| {num_tokens} | {num_heads} | {head_size} "
+            f"| {dtype} | {device} | {avg_time_torch_kernel:.5f}ms "
+            f"| {avg_time_triton_kernel:.5f}ms "
+            f"| {avg_time_cuda_kernel:.5f}ms "
+            f"| {performance_improved:.4f}x |"
+        )
 
 
 @pytest.mark.parametrize("num_tokens", NUM_BATCH_TOKENS)
@@ -85,29 +96,28 @@ def shortly_device(device: str) -> str:
 @pytest.mark.parametrize("head_size", HEAD_SIZES)
 @pytest.mark.parametrize("output_dtype", DTYPES)
 @torch.inference_mode()
-def test_merge_attn_states(num_tokens: int, num_query_heads: int,
-                           head_size: int, output_dtype: torch.dtype):
+def test_merge_attn_states(
+    num_tokens: int, num_query_heads: int, head_size: int, output_dtype: torch.dtype
+):
     if not current_platform.is_cuda():
-        pytest.skip('Currently only support compare triton merge_attn_states '
-                    'with custom cuda merge_attn_states kernel')
+        pytest.skip(
+            "Currently only support compare triton merge_attn_states "
+            "with custom cuda merge_attn_states kernel"
+        )
 
     NUM_TOKENS = num_tokens
     NUM_HEADS = num_query_heads
     HEAD_SIZE = head_size
 
-    print(f"\nNUM_TOKENS:{NUM_TOKENS}, NUM_HEADS:{NUM_HEADS}, "
-          f"HEAD_SIZE:{HEAD_SIZE}, DTYPE: {output_dtype}, "
-          f"Device: {current_platform.get_device_name()}")
+    print(
+        f"\nNUM_TOKENS:{NUM_TOKENS}, NUM_HEADS:{NUM_HEADS}, "
+        f"HEAD_SIZE:{HEAD_SIZE}, DTYPE: {output_dtype}, "
+        f"Device: {current_platform.get_device_name()}"
+    )
 
     # prefix_lse and suffix_lse contain inf and normal values
-    prefix_lse = torch.randn(NUM_HEADS,
-                             NUM_TOKENS,
-                             dtype=torch.float32,
-                             device="cuda")
-    suffix_lse = torch.randn(NUM_HEADS,
-                             NUM_TOKENS,
-                             dtype=torch.float32,
-                             device="cuda")
+    prefix_lse = torch.randn(NUM_HEADS, NUM_TOKENS, dtype=torch.float32, device="cuda")
+    suffix_lse = torch.randn(NUM_HEADS, NUM_TOKENS, dtype=torch.float32, device="cuda")
 
     # Generate boolean masks
     mask_prefix = torch.rand(NUM_HEADS, NUM_TOKENS) < 0.1
@@ -117,23 +127,23 @@ def test_merge_attn_states(num_tokens: int, num_query_heads: int,
     mask_prefix = torch.logical_and(mask_prefix, ~combined_mask)
     mask_suffix = torch.logical_and(mask_suffix, ~combined_mask)
 
-    prefix_lse[mask_prefix] = float('inf')
-    suffix_lse[mask_suffix] = float('inf')
+    prefix_lse[mask_prefix] = float("inf")
+    suffix_lse[mask_suffix] = float("inf")
 
     # Other input tensors (need to be initialized but
     # no actual calculation needed)
-    output = torch.zeros((NUM_TOKENS, NUM_HEADS, HEAD_SIZE),
-                         dtype=output_dtype,
-                         device="cuda")
-    output_lse = torch.zeros((NUM_HEADS, NUM_TOKENS),
-                             dtype=torch.float32,
-                             device="cuda")
-    prefix_output = torch.randn((NUM_TOKENS, NUM_HEADS, HEAD_SIZE),
-                                dtype=output_dtype,
-                                device="cuda")
-    suffix_output = torch.randn((NUM_TOKENS, NUM_HEADS, HEAD_SIZE),
-                                dtype=output_dtype,
-                                device="cuda")
+    output = torch.zeros(
+        (NUM_TOKENS, NUM_HEADS, HEAD_SIZE), dtype=output_dtype, device="cuda"
+    )
+    output_lse = torch.zeros(
+        (NUM_HEADS, NUM_TOKENS), dtype=torch.float32, device="cuda"
+    )
+    prefix_output = torch.randn(
+        (NUM_TOKENS, NUM_HEADS, HEAD_SIZE), dtype=output_dtype, device="cuda"
+    )
+    suffix_output = torch.randn(
+        (NUM_TOKENS, NUM_HEADS, HEAD_SIZE), dtype=output_dtype, device="cuda"
+    )
 
     warmup_times = 2
     repeat_times = 20
@@ -149,15 +159,25 @@ def test_merge_attn_states(num_tokens: int, num_query_heads: int,
     suffix_lse_torch = suffix_lse.clone()
     for _ in range(warmup_times):
         output_torch, output_lse_torch = merge_attn_states_torch(
-            output_torch, prefix_output, prefix_lse_torch, suffix_output,
-            suffix_lse_torch, output_lse_torch)
+            output_torch,
+            prefix_output,
+            prefix_lse_torch,
+            suffix_output,
+            suffix_lse_torch,
+            output_lse_torch,
+        )
     torch.cuda.synchronize()
 
     for _ in range(repeat_times):
         start.record()
         output_torch, output_lse_torch = merge_attn_states_torch(
-            output_torch, prefix_output, prefix_lse_torch, suffix_output,
-            suffix_lse_torch, output_lse_torch)
+            output_torch,
+            prefix_output,
+            prefix_lse_torch,
+            suffix_output,
+            suffix_lse_torch,
+            output_lse_torch,
+        )
         end.record()
         torch.cuda.synchronize()
         total_time_torch_kernel += start.elapsed_time(end)
@@ -173,16 +193,26 @@ def test_merge_attn_states(num_tokens: int, num_query_heads: int,
     end = torch.cuda.Event(enable_timing=True)
 
     for _ in range(warmup_times):
-        merge_attn_states_triton(output_ref_triton, prefix_output, prefix_lse,
-                                 suffix_output, suffix_lse,
-                                 output_lse_ref_triton)
+        merge_attn_states_triton(
+            output_ref_triton,
+            prefix_output,
+            prefix_lse,
+            suffix_output,
+            suffix_lse,
+            output_lse_ref_triton,
+        )
     torch.cuda.synchronize()
 
     for _ in range(repeat_times):
         start.record()
-        merge_attn_states_triton(output_ref_triton, prefix_output, prefix_lse,
-                                 suffix_output, suffix_lse,
-                                 output_lse_ref_triton)
+        merge_attn_states_triton(
+            output_ref_triton,
+            prefix_output,
+            prefix_lse,
+            suffix_output,
+            suffix_lse,
+            output_lse_ref_triton,
+        )
         end.record()
         torch.cuda.synchronize()
         total_time_triton_kernel += start.elapsed_time(end)
@@ -195,14 +225,26 @@ def test_merge_attn_states(num_tokens: int, num_query_heads: int,
     output_lse_cuda = output_lse.clone()
 
     for _ in range(warmup_times):
-        merge_attn_states_cuda(output_cuda, prefix_output, prefix_lse,
-                               suffix_output, suffix_lse, output_lse_cuda)
+        merge_attn_states_cuda(
+            output_cuda,
+            prefix_output,
+            prefix_lse,
+            suffix_output,
+            suffix_lse,
+            output_lse_cuda,
+        )
     torch.cuda.synchronize()
 
     for _ in range(repeat_times):
         start.record()
-        merge_attn_states_cuda(output_cuda, prefix_output, prefix_lse,
-                               suffix_output, suffix_lse, output_lse_cuda)
+        merge_attn_states_cuda(
+            output_cuda,
+            prefix_output,
+            prefix_lse,
+            suffix_output,
+            suffix_lse,
+            output_lse_cuda,
+        )
         end.record()
         torch.cuda.synchronize()
         total_time_cuda_kernel += start.elapsed_time(end)
@@ -213,8 +255,10 @@ def test_merge_attn_states(num_tokens: int, num_query_heads: int,
     performance_improved = avg_time_triton_kernel / avg_time_cuda_kernel
     print(f" Torch time: {avg_time_torch_kernel:.6f}ms")
     print(f"Triton time: {avg_time_triton_kernel:.6f}ms")
-    print(f"  CUDA time: {avg_time_cuda_kernel:.6f}ms, "
-          f"Performance: {performance_improved:.5f}x")
+    print(
+        f"  CUDA time: {avg_time_cuda_kernel:.6f}ms, "
+        f"Performance: {performance_improved:.5f}x"
+    )
     print("-" * 100)
 
     # 4. Correctness compare
@@ -232,35 +276,45 @@ def diff(a: torch.Tensor, b: torch.Tensor):
     # states operation.
     output_ref = output_ref_triton
     output_lse_ref = output_lse_ref_triton
-    torch.testing.assert_close(output_cuda.float(),
-                               output_ref.float(),
-                               atol=1e-3,
-                               rtol=rtol)
+    torch.testing.assert_close(
+        output_cuda.float(), output_ref.float(), atol=1e-3, rtol=rtol
+    )
     print("Output all match, max abs diff:")
     print(f"(Triton vs Torch) : {diff(output_torch, output_ref)}")
     print(f"  (CUDA vs Torch) : {diff(output_torch, output_cuda)}")
     print(f"  (CUDA vs Triton): {diff(output_ref, output_cuda)}")
     print("-" * 100)
 
-    torch.testing.assert_close(output_lse_cuda.float(),
-                               output_lse_ref.float(),
-                               atol=1e-3,
-                               rtol=rtol)
+    torch.testing.assert_close(
+        output_lse_cuda.float(), output_lse_ref.float(), atol=1e-3, rtol=rtol
+    )
     print("Output LSE all match, max abs diff:")
     print(f"(Triton vs Torch) : {diff(output_lse_torch, output_lse_ref)}")
     print(f"  (CUDA vs Torch) : {diff(output_lse_torch, output_lse_cuda)}")
     print(f"  (CUDA vs Triton): {diff(output_lse_ref, output_lse_cuda)}")
     print("-" * 100)
 
-    print("All output values test passed! All inf values "
-          "are correctly replaced with -inf.")
+    print(
+        "All output values test passed! All inf values "
+        "are correctly replaced with -inf."
+    )
     print("-" * 100)
 
     device = current_platform.get_device_name()
     all_case_info.append(
-        (NUM_TOKENS, NUM_HEADS, HEAD_SIZE, output_dtype, device,
-         avg_time_torch_kernel, avg_time_triton_kernel, avg_time_cuda_kernel,
-         performance_improved))
-    if len(all_case_info) == (len(NUM_BATCH_TOKENS) * len(HEAD_SIZES) *
-                              len(NUM_QUERY_HEADS) * len(DTYPES)):
+        (
+            NUM_TOKENS,
+            NUM_HEADS,
+            HEAD_SIZE,
+            output_dtype,
+            device,
+            avg_time_torch_kernel,
+            avg_time_triton_kernel,
+            avg_time_cuda_kernel,
+            performance_improved,
+        )
+    )
+    if len(all_case_info) == (
+        len(NUM_BATCH_TOKENS) * len(HEAD_SIZES) * len(NUM_QUERY_HEADS) * len(DTYPES)
+    ):
         generate_markdown_table()
diff --git a/tests/kernels/attention/test_mha_attn.py b/tests/kernels/attention/test_mha_attn.py
index cea08e19f52d..14d1618bca3c 100644
--- a/tests/kernels/attention/test_mha_attn.py
+++ b/tests/kernels/attention/test_mha_attn.py
@@ -5,6 +5,7 @@
 
 * Tests for MultiHeadAttention layer
 """
+
 from unittest.mock import patch
 
 import pytest
@@ -21,11 +22,11 @@
 
 @pytest.fixture(autouse=True)
 def clear_cache():
-    """Clear lru cache to ensure each test case runs without caching.
-    """
+    """Clear lru cache to ensure each test case runs without caching."""
     _cached_get_attn_backend.cache_clear()
     # Clear xformers availability cache
     import vllm.attention.layer as layer_module
+
     layer_module.USE_XFORMERS_OPS = None
 
 
@@ -37,49 +38,63 @@ def test_mha_attn_platform(device: str):
     torch.set_default_dtype(torch.float16)
 
     if device == "cpu":
-        with patch("vllm.attention.layer.current_platform", CpuPlatform()), \
-             patch("vllm.model_executor.models.vision.current_platform",
-                   CpuPlatform()):
+        with (
+            patch("vllm.attention.layer.current_platform", CpuPlatform()),
+            patch("vllm.model_executor.models.vision.current_platform", CpuPlatform()),
+        ):
             attn = MultiHeadAttention(16, 64, scale=1)
             assert attn.attn_backend == _Backend.TORCH_SDPA
     elif device == "hip":
-        with patch("vllm.attention.layer.current_platform", RocmPlatform()), \
-             patch("vllm.model_executor.models.vision.current_platform",
-                   RocmPlatform()):
+        with (
+            patch("vllm.attention.layer.current_platform", RocmPlatform()),
+            patch("vllm.model_executor.models.vision.current_platform", RocmPlatform()),
+        ):
             attn = MultiHeadAttention(16, 64, scale=1)
             assert attn.attn_backend == _Backend.TORCH_SDPA
     else:
         # Test CUDA with head_size=64 (divisible by 32)
         # - should use vLLM's FlashAttention
-        with patch("vllm.attention.layer.current_platform", CudaPlatform()), \
-             patch("vllm.model_executor.models.vision.current_platform",
-                   CudaPlatform()):
+        with (
+            patch("vllm.attention.layer.current_platform", CudaPlatform()),
+            patch("vllm.model_executor.models.vision.current_platform", CudaPlatform()),
+        ):
             attn = MultiHeadAttention(16, 64, scale=1)
             assert attn.attn_backend == _Backend.FLASH_ATTN
 
         # Test CUDA with head_size=72 (not divisible by 32)
         # - with upstream FA not available
         # - should use xformers
-        with patch("vllm.attention.layer.current_platform", CudaPlatform()), \
-             patch("vllm.model_executor.models.vision.current_platform",
-                   CudaPlatform()), \
-             patch("vllm.attention.layer.check_upstream_fa_availability",
-                   return_value=False):
+        with (
+            patch("vllm.attention.layer.current_platform", CudaPlatform()),
+            patch("vllm.model_executor.models.vision.current_platform", CudaPlatform()),
+            patch(
+                "vllm.attention.layer.check_upstream_fa_availability",
+                return_value=False,
+            ),
+        ):
             attn = MultiHeadAttention(16, 72, scale=1)
             assert attn.attn_backend == _Backend.XFORMERS
 
         # Test CUDA with head_size=72 (not divisible by 32)
         # - with upstream FA available
         # - should use upstream FA
-        with patch("vllm.attention.layer.current_platform", CudaPlatform()), \
-             patch("vllm.model_executor.models.vision.current_platform",
-                   CudaPlatform()), \
-             patch("vllm.attention.layer.check_upstream_fa_availability",
-                   return_value=True), \
-             patch.dict('sys.modules', {'flash_attn': type('MockFlashAttn', (),
-                                                           {
-                 'flash_attn_varlen_func': lambda *args, **kwargs: None
-             })()}):
+        with (
+            patch("vllm.attention.layer.current_platform", CudaPlatform()),
+            patch("vllm.model_executor.models.vision.current_platform", CudaPlatform()),
+            patch(
+                "vllm.attention.layer.check_upstream_fa_availability", return_value=True
+            ),
+            patch.dict(
+                "sys.modules",
+                {
+                    "flash_attn": type(
+                        "MockFlashAttn",
+                        (),
+                        {"flash_attn_varlen_func": lambda *args, **kwargs: None},
+                    )()
+                },
+            ),
+        ):
             attn = MultiHeadAttention(16, 72, scale=1)
             assert attn.attn_backend == _Backend.FLASH_ATTN
 
@@ -108,9 +123,11 @@ def ref_attention(
 NUM_KV_HEADS = [1]
 HEAD_SIZES = [64, 80]
 # flshattF and tritonflashattF supported: {torch.float16, torch.bfloat16}
-DTYPES = [
-    torch.half, torch.bfloat16, torch.float
-] if not current_platform.is_rocm() else [torch.half, torch.bfloat16]
+DTYPES = (
+    [torch.half, torch.bfloat16, torch.float]
+    if not current_platform.is_rocm()
+    else [torch.half, torch.bfloat16]
+)
 CUDA_DEVICES = ["cuda"]
 
 
@@ -138,10 +155,9 @@ def test_mha_attn_forward(
     k = torch.randn(batch_size, seq_len, num_kv_heads * head_size)
     v = torch.randn(batch_size, seq_len, num_kv_heads * head_size)
     scale = 1.0 / head_size**0.5
-    attn = MultiHeadAttention(num_heads,
-                              head_size,
-                              scale=scale,
-                              num_kv_heads=num_kv_heads)
+    attn = MultiHeadAttention(
+        num_heads, head_size, scale=scale, num_kv_heads=num_kv_heads
+    )
     output = attn(q, k, v)
 
     assert num_heads % num_kv_heads == 0
diff --git a/tests/kernels/attention/test_mla_decode_cpu.py b/tests/kernels/attention/test_mla_decode_cpu.py
index f8b307c595de..44f3e42e8714 100644
--- a/tests/kernels/attention/test_mla_decode_cpu.py
+++ b/tests/kernels/attention/test_mla_decode_cpu.py
@@ -11,30 +11,24 @@
 
 
 def ref_mla(
-        out: Tensor,  # (bs, num_heads, v_head_dim)
-        query: Tensor,  # (bs, num_heads, head_dim)
-        kv_cache: Tensor,  # (num_blocks, block_size, head_dim)
-        scale: float,
-        block_tables: Tensor,  # (bs, max_num_blocks)
-        seq_lens: Tensor,  # (bs,)
+    out: Tensor,  # (bs, num_heads, v_head_dim)
+    query: Tensor,  # (bs, num_heads, head_dim)
+    kv_cache: Tensor,  # (num_blocks, block_size, head_dim)
+    scale: float,
+    block_tables: Tensor,  # (bs, max_num_blocks)
+    seq_lens: Tensor,  # (bs,)
 ):
     bs, num_heads, v_head_dim = out.shape
     head_dim = query.shape[2]
 
     for i in range(bs):
         # gather and flatten KV-cache
-        kv = kv_cache[
-            block_tables[i]]  # (max_num_blocks, block_size, head_dim)
-        kv = kv.view(1, -1,
-                     head_dim)[:, :seq_lens[i]]  # (1, seq_len, head_dim)
+        kv = kv_cache[block_tables[i]]  # (max_num_blocks, block_size, head_dim)
+        kv = kv.view(1, -1, head_dim)[:, : seq_lens[i]]  # (1, seq_len, head_dim)
         v = kv[:, :, :v_head_dim]
 
         q = query[i].view(num_heads, 1, head_dim)
-        o = F.scaled_dot_product_attention(q,
-                                           kv,
-                                           v,
-                                           scale=scale,
-                                           enable_gqa=True)
+        o = F.scaled_dot_product_attention(q, kv, v, scale=scale, enable_gqa=True)
         out[i] = o.view(num_heads, v_head_dim)
 
     return out
@@ -63,18 +57,17 @@ def test_mla_decode_cpu(
     torch.set_default_dtype(dtype)
     torch.manual_seed(0)
 
-    scale = d**(-0.5)
+    scale = d ** (-0.5)
     if varlen:
         seq_lens = torch.empty(bs).normal_(mean_seq_len, mean_seq_len / 2)
         seq_lens = seq_lens.clip(2).to(torch.int32)
     else:
-        seq_lens = torch.full((bs, ), mean_seq_len, dtype=torch.int32)
+        seq_lens = torch.full((bs,), mean_seq_len, dtype=torch.int32)
     max_seq_len = seq_lens.max().item()
     seqlen_pad = cdiv(max_seq_len, 256) * 256  # is this necessary?
 
     q = torch.randn(bs, h_q, d)
-    block_table = torch.arange(bs * seqlen_pad // block_size,
-                               dtype=torch.int32)
+    block_table = torch.arange(bs * seqlen_pad // block_size, dtype=torch.int32)
     block_table = block_table.view(bs, seqlen_pad // block_size)
 
     kv_cache = torch.randn(block_table.numel(), block_size, d)
@@ -82,8 +75,7 @@ def test_mla_decode_cpu(
         kv_cache.view(bs, seqlen_pad, d)[i, seq_len:] = float("nan")
 
     out_mla = q.new_zeros(bs, h_q, dv)
-    ops.mla_decode_kvcache_cpu(out_mla, q, kv_cache, scale, block_table,
-                               seq_lens)
+    ops.mla_decode_kvcache_cpu(out_mla, q, kv_cache, scale, block_table, seq_lens)
 
     out_ref = q.new_zeros(bs, h_q, dv)
     ref_mla(out_ref, q, kv_cache, scale, block_table, seq_lens)
diff --git a/tests/kernels/attention/test_pack_unpack_triton.py b/tests/kernels/attention/test_pack_unpack_triton.py
index 20c0b262b479..d2aa14738d9d 100644
--- a/tests/kernels/attention/test_pack_unpack_triton.py
+++ b/tests/kernels/attention/test_pack_unpack_triton.py
@@ -39,7 +39,7 @@ def test_pack_seq_basic_fp8():
             start_idx = sum(lengths_list[:b])
             seq_len = lengths_list[b]
 
-            expected_data = x[start_idx:start_idx + seq_len].to(torch.float32)
+            expected_data = x[start_idx : start_idx + seq_len].to(torch.float32)
             actual_data = packed[b, :seq_len].to(torch.float32)
 
             assert_close(actual_data, expected_data, rtol=1e-1, atol=1e-2)
@@ -62,7 +62,7 @@ def test_pack_seq_custom_padding_fp8():
         # Check valid data
         for b in range(B):
             start_idx = b * 10
-            expected_data = x[start_idx:start_idx + 10].to(torch.float32)
+            expected_data = x[start_idx : start_idx + 10].to(torch.float32)
             actual_data = result[b, :10].to(torch.float32)
             assert_close(actual_data, expected_data, rtol=1e-1, atol=1e-2)
 
@@ -73,9 +73,7 @@ def test_pack_seq_custom_padding_fp8():
         elif pad_value > 0:
             assert torch.all(padded_data > 50)  # Large positive values
         else:
-            assert torch.allclose(padded_data,
-                                  torch.zeros_like(padded_data),
-                                  atol=1e-2)
+            assert torch.allclose(padded_data, torch.zeros_like(padded_data), atol=1e-2)
 
 
 def test_pack_seq_default_negative_inf_padding_fp8():
@@ -93,7 +91,8 @@ def test_pack_seq_default_negative_inf_padding_fp8():
     # Check that padding is large negative values (fp8 representation of -inf)
     padded_data = result[:, 10:].to(torch.float32)
     assert torch.all(
-        padded_data < -100)  # fp8 -inf is represented as large negative number
+        padded_data < -100
+    )  # fp8 -inf is represented as large negative number
 
 
 def test_pack_seq_edge_cases_fp8():
@@ -142,7 +141,7 @@ def test_pack_seq_different_block_sizes_fp8():
         # Check that valid data is preserved (within fp8 precision)
         for b in range(B):
             start_idx = b * 25
-            expected_data = x[start_idx:start_idx + 25].to(torch.float32)
+            expected_data = x[start_idx : start_idx + 25].to(torch.float32)
             actual_data = result[b, :25].to(torch.float32)
             assert_close(actual_data, expected_data, rtol=1e-1, atol=1e-2)
 
@@ -198,10 +197,7 @@ def test_pack_unpack_roundtrip_fp8():
 
         # Unpack without explicit start locations (computed in kernel)
         unpacked_with_loc = unpack_seq_triton(packed, lengths)
-        assert_close(x_f32,
-                     unpacked_with_loc.to(torch.float32),
-                     rtol=1e-3,
-                     atol=1e-2)
+        assert_close(x_f32, unpacked_with_loc.to(torch.float32), rtol=1e-3, atol=1e-2)
 
 
 def test_unpack_seq_triton_edge_cases_fp8():
@@ -216,10 +212,7 @@ def test_unpack_seq_triton_edge_cases_fp8():
     packed = pack_seq_triton(x, lengths)
     unpacked = unpack_seq_triton(packed, lengths)
     assert unpacked.shape == x.shape
-    assert_close(x.to(torch.float32),
-                 unpacked.to(torch.float32),
-                 rtol=1e-1,
-                 atol=1e-2)
+    assert_close(x.to(torch.float32), unpacked.to(torch.float32), rtol=1e-1, atol=1e-2)
 
     # Test with very short sequences
     x = torch.randn(20, 4, 8, dtype=torch.float32, device=device) * 0.1
@@ -228,10 +221,9 @@ def test_unpack_seq_triton_edge_cases_fp8():
     packed = pack_seq_triton(x, lengths)
     unpacked = unpack_seq_triton(packed, lengths)
     # Only compare the first 3 elements that were actually packed
-    assert_close(x[:3].to(torch.float32),
-                 unpacked.to(torch.float32),
-                 rtol=1e-1,
-                 atol=1e-2)
+    assert_close(
+        x[:3].to(torch.float32), unpacked.to(torch.float32), rtol=1e-1, atol=1e-2
+    )
 
     x = torch.randn(15, 8, 16, dtype=torch.float32, device=device) * 0.1
     x = x.to(dtype=dtype)
@@ -239,7 +231,4 @@ def test_unpack_seq_triton_edge_cases_fp8():
     packed = pack_seq_triton(x, lengths)
     unpacked = unpack_seq_triton(packed, lengths)
     assert unpacked.shape == x.shape
-    assert_close(x.to(torch.float32),
-                 unpacked.to(torch.float32),
-                 rtol=1e-1,
-                 atol=1e-2)
+    assert_close(x.to(torch.float32), unpacked.to(torch.float32), rtol=1e-1, atol=1e-2)
diff --git a/tests/kernels/attention/test_prefix_prefill.py b/tests/kernels/attention/test_prefix_prefill.py
index 0695f84aea1a..5ff2624cd7a4 100644
--- a/tests/kernels/attention/test_prefix_prefill.py
+++ b/tests/kernels/attention/test_prefix_prefill.py
@@ -12,8 +12,7 @@
 from xformers.ops.fmha.attn_bias import BlockDiagonalCausalFromBottomRightMask
 
 from tests.kernels.utils import make_alibi_bias
-from vllm.attention.ops.chunked_prefill_paged_decode import (
-    chunked_prefill_paged_decode)
+from vllm.attention.ops.chunked_prefill_paged_decode import chunked_prefill_paged_decode
 from vllm.attention.ops.prefix_prefill import context_attention_fwd
 from vllm.platforms import current_platform
 from vllm.utils import STR_DTYPE_TO_TORCH_DTYPE
@@ -22,9 +21,7 @@
 NUM_QUERIES_PER_KV = [1, 64]
 HEAD_SIZES = [24, 128]
 DTYPES = [torch.float16]
-CUDA_DEVICES = [
-    f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)
-]
+CUDA_DEVICES = [f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)]
 SLIDING_WINDOW = [0, 16, 2048]
 KV_CACHE_DTYPES = ["auto", "fp8", "fp8_e5m2"]
 
@@ -50,12 +47,10 @@ def test_contexted_kv_attention(
     device: str,
     op: Callable,
 ) -> None:
-
-    if 'fp8' in kv_cache_dtype and not current_platform.has_device_capability(
-            89):
+    if "fp8" in kv_cache_dtype and not current_platform.has_device_capability(89):
         pytest.skip(
-            'Triton limitation: fp8e4nv data type is not supported on CUDA'
-            ' arch < 89')
+            "Triton limitation: fp8e4nv data type is not supported on CUDA arch < 89"
+        )
 
     current_platform.seed_everything(0)
     torch.set_default_device(device)
@@ -93,38 +88,29 @@ def test_contexted_kv_attention(
         cache_dtype = dtype
     else:
         cache_dtype = STR_DTYPE_TO_TORCH_DTYPE[kv_cache_dtype]
-    k_cache = torch.zeros(cache_size,
-                          block_size,
-                          num_kv_heads,
-                          head_size,
-                          dtype=cache_dtype)
-    v_cache = torch.zeros(cache_size,
-                          block_size,
-                          num_kv_heads,
-                          head_size,
-                          dtype=cache_dtype)
+    k_cache = torch.zeros(
+        cache_size, block_size, num_kv_heads, head_size, dtype=cache_dtype
+    )
+    v_cache = torch.zeros(
+        cache_size, block_size, num_kv_heads, head_size, dtype=cache_dtype
+    )
     k = torch.zeros(sum(query_lens), num_kv_heads, head_size, dtype=dtype)
     v = torch.zeros(sum(query_lens), num_kv_heads, head_size, dtype=dtype)
     values = torch.arange(0, cache_size, dtype=torch.long)
     values = values[torch.randperm(cache_size)]
-    block_table = values[:BS * max_block_per_request].view(
-        BS, max_block_per_request)
+    block_table = values[: BS * max_block_per_request].view(BS, max_block_per_request)
     b_seq_len = torch.tensor(seq_lens, dtype=torch.long)
     b_ctx_len = torch.tensor(ctx_lens, dtype=torch.long)
-    b_start_loc = torch.cumsum(torch.tensor([0] + query_lens,
-                                            dtype=torch.long),
-                               dim=0)
+    b_start_loc = torch.cumsum(torch.tensor([0] + query_lens, dtype=torch.long), dim=0)
     max_input_len = MAX_SEQ_LEN
     # copy kv to cache
-    b_seq_start_loc = torch.cumsum(torch.tensor([0] + seq_lens[:-1],
-                                                dtype=torch.long),
-                                   dim=0)
+    b_seq_start_loc = torch.cumsum(
+        torch.tensor([0] + seq_lens[:-1], dtype=torch.long), dim=0
+    )
     for i in range(BS):
         for j in range(query_lens[i]):
-            k[b_start_loc[i] + j].copy_(key[b_seq_start_loc[i] + b_ctx_len[i] +
-                                            j])
-            v[b_start_loc[i] + j].copy_(value[b_seq_start_loc[i] +
-                                              b_ctx_len[i] + j])
+            k[b_start_loc[i] + j].copy_(key[b_seq_start_loc[i] + b_ctx_len[i] + j])
+            v[b_start_loc[i] + j].copy_(value[b_seq_start_loc[i] + b_ctx_len[i] + j])
         cur_ctx = 0
         block_id = 0
         while cur_ctx < b_ctx_len[i]:
@@ -135,61 +121,71 @@ def test_contexted_kv_attention(
                 end_loc = start_loc + block_size
             start_slot = block_table[i, block_id] * block_size
             end_slot = start_slot + end_loc - start_loc
-            k_cache.view(-1, num_kv_heads,
-                         head_size)[start_slot:end_slot].copy_(
-                             key[start_loc:end_loc])
-            v_cache.view(-1, num_kv_heads,
-                         head_size)[start_slot:end_slot].copy_(
-                             value[start_loc:end_loc])
+            k_cache.view(-1, num_kv_heads, head_size)[start_slot:end_slot].copy_(
+                key[start_loc:end_loc]
+            )
+            v_cache.view(-1, num_kv_heads, head_size)[start_slot:end_slot].copy_(
+                value[start_loc:end_loc]
+            )
             cur_ctx += block_size
             block_id += 1
     # transpose K_cache[num_blocks, block_size, num_kv_heads, head_size]
     # to K_cache[num_blocks, num_kv_heads, head_size/8, block_size, 8]
-    k_cache = k_cache.view(-1, block_size, num_kv_heads, head_size // 8,
-                           8).permute(0, 2, 3, 1, 4).contiguous()
+    k_cache = (
+        k_cache.view(-1, block_size, num_kv_heads, head_size // 8, 8)
+        .permute(0, 2, 3, 1, 4)
+        .contiguous()
+    )
     # transpose V_cache[num_blocks, block_size, num_kv_heads, head_size]
     # to V_cache[num_blocks, num_kv_heads, head_size, block_size]
-    v_cache = v_cache.view(-1, block_size, num_kv_heads,
-                           head_size).permute(0, 2, 3, 1).contiguous()
+    v_cache = (
+        v_cache.view(-1, block_size, num_kv_heads, head_size)
+        .permute(0, 2, 3, 1)
+        .contiguous()
+    )
     k_scale = v_scale = torch.tensor(1.0, dtype=torch.float32, device=device)
 
     # Warm up the Triton kernel by calling it once before actually measuring
     # generation time
-    op(query,
-       k,
-       v,
-       output,
-       kv_cache_dtype,
-       k_cache,
-       v_cache,
-       block_table,
-       b_start_loc,
-       b_seq_len,
-       MAX_CTX_LEN,
-       max_input_len,
-       k_scale,
-       v_scale,
-       sliding_window=sliding_window)
+    op(
+        query,
+        k,
+        v,
+        output,
+        kv_cache_dtype,
+        k_cache,
+        v_cache,
+        block_table,
+        b_start_loc,
+        b_seq_len,
+        MAX_CTX_LEN,
+        max_input_len,
+        k_scale,
+        v_scale,
+        sliding_window=sliding_window,
+    )
     torch.cuda.synchronize()
     start_time = time.time()
-    op(query,
-       k,
-       v,
-       output,
-       kv_cache_dtype,
-       k_cache,
-       v_cache,
-       block_table,
-       b_start_loc,
-       b_seq_len,
-       MAX_CTX_LEN,
-       max_input_len,
-       k_scale,
-       v_scale,
-       sliding_window=sliding_window)
+    op(
+        query,
+        k,
+        v,
+        output,
+        kv_cache_dtype,
+        k_cache,
+        v_cache,
+        block_table,
+        b_start_loc,
+        b_seq_len,
+        MAX_CTX_LEN,
+        max_input_len,
+        k_scale,
+        v_scale,
+        sliding_window=sliding_window,
+    )
     torch.cuda.synchronize()
     end_time = time.time()
-    print(f"triton Time: {(end_time - start_time)*1000:.2f} ms")
+    print(f"triton Time: {(end_time - start_time) * 1000:.2f} ms")
 
     scale = float(1.0 / (head_size**0.5))
 
@@ -201,22 +197,24 @@ def test_contexted_kv_attention(
         # heads.
         #
         # see also: vllm/model_executor/layers/attention.py
-        query = query.view(query.shape[0], num_kv_heads, num_queries_per_kv,
-                           query.shape[-1])
-        key = key[:, :, None, :].expand(key.shape[0], num_kv_heads,
-                                        num_queries_per_kv, key.shape[-1])
-        value = value[:, :,
-                      None, :].expand(value.shape[0], num_kv_heads,
-                                      num_queries_per_kv, value.shape[-1])
+        query = query.view(
+            query.shape[0], num_kv_heads, num_queries_per_kv, query.shape[-1]
+        )
+        key = key[:, :, None, :].expand(
+            key.shape[0], num_kv_heads, num_queries_per_kv, key.shape[-1]
+        )
+        value = value[:, :, None, :].expand(
+            value.shape[0], num_kv_heads, num_queries_per_kv, value.shape[-1]
+        )
     query = query.unsqueeze(0)
     key = key.unsqueeze(0)
     value = value.unsqueeze(0)
 
     attn_bias = BlockDiagonalCausalFromBottomRightMask.from_seqlens(
-        query_lens, seq_lens)
+        query_lens, seq_lens
+    )
     if sliding_window > 0:
-        attn_bias = attn_bias.make_local_attention_from_bottomright(
-            sliding_window)
+        attn_bias = attn_bias.make_local_attention_from_bottomright(sliding_window)
     output_ref = xops.memory_efficient_attention_forward(
         query,
         key,
@@ -239,7 +237,7 @@ def test_contexted_kv_attention(
     )
     torch.cuda.synchronize()
     end_time = time.time()
-    print(f"xformers Time: {(end_time - start_time)*1000:.2f} ms")
+    print(f"xformers Time: {(end_time - start_time) * 1000:.2f} ms")
     output_ref = output_ref.reshape(output.shape)
     atol = 1e-3 if "fp8" in kv_cache_dtype else 1e-4
     torch.testing.assert_close(output, output_ref, atol=atol, rtol=0)
@@ -262,12 +260,10 @@ def test_contexted_kv_attention_alibi(
     device: str,
     op: Callable,
 ) -> None:
-
-    if 'fp8' in kv_cache_dtype and not current_platform.has_device_capability(
-            89):
+    if "fp8" in kv_cache_dtype and not current_platform.has_device_capability(89):
         pytest.skip(
-            'Triton limitation: fp8e4nv data type is not supported on CUDA'
-            ' arch < 89')
+            "Triton limitation: fp8e4nv data type is not supported on CUDA arch < 89"
+        )
 
     current_platform.seed_everything(0)
     torch.set_default_device(device)
@@ -280,9 +276,9 @@ def test_contexted_kv_attention_alibi(
 
     def _get_alibi_slopes(total_num_heads: int) -> torch.Tensor:
         # Fork from: vllm/vllm/model_executor/models/bloom.py#L44
-        closest_power_of_2 = 2**math.floor(math.log2(total_num_heads))
+        closest_power_of_2 = 2 ** math.floor(math.log2(total_num_heads))
         base = torch.tensor(
-            2**(-(2**-(math.log2(closest_power_of_2) - 3))),
+            2 ** (-(2 ** -(math.log2(closest_power_of_2) - 3))),
             dtype=torch.float32,
         )
         powers = torch.arange(1, 1 + closest_power_of_2, dtype=torch.int32)
@@ -290,17 +286,16 @@ def _get_alibi_slopes(total_num_heads: int) -> torch.Tensor:
 
         if closest_power_of_2 != total_num_heads:
             extra_base = torch.tensor(
-                2**(-(2**-(math.log2(2 * closest_power_of_2) - 3))),
+                2 ** (-(2 ** -(math.log2(2 * closest_power_of_2) - 3))),
                 dtype=torch.float32,
             )
-            num_remaining_heads = min(closest_power_of_2,
-                                      total_num_heads - closest_power_of_2)
-            extra_powers = torch.arange(start=1,
-                                        end=1 + 2 * num_remaining_heads,
-                                        step=2,
-                                        dtype=torch.int32)
-            slopes = torch.cat(
-                [slopes, torch.pow(extra_base, extra_powers)], dim=0)
+            num_remaining_heads = min(
+                closest_power_of_2, total_num_heads - closest_power_of_2
+            )
+            extra_powers = torch.arange(
+                start=1, end=1 + 2 * num_remaining_heads, step=2, dtype=torch.int32
+            )
+            slopes = torch.cat([slopes, torch.pow(extra_base, extra_powers)], dim=0)
         return slopes
 
     alibi_slopes = _get_alibi_slopes(num_heads).to(device)
@@ -328,38 +323,29 @@ def _get_alibi_slopes(total_num_heads: int) -> torch.Tensor:
         cache_dtype = dtype
     else:
         cache_dtype = STR_DTYPE_TO_TORCH_DTYPE[kv_cache_dtype]
-    k_cache = torch.zeros(cache_size,
-                          block_size,
-                          num_kv_heads,
-                          head_size,
-                          dtype=cache_dtype)
-    v_cache = torch.zeros(cache_size,
-                          block_size,
-                          num_kv_heads,
-                          head_size,
-                          dtype=cache_dtype)
+    k_cache = torch.zeros(
+        cache_size, block_size, num_kv_heads, head_size, dtype=cache_dtype
+    )
+    v_cache = torch.zeros(
+        cache_size, block_size, num_kv_heads, head_size, dtype=cache_dtype
+    )
     k = torch.zeros(sum(query_lens), num_kv_heads, head_size, dtype=dtype)
     v = torch.zeros(sum(query_lens), num_kv_heads, head_size, dtype=dtype)
     values = torch.arange(0, cache_size, dtype=torch.long)
     values = values[torch.randperm(cache_size)]
-    block_table = values[:BS * max_block_per_request].view(
-        BS, max_block_per_request)
+    block_table = values[: BS * max_block_per_request].view(BS, max_block_per_request)
     b_seq_len = torch.tensor(seq_lens, dtype=torch.long)
     b_ctx_len = torch.tensor(ctx_lens, dtype=torch.long)
-    b_start_loc = torch.cumsum(torch.tensor([0] + query_lens,
-                                            dtype=torch.long),
-                               dim=0)
+    b_start_loc = torch.cumsum(torch.tensor([0] + query_lens, dtype=torch.long), dim=0)
     max_input_len = MAX_SEQ_LEN
     # copy kv to cache
-    b_seq_start_loc = torch.cumsum(torch.tensor([0] + seq_lens[:-1],
-                                                dtype=torch.long),
-                                   dim=0)
+    b_seq_start_loc = torch.cumsum(
+        torch.tensor([0] + seq_lens[:-1], dtype=torch.long), dim=0
+    )
     for i in range(BS):
         for j in range(query_lens[i]):
-            k[b_start_loc[i] + j].copy_(key[b_seq_start_loc[i] + b_ctx_len[i] +
-                                            j])
-            v[b_start_loc[i] + j].copy_(value[b_seq_start_loc[i] +
-                                              b_ctx_len[i] + j])
+            k[b_start_loc[i] + j].copy_(key[b_seq_start_loc[i] + b_ctx_len[i] + j])
+            v[b_start_loc[i] + j].copy_(value[b_seq_start_loc[i] + b_ctx_len[i] + j])
         cur_ctx = 0
         block_id = 0
         while cur_ctx < b_ctx_len[i]:
@@ -370,82 +356,90 @@ def _get_alibi_slopes(total_num_heads: int) -> torch.Tensor:
                 end_loc = start_loc + block_size
             start_slot = block_table[i, block_id] * block_size
             end_slot = start_slot + end_loc - start_loc
-            k_cache.view(-1, num_kv_heads,
-                         head_size)[start_slot:end_slot].copy_(
-                             key[start_loc:end_loc])
-            v_cache.view(-1, num_kv_heads,
-                         head_size)[start_slot:end_slot].copy_(
-                             value[start_loc:end_loc])
+            k_cache.view(-1, num_kv_heads, head_size)[start_slot:end_slot].copy_(
+                key[start_loc:end_loc]
+            )
+            v_cache.view(-1, num_kv_heads, head_size)[start_slot:end_slot].copy_(
+                value[start_loc:end_loc]
+            )
             cur_ctx += block_size
             block_id += 1
     # transpose K_cache[num_blocks, block_size, num_kv_heads, head_size]
     # to K_cache[num_blocks, num_kv_heads, head_size/8, block_size, 8]
-    k_cache = k_cache.view(-1, block_size, num_kv_heads, head_size // 8,
-                           8).permute(0, 2, 3, 1, 4).contiguous()
+    k_cache = (
+        k_cache.view(-1, block_size, num_kv_heads, head_size // 8, 8)
+        .permute(0, 2, 3, 1, 4)
+        .contiguous()
+    )
     # transpose V_cache[num_blocks, block_size, num_kv_heads, head_size]
     # to V_cache[num_blocks, num_kv_heads, head_size, block_size]
-    v_cache = v_cache.view(-1, block_size, num_kv_heads,
-                           head_size).permute(0, 2, 3, 1).contiguous()
+    v_cache = (
+        v_cache.view(-1, block_size, num_kv_heads, head_size)
+        .permute(0, 2, 3, 1)
+        .contiguous()
+    )
     k_scale = v_scale = torch.tensor(1.0, dtype=torch.float32, device=device)
 
     # Warm up the Triton kernel by calling it once before actually measuring
     # generation time
-    op(query,
-       k,
-       v,
-       output,
-       kv_cache_dtype,
-       k_cache,
-       v_cache,
-       block_table,
-       b_start_loc,
-       b_seq_len,
-       MAX_CTX_LEN,
-       max_input_len,
-       k_scale,
-       v_scale,
-       alibi_slopes=alibi_slopes)
+    op(
+        query,
+        k,
+        v,
+        output,
+        kv_cache_dtype,
+        k_cache,
+        v_cache,
+        block_table,
+        b_start_loc,
+        b_seq_len,
+        MAX_CTX_LEN,
+        max_input_len,
+        k_scale,
+        v_scale,
+        alibi_slopes=alibi_slopes,
+    )
     torch.cuda.synchronize()
     start_time = time.time()
-    op(query,
-       k,
-       v,
-       output,
-       kv_cache_dtype,
-       k_cache,
-       v_cache,
-       block_table,
-       b_start_loc,
-       b_seq_len,
-       MAX_CTX_LEN,
-       max_input_len,
-       k_scale,
-       v_scale,
-       alibi_slopes=alibi_slopes)
+    op(
+        query,
+        k,
+        v,
+        output,
+        kv_cache_dtype,
+        k_cache,
+        v_cache,
+        block_table,
+        b_start_loc,
+        b_seq_len,
+        MAX_CTX_LEN,
+        max_input_len,
+        k_scale,
+        v_scale,
+        alibi_slopes=alibi_slopes,
+    )
     torch.cuda.synchronize()
     end_time = time.time()
-    print(f"triton Time: {(end_time - start_time)*1000:.2f} ms")
+    print(f"triton Time: {(end_time - start_time) * 1000:.2f} ms")
     scale = float(1.0 / (head_size**0.5))
 
     # NOTE(DefTruth): In order to reuse _make_alibi_bias function,
     # we have to pad query tensor before MQA/GQA expanding.
     if query.shape[0] != key.shape[0]:
-        query_pad = torch.empty(sum(seq_lens),
-                                num_heads,
-                                head_size,
-                                dtype=dtype)
+        query_pad = torch.empty(sum(seq_lens), num_heads, head_size, dtype=dtype)
         query_pad.uniform_(-1e-3, 1e-3)
         seq_start = 0
         query_start = 0
         for i, (query_len, seq_len) in enumerate(zip(query_lens, seq_lens)):
             seq_end = seq_start + seq_len
             query_end = query_start + query_len
-            query_pad[seq_start:seq_end, ...] = torch.cat([
-                torch.zeros(
-                    seq_len - query_len, num_heads, head_size, dtype=dtype),
-                query[query_start:query_end, ...]
-            ],
-                                                          dim=0)
+            query_pad[seq_start:seq_end, ...] = torch.cat(
+                [
+                    torch.zeros(seq_len - query_len, num_heads, head_size, dtype=dtype),
+                    query[query_start:query_end, ...],
+                ],
+                dim=0,
+            )
             seq_start += seq_len
             query_start += query_len
         query = query_pad
@@ -456,11 +450,12 @@ def _get_alibi_slopes(total_num_heads: int) -> torch.Tensor:
         # heads.
         #
         # see also: vllm/model_executor/layers/attention.py
-        key = key[:, :, None, :].expand(key.shape[0], num_kv_heads,
-                                        num_queries_per_kv, key.shape[-1])
-        value = value[:, :,
-                      None, :].expand(value.shape[0], num_kv_heads,
-                                      num_queries_per_kv, value.shape[-1])
+        key = key[:, :, None, :].expand(
+            key.shape[0], num_kv_heads, num_queries_per_kv, key.shape[-1]
+        )
+        value = value[:, :, None, :].expand(
+            value.shape[0], num_kv_heads, num_queries_per_kv, value.shape[-1]
+        )
         # [seq, num_kv_heads, num_queries_per_kv, dk]=>
         # [seq, num_kv_heads*num_queries_per_kv, dk] to comply with rest of the
         # codebase. We save some time reshaping alibi matrix at runtime.
@@ -483,24 +478,23 @@ def _get_alibi_slopes(total_num_heads: int) -> torch.Tensor:
     for i, (query_len, seq_len) in enumerate(zip(query_lens, seq_lens)):
         seq_end = seq_start + seq_len
         query_end = query_start + query_len
-        out = xops.memory_efficient_attention_forward(query[:,
-                                                            seq_start:seq_end],
-                                                      key[:,
-                                                          seq_start:seq_end],
-                                                      value[:,
-                                                            seq_start:seq_end],
-                                                      attn_bias=attn_bias[i],
-                                                      p=0.0,
-                                                      scale=scale)
+        out = xops.memory_efficient_attention_forward(
+            query[:, seq_start:seq_end],
+            key[:, seq_start:seq_end],
+            value[:, seq_start:seq_end],
+            attn_bias=attn_bias[i],
+            p=0.0,
+            scale=scale,
+        )
         out = out.view_as(query[:, seq_start:seq_end]).view(
-            seq_len, num_heads, head_size)
-        output_ref[query_start:query_end, ...].copy_(out[seq_len - query_len:,
-                                                         ...])
+            seq_len, num_heads, head_size
+        )
+        output_ref[query_start:query_end, ...].copy_(out[seq_len - query_len :, ...])
         seq_start += seq_len
         query_start += query_len
     torch.cuda.synchronize()
     end_time = time.time()
-    print(f"xformers Time: {(end_time - start_time)*1000:.2f} ms")
+    print(f"xformers Time: {(end_time - start_time) * 1000:.2f} ms")
     atol = 1e-3 if "fp8" in kv_cache_dtype else 1e-6
     torch.testing.assert_close(output, output_ref, atol=atol, rtol=0)
 
@@ -532,9 +526,16 @@ def test_contexted_kv_attention_f32(
     device: str,
     op: Callable,
 ) -> None:
-    test_contexted_kv_attention(num_heads, num_queries_per_kv, head_size,
-                                sliding_window, dtype, kv_cache_dtype, device,
-                                op)
+    test_contexted_kv_attention(
+        num_heads,
+        num_queries_per_kv,
+        head_size,
+        sliding_window,
+        dtype,
+        kv_cache_dtype,
+        device,
+        op,
+    )
 
 
 @pytest.mark.optional
@@ -555,5 +556,6 @@ def test_contexted_kv_attention_alibi_f32(
     device: str,
     op: Callable,
 ) -> None:
-    test_contexted_kv_attention_alibi(num_heads, num_queries_per_kv, head_size,
-                                      dtype, kv_cache_dtype, device, op)
+    test_contexted_kv_attention_alibi(
+        num_heads, num_queries_per_kv, head_size, dtype, kv_cache_dtype, device, op
+    )
diff --git a/tests/kernels/attention/test_rocm_attention_selector.py b/tests/kernels/attention/test_rocm_attention_selector.py
index a5b4bddaf475..a59230528770 100644
--- a/tests/kernels/attention/test_rocm_attention_selector.py
+++ b/tests/kernels/attention/test_rocm_attention_selector.py
@@ -11,8 +11,7 @@
 
 @pytest.fixture(autouse=True)
 def clear_cache():
-    """Clear lru cache to ensure each test case runs without caching.
-    """
+    """Clear lru cache to ensure each test case runs without caching."""
     _cached_get_attn_backend.cache_clear()
 
 
@@ -22,46 +21,29 @@ def test_selector(monkeypatch: pytest.MonkeyPatch):
         m.setenv(STR_BACKEND_ENV_VAR, "ROCM_FLASH")
 
         # Set the current platform to ROCm using monkeypatch
-        monkeypatch.setattr("vllm.attention.selector.current_platform",
-                            RocmPlatform())
+        monkeypatch.setattr("vllm.attention.selector.current_platform", RocmPlatform())
 
         # Test standard ROCm attention
         backend = get_attn_backend(16, torch.float16, torch.float16, 16, False)
-        assert (backend.get_name() == "ROCM_FLASH"
-                or backend.get_name() == "TRITON_ATTN")
+        assert backend.get_name() == "ROCM_FLASH" or backend.get_name() == "TRITON_ATTN"
 
         # MLA test for deepseek related
 
         # change the attention backend to triton MLA
         m.setenv(STR_BACKEND_ENV_VAR, "TRITON_MLA")
-        backend = get_attn_backend(576,
-                                   torch.bfloat16,
-                                   "auto",
-                                   16,
-                                   False,
-                                   use_mla=True)
+        backend = get_attn_backend(576, torch.bfloat16, "auto", 16, False, use_mla=True)
         assert backend.get_name() == "TRITON_MLA"
 
         # If attention backend is None
         # If use_mla is true
         # The selected backend is triton MLA
         m.setenv(STR_BACKEND_ENV_VAR, None)
-        backend = get_attn_backend(576,
-                                   torch.bfloat16,
-                                   "auto",
-                                   16,
-                                   False,
-                                   use_mla=True)
+        backend = get_attn_backend(576, torch.bfloat16, "auto", 16, False, use_mla=True)
         assert backend.get_name() == "TRITON_MLA"
 
         # change the attention backend to AITER MLA
         m.setenv(STR_BACKEND_ENV_VAR, "ROCM_AITER_MLA")
-        backend = get_attn_backend(576,
-                                   torch.bfloat16,
-                                   "auto",
-                                   1,
-                                   False,
-                                   use_mla=True)
+        backend = get_attn_backend(576, torch.bfloat16, "auto", 1, False, use_mla=True)
         assert backend.get_name() == "ROCM_AITER_MLA"
 
         # If attention backend is None
@@ -70,10 +52,5 @@ def test_selector(monkeypatch: pytest.MonkeyPatch):
         # The selected backend is ROCM_AITER_MLA
         m.setenv(STR_BACKEND_ENV_VAR, None)
         m.setenv("VLLM_ROCM_USE_AITER", "1")
-        backend = get_attn_backend(576,
-                                   torch.bfloat16,
-                                   "auto",
-                                   1,
-                                   False,
-                                   use_mla=True)
+        backend = get_attn_backend(576, torch.bfloat16, "auto", 1, False, use_mla=True)
         assert backend.get_name() == "ROCM_AITER_MLA"
diff --git a/tests/kernels/attention/test_triton_decode_attention.py b/tests/kernels/attention/test_triton_decode_attention.py
index 48aacac8376b..01ba0951b825 100644
--- a/tests/kernels/attention/test_triton_decode_attention.py
+++ b/tests/kernels/attention/test_triton_decode_attention.py
@@ -24,14 +24,12 @@ def test_decode_attention(B, L, H_Q, H_KV, D_QK, D_V, CACHE_SIZE, PAGE_SIZE):
     num_kv_splits = 8
 
     num_pages_per_batch = cdiv(seq_len, PAGE_SIZE)
-    req_to_page = torch.randint(0,
-                                CACHE_SIZE // PAGE_SIZE,
-                                (B, num_pages_per_batch, 1),
-                                device="cuda")
+    req_to_page = torch.randint(
+        0, CACHE_SIZE // PAGE_SIZE, (B, num_pages_per_batch, 1), device="cuda"
+    )
     req_to_token = req_to_page * PAGE_SIZE
     req_to_token = req_to_token.expand(B, num_pages_per_batch, PAGE_SIZE)
-    req_to_token = req_to_token + torch.arange(PAGE_SIZE, device="cuda").view(
-        1, 1, -1)
+    req_to_token = req_to_token + torch.arange(PAGE_SIZE, device="cuda").view(1, 1, -1)
     req_to_token = req_to_token.view(B, -1)
     req_to_token = req_to_token[:, :seq_len].contiguous()
 
@@ -48,7 +46,7 @@ def test_decode_attention(B, L, H_Q, H_KV, D_QK, D_V, CACHE_SIZE, PAGE_SIZE):
 
     lse = torch.zeros(B, H_Q, dtype=dtype, device="cuda")
 
-    b_seq_len = torch.full((B, ), seq_len, device="cuda")
+    b_seq_len = torch.full((B,), seq_len, device="cuda")
 
     attn_logits = torch.empty(
         (B, H_Q, num_kv_splits, D_V + 1),
diff --git a/tests/kernels/attention/test_triton_unified_attention.py b/tests/kernels/attention/test_triton_unified_attention.py
index 5cff29b15aa3..fba82cfdadbd 100644
--- a/tests/kernels/attention/test_triton_unified_attention.py
+++ b/tests/kernels/attention/test_triton_unified_attention.py
@@ -14,9 +14,11 @@
 BLOCK_SIZES = [16]
 
 DTYPES = [torch.bfloat16]
-QDTYPES = [None, torch.float8_e4m3fn] if not current_platform.is_rocm() else [
-    None, torch.float8_e4m3fnuz
-]
+QDTYPES = (
+    [None, torch.float8_e4m3fn]
+    if not current_platform.is_rocm()
+    else [None, torch.float8_e4m3fnuz]
+)
 # one value large enough to test overflow in index calculation.
 # one value small enough to test the schema op check
 NUM_BLOCKS = [32768, 2048]
@@ -42,7 +44,7 @@ def ref_paged_attn(
     for i in range(num_seqs):
         query_len = query_lens[i]
         kv_len = kv_lens[i]
-        q = query[start_idx:start_idx + query_len]
+        q = query[start_idx : start_idx + query_len]
         q *= scale
 
         num_kv_blocks = (kv_len + block_size - 1) // block_size
@@ -60,10 +62,13 @@ def ref_paged_attn(
         empty_mask = torch.ones(query_len, kv_len)
         mask = torch.triu(empty_mask, diagonal=kv_len - query_len + 1).bool()
         if sliding_window is not None:
-            sliding_window_mask = torch.triu(empty_mask,
-                                             diagonal=kv_len -
-                                             (query_len + sliding_window) +
-                                             1).bool().logical_not()
+            sliding_window_mask = (
+                torch.triu(
+                    empty_mask, diagonal=kv_len - (query_len + sliding_window) + 1
+                )
+                .bool()
+                .logical_not()
+            )
             mask |= sliding_window_mask
         if soft_cap is not None and soft_cap > 0:
             attn = soft_cap * torch.tanh(attn / soft_cap)
@@ -77,9 +82,9 @@ def ref_paged_attn(
     return torch.cat(outputs, dim=0)
 
 
-@pytest.mark.parametrize("seq_lens",
-                         [[(1, 1328), (5, 18),
-                           (129, 463)], [(1, 523), (1, 37), (1, 2011)]])
+@pytest.mark.parametrize(
+    "seq_lens", [[(1, 1328), (5, 18), (129, 463)], [(1, 523), (1, 37), (1, 2011)]]
+)
 @pytest.mark.parametrize("num_heads", NUM_HEADS)
 @pytest.mark.parametrize("head_size", HEAD_SIZES)
 @pytest.mark.parametrize("block_size", BLOCK_SIZES)
@@ -111,30 +116,23 @@ def test_triton_unified_attn(
     assert num_query_heads % num_kv_heads == 0
     max_query_len = max(query_lens)
     max_kv_len = max(kv_lens)
-    window_size = ((sliding_window - 1, 0) if sliding_window is not None else
-                   (-1, -1))
+    window_size = (sliding_window - 1, 0) if sliding_window is not None else (-1, -1)
     scale = head_size**-0.5
 
-    query = torch.randn(sum(query_lens),
-                        num_query_heads,
-                        head_size,
-                        dtype=dtype)
-    key_cache = torch.randn(num_blocks,
-                            block_size,
-                            num_kv_heads,
-                            head_size,
-                            dtype=dtype)
+    query = torch.randn(sum(query_lens), num_query_heads, head_size, dtype=dtype)
+    key_cache = torch.randn(
+        num_blocks, block_size, num_kv_heads, head_size, dtype=dtype
+    )
     value_cache = torch.randn_like(key_cache)
-    cu_query_lens = torch.tensor([0] + query_lens,
-                                 dtype=torch.int32).cumsum(dim=0,
-                                                           dtype=torch.int32)
+    cu_query_lens = torch.tensor([0] + query_lens, dtype=torch.int32).cumsum(
+        dim=0, dtype=torch.int32
+    )
     kv_lens = torch.tensor(kv_lens, dtype=torch.int32)
 
     max_num_blocks_per_seq = (max_kv_len + block_size - 1) // block_size
-    block_tables = torch.randint(0,
-                                 num_blocks,
-                                 (num_seqs, max_num_blocks_per_seq),
-                                 dtype=torch.int32)
+    block_tables = torch.randint(
+        0, num_blocks, (num_seqs, max_num_blocks_per_seq), dtype=torch.int32
+    )
 
     output = torch.empty_like(query)
 
@@ -188,5 +186,7 @@ def test_triton_unified_attn(
     atol, rtol = 1.5e-2, 1e-2
     if q_dtype is not None:
         atol, rtol = 1.5e-1, 1.5e-1
-    torch.testing.assert_close(output, ref_output, atol=atol, rtol=rtol), \
-        f"{torch.max(torch.abs(output - ref_output))}"
+    (
+        torch.testing.assert_close(output, ref_output, atol=atol, rtol=rtol),
+        f"{torch.max(torch.abs(output - ref_output))}",
+    )
diff --git a/tests/kernels/core/test_activation.py b/tests/kernels/core/test_activation.py
index ec5c60fd7b0e..e8777ec4f59e 100644
--- a/tests/kernels/core/test_activation.py
+++ b/tests/kernels/core/test_activation.py
@@ -8,19 +8,23 @@
 
 from tests.kernels.allclose_default import get_default_atol, get_default_rtol
 from tests.kernels.utils import opcheck
-from vllm.model_executor.layers.activation import (FastGELU, FatreluAndMul,
-                                                   GeluAndMul, MulAndSilu,
-                                                   NewGELU, QuickGELU,
-                                                   SiluAndMul, SwigluOAIAndMul)
+from vllm.model_executor.layers.activation import (
+    FastGELU,
+    FatreluAndMul,
+    GeluAndMul,
+    MulAndSilu,
+    NewGELU,
+    QuickGELU,
+    SiluAndMul,
+    SwigluOAIAndMul,
+)
 from vllm.platforms import current_platform
 
 DTYPES = [torch.half, torch.bfloat16, torch.float]
 NUM_TOKENS = [7, 83, 2048]  # Arbitrary values for testing
 D = [512, 13824]  # Arbitrary values for testing
 SEEDS = [0]
-CUDA_DEVICES = [
-    f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)
-]
+CUDA_DEVICES = [f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)]
 
 
 @pytest.mark.parametrize(
@@ -73,24 +77,19 @@ def test_act_and_mul(
     out = layer(x)
     ref_out = layer.forward_native(x)
     if activation == "swigluoai_and_mul":
-
         rtol = {
-            #For fp16, change the relative tolerance from 1e-3 to 2e-3
-            torch.float16:
-            2e-3,
-            torch.bfloat16:
-            2e-2,
-            torch.float:
-            1.3e-6
+            # For fp16, change the relative tolerance from 1e-3 to 2e-3
+            torch.float16: 2e-3,
+            torch.bfloat16: 2e-2,
+            torch.float: 1.3e-6,
         }
 
         def _get_rtol(output) -> float:
             return rtol[output.dtype]
 
-        torch.testing.assert_close(out,
-                                   ref_out,
-                                   atol=get_default_atol(out),
-                                   rtol=_get_rtol(out))
+        torch.testing.assert_close(
+            out, ref_out, atol=get_default_atol(out), rtol=_get_rtol(out)
+        )
     else:
         # The SiluAndMul, MulAndSilu, GELU and FatReLU implementations are
         # equivalent to the native PyTorch implementations, so we can do exact
@@ -98,7 +97,7 @@ def _get_rtol(output) -> float:
         torch.testing.assert_close(out, ref_out, atol=0.0, rtol=0.0)
 
     d = x.shape[-1] // 2
-    output_shape = (x.shape[:-1] + (d, ))
+    output_shape = x.shape[:-1] + (d,)
     out = torch.empty(output_shape, dtype=x.dtype, device=x.device)
     if activation == "fatrelu":
         opcheck(fn, (out, x, threshold))
@@ -108,9 +107,14 @@ def _get_rtol(output) -> float:
         opcheck(fn, (out, x))
 
 
-@pytest.mark.parametrize("activation", [(FastGELU, torch.ops._C.gelu_fast),
-                                        (NewGELU, torch.ops._C.gelu_new),
-                                        (QuickGELU, torch.ops._C.gelu_quick)])
+@pytest.mark.parametrize(
+    "activation",
+    [
+        (FastGELU, torch.ops._C.gelu_fast),
+        (NewGELU, torch.ops._C.gelu_new),
+        (QuickGELU, torch.ops._C.gelu_quick),
+    ],
+)
 @pytest.mark.parametrize("num_tokens", NUM_TOKENS)
 @pytest.mark.parametrize("d", D)
 @pytest.mark.parametrize("dtype", DTYPES)
@@ -132,10 +136,9 @@ def test_activation(
     fn = activation[1]
     out = layer(x)
     ref_out = layer.forward_native(x)
-    torch.testing.assert_close(out,
-                               ref_out,
-                               atol=get_default_atol(out),
-                               rtol=get_default_rtol(out))
+    torch.testing.assert_close(
+        out, ref_out, atol=get_default_atol(out), rtol=get_default_rtol(out)
+    )
 
     out = torch.empty_like(x)
     opcheck(fn, (out, x))
diff --git a/tests/kernels/core/test_fused_quant_layernorm.py b/tests/kernels/core/test_fused_quant_layernorm.py
index 19703b8a2f97..52133ec53d1d 100644
--- a/tests/kernels/core/test_fused_quant_layernorm.py
+++ b/tests/kernels/core/test_fused_quant_layernorm.py
@@ -24,9 +24,7 @@
 ADD_RESIDUAL = [False, True]
 SCALE_UBS = [True, False]
 SEEDS = [0]
-CUDA_DEVICES = [
-    f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)
-]
+CUDA_DEVICES = [f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)]
 
 EPS = 1e-6
 
@@ -34,13 +32,12 @@
 
 
 def as_float32_tensor(x: Union[float, torch.tensor]) -> torch.tensor:
-    return torch.as_tensor(x, dtype=torch.float32, device='cuda')
+    return torch.as_tensor(x, dtype=torch.float32, device="cuda")
 
 
-def ref_rms_norm(rms_norm_layer: RMSNorm,
-                 x: torch.Tensor,
-                 residual: Optional[torch.Tensor]) \
-        -> tuple[torch.Tensor, Optional[torch.Tensor]]:
+def ref_rms_norm(
+    rms_norm_layer: RMSNorm, x: torch.Tensor, residual: Optional[torch.Tensor]
+) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
     if residual is not None:
         residual = residual.clone()
         out, residual = rms_norm_layer.forward_native(x, residual)
@@ -50,12 +47,13 @@ def ref_rms_norm(rms_norm_layer: RMSNorm,
     return out, residual
 
 
-def ref_dynamic_per_token_quant(rms_norm_layer: RMSNorm,
-                                x: torch.Tensor,
-                                quant_dtype: torch.dtype,
-                                residual: Optional[torch.Tensor],
-                                scale_ub: Optional[torch.Tensor]) \
-        -> tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor]]:
+def ref_dynamic_per_token_quant(
+    rms_norm_layer: RMSNorm,
+    x: torch.Tensor,
+    quant_dtype: torch.dtype,
+    residual: Optional[torch.Tensor],
+    scale_ub: Optional[torch.Tensor],
+) -> tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor]]:
     if scale_ub is not None:
         assert quant_dtype == torch.float8_e4m3fn
 
@@ -64,9 +62,9 @@ def ref_dynamic_per_token_quant(rms_norm_layer: RMSNorm,
 
     # Quant
     if quant_dtype == torch.float8_e4m3fn:
-        torch_out, scales = ops.scaled_fp8_quant(torch_out,
-                                                 scale_ub=scale_ub,
-                                                 use_per_token_if_dynamic=True)
+        torch_out, scales = ops.scaled_fp8_quant(
+            torch_out, scale_ub=scale_ub, use_per_token_if_dynamic=True
+        )
     else:
         assert quant_dtype == torch.int8
         torch_out, scales = ops.scaled_int8_quant(torch_out)
@@ -74,38 +72,41 @@ def ref_dynamic_per_token_quant(rms_norm_layer: RMSNorm,
     return torch_out, scales, residual
 
 
-def ref_impl(rms_norm_layer: RMSNorm,
-             x: torch.Tensor,
-             quant_dtype: torch.dtype,
-             residual: Optional[torch.Tensor],
-             scale_ub: Optional[torch.Tensor]) \
-        -> tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor]]:
-    return ref_dynamic_per_token_quant(rms_norm_layer, x, quant_dtype,
-                                       residual, scale_ub)
+def ref_impl(
+    rms_norm_layer: RMSNorm,
+    x: torch.Tensor,
+    quant_dtype: torch.dtype,
+    residual: Optional[torch.Tensor],
+    scale_ub: Optional[torch.Tensor],
+) -> tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor]]:
+    return ref_dynamic_per_token_quant(
+        rms_norm_layer, x, quant_dtype, residual, scale_ub
+    )
 
 
-def ops_dynamic_per_token_quant(weight: torch.Tensor,
-                                x: torch.Tensor,
-                                quant_dtype: torch.dtype,
-                                residual: Optional[torch.Tensor],
-                                scale_ub: Optional[torch.Tensor]) \
-        -> tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor]]:
+def ops_dynamic_per_token_quant(
+    weight: torch.Tensor,
+    x: torch.Tensor,
+    quant_dtype: torch.dtype,
+    residual: Optional[torch.Tensor],
+    scale_ub: Optional[torch.Tensor],
+) -> tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor]]:
     if residual is not None:
         residual = residual.clone()
-    out, scales = ops.rms_norm_dynamic_per_token_quant(x, weight, EPS,
-                                                       quant_dtype, scale_ub,
-                                                       residual)
+    out, scales = ops.rms_norm_dynamic_per_token_quant(
+        x, weight, EPS, quant_dtype, scale_ub, residual
+    )
     return out, scales, residual
 
 
-def ops_impl(weight: torch.Tensor,
-             x: torch.Tensor,
-             quant_dtype: torch.dtype,
-             residual: Optional[torch.Tensor],
-             scale_ub: Optional[torch.Tensor]) \
-        -> tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor]]:
-    return ops_dynamic_per_token_quant(weight, x, quant_dtype, residual,
-                                       scale_ub)
+def ops_impl(
+    weight: torch.Tensor,
+    x: torch.Tensor,
+    quant_dtype: torch.dtype,
+    residual: Optional[torch.Tensor],
+    scale_ub: Optional[torch.Tensor],
+) -> tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor]]:
+    return ops_dynamic_per_token_quant(weight, x, quant_dtype, residual, scale_ub)
 
 
 @pytest.mark.parametrize("num_tokens, hidden_size", NUM_TOKENS_HIDDEN_SIZES)
@@ -146,12 +147,14 @@ def test_rms_norm(
     residual = torch.randn_like(x) * scale if add_residual else None
     if scale_ub is not None:
         rms_x, _ = ref_rms_norm(layer, x, residual)
-        scale_ub = torch.mean(rms_x).to(dtype=torch.float32, device='cuda')
+        scale_ub = torch.mean(rms_x).to(dtype=torch.float32, device="cuda")
 
-    ref_out, ref_scales, ref_residual = \
-        ref_impl(layer, x, quant_dtype, residual, scale_ub)
-    ops_out, ops_scales, ops_residual = \
-        ops_impl(layer.weight, x, quant_dtype, residual, scale_ub)
+    ref_out, ref_scales, ref_residual = ref_impl(
+        layer, x, quant_dtype, residual, scale_ub
+    )
+    ops_out, ops_scales, ops_residual = ops_impl(
+        layer.weight, x, quant_dtype, residual, scale_ub
+    )
 
     assert ref_out.dtype == quant_dtype
     assert ops_out.dtype == quant_dtype
@@ -160,15 +163,18 @@ def test_rms_norm(
         # big atol to account for round-off errors.
         assert torch.allclose(ref_out, ops_out, atol=1)
     else:
-        assert torch.allclose(ref_out.to(dtype=torch.float32),
-                              ops_out.to(dtype=torch.float32))
+        assert torch.allclose(
+            ref_out.to(dtype=torch.float32), ops_out.to(dtype=torch.float32)
+        )
     if add_residual:
         assert torch.allclose(ref_residual, ops_residual)
 
     output = torch.empty_like(x, dtype=quant_dtype)
-    scales = torch.empty((x.numel() // x.shape[-1], 1),
-                         device=x.device,
-                         dtype=torch.float32)
-
-    opcheck(torch.ops._C.rms_norm_dynamic_per_token_quant,
-            (output, x, layer.weight, scales, 1e-5, scale_ub, residual))
+    scales = torch.empty(
+        (x.numel() // x.shape[-1], 1), device=x.device, dtype=torch.float32
+    )
+
+    opcheck(
+        torch.ops._C.rms_norm_dynamic_per_token_quant,
+        (output, x, layer.weight, scales, 1e-5, scale_ub, residual),
+    )
diff --git a/tests/kernels/core/test_layernorm.py b/tests/kernels/core/test_layernorm.py
index 53e6d793cf2f..7553d45e0057 100644
--- a/tests/kernels/core/test_layernorm.py
+++ b/tests/kernels/core/test_layernorm.py
@@ -11,13 +11,22 @@
 
 DTYPES = [torch.half, torch.bfloat16, torch.float]
 NUM_TOKENS = [7, 83, 4096]  # Arbitrary values for testing
-HIDDEN_SIZES = [8, 768, 769, 770, 771, 5120, 5124, 5125, 5126, 8192,
-                8199]  # Arbitrary values for testing
+HIDDEN_SIZES = [
+    8,
+    768,
+    769,
+    770,
+    771,
+    5120,
+    5124,
+    5125,
+    5126,
+    8192,
+    8199,
+]  # Arbitrary values for testing
 ADD_RESIDUAL = [False, True]
 SEEDS = [0]
-CUDA_DEVICES = [
-    f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)
-]
+CUDA_DEVICES = [f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)]
 
 
 @pytest.mark.parametrize("num_tokens", NUM_TOKENS)
@@ -63,11 +72,14 @@ def test_rms_norm(
         torch.testing.assert_close(out, ref_out, atol=1e-2, rtol=1e-2)
 
     if residual is not None:
-        opcheck(torch.ops._C.fused_add_rms_norm,
-                (x, residual, layer.weight.data, layer.variance_epsilon))
+        opcheck(
+            torch.ops._C.fused_add_rms_norm,
+            (x, residual, layer.weight.data, layer.variance_epsilon),
+        )
     else:
-        opcheck(torch.ops._C.rms_norm,
-                (out, x, layer.weight.data, layer.variance_epsilon))
+        opcheck(
+            torch.ops._C.rms_norm, (out, x, layer.weight.data, layer.variance_epsilon)
+        )
 
 
 @pytest.mark.parametrize("num_tokens", NUM_TOKENS)
@@ -98,7 +110,8 @@ def test_poly_norm(
 
     opcheck(
         torch.ops._C.poly_norm,
-        (out, x, layer.weight.data, layer.bias.data, layer.variance_epsilon))
+        (out, x, layer.weight.data, layer.bias.data, layer.variance_epsilon),
+    )
 
 
 @pytest.mark.parametrize("num_tokens", NUM_TOKENS)
@@ -144,7 +157,8 @@ def test_fused_rms_norm_quant(
 
     if add_residual:
         torch.ops._C.fused_add_rms_norm_static_fp8_quant(
-            out_quant_fused, x, residual_fused, weight, quant_scale_t, 1e-6)
+            out_quant_fused, x, residual_fused, weight, quant_scale_t, 1e-6
+        )
 
         # Unfused kernel is in-place so it goes second
         # Also use a separate clone of x to avoid modifying the input
@@ -152,29 +166,32 @@ def test_fused_rms_norm_quant(
         x_unfused = x_unfused_base[..., :hidden_size]
         assert x_unfused.is_contiguous() != strided_input
         torch.ops._C.fused_add_rms_norm(x_unfused, residual, weight, 1e-6)
-        torch.ops._C.static_scaled_fp8_quant(out_quant, x_unfused.contiguous(),
-                                             quant_scale_t)
+        torch.ops._C.static_scaled_fp8_quant(
+            out_quant, x_unfused.contiguous(), quant_scale_t
+        )
 
         torch.cuda.synchronize()
-        torch.testing.assert_close(residual_fused,
-                                   residual,
-                                   atol=1e-2,
-                                   rtol=1e-2)
+        torch.testing.assert_close(residual_fused, residual, atol=1e-2, rtol=1e-2)
         opcheck(
             torch.ops._C.fused_add_rms_norm_static_fp8_quant,
-            (out_quant_fused, x, residual_fused, weight, quant_scale_t, 1e-6))
+            (out_quant_fused, x, residual_fused, weight, quant_scale_t, 1e-6),
+        )
     else:
-        torch.ops._C.rms_norm_static_fp8_quant(out_quant_fused, x, weight,
-                                               quant_scale_t, 1e-6)
+        torch.ops._C.rms_norm_static_fp8_quant(
+            out_quant_fused, x, weight, quant_scale_t, 1e-6
+        )
 
         torch.ops._C.rms_norm(out_norm, x, weight, 1e-6)
-        torch.ops._C.static_scaled_fp8_quant(out_quant, out_norm,
-                                             quant_scale_t)
+        torch.ops._C.static_scaled_fp8_quant(out_quant, out_norm, quant_scale_t)
 
-        opcheck(torch.ops._C.rms_norm_static_fp8_quant,
-                (out_quant_fused, x, weight, quant_scale_t, 1e-6))
-
-    torch.testing.assert_close(out_quant.to(dtype=torch.float32),
-                               out_quant_fused.to(dtype=torch.float32),
-                               atol=1e-3,
-                               rtol=1e-3)
+        opcheck(
+            torch.ops._C.rms_norm_static_fp8_quant,
+            (out_quant_fused, x, weight, quant_scale_t, 1e-6),
+        )
+
+    torch.testing.assert_close(
+        out_quant.to(dtype=torch.float32),
+        out_quant_fused.to(dtype=torch.float32),
+        atol=1e-3,
+        rtol=1e-3,
+    )
diff --git a/tests/kernels/core/test_mrope.py b/tests/kernels/core/test_mrope.py
index 5a903438f5e9..02b795721f46 100644
--- a/tests/kernels/core/test_mrope.py
+++ b/tests/kernels/core/test_mrope.py
@@ -14,25 +14,25 @@
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 
 
-def generate_test_data(num_tokens: int, num_q_heads: int, num_kv_heads: int,
-                       head_size: int, max_position_embeddings: int,
-                       dtype: torch.dtype, device: torch.device):
+def generate_test_data(
+    num_tokens: int,
+    num_q_heads: int,
+    num_kv_heads: int,
+    head_size: int,
+    max_position_embeddings: int,
+    dtype: torch.dtype,
+    device: torch.device,
+):
     """Generate test data for given configuration."""
     current_platform.seed_everything(42)
     # Create 2D positions (3, num_tokens) for multimodal case
-    positions = torch.randint(0,
-                              max_position_embeddings // 4, (3, num_tokens),
-                              device=device)
+    positions = torch.randint(
+        0, max_position_embeddings // 4, (3, num_tokens), device=device
+    )
 
     # Create query and key tensors
-    query = torch.randn(num_tokens,
-                        num_q_heads * head_size,
-                        dtype=dtype,
-                        device=device)
-    key = torch.randn(num_tokens,
-                      num_kv_heads * head_size,
-                      dtype=dtype,
-                      device=device)
+    query = torch.randn(num_tokens, num_q_heads * head_size, dtype=dtype, device=device)
+    key = torch.randn(num_tokens, num_kv_heads * head_size, dtype=dtype, device=device)
 
     return positions, query, key
 
@@ -59,7 +59,8 @@ class MRoPETestInfo(NamedTuple):
                 Version(TRANSFORMERS_BASE_VERSION) < Version("4.57.0"),
                 reason="Qwen3-VL only available after Transformers v4.57",
             )
-        ]),
+        ],
+    ),
     MRoPETestInfo(
         model_name="Qwen/Qwen3-VL-30B-A3B-Instruct",
         marks=[
@@ -67,24 +68,33 @@ class MRoPETestInfo(NamedTuple):
                 Version(TRANSFORMERS_BASE_VERSION) < Version("4.57.0"),
                 reason="Qwen3-VL only available after Transformers v4.57",
             )
-        ]),
+        ],
+    ),
 ]
 
 num_tokens_list = [11, 8192]
 
 
-@pytest.mark.skipif(not current_platform.is_cuda_alike(),
-                    reason="Skipping CUDA/ROCm only tests.")
-@pytest.mark.parametrize("model_info, model_name", [
-    pytest.param(test_config, test_config.model_name, marks=test_config.marks)
-    for test_config in MODELS_TO_TEST
-])
+@pytest.mark.skipif(
+    not current_platform.is_cuda_alike(), reason="Skipping CUDA/ROCm only tests."
+)
+@pytest.mark.parametrize(
+    "model_info, model_name",
+    [
+        pytest.param(test_config, test_config.model_name, marks=test_config.marks)
+        for test_config in MODELS_TO_TEST
+    ],
+)
 @pytest.mark.parametrize("tp_size", [1, 2])
 @pytest.mark.parametrize("dtype", [torch.bfloat16])
 @pytest.mark.parametrize("num_tokens", num_tokens_list)
-def test_mrope(model_name: str, model_info: MRoPETestInfo, tp_size: int,
-               dtype: torch.dtype, num_tokens: int):
-
+def test_mrope(
+    model_name: str,
+    model_info: MRoPETestInfo,
+    tp_size: int,
+    dtype: torch.dtype,
+    num_tokens: int,
+):
     atol = model_info.atol
     rtol = model_info.rtol
 
@@ -96,8 +106,11 @@ def test_mrope(model_name: str, model_info: MRoPETestInfo, tp_size: int,
     total_num_heads = config.num_attention_heads
     num_heads = total_num_heads // tp_size
     num_kv_heads = max(1, total_num_kv_heads // tp_size)
-    head_dim = (config.head_dim if hasattr(config, "head_dim") else
-                config.hidden_size // total_num_heads)
+    head_dim = (
+        config.head_dim
+        if hasattr(config, "head_dim")
+        else config.hidden_size // total_num_heads
+    )
     is_neox_style = True
 
     rope_theta = config.rope_theta
@@ -117,9 +130,9 @@ def test_mrope(model_name: str, model_info: MRoPETestInfo, tp_size: int,
 
     # create q k v input tensors
     # create rotary pos emb input tensors
-    positions, query, key = generate_test_data(num_tokens, num_heads,
-                                               num_kv_heads, head_dim,
-                                               max_position, dtype, device)
+    positions, query, key = generate_test_data(
+        num_tokens, num_heads, num_kv_heads, head_dim, max_position, dtype, device
+    )
 
     query_native, key_native = mrope_helper_class.forward_native(
         positions,
@@ -137,19 +150,26 @@ def test_mrope(model_name: str, model_info: MRoPETestInfo, tp_size: int,
     torch.testing.assert_close(key_native, key_cuda, atol=atol, rtol=rtol)
 
 
-@pytest.mark.skipif(not current_platform.is_cuda_alike(),
-                    reason="Skipping CUDA/ROCm only tests.")
-@pytest.mark.parametrize("model_info, model_name", [
-    pytest.param(test_config, test_config.model_name, marks=test_config.marks)
-    for test_config in MODELS_TO_TEST
-])
+@pytest.mark.skipif(
+    not current_platform.is_cuda_alike(), reason="Skipping CUDA/ROCm only tests."
+)
+@pytest.mark.parametrize(
+    "model_info, model_name",
+    [
+        pytest.param(test_config, test_config.model_name, marks=test_config.marks)
+        for test_config in MODELS_TO_TEST
+    ],
+)
 @pytest.mark.parametrize("tp_size", [1, 2])
 @pytest.mark.parametrize("dtype", [torch.bfloat16])
 @pytest.mark.parametrize("num_tokens", num_tokens_list)
-def test_mrope_torch_compile_tracing(model_name: str,
-                                     model_info: MRoPETestInfo, tp_size: int,
-                                     dtype: torch.dtype, num_tokens: int):
-
+def test_mrope_torch_compile_tracing(
+    model_name: str,
+    model_info: MRoPETestInfo,
+    tp_size: int,
+    dtype: torch.dtype,
+    num_tokens: int,
+):
     atol = model_info.atol
     rtol = model_info.rtol
 
@@ -161,8 +181,11 @@ def test_mrope_torch_compile_tracing(model_name: str,
     total_num_heads = config.num_attention_heads
     num_heads = total_num_heads // tp_size
     num_kv_heads = max(1, total_num_kv_heads // tp_size)
-    head_dim = (config.head_dim if hasattr(config, "head_dim") else
-                config.hidden_size // total_num_heads)
+    head_dim = (
+        config.head_dim
+        if hasattr(config, "head_dim")
+        else config.hidden_size // total_num_heads
+    )
     is_neox_style = True
     rope_theta = config.rope_theta
     max_position = config.max_position_embeddings
@@ -180,16 +203,16 @@ def test_mrope_torch_compile_tracing(model_name: str,
     ).to(device=device)
 
     # Generate test data
-    positions, query, key = generate_test_data(num_tokens, num_heads,
-                                               num_kv_heads, head_dim,
-                                               max_position, dtype, device)
+    positions, query, key = generate_test_data(
+        num_tokens, num_heads, num_kv_heads, head_dim, max_position, dtype, device
+    )
 
     # Create a wrapper that makes the in-place function appear functional
     def functional_forward_cuda(pos, q, k):
         """Wrapper that converts in-place operation to functional style
 
         CUDA Graph does not support in-place operations.
-        This wrapper creates working copies of the 
+        This wrapper creates working copies of the
         input tensors and modifies them.
         """
         q_work = q.clone()  # Create working copies
@@ -206,11 +229,13 @@ def functional_forward_cuda(pos, q, k):
     )
 
     try:
-        compiled_forward_cuda = torch.compile(functional_forward_cuda,
-                                              fullgraph=True,
-                                              backend="inductor",
-                                              mode="reduce-overhead",
-                                              dynamic=False)
+        compiled_forward_cuda = torch.compile(
+            functional_forward_cuda,
+            fullgraph=True,
+            backend="inductor",
+            mode="reduce-overhead",
+            dynamic=False,
+        )
 
         # Run compiled version
         query_compiled_cuda, key_compiled_cuda = compiled_forward_cuda(
@@ -225,25 +250,16 @@ def functional_forward_cuda(pos, q, k):
         mrope_helper_class.forward_cuda(positions, query_cuda, key_cuda)
 
         # Verify results
-        torch.testing.assert_close(query_compiled_cuda,
-                                   query_cuda,
-                                   atol=atol,
-                                   rtol=rtol)
-        torch.testing.assert_close(key_compiled_cuda,
-                                   key_cuda,
-                                   atol=atol,
-                                   rtol=rtol)
-        torch.testing.assert_close(query_compiled_cuda,
-                                   query_native,
-                                   atol=atol,
-                                   rtol=rtol)
-        torch.testing.assert_close(key_compiled_cuda,
-                                   key_native,
-                                   atol=atol,
-                                   rtol=rtol)
+        torch.testing.assert_close(
+            query_compiled_cuda, query_cuda, atol=atol, rtol=rtol
+        )
+        torch.testing.assert_close(key_compiled_cuda, key_cuda, atol=atol, rtol=rtol)
+        torch.testing.assert_close(
+            query_compiled_cuda, query_native, atol=atol, rtol=rtol
+        )
+        torch.testing.assert_close(key_compiled_cuda, key_native, atol=atol, rtol=rtol)
 
         print("✓ forward_cuda successfully traced with torch.compile inductor")
 
     except Exception as e:
-        pytest.fail(
-            f"forward_cuda failed to trace with torch.compile inductor: {e}")
+        pytest.fail(f"forward_cuda failed to trace with torch.compile inductor: {e}")
diff --git a/tests/kernels/core/test_permute_cols.py b/tests/kernels/core/test_permute_cols.py
index e18f6230dbce..1e264735cb3c 100644
--- a/tests/kernels/core/test_permute_cols.py
+++ b/tests/kernels/core/test_permute_cols.py
@@ -8,11 +8,11 @@
 from vllm._custom_ops import permute_cols
 
 
-@pytest.mark.parametrize('shape', [(1, 512), (544, 4096), (67, 8192)])
-@pytest.mark.parametrize('dtype', [torch.bfloat16, torch.float16])
+@pytest.mark.parametrize("shape", [(1, 512), (544, 4096), (67, 8192)])
+@pytest.mark.parametrize("dtype", [torch.bfloat16, torch.float16])
 def test_permute_cols(shape, dtype):
     x = torch.randn(shape, dtype=dtype).cuda()
     perm = torch.randperm(x.shape[1]).to(torch.int).cuda()
     opcheck(torch.ops._C.permute_cols, (x, perm))
     y = permute_cols(x, perm)
-    torch.testing.assert_close(y, x[:, perm])
\ No newline at end of file
+    torch.testing.assert_close(y, x[:, perm])
diff --git a/tests/kernels/core/test_pos_encoding.py b/tests/kernels/core/test_pos_encoding.py
index 1235e3222a78..799e0a3f2a2b 100644
--- a/tests/kernels/core/test_pos_encoding.py
+++ b/tests/kernels/core/test_pos_encoding.py
@@ -19,30 +19,33 @@
 BATCH_SIZES = [5]  # Arbitrary values for testing
 SEQ_LENS = [11, 8192]  # Arbitrary values for testing
 SEEDS = [0]
-CUDA_DEVICES = [
-    f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)
-]
+CUDA_DEVICES = [f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)]
 USE_KEY = [True, False]
 
 
-def _get_flat_tensor_shape(batch_size: int, seq_len: int, num_heads: int,
-                           head_size: int) -> tuple[int, ...]:
+def _get_flat_tensor_shape(
+    batch_size: int, seq_len: int, num_heads: int, head_size: int
+) -> tuple[int, ...]:
     return (batch_size, seq_len, num_heads * head_size)
 
 
 # For testing sliced tensors
-def _get_padded_tensor_shape(batch_size: int, seq_len: int, num_heads: int,
-                             head_size: int) -> tuple[int, ...]:
+def _get_padded_tensor_shape(
+    batch_size: int, seq_len: int, num_heads: int, head_size: int
+) -> tuple[int, ...]:
     return (batch_size, seq_len, num_heads, head_size + 64)
 
 
-def _get_batch_tensor_shape(batch_size: int, seq_len: int, num_heads: int,
-                            head_size: int) -> tuple[int, ...]:
+def _get_batch_tensor_shape(
+    batch_size: int, seq_len: int, num_heads: int, head_size: int
+) -> tuple[int, ...]:
     return (batch_size, seq_len, num_heads, head_size)
 
 
 TENSORS_SHAPES_FN = [
-    _get_batch_tensor_shape, _get_flat_tensor_shape, _get_padded_tensor_shape
+    _get_batch_tensor_shape,
+    _get_flat_tensor_shape,
+    _get_padded_tensor_shape,
 ]
 
 
@@ -97,41 +100,63 @@ def test_rotary_embedding(
     ref_query, ref_key = rope.forward_native(positions, query, key)
     out_query, out_key = rope.forward(positions, query, key)
     # Compare the results.
-    torch.testing.assert_close(out_query,
-                               ref_query,
-                               atol=get_default_atol(out_query),
-                               rtol=get_default_rtol(out_query))
+    torch.testing.assert_close(
+        out_query,
+        ref_query,
+        atol=get_default_atol(out_query),
+        rtol=get_default_rtol(out_query),
+    )
     if use_key:
-        torch.testing.assert_close(out_key,
-                                   ref_key,
-                                   atol=get_default_atol(out_key),
-                                   rtol=get_default_rtol(out_key))
+        torch.testing.assert_close(
+            out_key,
+            ref_key,
+            atol=get_default_atol(out_key),
+            rtol=get_default_rtol(out_key),
+        )
     else:
-        assert ref_key is None and out_key is None, \
-            "expected returned key to be None"
+        assert ref_key is None and out_key is None, "expected returned key to be None"
 
 
 @torch.inference_mode()
 def test_rope_module_cache():
     MAX_POSITIONS = [123, 1234]
     BASES = [10000, 1000000]
-    ROPE_SCALINGS = (None, {
-        "rope_type": "linear",
-        "factor": (1, )
-    }, {
-        "rope_type": "dynamic",
-        "factor": 1
-    })
-    settings = (HEAD_SIZES, ROTARY_DIMS, MAX_POSITIONS, BASES, IS_NEOX_STYLE,
-                ROPE_SCALINGS, DTYPES)
+    ROPE_SCALINGS = (
+        None,
+        {"rope_type": "linear", "factor": (1,)},
+        {"rope_type": "dynamic", "factor": 1},
+    )
+    settings = (
+        HEAD_SIZES,
+        ROTARY_DIMS,
+        MAX_POSITIONS,
+        BASES,
+        IS_NEOX_STYLE,
+        ROPE_SCALINGS,
+        DTYPES,
+    )
     rope_setting_id_map: dict[str, int] = {}
     for setting in product(*settings):
-        head_size, rotary_dim, max_position, base, \
-            is_neox_stype, rope_scaling, dtype = setting
+        (
+            head_size,
+            rotary_dim,
+            max_position,
+            base,
+            is_neox_stype,
+            rope_scaling,
+            dtype,
+        ) = setting
         if rotary_dim is None:
             rotary_dim = head_size
-        rope = get_rope(head_size, rotary_dim, max_position, base,
-                        is_neox_stype, rope_scaling, dtype)
+        rope = get_rope(
+            head_size,
+            rotary_dim,
+            max_position,
+            base,
+            is_neox_stype,
+            rope_scaling,
+            dtype,
+        )
         # different settings cannot share the same rope module
         assert id(rope) not in rope_setting_id_map.values()
         assert all(x.dtype == dtype for x in rope.buffers())
@@ -139,11 +164,25 @@ def test_rope_module_cache():
         rope_setting_id_map[str(setting)] = id(rope)
 
     for setting in product(*settings):
-        head_size, rotary_dim, max_position, base, \
-            is_neox_stype, rope_scaling, dtype = setting
+        (
+            head_size,
+            rotary_dim,
+            max_position,
+            base,
+            is_neox_stype,
+            rope_scaling,
+            dtype,
+        ) = setting
         if rotary_dim is None:
             rotary_dim = head_size
-        rope = get_rope(head_size, rotary_dim, max_position, base,
-                        is_neox_stype, rope_scaling, dtype)
+        rope = get_rope(
+            head_size,
+            rotary_dim,
+            max_position,
+            base,
+            is_neox_stype,
+            rope_scaling,
+            dtype,
+        )
         # check if cache take effect
         assert id(rope) == rope_setting_id_map[str(setting)]
diff --git a/tests/kernels/core/test_rotary_embedding.py b/tests/kernels/core/test_rotary_embedding.py
index 5857dd5ba3fa..0a292a3e2ae7 100644
--- a/tests/kernels/core/test_rotary_embedding.py
+++ b/tests/kernels/core/test_rotary_embedding.py
@@ -13,17 +13,20 @@
 from vllm.model_executor.layers.rotary_embedding import RotaryEmbedding
 
 
-def rotary_embedding_opcheck(rot,
-                             positions: torch.Tensor,
-                             query: torch.Tensor,
-                             key: Optional[torch.Tensor] = None):
+def rotary_embedding_opcheck(
+    rot,
+    positions: torch.Tensor,
+    query: torch.Tensor,
+    key: Optional[torch.Tensor] = None,
+):
     cos_sin_cache = rot.cos_sin_cache.to(query.device, dtype=query.dtype)
 
     # ops.rotary_embedding() is a in-place operation
     # that updates the query and key tensors.
-    opcheck(torch.ops._C.rotary_embedding,
-            (positions, query, key, rot.head_size, cos_sin_cache,
-             rot.is_neox_style))
+    opcheck(
+        torch.ops._C.rotary_embedding,
+        (positions, query, key, rot.head_size, cos_sin_cache, rot.is_neox_style),
+    )
 
 
 @pytest.mark.parametrize("device", ["cuda"])
@@ -34,26 +37,30 @@ def rotary_embedding_opcheck(rot,
 @pytest.mark.parametrize("seq_len", [11, 1024])
 @pytest.mark.parametrize("use_key", [True, False])
 @pytest.mark.parametrize("head_stride_is_contiguous", [True, False])
-def test_rotary_embedding_opcheck(dist_init, device, max_position,
-                                  is_neox_style, rotary_dim, head_size,
-                                  seq_len, use_key, head_stride_is_contiguous):
+def test_rotary_embedding_opcheck(
+    dist_init,
+    device,
+    max_position,
+    is_neox_style,
+    rotary_dim,
+    head_size,
+    seq_len,
+    use_key,
+    head_stride_is_contiguous,
+):
     batch_size = 1
     base = 10000
     num_heads = 7
-    rot = RotaryEmbedding(head_size, rotary_dim, max_position, base,
-                          is_neox_style, torch.float32)
+    rot = RotaryEmbedding(
+        head_size, rotary_dim, max_position, base, is_neox_style, torch.float32
+    )
 
-    positions = torch.randint(0,
-                              max_position, (batch_size, seq_len),
-                              device=device)
+    positions = torch.randint(0, max_position, (batch_size, seq_len), device=device)
     head_stride = head_size + (64 if head_stride_is_contiguous else 0)
 
-    query = torch.randn(batch_size,
-                        seq_len,
-                        num_heads,
-                        head_stride,
-                        dtype=torch.float32,
-                        device=device)
+    query = torch.randn(
+        batch_size, seq_len, num_heads, head_stride, dtype=torch.float32, device=device
+    )
     key = torch.randn_like(query) if use_key else None
     query = query[..., :head_size]
     key = key[..., :head_size] if use_key else None
@@ -64,5 +71,8 @@ def test_rotary_embedding_opcheck(dist_init, device, max_position,
     # [..., num_heads * head_dim] shape/layout
     if head_stride_is_contiguous:
         rotary_embedding_opcheck(
-            rot, positions, query.flatten(start_dim=-2),
-            key.flatten(start_dim=-2) if use_key else None)
+            rot,
+            positions,
+            query.flatten(start_dim=-2),
+            key.flatten(start_dim=-2) if use_key else None,
+        )
diff --git a/tests/kernels/core/test_uva.py b/tests/kernels/core/test_uva.py
index c71215e4c646..73738175e5c7 100644
--- a/tests/kernels/core/test_uva.py
+++ b/tests/kernels/core/test_uva.py
@@ -5,20 +5,14 @@
 
 from vllm.utils import get_cuda_view_from_cpu_tensor, is_uva_available
 
-CUDA_DEVICES = [
-    f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)
-]
+CUDA_DEVICES = [f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)]
 
 
 @pytest.mark.skipif(not is_uva_available(), reason="UVA is not available.")
 @pytest.mark.parametrize("device", CUDA_DEVICES)
 def test_cpu_write(device):
     torch.set_default_device(device)
-    cpu_tensor = torch.zeros(10,
-                             10,
-                             device="cpu",
-                             pin_memory=True,
-                             dtype=torch.int32)
+    cpu_tensor = torch.zeros(10, 10, device="cpu", pin_memory=True, dtype=torch.int32)
     cuda_view = get_cuda_view_from_cpu_tensor(cpu_tensor)
     assert cuda_view.device.type == "cuda"
 
@@ -40,11 +34,7 @@ def test_cpu_write(device):
 @pytest.mark.parametrize("device", CUDA_DEVICES)
 def test_gpu_write(device):
     torch.set_default_device(device)
-    cpu_tensor = torch.zeros(10,
-                             10,
-                             device="cpu",
-                             pin_memory=True,
-                             dtype=torch.int32)
+    cpu_tensor = torch.zeros(10, 10, device="cpu", pin_memory=True, dtype=torch.int32)
     cuda_view = get_cuda_view_from_cpu_tensor(cpu_tensor)
     assert cuda_view.device.type == "cuda"
 
@@ -59,4 +49,4 @@ def test_gpu_write(device):
 
     assert cpu_tensor[0, 0] == 2
     assert cpu_tensor[2, 3] == 4
-    assert cpu_tensor[4, 5] == -2
\ No newline at end of file
+    assert cpu_tensor[4, 5] == -2
diff --git a/tests/kernels/mamba/test_causal_conv1d.py b/tests/kernels/mamba/test_causal_conv1d.py
index 411bd9e904b0..f5bac4f1ac12 100644
--- a/tests/kernels/mamba/test_causal_conv1d.py
+++ b/tests/kernels/mamba/test_causal_conv1d.py
@@ -10,7 +10,9 @@
 
 from vllm.attention.backends.utils import PAD_SLOT_ID
 from vllm.model_executor.layers.mamba.ops.causal_conv1d import (
-    causal_conv1d_fn, causal_conv1d_update)
+    causal_conv1d_fn,
+    causal_conv1d_update,
+)
 from vllm.platforms import current_platform
 
 
@@ -39,18 +41,15 @@ def causal_conv1d_ref(
     seqlen = x.shape[-1]
     dim, width = weight.shape
     if initial_states is None:
-        out = F.conv1d(x,
-                       weight.unsqueeze(1),
-                       bias,
-                       padding=width - 1,
-                       groups=dim)
+        out = F.conv1d(x, weight.unsqueeze(1), bias, padding=width - 1, groups=dim)
     else:
         x = torch.cat([initial_states, x], dim=-1)
         out = F.conv1d(x, weight.unsqueeze(1), bias, padding=0, groups=dim)
     out = out[..., :seqlen]
     if return_final_states:
         final_states = F.pad(x, (width - 1 - x.shape[-1], 0)).to(
-            dtype_in)  # (batch, dim, width - 1)
+            dtype_in
+        )  # (batch, dim, width - 1)
         if final_states_out is not None:
             final_states_out.copy_(final_states)
         else:
@@ -59,12 +58,9 @@ def causal_conv1d_ref(
     return (out, None) if not return_final_states else (out, final_states_out)
 
 
-def causal_conv1d_update_ref(x,
-                             conv_state,
-                             weight,
-                             bias=None,
-                             activation=None,
-                             cache_seqlens=None):
+def causal_conv1d_update_ref(
+    x, conv_state, weight, bias=None, activation=None, cache_seqlens=None
+):
     """
     x: (batch, dim) or (batch, dim, seqlen)
     conv_state: (batch, dim, state_len), where state_len >= width - 1
@@ -91,24 +87,25 @@ def causal_conv1d_update_ref(x,
     assert weight.shape == (dim, width)
     if cache_seqlens is None:
         x_new = torch.cat([conv_state, x], dim=-1).to(
-            weight.dtype)  # (batch, dim, state_len + seqlen)
+            weight.dtype
+        )  # (batch, dim, state_len + seqlen)
         conv_state.copy_(x_new[:, :, -state_len:])
     else:
         width_idx = torch.arange(
-            -(width - 1), 0, dtype=torch.long,
-            device=x.device).unsqueeze(0) + cache_seqlens.unsqueeze(1)
-        width_idx = torch.remainder(width_idx, state_len).unsqueeze(1).expand(
-            -1, dim, -1)
-        x_new = torch.cat([conv_state.gather(2, width_idx), x],
-                          dim=-1).to(weight.dtype)
-        copy_idx = torch.arange(
-            seqlen, dtype=torch.long,
-            device=x.device).unsqueeze(0) + cache_seqlens.unsqueeze(1)
-        copy_idx = torch.remainder(copy_idx,
-                                   state_len).unsqueeze(1).expand(-1, dim, -1)
+            -(width - 1), 0, dtype=torch.long, device=x.device
+        ).unsqueeze(0) + cache_seqlens.unsqueeze(1)
+        width_idx = (
+            torch.remainder(width_idx, state_len).unsqueeze(1).expand(-1, dim, -1)
+        )
+        x_new = torch.cat([conv_state.gather(2, width_idx), x], dim=-1).to(weight.dtype)
+        copy_idx = torch.arange(seqlen, dtype=torch.long, device=x.device).unsqueeze(
+            0
+        ) + cache_seqlens.unsqueeze(1)
+        copy_idx = torch.remainder(copy_idx, state_len).unsqueeze(1).expand(-1, dim, -1)
         conv_state.scatter_(2, copy_idx, x)
-    out = F.conv1d(x_new, weight.unsqueeze(1), bias, padding=0,
-                   groups=dim)[:, :, -seqlen:]
+    out = F.conv1d(x_new, weight.unsqueeze(1), bias, padding=0, groups=dim)[
+        :, :, -seqlen:
+    ]
     if unsqueeze:
         out = out.squeeze(-1)
     return (out if activation is None else F.silu(out)).to(dtype=dtype_in)
@@ -117,15 +114,17 @@ def causal_conv1d_update_ref(x,
 @pytest.mark.parametrize("itype", [torch.bfloat16, torch.float])
 @pytest.mark.parametrize("silu_activation", [True])
 @pytest.mark.parametrize("has_bias", [True])
-def causal_conv1d_opcheck_fn(x: torch.Tensor,
-                             weight: torch.Tensor,
-                             bias: Optional[torch.Tensor] = None,
-                             cu_seq_len: Optional[torch.Tensor] = None,
-                             cache_indices: Optional[torch.Tensor] = None,
-                             has_initial_state: Optional[torch.Tensor] = None,
-                             conv_states: Optional[torch.Tensor] = None,
-                             activation: Optional[str] = "silu",
-                             pad_slot_id: int = PAD_SLOT_ID):
+def causal_conv1d_opcheck_fn(
+    x: torch.Tensor,
+    weight: torch.Tensor,
+    bias: Optional[torch.Tensor] = None,
+    cu_seq_len: Optional[torch.Tensor] = None,
+    cache_indices: Optional[torch.Tensor] = None,
+    has_initial_state: Optional[torch.Tensor] = None,
+    conv_states: Optional[torch.Tensor] = None,
+    activation: Optional[str] = "silu",
+    pad_slot_id: int = PAD_SLOT_ID,
+):
     """
     x: (batch, dim, seqlen)
     weight: (dim, width)
@@ -150,8 +149,7 @@ def causal_conv1d_opcheck_fn(x: torch.Tensor,
 @pytest.mark.parametrize("seqlen", [1])
 @pytest.mark.parametrize("width", [4])
 @pytest.mark.parametrize("dim", [2048, 2048 + 16, 4096])
-def test_causal_conv1d_update(dim, width, seqlen, has_bias, silu_activation,
-                              itype):
+def test_causal_conv1d_update(dim, width, seqlen, has_bias, silu_activation, itype):
     device = "cuda"
     rtol, atol = (3e-4, 1e-3) if itype == torch.float32 else (3e-3, 5e-3)
     if itype == torch.bfloat16:
@@ -167,23 +165,16 @@ def test_causal_conv1d_update(dim, width, seqlen, has_bias, silu_activation,
     bias = torch.randn(dim, device=device, dtype=itype) if has_bias else None
     conv_state_ref = conv_state.detach().clone()
     activation = None if not silu_activation else "silu"
-    out = causal_conv1d_update(x,
-                               conv_state,
-                               weight,
-                               bias,
-                               activation=activation)
-    out_ref = causal_conv1d_update_ref(x_ref,
-                                       conv_state_ref,
-                                       weight,
-                                       bias,
-                                       activation=activation)
+    out = causal_conv1d_update(x, conv_state, weight, bias, activation=activation)
+    out_ref = causal_conv1d_update_ref(
+        x_ref, conv_state_ref, weight, bias, activation=activation
+    )
 
     assert torch.equal(conv_state, conv_state_ref)
     assert torch.allclose(out, out_ref, rtol=rtol, atol=atol)
 
 
-@pytest.mark.parametrize("itype",
-                         [torch.float32, torch.float16, torch.bfloat16])
+@pytest.mark.parametrize("itype", [torch.float32, torch.float16, torch.bfloat16])
 @pytest.mark.parametrize("silu_activation", [False, True])
 @pytest.mark.parametrize("has_bias", [False, True])
 @pytest.mark.parametrize("seqlen", [1, 3])
@@ -192,9 +183,9 @@ def test_causal_conv1d_update(dim, width, seqlen, has_bias, silu_activation,
 # tests correctness in case subset of the sequences are padded
 @pytest.mark.parametrize("with_padding", [True, False])
 @pytest.mark.parametrize("batch_size", [3])
-def test_causal_conv1d_update_with_batch_gather(batch_size, with_padding, dim,
-                                                width, seqlen, has_bias,
-                                                silu_activation, itype):
+def test_causal_conv1d_update_with_batch_gather(
+    batch_size, with_padding, dim, width, seqlen, has_bias, silu_activation, itype
+):
     device = "cuda"
     rtol, atol = (3e-4, 1e-3) if itype == torch.float32 else (3e-3, 5e-3)
     if itype == torch.bfloat16:
@@ -209,31 +200,30 @@ def test_causal_conv1d_update_with_batch_gather(batch_size, with_padding, dim,
     total_entries = 10 * batch_size
 
     # x will be (batch, dim, seqlen) with contiguous along dim-axis
-    x = torch.randn(padded_batch_size, seqlen, dim, device=device,
-                    dtype=itype).transpose(1, 2)
+    x = torch.randn(
+        padded_batch_size, seqlen, dim, device=device, dtype=itype
+    ).transpose(1, 2)
 
     x_ref = x.clone()
 
     conv_state_indices = torch.randperm(total_entries)[:batch_size].to(
-        dtype=torch.int32, device=device)
-    unused_states_bool = torch.ones(total_entries,
-                                    dtype=torch.bool,
-                                    device=device)
+        dtype=torch.int32, device=device
+    )
+    unused_states_bool = torch.ones(total_entries, dtype=torch.bool, device=device)
     unused_states_bool[conv_state_indices] = False
-    padded_state_indices = torch.concat([
-        conv_state_indices,
-        torch.as_tensor(
-            [PAD_SLOT_ID] * padding, dtype=torch.int32, device=device)
-    ],
-                                        dim=0)
+    padded_state_indices = torch.concat(
+        [
+            conv_state_indices,
+            torch.as_tensor([PAD_SLOT_ID] * padding, dtype=torch.int32, device=device),
+        ],
+        dim=0,
+    )
 
     # conv_state will be (cache_lines, dim, state_len)
     # with contiguous along dim-axis
-    conv_state = torch.randn(total_entries,
-                             width - 1,
-                             dim,
-                             device=device,
-                             dtype=itype).transpose(1, 2)
+    conv_state = torch.randn(
+        total_entries, width - 1, dim, device=device, dtype=itype
+    ).transpose(1, 2)
 
     conv_state_for_padding_test = conv_state.clone()
 
@@ -242,22 +232,23 @@ def test_causal_conv1d_update_with_batch_gather(batch_size, with_padding, dim,
     conv_state_ref = conv_state[conv_state_indices, :].detach().clone()
     activation = None if not silu_activation else "silu"
 
-    out = causal_conv1d_update(x,
-                               conv_state,
-                               weight,
-                               bias,
-                               activation=activation,
-                               conv_state_indices=padded_state_indices,
-                               pad_slot_id=PAD_SLOT_ID)
-    out_ref = causal_conv1d_update_ref(x_ref[:batch_size],
-                                       conv_state_ref,
-                                       weight,
-                                       bias,
-                                       activation=activation)
+    out = causal_conv1d_update(
+        x,
+        conv_state,
+        weight,
+        bias,
+        activation=activation,
+        conv_state_indices=padded_state_indices,
+        pad_slot_id=PAD_SLOT_ID,
+    )
+    out_ref = causal_conv1d_update_ref(
+        x_ref[:batch_size], conv_state_ref, weight, bias, activation=activation
+    )
 
     assert torch.equal(conv_state[conv_state_indices, :], conv_state_ref)
-    assert torch.equal(conv_state[unused_states_bool],
-                       conv_state_for_padding_test[unused_states_bool])
+    assert torch.equal(
+        conv_state[unused_states_bool], conv_state_for_padding_test[unused_states_bool]
+    )
     assert torch.allclose(out[:batch_size], out_ref, rtol=rtol, atol=atol)
 
 
@@ -265,12 +256,13 @@ def test_causal_conv1d_update_with_batch_gather(batch_size, with_padding, dim,
 @pytest.mark.parametrize("silu_activation", [True])
 @pytest.mark.parametrize("has_bias", [True])
 @pytest.mark.parametrize("width", [4])
-@pytest.mark.parametrize('seqlen', [8, 30, 249, 2049, 4096])
-@pytest.mark.parametrize('dim', [64, 4096])
-@pytest.mark.parametrize('with_padding', [True, False])
-@pytest.mark.parametrize('batch', [4, 10])
-def test_causal_conv1d_varlen(batch, with_padding, dim, seqlen, width,
-                              has_bias, silu_activation, itype):
+@pytest.mark.parametrize("seqlen", [8, 30, 249, 2049, 4096])
+@pytest.mark.parametrize("dim", [64, 4096])
+@pytest.mark.parametrize("with_padding", [True, False])
+@pytest.mark.parametrize("batch", [4, 10])
+def test_causal_conv1d_varlen(
+    batch, with_padding, dim, seqlen, width, has_bias, silu_activation, itype
+):
     device = "cuda"
     torch.cuda.empty_cache()
     rtol, atol = (3e-4, 1e-3) if itype == torch.float32 else (3e-3, 5e-3)
@@ -288,19 +280,19 @@ def test_causal_conv1d_varlen(batch, with_padding, dim, seqlen, width,
 
     seqlens.append(
         torch.diff(
-            torch.cat(
-                [torch.tensor([-1]), eos_pos,
-                 torch.tensor([seqlen - 1])])).tolist())
+            torch.cat([torch.tensor([-1]), eos_pos, torch.tensor([seqlen - 1])])
+        ).tolist()
+    )
     assert sum(seqlens[-1]) == seqlen
     assert all(s > 0 for s in seqlens[-1])
 
     total_entries = batch_size * 10
     cumsum = torch.cumsum(torch.tensor(seqlens[0]), dim=0).to(torch.int32)
-    cumsum = torch.concat([torch.tensor([0], dtype=torch.int32), cumsum],
-                          dim=0)
+    cumsum = torch.concat([torch.tensor([0], dtype=torch.int32), cumsum], dim=0)
     x = rearrange(
         torch.randn(1, seqlen, 4096 + dim + 64, device=device, dtype=itype),
-        "b s d -> b d s")[:, 4096:4096 + dim, :]
+        "b s d -> b d s",
+    )[:, 4096 : 4096 + dim, :]
 
     weight = torch.randn(dim, width, device=device, dtype=itype)
 
@@ -309,34 +301,34 @@ def test_causal_conv1d_varlen(batch, with_padding, dim, seqlen, width,
     weight_ref = weight.clone()
     bias_ref = bias.clone() if bias is not None else None
     activation = None if not silu_activation else "silu"
-    final_states = torch.randn(total_entries,
-                               width - 1,
-                               dim,
-                               device=x.device,
-                               dtype=x.dtype).transpose(1, 2)
+    final_states = torch.randn(
+        total_entries, width - 1, dim, device=x.device, dtype=x.dtype
+    ).transpose(1, 2)
     final_states_ref = final_states.clone()
-    has_initial_states = torch.randint(0,
-                                       2, (cumsum.shape[0] - 1, ),
-                                       dtype=torch.bool,
-                                       device=x.device)
-    state_indices = torch.randperm(total_entries,
-                                   dtype=torch.int32,
-                                   device=x.device)[:batch_size]
-    padded_state_indices = torch.concat([
-        state_indices,
-        torch.as_tensor(
-            [PAD_SLOT_ID] * padding, dtype=torch.int32, device=device),
-    ],
-                                        dim=-1)
-    out = causal_conv1d_fn(x.squeeze(0),
-                           weight,
-                           bias=bias,
-                           conv_states=final_states,
-                           query_start_loc=cumsum.cuda(),
-                           cache_indices=padded_state_indices,
-                           has_initial_state=has_initial_states,
-                           activation=activation,
-                           pad_slot_id=PAD_SLOT_ID)
+    has_initial_states = torch.randint(
+        0, 2, (cumsum.shape[0] - 1,), dtype=torch.bool, device=x.device
+    )
+    state_indices = torch.randperm(total_entries, dtype=torch.int32, device=x.device)[
+        :batch_size
+    ]
+    padded_state_indices = torch.concat(
+        [
+            state_indices,
+            torch.as_tensor([PAD_SLOT_ID] * padding, dtype=torch.int32, device=device),
+        ],
+        dim=-1,
+    )
+    out = causal_conv1d_fn(
+        x.squeeze(0),
+        weight,
+        bias=bias,
+        conv_states=final_states,
+        query_start_loc=cumsum.cuda(),
+        cache_indices=padded_state_indices,
+        has_initial_state=has_initial_states,
+        activation=activation,
+        pad_slot_id=PAD_SLOT_ID,
+    )
 
     out_ref = []
     out_ref_b = []
@@ -353,16 +345,20 @@ def test_causal_conv1d_varlen(batch, with_padding, dim, seqlen, width,
                 bias_ref,
                 activation=activation,
                 return_final_states=True,
-                final_states_out=final_states_ref[
-                    padded_state_indices[i]].unsqueeze(0),
-                initial_states=final_states_ref[padded_state_indices[i]].
-                unsqueeze(0) if has_initial_states[i] else None))
+                final_states_out=final_states_ref[padded_state_indices[i]].unsqueeze(0),
+                initial_states=final_states_ref[padded_state_indices[i]].unsqueeze(0)
+                if has_initial_states[i]
+                else None,
+            )
+        )
     out_ref.append(torch.cat([t[0] for t in out_ref_b], dim=2))
     out_ref_tensor = torch.cat(out_ref, dim=0)
 
-    assert torch.allclose(final_states[state_indices],
-                          final_states_ref[state_indices],
-                          rtol=rtol,
-                          atol=atol)
-    unpadded_out = out[:, :out_ref_tensor.shape[-1]]
+    assert torch.allclose(
+        final_states[state_indices],
+        final_states_ref[state_indices],
+        rtol=rtol,
+        atol=atol,
+    )
+    unpadded_out = out[:, : out_ref_tensor.shape[-1]]
     assert torch.allclose(unpadded_out, out_ref_tensor, rtol=rtol, atol=atol)
diff --git a/tests/kernels/mamba/test_mamba_mixer2.py b/tests/kernels/mamba/test_mamba_mixer2.py
index 16c310726ad1..d23daefa7b43 100644
--- a/tests/kernels/mamba/test_mamba_mixer2.py
+++ b/tests/kernels/mamba/test_mamba_mixer2.py
@@ -7,8 +7,10 @@
 import torch
 
 from tests.utils import multi_gpu_test
-from vllm.distributed.parallel_state import (init_distributed_environment,
-                                             initialize_model_parallel)
+from vllm.distributed.parallel_state import (
+    init_distributed_environment,
+    initialize_model_parallel,
+)
 from vllm.model_executor.layers.mamba.mamba_mixer2 import Mixer2RMSNormGated
 from vllm.platforms import current_platform
 from vllm.utils import update_environment_variables
@@ -24,14 +26,15 @@
         (64, 2),
         (64, 4),  # hidden_size be divisible by num_gpus
         (100, 5),  # and n_groups must divide hidden_size
-    ])
+    ],
+)
 @pytest.mark.parametrize("dtype", [torch.float16])
 def test_mixer2_gated_norm_multi_gpu(
     batch_size: int,
     seq_len: int,
     hidden_size_n_groups: tuple[int, int],
     dtype: torch.dtype,
-    device: str = 'cuda',
+    device: str = "cuda",
 ):
     hidden_size, n_groups = hidden_size_n_groups
     num_processes = 2
@@ -39,17 +42,19 @@ def test_mixer2_gated_norm_multi_gpu(
     def run_torch_spawn(fn, nprocs):
         # need to use torch.mp.spawn otherwise will have problems with
         # torch.distributed and cuda
-        torch.multiprocessing.spawn(fn,
-                                    args=(
-                                        num_processes,
-                                        batch_size,
-                                        seq_len,
-                                        hidden_size,
-                                        n_groups,
-                                        dtype,
-                                        device,
-                                    ),
-                                    nprocs=nprocs)
+        torch.multiprocessing.spawn(
+            fn,
+            args=(
+                num_processes,
+                batch_size,
+                seq_len,
+                hidden_size,
+                n_groups,
+                dtype,
+                device,
+            ),
+            nprocs=nprocs,
+        )
 
     run_torch_spawn(mixer2_gated_norm_tensor_parallel, 2)
 
@@ -71,20 +76,22 @@ def mixer2_gated_norm_tensor_parallel(
     torch.set_default_device(device)
     torch.set_default_dtype(dtype)
 
-    update_environment_variables({
-        'RANK': str(local_rank),
-        'LOCAL_RANK': str(local_rank),
-        'WORLD_SIZE': str(world_size),
-        'MASTER_ADDR': 'localhost',
-        'MASTER_PORT': '12345',
-    })
+    update_environment_variables(
+        {
+            "RANK": str(local_rank),
+            "LOCAL_RANK": str(local_rank),
+            "WORLD_SIZE": str(world_size),
+            "MASTER_ADDR": "localhost",
+            "MASTER_PORT": "12345",
+        }
+    )
 
     # initialize distributed
     init_distributed_environment()
     initialize_model_parallel(tensor_model_parallel_size=world_size)
 
     # create random weights an inputs
-    weight = torch.rand((hidden_size, ), dtype=dtype, device=device)
+    weight = torch.rand((hidden_size,), dtype=dtype, device=device)
     hidden_states = torch.randn(batch_size, seq_len, hidden_size)
     gate_states = torch.randn(batch_size, seq_len, hidden_size)
 
@@ -97,14 +104,18 @@ def mixer2_gated_norm_tensor_parallel(
 
     # create gated-norm without TP to compute reference
     # - utilize mock patching to disable TP when
-    with (unittest.mock.patch(
+    with (
+        unittest.mock.patch(
             "vllm.model_executor.layers.mamba.mamba_mixer2."
             "get_tensor_model_parallel_world_size",
-            return_value=1),
-          unittest.mock.patch(
-              "vllm.model_executor.layers.mamba.mamba_mixer2."
-              "get_tensor_model_parallel_rank",
-              return_value=0)):
+            return_value=1,
+        ),
+        unittest.mock.patch(
+            "vllm.model_executor.layers.mamba.mamba_mixer2."
+            "get_tensor_model_parallel_rank",
+            return_value=0,
+        ),
+    ):
         mixer_single_gpu = Mixer2RMSNormGated(
             full_hidden_size=hidden_size,
             full_n_groups=n_groups,
@@ -115,12 +126,13 @@ def mixer2_gated_norm_tensor_parallel(
     # generate and compare
     N = hidden_size // world_size
     output = mixer(
-        hidden_states[..., local_rank * N:(local_rank + 1) * N],
-        gate_states[..., local_rank * N:(local_rank + 1) * N],
+        hidden_states[..., local_rank * N : (local_rank + 1) * N],
+        gate_states[..., local_rank * N : (local_rank + 1) * N],
     )
     ref_output = mixer_single_gpu(hidden_states, gate_states)
-    torch.testing.assert_close(output,
-                               ref_output[...,
-                                          local_rank * N:(local_rank + 1) * N],
-                               atol=5e-3,
-                               rtol=1e-3)
+    torch.testing.assert_close(
+        output,
+        ref_output[..., local_rank * N : (local_rank + 1) * N],
+        atol=5e-3,
+        rtol=1e-3,
+    )
diff --git a/tests/kernels/mamba/test_mamba_ssm.py b/tests/kernels/mamba/test_mamba_ssm.py
index 4c32ae81b34c..9a6137239ebf 100644
--- a/tests/kernels/mamba/test_mamba_ssm.py
+++ b/tests/kernels/mamba/test_mamba_ssm.py
@@ -10,20 +10,15 @@
 from vllm import _custom_ops as ops  # noqa: F401
 from vllm.attention.backends.utils import PAD_SLOT_ID
 from vllm.model_executor.layers.mamba.ops.mamba_ssm import (
-    selective_scan_fn, selective_state_update)
+    selective_scan_fn,
+    selective_state_update,
+)
 from vllm.platforms import current_platform
 
 
-def selective_state_update_ref(state,
-                               x,
-                               dt,
-                               A,
-                               B,
-                               C,
-                               D=None,
-                               z=None,
-                               dt_bias=None,
-                               dt_softplus=False):
+def selective_state_update_ref(
+    state, x, dt, A, B, C, D=None, z=None, dt_bias=None, dt_softplus=False
+):
     """
     Argument:
         state: (batch, dim, dstate) or (batch, nheads, dim, dstate)
@@ -73,16 +68,17 @@ def selective_state_update_ref(state,
         assert dt_bias.shape == (nheads, dim)
         dt = dt + dt_bias
     dt = F.softplus(dt) if dt_softplus else dt
-    dA = torch.exp(rearrange(dt, "b h d -> b h d 1") *
-                   A)  # (batch, nheads, dim, dstate)
-    B = repeat(B, "b g n -> b (g h) n",
-               h=nheads // ngroups)  # (batch, nheads, dstate)
-    C = repeat(C, "b g n -> b (g h) n",
-               h=nheads // ngroups)  # (batch, nheads, dstate)
+    dA = torch.exp(
+        rearrange(dt, "b h d -> b h d 1") * A
+    )  # (batch, nheads, dim, dstate)
+    B = repeat(B, "b g n -> b (g h) n", h=nheads // ngroups)  # (batch, nheads, dstate)
+    C = repeat(C, "b g n -> b (g h) n", h=nheads // ngroups)  # (batch, nheads, dstate)
     dB = rearrange(dt, "b h d -> b h d 1") * rearrange(
-        B, "b h n -> b h 1 n")  # (batch, nheads, dim, dstate)
-    state.copy_(state * dA +
-                dB * rearrange(x, "b h d -> b h d 1"))  # (batch, dim, dstate
+        B, "b h n -> b h 1 n"
+    )  # (batch, nheads, dim, dstate)
+    state.copy_(
+        state * dA + dB * rearrange(x, "b h d -> b h d 1")
+    )  # (batch, dim, dstate
     out = torch.einsum("bhdn,bhn->bhd", state.to(C.dtype), C)
     if D is not None:
         out += (x * D).to(out.dtype)
@@ -92,18 +88,20 @@ def selective_state_update_ref(state,
     return out
 
 
-def selective_scan_ref(u,
-                       delta,
-                       A,
-                       B,
-                       C,
-                       D=None,
-                       z=None,
-                       delta_bias=None,
-                       delta_softplus=False,
-                       return_last_state=False,
-                       prev_state=None,
-                       final_state_out=None):
+def selective_scan_ref(
+    u,
+    delta,
+    A,
+    B,
+    C,
+    D=None,
+    z=None,
+    delta_bias=None,
+    delta_softplus=False,
+    return_last_state=False,
+    prev_state=None,
+    final_state_out=None,
+):
     """
     u: r(B D L)
     delta: r(B D L)
@@ -132,26 +130,26 @@ def selective_scan_ref(u,
     C = C.float()
     x = A.new_zeros((batch, dim, dstate)) if prev_state is None else prev_state
     ys = []
-    deltaA = torch.exp(torch.einsum('bdl,dn->bdln', delta, A))
+    deltaA = torch.exp(torch.einsum("bdl,dn->bdln", delta, A))
     if not is_variable_B:
-        deltaB_u = torch.einsum('bdl,dn,bdl->bdln', delta, B, u)
+        deltaB_u = torch.einsum("bdl,dn,bdl->bdln", delta, B, u)
     else:
         if B.dim() == 3:
-            deltaB_u = torch.einsum('bdl,bnl,bdl->bdln', delta, B, u)
+            deltaB_u = torch.einsum("bdl,bnl,bdl->bdln", delta, B, u)
         else:
             B = repeat(B, "B G N L -> B (G H) N L", H=dim // B.shape[1])
-            deltaB_u = torch.einsum('bdl,bdnl,bdl->bdln', delta, B, u)
+            deltaB_u = torch.einsum("bdl,bdnl,bdl->bdln", delta, B, u)
     if is_variable_C and C.dim() == 4:
         C = repeat(C, "B G N L -> B (G H) N L", H=dim // C.shape[1])
     for i in range(u.shape[2]):
         x = deltaA[:, :, i] * x + deltaB_u[:, :, i]
         if not is_variable_C:
-            y = torch.einsum('bdn,dn->bd', x, C)
+            y = torch.einsum("bdn,dn->bd", x, C)
         else:
             if C.dim() == 3:
-                y = torch.einsum('bdn,bn->bd', x, C[:, :, i])
+                y = torch.einsum("bdn,bn->bd", x, C[:, :, i])
             else:
-                y = torch.einsum('bdn,bdn->bd', x, C[:, :, :, i])
+                y = torch.einsum("bdn,bdn->bd", x, C[:, :, :, i])
         if i == u.shape[2] - 1:
             if final_state_out is None:
                 final_state_out = x
@@ -166,20 +164,22 @@ def selective_scan_ref(u,
     return out if not return_last_state else (out, final_state_out)
 
 
-def selective_scan_opcheck_fn(u,
-                              delta,
-                              A,
-                              B,
-                              C,
-                              D=None,
-                              z=None,
-                              delta_bias=None,
-                              delta_softplus=False,
-                              cu_seq_len=None,
-                              cache_indices=None,
-                              has_initial_state=None,
-                              ssm_states=None,
-                              pad_slot_id=PAD_SLOT_ID):
+def selective_scan_opcheck_fn(
+    u,
+    delta,
+    A,
+    B,
+    C,
+    D=None,
+    z=None,
+    delta_bias=None,
+    delta_softplus=False,
+    cu_seq_len=None,
+    cache_indices=None,
+    has_initial_state=None,
+    ssm_states=None,
+    pad_slot_id=PAD_SLOT_ID,
+):
     """if return_last_state is True, returns (out, last_state)
     last_state has shape (batch, dim, dstate).
     """
@@ -206,30 +206,55 @@ def selective_scan_opcheck_fn(u,
 
     # Disable test_autograd_registration for now as it seems to trigger
     # a bogus error.
-    opcheck(torch.ops._C.selective_scan_fwd,
-            (u, delta, A, B, C, D, z, delta_bias, delta_softplus, cu_seq_len,
-             cache_indices, has_initial_state, ssm_states, pad_slot_id),
-            test_utils=["test_schema", "test_faketensor"])
-
-
-@pytest.mark.parametrize('wtype', [torch.float32])
-@pytest.mark.parametrize('itype',
-                         [torch.float32, torch.float16, torch.bfloat16])
-@pytest.mark.parametrize('seqlen', [128, 256, 512, 1024, 2048, 4096])
-@pytest.mark.parametrize('has_delta_bias', [True])
-@pytest.mark.parametrize('delta_softplus', [True])
-@pytest.mark.parametrize('has_z', [True])
-@pytest.mark.parametrize('has_D', [True])
+    opcheck(
+        torch.ops._C.selective_scan_fwd,
+        (
+            u,
+            delta,
+            A,
+            B,
+            C,
+            D,
+            z,
+            delta_bias,
+            delta_softplus,
+            cu_seq_len,
+            cache_indices,
+            has_initial_state,
+            ssm_states,
+            pad_slot_id,
+        ),
+        test_utils=["test_schema", "test_faketensor"],
+    )
+
+
+@pytest.mark.parametrize("wtype", [torch.float32])
+@pytest.mark.parametrize("itype", [torch.float32, torch.float16, torch.bfloat16])
+@pytest.mark.parametrize("seqlen", [128, 256, 512, 1024, 2048, 4096])
+@pytest.mark.parametrize("has_delta_bias", [True])
+@pytest.mark.parametrize("delta_softplus", [True])
+@pytest.mark.parametrize("has_z", [True])
+@pytest.mark.parametrize("has_D", [True])
 @pytest.mark.parametrize("varBC_groups", [1, 2])
 @pytest.mark.parametrize("is_variable_C", [True])
 @pytest.mark.parametrize("is_variable_B", [True])
 @pytest.mark.parametrize("scan_chunks", [1, 2, 3])
-def test_selective_scan(is_variable_B, is_variable_C, varBC_groups, has_D,
-                        has_z, has_delta_bias, delta_softplus, seqlen, itype,
-                        wtype, scan_chunks):
+def test_selective_scan(
+    is_variable_B,
+    is_variable_C,
+    varBC_groups,
+    has_D,
+    has_z,
+    has_delta_bias,
+    delta_softplus,
+    seqlen,
+    itype,
+    wtype,
+    scan_chunks,
+):
     if varBC_groups > 1 and (not is_variable_B or not is_variable_C):
         pytest.skip()  # This config is not applicable
-    device = 'cuda'
+    device = "cuda"
     rtol, atol = (6e-4, 2e-3) if itype == torch.float32 else (3e-3, 5e-3)
     if itype == torch.bfloat16:
         rtol, atol = 3e-2, 5e-2
@@ -242,7 +267,7 @@ def test_selective_scan(is_variable_B, is_variable_C, varBC_groups, has_D,
     batch_size = 1
     dim = 4
     dstate = 8
-    A = (-0.5 * torch.rand(dim, dstate, device=device, dtype=wtype))
+    A = -0.5 * torch.rand(dim, dstate, device=device, dtype=wtype)
     A_ref = A.clone()
     if not is_variable_B:
         B_shape = [dim, dstate]
@@ -250,9 +275,7 @@ def test_selective_scan(is_variable_B, is_variable_C, varBC_groups, has_D,
         B_shape = [batch_size, dstate, seqlen]
     else:
         B_shape = [batch_size, varBC_groups, dstate, seqlen]
-    B = torch.randn(B_shape,
-                    device=device,
-                    dtype=wtype if not is_variable_B else itype)
+    B = torch.randn(B_shape, device=device, dtype=wtype if not is_variable_B else itype)
     B_ref = B.clone()
     if not is_variable_C:
         C_shape = [dim, dstate]
@@ -260,27 +283,27 @@ def test_selective_scan(is_variable_B, is_variable_C, varBC_groups, has_D,
         C_shape = [batch_size, dstate, seqlen]
     else:
         C_shape = [batch_size, varBC_groups, dstate, seqlen]
-    C = torch.randn(C_shape,
-                    device=device,
-                    dtype=wtype if not is_variable_C else itype)
+    C = torch.randn(C_shape, device=device, dtype=wtype if not is_variable_C else itype)
     C_ref = C.clone()
     D = torch.randn(dim, device=device, dtype=torch.float32) if has_D else None
     D_ref = D.clone()
-    z = torch.randn(batch_size, dim, seqlen, device=device,
-                    dtype=itype) if has_z else None
+    z = (
+        torch.randn(batch_size, dim, seqlen, device=device, dtype=itype)
+        if has_z
+        else None
+    )
     z_ref = z.clone() if has_z else None
-    delta_bias = (0.5 * torch.rand(dim, device=device, dtype=torch.float32)
-                  ) if has_delta_bias else None
+    delta_bias = (
+        (0.5 * torch.rand(dim, device=device, dtype=torch.float32))
+        if has_delta_bias
+        else None
+    )
     u = torch.randn(batch_size, dim, seqlen, device=device, dtype=itype)
     u_ref = u.clone()
-    delta = (0.5 *
-             torch.rand(batch_size, dim, seqlen, device=device, dtype=itype))
+    delta = 0.5 * torch.rand(batch_size, dim, seqlen, device=device, dtype=itype)
     delta_ref = delta.clone()
     state_shape = (batch_size, u.shape[1], int(A.shape[1]))
-    state = torch.randn(state_shape,
-                        device=u.device,
-                        dtype=itype,
-                        requires_grad=False)
+    state = torch.randn(state_shape, device=u.device, dtype=itype, requires_grad=False)
     state_ref = state.clone()
     out = None
     out_ref = None
@@ -312,9 +335,10 @@ def test_selective_scan(is_variable_B, is_variable_C, varBC_groups, has_D,
             z=_z,
             delta_bias=delta_bias,
             delta_softplus=delta_softplus,
-            has_initial_state=torch.ones(batch_size,
-                                         device=u.device,
-                                         dtype=torch.bool) if c > 0 else None)
+            has_initial_state=torch.ones(batch_size, device=u.device, dtype=torch.bool)
+            if c > 0
+            else None,
+        )
         outs.append(out)
     if len(outs) > 1:
         out = torch.cat(outs, dim=-1)
@@ -329,27 +353,29 @@ def test_selective_scan(is_variable_B, is_variable_C, varBC_groups, has_D,
         z=z_ref,
         delta_bias=delta_bias,
         delta_softplus=delta_softplus,
-        return_last_state=True)
+        return_last_state=True,
+    )
 
     assert out is not None and out_ref is not None
     assert torch.allclose(out, out_ref, rtol=rtol, atol=atol)
     assert state is not None and state_ref is not None
     assert torch.allclose(state, state_ref.to(itype), rtol=rtol, atol=atol)
 
-    selective_scan_opcheck_fn(u,
-                              delta,
-                              A,
-                              B,
-                              C,
-                              D,
-                              z,
-                              delta_bias=delta_bias,
-                              delta_softplus=delta_softplus,
-                              ssm_states=state)
+    selective_scan_opcheck_fn(
+        u,
+        delta,
+        A,
+        B,
+        C,
+        D,
+        z,
+        delta_bias=delta_bias,
+        delta_softplus=delta_softplus,
+        ssm_states=state,
+    )
 
 
-@pytest.mark.parametrize("itype",
-                         [torch.float32, torch.float16, torch.bfloat16])
+@pytest.mark.parametrize("itype", [torch.float32, torch.float16, torch.bfloat16])
 @pytest.mark.parametrize("has_z", [False, True])
 @pytest.mark.parametrize("dstate", [16, 32, 64])
 @pytest.mark.parametrize("dim", [2048, 2048 + 16, 4096])
@@ -374,52 +400,47 @@ def test_selective_state_update(dim, dstate, has_z, itype):
     D = torch.randn(dim, device=device)
     z = torch.randn_like(x) if has_z else None
     state_ref = state.detach().clone()
-    selective_state_update(state,
-                           x,
-                           dt,
-                           A,
-                           B,
-                           C,
-                           D=D,
-                           z=z,
-                           dt_bias=dt_bias,
-                           dt_softplus=True,
-                           out=out)
-    out_ref = selective_state_update_ref(state_ref,
-                                         x,
-                                         dt,
-                                         A,
-                                         B,
-                                         C,
-                                         D=D,
-                                         z=z,
-                                         dt_bias=dt_bias,
-                                         dt_softplus=True)
+    selective_state_update(
+        state, x, dt, A, B, C, D=D, z=z, dt_bias=dt_bias, dt_softplus=True, out=out
+    )
+    out_ref = selective_state_update_ref(
+        state_ref, x, dt, A, B, C, D=D, z=z, dt_bias=dt_bias, dt_softplus=True
+    )
 
     assert torch.allclose(state, state_ref, rtol=rtol, atol=atol)
     assert torch.allclose(out, out_ref, rtol=rtol, atol=atol)
 
 
-@pytest.mark.parametrize('wtype', [torch.float32])
-@pytest.mark.parametrize('itype', [torch.float32])
-@pytest.mark.parametrize('seqlen', [1, 128, 129, 256, 512, 1024, 2048, 4096])
+@pytest.mark.parametrize("wtype", [torch.float32])
+@pytest.mark.parametrize("itype", [torch.float32])
+@pytest.mark.parametrize("seqlen", [1, 128, 129, 256, 512, 1024, 2048, 4096])
 @pytest.mark.parametrize("return_last_state", [True])
-@pytest.mark.parametrize('has_delta_bias', [True])
-@pytest.mark.parametrize('delta_softplus', [True])
-@pytest.mark.parametrize('has_z', [True])
-@pytest.mark.parametrize('has_D', [True])
+@pytest.mark.parametrize("has_delta_bias", [True])
+@pytest.mark.parametrize("delta_softplus", [True])
+@pytest.mark.parametrize("has_z", [True])
+@pytest.mark.parametrize("has_D", [True])
 @pytest.mark.parametrize("varBC_groups", [1, 2])
 @pytest.mark.parametrize("is_variable_C", [True])
 @pytest.mark.parametrize("is_variable_B", [True])
 # tests correctness in case subset of the sequences are padded
 @pytest.mark.parametrize("with_padding", [False, True])
-def test_selective_scan_varlen(with_padding, is_variable_B, is_variable_C,
-                               varBC_groups, has_D, has_z, has_delta_bias,
-                               delta_softplus, return_last_state, seqlen,
-                               itype, wtype):
+def test_selective_scan_varlen(
+    with_padding,
+    is_variable_B,
+    is_variable_C,
+    varBC_groups,
+    has_D,
+    has_z,
+    has_delta_bias,
+    delta_softplus,
+    return_last_state,
+    seqlen,
+    itype,
+    wtype,
+):
     if varBC_groups > 1 and (not is_variable_B or not is_variable_C):
         pytest.skip()  # This config is not applicable
-    device = 'cuda'
+    device = "cuda"
     rtol, atol = (6e-4, 2e-3) if itype == torch.float32 else (3e-3, 5e-3)
     if itype == torch.bfloat16:
         rtol, atol = 3e-2, 5e-2
@@ -443,72 +464,79 @@ def test_selective_scan_varlen(with_padding, is_variable_B, is_variable_C,
     eos_pos = torch.randperm(seqlen - 1)[:nsplits].sort().values
     seqlens.append(
         torch.diff(
-            torch.cat(
-                [torch.tensor([-1]), eos_pos,
-                 torch.tensor([seqlen - 1])])).tolist())
+            torch.cat([torch.tensor([-1]), eos_pos, torch.tensor([seqlen - 1])])
+        ).tolist()
+    )
 
     assert sum(seqlens[-1]) == seqlen
     assert all(s > 0 for s in seqlens[-1])
 
     total_entries = batch_size * 10
     cumsum = torch.cumsum(torch.tensor(seqlens[0]), dim=0).to(torch.int32)
-    cumsum = torch.concat([torch.tensor([0], dtype=torch.int32), cumsum],
-                          dim=0).cuda()
+    cumsum = torch.concat([torch.tensor([0], dtype=torch.int32), cumsum], dim=0).cuda()
 
     dim = 4
     dstate = 8
-    A = (-0.5 * torch.rand(dim, dstate, device=device, dtype=wtype))
+    A = -0.5 * torch.rand(dim, dstate, device=device, dtype=wtype)
     A_ref = A.clone()
     B_shape = [varBC_groups, dstate, seqlen]
-    B = torch.randn(B_shape,
-                    device=device,
-                    dtype=wtype if not is_variable_B else itype)
+    B = torch.randn(B_shape, device=device, dtype=wtype if not is_variable_B else itype)
     B_ref = B.clone()
     C_shape = [varBC_groups, dstate, seqlen]
-    C = torch.randn(C_shape,
-                    device=device,
-                    dtype=wtype if not is_variable_C else itype)
+    C = torch.randn(C_shape, device=device, dtype=wtype if not is_variable_C else itype)
     C_ref = C.clone()
     D = torch.randn(dim, device=device, dtype=torch.float32) if has_D else None
     D_ref = D.clone()
     z = torch.randn(dim, seqlen, device=device, dtype=itype)
     z_ref = z.clone()
-    delta_bias = (0.5 * torch.rand(dim, device=device, dtype=torch.float32)
-                  ) if has_delta_bias else None
+    delta_bias = (
+        (0.5 * torch.rand(dim, device=device, dtype=torch.float32))
+        if has_delta_bias
+        else None
+    )
     u = torch.randn(dim, seqlen, device=device, dtype=itype)
     u_ref = u.clone()
-    delta = (0.5 * torch.rand(dim, seqlen, device=device, dtype=itype))
+    delta = 0.5 * torch.rand(dim, seqlen, device=device, dtype=itype)
     delta_ref = delta.clone()
     out = None
     out_ref = None
 
     prev_state_shape = (total_entries, u.shape[0], int(A.shape[1]))
-    prev_state = torch.randn(prev_state_shape,
-                             device=u.device,
-                             dtype=itype,
-                             requires_grad=False)
+    prev_state = torch.randn(
+        prev_state_shape, device=u.device, dtype=itype, requires_grad=False
+    )
     prev_state_ref = prev_state.clone()
-    state_indices = torch.randperm(total_entries,
-                                   dtype=torch.int32,
-                                   device=u.device)[:batch_size]
-    unused_states_bool = torch.ones(total_entries,
-                                    dtype=torch.bool,
-                                    device=device)
+    state_indices = torch.randperm(total_entries, dtype=torch.int32, device=u.device)[
+        :batch_size
+    ]
+    unused_states_bool = torch.ones(total_entries, dtype=torch.bool, device=device)
     unused_states_bool[state_indices] = False
-    padded_state_indices = torch.concat([
-        state_indices,
-        torch.as_tensor(
-            [PAD_SLOT_ID] * padding, dtype=torch.int32, device=device),
-    ],
-                                        dim=-1)
-
-    has_initial_state = torch.randint(0,
-                                      2, (cumsum.shape[0] - 1, ),
-                                      dtype=torch.bool,
-                                      device=u.device)
-    out = selective_scan_fn(u, prev_state, delta, A, B, C, D, z, delta_bias,
-                            delta_softplus, cumsum, padded_state_indices,
-                            has_initial_state)
+    padded_state_indices = torch.concat(
+        [
+            state_indices,
+            torch.as_tensor([PAD_SLOT_ID] * padding, dtype=torch.int32, device=device),
+        ],
+        dim=-1,
+    )
+
+    has_initial_state = torch.randint(
+        0, 2, (cumsum.shape[0] - 1,), dtype=torch.bool, device=u.device
+    )
+    out = selective_scan_fn(
+        u,
+        prev_state,
+        delta,
+        A,
+        B,
+        C,
+        D,
+        z,
+        delta_bias,
+        delta_softplus,
+        cumsum,
+        padded_state_indices,
+        has_initial_state,
+    )
     outs_ref = []
     splits = [
         torch.split(var, seqlens[0], dim=-1)
@@ -530,33 +558,46 @@ def test_selective_scan_varlen(with_padding, is_variable_B, is_variable_C,
             delta_softplus=delta_softplus,
             return_last_state=return_last_state,
             prev_state=prev_state_ref[padded_state_indices[i]].unsqueeze(0)
-            if has_initial_state[i] else None,
-            final_state_out=prev_state_ref[padded_state_indices[i]].unsqueeze(
-                0))
+            if has_initial_state[i]
+            else None,
+            final_state_out=prev_state_ref[padded_state_indices[i]].unsqueeze(0),
+        )
         outs_ref.append(out_ref_s)
     out_ref = torch.cat(outs_ref, dim=-1)[0]
 
-    unpadded_out = out[:, :out_ref[0].shape[-1]]
+    unpadded_out = out[:, : out_ref[0].shape[-1]]
     print("Output diff max", (unpadded_out - out_ref).max())
     print("Output diff mean", (unpadded_out - out_ref).mean())
     print("Output state diff max", (prev_state - prev_state_ref).max())
     print("Output state diff mean", (prev_state - prev_state_ref).mean())
     assert torch.allclose(prev_state, prev_state_ref, rtol=rtol, atol=atol)
     assert torch.allclose(unpadded_out, out_ref, rtol=rtol, atol=atol)
-    selective_scan_opcheck_fn(u, delta, A, B, C, D, z, delta_bias,
-                              delta_softplus, cumsum, padded_state_indices,
-                              has_initial_state, prev_state)
-
-
-@pytest.mark.parametrize("itype",
-                         [torch.float32, torch.float16, torch.bfloat16])
+    selective_scan_opcheck_fn(
+        u,
+        delta,
+        A,
+        B,
+        C,
+        D,
+        z,
+        delta_bias,
+        delta_softplus,
+        cumsum,
+        padded_state_indices,
+        has_initial_state,
+        prev_state,
+    )
+
+
+@pytest.mark.parametrize("itype", [torch.float32, torch.float16, torch.bfloat16])
 @pytest.mark.parametrize("has_z", [True])
 @pytest.mark.parametrize("dstate", [16, 32, 64])
 @pytest.mark.parametrize("dim", [2048, 2048 + 16, 4096])
 # tests correctness in case subset of the sequences are padded
 @pytest.mark.parametrize("with_padding", [True, False])
-def test_selective_state_update_with_batch_indices(with_padding, dim, dstate,
-                                                   has_z, itype):
+def test_selective_state_update_with_batch_indices(
+    with_padding, dim, dstate, has_z, itype
+):
     device = "cuda"
     rtol, atol = (3e-4, 1e-3) if itype == torch.float32 else (5e-3, 1e-2)
     if itype == torch.bfloat16:
@@ -571,17 +612,17 @@ def test_selective_state_update_with_batch_indices(with_padding, dim, dstate,
     total_entries = 10 * batch_size
     state = torch.randn(total_entries, dim, dstate, dtype=itype, device=device)
     state_indices = torch.randperm(total_entries)[:batch_size].to(
-        dtype=torch.int32, device=device)
-    unused_states_bool = torch.ones(total_entries,
-                                    dtype=torch.bool,
-                                    device=device)
+        dtype=torch.int32, device=device
+    )
+    unused_states_bool = torch.ones(total_entries, dtype=torch.bool, device=device)
     unused_states_bool[state_indices] = False
-    padded_state_indices = torch.concat([
-        state_indices,
-        torch.as_tensor(
-            [PAD_SLOT_ID] * padding, dtype=torch.int32, device=device)
-    ],
-                                        dim=0)
+    padded_state_indices = torch.concat(
+        [
+            state_indices,
+            torch.as_tensor([PAD_SLOT_ID] * padding, dtype=torch.int32, device=device),
+        ],
+        dim=0,
+    )
     x = torch.randn(padded_batch_size, dim, device=device, dtype=itype)
     out = torch.empty_like(x)
     dt = torch.randn(padded_batch_size, dim, device=device, dtype=itype)
@@ -593,61 +634,60 @@ def test_selective_state_update_with_batch_indices(with_padding, dim, dstate,
     z = torch.randn_like(x) if has_z else None
     state_ref = state[state_indices, :].clone()
     state_before = state.clone()
-    selective_state_update(state,
-                           x,
-                           dt,
-                           A,
-                           B,
-                           C,
-                           D=D,
-                           z=z,
-                           dt_bias=dt_bias,
-                           dt_softplus=True,
-                           state_batch_indices=padded_state_indices,
-                           pad_slot_id=PAD_SLOT_ID,
-                           out=out)
-    out_ref = selective_state_update_ref(state_ref,
-                                         x[:batch_size],
-                                         dt[:batch_size],
-                                         A,
-                                         B[:batch_size],
-                                         C[:batch_size],
-                                         D=D,
-                                         z=z[:batch_size],
-                                         dt_bias=dt_bias,
-                                         dt_softplus=True)
+    selective_state_update(
+        state,
+        x,
+        dt,
+        A,
+        B,
+        C,
+        D=D,
+        z=z,
+        dt_bias=dt_bias,
+        dt_softplus=True,
+        state_batch_indices=padded_state_indices,
+        pad_slot_id=PAD_SLOT_ID,
+        out=out,
+    )
+    out_ref = selective_state_update_ref(
+        state_ref,
+        x[:batch_size],
+        dt[:batch_size],
+        A,
+        B[:batch_size],
+        C[:batch_size],
+        D=D,
+        z=z[:batch_size],
+        dt_bias=dt_bias,
+        dt_softplus=True,
+    )
 
     print("Output diff max", (out[:batch_size] - out_ref).max())
     print("Output diff mean", (out[:batch_size] - out_ref).mean())
     print("Output state diff max", (state[state_indices, :] - state_ref).max())
-    print("Output state diff mean",
-          (state[state_indices, :] - state_ref).mean())
+    print("Output state diff mean", (state[state_indices, :] - state_ref).mean())
     # test padded entries stay the same
     if with_padding:
-        assert torch.equal(state_before[unused_states_bool],
-                           state[unused_states_bool])
-        assert torch.equal(x[batch_size + 1:], x[batch_size + 1:])
-        assert torch.equal(dt[batch_size + 1:], dt[batch_size + 1:])
-        assert torch.equal(B[batch_size + 1:], B[batch_size + 1:])
-        assert torch.equal(C[batch_size + 1:], C[batch_size + 1:])
+        assert torch.equal(state_before[unused_states_bool], state[unused_states_bool])
+        assert torch.equal(x[batch_size + 1 :], x[batch_size + 1 :])
+        assert torch.equal(dt[batch_size + 1 :], dt[batch_size + 1 :])
+        assert torch.equal(B[batch_size + 1 :], B[batch_size + 1 :])
+        assert torch.equal(C[batch_size + 1 :], C[batch_size + 1 :])
 
     # test "real" entries
-    assert torch.allclose(state[state_indices, :],
-                          state_ref,
-                          rtol=rtol,
-                          atol=atol)
+    assert torch.allclose(state[state_indices, :], state_ref, rtol=rtol, atol=atol)
     assert torch.allclose(out[:batch_size], out_ref, rtol=rtol, atol=atol)
 
 
-@pytest.mark.parametrize("itype",
-                         [torch.float32, torch.float16, torch.bfloat16])
+@pytest.mark.parametrize("itype", [torch.float32, torch.float16, torch.bfloat16])
 @pytest.mark.parametrize("has_z", [False, True])
 @pytest.mark.parametrize("tie_hdim", [False, True])
 @pytest.mark.parametrize("ngroups", [1, 2, 4])
 @pytest.mark.parametrize("dstate", [16, 32, 64])
 @pytest.mark.parametrize("dim", [2048, 4096])
 def test_selective_state_update_with_heads_with_batch_indices(
-        dim, dstate, ngroups, has_z, tie_hdim, itype):
+    dim, dstate, ngroups, has_z, tie_hdim, itype
+):
     device = "cuda"
     rtol, atol = (3e-4, 1e-3) if itype == torch.float32 else (5e-3, 3e-2)
     if itype == torch.bfloat16:
@@ -659,71 +699,55 @@ def test_selective_state_update_with_heads_with_batch_indices(
     nheads = dim // headdim
 
     total_entries = 10 * batch_size
-    state = torch.randn(total_entries,
-                        nheads,
-                        headdim,
-                        dstate,
-                        dtype=itype,
-                        device=device)
+    state = torch.randn(
+        total_entries, nheads, headdim, dstate, dtype=itype, device=device
+    )
     state_indices = torch.randperm(total_entries)[:batch_size].to(
-        dtype=torch.int32, device=device)
+        dtype=torch.int32, device=device
+    )
 
     x = torch.randn(batch_size, nheads, headdim, device=device, dtype=itype)
     out = torch.empty_like(x)
     if not tie_hdim:
-        dt = torch.randn(batch_size,
-                         nheads,
-                         headdim,
-                         device=device,
-                         dtype=itype)
+        dt = torch.randn(batch_size, nheads, headdim, device=device, dtype=itype)
         dt_bias = torch.rand(nheads, headdim, device=device) - 4.0
         A = -torch.rand(nheads, headdim, dstate, device=device) - 1.0
         D = torch.randn(nheads, headdim, device=device)
     else:
-        dt = repeat(torch.randn(batch_size, nheads, device=device,
-                                dtype=itype),
-                    "b h -> b h p",
-                    p=headdim)
-        dt_bias = repeat(torch.rand(nheads, device=device) - 4.0,
-                         "h -> h p",
-                         p=headdim)
-        A = repeat(-torch.rand(nheads, device=device) - 1.0,
-                   "h -> h p n",
-                   p=headdim,
-                   n=dstate)
+        dt = repeat(
+            torch.randn(batch_size, nheads, device=device, dtype=itype),
+            "b h -> b h p",
+            p=headdim,
+        )
+        dt_bias = repeat(torch.rand(nheads, device=device) - 4.0, "h -> h p", p=headdim)
+        A = repeat(
+            -torch.rand(nheads, device=device) - 1.0, "h -> h p n", p=headdim, n=dstate
+        )
         D = repeat(torch.randn(nheads, device=device), "h -> h p", p=headdim)
     B = torch.randn(batch_size, ngroups, dstate, device=device)
     C = torch.randn(batch_size, ngroups, dstate, device=device)
     z = torch.randn_like(x) if has_z else None
     state_ref = state[state_indices, :].detach().clone()
-    selective_state_update(state,
-                           x,
-                           dt,
-                           A,
-                           B,
-                           C,
-                           D=D,
-                           z=z,
-                           dt_bias=dt_bias,
-                           dt_softplus=True,
-                           state_batch_indices=state_indices,
-                           pad_slot_id=PAD_SLOT_ID,
-                           out=out)
-    out_ref = selective_state_update_ref(state_ref,
-                                         x,
-                                         dt,
-                                         A,
-                                         B,
-                                         C,
-                                         D=D,
-                                         z=z,
-                                         dt_bias=dt_bias,
-                                         dt_softplus=True)
+    selective_state_update(
+        state,
+        x,
+        dt,
+        A,
+        B,
+        C,
+        D=D,
+        z=z,
+        dt_bias=dt_bias,
+        dt_softplus=True,
+        state_batch_indices=state_indices,
+        pad_slot_id=PAD_SLOT_ID,
+        out=out,
+    )
+    out_ref = selective_state_update_ref(
+        state_ref, x, dt, A, B, C, D=D, z=z, dt_bias=dt_bias, dt_softplus=True
+    )
 
     print(f"Output max diff: {(out - out_ref).abs().max().item()}")
     print(f"Output mean diff: {(out - out_ref).abs().mean().item()}")
-    assert torch.allclose(state[state_indices, :],
-                          state_ref,
-                          rtol=rtol,
-                          atol=atol)
+    assert torch.allclose(state[state_indices, :], state_ref, rtol=rtol, atol=atol)
     assert torch.allclose(out, out_ref, rtol=rtol, atol=atol)
diff --git a/tests/kernels/mamba/test_mamba_ssm_ssd.py b/tests/kernels/mamba/test_mamba_ssm_ssd.py
index 9798b27cae76..b4424b717d02 100644
--- a/tests/kernels/mamba/test_mamba_ssm_ssd.py
+++ b/tests/kernels/mamba/test_mamba_ssm_ssd.py
@@ -7,10 +7,10 @@
 from einops import rearrange, repeat
 
 from vllm.model_executor.layers.mamba.ops.ssd_combined import (
-    mamba_chunk_scan_combined_varlen)
+    mamba_chunk_scan_combined_varlen,
+)
 from vllm.platforms import current_platform
-from vllm.v1.attention.backends.mamba2_attn import (
-    compute_varlen_chunk_metadata)
+from vllm.v1.attention.backends.mamba2_attn import compute_varlen_chunk_metadata
 
 # Added by the IBM Team, 2024
 
@@ -22,12 +22,10 @@ def segsum(x):
     """Calculates segment sum."""
     T = x.size(-1)
     x = repeat(x, "... d -> ... d e", e=T)
-    mask = torch.tril(torch.ones(T, T, device=x.device, dtype=bool),
-                      diagonal=-1)
+    mask = torch.tril(torch.ones(T, T, device=x.device, dtype=bool), diagonal=-1)
     x = x.masked_fill(~mask, 0)
     x_segsum = torch.cumsum(x, dim=-2)
-    mask = torch.tril(torch.ones(T, T, device=x.device, dtype=bool),
-                      diagonal=0)
+    mask = torch.tril(torch.ones(T, T, device=x.device, dtype=bool), diagonal=0)
     x_segsum = x_segsum.masked_fill(~mask, -torch.inf)
     return x_segsum
 
@@ -46,8 +44,9 @@ def ssd_minimal_discrete(X, A, B, C, block_len, initial_states=None):
     assert X.shape[1] % block_len == 0
 
     # Rearrange into blocks/chunks
-    X, A, B, C = (rearrange(x, "b (c l) ... -> b c l ...", l=block_len)
-                  for x in (X, A, B, C))
+    X, A, B, C = (
+        rearrange(x, "b (c l) ... -> b c l ...", l=block_len) for x in (X, A, B, C)
+    )
 
     A = rearrange(A, "b c l h -> b h c l")
     A_cumsum = torch.cumsum(A, dim=-1)
@@ -74,7 +73,7 @@ def ssd_minimal_discrete(X, A, B, C, block_len, initial_states=None):
     # 4. Compute state -> output conversion per chunk
     # (left term of low-rank factorization of off-diagonal blocks; C terms)
     state_decay_out = torch.exp(A_cumsum)
-    Y_off = torch.einsum('bclhn,bchpn,bhcl->bclhp', C, states, state_decay_out)
+    Y_off = torch.einsum("bclhn,bchpn,bhcl->bclhp", C, states, state_decay_out)
 
     # Add output of intra-chunk and inter-chunk terms
     # (diagonal and off-diagonal blocks)
@@ -82,42 +81,31 @@ def ssd_minimal_discrete(X, A, B, C, block_len, initial_states=None):
     return Y, final_state
 
 
-def generate_random_inputs(batch_size,
-                           seqlen,
-                           n_heads,
-                           d_head,
-                           itype,
-                           device='cuda'):
-
+def generate_random_inputs(batch_size, seqlen, n_heads, d_head, itype, device="cuda"):
     current_platform.seed_everything(0)
-    A = (-torch.exp(torch.rand(n_heads, dtype=itype, device=device)))
+    A = -torch.exp(torch.rand(n_heads, dtype=itype, device=device))
     dt = F.softplus(
-        torch.randn(batch_size, seqlen, n_heads, dtype=itype, device=device) -
-        4)
-    X = torch.randn((batch_size, seqlen, n_heads, d_head),
-                    dtype=itype,
-                    device=device)
-    B = torch.randn((batch_size, seqlen, n_heads, d_head),
-                    dtype=itype,
-                    device=device)
-    C = torch.randn((batch_size, seqlen, n_heads, d_head),
-                    dtype=itype,
-                    device=device)
+        torch.randn(batch_size, seqlen, n_heads, dtype=itype, device=device) - 4
+    )
+    X = torch.randn((batch_size, seqlen, n_heads, d_head), dtype=itype, device=device)
+    B = torch.randn((batch_size, seqlen, n_heads, d_head), dtype=itype, device=device)
+    C = torch.randn((batch_size, seqlen, n_heads, d_head), dtype=itype, device=device)
 
     return A, dt, X, B, C
 
 
-def generate_continuous_batched_examples(example_lens_by_batch,
-                                         num_examples,
-                                         full_length,
-                                         last_taken,
-                                         exhausted,
-                                         n_heads,
-                                         d_head,
-                                         itype,
-                                         device='cuda',
-                                         return_naive_ref=True):
-
+def generate_continuous_batched_examples(
+    example_lens_by_batch,
+    num_examples,
+    full_length,
+    last_taken,
+    exhausted,
+    n_heads,
+    d_head,
+    itype,
+    device="cuda",
+    return_naive_ref=True,
+):
     # this function generates a random examples of certain length
     # and then cut according to "example_lens_by_batch" and feed
     # them in continuous batches to the kernels.
@@ -126,23 +114,20 @@ def generate_continuous_batched_examples(example_lens_by_batch,
     # reference output.
 
     # generate the full-length example
-    A, dt, X, B, C = generate_random_inputs(num_examples, full_length, n_heads,
-                                            d_head, itype)
+    A, dt, X, B, C = generate_random_inputs(
+        num_examples, full_length, n_heads, d_head, itype
+    )
 
     if return_naive_ref:
-        Y_min, final_state_min = ssd_minimal_discrete(X * dt.unsqueeze(-1),
-                                                      A * dt,
-                                                      B,
-                                                      C,
-                                                      block_len=full_length //
-                                                      4)
+        Y_min, final_state_min = ssd_minimal_discrete(
+            X * dt.unsqueeze(-1), A * dt, B, C, block_len=full_length // 4
+        )
 
     # internal function that outputs a cont batch of examples
     # given a tuple of lengths for each example in the batch
     # e.g., example_lens=(8, 4) means take 8 samples from first eg,
     #       4 examples from second eg, etc
     def get_continuous_batch(example_lens: tuple[int, ...]):
-
         indices = []
         for i, x in enumerate(example_lens):
             c = last_taken.get(i, 0)
@@ -150,8 +135,10 @@ def get_continuous_batch(example_lens: tuple[int, ...]):
             last_taken[i] = (c + x) % full_length
             exhausted[i] = last_taken[i] == 0
 
-        return (torch.concat([x[i, s:e] for i, (s, e) in enumerate(indices)
-                              ]).unsqueeze(0) for x in (dt, X, B, C))
+        return (
+            torch.concat([x[i, s:e] for i, (s, e) in enumerate(indices)]).unsqueeze(0)
+            for x in (dt, X, B, C)
+        )
 
     # internal function that maps "n" to the appropriate right boundary
     # value when forming continuous batches from examples of length given
@@ -163,19 +150,20 @@ def end_boundary(n: int):
 
     IND_E = None
     for spec in example_lens_by_batch:
-
         # get the (maybe partial) example seen in this cont batch
         dt2, X2, B2, C2 = get_continuous_batch(spec)
 
         # get the metadata
-        cu_seqlens = torch.tensor((0, ) + spec, device=device).cumsum(dim=0)
-        seq_idx = torch.zeros(cu_seqlens[-1],
-                              dtype=torch.int32,
-                              device=cu_seqlens.device)
-        for i, (srt, end) in enumerate(zip(
+        cu_seqlens = torch.tensor((0,) + spec, device=device).cumsum(dim=0)
+        seq_idx = torch.zeros(
+            cu_seqlens[-1], dtype=torch.int32, device=cu_seqlens.device
+        )
+        for i, (srt, end) in enumerate(
+            zip(
                 cu_seqlens,
                 cu_seqlens[1:],
-        )):
+            )
+        ):
             seq_idx[srt:end] = i
 
         # for cont batch
@@ -190,19 +178,21 @@ def end_boundary(n: int):
         X2 = X2.squeeze(0)
         B2 = B2.squeeze(0)
         C2 = C2.squeeze(0)
-        yield ([Y_min[s, IND_S[s]:IND_E[s]]
-                for s in range(num_examples)] if return_naive_ref else None,
-               cu_seqlens, seq_idx, (A, dt2, X2, B2, C2))
+        yield (
+            [Y_min[s, IND_S[s] : IND_E[s]] for s in range(num_examples)]
+            if return_naive_ref
+            else None,
+            cu_seqlens,
+            seq_idx,
+            (A, dt2, X2, B2, C2),
+        )
 
 
-@pytest.mark.parametrize("itype",
-                         [torch.float32, torch.float16, torch.bfloat16])
+@pytest.mark.parametrize("itype", [torch.float32, torch.float16, torch.bfloat16])
 @pytest.mark.parametrize("n_heads", [3, 4, 11, 16, 32])
 @pytest.mark.parametrize("d_head", [5, 8, 19, 32, 128])
 @pytest.mark.parametrize("seq_len_chunk_size", [(112, 16), (128, 32)])
-def test_mamba_chunk_scan_single_example(d_head, n_heads, seq_len_chunk_size,
-                                         itype):
-
+def test_mamba_chunk_scan_single_example(d_head, n_heads, seq_len_chunk_size, itype):
     # this tests the kernels on a single example (bs=1)
 
     # TODO: the bfloat16 case requires higher thresholds. To be investigated
@@ -219,15 +209,16 @@ def test_mamba_chunk_scan_single_example(d_head, n_heads, seq_len_chunk_size,
     #   it is not an operational limitation.
     seqlen, chunk_size = seq_len_chunk_size
 
-    A, dt, X, B, C = generate_random_inputs(batch_size, seqlen, n_heads,
-                                            d_head, itype)
+    A, dt, X, B, C = generate_random_inputs(batch_size, seqlen, n_heads, d_head, itype)
 
-    Y_min, final_state_min = ssd_minimal_discrete(X * dt.unsqueeze(-1), A * dt,
-                                                  B, C, chunk_size)
+    Y_min, final_state_min = ssd_minimal_discrete(
+        X * dt.unsqueeze(-1), A * dt, B, C, chunk_size
+    )
 
     cu_seqlens = torch.tensor((0, seqlen), device="cuda").cumsum(dim=0)
     cu_chunk_seqlens, last_chunk_indices, seq_idx_chunks = (
-        compute_varlen_chunk_metadata(cu_seqlens, chunk_size))
+        compute_varlen_chunk_metadata(cu_seqlens, chunk_size)
+    )
     # varlen has implicit batch=1
     X = X.squeeze(0)
     dt = dt.squeeze(0)
@@ -255,10 +246,12 @@ def test_mamba_chunk_scan_single_example(d_head, n_heads, seq_len_chunk_size,
 
     # just test the last head
     # NOTE, in the kernel we always cast states to fp32
-    torch.testing.assert_close(final_state[:, -1].to(torch.float32),
-                               final_state_min[:, -1].to(torch.float32),
-                               atol=atol,
-                               rtol=rtol)
+    torch.testing.assert_close(
+        final_state[:, -1].to(torch.float32),
+        final_state_min[:, -1].to(torch.float32),
+        atol=atol,
+        rtol=rtol,
+    )
 
 
 @pytest.mark.parametrize("itype", [torch.float32, torch.float16])
@@ -267,32 +260,40 @@ def test_mamba_chunk_scan_single_example(d_head, n_heads, seq_len_chunk_size,
 @pytest.mark.parametrize(
     "seq_len_chunk_size_cases",
     [
-
         # small-ish chunk_size (8)
         (64, 8, 2, [(64, 32), (64, 32)]),
         (64, 8, 2, [(32, 32), (32, 32), (32, 32)]),
         (64, 8, 2, [(8, 8), (8, 8), (8, 8)]),  # chunk size boundary
-        (64, 8, 2, [(4, 4), (4, 4), (4, 4),
-                    (4, 4)]),  # chunk_size larger than cont batches
-        (64, 8, 5, [
-            (64, 32, 16, 8, 8),
-            (8, 16, 32, 16, 8),
-            (8, 8, 16, 32, 16),
-        ]),  # mode examples with varied lengths
-
+        (
+            64,
+            8,
+            2,
+            [(4, 4), (4, 4), (4, 4), (4, 4)],
+        ),  # chunk_size larger than cont batches
+        (
+            64,
+            8,
+            5,
+            [
+                (64, 32, 16, 8, 8),
+                (8, 16, 32, 16, 8),
+                (8, 8, 16, 32, 16),
+            ],
+        ),  # mode examples with varied lengths
         # large-ish chunk_size (256)
-        (64, 256, 1, [(5, ), (1, ), (1, ),
-                      (1, )]),  # irregular sizes with small sequences
-        (64, 256, 2, [(5, 30), (1, 2), (1, 2),
-                      (1, 2)]),  # irregular sizes with small sequences
-
+        (64, 256, 1, [(5,), (1,), (1,), (1,)]),  # irregular sizes with small sequences
+        (
+            64,
+            256,
+            2,
+            [(5, 30), (1, 2), (1, 2), (1, 2)],
+        ),  # irregular sizes with small sequences
         # we also need to test some large seqlen
         # to catch errors with init states decay
         (768, 128, 2, [(138, 225), (138, 225)]),
-    ])
-def test_mamba_chunk_scan_cont_batch(d_head, n_heads, seq_len_chunk_size_cases,
-                                     itype):
-
+    ],
+)
+def test_mamba_chunk_scan_cont_batch(d_head, n_heads, seq_len_chunk_size_cases, itype):
     # this test with multiple examples in a continuous batch
     # (i.e. chunked prefill)
 
@@ -311,12 +312,17 @@ def test_mamba_chunk_scan_cont_batch(d_head, n_heads, seq_len_chunk_size_cases,
 
     states = None
     for Y_min, cu_seqlens, _token_seq_idx, (
-            A, dt, X, B, C) in generate_continuous_batched_examples(
-                cases, num_examples, seqlen, last_taken, exhausted, n_heads,
-                d_head, itype):
-
+        A,
+        dt,
+        X,
+        B,
+        C,
+    ) in generate_continuous_batched_examples(
+        cases, num_examples, seqlen, last_taken, exhausted, n_heads, d_head, itype
+    ):
         cu_chunk_seqlens, last_chunk_indices, seq_idx_chunks = (
-            compute_varlen_chunk_metadata(cu_seqlens, chunk_size))
+            compute_varlen_chunk_metadata(cu_seqlens, chunk_size)
+        )
 
         Y = torch.empty_like(X)
         new_states = mamba_chunk_scan_combined_varlen(
@@ -337,9 +343,8 @@ def test_mamba_chunk_scan_cont_batch(d_head, n_heads, seq_len_chunk_size_cases,
 
         # just test the last in sequence
         for i in range(num_examples):
-
             # just test one dim and dstate
-            Y_eg = Y[cu_seqlens[i]:cu_seqlens[i + 1], 0, 0]
+            Y_eg = Y[cu_seqlens[i] : cu_seqlens[i + 1], 0, 0]
             Y_min_eg = Y_min[i][:, 0, 0]
             torch.testing.assert_close(Y_eg, Y_min_eg, atol=atol, rtol=rtol)
 
@@ -347,18 +352,20 @@ def test_mamba_chunk_scan_cont_batch(d_head, n_heads, seq_len_chunk_size_cases,
         states = new_states
         for i, clear in exhausted.items():
             if clear:
-                states[i].fill_(0.)
+                states[i].fill_(0.0)
                 exhausted[i] = False
 
 
 @pytest.mark.parametrize("chunk_size", [8, 256])
-@pytest.mark.parametrize("seqlens", [
-    (16, 2, 8, 13),
-    (270, 88, 212, 203),
-    (16, 20),
-])
+@pytest.mark.parametrize(
+    "seqlens",
+    [
+        (16, 2, 8, 13),
+        (270, 88, 212, 203),
+        (16, 20),
+    ],
+)
 def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
-
     # This test verifies the correctness of the chunked prefill implementation
     # in the mamba2 ssd kernels, by comparing concatenation (in the sequence
     # dimension) of chunked results with the full sequence result.
@@ -387,21 +394,25 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
     last_taken: dict = {}  # map: eg -> pointer to last taken sample
     exhausted: dict = {}  # map: eg -> boolean indicating example is exhausted
     _, cu_seqlens, seq_idx, (A, dt, X, B, C) = next(
-        generate_continuous_batched_examples([seqlens],
-                                             num_sequences,
-                                             max_seqlen,
-                                             last_taken,
-                                             exhausted,
-                                             n_heads,
-                                             d_head,
-                                             itype,
-                                             return_naive_ref=False))
+        generate_continuous_batched_examples(
+            [seqlens],
+            num_sequences,
+            max_seqlen,
+            last_taken,
+            exhausted,
+            n_heads,
+            d_head,
+            itype,
+            return_naive_ref=False,
+        )
+    )
     seqlens = torch.tensor(seqlens, dtype=torch.int32, device=X.device)
     device = X.device
 
     ## full seqlen computation
     cu_chunk_seqlens, last_chunk_indices, seq_idx_chunks = (
-        compute_varlen_chunk_metadata(cu_seqlens, chunk_size))
+        compute_varlen_chunk_metadata(cu_seqlens, chunk_size)
+    )
     Y_ref = torch.empty_like(X)
     state_ref = mamba_chunk_scan_combined_varlen(
         X,
@@ -422,11 +433,9 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
     ## chunked seqlen computation
     # first chunk
     chunked_seqlens = seqlens // 2
-    chunked_cu_seqlens = torch.cat([
-        torch.tensor([0], device=device),
-        torch.cumsum(chunked_seqlens, dim=0)
-    ],
-                                   dim=0)
+    chunked_cu_seqlens = torch.cat(
+        [torch.tensor([0], device=device), torch.cumsum(chunked_seqlens, dim=0)], dim=0
+    )
     chunked_input_seq_len = chunked_cu_seqlens[-1]
     X_chunked = torch.zeros_like(X)[:chunked_input_seq_len, ...]
     dt_chunked = torch.zeros_like(dt)[:chunked_input_seq_len, ...]
@@ -443,7 +452,8 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
         # fmt: on
 
     cu_chunk_seqlens, last_chunk_indices, seq_idx_chunks = (
-        compute_varlen_chunk_metadata(chunked_cu_seqlens, chunk_size))
+        compute_varlen_chunk_metadata(chunked_cu_seqlens, chunk_size)
+    )
     Y_partial = torch.empty_like(X_chunked)
     partial_state = mamba_chunk_scan_combined_varlen(
         X_chunked,
@@ -463,11 +473,13 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
 
     # remaining chunk
     remaining_chunked_seqlens = seqlens - chunked_seqlens
-    remaining_chunked_cu_seqlens = torch.cat([
-        torch.tensor([0], device=device),
-        torch.cumsum(remaining_chunked_seqlens, dim=0)
-    ],
-                                             dim=0)
+    remaining_chunked_cu_seqlens = torch.cat(
+        [
+            torch.tensor([0], device=device),
+            torch.cumsum(remaining_chunked_seqlens, dim=0),
+        ],
+        dim=0,
+    )
     remaining_chunked_input_seq_len = remaining_chunked_cu_seqlens[-1]
     # fmt: off
     remaining_X_chunked = torch.zeros_like(X)[:remaining_chunked_input_seq_len, ...]  # noqa: E501
@@ -497,8 +509,8 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
     assert concat_batch_f(C_chunked, remaining_C_chunked).equal(C)
 
     cu_chunk_seqlens, last_chunk_indices, seq_idx_chunks = (
-        compute_varlen_chunk_metadata(remaining_chunked_cu_seqlens,
-                                      chunk_size))
+        compute_varlen_chunk_metadata(remaining_chunked_cu_seqlens, chunk_size)
+    )
 
     Y_chunked = torch.empty_like(remaining_X_chunked)
     state_chunked = mamba_chunk_scan_combined_varlen(
@@ -520,20 +532,22 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
 
     # kernel chunked is same as kernel overall
     for i in range(num_sequences):
-        Y_seq = Y[cu_seqlens[i]:cu_seqlens[i + 1], ...]
-        Y_ref_seq = Y_ref[cu_seqlens[i]:cu_seqlens[i + 1], ...]
+        Y_seq = Y[cu_seqlens[i] : cu_seqlens[i + 1], ...]
+        Y_ref_seq = Y_ref[cu_seqlens[i] : cu_seqlens[i + 1], ...]
         torch.testing.assert_close(
-            Y_seq[:chunked_seqlens[i], ...],
-            Y_ref_seq[:chunked_seqlens[i], ...],
+            Y_seq[: chunked_seqlens[i], ...],
+            Y_ref_seq[: chunked_seqlens[i], ...],
             atol=atol,
             rtol=rtol,
-            msg=lambda x: f"seq{i} output part1 " + x)  # noqa: B023
+            msg=lambda x: f"seq{i} output part1 " + x,
+        )  # noqa: B023
         torch.testing.assert_close(
-            Y_seq[chunked_seqlens[i]:, ...],
-            Y_ref_seq[chunked_seqlens[i]:, ...],
+            Y_seq[chunked_seqlens[i] :, ...],
+            Y_ref_seq[chunked_seqlens[i] :, ...],
             atol=atol,
             rtol=rtol,
-            msg=lambda x: f"seq{i} output part2 " + x)  # noqa: B023
+            msg=lambda x: f"seq{i} output part2 " + x,
+        )  # noqa: B023
 
         state_seq = state_chunked[i]
         state_seq_ref = state_ref[i]
@@ -542,4 +556,5 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
             state_seq_ref,
             atol=atol,
             rtol=rtol,
-            msg=lambda x: f"seq{i} state " + x)  # noqa: B023
+            msg=lambda x: f"seq{i} state " + x,
+        )  # noqa: B023
diff --git a/tests/kernels/moe/modular_kernel_tools/cli_args.py b/tests/kernels/moe/modular_kernel_tools/cli_args.py
index b95d87cd04f5..d46847fbf6a3 100644
--- a/tests/kernels/moe/modular_kernel_tools/cli_args.py
+++ b/tests/kernels/moe/modular_kernel_tools/cli_args.py
@@ -9,18 +9,19 @@
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 
 from .common import Config
-from .mk_objects import (MK_ALL_PREPARE_FINALIZE_TYPES, MK_FUSED_EXPERT_TYPES,
-                         MK_SINGLE_GPU_PREPARE_FINALIZE_TYPES)
+from .mk_objects import (
+    MK_ALL_PREPARE_FINALIZE_TYPES,
+    MK_FUSED_EXPERT_TYPES,
+    MK_SINGLE_GPU_PREPARE_FINALIZE_TYPES,
+)
 
 
 def make_config_arg_parser(description: str):
-
     def to_pf_class_type(s: str) -> mk.FusedMoEPrepareAndFinalize:
         for pf in MK_ALL_PREPARE_FINALIZE_TYPES:
             if pf.__name__ == s:
                 return pf
-        raise ValueError(
-            f"Cannot find a PrepareFinalize type that matches {s}")
+        raise ValueError(f"Cannot find a PrepareFinalize type that matches {s}")
 
     def to_experts_class_type(s: str) -> mk.FusedMoEPermuteExpertsUnpermute:
         for fe in MK_FUSED_EXPERT_TYPES:
@@ -45,15 +46,18 @@ def to_quant_torch_dtype(s: str) -> torch.dtype:
         "--pf-type",
         type=to_pf_class_type,
         required=True,
-        help=("Choose a PrepareFinalize Type : "
-              f"{[x.__name__ for x in MK_ALL_PREPARE_FINALIZE_TYPES]}"),
+        help=(
+            "Choose a PrepareFinalize Type : "
+            f"{[x.__name__ for x in MK_ALL_PREPARE_FINALIZE_TYPES]}"
+        ),
     )
     parser.add_argument(
         "--experts-type",
         type=to_experts_class_type,
         required=True,
-        help=(f"Choose a FusedExpert type : "
-              f"{[x.__name__ for x in MK_FUSED_EXPERT_TYPES]}"),
+        help=(
+            f"Choose a FusedExpert type : {[x.__name__ for x in MK_FUSED_EXPERT_TYPES]}"
+        ),
     )
     parser.add_argument(
         "-m",
@@ -74,66 +78,65 @@ def to_quant_torch_dtype(s: str) -> torch.dtype:
         default=1024,
         help="N dimension of the first fused-moe matmul",
     )
-    parser.add_argument("--num-experts",
-                        type=int,
-                        default=32,
-                        help="Global num experts")
-    parser.add_argument("--topk",
-                        nargs="+",
-                        type=int,
-                        default=[4, 1],
-                        help="num topk")
+    parser.add_argument(
+        "--num-experts", type=int, default=32, help="Global num experts"
+    )
+    parser.add_argument("--topk", nargs="+", type=int, default=[4, 1], help="num topk")
     parser.add_argument(
         "--fused-moe-chunk-size",
         type=int,
-        help="Fused moe chunk size used for the non-batched fused experts impl."
+        help="Fused moe chunk size used for the non-batched fused experts impl.",
     )
 
     # Quant args
-    parser.add_argument("--quant-dtype",
-                        type=to_quant_torch_dtype,
-                        help="Quant datatype")
-    parser.add_argument("--per-token-quantized-activations",
-                        action='store_true',
-                        help=("The input activations must be per-token "
-                              "quantized"))
-    parser.add_argument("--per-channel-quantized-weights",
-                        action="store_true",
-                        help="The weights must be per-channel quantized.")
-    parser.add_argument("--block-shape",
-                        nargs="+",
-                        type=int,
-                        help="Quantization block shape")
+    parser.add_argument(
+        "--quant-dtype", type=to_quant_torch_dtype, help="Quant datatype"
+    )
+    parser.add_argument(
+        "--per-token-quantized-activations",
+        action="store_true",
+        help=("The input activations must be per-token quantized"),
+    )
+    parser.add_argument(
+        "--per-channel-quantized-weights",
+        action="store_true",
+        help="The weights must be per-channel quantized.",
+    )
+    parser.add_argument(
+        "--block-shape", nargs="+", type=int, help="Quantization block shape"
+    )
 
     # Torch trace profile generation args
-    parser.add_argument("--torch-trace-dir-path",
-                        type=str,
-                        default=None,
-                        help="Get torch trace for single execution")
+    parser.add_argument(
+        "--torch-trace-dir-path",
+        type=str,
+        default=None,
+        help="Get torch trace for single execution",
+    )
 
     return parser
 
 
 def _validate_args(args: argparse.Namespace):
-
     if args.quant_dtype is not None:
         assert args.quant_dtype == torch.float8_e4m3fn
         if args.block_shape is not None:
             assert len(args.block_shape) == 2, (
-                f"block shape must have 2 elements. got {args.block_shape}")
+                f"block shape must have 2 elements. got {args.block_shape}"
+            )
 
     if args.experts_type in MK_SINGLE_GPU_PREPARE_FINALIZE_TYPES:
-        assert args.world_size == 1, (
-            "Single GPU objects need world size set to 1")
+        assert args.world_size == 1, "Single GPU objects need world size set to 1"
 
     if args.torch_trace_dir_path is not None:
         from pathlib import Path
+
         assert Path(args.torch_trace_dir_path).is_dir(), (
-            f"Please create {args.torch_trace_dir_path}")
+            f"Please create {args.torch_trace_dir_path}"
+        )
 
 
 def make_config(args: argparse.Namespace) -> Config:
-
     _validate_args(args)
 
     quant_config = None
@@ -142,7 +145,8 @@ def make_config(args: argparse.Namespace) -> Config:
             quant_dtype=args.quant_dtype,
             per_act_token_quant=args.per_token_quantized_activations,
             per_out_ch_quant=args.per_channel_quantized_weights,
-            block_shape=args.block_shape)
+            block_shape=args.block_shape,
+        )
 
     return Config(
         Ms=args.m,
@@ -156,4 +160,5 @@ def make_config(args: argparse.Namespace) -> Config:
         fused_experts_type=args.experts_type,
         fused_moe_chunk_size=args.fused_moe_chunk_size,
         world_size=args.world_size,
-        torch_trace_dir_path=args.torch_trace_dir_path)
+        torch_trace_dir_path=args.torch_trace_dir_path,
+    )
diff --git a/tests/kernels/moe/modular_kernel_tools/common.py b/tests/kernels/moe/modular_kernel_tools/common.py
index b5fcc4cd70bf..903f13e44474 100644
--- a/tests/kernels/moe/modular_kernel_tools/common.py
+++ b/tests/kernels/moe/modular_kernel_tools/common.py
@@ -8,20 +8,30 @@
 import vllm._custom_ops as ops
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from tests.kernels.moe.utils import make_test_weights, per_token_cast_to_fp8
-from tests.kernels.quantization.nvfp4_utils import (FLOAT4_E2M1_MAX,
-                                                    FLOAT8_E4M3_MAX,
-                                                    dequantize_nvfp4_to_dtype)
+from tests.kernels.quantization.nvfp4_utils import (
+    FLOAT4_E2M1_MAX,
+    FLOAT8_E4M3_MAX,
+    dequantize_nvfp4_to_dtype,
+)
 from tests.kernels.utils import torch_experts
 from vllm.config import VllmConfig
 from vllm.distributed import get_dp_group, get_tensor_model_parallel_world_size
 from vllm.forward_context import set_forward_context
 from vllm.model_executor.layers.fused_moe.config import (
-    FusedMoEConfig, FusedMoEParallelConfig, FusedMoEQuantConfig)
+    FusedMoEConfig,
+    FusedMoEParallelConfig,
+    FusedMoEQuantConfig,
+)
 from vllm.model_executor.layers.fused_moe.fused_moe import fused_topk
 from vllm.utils import has_deep_ep, has_deep_gemm, has_pplx
 
-from .mk_objects import (TestMoEQuantConfig, expert_info, make_fused_experts,
-                         make_prepare_finalize, prepare_finalize_info)
+from .mk_objects import (
+    TestMoEQuantConfig,
+    expert_info,
+    make_fused_experts,
+    make_prepare_finalize,
+    prepare_finalize_info,
+)
 from .parallel_utils import ProcessGroupInfo
 
 
@@ -94,8 +104,7 @@ def is_per_act_token_quant(self) -> bool:
 
     @property
     def is_per_tensor_act_quant(self) -> bool:
-        return (not self.is_per_act_token_quant
-                and self.quant_block_shape is None)
+        return not self.is_per_act_token_quant and self.quant_block_shape is None
 
     @property
     def is_per_out_ch_quant(self) -> bool:
@@ -134,23 +143,24 @@ def make_env_data(self) -> tuple[VllmConfig, dict[Any, Any]]:
 
         if self.fused_moe_chunk_size is not None:
             env_dict.update(
-                {"VLLM_FUSED_MOE_CHUNK_SIZE": str(self.fused_moe_chunk_size)})
+                {"VLLM_FUSED_MOE_CHUNK_SIZE": str(self.fused_moe_chunk_size)}
+            )
 
         return vllm_config, env_dict
 
     def is_fp8_block_quantized(self):
-        return (self.quant_dtype == torch.float8_e4m3fn
-                and self.quant_block_shape is not None)
+        return (
+            self.quant_dtype == torch.float8_e4m3fn
+            and self.quant_block_shape is not None
+        )
 
     def is_batched_prepare_finalize(self):
         info = prepare_finalize_info(self.prepare_finalize_type)
-        return (mk.FusedMoEActivationFormat.BatchedExperts ==
-                info.activation_format)
+        return mk.FusedMoEActivationFormat.BatchedExperts == info.activation_format
 
     def is_batched_fused_experts(self):
         info = expert_info(self.fused_experts_type)
-        return (mk.FusedMoEActivationFormat.BatchedExperts ==
-                info.activation_format)
+        return mk.FusedMoEActivationFormat.BatchedExperts == info.activation_format
 
     def is_standard_fused_experts(self):
         info = expert_info(self.fused_experts_type)
@@ -190,8 +200,10 @@ def needs_pplx(self):
 
     def needs_deep_ep(self):
         info = prepare_finalize_info(self.prepare_finalize_type)
-        return (info.backend == "deepep_high_throughput"
-                or info.backend == "deepep_low_latency")
+        return (
+            info.backend == "deepep_high_throughput"
+            or info.backend == "deepep_low_latency"
+        )
 
     def all2all_backend(self):
         info = prepare_finalize_info(self.prepare_finalize_type)
@@ -211,20 +223,26 @@ def is_valid(self):
             return False
 
         # Check quantization sanity
-        if (int(self.is_per_act_token_quant) +
-                int(self.is_per_tensor_act_quant) +
-                int(self.quant_block_shape is not None)) > 1:
+        if (
+            int(self.is_per_act_token_quant)
+            + int(self.is_per_tensor_act_quant)
+            + int(self.quant_block_shape is not None)
+        ) > 1:
             # invalid quant config
             return False
 
         # check type support
         if self.quant_dtype is None:
-            if (self.dtype not in self.pf_supported_types()
-                    or self.dtype not in self.fe_supported_types()):
+            if (
+                self.dtype not in self.pf_supported_types()
+                or self.dtype not in self.fe_supported_types()
+            ):
                 return False
         else:
-            if (self.quant_dtype not in self.pf_supported_types()
-                    or self.quant_dtype not in self.fe_supported_types()):
+            if (
+                self.quant_dtype not in self.pf_supported_types()
+                or self.quant_dtype not in self.fe_supported_types()
+            ):
                 return False
 
         # Check block quanization support
@@ -261,18 +279,21 @@ class WeightTensors:
     def describe(self):
         s = ""
         s += "== Weight Tensors: \n"
-        s += f' - {_describe_tensor(self.w1, "w1")} \n'
-        s += f' - {_describe_tensor(self.w2, "w2")} \n'
-        s += f' - {_describe_tensor(self.w1_scale, "w1_scale")} \n'
-        s += f' - {_describe_tensor(self.w2_scale, "w2_scale")} \n'
-        s += f' - {_describe_tensor(self.w1_gs, "w1_gs")} \n'
-        s += f' - {_describe_tensor(self.w2_gs, "w2_gs")} \n'
+        s += f" - {_describe_tensor(self.w1, 'w1')} \n"
+        s += f" - {_describe_tensor(self.w2, 'w2')} \n"
+        s += f" - {_describe_tensor(self.w1_scale, 'w1_scale')} \n"
+        s += f" - {_describe_tensor(self.w2_scale, 'w2_scale')} \n"
+        s += f" - {_describe_tensor(self.w1_gs, 'w1_gs')} \n"
+        s += f" - {_describe_tensor(self.w2_gs, 'w2_gs')} \n"
         return s
 
     def is_quantized(self) -> bool:
         # or w1_scale is not None?
-        return (self.w1.dtype == torch.float8_e4m3fn
-                or self.w1.dtype == torch.uint8 or self.w1.dtype == torch.int8)
+        return (
+            self.w1.dtype == torch.float8_e4m3fn
+            or self.w1.dtype == torch.uint8
+            or self.w1.dtype == torch.int8
+        )
 
     def to_current_device(self):
         device = torch.cuda.current_device()
@@ -289,16 +310,13 @@ def to_current_device(self):
         if self.w2_gs is not None:
             self.w2_gs = self.w2_gs.to(device=device)
 
-    def slice_weights(self, rank: int,
-                      num_local_experts: int) -> "WeightTensors":
+    def slice_weights(self, rank: int, num_local_experts: int) -> "WeightTensors":
         s = rank * num_local_experts
         e = s + num_local_experts
         w1 = self.w1[s:e, :, :]
         w2 = self.w2[s:e, :, :]
-        w1_scale = self.w1_scale[
-            s:e, :, :] if self.w1_scale is not None else None
-        w2_scale = self.w2_scale[
-            s:e, :, :] if self.w2_scale is not None else None
+        w1_scale = self.w1_scale[s:e, :, :] if self.w1_scale is not None else None
+        w2_scale = self.w2_scale[s:e, :, :] if self.w2_scale is not None else None
         w1_gs = self.w1_gs[s:e] if self.w1_gs is not None else None
         w2_gs = self.w2_gs[s:e] if self.w2_gs is not None else None
 
@@ -313,15 +331,11 @@ def make(config: Config) -> "WeightTensors":
             in_dtype=config.dtype,
             quant_dtype=config.quant_dtype,
             block_shape=config.quant_block_shape,
-            per_out_ch_quant=config.
-            is_per_act_token_quant,  # or config.is_per_out_ch_quant
+            per_out_ch_quant=config.is_per_act_token_quant,  # or config.is_per_out_ch_quant
+        )
+        return WeightTensors(
+            w1=w1, w2=w2, w1_scale=w1_scale, w2_scale=w2_scale, w1_gs=w1_gs, w2_gs=w2_gs
         )
-        return WeightTensors(w1=w1,
-                             w2=w2,
-                             w1_scale=w1_scale,
-                             w2_scale=w2_scale,
-                             w1_gs=w1_gs,
-                             w2_gs=w2_gs)
 
 
 @dataclass
@@ -336,22 +350,22 @@ class RankTensors:
     def describe(self):
         s = ""
         s += "== Rank Tensors: \n"
-        s += f' - {_describe_tensor(self.hidden_states, "HS")} \n'
-        s += f' - {_describe_tensor(self.hidden_states_scale, "HS_scale")} \n'
-        s += f' - {_describe_tensor(self.topk_weights, "topk_weights")} \n'
-        s += f' - {_describe_tensor(self.topk_ids, "topk_ids")} \n'
-        s += f' - {_describe_tensor(self.expert_map, "expert_map")} \n'
+        s += f" - {_describe_tensor(self.hidden_states, 'HS')} \n"
+        s += f" - {_describe_tensor(self.hidden_states_scale, 'HS_scale')} \n"
+        s += f" - {_describe_tensor(self.topk_weights, 'topk_weights')} \n"
+        s += f" - {_describe_tensor(self.topk_ids, 'topk_ids')} \n"
+        s += f" - {_describe_tensor(self.expert_map, 'expert_map')} \n"
         return s
 
     @staticmethod
     def make_hidden_states(
-            config: Config) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
+        config: Config,
+    ) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
         """
         Return hidden_states
         """
         m, k, dtype = (config.M, config.K, config.dtype)
-        a = (torch.randn(
-            (m, k), device=torch.cuda.current_device(), dtype=dtype) / 15.0)
+        a = torch.randn((m, k), device=torch.cuda.current_device(), dtype=dtype) / 15.0
 
         if config.quant_dtype is None:
             return a, None
@@ -362,36 +376,29 @@ def make_hidden_states(
         # first - so further quantize and dequantize will yield the same
         # values.
         if config.is_per_tensor_act_quant:
-            a_q, a_scales = ops.scaled_fp8_quant(
-                a, use_per_token_if_dynamic=False)
+            a_q, a_scales = ops.scaled_fp8_quant(a, use_per_token_if_dynamic=False)
             return a_q.float().mul(a_scales).to(dtype), a_scales
 
         if config.is_per_act_token_quant:
-            a_q, a_scales = ops.scaled_fp8_quant(a,
-                                                 use_per_token_if_dynamic=True)
+            a_q, a_scales = ops.scaled_fp8_quant(a, use_per_token_if_dynamic=True)
             return a_q.float().mul(a_scales).to(dtype), None
 
         assert config.quant_block_shape is not None
         block_k = config.quant_block_shape[1]
         a_q, a_scales = per_token_cast_to_fp8(a, block_size=block_k)
-        return a_q.float().view(
-            (-1, block_k)).mul(a_scales.view(-1, 1)).view(m, k).to(dtype), None
+        return a_q.float().view((-1, block_k)).mul(a_scales.view(-1, 1)).view(m, k).to(
+            dtype
+        ), None
 
     @staticmethod
     def make(config: Config, pgi: ProcessGroupInfo):
-
         dtype = config.dtype
         topk, m, _ = (config.topk, config.M, config.K)
-        hidden_states, hidden_states_scale = RankTensors.make_hidden_states(
-            config)
+        hidden_states, hidden_states_scale = RankTensors.make_hidden_states(config)
 
-        num_local_experts, global_num_experts = (config.num_local_experts,
-                                                 config.E)
-        score = torch.randn((m, global_num_experts),
-                            device="cuda",
-                            dtype=dtype)
-        topk_weights, topk_ids, _ = fused_topk(hidden_states, score, topk,
-                                               False)
+        num_local_experts, global_num_experts = (config.num_local_experts, config.E)
+        score = torch.randn((m, global_num_experts), device="cuda", dtype=dtype)
+        topk_weights, topk_ids, _ = fused_topk(hidden_states, score, topk, False)
 
         # distribute topk_ids evenly
         for mi in range(m):
@@ -400,14 +407,15 @@ def make(config: Config, pgi: ProcessGroupInfo):
 
         expert_map = None
         if config.world_size > 1 and config.supports_expert_map():
-            expert_map = torch.full((global_num_experts, ),
-                                    fill_value=-1,
-                                    dtype=torch.int32)
+            expert_map = torch.full(
+                (global_num_experts,), fill_value=-1, dtype=torch.int32
+            )
             s = pgi.rank * num_local_experts
             e = s + num_local_experts
             expert_map[s:e] = torch.tensor(list(range(num_local_experts)))
-            expert_map = expert_map.to(device=torch.cuda.current_device(),
-                                       dtype=torch.int32)
+            expert_map = expert_map.to(
+                device=torch.cuda.current_device(), dtype=torch.int32
+            )
 
         return RankTensors(
             hidden_states=hidden_states,
@@ -418,9 +426,9 @@ def make(config: Config, pgi: ProcessGroupInfo):
         )
 
 
-def reference_moe_impl(config: Config, weights: WeightTensors,
-                       rank_tensors: RankTensors) -> torch.Tensor:
-
+def reference_moe_impl(
+    config: Config, weights: WeightTensors, rank_tensors: RankTensors
+) -> torch.Tensor:
     if config.quant_dtype == "nvfp4":
         quant_blocksize = 16
         dtype = config.dtype
@@ -433,8 +441,10 @@ def reference_moe_impl(config: Config, weights: WeightTensors,
         w2_blockscale = weights.w2_scale
         w2_gs = weights.w2_gs
 
-        a_global_scale = ((FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) / torch.amax(
-            rank_tensors.hidden_states.flatten(), dim=-1)).to(torch.float32)
+        a_global_scale = (
+            (FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX)
+            / torch.amax(rank_tensors.hidden_states.flatten(), dim=-1)
+        ).to(torch.float32)
 
         assert w1_gs is not None
         assert w2_gs is not None
@@ -447,14 +457,17 @@ def reference_moe_impl(config: Config, weights: WeightTensors,
         assert w2_blockscale.shape[2] % 4 == 0
 
         a_fp4, a_scale_interleaved = ops.scaled_fp4_quant(
-            rank_tensors.hidden_states, a_global_scale)
+            rank_tensors.hidden_states, a_global_scale
+        )
 
-        a = dequantize_nvfp4_to_dtype(a_fp4,
-                                      a_scale_interleaved,
-                                      a_global_scale,
-                                      dtype=dtype,
-                                      device=a_fp4.device,
-                                      block_size=quant_blocksize)
+        a = dequantize_nvfp4_to_dtype(
+            a_fp4,
+            a_scale_interleaved,
+            a_global_scale,
+            dtype=dtype,
+            device=a_fp4.device,
+            block_size=quant_blocksize,
+        )
 
         e = w1_q.shape[0]
         n = w1_q.shape[1] // 2
@@ -464,18 +477,22 @@ def reference_moe_impl(config: Config, weights: WeightTensors,
         w2 = torch.zeros((e, k, n), device="cuda", dtype=dtype)
 
         for idx in range(0, e):
-            w1[idx] = dequantize_nvfp4_to_dtype(w1_q[idx],
-                                                w1_blockscale[idx],
-                                                w1_gs[idx],
-                                                dtype=dtype,
-                                                device=w1_q.device,
-                                                block_size=quant_blocksize)
-            w2[idx] = dequantize_nvfp4_to_dtype(w2_q[idx],
-                                                w2_blockscale[idx],
-                                                w2_gs[idx],
-                                                dtype=dtype,
-                                                device=w2_q.device,
-                                                block_size=quant_blocksize)
+            w1[idx] = dequantize_nvfp4_to_dtype(
+                w1_q[idx],
+                w1_blockscale[idx],
+                w1_gs[idx],
+                dtype=dtype,
+                device=w1_q.device,
+                block_size=quant_blocksize,
+            )
+            w2[idx] = dequantize_nvfp4_to_dtype(
+                w2_q[idx],
+                w2_blockscale[idx],
+                w2_gs[idx],
+                dtype=dtype,
+                device=w2_q.device,
+                block_size=quant_blocksize,
+            )
         a_scale = None
         w1_scale = None
         w2_scale = None
@@ -493,27 +510,29 @@ def reference_moe_impl(config: Config, weights: WeightTensors,
         per_act_token_quant = config.is_per_act_token_quant
         block_shape = config.quant_block_shape
 
-    return torch_experts(a=a,
-                         w1=w1,
-                         w2=w2,
-                         topk_weight=rank_tensors.topk_weights,
-                         topk_ids=rank_tensors.topk_ids,
-                         global_num_experts=config.E,
-                         expert_map=None,
-                         w1_scale=w1_scale,
-                         w2_scale=w2_scale,
-                         a1_scale=a_scale,
-                         quant_dtype=quant_dtype,
-                         per_act_token_quant=per_act_token_quant,
-                         block_shape=block_shape,
-                         apply_router_weights_on_input=config.topk == 1
-                         and config.supports_apply_weight_on_input())
+    return torch_experts(
+        a=a,
+        w1=w1,
+        w2=w2,
+        topk_weight=rank_tensors.topk_weights,
+        topk_ids=rank_tensors.topk_ids,
+        global_num_experts=config.E,
+        expert_map=None,
+        w1_scale=w1_scale,
+        w2_scale=w2_scale,
+        a1_scale=a_scale,
+        quant_dtype=quant_dtype,
+        per_act_token_quant=per_act_token_quant,
+        block_shape=block_shape,
+        apply_router_weights_on_input=config.topk == 1
+        and config.supports_apply_weight_on_input(),
+    )
 
 
 def _make_gscale(num_experts: int) -> torch.Tensor:
-    return torch.ones((num_experts, ),
-                      device=torch.cuda.current_device(),
-                      dtype=torch.float32)
+    return torch.ones(
+        (num_experts,), device=torch.cuda.current_device(), dtype=torch.float32
+    )
 
 
 def make_modular_kernel(
@@ -521,12 +540,12 @@ def make_modular_kernel(
     vllm_config: VllmConfig,
     quant_config: FusedMoEQuantConfig,
 ) -> mk.FusedMoEModularKernel:
-
     def next_power_of_2(x):
         import math
+
         if x == 0:
             return 1
-        return 2**math.ceil(math.log2(x))
+        return 2 ** math.ceil(math.log2(x))
 
     # make moe config
     moe_parallel_config: FusedMoEParallelConfig = FusedMoEParallelConfig.make(
@@ -546,9 +565,9 @@ def next_power_of_2(x):
     )
 
     # make modular kernel
-    prepare_finalize = make_prepare_finalize(config.prepare_finalize_type,
-                                             config.all2all_backend(), moe,
-                                             quant_config)
+    prepare_finalize = make_prepare_finalize(
+        config.prepare_finalize_type, config.all2all_backend(), moe, quant_config
+    )
 
     fused_experts = make_fused_experts(
         config.fused_experts_type,
@@ -559,7 +578,8 @@ def next_power_of_2(x):
     )
 
     modular_kernel = mk.FusedMoEModularKernel(
-        prepare_finalize=prepare_finalize, fused_experts=fused_experts)
+        prepare_finalize=prepare_finalize, fused_experts=fused_experts
+    )
 
     return modular_kernel
 
@@ -587,10 +607,8 @@ def run_modular_kernel(
         w1_scale=rank_weights.w1_scale,
         w2_scale=rank_weights.w2_scale,
         a1_scale=rank_tensors.hidden_states_scale,
-        g1_alphas=(1 / rank_weights.w1_gs)
-        if rank_weights.w1_gs is not None else None,
-        g2_alphas=(1 / rank_weights.w2_gs)
-        if rank_weights.w2_gs is not None else None,
+        g1_alphas=(1 / rank_weights.w1_gs) if rank_weights.w1_gs is not None else None,
+        g2_alphas=(1 / rank_weights.w2_gs) if rank_weights.w2_gs is not None else None,
         a1_gscale=gscale,
         a2_gscale=gscale,
         block_shape=config.quant_block_shape,
@@ -603,38 +621,30 @@ def run_modular_kernel(
     # impls might update the tensor in place
     hidden_states = rank_tensors.hidden_states.clone()
 
-    topk_ids = rank_tensors.topk_ids.to(
-        mk.prepare_finalize.topk_indices_dtype())
+    topk_ids = rank_tensors.topk_ids.to(mk.prepare_finalize.topk_indices_dtype())
 
     mk_kwargs = {
-        "hidden_states":
-        hidden_states,
-        "w1":
-        rank_weights.w1,
-        "w2":
-        rank_weights.w2,
-        "topk_weights":
-        rank_tensors.topk_weights,
-        "topk_ids":
-        topk_ids,
-        "expert_map":
-        rank_tensors.expert_map,
-        "global_num_experts":
-        config.E,
-        "apply_router_weight_on_input":
-        config.topk == 1 and config.supports_apply_weight_on_input(),
+        "hidden_states": hidden_states,
+        "w1": rank_weights.w1,
+        "w2": rank_weights.w2,
+        "topk_weights": rank_tensors.topk_weights,
+        "topk_ids": topk_ids,
+        "expert_map": rank_tensors.expert_map,
+        "global_num_experts": config.E,
+        "apply_router_weight_on_input": config.topk == 1
+        and config.supports_apply_weight_on_input(),
     }
 
     num_tokens = rank_tensors.hidden_states.shape[0]
-    num_tokens_across_dp = torch.tensor([num_tokens] * config.world_size,
-                                        device="cuda",
-                                        dtype=torch.int)
+    num_tokens_across_dp = torch.tensor(
+        [num_tokens] * config.world_size, device="cuda", dtype=torch.int
+    )
 
     with set_forward_context(
-            None,
-            vllm_config,
-            num_tokens=num_tokens,
-            num_tokens_across_dp=num_tokens_across_dp,
+        None,
+        vllm_config,
+        num_tokens=num_tokens,
+        num_tokens_across_dp=num_tokens_across_dp,
     ):
         out = mk.forward(**mk_kwargs)
 
diff --git a/tests/kernels/moe/modular_kernel_tools/make_feature_matrix.py b/tests/kernels/moe/modular_kernel_tools/make_feature_matrix.py
index c1037b60bf38..9040db017fd6 100644
--- a/tests/kernels/moe/modular_kernel_tools/make_feature_matrix.py
+++ b/tests/kernels/moe/modular_kernel_tools/make_feature_matrix.py
@@ -10,14 +10,21 @@
 from tqdm import tqdm
 
 from vllm.config import VllmConfig, set_current_vllm_config
-from vllm.model_executor.layers.fused_moe.config import (
-    FUSED_MOE_UNQUANTIZED_CONFIG)
+from vllm.model_executor.layers.fused_moe.config import FUSED_MOE_UNQUANTIZED_CONFIG
 from vllm.platforms import current_platform
 
-from .common import (Config, RankTensors, WeightTensors, reference_moe_impl,
-                     run_modular_kernel)
-from .mk_objects import (MK_FUSED_EXPERT_TYPES,
-                         MK_MULTI_GPU_PREPARE_FINALIZE_TYPES, MK_QUANT_CONFIGS)
+from .common import (
+    Config,
+    RankTensors,
+    WeightTensors,
+    reference_moe_impl,
+    run_modular_kernel,
+)
+from .mk_objects import (
+    MK_FUSED_EXPERT_TYPES,
+    MK_MULTI_GPU_PREPARE_FINALIZE_TYPES,
+    MK_QUANT_CONFIGS,
+)
 from .parallel_utils import ProcessGroupInfo, parallel_launch_with_config
 
 
@@ -38,8 +45,9 @@ def rank_worker(
 
     # sanity check
     from vllm import envs
+
     if config.fused_moe_chunk_size is not None:
-        assert (config.fused_moe_chunk_size == envs.VLLM_FUSED_MOE_CHUNK_SIZE)
+        assert config.fused_moe_chunk_size == envs.VLLM_FUSED_MOE_CHUNK_SIZE
 
     # get weights to this device
     weights.to_current_device()
@@ -60,8 +68,7 @@ def rank_worker(
         rank_tensors = RankTensors.make(cfgx, pgi)
 
         # modular kernel out
-        mk_out = run_modular_kernel(pgi, vllm_config, cfgx, weights,
-                                    rank_tensors)
+        mk_out = run_modular_kernel(pgi, vllm_config, cfgx, weights, rank_tensors)
 
         with set_current_vllm_config(vllm_config):
             ref_out = reference_moe_impl(cfgx, weights, rank_tensors)
@@ -70,28 +77,27 @@ def rank_worker(
 
 
 def make_feature_matrix(csv_file_path: str):
-
     from dataclasses import asdict
 
     import pandas as pd
 
-    def add_to_results(config: Config,
-                       success: Result,
-                       results_df: Optional[pd.DataFrame] = None):
+    def add_to_results(
+        config: Config, success: Result, results_df: Optional[pd.DataFrame] = None
+    ):
         config_dict = asdict(config)
-        config_dict['prepare_finalize_type'] = config_dict[
-            'prepare_finalize_type'].__name__
-        config_dict['fused_experts_type'] = config_dict[
-            'fused_experts_type'].__name__
-        config_dict['per_tensor_act_quant'] = config.is_per_tensor_act_quant
-        quant_config_dict = config_dict['quant_config']
-        del config_dict['quant_config']
+        config_dict["prepare_finalize_type"] = config_dict[
+            "prepare_finalize_type"
+        ].__name__
+        config_dict["fused_experts_type"] = config_dict["fused_experts_type"].__name__
+        config_dict["per_tensor_act_quant"] = config.is_per_tensor_act_quant
+        quant_config_dict = config_dict["quant_config"]
+        del config_dict["quant_config"]
         if quant_config_dict is None:
             quant_config = FUSED_MOE_UNQUANTIZED_CONFIG
             quant_config_dict = asdict(quant_config)
 
         config_dict |= quant_config_dict
-        result_dict = config_dict | {'success': success.name}
+        result_dict = config_dict | {"success": success.name}
 
         result_df = pd.DataFrame([result_dict])
         if results_df is None:
@@ -112,22 +118,26 @@ def add_to_results(config: Config,
     Q_TYPES = MK_QUANT_CONFIGS
 
     combinations = list(
-        product(Ms, Ks, Ns, Es, TOPKs, DTYPEs, PF_TYPES, FE_TYPES, Q_TYPES))
+        product(Ms, Ks, Ns, Es, TOPKs, DTYPEs, PF_TYPES, FE_TYPES, Q_TYPES)
+    )
 
     results_df: Optional[pd.DataFrame] = None
     for m, k, n, e, topks, dtype, pf_type, experts_type, quant_config in tqdm(
-            combinations):  #noqa: E501
-        config = Config(Ms=[m],
-                        K=k,
-                        N=n,
-                        E=e,
-                        topks=topks,
-                        dtype=dtype,
-                        prepare_finalize_type=pf_type,
-                        fused_experts_type=experts_type,
-                        quant_config=quant_config,
-                        world_size=2,
-                        fused_moe_chunk_size=None)
+        combinations
+    ):  # noqa: E501
+        config = Config(
+            Ms=[m],
+            K=k,
+            N=n,
+            E=e,
+            topks=topks,
+            dtype=dtype,
+            prepare_finalize_type=pf_type,
+            fused_experts_type=experts_type,
+            quant_config=quant_config,
+            world_size=2,
+            fused_moe_chunk_size=None,
+        )
 
         success = None
         if config.is_valid():
@@ -135,9 +145,14 @@ def add_to_results(config: Config,
             try:
                 weights: WeightTensors = WeightTensors.make(config)
                 vllm_config, env_dict = config.make_env_data()
-                parallel_launch_with_config(config.world_size, rank_worker,
-                                            vllm_config, env_dict, config,
-                                            weights)
+                parallel_launch_with_config(
+                    config.world_size,
+                    rank_worker,
+                    vllm_config,
+                    env_dict,
+                    config,
+                    weights,
+                )
                 success = Result.PASS
             except Exception as _:
                 success = Result.FAIL
@@ -150,25 +165,33 @@ def add_to_results(config: Config,
         results_df.to_csv(f"{csv_file_path}")
 
 
-if __name__ == '__main__':
+if __name__ == "__main__":
     import argparse
     from pathlib import Path
-    parser = argparse.ArgumentParser(description=(
-        "Make ModularKernel feature matrix \n"
-        "Example : python3 -m tests.kernels.moe.modular_kernel_tools.make_feature_matrix "  #noqa: E501
-        "-f ./feature_matrices/feature_matrix.csv"))
-
-    parser.add_argument("-f",
-                        "--feature-matrix-csv-file-path",
-                        type=str,
-                        required=True,
-                        help="File name to Generate a .csv file")
+
+    parser = argparse.ArgumentParser(
+        description=(
+            "Make ModularKernel feature matrix \n"
+            "Example : python3 -m tests.kernels.moe.modular_kernel_tools.make_feature_matrix "  # noqa: E501
+            "-f ./feature_matrices/feature_matrix.csv"
+        )
+    )
+
+    parser.add_argument(
+        "-f",
+        "--feature-matrix-csv-file-path",
+        type=str,
+        required=True,
+        help="File name to Generate a .csv file",
+    )
     args = parser.parse_args()
 
     csv_path = args.feature_matrix_csv_file_path
-    assert csv_path.endswith(
-        'csv'), f"Need a file path ending with .csv, got {csv_path}"
-    assert Path(csv_path).parent.is_dir(
-    ), f"Cannot find parent directory for {Path(csv_path).parent}"
+    assert csv_path.endswith("csv"), (
+        f"Need a file path ending with .csv, got {csv_path}"
+    )
+    assert Path(csv_path).parent.is_dir(), (
+        f"Cannot find parent directory for {Path(csv_path).parent}"
+    )
 
     make_feature_matrix(args.feature_matrix_csv_file_path)
diff --git a/tests/kernels/moe/modular_kernel_tools/mk_objects.py b/tests/kernels/moe/modular_kernel_tools/mk_objects.py
index 57a1da7b4b1a..d4b42ed8ea9d 100644
--- a/tests/kernels/moe/modular_kernel_tools/mk_objects.py
+++ b/tests/kernels/moe/modular_kernel_tools/mk_objects.py
@@ -8,24 +8,33 @@
 # Fused experts and PrepareFinalize imports
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm.model_executor.layers.fused_moe.batched_deep_gemm_moe import (
-    BatchedDeepGemmExperts)
+    BatchedDeepGemmExperts,
+)
 from vllm.model_executor.layers.fused_moe.batched_triton_or_deep_gemm_moe import (  # noqa: E501
-    BatchedTritonOrDeepGemmExperts)
-from vllm.model_executor.layers.fused_moe.config import (FusedMoEConfig,
-                                                         FusedMoEQuantConfig)
+    BatchedTritonOrDeepGemmExperts,
+)
+from vllm.model_executor.layers.fused_moe.config import (
+    FusedMoEConfig,
+    FusedMoEQuantConfig,
+)
 from vllm.model_executor.layers.fused_moe.deep_gemm_moe import DeepGemmExperts
 from vllm.model_executor.layers.fused_moe.fused_batched_moe import (
-    BatchedTritonExperts, NaiveBatchedExperts)
-from vllm.model_executor.layers.fused_moe.layer import (FusedMoEMethodBase,
-                                                        TritonExperts)
+    BatchedTritonExperts,
+    NaiveBatchedExperts,
+)
+from vllm.model_executor.layers.fused_moe.layer import FusedMoEMethodBase, TritonExperts
 from vllm.model_executor.layers.fused_moe.prepare_finalize import (
-    MoEPrepareAndFinalizeNoEP)
+    MoEPrepareAndFinalizeNoEP,
+)
 from vllm.model_executor.layers.fused_moe.triton_deep_gemm_moe import (
-    TritonOrDeepGemmExperts)
+    TritonOrDeepGemmExperts,
+)
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    cutlass_fp4_supported)
+    cutlass_fp4_supported,
+)
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    cutlass_fp8_supported)
+    cutlass_fp8_supported,
+)
 from vllm.platforms import current_platform
 from vllm.utils import has_deep_ep, has_deep_gemm, has_pplx
 from vllm.utils.deep_gemm import is_deep_gemm_supported
@@ -60,8 +69,7 @@ class ExpertInfo:
     needs_deep_gemm: bool = False
 
 
-PREPARE_FINALIZE_INFO: dict[mk.FusedMoEPrepareAndFinalize,
-                            PrepareFinalizeInfo] = {}
+PREPARE_FINALIZE_INFO: dict[mk.FusedMoEPrepareAndFinalize, PrepareFinalizeInfo] = {}
 EXPERT_INFO: dict[mk.FusedMoEPermuteExpertsUnpermute, ExpertInfo] = {}
 MK_ALL_PREPARE_FINALIZE_TYPES: list[mk.FusedMoEPrepareAndFinalize] = []
 MK_MULTI_GPU_PREPARE_FINALIZE_TYPES: list[mk.FusedMoEPrepareAndFinalize] = []
@@ -71,7 +79,10 @@ class ExpertInfo:
 standard_format = mk.FusedMoEActivationFormat.Standard
 batched_format = mk.FusedMoEActivationFormat.BatchedExperts
 common_float_types: list[Union[torch.dtype, str]] = [
-    torch.float8_e4m3fn, torch.bfloat16, torch.float16, torch.float32
+    torch.float8_e4m3fn,
+    torch.bfloat16,
+    torch.float16,
+    torch.float32,
 ]
 common_float_and_int_types = common_float_types + [torch.int8]
 nvfp4_types = ["nvfp4"]
@@ -186,9 +197,11 @@ def expert_info(kind) -> ExpertInfo:
 # Disable on blackwell for now
 if has_deep_ep() and not current_platform.has_device_capability(100):
     from vllm.model_executor.layers.fused_moe.deepep_ht_prepare_finalize import (  # noqa: E501
-        DeepEPHTPrepareAndFinalize)
+        DeepEPHTPrepareAndFinalize,
+    )
     from vllm.model_executor.layers.fused_moe.deepep_ll_prepare_finalize import (  # noqa: E501
-        DeepEPLLPrepareAndFinalize)
+        DeepEPLLPrepareAndFinalize,
+    )
 
     register_prepare_and_finalize(
         DeepEPHTPrepareAndFinalize,
@@ -208,7 +221,9 @@ def expert_info(kind) -> ExpertInfo:
 
 if has_pplx():
     from vllm.model_executor.layers.fused_moe.pplx_prepare_finalize import (
-        PplxPrepareAndFinalize)
+        PplxPrepareAndFinalize,
+    )
+
     register_prepare_and_finalize(
         PplxPrepareAndFinalize,
         batched_format,
@@ -217,13 +232,14 @@ def expert_info(kind) -> ExpertInfo:
         backend="pplx",
     )
 
-if (has_flashinfer_cutlass_fused_moe()
-        and current_platform.has_device_capability(100)):
+if has_flashinfer_cutlass_fused_moe() and current_platform.has_device_capability(100):
     from vllm.model_executor.layers.fused_moe.flashinfer_cutlass_moe import (  # noqa: E501
-        FlashInferExperts)
+        FlashInferExperts,
+    )
     from vllm.model_executor.layers.fused_moe.flashinfer_cutlass_prepare_finalize import (  # noqa: E501
         FlashInferCutlassMoEPrepareAndFinalize,
-        create_flashinfer_prepare_finalize)
+        create_flashinfer_prepare_finalize,
+    )
 
     register_prepare_and_finalize(
         FlashInferCutlassMoEPrepareAndFinalize,
@@ -258,16 +274,18 @@ def expert_info(kind) -> ExpertInfo:
         needs_matching_quant=False,
         needs_deep_gemm=True,
     )
-    register_experts(
-        DeepGemmExperts,
-        standard_format,
-        fp8_types,
-        blocked_quantization_support=True,
-        supports_chunking=True,
-        supports_expert_map=True,
-        needs_matching_quant=False,
-        needs_deep_gemm=True,
-    ),
+    (
+        register_experts(
+            DeepGemmExperts,
+            standard_format,
+            fp8_types,
+            blocked_quantization_support=True,
+            supports_chunking=True,
+            supports_expert_map=True,
+            needs_matching_quant=False,
+            needs_deep_gemm=True,
+        ),
+    )
     register_experts(
         BatchedTritonOrDeepGemmExperts,
         batched_format,
@@ -290,8 +308,11 @@ def expert_info(kind) -> ExpertInfo:
     )
 
 if cutlass_fp8_supported():
-    from vllm.model_executor.layers.fused_moe import (CutlassBatchedExpertsFp8,
-                                                      CutlassExpertsFp8)
+    from vllm.model_executor.layers.fused_moe import (
+        CutlassBatchedExpertsFp8,
+        CutlassExpertsFp8,
+    )
+
     register_experts(
         CutlassExpertsFp8,
         standard_format,
@@ -310,8 +331,8 @@ def expert_info(kind) -> ExpertInfo:
     )
 
 if cutlass_fp4_supported():
-    from vllm.model_executor.layers.fused_moe.cutlass_moe import (
-        CutlassExpertsFp4)
+    from vllm.model_executor.layers.fused_moe.cutlass_moe import CutlassExpertsFp4
+
     register_experts(
         CutlassExpertsFp4,
         standard_format,
@@ -324,30 +345,40 @@ def expert_info(kind) -> ExpertInfo:
 MK_QUANT_CONFIGS: list[Optional[TestMoEQuantConfig]] = [
     None,
     # per-channel / per-column weights and per-tensor activations
-    TestMoEQuantConfig(quant_dtype=torch.float8_e4m3fn,
-                       per_out_ch_quant=True,
-                       per_act_token_quant=False,
-                       block_shape=None),
+    TestMoEQuantConfig(
+        quant_dtype=torch.float8_e4m3fn,
+        per_out_ch_quant=True,
+        per_act_token_quant=False,
+        block_shape=None,
+    ),
     # per-channel / per-column weights and per-token activations
-    TestMoEQuantConfig(quant_dtype=torch.float8_e4m3fn,
-                       per_out_ch_quant=True,
-                       per_act_token_quant=True,
-                       block_shape=None),
+    TestMoEQuantConfig(
+        quant_dtype=torch.float8_e4m3fn,
+        per_out_ch_quant=True,
+        per_act_token_quant=True,
+        block_shape=None,
+    ),
     # per-tensor weights and per-tensor activations
-    TestMoEQuantConfig(quant_dtype=torch.float8_e4m3fn,
-                       per_out_ch_quant=False,
-                       per_act_token_quant=False,
-                       block_shape=None),
+    TestMoEQuantConfig(
+        quant_dtype=torch.float8_e4m3fn,
+        per_out_ch_quant=False,
+        per_act_token_quant=False,
+        block_shape=None,
+    ),
     # per-tensor weights and per-token activations
-    TestMoEQuantConfig(quant_dtype=torch.float8_e4m3fn,
-                       per_out_ch_quant=False,
-                       per_act_token_quant=True,
-                       block_shape=None),
+    TestMoEQuantConfig(
+        quant_dtype=torch.float8_e4m3fn,
+        per_out_ch_quant=False,
+        per_act_token_quant=True,
+        block_shape=None,
+    ),
     # block-quantized weights and 128 block per-token activations
-    TestMoEQuantConfig(quant_dtype=torch.float8_e4m3fn,
-                       per_out_ch_quant=False,
-                       per_act_token_quant=False,
-                       block_shape=[128, 128]),
+    TestMoEQuantConfig(
+        quant_dtype=torch.float8_e4m3fn,
+        per_out_ch_quant=False,
+        per_act_token_quant=False,
+        block_shape=[128, 128],
+    ),
     # TODO (varun) : Should we test the following combinations ?
     # block-quantized weights and per-token activations
     # block-quantized weights and per-tensor activations
@@ -355,10 +386,12 @@ def expert_info(kind) -> ExpertInfo:
 
 if cutlass_fp4_supported() or has_flashinfer_cutlass_fused_moe():
     MK_QUANT_CONFIGS += [
-        TestMoEQuantConfig(quant_dtype="nvfp4",
-                           per_out_ch_quant=False,
-                           per_act_token_quant=False,
-                           block_shape=None),
+        TestMoEQuantConfig(
+            quant_dtype="nvfp4",
+            per_out_ch_quant=False,
+            per_act_token_quant=False,
+            block_shape=None,
+        ),
     ]
 
 
@@ -370,12 +403,14 @@ def make_prepare_finalize(
 ) -> mk.FusedMoEPrepareAndFinalize:
     if backend != "naive" and backend is not None:
         prepare_finalize = FusedMoEMethodBase._maybe_make_prepare_finalize(
-            moe, quant_config)
+            moe, quant_config
+        )
         assert prepare_finalize is not None
         return prepare_finalize
     elif prepare_finalize_type == FlashInferCutlassMoEPrepareAndFinalize:
         return create_flashinfer_prepare_finalize(
-            use_dp=moe.moe_parallel_config.dp_size > 1)
+            use_dp=moe.moe_parallel_config.dp_size > 1
+        )
     else:
         return MoEPrepareAndFinalizeNoEP()
 
@@ -391,10 +426,10 @@ def make_cutlass_strides(
     n: int,
     k: int,
 ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor, torch.Tensor]:
-    ab_strides1 = torch.full((e, ), k, device="cuda", dtype=torch.int64)
-    ab_strides2 = torch.full((e, ), n, device="cuda", dtype=torch.int64)
-    c_strides1 = torch.full((e, ), 2 * n, device="cuda", dtype=torch.int64)
-    c_strides2 = torch.full((e, ), k, device="cuda", dtype=torch.int64)
+    ab_strides1 = torch.full((e,), k, device="cuda", dtype=torch.int64)
+    ab_strides2 = torch.full((e,), n, device="cuda", dtype=torch.int64)
+    c_strides1 = torch.full((e,), 2 * n, device="cuda", dtype=torch.int64)
+    c_strides2 = torch.full((e,), k, device="cuda", dtype=torch.int64)
     return ab_strides1, ab_strides2, c_strides1, c_strides2
 
 
@@ -405,7 +440,6 @@ def make_fused_experts(
     num_dispatchers: int,
     N: int,
 ) -> mk.FusedMoEPermuteExpertsUnpermute:
-
     batch_kwargs = {
         "max_num_tokens": moe.max_num_tokens,
         "num_dispatchers": num_dispatchers,
diff --git a/tests/kernels/moe/modular_kernel_tools/parallel_utils.py b/tests/kernels/moe/modular_kernel_tools/parallel_utils.py
index 459b785e6504..7802129d3d48 100644
--- a/tests/kernels/moe/modular_kernel_tools/parallel_utils.py
+++ b/tests/kernels/moe/modular_kernel_tools/parallel_utils.py
@@ -6,13 +6,11 @@
 from typing import Any, Callable, Optional
 
 import torch
-from torch.multiprocessing import (
-    spawn)  # pyright: ignore[reportPrivateImportUsage]
+from torch.multiprocessing import spawn  # pyright: ignore[reportPrivateImportUsage]
 from typing_extensions import Concatenate, ParamSpec
 
 from vllm.config import VllmConfig, set_current_vllm_config
-from vllm.distributed import (init_distributed_environment,
-                              initialize_model_parallel)
+from vllm.distributed import init_distributed_environment, initialize_model_parallel
 from vllm.utils import get_open_port
 
 ## Parallel Processes Utils
@@ -30,10 +28,11 @@ class ProcessGroupInfo:
     device: torch.device
 
 
-def _set_vllm_config(vllm_config: VllmConfig, world_size: int, rank: int,
-                     local_rank: int):
-
+def _set_vllm_config(
+    vllm_config: VllmConfig, world_size: int, rank: int, local_rank: int
+):
     import tempfile
+
     temp_file = tempfile.mkstemp()[1]
 
     with set_current_vllm_config(vllm_config):
@@ -46,13 +45,10 @@ def _set_vllm_config(vllm_config: VllmConfig, world_size: int, rank: int,
         )
 
         initialize_model_parallel(
-            tensor_model_parallel_size=vllm_config.parallel_config.
-            tensor_parallel_size,
-            pipeline_model_parallel_size=vllm_config.parallel_config.
-            pipeline_parallel_size,
+            tensor_model_parallel_size=vllm_config.parallel_config.tensor_parallel_size,
+            pipeline_model_parallel_size=vllm_config.parallel_config.pipeline_parallel_size,
         )
-        cpu_group = torch.distributed.new_group(list(range(world_size)),
-                                                backend="gloo")
+        cpu_group = torch.distributed.new_group(list(range(world_size)), backend="gloo")
     return cpu_group
 
 
@@ -62,8 +58,7 @@ def _worker_parallel_launch(
     world_local_size: int,
     node_rank: int,
     init_method: str,
-    worker: Callable[Concatenate[ProcessGroupInfo, Optional[VllmConfig], Any,
-                                 P], None],
+    worker: Callable[Concatenate[ProcessGroupInfo, Optional[VllmConfig], Any, P], None],
     vllm_config: Optional[VllmConfig],
     env_dict: Optional[dict],
     *args: P.args,
@@ -131,7 +126,8 @@ def parallel_launch_with_config(
             worker,
             vllm_config,
             env_dict,
-        ) + args,
+        )
+        + args,
         nprocs=world_size,
         join=True,
     )
diff --git a/tests/kernels/moe/modular_kernel_tools/profile_modular_kernel.py b/tests/kernels/moe/modular_kernel_tools/profile_modular_kernel.py
index 0da6ee354352..48e5c4659b49 100644
--- a/tests/kernels/moe/modular_kernel_tools/profile_modular_kernel.py
+++ b/tests/kernels/moe/modular_kernel_tools/profile_modular_kernel.py
@@ -14,28 +14,31 @@
 from .parallel_utils import ProcessGroupInfo, parallel_launch_with_config
 
 
-def do_profile(fn: Callable,
-               fn_kwargs: dict[Any, Any],
-               pgi: ProcessGroupInfo,
-               config: Config,
-               num_warmups: int = 5):
+def do_profile(
+    fn: Callable,
+    fn_kwargs: dict[Any, Any],
+    pgi: ProcessGroupInfo,
+    config: Config,
+    num_warmups: int = 5,
+):
     for _ in range(num_warmups):
         fn(**fn_kwargs)
 
     with torch.profiler.profile(
-            activities=[
-                torch.profiler.ProfilerActivity.CPU,
-                torch.profiler.ProfilerActivity.CUDA,
-            ],
-            with_stack=True,
-            record_shapes=True,
+        activities=[
+            torch.profiler.ProfilerActivity.CPU,
+            torch.profiler.ProfilerActivity.CUDA,
+        ],
+        with_stack=True,
+        record_shapes=True,
     ) as tprof:
         fn(**fn_kwargs)
         torch.cuda.synchronize(torch.cuda.current_device())
 
     # TODO (varun): Add a descriptive trace file name
     tprof.export_chrome_trace(
-        f"{config.torch_trace_dir_path}/m{config.M}_{pgi.rank}_trace.json")
+        f"{config.torch_trace_dir_path}/m{config.M}_{pgi.rank}_trace.json"
+    )
 
 
 def profile_modular_kernel(
@@ -82,6 +85,7 @@ def rank_worker(
 
     # sanity check
     from vllm import envs
+
     if config.fused_moe_chunk_size is not None:
         assert config.fused_moe_chunk_size == envs.VLLM_FUSED_MOE_CHUNK_SIZE
 
@@ -108,20 +112,25 @@ def rank_worker(
 def run(config: Config):
     weights: WeightTensors = WeightTensors.make(config)
     vllm_config, env_dict = config.make_env_data()
-    parallel_launch_with_config(config.world_size, rank_worker, vllm_config,
-                                env_dict, config, weights)
+    parallel_launch_with_config(
+        config.world_size, rank_worker, vllm_config, env_dict, config, weights
+    )
 
 
-if __name__ == '__main__':
+if __name__ == "__main__":
     from .cli_args import make_config, make_config_arg_parser
-    parser = make_config_arg_parser(description=(
-        "Run single prepare-finalize & fused-experts combination test"
-        "Example : python3 -m tests.kernels.moe.modular_kernel_tools.profile_modular_kernel "  #noqa: E501
-        "--pf-type PplxPrepareAndFinalize --experts-type BatchedTritonExperts"
-    ))
+
+    parser = make_config_arg_parser(
+        description=(
+            "Run single prepare-finalize & fused-experts combination test"
+            "Example : python3 -m tests.kernels.moe.modular_kernel_tools.profile_modular_kernel "  # noqa: E501
+            "--pf-type PplxPrepareAndFinalize --experts-type BatchedTritonExperts"
+        )
+    )
     args = parser.parse_args()
     assert args.torch_trace_dir_path is not None, (
-        "Please pass in a directory to store torch traces")
+        "Please pass in a directory to store torch traces"
+    )
     config = make_config(args)
 
     run(config)
diff --git a/tests/kernels/moe/parallel_utils.py b/tests/kernels/moe/parallel_utils.py
index 1ad361ae0733..9d087ad13b82 100644
--- a/tests/kernels/moe/parallel_utils.py
+++ b/tests/kernels/moe/parallel_utils.py
@@ -3,6 +3,7 @@
 """
 DeepEP test utilities
 """
+
 import dataclasses
 import os
 import traceback
@@ -10,17 +11,18 @@
 
 import torch
 from torch.distributed import ProcessGroup
-from torch.multiprocessing import (
-    spawn)  # pyright: ignore[reportPrivateImportUsage]
+from torch.multiprocessing import spawn  # pyright: ignore[reportPrivateImportUsage]
 from typing_extensions import Concatenate, ParamSpec
 
 from vllm.utils import get_open_port, has_deep_ep
 
 if has_deep_ep():
     from vllm.model_executor.layers.fused_moe.deepep_ht_prepare_finalize import (  # noqa: E501
-        DeepEPHTPrepareAndFinalize)
+        DeepEPHTPrepareAndFinalize,
+    )
     from vllm.model_executor.layers.fused_moe.deepep_ll_prepare_finalize import (  # noqa: E501
-        DeepEPLLPrepareAndFinalize)
+        DeepEPLLPrepareAndFinalize,
+    )
 
 ## Parallel Processes Utils
 
@@ -96,7 +98,8 @@ def parallel_launch(
             0,
             f"tcp://{os.getenv('LOCALHOST', 'localhost')}:{get_open_port()}",
             worker,
-        ) + args,
+        )
+        + args,
         nprocs=world_size,
         join=True,
     )
@@ -118,48 +121,57 @@ class DeepEPLLArgs:
     use_fp8_dispatch: bool
 
 
-def make_deepep_ht_a2a(pg: ProcessGroup,
-                       pgi: ProcessGroupInfo,
-                       dp_size: int,
-                       ht_args: DeepEPHTArgs,
-                       q_dtype: Optional[torch.dtype] = None,
-                       block_shape: Optional[list[int]] = None):
-
+def make_deepep_ht_a2a(
+    pg: ProcessGroup,
+    pgi: ProcessGroupInfo,
+    dp_size: int,
+    ht_args: DeepEPHTArgs,
+    q_dtype: Optional[torch.dtype] = None,
+    block_shape: Optional[list[int]] = None,
+):
     import deep_ep
 
     # high throughput a2a
     num_nvl_bytes = 1024 * 1024 * 1024  # 1GB
     num_rdma_bytes, low_latency_mode, num_qps_per_rank = 0, False, 1
-    buffer = deep_ep.Buffer(group=pg,
-                            num_nvl_bytes=num_nvl_bytes,
-                            num_rdma_bytes=num_rdma_bytes,
-                            low_latency_mode=low_latency_mode,
-                            num_qps_per_rank=num_qps_per_rank)
-    return DeepEPHTPrepareAndFinalize(buffer=buffer,
-                                      num_dispatchers=pgi.world_size,
-                                      dp_size=dp_size,
-                                      rank_expert_offset=pgi.rank *
-                                      ht_args.num_local_experts)
-
-
-def make_deepep_ll_a2a(pg: ProcessGroup,
-                       pgi: ProcessGroupInfo,
-                       deepep_ll_args: DeepEPLLArgs,
-                       q_dtype: Optional[torch.dtype] = None,
-                       block_shape: Optional[list[int]] = None):
+    buffer = deep_ep.Buffer(
+        group=pg,
+        num_nvl_bytes=num_nvl_bytes,
+        num_rdma_bytes=num_rdma_bytes,
+        low_latency_mode=low_latency_mode,
+        num_qps_per_rank=num_qps_per_rank,
+    )
+    return DeepEPHTPrepareAndFinalize(
+        buffer=buffer,
+        num_dispatchers=pgi.world_size,
+        dp_size=dp_size,
+        rank_expert_offset=pgi.rank * ht_args.num_local_experts,
+    )
+
 
+def make_deepep_ll_a2a(
+    pg: ProcessGroup,
+    pgi: ProcessGroupInfo,
+    deepep_ll_args: DeepEPLLArgs,
+    q_dtype: Optional[torch.dtype] = None,
+    block_shape: Optional[list[int]] = None,
+):
     import deep_ep
 
     # low-latency a2a
     num_rdma_bytes = deep_ep.Buffer.get_low_latency_rdma_size_hint(
-        deepep_ll_args.max_tokens_per_rank, deepep_ll_args.hidden_size,
-        pgi.world_size, deepep_ll_args.num_experts)
+        deepep_ll_args.max_tokens_per_rank,
+        deepep_ll_args.hidden_size,
+        pgi.world_size,
+        deepep_ll_args.num_experts,
+    )
 
-    buffer = deep_ep.Buffer(group=pg,
-                            num_rdma_bytes=num_rdma_bytes,
-                            low_latency_mode=True,
-                            num_qps_per_rank=deepep_ll_args.num_experts //
-                            pgi.world_size)
+    buffer = deep_ep.Buffer(
+        group=pg,
+        num_rdma_bytes=num_rdma_bytes,
+        low_latency_mode=True,
+        num_qps_per_rank=deepep_ll_args.num_experts // pgi.world_size,
+    )
 
     return DeepEPLLPrepareAndFinalize(
         buffer=buffer,
@@ -169,17 +181,20 @@ def make_deepep_ll_a2a(pg: ProcessGroup,
     )
 
 
-def make_deepep_a2a(pg: ProcessGroup,
-                    pgi: ProcessGroupInfo,
-                    dp_size: int,
-                    deepep_ht_args: Optional[DeepEPHTArgs],
-                    deepep_ll_args: Optional[DeepEPLLArgs],
-                    q_dtype: Optional[torch.dtype] = None,
-                    block_shape: Optional[list[int]] = None):
+def make_deepep_a2a(
+    pg: ProcessGroup,
+    pgi: ProcessGroupInfo,
+    dp_size: int,
+    deepep_ht_args: Optional[DeepEPHTArgs],
+    deepep_ll_args: Optional[DeepEPLLArgs],
+    q_dtype: Optional[torch.dtype] = None,
+    block_shape: Optional[list[int]] = None,
+):
     if deepep_ht_args is not None:
         assert deepep_ll_args is None
-        return make_deepep_ht_a2a(pg, pgi, dp_size, deepep_ht_args, q_dtype,
-                                  block_shape)
+        return make_deepep_ht_a2a(
+            pg, pgi, dp_size, deepep_ht_args, q_dtype, block_shape
+        )
 
     assert deepep_ll_args is not None
     return make_deepep_ll_a2a(pg, pgi, deepep_ll_args, q_dtype, block_shape)
diff --git a/tests/kernels/moe/test_batched_deepgemm.py b/tests/kernels/moe/test_batched_deepgemm.py
index afec97e8cffd..59cecd60d3d6 100644
--- a/tests/kernels/moe/test_batched_deepgemm.py
+++ b/tests/kernels/moe/test_batched_deepgemm.py
@@ -5,13 +5,14 @@
 import torch
 
 from vllm.model_executor.layers.fused_moe.batched_deep_gemm_moe import (
-    BatchedDeepGemmExperts)
-from vllm.model_executor.layers.fused_moe.config import (
-    fp8_w8a8_moe_quant_config)
+    BatchedDeepGemmExperts,
+)
+from vllm.model_executor.layers.fused_moe.config import fp8_w8a8_moe_quant_config
 from vllm.model_executor.layers.fused_moe.fused_batched_moe import (
-    BatchedPrepareAndFinalize, BatchedTritonExperts)
-from vllm.model_executor.layers.fused_moe.modular_kernel import (
-    FusedMoEModularKernel)
+    BatchedPrepareAndFinalize,
+    BatchedTritonExperts,
+)
+from vllm.model_executor.layers.fused_moe.modular_kernel import FusedMoEModularKernel
 from vllm.utils.deep_gemm import calc_diff, is_deep_gemm_supported
 
 from .test_deepgemm import make_block_quant_fp8_weights
@@ -19,15 +20,15 @@
 BLOCK_SIZE = [128, 128]
 
 
-@pytest.mark.skipif(not is_deep_gemm_supported(),
-                    reason="Requires deep_gemm kernels")
+@pytest.mark.skipif(not is_deep_gemm_supported(), reason="Requires deep_gemm kernels")
 @pytest.mark.parametrize("E", [16, 32])  # number of experts
 @pytest.mark.parametrize("T", [256, 512])  # tokens per expert
 @pytest.mark.parametrize("K", [128, 256])  # hidden dim
 @pytest.mark.parametrize("N", [512, 1024])  # intermediate dim per expert
 @pytest.mark.parametrize("topk", [2, 4])
-def test_batched_deepgemm_vs_triton(E: int, T: int, K: int, N: int, topk: int,
-                                    monkeypatch):
+def test_batched_deepgemm_vs_triton(
+    E: int, T: int, K: int, N: int, topk: int, monkeypatch
+):
     """Compare BatchedDeepGemmExperts to BatchedTritonExperts."""
 
     monkeypatch.setenv("VLLM_USE_DEEP_GEMM", "1")
diff --git a/tests/kernels/moe/test_batched_moe.py b/tests/kernels/moe/test_batched_moe.py
index 7e79828937c7..09cede3fbcc7 100644
--- a/tests/kernels/moe/test_batched_moe.py
+++ b/tests/kernels/moe/test_batched_moe.py
@@ -7,14 +7,18 @@
 import pytest
 import torch
 
-from tests.kernels.moe.utils import (batched_moe,
-                                     make_quantized_test_activations,
-                                     make_test_weights, naive_batched_moe)
+from tests.kernels.moe.utils import (
+    batched_moe,
+    make_quantized_test_activations,
+    make_test_weights,
+    naive_batched_moe,
+)
 from tests.kernels.quant_utils import native_batched_masked_quant_matmul
 from tests.kernels.utils import torch_experts
 from vllm.config import VllmConfig, set_current_vllm_config
 from vllm.model_executor.layers.fused_moe.fused_batched_moe import (
-    invoke_moe_batched_triton_kernel)
+    invoke_moe_batched_triton_kernel,
+)
 from vllm.model_executor.layers.fused_moe.fused_moe import fused_topk
 from vllm.platforms import current_platform
 from vllm.triton_utils import tl
@@ -68,23 +72,32 @@ class BatchedMMTensors:
 
     @staticmethod
     def make_tensors(config: BatchedMMConfig):
-        A = torch.randn(
-            (config.num_experts, config.max_tokens_per_expert, config.K),
+        A = (
+            torch.randn(
+                (config.num_experts, config.max_tokens_per_expert, config.K),
+                device="cuda",
+                dtype=config.in_dtype,
+            )
+            / 10
+        )
+        B = torch.randn(
+            (config.num_experts, config.N, config.K),
             device="cuda",
-            dtype=config.in_dtype) / 10
-        B = torch.randn((config.num_experts, config.N, config.K),
-                        device="cuda",
-                        dtype=config.in_dtype)
+            dtype=config.in_dtype,
+        )
         C = torch.zeros(
             (config.num_experts, config.max_tokens_per_expert, config.N),
             device="cuda",
-            dtype=config.out_dtype)
+            dtype=config.out_dtype,
+        )
 
-        num_expert_tokens = torch.randint(low=0,
-                                          high=config.max_tokens_per_expert,
-                                          size=(config.num_experts, ),
-                                          device="cuda",
-                                          dtype=torch.int32)
+        num_expert_tokens = torch.randint(
+            low=0,
+            high=config.max_tokens_per_expert,
+            size=(config.num_experts,),
+            device="cuda",
+            dtype=torch.int32,
+        )
 
         return BatchedMMTensors(A, B, C, num_expert_tokens)
 
@@ -96,10 +109,15 @@ def make_tensors(config: BatchedMMConfig):
 @pytest.mark.parametrize("dtype", [torch.float8_e4m3fn, torch.bfloat16])
 @pytest.mark.parametrize("block_shape", [None, [128, 128]])
 @pytest.mark.parametrize("per_act_token_quant", [False, True])
-def test_batched_mm(num_experts: int, max_tokens_per_expert: int, K: int,
-                    N: int, dtype: torch.dtype,
-                    block_shape: Optional[list[int]],
-                    per_act_token_quant: bool):
+def test_batched_mm(
+    num_experts: int,
+    max_tokens_per_expert: int,
+    K: int,
+    N: int,
+    dtype: torch.dtype,
+    block_shape: Optional[list[int]],
+    per_act_token_quant: bool,
+):
     current_platform.seed_everything(7)
 
     use_fp8_w8a8 = dtype == torch.float8_e4m3fn
@@ -117,11 +135,13 @@ def test_batched_mm(num_experts: int, max_tokens_per_expert: int, K: int,
         act_dtype = dtype
         quant_dtype = None
 
-    num_expert_tokens = torch.randint(low=0,
-                                      high=max_tokens_per_expert,
-                                      size=(num_experts, ),
-                                      device="cuda",
-                                      dtype=torch.int32)
+    num_expert_tokens = torch.randint(
+        low=0,
+        high=max_tokens_per_expert,
+        size=(num_experts,),
+        device="cuda",
+        dtype=torch.int32,
+    )
 
     A, A_q, A_scale = make_quantized_test_activations(
         num_experts,
@@ -151,7 +171,7 @@ def test_batched_mm(num_experts: int, max_tokens_per_expert: int, K: int,
     compute_tl_dtype = {
         torch.float16: tl.float16,
         torch.bfloat16: tl.bfloat16,
-        torch.float32: tl.float32
+        torch.float32: tl.float32,
     }[test_output.dtype]
 
     assert A_q.dtype == B_q.dtype
@@ -173,7 +193,7 @@ def test_batched_mm(num_experts: int, max_tokens_per_expert: int, K: int,
         config={
             "BLOCK_SIZE_M": 16,
             "BLOCK_SIZE_N": 16,
-            "BLOCK_SIZE_K": 16 if dtype.itemsize > 1 else 32
+            "BLOCK_SIZE_K": 16 if dtype.itemsize > 1 else 32,
         },
         per_act_token_quant=per_act_token_quant,
         block_shape=block_shape,
@@ -186,11 +206,16 @@ def test_batched_mm(num_experts: int, max_tokens_per_expert: int, K: int,
         num_expert_tokens,
     )
 
-    q_ref_output = native_batched_masked_quant_matmul(A_q, B_q, q_ref_output,
-                                                      num_expert_tokens,
-                                                      A_scale, B_scale,
-                                                      block_shape,
-                                                      per_act_token_quant)
+    q_ref_output = native_batched_masked_quant_matmul(
+        A_q,
+        B_q,
+        q_ref_output,
+        num_expert_tokens,
+        A_scale,
+        B_scale,
+        block_shape,
+        per_act_token_quant,
+    )
 
     rtol, atol = {
         torch.float16: (6e-2, 6e-2),
@@ -308,12 +333,6 @@ def test_fused_moe_batched_experts(
             block_shape=block_shape,
         )
 
-    torch.testing.assert_close(batched_output,
-                               baseline_output,
-                               atol=3e-2,
-                               rtol=2e-2)
+    torch.testing.assert_close(batched_output, baseline_output, atol=3e-2, rtol=2e-2)
 
-    torch.testing.assert_close(triton_output,
-                               batched_output,
-                               atol=2e-2,
-                               rtol=2e-2)
+    torch.testing.assert_close(triton_output, batched_output, atol=2e-2, rtol=2e-2)
diff --git a/tests/kernels/moe/test_block_fp8.py b/tests/kernels/moe/test_block_fp8.py
index da383e18c372..b8cd3cb9200c 100644
--- a/tests/kernels/moe/test_block_fp8.py
+++ b/tests/kernels/moe/test_block_fp8.py
@@ -5,15 +5,21 @@
 import torch
 
 from tests.kernels.moe.utils import make_test_quant_config, make_test_weights
-from tests.kernels.quant_utils import (native_per_token_group_quant_fp8,
-                                       native_w8a8_block_matmul)
+from tests.kernels.quant_utils import (
+    native_per_token_group_quant_fp8,
+    native_w8a8_block_matmul,
+)
 from vllm.config import VllmConfig, set_current_vllm_config
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import fused_experts
 from vllm.model_executor.layers.fused_moe.deep_gemm_moe import (
-    _valid_deep_gemm_shape, deep_gemm_moe_fp8)
+    _valid_deep_gemm_shape,
+    deep_gemm_moe_fp8,
+)
 from vllm.model_executor.layers.fused_moe.fused_moe import (
-    fused_topk, modular_triton_fused_moe)
+    fused_topk,
+    modular_triton_fused_moe,
+)
 from vllm.platforms import current_platform
 from vllm.utils import has_deep_gemm
 from vllm.utils.deep_gemm import is_deep_gemm_e8m0_used
@@ -24,8 +30,7 @@
     from deep_gemm import get_m_alignment_for_contiguous_layout
 
 if current_platform.get_device_capability() < (9, 0):
-    pytest.skip("FP8 Triton requires CUDA 9.0 or higher",
-                allow_module_level=True)
+    pytest.skip("FP8 Triton requires CUDA 9.0 or higher", allow_module_level=True)
 
 vllm_config = VllmConfig()
 vllm_config.scheduler_config.max_num_seqs = 128
@@ -97,8 +102,7 @@
 SEEDS = [0]
 
 
-def torch_w8a8_block_fp8_moe(a, w1, w2, w1_s, w2_s, topk_weight, topk_ids,
-                             block_shape):
+def torch_w8a8_block_fp8_moe(a, w1, w2, w1_s, w2_s, topk_weight, topk_ids, block_shape):
     """Fused moe with block-wise quantization using native torch."""
     B, D = a.shape
     topk = topk_ids.size(1)
@@ -114,23 +118,17 @@ def torch_w8a8_block_fp8_moe(a, w1, w2, w1_s, w2_s, topk_weight, topk_ids,
     for i in range(w1.shape[0]):
         mask = topk_ids == i
         if mask.sum():
-            inter_out = native_w8a8_block_matmul(a_q[mask],
-                                                 w1[i],
-                                                 a_s[mask],
-                                                 w1_s[i],
-                                                 block_shape,
-                                                 output_dtype=a.dtype)
+            inter_out = native_w8a8_block_matmul(
+                a_q[mask], w1[i], a_s[mask], w1_s[i], block_shape, output_dtype=a.dtype
+            )
             act_out = SiluAndMul().forward_native(inter_out)
-            act_out_q, act_out_s = native_per_token_group_quant_fp8(
-                act_out, block_k)
-            out[mask] = native_w8a8_block_matmul(act_out_q,
-                                                 w2[i],
-                                                 act_out_s,
-                                                 w2_s[i],
-                                                 block_shape,
-                                                 output_dtype=a.dtype)
-    return (out.view(B, -1, w2.shape[1]) *
-            topk_weight.view(B, -1, 1).to(out.dtype)).sum(dim=1)
+            act_out_q, act_out_s = native_per_token_group_quant_fp8(act_out, block_k)
+            out[mask] = native_w8a8_block_matmul(
+                act_out_q, w2[i], act_out_s, w2_s[i], block_shape, output_dtype=a.dtype
+            )
+    return (
+        out.view(B, -1, w2.shape[1]) * topk_weight.view(B, -1, 1).to(out.dtype)
+    ).sum(dim=1)
 
 
 # Skip all tests if CUDA is not available
@@ -149,8 +147,9 @@ def setup_cuda():
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("seed", SEEDS)
 @torch.inference_mode()
-def test_w8a8_block_fp8_fused_moe(M, N, K, E, topk, block_size, dtype, seed,
-                                  monkeypatch):
+def test_w8a8_block_fp8_fused_moe(
+    M, N, K, E, topk, block_size, dtype, seed, monkeypatch
+):
     if topk > E:
         pytest.skip(f"Skipping test; topk={topk} > E={E}")
 
@@ -188,12 +187,9 @@ def test_w8a8_block_fp8_fused_moe(M, N, K, E, topk, block_size, dtype, seed,
             block_size,
         )
 
-        out = fused_experts(a,
-                            w1,
-                            w2,
-                            topk_weights,
-                            topk_ids,
-                            quant_config=quant_config)
+        out = fused_experts(
+            a, w1, w2, topk_weights, topk_ids, quant_config=quant_config
+        )
 
         m_out = m_fused_moe(a, w1, w2, topk_weights, topk_ids)
 
@@ -210,8 +206,7 @@ def test_w8a8_block_fp8_fused_moe(M, N, K, E, topk, block_size, dtype, seed,
 @pytest.mark.skipif(not dg_available, reason="DeepGemm kernels not available.")
 @pytest.mark.skipif(is_deep_gemm_e8m0_used(), reason="Not E8M0 scale MOE")
 @torch.inference_mode()
-def test_w8a8_block_fp8_deep_gemm_fused_moe(M, N, K, E, topk, seed,
-                                            monkeypatch):
+def test_w8a8_block_fp8_deep_gemm_fused_moe(M, N, K, E, topk, seed, monkeypatch):
     if topk > E:
         pytest.skip(f"Skipping test: topk={topk} > E={E}")
 
@@ -245,36 +240,38 @@ def test_w8a8_block_fp8_deep_gemm_fused_moe(M, N, K, E, topk, seed,
     # setup code in case we are able to revisit this later.
     use_compile = False
 
-    use_cudagraph = (chunk_size < M and N >= 1024 and K >= 1024
-                     and current_platform.is_cuda_alike())
+    use_cudagraph = (
+        chunk_size < M and N >= 1024 and K >= 1024 and current_platform.is_cuda_alike()
+    )
 
     topk_weights, topk_ids, _ = fused_topk(a, score.float(), topk, False)
 
     # Set the context to avoid lots of warning spam.
     with set_current_vllm_config(vllm_config):
-        ref_out = torch_w8a8_block_fp8_moe(a, w1, w2, w1_s, w2_s, topk_weights,
-                                           topk_ids, block_size)
+        ref_out = torch_w8a8_block_fp8_moe(
+            a, w1, w2, w1_s, w2_s, topk_weights, topk_ids, block_size
+        )
 
         if use_compile:
-            deep_gemm_moe_fp8_fn = torch.compile(deep_gemm_moe_fp8,
-                                                 backend="inductor",
-                                                 fullgraph=True)
+            deep_gemm_moe_fp8_fn = torch.compile(
+                deep_gemm_moe_fp8, backend="inductor", fullgraph=True
+            )
             torch._dynamo.mark_dynamic(a, 0)
             torch._dynamo.mark_dynamic(topk_weights, 0)
             torch._dynamo.mark_dynamic(topk_ids, 0)
         else:
             deep_gemm_moe_fp8_fn = deep_gemm_moe_fp8
 
-        out = deep_gemm_moe_fp8_fn(a, w1, w2, w1_s, w2_s, topk_weights,
-                                   topk_ids)
+        out = deep_gemm_moe_fp8_fn(a, w1, w2, w1_s, w2_s, topk_weights, topk_ids)
 
         if use_cudagraph:
             out.fill_(0)
             stream = torch.cuda.Stream()
             graph = torch.cuda.CUDAGraph()
             with torch.cuda.graph(graph, stream=stream):
-                out = deep_gemm_moe_fp8_fn(a, w1, w2, w1_s, w2_s, topk_weights,
-                                           topk_ids)
+                out = deep_gemm_moe_fp8_fn(
+                    a, w1, w2, w1_s, w2_s, topk_weights, topk_ids
+                )
             torch.cuda.synchronize()
             graph.replay()
             torch.cuda.synchronize()
diff --git a/tests/kernels/moe/test_block_int8.py b/tests/kernels/moe/test_block_int8.py
index 041a13ca5585..74cc943714dd 100644
--- a/tests/kernels/moe/test_block_int8.py
+++ b/tests/kernels/moe/test_block_int8.py
@@ -5,16 +5,17 @@
 import torch
 
 from tests.kernels.moe.utils import make_test_quant_config
-from tests.kernels.quant_utils import (native_per_token_group_quant_int8,
-                                       native_w8a8_block_matmul)
+from tests.kernels.quant_utils import (
+    native_per_token_group_quant_int8,
+    native_w8a8_block_matmul,
+)
 from vllm.config import VllmConfig, set_current_vllm_config
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import fused_experts, fused_topk
 from vllm.platforms import current_platform
 
 if current_platform.get_device_capability() < (7, 0):
-    pytest.skip("INT8 Triton requires CUDA 7.0 or higher",
-                allow_module_level=True)
+    pytest.skip("INT8 Triton requires CUDA 7.0 or higher", allow_module_level=True)
 
 vllm_config = VllmConfig()
 vllm_config.scheduler_config.max_num_seqs = 128
@@ -77,24 +78,18 @@ def torch_w8a8_block_int8_moe(a, w1, w2, w1_s, w2_s, score, topk, block_shape):
     for i in range(w1.shape[0]):
         mask = topk_ids == i
         if mask.sum():
-            inter_out = native_w8a8_block_matmul(a_q[mask],
-                                                 w1[i],
-                                                 a_s[mask],
-                                                 w1_s[i],
-                                                 block_shape,
-                                                 output_dtype=a.dtype)
+            inter_out = native_w8a8_block_matmul(
+                a_q[mask], w1[i], a_s[mask], w1_s[i], block_shape, output_dtype=a.dtype
+            )
             act_out = SiluAndMul().forward_native(inter_out)
-            act_out_q, act_out_s = native_per_token_group_quant_int8(
-                act_out, block_k)
+            act_out_q, act_out_s = native_per_token_group_quant_int8(act_out, block_k)
             act_out = act_out.to(torch.float32)
-            out[mask] = native_w8a8_block_matmul(act_out_q,
-                                                 w2[i],
-                                                 act_out_s,
-                                                 w2_s[i],
-                                                 block_shape,
-                                                 output_dtype=a.dtype)
-    return (out.view(B, -1, w2.shape[1]) *
-            topk_weight.view(B, -1, 1).to(out.dtype)).sum(dim=1)
+            out[mask] = native_w8a8_block_matmul(
+                act_out_q, w2[i], act_out_s, w2_s[i], block_shape, output_dtype=a.dtype
+            )
+    return (
+        out.view(B, -1, w2.shape[1]) * topk_weight.view(B, -1, 1).to(out.dtype)
+    ).sum(dim=1)
 
 
 @pytest.fixture(autouse=True, scope="module")
@@ -131,15 +126,19 @@ def test_w8a8_block_int8_fused_moe(M, N, K, E, topk, block_size, dtype, seed):
 
     # Set the context to avoid lots of warning spam.
     with set_current_vllm_config(vllm_config):
-        out = fused_experts(a,
-                            w1,
-                            w2,
-                            topk_weights,
-                            topk_ids,
-                            quant_config=quant_config)
-        ref_out = torch_w8a8_block_int8_moe(a, w1, w2, quant_config.w1_scale,
-                                            quant_config.w2_scale, score, topk,
-                                            block_size)
+        out = fused_experts(
+            a, w1, w2, topk_weights, topk_ids, quant_config=quant_config
+        )
+        ref_out = torch_w8a8_block_int8_moe(
+            a,
+            w1,
+            w2,
+            quant_config.w1_scale,
+            quant_config.w2_scale,
+            score,
+            topk,
+            block_size,
+        )
 
     # Check results
     torch.testing.assert_close(out, ref_out, atol=0.065, rtol=0.065)
diff --git a/tests/kernels/moe/test_count_expert_num_tokens.py b/tests/kernels/moe/test_count_expert_num_tokens.py
index 1768baaf1ca7..996a4538d105 100644
--- a/tests/kernels/moe/test_count_expert_num_tokens.py
+++ b/tests/kernels/moe/test_count_expert_num_tokens.py
@@ -15,7 +15,6 @@
 
 @dataclasses.dataclass
 class TestTensors:
-
     topk_ids: torch.Tensor
     expert_map: Optional[torch.Tensor] = None
 
@@ -25,32 +24,31 @@ def to_device(self, device: str):
             self.expert_map = self.expert_map.to(device=device)
 
     @staticmethod
-    def make(num_tokens: int, num_topk: int, num_experts: int, device: str,
-             topk_ids_dtype: torch.dtype) -> "TestTensors":
-
+    def make(
+        num_tokens: int,
+        num_topk: int,
+        num_experts: int,
+        device: str,
+        topk_ids_dtype: torch.dtype,
+    ) -> "TestTensors":
         # make topk ids
-        topk_ids = torch.empty((num_tokens, num_topk),
-                               device=device,
-                               dtype=torch.int64)
+        topk_ids = torch.empty((num_tokens, num_topk), device=device, dtype=torch.int64)
         for x in range(num_tokens):
             topk_ids[x] = torch.randperm(num_experts)[:num_topk]
         topk_ids = topk_ids.to(dtype=torch.int64)
         return TestTensors(topk_ids=topk_ids)
 
-    def with_ep_rank(self, ep_rank: int, num_global_experts: int,
-                     num_local_experts: int, device: str):
+    def with_ep_rank(
+        self, ep_rank: int, num_global_experts: int, num_local_experts: int, device: str
+    ):
         # make an expert map
-        expert_map = torch.empty((num_global_experts),
-                                 device=device,
-                                 dtype=torch.int32)
+        expert_map = torch.empty((num_global_experts), device=device, dtype=torch.int32)
         expert_map.fill_(-1)
         s = ep_rank * num_local_experts
         e = s + num_local_experts
-        expert_map[s:e] = torch.tensor(list(range(num_local_experts)),
-                                       device=device)
+        expert_map[s:e] = torch.tensor(list(range(num_local_experts)), device=device)
 
-        return TestTensors(topk_ids=self.topk_ids.clone(),
-                           expert_map=expert_map)
+        return TestTensors(topk_ids=self.topk_ids.clone(), expert_map=expert_map)
 
 
 def ref_impl(tt: TestTensors, expert_num_tokens: torch.Tensor):
@@ -68,49 +66,49 @@ def ref_impl(tt: TestTensors, expert_num_tokens: torch.Tensor):
         expert_num_tokens[eid] += count
 
 
-def do_test_compute_expert_num_tokens(num_tokens: int, num_topk: int,
-                                      num_experts: int, ep_size: int,
-                                      topk_ids_dtype: torch.dtype):
-
+def do_test_compute_expert_num_tokens(
+    num_tokens: int,
+    num_topk: int,
+    num_experts: int,
+    ep_size: int,
+    topk_ids_dtype: torch.dtype,
+):
     assert num_topk <= num_experts
 
-    tt = TestTensors.make(num_tokens,
-                          num_topk,
-                          num_experts,
-                          topk_ids_dtype=topk_ids_dtype,
-                          device="cpu")
+    tt = TestTensors.make(
+        num_tokens, num_topk, num_experts, topk_ids_dtype=topk_ids_dtype, device="cpu"
+    )
 
     num_global_experts = num_experts
     assert num_global_experts % ep_size == 0
     num_local_experts = num_global_experts // ep_size
     for ep_rank in range(ep_size):
-        tt_rank = tt.with_ep_rank(ep_rank, num_global_experts,
-                                  num_local_experts, "cpu")
+        tt_rank = tt.with_ep_rank(ep_rank, num_global_experts, num_local_experts, "cpu")
 
-        ref_expert_num_tokens = torch.zeros((num_local_experts),
-                                            device="cpu",
-                                            dtype=torch.int32)
+        ref_expert_num_tokens = torch.zeros(
+            (num_local_experts), device="cpu", dtype=torch.int32
+        )
         ref_impl(tt_rank, ref_expert_num_tokens)
         ref_expert_num_tokens = ref_expert_num_tokens.to("cuda")
 
         tt_rank.to_device("cuda")
         # Test with expert_map
         triton_expert_num_tokens_w_emap = count_expert_num_tokens(
-            tt_rank.topk_ids, num_local_experts, tt_rank.expert_map)
+            tt_rank.topk_ids, num_local_experts, tt_rank.expert_map
+        )
 
         # Test without expert map
         topk_ids = tt_rank.expert_map[tt_rank.topk_ids].to(topk_ids_dtype)
         triton_expert_num_tokens_wo_emap = count_expert_num_tokens(
-            topk_ids, num_local_experts, expert_map=None)
+            topk_ids, num_local_experts, expert_map=None
+        )
 
-        torch.testing.assert_close(ref_expert_num_tokens,
-                                   triton_expert_num_tokens_w_emap,
-                                   atol=0,
-                                   rtol=0)
-        torch.testing.assert_close(ref_expert_num_tokens,
-                                   triton_expert_num_tokens_wo_emap,
-                                   atol=0,
-                                   rtol=0)
+        torch.testing.assert_close(
+            ref_expert_num_tokens, triton_expert_num_tokens_w_emap, atol=0, rtol=0
+        )
+        torch.testing.assert_close(
+            ref_expert_num_tokens, triton_expert_num_tokens_wo_emap, atol=0, rtol=0
+        )
 
 
 @pytest.mark.parametrize("num_tokens", [1, 4, 8, 11, 127, 128, 3333, 7317])
@@ -118,22 +116,29 @@ def do_test_compute_expert_num_tokens(num_tokens: int, num_topk: int,
 @pytest.mark.parametrize("num_experts", [64])
 @pytest.mark.parametrize("ep_size", [1, 2, 4])
 @pytest.mark.parametrize("topk_ids_dtype", [torch.int64])
-def test_compute_expert_num_tokens(num_tokens: int, num_topk: int,
-                                   num_experts: int, ep_size: int,
-                                   topk_ids_dtype: torch.dtype):
-    do_test_compute_expert_num_tokens(num_tokens, num_topk, num_experts,
-                                      ep_size, topk_ids_dtype)
+def test_compute_expert_num_tokens(
+    num_tokens: int,
+    num_topk: int,
+    num_experts: int,
+    ep_size: int,
+    topk_ids_dtype: torch.dtype,
+):
+    do_test_compute_expert_num_tokens(
+        num_tokens, num_topk, num_experts, ep_size, topk_ids_dtype
+    )
 
 
 @pytest.mark.parametrize("numel", list(range(1, 8192, 111)))
 @pytest.mark.parametrize("num_experts", [32])
 @pytest.mark.parametrize("ep_size", [2])
 @pytest.mark.parametrize("topk_ids_dtype", [torch.int64])
-def test_compute_expert_num_tokens_from_numel(numel: int, num_experts: int,
-                                              ep_size: int,
-                                              topk_ids_dtype: torch.dtype):
-    do_test_compute_expert_num_tokens(num_tokens=numel,
-                                      num_topk=1,
-                                      num_experts=num_experts,
-                                      ep_size=ep_size,
-                                      topk_ids_dtype=topk_ids_dtype)
+def test_compute_expert_num_tokens_from_numel(
+    numel: int, num_experts: int, ep_size: int, topk_ids_dtype: torch.dtype
+):
+    do_test_compute_expert_num_tokens(
+        num_tokens=numel,
+        num_topk=1,
+        num_experts=num_experts,
+        ep_size=ep_size,
+        topk_ids_dtype=topk_ids_dtype,
+    )
diff --git a/tests/kernels/moe/test_cutlass_grouped_gemm.py b/tests/kernels/moe/test_cutlass_grouped_gemm.py
index 3b1618dacac7..4c60241bdb01 100644
--- a/tests/kernels/moe/test_cutlass_grouped_gemm.py
+++ b/tests/kernels/moe/test_cutlass_grouped_gemm.py
@@ -17,19 +17,24 @@
 from vllm.utils.deep_gemm import per_block_cast_to_fp8
 
 
-@pytest.mark.parametrize("num_groups, expected_m_per_group, k, n", [
-    (4, 8192, 7168, 4096),
-    (4, 8192, 2048, 7168),
-    (8, 4096, 7168, 4096),
-    (8, 4096, 2048, 7168),
-    (32, 1024, 7168, 4096),
-    (32, 1024, 2048, 7168),
-])
+@pytest.mark.parametrize(
+    "num_groups, expected_m_per_group, k, n",
+    [
+        (4, 8192, 7168, 4096),
+        (4, 8192, 2048, 7168),
+        (8, 4096, 7168, 4096),
+        (8, 4096, 2048, 7168),
+        (32, 1024, 7168, 4096),
+        (32, 1024, 2048, 7168),
+    ],
+)
 @pytest.mark.parametrize("out_dtype", [torch.float16])
 @pytest.mark.skipif(
     (lambda x: x is None or x.to_int() != 100)(
-        current_platform.get_device_capability()),
-    reason="Block Scaled Grouped GEMM is only supported on SM100.")
+        current_platform.get_device_capability()
+    ),
+    reason="Block Scaled Grouped GEMM is only supported on SM100.",
+)
 def test_cutlass_grouped_gemm(
     num_groups: int,
     expected_m_per_group: int,
@@ -40,8 +45,7 @@ def test_cutlass_grouped_gemm(
     device = "cuda"
     alignment = 128
     group_ms = [
-        int(expected_m_per_group * random.uniform(0.7, 1.3))
-        for _ in range(num_groups)
+        int(expected_m_per_group * random.uniform(0.7, 1.3)) for _ in range(num_groups)
     ]
     m = sum([cdiv(m, alignment) * alignment for m in group_ms])
 
@@ -58,20 +62,22 @@ def test_cutlass_grouped_gemm(
     expert_offsets = torch.tensor(ep_offset, device=device, dtype=torch.int32)
 
     x_fp8 = per_token_cast_to_fp8(x)
-    y_fp8 = (torch.empty_like(y, dtype=torch.float8_e4m3fn),
-             torch.empty((num_groups, cdiv(n, 128), k // 128),
-                         device=device,
-                         dtype=torch.float))
+    y_fp8 = (
+        torch.empty_like(y, dtype=torch.float8_e4m3fn),
+        torch.empty(
+            (num_groups, cdiv(n, 128), k // 128), device=device, dtype=torch.float
+        ),
+    )
     for i in range(num_groups):
         y_fp8[0][i], y_fp8[1][i] = per_block_cast_to_fp8(y[i], [128, 128])
 
     for i in range(num_groups):
-        a = x_fp8[0][ep_offset[i]:ep_offset[i + 1]]
-        a_scale = x_fp8[1][ep_offset[i]:ep_offset[i + 1]]
+        a = x_fp8[0][ep_offset[i] : ep_offset[i + 1]]
+        a_scale = x_fp8[1][ep_offset[i] : ep_offset[i + 1]]
         b = y_fp8[0][i].t()
         b_scale = y_fp8[1][i].t()
         baseline = baseline_scaled_mm(a, b, a_scale, b_scale, out_dtype)
-        ref_out[ep_offset[i]:ep_offset[i + 1]] = baseline
+        ref_out[ep_offset[i] : ep_offset[i + 1]] = baseline
 
     ops.cutlass_blockwise_scaled_grouped_mm(
         out,
diff --git a/tests/kernels/moe/test_cutlass_moe.py b/tests/kernels/moe/test_cutlass_moe.py
index ca6be767dab3..b82cea61bd4e 100644
--- a/tests/kernels/moe/test_cutlass_moe.py
+++ b/tests/kernels/moe/test_cutlass_moe.py
@@ -11,13 +11,15 @@
 from vllm import _custom_ops as ops
 from vllm.config import ParallelConfig, VllmConfig, set_current_vllm_config
 from vllm.model_executor.layers.fused_moe.config import (
-    FUSED_MOE_UNQUANTIZED_CONFIG, fp8_w8a8_moe_quant_config)
+    FUSED_MOE_UNQUANTIZED_CONFIG,
+    fp8_w8a8_moe_quant_config,
+)
 from vllm.model_executor.layers.fused_moe.cutlass_moe import (
-    cutlass_moe_fp8, run_cutlass_moe_fp8)
-from vllm.model_executor.layers.fused_moe.fused_moe import (fused_experts,
-                                                            fused_topk)
-from vllm.model_executor.layers.fused_moe.utils import (
-    moe_kernel_quantize_input)
+    cutlass_moe_fp8,
+    run_cutlass_moe_fp8,
+)
+from vllm.model_executor.layers.fused_moe.fused_moe import fused_experts, fused_topk
+from vllm.model_executor.layers.fused_moe.utils import moe_kernel_quantize_input
 from vllm.platforms import current_platform
 
 NUM_EXPERTS = [40, 64]
@@ -39,12 +41,11 @@
     (224, 3072, 1536),
     (32768, 1024, 1024),
     # These sizes trigger wrong answers.
-    #(7232, 2048, 5120),
-    #(40000, 2048, 5120),
+    # (7232, 2048, 5120),
+    # (40000, 2048, 5120),
 ]
 
-vllm_config = VllmConfig(parallel_config=ParallelConfig(
-    pipeline_parallel_size=1))
+vllm_config = VllmConfig(parallel_config=ParallelConfig(pipeline_parallel_size=1))
 vllm_config.scheduler_config.max_num_seqs = 128
 vllm_config.scheduler_config.max_model_len = 8192
 
@@ -60,22 +61,25 @@ class MOETensors:
     c_strides2: torch.Tensor
 
     @staticmethod
-    def make_moe_tensors(m: int, k: int, n: int, e: int,
-                         dtype: torch.dtype) -> "MOETensors":
+    def make_moe_tensors(
+        m: int, k: int, n: int, e: int, dtype: torch.dtype
+    ) -> "MOETensors":
         a = torch.randn((m, k), device="cuda", dtype=dtype) / 10
         w1 = torch.randn((e, 2 * n, k), device="cuda", dtype=dtype) / 10
         w2 = torch.randn((e, k, n), device="cuda", dtype=dtype) / 10
-        ab_strides1 = torch.full((e, ), k, device="cuda", dtype=torch.int64)
-        c_strides1 = torch.full((e, ), 2 * n, device="cuda", dtype=torch.int64)
-        ab_strides2 = torch.full((e, ), n, device="cuda", dtype=torch.int64)
-        c_strides2 = torch.full((e, ), k, device="cuda", dtype=torch.int64)
-        return MOETensors(a=a,
-                          w1=w1,
-                          w2=w2,
-                          ab_strides1=ab_strides1,
-                          c_strides1=c_strides1,
-                          ab_strides2=ab_strides2,
-                          c_strides2=c_strides2)
+        ab_strides1 = torch.full((e,), k, device="cuda", dtype=torch.int64)
+        c_strides1 = torch.full((e,), 2 * n, device="cuda", dtype=torch.int64)
+        ab_strides2 = torch.full((e,), n, device="cuda", dtype=torch.int64)
+        c_strides2 = torch.full((e,), k, device="cuda", dtype=torch.int64)
+        return MOETensors(
+            a=a,
+            w1=w1,
+            w2=w2,
+            ab_strides1=ab_strides1,
+            c_strides1=c_strides1,
+            ab_strides2=ab_strides2,
+            c_strides2=c_strides2,
+        )
 
 
 @dataclasses.dataclass
@@ -93,9 +97,9 @@ class MOETensors8Bit(MOETensors):
     w2_d: Optional[torch.Tensor] = None  # w2 -> w2_q -> w2_d
 
     @staticmethod
-    def make_moe_tensors_8bit(m: int, k: int, n: int, e: int,
-                              per_act_token: bool,
-                              per_out_channel: bool) -> "MOETensors8Bit":
+    def make_moe_tensors_8bit(
+        m: int, k: int, n: int, e: int, per_act_token: bool, per_out_channel: bool
+    ) -> "MOETensors8Bit":
         dtype = torch.half
         q_dtype = torch.float8_e4m3fn
 
@@ -106,24 +110,21 @@ def make_moe_tensors_8bit(m: int, k: int, n: int, e: int,
         k_b_scales = k if per_out_channel else 1
         # Get the right scale for tests.
         a_q, a_scale = ops.scaled_fp8_quant(
-            moe_tensors_fp16.a, None, use_per_token_if_dynamic=per_act_token)
+            moe_tensors_fp16.a, None, use_per_token_if_dynamic=per_act_token
+        )
 
         w1_q = torch.empty((e, 2 * n, k), device="cuda", dtype=q_dtype)
         w2_q = torch.empty((e, k, n), device="cuda", dtype=q_dtype)
 
-        w1_scale = torch.empty((e, n_b_scales, 1),
-                               device="cuda",
-                               dtype=torch.float32)
-        w2_scale = torch.empty((e, k_b_scales, 1),
-                               device="cuda",
-                               dtype=torch.float32)
+        w1_scale = torch.empty((e, n_b_scales, 1), device="cuda", dtype=torch.float32)
+        w2_scale = torch.empty((e, k_b_scales, 1), device="cuda", dtype=torch.float32)
         for expert in range(e):
             w1_q[expert], w1_scale[expert] = ops.scaled_fp8_quant(
-                moe_tensors_fp16.w1[expert],
-                use_per_token_if_dynamic=per_out_channel)
+                moe_tensors_fp16.w1[expert], use_per_token_if_dynamic=per_out_channel
+            )
             w2_q[expert], w2_scale[expert] = ops.scaled_fp8_quant(
-                moe_tensors_fp16.w2[expert],
-                use_per_token_if_dynamic=per_out_channel)
+                moe_tensors_fp16.w2[expert], use_per_token_if_dynamic=per_out_channel
+            )
 
         # a_q -> a_d, w1_q -> w1_d, w2_q -> w2_d
         a_d = a_q.float().mul(a_scale).to(dtype)
@@ -133,31 +134,37 @@ def make_moe_tensors_8bit(m: int, k: int, n: int, e: int,
             w1_d[expert] = (w1_q[expert].float() * w1_scale[expert]).half()
             w2_d[expert] = (w2_q[expert].float() * w2_scale[expert]).half()
 
-        return MOETensors8Bit(a=moe_tensors_fp16.a,
-                              w1=moe_tensors_fp16.w1,
-                              w2=moe_tensors_fp16.w2,
-                              ab_strides1=moe_tensors_fp16.ab_strides1,
-                              c_strides1=moe_tensors_fp16.c_strides1,
-                              ab_strides2=moe_tensors_fp16.ab_strides2,
-                              c_strides2=moe_tensors_fp16.c_strides2,
-                              a_q=a_q,
-                              w1_q=w1_q,
-                              w2_q=w2_q,
-                              a_scale=a_scale,
-                              w1_scale=w1_scale,
-                              w2_scale=w2_scale,
-                              a_d=a_d,
-                              w1_d=w1_d,
-                              w2_d=w2_d)
-
-
-def run_with_expert_maps(num_experts: int, num_local_experts: int,
-                         **cutlass_moe_kwargs):
-
+        return MOETensors8Bit(
+            a=moe_tensors_fp16.a,
+            w1=moe_tensors_fp16.w1,
+            w2=moe_tensors_fp16.w2,
+            ab_strides1=moe_tensors_fp16.ab_strides1,
+            c_strides1=moe_tensors_fp16.c_strides1,
+            ab_strides2=moe_tensors_fp16.ab_strides2,
+            c_strides2=moe_tensors_fp16.c_strides2,
+            a_q=a_q,
+            w1_q=w1_q,
+            w2_q=w2_q,
+            a_scale=a_scale,
+            w1_scale=w1_scale,
+            w2_scale=w2_scale,
+            a_d=a_d,
+            w1_d=w1_d,
+            w2_d=w2_d,
+        )
+
+
+def run_with_expert_maps(
+    num_experts: int, num_local_experts: int, **cutlass_moe_kwargs
+):
     def slice_experts():
         slice_params = [
-            "w1_q", "w2_q", "ab_strides1", "ab_strides2", "c_strides1",
-            "c_strides2"
+            "w1_q",
+            "w2_q",
+            "ab_strides1",
+            "ab_strides2",
+            "c_strides1",
+            "c_strides2",
         ]
         full_tensors = {
             k: v
@@ -173,9 +180,7 @@ def slice_experts():
             # make expert map
             expert_map = [-1] * num_experts
             expert_map[s:e] = list(range(num_local_experts))
-            expert_map = torch.tensor(expert_map,
-                                      dtype=torch.int32,
-                                      device="cuda")
+            expert_map = torch.tensor(expert_map, dtype=torch.int32, device="cuda")
 
             # update cutlass moe arg with expert_map
             cutlass_moe_kwargs["expert_map"] = expert_map
@@ -198,18 +203,26 @@ def slice_experts():
     return out_tensor
 
 
-def run_8_bit(moe_tensors: MOETensors8Bit,
-              topk_weights: torch.Tensor,
-              topk_ids: torch.Tensor,
-              per_act_token: bool,
-              per_out_ch: bool,
-              num_local_experts: Optional[int] = None) -> torch.Tensor:
-    assert not any([
-        t is None for t in [
-            moe_tensors.w1_q, moe_tensors.w2_q, moe_tensors.w1_scale,
-            moe_tensors.w2_scale, moe_tensors.a_scale
+def run_8_bit(
+    moe_tensors: MOETensors8Bit,
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    per_act_token: bool,
+    per_out_ch: bool,
+    num_local_experts: Optional[int] = None,
+) -> torch.Tensor:
+    assert not any(
+        [
+            t is None
+            for t in [
+                moe_tensors.w1_q,
+                moe_tensors.w2_q,
+                moe_tensors.w1_scale,
+                moe_tensors.w2_scale,
+                moe_tensors.a_scale,
+            ]
         ]
-    ])
+    )
 
     quant_config = fp8_w8a8_moe_quant_config(
         w1_scale=moe_tensors.w1_scale,
@@ -222,16 +235,16 @@ def run_8_bit(moe_tensors: MOETensors8Bit,
     )
 
     kwargs = {
-        'a': moe_tensors.a,
-        'w1_q': moe_tensors.w1_q,  # type: ignore[union-attr]
-        'w2_q': moe_tensors.w2_q,  # type: ignore[union-attr]
-        'topk_weights': topk_weights,
-        'topk_ids': topk_ids,
-        'ab_strides1': moe_tensors.ab_strides1,
-        'ab_strides2': moe_tensors.ab_strides2,
-        'c_strides1': moe_tensors.c_strides1,
-        'c_strides2': moe_tensors.c_strides2,
-        'quant_config': quant_config,
+        "a": moe_tensors.a,
+        "w1_q": moe_tensors.w1_q,  # type: ignore[union-attr]
+        "w2_q": moe_tensors.w2_q,  # type: ignore[union-attr]
+        "topk_weights": topk_weights,
+        "topk_ids": topk_ids,
+        "ab_strides1": moe_tensors.ab_strides1,
+        "ab_strides2": moe_tensors.ab_strides2,
+        "c_strides1": moe_tensors.c_strides1,
+        "c_strides2": moe_tensors.c_strides2,
+        "quant_config": quant_config,
     }
 
     num_experts = moe_tensors.w1.size(0)
@@ -243,7 +256,8 @@ def run_8_bit(moe_tensors: MOETensors8Bit,
     return run_with_expert_maps(
         num_experts,
         num_local_experts,  # type: ignore[arg-type]
-        **kwargs)
+        **kwargs,
+    )
 
 
 @pytest.mark.parametrize("m,n,k", MNK_FACTORS)
@@ -253,8 +267,10 @@ def run_8_bit(moe_tensors: MOETensors8Bit,
 @pytest.mark.parametrize("per_out_ch", [True, False])
 @pytest.mark.skipif(
     (lambda x: x is None or not ops.cutlass_group_gemm_supported(x.to_int()))(
-        current_platform.get_device_capability()),
-    reason="Grouped gemm is not supported on this GPU type.")
+        current_platform.get_device_capability()
+    ),
+    reason="Grouped gemm is not supported on this GPU type.",
+)
 def test_cutlass_moe_8_bit_no_graph(
     m: int,
     n: int,
@@ -269,25 +285,18 @@ def test_cutlass_moe_8_bit_no_graph(
     current_platform.seed_everything(7)
     monkeypatch.setenv("VLLM_FUSED_MOE_CHUNK_SIZE", "8192")
     with set_current_vllm_config(vllm_config):
-        mt = MOETensors8Bit.make_moe_tensors_8bit(m, k, n, e, per_act_token,
-                                                  per_out_ch)
+        mt = MOETensors8Bit.make_moe_tensors_8bit(m, k, n, e, per_act_token, per_out_ch)
 
         score = torch.randn((m, e), device="cuda", dtype=torch.half)
-        topk_weights, topk_ids, _ = fused_topk(mt.a,
-                                               score,
-                                               topk,
-                                               renormalize=False)
+        topk_weights, topk_ids, _ = fused_topk(mt.a, score, topk, renormalize=False)
 
         # Note that we are using the dequantized versions of the tensors.
         # Using a, w1 and w2 directly results in minor output differences.
 
         quant_config = FUSED_MOE_UNQUANTIZED_CONFIG
-        triton_output = fused_experts(mt.a_d,
-                                      mt.w1_d,
-                                      mt.w2_d,
-                                      topk_weights,
-                                      topk_ids,
-                                      quant_config=quant_config)
+        triton_output = fused_experts(
+            mt.a_d, mt.w1_d, mt.w2_d, topk_weights, topk_ids, quant_config=quant_config
+        )
 
         if ep_size is not None:
             assert e % ep_size == 0, "Cannot distribute experts evenly"
@@ -295,15 +304,15 @@ def test_cutlass_moe_8_bit_no_graph(
         else:
             number_local_experts = None
 
-        cutlass_output = run_8_bit(mt, topk_weights, topk_ids, per_act_token,
-                                   per_out_ch, number_local_experts)
+        cutlass_output = run_8_bit(
+            mt, topk_weights, topk_ids, per_act_token, per_out_ch, number_local_experts
+        )
 
         # Note 5.5 only needed for larger problem sizes, 5 works ok for
         # the rest.
-        torch.testing.assert_close(triton_output,
-                                   cutlass_output,
-                                   atol=5.5e-2,
-                                   rtol=1e-2)
+        torch.testing.assert_close(
+            triton_output, cutlass_output, atol=5.5e-2, rtol=1e-2
+        )
 
 
 @pytest.mark.parametrize("m,n,k", MNK_FACTORS)
@@ -313,8 +322,10 @@ def test_cutlass_moe_8_bit_no_graph(
 @pytest.mark.parametrize("per_out_ch", [True, False])
 @pytest.mark.skipif(
     (lambda x: x is None or not ops.cutlass_group_gemm_supported(x.to_int()))(
-        current_platform.get_device_capability()),
-    reason="Grouped gemm is not supported on this GPU type.")
+        current_platform.get_device_capability()
+    ),
+    reason="Grouped gemm is not supported on this GPU type.",
+)
 def test_cutlass_moe_8_bit_cuda_graph(
     m: int,
     n: int,
@@ -330,39 +341,30 @@ def test_cutlass_moe_8_bit_cuda_graph(
     with set_current_vllm_config(vllm_config):
         dtype = torch.half
 
-        mt = MOETensors8Bit.make_moe_tensors_8bit(m, k, n, e, per_act_token,
-                                                  per_out_ch)
+        mt = MOETensors8Bit.make_moe_tensors_8bit(m, k, n, e, per_act_token, per_out_ch)
 
         score = torch.randn((m, e), device="cuda", dtype=dtype)
-        topk_weights, topk_ids, _ = fused_topk(mt.a,
-                                               score,
-                                               topk,
-                                               renormalize=False)
+        topk_weights, topk_ids, _ = fused_topk(mt.a, score, topk, renormalize=False)
 
         # Note that we are using the dequantized versions of the tensors.
         # Using a, w1 and w2 directly results in minor output differences.
         quant_config = FUSED_MOE_UNQUANTIZED_CONFIG
-        triton_output = fused_experts(mt.a_d,
-                                      mt.w1_d,
-                                      mt.w2_d,
-                                      topk_weights,
-                                      topk_ids,
-                                      quant_config=quant_config)
+        triton_output = fused_experts(
+            mt.a_d, mt.w1_d, mt.w2_d, topk_weights, topk_ids, quant_config=quant_config
+        )
 
         stream = torch.cuda.Stream()
         graph = torch.cuda.CUDAGraph()
         with torch.cuda.graph(graph, stream=stream):
-            cutlass_output = run_8_bit(mt, topk_weights, topk_ids,
-                                       per_act_token, per_out_ch)
+            cutlass_output = run_8_bit(
+                mt, topk_weights, topk_ids, per_act_token, per_out_ch
+            )
 
         torch.cuda.synchronize()
         graph.replay()
         torch.cuda.synchronize()
 
-        torch.testing.assert_close(triton_output,
-                                   cutlass_output,
-                                   atol=9e-2,
-                                   rtol=1e-2)
+        torch.testing.assert_close(triton_output, cutlass_output, atol=9e-2, rtol=1e-2)
 
 
 @pytest.mark.parametrize("m", [64])
@@ -375,8 +377,10 @@ def test_cutlass_moe_8_bit_cuda_graph(
 @pytest.mark.parametrize("ep_size", [1, 2, 4, 8, 16])
 @pytest.mark.skipif(
     (lambda x: x is None or not ops.cutlass_group_gemm_supported(x.to_int()))(
-        current_platform.get_device_capability()),
-    reason="Grouped gemm is not supported on this GPU type.")
+        current_platform.get_device_capability()
+    ),
+    reason="Grouped gemm is not supported on this GPU type.",
+)
 def test_cutlass_moe_8_bit_EP(
     m: int,
     n: int,
@@ -388,8 +392,9 @@ def test_cutlass_moe_8_bit_EP(
     ep_size: int,
     monkeypatch,
 ):
-    test_cutlass_moe_8_bit_no_graph(m, n, k, e, topk, per_act_token,
-                                    per_out_channel, monkeypatch, ep_size)
+    test_cutlass_moe_8_bit_no_graph(
+        m, n, k, e, topk, per_act_token, per_out_channel, monkeypatch, ep_size
+    )
 
 
 LARGE_MNK_FACTORS = [
@@ -406,8 +411,10 @@ def test_cutlass_moe_8_bit_EP(
 @pytest.mark.parametrize("ep_size", [8])
 @pytest.mark.skipif(
     (lambda x: x is None or not ops.cutlass_group_gemm_supported(x.to_int()))(
-        current_platform.get_device_capability()),
-    reason="Grouped gemm is not supported on this GPU type.")
+        current_platform.get_device_capability()
+    ),
+    reason="Grouped gemm is not supported on this GPU type.",
+)
 def test_cutlass_moe_8_bit_EP_large(
     m: int,
     n: int,
@@ -419,8 +426,9 @@ def test_cutlass_moe_8_bit_EP_large(
     ep_size: int,
     monkeypatch,
 ):
-    test_cutlass_moe_8_bit_no_graph(m, n, k, e, topk, per_act_token,
-                                    per_out_channel, monkeypatch, ep_size)
+    test_cutlass_moe_8_bit_no_graph(
+        m, n, k, e, topk, per_act_token, per_out_channel, monkeypatch, ep_size
+    )
 
 
 @pytest.mark.parametrize("m,n,k,topk", [(1, 8192, 5120, 31)])
@@ -430,8 +438,10 @@ def test_cutlass_moe_8_bit_EP_large(
 @pytest.mark.parametrize("ep_size", [8])
 @pytest.mark.skipif(
     (lambda x: x is None or not ops.cutlass_group_gemm_supported(x.to_int()))(
-        current_platform.get_device_capability()),
-    reason="Grouped gemm is not supported on this GPU type.")
+        current_platform.get_device_capability()
+    ),
+    reason="Grouped gemm is not supported on this GPU type.",
+)
 def test_run_cutlass_moe_fp8(
     m: int,
     n: int,
@@ -444,14 +454,12 @@ def test_run_cutlass_moe_fp8(
 ):
     current_platform.seed_everything(7)
     with set_current_vllm_config(vllm_config):
-        mt = MOETensors8Bit.make_moe_tensors_8bit(m, k, n, e, per_act_token,
-                                                  per_out_channel)
+        mt = MOETensors8Bit.make_moe_tensors_8bit(
+            m, k, n, e, per_act_token, per_out_channel
+        )
 
         score = torch.randn((m, e), device="cuda", dtype=torch.half)
-        topk_weights, topk_ids, _ = fused_topk(mt.a,
-                                               score,
-                                               topk,
-                                               renormalize=False)
+        topk_weights, topk_ids, _ = fused_topk(mt.a, score, topk, renormalize=False)
         # we want to make sure there is at least one token that's generated in
         # this expert shard and at least one token that's NOT generated in this
         # expert shard
@@ -462,12 +470,12 @@ def test_run_cutlass_moe_fp8(
         workspace2_shape = (m * topk, max(n, k))
         output_shape = (m, k)
 
-        workspace13 = torch.empty(prod(workspace13_shape),
-                                  device="cuda",
-                                  dtype=mt.a.dtype)
-        workspace2 = torch.empty(prod(workspace2_shape),
-                                 device="cuda",
-                                 dtype=mt.a.dtype)
+        workspace13 = torch.empty(
+            prod(workspace13_shape), device="cuda", dtype=mt.a.dtype
+        )
+        workspace2 = torch.empty(
+            prod(workspace2_shape), device="cuda", dtype=mt.a.dtype
+        )
 
         num_local_experts = e // ep_size
         start, end = 0, num_local_experts
@@ -475,36 +483,55 @@ def test_run_cutlass_moe_fp8(
         expert_map[start:end] = list(range(num_local_experts))
         expert_map = torch.tensor(expert_map, dtype=torch.int32, device="cuda")
 
-        ab_strides1 = torch.full((e, ), k, device="cuda", dtype=torch.int64)
-        ab_strides2 = torch.full((e, ), n, device="cuda", dtype=torch.int64)
-        c_strides1 = torch.full((e, ), 2 * n, device="cuda", dtype=torch.int64)
-        c_strides2 = torch.full((e, ), k, device="cuda", dtype=torch.int64)
+        ab_strides1 = torch.full((e,), k, device="cuda", dtype=torch.int64)
+        ab_strides2 = torch.full((e,), n, device="cuda", dtype=torch.int64)
+        c_strides1 = torch.full((e,), 2 * n, device="cuda", dtype=torch.int64)
+        c_strides2 = torch.full((e,), k, device="cuda", dtype=torch.int64)
 
         activation = lambda o, i: torch.ops._C.silu_and_mul(o, i)
-        a1q, a1q_scale = moe_kernel_quantize_input(mt.a, mt.a_scale,
-                                                   torch.float8_e4m3fn,
-                                                   per_act_token)
+        a1q, a1q_scale = moe_kernel_quantize_input(
+            mt.a, mt.a_scale, torch.float8_e4m3fn, per_act_token
+        )
         global_num_experts = -1 if mt.w1_q is None else mt.w1_q.size(0)
         func = lambda output: run_cutlass_moe_fp8(
-            output, a1q, mt.w1_q, mt.w2_q, topk_ids, activation,
-            global_num_experts, expert_map, mt.w1_scale, mt.w2_scale,
-            a1q_scale, None, ab_strides1, ab_strides2, c_strides1, c_strides2,
-            workspace13, workspace2, None, mt.a.dtype, per_act_token,
-            per_out_channel, False, topk_weights)
+            output,
+            a1q,
+            mt.w1_q,
+            mt.w2_q,
+            topk_ids,
+            activation,
+            global_num_experts,
+            expert_map,
+            mt.w1_scale,
+            mt.w2_scale,
+            a1q_scale,
+            None,
+            ab_strides1,
+            ab_strides2,
+            c_strides1,
+            c_strides2,
+            workspace13,
+            workspace2,
+            None,
+            mt.a.dtype,
+            per_act_token,
+            per_out_channel,
+            False,
+            topk_weights,
+        )
 
         workspace13.random_()
-        output_random_workspace = torch.empty(output_shape,
-                                              device="cuda",
-                                              dtype=mt.a.dtype)
+        output_random_workspace = torch.empty(
+            output_shape, device="cuda", dtype=mt.a.dtype
+        )
         func(output_random_workspace)
 
         workspace13.fill_(0)
-        output_zero_workspace = torch.zeros(output_shape,
-                                            device="cuda",
-                                            dtype=mt.a.dtype)
+        output_zero_workspace = torch.zeros(
+            output_shape, device="cuda", dtype=mt.a.dtype
+        )
         func(output_zero_workspace)
 
-        torch.testing.assert_close(output_random_workspace,
-                                   output_zero_workspace,
-                                   atol=5e-3,
-                                   rtol=1e-3)
+        torch.testing.assert_close(
+            output_random_workspace, output_zero_workspace, atol=5e-3, rtol=1e-3
+        )
diff --git a/tests/kernels/moe/test_deepep_deepgemm_moe.py b/tests/kernels/moe/test_deepep_deepgemm_moe.py
index ced5457d4f53..cfa752d6ea2f 100644
--- a/tests/kernels/moe/test_deepep_deepgemm_moe.py
+++ b/tests/kernels/moe/test_deepep_deepgemm_moe.py
@@ -16,10 +16,11 @@
 
 from vllm.config import VllmConfig, set_current_vllm_config
 from vllm.model_executor.layers.fused_moe.config import (
-    FusedMoEQuantConfig, fp8_w8a8_moe_quant_config)
+    FusedMoEQuantConfig,
+    fp8_w8a8_moe_quant_config,
+)
 from vllm.model_executor.layers.fused_moe.fused_moe import fused_experts
-from vllm.model_executor.layers.fused_moe.modular_kernel import (
-    FusedMoEModularKernel)
+from vllm.model_executor.layers.fused_moe.modular_kernel import FusedMoEModularKernel
 from vllm.platforms import current_platform
 from vllm.utils import has_deep_ep, has_deep_gemm
 from vllm.utils.deep_gemm import is_deep_gemm_e8m0_used, is_deep_gemm_supported
@@ -30,18 +31,19 @@
 
 if has_deep_ep():
     from vllm.model_executor.layers.fused_moe.deepep_ht_prepare_finalize import (  # noqa: E501
-        DeepEPHTPrepareAndFinalize)
+        DeepEPHTPrepareAndFinalize,
+    )
     from vllm.model_executor.layers.fused_moe.deepep_ll_prepare_finalize import (  # noqa: E501
-        DeepEPLLPrepareAndFinalize)
+        DeepEPLLPrepareAndFinalize,
+    )
 
     from .parallel_utils import DeepEPHTArgs, DeepEPLLArgs, make_deepep_a2a
 
 if has_deep_gemm():
-
     from vllm.model_executor.layers.fused_moe.batched_deep_gemm_moe import (
-        BatchedDeepGemmExperts)
-    from vllm.model_executor.layers.fused_moe.deep_gemm_moe import (
-        DeepGemmExperts)
+        BatchedDeepGemmExperts,
+    )
+    from vllm.model_executor.layers.fused_moe.deep_gemm_moe import DeepGemmExperts
 
 requires_deep_ep = pytest.mark.skipif(
     not has_deep_ep(),
@@ -58,9 +60,10 @@
 
 def next_power_of_2(x):
     import math
+
     if x == 0:
         return 1
-    return 2**math.ceil(math.log2(x))
+    return 2 ** math.ceil(math.log2(x))
 
 
 def make_block_quant_fp8_weights(
@@ -72,13 +75,9 @@ def make_block_quant_fp8_weights(
     """
     Return weights w1q, w2q, w1_scale, w2_scale
     """
-    (_, w1q, w1_scale, _), (_, w2q, w2_scale,
-                            _) = make_test_weights(e,
-                                                   n,
-                                                   k,
-                                                   torch.bfloat16,
-                                                   torch.float8_e4m3fn,
-                                                   block_shape=block_size)
+    (_, w1q, w1_scale, _), (_, w2q, w2_scale, _) = make_test_weights(
+        e, n, k, torch.bfloat16, torch.float8_e4m3fn, block_shape=block_size
+    )
     return w1q, w2q, w1_scale, w2_scale
 
 
@@ -106,15 +105,15 @@ class TestTensors:
 
     @staticmethod
     def make(config: TestConfig, rank) -> "TestTensors":
-
         dtype = torch.bfloat16
         topk, m, k = (config.topk, config.m, config.k)
 
         fp8_info = torch.finfo(torch.float8_e4m3fn)
         fp8_max, fp8_min = fp8_info.max, fp8_info.min
 
-        rank_tokens = torch.randn(
-            (m, k), device=torch.cuda.current_device(), dtype=dtype) / 10.0
+        rank_tokens = (
+            torch.randn((m, k), device=torch.cuda.current_device(), dtype=dtype) / 10.0
+        )
         rank_tokens = rank_tokens.clamp(min=fp8_min, max=fp8_max)
         rank_token_scales = None
 
@@ -122,25 +121,32 @@ def make(config: TestConfig, rank) -> "TestTensors":
             low=0,
             high=config.num_experts,
             size=(m, topk),
-            device=torch.cuda.current_device()).to(dtype=torch.int64)
+            device=torch.cuda.current_device(),
+        ).to(dtype=torch.int64)
 
-        topk_weights = torch.randn(topk_ids.shape,
-                                   dtype=torch.float32,
-                                   device=torch.cuda.current_device())
+        topk_weights = torch.randn(
+            topk_ids.shape, dtype=torch.float32, device=torch.cuda.current_device()
+        )
 
-        return TestTensors(rank_tokens=rank_tokens,
-                           rank_token_scales=rank_token_scales,
-                           topk=topk_ids,
-                           topk_weights=topk_weights,
-                           config=config)
+        return TestTensors(
+            rank_tokens=rank_tokens,
+            rank_token_scales=rank_token_scales,
+            topk=topk_ids,
+            topk_weights=topk_weights,
+            config=config,
+        )
 
 
 def make_ll_modular_kernel(
-        pg: ProcessGroup, pgi: ProcessGroupInfo, max_tokens_per_rank: int,
-        dp_size: int, hidden_size: int, q_dtype: Optional[torch.dtype],
-        test_config: TestConfig,
-        quant_config: FusedMoEQuantConfig) -> FusedMoEModularKernel:
-
+    pg: ProcessGroup,
+    pgi: ProcessGroupInfo,
+    max_tokens_per_rank: int,
+    dp_size: int,
+    hidden_size: int,
+    q_dtype: Optional[torch.dtype],
+    test_config: TestConfig,
+    quant_config: FusedMoEQuantConfig,
+) -> FusedMoEModularKernel:
     assert test_config.low_latency
     assert test_config.use_fp8_dispatch is not None
 
@@ -153,26 +159,30 @@ def make_ll_modular_kernel(
             max_tokens_per_rank=max_tokens_per_rank,
             hidden_size=hidden_size,
             num_experts=test_config.num_experts,
-            use_fp8_dispatch=test_config.use_fp8_dispatch),
+            use_fp8_dispatch=test_config.use_fp8_dispatch,
+        ),
         q_dtype=q_dtype,
-        block_shape=test_config.block_size)
+        block_shape=test_config.block_size,
+    )
 
     fused_experts = BatchedDeepGemmExperts(
         max_num_tokens=max_tokens_per_rank,
         num_dispatchers=pgi.world_size // dp_size,
         quant_config=quant_config,
     )
-    mk = FusedMoEModularKernel(prepare_finalize=a2a,
-                               fused_experts=fused_experts)
+    mk = FusedMoEModularKernel(prepare_finalize=a2a, fused_experts=fused_experts)
     return mk
 
 
 def make_ht_modular_kernel(
-        pg: ProcessGroup, pgi: ProcessGroupInfo, dp_size: int,
-        num_local_experts: int, q_dtype: Optional[torch.dtype],
-        test_config: TestConfig,
-        quant_config: FusedMoEQuantConfig) -> FusedMoEModularKernel:
-
+    pg: ProcessGroup,
+    pgi: ProcessGroupInfo,
+    dp_size: int,
+    num_local_experts: int,
+    q_dtype: Optional[torch.dtype],
+    test_config: TestConfig,
+    quant_config: FusedMoEQuantConfig,
+) -> FusedMoEModularKernel:
     assert not test_config.low_latency
     assert test_config.use_fp8_dispatch is None
 
@@ -183,76 +193,82 @@ def make_ht_modular_kernel(
         deepep_ht_args=DeepEPHTArgs(num_local_experts=num_local_experts),
         deepep_ll_args=None,
         q_dtype=q_dtype,
-        block_shape=test_config.block_size)
+        block_shape=test_config.block_size,
+    )
 
     fused_experts = DeepGemmExperts(quant_config)
-    mk = FusedMoEModularKernel(prepare_finalize=a2a,
-                               fused_experts=fused_experts)
+    mk = FusedMoEModularKernel(prepare_finalize=a2a, fused_experts=fused_experts)
     return mk
 
 
 def make_modular_kernel(
-        pg: ProcessGroup, pgi: ProcessGroupInfo, dp_size: int,
-        num_local_experts: int, test_tensors: TestTensors,
-        quant_config: FusedMoEQuantConfig) -> FusedMoEModularKernel:
-
+    pg: ProcessGroup,
+    pgi: ProcessGroupInfo,
+    dp_size: int,
+    num_local_experts: int,
+    test_tensors: TestTensors,
+    quant_config: FusedMoEQuantConfig,
+) -> FusedMoEModularKernel:
     q_dtype = torch.float8_e4m3fn
     test_config = test_tensors.config
 
     mk: FusedMoEModularKernel
     # Make modular kernel
     if test_config.low_latency:
-        max_tokens_per_rank = max(
-            64, next_power_of_2(test_tensors.rank_tokens.size(0)))
+        max_tokens_per_rank = max(64, next_power_of_2(test_tensors.rank_tokens.size(0)))
         hidden_size = test_tensors.rank_tokens.size(-1)
 
-        mk = make_ll_modular_kernel(pg=pg,
-                                    pgi=pgi,
-                                    max_tokens_per_rank=max_tokens_per_rank,
-                                    dp_size=dp_size,
-                                    hidden_size=hidden_size,
-                                    q_dtype=q_dtype,
-                                    test_config=test_config,
-                                    quant_config=quant_config)
+        mk = make_ll_modular_kernel(
+            pg=pg,
+            pgi=pgi,
+            max_tokens_per_rank=max_tokens_per_rank,
+            dp_size=dp_size,
+            hidden_size=hidden_size,
+            q_dtype=q_dtype,
+            test_config=test_config,
+            quant_config=quant_config,
+        )
     else:
-        mk = make_ht_modular_kernel(pg,
-                                    pgi,
-                                    dp_size,
-                                    num_local_experts,
-                                    q_dtype,
-                                    test_config,
-                                    quant_config=quant_config)
+        mk = make_ht_modular_kernel(
+            pg,
+            pgi,
+            dp_size,
+            num_local_experts,
+            q_dtype,
+            test_config,
+            quant_config=quant_config,
+        )
 
     return mk
 
 
-def deepep_deepgemm_moe_impl(pg: ProcessGroup, pgi: ProcessGroupInfo,
-                             dp_size: int, test_tensors: TestTensors,
-                             w1: torch.Tensor, w2: torch.Tensor,
-                             w1_scale: Optional[torch.Tensor],
-                             w2_scale: Optional[torch.Tensor]) -> torch.Tensor:
-
+def deepep_deepgemm_moe_impl(
+    pg: ProcessGroup,
+    pgi: ProcessGroupInfo,
+    dp_size: int,
+    test_tensors: TestTensors,
+    w1: torch.Tensor,
+    w2: torch.Tensor,
+    w1_scale: Optional[torch.Tensor],
+    w2_scale: Optional[torch.Tensor],
+) -> torch.Tensor:
     test_config = test_tensors.config
     num_experts = test_config.num_experts
     num_local_experts = w1.size(0)
 
     def build_expert_map():
         num_local_experts = w1.size(0)
-        expert_map = torch.full((num_experts, ),
-                                fill_value=-1,
-                                dtype=torch.int32)
+        expert_map = torch.full((num_experts,), fill_value=-1, dtype=torch.int32)
         s = pgi.rank * num_local_experts
         e = s + num_local_experts
         expert_map[s:e] = torch.tensor(list(range(num_local_experts)))
-        return expert_map.to(device=torch.cuda.current_device(),
-                             dtype=torch.int32)
+        return expert_map.to(device=torch.cuda.current_device(), dtype=torch.int32)
 
     quant_config = fp8_w8a8_moe_quant_config(
         w1_scale=w1_scale,
         w2_scale=w2_scale,
         # Low-Latency kernels can't dispatch scales.
-        a1_scale=(None if test_config.low_latency else
-                  test_tensors.rank_token_scales),
+        a1_scale=(None if test_config.low_latency else test_tensors.rank_token_scales),
         block_shape=test_config.block_size,
     )
 
@@ -263,26 +279,35 @@ def build_expert_map():
         dp_size=dp_size,
         num_local_experts=num_local_experts,
         test_tensors=test_tensors,
-        quant_config=quant_config)
-
-    out = mk.forward(hidden_states=test_tensors.rank_tokens,
-                     w1=w1,
-                     w2=w2,
-                     topk_weights=test_tensors.topk_weights,
-                     topk_ids=test_tensors.topk,
-                     inplace=False,
-                     activation="silu",
-                     global_num_experts=num_experts,
-                     expert_map=build_expert_map(),
-                     apply_router_weight_on_input=False)
-    return out
+        quant_config=quant_config,
+    )
 
+    out = mk.forward(
+        hidden_states=test_tensors.rank_tokens,
+        w1=w1,
+        w2=w2,
+        topk_weights=test_tensors.topk_weights,
+        topk_ids=test_tensors.topk,
+        inplace=False,
+        activation="silu",
+        global_num_experts=num_experts,
+        expert_map=build_expert_map(),
+        apply_router_weight_on_input=False,
+    )
+    return out
 
-def triton_impl(a: torch.Tensor, topk_ids: torch.Tensor,
-                topk_weights: torch.Tensor, w1: torch.Tensor, w2: torch.Tensor,
-                w1_scale: torch.Tensor, w2_scale: torch.Tensor,
-                a1_scale: torch.Tensor, block_shape: list[int]):
 
+def triton_impl(
+    a: torch.Tensor,
+    topk_ids: torch.Tensor,
+    topk_weights: torch.Tensor,
+    w1: torch.Tensor,
+    w2: torch.Tensor,
+    w1_scale: torch.Tensor,
+    w2_scale: torch.Tensor,
+    a1_scale: torch.Tensor,
+    block_shape: list[int],
+):
     quant_config = fp8_w8a8_moe_quant_config(
         w1_scale=w1_scale,
         w2_scale=w2_scale,
@@ -300,7 +325,8 @@ def triton_impl(a: torch.Tensor, topk_ids: torch.Tensor,
         quant_config=quant_config,
         # Make sure this is set to False so we
         # don't end up comparing the same implementation.
-        allow_deep_gemm=False)
+        allow_deep_gemm=False,
+    )
 
 
 def _test_deepep_deepgemm_moe(
@@ -321,22 +347,21 @@ def _test_deepep_deepgemm_moe(
 
     pg = torch.distributed.new_group(list(range(pgi.world_size)))
     test_tensors = TestTensors.make(config, pgi.rank)
-    block_shape = [
-        w1.size(1) // w1_scale.size(1),
-        w1.size(2) // w1_scale.size(2)
-    ]
+    block_shape = [w1.size(1) // w1_scale.size(1), w1.size(2) // w1_scale.size(2)]
 
     with set_current_vllm_config(VllmConfig()):
         # Reference
-        triton_moe = triton_impl(a=test_tensors.rank_tokens,
-                                 topk_ids=test_tensors.topk,
-                                 topk_weights=test_tensors.topk_weights,
-                                 w1=w1,
-                                 w2=w2,
-                                 w1_scale=w1_scale,
-                                 w2_scale=w2_scale,
-                                 a1_scale=test_tensors.rank_token_scales,
-                                 block_shape=block_shape)
+        triton_moe = triton_impl(
+            a=test_tensors.rank_tokens,
+            topk_ids=test_tensors.topk,
+            topk_weights=test_tensors.topk_weights,
+            w1=w1,
+            w2=w2,
+            w1_scale=w1_scale,
+            w2_scale=w2_scale,
+            a1_scale=test_tensors.rank_token_scales,
+            block_shape=block_shape,
+        )
 
         # Slice experts for this rank.
         num_local_experts = config.num_experts // pgi.world_size
@@ -390,10 +415,15 @@ def _test_deepep_deepgemm_moe(
 @multi_gpu_test(num_gpus=2)
 @requires_deep_ep
 @requires_deep_gemm
-@pytest.mark.skipif(is_deep_gemm_e8m0_used(),
-                    reason="Skipping test for Blackwell DeepGEMM")
-def test_ht_deepep_deepgemm_moe(mnk: tuple[int, int, int], num_experts: int,
-                                topk: int, world_dp_size: tuple[int, int]):
+@pytest.mark.skipif(
+    is_deep_gemm_e8m0_used(), reason="Skipping test for Blackwell DeepGEMM"
+)
+def test_ht_deepep_deepgemm_moe(
+    mnk: tuple[int, int, int],
+    num_experts: int,
+    topk: int,
+    world_dp_size: tuple[int, int],
+):
     """
     Tests for High-Throughput DeepEP + DeepGemm integration.
     """
@@ -409,21 +439,32 @@ def test_ht_deepep_deepgemm_moe(mnk: tuple[int, int, int], num_experts: int,
     block_size = [block_m, block_m]
 
     world_size, dp_size = world_dp_size
-    config = TestConfig(topk=topk,
-                        m=m,
-                        k=k,
-                        n=n,
-                        num_experts=num_experts,
-                        per_act_token_quant=False,
-                        block_size=block_size,
-                        low_latency=False,
-                        use_fp8_dispatch=None)
+    config = TestConfig(
+        topk=topk,
+        m=m,
+        k=k,
+        n=n,
+        num_experts=num_experts,
+        per_act_token_quant=False,
+        block_size=block_size,
+        low_latency=False,
+        use_fp8_dispatch=None,
+    )
 
     w1, w2, w1_scale, w2_scale = make_block_quant_fp8_weights(
-        num_experts, n, k, block_size)
+        num_experts, n, k, block_size
+    )
 
-    parallel_launch(world_size, _test_deepep_deepgemm_moe, dp_size, config, w1,
-                    w2, w1_scale, w2_scale)
+    parallel_launch(
+        world_size,
+        _test_deepep_deepgemm_moe,
+        dp_size,
+        config,
+        w1,
+        w2,
+        w1_scale,
+        w2_scale,
+    )
 
 
 MNKs = [
@@ -448,8 +489,9 @@ def test_ht_deepep_deepgemm_moe(mnk: tuple[int, int, int], num_experts: int,
 @multi_gpu_test(num_gpus=2)
 @requires_deep_ep
 @requires_deep_gemm
-@pytest.mark.skipif(is_deep_gemm_e8m0_used(),
-                    reason="Skipping test for Blackwell DeepGEMM")
+@pytest.mark.skipif(
+    is_deep_gemm_e8m0_used(), reason="Skipping test for Blackwell DeepGEMM"
+)
 def test_ll_deepep_deepgemm_moe(
     mnk: tuple[int, int, int],
     num_experts: int,
@@ -482,7 +524,16 @@ def test_ll_deepep_deepgemm_moe(
     )
 
     w1, w2, w1_scale, w2_scale = make_block_quant_fp8_weights(
-        num_experts, n, k, block_size)
+        num_experts, n, k, block_size
+    )
 
-    parallel_launch(world_size, _test_deepep_deepgemm_moe, dp_size, config, w1,
-                    w2, w1_scale, w2_scale)
+    parallel_launch(
+        world_size,
+        _test_deepep_deepgemm_moe,
+        dp_size,
+        config,
+        w1,
+        w2,
+        w1_scale,
+        w2_scale,
+    )
diff --git a/tests/kernels/moe/test_deepep_moe.py b/tests/kernels/moe/test_deepep_moe.py
index 54d3a62b03fc..f98e4407a0ef 100644
--- a/tests/kernels/moe/test_deepep_moe.py
+++ b/tests/kernels/moe/test_deepep_moe.py
@@ -16,12 +16,11 @@
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import TritonExperts
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
-from vllm.model_executor.layers.fused_moe.fused_batched_moe import (
-    BatchedTritonExperts)
-from vllm.model_executor.layers.fused_moe.modular_kernel import (
-    FusedMoEModularKernel)
+from vllm.model_executor.layers.fused_moe.fused_batched_moe import BatchedTritonExperts
+from vllm.model_executor.layers.fused_moe.modular_kernel import FusedMoEModularKernel
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    per_token_group_quant_fp8)
+    per_token_group_quant_fp8,
+)
 from vllm.platforms import current_platform
 from vllm.utils import has_deep_ep
 
@@ -30,9 +29,11 @@
 
 if has_deep_ep():
     from vllm.model_executor.layers.fused_moe.deepep_ht_prepare_finalize import (  # noqa: E501
-        DeepEPHTPrepareAndFinalize)
+        DeepEPHTPrepareAndFinalize,
+    )
     from vllm.model_executor.layers.fused_moe.deepep_ll_prepare_finalize import (  # noqa: E501
-        DeepEPLLPrepareAndFinalize)
+        DeepEPLLPrepareAndFinalize,
+    )
 
     from .parallel_utils import DeepEPHTArgs, DeepEPLLArgs, make_deepep_a2a
 
@@ -45,7 +46,7 @@
 
 
 def make_weights(
-        e, n, k, dtype
+    e, n, k, dtype
 ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor, torch.Tensor]:
     """
     Return weights w1, w2, w1_scale, w2_scale
@@ -64,17 +65,15 @@ def make_weights(
     k_b_scales = k
     w1_q = torch.empty_like(w1, dtype=dtype)
     w2_q = torch.empty_like(w2, dtype=dtype)
-    w1_scale = torch.empty((e, n_b_scales, 1),
-                           device="cuda",
-                           dtype=torch.float32)
-    w2_scale = torch.empty((e, k_b_scales, 1),
-                           device="cuda",
-                           dtype=torch.float32)
+    w1_scale = torch.empty((e, n_b_scales, 1), device="cuda", dtype=torch.float32)
+    w2_scale = torch.empty((e, k_b_scales, 1), device="cuda", dtype=torch.float32)
     for expert in range(e):
         w1_q[expert], w1_scale[expert] = ops.scaled_fp8_quant(
-            w1[expert], use_per_token_if_dynamic=True)
+            w1[expert], use_per_token_if_dynamic=True
+        )
         w2_q[expert], w2_scale[expert] = ops.scaled_fp8_quant(
-            w2[expert], use_per_token_if_dynamic=True)
+            w2[expert], use_per_token_if_dynamic=True
+        )
     return w1_q, w2_q, w1_scale, w2_scale
 
 
@@ -100,24 +99,25 @@ class TestTensors:
     def make(config: TestConfig, low_latency_mode: bool) -> "TestTensors":
         # TODO (varun) - check that float16 works ?
         assert config.dtype in [torch.bfloat16, torch.float8_e4m3fn]
-        token_dtype = (torch.bfloat16 if config.dtype == torch.float8_e4m3fn
-                       else config.dtype)
-        rank_tokens = torch.randn(
-            (config.m, config.k), device="cuda", dtype=token_dtype) / 10
+        token_dtype = (
+            torch.bfloat16 if config.dtype == torch.float8_e4m3fn else config.dtype
+        )
+        rank_tokens = (
+            torch.randn((config.m, config.k), device="cuda", dtype=token_dtype) / 10
+        )
         rank_token_scales = None
 
-        topk = torch.randint(low=0,
-                             high=config.num_experts,
-                             size=(config.m, config.topk),
-                             device="cuda").to(dtype=torch.int64)
-        topk_weights = torch.randn(topk.shape,
-                                   dtype=torch.float32,
-                                   device="cuda")
-        return TestTensors(rank_tokens=rank_tokens,
-                           rank_token_scales=rank_token_scales,
-                           topk=topk,
-                           topk_weights=topk_weights,
-                           config=config)
+        topk = torch.randint(
+            low=0, high=config.num_experts, size=(config.m, config.topk), device="cuda"
+        ).to(dtype=torch.int64)
+        topk_weights = torch.randn(topk.shape, dtype=torch.float32, device="cuda")
+        return TestTensors(
+            rank_tokens=rank_tokens,
+            rank_token_scales=rank_token_scales,
+            topk=topk,
+            topk_weights=topk_weights,
+            config=config,
+        )
 
 
 def make_modular_kernel(
@@ -132,28 +132,33 @@ def make_modular_kernel(
     use_fp8_dispatch: bool,
     quant_config: FusedMoEQuantConfig,
 ) -> FusedMoEModularKernel:
-
     ht_args: Optional[DeepEPHTArgs] = None
     ll_args: Optional[DeepEPLLArgs] = None
 
     if low_latency_mode:
-        ll_args = DeepEPLLArgs(max_tokens_per_rank=MAX_TOKENS_PER_RANK,
-                               hidden_size=hidden_size,
-                               num_experts=num_experts,
-                               use_fp8_dispatch=use_fp8_dispatch)
+        ll_args = DeepEPLLArgs(
+            max_tokens_per_rank=MAX_TOKENS_PER_RANK,
+            hidden_size=hidden_size,
+            num_experts=num_experts,
+            use_fp8_dispatch=use_fp8_dispatch,
+        )
     else:
         assert not use_fp8_dispatch, (
-            "FP8 Dispatch is valid only for low-latency kernels")
+            "FP8 Dispatch is valid only for low-latency kernels"
+        )
         ht_args = DeepEPHTArgs(num_local_experts=num_local_experts)
 
-    a2a : Union[DeepEPHTPrepareAndFinalize, DeepEPLLPrepareAndFinalize] = \
-        make_deepep_a2a(pg = pg,
-                        pgi = pgi,
-                        dp_size = dp_size,
-                        q_dtype = q_dtype,
-                        block_shape = None,
-                        deepep_ht_args = ht_args,
-                        deepep_ll_args = ll_args)
+    a2a: Union[DeepEPHTPrepareAndFinalize, DeepEPLLPrepareAndFinalize] = (
+        make_deepep_a2a(
+            pg=pg,
+            pgi=pgi,
+            dp_size=dp_size,
+            q_dtype=q_dtype,
+            block_shape=None,
+            deepep_ht_args=ht_args,
+            deepep_ll_args=ll_args,
+        )
+    )
 
     num_dispatchers = pgi.world_size // dp_size
 
@@ -167,8 +172,7 @@ def make_modular_kernel(
     else:
         fused_experts = TritonExperts(quant_config=quant_config)
 
-    mk = FusedMoEModularKernel(prepare_finalize=a2a,
-                               fused_experts=fused_experts)
+    mk = FusedMoEModularKernel(prepare_finalize=a2a, fused_experts=fused_experts)
     return mk
 
 
@@ -186,19 +190,15 @@ def deep_ep_moe_impl(
     use_fp8_dispatch: bool,
     per_act_token_quant: bool,
 ) -> torch.Tensor:
-
     num_local_experts = w1.size(0)
 
     def build_expert_map():
         num_local_experts = w1.size(0)
-        expert_map = torch.full((num_experts, ),
-                                fill_value=-1,
-                                dtype=torch.int32)
+        expert_map = torch.full((num_experts,), fill_value=-1, dtype=torch.int32)
         s = pgi.rank * num_local_experts
         e = s + num_local_experts
         expert_map[s:e] = torch.tensor(list(range(num_local_experts)))
-        return expert_map.to(device=torch.cuda.current_device(),
-                             dtype=torch.int32)
+        return expert_map.to(device=torch.cuda.current_device(), dtype=torch.int32)
 
     hidden_size = test_tensors.rank_tokens.size(1)
     is_quantized = w1.dtype == torch.float8_e4m3fn
@@ -214,11 +214,12 @@ def process_chunk(chunk_start, chunk_end, skip_result_store=False):
         topk_weights_chunk = test_tensors.topk_weights[chunk_start:chunk_end]
         topk_chunk = test_tensors.topk[chunk_start:chunk_end]
         rank_token_scales_chunk = test_tensors.rank_token_scales
-        if rank_token_scales_chunk is not None and rank_token_scales_chunk.size(
-                0) == total_num_tokens:
+        if (
+            rank_token_scales_chunk is not None
+            and rank_token_scales_chunk.size(0) == total_num_tokens
+        ):
             # per act token
-            rank_token_scales_chunk = rank_token_scales_chunk[
-                chunk_start:chunk_end]
+            rank_token_scales_chunk = rank_token_scales_chunk[chunk_start:chunk_end]
 
         quant_config = FusedMoEQuantConfig.make(
             q_dtype,
@@ -230,26 +231,37 @@ def process_chunk(chunk_start, chunk_end, skip_result_store=False):
 
         # Make modular kernel
         mk: FusedMoEModularKernel = make_modular_kernel(
-            pg, pgi, low_latency_mode, hidden_size, dp_size, num_experts,
-            num_local_experts, q_dtype, use_fp8_dispatch, quant_config)
-
-        out = mk.forward(hidden_states=rank_tokens_chunk,
-                         w1=w1,
-                         w2=w2,
-                         topk_weights=topk_weights_chunk,
-                         topk_ids=topk_chunk,
-                         inplace=False,
-                         activation="silu",
-                         global_num_experts=num_experts,
-                         expert_map=build_expert_map(),
-                         apply_router_weight_on_input=False)
+            pg,
+            pgi,
+            low_latency_mode,
+            hidden_size,
+            dp_size,
+            num_experts,
+            num_local_experts,
+            q_dtype,
+            use_fp8_dispatch,
+            quant_config,
+        )
+
+        out = mk.forward(
+            hidden_states=rank_tokens_chunk,
+            w1=w1,
+            w2=w2,
+            topk_weights=topk_weights_chunk,
+            topk_ids=topk_chunk,
+            inplace=False,
+            activation="silu",
+            global_num_experts=num_experts,
+            expert_map=build_expert_map(),
+            apply_router_weight_on_input=False,
+        )
 
         if not skip_result_store:
-            out_hidden_states[chunk_start:chunk_end, :].copy_(
-                out, non_blocking=True)
+            out_hidden_states[chunk_start:chunk_end, :].copy_(out, non_blocking=True)
 
-    max_num_tokens_per_dp = (MAX_TOKENS_PER_RANK
-                             if low_latency_mode else total_num_tokens)
+    max_num_tokens_per_dp = (
+        MAX_TOKENS_PER_RANK if low_latency_mode else total_num_tokens
+    )
 
     for chunk_start_ in range(0, total_num_tokens, max_num_tokens_per_dp):
         chunk_start = chunk_start_
@@ -258,9 +270,9 @@ def process_chunk(chunk_start, chunk_end, skip_result_store=False):
         chunk_start = min(chunk_start, total_num_tokens - 1)
         chunk_end = min(chunk_end, total_num_tokens)
 
-        process_chunk(chunk_start,
-                      chunk_end,
-                      skip_result_store=chunk_start_ >= total_num_tokens)
+        process_chunk(
+            chunk_start, chunk_end, skip_result_store=chunk_start_ >= total_num_tokens
+        )
 
     return out_hidden_states
 
@@ -274,9 +286,11 @@ def torch_moe_impl(
     using_fp8_dispatch: bool,
     per_act_token_quant: bool,
 ):
-
-    a, topk_ids, topk_weights = (test_tensors.rank_tokens, test_tensors.topk,
-                                 test_tensors.topk_weights)
+    a, topk_ids, topk_weights = (
+        test_tensors.rank_tokens,
+        test_tensors.topk,
+        test_tensors.topk_weights,
+    )
     if using_fp8_dispatch:
         # The DeepEP implementation is requested to dispatch using FP8.
         # For numerical stability for testing, emulate the fp8 dispatch by
@@ -284,8 +298,11 @@ def torch_moe_impl(
         assert not per_act_token_quant
         a = test_tensors.rank_tokens
         aq, aq_scale = per_token_group_quant_fp8(a, 128)
-        a = (aq.view(-1, 128).to(torch.float32) * aq_scale.view(-1, 1)).view(
-            a.shape).to(a.dtype)
+        a = (
+            (aq.view(-1, 128).to(torch.float32) * aq_scale.view(-1, 1))
+            .view(a.shape)
+            .to(a.dtype)
+        )
 
     is_quantized = w1.dtype == torch.float8_e4m3fn
     a_dtype = a.dtype
@@ -306,8 +323,9 @@ def torch_moe_impl(
             e_w = topk_weights[i][j]
             w1_e = w1[e]
             w2_e = w2[e]
-            o_i += (SiluAndMul()
-                    (a_i @ w1_e.transpose(0, 1)) @ w2_e.transpose(0, 1)) * e_w
+            o_i += (
+                SiluAndMul()(a_i @ w1_e.transpose(0, 1)) @ w2_e.transpose(0, 1)
+            ) * e_w
 
     if is_quantized:
         out = out.to(dtype=a_dtype)
@@ -327,28 +345,36 @@ def _deep_ep_moe(
     use_fp8_dispatch: bool,
     per_act_token_quant: bool,
 ):
-
     if not low_latency_mode:
         assert not use_fp8_dispatch, (
-            "FP8 dispatch interface is available only in low-latency mode")
+            "FP8 dispatch interface is available only in low-latency mode"
+        )
 
     is_quantized = w1.dtype == torch.float8_e4m3fn
     w1 = w1.to(device=torch.cuda.current_device())
     w2 = w2.to(device=torch.cuda.current_device())
     if is_quantized:
         w1_scale = w1_scale.to(  # type: ignore
-            device=torch.cuda.current_device())
+            device=torch.cuda.current_device()
+        )
         w2_scale = w2_scale.to(  # type: ignore
-            device=torch.cuda.current_device())
+            device=torch.cuda.current_device()
+        )
 
     pg = torch.distributed.new_group(list(range(pgi.world_size)))
     test_tensors = TestTensors.make(config, low_latency_mode)
 
     with set_current_vllm_config(VllmConfig()):
         # Reference
-        torch_combined = torch_moe_impl(test_tensors, w1, w2, w1_scale,
-                                        w2_scale, use_fp8_dispatch,
-                                        per_act_token_quant)
+        torch_combined = torch_moe_impl(
+            test_tensors,
+            w1,
+            w2,
+            w1_scale,
+            w2_scale,
+            use_fp8_dispatch,
+            per_act_token_quant,
+        )
 
         # Splice experts for this rank.
         num_local_experts = config.num_experts // pgi.world_size
@@ -420,18 +446,23 @@ def test_deep_ep_moe(
 
     current_platform.seed_everything(7)
     world_size, dp_size = world_dp_size
-    config = TestConfig(dtype=dtype,
-                        topk=topk,
-                        m=m,
-                        k=k,
-                        n=n,
-                        num_experts=num_experts)
+    config = TestConfig(dtype=dtype, topk=topk, m=m, k=k, n=n, num_experts=num_experts)
 
     w1, w2, w1_scale, w2_scale = make_weights(num_experts, n, k, dtype)
 
-    parallel_launch(world_size, _deep_ep_moe, low_latency_mode, dp_size,
-                    config, w1, w2, w1_scale, w2_scale, use_fp8_dispatch,
-                    per_act_token_quant)
+    parallel_launch(
+        world_size,
+        _deep_ep_moe,
+        low_latency_mode,
+        dp_size,
+        config,
+        w1,
+        w2,
+        w1_scale,
+        w2_scale,
+        use_fp8_dispatch,
+        per_act_token_quant,
+    )
 
 
 MNKs = [
@@ -467,8 +498,7 @@ def test_low_latency_deep_ep_moe(
 ):
     low_latency_mode = True
 
-    if (low_latency_mode
-            and k not in DeepEPLLPrepareAndFinalize.SUPPORTED_HIDDEN_SIZES):
+    if low_latency_mode and k not in DeepEPLLPrepareAndFinalize.SUPPORTED_HIDDEN_SIZES:
         pytest.skip(
             f"Skipping test as hidden size {k} is not in list of supported "
             f"hidden sizes {DeepEPLLPrepareAndFinalize.SUPPORTED_HIDDEN_SIZES}"
@@ -476,15 +506,20 @@ def test_low_latency_deep_ep_moe(
 
     current_platform.seed_everything(7)
     world_size, dp_size = world_dp_size
-    config = TestConfig(dtype=dtype,
-                        topk=topk,
-                        m=m,
-                        k=k,
-                        n=n,
-                        num_experts=num_experts)
+    config = TestConfig(dtype=dtype, topk=topk, m=m, k=k, n=n, num_experts=num_experts)
 
     w1, w2, w1_scale, w2_scale = make_weights(num_experts, n, k, dtype)
 
-    parallel_launch(world_size, _deep_ep_moe, low_latency_mode, dp_size,
-                    config, w1, w2, w1_scale, w2_scale, use_fp8_dispatch,
-                    False)
+    parallel_launch(
+        world_size,
+        _deep_ep_moe,
+        low_latency_mode,
+        dp_size,
+        config,
+        w1,
+        w2,
+        w1_scale,
+        w2_scale,
+        use_fp8_dispatch,
+        False,
+    )
diff --git a/tests/kernels/moe/test_deepgemm.py b/tests/kernels/moe/test_deepgemm.py
index d575b6d4ca62..cad0085d5ba6 100644
--- a/tests/kernels/moe/test_deepgemm.py
+++ b/tests/kernels/moe/test_deepgemm.py
@@ -11,14 +11,18 @@
 import pytest
 import torch
 
-from vllm.model_executor.layers.fused_moe.config import (
-    fp8_w8a8_moe_quant_config)
+from vllm.model_executor.layers.fused_moe.config import fp8_w8a8_moe_quant_config
+
 # vLLM fused-expert reference (Triton fallback + DeepGEMM option)
 from vllm.model_executor.layers.fused_moe.fused_moe import fused_experts
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    per_token_group_quant_fp8)
-from vllm.utils.deep_gemm import (calc_diff, is_deep_gemm_supported,
-                                  per_block_cast_to_fp8)
+    per_token_group_quant_fp8,
+)
+from vllm.utils.deep_gemm import (
+    calc_diff,
+    is_deep_gemm_supported,
+    per_block_cast_to_fp8,
+)
 
 BLOCK_SIZE = [128, 128]
 
@@ -37,8 +41,10 @@ def make_block_quant_fp8_weights(
       w2 shape: (E, K, N)
     """
     dtype = torch.bfloat16
-    fp8_max, fp8_min = torch.finfo(torch.float8_e4m3fn).max, torch.finfo(
-        torch.float8_e4m3fn).min
+    fp8_max, fp8_min = (
+        torch.finfo(torch.float8_e4m3fn).max,
+        torch.finfo(torch.float8_e4m3fn).min,
+    )
 
     # bf16 reference weights
     w1_bf16 = torch.randn(e, 2 * n, k, device="cuda", dtype=dtype) / 10
@@ -54,24 +60,16 @@ def make_block_quant_fp8_weights(
 
     w1 = torch.empty_like(w1_bf16, dtype=torch.float8_e4m3fn)
     w2 = torch.empty_like(w2_bf16, dtype=torch.float8_e4m3fn)
-    w1_s = torch.empty(e,
-                       n_tiles_w1,
-                       k_tiles_w1,
-                       device="cuda",
-                       dtype=torch.float32)
-    w2_s = torch.empty(e,
-                       n_tiles_w2,
-                       k_tiles_w2,
-                       device="cuda",
-                       dtype=torch.float32)
+    w1_s = torch.empty(e, n_tiles_w1, k_tiles_w1, device="cuda", dtype=torch.float32)
+    w2_s = torch.empty(e, n_tiles_w2, k_tiles_w2, device="cuda", dtype=torch.float32)
 
     for i in range(e):
-        w1[i], w1_s[i] = per_block_cast_to_fp8(w1_bf16[i],
-                                               block_size=block_size,
-                                               use_ue8m0=True)
-        w2[i], w2_s[i] = per_block_cast_to_fp8(w2_bf16[i],
-                                               block_size=block_size,
-                                               use_ue8m0=True)
+        w1[i], w1_s[i] = per_block_cast_to_fp8(
+            w1_bf16[i], block_size=block_size, use_ue8m0=True
+        )
+        w2[i], w2_s[i] = per_block_cast_to_fp8(
+            w2_bf16[i], block_size=block_size, use_ue8m0=True
+        )
 
     return w1, w2, w1_s, w2_s
 
@@ -81,18 +79,17 @@ def run_single_case(m, n, k, topk, num_experts, block_size):
     Run one (M,N,K) configuration on a single GPU and assert DeepGEMM ==
     Triton baseline within tolerance.
     """
-    tokens_bf16 = torch.randn(
-        m, k, device="cuda", dtype=torch.bfloat16).clamp_min_(-1).clamp_max_(1)
+    tokens_bf16 = (
+        torch.randn(m, k, device="cuda", dtype=torch.bfloat16)
+        .clamp_min_(-1)
+        .clamp_max_(1)
+    )
     _, a1_scale = per_token_group_quant_fp8(tokens_bf16, block_size[1])
 
     # expert weight tensors
-    w1, w2, w1_s, w2_s = make_block_quant_fp8_weights(num_experts, n, k,
-                                                      block_size)
+    w1, w2, w1_s, w2_s = make_block_quant_fp8_weights(num_experts, n, k, block_size)
 
-    router_logits = torch.randn(m,
-                                num_experts,
-                                device="cuda",
-                                dtype=torch.float32)
+    router_logits = torch.randn(m, num_experts, device="cuda", dtype=torch.float32)
     topk_weights, topk_ids = torch.topk(router_logits, k=topk, dim=-1)
     topk_weights = torch.nn.functional.softmax(topk_weights, dim=-1)
 
@@ -147,15 +144,14 @@ def run_single_case(m, n, k, topk, num_experts, block_size):
 @pytest.mark.parametrize(("m", "n", "k"), MNKs)
 @pytest.mark.parametrize("topk", TOPKS)
 @pytest.mark.parametrize("num_experts", NUM_EXPERTS)
-@pytest.mark.skipif(not is_deep_gemm_supported(),
-                    reason="Requires deep_gemm kernels")
+@pytest.mark.skipif(not is_deep_gemm_supported(), reason="Requires deep_gemm kernels")
 def test_deepgemm_vs_triton(m, n, k, topk, num_experts, monkeypatch):
-
     with monkeypatch.context() as mp:
         mp.setenv("VLLM_USE_DEEP_GEMM", "1")
 
         _fused_moe_mod = importlib.import_module(
-            "vllm.model_executor.layers.fused_moe.fused_moe")
+            "vllm.model_executor.layers.fused_moe.fused_moe"
+        )
 
         call_counter = {"cnt": 0}
 
@@ -165,8 +161,7 @@ def _spy_deep_gemm_moe_fp8(*args, **kwargs):
             call_counter["cnt"] += 1
             return orig_fn(*args, **kwargs)
 
-        monkeypatch.setattr(_fused_moe_mod, "deep_gemm_moe_fp8",
-                            _spy_deep_gemm_moe_fp8)
+        monkeypatch.setattr(_fused_moe_mod, "deep_gemm_moe_fp8", _spy_deep_gemm_moe_fp8)
 
         if topk > num_experts:
             pytest.skip(f"topk={topk} > num_experts={num_experts}")
@@ -181,6 +176,7 @@ def _spy_deep_gemm_moe_fp8(*args, **kwargs):
         )
 
         # ensure that the DeepGEMM path was indeed taken.
-        assert call_counter["cnt"] == 1, \
-            f"DeepGEMM path was not executed during the test. " \
+        assert call_counter["cnt"] == 1, (
+            f"DeepGEMM path was not executed during the test. "
             f"Call counter: {call_counter['cnt']}"
+        )
diff --git a/tests/kernels/moe/test_flashinfer.py b/tests/kernels/moe/test_flashinfer.py
index c3be7f28fb24..0780232a8264 100644
--- a/tests/kernels/moe/test_flashinfer.py
+++ b/tests/kernels/moe/test_flashinfer.py
@@ -6,24 +6,28 @@
 import torch
 
 from vllm.config import ParallelConfig, VllmConfig, set_current_vllm_config
-from vllm.model_executor.layers.fused_moe.config import (
-    fp8_w8a8_moe_quant_config)
+from vllm.model_executor.layers.fused_moe.config import fp8_w8a8_moe_quant_config
 from vllm.model_executor.layers.fused_moe.fused_moe import fused_experts
 from vllm.model_executor.layers.fused_moe.layer import FusedMoE
 from vllm.model_executor.layers.quantization.utils.flashinfer_utils import (
-    apply_flashinfer_per_tensor_scale_fp8, flashinfer_cutlass_moe_fp8,
-    register_moe_scaling_factors, rotate_flashinfer_fp8_moe_weights,
-    swap_w13_to_w31)
-from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    input_to_float8)
+    apply_flashinfer_per_tensor_scale_fp8,
+    flashinfer_cutlass_moe_fp8,
+    register_moe_scaling_factors,
+    rotate_flashinfer_fp8_moe_weights,
+    swap_w13_to_w31,
+)
+from vllm.model_executor.layers.quantization.utils.fp8_utils import input_to_float8
 from vllm.model_executor.models.llama4 import Llama4MoE
 from vllm.platforms import current_platform
 from vllm.utils.flashinfer import has_flashinfer_cutlass_fused_moe
 
-if not has_flashinfer_cutlass_fused_moe(
-) or not current_platform.has_device_capability(100):
-    pytest.skip("Requires flashinfer_cutlass_fused_moe and nvfp4 support",
-                allow_module_level=True)
+if not has_flashinfer_cutlass_fused_moe() or not current_platform.has_device_capability(
+    100
+):
+    pytest.skip(
+        "Requires flashinfer_cutlass_fused_moe and nvfp4 support",
+        allow_module_level=True,
+    )
 
 NUM_EXPERTS = [16]
 TOP_KS = [1]
@@ -39,8 +43,7 @@
     (1, 4096, 5120),
 ]
 
-vllm_config = VllmConfig(parallel_config=ParallelConfig(
-    pipeline_parallel_size=1))
+vllm_config = VllmConfig(parallel_config=ParallelConfig(pipeline_parallel_size=1))
 vllm_config.scheduler_config.max_num_seqs = 128
 vllm_config.scheduler_config.max_model_len = 8192
 
@@ -74,18 +77,17 @@ class TestData:
     layer: torch.nn.Module
 
     @staticmethod
-    def make_moe_tensors_8bit(m: int, k: int, n: int, e: int,
-                              reorder: bool) -> "TestData":
-        hidden_states = torch.randn(
-            (m, k), device="cuda", dtype=torch.bfloat16) / 10
+    def make_moe_tensors_8bit(
+        m: int, k: int, n: int, e: int, reorder: bool
+    ) -> "TestData":
+        hidden_states = torch.randn((m, k), device="cuda", dtype=torch.bfloat16) / 10
         w13 = torch.randn((e, 2 * n, k), device="cuda", dtype=torch.bfloat16)
         w2 = torch.randn((e, k, n), device="cuda", dtype=torch.bfloat16)
 
         # Scale to fp8
         _, a1_scale = input_to_float8(hidden_states)
         a1_scale = 1.0 / a1_scale
-        a2_scale = torch.scalar_tensor(1.0).to(device="cuda").to(
-            dtype=torch.float32)
+        a2_scale = torch.scalar_tensor(1.0).to(device="cuda").to(dtype=torch.float32)
         w13_quantized, w13_weight_scale = quant_fp8_per_tensor_batches(w13)
         w2_quantized, w2_weight_scale = quant_fp8_per_tensor_batches(w2)
 
@@ -102,8 +104,7 @@ def make_moe_tensors_8bit(m: int, k: int, n: int, e: int,
         # flashinfer expects swapped rows for w13
         layer.w13_weight.data = swap_w13_to_w31(layer.w13_weight.data)
         if reorder:
-            rotate_flashinfer_fp8_moe_weights(layer.w13_weight,
-                                              layer.w2_weight)
+            rotate_flashinfer_fp8_moe_weights(layer.w13_weight, layer.w2_weight)
         layer.custom_routing_function = Llama4MoE.custom_routing_function
         layer.intermediate_size_per_partition = n
         layer.ep_rank = 0
@@ -145,7 +146,8 @@ def test_flashinfer_per_tensor_moe_fp8_no_graph(
             top_k=topk,
             renormalize=False,
             custom_routing_function=Llama4MoE.custom_routing_function,
-            scoring_func="softmax")
+            scoring_func="softmax",
+        )
 
         quant_config = fp8_w8a8_moe_quant_config(
             w1_scale=td.w13_weight_scale,
@@ -178,12 +180,10 @@ def test_flashinfer_per_tensor_moe_fp8_no_graph(
             top_k=topk,
             num_expert_group=None,
             topk_group=None,
-            apply_router_weight_on_input=True)
+            apply_router_weight_on_input=True,
+        )
 
-        torch.testing.assert_close(output,
-                                   flashinfer_output,
-                                   atol=5.5e-2,
-                                   rtol=1e-2)
+        torch.testing.assert_close(output, flashinfer_output, atol=5.5e-2, rtol=1e-2)
 
 
 @pytest.mark.skip(
@@ -213,7 +213,8 @@ def test_flashinfer_cutlass_moe_fp8_no_graph(
             top_k=topk,
             renormalize=False,
             custom_routing_function=Llama4MoE.custom_routing_function,
-            scoring_func="softmax")
+            scoring_func="softmax",
+        )
 
         quant_config = fp8_w8a8_moe_quant_config(
             w1_scale=td.w13_weight_scale,
@@ -250,7 +251,6 @@ def test_flashinfer_cutlass_moe_fp8_no_graph(
             apply_router_weight_on_input=True,
         )
 
-        torch.testing.assert_close(output,
-                                   flashinfer_cutlass_output,
-                                   atol=5.5e-2,
-                                   rtol=1e-2)
+        torch.testing.assert_close(
+            output, flashinfer_cutlass_output, atol=5.5e-2, rtol=1e-2
+        )
diff --git a/tests/kernels/moe/test_flashinfer_moe.py b/tests/kernels/moe/test_flashinfer_moe.py
index 8bf096b798cb..18cfd4f79092 100644
--- a/tests/kernels/moe/test_flashinfer_moe.py
+++ b/tests/kernels/moe/test_flashinfer_moe.py
@@ -4,26 +4,33 @@
 import torch
 
 from tests.kernels.moe.utils import make_test_quant_config
-from tests.kernels.quantization.nvfp4_utils import (FLOAT4_E2M1_MAX,
-                                                    FLOAT8_E4M3_MAX,
-                                                    dequantize_nvfp4_to_dtype)
+from tests.kernels.quantization.nvfp4_utils import (
+    FLOAT4_E2M1_MAX,
+    FLOAT8_E4M3_MAX,
+    dequantize_nvfp4_to_dtype,
+)
 from tests.kernels.utils import torch_moe
 from vllm import _custom_ops as ops
 from vllm.config import ParallelConfig, VllmConfig, set_current_vllm_config
 from vllm.model_executor.layers.fused_moe.flashinfer_cutlass_moe import (
-    FlashInferExperts, is_valid_flashinfer_cutlass_fused_moe)
+    FlashInferExperts,
+    is_valid_flashinfer_cutlass_fused_moe,
+)
 from vllm.model_executor.layers.fused_moe.fused_moe import fused_topk
-from vllm.model_executor.layers.fused_moe.modular_kernel import (
-    FusedMoEModularKernel)
+from vllm.model_executor.layers.fused_moe.modular_kernel import FusedMoEModularKernel
 from vllm.model_executor.layers.fused_moe.prepare_finalize import (
-    MoEPrepareAndFinalizeNoEP)
+    MoEPrepareAndFinalizeNoEP,
+)
 from vllm.platforms import current_platform
 from vllm.utils.flashinfer import has_flashinfer_cutlass_fused_moe
 
-if not has_flashinfer_cutlass_fused_moe(
-) or not current_platform.has_device_capability(100):
-    pytest.skip("Requires flashinfer_cutlass_fused_moe and nvfp4 support",
-                allow_module_level=True)
+if not has_flashinfer_cutlass_fused_moe() or not current_platform.has_device_capability(
+    100
+):
+    pytest.skip(
+        "Requires flashinfer_cutlass_fused_moe and nvfp4 support",
+        allow_module_level=True,
+    )
 
 MNK_FACTORS = [
     (2, 1024, 1024),
@@ -44,13 +51,13 @@
 @pytest.mark.parametrize("topk", [1, 6, 8])
 @pytest.mark.parametrize("dtype", [torch.half, torch.bfloat16])
 @torch.inference_mode()
-def test_flashinfer_fp4_moe_no_graph(m: int, n: int, k: int, e: int, topk: int,
-                                     dtype: torch.dtype):
+def test_flashinfer_fp4_moe_no_graph(
+    m: int, n: int, k: int, e: int, topk: int, dtype: torch.dtype
+):
     current_platform.seed_everything(7)
     with set_current_vllm_config(
-            VllmConfig(parallel_config=ParallelConfig(
-                pipeline_parallel_size=1))):
-
+        VllmConfig(parallel_config=ParallelConfig(pipeline_parallel_size=1))
+    ):
         a = torch.randn((m, k), device="cuda", dtype=dtype) / 10
 
         quant_blocksize = 16
@@ -66,10 +73,7 @@ def test_flashinfer_fp4_moe_no_graph(m: int, n: int, k: int, e: int, topk: int,
         )
 
         score = torch.randn((m, e), device="cuda", dtype=dtype)
-        topk_weights, topk_ids, _ = fused_topk(a,
-                                               score,
-                                               topk,
-                                               renormalize=False)
+        topk_weights, topk_ids, _ = fused_topk(a, score, topk, renormalize=False)
 
         assert is_valid_flashinfer_cutlass_fused_moe(a, w1_q, w2_q)
 
@@ -87,16 +91,19 @@ def test_flashinfer_fp4_moe_no_graph(m: int, n: int, k: int, e: int, topk: int,
         )
 
         # Reference check:
-        a_global_scale = ((FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) /
-                          torch.amax(a.flatten(), dim=-1)).to(torch.float32)
+        a_global_scale = (
+            (FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) / torch.amax(a.flatten(), dim=-1)
+        ).to(torch.float32)
         a_fp4, a_scale_interleaved = ops.scaled_fp4_quant(a, a_global_scale)
         _, m_k = a_fp4.shape
-        a_in_dtype = dequantize_nvfp4_to_dtype(a_fp4,
-                                               a_scale_interleaved,
-                                               a_global_scale,
-                                               dtype=a.dtype,
-                                               device=a.device,
-                                               block_size=quant_blocksize)
+        a_in_dtype = dequantize_nvfp4_to_dtype(
+            a_fp4,
+            a_scale_interleaved,
+            a_global_scale,
+            dtype=a.dtype,
+            device=a.device,
+            block_size=quant_blocksize,
+        )
 
         w1_d = torch.empty((e, 2 * n, k), device="cuda", dtype=dtype)
         w2_d = torch.empty((e, k, n), device="cuda", dtype=dtype)
@@ -104,23 +111,26 @@ def test_flashinfer_fp4_moe_no_graph(m: int, n: int, k: int, e: int, topk: int,
         for idx in range(0, e):
             w1_d[idx] = dequantize_nvfp4_to_dtype(
                 w1_q[idx],
-                quant_config.w1_scale[idx], (1 / quant_config.g1_alphas[idx]),
+                quant_config.w1_scale[idx],
+                (1 / quant_config.g1_alphas[idx]),
                 dtype=dtype,
                 device=w1_q.device,
-                block_size=quant_blocksize)
+                block_size=quant_blocksize,
+            )
             w2_d[idx] = dequantize_nvfp4_to_dtype(
                 w2_q[idx],
-                quant_config.w2_scale[idx], (1 / quant_config.g2_alphas[idx]),
+                quant_config.w2_scale[idx],
+                (1 / quant_config.g2_alphas[idx]),
                 dtype=dtype,
                 device=w2_q.device,
-                block_size=quant_blocksize)
+                block_size=quant_blocksize,
+            )
 
         torch_output = torch_moe(a_in_dtype, w1_d, w2_d, score, topk)
 
-        torch.testing.assert_close(torch_output,
-                                   flashinfer_output,
-                                   atol=1e-1,
-                                   rtol=1e-1)
+        torch.testing.assert_close(
+            torch_output, flashinfer_output, atol=1e-1, rtol=1e-1
+        )
 
 
 if __name__ == "__main__":
diff --git a/tests/kernels/moe/test_gpt_oss_triton_kernels.py b/tests/kernels/moe/test_gpt_oss_triton_kernels.py
index 024993c7677d..f78596d220bf 100644
--- a/tests/kernels/moe/test_gpt_oss_triton_kernels.py
+++ b/tests/kernels/moe/test_gpt_oss_triton_kernels.py
@@ -17,20 +17,21 @@
 import triton_kernels.swiglu
 from triton_kernels.matmul_ogs import FlexCtx, PrecisionConfig
 from triton_kernels.numerics import InFlexData
-from triton_kernels.numerics_details.mxfp import (downcast_to_mxfp,
-                                                  upcast_from_mxfp)
+from triton_kernels.numerics_details.mxfp import downcast_to_mxfp, upcast_from_mxfp
 from triton_kernels.tensor import FP4, convert_layout, wrap_torch_tensor
 from triton_kernels.tensor_details import layout
 from triton_kernels.testing import assert_close
 
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.fused_moe.fused_batched_moe import (
-    BatchedPrepareAndFinalize)
+    BatchedPrepareAndFinalize,
+)
 from vllm.model_executor.layers.fused_moe.fused_moe import fused_topk
 from vllm.model_executor.layers.fused_moe.gpt_oss_triton_kernels_moe import (
-    BatchedOAITritonExperts, triton_kernel_moe_forward)
-from vllm.model_executor.layers.fused_moe.modular_kernel import (
-    FusedMoEModularKernel)
+    BatchedOAITritonExperts,
+    triton_kernel_moe_forward,
+)
+from vllm.model_executor.layers.fused_moe.modular_kernel import FusedMoEModularKernel
 from vllm.model_executor.layers.utils import shuffle_weight
 from vllm.utils import round_up
 
@@ -46,13 +47,11 @@ def deshuffle(w: torch.Tensor):
 def init_compute_data(M, K, N, E, a_dtype: str, w_dtype: str, num_warps: int):
     randbits = [torch.randperm(E) for _ in range(M)]
     x_list = [
-        (-1)**i *
-        ((16384 +
-          ((i * 512) % 4096) + bits).to(torch.int16).view(torch.bfloat16))
+        (-1) ** i
+        * ((16384 + ((i * 512) % 4096) + bits).to(torch.int16).view(torch.bfloat16))
         for i, bits in enumerate(randbits)
     ]
-    exp_data = torch.stack(x_list).to(
-        device="cuda")  # simulating gate_output (M, E)
+    exp_data = torch.stack(x_list).to(device="cuda")  # simulating gate_output (M, E)
 
     # create input tensor
     x = torch.randn((M, K), dtype=torch.bfloat16, device="cuda")
@@ -120,20 +119,21 @@ def init_compute_data(M, K, N, E, a_dtype: str, w_dtype: str, num_warps: int):
             value=0,
         )
 
-        w1_bias_tri = F.pad(w1_bias_tri, (0, w1_right_pad, 0, 0),
-                            mode="constant",
-                            value=0)
-        w2_bias_tri = F.pad(w2_bias_tri, (0, w2_right_pad, 0, 0),
-                            mode="constant",
-                            value=0)
+        w1_bias_tri = F.pad(
+            w1_bias_tri, (0, w1_right_pad, 0, 0), mode="constant", value=0
+        )
+        w2_bias_tri = F.pad(
+            w2_bias_tri, (0, w2_right_pad, 0, 0), mode="constant", value=0
+        )
 
         x_tri = F.pad(x_tri, (0, x_pad, 0, 0), mode="constant", value=0)
 
-        w_layout, w_layout_opts = layout.make_default_matmul_mxfp4_w_layout(
-            mx_axis=1)
+        w_layout, w_layout_opts = layout.make_default_matmul_mxfp4_w_layout(mx_axis=1)
         w_scale_layout, w_scale_layout_opts = (
             layout.make_default_matmul_mxfp4_w_scale_layout(
-                mx_axis=1, num_warps=num_warps))
+                mx_axis=1, num_warps=num_warps
+            )
+        )
 
         w1_tri, w1_scale_tri = downcast_to_mxfp(w1_tri, torch.uint8, axis=1)
         w1 = upcast_from_mxfp(w1_tri, w1_scale_tri, torch.bfloat16, axis=1)
@@ -141,29 +141,33 @@ def init_compute_data(M, K, N, E, a_dtype: str, w_dtype: str, num_warps: int):
         w2_tri, w2_scale_tri = downcast_to_mxfp(w2_tri, torch.uint8, axis=1)
         w2 = upcast_from_mxfp(w2_tri, w2_scale_tri, torch.bfloat16, axis=1)
 
-        w1_tri = convert_layout(wrap_torch_tensor(w1_tri, FP4), w_layout,
-                                **w_layout_opts)
+        w1_tri = convert_layout(
+            wrap_torch_tensor(w1_tri, FP4), w_layout, **w_layout_opts
+        )
         w1_scale_tri = convert_layout(
             wrap_torch_tensor(w1_scale_tri),
             w_scale_layout,
             **w_scale_layout_opts,
         )
 
-        w2_tri = convert_layout(wrap_torch_tensor(w2_tri, FP4), w_layout,
-                                **w_layout_opts)
+        w2_tri = convert_layout(
+            wrap_torch_tensor(w2_tri, FP4), w_layout, **w_layout_opts
+        )
         w2_scale_tri = convert_layout(
             wrap_torch_tensor(w2_scale_tri),
             w_scale_layout,
             **w_scale_layout_opts,
         )
 
-        pc1 = PrecisionConfig(weight_scale=w1_scale_tri,
-                              flex_ctx=FlexCtx(rhs_data=InFlexData()))
-        pc2 = PrecisionConfig(weight_scale=w2_scale_tri,
-                              flex_ctx=FlexCtx(rhs_data=InFlexData()))
+        pc1 = PrecisionConfig(
+            weight_scale=w1_scale_tri, flex_ctx=FlexCtx(rhs_data=InFlexData())
+        )
+        pc2 = PrecisionConfig(
+            weight_scale=w2_scale_tri, flex_ctx=FlexCtx(rhs_data=InFlexData())
+        )
 
         # tucuate so the rest can run properly
-        w1 = w1[..., :K, :2 * N]
+        w1 = w1[..., :K, : 2 * N]
         w2 = w2[..., :N, :K]
 
         w1 = deshuffle(w1)
@@ -261,7 +265,8 @@ class Case:
 @pytest.mark.parametrize(
     ", ".join(f.name for f in fields(Case)),
     [
-        tuple(getattr(case, f.name) for f in fields(Case)) for case in [
+        tuple(getattr(case, f.name) for f in fields(Case))
+        for case in [
             # Case(a_dtype="bf16", w_dtype="bf16"),
             # Case(a_dtype="fp8_e4m3", w_dtype="fp8_e5m2"),
             Case(a_dtype="bf16", w_dtype="mx4")
@@ -321,10 +326,7 @@ def test_equiv(num_token, a_dtype, w_dtype, tp):
         gating_output=exp_data,
         topk=topk,
     )
-    assert_close(ref=out_ref,
-                 tri=out_triton_monolithic,
-                 maxtol=0.025,
-                 rmstol=0.005)
+    assert_close(ref=out_ref, tri=out_triton_monolithic, maxtol=0.025, rmstol=0.005)
 
 
 def batched_moe(
@@ -376,7 +378,8 @@ def batched_moe(
 @pytest.mark.parametrize(
     ", ".join(f.name for f in fields(Case)),
     [
-        tuple(getattr(case, f.name) for f in fields(Case)) for case in [
+        tuple(getattr(case, f.name) for f in fields(Case))
+        for case in [
             # Case(a_dtype="bf16", w_dtype="bf16"),
             # Case(a_dtype="fp8_e4m3", w_dtype="fp8_e5m2"),
             Case(a_dtype="bf16", w_dtype="mx4")
diff --git a/tests/kernels/moe/test_grouped_topk.py b/tests/kernels/moe/test_grouped_topk.py
index 646e763194fd..3f4f142be767 100644
--- a/tests/kernels/moe/test_grouped_topk.py
+++ b/tests/kernels/moe/test_grouped_topk.py
@@ -4,16 +4,20 @@
 
 Run `pytest tests/kernels/moe/test_grouped_topk.py`.
 """
+
 import pytest
 import torch
 
-from vllm.model_executor.layers.fused_moe.fused_moe import (fused_grouped_topk,
-                                                            grouped_topk)
+from vllm.model_executor.layers.fused_moe.fused_moe import (
+    fused_grouped_topk,
+    grouped_topk,
+)
 from vllm.platforms import current_platform
 
 
-@pytest.mark.skipif(not current_platform.is_cuda(),
-                    reason="This test is skipped on non-CUDA platform.")
+@pytest.mark.skipif(
+    not current_platform.is_cuda(), reason="This test is skipped on non-CUDA platform."
+)
 @pytest.mark.parametrize("n_token", [1, 33, 64])
 @pytest.mark.parametrize("n_hidden", [1024, 2048])
 @pytest.mark.parametrize("n_expert", [16])
@@ -23,23 +27,26 @@
 @pytest.mark.parametrize("topk_group", [2])
 @pytest.mark.parametrize("scoring_func", ["softmax", "sigmoid"])
 @pytest.mark.parametrize("routed_scaling_factor", [1.0, 2.5])
-@pytest.mark.parametrize("dtype",
-                         [torch.float16, torch.bfloat16, torch.float32])
-def test_grouped_topk(monkeypatch: pytest.MonkeyPatch, n_token: int,
-                      n_hidden: int, n_expert: int, topk: int,
-                      renormalize: bool, num_expert_group: int,
-                      topk_group: int, scoring_func: str,
-                      routed_scaling_factor: float, dtype: torch.dtype):
+@pytest.mark.parametrize("dtype", [torch.float16, torch.bfloat16, torch.float32])
+def test_grouped_topk(
+    monkeypatch: pytest.MonkeyPatch,
+    n_token: int,
+    n_hidden: int,
+    n_expert: int,
+    topk: int,
+    renormalize: bool,
+    num_expert_group: int,
+    topk_group: int,
+    scoring_func: str,
+    routed_scaling_factor: float,
+    dtype: torch.dtype,
+):
     current_platform.seed_everything(0)
-    hidden_states = torch.randn((n_token, n_hidden),
-                                dtype=dtype,
-                                device="cuda")
-    gating_output = torch.randn((n_token, n_expert),
-                                dtype=dtype,
-                                device="cuda")
-    e_score_correction_bias = torch.randn((n_expert, ),
-                                          dtype=torch.float32,
-                                          device="cuda")
+    hidden_states = torch.randn((n_token, n_hidden), dtype=dtype, device="cuda")
+    gating_output = torch.randn((n_token, n_expert), dtype=dtype, device="cuda")
+    e_score_correction_bias = torch.randn(
+        (n_expert,), dtype=torch.float32, device="cuda"
+    )
 
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_FUSED_MOE_GROUPED_TOPK", "0")
@@ -52,7 +59,8 @@ def test_grouped_topk(monkeypatch: pytest.MonkeyPatch, n_token: int,
             topk_group=topk_group,
             scoring_func=scoring_func,
             routed_scaling_factor=routed_scaling_factor,
-            e_score_correction_bias=e_score_correction_bias)
+            e_score_correction_bias=e_score_correction_bias,
+        )
 
         test_topk_weights, test_topk_ids = fused_grouped_topk(
             hidden_states=hidden_states,
@@ -63,14 +71,11 @@ def test_grouped_topk(monkeypatch: pytest.MonkeyPatch, n_token: int,
             topk_group=topk_group,
             scoring_func=scoring_func,
             routed_scaling_factor=routed_scaling_factor,
-            e_score_correction_bias=e_score_correction_bias)
+            e_score_correction_bias=e_score_correction_bias,
+        )
 
         if renormalize:
-            torch.testing.assert_close(baseline_topk_weights,
-                                       test_topk_weights,
-                                       atol=2e-2,
-                                       rtol=0)
-        torch.testing.assert_close(baseline_topk_ids,
-                                   test_topk_ids,
-                                   atol=0,
-                                   rtol=0)
+            torch.testing.assert_close(
+                baseline_topk_weights, test_topk_weights, atol=2e-2, rtol=0
+            )
+        torch.testing.assert_close(baseline_topk_ids, test_topk_ids, atol=0, rtol=0)
diff --git a/tests/kernels/moe/test_modular_kernel_combinations.py b/tests/kernels/moe/test_modular_kernel_combinations.py
index 1c7e62d7aa4c..fdd46d7e1b7b 100644
--- a/tests/kernels/moe/test_modular_kernel_combinations.py
+++ b/tests/kernels/moe/test_modular_kernel_combinations.py
@@ -17,18 +17,29 @@
 from vllm.utils.flashinfer import has_flashinfer_cutlass_fused_moe
 
 from ...utils import multi_gpu_test
-from .modular_kernel_tools.common import (Config, RankTensors, WeightTensors,
-                                          reference_moe_impl,
-                                          run_modular_kernel)
+from .modular_kernel_tools.common import (
+    Config,
+    RankTensors,
+    WeightTensors,
+    reference_moe_impl,
+    run_modular_kernel,
+)
 from .modular_kernel_tools.mk_objects import (
-    MK_FUSED_EXPERT_TYPES, MK_MULTI_GPU_PREPARE_FINALIZE_TYPES,
-    MK_QUANT_CONFIGS, MK_SINGLE_GPU_PREPARE_FINALIZE_TYPES, TestMoEQuantConfig,
-    expert_info)
-from .modular_kernel_tools.parallel_utils import (ProcessGroupInfo,
-                                                  parallel_launch_with_config)
+    MK_FUSED_EXPERT_TYPES,
+    MK_MULTI_GPU_PREPARE_FINALIZE_TYPES,
+    MK_QUANT_CONFIGS,
+    MK_SINGLE_GPU_PREPARE_FINALIZE_TYPES,
+    TestMoEQuantConfig,
+    expert_info,
+)
+from .modular_kernel_tools.parallel_utils import (
+    ProcessGroupInfo,
+    parallel_launch_with_config,
+)
 
-has_any_multi_gpu_package = (has_deep_ep() or has_deep_gemm() or has_pplx()
-                             or has_flashinfer_cutlass_fused_moe())
+has_any_multi_gpu_package = (
+    has_deep_ep() or has_deep_gemm() or has_pplx() or has_flashinfer_cutlass_fused_moe()
+)
 
 meets_multi_gpu_requirements = pytest.mark.skipif(
     not has_any_multi_gpu_package,
@@ -64,9 +75,9 @@ def rank_worker(
 
     # sanity check
     from vllm import envs
+
     if base_config.fused_moe_chunk_size is not None:
-        assert (
-            base_config.fused_moe_chunk_size == envs.VLLM_FUSED_MOE_CHUNK_SIZE)
+        assert base_config.fused_moe_chunk_size == envs.VLLM_FUSED_MOE_CHUNK_SIZE
 
     # get weights to this device
     weights.to_current_device()
@@ -93,8 +104,7 @@ def rank_worker(
             rank_tensors = RankTensors.make(config, pgi)
 
             # modular kernel out
-            mk_out = run_modular_kernel(pgi, vllm_config, config, weights,
-                                        rank_tensors)
+            mk_out = run_modular_kernel(pgi, vllm_config, config, weights, rank_tensors)
 
             with set_current_vllm_config(vllm_config):
                 ref_out = reference_moe_impl(config, weights, rank_tensors)
@@ -115,10 +125,10 @@ def rank_worker(
     if len(exceptions) > 0:
         raise RuntimeError(
             f"{len(exceptions)} of {count} tests failed in child process, "
-            f"rank={pgi.rank}.")
+            f"rank={pgi.rank}."
+        )
     else:
-        print(f"{count} of {count} tests passed in child process, "
-              f"rank={pgi.rank}.")
+        print(f"{count} of {count} tests passed in child process, rank={pgi.rank}.")
 
 
 def run(config: Config, verbose: bool):
@@ -127,8 +137,9 @@ def run(config: Config, verbose: bool):
     weights: WeightTensors = WeightTensors.make(config)
 
     vllm_config, env_dict = config.make_env_data()
-    parallel_launch_with_config(config.world_size, rank_worker, vllm_config,
-                                env_dict, config, weights, verbose)
+    parallel_launch_with_config(
+        config.world_size, rank_worker, vllm_config, env_dict, config, weights, verbose
+    )
 
 
 Ms = [32, 64]
@@ -149,8 +160,9 @@ def is_nyi_config(config: Config) -> bool:
     if info.needs_matching_quant:
         # The triton kernels expect both per-act-token-quant and
         # per-out-ch-quant or neither.
-        unsupported_quant_config = ((config.is_per_act_token_quant +
-                                     config.is_per_out_ch_quant) == 1)
+        unsupported_quant_config = (
+            config.is_per_act_token_quant + config.is_per_out_ch_quant
+        ) == 1
         return unsupported_quant_config
 
     return not info.supports_expert_map
@@ -162,19 +174,25 @@ def is_nyi_config(config: Config) -> bool:
 @pytest.mark.parametrize("dtype", DTYPEs)
 @pytest.mark.parametrize("quant_config", MK_QUANT_CONFIGS)
 @pytest.mark.parametrize(
-    "combination",
-    product(MK_MULTI_GPU_PREPARE_FINALIZE_TYPES, MK_FUSED_EXPERT_TYPES))
+    "combination", product(MK_MULTI_GPU_PREPARE_FINALIZE_TYPES, MK_FUSED_EXPERT_TYPES)
+)
 @pytest.mark.parametrize("fused_moe_chunk_size", FUSED_MOE_CHUNK_SIZEs)
 @pytest.mark.parametrize("world_size", [2])
 @multi_gpu_test(num_gpus=2)
 @meets_multi_gpu_requirements
 def test_modular_kernel_combinations_multigpu(
-        k: int, n: int, e: int, dtype: torch.dtype,
-        quant_config: Optional[TestMoEQuantConfig],
-        combination: tuple[mk.FusedMoEPrepareAndFinalize,
-                           mk.FusedMoEPermuteExpertsUnpermute],
-        fused_moe_chunk_size: Optional[int], world_size: int, pytestconfig):
-
+    k: int,
+    n: int,
+    e: int,
+    dtype: torch.dtype,
+    quant_config: Optional[TestMoEQuantConfig],
+    combination: tuple[
+        mk.FusedMoEPrepareAndFinalize, mk.FusedMoEPermuteExpertsUnpermute
+    ],
+    fused_moe_chunk_size: Optional[int],
+    world_size: int,
+    pytestconfig,
+):
     config = Config(
         Ms=Ms,
         K=k,
@@ -195,7 +213,7 @@ def test_modular_kernel_combinations_multigpu(
     if is_nyi_config(config):
         pytest.skip(f"Tests config {config} is nyi. Skipping ...")
 
-    verbosity = pytestconfig.getoption('verbose')
+    verbosity = pytestconfig.getoption("verbose")
     run(config, verbosity > 0)
 
 
@@ -205,16 +223,23 @@ def test_modular_kernel_combinations_multigpu(
 @pytest.mark.parametrize("dtype", DTYPEs)
 @pytest.mark.parametrize("quant_config", MK_QUANT_CONFIGS)
 @pytest.mark.parametrize(
-    "combination",
-    product(MK_SINGLE_GPU_PREPARE_FINALIZE_TYPES, MK_FUSED_EXPERT_TYPES))
+    "combination", product(MK_SINGLE_GPU_PREPARE_FINALIZE_TYPES, MK_FUSED_EXPERT_TYPES)
+)
 @pytest.mark.parametrize("fused_moe_chunk_size", FUSED_MOE_CHUNK_SIZEs)
 @pytest.mark.parametrize("world_size", [1])
 def test_modular_kernel_combinations_singlegpu(
-        k: int, n: int, e: int, dtype: torch.dtype,
-        quant_config: Optional[TestMoEQuantConfig],
-        combination: tuple[mk.FusedMoEPrepareAndFinalize,
-                           mk.FusedMoEPermuteExpertsUnpermute],
-        fused_moe_chunk_size: Optional[int], world_size: int, pytestconfig):
+    k: int,
+    n: int,
+    e: int,
+    dtype: torch.dtype,
+    quant_config: Optional[TestMoEQuantConfig],
+    combination: tuple[
+        mk.FusedMoEPrepareAndFinalize, mk.FusedMoEPermuteExpertsUnpermute
+    ],
+    fused_moe_chunk_size: Optional[int],
+    world_size: int,
+    pytestconfig,
+):
     config = Config(
         Ms=Ms,
         K=k,
@@ -235,19 +260,21 @@ def test_modular_kernel_combinations_singlegpu(
     if is_nyi_config(config):
         pytest.skip(f"Tests config {config} is nyi. Skipping ...")
 
-    verbosity = pytestconfig.getoption('verbose')
+    verbosity = pytestconfig.getoption("verbose")
     run(config, verbosity > 0)
 
 
-if __name__ == '__main__':
+if __name__ == "__main__":
     # Ability to test individual PrepareAndFinalize and FusedExperts combination
-    from .modular_kernel_tools.cli_args import (make_config,
-                                                make_config_arg_parser)
-    parser = make_config_arg_parser(description=(
-        "Run single prepare-finalize & fused-experts combination test"
-        "Example : python3 -m tests.kernels.moe.test_modular_kernel_combinations "  #noqa: E501
-        "--pf-type PplxPrepareAndFinalize --experts-type BatchedTritonExperts"
-    ))
+    from .modular_kernel_tools.cli_args import make_config, make_config_arg_parser
+
+    parser = make_config_arg_parser(
+        description=(
+            "Run single prepare-finalize & fused-experts combination test"
+            "Example : python3 -m tests.kernels.moe.test_modular_kernel_combinations "  # noqa: E501
+            "--pf-type PplxPrepareAndFinalize --experts-type BatchedTritonExperts"
+        )
+    )
     args = parser.parse_args()
     config = make_config(args)
 
diff --git a/tests/kernels/moe/test_moe.py b/tests/kernels/moe/test_moe.py
index 00835bec9a15..8dcefa9f7a04 100644
--- a/tests/kernels/moe/test_moe.py
+++ b/tests/kernels/moe/test_moe.py
@@ -4,6 +4,7 @@
 
 Run `pytest tests/kernels/test_moe.py`.
 """
+
 import functools
 from typing import Callable, Optional, Union
 
@@ -21,22 +22,32 @@
 from vllm.distributed.parallel_state import init_distributed_environment
 from vllm.forward_context import set_forward_context
 from vllm.model_executor.layers.fused_moe.config import (
-    FUSED_MOE_UNQUANTIZED_CONFIG, int4_w4a16_moe_quant_config,
-    int8_w8a16_moe_quant_config)
+    FUSED_MOE_UNQUANTIZED_CONFIG,
+    int4_w4a16_moe_quant_config,
+    int8_w8a16_moe_quant_config,
+)
 from vllm.model_executor.layers.fused_moe.fused_moe import (
-    fused_topk, modular_triton_fused_moe)
+    fused_topk,
+    modular_triton_fused_moe,
+)
 from vllm.model_executor.layers.fused_moe.moe_torch_iterative import (
-    fused_moe as iterative_moe)
+    fused_moe as iterative_moe,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-    marlin_permute_bias)
+    marlin_permute_bias,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp4 import (
-    rand_marlin_weight_mxfp4_like, rand_marlin_weight_nvfp4_like)
+    rand_marlin_weight_mxfp4_like,
+    rand_marlin_weight_nvfp4_like,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp8 import (
-    marlin_quant_fp8_torch)
+    marlin_quant_fp8_torch,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_test import (
-    awq_marlin_quantize, marlin_quantize)
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    quantize_weights)
+    awq_marlin_quantize,
+    marlin_quantize,
+)
+from vllm.model_executor.layers.quantization.utils.quant_utils import quantize_weights
 from vllm.model_executor.models.mixtral import MixtralMoE
 from vllm.platforms import current_platform
 from vllm.scalar_type import ScalarType, scalar_types
@@ -87,13 +98,15 @@ def run_moe_test(
     if isinstance(baseline, torch.Tensor):
         baseline_output = baseline
     else:
-        baseline_output = baseline(a,
-                                   w1,
-                                   w2,
-                                   score,
-                                   topk,
-                                   global_num_experts=global_num_experts,
-                                   expert_map=expert_map)
+        baseline_output = baseline(
+            a,
+            w1,
+            w2,
+            score,
+            topk,
+            global_num_experts=global_num_experts,
+            expert_map=expert_map,
+        )
 
     # Pad the weight if moe padding is enabled
     if padding:
@@ -105,34 +118,35 @@ def run_moe_test(
         torch._dynamo.mark_dynamic(a, 0)
         torch._dynamo.mark_dynamic(score, 0)
 
-    test_output = moe_fn(a,
-                         w1,
-                         w2,
-                         score,
-                         topk,
-                         global_num_experts=global_num_experts,
-                         expert_map=expert_map)
+    test_output = moe_fn(
+        a,
+        w1,
+        w2,
+        score,
+        topk,
+        global_num_experts=global_num_experts,
+        expert_map=expert_map,
+    )
 
     if use_cudagraph:
         test_output.fill_(0)
         stream = torch.cuda.Stream()
         graph = torch.cuda.CUDAGraph()
         with torch.cuda.graph(graph, stream=stream):
-            test_output = moe_fn(a,
-                                 w1,
-                                 w2,
-                                 score,
-                                 topk,
-                                 global_num_experts=global_num_experts,
-                                 expert_map=expert_map)
+            test_output = moe_fn(
+                a,
+                w1,
+                w2,
+                score,
+                topk,
+                global_num_experts=global_num_experts,
+                expert_map=expert_map,
+            )
         torch.cuda.synchronize()
         graph.replay()
         torch.cuda.synchronize()
 
-    torch.testing.assert_close(test_output,
-                               baseline_output,
-                               atol=atol,
-                               rtol=rtol)
+    torch.testing.assert_close(test_output, baseline_output, atol=atol, rtol=rtol)
 
     return baseline_output
 
@@ -176,11 +190,8 @@ def test_fused_moe(
 
     if ep_size > 1:
         local_e = e // ep_size
-        e_ids = torch.randint(0,
-                              e, (local_e, ),
-                              device="cuda",
-                              dtype=torch.int32)
-        e_map = torch.full((e, ), -1, device="cuda", dtype=torch.int32)
+        e_ids = torch.randint(0, e, (local_e,), device="cuda", dtype=torch.int32)
+        e_map = torch.full((e,), -1, device="cuda", dtype=torch.int32)
         e_map[e_ids] = torch.arange(local_e, device="cuda", dtype=torch.int32)
         w1 = w1[e_ids]
         w2 = w2[e_ids]
@@ -204,13 +215,15 @@ def m_fused_moe(
         expert_map: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
         topk_weights, topk_ids, _ = fused_topk(a, score, topk, False)
-        return m_fused_moe_fn(a,
-                              w1,
-                              w2,
-                              topk_weights,
-                              topk_ids,
-                              global_num_experts=global_num_experts,
-                              expert_map=expert_map)
+        return m_fused_moe_fn(
+            a,
+            w1,
+            w2,
+            topk_weights,
+            topk_ids,
+            global_num_experts=global_num_experts,
+            expert_map=expert_map,
+        )
 
     fused_moe_fn = functools.partial(fused_moe, renormalize=False)
 
@@ -234,19 +247,22 @@ def m_fused_moe(
     # setup code in case we are able to revisit this later.
     use_compile = False
 
-    use_cudagraph = (n >= 1024 and k >= 1024
-                     and current_platform.is_cuda_alike())
+    use_cudagraph = n >= 1024 and k >= 1024 and current_platform.is_cuda_alike()
 
     with set_current_vllm_config(vllm_config):
         baseline_output = runner(torch_moe, iterative_moe)
-        runner(baseline_output,
-               fused_moe_fn,
-               use_compile=use_compile,
-               use_cudagraph=use_cudagraph)
-        runner(baseline_output,
-               m_fused_moe,
-               use_compile=use_compile,
-               use_cudagraph=use_cudagraph)
+        runner(
+            baseline_output,
+            fused_moe_fn,
+            use_compile=use_compile,
+            use_cudagraph=use_cudagraph,
+        )
+        runner(
+            baseline_output,
+            m_fused_moe,
+            use_compile=use_compile,
+            use_cudagraph=use_cudagraph,
+        )
 
 
 @pytest.mark.parametrize("m,n,k", FUSED_MOE_WN16_MNK_FACTORS)
@@ -257,9 +273,18 @@ def m_fused_moe(
 @pytest.mark.parametrize("group_size", [64, 128])
 @pytest.mark.parametrize("has_zp", [True, False])
 @pytest.mark.parametrize("weight_bits", [4, 8])
-def test_fused_moe_wn16(m: int, n: int, k: int, e: int, topk: int,
-                        ep_size: int, dtype: torch.dtype, group_size: int,
-                        has_zp: bool, weight_bits: int):
+def test_fused_moe_wn16(
+    m: int,
+    n: int,
+    k: int,
+    e: int,
+    topk: int,
+    ep_size: int,
+    dtype: torch.dtype,
+    group_size: int,
+    has_zp: bool,
+    weight_bits: int,
+):
     a = torch.randn((m, k), device="cuda", dtype=dtype) / 10
     w1 = torch.randn((e, 2 * n, k), device="cuda", dtype=dtype) / 10
     w2 = torch.randn((e, k, n), device="cuda", dtype=dtype) / 10
@@ -274,35 +299,40 @@ def test_fused_moe_wn16(m: int, n: int, k: int, e: int, topk: int,
 
     w1_ref = w1.clone()
     w2_ref = w2.clone()
-    w1_qweight = torch.empty((e, 2 * n, k // pack_factor),
-                             device="cuda",
-                             dtype=torch.uint8)
-    w2_qweight = torch.empty((e, k, n // pack_factor),
-                             device="cuda",
-                             dtype=torch.uint8)
-    w1_scales = torch.empty((e, 2 * n, k // group_size),
-                            device="cuda",
-                            dtype=dtype)
-    w2_scales = torch.empty((e, k, n // group_size),
-                            device="cuda",
-                            dtype=dtype)
-    w1_qzeros = torch.empty((e, 2 * n // pack_factor, k // group_size),
-                            device="cuda",
-                            dtype=torch.uint8)
-    w2_qzeros = torch.empty((e, k // pack_factor, n // group_size),
-                            device="cuda",
-                            dtype=torch.uint8)
+    w1_qweight = torch.empty(
+        (e, 2 * n, k // pack_factor), device="cuda", dtype=torch.uint8
+    )
+    w2_qweight = torch.empty((e, k, n // pack_factor), device="cuda", dtype=torch.uint8)
+    w1_scales = torch.empty((e, 2 * n, k // group_size), device="cuda", dtype=dtype)
+    w2_scales = torch.empty((e, k, n // group_size), device="cuda", dtype=dtype)
+    w1_qzeros = torch.empty(
+        (e, 2 * n // pack_factor, k // group_size), device="cuda", dtype=torch.uint8
+    )
+    w2_qzeros = torch.empty(
+        (e, k // pack_factor, n // group_size), device="cuda", dtype=torch.uint8
+    )
 
     for i in range(e * 2):
         expert_id = i % e
         if i // e == 0:
-            w, w_ref, w_qweight, w_scales, w_qzeros = \
-                w1, w1_ref, w1_qweight, w1_scales, w1_qzeros
+            w, w_ref, w_qweight, w_scales, w_qzeros = (
+                w1,
+                w1_ref,
+                w1_qweight,
+                w1_scales,
+                w1_qzeros,
+            )
         else:
-            w, w_ref, w_qweight, w_scales, w_qzeros = \
-                w2, w2_ref, w2_qweight, w2_scales, w2_qzeros
+            w, w_ref, w_qweight, w_scales, w_qzeros = (
+                w2,
+                w2_ref,
+                w2_qweight,
+                w2_scales,
+                w2_qzeros,
+            )
         weight, qweight, scales, qzeros = quantize_weights(
-            w[expert_id].T, quant_type, group_size, has_zp, False)
+            w[expert_id].T, quant_type, group_size, has_zp, False
+        )
         weight = weight.T
         qweight = qweight.T.contiguous().to(torch.uint8)
         scales = scales.T
@@ -321,11 +351,8 @@ def test_fused_moe_wn16(m: int, n: int, k: int, e: int, topk: int,
 
     if ep_size > 1:
         local_e = e // ep_size
-        e_ids = torch.randint(0,
-                              e, (local_e, ),
-                              device="cuda",
-                              dtype=torch.int32)
-        e_map = torch.full((e, ), -1, device="cuda", dtype=torch.int32)
+        e_ids = torch.randint(0, e, (local_e,), device="cuda", dtype=torch.int32)
+        e_map = torch.full((e,), -1, device="cuda", dtype=torch.int32)
         e_map[e_ids] = torch.arange(local_e, device="cuda", dtype=torch.int32)
         w1_ref = w1_ref[e_ids]
         w2_ref = w2_ref[e_ids]
@@ -344,28 +371,27 @@ def test_fused_moe_wn16(m: int, n: int, k: int, e: int, topk: int,
         assert weight_bits == 8
         quant_config_builder = int8_w8a16_moe_quant_config
 
-    quant_config = quant_config_builder(w1_scale=w1_scales,
-                                        w2_scale=w2_scales,
-                                        w1_zp=w1_qzeros if has_zp else None,
-                                        w2_zp=w2_qzeros if has_zp else None,
-                                        block_shape=[0, group_size])
+    quant_config = quant_config_builder(
+        w1_scale=w1_scales,
+        w2_scale=w2_scales,
+        w1_zp=w1_qzeros if has_zp else None,
+        w2_zp=w2_qzeros if has_zp else None,
+        block_shape=[0, group_size],
+    )
 
     with set_current_vllm_config(vllm_config):
-        triton_output = fused_moe(a,
-                                  w1_qweight,
-                                  w2_qweight,
-                                  score,
-                                  topk,
-                                  renormalize=False,
-                                  global_num_experts=e,
-                                  expert_map=e_map,
-                                  quant_config=quant_config)
-        torch_output = torch_moe(a,
-                                 w1_ref,
-                                 w2_ref,
-                                 score,
-                                 topk,
-                                 expert_map=e_map)
+        triton_output = fused_moe(
+            a,
+            w1_qweight,
+            w2_qweight,
+            score,
+            topk,
+            renormalize=False,
+            global_num_experts=e,
+            expert_map=e_map,
+            quant_config=quant_config,
+        )
+        torch_output = torch_moe(a, w1_ref, w2_ref, score, topk, expert_map=e_map)
 
     torch.testing.assert_close(triton_output, torch_output, atol=2e-2, rtol=0)
 
@@ -373,16 +399,20 @@ def test_fused_moe_wn16(m: int, n: int, k: int, e: int, topk: int,
 @pytest.mark.parametrize("dtype", [torch.bfloat16])
 @pytest.mark.parametrize("padding", [True, False])
 @pytest.mark.parametrize(
-    "use_rocm_aiter", [True, False] if current_platform.is_rocm() else [False])
+    "use_rocm_aiter", [True, False] if current_platform.is_rocm() else [False]
+)
 @torch.inference_mode()
-def test_mixtral_moe(dist_init, dtype: torch.dtype, padding: bool,
-                     use_rocm_aiter: bool, monkeypatch):
+def test_mixtral_moe(
+    dist_init, dtype: torch.dtype, padding: bool, use_rocm_aiter: bool, monkeypatch
+):
     """Make sure our Mixtral MoE implementation agrees with the one from
     huggingface."""
 
     # clear the cache before every test
     from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-        is_rocm_aiter_moe_enabled)
+        is_rocm_aiter_moe_enabled,
+    )
+
     is_rocm_aiter_moe_enabled.cache_clear()
     if use_rocm_aiter:
         monkeypatch.setenv("VLLM_ROCM_USE_AITER", "1")
@@ -390,17 +420,16 @@ def test_mixtral_moe(dist_init, dtype: torch.dtype, padding: bool,
         if dtype == torch.float32:
             pytest.skip("AITER ROCm test skip for float32")
 
-    monkeypatch.setenv('RANK', "0")
-    monkeypatch.setenv('LOCAL_RANK', "0")
-    monkeypatch.setenv('WORLD_SIZE', "1")
-    monkeypatch.setenv('MASTER_ADDR', 'localhost')
-    monkeypatch.setenv('MASTER_PORT', '12345')
+    monkeypatch.setenv("RANK", "0")
+    monkeypatch.setenv("LOCAL_RANK", "0")
+    monkeypatch.setenv("WORLD_SIZE", "1")
+    monkeypatch.setenv("MASTER_ADDR", "localhost")
+    monkeypatch.setenv("MASTER_PORT", "12345")
     init_distributed_environment()
 
     # Instantiate our and huggingface's MoE blocks
     vllm_config.compilation_config.static_forward_context = dict()
-    with (set_current_vllm_config(vllm_config),
-          set_forward_context(None, vllm_config)):
+    with set_current_vllm_config(vllm_config), set_forward_context(None, vllm_config):
         config = MixtralConfig()
         hf_moe = MixtralSparseMoeBlock(config).to(dtype).to("cuda")
         vllm_moe = MixtralMoE(
@@ -416,27 +445,30 @@ def test_mixtral_moe(dist_init, dtype: torch.dtype, padding: bool,
         # Load the weights
         vllm_moe.gate.weight.data[:] = hf_moe.gate.weight.data
         for i in range(config.num_local_experts):
-            weights = (hf_moe.experts[i].w1.weight.data,
-                       hf_moe.experts[i].w3.weight.data)
+            weights = (
+                hf_moe.experts[i].w1.weight.data,
+                hf_moe.experts[i].w3.weight.data,
+            )
             vllm_moe.experts.w13_weight[i][:] = torch.cat(weights, dim=0)
             vllm_moe.experts.w2_weight[i][:] = hf_moe.experts[i].w2.weight.data
 
         # Generate input batch of dimensions [batch_size, seq_len, hidden_dim]
-        hf_inputs = torch.randn(
-            (1, 64, config.hidden_size)).to(dtype).to("cuda")
+        hf_inputs = torch.randn((1, 64, config.hidden_size)).to(dtype).to("cuda")
         # vLLM uses 1D query [num_tokens, hidden_dim]
         vllm_inputs = hf_inputs.flatten(0, 1)
 
         # Pad the weight if moe padding is enabled
         if padding:
-            vllm_moe.experts.w13_weight = Parameter(F.pad(
-                vllm_moe.experts.w13_weight, (0, 128), "constant", 0)[...,
-                                                                      0:-128],
-                                                    requires_grad=False)
-            vllm_moe.experts.w2_weight = Parameter(F.pad(
-                vllm_moe.experts.w2_weight, (0, 128), "constant", 0)[...,
-                                                                     0:-128],
-                                                   requires_grad=False)
+            vllm_moe.experts.w13_weight = Parameter(
+                F.pad(vllm_moe.experts.w13_weight, (0, 128), "constant", 0)[
+                    ..., 0:-128
+                ],
+                requires_grad=False,
+            )
+            vllm_moe.experts.w2_weight = Parameter(
+                F.pad(vllm_moe.experts.w2_weight, (0, 128), "constant", 0)[..., 0:-128],
+                requires_grad=False,
+            )
             torch.cuda.synchronize()
             torch.cuda.empty_cache()
 
@@ -453,19 +485,21 @@ def test_mixtral_moe(dist_init, dtype: torch.dtype, padding: bool,
     if use_rocm_aiter:
         # The values of rtol and atol are set based on the tests in ROCM AITER package. # noqa: E501
         # https://github.com/ROCm/aiter/blob/dfed377f4be7da96ca2d75ac0761f569676f7240/op_tests/test_moe.py#L174  # noqa: E501
-        torch.testing.assert_close(hf_states.flatten(0, 1),
-                                   vllm_states,
-                                   rtol=0.01,
-                                   atol=100)
+        torch.testing.assert_close(
+            hf_states.flatten(0, 1), vllm_states, rtol=0.01, atol=100
+        )
     else:
-        torch.testing.assert_close(hf_states.flatten(0, 1),
-                                   vllm_states,
-                                   rtol=mixtral_moe_tol[dtype],
-                                   atol=mixtral_moe_tol[dtype])
+        torch.testing.assert_close(
+            hf_states.flatten(0, 1),
+            vllm_states,
+            rtol=mixtral_moe_tol[dtype],
+            atol=mixtral_moe_tol[dtype],
+        )
 
 
 def marlin_moe_generate_valid_test_cases():
     import itertools
+
     m_list = [1, 123, 666]
     n_list = [128, 1024]
     k_list = [256, 2048]
@@ -484,16 +518,24 @@ def marlin_moe_generate_valid_test_cases():
     ]
     is_k_full_list = [True, False]
 
-    all_combinations = itertools.product(m_list, n_list, k_list, e_list,
-                                         topk_list, ep_size_list, dtype_list,
-                                         group_size_list, act_order_list,
-                                         quant_type_list, is_k_full_list)
-
-    def is_invalid(m, n, k, e, topk, ep_size, dtype, group_size, act_order,
-                   quant_type, is_k_full):
+    all_combinations = itertools.product(
+        m_list,
+        n_list,
+        k_list,
+        e_list,
+        topk_list,
+        ep_size_list,
+        dtype_list,
+        group_size_list,
+        act_order_list,
+        quant_type_list,
+        is_k_full_list,
+    )
 
-        if quant_type == scalar_types.float8_e4m3fn and \
-                group_size not in [-1, 128]:
+    def is_invalid(
+        m, n, k, e, topk, ep_size, dtype, group_size, act_order, quant_type, is_k_full
+    ):
+        if quant_type == scalar_types.float8_e4m3fn and group_size not in [-1, 128]:
             return False
         if quant_type == scalar_types.float4_e2m1f:
             if group_size not in [16, 32]:
@@ -522,9 +564,10 @@ def is_invalid(m, n, k, e, topk, ep_size, dtype, group_size, act_order,
 
 
 @pytest.mark.flaky(reruns=2)
-@pytest.mark.parametrize(("m, n, k, e, topk, ep_size, dtype, group_size,"
-                          "act_order, quant_type, is_k_full"),
-                         marlin_moe_generate_valid_test_cases())
+@pytest.mark.parametrize(
+    ("m, n, k, e, topk, ep_size, dtype, group_size,act_order, quant_type, is_k_full"),
+    marlin_moe_generate_valid_test_cases(),
+)
 @pytest.mark.skipif(current_platform.is_rocm(), reason="Skip for rocm")
 def test_fused_marlin_moe(
     m: int,
@@ -549,7 +592,7 @@ def test_fused_marlin_moe(
     if ep_size > 1:
         local_e = e // ep_size
         e_ids = torch.randperm(e, device="cuda", dtype=torch.int32)[:local_e]
-        e_map = torch.full((e, ), -1, device="cuda", dtype=torch.int32)
+        e_map = torch.full((e,), -1, device="cuda", dtype=torch.int32)
         e_map[e_ids] = torch.arange(local_e, device="cuda", dtype=torch.int32)
         w1 = w1[e_ids]
         w2 = w2[e_ids]
@@ -567,11 +610,13 @@ def test_fused_marlin_moe(
     for i in range(w1.shape[0]):
         if quant_type == scalar_types.float4_e2m1f:
             if group_size == 16:
-                w_ref1, qweight1, scales1, global_scale1 = \
+                w_ref1, qweight1, scales1, global_scale1 = (
                     rand_marlin_weight_nvfp4_like(w1[i], group_size)
+                )
             else:
-                w_ref1, qweight1, scales1 = \
-                    rand_marlin_weight_mxfp4_like(w1[i], group_size)
+                w_ref1, qweight1, scales1 = rand_marlin_weight_mxfp4_like(
+                    w1[i], group_size
+                )
                 global_scale1 = None
 
             w_ref1_l.append(w_ref1.T)
@@ -580,14 +625,14 @@ def test_fused_marlin_moe(
             if global_scale1 is not None:
                 global_scale1_l.append(global_scale1)
         elif quant_type == scalar_types.float8_e4m3fn:
-            w_ref1, qweight1, scales1 = marlin_quant_fp8_torch(
-                w1[i], group_size)
+            w_ref1, qweight1, scales1 = marlin_quant_fp8_torch(w1[i], group_size)
             w_ref1_l.append(w_ref1.T)
             qweight1_l.append(qweight1)
             scales1_l.append(scales1)
         elif has_zp:
             w_ref1, qweight1, scales1, zeros1 = awq_marlin_quantize(
-                w1[i].transpose(1, 0), quant_type, group_size)
+                w1[i].transpose(1, 0), quant_type, group_size
+            )
 
             w_ref1_l.append(w_ref1.T)
             qweight1_l.append(qweight1)
@@ -595,9 +640,9 @@ def test_fused_marlin_moe(
             zeros1_l.append(zeros1)
         else:
             test_perm = torch.randperm(k)
-            w_ref1, qweight1, scales1, g_idx1, sort_indices1, _ = \
-                marlin_quantize(w1[i].transpose(1, 0), quant_type,
-                                group_size, act_order, test_perm)
+            w_ref1, qweight1, scales1, g_idx1, sort_indices1, _ = marlin_quantize(
+                w1[i].transpose(1, 0), quant_type, group_size, act_order, test_perm
+            )
 
             w_ref1_l.append(w_ref1.T)
             qweight1_l.append(qweight1)
@@ -624,11 +669,13 @@ def test_fused_marlin_moe(
     for i in range(w2.shape[0]):
         if quant_type == scalar_types.float4_e2m1f:
             if group_size == 16:
-                w_ref2, qweight2, scales2, global_scale2 = \
+                w_ref2, qweight2, scales2, global_scale2 = (
                     rand_marlin_weight_nvfp4_like(w2[i], group_size)
+                )
             else:
-                w_ref2, qweight2, scales2 = \
-                    rand_marlin_weight_mxfp4_like(w2[i], group_size)
+                w_ref2, qweight2, scales2 = rand_marlin_weight_mxfp4_like(
+                    w2[i], group_size
+                )
                 global_scale2 = None
 
             w_ref2_l.append(w_ref2.T)
@@ -637,14 +684,14 @@ def test_fused_marlin_moe(
             if global_scale2 is not None:
                 global_scale2_l.append(global_scale2)
         elif quant_type == scalar_types.float8_e4m3fn:
-            w_ref2, qweight2, scales2 = marlin_quant_fp8_torch(
-                w2[i], group_size)
+            w_ref2, qweight2, scales2 = marlin_quant_fp8_torch(w2[i], group_size)
             w_ref2_l.append(w_ref2.T)
             qweight2_l.append(qweight2)
             scales2_l.append(scales2)
         elif has_zp:
             w_ref2, qweight2, scales2, zeros2 = awq_marlin_quantize(
-                w2[i].transpose(1, 0), quant_type, group_size)
+                w2[i].transpose(1, 0), quant_type, group_size
+            )
 
             w_ref2_l.append(w_ref2.T)
             qweight2_l.append(qweight2)
@@ -652,9 +699,9 @@ def test_fused_marlin_moe(
             zeros2_l.append(zeros2)
         else:
             test_perm = torch.randperm(n)
-            w_ref2, qweight2, scales2, g_idx2, sort_indices2, _ = \
-                marlin_quantize(w2[i].transpose(1, 0), quant_type,
-                                group_size, act_order, test_perm)
+            w_ref2, qweight2, scales2, g_idx2, sort_indices2, _ = marlin_quantize(
+                w2[i].transpose(1, 0), quant_type, group_size, act_order, test_perm
+            )
 
             w_ref2_l.append(w_ref2.T)
             qweight2_l.append(qweight2)
@@ -675,12 +722,7 @@ def test_fused_marlin_moe(
     topk_weights, topk_ids, _ = fused_topk(a, score, topk, False)
 
     with set_current_vllm_config(vllm_config):
-        torch_output = torch_moe(a,
-                                 w_ref1,
-                                 w_ref2,
-                                 score,
-                                 topk,
-                                 expert_map=e_map)
+        torch_output = torch_moe(a, w_ref1, w_ref2, score, topk, expert_map=e_map)
 
     marlin_output = torch.ops.vllm.fused_marlin_moe(
         a,
@@ -704,7 +746,8 @@ def test_fused_marlin_moe(
         w1_zeros=zeros1,
         w2_zeros=zeros2,
         quant_type_id=quant_type.id,
-        is_k_full=is_k_full)
+        is_k_full=is_k_full,
+    )
 
     torch.testing.assert_close(marlin_output, torch_output, atol=5e-2, rtol=0)
 
@@ -738,9 +781,9 @@ def test_fused_marlin_moe_with_bias(m):
 
     for i in range(w1.shape[0]):
         test_perm = torch.randperm(k)
-        w_ref1, qweight1, scales1, g_idx1, sort_indices1, _ = \
-            marlin_quantize(w1[i].transpose(1, 0), quant_type,
-                            group_size, act_order, test_perm)
+        w_ref1, qweight1, scales1, g_idx1, sort_indices1, _ = marlin_quantize(
+            w1[i].transpose(1, 0), quant_type, group_size, act_order, test_perm
+        )
 
         w_ref1_l.append(w_ref1.T)
         qweight1_l.append(qweight1)
@@ -767,9 +810,9 @@ def test_fused_marlin_moe_with_bias(m):
 
     for i in range(w2.shape[0]):
         test_perm = torch.randperm(n)
-        w_ref2, qweight2, scales2, g_idx2, sort_indices2, _ = \
-            marlin_quantize(w2[i].transpose(1, 0), quant_type,
-                            group_size, act_order, test_perm)
+        w_ref2, qweight2, scales2, g_idx2, sort_indices2, _ = marlin_quantize(
+            w2[i].transpose(1, 0), quant_type, group_size, act_order, test_perm
+        )
 
         w_ref2_l.append(w_ref2.T)
         qweight2_l.append(qweight2)
@@ -792,8 +835,7 @@ def test_fused_marlin_moe_with_bias(m):
     topk_weights, topk_ids, _ = fused_topk(a, score, topk, False)
 
     with set_current_vllm_config(vllm_config):
-        torch_output = torch_moe(a, w_ref1, w_ref2, score, topk, b_bias1,
-                                 b_bias2)
+        torch_output = torch_moe(a, w_ref1, w_ref2, score, topk, b_bias1, b_bias2)
 
     marlin_output = torch.ops.vllm.fused_marlin_moe(
         a,
@@ -817,7 +859,8 @@ def test_fused_marlin_moe_with_bias(m):
         w1_zeros=zeros1,
         w2_zeros=zeros2,
         quant_type_id=quant_type.id,
-        is_k_full=is_k_full)
+        is_k_full=is_k_full,
+    )
 
     torch.testing.assert_close(marlin_output, torch_output, atol=5e-2, rtol=0)
 
@@ -825,34 +868,36 @@ def test_fused_marlin_moe_with_bias(m):
 def test_moe_align_block_size_opcheck():
     num_experts = 4
     block_size = 4
-    topk_ids = torch.randint(0,
-                             num_experts, (3, 4),
-                             dtype=torch.int32,
-                             device='cuda')
+    topk_ids = torch.randint(0, num_experts, (3, 4), dtype=torch.int32, device="cuda")
 
     max_num_tokens_padded = topk_ids.numel() + num_experts * (block_size - 1)
-    sorted_ids = torch.empty((max_num_tokens_padded, ),
-                             dtype=torch.int32,
-                             device=topk_ids.device)
+    sorted_ids = torch.empty(
+        (max_num_tokens_padded,), dtype=torch.int32, device=topk_ids.device
+    )
     sorted_ids.fill_(topk_ids.numel())
     max_num_m_blocks = max_num_tokens_padded // block_size
-    expert_ids = torch.empty((max_num_m_blocks, ),
-                             dtype=torch.int32,
-                             device=topk_ids.device)
-    num_tokens_post_pad = torch.empty((1),
-                                      dtype=torch.int32,
-                                      device=topk_ids.device)
-
-    opcheck(torch.ops._moe_C.moe_align_block_size,
-            (topk_ids, num_experts, block_size, sorted_ids, expert_ids,
-             num_tokens_post_pad))
+    expert_ids = torch.empty(
+        (max_num_m_blocks,), dtype=torch.int32, device=topk_ids.device
+    )
+    num_tokens_post_pad = torch.empty((1), dtype=torch.int32, device=topk_ids.device)
+
+    opcheck(
+        torch.ops._moe_C.moe_align_block_size,
+        (
+            topk_ids,
+            num_experts,
+            block_size,
+            sorted_ids,
+            expert_ids,
+            num_tokens_post_pad,
+        ),
+    )
 
 
 @pytest.mark.parametrize("m", [1, 33, 64, 222])
 @pytest.mark.parametrize("topk", TOP_KS)
 @pytest.mark.parametrize("k", [128, 511, 1024])
-@pytest.mark.parametrize("dtype",
-                         [torch.float32, torch.float16, torch.bfloat16])
+@pytest.mark.parametrize("dtype", [torch.float32, torch.float16, torch.bfloat16])
 @pytest.mark.skipif(current_platform.is_rocm(), reason="Skip for rocm")
 def test_moe_sum(m: int, topk: int, k: int, dtype: torch.dtype):
     input = torch.randn((m, topk, k), device="cuda", dtype=dtype)
diff --git a/tests/kernels/moe/test_moe_align_block_size.py b/tests/kernels/moe/test_moe_align_block_size.py
index 5dfc8d9fab32..f92526e74955 100644
--- a/tests/kernels/moe/test_moe_align_block_size.py
+++ b/tests/kernels/moe/test_moe_align_block_size.py
@@ -11,7 +11,8 @@
 import torch
 
 from vllm.model_executor.layers.fused_moe.moe_align_block_size import (
-    moe_align_block_size)
+    moe_align_block_size,
+)
 from vllm.platforms import current_platform
 from vllm.utils import round_up
 
@@ -60,30 +61,33 @@ def _verify_expert_level_sorting(
     in topk_ids in the final sorted_ids however this does not impact quality.
     """
     # Group tokens by expert from the golden implementation
-    golden_expert_tokens = _group_tokens_by_expert(golden_sorted_ids,
-                                                   expert_ids, block_size,
-                                                   valid_length, total_tokens)
+    golden_expert_tokens = _group_tokens_by_expert(
+        golden_sorted_ids, expert_ids, block_size, valid_length, total_tokens
+    )
 
-    actual_expert_tokens = _group_tokens_by_expert(actual_sorted_ids,
-                                                   expert_ids, block_size,
-                                                   valid_length, total_tokens)
+    actual_expert_tokens = _group_tokens_by_expert(
+        actual_sorted_ids, expert_ids, block_size, valid_length, total_tokens
+    )
 
-    assert set(golden_expert_tokens.keys()) == set(
-        actual_expert_tokens.keys()), (
-            f"Expert IDs mismatch: golden={set(golden_expert_tokens.keys())}, "
-            f"actual={set(actual_expert_tokens.keys())}")
+    assert set(golden_expert_tokens.keys()) == set(actual_expert_tokens.keys()), (
+        f"Expert IDs mismatch: golden={set(golden_expert_tokens.keys())}, "
+        f"actual={set(actual_expert_tokens.keys())}"
+    )
 
     for expert_id in golden_expert_tokens:
-        golden_tokens = torch.tensor(golden_expert_tokens[expert_id],
-                                     device=actual_sorted_ids.device)
-        actual_tokens = torch.tensor(actual_expert_tokens[expert_id],
-                                     device=actual_sorted_ids.device)
+        golden_tokens = torch.tensor(
+            golden_expert_tokens[expert_id], device=actual_sorted_ids.device
+        )
+        actual_tokens = torch.tensor(
+            actual_expert_tokens[expert_id], device=actual_sorted_ids.device
+        )
         assert torch.equal(
-            torch.sort(golden_tokens)[0],
-            torch.sort(actual_tokens)[0]), (
-                f"Expert {expert_id} token mismatch: "
-                f"golden={golden_expert_tokens[expert_id]}, "
-                f"actual={actual_expert_tokens[expert_id]}")
+            torch.sort(golden_tokens)[0], torch.sort(actual_tokens)[0]
+        ), (
+            f"Expert {expert_id} token mismatch: "
+            f"golden={golden_expert_tokens[expert_id]}, "
+            f"actual={actual_expert_tokens[expert_id]}"
+        )
 
 
 def torch_moe_align_block_size(
@@ -104,40 +108,38 @@ def torch_moe_align_block_size(
     if pad_sorted_ids:
         max_num_tokens_padded = round_up(max_num_tokens_padded, block_size)
 
-    flattened_token_indices = torch.arange(topk_ids.numel(),
-                                           device=topk_ids.device,
-                                           dtype=torch.int32)
+    flattened_token_indices = torch.arange(
+        topk_ids.numel(), device=topk_ids.device, dtype=torch.int32
+    )
     flattened_expert_ids = topk_ids.flatten()
-    sorted_expert_ids, sort_indices = torch.sort(flattened_expert_ids,
-                                                 stable=True)
+    sorted_expert_ids, sort_indices = torch.sort(flattened_expert_ids, stable=True)
     sorted_token_indices = flattened_token_indices[sort_indices]
 
-    expert_token_counts = torch.zeros(num_experts,
-                                      dtype=torch.int64,
-                                      device=topk_ids.device)
+    expert_token_counts = torch.zeros(
+        num_experts, dtype=torch.int64, device=topk_ids.device
+    )
     for expert_id in range(num_experts):
         mask = sorted_expert_ids == expert_id
         expert_token_counts[expert_id] = mask.sum()
 
-    expert_padded_counts = torch.zeros(num_experts,
-                                       dtype=torch.int64,
-                                       device=topk_ids.device)
+    expert_padded_counts = torch.zeros(
+        num_experts, dtype=torch.int64, device=topk_ids.device
+    )
     for expert_id in range(num_experts):
         original_count = expert_token_counts[expert_id]
         if original_count > 0:
             expert_padded_counts[expert_id] = (
-                (original_count + block_size - 1) // block_size) * block_size
+                (original_count + block_size - 1) // block_size
+            ) * block_size
 
     sorted_token_ids = torch.full(
-        (max_num_tokens_padded, ),
+        (max_num_tokens_padded,),
         topk_ids.numel(),
         dtype=torch.int32,
         device=topk_ids.device,
     )
     max_num_blocks = (max_num_tokens_padded + block_size - 1) // block_size
-    expert_ids = torch.zeros(max_num_blocks,
-                             dtype=torch.int32,
-                             device=topk_ids.device)
+    expert_ids = torch.zeros(max_num_blocks, dtype=torch.int32, device=topk_ids.device)
 
     current_pos = 0
     current_block = 0
@@ -147,20 +149,20 @@ def torch_moe_align_block_size(
         num_expert_tokens = expert_tokens.shape[0]
 
         if num_expert_tokens > 0:
-            sorted_token_ids[current_pos:current_pos +
-                             num_expert_tokens] = (expert_tokens)
+            sorted_token_ids[current_pos : current_pos + num_expert_tokens] = (
+                expert_tokens
+            )
 
             expert_blocks_needed = expert_padded_counts[expert_id] // block_size
-            expert_ids[current_block:current_block +
-                       expert_blocks_needed] = (expert_id)
+            expert_ids[current_block : current_block + expert_blocks_needed] = expert_id
 
             current_pos += expert_padded_counts[expert_id]
             current_block += expert_blocks_needed
 
     total_padded_tokens = expert_padded_counts.sum()
-    num_tokens_post_pad = torch.tensor([total_padded_tokens],
-                                       dtype=torch.int32,
-                                       device=topk_ids.device)
+    num_tokens_post_pad = torch.tensor(
+        [total_padded_tokens], dtype=torch.int32, device=topk_ids.device
+    )
 
     if expert_map is not None:
         expert_ids = expert_map[expert_ids]
@@ -173,37 +175,32 @@ def torch_moe_align_block_size(
 @pytest.mark.parametrize("block_size", BLOCK_SIZES)
 @pytest.mark.parametrize("pad_sorted_ids", [False, True])
 @pytest.mark.skipif(current_platform.is_rocm(), reason="Skip for rocm")
-def test_moe_align_block_size(m: int, topk: int, num_experts: int,
-                              block_size: int, pad_sorted_ids: bool):
+def test_moe_align_block_size(
+    m: int, topk: int, num_experts: int, block_size: int, pad_sorted_ids: bool
+):
     """Test moe_align_block_size without expert mapping"""
     topk_ids = torch.zeros((m, topk), device="cuda", dtype=torch.int32)
     for i in range(m):
         experts = torch.randperm(num_experts, device="cuda")[:topk]
         topk_ids[i] = experts
 
-    actual_sorted_ids, actual_expert_ids, actual_num_tokens = (
-        moe_align_block_size(
-            topk_ids=topk_ids,
-            block_size=block_size,
-            num_experts=num_experts,
-            pad_sorted_ids=pad_sorted_ids,
-        ))
+    actual_sorted_ids, actual_expert_ids, actual_num_tokens = moe_align_block_size(
+        topk_ids=topk_ids,
+        block_size=block_size,
+        num_experts=num_experts,
+        pad_sorted_ids=pad_sorted_ids,
+    )
     golden_sorted_ids, golden_expert_ids, golden_num_tokens = (
         torch_moe_align_block_size(
             topk_ids=topk_ids,
             block_size=block_size,
             num_experts=num_experts,
             pad_sorted_ids=pad_sorted_ids,
-        ))
+        )
+    )
 
-    torch.testing.assert_close(actual_num_tokens,
-                               golden_num_tokens,
-                               atol=0,
-                               rtol=0)
-    torch.testing.assert_close(actual_expert_ids,
-                               golden_expert_ids,
-                               atol=0,
-                               rtol=0)
+    torch.testing.assert_close(actual_num_tokens, golden_num_tokens, atol=0, rtol=0)
+    torch.testing.assert_close(actual_expert_ids, golden_expert_ids, atol=0, rtol=0)
 
     # For sorted_token_ids, verify block-level correctness rather than exact
     # order Tokens within each expert's blocks can be in any order, but expert
@@ -219,16 +216,18 @@ def test_moe_align_block_size(m: int, topk: int, num_experts: int,
 
     total_tokens = m * topk
     assert actual_num_tokens.item() % block_size == 0, (
-        "num_tokens_post_pad should be divisible by block_size")
+        "num_tokens_post_pad should be divisible by block_size"
+    )
     assert actual_num_tokens.item() >= total_tokens, (
-        "num_tokens_post_pad should be at least total_tokens")
+        "num_tokens_post_pad should be at least total_tokens"
+    )
     valid_tokens = actual_sorted_ids[actual_sorted_ids < total_tokens]
     assert len(valid_tokens) == total_tokens, (
-        f"Should have exactly {total_tokens} valid tokens, "
-        f"got {len(valid_tokens)}")
-    assert (actual_expert_ids >= 0).all() and (
-        actual_expert_ids
-        < num_experts).all(), "expert_ids should contain valid expert indices"
+        f"Should have exactly {total_tokens} valid tokens, got {len(valid_tokens)}"
+    )
+    assert (actual_expert_ids >= 0).all() and (actual_expert_ids < num_experts).all(), (
+        "expert_ids should contain valid expert indices"
+    )
 
 
 @pytest.mark.parametrize("m", [16, 32])
@@ -236,46 +235,37 @@ def test_moe_align_block_size(m: int, topk: int, num_experts: int,
 @pytest.mark.parametrize("num_experts", [8])
 @pytest.mark.parametrize("block_size", [64])
 @pytest.mark.skipif(current_platform.is_rocm(), reason="Skip for rocm")
-def test_moe_align_block_size_with_expert_map(m: int, topk: int,
-                                              num_experts: int,
-                                              block_size: int):
+def test_moe_align_block_size_with_expert_map(
+    m: int, topk: int, num_experts: int, block_size: int
+):
     """Test moe_align_block_size with expert mapping (EP scenario)"""
     topk_ids = torch.zeros((m, topk), device="cuda", dtype=torch.int32)
     for i in range(m):
         experts = torch.randperm(num_experts, device="cuda")[:topk]
         topk_ids[i] = experts
 
-    expert_map = torch.full((num_experts, ),
-                            -1,
-                            device="cuda",
-                            dtype=torch.int32)
+    expert_map = torch.full((num_experts,), -1, device="cuda", dtype=torch.int32)
     local_experts = list(range(0, num_experts, 2))
     for i, expert_id in enumerate(local_experts):
         expert_map[expert_id] = i
 
-    actual_sorted_ids, actual_expert_ids, actual_num_tokens = (
-        moe_align_block_size(
-            topk_ids=topk_ids,
-            block_size=block_size,
-            num_experts=num_experts,
-            expert_map=expert_map,
-        ))
+    actual_sorted_ids, actual_expert_ids, actual_num_tokens = moe_align_block_size(
+        topk_ids=topk_ids,
+        block_size=block_size,
+        num_experts=num_experts,
+        expert_map=expert_map,
+    )
     golden_sorted_ids, golden_expert_ids, golden_num_tokens = (
         torch_moe_align_block_size(
             topk_ids=topk_ids,
             block_size=block_size,
             num_experts=num_experts,
             expert_map=expert_map,
-        ))
-
-    torch.testing.assert_close(actual_num_tokens,
-                               golden_num_tokens,
-                               atol=0,
-                               rtol=0)
-    torch.testing.assert_close(actual_expert_ids,
-                               golden_expert_ids,
-                               atol=0,
-                               rtol=0)
+        )
+    )
+
+    torch.testing.assert_close(actual_num_tokens, golden_num_tokens, atol=0, rtol=0)
+    torch.testing.assert_close(actual_expert_ids, golden_expert_ids, atol=0, rtol=0)
     _verify_expert_level_sorting(
         actual_sorted_ids,
         golden_sorted_ids,
@@ -290,26 +280,25 @@ def test_moe_align_block_size_deterministic():
     m, topk, num_experts, block_size = 128, 2, 32, 64
 
     torch.manual_seed(42)
-    topk_ids = torch.randint(0,
-                             num_experts, (m, topk),
-                             device="cuda",
-                             dtype=torch.int32)
+    topk_ids = torch.randint(
+        0, num_experts, (m, topk), device="cuda", dtype=torch.int32
+    )
 
     # expect the results to be reproducible
     results = []
     for _ in range(5):
         sorted_ids, expert_ids, num_tokens = moe_align_block_size(
-            topk_ids=topk_ids, block_size=block_size, num_experts=num_experts)
-        results.append(
-            (sorted_ids.clone(), expert_ids.clone(), num_tokens.clone()))
+            topk_ids=topk_ids, block_size=block_size, num_experts=num_experts
+        )
+        results.append((sorted_ids.clone(), expert_ids.clone(), num_tokens.clone()))
 
     for i in range(1, len(results)):
-        assert torch.equal(
-            results[0][0],
-            results[i][0]), ("sorted_ids should be deterministic")
-        assert torch.equal(
-            results[0][1],
-            results[i][1]), ("expert_ids should be deterministic")
-        assert torch.equal(
-            results[0][2],
-            results[i][2]), ("num_tokens should be deterministic")
+        assert torch.equal(results[0][0], results[i][0]), (
+            "sorted_ids should be deterministic"
+        )
+        assert torch.equal(results[0][1], results[i][1]), (
+            "expert_ids should be deterministic"
+        )
+        assert torch.equal(results[0][2], results[i][2]), (
+            "num_tokens should be deterministic"
+        )
diff --git a/tests/kernels/moe/test_moe_permute_unpermute.py b/tests/kernels/moe/test_moe_permute_unpermute.py
index d71664d94b9c..a6214437d404 100644
--- a/tests/kernels/moe/test_moe_permute_unpermute.py
+++ b/tests/kernels/moe/test_moe_permute_unpermute.py
@@ -14,7 +14,10 @@
 from vllm.model_executor.layers.fused_moe.fused_moe import fused_topk
 from vllm.model_executor.layers.fused_moe.layer import determine_expert_map
 from vllm.model_executor.layers.fused_moe.moe_permute_unpermute import (
-    moe_permute, moe_permute_unpermute_supported, moe_unpermute)
+    moe_permute,
+    moe_permute_unpermute_supported,
+    moe_unpermute,
+)
 from vllm.platforms import current_platform
 
 NUM_EXPERTS = [16, 64, 256]
@@ -24,35 +27,34 @@
 
 
 def torch_permute(
-        hidden_states: torch.Tensor,
-        topk_ids: torch.Tensor,
-        #   token_expert_indices: torch.Tensor,
-        topk: int,
-        n_expert: int,
-        n_local_expert: int,
-        start_expert: int,
-        expert_map: Optional[torch.Tensor] = None,
-        align_block_size: Optional[int] = None,
-        fill_invalid_expert: int = -1) -> list[torch.Tensor]:
+    hidden_states: torch.Tensor,
+    topk_ids: torch.Tensor,
+    #   token_expert_indices: torch.Tensor,
+    topk: int,
+    n_expert: int,
+    n_local_expert: int,
+    start_expert: int,
+    expert_map: Optional[torch.Tensor] = None,
+    align_block_size: Optional[int] = None,
+    fill_invalid_expert: int = -1,
+) -> list[torch.Tensor]:
     n_token, n_hidden = hidden_states.shape[0], hidden_states.shape[1]
     if expert_map is not None:
-        is_local_expert = (expert_map[topk_ids] != -1)
-        not_local_expert = (expert_map[topk_ids] == -1)
-        topk_ids = is_local_expert * (
-            topk_ids - start_expert) + not_local_expert * (topk_ids + n_expert)
-    token_expert_indices = torch.arange(0,
-                                        n_token * topk,
-                                        dtype=torch.int32,
-                                        device=hidden_states.device).reshape(
-                                            (n_token, topk))
+        is_local_expert = expert_map[topk_ids] != -1
+        not_local_expert = expert_map[topk_ids] == -1
+        topk_ids = is_local_expert * (topk_ids - start_expert) + not_local_expert * (
+            topk_ids + n_expert
+        )
+    token_expert_indices = torch.arange(
+        0, n_token * topk, dtype=torch.int32, device=hidden_states.device
+    ).reshape((n_token, topk))
 
-    sorted_topk_ids, sorted_indices = torch.sort(topk_ids.flatten(),
-                                                 stable=True)
+    sorted_topk_ids, sorted_indices = torch.sort(topk_ids.flatten(), stable=True)
     dst_row_id2src_row_id_map = token_expert_indices.flatten()[sorted_indices]
 
-    expert_first_token_offset = torch.zeros(n_local_expert + 1,
-                                            dtype=torch.int64,
-                                            device="cuda")
+    expert_first_token_offset = torch.zeros(
+        n_local_expert + 1, dtype=torch.int64, device="cuda"
+    )
     idx = 0
     for i in range(0, n_local_expert):
         cnt = 0
@@ -64,116 +66,133 @@ def torch_permute(
     _, src2dst_idx = torch.sort(dst_row_id2src_row_id_map)
     valid_row_idx = []
     if align_block_size is None:
-
-        permuted_hidden_states = hidden_states[dst_row_id2src_row_id_map //
-                                               topk, ...]
+        permuted_hidden_states = hidden_states[dst_row_id2src_row_id_map // topk, ...]
         permuted_row_size = permuted_hidden_states.shape[0]
-        m_indices = torch.empty(permuted_row_size,
-                                device="cuda",
-                                dtype=torch.int32).fill_(fill_invalid_expert)
+        m_indices = torch.empty(
+            permuted_row_size, device="cuda", dtype=torch.int32
+        ).fill_(fill_invalid_expert)
         for i in range(1, n_local_expert + 1):
             first_token_offset = expert_first_token_offset[i - 1]
             last_token_offset = expert_first_token_offset[i]
             m_indices[first_token_offset:last_token_offset] = i - 1
         src_row_id2dst_row_id_map = torch.arange(
-            0, n_token * topk, device="cuda",
-            dtype=torch.int32)[src2dst_idx].reshape((n_token, topk))
+            0, n_token * topk, device="cuda", dtype=torch.int32
+        )[src2dst_idx].reshape((n_token, topk))
         valid_row_idx += [i for i in range(expert_first_token_offset[-1])]
-        dst_row_id2src_row_id_map[
-            expert_first_token_offset[-1]:] = n_token * topk
+        dst_row_id2src_row_id_map[expert_first_token_offset[-1] :] = n_token * topk
         return [
-            permuted_hidden_states, expert_first_token_offset,
-            src_row_id2dst_row_id_map, dst_row_id2src_row_id_map, m_indices,
-            valid_row_idx
+            permuted_hidden_states,
+            expert_first_token_offset,
+            src_row_id2dst_row_id_map,
+            dst_row_id2src_row_id_map,
+            m_indices,
+            valid_row_idx,
         ]
     else:
-        permuted_row_size = (topk * n_token + n_expert *
-                             (align_block_size - 1) + align_block_size -
-                             1) // align_block_size * align_block_size
-        permuted_idx = torch.full((permuted_row_size, ),
-                                  n_token * topk,
-                                  dtype=torch.int32,
-                                  device=hidden_states.device)
-        permuted_hidden_states = torch.empty((permuted_row_size, n_hidden),
-                                             device="cuda",
-                                             dtype=hidden_states.dtype)
-        align_src_row_id2dst_row_id = torch.empty(n_token * topk,
-                                                  device="cuda",
-                                                  dtype=torch.int32)
-        align_expert_first_token_offset = torch.zeros_like(
-            expert_first_token_offset)
-        m_indices = torch.empty(permuted_row_size,
-                                device="cuda",
-                                dtype=torch.int32).fill_(fill_invalid_expert)
+        permuted_row_size = (
+            (topk * n_token + n_expert * (align_block_size - 1) + align_block_size - 1)
+            // align_block_size
+            * align_block_size
+        )
+        permuted_idx = torch.full(
+            (permuted_row_size,),
+            n_token * topk,
+            dtype=torch.int32,
+            device=hidden_states.device,
+        )
+        permuted_hidden_states = torch.empty(
+            (permuted_row_size, n_hidden), device="cuda", dtype=hidden_states.dtype
+        )
+        align_src_row_id2dst_row_id = torch.empty(
+            n_token * topk, device="cuda", dtype=torch.int32
+        )
+        align_expert_first_token_offset = torch.zeros_like(expert_first_token_offset)
+        m_indices = torch.empty(
+            permuted_row_size, device="cuda", dtype=torch.int32
+        ).fill_(fill_invalid_expert)
         # get align_permuted_hidden_states,
         # valid row_idx and align_expert_first_token_offset
         for i in range(1, n_local_expert + 1):
             first_token_offset = expert_first_token_offset[i - 1]
             last_token_offset = expert_first_token_offset[i]
             n_token_in_expert = last_token_offset - first_token_offset
-            align_expert_first_token_offset[
-                i] = align_expert_first_token_offset[
-                    i - 1] + (n_token_in_expert + align_block_size -
-                              1) // align_block_size * align_block_size
+            align_expert_first_token_offset[i] = (
+                align_expert_first_token_offset[i - 1]
+                + (n_token_in_expert + align_block_size - 1)
+                // align_block_size
+                * align_block_size
+            )
             align_first_token_offset = align_expert_first_token_offset[i - 1]
             align_last_token_offset = align_expert_first_token_offset[i]
             dst_row_id2src_row_id_in_expert = dst_row_id2src_row_id_map[
-                first_token_offset:first_token_offset + n_token_in_expert]
+                first_token_offset : first_token_offset + n_token_in_expert
+            ]
             # store token in current expert with align_first_token_offset
-            permuted_hidden_states[align_first_token_offset:\
-                                   align_first_token_offset+n_token_in_expert,\
-                                      ...] = hidden_states[\
-                                       dst_row_id2src_row_id_in_expert // topk,\
-                                          ...]
-            permuted_idx[align_first_token_offset:\
-                         align_first_token_offset+\
-                         n_token_in_expert] = dst_row_id2src_row_id_in_expert
+            permuted_hidden_states[
+                align_first_token_offset : align_first_token_offset + n_token_in_expert,
+                ...,
+            ] = hidden_states[dst_row_id2src_row_id_in_expert // topk, ...]
+            permuted_idx[
+                align_first_token_offset : align_first_token_offset + n_token_in_expert
+            ] = dst_row_id2src_row_id_in_expert
             # set current expert m_indices
             m_indices[align_first_token_offset:align_last_token_offset] = i - 1
             valid_row_idx += [
-                i for i in range(align_first_token_offset,
-                                 align_first_token_offset + n_token_in_expert)
+                i
+                for i in range(
+                    align_first_token_offset,
+                    align_first_token_offset + n_token_in_expert,
+                )
             ]
         # get align_src_row_id2dst_row_id
         for i in range(n_token * topk):
             eid = sorted_topk_ids[i]
-            if (eid >= n_local_expert):
+            if eid >= n_local_expert:
                 # check token not in local expert
-                align_src_row_id2dst_row_id[
-                    i] = align_expert_first_token_offset[-1]
+                align_src_row_id2dst_row_id[i] = align_expert_first_token_offset[-1]
                 continue
             first_token_offset = expert_first_token_offset[eid]
             align_first_token_offset = align_expert_first_token_offset[eid]
             token_offset = i - first_token_offset
-            align_src_row_id2dst_row_id[
-                i] = align_first_token_offset + token_offset
-        align_src_row_id2dst_row_id = align_src_row_id2dst_row_id[\
-            src2dst_idx].reshape((n_token, topk))
+            align_src_row_id2dst_row_id[i] = align_first_token_offset + token_offset
+        align_src_row_id2dst_row_id = align_src_row_id2dst_row_id[src2dst_idx].reshape(
+            (n_token, topk)
+        )
         return [
-            permuted_hidden_states, align_expert_first_token_offset,
-            align_src_row_id2dst_row_id, permuted_idx, m_indices, valid_row_idx
+            permuted_hidden_states,
+            align_expert_first_token_offset,
+            align_src_row_id2dst_row_id,
+            permuted_idx,
+            m_indices,
+            valid_row_idx,
         ]
 
 
-def torch_unpermute(permuted_hidden_states: torch.Tensor,
-                    topk_weights: torch.Tensor, topk_ids: torch.Tensor,
-                    token_expert_indices: torch.Tensor,
-                    src_row_id2dst_row_id_map: torch.Tensor,
-                    valid_row_idx: torch.Tensor, topk: int,
-                    n_expert: int) -> torch.Tensor:
+def torch_unpermute(
+    permuted_hidden_states: torch.Tensor,
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    token_expert_indices: torch.Tensor,
+    src_row_id2dst_row_id_map: torch.Tensor,
+    valid_row_idx: torch.Tensor,
+    topk: int,
+    n_expert: int,
+) -> torch.Tensor:
     # ignore invalid row
     n_hidden = permuted_hidden_states.shape[1]
-    mask = torch.zeros(permuted_hidden_states.shape[0],
-                       dtype=bool,
-                       device="cuda")
+    mask = torch.zeros(permuted_hidden_states.shape[0], dtype=bool, device="cuda")
     mask[valid_row_idx] = True
     permuted_hidden_states[~mask] = 0
 
     permuted_hidden_states = permuted_hidden_states[
-        src_row_id2dst_row_id_map.flatten(), ...]
+        src_row_id2dst_row_id_map.flatten(), ...
+    ]
     permuted_hidden_states = permuted_hidden_states.view(-1, topk, n_hidden)
-    output = (permuted_hidden_states * topk_weights.unsqueeze(2)).sum(1).to(
-        permuted_hidden_states.dtype)
+    output = (
+        (permuted_hidden_states * topk_weights.unsqueeze(2))
+        .sum(1)
+        .to(permuted_hidden_states.dtype)
+    )
     return output
 
 
@@ -184,59 +203,76 @@ def torch_unpermute(permuted_hidden_states: torch.Tensor,
 @pytest.mark.parametrize("dtype", [torch.bfloat16])
 @pytest.mark.parametrize("ep_size", EP_SIZE)
 @pytest.mark.parametrize("align_block_size", [None, 128])
-def test_moe_permute_unpermute(n_token: int, n_hidden: int, topk: int,
-                               n_expert: int, ep_size: int, dtype: torch.dtype,
-                               align_block_size: Optional[int]):
+def test_moe_permute_unpermute(
+    n_token: int,
+    n_hidden: int,
+    topk: int,
+    n_expert: int,
+    ep_size: int,
+    dtype: torch.dtype,
+    align_block_size: Optional[int],
+):
     if not moe_permute_unpermute_supported():
         pytest.skip("moe_permute_unpermute is not supported on this platform.")
     fill_invalid_expert = 0
     ep_rank = np.random.randint(0, ep_size)
     expert_map = None
     n_local_expert = n_expert
-    if (ep_size != 1):
-        n_local_expert, expert_map = determine_expert_map(
-            ep_size, ep_rank, n_expert)
+    if ep_size != 1:
+        n_local_expert, expert_map = determine_expert_map(ep_size, ep_rank, n_expert)
         expert_map = expert_map.cuda()
     start_expert = n_local_expert * ep_rank
     current_platform.seed_everything(0)
     hidden_states = torch.randn((n_token, n_hidden), device="cuda").to(dtype)
     gating_output = torch.randn((n_token, n_expert), device="cuda").to(dtype)
     topk_weights, topk_ids, token_expert_indices = fused_topk(
-        hidden_states, gating_output, topk, False)
-    (gold_permuted_hidden_states, gold_expert_first_token_offset,
-     gold_inv_permuted_idx, gold_permuted_idx, gold_m_indices,
-     valid_row_idx) = torch_permute(
-         hidden_states,
-         topk_ids,
-         # token_expert_indices,
-         topk,
-         n_expert,
-         n_local_expert,
-         start_expert,
-         expert_map=expert_map,
-         align_block_size=align_block_size,
-         fill_invalid_expert=fill_invalid_expert)
+        hidden_states, gating_output, topk, False
+    )
+    (
+        gold_permuted_hidden_states,
+        gold_expert_first_token_offset,
+        gold_inv_permuted_idx,
+        gold_permuted_idx,
+        gold_m_indices,
+        valid_row_idx,
+    ) = torch_permute(
+        hidden_states,
+        topk_ids,
+        # token_expert_indices,
+        topk,
+        n_expert,
+        n_local_expert,
+        start_expert,
+        expert_map=expert_map,
+        align_block_size=align_block_size,
+        fill_invalid_expert=fill_invalid_expert,
+    )
 
-    (permuted_hidden_states, _, expert_first_token_offset, inv_permuted_idx,
-     m_indices) = moe_permute(hidden_states=hidden_states,
-                              a1q_scale=None,
-                              topk_ids=topk_ids,
-                              n_expert=n_expert,
-                              n_local_expert=n_local_expert,
-                              expert_map=expert_map,
-                              align_block_size=align_block_size,
-                              fill_invalid_expert=fill_invalid_expert)
+    (
+        permuted_hidden_states,
+        _,
+        expert_first_token_offset,
+        inv_permuted_idx,
+        m_indices,
+    ) = moe_permute(
+        hidden_states=hidden_states,
+        a1q_scale=None,
+        topk_ids=topk_ids,
+        n_expert=n_expert,
+        n_local_expert=n_local_expert,
+        expert_map=expert_map,
+        align_block_size=align_block_size,
+        fill_invalid_expert=fill_invalid_expert,
+    )
 
     # check expert_first_token_offset
-    torch.testing.assert_close(gold_expert_first_token_offset,
-                               expert_first_token_offset,
-                               atol=0,
-                               rtol=0)
+    torch.testing.assert_close(
+        gold_expert_first_token_offset, expert_first_token_offset, atol=0, rtol=0
+    )
     # check src_row_id2dst_row_id_map
-    torch.testing.assert_close(gold_inv_permuted_idx.flatten(),
-                               inv_permuted_idx,
-                               atol=0,
-                               rtol=0)
+    torch.testing.assert_close(
+        gold_inv_permuted_idx.flatten(), inv_permuted_idx, atol=0, rtol=0
+    )
     # check mindice
     # current kernel usage assumes deepgemm requires align_block_size
     # when it's not provided then we don't compute m_indices (for cutlass)
@@ -244,19 +280,28 @@ def test_moe_permute_unpermute(n_token: int, n_hidden: int, topk: int,
         torch.testing.assert_close(gold_m_indices, m_indices, atol=0, rtol=0)
 
     # check permuted_hidden_states, only valid token
-    torch.testing.assert_close(gold_permuted_hidden_states[valid_row_idx],
-                               permuted_hidden_states[valid_row_idx],
-                               atol=0,
-                               rtol=0)
+    torch.testing.assert_close(
+        gold_permuted_hidden_states[valid_row_idx],
+        permuted_hidden_states[valid_row_idx],
+        atol=0,
+        rtol=0,
+    )
     # add a random tensor to simulate group gemm
-    result0 = 0.5 * permuted_hidden_states + torch.randn_like(
-        permuted_hidden_states)
+    result0 = 0.5 * permuted_hidden_states + torch.randn_like(permuted_hidden_states)
     result4 = torch.empty_like(hidden_states)
-    moe_unpermute(result4, result0, topk_weights, inv_permuted_idx,
-                  expert_first_token_offset)
+    moe_unpermute(
+        result4, result0, topk_weights, inv_permuted_idx, expert_first_token_offset
+    )
 
-    gold4 = torch_unpermute(result0, topk_weights, topk_ids,
-                            token_expert_indices, inv_permuted_idx,
-                            valid_row_idx, topk, n_local_expert)
+    gold4 = torch_unpermute(
+        result0,
+        topk_weights,
+        topk_ids,
+        token_expert_indices,
+        inv_permuted_idx,
+        valid_row_idx,
+        topk,
+        n_local_expert,
+    )
     # check unpermuted hidden
     torch.testing.assert_close(result4, gold4, atol=2e-2, rtol=0)
diff --git a/tests/kernels/moe/test_mxfp4_moe.py b/tests/kernels/moe/test_mxfp4_moe.py
index 61d3311cc162..d53f851e0126 100644
--- a/tests/kernels/moe/test_mxfp4_moe.py
+++ b/tests/kernels/moe/test_mxfp4_moe.py
@@ -11,27 +11,39 @@
 from packaging import version
 
 from vllm.model_executor.layers.quantization.quark.quark import (  # noqa: E501
-    QuarkLinearMethod, QuarkW4A4MXFP4)
+    QuarkLinearMethod,
+    QuarkW4A4MXFP4,
+)
 from vllm.model_executor.layers.quantization.quark.quark_moe import (  # noqa: E501
-    QuarkW4A4MXFp4MoEMethod)
+    QuarkW4A4MXFp4MoEMethod,
+)
 from vllm.platforms import current_platform
 from vllm.utils.flashinfer import has_flashinfer
 
 QUARK_MXFP4_AVAILABLE = find_spec("quark") is not None and version.parse(
-    importlib.metadata.version("amd-quark")) >= version.parse('0.8.99')
+    importlib.metadata.version("amd-quark")
+) >= version.parse("0.8.99")
 
-TRTLLM_GEN_MXFP4_AVAILABLE = current_platform.is_cuda(
-) and current_platform.is_device_capability(100)
+TRTLLM_GEN_MXFP4_AVAILABLE = (
+    current_platform.is_cuda() and current_platform.is_device_capability(100)
+)
 
-HOPPER_MXFP4_BF16_AVAILABLE = (current_platform.is_cuda()
-                               and current_platform.is_device_capability(90)
-                               and has_flashinfer())
+HOPPER_MXFP4_BF16_AVAILABLE = (
+    current_platform.is_cuda()
+    and current_platform.is_device_capability(90)
+    and has_flashinfer()
+)
 
 if TRTLLM_GEN_MXFP4_AVAILABLE:
-    from flashinfer import (fp4_quantize, mxfp8_quantize,
-                            next_positive_power_of_2,
-                            reorder_rows_for_gated_act_gemm, shuffle_matrix_a,
-                            shuffle_matrix_sf_a, trtllm_fp4_block_scale_moe)
+    from flashinfer import (
+        fp4_quantize,
+        mxfp8_quantize,
+        next_positive_power_of_2,
+        reorder_rows_for_gated_act_gemm,
+        shuffle_matrix_a,
+        shuffle_matrix_sf_a,
+        trtllm_fp4_block_scale_moe,
+    )
     from flashinfer.fp4_quantization import nvfp4_block_scale_interleave
     from flashinfer.fused_moe.core import _maybe_get_cached_w2_permute_indices
 
@@ -48,21 +60,25 @@ def enable_pickle(monkeypatch):
     monkeypatch.setenv("VLLM_ALLOW_INSECURE_SERIALIZATION", "1")
 
 
-@pytest.mark.parametrize('model_case', [
-    ModelCase("fxmarty/qwen_1.5-moe-a2.7b-mxfp4", tp=1),
-    ModelCase("fxmarty/deepseek_r1_3_layers_mxfp4", tp=8),
-    ModelCase("fxmarty/Llama-4-Scout-17B-16E-Instruct-2-layers-mxfp4", tp=1)
-])
-@pytest.mark.skipif(not QUARK_MXFP4_AVAILABLE,
-                    reason="amd-quark>=0.9 is not available")
+@pytest.mark.parametrize(
+    "model_case",
+    [
+        ModelCase("fxmarty/qwen_1.5-moe-a2.7b-mxfp4", tp=1),
+        ModelCase("fxmarty/deepseek_r1_3_layers_mxfp4", tp=8),
+        ModelCase("fxmarty/Llama-4-Scout-17B-16E-Instruct-2-layers-mxfp4", tp=1),
+    ],
+)
+@pytest.mark.skipif(not QUARK_MXFP4_AVAILABLE, reason="amd-quark>=0.9 is not available")
 def test_mxfp4_loading_and_execution_moe(vllm_runner, model_case: ModelCase):
     if torch.cuda.device_count() < model_case.tp:
-        pytest.skip(f"This test requires >={model_case.tp} gpus, got only "
-                    f"{torch.cuda.device_count()}")
+        pytest.skip(
+            f"This test requires >={model_case.tp} gpus, got only "
+            f"{torch.cuda.device_count()}"
+        )
 
-    with vllm_runner(model_case.model_id,
-                     tensor_parallel_size=model_case.tp,
-                     load_format="dummy") as llm:
+    with vllm_runner(
+        model_case.model_id, tensor_parallel_size=model_case.tp, load_format="dummy"
+    ) as llm:
 
         def check_model(model):
             layer = model.model.layers[0]
@@ -72,21 +88,16 @@ def check_model(model):
             assert isinstance(qkv_proj.quant_method, QuarkLinearMethod)
             assert isinstance(qkv_proj.scheme, QuarkW4A4MXFP4)
 
-            assert isinstance(layer.mlp.experts.quant_method,
-                              QuarkW4A4MXFp4MoEMethod)
+            assert isinstance(layer.mlp.experts.quant_method, QuarkW4A4MXFp4MoEMethod)
 
         if model_case.model_id == "fxmarty/qwen_1.5-moe-a2.7b-mxfp4":
             llm.apply_model(check_model)
 
-        output = llm.generate_greedy("Today I am in the French Alps and",
-                                     max_tokens=20)
+        output = llm.generate_greedy("Today I am in the French Alps and", max_tokens=20)
         assert output
 
 
-def swiglu(x,
-           alpha: float = 1.702,
-           beta: float = 1.0,
-           limit: Optional[float] = None):
+def swiglu(x, alpha: float = 1.702, beta: float = 1.0, limit: Optional[float] = None):
     # Note we add an extra bias of 1 to the linear layer
     x_glu, x_linear = torch.chunk(x, 2, dim=-1)
     if limit is not None:
@@ -96,24 +107,19 @@ def swiglu(x,
     return out_glu * (x_linear + beta)
 
 
-fp4_lookup_table = [
-    0, 0.5, 1, 1.5, 2, 3, 4, 6, -0, -0.5, -1, -1.5, -2, -3, -4, -6
-]
+fp4_lookup_table = [0, 0.5, 1, 1.5, 2, 3, 4, 6, -0, -0.5, -1, -1.5, -2, -3, -4, -6]
 
 
 def mxfp4_dequantize(x, scale):
     assert x.dtype == torch.uint8
     x = x.view(torch.uint8).to(torch.int32)
-    x_unpacked = torch.zeros(*x.shape[:-1],
-                             x.shape[-1] * 2,
-                             dtype=torch.int32,
-                             device=x.device)
+    x_unpacked = torch.zeros(
+        *x.shape[:-1], x.shape[-1] * 2, dtype=torch.int32, device=x.device
+    )
     x_unpacked[..., 0::2].copy_(x & 0xF)
     x_unpacked[..., 1::2].copy_((x >> 4) & 0xF)
 
-    x_float = torch.zeros(x_unpacked.shape,
-                          dtype=torch.float32,
-                          device=x.device)
+    x_float = torch.zeros(x_unpacked.shape, dtype=torch.float32, device=x.device)
     for i, val in enumerate(fp4_lookup_table):
         x_float[x_unpacked == i] = val
 
@@ -162,9 +168,10 @@ def reference_moe(
     t = torch.einsum("beck,bk->bec", mlp1_weight, t) + mlp1_bias
     t = swiglu(t, alpha=alpha, beta=beta, limit=limit)
 
-    if act_type == 'mxfp8':
-        t_quantized, t_scale = mxfp8_quantize(t.to(torch.bfloat16),
-                                              is_sf_swizzled_layout=False)
+    if act_type == "mxfp8":
+        t_quantized, t_scale = mxfp8_quantize(
+            t.to(torch.bfloat16), is_sf_swizzled_layout=False
+        )
         t = mxfp8_dequantize(t_quantized, t_scale)
     # MLP #2
     mlp2_weight = w2[expert_indices, ...]
@@ -221,37 +228,53 @@ def tg_mxfp4_moe(
     transpose_optimized: bool = False,
 ) -> torch.Tensor:
     sf_block_size = 32
-    assert (w13_weight.dim() == 3 and w13_weight.shape[0] == num_experts
-            and w13_weight.shape[1] == intermediate_size * 2
-            and w13_weight.shape[2] == hidden_size // 2)
-    assert (w13_weight_scale.dim() == 3
-            and w13_weight_scale.shape[0] == num_experts
-            and w13_weight_scale.shape[1] == intermediate_size * 2
-            and w13_weight_scale.shape[2] == hidden_size // sf_block_size)
-    assert (w2_weight.dim() == 3 and w2_weight.shape[0] == num_experts
-            and w2_weight.shape[1] == hidden_size
-            and w2_weight.shape[2] == intermediate_size // 2)
-    assert (w2_weight_scale.dim() == 3
-            and w2_weight_scale.shape[1] == hidden_size
-            and w2_weight_scale.shape[2] == intermediate_size // sf_block_size)
-    assert (w13_bias.dim() == 2 and w13_bias.shape[0] == num_experts
-            and w13_bias.shape[1] == intermediate_size * 2)
-    assert (w2_bias.dim() == 2 and w2_bias.shape[0] == num_experts
-            and w2_bias.shape[1] == hidden_size)
+    assert (
+        w13_weight.dim() == 3
+        and w13_weight.shape[0] == num_experts
+        and w13_weight.shape[1] == intermediate_size * 2
+        and w13_weight.shape[2] == hidden_size // 2
+    )
+    assert (
+        w13_weight_scale.dim() == 3
+        and w13_weight_scale.shape[0] == num_experts
+        and w13_weight_scale.shape[1] == intermediate_size * 2
+        and w13_weight_scale.shape[2] == hidden_size // sf_block_size
+    )
+    assert (
+        w2_weight.dim() == 3
+        and w2_weight.shape[0] == num_experts
+        and w2_weight.shape[1] == hidden_size
+        and w2_weight.shape[2] == intermediate_size // 2
+    )
+    assert (
+        w2_weight_scale.dim() == 3
+        and w2_weight_scale.shape[1] == hidden_size
+        and w2_weight_scale.shape[2] == intermediate_size // sf_block_size
+    )
+    assert (
+        w13_bias.dim() == 2
+        and w13_bias.shape[0] == num_experts
+        and w13_bias.shape[1] == intermediate_size * 2
+    )
+    assert (
+        w2_bias.dim() == 2
+        and w2_bias.shape[0] == num_experts
+        and w2_bias.shape[1] == hidden_size
+    )
 
     # Swap w1 and w3 as the definition of
     # swiglu is different in the trtllm-gen
     w13_weight_scale_ = w13_weight_scale.clone()
     w13_weight_ = w13_weight.clone()
     w13_bias_ = w13_bias.clone()
-    w13_weight[:, :intermediate_size, :].copy_(
-        w13_weight_[:, intermediate_size:, :])
-    w13_weight[:, intermediate_size:, :].copy_(
-        w13_weight_[:, :intermediate_size, :])
+    w13_weight[:, :intermediate_size, :].copy_(w13_weight_[:, intermediate_size:, :])
+    w13_weight[:, intermediate_size:, :].copy_(w13_weight_[:, :intermediate_size, :])
     w13_weight_scale[:, :intermediate_size, :].copy_(
-        w13_weight_scale_[:, intermediate_size:, :])
+        w13_weight_scale_[:, intermediate_size:, :]
+    )
     w13_weight_scale[:, intermediate_size:, :].copy_(
-        w13_weight_scale_[:, :intermediate_size, :])
+        w13_weight_scale_[:, :intermediate_size, :]
+    )
     w13_bias[:, :intermediate_size].copy_(w13_bias_[:, intermediate_size:])
     w13_bias[:, intermediate_size:].copy_(w13_bias_[:, :intermediate_size])
 
@@ -261,18 +284,23 @@ def tg_mxfp4_moe(
     w13_bias_interleaved = []
     for i in range(num_experts):
         w13_weight_interleaved.append(
-            reorder_rows_for_gated_act_gemm(w13_weight[i].clone()))
+            reorder_rows_for_gated_act_gemm(w13_weight[i].clone())
+        )
         w13_weight_scale_interleaved.append(
-            reorder_rows_for_gated_act_gemm(w13_weight_scale[i].clone()))
+            reorder_rows_for_gated_act_gemm(w13_weight_scale[i].clone())
+        )
         w13_bias_interleaved.append(
-            reorder_rows_for_gated_act_gemm(w13_bias[i].clone().reshape(-1,
-                                                                        1)))
+            reorder_rows_for_gated_act_gemm(w13_bias[i].clone().reshape(-1, 1))
+        )
     w13_weight = torch.stack(w13_weight_interleaved).reshape(
-        num_experts, 2 * intermediate_size, hidden_size // 2)
+        num_experts, 2 * intermediate_size, hidden_size // 2
+    )
     w13_weight_scale = torch.stack(w13_weight_scale_interleaved).reshape(
-        num_experts, 2 * intermediate_size, hidden_size // 32)
+        num_experts, 2 * intermediate_size, hidden_size // 32
+    )
     w13_bias = torch.stack(w13_bias_interleaved).reshape(
-        num_experts, 2 * intermediate_size)
+        num_experts, 2 * intermediate_size
+    )
 
     # Shuffle weights and scaling factors for transposed mma output
     gemm1_weights_shuffled = []
@@ -291,9 +319,11 @@ def tg_mxfp4_moe(
                 w13_weight[i].view(torch.uint8),
                 epilogue_tile_m,
             )
-            gemm1_weights_shuffled.append(w13_weight[i].view(
-                torch.uint8)[permute_indices.to(
-                    w13_weight.device)].contiguous())
+            gemm1_weights_shuffled.append(
+                w13_weight[i]
+                .view(torch.uint8)[permute_indices.to(w13_weight.device)]
+                .contiguous()
+            )
             # w13 scale shuffling
             permute_sf_indices = _maybe_get_cached_w2_permute_indices(
                 _cache_permute_indices,
@@ -302,26 +332,35 @@ def tg_mxfp4_moe(
                 num_elts_per_sf=16,
             )
             gemm1_scales_shuffled.append(
-                nvfp4_block_scale_interleave(w13_weight_scale[i].view(
-                    torch.uint8)[permute_sf_indices.to(
-                        w13_weight_scale.device)].contiguous()))
+                nvfp4_block_scale_interleave(
+                    w13_weight_scale[i]
+                    .view(torch.uint8)[permute_sf_indices.to(w13_weight_scale.device)]
+                    .contiguous()
+                )
+            )
             # w13 bias shuffling
             permute_bias_indices = _maybe_get_cached_w2_permute_indices(
                 _cache_permute_indices,
                 w13_bias[i].clone().reshape(-1, 1),
                 epilogue_tile_m,
             )
-            gemm1_bias_shuffled.append(w13_bias[i].clone().reshape(
-                -1, 1)[permute_bias_indices.to(w13_bias.device)].contiguous())
+            gemm1_bias_shuffled.append(
+                w13_bias[i]
+                .clone()
+                .reshape(-1, 1)[permute_bias_indices.to(w13_bias.device)]
+                .contiguous()
+            )
             # w2 weight shuffling
             permute_indices = _maybe_get_cached_w2_permute_indices(
                 _cache_permute_indices,
                 w2_weight[i].view(torch.uint8),
                 epilogue_tile_m,
             )
-            gemm2_weights_shuffled.append(w2_weight[i].view(
-                torch.uint8)[permute_indices.to(
-                    w2_weight.device)].contiguous())
+            gemm2_weights_shuffled.append(
+                w2_weight[i]
+                .view(torch.uint8)[permute_indices.to(w2_weight.device)]
+                .contiguous()
+            )
             # w2 scale shuffling
             permute_sf_indices = _maybe_get_cached_w2_permute_indices(
                 _cache_permute_indices,
@@ -330,48 +369,65 @@ def tg_mxfp4_moe(
                 num_elts_per_sf=16,
             )
             gemm2_scales_shuffled.append(
-                nvfp4_block_scale_interleave(w2_weight_scale[i].view(
-                    torch.uint8)[permute_sf_indices.to(
-                        w2_weight_scale.device)].contiguous()))
+                nvfp4_block_scale_interleave(
+                    w2_weight_scale[i]
+                    .view(torch.uint8)[permute_sf_indices.to(w2_weight_scale.device)]
+                    .contiguous()
+                )
+            )
             # w2 bias shuffling
             permute_indices = _maybe_get_cached_w2_permute_indices(
                 _cache_permute_indices,
                 w2_bias[i].clone().reshape(-1, 1),
                 epilogue_tile_m,
             )
-            gemm2_bias_shuffled.append(w2_bias[i].clone().reshape(
-                -1, 1)[permute_indices.to(w2_bias.device)].contiguous())
+            gemm2_bias_shuffled.append(
+                w2_bias[i]
+                .clone()
+                .reshape(-1, 1)[permute_indices.to(w2_bias.device)]
+                .contiguous()
+            )
 
     else:
         for i in range(num_experts):
             gemm1_weights_shuffled.append(
-                shuffle_matrix_a(w13_weight[i].view(torch.uint8),
-                                 epilogue_tile_m))
+                shuffle_matrix_a(w13_weight[i].view(torch.uint8), epilogue_tile_m)
+            )
             gemm1_scales_shuffled.append(
-                shuffle_matrix_sf_a(w13_weight_scale[i].view(torch.uint8),
-                                    epilogue_tile_m))
+                shuffle_matrix_sf_a(
+                    w13_weight_scale[i].view(torch.uint8), epilogue_tile_m
+                )
+            )
 
             gemm2_weights_shuffled.append(
-                shuffle_matrix_a(w2_weight[i].view(torch.uint8),
-                                 epilogue_tile_m))
+                shuffle_matrix_a(w2_weight[i].view(torch.uint8), epilogue_tile_m)
+            )
             gemm2_scales_shuffled.append(
-                shuffle_matrix_sf_a(w2_weight_scale[i].view(torch.uint8),
-                                    epilogue_tile_m))
+                shuffle_matrix_sf_a(
+                    w2_weight_scale[i].view(torch.uint8), epilogue_tile_m
+                )
+            )
             gemm1_bias_shuffled.append(
-                shuffle_matrix_a(w13_bias[i].reshape(-1, 1), epilogue_tile_m))
+                shuffle_matrix_a(w13_bias[i].reshape(-1, 1), epilogue_tile_m)
+            )
             gemm2_bias_shuffled.append(
-                shuffle_matrix_a(w2_bias[i].reshape(-1, 1), epilogue_tile_m))
+                shuffle_matrix_a(w2_bias[i].reshape(-1, 1), epilogue_tile_m)
+            )
 
     w13_weight = torch.stack(gemm1_weights_shuffled)
-    w13_weight_scale = torch.stack(gemm1_scales_shuffled).reshape(
-        num_experts, 2 * intermediate_size,
-        hidden_size // sf_block_size).view(torch.float8_e4m3fn)
+    w13_weight_scale = (
+        torch.stack(gemm1_scales_shuffled)
+        .reshape(num_experts, 2 * intermediate_size, hidden_size // sf_block_size)
+        .view(torch.float8_e4m3fn)
+    )
     w13_bias = torch.stack(gemm1_bias_shuffled).reshape(num_experts, -1)
 
     w2_weight = torch.stack(gemm2_weights_shuffled)
-    w2_weight_scale = torch.stack(gemm2_scales_shuffled).reshape(
-        num_experts, hidden_size,
-        intermediate_size // sf_block_size).view(torch.float8_e4m3fn)
+    w2_weight_scale = (
+        torch.stack(gemm2_scales_shuffled)
+        .reshape(num_experts, hidden_size, intermediate_size // sf_block_size)
+        .view(torch.float8_e4m3fn)
+    )
     w2_bias = torch.stack(gemm2_bias_shuffled).reshape(num_experts, -1)
 
     tg_result = trtllm_fp4_block_scale_moe(
@@ -401,7 +457,8 @@ def tg_mxfp4_moe(
         routed_scaling_factor=None,
         tile_tokens_dim=get_tile_tokens_dim(hidden_states, topk, num_experts),
         routing_method_type=1,  # renormalize
-        do_finalize=True)[0]
+        do_finalize=True,
+    )[0]
     return tg_result
 
 
@@ -424,20 +481,21 @@ def check_accuracy(a, b, atol, rtol, percent):
     if mismatch_percent > 1 - percent:
         raise Exception(
             f"Mismatch percentage is {mismatch_percent:.4f} for rtol {rtol} "
-            f"(threshold: {1-percent:.4f})")
+            f"(threshold: {1 - percent:.4f})"
+        )
 
 
 @pytest.mark.parametrize("topk", [1, 4])
 @pytest.mark.parametrize("num_experts", [32, 128])
 @pytest.mark.parametrize("num_tokens", [1, 128, 1024])
 @pytest.mark.parametrize("intermediate_size,hidden_size", [(3072, 3072)])
-@pytest.mark.parametrize("alpha,beta,limit", [(1.0, 1.0, None),
-                                              (1.702, 1.0, 7.0)])
-@pytest.mark.parametrize("act_type", ['mxfp8', 'bf16'])
+@pytest.mark.parametrize("alpha,beta,limit", [(1.0, 1.0, None), (1.702, 1.0, 7.0)])
+@pytest.mark.parametrize("act_type", ["mxfp8", "bf16"])
 @pytest.mark.parametrize("transpose_optimized", [False, True])
 @pytest.mark.skipif(
     not TRTLLM_GEN_MXFP4_AVAILABLE,
-    reason="nvidia gpu and compute capability sm100 is required for this test")
+    reason="nvidia gpu and compute capability sm100 is required for this test",
+)
 def test_trtllm_gen_mxfp4_fused_moe(
     topk: int,
     num_experts: int,
@@ -452,45 +510,52 @@ def test_trtllm_gen_mxfp4_fused_moe(
 ):
     seed = 42
     torch.manual_seed(seed)
-    hidden_states = torch.randn(num_tokens,
-                                hidden_size,
-                                device="cuda:0",
-                                dtype=torch.bfloat16)
-    w13 = (torch.randn(num_experts,
-                       intermediate_size * 2,
-                       hidden_size,
-                       device="cuda:0",
-                       dtype=torch.bfloat16))
-    w2 = (torch.randn(num_experts,
-                      hidden_size,
-                      intermediate_size,
-                      device="cuda:0",
-                      dtype=torch.bfloat16))
-    bias13 = torch.randn(num_experts, intermediate_size * 2,
-                         device="cuda:0") * 10
+    hidden_states = torch.randn(
+        num_tokens, hidden_size, device="cuda:0", dtype=torch.bfloat16
+    )
+    w13 = torch.randn(
+        num_experts,
+        intermediate_size * 2,
+        hidden_size,
+        device="cuda:0",
+        dtype=torch.bfloat16,
+    )
+    w2 = torch.randn(
+        num_experts,
+        hidden_size,
+        intermediate_size,
+        device="cuda:0",
+        dtype=torch.bfloat16,
+    )
+    bias13 = torch.randn(num_experts, intermediate_size * 2, device="cuda:0") * 10
     bias2 = torch.randn(num_experts, hidden_size, device="cuda:0") * 10
-    router_logits = torch.rand(num_tokens, num_experts,
-                               dtype=torch.float32).cuda()
-
-    w13, w13_scale = fp4_quantize(w13,
-                                  torch.tensor(1.0, device="cuda:0"),
-                                  32,
-                                  sf_use_ue8m0=True,
-                                  is_sf_swizzled_layout=False)
+    router_logits = torch.rand(num_tokens, num_experts, dtype=torch.float32).cuda()
+
+    w13, w13_scale = fp4_quantize(
+        w13,
+        torch.tensor(1.0, device="cuda:0"),
+        32,
+        sf_use_ue8m0=True,
+        is_sf_swizzled_layout=False,
+    )
     w13_scale = w13_scale.view(torch.float8_e4m3fn).reshape(
-        num_experts, intermediate_size * 2, hidden_size // 32)
-    w2, w2_scale = fp4_quantize(w2,
-                                torch.tensor(1.0, device="cuda:0"),
-                                32,
-                                sf_use_ue8m0=True,
-                                is_sf_swizzled_layout=False)
+        num_experts, intermediate_size * 2, hidden_size // 32
+    )
+    w2, w2_scale = fp4_quantize(
+        w2,
+        torch.tensor(1.0, device="cuda:0"),
+        32,
+        sf_use_ue8m0=True,
+        is_sf_swizzled_layout=False,
+    )
     w2_scale = w2_scale.view(torch.float8_e4m3fn).reshape(
-        num_experts, hidden_size, intermediate_size // 32)
-    if act_type == 'mxfp8':
+        num_experts, hidden_size, intermediate_size // 32
+    )
+    if act_type == "mxfp8":
         hidden_states, hidden_states_scale = mxfp8_quantize(
-            hidden_states, is_sf_swizzled_layout=False)
-        hidden_states_scale = hidden_states_scale.view(
-            torch.float8_e4m3fn).reshape(-1)
+            hidden_states, is_sf_swizzled_layout=False
+        )
+        hidden_states_scale = hidden_states_scale.view(torch.float8_e4m3fn).reshape(-1)
     else:
         hidden_states_scale = None
 
@@ -500,9 +565,10 @@ def test_trtllm_gen_mxfp4_fused_moe(
     w2_ref = mxfp4_dequantize(w2.clone(), w2_scale.clone())
     bias13_ref = bias13
     bias2_ref = bias2
-    if act_type == 'mxfp8':
-        hidden_states_ref = mxfp8_dequantize(
-            hidden_states, hidden_states_scale).to(torch.float32)
+    if act_type == "mxfp8":
+        hidden_states_ref = mxfp8_dequantize(hidden_states, hidden_states_scale).to(
+            torch.float32
+        )
     else:
         hidden_states_ref = hidden_states.to(torch.float32)
     # Process tokens in chunks of 32 to reduce memory usage
@@ -529,29 +595,31 @@ def test_trtllm_gen_mxfp4_fused_moe(
 
     # trtllm-gen result
     if alpha is not None:
-        alpha = torch.full((num_experts, ), alpha, device=hidden_states.device)
+        alpha = torch.full((num_experts,), alpha, device=hidden_states.device)
     if limit is not None:
-        limit = torch.full((num_experts, ), limit, device=hidden_states.device)
+        limit = torch.full((num_experts,), limit, device=hidden_states.device)
     if beta is not None:
-        beta = torch.full((num_experts, ), beta, device=hidden_states.device)
-    tg_result = tg_mxfp4_moe(router_logits,
-                             topk,
-                             num_experts,
-                             intermediate_size,
-                             hidden_size,
-                             hidden_states,
-                             hidden_states_scale,
-                             w13,
-                             w13_scale,
-                             bias13,
-                             w2,
-                             w2_scale,
-                             bias2,
-                             act_type,
-                             alpha=alpha,
-                             beta=beta,
-                             limit=limit,
-                             transpose_optimized=transpose_optimized)
+        beta = torch.full((num_experts,), beta, device=hidden_states.device)
+    tg_result = tg_mxfp4_moe(
+        router_logits,
+        topk,
+        num_experts,
+        intermediate_size,
+        hidden_size,
+        hidden_states,
+        hidden_states_scale,
+        w13,
+        w13_scale,
+        bias13,
+        w2,
+        w2_scale,
+        bias2,
+        act_type,
+        alpha=alpha,
+        beta=beta,
+        limit=limit,
+        transpose_optimized=transpose_optimized,
+    )
     # relatively loose check since the mxfp4 quantization is less accurate
     check_accuracy(ref_result, tg_result, atol=0, rtol=0.3, percent=0.8)
 
@@ -573,8 +641,7 @@ def _interleave_scales_lastdim_by4(scales: torch.Tensor) -> torch.Tensor:
 @pytest.mark.parametrize("num_experts", [32])
 @pytest.mark.parametrize("num_tokens", [1, 128])
 @pytest.mark.parametrize("intermediate_size,hidden_size", [(3072, 3072)])
-@pytest.mark.parametrize("alpha,beta,limit", [(1.0, 1.0, None),
-                                              (1.702, 1.0, 7.0)])
+@pytest.mark.parametrize("alpha,beta,limit", [(1.0, 1.0, None), (1.702, 1.0, 7.0)])
 @pytest.mark.skipif(
     not HOPPER_MXFP4_BF16_AVAILABLE,
     reason="nvidia gpu sm90 and flashinfer are required for this test",
@@ -593,52 +660,73 @@ def test_flashinfer_cutlass_mxfp4_fused_moe(
     device = "cuda:0"
 
     # Inputs
-    hidden_states = torch.randn(num_tokens,
-                                hidden_size,
-                                device=device,
-                                dtype=torch.bfloat16)
+    hidden_states = torch.randn(
+        num_tokens, hidden_size, device=device, dtype=torch.bfloat16
+    )
     # Random MXFP4 weights and scales (uint8), contiguous [w1; w3]
     w13_q = torch.randint(
         0,
-        256, (num_experts, 2 * intermediate_size, hidden_size // 2),
+        256,
+        (num_experts, 2 * intermediate_size, hidden_size // 2),
         device=device,
-        dtype=torch.uint8)
+        dtype=torch.uint8,
+    )
     w13_scale = torch.randint(
         118,
-        123, (num_experts, 2 * intermediate_size, hidden_size // 32),
+        123,
+        (num_experts, 2 * intermediate_size, hidden_size // 32),
         device=device,
-        dtype=torch.uint8)
+        dtype=torch.uint8,
+    )
 
-    w2_q = torch.randint(0,
-                         256,
-                         (num_experts, hidden_size, intermediate_size // 2),
-                         device=device,
-                         dtype=torch.uint8)
+    w2_q = torch.randint(
+        0,
+        256,
+        (num_experts, hidden_size, intermediate_size // 2),
+        device=device,
+        dtype=torch.uint8,
+    )
     w2_scale = torch.randint(
         118,
-        123, (num_experts, hidden_size, intermediate_size // 32),
+        123,
+        (num_experts, hidden_size, intermediate_size // 32),
         device=device,
-        dtype=torch.uint8)
+        dtype=torch.uint8,
+    )
     # Bias contiguous [b1; b3]
-    bias13 = (torch.randn(num_experts,
-                          2 * intermediate_size,
-                          device=device,
-                          dtype=torch.bfloat16) * 10)
-    bias2 = (torch.randn(
-        num_experts, hidden_size, device=device, dtype=torch.bfloat16) * 10)
-    router_logits = torch.rand(num_tokens,
-                               num_experts,
-                               dtype=torch.float32,
-                               device=device)
+    bias13 = (
+        torch.randn(
+            num_experts, 2 * intermediate_size, device=device, dtype=torch.bfloat16
+        )
+        * 10
+    )
+    bias2 = (
+        torch.randn(num_experts, hidden_size, device=device, dtype=torch.bfloat16) * 10
+    )
+    router_logits = torch.rand(
+        num_tokens, num_experts, dtype=torch.float32, device=device
+    )
 
     w13_ref = mxfp4_dequantize(w13_q.clone(), w13_scale.clone()).reshape(
-        num_experts, 2 * intermediate_size, hidden_size)
+        num_experts, 2 * intermediate_size, hidden_size
+    )
     w2_ref = mxfp4_dequantize(w2_q.clone(), w2_scale.clone()).reshape(
-        num_experts, hidden_size, intermediate_size)
-    ref = reference_moe(router_logits.to(torch.float32), topk, num_experts,
-                        hidden_states.to(torch.float32), w13_ref,
-                        bias13.to(torch.float32), w2_ref,
-                        bias2.to(torch.float32), alpha, beta, limit, 'bf16')
+        num_experts, hidden_size, intermediate_size
+    )
+    ref = reference_moe(
+        router_logits.to(torch.float32),
+        topk,
+        num_experts,
+        hidden_states.to(torch.float32),
+        w13_ref,
+        bias13.to(torch.float32),
+        w2_ref,
+        bias2.to(torch.float32),
+        alpha,
+        beta,
+        limit,
+        "bf16",
+    )
 
     from vllm.utils.flashinfer import flashinfer_cutlass_fused_moe
 
@@ -654,23 +742,24 @@ def test_flashinfer_cutlass_mxfp4_fused_moe(
     w13_s_inter = _interleave_scales_lastdim_by4(w13_s)
     w2_s_inter = _interleave_scales_lastdim_by4(w2_scale)
 
-    routing_weights = torch.nn.functional.softmax(router_logits,
-                                                  dim=1,
-                                                  dtype=torch.float32)
-    token_final_scales, token_selected_experts = torch.topk(routing_weights,
-                                                            topk,
-                                                            dim=-1)
-    token_final_scales = (token_final_scales /
-                          token_final_scales.sum(dim=-1, keepdim=True))
+    routing_weights = torch.nn.functional.softmax(
+        router_logits, dim=1, dtype=torch.float32
+    )
+    token_final_scales, token_selected_experts = torch.topk(
+        routing_weights, topk, dim=-1
+    )
+    token_final_scales = token_final_scales / token_final_scales.sum(
+        dim=-1, keepdim=True
+    )
     token_selected_experts = token_selected_experts.to(torch.int).contiguous()
 
     out = torch.empty_like(hidden_states, dtype=torch.bfloat16)
     if alpha is not None:
-        alpha = torch.full((num_experts, ), alpha, device=hidden_states.device)
+        alpha = torch.full((num_experts,), alpha, device=hidden_states.device)
     if beta is not None:
-        beta = torch.full((num_experts, ), beta, device=hidden_states.device)
+        beta = torch.full((num_experts,), beta, device=hidden_states.device)
     if limit is not None:
-        limit = torch.full((num_experts, ), limit, device=hidden_states.device)
+        limit = torch.full((num_experts,), limit, device=hidden_states.device)
 
     _ = flashinfer_cutlass_fused_moe(
         input=hidden_states,
@@ -680,8 +769,7 @@ def test_flashinfer_cutlass_mxfp4_fused_moe(
         fc2_expert_weights=w2_q,
         output_dtype=torch.bfloat16,
         output=out,
-        quant_scales=[w13_s_inter.to(torch.uint8),
-                      w2_s_inter.to(torch.uint8)],
+        quant_scales=[w13_s_inter.to(torch.uint8), w2_s_inter.to(torch.uint8)],
         fc1_expert_biases=w13_b,
         fc2_expert_biases=bias2.to(torch.bfloat16),
         swiglu_alpha=alpha,
@@ -702,11 +790,13 @@ def test_flashinfer_cutlass_mxfp4_fused_moe(
 @pytest.mark.parametrize("num_experts", [32])
 @pytest.mark.parametrize("num_tokens", [1, 128])
 @pytest.mark.parametrize("intermediate_size,hidden_size", [(3072, 3072)])
-@pytest.mark.parametrize("alpha,beta,limit", [(1.0, 1.0, None),
-                                              (1.702, 1.0, 7.0)])
+@pytest.mark.parametrize("alpha,beta,limit", [(1.0, 1.0, None), (1.702, 1.0, 7.0)])
 @pytest.mark.skipif(
-    not (current_platform.is_cuda()
-         and current_platform.is_device_capability(100) and has_flashinfer()),
+    not (
+        current_platform.is_cuda()
+        and current_platform.is_device_capability(100)
+        and has_flashinfer()
+    ),
     reason="NVIDIA GPU sm100 and flashinfer are required for this test",
 )
 def test_flashinfer_cutlass_mxfp4_mxfp8_fused_moe(
@@ -723,32 +813,43 @@ def test_flashinfer_cutlass_mxfp4_mxfp8_fused_moe(
     device = "cuda:0"
 
     # Inputs
-    hidden_states = torch.randn(num_tokens,
-                                hidden_size,
-                                device=device,
-                                dtype=torch.bfloat16)
+    hidden_states = torch.randn(
+        num_tokens, hidden_size, device=device, dtype=torch.bfloat16
+    )
     # Float weights in w13 format [w1; w3]
-    w13 = (torch.randn(num_experts,
-                       2 * intermediate_size,
-                       hidden_size,
-                       device=device,
-                       dtype=torch.bfloat16) / 10)
-    w2 = (torch.randn(num_experts,
-                      hidden_size,
-                      intermediate_size,
-                      device=device,
-                      dtype=torch.bfloat16) / 10)
+    w13 = (
+        torch.randn(
+            num_experts,
+            2 * intermediate_size,
+            hidden_size,
+            device=device,
+            dtype=torch.bfloat16,
+        )
+        / 10
+    )
+    w2 = (
+        torch.randn(
+            num_experts,
+            hidden_size,
+            intermediate_size,
+            device=device,
+            dtype=torch.bfloat16,
+        )
+        / 10
+    )
     # Bias contiguous [b1; b3]
-    bias13 = (torch.randn(num_experts,
-                          2 * intermediate_size,
-                          device=device,
-                          dtype=torch.bfloat16) * 10)
-    bias2 = (torch.randn(
-        num_experts, hidden_size, device=device, dtype=torch.bfloat16) * 10)
-    router_logits = torch.rand(num_tokens,
-                               num_experts,
-                               dtype=torch.float32,
-                               device=device)
+    bias13 = (
+        torch.randn(
+            num_experts, 2 * intermediate_size, device=device, dtype=torch.bfloat16
+        )
+        * 10
+    )
+    bias2 = (
+        torch.randn(num_experts, hidden_size, device=device, dtype=torch.bfloat16) * 10
+    )
+    router_logits = torch.rand(
+        num_tokens, num_experts, dtype=torch.float32, device=device
+    )
 
     # Quantize weights to MXFP4 per expert (SM100 path)
     from flashinfer import mxfp4_quantize
@@ -761,36 +862,56 @@ def quant_mxfp4_batches(a: torch.Tensor, e: int):
             sfs.append(sf)
         return torch.stack(qs), torch.stack(sfs)
 
-    def dequant_mxfp4_batches(mat_fp4: torch.Tensor,
-                              scale_tensor: torch.Tensor):
+    def dequant_mxfp4_batches(mat_fp4: torch.Tensor, scale_tensor: torch.Tensor):
         num_batches = mat_fp4.size(0)
         scale_tensor = scale_tensor.view(num_batches, -1)
         from flashinfer import mxfp4_dequantize
-        return torch.stack([
-            mxfp4_dequantize(mat_fp4[b, :, :], scale_tensor[b, :])
-            for b in range(num_batches)
-        ])
+
+        return torch.stack(
+            [
+                mxfp4_dequantize(mat_fp4[b, :, :], scale_tensor[b, :])
+                for b in range(num_batches)
+            ]
+        )
 
     w13_q, w13_scale = quant_mxfp4_batches(w13, num_experts)
     w2_q, w2_scale = quant_mxfp4_batches(w2, num_experts)
 
     # Reference result using dequantized tensors and reference_moe
-    w13_ref = dequant_mxfp4_batches(
-        w13_q.view(torch.uint8),
-        w13_scale.view(torch.uint8).reshape(-1)).to(torch.float32).reshape(
-            num_experts, 2 * intermediate_size, hidden_size).to(device)
-    w2_ref = dequant_mxfp4_batches(
-        w2_q.view(torch.uint8),
-        w2_scale.view(torch.uint8).reshape(-1)).to(torch.float32).reshape(
-            num_experts, hidden_size, intermediate_size).to(device)
+    w13_ref = (
+        dequant_mxfp4_batches(
+            w13_q.view(torch.uint8), w13_scale.view(torch.uint8).reshape(-1)
+        )
+        .to(torch.float32)
+        .reshape(num_experts, 2 * intermediate_size, hidden_size)
+        .to(device)
+    )
+    w2_ref = (
+        dequant_mxfp4_batches(
+            w2_q.view(torch.uint8), w2_scale.view(torch.uint8).reshape(-1)
+        )
+        .to(torch.float32)
+        .reshape(num_experts, hidden_size, intermediate_size)
+        .to(device)
+    )
 
     # Quantize activations for SM100 path and dequantize for reference
     hidden_states_q, hidden_states_sf = mxfp8_quantize(hidden_states, True, 32)
     # Reference uses BF16 input but quantizes intermediate activation to MXFP8
-    ref = reference_moe(router_logits.to(torch.float32), topk, num_experts,
-                        hidden_states.to(torch.float32), w13_ref,
-                        bias13.to(torch.float32), w2_ref,
-                        bias2.to(torch.float32), alpha, beta, limit, 'mxfp8')
+    ref = reference_moe(
+        router_logits.to(torch.float32),
+        topk,
+        num_experts,
+        hidden_states.to(torch.float32),
+        w13_ref,
+        bias13.to(torch.float32),
+        w2_ref,
+        bias2.to(torch.float32),
+        alpha,
+        beta,
+        limit,
+        "mxfp8",
+    )
 
     # Prepare inputs for FlashInfer CUTLASS fused MoE
     from vllm.utils.flashinfer import flashinfer_cutlass_fused_moe
@@ -807,31 +928,28 @@ def dequant_mxfp4_batches(mat_fp4: torch.Tensor,
     w13_b = torch.cat([b3, b1], dim=-1).to(torch.bfloat16)
 
     # Build routing for kernel
-    routing_weights = torch.nn.functional.softmax(router_logits,
-                                                  dim=1,
-                                                  dtype=torch.float32)
-    token_final_scales, token_selected_experts = torch.topk(routing_weights,
-                                                            topk,
-                                                            dim=-1)
-    token_final_scales = (token_final_scales /
-                          token_final_scales.sum(dim=-1, keepdim=True))
+    routing_weights = torch.nn.functional.softmax(
+        router_logits, dim=1, dtype=torch.float32
+    )
+    token_final_scales, token_selected_experts = torch.topk(
+        routing_weights, topk, dim=-1
+    )
+    token_final_scales = token_final_scales / token_final_scales.sum(
+        dim=-1, keepdim=True
+    )
     token_selected_experts = token_selected_experts.to(torch.int).contiguous()
 
     out = torch.empty_like(hidden_states, dtype=torch.bfloat16)
     if alpha is not None:
-        alpha_t = torch.full((num_experts, ),
-                             alpha,
-                             device=hidden_states.device)
+        alpha_t = torch.full((num_experts,), alpha, device=hidden_states.device)
     else:
         alpha_t = None
     if beta is not None:
-        beta_t = torch.full((num_experts, ), beta, device=hidden_states.device)
+        beta_t = torch.full((num_experts,), beta, device=hidden_states.device)
     else:
         beta_t = None
     if limit is not None:
-        limit_t = torch.full((num_experts, ),
-                             limit,
-                             device=hidden_states.device)
+        limit_t = torch.full((num_experts,), limit, device=hidden_states.device)
     else:
         limit_t = None
 
diff --git a/tests/kernels/moe/test_nvfp4_moe.py b/tests/kernels/moe/test_nvfp4_moe.py
index a48bfeb10b2e..dae19c0b2b31 100644
--- a/tests/kernels/moe/test_nvfp4_moe.py
+++ b/tests/kernels/moe/test_nvfp4_moe.py
@@ -4,9 +4,11 @@
 import torch
 
 from tests.kernels.moe.utils import make_test_weights
-from tests.kernels.quantization.nvfp4_utils import (FLOAT4_E2M1_MAX,
-                                                    FLOAT8_E4M3_MAX,
-                                                    dequantize_nvfp4_to_dtype)
+from tests.kernels.quantization.nvfp4_utils import (
+    FLOAT4_E2M1_MAX,
+    FLOAT8_E4M3_MAX,
+    dequantize_nvfp4_to_dtype,
+)
 from tests.kernels.utils import torch_moe
 from vllm import _custom_ops as ops
 from vllm.config import ParallelConfig, VllmConfig, set_current_vllm_config
@@ -16,8 +18,9 @@
 from vllm.platforms import current_platform
 
 if not current_platform.has_device_capability(100):
-    pytest.skip("Nvfp4 Requires compute capability of 10 or above.",
-                allow_module_level=True)
+    pytest.skip(
+        "Nvfp4 Requires compute capability of 10 or above.", allow_module_level=True
+    )
 
 MNK_FACTORS = [
     (2, 1024, 1024),
@@ -38,36 +41,34 @@
 @pytest.mark.parametrize("topk", [1, 6, 8])
 @pytest.mark.parametrize("dtype", [torch.half, torch.bfloat16])
 @torch.inference_mode()
-def test_cutlass_fp4_moe_no_graph(m: int, n: int, k: int, e: int, topk: int,
-                                  dtype: torch.dtype):
+def test_cutlass_fp4_moe_no_graph(
+    m: int, n: int, k: int, e: int, topk: int, dtype: torch.dtype
+):
     current_platform.seed_everything(7)
     with set_current_vllm_config(
-            VllmConfig(parallel_config=ParallelConfig(
-                pipeline_parallel_size=1))):
-
+        VllmConfig(parallel_config=ParallelConfig(pipeline_parallel_size=1))
+    ):
         quant_blocksize = 16
 
         a = torch.randn((m, k), device="cuda", dtype=dtype) / 10
 
-        (_, w1_q, w1_blockscale,
-         w1_gs), (_, w2_q, w2_blockscale, w2_gs) = make_test_weights(
-             e,
-             n,
-             k,
-             in_dtype=dtype,
-             quant_dtype="nvfp4",
-             block_shape=None,  # use quant_blocksize?
-             per_out_ch_quant=False,
-         )
+        (_, w1_q, w1_blockscale, w1_gs), (_, w2_q, w2_blockscale, w2_gs) = (
+            make_test_weights(
+                e,
+                n,
+                k,
+                in_dtype=dtype,
+                quant_dtype="nvfp4",
+                block_shape=None,  # use quant_blocksize?
+                per_out_ch_quant=False,
+            )
+        )
 
         score = torch.randn((m, e), device="cuda", dtype=dtype)
-        topk_weights, topk_ids, _ = fused_topk(a,
-                                               score,
-                                               topk,
-                                               renormalize=False)
+        topk_weights, topk_ids, _ = fused_topk(a, score, topk, renormalize=False)
 
-        a1_gs = torch.ones((e, ), device="cuda", dtype=torch.float32)
-        a2_gs = torch.ones((e, ), device="cuda", dtype=torch.float32)
+        a1_gs = torch.ones((e,), device="cuda", dtype=torch.float32)
+        a2_gs = torch.ones((e,), device="cuda", dtype=torch.float32)
 
         assert w1_gs is not None
         assert w2_gs is not None
@@ -97,40 +98,44 @@ def test_cutlass_fp4_moe_no_graph(m: int, n: int, k: int, e: int, topk: int,
         )
 
         # Reference check:
-        a_global_scale = ((FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) /
-                          torch.amax(a.flatten(), dim=-1)).to(torch.float32)
+        a_global_scale = (
+            (FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) / torch.amax(a.flatten(), dim=-1)
+        ).to(torch.float32)
         a_fp4, a_scale_interleaved = ops.scaled_fp4_quant(a, a_global_scale)
 
-        a_in_dtype = dequantize_nvfp4_to_dtype(a_fp4,
-                                               a_scale_interleaved,
-                                               a_global_scale,
-                                               dtype=a.dtype,
-                                               device=a.device,
-                                               block_size=quant_blocksize)
+        a_in_dtype = dequantize_nvfp4_to_dtype(
+            a_fp4,
+            a_scale_interleaved,
+            a_global_scale,
+            dtype=a.dtype,
+            device=a.device,
+            block_size=quant_blocksize,
+        )
 
         w1_d = torch.empty((e, 2 * n, k), device="cuda", dtype=dtype)
         w2_d = torch.empty((e, k, n), device="cuda", dtype=dtype)
 
         for idx in range(0, e):
-            w1_d[idx] = dequantize_nvfp4_to_dtype(w1_q[idx],
-                                                  w1_blockscale[idx],
-                                                  w1_gs[idx],
-                                                  dtype=dtype,
-                                                  device=w1_q.device,
-                                                  block_size=quant_blocksize)
-            w2_d[idx] = dequantize_nvfp4_to_dtype(w2_q[idx],
-                                                  w2_blockscale[idx],
-                                                  w2_gs[idx],
-                                                  dtype=dtype,
-                                                  device=w2_q.device,
-                                                  block_size=quant_blocksize)
+            w1_d[idx] = dequantize_nvfp4_to_dtype(
+                w1_q[idx],
+                w1_blockscale[idx],
+                w1_gs[idx],
+                dtype=dtype,
+                device=w1_q.device,
+                block_size=quant_blocksize,
+            )
+            w2_d[idx] = dequantize_nvfp4_to_dtype(
+                w2_q[idx],
+                w2_blockscale[idx],
+                w2_gs[idx],
+                dtype=dtype,
+                device=w2_q.device,
+                block_size=quant_blocksize,
+            )
 
         torch_output = torch_moe(a_in_dtype, w1_d, w2_d, score, topk)
 
-        torch.testing.assert_close(torch_output,
-                                   cutlass_output,
-                                   atol=1e-1,
-                                   rtol=1e-1)
+        torch.testing.assert_close(torch_output, cutlass_output, atol=1e-1, rtol=1e-1)
 
 
 if __name__ == "__main__":
diff --git a/tests/kernels/moe/test_pplx_cutlass_moe.py b/tests/kernels/moe/test_pplx_cutlass_moe.py
index 59126cef6adb..4c7c6c6a4f52 100644
--- a/tests/kernels/moe/test_pplx_cutlass_moe.py
+++ b/tests/kernels/moe/test_pplx_cutlass_moe.py
@@ -9,13 +9,10 @@
 from tests.kernels.utils import torch_experts
 from vllm import _custom_ops as ops
 from vllm.config import VllmConfig, set_current_vllm_config
-from vllm.model_executor.layers.fused_moe.config import (
-    fp8_w8a8_moe_quant_config)
-from vllm.model_executor.layers.fused_moe.cutlass_moe import (
-    CutlassBatchedExpertsFp8)
+from vllm.model_executor.layers.fused_moe.config import fp8_w8a8_moe_quant_config
+from vllm.model_executor.layers.fused_moe.cutlass_moe import CutlassBatchedExpertsFp8
 from vllm.model_executor.layers.fused_moe.fused_moe import fused_topk
-from vllm.model_executor.layers.fused_moe.modular_kernel import (
-    FusedMoEModularKernel)
+from vllm.model_executor.layers.fused_moe.modular_kernel import FusedMoEModularKernel
 from vllm.platforms import current_platform
 from vllm.utils import cdiv
 
@@ -24,9 +21,13 @@
 
 try:
     from pplx_kernels import AllToAll
-    from pplx_kernels.nvshmem import (nvshmem_alloc_empty_unique_id,
-                                      nvshmem_finalize, nvshmem_get_unique_id,
-                                      nvshmem_init)
+    from pplx_kernels.nvshmem import (
+        nvshmem_alloc_empty_unique_id,
+        nvshmem_finalize,
+        nvshmem_get_unique_id,
+        nvshmem_init,
+    )
+
     has_pplx = True
 except ImportError:
     has_pplx = False
@@ -50,12 +51,12 @@ def chunk_by_rank(t, r, w):
     chunk = rank_chunk(num, r, w)
     rem = num % w
     if rem == 0 or r < rem:
-        return t[(r * chunk):(r + 1) * chunk].contiguous()
+        return t[(r * chunk) : (r + 1) * chunk].contiguous()
     else:
         long_chunks = (num // w + 1) * rem
         short_chunks = (r - rem) * chunk
         start = long_chunks + short_chunks
-        return t[start:start + chunk].contiguous()
+        return t[start : start + chunk].contiguous()
 
 
 def pplx_cutlass_moe(
@@ -75,7 +76,9 @@ def pplx_cutlass_moe(
     group_name: Optional[str],
 ):
     from vllm.model_executor.layers.fused_moe.pplx_prepare_finalize import (
-        PplxPrepareAndFinalize)
+        PplxPrepareAndFinalize,
+    )
+
     assert torch.cuda.current_device() == pgi.local_rank
 
     num_tokens, hidden_dim = a.shape
@@ -126,35 +129,40 @@ def pplx_cutlass_moe(
         ata,
         max_num_tokens=max_num_tokens,
         num_local_experts=num_local_experts,
-        num_dispatchers=num_dispatchers)
-
-    ab_strides1 = torch.full((num_local_experts, ),
-                             hidden_dim,
-                             device="cuda",
-                             dtype=torch.int64)
-    ab_strides2 = torch.full((num_local_experts, ),
-                             intermediate_dim,
-                             device="cuda",
-                             dtype=torch.int64)
-    c_strides1 = torch.full((num_local_experts, ),
-                            2 * intermediate_dim,
-                            device="cuda",
-                            dtype=torch.int64)
-    c_strides2 = torch.full((num_local_experts, ),
-                            hidden_dim,
-                            device="cuda",
-                            dtype=torch.int64)
+        num_dispatchers=num_dispatchers,
+    )
+
+    ab_strides1 = torch.full(
+        (num_local_experts,), hidden_dim, device="cuda", dtype=torch.int64
+    )
+    ab_strides2 = torch.full(
+        (num_local_experts,), intermediate_dim, device="cuda", dtype=torch.int64
+    )
+    c_strides1 = torch.full(
+        (num_local_experts,), 2 * intermediate_dim, device="cuda", dtype=torch.int64
+    )
+    c_strides2 = torch.full(
+        (num_local_experts,), hidden_dim, device="cuda", dtype=torch.int64
+    )
 
     experts = CutlassBatchedExpertsFp8(
-        num_local_experts, num_dispatchers, out_dtype, ab_strides1,
-        ab_strides2, c_strides1, c_strides2,
+        num_local_experts,
+        num_dispatchers,
+        out_dtype,
+        ab_strides1,
+        ab_strides2,
+        c_strides1,
+        c_strides2,
         fp8_w8a8_moe_quant_config(
             per_act_token_quant=per_act_token,
             per_out_ch_quant=per_out_ch,
             w1_scale=chunk_by_rank(w1_scale, rank, world_size),
             w2_scale=chunk_by_rank(w2_scale, rank, world_size),
             a1_scale=chunk_by_rank(a1_scale, rank, world_size)
-            if per_act_token else a1_scale[rank]))
+            if per_act_token
+            else a1_scale[rank],
+        ),
+    )
 
     fused_cutlass_experts = FusedMoEModularKernel(
         prepare_finalize,
@@ -162,10 +170,10 @@ def pplx_cutlass_moe(
     )
 
     a_chunk = chunk_by_rank(a, rank, world_size).to(device)
-    chunk_topk_weight = chunk_by_rank(topk_weights, rank,
-                                      world_size).to(device)
-    chunk_topk_ids = chunk_by_rank(topk_ids, rank,
-                                   world_size).to(torch.uint32).to(device)
+    chunk_topk_weight = chunk_by_rank(topk_weights, rank, world_size).to(device)
+    chunk_topk_ids = (
+        chunk_by_rank(topk_ids, rank, world_size).to(torch.uint32).to(device)
+    )
 
     out = fused_cutlass_experts(
         a_chunk,
@@ -174,7 +182,7 @@ def pplx_cutlass_moe(
         chunk_topk_weight,
         chunk_topk_ids,
         global_num_experts=num_experts,
-        expert_map=None,  #TODO
+        expert_map=None,  # TODO
     )
 
     torch.cuda.synchronize()
@@ -210,35 +218,48 @@ def _pplx_moe(
 ):
     try:
         if use_internode:
-            uid = nvshmem_get_unique_id(
-            ) if pgi.rank == 0 else nvshmem_alloc_empty_unique_id()
+            uid = (
+                nvshmem_get_unique_id()
+                if pgi.rank == 0
+                else nvshmem_alloc_empty_unique_id()
+            )
             torch.distributed.broadcast(uid, src=0)
             nvshmem_init(uid, pgi.rank, pgi.world_size)
         else:
             group_ranks = list(range(pgi.world_size))
-            cpu_group = torch.distributed.new_group(group_ranks,
-                                                    backend="gloo")
+            cpu_group = torch.distributed.new_group(group_ranks, backend="gloo")
             group_name = cpu_group.group_name
 
         with set_current_vllm_config(vllm_config):
-            torch_output = torch_experts(a_full, w1_full, w2_full,
-                                         topk_weights, topk_ids)
-            pplx_output = pplx_cutlass_moe(pgi, dp_size, a, w1, w2, w1_scale,
-                                           w2_scale, topk_weights, topk_ids,
-                                           a1_scale, out_dtype, per_act_token,
-                                           per_out_ch, group_name)
-
-            torch_output = chunk_by_rank(torch_output, pgi.rank,
-                                         pgi.world_size).to(pplx_output.device)
+            torch_output = torch_experts(
+                a_full, w1_full, w2_full, topk_weights, topk_ids
+            )
+            pplx_output = pplx_cutlass_moe(
+                pgi,
+                dp_size,
+                a,
+                w1,
+                w2,
+                w1_scale,
+                w2_scale,
+                topk_weights,
+                topk_ids,
+                a1_scale,
+                out_dtype,
+                per_act_token,
+                per_out_ch,
+                group_name,
+            )
+
+            torch_output = chunk_by_rank(torch_output, pgi.rank, pgi.world_size).to(
+                pplx_output.device
+            )
 
         # Uncomment if more debugging is needed
         # print("PPLX OUT:", pplx_output)
         # print("TORCH OUT:", torch_output)
 
-        torch.testing.assert_close(pplx_output,
-                                   torch_output,
-                                   atol=0.05,
-                                   rtol=0)
+        torch.testing.assert_close(pplx_output, torch_output, atol=0.05, rtol=0)
     finally:
         if use_internode:
             nvshmem_finalize()
@@ -251,13 +272,15 @@ def _pplx_moe(
 @pytest.mark.parametrize("topk", TOP_KS)
 @pytest.mark.parametrize("per_act_token", [True, False])
 @pytest.mark.parametrize("per_out_ch", [True, False])
-@pytest.mark.parametrize("world_dp_size", [[2, 1]])  #, [4, 2]])
+@pytest.mark.parametrize("world_dp_size", [[2, 1]])  # , [4, 2]])
 @pytest.mark.parametrize("use_internode", [False])
 @multi_gpu_test(num_gpus=2)
 @pytest.mark.skipif(
     (lambda x: x is None or not ops.cutlass_group_gemm_supported(x.to_int()))(
-        current_platform.get_device_capability()),
-    reason="Grouped gemm is not supported on this GPU type.")
+        current_platform.get_device_capability()
+    ),
+    reason="Grouped gemm is not supported on this GPU type.",
+)
 @requires_pplx
 def test_cutlass_moe_pplx(
     m: int,
@@ -273,7 +296,6 @@ def test_cutlass_moe_pplx(
     current_platform.seed_everything(7)
 
     with set_current_vllm_config(vllm_config):
-
         dtype = torch.half
 
         a = torch.randn((m, k), device="cuda", dtype=dtype) / 10.0
@@ -283,22 +305,18 @@ def test_cutlass_moe_pplx(
         n_b_scales = 2 * n if per_out_ch else 1
         k_b_scales = k if per_out_ch else 1
 
-        w1_q = torch.empty((e, 2 * n, k),
-                           device="cuda",
-                           dtype=torch.float8_e4m3fn)
+        w1_q = torch.empty((e, 2 * n, k), device="cuda", dtype=torch.float8_e4m3fn)
         w2_q = torch.empty((e, k, n), device="cuda", dtype=torch.float8_e4m3fn)
-        w1_scale = torch.empty((e, n_b_scales, 1),
-                               device="cuda",
-                               dtype=torch.float32)
-        w2_scale = torch.empty((e, k_b_scales, 1),
-                               device="cuda",
-                               dtype=torch.float32)
+        w1_scale = torch.empty((e, n_b_scales, 1), device="cuda", dtype=torch.float32)
+        w2_scale = torch.empty((e, k_b_scales, 1), device="cuda", dtype=torch.float32)
 
         for expert in range(e):
             w1_q[expert], w1_scale[expert] = ops.scaled_fp8_quant(
-                w1[expert], use_per_token_if_dynamic=per_out_ch)
+                w1[expert], use_per_token_if_dynamic=per_out_ch
+            )
             w2_q[expert], w2_scale[expert] = ops.scaled_fp8_quant(
-                w2[expert], use_per_token_if_dynamic=per_out_ch)
+                w2[expert], use_per_token_if_dynamic=per_out_ch
+            )
 
         w1_d = torch.empty_like(w1)
         w2_d = torch.empty_like(w2)
@@ -307,19 +325,35 @@ def test_cutlass_moe_pplx(
             w2_d[expert] = (w2_q[expert].float() * w2_scale[expert]).half()
 
         score = torch.randn((m, e), device="cuda", dtype=dtype)
-        topk_weights, topk_ids, _ = fused_topk(a,
-                                               score,
-                                               topk,
-                                               renormalize=False)
+        topk_weights, topk_ids, _ = fused_topk(a, score, topk, renormalize=False)
 
         world_size, dp_size = world_dp_size
-        a_scale1 = torch.randn(
-            (m if per_act_token else 1, 1), device="cuda",
-            dtype=torch.float32) / 10.0
+        a_scale1 = (
+            torch.randn(
+                (m if per_act_token else 1, 1), device="cuda", dtype=torch.float32
+            )
+            / 10.0
+        )
         if not per_act_token:
             a_scale1 = a_scale1.repeat(world_size, 1)
 
-        parallel_launch(world_size, _pplx_moe, dp_size, a, w1_q, w2_q,
-                        w1_scale, w2_scale, topk_weights, topk_ids, a_scale1,
-                        dtype, a, w1_d, w2_d, per_act_token, per_out_ch,
-                        use_internode)
+        parallel_launch(
+            world_size,
+            _pplx_moe,
+            dp_size,
+            a,
+            w1_q,
+            w2_q,
+            w1_scale,
+            w2_scale,
+            topk_weights,
+            topk_ids,
+            a_scale1,
+            dtype,
+            a,
+            w1_d,
+            w2_d,
+            per_act_token,
+            per_out_ch,
+            use_internode,
+        )
diff --git a/tests/kernels/moe/test_pplx_moe.py b/tests/kernels/moe/test_pplx_moe.py
index 4ca4a1e79c57..241ba7d3c5d8 100644
--- a/tests/kernels/moe/test_pplx_moe.py
+++ b/tests/kernels/moe/test_pplx_moe.py
@@ -4,6 +4,7 @@
 
 Run `pytest tests/kernels/test_pplx_moe.py`.
 """
+
 import copy
 import itertools
 import textwrap
@@ -15,29 +16,34 @@
 
 try:
     from pplx_kernels import AllToAll
-    from pplx_kernels.nvshmem import (nvshmem_alloc_empty_unique_id,
-                                      nvshmem_finalize, nvshmem_get_unique_id,
-                                      nvshmem_init)
+    from pplx_kernels.nvshmem import (
+        nvshmem_alloc_empty_unique_id,
+        nvshmem_finalize,
+        nvshmem_get_unique_id,
+        nvshmem_init,
+    )
+
     has_pplx = True
 except ImportError:
     has_pplx = False
 
-from tests.kernels.moe.modular_kernel_tools.parallel_utils import (
-    _set_vllm_config)
-from tests.kernels.moe.utils import (make_shared_experts, make_test_weights,
-                                     naive_batched_moe)
+from tests.kernels.moe.modular_kernel_tools.parallel_utils import _set_vllm_config
+from tests.kernels.moe.utils import (
+    make_shared_experts,
+    make_test_weights,
+    naive_batched_moe,
+)
 from tests.kernels.quant_utils import dequant
 from tests.kernels.utils import torch_experts
 from vllm.config import VllmConfig, set_current_vllm_config
 from vllm.model_executor.layers.fused_moe import fused_topk, override_config
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
-from vllm.model_executor.layers.fused_moe.fused_batched_moe import (
-    BatchedTritonExperts)
+from vllm.model_executor.layers.fused_moe.fused_batched_moe import BatchedTritonExperts
 from vllm.model_executor.layers.fused_moe.fused_moe import get_default_config
-from vllm.model_executor.layers.fused_moe.modular_kernel import (
-    FusedMoEModularKernel)
+from vllm.model_executor.layers.fused_moe.modular_kernel import FusedMoEModularKernel
 from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
-    TopKWeightAndReduceDelegate)
+    TopKWeightAndReduceDelegate,
+)
 from vllm.platforms import current_platform
 from vllm.utils import round_up
 
@@ -59,7 +65,7 @@
 
 PPLX_COMBOS = [
     # TODO(bnell): figure out why this fails, seems to be test problem
-    #(1, 128, 128),
+    # (1, 128, 128),
     (2, 128, 512),
     (3, 1024, 2048),
     (4, 128, 128),
@@ -91,17 +97,16 @@ def torch_prepare(
     num_tokens, hidden_dim = a.shape
     topk = topk_ids.shape[1]
 
-    tokens_per_expert = torch.bincount(topk_ids.view(-1),
-                                       minlength=num_experts)
+    tokens_per_expert = torch.bincount(topk_ids.view(-1), minlength=num_experts)
 
     assert tokens_per_expert.numel() == num_experts
 
     if max_num_tokens is None:
         max_num_tokens = int(tokens_per_expert.max().item())
 
-    b_a = torch.zeros((num_experts, max_num_tokens, hidden_dim),
-                      dtype=a.dtype,
-                      device=a.device)
+    b_a = torch.zeros(
+        (num_experts, max_num_tokens, hidden_dim), dtype=a.dtype, device=a.device
+    )
 
     token_counts = torch.zeros(num_experts, dtype=torch.int, device=a.device)
 
@@ -109,28 +114,29 @@ def torch_prepare(
         for j in range(topk):
             expert_id = topk_ids[token, j]
             idx = token_counts[expert_id]
-            b_a[expert_id, idx:idx + 1, :] = a[token, :]
+            b_a[expert_id, idx : idx + 1, :] = a[token, :]
             token_counts[expert_id] = token_counts[expert_id] + 1
 
     return b_a, tokens_per_expert
 
 
-def torch_finalize(b_out: torch.Tensor, topk_weight: torch.Tensor,
-                   topk_ids: torch.Tensor) -> torch.Tensor:
+def torch_finalize(
+    b_out: torch.Tensor, topk_weight: torch.Tensor, topk_ids: torch.Tensor
+) -> torch.Tensor:
     num_tokens = topk_ids.shape[0]
     num_experts = b_out.shape[0]
     K = b_out.shape[-1]
     out = torch.zeros((num_tokens, K), dtype=b_out.dtype, device=b_out.device)
-    expert_counts = torch.zeros(num_experts,
-                                dtype=torch.int,
-                                device=b_out.device)
+    expert_counts = torch.zeros(num_experts, dtype=torch.int, device=b_out.device)
     for token in range(num_tokens):
         expert_ids = topk_ids[token]
         for i in range(expert_ids.numel()):
             expert_id = expert_ids[i]
             idx = expert_counts[expert_id]
-            out[token, :] = out[token, :] + b_out[expert_id, idx:idx +
-                                                  1, :] * topk_weight[token, i]
+            out[token, :] = (
+                out[token, :]
+                + b_out[expert_id, idx : idx + 1, :] * topk_weight[token, i]
+            )
             expert_counts[expert_id] = expert_counts[expert_id] + 1
 
     return out
@@ -149,17 +155,18 @@ def torch_batched_moe(
     num_tokens, topk = topk_ids.shape
     _, max_num_tokens, K = b_a.shape
     assert num_experts == b_a.shape[0] and w2.shape[1] == K
-    out = torch.zeros((num_experts, max_num_tokens, K),
-                      dtype=b_a.dtype,
-                      device=b_a.device)
-    tmp = torch.empty((max_num_tokens, w1.shape[1] // 2),
-                      dtype=b_a.dtype,
-                      device=b_a.device)
+    out = torch.zeros(
+        (num_experts, max_num_tokens, K), dtype=b_a.dtype, device=b_a.device
+    )
+    tmp = torch.empty(
+        (max_num_tokens, w1.shape[1] // 2), dtype=b_a.dtype, device=b_a.device
+    )
     for expert in range(num_experts):
         num = tokens_per_expert[expert]
         if num > 0:
             torch.ops._C.silu_and_mul(
-                tmp[:num], b_a[expert, :num, :] @ w1[expert].transpose(0, 1))
+                tmp[:num], b_a[expert, :num, :] @ w1[expert].transpose(0, 1)
+            )
             out[expert, :num, :] = tmp[:num] @ w2[expert].transpose(0, 1)
 
     return torch_finalize(out, topk_weight, topk_ids)
@@ -186,20 +193,16 @@ def test_fused_moe_batched_experts(
 
     with set_current_vllm_config(vllm_config):
         topk_weight, topk_ids, _ = fused_topk(a, score, topk, False)
-        baseline_output = torch_experts(a, w1, w2, topk_weight,
-                                        topk_ids)  # only for baseline
+        baseline_output = torch_experts(
+            a, w1, w2, topk_weight, topk_ids
+        )  # only for baseline
         torch_output = torch_batched_moe(a, w1, w2, topk_weight, topk_ids)
         batched_output = naive_batched_moe(
-            a, w1, w2, topk_weight, topk_ids)  # pick torch_experts or this
+            a, w1, w2, topk_weight, topk_ids
+        )  # pick torch_experts or this
 
-    torch.testing.assert_close(baseline_output,
-                               torch_output,
-                               atol=2e-2,
-                               rtol=0)
-    torch.testing.assert_close(baseline_output,
-                               batched_output,
-                               atol=2e-2,
-                               rtol=0)
+    torch.testing.assert_close(baseline_output, torch_output, atol=2e-2, rtol=0)
+    torch.testing.assert_close(baseline_output, batched_output, atol=2e-2, rtol=0)
 
 
 def create_pplx_prepare_finalize(
@@ -217,7 +220,9 @@ def create_pplx_prepare_finalize(
     group_name: Optional[str],
 ):
     from vllm.model_executor.layers.fused_moe.pplx_prepare_finalize import (
-        PplxPrepareAndFinalize, pplx_hidden_dim_scale_bytes)
+        PplxPrepareAndFinalize,
+        pplx_hidden_dim_scale_bytes,
+    )
 
     max_num_tokens = max(rank_chunk(num_tokens, 0, world_size), 1)
     num_local_experts = rank_chunk(num_experts, 0, world_size)
@@ -266,28 +271,31 @@ def rank_chunk(num: int, r: int, w: int) -> int:
 
 def chunk_by_rank(t: torch.Tensor, r: int, w: int) -> torch.Tensor:
     chunk = rank_chunk(t.shape[0], r, w)
-    return t[(r * chunk):(r + 1) * chunk]
+    return t[(r * chunk) : (r + 1) * chunk]
 
 
-def maybe_chunk_by_rank(t: Optional[torch.Tensor], r: int,
-                        w: int) -> Optional[torch.Tensor]:
+def maybe_chunk_by_rank(
+    t: Optional[torch.Tensor], r: int, w: int
+) -> Optional[torch.Tensor]:
     if t is not None:
         return chunk_by_rank(t, r, w)
     else:
         return t
 
 
-def chunk_scales_by_rank(t: Optional[torch.Tensor], r: int,
-                         w: int) -> Optional[torch.Tensor]:
+def chunk_scales_by_rank(
+    t: Optional[torch.Tensor], r: int, w: int
+) -> Optional[torch.Tensor]:
     if t is not None and t.numel() > 1:
         chunk = rank_chunk(t.shape[0], r, w)
-        return t[(r * chunk):(r + 1) * chunk]
+        return t[(r * chunk) : (r + 1) * chunk]
     else:
         return t
 
 
-def chunk_scales(t: Optional[torch.Tensor], start: int,
-                 end: int) -> Optional[torch.Tensor]:
+def chunk_scales(
+    t: Optional[torch.Tensor], start: int, end: int
+) -> Optional[torch.Tensor]:
     if t is not None and t.numel() > 1:
         return t[start:end]
     else:
@@ -350,8 +358,7 @@ def pplx_prepare_finalize(
         device=device,
     )
 
-    if (quant_dtype is not None and not per_act_token_quant
-            and block_shape is None):
+    if quant_dtype is not None and not per_act_token_quant and block_shape is None:
         a1_scale = torch.tensor(1.0, device="cuda", dtype=torch.float32)
         a2_scale = torch.tensor(1.0, device="cuda", dtype=torch.float32)
     else:
@@ -375,8 +382,7 @@ def pplx_prepare_finalize(
         ),
     )
 
-    b_a = dummy_work(
-        dequant(b_a, b_a_scale, block_shape, per_act_token_quant, a.dtype))
+    b_a = dummy_work(dequant(b_a, b_a_scale, block_shape, per_act_token_quant, a.dtype))
 
     prepare_finalize.finalize(
         out,
@@ -410,15 +416,17 @@ def _pplx_prepare_finalize(
 ):
     try:
         if use_internode:
-            uid = nvshmem_get_unique_id(
-            ) if pgi.rank == 0 else nvshmem_alloc_empty_unique_id()
+            uid = (
+                nvshmem_get_unique_id()
+                if pgi.rank == 0
+                else nvshmem_alloc_empty_unique_id()
+            )
             torch.distributed.broadcast(uid, src=0)
             nvshmem_init(uid, pgi.rank, pgi.world_size)
             group_name = None
         else:
             group_ranks = list(range(pgi.world_size))
-            cpu_group = torch.distributed.new_group(group_ranks,
-                                                    backend="gloo")
+            cpu_group = torch.distributed.new_group(group_ranks, backend="gloo")
             group_name = cpu_group.group_name
 
         topk_weight, topk_ids, _ = fused_topk(a, score, topk, False)
@@ -426,22 +434,28 @@ def _pplx_prepare_finalize(
 
         a_rep = torch.repeat_interleave(dummy_work(a), topk, dim=0)
 
-        torch_output = (a_rep.view(m, topk, k) *
-                        topk_weight.view(m, topk, 1).to(a_rep.dtype)).sum(
-                            dim=1)
-
-        pplx_output = pplx_prepare_finalize(pgi, dp_size, a, topk_weight,
-                                            topk_ids, num_experts, quant_dtype,
-                                            block_shape, per_act_token_quant,
-                                            group_name)
+        torch_output = (
+            a_rep.view(m, topk, k) * topk_weight.view(m, topk, 1).to(a_rep.dtype)
+        ).sum(dim=1)
+
+        pplx_output = pplx_prepare_finalize(
+            pgi,
+            dp_size,
+            a,
+            topk_weight,
+            topk_ids,
+            num_experts,
+            quant_dtype,
+            block_shape,
+            per_act_token_quant,
+            group_name,
+        )
 
-        torch_output = chunk_by_rank(torch_output, pgi.rank,
-                                     pgi.world_size).to(pgi.device)
+        torch_output = chunk_by_rank(torch_output, pgi.rank, pgi.world_size).to(
+            pgi.device
+        )
 
-        torch.testing.assert_close(pplx_output,
-                                   torch_output,
-                                   atol=3e-2,
-                                   rtol=3e-2)
+        torch.testing.assert_close(pplx_output, torch_output, atol=3e-2, rtol=3e-2)
     finally:
         if use_internode:
             nvshmem_finalize()
@@ -491,9 +505,19 @@ def test_pplx_prepare_finalize_slow(
     a = torch.randn((m, k), device=device, dtype=act_dtype) / 10
     score = torch.randn((m, e), device=device, dtype=act_dtype)
 
-    parallel_launch(world_size, _pplx_prepare_finalize, dp_size, a, score,
-                    topk, e, quant_dtype, block_shape, per_act_token_quant,
-                    use_internode)
+    parallel_launch(
+        world_size,
+        _pplx_prepare_finalize,
+        dp_size,
+        a,
+        score,
+        topk,
+        e,
+        quant_dtype,
+        block_shape,
+        per_act_token_quant,
+        use_internode,
+    )
 
 
 def pplx_moe(
@@ -517,7 +541,6 @@ def pplx_moe(
     use_cudagraphs: bool = True,
     shared_experts: Optional[torch.nn.Module] = None,
 ) -> Union[torch.Tensor, tuple[torch.Tensor, torch.Tensor]]:
-
     num_tokens, hidden_dim = a.shape
     num_experts = w1.shape[0]
     topk = topk_ids.shape[1]
@@ -579,21 +602,23 @@ def pplx_moe(
     # large enough to trigger chunking. I'm leaving the flag and
     # setup code in case we are able to revisit this later.
     if use_compile:
-        _fused_experts = torch.compile(fused_experts,
-                                       backend='inductor',
-                                       fullgraph=True)
+        _fused_experts = torch.compile(
+            fused_experts, backend="inductor", fullgraph=True
+        )
         torch._dynamo.mark_dynamic(a_chunk, 0)
         torch._dynamo.mark_dynamic(chunk_topk_weight, 0)
         torch._dynamo.mark_dynamic(chunk_topk_ids, 0)
     else:
         _fused_experts = fused_experts
 
-    out = _fused_experts(a_chunk,
-                         w1_chunk,
-                         w2_chunk,
-                         chunk_topk_weight,
-                         chunk_topk_ids,
-                         global_num_experts=num_experts)
+    out = _fused_experts(
+        a_chunk,
+        w1_chunk,
+        w2_chunk,
+        chunk_topk_weight,
+        chunk_topk_ids,
+        global_num_experts=num_experts,
+    )
 
     if use_cudagraphs:
         if isinstance(out, tuple):
@@ -604,12 +629,14 @@ def pplx_moe(
         stream = torch.cuda.Stream()
         graph = torch.cuda.CUDAGraph()
         with torch.cuda.graph(graph, stream=stream):
-            out = _fused_experts(a_chunk,
-                                 w1_chunk,
-                                 w2_chunk,
-                                 chunk_topk_weight,
-                                 chunk_topk_ids,
-                                 global_num_experts=num_experts)
+            out = _fused_experts(
+                a_chunk,
+                w1_chunk,
+                w2_chunk,
+                chunk_topk_weight,
+                chunk_topk_ids,
+                global_num_experts=num_experts,
+            )
 
         torch.cuda.synchronize()
         graph.replay()
@@ -640,15 +667,17 @@ def _pplx_moe(
 ):
     try:
         if use_internode:
-            uid = nvshmem_get_unique_id(
-            ) if pgi.rank == 0 else nvshmem_alloc_empty_unique_id()
+            uid = (
+                nvshmem_get_unique_id()
+                if pgi.rank == 0
+                else nvshmem_alloc_empty_unique_id()
+            )
             torch.distributed.broadcast(uid, src=0)
             nvshmem_init(uid, pgi.rank, pgi.world_size)
             group_name = None
         else:
             group_ranks = list(range(pgi.world_size))
-            cpu_group = torch.distributed.new_group(group_ranks,
-                                                    backend="gloo")
+            cpu_group = torch.distributed.new_group(group_ranks, backend="gloo")
             group_name = cpu_group.group_name
 
         m, k = a.shape
@@ -666,8 +695,7 @@ def _pplx_moe(
         w1_s = w1_s.to(device) if w1_s is not None else None
         w2_s = w2_s.to(device) if w2_s is not None else None
 
-        if (quant_dtype is not None and not per_act_token_quant
-                and block_shape is None):
+        if quant_dtype is not None and not per_act_token_quant and block_shape is None:
             a1_scale = torch.tensor(1.0, device="cuda", dtype=torch.float32)
             a2_scale = torch.tensor(1.0, device="cuda", dtype=torch.float32)
         else:
@@ -742,31 +770,27 @@ def _pplx_moe(
         if shared_output is not None:
             assert pplx_shared_output is not None
             chunked_shared_output = chunk_by_rank(
-                shared_output, pgi.rank,
-                pgi.world_size).to(pplx_shared_output.device)
+                shared_output, pgi.rank, pgi.world_size
+            ).to(pplx_shared_output.device)
         else:
             chunked_shared_output = None
 
         chunked_batch_output = chunk_by_rank(
-            batched_output, pgi.rank, pgi.world_size).to(pplx_output.device)
+            batched_output, pgi.rank, pgi.world_size
+        ).to(pplx_output.device)
 
-        torch.testing.assert_close(batched_output,
-                                   torch_output,
-                                   atol=3e-2,
-                                   rtol=3e-2)
+        torch.testing.assert_close(batched_output, torch_output, atol=3e-2, rtol=3e-2)
 
-        torch.testing.assert_close(pplx_output,
-                                   chunked_batch_output,
-                                   atol=3e-2,
-                                   rtol=3e-2)
+        torch.testing.assert_close(
+            pplx_output, chunked_batch_output, atol=3e-2, rtol=3e-2
+        )
 
         if shared_experts is not None:
             assert chunked_shared_output is not None
             assert pplx_shared_output is not None
-            torch.testing.assert_close(pplx_shared_output,
-                                       chunked_shared_output,
-                                       atol=3e-2,
-                                       rtol=3e-2)
+            torch.testing.assert_close(
+                pplx_shared_output, chunked_shared_output, atol=3e-2, rtol=3e-2
+            )
 
     finally:
         if use_internode:
@@ -823,15 +847,33 @@ def test_pplx_moe_slow(
         per_out_ch_quant=per_act_token_quant,
     )
 
-    parallel_launch(world_size, _pplx_moe, dp_size, a, w1, w2, score, topk, e,
-                    w1_s, w2_s, quant_dtype, per_act_token_quant, block_shape,
-                    use_internode)
-
+    parallel_launch(
+        world_size,
+        _pplx_moe,
+        dp_size,
+        a,
+        w1,
+        w2,
+        score,
+        topk,
+        e,
+        w1_s,
+        w2_s,
+        quant_dtype,
+        per_act_token_quant,
+        block_shape,
+        use_internode,
+    )
 
-def _pplx_test_loop(pgi: ProcessGroupInfo, dp_size: int, use_internode: bool,
-                    use_shared_experts: bool, make_weights: bool,
-                    test_fn: Callable):
 
+def _pplx_test_loop(
+    pgi: ProcessGroupInfo,
+    dp_size: int,
+    use_internode: bool,
+    use_shared_experts: bool,
+    make_weights: bool,
+    test_fn: Callable,
+):
     def format_result(msg, ex=None):
         if ex is not None:
             x = str(ex)
@@ -850,12 +892,12 @@ def format_result(msg, ex=None):
         new_vllm_config = copy.deepcopy(vllm_config)
         new_vllm_config.parallel_config.data_parallel_size = pgi.world_size
         new_vllm_config.parallel_config.enable_expert_parallel = True
-        _set_vllm_config(new_vllm_config, pgi.world_size, pgi.rank,
-                         pgi.local_rank)
+        _set_vllm_config(new_vllm_config, pgi.world_size, pgi.rank, pgi.local_rank)
 
     current_platform.seed_everything(7)
-    combos = itertools.product(PPLX_COMBOS, NUM_EXPERTS, TOP_KS, DTYPES,
-                               [False, True], [None, [128, 128]])
+    combos = itertools.product(
+        PPLX_COMBOS, NUM_EXPERTS, TOP_KS, DTYPES, [False, True], [None, [128, 128]]
+    )
     exceptions = []
     count = 0
     for mnk, e, topk, dtype, per_act_token_quant, block_shape in combos:
@@ -873,13 +915,11 @@ def format_result(msg, ex=None):
             f"test_pplx_moe[mnk={mnk}, e={e}, topk={topk}, "
             f"dtype={dtype}, per_act_token={per_act_token_quant}, "
             f"block_shape={block_shape}, use_internode={use_internode}, "
-            f"use_shared_experts={use_shared_experts}")
+            f"use_shared_experts={use_shared_experts}"
+        )
 
-        if not use_fp8_w8a8 and (per_act_token_quant
-                                 or block_shape is not None):
-            print(
-                f"{test_desc} - Skip quantization test for non-quantized type."
-            )
+        if not use_fp8_w8a8 and (per_act_token_quant or block_shape is not None):
+            print(f"{test_desc} - Skip quantization test for non-quantized type.")
             continue
 
         if per_act_token_quant and block_shape is not None:
@@ -934,10 +974,10 @@ def format_result(msg, ex=None):
     if len(exceptions) > 0:
         raise RuntimeError(
             f"{len(exceptions)} of {count} tests failed in child process, "
-            f"rank={pgi.rank}.")
+            f"rank={pgi.rank}."
+        )
     else:
-        print(f"{count} of {count} tests passed in child process, "
-              f"rank={pgi.rank}.")
+        print(f"{count} of {count} tests passed in child process, rank={pgi.rank}.")
 
 
 @pytest.mark.parametrize("world_dp_size", [[2, 1]])
@@ -950,8 +990,15 @@ def test_pplx_prepare_finalize(
 ):
     current_platform.seed_everything(7)
     world_size, dp_size = world_dp_size
-    parallel_launch(world_size * dp_size, _pplx_test_loop, dp_size,
-                    use_internode, False, False, _pplx_prepare_finalize)
+    parallel_launch(
+        world_size * dp_size,
+        _pplx_test_loop,
+        dp_size,
+        use_internode,
+        False,
+        False,
+        _pplx_prepare_finalize,
+    )
 
 
 @pytest.mark.parametrize("world_dp_size", [[2, 1]])
@@ -966,5 +1013,12 @@ def test_pplx_moe(
 ):
     current_platform.seed_everything(7)
     world_size, dp_size = world_dp_size
-    parallel_launch(world_size, _pplx_test_loop, dp_size, use_internode,
-                    use_shared_experts, True, _pplx_moe)
+    parallel_launch(
+        world_size,
+        _pplx_test_loop,
+        dp_size,
+        use_internode,
+        use_shared_experts,
+        True,
+        _pplx_moe,
+    )
diff --git a/tests/kernels/moe/test_rocm_aiter_topk.py b/tests/kernels/moe/test_rocm_aiter_topk.py
index 1c51c530c193..d4724d749fc9 100644
--- a/tests/kernels/moe/test_rocm_aiter_topk.py
+++ b/tests/kernels/moe/test_rocm_aiter_topk.py
@@ -24,13 +24,14 @@
 
 pytestmark = pytest.mark.skipif(
     not (current_platform.is_rocm() and aiter_available),
-    reason="AITER ops are only available on ROCm with aiter package installed")
+    reason="AITER ops are only available on ROCm with aiter package installed",
+)
 
 
 def test_rocm_aiter_biased_grouped_topk_custom_op_registration():
     """Test that the custom op is correctly registered."""
     # Check if the op exists in torch.ops.vllm
-    assert hasattr(torch.ops.vllm, 'rocm_aiter_biased_grouped_topk')
+    assert hasattr(torch.ops.vllm, "rocm_aiter_biased_grouped_topk")
 
     # Check if the op is callable
     assert callable(torch.ops.vllm.rocm_aiter_biased_grouped_topk)
@@ -39,7 +40,7 @@ def test_rocm_aiter_biased_grouped_topk_custom_op_registration():
 def test_rocm_aiter_grouped_topk_custom_op_registration():
     """Test that the custom op is correctly registered."""
     # Check if the op exists in torch.ops.vllm
-    assert hasattr(torch.ops.vllm, 'rocm_aiter_grouped_topk')
+    assert hasattr(torch.ops.vllm, "rocm_aiter_grouped_topk")
 
     # Check if the op is callable
     assert callable(torch.ops.vllm.rocm_aiter_grouped_topk)
@@ -56,25 +57,29 @@ def test_rocm_aiter_biased_grouped_topk_torch_compile_compatibility():
     renormalize = True
     scale_factor = 1.0
 
-    gating_output = torch.randn((token, expert),
-                                dtype=torch.bfloat16,
-                                device="cuda")
-    e_score_correction_bias = torch.randn((expert, ),
-                                          dtype=torch.bfloat16,
-                                          device="cuda")
+    gating_output = torch.randn((token, expert), dtype=torch.bfloat16, device="cuda")
+    e_score_correction_bias = torch.randn(
+        (expert,), dtype=torch.bfloat16, device="cuda"
+    )
 
     device = gating_output.device
     topk_ids = torch.empty((token, topk), dtype=torch.int32, device=device)
-    topk_weights = torch.empty((token, topk),
-                               dtype=torch.float32,
-                               device=device)
+    topk_weights = torch.empty((token, topk), dtype=torch.float32, device=device)
 
     # Define a function that uses the op
-    def biased_grouped_topk_fn(gating_output, e_score_correction_bias,
-                               topk_weights, topk_ids):
+    def biased_grouped_topk_fn(
+        gating_output, e_score_correction_bias, topk_weights, topk_ids
+    ):
         return torch.ops.vllm.rocm_aiter_biased_grouped_topk(
-            gating_output, e_score_correction_bias, topk_weights, topk_ids,
-            num_expert_group, topk_group, renormalize, scale_factor)
+            gating_output,
+            e_score_correction_bias,
+            topk_weights,
+            topk_ids,
+            num_expert_group,
+            topk_group,
+            renormalize,
+            scale_factor,
+        )
 
     # Verify the op's fake implementation
     torch.library.opcheck(
@@ -84,51 +89,49 @@ def biased_grouped_topk_fn(gating_output, e_score_correction_bias,
             "num_expert_group": num_expert_group,
             "topk_group": topk_group,
             "need_renorm": renormalize,
-            "routed_scaling_factor": scale_factor
+            "routed_scaling_factor": scale_factor,
         },
-        test_utils=("test_faketensor"))
+        test_utils=("test_faketensor"),
+    )
 
     # Compile the function with appropriate settings
-    compiled_fn = torch.compile(biased_grouped_topk_fn,
-                                fullgraph=True,
-                                backend="inductor",
-                                mode="reduce-overhead",
-                                dynamic=False)
-
-    topk_weights_original = torch.empty((token, topk),
-                                        dtype=torch.float32,
-                                        device=device)
-    topk_ids_original = torch.empty((token, topk),
-                                    dtype=torch.int32,
-                                    device=device)
-
-    topk_weights_compiled = torch.empty((token, topk),
-                                        dtype=torch.float32,
-                                        device=device)
-    topk_ids_compiled = torch.empty((token, topk),
-                                    dtype=torch.int32,
-                                    device=device)
+    compiled_fn = torch.compile(
+        biased_grouped_topk_fn,
+        fullgraph=True,
+        backend="inductor",
+        mode="reduce-overhead",
+        dynamic=False,
+    )
+
+    topk_weights_original = torch.empty(
+        (token, topk), dtype=torch.float32, device=device
+    )
+    topk_ids_original = torch.empty((token, topk), dtype=torch.int32, device=device)
+
+    topk_weights_compiled = torch.empty(
+        (token, topk), dtype=torch.float32, device=device
+    )
+    topk_ids_compiled = torch.empty((token, topk), dtype=torch.int32, device=device)
 
     # Run both compiled (V1 graph mode) and uncompiled versions (V1 eager mode)
-    biased_grouped_topk_fn(gating_output, e_score_correction_bias,
-                           topk_weights_original, topk_ids_original)
-    compiled_fn(gating_output, e_score_correction_bias, topk_weights_compiled,
-                topk_ids_compiled)
+    biased_grouped_topk_fn(
+        gating_output, e_score_correction_bias, topk_weights_original, topk_ids_original
+    )
+    compiled_fn(
+        gating_output, e_score_correction_bias, topk_weights_compiled, topk_ids_compiled
+    )
 
     # Sort the results for comparison since the order might not be deterministic
     topk_ids_original, indices_original = torch.sort(topk_ids_original)
-    topk_weights_original = torch.gather(topk_weights_original, 1,
-                                         indices_original)
+    topk_weights_original = torch.gather(topk_weights_original, 1, indices_original)
 
     topk_ids_compiled, indices_compiled = torch.sort(topk_ids_compiled)
-    topk_weights_compiled = torch.gather(topk_weights_compiled, 1,
-                                         indices_compiled)
+    topk_weights_compiled = torch.gather(topk_weights_compiled, 1, indices_compiled)
 
     # Verify results match
-    assert torch.allclose(topk_weights_original,
-                          topk_weights_compiled,
-                          rtol=1e-2,
-                          atol=1e-2)
+    assert torch.allclose(
+        topk_weights_original, topk_weights_compiled, rtol=1e-2, atol=1e-2
+    )
     assert torch.allclose(topk_ids_original, topk_ids_compiled)
 
 
@@ -144,73 +147,73 @@ def test_rocm_aiter_grouped_topk_torch_compile_compatibility():
     scoring_func = "softmax"
     scale_factor = 1.0
 
-    gating_output = torch.randn((token, expert),
-                                dtype=torch.bfloat16,
-                                device="cuda")
+    gating_output = torch.randn((token, expert), dtype=torch.bfloat16, device="cuda")
 
     device = gating_output.device
     topk_ids = torch.empty((token, topk), dtype=torch.int32, device=device)
-    topk_weights = torch.empty((token, topk),
-                               dtype=torch.float32,
-                               device=device)
+    topk_weights = torch.empty((token, topk), dtype=torch.float32, device=device)
 
     # Define a function that uses the op
     def grouped_topk_fn(gating_output, topk_weights, topk_ids, scoring_func):
         return torch.ops.vllm.rocm_aiter_grouped_topk(
-            gating_output, topk_weights, topk_ids, num_expert_group,
-            topk_group, renormalize, scoring_func, scale_factor)
+            gating_output,
+            topk_weights,
+            topk_ids,
+            num_expert_group,
+            topk_group,
+            renormalize,
+            scoring_func,
+            scale_factor,
+        )
 
     # Verify the op's fake implementation
-    torch.library.opcheck(torch.ops.vllm.rocm_aiter_grouped_topk,
-                          (gating_output, topk_weights, topk_ids),
-                          kwargs={
-                              "num_expert_group": num_expert_group,
-                              "topk_group": topk_group,
-                              "need_renorm": renormalize,
-                              "scoring_func": scoring_func,
-                              "routed_scaling_factor": scale_factor
-                          },
-                          test_utils=("test_faketensor"))
+    torch.library.opcheck(
+        torch.ops.vllm.rocm_aiter_grouped_topk,
+        (gating_output, topk_weights, topk_ids),
+        kwargs={
+            "num_expert_group": num_expert_group,
+            "topk_group": topk_group,
+            "need_renorm": renormalize,
+            "scoring_func": scoring_func,
+            "routed_scaling_factor": scale_factor,
+        },
+        test_utils=("test_faketensor"),
+    )
 
     # Compile the function with appropriate settings
-    compiled_fn = torch.compile(grouped_topk_fn,
-                                fullgraph=True,
-                                backend="inductor",
-                                mode="reduce-overhead",
-                                dynamic=False)
-
-    topk_weights_original = torch.empty((token, topk),
-                                        dtype=torch.float32,
-                                        device=device)
-    topk_ids_original = torch.empty((token, topk),
-                                    dtype=torch.int32,
-                                    device=device)
-
-    topk_weights_compiled = torch.empty((token, topk),
-                                        dtype=torch.float32,
-                                        device=device)
-    topk_ids_compiled = torch.empty((token, topk),
-                                    dtype=torch.int32,
-                                    device=device)
+    compiled_fn = torch.compile(
+        grouped_topk_fn,
+        fullgraph=True,
+        backend="inductor",
+        mode="reduce-overhead",
+        dynamic=False,
+    )
+
+    topk_weights_original = torch.empty(
+        (token, topk), dtype=torch.float32, device=device
+    )
+    topk_ids_original = torch.empty((token, topk), dtype=torch.int32, device=device)
+
+    topk_weights_compiled = torch.empty(
+        (token, topk), dtype=torch.float32, device=device
+    )
+    topk_ids_compiled = torch.empty((token, topk), dtype=torch.int32, device=device)
 
     # Run both compiled (V1 graph mode) and uncompiled versions (V1 eager mode)
-    grouped_topk_fn(gating_output, topk_weights_original, topk_ids_original,
-                    scoring_func)
-    compiled_fn(gating_output, topk_weights_compiled, topk_ids_compiled,
-                scoring_func)
+    grouped_topk_fn(
+        gating_output, topk_weights_original, topk_ids_original, scoring_func
+    )
+    compiled_fn(gating_output, topk_weights_compiled, topk_ids_compiled, scoring_func)
 
     # Sort the results for comparison since the order might not be deterministic
     topk_ids_original, indices_original = torch.sort(topk_ids_original)
-    topk_weights_original = torch.gather(topk_weights_original, 1,
-                                         indices_original)
+    topk_weights_original = torch.gather(topk_weights_original, 1, indices_original)
 
     topk_ids_compiled, indices_compiled = torch.sort(topk_ids_compiled)
-    topk_weights_compiled = torch.gather(topk_weights_compiled, 1,
-                                         indices_compiled)
+    topk_weights_compiled = torch.gather(topk_weights_compiled, 1, indices_compiled)
 
     # Verify results match
-    assert torch.allclose(topk_weights_original,
-                          topk_weights_compiled,
-                          rtol=1e-2,
-                          atol=1e-2)
+    assert torch.allclose(
+        topk_weights_original, topk_weights_compiled, rtol=1e-2, atol=1e-2
+    )
     assert torch.allclose(topk_ids_original, topk_ids_compiled)
diff --git a/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py b/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py
index 383b5ebfba9b..b6ca80e97e91 100644
--- a/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py
+++ b/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py
@@ -5,7 +5,8 @@
 import torch
 
 from vllm.model_executor.layers.fused_moe.batched_deep_gemm_moe import (
-    silu_mul_fp8_quant_deep_gemm_cuda)
+    silu_mul_fp8_quant_deep_gemm_cuda,
+)
 from vllm.platforms import current_platform
 from vllm.utils import cdiv
 
@@ -34,7 +35,6 @@
     (256, 16, 7168, fp8_dtype),
     (256, 32, 7168, fp8_dtype),
     (256, 64, 7168, fp8_dtype),
-
     # Only add a few fnuz tests to help with long CI times.
     (8, 512, 7168, torch.float8_e4m3fnuz),
     (8, 1024, 7168, torch.float8_e4m3fnuz),
@@ -52,15 +52,15 @@ def test_silu_mul_fp8_quant_deep_gemm(E, T, H, fp8_type):
     tokens_per_expert = torch.randint(
         low=T // 2,
         high=T,
-        size=(E, ),
+        size=(E,),
         dtype=torch.int32,
         device="cuda",
     )
 
     # Run the Triton kernel
-    y_q, y_s = silu_mul_fp8_quant_deep_gemm_cuda(y,
-                                                 tokens_per_expert,
-                                                 group_size=group_size)
+    y_q, y_s = silu_mul_fp8_quant_deep_gemm_cuda(
+        y, tokens_per_expert, group_size=group_size
+    )
 
     torch.cuda.synchronize()
     fp8_info = torch.finfo(fp8_dtype)
@@ -75,9 +75,9 @@ def test_silu_mul_fp8_quant_deep_gemm(E, T, H, fp8_type):
 
     for e in range(E):
         nt = tokens_per_expert[e].item()
-        ref_s = torch.empty((T, cdiv(H, group_size)),
-                            dtype=torch.float32,
-                            device="cuda")
+        ref_s = torch.empty(
+            (T, cdiv(H, group_size)), dtype=torch.float32, device="cuda"
+        )
         ref_q = torch.empty((T, H), dtype=fp8_dtype, device="cuda")
 
         for t in range(nt):
@@ -87,14 +87,17 @@ def test_silu_mul_fp8_quant_deep_gemm(E, T, H, fp8_type):
             # process full groups
             n_full_groups = H // group_size
             if n_full_groups > 0:
-                data_grp = data[:n_full_groups * group_size].view(
-                    n_full_groups, group_size)
+                data_grp = data[: n_full_groups * group_size].view(
+                    n_full_groups, group_size
+                )
                 amax = data_grp.abs().amax(dim=1).clamp(min=eps)
                 scale = amax / fp8_max
-                scaled = data[:n_full_groups *
-                              group_size] / scale.repeat_interleave(group_size)
-                ref_q_row[:n_full_groups * group_size] = scaled.clamp(
-                    fp8_min, fp8_max).to(fp8_dtype)
+                scaled = data[: n_full_groups * group_size] / scale.repeat_interleave(
+                    group_size
+                )
+                ref_q_row[: n_full_groups * group_size] = scaled.clamp(
+                    fp8_min, fp8_max
+                ).to(fp8_dtype)
                 ref_s[t, :n_full_groups] = scale
 
             # process remainder group
diff --git a/tests/kernels/moe/test_triton_moe_ptpc_fp8.py b/tests/kernels/moe/test_triton_moe_ptpc_fp8.py
index 1c31464b30e7..933cd9dbdeaa 100644
--- a/tests/kernels/moe/test_triton_moe_ptpc_fp8.py
+++ b/tests/kernels/moe/test_triton_moe_ptpc_fp8.py
@@ -11,13 +11,11 @@
 from vllm import _custom_ops as ops
 from vllm.config import VllmConfig, set_current_vllm_config
 from vllm.model_executor.layers.activation import SiluAndMul
-from vllm.model_executor.layers.fused_moe.config import (
-    fp8_w8a8_moe_quant_config)
+from vllm.model_executor.layers.fused_moe.config import fp8_w8a8_moe_quant_config
 from vllm.platforms import current_platform
 
 if current_platform.get_device_capability() < (9, 0):
-    pytest.skip("FP8 Triton requires CUDA 9.0 or higher",
-                allow_module_level=True)
+    pytest.skip("FP8 Triton requires CUDA 9.0 or higher", allow_module_level=True)
 
 vllm_config = VllmConfig()
 vllm_config.scheduler_config.max_num_seqs = 128
@@ -31,14 +29,13 @@ def native_w8a8_per_token_matmul(A, B, As, Bs, output_dtype=torch.float16):
     B = B.to(torch.float32)
 
     assert A.shape[-1] == B.shape[-1], "Dimension mismatch"
-    assert B.ndim == 2 and B.is_contiguous(
-    ), "B must be a 2D contiguous tensor"
+    assert B.ndim == 2 and B.is_contiguous(), "B must be a 2D contiguous tensor"
 
     # Reshape input
     M = A.numel() // A.shape[-1]
     B = B.t()  # Transpose weight matrix
     N, K = B.shape
-    origin_C_shape = A.shape[:-1] + (K, )
+    origin_C_shape = A.shape[:-1] + (K,)
     A = A.reshape(M, N)
 
     # As is per-token [M, 1], Bs is per-column [1, K]
@@ -88,17 +85,17 @@ def torch_w8a8_per_column_moe(a, w1, w2, w1_s, w2_s, score, topk):
             act_out = SiluAndMul().forward_native(inter_out)
             # Quantize activation output with per-token
             act_out_q, act_out_s = ops.scaled_fp8_quant(
-                act_out, use_per_token_if_dynamic=True)
+                act_out, use_per_token_if_dynamic=True
+            )
 
             # Second MLP layer
-            out[mask] = native_w8a8_per_token_matmul(act_out_q,
-                                                     w2[i],
-                                                     act_out_s,
-                                                     w2_s[i],
-                                                     output_dtype=a.dtype)
+            out[mask] = native_w8a8_per_token_matmul(
+                act_out_q, w2[i], act_out_s, w2_s[i], output_dtype=a.dtype
+            )
     # Apply routing weights and sum
-    return (out.view(B, -1, w2.shape[1]) *
-            topk_weight.view(B, -1, 1).to(out.dtype)).sum(dim=1)
+    return (
+        out.view(B, -1, w2.shape[1]) * topk_weight.view(B, -1, 1).to(out.dtype)
+    ).sum(dim=1)
 
 
 @pytest.fixture(autouse=True, scope="module")
@@ -116,8 +113,10 @@ def setup_cuda():
 SEEDS = [0]
 
 
-@pytest.mark.parametrize("M, N, K, E, topk, dtype, seed",
-                         itertools.product(M, N, K, E, TOP_KS, DTYPES, SEEDS))
+@pytest.mark.parametrize(
+    "M, N, K, E, topk, dtype, seed",
+    itertools.product(M, N, K, E, TOP_KS, DTYPES, SEEDS),
+)
 @torch.inference_mode()
 def test_w8a8_fp8_fused_moe(M, N, K, E, topk, dtype, seed):
     torch.manual_seed(seed)
@@ -133,12 +132,10 @@ def test_w8a8_fp8_fused_moe(M, N, K, E, topk, dtype, seed):
 
     # Generate int8 weights
     w1_fp32 = (torch.rand((E, 2 * N, K), dtype=torch.float32) - 0.5) * 2
-    w1 = (w1_fp32 * fp8_max).clamp(min=fp8_min,
-                                   max=fp8_max).to(torch.float8_e4m3fn)
+    w1 = (w1_fp32 * fp8_max).clamp(min=fp8_min, max=fp8_max).to(torch.float8_e4m3fn)
 
     w2_fp32 = (torch.rand((E, K, N), dtype=torch.float32) - 0.5) * 2
-    w2 = (w2_fp32 * fp8_max).clamp(min=fp8_min,
-                                   max=fp8_max).to(torch.float8_e4m3fn)
+    w2 = (w2_fp32 * fp8_max).clamp(min=fp8_min, max=fp8_max).to(torch.float8_e4m3fn)
 
     # Generate scale for each column (per-column quantization)
     w1_s = torch.rand(E, 2 * N, device=w1_fp32.device) * factor_for_scale
@@ -163,7 +160,7 @@ def test_w8a8_fp8_fused_moe(M, N, K, E, topk, dtype, seed):
         )
 
     # Check results
-    rel_diff = (torch.mean(
-        torch.abs(out.to(torch.float32) - ref_out.to(torch.float32))) /
-                torch.mean(torch.abs(ref_out.to(torch.float32))))
+    rel_diff = torch.mean(
+        torch.abs(out.to(torch.float32) - ref_out.to(torch.float32))
+    ) / torch.mean(torch.abs(ref_out.to(torch.float32)))
     assert rel_diff < 0.05
diff --git a/tests/kernels/moe/utils.py b/tests/kernels/moe/utils.py
index 7a0feb6a2079..9466dacb0c11 100644
--- a/tests/kernels/moe/utils.py
+++ b/tests/kernels/moe/utils.py
@@ -6,17 +6,17 @@
 
 import vllm._custom_ops as ops
 from tests.kernels.quant_utils import per_block_cast_to_int8
-from tests.kernels.quantization.nvfp4_utils import (FLOAT4_E2M1_MAX,
-                                                    FLOAT8_E4M3_MAX)
+from tests.kernels.quantization.nvfp4_utils import FLOAT4_E2M1_MAX, FLOAT8_E4M3_MAX
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import fused_experts, fused_topk
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.fused_moe.fused_batched_moe import (
-    BatchedPrepareAndFinalize, BatchedTritonExperts, NaiveBatchedExperts)
-from vllm.model_executor.layers.fused_moe.modular_kernel import (
-    FusedMoEModularKernel)
-from vllm.model_executor.layers.fused_moe.utils import (
-    moe_kernel_quantize_input)
+    BatchedPrepareAndFinalize,
+    BatchedTritonExperts,
+    NaiveBatchedExperts,
+)
+from vllm.model_executor.layers.fused_moe.modular_kernel import FusedMoEModularKernel
+from vllm.model_executor.layers.fused_moe.utils import moe_kernel_quantize_input
 from vllm.utils import round_up
 from vllm.utils.deep_gemm import per_block_cast_to_fp8
 
@@ -45,12 +45,7 @@ def triton_moe(
         a2_scale=a2_scale,
     )
 
-    return fused_experts(a,
-                         w1,
-                         w2,
-                         topk_weight,
-                         topk_ids,
-                         quant_config=quant_config)
+    return fused_experts(a, w1, w2, topk_weight, topk_ids, quant_config=quant_config)
 
 
 def batched_moe(
@@ -80,10 +75,9 @@ def batched_moe(
     )
 
     fused_experts = FusedMoEModularKernel(
-        BatchedPrepareAndFinalize(max_num_tokens,
-                                  num_dispatchers=1,
-                                  num_local_experts=w1.shape[0],
-                                  rank=0),
+        BatchedPrepareAndFinalize(
+            max_num_tokens, num_dispatchers=1, num_local_experts=w1.shape[0], rank=0
+        ),
         BatchedTritonExperts(
             max_num_tokens=max_num_tokens,
             num_dispatchers=1,
@@ -121,10 +115,9 @@ def naive_batched_moe(
     )
 
     fused_experts = FusedMoEModularKernel(
-        BatchedPrepareAndFinalize(max_num_tokens,
-                                  num_dispatchers=1,
-                                  num_local_experts=w1.shape[0],
-                                  rank=0),
+        BatchedPrepareAndFinalize(
+            max_num_tokens, num_dispatchers=1, num_local_experts=w1.shape[0], rank=0
+        ),
         NaiveBatchedExperts(
             max_num_tokens=max_num_tokens,
             num_dispatchers=1,
@@ -135,8 +128,9 @@ def naive_batched_moe(
     return fused_experts(a, w1, w2, topk_weight, topk_ids)
 
 
-def chunk_scales(scales: Optional[torch.Tensor], start: int,
-                 end: int) -> Optional[torch.Tensor]:
+def chunk_scales(
+    scales: Optional[torch.Tensor], start: int, end: int
+) -> Optional[torch.Tensor]:
     if scales is not None:
         if scales.numel() == 1:
             return scales
@@ -159,13 +153,15 @@ def make_quantized_test_activations(
     a_scale = None
 
     if quant_dtype is not None:
-        assert (quant_dtype == torch.float8_e4m3fn
-                or quant_dtype == torch.int8), "only fp8/int8 supported"
+        assert quant_dtype == torch.float8_e4m3fn or quant_dtype == torch.int8, (
+            "only fp8/int8 supported"
+        )
         a_q = torch.zeros_like(a, dtype=quant_dtype)
         a_scale_l = [None] * E
         for e in range(E):
             a_q[e], a_scale_l[e] = moe_kernel_quantize_input(
-                a[e], None, quant_dtype, per_act_token_quant, block_shape)
+                a[e], None, quant_dtype, per_act_token_quant, block_shape
+            )
         a_scale = torch.stack(a_scale_l)
 
         if not per_act_token_quant and block_shape is None:
@@ -181,8 +177,11 @@ def moe_quantize_weights(
     per_token_quant: bool,
     block_shape: Optional[list[int]],
 ) -> tuple[torch.Tensor, Optional[torch.Tensor], Optional[torch.Tensor]]:
-    assert (quant_dtype == torch.float8_e4m3fn or quant_dtype == torch.int8
-            or quant_dtype == "nvfp4"), "only fp8/int8/nvfp4 supported"
+    assert (
+        quant_dtype == torch.float8_e4m3fn
+        or quant_dtype == torch.int8
+        or quant_dtype == "nvfp4"
+    ), "only fp8/int8/nvfp4 supported"
 
     w_gs = None
 
@@ -199,10 +198,12 @@ def moe_quantize_weights(
     else:
         if quant_dtype == torch.int8:
             w, w_s = ops.scaled_int8_quant(
-                w, w_s, use_per_token_if_dynamic=per_token_quant)
+                w, w_s, use_per_token_if_dynamic=per_token_quant
+            )
         elif quant_dtype == torch.float8_e4m3fn:
             w, w_s = ops.scaled_fp8_quant(
-                w, w_s, use_per_token_if_dynamic=per_token_quant)
+                w, w_s, use_per_token_if_dynamic=per_token_quant
+            )
         elif quant_dtype == "nvfp4":
             assert not per_token_quant
             w_amax = torch.abs(w).max().to(torch.float32)
@@ -222,8 +223,7 @@ def make_test_weight(
     quant_dtype: Union[torch.dtype, str, None] = None,
     block_shape: Optional[list[int]] = None,
     per_out_ch_quant: bool = False,
-) -> tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor],
-           Optional[torch.Tensor]]:
+) -> tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor], Optional[torch.Tensor]]:
     w_16 = torch.randn((e, rows, cols), device="cuda", dtype=in_dtype) / 15
     w_gs = None
 
@@ -233,7 +233,8 @@ def make_test_weight(
         w_gs_l = [None] * e
         for idx in range(e):
             w_l[idx], w_s_l[idx], w_gs_l[idx] = moe_quantize_weights(
-                w_16[idx], None, quant_dtype, per_out_ch_quant, block_shape)
+                w_16[idx], None, quant_dtype, per_out_ch_quant, block_shape
+            )
 
         w = torch.stack(w_l)
         w_s = torch.stack(w_s_l)
@@ -264,26 +265,25 @@ def make_test_weights(
     quant_dtype: Union[torch.dtype, str, None] = None,
     block_shape: Optional[list[int]] = None,
     per_out_ch_quant: bool = False,
-) -> tuple[tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor],
-                 Optional[torch.Tensor]],
-           tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor],
-                 Optional[torch.Tensor]]]:
+) -> tuple[
+    tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor], Optional[torch.Tensor]],
+    tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor], Optional[torch.Tensor]],
+]:
     return (
-        make_test_weight(e, 2 * n, k, in_dtype, quant_dtype, block_shape,
-                         per_out_ch_quant),
-        make_test_weight(e, k, n, in_dtype, quant_dtype, block_shape,
-                         per_out_ch_quant),
+        make_test_weight(
+            e, 2 * n, k, in_dtype, quant_dtype, block_shape, per_out_ch_quant
+        ),
+        make_test_weight(e, k, n, in_dtype, quant_dtype, block_shape, per_out_ch_quant),
     )
 
 
 def per_token_cast_to_fp8(
-        x: torch.Tensor,
-        block_size: int = 128) -> tuple[torch.Tensor, torch.Tensor]:
+    x: torch.Tensor, block_size: int = 128
+) -> tuple[torch.Tensor, torch.Tensor]:
     assert x.dim() == 2
     m, n = x.shape
     pad_size = (block_size - (n % block_size)) % block_size
-    x = torch.nn.functional.pad(x,
-                                (0, pad_size), value=0) if pad_size > 0 else x
+    x = torch.nn.functional.pad(x, (0, pad_size), value=0) if pad_size > 0 else x
     x_view = x.view(m, -1, block_size)
     x_amax = x_view.abs().float().amax(dim=2).view(m, -1).clamp(1e-4)
     fp8_data = (x_view * (448.0 / x_amax.unsqueeze(2))).to(torch.float8_e4m3fn)
@@ -313,27 +313,31 @@ def make_test_quant_config(
     a1_gscale: Optional[torch.Tensor] = None
     a2_gscale: Optional[torch.Tensor] = None
     if quant_dtype == "nvfp4":
-        a1_gscale = torch.ones((e, ), device="cuda", dtype=torch.float32)
-        a2_gscale = torch.ones((e, ), device="cuda", dtype=torch.float32)
+        a1_gscale = torch.ones((e,), device="cuda", dtype=torch.float32)
+        a2_gscale = torch.ones((e,), device="cuda", dtype=torch.float32)
         a1_scale = a1_gscale
         a2_scale = a2_gscale
     else:
         a1_scale = None
         a2_scale = None
 
-    return w1, w2, FusedMoEQuantConfig.make(
-        quant_dtype,
-        per_act_token_quant=per_act_token_quant,
-        block_shape=block_shape,
-        w1_scale=w1_s,
-        w2_scale=w2_s,
-        a1_gscale=a1_gscale,
-        a2_gscale=a2_gscale,
-        a1_scale=a1_scale,
-        a2_scale=a2_scale,
-        # TODO: make sure this is handled properly
-        g1_alphas=(1 / w1_gs) if w1_gs is not None else None,
-        g2_alphas=(1 / w2_gs) if w2_gs is not None else None,
+    return (
+        w1,
+        w2,
+        FusedMoEQuantConfig.make(
+            quant_dtype,
+            per_act_token_quant=per_act_token_quant,
+            block_shape=block_shape,
+            w1_scale=w1_s,
+            w2_scale=w2_s,
+            a1_gscale=a1_gscale,
+            a2_gscale=a2_gscale,
+            a1_scale=a1_scale,
+            a2_scale=a2_scale,
+            # TODO: make sure this is handled properly
+            g1_alphas=(1 / w1_gs) if w1_gs is not None else None,
+            g2_alphas=(1 / w2_gs) if w2_gs is not None else None,
+        ),
     )
 
 
@@ -348,21 +352,23 @@ def fused_moe(
     global_num_experts: int = -1,
     expert_map: Optional[torch.Tensor] = None,
 ) -> torch.Tensor:
-    topk_weights, topk_ids, _ = fused_topk(hidden_states, score.float(), topk,
-                                           renormalize)
-    return fused_experts(hidden_states,
-                         w1,
-                         w2,
-                         topk_weights,
-                         topk_ids,
-                         global_num_experts=global_num_experts,
-                         expert_map=expert_map,
-                         quant_config=quant_config)
+    topk_weights, topk_ids, _ = fused_topk(
+        hidden_states, score.float(), topk, renormalize
+    )
+    return fused_experts(
+        hidden_states,
+        w1,
+        w2,
+        topk_weights,
+        topk_ids,
+        global_num_experts=global_num_experts,
+        expert_map=expert_map,
+        quant_config=quant_config,
+    )
 
 
 # CustomOp?
 class BaselineMM(torch.nn.Module):
-
     def __init__(
         self,
         b: torch.Tensor,
@@ -372,15 +378,11 @@ def __init__(
         self.b = b.to(dtype=torch.float32)
         self.out_dtype = out_dtype
 
-    def forward(
-            self,
-            a: torch.Tensor) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
-        return torch.mm(a.to(dtype=torch.float32),
-                        self.b).to(self.out_dtype), None
+    def forward(self, a: torch.Tensor) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
+        return torch.mm(a.to(dtype=torch.float32), self.b).to(self.out_dtype), None
 
 
 class TestMLP(torch.nn.Module):
-
     def __init__(
         self,
         w1: torch.Tensor,
@@ -410,7 +412,6 @@ def make_naive_shared_experts(
 
 
 class RealMLP(torch.nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -425,37 +426,48 @@ def __init__(
         w2_s: Optional[torch.Tensor] = None,
     ) -> None:
         from vllm.model_executor.layers.linear import (
-            MergedColumnParallelLinear, RowParallelLinear)
+            MergedColumnParallelLinear,
+            RowParallelLinear,
+        )
 
         super().__init__()
         self.gate_up_proj = MergedColumnParallelLinear(
-            hidden_size, [intermediate_size] * 2,
+            hidden_size,
+            [intermediate_size] * 2,
             bias=False,
             quant_config=quant_config,
-            prefix=f"{prefix}.gate_up_proj")
+            prefix=f"{prefix}.gate_up_proj",
+        )
         self.gate_up_proj.register_parameter(
-            "weight", torch.nn.Parameter(w1, requires_grad=False))
+            "weight", torch.nn.Parameter(w1, requires_grad=False)
+        )
         self.gate_up_proj.register_parameter(
-            "weight_scale", torch.nn.Parameter(w1_s, requires_grad=False))
+            "weight_scale", torch.nn.Parameter(w1_s, requires_grad=False)
+        )
         self.gate_up_proj.register_parameter(
-            "input_scale",
-            None)  #torch.nn.Parameter(None, requires_grad=False))
-        self.down_proj = RowParallelLinear(intermediate_size,
-                                           hidden_size,
-                                           bias=False,
-                                           quant_config=quant_config,
-                                           reduce_results=reduce_results,
-                                           prefix=f"{prefix}.down_proj")
+            "input_scale", None
+        )  # torch.nn.Parameter(None, requires_grad=False))
+        self.down_proj = RowParallelLinear(
+            intermediate_size,
+            hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            reduce_results=reduce_results,
+            prefix=f"{prefix}.down_proj",
+        )
         self.down_proj.register_parameter(
-            "weight", torch.nn.Parameter(w2, requires_grad=False))
+            "weight", torch.nn.Parameter(w2, requires_grad=False)
+        )
         self.down_proj.register_parameter(
-            "weight_scale", torch.nn.Parameter(w2_s, requires_grad=False))
+            "weight_scale", torch.nn.Parameter(w2_s, requires_grad=False)
+        )
         self.down_proj.register_parameter(
-            "input_scale",
-            None)  #torch.nn.Parameter(None, requires_grad=False))
+            "input_scale", None
+        )  # torch.nn.Parameter(None, requires_grad=False))
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -496,13 +508,6 @@ def make_shared_experts(
             w2_s = None
             quant_config = None
 
-        return RealMLP(K,
-                       N,
-                       w1,
-                       w2,
-                       "silu",
-                       quant_config,
-                       w1_s=w1_s,
-                       w2_s=w2_s)
+        return RealMLP(K, N, w1, w2, "silu", quant_config, w1_s=w1_s, w2_s=w2_s)
     finally:
         torch.set_default_dtype(old_dtype)
diff --git a/tests/kernels/quant_utils.py b/tests/kernels/quant_utils.py
index 01a1ad2e7a0a..d892f2a5acc0 100644
--- a/tests/kernels/quant_utils.py
+++ b/tests/kernels/quant_utils.py
@@ -5,8 +5,7 @@
 
 import torch
 
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    group_broadcast)
+from vllm.model_executor.layers.quantization.utils.quant_utils import group_broadcast
 from vllm.platforms import current_platform
 from vllm.utils import round_up
 
@@ -17,25 +16,31 @@
 
 
 def as_float32_tensor(x: Union[float, torch.tensor]) -> torch.tensor:
-    return torch.as_tensor(x, dtype=torch.float32, device='cuda')
+    return torch.as_tensor(x, dtype=torch.float32, device="cuda")
 
-def ref_dynamic_per_token_quant(x: torch.tensor,
-                                quant_dtype: torch.dtype,
-                                scale_ub: Optional[torch.tensor] = None) \
-        -> tuple[torch.tensor, torch.tensor]:
 
+def ref_dynamic_per_token_quant(
+    x: torch.tensor, quant_dtype: torch.dtype, scale_ub: Optional[torch.tensor] = None
+) -> tuple[torch.tensor, torch.tensor]:
     assert quant_dtype in [torch.int8, FP8_DTYPE]
     if scale_ub is not None:
         assert quant_dtype == FP8_DTYPE
 
-    qtype_traits = torch.iinfo(quant_dtype) if quant_dtype == torch.int8 \
-            else torch.finfo(quant_dtype)
-    qtype_traits_max = ROCM_FP8FNUZ_MAX if current_platform.is_rocm() \
-                                            and current_platform.is_fp8_fnuz() \
-                                        else qtype_traits.max
-    qtype_traits_min = -ROCM_FP8FNUZ_MAX if current_platform.is_rocm() \
-                                            and current_platform.is_fp8_fnuz() \
-                                        else qtype_traits.min
+    qtype_traits = (
+        torch.iinfo(quant_dtype)
+        if quant_dtype == torch.int8
+        else torch.finfo(quant_dtype)
+    )
+    qtype_traits_max = (
+        ROCM_FP8FNUZ_MAX
+        if current_platform.is_rocm() and current_platform.is_fp8_fnuz()
+        else qtype_traits.max
+    )
+    qtype_traits_min = (
+        -ROCM_FP8FNUZ_MAX
+        if current_platform.is_rocm() and current_platform.is_fp8_fnuz()
+        else qtype_traits.min
+    )
     qtype_max = as_float32_tensor(qtype_traits_max)
     s_1 = as_float32_tensor(1.0)
     s_512 = as_float32_tensor(512.0)
@@ -56,15 +61,13 @@ def ref_dynamic_per_token_quant(x: torch.tensor,
         iscales = as_float32_tensor(s_1 / scales)
         torch_out = as_float32_tensor(x) * iscales
         torch_out = torch_out.round()
-        torch_out = torch_out.clamp(qtype_traits_min,
-                                    qtype_traits_max).to(quant_dtype)
+        torch_out = torch_out.clamp(qtype_traits_min, qtype_traits_max).to(quant_dtype)
     else:
         assert quant_dtype == FP8_DTYPE
         min_scaling_factor = s_1 / (qtype_max * s_512)
         scales = scales.clamp(min=min_scaling_factor)
         torch_out = as_float32_tensor(x) / scales
-        torch_out = torch_out.clamp(qtype_traits_min,
-                                    qtype_traits_max).to(quant_dtype)
+        torch_out = torch_out.clamp(qtype_traits_min, qtype_traits_max).to(quant_dtype)
 
     return torch_out, scales
 
@@ -72,16 +75,20 @@ def ref_dynamic_per_token_quant(x: torch.tensor,
 # The int8 version is very similar. Incorporate the int8 version, like in
 # ref_dynamic_per_token_quant, when we have a dynamic_per_tensor int8 quant
 # kernel
-def ref_dynamic_per_tensor_fp8_quant(x: torch.tensor) \
-                    -> tuple[torch.tensor, torch.tensor]:
-
+def ref_dynamic_per_tensor_fp8_quant(
+    x: torch.tensor,
+) -> tuple[torch.tensor, torch.tensor]:
     fp8_traits = torch.finfo(FP8_DTYPE)
-    fp8_traits_max = ROCM_FP8FNUZ_MAX if current_platform.is_rocm() \
-                                            and current_platform.is_fp8_fnuz() \
-                                    else fp8_traits.max
-    fp8_traits_min = -ROCM_FP8FNUZ_MAX if current_platform.is_rocm() \
-                                            and current_platform.is_fp8_fnuz() \
-                                    else fp8_traits.min
+    fp8_traits_max = (
+        ROCM_FP8FNUZ_MAX
+        if current_platform.is_rocm() and current_platform.is_fp8_fnuz()
+        else fp8_traits.max
+    )
+    fp8_traits_min = (
+        -ROCM_FP8FNUZ_MAX
+        if current_platform.is_rocm() and current_platform.is_fp8_fnuz()
+        else fp8_traits.min
+    )
     fp8_max = as_float32_tensor(fp8_traits_max)
     one = as_float32_tensor(1.0)
 
@@ -92,9 +99,12 @@ def ref_dynamic_per_tensor_fp8_quant(x: torch.tensor) \
     x_max = as_float32_tensor(x.abs().max())
     ref_scale = x_max / fp8_max
     ref_iscale = one / ref_scale
-    ref_out = (as_float32_tensor(x) * ref_iscale).clamp(
-        fp8_traits_min, fp8_traits_max).to(FP8_DTYPE)
-    return ref_out, ref_scale.view((1, ))
+    ref_out = (
+        (as_float32_tensor(x) * ref_iscale)
+        .clamp(fp8_traits_min, fp8_traits_max)
+        .to(FP8_DTYPE)
+    )
+    return ref_out, ref_scale.view((1,))
 
 
 def native_w8a8_block_matmul(
@@ -126,7 +136,7 @@ def native_w8a8_block_matmul(
 
     M = A.numel() // A.shape[-1]
     N, K = B.shape
-    origin_C_shape = A.shape[:-1] + (N, )
+    origin_C_shape = A.shape[:-1] + (N,)
     A = A.reshape(M, A.shape[-1])
     As = As.reshape(M, As.shape[-1])
     n_tiles = (N + block_n - 1) // block_n
@@ -137,19 +147,19 @@ def native_w8a8_block_matmul(
     C_shape = (M, N)
     C = torch.zeros(C_shape, dtype=compute_type, device=A.device)
 
-    A_tiles = [
-        A[:, i * block_k:min((i + 1) * block_k, K)] for i in range(k_tiles)
-    ]
-    B_tiles = [[
-        B[
-            j * block_n:min((j + 1) * block_n, N),
-            i * block_k:min((i + 1) * block_k, K),
-        ] for i in range(k_tiles)
-    ] for j in range(n_tiles)]
-    C_tiles = [
-        C[:, j * block_n:min((j + 1) * block_n, N)] for j in range(n_tiles)
+    A_tiles = [A[:, i * block_k : min((i + 1) * block_k, K)] for i in range(k_tiles)]
+    B_tiles = [
+        [
+            B[
+                j * block_n : min((j + 1) * block_n, N),
+                i * block_k : min((i + 1) * block_k, K),
+            ]
+            for i in range(k_tiles)
+        ]
+        for j in range(n_tiles)
     ]
-    As_tiles = [As[:, i:i + 1] for i in range(k_tiles)]
+    C_tiles = [C[:, j * block_n : min((j + 1) * block_n, N)] for j in range(n_tiles)]
+    As_tiles = [As[:, i : i + 1] for i in range(k_tiles)]
 
     for i in range(k_tiles):
         for j in range(n_tiles):
@@ -163,14 +173,14 @@ def native_w8a8_block_matmul(
     return C
 
 
-def native_per_token_group_quant_fp8(x,
-                                     group_size,
-                                     eps=1e-10,
-                                     dtype=torch.float8_e4m3fn):
+def native_per_token_group_quant_fp8(
+    x, group_size, eps=1e-10, dtype=torch.float8_e4m3fn
+):
     """Function to perform per-token-group quantization on an input tensor
     `x` using native torch."""
-    assert x.shape[-1] % group_size == 0, ("the last dimension of `x` must "
-                                           "be divisible by `group_size`")
+    assert x.shape[-1] % group_size == 0, (
+        "the last dimension of `x` must be divisible by `group_size`"
+    )
     assert x.is_contiguous(), "`x` is not contiguous"
 
     finfo = torch.finfo(dtype)
@@ -178,28 +188,25 @@ def native_per_token_group_quant_fp8(x,
     fp8_max = finfo.max
 
     x_ = x.reshape(x.numel() // group_size, group_size)
-    amax = x_.abs().max(dim=-1,
-                        keepdim=True)[0].clamp(min=eps).to(torch.float32)
+    amax = x_.abs().max(dim=-1, keepdim=True)[0].clamp(min=eps).to(torch.float32)
     x_s = amax / fp8_max
     x_q = (x_ / x_s).clamp(min=fp8_min, max=fp8_max).to(dtype)
     x_q = x_q.reshape(x.shape)
-    x_s = x_s.reshape(x.shape[:-1] + (x.shape[-1] // group_size, ))
+    x_s = x_s.reshape(x.shape[:-1] + (x.shape[-1] // group_size,))
 
     return x_q, x_s
 
 
-def native_per_token_group_quant_int8(x,
-                                      group_size,
-                                      eps=1e-10,
-                                      dtype=torch.int8):
+def native_per_token_group_quant_int8(x, group_size, eps=1e-10, dtype=torch.int8):
     """Function to perform per-token-group quantization on an input tensor
     `x` using native torch.
 
     It converts the tensor values into int8 values and returns the
     quantized tensor along with the scaling factor used for quantization.
     """
-    assert (x.shape[-1] % group_size == 0
-            ), "the last dimension of `x` must be divisible by `group_size`"
+    assert x.shape[-1] % group_size == 0, (
+        "the last dimension of `x` must be divisible by `group_size`"
+    )
     assert x.is_contiguous(), "`x` is not contiguous"
 
     iinfo = torch.iinfo(dtype)
@@ -208,13 +215,13 @@ def native_per_token_group_quant_int8(x,
 
     x_ = x.reshape(x.numel() // group_size, group_size)
     # Use float32 for scale calculation for stability
-    amax = x_.abs().max(dim=-1,
-                        keepdim=True)[0].clamp(min=eps).to(torch.float32)
+    amax = x_.abs().max(dim=-1, keepdim=True)[0].clamp(min=eps).to(torch.float32)
     x_s = amax / int8_max
-    x_q = (x_.to(torch.float32) / x_s).round().clamp(
-        min=int8_min, max=int8_max).to(dtype)  # Round before clamping
+    x_q = (
+        (x_.to(torch.float32) / x_s).round().clamp(min=int8_min, max=int8_max).to(dtype)
+    )  # Round before clamping
     x_q = x_q.reshape(x.shape)
-    x_s = x_s.reshape(x.shape[:-1] + (x.shape[-1] // group_size, ))
+    x_s = x_s.reshape(x.shape[:-1] + (x.shape[-1] // group_size,))
 
     return x_q, x_s
 
@@ -229,9 +236,9 @@ def per_block_cast_to_int8(
     block_m, block_n = block_shape
     assert x.dim() == 2
     m, n = x.shape
-    x_padded = torch.zeros((round_up(m, block_m), round_up(n, block_n)),
-                           dtype=x.dtype,
-                           device=x.device)
+    x_padded = torch.zeros(
+        (round_up(m, block_m), round_up(n, block_n)), dtype=x.dtype, device=x.device
+    )
     x_padded[:m, :n] = x
     x_view = x_padded.view(-1, block_m, x_padded.size(1) // block_n, block_n)
     x_amax = x_view.abs().float().amax(dim=(1, 3), keepdim=True).clamp(1e-4)
@@ -269,8 +276,9 @@ def batched_dequant(
         assert t.shape[0] == scale.shape[0]
         out = torch.empty_like(t, dtype=out_dtype)
         for e in range(t.shape[0]):
-            out[e] = dequant(t[e], scale[e], block_shape, per_act_token_quant,
-                             out_dtype)
+            out[e] = dequant(
+                t[e], scale[e], block_shape, per_act_token_quant, out_dtype
+            )
         return out
 
     return t.to(out_dtype)
@@ -294,15 +302,17 @@ def native_batched_masked_quant_matmul(
         num_tokens = num_expert_tokens_cpu[e]
         if A.dtype.itemsize == 1 and block_shape is not None:
             assert A_scale is not None and B_scale is not None
-            tmp = native_w8a8_block_matmul(A[e], B[e], A_scale[e], B_scale[e],
-                                           block_shape, C.dtype)
+            tmp = native_w8a8_block_matmul(
+                A[e], B[e], A_scale[e], B_scale[e], block_shape, C.dtype
+            )
             C[e, :num_tokens, :] = tmp[:num_tokens, :]
         elif A.dtype.itemsize == 1 and block_shape is None:
             assert A_scale is not None and B_scale is not None
             A_dq = dequant(A[e], A_scale[e], block_shape, per_act_token_quant)
             B_dq = dequant(B[e], B_scale[e], block_shape, per_act_token_quant)
-            C[e, :num_tokens, :] = (
-                A_dq[:num_tokens] @ B_dq.transpose(0, 1)).to(C.dtype)
+            C[e, :num_tokens, :] = (A_dq[:num_tokens] @ B_dq.transpose(0, 1)).to(
+                C.dtype
+            )
         else:
             assert A_scale is None
             assert B_scale is None
diff --git a/tests/kernels/quantization/nvfp4_utils.py b/tests/kernels/quantization/nvfp4_utils.py
index fc4e12555018..50be6841560b 100644
--- a/tests/kernels/quantization/nvfp4_utils.py
+++ b/tests/kernels/quantization/nvfp4_utils.py
@@ -8,8 +8,9 @@
 FLOAT4_E2M1_MAX = scalar_types.float4_e2m1f.max()
 FLOAT8_E4M3_MAX = torch.finfo(torch.float8_e4m3fn).max
 
-kE2M1ToFloat = torch.tensor([0., 0.5, 1., 1.5, 2., 3., 4., 6.],
-                            dtype=torch.float32)
+kE2M1ToFloat = torch.tensor(
+    [0.0, 0.5, 1.0, 1.5, 2.0, 3.0, 4.0, 6.0], dtype=torch.float32
+)
 
 
 def convert_swizzled_to_linear(a_sf_swizzled: torch.Tensor, m, k, block_size):
@@ -22,12 +23,9 @@ def convert_swizzled_to_linear(a_sf_swizzled: torch.Tensor, m, k, block_size):
     return out[0:m, 0:k]
 
 
-def dequantize_nvfp4_to_dtype(tensor_fp4,
-                              tensor_sf,
-                              global_scale,
-                              dtype,
-                              device,
-                              block_size=16):
+def dequantize_nvfp4_to_dtype(
+    tensor_fp4, tensor_sf, global_scale, dtype, device, block_size=16
+):
     """Dequantize the fp4 tensor back to high precision."""
     # Two fp4 values are packed into one uint8.
     assert tensor_fp4.dtype == torch.uint8
@@ -69,7 +67,8 @@ def break_fp4_bytes(a, dtype):
 
 
 def quant_nvfp4_tensor(a: torch.Tensor):
-    a_global_scale = ((FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) /
-                      torch.abs(a).max().to(torch.float32))
+    a_global_scale = (FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) / torch.abs(a).max().to(
+        torch.float32
+    )
     a_quant, a_block_scale = scaled_fp4_quant(a, a_global_scale)
     return a_quant, a_block_scale, a_global_scale
diff --git a/tests/kernels/quantization/test_allspark_gemm.py b/tests/kernels/quantization/test_allspark_gemm.py
index 3de9cb364468..e5f056f04f8c 100644
--- a/tests/kernels/quantization/test_allspark_gemm.py
+++ b/tests/kernels/quantization/test_allspark_gemm.py
@@ -6,24 +6,25 @@
 from tests.kernels.utils import DEFAULT_OPCHECK_TEST_UTILS, opcheck
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.utils.allspark_utils import (
-    ALLSPARK_AMPERE_K_ALIGN, ALLSPARK_AMPERE_M_CUBLAS_THRESHOLD,
-    ALLSPARK_AMPERE_N_ALIGN)
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    quantize_weights)
+    ALLSPARK_AMPERE_K_ALIGN,
+    ALLSPARK_AMPERE_M_CUBLAS_THRESHOLD,
+    ALLSPARK_AMPERE_N_ALIGN,
+)
+from vllm.model_executor.layers.quantization.utils.quant_utils import quantize_weights
 from vllm.platforms import current_platform
 from vllm.scalar_type import scalar_types
 
 
-def is_gptq_allspark_supported(min_capability: int,
-                               max_capability: int) -> bool:
+def is_gptq_allspark_supported(min_capability: int, max_capability: int) -> bool:
     if not current_platform.is_cuda():
         return False
 
     capability = current_platform.get_device_capability()
     assert capability is not None
 
-    return capability.to_int() >= min_capability \
-        and capability.to_int() <= max_capability
+    return (
+        capability.to_int() >= min_capability and capability.to_int() <= max_capability
+    )
 
 
 MNK_FACTORS = [
@@ -43,7 +44,8 @@ def is_gptq_allspark_supported(min_capability: int,
 
 def compute_max_diff(output, output_ref):
     return torch.mean(torch.abs(output - output_ref)) / torch.mean(
-        torch.abs(output_ref))
+        torch.abs(output_ref)
+    )
 
 
 def rand_data(shape, dtype=torch.float16):
@@ -52,7 +54,8 @@ def rand_data(shape, dtype=torch.float16):
 
 @pytest.mark.skipif(
     not is_gptq_allspark_supported(80, 89),
-    reason="AllSpark Ampere kernel is not supported on this GPU type.")
+    reason="AllSpark Ampere kernel is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("mnk_factors", MNK_FACTORS)
 @pytest.mark.parametrize("group_size", [-1])
 @pytest.mark.parametrize("has_zp", HAS_ZP_OPTS)
@@ -67,8 +70,9 @@ def test_gptq_allspark_gemm_ampere(mnk_factors, group_size, has_zp, dtype):
     weight = rand_data((k, n), dtype=dtype)
 
     # Quantize (and apply act_order if provided)
-    w_ref, qw, s, zp = quantize_weights(weight, scalar_types.uint8b128,
-                                        group_size, has_zp)
+    w_ref, qw, s, zp = quantize_weights(
+        weight, scalar_types.uint8b128, group_size, has_zp
+    )
 
     qw = qw.to(torch.uint8)
     if has_zp:
@@ -79,20 +83,42 @@ def test_gptq_allspark_gemm_ampere(mnk_factors, group_size, has_zp, dtype):
 
     n_32align = (n + 32 - 1) // 32 * 32
 
-    qw_reorder, s_reorder, zp_reorder = ops.allspark_repack_weight(
-        qw, s, zp, has_zp)
-    opcheck(torch.ops._C.rearrange_kn_weight_as_n32k16_order,
-            (qw, s, zp, has_zp, qw_reorder, s_reorder, zp_reorder, k, n,
-             n_32align))
-
-    opcheck(torch.ops._C.allspark_w8a16_gemm,
-            (input, qw_reorder, s_reorder, zp_reorder, n, group_size, sm_count,
-             sm_version, ALLSPARK_AMPERE_M_CUBLAS_THRESHOLD, has_zp, True),
-            test_utils=DEFAULT_OPCHECK_TEST_UTILS)
-    output = ops.allspark_w8a16_gemm(input, qw_reorder, s_reorder, zp_reorder,
-                                     n, group_size, sm_count, sm_version,
-                                     ALLSPARK_AMPERE_M_CUBLAS_THRESHOLD,
-                                     has_zp, True)
+    qw_reorder, s_reorder, zp_reorder = ops.allspark_repack_weight(qw, s, zp, has_zp)
+    opcheck(
+        torch.ops._C.rearrange_kn_weight_as_n32k16_order,
+        (qw, s, zp, has_zp, qw_reorder, s_reorder, zp_reorder, k, n, n_32align),
+    )
+
+    opcheck(
+        torch.ops._C.allspark_w8a16_gemm,
+        (
+            input,
+            qw_reorder,
+            s_reorder,
+            zp_reorder,
+            n,
+            group_size,
+            sm_count,
+            sm_version,
+            ALLSPARK_AMPERE_M_CUBLAS_THRESHOLD,
+            has_zp,
+            True,
+        ),
+        test_utils=DEFAULT_OPCHECK_TEST_UTILS,
+    )
+    output = ops.allspark_w8a16_gemm(
+        input,
+        qw_reorder,
+        s_reorder,
+        zp_reorder,
+        n,
+        group_size,
+        sm_count,
+        sm_version,
+        ALLSPARK_AMPERE_M_CUBLAS_THRESHOLD,
+        has_zp,
+        True,
+    )
 
     output_ref = torch.matmul(input, w_ref)
     torch.cuda.synchronize()
diff --git a/tests/kernels/quantization/test_awq.py b/tests/kernels/quantization/test_awq.py
index bc0868123d82..efb62ca3799a 100644
--- a/tests/kernels/quantization/test_awq.py
+++ b/tests/kernels/quantization/test_awq.py
@@ -8,40 +8,42 @@
 from vllm import _custom_ops as ops  # noqa: F401
 
 
-@pytest.mark.skipif(not hasattr(torch.ops._C, "awq_dequantize"),
-                    reason="AWQ is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not hasattr(torch.ops._C, "awq_dequantize"),
+    reason="AWQ is not supported on this GPU type.",
+)
 def test_awq_dequantize_opcheck(monkeypatch: pytest.MonkeyPatch):
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_TRITON_AWQ", "0")
-        qweight = torch.randint(-2000000000,
-                                2000000000, (8192, 256),
-                                device='cuda',
-                                dtype=torch.int32)
-        scales = torch.rand((64, 2048), device='cuda', dtype=torch.float16)
-        zeros = torch.empty((64, 256), device='cuda', dtype=torch.int32)
+        qweight = torch.randint(
+            -2000000000, 2000000000, (8192, 256), device="cuda", dtype=torch.int32
+        )
+        scales = torch.rand((64, 2048), device="cuda", dtype=torch.float16)
+        zeros = torch.empty((64, 256), device="cuda", dtype=torch.int32)
         split_k_iters = 0
         thx = 0
         thy = 0
-        opcheck(torch.ops._C.awq_dequantize,
-                (qweight, scales, zeros, split_k_iters, thx, thy))
+        opcheck(
+            torch.ops._C.awq_dequantize,
+            (qweight, scales, zeros, split_k_iters, thx, thy),
+        )
 
 
 @pytest.mark.skip(reason="Not working; needs investigation.")
-@pytest.mark.skipif(not hasattr(torch.ops._C, "awq_gemm"),
-                    reason="AWQ is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not hasattr(torch.ops._C, "awq_gemm"),
+    reason="AWQ is not supported on this GPU type.",
+)
 def test_awq_gemm_opcheck(monkeypatch: pytest.MonkeyPatch):
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_TRITON_AWQ", "0")
-        input = torch.rand((2, 8192), device='cuda', dtype=torch.float16)
-        qweight = torch.randint(-2000000000,
-                                2000000000, (8192, 256),
-                                device='cuda',
-                                dtype=torch.int32)
-        scales = torch.randint(-2000000000,
-                               2000000000, (64, 256),
-                               device='cuda',
-                               dtype=torch.int32)
-        qzeros = torch.empty((64, 2048), device='cuda', dtype=torch.float16)
+        input = torch.rand((2, 8192), device="cuda", dtype=torch.float16)
+        qweight = torch.randint(
+            -2000000000, 2000000000, (8192, 256), device="cuda", dtype=torch.int32
+        )
+        scales = torch.randint(
+            -2000000000, 2000000000, (64, 256), device="cuda", dtype=torch.int32
+        )
+        qzeros = torch.empty((64, 2048), device="cuda", dtype=torch.float16)
         split_k_iters = 8
-        opcheck(torch.ops._C.awq_gemm,
-                (input, qweight, qzeros, scales, split_k_iters))
+        opcheck(torch.ops._C.awq_gemm, (input, qweight, qzeros, scales, split_k_iters))
diff --git a/tests/kernels/quantization/test_awq_triton.py b/tests/kernels/quantization/test_awq_triton.py
index 9354495642b2..069bd7435534 100644
--- a/tests/kernels/quantization/test_awq_triton.py
+++ b/tests/kernels/quantization/test_awq_triton.py
@@ -4,11 +4,15 @@
 
 Run `pytest tests/kernels/quantization/test_awq_triton.py`.
 """
+
 import pytest
 import torch
 
 from vllm.model_executor.layers.quantization.awq_triton import (
-    AWQ_TRITON_SUPPORTED_GROUP_SIZES, awq_dequantize_triton, awq_gemm_triton)
+    AWQ_TRITON_SUPPORTED_GROUP_SIZES,
+    awq_dequantize_triton,
+    awq_gemm_triton,
+)
 from vllm.platforms import current_platform
 
 device = "cuda"
@@ -33,23 +37,24 @@ def reverse_awq_order(t: torch.Tensor):
 # qweights - [R     , C // 8], int32
 # scales   - [R // G, C     ], float16
 # zeros    - [R // G, C // 8], int32
-def awq_dequantize_torch(qweight: torch.Tensor, scales: torch.Tensor,
-                         qzeros: torch.Tensor,
-                         group_size: int) -> torch.Tensor:
-
+def awq_dequantize_torch(
+    qweight: torch.Tensor, scales: torch.Tensor, qzeros: torch.Tensor, group_size: int
+) -> torch.Tensor:
     if group_size == -1:
         group_size = qweight.shape[0]
 
     bits = 4
     shifts = torch.arange(0, 32, bits, device=qzeros.device)
 
-    iweights = torch.bitwise_right_shift(qweight[:, :, None],
-                                         shifts[None, None, :]).to(torch.int8)
+    iweights = torch.bitwise_right_shift(qweight[:, :, None], shifts[None, None, :]).to(
+        torch.int8
+    )
 
     iweights = iweights.view(iweights.shape[0], -1)
 
-    zeros = torch.bitwise_right_shift(qzeros[:, :, None],
-                                      shifts[None, None, :]).to(torch.int8)
+    zeros = torch.bitwise_right_shift(qzeros[:, :, None], shifts[None, None, :]).to(
+        torch.int8
+    )
     zeros = zeros.view(qzeros.shape[0], -1)
     zeros = reverse_awq_order(zeros)
 
@@ -70,7 +75,6 @@ def awq_dequantize_torch(qweight: torch.Tensor, scales: torch.Tensor,
 @pytest.mark.parametrize("qweight_cols", [448, 576, 4736, 16, 32, 64, 128])
 @pytest.mark.parametrize("group_size", AWQ_TRITON_SUPPORTED_GROUP_SIZES)
 def test_dequantize(qweight_rows, qweight_cols, group_size):
-
     if group_size == -1:
         group_size = qweight_rows
 
@@ -84,25 +88,27 @@ def test_dequantize(qweight_rows, qweight_cols, group_size):
 
     current_platform.seed_everything(0)
 
-    qweight = torch.randint(0,
-                            torch.iinfo(torch.int32).max,
-                            (qweight_rows, qweight_cols),
-                            dtype=qweight_dtype,
-                            device=device)
-    scales = torch.rand(scales_rows,
-                        scales_cols,
-                        dtype=scales_dtype,
-                        device=device)
-    zeros = torch.randint(0,
-                          torch.iinfo(torch.int32).max,
-                          (zeros_rows, zeros_cols),
-                          dtype=zeros_dtype,
-                          device=device)
+    qweight = torch.randint(
+        0,
+        torch.iinfo(torch.int32).max,
+        (qweight_rows, qweight_cols),
+        dtype=qweight_dtype,
+        device=device,
+    )
+    scales = torch.rand(scales_rows, scales_cols, dtype=scales_dtype, device=device)
+    zeros = torch.randint(
+        0,
+        torch.iinfo(torch.int32).max,
+        (zeros_rows, zeros_cols),
+        dtype=zeros_dtype,
+        device=device,
+    )
 
     iweights_triton = awq_dequantize_triton(qweight, scales, zeros)
 
-    assert (not torch.any(torch.isinf(iweights_triton))
-            and not torch.any(torch.isnan(iweights_triton)))
+    assert not torch.any(torch.isinf(iweights_triton)) and not torch.any(
+        torch.isnan(iweights_triton)
+    )
 
     iweights_torch = awq_dequantize_torch(qweight, scales, zeros, group_size)
 
@@ -119,7 +125,6 @@ def test_dequantize(qweight_rows, qweight_cols, group_size):
 @pytest.mark.parametrize("group_size", AWQ_TRITON_SUPPORTED_GROUP_SIZES)
 @pytest.mark.parametrize("splitK", [1, 8])
 def test_gemm(N, K, M, splitK, group_size):
-
     if group_size == -1:
         group_size = K
 
@@ -138,35 +143,29 @@ def test_gemm(N, K, M, splitK, group_size):
 
     current_platform.seed_everything(0)
 
-    input = torch.rand((input_rows, input_cols),
-                       dtype=input_dtype,
-                       device=device)
-    qweight = torch.randint(0,
-                            torch.iinfo(torch.int32).max,
-                            (qweight_rows, qweight_cols),
-                            device=device)
-    qzeros = torch.randint(0,
-                           torch.iinfo(torch.int32).max,
-                           (qzeros_rows, qzeros_cols),
-                           device=device)
-    scales = torch.rand((scales_rows, scales_cols),
-                        dtype=scales_dtype,
-                        device=device)
-
-    output_triton = awq_gemm_triton(input, qweight, scales, qzeros,
-                                    split_k_iters)
-
-    assert (not torch.any(torch.isinf(output_triton))
-            and not torch.any(torch.isnan(output_triton)))
+    input = torch.rand((input_rows, input_cols), dtype=input_dtype, device=device)
+    qweight = torch.randint(
+        0, torch.iinfo(torch.int32).max, (qweight_rows, qweight_cols), device=device
+    )
+    qzeros = torch.randint(
+        0, torch.iinfo(torch.int32).max, (qzeros_rows, qzeros_cols), device=device
+    )
+    scales = torch.rand((scales_rows, scales_cols), dtype=scales_dtype, device=device)
+
+    output_triton = awq_gemm_triton(input, qweight, scales, qzeros, split_k_iters)
+
+    assert not torch.any(torch.isinf(output_triton)) and not torch.any(
+        torch.isnan(output_triton)
+    )
 
     dequantized_weights = awq_dequantize_triton(qweight, scales, qzeros)
 
     output_torch = torch.matmul(input, dequantized_weights)
 
-    assert (not torch.any(torch.isinf(output_torch))
-            and not torch.any(torch.isnan(output_torch)))
+    assert not torch.any(torch.isinf(output_torch)) and not torch.any(
+        torch.isnan(output_torch)
+    )
 
-    torch.testing.assert_close(output_triton.cpu(),
-                               output_torch.cpu(),
-                               atol=1e-1,
-                               rtol=1e-1)
+    torch.testing.assert_close(
+        output_triton.cpu(), output_torch.cpu(), atol=1e-1, rtol=1e-1
+    )
diff --git a/tests/kernels/quantization/test_block_fp8.py b/tests/kernels/quantization/test_block_fp8.py
index e02df540ce9d..a6dfb5428c52 100644
--- a/tests/kernels/quantization/test_block_fp8.py
+++ b/tests/kernels/quantization/test_block_fp8.py
@@ -7,20 +7,26 @@
 import pytest
 import torch
 
-from tests.kernels.quant_utils import (native_per_token_group_quant_fp8,
-                                       native_w8a8_block_matmul)
+from tests.kernels.quant_utils import (
+    native_per_token_group_quant_fp8,
+    native_w8a8_block_matmul,
+)
 from vllm.config import VllmConfig
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    cutlass_scaled_mm, per_token_group_quant_fp8, w8a8_triton_block_scaled_mm)
+    cutlass_scaled_mm,
+    per_token_group_quant_fp8,
+    w8a8_triton_block_scaled_mm,
+)
 from vllm.platforms import current_platform
 from vllm.utils import has_deep_gemm
-from vllm.utils.deep_gemm import (fp8_gemm_nt,
-                                  get_col_major_tma_aligned_tensor,
-                                  per_block_cast_to_fp8)
+from vllm.utils.deep_gemm import (
+    fp8_gemm_nt,
+    get_col_major_tma_aligned_tensor,
+    per_block_cast_to_fp8,
+)
 
 if current_platform.get_device_capability() < (9, 0):
-    pytest.skip("FP8 Triton requires CUDA 9.0 or higher",
-                allow_module_level=True)
+    pytest.skip("FP8 Triton requires CUDA 9.0 or higher", allow_module_level=True)
 
 vllm_config = VllmConfig()
 vllm_config.scheduler_config.max_num_seqs = 128
@@ -51,7 +57,8 @@ def setup_cuda():
 
 @pytest.mark.parametrize(
     "num_tokens,d,dtype,group_size,seed",
-    itertools.product(NUM_TOKENS, D, DTYPES, GROUP_SIZE, SEEDS))
+    itertools.product(NUM_TOKENS, D, DTYPES, GROUP_SIZE, SEEDS),
+)
 @torch.inference_mode()
 def test_per_token_group_quant_fp8(num_tokens, d, dtype, group_size, seed):
     torch.manual_seed(seed)
@@ -60,15 +67,14 @@ def test_per_token_group_quant_fp8(num_tokens, d, dtype, group_size, seed):
     ref_out, ref_scale = native_per_token_group_quant_fp8(x, group_size)
     out, scale = per_token_group_quant_fp8(x, group_size)
 
-    assert torch.allclose(out.to(torch.float32),
-                          ref_out.to(torch.float32),
-                          rtol=0.15)
+    assert torch.allclose(out.to(torch.float32), ref_out.to(torch.float32), rtol=0.15)
     assert torch.allclose(scale, ref_scale)
 
 
 @pytest.mark.parametrize(
     "M,N,K,block_size,out_dtype,seed",
-    itertools.product(M, N, K, BLOCK_SIZE, OUT_DTYPES, SEEDS))
+    itertools.product(M, N, K, BLOCK_SIZE, OUT_DTYPES, SEEDS),
+)
 @torch.inference_mode()
 def test_w8a8_block_fp8_matmul(M, N, K, block_size, out_dtype, seed):
     torch.manual_seed(seed)
@@ -89,14 +95,12 @@ def test_w8a8_block_fp8_matmul(M, N, K, block_size, out_dtype, seed):
     As = torch.rand(M, k_tiles, dtype=torch.float32) * factor_for_scale
     Bs = torch.rand(n_tiles, k_tiles, dtype=torch.float32) * factor_for_scale
 
-    ref_out = native_w8a8_block_matmul(A_fp8, B_fp8, As, Bs, block_size,
-                                       out_dtype)
-    out = w8a8_triton_block_scaled_mm(A_fp8, B_fp8, As, Bs, block_size,
-                                      out_dtype)
+    ref_out = native_w8a8_block_matmul(A_fp8, B_fp8, As, Bs, block_size, out_dtype)
+    out = w8a8_triton_block_scaled_mm(A_fp8, B_fp8, As, Bs, block_size, out_dtype)
 
-    rel_diff = (torch.mean(
-        torch.abs(out.to(torch.float32) - ref_out.to(torch.float32))) /
-                torch.mean(torch.abs(ref_out.to(torch.float32))))
+    rel_diff = torch.mean(
+        torch.abs(out.to(torch.float32) - ref_out.to(torch.float32))
+    ) / torch.mean(torch.abs(ref_out.to(torch.float32)))
     assert rel_diff < 0.001
 
 
@@ -127,32 +131,32 @@ def test_w8a8_block_fp8_cutlass_matmul():
 
     Bs = torch.rand(n_tiles, k_tiles, dtype=torch.float32) * factor_for_scale
     # Hopper requires row-major format for scales
-    Bs_cutlass = Bs.T.contiguous() if current_platform.is_device_capability(
-        90) else Bs
+    Bs_cutlass = Bs.T.contiguous() if current_platform.is_device_capability(90) else Bs
 
-    A_fp8, As = per_token_group_quant_fp8(A_fp32,
-                                          block_size[1],
-                                          column_major_scales=False)
+    A_fp8, As = per_token_group_quant_fp8(
+        A_fp32, block_size[1], column_major_scales=False
+    )
     # CUTLASS uses column-major format for scales
     A_fp8_cutlass, As_cutlass = per_token_group_quant_fp8(
-        A_fp32, block_size[1], column_major_scales=True)
+        A_fp32, block_size[1], column_major_scales=True
+    )
 
-    ref_out = native_w8a8_block_matmul(A_fp8, B_fp8, As, Bs, block_size,
-                                       out_dtype)
-    out = cutlass_scaled_mm(A_fp8_cutlass, B_fp8, As_cutlass, Bs_cutlass,
-                            block_size, out_dtype)
+    ref_out = native_w8a8_block_matmul(A_fp8, B_fp8, As, Bs, block_size, out_dtype)
+    out = cutlass_scaled_mm(
+        A_fp8_cutlass, B_fp8, As_cutlass, Bs_cutlass, block_size, out_dtype
+    )
 
-    rel_diff = (torch.mean(
-        torch.abs(out.to(torch.float32) - ref_out.to(torch.float32))) /
-                torch.mean(torch.abs(ref_out.to(torch.float32))))
+    rel_diff = torch.mean(
+        torch.abs(out.to(torch.float32) - ref_out.to(torch.float32))
+    ) / torch.mean(torch.abs(ref_out.to(torch.float32)))
     assert rel_diff < 0.001
 
 
 @pytest.mark.parametrize(
     "M,N,K,block_size,out_dtype,seed",
-    itertools.product(M, N, K, BLOCK_SIZE, OUT_DTYPES, SEEDS))
-@pytest.mark.skipif(not has_deep_gemm(),
-                    reason="DeepGemm kernels not available.")
+    itertools.product(M, N, K, BLOCK_SIZE, OUT_DTYPES, SEEDS),
+)
+@pytest.mark.skipif(not has_deep_gemm(), reason="DeepGemm kernels not available.")
 @torch.inference_mode()
 def test_w8a8_block_fp8_deep_gemm_matmul(M, N, K, block_size, out_dtype, seed):
     # only aligned sizes
@@ -172,20 +176,20 @@ def test_w8a8_block_fp8_deep_gemm_matmul(M, N, K, block_size, out_dtype, seed):
     As = As_fp8.to(torch.float32)
     Bs = Bs_fp8.to(torch.float32)
 
-    ref_out = native_w8a8_block_matmul(A_fp8, B_fp8, As, Bs, block_size,
-                                       out_dtype)
+    ref_out = native_w8a8_block_matmul(A_fp8, B_fp8, As, Bs, block_size, out_dtype)
 
     # Transpose earlier so that the testing will not trigger transposing kernels
     As_fp8 = get_col_major_tma_aligned_tensor(As_fp8)
 
-    out = torch.zeros((M, N), device='cuda', dtype=out_dtype)
+    out = torch.zeros((M, N), device="cuda", dtype=out_dtype)
 
-    assert As_fp8.shape == (M, (K + 127) //
-                            128), f"{As_fp8.shape} != {(M, (K + 127) // 128)}"
+    assert As_fp8.shape == (M, (K + 127) // 128), (
+        f"{As_fp8.shape} != {(M, (K + 127) // 128)}"
+    )
 
     fp8_gemm_nt((A_fp8, As_fp8), (B_fp8, Bs_fp8), out)
 
-    rel_diff = (torch.mean(
-        torch.abs(out.to(torch.float32) - ref_out.to(torch.float32))) /
-                torch.mean(torch.abs(ref_out.to(torch.float32))))
+    rel_diff = torch.mean(
+        torch.abs(out.to(torch.float32) - ref_out.to(torch.float32))
+    ) / torch.mean(torch.abs(ref_out.to(torch.float32)))
     assert rel_diff < 0.001
diff --git a/tests/kernels/quantization/test_block_int8.py b/tests/kernels/quantization/test_block_int8.py
index fac82cf9c8b5..dabc10a122f7 100644
--- a/tests/kernels/quantization/test_block_int8.py
+++ b/tests/kernels/quantization/test_block_int8.py
@@ -10,12 +10,12 @@
 from tests.kernels.quant_utils import native_w8a8_block_matmul
 from vllm.config import VllmConfig
 from vllm.model_executor.layers.quantization.utils.int8_utils import (
-    w8a8_block_int8_matmul)
+    w8a8_block_int8_matmul,
+)
 from vllm.platforms import current_platform
 
 if current_platform.get_device_capability() < (7, 0):
-    pytest.skip("INT8 Triton requires CUDA 7.0 or higher",
-                allow_module_level=True)
+    pytest.skip("INT8 Triton requires CUDA 7.0 or higher", allow_module_level=True)
 
 vllm_config = VllmConfig()
 vllm_config.scheduler_config.max_num_seqs = 128
@@ -36,8 +36,10 @@ def setup_cuda():
     torch.set_default_device("cuda")
 
 
-@pytest.mark.parametrize("M,N,K,block_size,out_dtype,seed",
-                         itertools.product(M, N, K, BLOCK_SIZE, DTYPES, SEEDS))
+@pytest.mark.parametrize(
+    "M,N,K,block_size,out_dtype,seed",
+    itertools.product(M, N, K, BLOCK_SIZE, DTYPES, SEEDS),
+)
 @torch.inference_mode()
 def test_w8a8_block_int8_matmul(M, N, K, block_size, out_dtype, seed):
     torch.manual_seed(seed)
@@ -58,11 +60,10 @@ def test_w8a8_block_int8_matmul(M, N, K, block_size, out_dtype, seed):
     As = torch.rand(M, k_tiles, dtype=torch.float32) * factor_for_scale
     Bs = torch.rand(n_tiles, k_tiles, dtype=torch.float32) * factor_for_scale
 
-    ref_out = native_w8a8_block_matmul(A_fp8, B_fp8, As, Bs, block_size,
-                                       out_dtype)
+    ref_out = native_w8a8_block_matmul(A_fp8, B_fp8, As, Bs, block_size, out_dtype)
     out = w8a8_block_int8_matmul(A_fp8, B_fp8, As, Bs, block_size, out_dtype)
 
-    rel_diff = (torch.mean(
-        torch.abs(out.to(torch.float32) - ref_out.to(torch.float32))) /
-                torch.mean(torch.abs(ref_out.to(torch.float32))))
+    rel_diff = torch.mean(
+        torch.abs(out.to(torch.float32) - ref_out.to(torch.float32))
+    ) / torch.mean(torch.abs(ref_out.to(torch.float32)))
     assert rel_diff < 0.001
diff --git a/tests/kernels/quantization/test_cutlass_2of4_sparse.py b/tests/kernels/quantization/test_cutlass_2of4_sparse.py
index ae61b3b3a28a..cfdb3658028a 100644
--- a/tests/kernels/quantization/test_cutlass_2of4_sparse.py
+++ b/tests/kernels/quantization/test_cutlass_2of4_sparse.py
@@ -11,12 +11,11 @@
 from tests.kernels.utils import baseline_scaled_mm, to_fp8, to_int8
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    sparse_cutlass_supported)
+    sparse_cutlass_supported,
+)
 from vllm.platforms import current_platform
 
-CUDA_DEVICES = [
-    f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)
-]
+CUDA_DEVICES = [f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)]
 
 capability = current_platform.get_device_capability()
 capability = capability[0] * 10 + capability[1]
@@ -40,9 +39,7 @@ def prune_to_2_4(tensor):
 
     # Create binary mask
     mask = torch.zeros_like(reshaped)
-    mask.scatter_(dim=1,
-                  index=indices,
-                  src=torch.ones_like(indices, dtype=mask.dtype))
+    mask.scatter_(dim=1, index=indices, src=torch.ones_like(indices, dtype=mask.dtype))
 
     # Apply mask and reshape back
     pruned = reshaped * mask
@@ -55,32 +52,31 @@ def prune_to_2_4(tensor):
 
 # This function checks that applying an identity matrix multiplication
 # to the compressed weights yields the original uncompressed weights.
-def check_compress_decompress_invariance(dtype: torch.dtype, b: torch.Tensor,
-                                         b_compressed: torch.Tensor,
-                                         b_metadata: torch.Tensor):
-
+def check_compress_decompress_invariance(
+    dtype: torch.dtype,
+    b: torch.Tensor,
+    b_compressed: torch.Tensor,
+    b_metadata: torch.Tensor,
+):
     # For float16 and bfloat16, cutlass_scaled_sparse_mm's output must be the
     # same dtype as its inputs. This line addresses that constraint while
     # arbitrarily using bfloat16 for the int8/fp8 cases.
     out_dtype = torch.float16 if dtype is torch.float16 else torch.bfloat16
 
-    eye = torch.eye(b.shape[0], device='cuda', dtype=dtype)
-    eye_scale = torch.ones(1, device='cuda', dtype=torch.float32)
-    b_decomp = ops.cutlass_scaled_sparse_mm(eye,
-                                            b_compressed,
-                                            b_metadata,
-                                            eye_scale,
-                                            eye_scale,
-                                            out_dtype=out_dtype)
+    eye = torch.eye(b.shape[0], device="cuda", dtype=dtype)
+    eye_scale = torch.ones(1, device="cuda", dtype=torch.float32)
+    b_decomp = ops.cutlass_scaled_sparse_mm(
+        eye, b_compressed, b_metadata, eye_scale, eye_scale, out_dtype=out_dtype
+    )
 
     torch.testing.assert_close(b.to(dtype=out_dtype), b_decomp)
 
 
 def make_rand_sparse_tensors(
-        dtype: torch.dtype, m: int, n: int, k: int
+    dtype: torch.dtype, m: int, n: int, k: int
 ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor, torch.Tensor]:
-    a = torch.randn((m, k), device='cuda')
-    b = torch.randn((n, k), device='cuda').t()
+    a = torch.randn((m, k), device="cuda")
+    b = torch.randn((n, k), device="cuda").t()
 
     if dtype == torch.int8:
         # ensure A and B aren't all zeros after rounding
@@ -107,32 +103,25 @@ def make_rand_sparse_tensors(
     return b_compressed, e, a, b
 
 
-@pytest.mark.skipif(not sparse_cutlass_supported(),
-                    reason="Sparse CUTLASS is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not sparse_cutlass_supported(),
+    reason="Sparse CUTLASS is not supported on this GPU type.",
+)
 # Test working with a subset of A and B for sparse matmul
 def test_cutlass_sparse_subset():
-
     big_m = 1024
     m, n, k = 512, 512, 512
 
     # Create tensors
-    b_comp, e, whole_a, b = make_rand_sparse_tensors(torch.float8_e4m3fn,
-                                                     big_m, n, k)
+    b_comp, e, whole_a, b = make_rand_sparse_tensors(torch.float8_e4m3fn, big_m, n, k)
     a = whole_a[0:m, 0:k]
     scale_a = torch.randn((1, 1), device="cuda", dtype=torch.float32) / 10
     scale_b = torch.randn((1, 1), device="cuda", dtype=torch.float32) / 10
 
-    out = ops.cutlass_scaled_sparse_mm(a,
-                                       b_comp,
-                                       e,
-                                       scale_a,
-                                       scale_b,
-                                       out_dtype=torch.bfloat16)
-    baseline = baseline_scaled_mm(a,
-                                  b,
-                                  scale_a,
-                                  scale_b,
-                                  out_dtype=torch.bfloat16)
+    out = ops.cutlass_scaled_sparse_mm(
+        a, b_comp, e, scale_a, scale_b, out_dtype=torch.bfloat16
+    )
+    baseline = baseline_scaled_mm(a, b, scale_a, scale_b, out_dtype=torch.bfloat16)
 
     torch.testing.assert_close(out, baseline, rtol=1e-1, atol=1e0)
 
@@ -161,105 +150,87 @@ def test_cutlass_sparse_subset():
 
 
 # Test working with a subset of A and B for sparse matmul
-@pytest.mark.skipif(not sparse_cutlass_supported(),
-                    reason="Sparse CUTLASS is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not sparse_cutlass_supported(),
+    reason="Sparse CUTLASS is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("m, n, k", MNK_FACTORS)
 @pytest.mark.parametrize("dtype", [torch.bfloat16, torch.float16])
 @pytest.mark.parametrize("use_bias", [True, False])
-def test_cutlass_sparse_gemm(m: int, k: int, n: int, dtype: type[torch.dtype],
-                             use_bias: bool):
-
+def test_cutlass_sparse_gemm(
+    m: int, k: int, n: int, dtype: type[torch.dtype], use_bias: bool
+):
     # Create tensors
     b_comp, e, a, b = make_rand_sparse_tensors(dtype, m, n, k)
     scale_a = torch.ones((1, 1), device="cuda", dtype=torch.float32)
     scale_b = torch.ones((1, 1), device="cuda", dtype=torch.float32)
 
-    bias = torch.rand((n, ), device="cuda", dtype=dtype) if use_bias else None
+    bias = torch.rand((n,), device="cuda", dtype=dtype) if use_bias else None
 
-    out = ops.cutlass_scaled_sparse_mm(a,
-                                       b_comp,
-                                       e,
-                                       scale_a,
-                                       scale_b,
-                                       out_dtype=dtype,
-                                       bias=bias)
+    out = ops.cutlass_scaled_sparse_mm(
+        a, b_comp, e, scale_a, scale_b, out_dtype=dtype, bias=bias
+    )
 
-    baseline = baseline_scaled_mm(a,
-                                  b,
-                                  scale_a,
-                                  scale_b,
-                                  out_dtype=dtype,
-                                  bias=bias)
+    baseline = baseline_scaled_mm(a, b, scale_a, scale_b, out_dtype=dtype, bias=bias)
 
     torch.testing.assert_close(out, baseline, rtol=1e-2, atol=3e-1)
 
 
-@pytest.mark.skipif(not sparse_cutlass_supported(),
-                    reason="Sparse CUTLASS is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not sparse_cutlass_supported(),
+    reason="Sparse CUTLASS is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("m, k, n", MNK_FACTORS)
-@pytest.mark.skipif(not current_platform.has_device_capability(89),
-                    reason="FP8 is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not current_platform.has_device_capability(89),
+    reason="FP8 is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("use_bias", [True, False])
 def test_cutlass_sparse_fp8_gemm(m: int, n: int, k: int, use_bias: bool):
-
     # Create tensors
     b_comp, e, a, b = make_rand_sparse_tensors(torch.float8_e4m3fn, m, n, k)
-    scale_a = (torch.randn((1, 1), device="cuda", dtype=torch.float32))
-    scale_b = (torch.randn((1, 1), device="cuda", dtype=torch.float32))
+    scale_a = torch.randn((1, 1), device="cuda", dtype=torch.float32)
+    scale_b = torch.randn((1, 1), device="cuda", dtype=torch.float32)
     out_dtype = torch.bfloat16
 
-    bias = torch.rand(
-        (n, ), device="cuda", dtype=out_dtype) * 10 if use_bias else None
+    bias = torch.rand((n,), device="cuda", dtype=out_dtype) * 10 if use_bias else None
 
-    out = ops.cutlass_scaled_sparse_mm(a,
-                                       b_comp,
-                                       e,
-                                       scale_a,
-                                       scale_b,
-                                       out_dtype=out_dtype,
-                                       bias=bias)
+    out = ops.cutlass_scaled_sparse_mm(
+        a, b_comp, e, scale_a, scale_b, out_dtype=out_dtype, bias=bias
+    )
 
-    baseline = baseline_scaled_mm(a,
-                                  b,
-                                  scale_a,
-                                  scale_b,
-                                  out_dtype=out_dtype,
-                                  bias=bias)
+    baseline = baseline_scaled_mm(
+        a, b, scale_a, scale_b, out_dtype=out_dtype, bias=bias
+    )
 
     torch.testing.assert_close(out, baseline, rtol=1e-2, atol=3e-1)
 
 
-@pytest.mark.skipif(not sparse_cutlass_supported(),
-                    reason="Sparse CUTLASS is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not sparse_cutlass_supported(),
+    reason="Sparse CUTLASS is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("m,k,n", MNK_FACTORS)
 @pytest.mark.parametrize("per_act_token", [True, False])
 @pytest.mark.parametrize("per_out_ch", [True, False])
 @pytest.mark.parametrize("use_bias", [True, False])
-def test_cutlass_sparse_int8_gemm(m: int, n: int, k: int, per_act_token: bool,
-                                  per_out_ch: bool, use_bias: bool):
-
+def test_cutlass_sparse_int8_gemm(
+    m: int, n: int, k: int, per_act_token: bool, per_out_ch: bool, use_bias: bool
+):
     # Create tensors
     b_comp, e, a, b = make_rand_sparse_tensors(torch.int8, m, n, k)
-    scale_a = (torch.randn((1, 1), device="cuda", dtype=torch.float32))
-    scale_b = (torch.randn((1, 1), device="cuda", dtype=torch.float32))
+    scale_a = torch.randn((1, 1), device="cuda", dtype=torch.float32)
+    scale_b = torch.randn((1, 1), device="cuda", dtype=torch.float32)
     out_dtype = torch.bfloat16
 
-    bias = torch.rand(
-        (n, ), device="cuda", dtype=out_dtype) * 10 if use_bias else None
-
-    out = ops.cutlass_scaled_sparse_mm(a,
-                                       b_comp,
-                                       e,
-                                       scale_a,
-                                       scale_b,
-                                       out_dtype=out_dtype,
-                                       bias=bias)
-
-    baseline = baseline_scaled_mm(a,
-                                  b,
-                                  scale_a,
-                                  scale_b,
-                                  out_dtype=out_dtype,
-                                  bias=bias)
+    bias = torch.rand((n,), device="cuda", dtype=out_dtype) * 10 if use_bias else None
+
+    out = ops.cutlass_scaled_sparse_mm(
+        a, b_comp, e, scale_a, scale_b, out_dtype=out_dtype, bias=bias
+    )
+
+    baseline = baseline_scaled_mm(
+        a, b, scale_a, scale_b, out_dtype=out_dtype, bias=bias
+    )
 
     torch.testing.assert_close(out, baseline, rtol=1e0, atol=2e0)
diff --git a/tests/kernels/quantization/test_cutlass_scaled_mm.py b/tests/kernels/quantization/test_cutlass_scaled_mm.py
index 65320509e173..abaf47391f83 100644
--- a/tests/kernels/quantization/test_cutlass_scaled_mm.py
+++ b/tests/kernels/quantization/test_cutlass_scaled_mm.py
@@ -4,6 +4,7 @@
 
 Run `pytest tests/kernels/quantization/test_cutlass_scaled_mm.py`.
 """
+
 import random
 
 import pytest
@@ -36,9 +37,7 @@
     (512, 24576, 128),
 ]
 
-CUDA_DEVICES = [
-    f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)
-]
+CUDA_DEVICES = [f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)]
 
 # -1 means full extent in that dimension
 TENSORWISE_GROUP_SHAPE = (-1, -1)
@@ -60,18 +59,19 @@ def group_scale_helper(shape, group_shape):
 def scale_shape(shape, group_shape):
     assert len(shape) == len(group_shape)
     group_shape = group_scale_helper(shape, group_shape)
-    return tuple(
-        cdiv(shape[i], group_shape[i]) for i in range(len(group_shape)))
-
-
-def cutlass_fp8_gemm_helper(m: int,
-                            n: int,
-                            k: int,
-                            a_scale_group_shape: tuple,
-                            b_scale_group_shape: tuple,
-                            use_bias: bool,
-                            out_dtype: type[torch.dtype] = torch.bfloat16,
-                            device: str = "cuda"):
+    return tuple(cdiv(shape[i], group_shape[i]) for i in range(len(group_shape)))
+
+
+def cutlass_fp8_gemm_helper(
+    m: int,
+    n: int,
+    k: int,
+    a_scale_group_shape: tuple,
+    b_scale_group_shape: tuple,
+    use_bias: bool,
+    out_dtype: type[torch.dtype] = torch.bfloat16,
+    device: str = "cuda",
+):
     # Test for a cutlass kernel with per-token activation quantization
     # and per-output channel weight quantization.
     a = to_fp8(torch.randn((m, k), device=device))
@@ -80,8 +80,8 @@ def cutlass_fp8_gemm_helper(m: int,
     a_scales_shape = scale_shape(a.shape, a_scale_group_shape)
     b_scales_shape = scale_shape(b.shape, b_scale_group_shape)
 
-    scale_a = (torch.randn(a_scales_shape, device=device, dtype=torch.float32))
-    scale_b = (torch.randn(b_scales_shape, device=device, dtype=torch.float32))
+    scale_a = torch.randn(a_scales_shape, device=device, dtype=torch.float32)
+    scale_b = torch.randn(b_scales_shape, device=device, dtype=torch.float32)
 
     # make scales M-major for blockwise quant, doesn't affect 1D scales
     scale_a = scale_a.t().contiguous().t()
@@ -89,7 +89,7 @@ def cutlass_fp8_gemm_helper(m: int,
     scale_b = scale_b.t().contiguous().t()
 
     if use_bias:
-        bias = torch.rand((n, ), device=device, dtype=out_dtype) * 10
+        bias = torch.rand((n,), device=device, dtype=out_dtype) * 10
     else:
         bias = None
 
@@ -98,18 +98,19 @@ def cutlass_fp8_gemm_helper(m: int,
 
     torch.testing.assert_close(out, baseline, rtol=5e-1, atol=1.5e-1)
 
-    opcheck(torch.ops._C.cutlass_scaled_mm,
-            (out, a, b, scale_a, scale_b, bias))
+    opcheck(torch.ops._C.cutlass_scaled_mm, (out, a, b, scale_a, scale_b, bias))
 
 
-def cutlass_int8_gemm_helper(m: int,
-                             n: int,
-                             k: int,
-                             a_scale_group_shape: tuple,
-                             b_scale_group_shape: tuple,
-                             use_bias: bool,
-                             out_dtype: type[torch.dtype] = torch.bfloat16,
-                             device: str = "cuda"):
+def cutlass_int8_gemm_helper(
+    m: int,
+    n: int,
+    k: int,
+    a_scale_group_shape: tuple,
+    b_scale_group_shape: tuple,
+    use_bias: bool,
+    out_dtype: type[torch.dtype] = torch.bfloat16,
+    device: str = "cuda",
+):
     # Test for a cutlass kernel with per-token activation quantization
     # and per-output channel weight quantization.
     a = to_int8(torch.randn((m, k), device=device) * 5)
@@ -118,11 +119,11 @@ def cutlass_int8_gemm_helper(m: int,
     a_scales_shape = scale_shape(a.shape, a_scale_group_shape)
     b_scales_shape = scale_shape(b.shape, b_scale_group_shape)
 
-    scale_a = (torch.randn(a_scales_shape, device=device, dtype=torch.float32))
-    scale_b = (torch.randn(b_scales_shape, device=device, dtype=torch.float32))
+    scale_a = torch.randn(a_scales_shape, device=device, dtype=torch.float32)
+    scale_b = torch.randn(b_scales_shape, device=device, dtype=torch.float32)
 
     if use_bias:
-        bias = torch.rand((n, ), device=device, dtype=out_dtype) * 10
+        bias = torch.rand((n,), device=device, dtype=out_dtype) * 10
     else:
         bias = None
 
@@ -131,145 +132,192 @@ def cutlass_int8_gemm_helper(m: int,
 
     torch.testing.assert_close(out, baseline, rtol=1e-1, atol=1e0)
 
-    opcheck(torch.ops._C.cutlass_scaled_mm,
-            (out, a, b, scale_a, scale_b, bias))
+    opcheck(torch.ops._C.cutlass_scaled_mm, (out, a, b, scale_a, scale_b, bias))
 
 
 @pytest.mark.parametrize("m,n,k", MNK_FACTORS)
-@pytest.mark.parametrize("a_scale_group_shape",
-                         [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
-@pytest.mark.parametrize("b_scale_group_shape",
-                         [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
+@pytest.mark.parametrize(
+    "a_scale_group_shape", [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
+@pytest.mark.parametrize(
+    "b_scale_group_shape", [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
 @pytest.mark.parametrize("use_bias", [True, False])
-@pytest.mark.skipif(not current_platform.has_device_capability(89),
-                    reason="FP8 is not supported on this GPU type.")
-def test_cutlass_fp8_gemm(m: int, n: int, k: int, a_scale_group_shape,
-                          b_scale_group_shape, use_bias: bool):
-    cutlass_fp8_gemm_helper(m, n, k, a_scale_group_shape, b_scale_group_shape,
-                            use_bias)
+@pytest.mark.skipif(
+    not current_platform.has_device_capability(89),
+    reason="FP8 is not supported on this GPU type.",
+)
+def test_cutlass_fp8_gemm(
+    m: int, n: int, k: int, a_scale_group_shape, b_scale_group_shape, use_bias: bool
+):
+    cutlass_fp8_gemm_helper(m, n, k, a_scale_group_shape, b_scale_group_shape, use_bias)
 
 
 @pytest.mark.parametrize("m,n,k", MNK_FACTORS)
-@pytest.mark.parametrize("a_scale_group_shape,b_scale_group_shape",
-                         [((1, 128), (128, 128))])
+@pytest.mark.parametrize(
+    "a_scale_group_shape,b_scale_group_shape", [((1, 128), (128, 128))]
+)
 @pytest.mark.parametrize("use_bias", [False])
-@pytest.mark.skipif(not current_platform.has_device_capability(90),
-                    reason="FP8 blockwise is not supported on this GPU type.")
-def test_cutlass_fp8_blockwise_scale_gemm(m: int, n: int, k: int,
-                                          a_scale_group_shape,
-                                          b_scale_group_shape, use_bias: bool):
+@pytest.mark.skipif(
+    not current_platform.has_device_capability(90),
+    reason="FP8 blockwise is not supported on this GPU type.",
+)
+def test_cutlass_fp8_blockwise_scale_gemm(
+    m: int, n: int, k: int, a_scale_group_shape, b_scale_group_shape, use_bias: bool
+):
     if k % b_scale_group_shape[0] != 0 or n % b_scale_group_shape[1] != 0:
         return
     if m % a_scale_group_shape[0] != 0 or k % a_scale_group_shape[1] != 0:
         return
     if m % 4 != 0 and current_platform.has_device_capability(100):
         return
-    cutlass_fp8_gemm_helper(m, n, k, a_scale_group_shape, b_scale_group_shape,
-                            use_bias)
+    cutlass_fp8_gemm_helper(m, n, k, a_scale_group_shape, b_scale_group_shape, use_bias)
 
 
 @pytest.mark.parametrize("m,n,k", MNK_FACTORS)
-@pytest.mark.parametrize("a_scale_group_shape",
-                         [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
-@pytest.mark.parametrize("b_scale_group_shape",
-                         [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
+@pytest.mark.parametrize(
+    "a_scale_group_shape", [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
+@pytest.mark.parametrize(
+    "b_scale_group_shape", [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
 @pytest.mark.parametrize("use_bias", [True, False])
-def test_cutlass_int8_gemm(m: int, n: int, k: int, a_scale_group_shape,
-                           b_scale_group_shape, use_bias: bool):
-    cutlass_int8_gemm_helper(m, n, k, a_scale_group_shape, b_scale_group_shape,
-                             use_bias)
-
-
-@pytest.mark.parametrize("a_scale_group_shape",
-                         [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
-@pytest.mark.parametrize("b_scale_group_shape",
-                         [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
+def test_cutlass_int8_gemm(
+    m: int, n: int, k: int, a_scale_group_shape, b_scale_group_shape, use_bias: bool
+):
+    cutlass_int8_gemm_helper(
+        m, n, k, a_scale_group_shape, b_scale_group_shape, use_bias
+    )
+
+
+@pytest.mark.parametrize(
+    "a_scale_group_shape", [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
+@pytest.mark.parametrize(
+    "b_scale_group_shape", [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
 @pytest.mark.parametrize("out_dtype", [torch.bfloat16, torch.float16])
 @pytest.mark.parametrize("use_bias", [True, False])
-def test_cutlass_int8_gemm_output_dtype(a_scale_group_shape,
-                                        b_scale_group_shape,
-                                        out_dtype: type[torch.dtype],
-                                        use_bias: bool):
-    cutlass_int8_gemm_helper(512,
-                             512,
-                             512,
-                             a_scale_group_shape,
-                             b_scale_group_shape,
-                             use_bias,
-                             out_dtype=out_dtype)
-
-
-@pytest.mark.parametrize("a_scale_group_shape",
-                         [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
-@pytest.mark.parametrize("b_scale_group_shape",
-                         [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
+def test_cutlass_int8_gemm_output_dtype(
+    a_scale_group_shape,
+    b_scale_group_shape,
+    out_dtype: type[torch.dtype],
+    use_bias: bool,
+):
+    cutlass_int8_gemm_helper(
+        512,
+        512,
+        512,
+        a_scale_group_shape,
+        b_scale_group_shape,
+        use_bias,
+        out_dtype=out_dtype,
+    )
+
+
+@pytest.mark.parametrize(
+    "a_scale_group_shape", [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
+@pytest.mark.parametrize(
+    "b_scale_group_shape", [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
 @pytest.mark.parametrize("out_dtype", [torch.bfloat16, torch.float16])
 @pytest.mark.parametrize("use_bias", [True, False])
-@pytest.mark.skipif(not current_platform.has_device_capability(89),
-                    reason="FP8 is not supported on this GPU type.")
-def test_cutlass_fp8_gemm_output_dtype(a_scale_group_shape,
-                                       b_scale_group_shape,
-                                       out_dtype: type[torch.dtype],
-                                       use_bias: bool):
-    cutlass_fp8_gemm_helper(512,
-                            512,
-                            512,
-                            a_scale_group_shape,
-                            b_scale_group_shape,
-                            use_bias,
-                            out_dtype=out_dtype)
-
-
-@pytest.mark.parametrize("a_scale_group_shape,b_scale_group_shape",
-                         [((1, 128), (128, 128))])
+@pytest.mark.skipif(
+    not current_platform.has_device_capability(89),
+    reason="FP8 is not supported on this GPU type.",
+)
+def test_cutlass_fp8_gemm_output_dtype(
+    a_scale_group_shape,
+    b_scale_group_shape,
+    out_dtype: type[torch.dtype],
+    use_bias: bool,
+):
+    cutlass_fp8_gemm_helper(
+        512,
+        512,
+        512,
+        a_scale_group_shape,
+        b_scale_group_shape,
+        use_bias,
+        out_dtype=out_dtype,
+    )
+
+
+@pytest.mark.parametrize(
+    "a_scale_group_shape,b_scale_group_shape", [((1, 128), (128, 128))]
+)
 @pytest.mark.parametrize("out_dtype", [torch.bfloat16, torch.float16])
 @pytest.mark.parametrize("use_bias", [False])
-@pytest.mark.skipif(not current_platform.has_device_capability(90),
-                    reason="FP8 blockwise is not supported on this GPU type.")
-def test_cutlass_fp8_blockwise_scale_gemm_dtype(a_scale_group_shape,
-                                                b_scale_group_shape,
-                                                out_dtype: type[torch.dtype],
-                                                use_bias: bool):
-    cutlass_fp8_gemm_helper(512,
-                            512,
-                            512,
-                            a_scale_group_shape,
-                            b_scale_group_shape,
-                            use_bias,
-                            out_dtype=out_dtype)
-
-
-@pytest.mark.parametrize("a_scale_group_shape",
-                         [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
-@pytest.mark.parametrize("b_scale_group_shape",
-                         [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
+@pytest.mark.skipif(
+    not current_platform.has_device_capability(90),
+    reason="FP8 blockwise is not supported on this GPU type.",
+)
+def test_cutlass_fp8_blockwise_scale_gemm_dtype(
+    a_scale_group_shape,
+    b_scale_group_shape,
+    out_dtype: type[torch.dtype],
+    use_bias: bool,
+):
+    cutlass_fp8_gemm_helper(
+        512,
+        512,
+        512,
+        a_scale_group_shape,
+        b_scale_group_shape,
+        use_bias,
+        out_dtype=out_dtype,
+    )
+
+
+@pytest.mark.parametrize(
+    "a_scale_group_shape", [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
+@pytest.mark.parametrize(
+    "b_scale_group_shape", [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
 @pytest.mark.parametrize("use_bias", [True, False])
 @pytest.mark.parametrize("device", CUDA_DEVICES)
-@pytest.mark.skipif(not current_platform.has_device_capability(89),
-                    reason="FP8 is not supported on this GPU type.")
-def test_cutlass_fp8_gemm_devices(a_scale_group_shape, b_scale_group_shape,
-                                  use_bias: bool, device: str):
-    cutlass_fp8_gemm_helper(512, 512, 512, a_scale_group_shape,
-                            b_scale_group_shape, use_bias, torch.bfloat16,
-                            device)
-
-
-@pytest.mark.parametrize("a_scale_group_shape",
-                         [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
-@pytest.mark.parametrize("b_scale_group_shape",
-                         [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
+@pytest.mark.skipif(
+    not current_platform.has_device_capability(89),
+    reason="FP8 is not supported on this GPU type.",
+)
+def test_cutlass_fp8_gemm_devices(
+    a_scale_group_shape, b_scale_group_shape, use_bias: bool, device: str
+):
+    cutlass_fp8_gemm_helper(
+        512,
+        512,
+        512,
+        a_scale_group_shape,
+        b_scale_group_shape,
+        use_bias,
+        torch.bfloat16,
+        device,
+    )
+
+
+@pytest.mark.parametrize(
+    "a_scale_group_shape", [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
+@pytest.mark.parametrize(
+    "b_scale_group_shape", [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
 @pytest.mark.parametrize("use_bias", [True, False])
 @pytest.mark.parametrize("device", CUDA_DEVICES)
-def test_cutlass_int8_gemm_devices(a_scale_group_shape, b_scale_group_shape,
-                                   use_bias: bool, device: str):
-    cutlass_int8_gemm_helper(512,
-                             512,
-                             512,
-                             a_scale_group_shape,
-                             b_scale_group_shape,
-                             use_bias,
-                             out_dtype=torch.bfloat16,
-                             device=device)
+def test_cutlass_int8_gemm_devices(
+    a_scale_group_shape, b_scale_group_shape, use_bias: bool, device: str
+):
+    cutlass_int8_gemm_helper(
+        512,
+        512,
+        512,
+        a_scale_group_shape,
+        b_scale_group_shape,
+        use_bias,
+        out_dtype=torch.bfloat16,
+        device=device,
+    )
 
 
 # For the following two tests:
@@ -277,32 +325,42 @@ def test_cutlass_int8_gemm_devices(a_scale_group_shape, b_scale_group_shape,
 # of a large power of two. In any case, the kernel will have a naive fallback
 # when N and K are not divisible by 16. But M is the number of tokens and the
 # kernel must handle any M thrown at it.
-@pytest.mark.parametrize("a_scale_group_shape",
-                         [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
-@pytest.mark.parametrize("b_scale_group_shape",
-                         [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
+@pytest.mark.parametrize(
+    "a_scale_group_shape", [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
+@pytest.mark.parametrize(
+    "b_scale_group_shape", [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
 @pytest.mark.parametrize("use_bias", [True, False])
-@pytest.mark.skipif(not current_platform.has_device_capability(89),
-                    reason="FP8 is not supported on this GPU type.")
-def test_cutlass_fp8_gemm_m_sweep(a_scale_group_shape, b_scale_group_shape,
-                                  use_bias: bool):
+@pytest.mark.skipif(
+    not current_platform.has_device_capability(89),
+    reason="FP8 is not supported on this GPU type.",
+)
+def test_cutlass_fp8_gemm_m_sweep(
+    a_scale_group_shape, b_scale_group_shape, use_bias: bool
+):
     for nk in range(32, 128, 32):
         for m in range(1, 128):
-            cutlass_fp8_gemm_helper(m, nk, nk, a_scale_group_shape,
-                                    b_scale_group_shape, use_bias)
+            cutlass_fp8_gemm_helper(
+                m, nk, nk, a_scale_group_shape, b_scale_group_shape, use_bias
+            )
 
 
-@pytest.mark.parametrize("a_scale_group_shape",
-                         [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
-@pytest.mark.parametrize("b_scale_group_shape",
-                         [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE])
+@pytest.mark.parametrize(
+    "a_scale_group_shape", [PER_TOKEN_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
+@pytest.mark.parametrize(
+    "b_scale_group_shape", [PER_OUT_CH_GROUP_SHAPE, TENSORWISE_GROUP_SHAPE]
+)
 @pytest.mark.parametrize("use_bias", [True, False])
-def test_cutlass_int8_gemm_m_sweep(a_scale_group_shape, b_scale_group_shape,
-                                   use_bias: bool):
+def test_cutlass_int8_gemm_m_sweep(
+    a_scale_group_shape, b_scale_group_shape, use_bias: bool
+):
     for nk in range(32, 128, 32):
         for m in range(1, 128):
-            cutlass_int8_gemm_helper(m, nk, nk, a_scale_group_shape,
-                                     b_scale_group_shape, use_bias)
+            cutlass_int8_gemm_helper(
+                m, nk, nk, a_scale_group_shape, b_scale_group_shape, use_bias
+            )
 
 
 @pytest.mark.parametrize("m", [32, 64, 128])
@@ -310,8 +368,7 @@ def test_cutlass_int8_gemm_m_sweep(a_scale_group_shape, b_scale_group_shape,
 @pytest.mark.parametrize("k", [64, 128, 256])
 @pytest.mark.parametrize("out_dtype", [torch.bfloat16, torch.float16])
 @pytest.mark.skip
-def test_cutlass_int8_azp_bias_fold(m: int, n: int, k: int,
-                                    out_dtype: torch.dtype):
+def test_cutlass_int8_azp_bias_fold(m: int, n: int, k: int, out_dtype: torch.dtype):
     # Currently, the test is failing because folding azp into
     # 16-bit bias loses too much precision
     scale_a = torch.randn((1, 1), device="cuda", dtype=torch.float32) / 10
@@ -328,7 +385,7 @@ def test_cutlass_int8_azp_bias_fold(m: int, n: int, k: int,
 
     b_dq = scale_b * bq_f32
 
-    azp_a = torch.rand((1, ), device="cuda", dtype=torch.float32) * 10 + 1.5
+    azp_a = torch.rand((1,), device="cuda", dtype=torch.float32) * 10 + 1.5
     azp_aq_i8 = (azp_a / scale_a).to(dtype=torch.int8)
     azp_a = azp_aq_i8.to(dtype=torch.float32) * scale_a  # correct for rounding
 
@@ -340,18 +397,17 @@ def test_cutlass_int8_azp_bias_fold(m: int, n: int, k: int,
     J = torch.ones((1, k), device="cuda", dtype=torch.float32)
     azp_bias = (azp_a * scale_b * (J @ bq_f32)).to(out_dtype)
     assert azp_bias.shape == (1, n)
-    assert azp_bias[0, :].shape == (n, )
-
-    baseline_q = (scale_a.to(device='cpu') * scale_b.to(device='cpu') * (
-        (aq_i32 + azp_aq_i8).to(device='cpu') @ bq_i32.to(device='cpu'))).to(
-            dtype=out_dtype, device='cuda')
-
-    out = ops.cutlass_scaled_mm(aq_i8,
-                                bq_i8,
-                                scale_a,
-                                scale_b,
-                                out_dtype=out_dtype,
-                                bias=azp_bias[0, :])
+    assert azp_bias[0, :].shape == (n,)
+
+    baseline_q = (
+        scale_a.to(device="cpu")
+        * scale_b.to(device="cpu")
+        * ((aq_i32 + azp_aq_i8).to(device="cpu") @ bq_i32.to(device="cpu"))
+    ).to(dtype=out_dtype, device="cuda")
+
+    out = ops.cutlass_scaled_mm(
+        aq_i8, bq_i8, scale_a, scale_b, out_dtype=out_dtype, bias=azp_bias[0, :]
+    )
     torch.testing.assert_close(out, baseline_dq, rtol=1e-2, atol=1e0)
     torch.testing.assert_close(out, baseline_q, rtol=1e-2, atol=1e0)
 
@@ -362,8 +418,9 @@ def test_cutlass_int8_azp_bias_fold(m: int, n: int, k: int,
 @pytest.mark.parametrize("out_dtype", [torch.bfloat16, torch.float16])
 @pytest.mark.parametrize("use_bias", [True, False])
 @pytest.mark.parametrize("azp_per_token", [True, False])
-def test_cutlass_int8_azp(m: int, n: int, k: int, out_dtype: torch.dtype,
-                          use_bias: bool, azp_per_token: bool):
+def test_cutlass_int8_azp(
+    m: int, n: int, k: int, out_dtype: torch.dtype, use_bias: bool, azp_per_token: bool
+):
     m_azp = m if azp_per_token else 1
     scale_a = torch.randn((m_azp, 1), device="cuda", dtype=torch.float32) / 10
     scale_b = torch.randn((1, n), device="cuda", dtype=torch.float32) / 10
@@ -377,16 +434,12 @@ def test_cutlass_int8_azp(m: int, n: int, k: int, out_dtype: torch.dtype,
     bq_f32 = bq_i8.to(dtype=torch.float32)
     b_dq = scale_b * bq_f32
 
-    azp_a = torch.rand(
-        (m_azp, 1), device="cuda", dtype=torch.float32) * 10 + 1.5
+    azp_a = torch.rand((m_azp, 1), device="cuda", dtype=torch.float32) * 10 + 1.5
     azp_aq_i8 = (azp_a / scale_a).to(dtype=torch.int8)
     azp_a = azp_aq_i8.to(dtype=torch.float32) * scale_a  # correct for rounding
 
     a_dq = scale_a * (aq_i32 - azp_aq_i8).to(dtype=torch.float32)
-    torch.testing.assert_close(a_dq,
-                               scale_a * aq_f32 - azp_a,
-                               rtol=1e-4,
-                               atol=1e-3)
+    torch.testing.assert_close(a_dq, scale_a * aq_f32 - azp_a, rtol=1e-4, atol=1e-3)
 
     if use_bias:
         bias = torch.rand((1, n), device="cuda", dtype=out_dtype) * 10 + 2.5
@@ -396,8 +449,8 @@ def test_cutlass_int8_azp(m: int, n: int, k: int, out_dtype: torch.dtype,
     baseline_dq = (torch.mm(a_dq, b_dq) + bias).to(out_dtype)
 
     # int32 mm not supported on CUDA
-    a_noazp_i32_cpu = (aq_i32 - azp_aq_i8).to(device='cpu')
-    cq = (a_noazp_i32_cpu @ bq_i32.to(device='cpu')).to(device='cuda')
+    a_noazp_i32_cpu = (aq_i32 - azp_aq_i8).to(device="cpu")
+    cq = (a_noazp_i32_cpu @ bq_i32.to(device="cpu")).to(device="cuda")
     baseline_q = (scale_a * scale_b * cq + bias).to(dtype=out_dtype)
 
     # Hadamard is just the sum of the cols
@@ -406,14 +459,14 @@ def test_cutlass_int8_azp(m: int, n: int, k: int, out_dtype: torch.dtype,
     func_bias = bias if use_bias else None
 
     if azp_per_token:
-        out = ops.cutlass_scaled_mm_azp(aq_i8, bq_i8, scale_a, scale_b,
-                                        out_dtype, azp_adj_i32, azp_i32,
-                                        func_bias)
+        out = ops.cutlass_scaled_mm_azp(
+            aq_i8, bq_i8, scale_a, scale_b, out_dtype, azp_adj_i32, azp_i32, func_bias
+        )
     else:
         azp_with_adj_i32 = azp_i32 * azp_adj_i32
-        out = ops.cutlass_scaled_mm_azp(aq_i8, bq_i8, scale_a, scale_b,
-                                        out_dtype, azp_with_adj_i32, None,
-                                        func_bias)
+        out = ops.cutlass_scaled_mm_azp(
+            aq_i8, bq_i8, scale_a, scale_b, out_dtype, azp_with_adj_i32, None, func_bias
+        )
 
     # bfloat16 precision is 7-bit mantissa -> 2^-8 ~ 0.4%
     # float16 precision is 10-bit mantissa -> 2^-11 ~ 0.05%
@@ -423,13 +476,15 @@ def test_cutlass_int8_azp(m: int, n: int, k: int, out_dtype: torch.dtype,
     torch.testing.assert_close(out, baseline_q, rtol=rtol, atol=atol)
 
     if azp_per_token:
-        opcheck(torch.ops._C.cutlass_scaled_mm_azp,
-                (out, aq_i8, bq_i8, scale_a, scale_b, azp_adj_i32, azp_i32,
-                 func_bias))
+        opcheck(
+            torch.ops._C.cutlass_scaled_mm_azp,
+            (out, aq_i8, bq_i8, scale_a, scale_b, azp_adj_i32, azp_i32, func_bias),
+        )
     else:
-        opcheck(torch.ops._C.cutlass_scaled_mm_azp,
-                (out, aq_i8, bq_i8, scale_a, scale_b, azp_with_adj_i32, None,
-                 func_bias))
+        opcheck(
+            torch.ops._C.cutlass_scaled_mm_azp,
+            (out, aq_i8, bq_i8, scale_a, scale_b, azp_with_adj_i32, None, func_bias),
+        )
 
 
 # Test working with a subset of A and B
@@ -445,23 +500,14 @@ def test_cutlass_subset():
     scale_a = torch.randn((1, 1), device="cuda", dtype=torch.float32) / 10
     scale_b = torch.randn((1, 1), device="cuda", dtype=torch.float32) / 10
 
-    out = ops.cutlass_scaled_mm(a,
-                                b,
-                                scale_a,
-                                scale_b,
-                                out_dtype=torch.bfloat16)
-    baseline = baseline_scaled_mm(a,
-                                  b,
-                                  scale_a,
-                                  scale_b,
-                                  out_dtype=torch.bfloat16)
+    out = ops.cutlass_scaled_mm(a, b, scale_a, scale_b, out_dtype=torch.bfloat16)
+    baseline = baseline_scaled_mm(a, b, scale_a, scale_b, out_dtype=torch.bfloat16)
 
     torch.testing.assert_close(out, baseline, rtol=1e-1, atol=1e0)
 
 
 # Test to make sure cuda graphs work
 class CutlassLayer(torch.nn.Module):
-
     def __init__(self, b, scale_a, scale_b, out_dtype):
         super().__init__()
         self.b = b
@@ -470,8 +516,9 @@ def __init__(self, b, scale_a, scale_b, out_dtype):
         self.out_dtype = out_dtype
 
     def forward(self, a):
-        return ops.cutlass_scaled_mm(a, self.b, self.scale_a, self.scale_b,
-                                     self.out_dtype)
+        return ops.cutlass_scaled_mm(
+            a, self.b, self.scale_a, self.scale_b, self.out_dtype
+        )
 
 
 @pytest.mark.parametrize("per_act_token", [True, False])
@@ -485,10 +532,8 @@ def test_cutlass_cuda_graph(per_act_token: bool, per_out_ch: bool):
     m_a_scales = m if per_act_token else 1
     n_b_scales = n if per_out_ch else 1
 
-    scale_a = (torch.randn(
-        (m_a_scales, 1), device="cuda", dtype=torch.float32) / 10)
-    scale_b = (torch.randn(
-        (1, n_b_scales), device="cuda", dtype=torch.float32) / 10)
+    scale_a = torch.randn((m_a_scales, 1), device="cuda", dtype=torch.float32) / 10
+    scale_b = torch.randn((1, n_b_scales), device="cuda", dtype=torch.float32) / 10
 
     # Construct a trivial model with a single layer that calls a CUTLASS kernel
     model = CutlassLayer(b, scale_a, scale_b, torch.bfloat16)
@@ -502,13 +547,14 @@ def test_cutlass_cuda_graph(per_act_token: bool, per_out_ch: bool):
     out.zero_()
     g.replay()
 
-    baseline = torch.mm(scale_a * a.to(dtype=torch.float32),
-                        scale_b * b.to(dtype=torch.float32)).to(torch.bfloat16)
+    baseline = torch.mm(
+        scale_a * a.to(dtype=torch.float32), scale_b * b.to(dtype=torch.float32)
+    ).to(torch.bfloat16)
     torch.testing.assert_close(out, baseline, rtol=1e-1, atol=1e0)
 
 
 def test_cutlass_support_opcheck():
-    opcheck(torch.ops._C.cutlass_scaled_mm_supports_fp8, (capability, ))
+    opcheck(torch.ops._C.cutlass_scaled_mm_supports_fp8, (capability,))
 
 
 @pytest.mark.parametrize("num_experts", [8, 64])
@@ -517,11 +563,13 @@ def test_cutlass_support_opcheck():
 @pytest.mark.parametrize("use_bias", [False])
 @pytest.mark.skipif(
     (lambda x: x is None or not ops.cutlass_group_gemm_supported(x.to_int()))(
-        current_platform.get_device_capability()),
-    reason="Grouped gemm is not supported on this GPU type.")
-def test_cutlass_fp8_group_gemm(num_experts: int, per_act_token: bool,
-                                per_out_ch: bool, use_bias: bool):
-
+        current_platform.get_device_capability()
+    ),
+    reason="Grouped gemm is not supported on this GPU type.",
+)
+def test_cutlass_fp8_group_gemm(
+    num_experts: int, per_act_token: bool, per_out_ch: bool, use_bias: bool
+):
     # Device and dtype setup
     device = "cuda"
     out_dtype = torch.half
@@ -533,13 +581,9 @@ def test_cutlass_fp8_group_gemm(num_experts: int, per_act_token: bool,
     b_scales_tensors = []
     baseline_tensors = []
 
-    expert_offsets = torch.zeros((num_experts + 1),
-                                 device=device,
-                                 dtype=torch.int64)
+    expert_offsets = torch.zeros((num_experts + 1), device=device, dtype=torch.int64)
 
-    problem_sizes = torch.zeros((num_experts, 3),
-                                device=device,
-                                dtype=torch.int32)
+    problem_sizes = torch.zeros((num_experts, 3), device=device, dtype=torch.int32)
 
     if not per_act_token:
         one_scale_a = torch.randn((1, 1), device=device, dtype=torch.float32)
@@ -566,75 +610,76 @@ def test_cutlass_fp8_group_gemm(num_experts: int, per_act_token: bool,
         b_tensors.append(b_g)
 
         # Set up A/B scales
-        scale_b = torch.randn((1, n_b_scales),
-                              device=device,
-                              dtype=torch.float32)
+        scale_b = torch.randn((1, n_b_scales), device=device, dtype=torch.float32)
         b_scales_tensors.append(scale_b)
 
         if per_act_token:
-            scale_a = torch.randn((m_a_scales, 1),
-                                  device=device,
-                                  dtype=torch.float32)
+            scale_a = torch.randn((m_a_scales, 1), device=device, dtype=torch.float32)
             a_scales_tensors.append(scale_a)
         else:
             scale_a = one_scale_a
 
         # Compute baseline result for this group
-        baseline_g = baseline_scaled_mm(a_g, b_g, scale_a, scale_b, out_dtype,
-                                        None)
+        baseline_g = baseline_scaled_mm(a_g, b_g, scale_a, scale_b, out_dtype, None)
         baseline_tensors.append(baseline_g)
 
-    a_tensors_stacked = torch.empty((expert_offsets[num_experts], k_g),
-                                    device=device,
-                                    dtype=torch.float8_e4m3fn)
-    b_tensors_stacked = torch.empty((num_experts, n_g, k_g),
-                                    device=device,
-                                    dtype=torch.float8_e4m3fn)
+    a_tensors_stacked = torch.empty(
+        (expert_offsets[num_experts], k_g), device=device, dtype=torch.float8_e4m3fn
+    )
+    b_tensors_stacked = torch.empty(
+        (num_experts, n_g, k_g), device=device, dtype=torch.float8_e4m3fn
+    )
 
     for g in range(num_experts):
-        a_tensors_stacked[expert_offsets[g]:expert_offsets[g +
-                                                           1]] = a_tensors[g]
+        a_tensors_stacked[expert_offsets[g] : expert_offsets[g + 1]] = a_tensors[g]
         b_tensors_stacked[g] = b_tensors[g].t()
     b_tensors_stacked = b_tensors_stacked.transpose(1, 2)
 
     if per_act_token:
         a_scales_tensors_stacked = torch.empty(
-            (expert_offsets[num_experts], 1),
-            device=device,
-            dtype=torch.float32)
+            (expert_offsets[num_experts], 1), device=device, dtype=torch.float32
+        )
         for g in range(num_experts):
-            a_scales_tensors_stacked[
-                expert_offsets[g]:expert_offsets[g + 1]] = a_scales_tensors[g]
+            a_scales_tensors_stacked[expert_offsets[g] : expert_offsets[g + 1]] = (
+                a_scales_tensors[g]
+            )
     else:
         a_scales_tensors_stacked = one_scale_a
 
-    b_scales_tensors_stacked = torch.empty((num_experts, n_b_scales),
-                                           device=device,
-                                           dtype=torch.float32)
+    b_scales_tensors_stacked = torch.empty(
+        (num_experts, n_b_scales), device=device, dtype=torch.float32
+    )
     for g in range(num_experts):
         b_scales_tensors_stacked[g] = b_scales_tensors[g]
 
-    out_tensors_stacked = torch.zeros((expert_offsets[num_experts], n_g),
-                                      device=device,
-                                      dtype=out_dtype)
-
-    ab_strides = torch.full((num_experts, ),
-                            a_tensors_stacked.stride(0),
-                            device="cuda",
-                            dtype=torch.int64)
-    c_strides = torch.full((num_experts, ),
-                           out_tensors_stacked.stride(0),
-                           device="cuda",
-                           dtype=torch.int64)
-
-    ops.cutlass_moe_mm(out_tensors_stacked, a_tensors_stacked,
-                       b_tensors_stacked, a_scales_tensors_stacked,
-                       b_scales_tensors_stacked, expert_offsets[:-1],
-                       problem_sizes, ab_strides, ab_strides, c_strides,
-                       per_act_token, per_out_ch)
+    out_tensors_stacked = torch.zeros(
+        (expert_offsets[num_experts], n_g), device=device, dtype=out_dtype
+    )
+
+    ab_strides = torch.full(
+        (num_experts,), a_tensors_stacked.stride(0), device="cuda", dtype=torch.int64
+    )
+    c_strides = torch.full(
+        (num_experts,), out_tensors_stacked.stride(0), device="cuda", dtype=torch.int64
+    )
+
+    ops.cutlass_moe_mm(
+        out_tensors_stacked,
+        a_tensors_stacked,
+        b_tensors_stacked,
+        a_scales_tensors_stacked,
+        b_scales_tensors_stacked,
+        expert_offsets[:-1],
+        problem_sizes,
+        ab_strides,
+        ab_strides,
+        c_strides,
+        per_act_token,
+        per_out_ch,
+    )
 
     # Validate each group's result against the baseline
     for g in range(num_experts):
         baseline = baseline_tensors[g]
-        c = out_tensors_stacked[expert_offsets[g]:expert_offsets[g + 1]]
+        c = out_tensors_stacked[expert_offsets[g] : expert_offsets[g + 1]]
         torch.testing.assert_close(c, baseline, rtol=1e-2, atol=5e-4)
diff --git a/tests/kernels/quantization/test_cutlass_w4a8.py b/tests/kernels/quantization/test_cutlass_w4a8.py
index f659408efe8c..a3d524fe90ed 100644
--- a/tests/kernels/quantization/test_cutlass_w4a8.py
+++ b/tests/kernels/quantization/test_cutlass_w4a8.py
@@ -13,7 +13,9 @@
 
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    pack_rows, quantize_weights)
+    pack_rows,
+    quantize_weights,
+)
 from vllm.platforms import current_platform
 from vllm.scalar_type import ScalarType, scalar_types
 
@@ -24,16 +26,33 @@
 #  have kernels and some kernels support multiple quantization methods.
 IS_SUPPORTED_BY_GPU = current_platform.get_device_capability()[0] >= 9
 
-MNK_SHAPES = [(1, 128, 128), (1, 512, 1024), (1, 4096, 4096), (1, 8192, 28672),
-              (13, 8192, 4096), (26, 4096, 8192), (64, 4096, 4096),
-              (64, 8192, 28672), (257, 128, 4096), (257, 4096, 4096),
-              (1024, 4096, 8192), (1024, 8192, 4096)]
+MNK_SHAPES = [
+    (1, 128, 128),
+    (1, 512, 1024),
+    (1, 4096, 4096),
+    (1, 8192, 28672),
+    (13, 8192, 4096),
+    (26, 4096, 8192),
+    (64, 4096, 4096),
+    (64, 8192, 28672),
+    (257, 128, 4096),
+    (257, 4096, 4096),
+    (1024, 4096, 8192),
+    (1024, 8192, 4096),
+]
 
 # TODO(czhu): get supported schedules from fn
 SCHEDULES = [
-    '128x16_1x1x1', '256x16_1x1x1', '128x32_1x1x1', '256x32_1x1x1',
-    '128x64_1x1x1', '256x64_1x1x1', '128x128_1x1x1', '256x128_1x1x1',
-    '128x256_1x1x1', '128x256_2x1x1'
+    "128x16_1x1x1",
+    "256x16_1x1x1",
+    "128x32_1x1x1",
+    "256x32_1x1x1",
+    "128x64_1x1x1",
+    "256x64_1x1x1",
+    "128x128_1x1x1",
+    "256x128_1x1x1",
+    "128x256_1x1x1",
+    "128x256_2x1x1",
 ]
 
 
@@ -60,19 +79,23 @@ class Tensors:
 
 # (Act Type, Weight Type, Output Type, Scale Type, ZeroPoints,
 #  Ch Scales Type, Tok Scales Type)
-TestTypeTuple = tuple[list[torch.dtype], ScalarType, Optional[torch.dtype],
-                      Optional[torch.dtype], bool]
+TestTypeTuple = tuple[
+    list[torch.dtype], ScalarType, Optional[torch.dtype], Optional[torch.dtype], bool
+]
 TEST_TYPES = [
     *(
-        TypeConfig(act_type=torch.float8_e4m3fn,
-                   weight_type=w_type,
-                   output_type=o_type,
-                   group_scale_type=torch.float8_e4m3fn,
-                   channel_scale_type=torch.float32,
-                   token_scale_type=torch.float32)
+        TypeConfig(
+            act_type=torch.float8_e4m3fn,
+            weight_type=w_type,
+            output_type=o_type,
+            group_scale_type=torch.float8_e4m3fn,
+            channel_scale_type=torch.float32,
+            token_scale_type=torch.float32,
+        )
         for w_type in [scalar_types.int4]
         # TODO(czhu): fp16 out type
-        for o_type in [torch.bfloat16]),
+        for o_type in [torch.bfloat16]
+    ),
 ]
 
 # TODO: in future PR refactor this and `is_quant_method_supported` in the kernel
@@ -86,26 +109,28 @@ class Tensors:
 # For testing quantized linear kernels
 def to_fp8(tensor: torch.Tensor):
     finfo = torch.finfo(torch.float8_e4m3fn)
-    return tensor.clamp(min=finfo.min,
-                        max=finfo.max).to(dtype=torch.float8_e4m3fn)
+    return tensor.clamp(min=finfo.min, max=finfo.max).to(dtype=torch.float8_e4m3fn)
 
 
-def cutlass_quantize_and_pack(atype: torch.dtype,
-                              w: torch.Tensor,
-                              wtype: ScalarType,
-                              stype: Optional[torch.dtype],
-                              group_size: Optional[int],
-                              zero_points: bool = False):
+def cutlass_quantize_and_pack(
+    atype: torch.dtype,
+    w: torch.Tensor,
+    wtype: ScalarType,
+    stype: Optional[torch.dtype],
+    group_size: Optional[int],
+    zero_points: bool = False,
+):
     assert wtype.is_integer(), "TODO: support floating point weights"
 
-    w_ref, w_q, w_s, w_zp = quantize_weights(w,
-                                             wtype,
-                                             group_size=group_size,
-                                             zero_points=zero_points)
+    w_ref, w_q, w_s, w_zp = quantize_weights(
+        w, wtype, group_size=group_size, zero_points=zero_points
+    )
 
     # since scales are cast to fp8, we need to compute w_ref this way
-    w_ref = ((w_q).to(torch.float32) * w_s.to(atype).to(
-        torch.float32).repeat_interleave(group_size, dim=0)).to(atype)
+    w_ref = (
+        (w_q).to(torch.float32)
+        * w_s.to(atype).to(torch.float32).repeat_interleave(group_size, dim=0)
+    ).to(atype)
 
     # bit mask prevents sign extending int4 when packing
     w_q = pack_rows(w_q & 0x0F, wtype.size_bits, *w_q.shape)
@@ -117,12 +142,14 @@ def cutlass_quantize_and_pack(atype: torch.dtype,
     return w_ref, w_q_packed, w_s_packed, w_zp
 
 
-def create_test_tensors(shape: tuple[int, int, int], types: TypeConfig,
-                        group_size: Optional[int]) -> Tensors:
+def create_test_tensors(
+    shape: tuple[int, int, int], types: TypeConfig, group_size: Optional[int]
+) -> Tensors:
     m, n, k = shape
 
-    print("create_test_tensors, shape:", shape, "types:", types, "group_size:",
-          group_size)
+    print(
+        "create_test_tensors, shape:", shape, "types:", types, "group_size:", group_size
+    )
 
     a = to_fp8(torch.randn((m, k), device="cuda"))
     w = to_fp8(torch.randn((k, n), device="cuda"))
@@ -133,30 +160,34 @@ def create_test_tensors(shape: tuple[int, int, int], types: TypeConfig,
         w = w.to(torch.float16)
 
     w_ref, w_q_packed, w_s, _ = cutlass_quantize_and_pack(
-        a.dtype, w, types.weight_type, types.group_scale_type, group_size,
-        False)
+        a.dtype, w, types.weight_type, types.group_scale_type, group_size, False
+    )
 
     a_ref = a.to(torch.float32)
     w_ref = w_ref.to(torch.float32)
 
     # for the practical use case we need per-tok scales for fp8 activations
-    w_tok_s = torch.randn((m, ), device='cuda', dtype=types.token_scale_type)
+    w_tok_s = torch.randn((m,), device="cuda", dtype=types.token_scale_type)
     # weights are already per-group quantized, use placeholder here
-    w_ch_s = torch.ones((n, ), device='cuda', dtype=types.channel_scale_type)
-
-    return Tensors(w_ref=w_ref,
-                   a_ref=a_ref,
-                   a=a,
-                   w_q=w_q_packed,
-                   w_g_s=w_s,
-                   w_ch_s=w_ch_s,
-                   w_tok_s=w_tok_s)
+    w_ch_s = torch.ones((n,), device="cuda", dtype=types.channel_scale_type)
+
+    return Tensors(
+        w_ref=w_ref,
+        a_ref=a_ref,
+        a=a,
+        w_q=w_q_packed,
+        w_g_s=w_s,
+        w_ch_s=w_ch_s,
+        w_tok_s=w_tok_s,
+    )
 
 
-def mm_test_helper(types: TypeConfig,
-                   tensors: Tensors,
-                   group_size: Optional[int] = None,
-                   schedule: Optional[str] = None):
+def mm_test_helper(
+    types: TypeConfig,
+    tensors: Tensors,
+    group_size: Optional[int] = None,
+    schedule: Optional[str] = None,
+):
     # CUTLASS upstream uses fp8 with fastaccum as reference
     # https://github.com/NVIDIA/cutlass/blob/main/examples/55_hopper_mixed_dtype_gemm/55_hopper_int4_fp8_gemm.cu#L406
     output_ref = torch._scaled_mm(
@@ -165,7 +196,8 @@ def mm_test_helper(types: TypeConfig,
         tensors.w_tok_s.unsqueeze(1),
         tensors.w_ch_s.unsqueeze(0),
         out_dtype=types.output_type,
-        use_fast_accum=True)
+        use_fast_accum=True,
+    )
 
     output = ops.cutlass_w4a8_mm(
         a=tensors.a,
@@ -179,17 +211,15 @@ def mm_test_helper(types: TypeConfig,
     print(output)
     print(output_ref)
 
-    torch.testing.assert_close(output,
-                               output_ref.to(output.dtype),
-                               rtol=1e-3,
-                               atol=1e-3)
+    torch.testing.assert_close(
+        output, output_ref.to(output.dtype), rtol=1e-3, atol=1e-3
+    )
 
 
-@pytest.mark.skipif(not IS_SUPPORTED_BY_GPU,
-                    reason="CUTLASS W4A8 is not supported on this GPU type.")
-@pytest.mark.parametrize("shape",
-                         MNK_SHAPES,
-                         ids=lambda x: "x".join(str(v) for v in x))
+@pytest.mark.skipif(
+    not IS_SUPPORTED_BY_GPU, reason="CUTLASS W4A8 is not supported on this GPU type."
+)
+@pytest.mark.parametrize("shape", MNK_SHAPES, ids=lambda x: "x".join(str(v) for v in x))
 @pytest.mark.parametrize("types", TEST_TYPES)
 @pytest.mark.parametrize("schedule", SCHEDULES)
 def test_cutlass_w4a8(shape, types: TypeConfig, schedule):
@@ -201,7 +231,6 @@ def test_cutlass_w4a8(shape, types: TypeConfig, schedule):
 
 # Test to make sure cuda graphs work
 class W4A8Layer(torch.nn.Module):
-
     def __init__(self, **kwargs):
         super().__init__()
         self.kwargs = kwargs
@@ -210,8 +239,9 @@ def forward(self, a):
         return ops.cutlass_w4a8_mm(a=a, **self.kwargs)
 
 
-@pytest.mark.skipif(not IS_SUPPORTED_BY_GPU,
-                    reason="CUTLASS W4A8 is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not IS_SUPPORTED_BY_GPU, reason="CUTLASS W4A8 is not supported on this GPU type."
+)
 def test_w4a8_cuda_graph():
     m, n, k = 512, 4096, 4096
 
@@ -224,10 +254,11 @@ def test_w4a8_cuda_graph():
     zero_points = False
 
     w_ref, w_q_packed, w_s, _ = cutlass_quantize_and_pack(
-        a.dtype, b.to(torch.float16), wtype, stype, group_size, zero_points)
+        a.dtype, b.to(torch.float16), wtype, stype, group_size, zero_points
+    )
 
-    w_tok_s = torch.randn((m, ), device='cuda', dtype=torch.float32)
-    w_ch_s = torch.ones((n, ), device='cuda', dtype=torch.float32)
+    w_tok_s = torch.randn((m,), device="cuda", dtype=torch.float32)
+    w_ch_s = torch.ones((n,), device="cuda", dtype=torch.float32)
 
     # Construct a trivial model with a single layer that calls the kernel
     model = W4A8Layer(
@@ -244,7 +275,8 @@ def test_w4a8_cuda_graph():
         w_tok_s.unsqueeze(1),
         w_ch_s.unsqueeze(0),
         out_dtype=torch.bfloat16,
-        use_fast_accum=True)
+        use_fast_accum=True,
+    )
 
     # Run the model with a cuda graph
     stream = torch.cuda.Stream()
diff --git a/tests/kernels/quantization/test_flashinfer_nvfp4_scaled_mm.py b/tests/kernels/quantization/test_flashinfer_nvfp4_scaled_mm.py
index 131086a5f703..1e5c7dafb0f5 100644
--- a/tests/kernels/quantization/test_flashinfer_nvfp4_scaled_mm.py
+++ b/tests/kernels/quantization/test_flashinfer_nvfp4_scaled_mm.py
@@ -2,8 +2,12 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 import pytest
 import torch
-from nvfp4_utils import (FLOAT4_E2M1_MAX, FLOAT8_E4M3_MAX,
-                         convert_swizzled_to_linear, dequantize_nvfp4_to_dtype)
+from nvfp4_utils import (
+    FLOAT4_E2M1_MAX,
+    FLOAT8_E4M3_MAX,
+    convert_swizzled_to_linear,
+    dequantize_nvfp4_to_dtype,
+)
 
 from vllm import _custom_ops as ops
 from vllm.platforms import current_platform
@@ -41,18 +45,12 @@ def get_ref_results(
     _, m_k = a_fp4.shape
     _, n_k = b_fp4.shape
     assert m_k == n_k
-    a_in_dtype = dequantize_nvfp4_to_dtype(a_fp4,
-                                           a_sf,
-                                           a_global_scale,
-                                           dtype=dtype,
-                                           device=device,
-                                           block_size=block_size)
-    b_in_dtype = dequantize_nvfp4_to_dtype(b_fp4,
-                                           b_sf,
-                                           b_global_scale,
-                                           dtype=dtype,
-                                           device=device,
-                                           block_size=block_size)
+    a_in_dtype = dequantize_nvfp4_to_dtype(
+        a_fp4, a_sf, a_global_scale, dtype=dtype, device=device, block_size=block_size
+    )
+    b_in_dtype = dequantize_nvfp4_to_dtype(
+        b_fp4, b_sf, b_global_scale, dtype=dtype, device=device, block_size=block_size
+    )
     return torch.matmul(a_in_dtype, b_in_dtype.t())
 
 
@@ -72,8 +70,7 @@ def test_flashinfer_nvfp4_gemm(
     autotune: bool,
 ) -> None:
     if backend == "trtllm" and dtype == torch.float16:
-        pytest.skip(
-            "Only torch.bfloat16 is supported for TRTLLM FP4 GEMM operations")
+        pytest.skip("Only torch.bfloat16 is supported for TRTLLM FP4 GEMM operations")
 
     current_platform.seed_everything(seed)
     m, n, packed_k = shape
@@ -82,10 +79,12 @@ def test_flashinfer_nvfp4_gemm(
     a_dtype = torch.randn((m, k), dtype=dtype, device=device)
     b_dtype = torch.randn((n, k), dtype=dtype, device=device)
 
-    a_global_scale = ((FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) /
-                      torch.amax(a_dtype.flatten(), dim=-1)).to(torch.float32)
-    b_global_scale = ((FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) /
-                      torch.amax(b_dtype.flatten(), dim=-1)).to(torch.float32)
+    a_global_scale = (
+        (FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) / torch.amax(a_dtype.flatten(), dim=-1)
+    ).to(torch.float32)
+    b_global_scale = (
+        (FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) / torch.amax(b_dtype.flatten(), dim=-1)
+    ).to(torch.float32)
     alpha = 1.0 / (a_global_scale * b_global_scale)
     # ops.scaled_fp4_quant returns swizzled scales, while weights
     # from checkpoints are in linear scales.
@@ -113,14 +112,18 @@ def test_flashinfer_nvfp4_gemm(
 
     if backend == "trtllm":
         epilogue_tile_m = 128
-        b_fp4 = flashinfer.shuffle_matrix_a(b_fp4.view(torch.uint8),
-                                            epilogue_tile_m)
+        b_fp4 = flashinfer.shuffle_matrix_a(b_fp4.view(torch.uint8), epilogue_tile_m)
 
         b_scale_interleaved = convert_swizzled_to_linear(
-            b_scale_interleaved, n, k, block_size)
-        b_scale_interleaved = (flashinfer.shuffle_matrix_sf_a(
-            b_scale_interleaved.view(torch.uint8), epilogue_tile_m).reshape(
-                b_scale_interleaved.shape).view(torch.float8_e4m3fn))
+            b_scale_interleaved, n, k, block_size
+        )
+        b_scale_interleaved = (
+            flashinfer.shuffle_matrix_sf_a(
+                b_scale_interleaved.view(torch.uint8), epilogue_tile_m
+            )
+            .reshape(b_scale_interleaved.shape)
+            .view(torch.float8_e4m3fn)
+        )
 
     with flashinfer.autotune(autotune):
         out = flashinfer_scaled_fp4_mm(
@@ -133,7 +136,4 @@ def test_flashinfer_nvfp4_gemm(
             backend=backend,
         )
 
-    torch.testing.assert_close(out,
-                               expected_out.to(dtype=dtype),
-                               atol=1e-1,
-                               rtol=1e-1)
+    torch.testing.assert_close(out, expected_out.to(dtype=dtype), atol=1e-1, rtol=1e-1)
diff --git a/tests/kernels/quantization/test_flashinfer_scaled_mm.py b/tests/kernels/quantization/test_flashinfer_scaled_mm.py
index 9f669c6df8bd..b30821b6895b 100644
--- a/tests/kernels/quantization/test_flashinfer_scaled_mm.py
+++ b/tests/kernels/quantization/test_flashinfer_scaled_mm.py
@@ -9,8 +9,7 @@
 
 if not current_platform.has_device_capability(100):
     pytest.skip(
-        reason=
-        "Flashinfer FP8 gemms requires compute capability of 10.0 or above.",
+        reason="Flashinfer FP8 gemms requires compute capability of 10.0 or above.",
         allow_module_level=True,
     )
 
@@ -53,7 +52,7 @@ def test_flashinfer_fp8_gemm(
     ).to(dtype=dtype)
 
     if use_bias:
-        bias = torch.randn((n, ), dtype=dtype, device=device)
+        bias = torch.randn((n,), dtype=dtype, device=device)
         expected_out = expected_out + bias
     else:
         bias = None
diff --git a/tests/kernels/quantization/test_fp8_quant.py b/tests/kernels/quantization/test_fp8_quant.py
index c2e70ffb8d34..19aa21b96a57 100644
--- a/tests/kernels/quantization/test_fp8_quant.py
+++ b/tests/kernels/quantization/test_fp8_quant.py
@@ -5,9 +5,11 @@
 import torch
 
 import vllm._custom_ops as ops
-from tests.kernels.quant_utils import (FP8_DTYPE,
-                                       ref_dynamic_per_tensor_fp8_quant,
-                                       ref_dynamic_per_token_quant)
+from tests.kernels.quant_utils import (
+    FP8_DTYPE,
+    ref_dynamic_per_tensor_fp8_quant,
+    ref_dynamic_per_token_quant,
+)
 from tests.kernels.utils import opcheck
 from vllm.platforms import current_platform
 
@@ -18,23 +20,25 @@
 SEEDS = [0]
 
 
-def opcheck_fp8_quant(output,
-                      input,
-                      scale=None,
-                      scale_ub=None,
-                      use_per_token_if_dynamic=False):
+def opcheck_fp8_quant(
+    output, input, scale=None, scale_ub=None, use_per_token_if_dynamic=False
+):
     if scale is not None:
         opcheck(torch.ops._C.static_scaled_fp8_quant, (output, input, scale))
     elif use_per_token_if_dynamic:
-        scale = torch.empty((input.shape[0], 1),
-                            device=input.device,
-                            dtype=torch.float32)
-        opcheck(torch.ops._C.dynamic_per_token_scaled_fp8_quant,
-                (output, input, scale, scale_ub))
+        scale = torch.empty(
+            (input.shape[0], 1), device=input.device, dtype=torch.float32
+        )
+        opcheck(
+            torch.ops._C.dynamic_per_token_scaled_fp8_quant,
+            (output, input, scale, scale_ub),
+        )
     else:
-        scale = torch.empty((input.numel() // input.shape[-1], 1),
-                            device=input.device,
-                            dtype=torch.float32)
+        scale = torch.empty(
+            (input.numel() // input.shape[-1], 1),
+            device=input.device,
+            dtype=torch.float32,
+        )
         opcheck(torch.ops._C.dynamic_scaled_fp8_quant, (output, input, scale))
 
 
@@ -44,30 +48,29 @@ def opcheck_fp8_quant(output,
 @pytest.mark.parametrize("scale_ub", SCALE_UBS)
 @pytest.mark.parametrize("seed", SEEDS)
 @torch.inference_mode()
-def test_dynamic_per_token_fp8_quant(num_tokens: int, hidden_size: int,
-                                     dtype: torch.dtype, scale_ub: bool,
-                                     seed: int) -> None:
+def test_dynamic_per_token_fp8_quant(
+    num_tokens: int, hidden_size: int, dtype: torch.dtype, scale_ub: bool, seed: int
+) -> None:
     current_platform.seed_everything(seed)
 
-    x = torch.rand(num_tokens, hidden_size, dtype=dtype,
-                   device="cuda") + 1e-6  # avoid nans
+    x = (
+        torch.rand(num_tokens, hidden_size, dtype=dtype, device="cuda") + 1e-6
+    )  # avoid nans
 
-    scale_ub = torch.mean(x).to(dtype=torch.float32, device='cuda') \
-            if scale_ub else None
+    scale_ub = (
+        torch.mean(x).to(dtype=torch.float32, device="cuda") if scale_ub else None
+    )
     ref_out, ref_scales = ref_dynamic_per_token_quant(x, FP8_DTYPE, scale_ub)
-    ops_out, ops_scales = ops.scaled_fp8_quant(x,
-                                               scale_ub=scale_ub,
-                                               use_per_token_if_dynamic=True)
+    ops_out, ops_scales = ops.scaled_fp8_quant(
+        x, scale_ub=scale_ub, use_per_token_if_dynamic=True
+    )
 
     torch.testing.assert_close(ref_scales, ops_scales)
-    torch.testing.assert_close(ref_out.to(dtype=torch.float32),
-                               ops_out.to(dtype=torch.float32))
+    torch.testing.assert_close(
+        ref_out.to(dtype=torch.float32), ops_out.to(dtype=torch.float32)
+    )
 
-    opcheck_fp8_quant(ops_out,
-                      x,
-                      None,
-                      scale_ub,
-                      use_per_token_if_dynamic=True)
+    opcheck_fp8_quant(ops_out, x, None, scale_ub, use_per_token_if_dynamic=True)
 
 
 @pytest.mark.parametrize("num_tokens", NUM_TOKENS)
@@ -75,8 +78,9 @@ def test_dynamic_per_token_fp8_quant(num_tokens: int, hidden_size: int,
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("seed", SEEDS)
 @torch.inference_mode()
-def test_dynamic_per_tensor_fp8_quant(num_tokens: int, hidden_size: int,
-                                      dtype: torch.dtype, seed: int) -> None:
+def test_dynamic_per_tensor_fp8_quant(
+    num_tokens: int, hidden_size: int, dtype: torch.dtype, seed: int
+) -> None:
     current_platform.seed_everything(seed)
 
     x = torch.rand(num_tokens, hidden_size, dtype=dtype, device="cuda")
@@ -85,8 +89,9 @@ def test_dynamic_per_tensor_fp8_quant(num_tokens: int, hidden_size: int,
     ops_out, ops_scale = ops.scaled_fp8_quant(x)
 
     torch.testing.assert_close(ref_scale, ops_scale)
-    torch.testing.assert_close(ref_out.to(dtype=torch.float32),
-                               ops_out.to(dtype=torch.float32))
+    torch.testing.assert_close(
+        ref_out.to(dtype=torch.float32), ops_out.to(dtype=torch.float32)
+    )
 
     opcheck_fp8_quant(ops_out, x)
 
diff --git a/tests/kernels/quantization/test_fp8_quant_group.py b/tests/kernels/quantization/test_fp8_quant_group.py
index 8f2bc6e3cee5..6628ac650fd5 100644
--- a/tests/kernels/quantization/test_fp8_quant_group.py
+++ b/tests/kernels/quantization/test_fp8_quant_group.py
@@ -6,8 +6,7 @@
 import torch
 
 from vllm.model_executor.layers.quantization.input_quant_fp8 import QuantFP8
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape)
+from vllm.model_executor.layers.quantization.utils.quant_utils import GroupShape
 from vllm.platforms import current_platform
 
 
@@ -18,13 +17,14 @@
         (64, 1024, 64),  # Medium
         (128, 2048, 128),  # Large
         (8, 513, 64),  # Non-divisible (native only)
-    ])
+    ],
+)
 @pytest.mark.parametrize("seed", [42])
 @pytest.mark.parametrize("use_ue8m0", [True, False])
 @torch.inference_mode()
-def test_quantfp8_group_functionality(batch_size: int, hidden_dim: int,
-                                      group_size: int, seed: int,
-                                      use_ue8m0: bool) -> None:
+def test_quantfp8_group_functionality(
+    batch_size: int, hidden_dim: int, group_size: int, seed: int, use_ue8m0: bool
+) -> None:
     """Test QuantFP8 group quantization with various configurations.
 
     Tests both CUDA and native implementations, column-major scales,
@@ -32,16 +32,17 @@ def test_quantfp8_group_functionality(batch_size: int, hidden_dim: int,
     """
     current_platform.seed_everything(seed)
 
-    x = torch.randn(
-        (batch_size, hidden_dim), dtype=torch.bfloat16, device="cuda") * 8
+    x = torch.randn((batch_size, hidden_dim), dtype=torch.bfloat16, device="cuda") * 8
     expected_num_groups = (hidden_dim + group_size - 1) // group_size
     is_divisible = hidden_dim % group_size == 0
 
     group_shape = GroupShape(1, group_size)
-    quant_op = QuantFP8(static=False,
-                        group_shape=group_shape,
-                        column_major_scales=False,
-                        use_ue8m0=use_ue8m0)
+    quant_op = QuantFP8(
+        static=False,
+        group_shape=group_shape,
+        column_major_scales=False,
+        use_ue8m0=use_ue8m0,
+    )
 
     # 1. Test native implementation (always available)
     x_quant_native, scales_native = quant_op.forward_native(x.clone())
@@ -49,10 +50,12 @@ def test_quantfp8_group_functionality(batch_size: int, hidden_dim: int,
     assert scales_native.shape == (batch_size, expected_num_groups)
 
     # 2. Test column-major scales configuration
-    quant_op_col = QuantFP8(static=False,
-                            group_shape=group_shape,
-                            column_major_scales=True,
-                            use_ue8m0=use_ue8m0)
+    quant_op_col = QuantFP8(
+        static=False,
+        group_shape=group_shape,
+        column_major_scales=True,
+        use_ue8m0=use_ue8m0,
+    )
     _, scales_col = quant_op_col.forward_native(x.clone())
     assert scales_col.shape == (batch_size, expected_num_groups)
     assert scales_col.stride(0) == 1
@@ -86,41 +89,48 @@ def test_quantfp8_group_multidimensional(seed: int, use_ue8m0: bool) -> None:
 
     # Test with 3D input
     batch1, batch2, hidden_dim = 4, 8, 1024
-    x_3d = torch.randn(
-        (batch1, batch2, hidden_dim), dtype=torch.bfloat16, device="cuda") * 8
+    x_3d = (
+        torch.randn((batch1, batch2, hidden_dim), dtype=torch.bfloat16, device="cuda")
+        * 8
+    )
 
     group_shape = GroupShape(1, group_size)
-    quant_op = QuantFP8(static=False,
-                        group_shape=group_shape,
-                        column_major_scales=False,
-                        use_ue8m0=use_ue8m0)
+    quant_op = QuantFP8(
+        static=False,
+        group_shape=group_shape,
+        column_major_scales=False,
+        use_ue8m0=use_ue8m0,
+    )
 
     x_quant, scales = quant_op.forward_native(x_3d.clone())
     assert x_quant.shape == x_3d.shape
     assert scales.shape == (batch1, batch2, hidden_dim // group_size)
 
     # Test column_major_scales with multi-dim
-    quant_op_col = QuantFP8(static=False,
-                            group_shape=group_shape,
-                            column_major_scales=True,
-                            use_ue8m0=use_ue8m0)
+    quant_op_col = QuantFP8(
+        static=False,
+        group_shape=group_shape,
+        column_major_scales=True,
+        use_ue8m0=use_ue8m0,
+    )
     _, scales_col = quant_op_col.forward_native(x_3d.clone())
     assert scales_col.shape == (batch1, batch2, hidden_dim // group_size)
 
     # Test with 4D input
     batch1, batch2, batch3, hidden_dim = 2, 3, 4, 256
-    x_4d = torch.randn((batch1, batch2, batch3, hidden_dim),
-                       dtype=torch.bfloat16,
-                       device="cuda") * 8
+    x_4d = (
+        torch.randn(
+            (batch1, batch2, batch3, hidden_dim), dtype=torch.bfloat16, device="cuda"
+        )
+        * 8
+    )
 
     x_quant_4d, scales_4d = quant_op.forward_native(x_4d.clone())
     assert x_quant_4d.shape == x_4d.shape
-    assert scales_4d.shape == (batch1, batch2, batch3,
-                               hidden_dim // group_size)
+    assert scales_4d.shape == (batch1, batch2, batch3, hidden_dim // group_size)
 
     _, scales_4d_col = quant_op_col.forward_native(x_4d.clone())
-    assert scales_4d_col.shape == (batch1, batch2, hidden_dim // group_size,
-                                   batch3)
+    assert scales_4d_col.shape == (batch1, batch2, hidden_dim // group_size, batch3)
 
 
 @pytest.mark.parametrize("seed", [42])
@@ -132,30 +142,24 @@ def test_quantfp8_group_edge_cases(seed: int) -> None:
     group_size = 64
 
     # Test with single group (group_size >= hidden_dim)
-    x_small = torch.randn(
-        (batch_size, 32), dtype=torch.bfloat16, device="cuda") * 8
+    x_small = torch.randn((batch_size, 32), dtype=torch.bfloat16, device="cuda") * 8
     group_shape = GroupShape(1, group_size)
-    quant_op = QuantFP8(static=False,
-                        group_shape=group_shape,
-                        column_major_scales=False)
+    quant_op = QuantFP8(
+        static=False, group_shape=group_shape, column_major_scales=False
+    )
 
     x_quant_small, scales_small = quant_op.forward_native(x_small.clone())
     assert x_quant_small.shape == x_small.shape
     assert scales_small.shape == (batch_size, 1)
 
     # Test with zero inputs
-    x_zero = torch.zeros((batch_size, 256),
-                         dtype=torch.bfloat16,
-                         device="cuda")
+    x_zero = torch.zeros((batch_size, 256), dtype=torch.bfloat16, device="cuda")
     x_quant_zero, scales_zero = quant_op.forward_native(x_zero.clone())
     assert x_quant_zero.shape == x_zero.shape
     assert (scales_zero > 0).all(), "Scales should be clamped to minimum"
 
     # Test very large values
-    x_large = torch.full((batch_size, 256),
-                         1000.0,
-                         dtype=torch.bfloat16,
-                         device="cuda")
+    x_large = torch.full((batch_size, 256), 1000.0, dtype=torch.bfloat16, device="cuda")
     x_quant_large, scales_large = quant_op.forward_native(x_large.clone())
     assert x_quant_large.shape == x_large.shape
     # FP8 max is typically 448 or 224, so scales should be > 1
diff --git a/tests/kernels/quantization/test_ggml.py b/tests/kernels/quantization/test_ggml.py
index 07651fef39bf..0dc24187f2b3 100644
--- a/tests/kernels/quantization/test_ggml.py
+++ b/tests/kernels/quantization/test_ggml.py
@@ -13,33 +13,42 @@
 def test_ggml_opcheck(quant_type):
     block_size, type_size = gguf.GGML_QUANT_SIZES[quant_type]
     shape = [256, 1152]
-    qweight = torch.randint(0, 100, shape, device='cuda', dtype=torch.uint8)
+    qweight = torch.randint(0, 100, shape, device="cuda", dtype=torch.uint8)
     m = qweight.shape[0]
     n = qweight.shape[1] // type_size * block_size
-    opcheck(torch.ops._C.ggml_dequantize,
-            (qweight, quant_type, m, n, torch.float16))
+    opcheck(torch.ops._C.ggml_dequantize, (qweight, quant_type, m, n, torch.float16))
 
-    x = torch.rand((m, 512), device='cuda', dtype=torch.float16)
-    opcheck(torch.ops._C.ggml_mul_mat_a8,
-            (qweight, x, quant_type, qweight.shape[0]))
-    opcheck(torch.ops._C.ggml_mul_mat_vec_a8,
-            (qweight, x, quant_type, qweight.shape[0]))
+    x = torch.rand((m, 512), device="cuda", dtype=torch.float16)
+    opcheck(torch.ops._C.ggml_mul_mat_a8, (qweight, x, quant_type, qweight.shape[0]))
+    opcheck(
+        torch.ops._C.ggml_mul_mat_vec_a8, (qweight, x, quant_type, qweight.shape[0])
+    )
 
     shape = [256, 1024, 336]
-    qweight = torch.randint(0, 100, shape, device='cuda', dtype=torch.uint8)
-    x = torch.rand((1, 1024), device='cuda', dtype=torch.float16)
-    sorted_token_ids = torch.arange(776, device='cuda')
-    expert_ids = torch.randint(0, 256, (194, ), device='cuda')
-    num_tokens_post_padded = torch.tensor([1],
-                                          dtype=torch.int64,
-                                          device='cuda')
-
-    opcheck(torch.ops._C.ggml_moe_a8,
-            (x, qweight, sorted_token_ids, expert_ids, num_tokens_post_padded,
-             quant_type, qweight.shape[0], 1, x.shape[0]))
+    qweight = torch.randint(0, 100, shape, device="cuda", dtype=torch.uint8)
+    x = torch.rand((1, 1024), device="cuda", dtype=torch.float16)
+    sorted_token_ids = torch.arange(776, device="cuda")
+    expert_ids = torch.randint(0, 256, (194,), device="cuda")
+    num_tokens_post_padded = torch.tensor([1], dtype=torch.int64, device="cuda")
 
-    topk_ids = torch.zeros((1, 1), device='cuda', dtype=torch.int32)
+    opcheck(
+        torch.ops._C.ggml_moe_a8,
+        (
+            x,
+            qweight,
+            sorted_token_ids,
+            expert_ids,
+            num_tokens_post_padded,
+            quant_type,
+            qweight.shape[0],
+            1,
+            x.shape[0],
+        ),
+    )
+
+    topk_ids = torch.zeros((1, 1), device="cuda", dtype=torch.int32)
 
     opcheck(
         torch.ops._C.ggml_moe_a8_vec,
-        (x, qweight, topk_ids, 1, quant_type, qweight.shape[0], x.shape[0]))
+        (x, qweight, topk_ids, 1, quant_type, qweight.shape[0], x.shape[0]),
+    )
diff --git a/tests/kernels/quantization/test_gguf.py b/tests/kernels/quantization/test_gguf.py
index 436d5cb64021..0988ba01759f 100644
--- a/tests/kernels/quantization/test_gguf.py
+++ b/tests/kernels/quantization/test_gguf.py
@@ -18,8 +18,8 @@
 
 
 def get_gguf_sample_tensors(
-        hidden_size: int,
-        quant_type: GGMLQuantizationType) -> list[ReaderTensor]:
+    hidden_size: int, quant_type: GGMLQuantizationType
+) -> list[ReaderTensor]:
     sample_dir = GGUF_SAMPLE
     filename = f"Quant_{quant_type.name}_{hidden_size}.gguf"
     sample_file = Path(sample_dir) / filename
@@ -27,8 +27,8 @@ def get_gguf_sample_tensors(
 
 
 def get_gguf_MoE_tensors(
-        hidden_size: int,
-        quant_type: GGMLQuantizationType) -> list[ReaderTensor]:
+    hidden_size: int, quant_type: GGMLQuantizationType
+) -> list[ReaderTensor]:
     sample_dir = GGUF_SAMPLE_MOE
     filename = f"Quant_{quant_type.name}_{hidden_size}.gguf"
     sample_file = Path(sample_dir) / filename
@@ -68,17 +68,20 @@ def get_gguf_MoE_tensors(
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("quant_type", QUANT_TYPES)
 @torch.inference_mode()
-def test_dequantize(hidden_size: int, dtype: torch.dtype,
-                    quant_type: GGMLQuantizationType):
+def test_dequantize(
+    hidden_size: int, dtype: torch.dtype, quant_type: GGMLQuantizationType
+):
     tensors = get_gguf_sample_tensors(hidden_size, quant_type)
     for tensor in tensors:
         shape_str = tensor.name.split("_")[-1]
         shape = map(int, shape_str.split("x"))
 
-        ref_output = torch.tensor(dequantize(tensor.data, quant_type),
-                                  device="cuda").to(dtype)
-        output = ops.ggml_dequantize(torch.tensor(tensor.data, device="cuda"),
-                                     quant_type, *list(shape), dtype)
+        ref_output = torch.tensor(
+            dequantize(tensor.data, quant_type), device="cuda"
+        ).to(dtype)
+        output = ops.ggml_dequantize(
+            torch.tensor(tensor.data, device="cuda"), quant_type, *list(shape), dtype
+        )
 
         torch.testing.assert_close(output, ref_output, atol=1e-2, rtol=4e-2)
 
@@ -87,20 +90,21 @@ def test_dequantize(hidden_size: int, dtype: torch.dtype,
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("quant_type", QUANT_TYPES)
 @torch.inference_mode()
-def test_mmvq(hidden_size: int, dtype: torch.dtype,
-              quant_type: GGMLQuantizationType):
+def test_mmvq(hidden_size: int, dtype: torch.dtype, quant_type: GGMLQuantizationType):
     current_platform.seed_everything(0)
 
     tensors = get_gguf_sample_tensors(hidden_size, quant_type)
     x = torch.rand((1, hidden_size), dtype=dtype, device="cuda")
     for tensor in tensors:
-        weight = torch.tensor(dequantize(tensor.data, quant_type),
-                              device="cuda").to(dtype)
+        weight = torch.tensor(dequantize(tensor.data, quant_type), device="cuda").to(
+            dtype
+        )
         ref_output = x @ weight.T
 
         qweight = torch.tensor(tensor.data, device="cuda")
-        output = ops.ggml_mul_mat_vec_a8(qweight, x, quant_type,
-                                         qweight.shape[0]).to(dtype)
+        output = ops.ggml_mul_mat_vec_a8(qweight, x, quant_type, qweight.shape[0]).to(
+            dtype
+        )
 
         torch.testing.assert_close(output, ref_output, atol=1, rtol=1e-1)
 
@@ -121,17 +125,23 @@ def test_mmvq(hidden_size: int, dtype: torch.dtype,
         GGMLQuantizationType.Q4_0,
         GGMLQuantizationType.Q5_0,
         GGMLQuantizationType.Q8_0,
-    ])
+    ],
+)
 @torch.inference_mode()
-def test_mmq(num_tokens: int, hidden_size: int, dtype: torch.dtype,
-             quant_type: GGMLQuantizationType):
+def test_mmq(
+    num_tokens: int,
+    hidden_size: int,
+    dtype: torch.dtype,
+    quant_type: GGMLQuantizationType,
+):
     current_platform.seed_everything(0)
 
     tensors = get_gguf_sample_tensors(hidden_size, quant_type)
     x = torch.rand((num_tokens, hidden_size), dtype=dtype, device="cuda")
     for tensor in tensors:
-        weight = torch.tensor(dequantize(tensor.data, quant_type),
-                              device="cuda").to(dtype)
+        weight = torch.tensor(dequantize(tensor.data, quant_type), device="cuda").to(
+            dtype
+        )
         ref_output = x @ weight.T
 
         qweight = torch.tensor(tensor.data, device="cuda")
@@ -141,10 +151,9 @@ def test_mmq(num_tokens: int, hidden_size: int, dtype: torch.dtype,
         # bfloat16 tends to accumulate and can greatly inflate rtol
         # since outputs are also very close to 0
         rtols = {torch.half: 1e-1, torch.bfloat16: 1e4, torch.float: 2e1}
-        torch.testing.assert_close(output,
-                                   ref_output,
-                                   atol=atols[dtype],
-                                   rtol=rtols[dtype])
+        torch.testing.assert_close(
+            output, ref_output, atol=atols[dtype], rtol=rtols[dtype]
+        )
 
 
 @pytest.mark.parametrize("num_tokens", NUM_TOKENS)
@@ -153,35 +162,46 @@ def test_mmq(num_tokens: int, hidden_size: int, dtype: torch.dtype,
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("quant_type", QUANT_TYPES)
 @torch.inference_mode()
-def test_moe(num_tokens: int, hidden_size: int, dtype: torch.dtype,
-             quant_type: GGMLQuantizationType, top_k: int):
+def test_moe(
+    num_tokens: int,
+    hidden_size: int,
+    dtype: torch.dtype,
+    quant_type: GGMLQuantizationType,
+    top_k: int,
+):
     current_platform.seed_everything(0)
     H, E = 1024, 256
 
     x = torch.rand((num_tokens, H), dtype=dtype, device="cuda")
 
     topk_weights = torch.rand(num_tokens, top_k, device="cuda", dtype=dtype)
-    topk_ids = torch.randint(0,
-                             E, (num_tokens, top_k),
-                             device="cuda",
-                             dtype=torch.int32)
+    topk_ids = torch.randint(
+        0, E, (num_tokens, top_k), device="cuda", dtype=torch.int32
+    )
 
     tensors = get_gguf_MoE_tensors(hidden_size, quant_type)
 
     w13 = tensors[0]
     w2 = tensors[1]
 
-    w13_dequant = torch.tensor(dequantize(w13.data, quant_type),
-                               device="cuda").to(dtype)
-
-    w2_dequant = torch.tensor(dequantize(w2.data, quant_type),
-                              device="cuda").to(dtype)
-
-    output = _fused_moe_gguf(x, torch.tensor(w13.data, device="cuda"),
-                             torch.tensor(w2.data,
-                                          device="cuda"), topk_weights,
-                             topk_ids, quant_type, quant_type, "silu")
-
-    ref_output = fused_experts(x, w13_dequant, w2_dequant, topk_weights,
-                               topk_ids).reshape(output.shape)
+    w13_dequant = torch.tensor(dequantize(w13.data, quant_type), device="cuda").to(
+        dtype
+    )
+
+    w2_dequant = torch.tensor(dequantize(w2.data, quant_type), device="cuda").to(dtype)
+
+    output = _fused_moe_gguf(
+        x,
+        torch.tensor(w13.data, device="cuda"),
+        torch.tensor(w2.data, device="cuda"),
+        topk_weights,
+        topk_ids,
+        quant_type,
+        quant_type,
+        "silu",
+    )
+
+    ref_output = fused_experts(
+        x, w13_dequant, w2_dequant, topk_weights, topk_ids
+    ).reshape(output.shape)
     torch.testing.assert_close(output, ref_output, atol=1, rtol=1e-1)
diff --git a/tests/kernels/quantization/test_gptq.py b/tests/kernels/quantization/test_gptq.py
index 7fb57a1576bd..72e4194c1327 100644
--- a/tests/kernels/quantization/test_gptq.py
+++ b/tests/kernels/quantization/test_gptq.py
@@ -8,25 +8,22 @@
 
 
 def test_gptq_shuffle_opcheck():
-    weight = torch.randint(-2000000,
-                           2000000, (1792, 4096),
-                           device='cuda',
-                           dtype=torch.int32)
-    perm = torch.empty((0, ), device='cuda', dtype=torch.int32)
+    weight = torch.randint(
+        -2000000, 2000000, (1792, 4096), device="cuda", dtype=torch.int32
+    )
+    perm = torch.empty((0,), device="cuda", dtype=torch.int32)
     bit = 4
     opcheck(torch.ops._C.gptq_shuffle, (weight, perm, bit))
 
 
 def test_gptq_gemm_opcheck():
-    a = torch.rand((240, 4096), device='cuda', dtype=torch.float16)
-    weight = torch.randint(-2000000,
-                           2000000, (512, 6144),
-                           device='cuda',
-                           dtype=torch.int32)
-    zeros = torch.zeros((32, 768), device='cuda', dtype=torch.int32)
-    scales = torch.rand((32, 6144), device='cuda', dtype=torch.float16)
-    idx = torch.empty((0, ), device='cuda', dtype=torch.int32)
+    a = torch.rand((240, 4096), device="cuda", dtype=torch.float16)
+    weight = torch.randint(
+        -2000000, 2000000, (512, 6144), device="cuda", dtype=torch.int32
+    )
+    zeros = torch.zeros((32, 768), device="cuda", dtype=torch.int32)
+    scales = torch.rand((32, 6144), device="cuda", dtype=torch.float16)
+    idx = torch.empty((0,), device="cuda", dtype=torch.int32)
     use_exllama = True
     bit = 4
-    opcheck(torch.ops._C.gptq_gemm,
-            (a, weight, zeros, scales, idx, use_exllama, bit))
+    opcheck(torch.ops._C.gptq_gemm, (a, weight, zeros, scales, idx, use_exllama, bit))
diff --git a/tests/kernels/quantization/test_hadacore.py b/tests/kernels/quantization/test_hadacore.py
index 127d68072e3f..3ccee9db048c 100644
--- a/tests/kernels/quantization/test_hadacore.py
+++ b/tests/kernels/quantization/test_hadacore.py
@@ -15,7 +15,8 @@
 def test_hadacore(batch_size, hidden_dim, dtype=torch.bfloat16, device="cuda"):
     x = torch.eye(hidden_dim, dtype=dtype, device=device)
     hadamard = deterministic_hadamard_matrix(
-        hidden_dim, dtype=torch.float64, device="cuda") / math.sqrt(hidden_dim)
+        hidden_dim, dtype=torch.float64, device="cuda"
+    ) / math.sqrt(hidden_dim)
 
     y = ops.hadacore_transform(x.clone())
     y_true = (x.to(hadamard.dtype) @ hadamard.T).to(y.dtype)
diff --git a/tests/kernels/quantization/test_int8_kernel.py b/tests/kernels/quantization/test_int8_kernel.py
index f2271e6be542..0e31e9aabea8 100644
--- a/tests/kernels/quantization/test_int8_kernel.py
+++ b/tests/kernels/quantization/test_int8_kernel.py
@@ -11,12 +11,12 @@
 from vllm.model_executor.layers.fused_moe import fused_experts
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.quantization.utils.int8_utils import (
-    per_token_quant_int8)
+    per_token_quant_int8,
+)
 from vllm.platforms import current_platform
 
 if current_platform.get_device_capability() < (7, 0):
-    pytest.skip("INT8 Triton requires CUDA 7.0 or higher",
-                allow_module_level=True)
+    pytest.skip("INT8 Triton requires CUDA 7.0 or higher", allow_module_level=True)
 
 
 def native_w8a8_per_token_matmul(A, B, As, Bs, output_dtype=torch.float16):
@@ -26,14 +26,13 @@ def native_w8a8_per_token_matmul(A, B, As, Bs, output_dtype=torch.float16):
     B = B.to(torch.float32)
 
     assert A.shape[-1] == B.shape[-1], "Dimension mismatch"
-    assert B.ndim == 2 and B.is_contiguous(
-    ), "B must be a 2D contiguous tensor"
+    assert B.ndim == 2 and B.is_contiguous(), "B must be a 2D contiguous tensor"
 
     # Reshape input
     M = A.numel() // A.shape[-1]
     B = B.t()  # Transpose weight matrix
     N, K = B.shape
-    origin_C_shape = A.shape[:-1] + (K, )
+    origin_C_shape = A.shape[:-1] + (K,)
     A = A.reshape(M, N)
 
     # As is per-token [M, 1], Bs is per-column [1, K]
@@ -43,8 +42,7 @@ def native_w8a8_per_token_matmul(A, B, As, Bs, output_dtype=torch.float16):
     return C.reshape(origin_C_shape).to(output_dtype)
 
 
-def torch_w8a8_per_column_moe(a, w1, w2, w1_s, w2_s, topk, topk_weight,
-                              topk_ids):
+def torch_w8a8_per_column_moe(a, w1, w2, w1_s, w2_s, topk, topk_weight, topk_ids):
     """This function performs fused moe with per-column int8 quantization
     using native torch."""
 
@@ -66,25 +64,22 @@ def torch_w8a8_per_column_moe(a, w1, w2, w1_s, w2_s, topk, topk_weight,
         mask = topk_ids == i
         if mask.sum():
             # First MLP layer: note that a_s is now per-token
-            inter_out = native_w8a8_per_token_matmul(a_q[mask],
-                                                     w1[i],
-                                                     a_s[mask],
-                                                     w1_s[i],
-                                                     output_dtype=a.dtype)
+            inter_out = native_w8a8_per_token_matmul(
+                a_q[mask], w1[i], a_s[mask], w1_s[i], output_dtype=a.dtype
+            )
             # Activation function
             act_out = SiluAndMul().forward_native(inter_out)
             # Quantize activation output with per-token
             act_out_q, act_out_s = per_token_quant_int8(act_out)
 
             # Second MLP layer
-            out[mask] = native_w8a8_per_token_matmul(act_out_q,
-                                                     w2[i],
-                                                     act_out_s,
-                                                     w2_s[i],
-                                                     output_dtype=a.dtype)
+            out[mask] = native_w8a8_per_token_matmul(
+                act_out_q, w2[i], act_out_s, w2_s[i], output_dtype=a.dtype
+            )
     # Apply routing weights and sum
-    return (out.view(B, -1, w2.shape[1]) *
-            topk_weight.view(B, -1, 1).to(out.dtype)).sum(dim=1)
+    return (
+        out.view(B, -1, w2.shape[1]) * topk_weight.view(B, -1, 1).to(out.dtype)
+    ).sum(dim=1)
 
 
 @pytest.fixture(autouse=True, scope="module")
@@ -102,8 +97,10 @@ def setup_cuda():
 SEEDS = [0]
 
 
-@pytest.mark.parametrize("M, N, K, E, topk, dtype, seed",
-                         itertools.product(M, N, K, E, TOP_KS, DTYPES, SEEDS))
+@pytest.mark.parametrize(
+    "M, N, K, E, topk, dtype, seed",
+    itertools.product(M, N, K, E, TOP_KS, DTYPES, SEEDS),
+)
 @torch.inference_mode()
 def test_w8a8_fp8_fused_moe(M, N, K, E, topk, dtype, seed):
     torch.manual_seed(seed)
@@ -130,8 +127,9 @@ def test_w8a8_fp8_fused_moe(M, N, K, E, topk, dtype, seed):
     score = torch.softmax(score, dim=-1, dtype=torch.float32)
     topk_weights, topk_ids = torch.topk(score, topk)
 
-    ref_out = torch_w8a8_per_column_moe(a, w1, w2, w1_s, w2_s, topk,
-                                        topk_weights, topk_ids)
+    ref_out = torch_w8a8_per_column_moe(
+        a, w1, w2, w1_s, w2_s, topk, topk_weights, topk_ids
+    )
 
     quant_config = FusedMoEQuantConfig.make(
         torch.int8,
@@ -151,7 +149,7 @@ def test_w8a8_fp8_fused_moe(M, N, K, E, topk, dtype, seed):
     )
 
     # Check results
-    rel_diff = (torch.mean(
-        torch.abs(out.to(torch.float32) - ref_out.to(torch.float32))) /
-                torch.mean(torch.abs(ref_out.to(torch.float32))))
+    rel_diff = torch.mean(
+        torch.abs(out.to(torch.float32) - ref_out.to(torch.float32))
+    ) / torch.mean(torch.abs(ref_out.to(torch.float32)))
     assert rel_diff < 0.05
diff --git a/tests/kernels/quantization/test_int8_quant.py b/tests/kernels/quantization/test_int8_quant.py
index c1c9bf191d5b..48e947db5fa7 100644
--- a/tests/kernels/quantization/test_int8_quant.py
+++ b/tests/kernels/quantization/test_int8_quant.py
@@ -18,26 +18,24 @@
 
 def opcheck_int8_quant_static(output, input, scale, azp=None):
     if azp is None:
-        opcheck(torch.ops._C.static_scaled_int8_quant,
-                (output, input, scale, None))
+        opcheck(torch.ops._C.static_scaled_int8_quant, (output, input, scale, None))
     else:
-        opcheck(torch.ops._C.static_scaled_int8_quant,
-                (output, input, scale, azp))
+        opcheck(torch.ops._C.static_scaled_int8_quant, (output, input, scale, azp))
 
 
 def opcheck_int8_quant_dynamic(output, input, symmetric=True):
-    scale = torch.empty((input.numel() // input.shape[-1], 1),
-                        device=input.device,
-                        dtype=torch.float32)
+    scale = torch.empty(
+        (input.numel() // input.shape[-1], 1), device=input.device, dtype=torch.float32
+    )
     if symmetric:
-        opcheck(torch.ops._C.dynamic_scaled_int8_quant,
-                (output, input, scale, None))
+        opcheck(torch.ops._C.dynamic_scaled_int8_quant, (output, input, scale, None))
     else:
-        azp = torch.empty((input.numel() // input.shape[-1], 1),
-                          device=input.device,
-                          dtype=torch.int32)
-        opcheck(torch.ops._C.dynamic_scaled_int8_quant,
-                (output, input, scale, azp))
+        azp = torch.empty(
+            (input.numel() // input.shape[-1], 1),
+            device=input.device,
+            dtype=torch.int32,
+        )
+        opcheck(torch.ops._C.dynamic_scaled_int8_quant, (output, input, scale, azp))
 
 
 @pytest.mark.parametrize("num_tokens", NUM_TOKENS)
@@ -45,8 +43,9 @@ def opcheck_int8_quant_dynamic(output, input, symmetric=True):
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("seed", SEEDS)
 @torch.inference_mode()
-def test_dynamic_scaled_int8_quant(num_tokens: int, hidden_size: int,
-                                   dtype: torch.dtype, seed: int) -> None:
+def test_dynamic_scaled_int8_quant(
+    num_tokens: int, hidden_size: int, dtype: torch.dtype, seed: int
+) -> None:
     current_platform.seed_everything(seed)
 
     x = torch.rand(num_tokens, hidden_size, dtype=dtype, device="cuda") * 1000
@@ -68,30 +67,31 @@ def test_dynamic_scaled_int8_quant(num_tokens: int, hidden_size: int,
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("seed", SEEDS)
 @torch.inference_mode()
-def test_dynamic_scaled_int8_azp_quant(num_tokens: int, hidden_size: int,
-                                       dtype: torch.dtype, seed: int) -> None:
+def test_dynamic_scaled_int8_azp_quant(
+    num_tokens: int, hidden_size: int, dtype: torch.dtype, seed: int
+) -> None:
     current_platform.seed_everything(seed)
     int8_traits = torch.iinfo(torch.int8)
 
-    x = torch.rand(num_tokens, hidden_size, dtype=dtype,
-                   device="cuda") * 1000 - 300
+    x = torch.rand(num_tokens, hidden_size, dtype=dtype, device="cuda") * 1000 - 300
 
     x_token_max, _ = x.to(dtype=torch.float32).max(dim=1, keepdim=True)
     x_token_min, _ = x.to(dtype=torch.float32).min(dim=1, keepdim=True)
 
     # calculate scale and azp, and adjust the range
     scales = (x_token_max - x_token_min) / torch.tensor(255.0)
-    azps = torch.round(torch.tensor(-128.0) - x_token_min / scales).to(
-        torch.int32)
+    azps = torch.round(torch.tensor(-128.0) - x_token_min / scales).to(torch.int32)
 
-    torch_out = ((x / scales).round() + azps).clamp(
-        int8_traits.min, int8_traits.max).to(torch.int8)
-    assert torch_out.min() >= int8_traits.min and torch_out.max(
-    ) <= int8_traits.max
+    torch_out = (
+        ((x / scales).round() + azps)
+        .clamp(int8_traits.min, int8_traits.max)
+        .to(torch.int8)
+    )
+    assert torch_out.min() >= int8_traits.min and torch_out.max() <= int8_traits.max
 
     ops_out, scales_out, azp_out = scaled_int8_quant(x, symmetric=False)
 
-    if (not torch.allclose(scales_out, scales)):
+    if not torch.allclose(scales_out, scales):
         print(torch.argmax(torch.abs(scales_out - scales)))
     torch.testing.assert_close(scales_out, scales)
     # big atol to account for rounding errors
@@ -108,17 +108,18 @@ def test_dynamic_scaled_int8_azp_quant(num_tokens: int, hidden_size: int,
 @pytest.mark.parametrize("seed", SEEDS)
 @pytest.mark.parametrize("scale", SCALE)
 @torch.inference_mode()
-def test_static_scaled_int8_quant(num_tokens: int, hidden_size: int,
-                                  dtype: torch.dtype, seed: int,
-                                  scale: float) -> None:
+def test_static_scaled_int8_quant(
+    num_tokens: int, hidden_size: int, dtype: torch.dtype, seed: int, scale: float
+) -> None:
     current_platform.seed_everything(seed)
     int8_traits = torch.iinfo(torch.int8)
 
     x = torch.rand(num_tokens, hidden_size, dtype=dtype, device="cuda") * 1000
     scale_arg = torch.tensor([scale], dtype=torch.float32, device="cuda")
 
-    out1 = (x / scale_arg).round().clamp(int8_traits.min,
-                                         int8_traits.max).to(torch.int8)
+    out1 = (
+        (x / scale_arg).round().clamp(int8_traits.min, int8_traits.max).to(torch.int8)
+    )
     out2, scale2, _ = scaled_int8_quant(x, scale_arg)
     assert scale2 is scale_arg
 
@@ -135,24 +136,28 @@ def test_static_scaled_int8_quant(num_tokens: int, hidden_size: int,
 @pytest.mark.parametrize("scale", SCALE)
 @pytest.mark.parametrize("azp", [-255, 54])
 @torch.inference_mode()
-def test_static_scaled_int8_azp_quant(num_tokens: int, hidden_size: int,
-                                      dtype: torch.dtype, seed: int,
-                                      scale: float, azp: int) -> None:
+def test_static_scaled_int8_azp_quant(
+    num_tokens: int,
+    hidden_size: int,
+    dtype: torch.dtype,
+    seed: int,
+    scale: float,
+    azp: int,
+) -> None:
     current_platform.seed_everything(seed)
     int8_traits = torch.iinfo(torch.int8)
 
-    x = torch.rand(num_tokens, hidden_size, dtype=dtype,
-                   device="cuda") * 1000 - 300
+    x = torch.rand(num_tokens, hidden_size, dtype=dtype, device="cuda") * 1000 - 300
 
-    out1 = ((x / scale).round() + azp).clamp(int8_traits.min,
-                                             int8_traits.max).to(torch.int8)
+    out1 = (
+        ((x / scale).round() + azp)
+        .clamp(int8_traits.min, int8_traits.max)
+        .to(torch.int8)
+    )
     scale_arg = torch.tensor([scale], dtype=torch.float32, device="cuda")
     azp_arg = torch.tensor([azp], dtype=torch.int32, device="cuda")
 
-    out2, scale2, azp2 = scaled_int8_quant(x,
-                                           scale_arg,
-                                           azp_arg,
-                                           symmetric=False)
+    out2, scale2, azp2 = scaled_int8_quant(x, scale_arg, azp_arg, symmetric=False)
     assert scale2 is scale_arg
     assert azp2 is azp_arg
 
@@ -172,10 +177,7 @@ def test_static_scaled_int8_azp_quant_saturating_cast(is_max: bool) -> None:
     int32_traits = torch.iinfo(torch.int32)
     val = float(int32_traits.max if is_max else int32_traits.min)
 
-    x_vals = [[
-        nextafter(val, inf), val + 1, val, val - 1,
-        nextafter(val, -inf)
-    ]]
+    x_vals = [[nextafter(val, inf), val + 1, val, val - 1, nextafter(val, -inf)]]
     x = torch.tensor(x_vals, dtype=torch.float32, device="cuda")
 
     # The calculation in the kernel is: cast<int8>(cast<int32>(x / scale) + azp)
diff --git a/tests/kernels/quantization/test_machete_mm.py b/tests/kernels/quantization/test_machete_mm.py
index 50584f3f82d4..b32523bb85d9 100644
--- a/tests/kernels/quantization/test_machete_mm.py
+++ b/tests/kernels/quantization/test_machete_mm.py
@@ -15,15 +15,16 @@
 from tests.kernels.utils import opcheck
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.utils.machete_utils import (
-    query_machete_supported_group_sizes)
+    query_machete_supported_group_sizes,
+)
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    pack_rows, quantize_weights)
+    pack_rows,
+    quantize_weights,
+)
 from vllm.platforms import current_platform
 from vllm.scalar_type import ScalarType, scalar_types
 
-CUDA_DEVICES = [
-    f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)
-]
+CUDA_DEVICES = [f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)]
 
 # TODO: in future PR refactor this and `is_quant_method_supported` in the kernel
 #  unit tests to a common utility function. Currently the use of
@@ -72,29 +73,38 @@ class Tensors:
 #  Ch Scales Type, Tok Scales Type)
 # NOTE: None "Scale Type" means the act type is floating point
 #       None "Output Type" means the output type is the same as the act type
-TestTypeTuple = tuple[list[torch.dtype], ScalarType, Optional[torch.dtype],
-                      Optional[torch.dtype], bool]
+TestTypeTuple = tuple[
+    list[torch.dtype], ScalarType, Optional[torch.dtype], Optional[torch.dtype], bool
+]
 TEST_TYPES = [
     # GPTQ style
-    *(TypeConfig(act_type=a_type,
-                 weight_type=w_type,
-                 output_type=None,
-                 group_scale_type=a_type,
-                 group_zero_type=None,
-                 channel_scale_type=None,
-                 token_scale_type=None)
-      for w_type in [scalar_types.uint4b8, scalar_types.uint8b128]
-      for a_type in [torch.float16, torch.bfloat16]),
+    *(
+        TypeConfig(
+            act_type=a_type,
+            weight_type=w_type,
+            output_type=None,
+            group_scale_type=a_type,
+            group_zero_type=None,
+            channel_scale_type=None,
+            token_scale_type=None,
+        )
+        for w_type in [scalar_types.uint4b8, scalar_types.uint8b128]
+        for a_type in [torch.float16, torch.bfloat16]
+    ),
     # AWQ style
-    *(TypeConfig(act_type=a_type,
-                 weight_type=w_type,
-                 output_type=None,
-                 group_scale_type=a_type,
-                 group_zero_type=a_type,
-                 channel_scale_type=None,
-                 token_scale_type=None)
-      for w_type in [scalar_types.uint4, scalar_types.uint8]
-      for a_type in [torch.float16, torch.bfloat16]),
+    *(
+        TypeConfig(
+            act_type=a_type,
+            weight_type=w_type,
+            output_type=None,
+            group_scale_type=a_type,
+            group_zero_type=a_type,
+            channel_scale_type=None,
+            token_scale_type=None,
+        )
+        for w_type in [scalar_types.uint4, scalar_types.uint8]
+        for a_type in [torch.float16, torch.bfloat16]
+    ),
     # # QQQ style
     # *(TypeConfig(act_type=torch.int8,
     #              weight_type=scalar_types.uint4b8,
@@ -133,17 +143,18 @@ def maybe_convert_zeropoints(zps: Optional[torch.Tensor], s: torch.Tensor):
     return zps if zps is None else -1 * s * (zps.to(s.dtype))
 
 
-def group_size_valid(shape: tuple[int, int, int],
-                     group_size: Optional[int]) -> bool:
+def group_size_valid(shape: tuple[int, int, int], group_size: Optional[int]) -> bool:
     return group_size is None or group_size == -1 or shape[2] % group_size == 0
 
 
-def machete_quantize_and_pack(atype: torch.dtype,
-                              w: torch.Tensor,
-                              wtype: ScalarType,
-                              stype: Optional[torch.dtype],
-                              group_size: Optional[int],
-                              zero_points: bool = False):
+def machete_quantize_and_pack(
+    atype: torch.dtype,
+    w: torch.Tensor,
+    wtype: ScalarType,
+    stype: Optional[torch.dtype],
+    group_size: Optional[int],
+    zero_points: bool = False,
+):
     assert wtype.is_integer(), "TODO: support floating point weights"
 
     w_ref, w_q, w_s, w_zp = quantize_weights(
@@ -152,7 +163,8 @@ def machete_quantize_and_pack(atype: torch.dtype,
         group_size=group_size,
         zero_points=zero_points,
         # to match how the kernel applies zps
-        ref_zero_points_after_scales=True)
+        ref_zero_points_after_scales=True,
+    )
 
     w_q = pack_rows(w_q, wtype.size_bits, *w_q.shape)
     w_q = w_q.t().contiguous().t()  # convert to col major
@@ -163,15 +175,18 @@ def machete_quantize_and_pack(atype: torch.dtype,
     return w_ref, w_q_machete, w_s, w_zp
 
 
-def create_test_tensors(shape: tuple[int, int, int],
-                        types: TypeConfig,
-                        group_size: Optional[int],
-                        subset_stride_factor: Optional[int] = None) -> Tensors:
+def create_test_tensors(
+    shape: tuple[int, int, int],
+    types: TypeConfig,
+    group_size: Optional[int],
+    subset_stride_factor: Optional[int] = None,
+) -> Tensors:
     m, n, k = shape
     factor = subset_stride_factor or 1
 
-    print("create_test_tensors, shape:", shape, "types:", types, "group_size:",
-          group_size)
+    print(
+        "create_test_tensors, shape:", shape, "types:", types, "group_size:", group_size
+    )
 
     a = rand_data((m * factor, k * factor), types.act_type, scale=3, offset=2)
     w = rand_data((k * factor, n * factor), types.act_type, scale=3, offset=1)
@@ -186,8 +201,13 @@ def create_test_tensors(shape: tuple[int, int, int],
         w = w.to(torch.float16)
 
     w_ref, w_q_packed, w_s, w_zp = machete_quantize_and_pack(
-        a.dtype, w, types.weight_type, types.group_scale_type, group_size,
-        types.group_zero_type is not None)
+        a.dtype,
+        w,
+        types.weight_type,
+        types.group_scale_type,
+        group_size,
+        types.group_zero_type is not None,
+    )
 
     if not a.dtype.is_floating_point:
         aiinfo = torch.iinfo(a.dtype)
@@ -196,35 +216,47 @@ def create_test_tensors(shape: tuple[int, int, int],
     a_ref = a.to(torch.float32)
     w_ref = w_ref.to(torch.float32)
 
-    w_ch_s = None if types.channel_scale_type is None else\
-        rand_data((n,), types.channel_scale_type)
-    w_tok_s = None if types.token_scale_type is None else\
-        rand_data((m,), types.token_scale_type)
+    w_ch_s = (
+        None
+        if types.channel_scale_type is None
+        else rand_data((n,), types.channel_scale_type)
+    )
+    w_tok_s = (
+        None
+        if types.token_scale_type is None
+        else rand_data((m,), types.token_scale_type)
+    )
 
-    return Tensors(w_ref=w_ref,
-                   a_ref=a_ref,
-                   a=a,
-                   w_q=w_q_packed,
-                   w_g_s=w_s,
-                   w_g_zp=maybe_convert_zeropoints(w_zp, w_s),
-                   w_ch_s=w_ch_s,
-                   w_tok_s=w_tok_s)
+    return Tensors(
+        w_ref=w_ref,
+        a_ref=a_ref,
+        a=a,
+        w_q=w_q_packed,
+        w_g_s=w_s,
+        w_g_zp=maybe_convert_zeropoints(w_zp, w_s),
+        w_ch_s=w_ch_s,
+        w_tok_s=w_tok_s,
+    )
 
 
 # None stype means scales use the same dtype as a
-def machete_mm_test_helper(types: TypeConfig,
-                           tensors: Tensors,
-                           group_size: Optional[int] = None,
-                           schedule: Optional[str] = None):
+def machete_mm_test_helper(
+    types: TypeConfig,
+    tensors: Tensors,
+    group_size: Optional[int] = None,
+    schedule: Optional[str] = None,
+):
     output_ref = torch.matmul(tensors.a_ref, tensors.w_ref)
     output_ref_type = output_ref.dtype
 
     if tensors.w_ch_s is not None:
-        output_ref = (output_ref.to(tensors.w_ch_s.dtype) *
-                      tensors.w_ch_s.unsqueeze(0)).to(output_ref_type)
+        output_ref = (
+            output_ref.to(tensors.w_ch_s.dtype) * tensors.w_ch_s.unsqueeze(0)
+        ).to(output_ref_type)
     if tensors.w_tok_s is not None:
-        output_ref = (output_ref.to(tensors.w_tok_s.dtype) *
-                      tensors.w_tok_s.unsqueeze(1)).to(output_ref_type)
+        output_ref = (
+            output_ref.to(tensors.w_tok_s.dtype) * tensors.w_tok_s.unsqueeze(1)
+        ).to(output_ref_type)
 
     output = ops.machete_mm(
         a=tensors.a,
@@ -245,23 +277,23 @@ def machete_mm_test_helper(types: TypeConfig,
     # Relax atol as our reduction dim becomes larger (more rounding error)
     # Relax atol when we have zeropoints since the way machete applies
     #  zeropoints (after scales) causes noise around 0
-    atol = 1 if tensors.w_g_zp is not None\
+    atol = (
+        1
+        if tensors.w_g_zp is not None
         else min(5e-2 * math.sqrt(tensors.a.shape[1]), 1)
+    )
     rtol = 1e-1 if tensors.a.element_size() >= 2 else 2e-1
-    torch.testing.assert_close(output,
-                               output_ref.to(output.dtype),
-                               rtol=rtol,
-                               atol=atol)
+    torch.testing.assert_close(
+        output, output_ref.to(output.dtype), rtol=rtol, atol=atol
+    )
 
 
-@pytest.mark.skipif(not IS_SUPPORTED_BY_GPU,
-                    reason="Machete is not supported on this GPU type.")
-@pytest.mark.parametrize("shape",
-                         MNK_SHAPES,
-                         ids=lambda x: "x".join(str(v) for v in x))
+@pytest.mark.skipif(
+    not IS_SUPPORTED_BY_GPU, reason="Machete is not supported on this GPU type."
+)
+@pytest.mark.parametrize("shape", MNK_SHAPES, ids=lambda x: "x".join(str(v) for v in x))
 @pytest.mark.parametrize("types", TEST_TYPES)
 def test_machete_all_schedules(shape, types: TypeConfig):
-
     group_sizes: list[Optional[int]] = []
     if types.group_scale_type is None:
         group_sizes = [None]
@@ -275,20 +307,20 @@ def test_machete_all_schedules(shape, types: TypeConfig):
         tensors = create_test_tensors(shape, types, group_size)
         print(f"MNK = {shape}")
         for schedule in ops.machete_supported_schedules(
-                types.act_type,
-                types.weight_type,
-                group_scales_type=types.group_scale_type,
-                group_zeros_type=types.group_scale_type,
-                out_type=types.output_type):
+            types.act_type,
+            types.weight_type,
+            group_scales_type=types.group_scale_type,
+            group_zeros_type=types.group_scale_type,
+            out_type=types.output_type,
+        ):
             print(f"Testing schedule {schedule}")
             machete_mm_test_helper(types, tensors, group_size, schedule)
 
 
-@pytest.mark.skipif(not IS_SUPPORTED_BY_GPU,
-                    reason="Machete is not supported on this GPU type.")
-@pytest.mark.parametrize("shape",
-                         MNK_SHAPES,
-                         ids=lambda x: "x".join(str(v) for v in x))
+@pytest.mark.skipif(
+    not IS_SUPPORTED_BY_GPU, reason="Machete is not supported on this GPU type."
+)
+@pytest.mark.parametrize("shape", MNK_SHAPES, ids=lambda x: "x".join(str(v) for v in x))
 @pytest.mark.parametrize("types", TEST_TYPES)
 def test_machete_heuristic(shape, types: TypeConfig):
     group_sizes: list[Optional[int]] = []
@@ -306,19 +338,22 @@ def test_machete_heuristic(shape, types: TypeConfig):
 
 
 # Test working on other devices
-@pytest.mark.skipif(not IS_SUPPORTED_BY_GPU,
-                    reason="Machete is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not IS_SUPPORTED_BY_GPU, reason="Machete is not supported on this GPU type."
+)
 @pytest.mark.parametrize("device", CUDA_DEVICES)
 def test_machete_devices(device: str):
     group_size = 128
 
-    type_config = TypeConfig(act_type=torch.float16,
-                             weight_type=scalar_types.uint4b8,
-                             output_type=None,
-                             group_scale_type=torch.float16,
-                             group_zero_type=None,
-                             channel_scale_type=None,
-                             token_scale_type=None)
+    type_config = TypeConfig(
+        act_type=torch.float16,
+        weight_type=scalar_types.uint4b8,
+        output_type=None,
+        group_scale_type=torch.float16,
+        group_zero_type=None,
+        channel_scale_type=None,
+        token_scale_type=None,
+    )
 
     tensors = create_test_tensors((512, 4096, 4096), type_config, group_size)
 
@@ -331,29 +366,30 @@ def test_machete_devices(device: str):
 
 
 # Test working with a subset of A and B
-@pytest.mark.skipif(not IS_SUPPORTED_BY_GPU,
-                    reason="Machete is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not IS_SUPPORTED_BY_GPU, reason="Machete is not supported on this GPU type."
+)
 def test_machete_subset():
     group_size = 128
 
-    type_config = TypeConfig(act_type=torch.float16,
-                             weight_type=scalar_types.uint4b8,
-                             output_type=None,
-                             group_scale_type=torch.float16,
-                             group_zero_type=None,
-                             channel_scale_type=None,
-                             token_scale_type=None)
-
-    tensors = create_test_tensors((512, 4096, 4096),
-                                  type_config,
-                                  group_size,
-                                  subset_stride_factor=2)
+    type_config = TypeConfig(
+        act_type=torch.float16,
+        weight_type=scalar_types.uint4b8,
+        output_type=None,
+        group_scale_type=torch.float16,
+        group_zero_type=None,
+        channel_scale_type=None,
+        token_scale_type=None,
+    )
+
+    tensors = create_test_tensors(
+        (512, 4096, 4096), type_config, group_size, subset_stride_factor=2
+    )
     machete_mm_test_helper(type_config, tensors, group_size)
 
 
 # Test to make sure cuda graphs work
 class MacheteLayer(torch.nn.Module):
-
     def __init__(self, **kwargs):
         super().__init__()
         self.kwargs = kwargs
@@ -362,8 +398,9 @@ def forward(self, a):
         return ops.machete_mm(a=a, **self.kwargs)
 
 
-@pytest.mark.skipif(not IS_SUPPORTED_BY_GPU,
-                    reason="Machete is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not IS_SUPPORTED_BY_GPU, reason="Machete is not supported on this GPU type."
+)
 def test_machete_cuda_graph():
     m, n, k = 512, 4096, 4096
 
@@ -375,7 +412,8 @@ def test_machete_cuda_graph():
     zero_points = False
 
     w_ref, w_q_packed, w_s, w_zp = machete_quantize_and_pack(
-        a.dtype, b, wtype, stype, group_size, zero_points)
+        a.dtype, b, wtype, stype, group_size, zero_points
+    )
 
     # Construct a trivial model with a single layer that calls a machete kernel
     model = MacheteLayer(
diff --git a/tests/kernels/quantization/test_marlin_gemm.py b/tests/kernels/quantization/test_marlin_gemm.py
index 0be020085bfa..0833115fcf30 100644
--- a/tests/kernels/quantization/test_marlin_gemm.py
+++ b/tests/kernels/quantization/test_marlin_gemm.py
@@ -4,6 +4,7 @@
 
 Run `pytest tests/kernels/quantization/test_marlin_gemm.py`.
 """
+
 import pytest
 import torch
 
@@ -11,24 +12,44 @@
 from tests.quantization.utils import is_quant_method_supported
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.gptq_marlin_24 import (
-    GPTQ_MARLIN_24_MAX_PARALLEL, GPTQ_MARLIN_24_MIN_THREAD_N,
-    GPTQ_MARLIN_24_SUPPORTED_GROUP_SIZES, GPTQ_MARLIN_24_SUPPORTED_QUANT_TYPES)
+    GPTQ_MARLIN_24_MAX_PARALLEL,
+    GPTQ_MARLIN_24_MIN_THREAD_N,
+    GPTQ_MARLIN_24_SUPPORTED_GROUP_SIZES,
+    GPTQ_MARLIN_24_SUPPORTED_QUANT_TYPES,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-    MARLIN_SUPPORTED_GROUP_SIZES, marlin_make_empty_g_idx,
-    marlin_make_workspace_new, marlin_permute_bias, marlin_permute_scales,
-    query_marlin_supported_quant_types)
+    MARLIN_SUPPORTED_GROUP_SIZES,
+    marlin_make_empty_g_idx,
+    marlin_make_workspace_new,
+    marlin_permute_bias,
+    marlin_permute_scales,
+    query_marlin_supported_quant_types,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp4 import (
-    FP4_MARLIN_SUPPORTED_GROUP_SIZES, rand_marlin_weight_mxfp4_like,
-    rand_marlin_weight_nvfp4_like)
+    FP4_MARLIN_SUPPORTED_GROUP_SIZES,
+    rand_marlin_weight_mxfp4_like,
+    rand_marlin_weight_nvfp4_like,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp8 import (
-    marlin_quant_fp8_torch)
+    marlin_quant_fp8_torch,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_test import (
-    MarlinWorkspace, awq_marlin_quantize, get_weight_perm, marlin_quantize,
-    marlin_weights)
+    MarlinWorkspace,
+    awq_marlin_quantize,
+    get_weight_perm,
+    marlin_quantize,
+    marlin_weights,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_test_24 import (
-    marlin_24_quantize)
+    marlin_24_quantize,
+)
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    awq_pack, gptq_pack, gptq_quantize_weights, quantize_weights, sort_weights)
+    awq_pack,
+    gptq_pack,
+    gptq_quantize_weights,
+    quantize_weights,
+    sort_weights,
+)
 from vllm.scalar_type import scalar_types
 
 ACT_ORDER_OPTS = [False, True]
@@ -56,24 +77,27 @@
 
 def compute_max_diff(output, output_ref):
     return torch.mean(torch.abs(output - output_ref)) / torch.mean(
-        torch.abs(output_ref))
+        torch.abs(output_ref)
+    )
 
 
 def rand_data(shape, dtype=torch.float16):
     return torch.randn(shape, dtype=dtype, device="cuda")
 
 
-@pytest.mark.skipif(not is_quant_method_supported("gptq_marlin"),
-                    reason="Marlin is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("gptq_marlin"),
+    reason="Marlin is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("k_chunk", MARLIN_K_CHUNKS)
 @pytest.mark.parametrize("n_chunk", MARLIN_N_CHUNKS)
-@pytest.mark.parametrize("quant_type",
-                         query_marlin_supported_quant_types(False, False))
+@pytest.mark.parametrize("quant_type", query_marlin_supported_quant_types(False, False))
 @pytest.mark.parametrize("group_size", MARLIN_SUPPORTED_GROUP_SIZES)
 @pytest.mark.parametrize("act_order", ACT_ORDER_OPTS)
 @pytest.mark.parametrize("mnk_factors", MNK_FACTORS)
-def test_gptq_marlin_repack(k_chunk, n_chunk, quant_type, group_size,
-                            act_order, mnk_factors):
+def test_gptq_marlin_repack(
+    k_chunk, n_chunk, quant_type, group_size, act_order, mnk_factors
+):
     m_factor, n_factor, k_factor = mnk_factors
 
     size_k = k_chunk * k_factor
@@ -96,7 +120,8 @@ def test_gptq_marlin_repack(k_chunk, n_chunk, quant_type, group_size,
 
     # Quantize (and apply act_order if provided)
     w_ref, q_w, s, g_idx, rand_perm = gptq_quantize_weights(
-        b_weight, quant_type, group_size, act_order)
+        b_weight, quant_type, group_size, act_order
+    )
 
     # Pack to GPTQ format
     q_w_gptq = gptq_pack(q_w, quant_type.size_bits, size_k, size_n)
@@ -109,11 +134,14 @@ def test_gptq_marlin_repack(k_chunk, n_chunk, quant_type, group_size,
 
     # Pack to Marlin format
     weight_perm = get_weight_perm(quant_type.size_bits)
-    marlin_q_w_1 = marlin_weights(q_w, size_k, size_n, quant_type.size_bits,
-                                  weight_perm)
+    marlin_q_w_1 = marlin_weights(
+        q_w, size_k, size_n, quant_type.size_bits, weight_perm
+    )
 
-    opcheck(torch.ops._C.gptq_marlin_repack,
-            (q_w_gptq, sort_indices, size_k, size_n, quant_type.size_bits))
+    opcheck(
+        torch.ops._C.gptq_marlin_repack,
+        (q_w_gptq, sort_indices, size_k, size_n, quant_type.size_bits),
+    )
 
     # Run Marlin repack GPU kernel
     marlin_q_w_2 = ops.gptq_marlin_repack(
@@ -128,16 +156,16 @@ def test_gptq_marlin_repack(k_chunk, n_chunk, quant_type, group_size,
     torch.testing.assert_close(marlin_q_w_1, marlin_q_w_2)
 
 
-@pytest.mark.skipif(not is_quant_method_supported("gptq_marlin"),
-                    reason="Marlin is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("gptq_marlin"),
+    reason="Marlin is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("k_chunk", MARLIN_K_CHUNKS)
 @pytest.mark.parametrize("n_chunk", MARLIN_N_CHUNKS)
-@pytest.mark.parametrize("quant_type",
-                         query_marlin_supported_quant_types(True))
+@pytest.mark.parametrize("quant_type", query_marlin_supported_quant_types(True))
 @pytest.mark.parametrize("group_size", MARLIN_SUPPORTED_GROUP_SIZES)
 @pytest.mark.parametrize("mnk_factors", MNK_FACTORS)
-def test_awq_marlin_repack(k_chunk, n_chunk, quant_type, group_size,
-                           mnk_factors):
+def test_awq_marlin_repack(k_chunk, n_chunk, quant_type, group_size, mnk_factors):
     m_factor, n_factor, k_factor = mnk_factors
 
     size_k = k_chunk * k_factor
@@ -152,21 +180,22 @@ def test_awq_marlin_repack(k_chunk, n_chunk, quant_type, group_size,
     b_weight = rand_data((size_k, size_n))
 
     # Quantize
-    w_ref, q_w, s, zp = quantize_weights(b_weight,
-                                         quant_type,
-                                         group_size,
-                                         zero_points=True)
+    w_ref, q_w, s, zp = quantize_weights(
+        b_weight, quant_type, group_size, zero_points=True
+    )
 
     # Pack to AWQ format
     q_w_awq = awq_pack(q_w, quant_type.size_bits, size_k, size_n)
 
     # Pack to Marlin format
     weight_perm = get_weight_perm(quant_type.size_bits)
-    marlin_q_w_1 = marlin_weights(q_w, size_k, size_n, quant_type.size_bits,
-                                  weight_perm)
+    marlin_q_w_1 = marlin_weights(
+        q_w, size_k, size_n, quant_type.size_bits, weight_perm
+    )
 
-    opcheck(torch.ops._C.awq_marlin_repack,
-            (q_w_awq, size_k, size_n, quant_type.size_bits))
+    opcheck(
+        torch.ops._C.awq_marlin_repack, (q_w_awq, size_k, size_n, quant_type.size_bits)
+    )
 
     # Run Marlin repack GPU kernel
     marlin_q_w_2 = ops.awq_marlin_repack(
@@ -180,23 +209,34 @@ def test_awq_marlin_repack(k_chunk, n_chunk, quant_type, group_size,
     torch.testing.assert_close(marlin_q_w_1, marlin_q_w_2)
 
 
-@pytest.mark.skipif(not is_quant_method_supported("gptq_marlin"),
-                    reason="Marlin is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("gptq_marlin"),
+    reason="Marlin is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("k_chunk", MARLIN_K_CHUNKS)
 @pytest.mark.parametrize("n_chunk", MARLIN_N_CHUNKS)
 @pytest.mark.parametrize("quant_type", query_marlin_supported_quant_types())
 @pytest.mark.parametrize(
-    "group_size",
-    set(MARLIN_SUPPORTED_GROUP_SIZES + FP4_MARLIN_SUPPORTED_GROUP_SIZES))
+    "group_size", set(MARLIN_SUPPORTED_GROUP_SIZES + FP4_MARLIN_SUPPORTED_GROUP_SIZES)
+)
 @pytest.mark.parametrize("mnk_factors", MNK_FACTORS)
 @pytest.mark.parametrize("act_order", ACT_ORDER_OPTS)
 @pytest.mark.parametrize("is_k_full", K_FULL_OPTS)
 @pytest.mark.parametrize("use_atomic_add", USE_ATOMIC_ADD_OPTS)
 @pytest.mark.parametrize("use_fp32_reduce", USE_FP32_REDUCE_OPTS)
 @pytest.mark.parametrize("dtype", DTYPES)
-def test_gptq_marlin_gemm(k_chunk, n_chunk, quant_type, group_size,
-                          mnk_factors, act_order, is_k_full, use_atomic_add,
-                          use_fp32_reduce, dtype):
+def test_gptq_marlin_gemm(
+    k_chunk,
+    n_chunk,
+    quant_type,
+    group_size,
+    mnk_factors,
+    act_order,
+    is_k_full,
+    use_atomic_add,
+    use_fp32_reduce,
+    dtype,
+):
     m_factor, n_factor, k_factor = mnk_factors
     has_zp = quant_type in [scalar_types.uint4, scalar_types.uint8]
 
@@ -225,11 +265,13 @@ def test_gptq_marlin_gemm(k_chunk, n_chunk, quant_type, group_size,
             return
 
         if group_size == 16:
-            w_ref, marlin_q_w, marlin_s, marlin_s2 = \
-                rand_marlin_weight_nvfp4_like(b_weight.T, group_size)
+            w_ref, marlin_q_w, marlin_s, marlin_s2 = rand_marlin_weight_nvfp4_like(
+                b_weight.T, group_size
+            )
         else:
-            w_ref, marlin_q_w, marlin_s = \
-                rand_marlin_weight_mxfp4_like(b_weight.T, group_size)
+            w_ref, marlin_q_w, marlin_s = rand_marlin_weight_mxfp4_like(
+                b_weight.T, group_size
+            )
             marlin_s2 = None
 
         g_idx = None
@@ -240,8 +282,7 @@ def test_gptq_marlin_gemm(k_chunk, n_chunk, quant_type, group_size,
             return
         if act_order:
             return
-        w_ref, marlin_q_w, marlin_s = marlin_quant_fp8_torch(
-            b_weight.T, group_size)
+        w_ref, marlin_q_w, marlin_s = marlin_quant_fp8_torch(b_weight.T, group_size)
         g_idx = None
         sort_indices = None
         marlin_zp = None
@@ -250,7 +291,8 @@ def test_gptq_marlin_gemm(k_chunk, n_chunk, quant_type, group_size,
         if group_size == 16:
             return
         w_ref, marlin_q_w, marlin_s, marlin_zp = awq_marlin_quantize(
-            b_weight, quant_type, group_size)
+            b_weight, quant_type, group_size
+        )
         g_idx = None
         sort_indices = None
         marlin_s2 = None
@@ -258,18 +300,37 @@ def test_gptq_marlin_gemm(k_chunk, n_chunk, quant_type, group_size,
         if group_size == 16:
             return
         w_ref, marlin_q_w, marlin_s, g_idx, sort_indices, _ = marlin_quantize(
-            b_weight, quant_type, group_size, act_order)
+            b_weight, quant_type, group_size, act_order
+        )
         marlin_zp = None
         marlin_s2 = None
 
     workspace = marlin_make_workspace_new(w_ref.device)
 
-    opcheck(torch.ops._C.gptq_marlin_gemm,
-            (a_input, None, marlin_q_w, None, marlin_s, marlin_s2, marlin_zp,
-             g_idx, sort_indices, workspace, quant_type.id, a_input.shape[0],
-             b_weight.shape[1], a_input.shape[1], is_k_full, use_atomic_add,
-             use_fp32_reduce, False),
-            test_utils=DEFAULT_OPCHECK_TEST_UTILS)
+    opcheck(
+        torch.ops._C.gptq_marlin_gemm,
+        (
+            a_input,
+            None,
+            marlin_q_w,
+            None,
+            marlin_s,
+            marlin_s2,
+            marlin_zp,
+            g_idx,
+            sort_indices,
+            workspace,
+            quant_type.id,
+            a_input.shape[0],
+            b_weight.shape[1],
+            a_input.shape[1],
+            is_k_full,
+            use_atomic_add,
+            use_fp32_reduce,
+            False,
+        ),
+        test_utils=DEFAULT_OPCHECK_TEST_UTILS,
+    )
 
     output = ops.gptq_marlin_gemm(
         a_input,
@@ -302,23 +363,40 @@ def test_gptq_marlin_gemm(k_chunk, n_chunk, quant_type, group_size,
 
 # TODO: find better way to test this?
 @torch.compile(fullgraph=True)
-def marlin_24_gemm_tester(a_input, marlin_24_q_w_comp, marlin_24_meta,
-                          marlin_24_s, scratch, quant_type, size_m, size_n,
-                          size_k):
-    return ops.gptq_marlin_24_gemm(a_input, marlin_24_q_w_comp, marlin_24_meta,
-                                   marlin_24_s, scratch, quant_type, size_m,
-                                   size_n, size_k)
+def marlin_24_gemm_tester(
+    a_input,
+    marlin_24_q_w_comp,
+    marlin_24_meta,
+    marlin_24_s,
+    scratch,
+    quant_type,
+    size_m,
+    size_n,
+    size_k,
+):
+    return ops.gptq_marlin_24_gemm(
+        a_input,
+        marlin_24_q_w_comp,
+        marlin_24_meta,
+        marlin_24_s,
+        scratch,
+        quant_type,
+        size_m,
+        size_n,
+        size_k,
+    )
 
 
-@pytest.mark.skipif(not is_quant_method_supported("gptq_marlin"),
-                    reason="Marlin is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("gptq_marlin"),
+    reason="Marlin is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("k_chunk", MARLIN_24_K_CHUNKS)
 @pytest.mark.parametrize("n_chunk", MARLIN_24_N_CHUNKS)
 @pytest.mark.parametrize("quant_type", GPTQ_MARLIN_24_SUPPORTED_QUANT_TYPES)
 @pytest.mark.parametrize("group_size", GPTQ_MARLIN_24_SUPPORTED_GROUP_SIZES)
 @pytest.mark.parametrize("mnk_factors", MNK_FACTORS)
-def test_gptq_marlin_24_gemm(k_chunk, n_chunk, quant_type, group_size,
-                             mnk_factors):
+def test_gptq_marlin_24_gemm(k_chunk, n_chunk, quant_type, group_size, mnk_factors):
     m_factor, n_factor, k_factor = mnk_factors
 
     size_m = m_factor
@@ -328,19 +406,31 @@ def test_gptq_marlin_24_gemm(k_chunk, n_chunk, quant_type, group_size,
     a_input = rand_data((size_m, size_k))
     b_weight = rand_data((size_k, size_n))
 
-    (w_24_ref, marlin_24_q_w_comp, marlin_24_meta,
-     marlin_24_s) = marlin_24_quantize(b_weight, quant_type, group_size)
+    (w_24_ref, marlin_24_q_w_comp, marlin_24_meta, marlin_24_s) = marlin_24_quantize(
+        b_weight, quant_type, group_size
+    )
 
-    workspace_24 = MarlinWorkspace(size_n, GPTQ_MARLIN_24_MIN_THREAD_N,
-                                   GPTQ_MARLIN_24_MAX_PARALLEL)
+    workspace_24 = MarlinWorkspace(
+        size_n, GPTQ_MARLIN_24_MIN_THREAD_N, GPTQ_MARLIN_24_MAX_PARALLEL
+    )
 
     output_ref = torch.matmul(a_input, w_24_ref)
 
-    opcheck(torch.ops._C.gptq_marlin_24_gemm,
-            (a_input, marlin_24_q_w_comp, marlin_24_meta, marlin_24_s,
-             workspace_24.scratch, quant_type.id, a_input.shape[0],
-             b_weight.shape[1], a_input.shape[1]),
-            test_utils=DEFAULT_OPCHECK_TEST_UTILS)
+    opcheck(
+        torch.ops._C.gptq_marlin_24_gemm,
+        (
+            a_input,
+            marlin_24_q_w_comp,
+            marlin_24_meta,
+            marlin_24_s,
+            workspace_24.scratch,
+            quant_type.id,
+            a_input.shape[0],
+            b_weight.shape[1],
+            a_input.shape[1],
+        ),
+        test_utils=DEFAULT_OPCHECK_TEST_UTILS,
+    )
 
     output = marlin_24_gemm_tester(
         a_input,
@@ -361,8 +451,10 @@ def test_gptq_marlin_24_gemm(k_chunk, n_chunk, quant_type, group_size,
     assert max_diff < 0.04
 
 
-@pytest.mark.skipif(not is_quant_method_supported("gptq_marlin"),
-                    reason="Marlin is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("gptq_marlin"),
+    reason="Marlin is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("k_chunk", MARLIN_K_CHUNKS)
 @pytest.mark.parametrize("n_chunk", MARLIN_N_CHUNKS)
 @pytest.mark.parametrize("group_size", HQQ_SUPPORTED_GROUP_SIZES)
@@ -386,22 +478,22 @@ def test_hqq_marlin_gemm(
     a_input = rand_data((size_m, size_k))
     dev = a_input.device
 
-    b_weight = torch.randint(0,
-                             10, (size_n, size_k),
-                             dtype=torch.uint8,
-                             device=dev)
+    b_weight = torch.randint(0, 10, (size_n, size_k), dtype=torch.uint8, device=dev)
     scale = rand_data((size_n, size_k // group_size))
     zero = rand_data((size_n, size_k // group_size))
 
     gptq_w_q = gptq_pack(b_weight.transpose(1, 0), 4, size_k, size_n)
 
     sort_indices = torch.empty(0, dtype=torch.int, device=dev)
-    marlin_w_q = ops.gptq_marlin_repack(gptq_w_q, sort_indices, size_k, size_n,
-                                        4).to(dev)
-    marlin_s = marlin_permute_scales(scale.transpose(1, 0), size_k, size_n,
-                                     group_size).to(dev)
-    marlin_zp = marlin_permute_scales(zero.transpose(1, 0), size_k, size_n,
-                                      group_size).to(dev)
+    marlin_w_q = ops.gptq_marlin_repack(gptq_w_q, sort_indices, size_k, size_n, 4).to(
+        dev
+    )
+    marlin_s = marlin_permute_scales(
+        scale.transpose(1, 0), size_k, size_n, group_size
+    ).to(dev)
+    marlin_zp = marlin_permute_scales(
+        zero.transpose(1, 0), size_k, size_n, group_size
+    ).to(dev)
 
     g_idx = marlin_make_empty_g_idx(dev)
     g_idx_sort_indices = marlin_make_empty_g_idx(dev)
@@ -433,8 +525,7 @@ def test_hqq_marlin_gemm(
     s_flat = scale.reshape(-1, 1)
     dequant = (b_flat - zp_flat) * s_flat
 
-    output_ref = torch.matmul(a_input,
-                              dequant.reshape(b_weight.shape).transpose(1, 0))
+    output_ref = torch.matmul(a_input, dequant.reshape(b_weight.shape).transpose(1, 0))
 
     torch.cuda.synchronize()
 
@@ -451,11 +542,12 @@ def test_marlin_gemm_subset_input():
     big_m = size_m * 2
     big_k = size_k * 2
 
-    a_input = rand_data((big_m, big_k))[8:size_m + 8, 8:size_k + 8]
+    a_input = rand_data((big_m, big_k))[8 : size_m + 8, 8 : size_k + 8]
     b_weight = rand_data((size_k, size_n))
 
     w_ref, marlin_q_w, marlin_s, g_idx, sort_indices, _ = marlin_quantize(
-        b_weight, quant_type, group_size, False)
+        b_weight, quant_type, group_size, False
+    )
 
     marlin_zp = marlin_make_empty_g_idx(marlin_s.device)
     workspace = marlin_make_workspace_new(a_input.device)
@@ -497,12 +589,13 @@ def test_marlin_gemm_with_bias(size_m):
     size_k, size_n = 1024, 2048
     a_input = rand_data((size_m, size_k))
     b_weight = rand_data((size_k, size_n))
-    b_bias = rand_data((size_n, )) * 10
+    b_bias = rand_data((size_n,)) * 10
 
     marlin_bias = marlin_permute_bias(b_bias)
 
     w_ref, marlin_q_w, marlin_s, g_idx, sort_indices, _ = marlin_quantize(
-        b_weight, quant_type, group_size, False)
+        b_weight, quant_type, group_size, False
+    )
 
     marlin_zp = marlin_make_empty_g_idx(marlin_s.device)
     workspace = marlin_make_workspace_new(a_input.device)
diff --git a/tests/kernels/quantization/test_nvfp4_quant.py b/tests/kernels/quantization/test_nvfp4_quant.py
index 3a8f4c17598c..e9b091d06697 100644
--- a/tests/kernels/quantization/test_nvfp4_quant.py
+++ b/tests/kernels/quantization/test_nvfp4_quant.py
@@ -8,15 +8,27 @@
 from vllm.scalar_type import scalar_types
 
 if not current_platform.has_device_capability(100):
-    pytest.skip(reason="Nvfp4 Requires compute capability of 10 or above.",
-                allow_module_level=True)
+    pytest.skip(
+        reason="Nvfp4 Requires compute capability of 10 or above.",
+        allow_module_level=True,
+    )
 
 DTYPES = [torch.float16, torch.bfloat16]
 SHAPES = [(128, 64), (128, 128), (256, 64), (256, 128)]
-PAD_SHAPES = [(90, 64), (150, 64), (128, 48), (128, 80), (150, 80), (90, 48),
-              (90, 128), (150, 128), (150, 48), (90, 80)]
+PAD_SHAPES = [
+    (90, 64),
+    (150, 64),
+    (128, 48),
+    (128, 80),
+    (150, 80),
+    (90, 48),
+    (90, 128),
+    (150, 128),
+    (150, 48),
+    (90, 80),
+]
 SEEDS = [42]
-CUDA_DEVICES = ['cuda:0']
+CUDA_DEVICES = ["cuda:0"]
 
 FLOAT4_E2M1_MAX = scalar_types.float4_e2m1f.max()
 FLOAT8_E4M3_MAX = torch.finfo(torch.float8_e4m3fn).max
@@ -31,7 +43,22 @@
 # 0001 -> 0.5
 # 0000 -> 0
 E2M1_TO_FLOAT32 = [
-    0., 0.5, 1., 1.5, 2., 3., 4., 6., 0., -0.5, -1., -1.5, -2., -3., -4., -6.
+    0.0,
+    0.5,
+    1.0,
+    1.5,
+    2.0,
+    3.0,
+    4.0,
+    6.0,
+    0.0,
+    -0.5,
+    -1.0,
+    -1.5,
+    -2.0,
+    -3.0,
+    -4.0,
+    -6.0,
 ]
 BLOCK_SIZE = 16
 
@@ -74,8 +101,7 @@ def ref_nvfp4_quant(x, global_scale):
     assert x.ndim == 2
     m, n = x.shape
     x = torch.reshape(x, (m, n // BLOCK_SIZE, BLOCK_SIZE))
-    vec_max = torch.max(torch.abs(x), dim=-1,
-                        keepdim=True)[0].to(torch.float32)
+    vec_max = torch.max(torch.abs(x), dim=-1, keepdim=True)[0].to(torch.float32)
     scale = global_scale * (vec_max * get_reciprocal(FLOAT4_E2M1_MAX))
     scale = scale.to(torch.float8_e4m3fn).to(torch.float32)
     output_scale = get_reciprocal(scale * get_reciprocal(global_scale))
@@ -131,7 +157,7 @@ def test_quantize_to_fp4(
 def test_quantize_to_fp4_padded(pad_shape: tuple[int, int]) -> None:
     dtype = torch.float16
     current_platform.seed_everything(42)
-    torch.set_default_device('cuda:0')
+    torch.set_default_device("cuda:0")
 
     m, n = pad_shape
 
diff --git a/tests/kernels/quantization/test_nvfp4_scaled_mm.py b/tests/kernels/quantization/test_nvfp4_scaled_mm.py
index 67e041f2b71c..434564737c88 100644
--- a/tests/kernels/quantization/test_nvfp4_scaled_mm.py
+++ b/tests/kernels/quantization/test_nvfp4_scaled_mm.py
@@ -2,15 +2,16 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 import pytest
 import torch
-from nvfp4_utils import (FLOAT4_E2M1_MAX, FLOAT8_E4M3_MAX,
-                         dequantize_nvfp4_to_dtype)
+from nvfp4_utils import FLOAT4_E2M1_MAX, FLOAT8_E4M3_MAX, dequantize_nvfp4_to_dtype
 
 from vllm import _custom_ops as ops
 from vllm.platforms import current_platform
 
 if not current_platform.has_device_capability(100):
-    pytest.skip(reason="Nvfp4 Requires compute capability of 10 or above.",
-                allow_module_level=True)
+    pytest.skip(
+        reason="Nvfp4 Requires compute capability of 10 or above.",
+        allow_module_level=True,
+    )
 
 DTYPES = [torch.float16, torch.bfloat16]
 # m, n, k
@@ -19,26 +20,31 @@
 SHAPES.extend(PAD_SHAPES)
 
 SEEDS = [42]
-CUDA_DEVICES = ['cuda:0']
+CUDA_DEVICES = ["cuda:0"]
 
 
-def get_ref_results(a_fp4, b_fp4, a_sf, b_sf, a_global_scale, b_global_scale,
-                    m, n, dtype, block_size, device):
+def get_ref_results(
+    a_fp4,
+    b_fp4,
+    a_sf,
+    b_sf,
+    a_global_scale,
+    b_global_scale,
+    m,
+    n,
+    dtype,
+    block_size,
+    device,
+):
     _, m_k = a_fp4.shape
     _, n_k = b_fp4.shape
-    assert (m_k == n_k)
-    a_in_dtype = dequantize_nvfp4_to_dtype(a_fp4,
-                                           a_sf,
-                                           a_global_scale,
-                                           dtype=dtype,
-                                           device=device,
-                                           block_size=block_size)
-    b_in_dtype = dequantize_nvfp4_to_dtype(b_fp4,
-                                           b_sf,
-                                           b_global_scale,
-                                           dtype=dtype,
-                                           device=device,
-                                           block_size=block_size)
+    assert m_k == n_k
+    a_in_dtype = dequantize_nvfp4_to_dtype(
+        a_fp4, a_sf, a_global_scale, dtype=dtype, device=device, block_size=block_size
+    )
+    b_in_dtype = dequantize_nvfp4_to_dtype(
+        b_fp4, b_sf, b_global_scale, dtype=dtype, device=device, block_size=block_size
+    )
     return torch.matmul(a_in_dtype, b_in_dtype.t())
 
 
@@ -60,25 +66,34 @@ def test_nvfp4_gemm(
     a_dtype = torch.randn((m, k), dtype=dtype, device=device)
     b_dtype = torch.randn((n, k), dtype=dtype, device=device)
 
-    a_global_scale = ((FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) /
-                      torch.amax(a_dtype.flatten(), dim=-1)).to(torch.float32)
-    b_global_scale = ((FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) /
-                      torch.amax(b_dtype.flatten(), dim=-1)).to(torch.float32)
-    alpha = 1. / (a_global_scale * b_global_scale)
+    a_global_scale = (
+        (FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) / torch.amax(a_dtype.flatten(), dim=-1)
+    ).to(torch.float32)
+    b_global_scale = (
+        (FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) / torch.amax(b_dtype.flatten(), dim=-1)
+    ).to(torch.float32)
+    alpha = 1.0 / (a_global_scale * b_global_scale)
     # ops.scaled_fp4_quant returns swizzled scales, while weights
     # from checkpoints are in linear scales.
     a_fp4, a_scale_interleaved = ops.scaled_fp4_quant(a_dtype, a_global_scale)
     b_fp4, b_scale_interleaved = ops.scaled_fp4_quant(b_dtype, b_global_scale)
 
     # get_ref_results unswizzles the scales internally.
-    expected_out = get_ref_results(a_fp4, b_fp4, a_scale_interleaved,
-                                   b_scale_interleaved, a_global_scale,
-                                   b_global_scale, m, n, dtype, block_size,
-                                   device)
-    out = ops.cutlass_scaled_fp4_mm(a_fp4, b_fp4, a_scale_interleaved,
-                                    b_scale_interleaved, alpha, dtype)
+    expected_out = get_ref_results(
+        a_fp4,
+        b_fp4,
+        a_scale_interleaved,
+        b_scale_interleaved,
+        a_global_scale,
+        b_global_scale,
+        m,
+        n,
+        dtype,
+        block_size,
+        device,
+    )
+    out = ops.cutlass_scaled_fp4_mm(
+        a_fp4, b_fp4, a_scale_interleaved, b_scale_interleaved, alpha, dtype
+    )
 
-    torch.testing.assert_close(out,
-                               expected_out.to(dtype=dtype),
-                               atol=1e-1,
-                               rtol=1e-1)
+    torch.testing.assert_close(out, expected_out.to(dtype=dtype), atol=1e-1, rtol=1e-1)
diff --git a/tests/kernels/quantization/test_per_token_group_quant.py b/tests/kernels/quantization/test_per_token_group_quant.py
index 07f17d1efe64..7a6500454530 100644
--- a/tests/kernels/quantization/test_per_token_group_quant.py
+++ b/tests/kernels/quantization/test_per_token_group_quant.py
@@ -13,15 +13,15 @@
 @pytest.mark.parametrize("scale_ue8m0", [False, True])
 @pytest.mark.parametrize("group_size", [64, 128])
 @pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
-def test_per_token_group_quant_fp8(shape, column_major: bool,
-                                   scale_ue8m0: bool, group_size: int):
+def test_per_token_group_quant_fp8(
+    shape, column_major: bool, scale_ue8m0: bool, group_size: int
+):
     device = "cuda"
 
     torch.manual_seed(42)
     num_tokens, hidden_dim = shape
 
-    x = (torch.randn(
-        (num_tokens, hidden_dim), device=device, dtype=torch.bfloat16) * 8)
+    x = torch.randn((num_tokens, hidden_dim), device=device, dtype=torch.bfloat16) * 8
 
     # cuda path
     out_q, scale = fp8_utils.per_token_group_quant_fp8(
@@ -53,8 +53,7 @@ def test_per_token_group_quant_int8(shape, group_size: int):
     torch.manual_seed(42)
     num_tokens, hidden_dim = shape
 
-    x = (torch.randn(
-        (num_tokens, hidden_dim), device=device, dtype=torch.bfloat16) * 8)
+    x = torch.randn((num_tokens, hidden_dim), device=device, dtype=torch.bfloat16) * 8
 
     # cuda path
     out_q, scale = int8_utils.per_token_group_quant_int8(
diff --git a/tests/kernels/quantization/test_rocm_skinny_gemms.py b/tests/kernels/quantization/test_rocm_skinny_gemms.py
index 6de5fc9c5601..dc6557b93f05 100644
--- a/tests/kernels/quantization/test_rocm_skinny_gemms.py
+++ b/tests/kernels/quantization/test_rocm_skinny_gemms.py
@@ -63,12 +63,11 @@
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("rows_per_block", [2, 4, 8, 16])
 @pytest.mark.parametrize("seed", SEEDS)
-@pytest.mark.skipif(not current_platform.is_rocm(),
-                    reason="only test for rocm")
+@pytest.mark.skipif(not current_platform.is_rocm(), reason="only test for rocm")
 @torch.inference_mode()
 def test_rocm_llmm1_kernel(n, k, m, dtype, rows_per_block, seed):
     torch.manual_seed(seed)
-    #TODO: Zero-centering the inputs causes errors for LLMM1!
+    # TODO: Zero-centering the inputs causes errors for LLMM1!
     #      Without that the numbers quickly saturate, and may
     #      be giving false matches.
     A = torch.rand(n, k, dtype=dtype, device="cuda")
@@ -83,14 +82,13 @@ def test_rocm_llmm1_kernel(n, k, m, dtype, rows_per_block, seed):
 @pytest.mark.parametrize("n,k,m", NKM_FACTORS_WVSPLITK)
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("seed", SEEDS)
-@pytest.mark.skipif(not current_platform.is_rocm(),
-                    reason="only test for rocm")
+@pytest.mark.skipif(not current_platform.is_rocm(), reason="only test for rocm")
 def test_rocm_wvsplitk_kernel(n, k, m, dtype, seed):
     torch.manual_seed(seed)
     cu_count = current_platform.get_cu_count()
 
-    A = torch.rand(n, k, dtype=dtype, device="cuda") - .5
-    B = torch.rand(m, k, dtype=dtype, device="cuda") - .5
+    A = torch.rand(n, k, dtype=dtype, device="cuda") - 0.5
+    B = torch.rand(m, k, dtype=dtype, device="cuda") - 0.5
 
     ref_out = torch.nn.functional.linear(A, B)
     out = ops.wvSplitK(B, A.view(-1, A.size(-1)), cu_count)
@@ -101,16 +99,15 @@ def test_rocm_wvsplitk_kernel(n, k, m, dtype, seed):
 @pytest.mark.parametrize("n,k,m", NKM_FACTORS_WVSPLITK)
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("seed", SEEDS)
-@pytest.mark.skipif(not current_platform.is_rocm(),
-                    reason="only test for rocm")
+@pytest.mark.skipif(not current_platform.is_rocm(), reason="only test for rocm")
 def test_rocm_wvsplitk_bias1D_kernel(n, k, m, dtype, seed):
     torch.manual_seed(seed)
     cu_count = current_platform.get_cu_count()
 
     xavier = math.sqrt(2 / k)  # normalize to avoid large output-bias deltas
-    A = (torch.rand(n, k, dtype=dtype, device="cuda") - .5) * xavier
-    B = (torch.rand(m, k, dtype=dtype, device="cuda") - .5) * xavier
-    BIAS = torch.rand(m, dtype=dtype, device="cuda") - .5
+    A = (torch.rand(n, k, dtype=dtype, device="cuda") - 0.5) * xavier
+    B = (torch.rand(m, k, dtype=dtype, device="cuda") - 0.5) * xavier
+    BIAS = torch.rand(m, dtype=dtype, device="cuda") - 0.5
 
     ref_out = torch.nn.functional.linear(A, B, BIAS)
     out = ops.wvSplitK(B, A.view(-1, A.size(-1)), cu_count, BIAS)
@@ -121,16 +118,15 @@ def test_rocm_wvsplitk_bias1D_kernel(n, k, m, dtype, seed):
 @pytest.mark.parametrize("n,k,m", NKM_FACTORS_WVSPLITK)
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("seed", SEEDS)
-@pytest.mark.skipif(not current_platform.is_rocm(),
-                    reason="only test for rocm")
+@pytest.mark.skipif(not current_platform.is_rocm(), reason="only test for rocm")
 def test_rocm_wvsplitk_bias2D_kernel(n, k, m, dtype, seed):
     torch.manual_seed(seed)
     cu_count = current_platform.get_cu_count()
 
     xavier = math.sqrt(2 / k)  # normalize to avoid large output-bias deltas
-    A = (torch.rand(n, k, dtype=dtype, device="cuda") - .5) * xavier
-    B = (torch.rand(m, k, dtype=dtype, device="cuda") - .5) * xavier
-    BIAS = torch.rand(n, m, dtype=dtype, device="cuda") - .5
+    A = (torch.rand(n, k, dtype=dtype, device="cuda") - 0.5) * xavier
+    B = (torch.rand(m, k, dtype=dtype, device="cuda") - 0.5) * xavier
+    BIAS = torch.rand(n, m, dtype=dtype, device="cuda") - 0.5
 
     ref_out = torch.nn.functional.linear(A, B, BIAS)
     out = ops.wvSplitK(B, A.view(-1, A.size(-1)), cu_count, BIAS)
@@ -143,7 +139,8 @@ def test_rocm_wvsplitk_bias2D_kernel(n, k, m, dtype, seed):
 @pytest.mark.parametrize("seed", SEEDS)
 @pytest.mark.skipif(
     not (current_platform.is_rocm() and current_platform.supports_fp8()),
-    reason="only test for rocm fp8")
+    reason="only test for rocm fp8",
+)
 def test_rocm_wvsplitk_fp8_kernel(n, k, m, dtype, seed):
     torch.manual_seed(seed)
 
@@ -153,13 +150,10 @@ def test_rocm_wvsplitk_fp8_kernel(n, k, m, dtype, seed):
     A, scale_a = ref_dynamic_per_tensor_fp8_quant(A)
     B, scale_b = ref_dynamic_per_tensor_fp8_quant(B)
 
-    ref_out = torch._scaled_mm(A,
-                               B.t(),
-                               out_dtype=dtype,
-                               scale_a=scale_a,
-                               scale_b=scale_b)
-    out = ops.wvSplitKQ(B, A, dtype, scale_a, scale_b,
-                        current_platform.get_cu_count())
+    ref_out = torch._scaled_mm(
+        A, B.t(), out_dtype=dtype, scale_a=scale_a, scale_b=scale_b
+    )
+    out = ops.wvSplitKQ(B, A, dtype, scale_a, scale_b, current_platform.get_cu_count())
 
     assert torch.allclose(out, ref_out, rtol=0.01)
 
@@ -169,25 +163,24 @@ def test_rocm_wvsplitk_fp8_kernel(n, k, m, dtype, seed):
 @pytest.mark.parametrize("seed", SEEDS)
 @pytest.mark.skipif(
     not (current_platform.is_rocm() and current_platform.supports_fp8()),
-    reason="only test for rocm fp8")
+    reason="only test for rocm fp8",
+)
 def test_rocm_wvsplitk_fp8_bias1D_kernel(n, k, m, dtype, seed):
     torch.manual_seed(seed)
 
     xavier = math.sqrt(2 / k)  # normalize to avoid large output-bias deltas
-    A = (torch.rand(n, k, device="cuda") - .5) * xavier
-    B = (torch.rand(m, k, device="cuda") - .5) * xavier
-    BIAS = torch.rand(m, dtype=dtype, device="cuda") - .5
+    A = (torch.rand(n, k, device="cuda") - 0.5) * xavier
+    B = (torch.rand(m, k, device="cuda") - 0.5) * xavier
+    BIAS = torch.rand(m, dtype=dtype, device="cuda") - 0.5
 
     A, scale_a = ref_dynamic_per_tensor_fp8_quant(A)
     B, scale_b = ref_dynamic_per_tensor_fp8_quant(B)
 
-    ref_out = torch._scaled_mm(A,
-                               B.t(),
-                               out_dtype=dtype,
-                               scale_a=scale_a,
-                               scale_b=scale_b,
-                               bias=BIAS)
-    out = ops.wvSplitKQ(B, A, dtype, scale_a, scale_b,
-                        current_platform.get_cu_count(), BIAS)
+    ref_out = torch._scaled_mm(
+        A, B.t(), out_dtype=dtype, scale_a=scale_a, scale_b=scale_b, bias=BIAS
+    )
+    out = ops.wvSplitKQ(
+        B, A, dtype, scale_a, scale_b, current_platform.get_cu_count(), BIAS
+    )
 
     assert torch.allclose(out, ref_out, rtol=0.01)
diff --git a/tests/kernels/quantization/test_silu_mul_nvfp4_quant.py b/tests/kernels/quantization/test_silu_mul_nvfp4_quant.py
index a40d0c4ef122..4617464a3978 100644
--- a/tests/kernels/quantization/test_silu_mul_nvfp4_quant.py
+++ b/tests/kernels/quantization/test_silu_mul_nvfp4_quant.py
@@ -3,16 +3,20 @@
 import pytest
 import torch
 
-from tests.kernels.quantization.nvfp4_utils import (FLOAT4_E2M1_MAX,
-                                                    FLOAT8_E4M3_MAX,
-                                                    dequantize_nvfp4_to_dtype)
+from tests.kernels.quantization.nvfp4_utils import (
+    FLOAT4_E2M1_MAX,
+    FLOAT8_E4M3_MAX,
+    dequantize_nvfp4_to_dtype,
+)
 from vllm._custom_ops import scaled_fp4_quant
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.platforms import current_platform
 
 if not current_platform.has_device_capability(100):
-    pytest.skip(reason="Nvfp4 Requires compute capability of 10 or above.",
-                allow_module_level=True)
+    pytest.skip(
+        reason="Nvfp4 Requires compute capability of 10 or above.",
+        allow_module_level=True,
+    )
 
 FP4_DTYPE = torch.uint8
 FP8_DTYPE = current_platform.fp8_dtype()
@@ -30,24 +34,24 @@ def test_silu_mul_nvfp4_quant(
     shape: tuple[int, int],
 ) -> None:
     current_platform.seed_everything(42)
-    device = 'cuda:0'
+    device = "cuda:0"
     torch.set_default_device(device)
 
     x = torch.randn(shape, dtype=dtype)
 
     # ref op
     ref_output = SiluAndMul().forward_native(x)
-    ref_global_scale = ((FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) /
-                        torch.abs(ref_output).max().to(torch.float32))
-    ref_output_quant, ref_block_scale = scaled_fp4_quant(
-        ref_output, ref_global_scale)
+    ref_global_scale = (FLOAT8_E4M3_MAX * FLOAT4_E2M1_MAX) / torch.abs(
+        ref_output
+    ).max().to(torch.float32)
+    ref_output_quant, ref_block_scale = scaled_fp4_quant(ref_output, ref_global_scale)
 
     # fused op
     fused_output_quant = torch.empty_like(ref_output_quant)
     fused_block_scale = torch.empty_like(ref_block_scale)
-    torch.ops._C.silu_and_mul_nvfp4_quant(fused_output_quant,
-                                          fused_block_scale, x,
-                                          ref_global_scale)
+    torch.ops._C.silu_and_mul_nvfp4_quant(
+        fused_output_quant, fused_block_scale, x, ref_global_scale
+    )
 
     # check dtype
     assert ref_output_quant.dtype == FP4_DTYPE
@@ -59,17 +63,14 @@ def test_silu_mul_nvfp4_quant(
     assert ref_block_scale.shape == fused_block_scale.shape
 
     # check dequantized output
-    ref_output_dequant = dequantize_nvfp4_to_dtype(ref_output_quant,
-                                                   ref_block_scale,
-                                                   ref_global_scale, dtype,
-                                                   device)
-    fused_output_dequant = dequantize_nvfp4_to_dtype(fused_output_quant,
-                                                     fused_block_scale,
-                                                     ref_global_scale, dtype,
-                                                     device)
+    ref_output_dequant = dequantize_nvfp4_to_dtype(
+        ref_output_quant, ref_block_scale, ref_global_scale, dtype, device
+    )
+    fused_output_dequant = dequantize_nvfp4_to_dtype(
+        fused_output_quant, fused_block_scale, ref_global_scale, dtype, device
+    )
 
     atol, rtol = 3e-1, 3e-1
-    torch.testing.assert_close(ref_output_dequant,
-                               fused_output_dequant,
-                               atol=atol,
-                               rtol=rtol)
+    torch.testing.assert_close(
+        ref_output_dequant, fused_output_dequant, atol=atol, rtol=rtol
+    )
diff --git a/tests/kernels/quantization/test_triton_scaled_mm.py b/tests/kernels/quantization/test_triton_scaled_mm.py
index d8cfb5710dba..1026332d99f8 100644
--- a/tests/kernels/quantization/test_triton_scaled_mm.py
+++ b/tests/kernels/quantization/test_triton_scaled_mm.py
@@ -4,6 +4,7 @@
 
 Run `pytest tests/kernels/quantization/test_triton_scaled_mm.py`.
 """
+
 import importlib
 from typing import Optional
 
@@ -15,17 +16,19 @@
 device = "cuda"
 
 triton_scaled_mm_module = importlib.import_module(
-    "vllm.model_executor.layers.quantization.compressed_tensors."
-    "triton_scaled_mm")
+    "vllm.model_executor.layers.quantization.compressed_tensors.triton_scaled_mm"
+)
 triton_scaled_mm = triton_scaled_mm_module.triton_scaled_mm
 
 
-def torch_scaled_mm(a: torch.Tensor,
-                    b: torch.Tensor,
-                    scale_a: torch.Tensor,
-                    scale_b: torch.Tensor,
-                    out_dtype: type[torch.dtype],
-                    bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+def torch_scaled_mm(
+    a: torch.Tensor,
+    b: torch.Tensor,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    out_dtype: type[torch.dtype],
+    bias: Optional[torch.Tensor] = None,
+) -> torch.Tensor:
     out = torch.mm(a.to(torch.float32), b.to(torch.float32))
     out = scale_a * out
     out = scale_b.T * out
@@ -44,20 +47,22 @@ def get_8bit_types():
 
 
 # This test is to check regressions for int8 support on ROCm.
-@pytest.mark.parametrize("model_path", [
-    "neuralmagic/Llama-3.2-1B-quantized.w8a8",
-])
+@pytest.mark.parametrize(
+    "model_path",
+    [
+        "neuralmagic/Llama-3.2-1B-quantized.w8a8",
+    ],
+)
 @pytest.mark.parametrize("max_tokens", [32])
 @pytest.mark.parametrize("num_logprobs", [10])
-@pytest.mark.skipif(not current_platform.is_rocm(),
-                    reason="Should only run on ROCm")
-def test_rocm_compressed_tensors_w8a8(vllm_runner, example_prompts, model_path,
-                                      max_tokens, num_logprobs):
+@pytest.mark.skipif(not current_platform.is_rocm(), reason="Should only run on ROCm")
+def test_rocm_compressed_tensors_w8a8(
+    vllm_runner, example_prompts, model_path, max_tokens, num_logprobs
+):
     dtype = "bfloat16"
 
     with vllm_runner(model_path, dtype=dtype) as vllm_model:
-        vllm_model.generate_greedy_logprobs(example_prompts, max_tokens,
-                                            num_logprobs)
+        vllm_model.generate_greedy_logprobs(example_prompts, max_tokens, num_logprobs)
 
 
 MNK_FACTORS = [
@@ -76,10 +81,10 @@ def test_rocm_compressed_tensors_w8a8(vllm_runner, example_prompts, model_path,
 @pytest.mark.parametrize("use_scalar_scale_a", [True, False])
 @pytest.mark.parametrize("use_scalar_scale_b", [True, False])
 @pytest.mark.parametrize("use_bias", [True, False])
-def test_scaled_mm(M, N, K, in_dtype, out_dtype, use_scalar_scale_a,
-                   use_scalar_scale_b, use_bias):
-    is_floating_point_type = lambda t: torch.tensor([1, 1], dtype=t
-                                                    ).is_floating_point()
+def test_scaled_mm(
+    M, N, K, in_dtype, out_dtype, use_scalar_scale_a, use_scalar_scale_b, use_bias
+):
+    is_floating_point_type = lambda t: torch.tensor([1, 1], dtype=t).is_floating_point()
 
     current_platform.seed_everything(0)
 
@@ -93,10 +98,8 @@ def test_scaled_mm(M, N, K, in_dtype, out_dtype, use_scalar_scale_a,
     #
     # So, the values here are kept small enough to avoid this situation.
     if is_floating_point_type(in_dtype):
-        a = (0.25 * torch.rand(
-            (M, K), dtype=torch.float32, device=device)).to(in_dtype)
-        b = (0.25 * torch.rand(
-            (K, N), dtype=torch.float32, device=device)).to(in_dtype)
+        a = (0.25 * torch.rand((M, K), dtype=torch.float32, device=device)).to(in_dtype)
+        b = (0.25 * torch.rand((K, N), dtype=torch.float32, device=device)).to(in_dtype)
     else:
         a = torch.randint(-32, 32, (M, K), dtype=in_dtype, device=device)
         b = torch.randint(-32, 32, (K, N), dtype=in_dtype, device=device)
@@ -113,7 +116,7 @@ def test_scaled_mm(M, N, K, in_dtype, out_dtype, use_scalar_scale_a,
 
     bias = None
     if use_bias:
-        bias = torch.rand((N, ), device=device, dtype=out_dtype)
+        bias = torch.rand((N,), device=device, dtype=out_dtype)
 
     c_check = triton_scaled_mm(a, b, scale_a, scale_b, out_dtype, bias)
 
diff --git a/tests/kernels/test_apply_repetition_penalties.py b/tests/kernels/test_apply_repetition_penalties.py
index 90380b872d6c..a4619f5846b1 100644
--- a/tests/kernels/test_apply_repetition_penalties.py
+++ b/tests/kernels/test_apply_repetition_penalties.py
@@ -4,8 +4,10 @@
 import torch
 
 from tests.kernels.utils import opcheck
-from vllm._custom_ops import (apply_repetition_penalties_cuda,
-                              apply_repetition_penalties_torch)
+from vllm._custom_ops import (
+    apply_repetition_penalties_cuda,
+    apply_repetition_penalties_torch,
+)
 from vllm.platforms import current_platform
 
 NUM_SEQS = [1, 2, 3, 4, 8, 13, 17, 32, 37, 256, 1023, 1024, 1025]
@@ -21,8 +23,9 @@
 @pytest.mark.parametrize("repetition_penalty", REPETITION_PENALTY_VALUES)
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("seed", SEEDS)
-@pytest.mark.skipif(not current_platform.is_cuda(),
-                    reason="This test for checking CUDA kernel")
+@pytest.mark.skipif(
+    not current_platform.is_cuda(), reason="This test for checking CUDA kernel"
+)
 @torch.inference_mode()
 def test_apply_repetition_penalties(
     num_seqs: int,
@@ -32,7 +35,7 @@ def test_apply_repetition_penalties(
     seed: int,
 ) -> None:
     """
-    Test the apply_repetition_penalties custom op 
+    Test the apply_repetition_penalties custom op
     against a reference implementation.
     """
     current_platform.seed_everything(seed)
@@ -46,39 +49,40 @@ def test_apply_repetition_penalties(
     output_mask = torch.zeros(num_seqs, vocab_size, dtype=torch.bool)
 
     # Mark some tokens as repeated in prompt and output
-    prompt_indices = torch.randint(0, vocab_size,
-                                   (num_seqs, max(1, vocab_size // 200)))
-    output_indices = torch.randint(0, vocab_size,
-                                   (num_seqs, max(1, vocab_size // 200)))
+    prompt_indices = torch.randint(0, vocab_size, (num_seqs, max(1, vocab_size // 200)))
+    output_indices = torch.randint(0, vocab_size, (num_seqs, max(1, vocab_size // 200)))
 
     for i in range(num_seqs):
         prompt_mask[i, prompt_indices[i]] = True
         output_mask[i, output_indices[i]] = True
 
     # Create repetition penalties tensor
-    repetition_penalties = torch.full((num_seqs, ),
-                                      repetition_penalty,
-                                      dtype=dtype)
+    repetition_penalties = torch.full((num_seqs,), repetition_penalty, dtype=dtype)
 
     # Run all three implementations
     logits_torch = logits.clone()
     logits_cuda = logits.clone()
 
-    apply_repetition_penalties_torch(logits_torch, prompt_mask, output_mask,
-                                     repetition_penalties)
-    apply_repetition_penalties_cuda(logits_cuda, prompt_mask, output_mask,
-                                    repetition_penalties)
+    apply_repetition_penalties_torch(
+        logits_torch, prompt_mask, output_mask, repetition_penalties
+    )
+    apply_repetition_penalties_cuda(
+        logits_cuda, prompt_mask, output_mask, repetition_penalties
+    )
 
     # Compare all outputs to reference
     torch.testing.assert_close(logits_torch, logits_cuda, rtol=1e-3, atol=1e-3)
 
     # Test the operator by applying the opcheck utility
-    opcheck(torch.ops._C.apply_repetition_penalties_,
-            (logits.clone(), prompt_mask, output_mask, repetition_penalties))
+    opcheck(
+        torch.ops._C.apply_repetition_penalties_,
+        (logits.clone(), prompt_mask, output_mask, repetition_penalties),
+    )
 
 
-@pytest.mark.skipif(not current_platform.is_cuda(),
-                    reason="This test for checking CUDA kernel")
+@pytest.mark.skipif(
+    not current_platform.is_cuda(), reason="This test for checking CUDA kernel"
+)
 @torch.inference_mode()
 def test_apply_repetition_penalties_zero_seqs() -> None:
     """
@@ -104,22 +108,24 @@ def test_apply_repetition_penalties_zero_seqs() -> None:
     # No tokens to mark as repeated since num_seqs=0
 
     # Create repetition penalties tensor
-    repetition_penalties = torch.full((num_seqs, ),
-                                      repetition_penalty,
-                                      dtype=dtype)
+    repetition_penalties = torch.full((num_seqs,), repetition_penalty, dtype=dtype)
 
     # Run all three implementations
     logits_torch = logits.clone()
     logits_cuda = logits.clone()
 
-    apply_repetition_penalties_torch(logits_torch, prompt_mask, output_mask,
-                                     repetition_penalties)
-    apply_repetition_penalties_cuda(logits_cuda, prompt_mask, output_mask,
-                                    repetition_penalties)
+    apply_repetition_penalties_torch(
+        logits_torch, prompt_mask, output_mask, repetition_penalties
+    )
+    apply_repetition_penalties_cuda(
+        logits_cuda, prompt_mask, output_mask, repetition_penalties
+    )
 
     # Compare all outputs to reference
     torch.testing.assert_close(logits_torch, logits_cuda, rtol=1e-3, atol=1e-3)
 
     # Test the operator by applying the opcheck utility
-    opcheck(torch.ops._C.apply_repetition_penalties_,
-            (logits.clone(), prompt_mask, output_mask, repetition_penalties))
+    opcheck(
+        torch.ops._C.apply_repetition_penalties_,
+        (logits.clone(), prompt_mask, output_mask, repetition_penalties),
+    )
diff --git a/tests/kernels/test_flex_attention.py b/tests/kernels/test_flex_attention.py
index 39753c0cc15b..87002c72f6e1 100644
--- a/tests/kernels/test_flex_attention.py
+++ b/tests/kernels/test_flex_attention.py
@@ -9,11 +9,13 @@
 import torch
 from packaging import version
 
-from tests.v1.attention.utils import (BatchSpec, create_common_attn_metadata,
-                                      create_standard_kv_cache_spec,
-                                      create_vllm_config)
-from vllm.v1.attention.backends.flex_attention import (
-    FlexAttentionMetadataBuilder)
+from tests.v1.attention.utils import (
+    BatchSpec,
+    create_common_attn_metadata,
+    create_standard_kv_cache_spec,
+    create_vllm_config,
+)
+from vllm.v1.attention.backends.flex_attention import FlexAttentionMetadataBuilder
 
 from ..models.utils import check_embeddings_close, check_logprobs_close
 
@@ -57,26 +59,32 @@ def test_flex_attention_vs_default_backend(vllm_runner, monkeypatch):
         m.setenv("VLLM_ATTENTION_BACKEND", "FLEX_ATTENTION")
 
         set_seed(seed)
-        with vllm_runner(model_name,
-                         runner="generate",
-                         tensor_parallel_size=1,
-                         num_gpu_blocks_override=128,
-                         enforce_eager=True) as llm_flex:
+        with vllm_runner(
+            model_name,
+            runner="generate",
+            tensor_parallel_size=1,
+            num_gpu_blocks_override=128,
+            enforce_eager=True,
+        ) as llm_flex:
             output_flex = llm_flex.generate_greedy_logprobs(
-                prompts, max_tokens, num_logprobs)
+                prompts, max_tokens, num_logprobs
+            )
 
     # Run with default backend
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
         set_seed(seed)
-        with vllm_runner(model_name,
-                         runner="generate",
-                         tensor_parallel_size=1,
-                         num_gpu_blocks_override=128,
-                         enforce_eager=True,
-                         gpu_memory_utilization=0.85) as llm_default:
+        with vllm_runner(
+            model_name,
+            runner="generate",
+            tensor_parallel_size=1,
+            num_gpu_blocks_override=128,
+            enforce_eager=True,
+            gpu_memory_utilization=0.85,
+        ) as llm_default:
             output_default = llm_default.generate_greedy_logprobs(
-                prompts, max_tokens, num_logprobs)
+                prompts, max_tokens, num_logprobs
+            )
 
     check_logprobs_close(
         outputs_0_lst=output_flex,
@@ -107,23 +115,27 @@ def test_encoder_flex_attention_vs_default_backend(vllm_runner, monkeypatch):
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
         m.setenv("VLLM_ATTENTION_BACKEND", "FLEX_ATTENTION")
-        with vllm_runner(model_name,
-                         runner="pooling",
-                         dtype=torch.bfloat16,
-                         tensor_parallel_size=1,
-                         max_model_len=100,
-                         enforce_eager=True) as llm_flex:
+        with vllm_runner(
+            model_name,
+            runner="pooling",
+            dtype=torch.bfloat16,
+            tensor_parallel_size=1,
+            max_model_len=100,
+            enforce_eager=True,
+        ) as llm_flex:
             flex_outputs = llm_flex.embed(prompts)
 
     # Run with default backend
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
-        with vllm_runner(model_name,
-                         runner="pooling",
-                         dtype=torch.bfloat16,
-                         tensor_parallel_size=1,
-                         max_model_len=100,
-                         enforce_eager=True) as llm_default:
+        with vllm_runner(
+            model_name,
+            runner="pooling",
+            dtype=torch.bfloat16,
+            tensor_parallel_size=1,
+            max_model_len=100,
+            enforce_eager=True,
+        ) as llm_default:
             default_outputs = llm_default.embed(prompts)
 
     check_embeddings_close(
@@ -147,27 +159,29 @@ def test_block_mask_direct_vs_slow_path():
     """
     device = torch.device("cuda")
 
-    vllm_config = create_vllm_config(model_name="meta-llama/Meta-Llama-3-8B",
-                                     block_size=16,
-                                     max_model_len=1024)
+    vllm_config = create_vllm_config(
+        model_name="meta-llama/Meta-Llama-3-8B", block_size=16, max_model_len=1024
+    )
     kv_cache_spec = create_standard_kv_cache_spec(vllm_config)
 
     # Use a mixed batch that will create groups spanning multiple sequences
-    batch_spec = BatchSpec(seq_lens=[35, 64, 128, 256],
-                           query_lens=[33, 5, 32, 64],
-                           name="test_mixed_batch")
+    batch_spec = BatchSpec(
+        seq_lens=[35, 64, 128, 256], query_lens=[33, 5, 32, 64], name="test_mixed_batch"
+    )
 
     common_attn_metadata = create_common_attn_metadata(
-        batch_spec, vllm_config.cache_config.block_size, device)
+        batch_spec, vllm_config.cache_config.block_size, device
+    )
 
-    builder = FlexAttentionMetadataBuilder(kv_cache_spec, [], vllm_config,
-                                           device)
+    builder = FlexAttentionMetadataBuilder(kv_cache_spec, [], vllm_config, device)
 
-    metadata_direct = builder.build(common_prefix_len=0,
-                                    common_attn_metadata=common_attn_metadata)
+    metadata_direct = builder.build(
+        common_prefix_len=0, common_attn_metadata=common_attn_metadata
+    )
     builder.direct_build = False
-    metadata_slow = builder.build(common_prefix_len=0,
-                                  common_attn_metadata=common_attn_metadata)
+    metadata_slow = builder.build(
+        common_prefix_len=0, common_attn_metadata=common_attn_metadata
+    )
 
     assert metadata_direct.block_mask is not None
     assert metadata_slow.block_mask is not None
@@ -184,20 +198,20 @@ def test_block_mask_direct_vs_slow_path():
     missing_details = []
 
     for group_idx in range(num_groups):
-        direct_blocks = set(
-            direct_indices[group_idx, :direct_num[group_idx]].tolist())
-        slow_blocks = set(
-            slow_indices[group_idx, :slow_num[group_idx]].tolist())
+        direct_blocks = set(direct_indices[group_idx, : direct_num[group_idx]].tolist())
+        slow_blocks = set(slow_indices[group_idx, : slow_num[group_idx]].tolist())
 
         missing_blocks = slow_blocks - direct_blocks
         if missing_blocks:
             all_contained = False
             missing_details.append(
-                f"Group {group_idx}: missing {sorted(missing_blocks)}")
+                f"Group {group_idx}: missing {sorted(missing_blocks)}"
+            )
 
     assert all_contained, (
-        "Direct path is missing blocks required by slow path:\n" +
-        "\n".join(missing_details))
+        "Direct path is missing blocks required by slow path:\n"
+        + "\n".join(missing_details)
+    )
 
 
 if __name__ == "__main__":
diff --git a/tests/kernels/test_fused_quant_activation.py b/tests/kernels/test_fused_quant_activation.py
index 803453a20d81..c79e6105e69f 100644
--- a/tests/kernels/test_fused_quant_activation.py
+++ b/tests/kernels/test_fused_quant_activation.py
@@ -13,13 +13,12 @@
 NUM_TOKENS = [1, 17, 86, 1234, 3045]  # Arbitrary values for testing
 HIDDEN_SIZES = [16, 48, 128, 1562, 4096]  # Arbitrary values for testing
 SEEDS = [0]
-CUDA_DEVICES = [
-    f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)
-]
+CUDA_DEVICES = [f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)]
 
 
-def ref_impl(silu_and_mul: SiluAndMul, x: torch.Tensor,
-             scale: torch.Tensor) -> torch.Tensor:
+def ref_impl(
+    silu_and_mul: SiluAndMul, x: torch.Tensor, scale: torch.Tensor
+) -> torch.Tensor:
     silu_and_mul_out = silu_and_mul.forward_native(x)
     out, scales = ops.scaled_fp8_quant(silu_and_mul_out, scale)
     return out
@@ -27,9 +26,7 @@ def ref_impl(silu_and_mul: SiluAndMul, x: torch.Tensor,
 
 def ops_impl(x: torch.Tensor, scale: torch.Tensor) -> torch.Tensor:
     out_shape = (x.shape[0], x.shape[1] // 2)
-    out = torch.empty(out_shape,
-                      dtype=current_platform.fp8_dtype(),
-                      device=x.device)
+    out = torch.empty(out_shape, dtype=current_platform.fp8_dtype(), device=x.device)
     torch.ops._C.silu_and_mul_quant(out, x, scale)
     return out
 
@@ -57,7 +54,7 @@ def test_silu_and_mul(
     layer = SiluAndMul()
 
     # Make inputs
-    scale = (torch.randn((1), device=device, dtype=torch.float32))
+    scale = torch.randn((1), device=device, dtype=torch.float32)
     x = torch.randn(num_tokens, hidden_size, dtype=dtype)
 
     ref_out = ref_impl(layer, x, scale)
@@ -66,6 +63,7 @@ def test_silu_and_mul(
     assert ref_out.dtype == quant_dtype
     assert ops_out.dtype == quant_dtype
     assert ref_out.shape == ops_out.shape
-    assert torch.allclose(ref_out.to(dtype=torch.float32),
-                          ops_out.to(dtype=torch.float32))
+    assert torch.allclose(
+        ref_out.to(dtype=torch.float32), ops_out.to(dtype=torch.float32)
+    )
     opcheck(torch.ops._C.silu_and_mul_quant, (ops_out, x, scale))
diff --git a/tests/kernels/test_onednn.py b/tests/kernels/test_onednn.py
index 198a8fdf0c33..43251ffaab91 100644
--- a/tests/kernels/test_onednn.py
+++ b/tests/kernels/test_onednn.py
@@ -44,24 +44,27 @@ def ref_int8_scaled_mm(
 ):
     if azp is not None:
         a = a.to(dtype=torch.float32) - azp.to(dtype=torch.float32)
-    output = torch.mm((scale_a * a.to(dtype=torch.float32)),
-                      (scale_b * b.to(dtype=torch.float32)))
+    output = torch.mm(
+        (scale_a * a.to(dtype=torch.float32)), (scale_b * b.to(dtype=torch.float32))
+    )
     if bias is not None:
         output += bias.float()
 
     return output.to(dtype=output_type)
 
 
-def onednn_int8_gemm_test_helper(primitive_cache_size: int,
-                                 m: int,
-                                 n: int,
-                                 k: int,
-                                 per_tensor_a_quant: bool,
-                                 per_tensor_b_quant: bool,
-                                 use_azp: bool,
-                                 use_bias: bool,
-                                 out_dtype: torch.dtype = torch.bfloat16,
-                                 device: str = "cpu"):
+def onednn_int8_gemm_test_helper(
+    primitive_cache_size: int,
+    m: int,
+    n: int,
+    k: int,
+    per_tensor_a_quant: bool,
+    per_tensor_b_quant: bool,
+    use_azp: bool,
+    use_bias: bool,
+    out_dtype: torch.dtype = torch.bfloat16,
+    device: str = "cpu",
+):
     # Test for a oneDNN kernel with per-tensor / per-token activation
     # quantization and per-tensor / per-output channel weight quantization.
     a = to_int8(torch.randn((m, k), device=device) * 5)
@@ -70,8 +73,8 @@ def onednn_int8_gemm_test_helper(primitive_cache_size: int,
     a_scales_shape = (1, 1) if per_tensor_a_quant else (m, 1)
     b_scales_shape = (1, 1) if per_tensor_b_quant else (1, n)
 
-    scale_a = (torch.randn(a_scales_shape, device=device, dtype=torch.float32))
-    scale_b = (torch.randn(b_scales_shape, device=device, dtype=torch.float32))
+    scale_a = torch.randn(a_scales_shape, device=device, dtype=torch.float32)
+    scale_b = torch.randn(b_scales_shape, device=device, dtype=torch.float32)
 
     if use_azp:
         azp = torch.rand(a_scales_shape, dtype=torch.float32) * 10 + 1.5
@@ -82,7 +85,7 @@ def onednn_int8_gemm_test_helper(primitive_cache_size: int,
         azp_adj = None
 
     if use_bias:
-        bias = torch.rand((n, ), device=device, dtype=out_dtype) * 10
+        bias = torch.rand((n,), device=device, dtype=out_dtype) * 10
     else:
         bias = None
 
@@ -105,20 +108,21 @@ def onednn_int8_gemm_test_helper(primitive_cache_size: int,
         # To test runtime bias setting
         out = torch.zeros((m, n), dtype=out_dtype)
         ops.onednn_scaled_mm(handler, a, out, scale_a, azp, azp_adj, None)
-        baseline = ref_int8_scaled_mm(a, b, scale_a, scale_b, azp, None,
-                                      out_dtype)
+        baseline = ref_int8_scaled_mm(a, b, scale_a, scale_b, azp, None, out_dtype)
 
         torch.testing.assert_close(out, baseline, rtol=1e-1, atol=1e0)
 
 
-def onednn_gemm_test_helper(primitive_cache_size: int,
-                            m: int,
-                            n: int,
-                            k: int,
-                            use_bias: bool,
-                            use_stride: bool,
-                            dtype: torch.dtype = torch.bfloat16,
-                            device: str = "cpu"):
+def onednn_gemm_test_helper(
+    primitive_cache_size: int,
+    m: int,
+    n: int,
+    k: int,
+    use_bias: bool,
+    use_stride: bool,
+    dtype: torch.dtype = torch.bfloat16,
+    device: str = "cpu",
+):
     if use_stride:
         a = torch.rand((m, 2 * k), dtype=dtype, device=device) * 1.5
         a = a[:, :k]
@@ -128,7 +132,7 @@ def onednn_gemm_test_helper(primitive_cache_size: int,
     b = torch.rand((n, k), dtype=dtype, device=device) * 1.5
 
     if use_bias:
-        bias = torch.rand((n, ), device=device, dtype=dtype) * 5
+        bias = torch.rand((n,), device=device, dtype=dtype) * 5
         bias_f32 = bias.float()
     else:
         bias = None
@@ -140,16 +144,18 @@ def onednn_gemm_test_helper(primitive_cache_size: int,
     )
 
     out = ops.onednn_mm(handler, a, bias)
-    baseline = torch.nn.functional.linear(a.float(), b.float(),
-                                          bias_f32).to(dtype=a.dtype)
+    baseline = torch.nn.functional.linear(a.float(), b.float(), bias_f32).to(
+        dtype=a.dtype
+    )
 
     torch.testing.assert_close(out, baseline)
 
     if use_bias:
         # To test runtime bias setting
         out = ops.onednn_mm(handler, a, None)
-        baseline = torch.nn.functional.linear(a.float(), b.float(),
-                                              None).to(dtype=a.dtype)
+        baseline = torch.nn.functional.linear(a.float(), b.float(), None).to(
+            dtype=a.dtype
+        )
 
         torch.testing.assert_close(out, baseline)
 
diff --git a/tests/kernels/test_shuffle_rows.py b/tests/kernels/test_shuffle_rows.py
index 7d02e1764e7d..c7de64066e87 100644
--- a/tests/kernels/test_shuffle_rows.py
+++ b/tests/kernels/test_shuffle_rows.py
@@ -14,20 +14,15 @@
 
 @pytest.mark.parametrize("num_tokens", [1, 16, 64, 128, 256, 512, 1024])
 @pytest.mark.parametrize("hidden_size", [128, 256, 512, 1024, 2048, 4096])
-@pytest.mark.parametrize("dtype",
-                         [torch.float16, torch.bfloat16, torch.float32])
-def test_shuffle_rows_basic(num_tokens: int, hidden_size: int,
-                            dtype: torch.dtype):
+@pytest.mark.parametrize("dtype", [torch.float16, torch.bfloat16, torch.float32])
+def test_shuffle_rows_basic(num_tokens: int, hidden_size: int, dtype: torch.dtype):
     """Test basic functionality of shuffle_rows with various tensor sizes and
     dtypes."""
     if not current_platform.is_cuda():
         pytest.skip("shuffle_rows requires CUDA")
 
     # Create input tensor
-    input_tensor = torch.randn(num_tokens,
-                               hidden_size,
-                               device="cuda",
-                               dtype=dtype)
+    input_tensor = torch.randn(num_tokens, hidden_size, device="cuda", dtype=dtype)
 
     # Create a simple permutation map (identity mapping)
     dst2src_map = torch.arange(num_tokens, device="cuda", dtype=torch.int32)
@@ -47,24 +42,18 @@ def test_shuffle_rows_basic(num_tokens: int, hidden_size: int,
 @pytest.mark.parametrize("num_tokens", [16, 64, 128])
 @pytest.mark.parametrize("hidden_size", [128, 512, 1024])
 @pytest.mark.parametrize("dtype", [torch.float16, torch.bfloat16])
-def test_shuffle_rows_permutation(num_tokens: int, hidden_size: int,
-                                  dtype: torch.dtype):
+def test_shuffle_rows_permutation(
+    num_tokens: int, hidden_size: int, dtype: torch.dtype
+):
     """Test shuffle_rows with actual permutation."""
     if not current_platform.is_cuda():
         pytest.skip("shuffle_rows requires CUDA")
 
     # Create input tensor
-    input_tensor = torch.randn(num_tokens,
-                               hidden_size,
-                               device="cuda",
-                               dtype=dtype)
+    input_tensor = torch.randn(num_tokens, hidden_size, device="cuda", dtype=dtype)
 
     # Create a reverse permutation map
-    dst2src_map = torch.arange(num_tokens - 1,
-                               -1,
-                               -1,
-                               device="cuda",
-                               dtype=torch.int32)
+    dst2src_map = torch.arange(num_tokens - 1, -1, -1, device="cuda", dtype=torch.int32)
 
     # Test shuffle_rows
     output = shuffle_rows(input_tensor, dst2src_map)
@@ -90,17 +79,13 @@ def test_shuffle_rows_expansion(num_tokens: int, hidden_size: int):
     dtype = torch.float16
 
     # Create input tensor
-    input_tensor = torch.randn(num_tokens,
-                               hidden_size,
-                               device="cuda",
-                               dtype=dtype)
+    input_tensor = torch.randn(num_tokens, hidden_size, device="cuda", dtype=dtype)
 
     # Create a mapping that duplicates some tokens (expansion)
     expanded_size = num_tokens * 2
-    dst2src_map = torch.randint(0,
-                                num_tokens, (expanded_size, ),
-                                device="cuda",
-                                dtype=torch.int32)
+    dst2src_map = torch.randint(
+        0, num_tokens, (expanded_size,), device="cuda", dtype=torch.int32
+    )
 
     # Test shuffle_rows
     output = shuffle_rows(input_tensor, dst2src_map)
@@ -113,10 +98,9 @@ def test_shuffle_rows_expansion(num_tokens: int, hidden_size: int):
     # Verify that each output row matches the corresponding input row
     for i in range(expanded_size):
         src_idx = dst2src_map[i].item()
-        torch.testing.assert_close(output[i],
-                                   input_tensor[src_idx],
-                                   atol=1e-6,
-                                   rtol=1e-5)
+        torch.testing.assert_close(
+            output[i], input_tensor[src_idx], atol=1e-6, rtol=1e-5
+        )
 
 
 @pytest.mark.parametrize("num_tokens", [16, 64])
@@ -132,10 +116,7 @@ def test_shuffle_rows_random_permutation(num_tokens: int, hidden_size: int):
     torch.manual_seed(42)
 
     # Create input tensor
-    input_tensor = torch.randn(num_tokens,
-                               hidden_size,
-                               device="cuda",
-                               dtype=dtype)
+    input_tensor = torch.randn(num_tokens, hidden_size, device="cuda", dtype=dtype)
 
     # Create a random permutation map
     dst2src_map = torch.randperm(num_tokens, device="cuda", dtype=torch.int32)
@@ -151,10 +132,9 @@ def test_shuffle_rows_random_permutation(num_tokens: int, hidden_size: int):
     # Verify that each output row matches the corresponding input row
     for i in range(num_tokens):
         src_idx = dst2src_map[i].item()
-        torch.testing.assert_close(output[i],
-                                   input_tensor[src_idx],
-                                   atol=1e-6,
-                                   rtol=1e-5)
+        torch.testing.assert_close(
+            output[i], input_tensor[src_idx], atol=1e-6, rtol=1e-5
+        )
 
 
 def test_shuffle_rows_edge_cases():
@@ -188,10 +168,7 @@ def test_shuffle_rows_moe_like_scenario():
     topk = 2
 
     # Simulate input tokens
-    input_tensor = torch.randn(batch_size,
-                               hidden_size,
-                               device="cuda",
-                               dtype=dtype)
+    input_tensor = torch.randn(batch_size, hidden_size, device="cuda", dtype=dtype)
 
     # Simulate expert assignment (each token goes to topk experts)
     # This creates a mapping where tokens are duplicated for multiple experts
@@ -215,14 +192,12 @@ def test_shuffle_rows_moe_like_scenario():
     for i in range(batch_size):
         for k in range(topk):
             output_idx = i * topk + k
-            torch.testing.assert_close(output[output_idx],
-                                       input_tensor[i],
-                                       atol=1e-6,
-                                       rtol=1e-5)
+            torch.testing.assert_close(
+                output[output_idx], input_tensor[i], atol=1e-6, rtol=1e-5
+            )
 
 
-@pytest.mark.parametrize("dtype",
-                         [torch.float16, torch.bfloat16, torch.float32])
+@pytest.mark.parametrize("dtype", [torch.float16, torch.bfloat16, torch.float32])
 def test_shuffle_rows_dtype_consistency(dtype: torch.dtype):
     """Test that shuffle_rows preserves dtype correctly."""
     if not current_platform.is_cuda():
@@ -232,10 +207,7 @@ def test_shuffle_rows_dtype_consistency(dtype: torch.dtype):
     hidden_size = 512
 
     # Create input tensor with specific dtype
-    input_tensor = torch.randn(num_tokens,
-                               hidden_size,
-                               device="cuda",
-                               dtype=dtype)
+    input_tensor = torch.randn(num_tokens, hidden_size, device="cuda", dtype=dtype)
     dst2src_map = torch.arange(num_tokens, device="cuda", dtype=torch.int32)
 
     # Test shuffle_rows
@@ -257,10 +229,7 @@ def test_shuffle_rows_device_consistency():
     dtype = torch.float16
 
     # Create input tensor on CUDA
-    input_tensor = torch.randn(num_tokens,
-                               hidden_size,
-                               device="cuda",
-                               dtype=dtype)
+    input_tensor = torch.randn(num_tokens, hidden_size, device="cuda", dtype=dtype)
     dst2src_map = torch.arange(num_tokens, device="cuda", dtype=torch.int32)
 
     # Test shuffle_rows
@@ -281,10 +250,7 @@ def test_shuffle_rows_contiguous_output():
     dtype = torch.float16
 
     # Create input tensor
-    input_tensor = torch.randn(num_tokens,
-                               hidden_size,
-                               device="cuda",
-                               dtype=dtype)
+    input_tensor = torch.randn(num_tokens, hidden_size, device="cuda", dtype=dtype)
     dst2src_map = torch.arange(num_tokens, device="cuda", dtype=torch.int32)
 
     # Test shuffle_rows
diff --git a/tests/kernels/test_triton_flash_attention.py b/tests/kernels/test_triton_flash_attention.py
index 1c31cfb25e5a..4b0bbb992d2e 100644
--- a/tests/kernels/test_triton_flash_attention.py
+++ b/tests/kernels/test_triton_flash_attention.py
@@ -4,21 +4,24 @@
 
 Run `pytest tests/kernels/test_triton_flash_attention.py`.
 """
+
 import pytest
 import torch
 
-from vllm.attention.ops.triton_flash_attention import (SUPPORTED_LAYOUTS,
-                                                       MetaData,
-                                                       compute_alibi_tensor,
-                                                       scale_fp8,
-                                                       triton_attention_rocm)
+from vllm.attention.ops.triton_flash_attention import (
+    SUPPORTED_LAYOUTS,
+    MetaData,
+    compute_alibi_tensor,
+    scale_fp8,
+    triton_attention_rocm,
+)
 from vllm.platforms import current_platform
 
 
 class ReferenceAttention:
-
-    def __init__(self, Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD, use_alibi, dtype,
-                 input_metadata):
+    def __init__(
+        self, Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD, use_alibi, dtype, input_metadata
+    ):
         self.Z = Z
         self.HQ = HQ
         self.HK = HK
@@ -30,21 +33,23 @@ def __init__(self, Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD, use_alibi, dtype,
         self.input_metadata = input_metadata
 
     def fwd(self, q, k, v):
-        scores = torch.einsum('bhqd,bhkd->bhqk', q,
-                              k).float() * self.input_metadata.sm_scale
+        scores = (
+            torch.einsum("bhqd,bhkd->bhqk", q, k).float() * self.input_metadata.sm_scale
+        )
         if self.input_metadata.causal:
-            mask = torch.tril(torch.ones(self.N_CTX_Q,
-                                         self.N_CTX_K,
-                                         device="cuda"),
-                              diagonal=self.N_CTX_K - self.N_CTX_Q)
+            mask = torch.tril(
+                torch.ones(self.N_CTX_Q, self.N_CTX_K, device="cuda"),
+                diagonal=self.N_CTX_K - self.N_CTX_Q,
+            )
             scores[:, :, mask == 0] = float("-inf")
 
         if self.input_metadata.bias is not None:
             scores += self.input_metadata.bias
 
         if self.use_alibi:
-            scores += compute_alibi_tensor(self.input_metadata.alibi_slopes,
-                                           self.N_CTX_Q, self.N_CTX_K)
+            scores += compute_alibi_tensor(
+                self.input_metadata.alibi_slopes, self.N_CTX_Q, self.N_CTX_K
+            )
 
         p = torch.softmax(scores, dim=-1)
         if self.input_metadata.causal:
@@ -54,31 +59,38 @@ def fwd(self, q, k, v):
             # should be out of the softmax.
             nan_mask = torch.isnan(p)
             p[nan_mask == 1] = 0
-        ref_out = torch.einsum('bhqk,bhkd->bhqd', p.to(self.dtype), v)
+        ref_out = torch.einsum("bhqk,bhkd->bhqd", p.to(self.dtype), v)
         # compare
-        if self.input_metadata.layout == 'bshd':
+        if self.input_metadata.layout == "bshd":
             ref_out = ref_out.transpose(1, 2).clone()
         return ref_out
 
     def fwd_fp8(self, q_quantized, k_quantized, v_quantized):
         q = (q_quantized.to(torch.float16) * self.input_metadata.q_descale).to(
-            self.dtype)
+            self.dtype
+        )
         k = (k_quantized.to(torch.float16) * self.input_metadata.k_descale).to(
-            self.dtype)
+            self.dtype
+        )
         v = (v_quantized.to(torch.float16) * self.input_metadata.v_descale).to(
-            self.dtype)
+            self.dtype
+        )
         result = self.fwd(q, k, v)
         if self.input_metadata.o_scale is not None:
             result, _ = scale_fp8(result, self.input_metadata.o_scale)
         return result
 
     def fwd_fp8_kv(self, q, k_quantized, v_quantized):
-        k_descale, v_descale = (self.input_metadata.k_descale,
-                                self.input_metadata.v_descale)
-        k_dequantized = (k_quantized.to(torch.float32) *
-                         k_descale.to(torch.float32)).to(self.dtype)
-        v_dequantized = (v_quantized.to(torch.float32) *
-                         v_descale.to(torch.float32)).to(self.dtype)
+        k_descale, v_descale = (
+            self.input_metadata.k_descale,
+            self.input_metadata.v_descale,
+        )
+        k_dequantized = (
+            k_quantized.to(torch.float32) * k_descale.to(torch.float32)
+        ).to(self.dtype)
+        v_dequantized = (
+            v_quantized.to(torch.float32) * v_descale.to(torch.float32)
+        ).to(self.dtype)
         return self.fwd(q, k_dequantized, v_dequantized)
 
     def varlen_fwd(self, q, k, v, is_mqa=False):
@@ -86,29 +98,33 @@ def varlen_fwd(self, q, k, v, is_mqa=False):
         if is_mqa:
             # Make KV look like HQ/HK "groups" of HK. Later, we will reshape so
             # the size aligns with Q.
-            k_ref = k.view(k.shape[0], k.shape[1], 1,
-                           k.shape[2]).expand(-1, -1, self.HQ // self.HK, -1)
-            v_ref = v.view(v.shape[0], v.shape[1], 1,
-                           v.shape[2]).expand(-1, -1, self.HQ // self.HK, -1)
+            k_ref = k.view(k.shape[0], k.shape[1], 1, k.shape[2]).expand(
+                -1, -1, self.HQ // self.HK, -1
+            )
+            v_ref = v.view(v.shape[0], v.shape[1], 1, v.shape[2]).expand(
+                -1, -1, self.HQ // self.HK, -1
+            )
         else:
             k_ref = k
             v_ref = v
 
         for i in range(0, self.input_metadata.num_contexts):
-            start_q, start_k = self.input_metadata.cu_seqlens_q[
-                i], self.input_metadata.cu_seqlens_k[i]
-            end_q, end_k = self.input_metadata.cu_seqlens_q[
-                i + 1], self.input_metadata.cu_seqlens_k[i + 1]
+            start_q, start_k = (
+                self.input_metadata.cu_seqlens_q[i],
+                self.input_metadata.cu_seqlens_k[i],
+            )
+            end_q, end_k = (
+                self.input_metadata.cu_seqlens_q[i + 1],
+                self.input_metadata.cu_seqlens_k[i + 1],
+            )
             k_curr = k_ref[start_k:end_k]
             v_curr = v_ref[start_k:end_k]
             if is_mqa:
                 k_curr = k_curr.reshape(k_curr.shape[0], -1, k_curr.shape[3])
                 v_curr = v_curr.reshape(v_curr.shape[0], -1, v_curr.shape[3])
-            scores = torch.einsum('qhd,khd->qhk', q[start_q:end_q],
-                                  k_curr).float()
-            p = torch.softmax(scores * self.input_metadata.sm_scale,
-                              dim=-1).half()
-            ref_out[start_q:end_q] = torch.einsum('qhk,khd->qhd', p, v_curr)
+            scores = torch.einsum("qhd,khd->qhk", q[start_q:end_q], k_curr).float()
+            p = torch.softmax(scores * self.input_metadata.sm_scale, dim=-1).half()
+            ref_out[start_q:end_q] = torch.einsum("qhk,khd->qhd", p, v_curr)
         return ref_out
 
 
@@ -123,8 +139,7 @@ def quantize_input(q, k, v, fp8_kv=False, use_o_scale=False):
     # model.
     p_scale = None
 
-    o_scale = torch.rand(1, device="cuda",
-                         requires_grad=False) if use_o_scale else None
+    o_scale = torch.rand(1, device="cuda", requires_grad=False) if use_o_scale else None
 
     return q, k, v, q_descale, k_descale, v_descale, p_scale, o_scale
 
@@ -150,10 +165,10 @@ def input_helper(
     current_platform.seed_everything(0)
 
     # Initialize q, k, v
-    if layout == 'bhsd':
+    if layout == "bhsd":
         q_tensor_shape = (Z, HQ, N_CTX_Q, D_HEAD)
         k_tensor_shape = (Z, HK, N_CTX_K, D_HEAD)
-    elif layout == 'bshd':
+    elif layout == "bshd":
         q_tensor_shape = (Z, N_CTX_Q, HQ, D_HEAD)
         k_tensor_shape = (Z, N_CTX_K, HK, D_HEAD)
 
@@ -161,69 +176,54 @@ def input_helper(
         # for n heads the set of slopes is the geometric sequence that starts
         # 2^(-8/n)
         alibi_slopes = torch.tensor(
-            [2**(-8 / HQ * i) for i in range(1, HQ + 1)],
+            [2 ** (-8 / HQ * i) for i in range(1, HQ + 1)],
             dtype=torch.float32,
-            device="cuda").repeat(Z, 1)
+            device="cuda",
+        ).repeat(Z, 1)
     else:
         alibi_slopes = None
 
     if use_bias:
-        bias = torch.randn((1, HQ, N_CTX_Q, N_CTX_K),
-                           dtype=dtype,
-                           device="cuda",
-                           requires_grad=False)
+        bias = torch.randn(
+            (1, HQ, N_CTX_Q, N_CTX_K), dtype=dtype, device="cuda", requires_grad=False
+        )
     else:
         bias = None
 
-    q = torch.randn(q_tensor_shape,
-                    dtype=dtype,
-                    device="cuda",
-                    requires_grad=False)
-    k = torch.randn(k_tensor_shape,
-                    dtype=dtype,
-                    device="cuda",
-                    requires_grad=False)
-    v = torch.randn(k_tensor_shape,
-                    dtype=dtype,
-                    device="cuda",
-                    requires_grad=False)
+    q = torch.randn(q_tensor_shape, dtype=dtype, device="cuda", requires_grad=False)
+    k = torch.randn(k_tensor_shape, dtype=dtype, device="cuda", requires_grad=False)
+    v = torch.randn(k_tensor_shape, dtype=dtype, device="cuda", requires_grad=False)
 
     if is_fp8:
-        (q, k, v, q_descale, k_descale, v_descale, p_scale,
-         o_scale) = quantize_input(q,
-                                   k,
-                                   v,
-                                   use_o_scale=use_o_scale,
-                                   fp8_kv=fp8_kv)
+        (q, k, v, q_descale, k_descale, v_descale, p_scale, o_scale) = quantize_input(
+            q, k, v, use_o_scale=use_o_scale, fp8_kv=fp8_kv
+        )
     else:
         q_descale = k_descale = v_descale = p_scale = o_scale = None
 
-    input_metadata = MetaData(sm_scale=D_HEAD**-0.5,
-                              max_seqlens_q=N_CTX_Q,
-                              max_seqlens_k=N_CTX_K,
-                              layout=layout,
-                              alibi_slopes=alibi_slopes,
-                              alibi_batch=Z,
-                              alibi_nheads=HQ,
-                              q_descale=q_descale,
-                              k_descale=k_descale,
-                              v_descale=v_descale,
-                              p_scale=p_scale,
-                              o_scale=o_scale,
-                              bias=bias,
-                              seqlen_q=N_CTX_Q,
-                              seqlen_k=N_CTX_K)
+    input_metadata = MetaData(
+        sm_scale=D_HEAD**-0.5,
+        max_seqlens_q=N_CTX_Q,
+        max_seqlens_k=N_CTX_K,
+        layout=layout,
+        alibi_slopes=alibi_slopes,
+        alibi_batch=Z,
+        alibi_nheads=HQ,
+        q_descale=q_descale,
+        k_descale=k_descale,
+        v_descale=v_descale,
+        p_scale=p_scale,
+        o_scale=o_scale,
+        bias=bias,
+        seqlen_q=N_CTX_Q,
+        seqlen_k=N_CTX_K,
+    )
     return q, k, v, input_metadata
 
 
-def varlen_input_helper(Z,
-                        HQ,
-                        HK,
-                        N_CTX_Q,
-                        N_CTX_K,
-                        D_HEAD,
-                        dtype,
-                        equal_seqlens=False):
+def varlen_input_helper(
+    Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD, dtype, equal_seqlens=False
+):
     current_platform.seed_everything(0)
 
     # Random sequence lengths. Using N_CTX as kind of max of sum of individual
@@ -231,66 +231,72 @@ def varlen_input_helper(Z,
     if not equal_seqlens:
         max_seqlens_q = N_CTX_Q // Z
         max_seqlens_k = N_CTX_K // Z
-        seqlens_q = torch.randint(1,
-                                  max_seqlens_q + 1, (Z, ),
-                                  dtype=torch.int32)
-        seqlens_k = torch.randint(1,
-                                  max_seqlens_k + 1, (Z, ),
-                                  dtype=torch.int32)
+        seqlens_q = torch.randint(1, max_seqlens_q + 1, (Z,), dtype=torch.int32)
+        seqlens_k = torch.randint(1, max_seqlens_k + 1, (Z,), dtype=torch.int32)
     else:
-        seqlens_q = torch.full((Z, ), N_CTX_Q // Z)
-        seqlens_k = torch.full((Z, ), N_CTX_K // Z)
+        seqlens_q = torch.full((Z,), N_CTX_Q // Z)
+        seqlens_k = torch.full((Z,), N_CTX_K // Z)
 
     # Calculate cumulative sequence lengths
-    cu_seqlens_q = torch.cat([
-        torch.tensor([0], dtype=torch.int32),
-        seqlens_q.cumsum(dim=0, dtype=torch.int32)
-    ])
-    cu_seqlens_k = torch.cat([
-        torch.tensor([0], dtype=torch.int32),
-        seqlens_k.cumsum(dim=0, dtype=torch.int32)
-    ])
+    cu_seqlens_q = torch.cat(
+        [
+            torch.tensor([0], dtype=torch.int32),
+            seqlens_q.cumsum(dim=0, dtype=torch.int32),
+        ]
+    )
+    cu_seqlens_k = torch.cat(
+        [
+            torch.tensor([0], dtype=torch.int32),
+            seqlens_k.cumsum(dim=0, dtype=torch.int32),
+        ]
+    )
     cu_seqlens_q = cu_seqlens_q.to(device="cuda")
     cu_seqlens_k = cu_seqlens_k.to(device="cuda")
 
     # Initialize q, k, v with variable lengths
     total_q = cu_seqlens_q[-1].item()
     total_k = cu_seqlens_k[-1].item()
-    q = torch.randn((total_q, HQ, D_HEAD), dtype=dtype,
-                    device="cuda").normal_(mean=0., std=0.5).requires_grad_()
-    k = torch.randn((total_k, HK, D_HEAD), dtype=dtype,
-                    device="cuda").normal_(mean=0., std=0.5).requires_grad_()
-    v = torch.randn((total_k, HK, D_HEAD), dtype=dtype,
-                    device="cuda").normal_(mean=0., std=0.5).requires_grad_()
+    q = (
+        torch.randn((total_q, HQ, D_HEAD), dtype=dtype, device="cuda")
+        .normal_(mean=0.0, std=0.5)
+        .requires_grad_()
+    )
+    k = (
+        torch.randn((total_k, HK, D_HEAD), dtype=dtype, device="cuda")
+        .normal_(mean=0.0, std=0.5)
+        .requires_grad_()
+    )
+    v = (
+        torch.randn((total_k, HK, D_HEAD), dtype=dtype, device="cuda")
+        .normal_(mean=0.0, std=0.5)
+        .requires_grad_()
+    )
     sm_scale = D_HEAD**-0.5
     input_metadata = MetaData(sm_scale=sm_scale)
     input_metadata.set_varlen_params(cu_seqlens_q, cu_seqlens_k)
     return q, k, v, input_metadata
 
 
-@pytest.mark.parametrize('Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD', [
-    (1, 48, 12, 1, 1, 64),
-    (4, 4, 4, 128, 128, 65),
-    (16, 48, 48, 1, 1, 128),
-    (64, 48, 24, 3, 3, 128),
-    (4, 4, 4, 113, 123, 1),
-])
-@pytest.mark.parametrize('causal', [True, False])
-@pytest.mark.parametrize('use_alibi', [True, False])
-@pytest.mark.parametrize('layout', ['bshd'])
-def test_op_fwd(Z,
-                HQ,
-                HK,
-                N_CTX_Q,
-                N_CTX_K,
-                D_HEAD,
-                causal,
-                use_alibi,
-                layout,
-                dtype=torch.float16):
+@pytest.mark.parametrize(
+    "Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD",
+    [
+        (1, 48, 12, 1, 1, 64),
+        (4, 4, 4, 128, 128, 65),
+        (16, 48, 48, 1, 1, 128),
+        (64, 48, 24, 3, 3, 128),
+        (4, 4, 4, 113, 123, 1),
+    ],
+)
+@pytest.mark.parametrize("causal", [True, False])
+@pytest.mark.parametrize("use_alibi", [True, False])
+@pytest.mark.parametrize("layout", ["bshd"])
+def test_op_fwd(
+    Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD, causal, use_alibi, layout, dtype=torch.float16
+):
     current_platform.seed_everything(0)
-    q, k, v, input_metadata = input_helper(Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD,
-                                           dtype, layout, use_alibi, causal)
+    q, k, v, input_metadata = input_helper(
+        Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD, dtype, layout, use_alibi, causal
+    )
 
     o = torch.empty_like(q)
 
@@ -299,48 +305,50 @@ def test_op_fwd(Z,
 
     # Transpose here if layout is bshd so we have same reference code for all
     # layouts
-    if layout == 'bshd':
+    if layout == "bshd":
         q = q.transpose(1, 2).clone()
         k = k.transpose(1, 2).clone()
         v = v.transpose(1, 2).clone()
     # Replicate K and V if using MQA/GQA
     if HQ != HK:
-        k = k.view(k.shape[0], k.shape[1], -1, k.shape[2],
-                   k.shape[3]).expand(-1, -1, HQ // HK, -1,
-                                      -1).reshape(k.shape[0], -1, k.shape[2],
-                                                  k.shape[3])
-        v = v.view(v.shape[0], v.shape[1], -1, v.shape[2],
-                   v.shape[3]).expand(-1, -1, HQ // HK, -1,
-                                      -1).reshape(v.shape[0], -1, v.shape[2],
-                                                  v.shape[3])
-
-    ref_impl = ReferenceAttention(Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD,
-                                  use_alibi, dtype, input_metadata)
+        k = (
+            k.view(k.shape[0], k.shape[1], -1, k.shape[2], k.shape[3])
+            .expand(-1, -1, HQ // HK, -1, -1)
+            .reshape(k.shape[0], -1, k.shape[2], k.shape[3])
+        )
+        v = (
+            v.view(v.shape[0], v.shape[1], -1, v.shape[2], v.shape[3])
+            .expand(-1, -1, HQ // HK, -1, -1)
+            .reshape(v.shape[0], -1, v.shape[2], v.shape[3])
+        )
+
+    ref_impl = ReferenceAttention(
+        Z, HQ, HK, N_CTX_Q, N_CTX_K, D_HEAD, use_alibi, dtype, input_metadata
+    )
     ref_out = ref_impl.fwd(q, k, v)
 
     torch.testing.assert_close(ref_out, tri_out, atol=2e-2, rtol=2e-2)
 
 
-@pytest.mark.parametrize('Z, H, N_CTX_Q, N_CTX_K, D_HEAD', [
-    (4, 48, 1, 1, 64),
-    (4, 48, 1, 1, 128),
-    (4, 48, 3, 3, 128),
-    (4, 4, 128, 128, 65),
-])
-@pytest.mark.parametrize('causal', [True, False])
-@pytest.mark.parametrize('layout', ['bhsd'])
-@pytest.mark.parametrize('use_o_scale', [True, False])
-@pytest.mark.skipif(torch.cuda.get_device_capability() < (9, 0),
-                    reason="Triton FP8 requires CUDA 9.0 or higher")
-def test_op_fwd_fp8(Z,
-                    H,
-                    N_CTX_Q,
-                    N_CTX_K,
-                    D_HEAD,
-                    causal,
-                    layout,
-                    use_o_scale,
-                    dtype=torch.float32):
+@pytest.mark.parametrize(
+    "Z, H, N_CTX_Q, N_CTX_K, D_HEAD",
+    [
+        (4, 48, 1, 1, 64),
+        (4, 48, 1, 1, 128),
+        (4, 48, 3, 3, 128),
+        (4, 4, 128, 128, 65),
+    ],
+)
+@pytest.mark.parametrize("causal", [True, False])
+@pytest.mark.parametrize("layout", ["bhsd"])
+@pytest.mark.parametrize("use_o_scale", [True, False])
+@pytest.mark.skipif(
+    torch.cuda.get_device_capability() < (9, 0),
+    reason="Triton FP8 requires CUDA 9.0 or higher",
+)
+def test_op_fwd_fp8(
+    Z, H, N_CTX_Q, N_CTX_K, D_HEAD, causal, layout, use_o_scale, dtype=torch.float32
+):
     current_platform.seed_everything(0)
 
     # Disable grad to save memory it won't run into OOM on CI machine.
@@ -358,95 +366,103 @@ def test_op_fwd_fp8(Z,
         causal=causal,
         layout=layout,
         is_fp8=True,
-        use_o_scale=use_o_scale)
+        use_o_scale=use_o_scale,
+    )
 
     o = torch.empty_like(q_quantized) if use_o_scale else None
 
-    tri_out, _ = triton_attention_rocm(q_quantized, k_quantized, v_quantized,
-                                       o, input_metadata)
+    tri_out, _ = triton_attention_rocm(
+        q_quantized, k_quantized, v_quantized, o, input_metadata
+    )
 
-    ref_impl = ReferenceAttention(Z, H, H, N_CTX_Q, N_CTX_K, D_HEAD, False,
-                                  dtype, input_metadata)
+    ref_impl = ReferenceAttention(
+        Z, H, H, N_CTX_Q, N_CTX_K, D_HEAD, False, dtype, input_metadata
+    )
     ref_out = ref_impl.fwd_fp8(q_quantized, k_quantized, v_quantized)
 
     # compare
-    torch.testing.assert_close(ref_out.to(torch.float32),
-                               tri_out.to(torch.float32),
-                               atol=7e-2,
-                               rtol=2e-1)
-
-
-@pytest.mark.parametrize('Z, H, N_CTX_Q, N_CTX_K, D_HEAD', [
-    (4, 48, 1, 1, 64),
-    (4, 48, 1, 1, 128),
-    (4, 48, 3, 3, 128),
-    (4, 4, 128, 128, 65),
-    (4, 4, 113, 123, 1),
-])
-@pytest.mark.parametrize('causal', [True, False])
-@pytest.mark.parametrize('layout', ['bhsd'])
-def test_op_fwd_fp8_kv(Z,
-                       H,
-                       N_CTX_Q,
-                       N_CTX_K,
-                       D_HEAD,
-                       causal,
-                       layout,
-                       dtype=torch.float32):
+    torch.testing.assert_close(
+        ref_out.to(torch.float32), tri_out.to(torch.float32), atol=7e-2, rtol=2e-1
+    )
+
+
+@pytest.mark.parametrize(
+    "Z, H, N_CTX_Q, N_CTX_K, D_HEAD",
+    [
+        (4, 48, 1, 1, 64),
+        (4, 48, 1, 1, 128),
+        (4, 48, 3, 3, 128),
+        (4, 4, 128, 128, 65),
+        (4, 4, 113, 123, 1),
+    ],
+)
+@pytest.mark.parametrize("causal", [True, False])
+@pytest.mark.parametrize("layout", ["bhsd"])
+def test_op_fwd_fp8_kv(
+    Z, H, N_CTX_Q, N_CTX_K, D_HEAD, causal, layout, dtype=torch.float32
+):
     current_platform.seed_everything(0)
 
-    q, k_quantized, v_quantized, input_metadata = input_helper(Z,
-                                                               H,
-                                                               H,
-                                                               N_CTX_Q,
-                                                               N_CTX_K,
-                                                               D_HEAD,
-                                                               dtype,
-                                                               causal=causal,
-                                                               layout=layout,
-                                                               is_fp8=True,
-                                                               fp8_kv=True)
+    q, k_quantized, v_quantized, input_metadata = input_helper(
+        Z,
+        H,
+        H,
+        N_CTX_Q,
+        N_CTX_K,
+        D_HEAD,
+        dtype,
+        causal=causal,
+        layout=layout,
+        is_fp8=True,
+        fp8_kv=True,
+    )
 
     o = torch.empty_like(q)
 
-    tri_out, _ = triton_attention_rocm(q, k_quantized, v_quantized, o,
-                                       input_metadata)
+    tri_out, _ = triton_attention_rocm(q, k_quantized, v_quantized, o, input_metadata)
 
-    ref_impl = ReferenceAttention(Z, H, H, N_CTX_Q, N_CTX_K, D_HEAD, False,
-                                  dtype, input_metadata)
+    ref_impl = ReferenceAttention(
+        Z, H, H, N_CTX_Q, N_CTX_K, D_HEAD, False, dtype, input_metadata
+    )
     ref_out = ref_impl.fwd_fp8_kv(q, k_quantized, v_quantized)
 
     torch.testing.assert_close(ref_out, tri_out, atol=3e-2, rtol=8e-1)
 
 
-@pytest.mark.parametrize('Z, H, N_CTX_Q, N_CTX_K, D_HEAD', [
-    (4, 48, 1, 1, 64),
-    (4, 48, 1, 1, 128),
-    (4, 48, 3, 3, 128),
-    (4, 4, 128, 128, 65),
-])
-@pytest.mark.parametrize('causal', [True, False])
-@pytest.mark.parametrize('use_bias', [True])
-@pytest.mark.parametrize('dtype', [torch.bfloat16])
+@pytest.mark.parametrize(
+    "Z, H, N_CTX_Q, N_CTX_K, D_HEAD",
+    [
+        (4, 48, 1, 1, 64),
+        (4, 48, 1, 1, 128),
+        (4, 48, 3, 3, 128),
+        (4, 4, 128, 128, 65),
+    ],
+)
+@pytest.mark.parametrize("causal", [True, False])
+@pytest.mark.parametrize("use_bias", [True])
+@pytest.mark.parametrize("dtype", [torch.bfloat16])
 def test_op_fwd_bias(Z, H, N_CTX_Q, N_CTX_K, D_HEAD, causal, use_bias, dtype):
     current_platform.seed_everything(0)
-    q, k, v, input_metadata = input_helper(Z,
-                                           H,
-                                           H,
-                                           N_CTX_Q,
-                                           N_CTX_K,
-                                           D_HEAD,
-                                           dtype,
-                                           layout='bhsd',
-                                           causal=causal,
-                                           use_bias=use_bias)
+    q, k, v, input_metadata = input_helper(
+        Z,
+        H,
+        H,
+        N_CTX_Q,
+        N_CTX_K,
+        D_HEAD,
+        dtype,
+        layout="bhsd",
+        causal=causal,
+        use_bias=use_bias,
+    )
     o = torch.empty_like(q)
 
     # triton implementation
     tri_out, _ = triton_attention_rocm(q, k, v, o, input_metadata)
 
-    ref_impl = ReferenceAttention(Z, H, H, N_CTX_Q, N_CTX_K, D_HEAD, False,
-                                  dtype, input_metadata)
+    ref_impl = ReferenceAttention(
+        Z, H, H, N_CTX_Q, N_CTX_K, D_HEAD, False, dtype, input_metadata
+    )
     ref_out = ref_impl.fwd(q, k, v)
 
     # compare
@@ -454,47 +470,47 @@ def test_op_fwd_bias(Z, H, N_CTX_Q, N_CTX_K, D_HEAD, causal, use_bias, dtype):
 
 
 # NOTE: Uses thd layout, so also tests thd.
-@pytest.mark.parametrize('Z, H, N_CTX, D_HEAD', [(1, 48, 256, 64),
-                                                 (4, 48, 512, 64),
-                                                 (16, 48, 512, 64),
-                                                 (64, 48, 128, 128)])
-@pytest.mark.parametrize('causal', [True, False])
+@pytest.mark.parametrize(
+    "Z, H, N_CTX, D_HEAD",
+    [(1, 48, 256, 64), (4, 48, 512, 64), (16, 48, 512, 64), (64, 48, 128, 128)],
+)
+@pytest.mark.parametrize("causal", [True, False])
 def test_op_varlen_fwd(Z, H, N_CTX, D_HEAD, causal, dtype=torch.float16):
-
-    q, k, v, input_metadata = varlen_input_helper(Z, H, H, N_CTX, N_CTX,
-                                                  D_HEAD, dtype)
+    q, k, v, input_metadata = varlen_input_helper(Z, H, H, N_CTX, N_CTX, D_HEAD, dtype)
 
     tri_out = torch.empty_like(q)
     triton_attention_rocm(q, k, v, tri_out, input_metadata)
 
-    ref_impl = ReferenceAttention(Z, H, H, N_CTX, N_CTX, D_HEAD, False, dtype,
-                                  input_metadata)
+    ref_impl = ReferenceAttention(
+        Z, H, H, N_CTX, N_CTX, D_HEAD, False, dtype, input_metadata
+    )
     ref_out = ref_impl.varlen_fwd(q, k, v, is_mqa=False)
 
     torch.testing.assert_close(ref_out, tri_out, atol=2e-2, rtol=2e-2)
 
 
 # NOTE: Uses thd layout, so also tests thd.
-@pytest.mark.parametrize('Z, HQ, HK, N_CTX, D_HEAD', [(2, 48, 24, 128, 64),
-                                                      (4, 48, 12, 256, 64),
-                                                      (4, 48, 4, 512, 64),
-                                                      (4, 64, 16, 128, 128)])
-@pytest.mark.parametrize('causal', [False])
-def test_op_varlen_mqa_fwd(Z,
-                           HQ,
-                           HK,
-                           N_CTX,
-                           D_HEAD,
-                           causal,
-                           dtype=torch.float16):
-    q, k, v, input_metadata = varlen_input_helper(Z, HQ, HK, N_CTX, N_CTX,
-                                                  D_HEAD, dtype)
+@pytest.mark.parametrize(
+    "Z, HQ, HK, N_CTX, D_HEAD",
+    [
+        (2, 48, 24, 128, 64),
+        (4, 48, 12, 256, 64),
+        (4, 48, 4, 512, 64),
+        (4, 64, 16, 128, 128),
+    ],
+)
+@pytest.mark.parametrize("causal", [False])
+def test_op_varlen_mqa_fwd(Z, HQ, HK, N_CTX, D_HEAD, causal, dtype=torch.float16):
+    q, k, v, input_metadata = varlen_input_helper(
+        Z, HQ, HK, N_CTX, N_CTX, D_HEAD, dtype
+    )
 
     tri_out = torch.empty_like(q)
     triton_attention_rocm(q, k, v, tri_out, input_metadata)
 
-    ref_impl = ReferenceAttention(Z, HQ, HK, N_CTX, N_CTX, D_HEAD, False,
-                                  dtype, input_metadata)
+    ref_impl = ReferenceAttention(
+        Z, HQ, HK, N_CTX, N_CTX, D_HEAD, False, dtype, input_metadata
+    )
     ref_out = ref_impl.varlen_fwd(q, k, v, is_mqa=True)
 
     torch.testing.assert_close(ref_out, tri_out, atol=2e-2, rtol=2e-2)
diff --git a/tests/kernels/utils.py b/tests/kernels/utils.py
index db6f29c28c95..f3e0c2f817e2 100644
--- a/tests/kernels/utils.py
+++ b/tests/kernels/utils.py
@@ -17,10 +17,13 @@
 from vllm.attention import AttentionBackend, AttentionMetadata, AttentionType
 from vllm.attention.backends.registry import _Backend
 from vllm.model_executor.layers.activation import SiluAndMul
-from vllm.model_executor.layers.fused_moe.utils import (
-    moe_kernel_quantize_input)
-from vllm.utils import (STR_BACKEND_ENV_VAR, STR_FLASH_ATTN_VAL,
-                        STR_XFORMERS_ATTN_VAL, make_tensor_with_pad)
+from vllm.model_executor.layers.fused_moe.utils import moe_kernel_quantize_input
+from vllm.utils import (
+    STR_BACKEND_ENV_VAR,
+    STR_FLASH_ATTN_VAL,
+    STR_XFORMERS_ATTN_VAL,
+    make_tensor_with_pad,
+)
 
 # For now, disable "test_aot_dispatch_dynamic" since there are some
 # bugs related to this test in PyTorch 2.4.
@@ -39,7 +42,7 @@
 
 
 class QKVInputs(NamedTuple):
-    '''
+    """
     Data structure for representing unpacked attention inputs,
     query/key/values and their sequence lengths.
 
@@ -49,7 +52,7 @@ class QKVInputs(NamedTuple):
                              num_heads x head_size) attention inputs
         * q_seq_lens: query sequence lengths list
         * kv_seq_lens: shared key/value sequence lengths list
-    '''
+    """
 
     query: torch.Tensor
     key: torch.Tensor
@@ -59,7 +62,7 @@ class QKVInputs(NamedTuple):
 
 
 class QKVO(NamedTuple):
-    '''
+    """
     Data structure for representing unpacked attention inputs,
     alongside unpacked known-correct attention output
 
@@ -69,14 +72,14 @@ class QKVO(NamedTuple):
                              num_heads x head_size) attention inputs
         * ideal_output: unpacked (batch_size x padded_seq_len x
                         num_heads x head_size) known-correct attention output
-    '''
+    """
 
     qkv: QKVInputs
     ideal_output: torch.Tensor
 
 
 class PackedQKVInputs(NamedTuple):
-    '''
+    """
     Data structure for representing packed attention inputs
 
     Attributes:
@@ -88,7 +91,7 @@ class PackedQKVInputs(NamedTuple):
                              packed tensor
         * q_seq_lens: query sequence lengths list
         * kv_seq_lens: shared key/value sequence lengths list
-    '''
+    """
 
     query: torch.Tensor
     key: torch.Tensor
@@ -100,7 +103,7 @@ class PackedQKVInputs(NamedTuple):
 
 
 class PackedQKVO(NamedTuple):
-    '''
+    """
     Data structure for representing packed attention inputs,
     alongside packed known-correct attention output
 
@@ -110,28 +113,28 @@ class PackedQKVO(NamedTuple):
                       x head_size) attention inputs
         * ideal_output: packed (number_of_tokens x num_heads
                         x head_size) known-correct attention output
-    '''
+    """
 
     packed_qkv: Optional[PackedQKVInputs]
     ideal_output: torch.Tensor
 
 
 class KVMemoryMap(NamedTuple):
-    '''
+    """
     Data structure for encapsulating KV cache memory mapping.
 
     Attributes:
 
         * block_tables: KV cache block tables
         * slot_mapping: mapping of sequence offset to physical address
-    '''
+    """
 
     block_tables: torch.Tensor
     slot_mapping: torch.Tensor
 
 
 class PhaseTestParameters(NamedTuple):
-    '''
+    """
     Data structure for encapsulating the test parameters
     for a given test "phase" (prefill or decode phase) and attention
     scenario (encoder, decoder-self, encoder/decoder-cross)
@@ -143,7 +146,7 @@ class PhaseTestParameters(NamedTuple):
                        output
         * kv_mmap: KV cache memory mapping, specific to this test phase &
                    attention scenario
-    '''
+    """
 
     packed_qkvo: PackedQKVO
     kv_mmap: Optional[KVMemoryMap]
@@ -153,41 +156,43 @@ def maybe_make_int_tensor(
     _list: Optional[list[int]],
     device: Union[torch.device, str],
 ) -> torch.Tensor:
-    '''
+    """
     Convert Python int list to a 1D int torch.Tensor on `device`
 
     Returns:
 
     * If _list is not None: 1D int torch.Tensor on `device`
     * None otherwise
-    '''
-    return None if _list is None else torch.tensor(
-        _list, dtype=torch.int, device=device)
+    """
+    return (
+        None if _list is None else torch.tensor(_list, dtype=torch.int, device=device)
+    )
 
 
 def maybe_make_long_tensor(
     _list: Optional[list[int]],
     device: Union[torch.device, str],
 ) -> torch.Tensor:
-    '''
+    """
     Convert Python int list to a 1D long torch.Tensor on `device`
 
     Returns:
 
     * If _list is not None: 1D long torch.Tensor on `device`
     * None otherwise
-    '''
-    return None if _list is None else torch.tensor(
-        _list, dtype=torch.long, device=device)
+    """
+    return (
+        None if _list is None else torch.tensor(_list, dtype=torch.long, device=device)
+    )
 
 
 def maybe_max(_list: Optional[list]) -> Optional[Number]:
-    '''
+    """
     Returns:
 
     * If _list is not None: max(_list)
     * None otherwise
-    '''
+    """
     return None if _list is None else max(_list)
 
 
@@ -195,7 +200,7 @@ def make_causal_mask(
     q_max_seq_len: int,
     kv_max_seq_len: int,
 ) -> torch.Tensor:
-    '''
+    """
     Create a q_max_seq_len x kv_max_seq_len causal mask
 
     Arguments:
@@ -206,19 +211,19 @@ def make_causal_mask(
     Returns:
 
     * 2D tensor, q_max_seq_len x kv_max_seq_len
-    '''
+    """
 
     # Create a matrix where entry (i, j) is True if i >= j
     mask = torch.triu(torch.ones(q_max_seq_len, kv_max_seq_len), diagonal=1)
     # Replace True with float('-inf') and False with 0
-    mask = mask.masked_fill(mask == 1,
-                            float('-inf')).masked_fill(mask == 0, 0.0)
+    mask = mask.masked_fill(mask == 1, float("-inf")).masked_fill(mask == 0, 0.0)
     return mask
 
 
-def override_backend_env_variable(mpatch: pytest.MonkeyPatch,
-                                  backend_name: str) -> None:
-    '''
+def override_backend_env_variable(
+    mpatch: pytest.MonkeyPatch, backend_name: str
+) -> None:
+    """
     Override the environment variable indicating the vLLM backend temporarily,
     using pytest monkeypatch to ensure that the env vars get
     reset once the test context exits.
@@ -227,18 +232,20 @@ def override_backend_env_variable(mpatch: pytest.MonkeyPatch,
 
     * mpatch: pytest monkeypatch instance
     * backend_name: attention backend name to force
-    '''
+    """
     mpatch.setenv(STR_BACKEND_ENV_VAR, backend_name)
 
 
-def ref_masked_attention(query: torch.Tensor,
-                         key: torch.Tensor,
-                         value: torch.Tensor,
-                         scale: float,
-                         custom_mask: Optional[torch.Tensor] = None,
-                         q_seq_lens: Optional[list] = None,
-                         kv_seq_lens: Optional[list] = None) -> torch.Tensor:
-    '''
+def ref_masked_attention(
+    query: torch.Tensor,
+    key: torch.Tensor,
+    value: torch.Tensor,
+    scale: float,
+    custom_mask: Optional[torch.Tensor] = None,
+    q_seq_lens: Optional[list] = None,
+    kv_seq_lens: Optional[list] = None,
+) -> torch.Tensor:
+    """
     "Golden" masked attention reference. Supports two types of masking:
 
     * Basic attention mask, utilizing {q,kv}_seq_lens args to mask out
@@ -260,14 +267,14 @@ def ref_masked_attention(query: torch.Tensor,
     Returns:
 
     * Attention result, batch_size x q_padded_seq_len x num_heads x head_size
-    '''
+    """
 
     assert q_seq_lens is not None
     assert kv_seq_lens is not None
 
     batch_size = query.shape[0]
-    assert (len(q_seq_lens) == batch_size)
-    assert (len(kv_seq_lens) == batch_size)
+    assert len(q_seq_lens) == batch_size
+    assert len(kv_seq_lens) == batch_size
 
     attn_weights = scale * torch.einsum("bqhd,bkhd->bhqk", query, key).float()
 
@@ -303,7 +310,7 @@ def make_qkv(
     attn_type: AttentionType = AttentionType.ENCODER_DECODER,
     force_max_len: bool = False,
 ) -> tuple[QKVInputs, QKVInputs, QKVInputs]:
-    '''
+    """
     Construct QKV test tensors for self- and cross-attention.
 
     Generates three query/key/value triplets:
@@ -340,14 +347,12 @@ def make_qkv(
     * Overall QKVInputs structure (containing full unpacked Q/K/V tensors)
     * Prefill QKVInputs structure (containing all but the last sequence offset)
     * Decode QKVInputs structure (containing all only the last sequence offset)
-    '''
+    """
 
     if force_max_len:
         q_seq_lens = [max_q_seq_len for _ in range(batch_size)]
     else:
-        q_seq_lens = [
-            random.randint(2, max_q_seq_len) for _ in range(batch_size)
-        ]
+        q_seq_lens = [random.randint(2, max_q_seq_len) for _ in range(batch_size)]
     kv_seq_lens = None
     if force_kv_seq_lens is not None:
         kv_seq_lens = force_kv_seq_lens
@@ -360,50 +365,44 @@ def make_qkv(
         if force_max_len:
             kv_seq_lens = [max_kv_seq_len] * batch_size
         else:
-            kv_seq_lens = [
-                random.randint(2, max_kv_seq_len) for _ in range(batch_size)
-            ]
-
-    query = torch.rand(
-        (batch_size, max_q_seq_len, num_heads, head_size)).to(device)
-    key = torch.rand(
-        (batch_size, max_kv_seq_len, num_heads, head_size)).to(device)
-    value = torch.rand(
-        (batch_size, max_kv_seq_len, num_heads, head_size)).to(device)
-
-    prefill_query = torch.zeros(
-        (batch_size, max_q_seq_len, num_heads, head_size)).to(device)
-    prefill_key = torch.zeros(
-        (batch_size, max_kv_seq_len, num_heads, head_size)).to(device)
-    prefill_value = torch.zeros(
-        (batch_size, max_kv_seq_len, num_heads, head_size)).to(device)
-
-    decode_query = torch.zeros(
-        (batch_size, 1, num_heads, head_size)).to(device)
+            kv_seq_lens = [random.randint(2, max_kv_seq_len) for _ in range(batch_size)]
+
+    query = torch.rand((batch_size, max_q_seq_len, num_heads, head_size)).to(device)
+    key = torch.rand((batch_size, max_kv_seq_len, num_heads, head_size)).to(device)
+    value = torch.rand((batch_size, max_kv_seq_len, num_heads, head_size)).to(device)
+
+    prefill_query = torch.zeros((batch_size, max_q_seq_len, num_heads, head_size)).to(
+        device
+    )
+    prefill_key = torch.zeros((batch_size, max_kv_seq_len, num_heads, head_size)).to(
+        device
+    )
+    prefill_value = torch.zeros((batch_size, max_kv_seq_len, num_heads, head_size)).to(
+        device
+    )
+
+    decode_query = torch.zeros((batch_size, 1, num_heads, head_size)).to(device)
     decode_key = torch.zeros((batch_size, 1, num_heads, head_size)).to(device)
-    decode_value = torch.zeros(
-        (batch_size, 1, num_heads, head_size)).to(device)
+    decode_value = torch.zeros((batch_size, 1, num_heads, head_size)).to(device)
 
-    for bdx, (q_seq_len, kv_seq_len) in enumerate(zip(q_seq_lens,
-                                                      kv_seq_lens)):
+    for bdx, (q_seq_len, kv_seq_len) in enumerate(zip(q_seq_lens, kv_seq_lens)):
         query[bdx, q_seq_len:, :, :] = 0
         key[bdx, kv_seq_len:, :, :] = 0
         value[bdx, kv_seq_len:, :, :] = 0
 
-        prefill_query[bdx,
-                      0:(q_seq_len - 1), :, :] = query[bdx,
-                                                       0:(q_seq_len - 1), :, :]
-        prefill_key[bdx,
-                    0:(kv_seq_len - 1), :, :] = key[bdx,
-                                                    0:(kv_seq_len - 1), :, :]
-        prefill_value[bdx, 0:(kv_seq_len -
-                              1), :, :] = value[bdx, 0:(kv_seq_len - 1), :, :]
-
-        decode_query[bdx, :, :, :] = query[bdx,
-                                           (q_seq_len - 1):q_seq_len, :, :]
-        decode_key[bdx, :, :, :] = key[bdx, (kv_seq_len - 1):kv_seq_len, :, :]
-        decode_value[bdx, :, :, :] = value[bdx,
-                                           (kv_seq_len - 1):kv_seq_len, :, :]
+        prefill_query[bdx, 0 : (q_seq_len - 1), :, :] = query[
+            bdx, 0 : (q_seq_len - 1), :, :
+        ]
+        prefill_key[bdx, 0 : (kv_seq_len - 1), :, :] = key[
+            bdx, 0 : (kv_seq_len - 1), :, :
+        ]
+        prefill_value[bdx, 0 : (kv_seq_len - 1), :, :] = value[
+            bdx, 0 : (kv_seq_len - 1), :, :
+        ]
+
+        decode_query[bdx, :, :, :] = query[bdx, (q_seq_len - 1) : q_seq_len, :, :]
+        decode_key[bdx, :, :, :] = key[bdx, (kv_seq_len - 1) : kv_seq_len, :, :]
+        decode_value[bdx, :, :, :] = value[bdx, (kv_seq_len - 1) : kv_seq_len, :, :]
 
     prefill_q_seq_lens = [plen - 1 for plen in q_seq_lens]
     prefill_kv_seq_lens = [plen - 1 for plen in kv_seq_lens]
@@ -417,25 +416,29 @@ def make_qkv(
             key,
             value,
             q_seq_lens,
-            kv_seq_lens),
+            kv_seq_lens,
+        ),
         QKVInputs(
             prefill_query,  # Prefill subset of QKV sequences
             prefill_key,
             prefill_value,
             prefill_q_seq_lens,
-            prefill_kv_seq_lens),
+            prefill_kv_seq_lens,
+        ),
         QKVInputs(
             decode_query,  # Decode subset of KV sequences
             decode_key,
             decode_value,
             decode_q_seq_lens,
-            decode_kv_seq_lens))
+            decode_kv_seq_lens,
+        ),
+    )
 
 
 def pack_tensor(
-        unpacked_tensor: torch.Tensor, seq_lens: list[int],
-        device: Union[torch.device, str]) -> tuple[torch.Tensor, list[int]]:
-    '''
+    unpacked_tensor: torch.Tensor, seq_lens: list[int], device: Union[torch.device, str]
+) -> tuple[torch.Tensor, list[int]]:
+    """
     Pack a batch_size x padded_seq_len x num_heads x head_size tensor into an
     unpadded number_of_tokens x num_heads x head_size tensor, where
     number_of_tokens = sum(seq_lens)
@@ -451,7 +454,7 @@ def pack_tensor(
     * packed_tensor: number_of_tokens x num_heads x head_size
     * start_loc_list: start idx of each batch elt in packed_tensor; [0] +
       list(itertools.accumulate(seq_lens))
-    '''
+    """
 
     num_tok = sum(seq_lens)
     num_heads = unpacked_tensor.shape[-2]
@@ -460,16 +463,15 @@ def pack_tensor(
     packed_tensor = torch.zeros((num_tok, num_heads, head_size), device=device)
 
     for bdx, (seq_len, start_loc) in enumerate(zip(seq_lens, start_loc_list)):
-
-        packed_tensor[start_loc:(
-            start_loc + seq_len), :, :] = unpacked_tensor[bdx, :seq_len, :, :]
+        packed_tensor[start_loc : (start_loc + seq_len), :, :] = unpacked_tensor[
+            bdx, :seq_len, :, :
+        ]
 
     return packed_tensor, start_loc_list
 
 
-def pack_qkv(qkv: QKVInputs, device: Union[torch.device,
-                                           str]) -> PackedQKVInputs:
-    '''
+def pack_qkv(qkv: QKVInputs, device: Union[torch.device, str]) -> PackedQKVInputs:
+    """
     Individually pack each of Q, K and V, each with dimensions batch_size x
     padded_seq_len x num_heads x head_size, into respective number_of_tokens x
     num_heads x head_size tensors.
@@ -488,28 +490,30 @@ def pack_qkv(qkv: QKVInputs, device: Union[torch.device,
 
     * Packed (number_of_tokens x num_heads x head_size) QKV inputs
       derived from unpacked inputs
-    '''
+    """
 
     if qkv.query is None:
         packed_query = None
         q_start_loc_list = None
     else:
-        packed_query, q_start_loc_list = pack_tensor(qkv.query,
-                                                     qkv.q_seq_lens,
-                                                     device=device)
-    packed_key, kv_start_loc_list = pack_tensor(qkv.key,
-                                                qkv.kv_seq_lens,
-                                                device=device)
+        packed_query, q_start_loc_list = pack_tensor(
+            qkv.query, qkv.q_seq_lens, device=device
+        )
+    packed_key, kv_start_loc_list = pack_tensor(qkv.key, qkv.kv_seq_lens, device=device)
     packed_value, _ = pack_tensor(qkv.value, qkv.kv_seq_lens, device=device)
     return PackedQKVInputs(
-        packed_query, packed_key, packed_value, q_start_loc_list,
+        packed_query,
+        packed_key,
+        packed_value,
+        q_start_loc_list,
         kv_start_loc_list,
         (None if q_start_loc_list is None else qkv.q_seq_lens),
-        qkv.kv_seq_lens)
+        qkv.kv_seq_lens,
+    )
 
 
 def make_backend(backend_name: str) -> AttentionBackend:
-    '''
+    """
     Construct the backend instance determined by the backend_name string
     argument.
 
@@ -523,31 +527,33 @@ def make_backend(backend_name: str) -> AttentionBackend:
     Returns:
 
     * Backend instance
-    '''
+    """
     if backend_name == STR_XFORMERS_ATTN_VAL:
-        from vllm.v1.attention.backends.xformers import (
-            XFormersAttentionBackend)
+        from vllm.v1.attention.backends.xformers import XFormersAttentionBackend
+
         return XFormersAttentionBackend()
     if backend_name == STR_FLASH_ATTN_VAL:
         from vllm.v1.attention.backends.flash_attn import FlashAttentionBackend
+
         return FlashAttentionBackend()
     if backend_name == "TRITON_ATTN":
-        from vllm.v1.attention.backends.triton_attn import (
-            TritonAttentionBackend)
+        from vllm.v1.attention.backends.triton_attn import TritonAttentionBackend
+
         return TritonAttentionBackend()
     if backend_name == "FLEX_ATTENTION":
-        from vllm.v1.attention.backends.flex_attention import (
-            FlexAttentionBackend)
+        from vllm.v1.attention.backends.flex_attention import FlexAttentionBackend
+
         return FlexAttentionBackend()
     if backend_name == "TORCH_SDPA":
         from vllm.v1.attention.backends.cpu_attn import TorchSDPABackend
+
         return TorchSDPABackend()
     if backend_name == "FLASHINFER":
         from vllm.v1.attention.backends.flashinfer import FlashInferBackend
+
         return FlashInferBackend()
 
-    raise AssertionError(
-        f"Unrecognized backend_name {backend_name} for unit test")
+    raise AssertionError(f"Unrecognized backend_name {backend_name} for unit test")
 
 
 def make_alibi_bias(
@@ -565,7 +571,8 @@ def make_alibi_bias(
     attn_biases: list[Any] = []
     num_heads = alibi_slopes.shape[0]
     assert num_heads >= num_kv_heads, (
-        "ALiBi slopes expect at least as many heads as KV heads")
+        "ALiBi slopes expect at least as many heads as KV heads"
+    )
 
     for seq_len in seq_lens:
         bias = torch.arange(seq_len, dtype=dtype, device=alibi_slopes.device)
@@ -591,9 +598,17 @@ def _make_metadata_tensors(
     context_lens: Optional[list[int]],
     encoder_seq_lens: Optional[list[int]],
     device: Union[torch.device, str],
-) -> tuple[torch.Tensor, torch.Tensor, Any, Any, Optional[torch.Tensor],
-           torch.Tensor, torch.Tensor, Optional[int]]:
-    '''
+) -> tuple[
+    torch.Tensor,
+    torch.Tensor,
+    Any,
+    Any,
+    Optional[torch.Tensor],
+    torch.Tensor,
+    torch.Tensor,
+    Optional[int],
+]:
+    """
     Build scalar & tensor values required to build attention metadata structure.
 
     Arguments:
@@ -613,48 +628,61 @@ def _make_metadata_tensors(
     * encoder_seq_lens_tensor: encoder seq_lens list, as tensor
     * encoder_seq_start_loc: start idx of each encoder sequence
     * max_encoder_seq_len: encoder seq_lens list, as tensor
-    '''
+    """
     seq_lens_tensor = maybe_make_int_tensor(seq_lens, device)
     context_lens_tensor = maybe_make_int_tensor(context_lens, device)
     max_context_len = maybe_max(context_lens)
     max_seq_len = maybe_max(seq_lens)
 
     encoder_seq_lens_tensor = maybe_make_int_tensor(encoder_seq_lens, device)
-    max_encoder_seq_len = (None if encoder_seq_lens is None else
-                           max(encoder_seq_lens))
+    max_encoder_seq_len = None if encoder_seq_lens is None else max(encoder_seq_lens)
 
     seq_start_loc = None
 
     if seq_lens_tensor is not None:
-        seq_start_loc = torch.zeros(seq_lens_tensor.shape[0] + 1,
-                                    dtype=torch.int32,
-                                    device=seq_lens_tensor.device)
-        torch.cumsum(seq_lens_tensor,
-                     dim=0,
-                     dtype=seq_start_loc.dtype,
-                     out=seq_start_loc[1:])
-
-    encoder_seq_start_loc = torch.zeros(encoder_seq_lens_tensor.shape[0] + 1,
-                                        dtype=torch.int32,
-                                        device=encoder_seq_lens_tensor.device)
-    torch.cumsum(encoder_seq_lens_tensor,
-                 dim=0,
-                 dtype=encoder_seq_start_loc.dtype,
-                 out=encoder_seq_start_loc[1:])
-
-    return (seq_lens_tensor, context_lens_tensor, max_context_len, max_seq_len,
-            seq_start_loc, encoder_seq_lens_tensor, encoder_seq_start_loc,
-            max_encoder_seq_len)
-
-
-def make_kv_cache(num_blocks: int,
-                  num_heads: int,
-                  head_size: int,
-                  block_size: int,
-                  device: Union[torch.device, str],
-                  backend: str,
-                  default_val: float = 0.0) -> torch.Tensor:
-    '''
+        seq_start_loc = torch.zeros(
+            seq_lens_tensor.shape[0] + 1,
+            dtype=torch.int32,
+            device=seq_lens_tensor.device,
+        )
+        torch.cumsum(
+            seq_lens_tensor, dim=0, dtype=seq_start_loc.dtype, out=seq_start_loc[1:]
+        )
+
+    encoder_seq_start_loc = torch.zeros(
+        encoder_seq_lens_tensor.shape[0] + 1,
+        dtype=torch.int32,
+        device=encoder_seq_lens_tensor.device,
+    )
+    torch.cumsum(
+        encoder_seq_lens_tensor,
+        dim=0,
+        dtype=encoder_seq_start_loc.dtype,
+        out=encoder_seq_start_loc[1:],
+    )
+
+    return (
+        seq_lens_tensor,
+        context_lens_tensor,
+        max_context_len,
+        max_seq_len,
+        seq_start_loc,
+        encoder_seq_lens_tensor,
+        encoder_seq_start_loc,
+        max_encoder_seq_len,
+    )
+
+
+def make_kv_cache(
+    num_blocks: int,
+    num_heads: int,
+    head_size: int,
+    block_size: int,
+    device: Union[torch.device, str],
+    backend: str,
+    default_val: float = 0.0,
+) -> torch.Tensor:
+    """
     Create a fake KV cache.
 
     Arguments:
@@ -672,27 +700,29 @@ def make_kv_cache(num_blocks: int,
     *     for backend 'XFORMERS'
     * kv_cache: 2 x num_blocks x block_size x num_heads x head_size
     *     for backend 'FLASH_ATTN'
-    '''
-    if backend == 'XFORMERS':
-        kv_cache = torch.rand(
-            (2, num_blocks, block_size * num_heads * head_size)).to(device)
-    elif backend == 'FLASH_ATTN':
-        kv_cache = torch.rand(
-            (2, num_blocks, block_size, num_heads, head_size)).to(device)
+    """
+    if backend == "XFORMERS":
+        kv_cache = torch.rand((2, num_blocks, block_size * num_heads * head_size)).to(
+            device
+        )
+    elif backend == "FLASH_ATTN":
+        kv_cache = torch.rand((2, num_blocks, block_size, num_heads, head_size)).to(
+            device
+        )
     else:
         raise ValueError(
-            f"Unknown backend value: '{backend}'. Expected 'XFORMERS' or "
-            f"'FLASH_ATTN'.")
+            f"Unknown backend value: '{backend}'. Expected 'XFORMERS' or 'FLASH_ATTN'."
+        )
     if default_val is not None:
         kv_cache[:, :, :] = default_val
     return kv_cache
 
 
 def _num_tokens_to_min_blocks(num_tokens: int, block_size: int) -> int:
-    '''
+    """
     Compute the minimum number of blocks required to hold num_tokens tokens,
     given block_size
-    '''
+    """
     return (num_tokens + block_size) // block_size
 
 
@@ -704,9 +734,12 @@ def make_empty_block_tables_tensor(device: Union[torch.device, str]):
     return torch.tensor([], device=device)
 
 
-def split_slot_mapping(slot_mapping_list: torch.Tensor, seq_lens: list[int],
-                       device: Union[torch.device, str]):
-    '''
+def split_slot_mapping(
+    slot_mapping_list: torch.Tensor,
+    seq_lens: list[int],
+    device: Union[torch.device, str],
+):
+    """
     Split a slot mapping into valid prefill- and decode-phase slot mappings.
 
     Context:
@@ -744,28 +777,32 @@ def split_slot_mapping(slot_mapping_list: torch.Tensor, seq_lens: list[int],
       reflecting all N prefill prompts
     * decode_slot_mapping: Length-N 1D slot mapping (as Tensor) reflecting
       all N decoded tokens
-    '''
+    """
 
     prefill_slot_mapping = []
     decode_slot_mapping = []
 
     base_idx = 0
     for seq_len in seq_lens:
-        prefill_slot_mapping.extend(slot_mapping_list[base_idx:(base_idx +
-                                                                seq_len - 1)])
+        prefill_slot_mapping.extend(
+            slot_mapping_list[base_idx : (base_idx + seq_len - 1)]
+        )
         decode_slot_mapping.append(slot_mapping_list[base_idx + seq_len - 1])
         base_idx += seq_len
 
-    return (maybe_make_long_tensor(prefill_slot_mapping, device),
-            maybe_make_long_tensor(decode_slot_mapping, device))
+    return (
+        maybe_make_long_tensor(prefill_slot_mapping, device),
+        maybe_make_long_tensor(decode_slot_mapping, device),
+    )
 
 
 def make_block_tables_slot_mapping(
-        block_size: int,
-        seq_lens: list[int],
-        device: Union[torch.device, str],
-        block_base_addr: int = 0) -> tuple[torch.Tensor, list[int], int]:
-    '''
+    block_size: int,
+    seq_lens: list[int],
+    device: Union[torch.device, str],
+    block_base_addr: int = 0,
+) -> tuple[torch.Tensor, list[int], int]:
+    """
     Construct fake block tables & slot mappings.
 
     For a sequence with num_tokens tokens the minimum number
@@ -802,12 +839,11 @@ def make_block_tables_slot_mapping(
     * block_tables_tensor: block table for sequence
     * slot_mapping_list: slot mapping for sequence
     * max_block_idx: the highest block address within this block table
-    '''
+    """
 
     # Provision minimum number of KV cache blocks
     num_blocks_list = [
-        _num_tokens_to_min_blocks(num_tokens, block_size)
-        for num_tokens in seq_lens
+        _num_tokens_to_min_blocks(num_tokens, block_size) for num_tokens in seq_lens
     ]
     max_block_table_len = max(num_blocks_list)
     block_table_pad_tokens = 10
@@ -820,11 +856,11 @@ def make_block_tables_slot_mapping(
     max_block_idx = block_base_idx
     for sdx, num_tokens in enumerate(seq_lens):
         num_blocks = num_blocks_list[sdx]
-        block_table = list(
-            range(block_base_idx, block_base_idx - num_blocks, -1))
+        block_table = list(range(block_base_idx, block_base_idx - num_blocks, -1))
         for idx in range(num_tokens):
-            mapping_value = (
-                idx % block_size) + block_table[idx // block_size] * block_size
+            mapping_value = (idx % block_size) + block_table[
+                idx // block_size
+            ] * block_size
             slot_mapping_list.append(mapping_value)
 
         block_base_idx -= num_blocks
@@ -848,9 +884,9 @@ def make_test_metadata(
     decoder_test_params: Optional[PhaseTestParameters],
     device: Union[torch.device, str],
     encoder_test_params: Optional[PhaseTestParameters] = None,
-    cross_test_params: Optional[PhaseTestParameters] = None
+    cross_test_params: Optional[PhaseTestParameters] = None,
 ) -> AttentionMetadata:
-    '''
+    """
     Construct fake attention metadata for a given test phase
     (prefill-phase or decode-phase).
 
@@ -887,13 +923,12 @@ def make_test_metadata(
     Return:
 
     * AttentionMetadata structure
-    '''
+    """
 
     # Decoder self-attention memory mapping
     # decoder_test_params is None signals encoder-only
     # scenario, so kv_mmap is None
-    kv_mmap = (None
-               if decoder_test_params is None else decoder_test_params.kv_mmap)
+    kv_mmap = None if decoder_test_params is None else decoder_test_params.kv_mmap
 
     # This function constructs metadata assuming no chunked prefill,
     # i.e. 100% prefill tokens or 100% decode tokens
@@ -906,10 +941,11 @@ def make_test_metadata(
     # seq_lens is None signals encoder-only
     # scenario, in which case num_prefills_or_decodes and
     # num_prefill_or_decode_tokens are unused
-    num_prefills_or_decodes = (None if seq_lens is None else len(seq_lens))
+    num_prefills_or_decodes = None if seq_lens is None else len(seq_lens)
 
-    num_prefill_or_decode_tokens = (None if seq_lens is None else (
-        sum(seq_lens) if is_prompt else len(seq_lens)))
+    num_prefill_or_decode_tokens = (
+        None if seq_lens is None else (sum(seq_lens) if is_prompt else len(seq_lens))
+    )
 
     # Seems for non-prefix-caching scenarios context_lens
     # is never needed
@@ -923,8 +959,9 @@ def make_test_metadata(
         # * Extract encoder input sequence lengths
         assert encoder_test_params.packed_qkvo.packed_qkv is not None
         encoder_seq_lens = encoder_test_params.packed_qkvo.packed_qkv.q_seq_lens
-        num_encoder_tokens = (None if encoder_seq_lens is None else
-                              (sum(encoder_seq_lens)))
+        num_encoder_tokens = (
+            None if encoder_seq_lens is None else (sum(encoder_seq_lens))
+        )
 
     if cross_test_params is None:
         cross_kv_mmap = None
@@ -952,10 +989,9 @@ def make_test_metadata(
             encoder_seq_lens_tensor,
             encoder_seq_start_loc,
             max_encoder_seq_len,
-        ) = _make_metadata_tensors(seq_lens,
-                                   context_lens,
-                                   encoder_seq_lens,
-                                   device=device)
+        ) = _make_metadata_tensors(
+            seq_lens, context_lens, encoder_seq_lens, device=device
+        )
         return attn_backend_obj.make_metadata(
             num_prefills=num_prefills,
             slot_mapping=(None if kv_mmap is None else kv_mmap.slot_mapping),
@@ -975,10 +1011,13 @@ def make_test_metadata(
             encoder_seq_lens_tensor=encoder_seq_lens_tensor,
             encoder_seq_start_loc=encoder_seq_start_loc,
             max_encoder_seq_len=max_encoder_seq_len,
-            cross_slot_mapping=(None if cross_kv_mmap is None else
-                                cross_kv_mmap.slot_mapping),
-            cross_block_tables=(None if cross_kv_mmap is None else
-                                cross_kv_mmap.block_tables))
+            cross_slot_mapping=(
+                None if cross_kv_mmap is None else cross_kv_mmap.slot_mapping
+            ),
+            cross_block_tables=(
+                None if cross_kv_mmap is None else cross_kv_mmap.block_tables
+            ),
+        )
 
     else:  # not is_prompt
         # Decode-phase scenario
@@ -1000,10 +1039,9 @@ def make_test_metadata(
             encoder_seq_lens_tensor,
             encoder_seq_start_loc,
             max_encoder_seq_len,
-        ) = _make_metadata_tensors(seq_lens,
-                                   context_lens,
-                                   encoder_seq_lens,
-                                   device=device)
+        ) = _make_metadata_tensors(
+            seq_lens, context_lens, encoder_seq_lens, device=device
+        )
 
         return attn_backend_obj.make_metadata(
             num_prefills=num_prefills,
@@ -1025,16 +1063,19 @@ def make_test_metadata(
             encoder_seq_lens_tensor=encoder_seq_lens_tensor,
             encoder_seq_start_loc=encoder_seq_start_loc,
             max_encoder_seq_len=max_encoder_seq_len,
-            cross_slot_mapping=(None if cross_kv_mmap is None else
-                                cross_kv_mmap.slot_mapping),
-            cross_block_tables=(None if cross_kv_mmap is None else
-                                cross_kv_mmap.block_tables))
-
-
-def assert_actual_matches_ideal(test_params: PhaseTestParameters,
-                                output_under_test: torch.Tensor,
-                                backend: str) -> None:
-    '''
+            cross_slot_mapping=(
+                None if cross_kv_mmap is None else cross_kv_mmap.slot_mapping
+            ),
+            cross_block_tables=(
+                None if cross_kv_mmap is None else cross_kv_mmap.block_tables
+            ),
+        )
+
+
+def assert_actual_matches_ideal(
+    test_params: PhaseTestParameters, output_under_test: torch.Tensor, backend: str
+) -> None:
+    """
     Assert that observed output matches the ideal output
     contained in the test parameters data structure.
 
@@ -1042,24 +1083,24 @@ def assert_actual_matches_ideal(test_params: PhaseTestParameters,
 
     * test_params: Test parameters including packed ideal output
     * output_under_test: actually observed output value
-    '''
+    """
     ideal_output = test_params.packed_qkvo.ideal_output
-    if backend == 'XFORMERS':
-        torch.testing.assert_close(ideal_output,
-                                   output_under_test.view_as(ideal_output))
+    if backend == "XFORMERS":
+        torch.testing.assert_close(
+            ideal_output, output_under_test.view_as(ideal_output)
+        )
 
-    elif backend == 'FLASH_ATTN':
+    elif backend == "FLASH_ATTN":
         # For FlashAttention override the accuracy thresholds to non default
         # values since we notice a higher difference between the ideal and
         # actual output.
-        torch.testing.assert_close(ideal_output,
-                                   output_under_test.view_as(ideal_output),
-                                   atol=0.01,
-                                   rtol=0.016)
+        torch.testing.assert_close(
+            ideal_output, output_under_test.view_as(ideal_output), atol=0.01, rtol=0.016
+        )
     else:
         raise ValueError(
-            f"Unknown backend value: '{backend}'. Expected 'XFORMERS' or "
-            f"'FLASH_ATTN'.")
+            f"Unknown backend value: '{backend}'. Expected 'XFORMERS' or 'FLASH_ATTN'."
+        )
 
 
 # Copied/modified from torch._refs.__init__.py
@@ -1073,19 +1114,15 @@ def fp8_allclose(
     """
     Reference implementation of torch.allclose
     """
-    torch._refs._check_close_args(name="torch.allclose",
-                                  a=a,
-                                  b=b,
-                                  rtol=rtol,
-                                  atol=atol)
+    torch._refs._check_close_args(name="torch.allclose", a=a, b=b, rtol=rtol, atol=atol)
 
     return bool(
         torch.all(
-            torch.isclose(a.double(),
-                          b.double(),
-                          rtol=rtol,
-                          atol=atol,
-                          equal_nan=equal_nan)).item())
+            torch.isclose(
+                a.double(), b.double(), rtol=rtol, atol=atol, equal_nan=equal_nan
+            )
+        ).item()
+    )
 
 
 # Marlin MoE test utils
@@ -1098,7 +1135,8 @@ def stack_and_dev(tensors: list[torch.Tensor]):
 
 def compute_max_diff(output, output_ref):
     return torch.mean(torch.abs(output - output_ref)) / torch.mean(
-        torch.abs(output_ref))
+        torch.abs(output_ref)
+    )
 
 
 def torch_experts(
@@ -1120,10 +1158,11 @@ def torch_experts(
     block_shape: Optional[list[int]] = None,
     apply_router_weights_on_input: bool = False,
 ) -> torch.Tensor:
-    assert (global_num_experts == -1
-            or (global_num_experts == w1.shape[0] and expert_map is None)
-            or (expert_map is not None
-                and global_num_experts == expert_map.shape[0]))
+    assert (
+        global_num_experts == -1
+        or (global_num_experts == w1.shape[0] and expert_map is None)
+        or (expert_map is not None and global_num_experts == expert_map.shape[0])
+    )
 
     M, K = a.shape
     topk = topk_ids.shape[1]
@@ -1138,8 +1177,9 @@ def torch_experts(
 
     if a1_scale:
         assert not per_act_token_quant and block_shape is None
-    a, a_scale = moe_kernel_quantize_input(a, a1_scale, quant_dtype,
-                                           per_act_token_quant, block_shape)
+    a, a_scale = moe_kernel_quantize_input(
+        a, a1_scale, quant_dtype, per_act_token_quant, block_shape
+    )
 
     num_experts = w1.shape[0]
 
@@ -1159,31 +1199,35 @@ def torch_experts(
                 tmp2 = SiluAndMul()(tmp1)
                 out[mask] = tmp2 @ w2[i].transpose(0, 1)
                 if b_bias2 is not None:
-                    out[mask] = out[mask] + b_bias2[i].view(1, -1).to(
-                        tmp1.dtype)
+                    out[mask] = out[mask] + b_bias2[i].view(1, -1).to(tmp1.dtype)
             elif block_shape is not None:
                 # block quantized
-                assert (a_scale is not None and w1_scale is not None
-                        and w2_scale is not None)
-                tmp1 = native_w8a8_block_matmul(a[mask], w1[i], a_scale[mask],
-                                                w1_scale[i], block_shape,
-                                                out.dtype)
+                assert (
+                    a_scale is not None
+                    and w1_scale is not None
+                    and w2_scale is not None
+                )
+                tmp1 = native_w8a8_block_matmul(
+                    a[mask], w1[i], a_scale[mask], w1_scale[i], block_shape, out.dtype
+                )
                 if b_bias1 is not None:
                     tmp1 = tmp1 + b_bias1[i].view(1, -1).to(tmp1.dtype)
                 tmp2 = SiluAndMul()(tmp1)
                 tmp2, b_scale = moe_kernel_quantize_input(
-                    tmp2, a2_scale, quant_dtype, per_act_token_quant,
-                    block_shape)
+                    tmp2, a2_scale, quant_dtype, per_act_token_quant, block_shape
+                )
 
-                out[mask] = native_w8a8_block_matmul(tmp2, w2[i], b_scale,
-                                                     w2_scale[i], block_shape,
-                                                     out.dtype)
+                out[mask] = native_w8a8_block_matmul(
+                    tmp2, w2[i], b_scale, w2_scale[i], block_shape, out.dtype
+                )
                 if b_bias2 is not None:
-                    out[mask] = out[mask] + b_bias2[i].view(1, -1).to(
-                        tmp1.dtype)
+                    out[mask] = out[mask] + b_bias2[i].view(1, -1).to(tmp1.dtype)
             else:
-                assert (a_scale is not None and w1_scale is not None
-                        and w2_scale is not None)
+                assert (
+                    a_scale is not None
+                    and w1_scale is not None
+                    and w2_scale is not None
+                )
                 scales = a_scale if a_scale.numel() == 1 else a_scale[mask]
 
                 tmp1 = a[mask].to(f32) * scales
@@ -1195,37 +1239,50 @@ def torch_experts(
                 tmp2 = SiluAndMul()(tmp1).to(out.dtype)
 
                 tmp2, b_scale = moe_kernel_quantize_input(
-                    tmp2, a2_scale, quant_dtype, per_act_token_quant,
-                    block_shape)
+                    tmp2, a2_scale, quant_dtype, per_act_token_quant, block_shape
+                )
                 assert b_scale is not None
 
                 tmp2 = tmp2.to(f32) * b_scale
                 w2_dq = (w2[i].to(f32) * w2_scale[i]).transpose(0, 1)
                 out[mask] = (tmp2 @ w2_dq).to(out.dtype)
                 if b_bias2 is not None:
-                    out[mask] = out[mask] + b_bias2[i].view(1, -1).to(
-                        out.dtype)
+                    out[mask] = out[mask] + b_bias2[i].view(1, -1).to(out.dtype)
 
     if apply_router_weights_on_input:
         return out
     else:
-        return (out.view(M, -1, w2.shape[1]).to(f32) *
-                topk_weight.view(M, -1, 1)).sum(dim=1).to(out.dtype)
-
-
-def torch_moe(a: torch.Tensor,
-              w1: torch.Tensor,
-              w2: torch.Tensor,
-              score: torch.Tensor,
-              topk: int,
-              b_bias1: Optional[torch.Tensor] = None,
-              b_bias2: Optional[torch.Tensor] = None,
-              global_num_experts: int = -1,
-              expert_map: Optional[torch.Tensor] = None) -> torch.Tensor:
+        return (
+            (out.view(M, -1, w2.shape[1]).to(f32) * topk_weight.view(M, -1, 1))
+            .sum(dim=1)
+            .to(out.dtype)
+        )
+
+
+def torch_moe(
+    a: torch.Tensor,
+    w1: torch.Tensor,
+    w2: torch.Tensor,
+    score: torch.Tensor,
+    topk: int,
+    b_bias1: Optional[torch.Tensor] = None,
+    b_bias2: Optional[torch.Tensor] = None,
+    global_num_experts: int = -1,
+    expert_map: Optional[torch.Tensor] = None,
+) -> torch.Tensor:
     score = torch.softmax(score, dim=-1, dtype=torch.float32)
     topk_weight, topk_ids = torch.topk(score, topk)
-    return torch_experts(a, w1, w2, topk_weight, topk_ids, global_num_experts,
-                         b_bias1, b_bias2, expert_map)
+    return torch_experts(
+        a,
+        w1,
+        w2,
+        topk_weight,
+        topk_ids,
+        global_num_experts,
+        b_bias1,
+        b_bias2,
+        expert_map,
+    )
 
 
 def torch_moe_single(a, w, score, topk):
@@ -1244,41 +1301,49 @@ def torch_moe_single(a, w, score, topk):
 
 # A special version of op check that has a restricted default set of test_utils
 # and a patched version of allclose that supports fp8 types.
-def opcheck(op: Union[torch._ops.OpOverload, torch._ops.OpOverloadPacket,
-                      torch._library.custom_ops.CustomOpDef],
-            args: tuple[Any, ...],
-            kwargs: Optional[dict[str, Any]] = None,
-            *,
-            test_utils: Union[str, Sequence[str]] = ALL_OPCHECK_TEST_UTILS,
-            raise_exception: bool = True,
-            cond: bool = True) -> dict[str, str]:
-    with unittest.mock.patch('torch.allclose', new=fp8_allclose):
-        return torch.library.opcheck(
-            op,
-            args,
-            kwargs,
-            test_utils=test_utils,
-            raise_exception=raise_exception) if cond else {}
+def opcheck(
+    op: Union[
+        torch._ops.OpOverload,
+        torch._ops.OpOverloadPacket,
+        torch._library.custom_ops.CustomOpDef,
+    ],
+    args: tuple[Any, ...],
+    kwargs: Optional[dict[str, Any]] = None,
+    *,
+    test_utils: Union[str, Sequence[str]] = ALL_OPCHECK_TEST_UTILS,
+    raise_exception: bool = True,
+    cond: bool = True,
+) -> dict[str, str]:
+    with unittest.mock.patch("torch.allclose", new=fp8_allclose):
+        return (
+            torch.library.opcheck(
+                op, args, kwargs, test_utils=test_utils, raise_exception=raise_exception
+            )
+            if cond
+            else {}
+        )
 
 
 # For testing quantized linear kernels
 def to_fp8(tensor: torch.Tensor):
     finfo = torch.finfo(torch.float8_e4m3fn)
-    return torch.round(tensor.clamp(
-        min=finfo.min, max=finfo.max)).to(dtype=torch.float8_e4m3fn)
+    return torch.round(tensor.clamp(min=finfo.min, max=finfo.max)).to(
+        dtype=torch.float8_e4m3fn
+    )
 
 
 def to_int8(tensor: torch.Tensor):
     return torch.round(tensor.clamp(min=-128, max=127)).to(dtype=torch.int8)
 
 
-def baseline_scaled_mm(a: torch.Tensor,
-                       b: torch.Tensor,
-                       scale_a: torch.Tensor,
-                       scale_b: torch.Tensor,
-                       out_dtype: type[torch.dtype],
-                       bias: Optional[torch.Tensor] = None) -> torch.Tensor:
-
+def baseline_scaled_mm(
+    a: torch.Tensor,
+    b: torch.Tensor,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    out_dtype: type[torch.dtype],
+    bias: Optional[torch.Tensor] = None,
+) -> torch.Tensor:
     # We treat N-dimensional group scaling as extended numpy-style broadcasting
     # in numpy simply stretches dimensions with an extent of 1 to match
     # the target shape by repeating the data along that dimension (broadcasting)
@@ -1297,16 +1362,19 @@ def group_broadcast(t, shape):
         for i, s in enumerate(shape):
             if t.shape[i] != s and t.shape[i] != 1:
                 assert s % t.shape[i] == 0
-                t = t.unsqueeze(i + 1)\
-                  .expand(*t.shape[:i+1], s // t.shape[i], *t.shape[i+1:])\
-                  .flatten(i, i + 1)
+                t = (
+                    t.unsqueeze(i + 1)
+                    .expand(*t.shape[: i + 1], s // t.shape[i], *t.shape[i + 1 :])
+                    .flatten(i, i + 1)
+                )
         return t
 
     scale_a = group_broadcast(scale_a, a.shape)
     scale_b = group_broadcast(scale_b, b.shape)
 
-    output = torch.mm((scale_a * a.to(dtype=torch.float32)),
-                      (scale_b * b.to(dtype=torch.float32))).to(out_dtype)
+    output = torch.mm(
+        (scale_a * a.to(dtype=torch.float32)), (scale_b * b.to(dtype=torch.float32))
+    ).to(out_dtype)
 
     if bias is not None:
         output = output + bias
diff --git a/tests/kv_transfer/test_lookup_buffer.py b/tests/kv_transfer/test_lookup_buffer.py
index ca2f04dabfc9..a61ccef70062 100644
--- a/tests/kv_transfer/test_lookup_buffer.py
+++ b/tests/kv_transfer/test_lookup_buffer.py
@@ -8,8 +8,7 @@
 from tqdm import tqdm
 
 from vllm.config import KVTransferConfig
-from vllm.distributed.kv_transfer.kv_lookup_buffer.simple_buffer import (
-    SimpleBuffer)
+from vllm.distributed.kv_transfer.kv_lookup_buffer.simple_buffer import SimpleBuffer
 from vllm.distributed.kv_transfer.kv_pipe.pynccl_pipe import PyNcclPipe
 
 # TODO: the test depends on a lot of fields in the current implementation.
@@ -17,7 +16,6 @@
 
 
 def test_run(my_rank, buffer, device):
-
     # buffer should be empty in the beginning
     if my_rank == 0:
         assert buffer.buffer_size == 0
@@ -27,7 +25,7 @@ def test_run(my_rank, buffer, device):
 
     # insert
     tokens = torch.tensor([1, 2, 3]).to(device)
-    roi = (tokens > 0)
+    roi = tokens > 0
     if my_rank == 0:
         key = 2.0 * torch.ones([5, 6]).to(device)
         value = 3.0 * torch.ones([5, 6]).to(device)
@@ -55,7 +53,6 @@ def test_run(my_rank, buffer, device):
 
 
 def stress_test(my_rank, buf, device):
-
     torch.distributed.barrier()
     torch.manual_seed(100)
 
@@ -66,7 +63,8 @@ def stress_test(my_rank, buf, device):
             torch.rand(100).to(device),  # key
             torch.rand(100).to(device),  # value
             torch.rand(100).to(device),  # hidden
-        ) for i in tqdm(range(200))
+        )
+        for i in tqdm(range(200))
     ]
 
     random.seed(my_rank)
@@ -115,12 +113,11 @@ def stress_test(my_rank, buf, device):
 
 
 if __name__ == "__main__":
-
-    my_rank = int(os.environ['RANK'])
+    my_rank = int(os.environ["RANK"])
 
     torch.distributed.init_process_group(
-        backend='gloo',
-        init_method='tcp://localhost:12398',
+        backend="gloo",
+        init_method="tcp://localhost:12398",
         world_size=2,
         rank=my_rank,
     )
@@ -128,8 +125,8 @@ def stress_test(my_rank, buf, device):
     print(f"initialized! My rank is {my_rank}")
 
     config = KVTransferConfig(
-        kv_connector='P2pNcclConnector',
-        kv_buffer_device='cuda',
+        kv_connector="P2pNcclConnector",
+        kv_buffer_device="cuda",
         kv_buffer_size=1e9,
         kv_rank=my_rank,
         kv_role="kv_both",  # this arg doesn't matter in this test
@@ -160,4 +157,4 @@ def stress_test(my_rank, buf, device):
     buffer.close()
     data_pipe.close()
     cpu_pipe.close()
-    print('Done')
+    print("Done")
diff --git a/tests/kv_transfer/test_module.py b/tests/kv_transfer/test_module.py
index 7a04174870da..b9a28e4bceb7 100644
--- a/tests/kv_transfer/test_module.py
+++ b/tests/kv_transfer/test_module.py
@@ -9,21 +9,19 @@
 
 
 def run_python_script(script_name, timeout):
-    script_name = f'kv_transfer/{script_name}'
+    script_name = f"kv_transfer/{script_name}"
     try:
         # Start both processes asynchronously using Popen
         process0 = subprocess.Popen(
             [sys.executable, script_name],
-            env={"RANK":
-                 "0"},  # Set the RANK environment variable for process 0
+            env={"RANK": "0"},  # Set the RANK environment variable for process 0
             stdout=sys.stdout,  # Pipe stdout to current stdout
             stderr=sys.stderr,  # Pipe stderr to current stderr
         )
 
         process1 = subprocess.Popen(
             [sys.executable, script_name],
-            env={"RANK":
-                 "1"},  # Set the RANK environment variable for process 1
+            env={"RANK": "1"},  # Set the RANK environment variable for process 1
             stdout=sys.stdout,  # Pipe stdout to current stdout
             stderr=sys.stderr,  # Pipe stderr to current stderr
         )
@@ -34,11 +32,9 @@ def run_python_script(script_name, timeout):
 
         # Check the return status of both processes
         if process0.returncode != 0:
-            pytest.fail(
-                f"Test {script_name} failed for RANK=0, {process0.returncode}")
+            pytest.fail(f"Test {script_name} failed for RANK=0, {process0.returncode}")
         if process1.returncode != 0:
-            pytest.fail(
-                f"Test {script_name} failed for RANK=1, {process1.returncode}")
+            pytest.fail(f"Test {script_name} failed for RANK=1, {process1.returncode}")
 
     except subprocess.TimeoutExpired:
         # If either process times out, terminate both and fail the test
@@ -53,15 +49,14 @@ def run_python_script(script_name, timeout):
 @pytest.mark.parametrize(
     "script_name,timeout",
     [
-        ("test_lookup_buffer.py",
-         60),  # Second test case with a 60-second timeout
-        ("test_send_recv.py", 120)  # First test case with a 120-second timeout
-    ])
+        ("test_lookup_buffer.py", 60),  # Second test case with a 60-second timeout
+        ("test_send_recv.py", 120),  # First test case with a 120-second timeout
+    ],
+)
 def test_run_python_script(script_name, timeout):
     # Check the number of GPUs
     if torch.cuda.device_count() < 2:
-        pytest.skip(
-            f"Skipping test {script_name} because <2 GPUs are available")
+        pytest.skip(f"Skipping test {script_name} because <2 GPUs are available")
 
     # Run the test if there are at least 2 GPUs
     run_python_script(script_name, timeout)
diff --git a/tests/kv_transfer/test_send_recv.py b/tests/kv_transfer/test_send_recv.py
index 99ad2b43aeac..5762224eff76 100644
--- a/tests/kv_transfer/test_send_recv.py
+++ b/tests/kv_transfer/test_send_recv.py
@@ -15,7 +15,7 @@ def test_run(my_rank, pipe):
     print(f"rank {my_rank} test_run starts....")
     # test run
     x = torch.tensor([1]).to(pipe.device)
-    y = torch.tensor([[2., 3., 4., 8.]]).to(pipe.device)
+    y = torch.tensor([[2.0, 3.0, 4.0, 8.0]]).to(pipe.device)
     if my_rank == 0:
         pipe.send_tensor(x)
         print(f"rank {my_rank} sent tensor x")
@@ -53,9 +53,8 @@ def stress_test(my_rank, pipe):
     for i in tqdm(range(500)):
         mean = torch.rand(1).item() * 100
         std = torch.rand(1).item() * 100
-        size = torch.randint(900, 1000, (2, ))
-        x = torch.normal(mean * 1.0, std * 1.0,
-                         size=size.tolist()).to(pipe.device)
+        size = torch.randint(900, 1000, (2,))
+        x = torch.normal(mean * 1.0, std * 1.0, size=size.tolist()).to(pipe.device)
 
         # 5% probability of sending a None
         if torch.rand(1).item() < 0.05:
@@ -96,20 +95,16 @@ def latency_test(my_rank, pipe, nelement, ntensor):
     torch.distributed.barrier()
 
     for i in tqdm(range(500)):
-
         tensors = []
 
         if my_rank == 0:
             # create tensor
-            tensors = [
-                torch.rand(nelement).to(pipe.device) for _ in range(ntensor)
-            ]
+            tensors = [torch.rand(nelement).to(pipe.device) for _ in range(ntensor)]
 
         torch.distributed.barrier()
 
         if my_rank == 0:
-            t = torch.tensor([time.time()],
-                             dtype=torch.float64).to(pipe.device)
+            t = torch.tensor([time.time()], dtype=torch.float64).to(pipe.device)
             for tensor in tensors:
                 pipe.send_tensor(tensor)
             pipe.send_tensor(t)
@@ -121,24 +116,23 @@ def latency_test(my_rank, pipe, nelement, ntensor):
 
     torch.distributed.barrier()
 
-    print('Latency test passed.')
-    print('Latency:', torch.tensor(latencies).mean().item() * 1000, 'ms')
+    print("Latency test passed.")
+    print("Latency:", torch.tensor(latencies).mean().item() * 1000, "ms")
 
 
 if __name__ == "__main__":
-
-    my_rank = int(os.environ['RANK'])
+    my_rank = int(os.environ["RANK"])
 
     torch.distributed.init_process_group(
-        backend='gloo',
-        init_method='tcp://localhost:12398',
+        backend="gloo",
+        init_method="tcp://localhost:12398",
         world_size=2,
         rank=my_rank,
     )
 
     config = KVTransferConfig(
-        kv_connector='P2pNcclConnector',
-        kv_buffer_device='cuda',
+        kv_connector="P2pNcclConnector",
+        kv_buffer_device="cuda",
         kv_buffer_size=1e9,
         kv_rank=my_rank,
         kv_role="kv_both",  # this arg doesn't matter in this test
diff --git a/tests/lora/conftest.py b/tests/lora/conftest.py
index b539a7bf5d76..f805a74a4dba 100644
--- a/tests/lora/conftest.py
+++ b/tests/lora/conftest.py
@@ -10,12 +10,16 @@
 import torch.nn as nn
 from huggingface_hub import snapshot_download
 
-from vllm.distributed import (cleanup_dist_env_and_memory,
-                              init_distributed_environment,
-                              initialize_model_parallel)
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.distributed import (
+    cleanup_dist_env_and_memory,
+    init_distributed_environment,
+    initialize_model_parallel,
+)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
 from vllm.model_executor.models.interfaces import SupportsLoRA
@@ -47,11 +51,13 @@ def dist_init():
     if current_platform.is_cpu() or current_platform.is_tpu():
         backend = "gloo"
 
-    init_distributed_environment(world_size=1,
-                                 rank=0,
-                                 distributed_init_method=f"file://{temp_file}",
-                                 local_rank=0,
-                                 backend=backend)
+    init_distributed_environment(
+        world_size=1,
+        rank=0,
+        distributed_init_method=f"file://{temp_file}",
+        local_rank=0,
+        backend=backend,
+    )
     initialize_model_parallel(1, 1)
     yield
     cleanup_dist_env_and_memory(shutdown_ray=True)
@@ -66,10 +72,9 @@ def dist_init_torch_only():
         backend = "gloo"
 
     temp_file = tempfile.mkstemp()[1]
-    torch.distributed.init_process_group(world_size=1,
-                                         rank=0,
-                                         init_method=f"file://{temp_file}",
-                                         backend=backend)
+    torch.distributed.init_process_group(
+        world_size=1, rank=0, init_method=f"file://{temp_file}", backend=backend
+    )
 
 
 class DummyLoRAModel(nn.Sequential, SupportsLoRA):
@@ -79,24 +84,30 @@ class DummyLoRAModel(nn.Sequential, SupportsLoRA):
 @pytest.fixture
 def dummy_model() -> nn.Module:
     model = DummyLoRAModel(
-        OrderedDict([
-            ("dense1", ColumnParallelLinear(764, 100)),
-            ("dense2", RowParallelLinear(100, 50)),
-            (
-                "layer1",
-                nn.Sequential(
-                    OrderedDict([
-                        ("dense1", ColumnParallelLinear(100, 10)),
-                        ("dense2", RowParallelLinear(10, 50)),
-                    ])),
-            ),
-            ("act2", nn.ReLU()),
-            ("output", ColumnParallelLinear(50, 10)),
-            ("outact", nn.Sigmoid()),
-            # Special handling for lm_head & sampler
-            ("lm_head", ParallelLMHead(512, 10)),
-            ("logits_processor", LogitsProcessor(512)),
-        ]))
+        OrderedDict(
+            [
+                ("dense1", ColumnParallelLinear(764, 100)),
+                ("dense2", RowParallelLinear(100, 50)),
+                (
+                    "layer1",
+                    nn.Sequential(
+                        OrderedDict(
+                            [
+                                ("dense1", ColumnParallelLinear(100, 10)),
+                                ("dense2", RowParallelLinear(10, 50)),
+                            ]
+                        )
+                    ),
+                ),
+                ("act2", nn.ReLU()),
+                ("output", ColumnParallelLinear(50, 10)),
+                ("outact", nn.Sigmoid()),
+                # Special handling for lm_head & sampler
+                ("lm_head", ParallelLMHead(512, 10)),
+                ("logits_processor", LogitsProcessor(512)),
+            ]
+        )
+    )
     model.config = MagicMock()
     model.embedding_modules = {"lm_head": "lm_head"}
     model.unpadded_vocab_size = 32000
@@ -106,24 +117,30 @@ def dummy_model() -> nn.Module:
 @pytest.fixture
 def dummy_model_gate_up() -> nn.Module:
     model = DummyLoRAModel(
-        OrderedDict([
-            ("dense1", ColumnParallelLinear(764, 100)),
-            ("dense2", RowParallelLinear(100, 50)),
-            (
-                "layer1",
-                nn.Sequential(
-                    OrderedDict([
-                        ("dense1", ColumnParallelLinear(100, 10)),
-                        ("dense2", RowParallelLinear(10, 50)),
-                    ])),
-            ),
-            ("act2", nn.ReLU()),
-            ("gate_up_proj", MergedColumnParallelLinear(50, [5, 5])),
-            ("outact", nn.Sigmoid()),
-            # Special handling for lm_head & sampler
-            ("lm_head", ParallelLMHead(512, 10)),
-            ("logits_processor", LogitsProcessor(512)),
-        ]))
+        OrderedDict(
+            [
+                ("dense1", ColumnParallelLinear(764, 100)),
+                ("dense2", RowParallelLinear(100, 50)),
+                (
+                    "layer1",
+                    nn.Sequential(
+                        OrderedDict(
+                            [
+                                ("dense1", ColumnParallelLinear(100, 10)),
+                                ("dense2", RowParallelLinear(10, 50)),
+                            ]
+                        )
+                    ),
+                ),
+                ("act2", nn.ReLU()),
+                ("gate_up_proj", MergedColumnParallelLinear(50, [5, 5])),
+                ("outact", nn.Sigmoid()),
+                # Special handling for lm_head & sampler
+                ("lm_head", ParallelLMHead(512, 10)),
+                ("logits_processor", LogitsProcessor(512)),
+            ]
+        )
+    )
     model.config = MagicMock()
     model.packed_modules_mapping = {
         "gate_up_proj": [
diff --git a/tests/lora/test_add_lora.py b/tests/lora/test_add_lora.py
index 35d024575915..2f28253bce53 100644
--- a/tests/lora/test_add_lora.py
+++ b/tests/lora/test_add_lora.py
@@ -7,7 +7,8 @@
 
 from vllm.engine.arg_utils import AsyncEngineArgs
 from vllm.entrypoints.openai.api_server import (
-    build_async_engine_client_from_engine_args)
+    build_async_engine_client_from_engine_args,
+)
 from vllm.inputs import TextPrompt
 from vllm.lora.request import LoRARequest
 from vllm.sampling_params import SamplingParams
@@ -26,14 +27,10 @@ def get_lora_requests(lora_path) -> list[LoRARequest]:
     return lora_requests
 
 
-async def requests_processing_time(llm,
-                                   lora_requests: list[LoRARequest]) -> float:
-
-    sampling_params = SamplingParams(n=1,
-                                     temperature=0.0,
-                                     top_p=1.0,
-                                     ignore_eos=True,
-                                     max_tokens=1)
+async def requests_processing_time(llm, lora_requests: list[LoRARequest]) -> float:
+    sampling_params = SamplingParams(
+        n=1, temperature=0.0, top_p=1.0, ignore_eos=True, max_tokens=1
+    )
 
     generators = []
     start = time.perf_counter()
@@ -41,11 +38,11 @@ async def requests_processing_time(llm,
     for lora_request in lora_requests:
         lora_int_id = lora_request.lora_int_id
         generator = llm.generate(
-            prompt=TextPrompt(prompt=f"hello {lora_int_id}",
-                              multi_modal_data=None),  # type: ignore 
+            prompt=TextPrompt(prompt=f"hello {lora_int_id}", multi_modal_data=None),  # type: ignore
             sampling_params=sampling_params,
             lora_request=lora_request,
-            request_id=f"test{lora_int_id}")
+            request_id=f"test{lora_int_id}",
+        )
         generators.append(generator)
 
     all_gens = merge_async_iterators(*generators)
@@ -58,13 +55,13 @@ async def requests_processing_time(llm,
 
 @pytest.mark.asyncio
 async def test_add_lora(chatglm3_lora_files):
-    """ 
+    """
     The add_lora function is used to preload some LoRA adapters into the
     engine in anticipation of future requests using these adapters. To test
     this functionality, we use the async engine to process some requests - We
     do it twice, once with add_lora() preloading and once without.
 
-    We measure the request processing time in both cases and expect the time 
+    We measure the request processing time in both cases and expect the time
     to be lesser in the case with add_lora() calls.
     """
     lora_requests: list[LoRARequest] = get_lora_requests(chatglm3_lora_files)
@@ -78,18 +75,18 @@ async def test_add_lora(chatglm3_lora_files):
         max_loras=max_loras,
         max_lora_rank=LORA_RANK,
         max_model_len=128,
-        gpu_memory_utilization=0.8,  #avoid OOM
+        gpu_memory_utilization=0.8,  # avoid OOM
         trust_remote_code=True,
-        enforce_eager=True)
+        enforce_eager=True,
+    )
 
     # split lora_requests into 3 parts
     part_size = len(lora_requests) // 3
     dummy_run_requests = lora_requests[:part_size]
-    warmup_run_requests = lora_requests[part_size:part_size * 2]
-    cold_run_requests = lora_requests[part_size * 2:]
+    warmup_run_requests = lora_requests[part_size : part_size * 2]
+    cold_run_requests = lora_requests[part_size * 2 :]
 
     async with build_async_engine_client_from_engine_args(engine_args) as llm:
-
         # Dummy run - So any 1-time functionality like triton kernel compilation
         # is complete here.
         await requests_processing_time(llm, dummy_run_requests)
@@ -101,18 +98,16 @@ async def test_add_lora(chatglm3_lora_files):
         # Test that all all_lora calls are successful.
         assert all(add_lora_results)
 
-        time_with_add_lora = await requests_processing_time(
-            llm, warmup_run_requests)
+        time_with_add_lora = await requests_processing_time(llm, warmup_run_requests)
 
         # Run without any warmup
-        time_cold_start = await requests_processing_time(
-            llm, cold_run_requests)
+        time_cold_start = await requests_processing_time(llm, cold_run_requests)
 
-    print(f"time hot-start {time_with_add_lora} vs "
-          f"time cold-start {time_cold_start} ")
+    print(f"time hot-start {time_with_add_lora} vs time cold-start {time_cold_start} ")
 
     assert time_with_add_lora < time_cold_start, (
         f"time_with_add_lora={time_with_add_lora}, "
         f"time_cold_start={time_cold_start}"
         "The engine request processing time with LoRA pre-loading "
-        "must be less than the version that does on-demand LoRA loading.")
+        "must be less than the version that does on-demand LoRA loading."
+    )
diff --git a/tests/lora/test_chatglm3_tp.py b/tests/lora/test_chatglm3_tp.py
index 5cffb8cfcc26..2ae651a2cfcc 100644
--- a/tests/lora/test_chatglm3_tp.py
+++ b/tests/lora/test_chatglm3_tp.py
@@ -21,20 +21,18 @@ def do_sample(llm: vllm.LLM, lora_path: str, lora_id: int) -> list[str]:
     prompts = [
         PROMPT_TEMPLATE.format(query="How many singers do we have?"),
         PROMPT_TEMPLATE.format(
-            query=
-            "What is the average, minimum, and maximum age of all singers from France?"  # noqa: E501
+            query="What is the average, minimum, and maximum age of all singers from France?"  # noqa: E501
         ),
         PROMPT_TEMPLATE.format(
-            query=
-            "Show name, country, age for all singers ordered by age from the oldest to the youngest."  # noqa: E501
+            query="Show name, country, age for all singers ordered by age from the oldest to the youngest."  # noqa: E501
         ),
     ]
     sampling_params = vllm.SamplingParams(temperature=0, max_tokens=32)
     outputs = llm.generate(
         prompts,
         sampling_params,
-        lora_request=LoRARequest(str(lora_id), lora_id, lora_path)
-        if lora_id else None)
+        lora_request=LoRARequest(str(lora_id), lora_id, lora_path) if lora_id else None,
+    )
     # Print the outputs.
     generated_texts: list[str] = []
     for output in outputs:
@@ -47,13 +45,15 @@ def do_sample(llm: vllm.LLM, lora_path: str, lora_id: int) -> list[str]:
 
 @create_new_process_for_each_test()
 def test_chatglm3_lora(chatglm3_lora_files):
-    llm = vllm.LLM(MODEL_PATH,
-                   max_model_len=1024,
-                   enable_lora=True,
-                   max_loras=4,
-                   max_lora_rank=64,
-                   trust_remote_code=True,
-                   enable_chunked_prefill=True)
+    llm = vllm.LLM(
+        MODEL_PATH,
+        max_model_len=1024,
+        enable_lora=True,
+        max_loras=4,
+        max_lora_rank=64,
+        trust_remote_code=True,
+        enable_chunked_prefill=True,
+    )
 
     output1 = do_sample(llm, chatglm3_lora_files, lora_id=1)
     for i in range(len(EXPECTED_LORA_OUTPUT)):
@@ -66,15 +66,17 @@ def test_chatglm3_lora(chatglm3_lora_files):
 @multi_gpu_test(num_gpus=4)
 @create_new_process_for_each_test()
 def test_chatglm3_lora_tp4(chatglm3_lora_files):
-    llm = vllm.LLM(MODEL_PATH,
-                   max_model_len=1024,
-                   enable_lora=True,
-                   max_loras=4,
-                   max_lora_rank=64,
-                   tensor_parallel_size=4,
-                   trust_remote_code=True,
-                   fully_sharded_loras=False,
-                   enable_chunked_prefill=True)
+    llm = vllm.LLM(
+        MODEL_PATH,
+        max_model_len=1024,
+        enable_lora=True,
+        max_loras=4,
+        max_lora_rank=64,
+        tensor_parallel_size=4,
+        trust_remote_code=True,
+        fully_sharded_loras=False,
+        enable_chunked_prefill=True,
+    )
 
     output1 = do_sample(llm, chatglm3_lora_files, lora_id=1)
     for i in range(len(EXPECTED_LORA_OUTPUT)):
@@ -90,16 +92,18 @@ def test_chatglm3_lora_tp4_fully_sharded_loras(chatglm3_lora_files):
     # https://github.com/NVIDIA/nccl/issues/1790, set a lower value for
     # gpu_memory_utilization here because NCCL >= 2.26.3 seems to use
     # more GPU memory causing vLLM to OOM
-    llm = vllm.LLM(MODEL_PATH,
-                   max_model_len=1024,
-                   enable_lora=True,
-                   max_loras=4,
-                   max_lora_rank=64,
-                   tensor_parallel_size=4,
-                   trust_remote_code=True,
-                   fully_sharded_loras=True,
-                   enable_chunked_prefill=True,
-                   gpu_memory_utilization=0.85)
+    llm = vllm.LLM(
+        MODEL_PATH,
+        max_model_len=1024,
+        enable_lora=True,
+        max_loras=4,
+        max_lora_rank=64,
+        tensor_parallel_size=4,
+        trust_remote_code=True,
+        fully_sharded_loras=True,
+        enable_chunked_prefill=True,
+        gpu_memory_utilization=0.85,
+    )
     output1 = do_sample(llm, chatglm3_lora_files, lora_id=1)
     for i in range(len(EXPECTED_LORA_OUTPUT)):
         assert output1[i] == EXPECTED_LORA_OUTPUT[i]
diff --git a/tests/lora/test_default_mm_loras.py b/tests/lora/test_default_mm_loras.py
index f615ceda76b5..1a5b9ba3641d 100644
--- a/tests/lora/test_default_mm_loras.py
+++ b/tests/lora/test_default_mm_loras.py
@@ -32,15 +32,12 @@
     "max_lora_rank": 320,
     "max_model_len": 12800,
     "gpu_memory_utilization": 0.8,
-    "limit_mm_per_prompt": {
-        "audio": 1
-    },
+    "limit_mm_per_prompt": {"audio": 1},
     "enforce_eager": True,
 }
 
 
-def run_test(vllm_runner, audio_assets, lora_request, expected_suffix,
-             **kwargs):
+def run_test(vllm_runner, audio_assets, lora_request, expected_suffix, **kwargs):
     inputs = [([AUDIO_PROMPT], [audio_assets[0].audio_and_sample_rate[0]])]
 
     # Apply any additional kwargs as overrides to the base kwargs
@@ -53,11 +50,11 @@ def run_test(vllm_runner, audio_assets, lora_request, expected_suffix,
                 max_tokens=128,
                 audios=audios,
                 lora_request=lora_request,
-            ) for prompts, audios in inputs
+            )
+            for prompts, audios in inputs
         ]
 
-        assert vllm_outputs_with_default_lora[-1][-1][-1].endswith(
-            expected_suffix)
+        assert vllm_outputs_with_default_lora[-1][-1][-1].endswith(expected_suffix)
 
 
 def test_active_default_mm_lora(
diff --git a/tests/lora/test_layers.py b/tests/lora/test_layers.py
index ced0afc50cb9..7c29a8529838 100644
--- a/tests/lora/test_layers.py
+++ b/tests/lora/test_layers.py
@@ -12,32 +12,43 @@
 import torch.nn.functional as F
 
 from vllm.config.lora import LoRAConfig
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.lora.layers import (BaseLayerWithLoRA, ColumnParallelLinearWithLoRA,
-                              ColumnParallelLinearWithShardedLoRA,
-                              LogitsProcessorWithLoRA, LoRAMapping,
-                              MergedColumnParallelLinearWithLoRA,
-                              MergedColumnParallelLinearWithShardedLoRA,
-                              MergedQKVParallelLinearWithLoRA,
-                              MergedQKVParallelLinearWithShardedLoRA,
-                              QKVParallelLinearWithLoRA,
-                              QKVParallelLinearWithShardedLoRA,
-                              ReplicatedLinearWithLoRA,
-                              RowParallelLinearWithLoRA,
-                              RowParallelLinearWithShardedLoRA,
-                              VocabParallelEmbeddingWithLoRA)
+from vllm.lora.layers import (
+    BaseLayerWithLoRA,
+    ColumnParallelLinearWithLoRA,
+    ColumnParallelLinearWithShardedLoRA,
+    LogitsProcessorWithLoRA,
+    LoRAMapping,
+    MergedColumnParallelLinearWithLoRA,
+    MergedColumnParallelLinearWithShardedLoRA,
+    MergedQKVParallelLinearWithLoRA,
+    MergedQKVParallelLinearWithShardedLoRA,
+    QKVParallelLinearWithLoRA,
+    QKVParallelLinearWithShardedLoRA,
+    ReplicatedLinearWithLoRA,
+    RowParallelLinearWithLoRA,
+    RowParallelLinearWithShardedLoRA,
+    VocabParallelEmbeddingWithLoRA,
+)
+
 # yapf: enable
 from vllm.lora.models import LoRALayerWeights, PackedLoRALayerWeights
 from vllm.lora.punica_wrapper import get_punica_wrapper
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding, get_masked_input_and_mask)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+    get_masked_input_and_mask,
+)
 from vllm.model_executor.utils import set_random_seed
 from vllm.platforms import current_platform
 
@@ -51,11 +62,14 @@
 
 pytestmark = pytest.mark.skipif(
     not (current_platform.is_cuda_alike() or current_platform.is_cpu()),
-    reason="Backend not supported")
+    reason="Backend not supported",
+)
 
-DEVICES = ([
-    f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)
-] if current_platform.is_cuda_alike() else ["cpu"])
+DEVICES = (
+    [f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)]
+    if current_platform.is_cuda_alike()
+    else ["cpu"]
+)
 
 # prefill stage(True) or decode stage(False)
 STAGES = [True, False]
@@ -68,8 +82,8 @@
 @pytest.fixture(autouse=True)
 def clean_cache_reset_device(reset_default_device):
     # Release any memory we might be holding on to. CI runs OOMs otherwise.
-    from vllm.lora.ops.triton_ops.utils import (_LORA_A_PTR_DICT,
-                                                _LORA_B_PTR_DICT)
+    from vllm.lora.ops.triton_ops.utils import _LORA_A_PTR_DICT, _LORA_B_PTR_DICT
+
     _LORA_B_PTR_DICT.clear()
     _LORA_A_PTR_DICT.clear()
 
@@ -79,13 +93,14 @@ def clean_cache_reset_device(reset_default_device):
 @pytest.fixture(autouse=True)
 def skip_cuda_with_stage_false(request):
     """
-    On cuda-like platforms, we use the same kernels for prefill and decode 
+    On cuda-like platforms, we use the same kernels for prefill and decode
     stage, and 'stage' is generally ignored, so we only need to test once.
     """
     if current_platform.is_cuda_alike():
         try:
             if hasattr(request.node, "callspec") and hasattr(
-                    request.node.callspec, "params"):
+                request.node.callspec, "params"
+            ):
                 params = request.node.callspec.params
                 if "stage" in params and params["stage"] is False:
                     pytest.skip("Skip test when stage=False")
@@ -94,9 +109,9 @@ def skip_cuda_with_stage_false(request):
     yield
 
 
-def get_random_id_to_index(num_loras: int,
-                           num_slots: int,
-                           log: bool = True) -> list[Optional[int]]:
+def get_random_id_to_index(
+    num_loras: int, num_slots: int, log: bool = True
+) -> list[Optional[int]]:
     """Creates a random lora_id_to_index mapping.
 
     Args:
@@ -109,7 +124,8 @@ def get_random_id_to_index(num_loras: int,
     if num_loras > num_slots:
         raise ValueError(
             f"num_loras is higher than num_slots: {num_loras} > {num_slots}. "
-            "num_loras must be less than or equal to num_slots.")
+            "num_loras must be less than or equal to num_slots."
+        )
 
     slots: list[Optional[int]] = [None] * num_slots
     random_slot_selections = (torch.randperm(num_slots)[:num_loras]).tolist()
@@ -158,19 +174,18 @@ def populate_loras(
             subloras: list[LoRALayerWeights] = []
             sublora_len = layer_weights.shape[0] // repeats
             for i in range(repeats):
-                sublora = DummyLoRAManager(
-                    layer_weights.device).init_random_lora(
-                        module_name=f"fake_{i}",
-                        weight=layer_weights,
-                        generate_embeddings_tensor=generate_embeddings_tensor,
-                    )
-                sublora.lora_b = sublora.lora_b[(sublora_len *
-                                                 i):(sublora_len * (i + 1)), :]
+                sublora = DummyLoRAManager(layer_weights.device).init_random_lora(
+                    module_name=f"fake_{i}",
+                    weight=layer_weights,
+                    generate_embeddings_tensor=generate_embeddings_tensor,
+                )
+                sublora.lora_b = sublora.lora_b[
+                    (sublora_len * i) : (sublora_len * (i + 1)), :
+                ]
                 sublora.optimize()
                 subloras.append(sublora)
 
-            lora = PackedLoRALayerWeights.pack(
-                subloras) if repeats > 1 else subloras[0]
+            lora = PackedLoRALayerWeights.pack(subloras) if repeats > 1 else subloras[0]
 
             layer.set_lora(
                 slot_idx,
@@ -191,7 +206,7 @@ def create_random_inputs(
     input_size: tuple[int, ...],
     input_range: tuple[float, float],
     input_type: torch.dtype = torch.int,
-    device: torch.device = "cuda"
+    device: torch.device = "cuda",
 ) -> tuple[list[torch.Tensor], list[int], list[int]]:
     """Creates random inputs.
 
@@ -213,14 +228,15 @@ def create_random_inputs(
     for _ in range(num_inputs):
         if input_type == torch.int:
             inputs.append(
-                torch.randint(low=int(low),
-                              high=int(high),
-                              size=input_size,
-                              device=device))
+                torch.randint(
+                    low=int(low), high=int(high), size=input_size, device=device
+                )
+            )
         else:
             inputs.append(
-                torch.rand(size=input_size, dtype=input_type, device=device) *
-                high + low)
+                torch.rand(size=input_size, dtype=input_type, device=device) * high
+                + low
+            )
 
         lora_id = random.choice(active_lora_ids)
         index_mapping += [lora_id] * input_size[0]
@@ -258,9 +274,9 @@ def test_embeddings(dist_init, num_loras, device, vocab_size, stage) -> None:
     max_loras = 8
     punica_wrapper = get_punica_wrapper(8192, 256, device, max_loras=max_loras)
     assert check_punica_wrapper(punica_wrapper)
-    lora_config = LoRAConfig(max_loras=max_loras,
-                             max_lora_rank=8,
-                             lora_dtype=torch.float16)
+    lora_config = LoRAConfig(
+        max_loras=max_loras, max_lora_rank=8, lora_dtype=torch.float16
+    )
 
     def create_random_embedding_layer():
         embedding = VocabParallelEmbedding(vocab_size, 256)
@@ -286,15 +302,18 @@ def create_random_embedding_layer():
         inputs, index_mapping, prompt_mapping = create_random_inputs(
             active_lora_ids=list(lora_dict.keys()),
             num_inputs=num_loras * 3,
-            input_size=(200, ),
+            input_size=(200,),
             input_range=(1, vocab_size),
-            device=device)
-        lora_mapping = LoRAMapping(index_mapping,
-                                   prompt_mapping,
-                                   is_prefill=stage)
-        punica_wrapper.update_metadata(lora_mapping, id_to_index, max_loras,
-                                       vocab_size,
-                                       lora_config.lora_extra_vocab_size)
+            device=device,
+        )
+        lora_mapping = LoRAMapping(index_mapping, prompt_mapping, is_prefill=stage)
+        punica_wrapper.update_metadata(
+            lora_mapping,
+            id_to_index,
+            max_loras,
+            vocab_size,
+            lora_config.lora_extra_vocab_size,
+        )
 
         lora_result = lora_embedding(torch.cat(inputs))
 
@@ -306,15 +325,12 @@ def create_random_embedding_layer():
                 input_,
                 lora.lora_a.T,
             )
-            result += (after_a @ lora.lora_b.T)
+            result += after_a @ lora.lora_b.T
             expected_results.append(result)
         expected_result = torch.cat(expected_results)
 
         rtol, atol = TOLERANCES[lora_result.dtype]
-        torch.testing.assert_close(lora_result,
-                                   expected_result,
-                                   rtol=rtol,
-                                   atol=atol)
+        torch.testing.assert_close(lora_result, expected_result, rtol=rtol, atol=atol)
 
         # Check that resetting the lora weights succeeds
 
@@ -324,24 +340,24 @@ def create_random_embedding_layer():
         inputs, index_mapping, prompt_mapping = create_random_inputs(
             active_lora_ids=[0],
             num_inputs=num_loras * 3,
-            input_size=(200, ),
+            input_size=(200,),
             input_range=(1, vocab_size),
-            device=device)
-        lora_mapping = LoRAMapping(index_mapping,
-                                   prompt_mapping,
-                                   is_prefill=stage)
-        punica_wrapper.update_metadata(lora_mapping, id_to_index, max_loras,
-                                       vocab_size,
-                                       lora_config.lora_extra_vocab_size)
+            device=device,
+        )
+        lora_mapping = LoRAMapping(index_mapping, prompt_mapping, is_prefill=stage)
+        punica_wrapper.update_metadata(
+            lora_mapping,
+            id_to_index,
+            max_loras,
+            vocab_size,
+            lora_config.lora_extra_vocab_size,
+        )
 
         lora_result = lora_embedding(torch.cat(inputs))
         expected_result = embedding(torch.cat(inputs))
 
         rtol, atol = TOLERANCES[lora_result.dtype]
-        torch.testing.assert_close(lora_result,
-                                   expected_result,
-                                   rtol=rtol,
-                                   atol=atol)
+        torch.testing.assert_close(lora_result, expected_result, rtol=rtol, atol=atol)
 
 
 @torch.inference_mode()
@@ -351,9 +367,9 @@ def create_random_embedding_layer():
 @pytest.mark.parametrize("device", DEVICES)
 @pytest.mark.parametrize("vocab_size", [512, 32000, 64000, 128000])
 @pytest.mark.parametrize("stage", STAGES)
-def test_embeddings_with_new_embeddings(dist_init, num_loras, device,
-                                        vocab_size, stage) -> None:
-
+def test_embeddings_with_new_embeddings(
+    dist_init, num_loras, device, vocab_size, stage
+) -> None:
     if current_platform.is_cuda_alike():
         torch.cuda.set_device(device)
 
@@ -361,9 +377,9 @@ def test_embeddings_with_new_embeddings(dist_init, num_loras, device,
     max_loras = 8
     punica_wrapper = get_punica_wrapper(8192, 256, device, max_loras=max_loras)
     assert check_punica_wrapper(punica_wrapper)
-    lora_config = LoRAConfig(max_loras=max_loras,
-                             max_lora_rank=8,
-                             lora_dtype=torch.float16)
+    lora_config = LoRAConfig(
+        max_loras=max_loras, max_lora_rank=8, lora_dtype=torch.float16
+    )
 
     def create_random_embedding_layer():
         embedding = VocabParallelEmbedding(vocab_size, 256)
@@ -373,12 +389,12 @@ def create_random_embedding_layer():
         expanded_embedding = VocabParallelEmbedding(
             vocab_size + lora_config.lora_extra_vocab_size * max_loras,
             256,
-            org_num_embeddings=vocab_size)
+            org_num_embeddings=vocab_size,
+        )
         expanded_embedding.weight.data[:vocab_size, :] = embedding_data
         # We need to deepcopy the embedding as it will be modified
         # in place
-        lora_embedding = VocabParallelEmbeddingWithLoRA(
-            deepcopy(expanded_embedding))
+        lora_embedding = VocabParallelEmbeddingWithLoRA(deepcopy(expanded_embedding))
         lora_embedding.create_lora_weights(max_loras, lora_config)
 
         return expanded_embedding, lora_embedding
@@ -392,7 +408,8 @@ def create_random_embedding_layer():
             id_to_index,
             layer=lora_embedding,
             layer_weights=torch.zeros(
-                (256, vocab_size + lora_config.lora_extra_vocab_size)),
+                (256, vocab_size + lora_config.lora_extra_vocab_size)
+            ),
             generate_embeddings_tensor=256,
         )
 
@@ -410,52 +427,53 @@ def create_random_embedding_layer():
         inputs, index_mapping, prompt_mapping = create_random_inputs(
             active_lora_ids=list(lora_dict.keys()),
             num_inputs=num_loras * 3,
-            input_size=(200, ),
+            input_size=(200,),
             input_range=(1, vocab_size),
-            device=device)
-        lora_mapping = LoRAMapping(index_mapping,
-                                   prompt_mapping,
-                                   is_prefill=stage)
-        punica_wrapper.update_metadata(lora_mapping, id_to_index, max_loras,
-                                       vocab_size,
-                                       lora_config.lora_extra_vocab_size)
+            device=device,
+        )
+        lora_mapping = LoRAMapping(index_mapping, prompt_mapping, is_prefill=stage)
+        punica_wrapper.update_metadata(
+            lora_mapping,
+            id_to_index,
+            max_loras,
+            vocab_size,
+            lora_config.lora_extra_vocab_size,
+        )
         original_inputs = deepcopy(inputs)
 
         # Force some of the inputs to be in the extended embeddings range
         # to guarantee that their behavior is tested.
-        for input_, original_input_, lora_id in zip(inputs, original_inputs,
-                                                    prompt_mapping):
+        for input_, original_input_, lora_id in zip(
+            inputs, original_inputs, prompt_mapping
+        ):
             embedding_id = lora_id - 1
             input_[-1] = vocab_size + (embedding_id * embeddings_tensor_len)
             original_input_[-1] = vocab_size
-            input_[-2] = vocab_size + (
-                (embedding_id + 1) * embeddings_tensor_len - 1)
+            input_[-2] = vocab_size + ((embedding_id + 1) * embeddings_tensor_len - 1)
             original_input_[-2] = vocab_size + embeddings_tensor_len - 1
 
-        expanded_embedding.weight[vocab_size:vocab_size +
-                                  (embeddings_tensor_len *
-                                   max_loras)] = torch.cat(embeddings_tensors)
+        expanded_embedding.weight[
+            vocab_size : vocab_size + (embeddings_tensor_len * max_loras)
+        ] = torch.cat(embeddings_tensors)
 
         lora_result = lora_embedding(torch.cat(original_inputs))
 
         expected_results: list[torch.Tensor] = []
-        for input_, original_input_, lora_id in zip(inputs, original_inputs,
-                                                    prompt_mapping):
+        for input_, original_input_, lora_id in zip(
+            inputs, original_inputs, prompt_mapping
+        ):
             lora = lora_dict[lora_id]
             result = expanded_embedding(input_)
             after_a = F.embedding(
                 original_input_,
                 lora.lora_a.T,
             )
-            result += (after_a @ lora.lora_b.T)
+            result += after_a @ lora.lora_b.T
             expected_results.append(result)
         expected_result = torch.cat(expected_results)
 
         rtol, atol = TOLERANCES[lora_result.dtype]
-        torch.testing.assert_close(lora_result,
-                                   expected_result,
-                                   rtol=rtol,
-                                   atol=atol)
+        torch.testing.assert_close(lora_result, expected_result, rtol=rtol, atol=atol)
 
         # Check that resetting the lora weights succeeds
 
@@ -465,24 +483,24 @@ def create_random_embedding_layer():
         inputs, index_mapping, prompt_mapping = create_random_inputs(
             active_lora_ids=[0],
             num_inputs=num_loras * 3,
-            input_size=(200, ),
+            input_size=(200,),
             input_range=(1, vocab_size),
-            device=device)
+            device=device,
+        )
         original_inputs = deepcopy(inputs)
-        lora_mapping = LoRAMapping(index_mapping,
-                                   prompt_mapping,
-                                   is_prefill=stage)
-        punica_wrapper.update_metadata(lora_mapping, id_to_index, max_loras,
-                                       vocab_size,
-                                       lora_config.lora_extra_vocab_size)
+        lora_mapping = LoRAMapping(index_mapping, prompt_mapping, is_prefill=stage)
+        punica_wrapper.update_metadata(
+            lora_mapping,
+            id_to_index,
+            max_loras,
+            vocab_size,
+            lora_config.lora_extra_vocab_size,
+        )
         lora_result = lora_embedding(torch.cat(original_inputs))
         expected_result = expanded_embedding(torch.cat(inputs))
 
         rtol, atol = TOLERANCES[lora_result.dtype]
-        torch.testing.assert_close(lora_result,
-                                   expected_result,
-                                   rtol=rtol,
-                                   atol=atol)
+        torch.testing.assert_close(lora_result, expected_result, rtol=rtol, atol=atol)
 
 
 @torch.inference_mode()
@@ -490,9 +508,9 @@ def create_random_embedding_layer():
 @pytest.mark.parametrize("device", DEVICES)
 @pytest.mark.parametrize("vocab_size", [512, 32000, 64000, 256512])
 @pytest.mark.parametrize("stage", STAGES)
-def test_lm_head_logits_processor(dist_init, num_loras, device, vocab_size,
-                                  stage) -> None:
-
+def test_lm_head_logits_processor(
+    dist_init, num_loras, device, vocab_size, stage
+) -> None:
     if current_platform.is_cuda_alike():
         torch.cuda.set_device(device)
 
@@ -500,22 +518,25 @@ def test_lm_head_logits_processor(dist_init, num_loras, device, vocab_size,
     max_loras = 8
     punica_wrapper = get_punica_wrapper(8192, 256, device, max_loras=max_loras)
     assert check_punica_wrapper(punica_wrapper)
-    lora_config = LoRAConfig(max_loras=max_loras,
-                             max_lora_rank=8,
-                             lora_dtype=torch.float16)
+    lora_config = LoRAConfig(
+        max_loras=max_loras, max_lora_rank=8, lora_dtype=torch.float16
+    )
 
     def _pretest():
-        linear = ParallelLMHead(vocab_size + lora_config.lora_extra_vocab_size,
-                                1024,
-                                vocab_size,
-                                params_dtype=torch.float16)
+        linear = ParallelLMHead(
+            vocab_size + lora_config.lora_extra_vocab_size,
+            1024,
+            vocab_size,
+            params_dtype=torch.float16,
+        )
         linear.weight.data = torch.rand_like(linear.weight.data)
         linear.weight.data[:, vocab_size:] = 0
         logits_processor = LogitsProcessor(
-            vocab_size + lora_config.lora_extra_vocab_size, vocab_size)
+            vocab_size + lora_config.lora_extra_vocab_size, vocab_size
+        )
         lora_logits_processor = LogitsProcessorWithLoRA(
-            logits_processor, 1024, linear.weight.dtype, linear.weight.device,
-            None)
+            logits_processor, 1024, linear.weight.dtype, linear.weight.device, None
+        )
         lora_logits_processor.create_lora_weights(max_loras, lora_config)
 
         return linear, logits_processor, lora_logits_processor
@@ -542,10 +563,9 @@ def _pretest():
             input_size=(1, 1024),
             input_range=(0, 1),
             input_type=torch.float16,
-            device=device)
-        lora_mapping = LoRAMapping(index_mapping,
-                                   prompt_mapping,
-                                   is_prefill=stage)
+            device=device,
+        )
+        lora_mapping = LoRAMapping(index_mapping, prompt_mapping, is_prefill=stage)
         punica_wrapper.update_metadata(
             lora_mapping,
             id_to_index,
@@ -556,25 +576,24 @@ def _pretest():
         input_ = torch.rand(20, 1024)
 
         lora_result = lora_logits_processor._get_logits(
-            hidden_states=torch.cat(inputs),
-            lm_head=linear,
-            embedding_bias=None)
+            hidden_states=torch.cat(inputs), lm_head=linear, embedding_bias=None
+        )
 
         original_lm_head = deepcopy(linear)
 
-        linear.weight[logits_processor.
-                      org_vocab_size:logits_processor.org_vocab_size +
-                      embeddings_tensor_len] = embeddings_tensor
+        linear.weight[
+            logits_processor.org_vocab_size : logits_processor.org_vocab_size
+            + embeddings_tensor_len
+        ] = embeddings_tensor
 
-        logits_processor.org_vocab_size = (vocab_size +
-                                           lora_config.lora_extra_vocab_size)
+        logits_processor.org_vocab_size = vocab_size + lora_config.lora_extra_vocab_size
         expected_results: list[torch.Tensor] = []
         for input_, lora_id in zip(inputs, prompt_mapping):
             lora = lora_dict[lora_id]
-            result = logits_processor._get_logits(hidden_states=input_,
-                                                  lm_head=linear,
-                                                  embedding_bias=None)
-            result[:, vocab_size + embeddings_tensor_len:] = float("-inf")
+            result = logits_processor._get_logits(
+                hidden_states=input_, lm_head=linear, embedding_bias=None
+            )
+            result[:, vocab_size + embeddings_tensor_len :] = float("-inf")
             result += input_ @ lora.lora_a.T @ lora.lora_b.T * lora.scaling
             expected_results.append(result)
         expected_result = torch.cat(expected_results)
@@ -591,10 +610,9 @@ def _pretest():
             input_size=(1, 1024),
             input_range=(0, 1),
             input_type=torch.float16,
-            device=device)
-        lora_mapping = LoRAMapping(index_mapping,
-                                   prompt_mapping,
-                                   is_prefill=stage)
+            device=device,
+        )
+        lora_mapping = LoRAMapping(index_mapping, prompt_mapping, is_prefill=stage)
         punica_wrapper.update_metadata(
             lora_mapping,
             id_to_index,
@@ -606,17 +624,16 @@ def _pretest():
         lora_result = lora_logits_processor._get_logits(
             hidden_states=torch.cat(inputs),
             lm_head=original_lm_head,
-            embedding_bias=None)[:, :vocab_size]
+            embedding_bias=None,
+        )[:, :vocab_size]
         expected_result = logits_processor._get_logits(
             hidden_states=torch.cat(inputs),
             lm_head=original_lm_head,
-            embedding_bias=None)
+            embedding_bias=None,
+        )
 
         rtol, atol = TOLERANCES[lora_result.dtype]
-        torch.testing.assert_close(lora_result,
-                                   expected_result,
-                                   rtol=rtol,
-                                   atol=atol)
+        torch.testing.assert_close(lora_result, expected_result, rtol=rtol, atol=atol)
 
 
 @torch.inference_mode()
@@ -629,7 +646,6 @@ def test_linear_replicated(
     device,
     stage,
 ) -> None:
-
     if current_platform.is_cuda_alike():
         torch.cuda.set_device(device)
 
@@ -644,17 +660,17 @@ def test_linear_replicated(
     )
 
     def create_random_linear_replicated_layer():
-
-        linear = ReplicatedLinear(4096,
-                                  4096,
-                                  bias=False,
-                                  params_dtype=torch.float16)
+        linear = ReplicatedLinear(4096, 4096, bias=False, params_dtype=torch.float16)
         linear.weight.data = torch.rand_like(linear.weight.data)
         lora_linear = ReplicatedLinearWithLoRA(linear)
 
         lora_linear.create_lora_weights(max_loras, lora_config)
-        assert (lora_linear.n_slices == len(lora_linear.lora_a_stacked) == len(
-            lora_linear.lora_b_stacked) == 1)
+        assert (
+            lora_linear.n_slices
+            == len(lora_linear.lora_a_stacked)
+            == len(lora_linear.lora_b_stacked)
+            == 1
+        )
         return linear, lora_linear
 
     for i in range(NUM_RANDOM_SEEDS):
@@ -676,10 +692,9 @@ def create_random_linear_replicated_layer():
             input_size=(1, 4096),
             input_range=(0, 1),
             input_type=torch.float16,
-            device=device)
-        lora_mapping = LoRAMapping(index_mapping,
-                                   prompt_mapping,
-                                   is_prefill=stage)
+            device=device,
+        )
+        lora_mapping = LoRAMapping(index_mapping, prompt_mapping, is_prefill=stage)
         punica_wrapper.update_metadata(
             lora_mapping,
             id_to_index,
@@ -692,7 +707,6 @@ def create_random_linear_replicated_layer():
 
         expected_results: list[torch.Tensor] = []
         for input_, lora_id in zip(inputs, prompt_mapping):
-
             lora = lora_dict[lora_id]
             result = linear(input_)[0]
             result += input_ @ lora.lora_a.T @ lora.lora_b.T * lora.scaling
@@ -700,10 +714,7 @@ def create_random_linear_replicated_layer():
         expected_result = torch.cat(expected_results)
 
         rtol, atol = TOLERANCES[lora_result.dtype]
-        torch.testing.assert_close(lora_result,
-                                   expected_result,
-                                   rtol=rtol,
-                                   atol=atol)
+        torch.testing.assert_close(lora_result, expected_result, rtol=rtol, atol=atol)
 
         # Check that resetting the lora weights succeeds
 
@@ -716,22 +727,19 @@ def create_random_linear_replicated_layer():
             input_size=(1, 4096),
             input_range=(0, 1),
             input_type=torch.float16,
-            device=device)
-        lora_mapping = LoRAMapping(index_mapping,
-                                   prompt_mapping,
-                                   is_prefill=stage)
+            device=device,
+        )
+        lora_mapping = LoRAMapping(index_mapping, prompt_mapping, is_prefill=stage)
 
-        punica_wrapper.update_metadata(lora_mapping, id_to_index, max_loras,
-                                       512, lora_config.lora_extra_vocab_size)
+        punica_wrapper.update_metadata(
+            lora_mapping, id_to_index, max_loras, 512, lora_config.lora_extra_vocab_size
+        )
 
         lora_result = lora_linear(torch.cat(inputs))[0]
         expected_result = linear(torch.cat(inputs))[0]
 
         rtol, atol = TOLERANCES[lora_result.dtype]
-        torch.testing.assert_close(lora_result,
-                                   expected_result,
-                                   rtol=rtol,
-                                   atol=atol)
+        torch.testing.assert_close(lora_result, expected_result, rtol=rtol, atol=atol)
 
 
 @torch.inference_mode()
@@ -740,9 +748,9 @@ def create_random_linear_replicated_layer():
 @pytest.mark.parametrize("fully_shard", [True, False])
 @pytest.mark.parametrize("device", DEVICES)
 @pytest.mark.parametrize("stage", STAGES)
-def test_linear_parallel(dist_init, num_loras, orientation, fully_shard,
-                         device, stage) -> None:
-
+def test_linear_parallel(
+    dist_init, num_loras, orientation, fully_shard, device, stage
+) -> None:
     if current_platform.is_cuda_alike():
         torch.cuda.set_device(device)
 
@@ -759,25 +767,32 @@ def test_linear_parallel(dist_init, num_loras, orientation, fully_shard,
 
     def create_random_linear_parallel_layer():
         if orientation == "row":
-            linear = RowParallelLinear(4096,
-                                       4096,
-                                       bias=False,
-                                       params_dtype=torch.float16)
+            linear = RowParallelLinear(
+                4096, 4096, bias=False, params_dtype=torch.float16
+            )
             linear.weight.data = torch.rand_like(linear.weight.data)
-            lora_linear = (RowParallelLinearWithLoRA(linear) if not fully_shard
-                           else RowParallelLinearWithShardedLoRA(linear))
+            lora_linear = (
+                RowParallelLinearWithLoRA(linear)
+                if not fully_shard
+                else RowParallelLinearWithShardedLoRA(linear)
+            )
         else:
-            linear = ColumnParallelLinear(4096,
-                                          4096,
-                                          bias=False,
-                                          params_dtype=torch.float16)
+            linear = ColumnParallelLinear(
+                4096, 4096, bias=False, params_dtype=torch.float16
+            )
             linear.weight.data = torch.rand_like(linear.weight.data)
-            lora_linear = (ColumnParallelLinearWithLoRA(linear)
-                           if not fully_shard else
-                           ColumnParallelLinearWithShardedLoRA(linear))
+            lora_linear = (
+                ColumnParallelLinearWithLoRA(linear)
+                if not fully_shard
+                else ColumnParallelLinearWithShardedLoRA(linear)
+            )
         lora_linear.create_lora_weights(max_loras, lora_config)
-        assert (lora_linear.n_slices == len(lora_linear.lora_a_stacked) == len(
-            lora_linear.lora_b_stacked) == 1)
+        assert (
+            lora_linear.n_slices
+            == len(lora_linear.lora_a_stacked)
+            == len(lora_linear.lora_b_stacked)
+            == 1
+        )
 
         return linear, lora_linear
 
@@ -800,10 +815,9 @@ def create_random_linear_parallel_layer():
             input_size=(1, 4096),
             input_range=(0, 1),
             input_type=torch.float16,
-            device=device)
-        lora_mapping = LoRAMapping(index_mapping,
-                                   prompt_mapping,
-                                   is_prefill=stage)
+            device=device,
+        )
+        lora_mapping = LoRAMapping(index_mapping, prompt_mapping, is_prefill=stage)
         punica_wrapper.update_metadata(
             lora_mapping,
             id_to_index,
@@ -823,10 +837,7 @@ def create_random_linear_parallel_layer():
         expected_result = torch.cat(expected_results)
 
         rtol, atol = TOLERANCES[lora_result.dtype]
-        torch.testing.assert_close(lora_result,
-                                   expected_result,
-                                   rtol=rtol,
-                                   atol=atol)
+        torch.testing.assert_close(lora_result, expected_result, rtol=rtol, atol=atol)
 
         # Check that resetting the lora weights succeeds
 
@@ -839,22 +850,19 @@ def create_random_linear_parallel_layer():
             input_size=(1, 4096),
             input_range=(0, 1),
             input_type=torch.float16,
-            device=device)
-        lora_mapping = LoRAMapping(index_mapping,
-                                   prompt_mapping,
-                                   is_prefill=stage)
+            device=device,
+        )
+        lora_mapping = LoRAMapping(index_mapping, prompt_mapping, is_prefill=stage)
 
-        punica_wrapper.update_metadata(lora_mapping, id_to_index, max_loras,
-                                       512, lora_config.lora_extra_vocab_size)
+        punica_wrapper.update_metadata(
+            lora_mapping, id_to_index, max_loras, 512, lora_config.lora_extra_vocab_size
+        )
 
         lora_result = lora_linear(torch.cat(inputs))[0]
         expected_result = linear(torch.cat(inputs))[0]
 
         rtol, atol = TOLERANCES[lora_result.dtype]
-        torch.testing.assert_close(lora_result,
-                                   expected_result,
-                                   rtol=rtol,
-                                   atol=atol)
+        torch.testing.assert_close(lora_result, expected_result, rtol=rtol, atol=atol)
 
 
 @torch.inference_mode()
@@ -863,9 +871,9 @@ def create_random_linear_parallel_layer():
 @pytest.mark.parametrize("fully_shard", [True, False])
 @pytest.mark.parametrize("device", DEVICES)
 @pytest.mark.parametrize("stage", STAGES)
-def test_column_parallel_packed(dist_init, num_loras, repeats, fully_shard,
-                                device, stage) -> None:
-
+def test_column_parallel_packed(
+    dist_init, num_loras, repeats, fully_shard, device, stage
+) -> None:
     if current_platform.is_cuda_alike():
         torch.cuda.set_device(device)
 
@@ -882,33 +890,35 @@ def test_column_parallel_packed(dist_init, num_loras, repeats, fully_shard,
 
     def create_column_parallel_packed_layer():
         if repeats == 2:
-            linear = MergedColumnParallelLinear(4096, [4096] * repeats,
-                                                bias=False,
-                                                params_dtype=torch.float16)
+            linear = MergedColumnParallelLinear(
+                4096, [4096] * repeats, bias=False, params_dtype=torch.float16
+            )
             linear.weight.data = torch.rand_like(linear.weight.data)
-            lora_linear = (MergedColumnParallelLinearWithLoRA(linear)
-                           if not fully_shard else
-                           MergedColumnParallelLinearWithShardedLoRA(linear))
+            lora_linear = (
+                MergedColumnParallelLinearWithLoRA(linear)
+                if not fully_shard
+                else MergedColumnParallelLinearWithShardedLoRA(linear)
+            )
         elif repeats == 3:
-            linear = QKVParallelLinear(4096,
-                                       64,
-                                       32,
-                                       bias=False,
-                                       params_dtype=torch.float16)
+            linear = QKVParallelLinear(
+                4096, 64, 32, bias=False, params_dtype=torch.float16
+            )
             linear.weight.data = torch.rand_like(linear.weight.data)
-            lora_linear = (MergedQKVParallelLinearWithLoRA(linear)
-                           if not fully_shard else
-                           MergedQKVParallelLinearWithShardedLoRA(linear))
+            lora_linear = (
+                MergedQKVParallelLinearWithLoRA(linear)
+                if not fully_shard
+                else MergedQKVParallelLinearWithShardedLoRA(linear)
+            )
         else:
-            linear = QKVParallelLinear(4096,
-                                       64,
-                                       32,
-                                       bias=False,
-                                       params_dtype=torch.float16)
+            linear = QKVParallelLinear(
+                4096, 64, 32, bias=False, params_dtype=torch.float16
+            )
             linear.weight.data = torch.rand_like(linear.weight.data)
-            lora_linear = QKVParallelLinearWithLoRA(
-                linear
-            ) if not fully_shard else QKVParallelLinearWithShardedLoRA(linear)
+            lora_linear = (
+                QKVParallelLinearWithLoRA(linear)
+                if not fully_shard
+                else QKVParallelLinearWithShardedLoRA(linear)
+            )
 
         @dataclass
         class FakeConfig:
@@ -917,11 +927,15 @@ class FakeConfig:
             num_attention_heads = 32
 
         n_slices = repeats
-        lora_linear.create_lora_weights(max_loras,
-                                        lora_config,
-                                        model_config=FakeConfig())
-        assert (lora_linear.n_slices == len(lora_linear.lora_a_stacked) == len(
-            lora_linear.lora_b_stacked) == n_slices)
+        lora_linear.create_lora_weights(
+            max_loras, lora_config, model_config=FakeConfig()
+        )
+        assert (
+            lora_linear.n_slices
+            == len(lora_linear.lora_a_stacked)
+            == len(lora_linear.lora_b_stacked)
+            == n_slices
+        )
 
         return linear, lora_linear
 
@@ -946,10 +960,9 @@ class FakeConfig:
             input_size=(1, 4096),
             input_range=(0, 1),
             input_type=torch.float16,
-            device=device)
-        lora_mapping = LoRAMapping(index_mapping,
-                                   prompt_mapping,
-                                   is_prefill=stage)
+            device=device,
+        )
+        lora_mapping = LoRAMapping(index_mapping, prompt_mapping, is_prefill=stage)
 
         punica_wrapper.update_metadata(
             lora_mapping,
@@ -966,18 +979,14 @@ class FakeConfig:
             result = linear(input_)[0]
             subloras = sublora_dict[lora_id]
             for i, sublora in enumerate(subloras):
-                result[:, sublora.lora_b.shape[0] * i:sublora.lora_b.shape[0] *
-                       (i + 1)] += (
-                           input_ @ sublora.lora_a.T @ sublora.lora_b.T *
-                           sublora.scaling)
+                result[
+                    :, sublora.lora_b.shape[0] * i : sublora.lora_b.shape[0] * (i + 1)
+                ] += input_ @ sublora.lora_a.T @ sublora.lora_b.T * sublora.scaling
             expected_results.append(result)
         expected_result = torch.cat(expected_results)
 
         rtol, atol = TOLERANCES[lora_result.dtype]
-        torch.testing.assert_close(lora_result,
-                                   expected_result,
-                                   rtol=rtol,
-                                   atol=atol)
+        torch.testing.assert_close(lora_result, expected_result, rtol=rtol, atol=atol)
 
         for slot_idx in range(max_loras):
             lora_linear.reset_lora(slot_idx)
@@ -988,10 +997,9 @@ class FakeConfig:
             input_size=(1, 4096),
             input_range=(0, 1),
             input_type=torch.float16,
-            device=device)
-        lora_mapping = LoRAMapping(index_mapping,
-                                   prompt_mapping,
-                                   is_prefill=stage)
+            device=device,
+        )
+        lora_mapping = LoRAMapping(index_mapping, prompt_mapping, is_prefill=stage)
 
         punica_wrapper.update_metadata(
             lora_mapping,
@@ -1005,15 +1013,13 @@ class FakeConfig:
         expected_result = linear(torch.cat(inputs))[0]
 
         rtol, atol = TOLERANCES[lora_result.dtype]
-        torch.testing.assert_close(lora_result,
-                                   expected_result,
-                                   rtol=rtol,
-                                   atol=atol)
+        torch.testing.assert_close(lora_result, expected_result, rtol=rtol, atol=atol)
 
 
 @pytest.mark.parametrize("tp_size", [1, 2, 4, 8])
 @pytest.mark.parametrize(
-    "seed", list(range(VOCAB_PARALLEL_EMBEDDING_TEST_NUM_RANDOM_SEEDS)))
+    "seed", list(range(VOCAB_PARALLEL_EMBEDDING_TEST_NUM_RANDOM_SEEDS))
+)
 def test_vocab_parallel_embedding_indices(tp_size, seed):
     random.seed(seed)
     vocab_size = random.randint(4000, 64000)
@@ -1031,20 +1037,24 @@ def test_vocab_parallel_embedding_indices(tp_size, seed):
     token_ids: list[int] = []
 
     for tp_rank in range(tp_size):
-        with patch(
+        with (
+            patch(
                 "vllm.model_executor.layers.vocab_parallel_embedding.get_tensor_model_parallel_rank",
-                return_value=tp_rank
-        ), patch(
+                return_value=tp_rank,
+            ),
+            patch(
                 "vllm.model_executor.layers.vocab_parallel_embedding.get_tensor_model_parallel_world_size",
-                return_value=tp_size):
+                return_value=tp_size,
+            ),
+        ):
             vocab_embedding = VocabParallelEmbedding(
-                vocab_size, 1, org_num_embeddings=org_vocab_size)
+                vocab_size, 1, org_num_embeddings=org_vocab_size
+            )
         vocab_size_padded = vocab_embedding.num_embeddings_padded
         shard_indices = vocab_embedding.shard_indices
         # Assert that the ranges are contiguous
         assert shard_indices.org_vocab_start_index == last_org_vocab_end_index
-        assert (shard_indices.added_vocab_start_index ==
-                last_added_vocab_end_index)
+        assert shard_indices.added_vocab_start_index == last_added_vocab_end_index
 
         # Ensure that we are not exceeding the vocab size
         computed_vocab_size += shard_indices.num_elements_padded
@@ -1053,22 +1063,39 @@ def test_vocab_parallel_embedding_indices(tp_size, seed):
 
         # Ensure that the ranges are not overlapping
         all_org_tokens.extend(
-            range(shard_indices.org_vocab_start_index,
-                  shard_indices.org_vocab_end_index))
+            range(
+                shard_indices.org_vocab_start_index, shard_indices.org_vocab_end_index
+            )
+        )
         all_added_tokens.extend(
-            range(shard_indices.added_vocab_start_index,
-                  shard_indices.added_vocab_end_index))
+            range(
+                shard_indices.added_vocab_start_index,
+                shard_indices.added_vocab_end_index,
+            )
+        )
 
         token_ids.extend(
-            range(shard_indices.org_vocab_start_index,
-                  shard_indices.org_vocab_end_index))
-        token_ids.extend([-1] * (shard_indices.num_org_elements_padded -
-                                 shard_indices.num_org_elements))
+            range(
+                shard_indices.org_vocab_start_index, shard_indices.org_vocab_end_index
+            )
+        )
+        token_ids.extend(
+            [-1]
+            * (shard_indices.num_org_elements_padded - shard_indices.num_org_elements)
+        )
+        token_ids.extend(
+            range(
+                shard_indices.added_vocab_start_index,
+                shard_indices.added_vocab_end_index,
+            )
+        )
         token_ids.extend(
-            range(shard_indices.added_vocab_start_index,
-                  shard_indices.added_vocab_end_index))
-        token_ids.extend([-1] * (shard_indices.num_added_elements_padded -
-                                 shard_indices.num_added_elements))
+            [-1]
+            * (
+                shard_indices.num_added_elements_padded
+                - shard_indices.num_added_elements
+            )
+        )
 
         last_org_vocab_end_index = shard_indices.org_vocab_end_index
         last_added_vocab_end_index = shard_indices.added_vocab_end_index
@@ -1096,130 +1123,165 @@ def test_get_masked_input_and_mask():
     x = torch.tensor([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])
 
     # base tp 1 case, no padding
-    modified_x, _ = get_masked_input_and_mask(x,
-                                              org_vocab_start_index=0,
-                                              org_vocab_end_index=8,
-                                              added_vocab_start_index=8,
-                                              added_vocab_end_index=12,
-                                              num_org_vocab_padding=0)
+    modified_x, _ = get_masked_input_and_mask(
+        x,
+        org_vocab_start_index=0,
+        org_vocab_end_index=8,
+        added_vocab_start_index=8,
+        added_vocab_end_index=12,
+        num_org_vocab_padding=0,
+    )
     assert torch.equal(x, modified_x)
 
     # tp 2 case, no padding
-    modified_x_rank_0, _ = get_masked_input_and_mask(x,
-                                                     org_vocab_start_index=0,
-                                                     org_vocab_end_index=4,
-                                                     added_vocab_start_index=8,
-                                                     added_vocab_end_index=10,
-                                                     num_org_vocab_padding=0)
+    modified_x_rank_0, _ = get_masked_input_and_mask(
+        x,
+        org_vocab_start_index=0,
+        org_vocab_end_index=4,
+        added_vocab_start_index=8,
+        added_vocab_end_index=10,
+        num_org_vocab_padding=0,
+    )
     modified_x_rank_1, _ = get_masked_input_and_mask(
         x,
         org_vocab_start_index=4,
         org_vocab_end_index=8,
         added_vocab_start_index=10,
         added_vocab_end_index=12,
-        num_org_vocab_padding=0)
-    assert torch.equal(modified_x_rank_0,
-                       torch.tensor([0, 1, 2, 3, 0, 0, 0, 0, 4, 5, 0, 0]))
-    assert torch.equal(modified_x_rank_1,
-                       torch.tensor([0, 0, 0, 0, 0, 1, 2, 3, 0, 0, 4, 5]))
+        num_org_vocab_padding=0,
+    )
+    assert torch.equal(
+        modified_x_rank_0, torch.tensor([0, 1, 2, 3, 0, 0, 0, 0, 4, 5, 0, 0])
+    )
+    assert torch.equal(
+        modified_x_rank_1, torch.tensor([0, 0, 0, 0, 0, 1, 2, 3, 0, 0, 4, 5])
+    )
 
     # tp 4 case, no padding
-    modified_x_rank_0, _ = get_masked_input_and_mask(x,
-                                                     org_vocab_start_index=0,
-                                                     org_vocab_end_index=2,
-                                                     added_vocab_start_index=8,
-                                                     added_vocab_end_index=9,
-                                                     num_org_vocab_padding=0)
-    modified_x_rank_1, _ = get_masked_input_and_mask(x,
-                                                     org_vocab_start_index=2,
-                                                     org_vocab_end_index=4,
-                                                     added_vocab_start_index=9,
-                                                     added_vocab_end_index=10,
-                                                     num_org_vocab_padding=0)
+    modified_x_rank_0, _ = get_masked_input_and_mask(
+        x,
+        org_vocab_start_index=0,
+        org_vocab_end_index=2,
+        added_vocab_start_index=8,
+        added_vocab_end_index=9,
+        num_org_vocab_padding=0,
+    )
+    modified_x_rank_1, _ = get_masked_input_and_mask(
+        x,
+        org_vocab_start_index=2,
+        org_vocab_end_index=4,
+        added_vocab_start_index=9,
+        added_vocab_end_index=10,
+        num_org_vocab_padding=0,
+    )
     modified_x_rank_2, _ = get_masked_input_and_mask(
         x,
         org_vocab_start_index=4,
         org_vocab_end_index=6,
         added_vocab_start_index=10,
         added_vocab_end_index=11,
-        num_org_vocab_padding=0)
+        num_org_vocab_padding=0,
+    )
     modified_x_rank_3, _ = get_masked_input_and_mask(
         x,
         org_vocab_start_index=6,
         org_vocab_end_index=8,
         added_vocab_start_index=11,
         added_vocab_end_index=12,
-        num_org_vocab_padding=0)
-    assert torch.equal(modified_x_rank_0,
-                       torch.tensor([0, 1, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0]))
-    assert torch.equal(modified_x_rank_1,
-                       torch.tensor([0, 0, 0, 1, 0, 0, 0, 0, 0, 2, 0, 0]))
-    assert torch.equal(modified_x_rank_2,
-                       torch.tensor([0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 2, 0]))
-    assert torch.equal(modified_x_rank_3,
-                       torch.tensor([0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 2]))
+        num_org_vocab_padding=0,
+    )
+    assert torch.equal(
+        modified_x_rank_0, torch.tensor([0, 1, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0])
+    )
+    assert torch.equal(
+        modified_x_rank_1, torch.tensor([0, 0, 0, 1, 0, 0, 0, 0, 0, 2, 0, 0])
+    )
+    assert torch.equal(
+        modified_x_rank_2, torch.tensor([0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 2, 0])
+    )
+    assert torch.equal(
+        modified_x_rank_3, torch.tensor([0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 2])
+    )
 
     # base tp 1 case, with padding
-    modified_x, _ = get_masked_input_and_mask(x,
-                                              org_vocab_start_index=0,
-                                              org_vocab_end_index=8,
-                                              added_vocab_start_index=8,
-                                              added_vocab_end_index=12,
-                                              num_org_vocab_padding=2)
-    assert torch.equal(modified_x,
-                       torch.tensor([0, 1, 2, 3, 4, 5, 6, 7, 10, 11, 12, 13]))
+    modified_x, _ = get_masked_input_and_mask(
+        x,
+        org_vocab_start_index=0,
+        org_vocab_end_index=8,
+        added_vocab_start_index=8,
+        added_vocab_end_index=12,
+        num_org_vocab_padding=2,
+    )
+    assert torch.equal(
+        modified_x, torch.tensor([0, 1, 2, 3, 4, 5, 6, 7, 10, 11, 12, 13])
+    )
 
     # tp 2 case, with padding
-    modified_x_rank_0, _ = get_masked_input_and_mask(x,
-                                                     org_vocab_start_index=0,
-                                                     org_vocab_end_index=4,
-                                                     added_vocab_start_index=8,
-                                                     added_vocab_end_index=10,
-                                                     num_org_vocab_padding=2)
+    modified_x_rank_0, _ = get_masked_input_and_mask(
+        x,
+        org_vocab_start_index=0,
+        org_vocab_end_index=4,
+        added_vocab_start_index=8,
+        added_vocab_end_index=10,
+        num_org_vocab_padding=2,
+    )
     modified_x_rank_1, _ = get_masked_input_and_mask(
         x,
         org_vocab_start_index=4,
         org_vocab_end_index=8,
         added_vocab_start_index=10,
         added_vocab_end_index=12,
-        num_org_vocab_padding=2)
-    assert torch.equal(modified_x_rank_0,
-                       torch.tensor([0, 1, 2, 3, 0, 0, 0, 0, 6, 7, 0, 0]))
-    assert torch.equal(modified_x_rank_1,
-                       torch.tensor([0, 0, 0, 0, 0, 1, 2, 3, 0, 0, 6, 7]))
+        num_org_vocab_padding=2,
+    )
+    assert torch.equal(
+        modified_x_rank_0, torch.tensor([0, 1, 2, 3, 0, 0, 0, 0, 6, 7, 0, 0])
+    )
+    assert torch.equal(
+        modified_x_rank_1, torch.tensor([0, 0, 0, 0, 0, 1, 2, 3, 0, 0, 6, 7])
+    )
 
     # tp 4 case, with padding
-    modified_x_rank_0, _ = get_masked_input_and_mask(x,
-                                                     org_vocab_start_index=0,
-                                                     org_vocab_end_index=2,
-                                                     added_vocab_start_index=8,
-                                                     added_vocab_end_index=9,
-                                                     num_org_vocab_padding=2)
-    modified_x_rank_1, _ = get_masked_input_and_mask(x,
-                                                     org_vocab_start_index=2,
-                                                     org_vocab_end_index=4,
-                                                     added_vocab_start_index=9,
-                                                     added_vocab_end_index=10,
-                                                     num_org_vocab_padding=2)
+    modified_x_rank_0, _ = get_masked_input_and_mask(
+        x,
+        org_vocab_start_index=0,
+        org_vocab_end_index=2,
+        added_vocab_start_index=8,
+        added_vocab_end_index=9,
+        num_org_vocab_padding=2,
+    )
+    modified_x_rank_1, _ = get_masked_input_and_mask(
+        x,
+        org_vocab_start_index=2,
+        org_vocab_end_index=4,
+        added_vocab_start_index=9,
+        added_vocab_end_index=10,
+        num_org_vocab_padding=2,
+    )
     modified_x_rank_2, _ = get_masked_input_and_mask(
         x,
         org_vocab_start_index=4,
         org_vocab_end_index=6,
         added_vocab_start_index=10,
         added_vocab_end_index=11,
-        num_org_vocab_padding=2)
+        num_org_vocab_padding=2,
+    )
     modified_x_rank_3, _ = get_masked_input_and_mask(
         x,
         org_vocab_start_index=6,
         org_vocab_end_index=8,
         added_vocab_start_index=11,
         added_vocab_end_index=12,
-        num_org_vocab_padding=2)
-    assert torch.equal(modified_x_rank_0,
-                       torch.tensor([0, 1, 0, 0, 0, 0, 0, 0, 4, 0, 0, 0]))
-    assert torch.equal(modified_x_rank_1,
-                       torch.tensor([0, 0, 0, 1, 0, 0, 0, 0, 0, 4, 0, 0]))
-    assert torch.equal(modified_x_rank_2,
-                       torch.tensor([0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 4, 0]))
-    assert torch.equal(modified_x_rank_3,
-                       torch.tensor([0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 4]))
+        num_org_vocab_padding=2,
+    )
+    assert torch.equal(
+        modified_x_rank_0, torch.tensor([0, 1, 0, 0, 0, 0, 0, 0, 4, 0, 0, 0])
+    )
+    assert torch.equal(
+        modified_x_rank_1, torch.tensor([0, 0, 0, 1, 0, 0, 0, 0, 0, 4, 0, 0])
+    )
+    assert torch.equal(
+        modified_x_rank_2, torch.tensor([0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 4, 0])
+    )
+    assert torch.equal(
+        modified_x_rank_3, torch.tensor([0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 4])
+    )
diff --git a/tests/lora/test_llama_tp.py b/tests/lora/test_llama_tp.py
index a6770e6d32af..1aea3986d537 100644
--- a/tests/lora/test_llama_tp.py
+++ b/tests/lora/test_llama_tp.py
@@ -19,27 +19,28 @@
     "  SELECT one_mora FROM table_name_95 WHERE gloss = 'low tone mora with a gloss of /˩okiru/' [òkìɽɯ́] AND accented_mora = 'low tone mora with a gloss of /˩okiru/' [òkìɽɯ́] ",  # noqa: E501
     "  SELECT sex FROM people WHERE people_id IN (SELECT people_id FROM candidate GROUP BY sex ORDER BY COUNT(people_id) DESC LIMIT 1) ",  # noqa: E501
     "  SELECT pick FROM table_name_60 WHERE former_wnba_team = 'Minnesota Lynx' ",  # noqa: E501
-    "  SELECT womens_doubles FROM table_28138035_4 WHERE mens_singles = 'Werner Schlager' "  # noqa: E501
+    "  SELECT womens_doubles FROM table_28138035_4 WHERE mens_singles = 'Werner Schlager' ",  # noqa: E501
 ]
 
 
-def do_sample(llm: vllm.LLM,
-              lora_path: str,
-              lora_id: int,
-              tensorizer_config_dict: Union[dict, None] = None) -> list[str]:
+def do_sample(
+    llm: vllm.LLM,
+    lora_path: str,
+    lora_id: int,
+    tensorizer_config_dict: Union[dict, None] = None,
+) -> list[str]:
     prompts = [
         "[user] Write a SQL query to answer the question based on the table schema.\n\n context: CREATE TABLE table_name_74 (icao VARCHAR, airport VARCHAR)\n\n question: Name the ICAO for lilongwe international airport [/user] [assistant]",  # noqa: E501
         "[user] Write a SQL query to answer the question based on the table schema.\n\n context: CREATE TABLE table_name_11 (nationality VARCHAR, elector VARCHAR)\n\n question: When Anchero Pantaleone was the elector what is under nationality? [/user] [assistant]",  # noqa: E501
         "[user] Write a SQL query to answer the question based on the table schema.\n\n context: CREATE TABLE table_name_95 (one_mora VARCHAR, gloss VARCHAR, accented_mora VARCHAR)\n\n question: What is the one mora for a low tone mora with a gloss of /˩okiru/ [òkìɽɯ́]? [/user] [assistant]",  # noqa: E501
         "[user] Write a SQL query to answer the question based on the table schema.\n\n context: CREATE TABLE candidate (people_id VARCHAR, unsure_rate INTEGER); CREATE TABLE people (sex VARCHAR, people_id VARCHAR)\n\n question: which gender got the highest average uncertain ratio. [/user] [assistant]",  # noqa: E501
         "[user] Write a SQL query to answer the question based on the table schema.\n\n context: CREATE TABLE table_name_60 (pick INTEGER, former_wnba_team VARCHAR)\n\n question: What pick was a player that previously played for the Minnesota Lynx? [/user] [assistant]",  # noqa: E501
-        "[user] Write a SQL query to answer the question based on the table schema.\n\n context: CREATE TABLE table_28138035_4 (womens_doubles VARCHAR, mens_singles VARCHAR)\n\n question: Name the women's doubles for werner schlager [/user] [assistant]"  # noqa: E501
+        "[user] Write a SQL query to answer the question based on the table schema.\n\n context: CREATE TABLE table_28138035_4 (womens_doubles VARCHAR, mens_singles VARCHAR)\n\n question: Name the women's doubles for werner schlager [/user] [assistant]",  # noqa: E501
     ]
 
-    sampling_params = vllm.SamplingParams(temperature=0,
-                                          max_tokens=256,
-                                          skip_special_tokens=False,
-                                          stop=["[/assistant]"])
+    sampling_params = vllm.SamplingParams(
+        temperature=0, max_tokens=256, skip_special_tokens=False, stop=["[/assistant]"]
+    )
 
     if tensorizer_config_dict is not None:
         outputs = llm.generate(
@@ -49,14 +50,19 @@ def do_sample(llm: vllm.LLM,
                 str(lora_id),
                 lora_id,
                 lora_path,
-                tensorizer_config_dict=tensorizer_config_dict)
-            if lora_id else None)
+                tensorizer_config_dict=tensorizer_config_dict,
+            )
+            if lora_id
+            else None,
+        )
     else:
         outputs = llm.generate(
             prompts,
             sampling_params,
             lora_request=LoRARequest(str(lora_id), lora_id, lora_path)
-            if lora_id else None)
+            if lora_id
+            else None,
+        )
     # Print the outputs.
     generated_texts: list[str] = []
     for output in outputs:
@@ -67,42 +73,51 @@ def do_sample(llm: vllm.LLM,
     return generated_texts
 
 
-def generate_and_test(llm,
-                      sql_lora_files,
-                      tensorizer_config_dict: Union[dict, None] = None):
+def generate_and_test(
+    llm, sql_lora_files, tensorizer_config_dict: Union[dict, None] = None
+):
     print("lora adapter created")
     print("lora 1")
-    assert do_sample(llm,
-                     sql_lora_files,
-                     tensorizer_config_dict=tensorizer_config_dict,
-                     lora_id=1) == EXPECTED_LORA_OUTPUT
+    assert (
+        do_sample(
+            llm,
+            sql_lora_files,
+            tensorizer_config_dict=tensorizer_config_dict,
+            lora_id=1,
+        )
+        == EXPECTED_LORA_OUTPUT
+    )
 
     print("lora 2")
-    assert do_sample(llm,
-                     sql_lora_files,
-                     tensorizer_config_dict=tensorizer_config_dict,
-                     lora_id=2) == EXPECTED_LORA_OUTPUT
+    assert (
+        do_sample(
+            llm,
+            sql_lora_files,
+            tensorizer_config_dict=tensorizer_config_dict,
+            lora_id=2,
+        )
+        == EXPECTED_LORA_OUTPUT
+    )
 
     print("removing lora")
 
 
 @create_new_process_for_each_test()
 def test_llama_lora(sql_lora_files):
-
     llm = vllm.LLM(
         MODEL_PATH,
         tokenizer=sql_lora_files,
         enable_lora=True,
         # also test odd max_num_seqs
         max_num_seqs=13,
-        max_loras=4)
+        max_loras=4,
+    )
     generate_and_test(llm, sql_lora_files)
 
 
 @multi_gpu_test(num_gpus=4)
 @create_new_process_for_each_test()
 def test_llama_lora_tp4(sql_lora_files):
-
     llm = vllm.LLM(
         MODEL_PATH,
         tokenizer=sql_lora_files,
@@ -117,7 +132,6 @@ def test_llama_lora_tp4(sql_lora_files):
 @multi_gpu_test(num_gpus=4)
 @create_new_process_for_each_test()
 def test_llama_lora_tp4_fully_sharded_loras(sql_lora_files):
-
     llm = vllm.LLM(
         MODEL_PATH,
         tokenizer=sql_lora_files,
@@ -132,9 +146,9 @@ def test_llama_lora_tp4_fully_sharded_loras(sql_lora_files):
 
 @multi_gpu_test(num_gpus=2)
 @create_new_process_for_each_test()
-def test_tp2_serialize_and_deserialize_lora(tmp_path, sql_lora_files,
-                                            sql_lora_huggingface_id):
-
+def test_tp2_serialize_and_deserialize_lora(
+    tmp_path, sql_lora_files, sql_lora_huggingface_id
+):
     # Run the tensorizing of the LoRA adapter and the model in a subprocess
     # to guarantee cleanup
 
@@ -145,17 +159,28 @@ def test_tp2_serialize_and_deserialize_lora(tmp_path, sql_lora_files,
     lora_path = sql_lora_huggingface_id
     suffix = "test"
     try:
-        result = subprocess.run([
-            sys.executable,
-            f"{VLLM_PATH}/examples/others/tensorize_vllm_model.py", "--model",
-            MODEL_PATH, "--lora-path", lora_path, "--tensor-parallel-size",
-            str(tp_size), "serialize", "--serialized-directory",
-            str(tmp_path), "--suffix", suffix, "--serialization-kwargs",
-            '{"limit_cpu_concurrency": 4}'
-        ],
-                                check=True,
-                                capture_output=True,
-                                text=True)
+        result = subprocess.run(
+            [
+                sys.executable,
+                f"{VLLM_PATH}/examples/others/tensorize_vllm_model.py",
+                "--model",
+                MODEL_PATH,
+                "--lora-path",
+                lora_path,
+                "--tensor-parallel-size",
+                str(tp_size),
+                "serialize",
+                "--serialized-directory",
+                str(tmp_path),
+                "--suffix",
+                suffix,
+                "--serialization-kwargs",
+                '{"limit_cpu_concurrency": 4}',
+            ],
+            check=True,
+            capture_output=True,
+            text=True,
+        )
     except subprocess.CalledProcessError as e:
         print("Tensorizing failed.")
         print("STDOUT:\n", e.stdout)
@@ -167,21 +192,25 @@ def test_tp2_serialize_and_deserialize_lora(tmp_path, sql_lora_files,
     model_uri = tmp_path / "vllm" / model_ref / suffix / model_name
     tensorizer_config = TensorizerConfig(tensorizer_uri=str(model_uri))
 
-    loaded_llm = LLM(model=model_ref,
-                     tokenizer=sql_lora_files,
-                     load_format="tensorizer",
-                     enable_lora=True,
-                     enforce_eager=True,
-                     model_loader_extra_config=tensorizer_config,
-                     max_num_seqs=13,
-                     tensor_parallel_size=2,
-                     max_loras=2)
+    loaded_llm = LLM(
+        model=model_ref,
+        tokenizer=sql_lora_files,
+        load_format="tensorizer",
+        enable_lora=True,
+        enforce_eager=True,
+        model_loader_extra_config=tensorizer_config,
+        max_num_seqs=13,
+        tensor_parallel_size=2,
+        max_loras=2,
+    )
 
     tc_as_dict = tensorizer_config.to_serializable()
 
     print("lora adapter created")
     print("lora 1")
-    assert do_sample(loaded_llm,
-                     sql_lora_files,
-                     tensorizer_config_dict=tc_as_dict,
-                     lora_id=1) == EXPECTED_LORA_OUTPUT
+    assert (
+        do_sample(
+            loaded_llm, sql_lora_files, tensorizer_config_dict=tc_as_dict, lora_id=1
+        )
+        == EXPECTED_LORA_OUTPUT
+    )
diff --git a/tests/lora/test_llm_with_multi_loras.py b/tests/lora/test_llm_with_multi_loras.py
index 3d8dd512a201..12855f108f6b 100644
--- a/tests/lora/test_llm_with_multi_loras.py
+++ b/tests/lora/test_llm_with_multi_loras.py
@@ -5,6 +5,7 @@
 1. test multi loras service with tp >= 2
 2. test multi loras request
 """
+
 import pytest
 
 from tests.utils import multi_gpu_test
@@ -31,14 +32,8 @@
 
 def format_chatml_messages(prompt: str):
     return [
-        {
-            "role": "system",
-            "content": "You are a helpful assistant."
-        },
-        {
-            "role": "user",
-            "content": prompt
-        },
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": prompt},
     ]
 
 
@@ -57,7 +52,6 @@ def make_add_lora_request(name: str, path: str):
 
 @multi_gpu_test(num_gpus=2)
 def test_multi_loras_with_tp_sync():
-
     llm = LLM(
         model=MODEL_PATH,
         enable_lora=True,
@@ -116,15 +110,17 @@ def call_llm_get_outputs(prompt: str, lora_name: str):
 
     def reload_lora(name: str):
         """
-        reload a lora to simulate the case: 
-        setting `VLLM_ALLOW_RUNTIME_LORA_UPDATING=true` 
+        reload a lora to simulate the case:
+        setting `VLLM_ALLOW_RUNTIME_LORA_UPDATING=true`
         for dynamic lora loading and unloading
         """
         remove_lora_response = llm.llm_engine.remove_lora(
-            lora_id=LORA_NAME_ID_MAP[name])
+            lora_id=LORA_NAME_ID_MAP[name]
+        )
 
         add_lora_response = llm.llm_engine.add_lora(
-            make_add_lora_request(name, LORA_NAME_PATH_MAP[name]))
+            make_add_lora_request(name, LORA_NAME_PATH_MAP[name])
+        )
 
         print(f"{remove_lora_response=}, {add_lora_response=}")
 
@@ -134,7 +130,6 @@ def check_outputs(outputs: str, expected: str):
         assert outputs == expected
 
     for prompt, expected_output in zip(LORA_TEST_PROMPTS, LORA_TEST_EXPECTED):
-
         output_text = call_llm_get_outputs(prompt, "Alice")
         check_outputs(output_text, expected_output)
 
@@ -175,8 +170,7 @@ def test_multiple_lora_requests():
     PROMPTS = ["Hello, my name is"] * 2
     LORA_NAME = "Alice"
     lora_request = [
-        LoRARequest(LORA_NAME + str(idx), idx + 1,
-                    LORA_NAME_PATH_MAP[LORA_NAME])
+        LoRARequest(LORA_NAME + str(idx), idx + 1, LORA_NAME_PATH_MAP[LORA_NAME])
         for idx in range(len(PROMPTS))
     ]
     # Multiple SamplingParams should be matched with each prompt
diff --git a/tests/lora/test_lora_checkpoints.py b/tests/lora/test_lora_checkpoints.py
index ebc0f26378d2..2219d470e91a 100644
--- a/tests/lora/test_lora_checkpoints.py
+++ b/tests/lora/test_lora_checkpoints.py
@@ -8,9 +8,7 @@
 from vllm.model_executor.models.baichuan import BaiChuanBaseForCausalLM
 from vllm.model_executor.models.utils import WeightsMapper
 
-lora_lst = [
-    "baichuan7B", "baichuan7B-zero", "baichuan7B-zero-regex", "chatglm3-6b"
-]
+lora_lst = ["baichuan7B", "baichuan7B-zero", "baichuan7B-zero-regex", "chatglm3-6b"]
 BAICHUAN_LORA_MODULES = [
     "W_pack",
     "o_proj",
@@ -37,8 +35,9 @@ def test_load_checkpoints(
         else:
             expected_lora_modules.append(module)
     if lora_name == "baichuan7B":
-        peft_helper = PEFTHelper.from_local_dir(baichuan_lora_files,
-                                                max_position_embeddings=4096)
+        peft_helper = PEFTHelper.from_local_dir(
+            baichuan_lora_files, max_position_embeddings=4096
+        )
         # For the baichuan7B model, load it's LoRA,
         # and the test should pass.
         LoRAModel.from_local_checkpoint(
@@ -48,13 +47,15 @@ def test_load_checkpoints(
             lora_model_id=1,
             device="cpu",
             embedding_modules=embedding_modules,
-            embedding_padding_modules=embed_padding_modules)
+            embedding_padding_modules=embed_padding_modules,
+        )
     elif lora_name == "baichuan7B-zero":
         # Test that the target_modules contain prefix
         # such as "model.layers.0.self_atten.W_pack", and
         # the test should pass.
-        peft_helper = PEFTHelper.from_local_dir(baichuan_zero_lora_files,
-                                                max_position_embeddings=4096)
+        peft_helper = PEFTHelper.from_local_dir(
+            baichuan_zero_lora_files, max_position_embeddings=4096
+        )
         LoRAModel.from_local_checkpoint(
             baichuan_zero_lora_files,
             expected_lora_modules,
@@ -62,12 +63,14 @@ def test_load_checkpoints(
             lora_model_id=1,
             device="cpu",
             embedding_modules=embedding_modules,
-            embedding_padding_modules=embed_padding_modules)
+            embedding_padding_modules=embed_padding_modules,
+        )
     elif lora_name == "baichuan7B-zero-regex":
         # Test that the `target_modules` in the form of regular expressions,
         # such as `model\\..*(W_pack|o_proj)`, and the test should pass.
-        peft_helper = PEFTHelper.from_local_dir(baichuan_regex_lora_files,
-                                                max_position_embeddings=4096)
+        peft_helper = PEFTHelper.from_local_dir(
+            baichuan_regex_lora_files, max_position_embeddings=4096
+        )
         LoRAModel.from_local_checkpoint(
             baichuan_regex_lora_files,
             expected_lora_modules,
@@ -75,13 +78,15 @@ def test_load_checkpoints(
             lora_model_id=1,
             device="cpu",
             embedding_modules=embedding_modules,
-            embedding_padding_modules=embed_padding_modules)
+            embedding_padding_modules=embed_padding_modules,
+        )
     else:
         # For the baichuan7B model, load chatglm3-6b's LoRA,
         # and the test should raise the following error.
         expected_error = "Please verify that the loaded LoRA module is correct"  # noqa: E501
-        peft_helper = PEFTHelper.from_local_dir(chatglm3_lora_files,
-                                                max_position_embeddings=4096)
+        peft_helper = PEFTHelper.from_local_dir(
+            chatglm3_lora_files, max_position_embeddings=4096
+        )
         with pytest.raises(ValueError, match=expected_error):
             LoRAModel.from_local_checkpoint(
                 chatglm3_lora_files,
@@ -90,11 +95,11 @@ def test_load_checkpoints(
                 lora_model_id=1,
                 device="cpu",
                 embedding_modules=embedding_modules,
-                embedding_padding_modules=embed_padding_modules)
+                embedding_padding_modules=embed_padding_modules,
+            )
 
 
 def test_lora_weights_mapping(baichuan_lora_files):
-
     packed_modules_mapping = BaiChuanBaseForCausalLM.packed_modules_mapping
     embedding_modules = BaiChuanBaseForCausalLM.embedding_modules
     embed_padding_modules = BaiChuanBaseForCausalLM.embedding_padding_modules
@@ -113,8 +118,9 @@ def test_lora_weights_mapping(baichuan_lora_files):
             ".layers.": ".baichuan_layers.",
         },
     )
-    peft_helper = PEFTHelper.from_local_dir(baichuan_lora_files,
-                                            max_position_embeddings=4096)
+    peft_helper = PEFTHelper.from_local_dir(
+        baichuan_lora_files, max_position_embeddings=4096
+    )
     lora_model = LoRAModel.from_local_checkpoint(
         baichuan_lora_files,
         expected_lora_modules,
diff --git a/tests/lora/test_lora_functions.py b/tests/lora/test_lora_functions.py
index 221d5237823c..e914393fee8a 100644
--- a/tests/lora/test_lora_functions.py
+++ b/tests/lora/test_lora_functions.py
@@ -3,11 +3,13 @@
 """
 Script to test add_lora, remove_lora, pin_lora, list_loras functions.
 """
+
 import pytest
 
 from vllm.engine.arg_utils import AsyncEngineArgs, EngineArgs
 from vllm.entrypoints.openai.api_server import (
-    build_async_engine_client_from_engine_args)
+    build_async_engine_client_from_engine_args,
+)
 from vllm.lora.request import LoRARequest
 from vllm.v1.engine.llm_engine import LLMEngine
 
@@ -17,23 +19,24 @@
 
 
 def make_lora_request(lora_id: int):
-    return LoRARequest(lora_name=f"{lora_id}",
-                       lora_int_id=lora_id,
-                       lora_path=LORA_MODULE_PATH)
+    return LoRARequest(
+        lora_name=f"{lora_id}", lora_int_id=lora_id, lora_path=LORA_MODULE_PATH
+    )
 
 
 def test_lora_functions_sync():
-
     max_loras = 4
     # Create engine in eager-mode. Due to high max_loras, the CI can
     # OOM during cuda-graph capture.
-    engine_args = EngineArgs(model=MODEL_PATH,
-                             enable_lora=True,
-                             max_loras=max_loras,
-                             max_lora_rank=LORA_RANK,
-                             max_model_len=128,
-                             gpu_memory_utilization=0.8,
-                             enforce_eager=True)
+    engine_args = EngineArgs(
+        model=MODEL_PATH,
+        enable_lora=True,
+        max_loras=max_loras,
+        max_lora_rank=LORA_RANK,
+        max_model_len=128,
+        gpu_memory_utilization=0.8,
+        enforce_eager=True,
+    )
 
     llm = LLMEngine.from_engine_args(engine_args)
 
@@ -70,15 +73,16 @@ def run_check(fn, args, expected: list):
 
 @pytest.mark.asyncio
 async def test_lora_functions_async():
-
     max_loras = 4
-    engine_args = AsyncEngineArgs(model=MODEL_PATH,
-                                  enable_lora=True,
-                                  max_loras=max_loras,
-                                  max_lora_rank=LORA_RANK,
-                                  max_model_len=128,
-                                  gpu_memory_utilization=0.8,
-                                  enforce_eager=True)
+    engine_args = AsyncEngineArgs(
+        model=MODEL_PATH,
+        enable_lora=True,
+        max_loras=max_loras,
+        max_lora_rank=LORA_RANK,
+        max_model_len=128,
+        gpu_memory_utilization=0.8,
+        enforce_eager=True,
+    )
 
     async def run_check(fn, args, expected: list):
         await fn(args)
diff --git a/tests/lora/test_lora_huggingface.py b/tests/lora/test_lora_huggingface.py
index b46d81f1651a..7d20faef541a 100644
--- a/tests/lora/test_lora_huggingface.py
+++ b/tests/lora/test_lora_huggingface.py
@@ -11,8 +11,12 @@
 # Provide absolute path and huggingface lora ids
 lora_fixture_name = ["sql_lora_files", "sql_lora_huggingface_id"]
 LLAMA_LORA_MODULES = [
-    "qkv_proj", "o_proj", "gate_up_proj", "down_proj", "embed_tokens",
-    "lm_head"
+    "qkv_proj",
+    "o_proj",
+    "gate_up_proj",
+    "down_proj",
+    "embed_tokens",
+    "lm_head",
 ]
 
 
@@ -40,7 +44,8 @@ def test_load_checkpoints_from_huggingface(lora_fixture_name, request):
         lora_model_id=1,
         device="cpu",
         embedding_modules=embedding_modules,
-        embedding_padding_modules=embed_padding_modules)
+        embedding_padding_modules=embed_padding_modules,
+    )
 
     # Assertions to ensure the model is loaded correctly
     assert lora_model is not None, "LoRAModel is not loaded correctly"
diff --git a/tests/lora/test_lora_manager.py b/tests/lora/test_lora_manager.py
index 6f0a85231408..e7816031142e 100644
--- a/tests/lora/test_lora_manager.py
+++ b/tests/lora/test_lora_manager.py
@@ -10,16 +10,21 @@
 
 from vllm.config import ModelConfig, VllmConfig
 from vllm.config.lora import LoRAConfig
-from vllm.lora.layers import (ColumnParallelLinearWithLoRA,
-                              MergedColumnParallelLinearWithLoRA,
-                              RowParallelLinearWithLoRA)
+from vllm.lora.layers import (
+    ColumnParallelLinearWithLoRA,
+    MergedColumnParallelLinearWithLoRA,
+    RowParallelLinearWithLoRA,
+)
 from vllm.lora.lora_weights import LoRALayerWeights, PackedLoRALayerWeights
-from vllm.lora.models import (LoRAMapping, LoRAModel, LoRAModelManager,
-                              LRUCacheLoRAModelManager)
+from vllm.lora.models import (
+    LoRAMapping,
+    LoRAModel,
+    LoRAModelManager,
+    LRUCacheLoRAModelManager,
+)
 from vllm.lora.peft_helper import PEFTHelper
 from vllm.lora.request import LoRARequest
-from vllm.lora.worker_manager import (LRUCacheWorkerLoRAManager,
-                                      WorkerLoRAManager)
+from vllm.lora.worker_manager import LRUCacheWorkerLoRAManager, WorkerLoRAManager
 from vllm.platforms import current_platform
 
 from .utils import create_peft_lora
@@ -31,22 +36,25 @@
 
 EMBEDDING_PADDING_MODULES = ["lm_head"]
 
-DEVICES = ([
-    f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)
-] if current_platform.is_cuda_alike() else ["cpu"])
+DEVICES = (
+    [f"cuda:{i}" for i in range(1 if torch.cuda.device_count() == 1 else 2)]
+    if current_platform.is_cuda_alike()
+    else ["cpu"]
+)
 
 DEFAULT_DTYPE = torch.get_default_dtype()
 
 
 @pytest.mark.parametrize("device", DEVICES)
 def test_from_lora_tensors(sql_lora_files, device):
-    tensors = load_file(
-        os.path.join(sql_lora_files, "adapter_model.safetensors"))
+    tensors = load_file(os.path.join(sql_lora_files, "adapter_model.safetensors"))
     new_embeddings = load_file(
-        os.path.join(sql_lora_files, "new_embeddings.safetensors"))
+        os.path.join(sql_lora_files, "new_embeddings.safetensors")
+    )
 
-    peft_helper = PEFTHelper.from_local_dir(sql_lora_files,
-                                            max_position_embeddings=4096)
+    peft_helper = PEFTHelper.from_local_dir(
+        sql_lora_files, max_position_embeddings=4096
+    )
     lora_model = LoRAModel.from_lora_tensors(
         1,
         tensors,
@@ -54,7 +62,8 @@ def test_from_lora_tensors(sql_lora_files, device):
         device=device,
         embeddings=new_embeddings,
         embedding_modules=EMBEDDING_MODULES,
-        embedding_padding_modules=EMBEDDING_PADDING_MODULES)
+        embedding_padding_modules=EMBEDDING_PADDING_MODULES,
+    )
     for module_name, lora in lora_model.loras.items():
         assert lora.module_name == module_name
         assert lora.rank == 8
@@ -63,22 +72,27 @@ def test_from_lora_tensors(sql_lora_files, device):
         assert lora.lora_b is not None
         assert lora.lora_a.device == torch.device(device)
         assert lora.lora_b.device == torch.device(device)
-        assert (lora.lora_a.shape[0] == lora.lora_b.shape[1]
-                ), f"{lora.lora_a.shape=}, {lora.lora_b.shape=}"
+        assert lora.lora_a.shape[0] == lora.lora_b.shape[1], (
+            f"{lora.lora_a.shape=}, {lora.lora_b.shape=}"
+        )
         assert lora.lora_a.shape[0] == 8
         embeddings_module = next(
-            (k for k in EMBEDDING_MODULES if k in module_name), None)
+            (k for k in EMBEDDING_MODULES if k in module_name), None
+        )
         if embeddings_module:
             assert torch.equal(
                 lora.embeddings_tensor,
                 new_embeddings[EMBEDDING_MODULES[embeddings_module]].to(
-                    device=lora.embeddings_tensor.device))
+                    device=lora.embeddings_tensor.device
+                ),
+            )
         else:
             assert lora.embeddings_tensor is None
 
 
-def create_lora(lora_id: int, model: nn.Module, sub_modules: list[str],
-                device: torch.device) -> LoRAModel:
+def create_lora(
+    lora_id: int, model: nn.Module, sub_modules: list[str], device: torch.device
+) -> LoRAModel:
     loras: dict[str, LoRALayerWeights] = {}
     for name in sub_modules:
         w = model.get_submodule(name).weight
@@ -110,8 +124,7 @@ def create_packed_lora(
             8,
             16,
             torch.rand([8, w.shape[1]], device=device),
-            torch.rand([w.shape[0] // len(replaced_module_names), 8],
-                       device=device),
+            torch.rand([w.shape[0] // len(replaced_module_names), 8], device=device),
         )
     return LoRAModel(lora_id, 8, loras)
 
@@ -119,42 +132,42 @@ def create_packed_lora(
 def test_replace_submodules(dist_init, dummy_model):
     model = dummy_model
     manager = LoRAModelManager(
-        model, 1, 1, 1,
-        LoRAConfig(max_lora_rank=8,
-                   max_cpu_loras=8,
-                   max_loras=8,
-                   lora_dtype=DEFAULT_DTYPE), torch.device(DEVICES[0]))
+        model,
+        1,
+        1,
+        1,
+        LoRAConfig(
+            max_lora_rank=8, max_cpu_loras=8, max_loras=8, lora_dtype=DEFAULT_DTYPE
+        ),
+        torch.device(DEVICES[0]),
+    )
     model = manager.model
-    assert isinstance(model.get_submodule("dense1"),
-                      ColumnParallelLinearWithLoRA)
-    assert isinstance(model.get_submodule("layer1.dense1"),
-                      ColumnParallelLinearWithLoRA)
+    assert isinstance(model.get_submodule("dense1"), ColumnParallelLinearWithLoRA)
+    assert isinstance(
+        model.get_submodule("layer1.dense1"), ColumnParallelLinearWithLoRA
+    )
     assert isinstance(model.get_submodule("dense2"), RowParallelLinearWithLoRA)
-    assert isinstance(model.get_submodule("layer1.dense2"),
-                      RowParallelLinearWithLoRA)
+    assert isinstance(model.get_submodule("layer1.dense2"), RowParallelLinearWithLoRA)
 
 
 @pytest.mark.parametrize("device", DEVICES)
 def test_lora_model_manager(dist_init, dummy_model, device):
     model = dummy_model
-    model_lora1 = create_lora(1,
-                              model, ["layer1.dense1", "dense2", "lm_head"],
-                              device=device)
-    model_lora2 = create_lora(2,
-                              model, ["dense1", "dense2", "lm_head"],
-                              device=device)
-    model_lora3 = create_lora(3,
-                              model, ["dense1", "dense2", "lm_head"],
-                              device=device)
-    manager = LoRAModelManager(model,
-                               2,
-                               2,
-                               2,
-                               LoRAConfig(max_lora_rank=8,
-                                          max_cpu_loras=3,
-                                          max_loras=2,
-                                          lora_dtype=DEFAULT_DTYPE),
-                               device=device)
+    model_lora1 = create_lora(
+        1, model, ["layer1.dense1", "dense2", "lm_head"], device=device
+    )
+    model_lora2 = create_lora(2, model, ["dense1", "dense2", "lm_head"], device=device)
+    model_lora3 = create_lora(3, model, ["dense1", "dense2", "lm_head"], device=device)
+    manager = LoRAModelManager(
+        model,
+        2,
+        2,
+        2,
+        LoRAConfig(
+            max_lora_rank=8, max_cpu_loras=3, max_loras=2, lora_dtype=DEFAULT_DTYPE
+        ),
+        device=device,
+    )
     assert all(x is None for x in manager.lora_index_to_id)
     assert manager.add_adapter(model_lora1)
     assert manager.activate_adapter(1)
@@ -204,24 +217,21 @@ def test_lora_model_manager(dist_init, dummy_model, device):
 @pytest.mark.parametrize("device", DEVICES)
 def test_lora_lru_cache_model_manager(dist_init, dummy_model, device):
     model = dummy_model
-    model_lora1 = create_lora(1,
-                              model, ["layer1.dense1", "dense2", "lm_head"],
-                              device=device)
-    model_lora2 = create_lora(2,
-                              model, ["dense1", "dense2", "lm_head"],
-                              device=device)
-    model_lora3 = create_lora(3,
-                              model, ["dense1", "dense2", "lm_head"],
-                              device=device)
-    manager = LRUCacheLoRAModelManager(model,
-                                       2,
-                                       2,
-                                       2,
-                                       LoRAConfig(max_lora_rank=8,
-                                                  max_cpu_loras=3,
-                                                  max_loras=2,
-                                                  lora_dtype=DEFAULT_DTYPE),
-                                       device=device)
+    model_lora1 = create_lora(
+        1, model, ["layer1.dense1", "dense2", "lm_head"], device=device
+    )
+    model_lora2 = create_lora(2, model, ["dense1", "dense2", "lm_head"], device=device)
+    model_lora3 = create_lora(3, model, ["dense1", "dense2", "lm_head"], device=device)
+    manager = LRUCacheLoRAModelManager(
+        model,
+        2,
+        2,
+        2,
+        LoRAConfig(
+            max_lora_rank=8, max_cpu_loras=3, max_loras=2, lora_dtype=DEFAULT_DTYPE
+        ),
+        device=device,
+    )
     assert all(x is None for x in manager.lora_index_to_id)
     assert manager.add_adapter(model_lora1)
     assert manager.activate_adapter(1)
@@ -297,27 +307,22 @@ def test_lru_lora_model_manager(dist_init, dummy_model, device):
     # This tests just the LRU cache functionality, everything else is
     # tested in test_lora_model_manager
     model = dummy_model
-    model_lora1 = create_lora(1,
-                              model, ["layer1.dense1", "dense2", "lm_head"],
-                              device=device)
-    model_lora2 = create_lora(2,
-                              model, ["dense1", "dense2", "lm_head"],
-                              device=device)
-    model_lora3 = create_lora(3,
-                              model, ["dense1", "dense2", "lm_head"],
-                              device=device)
-    model_lora4 = create_lora(4,
-                              model, ["dense1", "dense2", "lm_head"],
-                              device=device)
-    manager = LRUCacheLoRAModelManager(model,
-                                       2,
-                                       2,
-                                       2,
-                                       LoRAConfig(max_lora_rank=8,
-                                                  max_cpu_loras=2,
-                                                  max_loras=2,
-                                                  lora_dtype=DEFAULT_DTYPE),
-                                       device=device)
+    model_lora1 = create_lora(
+        1, model, ["layer1.dense1", "dense2", "lm_head"], device=device
+    )
+    model_lora2 = create_lora(2, model, ["dense1", "dense2", "lm_head"], device=device)
+    model_lora3 = create_lora(3, model, ["dense1", "dense2", "lm_head"], device=device)
+    model_lora4 = create_lora(4, model, ["dense1", "dense2", "lm_head"], device=device)
+    manager = LRUCacheLoRAModelManager(
+        model,
+        2,
+        2,
+        2,
+        LoRAConfig(
+            max_lora_rank=8, max_cpu_loras=2, max_loras=2, lora_dtype=DEFAULT_DTYPE
+        ),
+        device=device,
+    )
     assert all(x is None for x in manager.lora_index_to_id)
 
     # Add up to capacity
@@ -421,12 +426,10 @@ def test_lru_lora_model_manager(dist_init, dummy_model, device):
 
 
 @pytest.mark.parametrize("device", DEVICES)
-def test_lru_cache_worker_adapter_manager(dist_init, dummy_model, device,
-                                          tmp_path):
-    lora_config = LoRAConfig(max_lora_rank=8,
-                             max_cpu_loras=4,
-                             max_loras=4,
-                             lora_dtype=DEFAULT_DTYPE)
+def test_lru_cache_worker_adapter_manager(dist_init, dummy_model, device, tmp_path):
+    lora_config = LoRAConfig(
+        max_lora_rank=8, max_cpu_loras=4, max_loras=4, lora_dtype=DEFAULT_DTYPE
+    )
 
     dummy_lora_files = f"{tmp_path}/lora_adapter"
     os.makedirs(dummy_lora_files, exist_ok=True)
@@ -438,13 +441,13 @@ def test_lru_cache_worker_adapter_manager(dist_init, dummy_model, device,
     )
 
     model_config = ModelConfig(max_model_len=16)
-    vllm_config = VllmConfig(model_config=model_config,
-                             lora_config=lora_config)
+    vllm_config = VllmConfig(model_config=model_config, lora_config=lora_config)
 
     vllm_config.scheduler_config.max_num_seqs = 4
     vllm_config.scheduler_config.max_num_batched_tokens = 2
     worker_adapter_manager = LRUCacheWorkerLoRAManager(
-        vllm_config, device, EMBEDDING_MODULES, EMBEDDING_PADDING_MODULES)
+        vllm_config, device, EMBEDDING_MODULES, EMBEDDING_PADDING_MODULES
+    )
 
     worker_adapter_manager.max_num_seqs = 4
     worker_adapter_manager.max_num_batched_tokens = 2
@@ -452,52 +455,64 @@ def test_lru_cache_worker_adapter_manager(dist_init, dummy_model, device,
     worker_adapter_manager.create_lora_manager(dummy_model)
 
     mapping = LoRAMapping([], [])
-    worker_adapter_manager.set_active_adapters([
-        LoRARequest("1", 1, dummy_lora_files),
-        LoRARequest("2", 2, dummy_lora_files)
-    ], mapping)
+    worker_adapter_manager.set_active_adapters(
+        [LoRARequest("1", 1, dummy_lora_files), LoRARequest("2", 2, dummy_lora_files)],
+        mapping,
+    )
     assert worker_adapter_manager.list_adapters() == {1, 2}
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[0] == 1
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[1] == 2
 
-    worker_adapter_manager.set_active_adapters([
-        LoRARequest("1", 1, dummy_lora_files),
-        LoRARequest("3", 3, dummy_lora_files),
-        LoRARequest("4", 4, dummy_lora_files)
-    ], mapping)
+    worker_adapter_manager.set_active_adapters(
+        [
+            LoRARequest("1", 1, dummy_lora_files),
+            LoRARequest("3", 3, dummy_lora_files),
+            LoRARequest("4", 4, dummy_lora_files),
+        ],
+        mapping,
+    )
     assert worker_adapter_manager.list_adapters() == {1, 2, 3, 4}
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[0] == 1
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[1] == 2
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[2] == 3
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[3] == 4
 
-    worker_adapter_manager.set_active_adapters([
-        LoRARequest("1", 1, dummy_lora_files),
-        LoRARequest("2", 2, dummy_lora_files),
-        LoRARequest("5", 5, dummy_lora_files)
-    ], mapping)
+    worker_adapter_manager.set_active_adapters(
+        [
+            LoRARequest("1", 1, dummy_lora_files),
+            LoRARequest("2", 2, dummy_lora_files),
+            LoRARequest("5", 5, dummy_lora_files),
+        ],
+        mapping,
+    )
     assert worker_adapter_manager.list_adapters() == {1, 2, 4, 5}
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[0] == 1
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[1] == 2
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[2] == 5
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[3] == 4
 
-    worker_adapter_manager.set_active_adapters([
-        LoRARequest("1", 1, dummy_lora_files),
-        LoRARequest("1", 1, dummy_lora_files),
-        LoRARequest("1", 1, dummy_lora_files)
-    ], mapping)
+    worker_adapter_manager.set_active_adapters(
+        [
+            LoRARequest("1", 1, dummy_lora_files),
+            LoRARequest("1", 1, dummy_lora_files),
+            LoRARequest("1", 1, dummy_lora_files),
+        ],
+        mapping,
+    )
     assert worker_adapter_manager.list_adapters() == {1, 2, 4, 5}
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[0] == 1
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[1] == 2
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[2] == 5
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[3] == 4
 
-    worker_adapter_manager.set_active_adapters([
-        LoRARequest("6", 6, dummy_lora_files),
-        LoRARequest("7", 7, dummy_lora_files),
-        LoRARequest("8", 8, dummy_lora_files)
-    ], mapping)
+    worker_adapter_manager.set_active_adapters(
+        [
+            LoRARequest("6", 6, dummy_lora_files),
+            LoRARequest("7", 7, dummy_lora_files),
+            LoRARequest("8", 8, dummy_lora_files),
+        ],
+        mapping,
+    )
     assert worker_adapter_manager.list_adapters() == {1, 6, 7, 8}
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[0] == 1
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[1] == 7
@@ -506,41 +521,40 @@ def test_lru_cache_worker_adapter_manager(dist_init, dummy_model, device,
 
     # Over capacity
     with pytest.raises(RuntimeError):
-        worker_adapter_manager.set_active_adapters([
-            LoRARequest("10", 10, dummy_lora_files),
-            LoRARequest("11", 11, dummy_lora_files),
-            LoRARequest("12", 12, dummy_lora_files),
-            LoRARequest("13", 13, dummy_lora_files),
-            LoRARequest("14", 14, dummy_lora_files)
-        ], mapping)
+        worker_adapter_manager.set_active_adapters(
+            [
+                LoRARequest("10", 10, dummy_lora_files),
+                LoRARequest("11", 11, dummy_lora_files),
+                LoRARequest("12", 12, dummy_lora_files),
+                LoRARequest("13", 13, dummy_lora_files),
+                LoRARequest("14", 14, dummy_lora_files),
+            ],
+            mapping,
+        )
 
     assert worker_adapter_manager.device == device
-    assert (worker_adapter_manager._adapter_manager.punica_wrapper.device ==
-            device)
+    assert worker_adapter_manager._adapter_manager.punica_wrapper.device == device
 
 
 @pytest.mark.parametrize("device", DEVICES)
-def test_worker_adapter_manager(dist_init, dummy_model_gate_up, device,
-                                tmp_path):
+def test_worker_adapter_manager(dist_init, dummy_model_gate_up, device, tmp_path):
     # Should remove every LoRA not specified in the request.
-    lora_config = LoRAConfig(max_lora_rank=8,
-                             max_cpu_loras=4,
-                             max_loras=4,
-                             lora_dtype=DEFAULT_DTYPE)
+    lora_config = LoRAConfig(
+        max_lora_rank=8, max_cpu_loras=4, max_loras=4, lora_dtype=DEFAULT_DTYPE
+    )
 
     model_config = ModelConfig(max_model_len=16)
-    vllm_config = VllmConfig(model_config=model_config,
-                             lora_config=lora_config)
+    vllm_config = VllmConfig(model_config=model_config, lora_config=lora_config)
 
     vllm_config.scheduler_config.max_num_seqs = 4
     vllm_config.scheduler_config.max_num_batched_tokens = 2
 
-    worker_adapter_manager = WorkerLoRAManager(vllm_config, device,
-                                               EMBEDDING_MODULES,
-                                               EMBEDDING_PADDING_MODULES)
+    worker_adapter_manager = WorkerLoRAManager(
+        vllm_config, device, EMBEDDING_MODULES, EMBEDDING_PADDING_MODULES
+    )
     worker_adapter_manager.vocab_size = (
-        dummy_model_gate_up.unpadded_vocab_size -
-        lora_config.lora_extra_vocab_size)
+        dummy_model_gate_up.unpadded_vocab_size - lora_config.lora_extra_vocab_size
+    )
     worker_adapter_manager.create_lora_manager(dummy_model_gate_up)
 
     dummy_lora_files = f"{tmp_path}/lora_adapter"
@@ -553,49 +567,61 @@ def test_worker_adapter_manager(dist_init, dummy_model_gate_up, device,
     )
 
     mapping = LoRAMapping([], [])
-    worker_adapter_manager.set_active_adapters([
-        LoRARequest("1", 1, dummy_lora_files),
-        LoRARequest("2", 2, dummy_lora_files)
-    ], mapping)
+    worker_adapter_manager.set_active_adapters(
+        [LoRARequest("1", 1, dummy_lora_files), LoRARequest("2", 2, dummy_lora_files)],
+        mapping,
+    )
     assert worker_adapter_manager.list_adapters() == {1, 2}
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[0] == 1
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[1] == 2
 
-    worker_adapter_manager.set_active_adapters([
-        LoRARequest("1", 1, dummy_lora_files),
-        LoRARequest("3", 3, dummy_lora_files),
-        LoRARequest("4", 4, dummy_lora_files)
-    ], mapping)
+    worker_adapter_manager.set_active_adapters(
+        [
+            LoRARequest("1", 1, dummy_lora_files),
+            LoRARequest("3", 3, dummy_lora_files),
+            LoRARequest("4", 4, dummy_lora_files),
+        ],
+        mapping,
+    )
     assert worker_adapter_manager.list_adapters() == {1, 3, 4}
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[0] == 1
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[1] == 3
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[2] == 4
 
-    worker_adapter_manager.set_active_adapters([
-        LoRARequest("1", 1, dummy_lora_files),
-        LoRARequest("2", 2, dummy_lora_files),
-        LoRARequest("5", 5, dummy_lora_files)
-    ], mapping)
+    worker_adapter_manager.set_active_adapters(
+        [
+            LoRARequest("1", 1, dummy_lora_files),
+            LoRARequest("2", 2, dummy_lora_files),
+            LoRARequest("5", 5, dummy_lora_files),
+        ],
+        mapping,
+    )
     assert worker_adapter_manager.list_adapters() == {1, 2, 5}
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[0] == 1
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[1] == 2
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[2] == 5
 
-    worker_adapter_manager.set_active_adapters([
-        LoRARequest("1", 1, dummy_lora_files),
-        LoRARequest("1", 1, dummy_lora_files),
-        LoRARequest("1", 1, dummy_lora_files)
-    ], mapping)
+    worker_adapter_manager.set_active_adapters(
+        [
+            LoRARequest("1", 1, dummy_lora_files),
+            LoRARequest("1", 1, dummy_lora_files),
+            LoRARequest("1", 1, dummy_lora_files),
+        ],
+        mapping,
+    )
     assert worker_adapter_manager.list_adapters() == {1}
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[0] == 1
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[1] is None
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[2] is None
 
-    worker_adapter_manager.set_active_adapters([
-        LoRARequest("6", 6, dummy_lora_files),
-        LoRARequest("7", 7, dummy_lora_files),
-        LoRARequest("8", 8, dummy_lora_files)
-    ], mapping)
+    worker_adapter_manager.set_active_adapters(
+        [
+            LoRARequest("6", 6, dummy_lora_files),
+            LoRARequest("7", 7, dummy_lora_files),
+            LoRARequest("8", 8, dummy_lora_files),
+        ],
+        mapping,
+    )
     assert worker_adapter_manager.list_adapters() == {6, 7, 8}
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[0] == 8
     assert worker_adapter_manager._adapter_manager.lora_index_to_id[1] == 6
@@ -603,17 +629,19 @@ def test_worker_adapter_manager(dist_init, dummy_model_gate_up, device,
 
     # Over capacity
     with pytest.raises(RuntimeError):
-        worker_adapter_manager.set_active_adapters([
-            LoRARequest("10", 10, dummy_lora_files),
-            LoRARequest("11", 11, dummy_lora_files),
-            LoRARequest("12", 12, dummy_lora_files),
-            LoRARequest("13", 13, dummy_lora_files),
-            LoRARequest("14", 14, dummy_lora_files)
-        ], mapping)
+        worker_adapter_manager.set_active_adapters(
+            [
+                LoRARequest("10", 10, dummy_lora_files),
+                LoRARequest("11", 11, dummy_lora_files),
+                LoRARequest("12", 12, dummy_lora_files),
+                LoRARequest("13", 13, dummy_lora_files),
+                LoRARequest("14", 14, dummy_lora_files),
+            ],
+            mapping,
+        )
 
     assert worker_adapter_manager.device == device
-    assert (worker_adapter_manager._adapter_manager.punica_wrapper.device ==
-            device)
+    assert worker_adapter_manager._adapter_manager.punica_wrapper.device == device
 
 
 @pytest.mark.parametrize("device", DEVICES)
@@ -624,7 +652,8 @@ def test_packed_loras(dist_init, dummy_model_gate_up, device):
         model,
         module_name="gate_up_proj",
         replaced_module_names=["gate_proj", "up_proj"],
-        device=device)
+        device=device,
+    )
     model_lora1 = create_packed_lora(
         2,
         model,
@@ -634,19 +663,21 @@ def test_packed_loras(dist_init, dummy_model_gate_up, device):
         empty_replaced_module_name="gate_proj",
     )
 
-    manager = LoRAModelManager(model,
-                               2,
-                               2,
-                               2,
-                               LoRAConfig(max_lora_rank=8,
-                                          max_cpu_loras=2,
-                                          max_loras=2,
-                                          lora_dtype=DEFAULT_DTYPE),
-                               device=device)
+    manager = LoRAModelManager(
+        model,
+        2,
+        2,
+        2,
+        LoRAConfig(
+            max_lora_rank=8, max_cpu_loras=2, max_loras=2, lora_dtype=DEFAULT_DTYPE
+        ),
+        device=device,
+    )
     model = manager.model
 
-    assert isinstance(model.get_submodule("gate_up_proj"),
-                      MergedColumnParallelLinearWithLoRA)
+    assert isinstance(
+        model.get_submodule("gate_up_proj"), MergedColumnParallelLinearWithLoRA
+    )
     # Verify packed lora is correct
     model_lora_clone = model_lora.clone(1)
     model_lora_clone1 = model_lora1.clone(1)
@@ -659,21 +690,27 @@ def test_packed_loras(dist_init, dummy_model_gate_up, device):
     packed_lora = model_lora.get_lora("gate_up_proj")
     assert packed_lora and isinstance(packed_lora, PackedLoRALayerWeights)
 
-    torch.testing.assert_close(packed_lora.lora_a[0],
-                               model_lora_clone.get_lora("gate_proj").lora_a)
-    torch.testing.assert_close(packed_lora.lora_b[0],
-                               model_lora_clone.get_lora("gate_proj").lora_b)
-    torch.testing.assert_close(packed_lora.lora_a[1],
-                               model_lora_clone.get_lora("up_proj").lora_a)
-    torch.testing.assert_close(packed_lora.lora_b[1],
-                               model_lora_clone.get_lora("up_proj").lora_b)
+    torch.testing.assert_close(
+        packed_lora.lora_a[0], model_lora_clone.get_lora("gate_proj").lora_a
+    )
+    torch.testing.assert_close(
+        packed_lora.lora_b[0], model_lora_clone.get_lora("gate_proj").lora_b
+    )
+    torch.testing.assert_close(
+        packed_lora.lora_a[1], model_lora_clone.get_lora("up_proj").lora_a
+    )
+    torch.testing.assert_close(
+        packed_lora.lora_b[1], model_lora_clone.get_lora("up_proj").lora_b
+    )
 
     packed_lora1 = model_lora1.get_lora("gate_up_proj")
     assert packed_lora1 and isinstance(packed_lora1, PackedLoRALayerWeights)
 
     assert packed_lora1.lora_a[0] is None
     assert packed_lora1.lora_b[0] is None
-    torch.testing.assert_close(packed_lora1.lora_a[1],
-                               model_lora_clone1.get_lora("up_proj").lora_a)
-    torch.testing.assert_close(packed_lora1.lora_b[1],
-                               model_lora_clone1.get_lora("up_proj").lora_b)
+    torch.testing.assert_close(
+        packed_lora1.lora_a[1], model_lora_clone1.get_lora("up_proj").lora_a
+    )
+    torch.testing.assert_close(
+        packed_lora1.lora_b[1], model_lora_clone1.get_lora("up_proj").lora_b
+    )
diff --git a/tests/lora/test_minicpmv_tp.py b/tests/lora/test_minicpmv_tp.py
index 99fe951bbf07..ce98fe2f8613 100644
--- a/tests/lora/test_minicpmv_tp.py
+++ b/tests/lora/test_minicpmv_tp.py
@@ -15,7 +15,8 @@
 PROMPT_TEMPLATE = (
     "<|begin_of_text|><|start_header_id|>user<|end_header_id|>\n\n"
     "(<image>./</image>)\nWhat is in the image?<|eot_id|>"
-    "<|start_header_id|>assistant<|end_header_id|>\n\n")
+    "<|start_header_id|>assistant<|end_header_id|>\n\n"
+)
 
 IMAGE_ASSETS = [
     ImageAsset("stop_sign"),
@@ -34,18 +35,18 @@ def do_sample(llm: vllm.LLM, lora_path: str, lora_id: int) -> list[str]:
         stop_token_ids=[128001, 128009],  # eos_id, eot_id
     )
 
-    inputs = [{
-        "prompt": PROMPT_TEMPLATE,
-        "multi_modal_data": {
-            "image": asset.pil_image
-        },
-    } for asset in IMAGE_ASSETS]
+    inputs = [
+        {
+            "prompt": PROMPT_TEMPLATE,
+            "multi_modal_data": {"image": asset.pil_image},
+        }
+        for asset in IMAGE_ASSETS
+    ]
 
     outputs = llm.generate(
         inputs,
         sampling_params,
-        lora_request=LoRARequest(str(lora_id), lora_id, lora_path)
-        if lora_id else None,
+        lora_request=LoRARequest(str(lora_id), lora_id, lora_path) if lora_id else None,
     )
     # Print the outputs.
     generated_texts: list[str] = []
@@ -58,7 +59,8 @@ def do_sample(llm: vllm.LLM, lora_path: str, lora_id: int) -> list[str]:
 
 @pytest.mark.xfail(
     current_platform.is_rocm(),
-    reason="MiniCPM-V dependency xformers incompatible with ROCm")
+    reason="MiniCPM-V dependency xformers incompatible with ROCm",
+)
 def test_minicpmv_lora(minicpmv_lora_files):
     llm = vllm.LLM(
         MODEL_PATH,
@@ -68,10 +70,7 @@ def test_minicpmv_lora(minicpmv_lora_files):
         max_lora_rank=8,
         enforce_eager=True,
         max_model_len=2048,
-        limit_mm_per_prompt={
-            "image": 2,
-            "video": 0
-        },
+        limit_mm_per_prompt={"image": 2, "video": 0},
         trust_remote_code=True,
     )
     output1 = do_sample(llm, minicpmv_lora_files, lora_id=1)
@@ -82,11 +81,13 @@ def test_minicpmv_lora(minicpmv_lora_files):
         assert EXPECTED_OUTPUT[i].startswith(output2[i])
 
 
-@pytest.mark.skipif(current_platform.is_cuda_alike(),
-                    reason="Skipping to avoid redundant model tests")
+@pytest.mark.skipif(
+    current_platform.is_cuda_alike(), reason="Skipping to avoid redundant model tests"
+)
 @pytest.mark.xfail(
     current_platform.is_rocm(),
-    reason="MiniCPM-V dependency xformers incompatible with ROCm")
+    reason="MiniCPM-V dependency xformers incompatible with ROCm",
+)
 @create_new_process_for_each_test()
 def test_minicpmv_tp4_wo_fully_sharded_loras(minicpmv_lora_files):
     llm = vllm.LLM(
@@ -96,10 +97,7 @@ def test_minicpmv_tp4_wo_fully_sharded_loras(minicpmv_lora_files):
         max_loras=4,
         max_lora_rank=64,
         tensor_parallel_size=4,
-        limit_mm_per_prompt={
-            "image": 2,
-            "video": 0
-        },
+        limit_mm_per_prompt={"image": 2, "video": 0},
         trust_remote_code=True,
     )
     output_tp = do_sample(llm, minicpmv_lora_files, lora_id=1)
@@ -107,11 +105,13 @@ def test_minicpmv_tp4_wo_fully_sharded_loras(minicpmv_lora_files):
         assert EXPECTED_OUTPUT[i].startswith(output_tp[i])
 
 
-@pytest.mark.skipif(current_platform.is_cuda_alike(),
-                    reason="Skipping to avoid redundant model tests")
+@pytest.mark.skipif(
+    current_platform.is_cuda_alike(), reason="Skipping to avoid redundant model tests"
+)
 @pytest.mark.xfail(
     current_platform.is_rocm(),
-    reason="MiniCPM-V dependency xformers incompatible with ROCm")
+    reason="MiniCPM-V dependency xformers incompatible with ROCm",
+)
 @create_new_process_for_each_test()
 def test_minicpmv_tp4_fully_sharded_loras(minicpmv_lora_files):
     llm = vllm.LLM(
@@ -122,10 +122,7 @@ def test_minicpmv_tp4_fully_sharded_loras(minicpmv_lora_files):
         max_lora_rank=8,
         tensor_parallel_size=4,
         trust_remote_code=True,
-        limit_mm_per_prompt={
-            "image": 1,
-            "video": 0
-        },
+        limit_mm_per_prompt={"image": 1, "video": 0},
         fully_sharded_loras=True,
     )
     output_tp = do_sample(llm, minicpmv_lora_files, lora_id=1)
diff --git a/tests/lora/test_mixtral.py b/tests/lora/test_mixtral.py
index 03e5d8d5d672..868ca51b3331 100644
--- a/tests/lora/test_mixtral.py
+++ b/tests/lora/test_mixtral.py
@@ -11,15 +11,15 @@
 MODEL_PATH = "mistralai/Mixtral-8x7B-Instruct-v0.1"
 
 
-def do_sample(llm: vllm.LLM, lora_path: str, lora_id: int,
-              prompts: list[str]) -> list[str]:
-
+def do_sample(
+    llm: vllm.LLM, lora_path: str, lora_id: int, prompts: list[str]
+) -> list[str]:
     sampling_params = vllm.SamplingParams(temperature=0, max_tokens=256)
     outputs = llm.generate(
         prompts,
         sampling_params,
-        lora_request=LoRARequest(str(lora_id), lora_id, lora_path)
-        if lora_id else None)
+        lora_request=LoRARequest(str(lora_id), lora_id, lora_path) if lora_id else None,
+    )
     # Print the outputs.
     generated_texts: list[str] = []
     for output in outputs:
@@ -33,8 +33,11 @@ def do_sample(llm: vllm.LLM, lora_path: str, lora_id: int,
 @pytest.mark.parametrize("tp_size", [4])
 def test_mixtral_lora(mixtral_lora_files, tp_size):
     """Original test, the LoRA model has the common target modules, not all"""
-    if torch.cuda.device_count(
-    ) < tp_size and tp_size > 1 and current_platform.is_cuda_alike():
+    if (
+        torch.cuda.device_count() < tp_size
+        and tp_size > 1
+        and current_platform.is_cuda_alike()
+    ):
         pytest.skip(f"Not enough GPUs for tensor parallelism {tp_size}")
 
     prompts = [
@@ -57,7 +60,11 @@ def test_mixtral_lora(mixtral_lora_files, tp_size):
         "give_opinion(name[SpellForce 3], developer[Grimlore Games], release_year[2017], rating[poor])",  # noqa: E501
         "inform(name[BioShock], release_year[2007], rating[good], genres[action-adventure, role-playing, shooter], platforms[PlayStation, Xbox, PC], available_on_steam[yes], has_linux_release[no], has_mac_release[yes])",  # noqa: E501
     ]
-    assert do_sample(llm, mixtral_lora_files, lora_id=1,
-                     prompts=prompts) == expected_lora_output
-    assert do_sample(llm, mixtral_lora_files, lora_id=2,
-                     prompts=prompts) == expected_lora_output
+    assert (
+        do_sample(llm, mixtral_lora_files, lora_id=1, prompts=prompts)
+        == expected_lora_output
+    )
+    assert (
+        do_sample(llm, mixtral_lora_files, lora_id=2, prompts=prompts)
+        == expected_lora_output
+    )
diff --git a/tests/lora/test_peft_helper.py b/tests/lora/test_peft_helper.py
index ffffb5d8eab9..2cc8bfe63495 100644
--- a/tests/lora/test_peft_helper.py
+++ b/tests/lora/test_peft_helper.py
@@ -13,34 +13,27 @@
 ERROR_CASES = [
     (
         "test_rank",
-        {
-            "r": 1024
-        },
+        {"r": 1024},
         "is greater than max_lora_rank",
     ),
     (
         "test_bias",
-        {
-            "bias": "all"
-        },
+        {"bias": "all"},
         "Adapter bias cannot be used without bias_enabled",
     ),
-    ("test_dora", {
-        "use_dora": True
-    }, "does not yet support DoRA"),
+    ("test_dora", {"use_dora": True}, "does not yet support DoRA"),
     (
         "test_modules_to_save",
-        {
-            "modules_to_save": ["lm_head"]
-        },
+        {"modules_to_save": ["lm_head"]},
         "only supports modules_to_save being None",
     ),
 ]
 
 
 def test_peft_helper_pass(sql_lora_files, tmp_path):
-    peft_helper = PEFTHelper.from_local_dir(sql_lora_files,
-                                            max_position_embeddings=4096)
+    peft_helper = PEFTHelper.from_local_dir(
+        sql_lora_files, max_position_embeddings=4096
+    )
     lora_config = LoRAConfig(max_lora_rank=16, max_cpu_loras=3, max_loras=2)
     peft_helper.validate_legal(lora_config)
     assert peft_helper.r == 8
@@ -74,8 +67,7 @@ def test_peft_helper_pass(sql_lora_files, tmp_path):
     with open(config_path, "w") as f:
         json.dump(adapter_config, f)
 
-    peft_helper = PEFTHelper.from_local_dir(test_dir,
-                                            max_position_embeddings=4096)
+    peft_helper = PEFTHelper.from_local_dir(test_dir, max_position_embeddings=4096)
     peft_helper.validate_legal(lora_config)
     scaling = peft_helper.lora_alpha / math.sqrt(peft_helper.r)
     assert abs(peft_helper.vllm_lora_scaling_factor - scaling) < 1e-3
@@ -106,4 +98,5 @@ def test_peft_helper_error(
     # Test loading the adapter
     with pytest.raises(ValueError, match=expected_error):
         PEFTHelper.from_local_dir(
-            test_dir, max_position_embeddings=4096).validate_legal(lora_config)
+            test_dir, max_position_embeddings=4096
+        ).validate_legal(lora_config)
diff --git a/tests/lora/test_punica_ops.py b/tests/lora/test_punica_ops.py
index 14fa79ae5b44..e4df9751077d 100644
--- a/tests/lora/test_punica_ops.py
+++ b/tests/lora/test_punica_ops.py
@@ -21,11 +21,18 @@ def reset_device(reset_default_device):
 
 # Utility shrink and expand operations used as reference implementations.
 def sgmv_shrink_for_nslices(
-        nslices: int, inputs_tensor: torch.Tensor,
-        lora_weights_lst: list[torch.Tensor], out_tensor: torch.Tensor,
-        b_seq_start_loc: torch.Tensor, seq_len_tensor: torch.Tensor,
-        prompt_lora_mapping: torch.Tensor, batches: int, max_seq_length: int,
-        num_tokens: int, scaling: float):
+    nslices: int,
+    inputs_tensor: torch.Tensor,
+    lora_weights_lst: list[torch.Tensor],
+    out_tensor: torch.Tensor,
+    b_seq_start_loc: torch.Tensor,
+    seq_len_tensor: torch.Tensor,
+    prompt_lora_mapping: torch.Tensor,
+    batches: int,
+    max_seq_length: int,
+    num_tokens: int,
+    scaling: float,
+):
     """
     Wrapper around torch_ops.sgmv_shrink that handles any nslices.
     """
@@ -44,15 +51,20 @@ def sgmv_shrink_for_nslices(
         )
 
 
-def sgmv_expand_for_nslices(nslices: int, hidden_size: int,
-                            inputs_tensor: torch.Tensor,
-                            lora_weights_lst: list[torch.Tensor],
-                            out_tensor: torch.Tensor,
-                            b_seq_start_loc: torch.Tensor,
-                            seq_len_tensor: torch.Tensor,
-                            prompt_lora_mapping: torch.Tensor, batches: int,
-                            max_seq_length: int, num_tokens: int,
-                            add_inputs: bool) -> None:
+def sgmv_expand_for_nslices(
+    nslices: int,
+    hidden_size: int,
+    inputs_tensor: torch.Tensor,
+    lora_weights_lst: list[torch.Tensor],
+    out_tensor: torch.Tensor,
+    b_seq_start_loc: torch.Tensor,
+    seq_len_tensor: torch.Tensor,
+    prompt_lora_mapping: torch.Tensor,
+    batches: int,
+    max_seq_length: int,
+    num_tokens: int,
+    add_inputs: bool,
+) -> None:
     """
     Wrapper around torch_ops.sgmv_expand that handles any nslices.
     """
@@ -94,10 +106,17 @@ def sgmv_expand_for_nslices(nslices: int, hidden_size: int,
 _dict_lock = Lock()
 
 
-def check_lora_shrink_kernel(batches: int, num_loras: int, rank: int,
-                             hidden_size: int, nslices: int,
-                             dtype: torch.dtype, device: str, seq_length: int,
-                             scaling: float):
+def check_lora_shrink_kernel(
+    batches: int,
+    num_loras: int,
+    rank: int,
+    hidden_size: int,
+    nslices: int,
+    dtype: torch.dtype,
+    device: str,
+    seq_length: int,
+    scaling: float,
+):
     """
     Compare outputs of torch_ops.sgmv_shrink and triton_ops.lora_shrink
     kernels.
@@ -116,14 +135,19 @@ def check_lora_shrink_kernel(batches: int, num_loras: int, rank: int,
     max_seq_length, token_nums = data.meta()
 
     # Setup metadata information for SGMV and reference kernels
-    sgmv_meta_args = (data.b_seq_start_loc, data.seq_len_tensor,
-                      data.prompt_lora_mapping, batches, max_seq_length,
-                      token_nums)
+    sgmv_meta_args = (
+        data.b_seq_start_loc,
+        data.seq_len_tensor,
+        data.prompt_lora_mapping,
+        batches,
+        max_seq_length,
+        token_nums,
+    )
 
     # Setup metadata information for the LoRA kernel.
-    lora_meta = LoRAKernelMeta.make(max_loras=num_loras,
-                                    max_num_tokens=token_nums,
-                                    device='cuda')
+    lora_meta = LoRAKernelMeta.make(
+        max_loras=num_loras, max_num_tokens=token_nums, device="cuda"
+    )
     lora_meta.prepare_tensors(data.token_lora_mapping)
 
     ref_out_tensor = data.ref_out_tensor
@@ -154,10 +178,17 @@ def check_lora_shrink_kernel(batches: int, num_loras: int, rank: int,
     assert_close(out_tensor, ref_out_tensor)
 
 
-def check_lora_expand_kernel(batches: int, num_loras: int, rank: int,
-                             hidden_size: int, nslices: int,
-                             dtype: torch.dtype, device: str, seq_length: int,
-                             add_inputs: bool):
+def check_lora_expand_kernel(
+    batches: int,
+    num_loras: int,
+    rank: int,
+    hidden_size: int,
+    nslices: int,
+    dtype: torch.dtype,
+    device: str,
+    seq_length: int,
+    add_inputs: bool,
+):
     """
     Compare outputs of torch_ops.sgmv_expand and triton_ops.lora_expand
     kernels.
@@ -177,14 +208,19 @@ def check_lora_expand_kernel(batches: int, num_loras: int, rank: int,
     max_seq_length, token_nums = data.meta()
 
     # Setup metadata information for SGMV and reference kernels
-    sgmv_meta_args = (data.b_seq_start_loc, data.seq_len_tensor,
-                      data.prompt_lora_mapping, batches, max_seq_length,
-                      token_nums)
+    sgmv_meta_args = (
+        data.b_seq_start_loc,
+        data.seq_len_tensor,
+        data.prompt_lora_mapping,
+        batches,
+        max_seq_length,
+        token_nums,
+    )
 
     # Setup metadata information for the LoRA kernel.
-    lora_meta = LoRAKernelMeta.make(max_loras=num_loras,
-                                    max_num_tokens=token_nums,
-                                    device='cuda')
+    lora_meta = LoRAKernelMeta.make(
+        max_loras=num_loras, max_num_tokens=token_nums, device="cuda"
+    )
     lora_meta.prepare_tensors(data.token_lora_mapping)
 
     # Setup output tensors
@@ -194,21 +230,25 @@ def check_lora_expand_kernel(batches: int, num_loras: int, rank: int,
     with _dict_lock:
         # lora_expand kernel
         _LORA_B_PTR_DICT.clear()
-        triton_ops.lora_expand(data.inputs_tensor,
-                               data.lora_weights,
-                               out_tensor,
-                               *lora_meta.meta_args(token_nums=token_nums),
-                               offset_start=0,
-                               add_inputs=add_inputs)
+        triton_ops.lora_expand(
+            data.inputs_tensor,
+            data.lora_weights,
+            out_tensor,
+            *lora_meta.meta_args(token_nums=token_nums),
+            offset_start=0,
+            add_inputs=add_inputs,
+        )
 
     # Reference
-    sgmv_expand_for_nslices(nslices,
-                            hidden_size,
-                            data.inputs_tensor,
-                            data.lora_weights,
-                            ref_out_tensor,
-                            *sgmv_meta_args,
-                            add_inputs=add_inputs)
+    sgmv_expand_for_nslices(
+        nslices,
+        hidden_size,
+        data.inputs_tensor,
+        data.lora_weights,
+        ref_out_tensor,
+        *sgmv_meta_args,
+        add_inputs=add_inputs,
+    )
 
     assert_close(out_tensor, ref_out_tensor)
 
@@ -299,7 +339,7 @@ def check_lora_expand_kernel(batches: int, num_loras: int, rank: int,
     128000,
     128256,
 ]
-#The size of TP
+# The size of TP
 divisibility = [1, 2, 8, 16, 64]
 
 all_hidden_size = []
@@ -331,10 +371,10 @@ def check_lora_expand_kernel(batches: int, num_loras: int, rank: int,
 SEED = [0]
 
 
-@pytest.mark.parametrize("batches", test_params['batches'])
-@pytest.mark.parametrize("num_loras", test_params['num_loras'])
-@pytest.mark.parametrize("rank", test_params['max_ranks'])
-@pytest.mark.parametrize("hidden_size", test_params['hidden_sizes'])
+@pytest.mark.parametrize("batches", test_params["batches"])
+@pytest.mark.parametrize("num_loras", test_params["num_loras"])
+@pytest.mark.parametrize("rank", test_params["max_ranks"])
+@pytest.mark.parametrize("hidden_size", test_params["hidden_sizes"])
 @pytest.mark.parametrize("nslices", [1, 2, 3])
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("device", DEVICES)
@@ -358,31 +398,35 @@ def test_kernels(
     current_platform.seed_everything(seed)
 
     if op_type == "shrink":
-        check_lora_shrink_kernel(batches=batches,
-                                 num_loras=num_loras,
-                                 rank=rank,
-                                 hidden_size=hidden_size,
-                                 nslices=nslices,
-                                 dtype=dtype,
-                                 device=device,
-                                 seq_length=128,
-                                 scaling=0.5)
+        check_lora_shrink_kernel(
+            batches=batches,
+            num_loras=num_loras,
+            rank=rank,
+            hidden_size=hidden_size,
+            nslices=nslices,
+            dtype=dtype,
+            device=device,
+            seq_length=128,
+            scaling=0.5,
+        )
     else:
-        check_lora_expand_kernel(batches=batches,
-                                 num_loras=num_loras,
-                                 rank=rank,
-                                 hidden_size=hidden_size,
-                                 nslices=nslices,
-                                 dtype=dtype,
-                                 device=device,
-                                 seq_length=128,
-                                 add_inputs=True)
-
-
-@pytest.mark.parametrize("batches", hs_test_params['batches'])
-@pytest.mark.parametrize("num_loras", hs_test_params['num_loras'])
-@pytest.mark.parametrize("rank", hs_test_params['max_ranks'])
-@pytest.mark.parametrize("hidden_size", hs_test_params['hidden_sizes'])
+        check_lora_expand_kernel(
+            batches=batches,
+            num_loras=num_loras,
+            rank=rank,
+            hidden_size=hidden_size,
+            nslices=nslices,
+            dtype=dtype,
+            device=device,
+            seq_length=128,
+            add_inputs=True,
+        )
+
+
+@pytest.mark.parametrize("batches", hs_test_params["batches"])
+@pytest.mark.parametrize("num_loras", hs_test_params["num_loras"])
+@pytest.mark.parametrize("rank", hs_test_params["max_ranks"])
+@pytest.mark.parametrize("hidden_size", hs_test_params["hidden_sizes"])
 @pytest.mark.parametrize("nslices", [1, 2, 3])
 @pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("device", DEVICES)
@@ -406,22 +450,26 @@ def test_kernels_hidden_size(
     current_platform.seed_everything(seed)
 
     if op_type == "shrink":
-        check_lora_shrink_kernel(batches=batches,
-                                 num_loras=num_loras,
-                                 rank=rank,
-                                 hidden_size=hidden_size,
-                                 nslices=nslices,
-                                 dtype=dtype,
-                                 device=device,
-                                 seq_length=128,
-                                 scaling=0.5)
+        check_lora_shrink_kernel(
+            batches=batches,
+            num_loras=num_loras,
+            rank=rank,
+            hidden_size=hidden_size,
+            nslices=nslices,
+            dtype=dtype,
+            device=device,
+            seq_length=128,
+            scaling=0.5,
+        )
     else:
-        check_lora_expand_kernel(batches=batches,
-                                 num_loras=num_loras,
-                                 rank=rank,
-                                 hidden_size=hidden_size,
-                                 nslices=nslices,
-                                 dtype=dtype,
-                                 device=device,
-                                 seq_length=128,
-                                 add_inputs=True)
+        check_lora_expand_kernel(
+            batches=batches,
+            num_loras=num_loras,
+            rank=rank,
+            hidden_size=hidden_size,
+            nslices=nslices,
+            dtype=dtype,
+            device=device,
+            seq_length=128,
+            add_inputs=True,
+        )
diff --git a/tests/lora/test_quant_model.py b/tests/lora/test_quant_model.py
index 2b54b2edd6a9..06e1b22ab56e 100644
--- a/tests/lora/test_quant_model.py
+++ b/tests/lora/test_quant_model.py
@@ -20,28 +20,27 @@ class ModelWithQuantization:
 
 
 MODELS: list[ModelWithQuantization]
-#AWQ quantization is currently not supported in ROCm.
+# AWQ quantization is currently not supported in ROCm.
 if current_platform.is_rocm():
     MODELS = [
         ModelWithQuantization(
-            model_path="TheBloke/TinyLlama-1.1B-Chat-v0.3-GPTQ",
-            quantization="gptq"),
+            model_path="TheBloke/TinyLlama-1.1B-Chat-v0.3-GPTQ", quantization="gptq"
+        ),
     ]
 else:
     MODELS = [
         ModelWithQuantization(
-            model_path="TheBloke/TinyLlama-1.1B-Chat-v0.3-AWQ",
-            quantization="awq"),
+            model_path="TheBloke/TinyLlama-1.1B-Chat-v0.3-AWQ", quantization="awq"
+        ),
         ModelWithQuantization(
-            model_path="TheBloke/TinyLlama-1.1B-Chat-v0.3-GPTQ",
-            quantization="gptq"),
+            model_path="TheBloke/TinyLlama-1.1B-Chat-v0.3-GPTQ", quantization="gptq"
+        ),
     ]
 
 
-def do_sample(llm: vllm.LLM,
-              lora_path: str,
-              lora_id: int,
-              max_tokens: int = 256) -> list[str]:
+def do_sample(
+    llm: vllm.LLM, lora_path: str, lora_id: int, max_tokens: int = 256
+) -> list[str]:
     raw_prompts = [
         "Give me an orange-ish brown color",
         "Give me a neon pink color",
@@ -52,14 +51,14 @@ def format_prompt_tuples(prompt):
 
     prompts = [format_prompt_tuples(p) for p in raw_prompts]
 
-    sampling_params = vllm.SamplingParams(temperature=0,
-                                          max_tokens=max_tokens,
-                                          stop=["<|im_end|>"])
+    sampling_params = vllm.SamplingParams(
+        temperature=0, max_tokens=max_tokens, stop=["<|im_end|>"]
+    )
     outputs = llm.generate(
         prompts,
         sampling_params,
-        lora_request=LoRARequest(str(lora_id), lora_id, lora_path)
-        if lora_id else None)
+        lora_request=LoRARequest(str(lora_id), lora_id, lora_path) if lora_id else None,
+    )
     # Print the outputs.
     generated_texts: list[str] = []
     for output in outputs:
@@ -72,18 +71,18 @@ def format_prompt_tuples(prompt):
 
 @pytest.mark.parametrize("model", MODELS)
 def test_quant_model_lora(tinyllama_lora_files, model):
-
     llm = vllm.LLM(
         model=model.model_path,
         enable_lora=True,
         max_num_seqs=16,
         max_loras=4,
         max_model_len=400,
-        gpu_memory_utilization=0.2,  #avoid OOM
+        gpu_memory_utilization=0.2,  # avoid OOM
         quantization=model.quantization,
         trust_remote_code=True,
         enable_chunked_prefill=True,
-        tokenizer=tinyllama_lora_files)
+        tokenizer=tinyllama_lora_files,
+    )
 
     if model.quantization is None:
         expected_lora_output = [
@@ -104,11 +103,11 @@ def test_quant_model_lora(tinyllama_lora_files, model):
     def expect_match(output, expected_output):
         # HACK: GPTQ lora outputs are just incredibly unstable.
         # Assert that the outputs changed.
-        if (model.quantization == "gptq"
-                and expected_output is expected_lora_output):
+        if model.quantization == "gptq" and expected_output is expected_lora_output:
             for i, o in enumerate(output):
-                assert o.startswith(
-                    '#'), f"Expected example {i} to start with # but got {o}"
+                assert o.startswith("#"), (
+                    f"Expected example {i} to start with # but got {o}"
+                )
             return
         assert output == expected_output
 
@@ -116,17 +115,11 @@ def expect_match(output, expected_output):
 
     print("lora adapter created")
     print("lora 1")
-    output = do_sample(llm,
-                       tinyllama_lora_files,
-                       lora_id=1,
-                       max_tokens=max_tokens)
+    output = do_sample(llm, tinyllama_lora_files, lora_id=1, max_tokens=max_tokens)
     expect_match(output, expected_lora_output)
 
     print("lora 2")
-    output = do_sample(llm,
-                       tinyllama_lora_files,
-                       lora_id=2,
-                       max_tokens=max_tokens)
+    output = do_sample(llm, tinyllama_lora_files, lora_id=2, max_tokens=max_tokens)
     expect_match(output, expected_lora_output)
 
     print("removing lora")
@@ -136,8 +129,7 @@ def expect_match(output, expected_output):
 
 
 @pytest.mark.parametrize("model", MODELS)
-def test_quant_model_tp_equality(tinyllama_lora_files, num_gpus_available,
-                                 model):
+def test_quant_model_tp_equality(tinyllama_lora_files, num_gpus_available, model):
     if num_gpus_available < 2:
         pytest.skip(f"Not enough GPUs for tensor parallelism {2}")
     if model.quantization == "gptq":
@@ -147,10 +139,11 @@ def test_quant_model_tp_equality(tinyllama_lora_files, num_gpus_available,
         enable_lora=True,
         max_num_seqs=16,
         max_loras=4,
-        gpu_memory_utilization=0.2,  #avoid OOM
+        gpu_memory_utilization=0.2,  # avoid OOM
         quantization=model.quantization,
         trust_remote_code=True,
-        enable_chunked_prefill=True)
+        enable_chunked_prefill=True,
+    )
     output_tp1 = do_sample(llm_tp1, tinyllama_lora_files, lora_id=1)
 
     del llm_tp1
@@ -162,9 +155,10 @@ def test_quant_model_tp_equality(tinyllama_lora_files, num_gpus_available,
         max_num_seqs=16,
         max_loras=4,
         tensor_parallel_size=2,
-        gpu_memory_utilization=0.2,  #avoid OOM
+        gpu_memory_utilization=0.2,  # avoid OOM
         quantization=model.quantization,
-        enable_chunked_prefill=True)
+        enable_chunked_prefill=True,
+    )
     output_tp2 = do_sample(llm_tp2, tinyllama_lora_files, lora_id=1)
 
     del llm_tp2
diff --git a/tests/lora/test_qwen2vl.py b/tests/lora/test_qwen2vl.py
index 76f3bc0ebf89..894263bd0ba3 100644
--- a/tests/lora/test_qwen2vl.py
+++ b/tests/lora/test_qwen2vl.py
@@ -37,7 +37,8 @@ class Qwen2VLTester:
         "<|im_start|>system\nYou are a helpful assistant.<|im_end|>"
         "\n<|im_start|>user\n<|vision_start|><|image_pad|><|vision_end|>"
         "What is in the image?<|im_end|>\n"
-        "<|im_start|>assistant\n")
+        "<|im_start|>assistant\n"
+    )
 
     def __init__(self, config: TestConfig):
         self.config = config
@@ -56,68 +57,68 @@ def _initialize_llm(self) -> vllm.LLM:
             max_model_len=self.config.max_model_len,
         )
 
-    def run_test(self,
-                 images: list[ImageAsset],
-                 expected_outputs: list[str],
-                 lora_id: Optional[int] = None,
-                 temperature: float = 0,
-                 max_tokens: int = 5):
-
+    def run_test(
+        self,
+        images: list[ImageAsset],
+        expected_outputs: list[str],
+        lora_id: Optional[int] = None,
+        temperature: float = 0,
+        max_tokens: int = 5,
+    ):
         sampling_params = vllm.SamplingParams(
             temperature=temperature,
             max_tokens=max_tokens,
         )
-        inputs = [{
-            "prompt": self.PROMPT_TEMPLATE,
-            "multi_modal_data": {
-                "image": asset.pil_image
-            },
-        } for asset in images]
-
-        lora_request = LoRARequest(str(lora_id), lora_id,
-                                   self.config.lora_path)
-        outputs = self.llm.generate(inputs,
-                                    sampling_params,
-                                    lora_request=lora_request)
-        generated_texts = [
-            output.outputs[0].text.strip() for output in outputs
+        inputs = [
+            {
+                "prompt": self.PROMPT_TEMPLATE,
+                "multi_modal_data": {"image": asset.pil_image},
+            }
+            for asset in images
         ]
 
+        lora_request = LoRARequest(str(lora_id), lora_id, self.config.lora_path)
+        outputs = self.llm.generate(inputs, sampling_params, lora_request=lora_request)
+        generated_texts = [output.outputs[0].text.strip() for output in outputs]
+
         # Validate outputs
         for generated, expected in zip(generated_texts, expected_outputs):
-            assert expected.startswith(
-                generated), f"Generated text {generated} doesn't "
+            assert expected.startswith(generated), (
+                f"Generated text {generated} doesn't "
+            )
             f"match expected pattern {expected}"
 
-    def run_beam_search_test(self,
-                             images: list[ImageAsset],
-                             expected_outputs: list[list[str]],
-                             lora_id: Optional[int] = None,
-                             temperature: float = 0,
-                             beam_width: int = 2,
-                             max_tokens: int = 5):
-
-        beam_search_params = BeamSearchParams(beam_width=beam_width,
-                                              max_tokens=max_tokens,
-                                              temperature=temperature)
-
-        inputs = [{
-            "prompt": self.PROMPT_TEMPLATE,
-            "multi_modal_data": {
-                "image": asset.pil_image
-            },
-        } for asset in images]
-
-        lora_request = LoRARequest(str(lora_id), lora_id,
-                                   self.config.lora_path)
-        outputs = self.llm.beam_search(inputs,
-                                       beam_search_params,
-                                       lora_request=lora_request)
+    def run_beam_search_test(
+        self,
+        images: list[ImageAsset],
+        expected_outputs: list[list[str]],
+        lora_id: Optional[int] = None,
+        temperature: float = 0,
+        beam_width: int = 2,
+        max_tokens: int = 5,
+    ):
+        beam_search_params = BeamSearchParams(
+            beam_width=beam_width, max_tokens=max_tokens, temperature=temperature
+        )
+
+        inputs = [
+            {
+                "prompt": self.PROMPT_TEMPLATE,
+                "multi_modal_data": {"image": asset.pil_image},
+            }
+            for asset in images
+        ]
+
+        lora_request = LoRARequest(str(lora_id), lora_id, self.config.lora_path)
+        outputs = self.llm.beam_search(
+            inputs, beam_search_params, lora_request=lora_request
+        )
 
         for output_obj, expected_outs in zip(outputs, expected_outputs):
             output_texts = [seq.text for seq in output_obj.sequences]
-            assert output_texts == expected_outs, \
-                f"Generated texts {output_texts} do not match expected {expected_outs}"  # noqa: E501
+            assert output_texts == expected_outs, (
+                f"Generated texts {output_texts} do not match expected {expected_outs}"
+            )  # noqa: E501
 
 
 TEST_IMAGES = [
@@ -144,27 +145,25 @@ def run_beam_search_test(self,
 
 @pytest.mark.xfail(
     current_platform.is_rocm(),
-    reason="Qwen2-VL dependency xformers incompatible with ROCm")
+    reason="Qwen2-VL dependency xformers incompatible with ROCm",
+)
 def test_qwen2vl_lora(qwen2vl_lora_files):
     """Test Qwen 2.0 VL model with LoRA"""
-    config = TestConfig(model_path=QWEN2VL_MODEL_PATH,
-                        lora_path=qwen2vl_lora_files)
+    config = TestConfig(model_path=QWEN2VL_MODEL_PATH, lora_path=qwen2vl_lora_files)
     tester = Qwen2VLTester(config)
 
     # Test with different LoRA IDs
     for lora_id in [1, 2]:
-        tester.run_test(TEST_IMAGES,
-                        expected_outputs=EXPECTED_OUTPUTS,
-                        lora_id=lora_id)
+        tester.run_test(TEST_IMAGES, expected_outputs=EXPECTED_OUTPUTS, lora_id=lora_id)
 
 
 @pytest.mark.xfail(
     current_platform.is_rocm(),
-    reason="Qwen2-VL dependency xformers incompatible with ROCm")
+    reason="Qwen2-VL dependency xformers incompatible with ROCm",
+)
 def test_qwen2vl_lora_beam_search(qwen2vl_lora_files):
     """Test Qwen 2.0 VL model with LoRA through beam search."""
-    config = TestConfig(model_path=QWEN2VL_MODEL_PATH,
-                        lora_path=qwen2vl_lora_files)
+    config = TestConfig(model_path=QWEN2VL_MODEL_PATH, lora_path=qwen2vl_lora_files)
     tester = Qwen2VLTester(config)
 
     # Test with different LoRA IDs
@@ -176,7 +175,8 @@ def test_qwen2vl_lora_beam_search(qwen2vl_lora_files):
         tester.run_beam_search_test(
             [ImageAsset("cherry_blossom")],
             expected_outputs=EXPECTED_BEAM_SEARCH_OUTPUTS,
-            lora_id=lora_id)
+            lora_id=lora_id,
+        )
 
 
 @pytest.mark.xfail(
@@ -185,12 +185,9 @@ def test_qwen2vl_lora_beam_search(qwen2vl_lora_files):
 )
 def test_qwen25vl_lora(qwen25vl_lora_files):
     """Test Qwen 2.5 VL model with LoRA"""
-    config = TestConfig(model_path=QWEN25VL_MODEL_PATH,
-                        lora_path=qwen25vl_lora_files)
+    config = TestConfig(model_path=QWEN25VL_MODEL_PATH, lora_path=qwen25vl_lora_files)
     tester = Qwen2VLTester(config)
 
     # Test with different LoRA IDs
     for lora_id in [1, 2]:
-        tester.run_test(TEST_IMAGES,
-                        expected_outputs=EXPECTED_OUTPUTS,
-                        lora_id=lora_id)
+        tester.run_test(TEST_IMAGES, expected_outputs=EXPECTED_OUTPUTS, lora_id=lora_id)
diff --git a/tests/lora/test_resolver.py b/tests/lora/test_resolver.py
index 6c93e577611f..c70e58a375c7 100644
--- a/tests/lora/test_resolver.py
+++ b/tests/lora/test_resolver.py
@@ -12,13 +12,15 @@
 class DummyLoRAResolver(LoRAResolver):
     """A dummy LoRA resolver for testing."""
 
-    async def resolve_lora(self, base_model_name: str,
-                           lora_name: str) -> Optional[LoRARequest]:
+    async def resolve_lora(
+        self, base_model_name: str, lora_name: str
+    ) -> Optional[LoRARequest]:
         if lora_name == "test_lora":
             return LoRARequest(
                 lora_name=lora_name,
                 lora_path=f"/dummy/path/{base_model_name}/{lora_name}",
-                lora_int_id=abs(hash(lora_name)))
+                lora_int_id=abs(hash(lora_name)),
+            )
         return None
 
 
@@ -70,6 +72,5 @@ async def test_dummy_resolver_resolve():
     assert result.lora_path == f"/dummy/path/{base_model_name}/{lora_name}"
 
     # Test failed resolution
-    result = await dummy_resolver.resolve_lora(base_model_name,
-                                               "nonexistent_lora")
+    result = await dummy_resolver.resolve_lora(base_model_name, "nonexistent_lora")
     assert result is None
diff --git a/tests/lora/test_transformers_model.py b/tests/lora/test_transformers_model.py
index 723f7a54778f..ea1f5f9c32c3 100644
--- a/tests/lora/test_transformers_model.py
+++ b/tests/lora/test_transformers_model.py
@@ -24,20 +24,18 @@ def do_sample(llm: vllm.LLM, lora_path: str, lora_id: int) -> list[str]:
     prompts = [
         PROMPT_TEMPLATE.format(query="How many singers do we have?"),
         PROMPT_TEMPLATE.format(
-            query=
-            "What is the average, minimum, and maximum age of all singers from France?"  # noqa: E501
+            query="What is the average, minimum, and maximum age of all singers from France?"  # noqa: E501
         ),
         PROMPT_TEMPLATE.format(
-            query=
-            "What are all distinct countries where singers above age 20 are from?"  # noqa: E501
+            query="What are all distinct countries where singers above age 20 are from?"  # noqa: E501
         ),
     ]
     sampling_params = vllm.SamplingParams(temperature=0, max_tokens=32)
     outputs = llm.generate(
         prompts,
         sampling_params,
-        lora_request=LoRARequest(str(lora_id), lora_id, lora_path)
-        if lora_id else None)
+        lora_request=LoRARequest(str(lora_id), lora_id, lora_path) if lora_id else None,
+    )
     # Print the outputs.
     generated_texts: list[str] = []
     for output in outputs:
@@ -49,13 +47,15 @@ def do_sample(llm: vllm.LLM, lora_path: str, lora_id: int) -> list[str]:
 
 
 def test_ilama_lora(ilama_lora_files):
-    llm = vllm.LLM(MODEL_PATH,
-                   max_model_len=1024,
-                   enable_lora=True,
-                   max_loras=4,
-                   max_lora_rank=16,
-                   trust_remote_code=True,
-                   enable_chunked_prefill=True)
+    llm = vllm.LLM(
+        MODEL_PATH,
+        max_model_len=1024,
+        enable_lora=True,
+        max_loras=4,
+        max_lora_rank=16,
+        trust_remote_code=True,
+        enable_chunked_prefill=True,
+    )
 
     output1 = do_sample(llm, ilama_lora_files, lora_id=1)
     for i in range(len(EXPECTED_LORA_OUTPUT)):
@@ -65,20 +65,23 @@ def test_ilama_lora(ilama_lora_files):
         assert output2[i] == EXPECTED_LORA_OUTPUT[i]
 
 
-@pytest.mark.skipif(current_platform.is_cuda_alike(),
-                    reason="Skipping to avoid redundant model tests")
+@pytest.mark.skipif(
+    current_platform.is_cuda_alike(), reason="Skipping to avoid redundant model tests"
+)
 @multi_gpu_test(num_gpus=4)
 @create_new_process_for_each_test()
 def test_ilama_lora_tp4(ilama_lora_files):
-    llm = vllm.LLM(MODEL_PATH,
-                   max_model_len=1024,
-                   enable_lora=True,
-                   max_loras=4,
-                   max_lora_rank=16,
-                   tensor_parallel_size=4,
-                   trust_remote_code=True,
-                   fully_sharded_loras=False,
-                   enable_chunked_prefill=True)
+    llm = vllm.LLM(
+        MODEL_PATH,
+        max_model_len=1024,
+        enable_lora=True,
+        max_loras=4,
+        max_lora_rank=16,
+        tensor_parallel_size=4,
+        trust_remote_code=True,
+        fully_sharded_loras=False,
+        enable_chunked_prefill=True,
+    )
 
     output1 = do_sample(llm, ilama_lora_files, lora_id=1)
     for i in range(len(EXPECTED_LORA_OUTPUT)):
@@ -88,20 +91,23 @@ def test_ilama_lora_tp4(ilama_lora_files):
         assert output2[i] == EXPECTED_LORA_OUTPUT[i]
 
 
-@pytest.mark.skipif(current_platform.is_cuda_alike(),
-                    reason="Skipping to avoid redundant model tests")
+@pytest.mark.skipif(
+    current_platform.is_cuda_alike(), reason="Skipping to avoid redundant model tests"
+)
 @multi_gpu_test(num_gpus=4)
 @create_new_process_for_each_test()
 def test_ilama_lora_tp4_fully_sharded_loras(ilama_lora_files):
-    llm = vllm.LLM(MODEL_PATH,
-                   max_model_len=1024,
-                   enable_lora=True,
-                   max_loras=4,
-                   max_lora_rank=16,
-                   tensor_parallel_size=4,
-                   trust_remote_code=True,
-                   fully_sharded_loras=True,
-                   enable_chunked_prefill=True)
+    llm = vllm.LLM(
+        MODEL_PATH,
+        max_model_len=1024,
+        enable_lora=True,
+        max_loras=4,
+        max_lora_rank=16,
+        tensor_parallel_size=4,
+        trust_remote_code=True,
+        fully_sharded_loras=True,
+        enable_chunked_prefill=True,
+    )
     output1 = do_sample(llm, ilama_lora_files, lora_id=1)
     for i in range(len(EXPECTED_LORA_OUTPUT)):
         assert output1[i] == EXPECTED_LORA_OUTPUT[i]
diff --git a/tests/lora/test_utils.py b/tests/lora/test_utils.py
index b343bef0a920..aed91d98ddbd 100644
--- a/tests/lora/test_utils.py
+++ b/tests/lora/test_utils.py
@@ -9,8 +9,11 @@
 from huggingface_hub.utils import HfHubHTTPError
 from torch import nn
 
-from vllm.lora.utils import (get_adapter_absolute_path,
-                             parse_fine_tuned_lora_name, replace_submodule)
+from vllm.lora.utils import (
+    get_adapter_absolute_path,
+    parse_fine_tuned_lora_name,
+    replace_submodule,
+)
 from vllm.model_executor.models.utils import WeightsMapper
 
 
@@ -24,10 +27,12 @@ class LoRANameParserTestConfig(NamedTuple):
 
 def test_parse_fine_tuned_lora_name_valid():
     fixture = [
-        LoRANameParserTestConfig("base_model.model.lm_head.lora_A.weight",
-                                 "lm_head", True, False),
-        LoRANameParserTestConfig("base_model.model.lm_head.lora_B.weight",
-                                 "lm_head", False, False),
+        LoRANameParserTestConfig(
+            "base_model.model.lm_head.lora_A.weight", "lm_head", True, False
+        ),
+        LoRANameParserTestConfig(
+            "base_model.model.lm_head.lora_B.weight", "lm_head", False, False
+        ),
         LoRANameParserTestConfig(
             "base_model.model.model.embed_tokens.lora_embedding_A",
             "model.embed_tokens",
@@ -71,7 +76,8 @@ def test_parse_fine_tuned_lora_name_valid():
             True,
             False,
             weights_mapper=WeightsMapper(
-                orig_to_new_prefix={"model.": "language_model.model."}),
+                orig_to_new_prefix={"model.": "language_model.model."}
+            ),
         ),
         LoRANameParserTestConfig(
             "base_model.model.model.layers.9.mlp.down_proj.lora_B.weight",
@@ -79,7 +85,8 @@ def test_parse_fine_tuned_lora_name_valid():
             False,
             False,
             weights_mapper=WeightsMapper(
-                orig_to_new_prefix={"model.": "language_model.model."}),
+                orig_to_new_prefix={"model.": "language_model.model."}
+            ),
         ),
         LoRANameParserTestConfig(
             "model.layers.9.mlp.down_proj.lora_A.weight",
@@ -87,7 +94,8 @@ def test_parse_fine_tuned_lora_name_valid():
             True,
             False,
             weights_mapper=WeightsMapper(
-                orig_to_new_prefix={"model.": "language_model.model."}),
+                orig_to_new_prefix={"model.": "language_model.model."}
+            ),
         ),
         LoRANameParserTestConfig(
             "model.layers.9.mlp.down_proj.lora_B.weight",
@@ -95,12 +103,14 @@ def test_parse_fine_tuned_lora_name_valid():
             False,
             False,
             weights_mapper=WeightsMapper(
-                orig_to_new_prefix={"model.": "language_model.model."}),
+                orig_to_new_prefix={"model.": "language_model.model."}
+            ),
         ),
     ]
     for name, module_name, is_lora_a, is_bias, weights_mapper in fixture:
-        assert (module_name, is_lora_a,
-                is_bias) == parse_fine_tuned_lora_name(name, weights_mapper)
+        assert (module_name, is_lora_a, is_bias) == parse_fine_tuned_lora_name(
+            name, weights_mapper
+        )
 
 
 def test_parse_fine_tuned_lora_name_invalid():
@@ -115,22 +125,28 @@ def test_parse_fine_tuned_lora_name_invalid():
 
 def test_replace_submodule():
     model = nn.Sequential(
-        OrderedDict([
-            ("dense1", nn.Linear(764, 100)),
-            ("act1", nn.ReLU()),
-            ("dense2", nn.Linear(100, 50)),
-            (
-                "seq1",
-                nn.Sequential(
-                    OrderedDict([
-                        ("dense1", nn.Linear(100, 10)),
-                        ("dense2", nn.Linear(10, 50)),
-                    ])),
-            ),
-            ("act2", nn.ReLU()),
-            ("output", nn.Linear(50, 10)),
-            ("outact", nn.Sigmoid()),
-        ]))
+        OrderedDict(
+            [
+                ("dense1", nn.Linear(764, 100)),
+                ("act1", nn.ReLU()),
+                ("dense2", nn.Linear(100, 50)),
+                (
+                    "seq1",
+                    nn.Sequential(
+                        OrderedDict(
+                            [
+                                ("dense1", nn.Linear(100, 10)),
+                                ("dense2", nn.Linear(10, 50)),
+                            ]
+                        )
+                    ),
+                ),
+                ("act2", nn.ReLU()),
+                ("output", nn.Linear(50, 10)),
+                ("outact", nn.Sigmoid()),
+            ]
+        )
+    )
 
     sigmoid = nn.Sigmoid()
 
@@ -143,52 +159,51 @@ def test_replace_submodule():
 
 
 # Unit tests for get_adapter_absolute_path
-@patch('os.path.isabs')
+@patch("os.path.isabs")
 def test_get_adapter_absolute_path_absolute(mock_isabs):
-    path = '/absolute/path/to/lora'
+    path = "/absolute/path/to/lora"
     mock_isabs.return_value = True
     assert get_adapter_absolute_path(path) == path
 
 
-@patch('os.path.expanduser')
+@patch("os.path.expanduser")
 def test_get_adapter_absolute_path_expanduser(mock_expanduser):
     # Path with ~ that needs to be expanded
-    path = '~/relative/path/to/lora'
-    absolute_path = '/home/user/relative/path/to/lora'
+    path = "~/relative/path/to/lora"
+    absolute_path = "/home/user/relative/path/to/lora"
     mock_expanduser.return_value = absolute_path
     assert get_adapter_absolute_path(path) == absolute_path
 
 
-@patch('os.path.exists')
-@patch('os.path.abspath')
+@patch("os.path.exists")
+@patch("os.path.abspath")
 def test_get_adapter_absolute_path_local_existing(mock_abspath, mock_exist):
     # Relative path that exists locally
-    path = 'relative/path/to/lora'
-    absolute_path = '/absolute/path/to/lora'
+    path = "relative/path/to/lora"
+    absolute_path = "/absolute/path/to/lora"
     mock_exist.return_value = True
     mock_abspath.return_value = absolute_path
     assert get_adapter_absolute_path(path) == absolute_path
 
 
-@patch('huggingface_hub.snapshot_download')
-@patch('os.path.exists')
-def test_get_adapter_absolute_path_huggingface(mock_exist,
-                                               mock_snapshot_download):
+@patch("huggingface_hub.snapshot_download")
+@patch("os.path.exists")
+def test_get_adapter_absolute_path_huggingface(mock_exist, mock_snapshot_download):
     # Hugging Face model identifier
-    path = 'org/repo'
-    absolute_path = '/mock/snapshot/path'
+    path = "org/repo"
+    absolute_path = "/mock/snapshot/path"
     mock_exist.return_value = False
     mock_snapshot_download.return_value = absolute_path
     assert get_adapter_absolute_path(path) == absolute_path
 
 
-@patch('huggingface_hub.snapshot_download')
-@patch('os.path.exists')
-def test_get_adapter_absolute_path_huggingface_error(mock_exist,
-                                                     mock_snapshot_download):
+@patch("huggingface_hub.snapshot_download")
+@patch("os.path.exists")
+def test_get_adapter_absolute_path_huggingface_error(
+    mock_exist, mock_snapshot_download
+):
     # Hugging Face model identifier with download error
-    path = 'org/repo'
+    path = "org/repo"
     mock_exist.return_value = False
-    mock_snapshot_download.side_effect = HfHubHTTPError(
-        "failed to query model info")
+    mock_snapshot_download.side_effect = HfHubHTTPError("failed to query model info")
     assert get_adapter_absolute_path(path) == path
diff --git a/tests/lora/test_worker.py b/tests/lora/test_worker.py
index 9c47abf8f4dc..c97f8debd1b9 100644
--- a/tests/lora/test_worker.py
+++ b/tests/lora/test_worker.py
@@ -6,8 +6,14 @@
 import tempfile
 from unittest.mock import patch
 
-from vllm.config import (CacheConfig, DeviceConfig, ModelConfig,
-                         ParallelConfig, SchedulerConfig, VllmConfig)
+from vllm.config import (
+    CacheConfig,
+    DeviceConfig,
+    ModelConfig,
+    ParallelConfig,
+    SchedulerConfig,
+    VllmConfig,
+)
 from vllm.config.load import LoadConfig
 from vllm.config.lora import LoRAConfig
 from vllm.lora.models import LoRAMapping
@@ -19,12 +25,12 @@
 
 @patch.dict(os.environ, {"RANK": "0"})
 def test_worker_apply_lora(sql_lora_files):
-
     def set_active_loras(worker: Worker, lora_requests: list[LoRARequest]):
         lora_mapping = LoRAMapping([], [])
 
         worker.model_runner.lora_manager.set_active_adapters(
-            lora_requests, lora_mapping)
+            lora_requests, lora_mapping
+        )
 
     vllm_config = VllmConfig(
         model_config=ModelConfig(
@@ -49,9 +55,9 @@ def set_active_loras(worker: Worker, lora_requests: list[LoRARequest]):
             swap_space=0,
             cache_dtype="auto",
         ),
-        lora_config=LoRAConfig(max_lora_rank=8,
-                               max_cpu_loras=NUM_LORAS,
-                               max_loras=NUM_LORAS),
+        lora_config=LoRAConfig(
+            max_lora_rank=8, max_cpu_loras=NUM_LORAS, max_loras=NUM_LORAS
+        ),
     )
     worker = Worker(
         vllm_config=vllm_config,
@@ -67,23 +73,22 @@ def set_active_loras(worker: Worker, lora_requests: list[LoRARequest]):
     assert worker.list_loras() == set()
 
     lora_requests = [
-        LoRARequest(str(i + 1), i + 1, sql_lora_files)
-        for i in range(NUM_LORAS)
+        LoRARequest(str(i + 1), i + 1, sql_lora_files) for i in range(NUM_LORAS)
     ]
 
     set_active_loras(worker, lora_requests)
     assert worker.list_loras() == {
-        lora_request.lora_int_id
-        for lora_request in lora_requests
+        lora_request.lora_int_id for lora_request in lora_requests
     }
 
     for i in range(NUM_LORAS):
         random.seed(i)
-        iter_lora_requests = random.choices(lora_requests,
-                                            k=random.randint(1, NUM_LORAS))
+        iter_lora_requests = random.choices(
+            lora_requests, k=random.randint(1, NUM_LORAS)
+        )
         random.shuffle(iter_lora_requests)
-        iter_lora_requests = iter_lora_requests[:-random.randint(0, NUM_LORAS)]
+        iter_lora_requests = iter_lora_requests[: -random.randint(0, NUM_LORAS)]
         set_active_loras(worker, lora_requests)
         assert worker.list_loras().issuperset(
-            {lora_request.lora_int_id
-             for lora_request in iter_lora_requests})
+            {lora_request.lora_int_id for lora_request in iter_lora_requests}
+        )
diff --git a/tests/lora/utils.py b/tests/lora/utils.py
index 0432a1a9bba0..b522aa6b0874 100644
--- a/tests/lora/utils.py
+++ b/tests/lora/utils.py
@@ -13,7 +13,6 @@
 
 
 class DummyLoRAManager:
-
     def __init__(self, device: torch.device = "cuda:0"):
         super().__init__()
         self._loras: dict[str, LoRALayerWeights] = {}
@@ -36,12 +35,12 @@ def init_random_lora(
             module_name,
             rank=rank,
             lora_alpha=1,
-            lora_a=torch.rand([rank, weight.shape[1]],
-                              dtype=weight.dtype,
-                              device=self._device),
-            lora_b=torch.rand([weight.shape[0], rank],
-                              dtype=weight.dtype,
-                              device=self._device),
+            lora_a=torch.rand(
+                [rank, weight.shape[1]], dtype=weight.dtype, device=self._device
+            ),
+            lora_b=torch.rand(
+                [weight.shape[0], rank], dtype=weight.dtype, device=self._device
+            ),
         )
         if generate_embeddings_tensor:
             lora.embeddings_tensor = torch.rand(
@@ -146,27 +145,26 @@ def generate_data(
     op_type,
     device,
 ) -> PunicaTensors:
-    seq_len_tensor = torch.randint(seq_length, seq_length + 1,
-                                   (batches, )).to(device)
+    seq_len_tensor = torch.randint(seq_length, seq_length + 1, (batches,)).to(device)
     b_seq_start_loc = torch.cumsum(
         torch.tensor([0] + seq_len_tensor[:-1].tolist(), dtype=torch.long),
         dim=0,
     ).to(device)
     total_tokens = seq_len_tensor.sum()
     if op_type == "shrink":
-        inputs_tensor = torch.rand((total_tokens, hidden_size),
-                                   dtype=dtype).to(device)
+        inputs_tensor = torch.rand((total_tokens, hidden_size), dtype=dtype).to(device)
         lora_weights = torch.rand(
             (lora_nums, max_rank, hidden_size),  # col-major
             dtype=dtype,
         ).to(device)
         # shrink op need atomic_add, so output is initinized by 0
-        ref_out_tensor = torch.zeros((total_tokens, max_rank),
-                                     dtype=dtype,
-                                     device=inputs_tensor.device)
+        ref_out_tensor = torch.zeros(
+            (total_tokens, max_rank), dtype=dtype, device=inputs_tensor.device
+        )
         # NOTE  shrink kernel using torch.float32 as output type
-        our_out_tensor = torch.zeros((total_tokens, max_rank),
-                                     dtype=torch.float32).to(device)
+        our_out_tensor = torch.zeros((total_tokens, max_rank), dtype=torch.float32).to(
+            device
+        )
     else:
         inputs_tensor = torch.rand(
             (total_tokens, max_rank),
@@ -184,15 +182,16 @@ def generate_data(
         ).to(device)
         # Ensure the same input.
         our_out_tensor = ref_out_tensor.clone()
-    lora_indices_tensor = torch.randint(0,
-                                        lora_nums - 1 if lora_nums > 1 else 1,
-                                        (batches, )).to(device)
+    lora_indices_tensor = torch.randint(
+        0, lora_nums - 1 if lora_nums > 1 else 1, (batches,)
+    ).to(device)
     indices = torch.zeros((total_tokens), dtype=torch.long).to(device)
     current_offset = 0
     for b_id in range(batches):
         lora_index = lora_indices_tensor[b_id]
-        indices[current_offset:current_offset +
-                seq_len_tensor[b_id]].copy_(lora_index)
+        indices[current_offset : current_offset + seq_len_tensor[b_id]].copy_(
+            lora_index
+        )
         current_offset += seq_len_tensor[b_id].item()
 
     return PunicaTensors(
@@ -217,8 +216,7 @@ def generate_data_for_expand_nslices(
     nslices,
     device,
 ) -> PunicaTensors:
-    seq_len_tensor = torch.randint(seq_length, seq_length + 1,
-                                   (batches, )).to(device)
+    seq_len_tensor = torch.randint(seq_length, seq_length + 1, (batches,)).to(device)
     b_seq_start_loc = torch.cumsum(
         torch.tensor([0] + seq_len_tensor[:-1].tolist(), dtype=torch.long),
         dim=0,
@@ -234,22 +232,25 @@ def generate_data_for_expand_nslices(
             torch.rand(
                 (lora_nums, hidden_size, max_rank),  # col-major
                 dtype=dtype,
-            ).to(device))
+            ).to(device)
+        )
     # expand op needs to complete y+=a@lora_b, so output is
     # initinized randomly
-    ref_out_tensor = torch.rand((total_tokens, hidden_size * nslices),
-                                dtype=dtype).to(device)
+    ref_out_tensor = torch.rand((total_tokens, hidden_size * nslices), dtype=dtype).to(
+        device
+    )
     # Ensure the same input.
     our_out_tensor = ref_out_tensor.clone()
-    lora_indices_tensor = torch.randint(0,
-                                        lora_nums - 1 if lora_nums > 1 else 1,
-                                        (batches, ))
+    lora_indices_tensor = torch.randint(
+        0, lora_nums - 1 if lora_nums > 1 else 1, (batches,)
+    )
     indices = torch.zeros((total_tokens), dtype=torch.long).to(device)
     current_offset = 0
     for b_id in range(batches):
         lora_index = lora_indices_tensor[b_id]
-        indices[current_offset:current_offset +
-                seq_len_tensor[b_id]] = (lora_index.item())
+        indices[current_offset : current_offset + seq_len_tensor[b_id]] = (
+            lora_index.item()
+        )
         current_offset += seq_len_tensor[b_id].item()
 
     lora_indices_tensor = lora_indices_tensor.to(device)
@@ -276,8 +277,7 @@ def generate_data_for_nslices(
     op_type,
     device,
 ) -> PunicaTensors:
-    seq_len_tensor = torch.randint(seq_length, seq_length + 1,
-                                   (batches, )).to(device)
+    seq_len_tensor = torch.randint(seq_length, seq_length + 1, (batches,)).to(device)
     b_seq_start_loc = torch.cumsum(
         torch.tensor([0] + seq_len_tensor[:-1].tolist(), dtype=torch.long),
         dim=0,
@@ -286,9 +286,7 @@ def generate_data_for_nslices(
 
     lora_weights_lst = []
     if op_type == "shrink":
-
-        inputs_tensor = torch.rand((total_tokens, hidden_size),
-                                   dtype=dtype).to(device)
+        inputs_tensor = torch.rand((total_tokens, hidden_size), dtype=dtype).to(device)
 
         for _ in range(nslices):
             if op_type == "shrink":
@@ -296,7 +294,8 @@ def generate_data_for_nslices(
                     torch.rand(
                         (lora_nums, max_rank, hidden_size),  # col-major
                         dtype=dtype,
-                    ).to(device))
+                    ).to(device)
+                )
         # NOTE  shrink kernel using torch.float32 as output type
         # shrink op need atomic_add, so output is initinized by 0
         our_out_tensor = torch.zeros(
@@ -313,23 +312,26 @@ def generate_data_for_nslices(
                 torch.rand(
                     (lora_nums, hidden_size, max_rank),  # col-major
                     dtype=dtype,
-                ).to(device))
+                ).to(device)
+            )
         # expand op needs to complete y+=a@lora_b, so output is
         # initinized randomly
-        our_out_tensor = torch.rand((total_tokens, hidden_size * nslices),
-                                    dtype=dtype).to(device)
+        our_out_tensor = torch.rand(
+            (total_tokens, hidden_size * nslices), dtype=dtype
+        ).to(device)
 
     # Ensure the same input.
     ref_out_tensor = our_out_tensor.clone()
-    lora_indices_tensor = torch.randint(0,
-                                        lora_nums - 1 if lora_nums > 1 else 1,
-                                        (batches, ))
+    lora_indices_tensor = torch.randint(
+        0, lora_nums - 1 if lora_nums > 1 else 1, (batches,)
+    )
     indices = torch.zeros((total_tokens), dtype=torch.long).to(device)
     current_offset = 0
     for b_id in range(batches):
         lora_index = lora_indices_tensor[b_id]
-        indices[current_offset:current_offset +
-                seq_len_tensor[b_id]] = (lora_index.item())
+        indices[current_offset : current_offset + seq_len_tensor[b_id]] = (
+            lora_index.item()
+        )
         current_offset += seq_len_tensor[b_id].item()
 
     lora_indices_tensor = lora_indices_tensor.to(device)
@@ -379,24 +381,20 @@ def create_peft_lora(
     }
 
     for module_name in target_modules:
-
         module = model
         for attr in module_name.split("."):
             module = getattr(module, attr)
 
         if hasattr(module, "input_size") and hasattr(module, "output_size"):
-
             in_features = module.input_size
             out_features = module.output_size
 
-        elif hasattr(module, "embedding_dim") and hasattr(
-                module, "num_embeddings"):
+        elif hasattr(module, "embedding_dim") and hasattr(module, "num_embeddings"):
             # ParallelLMHead
             in_features = module.embedding_dim
             out_features = module.num_embeddings
         else:
-            raise ValueError(
-                f"Unable to determine dimensions for module {module_name}")
+            raise ValueError(f"Unable to determine dimensions for module {module_name}")
 
         lora_A = torch.randn(rank, in_features, dtype=lora_dtype)
 
diff --git a/tests/model_executor/model_loader/fastsafetensors_loader/test_weight_utils.py b/tests/model_executor/model_loader/fastsafetensors_loader/test_weight_utils.py
index 78d23acfec7c..cc899b77b5e9 100644
--- a/tests/model_executor/model_loader/fastsafetensors_loader/test_weight_utils.py
+++ b/tests/model_executor/model_loader/fastsafetensors_loader/test_weight_utils.py
@@ -8,24 +8,25 @@
 import torch
 
 from vllm.model_executor.model_loader.weight_utils import (
-    download_weights_from_hf, fastsafetensors_weights_iterator,
-    safetensors_weights_iterator)
+    download_weights_from_hf,
+    fastsafetensors_weights_iterator,
+    safetensors_weights_iterator,
+)
 
 
 def test_fastsafetensors_model_loader():
     with tempfile.TemporaryDirectory() as tmpdir:
         huggingface_hub.constants.HF_HUB_OFFLINE = False
-        download_weights_from_hf("openai-community/gpt2",
-                                 allow_patterns=["*.safetensors"],
-                                 cache_dir=tmpdir)
+        download_weights_from_hf(
+            "openai-community/gpt2", allow_patterns=["*.safetensors"], cache_dir=tmpdir
+        )
         safetensors = glob.glob(f"{tmpdir}/**/*.safetensors", recursive=True)
         assert len(safetensors) > 0
 
         fastsafetensors_tensors = {}
         hf_safetensors_tensors = {}
 
-        for name, tensor in fastsafetensors_weights_iterator(
-                safetensors, True):
+        for name, tensor in fastsafetensors_weights_iterator(safetensors, True):
             fastsafetensors_tensors[name] = tensor
 
         for name, tensor in safetensors_weights_iterator(safetensors, True):
@@ -34,13 +35,10 @@ def test_fastsafetensors_model_loader():
         assert len(fastsafetensors_tensors) == len(hf_safetensors_tensors)
 
         for name, fastsafetensors_tensor in fastsafetensors_tensors.items():
-            fastsafetensors_tensor = fastsafetensors_tensor.to('cpu')
-            assert fastsafetensors_tensor.dtype == hf_safetensors_tensors[
-                name].dtype
-            assert fastsafetensors_tensor.shape == hf_safetensors_tensors[
-                name].shape
-            assert torch.all(
-                fastsafetensors_tensor.eq(hf_safetensors_tensors[name]))
+            fastsafetensors_tensor = fastsafetensors_tensor.to("cpu")
+            assert fastsafetensors_tensor.dtype == hf_safetensors_tensors[name].dtype
+            assert fastsafetensors_tensor.shape == hf_safetensors_tensors[name].shape
+            assert torch.all(fastsafetensors_tensor.eq(hf_safetensors_tensors[name]))
 
 
 if __name__ == "__main__":
diff --git a/tests/model_executor/model_loader/runai_model_streamer/test_runai_utils.py b/tests/model_executor/model_loader/runai_model_streamer/test_runai_utils.py
index e11e4c7289bc..3ad7308eeba2 100644
--- a/tests/model_executor/model_loader/runai_model_streamer/test_runai_utils.py
+++ b/tests/model_executor/model_loader/runai_model_streamer/test_runai_utils.py
@@ -8,11 +8,12 @@
 
 import huggingface_hub.constants
 
-from vllm.model_executor.model_loader.weight_utils import (
-    download_weights_from_hf)
-from vllm.transformers_utils.runai_utils import (ObjectStorageModel,
-                                                 is_runai_obj_uri,
-                                                 list_safetensors)
+from vllm.model_executor.model_loader.weight_utils import download_weights_from_hf
+from vllm.transformers_utils.runai_utils import (
+    ObjectStorageModel,
+    is_runai_obj_uri,
+    list_safetensors,
+)
 
 
 def test_is_runai_obj_uri():
@@ -24,14 +25,14 @@ def test_is_runai_obj_uri():
 def test_runai_list_safetensors_local():
     with tempfile.TemporaryDirectory() as tmpdir:
         huggingface_hub.constants.HF_HUB_OFFLINE = False
-        download_weights_from_hf("openai-community/gpt2",
-                                 allow_patterns=["*.safetensors", "*.json"],
-                                 cache_dir=tmpdir)
+        download_weights_from_hf(
+            "openai-community/gpt2",
+            allow_patterns=["*.safetensors", "*.json"],
+            cache_dir=tmpdir,
+        )
         safetensors = glob.glob(f"{tmpdir}/**/*.safetensors", recursive=True)
         assert len(safetensors) > 0
-        parentdir = [
-            os.path.dirname(safetensor) for safetensor in safetensors
-        ][0]
+        parentdir = [os.path.dirname(safetensor) for safetensor in safetensors][0]
         files = list_safetensors(parentdir)
         assert len(safetensors) == len(files)
 
@@ -50,9 +51,9 @@ def test_runai_pull_files_gcs(monkeypatch):
     #     | cut -d":" -f2 | base64 -d | xxd -p
     expected_checksum = "f60dea775da1392434275b311b31a431"
     hasher = hashlib.new("md5")
-    with open(os.path.join(model.dir, filename), 'rb') as f:
+    with open(os.path.join(model.dir, filename), "rb") as f:
         # Read the file in chunks to handle large files efficiently
-        for chunk in iter(lambda: f.read(4096), b''):
+        for chunk in iter(lambda: f.read(4096), b""):
             hasher.update(chunk)
     actual_checksum = hasher.hexdigest()
     assert actual_checksum == expected_checksum
diff --git a/tests/model_executor/model_loader/runai_model_streamer/test_weight_utils.py b/tests/model_executor/model_loader/runai_model_streamer/test_weight_utils.py
index ee448c2ccb21..03691b4a472f 100644
--- a/tests/model_executor/model_loader/runai_model_streamer/test_weight_utils.py
+++ b/tests/model_executor/model_loader/runai_model_streamer/test_weight_utils.py
@@ -8,24 +8,25 @@
 import torch
 
 from vllm.model_executor.model_loader.weight_utils import (
-    download_weights_from_hf, runai_safetensors_weights_iterator,
-    safetensors_weights_iterator)
+    download_weights_from_hf,
+    runai_safetensors_weights_iterator,
+    safetensors_weights_iterator,
+)
 
 
 def test_runai_model_loader():
     with tempfile.TemporaryDirectory() as tmpdir:
         huggingface_hub.constants.HF_HUB_OFFLINE = False
-        download_weights_from_hf("openai-community/gpt2",
-                                 allow_patterns=["*.safetensors"],
-                                 cache_dir=tmpdir)
+        download_weights_from_hf(
+            "openai-community/gpt2", allow_patterns=["*.safetensors"], cache_dir=tmpdir
+        )
         safetensors = glob.glob(f"{tmpdir}/**/*.safetensors", recursive=True)
         assert len(safetensors) > 0
 
         runai_model_streamer_tensors = {}
         hf_safetensors_tensors = {}
 
-        for name, tensor in runai_safetensors_weights_iterator(
-                safetensors, True):
+        for name, tensor in runai_safetensors_weights_iterator(safetensors, True):
             runai_model_streamer_tensors[name] = tensor
 
         for name, tensor in safetensors_weights_iterator(safetensors, True):
diff --git a/tests/model_executor/model_loader/tensorizer_loader/conftest.py b/tests/model_executor/model_loader/tensorizer_loader/conftest.py
index cc02d7ecf20b..add6d3742ff5 100644
--- a/tests/model_executor/model_loader/tensorizer_loader/conftest.py
+++ b/tests/model_executor/model_loader/tensorizer_loader/conftest.py
@@ -32,7 +32,6 @@ def cleanup():
 
 @pytest.fixture()
 def just_serialize_model_tensors(model_ref, monkeypatch, tmp_path):
-
     def noop(*args, **kwargs):
         return None
 
@@ -56,8 +55,7 @@ def model_path(model_ref, tmp_path):
     yield tmp_path / model_ref / "model.tensors"
 
 
-def assert_from_collective_rpc(engine: LLM, closure: Callable,
-                               closure_kwargs: dict):
+def assert_from_collective_rpc(engine: LLM, closure: Callable, closure_kwargs: dict):
     res = engine.collective_rpc(method=closure, kwargs=closure_kwargs)
     return all(res)
 
@@ -67,18 +65,13 @@ def assert_from_collective_rpc(engine: LLM, closure: Callable,
 # method. It's purely used as a dummy utility to run methods that test
 # Tensorizer functionality
 class DummyExecutor(UniProcExecutor):
-
     def _init_executor(self) -> None:
-        """Initialize the worker and load the model.
-        """
-        self.driver_worker = WorkerWrapperBase(vllm_config=self.vllm_config,
-                                               rpc_rank=0)
-        distributed_init_method = get_distributed_init_method(
-            get_ip(), get_open_port())
+        """Initialize the worker and load the model."""
+        self.driver_worker = WorkerWrapperBase(vllm_config=self.vllm_config, rpc_rank=0)
+        distributed_init_method = get_distributed_init_method(get_ip(), get_open_port())
         local_rank = 0
         # set local rank as the device index if specified
-        device_info = self.vllm_config.device_config.device.__str__().split(
-            ":")
+        device_info = self.vllm_config.device_config.device.__str__().split(":")
         if len(device_info) > 1:
             local_rank = int(device_info[1])
         rank = 0
@@ -91,7 +84,7 @@ def _init_executor(self) -> None:
             is_driver_worker=is_driver_worker,
         )
         self.mm_receiver_cache = None
-        self.collective_rpc("init_worker", args=([kwargs], ))
+        self.collective_rpc("init_worker", args=([kwargs],))
         self.collective_rpc("init_device")
 
     @property
@@ -99,5 +92,5 @@ def max_concurrent_batches(self) -> int:
         return 2
 
     def shutdown(self):
-        if hasattr(self, 'thread_pool'):
+        if hasattr(self, "thread_pool"):
             self.thread_pool.shutdown(wait=False)
diff --git a/tests/model_executor/model_loader/tensorizer_loader/test_tensorizer.py b/tests/model_executor/model_loader/tensorizer_loader/test_tensorizer.py
index f50f04696738..ed86a6b8b1ed 100644
--- a/tests/model_executor/model_loader/tensorizer_loader/test_tensorizer.py
+++ b/tests/model_executor/model_loader/tensorizer_loader/test_tensorizer.py
@@ -17,14 +17,19 @@
 from tests.utils import VLLM_PATH, RemoteOpenAIServer
 from vllm import LLM, SamplingParams
 from vllm.engine.arg_utils import EngineArgs
+
 # yapf: disable
-from vllm.model_executor.model_loader.tensorizer import (TensorizerConfig,
-                                                         TensorSerializer,
-                                                         is_vllm_tensorized,
-                                                         open_stream,
-                                                         tensorize_vllm_model)
+from vllm.model_executor.model_loader.tensorizer import (
+    TensorizerConfig,
+    TensorSerializer,
+    is_vllm_tensorized,
+    open_stream,
+    tensorize_vllm_model,
+)
 from vllm.model_executor.model_loader.tensorizer_loader import (
-    BLACKLISTED_TENSORIZER_ARGS)
+    BLACKLISTED_TENSORIZER_ARGS,
+)
+
 # yapf: enable
 from vllm.utils import PlaceholderModule
 
@@ -44,7 +49,7 @@ class TensorizerCaughtError(Exception):
 
 EXAMPLES_PATH = VLLM_PATH / "examples"
 
-pytest_plugins = "pytest_asyncio",
+pytest_plugins = ("pytest_asyncio",)
 
 prompts = [
     "Hello, my name is",
@@ -56,8 +61,7 @@ class TensorizerCaughtError(Exception):
 sampling_params = SamplingParams(temperature=0.8, top_p=0.95, seed=0)
 
 
-def patch_init_and_catch_error(self, obj, method_name,
-                               expected_error: type[Exception]):
+def patch_init_and_catch_error(self, obj, method_name, expected_error: type[Exception]):
     original = getattr(obj, method_name, None)
     if original is None:
         raise ValueError("Method '{}' not found.".format(method_name))
@@ -80,17 +84,19 @@ def assert_specific_tensorizer_error_is_raised(
     expected_error: type[Exception],
 ):
     with pytest.raises(TensorizerCaughtError):
-        executor.collective_rpc(patch_init_and_catch_error,
-                                args=(
-                                    obj,
-                                    method_name,
-                                    expected_error,
-                                ))
+        executor.collective_rpc(
+            patch_init_and_catch_error,
+            args=(
+                obj,
+                method_name,
+                expected_error,
+            ),
+        )
 
 
 def is_curl_installed():
     try:
-        subprocess.check_call(['curl', '--version'])
+        subprocess.check_call(["curl", "--version"])
         return True
     except (subprocess.CalledProcessError, FileNotFoundError):
         return False
@@ -99,13 +105,14 @@ def is_curl_installed():
 def write_keyfile(keyfile_path: str):
     encryption_params = EncryptionParams.random()
     pathlib.Path(keyfile_path).parent.mkdir(parents=True, exist_ok=True)
-    with open(keyfile_path, 'wb') as f:
+    with open(keyfile_path, "wb") as f:
         f.write(encryption_params.key)
 
 
 @pytest.mark.skipif(not is_curl_installed(), reason="cURL is not installed")
 def test_deserialized_encrypted_vllm_model_has_same_outputs(
-        model_ref, vllm_runner, tmp_path, model_path):
+    model_ref, vllm_runner, tmp_path, model_path
+):
     args = EngineArgs(model=model_ref)
     with vllm_runner(model_ref) as vllm_model:
         key_path = tmp_path / model_ref / "model.key"
@@ -113,29 +120,30 @@ def test_deserialized_encrypted_vllm_model_has_same_outputs(
 
         outputs = vllm_model.generate(prompts, sampling_params)
 
-    config_for_serializing = TensorizerConfig(tensorizer_uri=str(model_path),
-                                              encryption_keyfile=str(key_path))
+    config_for_serializing = TensorizerConfig(
+        tensorizer_uri=str(model_path), encryption_keyfile=str(key_path)
+    )
 
     tensorize_vllm_model(args, config_for_serializing)
 
     config_for_deserializing = TensorizerConfig(
-        tensorizer_uri=str(model_path), encryption_keyfile=str(key_path))
-
-    with vllm_runner(model_ref,
-                     load_format="tensorizer",
-                     model_loader_extra_config=config_for_deserializing
-                     ) as loaded_vllm_model:  # noqa: E501
+        tensorizer_uri=str(model_path), encryption_keyfile=str(key_path)
+    )
 
-        deserialized_outputs = loaded_vllm_model.generate(
-            prompts, sampling_params)
+    with vllm_runner(
+        model_ref,
+        load_format="tensorizer",
+        model_loader_extra_config=config_for_deserializing,
+    ) as loaded_vllm_model:  # noqa: E501
+        deserialized_outputs = loaded_vllm_model.generate(prompts, sampling_params)
         # noqa: E501
 
         assert outputs == deserialized_outputs
 
 
-def test_deserialized_hf_model_has_same_outputs(hf_runner, vllm_runner,
-                                                tmp_path, model_ref,
-                                                model_path):
+def test_deserialized_hf_model_has_same_outputs(
+    hf_runner, vllm_runner, tmp_path, model_ref, model_path
+):
     with hf_runner(model_ref) as hf_model:
         max_tokens = 50
         outputs = hf_model.generate_greedy(prompts, max_tokens=max_tokens)
@@ -143,14 +151,17 @@ def test_deserialized_hf_model_has_same_outputs(hf_runner, vllm_runner,
             serializer = TensorSerializer(stream)
             serializer.write_module(hf_model.model)
 
-    with vllm_runner(model_ref,
-                     load_format="tensorizer",
-                     model_loader_extra_config=TensorizerConfig(
-                         tensorizer_uri=str(model_path),
-                         num_readers=1,
-                     )) as loaded_hf_model:
+    with vllm_runner(
+        model_ref,
+        load_format="tensorizer",
+        model_loader_extra_config=TensorizerConfig(
+            tensorizer_uri=str(model_path),
+            num_readers=1,
+        ),
+    ) as loaded_hf_model:
         deserialized_outputs = loaded_hf_model.generate_greedy(
-            prompts, max_tokens=max_tokens)
+            prompts, max_tokens=max_tokens
+        )
 
         assert outputs == deserialized_outputs
 
@@ -159,35 +170,37 @@ def test_load_without_tensorizer_load_format(vllm_runner, capfd, model_ref):
     model = None
     try:
         model = vllm_runner(
-            model_ref,
-            model_loader_extra_config=TensorizerConfig(tensorizer_uri="test"))
+            model_ref, model_loader_extra_config=TensorizerConfig(tensorizer_uri="test")
+        )
         pytest.fail("Expected RuntimeError for extra config keys")
     except RuntimeError:
         out, err = capfd.readouterr()
         combined_output = out + err
-        assert ("ValueError: Unexpected extra config keys for load "
-                "format auto") in combined_output
+        assert (
+            "ValueError: Unexpected extra config keys for load format auto"
+        ) in combined_output
     finally:
         del model
         gc.collect()
         torch.cuda.empty_cache()
 
 
-def test_raise_value_error_on_invalid_load_format(vllm_runner, capfd,
-                                                  model_ref):
+def test_raise_value_error_on_invalid_load_format(vllm_runner, capfd, model_ref):
     model = None
     try:
         model = vllm_runner(
             model_ref,
             load_format="safetensors",
-            model_loader_extra_config=TensorizerConfig(tensorizer_uri="test"))
+            model_loader_extra_config=TensorizerConfig(tensorizer_uri="test"),
+        )
         pytest.fail("Expected RuntimeError for extra config keys")
     except RuntimeError:
         out, err = capfd.readouterr()
 
         combined_output = out + err
-        assert ("ValueError: Unexpected extra config keys "
-                "for load format safetensors") in combined_output
+        assert (
+            "ValueError: Unexpected extra config keys for load format safetensors"
+        ) in combined_output
     finally:
         del model
         gc.collect()
@@ -214,21 +227,24 @@ def test_tensorizer_with_tp_path_without_template(vllm_runner, capfd):
     except RuntimeError:
         out, err = capfd.readouterr()
         combined_output = out + err
-        assert ("ValueError: For a sharded model, tensorizer_uri "
-                "should include a string format template like '%04d' "
-                "to be formatted with the rank "
-                "of the shard") in combined_output
+        assert (
+            "ValueError: For a sharded model, tensorizer_uri "
+            "should include a string format template like '%04d' "
+            "to be formatted with the rank "
+            "of the shard"
+        ) in combined_output
 
 
 @pytest.mark.skipif(torch.cuda.device_count() < 2, reason="Requires 2 GPUs")
 def test_deserialized_encrypted_vllm_model_with_tp_has_same_outputs(
-        vllm_runner, tmp_path):
+    vllm_runner, tmp_path
+):
     model_ref = "EleutherAI/pythia-1.4b"
     # record outputs from un-sharded un-tensorized model
     with vllm_runner(
-            model_ref,
-            disable_custom_all_reduce=True,
-            enforce_eager=True,
+        model_ref,
+        disable_custom_all_reduce=True,
+        enforce_eager=True,
     ) as base_model:
         outputs = base_model.generate(prompts, sampling_params)
 
@@ -254,21 +270,22 @@ def test_deserialized_encrypted_vllm_model_with_tp_has_same_outputs(
     assert os.path.isfile(model_path % 1), "Serialization subprocess failed"
 
     with vllm_runner(
-            model_ref,
-            tensor_parallel_size=2,
-            load_format="tensorizer",
-            disable_custom_all_reduce=True,
-            enforce_eager=True,
-            model_loader_extra_config=tensorizer_config) as loaded_vllm_model:
-        deserialized_outputs = loaded_vllm_model.generate(
-            prompts, sampling_params)
+        model_ref,
+        tensor_parallel_size=2,
+        load_format="tensorizer",
+        disable_custom_all_reduce=True,
+        enforce_eager=True,
+        model_loader_extra_config=tensorizer_config,
+    ) as loaded_vllm_model:
+        deserialized_outputs = loaded_vllm_model.generate(prompts, sampling_params)
 
     assert outputs == deserialized_outputs
 
 
 @pytest.mark.flaky(reruns=3)
-def test_vllm_tensorized_model_has_same_outputs(model_ref, vllm_runner,
-                                                tmp_path, model_path):
+def test_vllm_tensorized_model_has_same_outputs(
+    model_ref, vllm_runner, tmp_path, model_path
+):
     gc.collect()
     torch.cuda.empty_cache()
     config = TensorizerConfig(tensorizer_uri=str(model_path))
@@ -280,11 +297,10 @@ def test_vllm_tensorized_model_has_same_outputs(model_ref, vllm_runner,
     tensorize_vllm_model(args, config)
     assert is_vllm_tensorized(config)
 
-    with vllm_runner(model_ref,
-                     load_format="tensorizer",
-                     model_loader_extra_config=config) as loaded_vllm_model:
-        deserialized_outputs = loaded_vllm_model.generate(
-            prompts, sampling_params)
+    with vllm_runner(
+        model_ref, load_format="tensorizer", model_loader_extra_config=config
+    ) as loaded_vllm_model:
+        deserialized_outputs = loaded_vllm_model.generate(prompts, sampling_params)
         # noqa: E501
 
         assert outputs == deserialized_outputs
@@ -314,15 +330,17 @@ def test_load_with_just_model_tensors(just_serialize_model_tensors, model_ref):
 
 
 def test_assert_serialization_kwargs_passed_to_tensor_serializer(tmp_path):
-
     serialization_params = {
         "limit_cpu_concurrency": 2,
     }
     model_ref = "facebook/opt-125m"
     model_path = tmp_path / (model_ref + ".tensors")
-    config = TensorizerConfig(tensorizer_uri=str(model_path),
-                              serialization_kwargs=serialization_params)
-    llm = LLM(model=model_ref, )
+    config = TensorizerConfig(
+        tensorizer_uri=str(model_path), serialization_kwargs=serialization_params
+    )
+    llm = LLM(
+        model=model_ref,
+    )
 
     def serialization_test(self, *args, **kwargs):
         # This is performed in the ephemeral worker process, so monkey-patching
@@ -340,10 +358,13 @@ def tensorizer_serializer_wrapper(self, *args, **kwargs):
             return original(self, *args, **kwargs)
 
         tensorizer.serialization.TensorSerializer.__init__ = (
-            tensorizer_serializer_wrapper)
+            tensorizer_serializer_wrapper
+        )
 
         tensorizer_config = TensorizerConfig(**kwargs["tensorizer_config"])
-        self.save_tensorized_model(tensorizer_config=tensorizer_config, )
+        self.save_tensorized_model(
+            tensorizer_config=tensorizer_config,
+        )
         return to_compare | original_dict == to_compare
 
     kwargs = {"tensorizer_config": config.to_serializable()}
@@ -351,9 +372,7 @@ def tensorizer_serializer_wrapper(self, *args, **kwargs):
     assert assert_from_collective_rpc(llm, serialization_test, kwargs)
 
 
-def test_assert_deserialization_kwargs_passed_to_tensor_deserializer(
-        tmp_path, capfd):
-
+def test_assert_deserialization_kwargs_passed_to_tensor_deserializer(tmp_path, capfd):
     deserialization_kwargs = {
         "num_readers": "bar",  # illegal value
     }
@@ -364,8 +383,9 @@ def test_assert_deserialization_kwargs_passed_to_tensor_deserializer(
 
     model_ref = "facebook/opt-125m"
     model_path = tmp_path / (model_ref + ".tensors")
-    config = TensorizerConfig(tensorizer_uri=str(model_path),
-                              serialization_kwargs=serialization_params)
+    config = TensorizerConfig(
+        tensorizer_uri=str(model_path), serialization_kwargs=serialization_params
+    )
 
     args = EngineArgs(model=model_ref)
     tensorize_vllm_model(args, config)
@@ -393,7 +413,6 @@ def test_assert_deserialization_kwargs_passed_to_tensor_deserializer(
 
 
 def test_assert_stream_kwargs_passed_to_tensor_deserializer(tmp_path, capfd):
-
     deserialization_kwargs = {
         "num_readers": 1,
     }
@@ -404,8 +423,9 @@ def test_assert_stream_kwargs_passed_to_tensor_deserializer(tmp_path, capfd):
 
     model_ref = "facebook/opt-125m"
     model_path = tmp_path / (model_ref + ".tensors")
-    config = TensorizerConfig(tensorizer_uri=str(model_path),
-                              serialization_kwargs=serialization_params)
+    config = TensorizerConfig(
+        tensorizer_uri=str(model_path), serialization_kwargs=serialization_params
+    )
 
     args = EngineArgs(model=model_ref)
     tensorize_vllm_model(args, config)
@@ -441,16 +461,24 @@ async def test_serialize_and_serve_entrypoints(tmp_path):
 
     suffix = "test"
     try:
-        result = subprocess.run([
-            sys.executable,
-            f"{VLLM_PATH}/examples/others/tensorize_vllm_model.py", "--model",
-            model_ref, "serialize", "--serialized-directory",
-            str(tmp_path), "--suffix", suffix, "--serialization-kwargs",
-            '{"limit_cpu_concurrency": 4}'
-        ],
-                                check=True,
-                                capture_output=True,
-                                text=True)
+        result = subprocess.run(
+            [
+                sys.executable,
+                f"{VLLM_PATH}/examples/others/tensorize_vllm_model.py",
+                "--model",
+                model_ref,
+                "serialize",
+                "--serialized-directory",
+                str(tmp_path),
+                "--suffix",
+                suffix,
+                "--serialization-kwargs",
+                '{"limit_cpu_concurrency": 4}',
+            ],
+            check=True,
+            capture_output=True,
+            text=True,
+        )
     except subprocess.CalledProcessError as e:
         print("Tensorizing failed.")
         print("STDOUT:\n", e.stdout)
@@ -470,14 +498,20 @@ async def test_serialize_and_serve_entrypoints(tmp_path):
         "deserialization_kwargs": {
             "verify_hash": True,
             "num_readers": 8,
-        }
+        },
     }
 
     cmd = [
-        "-m", "vllm.entrypoints.cli.main", "serve", "--host", "localhost",
-        "--load-format", "tensorizer", model_ref,
+        "-m",
+        "vllm.entrypoints.cli.main",
+        "serve",
+        "--host",
+        "localhost",
+        "--load-format",
+        "tensorizer",
+        model_ref,
         "--model-loader-extra-config",
-        json.dumps(model_loader_extra_config, indent=2)
+        json.dumps(model_loader_extra_config, indent=2),
     ]
 
     proc = await asyncio.create_subprocess_exec(
@@ -500,17 +534,16 @@ async def test_serialize_and_serve_entrypoints(tmp_path):
 
 
 @pytest.mark.parametrize("illegal_value", BLACKLISTED_TENSORIZER_ARGS)
-def test_blacklisted_parameter_for_loading(tmp_path, vllm_runner, capfd,
-                                           illegal_value):
-
+def test_blacklisted_parameter_for_loading(tmp_path, vllm_runner, capfd, illegal_value):
     serialization_params = {
         "limit_cpu_concurrency": 2,
     }
 
     model_ref = "facebook/opt-125m"
     model_path = tmp_path / (model_ref + ".tensors")
-    config = TensorizerConfig(tensorizer_uri=str(model_path),
-                              serialization_kwargs=serialization_params)
+    config = TensorizerConfig(
+        tensorizer_uri=str(model_path), serialization_kwargs=serialization_params
+    )
 
     args = EngineArgs(model=model_ref)
     tensorize_vllm_model(args, config)
@@ -526,5 +559,6 @@ def test_blacklisted_parameter_for_loading(tmp_path, vllm_runner, capfd,
     except RuntimeError:
         out, err = capfd.readouterr()
         combined_output = out + err
-        assert (f"ValueError: {illegal_value} is not an allowed "
-                f"Tensorizer argument.") in combined_output
+        assert (
+            f"ValueError: {illegal_value} is not an allowed Tensorizer argument."
+        ) in combined_output
diff --git a/tests/model_executor/model_loader/test_registry.py b/tests/model_executor/model_loader/test_registry.py
index 639ee6db9270..020988ccac13 100644
--- a/tests/model_executor/model_loader/test_registry.py
+++ b/tests/model_executor/model_loader/test_registry.py
@@ -6,22 +6,19 @@
 
 from vllm.config import ModelConfig
 from vllm.config.load import LoadConfig
-from vllm.model_executor.model_loader import (get_model_loader,
-                                              register_model_loader)
+from vllm.model_executor.model_loader import get_model_loader, register_model_loader
 from vllm.model_executor.model_loader.base_loader import BaseModelLoader
 
 
 @register_model_loader("custom_load_format")
 class CustomModelLoader(BaseModelLoader):
-
     def __init__(self, load_config: LoadConfig) -> None:
         super().__init__(load_config)
 
     def download_model(self, model_config: ModelConfig) -> None:
         pass
 
-    def load_weights(self, model: nn.Module,
-                     model_config: ModelConfig) -> None:
+    def load_weights(self, model: nn.Module, model_config: ModelConfig) -> None:
         pass
 
 
diff --git a/tests/model_executor/model_loader/test_sharded_state_loader.py b/tests/model_executor/model_loader/test_sharded_state_loader.py
index 785169f5d22e..5bb841bf2fa0 100644
--- a/tests/model_executor/model_loader/test_sharded_state_loader.py
+++ b/tests/model_executor/model_loader/test_sharded_state_loader.py
@@ -35,11 +35,13 @@ def test_filter_subtensors():
         "b": torch.empty((2, 4)),
         "c": torch.empty((2, 4, 8)),
     }
-    state_dict.update({
-        "x": state_dict["b"],
-        "y": state_dict["c"][1, 2, :],
-        "z": state_dict["c"][1, :, 4],
-    })
+    state_dict.update(
+        {
+            "x": state_dict["b"],
+            "y": state_dict["c"][1, 2, :],
+            "z": state_dict["c"][1, :, 4],
+        }
+    )
     filtered_state_dict = ShardedStateLoader._filter_subtensors(state_dict)
     assert tuple(filtered_state_dict.keys()) == ("a", "b", "c")
     for key, tensor in filtered_state_dict.items():
@@ -49,8 +51,9 @@ def test_filter_subtensors():
 
 @pytest.fixture(scope="module")
 def llama_3p2_1b_files():
-    input_dir = snapshot_download("meta-llama/Llama-3.2-1B-Instruct",
-                                  ignore_patterns=["*.bin*", "original/*"])
+    input_dir = snapshot_download(
+        "meta-llama/Llama-3.2-1B-Instruct", ignore_patterns=["*.bin*", "original/*"]
+    )
 
     yield input_dir
 
@@ -63,8 +66,7 @@ def _run_writer(input_dir, output_dir, weights_patterns, **kwargs):
     if is_v1_engine:
         # For V1 engine, we need to use engine_core.save_sharded_state
         print("Using V1 engine save path")
-        llm_sharded_writer.llm_engine.engine_core.save_sharded_state(
-            path=output_dir)
+        llm_sharded_writer.llm_engine.engine_core.save_sharded_state(path=output_dir)
     else:
         # For V0 engine
         print("Using V0 engine save path")
@@ -74,8 +76,9 @@ def _run_writer(input_dir, output_dir, weights_patterns, **kwargs):
     # Copy metadata files to output directory
     for file in os.listdir(input_dir):
         if os.path.isdir(os.path.join(input_dir, file)):
-            shutil.copytree(os.path.join(input_dir, file),
-                            os.path.join(output_dir, file))
+            shutil.copytree(
+                os.path.join(input_dir, file), os.path.join(output_dir, file)
+            )
         elif not any(fnmatch.fnmatch(file, ext) for ext in weights_patterns):
             shutil.copy(os.path.join(input_dir, file), output_dir)
 
@@ -90,37 +93,42 @@ def _run_generate(input_dir, queue: mp.Queue, **kwargs):
 
 @pytest.mark.parametrize("enable_lora", [False, True])
 @pytest.mark.parametrize("tp_size", [1, 2])
-def test_sharded_state_loader(enable_lora, tp_size, num_gpus_available,
-                              llama_3p2_1b_files):
+def test_sharded_state_loader(
+    enable_lora, tp_size, num_gpus_available, llama_3p2_1b_files
+):
     if num_gpus_available < tp_size:
         pytest.skip(f"Not enough GPUs for tensor parallelism {tp_size}")
 
-    weights_patterns = ("*.safetensors", )
+    weights_patterns = ("*.safetensors",)
     gpu_memory_utilization = 0.8
     input_dir = llama_3p2_1b_files
     ctx = mp.get_context("spawn")
 
     # Run in separate processes for memory & CUDA isolation
     with TemporaryDirectory() as output_dir:
-        p = ctx.Process(target=_run_writer,
-                        args=(input_dir, output_dir, weights_patterns),
-                        kwargs=dict(
-                            tensor_parallel_size=tp_size,
-                            gpu_memory_utilization=gpu_memory_utilization,
-                            enforce_eager=True,
-                        ))
+        p = ctx.Process(
+            target=_run_writer,
+            args=(input_dir, output_dir, weights_patterns),
+            kwargs=dict(
+                tensor_parallel_size=tp_size,
+                gpu_memory_utilization=gpu_memory_utilization,
+                enforce_eager=True,
+            ),
+        )
         p.start()
         p.join()
 
         queue = ctx.Queue()
 
-        p = ctx.Process(target=_run_generate,
-                        args=(input_dir, queue),
-                        kwargs=dict(
-                            enable_lora=enable_lora,
-                            gpu_memory_utilization=gpu_memory_utilization,
-                            tensor_parallel_size=tp_size,
-                        ))
+        p = ctx.Process(
+            target=_run_generate,
+            args=(input_dir, queue),
+            kwargs=dict(
+                enable_lora=enable_lora,
+                gpu_memory_utilization=gpu_memory_utilization,
+                tensor_parallel_size=tp_size,
+            ),
+        )
         p.start()
         # Call queue.get() before p.join() to prevent deadlock:
         # If p.join() is called before queue.get() and the queue is full,
@@ -134,14 +142,16 @@ def test_sharded_state_loader(enable_lora, tp_size, num_gpus_available,
 
         queue = ctx.Queue()
 
-        p = ctx.Process(target=_run_generate,
-                        args=(output_dir, queue),
-                        kwargs=dict(
-                            enable_lora=enable_lora,
-                            gpu_memory_utilization=gpu_memory_utilization,
-                            tensor_parallel_size=tp_size,
-                            load_format="sharded_state",
-                        ))
+        p = ctx.Process(
+            target=_run_generate,
+            args=(output_dir, queue),
+            kwargs=dict(
+                enable_lora=enable_lora,
+                gpu_memory_utilization=gpu_memory_utilization,
+                tensor_parallel_size=tp_size,
+                load_format="sharded_state",
+            ),
+        )
         p.start()
         # Call queue.get() before p.join() to prevent deadlock:
         # If p.join() is called before queue.get() and the queue is full,
diff --git a/tests/model_executor/test_enabled_custom_ops.py b/tests/model_executor/test_enabled_custom_ops.py
index 200b6ecd5852..12aad4cb8da0 100644
--- a/tests/model_executor/test_enabled_custom_ops.py
+++ b/tests/model_executor/test_enabled_custom_ops.py
@@ -7,16 +7,24 @@
 
 from vllm.config import CompilationConfig, VllmConfig, set_current_vllm_config
 from vllm.model_executor.custom_op import CustomOp
-from vllm.model_executor.layers.activation import (GeluAndMul,
-                                                   ReLUSquaredActivation,
-                                                   SiluAndMul)
-from vllm.model_executor.layers.fused_moe.fused_moe import (dispatch_topk_func,
-                                                            vllm_topk_softmax)
+from vllm.model_executor.layers.activation import (
+    GeluAndMul,
+    ReLUSquaredActivation,
+    SiluAndMul,
+)
+from vllm.model_executor.layers.fused_moe.fused_moe import (
+    dispatch_topk_func,
+    vllm_topk_softmax,
+)
 from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-    is_rocm_aiter_moe_enabled)
-from vllm.model_executor.layers.layernorm import (RMSNorm,
-                                                  dispatch_rocm_rmsnorm_func,
-                                                  fused_add_rms_norm, rms_norm)
+    is_rocm_aiter_moe_enabled,
+)
+from vllm.model_executor.layers.layernorm import (
+    RMSNorm,
+    dispatch_rocm_rmsnorm_func,
+    fused_add_rms_norm,
+    rms_norm,
+)
 from vllm.platforms import current_platform
 
 RMS_NORM_SUPPORTED_DTYPES = [torch.float16, torch.bfloat16]
@@ -65,14 +73,21 @@ class Relu3(ReLUSquaredActivation):
         ("-silu_and_mul,+relu3", 3, True, [0, 0, 0, 1], False),
         # All but RMSNorm
         ("all,-rms_norm", 4, True, [0, 1, 1, 1], True),
-    ])
-def test_enabled_ops(env: Optional[str], torch_level: int, use_inductor: bool,
-                     ops_enabled: list[int], default_on: bool):
-    custom_ops = env.split(',') if env else []
+    ],
+)
+def test_enabled_ops(
+    env: Optional[str],
+    torch_level: int,
+    use_inductor: bool,
+    ops_enabled: list[int],
+    default_on: bool,
+):
+    custom_ops = env.split(",") if env else []
     vllm_config = VllmConfig(
-        compilation_config=CompilationConfig(use_inductor=bool(use_inductor),
-                                             level=torch_level,
-                                             custom_ops=custom_ops))
+        compilation_config=CompilationConfig(
+            use_inductor=bool(use_inductor), level=torch_level, custom_ops=custom_ops
+        )
+    )
     with set_current_vllm_config(vllm_config):
         assert CustomOp.default_on() == default_on
 
@@ -100,11 +115,13 @@ class SiluAndMul2(SiluAndMul):
 
 
 @pytest.mark.parametrize(
-    "env", ["all,none", "all,+rms_norm,all", "+rms_norm,-rms_norm"])
+    "env", ["all,none", "all,+rms_norm,all", "+rms_norm,-rms_norm"]
+)
 def test_enabled_ops_invalid(env: str):
     with pytest.raises(Exception):  # noqa
-        vllm_config = VllmConfig(compilation_config=CompilationConfig(
-            custom_ops=env.split(",")))
+        vllm_config = VllmConfig(
+            compilation_config=CompilationConfig(custom_ops=env.split(","))
+        )
         with set_current_vllm_config(vllm_config):
             RMSNorm(1024).enabled()
 
@@ -116,28 +133,38 @@ def test_topk_dispatch(use_rocm_aiter: str, monkeypatch):
     is_rocm_aiter_moe_enabled.cache_clear()
     if current_platform.is_rocm() and int(use_rocm_aiter):
         from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-            rocm_aiter_topk_softmax)
+            rocm_aiter_topk_softmax,
+        )
+
         assert topk_func == rocm_aiter_topk_softmax
     else:
         assert topk_func == vllm_topk_softmax
 
 
 @pytest.mark.parametrize("add_residual", [True, False])
-@pytest.mark.parametrize("dtype",
-                         [torch.float32, torch.float16, torch.bfloat16])
+@pytest.mark.parametrize("dtype", [torch.float32, torch.float16, torch.bfloat16])
 @pytest.mark.parametrize("use_rocm_aiter", ["0", "1"])
 @pytest.mark.parametrize("use_rocm_aiter_norm", ["0", "1"])
-@pytest.mark.skipif(not current_platform.is_rocm(),
-                    reason="AITER is a feature exclusive for ROCm")
-def test_rms_norm_dispatch(add_residual: bool, dtype: torch.dtype,
-                           use_rocm_aiter: str, use_rocm_aiter_norm: str,
-                           monkeypatch):
+@pytest.mark.skipif(
+    not current_platform.is_rocm(), reason="AITER is a feature exclusive for ROCm"
+)
+def test_rms_norm_dispatch(
+    add_residual: bool,
+    dtype: torch.dtype,
+    use_rocm_aiter: str,
+    use_rocm_aiter_norm: str,
+    monkeypatch,
+):
     monkeypatch.setenv("VLLM_ROCM_USE_AITER", use_rocm_aiter)
     monkeypatch.setenv("VLLM_ROCM_USE_AITER_RMSNORM", use_rocm_aiter_norm)
     rms_norm_func = dispatch_rocm_rmsnorm_func(add_residual, dtype)
 
-    should_use_rocm_aiter = current_platform.is_rocm() and int(use_rocm_aiter) \
-        and int(use_rocm_aiter_norm) and dtype in RMS_NORM_SUPPORTED_DTYPES
+    should_use_rocm_aiter = (
+        current_platform.is_rocm()
+        and int(use_rocm_aiter)
+        and int(use_rocm_aiter_norm)
+        and dtype in RMS_NORM_SUPPORTED_DTYPES
+    )
 
     if add_residual and should_use_rocm_aiter:
         assert rms_norm_func == torch.ops.vllm.rocm_aiter_rmsnorm2d_fwd_with_add
diff --git a/tests/model_executor/test_model_load_with_params.py b/tests/model_executor/test_model_load_with_params.py
index c7b15c6ae118..489ac1e6475b 100644
--- a/tests/model_executor/test_model_load_with_params.py
+++ b/tests/model_executor/test_model_load_with_params.py
@@ -5,8 +5,12 @@
 
 import pytest
 
-from vllm.model_executor.layers.pooler import (CLSPool, DispatchPooler,
-                                               MeanPool, PoolingType)
+from vllm.model_executor.layers.pooler import (
+    CLSPool,
+    DispatchPooler,
+    MeanPool,
+    PoolingType,
+)
 from vllm.model_executor.models.bert import BertEmbeddingModel
 from vllm.model_executor.models.roberta import RobertaEmbeddingModel
 from vllm.platforms import current_platform
@@ -15,25 +19,28 @@
 MODEL_NAME = os.environ.get("MODEL_NAME", "BAAI/bge-base-en-v1.5")
 REVISION = os.environ.get("REVISION", "main")
 
-MODEL_NAME_ROBERTA = os.environ.get("MODEL_NAME",
-                                    "intfloat/multilingual-e5-base")
+MODEL_NAME_ROBERTA = os.environ.get("MODEL_NAME", "intfloat/multilingual-e5-base")
 REVISION_ROBERTA = os.environ.get("REVISION", "main")
 
 
-@pytest.mark.skipif(current_platform.is_rocm(),
-                    reason="Xformers backend is not supported on ROCm.")
+@pytest.mark.skipif(
+    current_platform.is_rocm(), reason="Xformers backend is not supported on ROCm."
+)
 def test_model_loading_with_params(vllm_runner, monkeypatch):
     """
     Test parameter weight loading with tp>1.
     """
     # to use apply_model
     monkeypatch.setenv("VLLM_ALLOW_INSECURE_SERIALIZATION", "1")
-    with vllm_runner(model_name=MODEL_NAME,
-                     revision=REVISION,
-                     dtype="float16",
-                     max_model_len=MAX_MODEL_LEN) as vllm_model:
-        output = vllm_model.embed("Write a short story about a robot that"
-                                  " dreams for the first time.\n")
+    with vllm_runner(
+        model_name=MODEL_NAME,
+        revision=REVISION,
+        dtype="float16",
+        max_model_len=MAX_MODEL_LEN,
+    ) as vllm_model:
+        output = vllm_model.embed(
+            "Write a short story about a robot that dreams for the first time.\n"
+        )
 
         model_config = vllm_model.llm.llm_engine.model_config
         model_tokenizer = vllm_model.llm.llm_engine.tokenizer
@@ -60,20 +67,24 @@ def check_model(model):
         assert output
 
 
-@pytest.mark.skipif(current_platform.is_rocm(),
-                    reason="Xformers backend is not supported on ROCm.")
+@pytest.mark.skipif(
+    current_platform.is_rocm(), reason="Xformers backend is not supported on ROCm."
+)
 def test_roberta_model_loading_with_params(vllm_runner, monkeypatch):
     """
     Test parameter weight loading with tp>1.
     """
     # to use apply_model
     monkeypatch.setenv("VLLM_ALLOW_INSECURE_SERIALIZATION", "1")
-    with vllm_runner(model_name=MODEL_NAME_ROBERTA,
-                     revision=REVISION_ROBERTA,
-                     dtype="float16",
-                     max_model_len=MAX_MODEL_LEN) as vllm_model:
-        output = vllm_model.embed("Write a short story about a robot that"
-                                  " dreams for the first time.\n")
+    with vllm_runner(
+        model_name=MODEL_NAME_ROBERTA,
+        revision=REVISION_ROBERTA,
+        dtype="float16",
+        max_model_len=MAX_MODEL_LEN,
+    ) as vllm_model:
+        output = vllm_model.embed(
+            "Write a short story about a robot that dreams for the first time.\n"
+        )
 
         model_config = vllm_model.llm.llm_engine.model_config
         model_tokenizer = vllm_model.llm.llm_engine.tokenizer
@@ -93,16 +104,16 @@ def test_roberta_model_loading_with_params(vllm_runner, monkeypatch):
         def check_model(model):
             assert isinstance(model, RobertaEmbeddingModel)
             assert isinstance(pooler := model.pooler, DispatchPooler)
-            assert isinstance(pooler.poolers_by_task["embed"].pooling,
-                              MeanPool)
+            assert isinstance(pooler.poolers_by_task["embed"].pooling, MeanPool)
 
         vllm_model.apply_model(check_model)
 
         assert output
 
 
-@pytest.mark.skipif(current_platform.is_rocm(),
-                    reason="Xformers backend is not supported on ROCm.")
+@pytest.mark.skipif(
+    current_platform.is_rocm(), reason="Xformers backend is not supported on ROCm."
+)
 def test_facebook_roberta_model_loading_with_params(vllm_runner, monkeypatch):
     """
     Test loading roberta-base model with no lm_head.
@@ -110,11 +121,12 @@ def test_facebook_roberta_model_loading_with_params(vllm_runner, monkeypatch):
     # to use apply_model
     monkeypatch.setenv("VLLM_ALLOW_INSECURE_SERIALIZATION", "1")
     model_name = "FacebookAI/roberta-base"
-    with vllm_runner(model_name=model_name,
-                     dtype="float16",
-                     max_model_len=MAX_MODEL_LEN) as vllm_model:
-        output = vllm_model.embed("Write a short story about a robot that"
-                                  " dreams for the first time.\n")
+    with vllm_runner(
+        model_name=model_name, dtype="float16", max_model_len=MAX_MODEL_LEN
+    ) as vllm_model:
+        output = vllm_model.embed(
+            "Write a short story about a robot that dreams for the first time.\n"
+        )
 
         assert vllm_model.llm.llm_engine.model_config.tokenizer == model_name
 
diff --git a/tests/model_executor/test_weight_utils.py b/tests/model_executor/test_weight_utils.py
index df625b8d6004..6dc120ddbac9 100644
--- a/tests/model_executor/test_weight_utils.py
+++ b/tests/model_executor/test_weight_utils.py
@@ -9,23 +9,24 @@
 from huggingface_hub.utils import LocalEntryNotFoundError
 
 from vllm.model_executor.model_loader.weight_utils import (
-    download_weights_from_hf, enable_hf_transfer)
+    download_weights_from_hf,
+    enable_hf_transfer,
+)
 
 
 def test_hf_transfer_auto_activation():
     if "HF_HUB_ENABLE_HF_TRANSFER" in os.environ:
         # in case it is already set, we can't test the auto activation
-        pytest.skip(
-            "HF_HUB_ENABLE_HF_TRANSFER is set, can't test auto activation")
+        pytest.skip("HF_HUB_ENABLE_HF_TRANSFER is set, can't test auto activation")
     enable_hf_transfer()
     try:
         # enable hf hub transfer if available
         import hf_transfer  # type: ignore # noqa
+
         HF_TRANSFER_ACTIVE = True
     except ImportError:
         HF_TRANSFER_ACTIVE = False
-    assert (huggingface_hub.constants.HF_HUB_ENABLE_HF_TRANSFER ==
-            HF_TRANSFER_ACTIVE)
+    assert huggingface_hub.constants.HF_HUB_ENABLE_HF_TRANSFER == HF_TRANSFER_ACTIVE
 
 
 def test_download_weights_from_hf():
@@ -34,22 +35,30 @@ def test_download_weights_from_hf():
         # if offline is set and model is not cached
         huggingface_hub.constants.HF_HUB_OFFLINE = True
         with pytest.raises(LocalEntryNotFoundError):
-            download_weights_from_hf("facebook/opt-125m",
-                                     allow_patterns=["*.safetensors", "*.bin"],
-                                     cache_dir=tmpdir)
+            download_weights_from_hf(
+                "facebook/opt-125m",
+                allow_patterns=["*.safetensors", "*.bin"],
+                cache_dir=tmpdir,
+            )
 
         # download the model
         huggingface_hub.constants.HF_HUB_OFFLINE = False
-        download_weights_from_hf("facebook/opt-125m",
-                                 allow_patterns=["*.safetensors", "*.bin"],
-                                 cache_dir=tmpdir)
+        download_weights_from_hf(
+            "facebook/opt-125m",
+            allow_patterns=["*.safetensors", "*.bin"],
+            cache_dir=tmpdir,
+        )
 
         # now it should work offline
         huggingface_hub.constants.HF_HUB_OFFLINE = True
-        assert download_weights_from_hf(
-            "facebook/opt-125m",
-            allow_patterns=["*.safetensors", "*.bin"],
-            cache_dir=tmpdir) is not None
+        assert (
+            download_weights_from_hf(
+                "facebook/opt-125m",
+                allow_patterns=["*.safetensors", "*.bin"],
+                cache_dir=tmpdir,
+            )
+            is not None
+        )
 
 
 if __name__ == "__main__":
diff --git a/tests/models/language/generation/test_common.py b/tests/models/language/generation/test_common.py
index 39c4dd735b72..3fc265194e2a 100644
--- a/tests/models/language/generation/test_common.py
+++ b/tests/models/language/generation/test_common.py
@@ -51,8 +51,9 @@
         pytest.param(
             "google/gemma-1.1-2b-it",  # gemma
             marks=[
-                pytest.mark.core_model, pytest.mark.cpu_model,
-                pytest.mark.slow_test
+                pytest.mark.core_model,
+                pytest.mark.cpu_model,
+                pytest.mark.slow_test,
             ],
         ),
         pytest.param(
@@ -65,8 +66,7 @@
         pytest.param(
             "openbmb/MiniCPM3-4B",
             # fused_moe not supported on CPU
-            marks=[pytest.mark.core_model,
-                   large_gpu_mark(min_gb=32)],
+            marks=[pytest.mark.core_model, large_gpu_mark(min_gb=32)],
         ),
         pytest.param(
             "facebook/opt-125m",  # opt
@@ -82,8 +82,9 @@
         pytest.param(
             "Qwen/Qwen2.5-0.5B-Instruct",  # qwen2
             marks=[
-                pytest.mark.core_model, pytest.mark.cpu_model,
-                pytest.mark.slow_test
+                pytest.mark.core_model,
+                pytest.mark.cpu_model,
+                pytest.mark.slow_test,
             ],
         ),
         pytest.param(
@@ -100,16 +101,25 @@
             marks=[pytest.mark.cpu_model],
         ),
         pytest.param("swiss-ai/Apertus-8B-2509"),  # apertus
-    ])
+    ],
+)
 @pytest.mark.parametrize("max_tokens", [32])
 @pytest.mark.parametrize("num_logprobs", [5])
 @pytest.mark.parametrize(
-    "use_rocm_aiter", [True, False] if current_platform.is_rocm() else [False])
+    "use_rocm_aiter", [True, False] if current_platform.is_rocm() else [False]
+)
 @pytest.mark.parametrize("use_prompt_embeds", [True, False])
-def test_models(hf_runner, vllm_runner, example_prompts, model: str,
-                max_tokens: int, num_logprobs: int, use_rocm_aiter: bool,
-                use_prompt_embeds: bool, monkeypatch) -> None:
-
+def test_models(
+    hf_runner,
+    vllm_runner,
+    example_prompts,
+    model: str,
+    max_tokens: int,
+    num_logprobs: int,
+    use_rocm_aiter: bool,
+    use_prompt_embeds: bool,
+    monkeypatch,
+) -> None:
     model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
     model_info.check_available_online(on_fail="skip")
     model_info.check_transformers_version(on_fail="skip")
@@ -125,34 +135,37 @@ def test_models(hf_runner, vllm_runner, example_prompts, model: str,
 
     with hf_runner(model) as hf_model:
         hf_outputs = hf_model.generate_greedy_logprobs_limit(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
-        prompt_embeds: Optional[list[torch.Tensor]] = ([] if use_prompt_embeds
-                                                       else None)
+        prompt_embeds: Optional[list[torch.Tensor]] = [] if use_prompt_embeds else None
 
         prompt_token_ids = []
         for prompt in example_prompts:
-            token_ids = hf_model.tokenizer(prompt,
-                                           return_tensors="pt").input_ids.to(
-                                               hf_model.model.device)
+            token_ids = hf_model.tokenizer(prompt, return_tensors="pt").input_ids.to(
+                hf_model.model.device
+            )
             prompt_token_ids.append(token_ids)
             if prompt_embeds is not None:
-                prompt_embeds.append(hf_model.model.get_input_embeddings()(
-                    token_ids).squeeze(0))
+                prompt_embeds.append(
+                    hf_model.model.get_input_embeddings()(token_ids).squeeze(0)
+                )
 
     with vllm_runner(
-            model,
-            tokenizer_name=model_info.tokenizer or model,
-            tokenizer_mode=model_info.tokenizer_mode,
-            trust_remote_code=model_info.trust_remote_code,
-            max_num_seqs=2,
-            enable_prompt_embeds=use_prompt_embeds,
+        model,
+        tokenizer_name=model_info.tokenizer or model,
+        tokenizer_mode=model_info.tokenizer_mode,
+        trust_remote_code=model_info.trust_remote_code,
+        max_num_seqs=2,
+        enable_prompt_embeds=use_prompt_embeds,
     ) as vllm_model:
         vllm_outputs = vllm_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
         if prompt_embeds is not None:
             vllm_outputs_from_embeds = vllm_model.generate_greedy_logprobs(
-                prompt_embeds, max_tokens, num_logprobs)
+                prompt_embeds, max_tokens, num_logprobs
+            )
 
     check_logprobs_close(
         outputs_0_lst=hf_outputs,
diff --git a/tests/models/language/generation/test_gemma.py b/tests/models/language/generation/test_gemma.py
index 60a4bc14be88..53bff5ed8651 100644
--- a/tests/models/language/generation/test_gemma.py
+++ b/tests/models/language/generation/test_gemma.py
@@ -11,17 +11,17 @@ def test_dummy_loader(vllm_runner, monkeypatch, model: str) -> None:
     with monkeypatch.context() as m:
         m.setenv("VLLM_ALLOW_INSECURE_SERIALIZATION", "1")
         with vllm_runner(
-                model,
-                load_format="dummy",
+            model,
+            load_format="dummy",
         ) as llm:
             if model == "google/gemma-3-4b-it":
                 normalizers = llm.llm.collective_rpc(
-                    lambda self: self.model_runner.model.language_model.model.
-                    normalizer.cpu().item())
+                    lambda self: self.model_runner.model.language_model.model.normalizer.cpu().item()
+                )
                 config = llm.llm.llm_engine.model_config.hf_config.text_config
             else:
                 normalizers = llm.llm.collective_rpc(
-                    lambda self: self.model_runner.model.model.normalizer.cpu(
-                    ).item())
+                    lambda self: self.model_runner.model.model.normalizer.cpu().item()
+                )
                 config = llm.llm.llm_engine.model_config.hf_config
             assert np.allclose(normalizers, config.hidden_size**0.5, rtol=2e-3)
diff --git a/tests/models/language/generation/test_granite.py b/tests/models/language/generation/test_granite.py
index 2a39f78a708e..e569e75ff3a8 100644
--- a/tests/models/language/generation/test_granite.py
+++ b/tests/models/language/generation/test_granite.py
@@ -26,11 +26,13 @@ def test_models(
 ) -> None:
     with hf_runner(model, dtype=dtype) as hf_model:
         hf_outputs = hf_model.generate_greedy_logprobs_limit(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     with vllm_runner(model, dtype=dtype) as vllm_model:
         vllm_outputs = vllm_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
     check_logprobs_close(
         outputs_0_lst=hf_outputs,
         outputs_1_lst=vllm_outputs,
diff --git a/tests/models/language/generation/test_hybrid.py b/tests/models/language/generation/test_hybrid.py
index bd7157568e84..abedd15b0d7e 100644
--- a/tests/models/language/generation/test_hybrid.py
+++ b/tests/models/language/generation/test_hybrid.py
@@ -24,7 +24,7 @@
     "tiiuae/falcon-mamba-tiny-dev",
     # mamba2-codestral in transformers is broken pending:
     # https://github.com/huggingface/transformers/pull/40861
-    #"yujiepan/mamba2-codestral-v0.1-tiny-random",
+    # "yujiepan/mamba2-codestral-v0.1-tiny-random",
 ]
 
 HYBRID_MODELS = [
@@ -65,7 +65,6 @@ def test_models(
     max_tokens: int,
     num_logprobs: int,
 ) -> None:
-
     try:
         model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
         model_info.check_available_online(on_fail="skip")
@@ -75,11 +74,13 @@ def test_models(
 
     with hf_runner(model) as hf_model:
         hf_outputs = hf_model.generate_greedy_logprobs_limit(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     with vllm_runner(model, max_num_seqs=MAX_NUM_SEQS) as vllm_model:
         vllm_outputs = vllm_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     check_logprobs_close(
         outputs_0_lst=hf_outputs,
@@ -109,13 +110,14 @@ def test_batching(
     for_loop_outputs = []
     with vllm_runner(model, max_num_seqs=MAX_NUM_SEQS) as vllm_model:
         for prompt in example_prompts:
-            single_output, = vllm_model.generate_greedy_logprobs([prompt],
-                                                                 max_tokens,
-                                                                 num_logprobs)
+            (single_output,) = vllm_model.generate_greedy_logprobs(
+                [prompt], max_tokens, num_logprobs
+            )
             for_loop_outputs.append(single_output)
 
         batched_outputs = vllm_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     check_logprobs_close(
         outputs_0_lst=for_loop_outputs,
@@ -134,8 +136,8 @@ def test_chunked_prefill_with_parallel_sampling(
     max_tokens: int,
 ) -> None:
     """
-    Tests chunked prefill in conjunction with n > 1. 
-    
+    Tests chunked prefill in conjunction with n > 1.
+
     In this case, prefill is populated with decoding tokens and
     we test that it doesn't fail.
 
@@ -143,16 +145,13 @@ def test_chunked_prefill_with_parallel_sampling(
     decoding steps inside a chunked prefill forward pass
     (where we have both prefill and decode together)
     """
-    sampling_params = SamplingParams(n=3,
-                                     temperature=1,
-                                     seed=0,
-                                     max_tokens=max_tokens)
+    sampling_params = SamplingParams(n=3, temperature=1, seed=0, max_tokens=max_tokens)
     with vllm_runner(
-            model,
-            enable_chunked_prefill=True,
-            # forces prefill chunks with decoding
-            max_num_batched_tokens=MAX_NUM_SEQS * 3,
-            max_num_seqs=MAX_NUM_SEQS,
+        model,
+        enable_chunked_prefill=True,
+        # forces prefill chunks with decoding
+        max_num_batched_tokens=MAX_NUM_SEQS * 3,
+        max_num_seqs=MAX_NUM_SEQS,
     ) as vllm_model:
         vllm_model.generate(example_prompts, sampling_params)
 
@@ -170,10 +169,8 @@ def test_mamba_cache_cg_padding(
     batch size. If it's not, a torch RuntimeError will be raised because
     tensor dimensions aren't compatible.
     """
-    vllm_config = EngineArgs(model=model,
-                             trust_remote_code=True).create_engine_config()
-    while len(example_prompts) == vllm_config.pad_for_cudagraph(
-            len(example_prompts)):
+    vllm_config = EngineArgs(model=model, trust_remote_code=True).create_engine_config()
+    while len(example_prompts) == vllm_config.pad_for_cudagraph(len(example_prompts)):
         example_prompts.append(example_prompts[0])
 
     try:
@@ -183,7 +180,8 @@ def test_mamba_cache_cg_padding(
         pytest.fail(
             "Couldn't run batch size which is not equal to a Cuda Graph "
             "captured batch size. "
-            "Could be related to mamba cache not padded correctly")
+            "Could be related to mamba cache not padded correctly"
+        )
 
 
 @pytest.mark.parametrize("model", [SSM_MODELS[0], HYBRID_MODELS[0]])
@@ -205,8 +203,10 @@ def test_fail_upon_inc_requests_and_finished_requests_lt_available_blocks(
         with vllm_runner(model, max_num_seqs=MAX_NUM_SEQS) as vllm_model:
             vllm_model.generate_greedy([example_prompts[0]] * 100, 10)
     except ValueError:
-        pytest.fail("Hybrid inner state wasn't cleaned up properly between"
-                    "steps finished requests registered unnecessarily ")
+        pytest.fail(
+            "Hybrid inner state wasn't cleaned up properly between"
+            "steps finished requests registered unnecessarily "
+        )
 
 
 @pytest.mark.parametrize("model", [SSM_MODELS[0], HYBRID_MODELS[0]])
@@ -215,10 +215,10 @@ def test_state_cleanup(
     example_prompts,
     model: str,
 ) -> None:
-    """ 
+    """
     This test is for verifying that the Hybrid state is cleaned up between
     steps.
-    
+
     If it's not cleaned, an error would be expected.
     """
     try:
@@ -226,8 +226,10 @@ def test_state_cleanup(
             for _ in range(10):
                 vllm_model.generate_greedy([example_prompts[0]] * 100, 1)
     except ValueError:
-        pytest.fail("Hybrid inner state wasn't cleaned up between states, "
-                    "could be related to finished_requests_ids")
+        pytest.fail(
+            "Hybrid inner state wasn't cleaned up between states, "
+            "could be related to finished_requests_ids"
+        )
 
 
 @multi_gpu_test(num_gpus=2)
@@ -241,15 +243,19 @@ def test_distributed_correctness(
     max_tokens: int,
     num_logprobs: int,
 ) -> None:
-    with vllm_runner(model, tensor_parallel_size=1,
-                     max_num_seqs=MAX_NUM_SEQS) as vllm_model:
+    with vllm_runner(
+        model, tensor_parallel_size=1, max_num_seqs=MAX_NUM_SEQS
+    ) as vllm_model:
         vllm_outputs_tp_1 = vllm_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
-    with vllm_runner(model, tensor_parallel_size=2,
-                     max_num_seqs=MAX_NUM_SEQS) as vllm_model:
+    with vllm_runner(
+        model, tensor_parallel_size=2, max_num_seqs=MAX_NUM_SEQS
+    ) as vllm_model:
         vllm_outputs_tp_2 = vllm_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     check_logprobs_close(
         outputs_0_lst=vllm_outputs_tp_1,
@@ -271,7 +277,6 @@ def test_full_cuda_graph(
     max_tokens: int,
     num_logprobs: int,
 ) -> None:
-
     try:
         model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
         model_info.check_available_online(on_fail="skip")
@@ -281,11 +286,13 @@ def test_full_cuda_graph(
 
     with hf_runner(model) as hf_model:
         hf_outputs = hf_model.generate_greedy_logprobs_limit(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     with vllm_runner(model, max_num_seqs=MAX_NUM_SEQS) as vllm_model:
         vllm_outputs = vllm_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     check_logprobs_close(
         outputs_0_lst=hf_outputs,
@@ -298,8 +305,9 @@ def test_full_cuda_graph(
 @pytest.mark.parametrize("model", FP32_STATE_MODELS)
 @pytest.mark.parametrize("max_tokens", [64])
 @pytest.mark.parametrize("num_logprobs", [5])
-@pytest.mark.parametrize("cache_dtype_param",
-                         ["mamba_ssm_cache_dtype", "mamba_cache_dtype"])
+@pytest.mark.parametrize(
+    "cache_dtype_param", ["mamba_ssm_cache_dtype", "mamba_cache_dtype"]
+)
 def test_fp32_cache_state(
     hf_runner,
     vllm_runner,
@@ -310,7 +318,6 @@ def test_fp32_cache_state(
     num_logprobs: int,
     cache_dtype_param: str,
 ) -> None:
-
     try:
         model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
         model_info.check_available_online(on_fail="skip")
@@ -320,13 +327,15 @@ def test_fp32_cache_state(
 
     with hf_runner(model) as hf_model:
         hf_outputs = hf_model.generate_greedy_logprobs_limit(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
-    with vllm_runner(model,
-                     max_num_seqs=MAX_NUM_SEQS,
-                     **{cache_dtype_param: "float32"}) as vllm_model:
+    with vllm_runner(
+        model, max_num_seqs=MAX_NUM_SEQS, **{cache_dtype_param: "float32"}
+    ) as vllm_model:
         vllm_outputs = vllm_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     check_logprobs_close(
         outputs_0_lst=hf_outputs,
@@ -339,21 +348,23 @@ def test_fp32_cache_state(
 # Helper functions for the APC tests
 def _get_vllm_runner_params(model, max_model_len, tensor_parallel_size=1):
     return {
-        'model_name': model,
-        'enable_prefix_caching': False,
-        'max_model_len': max_model_len,
-        'tensor_parallel_size': tensor_parallel_size,
-        'gpu_memory_utilization': 0.4
+        "model_name": model,
+        "enable_prefix_caching": False,
+        "max_model_len": max_model_len,
+        "tensor_parallel_size": tensor_parallel_size,
+        "gpu_memory_utilization": 0.4,
     }
 
 
-def _get_vLLM_output(vllm_runner,
-                     kwargs,
-                     prompts,
-                     max_tokens,
-                     num_logprobs,
-                     num_repetitions=1,
-                     vllm_model=None):
+def _get_vLLM_output(
+    vllm_runner,
+    kwargs,
+    prompts,
+    max_tokens,
+    num_logprobs,
+    num_repetitions=1,
+    vllm_model=None,
+):
     outs = []
     if vllm_model is None:
         vllm_model = vllm_runner(**kwargs)
@@ -362,7 +373,8 @@ def _get_vLLM_output(vllm_runner,
             vllm_output = vllm_model.generate_greedy(prompts, max_tokens)
         else:
             vllm_output = vllm_model.generate_greedy_logprobs(
-                prompts, max_tokens, num_logprobs)
+                prompts, max_tokens, num_logprobs
+            )
         outs.append(vllm_output)
 
     return outs, vllm_model
@@ -387,7 +399,6 @@ def test_apc_single_prompt(
     num_logprobs: int,
     tensor_parallel_size: int,
 ) -> None:
-
     try:
         model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
         model_info.check_available_online(on_fail="skip")
@@ -395,29 +406,33 @@ def test_apc_single_prompt(
     except ValueError:
         pass
 
-    compare_operator: Callable = check_logprobs_close \
-          if num_logprobs > 0 else check_outputs_equal # type: ignore
+    compare_operator: Callable = (
+        check_logprobs_close if num_logprobs > 0 else check_outputs_equal  # type: ignore
+    )
 
     MULTIPLE = 300
 
     # Sample prompts.
     generated_prompts = [MULTIPLE * example_prompts[0]]
 
-    max_model_len = max(
-        len(prompt) + max_tokens for prompt in generated_prompts)
+    max_model_len = max(len(prompt) + max_tokens for prompt in generated_prompts)
     vllm_runner_kwargs = _get_vllm_runner_params(
-        model, max_model_len, tensor_parallel_size=tensor_parallel_size)
-    vllm_runner_kwargs['mamba_ssm_cache_dtype'] = "float32"
-    vllm_outputs_no_cache, _ = _get_vLLM_output(vllm_runner,
-                                                vllm_runner_kwargs,
-                                                generated_prompts, max_tokens,
-                                                num_logprobs)
-
-    vllm_runner_kwargs['enable_prefix_caching'] = True
-    vllm_outputs_cache_rep, _ = _get_vLLM_output(vllm_runner,
-                                                 vllm_runner_kwargs,
-                                                 generated_prompts, max_tokens,
-                                                 num_logprobs, n_repetitions)
+        model, max_model_len, tensor_parallel_size=tensor_parallel_size
+    )
+    vllm_runner_kwargs["mamba_ssm_cache_dtype"] = "float32"
+    vllm_outputs_no_cache, _ = _get_vLLM_output(
+        vllm_runner, vllm_runner_kwargs, generated_prompts, max_tokens, num_logprobs
+    )
+
+    vllm_runner_kwargs["enable_prefix_caching"] = True
+    vllm_outputs_cache_rep, _ = _get_vLLM_output(
+        vllm_runner,
+        vllm_runner_kwargs,
+        generated_prompts,
+        max_tokens,
+        num_logprobs,
+        n_repetitions,
+    )
 
     for r_idx, vllm_outputs_cache_itn in enumerate(vllm_outputs_cache_rep):
         # In the first repetition, the caches are filled
@@ -450,7 +465,6 @@ def test_apc_single_prompt_block_align_alignment(
     num_logprobs: int,
     tensor_parallel_size: int,
 ) -> None:
-
     try:
         model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
         model_info.check_available_online(on_fail="skip")
@@ -458,30 +472,29 @@ def test_apc_single_prompt_block_align_alignment(
     except ValueError:
         pass
 
-    compare_operator: Callable = check_logprobs_close \
-                    if num_logprobs > 0 else check_outputs_equal # type: ignore
+    compare_operator: Callable = (
+        check_logprobs_close if num_logprobs > 0 else check_outputs_equal  # type: ignore
+    )
 
     MULTIPLE = 300
 
     # Sample prompts. This custom prompt is used, as it causes the most issues
     generated_prompts = ["The president of the United States is " * MULTIPLE]
 
-    max_model_len = max(
-        len(prompt) + max_tokens for prompt in generated_prompts)
+    max_model_len = max(len(prompt) + max_tokens for prompt in generated_prompts)
     vllm_runner_kwargs = _get_vllm_runner_params(
-        model, max_model_len, tensor_parallel_size=tensor_parallel_size)
-    vllm_runner_kwargs['mamba_ssm_cache_dtype'] = "float32"
+        model, max_model_len, tensor_parallel_size=tensor_parallel_size
+    )
+    vllm_runner_kwargs["mamba_ssm_cache_dtype"] = "float32"
 
-    vllm_outputs_no_cache, _ = _get_vLLM_output(vllm_runner,
-                                                vllm_runner_kwargs,
-                                                generated_prompts, max_tokens,
-                                                num_logprobs)
+    vllm_outputs_no_cache, _ = _get_vLLM_output(
+        vllm_runner, vllm_runner_kwargs, generated_prompts, max_tokens, num_logprobs
+    )
 
-    vllm_runner_kwargs['enable_prefix_caching'] = True
+    vllm_runner_kwargs["enable_prefix_caching"] = True
     with vllm_runner(**vllm_runner_kwargs) as vllm_model:
         # Retrieve the default mamba state block size
-        mamba_block_size = vllm_model.llm.llm_engine.cache_config. \
-            mamba_block_size
+        mamba_block_size = vllm_model.llm.llm_engine.cache_config.mamba_block_size
 
     # In case the hybrid model does not have the
     # "mamba_block_size" assume a fixed constant
@@ -489,18 +502,18 @@ def test_apc_single_prompt_block_align_alignment(
         mamba_block_size = 512
 
     mamba_block_size_multiplier = 10
-    for offsets in [
-            -3, 3, mamba_block_size // 4 + 3, mamba_block_size // 2 - 3
-    ]:
-
-        vllm_runner_kwargs[
-            'max_num_batched_tokens'] = mamba_block_size_multiplier * \
-                                        mamba_block_size - offsets
-        vllm_outputs_cache_rep, _ = _get_vLLM_output(vllm_runner,
-                                                     vllm_runner_kwargs,
-                                                     generated_prompts,
-                                                     max_tokens, num_logprobs,
-                                                     n_repetitions)
+    for offsets in [-3, 3, mamba_block_size // 4 + 3, mamba_block_size // 2 - 3]:
+        vllm_runner_kwargs["max_num_batched_tokens"] = (
+            mamba_block_size_multiplier * mamba_block_size - offsets
+        )
+        vllm_outputs_cache_rep, _ = _get_vLLM_output(
+            vllm_runner,
+            vllm_runner_kwargs,
+            generated_prompts,
+            max_tokens,
+            num_logprobs,
+            n_repetitions,
+        )
 
         # Check alignment of the output logits when using APC
         for r_idx, vllm_outputs_cache_itn in enumerate(vllm_outputs_cache_rep):
@@ -534,7 +547,6 @@ def test_apc_multiple_prompts_all_cached_outputs(
     num_logprobs: int,
     tensor_parallel_size: int,
 ) -> None:
-
     try:
         model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
         model_info.check_available_online(on_fail="skip")
@@ -542,30 +554,34 @@ def test_apc_multiple_prompts_all_cached_outputs(
     except ValueError:
         pass
 
-    compare_operator: Callable = check_logprobs_close \
-        if num_logprobs > 0 else check_outputs_equal # type: ignore
+    compare_operator: Callable = (
+        check_logprobs_close if num_logprobs > 0 else check_outputs_equal  # type: ignore
+    )
 
     MULTIPLE = 300
 
     # Sample prompts.
     generated_prompts = [MULTIPLE * prompt for prompt in example_prompts]
 
-    max_model_len = max(
-        len(prompt) + max_tokens for prompt in generated_prompts)
+    max_model_len = max(len(prompt) + max_tokens for prompt in generated_prompts)
     vllm_runner_kwargs = _get_vllm_runner_params(
-        model, max_model_len, tensor_parallel_size=tensor_parallel_size)
-    vllm_runner_kwargs['mamba_ssm_cache_dtype'] = "float32"
+        model, max_model_len, tensor_parallel_size=tensor_parallel_size
+    )
+    vllm_runner_kwargs["mamba_ssm_cache_dtype"] = "float32"
 
-    vllm_outputs_no_cache, _ = _get_vLLM_output(vllm_runner,
-                                                vllm_runner_kwargs,
-                                                generated_prompts, max_tokens,
-                                                num_logprobs)
+    vllm_outputs_no_cache, _ = _get_vLLM_output(
+        vllm_runner, vllm_runner_kwargs, generated_prompts, max_tokens, num_logprobs
+    )
 
-    vllm_runner_kwargs['enable_prefix_caching'] = True
-    vllm_outputs_cache_rep, _ = _get_vLLM_output(vllm_runner,
-                                                 vllm_runner_kwargs,
-                                                 generated_prompts, max_tokens,
-                                                 num_logprobs, n_repetitions)
+    vllm_runner_kwargs["enable_prefix_caching"] = True
+    vllm_outputs_cache_rep, _ = _get_vLLM_output(
+        vllm_runner,
+        vllm_runner_kwargs,
+        generated_prompts,
+        max_tokens,
+        num_logprobs,
+        n_repetitions,
+    )
 
     for r_idx, vllm_outputs_cache_itn in enumerate(vllm_outputs_cache_rep):
         # In the first repetition, the caches are filled
@@ -598,7 +614,6 @@ def test_apc_multiple_prompts_block_align_alignment(
     num_logprobs: int,
     tensor_parallel_size: int,
 ) -> None:
-
     try:
         model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
         model_info.check_available_online(on_fail="skip")
@@ -606,34 +621,31 @@ def test_apc_multiple_prompts_block_align_alignment(
     except ValueError:
         pass
 
-    compare_operator: Callable = check_logprobs_close \
-        if num_logprobs > 0 else check_outputs_equal # type: ignore
+    compare_operator: Callable = (
+        check_logprobs_close if num_logprobs > 0 else check_outputs_equal  # type: ignore
+    )
 
     MULTIPLE = 300
 
     # Sample prompts. This custom prompt is used, as it causes the most issues
     prompt_text = "The president of the United States is "
     prompt_offsets = [0, 3, 7, 13, 17, 22, 25, 31]
-    generated_prompts = [
-        prompt_text[offset:] * MULTIPLE for offset in prompt_offsets
-    ]
-
-    max_model_len = max(
-        len(prompt) + max_tokens for prompt in generated_prompts)
-    vllm_runner_kwargs = _get_vllm_runner_params(model, max_model_len,
-                                                 tensor_parallel_size)
-    vllm_runner_kwargs['mamba_ssm_cache_dtype'] = "float32"
-
-    vllm_outputs_no_cache, _ = _get_vLLM_output(vllm_runner,
-                                                vllm_runner_kwargs,
-                                                generated_prompts, max_tokens,
-                                                num_logprobs)
-
-    vllm_runner_kwargs['enable_prefix_caching'] = True
+    generated_prompts = [prompt_text[offset:] * MULTIPLE for offset in prompt_offsets]
+
+    max_model_len = max(len(prompt) + max_tokens for prompt in generated_prompts)
+    vllm_runner_kwargs = _get_vllm_runner_params(
+        model, max_model_len, tensor_parallel_size
+    )
+    vllm_runner_kwargs["mamba_ssm_cache_dtype"] = "float32"
+
+    vllm_outputs_no_cache, _ = _get_vLLM_output(
+        vllm_runner, vllm_runner_kwargs, generated_prompts, max_tokens, num_logprobs
+    )
+
+    vllm_runner_kwargs["enable_prefix_caching"] = True
     with vllm_runner(**vllm_runner_kwargs) as vllm_model:
         # Retrieve the default mamba state block size
-        mamba_block_size = vllm_model.llm.llm_engine.cache_config. \
-            mamba_block_size
+        mamba_block_size = vllm_model.llm.llm_engine.cache_config.mamba_block_size
 
     # In case the hybrid model does not have the
     # "mamba_block_size" assume a fixed constant
@@ -641,18 +653,18 @@ def test_apc_multiple_prompts_block_align_alignment(
         mamba_block_size = 512
 
     mamba_block_size_multiplier = 10
-    for offsets in [
-            -3, 3, mamba_block_size // 4 + 3, mamba_block_size // 2 - 3
-    ]:
-
-        vllm_runner_kwargs[
-            'max_num_batched_tokens'] = mamba_block_size_multiplier * \
-                                        mamba_block_size - offsets
-        vllm_outputs_cache_rep, _ = _get_vLLM_output(vllm_runner,
-                                                     vllm_runner_kwargs,
-                                                     generated_prompts,
-                                                     max_tokens, num_logprobs,
-                                                     n_repetitions)
+    for offsets in [-3, 3, mamba_block_size // 4 + 3, mamba_block_size // 2 - 3]:
+        vllm_runner_kwargs["max_num_batched_tokens"] = (
+            mamba_block_size_multiplier * mamba_block_size - offsets
+        )
+        vllm_outputs_cache_rep, _ = _get_vLLM_output(
+            vllm_runner,
+            vllm_runner_kwargs,
+            generated_prompts,
+            max_tokens,
+            num_logprobs,
+            n_repetitions,
+        )
 
         # Check alignment of the output logits when using APC
         for r_idx, vllm_outputs_cache_itn in enumerate(vllm_outputs_cache_rep):
@@ -686,7 +698,6 @@ def test_apc_multiple_prompts_partial_cached_outputs(
     num_logprobs: int,
     tensor_parallel_size: int,
 ) -> None:
-
     try:
         model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
         model_info.check_available_online(on_fail="skip")
@@ -694,30 +705,30 @@ def test_apc_multiple_prompts_partial_cached_outputs(
     except ValueError:
         pass
 
-    compare_operator: Callable = check_logprobs_close \
-        if num_logprobs > 0 else check_outputs_equal # type: ignore
+    compare_operator: Callable = (
+        check_logprobs_close if num_logprobs > 0 else check_outputs_equal  # type: ignore
+    )
 
     MULTIPLE = 300
 
     # Sample prompts.
     generated_prompts = [MULTIPLE * prompt for prompt in example_prompts]
 
-    max_model_len = max(
-        len(prompt) + max_tokens for prompt in generated_prompts)
+    max_model_len = max(len(prompt) + max_tokens for prompt in generated_prompts)
     vllm_runner_kwargs = _get_vllm_runner_params(
-        model, max_model_len, tensor_parallel_size=tensor_parallel_size)
-    vllm_runner_kwargs['mamba_ssm_cache_dtype'] = "float32"
+        model, max_model_len, tensor_parallel_size=tensor_parallel_size
+    )
+    vllm_runner_kwargs["mamba_ssm_cache_dtype"] = "float32"
 
-    vllm_outputs_no_cache, _ = _get_vLLM_output(vllm_runner,
-                                                vllm_runner_kwargs,
-                                                generated_prompts, max_tokens,
-                                                num_logprobs)
+    vllm_outputs_no_cache, _ = _get_vLLM_output(
+        vllm_runner, vllm_runner_kwargs, generated_prompts, max_tokens, num_logprobs
+    )
 
     # Cache only part of all the prompts
-    vllm_runner_kwargs['enable_prefix_caching'] = True
+    vllm_runner_kwargs["enable_prefix_caching"] = True
     vllm_outputs_partial_cache, vllm_model = _get_vLLM_output(
-        vllm_runner, vllm_runner_kwargs, generated_prompts[:3], max_tokens,
-        num_logprobs)
+        vllm_runner, vllm_runner_kwargs, generated_prompts[:3], max_tokens, num_logprobs
+    )
 
     compare_operator(
         outputs_0_lst=vllm_outputs_no_cache[0][:3],
@@ -726,13 +737,15 @@ def test_apc_multiple_prompts_partial_cached_outputs(
         name_1="vllm_partial_cache",
     )
 
-    vllm_outputs_cache_rep, _ = _get_vLLM_output(vllm_runner,
-                                                 vllm_runner_kwargs,
-                                                 generated_prompts,
-                                                 max_tokens,
-                                                 num_logprobs,
-                                                 n_repetitions,
-                                                 vllm_model=vllm_model)
+    vllm_outputs_cache_rep, _ = _get_vLLM_output(
+        vllm_runner,
+        vllm_runner_kwargs,
+        generated_prompts,
+        max_tokens,
+        num_logprobs,
+        n_repetitions,
+        vllm_model=vllm_model,
+    )
 
     for r_idx, vllm_outputs_cache_itn in enumerate(vllm_outputs_cache_rep):
         # In the first repetition, the caches are filled
diff --git a/tests/models/language/generation/test_mistral.py b/tests/models/language/generation/test_mistral.py
index 845afbfa8a45..ece2bed4f5d7 100644
--- a/tests/models/language/generation/test_mistral.py
+++ b/tests/models/language/generation/test_mistral.py
@@ -6,7 +6,9 @@
 import pytest
 
 from vllm.entrypoints.openai.tool_parsers.mistral_tool_parser import (
-    MistralToolCall, MistralToolParser)
+    MistralToolCall,
+    MistralToolParser,
+)
 from vllm.sampling_params import SamplingParams
 from vllm.transformers_utils.tokenizer import MistralTokenizer
 
@@ -33,136 +35,114 @@
 ]
 
 # for function calling
-TOOLS = [{
-    "type": "function",
-    "function": {
-        "name": "get_current_weather",
-        "description": "Get the current weather in a given location",
-        "parameters": {
-            "type": "object",
-            "properties": {
-                "city": {
-                    "type":
-                    "string",
-                    "description":
-                    "The city to find the weather for, e.g. 'San Francisco'"
-                },
-                "state": {
-                    "type":
-                    "string",
-                    "description":
-                    "the two-letter abbreviation for the state that the city is"
-                    " in, e.g. 'CA' which would mean 'California'"
+TOOLS = [
+    {
+        "type": "function",
+        "function": {
+            "name": "get_current_weather",
+            "description": "Get the current weather in a given location",
+            "parameters": {
+                "type": "object",
+                "properties": {
+                    "city": {
+                        "type": "string",
+                        "description": "The city to find the weather for, e.g. 'San Francisco'",
+                    },
+                    "state": {
+                        "type": "string",
+                        "description": "the two-letter abbreviation for the state that the city is"
+                        " in, e.g. 'CA' which would mean 'California'",
+                    },
+                    "unit": {
+                        "type": "string",
+                        "description": "The unit to fetch the temperature in",
+                        "enum": ["celsius", "fahrenheit"],
+                    },
                 },
-                "unit": {
-                    "type": "string",
-                    "description": "The unit to fetch the temperature in",
-                    "enum": ["celsius", "fahrenheit"]
-                }
+                "required": ["city", "state", "unit"],
             },
-            "required": ["city", "state", "unit"]
-        }
+        },
     },
-}, {
-    "type": "function",
-    "function": {
-        "name": "rewrite",
-        "description": "Rewrites text",
-        "parameters": {
-            "type": "object",
-            "required": [],
-            "properties": {
-                "text": {
-                    "type": "string",
-                    "description": "The input text to rewrite."
-                }
-            }
-        }
-    }
-}]
-MSGS = [
     {
-        "role": "system",
-        "content": "You are an assistant."
+        "type": "function",
+        "function": {
+            "name": "rewrite",
+            "description": "Rewrites text",
+            "parameters": {
+                "type": "object",
+                "required": [],
+                "properties": {
+                    "text": {
+                        "type": "string",
+                        "description": "The input text to rewrite.",
+                    }
+                },
+            },
+        },
     },
+]
+MSGS = [
+    {"role": "system", "content": "You are an assistant."},
     {
-        "role":
-        "user",
-        "content":
-        "Could you please rewrite the below article? \n\n My English needs improvving, maybe I make errors."  # noqa
+        "role": "user",
+        "content": "Could you please rewrite the below article? \n\n My English needs improvving, maybe I make errors.",  # noqa
     },
     {
-        "role":
-        "assistant",
-        "content":
-        "",
-        "tool_calls": [{
-            "id": "bbc5b7ede",
-            "type": "function",
-            "function": {
-                "name":
-                "rewrite",
-                "arguments":
-                '{\"text\":\"My English needs improvving, maybe I make errors.\"}'  # noqa
+        "role": "assistant",
+        "content": "",
+        "tool_calls": [
+            {
+                "id": "bbc5b7ede",
+                "type": "function",
+                "function": {
+                    "name": "rewrite",
+                    "arguments": '{"text":"My English needs improvving, maybe I make errors."}',  # noqa
+                },
             }
-        }]
+        ],
     },
     {
         "role": "tool",
-        "content":
-        "{\"action\":\"rewrite\",\"outcome\":\"My English needs improving, maybe I make errors.\"}",  # noqa
+        "content": '{"action":"rewrite","outcome":"My English needs improving, maybe I make errors."}',  # noqa
         "tool_call_id": "bbc5b7ede",
-        "name": "rewrite"
+        "name": "rewrite",
     },
     {
         "role": "assistant",
-        "content": "---\n\nMy English needs improving, maybe I make errors"
+        "content": "---\n\nMy English needs improving, maybe I make errors",
     },
     {
-        "role":
-        "user",
-        "content": ("Can you tell me what the temperate"
-                    " will be in Dallas, in fahrenheit?")
-    }
+        "role": "user",
+        "content": (
+            "Can you tell me what the temperate will be in Dallas, in fahrenheit?"
+        ),
+    },
 ]
 
 SAMPLE_JSON_SCHEMA = {
     "type": "object",
     "properties": {
-        "name": {
-            "type": "string"
-        },
-        "age": {
-            "type": "integer"
-        },
+        "name": {"type": "string"},
+        "age": {"type": "integer"},
         "skills": {
             "type": "array",
-            "items": {
-                "type": "string",
-                "maxLength": 10
-            },
-            "minItems": 3
+            "items": {"type": "string", "maxLength": 10},
+            "minItems": 3,
         },
         "work_history": {
             "type": "array",
             "items": {
                 "type": "object",
                 "properties": {
-                    "company": {
-                        "type": "string"
-                    },
-                    "duration": {
-                        "type": "number"
-                    },
-                    "position": {
-                        "type": "string"
-                    }
+                    "company": {"type": "string"},
+                    "duration": {"type": "number"},
+                    "position": {"type": "string"},
                 },
-                "required": ["company", "position"]
-            }
-        }
+                "required": ["company", "position"],
+            },
+        },
     },
-    "required": ["name", "age", "skills", "work_history"]
+    "required": ["name", "age", "skills", "work_history"],
 }
 
 
@@ -170,17 +150,25 @@
 @pytest.mark.parametrize("dtype", ["bfloat16"])
 @pytest.mark.parametrize("max_tokens", [64])
 @pytest.mark.parametrize("num_logprobs", [5])
-def test_models(hf_runner, vllm_runner, example_prompts, model: str,
-                dtype: str, max_tokens: int, num_logprobs: int) -> None:
+def test_models(
+    hf_runner,
+    vllm_runner,
+    example_prompts,
+    model: str,
+    dtype: str,
+    max_tokens: int,
+    num_logprobs: int,
+) -> None:
     # TODO(sang): Sliding window should be tested separately.
     with hf_runner(model, dtype=dtype) as hf_model:
         hf_outputs = hf_model.generate_greedy_logprobs_limit(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
-    with vllm_runner(model, dtype=dtype,
-                     tokenizer_mode="mistral") as vllm_model:
+    with vllm_runner(model, dtype=dtype, tokenizer_mode="mistral") as vllm_model:
         vllm_outputs = vllm_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     check_logprobs_close(
         outputs_0_lst=hf_outputs,
@@ -194,27 +182,35 @@ def test_models(hf_runner, vllm_runner, example_prompts, model: str,
 @pytest.mark.parametrize("dtype", ["bfloat16"])
 @pytest.mark.parametrize("max_tokens", [64])
 @pytest.mark.parametrize("num_logprobs", [5])
-def test_mistral_format(vllm_runner, example_prompts, model: str, dtype: str,
-                        max_tokens: int, num_logprobs: int) -> None:
+def test_mistral_format(
+    vllm_runner,
+    example_prompts,
+    model: str,
+    dtype: str,
+    max_tokens: int,
+    num_logprobs: int,
+) -> None:
     with vllm_runner(
-            model,
-            dtype=dtype,
-            tokenizer_mode="mistral",
-            load_format="mistral",
-            config_format="mistral",
+        model,
+        dtype=dtype,
+        tokenizer_mode="mistral",
+        load_format="mistral",
+        config_format="mistral",
     ) as mistral_format_model:
         mistral_format_outputs = mistral_format_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     with vllm_runner(
-            model,
-            dtype=dtype,
-            tokenizer_mode="auto",
-            load_format="safetensors",
-            config_format="hf",
+        model,
+        dtype=dtype,
+        tokenizer_mode="auto",
+        load_format="safetensors",
+        config_format="hf",
     ) as hf_format_model:
         hf_format_outputs = hf_format_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     check_logprobs_close(
         outputs_0_lst=hf_format_outputs,
@@ -226,34 +222,35 @@ def test_mistral_format(vllm_runner, example_prompts, model: str, dtype: str,
 
 @pytest.mark.parametrize("model", MISTRAL_FORMAT_MODELS)
 @pytest.mark.parametrize("dtype", ["bfloat16"])
-def test_mistral_symbolic_languages(vllm_runner, model: str,
-                                    dtype: str) -> None:
-    with vllm_runner(model,
-                     dtype=dtype,
-                     max_model_len=8192,
-                     tokenizer_mode="mistral",
-                     config_format="mistral",
-                     load_format="mistral") as vllm_model:
+def test_mistral_symbolic_languages(vllm_runner, model: str, dtype: str) -> None:
+    with vllm_runner(
+        model,
+        dtype=dtype,
+        max_model_len=8192,
+        tokenizer_mode="mistral",
+        config_format="mistral",
+        load_format="mistral",
+    ) as vllm_model:
         for prompt in SYMBOLIC_LANG_PROMPTS:
             msg = {"role": "user", "content": prompt}
-            outputs = vllm_model.llm.chat([msg],
-                                          sampling_params=SAMPLING_PARAMS)
+            outputs = vllm_model.llm.chat([msg], sampling_params=SAMPLING_PARAMS)
             assert "�" not in outputs[0].outputs[0].text.strip()
 
 
 @pytest.mark.parametrize("model", MISTRAL_FORMAT_MODELS)
 @pytest.mark.parametrize("dtype", ["bfloat16"])
 def test_mistral_function_calling(vllm_runner, model: str, dtype: str) -> None:
-    with vllm_runner(model,
-                     dtype=dtype,
-                     tokenizer_mode="mistral",
-                     config_format="mistral",
-                     load_format="mistral") as vllm_model:
-
+    with vllm_runner(
+        model,
+        dtype=dtype,
+        tokenizer_mode="mistral",
+        config_format="mistral",
+        load_format="mistral",
+    ) as vllm_model:
         msgs = copy.deepcopy(MSGS)
-        outputs = vllm_model.llm.chat(msgs,
-                                      tools=TOOLS,
-                                      sampling_params=SAMPLING_PARAMS)
+        outputs = vllm_model.llm.chat(
+            msgs, tools=TOOLS, sampling_params=SAMPLING_PARAMS
+        )
 
         tokenizer = vllm_model.llm.get_tokenizer()
         tool_parser = MistralToolParser(tokenizer)
@@ -265,10 +262,11 @@ def test_mistral_function_calling(vllm_runner, model: str, dtype: str) -> None:
         assert parsed_message.tools_called
 
         assert MistralToolCall.is_valid_id(parsed_message.tool_calls[0].id)
-        assert parsed_message.tool_calls[
-            0].function.name == "get_current_weather"
-        assert parsed_message.tool_calls[
-            0].function.arguments == '{"city": "Dallas", "state": "TX", "unit": "fahrenheit"}'  # noqa
+        assert parsed_message.tool_calls[0].function.name == "get_current_weather"
+        assert (
+            parsed_message.tool_calls[0].function.arguments
+            == '{"city": "Dallas", "state": "TX", "unit": "fahrenheit"}'
+        )  # noqa
         assert parsed_message.content is None
 
 
@@ -297,17 +295,10 @@ def get_vocab():
         "city": "Dallas",
         "state": "TX",
         "unit": "fahrenheit",
-        "sub_dict": {
-            "foo": "bar",
-            "inner": {
-                "x": 1,
-                "y": 2
-            }
-        },
+        "sub_dict": {"foo": "bar", "inner": {"x": 1, "y": 2}},
     }
 
-    model_output = (
-        f"{parser.bot_token}get_current_weather{json.dumps(args_dict)}")
+    model_output = f"{parser.bot_token}get_current_weather{json.dumps(args_dict)}"
 
     parsed = parser.extract_tool_calls(model_output, None)
 
diff --git a/tests/models/language/generation/test_phimoe.py b/tests/models/language/generation/test_phimoe.py
index 6c9cc2821c30..e640655784cc 100644
--- a/tests/models/language/generation/test_phimoe.py
+++ b/tests/models/language/generation/test_phimoe.py
@@ -15,62 +15,56 @@
 
 def test_phimoe_routing_function():
     from vllm.model_executor.models.phimoe import phimoe_routing_function
+
     test_case = {
         0: {
-            "hidden_states":
-            torch.tensor([1, 2, 3, 4, 5, 6, 7, 8],
-                         dtype=torch.float32,
-                         requires_grad=False).view(4, 2),
-            "gating_output":
-            torch.tensor([0.1, 0.2, 0.3, 0.4],
-                         dtype=torch.float32,
-                         requires_grad=False),
-            "topk":
-            2,
-            "renormalize":
-            False,
+            "hidden_states": torch.tensor(
+                [1, 2, 3, 4, 5, 6, 7, 8], dtype=torch.float32, requires_grad=False
+            ).view(4, 2),
+            "gating_output": torch.tensor(
+                [0.1, 0.2, 0.3, 0.4], dtype=torch.float32, requires_grad=False
+            ),
+            "topk": 2,
+            "renormalize": False,
         },
         1: {
-            "hidden_states":
-            torch.tensor([1, 2, 3, 4, 5, 6, 7, 8],
-                         dtype=torch.float32,
-                         requires_grad=False).view(4, 2),
-            "gating_output":
-            torch.tensor([0.4, 0.2, 0.3, 0.4],
-                         dtype=torch.float32,
-                         requires_grad=False),
-            "topk":
-            2,
-            "renormalize":
-            False,
-        }
+            "hidden_states": torch.tensor(
+                [1, 2, 3, 4, 5, 6, 7, 8], dtype=torch.float32, requires_grad=False
+            ).view(4, 2),
+            "gating_output": torch.tensor(
+                [0.4, 0.2, 0.3, 0.4], dtype=torch.float32, requires_grad=False
+            ),
+            "topk": 2,
+            "renormalize": False,
+        },
     }
 
     ground_truth = {
         0: {
-            "topk_weights":
-            torch.tensor([1., 1.], dtype=torch.float32, requires_grad=False),
-            "topk_ids":
-            torch.tensor([3, 2], dtype=torch.long, requires_grad=False),
+            "topk_weights": torch.tensor(
+                [1.0, 1.0], dtype=torch.float32, requires_grad=False
+            ),
+            "topk_ids": torch.tensor([3, 2], dtype=torch.long, requires_grad=False),
         },
         1: {
-            "topk_weights":
-            torch.tensor([0.5, 1.], dtype=torch.float32, requires_grad=False),
-            "topk_ids":
-            torch.tensor([0, 3], dtype=torch.long, requires_grad=False),
-        }
+            "topk_weights": torch.tensor(
+                [0.5, 1.0], dtype=torch.float32, requires_grad=False
+            ),
+            "topk_ids": torch.tensor([0, 3], dtype=torch.long, requires_grad=False),
+        },
     }
 
     for test_id in test_case:
         topk_weights, topk_ids = phimoe_routing_function(**test_case[test_id])
-        assert torch.allclose(topk_weights,
-                              ground_truth[test_id]["topk_weights"])
+        assert torch.allclose(topk_weights, ground_truth[test_id]["topk_weights"])
         assert torch.equal(topk_ids, ground_truth[test_id]["topk_ids"])
 
 
-@pytest.mark.skipif(condition=current_platform.is_cpu(),
-                    reason="This test takes a lot time to run on CPU, "
-                    "and vllm CI's disk space is not enough for this model.")
+@pytest.mark.skipif(
+    condition=current_platform.is_cpu(),
+    reason="This test takes a lot time to run on CPU, "
+    "and vllm CI's disk space is not enough for this model.",
+)
 @large_gpu_test(min_gb=80)
 @pytest.mark.parametrize("model", MODELS)
 @pytest.mark.parametrize("dtype", ["bfloat16"])
@@ -87,11 +81,13 @@ def test_models(
 ) -> None:
     with hf_runner(model, dtype=dtype) as hf_model:
         hf_outputs = hf_model.generate_greedy_logprobs_limit(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     with vllm_runner(model, dtype=dtype) as vllm_model:
         vllm_outputs = vllm_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
     check_logprobs_close(
         outputs_0_lst=hf_outputs,
         outputs_1_lst=vllm_outputs,
diff --git a/tests/models/language/generation_ppl_test/ppl_utils.py b/tests/models/language/generation_ppl_test/ppl_utils.py
index 6225bbe3377b..dcef365e99e7 100644
--- a/tests/models/language/generation_ppl_test/ppl_utils.py
+++ b/tests/models/language/generation_ppl_test/ppl_utils.py
@@ -8,8 +8,7 @@
 from datasets import load_dataset
 
 import tests.ci_envs as ci_envs
-from tests.models.utils import (GenerateModelInfo,
-                                TokensTextLogprobsPromptLogprobs)
+from tests.models.utils import GenerateModelInfo, TokensTextLogprobsPromptLogprobs
 from vllm.logprobs import Logprob
 
 # See #24485
@@ -18,13 +17,14 @@
 
 
 @torch.inference_mode
-def wikitext_ppl_test(hf_runner,
-                      vllm_runner,
-                      model_info: GenerateModelInfo,
-                      max_length=MAX_LENGTH,
-                      vllm_extra_kwargs=None,
-                      atol=PPL_TOL):
-
+def wikitext_ppl_test(
+    hf_runner,
+    vllm_runner,
+    model_info: GenerateModelInfo,
+    max_length=MAX_LENGTH,
+    vllm_extra_kwargs=None,
+    atol=PPL_TOL,
+):
     # A model family has many models with the same architecture,
     # and we don't need to test each one.
     if not ci_envs.VLLM_CI_NO_SKIP and not model_info.enable_test:
@@ -44,15 +44,16 @@ def wikitext_ppl_test(hf_runner,
     if ci_envs.VLLM_CI_HEAD_DTYPE is not None:
         if "hf_overrides" not in vllm_extra_kwargs:
             vllm_extra_kwargs["hf_overrides"] = {}
-        vllm_extra_kwargs["hf_overrides"][
-            "head_dtype"] = ci_envs.VLLM_CI_HEAD_DTYPE
-
-    with vllm_runner(model_info.name,
-                     gpu_memory_utilization=0.7,
-                     max_model_len=max_length,
-                     max_num_seqs=1,
-                     enforce_eager=True,
-                     **vllm_extra_kwargs) as vllm_model:
+        vllm_extra_kwargs["hf_overrides"]["head_dtype"] = ci_envs.VLLM_CI_HEAD_DTYPE
+
+    with vllm_runner(
+        model_info.name,
+        gpu_memory_utilization=0.7,
+        max_model_len=max_length,
+        max_num_seqs=1,
+        enforce_eager=True,
+        **vllm_extra_kwargs,
+    ) as vllm_model:
         # Use max_num_seqs=1 to avoid OOM,
         # and avoid batch different requests together.
 
@@ -60,7 +61,7 @@ def wikitext_ppl_test(hf_runner,
 
         # Confirm whether vllm is using the correct architecture
         if model_info.architecture:
-            assert (model_info.architecture in model_config.architectures)
+            assert model_info.architecture in model_config.architectures
 
         max_length = min(model_config.max_model_len - 1, max_length)
         stride = max_length
@@ -74,12 +75,14 @@ def wikitext_ppl_test(hf_runner,
             end_loc = min(begin_loc + max_length, n_tokens)
             chunks.append(tokens[begin_loc:end_loc])
 
-        outputs = vllm_model.generate_greedy_logprobs(prompts=chunks,
-                                                      max_tokens=1,
-                                                      num_logprobs=None,
-                                                      num_prompt_logprobs=0,
-                                                      use_tqdm=False)
-        nll_sum = torch.tensor(0., dtype=torch.float32, device="cpu")
+        outputs = vllm_model.generate_greedy_logprobs(
+            prompts=chunks,
+            max_tokens=1,
+            num_logprobs=None,
+            num_prompt_logprobs=0,
+            use_tqdm=False,
+        )
+        nll_sum = torch.tensor(0.0, dtype=torch.float32, device="cpu")
         n_tokens = 0
         for output in outputs:
             output = cast(TokensTextLogprobsPromptLogprobs, output)
@@ -94,7 +97,8 @@ def wikitext_ppl_test(hf_runner,
                 token_log_probs.append(token_log_prob)
 
             neg_log_likelihood = -torch.tensor(
-                token_log_probs, dtype=torch.float32, device="cpu").sum()
+                token_log_probs, dtype=torch.float32, device="cpu"
+            ).sum()
             nll_sum += neg_log_likelihood
             n_tokens += len(token_log_probs)
         vllm_ppl = float(torch.exp(nll_sum / n_tokens))
@@ -104,14 +108,13 @@ def wikitext_ppl_test(hf_runner,
     # Accelerate ppl test by setting Transformers ppl score to a constant
     if model_info.hf_ppl is None:
         with hf_runner(
-                model_info.name,
-                dtype=ci_envs.VLLM_CI_HF_DTYPE or model_info.hf_dtype,
+            model_info.name,
+            dtype=ci_envs.VLLM_CI_HF_DTYPE or model_info.hf_dtype,
         ) as hf_model:
-            nll_sum = torch.tensor(0., dtype=torch.float32, device="cpu")
+            nll_sum = torch.tensor(0.0, dtype=torch.float32, device="cpu")
             n_tokens = 0
             for chunk in chunks:
-                inputs = hf_model.wrap_device(
-                    {"input_ids": torch.tensor([chunk])})
+                inputs = hf_model.wrap_device({"input_ids": torch.tensor([chunk])})
                 input_ids = inputs["input_ids"]
                 outputs = hf_model.model(input_ids, labels=input_ids)
                 neg_log_likelihood = outputs.loss
diff --git a/tests/models/language/pooling/embed_utils.py b/tests/models/language/pooling/embed_utils.py
index 86751e0a4d5f..261ab80ae86b 100644
--- a/tests/models/language/pooling/embed_utils.py
+++ b/tests/models/language/pooling/embed_utils.py
@@ -6,8 +6,7 @@
 import pytest
 
 from tests.conftest import HfRunner
-from tests.models.utils import (EmbedModelInfo, check_embeddings_close,
-                                matryoshka_fy)
+from tests.models.utils import EmbedModelInfo, check_embeddings_close, matryoshka_fy
 
 
 def run_embedding_correctness_test(
@@ -29,12 +28,14 @@ def run_embedding_correctness_test(
     )
 
 
-def correctness_test_embed_models(hf_runner,
-                                  vllm_runner,
-                                  model_info: EmbedModelInfo,
-                                  example_prompts,
-                                  vllm_extra_kwargs=None,
-                                  hf_model_callback=None):
+def correctness_test_embed_models(
+    hf_runner,
+    vllm_runner,
+    model_info: EmbedModelInfo,
+    example_prompts,
+    vllm_extra_kwargs=None,
+    hf_model_callback=None,
+):
     pytest.skip("Debug only, ci prefers to use mteb test.")
 
     # The example_prompts has ending "\n", for example:
@@ -51,18 +52,16 @@ def correctness_test_embed_models(hf_runner,
     if model_info.hf_overrides is not None:
         vllm_extra_kwargs["hf_overrides"] = model_info.hf_overrides
 
-    with vllm_runner(model_info.name,
-                     runner="pooling",
-                     max_model_len=None,
-                     **vllm_extra_kwargs) as vllm_model:
+    with vllm_runner(
+        model_info.name, runner="pooling", max_model_len=None, **vllm_extra_kwargs
+    ) as vllm_model:
         vllm_outputs = vllm_model.embed(example_prompts)
 
     with hf_runner(
-            model_info.name,
-            dtype=model_info.hf_dtype,
-            is_sentence_transformer=True,
+        model_info.name,
+        dtype=model_info.hf_dtype,
+        is_sentence_transformer=True,
     ) as hf_model:
-
         if hf_model_callback is not None:
             hf_model_callback(hf_model)
 
diff --git a/tests/models/language/pooling/test_auto_prefix_cache_support.py b/tests/models/language/pooling/test_auto_prefix_cache_support.py
index 15e24c59d1dd..e95119df95c7 100644
--- a/tests/models/language/pooling/test_auto_prefix_cache_support.py
+++ b/tests/models/language/pooling/test_auto_prefix_cache_support.py
@@ -4,8 +4,7 @@
 import torch
 from transformers import AutoModelForSequenceClassification
 
-from tests.models.language.pooling.embed_utils import (
-    run_embedding_correctness_test)
+from tests.models.language.pooling.embed_utils import run_embedding_correctness_test
 
 
 @pytest.mark.parametrize(
@@ -20,28 +19,27 @@ def test_classify_models(
     model: str,
     dtype: str,
 ) -> None:
-
     example_prompts = example_prompts * 2
 
-    with vllm_runner(model,
-                     max_model_len=512,
-                     dtype=dtype,
-                     enable_prefix_caching=True) as vllm_model:
+    with vllm_runner(
+        model, max_model_len=512, dtype=dtype, enable_prefix_caching=True
+    ) as vllm_model:
         cache_config = vllm_model.llm.llm_engine.cache_config
         assert cache_config.enable_prefix_caching
         vllm_outputs = vllm_model.classify(example_prompts)
 
-    with hf_runner(model,
-                   dtype=dtype,
-                   auto_cls=AutoModelForSequenceClassification) as hf_model:
+    with hf_runner(
+        model, dtype=dtype, auto_cls=AutoModelForSequenceClassification
+    ) as hf_model:
         hf_outputs = hf_model.classify(example_prompts)
 
     for hf_output, vllm_output in zip(hf_outputs, vllm_outputs):
         hf_output = torch.tensor(hf_output)
         vllm_output = torch.tensor(vllm_output)
 
-        assert torch.allclose(hf_output, vllm_output,
-                              1e-3 if dtype == "float" else 1e-2)
+        assert torch.allclose(
+            hf_output, vllm_output, 1e-3 if dtype == "float" else 1e-2
+        )
 
 
 @pytest.mark.parametrize(
@@ -59,18 +57,18 @@ def test_embed_models(
     example_prompts = [str(s).strip() for s in example_prompts] * 2
 
     with vllm_runner(
-            model,
-            runner="pooling",
-            max_model_len=None,
-            enable_prefix_caching=True,
+        model,
+        runner="pooling",
+        max_model_len=None,
+        enable_prefix_caching=True,
     ) as vllm_model:
         cache_config = vllm_model.llm.llm_engine.cache_config
         assert cache_config.enable_prefix_caching
         vllm_outputs = vllm_model.embed(example_prompts)
 
     with hf_runner(
-            model,
-            is_sentence_transformer=True,
+        model,
+        is_sentence_transformer=True,
     ) as hf_model:
         run_embedding_correctness_test(hf_model, example_prompts, vllm_outputs)
 
@@ -81,13 +79,14 @@ def test_embed_models(
         "intfloat/e5-small",
         "Alibaba-NLP/gte-Qwen2-1.5B-instruct",  # is_causal == False
         "papluca/xlm-roberta-base-language-detection",
-    ])
+    ],
+)
 @pytest.mark.parametrize("dtype", ["half"])
-def test_non_causal_models(hf_runner, vllm_runner, example_prompts, model: str,
-                           dtype: str) -> None:
-    with vllm_runner(model,
-                     max_model_len=512,
-                     dtype=dtype,
-                     enable_prefix_caching=True) as vllm_model:
+def test_non_causal_models(
+    hf_runner, vllm_runner, example_prompts, model: str, dtype: str
+) -> None:
+    with vllm_runner(
+        model, max_model_len=512, dtype=dtype, enable_prefix_caching=True
+    ) as vllm_model:
         cache_config = vllm_model.llm.llm_engine.cache_config
         assert not cache_config.enable_prefix_caching
diff --git a/tests/models/language/pooling/test_classification.py b/tests/models/language/pooling/test_classification.py
index 8e398830d39d..471826f214d0 100644
--- a/tests/models/language/pooling/test_classification.py
+++ b/tests/models/language/pooling/test_classification.py
@@ -10,15 +10,17 @@
 @pytest.mark.parametrize(
     "model",
     [
-        pytest.param("jason9693/Qwen2.5-1.5B-apeach",
-                     marks=[
-                         pytest.mark.core_model, pytest.mark.cpu_model,
-                         pytest.mark.slow_test
-                     ]),
+        pytest.param(
+            "jason9693/Qwen2.5-1.5B-apeach",
+            marks=[
+                pytest.mark.core_model,
+                pytest.mark.cpu_model,
+                pytest.mark.slow_test,
+            ],
+        ),
     ],
 )
-@pytest.mark.parametrize("dtype",
-                         ["half"] if current_platform.is_rocm() else ["float"])
+@pytest.mark.parametrize("dtype", ["half"] if current_platform.is_rocm() else ["float"])
 def test_models(
     hf_runner,
     vllm_runner,
@@ -35,9 +37,9 @@ def test_models(
     with vllm_runner(model, max_model_len=512, dtype=dtype) as vllm_model:
         vllm_outputs = vllm_model.classify(example_prompts)
 
-    with hf_runner(model,
-                   dtype=dtype,
-                   auto_cls=AutoModelForSequenceClassification) as hf_model:
+    with hf_runner(
+        model, dtype=dtype, auto_cls=AutoModelForSequenceClassification
+    ) as hf_model:
         hf_outputs = hf_model.classify(example_prompts)
 
     # check logits difference
@@ -48,5 +50,6 @@ def test_models(
         # the tolerance value of 1e-2 is selected based on the
         # half datatype tests in
         # tests/models/language/pooling/test_embedding.py
-        assert torch.allclose(hf_output, vllm_output,
-                              1e-3 if dtype == "float" else 1e-2)
+        assert torch.allclose(
+            hf_output, vllm_output, 1e-3 if dtype == "float" else 1e-2
+        )
diff --git a/tests/models/language/pooling/test_embedding.py b/tests/models/language/pooling/test_embedding.py
index 17513d1bb20d..c9574dca498e 100644
--- a/tests/models/language/pooling/test_embedding.py
+++ b/tests/models/language/pooling/test_embedding.py
@@ -18,20 +18,25 @@
         # case won't pass because gte-Qwen2-1.5B-instruct will cache custom
         # model code with bidirectional attention.
         # [Decoder-only]
-        pytest.param("BAAI/bge-multilingual-gemma2",
-                     marks=[pytest.mark.core_model, pytest.mark.slow_test]),
+        pytest.param(
+            "BAAI/bge-multilingual-gemma2",
+            marks=[pytest.mark.core_model, pytest.mark.slow_test],
+        ),
         pytest.param(
             "intfloat/e5-mistral-7b-instruct",
             # CPU v1 doesn't support sliding window
-            marks=[pytest.mark.core_model]),
-        pytest.param("ssmits/Qwen2-7B-Instruct-embed-base",
-                     marks=[pytest.mark.cpu_model]),
+            marks=[pytest.mark.core_model],
+        ),
+        pytest.param(
+            "ssmits/Qwen2-7B-Instruct-embed-base", marks=[pytest.mark.cpu_model]
+        ),
         # [Encoder-only]
         pytest.param(
             "BAAI/bge-base-en-v1.5",
             marks=[
-                pytest.mark.core_model, pytest.mark.cpu_model,
-                pytest.mark.slow_test
+                pytest.mark.core_model,
+                pytest.mark.cpu_model,
+                pytest.mark.slow_test,
             ],
         ),
         pytest.param("sentence-transformers/all-MiniLM-L12-v2"),
@@ -50,7 +55,6 @@ def test_models(
     model,
     monkeypatch,
 ) -> None:
-
     if model == "BAAI/bge-multilingual-gemma2" and current_platform.is_rocm():
         # ROCm Triton FA does not currently support sliding window attention
         # switch to use ROCm CK FA backend
@@ -58,13 +62,14 @@ def test_models(
 
     vllm_extra_kwargs = {}
     if model == "ssmits/Qwen2-7B-Instruct-embed-base":
-        vllm_extra_kwargs["pooler_config"] = \
-            PoolerConfig(pooling_type="MEAN", normalize=False)
+        vllm_extra_kwargs["pooler_config"] = PoolerConfig(
+            pooling_type="MEAN", normalize=False
+        )
 
     max_model_len: Optional[int] = 512
     if model in [
-            "sentence-transformers/all-MiniLM-L12-v2",
-            "sentence-transformers/stsb-roberta-base-v2"
+        "sentence-transformers/all-MiniLM-L12-v2",
+        "sentence-transformers/stsb-roberta-base-v2",
     ]:
         max_model_len = None
 
@@ -79,10 +84,9 @@ def test_models(
     with hf_runner(model, is_sentence_transformer=True) as hf_model:
         hf_outputs = hf_model.encode(example_prompts)
 
-    with vllm_runner(model,
-                     runner="pooling",
-                     max_model_len=max_model_len,
-                     **vllm_extra_kwargs) as vllm_model:
+    with vllm_runner(
+        model, runner="pooling", max_model_len=max_model_len, **vllm_extra_kwargs
+    ) as vllm_model:
         vllm_outputs = vllm_model.embed(example_prompts)
 
     check_embeddings_close(
diff --git a/tests/models/language/pooling/test_gritlm.py b/tests/models/language/pooling/test_gritlm.py
index 17a55d916b1f..14308ac06c03 100644
--- a/tests/models/language/pooling/test_gritlm.py
+++ b/tests/models/language/pooling/test_gritlm.py
@@ -70,8 +70,9 @@ async def run_client_embeddings(
 
 
 def gritlm_instruction(instruction):
-    return ("<|user|>\n" + instruction +
-            "\n<|embed|>\n" if instruction else "<|embed|>\n")
+    return (
+        "<|user|>\n" + instruction + "\n<|embed|>\n" if instruction else "<|embed|>\n"
+    )
 
 
 def get_test_data():
@@ -80,7 +81,8 @@ def get_test_data():
     README.md in https://github.com/ContextualAI/gritlm
     """
     q_instruction = gritlm_instruction(
-        "Given a scientific paper title, retrieve the paper's abstract", )
+        "Given a scientific paper title, retrieve the paper's abstract",
+    )
     queries = [
         "Bitcoin: A Peer-to-Peer Electronic Cash System",
         "Generative Representational Instruction Tuning",
@@ -114,9 +116,9 @@ def test_gritlm_offline_embedding(vllm_runner):
     queries, q_instruction, documents, d_instruction = get_test_data()
 
     with vllm_runner(
-            MODEL_NAME,
-            runner="pooling",
-            max_model_len=MAX_MODEL_LEN,
+        MODEL_NAME,
+        runner="pooling",
+        max_model_len=MAX_MODEL_LEN,
     ) as vllm_model:
         llm = vllm_model.llm
 
@@ -161,9 +163,9 @@ def test_gritlm_offline_generate(monkeypatch: pytest.MonkeyPatch, vllm_runner):
     input = "<|user|>\nWhat is the capital of France?\n<|assistant|>\n"
 
     with vllm_runner(
-            MODEL_NAME,
-            runner="generate",
-            max_model_len=MAX_MODEL_LEN,
+        MODEL_NAME,
+        runner="generate",
+        max_model_len=MAX_MODEL_LEN,
     ) as vllm_model:
         llm = vllm_model.llm
 
diff --git a/tests/models/language/pooling/test_mm_classifier_conversion.py b/tests/models/language/pooling/test_mm_classifier_conversion.py
index 9814cad48a80..91be6cd09d33 100644
--- a/tests/models/language/pooling/test_mm_classifier_conversion.py
+++ b/tests/models/language/pooling/test_mm_classifier_conversion.py
@@ -21,16 +21,18 @@ def test_idefics_multimodal(
         "The future of AI is",
     ]
 
-    with vllm_runner(model_name="HuggingFaceM4/Idefics3-8B-Llama3",
-                     runner="pooling",
-                     task="classify",
-                     convert="classify",
-                     load_format="dummy",
-                     max_model_len=512,
-                     enforce_eager=True,
-                     tensor_parallel_size=1,
-                     disable_log_stats=True,
-                     dtype="bfloat16") as vllm_model:
+    with vllm_runner(
+        model_name="HuggingFaceM4/Idefics3-8B-Llama3",
+        runner="pooling",
+        task="classify",
+        convert="classify",
+        load_format="dummy",
+        max_model_len=512,
+        enforce_eager=True,
+        tensor_parallel_size=1,
+        disable_log_stats=True,
+        dtype="bfloat16",
+    ) as vllm_model:
         llm = vllm_model.get_llm()
         outputs = llm.classify(prompts)
         for output in outputs:
@@ -38,19 +40,20 @@ def test_idefics_multimodal(
 
 
 def update_config(config):
-    config.text_config.update({
-        "architectures": ["Gemma3ForSequenceClassification"],
-        "classifier_from_token": ["A", "B", "C", "D", "E"],
-        "method":
-        "no_post_processing",
-        "id2label": {
-            "A": "Chair",
-            "B": "Couch",
-            "C": "Table",
-            "D": "Bed",
-            "E": "Cupboard"
-        },
-    })
+    config.text_config.update(
+        {
+            "architectures": ["Gemma3ForSequenceClassification"],
+            "classifier_from_token": ["A", "B", "C", "D", "E"],
+            "method": "no_post_processing",
+            "id2label": {
+                "A": "Chair",
+                "B": "Couch",
+                "C": "Table",
+                "D": "Bed",
+                "E": "Cupboard",
+            },
+        }
+    )
     return config
 
 
@@ -63,11 +66,10 @@ def test_gemma_multimodal(
         # switch to use ROCm CK FA backend
         monkeypatch.setenv("VLLM_USE_TRITON_FLASH_ATTN", "False")
 
-    messages = [{
-        "role":
-        "system",
-        "content":
-        """
+    messages = [
+        {
+            "role": "system",
+            "content": """
     You are a helpful assistant. You will be given a product description
     which may also include an image. Classify the following product into
     one of the categories:
@@ -78,38 +80,39 @@ def test_gemma_multimodal(
     D = bed
     E = cupboard
 
-    You'll answer with exactly one letter (A, B, C, D, or E)."""
-    }, {
-        "role":
-        "user",
-        "content": [{
-            "type": "image_url",
-            "image_url": {
-                "url":
-                "https://upload.wikimedia.org/wikipedia/commons/c/c6/Set_of_fourteen_side_chairs_MET_DP110780.jpg"
-            }
-        }, {
-            "type": "text",
-            "text": "A fine 19th century piece of furniture."
-        }]
-    }]
-
-    with vllm_runner(model_name="google/gemma-3-4b-it",
-                     runner="pooling",
-                     task="classify",
-                     convert="classify",
-                     load_format="auto",
-                     hf_overrides=update_config,
-                     pooler_config=PoolerConfig(pooling_type="LAST"),
-                     max_model_len=512,
-                     enforce_eager=True,
-                     tensor_parallel_size=1,
-                     disable_log_stats=True,
-                     dtype="bfloat16") as vllm_model:
+    You'll answer with exactly one letter (A, B, C, D, or E).""",
+        },
+        {
+            "role": "user",
+            "content": [
+                {
+                    "type": "image_url",
+                    "image_url": {
+                        "url": "https://upload.wikimedia.org/wikipedia/commons/c/c6/Set_of_fourteen_side_chairs_MET_DP110780.jpg"
+                    },
+                },
+                {"type": "text", "text": "A fine 19th century piece of furniture."},
+            ],
+        },
+    ]
 
+    with vllm_runner(
+        model_name="google/gemma-3-4b-it",
+        runner="pooling",
+        task="classify",
+        convert="classify",
+        load_format="auto",
+        hf_overrides=update_config,
+        pooler_config=PoolerConfig(pooling_type="LAST"),
+        max_model_len=512,
+        enforce_eager=True,
+        tensor_parallel_size=1,
+        disable_log_stats=True,
+        dtype="bfloat16",
+    ) as vllm_model:
         llm = vllm_model.get_llm()
         prompts = llm.preprocess_chat(messages)
 
         result = llm.classify(prompts)
         assert result[0].outputs.probs[0] > 0.95
-        assert all(c < 0.05 for c in result[0].outputs.probs[1:])
\ No newline at end of file
+        assert all(c < 0.05 for c in result[0].outputs.probs[1:])
diff --git a/tests/models/language/pooling/test_multilabel_classification_support.py b/tests/models/language/pooling/test_multilabel_classification_support.py
index 45366f209414..472fee71711a 100644
--- a/tests/models/language/pooling/test_multilabel_classification_support.py
+++ b/tests/models/language/pooling/test_multilabel_classification_support.py
@@ -20,14 +20,15 @@ def test_classify_models(
     with vllm_runner(model, max_model_len=512, dtype=dtype) as vllm_model:
         vllm_outputs = vllm_model.classify(example_prompts)
 
-    with hf_runner(model,
-                   dtype=dtype,
-                   auto_cls=AutoModelForSequenceClassification) as hf_model:
+    with hf_runner(
+        model, dtype=dtype, auto_cls=AutoModelForSequenceClassification
+    ) as hf_model:
         hf_outputs = hf_model.classify(example_prompts)
 
     for hf_output, vllm_output in zip(hf_outputs, vllm_outputs):
         hf_output = torch.tensor(hf_output)
         vllm_output = torch.tensor(vllm_output)
 
-        assert torch.allclose(hf_output, vllm_output,
-                              1e-3 if dtype == "float" else 1e-2)
+        assert torch.allclose(
+            hf_output, vllm_output, 1e-3 if dtype == "float" else 1e-2
+        )
diff --git a/tests/models/language/pooling/test_nomic_max_model_len.py b/tests/models/language/pooling/test_nomic_max_model_len.py
index c34c36fd9815..88f088c60327 100644
--- a/tests/models/language/pooling/test_nomic_max_model_len.py
+++ b/tests/models/language/pooling/test_nomic_max_model_len.py
@@ -7,10 +7,10 @@
 
 MODELS = [
     EmbedModelInfo("nomic-ai/nomic-embed-text-v1"),
-    #EmbedModelInfo("nomic-ai/nomic-embed-text-v1.5"),
-    #EmbedModelInfo("nomic-ai/CodeRankEmbed"),
+    # EmbedModelInfo("nomic-ai/nomic-embed-text-v1.5"),
+    # EmbedModelInfo("nomic-ai/CodeRankEmbed"),
     EmbedModelInfo("nomic-ai/nomic-embed-text-v2-moe"),
-    #EmbedModelInfo("Snowflake/snowflake-arctic-embed-m-long"),
+    # EmbedModelInfo("Snowflake/snowflake-arctic-embed-m-long"),
 ]
 
 rope_theta = 1000
@@ -21,23 +21,24 @@
 
 @pytest.mark.parametrize("model_info", MODELS)
 def test_default(model_info, vllm_runner):
-    with vllm_runner(model_info.name, runner="pooling",
-                     max_model_len=None) as vllm_model:
+    with vllm_runner(
+        model_info.name, runner="pooling", max_model_len=None
+    ) as vllm_model:
         model_config = vllm_model.llm.llm_engine.model_config
         if model_info.name == "nomic-ai/nomic-embed-text-v2-moe":
             # For nomic-embed-text-v2-moe the length is set to 512
             # by sentence_bert_config.json.
             assert model_config.max_model_len == 512
         else:
-            assert (
-                model_config.max_model_len == original_max_position_embeddings)
+            assert model_config.max_model_len == original_max_position_embeddings
 
 
 @pytest.mark.parametrize("model_info", MODELS)
 def test_set_max_model_len_legal(model_info, vllm_runner):
     # set max_model_len <= 512
-    with vllm_runner(model_info.name, runner="pooling",
-                     max_model_len=256) as vllm_model:
+    with vllm_runner(
+        model_info.name, runner="pooling", max_model_len=256
+    ) as vllm_model:
         model_config = vllm_model.llm.llm_engine.model_config
         assert model_config.max_model_len == 256
 
@@ -46,13 +47,12 @@ def test_set_max_model_len_legal(model_info, vllm_runner):
         # For nomic-embed-text-v2-moe the length is set to 512
         # by sentence_bert_config.json.
         with pytest.raises(ValueError):
-            with vllm_runner(model_info.name,
-                             runner="pooling",
-                             max_model_len=1024):
+            with vllm_runner(model_info.name, runner="pooling", max_model_len=1024):
                 pass
     else:
-        with vllm_runner(model_info.name, runner="pooling",
-                         max_model_len=1024) as vllm_model:
+        with vllm_runner(
+            model_info.name, runner="pooling", max_model_len=1024
+        ) as vllm_model:
             model_config = vllm_model.llm.llm_engine.model_config
             assert model_config.max_model_len == 1024
 
@@ -61,17 +61,18 @@ def test_set_max_model_len_legal(model_info, vllm_runner):
 def test_set_max_model_len_illegal(model_info, vllm_runner):
     # set max_model_len > 2048
     with pytest.raises(ValueError):
-        with vllm_runner(model_info.name, runner="pooling",
-                         max_model_len=4096):
+        with vllm_runner(model_info.name, runner="pooling", max_model_len=4096):
             pass
 
     # set max_model_len > 2048 by hf_overrides
     hf_overrides = {"max_model_len": 4096}
     with pytest.raises(ValueError):
-        with vllm_runner(model_info.name,
-                         runner="pooling",
-                         max_model_len=None,
-                         hf_overrides=hf_overrides):
+        with vllm_runner(
+            model_info.name,
+            runner="pooling",
+            max_model_len=None,
+            hf_overrides=hf_overrides,
+        ):
             pass
 
 
@@ -82,16 +83,14 @@ def test_use_rope_scaling_legal(model_info, vllm_runner):
         "rope_scaling": {
             "rope_type": "yarn",
             "factor": factor,
-            "original_max_position_embeddings":
-            original_max_position_embeddings
+            "original_max_position_embeddings": original_max_position_embeddings,
         },
-        "max_model_len": max_model_len
+        "max_model_len": max_model_len,
     }
 
-    with vllm_runner(model_info.name,
-                     runner="pooling",
-                     max_model_len=None,
-                     hf_overrides=hf_overrides):
+    with vllm_runner(
+        model_info.name, runner="pooling", max_model_len=None, hf_overrides=hf_overrides
+    ):
         pass
 
 
@@ -102,16 +101,17 @@ def test_use_rope_scaling_illegal(model_info, vllm_runner):
         "rope_scaling": {
             "rope_type": "yarn",
             "factor": factor,
-            "original_max_position_embeddings":
-            original_max_position_embeddings
-        }
+            "original_max_position_embeddings": original_max_position_embeddings,
+        },
     }
     # illegal max_model_len
     with pytest.raises(ValueError):
-        with vllm_runner(model_info.name,
-                         runner="pooling",
-                         max_model_len=max_model_len + 1,
-                         hf_overrides=hf_overrides):
+        with vllm_runner(
+            model_info.name,
+            runner="pooling",
+            max_model_len=max_model_len + 1,
+            hf_overrides=hf_overrides,
+        ):
             pass
 
     hf_overrides = {
@@ -119,15 +119,16 @@ def test_use_rope_scaling_illegal(model_info, vllm_runner):
         "rope_scaling": {
             "rope_type": "yarn",
             "factor": factor,
-            "original_max_position_embeddings":
-            original_max_position_embeddings
+            "original_max_position_embeddings": original_max_position_embeddings,
         },
-        "max_model_len": max_model_len + 1
+        "max_model_len": max_model_len + 1,
     }
     # illegal max_model_len by hf_overrides
     with pytest.raises(ValueError):
-        with vllm_runner(model_info.name,
-                         runner="pooling",
-                         max_model_len=None,
-                         hf_overrides=hf_overrides):
+        with vllm_runner(
+            model_info.name,
+            runner="pooling",
+            max_model_len=None,
+            hf_overrides=hf_overrides,
+        ):
             pass
diff --git a/tests/models/language/pooling/test_pooler_config_init_behaviour.py b/tests/models/language/pooling/test_pooler_config_init_behaviour.py
index 9b3fbd6a6cd0..674bf02b7b98 100644
--- a/tests/models/language/pooling/test_pooler_config_init_behaviour.py
+++ b/tests/models/language/pooling/test_pooler_config_init_behaviour.py
@@ -10,10 +10,7 @@
 
 @pytest.mark.parametrize(
     "model",
-    [
-        "jason9693/Qwen2.5-1.5B-apeach",
-        "papluca/xlm-roberta-base-language-detection"
-    ],
+    ["jason9693/Qwen2.5-1.5B-apeach", "papluca/xlm-roberta-base-language-detection"],
 )
 @pytest.mark.parametrize("dtype", ["half"])
 def test_classify_models_using_activation(
@@ -23,30 +20,32 @@ def test_classify_models_using_activation(
     model: str,
     dtype: str,
 ) -> None:
-
     with vllm_runner(
-            model,
-            max_model_len=512,
-            dtype=dtype,
-            pooler_config=PoolerConfig(activation=False)) as vllm_model:
+        model,
+        max_model_len=512,
+        dtype=dtype,
+        pooler_config=PoolerConfig(activation=False),
+    ) as vllm_model:
         wo_activation_out = vllm_model.classify(example_prompts)
 
     with vllm_runner(
-            model,
-            max_model_len=512,
-            dtype=dtype,
-            pooler_config=PoolerConfig(activation=True)) as vllm_model:
+        model,
+        max_model_len=512,
+        dtype=dtype,
+        pooler_config=PoolerConfig(activation=True),
+    ) as vllm_model:
         w_activation_out = vllm_model.classify(example_prompts)
 
-    for wo_activation, w_activation in zip(wo_activation_out,
-                                           w_activation_out):
+    for wo_activation, w_activation in zip(wo_activation_out, w_activation_out):
         wo_activation = torch.tensor(wo_activation)
         w_activation = torch.tensor(w_activation)
 
-        assert not torch.allclose(wo_activation, w_activation,
-                                  atol=1e-2), "pooler_config is not working"
-        assert torch.allclose(softmax(wo_activation), w_activation,
-                              1e-3 if dtype == "float" else 1e-2)
+        assert not torch.allclose(wo_activation, w_activation, atol=1e-2), (
+            "pooler_config is not working"
+        )
+        assert torch.allclose(
+            softmax(wo_activation), w_activation, 1e-3 if dtype == "float" else 1e-2
+        )
 
 
 @pytest.mark.parametrize(
@@ -63,26 +62,28 @@ def test_embed_models_using_normalize(
     model: str,
     dtype: str,
 ) -> None:
-
     with vllm_runner(
-            model,
-            max_model_len=512,
-            dtype=dtype,
-            pooler_config=PoolerConfig(normalize=False)) as vllm_model:
+        model,
+        max_model_len=512,
+        dtype=dtype,
+        pooler_config=PoolerConfig(normalize=False),
+    ) as vllm_model:
         wo_normalize = torch.tensor(vllm_model.embed(example_prompts))
 
-    with vllm_runner(model,
-                     max_model_len=512,
-                     dtype=dtype,
-                     pooler_config=PoolerConfig(normalize=True)) as vllm_model:
+    with vllm_runner(
+        model,
+        max_model_len=512,
+        dtype=dtype,
+        pooler_config=PoolerConfig(normalize=True),
+    ) as vllm_model:
         w_normalize = torch.tensor(vllm_model.embed(example_prompts))
 
-    assert not torch.allclose(
-        wo_normalize, w_normalize,
-        atol=1e-2), "pooler_config normalize is not working"
+    assert not torch.allclose(wo_normalize, w_normalize, atol=1e-2), (
+        "pooler_config normalize is not working"
+    )
     assert torch.allclose(
-        F.normalize(wo_normalize, p=2, dim=-1), w_normalize,
-        atol=1e-2), "w_normal should be close to normal(wo_normal)."
+        F.normalize(wo_normalize, p=2, dim=-1), w_normalize, atol=1e-2
+    ), "w_normal should be close to normal(wo_normal)."
 
 
 @pytest.mark.parametrize(
@@ -99,25 +100,26 @@ def test_reward_models_using_softmax(
     model: str,
     dtype: str,
 ) -> None:
-
-    with vllm_runner(model,
-                     max_model_len=1024,
-                     dtype=dtype,
-                     pooler_config=PoolerConfig(softmax=False)) as vllm_model:
+    with vllm_runner(
+        model,
+        max_model_len=1024,
+        dtype=dtype,
+        pooler_config=PoolerConfig(softmax=False),
+    ) as vllm_model:
         wo_softmax = vllm_model.encode(example_prompts)
 
-    with vllm_runner(model,
-                     max_model_len=1024,
-                     dtype=dtype,
-                     pooler_config=PoolerConfig(softmax=True)) as vllm_model:
+    with vllm_runner(
+        model, max_model_len=1024, dtype=dtype, pooler_config=PoolerConfig(softmax=True)
+    ) as vllm_model:
         w_softmax = vllm_model.encode(example_prompts)
 
     for wo, w in zip(wo_softmax, w_softmax):
         wo = torch.tensor(wo)
         w = torch.tensor(w)
 
-        assert not torch.allclose(
-            wo, w, atol=1e-2), "pooler_config softmax is not working"
-        assert torch.allclose(
-            softmax(wo), w,
-            atol=1e-2), "w_softmax should be close to softmax(wo_softmax)."
+        assert not torch.allclose(wo, w, atol=1e-2), (
+            "pooler_config softmax is not working"
+        )
+        assert torch.allclose(softmax(wo), w, atol=1e-2), (
+            "w_softmax should be close to softmax(wo_softmax)."
+        )
diff --git a/tests/models/language/pooling/test_reward.py b/tests/models/language/pooling/test_reward.py
index 4ac91b5aed50..46504d025c26 100644
--- a/tests/models/language/pooling/test_reward.py
+++ b/tests/models/language/pooling/test_reward.py
@@ -16,10 +16,8 @@
 def math_step_prompts():
     # ruff: noqa: E501
     data = {
-        "system":
-        "Please reason step by step, and put your final answer within \\boxed{}. ",
-        "query":
-        "Sue lives in a fun neighborhood.  One weekend, the neighbors decided to play a prank on Sue.  On Friday morning, the neighbors placed 18 pink plastic flamingos out on Sue's front yard.  On Saturday morning, the neighbors took back one third of the flamingos, painted them white, and put these newly painted white flamingos back out on Sue's front yard.  Then, on Sunday morning, they added another 18 pink plastic flamingos to the collection. At noon on Sunday, how many more pink plastic flamingos were out than white plastic flamingos?",
+        "system": "Please reason step by step, and put your final answer within \\boxed{}. ",
+        "query": "Sue lives in a fun neighborhood.  One weekend, the neighbors decided to play a prank on Sue.  On Friday morning, the neighbors placed 18 pink plastic flamingos out on Sue's front yard.  On Saturday morning, the neighbors took back one third of the flamingos, painted them white, and put these newly painted white flamingos back out on Sue's front yard.  Then, on Sunday morning, they added another 18 pink plastic flamingos to the collection. At noon on Sunday, how many more pink plastic flamingos were out than white plastic flamingos?",
         "response": [
             "To find out how many more pink plastic flamingos were out than white plastic flamingos at noon on Sunday, we can break down the problem into steps. First, on Friday, the neighbors start with 18 pink plastic flamingos.",
             "On Saturday, they take back one third of the flamingos. Since there were 18 flamingos, (1/3 \\times 18 = 6) flamingos are taken back. So, they have (18 - 6 = 12) flamingos left in their possession. Then, they paint these 6 flamingos white and put them back out on Sue's front yard. Now, Sue has the original 12 pink flamingos plus the 6 new white ones. Thus, by the end of Saturday, Sue has (12 + 6 = 18) pink flamingos and 6 white flamingos.",
@@ -27,16 +25,16 @@ def math_step_prompts():
             "To find the difference, subtract the number of white flamingos from the number of pink flamingos: (36 - 6 = 30). Therefore, at noon on Sunday, there were 30 more pink plastic flamingos out than white plastic flamingos. The answer is (\\boxed{30}).",
         ],
     }
-    answer = "<extra_0>".join(data['response']) + "<extra_0>"
+    answer = "<extra_0>".join(data["response"]) + "<extra_0>"
     prompt = f"<im_start>system\n{data['system']}<im_end>\n<im_start>user\n{data['query']}<im_end>\n<im_start>assistant\n{answer}<im_end><|endoftext|>"
     return [prompt]
 
 
 def step_reward_patch_hf_model(hf_model: HfRunner):
-
     # Patch the hf_runner to use the step reward function
-    def make_step_rewards(logits: torch.Tensor,
-                          token_masks: torch.Tensor) -> list[list[float]]:
+    def make_step_rewards(
+        logits: torch.Tensor, token_masks: torch.Tensor
+    ) -> list[list[float]]:
         probabilities = F.softmax(logits, dim=-1)
         probabilities = probabilities * token_masks.unsqueeze(-1)
 
@@ -54,7 +52,7 @@ def reward(prompts: list[str]) -> list[list[float]]:
         outputs = hf_model.model(input_ids=input_ids)
 
         step_sep_id = hf_model.tokenizer.encode("<extra_0>")[0]
-        token_masks = (input_ids == step_sep_id)
+        token_masks = input_ids == step_sep_id
         return make_step_rewards(outputs[0], token_masks)
 
     hf_model.reward = reward  # type: ignore[attr-defined]
@@ -65,8 +63,10 @@ def reward(prompts: list[str]) -> list[list[float]]:
 @pytest.mark.parametrize(
     "model",
     [
-        pytest.param("Qwen/Qwen2.5-Math-PRM-7B",
-                     marks=[pytest.mark.core_model, pytest.mark.cpu_model]),
+        pytest.param(
+            "Qwen/Qwen2.5-Math-PRM-7B",
+            marks=[pytest.mark.core_model, pytest.mark.cpu_model],
+        ),
     ],
 )
 @pytest.mark.parametrize("dtype", ["half"])
@@ -78,8 +78,9 @@ def test_prm_models(
     dtype: str,
     monkeypatch,
 ) -> None:
-    check_transformers_version("Qwen/Qwen2.5-Math-PRM-7B",
-                               max_transformers_version="4.53.2")
+    check_transformers_version(
+        "Qwen/Qwen2.5-Math-PRM-7B", max_transformers_version="4.53.2"
+    )
 
     if current_platform.is_cpu():
         pytest.skip("CPU only supports V1")
diff --git a/tests/models/language/pooling/test_scoring.py b/tests/models/language/pooling/test_scoring.py
index ef9d5530cde1..416a43070f0e 100644
--- a/tests/models/language/pooling/test_scoring.py
+++ b/tests/models/language/pooling/test_scoring.py
@@ -37,10 +37,9 @@ def test_cross_encoder_1_to_1(vllm_runner, hf_runner, model_name):
     with hf_runner(model_name, dtype=DTYPE, is_cross_encoder=True) as hf_model:
         hf_outputs = hf_model.predict([text_pair]).tolist()
 
-    with vllm_runner(model_name,
-                     runner="pooling",
-                     dtype=DTYPE,
-                     max_model_len=None) as vllm_model:
+    with vllm_runner(
+        model_name, runner="pooling", dtype=DTYPE, max_model_len=None
+    ) as vllm_model:
         vllm_outputs = vllm_model.score(text_pair[0], text_pair[1])
 
     assert len(vllm_outputs) == 1
@@ -58,10 +57,9 @@ def test_cross_encoder_1_to_N(vllm_runner, hf_runner, model_name):
     with hf_runner(model_name, dtype=DTYPE, is_cross_encoder=True) as hf_model:
         hf_outputs = hf_model.predict(text_pairs).tolist()
 
-    with vllm_runner(model_name,
-                     runner="pooling",
-                     dtype=DTYPE,
-                     max_model_len=None) as vllm_model:
+    with vllm_runner(
+        model_name, runner="pooling", dtype=DTYPE, max_model_len=None
+    ) as vllm_model:
         vllm_outputs = vllm_model.score(TEXTS_1[0], TEXTS_2)
 
     assert len(vllm_outputs) == 2
@@ -80,10 +78,9 @@ def test_cross_encoder_N_to_N(vllm_runner, hf_runner, model_name):
     with hf_runner(model_name, dtype=DTYPE, is_cross_encoder=True) as hf_model:
         hf_outputs = hf_model.predict(text_pairs).tolist()
 
-    with vllm_runner(model_name,
-                     runner="pooling",
-                     dtype=DTYPE,
-                     max_model_len=None) as vllm_model:
+    with vllm_runner(
+        model_name, runner="pooling", dtype=DTYPE, max_model_len=None
+    ) as vllm_model:
         vllm_outputs = vllm_model.score(TEXTS_1, TEXTS_2)
 
     assert len(vllm_outputs) == 2
@@ -101,17 +98,15 @@ def emb_model_name(request):
 def test_embedding_1_to_1(vllm_runner, hf_runner, emb_model_name):
     text_pair = [TEXTS_1[0], TEXTS_2[0]]
 
-    with hf_runner(emb_model_name, dtype=DTYPE,
-                   is_sentence_transformer=True) as hf_model:
+    with hf_runner(
+        emb_model_name, dtype=DTYPE, is_sentence_transformer=True
+    ) as hf_model:
         hf_embeddings = hf_model.encode(text_pair)
-        hf_outputs = [
-            F.cosine_similarity(*map(torch.tensor, hf_embeddings), dim=0)
-        ]
+        hf_outputs = [F.cosine_similarity(*map(torch.tensor, hf_embeddings), dim=0)]
 
-    with vllm_runner(emb_model_name,
-                     runner="pooling",
-                     dtype=DTYPE,
-                     max_model_len=None) as vllm_model:
+    with vllm_runner(
+        emb_model_name, runner="pooling", dtype=DTYPE, max_model_len=None
+    ) as vllm_model:
         vllm_outputs = vllm_model.score(text_pair[0], text_pair[1])
 
     assert len(vllm_outputs) == 1
@@ -126,20 +121,18 @@ def test_embedding_1_to_N(vllm_runner, hf_runner, emb_model_name):
         [TEXTS_1[0], TEXTS_2[1]],
     ]
 
-    with hf_runner(emb_model_name, dtype=DTYPE,
-                   is_sentence_transformer=True) as hf_model:
-        hf_embeddings = [
-            hf_model.encode(text_pair) for text_pair in text_pairs
-        ]
+    with hf_runner(
+        emb_model_name, dtype=DTYPE, is_sentence_transformer=True
+    ) as hf_model:
+        hf_embeddings = [hf_model.encode(text_pair) for text_pair in text_pairs]
         hf_outputs = [
             F.cosine_similarity(*map(torch.tensor, pair), dim=0)
             for pair in hf_embeddings
         ]
 
-    with vllm_runner(emb_model_name,
-                     runner="pooling",
-                     dtype=DTYPE,
-                     max_model_len=None) as vllm_model:
+    with vllm_runner(
+        emb_model_name, runner="pooling", dtype=DTYPE, max_model_len=None
+    ) as vllm_model:
         vllm_outputs = vllm_model.score(TEXTS_1[0], TEXTS_2)
 
     assert len(vllm_outputs) == 2
@@ -155,20 +148,18 @@ def test_embedding_N_to_N(vllm_runner, hf_runner, emb_model_name):
         [TEXTS_1[1], TEXTS_2[1]],
     ]
 
-    with hf_runner(emb_model_name, dtype=DTYPE,
-                   is_sentence_transformer=True) as hf_model:
-        hf_embeddings = [
-            hf_model.encode(text_pair) for text_pair in text_pairs
-        ]
+    with hf_runner(
+        emb_model_name, dtype=DTYPE, is_sentence_transformer=True
+    ) as hf_model:
+        hf_embeddings = [hf_model.encode(text_pair) for text_pair in text_pairs]
         hf_outputs = [
             F.cosine_similarity(*map(torch.tensor, pair), dim=0)
             for pair in hf_embeddings
         ]
 
-    with vllm_runner(emb_model_name,
-                     runner="pooling",
-                     dtype=DTYPE,
-                     max_model_len=None) as vllm_model:
+    with vllm_runner(
+        emb_model_name, runner="pooling", dtype=DTYPE, max_model_len=None
+    ) as vllm_model:
         vllm_outputs = vllm_model.score(TEXTS_1, TEXTS_2)
 
     assert len(vllm_outputs) == 2
diff --git a/tests/models/language/pooling/test_token_classification.py b/tests/models/language/pooling/test_token_classification.py
index fd5e48a8b144..4849f1ec4d36 100644
--- a/tests/models/language/pooling/test_token_classification.py
+++ b/tests/models/language/pooling/test_token_classification.py
@@ -21,9 +21,9 @@ def test_models(
     with vllm_runner(model, max_model_len=None, dtype=dtype) as vllm_model:
         vllm_outputs = vllm_model.encode(example_prompts)
 
-    with hf_runner(model,
-                   dtype=dtype,
-                   auto_cls=AutoModelForTokenClassification) as hf_model:
+    with hf_runner(
+        model, dtype=dtype, auto_cls=AutoModelForTokenClassification
+    ) as hf_model:
         tokenizer = hf_model.tokenizer
         hf_outputs = []
         for prompt in example_prompts:
diff --git a/tests/models/language/pooling/test_truncation_control.py b/tests/models/language/pooling/test_truncation_control.py
index c6ef899958a0..f1870ddbee51 100644
--- a/tests/models/language/pooling/test_truncation_control.py
+++ b/tests/models/language/pooling/test_truncation_control.py
@@ -20,51 +20,57 @@
 field."""
 
 
-def test_smaller_truncation_size(vllm_runner,
-                                 model_name=MODEL_NAME,
-                                 input_str=input_str):
-
+def test_smaller_truncation_size(
+    vllm_runner, model_name=MODEL_NAME, input_str=input_str
+):
     truncate_prompt_tokens = 10
 
-    with vllm_runner(model_name, runner="pooling",
-                     max_model_len=max_model_len) as vllm_model:
+    with vllm_runner(
+        model_name, runner="pooling", max_model_len=max_model_len
+    ) as vllm_model:
         vllm_output = vllm_model.llm.embed(
-            input_str, truncate_prompt_tokens=truncate_prompt_tokens)
+            input_str, truncate_prompt_tokens=truncate_prompt_tokens
+        )
 
     prompt_tokens = vllm_output[0].prompt_token_ids
 
     assert len(prompt_tokens) == truncate_prompt_tokens
 
 
-def test_max_truncation_size(vllm_runner,
-                             model_name=MODEL_NAME,
-                             input_str=input_str):
+def test_max_truncation_size(vllm_runner, model_name=MODEL_NAME, input_str=input_str):
     truncate_prompt_tokens = -1
 
-    with vllm_runner(model_name, runner="pooling",
-                     max_model_len=max_model_len) as vllm_model:
+    with vllm_runner(
+        model_name, runner="pooling", max_model_len=max_model_len
+    ) as vllm_model:
         vllm_output = vllm_model.llm.embed(
-            input_str, truncate_prompt_tokens=truncate_prompt_tokens)
+            input_str, truncate_prompt_tokens=truncate_prompt_tokens
+        )
 
     prompt_tokens = vllm_output[0].prompt_token_ids
 
     assert len(prompt_tokens) == max_model_len
 
 
-def test_bigger_truncation_size(vllm_runner,
-                                model_name=MODEL_NAME,
-                                input_str=input_str):
-
+def test_bigger_truncation_size(
+    vllm_runner, model_name=MODEL_NAME, input_str=input_str
+):
     truncate_prompt_tokens = max_model_len + 1
 
-    with pytest.raises(ValueError), vllm_runner(
-            model_name, runner="pooling",
-            max_model_len=max_model_len) as vllm_model:
-
+    with (
+        pytest.raises(ValueError),
+        vllm_runner(
+            model_name, runner="pooling", max_model_len=max_model_len
+        ) as vllm_model,
+    ):
         llm_output = vllm_model.llm.embed(
-            input_str, truncate_prompt_tokens=truncate_prompt_tokens)
+            input_str, truncate_prompt_tokens=truncate_prompt_tokens
+        )
 
-        assert llm_output == f"""truncate_prompt_tokens value 
+        assert (
+            llm_output
+            == f"""truncate_prompt_tokens value 
                 ({truncate_prompt_tokens}) is greater than 
                 max_model_len ({max_model_len}). Please, select 
                 a smaller truncation size."""
+        )
diff --git a/tests/models/language/pooling_mteb_test/mteb_utils.py b/tests/models/language/pooling_mteb_test/mteb_utils.py
index 7b3c02fbbd9f..a4a7f1b48d3d 100644
--- a/tests/models/language/pooling_mteb_test/mteb_utils.py
+++ b/tests/models/language/pooling_mteb_test/mteb_utils.py
@@ -12,8 +12,7 @@
 import torch
 
 import tests.ci_envs as ci_envs
-from tests.models.utils import (EmbedModelInfo, RerankModelInfo,
-                                check_embeddings_close)
+from tests.models.utils import EmbedModelInfo, RerankModelInfo, check_embeddings_close
 
 # Most embedding models on the STS12 task (See #17175):
 # - Model implementation and minor changes in tensor dtype
@@ -30,7 +29,6 @@
 
 
 class VllmMtebEncoder(mteb.Encoder):
-
     def __init__(self, vllm_model):
         super().__init__()
         self.llm = vllm_model
@@ -53,8 +51,7 @@ def encode(
 
     def predict(
         self,
-        sentences: list[tuple[str, str,
-                              Optional[str]]],  # query, corpus, prompt
+        sentences: list[tuple[str, str, Optional[str]]],  # query, corpus, prompt
         *args,
         **kwargs,
     ) -> np.ndarray:
@@ -64,17 +61,15 @@ def predict(
         queries = [s[0] for s in sentences]
         corpus = [s[1] for s in sentences]
 
-        outputs = self.llm.score(queries,
-                                 corpus,
-                                 truncate_prompt_tokens=-1,
-                                 use_tqdm=False)
+        outputs = self.llm.score(
+            queries, corpus, truncate_prompt_tokens=-1, use_tqdm=False
+        )
         scores = np.array(outputs)
         scores = scores[np.argsort(r)]
         return scores
 
 
 class OpenAIClientMtebEncoder(mteb.Encoder):
-
     def __init__(self, model_name: str, client):
         super().__init__()
         self.model_name = model_name
@@ -87,8 +82,9 @@ def encode(self, sentences: Sequence[str], *args, **kwargs) -> np.ndarray:
         r = self.rng.permutation(len(sentences))
         sentences = [sentences[i] for i in r]
 
-        embeddings = self.client.embeddings.create(model=self.model_name,
-                                                   input=sentences)
+        embeddings = self.client.embeddings.create(
+            model=self.model_name, input=sentences
+        )
         outputs = [d.embedding for d in embeddings.data]
         embeds = np.array(outputs)
         embeds = embeds[np.argsort(r)]
@@ -96,7 +92,6 @@ def encode(self, sentences: Sequence[str], *args, **kwargs) -> np.ndarray:
 
 
 class ScoreClientMtebEncoder(mteb.Encoder):
-
     def __init__(self, model_name: str, url):
         super().__init__()
         self.model_name = model_name
@@ -105,8 +100,7 @@ def __init__(self, model_name: str, url):
 
     def predict(
         self,
-        sentences: list[tuple[str, str,
-                              Optional[str]]],  # query, corpus, prompt
+        sentences: list[tuple[str, str, Optional[str]]],  # query, corpus, prompt
         *args,
         **kwargs,
     ) -> np.ndarray:
@@ -122,27 +116,30 @@ def predict(
         return scores
 
     def get_score(self, query, corpus):
-        response = requests.post(self.url,
-                                 json={
-                                     "model": self.model_name,
-                                     "text_1": query,
-                                     "text_2": corpus,
-                                     "truncate_prompt_tokens": -1,
-                                 }).json()
-        return response['data'][0]["score"]
+        response = requests.post(
+            self.url,
+            json={
+                "model": self.model_name,
+                "text_1": query,
+                "text_2": corpus,
+                "truncate_prompt_tokens": -1,
+            },
+        ).json()
+        return response["data"][0]["score"]
 
 
 class RerankClientMtebEncoder(ScoreClientMtebEncoder):
-
     def get_score(self, query, corpus):
-        response = requests.post(self.url,
-                                 json={
-                                     "model": self.model_name,
-                                     "query": query,
-                                     "documents": [corpus],
-                                     "truncate_prompt_tokens": -1,
-                                 }).json()
-        return response['results'][0]["relevance_score"]
+        response = requests.post(
+            self.url,
+            json={
+                "model": self.model_name,
+                "query": query,
+                "documents": [corpus],
+                "truncate_prompt_tokens": -1,
+            },
+        ).json()
+        return response["results"][0]["relevance_score"]
 
 
 def run_mteb_embed_task(encoder, tasks):
@@ -161,12 +158,14 @@ def run_mteb_embed_task(encoder, tasks):
     return main_score
 
 
-def mteb_test_embed_models(hf_runner,
-                           vllm_runner,
-                           model_info: EmbedModelInfo,
-                           vllm_extra_kwargs=None,
-                           hf_model_callback=None,
-                           atol=MTEB_EMBED_TOL):
+def mteb_test_embed_models(
+    hf_runner,
+    vllm_runner,
+    model_info: EmbedModelInfo,
+    vllm_extra_kwargs=None,
+    hf_model_callback=None,
+    atol=MTEB_EMBED_TOL,
+):
     # A model family has many models with the same architecture,
     # and we don't need to test each one.
     if not ci_envs.VLLM_CI_NO_SKIP and not model_info.enable_test:
@@ -187,15 +186,15 @@ def mteb_test_embed_models(hf_runner,
     if ci_envs.VLLM_CI_HEAD_DTYPE is not None:
         if "hf_overrides" not in vllm_extra_kwargs:
             vllm_extra_kwargs["hf_overrides"] = {}
-        vllm_extra_kwargs["hf_overrides"][
-            "head_dtype"] = ci_envs.VLLM_CI_HEAD_DTYPE
-
-    with vllm_runner(model_info.name,
-                     runner="pooling",
-                     max_model_len=None,
-                     enforce_eager=True,
-                     **vllm_extra_kwargs) as vllm_model:
-
+        vllm_extra_kwargs["hf_overrides"]["head_dtype"] = ci_envs.VLLM_CI_HEAD_DTYPE
+
+    with vllm_runner(
+        model_info.name,
+        runner="pooling",
+        max_model_len=None,
+        enforce_eager=True,
+        **vllm_extra_kwargs,
+    ) as vllm_model:
         model_config = vllm_model.llm.llm_engine.model_config
 
         # Confirm whether vllm is using the correct architecture
@@ -204,28 +203,29 @@ def mteb_test_embed_models(hf_runner,
 
         # Confirm whether vllm uses the correct default_pooling_type, which
         # relates to whether chunked prefill and prefix caching are enabled
-        assert (model_config._model_info.default_pooling_type ==
-                model_info.default_pooling_type)
+        assert (
+            model_config._model_info.default_pooling_type
+            == model_info.default_pooling_type
+        )
 
-        vllm_main_score = run_mteb_embed_task(VllmMtebEncoder(vllm_model),
-                                              MTEB_EMBED_TASKS)
+        vllm_main_score = run_mteb_embed_task(
+            VllmMtebEncoder(vllm_model), MTEB_EMBED_TASKS
+        )
         vllm_dtype = vllm_model.llm.llm_engine.model_config.dtype
         head_dtype = model_config.head_dtype
 
         # Test embed_dims, isnan and whether to use normalize
-        vllm_outputs = vllm_model.embed(example_prompts,
-                                        truncate_prompt_tokens=-1)
+        vllm_outputs = vllm_model.embed(example_prompts, truncate_prompt_tokens=-1)
         assert not torch.any(torch.isnan(torch.tensor(vllm_outputs)))
 
     # Accelerate mteb test by setting
     # SentenceTransformers mteb score to a constant
     if model_info.mteb_score is None:
         with hf_runner(
-                model_info.name,
-                is_sentence_transformer=True,
-                dtype=ci_envs.VLLM_CI_HF_DTYPE or model_info.hf_dtype,
+            model_info.name,
+            is_sentence_transformer=True,
+            dtype=ci_envs.VLLM_CI_HF_DTYPE or model_info.hf_dtype,
         ) as hf_model:
-
             # e.g. setting default parameters for the encode method of hf_runner
             if hf_model_callback is not None:
                 hf_model_callback(hf_model)
@@ -247,8 +247,7 @@ def mteb_test_embed_models(hf_runner,
         st_dtype = "Constant"
 
     print("Model:", model_info.name)
-    print("VLLM:", f"dtype:{vllm_dtype}", f"head_dtype:{head_dtype}",
-          vllm_main_score)
+    print("VLLM:", f"dtype:{vllm_dtype}", f"head_dtype:{head_dtype}", vllm_main_score)
     print("SentenceTransformers:", st_dtype, st_main_score)
     print("Difference:", st_main_score - vllm_main_score)
 
@@ -282,26 +281,21 @@ def run_mteb_rerank(cross_encoder, tasks, languages):
             top_k=10,
             save_predictions=True,
             output_folder=f"{results_folder}/stage2",
-            previous_results=
-            f"{results_folder}/stage1/NFCorpus_{subset}_predictions.json",
+            previous_results=f"{results_folder}/stage1/NFCorpus_{subset}_predictions.json",
             encode_kwargs={"show_progress_bar": False},
         )
         main_score = results[0].scores["test"][0]["main_score"]
     return main_score
 
 
-def mteb_test_rerank_models_hf(hf_runner,
-                               model_name,
-                               hf_dtype="float32",
-                               hf_model_callback=None):
-    with hf_runner(model_name, is_cross_encoder=True,
-                   dtype=hf_dtype) as hf_model:
-
+def mteb_test_rerank_models_hf(
+    hf_runner, model_name, hf_dtype="float32", hf_model_callback=None
+):
+    with hf_runner(model_name, is_cross_encoder=True, dtype=hf_dtype) as hf_model:
         original_predict = hf_model.predict
 
         def _predict(
-            sentences: list[tuple[str, str,
-                                  Optional[str]]],  # query, corpus, prompt
+            sentences: list[tuple[str, str, Optional[str]]],  # query, corpus, prompt
             *args,
             **kwargs,
         ):
@@ -315,20 +309,22 @@ def _predict(
         if hf_model_callback is not None:
             hf_model_callback(hf_model)
 
-        st_main_score = run_mteb_rerank(hf_model,
-                                        tasks=MTEB_RERANK_TASKS,
-                                        languages=MTEB_RERANK_LANGS)
+        st_main_score = run_mteb_rerank(
+            hf_model, tasks=MTEB_RERANK_TASKS, languages=MTEB_RERANK_LANGS
+        )
         st_dtype = next(hf_model.model.model.parameters()).dtype
     return st_main_score, st_dtype
 
 
-def mteb_test_rerank_models(hf_runner,
-                            vllm_runner,
-                            model_info: RerankModelInfo,
-                            vllm_extra_kwargs=None,
-                            hf_model_callback=None,
-                            vllm_mteb_encoder=VllmMtebEncoder,
-                            atol=MTEB_RERANK_TOL):
+def mteb_test_rerank_models(
+    hf_runner,
+    vllm_runner,
+    model_info: RerankModelInfo,
+    vllm_extra_kwargs=None,
+    hf_model_callback=None,
+    vllm_mteb_encoder=VllmMtebEncoder,
+    atol=MTEB_RERANK_TOL,
+):
     # A model family has many models with the same architecture,
     # and we don't need to test each one.
     if not ci_envs.VLLM_CI_NO_SKIP and not model_info.enable_test:
@@ -346,33 +342,37 @@ def mteb_test_rerank_models(hf_runner,
     if ci_envs.VLLM_CI_HEAD_DTYPE is not None:
         if "hf_overrides" not in vllm_extra_kwargs:
             vllm_extra_kwargs["hf_overrides"] = {}
-        vllm_extra_kwargs["hf_overrides"][
-            "head_dtype"] = ci_envs.VLLM_CI_HEAD_DTYPE
-
-    with vllm_runner(model_info.name,
-                     runner="pooling",
-                     max_model_len=None,
-                     max_num_seqs=8,
-                     enforce_eager=True,
-                     **vllm_extra_kwargs) as vllm_model:
-
+        vllm_extra_kwargs["hf_overrides"]["head_dtype"] = ci_envs.VLLM_CI_HEAD_DTYPE
+
+    with vllm_runner(
+        model_info.name,
+        runner="pooling",
+        max_model_len=None,
+        max_num_seqs=8,
+        enforce_eager=True,
+        **vllm_extra_kwargs,
+    ) as vllm_model:
         model_config = vllm_model.llm.llm_engine.model_config
 
         # Confirm whether vllm is using the correct architecture
         if model_info.architecture:
-            assert (model_info.architecture in model_config.architectures)
+            assert model_info.architecture in model_config.architectures
 
         # Score API is only enabled for num_labels == 1
         assert model_config.hf_config.num_labels == 1
 
         # Confirm whether vllm uses the correct default_pooling_type, which
         # relates to whether chunked prefill and prefix caching are enabled
-        assert (model_config._model_info.default_pooling_type ==
-                model_info.default_pooling_type)
+        assert (
+            model_config._model_info.default_pooling_type
+            == model_info.default_pooling_type
+        )
 
-        vllm_main_score = run_mteb_rerank(vllm_mteb_encoder(vllm_model),
-                                          tasks=MTEB_RERANK_TASKS,
-                                          languages=MTEB_RERANK_LANGS)
+        vllm_main_score = run_mteb_rerank(
+            vllm_mteb_encoder(vllm_model),
+            tasks=MTEB_RERANK_TASKS,
+            languages=MTEB_RERANK_LANGS,
+        )
         vllm_dtype = model_config.dtype
         head_dtype = model_config.head_dtype
 
@@ -380,14 +380,14 @@ def mteb_test_rerank_models(hf_runner,
     # SentenceTransformers mteb score to a constant
     if model_info.mteb_score is None:
         st_main_score, st_dtype = mteb_test_rerank_models_hf(
-            hf_runner, model_info.name, model_info.hf_dtype, hf_model_callback)
+            hf_runner, model_info.name, model_info.hf_dtype, hf_model_callback
+        )
     else:
         st_main_score = model_info.mteb_score
         st_dtype = "Constant"
 
     print("Model:", model_info.name)
-    print("VLLM:", f"dtype:{vllm_dtype}", f"head_dtype:{head_dtype}",
-          vllm_main_score)
+    print("VLLM:", f"dtype:{vllm_dtype}", f"head_dtype:{head_dtype}", vllm_main_score)
     print("SentenceTransformers:", st_dtype, st_main_score)
     print("Difference:", st_main_score - vllm_main_score)
 
diff --git a/tests/models/language/pooling_mteb_test/test_baai.py b/tests/models/language/pooling_mteb_test/test_baai.py
index e131c9b1038d..bad13e245714 100644
--- a/tests/models/language/pooling_mteb_test/test_baai.py
+++ b/tests/models/language/pooling_mteb_test/test_baai.py
@@ -2,67 +2,76 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 import pytest
 
-from tests.models.language.pooling.embed_utils import (
-    correctness_test_embed_models)
-from tests.models.utils import (CLSPoolingEmbedModelInfo,
-                                CLSPoolingRerankModelInfo, EmbedModelInfo,
-                                LASTPoolingEmbedModelInfo, RerankModelInfo)
+from tests.models.language.pooling.embed_utils import correctness_test_embed_models
+from tests.models.utils import (
+    CLSPoolingEmbedModelInfo,
+    CLSPoolingRerankModelInfo,
+    EmbedModelInfo,
+    LASTPoolingEmbedModelInfo,
+    RerankModelInfo,
+)
 
 from .mteb_utils import mteb_test_embed_models, mteb_test_rerank_models
 
 MODELS = [
     ########## BertModel
-    CLSPoolingEmbedModelInfo("BAAI/bge-base-en",
-                             architecture="BertModel",
-                             mteb_score=0.779336792,
-                             enable_test=True),
-    CLSPoolingEmbedModelInfo("BAAI/bge-base-zh",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("BAAI/bge-small-en",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("BAAI/bge-small-zh",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("BAAI/bge-large-en",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("BAAI/bge-large-zh",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("BAAI/bge-large-zh-noinstruct",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("BAAI/bge-base-en-v1.5",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("BAAI/bge-base-zh-v1.5",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("BAAI/bge-small-en-v1.5",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("BAAI/bge-small-zh-v1.5",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("BAAI/bge-large-en-v1.5",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("BAAI/bge-large-zh-v1.5",
-                             architecture="BertModel",
-                             enable_test=False),
+    CLSPoolingEmbedModelInfo(
+        "BAAI/bge-base-en",
+        architecture="BertModel",
+        mteb_score=0.779336792,
+        enable_test=True,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "BAAI/bge-base-zh", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "BAAI/bge-small-en", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "BAAI/bge-small-zh", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "BAAI/bge-large-en", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "BAAI/bge-large-zh", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "BAAI/bge-large-zh-noinstruct", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "BAAI/bge-base-en-v1.5", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "BAAI/bge-base-zh-v1.5", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "BAAI/bge-small-en-v1.5", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "BAAI/bge-small-zh-v1.5", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "BAAI/bge-large-en-v1.5", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "BAAI/bge-large-zh-v1.5", architecture="BertModel", enable_test=False
+    ),
     ########## XLMRobertaModel
-    CLSPoolingEmbedModelInfo("BAAI/bge-m3",
-                             architecture="XLMRobertaModel",
-                             mteb_score=0.787343078,
-                             enable_test=True),
+    CLSPoolingEmbedModelInfo(
+        "BAAI/bge-m3",
+        architecture="XLMRobertaModel",
+        mteb_score=0.787343078,
+        enable_test=True,
+    ),
     ########## Qwen2Model
-    LASTPoolingEmbedModelInfo("BAAI/bge-code-v1",
-                              architecture="Qwen2Model",
-                              mteb_score=0.75724465,
-                              dtype="float32",
-                              enable_test=True),
+    LASTPoolingEmbedModelInfo(
+        "BAAI/bge-code-v1",
+        architecture="Qwen2Model",
+        mteb_score=0.75724465,
+        dtype="float32",
+        enable_test=True,
+    ),
 ]
 
 RERANK_MODELS = [
@@ -71,33 +80,35 @@
         "BAAI/bge-reranker-base",
         architecture="XLMRobertaForSequenceClassification",
         mteb_score=0.32398,
-        enable_test=True),
+        enable_test=True,
+    ),
     CLSPoolingRerankModelInfo(
         "BAAI/bge-reranker-large",
         architecture="XLMRobertaForSequenceClassification",
-        enable_test=False),
+        enable_test=False,
+    ),
     CLSPoolingRerankModelInfo(
         "BAAI/bge-reranker-v2-m3",
         architecture="XLMRobertaForSequenceClassification",
-        enable_test=False)
+        enable_test=False,
+    ),
 ]
 
 
 @pytest.mark.parametrize("model_info", MODELS)
-def test_embed_models_mteb(hf_runner, vllm_runner,
-                           model_info: EmbedModelInfo) -> None:
+def test_embed_models_mteb(hf_runner, vllm_runner, model_info: EmbedModelInfo) -> None:
     mteb_test_embed_models(hf_runner, vllm_runner, model_info)
 
 
 @pytest.mark.parametrize("model_info", MODELS)
-def test_embed_models_correctness(hf_runner, vllm_runner,
-                                  model_info: EmbedModelInfo,
-                                  example_prompts) -> None:
-    correctness_test_embed_models(hf_runner, vllm_runner, model_info,
-                                  example_prompts)
+def test_embed_models_correctness(
+    hf_runner, vllm_runner, model_info: EmbedModelInfo, example_prompts
+) -> None:
+    correctness_test_embed_models(hf_runner, vllm_runner, model_info, example_prompts)
 
 
 @pytest.mark.parametrize("model_info", RERANK_MODELS)
-def test_rerank_models_mteb(hf_runner, vllm_runner,
-                            model_info: RerankModelInfo) -> None:
+def test_rerank_models_mteb(
+    hf_runner, vllm_runner, model_info: RerankModelInfo
+) -> None:
     mteb_test_rerank_models(hf_runner, vllm_runner, model_info)
diff --git a/tests/models/language/pooling_mteb_test/test_bge_reranker_v2_gemma.py b/tests/models/language/pooling_mteb_test/test_bge_reranker_v2_gemma.py
index 1eca2a2c0abd..9e95dd74c397 100644
--- a/tests/models/language/pooling_mteb_test/test_bge_reranker_v2_gemma.py
+++ b/tests/models/language/pooling_mteb_test/test_bge_reranker_v2_gemma.py
@@ -8,53 +8,50 @@
 
 from tests.conftest import HfRunner
 from tests.models.language.pooling_mteb_test.mteb_utils import (
-    VllmMtebEncoder, mteb_test_rerank_models)
+    VllmMtebEncoder,
+    mteb_test_rerank_models,
+)
 from tests.models.utils import LASTPoolingRerankModelInfo, RerankModelInfo
 
 RERANK_MODELS = [
-    LASTPoolingRerankModelInfo("BAAI/bge-reranker-v2-gemma",
-                               architecture="GemmaForSequenceClassification",
-                               mteb_score=0.33757,
-                               hf_overrides={
-                                   "architectures":
-                                   ["GemmaForSequenceClassification"],
-                                   "classifier_from_token": ["Yes"],
-                                   "method":
-                                   "no_post_processing",
-                               }),
+    LASTPoolingRerankModelInfo(
+        "BAAI/bge-reranker-v2-gemma",
+        architecture="GemmaForSequenceClassification",
+        mteb_score=0.33757,
+        hf_overrides={
+            "architectures": ["GemmaForSequenceClassification"],
+            "classifier_from_token": ["Yes"],
+            "method": "no_post_processing",
+        },
+    ),
 ]
 
 PROMPT = "Given a query A and a passage B, determine whether the passage contains an answer to the query by providing a prediction of either 'Yes' or 'No'."  # noqa: E501
 
 
 class GemmaRerankerHfRunner(HfRunner):
-
-    def __init__(self,
-                 model_name: str,
-                 dtype: str = "auto",
-                 *args: Any,
-                 **kwargs: Any) -> None:
+    def __init__(
+        self, model_name: str, dtype: str = "auto", *args: Any, **kwargs: Any
+    ) -> None:
         from transformers import AutoModelForCausalLM, AutoTokenizer
+
         super().__init__(model_name, dtype, auto_cls=AutoModelForCausalLM)
-        self.tokenizer = AutoTokenizer.from_pretrained(model_name,
-                                                       padding_side='left')
+        self.tokenizer = AutoTokenizer.from_pretrained(model_name, padding_side="left")
         self.yes_loc = self.tokenizer.convert_tokens_to_ids("Yes")
 
     @torch.no_grad()
-    def predict(self, prompts: list[list[str]], *args,
-                **kwargs) -> torch.Tensor:
-
+    def predict(self, prompts: list[list[str]], *args, **kwargs) -> torch.Tensor:
         def get_inputs(pairs, tokenizer, prompt=None):
             if prompt is None:
                 prompt = PROMPT
 
             sep = "\n"
-            prompt_inputs = tokenizer(prompt,
-                                      return_tensors=None,
-                                      add_special_tokens=False)["input_ids"]
-            sep_inputs = tokenizer(sep,
-                                   return_tensors=None,
-                                   add_special_tokens=False)["input_ids"]
+            prompt_inputs = tokenizer(
+                prompt, return_tensors=None, add_special_tokens=False
+            )["input_ids"]
+            sep_inputs = tokenizer(sep, return_tensors=None, add_special_tokens=False)[
+                "input_ids"
+            ]
             inputs = []
             for query, passage in pairs:
                 query_inputs = tokenizer(
@@ -78,8 +75,7 @@ def get_inputs(pairs, tokenizer, prompt=None):
                     return_token_type_ids=False,
                     add_special_tokens=False,
                 )
-                item["input_ids"] = item[
-                    "input_ids"] + sep_inputs + prompt_inputs
+                item["input_ids"] = item["input_ids"] + sep_inputs + prompt_inputs
                 item["attention_mask"] = [1] * len(item["input_ids"])
                 inputs.append(item)
             return tokenizer.pad(
@@ -95,14 +91,19 @@ def get_inputs(pairs, tokenizer, prompt=None):
             inputs = inputs.to(self.model.device)
             _n_tokens = inputs["input_ids"].shape[1]
             logits = self.model(**inputs, return_dict=True).logits
-            _scores = (logits[:, -1,
-                              self.yes_loc].view(-1, ).float().sigmoid())
+            _scores = (
+                logits[:, -1, self.yes_loc]
+                .view(
+                    -1,
+                )
+                .float()
+                .sigmoid()
+            )
             scores.append(_scores[0].item())
         return torch.Tensor(scores)
 
 
 class GemmaMtebEncoder(VllmMtebEncoder):
-
     def __init__(self, *args, **kwargs):
         super().__init__(*args, **kwargs)
         self.query_template = "A: {query}\n"
@@ -110,12 +111,10 @@ def __init__(self, *args, **kwargs):
 
     def predict(
         self,
-        sentences: list[tuple[str, str,
-                              Optional[str]]],  # query, corpus, prompt
+        sentences: list[tuple[str, str, Optional[str]]],  # query, corpus, prompt
         *args,
         **kwargs,
     ) -> np.ndarray:
-
         _sentences = []
         for query, corpus, prompt in sentences:
             query = self.query_template.format(query=query)
@@ -127,8 +126,9 @@ def predict(
 
 @pytest.mark.parametrize("model_info", RERANK_MODELS)
 def test_rerank_models_mteb(vllm_runner, model_info: RerankModelInfo) -> None:
-
-    mteb_test_rerank_models(GemmaRerankerHfRunner,
-                            vllm_runner,
-                            model_info,
-                            vllm_mteb_encoder=GemmaMtebEncoder)
+    mteb_test_rerank_models(
+        GemmaRerankerHfRunner,
+        vllm_runner,
+        model_info,
+        vllm_mteb_encoder=GemmaMtebEncoder,
+    )
diff --git a/tests/models/language/pooling_mteb_test/test_cross_encoder.py b/tests/models/language/pooling_mteb_test/test_cross_encoder.py
index ad320fae0c85..638ffc7a62b0 100644
--- a/tests/models/language/pooling_mteb_test/test_cross_encoder.py
+++ b/tests/models/language/pooling_mteb_test/test_cross_encoder.py
@@ -2,22 +2,30 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 import pytest
 
-from tests.models.utils import (CLSPoolingRerankModelInfo,
-                                LASTPoolingRerankModelInfo, RerankModelInfo)
+from tests.models.utils import (
+    CLSPoolingRerankModelInfo,
+    LASTPoolingRerankModelInfo,
+    RerankModelInfo,
+)
 
 from .mteb_utils import mteb_test_rerank_models
 
 RERANK_MODELS = [
-    CLSPoolingRerankModelInfo("cross-encoder/ms-marco-TinyBERT-L-2-v2",
-                              mteb_score=0.32898,
-                              architecture="BertForSequenceClassification"),
-    LASTPoolingRerankModelInfo("tomaarsen/Qwen3-Reranker-0.6B-seq-cls",
-                               mteb_score=0.25736,
-                               architecture="Qwen3ForSequenceClassification")
+    CLSPoolingRerankModelInfo(
+        "cross-encoder/ms-marco-TinyBERT-L-2-v2",
+        mteb_score=0.32898,
+        architecture="BertForSequenceClassification",
+    ),
+    LASTPoolingRerankModelInfo(
+        "tomaarsen/Qwen3-Reranker-0.6B-seq-cls",
+        mteb_score=0.25736,
+        architecture="Qwen3ForSequenceClassification",
+    ),
 ]
 
 
 @pytest.mark.parametrize("model_info", RERANK_MODELS)
-def test_rerank_models_mteb(hf_runner, vllm_runner,
-                            model_info: RerankModelInfo) -> None:
+def test_rerank_models_mteb(
+    hf_runner, vllm_runner, model_info: RerankModelInfo
+) -> None:
     mteb_test_rerank_models(hf_runner, vllm_runner, model_info)
diff --git a/tests/models/language/pooling_mteb_test/test_gte.py b/tests/models/language/pooling_mteb_test/test_gte.py
index 9ae43fd05bf7..a22821fd65b5 100644
--- a/tests/models/language/pooling_mteb_test/test_gte.py
+++ b/tests/models/language/pooling_mteb_test/test_gte.py
@@ -3,74 +3,93 @@
 
 import pytest
 
-from tests.models.language.pooling.embed_utils import (
-    correctness_test_embed_models)
-from tests.models.utils import (CLSPoolingEmbedModelInfo,
-                                CLSPoolingRerankModelInfo, EmbedModelInfo,
-                                LASTPoolingEmbedModelInfo, RerankModelInfo)
+from tests.models.language.pooling.embed_utils import correctness_test_embed_models
+from tests.models.utils import (
+    CLSPoolingEmbedModelInfo,
+    CLSPoolingRerankModelInfo,
+    EmbedModelInfo,
+    LASTPoolingEmbedModelInfo,
+    RerankModelInfo,
+)
 
 from .mteb_utils import mteb_test_embed_models, mteb_test_rerank_models
 
 MODELS = [
     ########## BertModel
-    CLSPoolingEmbedModelInfo("thenlper/gte-large",
-                             mteb_score=0.76807651,
-                             architecture="BertModel",
-                             enable_test=True),
-    CLSPoolingEmbedModelInfo("thenlper/gte-base",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("thenlper/gte-small",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("thenlper/gte-large-zh",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("thenlper/gte-base-zh",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("thenlper/gte-small-zh",
-                             architecture="BertModel",
-                             enable_test=False),
+    CLSPoolingEmbedModelInfo(
+        "thenlper/gte-large",
+        mteb_score=0.76807651,
+        architecture="BertModel",
+        enable_test=True,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "thenlper/gte-base", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "thenlper/gte-small", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "thenlper/gte-large-zh", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "thenlper/gte-base-zh", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "thenlper/gte-small-zh", architecture="BertModel", enable_test=False
+    ),
     ########### NewModel
     # These three architectures are almost the same, but not exactly the same.
     # For example,
     # - whether to use token_type_embeddings
     # - whether to use context expansion
     # So only test one (the most widely used) model
-    CLSPoolingEmbedModelInfo("Alibaba-NLP/gte-multilingual-base",
-                             architecture="GteNewModel",
-                             mteb_score=0.775074696,
-                             hf_overrides={"architectures": ["GteNewModel"]},
-                             enable_test=True),
-    CLSPoolingEmbedModelInfo("Alibaba-NLP/gte-base-en-v1.5",
-                             architecture="GteNewModel",
-                             hf_overrides={"architectures": ["GteNewModel"]},
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("Alibaba-NLP/gte-large-en-v1.5",
-                             architecture="GteNewModel",
-                             hf_overrides={"architectures": ["GteNewModel"]},
-                             enable_test=False),
+    CLSPoolingEmbedModelInfo(
+        "Alibaba-NLP/gte-multilingual-base",
+        architecture="GteNewModel",
+        mteb_score=0.775074696,
+        hf_overrides={"architectures": ["GteNewModel"]},
+        enable_test=True,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "Alibaba-NLP/gte-base-en-v1.5",
+        architecture="GteNewModel",
+        hf_overrides={"architectures": ["GteNewModel"]},
+        enable_test=False,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "Alibaba-NLP/gte-large-en-v1.5",
+        architecture="GteNewModel",
+        hf_overrides={"architectures": ["GteNewModel"]},
+        enable_test=False,
+    ),
     ########### Qwen2ForCausalLM
-    LASTPoolingEmbedModelInfo("Alibaba-NLP/gte-Qwen2-1.5B-instruct",
-                              mteb_score=0.758473459018872,
-                              architecture="Qwen2ForCausalLM",
-                              enable_test=True),
+    LASTPoolingEmbedModelInfo(
+        "Alibaba-NLP/gte-Qwen2-1.5B-instruct",
+        mteb_score=0.758473459018872,
+        architecture="Qwen2ForCausalLM",
+        enable_test=True,
+    ),
     ########## ModernBertModel
-    CLSPoolingEmbedModelInfo("Alibaba-NLP/gte-modernbert-base",
-                             mteb_score=0.748193353,
-                             architecture="ModernBertModel",
-                             enable_test=True),
+    CLSPoolingEmbedModelInfo(
+        "Alibaba-NLP/gte-modernbert-base",
+        mteb_score=0.748193353,
+        architecture="ModernBertModel",
+        enable_test=True,
+    ),
     ########## Qwen3ForCausalLM
-    LASTPoolingEmbedModelInfo("Qwen/Qwen3-Embedding-0.6B",
-                              mteb_score=0.771163695,
-                              architecture="Qwen3ForCausalLM",
-                              dtype="float32",
-                              enable_test=True),
-    LASTPoolingEmbedModelInfo("Qwen/Qwen3-Embedding-4B",
-                              architecture="Qwen3ForCausalLM",
-                              dtype="float32",
-                              enable_test=False),
+    LASTPoolingEmbedModelInfo(
+        "Qwen/Qwen3-Embedding-0.6B",
+        mteb_score=0.771163695,
+        architecture="Qwen3ForCausalLM",
+        dtype="float32",
+        enable_test=True,
+    ),
+    LASTPoolingEmbedModelInfo(
+        "Qwen/Qwen3-Embedding-4B",
+        architecture="Qwen3ForCausalLM",
+        dtype="float32",
+        enable_test=False,
+    ),
 ]
 
 RERANK_MODELS = [
@@ -79,31 +98,32 @@
         "Alibaba-NLP/gte-reranker-modernbert-base",
         mteb_score=0.33386,
         architecture="ModernBertForSequenceClassification",
-        enable_test=True),
+        enable_test=True,
+    ),
     CLSPoolingRerankModelInfo(
         "Alibaba-NLP/gte-multilingual-reranker-base",
         mteb_score=0.33062,
         architecture="GteNewForSequenceClassification",
         hf_overrides={"architectures": ["GteNewForSequenceClassification"]},
-        enable_test=True),
+        enable_test=True,
+    ),
 ]
 
 
 @pytest.mark.parametrize("model_info", MODELS)
-def test_embed_models_mteb(hf_runner, vllm_runner,
-                           model_info: EmbedModelInfo) -> None:
+def test_embed_models_mteb(hf_runner, vllm_runner, model_info: EmbedModelInfo) -> None:
     mteb_test_embed_models(hf_runner, vllm_runner, model_info)
 
 
 @pytest.mark.parametrize("model_info", MODELS)
-def test_embed_models_correctness(hf_runner, vllm_runner,
-                                  model_info: EmbedModelInfo,
-                                  example_prompts) -> None:
-    correctness_test_embed_models(hf_runner, vllm_runner, model_info,
-                                  example_prompts)
+def test_embed_models_correctness(
+    hf_runner, vllm_runner, model_info: EmbedModelInfo, example_prompts
+) -> None:
+    correctness_test_embed_models(hf_runner, vllm_runner, model_info, example_prompts)
 
 
 @pytest.mark.parametrize("model_info", RERANK_MODELS)
-def test_rerank_models_mteb(hf_runner, vllm_runner,
-                            model_info: RerankModelInfo) -> None:
+def test_rerank_models_mteb(
+    hf_runner, vllm_runner, model_info: RerankModelInfo
+) -> None:
     mteb_test_rerank_models(hf_runner, vllm_runner, model_info)
diff --git a/tests/models/language/pooling_mteb_test/test_intfloat.py b/tests/models/language/pooling_mteb_test/test_intfloat.py
index 0d6026898ad4..1d078db69236 100644
--- a/tests/models/language/pooling_mteb_test/test_intfloat.py
+++ b/tests/models/language/pooling_mteb_test/test_intfloat.py
@@ -2,50 +2,55 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 import pytest
 
-from tests.models.language.pooling.embed_utils import (
-    correctness_test_embed_models)
+from tests.models.language.pooling.embed_utils import correctness_test_embed_models
 from tests.models.utils import CLSPoolingEmbedModelInfo, EmbedModelInfo
 
 from .mteb_utils import mteb_test_embed_models
 
 MODELS = [
     ########## BertModel
-    CLSPoolingEmbedModelInfo("intfloat/e5-small",
-                             architecture="BertModel",
-                             mteb_score=0.742285423,
-                             enable_test=True),
-    CLSPoolingEmbedModelInfo("intfloat/e5-base",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("intfloat/e5-large",
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("intfloat/multilingual-e5-small",
-                             architecture="BertModel",
-                             enable_test=False),
+    CLSPoolingEmbedModelInfo(
+        "intfloat/e5-small",
+        architecture="BertModel",
+        mteb_score=0.742285423,
+        enable_test=True,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "intfloat/e5-base", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "intfloat/e5-large", architecture="BertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "intfloat/multilingual-e5-small", architecture="BertModel", enable_test=False
+    ),
     ########## XLMRobertaModel
-    CLSPoolingEmbedModelInfo("intfloat/multilingual-e5-base",
-                             architecture="XLMRobertaModel",
-                             mteb_score=0.779325955,
-                             enable_test=True),
-    CLSPoolingEmbedModelInfo("intfloat/multilingual-e5-large",
-                             architecture="XLMRobertaModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("intfloat/multilingual-e5-large-instruct",
-                             architecture="XLMRobertaModel",
-                             enable_test=False),
+    CLSPoolingEmbedModelInfo(
+        "intfloat/multilingual-e5-base",
+        architecture="XLMRobertaModel",
+        mteb_score=0.779325955,
+        enable_test=True,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "intfloat/multilingual-e5-large",
+        architecture="XLMRobertaModel",
+        enable_test=False,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "intfloat/multilingual-e5-large-instruct",
+        architecture="XLMRobertaModel",
+        enable_test=False,
+    ),
 ]
 
 
 @pytest.mark.parametrize("model_info", MODELS)
-def test_embed_models_mteb(hf_runner, vllm_runner,
-                           model_info: EmbedModelInfo) -> None:
+def test_embed_models_mteb(hf_runner, vllm_runner, model_info: EmbedModelInfo) -> None:
     mteb_test_embed_models(hf_runner, vllm_runner, model_info)
 
 
 @pytest.mark.parametrize("model_info", MODELS)
-def test_embed_models_correctness(hf_runner, vllm_runner,
-                                  model_info: EmbedModelInfo,
-                                  example_prompts) -> None:
-    correctness_test_embed_models(hf_runner, vllm_runner, model_info,
-                                  example_prompts)
+def test_embed_models_correctness(
+    hf_runner, vllm_runner, model_info: EmbedModelInfo, example_prompts
+) -> None:
+    correctness_test_embed_models(hf_runner, vllm_runner, model_info, example_prompts)
diff --git a/tests/models/language/pooling_mteb_test/test_jina.py b/tests/models/language/pooling_mteb_test/test_jina.py
index 0a77a78bb31b..0a712b2542f3 100644
--- a/tests/models/language/pooling_mteb_test/test_jina.py
+++ b/tests/models/language/pooling_mteb_test/test_jina.py
@@ -5,60 +5,68 @@
 import pytest
 
 from tests.models.language.pooling.embed_utils import (
-    check_embeddings_close, correctness_test_embed_models, matryoshka_fy)
-from tests.models.utils import (CLSPoolingEmbedModelInfo,
-                                CLSPoolingRerankModelInfo, EmbedModelInfo,
-                                RerankModelInfo)
+    check_embeddings_close,
+    correctness_test_embed_models,
+    matryoshka_fy,
+)
+from tests.models.utils import (
+    CLSPoolingEmbedModelInfo,
+    CLSPoolingRerankModelInfo,
+    EmbedModelInfo,
+    RerankModelInfo,
+)
 from vllm import PoolingParams
 
 from .mteb_utils import mteb_test_embed_models, mteb_test_rerank_models
 
 EMBEDDING_MODELS = [
-    CLSPoolingEmbedModelInfo("jinaai/jina-embeddings-v3",
-                             mteb_score=0.824413164,
-                             architecture="XLMRobertaModel",
-                             is_matryoshka=True)
+    CLSPoolingEmbedModelInfo(
+        "jinaai/jina-embeddings-v3",
+        mteb_score=0.824413164,
+        architecture="XLMRobertaModel",
+        is_matryoshka=True,
+    )
 ]
 
 RERANK_MODELS = [
     CLSPoolingRerankModelInfo(
         "jinaai/jina-reranker-v2-base-multilingual",
         mteb_score=0.33643,
-        architecture="XLMRobertaForSequenceClassification")
+        architecture="XLMRobertaForSequenceClassification",
+    )
 ]
 
 
 @pytest.mark.parametrize("model_info", EMBEDDING_MODELS)
-def test_embed_models_mteb(hf_runner, vllm_runner,
-                           model_info: EmbedModelInfo) -> None:
-
+def test_embed_models_mteb(hf_runner, vllm_runner, model_info: EmbedModelInfo) -> None:
     def hf_model_callback(model):
         model.encode = partial(model.encode, task="text-matching")
 
-    mteb_test_embed_models(hf_runner,
-                           vllm_runner,
-                           model_info,
-                           hf_model_callback=hf_model_callback)
+    mteb_test_embed_models(
+        hf_runner, vllm_runner, model_info, hf_model_callback=hf_model_callback
+    )
 
 
 @pytest.mark.parametrize("model_info", EMBEDDING_MODELS)
-def test_embed_models_correctness(hf_runner, vllm_runner,
-                                  model_info: EmbedModelInfo,
-                                  example_prompts) -> None:
-
+def test_embed_models_correctness(
+    hf_runner, vllm_runner, model_info: EmbedModelInfo, example_prompts
+) -> None:
     def hf_model_callback(model):
         model.encode = partial(model.encode, task="text-matching")
 
-    correctness_test_embed_models(hf_runner,
-                                  vllm_runner,
-                                  model_info,
-                                  example_prompts,
-                                  hf_model_callback=hf_model_callback)
+    correctness_test_embed_models(
+        hf_runner,
+        vllm_runner,
+        model_info,
+        example_prompts,
+        hf_model_callback=hf_model_callback,
+    )
 
 
 @pytest.mark.parametrize("model_info", RERANK_MODELS)
-def test_rerank_models_mteb(hf_runner, vllm_runner,
-                            model_info: RerankModelInfo) -> None:
+def test_rerank_models_mteb(
+    hf_runner, vllm_runner, model_info: RerankModelInfo
+) -> None:
     mteb_test_rerank_models(hf_runner, vllm_runner, model_info)
 
 
@@ -81,32 +89,32 @@ def test_matryoshka(
     example_prompts = [str(s).strip() for s in example_prompts]
 
     with hf_runner(
-            model_info.name,
-            dtype=dtype,
-            is_sentence_transformer=True,
+        model_info.name,
+        dtype=dtype,
+        is_sentence_transformer=True,
     ) as hf_model:
         hf_outputs = hf_model.encode(example_prompts, task="text-matching")
         hf_outputs = matryoshka_fy(hf_outputs, dimensions)
 
-    with vllm_runner(model_info.name,
-                     runner="pooling",
-                     dtype=dtype,
-                     max_model_len=None) as vllm_model:
+    with vllm_runner(
+        model_info.name, runner="pooling", dtype=dtype, max_model_len=None
+    ) as vllm_model:
         assert vllm_model.llm.llm_engine.model_config.is_matryoshka
 
         matryoshka_dimensions = (
-            vllm_model.llm.llm_engine.model_config.matryoshka_dimensions)
+            vllm_model.llm.llm_engine.model_config.matryoshka_dimensions
+        )
         assert matryoshka_dimensions is not None
 
         if dimensions not in matryoshka_dimensions:
             with pytest.raises(ValueError):
                 vllm_model.embed(
-                    example_prompts,
-                    pooling_params=PoolingParams(dimensions=dimensions))
+                    example_prompts, pooling_params=PoolingParams(dimensions=dimensions)
+                )
         else:
             vllm_outputs = vllm_model.embed(
-                example_prompts,
-                pooling_params=PoolingParams(dimensions=dimensions))
+                example_prompts, pooling_params=PoolingParams(dimensions=dimensions)
+            )
 
             check_embeddings_close(
                 embeddings_0_lst=hf_outputs,
diff --git a/tests/models/language/pooling_mteb_test/test_mxbai_rerank.py b/tests/models/language/pooling_mteb_test/test_mxbai_rerank.py
index 05ebb4ec4d3f..fd04dc199023 100644
--- a/tests/models/language/pooling_mteb_test/test_mxbai_rerank.py
+++ b/tests/models/language/pooling_mteb_test/test_mxbai_rerank.py
@@ -17,46 +17,45 @@
 }
 
 RERANK_MODELS = [
-    LASTPoolingRerankModelInfo("mixedbread-ai/mxbai-rerank-base-v2",
-                               architecture="Qwen2ForSequenceClassification",
-                               hf_overrides=mxbai_rerank_hf_overrides,
-                               mteb_score=0.273,
-                               enable_test=True),
-    LASTPoolingRerankModelInfo("mixedbread-ai/mxbai-rerank-large-v2",
-                               architecture="Qwen2ForSequenceClassification",
-                               hf_overrides=mxbai_rerank_hf_overrides,
-                               enable_test=False)
+    LASTPoolingRerankModelInfo(
+        "mixedbread-ai/mxbai-rerank-base-v2",
+        architecture="Qwen2ForSequenceClassification",
+        hf_overrides=mxbai_rerank_hf_overrides,
+        mteb_score=0.273,
+        enable_test=True,
+    ),
+    LASTPoolingRerankModelInfo(
+        "mixedbread-ai/mxbai-rerank-large-v2",
+        architecture="Qwen2ForSequenceClassification",
+        hf_overrides=mxbai_rerank_hf_overrides,
+        enable_test=False,
+    ),
 ]
 
 
 class MxbaiRerankerHfRunner(HfRunner):
-
-    def __init__(self,
-                 model_name: str,
-                 dtype: str = "auto",
-                 *args: Any,
-                 **kwargs: Any) -> None:
+    def __init__(
+        self, model_name: str, dtype: str = "auto", *args: Any, **kwargs: Any
+    ) -> None:
         from transformers import AutoModelForCausalLM, AutoTokenizer
+
         super().__init__(model_name, dtype, auto_cls=AutoModelForCausalLM)
 
-        self.tokenizer = AutoTokenizer.from_pretrained(model_name,
-                                                       padding_side='left')
+        self.tokenizer = AutoTokenizer.from_pretrained(model_name, padding_side="left")
         self.yes_loc = self.tokenizer.convert_tokens_to_ids("1")
         self.no_loc = self.tokenizer.convert_tokens_to_ids("0")
 
-    def predict(self, prompts: list[list[str]], *args,
-                **kwargs) -> torch.Tensor:
-
+    def predict(self, prompts: list[list[str]], *args, **kwargs) -> torch.Tensor:
         def process_inputs(pairs):
-            inputs = self.tokenizer(pairs,
-                                    padding=False,
-                                    truncation='longest_first',
-                                    return_attention_mask=False)
-            for i, ele in enumerate(inputs['input_ids']):
-                inputs['input_ids'][i] = ele
-            inputs = self.tokenizer.pad(inputs,
-                                        padding=True,
-                                        return_tensors="pt")
+            inputs = self.tokenizer(
+                pairs,
+                padding=False,
+                truncation="longest_first",
+                return_attention_mask=False,
+            )
+            for i, ele in enumerate(inputs["input_ids"]):
+                inputs["input_ids"][i] = ele
+            inputs = self.tokenizer.pad(inputs, padding=True, return_tensors="pt")
             for key in inputs:
                 inputs[key] = inputs[key].to(self.model.device)
             return inputs
diff --git a/tests/models/language/pooling_mteb_test/test_nomic.py b/tests/models/language/pooling_mteb_test/test_nomic.py
index 61512fd0dff1..c54a43052483 100644
--- a/tests/models/language/pooling_mteb_test/test_nomic.py
+++ b/tests/models/language/pooling_mteb_test/test_nomic.py
@@ -3,39 +3,42 @@
 
 import pytest
 
-from tests.models.language.pooling.embed_utils import (
-    correctness_test_embed_models)
+from tests.models.language.pooling.embed_utils import correctness_test_embed_models
 from tests.models.utils import CLSPoolingEmbedModelInfo, EmbedModelInfo
 
 from .mteb_utils import mteb_test_embed_models
 
 MODELS = [
-    CLSPoolingEmbedModelInfo("nomic-ai/nomic-embed-text-v1",
-                             architecture="NomicBertModel",
-                             mteb_score=0.737568559,
-                             enable_test=True),
-    CLSPoolingEmbedModelInfo("nomic-ai/nomic-embed-text-v1.5",
-                             architecture="NomicBertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("nomic-ai/CodeRankEmbed",
-                             architecture="NomicBertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("nomic-ai/nomic-embed-text-v2-moe",
-                             architecture="NomicBertModel",
-                             mteb_score=0.715488912,
-                             enable_test=True)
+    CLSPoolingEmbedModelInfo(
+        "nomic-ai/nomic-embed-text-v1",
+        architecture="NomicBertModel",
+        mteb_score=0.737568559,
+        enable_test=True,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "nomic-ai/nomic-embed-text-v1.5",
+        architecture="NomicBertModel",
+        enable_test=False,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "nomic-ai/CodeRankEmbed", architecture="NomicBertModel", enable_test=False
+    ),
+    CLSPoolingEmbedModelInfo(
+        "nomic-ai/nomic-embed-text-v2-moe",
+        architecture="NomicBertModel",
+        mteb_score=0.715488912,
+        enable_test=True,
+    ),
 ]
 
 
 @pytest.mark.parametrize("model_info", MODELS)
-def test_embed_models_mteb(hf_runner, vllm_runner,
-                           model_info: EmbedModelInfo) -> None:
+def test_embed_models_mteb(hf_runner, vllm_runner, model_info: EmbedModelInfo) -> None:
     mteb_test_embed_models(hf_runner, vllm_runner, model_info)
 
 
 @pytest.mark.parametrize("model_info", MODELS)
-def test_embed_models_correctness(hf_runner, vllm_runner,
-                                  model_info: EmbedModelInfo,
-                                  example_prompts) -> None:
-    correctness_test_embed_models(hf_runner, vllm_runner, model_info,
-                                  example_prompts)
+def test_embed_models_correctness(
+    hf_runner, vllm_runner, model_info: EmbedModelInfo, example_prompts
+) -> None:
+    correctness_test_embed_models(hf_runner, vllm_runner, model_info, example_prompts)
diff --git a/tests/models/language/pooling_mteb_test/test_qwen3_reranker.py b/tests/models/language/pooling_mteb_test/test_qwen3_reranker.py
index 65403081dc0f..00e99f44cfdb 100644
--- a/tests/models/language/pooling_mteb_test/test_qwen3_reranker.py
+++ b/tests/models/language/pooling_mteb_test/test_qwen3_reranker.py
@@ -18,46 +18,45 @@
 }
 
 RERANK_MODELS = [
-    LASTPoolingRerankModelInfo("Qwen/Qwen3-Reranker-0.6B",
-                               architecture="Qwen3ForSequenceClassification",
-                               mteb_score=0.25736,
-                               hf_overrides=qwen3_reranker_hf_overrides,
-                               enable_test=True),
-    LASTPoolingRerankModelInfo("Qwen/Qwen3-Reranker-4B",
-                               architecture="Qwen3ForSequenceClassification",
-                               hf_overrides=qwen3_reranker_hf_overrides,
-                               enable_test=False)
+    LASTPoolingRerankModelInfo(
+        "Qwen/Qwen3-Reranker-0.6B",
+        architecture="Qwen3ForSequenceClassification",
+        mteb_score=0.25736,
+        hf_overrides=qwen3_reranker_hf_overrides,
+        enable_test=True,
+    ),
+    LASTPoolingRerankModelInfo(
+        "Qwen/Qwen3-Reranker-4B",
+        architecture="Qwen3ForSequenceClassification",
+        hf_overrides=qwen3_reranker_hf_overrides,
+        enable_test=False,
+    ),
 ]
 
 
 class Qwen3RerankerHfRunner(HfRunner):
-
-    def __init__(self,
-                 model_name: str,
-                 dtype: str = "auto",
-                 *args: Any,
-                 **kwargs: Any) -> None:
+    def __init__(
+        self, model_name: str, dtype: str = "auto", *args: Any, **kwargs: Any
+    ) -> None:
         from transformers import AutoModelForCausalLM, AutoTokenizer
+
         super().__init__(model_name, dtype, auto_cls=AutoModelForCausalLM)
 
-        self.tokenizer = AutoTokenizer.from_pretrained(model_name,
-                                                       padding_side='left')
+        self.tokenizer = AutoTokenizer.from_pretrained(model_name, padding_side="left")
         self.token_false_id = self.tokenizer.convert_tokens_to_ids("no")
         self.token_true_id = self.tokenizer.convert_tokens_to_ids("yes")
 
-    def predict(self, prompts: list[list[str]], *args,
-                **kwargs) -> torch.Tensor:
-
+    def predict(self, prompts: list[list[str]], *args, **kwargs) -> torch.Tensor:
         def process_inputs(pairs):
-            inputs = self.tokenizer(pairs,
-                                    padding=False,
-                                    truncation='longest_first',
-                                    return_attention_mask=False)
-            for i, ele in enumerate(inputs['input_ids']):
-                inputs['input_ids'][i] = ele
-            inputs = self.tokenizer.pad(inputs,
-                                        padding=True,
-                                        return_tensors="pt")
+            inputs = self.tokenizer(
+                pairs,
+                padding=False,
+                truncation="longest_first",
+                return_attention_mask=False,
+            )
+            for i, ele in enumerate(inputs["input_ids"]):
+                inputs["input_ids"][i] = ele
+            inputs = self.tokenizer.pad(inputs, padding=True, return_tensors="pt")
             for key in inputs:
                 inputs[key] = inputs[key].to(self.model.device)
             return inputs
@@ -82,20 +81,18 @@ def compute_logits(inputs):
 
 @pytest.mark.parametrize("model_info", RERANK_MODELS)
 def test_rerank_models_mteb(vllm_runner, model_info: RerankModelInfo) -> None:
-
     mteb_test_rerank_models(Qwen3RerankerHfRunner, vllm_runner, model_info)
 
 
 @pytest.mark.parametrize("model_info", RERANK_MODELS)
 @multi_gpu_test(num_gpus=2)
-def test_rerank_models_mteb_tp(vllm_runner,
-                               model_info: RerankModelInfo) -> None:
-
+def test_rerank_models_mteb_tp(vllm_runner, model_info: RerankModelInfo) -> None:
     assert model_info.architecture == "Qwen3ForSequenceClassification"
 
     vllm_extra_kwargs: dict[str, Any] = {
         "tensor_parallel_size": 2,
     }
 
-    mteb_test_rerank_models(Qwen3RerankerHfRunner, vllm_runner, model_info,
-                            vllm_extra_kwargs)
+    mteb_test_rerank_models(
+        Qwen3RerankerHfRunner, vllm_runner, model_info, vllm_extra_kwargs
+    )
diff --git a/tests/models/language/pooling_mteb_test/test_snowflake_arctic_embed.py b/tests/models/language/pooling_mteb_test/test_snowflake_arctic_embed.py
index 91bad2c4e42f..3c30628aeaa4 100644
--- a/tests/models/language/pooling_mteb_test/test_snowflake_arctic_embed.py
+++ b/tests/models/language/pooling_mteb_test/test_snowflake_arctic_embed.py
@@ -3,62 +3,75 @@
 
 import pytest
 
-from tests.models.language.pooling.embed_utils import (
-    correctness_test_embed_models)
+from tests.models.language.pooling.embed_utils import correctness_test_embed_models
 from tests.models.utils import CLSPoolingEmbedModelInfo, EmbedModelInfo
 
 from .mteb_utils import mteb_test_embed_models
 
 MODELS = [
-    CLSPoolingEmbedModelInfo("Snowflake/snowflake-arctic-embed-xs",
-                             is_matryoshka=False,
-                             architecture="BertModel",
-                             mteb_score=0.714927797,
-                             enable_test=True),
-    CLSPoolingEmbedModelInfo("Snowflake/snowflake-arctic-embed-s",
-                             is_matryoshka=False,
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("Snowflake/snowflake-arctic-embed-m",
-                             is_matryoshka=False,
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("Snowflake/snowflake-arctic-embed-m-long",
-                             is_matryoshka=False,
-                             architecture="NomicBertModel",
-                             mteb_score=0.681146831,
-                             enable_test=True),
-    CLSPoolingEmbedModelInfo("Snowflake/snowflake-arctic-embed-l",
-                             is_matryoshka=False,
-                             architecture="BertModel",
-                             enable_test=False),
-    CLSPoolingEmbedModelInfo("Snowflake/snowflake-arctic-embed-m-v1.5",
-                             is_matryoshka=True,
-                             architecture="BertModel",
-                             mteb_score=0.649088363,
-                             enable_test=True),
-    CLSPoolingEmbedModelInfo("Snowflake/snowflake-arctic-embed-l-v2.0",
-                             is_matryoshka=True,
-                             architecture="XLMRobertaModel",
-                             mteb_score=0.712258299,
-                             enable_test=True),
-    CLSPoolingEmbedModelInfo("Snowflake/snowflake-arctic-embed-m-v2.0",
-                             is_matryoshka=True,
-                             architecture="GteModel",
-                             mteb_score=0.706622444,
-                             enable_test=True),
+    CLSPoolingEmbedModelInfo(
+        "Snowflake/snowflake-arctic-embed-xs",
+        is_matryoshka=False,
+        architecture="BertModel",
+        mteb_score=0.714927797,
+        enable_test=True,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "Snowflake/snowflake-arctic-embed-s",
+        is_matryoshka=False,
+        architecture="BertModel",
+        enable_test=False,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "Snowflake/snowflake-arctic-embed-m",
+        is_matryoshka=False,
+        architecture="BertModel",
+        enable_test=False,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "Snowflake/snowflake-arctic-embed-m-long",
+        is_matryoshka=False,
+        architecture="NomicBertModel",
+        mteb_score=0.681146831,
+        enable_test=True,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "Snowflake/snowflake-arctic-embed-l",
+        is_matryoshka=False,
+        architecture="BertModel",
+        enable_test=False,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "Snowflake/snowflake-arctic-embed-m-v1.5",
+        is_matryoshka=True,
+        architecture="BertModel",
+        mteb_score=0.649088363,
+        enable_test=True,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "Snowflake/snowflake-arctic-embed-l-v2.0",
+        is_matryoshka=True,
+        architecture="XLMRobertaModel",
+        mteb_score=0.712258299,
+        enable_test=True,
+    ),
+    CLSPoolingEmbedModelInfo(
+        "Snowflake/snowflake-arctic-embed-m-v2.0",
+        is_matryoshka=True,
+        architecture="GteModel",
+        mteb_score=0.706622444,
+        enable_test=True,
+    ),
 ]
 
 
 @pytest.mark.parametrize("model_info", MODELS)
-def test_embed_models_mteb(hf_runner, vllm_runner,
-                           model_info: EmbedModelInfo) -> None:
+def test_embed_models_mteb(hf_runner, vllm_runner, model_info: EmbedModelInfo) -> None:
     mteb_test_embed_models(hf_runner, vllm_runner, model_info)
 
 
 @pytest.mark.parametrize("model_info", MODELS)
-def test_embed_models_correctness(hf_runner, vllm_runner,
-                                  model_info: EmbedModelInfo,
-                                  example_prompts) -> None:
-    correctness_test_embed_models(hf_runner, vllm_runner, model_info,
-                                  example_prompts)
+def test_embed_models_correctness(
+    hf_runner, vllm_runner, model_info: EmbedModelInfo, example_prompts
+) -> None:
+    correctness_test_embed_models(hf_runner, vllm_runner, model_info, example_prompts)
diff --git a/tests/models/language/pooling_mteb_test/test_st_projector.py b/tests/models/language/pooling_mteb_test/test_st_projector.py
index bd493e7e2ba0..91b1ef828d0d 100644
--- a/tests/models/language/pooling_mteb_test/test_st_projector.py
+++ b/tests/models/language/pooling_mteb_test/test_st_projector.py
@@ -2,8 +2,11 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 import pytest
 
-from tests.models.utils import (CLSPoolingEmbedModelInfo, EmbedModelInfo,
-                                LASTPoolingEmbedModelInfo)
+from tests.models.utils import (
+    CLSPoolingEmbedModelInfo,
+    EmbedModelInfo,
+    LASTPoolingEmbedModelInfo,
+)
 
 from .mteb_utils import mteb_test_embed_models
 
@@ -15,15 +18,15 @@
         mteb_score=0.688611955,
         enable_test=True,
     ),
-    LASTPoolingEmbedModelInfo("google/embeddinggemma-300m",
-                              architecture="Gemma3TextModel",
-                              mteb_score=0.7473819294684156,
-                              enable_test=True)
+    LASTPoolingEmbedModelInfo(
+        "google/embeddinggemma-300m",
+        architecture="Gemma3TextModel",
+        mteb_score=0.7473819294684156,
+        enable_test=True,
+    ),
 ]
 
 
 @pytest.mark.parametrize("model_info", ST_PROJECTOR_MODELS)
-def test_embed_models_mteb(hf_runner, vllm_runner,
-                           model_info: EmbedModelInfo) -> None:
-
+def test_embed_models_mteb(hf_runner, vllm_runner, model_info: EmbedModelInfo) -> None:
     mteb_test_embed_models(hf_runner, vllm_runner, model_info)
diff --git a/tests/models/multimodal/generation/test_common.py b/tests/models/multimodal/generation/test_common.py
index c378ef670f91..143d60fbf963 100644
--- a/tests/models/multimodal/generation/test_common.py
+++ b/tests/models/multimodal/generation/test_common.py
@@ -3,27 +3,40 @@
 """Common tests for testing .generate() functionality for single / multiple
 image, embedding, and video support for different VLMs in vLLM.
 """
+
 import math
 import os
 from collections import defaultdict
 from pathlib import PosixPath
 
 import pytest
-from transformers import (AutoModel, AutoModelForImageTextToText,
-                          AutoModelForTextToWaveform)
+from transformers import (
+    AutoModel,
+    AutoModelForImageTextToText,
+    AutoModelForTextToWaveform,
+)
 
 from vllm.platforms import current_platform
 from vllm.utils import identity
 
-from ....conftest import (IMAGE_ASSETS, AudioTestAssets, HfRunner,
-                          ImageTestAssets, VideoTestAssets, VllmRunner)
-from ....utils import (create_new_process_for_each_test, large_gpu_mark,
-                       multi_gpu_marks)
+from ....conftest import (
+    IMAGE_ASSETS,
+    AudioTestAssets,
+    HfRunner,
+    ImageTestAssets,
+    VideoTestAssets,
+    VllmRunner,
+)
+from ....utils import create_new_process_for_each_test, large_gpu_mark, multi_gpu_marks
 from ...utils import check_outputs_equal
 from .vlm_utils import custom_inputs, model_utils, runners
 from .vlm_utils.case_filtering import get_parametrized_options
-from .vlm_utils.types import (CustomTestOptions, ExpandableVLMTestArgs,
-                              VLMTestInfo, VLMTestType)
+from .vlm_utils.types import (
+    CustomTestOptions,
+    ExpandableVLMTestArgs,
+    VLMTestInfo,
+    VLMTestType,
+)
 
 # This hack is needed for phi3v & paligemma models
 # ROCm Triton FA can run into shared memory issues with these models,
@@ -828,7 +841,7 @@ def _mark_splits(
     new_test_settings = dict[str, VLMTestInfo]()
 
     for i in range(num_groups):
-        models_in_group = models[i * split_size:(i + 1) * split_size]
+        models_in_group = models[i * split_size : (i + 1) * split_size]
 
         for model in models_in_group:
             for info in test_infos_by_model[model]:
@@ -859,7 +872,8 @@ def _mark_splits(
         VLM_TEST_SETTINGS,
         test_type=VLMTestType.IMAGE,
         create_new_process_for_each_test=False,
-    ))
+    ),
+)
 def test_single_image_models(
     tmp_path: PosixPath,
     model_type: str,
@@ -885,7 +899,8 @@ def test_single_image_models(
         VLM_TEST_SETTINGS,
         test_type=VLMTestType.MULTI_IMAGE,
         create_new_process_for_each_test=False,
-    ))
+    ),
+)
 def test_multi_image_models(
     tmp_path: PosixPath,
     model_type: str,
@@ -911,7 +926,8 @@ def test_multi_image_models(
         VLM_TEST_SETTINGS,
         test_type=VLMTestType.EMBEDDING,
         create_new_process_for_each_test=False,
-    ))
+    ),
+)
 def test_image_embedding_models(
     model_type: str,
     test_case: ExpandableVLMTestArgs,
@@ -935,7 +951,8 @@ def test_image_embedding_models(
         VLM_TEST_SETTINGS,
         test_type=VLMTestType.VIDEO,
         create_new_process_for_each_test=False,
-    ))
+    ),
+)
 def test_video_models(
     model_type: str,
     test_case: ExpandableVLMTestArgs,
@@ -959,7 +976,8 @@ def test_video_models(
         VLM_TEST_SETTINGS,
         test_type=VLMTestType.AUDIO,
         create_new_process_for_each_test=False,
-    ))
+    ),
+)
 def test_audio_models(
     model_type: str,
     test_case: ExpandableVLMTestArgs,
@@ -983,7 +1001,8 @@ def test_audio_models(
         VLM_TEST_SETTINGS,
         test_type=VLMTestType.CUSTOM_INPUTS,
         create_new_process_for_each_test=False,
-    ))
+    ),
+)
 def test_custom_inputs_models(
     model_type: str,
     test_case: ExpandableVLMTestArgs,
@@ -1006,7 +1025,8 @@ def test_custom_inputs_models(
         VLM_TEST_SETTINGS,
         test_type=VLMTestType.IMAGE,
         create_new_process_for_each_test=True,
-    ))
+    ),
+)
 @create_new_process_for_each_test()
 def test_single_image_models_heavy(
     tmp_path: PosixPath,
@@ -1033,7 +1053,8 @@ def test_single_image_models_heavy(
         VLM_TEST_SETTINGS,
         test_type=VLMTestType.MULTI_IMAGE,
         create_new_process_for_each_test=True,
-    ))
+    ),
+)
 @create_new_process_for_each_test()
 def test_multi_image_models_heavy(
     tmp_path: PosixPath,
@@ -1060,7 +1081,8 @@ def test_multi_image_models_heavy(
         VLM_TEST_SETTINGS,
         test_type=VLMTestType.EMBEDDING,
         create_new_process_for_each_test=True,
-    ))
+    ),
+)
 @create_new_process_for_each_test()
 def test_image_embedding_models_heavy(
     model_type: str,
@@ -1085,7 +1107,8 @@ def test_image_embedding_models_heavy(
         VLM_TEST_SETTINGS,
         test_type=VLMTestType.VIDEO,
         create_new_process_for_each_test=True,
-    ))
+    ),
+)
 def test_video_models_heavy(
     model_type: str,
     test_case: ExpandableVLMTestArgs,
@@ -1109,7 +1132,8 @@ def test_video_models_heavy(
         VLM_TEST_SETTINGS,
         test_type=VLMTestType.AUDIO,
         create_new_process_for_each_test=True,
-    ))
+    ),
+)
 def test_audio_models_heavy(
     model_type: str,
     test_case: ExpandableVLMTestArgs,
@@ -1133,7 +1157,8 @@ def test_audio_models_heavy(
         VLM_TEST_SETTINGS,
         test_type=VLMTestType.CUSTOM_INPUTS,
         create_new_process_for_each_test=True,
-    ))
+    ),
+)
 @create_new_process_for_each_test()
 def test_custom_inputs_models_heavy(
     model_type: str,
diff --git a/tests/models/multimodal/generation/test_granite_speech.py b/tests/models/multimodal/generation/test_granite_speech.py
index c1305e0ae31c..ef08b1916aa5 100644
--- a/tests/models/multimodal/generation/test_granite_speech.py
+++ b/tests/models/multimodal/generation/test_granite_speech.py
@@ -10,8 +10,7 @@
 from vllm.logprobs import SampleLogprobs
 from vllm.lora.request import LoRARequest
 
-from ....conftest import (AudioTestAssets, HfRunner, PromptAudioInput,
-                          VllmRunner)
+from ....conftest import AudioTestAssets, HfRunner, PromptAudioInput, VllmRunner
 from ...registry import HF_EXAMPLE_MODELS
 from ...utils import check_logprobs_close
 
@@ -64,50 +63,49 @@ def run_test(
     # will hurt multiprocessing backend with fork method (the default method).
     # max_model_len should be greater than image_feature_size
     with vllm_runner(
-            model,
-            runner="generate",
-            max_model_len=max_model_len,
-            max_num_seqs=1,
-            dtype=dtype,
-            limit_mm_per_prompt={"audio": 1},
-            tensor_parallel_size=tensor_parallel_size,
-            distributed_executor_backend=distributed_executor_backend,
-            enable_lora=True,
-            max_lora_rank=64,
-            enforce_eager=True,
+        model,
+        runner="generate",
+        max_model_len=max_model_len,
+        max_num_seqs=1,
+        dtype=dtype,
+        limit_mm_per_prompt={"audio": 1},
+        tensor_parallel_size=tensor_parallel_size,
+        distributed_executor_backend=distributed_executor_backend,
+        enable_lora=True,
+        max_lora_rank=64,
+        enforce_eager=True,
     ) as vllm_model:
         lora_request = LoRARequest("audio", 1, audio_lora_path)
         vllm_outputs_per_case = [
-            vllm_model.generate_greedy_logprobs(prompts,
-                                                max_tokens,
-                                                num_logprobs=num_logprobs,
-                                                audios=audios,
-                                                lora_request=lora_request)
+            vllm_model.generate_greedy_logprobs(
+                prompts,
+                max_tokens,
+                num_logprobs=num_logprobs,
+                audios=audios,
+                lora_request=lora_request,
+            )
             for prompts, audios in inputs
         ]
 
-    with hf_runner(model, dtype=dtype,
-                   auto_cls=AutoModelForSpeechSeq2Seq) as hf_model:
-
+    with hf_runner(model, dtype=dtype, auto_cls=AutoModelForSpeechSeq2Seq) as hf_model:
         hf_processor = hf_model.processor
         eos_token_id = hf_processor.tokenizer.eos_token_id
 
         hf_outputs_per_case = [
-            hf_model.generate_greedy_logprobs_limit(prompts,
-                                                    max_tokens,
-                                                    num_logprobs=num_logprobs,
-                                                    audios=[audios],
-                                                    eos_token_id=eos_token_id)
+            hf_model.generate_greedy_logprobs_limit(
+                prompts,
+                max_tokens,
+                num_logprobs=num_logprobs,
+                audios=[audios],
+                eos_token_id=eos_token_id,
+            )
             for prompts, audios in inputs
         ]
 
-    for hf_outputs, vllm_outputs in zip(hf_outputs_per_case,
-                                        vllm_outputs_per_case):
+    for hf_outputs, vllm_outputs in zip(hf_outputs_per_case, vllm_outputs_per_case):
         check_logprobs_close(
             outputs_0_lst=hf_outputs,
-            outputs_1_lst=[
-                vllm_to_hf_output(output) for output in vllm_outputs
-            ],
+            outputs_1_lst=[vllm_to_hf_output(output) for output in vllm_outputs],
             name_0="hf",
             name_1="vllm",
         )
@@ -118,9 +116,16 @@ def run_test(
 @pytest.mark.parametrize("max_model_len", [2048])
 @pytest.mark.parametrize("max_tokens", [128])
 @pytest.mark.parametrize("num_logprobs", [10])
-def test_models(hf_runner, vllm_runner, model: str,
-                audio_assets: AudioTestAssets, dtype: str, max_model_len: int,
-                max_tokens: int, num_logprobs: int) -> None:
+def test_models(
+    hf_runner,
+    vllm_runner,
+    model: str,
+    audio_assets: AudioTestAssets,
+    dtype: str,
+    max_model_len: int,
+    max_tokens: int,
+    num_logprobs: int,
+) -> None:
     model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
     model_info.check_available_online(on_fail="skip")
     model_info.check_transformers_version(on_fail="skip")
diff --git a/tests/models/multimodal/generation/test_interleaved.py b/tests/models/multimodal/generation/test_interleaved.py
index 1ef56af33a09..a773db19825e 100644
--- a/tests/models/multimodal/generation/test_interleaved.py
+++ b/tests/models/multimodal/generation/test_interleaved.py
@@ -28,8 +28,7 @@ def test_models(vllm_runner, model, dtype: str, max_tokens: int) -> None:
     give the same result.
     """
 
-    image_cherry = convert_image_mode(
-        ImageAsset("cherry_blossom").pil_image, "RGB")
+    image_cherry = convert_image_mode(ImageAsset("cherry_blossom").pil_image, "RGB")
     image_stop = convert_image_mode(ImageAsset("stop_sign").pil_image, "RGB")
     images = [image_cherry, image_stop]
     video = VideoAsset(name="baby_reading", num_frames=16).np_ndarrays
@@ -47,29 +46,30 @@ def test_models(vllm_runner, model, dtype: str, max_tokens: int) -> None:
         ),
     ]
 
-    with vllm_runner(model,
-                     runner="generate",
-                     dtype=dtype,
-                     limit_mm_per_prompt={"image": 2},
-                     max_model_len=32768,
-                     max_num_seqs=2,
-                     tensor_parallel_size=1,
-                     enforce_eager=True) as vllm_model:
+    with vllm_runner(
+        model,
+        runner="generate",
+        dtype=dtype,
+        limit_mm_per_prompt={"image": 2},
+        max_model_len=32768,
+        max_num_seqs=2,
+        tensor_parallel_size=1,
+        enforce_eager=True,
+    ) as vllm_model:
         vllm_outputs_per_case = [
-            vllm_model.generate_greedy(prompts,
-                                       max_tokens,
-                                       images=images,
-                                       videos=videos)
+            vllm_model.generate_greedy(
+                prompts, max_tokens, images=images, videos=videos
+            )
             for prompts, images, videos in inputs
         ]
 
     all_results = [output[0][1] for output in vllm_outputs_per_case]
-    outputs = [(total_str, total_str.find("assistant\n") + len("assistant\n"))
-               for total_str in all_results]
-    prompt_lengths = [prompt_len for _, prompt_len in outputs]
-    generated_strs = [
-        total_str[prompt_len:] for total_str, prompt_len in outputs
+    outputs = [
+        (total_str, total_str.find("assistant\n") + len("assistant\n"))
+        for total_str in all_results
     ]
+    prompt_lengths = [prompt_len for _, prompt_len in outputs]
+    generated_strs = [total_str[prompt_len:] for total_str, prompt_len in outputs]
     interleaved_prompt_len, noninterleaved_prompt_len = prompt_lengths
     interleaved_output_str, noninterleaved_output_str = generated_strs
 
diff --git a/tests/models/multimodal/generation/test_maverick.py b/tests/models/multimodal/generation/test_maverick.py
index bacc9ef94f49..2f9b09f4026c 100644
--- a/tests/models/multimodal/generation/test_maverick.py
+++ b/tests/models/multimodal/generation/test_maverick.py
@@ -18,13 +18,11 @@
 import pytest
 import torch
 from safetensors.torch import save_file
-from transformers import (AutoConfig, AutoProcessor, AutoTokenizer,
-                          GenerationConfig)
+from transformers import AutoConfig, AutoProcessor, AutoTokenizer, GenerationConfig
 
 from vllm import LLM, SamplingParams
 from vllm.v1.executor.abstract import Executor
-from vllm.v1.kv_cache_interface import (ChunkedLocalAttentionSpec,
-                                        FullAttentionSpec)
+from vllm.v1.kv_cache_interface import ChunkedLocalAttentionSpec, FullAttentionSpec
 
 from ....utils import multi_gpu_test
 
@@ -93,8 +91,7 @@ def get_rope_layers_config(model_path: str) -> list[int]:
 
 
 def create_reduced_maverick_model(
-    original_model_name:
-    str = "meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8",
+    original_model_name: str = "meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8",
     output_dir: str = "/tmp/reduced_maverick",
     text_layers: int = 4,
     num_experts: int = 4,
@@ -118,7 +115,8 @@ def create_reduced_maverick_model(
 
     print(
         f"Creating reduced Maverick model with {text_layers} text layers and "
-        f"{vision_layers} vision layers...")
+        f"{vision_layers} vision layers..."
+    )
 
     # Create output directory
     output_path = Path(output_dir)
@@ -126,19 +124,23 @@ def create_reduced_maverick_model(
         if force_recreate:
             shutil.rmtree(output_path)
         else:
-            print(f"Output directory {output_dir} already exists. "
-                  "Use --force-recreate to overwrite.")
+            print(
+                f"Output directory {output_dir} already exists. "
+                "Use --force-recreate to overwrite."
+            )
             return str(output_path)
 
     output_path.mkdir(parents=True, exist_ok=True)
 
     try:
         print("Loading original model configuration...")
-        original_config = AutoConfig.from_pretrained(original_model_name,
-                                                     trust_remote_code=True)
+        original_config = AutoConfig.from_pretrained(
+            original_model_name, trust_remote_code=True
+        )
         print("Creating reduced configuration...")
-        reduced_config = create_reduced_config(original_config, text_layers,
-                                               num_experts, vision_layers)
+        reduced_config = create_reduced_config(
+            original_config, text_layers, num_experts, vision_layers
+        )
 
         config_path = output_path / "config.json"
         with open(config_path, "w") as f:
@@ -149,8 +151,7 @@ def create_reduced_maverick_model(
         copy_tokenizer_files(original_model_name, output_path)
 
         print("Creating reduced safetensors files...")
-        create_reduced_safetensors(original_config, reduced_config,
-                                   output_path)
+        create_reduced_safetensors(original_config, reduced_config, output_path)
 
         print("Creating preprocessor config...")
         create_preprocessor_config(original_config, output_path)
@@ -173,9 +174,9 @@ def create_reduced_maverick_model(
         raise
 
 
-def create_reduced_config(original_config: Any, text_layers: int,
-                          num_experts: int,
-                          vision_layers: int) -> dict[str, Any]:
+def create_reduced_config(
+    original_config: Any, text_layers: int, num_experts: int, vision_layers: int
+) -> dict[str, Any]:
     """Create a reduced configuration based on the original."""
 
     # Convert config to dictionary
@@ -185,23 +186,18 @@ def create_reduced_config(original_config: Any, text_layers: int,
     if "text_config" in config_dict:
         original_text_layers = config_dict["text_config"]["num_hidden_layers"]
         config_dict["text_config"]["num_hidden_layers"] = text_layers
-        print(
-            f"Reduced text layers from {original_text_layers} to {text_layers}"
-        )
+        print(f"Reduced text layers from {original_text_layers} to {text_layers}")
 
         original_num_experts = config_dict["text_config"]["num_local_experts"]
         config_dict["text_config"]["num_local_experts"] = num_experts
-        print(
-            f"Reduced num experts from {original_num_experts} to {num_experts}"
-        )
+        print(f"Reduced num experts from {original_num_experts} to {num_experts}")
 
         hidden_dim_divisor = 4
 
         original_hidden_size = config_dict["text_config"]["hidden_size"]
         new_hidden_size = original_hidden_size // hidden_dim_divisor
         config_dict["text_config"]["hidden_size"] = new_hidden_size
-        print(f"Reduced hidden size from {original_hidden_size} to "
-              f"{new_hidden_size}")
+        print(f"Reduced hidden size from {original_hidden_size} to {new_hidden_size}")
 
         original_head_dim = config_dict["text_config"]["head_dim"]
         new_head_dim = original_head_dim // hidden_dim_divisor
@@ -210,15 +206,12 @@ def create_reduced_config(original_config: Any, text_layers: int,
 
     # Reduce vision layers
     if "vision_config" in config_dict:
-        original_vision_layers = config_dict["vision_config"][
-            "num_hidden_layers"]
+        original_vision_layers = config_dict["vision_config"]["num_hidden_layers"]
         config_dict["vision_config"]["num_hidden_layers"] = vision_layers
-        print(f"Reduced vision layers from {original_vision_layers} "
-              f"to {vision_layers}")
+        print(f"Reduced vision layers from {original_vision_layers} to {vision_layers}")
 
     # Update model name to indicate it's a reduced version
-    config_dict["_name_or_path"] = (
-        f"reduced_maverick_{text_layers}t_{vision_layers}v")
+    config_dict["_name_or_path"] = f"reduced_maverick_{text_layers}t_{vision_layers}v"
 
     return config_dict
 
@@ -227,16 +220,16 @@ def copy_tokenizer_files(original_model_name: str, output_path: Path) -> None:
     """Copy tokenizer files from the original model."""
 
     try:
-        tokenizer = AutoTokenizer.from_pretrained(original_model_name,
-                                                  trust_remote_code=True)
+        tokenizer = AutoTokenizer.from_pretrained(
+            original_model_name, trust_remote_code=True
+        )
         tokenizer.save_pretrained(output_path)
         print("Tokenizer files copied successfully")
     except Exception as e:
         print(f"Warning: Could not copy tokenizer files: {e}")
 
 
-def create_preprocessor_config(original_config: Any,
-                               output_path: Path) -> None:
+def create_preprocessor_config(original_config: Any, output_path: Path) -> None:
     """Create preprocessor_config.json for multimodal model."""
 
     # Try to load the original preprocessor config
@@ -254,9 +247,9 @@ def create_preprocessor_config(original_config: Any,
         raise
 
 
-def create_reduced_safetensors(original_config: Any, reduced_config: dict[str,
-                                                                          Any],
-                               output_path: Path) -> None:
+def create_reduced_safetensors(
+    original_config: Any, reduced_config: dict[str, Any], output_path: Path
+) -> None:
     """Create safetensors files with weights for the reduced model."""
 
     print("Generating synthetic weights for reduced model...")
@@ -279,8 +272,7 @@ def create_reduced_safetensors(original_config: Any, reduced_config: dict[str,
     save_weights_to_safetensors(weights, output_path)
 
 
-def create_text_model_weights(
-        text_config: dict[str, Any]) -> dict[str, torch.Tensor]:
+def create_text_model_weights(text_config: dict[str, Any]) -> dict[str, torch.Tensor]:
     """Create synthetic weights for the text model with MoE structure."""
 
     weights = {}
@@ -291,19 +283,18 @@ def create_text_model_weights(
     intermediate_size_mlp = text_config["intermediate_size_mlp"]
     num_layers = text_config["num_hidden_layers"]
     num_attention_heads = text_config["num_attention_heads"]
-    num_key_value_heads = text_config.get("num_key_value_heads",
-                                          num_attention_heads)
+    num_key_value_heads = text_config.get("num_key_value_heads", num_attention_heads)
 
     # MoE specific parameters
     num_experts = text_config.get("num_local_experts")
-    assert (num_experts
-            is not None), "num_local_experts must be specified for MoE"
+    assert num_experts is not None, "num_local_experts must be specified for MoE"
 
     head_dim = hidden_size // num_attention_heads
 
     # Embedding layers
     weights["language_model.model.embed_tokens.weight"] = torch.randn(
-        vocab_size, hidden_size, dtype=torch.float16)
+        vocab_size, hidden_size, dtype=torch.float16
+    )
 
     # Transformer layers
     for layer_idx in range(num_layers):
@@ -312,95 +303,105 @@ def create_text_model_weights(
 
         # Self-attention weights (separate q, k, v projections)
         weights[f"{layer_prefix}.self_attn.q_proj.weight"] = torch.randn(
-            hidden_size, num_attention_heads * head_dim, dtype=torch.bfloat16)
+            hidden_size, num_attention_heads * head_dim, dtype=torch.bfloat16
+        )
         weights[f"{layer_prefix}.self_attn.k_proj.weight"] = torch.randn(
-            hidden_size, num_key_value_heads * head_dim, dtype=torch.bfloat16)
+            hidden_size, num_key_value_heads * head_dim, dtype=torch.bfloat16
+        )
         weights[f"{layer_prefix}.self_attn.v_proj.weight"] = torch.randn(
-            num_key_value_heads * head_dim, hidden_size, dtype=torch.bfloat16)
+            num_key_value_heads * head_dim, hidden_size, dtype=torch.bfloat16
+        )
         weights[f"{layer_prefix}.self_attn.o_proj.weight"] = torch.randn(
-            hidden_size, num_attention_heads * head_dim, dtype=torch.bfloat16)
+            hidden_size, num_attention_heads * head_dim, dtype=torch.bfloat16
+        )
         print("Self-attention weights created.")
 
         # Feed-forward weights - MoE pattern based on interleave_moe_layer_step
         # For interleave_moe_layer_step=2: layers 1,3,5,... are MoE, layers
         # 0,2,4,... are dense
         interleave_step = text_config.get("interleave_moe_layer_step", 1)
-        is_moe_layer = (interleave_step > 0
-                        and (layer_idx + 1) % interleave_step == 0)
+        is_moe_layer = interleave_step > 0 and (layer_idx + 1) % interleave_step == 0
 
         if is_moe_layer:
             # MoE layer structure
             # 1. Router weights
-            weights[
-                f"{layer_prefix}.feed_forward.router.weight"] = torch.randn(
-                    num_experts, hidden_size, dtype=torch.float16)
+            weights[f"{layer_prefix}.feed_forward.router.weight"] = torch.randn(
+                num_experts, hidden_size, dtype=torch.float16
+            )
 
             # 2. Individual expert weights (not fused)
             for expert_idx in range(num_experts):
-                expert_prefix = (
-                    f"{layer_prefix}.feed_forward.experts.{expert_idx}")
+                expert_prefix = f"{layer_prefix}.feed_forward.experts.{expert_idx}"
 
                 weights[f"{expert_prefix}.gate_proj.weight"] = torch.randn(
-                    intermediate_size, hidden_size, dtype=torch.bfloat16)
+                    intermediate_size, hidden_size, dtype=torch.bfloat16
+                )
                 weights[f"{expert_prefix}.up_proj.weight"] = torch.randn(
-                    intermediate_size, hidden_size, dtype=torch.bfloat16)
+                    intermediate_size, hidden_size, dtype=torch.bfloat16
+                )
                 weights[f"{expert_prefix}.down_proj.weight"] = torch.randn(
-                    hidden_size, intermediate_size, dtype=torch.bfloat16)
+                    hidden_size, intermediate_size, dtype=torch.bfloat16
+                )
 
                 # Expert weight scales (FP8 quantization)
-                weights[
-                    f"{expert_prefix}.gate_proj.weight_scale"] = torch.ones(
-                        intermediate_size, 1, dtype=torch.bfloat16)
+                weights[f"{expert_prefix}.gate_proj.weight_scale"] = torch.ones(
+                    intermediate_size, 1, dtype=torch.bfloat16
+                )
                 weights[f"{expert_prefix}.up_proj.weight_scale"] = torch.ones(
-                    intermediate_size, 1, dtype=torch.bfloat16)
-                weights[
-                    f"{expert_prefix}.down_proj.weight_scale"] = torch.ones(
-                        hidden_size, 1, dtype=torch.bfloat16)
+                    intermediate_size, 1, dtype=torch.bfloat16
+                )
+                weights[f"{expert_prefix}.down_proj.weight_scale"] = torch.ones(
+                    hidden_size, 1, dtype=torch.bfloat16
+                )
 
             # 3. Shared expert weights
             shared_expert_prefix = f"{layer_prefix}.feed_forward.shared_expert"
             weights[f"{shared_expert_prefix}.gate_proj.weight"] = torch.randn(
-                intermediate_size, hidden_size, dtype=torch.bfloat16)
+                intermediate_size, hidden_size, dtype=torch.bfloat16
+            )
             weights[f"{shared_expert_prefix}.up_proj.weight"] = torch.randn(
-                intermediate_size, hidden_size, dtype=torch.bfloat16)
+                intermediate_size, hidden_size, dtype=torch.bfloat16
+            )
             weights[f"{shared_expert_prefix}.down_proj.weight"] = torch.randn(
-                hidden_size, intermediate_size, dtype=torch.bfloat16)
+                hidden_size, intermediate_size, dtype=torch.bfloat16
+            )
             print(f"MoE feed-forward weights created for layer {layer_idx}.")
         else:
             # Dense layer structure
-            weights[f"{layer_prefix}.feed_forward.gate_proj.weight"] = (
-                torch.randn(intermediate_size_mlp,
-                            hidden_size,
-                            dtype=torch.bfloat16))
-            weights[f"{layer_prefix}.feed_forward.up_proj.weight"] = (
-                torch.randn(intermediate_size_mlp,
-                            hidden_size,
-                            dtype=torch.bfloat16))
-            weights[f"{layer_prefix}.feed_forward.down_proj.weight"] = (
-                torch.randn(hidden_size,
-                            intermediate_size_mlp,
-                            dtype=torch.bfloat16))
+            weights[f"{layer_prefix}.feed_forward.gate_proj.weight"] = torch.randn(
+                intermediate_size_mlp, hidden_size, dtype=torch.bfloat16
+            )
+            weights[f"{layer_prefix}.feed_forward.up_proj.weight"] = torch.randn(
+                intermediate_size_mlp, hidden_size, dtype=torch.bfloat16
+            )
+            weights[f"{layer_prefix}.feed_forward.down_proj.weight"] = torch.randn(
+                hidden_size, intermediate_size_mlp, dtype=torch.bfloat16
+            )
             print(f"Dense feed-forward weights created for layer {layer_idx}.")
 
         # Layer norms
         weights[f"{layer_prefix}.input_layernorm.weight"] = torch.ones(
-            hidden_size, dtype=torch.bfloat16)
-        weights[
-            f"{layer_prefix}.post_attention_layernorm.weight"] = torch.ones(
-                hidden_size, dtype=torch.bfloat16)
+            hidden_size, dtype=torch.bfloat16
+        )
+        weights[f"{layer_prefix}.post_attention_layernorm.weight"] = torch.ones(
+            hidden_size, dtype=torch.bfloat16
+        )
         print("Layer norms created.")
 
     # Final layer norm and output projection
     weights["language_model.model.norm.weight"] = torch.ones(
-        hidden_size, dtype=torch.bfloat16)
+        hidden_size, dtype=torch.bfloat16
+    )
     weights["language_model.lm_head.weight"] = torch.randn(
-        vocab_size, hidden_size, dtype=torch.bfloat16)
+        vocab_size, hidden_size, dtype=torch.bfloat16
+    )
 
     return weights
 
 
 def create_vision_model_weights(
-        vision_config: dict[str, Any]) -> dict[str, torch.Tensor]:
+    vision_config: dict[str, Any],
+) -> dict[str, torch.Tensor]:
     """Create synthetic weights for the vision model."""
 
     weights = {}
@@ -414,47 +415,62 @@ def create_vision_model_weights(
         layer_prefix = f"vision_model.model.layers.{layer_idx}"
 
         weights[f"{layer_prefix}.self_attn.q_proj.weight"] = torch.randn(
-            hidden_size, hidden_size, dtype=torch.bfloat16)
+            hidden_size, hidden_size, dtype=torch.bfloat16
+        )
         weights[f"{layer_prefix}.self_attn.q_proj.bias"] = torch.zeros(
-            hidden_size, dtype=torch.bfloat16)
+            hidden_size, dtype=torch.bfloat16
+        )
         weights[f"{layer_prefix}.self_attn.k_proj.weight"] = torch.randn(
-            hidden_size, hidden_size, dtype=torch.bfloat16)
+            hidden_size, hidden_size, dtype=torch.bfloat16
+        )
         weights[f"{layer_prefix}.self_attn.k_proj.bias"] = torch.zeros(
-            hidden_size, dtype=torch.bfloat16)
+            hidden_size, dtype=torch.bfloat16
+        )
         weights[f"{layer_prefix}.self_attn.v_proj.weight"] = torch.randn(
-            hidden_size, hidden_size, dtype=torch.bfloat16)
+            hidden_size, hidden_size, dtype=torch.bfloat16
+        )
         weights[f"{layer_prefix}.self_attn.v_proj.bias"] = torch.zeros(
-            hidden_size, dtype=torch.bfloat16)
+            hidden_size, dtype=torch.bfloat16
+        )
         weights[f"{layer_prefix}.self_attn.o_proj.weight"] = torch.randn(
-            hidden_size, hidden_size, dtype=torch.bfloat16)
+            hidden_size, hidden_size, dtype=torch.bfloat16
+        )
         weights[f"{layer_prefix}.self_attn.o_proj.bias"] = torch.zeros(
-            hidden_size, dtype=torch.bfloat16)
+            hidden_size, dtype=torch.bfloat16
+        )
 
         weights[f"{layer_prefix}.mlp.fc1.weight"] = torch.randn(
-            intermediate_size, hidden_size, dtype=torch.bfloat16)
+            intermediate_size, hidden_size, dtype=torch.bfloat16
+        )
         weights[f"{layer_prefix}.mlp.fc1.bias"] = torch.zeros(
-            intermediate_size, dtype=torch.bfloat16)
+            intermediate_size, dtype=torch.bfloat16
+        )
         weights[f"{layer_prefix}.mlp.fc2.weight"] = torch.randn(
-            hidden_size, intermediate_size, dtype=torch.bfloat16)
+            hidden_size, intermediate_size, dtype=torch.bfloat16
+        )
         weights[f"{layer_prefix}.mlp.fc2.bias"] = torch.zeros(
-            hidden_size, dtype=torch.bfloat16)
+            hidden_size, dtype=torch.bfloat16
+        )
 
         weights[f"{layer_prefix}.input_layernorm.weight"] = torch.ones(
-            hidden_size, dtype=torch.bfloat16)
+            hidden_size, dtype=torch.bfloat16
+        )
         weights[f"{layer_prefix}.input_layernorm.bias"] = torch.zeros(
-            hidden_size, dtype=torch.bfloat16)
-        weights[
-            f"{layer_prefix}.post_attention_layernorm.weight"] = torch.ones(
-                hidden_size, dtype=torch.bfloat16)
+            hidden_size, dtype=torch.bfloat16
+        )
+        weights[f"{layer_prefix}.post_attention_layernorm.weight"] = torch.ones(
+            hidden_size, dtype=torch.bfloat16
+        )
         weights[f"{layer_prefix}.post_attention_layernorm.bias"] = torch.zeros(
-            hidden_size, dtype=torch.bfloat16)
+            hidden_size, dtype=torch.bfloat16
+        )
 
     return weights
 
 
 def create_shared_weights(
-        text_config: dict[str, Any],
-        vision_config: dict[str, Any]) -> dict[str, torch.Tensor]:
+    text_config: dict[str, Any], vision_config: dict[str, Any]
+) -> dict[str, torch.Tensor]:
     """Create weights for shared components (vision-language connector)"""
 
     weights = {}
@@ -464,13 +480,15 @@ def create_shared_weights(
 
     # Vision-language connector (projects vision features to text space)
     weights["multi_modal_projector.linear_1.weight"] = torch.randn(
-        text_hidden_size, projector_input_dim, dtype=torch.bfloat16)
+        text_hidden_size, projector_input_dim, dtype=torch.bfloat16
+    )
 
     return weights
 
 
-def save_weights_to_safetensors(weights: dict[str, torch.Tensor],
-                                output_path: Path) -> None:
+def save_weights_to_safetensors(
+    weights: dict[str, torch.Tensor], output_path: Path
+) -> None:
     """Save weights to safetensors files and create index."""
 
     # Determine how to shard the weights
@@ -507,18 +525,18 @@ def save_weights_to_safetensors(weights: dict[str, torch.Tensor],
     else:
         # Multiple shards
         for i, shard in enumerate(shards):
-            filename = f"model-{i+1:05d}-of-{len(shards):05d}.safetensors"
+            filename = f"model-{i + 1:05d}-of-{len(shards):05d}.safetensors"
             save_file(shard, output_path / filename)
             for name in shard:
                 weight_map[name] = filename
-            print(f"Saved shard {i+1}/{len(shards)}: {filename}")
+            print(f"Saved shard {i + 1}/{len(shards)}: {filename}")
 
     # Create index file
     index_data = {
         "metadata": {
-            "total_size":
-            sum(tensor.numel() * tensor.element_size()
-                for tensor in weights.values())
+            "total_size": sum(
+                tensor.numel() * tensor.element_size() for tensor in weights.values()
+            )
         },
         "weight_map": weight_map,
     }
@@ -528,8 +546,9 @@ def save_weights_to_safetensors(weights: dict[str, torch.Tensor],
         json.dump(index_data, f, indent=2)
 
     print(f"Created index file: {index_path}")
-    print(f"Total model size: "
-          f"{index_data['metadata']['total_size'] / (1024**3):.2f} GB")
+    print(
+        f"Total model size: {index_data['metadata']['total_size'] / (1024**3):.2f} GB"
+    )
 
 
 def check_attention_spec_interleaved_rope(
@@ -540,8 +559,7 @@ def check_attention_spec_interleaved_rope(
 ):
     """Check that the attention spec is correct."""
     assert isinstance(llm.llm_engine.model_executor, Executor)
-    kv_cache_specs_per_rank = llm.llm_engine.model_executor.get_kv_cache_specs(
-    )
+    kv_cache_specs_per_rank = llm.llm_engine.model_executor.get_kv_cache_specs()
     for rank in range(num_ranks):
         kv_cache_specs = kv_cache_specs_per_rank[rank]
         assert len(kv_cache_specs.keys()) == num_attention_layers
@@ -551,16 +569,14 @@ def check_attention_spec_interleaved_rope(
             else:
                 expected_spec = ChunkedLocalAttentionSpec
             assert isinstance(
-                kv_cache_specs[
-                    f"language_model.model.layers.{i}.self_attn.attn"],
-                expected_spec)
+                kv_cache_specs[f"language_model.model.layers.{i}.self_attn.attn"],
+                expected_spec,
+            )
 
 
 def run_reduced_model(llm: LLM, should_profile: bool = False) -> None:
     """Test the created reduced model with vLLM."""
-    sampling_params = SamplingParams(temperature=0.8,
-                                     top_p=0.95,
-                                     max_tokens=50)
+    sampling_params = SamplingParams(temperature=0.8, top_p=0.95, max_tokens=50)
 
     if should_profile:
         llm.start_profile()
@@ -571,15 +587,15 @@ def run_reduced_model(llm: LLM, should_profile: bool = False) -> None:
     print("Test generation successful!")
     for output in outputs:
         print(f"Prompt: {output.prompt}")
-        print(f"Output: "
-              f"{output.outputs[0].text}")
+        print(f"Output: {output.outputs[0].text}")
         print("-" * 40)
 
 
 @multi_gpu_test(num_gpus=2)
 @pytest.mark.parametrize(
     "original_model_name,text_layers,num_experts,vision_layers,",
-    [("meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8", 4, 4, 2)])
+    [("meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8", 4, 4, 2)],
+)
 @pytest.mark.parametrize("enforce_eager", [True, False])
 @pytest.mark.parametrize("tp,ep", [(2, True)])
 @pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
@@ -640,7 +656,8 @@ def main():
     import argparse
 
     parser = argparse.ArgumentParser(
-        description="Create a reduced-layer Maverick model")
+        description="Create a reduced-layer Maverick model"
+    )
     parser.add_argument(
         "--output-dir",
         default="/tmp/reduced_maverick",
@@ -652,10 +669,7 @@ def main():
         default=4,
         help="Number of text transformer layers",
     )
-    parser.add_argument("--num-experts",
-                        type=int,
-                        default=4,
-                        help="Number of experts")
+    parser.add_argument("--num-experts", type=int, default=4, help="Number of experts")
     parser.add_argument(
         "--vision-layers",
         type=int,
@@ -667,12 +681,12 @@ def main():
         action="store_true",
         help="Force recreation if output directory exists",
     )
-    parser.add_argument("--test",
-                        action="store_true",
-                        help="Test the created model with vLLM")
-    parser.add_argument("--profile",
-                        action="store_true",
-                        help="Profile the created model with vLLM")
+    parser.add_argument(
+        "--test", action="store_true", help="Test the created model with vLLM"
+    )
+    parser.add_argument(
+        "--profile", action="store_true", help="Profile the created model with vLLM"
+    )
     parser.add_argument(
         "--test-original",
         action="store_true",
@@ -687,16 +701,18 @@ def main():
     args = parser.parse_args()
 
     if args.test:
-        test_dummy_maverick(original_model_name=args.original_model,
-                            output_dir=args.output_dir,
-                            text_layers=args.text_layers,
-                            num_experts=args.num_experts,
-                            vision_layers=args.vision_layers,
-                            force_recreate=args.force_recreate,
-                            tp=2,
-                            ep=True,
-                            enforce_eager=True,
-                            profile=args.profile)
+        test_dummy_maverick(
+            original_model_name=args.original_model,
+            output_dir=args.output_dir,
+            text_layers=args.text_layers,
+            num_experts=args.num_experts,
+            vision_layers=args.vision_layers,
+            force_recreate=args.force_recreate,
+            tp=2,
+            ep=True,
+            enforce_eager=True,
+            profile=args.profile,
+        )
 
     if args.test_original:
         run_maverick_serving(args.original_model)
diff --git a/tests/models/multimodal/generation/test_phi4_multimodal.py b/tests/models/multimodal/generation/test_phi4_multimodal.py
index db8984d8656f..132c69285c5c 100644
--- a/tests/models/multimodal/generation/test_phi4_multimodal.py
+++ b/tests/models/multimodal/generation/test_phi4_multimodal.py
@@ -14,26 +14,35 @@
 from vllm.multimodal.image import rescale_image_size
 from vllm.platforms import current_platform
 
-from ....conftest import (IMAGE_ASSETS, HfRunner, PromptAudioInput,
-                          PromptImageInput, VllmRunner)
+from ....conftest import (
+    IMAGE_ASSETS,
+    HfRunner,
+    PromptAudioInput,
+    PromptImageInput,
+    VllmRunner,
+)
 from ....utils import large_gpu_test
 from ...utils import check_logprobs_close
 
-HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts({
-    "stop_sign":
-    "<|user|>\n<|image|>\nWhat's the content of the image?<|end|>\n<|assistant|>\n",  # noqa: E501
-    "cherry_blossom":
-    "<|user|>\n<|image|>\nPlease infer the season with reason in details.<|end|>\n<|assistant|>\n",  # noqa: E501
-})
-HF_MULTIIMAGE_IMAGE_PROMPT = "<|user|>\n<|image|>\n<|image|>\nDescribe these images.<|end|>\n<|assistant|>\n"  # noqa: E501
+HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts(
+    {
+        "stop_sign": "<|user|>\n<|image|>\nWhat's the content of the image?<|end|>\n<|assistant|>\n",  # noqa: E501
+        "cherry_blossom": "<|user|>\n<|image|>\nPlease infer the season with reason in details.<|end|>\n<|assistant|>\n",  # noqa: E501
+    }
+)
+HF_MULTIIMAGE_IMAGE_PROMPT = (
+    "<|user|>\n<|image|>\n<|image|>\nDescribe these images.<|end|>\n<|assistant|>\n"  # noqa: E501
+)
 
-model_path = snapshot_download("microsoft/Phi-4-multimodal-instruct",
-                               revision="refs/pr/70")
+model_path = snapshot_download(
+    "microsoft/Phi-4-multimodal-instruct", revision="refs/pr/70"
+)
 # Since the vision-lora and speech-lora co-exist with the base model,
 # we have to manually specify the path of the lora weights.
 vision_lora_path = os.path.join(model_path, "vision-lora")
-speech_question = os.path.join(model_path, "examples",
-                               "what_is_shown_in_this_image.wav")
+speech_question = os.path.join(
+    model_path, "examples", "what_is_shown_in_this_image.wav"
+)
 models = [model_path]
 
 target_dtype = "half"
@@ -48,8 +57,7 @@
 def run_test(
     hf_runner: type[HfRunner],
     vllm_runner: type[VllmRunner],
-    inputs: Sequence[tuple[list[str], PromptImageInput,
-                           Optional[PromptAudioInput]]],
+    inputs: Sequence[tuple[list[str], PromptImageInput, Optional[PromptAudioInput]]],
     model: str,
     *,
     max_model_len: int,
@@ -75,28 +83,30 @@ def run_test(
     # will hurt multiprocessing backend with fork method (the default method).
     # max_model_len should be greater than image_feature_size
     with vllm_runner(
-            model,
-            task="generate",
-            max_model_len=max_model_len,
-            max_num_seqs=2,
-            dtype=dtype,
-            limit_mm_per_prompt={"image": mm_limit},
-            tensor_parallel_size=tensor_parallel_size,
-            distributed_executor_backend=distributed_executor_backend,
-            enable_lora=True,
-            max_lora_rank=320,
-            gpu_memory_utilization=0.8,  # set to 0.8 to avoid OOM in CI
-            enforce_eager=True,
-            trust_remote_code=False,
+        model,
+        task="generate",
+        max_model_len=max_model_len,
+        max_num_seqs=2,
+        dtype=dtype,
+        limit_mm_per_prompt={"image": mm_limit},
+        tensor_parallel_size=tensor_parallel_size,
+        distributed_executor_backend=distributed_executor_backend,
+        enable_lora=True,
+        max_lora_rank=320,
+        gpu_memory_utilization=0.8,  # set to 0.8 to avoid OOM in CI
+        enforce_eager=True,
+        trust_remote_code=False,
     ) as vllm_model:
         lora_request = LoRARequest("vision", 1, vision_lora_path)
         vllm_outputs_per_case = [
-            vllm_model.generate_greedy_logprobs(prompts,
-                                                max_tokens,
-                                                num_logprobs=num_logprobs,
-                                                images=images,
-                                                audios=audios,
-                                                lora_request=lora_request)
+            vllm_model.generate_greedy_logprobs(
+                prompts,
+                max_tokens,
+                num_logprobs=num_logprobs,
+                images=images,
+                audios=audios,
+                lora_request=lora_request,
+            )
             for prompts, images, audios in inputs
         ]
 
@@ -108,17 +118,18 @@ def run_test(
         hf_processor = hf_model.processor
         eos_token_id = hf_processor.tokenizer.eos_token_id
         hf_outputs_per_case = [
-            hf_model.generate_greedy_logprobs_limit(prompts,
-                                                    max_tokens,
-                                                    num_logprobs=num_logprobs,
-                                                    images=images,
-                                                    audios=audios,
-                                                    eos_token_id=eos_token_id)
+            hf_model.generate_greedy_logprobs_limit(
+                prompts,
+                max_tokens,
+                num_logprobs=num_logprobs,
+                images=images,
+                audios=audios,
+                eos_token_id=eos_token_id,
+            )
             for prompts, images, audios in inputs
         ]
 
-    for hf_outputs, vllm_outputs in zip(hf_outputs_per_case,
-                                        vllm_outputs_per_case):
+    for hf_outputs, vllm_outputs in zip(hf_outputs_per_case, vllm_outputs_per_case):
         check_logprobs_close(
             outputs_0_lst=hf_outputs,
             outputs_1_lst=vllm_outputs,
@@ -145,16 +156,27 @@ def run_test(
 @pytest.mark.parametrize("max_model_len", [12800])
 @pytest.mark.parametrize("max_tokens", [128])
 @pytest.mark.parametrize("num_logprobs", [10])
-def test_models(hf_runner, vllm_runner, image_assets, model, size_factors,
-                dtype: str, max_model_len: int, max_tokens: int,
-                num_logprobs: int) -> None:
+def test_models(
+    hf_runner,
+    vllm_runner,
+    image_assets,
+    model,
+    size_factors,
+    dtype: str,
+    max_model_len: int,
+    max_tokens: int,
+    num_logprobs: int,
+) -> None:
     images = [asset.pil_image for asset in image_assets]
 
-    inputs_per_image = [(
-        [prompt for _ in size_factors],
-        [rescale_image_size(image, factor) for factor in size_factors],
-        None,
-    ) for image, prompt in zip(images, HF_IMAGE_PROMPTS)]
+    inputs_per_image = [
+        (
+            [prompt for _ in size_factors],
+            [rescale_image_size(image, factor) for factor in size_factors],
+            None,
+        )
+        for image, prompt in zip(images, HF_IMAGE_PROMPTS)
+    ]
 
     run_test(
         hf_runner,
@@ -189,16 +211,26 @@ def test_models(hf_runner, vllm_runner, image_assets, model, size_factors,
 @pytest.mark.parametrize("max_model_len", [25600])
 @pytest.mark.parametrize("max_tokens", [128])
 @pytest.mark.parametrize("num_logprobs", [10])
-def test_multi_images_models(hf_runner, vllm_runner, image_assets, model,
-                             size_factors, dtype: str, max_model_len: int,
-                             max_tokens: int, num_logprobs: int) -> None:
+def test_multi_images_models(
+    hf_runner,
+    vllm_runner,
+    image_assets,
+    model,
+    size_factors,
+    dtype: str,
+    max_model_len: int,
+    max_tokens: int,
+    num_logprobs: int,
+) -> None:
     images = [asset.pil_image for asset in image_assets]
 
     inputs_per_case = [
         (
             [HF_MULTIIMAGE_IMAGE_PROMPT for _ in size_factors],
-            [[rescale_image_size(image, factor) for image in images]
-             for factor in size_factors],
+            [
+                [rescale_image_size(image, factor) for image in images]
+                for factor in size_factors
+            ],
             None,
         ),
     ]
@@ -222,10 +254,15 @@ def test_multi_images_models(hf_runner, vllm_runner, image_assets, model,
 @pytest.mark.parametrize("max_model_len", [12800])
 @pytest.mark.parametrize("max_tokens", [128])
 @pytest.mark.parametrize("num_logprobs", [10])
-def test_vision_speech_models(hf_runner, vllm_runner, model, dtype: str,
-                              max_model_len: int, max_tokens: int,
-                              num_logprobs: int) -> None:
-
+def test_vision_speech_models(
+    hf_runner,
+    vllm_runner,
+    model,
+    dtype: str,
+    max_model_len: int,
+    max_tokens: int,
+    num_logprobs: int,
+) -> None:
     # use the example speech question so that the model outputs are reasonable
     audio = librosa.load(speech_question, sr=16000)
     image = ImageAsset("cherry_blossom").pil_image.convert("RGB")
diff --git a/tests/models/multimodal/generation/test_phi4mm.py b/tests/models/multimodal/generation/test_phi4mm.py
index 77e2b90dd5e9..e69d44c6a131 100644
--- a/tests/models/multimodal/generation/test_phi4mm.py
+++ b/tests/models/multimodal/generation/test_phi4mm.py
@@ -17,31 +17,39 @@
 from vllm.multimodal.image import convert_image_mode, rescale_image_size
 from vllm.platforms import current_platform
 
-from ....conftest import (IMAGE_ASSETS, HfRunner, PromptAudioInput,
-                          PromptImageInput, VllmRunner)
+from ....conftest import (
+    IMAGE_ASSETS,
+    HfRunner,
+    PromptAudioInput,
+    PromptImageInput,
+    VllmRunner,
+)
 from ....utils import large_gpu_test
 from ...utils import check_logprobs_close
 
-HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts({
-    "stop_sign":
-    "<|user|>\n<|image_1|>\nWhat's the content of the image?<|end|>\n<|assistant|>\n",  # noqa: E501
-    "cherry_blossom":
-    "<|user|>\n<|image_1|>\nPlease infer the season with reason in details.<|end|>\n<|assistant|>\n",  # noqa: E501
-})
-HF_MULTIIMAGE_IMAGE_PROMPT = "<|user|>\n<|image_1|>\n<|image_2|>\nDescribe these images.<|end|>\n<|assistant|>\n"  # noqa: E501
+HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts(
+    {
+        "stop_sign": "<|user|>\n<|image_1|>\nWhat's the content of the image?<|end|>\n<|assistant|>\n",  # noqa: E501
+        "cherry_blossom": "<|user|>\n<|image_1|>\nPlease infer the season with reason in details.<|end|>\n<|assistant|>\n",  # noqa: E501
+    }
+)
+HF_MULTIIMAGE_IMAGE_PROMPT = (
+    "<|user|>\n<|image_1|>\n<|image_2|>\nDescribe these images.<|end|>\n<|assistant|>\n"  # noqa: E501
+)
 
 model_path = snapshot_download("microsoft/Phi-4-multimodal-instruct")
 # Since the vision-lora and speech-lora co-exist with the base model,
 # we have to manually specify the path of the lora weights.
 vision_lora_path = os.path.join(model_path, "vision-lora")
-speech_question = os.path.join(model_path, "examples",
-                               "what_is_shown_in_this_image.wav")
+speech_question = os.path.join(
+    model_path, "examples", "what_is_shown_in_this_image.wav"
+)
 models = [model_path]
 
 
-def vllm_to_hf_output(vllm_output: tuple[list[int], str,
-                                         Optional[SampleLogprobs]],
-                      model: str):
+def vllm_to_hf_output(
+    vllm_output: tuple[list[int], str, Optional[SampleLogprobs]], model: str
+):
     """Sanitize vllm output to be comparable with hf output."""
     _, output_str, out_logprobs = vllm_output
 
@@ -71,8 +79,7 @@ def vllm_to_hf_output(vllm_output: tuple[list[int], str,
 def run_test(
     hf_runner: type[HfRunner],
     vllm_runner: type[VllmRunner],
-    inputs: Sequence[tuple[list[str], PromptImageInput,
-                           Optional[PromptAudioInput]]],
+    inputs: Sequence[tuple[list[str], PromptImageInput, Optional[PromptAudioInput]]],
     model: str,
     *,
     max_model_len: int,
@@ -98,27 +105,29 @@ def run_test(
     # will hurt multiprocessing backend with fork method (the default method).
     # max_model_len should be greater than image_feature_size
     with vllm_runner(
-            model,
-            runner="generate",
-            max_model_len=max_model_len,
-            max_num_seqs=2,
-            dtype=dtype,
-            limit_mm_per_prompt={"image": mm_limit},
-            tensor_parallel_size=tensor_parallel_size,
-            distributed_executor_backend=distributed_executor_backend,
-            enable_lora=True,
-            max_lora_rank=320,
-            gpu_memory_utilization=0.8,  # set to 0.8 to avoid OOM in CI
-            enforce_eager=True,
+        model,
+        runner="generate",
+        max_model_len=max_model_len,
+        max_num_seqs=2,
+        dtype=dtype,
+        limit_mm_per_prompt={"image": mm_limit},
+        tensor_parallel_size=tensor_parallel_size,
+        distributed_executor_backend=distributed_executor_backend,
+        enable_lora=True,
+        max_lora_rank=320,
+        gpu_memory_utilization=0.8,  # set to 0.8 to avoid OOM in CI
+        enforce_eager=True,
     ) as vllm_model:
         lora_request = LoRARequest("vision", 1, vision_lora_path)
         vllm_outputs_per_case = [
-            vllm_model.generate_greedy_logprobs(prompts,
-                                                max_tokens,
-                                                num_logprobs=num_logprobs,
-                                                images=images,
-                                                audios=audios,
-                                                lora_request=lora_request)
+            vllm_model.generate_greedy_logprobs(
+                prompts,
+                max_tokens,
+                num_logprobs=num_logprobs,
+                images=images,
+                audios=audios,
+                lora_request=lora_request,
+            )
             for prompts, images, audios in inputs
         ]
 
@@ -127,42 +136,36 @@ def run_test(
     pytest.skip("HF impl is not compatible with current transformers")
 
     hf_model_kwargs = {"_attn_implementation": "sdpa"}
-    with hf_runner(model, dtype=dtype,
-                   model_kwargs=hf_model_kwargs) as hf_model:
-
+    with hf_runner(model, dtype=dtype, model_kwargs=hf_model_kwargs) as hf_model:
         hf_processor = hf_model.processor
         eos_token_id = hf_processor.tokenizer.eos_token_id
 
-        def patch_hf_processor(*args,
-                               text="",
-                               images=None,
-                               audio=None,
-                               sampling_rate=None,
-                               **kwargs):
+        def patch_hf_processor(
+            *args, text="", images=None, audio=None, sampling_rate=None, **kwargs
+        ):
             audios = None
             if audio is not None and sampling_rate is not None:
                 audios = [(audio, sampling_rate)]
-            return hf_processor(*args,
-                                text=text,
-                                images=images,
-                                audios=audios,
-                                **kwargs)
+            return hf_processor(
+                *args, text=text, images=images, audios=audios, **kwargs
+            )
 
         hf_model.processor = patch_hf_processor
 
         hf_outputs_per_case = [
-            hf_model.generate_greedy_logprobs_limit(prompts,
-                                                    max_tokens,
-                                                    num_logprobs=num_logprobs,
-                                                    images=images,
-                                                    audios=audios,
-                                                    eos_token_id=eos_token_id,
-                                                    num_logits_to_keep=0)
+            hf_model.generate_greedy_logprobs_limit(
+                prompts,
+                max_tokens,
+                num_logprobs=num_logprobs,
+                images=images,
+                audios=audios,
+                eos_token_id=eos_token_id,
+                num_logits_to_keep=0,
+            )
             for prompts, images, audios in inputs
         ]
 
-    for hf_outputs, vllm_outputs in zip(hf_outputs_per_case,
-                                        vllm_outputs_per_case):
+    for hf_outputs, vllm_outputs in zip(hf_outputs_per_case, vllm_outputs_per_case):
         check_logprobs_close(
             outputs_0_lst=hf_outputs,
             outputs_1_lst=vllm_outputs,
@@ -189,16 +192,27 @@ def patch_hf_processor(*args,
 @pytest.mark.parametrize("max_model_len", [12800])
 @pytest.mark.parametrize("max_tokens", [128])
 @pytest.mark.parametrize("num_logprobs", [10])
-def test_models(hf_runner, vllm_runner, image_assets, model, size_factors,
-                dtype: str, max_model_len: int, max_tokens: int,
-                num_logprobs: int) -> None:
+def test_models(
+    hf_runner,
+    vllm_runner,
+    image_assets,
+    model,
+    size_factors,
+    dtype: str,
+    max_model_len: int,
+    max_tokens: int,
+    num_logprobs: int,
+) -> None:
     images = [asset.pil_image for asset in image_assets]
 
-    inputs_per_image = [(
-        [prompt for _ in size_factors],
-        [rescale_image_size(image, factor) for factor in size_factors],
-        None,
-    ) for image, prompt in zip(images, HF_IMAGE_PROMPTS)]
+    inputs_per_image = [
+        (
+            [prompt for _ in size_factors],
+            [rescale_image_size(image, factor) for factor in size_factors],
+            None,
+        )
+        for image, prompt in zip(images, HF_IMAGE_PROMPTS)
+    ]
 
     run_test(
         hf_runner,
@@ -233,16 +247,26 @@ def test_models(hf_runner, vllm_runner, image_assets, model, size_factors,
 @pytest.mark.parametrize("max_model_len", [25600])
 @pytest.mark.parametrize("max_tokens", [128])
 @pytest.mark.parametrize("num_logprobs", [10])
-def test_multi_images_models(hf_runner, vllm_runner, image_assets, model,
-                             size_factors, dtype: str, max_model_len: int,
-                             max_tokens: int, num_logprobs: int) -> None:
+def test_multi_images_models(
+    hf_runner,
+    vllm_runner,
+    image_assets,
+    model,
+    size_factors,
+    dtype: str,
+    max_model_len: int,
+    max_tokens: int,
+    num_logprobs: int,
+) -> None:
     images = [asset.pil_image for asset in image_assets]
 
     inputs_per_case = [
         (
             [HF_MULTIIMAGE_IMAGE_PROMPT for _ in size_factors],
-            [[rescale_image_size(image, factor) for image in images]
-             for factor in size_factors],
+            [
+                [rescale_image_size(image, factor) for image in images]
+                for factor in size_factors
+            ],
             None,
         ),
     ]
@@ -266,10 +290,15 @@ def test_multi_images_models(hf_runner, vllm_runner, image_assets, model,
 @pytest.mark.parametrize("max_model_len", [12800])
 @pytest.mark.parametrize("max_tokens", [128])
 @pytest.mark.parametrize("num_logprobs", [10])
-def test_vision_speech_models(hf_runner, vllm_runner, model, dtype: str,
-                              max_model_len: int, max_tokens: int,
-                              num_logprobs: int) -> None:
-
+def test_vision_speech_models(
+    hf_runner,
+    vllm_runner,
+    model,
+    dtype: str,
+    max_model_len: int,
+    max_tokens: int,
+    num_logprobs: int,
+) -> None:
     # use the example speech question so that the model outputs are reasonable
     audio = librosa.load(speech_question, sr=None)
     image = convert_image_mode(ImageAsset("cherry_blossom").pil_image, "RGB")
diff --git a/tests/models/multimodal/generation/test_pixtral.py b/tests/models/multimodal/generation/test_pixtral.py
index 715b08ef90e5..db0effdaf666 100644
--- a/tests/models/multimodal/generation/test_pixtral.py
+++ b/tests/models/multimodal/generation/test_pixtral.py
@@ -37,33 +37,33 @@
 
 
 def _create_msg_format(urls: list[str]) -> list[dict[str, Any]]:
-    return [{
-        "role":
-        "user",
-        "content": [{
-            "type": "text",
-            "text": PROMPT,
-        }] + [{
-            "type": "image_url",
-            "image_url": {
-                "url": url
-            }
-        } for url in urls],
-    }]
+    return [
+        {
+            "role": "user",
+            "content": [
+                {
+                    "type": "text",
+                    "text": PROMPT,
+                }
+            ]
+            + [{"type": "image_url", "image_url": {"url": url}} for url in urls],
+        }
+    ]
 
 
 def _create_msg_format_hf(urls: list[str]) -> list[dict[str, Any]]:
-    return [{
-        "role":
-        "user",
-        "content": [{
-            "type": "text",
-            "content": PROMPT,
-        }, *({
-            "type": "image",
-            "image": download_image(url)
-        } for url in urls)],
-    }]
+    return [
+        {
+            "role": "user",
+            "content": [
+                {
+                    "type": "text",
+                    "content": PROMPT,
+                },
+                *({"type": "image", "image": download_image(url)} for url in urls),
+            ],
+        }
+    ]
 
 
 def _create_engine_inputs(urls: list[str]) -> TokensPrompt:
@@ -125,11 +125,17 @@ def _dump_outputs_w_logprobs(
     outputs: OutputsLogprobs,
     filename: "StrPath",
 ) -> None:
-    json_data = [(tokens, text, [{
-        k: asdict(v)
-        for k, v in token_logprobs.items()
-    } for token_logprobs in (logprobs or [])])
-                 for tokens, text, logprobs in outputs]
+    json_data = [
+        (
+            tokens,
+            text,
+            [
+                {k: asdict(v) for k, v in token_logprobs.items()}
+                for token_logprobs in (logprobs or [])
+            ],
+        )
+        for tokens, text, logprobs in outputs
+    ]
 
     with open(filename, "w") as f:
         json.dump(json_data, f)
@@ -139,28 +145,35 @@ def load_outputs_w_logprobs(filename: "StrPath") -> OutputsLogprobs:
     with open(filename, "rb") as f:
         json_data = json.load(f)
 
-    return [(tokens, text, [{
-        int(k): Logprob(**v)
-        for k, v in token_logprobs.items()
-    } for token_logprobs in logprobs]) for tokens, text, logprobs in json_data]
+    return [
+        (
+            tokens,
+            text,
+            [
+                {int(k): Logprob(**v) for k, v in token_logprobs.items()}
+                for token_logprobs in logprobs
+            ],
+        )
+        for tokens, text, logprobs in json_data
+    ]
 
 
 @large_gpu_test(min_gb=80)
 @pytest.mark.parametrize("model", MODELS)
 @pytest.mark.parametrize("max_model_len", MAX_MODEL_LEN)
 @pytest.mark.parametrize("dtype", ["bfloat16"])
-def test_chat(vllm_runner, max_model_len: int, model: str, dtype: str,
-              local_asset_server) -> None:
-    EXPECTED_CHAT_LOGPROBS = load_outputs_w_logprobs(
-        FIXTURE_LOGPROBS_CHAT[model])
+def test_chat(
+    vllm_runner, max_model_len: int, model: str, dtype: str, local_asset_server
+) -> None:
+    EXPECTED_CHAT_LOGPROBS = load_outputs_w_logprobs(FIXTURE_LOGPROBS_CHAT[model])
     with vllm_runner(
-            model,
-            dtype=dtype,
-            tokenizer_mode="mistral",
-            load_format="mistral",
-            config_format="mistral",
-            max_model_len=max_model_len,
-            limit_mm_per_prompt=LIMIT_MM_PER_PROMPT,
+        model,
+        dtype=dtype,
+        tokenizer_mode="mistral",
+        load_format="mistral",
+        config_format="mistral",
+        max_model_len=max_model_len,
+        limit_mm_per_prompt=LIMIT_MM_PER_PROMPT,
     ) as vllm_model:
         outputs = []
 
@@ -180,7 +193,9 @@ def test_chat(vllm_runner, max_model_len: int, model: str, dtype: str,
     for i in range(len(logprobs)):
         assert logprobs[i][-1] is None
         logprobs[i] = logprobs[i][:-1]
-    check_logprobs_close(outputs_0_lst=EXPECTED_CHAT_LOGPROBS,
-                         outputs_1_lst=logprobs,
-                         name_0="h100_ref",
-                         name_1="output")
+    check_logprobs_close(
+        outputs_0_lst=EXPECTED_CHAT_LOGPROBS,
+        outputs_1_lst=logprobs,
+        name_0="h100_ref",
+        name_1="output",
+    )
diff --git a/tests/models/multimodal/generation/test_qwen2_5_vl.py b/tests/models/multimodal/generation/test_qwen2_5_vl.py
index 1dc3188d60bd..1a7d854352ae 100644
--- a/tests/models/multimodal/generation/test_qwen2_5_vl.py
+++ b/tests/models/multimodal/generation/test_qwen2_5_vl.py
@@ -17,14 +17,15 @@ def qwen2_5_vl_chat_template(*query):
     return f"<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n<|im_start|>user\n{''.join(query)}<|im_end|><|im_start|>assistant\n"  # noqa: E501
 
 
-VIDEO_PROMPTS = VIDEO_ASSETS.prompts({
-    "baby_reading":
-    qwen2_5_vl_chat_template(
-        VIDEO_PLACEHOLDER,
-        "Describe this video with a short sentence ",
-        "(no more than 20 words)",
-    ),
-})
+VIDEO_PROMPTS = VIDEO_ASSETS.prompts(
+    {
+        "baby_reading": qwen2_5_vl_chat_template(
+            VIDEO_PLACEHOLDER,
+            "Describe this video with a short sentence ",
+            "(no more than 20 words)",
+        ),
+    }
+)
 
 
 @pytest.mark.core_model
@@ -33,10 +34,15 @@ def qwen2_5_vl_chat_template(*query):
 @pytest.mark.parametrize("num_frames", [16])
 @pytest.mark.parametrize("dtype", [target_dtype])
 @pytest.mark.parametrize("max_tokens", [128])
-def test_qwen2_5_vl_evs_functionality(vllm_runner, video_assets, model,
-                                      video_pruning_rate: float,
-                                      num_frames: int, dtype: str,
-                                      max_tokens: int) -> None:
+def test_qwen2_5_vl_evs_functionality(
+    vllm_runner,
+    video_assets,
+    model,
+    video_pruning_rate: float,
+    num_frames: int,
+    dtype: str,
+    max_tokens: int,
+) -> None:
     """Test EVS (Efficient Video Sampling) functionality with different
     pruning rates.
     """
@@ -51,19 +57,18 @@ def test_qwen2_5_vl_evs_functionality(vllm_runner, video_assets, model,
     videos = [sampled_vids[0]]
 
     # Initialize model with EVS configuration
-    with vllm_runner(model,
-                     runner="generate",
-                     max_model_len=4000,
-                     max_num_seqs=1,
-                     dtype=dtype,
-                     limit_mm_per_prompt={"video": 1},
-                     tensor_parallel_size=1,
-                     video_pruning_rate=video_pruning_rate) as vllm_model:
-
+    with vllm_runner(
+        model,
+        runner="generate",
+        max_model_len=4000,
+        max_num_seqs=1,
+        dtype=dtype,
+        limit_mm_per_prompt={"video": 1},
+        tensor_parallel_size=1,
+        video_pruning_rate=video_pruning_rate,
+    ) as vllm_model:
         # Generate output - this should not crash
-        outputs = vllm_model.generate_greedy(prompts,
-                                             max_tokens,
-                                             videos=videos)
+        outputs = vllm_model.generate_greedy(prompts, max_tokens, videos=videos)
 
         # Basic validation that we got a response
         assert len(outputs) == 1
@@ -83,10 +88,15 @@ def test_qwen2_5_vl_evs_functionality(vllm_runner, video_assets, model,
 @pytest.mark.parametrize("num_frames", [16])
 @pytest.mark.parametrize("dtype", [target_dtype])
 @pytest.mark.parametrize("max_tokens", [128])
-def test_qwen2_5_vl_evs_batched_videos(vllm_runner, video_assets, model,
-                                       video_pruning_rate: float,
-                                       num_frames: int, dtype: str,
-                                       max_tokens: int) -> None:
+def test_qwen2_5_vl_evs_batched_videos(
+    vllm_runner,
+    video_assets,
+    model,
+    video_pruning_rate: float,
+    num_frames: int,
+    dtype: str,
+    max_tokens: int,
+) -> None:
     """Test EVS functionality with batched videos.
 
     This test validates that:
@@ -102,23 +112,21 @@ def test_qwen2_5_vl_evs_batched_videos(vllm_runner, video_assets, model,
 
     # Test batched videos
     prompts = [VIDEO_PROMPTS[0], VIDEO_PROMPTS[0]]
-    videos = [sampled_vids[0],
-              sampled_vids[0]]  # Use same video twice for testing
+    videos = [sampled_vids[0], sampled_vids[0]]  # Use same video twice for testing
 
     # Initialize model with EVS configuration
-    with vllm_runner(model,
-                     runner="generate",
-                     max_model_len=4000,
-                     max_num_seqs=2,
-                     dtype=dtype,
-                     limit_mm_per_prompt={"video": 2},
-                     tensor_parallel_size=1,
-                     video_pruning_rate=video_pruning_rate) as vllm_model:
-
+    with vllm_runner(
+        model,
+        runner="generate",
+        max_model_len=4000,
+        max_num_seqs=2,
+        dtype=dtype,
+        limit_mm_per_prompt={"video": 2},
+        tensor_parallel_size=1,
+        video_pruning_rate=video_pruning_rate,
+    ) as vllm_model:
         # Generate output - this should not crash
-        outputs = vllm_model.generate_greedy(prompts,
-                                             max_tokens,
-                                             videos=videos)
+        outputs = vllm_model.generate_greedy(prompts, max_tokens, videos=videos)
 
         # Basic validation that we got responses for both videos
         assert len(outputs) == 2
diff --git a/tests/models/multimodal/generation/test_qwen2_vl.py b/tests/models/multimodal/generation/test_qwen2_vl.py
index c8a3513ac7ad..a8f0ba870185 100644
--- a/tests/models/multimodal/generation/test_qwen2_vl.py
+++ b/tests/models/multimodal/generation/test_qwen2_vl.py
@@ -11,8 +11,13 @@
 from vllm.multimodal.image import rescale_image_size
 from vllm.multimodal.video import rescale_video_size, sample_frames_from_video
 
-from ....conftest import (IMAGE_ASSETS, VIDEO_ASSETS, PromptImageInput,
-                          PromptVideoInput, VllmRunner)
+from ....conftest import (
+    IMAGE_ASSETS,
+    VIDEO_ASSETS,
+    PromptImageInput,
+    PromptVideoInput,
+    VllmRunner,
+)
 from ...utils import check_logprobs_close
 
 
@@ -34,28 +39,29 @@ def qwen2_vl_chat_template(*query):
     return f"<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n<|im_start|>user\n{''.join(query)}<|im_end|><|im_start|>assistant\n"  # noqa: E501
 
 
-IMAGE_PROMPTS = IMAGE_ASSETS.prompts({
-    "stop_sign":
-    qwen2_vl_chat_template(
-        IMAGE_PLACEHOLDER,
-        "What is the biggest text's content in this image?",
-    ),
-    "cherry_blossom":
-    qwen2_vl_chat_template(
-        IMAGE_PLACEHOLDER,
-        "What is the season shown in this image? ",
-        "Reply with a short sentence (no more than 20 words)",
-    ),
-})
-
-VIDEO_PROMPTS = VIDEO_ASSETS.prompts({
-    "baby_reading":
-    qwen2_vl_chat_template(
-        VIDEO_PLACEHOLDER,
-        "Describe this video with a short sentence ",
-        "(no more than 20 words)",
-    ),
-})
+IMAGE_PROMPTS = IMAGE_ASSETS.prompts(
+    {
+        "stop_sign": qwen2_vl_chat_template(
+            IMAGE_PLACEHOLDER,
+            "What is the biggest text's content in this image?",
+        ),
+        "cherry_blossom": qwen2_vl_chat_template(
+            IMAGE_PLACEHOLDER,
+            "What is the season shown in this image? ",
+            "Reply with a short sentence (no more than 20 words)",
+        ),
+    }
+)
+
+VIDEO_PROMPTS = VIDEO_ASSETS.prompts(
+    {
+        "baby_reading": qwen2_vl_chat_template(
+            VIDEO_PLACEHOLDER,
+            "Describe this video with a short sentence ",
+            "(no more than 20 words)",
+        ),
+    }
+)
 
 MULTIIMAGE_PROMPT = qwen2_vl_chat_template(
     IMAGE_PLACEHOLDER,
@@ -77,17 +83,19 @@ class Qwen2VLPromptVideoEmbeddingInput(TypedDict):
 
 
 def batch_make_image_embeddings(
-        image_batches: list[Union[Image.Image, list[Image.Image]]], processor,
-        llm: VllmRunner) -> list[Qwen2VLPromptImageEmbeddingInput]:
+    image_batches: list[Union[Image.Image, list[Image.Image]]],
+    processor,
+    llm: VllmRunner,
+) -> list[Qwen2VLPromptImageEmbeddingInput]:
     """batched image embeddings for Qwen2-VL
 
-    This will infer all images' embeddings in a single batch, 
+    This will infer all images' embeddings in a single batch,
       and split the result according to input batches.
 
     image_batches:
       - Single-image batches: `list[Image.Image]`
       - Multiple-image batches: `list[list[Image.Image]]]`
-    
+
     returns: `list[Qwen2VLPromptImageEmbeddingInput]`
     """
 
@@ -108,9 +116,9 @@ def batch_make_image_embeddings(
     # image to pixel values
     image_processor = processor.image_processor
 
-    preprocess_result = image_processor \
-        .preprocess(images=images, return_tensors="pt") \
-        .data
+    preprocess_result = image_processor.preprocess(
+        images=images, return_tensors="pt"
+    ).data
     pixel_values = preprocess_result["pixel_values"]
     image_grid_thw = preprocess_result["image_grid_thw"]
 
@@ -119,12 +127,13 @@ def get_image_embeds(model):
         with torch.no_grad():
             visual = model.visual
 
-            pixel_values_on_device = pixel_values.to(visual.device,
-                                                     dtype=visual.dtype)
-            image_grid_thw_on_device = image_grid_thw.to(visual.device,
-                                                         dtype=torch.int64)
-            return visual(pixel_values_on_device,
-                          grid_thw=image_grid_thw_on_device).cpu()
+            pixel_values_on_device = pixel_values.to(visual.device, dtype=visual.dtype)
+            image_grid_thw_on_device = image_grid_thw.to(
+                visual.device, dtype=torch.int64
+            )
+            return visual(
+                pixel_values_on_device, grid_thw=image_grid_thw_on_device
+            ).cpu()
 
     image_embeds = torch.concat(llm.apply_model(get_image_embeds))
 
@@ -137,16 +146,21 @@ def get_image_embeds(model):
         merge_size = image_processor.merge_size
         cur_batch_embed_len = sum(
             grid_thw.prod(-1) // merge_size // merge_size
-            for grid_thw in image_grid_thw[image_counter:image_counter +
-                                           cur_batch_image_count])
+            for grid_thw in image_grid_thw[
+                image_counter : image_counter + cur_batch_image_count
+            ]
+        )
 
-        result.append({
-            "image_embeds":
-            image_embeds[embed_counter:embed_counter + cur_batch_embed_len],
-            "image_grid_thw":
-            image_grid_thw[image_counter:image_counter +
-                           cur_batch_image_count],
-        })
+        result.append(
+            {
+                "image_embeds": image_embeds[
+                    embed_counter : embed_counter + cur_batch_embed_len
+                ],
+                "image_grid_thw": image_grid_thw[
+                    image_counter : image_counter + cur_batch_image_count
+                ],
+            }
+        )
 
         embed_counter += cur_batch_embed_len
         image_counter += cur_batch_image_count
@@ -160,13 +174,13 @@ def get_image_embeds(model):
 
 
 def batch_make_video_embeddings(
-        video_batches: PromptVideoInput, processor,
-        llm: VllmRunner) -> list[Qwen2VLPromptVideoEmbeddingInput]:
+    video_batches: PromptVideoInput, processor, llm: VllmRunner
+) -> list[Qwen2VLPromptVideoEmbeddingInput]:
     """batched video embeddings for Qwen2-VL
 
     A NDArray represents a single video's all frames.
 
-    This will infer all videos' embeddings in a single batch, 
+    This will infer all videos' embeddings in a single batch,
       and split the result according to input batches.
 
     video_batches:
@@ -191,9 +205,9 @@ def batch_make_video_embeddings(
     # video to pixel values
     image_processor = processor.image_processor
 
-    preprocess_result = image_processor \
-        .preprocess(images=None, videos=videos, return_tensors="pt") \
-        .data
+    preprocess_result = image_processor.preprocess(
+        images=None, videos=videos, return_tensors="pt"
+    ).data
     pixel_values = preprocess_result["pixel_values_videos"]
     video_grid_thw = preprocess_result["video_grid_thw"]
 
@@ -202,12 +216,13 @@ def get_image_embeds(model):
         with torch.no_grad():
             visual = model.visual
 
-            pixel_values_on_device = pixel_values.to(visual.device,
-                                                     dtype=visual.dtype)
-            video_grid_thw_on_device = video_grid_thw.to(visual.device,
-                                                         dtype=torch.int64)
-            return visual(pixel_values_on_device,
-                          grid_thw=video_grid_thw_on_device).cpu()
+            pixel_values_on_device = pixel_values.to(visual.device, dtype=visual.dtype)
+            video_grid_thw_on_device = video_grid_thw.to(
+                visual.device, dtype=torch.int64
+            )
+            return visual(
+                pixel_values_on_device, grid_thw=video_grid_thw_on_device
+            ).cpu()
 
     video_embeds = torch.concat(llm.apply_model(get_image_embeds))
 
@@ -220,16 +235,21 @@ def get_image_embeds(model):
         merge_size = image_processor.merge_size
         cur_batch_embed_len = sum(
             grid_thw.prod(-1) // merge_size // merge_size
-            for grid_thw in video_grid_thw[video_counter:video_counter +
-                                           cur_batch_video_count])
+            for grid_thw in video_grid_thw[
+                video_counter : video_counter + cur_batch_video_count
+            ]
+        )
 
-        result.append({
-            "video_embeds":
-            video_embeds[embed_counter:embed_counter + cur_batch_embed_len],
-            "video_grid_thw":
-            video_grid_thw[video_counter:video_counter +
-                           cur_batch_video_count],
-        })
+        result.append(
+            {
+                "video_embeds": video_embeds[
+                    embed_counter : embed_counter + cur_batch_embed_len
+                ],
+                "video_grid_thw": video_grid_thw[
+                    video_counter : video_counter + cur_batch_video_count
+                ],
+            }
+        )
 
         embed_counter += cur_batch_embed_len
         video_counter += cur_batch_video_count
@@ -263,25 +283,24 @@ def run_embedding_input_test(
 
     # max_model_len should be greater than image_feature_size
     with vllm_runner(
-            model,
-            runner="generate",
-            max_model_len=4000,
-            max_num_seqs=3,
-            dtype=dtype,
-            limit_mm_per_prompt={
-                "image": mm_limit,
-                "video": mm_limit
-            },
-            tensor_parallel_size=tensor_parallel_size,
-            distributed_executor_backend=distributed_executor_backend,
-            default_torch_num_threads=1,
+        model,
+        runner="generate",
+        max_model_len=4000,
+        max_num_seqs=3,
+        dtype=dtype,
+        limit_mm_per_prompt={"image": mm_limit, "video": mm_limit},
+        tensor_parallel_size=tensor_parallel_size,
+        distributed_executor_backend=distributed_executor_backend,
+        default_torch_num_threads=1,
     ) as vllm_model:
         outputs_per_case_for_original_input = [
-            vllm_model.generate_greedy_logprobs(prompts,
-                                                max_tokens,
-                                                num_logprobs=num_logprobs,
-                                                images=images or None,
-                                                videos=videos or None)
+            vllm_model.generate_greedy_logprobs(
+                prompts,
+                max_tokens,
+                num_logprobs=num_logprobs,
+                images=images or None,
+                videos=videos or None,
+            )
             for prompts, images, videos in inputs
         ]
 
@@ -290,17 +309,19 @@ def run_embedding_input_test(
                 prompts,
                 max_tokens,
                 num_logprobs=num_logprobs,
-                images=batch_make_image_embeddings(
-                    images, processor, vllm_model) if images else None,
-                videos=batch_make_video_embeddings(
-                    videos, processor, vllm_model) if videos else None)
+                images=batch_make_image_embeddings(images, processor, vllm_model)
+                if images
+                else None,
+                videos=batch_make_video_embeddings(videos, processor, vllm_model)
+                if videos
+                else None,
+            )
             for prompts, images, videos in inputs
         ]
 
-    for outputs_for_original_input, \
-        outputs_for_embeddings_input \
-        in zip(outputs_per_case_for_original_input,
-            outputs_per_case_for_embeddings_input):
+    for outputs_for_original_input, outputs_for_embeddings_input in zip(
+        outputs_per_case_for_original_input, outputs_per_case_for_embeddings_input
+    ):
         check_logprobs_close(
             outputs_0_lst=outputs_for_original_input,
             outputs_1_lst=outputs_for_embeddings_input,
@@ -325,17 +346,26 @@ def run_embedding_input_test(
 @pytest.mark.parametrize("dtype", [target_dtype])
 @pytest.mark.parametrize("max_tokens", [128])
 @pytest.mark.parametrize("num_logprobs", [10])
-def test_qwen2_vl_image_embeddings_input(vllm_runner, image_assets, model,
-                                         size_factors, dtype, max_tokens,
-                                         num_logprobs, monkeypatch) -> None:
+def test_qwen2_vl_image_embeddings_input(
+    vllm_runner,
+    image_assets,
+    model,
+    size_factors,
+    dtype,
+    max_tokens,
+    num_logprobs,
+    monkeypatch,
+) -> None:
     images = [asset.pil_image for asset in image_assets]
 
-    inputs_per_case: list[tuple[
-        list[str], PromptImageInput, PromptVideoInput]] = [(
+    inputs_per_case: list[tuple[list[str], PromptImageInput, PromptVideoInput]] = [
+        (
             [prompt for _ in size_factors],
             [rescale_image_size(image, factor) for factor in size_factors],
             [],
-        ) for image, prompt in zip(images, IMAGE_PROMPTS)]
+        )
+        for image, prompt in zip(images, IMAGE_PROMPTS)
+    ]
 
     run_embedding_input_test(
         vllm_runner,
@@ -366,21 +396,27 @@ def test_qwen2_vl_image_embeddings_input(vllm_runner, image_assets, model,
 @pytest.mark.parametrize("dtype", [target_dtype])
 @pytest.mark.parametrize("max_tokens", [128])
 @pytest.mark.parametrize("num_logprobs", [10])
-def test_qwen2_vl_multiple_image_embeddings_input(vllm_runner, image_assets,
-                                                  model, size_factors,
-                                                  dtype: str, max_tokens: int,
-                                                  num_logprobs: int) -> None:
+def test_qwen2_vl_multiple_image_embeddings_input(
+    vllm_runner,
+    image_assets,
+    model,
+    size_factors,
+    dtype: str,
+    max_tokens: int,
+    num_logprobs: int,
+) -> None:
     images = [asset.pil_image for asset in image_assets]
 
-    inputs_per_case: list[tuple[list[str], PromptImageInput,
-                                PromptVideoInput]] = [(
-                                    [MULTIIMAGE_PROMPT for _ in size_factors],
-                                    [[
-                                        rescale_image_size(image, factor)
-                                        for image in images
-                                    ] for factor in size_factors],
-                                    [],
-                                )]
+    inputs_per_case: list[tuple[list[str], PromptImageInput, PromptVideoInput]] = [
+        (
+            [MULTIIMAGE_PROMPT for _ in size_factors],
+            [
+                [rescale_image_size(image, factor) for image in images]
+                for factor in size_factors
+            ],
+            [],
+        )
+    ]
 
     run_embedding_input_test(
         vllm_runner,
@@ -410,22 +446,29 @@ def test_qwen2_vl_multiple_image_embeddings_input(vllm_runner, image_assets,
 @pytest.mark.parametrize("dtype", [target_dtype])
 @pytest.mark.parametrize("max_tokens", [128])
 @pytest.mark.parametrize("num_logprobs", [10])
-def test_qwen2_vl_video_embeddings_input(vllm_runner, video_assets, model,
-                                         size_factors, dtype: str,
-                                         max_tokens: int,
-                                         num_logprobs: int) -> None:
+def test_qwen2_vl_video_embeddings_input(
+    vllm_runner,
+    video_assets,
+    model,
+    size_factors,
+    dtype: str,
+    max_tokens: int,
+    num_logprobs: int,
+) -> None:
     num_frames = 4
     sampled_vids = [
         sample_frames_from_video(asset.np_ndarrays, num_frames)
         for asset in video_assets
     ]
 
-    inputs_per_case: list[tuple[
-        list[str], PromptImageInput, PromptVideoInput]] = [(
+    inputs_per_case: list[tuple[list[str], PromptImageInput, PromptVideoInput]] = [
+        (
             [prompt for _ in size_factors],
             [],
             [rescale_video_size(video, factor) for factor in size_factors],
-        ) for video, prompt in zip(sampled_vids, VIDEO_PROMPTS)]
+        )
+        for video, prompt in zip(sampled_vids, VIDEO_PROMPTS)
+    ]
 
     run_embedding_input_test(
         vllm_runner,
diff --git a/tests/models/multimodal/generation/test_ultravox.py b/tests/models/multimodal/generation/test_ultravox.py
index e7e7bd3154a1..da1e7c7486fd 100644
--- a/tests/models/multimodal/generation/test_ultravox.py
+++ b/tests/models/multimodal/generation/test_ultravox.py
@@ -15,12 +15,12 @@
 
 MODEL_NAME = "fixie-ai/ultravox-v0_5-llama-3_2-1b"
 
-AUDIO_PROMPTS = AUDIO_ASSETS.prompts({
-    "mary_had_lamb":
-    "Transcribe this into English.",
-    "winning_call":
-    "What is happening in this audio clip?",
-})
+AUDIO_PROMPTS = AUDIO_ASSETS.prompts(
+    {
+        "mary_had_lamb": "Transcribe this into English.",
+        "winning_call": "What is happening in this audio clip?",
+    }
+)
 
 MULTI_AUDIO_PROMPT = "Describe each of the audios above."
 
@@ -33,7 +33,7 @@
     "enable_chunked_prefill": True,
     "max_num_seqs": 2,
     # Use a very small limit to exercise chunked prefill.
-    "max_num_batched_tokens": 16
+    "max_num_batched_tokens": 16,
 }
 
 
@@ -43,27 +43,33 @@ def params_kwargs_to_cli_args(params_kwargs: dict[str, Any]) -> list[str]:
     for key, value in params_kwargs.items():
         if isinstance(value, bool):
             if value:
-                args.append(f"--{key.replace('_','-')}")
+                args.append(f"--{key.replace('_', '-')}")
         else:
-            args.append(f"--{key.replace('_','-')}={value}")
+            args.append(f"--{key.replace('_', '-')}={value}")
     return args
 
 
-@pytest.fixture(params=[
-    pytest.param({}, marks=pytest.mark.cpu_model),
-    pytest.param(CHUNKED_PREFILL_KWARGS),
-])
+@pytest.fixture(
+    params=[
+        pytest.param({}, marks=pytest.mark.cpu_model),
+        pytest.param(CHUNKED_PREFILL_KWARGS),
+    ]
+)
 def server(request, audio_assets: AudioTestAssets):
     args = [
-        "--dtype", "bfloat16", "--max-model-len", "4096", "--enforce-eager",
+        "--dtype",
+        "bfloat16",
+        "--max-model-len",
+        "4096",
+        "--enforce-eager",
         "--limit-mm-per-prompt",
-        json.dumps({"audio": len(audio_assets)}), "--trust-remote-code"
+        json.dumps({"audio": len(audio_assets)}),
+        "--trust-remote-code",
     ] + params_kwargs_to_cli_args(request.param)
 
-    with RemoteOpenAIServer(MODEL_NAME,
-                            args,
-                            env_dict={"VLLM_AUDIO_FETCH_TIMEOUT":
-                                      "30"}) as remote_server:
+    with RemoteOpenAIServer(
+        MODEL_NAME, args, env_dict={"VLLM_AUDIO_FETCH_TIMEOUT": "30"}
+    ) as remote_server:
         yield remote_server
 
 
@@ -77,12 +83,11 @@ def _get_prompt(audio_count, question, placeholder):
     tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
     placeholder = f"{placeholder}\n" * audio_count
 
-    return tokenizer.apply_chat_template([{
-        'role': 'user',
-        'content': f"{placeholder}{question}"
-    }],
-                                         tokenize=False,
-                                         add_generation_prompt=True)
+    return tokenizer.apply_chat_template(
+        [{"role": "user", "content": f"{placeholder}{question}"}],
+        tokenize=False,
+        add_generation_prompt=True,
+    )
 
 
 def run_multi_audio_test(
@@ -99,19 +104,21 @@ def run_multi_audio_test(
     model_info.check_available_online(on_fail="skip")
     model_info.check_transformers_version(on_fail="skip")
 
-    with vllm_runner(model,
-                     dtype=dtype,
-                     enforce_eager=True,
-                     limit_mm_per_prompt={
-                         "audio":
-                         max((len(audio) for _, audio in prompts_and_audios))
-                     },
-                     **kwargs) as vllm_model:
+    with vllm_runner(
+        model,
+        dtype=dtype,
+        enforce_eager=True,
+        limit_mm_per_prompt={
+            "audio": max((len(audio) for _, audio in prompts_and_audios))
+        },
+        **kwargs,
+    ) as vllm_model:
         vllm_outputs = vllm_model.generate_greedy_logprobs(
             [prompt for prompt, _ in prompts_and_audios],
             max_tokens,
             num_logprobs=num_logprobs,
-            audios=[audios for _, audios in prompts_and_audios])
+            audios=[audios for _, audios in prompts_and_audios],
+        )
 
     # The HuggingFace model doesn't support multiple audios yet, so
     # just assert that some tokens were generated.
@@ -122,21 +129,25 @@ def run_multi_audio_test(
 @pytest.mark.parametrize("dtype", ["half"])
 @pytest.mark.parametrize("max_tokens", [128])
 @pytest.mark.parametrize("num_logprobs", [5])
-@pytest.mark.parametrize("vllm_kwargs", [
-    pytest.param({}, marks=pytest.mark.cpu_model),
-    pytest.param(CHUNKED_PREFILL_KWARGS),
-])
-def test_models_with_multiple_audios(vllm_runner,
-                                     audio_assets: AudioTestAssets, dtype: str,
-                                     max_tokens: int, num_logprobs: int,
-                                     vllm_kwargs: dict) -> None:
-
-    vllm_prompt = _get_prompt(len(audio_assets), MULTI_AUDIO_PROMPT,
-                              VLLM_PLACEHOLDER)
+@pytest.mark.parametrize(
+    "vllm_kwargs",
+    [
+        pytest.param({}, marks=pytest.mark.cpu_model),
+        pytest.param(CHUNKED_PREFILL_KWARGS),
+    ],
+)
+def test_models_with_multiple_audios(
+    vllm_runner,
+    audio_assets: AudioTestAssets,
+    dtype: str,
+    max_tokens: int,
+    num_logprobs: int,
+    vllm_kwargs: dict,
+) -> None:
+    vllm_prompt = _get_prompt(len(audio_assets), MULTI_AUDIO_PROMPT, VLLM_PLACEHOLDER)
     run_multi_audio_test(
         vllm_runner,
-        [(vllm_prompt, [audio.audio_and_sample_rate
-                        for audio in audio_assets])],
+        [(vllm_prompt, [audio.audio_and_sample_rate for audio in audio_assets])],
         MODEL_NAME,
         dtype=dtype,
         max_tokens=max_tokens,
@@ -149,28 +160,25 @@ def test_models_with_multiple_audios(vllm_runner,
 async def test_online_serving(client, audio_assets: AudioTestAssets):
     """Exercises online serving with/without chunked prefill enabled."""
 
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            *[{
-                "type": "audio_url",
-                "audio_url": {
-                    "url": audio.url
-                }
-            } for audio in audio_assets],
-            {
-                "type":
-                "text",
-                "text":
-                f"What's happening in these {len(audio_assets)} audio clips?"
-            },
-        ],
-    }]
-
-    chat_completion = await client.chat.completions.create(model=MODEL_NAME,
-                                                           messages=messages,
-                                                           max_tokens=10)
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                *[
+                    {"type": "audio_url", "audio_url": {"url": audio.url}}
+                    for audio in audio_assets
+                ],
+                {
+                    "type": "text",
+                    "text": f"What's happening in these {len(audio_assets)} audio clips?",
+                },
+            ],
+        }
+    ]
+
+    chat_completion = await client.chat.completions.create(
+        model=MODEL_NAME, messages=messages, max_tokens=10
+    )
 
     assert len(chat_completion.choices) == 1
     choice = chat_completion.choices[0]
diff --git a/tests/models/multimodal/generation/test_voxtral.py b/tests/models/multimodal/generation/test_voxtral.py
index b4439dfe020c..aa9628435e4d 100644
--- a/tests/models/multimodal/generation/test_voxtral.py
+++ b/tests/models/multimodal/generation/test_voxtral.py
@@ -6,8 +6,12 @@
 import pytest
 import pytest_asyncio
 from mistral_common.audio import Audio
-from mistral_common.protocol.instruct.messages import (AudioChunk, RawAudio,
-                                                       TextChunk, UserMessage)
+from mistral_common.protocol.instruct.messages import (
+    AudioChunk,
+    RawAudio,
+    TextChunk,
+    UserMessage,
+)
 
 from vllm.transformers_utils.tokenizer import MistralTokenizer
 
@@ -17,8 +21,12 @@
 
 MODEL_NAME = "mistralai/Voxtral-Mini-3B-2507"
 MISTRAL_FORMAT_ARGS = [
-    "--tokenizer_mode", "mistral", "--config_format", "mistral",
-    "--load_format", "mistral"
+    "--tokenizer_mode",
+    "mistral",
+    "--config_format",
+    "mistral",
+    "--load_format",
+    "mistral",
 ]
 
 
@@ -30,10 +38,9 @@ def server(request, audio_assets: AudioTestAssets):
         json.dumps({"audio": len(audio_assets)}),
     ] + MISTRAL_FORMAT_ARGS
 
-    with RemoteOpenAIServer(MODEL_NAME,
-                            args,
-                            env_dict={"VLLM_AUDIO_FETCH_TIMEOUT":
-                                      "30"}) as remote_server:
+    with RemoteOpenAIServer(
+        MODEL_NAME, args, env_dict={"VLLM_AUDIO_FETCH_TIMEOUT": "30"}
+    ) as remote_server:
         yield remote_server
 
 
@@ -64,15 +71,17 @@ def _get_prompt(audio_assets, question):
 @pytest.mark.parametrize("dtype", ["half"])
 @pytest.mark.parametrize("max_tokens", [128])
 @pytest.mark.parametrize("num_logprobs", [5])
-def test_models_with_multiple_audios(vllm_runner,
-                                     audio_assets: AudioTestAssets, dtype: str,
-                                     max_tokens: int,
-                                     num_logprobs: int) -> None:
+def test_models_with_multiple_audios(
+    vllm_runner,
+    audio_assets: AudioTestAssets,
+    dtype: str,
+    max_tokens: int,
+    num_logprobs: int,
+) -> None:
     vllm_prompt = _get_prompt(audio_assets, MULTI_AUDIO_PROMPT)
     run_multi_audio_test(
         vllm_runner,
-        [(vllm_prompt, [audio.audio_and_sample_rate
-                        for audio in audio_assets])],
+        [(vllm_prompt, [audio.audio_and_sample_rate for audio in audio_assets])],
         MODEL_NAME,
         dtype=dtype,
         max_tokens=max_tokens,
@@ -92,23 +101,22 @@ def asset_to_chunk(asset):
         return audio_dict
 
     audio_chunks = [asset_to_chunk(asset) for asset in audio_assets]
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            *audio_chunks,
-            {
-                "type":
-                "text",
-                "text":
-                f"What's happening in these {len(audio_assets)} audio clips?"
-            },
-        ],
-    }]
-
-    chat_completion = await client.chat.completions.create(model=MODEL_NAME,
-                                                           messages=messages,
-                                                           max_tokens=10)
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                *audio_chunks,
+                {
+                    "type": "text",
+                    "text": f"What's happening in these {len(audio_assets)} audio clips?",
+                },
+            ],
+        }
+    ]
+
+    chat_completion = await client.chat.completions.create(
+        model=MODEL_NAME, messages=messages, max_tokens=10
+    )
 
     assert len(chat_completion.choices) == 1
     choice = chat_completion.choices[0]
diff --git a/tests/models/multimodal/generation/test_whisper.py b/tests/models/multimodal/generation/test_whisper.py
index e0e9980b8833..766f09b0d320 100644
--- a/tests/models/multimodal/generation/test_whisper.py
+++ b/tests/models/multimodal/generation/test_whisper.py
@@ -12,8 +12,7 @@
 
 PROMPTS = [
     {
-        "prompt":
-        "<|startoftranscript|><|en|><|transcribe|><|notimestamps|>",
+        "prompt": "<|startoftranscript|><|en|><|transcribe|><|notimestamps|>",
         "multi_modal_data": {
             "audio": AudioAsset("mary_had_lamb").audio_and_sample_rate,
         },
@@ -25,9 +24,8 @@
                 "audio": AudioAsset("winning_call").audio_and_sample_rate,
             },
         },
-        "decoder_prompt":
-        "<|startoftranscript|><|en|><|transcribe|><|notimestamps|>",
-    }
+        "decoder_prompt": "<|startoftranscript|><|en|><|transcribe|><|notimestamps|>",
+    },
 ]
 
 EXPECTED = {
@@ -41,7 +39,7 @@
         " is June and the third base. They're going to wave him in. The throw"
         " to the plate will be late. The Mariners are going to play for the"
         " American League Championship. I don't believe it. It just continues"
-        " by all five."
+        " by all five.",
     ],
     "openai/whisper-small": [
         " The first words I spoke in the original pornograph. A little piece"
@@ -51,7 +49,7 @@
         " comes joy. Here is Junior to third base. They're gonna wave him"
         " in. The throw to the plate will be late. The Mariners are going to"
         " play for the American League Championship. I don't believe it. It"
-        " just continues. My, oh my."
+        " just continues. My, oh my.",
     ],
     "openai/whisper-medium": [
         " The first words I spoke in the original phonograph, a little piece"
@@ -62,7 +60,7 @@
         " Jorgen at third base. They're going to wave him in. The throw to the"
         " plate will be late. The Mariners are going to play for the American"
         " League Championship. I don't believe it. It just continues. My, oh"
-        " my."
+        " my.",
     ],
     "openai/whisper-large-v3": [
         " The first words I spoke in the original phonograph, a little piece"
@@ -73,7 +71,7 @@
         " Junior to third base. They're going to wave him in. The throw to the"
         " plate will be late. The Mariners are going to play for the American"
         " League Championship. I don't believe it. It just continues. My, oh,"
-        " my."
+        " my.",
     ],
     "openai/whisper-large-v3-turbo": [
         " The first words I spoke in the original phonograph, a little piece"
@@ -84,8 +82,8 @@
         " Junior to third base. They're going to wave him in. The throw to the"
         " plate will be late. The Mariners are going to play for the American"
         " League Championship. I don't believe it. It just continues. My, oh,"
-        " my."
-    ]
+        " my.",
+    ],
 }
 
 
@@ -100,11 +98,11 @@ def run_test(
     expected_list = EXPECTED[model] * 10
 
     with vllm_runner(
-            model,
-            dtype="half",
-            max_model_len=448,
-            tensor_parallel_size=tensor_parallel_size,
-            distributed_executor_backend=distributed_executor_backend,
+        model,
+        dtype="half",
+        max_model_len=448,
+        tensor_parallel_size=tensor_parallel_size,
+        distributed_executor_backend=distributed_executor_backend,
     ) as vllm_model:
         llm = vllm_model.llm
 
diff --git a/tests/models/multimodal/generation/vlm_utils/builders.py b/tests/models/multimodal/generation/vlm_utils/builders.py
index 133d5d6ee2ef..096931cca09f 100644
--- a/tests/models/multimodal/generation/vlm_utils/builders.py
+++ b/tests/models/multimodal/generation/vlm_utils/builders.py
@@ -1,7 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-"""Helpers for building inputs that can be leveraged for different test types.
-"""
+"""Helpers for building inputs that can be leveraged for different test types."""
+
 from collections.abc import Iterable
 from pathlib import PosixPath
 from typing import Callable, Optional, Union
@@ -10,20 +10,30 @@
 
 from vllm.multimodal.audio import AudioResampler
 from vllm.multimodal.image import rescale_image_size
-from vllm.multimodal.video import (rescale_video_size, resize_video,
-                                   sample_frames_from_video)
+from vllm.multimodal.video import (
+    rescale_video_size,
+    resize_video,
+    sample_frames_from_video,
+)
 
 from .....conftest import AudioTestAssets, ImageTestAssets, VideoTestAssets
-from .types import (SINGLE_AUDIO_BASE_PROMPT, SINGLE_IMAGE_BASE_PROMPTS,
-                    TEST_AUDIO_PLACEHOLDER, TEST_IMG_PLACEHOLDER,
-                    TEST_VIDEO_PLACEHOLDER, VIDEO_BASE_PROMPT,
-                    ImageSizeWrapper, PromptWithMultiModalInput, SizeType,
-                    VLMTestInfo)
-
-
-def replace_test_placeholder(prompt: str, mm_idx_to_prompt: Callable[[int],
-                                                                     str],
-                             test_placeholder: str) -> str:
+from .types import (
+    SINGLE_AUDIO_BASE_PROMPT,
+    SINGLE_IMAGE_BASE_PROMPTS,
+    TEST_AUDIO_PLACEHOLDER,
+    TEST_IMG_PLACEHOLDER,
+    TEST_VIDEO_PLACEHOLDER,
+    VIDEO_BASE_PROMPT,
+    ImageSizeWrapper,
+    PromptWithMultiModalInput,
+    SizeType,
+    VLMTestInfo,
+)
+
+
+def replace_test_placeholder(
+    prompt: str, mm_idx_to_prompt: Callable[[int], str], test_placeholder: str
+) -> str:
     """Given a prompt, replaces each test placeholder with the
     model-specific tag.
     """
@@ -35,11 +45,13 @@ def replace_test_placeholder(prompt: str, mm_idx_to_prompt: Callable[[int],
     return img_prompt
 
 
-def get_model_prompts(base_prompts: Iterable[str],
-                      img_idx_to_prompt: Optional[Callable[[int], str]],
-                      video_idx_to_prompt: Optional[Callable[[int], str]],
-                      audio_idx_to_prompt: Optional[Callable[[int], str]],
-                      prompt_formatter: Callable[[str], str]) -> list[str]:
+def get_model_prompts(
+    base_prompts: Iterable[str],
+    img_idx_to_prompt: Optional[Callable[[int], str]],
+    video_idx_to_prompt: Optional[Callable[[int], str]],
+    audio_idx_to_prompt: Optional[Callable[[int], str]],
+    prompt_formatter: Callable[[str], str],
+) -> list[str]:
     """Given a model-agnostic base prompt and test configuration for a model(s)
     to be tested, update the media placeholders and apply the prompt formatting
     to get the test prompt string for this model.
@@ -56,19 +68,19 @@ def get_model_prompts(base_prompts: Iterable[str],
         # Replace the multimodal placeholders in the base prompt with
         # the correct ones for the model that we are testing
         if img_idx_to_prompt:
-            base_prompt = replace_test_placeholder(base_prompt,
-                                                   img_idx_to_prompt,
-                                                   TEST_IMG_PLACEHOLDER)
+            base_prompt = replace_test_placeholder(
+                base_prompt, img_idx_to_prompt, TEST_IMG_PLACEHOLDER
+            )
 
         if video_idx_to_prompt:
-            base_prompt = replace_test_placeholder(base_prompt,
-                                                   video_idx_to_prompt,
-                                                   TEST_VIDEO_PLACEHOLDER)
+            base_prompt = replace_test_placeholder(
+                base_prompt, video_idx_to_prompt, TEST_VIDEO_PLACEHOLDER
+            )
 
         if audio_idx_to_prompt:
-            base_prompt = replace_test_placeholder(base_prompt,
-                                                   audio_idx_to_prompt,
-                                                   TEST_AUDIO_PLACEHOLDER)
+            base_prompt = replace_test_placeholder(
+                base_prompt, audio_idx_to_prompt, TEST_AUDIO_PLACEHOLDER
+            )
 
         # Apply the prompt formatter to wrap the base prompt with
         # the correct media placeholders to get the model test prompt
@@ -84,14 +96,15 @@ def build_single_image_inputs_from_test_info(
     tmp_path: Optional[PosixPath] = None,
 ) -> list[PromptWithMultiModalInput]:
     if test_info.prompt_formatter is None:
-        raise ValueError(
-            "Prompt formatter must be set to build single image inputs")
+        raise ValueError("Prompt formatter must be set to build single image inputs")
 
-    model_prompts = get_model_prompts(test_info.single_image_prompts,
-                                      test_info.img_idx_to_prompt,
-                                      test_info.video_idx_to_prompt,
-                                      test_info.audio_idx_to_prompt,
-                                      test_info.prompt_formatter)
+    model_prompts = get_model_prompts(
+        test_info.single_image_prompts,
+        test_info.img_idx_to_prompt,
+        test_info.video_idx_to_prompt,
+        test_info.audio_idx_to_prompt,
+        test_info.prompt_formatter,
+    )
 
     # For models that require a local path / URL encoded in the image; export
     # assets and encode into tmp_path for this test. This should be avoided
@@ -110,8 +123,8 @@ def build_single_image_inputs_from_test_info(
 
 
 def build_single_image_inputs(
-        images, model_prompts,
-        size_wrapper: ImageSizeWrapper) -> list[PromptWithMultiModalInput]:
+    images, model_prompts, size_wrapper: ImageSizeWrapper
+) -> list[PromptWithMultiModalInput]:
     # For every image / prompt pair, get a pair containing two lists of
     # length size_factors, where the first contains duplicates of the model
     # prompt [str], and the second contains copies of the image after being
@@ -125,7 +138,8 @@ def build_single_image_inputs(
                 apply_image_size_scaling(image, size, size_wrapper.type)
                 for size in size_wrapper.data
             ],
-        ) for image, prompt in zip(images, model_prompts)
+        )
+        for image, prompt in zip(images, model_prompts)
     ]
 
 
@@ -136,14 +150,15 @@ def build_multi_image_inputs_from_test_info(
     tmp_path: Optional[PosixPath] = None,
 ) -> list[PromptWithMultiModalInput]:
     if test_info.prompt_formatter is None:
-        raise ValueError(
-            "Prompt formatter must be set to build multi image inputs")
+        raise ValueError("Prompt formatter must be set to build multi image inputs")
 
-    model_prompts = get_model_prompts([test_info.multi_image_prompt],
-                                      test_info.img_idx_to_prompt,
-                                      test_info.video_idx_to_prompt,
-                                      test_info.audio_idx_to_prompt,
-                                      test_info.prompt_formatter)
+    model_prompts = get_model_prompts(
+        [test_info.multi_image_prompt],
+        test_info.img_idx_to_prompt,
+        test_info.video_idx_to_prompt,
+        test_info.audio_idx_to_prompt,
+        test_info.prompt_formatter,
+    )
 
     if test_info.prompt_path_encoder is not None:
         if tmp_path is None:
@@ -164,16 +179,20 @@ def build_multi_image_inputs_from_test_info(
 
 
 def build_multi_image_inputs(
-        image_lists, model_prompts,
-        size_wrapper: ImageSizeWrapper) -> list[PromptWithMultiModalInput]:
+    image_lists, model_prompts, size_wrapper: ImageSizeWrapper
+) -> list[PromptWithMultiModalInput]:
     return [
         PromptWithMultiModalInput(
             prompts=[prompt for _ in size_wrapper.data],
-            image_data=[[
-                apply_image_size_scaling(image, size, size_wrapper.type)
-                for image in images
-            ] for size in size_wrapper.data],
-        ) for images, prompt in zip(image_lists, model_prompts)
+            image_data=[
+                [
+                    apply_image_size_scaling(image, size, size_wrapper.type)
+                    for image in images
+                ]
+                for size in size_wrapper.data
+            ],
+        )
+        for images, prompt in zip(image_lists, model_prompts)
     ]
 
 
@@ -185,10 +204,10 @@ def build_embedding_inputs_from_test_info(
     # These conditions will always be true if invoked through filtering,
     # but we still check them in case this is ever called directly
     if test_info.prompt_formatter is None:
-        raise ValueError(
-            "Prompt formatter must be set to build image embedding inputs")
-    if size_wrapper.type != SizeType.SIZE_FACTOR or not \
-            all(factor == 1.0 for factor in size_wrapper.data):
+        raise ValueError("Prompt formatter must be set to build image embedding inputs")
+    if size_wrapper.type != SizeType.SIZE_FACTOR or not all(
+        factor == 1.0 for factor in size_wrapper.data
+    ):
         raise ValueError("Embedding tests require constant (1.0) size factors")
     if test_info.convert_assets_to_embeddings is None:
         raise ValueError("No conversion func for getting embeddings found")
@@ -209,8 +228,7 @@ def build_embedding_inputs_from_test_info(
     assert len(images) == len(model_prompts)
 
     inputs = build_single_image_inputs(images, model_prompts, size_wrapper)
-    vllm_embeddings = build_single_image_inputs(embeds, model_prompts,
-                                                size_wrapper)
+    vllm_embeddings = build_single_image_inputs(embeds, model_prompts, size_wrapper)
     return inputs, vllm_embeddings
 
 
@@ -235,21 +253,22 @@ def build_video_inputs_from_test_info(
         for asset in video_assets
     ]
 
-    video_scaler = (resize_video if size_wrapper.type == SizeType.FIXED_SIZE
-                    else rescale_video_size)
+    video_scaler = (
+        resize_video if size_wrapper.type == SizeType.FIXED_SIZE else rescale_video_size
+    )
 
     return [
         PromptWithMultiModalInput(
             prompts=[prompt for _ in size_wrapper.data],
-            video_data=[
-                video_scaler(video, size) for size in size_wrapper.data
-            ],
-        ) for video, prompt in zip(sampled_vids, model_prompts)
+            video_data=[video_scaler(video, size) for size in size_wrapper.data],
+        )
+        for video, prompt in zip(sampled_vids, model_prompts)
     ]
 
 
-def apply_image_size_scaling(image, size: Union[float, tuple[int, int]],
-                             size_type: SizeType):
+def apply_image_size_scaling(
+    image, size: Union[float, tuple[int, int]], size_type: SizeType
+):
     """Applies a size scaler to one image; this can be an image size factor,
     which scales the image while maintaining the aspect ratio"""
     # Special case for embeddings; if it's a tensor, it's only valid if we
@@ -285,13 +304,16 @@ def build_audio_inputs_from_test_info(
         method="librosa",
     )
     audios = [asset.audio_and_sample_rate for asset in audio_assets]
-    resampled_audios = [(
-        resampler.resample(
-            audio,
-            orig_sr=sr,
-        ),
-        int(resampler.target_sr),
-    ) for audio, sr in audios]
+    resampled_audios = [
+        (
+            resampler.resample(
+                audio,
+                orig_sr=sr,
+            ),
+            int(resampler.target_sr),
+        )
+        for audio, sr in audios
+    ]
 
     return [
         PromptWithMultiModalInput(
diff --git a/tests/models/multimodal/generation/vlm_utils/case_filtering.py b/tests/models/multimodal/generation/vlm_utils/case_filtering.py
index 1edb51213534..89d5829fd0f8 100644
--- a/tests/models/multimodal/generation/vlm_utils/case_filtering.py
+++ b/tests/models/multimodal/generation/vlm_utils/case_filtering.py
@@ -4,19 +4,28 @@
 modality, getting all combinations (similar to pytest's parametrization),
 handling multimodal placeholder substitution, and so on.
 """
+
 import itertools
 from collections import OrderedDict
 from collections.abc import Iterable
 
 import pytest
 
-from .types import (EMBEDDING_SIZE_FACTORS, ExpandableVLMTestArgs,
-                    ImageSizeWrapper, SizeType, VLMTestInfo, VLMTestType)
+from .types import (
+    EMBEDDING_SIZE_FACTORS,
+    ExpandableVLMTestArgs,
+    ImageSizeWrapper,
+    SizeType,
+    VLMTestInfo,
+    VLMTestType,
+)
 
 
 def get_filtered_test_settings(
-        test_settings: dict[str, VLMTestInfo], test_type: VLMTestType,
-        new_proc_per_test: bool) -> dict[str, VLMTestInfo]:
+    test_settings: dict[str, VLMTestInfo],
+    test_type: VLMTestType,
+    new_proc_per_test: bool,
+) -> dict[str, VLMTestInfo]:
     """Given the dict of potential test settings to run, return a subdict
     of tests who have the current test type enabled with the matching val for
     fork_per_test.
@@ -25,7 +34,8 @@ def get_filtered_test_settings(
     def matches_test_type(test_info: VLMTestInfo, test_type: VLMTestType):
         return test_info.test_type == test_type or (
             isinstance(test_info.test_type, Iterable)
-            and test_type in test_info.test_type)
+            and test_type in test_info.test_type
+        )
 
     matching_tests = {}
     for test_name, test_info in test_settings.items():
@@ -36,62 +46,69 @@ def matches_test_type(test_info: VLMTestInfo, test_type: VLMTestType):
                 assert test_info.convert_assets_to_embeddings is not None
             # Custom test inputs need to explicitly define the mm limit/inputs
             if matches_test_type(test_info, VLMTestType.CUSTOM_INPUTS):
-                assert (test_info.custom_test_opts is not None
-                        and isinstance(test_info.custom_test_opts, Iterable))
+                assert test_info.custom_test_opts is not None and isinstance(
+                    test_info.custom_test_opts, Iterable
+                )
             # For all types besides custom inputs, we need a prompt formatter
             else:
                 assert test_info.prompt_formatter is not None
 
             # Everything looks okay; keep if this is correct proc handling
-            if (test_info.distributed_executor_backend
-                    is not None) == new_proc_per_test:
+            if (
+                test_info.distributed_executor_backend is not None
+            ) == new_proc_per_test:
                 matching_tests[test_name] = test_info
 
     return matching_tests
 
 
-def get_parametrized_options(test_settings: dict[str, VLMTestInfo],
-                             test_type: VLMTestType,
-                             create_new_process_for_each_test: bool):
+def get_parametrized_options(
+    test_settings: dict[str, VLMTestInfo],
+    test_type: VLMTestType,
+    create_new_process_for_each_test: bool,
+):
     """Converts all of our VLMTestInfo into an expanded list of parameters.
     This is similar to nesting pytest parametrize calls, but done directly
     through an itertools product so that each test can set things like
     size factors etc, while still running in isolated test cases.
     """
     matching_tests = get_filtered_test_settings(
-        test_settings, test_type, create_new_process_for_each_test)
+        test_settings, test_type, create_new_process_for_each_test
+    )
 
     # Ensure that something is wrapped as an iterable it's not already
-    ensure_wrapped = lambda e: e if isinstance(e, (list, tuple)) else (e, )
+    ensure_wrapped = lambda e: e if isinstance(e, (list, tuple)) else (e,)
 
     def get_model_type_cases(model_type: str, test_info: VLMTestInfo):
         # This is essentially the same as nesting a bunch of mark.parametrize
         # decorators, but we do it programmatically to allow overrides for on
         # a per-model basis, while still being able to execute each of these
         # as individual test cases in pytest.
-        iter_kwargs = OrderedDict([
-            ("model", ensure_wrapped(test_info.models)),
-            ("max_tokens", ensure_wrapped(test_info.max_tokens)),
-            ("num_logprobs", ensure_wrapped(test_info.num_logprobs)),
-            ("dtype", ensure_wrapped(test_info.dtype)),
-            ("distributed_executor_backend",
-             ensure_wrapped(test_info.distributed_executor_backend)),
-        ])
+        iter_kwargs = OrderedDict(
+            [
+                ("model", ensure_wrapped(test_info.models)),
+                ("max_tokens", ensure_wrapped(test_info.max_tokens)),
+                ("num_logprobs", ensure_wrapped(test_info.num_logprobs)),
+                ("dtype", ensure_wrapped(test_info.dtype)),
+                (
+                    "distributed_executor_backend",
+                    ensure_wrapped(test_info.distributed_executor_backend),
+                ),
+            ]
+        )
 
         # num_frames is video only
         if test_type == VLMTestType.VIDEO:
-            iter_kwargs["num_video_frames"] = ensure_wrapped(
-                test_info.num_video_frames)
+            iter_kwargs["num_video_frames"] = ensure_wrapped(test_info.num_video_frames)
 
         # No sizes passed for custom inputs, since inputs are directly provided
         if test_type not in (VLMTestType.CUSTOM_INPUTS, VLMTestType.AUDIO):
             wrapped_sizes = get_wrapped_test_sizes(test_info, test_type)
             if wrapped_sizes is None:
-                raise ValueError(
-                    f"Sizes must be set for test type {test_type}")
+                raise ValueError(f"Sizes must be set for test type {test_type}")
             iter_kwargs["size_wrapper"] = wrapped_sizes
 
-        #Otherwise expand the custom test options instead
+        # Otherwise expand the custom test options instead
         elif test_type == VLMTestType.CUSTOM_INPUTS:
             if test_info.custom_test_opts is None:
                 raise ValueError("Test has type CUSTOM_INPUTS, but none given")
@@ -121,8 +138,8 @@ def get_model_type_cases(model_type: str, test_info: VLMTestInfo):
 
 
 def get_wrapped_test_sizes(
-        test_info: VLMTestInfo,
-        test_type: VLMTestType) -> tuple[ImageSizeWrapper, ...]:
+    test_info: VLMTestInfo, test_type: VLMTestType
+) -> tuple[ImageSizeWrapper, ...]:
     """Given a test info which may have size factors or fixed sizes, wrap them
     and combine them into an iterable, each of which will be used in parameter
     expansion.
@@ -133,18 +150,18 @@ def get_wrapped_test_sizes(
     """
     # If it is an embedding test, we always use the EMBEDDING_SIZE_FACTORS
     if test_type == VLMTestType.EMBEDDING:
-        return tuple([
-            ImageSizeWrapper(type=SizeType.SIZE_FACTOR, data=factor)
-            for factor in EMBEDDING_SIZE_FACTORS
-        ])
+        return tuple(
+            [
+                ImageSizeWrapper(type=SizeType.SIZE_FACTOR, data=factor)
+                for factor in EMBEDDING_SIZE_FACTORS
+            ]
+        )
     # Audio and Custom inputs have preprocessed inputs
     elif test_type in (VLMTestType.AUDIO, VLMTestType.CUSTOM_INPUTS):
         return tuple()
 
-    size_factors = test_info.image_size_factors \
-        if test_info.image_size_factors else []
-    fixed_sizes = test_info.image_sizes \
-        if test_info.image_sizes else []
+    size_factors = test_info.image_size_factors if test_info.image_size_factors else []
+    fixed_sizes = test_info.image_sizes if test_info.image_sizes else []
 
     wrapped_factors = [
         ImageSizeWrapper(type=SizeType.SIZE_FACTOR, data=factor)
@@ -152,8 +169,7 @@ def get_wrapped_test_sizes(
     ]
 
     wrapped_sizes = [
-        ImageSizeWrapper(type=SizeType.FIXED_SIZE, data=size)
-        for size in fixed_sizes
+        ImageSizeWrapper(type=SizeType.FIXED_SIZE, data=size) for size in fixed_sizes
     ]
 
     return tuple(wrapped_factors + wrapped_sizes)
diff --git a/tests/models/multimodal/generation/vlm_utils/core.py b/tests/models/multimodal/generation/vlm_utils/core.py
index 11d44120b875..0c11f5f9b082 100644
--- a/tests/models/multimodal/generation/vlm_utils/core.py
+++ b/tests/models/multimodal/generation/vlm_utils/core.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Core test implementation to be shared across modalities."""
+
 from typing import Any, Callable, Optional
 
 import torch
@@ -70,22 +71,23 @@ def run_test(
     if model_info.hf_overrides:
         vllm_runner_kwargs_["hf_overrides"] = model_info.hf_overrides
     if model_info.skip_tokenizer_init:
-        vllm_runner_kwargs_[
-            "skip_tokenizer_init"] = model_info.skip_tokenizer_init
+        vllm_runner_kwargs_["skip_tokenizer_init"] = model_info.skip_tokenizer_init
 
     if vllm_runner_kwargs:
         vllm_runner_kwargs_.update(vllm_runner_kwargs)
 
-    with vllm_runner(model,
-                     max_model_len=max_model_len,
-                     max_num_seqs=max_num_seqs,
-                     dtype=dtype,
-                     limit_mm_per_prompt=limit_mm_per_prompt,
-                     tensor_parallel_size=tensor_parallel_size,
-                     distributed_executor_backend=distributed_executor_backend,
-                     enforce_eager=enforce_eager,
-                     runner=runner,
-                     **vllm_runner_kwargs_) as vllm_model:
+    with vllm_runner(
+        model,
+        max_model_len=max_model_len,
+        max_num_seqs=max_num_seqs,
+        dtype=dtype,
+        limit_mm_per_prompt=limit_mm_per_prompt,
+        tensor_parallel_size=tensor_parallel_size,
+        distributed_executor_backend=distributed_executor_backend,
+        enforce_eager=enforce_eager,
+        runner=runner,
+        **vllm_runner_kwargs_,
+    ) as vllm_model:
         tokenizer = vllm_model.llm.get_tokenizer()
 
         vllm_kwargs: dict[str, Any] = {}
@@ -95,21 +97,19 @@ def run_test(
             vllm_kwargs["stop"] = stop_str
 
         for prompts, image_data, video_data, audio_data in vllm_inputs:
-            mm_data = dict(images=image_data,
-                           videos=video_data,
-                           audios=audio_data)
+            mm_data = dict(images=image_data, videos=video_data, audios=audio_data)
             vllm_kwargs_with_mm_data = vllm_kwargs | mm_data
             vllm_output = vllm_model.generate_greedy_logprobs(
                 prompts,
                 max_tokens,
                 num_logprobs=num_logprobs,
-                **vllm_kwargs_with_mm_data)
+                **vllm_kwargs_with_mm_data,
+            )
             vllm_outputs_per_mm.append(vllm_output)
 
-    hf_model = hf_runner(model,
-                         dtype=dtype,
-                         auto_cls=auto_cls,
-                         model_kwargs=hf_model_kwargs)
+    hf_model = hf_runner(
+        model, dtype=dtype, auto_cls=auto_cls, model_kwargs=hf_model_kwargs
+    )
 
     # Some models need to patch things like the model processor, e.g., internvl
     if patch_hf_runner is not None:
@@ -129,16 +129,15 @@ def run_test(
             hf_kwargs["stop_strings"] = stop_str
 
         for prompts, image_data, video_data, audio_data in inputs:
-            mm_data = dict(images=image_data,
-                           videos=video_data,
-                           audios=audio_data)
+            mm_data = dict(images=image_data, videos=video_data, audios=audio_data)
             hf_kwargs_with_mm_data = hf_kwargs | mm_data
             hf_output = hf_model.generate_greedy_logprobs_limit(
                 prompts,
                 max_tokens,
                 num_logprobs=num_logprobs,
                 tokenizer=tokenizer,
-                **hf_kwargs_with_mm_data)
+                **hf_kwargs_with_mm_data,
+            )
             hf_outputs_per_mm.append(hf_output)
 
     # Apply output processing / sanitation to the vLLM and HF runner results
@@ -150,8 +149,7 @@ def run_test(
         second_runner_processor=vllm_output_post_proc,
     )
 
-    for hf_outputs, vllm_outputs in zip(hf_outputs_per_mm,
-                                        vllm_outputs_per_mm):
+    for hf_outputs, vllm_outputs in zip(hf_outputs_per_mm, vllm_outputs_per_mm):
         # This is usually check_logprobs_close, but it's passed through to
         # allow things like check_outputs_equal where needed
         comparator(
@@ -171,15 +169,19 @@ def process_runner_outputs(
 ):
     """Applies the runner processor(s) to the runner outputs, if any."""
     if first_runner_processor is not None:
-        first_runner_outputs = process_outputs(first_runner_processor, model,
-                                               first_runner_outputs)
+        first_runner_outputs = process_outputs(
+            first_runner_processor, model, first_runner_outputs
+        )
     if second_runner_processor is not None:
-        second_runner_outputs = process_outputs(second_runner_processor, model,
-                                                second_runner_outputs)
+        second_runner_outputs = process_outputs(
+            second_runner_processor, model, second_runner_outputs
+        )
     return first_runner_outputs, second_runner_outputs
 
 
 def process_outputs(output_processor, model, outputs_per_image):
     """Applies a model specific post-processor function to a runner's output"""
-    return [[output_processor(res, model) for res in outputs]
-            for outputs in outputs_per_image]
+    return [
+        [output_processor(res, model) for res in outputs]
+        for outputs in outputs_per_image
+    ]
diff --git a/tests/models/multimodal/generation/vlm_utils/custom_inputs.py b/tests/models/multimodal/generation/vlm_utils/custom_inputs.py
index e369416fc49c..32a945f25365 100644
--- a/tests/models/multimodal/generation/vlm_utils/custom_inputs.py
+++ b/tests/models/multimodal/generation/vlm_utils/custom_inputs.py
@@ -1,12 +1,16 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Custom input builders for edge-cases in different models."""
+
 from typing import Callable
 
 from vllm.assets.image import ImageAsset
 from vllm.multimodal.image import rescale_image_size
-from vllm.multimodal.video import (rescale_video_size, resize_video,
-                                   sample_frames_from_video)
+from vllm.multimodal.video import (
+    rescale_video_size,
+    resize_video,
+    sample_frames_from_video,
+)
 
 from .....conftest import IMAGE_ASSETS, VIDEO_ASSETS
 from .builders import build_multi_image_inputs, build_single_image_inputs
@@ -15,7 +19,7 @@
 
 def multi_image_multi_aspect_ratio_inputs(formatter: Callable[[str], str]):
     """Builds inputs for multi-image (varied sizes/aspect ratio) testing.
-    
+
     Args:
         formatter: model-specific prompt formatter.
     """
@@ -41,7 +45,7 @@ def multi_image_multi_aspect_ratio_inputs(formatter: Callable[[str], str]):
             stop_sign,
             rescale_image_size(stop_sign, 0.25),
             cherry_blossom.resize((183, 488)),
-            cherry_blossom.resize((488, 183))
+            cherry_blossom.resize((488, 183)),
         ],
         cherry_blossom,
     ]
@@ -54,10 +58,11 @@ def multi_image_multi_aspect_ratio_inputs(formatter: Callable[[str], str]):
     ]
 
 
-def multi_video_multi_aspect_ratio_inputs(formatter: Callable[[str], str],
-                                          num_frames: int = 16):
+def multi_video_multi_aspect_ratio_inputs(
+    formatter: Callable[[str], str], num_frames: int = 16
+):
     """Builds inputs for multi-video (varied sizes/aspect ratio) testing.
-    
+
     Args:
         formatter: model-specific prompt formatter.
     """
@@ -81,7 +86,7 @@ def multi_video_multi_aspect_ratio_inputs(formatter: Callable[[str], str],
             video,
             rescale_video_size(video, 0.25),
             resize_video(video, (183, 488)),
-            resize_video(video, (488, 183))
+            resize_video(video, (488, 183)),
         ],
         video,
     ]
@@ -96,7 +101,9 @@ def multi_video_multi_aspect_ratio_inputs(formatter: Callable[[str], str],
 
 def different_patch_input_cases_internvl():
     images = [asset.pil_image.resize((896, 896)) for asset in IMAGE_ASSETS]
-    formatter = lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>Assistant\n"  # noqa: E501
+    formatter = (
+        lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>Assistant\n"
+    )  # noqa: E501
     single_img_prompts = [
         "<image>\nWhat's the content in the center of the image?",
         "<image>\nWhat is the season?",
@@ -115,14 +122,14 @@ def different_patch_input_cases_internvl():
 
 
 def windows_attention_image_qwen2_5_vl():
-
     # image from regression issue: https://github.com/vllm-project/vllm/issues/15122 # noqa: E501
     image = ImageAsset("hato").pil_image
 
     question = "Describe the image."
     img_prompt = "<|vision_start|><|image_pad|><|vision_end|>"
-    prompt = (f"<|im_start|>User\n{img_prompt}{question}<|im_end|>\n"
-              "<|im_start|>assistant\n")
+    prompt = (
+        f"<|im_start|>User\n{img_prompt}{question}<|im_end|>\n<|im_start|>assistant\n"
+    )
 
     wrapped_sf = ImageSizeWrapper(type=SizeType.SIZE_FACTOR, data=[0.5])
     return build_single_image_inputs([image], [prompt], wrapped_sf)
@@ -136,8 +143,9 @@ def video_with_metadata_glm4_1v():
     formatted_prompt = f"<|user|>\n{video_prompt}{question}<|assistant|>\n"
 
     scales = [0.1, 0.2, 0.25]
-    video_input = [[(rescale_video_size(video_array, scale), metadata)]
-                   for scale in scales]
+    video_input = [
+        [(rescale_video_size(video_array, scale), metadata)] for scale in scales
+    ]
     prompts = [formatted_prompt] * len(video_input)
 
     return [
diff --git a/tests/models/multimodal/generation/vlm_utils/model_utils.py b/tests/models/multimodal/generation/vlm_utils/model_utils.py
index ba55450ec8a9..d217f2890419 100644
--- a/tests/models/multimodal/generation/vlm_utils/model_utils.py
+++ b/tests/models/multimodal/generation/vlm_utils/model_utils.py
@@ -4,6 +4,7 @@
 for manipulating the input / output of HF & vLLM test runners, which are
 typically specific to a small subset of models.
 """
+
 import types
 from pathlib import PosixPath
 from typing import Optional, Union
@@ -15,8 +16,13 @@
 import regex as re
 import torch
 from PIL.Image import Image
-from transformers import (AutoConfig, AutoTokenizer, BatchFeature,
-                          GenerationConfig, GenerationMixin)
+from transformers import (
+    AutoConfig,
+    AutoTokenizer,
+    BatchFeature,
+    GenerationConfig,
+    GenerationMixin,
+)
 from transformers.video_utils import VideoMetadata
 
 from vllm.logprobs import SampleLogprobs
@@ -27,8 +33,7 @@
 
 
 ####### vLLM output processors functions
-def blip2_vllm_to_hf_output(vllm_output: RunnerOutput,
-                            model: str) -> RunnerOutput:
+def blip2_vllm_to_hf_output(vllm_output: RunnerOutput, model: str) -> RunnerOutput:
     """Sanitize vllm output [blip2 models] to be comparable with hf output."""
     _, output_str, out_logprobs = vllm_output
 
@@ -42,8 +47,7 @@ def blip2_vllm_to_hf_output(vllm_output: RunnerOutput,
     return hf_output_ids, hf_output_str, out_logprobs
 
 
-def fuyu_vllm_to_hf_output(vllm_output: RunnerOutput,
-                           model: str) -> RunnerOutput:
+def fuyu_vllm_to_hf_output(vllm_output: RunnerOutput, model: str) -> RunnerOutput:
     """Sanitize vllm output [fuyu models] to be comparable with hf output."""
     output_ids, output_str, out_logprobs = vllm_output
 
@@ -53,8 +57,8 @@ def fuyu_vllm_to_hf_output(vllm_output: RunnerOutput,
 
 
 def qwen_vllm_to_hf_output(
-        vllm_output: RunnerOutput,
-        model: str) -> tuple[list[int], str, Optional[SampleLogprobs]]:
+    vllm_output: RunnerOutput, model: str
+) -> tuple[list[int], str, Optional[SampleLogprobs]]:
     """Sanitize vllm output [qwen models] to be comparable with hf output."""
     output_ids, output_str, out_logprobs = vllm_output
 
@@ -64,8 +68,8 @@ def qwen_vllm_to_hf_output(
 
 
 def qwen2_vllm_to_hf_output(
-        vllm_output: RunnerOutput,
-        model: str) -> tuple[list[int], str, Optional[SampleLogprobs]]:
+    vllm_output: RunnerOutput, model: str
+) -> tuple[list[int], str, Optional[SampleLogprobs]]:
     """Sanitize vllm output [qwen2 models] to be comparable with hf output."""
     output_ids, output_str, out_logprobs = vllm_output
 
@@ -75,8 +79,8 @@ def qwen2_vllm_to_hf_output(
 
 
 def kimiv_vl_vllm_to_hf_output(
-        vllm_output: RunnerOutput,
-        model: str) -> tuple[list[int], str, Optional[SampleLogprobs]]:
+    vllm_output: RunnerOutput, model: str
+) -> tuple[list[int], str, Optional[SampleLogprobs]]:
     """Sanitize vllm output [kimi_vl models] to be comparable with hf output."""
     output_ids, output_str, out_logprobs = vllm_output
 
@@ -85,23 +89,25 @@ def kimiv_vl_vllm_to_hf_output(
     return output_ids, hf_output_str, out_logprobs
 
 
-def llava_image_vllm_to_hf_output(vllm_output: RunnerOutput,
-                                  model: str) -> RunnerOutput:
+def llava_image_vllm_to_hf_output(
+    vllm_output: RunnerOutput, model: str
+) -> RunnerOutput:
     config = AutoConfig.from_pretrained(model)
     mm_token_id = config.image_token_index
     return _llava_vllm_to_hf_output(vllm_output, model, mm_token_id)
 
 
 def llava_video_vllm_to_hf_output(
-        vllm_output: RunnerOutput,
-        model: str) -> tuple[list[int], str, Optional[SampleLogprobs]]:
+    vllm_output: RunnerOutput, model: str
+) -> tuple[list[int], str, Optional[SampleLogprobs]]:
     config = AutoConfig.from_pretrained(model)
     mm_token_id = config.video_token_index
     return _llava_vllm_to_hf_output(vllm_output, model, mm_token_id)
 
 
-def _llava_vllm_to_hf_output(vllm_output: RunnerOutput, model: str,
-                             mm_token_id: int) -> RunnerOutput:
+def _llava_vllm_to_hf_output(
+    vllm_output: RunnerOutput, model: str, mm_token_id: int
+) -> RunnerOutput:
     """Sanitize vllm output [Llava models] to be comparable with hf output."""
     output_ids, output_str, out_logprobs = vllm_output
 
@@ -109,7 +115,8 @@ def _llava_vllm_to_hf_output(vllm_output: RunnerOutput, model: str,
     eos_token_id = tokenizer.eos_token_id
 
     hf_output_ids = [
-        token_id for idx, token_id in enumerate(output_ids)
+        token_id
+        for idx, token_id in enumerate(output_ids)
         if token_id != mm_token_id or output_ids[idx - 1] != mm_token_id
     ]
 
@@ -128,8 +135,9 @@ def llava_onevision_hf_model_kwargs(model: str) -> dict:
     return config.to_dict()
 
 
-def llava_onevision_vllm_to_hf_output(vllm_output: RunnerOutput,
-                                      model: str) -> RunnerOutput:
+def llava_onevision_vllm_to_hf_output(
+    vllm_output: RunnerOutput, model: str
+) -> RunnerOutput:
     """Sanitize vllm output [llava-onevision] to compare with hf output."""
     output_ids, output_str, out_logprobs = vllm_output
 
@@ -140,7 +148,8 @@ def llava_onevision_vllm_to_hf_output(vllm_output: RunnerOutput,
     eos_token_id = tokenizer.eos_token_id
 
     hf_output_ids = [
-        token_id for idx, token_id in enumerate(output_ids)
+        token_id
+        for idx, token_id in enumerate(output_ids)
         if token_id != video_token_id or output_ids[idx - 1] != video_token_id
     ]
 
@@ -151,8 +160,7 @@ def llava_onevision_vllm_to_hf_output(vllm_output: RunnerOutput,
     return hf_output_ids, hf_output_str, out_logprobs
 
 
-def mantis_vllm_to_hf_output(vllm_output: RunnerOutput,
-                             model: str) -> RunnerOutput:
+def mantis_vllm_to_hf_output(vllm_output: RunnerOutput, model: str) -> RunnerOutput:
     """Sanitize vllm output [mantis] to compare with hf output."""
     output_ids, output_str, out_logprobs = vllm_output
 
@@ -161,8 +169,7 @@ def mantis_vllm_to_hf_output(vllm_output: RunnerOutput,
     return output_ids, hf_output_str, out_logprobs
 
 
-def phi3v_vllm_to_hf_output(vllm_output: RunnerOutput,
-                            model: str) -> RunnerOutput:
+def phi3v_vllm_to_hf_output(vllm_output: RunnerOutput, model: str) -> RunnerOutput:
     """Sanitize vllm output [phi3v] to be comparable with hf output."""
     _, output_str, out_logprobs = vllm_output
 
@@ -180,8 +187,7 @@ def phi3v_vllm_to_hf_output(vllm_output: RunnerOutput,
     return hf_output_ids, hf_output_str, out_logprobs
 
 
-def paligemma_vllm_to_hf_output(vllm_output: RunnerOutput,
-                                model: str) -> RunnerOutput:
+def paligemma_vllm_to_hf_output(vllm_output: RunnerOutput, model: str) -> RunnerOutput:
     """Sanitize vllm output to be comparable with hf output."""
     output_ids, output_str, out_logprobs = vllm_output
 
@@ -192,7 +198,8 @@ def paligemma_vllm_to_hf_output(vllm_output: RunnerOutput,
     eos_token_id = tokenizer.eos_token_id
 
     hf_output_ids = [
-        token_id for idx, token_id in enumerate(output_ids)
+        token_id
+        for idx, token_id in enumerate(output_ids)
         if token_id != image_token_id or output_ids[idx - 1] != image_token_id
     ]
 
@@ -205,46 +212,40 @@ def paligemma_vllm_to_hf_output(vllm_output: RunnerOutput,
 
 
 ####### Post-processors for HF outputs
-def deepseekvl2_trunc_hf_output(hf_output: RunnerOutput,
-                                model: str) -> RunnerOutput:
+def deepseekvl2_trunc_hf_output(hf_output: RunnerOutput, model: str) -> RunnerOutput:
     output_ids, output_str, out_logprobs = hf_output
     if output_str.endswith("<｜end▁of▁sentence｜>"):
         output_str = output_str.split("<｜end▁of▁sentence｜>")[0]
     return output_ids, output_str, out_logprobs
 
 
-def idefics3_trunc_hf_output(hf_output: RunnerOutput,
-                             model: str) -> RunnerOutput:
+def idefics3_trunc_hf_output(hf_output: RunnerOutput, model: str) -> RunnerOutput:
     output_ids, output_str, out_logprobs = hf_output
     if output_str.endswith("<end_of_utterance>"):
         output_str = output_str.split("<end_of_utterance>")[0]
     return output_ids, output_str, out_logprobs
 
 
-def smolvlm_trunc_hf_output(hf_output: RunnerOutput,
-                            model: str) -> RunnerOutput:
+def smolvlm_trunc_hf_output(hf_output: RunnerOutput, model: str) -> RunnerOutput:
     # Based on Idefics3
     return idefics3_trunc_hf_output(hf_output, model)
 
 
-def minicpmv_trunc_hf_output(hf_output: RunnerOutput,
-                             model: str) -> RunnerOutput:
+def minicpmv_trunc_hf_output(hf_output: RunnerOutput, model: str) -> RunnerOutput:
     output_ids, output_str, out_logprobs = hf_output
     if output_str.endswith("<|eot_id|>"):
         output_str = output_str.split("<|eot_id|>")[0]
     return output_ids, output_str, out_logprobs
 
 
-def minimax_vl_01_hf_output(hf_output: RunnerOutput,
-                            model: str) -> RunnerOutput:
+def minimax_vl_01_hf_output(hf_output: RunnerOutput, model: str) -> RunnerOutput:
     output_ids, output_str, out_logprobs = hf_output
     if output_str.endswith("<end_of_sentence>"):
         output_str = output_str.split("<end_of_sentence>")[0]
     return output_ids, output_str, out_logprobs
 
 
-def ultravox_trunc_hf_output(hf_output: RunnerOutput,
-                             model: str) -> RunnerOutput:
+def ultravox_trunc_hf_output(hf_output: RunnerOutput, model: str) -> RunnerOutput:
     output_ids, output_str, out_logprobs = hf_output
 
     tokenizer = AutoTokenizer.from_pretrained(model)
@@ -262,8 +263,8 @@ def get_llava_embeddings(image_assets: ImageTestAssets):
 
 ####### Prompt path encoders for models that need models on disk
 def qwen_prompt_path_encoder(
-        tmp_path: PosixPath, prompt: str,
-        assets: Union[list[ImageAsset], ImageTestAssets]) -> str:
+    tmp_path: PosixPath, prompt: str, assets: Union[list[ImageAsset], ImageTestAssets]
+) -> str:
     """Given a temporary dir path, export one or more image assets into the
     tempdir & replace its contents with the local path to the string so that
     the HF version of Qwen-VL can resolve the path and load the image in its
@@ -313,8 +314,9 @@ def processor(*args, text="", images=None, **kwargs):
         return BatchFeature(data=inputs, tensor_type="pt")
 
     hf_model.processor = processor
-    hf_model.model.get_output_embeddings = lambda: \
-        hf_model.model.language.model.embed_tokens
+    hf_model.model.get_output_embeddings = (
+        lambda: hf_model.model.language.model.embed_tokens
+    )
     return hf_model
 
 
@@ -357,11 +359,10 @@ def processor(*args, text="", images=None, **kwargs):
         assert len(contents) == len(images)
 
         return hf_processor.apply_chat_template(
-            [{
-                "role": "user",
-                "image": image,
-                "content": content
-            } for image, content in zip(images, contents)],
+            [
+                {"role": "user", "image": image, "content": content}
+                for image, content in zip(images, contents)
+            ],
             add_generation_prompt=True,
             tokenize=True,
             return_dict=True,
@@ -369,8 +370,9 @@ def processor(*args, text="", images=None, **kwargs):
         )
 
     hf_model.processor = processor
-    hf_model.model.get_output_embeddings = lambda: \
-        hf_model.model.transformer.output_layer
+    hf_model.model.get_output_embeddings = (
+        lambda: hf_model.model.transformer.output_layer
+    )
     return hf_model
 
 
@@ -387,10 +389,9 @@ def processor(*args, videos=None, **kwargs):
         else:
             video_metadata = None
 
-        return hf_processor(*args,
-                            videos=videos,
-                            video_metadata=video_metadata,
-                            **kwargs)
+        return hf_processor(
+            *args, videos=videos, video_metadata=video_metadata, **kwargs
+        )
 
     hf_model.processor = processor
     return hf_model
@@ -406,8 +407,9 @@ def __init__(self, hf_runner: HfRunner):
             self.num_image_token = hf_runner.model.num_image_token
             self.tokenizer = hf_runner.tokenizer
 
-            self.config = AutoConfig.from_pretrained(hf_runner.model_name,
-                                                     trust_remote_code=True)
+            self.config = AutoConfig.from_pretrained(
+                hf_runner.model_name, trust_remote_code=True
+            )
             self.vision_config = self.config.vision_config
             self.use_thumbnail = self.config.use_thumbnail
             self.use_msac = self.config.use_msac
@@ -415,11 +417,14 @@ def __init__(self, hf_runner: HfRunner):
             self.max_num = self.config.max_dynamic_patch
             self.image_size = self.vision_config.image_size
 
-        def __call__(self, text: str, images: Union[Image, list[Image]],
-                     **kwargs):
+        def __call__(self, text: str, images: Union[Image, list[Image]], **kwargs):
             # yapf: disable
             from vllm.model_executor.models.h2ovl import (
-                IMG_CONTEXT, IMG_END, IMG_START, image_to_pixel_values_h2ovl)
+                IMG_CONTEXT,
+                IMG_END,
+                IMG_START,
+                image_to_pixel_values_h2ovl,
+            )
 
             # yapf: enable
             images = [images] if isinstance(images, Image) else images
@@ -431,29 +436,26 @@ def __call__(self, text: str, images: Union[Image, list[Image]],
                     max_num=self.max_num,
                     use_thumbnail=self.use_thumbnail,
                     use_msac=self.use_msac,
-                ) for image in images
-            ]
-            num_patches_list = [
-                pixel_value.shape[0] for pixel_value in pixel_values
+                )
+                for image in images
             ]
+            num_patches_list = [pixel_value.shape[0] for pixel_value in pixel_values]
             pixel_values = torch.cat(pixel_values, dim=0)
             for num_patches in num_patches_list:
-                context_tokens = IMG_CONTEXT * self.num_image_token \
-                    * num_patches
+                context_tokens = IMG_CONTEXT * self.num_image_token * num_patches
                 image_tokens = IMG_START + context_tokens + IMG_END
-                text = text.replace('<image>', image_tokens, 1)
+                text = text.replace("<image>", image_tokens, 1)
             prompt = self.tokenizer(text, return_tensors="pt")
             prompt.update({"pixel_values": pixel_values})
             return prompt
 
-    img_context_token_id = hf_model.tokenizer.convert_tokens_to_ids(
-        "<IMG_CONTEXT>")
+    img_context_token_id = hf_model.tokenizer.convert_tokens_to_ids("<IMG_CONTEXT>")
     hf_model.model.img_context_token_id = img_context_token_id
     hf_model.processor = H2OVLProcessor(hf_model)
-    hf_model.model.get_output_embeddings = lambda: \
-        hf_model.model.language_model.get_output_embeddings()
-    hf_model.model.generate = types.MethodType(_internvl_generate,
-                                               hf_model.model)
+    hf_model.model.get_output_embeddings = (
+        lambda: hf_model.model.language_model.get_output_embeddings()
+    )
+    hf_model.model.generate = types.MethodType(_internvl_generate, hf_model.model)
     return hf_model
 
 
@@ -467,19 +469,23 @@ def __init__(self, hf_runner: HfRunner):
             self.num_image_token = hf_runner.model.num_image_token
             self.tokenizer = hf_runner.tokenizer
 
-            self.config = AutoConfig.from_pretrained(hf_runner.model_name,
-                                                     trust_remote_code=True)
+            self.config = AutoConfig.from_pretrained(
+                hf_runner.model_name, trust_remote_code=True
+            )
             self.vision_config = self.config.vision_config
             self.use_thumbnail = self.config.use_thumbnail
             self.min_num = self.config.min_dynamic_patch
             self.max_num = self.config.max_dynamic_patch
             self.image_size = self.vision_config.image_size
 
-        def __call__(self, text: str, images: Union[Image, list[Image]],
-                     **kwargs):
+        def __call__(self, text: str, images: Union[Image, list[Image]], **kwargs):
             from vllm.model_executor.models.skyworkr1v import (
-                IMG_CONTEXT, IMG_END, IMG_START,
-                image_to_pixel_values_skyworkr1v)
+                IMG_CONTEXT,
+                IMG_END,
+                IMG_START,
+                image_to_pixel_values_skyworkr1v,
+            )
+
             images = [images] if isinstance(images, Image) else images
             pixel_values = [
                 image_to_pixel_values_skyworkr1v(
@@ -488,29 +494,26 @@ def __call__(self, text: str, images: Union[Image, list[Image]],
                     min_num=self.min_num,
                     max_num=self.max_num,
                     use_thumbnail=self.use_thumbnail,
-                ) for image in images
-            ]
-            num_patches_list = [
-                pixel_value.shape[0] for pixel_value in pixel_values
+                )
+                for image in images
             ]
+            num_patches_list = [pixel_value.shape[0] for pixel_value in pixel_values]
             pixel_values = torch.cat(pixel_values, dim=0)
             for num_patches in num_patches_list:
-                context_tokens = IMG_CONTEXT * self.num_image_token \
-                    * num_patches
+                context_tokens = IMG_CONTEXT * self.num_image_token * num_patches
                 image_tokens = IMG_START + context_tokens + IMG_END
-                text = text.replace('<image>', image_tokens, 1)
+                text = text.replace("<image>", image_tokens, 1)
             prompt = self.tokenizer(text, return_tensors="pt")
             prompt.update({"pixel_values": pixel_values})
             return prompt
 
-    img_context_token_id = hf_model.tokenizer.convert_tokens_to_ids(
-        "<IMG_CONTEXT>")
+    img_context_token_id = hf_model.tokenizer.convert_tokens_to_ids("<IMG_CONTEXT>")
     hf_model.model.img_context_token_id = img_context_token_id
     hf_model.processor = SkyworkR1VProcessor(hf_model)
-    hf_model.model.get_output_embeddings = lambda: \
-        hf_model.model.language_model.get_output_embeddings()
-    hf_model.model.generate = types.MethodType(_internvl_generate,
-                                               hf_model.model)
+    hf_model.model.get_output_embeddings = (
+        lambda: hf_model.model.language_model.get_output_embeddings()
+    )
+    hf_model.model.generate = types.MethodType(_internvl_generate, hf_model.model)
     return hf_model
 
 
@@ -524,8 +527,9 @@ def __init__(self, hf_runner: HfRunner):
             self.num_image_token = hf_runner.model.num_image_token
             self.tokenizer = hf_runner.tokenizer
 
-            self.config = AutoConfig.from_pretrained(hf_runner.model_name,
-                                                     trust_remote_code=True)
+            self.config = AutoConfig.from_pretrained(
+                hf_runner.model_name, trust_remote_code=True
+            )
             self.vision_config = self.config.vision_config
             self.use_thumbnail = self.config.use_thumbnail
             self.min_num = self.config.min_dynamic_patch
@@ -540,8 +544,13 @@ def __call__(
             **kwargs,
         ):
             from vllm.model_executor.models.internvl import (
-                IMG_CONTEXT, IMG_END, IMG_START,
-                image_to_pixel_values_internvl, video_to_pixel_values_internvl)
+                IMG_CONTEXT,
+                IMG_END,
+                IMG_START,
+                image_to_pixel_values_internvl,
+                video_to_pixel_values_internvl,
+            )
+
             images = [images] if isinstance(images, Image) else images
             videos = [videos] if isinstance(videos, np.ndarray) else videos
             if images is not None:
@@ -552,7 +561,8 @@ def __call__(
                         min_num=self.min_num,
                         max_num=self.max_num,
                         use_thumbnail=self.use_thumbnail,
-                    ) for image in images
+                    )
+                    for image in images
                 ]
                 num_patches_images = [
                     pixel_value.shape[0] for pixel_value in pixel_values_images
@@ -568,7 +578,8 @@ def __call__(
                         min_num=1,
                         max_num=1,
                         use_thumbnail=False,
-                    ) for video in videos
+                    )
+                    for video in videos
                 ]
                 num_patches_videos = [
                     pixel_value.shape[0] for pixel_value in pixel_values_videos
@@ -580,38 +591,37 @@ def __call__(
             while ("<image>" in text) or ("<video>" in text):
                 image_index = text.find("<image>")
                 video_index = text.find("<video>")
-                if image_index == -1 or (video_index > -1
-                                         and video_index < image_index):
+                if image_index == -1 or (
+                    video_index > -1 and video_index < image_index
+                ):
                     num_patches = num_patches_videos.pop(0)
                     pixel_values.append(pixel_values_videos.pop(0))
-                    context_tokens = IMG_START + \
-                        IMG_CONTEXT * self.num_image_token + IMG_END
-                    video_tokens = ''.join([
-                        f'Frame{i+1}: {context_tokens}'
-                        for i in range(num_patches)
-                    ])
-                    text = text.replace('<video>', video_tokens, 1)
+                    context_tokens = (
+                        IMG_START + IMG_CONTEXT * self.num_image_token + IMG_END
+                    )
+                    video_tokens = "".join(
+                        [f"Frame{i + 1}: {context_tokens}" for i in range(num_patches)]
+                    )
+                    text = text.replace("<video>", video_tokens, 1)
                 else:
                     num_patches = num_patches_images.pop(0)
                     pixel_values.append(pixel_values_images.pop(0))
-                    context_tokens = IMG_CONTEXT * self.num_image_token \
-                        * num_patches
+                    context_tokens = IMG_CONTEXT * self.num_image_token * num_patches
                     image_tokens = IMG_START + context_tokens + IMG_END
-                    text = text.replace('<image>', image_tokens, 1)
+                    text = text.replace("<image>", image_tokens, 1)
             pixel_values = torch.cat(pixel_values, dim=0)
 
             prompt = self.tokenizer(text, return_tensors="pt")
             prompt.update({"pixel_values": pixel_values})
             return prompt
 
-    img_context_token_id = hf_model.tokenizer.convert_tokens_to_ids(
-        "<IMG_CONTEXT>")
+    img_context_token_id = hf_model.tokenizer.convert_tokens_to_ids("<IMG_CONTEXT>")
     hf_model.model.img_context_token_id = img_context_token_id
     hf_model.processor = InternVLProcessor(hf_model)
-    hf_model.model.get_output_embeddings = lambda: \
-        hf_model.model.language_model.get_output_embeddings()
-    hf_model.model.generate = types.MethodType(_internvl_generate,
-                                               hf_model.model)
+    hf_model.model.get_output_embeddings = (
+        lambda: hf_model.model.language_model.get_output_embeddings()
+    )
+    hf_model.model.generate = types.MethodType(_internvl_generate, hf_model.model)
     return hf_model
 
 
@@ -631,7 +641,7 @@ def _internvl_generate(
     input_embeds = input_embeds.reshape(B * N, C)
 
     input_ids = input_ids.reshape(B * N)
-    selected = (input_ids == self.img_context_token_id)
+    selected = input_ids == self.img_context_token_id
     assert selected.sum() != 0
     input_embeds[selected] = vit_embeds.reshape(-1, C).to(input_embeds.device)
 
@@ -778,8 +788,9 @@ def _generate(self, max_new_tokens=None, do_sample=None, **kwargs):
 
 def ovis_patch_hf_runner(hf_model: HfRunner) -> HfRunner:
     """Patches and returns an instance of the HfRunner to use for Ovis2."""
-    hf_model.model.get_output_embeddings = lambda: \
-        hf_model.model.llm.get_output_embeddings()
+    hf_model.model.get_output_embeddings = (
+        lambda: hf_model.model.llm.get_output_embeddings()
+    )
 
     def processor(*args, text="", images=None, **kwargs):
         text_tokenizer = hf_model.model.get_text_tokenizer()
@@ -787,8 +798,7 @@ def processor(*args, text="", images=None, **kwargs):
 
         prompt_start_and_end = {
             "qwen2": ("<|im_start|>user\n", "<|im_end|>\n"),
-            "llama":
-            ("<|start_header_id|>user<|end_header_id|>\n\n", "<|eot_id|>"),
+            "llama": ("<|start_header_id|>user<|end_header_id|>\n\n", "<|eot_id|>"),
             "gemma2": ("<start_of_turn>user\n", "<end_of_turn>\n"),
         }
         for start, end in prompt_start_and_end.values():
@@ -797,7 +807,8 @@ def processor(*args, text="", images=None, **kwargs):
                 break
 
         prompt, input_ids, pixel_values = hf_model.model.preprocess_inputs(
-            text_or_conversations=text, images=images)
+            text_or_conversations=text, images=images
+        )
         attention_mask = torch.ne(input_ids, text_tokenizer.pad_token_id)
 
         inputs = {
@@ -813,8 +824,9 @@ def processor(*args, text="", images=None, **kwargs):
 
 def ovis2_5_patch_hf_runner(hf_model: HfRunner) -> HfRunner:
     """Patches and returns an instance of the HfRunner to use for Ovis2."""
-    hf_model.model.get_output_embeddings = lambda: \
-        hf_model.model.llm.get_output_embeddings()
+    hf_model.model.get_output_embeddings = (
+        lambda: hf_model.model.llm.get_output_embeddings()
+    )
 
     def processor(*args, text="", images=None, videos=None, **kwargs):
         if images is None:
@@ -825,13 +837,11 @@ def processor(*args, text="", images=None, videos=None, **kwargs):
             videos = []
         else:
             videos = [videos] if isinstance(videos, np.ndarray) else videos
-            videos = [[PIL.Image.fromarray(frame) for frame in vid]
-                      for vid in videos]
+            videos = [[PIL.Image.fromarray(frame) for frame in vid] for vid in videos]
 
         prompt_start_and_end = {
             "qwen2": ("<|im_start|>user\n", "<|im_end|>\n"),
-            "llama":
-            ("<|start_header_id|>user<|end_header_id|>\n\n", "<|eot_id|>"),
+            "llama": ("<|start_header_id|>user<|end_header_id|>\n\n", "<|eot_id|>"),
             "gemma2": ("<start_of_turn>user\n", "<end_of_turn>\n"),
         }
         for start, end in prompt_start_and_end.values():
@@ -842,21 +852,20 @@ def processor(*args, text="", images=None, videos=None, **kwargs):
         images_message = [{"type": "image", "image": img} for img in images]
         videos_message = [{"type": "video", "video": vid} for vid in videos]
 
-        messages = [{
-            "role":
-            "user",
-            "content": [
-                *images_message,
-                *videos_message,
-                {
-                    "type": "text",
-                    "text": text
-                },
-            ],
-        }]
+        messages = [
+            {
+                "role": "user",
+                "content": [
+                    *images_message,
+                    *videos_message,
+                    {"type": "text", "text": text},
+                ],
+            }
+        ]
 
         input_ids, pixel_values, grid_thws = hf_model.model.preprocess_inputs(
-            messages=messages, enable_thinking=True)
+            messages=messages, enable_thinking=True
+        )
         inputs = {
             "inputs": input_ids,
             "pixel_values": pixel_values,
diff --git a/tests/models/multimodal/generation/vlm_utils/runners.py b/tests/models/multimodal/generation/vlm_utils/runners.py
index 562f89df1347..c91ae117b558 100644
--- a/tests/models/multimodal/generation/vlm_utils/runners.py
+++ b/tests/models/multimodal/generation/vlm_utils/runners.py
@@ -3,23 +3,34 @@
 """Entrypoints for wrapping the core run_test implementation for specific test
 types / modalities.
 """
+
 from pathlib import PosixPath
 
-from .....conftest import (AudioTestAssets, HfRunner, ImageTestAssets,
-                           VideoTestAssets, VllmRunner)
+from .....conftest import (
+    AudioTestAssets,
+    HfRunner,
+    ImageTestAssets,
+    VideoTestAssets,
+    VllmRunner,
+)
 from . import builders, core
 from .types import ExpandableVLMTestArgs, VLMTestInfo
 
 
 ####### Entrypoints for running different test types
-def run_single_image_test(*, tmp_path: PosixPath, model_test_info: VLMTestInfo,
-                          test_case: ExpandableVLMTestArgs,
-                          hf_runner: type[HfRunner],
-                          vllm_runner: type[VllmRunner],
-                          image_assets: ImageTestAssets):
+def run_single_image_test(
+    *,
+    tmp_path: PosixPath,
+    model_test_info: VLMTestInfo,
+    test_case: ExpandableVLMTestArgs,
+    hf_runner: type[HfRunner],
+    vllm_runner: type[VllmRunner],
+    image_assets: ImageTestAssets,
+):
     assert test_case.size_wrapper is not None
     inputs = builders.build_single_image_inputs_from_test_info(
-        model_test_info, image_assets, test_case.size_wrapper, tmp_path)
+        model_test_info, image_assets, test_case.size_wrapper, tmp_path
+    )
 
     core.run_test(
         hf_runner=hf_runner,
@@ -31,17 +42,23 @@ def run_single_image_test(*, tmp_path: PosixPath, model_test_info: VLMTestInfo,
         num_logprobs=test_case.num_logprobs,
         limit_mm_per_prompt={"image": 1},
         distributed_executor_backend=test_case.distributed_executor_backend,
-        **model_test_info.get_non_parametrized_runner_kwargs())
+        **model_test_info.get_non_parametrized_runner_kwargs(),
+    )
 
 
-def run_multi_image_test(*, tmp_path: PosixPath, model_test_info: VLMTestInfo,
-                         test_case: ExpandableVLMTestArgs,
-                         hf_runner: type[HfRunner],
-                         vllm_runner: type[VllmRunner],
-                         image_assets: ImageTestAssets):
+def run_multi_image_test(
+    *,
+    tmp_path: PosixPath,
+    model_test_info: VLMTestInfo,
+    test_case: ExpandableVLMTestArgs,
+    hf_runner: type[HfRunner],
+    vllm_runner: type[VllmRunner],
+    image_assets: ImageTestAssets,
+):
     assert test_case.size_wrapper is not None
     inputs = builders.build_multi_image_inputs_from_test_info(
-        model_test_info, image_assets, test_case.size_wrapper, tmp_path)
+        model_test_info, image_assets, test_case.size_wrapper, tmp_path
+    )
 
     core.run_test(
         hf_runner=hf_runner,
@@ -53,17 +70,22 @@ def run_multi_image_test(*, tmp_path: PosixPath, model_test_info: VLMTestInfo,
         num_logprobs=test_case.num_logprobs,
         limit_mm_per_prompt={"image": len(image_assets)},
         distributed_executor_backend=test_case.distributed_executor_backend,
-        **model_test_info.get_non_parametrized_runner_kwargs())
+        **model_test_info.get_non_parametrized_runner_kwargs(),
+    )
 
 
-def run_embedding_test(*, model_test_info: VLMTestInfo,
-                       test_case: ExpandableVLMTestArgs,
-                       hf_runner: type[HfRunner],
-                       vllm_runner: type[VllmRunner],
-                       image_assets: ImageTestAssets):
+def run_embedding_test(
+    *,
+    model_test_info: VLMTestInfo,
+    test_case: ExpandableVLMTestArgs,
+    hf_runner: type[HfRunner],
+    vllm_runner: type[VllmRunner],
+    image_assets: ImageTestAssets,
+):
     assert test_case.size_wrapper is not None
     inputs, vllm_embeddings = builders.build_embedding_inputs_from_test_info(
-        model_test_info, image_assets, test_case.size_wrapper)
+        model_test_info, image_assets, test_case.size_wrapper
+    )
 
     core.run_test(
         hf_runner=hf_runner,
@@ -76,7 +98,8 @@ def run_embedding_test(*, model_test_info: VLMTestInfo,
         limit_mm_per_prompt={"image": 1},
         vllm_embeddings=vllm_embeddings,
         distributed_executor_backend=test_case.distributed_executor_backend,
-        **model_test_info.get_non_parametrized_runner_kwargs())
+        **model_test_info.get_non_parametrized_runner_kwargs(),
+    )
 
 
 def run_video_test(
@@ -90,8 +113,11 @@ def run_video_test(
     assert test_case.size_wrapper is not None
     assert test_case.num_video_frames is not None
     inputs = builders.build_video_inputs_from_test_info(
-        model_test_info, video_assets, test_case.size_wrapper,
-        test_case.num_video_frames)
+        model_test_info,
+        video_assets,
+        test_case.size_wrapper,
+        test_case.num_video_frames,
+    )
 
     core.run_test(
         hf_runner=hf_runner,
@@ -103,7 +129,8 @@ def run_video_test(
         num_logprobs=test_case.num_logprobs,
         limit_mm_per_prompt={"video": len(video_assets)},
         distributed_executor_backend=test_case.distributed_executor_backend,
-        **model_test_info.get_non_parametrized_runner_kwargs())
+        **model_test_info.get_non_parametrized_runner_kwargs(),
+    )
 
 
 def run_audio_test(
@@ -114,8 +141,7 @@ def run_audio_test(
     vllm_runner: type[VllmRunner],
     audio_assets: AudioTestAssets,
 ):
-    inputs = builders.build_audio_inputs_from_test_info(
-        model_test_info, audio_assets)
+    inputs = builders.build_audio_inputs_from_test_info(model_test_info, audio_assets)
 
     core.run_test(
         hf_runner=hf_runner,
@@ -127,13 +153,17 @@ def run_audio_test(
         num_logprobs=test_case.num_logprobs,
         limit_mm_per_prompt={"audio": 1},
         distributed_executor_backend=test_case.distributed_executor_backend,
-        **model_test_info.get_non_parametrized_runner_kwargs())
+        **model_test_info.get_non_parametrized_runner_kwargs(),
+    )
 
 
-def run_custom_inputs_test(*, model_test_info: VLMTestInfo,
-                           test_case: ExpandableVLMTestArgs,
-                           hf_runner: type[HfRunner],
-                           vllm_runner: type[VllmRunner]):
+def run_custom_inputs_test(
+    *,
+    model_test_info: VLMTestInfo,
+    test_case: ExpandableVLMTestArgs,
+    hf_runner: type[HfRunner],
+    vllm_runner: type[VllmRunner],
+):
     # Custom test cases can provide inputs directly, but they need to
     # explicitly provided a CustomTestConfig, which wraps the inputs and
     # the limit_mm_per_prompt
@@ -155,4 +185,5 @@ def run_custom_inputs_test(*, model_test_info: VLMTestInfo,
         num_logprobs=test_case.num_logprobs,
         limit_mm_per_prompt=limit_mm_per_prompt,
         distributed_executor_backend=test_case.distributed_executor_backend,
-        **model_test_info.get_non_parametrized_runner_kwargs())
+        **model_test_info.get_non_parametrized_runner_kwargs(),
+    )
diff --git a/tests/models/multimodal/generation/vlm_utils/types.py b/tests/models/multimodal/generation/vlm_utils/types.py
index 6a82bdfc4cf2..a28e85f91a7f 100644
--- a/tests/models/multimodal/generation/vlm_utils/types.py
+++ b/tests/models/multimodal/generation/vlm_utils/types.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Types for writing multimodal model tests."""
+
 from collections.abc import Iterable
 from enum import Enum
 from pathlib import PosixPath
@@ -15,9 +16,16 @@
 from vllm.logprobs import SampleLogprobs
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
-from .....conftest import (AUDIO_ASSETS, IMAGE_ASSETS, HfRunner, ImageAsset,
-                           ImageTestAssets, PromptAudioInput, PromptImageInput,
-                           PromptVideoInput)
+from .....conftest import (
+    AUDIO_ASSETS,
+    IMAGE_ASSETS,
+    HfRunner,
+    ImageAsset,
+    ImageTestAssets,
+    PromptAudioInput,
+    PromptImageInput,
+    PromptVideoInput,
+)
 from ....utils import check_logprobs_close
 
 # meta image tag; will be replaced by the appropriate tag for the model
@@ -47,6 +55,7 @@
 
 class PromptWithMultiModalInput(NamedTuple):
     """Holds the multimodal input for a single test case."""
+
     prompts: list[str]
     image_data: Optional[PromptImageInput] = None
     video_data: Optional[PromptVideoInput] = None
@@ -100,8 +109,9 @@ class VLMTestInfo(NamedTuple):
 
     # Function for converting ImageAssets to image embeddings;
     # We need to define this explicitly for embedding tests
-    convert_assets_to_embeddings: Optional[Callable[[ImageTestAssets],
-                                                    list[torch.Tensor]]] = None
+    convert_assets_to_embeddings: Optional[
+        Callable[[ImageTestAssets], list[torch.Tensor]]
+    ] = None
 
     # Exposed options for vLLM runner; we change these in a several tests,
     # but the defaults are derived from VllmRunner & the engine defaults
@@ -156,8 +166,8 @@ class VLMTestInfo(NamedTuple):
     # for Qwen-VL, which requires encoding the image path / url into the prompt
     # for HF runner
     prompt_path_encoder: Optional[
-        Callable[[PosixPath, str, Union[list[ImageAsset], ImageTestAssets]],
-                 str]] = None  # noqa: E501
+        Callable[[PosixPath, str, Union[list[ImageAsset], ImageTestAssets]], str]
+    ] = None  # noqa: E501
 
     # Allows configuring a test to run with custom inputs
     custom_test_opts: Optional[list[CustomTestOptions]] = None
@@ -190,6 +200,7 @@ def get_non_parametrized_runner_kwargs(self):
 
 class ExpandableVLMTestArgs(NamedTuple):
     """The expanded kwargs which correspond to a single test case."""
+
     model: str
     max_tokens: int
     num_logprobs: int
diff --git a/tests/models/multimodal/pooling/test_clip.py b/tests/models/multimodal/pooling/test_clip.py
index 0aaf6877c2a6..b8c6c4abace9 100644
--- a/tests/models/multimodal/pooling/test_clip.py
+++ b/tests/models/multimodal/pooling/test_clip.py
@@ -12,10 +12,12 @@
     "a photo of a cherry blossom",
 ]
 
-HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts({
-    "stop_sign": "",
-    "cherry_blossom": "",
-})
+HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts(
+    {
+        "stop_sign": "",
+        "cherry_blossom": "",
+    }
+)
 
 MODELS = ["openai/clip-vit-base-patch32"]
 
@@ -33,11 +35,9 @@ def _run_test(
     # vLLM needs a fresh new process without cuda initialization.
     # if we run HF first, the cuda initialization will be done and it
     # will hurt multiprocessing backend with fork method (the default method).
-    with vllm_runner(model,
-                     runner="pooling",
-                     dtype=dtype,
-                     enforce_eager=True,
-                     max_model_len=77) as vllm_model:
+    with vllm_runner(
+        model, runner="pooling", dtype=dtype, enforce_eager=True, max_model_len=77
+    ) as vllm_model:
         vllm_outputs = vllm_model.embed(input_texts, images=input_images)
 
     with hf_runner(model, dtype=dtype, auto_cls=CLIPModel) as hf_model:
@@ -48,10 +48,12 @@ def _run_test(
             if "pixel_values" in inputs:
                 inputs.pop("input_ids")
                 pooled_output = hf_model.model.get_image_features(
-                    **hf_model.wrap_device(inputs)).squeeze(0)
+                    **hf_model.wrap_device(inputs)
+                ).squeeze(0)
             else:
                 pooled_output = hf_model.model.get_text_features(
-                    **hf_model.wrap_device(inputs)).squeeze(0)
+                    **hf_model.wrap_device(inputs)
+                ).squeeze(0)
 
             all_outputs.append(pooled_output.tolist())
 
@@ -98,8 +100,7 @@ def test_models_image(
     dtype: str,
 ) -> None:
     input_texts_images = [
-        (text, asset.pil_image)
-        for text, asset in zip(HF_IMAGE_PROMPTS, image_assets)
+        (text, asset.pil_image) for text, asset in zip(HF_IMAGE_PROMPTS, image_assets)
     ]
     input_texts = [text for text, _ in input_texts_images]
     input_images = [image for _, image in input_texts_images]
@@ -125,11 +126,9 @@ def test_models_text_image_no_crash(
     texts = [HF_TEXT_PROMPTS[0]]
     images = [image_assets[0].pil_image]
 
-    with vllm_runner(model,
-                     runner="pooling",
-                     dtype=dtype,
-                     enforce_eager=True,
-                     max_model_len=77) as vllm_model:
+    with vllm_runner(
+        model, runner="pooling", dtype=dtype, enforce_eager=True, max_model_len=77
+    ) as vllm_model:
         with pytest.raises(ValueError, match="not both"):
             vllm_model.embed(texts, images=images)
 
diff --git a/tests/models/multimodal/pooling/test_dse_qwen2_vl.py b/tests/models/multimodal/pooling/test_dse_qwen2_vl.py
index f152ded3fb23..7f30b1f299ba 100644
--- a/tests/models/multimodal/pooling/test_dse_qwen2_vl.py
+++ b/tests/models/multimodal/pooling/test_dse_qwen2_vl.py
@@ -17,18 +17,21 @@
     # T -> X
     (
         "Query: Find me an everyday image that matches the given caption: The label of the object is stop sign",  # noqa: E501,
-        Image.new("RGB", (56, 56))),
+        Image.new("RGB", (56, 56)),
+    ),
     # T -> X
-    ("Query: Retrieve an image of this caption: cherry blossom",
-     Image.new("RGB", (56, 56))),
+    (
+        "Query: Retrieve an image of this caption: cherry blossom",
+        Image.new("RGB", (56, 56)),
+    ),
 ]
 
-HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts({
-    "stop_sign":
-    "What is shown in this image?",
-    "cherry_blossom":
-    "What is shown in this image?"
-})
+HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts(
+    {
+        "stop_sign": "What is shown in this image?",
+        "cherry_blossom": "What is shown in this image?",
+    }
+)
 
 MODELS = ["MrLight/dse-qwen2-2b-mrl-v1"]
 
@@ -36,34 +39,30 @@
 def get_messages(image: Image.Image, text: str, embed_text: bool):
     # assert False, 'remember to use outer [] as required'
     if embed_text:
-        messages = [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "image",
-                    "image": Image.new("RGB", (56, 56)),
-                    "resized_height": 1,
-                    "resized_width": 1
-                },  # need a dummy image here for an easier process.
-                {
-                    "type": "text",
-                    "text": text
-                },
-            ]
-        }]
+        messages = [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image",
+                        "image": Image.new("RGB", (56, 56)),
+                        "resized_height": 1,
+                        "resized_width": 1,
+                    },  # need a dummy image here for an easier process.
+                    {"type": "text", "text": text},
+                ],
+            }
+        ]
     else:
-        messages = [{
-            "role":
-            "user",
-            "content": [{
-                "type": "image",
-                "image": image
-            }, {
-                "type": "text",
-                "text": text
-            }]
-        }]
+        messages = [
+            {
+                "role": "user",
+                "content": [
+                    {"type": "image", "image": image},
+                    {"type": "text", "text": text},
+                ],
+            }
+        ]
     return messages
 
 
@@ -71,8 +70,10 @@ def apply_chat_template_and_add_eos(
     messages: list[dict],
     apply_chat_template_fn: Callable,
 ):
-    prompt = apply_chat_template_fn(
-        messages, tokenize=False, add_generation_prompt=True) + "<|endoftext|>"
+    prompt = (
+        apply_chat_template_fn(messages, tokenize=False, add_generation_prompt=True)
+        + "<|endoftext|>"
+    )
     return prompt
 
 
@@ -86,16 +87,14 @@ def _run_test(
     *,
     dtype: str,
 ) -> None:
-    '''SET PYTHONPATH'''
+    """SET PYTHONPATH"""
     # NOTE: take care of the order. run vLLM first, and then run HF.
     # vLLM needs a fresh new process without cuda initialization.
     # if we run HF first, the cuda initialization will be done and it
     # will hurt multiprocessing backend with fork method (the default method).
-    with vllm_runner(model,
-                     runner="pooling",
-                     dtype=dtype,
-                     enforce_eager=True,
-                     max_model_len=8192) as vllm_model:
+    with vllm_runner(
+        model, runner="pooling", dtype=dtype, enforce_eager=True, max_model_len=8192
+    ) as vllm_model:
         tokenizer = vllm_model.llm.get_tokenizer()
         texts = [
             # this is necessary because vllm_model.embed will not apply any
@@ -105,25 +104,25 @@ def _run_test(
             apply_chat_template_and_add_eos(
                 get_messages(image, text, False),
                 apply_chat_template_fn=tokenizer.apply_chat_template,
-            ) for text, image in zip(input_texts, input_images)
+            )
+            for text, image in zip(input_texts, input_images)
             # vllm will replace the pad token with the actual image,
             # which may be a placeholder image, later.
         ]
         vllm_outputs = vllm_model.embed(texts, images=input_images)
 
     hf_outputs = []
-    with hf_runner(model,
-                   dtype=dtype,
-                   auto_cls=Qwen2VLForConditionalGeneration) as hf_model:
-
+    with hf_runner(
+        model, dtype=dtype, auto_cls=Qwen2VLForConditionalGeneration
+    ) as hf_model:
         prompts = []
-        for text, image, embed_text in zip(input_texts, input_images,
-                                           embed_texts):
+        for text, image, embed_text in zip(input_texts, input_images, embed_texts):
             # dse requires non-standard input processing
             # because it needs an image_pad token
             messages = get_messages(image, text, embed_text)
             prompt = apply_chat_template_and_add_eos(
-                messages, hf_model.processor.apply_chat_template)
+                messages, hf_model.processor.apply_chat_template
+            )
 
             prompts.append(prompt)
 
@@ -145,9 +144,9 @@ def _run_test(
                     return_dict=True,
                     output_hidden_states=True,
                 )
-                pooled_output = F.normalize(outputs.hidden_states[-1][0, -1],
-                                            p=2,
-                                            dim=-1)
+                pooled_output = F.normalize(
+                    outputs.hidden_states[-1][0, -1], p=2, dim=-1
+                )
 
                 all_outputs.append(pooled_output.tolist())
 
@@ -170,8 +169,9 @@ def test_models_text(
     model: str,
     dtype: str,
 ) -> None:
-    input_texts_images = [(text, image_placeholder)
-                          for text, image_placeholder in HF_TEXT_PROMPTS]
+    input_texts_images = [
+        (text, image_placeholder) for text, image_placeholder in HF_TEXT_PROMPTS
+    ]
     input_texts = [text for text, _ in input_texts_images]
     input_images = [image for _, image in input_texts_images]
     embed_texts = [True] * len(input_texts)
@@ -198,8 +198,7 @@ def test_models_image(
     dtype: str,
 ) -> None:
     input_texts_images = [
-        (text, asset.pil_image)
-        for text, asset in zip(HF_IMAGE_PROMPTS, image_assets)
+        (text, asset.pil_image) for text, asset in zip(HF_IMAGE_PROMPTS, image_assets)
     ]
     input_texts = [text for text, _ in input_texts_images]
     input_images = [image for _, image in input_texts_images]
diff --git a/tests/models/multimodal/pooling/test_intern_vit.py b/tests/models/multimodal/pooling/test_intern_vit.py
index 3e2be34a50ad..b474e851319a 100644
--- a/tests/models/multimodal/pooling/test_intern_vit.py
+++ b/tests/models/multimodal/pooling/test_intern_vit.py
@@ -29,7 +29,7 @@ def run_intern_vit_test(
     img_processor = CLIPImageProcessor.from_pretrained(model)
     images = [asset.pil_image for asset in image_assets]
     pixel_values = [
-        img_processor(images, return_tensors='pt').pixel_values.to(torch_dtype)
+        img_processor(images, return_tensors="pt").pixel_values.to(torch_dtype)
         for images in images
     ]
 
@@ -37,15 +37,16 @@ def run_intern_vit_test(
     if not getattr(config, "norm_type", None):
         config.norm_type = "rms_norm"
 
-    hf_model = AutoModel.from_pretrained(model,
-                                         torch_dtype=torch_dtype,
-                                         trust_remote_code=True).to("cuda")
+    hf_model = AutoModel.from_pretrained(
+        model, torch_dtype=torch_dtype, trust_remote_code=True
+    ).to("cuda")
     hf_outputs_per_image = [
         hf_model(pixel_value.to("cuda")).last_hidden_state
         for pixel_value in pixel_values
     ]
 
     from vllm.model_executor.models.intern_vit import InternVisionModel
+
     vllm_model = InternVisionModel(config)
     vllm_model.load_weights(hf_model.state_dict().items())
 
@@ -54,22 +55,23 @@ def run_intern_vit_test(
 
     vllm_model = vllm_model.to("cuda", torch_dtype)
     vllm_outputs_per_image = [
-        vllm_model(pixel_values=pixel_value.to("cuda"))
-        for pixel_value in pixel_values
+        vllm_model(pixel_values=pixel_value.to("cuda")) for pixel_value in pixel_values
     ]
     del vllm_model
     cleanup_dist_env_and_memory()
 
     cos_similar = nn.CosineSimilarity(dim=-1)
-    for vllm_output, hf_output in zip(vllm_outputs_per_image,
-                                      hf_outputs_per_image):
+    for vllm_output, hf_output in zip(vllm_outputs_per_image, hf_outputs_per_image):
         assert cos_similar(vllm_output, hf_output).mean() > 0.99
 
 
-@pytest.mark.parametrize("model_id", [
-    "OpenGVLab/InternViT-300M-448px",
-    "OpenGVLab/InternViT-6B-448px-V1-5",
-])
+@pytest.mark.parametrize(
+    "model_id",
+    [
+        "OpenGVLab/InternViT-300M-448px",
+        "OpenGVLab/InternViT-6B-448px-V1-5",
+    ],
+)
 @pytest.mark.parametrize("dtype", ["half"])
 def test_models(dist_init, image_assets, model_id, dtype: str) -> None:
     run_intern_vit_test(
diff --git a/tests/models/multimodal/pooling/test_jinavl_reranker.py b/tests/models/multimodal/pooling/test_jinavl_reranker.py
index 7ad7a8d284cb..853f56618290 100644
--- a/tests/models/multimodal/pooling/test_jinavl_reranker.py
+++ b/tests/models/multimodal/pooling/test_jinavl_reranker.py
@@ -29,7 +29,6 @@ def vllm_reranker(
     query_type: str = "text",
     doc_type: str = "text",
 ):
-
     def create_image_param(url: str) -> ChatCompletionContentPartImageParam:
         return {"type": "image_url", "image_url": {"url": f"{url}"}}
 
@@ -38,23 +37,25 @@ def create_image_param(url: str) -> ChatCompletionContentPartImageParam:
         query = query_strs
     elif query_type == "image":
         query = ScoreMultiModalParam(
-            content=[create_image_param(url) for url in query_strs])
+            content=[create_image_param(url) for url in query_strs]
+        )
 
     documents: Union[list[str], ScoreMultiModalParam]
     if doc_type == "text":
         documents = document_strs
     elif doc_type == "image":
         documents = ScoreMultiModalParam(
-            content=[create_image_param(url) for url in document_strs])
+            content=[create_image_param(url) for url in document_strs]
+        )
 
     with vllm_runner(
-            model_name,
-            runner="pooling",
-            dtype=dtype,
-            max_num_seqs=2,
-            max_model_len=2048,
-            mm_processor_kwargs=mm_processor_kwargs,
-            limit_mm_per_prompt=limit_mm_per_prompt,
+        model_name,
+        runner="pooling",
+        dtype=dtype,
+        max_num_seqs=2,
+        max_model_len=2048,
+        mm_processor_kwargs=mm_processor_kwargs,
+        limit_mm_per_prompt=limit_mm_per_prompt,
     ) as vllm_model:
         outputs = vllm_model.llm.score(query, documents)
 
@@ -78,16 +79,15 @@ def hf_reranker(
     data_pairs = [[query_strs[0], d] for d in document_strs]
 
     with hf_runner(
-            model_name,
-            dtype=dtype,
-            trust_remote_code=True,
-            auto_cls=AutoModel,
-            model_kwargs={"key_mapping": checkpoint_to_hf_mapper},
+        model_name,
+        dtype=dtype,
+        trust_remote_code=True,
+        auto_cls=AutoModel,
+        model_kwargs={"key_mapping": checkpoint_to_hf_mapper},
     ) as hf_model:
-        return hf_model.model.compute_score(data_pairs,
-                                            max_length=2048,
-                                            query_type=query_type,
-                                            doc_type=doc_type)
+        return hf_model.model.compute_score(
+            data_pairs, max_length=2048, query_type=query_type, doc_type=doc_type
+        )
 
 
 # Visual Documents Reranking
@@ -100,10 +100,12 @@ def test_model_text_image(hf_runner, vllm_runner, model_name, dtype):
         "https://raw.githubusercontent.com/jina-ai/multimodal-reranker-test/main/paper-11.png",
     ]
 
-    hf_outputs = hf_reranker(hf_runner, model_name, dtype, query, documents,
-                             "text", "image")
-    vllm_outputs = vllm_reranker(vllm_runner, model_name, dtype, query,
-                                 documents, "text", "image")
+    hf_outputs = hf_reranker(
+        hf_runner, model_name, dtype, query, documents, "text", "image"
+    )
+    vllm_outputs = vllm_reranker(
+        vllm_runner, model_name, dtype, query, documents, "text", "image"
+    )
 
     assert hf_outputs[0] == pytest.approx(vllm_outputs[0], rel=0.02)
     assert hf_outputs[1] == pytest.approx(vllm_outputs[1], rel=0.02)
@@ -127,10 +129,12 @@ def test_model_text_text(hf_runner, vllm_runner, model_name, dtype):
         lower computational requirements.""",  # noqa: E501
         "数据提取么？为什么不用正则啊，你用正则不就全解决了么？",
     ]
-    hf_outputs = hf_reranker(hf_runner, model_name, dtype, query, documents,
-                             "text", "text")
-    vllm_outputs = vllm_reranker(vllm_runner, model_name, dtype, query,
-                                 documents, "text", "text")
+    hf_outputs = hf_reranker(
+        hf_runner, model_name, dtype, query, documents, "text", "text"
+    )
+    vllm_outputs = vllm_reranker(
+        vllm_runner, model_name, dtype, query, documents, "text", "text"
+    )
 
     assert hf_outputs[0] == pytest.approx(vllm_outputs[0], rel=0.02)
     assert hf_outputs[1] == pytest.approx(vllm_outputs[1], rel=0.02)
@@ -157,10 +161,12 @@ def test_model_image_text(hf_runner, vllm_runner, model_name, dtype):
         "数据提取么？为什么不用正则啊，你用正则不就全解决了么？",
     ]
 
-    hf_outputs = hf_reranker(hf_runner, model_name, dtype, query, documents,
-                             "image", "text")
-    vllm_outputs = vllm_reranker(vllm_runner, model_name, dtype, query,
-                                 documents, "image", "text")
+    hf_outputs = hf_reranker(
+        hf_runner, model_name, dtype, query, documents, "image", "text"
+    )
+    vllm_outputs = vllm_reranker(
+        vllm_runner, model_name, dtype, query, documents, "image", "text"
+    )
 
     assert hf_outputs[0] == pytest.approx(vllm_outputs[0], rel=0.02)
     assert hf_outputs[1] == pytest.approx(vllm_outputs[1], rel=0.02)
@@ -178,10 +184,12 @@ def test_model_image_image(hf_runner, vllm_runner, model_name, dtype):
         "https://raw.githubusercontent.com/jina-ai/multimodal-reranker-test/main/paper-11.png",
     ]
 
-    hf_outputs = hf_reranker(hf_runner, model_name, dtype, query, documents,
-                             "image", "image")
-    vllm_outputs = vllm_reranker(vllm_runner, model_name, dtype, query,
-                                 documents, "image", "image")
+    hf_outputs = hf_reranker(
+        hf_runner, model_name, dtype, query, documents, "image", "image"
+    )
+    vllm_outputs = vllm_reranker(
+        vllm_runner, model_name, dtype, query, documents, "image", "image"
+    )
 
     assert hf_outputs[0] == pytest.approx(vllm_outputs[0], rel=0.02)
     assert hf_outputs[1] == pytest.approx(vllm_outputs[1], rel=0.02)
diff --git a/tests/models/multimodal/pooling/test_llava_next.py b/tests/models/multimodal/pooling/test_llava_next.py
index 50826677581d..2053ce399483 100644
--- a/tests/models/multimodal/pooling/test_llava_next.py
+++ b/tests/models/multimodal/pooling/test_llava_next.py
@@ -24,9 +24,10 @@
 #    built with LAPACK support.
 pytestmark = pytest.mark.skipif(
     not current_platform.is_cuda(),
-    reason="Llava Next model uses op that is only supported in CUDA")
+    reason="Llava Next model uses op that is only supported in CUDA",
+)
 
-llama3_template = '<|start_header_id|>user<|end_header_id|>\n\n{}<|eot_id|><|start_header_id|>assistant<|end_header_id|>\n\n \n'  # noqa: E501
+llama3_template = "<|start_header_id|>user<|end_header_id|>\n\n{}<|eot_id|><|start_header_id|>assistant<|end_header_id|>\n\n \n"  # noqa: E501
 
 HF_TEXT_PROMPTS = [
     # T -> X
@@ -34,18 +35,21 @@
         "The label of the object is stop sign\nSummary above sentence in one word: "  # noqa: E501
     ),
     # T -> X
-    llama3_template.format(
-        "cherry blossom\nSummary above sentence in one word: "),
+    llama3_template.format("cherry blossom\nSummary above sentence in one word: "),
 ]
 
-HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts({
-    # I -> X
-    "stop_sign":
-    llama3_template.format("<image>\nSummary above image in one word: "),
-    # I -> X
-    "cherry_blossom":
-    llama3_template.format("<image>\nSummary above image in one word: "),
-})
+HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts(
+    {
+        # I -> X
+        "stop_sign": llama3_template.format(
+            "<image>\nSummary above image in one word: "
+        ),
+        # I -> X
+        "cherry_blossom": llama3_template.format(
+            "<image>\nSummary above image in one word: "
+        ),
+    }
+)
 
 MODELS = ["royokong/e5-v"]
 
@@ -63,23 +67,22 @@ def _run_test(
     # vLLM needs a fresh new process without cuda initialization.
     # if we run HF first, the cuda initialization will be done and it
     # will hurt multiprocessing backend with fork method (the default method).
-    with vllm_runner(model,
-                     runner="pooling",
-                     dtype=dtype,
-                     max_model_len=4096,
-                     enforce_eager=True) as vllm_model:
+    with vllm_runner(
+        model, runner="pooling", dtype=dtype, max_model_len=4096, enforce_eager=True
+    ) as vllm_model:
         vllm_outputs = vllm_model.embed(input_texts, images=input_images)
 
-    with hf_runner(model, dtype=dtype,
-                   auto_cls=AutoModelForImageTextToText) as hf_model:
+    with hf_runner(
+        model, dtype=dtype, auto_cls=AutoModelForImageTextToText
+    ) as hf_model:
         # Patch the issue where generation_config.json is missing
-        hf_model.processor.patch_size = \
-            hf_model.model.config.vision_config.patch_size
+        hf_model.processor.patch_size = hf_model.model.config.vision_config.patch_size
 
         # Patch the issue where image_token_id
         # exceeds the maximum allowed vocab size
         hf_model.model.resize_token_embeddings(
-            hf_model.model.language_model.vocab_size + 1)
+            hf_model.model.language_model.vocab_size + 1
+        )
 
         all_inputs = hf_model.get_inputs(input_texts, images=input_images)
 
@@ -91,8 +94,7 @@ def _run_test(
                 return_dict=True,
                 output_hidden_states=True,
             )
-            pooled_output = F.normalize(outputs.hidden_states[-1][0, -1, :],
-                                        dim=-1)
+            pooled_output = F.normalize(outputs.hidden_states[-1][0, -1, :], dim=-1)
 
             all_outputs.append(pooled_output.tolist())
 
@@ -142,8 +144,7 @@ def test_models_image(
     dtype: str,
 ) -> None:
     input_texts_images = [
-        (text, asset.pil_image)
-        for text, asset in zip(HF_IMAGE_PROMPTS, image_assets)
+        (text, asset.pil_image) for text, asset in zip(HF_IMAGE_PROMPTS, image_assets)
     ]
     input_texts = [text for text, _ in input_texts_images]
     input_images = [image for _, image in input_texts_images]
diff --git a/tests/models/multimodal/pooling/test_phi3v.py b/tests/models/multimodal/pooling/test_phi3v.py
index f918a0bd781e..c799a5bd3e1e 100644
--- a/tests/models/multimodal/pooling/test_phi3v.py
+++ b/tests/models/multimodal/pooling/test_phi3v.py
@@ -19,14 +19,14 @@
     "Retrieve an image of this caption: cherry blossom",
 ]
 
-HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts({
-    # T + I -> X
-    "stop_sign":
-    "<|image_1|> Select the portion of the image that isolates the object of the given label: The label of the object is stop sign",  # noqa: E501
-    # I -> X
-    "cherry_blossom":
-    "<|image_1|> Represent the given image for classification",  # noqa: E501
-})
+HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts(
+    {
+        # T + I -> X
+        "stop_sign": "<|image_1|> Select the portion of the image that isolates the object of the given label: The label of the object is stop sign",  # noqa: E501
+        # I -> X
+        "cherry_blossom": "<|image_1|> Represent the given image for classification",  # noqa: E501
+    }
+)
 
 MODELS = ["TIGER-Lab/VLM2Vec-Full"]
 
@@ -44,14 +44,14 @@ def _run_test(
     # vLLM needs a fresh new process without cuda initialization.
     # if we run HF first, the cuda initialization will be done and it
     # will hurt multiprocessing backend with fork method (the default method).
-    with vllm_runner(model, runner="pooling", dtype=dtype,
-                     enforce_eager=True) as vllm_model:
+    with vllm_runner(
+        model, runner="pooling", dtype=dtype, enforce_eager=True
+    ) as vllm_model:
         vllm_outputs = vllm_model.embed(input_texts, images=input_images)
 
     # use eager mode for hf runner, since phi3_v didn't work with flash_attn
     hf_model_kwargs = {"_attn_implementation": "eager"}
-    with hf_runner(model, dtype=dtype,
-                   model_kwargs=hf_model_kwargs) as hf_model:
+    with hf_runner(model, dtype=dtype, model_kwargs=hf_model_kwargs) as hf_model:
         all_inputs = hf_model.get_inputs(input_texts, images=input_images)
 
         all_outputs = []
@@ -114,18 +114,21 @@ def test_models_image(
     dtype: str,
 ) -> None:
     input_texts_images = [
-        (text, asset.pil_image)
-        for text, asset in zip(HF_IMAGE_PROMPTS, image_assets)
+        (text, asset.pil_image) for text, asset in zip(HF_IMAGE_PROMPTS, image_assets)
     ]
     # add cases for special_tokens
-    input_texts_images.append((
-        "\n<s><|user|>\n <|image_1|>\n\t <s>"
-        "Represent the given image for classification<|end|>"
-        "\n<|assistant|>\n",
-        Image.open(
-            get_vllm_public_assets(filename="cherry_blossom.jpg",
-                                   s3_prefix=VLM_IMAGES_DIR)),
-    ))
+    input_texts_images.append(
+        (
+            "\n<s><|user|>\n <|image_1|>\n\t <s>"
+            "Represent the given image for classification<|end|>"
+            "\n<|assistant|>\n",
+            Image.open(
+                get_vllm_public_assets(
+                    filename="cherry_blossom.jpg", s3_prefix=VLM_IMAGES_DIR
+                )
+            ),
+        )
+    )
     input_texts = [text for text, _ in input_texts_images]
     input_images = [image for _, image in input_texts_images]
 
diff --git a/tests/models/multimodal/pooling/test_prithvi_mae.py b/tests/models/multimodal/pooling/test_prithvi_mae.py
index 7309660ea526..abf4150a9132 100644
--- a/tests/models/multimodal/pooling/test_prithvi_mae.py
+++ b/tests/models/multimodal/pooling/test_prithvi_mae.py
@@ -19,25 +19,25 @@ def _run_test(
     vllm_runner: type[VllmRunner],
     model: str,
 ) -> None:
-
     prompt = [
         {
             # This model deals with no text input
             "prompt_token_ids": [1],
             "multi_modal_data": generate_test_mm_data(),
-        } for _ in range(10)
+        }
+        for _ in range(10)
     ]
 
     with vllm_runner(
-            model,
-            runner="pooling",
-            dtype="half",
-            enforce_eager=True,
-            skip_tokenizer_init=True,
-            # Limit the maximum number of sequences to avoid the
-            # test going OOM during the warmup run
-            max_num_seqs=32,
-            default_torch_num_threads=1,
+        model,
+        runner="pooling",
+        dtype="half",
+        enforce_eager=True,
+        skip_tokenizer_init=True,
+        # Limit the maximum number of sequences to avoid the
+        # test going OOM during the warmup run
+        max_num_seqs=32,
+        default_torch_num_threads=1,
     ) as vllm_model:
         vllm_model.encode(prompt)
 
diff --git a/tests/models/multimodal/pooling/test_radio.py b/tests/models/multimodal/pooling/test_radio.py
index 27b9fe369e80..80f594021ca8 100644
--- a/tests/models/multimodal/pooling/test_radio.py
+++ b/tests/models/multimodal/pooling/test_radio.py
@@ -34,9 +34,9 @@ def run_radio_test(
     # Using `self.get_nearest_supported_resolution`, for assets 432x642 the
     # nearest supported resolution is 432x640.
     pixel_values = [
-        img_processor(
-            image,
-            return_tensors='pt').pixel_values.to(torch_dtype)[:, :, :, :640]
+        img_processor(image, return_tensors="pt").pixel_values.to(torch_dtype)[
+            :, :, :, :640
+        ]
         for image in images
     ]
 
@@ -51,32 +51,33 @@ def run_radio_test(
     hf_model.eval()
 
     hf_outputs_per_image = [
-        hf_model(pixel_value.to("cuda")).features
-        for pixel_value in pixel_values
+        hf_model(pixel_value.to("cuda")).features for pixel_value in pixel_values
     ]
 
-    radio_config = RadioConfig(model_name=config.args["model"],
-                               reg_tokens=config.args["register_multiple"])
+    radio_config = RadioConfig(
+        model_name=config.args["model"], reg_tokens=config.args["register_multiple"]
+    )
     vllm_model = RadioModel(radio_config)
     vllm_model.load_weights(hf_model.state_dict())
     vllm_model = vllm_model.to("cuda", torch_dtype)
 
     vllm_outputs_per_image = [
-        vllm_model(pixel_values=pixel_value.to("cuda"))
-        for pixel_value in pixel_values
+        vllm_model(pixel_values=pixel_value.to("cuda")) for pixel_value in pixel_values
     ]
     del vllm_model, hf_model
     cleanup_dist_env_and_memory()
 
     cos_similar = nn.CosineSimilarity(dim=-1)
-    for vllm_output, hf_output in zip(vllm_outputs_per_image,
-                                      hf_outputs_per_image):
+    for vllm_output, hf_output in zip(vllm_outputs_per_image, hf_outputs_per_image):
         assert cos_similar(vllm_output, hf_output).mean() > 0.99
 
 
-@pytest.mark.parametrize("model_id", [
-    "nvidia/C-RADIOv2-H",
-])
+@pytest.mark.parametrize(
+    "model_id",
+    [
+        "nvidia/C-RADIOv2-H",
+    ],
+)
 @pytest.mark.parametrize("dtype", ["half"])
 def test_radio(dist_init, image_assets, model_id, dtype: str) -> None:
     run_radio_test(
diff --git a/tests/models/multimodal/processing/test_common.py b/tests/models/multimodal/processing/test_common.py
index e8c28afee7e3..4f6a5649b4e5 100644
--- a/tests/models/multimodal/processing/test_common.py
+++ b/tests/models/multimodal/processing/test_common.py
@@ -6,22 +6,27 @@
 
 import numpy as np
 import pytest
-from mistral_common.protocol.instruct.messages import (ImageChunk, TextChunk,
-                                                       UserMessage)
+from mistral_common.protocol.instruct.messages import ImageChunk, TextChunk, UserMessage
 from mistral_common.protocol.instruct.request import ChatCompletionRequest
 from PIL import Image
 
 from vllm.config import ModelConfig
-from vllm.config.multimodal import (AudioDummyOptions, BaseDummyOptions,
-                                    ImageDummyOptions, VideoDummyOptions)
+from vllm.config.multimodal import (
+    AudioDummyOptions,
+    BaseDummyOptions,
+    ImageDummyOptions,
+    VideoDummyOptions,
+)
 from vllm.multimodal import MULTIMODAL_REGISTRY, MultiModalDataDict
 from vllm.multimodal.cache import MultiModalProcessorOnlyCache
 from vllm.multimodal.inputs import MultiModalInputs
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        InputProcessingContext)
-from vllm.transformers_utils.tokenizer import (AnyTokenizer, MistralTokenizer,
-                                               cached_tokenizer_from_config,
-                                               encode_tokens)
+from vllm.multimodal.processing import BaseMultiModalProcessor, InputProcessingContext
+from vllm.transformers_utils.tokenizer import (
+    AnyTokenizer,
+    MistralTokenizer,
+    cached_tokenizer_from_config,
+    encode_tokens,
+)
 
 from ....multimodal.utils import random_audio, random_image, random_video
 from ...registry import HF_EXAMPLE_MODELS
@@ -36,14 +41,17 @@ def glm4_1v_patch_mm_data(mm_data: MultiModalDataDict) -> MultiModalDataDict:
         # GLM4.1V doesn't support multiple videos
         video = mm_data["video"]
         num_frames = len(video)
-        mm_data["video"] = (video, {
-            "total_num_frames": num_frames,
-            "fps": num_frames,
-            "duration": 1,
-            "frames_indices": [i for i in range(num_frames)],
-            "video_backend": "opencv",
-            "do_sample_frames": True,
-        })
+        mm_data["video"] = (
+            video,
+            {
+                "total_num_frames": num_frames,
+                "fps": num_frames,
+                "duration": 1,
+                "frames_indices": [i for i in range(num_frames)],
+                "video_backend": "opencv",
+                "do_sample_frames": True,
+            },
+        )
     return mm_data
 
 
@@ -102,7 +110,8 @@ def _test_processing_correctness(
         mm_processor_cache_gb=2048,
         skip_tokenizer_init=model_info.skip_tokenizer_init,
         enforce_eager=model_info.enforce_eager,
-        dtype=model_info.dtype)
+        dtype=model_info.dtype,
+    )
 
     model_cls = MULTIMODAL_REGISTRY._get_model_cls(model_config)
     factories = MULTIMODAL_REGISTRY._processor_factories[model_cls]
@@ -145,27 +154,22 @@ def _to_dummy_options(modality: str, count: int) -> BaseDummyOptions:
     input_to_hit = {
         "image": Image.new("RGB", size=(128, 128)),
         "video": np.zeros((4, 128, 128, 3), dtype=np.uint8),
-        "audio": (np.zeros((512, )), 16000),
+        "audio": (np.zeros((512,)), 16000),
     }
     input_factory = {
-        "image":
-        partial(random_image, rng, min_wh=128, max_wh=256),
-        "video":
-        partial(random_video,
-                rng,
-                min_frames=2,
-                max_frames=16,
-                min_wh=128,
-                max_wh=256),
-        "audio":
-        partial(random_audio, rng, min_len=512, max_len=1024, sr=16000),
+        "image": partial(random_image, rng, min_wh=128, max_wh=256),
+        "video": partial(
+            random_video, rng, min_frames=2, max_frames=16, min_wh=128, max_wh=256
+        ),
+        "audio": partial(random_audio, rng, min_len=512, max_len=1024, sr=16000),
     }
 
     for batch_idx in range(num_batches):
         mm_data = {
-            k:
-            [(input_to_hit[k] if rng.rand() < hit_rate else input_factory[k]())
-             for _ in range(rng.randint(limit + 1))]
+            k: [
+                (input_to_hit[k] if rng.rand() < hit_rate else input_factory[k]())
+                for _ in range(rng.randint(limit + 1))
+            ]
             for k, limit in limit_mm_per_prompt_ints.items()
         }
 
@@ -174,12 +178,16 @@ def _to_dummy_options(modality: str, count: int) -> BaseDummyOptions:
         # Mistral chat outputs tokens directly, rather than text prompts
         if isinstance(tokenizer, MistralTokenizer):
             images = mm_data.get("image", [])
-            request = ChatCompletionRequest(messages=[
-                UserMessage(content=[
-                    TextChunk(text=""),
-                    *(ImageChunk(image=image) for image in images),
-                ]),
-            ])
+            request = ChatCompletionRequest(
+                messages=[
+                    UserMessage(
+                        content=[
+                            TextChunk(text=""),
+                            *(ImageChunk(image=image) for image in images),
+                        ]
+                    ),
+                ]
+            )
             res = tokenizer.mistral.encode_chat_completion(request)
             prompt = res.tokens
         else:
@@ -303,16 +311,14 @@ def _test_processing_correctness_one(
             baseline_text_result,
             baseline_tokenized_result,
             ignore_mm_keys=ignore_mm_keys,
-            msg=f"Failed ({batch_idx=}, {text_prompt=}, "
-            f"{token_prompt=}, {mm_data=})",
+            msg=f"Failed ({batch_idx=}, {text_prompt=}, {token_prompt=}, {mm_data=})",
         )
 
         _assert_inputs_equal(
             cached_text_result,
             cached_tokenized_result,
             ignore_mm_keys=ignore_mm_keys,
-            msg=f"Failed ({batch_idx=}, {text_prompt=}, "
-            f"{token_prompt=}, {mm_data=})",
+            msg=f"Failed ({batch_idx=}, {text_prompt=}, {token_prompt=}, {mm_data=})",
         )
 
 
diff --git a/tests/models/multimodal/processing/test_glm4_1v.py b/tests/models/multimodal/processing/test_glm4_1v.py
index 070ddcd89ee9..553a5f719bd3 100644
--- a/tests/models/multimodal/processing/test_glm4_1v.py
+++ b/tests/models/multimodal/processing/test_glm4_1v.py
@@ -24,7 +24,8 @@
         # post-sampled frames (expected behavior)
         (-1, 1, 5),
         (-1, 2, 10),
-    ])
+    ],
+)
 def test_processor_override(
     model_id: str,
     expected_toks_per_frame: int,
@@ -55,10 +56,8 @@ def test_processor_override(
     # Ensure we have the right number of placeholders per num_crops size
     hf_processor = processor.info.get_hf_processor(**hf_processor_mm_kwargs)
     video_token_id = tokenizer.convert_tokens_to_ids(hf_processor.video_token)
-    video_tok_count = processed_inputs["prompt_token_ids"].count(
-        video_token_id)
-    grid_t, _, _ = processed_inputs["mm_kwargs"].get_data(
-    )["video_grid_thw"][0]
+    video_tok_count = processed_inputs["prompt_token_ids"].count(video_token_id)
+    grid_t, _, _ = processed_inputs["mm_kwargs"].get_data()["video_grid_thw"][0]
 
     assert grid_t == expected_grid_t
     assert video_tok_count == expected_toks_per_frame * grid_t
@@ -71,7 +70,7 @@ def test_video_loader_consistency(
     fps: int,
 ):
     """
-    Ensure dynamic video loader (pre-sampled by loader) and normal video 
+    Ensure dynamic video loader (pre-sampled by loader) and normal video
     loader (post-sampled by processor) produce same video processing outputs.
     """
     ctx = build_model_context(
@@ -91,7 +90,8 @@ def test_video_loader_consistency(
 
     static_video, static_metadata = OpenCVVideoBackend.load_bytes(video_bytes)
     dynamic_video, dynamic_metadata = OpenCVDynamicVideoBackend.load_bytes(
-        video_bytes, fps=fps)
+        video_bytes, fps=fps
+    )
 
     # pre-sampled loader shouldn't read all frames
     assert len(dynamic_video) < len(static_video)
@@ -99,12 +99,11 @@ def test_video_loader_consistency(
     static_mm_data = {"video": [(static_video, static_metadata)]}
     dynamic_mm_data = {"video": [(dynamic_video, dynamic_metadata)]}
 
-    static_outputs = processor.apply(prompt, static_mm_data,
-                                     hf_processor_mm_kwargs)
-    dynamic_outputs = processor.apply(prompt, dynamic_mm_data,
-                                      hf_processor_mm_kwargs)
+    static_outputs = processor.apply(prompt, static_mm_data, hf_processor_mm_kwargs)
+    dynamic_outputs = processor.apply(prompt, dynamic_mm_data, hf_processor_mm_kwargs)
 
-    assert static_outputs["prompt_token_ids"] == dynamic_outputs[
-        "prompt_token_ids"]
-    assert static_outputs["mm_kwargs"].get_data(
-    ) == dynamic_outputs["mm_kwargs"].get_data()
+    assert static_outputs["prompt_token_ids"] == dynamic_outputs["prompt_token_ids"]
+    assert (
+        static_outputs["mm_kwargs"].get_data()
+        == dynamic_outputs["mm_kwargs"].get_data()
+    )
diff --git a/tests/models/multimodal/processing/test_h2ovl.py b/tests/models/multimodal/processing/test_h2ovl.py
index 1adfe21352c4..bd21d4008fa7 100644
--- a/tests/models/multimodal/processing/test_h2ovl.py
+++ b/tests/models/multimodal/processing/test_h2ovl.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Tests for H2OVL's multimodal preprocessing kwargs."""
+
 from collections.abc import Mapping
 from typing import Optional
 
@@ -23,8 +24,10 @@ def _get_expected_num_patches(
     min_num: int,
     max_num: int,
 ):
-    from vllm.model_executor.models.h2ovl import (calculate_h2ovl_targets,
-                                                  get_h2ovl_target_ratios)
+    from vllm.model_executor.models.h2ovl import (
+        calculate_h2ovl_targets,
+        get_h2ovl_target_ratios,
+    )
 
     width, height = image.size
 
@@ -101,24 +104,27 @@ def _run_check(
 
     total_expected_num_patches = sum(
         _get_expected_num_patches(config, image, len(images), min_num, max_num)
-        for image in images)
+        for image in images
+    )
 
     processed_inputs = processor.apply(prompt, mm_data, mm_processor_kwargs)
 
     # Ensure we have the right number of placeholders per num_crops size
     image_token_id = tokenizer.convert_tokens_to_ids("<IMG_CONTEXT>")
     img_tok_count = processed_inputs["prompt_token_ids"].count(image_token_id)
-    pixel_shape = processed_inputs["mm_kwargs"].get_data(
-    )["pixel_values_flat"].shape
+    pixel_shape = processed_inputs["mm_kwargs"].get_data()["pixel_values_flat"].shape
 
     assert img_tok_count == 256 * total_expected_num_patches
     assert pixel_shape[0] == total_expected_num_patches
 
 
-@pytest.mark.parametrize("model_id", [
-    "h2oai/h2ovl-mississippi-800m",
-    "h2oai/h2ovl-mississippi-2b",
-])
+@pytest.mark.parametrize(
+    "model_id",
+    [
+        "h2oai/h2ovl-mississippi-800m",
+        "h2oai/h2ovl-mississippi-2b",
+    ],
+)
 @pytest.mark.parametrize(
     "size_factors",
     [
@@ -165,10 +171,7 @@ def test_processor_override(
 
     _run_check(
         processor,
-        [
-            rescale_image_size(image_assets[0].pil_image, f)
-            for f in size_factors
-        ],
+        [rescale_image_size(image_assets[0].pil_image, f) for f in size_factors],
         min_num,
         max_num,
         hf_processor_mm_kwargs,
diff --git a/tests/models/multimodal/processing/test_idefics3.py b/tests/models/multimodal/processing/test_idefics3.py
index d3a55993e558..2028d13943cc 100644
--- a/tests/models/multimodal/processing/test_idefics3.py
+++ b/tests/models/multimodal/processing/test_idefics3.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Tests for Idefics3's multimodal preprocessing kwargs."""
+
 import pytest
 from transformers import Idefics3Config
 
@@ -17,7 +18,8 @@
     [
         ({"size": {"longest_edge": 364}}, 169),
         ({"size": {"longest_edge": 728}}, 169 * (2**2 + 1)),
-    ])
+    ],
+)
 # yapf: enable
 @pytest.mark.parametrize("num_imgs", [1, 2])
 @pytest.mark.parametrize("kwargs_on_init", [True, False])
@@ -42,8 +44,11 @@ def test_processor_override(
     hf_processor_mm_kwargs = {} if kwargs_on_init else mm_processor_kwargs
 
     # Build the image str / prompt based on the number of images we pass
-    placeholders = "<image>" if num_imgs == 1 else "\n".join(
-        f"Image-{i}: <image>\n" for i in range(1, num_imgs + 1))
+    placeholders = (
+        "<image>"
+        if num_imgs == 1
+        else "\n".join(f"Image-{i}: <image>\n" for i in range(1, num_imgs + 1))
+    )
     prompt = f"<|begin_of_text|>User:{placeholders}\n<end_of_utterance>\nAssistant:"  # noqa: E501
 
     # Build mm_data
@@ -57,8 +62,7 @@ def test_processor_override(
     # Ensure the placeholders format are correct
     hf_processor = processor.info.get_hf_processor(**hf_processor_mm_kwargs)
     hf_processed_inputs = hf_processor(text=prompt, images=mm_data["image"])
-    assert processed_inputs["prompt_token_ids"] == hf_processed_inputs[
-        "input_ids"][0]
+    assert processed_inputs["prompt_token_ids"] == hf_processed_inputs["input_ids"][0]
 
     # Ensure we have the right number of placeholders per num_crops size
     image_token_id = ctx.get_hf_config().image_token_id
diff --git a/tests/models/multimodal/processing/test_internvl.py b/tests/models/multimodal/processing/test_internvl.py
index e4f25f5ac712..6f6529cb9401 100644
--- a/tests/models/multimodal/processing/test_internvl.py
+++ b/tests/models/multimodal/processing/test_internvl.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Tests for InternVL's multimodal preprocessing kwargs."""
+
 from collections.abc import Mapping
 from typing import Optional
 
@@ -24,7 +25,9 @@ def _get_expected_num_patches(
     max_num: int,
 ):
     from vllm.model_executor.models.internvl import (
-        calculate_internvl_targets, get_internvl_target_ratios)
+        calculate_internvl_targets,
+        get_internvl_target_ratios,
+    )
 
     width, height = image.size
 
@@ -61,15 +64,15 @@ def _run_check(
 
     total_expected_num_patches = sum(
         _get_expected_num_patches(config, image, len(images), min_num, max_num)
-        for image in images)
+        for image in images
+    )
 
     processed_inputs = processor.apply(prompt, mm_data, mm_processor_kwargs)
 
     # Ensure we have the right number of placeholders per num_crops size
     image_token_id = tokenizer.convert_tokens_to_ids("<IMG_CONTEXT>")
     img_tok_count = processed_inputs["prompt_token_ids"].count(image_token_id)
-    pixel_shape = processed_inputs["mm_kwargs"].get_data(
-    )["pixel_values_flat"].shape
+    pixel_shape = processed_inputs["mm_kwargs"].get_data()["pixel_values_flat"].shape
 
     assert img_tok_count == 256 * total_expected_num_patches
     assert pixel_shape[0] == total_expected_num_patches
@@ -122,10 +125,7 @@ def test_processor_override(
 
     _run_check(
         processor,
-        [
-            rescale_image_size(image_assets[0].pil_image, f)
-            for f in size_factors
-        ],
+        [rescale_image_size(image_assets[0].pil_image, f) for f in size_factors],
         min_num,
         max_num,
         hf_processor_mm_kwargs,
diff --git a/tests/models/multimodal/processing/test_llama4.py b/tests/models/multimodal/processing/test_llama4.py
index bea4f43567ee..4c0791ea3cec 100644
--- a/tests/models/multimodal/processing/test_llama4.py
+++ b/tests/models/multimodal/processing/test_llama4.py
@@ -11,8 +11,7 @@
 from ...utils import build_model_context
 
 
-@pytest.mark.parametrize("model_id",
-                         ["meta-llama/Llama-4-Scout-17B-16E-Instruct"])
+@pytest.mark.parametrize("model_id", ["meta-llama/Llama-4-Scout-17B-16E-Instruct"])
 @pytest.mark.parametrize("mm_processor_kwargs", [{}])
 @pytest.mark.parametrize("num_imgs", [1, 5])
 @pytest.mark.parametrize("mm_processor_cache_gb", [0, 4])
@@ -38,13 +37,14 @@ def test_processor_override(
     hf_processor = processor.info.get_hf_processor()
     vocab = tokenizer.get_vocab()
 
-    prompt = "<|begin_of_text|><|header_start|>user<|header_end|>" \
-        + "<|image|>" * num_imgs \
+    prompt = (
+        "<|begin_of_text|><|header_start|>user<|header_end|>"
+        + "<|image|>" * num_imgs
         + "<|eot|><|header_start|>assistant<|header_end|>"
+    )
     mm_data = {
         "image": [
-            image_assets[(i % len(image_assets))].pil_image
-            for i in range(num_imgs)
+            image_assets[(i % len(image_assets))].pil_image for i in range(num_imgs)
         ]
     }
     if tokenized_prompt:
@@ -64,22 +64,23 @@ def test_processor_override(
         if tiles_x * tiles_y > 1:
             num_x_separators += (tiles_x - 1) * tiles_y
             num_y_separators += tiles_y
-    assert prompt_token_ids.count(vocab[hf_processor.tile_token]) \
-        == num_x_separators
-    assert prompt_token_ids.count(vocab[hf_processor.tile_global_token]) \
-        ==  num_y_separators
+    assert prompt_token_ids.count(vocab[hf_processor.tile_token]) == num_x_separators
+    assert (
+        prompt_token_ids.count(vocab[hf_processor.tile_global_token])
+        == num_y_separators
+    )
 
     # image token offsets
     img_locs = processed_inputs["mm_placeholders"].get("image", [])
     assert len(img_locs) == num_imgs
-    assert [img_loc.offset for img_loc in img_locs] == \
-        [i for i, v in enumerate(prompt_token_ids) \
-        if v == config.boi_token_index]
+    assert [img_loc.offset for img_loc in img_locs] == [
+        i for i, v in enumerate(prompt_token_ids) if v == config.boi_token_index
+    ]
 
     # patch sizes and masks
-    num_patches_per_chunk = processor.info.get_patch_per_chunk(
-        config.vision_config)
-    assert prompt_token_ids.count(config.image_token_index) \
+    num_patches_per_chunk = processor.info.get_patch_per_chunk(config.vision_config)
+    assert (
+        prompt_token_ids.count(config.image_token_index)
         == sum(mm_data["patches_per_image"]) * num_patches_per_chunk
-    assert len(mm_data["pixel_values"]) \
-        == sum(mm_data["patches_per_image"])
+    )
+    assert len(mm_data["pixel_values"]) == sum(mm_data["patches_per_image"])
diff --git a/tests/models/multimodal/processing/test_llava_next.py b/tests/models/multimodal/processing/test_llava_next.py
index ca34d1d758a4..ffe7ca17b5d6 100644
--- a/tests/models/multimodal/processing/test_llava_next.py
+++ b/tests/models/multimodal/processing/test_llava_next.py
@@ -22,8 +22,9 @@ def _validate_image_max_tokens_one(
     image_size: ImageSize,
 ) -> None:
     info = processor.info
-    feature_size = info.get_num_image_tokens(image_width=image_size.width,
-                                             image_height=image_size.height)
+    feature_size = info.get_num_image_tokens(
+        image_width=image_size.width, image_height=image_size.height
+    )
 
     try:
         assert feature_size <= max_tokens, f"{feature_size} <= {max_tokens}"
@@ -31,8 +32,9 @@ def _validate_image_max_tokens_one(
         failed_size_excs.append((image_size, exc))
 
 
-@pytest.mark.skip("This test takes around 5 minutes to run. "
-                  "Comment this out to run it manually.")
+@pytest.mark.skip(
+    "This test takes around 5 minutes to run. Comment this out to run it manually."
+)
 @pytest.mark.parametrize("model_id", ["llava-hf/llava-v1.6-mistral-7b-hf"])
 def test_processor_max_tokens(model_id):
     ctx = build_model_context(
@@ -66,9 +68,9 @@ def test_processor_max_tokens(model_id):
     pqdm(image_sizes, validate_one, n_jobs=8, desc="Validating image sizes")
 
     if failed_size_excs:
-        msg = "Found failing image sizes:" \
-            + "\n========\n".join(f"[{size}]\n{exc}"
-                                  for size, exc in failed_size_excs)
+        msg = "Found failing image sizes:" + "\n========\n".join(
+            f"[{size}]\n{exc}" for size, exc in failed_size_excs
+        )
         raise AssertionError(msg)
 
 
@@ -94,8 +96,10 @@ def _validate_image_prompt_replacements_one(
 
         # NOTE: There is a BOS token
         assert first_placeholder.offset == 1
-        assert first_placeholder.length == (
-            len(processed_inputs["prompt_token_ids"]) - 1) // num_imgs
+        assert (
+            first_placeholder.length
+            == (len(processed_inputs["prompt_token_ids"]) - 1) // num_imgs
+        )
 
     except Exception as exc:
         failed_size_excs.append((image_size, exc))
@@ -122,9 +126,9 @@ def _test_image_prompt_replacements(
     pqdm(image_sizes, validate_one, n_jobs=8, desc="Validating image sizes")
 
     if failed_size_excs:
-        msg = "Found failing image sizes:" \
-            + "\n========\n".join(f"[{size}]\n{exc}"
-                                  for size, exc in failed_size_excs)
+        msg = "Found failing image sizes:" + "\n========\n".join(
+            f"[{size}]\n{exc}" for size, exc in failed_size_excs
+        )
         raise AssertionError(msg)
 
 
@@ -138,11 +142,17 @@ def test_processor_prompt_replacements_regression(model_id, num_imgs):
     )
     processor = MULTIMODAL_REGISTRY.create_processor(ctx.model_config)
 
-    image_ratios = [(171, 152), (184, 161), (198, 176), (333, 296), (369, 328),
-                    (488, 183), (2560, 1669)]
+    image_ratios = [
+        (171, 152),
+        (184, 161),
+        (198, 176),
+        (333, 296),
+        (369, 328),
+        (488, 183),
+        (2560, 1669),
+    ]
     image_sizes = [
-        size for w, h in image_ratios
-        for size in [ImageSize(w, h), ImageSize(h, w)]
+        size for w, h in image_ratios for size in [ImageSize(w, h), ImageSize(h, w)]
     ]
 
     _test_image_prompt_replacements(
@@ -152,8 +162,9 @@ def test_processor_prompt_replacements_regression(model_id, num_imgs):
     )
 
 
-@pytest.mark.skip("This test takes around 2 hours to run. "
-                  "Comment this out to run it manually.")
+@pytest.mark.skip(
+    "This test takes around 2 hours to run. Comment this out to run it manually."
+)
 @pytest.mark.parametrize("model_id", ["llava-hf/llava-v1.6-mistral-7b-hf"])
 @pytest.mark.parametrize("num_imgs", [1])
 def test_processor_prompt_replacements_all(model_id, num_imgs):
diff --git a/tests/models/multimodal/processing/test_llava_onevision.py b/tests/models/multimodal/processing/test_llava_onevision.py
index e6344c4e7e6f..f5c552fe6476 100644
--- a/tests/models/multimodal/processing/test_llava_onevision.py
+++ b/tests/models/multimodal/processing/test_llava_onevision.py
@@ -22,8 +22,9 @@ def _validate_image_max_tokens_one(
     image_size: ImageSize,
 ) -> None:
     info = processor.info
-    feature_size = info.get_num_image_tokens(image_width=image_size.width,
-                                             image_height=image_size.height)
+    feature_size = info.get_num_image_tokens(
+        image_width=image_size.width, image_height=image_size.height
+    )
 
     try:
         assert feature_size <= max_tokens, f"{feature_size} <= {max_tokens}"
@@ -31,10 +32,10 @@ def _validate_image_max_tokens_one(
         failed_size_excs.append((image_size, exc))
 
 
-@pytest.mark.skip("This test takes around 5 minutes to run. "
-                  "Comment this out to run it manually.")
-@pytest.mark.parametrize("model_id",
-                         ["llava-hf/llava-onevision-qwen2-0.5b-ov-hf"])
+@pytest.mark.skip(
+    "This test takes around 5 minutes to run. Comment this out to run it manually."
+)
+@pytest.mark.parametrize("model_id", ["llava-hf/llava-onevision-qwen2-0.5b-ov-hf"])
 def test_processor_max_tokens(model_id):
     ctx = build_model_context(
         model_id,
@@ -67,9 +68,9 @@ def test_processor_max_tokens(model_id):
     pqdm(image_sizes, validate_one, n_jobs=8, desc="Validating image sizes")
 
     if failed_size_excs:
-        msg = "Found failing image sizes:" \
-            + "\n========\n".join(f"[{size}]\n{exc}"
-                                  for size, exc in failed_size_excs)
+        msg = "Found failing image sizes:" + "\n========\n".join(
+            f"[{size}]\n{exc}" for size, exc in failed_size_excs
+        )
         raise AssertionError(msg)
 
 
@@ -94,8 +95,10 @@ def _validate_image_prompt_replacements_one(
         first_placeholder = image_placeholders[0]
 
         assert first_placeholder.offset == 0
-        assert first_placeholder.length == len(
-            processed_inputs["prompt_token_ids"]) // num_imgs
+        assert (
+            first_placeholder.length
+            == len(processed_inputs["prompt_token_ids"]) // num_imgs
+        )
     except Exception as exc:
         failed_size_excs.append((image_size, exc))
 
@@ -121,14 +124,13 @@ def _test_image_prompt_replacements(
     pqdm(image_sizes, validate_one, n_jobs=8, desc="Validating image sizes")
 
     if failed_size_excs:
-        msg = "Found failing image sizes:" \
-            + "\n========\n".join(f"[{size}]\n{exc}"
-                                  for size, exc in failed_size_excs)
+        msg = "Found failing image sizes:" + "\n========\n".join(
+            f"[{size}]\n{exc}" for size, exc in failed_size_excs
+        )
         raise AssertionError(msg)
 
 
-@pytest.mark.parametrize("model_id",
-                         ["llava-hf/llava-onevision-qwen2-0.5b-ov-hf"])
+@pytest.mark.parametrize("model_id", ["llava-hf/llava-onevision-qwen2-0.5b-ov-hf"])
 @pytest.mark.parametrize("num_imgs", [1, 2])
 def test_processor_prompt_replacements_regression(model_id, num_imgs):
     ctx = build_model_context(
@@ -138,11 +140,17 @@ def test_processor_prompt_replacements_regression(model_id, num_imgs):
     )
     processor = MULTIMODAL_REGISTRY.create_processor(ctx.model_config)
 
-    image_ratios = [(171, 152), (184, 161), (198, 176), (333, 296), (369, 328),
-                    (488, 183), (2560, 1669)]
+    image_ratios = [
+        (171, 152),
+        (184, 161),
+        (198, 176),
+        (333, 296),
+        (369, 328),
+        (488, 183),
+        (2560, 1669),
+    ]
     image_sizes = [
-        size for w, h in image_ratios
-        for size in [ImageSize(w, h), ImageSize(h, w)]
+        size for w, h in image_ratios for size in [ImageSize(w, h), ImageSize(h, w)]
     ]
 
     _test_image_prompt_replacements(
@@ -152,10 +160,10 @@ def test_processor_prompt_replacements_regression(model_id, num_imgs):
     )
 
 
-@pytest.mark.skip("This test takes around 2 hours to run. "
-                  "Comment this out to run it manually.")
-@pytest.mark.parametrize("model_id",
-                         ["llava-hf/llava-onevision-qwen2-0.5b-ov-hf"])
+@pytest.mark.skip(
+    "This test takes around 2 hours to run. Comment this out to run it manually."
+)
+@pytest.mark.parametrize("model_id", ["llava-hf/llava-onevision-qwen2-0.5b-ov-hf"])
 @pytest.mark.parametrize("num_imgs", [1])
 def test_processor_prompt_replacements_all(model_id, num_imgs):
     ctx = build_model_context(
diff --git a/tests/models/multimodal/processing/test_minimax_vl_01.py b/tests/models/multimodal/processing/test_minimax_vl_01.py
index 9387212e3f10..11e000123511 100644
--- a/tests/models/multimodal/processing/test_minimax_vl_01.py
+++ b/tests/models/multimodal/processing/test_minimax_vl_01.py
@@ -61,17 +61,17 @@ def _test_image_prompt_replacements(
     num_imgs: int,
     image_sizes: list[ImageSize],
 ) -> None:
-
     failed_size_excs = list[tuple[ImageSize, Exception]]()
 
     for size in image_sizes:
-        _validate_image_prompt_replacements_one(processor, num_imgs,
-                                                failed_size_excs, size)
+        _validate_image_prompt_replacements_one(
+            processor, num_imgs, failed_size_excs, size
+        )
 
     if failed_size_excs:
-        msg = "Found failing image sizes:" \
-            + "\n========\n".join(f"[{size}]\n{exc}"
-                                  for size, exc in failed_size_excs)
+        msg = "Found failing image sizes:" + "\n========\n".join(
+            f"[{size}]\n{exc}" for size, exc in failed_size_excs
+        )
         raise AssertionError(msg)
 
 
@@ -85,11 +85,17 @@ def test_processor_prompt_replacements_regression(model_id, num_imgs):
     )
     processor = MULTIMODAL_REGISTRY.create_processor(ctx.model_config)
 
-    image_ratios = [(171, 152), (184, 161), (198, 176), (333, 296), (369, 328),
-                    (488, 183), (2560, 1669)]
+    image_ratios = [
+        (171, 152),
+        (184, 161),
+        (198, 176),
+        (333, 296),
+        (369, 328),
+        (488, 183),
+        (2560, 1669),
+    ]
     image_sizes = [
-        size for w, h in image_ratios
-        for size in [ImageSize(w, h), ImageSize(h, w)]
+        size for w, h in image_ratios for size in [ImageSize(w, h), ImageSize(h, w)]
     ]
 
     _test_image_prompt_replacements(
diff --git a/tests/models/multimodal/processing/test_mllama4.py b/tests/models/multimodal/processing/test_mllama4.py
index a155ada35e92..e5ff2d1391b6 100644
--- a/tests/models/multimodal/processing/test_mllama4.py
+++ b/tests/models/multimodal/processing/test_mllama4.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Tests for mllama's multimodal preprocessing and profiling."""
+
 import pytest
 from torch import prod
 from transformers import Llama4Config
@@ -47,14 +48,17 @@ def test_profiling(model_id: str, max_model_len: int):
     image_size = hf_config.vision_config.image_size
     patch_size = hf_config.vision_config.patch_size
     downsample_ratio = int(
-        round(1.0 / (hf_config.vision_config.pixel_shuffle_ratio**2)))
-    tokens_per_patch = ((image_size // patch_size)**2) // downsample_ratio
+        round(1.0 / (hf_config.vision_config.pixel_shuffle_ratio**2))
+    )
+    tokens_per_patch = ((image_size // patch_size) ** 2) // downsample_ratio
     chunks_per_image = prod(mm_data["patches_per_image"])
     total_num_patches = chunks_per_image * tokens_per_patch
-    num_tiles = mm_data["aspect_ratios"][0][0] * mm_data["aspect_ratios"][0][
-        1]  # x-y separator tokens
-    total_tokens = total_num_patches.item() + num_tiles.item(
-    ) + 3  # image start, image, image end
+    num_tiles = (
+        mm_data["aspect_ratios"][0][0] * mm_data["aspect_ratios"][0][1]
+    )  # x-y separator tokens
+    total_tokens = (
+        total_num_patches.item() + num_tiles.item() + 3
+    )  # image start, image, image end
 
     profiled_tokens = profiler.get_mm_max_contiguous_tokens(
         max_model_len,
@@ -63,5 +67,6 @@ def test_profiling(model_id: str, max_model_len: int):
 
     assert total_tokens == profiled_tokens["image"]
     assert total_tokens == sum(
-        placeholder.length for placeholder in
-        decoder_dummy_data.multi_modal_placeholders["image"])
+        placeholder.length
+        for placeholder in decoder_dummy_data.multi_modal_placeholders["image"]
+    )
diff --git a/tests/models/multimodal/processing/test_nemotron_vl.py b/tests/models/multimodal/processing/test_nemotron_vl.py
index d9f1965a053d..6ff6f396fa33 100644
--- a/tests/models/multimodal/processing/test_nemotron_vl.py
+++ b/tests/models/multimodal/processing/test_nemotron_vl.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Tests for Nemotron-Nano-VL's multimodal preprocessing kwargs."""
+
 from collections.abc import Mapping
 from typing import Optional
 
@@ -24,7 +25,9 @@ def _get_expected_num_patches(
     max_num: int,
 ):
     from vllm.model_executor.models.nemotron_vl import (
-        calculate_nemotron_vl_targets, get_nemotron_vl_target_ratios)
+        calculate_nemotron_vl_targets,
+        get_nemotron_vl_target_ratios,
+    )
 
     width, height = image.size
 
@@ -63,22 +66,21 @@ def _run_check(
 
     total_expected_num_patches = sum(
         _get_expected_num_patches(config, image, len(images), min_num, max_num)
-        for image in images)
+        for image in images
+    )
     print(total_expected_num_patches)
     processed_inputs = processor.apply(prompt, mm_data, mm_processor_kwargs)
 
     # Ensure we have the right number of placeholders per num_crops size
     image_token_id = tokenizer.convert_tokens_to_ids("<image>")
     img_tok_count = processed_inputs["prompt_token_ids"].count(image_token_id)
-    pixel_shape = processed_inputs["mm_kwargs"].get_data(
-    )["pixel_values_flat"].shape
+    pixel_shape = processed_inputs["mm_kwargs"].get_data()["pixel_values_flat"].shape
     print("Image token count:", img_tok_count, "Pixel shape:", pixel_shape)
     assert img_tok_count == 256 * total_expected_num_patches
     assert pixel_shape[0] == total_expected_num_patches
 
 
-@pytest.mark.parametrize("model_id",
-                         ["nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1"])
+@pytest.mark.parametrize("model_id", ["nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1"])
 @pytest.mark.parametrize(
     "size_factors",
     [
@@ -125,10 +127,7 @@ def test_processor_override(
 
     _run_check(
         processor,
-        [
-            rescale_image_size(image_assets[0].pil_image, f)
-            for f in size_factors
-        ],
+        [rescale_image_size(image_assets[0].pil_image, f) for f in size_factors],
         min_num,
         max_num,
         hf_processor_mm_kwargs,
diff --git a/tests/models/multimodal/processing/test_phi3v.py b/tests/models/multimodal/processing/test_phi3v.py
index 1f3646f79486..436f029f9f0e 100644
--- a/tests/models/multimodal/processing/test_phi3v.py
+++ b/tests/models/multimodal/processing/test_phi3v.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Tests for phi3v's multimodal preprocessing kwargs."""
+
 import pytest
 
 from vllm.multimodal import MULTIMODAL_REGISTRY
@@ -18,7 +19,8 @@
         ({"num_crops": 16}, 1921),
         # the default num_crops of phi-3.5-vision is 4
         ({}, 757),
-    ])
+    ],
+)
 # yapf: enable
 @pytest.mark.parametrize("num_imgs", [1, 2])
 @pytest.mark.parametrize("kwargs_on_init", [True, False])
diff --git a/tests/models/multimodal/processing/test_phi4mm.py b/tests/models/multimodal/processing/test_phi4mm.py
index f16d261c2c6a..b6759342ffdf 100644
--- a/tests/models/multimodal/processing/test_phi4mm.py
+++ b/tests/models/multimodal/processing/test_phi4mm.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Tests for phi4mm's multimodal preprocessing kwargs."""
+
 import pytest
 
 from vllm.multimodal import MULTIMODAL_REGISTRY
@@ -18,7 +19,8 @@
         ({"dynamic_hd": 16}, 4433),
         # the default num_crops of phi-4-multimodal is 36
         ({}, 9585),
-    ])
+    ],
+)
 # yapf: enable
 @pytest.mark.parametrize("num_imgs", [1, 2])
 @pytest.mark.parametrize("kwargs_on_init", [True, False])
@@ -46,8 +48,7 @@ def test_processor_override(
     img_str = "".join([f"<|image_{idx}|>\n" for idx in range(1, num_imgs + 1)])
     prompt = f"<|user|>\n{img_str}<|end|>\n<|assistant|>\n"
 
-    image_size = ctx.get_hf_config(
-    ).embd_layer["image_embd_layer"]["crop_size"]
+    image_size = ctx.get_hf_config().embd_layer["image_embd_layer"]["crop_size"]
     dummy_image_size = (image_size * 7, image_size * 7)
     dummy_image = image_assets[0].pil_image.resize(dummy_image_size)
     mm_data = {"image": [dummy_image] * num_imgs}
@@ -56,5 +57,6 @@ def test_processor_override(
 
     # Ensure we have the right number of placeholders per num_crops size
     img_tok_count = processed_inputs["prompt_token_ids"].count(
-        _IMAGE_PLACEHOLDER_TOKEN_ID)
+        _IMAGE_PLACEHOLDER_TOKEN_ID
+    )
     assert img_tok_count == expected_toks_per_img * num_imgs
diff --git a/tests/models/multimodal/processing/test_qwen2_vl.py b/tests/models/multimodal/processing/test_qwen2_vl.py
index 985f4188fdb6..eddcd329baba 100644
--- a/tests/models/multimodal/processing/test_qwen2_vl.py
+++ b/tests/models/multimodal/processing/test_qwen2_vl.py
@@ -12,10 +12,12 @@
 @pytest.mark.parametrize("model_id", ["Qwen/Qwen2-VL-2B-Instruct"])
 # yapf: disable
 @pytest.mark.parametrize(
-    ("mm_processor_kwargs", "expected_toks_per_img", "expected_pixels_shape"), [
+    ("mm_processor_kwargs", "expected_toks_per_img", "expected_pixels_shape"),
+    [
         ({}, 1426, (5704, 1176)),
         ({"min_pixels": 64**2, "max_pixels": 512**2}, 330, (1320, 1176)),
-    ])
+    ],
+)
 # yapf: enable
 @pytest.mark.parametrize("num_imgs", [1, 2])
 @pytest.mark.parametrize("kwargs_on_init", [True, False])
@@ -48,8 +50,7 @@ def test_processor_override(
     hf_processor = processor.info.get_hf_processor(**hf_processor_mm_kwargs)
     image_token_id = tokenizer.convert_tokens_to_ids(hf_processor.image_token)
     img_tok_count = processed_inputs["prompt_token_ids"].count(image_token_id)
-    pixel_shape = processed_inputs["mm_kwargs"].get_data(
-    )["pixel_values"].shape
+    pixel_shape = processed_inputs["mm_kwargs"].get_data()["pixel_values"].shape
 
     assert img_tok_count == expected_toks_per_img * num_imgs
     assert pixel_shape[0] == expected_pixels_shape[0] * num_imgs
diff --git a/tests/models/multimodal/processing/test_smolvlm.py b/tests/models/multimodal/processing/test_smolvlm.py
index af8f983388c6..20018513d067 100644
--- a/tests/models/multimodal/processing/test_smolvlm.py
+++ b/tests/models/multimodal/processing/test_smolvlm.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Tests for smolvlm's multimodal preprocessing kwargs."""
+
 import pytest
 from transformers import SmolVLMConfig
 
@@ -17,7 +18,8 @@
     [
         ({"max_image_size": {"longest_edge": 384}}, 1377),
         ({"max_image_size": {"longest_edge": 768}}, 405),
-    ])
+    ],
+)
 # yapf: enable
 @pytest.mark.parametrize("num_imgs", [1, 2])
 @pytest.mark.parametrize("kwargs_on_init", [True, False])
@@ -42,8 +44,11 @@ def test_processor_override(
     hf_processor_mm_kwargs = {} if kwargs_on_init else mm_processor_kwargs
 
     # Build the image str / prompt based on the number of images we pass
-    placeholders = "<image>" if num_imgs == 1 else "\n".join(
-        f"Image-{i}: <image>\n" for i in range(1, num_imgs + 1))
+    placeholders = (
+        "<image>"
+        if num_imgs == 1
+        else "\n".join(f"Image-{i}: <image>\n" for i in range(1, num_imgs + 1))
+    )
     prompt = f"<|im_start|>User:{placeholders}\n<end_of_utterance>\nAssistant:"  # noqa: E501
 
     # Build mm_data
@@ -57,8 +62,7 @@ def test_processor_override(
     # Ensure the placeholders format are correct
     hf_processor = processor.info.get_hf_processor(**hf_processor_mm_kwargs)
     hf_processed_inputs = hf_processor(text=prompt, images=mm_data["image"])
-    assert processed_inputs["prompt_token_ids"] == hf_processed_inputs[
-        "input_ids"][0]
+    assert processed_inputs["prompt_token_ids"] == hf_processed_inputs["input_ids"][0]
 
     # Ensure we have the right number of placeholders per num_crops size
     image_token_id = ctx.get_hf_config().image_token_id
diff --git a/tests/models/multimodal/processing/test_tensor_schema.py b/tests/models/multimodal/processing/test_tensor_schema.py
index 6061e4538c95..2c4d109c3687 100644
--- a/tests/models/multimodal/processing/test_tensor_schema.py
+++ b/tests/models/multimodal/processing/test_tensor_schema.py
@@ -9,23 +9,29 @@
 import numpy as np
 import pytest
 import torch.nn as nn
-from mistral_common.protocol.instruct.messages import (ImageChunk, TextChunk,
-                                                       UserMessage)
+from mistral_common.protocol.instruct.messages import ImageChunk, TextChunk, UserMessage
 from mistral_common.protocol.instruct.request import ChatCompletionRequest
 from PIL import Image
 
 from vllm.config import ModelConfig, VllmConfig, set_current_vllm_config
-from vllm.config.multimodal import (AudioDummyOptions, BaseDummyOptions,
-                                    ImageDummyOptions, VideoDummyOptions)
-from vllm.distributed import (cleanup_dist_env_and_memory,
-                              init_distributed_environment,
-                              initialize_model_parallel)
+from vllm.config.multimodal import (
+    AudioDummyOptions,
+    BaseDummyOptions,
+    ImageDummyOptions,
+    VideoDummyOptions,
+)
+from vllm.distributed import (
+    cleanup_dist_env_and_memory,
+    init_distributed_environment,
+    initialize_model_parallel,
+)
 from vllm.model_executor.model_loader.utils import set_default_torch_dtype
-from vllm.model_executor.models.interfaces import (SupportsMultiModal,
-                                                   supports_multimodal)
+from vllm.model_executor.models.interfaces import (
+    SupportsMultiModal,
+    supports_multimodal,
+)
 from vllm.multimodal import MULTIMODAL_REGISTRY, BatchedTensorInputs
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        InputProcessingContext)
+from vllm.multimodal.processing import BaseMultiModalProcessor, InputProcessingContext
 from vllm.multimodal.utils import group_mm_kwargs_by_modality
 from vllm.transformers_utils.tokenizer import cached_tokenizer_from_config
 from vllm.utils import is_list_of
@@ -48,13 +54,15 @@
 }
 
 ImageInput = list[Image.Image]
-VideoInput = Union[list[Image.Image], list[np.ndarray],
-                   list[tuple[np.ndarray, dict[str, Any]]]]
+VideoInput = Union[
+    list[Image.Image], list[np.ndarray], list[tuple[np.ndarray, dict[str, Any]]]
+]
 AudioInput = list[tuple[np.ndarray, int]]
 
 
-def _resize_data(_data: Union[Image.Image, np.ndarray],
-                 size_factor: float) -> Union[Image.Image, np.ndarray]:
+def _resize_data(
+    _data: Union[Image.Image, np.ndarray], size_factor: float
+) -> Union[Image.Image, np.ndarray]:
     assert size_factor <= 1, "Size factor must be less than 1"
     # Image input
     if isinstance(_data, Image.Image):
@@ -74,20 +82,18 @@ def _resize_data(_data: Union[Image.Image, np.ndarray],
         return _data[..., :T, :H, :W, :C]
     # Audio input
     elif isinstance(_data, np.ndarray) and _data.ndim == 1:
-        return _data[:int(len(_data) * size_factor)]
+        return _data[: int(len(_data) * size_factor)]
     raise AssertionError("This line should be unreachable.")
 
 
 def resize_mm_data(
-    data: Union[ImageInput, VideoInput, AudioInput],
-    size_factors: tuple[float,
-                        ...]) -> Union[ImageInput, VideoInput, AudioInput]:
-    size_factors = size_factors[:len(data)]
+    data: Union[ImageInput, VideoInput, AudioInput], size_factors: tuple[float, ...]
+) -> Union[ImageInput, VideoInput, AudioInput]:
+    size_factors = size_factors[: len(data)]
     if is_list_of(data, (Image.Image, np.ndarray, list)):
         return [_resize_data(d, s) for d, s in zip(data, size_factors)]
     elif is_list_of(data, tuple):
-        return [(_resize_data(d, s), meta)
-                for (d, meta), s in zip(data, size_factors)]
+        return [(_resize_data(d, s), meta) for (d, meta), s in zip(data, size_factors)]
     raise ValueError("Unsupported multimodal data type.")
 
 
@@ -116,12 +122,16 @@ def create_batched_mm_kwargs(
     # Mistral chat outputs tokens directly, rather than text prompts
     if model_config.tokenizer_mode == "mistral":
         images = resized_mm_data.get("image", [])
-        request = ChatCompletionRequest(messages=[
-            UserMessage(content=[
-                TextChunk(text=""),
-                *(ImageChunk(image=image) for image in images),
-            ]),
-        ])
+        request = ChatCompletionRequest(
+            messages=[
+                UserMessage(
+                    content=[
+                        TextChunk(text=""),
+                        *(ImageChunk(image=image) for image in images),
+                    ]
+                ),
+            ]
+        )
         tokenizer = processing_info.get_tokenizer()
         res = tokenizer.mistral.encode_chat_completion(request)
         prompt = res.tokens
@@ -133,10 +143,7 @@ def create_batched_mm_kwargs(
         hf_processor_mm_kwargs=processor_inputs.hf_processor_mm_kwargs,
         tokenization_kwargs=processor_inputs.tokenization_kwargs,
     )["mm_kwargs"].require_data()
-    items = [
-        item for modality in supported_mm_limits
-        for item in mm_kwargs[modality]
-    ]
+    items = [item for modality in supported_mm_limits for item in mm_kwargs[modality]]
     return group_mm_kwargs_by_modality(
         items,
         merge_by_field_config=model_cls.merge_by_field_config,
@@ -167,15 +174,17 @@ def initialize_dummy_model(
     cleanup_dist_env_and_memory()
 
 
-def get_model_id_to_test(
-        model_arch_list: Iterable[str]) -> list[tuple[str, str]]:
+def get_model_id_to_test(model_arch_list: Iterable[str]) -> list[tuple[str, str]]:
     filtered_results = []
     for model_arch in model_arch_list:
         model_info = HF_EXAMPLE_MODELS.get_hf_info(model_arch)
         if model_info.extras and model_arch in ARCH_NEEDS_EXTRAS:
             available_repos = list(
-                map(lambda model_id: (model_arch, model_id),
-                    [model_info.default, *model_info.extras.values()]))
+                map(
+                    lambda model_id: (model_arch, model_id),
+                    [model_info.default, *model_info.extras.values()],
+                )
+            )
             filtered_results.extend(available_repos)
         else:
             filtered_results.append((model_arch, model_info.default))
@@ -183,8 +192,8 @@ def get_model_id_to_test(
 
 
 @pytest.mark.parametrize(
-    "model_arch, model_id",
-    get_model_id_to_test(_MULTIMODAL_EXAMPLE_MODELS.keys()))
+    "model_arch, model_id", get_model_id_to_test(_MULTIMODAL_EXAMPLE_MODELS.keys())
+)
 def test_model_tensor_schema(model_arch: str, model_id: str):
     if model_arch in ARCH_TO_SKIP:
         pytest.skip(f"Skipping {model_arch} due to {ARCH_TO_SKIP[model_arch]}")
@@ -193,12 +202,13 @@ def test_model_tensor_schema(model_arch: str, model_id: str):
 
     model_info = HF_EXAMPLE_MODELS.get_hf_info(model_arch)
     model_info.check_available_online(on_fail="skip")
-    model_info.check_transformers_version(on_fail="skip",
-                                          check_max_version=False)
+    model_info.check_transformers_version(on_fail="skip", check_max_version=False)
 
-    hf_overrides_fn = partial(dummy_hf_overrides,
-                              model_arch=model_arch,
-                              exist_overrides=model_info.hf_overrides)
+    hf_overrides_fn = partial(
+        dummy_hf_overrides,
+        model_arch=model_arch,
+        exist_overrides=model_info.hf_overrides,
+    )
 
     model_config = ModelConfig(
         model_id,
@@ -256,8 +266,11 @@ def _to_dummy_options(modality: str, count: int) -> BaseDummyOptions:
 
     with initialize_dummy_model(model_cls, model_config) as model:
         for modality, _, mm_kwargs in create_batched_mm_kwargs(
-                model_cls, model_config, processor):
+            model_cls, model_config, processor
+        ):
             for method_name in inputs_parse_methods:
-                print(f"Testing `{method_name}` with modality={modality} "
-                      f"and mm_kwargs{list(mm_kwargs.keys())}")
+                print(
+                    f"Testing `{method_name}` with modality={modality} "
+                    f"and mm_kwargs{list(mm_kwargs.keys())}"
+                )
                 getattr(model, method_name)(modality=modality, **mm_kwargs)
diff --git a/tests/models/multimodal/test_mapping.py b/tests/models/multimodal/test_mapping.py
index caf1966ab513..2179cf33a573 100644
--- a/tests/models/multimodal/test_mapping.py
+++ b/tests/models/multimodal/test_mapping.py
@@ -19,7 +19,7 @@ def create_repo_dummy_weights(repo: str) -> Iterable[tuple[str, torch.Tensor]]:
     """Create weights from safetensors checkpoint metadata"""
     metadata = try_get_safetensors_metadata(repo)
     weight_names = list(metadata.weight_map.keys())
-    with torch.device('meta'):
+    with torch.device("meta"):
         return ((name, torch.empty(0)) for name in weight_names)
 
 
@@ -61,7 +61,8 @@ def test_hf_model_weights_mapper(model_arch: str):
         hf_overrides=model_info.hf_overrides,
         skip_tokenizer_init=model_info.skip_tokenizer_init,
         enforce_eager=model_info.enforce_eager,
-        dtype=model_info.dtype)
+        dtype=model_info.dtype,
+    )
     model_cls = MULTIMODAL_REGISTRY._get_model_cls(model_config)
 
     original_weights = create_repo_dummy_weights(model_id)
@@ -83,6 +84,7 @@ def test_hf_model_weights_mapper(model_arch: str):
 
     weights_missing = ref_weight_names - weight_names
     weights_unmapped = weight_names - ref_weight_names
-    assert (not weights_missing and not weights_unmapped), (
+    assert not weights_missing and not weights_unmapped, (
         f"Following weights are not mapped correctly: {weights_unmapped}, "
-        f"Missing expected weights: {weights_missing}.")
+        f"Missing expected weights: {weights_missing}."
+    )
diff --git a/tests/models/quantization/test_awq.py b/tests/models/quantization/test_awq.py
index e741e4ad90a0..c4c10832ede3 100644
--- a/tests/models/quantization/test_awq.py
+++ b/tests/models/quantization/test_awq.py
@@ -11,12 +11,12 @@
 from ...conftest import IMAGE_ASSETS, ImageTestAssets, VllmRunner
 from ..utils import check_logprobs_close
 
-HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts({
-    "stop_sign":
-    "<|im_start|>User\n<image>\nWhat's the content in the center of the image?<|im_end|>\n<|im_start|>Assistant\n",  # noqa: E501
-    "cherry_blossom":
-    "<|im_start|>User\n<image>\nWhat is the season?<|im_end|>\n<|im_start|>Assistant\n",  # noqa: E501
-})
+HF_IMAGE_PROMPTS = IMAGE_ASSETS.prompts(
+    {
+        "stop_sign": "<|im_start|>User\n<image>\nWhat's the content in the center of the image?<|im_end|>\n<|im_start|>Assistant\n",  # noqa: E501
+        "cherry_blossom": "<|im_start|>User\n<image>\nWhat is the season?<|im_end|>\n<|im_start|>Assistant\n",  # noqa: E501
+    }
+)
 
 
 def run_awq_test(
@@ -34,10 +34,13 @@ def run_awq_test(
 ):
     images = [asset.pil_image for asset in image_assets]
 
-    inputs_per_image = [(
-        [prompt for _ in size_factors],
-        [rescale_image_size(image, factor) for factor in size_factors],
-    ) for image, prompt in zip(images, HF_IMAGE_PROMPTS)]
+    inputs_per_image = [
+        (
+            [prompt for _ in size_factors],
+            [rescale_image_size(image, factor) for factor in size_factors],
+        )
+        for image, prompt in zip(images, HF_IMAGE_PROMPTS)
+    ]
 
     # NOTE: take care of the order. run vLLM first, and then run HF.
     # vLLM needs a fresh new process without cuda initialization.
@@ -46,42 +49,41 @@ def run_awq_test(
 
     # max_model_len should be greater than image_feature_size
     with vllm_runner(
-            source_model,
-            max_model_len=4096,
-            dtype=dtype,
-            tensor_parallel_size=tensor_parallel_size,
-            distributed_executor_backend=distributed_executor_backend,
-            enforce_eager=True,
-            default_torch_num_threads=1,
+        source_model,
+        max_model_len=4096,
+        dtype=dtype,
+        tensor_parallel_size=tensor_parallel_size,
+        distributed_executor_backend=distributed_executor_backend,
+        enforce_eager=True,
+        default_torch_num_threads=1,
     ) as vllm_model:
         source_outputs_per_image = [
-            vllm_model.generate_greedy_logprobs(prompts,
-                                                max_tokens,
-                                                num_logprobs=num_logprobs,
-                                                images=images)
+            vllm_model.generate_greedy_logprobs(
+                prompts, max_tokens, num_logprobs=num_logprobs, images=images
+            )
             for prompts, images in inputs_per_image
         ]
 
     with vllm_runner(
-            quant_model,
-            quantization="awq",
-            max_model_len=4096,
-            dtype=dtype,
-            tensor_parallel_size=tensor_parallel_size,
-            distributed_executor_backend=distributed_executor_backend,
-            enforce_eager=True,
-            default_torch_num_threads=1,
+        quant_model,
+        quantization="awq",
+        max_model_len=4096,
+        dtype=dtype,
+        tensor_parallel_size=tensor_parallel_size,
+        distributed_executor_backend=distributed_executor_backend,
+        enforce_eager=True,
+        default_torch_num_threads=1,
     ) as vllm_model:
         quant_outputs_per_image = [
-            vllm_model.generate_greedy_logprobs(prompts,
-                                                max_tokens,
-                                                num_logprobs=num_logprobs,
-                                                images=images)
+            vllm_model.generate_greedy_logprobs(
+                prompts, max_tokens, num_logprobs=num_logprobs, images=images
+            )
             for prompts, images in inputs_per_image
         ]
 
-    for source_outputs, quant_outputs in zip(source_outputs_per_image,
-                                             quant_outputs_per_image):
+    for source_outputs, quant_outputs in zip(
+        source_outputs_per_image, quant_outputs_per_image
+    ):
         # TODO: Check whether using original CLIPVisionModel can improve
         # consistency against HF
         check_logprobs_close(
@@ -113,9 +115,16 @@ def run_awq_test(
 @pytest.mark.parametrize("max_tokens", [128])
 @pytest.mark.parametrize("num_logprobs", [5])
 @torch.inference_mode()
-def test_awq_models(vllm_runner, image_assets, source_model, quant_model,
-                    size_factors, dtype, max_tokens, num_logprobs) -> None:
-
+def test_awq_models(
+    vllm_runner,
+    image_assets,
+    source_model,
+    quant_model,
+    size_factors,
+    dtype,
+    max_tokens,
+    num_logprobs,
+) -> None:
     run_awq_test(
         vllm_runner,
         image_assets,
diff --git a/tests/models/quantization/test_bitblas.py b/tests/models/quantization/test_bitblas.py
index 754ac9a29a13..f516cc2724a6 100644
--- a/tests/models/quantization/test_bitblas.py
+++ b/tests/models/quantization/test_bitblas.py
@@ -7,9 +7,10 @@
 bitblas/GPTQ models are in the top 3 selections of each other.
 
 Note: bitblas internally uses locks to synchronize the threads. This can
-result in very slight nondeterminism for bitblas. As a result, we re-run the 
+result in very slight nondeterminism for bitblas. As a result, we re-run the
 test up to 3 times to see if we pass.
 """
+
 from dataclasses import dataclass
 
 import pytest
@@ -24,8 +25,10 @@ class ModelPair:
 
 
 model_pairs = [
-    ModelPair(model_bitblas="hxbgsyxh/opt-125m-4bit-128g-bitblas",
-              model_gptq="hxbgsyxh/opt-125m-4bit-128g"),
+    ModelPair(
+        model_bitblas="hxbgsyxh/opt-125m-4bit-128g-bitblas",
+        model_gptq="hxbgsyxh/opt-125m-4bit-128g",
+    ),
 ]
 
 
@@ -43,16 +46,19 @@ def test_models(
     max_tokens: int,
     num_logprobs: int,
 ) -> None:
-    with vllm_runner(model_pair.model_bitblas,
-                     dtype=dtype,
-                     quantization="bitblas") as bitblas_model:
+    with vllm_runner(
+        model_pair.model_bitblas, dtype=dtype, quantization="bitblas"
+    ) as bitblas_model:
         bitblas_outputs = bitblas_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
-    with vllm_runner(model_pair.model_gptq, dtype=dtype,
-                     quantization="gptq") as gptq_model:
+    with vllm_runner(
+        model_pair.model_gptq, dtype=dtype, quantization="gptq"
+    ) as gptq_model:
         gptq_outputs = gptq_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     check_logprobs_close(
         outputs_0_lst=gptq_outputs,
diff --git a/tests/models/quantization/test_bitsandbytes.py b/tests/models/quantization/test_bitsandbytes.py
index 25fc44fee90d..5e0421af1c17 100644
--- a/tests/models/quantization/test_bitsandbytes.py
+++ b/tests/models/quantization/test_bitsandbytes.py
@@ -1,9 +1,9 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-'''Tests whether bitsandbytes computation is enabled correctly.
+"""Tests whether bitsandbytes computation is enabled correctly.
 
 Run `pytest tests/quantization/test_bitsandbytes.py`.
-'''
+"""
 
 import pytest
 from transformers import BitsAndBytesConfig
@@ -15,8 +15,10 @@
 
 models_4bit_to_test = [
     ("facebook/opt-125m", "quantize opt model inflight"),
-    ("mistralai/Mistral-7B-Instruct-v0.3",
-     "quantize inflight model with both HF and Mistral format weights")
+    (
+        "mistralai/Mistral-7B-Instruct-v0.3",
+        "quantize inflight model with both HF and Mistral format weights",
+    ),
 ]
 
 models_4bit_to_embedding_test = [
@@ -28,72 +30,84 @@
 ]
 
 models_pre_qaunt_4bit_to_test = [
-    ('PrunaAI/Einstein-v6.1-Llama3-8B-bnb-4bit-smashed',
-     'read pre-quantized 4-bit FP4 model'),
-    ('poedator/opt-125m-bnb-4bit', 'read pre-quantized 4-bit NF4 opt model'),
+    (
+        "PrunaAI/Einstein-v6.1-Llama3-8B-bnb-4bit-smashed",
+        "read pre-quantized 4-bit FP4 model",
+    ),
+    ("poedator/opt-125m-bnb-4bit", "read pre-quantized 4-bit NF4 opt model"),
 ]
 
 models_pre_quant_8bit_to_test = [
-    ('meta-llama/Llama-Guard-3-8B-INT8',
-     'read pre-quantized llama 8-bit model'),
+    ("meta-llama/Llama-Guard-3-8B-INT8", "read pre-quantized llama 8-bit model"),
     ("yec019/fbopt-350m-8bit", "read pre-quantized 8-bit opt model"),
 ]
 
 
-@pytest.mark.skipif(not is_quant_method_supported("bitsandbytes"),
-                    reason='bitsandbytes is not supported on this GPU type.')
+@pytest.mark.skipif(
+    not is_quant_method_supported("bitsandbytes"),
+    reason="bitsandbytes is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("model_name, description", models_4bit_to_test)
-def test_load_4bit_bnb_model(hf_runner, vllm_runner, example_prompts,
-                             model_name, description) -> None:
-
-    hf_model_kwargs = dict(quantization_config=BitsAndBytesConfig(
-        load_in_4bit=True))
-    validate_generated_texts(hf_runner, vllm_runner, example_prompts[:1],
-                             model_name, False, hf_model_kwargs)
-
-
-@pytest.mark.skipif(not is_quant_method_supported("bitsandbytes"),
-                    reason='bitsandbytes is not supported on this GPU type.')
-@pytest.mark.parametrize("model_name, description",
-                         models_pre_qaunt_4bit_to_test)
-def test_load_pre_quant_4bit_bnb_model(hf_runner, vllm_runner, example_prompts,
-                                       model_name, description) -> None:
+def test_load_4bit_bnb_model(
+    hf_runner, vllm_runner, example_prompts, model_name, description
+) -> None:
+    hf_model_kwargs = dict(quantization_config=BitsAndBytesConfig(load_in_4bit=True))
+    validate_generated_texts(
+        hf_runner, vllm_runner, example_prompts[:1], model_name, False, hf_model_kwargs
+    )
 
-    validate_generated_texts(hf_runner, vllm_runner, example_prompts[:1],
-                             model_name, True)
 
+@pytest.mark.skipif(
+    not is_quant_method_supported("bitsandbytes"),
+    reason="bitsandbytes is not supported on this GPU type.",
+)
+@pytest.mark.parametrize("model_name, description", models_pre_qaunt_4bit_to_test)
+def test_load_pre_quant_4bit_bnb_model(
+    hf_runner, vllm_runner, example_prompts, model_name, description
+) -> None:
+    validate_generated_texts(
+        hf_runner, vllm_runner, example_prompts[:1], model_name, True
+    )
 
-@pytest.mark.skipif(not is_quant_method_supported("bitsandbytes"),
-                    reason='bitsandbytes is not supported on this GPU type.')
-@pytest.mark.parametrize("model_name, description",
-                         models_pre_quant_8bit_to_test)
-def test_load_8bit_bnb_model(hf_runner, vllm_runner, example_prompts,
-                             model_name, description) -> None:
 
-    validate_generated_texts(hf_runner, vllm_runner, example_prompts[:1],
-                             model_name, True)
+@pytest.mark.skipif(
+    not is_quant_method_supported("bitsandbytes"),
+    reason="bitsandbytes is not supported on this GPU type.",
+)
+@pytest.mark.parametrize("model_name, description", models_pre_quant_8bit_to_test)
+def test_load_8bit_bnb_model(
+    hf_runner, vllm_runner, example_prompts, model_name, description
+) -> None:
+    validate_generated_texts(
+        hf_runner, vllm_runner, example_prompts[:1], model_name, True
+    )
 
 
-@pytest.mark.skipif(not is_quant_method_supported("bitsandbytes"),
-                    reason='bitsandbytes is not supported on this GPU type.')
+@pytest.mark.skipif(
+    not is_quant_method_supported("bitsandbytes"),
+    reason="bitsandbytes is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("model_name, description", models_4bit_to_test)
 @multi_gpu_test(num_gpus=2)
-def test_load_tp_4bit_bnb_model(hf_runner, vllm_runner, example_prompts,
-                                model_name, description) -> None:
-
-    hf_model_kwargs = dict(quantization_config=BitsAndBytesConfig(
-        load_in_4bit=True))
-    validate_generated_texts(hf_runner,
-                             vllm_runner,
-                             example_prompts[:1],
-                             model_name,
-                             False,
-                             hf_model_kwargs,
-                             vllm_tp_size=2)
-
-
-@pytest.mark.skipif(not is_quant_method_supported("bitsandbytes"),
-                    reason='bitsandbytes is not supported on this GPU type.')
+def test_load_tp_4bit_bnb_model(
+    hf_runner, vllm_runner, example_prompts, model_name, description
+) -> None:
+    hf_model_kwargs = dict(quantization_config=BitsAndBytesConfig(load_in_4bit=True))
+    validate_generated_texts(
+        hf_runner,
+        vllm_runner,
+        example_prompts[:1],
+        model_name,
+        False,
+        hf_model_kwargs,
+        vllm_tp_size=2,
+    )
+
+
+@pytest.mark.skipif(
+    not is_quant_method_supported("bitsandbytes"),
+    reason="bitsandbytes is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("model_name, description", models_4bit_to_test)
 @multi_gpu_test(num_gpus=2)
 def test_load_pp_4bit_bnb_model(model_name, description) -> None:
@@ -115,30 +129,37 @@ def test_load_pp_4bit_bnb_model(model_name, description) -> None:
     compare_two_settings(model_name, common_args, pp_args)
 
 
-@pytest.mark.skipif(not is_quant_method_supported("bitsandbytes"),
-                    reason='bitsandbytes is not supported on this GPU type.')
+@pytest.mark.skipif(
+    not is_quant_method_supported("bitsandbytes"),
+    reason="bitsandbytes is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("model_name, description", models_4bit_to_moe_test)
-def test_4bit_bnb_moe_model(hf_runner, vllm_runner, example_prompts,
-                            model_name, description) -> None:
-
-    hf_model_kwargs = dict(quantization_config=BitsAndBytesConfig(
-        load_in_4bit=True,
-        bnb_4bit_quant_type="nf4",
-        bnb_4bit_use_double_quant=True,
-    ))
-    with vllm_runner(model_name,
-                     quantization='bitsandbytes',
-                     enforce_eager=False,
-                     default_torch_num_threads=1) as llm:
-        vllm_outputs = llm.generate_greedy_logprobs(example_prompts,
-                                                    max_tokens=32,
-                                                    num_logprobs=5)
-
-    with hf_runner(model_name,
-                   model_kwargs=hf_model_kwargs,
-                   default_torch_num_threads=1) as llm:
+def test_4bit_bnb_moe_model(
+    hf_runner, vllm_runner, example_prompts, model_name, description
+) -> None:
+    hf_model_kwargs = dict(
+        quantization_config=BitsAndBytesConfig(
+            load_in_4bit=True,
+            bnb_4bit_quant_type="nf4",
+            bnb_4bit_use_double_quant=True,
+        )
+    )
+    with vllm_runner(
+        model_name,
+        quantization="bitsandbytes",
+        enforce_eager=False,
+        default_torch_num_threads=1,
+    ) as llm:
+        vllm_outputs = llm.generate_greedy_logprobs(
+            example_prompts, max_tokens=32, num_logprobs=5
+        )
+
+    with hf_runner(
+        model_name, model_kwargs=hf_model_kwargs, default_torch_num_threads=1
+    ) as llm:
         transformers_outputs = llm.generate_greedy_logprobs_limit(
-            example_prompts, max_tokens=32, num_logprobs=5)
+            example_prompts, max_tokens=32, num_logprobs=5
+        )
     check_logprobs_close(
         outputs_0_lst=transformers_outputs,
         outputs_1_lst=vllm_outputs,
@@ -147,10 +168,11 @@ def test_4bit_bnb_moe_model(hf_runner, vllm_runner, example_prompts,
     )
 
 
-@pytest.mark.skipif(not is_quant_method_supported("bitsandbytes"),
-                    reason='bitsandbytes is not supported on this GPU type.')
-@pytest.mark.parametrize("model_name, description",
-                         models_4bit_to_embedding_test)
+@pytest.mark.skipif(
+    not is_quant_method_supported("bitsandbytes"),
+    reason="bitsandbytes is not supported on this GPU type.",
+)
+@pytest.mark.parametrize("model_name, description", models_4bit_to_embedding_test)
 @pytest.mark.parametrize("dtype", ["half"])
 def test_4bit_bnb_embedding_model(
     model_name,
@@ -160,7 +182,6 @@ def test_4bit_bnb_embedding_model(
     example_prompts,
     dtype: str,
 ) -> None:
-
     # The example_prompts has ending "\n", for example:
     # "Write a short story about a robot that dreams for the first time.\n"
     # sentence_transformers will strip the input texts, see:
@@ -170,22 +191,23 @@ def test_4bit_bnb_embedding_model(
     example_prompts = [str(s).strip() for s in example_prompts]
 
     # Inflight 4bit quantization
-    with vllm_runner(model_name,
-                     runner="pooling",
-                     dtype=dtype,
-                     gpu_memory_utilization=0.5,
-                     quantization="bitsandbytes",
-                     default_torch_num_threads=1) as vllm_model:
+    with vllm_runner(
+        model_name,
+        runner="pooling",
+        dtype=dtype,
+        gpu_memory_utilization=0.5,
+        quantization="bitsandbytes",
+        default_torch_num_threads=1,
+    ) as vllm_model:
         vllm_outputs = vllm_model.embed(example_prompts)
 
-    hf_model_kwargs = dict(quantization_config=BitsAndBytesConfig(
-        load_in_4bit=True))
+    hf_model_kwargs = dict(quantization_config=BitsAndBytesConfig(load_in_4bit=True))
     with hf_runner(
-            model_name,
-            dtype=dtype,
-            model_kwargs=hf_model_kwargs,
-            is_sentence_transformer=True,
-            default_torch_num_threads=1,
+        model_name,
+        dtype=dtype,
+        model_kwargs=hf_model_kwargs,
+        is_sentence_transformer=True,
+        default_torch_num_threads=1,
     ) as hf_model:
         hf_outputs = hf_model.encode(example_prompts)
 
@@ -210,23 +232,25 @@ def log_generated_texts(prompts, outputs, runner_name):
     return logged_texts
 
 
-def validate_generated_texts(hf_runner,
-                             vllm_runner,
-                             prompts,
-                             model_name,
-                             pre_quant=False,
-                             hf_model_kwargs=None,
-                             vllm_tp_size=1,
-                             max_tokens=8):
-
+def validate_generated_texts(
+    hf_runner,
+    vllm_runner,
+    prompts,
+    model_name,
+    pre_quant=False,
+    hf_model_kwargs=None,
+    vllm_tp_size=1,
+    max_tokens=8,
+):
     # NOTE: run vLLM first, as it requires a clean process
     # when using distributed inference
-    with vllm_runner(model_name,
-                     quantization=None if pre_quant else 'bitsandbytes',
-                     tensor_parallel_size=vllm_tp_size,
-                     enforce_eager=False,
-                     default_torch_num_threads=1) as llm:
-
+    with vllm_runner(
+        model_name,
+        quantization=None if pre_quant else "bitsandbytes",
+        tensor_parallel_size=vllm_tp_size,
+        enforce_eager=False,
+        default_torch_num_threads=1,
+    ) as llm:
         vllm_outputs = llm.generate_greedy(prompts, max_tokens)
         vllm_logs = log_generated_texts(prompts, vllm_outputs, "VllmRunner")
 
@@ -234,9 +258,9 @@ def validate_generated_texts(hf_runner,
         hf_model_kwargs = {}
 
     # Run with HF runner
-    with hf_runner(model_name,
-                   model_kwargs=hf_model_kwargs,
-                   default_torch_num_threads=1) as llm:
+    with hf_runner(
+        model_name, model_kwargs=hf_model_kwargs, default_torch_num_threads=1
+    ) as llm:
         hf_outputs = llm.generate_greedy(prompts, max_tokens)
         hf_logs = log_generated_texts(prompts, hf_outputs, "HfRunner")
 
@@ -245,8 +269,10 @@ def validate_generated_texts(hf_runner,
         hf_str = hf_log["generated_text"]
         vllm_str = vllm_log["generated_text"]
         prompt = hf_log["prompt"]
-        assert hf_str == vllm_str, (f"Model: {model_name}"
-                                    f"Mismatch between HF and vLLM outputs:\n"
-                                    f"Prompt: {prompt}\n"
-                                    f"HF Output: '{hf_str}'\n"
-                                    f"vLLM Output: '{vllm_str}'")
+        assert hf_str == vllm_str, (
+            f"Model: {model_name}"
+            f"Mismatch between HF and vLLM outputs:\n"
+            f"Prompt: {prompt}\n"
+            f"HF Output: '{hf_str}'\n"
+            f"vLLM Output: '{vllm_str}'"
+        )
diff --git a/tests/models/quantization/test_fp8.py b/tests/models/quantization/test_fp8.py
index bb8ae741b614..55b149ae5da7 100644
--- a/tests/models/quantization/test_fp8.py
+++ b/tests/models/quantization/test_fp8.py
@@ -5,6 +5,7 @@
 """Tests fp8 models against ground truth generation
 Note: these tests will only pass on L4 GPU.
 """
+
 import pytest
 
 from tests.quantization.utils import is_quant_method_supported
@@ -14,21 +15,33 @@
 from ..utils import check_logprobs_close
 
 
-@pytest.mark.skipif(not is_quant_method_supported("fp8"),
-                    reason="fp8 is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("fp8"),
+    reason="fp8 is not supported on this GPU type.",
+)
 @pytest.mark.parametrize(
     "kv_cache_dtype,base_model,test_model",
     [
         # Test FP8 checkpoint w. fp8_e4m3 kv-cache scaling factors.
-        ("fp8_e4m3", "meta-llama/Llama-3.2-1B-Instruct",
-         "nm-testing/Llama-3.2-1B-Instruct-FP8-KV"),
+        (
+            "fp8_e4m3",
+            "meta-llama/Llama-3.2-1B-Instruct",
+            "nm-testing/Llama-3.2-1B-Instruct-FP8-KV",
+        ),
         # Test BF16 checkpoint w. fp8_e5m2 kv-cache.
-        ("fp8_e5m2", "meta-llama/Llama-3.2-1B-Instruct",
-         "meta-llama/Llama-3.2-1B-Instruct"),
+        (
+            "fp8_e5m2",
+            "meta-llama/Llama-3.2-1B-Instruct",
+            "meta-llama/Llama-3.2-1B-Instruct",
+        ),
         # Test BF16 checkpoint w. fp8_e4m3 kv-cache scaling factors in json.
-        ("fp8_e4m3", "meta-llama/Llama-3.2-1B-Instruct",
-         "meta-llama/Llama-3.2-1B-Instruct")
-    ])
+        (
+            "fp8_e4m3",
+            "meta-llama/Llama-3.2-1B-Instruct",
+            "meta-llama/Llama-3.2-1B-Instruct",
+        ),
+    ],
+)
 # Due to low-precision numerical divergence, we only test logprob of 4 tokens
 @pytest.mark.parametrize("max_tokens", [4])
 @pytest.mark.parametrize("enforce_eager", [True])
@@ -54,38 +67,39 @@ def test_models(
     """
 
     if kv_cache_dtype == "fp8_e5m2" and current_platform.is_rocm():
-        pytest.skip(
-            f"{kv_cache_dtype} is currently not supported on ROCm/HIP.")
+        pytest.skip(f"{kv_cache_dtype} is currently not supported on ROCm/HIP.")
 
     if not current_platform.is_kv_cache_dtype_supported(kv_cache_dtype, None):
         pytest.skip(f"{kv_cache_dtype} is not supported on this platform.")
 
     with monkeypatch.context() as m:
-        m.setenv("TOKENIZERS_PARALLELISM", 'true')
+        m.setenv("TOKENIZERS_PARALLELISM", "true")
         m.setenv(STR_BACKEND_ENV_VAR, backend)
 
         MAX_MODEL_LEN = 1024
         NUM_LOG_PROBS = 8
 
         with vllm_runner(
-                base_model,
-                max_model_len=MAX_MODEL_LEN,
-                tensor_parallel_size=tensor_parallel_size,
-                enforce_eager=enforce_eager,
-                kv_cache_dtype="auto",
+            base_model,
+            max_model_len=MAX_MODEL_LEN,
+            tensor_parallel_size=tensor_parallel_size,
+            enforce_eager=enforce_eager,
+            kv_cache_dtype="auto",
         ) as vllm_model:
             baseline_outputs = vllm_model.generate_greedy_logprobs(
-                example_prompts, max_tokens, NUM_LOG_PROBS)
+                example_prompts, max_tokens, NUM_LOG_PROBS
+            )
 
         with vllm_runner(
-                test_model,
-                max_model_len=MAX_MODEL_LEN,
-                tensor_parallel_size=tensor_parallel_size,
-                enforce_eager=enforce_eager,
-                kv_cache_dtype=kv_cache_dtype,
+            test_model,
+            max_model_len=MAX_MODEL_LEN,
+            tensor_parallel_size=tensor_parallel_size,
+            enforce_eager=enforce_eager,
+            kv_cache_dtype=kv_cache_dtype,
         ) as vllm_model:
             test_outputs = vllm_model.generate_greedy_logprobs(
-                example_prompts, max_tokens, NUM_LOG_PROBS)
+                example_prompts, max_tokens, NUM_LOG_PROBS
+            )
 
         check_logprobs_close(
             outputs_0_lst=baseline_outputs,
@@ -96,15 +110,18 @@ def test_models(
 
 
 @pytest.mark.cpu_model
-@pytest.mark.skipif(not current_platform.is_cpu(),
-                    reason="test for the CPU backend.")
+@pytest.mark.skipif(not current_platform.is_cpu(), reason="test for the CPU backend.")
 @pytest.mark.parametrize(
     "kv_cache_dtype,base_model,test_model",
     [
         # Test BF16 checkpoint w. fp8_e5m2 kv-cache.
-        ("fp8_e5m2", "meta-llama/Llama-3.2-1B-Instruct",
-         "meta-llama/Llama-3.2-1B-Instruct"),
-    ])
+        (
+            "fp8_e5m2",
+            "meta-llama/Llama-3.2-1B-Instruct",
+            "meta-llama/Llama-3.2-1B-Instruct",
+        ),
+    ],
+)
 # Due to low-precision numerical divergence, we only test logprob of 4 tokens
 @pytest.mark.parametrize("max_tokens", [4])
 def test_cpu_models(
@@ -121,28 +138,30 @@ def test_cpu_models(
     numerical sensitive kernels.
     """
     with monkeypatch.context() as m:
-        m.setenv("TOKENIZERS_PARALLELISM", 'true')
+        m.setenv("TOKENIZERS_PARALLELISM", "true")
 
         MAX_MODEL_LEN = 1024
         NUM_LOG_PROBS = 8
 
         with vllm_runner(
-                base_model,
-                max_model_len=MAX_MODEL_LEN,
-                dtype="bfloat16",
-                kv_cache_dtype="auto",
+            base_model,
+            max_model_len=MAX_MODEL_LEN,
+            dtype="bfloat16",
+            kv_cache_dtype="auto",
         ) as vllm_model:
             baseline_outputs = vllm_model.generate_greedy_logprobs(
-                example_prompts, max_tokens, NUM_LOG_PROBS)
+                example_prompts, max_tokens, NUM_LOG_PROBS
+            )
 
         with vllm_runner(
-                test_model,
-                max_model_len=MAX_MODEL_LEN,
-                dtype="bfloat16",
-                kv_cache_dtype=kv_cache_dtype,
+            test_model,
+            max_model_len=MAX_MODEL_LEN,
+            dtype="bfloat16",
+            kv_cache_dtype=kv_cache_dtype,
         ) as vllm_model:
             test_outputs = vllm_model.generate_greedy_logprobs(
-                example_prompts, max_tokens, NUM_LOG_PROBS)
+                example_prompts, max_tokens, NUM_LOG_PROBS
+            )
 
         check_logprobs_close(
             outputs_0_lst=baseline_outputs,
diff --git a/tests/models/quantization/test_gguf.py b/tests/models/quantization/test_gguf.py
index 3e77d3e71039..5e2438857aee 100644
--- a/tests/models/quantization/test_gguf.py
+++ b/tests/models/quantization/test_gguf.py
@@ -100,35 +100,37 @@ def check_model_outputs(
 ):
     tokenizer = AutoTokenizer.from_pretrained(model.original_model)
     if tokenizer.chat_template is not None:
-        messages = [[{
-            'role': 'user',
-            'content': prompt
-        }] for prompt in prompts]
-        prompts = tokenizer.apply_chat_template(messages,
-                                                tokenize=False,
-                                                add_generation_prompt=True)
+        messages = [[{"role": "user", "content": prompt}] for prompt in prompts]
+        prompts = tokenizer.apply_chat_template(
+            messages, tokenize=False, add_generation_prompt=True
+        )
 
     # Run gguf model.
-    with vllm_runner(model_name=model.gguf_model,
-                     enforce_eager=True,
-                     tokenizer_name=model.original_model,
-                     dtype=dtype,
-                     max_model_len=MAX_MODEL_LEN,
-                     tensor_parallel_size=tp_size) as gguf_model:
+    with vllm_runner(
+        model_name=model.gguf_model,
+        enforce_eager=True,
+        tokenizer_name=model.original_model,
+        dtype=dtype,
+        max_model_len=MAX_MODEL_LEN,
+        tensor_parallel_size=tp_size,
+    ) as gguf_model:
         gguf_outputs = gguf_model.generate_greedy_logprobs(
-            prompts[:-1], max_tokens, num_logprobs)
+            prompts[:-1], max_tokens, num_logprobs
+        )
 
     # Run unquantized model.
     # Should run with tp=1, otherwise the test will stuck at
     # nccl initialization.
     with vllm_runner(
-            model_name=model.original_model,
-            enforce_eager=True,  # faster tests
-            dtype=dtype,
-            max_model_len=MAX_MODEL_LEN,
-            tensor_parallel_size=1) as original_model:
+        model_name=model.original_model,
+        enforce_eager=True,  # faster tests
+        dtype=dtype,
+        max_model_len=MAX_MODEL_LEN,
+        tensor_parallel_size=1,
+    ) as original_model:
         original_outputs = original_model.generate_greedy_logprobs(
-            prompts[:-1], max_tokens, num_logprobs)
+            prompts[:-1], max_tokens, num_logprobs
+        )
 
     check_logprobs_close(
         outputs_0_lst=original_outputs,
@@ -138,12 +140,14 @@ def check_model_outputs(
     )
 
 
-@pytest.mark.skipif(not is_quant_method_supported("gguf"),
-                    reason="gguf is not supported on this GPU type.")
-@pytest.mark.parametrize("model", [
-    pytest.param(test_config, marks=test_config.marks)
-    for test_config in MODELS
-])
+@pytest.mark.skipif(
+    not is_quant_method_supported("gguf"),
+    reason="gguf is not supported on this GPU type.",
+)
+@pytest.mark.parametrize(
+    "model",
+    [pytest.param(test_config, marks=test_config.marks) for test_config in MODELS],
+)
 @pytest.mark.parametrize("dtype", ["half"])
 @pytest.mark.parametrize("max_tokens", [32])
 @pytest.mark.parametrize("num_logprobs", [5])
@@ -157,12 +161,15 @@ def test_models(
     num_logprobs: int,
     tp_size: int,
 ) -> None:
-    check_model_outputs(vllm_runner, example_prompts, model, dtype, max_tokens,
-                        num_logprobs, tp_size)
+    check_model_outputs(
+        vllm_runner, example_prompts, model, dtype, max_tokens, num_logprobs, tp_size
+    )
 
 
-@pytest.mark.skipif(not is_quant_method_supported("gguf"),
-                    reason="gguf is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("gguf"),
+    reason="gguf is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("model", [LLAMA_CONFIG])
 @pytest.mark.parametrize("dtype", ["half"])
 @pytest.mark.parametrize("max_tokens", [8])
@@ -178,5 +185,6 @@ def test_distributed(
     num_logprobs: int,
     tp_size: int,
 ) -> None:
-    check_model_outputs(vllm_runner, example_prompts, model, dtype, max_tokens,
-                        num_logprobs, tp_size)
+    check_model_outputs(
+        vllm_runner, example_prompts, model, dtype, max_tokens, num_logprobs, tp_size
+    )
diff --git a/tests/models/quantization/test_gptq_bitblas.py b/tests/models/quantization/test_gptq_bitblas.py
index c3aed77525de..b29c5e769ce8 100644
--- a/tests/models/quantization/test_gptq_bitblas.py
+++ b/tests/models/quantization/test_gptq_bitblas.py
@@ -7,9 +7,10 @@
 bitblas/GPTQ models are in the top 3 selections of each other.
 
 Note: bitblas internally uses locks to synchronize the threads. This can
-result in very slight nondeterminism for bitblas. As a result, we re-run the 
+result in very slight nondeterminism for bitblas. As a result, we re-run the
 test up to 3 times to see if we pass.
 """
+
 from dataclasses import dataclass
 
 import pytest
@@ -41,16 +42,19 @@ def test_models(
     max_tokens: int,
     num_logprobs: int,
 ) -> None:
-    with vllm_runner(model_pair.model_gptq,
-                     dtype=dtype,
-                     quantization="bitblas") as bitblas_model:
+    with vllm_runner(
+        model_pair.model_gptq, dtype=dtype, quantization="bitblas"
+    ) as bitblas_model:
         bitblas_outputs = bitblas_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
-    with vllm_runner(model_pair.model_gptq, dtype=dtype,
-                     quantization="gptq") as gptq_model:
+    with vllm_runner(
+        model_pair.model_gptq, dtype=dtype, quantization="gptq"
+    ) as gptq_model:
         gptq_outputs = gptq_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     check_logprobs_close(
         outputs_0_lst=gptq_outputs,
diff --git a/tests/models/quantization/test_gptq_marlin.py b/tests/models/quantization/test_gptq_marlin.py
index db70a3bd2c04..cf52ae39214d 100644
--- a/tests/models/quantization/test_gptq_marlin.py
+++ b/tests/models/quantization/test_gptq_marlin.py
@@ -9,6 +9,7 @@
 result in very slight nondeterminism for Marlin. As a result, we re-run the test
 up to 3 times to see if we pass.
 """
+
 import os
 
 import pytest
@@ -26,20 +27,20 @@
 MODELS = [
     # act_order==True, group_size=128
     ("TheBloke/TinyLlama-1.1B-Chat-v1.0-GPTQ", "main"),
-
     # 8-bit, act_order==True, group_size=channelwise
     ("TheBloke/TinyLlama-1.1B-Chat-v1.0-GPTQ", "gptq-8bit--1g-actorder_True"),
-
     # 4-bit, act_order==True, group_size=128
-    ("TechxGenus/gemma-1.1-2b-it-GPTQ", "main")
+    ("TechxGenus/gemma-1.1-2b-it-GPTQ", "main"),
 ]
 
 
 @pytest.mark.flaky(reruns=3)
-@pytest.mark.skipif(not is_quant_method_supported("gptq_marlin")
-                    or current_platform.is_rocm()
-                    or not current_platform.is_cuda(),
-                    reason="gptq_marlin is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("gptq_marlin")
+    or current_platform.is_rocm()
+    or not current_platform.is_cuda(),
+    reason="gptq_marlin is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("model", MODELS)
 @pytest.mark.parametrize("dtype", ["half", "bfloat16"])
 @pytest.mark.parametrize("max_tokens", [32])
@@ -55,29 +56,34 @@ def test_models(
     model_name, revision = model
 
     # Run marlin.
-    with vllm_runner(model_name=model_name,
-                     revision=revision,
-                     dtype=dtype,
-                     quantization="marlin",
-                     max_model_len=MAX_MODEL_LEN,
-                     tensor_parallel_size=1) as gptq_marlin_model:
-
+    with vllm_runner(
+        model_name=model_name,
+        revision=revision,
+        dtype=dtype,
+        quantization="marlin",
+        max_model_len=MAX_MODEL_LEN,
+        tensor_parallel_size=1,
+    ) as gptq_marlin_model:
         gptq_marlin_outputs = gptq_marlin_model.generate_greedy_logprobs(
-            example_prompts[:-1], max_tokens, num_logprobs)
+            example_prompts[:-1], max_tokens, num_logprobs
+        )
     _ROPE_DICT.clear()  # clear rope cache to avoid rope dtype error
 
     # Run gptq.
     # The naive gptq kernel doesn't support bf16 yet.
     # Here we always compare fp16/bf16 gpt marlin kernel
     # to fp16 gptq kernel.
-    with vllm_runner(model_name=model_name,
-                     revision=revision,
-                     dtype="half",
-                     quantization="gptq",
-                     max_model_len=MAX_MODEL_LEN,
-                     tensor_parallel_size=1) as gptq_model:
+    with vllm_runner(
+        model_name=model_name,
+        revision=revision,
+        dtype="half",
+        quantization="gptq",
+        max_model_len=MAX_MODEL_LEN,
+        tensor_parallel_size=1,
+    ) as gptq_model:
         gptq_outputs = gptq_model.generate_greedy_logprobs(
-            example_prompts[:-1], max_tokens, num_logprobs)
+            example_prompts[:-1], max_tokens, num_logprobs
+        )
 
     check_logprobs_close(
         outputs_0_lst=gptq_outputs,
diff --git a/tests/models/quantization/test_gptq_marlin_24.py b/tests/models/quantization/test_gptq_marlin_24.py
index 9b86ae95ba5c..85426ee5b089 100644
--- a/tests/models/quantization/test_gptq_marlin_24.py
+++ b/tests/models/quantization/test_gptq_marlin_24.py
@@ -6,6 +6,7 @@
 As a result, in this test, we just confirm that the top selected tokens of the
 Marlin/GPTQ models are in the top 3 selections of each other.
 """
+
 from dataclasses import dataclass
 
 import pytest
@@ -24,15 +25,18 @@ class ModelPair:
 
 model_pairs = [
     # 4-bit, group_size == 128
-    ModelPair(model_marlin="alexm-nm/tinyllama-24-marlin24-4bit-g128",
-              model_gptq="alexm-nm/tinyllama-24-gptq-4bit-g128"),
+    ModelPair(
+        model_marlin="alexm-nm/tinyllama-24-marlin24-4bit-g128",
+        model_gptq="alexm-nm/tinyllama-24-gptq-4bit-g128",
+    ),
     # # 4-bit, group_size == channelwise
     # ModelPair(model_marlin="alexm-nm/tinyllama-24-marlin24-4bit-channelwise",
     #           model_gptq="alexm-nm/tinyllama-24-gptq-4bit-channelwise"),
-
     # 8-bit, group_size == 128
-    ModelPair(model_marlin="alexm-nm/tinyllama-24-marlin24-8bit-g128",
-              model_gptq="alexm-nm/tinyllama-24-gptq-8bit-g128"),
+    ModelPair(
+        model_marlin="alexm-nm/tinyllama-24-marlin24-8bit-g128",
+        model_gptq="alexm-nm/tinyllama-24-gptq-8bit-g128",
+    ),
     # # 8-bit, group_size == channelwise
     # ModelPair(model_marlin="alexm-nm/tinyllama-24-marlin24-8bit-channelwise",
     #           model_gptq="alexm-nm/tinyllama-24-gptq-8bit-channelwise"),
@@ -40,10 +44,12 @@ class ModelPair:
 
 
 @pytest.mark.flaky(reruns=2)
-@pytest.mark.skipif(not is_quant_method_supported("gptq_marlin_24")
-                    or current_platform.is_rocm()
-                    or not current_platform.is_cuda(),
-                    reason="Marlin24 is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("gptq_marlin_24")
+    or current_platform.is_rocm()
+    or not current_platform.is_cuda(),
+    reason="Marlin24 is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("model_pair", model_pairs)
 @pytest.mark.parametrize("dtype", ["half"])
 @pytest.mark.parametrize("max_tokens", [8])
@@ -56,16 +62,19 @@ def test_models(
     max_tokens: int,
     num_logprobs: int,
 ) -> None:
-    with vllm_runner(model_pair.model_marlin,
-                     dtype=dtype,
-                     quantization="gptq_marlin_24") as marlin_24_model:
+    with vllm_runner(
+        model_pair.model_marlin, dtype=dtype, quantization="gptq_marlin_24"
+    ) as marlin_24_model:
         marlin_24_outputs = marlin_24_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
-    with vllm_runner(model_pair.model_gptq, dtype=dtype,
-                     quantization="gptq") as gptq_model:
+    with vllm_runner(
+        model_pair.model_gptq, dtype=dtype, quantization="gptq"
+    ) as gptq_model:
         gptq_outputs = gptq_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     check_logprobs_close(
         outputs_0_lst=gptq_outputs,
diff --git a/tests/models/quantization/test_modelopt.py b/tests/models/quantization/test_modelopt.py
index e23d4d9d211d..db3af972bb77 100644
--- a/tests/models/quantization/test_modelopt.py
+++ b/tests/models/quantization/test_modelopt.py
@@ -5,6 +5,7 @@
 """Tests Model Optimizer fp8 models against ground truth generation
 Note: these tests will only pass on H100
 """
+
 import os
 
 import pytest
@@ -22,13 +23,13 @@
 EXPECTED_STRS_MAP = {
     "nvidia/Llama-3.1-8B-Instruct-FP8": [
         "You're referring to VLLM, a high-performance Large Language Model (LLM) inference and",
-        'Here are the major milestones in the development of artificial intelligence (AI) from 1950 to ',
-        'The comparison between artificial intelligence (AI) and human intelligence in terms of processing information is a complex and',
+        "Here are the major milestones in the development of artificial intelligence (AI) from 1950 to ",
+        "The comparison between artificial intelligence (AI) and human intelligence in terms of processing information is a complex and",
         'A neural network is a complex system modeled after the human brain, consisting of interconnected nodes or "ne',
-        '**The Spark of Imagination**\n\nZeta-5, a sleek and efficient robot, whir',
-        'The COVID-19 pandemic has had a profound impact on global economic structures and business models, leading to',
-        'The Mona Lisa, painted by Leonardo da Vinci in the early 16th century, is one of',
-        'Here are the translations:\n\n**Japanese:** 「早起きは早く獲物をとる'
+        "**The Spark of Imagination**\n\nZeta-5, a sleek and efficient robot, whir",
+        "The COVID-19 pandemic has had a profound impact on global economic structures and business models, leading to",
+        "The Mona Lisa, painted by Leonardo da Vinci in the early 16th century, is one of",
+        "Here are the translations:\n\n**Japanese:** 「早起きは早く獲物をとる",
     ]
 }
 
@@ -39,10 +40,12 @@
 # the hardware being run on.
 # Disabled to prevent it from breaking the build
 @pytest.mark.skip(
-    reason=
-    "Prevent unstable test based on golden strings from breaking the build.")
-@pytest.mark.skipif(not is_quant_method_supported("fp8"),
-                    reason="fp8 is not supported on this GPU type.")
+    reason="Prevent unstable test based on golden strings from breaking the build."
+)
+@pytest.mark.skipif(
+    not is_quant_method_supported("fp8"),
+    reason="fp8 is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("model_name", MODELS)
 def test_models(example_prompts, model_name) -> None:
     llm = LLM(
@@ -55,12 +58,11 @@ def test_models(example_prompts, model_name) -> None:
 
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     formatted_prompts = [
-        tokenizer.apply_chat_template([{
-            "role": "user",
-            "content": prompt
-        }],
-                                      tokenize=False,
-                                      add_generation_prompt=True)
+        tokenizer.apply_chat_template(
+            [{"role": "user", "content": prompt}],
+            tokenize=False,
+            add_generation_prompt=True,
+        )
         for prompt in example_prompts
     ]
     params = SamplingParams(max_tokens=20, temperature=0)
@@ -78,4 +80,5 @@ def test_models(example_prompts, model_name) -> None:
         generated_str = generations[i]
         expected_str = expected_strs[i]
         assert expected_str == generated_str, (
-            f"Test{i}:\nExpected: {expected_str!r}\nvLLM: {generated_str!r}")
+            f"Test{i}:\nExpected: {expected_str!r}\nvLLM: {generated_str!r}"
+        )
diff --git a/tests/models/quantization/test_mxfp4.py b/tests/models/quantization/test_mxfp4.py
index 7b8a334bbc36..d598e405be81 100644
--- a/tests/models/quantization/test_mxfp4.py
+++ b/tests/models/quantization/test_mxfp4.py
@@ -1,8 +1,8 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 # flake8: noqa
-"""Tests Quark mxfp4 models against ground truth generation
-"""
+"""Tests Quark mxfp4 models against ground truth generation"""
+
 import pytest
 
 from vllm import LLM, SamplingParams
@@ -11,13 +11,13 @@
 
 EXPECTED_STRS_MAP = {
     "amd/Llama-2-7b-chat-hf-wmxfp4-amxfp4-kvfp8-scale-uint8": [
-        '\n### Key Features\n\n* **High-throughput Inference**: vLL',
-        '\nArtificial intelligence (AI) has evolved significantly since its inception in the 1',
-        'Artificial intelligence (AI) and human intelligence (HI) are two distinct concepts that have been',
-        'A neural network is a machine learning model inspired by the structure of the human brain. It consists of',
-        '\nTitle: The Dreaming Robot\n\nAs the sun set on the bustling metropol',
-        '\nThe COVID-19 pandemic has had a profound impact on global economic structures and business',
-        'The Mona Lisa painting, created by Leonardo da Vinci in the early 16th',
+        "\n### Key Features\n\n* **High-throughput Inference**: vLL",
+        "\nArtificial intelligence (AI) has evolved significantly since its inception in the 1",
+        "Artificial intelligence (AI) and human intelligence (HI) are two distinct concepts that have been",
+        "A neural network is a machine learning model inspired by the structure of the human brain. It consists of",
+        "\nTitle: The Dreaming Robot\n\nAs the sun set on the bustling metropol",
+        "\nThe COVID-19 pandemic has had a profound impact on global economic structures and business",
+        "The Mona Lisa painting, created by Leonardo da Vinci in the early 16th",
         " everybody knows this proverbial saying, but did you know that it's not entirely accurate?",
     ]
 }
@@ -38,4 +38,5 @@ def test_models(example_prompts, model_name) -> None:
         output_str = output.outputs[0].text
         expected_str = EXPECTED_STRS_MAP[model_name][i]
         assert expected_str == output_str, (
-            f"Expected: {expected_str!r}\nvLLM: {output_str!r}")
+            f"Expected: {expected_str!r}\nvLLM: {output_str!r}"
+        )
diff --git a/tests/models/quantization/test_nvfp4.py b/tests/models/quantization/test_nvfp4.py
index b3c217e729e4..9f45f142d68b 100644
--- a/tests/models/quantization/test_nvfp4.py
+++ b/tests/models/quantization/test_nvfp4.py
@@ -4,6 +4,7 @@
 """Tests Model Optimizer nvfp4 models against ground truth generation
 Note: these tests will only pass on B200
 """
+
 import os
 from typing import List
 
@@ -21,14 +22,14 @@
 
 EXPECTED_STRS_MAP = {
     "nvidia/Llama-3.3-70B-Instruct-FP4": [
-        'vLLM (Vectorized Large Language Model) is indeed a high-throughput and memory-efficient inference',
-        'Here are the major milestones in the development of artificial intelligence (AI) from 1950 to ',
-        'Artificial intelligence (AI) and human intelligence (HI) are two distinct forms of intelligence that process',
-        'A neural network is a type of machine learning model inspired by the structure and function of the human brain',
-        'In the heart of a cutting-edge robotics lab, a team of engineers had been working tirelessly to push',
-        'The COVID-19 pandemic has had a profound impact on global economic structures and future business models, leading',
-        'The Mona Lisa, painted by Leonardo da Vinci in the early 16th century, is one of',
-        'Here are the translations:\n\n* Japanese: (Sasuga no tori ga miwa o ts'
+        "vLLM (Vectorized Large Language Model) is indeed a high-throughput and memory-efficient inference",
+        "Here are the major milestones in the development of artificial intelligence (AI) from 1950 to ",
+        "Artificial intelligence (AI) and human intelligence (HI) are two distinct forms of intelligence that process",
+        "A neural network is a type of machine learning model inspired by the structure and function of the human brain",
+        "In the heart of a cutting-edge robotics lab, a team of engineers had been working tirelessly to push",
+        "The COVID-19 pandemic has had a profound impact on global economic structures and future business models, leading",
+        "The Mona Lisa, painted by Leonardo da Vinci in the early 16th century, is one of",
+        "Here are the translations:\n\n* Japanese: (Sasuga no tori ga miwa o ts",
     ]
 }
 
@@ -39,11 +40,13 @@
 # the hardware being run on.
 # Disabled to prevent it from breaking the build
 @pytest.mark.skip(
-    reason=
-    "Prevent unstable test based on golden strings from breaking the build "
-    " and test input model being too large and hanging the system.")
-@pytest.mark.skipif(not is_quant_method_supported("modelopt_fp4"),
-                    reason="modelopt_fp4 is not supported on this GPU type.")
+    reason="Prevent unstable test based on golden strings from breaking the build "
+    " and test input model being too large and hanging the system."
+)
+@pytest.mark.skipif(
+    not is_quant_method_supported("modelopt_fp4"),
+    reason="modelopt_fp4 is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("model_name", MODELS)
 def test_models(example_prompts, model_name) -> None:
     llm = LLM(
@@ -56,12 +59,11 @@ def test_models(example_prompts, model_name) -> None:
 
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     formatted_prompts = [
-        tokenizer.apply_chat_template([{
-            "role": "user",
-            "content": prompt
-        }],
-                                      tokenize=False,
-                                      add_generation_prompt=True)
+        tokenizer.apply_chat_template(
+            [{"role": "user", "content": prompt}],
+            tokenize=False,
+            add_generation_prompt=True,
+        )
         for prompt in example_prompts
     ]
     params = SamplingParams(max_tokens=20, temperature=0)
@@ -79,4 +81,5 @@ def test_models(example_prompts, model_name) -> None:
         generated_str = generations[i]
         expected_str = expected_strs[i]
         assert expected_str == generated_str, (
-            f"Test{i}:\nExpected: {expected_str!r}\nvLLM: {generated_str!r}")
+            f"Test{i}:\nExpected: {expected_str!r}\nvLLM: {generated_str!r}"
+        )
diff --git a/tests/models/registry.py b/tests/models/registry.py
index 182654cdf3c7..292c5c222d72 100644
--- a/tests/models/registry.py
+++ b/tests/models/registry.py
@@ -114,8 +114,10 @@ def check_transformers_version(
         If the installed transformers version does not meet the requirements,
         perform the given action.
         """
-        if (self.min_transformers_version is None
-                and self.max_transformers_version is None):
+        if (
+            self.min_transformers_version is None
+            and self.max_transformers_version is None
+        ):
             return None
 
         current_version = TRANSFORMERS_VERSION
@@ -125,11 +127,17 @@ def check_transformers_version(
         msg = f"`transformers=={current_version}` installed, but `transformers"
         # Only check the base version for the min/max version, otherwise preview
         # models cannot be run because `x.yy.0.dev0`<`x.yy.0`
-        if (check_min_version and min_version
-                and Version(cur_base_version) < Version(min_version)):
+        if (
+            check_min_version
+            and min_version
+            and Version(cur_base_version) < Version(min_version)
+        ):
             msg += f">={min_version}` is required to run this model."
-        elif (check_max_version and max_version
-              and Version(cur_base_version) > Version(max_version)):
+        elif (
+            check_max_version
+            and max_version
+            and Version(cur_base_version) > Version(max_version)
+        ):
             msg += f"<={max_version}` is required to run this model."
         else:
             return None
diff --git a/tests/models/test_initialization.py b/tests/models/test_initialization.py
index 1db0dc3da922..f501798ffa36 100644
--- a/tests/models/test_initialization.py
+++ b/tests/models/test_initialization.py
@@ -8,13 +8,19 @@
 
 from vllm import LLM
 from vllm.utils import GiB_bytes
-from vllm.v1.core.kv_cache_utils import (generate_scheduler_kv_cache_config,
-                                         get_kv_cache_configs)
+from vllm.v1.core.kv_cache_utils import (
+    generate_scheduler_kv_cache_config,
+    get_kv_cache_configs,
+)
 from vllm.v1.engine.core import EngineCore as V1EngineCore
 
 from ..utils import create_new_process_for_each_test
-from .registry import (_TRANSFORMERS_BACKEND_MODELS, AUTO_EXAMPLE_MODELS,
-                       HF_EXAMPLE_MODELS, HfExampleModels)
+from .registry import (
+    _TRANSFORMERS_BACKEND_MODELS,
+    AUTO_EXAMPLE_MODELS,
+    HF_EXAMPLE_MODELS,
+    HfExampleModels,
+)
 from .utils import dummy_hf_overrides
 
 # This minimal list of model architectures is smaller than the total list of
@@ -24,23 +30,32 @@
 # generation, sequence classification, causal LM, ranking, chat, reward model,
 # multimodal, geospatial, voice, embedding, MTP)
 MINIMAL_MODEL_ARCH_LIST = [
-    "LlavaForConditionalGeneration", "Llama4ForConditionalGeneration",
-    "BertForSequenceClassification", "Gemma3nForCausalLM", "JinaVLForRanking",
-    "InternVLChatModel", "InternLM2ForRewardModel",
-    "TransformersForMultimodalLM", "PrithviGeoSpatialMAE", "UltravoxModel",
-    "DeepSeekMTPModel", "XLMRobertaModel"
+    "LlavaForConditionalGeneration",
+    "Llama4ForConditionalGeneration",
+    "BertForSequenceClassification",
+    "Gemma3nForCausalLM",
+    "JinaVLForRanking",
+    "InternVLChatModel",
+    "InternLM2ForRewardModel",
+    "TransformersForMultimodalLM",
+    "PrithviGeoSpatialMAE",
+    "UltravoxModel",
+    "DeepSeekMTPModel",
+    "XLMRobertaModel",
 ]
 
 # This list is the complement of the minimal list above. The intention is that
 # this list of models is only tested in a "special case" i.e. most PRs should
 # not test these models
-OTHER_MODEL_ARCH_LIST = (set(HF_EXAMPLE_MODELS.get_supported_archs()) -
-                         set(MINIMAL_MODEL_ARCH_LIST))
+OTHER_MODEL_ARCH_LIST = set(HF_EXAMPLE_MODELS.get_supported_archs()) - set(
+    MINIMAL_MODEL_ARCH_LIST
+)
 
 
 @create_new_process_for_each_test()
-def can_initialize(model_arch: str, monkeypatch: pytest.MonkeyPatch,
-                   EXAMPLE_MODELS: HfExampleModels):
+def can_initialize(
+    model_arch: str, monkeypatch: pytest.MonkeyPatch, EXAMPLE_MODELS: HfExampleModels
+):
     """The reason for using create_new_process_for_each_test is to avoid
     the WARNING:
         "We must use the 'spawn' multiprocessing start method. Overriding
@@ -53,12 +68,12 @@ def can_initialize(model_arch: str, monkeypatch: pytest.MonkeyPatch,
     model_info.check_available_online(on_fail="skip")
     model_info.check_transformers_version(on_fail="skip")
 
-    hf_overrides_fn = partial(dummy_hf_overrides,
-                              model_arch=model_arch,
-                              exist_overrides=model_info.hf_overrides,
-                              use_original_num_layers=getattr(
-                                  model_info, 'use_original_num_layers',
-                                  False))
+    hf_overrides_fn = partial(
+        dummy_hf_overrides,
+        model_arch=model_arch,
+        exist_overrides=model_info.hf_overrides,
+        use_original_num_layers=getattr(model_info, "use_original_num_layers", False),
+    )
 
     # Avoid calling model.forward()
     def _initialize_kv_caches_v1(self, vllm_config):
@@ -68,14 +83,15 @@ def _initialize_kv_caches_v1(self, vllm_config):
             kv_cache_specs,
             [10 * GiB_bytes],
         )
-        scheduler_kv_cache_config = generate_scheduler_kv_cache_config(
-            kv_cache_configs)
+        scheduler_kv_cache_config = generate_scheduler_kv_cache_config(kv_cache_configs)
 
         # gpu_blocks (> 0), cpu_blocks, scheduler_kv_cache_config
         return 1, 0, scheduler_kv_cache_config
 
-    with (patch.object(V1EngineCore, "_initialize_kv_caches",
-                       _initialize_kv_caches_v1), monkeypatch.context() as m):
+    with (
+        patch.object(V1EngineCore, "_initialize_kv_caches", _initialize_kv_caches_v1),
+        monkeypatch.context() as m,
+    ):
         if model_info.v0_only:
             # NOTE(woosuk): skip the test for V0-only models
             return
@@ -97,21 +113,24 @@ def _initialize_kv_caches_v1(self, vllm_config):
             speculative_config={
                 "model": model_info.speculative_model,
                 "num_speculative_tokens": 1,
-            } if model_info.speculative_model else None,
+            }
+            if model_info.speculative_model
+            else None,
             trust_remote_code=model_info.trust_remote_code,
             max_model_len=model_info.max_model_len,
             # these tests seem to produce leftover memory
             gpu_memory_utilization=0.80,
             load_format="dummy",
             model_impl="transformers"
-            if model_arch in _TRANSFORMERS_BACKEND_MODELS else "vllm",
+            if model_arch in _TRANSFORMERS_BACKEND_MODELS
+            else "vllm",
             hf_overrides=hf_overrides_fn,
-            max_num_seqs=model_info.max_num_seqs)
+            max_num_seqs=model_info.max_num_seqs,
+        )
 
 
 @pytest.mark.parametrize("model_arch", MINIMAL_MODEL_ARCH_LIST)
-def test_can_initialize_small_subset(model_arch: str,
-                                     monkeypatch: pytest.MonkeyPatch):
+def test_can_initialize_small_subset(model_arch: str, monkeypatch: pytest.MonkeyPatch):
     """Test initializing small subset of supported models"""
     if model_arch == "Lfm2ForCausalLM":
         pytest.skip("Skipping until test supports V1-only models")
@@ -119,10 +138,9 @@ def test_can_initialize_small_subset(model_arch: str,
 
 
 @pytest.mark.parametrize("model_arch", OTHER_MODEL_ARCH_LIST)
-def test_can_initialize_large_subset(model_arch: str,
-                                     monkeypatch: pytest.MonkeyPatch):
+def test_can_initialize_large_subset(model_arch: str, monkeypatch: pytest.MonkeyPatch):
     """Test initializing large subset of supported models
-    
+
     This test covers the complement of the tests covered in the "small subset"
     test.
     """
@@ -131,8 +149,6 @@ def test_can_initialize_large_subset(model_arch: str,
     can_initialize(model_arch, monkeypatch, HF_EXAMPLE_MODELS)
 
 
-@pytest.mark.parametrize("model_arch",
-                         AUTO_EXAMPLE_MODELS.get_supported_archs())
-def test_implicit_converted_models(model_arch: str,
-                                   monkeypatch: pytest.MonkeyPatch):
+@pytest.mark.parametrize("model_arch", AUTO_EXAMPLE_MODELS.get_supported_archs())
+def test_implicit_converted_models(model_arch: str, monkeypatch: pytest.MonkeyPatch):
     can_initialize(model_arch, monkeypatch, AUTO_EXAMPLE_MODELS)
diff --git a/tests/models/test_oot_registration.py b/tests/models/test_oot_registration.py
index 4aa7bb729789..15e94eef4aa0 100644
--- a/tests/models/test_oot_registration.py
+++ b/tests/models/test_oot_registration.py
@@ -50,9 +50,9 @@ def test_oot_registration_embedding(
     with monkeypatch.context() as m:
         m.setenv("VLLM_PLUGINS", "register_dummy_model")
         prompts = ["Hello, my name is", "The text does not matter"]
-        llm = LLM(model=dummy_gemma2_embedding_path,
-                  load_format="dummy",
-                  max_model_len=2048)
+        llm = LLM(
+            model=dummy_gemma2_embedding_path, load_format="dummy", max_model_len=2048
+        )
         outputs = llm.embed(prompts)
 
         for output in outputs:
@@ -69,27 +69,28 @@ def test_oot_registration_multimodal(
 ):
     with monkeypatch.context() as m:
         m.setenv("VLLM_PLUGINS", "register_dummy_model")
-        prompts = [{
-            "prompt": "What's in the image?<image>",
-            "multi_modal_data": {
-                "image": image
+        prompts = [
+            {
+                "prompt": "What's in the image?<image>",
+                "multi_modal_data": {"image": image},
             },
-        }, {
-            "prompt": "Describe the image<image>",
-            "multi_modal_data": {
-                "image": image
+            {
+                "prompt": "Describe the image<image>",
+                "multi_modal_data": {"image": image},
             },
-        }]
+        ]
 
         sampling_params = SamplingParams(temperature=0)
-        llm = LLM(model=dummy_llava_path,
-                  load_format="dummy",
-                  max_num_seqs=1,
-                  trust_remote_code=True,
-                  gpu_memory_utilization=0.98,
-                  max_model_len=4096,
-                  enforce_eager=True,
-                  limit_mm_per_prompt={"image": 1})
+        llm = LLM(
+            model=dummy_llava_path,
+            load_format="dummy",
+            max_num_seqs=1,
+            trust_remote_code=True,
+            gpu_memory_utilization=0.98,
+            max_model_len=4096,
+            enforce_eager=True,
+            limit_mm_per_prompt={"image": 1},
+        )
 
         first_token = llm.get_tokenizer().decode(0)
         outputs = llm.generate(prompts, sampling_params)
diff --git a/tests/models/test_registry.py b/tests/models/test_registry.py
index f67d4017eeee..9017a0fd9140 100644
--- a/tests/models/test_registry.py
+++ b/tests/models/test_registry.py
@@ -6,16 +6,22 @@
 import pytest
 import torch.cuda
 
-from vllm.model_executor.models import (is_pooling_model,
-                                        is_text_generation_model,
-                                        supports_multimodal)
-from vllm.model_executor.models.adapters import (as_embedding_model,
-                                                 as_reward_model,
-                                                 as_seq_cls_model)
-from vllm.model_executor.models.registry import (_MULTIMODAL_MODELS,
-                                                 _SPECULATIVE_DECODING_MODELS,
-                                                 _TEXT_GENERATION_MODELS,
-                                                 ModelRegistry)
+from vllm.model_executor.models import (
+    is_pooling_model,
+    is_text_generation_model,
+    supports_multimodal,
+)
+from vllm.model_executor.models.adapters import (
+    as_embedding_model,
+    as_reward_model,
+    as_seq_cls_model,
+)
+from vllm.model_executor.models.registry import (
+    _MULTIMODAL_MODELS,
+    _SPECULATIVE_DECODING_MODELS,
+    _TEXT_GENERATION_MODELS,
+    ModelRegistry,
+)
 from vllm.platforms import current_platform
 
 from ..utils import create_new_process_for_each_test
@@ -34,8 +40,7 @@ def test_registry_imports(model_arch):
     if model_arch in _SPECULATIVE_DECODING_MODELS:
         return  # Ignore these models which do not have a unified format
 
-    if (model_arch in _TEXT_GENERATION_MODELS
-            or model_arch in _MULTIMODAL_MODELS):
+    if model_arch in _TEXT_GENERATION_MODELS or model_arch in _MULTIMODAL_MODELS:
         assert is_text_generation_model(model_cls)
 
     # All vLLM models should be convertible to a pooling model
@@ -48,13 +53,16 @@ def test_registry_imports(model_arch):
 
 
 @create_new_process_for_each_test()
-@pytest.mark.parametrize("model_arch,is_mm,init_cuda,is_ce", [
-    ("LlamaForCausalLM", False, False, False),
-    ("LlavaForConditionalGeneration", True, True, False),
-    ("BertForSequenceClassification", False, False, True),
-    ("RobertaForSequenceClassification", False, False, True),
-    ("XLMRobertaForSequenceClassification", False, False, True),
-])
+@pytest.mark.parametrize(
+    "model_arch,is_mm,init_cuda,is_ce",
+    [
+        ("LlamaForCausalLM", False, False, False),
+        ("LlavaForConditionalGeneration", True, True, False),
+        ("BertForSequenceClassification", False, False, True),
+        ("RobertaForSequenceClassification", False, False, True),
+        ("XLMRobertaForSequenceClassification", False, False, True),
+    ],
+)
 def test_registry_model_property(model_arch, is_mm, init_cuda, is_ce):
     model_info = ModelRegistry._try_inspect_model_cls(model_arch)
     assert model_info is not None
@@ -70,7 +78,8 @@ def test_registry_model_property(model_arch, is_mm, init_cuda, is_ce):
             warnings.warn(
                 "This model no longer initializes CUDA on import. "
                 "Please test using a different one.",
-                stacklevel=2)
+                stacklevel=2,
+            )
 
 
 @create_new_process_for_each_test()
@@ -82,7 +91,8 @@ def test_registry_model_property(model_arch, is_mm, init_cuda, is_ce):
         # ("MLPSpeculatorPreTrainedModel", False, False),
         ("DeepseekV2ForCausalLM", True, False),
         ("Qwen2VLForConditionalGeneration", True, True),
-    ])
+    ],
+)
 def test_registry_is_pp(model_arch, is_pp, init_cuda):
     model_info = ModelRegistry._try_inspect_model_cls(model_arch)
     assert model_info is not None
@@ -97,13 +107,16 @@ def test_registry_is_pp(model_arch, is_pp, init_cuda):
             warnings.warn(
                 "This model no longer initializes CUDA on import. "
                 "Please test using a different one.",
-                stacklevel=2)
+                stacklevel=2,
+            )
 
 
 def test_hf_registry_coverage():
-    untested_archs = (ModelRegistry.get_supported_archs() -
-                      HF_EXAMPLE_MODELS.get_supported_archs())
+    untested_archs = (
+        ModelRegistry.get_supported_archs() - HF_EXAMPLE_MODELS.get_supported_archs()
+    )
 
     assert not untested_archs, (
         "Please add the following architectures to "
-        f"`tests/models/registry.py`: {untested_archs}")
+        f"`tests/models/registry.py`: {untested_archs}"
+    )
diff --git a/tests/models/test_terratorch.py b/tests/models/test_terratorch.py
index 842e37ea26f6..cadce5d2b2bb 100644
--- a/tests/models/test_terratorch.py
+++ b/tests/models/test_terratorch.py
@@ -11,32 +11,33 @@
     "model",
     [
         "ibm-nasa-geospatial/Prithvi-EO-2.0-300M-TL-Sen1Floods11",
-        "mgazz/Prithvi_v2_eo_300_tl_unet_agb"
+        "mgazz/Prithvi_v2_eo_300_tl_unet_agb",
     ],
 )
 def test_inference(
     vllm_runner: type[VllmRunner],
     model: str,
 ) -> None:
-
     pixel_values = torch.full((6, 512, 512), 1.0, dtype=torch.float16)
     location_coords = torch.full((1, 2), 1.0, dtype=torch.float16)
-    prompt = dict(prompt_token_ids=[1],
-                  multi_modal_data=dict(pixel_values=pixel_values,
-                                        location_coords=location_coords))
+    prompt = dict(
+        prompt_token_ids=[1],
+        multi_modal_data=dict(
+            pixel_values=pixel_values, location_coords=location_coords
+        ),
+    )
     with vllm_runner(
-            model,
-            runner="pooling",
-            dtype="half",
-            enforce_eager=True,
-            skip_tokenizer_init=True,
-            # Limit the maximum number of sequences to avoid the
-            # test going OOM during the warmup run
-            max_num_seqs=32,
-            default_torch_num_threads=1,
+        model,
+        runner="pooling",
+        dtype="half",
+        enforce_eager=True,
+        skip_tokenizer_init=True,
+        # Limit the maximum number of sequences to avoid the
+        # test going OOM during the warmup run
+        max_num_seqs=32,
+        default_torch_num_threads=1,
     ) as vllm_model:
-
         vllm_output = vllm_model.llm.encode(prompt)
         assert torch.equal(
-            torch.isnan(vllm_output[0].outputs.data).any(),
-            torch.tensor(False))
+            torch.isnan(vllm_output[0].outputs.data).any(), torch.tensor(False)
+        )
diff --git a/tests/models/test_transformers.py b/tests/models/test_transformers.py
index bd443575127f..b434c0955be7 100644
--- a/tests/models/test_transformers.py
+++ b/tests/models/test_transformers.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Test the functionality of the Transformers backend."""
+
 from typing import Any, Optional, Union
 
 import pytest
@@ -60,14 +61,16 @@ def check_implementation(
 
 @pytest.mark.skipif(
     current_platform.is_rocm(),
-    reason="Llama-3.2-1B-Instruct, Ilama-3.2-1B produce memory access fault.")
+    reason="Llama-3.2-1B-Instruct, Ilama-3.2-1B produce memory access fault.",
+)
 @pytest.mark.parametrize(
     "model,model_impl",
     [
         ("meta-llama/Llama-3.2-1B-Instruct", "transformers"),
         ("hmellor/Ilama-3.2-1B", "auto"),  # CUSTOM CODE
         ("allenai/OLMoE-1B-7B-0924", "transformers"),  # MoE
-    ])  # trust_remote_code=True by default
+    ],
+)  # trust_remote_code=True by default
 def test_models(
     hf_runner: type[HfRunner],
     vllm_runner: type[VllmRunner],
@@ -77,29 +80,32 @@ def test_models(
 ) -> None:
     import transformers
     from packaging.version import Version
+
     installed = Version(transformers.__version__)
     required = Version("4.57.0.dev0")
     if model == "allenai/OLMoE-1B-7B-0924" and installed < required:
-        pytest.skip("MoE models with the Transformers backend require "
-                    f"transformers>={required}, but got {installed}")
+        pytest.skip(
+            "MoE models with the Transformers backend require "
+            f"transformers>={required}, but got {installed}"
+        )
 
-    check_implementation(hf_runner,
-                         vllm_runner,
-                         example_prompts,
-                         model,
-                         model_impl=model_impl)
+    check_implementation(
+        hf_runner, vllm_runner, example_prompts, model, model_impl=model_impl
+    )
 
 
 def test_hybrid_attention(vllm_runner: type[VllmRunner]) -> None:
     prompts, _, _ = prep_prompts(4, (800, 801))
     kwargs_ref = {"max_model_len": 8192, "enforce_eager": True}
     kwargs_test = {"model_impl": "transformers", **kwargs_ref}
-    check_implementation(vllm_runner,
-                         vllm_runner,
-                         prompts,
-                         model="hmellor/tiny-random-Gemma2ForCausalLM",
-                         kwargs_ref=kwargs_ref,
-                         kwargs_test=kwargs_test)
+    check_implementation(
+        vllm_runner,
+        vllm_runner,
+        prompts,
+        model="hmellor/tiny-random-Gemma2ForCausalLM",
+        kwargs_ref=kwargs_ref,
+        kwargs_test=kwargs_test,
+    )
 
 
 @multi_gpu_test(num_gpus=2)
@@ -109,23 +115,28 @@ def test_distributed(
     example_prompts,
 ):
     kwargs = {"model_impl": "transformers", "tensor_parallel_size": 2}
-    check_implementation(hf_runner,
-                         vllm_runner,
-                         example_prompts,
-                         "meta-llama/Llama-3.2-1B-Instruct",
-                         kwargs_test=kwargs)
+    check_implementation(
+        hf_runner,
+        vllm_runner,
+        example_prompts,
+        "meta-llama/Llama-3.2-1B-Instruct",
+        kwargs_test=kwargs,
+    )
 
 
-@pytest.mark.parametrize("model, quantization_kwargs", [
-    ("TheBloke/TinyLlama-1.1B-Chat-v0.3-AWQ", {}),
-    ("TheBloke/TinyLlama-1.1B-Chat-v0.3-GPTQ", {}),
-    (
-        "meta-llama/Llama-3.2-1B-Instruct",
-        {
-            "quantization": "bitsandbytes",
-        },
-    ),
-])
+@pytest.mark.parametrize(
+    "model, quantization_kwargs",
+    [
+        ("TheBloke/TinyLlama-1.1B-Chat-v0.3-AWQ", {}),
+        ("TheBloke/TinyLlama-1.1B-Chat-v0.3-GPTQ", {}),
+        (
+            "meta-llama/Llama-3.2-1B-Instruct",
+            {
+                "quantization": "bitsandbytes",
+            },
+        ),
+    ],
+)
 @pytest.mark.parametrize("max_tokens", [32])
 @pytest.mark.parametrize("num_logprobs", [5])
 def test_quantization(
@@ -136,27 +147,34 @@ def test_quantization(
     max_tokens: int,
     num_logprobs: int,
 ) -> None:
-    if (current_platform.is_rocm()
-            and quantization_kwargs.get("quantization", "") == "bitsandbytes"):
-        pytest.skip(
-            "bitsandbytes quantization is currently not supported in rocm.")
+    if (
+        current_platform.is_rocm()
+        and quantization_kwargs.get("quantization", "") == "bitsandbytes"
+    ):
+        pytest.skip("bitsandbytes quantization is currently not supported in rocm.")
 
     with vllm_runner(
-            model, model_impl="auto", enforce_eager=True,
-            **quantization_kwargs) as vllm_model:  # type: ignore[arg-type]
+        model,
+        model_impl="auto",
+        enforce_eager=True,
+        **quantization_kwargs,  # type: ignore[arg-type]
+    ) as vllm_model:
         vllm_outputs = vllm_model.generate_greedy_logprobs(
-            example_prompts, max_tokens=max_tokens, num_logprobs=num_logprobs)
+            example_prompts, max_tokens=max_tokens, num_logprobs=num_logprobs
+        )
 
     with vllm_runner(
-            model,
-            model_impl="transformers",
-            enforce_eager=True,
-            **quantization_kwargs) as vllm_model:  # type: ignore[arg-type]
+        model,
+        model_impl="transformers",
+        enforce_eager=True,
+        **quantization_kwargs,  # type: ignore[arg-type]
+    ) as vllm_model:
         model_config = vllm_model.llm.llm_engine.model_config
         assert model_config.using_transformers_backend()
 
         transformers_outputs = vllm_model.generate_greedy_logprobs(
-            example_prompts, max_tokens=max_tokens, num_logprobs=num_logprobs)
+            example_prompts, max_tokens=max_tokens, num_logprobs=num_logprobs
+        )
 
     check_logprobs_close(
         outputs_0_lst=transformers_outputs,
@@ -172,22 +190,24 @@ def test_quantization(
         # Layers live in `layers`
         "Qwen/Qwen3-Embedding-0.6B",
         # Layers live in `model.layers`
-        "meta-llama/Llama-3.2-1B-Instruct"
+        "meta-llama/Llama-3.2-1B-Instruct",
     ],
 )
 def test_embed_loading(vllm_runner, model):
-    with vllm_runner(model,
-                     max_model_len=1024,
-                     enforce_eager=True,
-                     runner="pooling",
-                     model_impl="transformers") as model_test:
+    with vllm_runner(
+        model,
+        max_model_len=1024,
+        enforce_eager=True,
+        runner="pooling",
+        model_impl="transformers",
+    ) as model_test:
         model_config = model_test.llm.llm_engine.model_config
         assert model_config.using_transformers_backend()
 
 
 @pytest.mark.parametrize(
-    "arch",
-    ["TransformersEmbeddingModel", "TransformersForSequenceClassification"])
+    "arch", ["TransformersEmbeddingModel", "TransformersForSequenceClassification"]
+)
 def test_pooling(hf_runner, vllm_runner, example_prompts, arch):
     model = get_model(arch)
 
@@ -202,6 +222,7 @@ def test_pooling(hf_runner, vllm_runner, example_prompts, arch):
         hf_kwargs["is_sentence_transformer"] = True
     elif arch == "TransformersForSequenceClassification":
         from transformers import AutoModelForSequenceClassification
+
         hf_kwargs["auto_cls"] = AutoModelForSequenceClassification
 
     # The example_prompts has ending "\n", for example:
@@ -212,8 +233,10 @@ def test_pooling(hf_runner, vllm_runner, example_prompts, arch):
     # So we need to strip the input texts to avoid test failing.
     example_prompts = [str(s).strip() for s in example_prompts]
 
-    with (vllm_runner(model, **vllm_kwargs) as
-          vllm_model, hf_runner(model, **hf_kwargs) as hf_model):
+    with (
+        vllm_runner(model, **vllm_kwargs) as vllm_model,
+        hf_runner(model, **hf_kwargs) as hf_model,
+    ):
         model_config = vllm_model.llm.llm_engine.model_config
         assert model_config.using_transformers_backend()
 
diff --git a/tests/models/test_utils.py b/tests/models/test_utils.py
index 9b87b1a9d46c..7cc4ee3c1856 100644
--- a/tests/models/test_utils.py
+++ b/tests/models/test_utils.py
@@ -10,7 +10,6 @@
 
 
 class ModuleWithBatchNorm(torch.nn.Module):
-
     def __init__(self):
         super().__init__()
         self.bn = torch.nn.BatchNorm1d(2)
@@ -20,7 +19,6 @@ def forward(self, x):
 
 
 class ModuleWithNestedBatchNorm(torch.nn.Module):
-
     def __init__(self):
         super().__init__()
         self.nested_mod = ModuleWithBatchNorm()
@@ -67,9 +65,11 @@ def weight_generator():
     new_mod = ModuleWithNestedBatchNorm()
 
     assert not torch.all(
-        new_mod.nested_mod.bn.running_mean == mod.nested_mod.bn.running_mean)
+        new_mod.nested_mod.bn.running_mean == mod.nested_mod.bn.running_mean
+    )
     assert not torch.all(
-        new_mod.nested_mod.bn.running_var == mod.nested_mod.bn.running_var)
+        new_mod.nested_mod.bn.running_var == mod.nested_mod.bn.running_var
+    )
     assert new_mod.nested_mod.bn.num_batches_tracked.item() == 0
 
     loader = AutoWeightsLoader(new_mod)
@@ -77,9 +77,9 @@ def weight_generator():
 
     # Ensure the stats are updated
     assert torch.all(
-        new_mod.nested_mod.bn.running_mean == mod.nested_mod.bn.running_mean)
-    assert torch.all(
-        new_mod.nested_mod.bn.running_var == mod.nested_mod.bn.running_var)
+        new_mod.nested_mod.bn.running_mean == mod.nested_mod.bn.running_mean
+    )
+    assert torch.all(new_mod.nested_mod.bn.running_var == mod.nested_mod.bn.running_var)
     assert new_mod.nested_mod.bn.num_batches_tracked.item() == 1
 
 
@@ -101,9 +101,11 @@ def weight_generator():
     new_mod = ModuleWithNestedBatchNorm()
 
     assert not torch.all(
-        new_mod.nested_mod.bn.running_mean == mod.nested_mod.bn.running_mean)
+        new_mod.nested_mod.bn.running_mean == mod.nested_mod.bn.running_mean
+    )
     assert not torch.all(
-        new_mod.nested_mod.bn.running_var == mod.nested_mod.bn.running_var)
+        new_mod.nested_mod.bn.running_var == mod.nested_mod.bn.running_var
+    )
     assert new_mod.nested_mod.bn.num_batches_tracked.item() == 0
 
     loader = AutoWeightsLoader(new_mod, skip_prefixes=["prefix."])
@@ -111,9 +113,9 @@ def weight_generator():
 
     # Ensure the stats are updated
     assert torch.all(
-        new_mod.nested_mod.bn.running_mean == mod.nested_mod.bn.running_mean)
-    assert torch.all(
-        new_mod.nested_mod.bn.running_var == mod.nested_mod.bn.running_var)
+        new_mod.nested_mod.bn.running_mean == mod.nested_mod.bn.running_mean
+    )
+    assert torch.all(new_mod.nested_mod.bn.running_var == mod.nested_mod.bn.running_var)
     assert new_mod.nested_mod.bn.num_batches_tracked.item() == 1
 
 
@@ -137,9 +139,11 @@ def weight_generator():
     new_mod = ModuleWithNestedBatchNorm()
 
     assert not torch.all(
-        new_mod.nested_mod.bn.running_mean == mod.nested_mod.bn.running_mean)
+        new_mod.nested_mod.bn.running_mean == mod.nested_mod.bn.running_mean
+    )
     assert not torch.all(
-        new_mod.nested_mod.bn.running_var == mod.nested_mod.bn.running_var)
+        new_mod.nested_mod.bn.running_var == mod.nested_mod.bn.running_var
+    )
     assert new_mod.nested_mod.bn.num_batches_tracked.item() == 0
 
     loader = AutoWeightsLoader(new_mod, skip_substrs=["substr."])
@@ -147,7 +151,7 @@ def weight_generator():
 
     # Ensure the stats are updated
     assert torch.all(
-        new_mod.nested_mod.bn.running_mean == mod.nested_mod.bn.running_mean)
-    assert torch.all(
-        new_mod.nested_mod.bn.running_var == mod.nested_mod.bn.running_var)
+        new_mod.nested_mod.bn.running_mean == mod.nested_mod.bn.running_mean
+    )
+    assert torch.all(new_mod.nested_mod.bn.running_var == mod.nested_mod.bn.running_var)
     assert new_mod.nested_mod.bn.num_batches_tracked.item() == 1
diff --git a/tests/models/test_vision.py b/tests/models/test_vision.py
index 60ea2447e984..b323bca79f4e 100644
--- a/tests/models/test_vision.py
+++ b/tests/models/test_vision.py
@@ -8,11 +8,16 @@
 
 from tests.utils import multi_gpu_test
 from vllm.distributed import get_tensor_model_parallel_world_size
-from vllm.distributed.parallel_state import (init_distributed_environment,
-                                             initialize_model_parallel)
+from vllm.distributed.parallel_state import (
+    init_distributed_environment,
+    initialize_model_parallel,
+)
 from vllm.model_executor.models.vision import (
-    get_load_balance_assignment, resolve_visual_encoder_outputs,
-    run_dp_sharded_mrope_vision_model, run_dp_sharded_vision_model)
+    get_load_balance_assignment,
+    resolve_visual_encoder_outputs,
+    run_dp_sharded_mrope_vision_model,
+    run_dp_sharded_vision_model,
+)
 from vllm.platforms import current_platform
 from vllm.utils import get_open_port, update_environment_variables
 
@@ -20,8 +25,7 @@
 
 
 @pytest.mark.parametrize(
-    ("select_layers", "num_layers_loaded", "max_possible_layers",
-     "expected_features"),
+    ("select_layers", "num_layers_loaded", "max_possible_layers", "expected_features"),
     [
         # All layers loaded
         ([1, 10], 10, 10, [1, 10]),
@@ -29,16 +33,15 @@
         # Some layers not loaded
         ([1, 10], 10, 20, [1, 10]),
         ([-20, -11], 10, 20, [1, 10]),
-    ])
-def test_resolve_visual_encoder_outputs(select_layers, num_layers_loaded,
-                                        max_possible_layers,
-                                        expected_features):
+    ],
+)
+def test_resolve_visual_encoder_outputs(
+    select_layers, num_layers_loaded, max_possible_layers, expected_features
+):
     """
     Test that offsets are correctly handled for vision feature layers.
     """
-    encoder_outputs = [
-        torch.tensor([idx]) for idx in range(num_layers_loaded + 1)
-    ]
+    encoder_outputs = [torch.tensor([idx]) for idx in range(num_layers_loaded + 1)]
     output_tensor = resolve_visual_encoder_outputs(
         encoder_outputs=encoder_outputs,
         post_layer_norm=None,
@@ -85,10 +88,11 @@ def test_run_dp_sharded_vision_model(batch_size: int):
     )
 
 
-def run_dp_sharded_vision_model_vs_direct(local_rank: int, world_size: int,
-                                          batch_size: int, master_port: int):
+def run_dp_sharded_vision_model_vs_direct(
+    local_rank: int, world_size: int, batch_size: int, master_port: int
+):
     """
-    Test that run_dp_sharded_vision_model produces the same results as 
+    Test that run_dp_sharded_vision_model produces the same results as
     calling the model directly.
     """
 
@@ -99,13 +103,15 @@ def run_dp_sharded_vision_model_vs_direct(local_rank: int, world_size: int,
     current_platform.set_device(device)
     torch.set_default_device(device)
 
-    update_environment_variables({
-        'RANK': str(local_rank),
-        'LOCAL_RANK': str(local_rank),
-        'WORLD_SIZE': str(world_size),
-        'MASTER_ADDR': 'localhost',
-        'MASTER_PORT': str(master_port),
-    })
+    update_environment_variables(
+        {
+            "RANK": str(local_rank),
+            "LOCAL_RANK": str(local_rank),
+            "WORLD_SIZE": str(world_size),
+            "MASTER_ADDR": "localhost",
+            "MASTER_PORT": str(master_port),
+        }
+    )
 
     # initialize distributed
     init_distributed_environment()
@@ -141,28 +147,45 @@ def run_dp_sharded_vision_model_vs_direct(local_rank: int, world_size: int,
     [
         # Empty input
         ([], 2, [], [0, 0], [0, 0], "empty input"),
-
         # Fewer samples than GPUs
-        ([100, 200], 4, [1, 0], [1, 1, 0, 0], [200, 100, 0, 0
-                                               ], "fewer samples than GPUs"),
-
+        (
+            [100, 200],
+            4,
+            [1, 0],
+            [1, 1, 0, 0],
+            [200, 100, 0, 0],
+            "fewer samples than GPUs",
+        ),
         # Single GPU
         ([100, 200, 300], 1, [2, 1, 0], [3], [600], "single GPU"),
-
         # Balanced assignment
-        ([100, 100, 100, 100
-          ], 2, [0, 2, 1, 3], [2, 2], [200, 200], "balanced assignment"),
-
+        (
+            [100, 100, 100, 100],
+            2,
+            [0, 2, 1, 3],
+            [2, 2],
+            [200, 200],
+            "balanced assignment",
+        ),
         # Unbalanced sizes - this one is trickier since the algorithm is greedy
-        ([1000, 100, 200, 50], 2, [0, 2, 1, 3
-                                   ], [1, 3], [1000, 350], "unbalanced sizes"),
+        (
+            [1000, 100, 200, 50],
+            2,
+            [0, 2, 1, 3],
+            [1, 3],
+            [1000, 350],
+            "unbalanced sizes",
+        ),
     ],
 )
-def test_get_load_balance_assignment_cases(sizes, num_gpus,
-                                           expected_shuffle_indices,
-                                           expected_gpu_sample_counts,
-                                           expected_grouped_sizes_per_gpu,
-                                           test_description):
+def test_get_load_balance_assignment_cases(
+    sizes,
+    num_gpus,
+    expected_shuffle_indices,
+    expected_gpu_sample_counts,
+    expected_grouped_sizes_per_gpu,
+    test_description,
+):
     """Test get_load_balance_assignment with various input cases."""
     result = get_load_balance_assignment(sizes, num_gpus=num_gpus)
     (shuffle_indices, gpu_sample_counts, grouped_sizes_per_gpu) = result
@@ -188,8 +211,7 @@ def __init__(self, spatial_merge_size: int = 2, out_hidden_size: int = 64):
         self.out_hidden_size = out_hidden_size
         self.linear = torch.nn.Linear(768, out_hidden_size)
 
-    def forward(self, pixel_values: torch.Tensor,
-                grid_thw_list: list[list[int]]):
+    def forward(self, pixel_values: torch.Tensor, grid_thw_list: list[list[int]]):
         """Simple forward pass that simulates spatial merging."""
         # Apply linear transformation
         embeddings = self.linear(pixel_values)
@@ -212,8 +234,9 @@ def forward(self, pixel_values: torch.Tensor,
             merged_patches = num_patches // merge_factor
             if merged_patches > 0:
                 # Reshape and average to simulate merging
-                reshaped = image_patches[:merged_patches * merge_factor].view(
-                    merged_patches, merge_factor, -1)
+                reshaped = image_patches[: merged_patches * merge_factor].view(
+                    merged_patches, merge_factor, -1
+                )
                 merged = reshaped.mean(dim=1)
                 merged_embeddings.append(merged)
 
@@ -222,9 +245,11 @@ def forward(self, pixel_values: torch.Tensor,
         if merged_embeddings:
             return torch.cat(merged_embeddings, dim=0)
         else:
-            return torch.empty((0, self.out_hidden_size),
-                               device=pixel_values.device,
-                               dtype=pixel_values.dtype)
+            return torch.empty(
+                (0, self.out_hidden_size),
+                device=pixel_values.device,
+                dtype=pixel_values.dtype,
+            )
 
 
 @multi_gpu_test(num_gpus=2)
@@ -250,12 +275,11 @@ def test_run_dp_sharded_mrope_vision_model(batch_size: int):
     )
 
 
-def run_dp_sharded_mrope_vision_model_vs_direct(local_rank: int,
-                                                world_size: int,
-                                                batch_size: int,
-                                                master_port: int):
+def run_dp_sharded_mrope_vision_model_vs_direct(
+    local_rank: int, world_size: int, batch_size: int, master_port: int
+):
     """
-    Test that run_dp_sharded_mrope_vision_model produces the same results as 
+    Test that run_dp_sharded_mrope_vision_model produces the same results as
     calling the model directly.
     """
     # Set random seed for reproducibility
@@ -264,13 +288,15 @@ def run_dp_sharded_mrope_vision_model_vs_direct(local_rank: int,
     current_platform.set_device(device)
     torch.set_default_device(device)
 
-    update_environment_variables({
-        'RANK': str(local_rank),
-        'LOCAL_RANK': str(local_rank),
-        'WORLD_SIZE': str(world_size),
-        'MASTER_ADDR': 'localhost',
-        'MASTER_PORT': str(master_port),
-    })
+    update_environment_variables(
+        {
+            "RANK": str(local_rank),
+            "LOCAL_RANK": str(local_rank),
+            "WORLD_SIZE": str(world_size),
+            "MASTER_ADDR": "localhost",
+            "MASTER_PORT": str(master_port),
+        }
+    )
 
     # initialize distributed
     init_distributed_environment()
@@ -303,10 +329,9 @@ def run_dp_sharded_mrope_vision_model_vs_direct(local_rank: int,
 
     # Run the model through the sharded function
     with torch.inference_mode():
-        sharded_output = run_dp_sharded_mrope_vision_model(vision_model,
-                                                           pixel_values,
-                                                           grid_thw_list,
-                                                           rope_type="rope_3d")
+        sharded_output = run_dp_sharded_mrope_vision_model(
+            vision_model, pixel_values, grid_thw_list, rope_type="rope_3d"
+        )
         sharded_output = torch.cat(sharded_output, dim=0)
 
     # Check that the world size is set up correctly
@@ -317,10 +342,7 @@ def run_dp_sharded_mrope_vision_model_vs_direct(local_rank: int,
         # Check that the outputs have the same shape
         assert direct_output.shape == sharded_output.shape
         # Check that the outputs are close (they should be identical)
-        assert torch.allclose(direct_output,
-                              sharded_output,
-                              rtol=1e-5,
-                              atol=1e-5)
+        assert torch.allclose(direct_output, sharded_output, rtol=1e-5, atol=1e-5)
 
 
 @multi_gpu_test(num_gpus=2)
@@ -334,20 +356,23 @@ def test_run_dp_sharded_mrope_vision_model_empty_input():
 
 
 def run_dp_sharded_mrope_vision_model_empty_input_worker(
-        local_rank: int, world_size: int, master_port: int):
+    local_rank: int, world_size: int, master_port: int
+):
     """Test run_dp_sharded_mrope_vision_model with empty input."""
     # Set up distributed environment
     device = f"{current_platform.device_name}:{local_rank}"
     current_platform.set_device(device)
     torch.set_default_device(device)
 
-    update_environment_variables({
-        'RANK': str(local_rank),
-        'LOCAL_RANK': str(local_rank),
-        'WORLD_SIZE': str(world_size),
-        'MASTER_ADDR': 'localhost',
-        'MASTER_PORT': str(master_port),
-    })
+    update_environment_variables(
+        {
+            "RANK": str(local_rank),
+            "LOCAL_RANK": str(local_rank),
+            "WORLD_SIZE": str(world_size),
+            "MASTER_ADDR": "localhost",
+            "MASTER_PORT": str(master_port),
+        }
+    )
 
     init_distributed_environment()
     initialize_model_parallel(tensor_model_parallel_size=world_size)
@@ -360,10 +385,9 @@ def run_dp_sharded_mrope_vision_model_empty_input_worker(
 
     # Should handle empty input gracefully
     with torch.inference_mode():
-        output = run_dp_sharded_mrope_vision_model(vision_model,
-                                                   pixel_values,
-                                                   grid_thw_list,
-                                                   rope_type="rope_3d")
+        output = run_dp_sharded_mrope_vision_model(
+            vision_model, pixel_values, grid_thw_list, rope_type="rope_3d"
+        )
 
     assert len(output) == 0
 
@@ -379,7 +403,8 @@ def test_run_dp_sharded_mrope_vision_model_uneven_load():
 
 
 def run_dp_sharded_mrope_vision_model_uneven_load_worker(
-        local_rank: int, world_size: int, master_port: int):
+    local_rank: int, world_size: int, master_port: int
+):
     """Test run_dp_sharded_mrope_vision_model with uneven load distribution."""
     # Set up distributed environment
     current_platform.seed_everything(123)
@@ -387,13 +412,15 @@ def run_dp_sharded_mrope_vision_model_uneven_load_worker(
     current_platform.set_device(device)
     torch.set_default_device(device)
 
-    update_environment_variables({
-        'RANK': str(local_rank),
-        'LOCAL_RANK': str(local_rank),
-        'WORLD_SIZE': str(world_size),
-        'MASTER_ADDR': 'localhost',
-        'MASTER_PORT': str(master_port),
-    })
+    update_environment_variables(
+        {
+            "RANK": str(local_rank),
+            "LOCAL_RANK": str(local_rank),
+            "WORLD_SIZE": str(world_size),
+            "MASTER_ADDR": "localhost",
+            "MASTER_PORT": str(master_port),
+        }
+    )
 
     init_distributed_environment()
     initialize_model_parallel(tensor_model_parallel_size=world_size)
@@ -401,7 +428,7 @@ def run_dp_sharded_mrope_vision_model_uneven_load_worker(
     # Create images with very different sizes
     grid_thw_list = [
         [1, 2, 2],  # Small: 4 patches
-        [1, 8, 8],  # Large: 64 patches  
+        [1, 8, 8],  # Large: 64 patches
         [1, 3, 3],  # Medium: 9 patches
     ]
 
@@ -416,15 +443,15 @@ def run_dp_sharded_mrope_vision_model_uneven_load_worker(
 
     # Should handle uneven distribution without errors
     with torch.inference_mode():
-        output_tuple = run_dp_sharded_mrope_vision_model(vision_model,
-                                                         pixel_values,
-                                                         grid_thw_list,
-                                                         rope_type="rope_3d")
+        output_tuple = run_dp_sharded_mrope_vision_model(
+            vision_model, pixel_values, grid_thw_list, rope_type="rope_3d"
+        )
 
     # Verify output shape is reasonable
     merge_factor = vision_model.spatial_merge_size**2
     expected_output_patches = list(
-        math.prod(grid_thw) // merge_factor for grid_thw in grid_thw_list)
+        math.prod(grid_thw) // merge_factor for grid_thw in grid_thw_list
+    )
 
     for i, output in enumerate(output_tuple):
         assert output.shape[0] == expected_output_patches[i]
@@ -445,8 +472,9 @@ def test_simple_mrope_vision_model_spatial_merge(spatial_merge_size: int):
         pixel_values_list.append(image_pixels)
 
     pixel_values = torch.cat(pixel_values_list, dim=0)
-    vision_model = SimpleMRopeVisionModel(
-        spatial_merge_size=spatial_merge_size).to(device)
+    vision_model = SimpleMRopeVisionModel(spatial_merge_size=spatial_merge_size).to(
+        device
+    )
 
     with torch.inference_mode():
         output = vision_model(pixel_values, grid_thw_list)
diff --git a/tests/models/utils.py b/tests/models/utils.py
index 50936114865a..c20e50ff1bff 100644
--- a/tests/models/utils.py
+++ b/tests/models/utils.py
@@ -33,16 +33,18 @@ def check_outputs_equal(
     """
     assert len(outputs_0_lst) == len(outputs_1_lst)
 
-    for prompt_idx, (outputs_0,
-                     outputs_1) in enumerate(zip(outputs_0_lst,
-                                                 outputs_1_lst)):
+    for prompt_idx, (outputs_0, outputs_1) in enumerate(
+        zip(outputs_0_lst, outputs_1_lst)
+    ):
         output_ids_0, output_str_0 = outputs_0
         output_ids_1, output_str_1 = outputs_1
 
         # The text and token outputs should exactly match
-        fail_msg = (f"Test{prompt_idx}:"
-                    f"\n{name_0}:\t{output_str_0!r}"
-                    f"\n{name_1}:\t{output_str_1!r}")
+        fail_msg = (
+            f"Test{prompt_idx}:"
+            f"\n{name_0}:\t{output_str_0!r}"
+            f"\n{name_1}:\t{output_str_1!r}"
+        )
 
         assert output_str_0 == output_str_1, fail_msg
         assert output_ids_0 == output_ids_1, fail_msg
@@ -54,9 +56,9 @@ def check_outputs_equal(
 # * List of top sample logprobs for each sampled token
 #
 # Assumes prompt logprobs were not requested.
-TokensTextLogprobs = tuple[list[int], str, Optional[Union[list[dict[int,
-                                                                    float]],
-                                                          SampleLogprobs]]]
+TokensTextLogprobs = tuple[
+    list[int], str, Optional[Union[list[dict[int, float]], SampleLogprobs]]
+]
 
 # Allow for tokens to be represented as str's rather than IDs;
 # tuple of
@@ -65,9 +67,9 @@ def check_outputs_equal(
 # * Optional list of top sample logprobs for each sampled token
 #
 # Assumes prompt logprobs were not requested.
-TextTextLogprobs = tuple[list[str], str, Optional[Union[list[dict[str, float]],
-                                                        list[dict[str,
-                                                                  Logprob]]]]]
+TextTextLogprobs = tuple[
+    list[str], str, Optional[Union[list[dict[str, float]], list[dict[str, Logprob]]]]
+]
 
 # Representation of generated sequence as a tuple of
 # * Token ID list
@@ -77,18 +79,21 @@ def check_outputs_equal(
 #
 # Allows prompt logprobs to be requested.
 TokensTextLogprobsPromptLogprobs = tuple[
-    list[int], str, Optional[Union[list[dict[int, float]], SampleLogprobs]],
-    Optional[Union[list[Optional[dict[int, float]]], PromptLogprobs]]]
+    list[int],
+    str,
+    Optional[Union[list[dict[int, float]], SampleLogprobs]],
+    Optional[Union[list[Optional[dict[int, float]]], PromptLogprobs]],
+]
 
 
 def check_logprobs_close(
     *,
-    outputs_0_lst: Sequence[Union[TokensTextLogprobs,
-                                  TokensTextLogprobsPromptLogprobs,
-                                  TextTextLogprobs]],
-    outputs_1_lst: Sequence[Union[TokensTextLogprobs,
-                                  TokensTextLogprobsPromptLogprobs,
-                                  TextTextLogprobs]],
+    outputs_0_lst: Sequence[
+        Union[TokensTextLogprobs, TokensTextLogprobsPromptLogprobs, TextTextLogprobs]
+    ],
+    outputs_1_lst: Sequence[
+        Union[TokensTextLogprobs, TokensTextLogprobsPromptLogprobs, TextTextLogprobs]
+    ],
     name_0: str,
     name_1: str,
     num_outputs_0_skip_tokens: int = 0,
@@ -128,9 +133,9 @@ def check_logprobs_close(
     assert len(outputs_0_lst) == len(outputs_1_lst)
 
     # Loop through responses to each prompt.
-    for prompt_idx, (outputs_0,
-                     outputs_1) in enumerate(zip(outputs_0_lst,
-                                                 outputs_1_lst)):
+    for prompt_idx, (outputs_0, outputs_1) in enumerate(
+        zip(outputs_0_lst, outputs_1_lst)
+    ):
         assert len(outputs_0) == len(outputs_1)
         if len(outputs_0) == 3:
             assert len(outputs_1) == 3
@@ -155,17 +160,18 @@ def check_logprobs_close(
             ) = outputs_1
 
             # Test prompt logprobs closeness
-            if (prompt_logprobs_0 is not None
-                    and prompt_logprobs_1 is not None):
+            if prompt_logprobs_0 is not None and prompt_logprobs_1 is not None:
                 # Both sequences' prompt logprobs lists are not `None``
                 # (although individual list elements may be `None`);
                 # for each token's logprobs:
                 for idx, (logprobs_elem_0, logprobs_elem_1) in enumerate(
-                        zip(prompt_logprobs_0, prompt_logprobs_1)):
+                    zip(prompt_logprobs_0, prompt_logprobs_1)
+                ):
                     fail_msg = (
                         f"Prompt logprobs test:"
                         f"\n{name_0}:\tPrompt index {idx}\t{logprobs_elem_0}"
-                        f"\n{name_1}:\tPrompt index {idx}\t{logprobs_elem_1}")
+                        f"\n{name_1}:\tPrompt index {idx}\t{logprobs_elem_1}"
+                    )
 
                     if logprobs_elem_0 is None:
                         # If the seq 0 token's logprobs are `None`,
@@ -176,20 +182,24 @@ def check_logprobs_close(
                         # the seq 1 token's logprobs must not be `None`
                         assert logprobs_elem_1 is not None, fail_msg
                         # Logprobs check: top-k token choices must be the same
-                        assert (set(logprobs_elem_0.keys()) == set(
-                            logprobs_elem_1.keys())), fail_msg
+                        assert set(logprobs_elem_0.keys()) == set(
+                            logprobs_elem_1.keys()
+                        ), fail_msg
             else:
                 # Both sequence logprobs lists must be `None`
-                fail_msg = (f"Prompt logprobs test:"
-                            f"\n{name_0}:\tlogprobs\t{prompt_logprobs_0}"
-                            f"\n{name_1}:\tlogprobs\t{prompt_logprobs_1}")
+                fail_msg = (
+                    f"Prompt logprobs test:"
+                    f"\n{name_0}:\tlogprobs\t{prompt_logprobs_0}"
+                    f"\n{name_1}:\tlogprobs\t{prompt_logprobs_1}"
+                )
 
-                assert (prompt_logprobs_0 is None
-                        and prompt_logprobs_1 is None), fail_msg
+                assert prompt_logprobs_0 is None and prompt_logprobs_1 is None, fail_msg
         else:
-            raise ValueError(f"Outputs tuple must have 3 or 4 elements but "
-                             f"{len(outputs_0)} elements were provided: "
-                             f"{outputs_0}")
+            raise ValueError(
+                f"Outputs tuple must have 3 or 4 elements but "
+                f"{len(outputs_0)} elements were provided: "
+                f"{outputs_0}"
+            )
 
         if logprobs_0 is None:
             logprobs_0 = [None] * len(output_ids_0)
@@ -206,9 +216,9 @@ def check_logprobs_close(
         logprobs_0 = logprobs_0[num_outputs_0_skip_tokens:]
 
         # Loop through generated tokens.
-        for idx, (output_id_0,
-                  output_id_1) in enumerate(zip(output_ids_0, output_ids_1)):
-
+        for idx, (output_id_0, output_id_1) in enumerate(
+            zip(output_ids_0, output_ids_1)
+        ):
             is_tok_mismatch = output_id_0 != output_id_1
 
             # If generated tokens don't match
@@ -223,7 +233,8 @@ def check_logprobs_close(
                     f"Test{prompt_idx}:"
                     f"\nMatched tokens:\t{output_ids_0[:idx]}"
                     f"\n{name_0}:\t{output_str_0!r}\t{logprobs_elem_0}"
-                    f"\n{name_1}:\t{output_str_1!r}\t{logprobs_elem_1}")
+                    f"\n{name_1}:\t{output_str_1!r}\t{logprobs_elem_1}"
+                )
 
                 assert logprobs_elem_0 is not None, fail_msg
                 assert logprobs_elem_1 is not None, fail_msg
@@ -244,9 +255,11 @@ def check_logprobs_close(
             if output_str_0 != output_str_1 and warn_on_mismatch:
                 # The token outputs exactly match,
                 # so the text outputs should exactly match as well
-                fail_msg = (f"Test{prompt_idx}:"
-                            f"\n{name_0}:\t{output_str_0!r}"
-                            f"\n{name_1}:\t{output_str_1!r}")
+                fail_msg = (
+                    f"Test{prompt_idx}:"
+                    f"\n{name_0}:\t{output_str_0!r}"
+                    f"\n{name_1}:\t{output_str_1!r}"
+                )
 
                 with warnings.catch_warnings():
                     # This ensures that repeated warnings are shown
@@ -317,18 +330,22 @@ def check_embeddings_close(
     assert len(embeddings_0_lst) == len(embeddings_1_lst)
 
     for prompt_idx, (embeddings_0, embeddings_1) in enumerate(
-            zip(embeddings_0_lst, embeddings_1_lst)):
+        zip(embeddings_0_lst, embeddings_1_lst)
+    ):
         assert len(embeddings_0) == len(embeddings_1), (
-            f"Length mismatch: {len(embeddings_0)} vs. {len(embeddings_1)}")
+            f"Length mismatch: {len(embeddings_0)} vs. {len(embeddings_1)}"
+        )
 
-        sim = F.cosine_similarity(torch.tensor(embeddings_0),
-                                  torch.tensor(embeddings_1),
-                                  dim=0)
+        sim = F.cosine_similarity(
+            torch.tensor(embeddings_0), torch.tensor(embeddings_1), dim=0
+        )
 
-        fail_msg = (f"Test{prompt_idx}:"
-                    f"\nCosine similarity: \t{sim:.4f}"
-                    f"\n{name_0}:\t{embeddings_0[:16]!r}"
-                    f"\n{name_1}:\t{embeddings_1[:16]!r}")
+        fail_msg = (
+            f"Test{prompt_idx}:"
+            f"\nCosine similarity: \t{sim:.4f}"
+            f"\n{name_0}:\t{embeddings_0[:16]!r}"
+            f"\n{name_1}:\t{embeddings_1[:16]!r}"
+        )
 
         assert sim >= 1 - tol, fail_msg
 
@@ -413,20 +430,19 @@ def dummy_hf_overrides(
 
     # Ensure at least 2 expert per group
     # Since `grouped_topk` assumes top-2
-    n_group = getattr(text_config, 'n_group', None)
+    n_group = getattr(text_config, "n_group", None)
     num_experts = n_group * 2 if n_group is not None else 2
 
     # we use three layers for Gemma-3n to check
     # both normal layer and kv_shared_layer
     if use_original_num_layers:
         # Use the original number of layers from the config
-        num_layers = getattr(text_config, 'num_layers', 1)
-        num_hidden_layers = getattr(text_config, 'num_hidden_layers', 1)
+        num_layers = getattr(text_config, "num_layers", 1)
+        num_hidden_layers = getattr(text_config, "num_hidden_layers", 1)
     else:
         # Use minimal layers for testing
         num_layers = 1
-        num_hidden_layers = (3 if model_arch
-                             == "Gemma3nForConditionalGeneration" else 1)
+        num_hidden_layers = 3 if model_arch == "Gemma3nForConditionalGeneration" else 1
 
     update_dict = {
         "num_layers": num_layers,
@@ -440,53 +456,63 @@ class DummyConfig:
     # Only set MoE related config when the model has MoE layers.
     # Otherwise all models detected as MoE by _get_transformers_backend_cls.
     if ModelConfig.get_num_experts(DummyConfig) > 0:
-        update_dict.update({
-            "num_experts": num_experts,
-            "num_experts_per_tok": 2,
-            "num_local_experts": num_experts,
-            # Otherwise there will not be any expert layers
-            "first_k_dense_replace": 0,
-            # To avoid OOM on DeepSeek-V3
-            "n_routed_experts": num_experts,
-        })
+        update_dict.update(
+            {
+                "num_experts": num_experts,
+                "num_experts_per_tok": 2,
+                "num_local_experts": num_experts,
+                # Otherwise there will not be any expert layers
+                "first_k_dense_replace": 0,
+                # To avoid OOM on DeepSeek-V3
+                "n_routed_experts": num_experts,
+            }
+        )
 
     # Update num_hidden_layers for non-Longcat architectures
-    if model_arch != "LongcatFlashForCausalLM" \
-            and model_arch != "LongCatFlashMTPModel":
+    if model_arch != "LongcatFlashForCausalLM" and model_arch != "LongCatFlashMTPModel":
         update_dict["num_hidden_layers"] = num_hidden_layers
 
     text_config.update(update_dict)
 
     if hasattr(hf_config, "vision_config"):
-        hf_config.vision_config.update({
-            "num_layers": 1,
-            "num_hidden_layers": 1,
-        })
+        hf_config.vision_config.update(
+            {
+                "num_layers": 1,
+                "num_hidden_layers": 1,
+            }
+        )
 
     # e.g.: ibm-granite/granite-speech-3.3-2b
     if hasattr(hf_config, "encoder_config"):
-        hf_config.encoder_config.update({
-            "num_layers": 1,
-            "num_hidden_layers": 1,
-        })
+        hf_config.encoder_config.update(
+            {
+                "num_layers": 1,
+                "num_hidden_layers": 1,
+            }
+        )
 
     # e.g.: Qwen/Qwen2-Audio-7B-Instruct
     if hasattr(hf_config, "audio_config"):
-        hf_config.audio_config.update({
-            "num_layers": 1,
-            "num_hidden_layers": 1,
-            "encoder_layers": 1,
-        })
+        hf_config.audio_config.update(
+            {
+                "num_layers": 1,
+                "num_hidden_layers": 1,
+                "encoder_layers": 1,
+            }
+        )
 
     return hf_config
 
 
-def check_transformers_version(model: str,
-                               min_transformers_version: Optional[str] = None,
-                               max_transformers_version: Optional[str] = None):
+def check_transformers_version(
+    model: str,
+    min_transformers_version: Optional[str] = None,
+    max_transformers_version: Optional[str] = None,
+):
     from .registry import _HfExamplesInfo
 
-    return _HfExamplesInfo(model,
-                           min_transformers_version=min_transformers_version,
-                           max_transformers_version=max_transformers_version
-                           ).check_transformers_version(on_fail="skip")
+    return _HfExamplesInfo(
+        model,
+        min_transformers_version=min_transformers_version,
+        max_transformers_version=max_transformers_version,
+    ).check_transformers_version(on_fail="skip")
diff --git a/tests/multimodal/test_audio.py b/tests/multimodal/test_audio.py
index ba39af845041..189b319e5fcd 100644
--- a/tests/multimodal/test_audio.py
+++ b/tests/multimodal/test_audio.py
@@ -8,9 +8,12 @@
 import numpy as np
 import pytest
 
-from vllm.multimodal.audio import (AudioMediaIO, AudioResampler,
-                                   resample_audio_librosa,
-                                   resample_audio_scipy)
+from vllm.multimodal.audio import (
+    AudioMediaIO,
+    AudioResampler,
+    resample_audio_librosa,
+    resample_audio_scipy,
+)
 
 
 @pytest.fixture
@@ -21,12 +24,10 @@ def dummy_audio():
 def test_resample_audio_librosa(dummy_audio):
     with patch("vllm.multimodal.audio.librosa.resample") as mock_resample:
         mock_resample.return_value = dummy_audio * 2
-        out = resample_audio_librosa(dummy_audio,
-                                     orig_sr=44100,
-                                     target_sr=22050)
-        mock_resample.assert_called_once_with(dummy_audio,
-                                              orig_sr=44100,
-                                              target_sr=22050)
+        out = resample_audio_librosa(dummy_audio, orig_sr=44100, target_sr=22050)
+        mock_resample.assert_called_once_with(
+            dummy_audio, orig_sr=44100, target_sr=22050
+        )
         assert np.all(out == dummy_audio * 2)
 
 
@@ -40,8 +41,7 @@ def test_resample_audio_scipy(dummy_audio):
     assert np.all(out_same == dummy_audio)
 
 
-@pytest.mark.xfail(
-    reason="resample_audio_scipy is buggy for non-integer ratios")
+@pytest.mark.xfail(reason="resample_audio_scipy is buggy for non-integer ratios")
 def test_resample_audio_scipy_non_integer_ratio(dummy_audio):
     out = resample_audio_scipy(dummy_audio, orig_sr=5, target_sr=3)
 
@@ -54,13 +54,12 @@ def test_resample_audio_scipy_non_integer_ratio(dummy_audio):
 
 def test_audio_resampler_librosa_calls_resample(dummy_audio):
     resampler = AudioResampler(target_sr=22050, method="librosa")
-    with patch(
-            "vllm.multimodal.audio.resample_audio_librosa") as mock_resample:
+    with patch("vllm.multimodal.audio.resample_audio_librosa") as mock_resample:
         mock_resample.return_value = dummy_audio
         out = resampler.resample(dummy_audio, orig_sr=44100)
-        mock_resample.assert_called_once_with(dummy_audio,
-                                              orig_sr=44100,
-                                              target_sr=22050)
+        mock_resample.assert_called_once_with(
+            dummy_audio, orig_sr=44100, target_sr=22050
+        )
         assert np.all(out == dummy_audio)
 
 
@@ -69,9 +68,9 @@ def test_audio_resampler_scipy_calls_resample(dummy_audio):
     with patch("vllm.multimodal.audio.resample_audio_scipy") as mock_resample:
         mock_resample.return_value = dummy_audio
         out = resampler.resample(dummy_audio, orig_sr=44100)
-        mock_resample.assert_called_once_with(dummy_audio,
-                                              orig_sr=44100,
-                                              target_sr=22050)
+        mock_resample.assert_called_once_with(
+            dummy_audio, orig_sr=44100, target_sr=22050
+        )
         assert np.all(out == dummy_audio)
 
 
diff --git a/tests/multimodal/test_cache.py b/tests/multimodal/test_cache.py
index 48e88e7c0175..49493a2e0479 100644
--- a/tests/multimodal/test_cache.py
+++ b/tests/multimodal/test_cache.py
@@ -8,15 +8,20 @@
 
 from vllm.config import ModelConfig, ParallelConfig, VllmConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.cache import (MultiModalCache,
-                                   MultiModalProcessorCacheItem,
-                                   MultiModalProcessorCacheItemMetadata,
-                                   engine_receiver_cache_from_config,
-                                   processor_cache_from_config)
+from vllm.multimodal.cache import (
+    MultiModalCache,
+    MultiModalProcessorCacheItem,
+    MultiModalProcessorCacheItemMetadata,
+    engine_receiver_cache_from_config,
+    processor_cache_from_config,
+)
 from vllm.multimodal.hasher import MultiModalHasher
-from vllm.multimodal.inputs import (MultiModalFieldElem, MultiModalKwargsItem,
-                                    MultiModalKwargsItems,
-                                    MultiModalSharedField)
+from vllm.multimodal.inputs import (
+    MultiModalFieldElem,
+    MultiModalKwargsItem,
+    MultiModalKwargsItems,
+    MultiModalSharedField,
+)
 from vllm.multimodal.processing import PromptInsertion
 
 pytestmark = pytest.mark.cpu_test
@@ -30,9 +35,9 @@ def _dummy_elem(
     rng: Optional[np.random.RandomState] = None,
 ):
     if rng is None:
-        data = torch.empty((size, ), dtype=torch.int8)
+        data = torch.empty((size,), dtype=torch.int8)
     else:
-        data = torch.from_numpy(rng.randint(4, size=(size, ), dtype=np.int8))
+        data = torch.from_numpy(rng.randint(4, size=(size,), dtype=np.int8))
 
     return MultiModalFieldElem(
         modality=modality,
@@ -48,10 +53,9 @@ def _dummy_item(
     *,
     rng: Optional[np.random.RandomState] = None,
 ):
-    return MultiModalKwargsItem.from_elems([
-        _dummy_elem(modality, key, size, rng=rng)
-        for key, size in size_by_key.items()
-    ])
+    return MultiModalKwargsItem.from_elems(
+        [_dummy_elem(modality, key, size, rng=rng) for key, size in size_by_key.items()]
+    )
 
 
 def _dummy_items(
@@ -59,10 +63,12 @@ def _dummy_items(
     *,
     rng: Optional[np.random.RandomState] = None,
 ):
-    return MultiModalKwargsItems.from_seq([
-        _dummy_item(modality, size_by_key, rng=rng)
-        for modality, size_by_key in size_by_key_modality.items()
-    ])
+    return MultiModalKwargsItems.from_seq(
+        [
+            _dummy_item(modality, size_by_key, rng=rng)
+            for modality, size_by_key in size_by_key_modality.items()
+        ]
+    )
 
 
 # yapf: disable
diff --git a/tests/multimodal/test_hasher.py b/tests/multimodal/test_hasher.py
index 46aba1b75f77..29064f273783 100644
--- a/tests/multimodal/test_hasher.py
+++ b/tests/multimodal/test_hasher.py
@@ -90,8 +90,6 @@ def test_hash_image_exif_id():
 
     hasher = MultiModalHasher
     # first image has UUID in ImageID, so it should hash to that UUID
-    assert hasher.hash_kwargs(image=image1) == hasher.hash_kwargs(
-        image=id.bytes)
+    assert hasher.hash_kwargs(image=image1) == hasher.hash_kwargs(image=id.bytes)
     # second image has non-UUID in ImageID, so it should hash to the image data
-    assert hasher.hash_kwargs(image=image2) == hasher.hash_kwargs(
-        image=image2a)
+    assert hasher.hash_kwargs(image=image2) == hasher.hash_kwargs(image=image2a)
diff --git a/tests/multimodal/test_image.py b/tests/multimodal/test_image.py
index 2f21ad969e74..329a5b0494cb 100644
--- a/tests/multimodal/test_image.py
+++ b/tests/multimodal/test_image.py
@@ -43,8 +43,7 @@ def test_rgba_to_rgb():
 def test_rgba_to_rgb_custom_background(tmp_path):
     """Test RGBA to RGB conversion with custom background colors."""
     # Create a simple RGBA image with transparent and opaque pixels
-    rgba_image = Image.new("RGBA", (10, 10),
-                           (255, 0, 0, 255))  # Red with full opacity
+    rgba_image = Image.new("RGBA", (10, 10), (255, 0, 0, 255))  # Red with full opacity
 
     # Make top-left quadrant transparent
     for i in range(5):
@@ -94,7 +93,7 @@ def test_rgba_to_rgb_custom_background(tmp_path):
     assert blue_numpy[0][0][2] == 255  # B
 
     # Test 4: Test with load_bytes method
-    with open(test_image_path, 'rb') as f:
+    with open(test_image_path, "rb") as f:
         image_data = f.read()
 
     image_io_green = ImageMediaIO(rgba_background_color=(0, 255, 0))
@@ -111,39 +110,47 @@ def test_rgba_background_color_validation():
     """Test that invalid rgba_background_color values are properly rejected."""
 
     # Test invalid types
-    with pytest.raises(ValueError,
-                       match="rgba_background_color must be a list or tuple"):
+    with pytest.raises(
+        ValueError, match="rgba_background_color must be a list or tuple"
+    ):
         ImageMediaIO(rgba_background_color="255,255,255")
 
-    with pytest.raises(ValueError,
-                       match="rgba_background_color must be a list or tuple"):
+    with pytest.raises(
+        ValueError, match="rgba_background_color must be a list or tuple"
+    ):
         ImageMediaIO(rgba_background_color=255)
 
     # Test wrong number of elements
-    with pytest.raises(ValueError,
-                       match="rgba_background_color must be a list or tuple"):
+    with pytest.raises(
+        ValueError, match="rgba_background_color must be a list or tuple"
+    ):
         ImageMediaIO(rgba_background_color=(255, 255))
 
-    with pytest.raises(ValueError,
-                       match="rgba_background_color must be a list or tuple"):
+    with pytest.raises(
+        ValueError, match="rgba_background_color must be a list or tuple"
+    ):
         ImageMediaIO(rgba_background_color=(255, 255, 255, 255))
 
     # Test non-integer values
-    with pytest.raises(ValueError,
-                       match="rgba_background_color must be a list or tuple"):
+    with pytest.raises(
+        ValueError, match="rgba_background_color must be a list or tuple"
+    ):
         ImageMediaIO(rgba_background_color=(255.0, 255.0, 255.0))
 
-    with pytest.raises(ValueError,
-                       match="rgba_background_color must be a list or tuple"):
+    with pytest.raises(
+        ValueError, match="rgba_background_color must be a list or tuple"
+    ):
         ImageMediaIO(rgba_background_color=(255, "255", 255))
 
     # Test out of range values
-    with pytest.raises(ValueError,
-                       match="rgba_background_color must be a list or tuple"):
+    with pytest.raises(
+        ValueError, match="rgba_background_color must be a list or tuple"
+    ):
         ImageMediaIO(rgba_background_color=(256, 255, 255))
 
-    with pytest.raises(ValueError,
-                       match="rgba_background_color must be a list or tuple"):
+    with pytest.raises(
+        ValueError, match="rgba_background_color must be a list or tuple"
+    ):
         ImageMediaIO(rgba_background_color=(255, -1, 255))
 
     # Test that valid values work
diff --git a/tests/multimodal/test_inputs.py b/tests/multimodal/test_inputs.py
index f35935d14ff2..88e92bee3a29 100644
--- a/tests/multimodal/test_inputs.py
+++ b/tests/multimodal/test_inputs.py
@@ -9,8 +9,7 @@
 pytestmark = pytest.mark.cpu_test
 
 
-def assert_nested_tensors_equal(expected: NestedTensors,
-                                actual: NestedTensors):
+def assert_nested_tensors_equal(expected: NestedTensors, actual: NestedTensors):
     assert type(expected) == type(actual)  # noqa: E721
     if isinstance(expected, torch.Tensor):
         assert torch.equal(expected, actual)
@@ -19,8 +18,9 @@ def assert_nested_tensors_equal(expected: NestedTensors,
             assert_nested_tensors_equal(expected_item, actual_item)
 
 
-def assert_multimodal_inputs_equal(expected: MultiModalKwargs,
-                                   actual: MultiModalKwargs):
+def assert_multimodal_inputs_equal(
+    expected: MultiModalKwargs, actual: MultiModalKwargs
+):
     assert set(expected.keys()) == set(actual.keys())
     for key in expected:
         assert_nested_tensors_equal(expected[key], actual[key])
@@ -52,19 +52,10 @@ def test_multimodal_input_batch_nested_tensors():
     a = torch.rand([2, 3])
     b = torch.rand([2, 3])
     c = torch.rand([2, 3])
-    result = MultiModalKwargs.batch([{
-        "image": [a]
-    }, {
-        "image": [b]
-    }, {
-        "image": [c]
-    }])
-    assert_multimodal_inputs_equal(result, {
-        "image":
-        torch.stack([a.unsqueeze(0),
-                     b.unsqueeze(0),
-                     c.unsqueeze(0)])
-    })
+    result = MultiModalKwargs.batch([{"image": [a]}, {"image": [b]}, {"image": [c]}])
+    assert_multimodal_inputs_equal(
+        result, {"image": torch.stack([a.unsqueeze(0), b.unsqueeze(0), c.unsqueeze(0)])}
+    )
 
 
 def test_multimodal_input_batch_heterogeneous_lists():
@@ -73,8 +64,8 @@ def test_multimodal_input_batch_heterogeneous_lists():
     c = torch.rand([1, 2, 3])
     result = MultiModalKwargs.batch([{"image": [a, b]}, {"image": [c]}])
     assert_multimodal_inputs_equal(
-        result,
-        {"image": [torch.stack([a, b]), c.unsqueeze(0)]})
+        result, {"image": [torch.stack([a, b]), c.unsqueeze(0)]}
+    )
 
 
 def test_multimodal_input_batch_multiple_batchable_lists():
@@ -84,9 +75,8 @@ def test_multimodal_input_batch_multiple_batchable_lists():
     d = torch.rand([1, 2, 3])
     result = MultiModalKwargs.batch([{"image": [a, b]}, {"image": [c, d]}])
     assert_multimodal_inputs_equal(
-        result,
-        {"image": torch.stack([torch.stack([a, b]),
-                               torch.stack([c, d])])})
+        result, {"image": torch.stack([torch.stack([a, b]), torch.stack([c, d])])}
+    )
 
 
 def test_multimodal_input_batch_mixed_stacking_depths():
diff --git a/tests/multimodal/test_processing.py b/tests/multimodal/test_processing.py
index 7aa51acff350..961a2c86b230 100644
--- a/tests/multimodal/test_processing.py
+++ b/tests/multimodal/test_processing.py
@@ -9,16 +9,22 @@
 
 from vllm.config import ModelConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.multimodal.processing import (InputProcessingContext,
-                                        PlaceholderFeaturesInfo,
-                                        PromptIndexTargets, PromptInsertion,
-                                        PromptReplacement, apply_text_matches,
-                                        apply_token_matches,
-                                        find_mm_placeholders,
-                                        iter_token_matches,
-                                        replace_token_matches)
+from vllm.multimodal.processing import (
+    InputProcessingContext,
+    PlaceholderFeaturesInfo,
+    PromptIndexTargets,
+    PromptInsertion,
+    PromptReplacement,
+    apply_text_matches,
+    apply_token_matches,
+    find_mm_placeholders,
+    iter_token_matches,
+    replace_token_matches,
+)
+
 # yapf: enable
 from vllm.multimodal.profiling import MultiModalProfiler
 from vllm.transformers_utils.tokenizer import AnyTokenizer
diff --git a/tests/multimodal/test_registry.py b/tests/multimodal/test_registry.py
index 01fbe9a52b77..3b01bda7f54c 100644
--- a/tests/multimodal/test_registry.py
+++ b/tests/multimodal/test_registry.py
@@ -19,22 +19,16 @@
     [
         ("Qwen/Qwen2-0.5B-Instruct", {}, False),
         ("Qwen/Qwen2.5-VL-3B-Instruct", {}, True),
-        ("Qwen/Qwen2.5-VL-3B-Instruct", {
-            "image": 0,
-            "video": 0
-        }, False),
-        ("Qwen/Qwen2.5-VL-3B-Instruct", {
-            "image": 0
-        }, True),
+        ("Qwen/Qwen2.5-VL-3B-Instruct", {"image": 0, "video": 0}, False),
+        ("Qwen/Qwen2.5-VL-3B-Instruct", {"image": 0}, True),
     ],
 )
 @pytest.mark.core_model
 def test_supports_multimodal_inputs(model_id, limit_mm_per_prompt, expected):
-    """Test supports_multimodal_inputs returns correct boolean for various 
+    """Test supports_multimodal_inputs returns correct boolean for various
     configs."""
     ctx = build_model_context(
         model_id,
         limit_mm_per_prompt=limit_mm_per_prompt,
     )
-    assert MULTIMODAL_REGISTRY.supports_multimodal_inputs(
-        ctx.model_config) is expected
\ No newline at end of file
+    assert MULTIMODAL_REGISTRY.supports_multimodal_inputs(ctx.model_config) is expected
diff --git a/tests/multimodal/test_utils.py b/tests/multimodal/test_utils.py
index d1a7882a4c37..81b332059def 100644
--- a/tests/multimodal/test_utils.py
+++ b/tests/multimodal/test_utils.py
@@ -30,7 +30,6 @@
 
 @pytest.fixture(scope="module")
 def url_images(local_asset_server) -> dict[str, Image.Image]:
-
     return {
         image_url: local_asset_server.get_image_asset(image_url)
         for image_url in TEST_IMAGE_ASSETS
@@ -39,10 +38,10 @@ def url_images(local_asset_server) -> dict[str, Image.Image]:
 
 def get_supported_suffixes() -> tuple[str, ...]:
     # We should at least test the file types mentioned in GPT-4 with Vision
-    OPENAI_SUPPORTED_SUFFIXES = ('.png', '.jpeg', '.jpg', '.webp', '.gif')
+    OPENAI_SUPPORTED_SUFFIXES = (".png", ".jpeg", ".jpg", ".webp", ".gif")
 
     # Additional file types that are supported by us
-    EXTRA_SUPPORTED_SUFFIXES = ('.bmp', '.tiff')
+    EXTRA_SUPPORTED_SUFFIXES = (".bmp", ".tiff")
 
     return OPENAI_SUPPORTED_SUFFIXES + EXTRA_SUPPORTED_SUFFIXES
 
@@ -64,14 +63,16 @@ async def test_fetch_image_http(image_url: str):
 @pytest.mark.asyncio
 @pytest.mark.parametrize("raw_image_url", TEST_IMAGE_ASSETS)
 @pytest.mark.parametrize("suffix", get_supported_suffixes())
-async def test_fetch_image_base64(url_images: dict[str, Image.Image],
-                                  raw_image_url: str, suffix: str):
+async def test_fetch_image_base64(
+    url_images: dict[str, Image.Image], raw_image_url: str, suffix: str
+):
     connector = MediaConnector(
         # Domain restriction should not apply to data URLs.
         allowed_media_domains=[
             "www.bogotobogo.com",
             "github.com",
-        ])
+        ]
+    )
     url_image = url_images[raw_image_url]
 
     try:
@@ -80,14 +81,14 @@ async def test_fetch_image_base64(url_images: dict[str, Image.Image],
         try:
             mime_type = mimetypes.types_map[suffix]
         except KeyError:
-            pytest.skip('No MIME type')
+            pytest.skip("No MIME type")
 
     with NamedTemporaryFile(suffix=suffix) as f:
         try:
             url_image.save(f.name)
         except Exception as e:
-            if e.args[0] == 'cannot write mode RGBA as JPEG':
-                pytest.skip('Conversion not supported')
+            if e.args[0] == "cannot write mode RGBA as JPEG":
+                pytest.skip("Conversion not supported")
 
             raise
 
@@ -113,30 +114,36 @@ async def test_fetch_image_local_files(image_url: str):
         local_connector = MediaConnector(allowed_local_media_path=temp_dir)
 
         origin_image = connector.fetch_image(image_url)
-        origin_image.save(os.path.join(temp_dir, os.path.basename(image_url)),
-                          quality=100,
-                          icc_profile=origin_image.info.get('icc_profile'))
+        origin_image.save(
+            os.path.join(temp_dir, os.path.basename(image_url)),
+            quality=100,
+            icc_profile=origin_image.info.get("icc_profile"),
+        )
 
         image_async = await local_connector.fetch_image_async(
-            f"file://{temp_dir}/{os.path.basename(image_url)}")
+            f"file://{temp_dir}/{os.path.basename(image_url)}"
+        )
         image_sync = local_connector.fetch_image(
-            f"file://{temp_dir}/{os.path.basename(image_url)}")
+            f"file://{temp_dir}/{os.path.basename(image_url)}"
+        )
         # Check that the images are equal
         assert not ImageChops.difference(image_sync, image_async).getbbox()
 
         with pytest.raises(ValueError, match="must be a subpath"):
             await local_connector.fetch_image_async(
-                f"file://{temp_dir}/../{os.path.basename(image_url)}")
+                f"file://{temp_dir}/../{os.path.basename(image_url)}"
+            )
         with pytest.raises(RuntimeError, match="Cannot load local files"):
             await connector.fetch_image_async(
-                f"file://{temp_dir}/../{os.path.basename(image_url)}")
+                f"file://{temp_dir}/../{os.path.basename(image_url)}"
+            )
 
         with pytest.raises(ValueError, match="must be a subpath"):
             local_connector.fetch_image(
-                f"file://{temp_dir}/../{os.path.basename(image_url)}")
+                f"file://{temp_dir}/../{os.path.basename(image_url)}"
+            )
         with pytest.raises(RuntimeError, match="Cannot load local files"):
-            connector.fetch_image(
-                f"file://{temp_dir}/../{os.path.basename(image_url)}")
+            connector.fetch_image(f"file://{temp_dir}/../{os.path.basename(image_url)}")
 
 
 @pytest.mark.asyncio
@@ -149,18 +156,19 @@ async def test_fetch_image_local_files_with_space_in_name(image_url: str):
 
         origin_image = connector.fetch_image(image_url)
         filename = "file name with space.jpg"
-        origin_image.save(os.path.join(temp_dir, filename),
-                          quality=100,
-                          icc_profile=origin_image.info.get('icc_profile'))
+        origin_image.save(
+            os.path.join(temp_dir, filename),
+            quality=100,
+            icc_profile=origin_image.info.get("icc_profile"),
+        )
 
         try:
             image_async = await local_connector.fetch_image_async(
-                f"file://{temp_dir}/{filename}")
-            image_sync = local_connector.fetch_image(
-                f"file://{temp_dir}/{filename}")
+                f"file://{temp_dir}/{filename}"
+            )
+            image_sync = local_connector.fetch_image(f"file://{temp_dir}/{filename}")
         except FileNotFoundError as e:
-            pytest.fail(
-                "Failed to fetch image with space in name: {}".format(e))
+            pytest.fail("Failed to fetch image with space in name: {}".format(e))
         # Check that the images are equal
         assert not ImageChops.difference(image_sync, image_async).getbbox()
 
@@ -183,9 +191,12 @@ async def test_fetch_image_error_conversion():
 @pytest.mark.parametrize("num_frames", [-1, 32, 1800])
 async def test_fetch_video_http(video_url: str, num_frames: int):
     connector = MediaConnector(
-        media_io_kwargs={"video": {
-            "num_frames": num_frames,
-        }})
+        media_io_kwargs={
+            "video": {
+                "num_frames": num_frames,
+            }
+        }
+    )
 
     video_sync, metadata_sync = connector.fetch_video(video_url)
     video_async, metadata_async = await connector.fetch_video_async(video_url)
@@ -198,8 +209,11 @@ async def test_fetch_video_http(video_url: str, num_frames: int):
 @pytest.mark.parametrize("max_duration", [1, 60, 1800])
 @pytest.mark.parametrize("requested_fps", [2, 24])
 async def test_fetch_video_http_with_dynamic_loader(
-        video_url: str, max_duration: int, requested_fps: int,
-        monkeypatch: pytest.MonkeyPatch):
+    video_url: str,
+    max_duration: int,
+    requested_fps: int,
+    monkeypatch: pytest.MonkeyPatch,
+):
     with monkeypatch.context() as m:
         m.setenv("VLLM_VIDEO_LOADER_BACKEND", "opencv_dynamic")
         connector = MediaConnector(
@@ -208,11 +222,11 @@ async def test_fetch_video_http_with_dynamic_loader(
                     "max_duration": max_duration,
                     "requested_fps": requested_fps,
                 }
-            })
+            }
+        )
 
         video_sync, metadata_sync = connector.fetch_video(video_url)
-        video_async, metadata_async = await connector.fetch_video_async(
-            video_url)
+        video_async, metadata_async = await connector.fetch_video_async(video_url)
 
         assert np.array_equal(video_sync, video_async)
         assert metadata_sync == metadata_async
diff --git a/tests/multimodal/test_video.py b/tests/multimodal/test_video.py
index 1bdbb5a10a6d..6572616769a9 100644
--- a/tests/multimodal/test_video.py
+++ b/tests/multimodal/test_video.py
@@ -12,8 +12,7 @@
 from vllm.assets.base import get_vllm_public_assets
 from vllm.assets.video import video_to_ndarrays, video_to_pil_images_list
 from vllm.multimodal.image import ImageMediaIO
-from vllm.multimodal.video import (VIDEO_LOADER_REGISTRY, VideoLoader,
-                                   VideoMediaIO)
+from vllm.multimodal.video import VIDEO_LOADER_REGISTRY, VideoLoader, VideoMediaIO
 
 from .utils import cosine_similarity, create_video_from_image, normalize_image
 
@@ -26,7 +25,6 @@
 
 @VIDEO_LOADER_REGISTRY.register("test_video_loader_1")
 class TestVideoLoader1(VideoLoader):
-
     @classmethod
     def load_bytes(cls, data: bytes, num_frames: int = -1) -> npt.NDArray:
         return FAKE_OUTPUT_1
@@ -34,7 +32,6 @@ def load_bytes(cls, data: bytes, num_frames: int = -1) -> npt.NDArray:
 
 @VIDEO_LOADER_REGISTRY.register("test_video_loader_2")
 class TestVideoLoader2(VideoLoader):
-
     @classmethod
     def load_bytes(cls, data: bytes, num_frames: int = -1) -> npt.NDArray:
         return FAKE_OUTPUT_2
@@ -57,13 +54,10 @@ def test_video_loader_type_doesnt_exist():
 
 @VIDEO_LOADER_REGISTRY.register("assert_10_frames_1_fps")
 class Assert10Frames1FPSVideoLoader(VideoLoader):
-
     @classmethod
-    def load_bytes(cls,
-                   data: bytes,
-                   num_frames: int = -1,
-                   fps: float = -1.0,
-                   **kwargs) -> npt.NDArray:
+    def load_bytes(
+        cls, data: bytes, num_frames: int = -1, fps: float = -1.0, **kwargs
+    ) -> npt.NDArray:
         assert num_frames == 10, "bad num_frames"
         assert fps == 1.0, "bad fps"
         return FAKE_OUTPUT_2
@@ -79,11 +73,8 @@ def test_video_media_io_kwargs(monkeypatch: pytest.MonkeyPatch):
         _ = videoio.load_bytes(b"test")
 
         videoio = VideoMediaIO(
-            imageio, **{
-                "num_frames": 10,
-                "fps": 1.0,
-                "not_used": "not_used"
-            })
+            imageio, **{"num_frames": 10, "fps": 1.0, "not_used": "not_used"}
+        )
         _ = videoio.load_bytes(b"test")
 
         with pytest.raises(AssertionError, match="bad num_frames"):
@@ -106,8 +97,9 @@ def test_opencv_video_io_colorspace(is_color: bool, fourcc: str, ext: str):
     Test all functions that use OpenCV for video I/O return RGB format.
     Both RGB and grayscale videos are tested.
     """
-    image_path = get_vllm_public_assets(filename="stop_sign.jpg",
-                                        s3_prefix="vision_model_images")
+    image_path = get_vllm_public_assets(
+        filename="stop_sign.jpg", s3_prefix="vision_model_images"
+    )
     image = Image.open(image_path)
     with tempfile.TemporaryDirectory() as tmpdir:
         if not is_color:
@@ -127,21 +119,24 @@ def test_opencv_video_io_colorspace(is_color: bool, fourcc: str, ext: str):
 
         frames = video_to_ndarrays(video_path)
         for frame in frames:
-            sim = cosine_similarity(normalize_image(np.array(frame)),
-                                    normalize_image(np.array(image)))
+            sim = cosine_similarity(
+                normalize_image(np.array(frame)), normalize_image(np.array(image))
+            )
             assert np.sum(np.isnan(sim)) / sim.size < 0.001
             assert np.nanmean(sim) > 0.99
 
         pil_frames = video_to_pil_images_list(video_path)
         for frame in pil_frames:
-            sim = cosine_similarity(normalize_image(np.array(frame)),
-                                    normalize_image(np.array(image)))
+            sim = cosine_similarity(
+                normalize_image(np.array(frame)), normalize_image(np.array(image))
+            )
             assert np.sum(np.isnan(sim)) / sim.size < 0.001
             assert np.nanmean(sim) > 0.99
 
         io_frames, _ = VideoMediaIO(ImageMediaIO()).load_file(Path(video_path))
         for frame in io_frames:
-            sim = cosine_similarity(normalize_image(np.array(frame)),
-                                    normalize_image(np.array(image)))
+            sim = cosine_similarity(
+                normalize_image(np.array(frame)), normalize_image(np.array(image))
+            )
             assert np.sum(np.isnan(sim)) / sim.size < 0.001
             assert np.nanmean(sim) > 0.99
diff --git a/tests/multimodal/utils.py b/tests/multimodal/utils.py
index 9a58292f9f4a..485bde939f69 100644
--- a/tests/multimodal/utils.py
+++ b/tests/multimodal/utils.py
@@ -8,7 +8,7 @@
 
 
 def random_image(rng: np.random.RandomState, min_wh: int, max_wh: int):
-    w, h = rng.randint(min_wh, max_wh, size=(2, ))
+    w, h = rng.randint(min_wh, max_wh, size=(2,))
     arr = rng.randint(0, 255, size=(w, h, 3), dtype=np.uint8)
     return Image.fromarray(arr)
 
@@ -21,7 +21,7 @@ def random_video(
     max_wh: int,
 ):
     num_frames = rng.randint(min_frames, max_frames)
-    w, h = rng.randint(min_wh, max_wh, size=(2, ))
+    w, h = rng.randint(min_wh, max_wh, size=(2,))
     return rng.randint(0, 255, size=(num_frames, w, h, 3), dtype=np.uint8)
 
 
@@ -66,14 +66,13 @@ def create_video_from_image(
     return video_path
 
 
-def cosine_similarity(A: npt.NDArray,
-                      B: npt.NDArray,
-                      axis: int = -1) -> npt.NDArray:
+def cosine_similarity(A: npt.NDArray, B: npt.NDArray, axis: int = -1) -> npt.NDArray:
     """Compute cosine similarity between two vectors."""
-    return (np.sum(A * B, axis=axis) /
-            (np.linalg.norm(A, axis=axis) * np.linalg.norm(B, axis=axis)))
+    return np.sum(A * B, axis=axis) / (
+        np.linalg.norm(A, axis=axis) * np.linalg.norm(B, axis=axis)
+    )
 
 
 def normalize_image(image: npt.NDArray) -> npt.NDArray:
     """Normalize image to [0, 1] range."""
-    return image.astype(np.float32) / 255.0
\ No newline at end of file
+    return image.astype(np.float32) / 255.0
diff --git a/tests/plugins/lora_resolvers/test_filesystem_resolver.py b/tests/plugins/lora_resolvers/test_filesystem_resolver.py
index 3e2c2577da66..cd98efdd1390 100644
--- a/tests/plugins/lora_resolvers/test_filesystem_resolver.py
+++ b/tests/plugins/lora_resolvers/test_filesystem_resolver.py
@@ -13,11 +13,10 @@
 PA_NAME = "swapnilbp/llama_tweet_ptune"
 
 
-@pytest.fixture(scope='module')
+@pytest.fixture(scope="module")
 def adapter_cache(request, tmpdir_factory):
     # Create dir that mimics the structure of the adapter cache
-    adapter_cache = tmpdir_factory.mktemp(
-        request.module.__name__) / "adapter_cache"
+    adapter_cache = tmpdir_factory.mktemp(request.module.__name__) / "adapter_cache"
     return adapter_cache
 
 
diff --git a/tests/plugins/prithvi_io_processor_plugin/prithvi_io_processor/prithvi_processor.py b/tests/plugins/prithvi_io_processor_plugin/prithvi_io_processor/prithvi_processor.py
index 42874f0398f0..1d8a7d204046 100644
--- a/tests/plugins/prithvi_io_processor_plugin/prithvi_io_processor/prithvi_processor.py
+++ b/tests/plugins/prithvi_io_processor_plugin/prithvi_io_processor/prithvi_processor.py
@@ -20,14 +20,15 @@
 from terratorch.datamodules import Sen1Floods11NonGeoDataModule
 
 from vllm.config import VllmConfig
-from vllm.entrypoints.openai.protocol import (IOProcessorRequest,
-                                              IOProcessorResponse)
+from vllm.entrypoints.openai.protocol import IOProcessorRequest, IOProcessorResponse
 from vllm.inputs.data import PromptType
 from vllm.logger import init_logger
 from vllm.outputs import PoolingRequestOutput
-from vllm.plugins.io_processors.interface import (IOProcessor,
-                                                  IOProcessorInput,
-                                                  IOProcessorOutput)
+from vllm.plugins.io_processors.interface import (
+    IOProcessor,
+    IOProcessorInput,
+    IOProcessorOutput,
+)
 
 from .types import DataModuleConfig, ImagePrompt, ImageRequestOutput
 
@@ -42,35 +43,25 @@
 
 datamodule_config: DataModuleConfig = {
     "bands": ["BLUE", "GREEN", "RED", "NIR_NARROW", "SWIR_1", "SWIR_2"],
-    "batch_size":
-    16,
-    "constant_scale":
-    0.0001,
-    "data_root":
-    "/dccstor/geofm-finetuning/datasets/sen1floods11",
-    "drop_last":
-    True,
-    "no_data_replace":
-    0.0,
-    "no_label_replace":
-    -1,
-    "num_workers":
-    8,
+    "batch_size": 16,
+    "constant_scale": 0.0001,
+    "data_root": "/dccstor/geofm-finetuning/datasets/sen1floods11",
+    "drop_last": True,
+    "no_data_replace": 0.0,
+    "no_label_replace": -1,
+    "num_workers": 8,
     "test_transform": [
-        albumentations.Resize(always_apply=False,
-                              height=448,
-                              interpolation=1,
-                              p=1,
-                              width=448),
-        albumentations.pytorch.ToTensorV2(transpose_mask=False,
-                                          always_apply=True,
-                                          p=1.0),
+        albumentations.Resize(
+            always_apply=False, height=448, interpolation=1, p=1, width=448
+        ),
+        albumentations.pytorch.ToTensorV2(
+            transpose_mask=False, always_apply=True, p=1.0
+        ),
     ],
 }
 
 
-def save_geotiff(image: torch.Tensor, meta: dict,
-                 out_format: str) -> str | bytes:
+def save_geotiff(image: torch.Tensor, meta: dict, out_format: str) -> str | bytes:
     """Save multi-band image in Geotiff file.
 
     Args:
@@ -219,8 +210,11 @@ def load_image(
                 if len(julian_day) == 3:
                     julian_day = int(julian_day)
                 else:
-                    julian_day = (datetime.datetime.strptime(
-                        julian_day, "%m%d").timetuple().tm_yday)
+                    julian_day = (
+                        datetime.datetime.strptime(julian_day, "%m%d")
+                        .timetuple()
+                        .tm_yday
+                    )
                 temporal_coords.append([year, julian_day])
         except Exception:
             logger.exception("Could not extract timestamp for %s", file)
@@ -233,11 +227,9 @@ def load_image(
 
 
 class PrithviMultimodalDataProcessor(IOProcessor):
-
     indices = [0, 1, 2, 3, 4, 5]
 
     def __init__(self, vllm_config: VllmConfig):
-
         super().__init__(vllm_config)
 
         self.datamodule = Sen1Floods11NonGeoDataModule(
@@ -264,8 +256,7 @@ def parse_request(self, request: Any) -> IOProcessorInput:
             return image_prompt
         if isinstance(request, IOProcessorRequest):
             if not hasattr(request, "data"):
-                raise ValueError(
-                    "missing 'data' field in OpenAIBaseModel Request")
+                raise ValueError("missing 'data' field in OpenAIBaseModel Request")
 
             request_data = request.data
 
@@ -277,7 +268,8 @@ def parse_request(self, request: Any) -> IOProcessorInput:
         raise ValueError("Unable to parse request")
 
     def output_to_response(
-            self, plugin_output: IOProcessorOutput) -> IOProcessorResponse:
+        self, plugin_output: IOProcessorOutput
+    ) -> IOProcessorResponse:
         return IOProcessorResponse(
             request_id=plugin_output.request_id,
             data=plugin_output,
@@ -289,7 +281,6 @@ def pre_process(
         request_id: Optional[str] = None,
         **kwargs,
     ) -> Union[PromptType, Sequence[PromptType]]:
-
         image_data = dict(prompt)
 
         if request_id:
@@ -309,10 +300,8 @@ def pre_process(
             input_data = input_data / 10000  # Convert to range 0-1
 
         self.original_h, self.original_w = input_data.shape[-2:]
-        pad_h = (self.img_size -
-                 (self.original_h % self.img_size)) % self.img_size
-        pad_w = (self.img_size -
-                 (self.original_w % self.img_size)) % self.img_size
+        pad_h = (self.img_size - (self.original_h % self.img_size)) % self.img_size
+        pad_w = (self.img_size - (self.original_w % self.img_size)) % self.img_size
         input_data = np.pad(
             input_data,
             ((0, 0), (0, 0), (0, 0), (0, pad_h), (0, pad_w)),
@@ -320,9 +309,9 @@ def pre_process(
         )
 
         batch = torch.tensor(input_data)
-        windows = batch.unfold(3, self.img_size,
-                               self.img_size).unfold(4, self.img_size,
-                                                     self.img_size)
+        windows = batch.unfold(3, self.img_size, self.img_size).unfold(
+            4, self.img_size, self.img_size
+        )
         self.h1, self.w1 = windows.shape[3:5]
         windows = rearrange(
             windows,
@@ -332,8 +321,11 @@ def pre_process(
         )
 
         # Split into batches if number of windows > batch_size
-        num_batches = (windows.shape[0] // self.batch_size
-                       if windows.shape[0] > self.batch_size else 1)
+        num_batches = (
+            windows.shape[0] // self.batch_size
+            if windows.shape[0] > self.batch_size
+            else 1
+        )
         windows = torch.tensor_split(windows, num_batches, dim=0)
 
         if temporal_coords:
@@ -349,15 +341,18 @@ def pre_process(
         for window in windows:
             # Apply standardization
             window = self.datamodule.test_transform(
-                image=window.squeeze().numpy().transpose(1, 2, 0))
+                image=window.squeeze().numpy().transpose(1, 2, 0)
+            )
             window = self.datamodule.aug(window)["image"]
-            prompts.append({
-                "prompt_token_ids": [1],
-                "multi_modal_data": {
-                    "pixel_values": window.to(torch.float16)[0],
-                    "location_coords": location_coords.to(torch.float16),
-                },
-            })
+            prompts.append(
+                {
+                    "prompt_token_ids": [1],
+                    "multi_modal_data": {
+                        "pixel_values": window.to(torch.float16)[0],
+                        "location_coords": location_coords.to(torch.float16),
+                    },
+                }
+            )
 
         return prompts
 
@@ -367,7 +362,6 @@ def post_process(
         request_id: Optional[str] = None,
         **kwargs,
     ) -> IOProcessorOutput:
-
         pred_imgs_list = []
 
         if request_id and (request_id in self.requests_cache):
@@ -399,7 +393,7 @@ def post_process(
         )
 
         # Cut padded area back to original size
-        pred_imgs = pred_imgs[..., :self.original_h, :self.original_w]
+        pred_imgs = pred_imgs[..., : self.original_h, : self.original_w]
 
         # Squeeze (batch size 1)
         pred_imgs = pred_imgs[0]
@@ -407,10 +401,10 @@ def post_process(
         if not self.meta_data:
             raise ValueError("No metadata available for the current task")
         self.meta_data.update(count=1, dtype="uint8", compress="lzw", nodata=0)
-        out_data = save_geotiff(_convert_np_uint8(pred_imgs), self.meta_data,
-                                out_format)
+        out_data = save_geotiff(
+            _convert_np_uint8(pred_imgs), self.meta_data, out_format
+        )
 
-        return ImageRequestOutput(type=out_format,
-                                  format="tiff",
-                                  data=out_data,
-                                  request_id=request_id)
+        return ImageRequestOutput(
+            type=out_format, format="tiff", data=out_data, request_id=request_id
+        )
diff --git a/tests/plugins/prithvi_io_processor_plugin/prithvi_io_processor/types.py b/tests/plugins/prithvi_io_processor_plugin/prithvi_io_processor/types.py
index d4c6628211fb..21a5c3754c36 100644
--- a/tests/plugins/prithvi_io_processor_plugin/prithvi_io_processor/types.py
+++ b/tests/plugins/prithvi_io_processor_plugin/prithvi_io_processor/types.py
@@ -16,12 +16,10 @@ class DataModuleConfig(TypedDict):
     no_data_replace: float
     no_label_replace: int
     num_workers: int
-    test_transform: list[
-        albumentations.core.transforms_interface.BasicTransform]
+    test_transform: list[albumentations.core.transforms_interface.BasicTransform]
 
 
 class ImagePrompt(BaseModel):
-
     data_format: Literal["b64_json", "bytes", "url", "path"]
     """
     This is the data type for the input image
@@ -45,7 +43,7 @@ class ImagePrompt(BaseModel):
 
 class ImageRequestOutput(BaseModel):
     """
-    The output data of an image request to vLLM. 
+    The output data of an image request to vLLM.
 
     Args:
         type (str): The data content type [path, object]
diff --git a/tests/plugins/vllm_add_dummy_model/setup.py b/tests/plugins/vllm_add_dummy_model/setup.py
index 6307bb63897a..eeffac5d3edd 100644
--- a/tests/plugins/vllm_add_dummy_model/setup.py
+++ b/tests/plugins/vllm_add_dummy_model/setup.py
@@ -3,10 +3,11 @@
 
 from setuptools import setup
 
-setup(name='vllm_add_dummy_model',
-      version='0.1',
-      packages=['vllm_add_dummy_model'],
-      entry_points={
-          'vllm.general_plugins':
-          ["register_dummy_model = vllm_add_dummy_model:register"]
-      })
+setup(
+    name="vllm_add_dummy_model",
+    version="0.1",
+    packages=["vllm_add_dummy_model"],
+    entry_points={
+        "vllm.general_plugins": ["register_dummy_model = vllm_add_dummy_model:register"]
+    },
+)
diff --git a/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/__init__.py b/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/__init__.py
index b2085b01c45c..457187e4b492 100644
--- a/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/__init__.py
+++ b/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/__init__.py
@@ -19,5 +19,4 @@ def register():
         )
 
     if "MyLlava" not in ModelRegistry.get_supported_archs():
-        ModelRegistry.register_model("MyLlava",
-                                     "vllm_add_dummy_model.my_llava:MyLlava")
+        ModelRegistry.register_model("MyLlava", "vllm_add_dummy_model.my_llava:MyLlava")
diff --git a/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/my_gemma_embedding.py b/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/my_gemma_embedding.py
index fc654f20fff2..a22a10eab47d 100644
--- a/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/my_gemma_embedding.py
+++ b/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/my_gemma_embedding.py
@@ -15,7 +15,6 @@
 
 
 class MyGemma2Embedding(nn.Module):
-
     is_pooling_model = True
 
     hf_to_vllm_mapper = WeightsMapper(orig_to_new_prefix={"model.": ""})
@@ -23,19 +22,23 @@ class MyGemma2Embedding(nn.Module):
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
-        self.model = Gemma2Model(vllm_config=vllm_config,
-                                 prefix=maybe_prefix(prefix, "model"))
+        self.model = Gemma2Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
         pooler_config = vllm_config.model_config.pooler_config
         assert pooler_config is not None
 
-        self.pooler = DispatchPooler({
-            "encode": Pooler.for_encode(pooler_config),
-            "embed": Pooler.for_embed(pooler_config),
-        })
+        self.pooler = DispatchPooler(
+            {
+                "encode": Pooler.for_encode(pooler_config),
+                "embed": Pooler.for_embed(pooler_config),
+            }
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def forward(
         self,
@@ -58,8 +61,8 @@ def forward(
         return torch.zeros_like(hidden_states)
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
-
         weights = self.hf_to_vllm_mapper.apply(weights)
-        weights = ((name, data) for name, data in weights
-                   if not name.startswith("lm_head."))
+        weights = (
+            (name, data) for name, data in weights if not name.startswith("lm_head.")
+        )
         return self.model.load_weights(weights)
diff --git a/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/my_llava.py b/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/my_llava.py
index b431ad1ed092..9e6f5c3a77e3 100644
--- a/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/my_llava.py
+++ b/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/my_llava.py
@@ -5,20 +5,22 @@
 
 import torch
 
-from vllm.model_executor.models.llava import (LlavaDummyInputsBuilder,
-                                              LlavaForConditionalGeneration,
-                                              LlavaMultiModalProcessor,
-                                              LlavaProcessingInfo)
+from vllm.model_executor.models.llava import (
+    LlavaDummyInputsBuilder,
+    LlavaForConditionalGeneration,
+    LlavaMultiModalProcessor,
+    LlavaProcessingInfo,
+)
 from vllm.multimodal import MULTIMODAL_REGISTRY
 
 
-@MULTIMODAL_REGISTRY.register_processor(LlavaMultiModalProcessor,
-                                        info=LlavaProcessingInfo,
-                                        dummy_inputs=LlavaDummyInputsBuilder)
+@MULTIMODAL_REGISTRY.register_processor(
+    LlavaMultiModalProcessor,
+    info=LlavaProcessingInfo,
+    dummy_inputs=LlavaDummyInputsBuilder,
+)
 class MyLlava(LlavaForConditionalGeneration):
-
-    def compute_logits(self,
-                       hidden_states: torch.Tensor) -> Optional[torch.Tensor]:
+    def compute_logits(self, hidden_states: torch.Tensor) -> Optional[torch.Tensor]:
         # this dummy model always predicts the first token
         logits = super().compute_logits(hidden_states)
         if logits is not None:
diff --git a/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/my_opt.py b/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/my_opt.py
index a6fafff98e9c..c02299f5d44f 100644
--- a/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/my_opt.py
+++ b/tests/plugins/vllm_add_dummy_model/vllm_add_dummy_model/my_opt.py
@@ -9,9 +9,7 @@
 
 
 class MyOPTForCausalLM(OPTForCausalLM):
-
-    def compute_logits(self,
-                       hidden_states: torch.Tensor) -> Optional[torch.Tensor]:
+    def compute_logits(self, hidden_states: torch.Tensor) -> Optional[torch.Tensor]:
         # this dummy model always predicts the first token
         logits = super().compute_logits(hidden_states)
         if logits is not None:
diff --git a/tests/plugins/vllm_add_dummy_platform/setup.py b/tests/plugins/vllm_add_dummy_platform/setup.py
index a531826628cd..b976dddb7fb5 100644
--- a/tests/plugins/vllm_add_dummy_platform/setup.py
+++ b/tests/plugins/vllm_add_dummy_platform/setup.py
@@ -4,13 +4,15 @@
 from setuptools import setup
 
 setup(
-    name='vllm_add_dummy_platform',
-    version='0.1',
-    packages=['vllm_add_dummy_platform'],
+    name="vllm_add_dummy_platform",
+    version="0.1",
+    packages=["vllm_add_dummy_platform"],
     entry_points={
-        'vllm.platform_plugins': [
+        "vllm.platform_plugins": [
             "dummy_platform_plugin = vllm_add_dummy_platform:dummy_platform_plugin"  # noqa
         ],
-        "vllm.general_plugins":
-        ["dummy_custom_ops = vllm_add_dummy_platform:register_ops"],
-    })
+        "vllm.general_plugins": [
+            "dummy_custom_ops = vllm_add_dummy_platform:register_ops"
+        ],
+    },
+)
diff --git a/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_attention_backend.py b/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_attention_backend.py
index e38fb2fbf934..f2d516f52b8b 100644
--- a/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_attention_backend.py
+++ b/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_attention_backend.py
@@ -1,12 +1,10 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from vllm.attention.backends.placeholder_attn import (
-    PlaceholderAttentionBackend)
+from vllm.attention.backends.placeholder_attn import PlaceholderAttentionBackend
 
 
 class DummyAttentionBackend(PlaceholderAttentionBackend):
-
     @staticmethod
     def get_name() -> str:
         return "Dummy_Backend"
diff --git a/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_custom_ops.py b/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_custom_ops.py
index 1fcc3fc66617..b73028574526 100644
--- a/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_custom_ops.py
+++ b/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_custom_ops.py
@@ -15,6 +15,5 @@ def __init__(self, *args, **kwargs):
         super().__init__(*args, **kwargs)
         self.addition_config = True
 
-    def forward_oot(self, *args,
-                    **kwargs) -> tuple[torch.Tensor, torch.Tensor]:
+    def forward_oot(self, *args, **kwargs) -> tuple[torch.Tensor, torch.Tensor]:
         return super().forward_oot(*args, **kwargs)
diff --git a/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_platform.py b/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_platform.py
index 30d721304b5c..90cb461a6caf 100644
--- a/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_platform.py
+++ b/tests/plugins/vllm_add_dummy_platform/vllm_add_dummy_platform/dummy_platform.py
@@ -24,7 +24,16 @@ def check_and_update_config(cls, vllm_config: VllmConfig) -> None:
             # Activate custom ops for v1.
             compilation_config.custom_ops = ["all"]
 
-    def get_attn_backend_cls(self, backend_name, head_size, dtype,
-                             kv_cache_dtype, block_size, use_v1, use_mla,
-                             has_sink, use_sparse):
+    def get_attn_backend_cls(
+        self,
+        backend_name,
+        head_size,
+        dtype,
+        kv_cache_dtype,
+        block_size,
+        use_v1,
+        use_mla,
+        has_sink,
+        use_sparse,
+    ):
         return "vllm_add_dummy_platform.dummy_attention_backend.DummyAttentionBackend"  # noqa E501
diff --git a/tests/plugins_tests/test_io_processor_plugins.py b/tests/plugins_tests/test_io_processor_plugins.py
index 3567a701a3af..912b32755e80 100644
--- a/tests/plugins_tests/test_io_processor_plugins.py
+++ b/tests/plugins_tests/test_io_processor_plugins.py
@@ -50,7 +50,6 @@ async def test_prithvi_mae_plugin_online(
     server: RemoteOpenAIServer,
     model_name: str,
 ):
-
     request_payload_url = {
         "data": {
             "data": image_url,
@@ -60,7 +59,7 @@ async def test_prithvi_mae_plugin_online(
         },
         "priority": 0,
         "model": model_name,
-        "softmax": False
+        "softmax": False,
     }
 
     ret = requests.post(
@@ -77,8 +76,8 @@ async def test_prithvi_mae_plugin_online(
     plugin_data = parsed_response.data
 
     assert all(
-        plugin_data.get(attr)
-        for attr in ["type", "format", "data", "request_id"])
+        plugin_data.get(attr) for attr in ["type", "format", "data", "request_id"]
+    )
 
     # We just check that the output is a valid base64 string.
     # Raises an exception and fails the test if the string is corrupted.
@@ -87,7 +86,6 @@ async def test_prithvi_mae_plugin_online(
 
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 def test_prithvi_mae_plugin_offline(vllm_runner, model_name: str):
-
     img_prompt = dict(
         data=image_url,
         data_format="url",
@@ -98,16 +96,16 @@ def test_prithvi_mae_plugin_offline(vllm_runner, model_name: str):
     pooling_params = PoolingParams(task="encode", softmax=False)
 
     with vllm_runner(
-            model_name,
-            runner="pooling",
-            skip_tokenizer_init=True,
-            trust_remote_code=True,
-            enforce_eager=True,
-            # Limit the maximum number of parallel requests
-            # to avoid the model going OOM in CI.
-            max_num_seqs=1,
-            model_impl="terratorch",
-            io_processor_plugin="prithvi_to_tiff",
+        model_name,
+        runner="pooling",
+        skip_tokenizer_init=True,
+        trust_remote_code=True,
+        enforce_eager=True,
+        # Limit the maximum number of parallel requests
+        # to avoid the model going OOM in CI.
+        max_num_seqs=1,
+        model_impl="terratorch",
+        io_processor_plugin="prithvi_to_tiff",
     ) as llm_runner:
         pooler_output = llm_runner.get_llm().encode(
             img_prompt,
@@ -117,8 +115,8 @@ def test_prithvi_mae_plugin_offline(vllm_runner, model_name: str):
 
     # verify the output is formatted as expected for this plugin
     assert all(
-        hasattr(output, attr)
-        for attr in ["type", "format", "data", "request_id"])
+        hasattr(output, attr) for attr in ["type", "format", "data", "request_id"]
+    )
 
     # We just check that the output is a valid base64 string.
     # Raises an exception and fails the test if the string is corrupted.
diff --git a/tests/plugins_tests/test_platform_plugins.py b/tests/plugins_tests/test_platform_plugins.py
index 1d7e4475011d..4dace171a8d3 100644
--- a/tests/plugins_tests/test_platform_plugins.py
+++ b/tests/plugins_tests/test_platform_plugins.py
@@ -10,29 +10,38 @@
 def test_platform_plugins():
     # simulate workload by running an example
     import runpy
+
     current_file = __file__
     import os
+
     example_file = os.path.join(
         os.path.dirname(os.path.dirname(os.path.dirname(current_file))),
-        "examples", "offline_inference/basic/basic.py")
+        "examples",
+        "offline_inference/basic/basic.py",
+    )
     runpy.run_path(example_file)
 
     # check if the plugin is loaded correctly
     from vllm.platforms import _init_trace, current_platform
+
     assert current_platform.device_name == "DummyDevice", (
         f"Expected DummyDevice, got {current_platform.device_name}, "
         "possibly because current_platform is imported before the plugin"
-        f" is loaded. The first import:\n{_init_trace}")
+        f" is loaded. The first import:\n{_init_trace}"
+    )
 
 
 def test_oot_custom_op(monkeypatch: pytest.MonkeyPatch):
     # simulate workload by running an example
     load_general_plugins()
     from vllm.model_executor.layers.rotary_embedding import RotaryEmbedding
+
     layer = RotaryEmbedding(16, 16, 16, 16, True, torch.float16)
     assert layer.__class__.__name__ == "DummyRotaryEmbedding", (
         f"Expected DummyRotaryEmbedding, got {layer.__class__.__name__}, "
-        "possibly because the custom op is not registered correctly.")
+        "possibly because the custom op is not registered correctly."
+    )
     assert hasattr(layer, "addition_config"), (
         "Expected DummyRotaryEmbedding to have an 'addition_config' attribute, "
-        "which is set by the custom op.")
+        "which is set by the custom op."
+    )
diff --git a/tests/plugins_tests/test_scheduler_plugins.py b/tests/plugins_tests/test_scheduler_plugins.py
index 099869a82ad2..1c37d6a39261 100644
--- a/tests/plugins_tests/test_scheduler_plugins.py
+++ b/tests/plugins_tests/test_scheduler_plugins.py
@@ -10,7 +10,6 @@
 
 
 class DummyV1Scheduler(Scheduler):
-
     def schedule(self):
         raise Exception("Exception raised by DummyV1Scheduler")
 
@@ -23,7 +22,6 @@ def test_scheduler_plugins_v1(monkeypatch: pytest.MonkeyPatch):
         m.setenv("VLLM_ENABLE_V1_MULTIPROCESSING", "0")
 
         with pytest.raises(Exception) as exception_info:
-
             engine_args = EngineArgs(
                 model="facebook/opt-125m",
                 enforce_eager=True,  # reduce test time
@@ -36,5 +34,4 @@ def test_scheduler_plugins_v1(monkeypatch: pytest.MonkeyPatch):
             engine.add_request("0", "foo", sampling_params)
             engine.step()
 
-        assert str(
-            exception_info.value) == "Exception raised by DummyV1Scheduler"
+        assert str(exception_info.value) == "Exception raised by DummyV1Scheduler"
diff --git a/tests/quantization/reference_mxfp4.py b/tests/quantization/reference_mxfp4.py
index 2ef251933f68..d84659ed035e 100644
--- a/tests/quantization/reference_mxfp4.py
+++ b/tests/quantization/reference_mxfp4.py
@@ -14,14 +14,15 @@
 FLOAT4_EXP_BIAS = 1
 FLOAT4_MANTISSA_BITS = 1
 
-FLOAT16_VAL_TO_ADD = (1 << (FLOAT16_MANTISSA_BITS - FLOAT4_MANTISSA_BITS - 1))
-FLOAT16_SIGN_EXPONENT_MASK = ((
-    (1 << (FLOAT16_EXP_BITS + 1)) - 1) << FLOAT16_MANTISSA_BITS)
+FLOAT16_VAL_TO_ADD = 1 << (FLOAT16_MANTISSA_BITS - FLOAT4_MANTISSA_BITS - 1)
+FLOAT16_SIGN_EXPONENT_MASK = (
+    (1 << (FLOAT16_EXP_BITS + 1)) - 1
+) << FLOAT16_MANTISSA_BITS
 
-BFLOAT16_VAL_TO_ADD = (1 <<
-                       (BFLOAT16_MANTISSA_BITS - FLOAT4_MANTISSA_BITS - 1))
-BFLOAT16_SIGN_EXPONENT_MASK = ((
-    (1 << (BFLOAT16_EXP_BITS + 1)) - 1) << BFLOAT16_MANTISSA_BITS)
+BFLOAT16_VAL_TO_ADD = 1 << (BFLOAT16_MANTISSA_BITS - FLOAT4_MANTISSA_BITS - 1)
+BFLOAT16_SIGN_EXPONENT_MASK = (
+    (1 << (BFLOAT16_EXP_BITS + 1)) - 1
+) << BFLOAT16_MANTISSA_BITS
 
 
 def e8m0_to_half(scale, half_dtype: torch.dtype):
@@ -30,19 +31,19 @@ def e8m0_to_half(scale, half_dtype: torch.dtype):
     scale_exp = scale.to(torch.int16) - 127
 
     # This can be implemented with bitwise operations in a proper kernel.
-    scale_half = 2.0**(scale_exp.to(torch.float))
+    scale_half = 2.0 ** (scale_exp.to(torch.float))
 
     return scale_half.to(half_dtype)
 
 
-def upcast_fp4_to_fp16_or_bf16(val, float_dtype: torch.dtype,
-                               half_exp_bias: int, half_mantissa_bits: int):
+def upcast_fp4_to_fp16_or_bf16(
+    val, float_dtype: torch.dtype, half_exp_bias: int, half_mantissa_bits: int
+):
     assert val.dtype == torch.uint8
 
-    unpacked = torch.zeros(*val.shape[:-1],
-                           val.shape[-1] * 2,
-                           dtype=torch.uint8,
-                           device=val.device)
+    unpacked = torch.zeros(
+        *val.shape[:-1], val.shape[-1] * 2, dtype=torch.uint8, device=val.device
+    )
     unpacked[..., 1::2] = (val >> 4) & 0x0F  # Extract high 4 bits.
     unpacked[..., ::2] = val & 0x0F  # Extract low 4 bits.
 
@@ -72,8 +73,11 @@ def upcast_fp4_to_fp16_or_bf16(val, float_dtype: torch.dtype,
     new_exp = new_exp.to(torch.int32)
     sign = sign.to(torch.int32)
 
-    qdq_val = (sign << 15) + (new_exp << half_mantissa_bits) + (
-        new_mantissa << (half_mantissa_bits - 1))
+    qdq_val = (
+        (sign << 15)
+        + (new_exp << half_mantissa_bits)
+        + (new_mantissa << (half_mantissa_bits - 1))
+    )
 
     assert qdq_val.max() <= 65535
     assert qdq_val.min() >= 0
@@ -84,8 +88,9 @@ def upcast_fp4_to_fp16_or_bf16(val, float_dtype: torch.dtype,
     return result
 
 
-def dq_mxfp4_torch(x: torch.Tensor, scale: torch.Tensor,
-                   float_dtype: torch.dtype) -> torch.Tensor:
+def dq_mxfp4_torch(
+    x: torch.Tensor, scale: torch.Tensor, float_dtype: torch.dtype
+) -> torch.Tensor:
     assert x.dtype == torch.uint8
     assert scale.dtype == torch.uint8
 
@@ -98,10 +103,12 @@ def dq_mxfp4_torch(x: torch.Tensor, scale: torch.Tensor,
 
     scale_half = e8m0_to_half(scale, half_dtype=float_dtype)
 
-    x_half = upcast_fp4_to_fp16_or_bf16(x,
-                                        float_dtype=float_dtype,
-                                        half_exp_bias=half_exp_bias,
-                                        half_mantissa_bits=half_mantissa_bits)
+    x_half = upcast_fp4_to_fp16_or_bf16(
+        x,
+        float_dtype=float_dtype,
+        half_exp_bias=half_exp_bias,
+        half_mantissa_bits=half_mantissa_bits,
+    )
 
     x_half = x_half.reshape(*x_half.shape[:-1], -1, 32)
     x_half = x_half * scale_half[..., None]
@@ -110,8 +117,9 @@ def dq_mxfp4_torch(x: torch.Tensor, scale: torch.Tensor,
     return x_half
 
 
-def fp16_to_fp4_simulate(val, half_mantissa_bits: int, half_exp_bits: int,
-                         half_exp_bias: int):
+def fp16_to_fp4_simulate(
+    val, half_mantissa_bits: int, half_exp_bits: int, half_exp_bias: int
+):
     # Casts an fp16/bf16 input to the restricted values of float4_e2m1,
     # that is to say [0., 0.5, 1.0, 1.5, 2.0, 3.0, 4.0, 6.0, -0.0,
     # -0.5, -1.0, -1.5, -2.0, -3.0, -4.0, -6.0].
@@ -119,7 +127,7 @@ def fp16_to_fp4_simulate(val, half_mantissa_bits: int, half_exp_bits: int,
     float_type = val.dtype
 
     # "rshift_cuda" not implemented for 'UInt16'
-    val_view = val.view(torch.int16)  #.to(torch.int32)
+    val_view = val.view(torch.int16)  # .to(torch.int32)
 
     exp = val_view >> half_mantissa_bits
     exp = exp & ((1 << half_exp_bits) - 1)
@@ -147,23 +155,15 @@ def fp16_to_fp4_simulate(val, half_mantissa_bits: int, half_exp_bits: int,
 
     tail = mantissa_plus_one & ((1 << tail_bits) - 1)
 
-    round_close = (tail < half)  # round towards 0
-    round_away = (tail > half)  # round away from 0
+    round_close = tail < half  # round towards 0
+    round_away = tail > half  # round away from 0
     tie = tail == half
 
-    new_mantissa_close = torch.zeros(val.shape,
-                                     device=val.device,
-                                     dtype=torch.bool)
-    new_exp_close = torch.zeros(val.shape,
-                                device=val.device,
-                                dtype=torch.uint16)
+    new_mantissa_close = torch.zeros(val.shape, device=val.device, dtype=torch.bool)
+    new_exp_close = torch.zeros(val.shape, device=val.device, dtype=torch.uint16)
 
-    new_mantissa_away = torch.zeros(val.shape,
-                                    device=val.device,
-                                    dtype=torch.bool)
-    new_exp_away = torch.zeros(val.shape,
-                               device=val.device,
-                               dtype=torch.uint16)
+    new_mantissa_away = torch.zeros(val.shape, device=val.device, dtype=torch.bool)
+    new_exp_away = torch.zeros(val.shape, device=val.device, dtype=torch.uint16)
 
     new_exp_tie = torch.zeros(val.shape, device=val.device, dtype=torch.uint16)
 
@@ -202,27 +202,29 @@ def fp16_to_fp4_simulate(val, half_mantissa_bits: int, half_exp_bits: int,
     new_exp_tie = (exp > (half_exp_bias - 2)) * (exp + (mantissa_last == 1))
 
     # Gather round up, round down and tie.
-    new_exp = round_away * new_exp_away \
-        + round_close * new_exp_close \
-        + tie * new_exp_tie
+    new_exp = (
+        round_away * new_exp_away + round_close * new_exp_close + tie * new_exp_tie
+    )
 
-    new_mantissa = round_away * new_mantissa_away \
-        + round_close * new_mantissa_close
+    new_mantissa = round_away * new_mantissa_away + round_close * new_mantissa_close
 
     # if new_exp > 3:
     #     new_mantissa = 1
-    new_mantissa = new_mantissa + (new_exp >
-                                   (2 + half_exp_bias)) * (new_mantissa == 0)
+    new_mantissa = new_mantissa + (new_exp > (2 + half_exp_bias)) * (new_mantissa == 0)
 
     # Clamp the exponent to acceptable values.
     new_exp = (new_exp >= (half_exp_bias - 2)) * torch.clamp(
-        new_exp, half_exp_bias - 2, half_exp_bias + 2)
+        new_exp, half_exp_bias - 2, half_exp_bias + 2
+    )
 
     sign = sign.to(torch.int32)
     new_mantissa = new_mantissa.to(torch.int32)
 
-    qdq_val = (sign << 15) + (new_exp << half_mantissa_bits) + (
-        new_mantissa << (half_mantissa_bits - 1))
+    qdq_val = (
+        (sign << 15)
+        + (new_exp << half_mantissa_bits)
+        + (new_mantissa << (half_mantissa_bits - 1))
+    )
 
     assert qdq_val.max() <= 65535
     assert qdq_val.min() >= 0
@@ -233,8 +235,9 @@ def fp16_to_fp4_simulate(val, half_mantissa_bits: int, half_exp_bits: int,
     return result
 
 
-def qdq_mxfp4_torch(x: torch.Tensor,
-                    scale_calculation_mode: str = "even") -> torch.Tensor:
+def qdq_mxfp4_torch(
+    x: torch.Tensor, scale_calculation_mode: str = "even"
+) -> torch.Tensor:
     half_dtype = x.dtype
 
     if half_dtype == torch.float16:
@@ -258,8 +261,7 @@ def qdq_mxfp4_torch(x: torch.Tensor,
 
     block_max = block_max.view(torch.uint16).to(torch.int32)
 
-    block_max_uint = torch.bitwise_and(block_max + val_to_add,
-                                       sign_exponent_mask)
+    block_max_uint = torch.bitwise_and(block_max + val_to_add, sign_exponent_mask)
 
     assert block_max_uint.max() <= 65535
     assert block_max_uint.min() >= 0
@@ -268,20 +270,23 @@ def qdq_mxfp4_torch(x: torch.Tensor,
 
     block_max = block_max_uint.view(half_dtype)
 
-    scale_exp = FLOAT8_E8M0_MAX_EXP + torch.floor(torch.log2(block_max)).to(
-        torch.int32) - 2
+    scale_exp = (
+        FLOAT8_E8M0_MAX_EXP + torch.floor(torch.log2(block_max)).to(torch.int32) - 2
+    )
 
     scale_exp = torch.clamp(scale_exp, 0, 2 * FLOAT8_E8M0_MAX_EXP)
 
-    scale = 2.0**(scale_exp - FLOAT8_E8M0_MAX_EXP)
+    scale = 2.0 ** (scale_exp - FLOAT8_E8M0_MAX_EXP)
     scale = scale.to(half_dtype)
 
     x = x / scale[..., None]
 
-    x_fp4 = fp16_to_fp4_simulate(x,
-                                 half_exp_bits=half_exp_bits,
-                                 half_mantissa_bits=half_mantissa_bits,
-                                 half_exp_bias=half_exp_bias)
+    x_fp4 = fp16_to_fp4_simulate(
+        x,
+        half_exp_bits=half_exp_bits,
+        half_mantissa_bits=half_mantissa_bits,
+        half_exp_bias=half_exp_bias,
+    )
 
     x_fp4 = x_fp4 * scale[..., None]
     return x_fp4.reshape(*x_fp4.shape[:-2], -1)
diff --git a/tests/quantization/test_auto_round.py b/tests/quantization/test_auto_round.py
index 1c41d904b816..69632ae6cac7 100644
--- a/tests/quantization/test_auto_round.py
+++ b/tests/quantization/test_auto_round.py
@@ -1,11 +1,11 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Test model set-up and inference for quantized HF models supported
- on the AutoRound.
+on the AutoRound.
 
- Validating the configuration and printing results for manual checking.
+Validating the configuration and printing results for manual checking.
 
- Run `pytest tests/quantization/test_auto_round.py`.
+Run `pytest tests/quantization/test_auto_round.py`.
 """
 
 import pytest
@@ -14,18 +14,19 @@
 
 MODELS = [
     "OPEA/Qwen2.5-0.5B-Instruct-int4-sym-inc",  ##auto_round:auto_gptq
-    "Intel/Qwen2-0.5B-Instruct-int4-sym-AutoRound"  ##auto_round:auto_awq
+    "Intel/Qwen2-0.5B-Instruct-int4-sym-AutoRound",  ##auto_round:auto_awq
 ]
 
 
-@pytest.mark.skipif(not current_platform.is_cpu()
-                    and not current_platform.is_xpu()
-                    and not current_platform.is_cuda(),
-                    reason="only supports CPU/XPU/CUDA backend.")
+@pytest.mark.skipif(
+    not current_platform.is_cpu()
+    and not current_platform.is_xpu()
+    and not current_platform.is_cuda(),
+    reason="only supports CPU/XPU/CUDA backend.",
+)
 @pytest.mark.parametrize("model", MODELS)
 def test_auto_round(vllm_runner, model):
     with vllm_runner(model) as llm:
-        output = llm.generate_greedy(["The capital of France is"],
-                                     max_tokens=8)
+        output = llm.generate_greedy(["The capital of France is"], max_tokens=8)
     assert output
     print(f"{output[0][1]}")
diff --git a/tests/quantization/test_blackwell_moe.py b/tests/quantization/test_blackwell_moe.py
index 906693a1f401..218763bc627d 100644
--- a/tests/quantization/test_blackwell_moe.py
+++ b/tests/quantization/test_blackwell_moe.py
@@ -11,8 +11,9 @@
 from vllm.platforms import current_platform
 
 if not current_platform.is_device_capability(100):
-    pytest.skip("This test only runs on Blackwell GPUs (SM100).",
-                allow_module_level=True)
+    pytest.skip(
+        "This test only runs on Blackwell GPUs (SM100).", allow_module_level=True
+    )
 
 os.environ["FLASHINFER_NVCC_THREADS"] = "16"
 
@@ -22,7 +23,6 @@
 
 
 def can_initialize(model: str, extra_args: Optional[list[str]] = None):
-
     # Server arguments
     extra_args = extra_args if extra_args is not None else []
     server_args = [
@@ -40,10 +40,11 @@ def can_initialize(model: str, extra_args: Optional[list[str]] = None):
 
     # Launch server and make a simple request
     with RemoteOpenAIServer(
-            model,
-            server_args,
-            max_wait_seconds=1000,  # Due to FlashInfer compile
-            override_hf_configs=dummy_hf_overrides) as server:
+        model,
+        server_args,
+        max_wait_seconds=1000,  # Due to FlashInfer compile
+        override_hf_configs=dummy_hf_overrides,
+    ) as server:
         client = server.get_client()
         # Make a simple request to verify the server works
         completion = client.completions.create(
@@ -59,20 +60,21 @@ def can_initialize(model: str, extra_args: Optional[list[str]] = None):
 ## Llama4 ##
 
 
-@pytest.mark.skip(reason=(
-    "RuntimeError: run_moe() Expected a value of type "
-    "'Optional[List[Tensor]]' for argument '_9' but instead found type "
-    "'list'."))
-def test_llama4_fp8_tensor_moe_flashinfer_cutlass(
-        monkeypatch: pytest.MonkeyPatch):
+@pytest.mark.skip(
+    reason=(
+        "RuntimeError: run_moe() Expected a value of type "
+        "'Optional[List[Tensor]]' for argument '_9' but instead found type "
+        "'list'."
+    )
+)
+def test_llama4_fp8_tensor_moe_flashinfer_cutlass(monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_FP8", "1")
     monkeypatch.setenv("VLLM_FLASHINFER_MOE_BACKEND", "throughput")
     can_initialize("nvidia/Llama-4-Scout-17B-16E-Instruct-FP8")
 
 
 @pytest.mark.skip(reason="Works, but takes too long to run")
-def test_llama4_fp8_tensor_moe_flashinfer_trtllm(
-        monkeypatch: pytest.MonkeyPatch):
+def test_llama4_fp8_tensor_moe_flashinfer_trtllm(monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_FP8", "1")
     monkeypatch.setenv("VLLM_FLASHINFER_MOE_BACKEND", "latency")
     can_initialize("nvidia/Llama-4-Scout-17B-16E-Instruct-FP8")
@@ -100,24 +102,25 @@ def test_deepseek_fp8_block_moe_deep_gemm(monkeypatch: pytest.MonkeyPatch):
     can_initialize("deepseek-ai/DeepSeek-V3.1")
 
 
-@pytest.mark.skip(reason=("Known issue: lack of kernel support. "
-                          "Expected failure: assert self.block_quant is None"))
-def test_deepseek_fp8_block_moe_flashinfer_cutlass(
-        monkeypatch: pytest.MonkeyPatch):
+@pytest.mark.skip(
+    reason=(
+        "Known issue: lack of kernel support. "
+        "Expected failure: assert self.block_quant is None"
+    )
+)
+def test_deepseek_fp8_block_moe_flashinfer_cutlass(monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_FP8", "1")
     monkeypatch.setenv("VLLM_FLASHINFER_MOE_BACKEND", "throughput")
     can_initialize("deepseek-ai/DeepSeek-V3.1")
 
 
-def test_deepseek_fp8_block_moe_flashinfer_trtllm(
-        monkeypatch: pytest.MonkeyPatch):
+def test_deepseek_fp8_block_moe_flashinfer_trtllm(monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_FP8", "1")
     monkeypatch.setenv("VLLM_FLASHINFER_MOE_BACKEND", "latency")
     can_initialize("deepseek-ai/DeepSeek-V3.1")
 
 
-def test_deepseek_nvfp4_moe_flashinfer_cutlass(
-        monkeypatch: pytest.MonkeyPatch):
+def test_deepseek_nvfp4_moe_flashinfer_cutlass(monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_FP4", "1")
     monkeypatch.setenv("VLLM_FLASHINFER_MOE_BACKEND", "throughput")
     can_initialize("nvidia/DeepSeek-R1-0528-FP4-v2")
@@ -138,13 +141,11 @@ def test_gptoss_mxfp4bf16_moe_flashinfer(monkeypatch: pytest.MonkeyPatch):
     can_initialize("openai/gpt-oss-20b")
 
 
-def test_gptoss_mxfp4mxfp8_moe_flashinfer_cutlass(
-        monkeypatch: pytest.MonkeyPatch):
+def test_gptoss_mxfp4mxfp8_moe_flashinfer_cutlass(monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8_CUTLASS", "1")
     can_initialize("openai/gpt-oss-20b")
 
 
-def test_gptoss_mxfp4mxfp8_moe_flashinfer_trtllm(
-        monkeypatch: pytest.MonkeyPatch):
+def test_gptoss_mxfp4mxfp8_moe_flashinfer_trtllm(monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8", "1")
     can_initialize("openai/gpt-oss-20b")
diff --git a/tests/quantization/test_compressed_tensors.py b/tests/quantization/test_compressed_tensors.py
index af8c7ec3b482..824d927724e0 100644
--- a/tests/quantization/test_compressed_tensors.py
+++ b/tests/quantization/test_compressed_tensors.py
@@ -13,18 +13,25 @@
 
 from tests.models.utils import check_logprobs_close
 from vllm.model_executor.layers.quantization.compressed_tensors.compressed_tensors import (  # noqa: E501
-    CompressedTensors24, CompressedTensorsLinearMethod,
-    CompressedTensorsW4A4Fp4, CompressedTensorsW4A8Fp8,
-    CompressedTensorsW4A16Fp4, CompressedTensorsW4A16Sparse24,
-    CompressedTensorsW8A8Fp8, CompressedTensorsW8A8Int8,
-    CompressedTensorsW8A16Fp8, CompressedTensorsWNA16)
+    CompressedTensors24,
+    CompressedTensorsLinearMethod,
+    CompressedTensorsW4A4Fp4,
+    CompressedTensorsW4A8Fp8,
+    CompressedTensorsW4A16Fp4,
+    CompressedTensorsW4A16Sparse24,
+    CompressedTensorsW8A8Fp8,
+    CompressedTensorsW8A8Int8,
+    CompressedTensorsW8A16Fp8,
+    CompressedTensorsWNA16,
+)
 from vllm.model_executor.layers.quantization.input_quant_fp8 import QuantFP8
-from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    W8A8BlockFp8LinearOp)
+from vllm.model_executor.layers.quantization.utils.fp8_utils import W8A8BlockFp8LinearOp
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    cutlass_fp4_supported)
+    cutlass_fp4_supported,
+)
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    sparse_cutlass_supported)
+    sparse_cutlass_supported,
+)
 from vllm.platforms import current_platform
 
 # AITER only supports per-channel-per-channel INT8 gemm
@@ -32,7 +39,7 @@
 # It does not support mix precision MM and mix quantization scheme.
 ROCM_AITER_SUPPORTED_INT8_MODEL = [
     "neuralmagic/Llama-3.2-1B-quantized.w8a8",
-    "nm-testing/tinyllama-oneshot-w8a8-channel-dynamic-token-v2"
+    "nm-testing/tinyllama-oneshot-w8a8-channel-dynamic-token-v2",
 ]
 
 # TritonScaledMMLinearKernel only supports symmetric quantization.
@@ -80,8 +87,10 @@ def enable_pickle(monkeypatch):
 def test_compressed_tensors_w8a8_static_setup(vllm_runner, model_args):
     model_path, strategy, quant_type, shape_0, is_symmetric = model_args
 
-    if current_platform.is_rocm(
-    ) and model_path not in ROCM_TRITON_SCALED_MM_SUPPORTED_INT8_MODEL:
+    if (
+        current_platform.is_rocm()
+        and model_path not in ROCM_TRITON_SCALED_MM_SUPPORTED_INT8_MODEL
+    ):
         pytest.skip(f"Skip model {model_path} as it is not support on ROCm.")
 
     with vllm_runner(model_path, enforce_eager=True) as llm:
@@ -106,14 +115,10 @@ def zp_valid(zp: Optional[torch.Tensor]):
             assert zp_valid(gate_up_proj.input_zero_point)
             assert zp_valid(down_proj.input_zero_point)
 
-            assert isinstance(qkv_proj.quant_method,
-                              CompressedTensorsLinearMethod)
-            assert isinstance(o_proj.quant_method,
-                              CompressedTensorsLinearMethod)
-            assert isinstance(gate_up_proj.quant_method,
-                              CompressedTensorsLinearMethod)
-            assert isinstance(down_proj.quant_method,
-                              CompressedTensorsLinearMethod)
+            assert isinstance(qkv_proj.quant_method, CompressedTensorsLinearMethod)
+            assert isinstance(o_proj.quant_method, CompressedTensorsLinearMethod)
+            assert isinstance(gate_up_proj.quant_method, CompressedTensorsLinearMethod)
+            assert isinstance(down_proj.quant_method, CompressedTensorsLinearMethod)
             assert isinstance(qkv_proj.scheme, CompressedTensorsW8A8Int8)
 
             assert qkv_proj.scheme.strategy == strategy
@@ -151,7 +156,8 @@ def zp_valid(zp: Optional[torch.Tensor]):
 @pytest.mark.parametrize("max_tokens", [32])
 @pytest.mark.parametrize("num_logprobs", [10])
 @pytest.mark.parametrize(
-    "use_aiter", [True, False] if current_platform.is_rocm() else [False])
+    "use_aiter", [True, False] if current_platform.is_rocm() else [False]
+)
 def test_compressed_tensors_w8a8_logprobs(
     hf_runner,
     vllm_runner,
@@ -162,15 +168,15 @@ def test_compressed_tensors_w8a8_logprobs(
     use_aiter,
     monkeypatch,
 ):
-
-    if current_platform.is_rocm(
-    ) and model_path not in ROCM_TRITON_SCALED_MM_SUPPORTED_INT8_MODEL:
+    if (
+        current_platform.is_rocm()
+        and model_path not in ROCM_TRITON_SCALED_MM_SUPPORTED_INT8_MODEL
+    ):
         pytest.skip(f"Skip model {model_path} as it is not support on ROCm.")
 
     if use_aiter:
         if model_path not in ROCM_AITER_SUPPORTED_INT8_MODEL:
-            pytest.skip(
-                f"Skip model {model_path} as it is not support by aiter.")
+            pytest.skip(f"Skip model {model_path} as it is not support by aiter.")
         # this will enable VLLM_ROCM_USE_AITER_LINEAR
         monkeypatch.setenv("VLLM_ROCM_USE_AITER", "1")
 
@@ -178,18 +184,20 @@ def test_compressed_tensors_w8a8_logprobs(
 
     # skip language translation prompt for the static per tensor models
     if model_path in (
-            "nm-testing/Meta-Llama-3-8B-Instruct-W8A8-Static-Per-Tensor-Sym",
-            "nm-testing/Meta-Llama-3-8B-Instruct-W8A8-Static-Per-Tensor-Asym",
+        "nm-testing/Meta-Llama-3-8B-Instruct-W8A8-Static-Per-Tensor-Sym",
+        "nm-testing/Meta-Llama-3-8B-Instruct-W8A8-Static-Per-Tensor-Asym",
     ):
         example_prompts = example_prompts[0:-1]
 
     with hf_runner(model_path, dtype=dtype) as hf_model:
         hf_outputs = hf_model.generate_greedy_logprobs_limit(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     with vllm_runner(model_path, dtype=dtype) as vllm_model:
         vllm_outputs = vllm_model.generate_greedy_logprobs(
-            example_prompts, max_tokens, num_logprobs)
+            example_prompts, max_tokens, num_logprobs
+        )
 
     check_logprobs_close(
         outputs_0_lst=hf_outputs,
@@ -225,7 +233,8 @@ def test_compressed_tensors_no_enforce_eager(vllm_runner):
     ],
 )
 @pytest.mark.parametrize(
-    "use_aiter", [True, False] if current_platform.is_rocm() else [False])
+    "use_aiter", [True, False] if current_platform.is_rocm() else [False]
+)
 def test_compressed_tensors_w8a8_dynamic_per_token(
     vllm_runner,
     model_args,
@@ -234,14 +243,15 @@ def test_compressed_tensors_w8a8_dynamic_per_token(
 ):
     model_path, strategy = model_args
 
-    if current_platform.is_rocm(
-    ) and model_path not in ROCM_TRITON_SCALED_MM_SUPPORTED_INT8_MODEL:
+    if (
+        current_platform.is_rocm()
+        and model_path not in ROCM_TRITON_SCALED_MM_SUPPORTED_INT8_MODEL
+    ):
         pytest.skip(f"Skip model {model_path} as it is not support on ROCm.")
 
     if use_aiter:
         if model_path not in ROCM_AITER_SUPPORTED_INT8_MODEL:
-            pytest.skip(
-                f"Skip model {model_path} as it is not support by aiter.")
+            pytest.skip(f"Skip model {model_path} as it is not support by aiter.")
         # this will enable VLLM_ROCM_USE_AITER_LINEAR
         monkeypatch.setenv("VLLM_ROCM_USE_AITER", "1")
 
@@ -252,8 +262,7 @@ def check_model(model):
 
             qkv_proj = layer.self_attn.qkv_proj
 
-            assert isinstance(qkv_proj.quant_method,
-                              CompressedTensorsLinearMethod)
+            assert isinstance(qkv_proj.quant_method, CompressedTensorsLinearMethod)
             assert isinstance(qkv_proj.scheme, CompressedTensorsW8A8Int8)
             assert not qkv_proj.scheme.is_static_input_scheme
             assert qkv_proj.scheme.strategy == strategy
@@ -267,21 +276,60 @@ def check_model(model):
 
 @pytest.mark.parametrize(
     "wNa16_args",
-    [("nm-testing/tinyllama-oneshot-w4a16-channel-v2", "channel", None, 8,
-      True, False),
-     ("nm-testing/tinyllama-oneshot-w4a16-group128-v2", "group", 128, 8, True,
-      False),
-     ("nm-testing/tinyllama-oneshot-w8a16-per-channel", "channel", None, 4,
-      True, False),
-     ("nm-testing/TinyLlama-1.1B-Chat-v1.0-awq-group128-asym256", "group", 128,
-      8, False, False),
-     ("nm-testing/TinyLlama-1.1B-Chat-v1.0-W4A16-G128-Asym-Updated-Channel",
-      "channel", None, 8, False, False),
-     ("nm-testing/TinyLlama-1.1B-Chat-v1.0-W4A16-G128-Asym-Updated-ActOrder",
-      "group", 128, 8, False, True)],
+    [
+        (
+            "nm-testing/tinyllama-oneshot-w4a16-channel-v2",
+            "channel",
+            None,
+            8,
+            True,
+            False,
+        ),
+        (
+            "nm-testing/tinyllama-oneshot-w4a16-group128-v2",
+            "group",
+            128,
+            8,
+            True,
+            False,
+        ),
+        (
+            "nm-testing/tinyllama-oneshot-w8a16-per-channel",
+            "channel",
+            None,
+            4,
+            True,
+            False,
+        ),
+        (
+            "nm-testing/TinyLlama-1.1B-Chat-v1.0-awq-group128-asym256",
+            "group",
+            128,
+            8,
+            False,
+            False,
+        ),
+        (
+            "nm-testing/TinyLlama-1.1B-Chat-v1.0-W4A16-G128-Asym-Updated-Channel",
+            "channel",
+            None,
+            8,
+            False,
+            False,
+        ),
+        (
+            "nm-testing/TinyLlama-1.1B-Chat-v1.0-W4A16-G128-Asym-Updated-ActOrder",
+            "group",
+            128,
+            8,
+            False,
+            True,
+        ),
+    ],
+)
+@pytest.mark.skipif(
+    not current_platform.is_cuda(), reason="The tests are skipped on non-CUDA platform."
 )
-@pytest.mark.skipif(not current_platform.is_cuda(),
-                    reason="The tests are skipped on non-CUDA platform.")
 def test_compressed_tensors_wNa16(vllm_runner, wNa16_args):
     model, strategy, group, pack_factor, symmetric, has_g_idx = wNa16_args
     with vllm_runner(model) as llm:
@@ -290,13 +338,11 @@ def check_model(model):
             layer = model.model.layers[0]
 
             qkv_proj = layer.self_attn.qkv_proj
-            assert isinstance(qkv_proj.quant_method,
-                              CompressedTensorsLinearMethod)
+            assert isinstance(qkv_proj.quant_method, CompressedTensorsLinearMethod)
             assert isinstance(qkv_proj.scheme, CompressedTensorsWNA16)
 
             assert qkv_proj.scheme.strategy == strategy
-            assert qkv_proj.scheme.group_size == (-1
-                                                  if group is None else group)
+            assert qkv_proj.scheme.group_size == (-1 if group is None else group)
 
             assert qkv_proj.scheme.pack_factor == pack_factor
             assert qkv_proj.scheme.symmetric == symmetric
@@ -308,8 +354,9 @@ def check_model(model):
         assert output
 
 
-@pytest.mark.skipif(not current_platform.is_cuda(),
-                    reason="This test is skipped on non-CUDA platform.")
+@pytest.mark.skipif(
+    not current_platform.is_cuda(), reason="This test is skipped on non-CUDA platform."
+)
 def test_compressed_tensors_w4a16_marlin24(vllm_runner):
     model_path = "nm-testing/llama7b-one-shot-2_4-w4a16-marlin24-t"
     with vllm_runner(model_path) as llm:
@@ -319,8 +366,7 @@ def check_model(model):
 
             qkv_proj = layer.self_attn.qkv_proj
 
-            assert isinstance(qkv_proj.quant_method,
-                              CompressedTensorsLinearMethod)
+            assert isinstance(qkv_proj.quant_method, CompressedTensorsLinearMethod)
             assert isinstance(qkv_proj.scheme, CompressedTensorsW4A16Sparse24)
             assert qkv_proj.weight_packed.dtype is torch.int32
 
@@ -339,8 +385,7 @@ def check_model(model):
 
             qkv_proj = layer.self_attn.qkv_proj
 
-            assert isinstance(qkv_proj.quant_method,
-                              CompressedTensorsLinearMethod)
+            assert isinstance(qkv_proj.quant_method, CompressedTensorsLinearMethod)
             assert isinstance(
                 qkv_proj.scheme,
                 (CompressedTensorsW8A8Fp8, CompressedTensorsW8A16Fp8),
@@ -362,9 +407,11 @@ def check_model(model):
 
 @pytest.mark.skipif(
     not current_platform.is_kv_cache_dtype_supported("fp8", None),
-    reason="FP8 KV cache is not supported on this device.")
-@pytest.mark.skipif(not current_platform.is_cuda(),
-                    reason="This test is skipped on non-CUDA platform.")
+    reason="FP8 KV cache is not supported on this device.",
+)
+@pytest.mark.skipif(
+    not current_platform.is_cuda(), reason="This test is skipped on non-CUDA platform."
+)
 def test_compressed_tensors_kv_cache(vllm_runner):
     model_path = "nm-testing/TinyLlama-1.1B-compressed-tensors-kv-cache-scheme"
     with vllm_runner(model_path, kv_cache_dtype="fp8") as llm:
@@ -376,10 +423,7 @@ def test_compressed_tensors_kv_cache(vllm_runner):
     not sparse_cutlass_supported(),
     reason="Sparse FP8 is not yet supported on this GPU type.",
 )
-def _test_2of4_quant_models(qkv_proj,
-                            weight_strategy,
-                            input_strategy,
-                            format="dense"):
+def _test_2of4_quant_models(qkv_proj, weight_strategy, input_strategy, format="dense"):
     assert isinstance(qkv_proj.quant_method, CompressedTensorsLinearMethod)
     assert isinstance(qkv_proj.scheme, CompressedTensors24)
 
@@ -393,8 +437,7 @@ def _test_2of4_quant_models(qkv_proj,
 
 
 @pytest.mark.skipif(
-    not current_platform.is_cuda()
-    or not current_platform.has_device_capability(90),
+    not current_platform.is_cuda() or not current_platform.has_device_capability(90),
     reason="Sparse FP8 is not yet supported on this GPU type.",
 )
 @pytest.mark.parametrize(
@@ -441,8 +484,7 @@ def check_model(model):
 
 
 @pytest.mark.skipif(
-    not current_platform.is_cuda()
-    or not current_platform.has_device_capability(90),
+    not current_platform.is_cuda() or not current_platform.has_device_capability(90),
     reason="Sparse FP8 is not yet supported on this GPU type.",
 )
 @pytest.mark.parametrize(
@@ -603,17 +645,14 @@ def check_model(model):
             layer = model.model.layers[0]
 
             qkv_proj = layer.self_attn.qkv_proj
-            assert isinstance(qkv_proj.quant_method,
-                              CompressedTensorsLinearMethod)
+            assert isinstance(qkv_proj.quant_method, CompressedTensorsLinearMethod)
             assert isinstance(qkv_proj.scheme, CompressedTensors24)
 
             assert qkv_proj.scheme.weight_quant is None
             assert qkv_proj.scheme.input_quant is None
             assert not qkv_proj.scheme.quantized
             assert qkv_proj.quant_method.quantization_config.sparsity_scheme_map
-            sparsity_map = (
-                qkv_proj.quant_method.quantization_config.sparsity_scheme_map
-            )  # noqa: E501
+            sparsity_map = qkv_proj.quant_method.quantization_config.sparsity_scheme_map  # noqa: E501
             assert sparsity_map.get("Linear").format == "dense"
             assert sparsity_map.get("Linear").sparsity_structure == "2:4"
 
@@ -629,7 +668,8 @@ def check_model(model):
     reason="Cutlass is not yet supported on this GPU type.",
 )
 @pytest.mark.parametrize(
-    "args_2of4", [("nm-testing/llama2.c-stories42M-pruned2.4-compressed")])
+    "args_2of4", [("nm-testing/llama2.c-stories42M-pruned2.4-compressed")]
+)
 def test_compressed_tensors_2of4_sparse_compressed(vllm_runner, args_2of4):
     model = args_2of4
     with vllm_runner(model) as llm:
@@ -638,17 +678,14 @@ def check_model(model):
             layer = model.model.layers[0]
 
             qkv_proj = layer.self_attn.qkv_proj
-            assert isinstance(qkv_proj.quant_method,
-                              CompressedTensorsLinearMethod)
+            assert isinstance(qkv_proj.quant_method, CompressedTensorsLinearMethod)
             assert isinstance(qkv_proj.scheme, CompressedTensors24)
 
             assert qkv_proj.scheme.weight_quant is None
             assert qkv_proj.scheme.input_quant is None
             assert not qkv_proj.scheme.quantized
             assert qkv_proj.quant_method.quantization_config.sparsity_scheme_map
-            sparsity_map = (
-                qkv_proj.quant_method.quantization_config.sparsity_scheme_map
-            )  # noqa: E501
+            sparsity_map = qkv_proj.quant_method.quantization_config.sparsity_scheme_map  # noqa: E501
             assert sparsity_map.get("Linear").format == "sparse-24-bitmask"
             assert sparsity_map.get("Linear").sparsity_structure == "2:4"
 
@@ -661,9 +698,11 @@ def check_model(model):
 
 @pytest.mark.parametrize(
     "args",
-    [("nm-testing/TinyLlama-1.1B-Chat-v1.0-NVFP4A16",
-      CompressedTensorsW4A16Fp4),
-     ("nm-testing/TinyLlama-1.1B-Chat-v1.0-NVFP4", CompressedTensorsW4A4Fp4)])
+    [
+        ("nm-testing/TinyLlama-1.1B-Chat-v1.0-NVFP4A16", CompressedTensorsW4A16Fp4),
+        ("nm-testing/TinyLlama-1.1B-Chat-v1.0-NVFP4", CompressedTensorsW4A4Fp4),
+    ],
+)
 def test_compressed_tensors_nvfp4(vllm_runner, args):
     model, scheme = args
     with vllm_runner(model, enforce_eager=True) as llm:
@@ -672,11 +711,12 @@ def check_model(model):
             layer = model.model.layers[0]
 
             qkv_proj = layer.self_attn.qkv_proj
-            assert isinstance(qkv_proj.quant_method,
-                              CompressedTensorsLinearMethod)
-            if isinstance(qkv_proj.scheme, scheme) or isinstance(
-                    qkv_proj.scheme,
-                    CompressedTensorsW4A16Fp4) and not cutlass_fp4_supported():
+            assert isinstance(qkv_proj.quant_method, CompressedTensorsLinearMethod)
+            if (
+                isinstance(qkv_proj.scheme, scheme)
+                or isinstance(qkv_proj.scheme, CompressedTensorsW4A16Fp4)
+                and not cutlass_fp4_supported()
+            ):
                 assert True
             else:
                 raise AssertionError("FP4 Scheme Mismatch")
@@ -690,13 +730,13 @@ def check_model(model):
 
 
 @pytest.mark.skipif(
-    not current_platform.is_cuda()
-    or not current_platform.has_device_capability(90),
+    not current_platform.is_cuda() or not current_platform.has_device_capability(90),
     reason="W4A8 FP8 is not yet supported on this GPU type.",
 )
-@pytest.mark.parametrize("args", [
-    ("czhu-cohere/TinyLlama-1.1B-Chat-v1.0-W4A8-e2e", CompressedTensorsW4A8Fp8)
-])
+@pytest.mark.parametrize(
+    "args",
+    [("czhu-cohere/TinyLlama-1.1B-Chat-v1.0-W4A8-e2e", CompressedTensorsW4A8Fp8)],
+)
 def test_compressed_tensors_w4a8_fp8(vllm_runner, args):
     model, scheme = args
     with vllm_runner(model, enforce_eager=True) as llm:
@@ -710,8 +750,7 @@ def check_model(model):
             down_proj = layer.mlp.down_proj
 
             for proj in (qkv_proj, o_proj, gate_up_proj, down_proj):
-                assert isinstance(proj.quant_method,
-                                  CompressedTensorsLinearMethod)
+                assert isinstance(proj.quant_method, CompressedTensorsLinearMethod)
                 assert isinstance(proj.scheme, scheme)
 
                 assert proj.weight_packed.dtype is torch.int32
@@ -725,22 +764,27 @@ def check_model(model):
         assert output
 
 
-@pytest.mark.skipif(not current_platform.is_cuda(),
-                    reason="This test is skipped on non-CUDA platform.")
-@pytest.mark.parametrize("model,prompt,exp_perplexity", [
-    (
-        "nm-testing/Llama-3.2-1B-Instruct-spinquantR1R2R4-w4a16",
-        "Flat is better than nested.\nSparse is better than dense.",
-        150.0,
-    ),
-    (
-        "nm-testing/Llama-3.2-1B-Instruct-quip-w4a16",
-        "Flat is better than nested.\nSparse is better than dense.",
-        150.0,
-    ),
-])
-def test_compressed_tensors_transforms_perplexity(vllm_runner, model, prompt,
-                                                  exp_perplexity):
+@pytest.mark.skipif(
+    not current_platform.is_cuda(), reason="This test is skipped on non-CUDA platform."
+)
+@pytest.mark.parametrize(
+    "model,prompt,exp_perplexity",
+    [
+        (
+            "nm-testing/Llama-3.2-1B-Instruct-spinquantR1R2R4-w4a16",
+            "Flat is better than nested.\nSparse is better than dense.",
+            150.0,
+        ),
+        (
+            "nm-testing/Llama-3.2-1B-Instruct-quip-w4a16",
+            "Flat is better than nested.\nSparse is better than dense.",
+            150.0,
+        ),
+    ],
+)
+def test_compressed_tensors_transforms_perplexity(
+    vllm_runner, model, prompt, exp_perplexity
+):
     with vllm_runner(model, enforce_eager=True) as llm:
         perplexity = llm.generate_prompt_perplexity([prompt])[0]
         print(perplexity)
@@ -750,26 +794,24 @@ def test_compressed_tensors_transforms_perplexity(vllm_runner, model, prompt,
 def test_compressed_tensors_fp8_block_enabled(vllm_runner):
     model_path = "RedHatAI/Qwen3-0.6B-FP8-BLOCK"
     with vllm_runner(model_path) as llm:
-
         fp8_dtype = current_platform.fp8_dtype()
 
         def check_model(model):
             layer = model.model.layers[0]
 
             qkv_proj = layer.self_attn.qkv_proj
-            assert isinstance(qkv_proj.quant_method,
-                              CompressedTensorsLinearMethod)
+            assert isinstance(qkv_proj.quant_method, CompressedTensorsLinearMethod)
             assert isinstance(qkv_proj.scheme, CompressedTensorsW8A8Fp8)
-            assert isinstance(qkv_proj.scheme.w8a8_block_fp8_linear,
-                              W8A8BlockFp8LinearOp)
+            assert isinstance(
+                qkv_proj.scheme.w8a8_block_fp8_linear, W8A8BlockFp8LinearOp
+            )
 
             assert qkv_proj.weight.dtype is fp8_dtype
             assert qkv_proj.weight_scale.dtype is torch.float32
             assert len(qkv_proj.weight.shape) == 2
             assert len(qkv_proj.weight_scale.shape) == 2
 
-            input_quant_op = \
-                qkv_proj.scheme.w8a8_block_fp8_linear.input_quant_op
+            input_quant_op = qkv_proj.scheme.w8a8_block_fp8_linear.input_quant_op
             assert isinstance(input_quant_op, QuantFP8)
             assert input_quant_op._forward_method == input_quant_op.forward_cuda
 
diff --git a/tests/quantization/test_configs.py b/tests/quantization/test_configs.py
index 1843bffd2115..797b565b91af 100644
--- a/tests/quantization/test_configs.py
+++ b/tests/quantization/test_configs.py
@@ -33,7 +33,6 @@ class ModelPair:
     ("LnL-AI/TinyLlama-1.1B-Chat-v1.0-GPTQ-4bit", "marlin", "gptq_marlin"),
     ("LnL-AI/TinyLlama-1.1B-Chat-v1.0-GPTQ-4bit", "gptq", "gptq"),
     ("LnL-AI/TinyLlama-1.1B-Chat-v1.0-GPTQ-4bit", "awq", "ERROR"),
-
     # AUTOAWQ
     ("TheBloke/OpenHermes-2.5-Mistral-7B-AWQ", None, "awq_marlin"),
     ("TheBloke/OpenHermes-2.5-Mistral-7B-AWQ", "awq", "awq"),
@@ -55,4 +54,5 @@ def test_auto_gptq(model_arg_exptype: tuple[str, None, str]) -> None:
     assert found_quantization_type == expected_type, (
         f"Expected quant_type == {expected_type} for {model_path}, "
         f"but found {found_quantization_type} "
-        f"for no --quantization {quantization_arg} case")
+        f"for no --quantization {quantization_arg} case"
+    )
diff --git a/tests/quantization/test_cpu_offload.py b/tests/quantization/test_cpu_offload.py
index 08d9573ecf0b..25d1dc59f617 100644
--- a/tests/quantization/test_cpu_offload.py
+++ b/tests/quantization/test_cpu_offload.py
@@ -1,77 +1,108 @@
 # SPDX-License-Identifier: Apache-2.0
-# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-
-# Expanded quantized model tests for CPU offloading
-# Base tests: tests/basic_correctness/test_cpu_offload.py
-
-import pytest
-
-from tests.quantization.utils import is_quant_method_supported
-
-from ..utils import compare_two_settings
-
-
-@pytest.mark.skipif(not is_quant_method_supported("fp8"),
-                    reason="fp8 is not supported on this GPU type.")
-def test_cpu_offload_fp8():
-    # Test quantization of an unquantized checkpoint
-    compare_two_settings("meta-llama/Llama-3.2-1B-Instruct",
-                         ["--quantization", "fp8"],
-                         ["--quantization", "fp8", "--cpu-offload-gb", "1"],
-                         max_wait_seconds=480)
-    # Test loading a quantized checkpoint
-    compare_two_settings("neuralmagic/Qwen2-1.5B-Instruct-FP8", [],
-                         ["--cpu-offload-gb", "1"],
-                         max_wait_seconds=480)
-
-
-@pytest.mark.skipif(not is_quant_method_supported("gptq_marlin"),
-                    reason="gptq_marlin is not supported on this GPU type.")
-def test_cpu_offload_gptq(monkeypatch):
-    # This quant method is sensitive to dummy weights, so we force real weights
-    monkeypatch.setenv('VLLM_TEST_FORCE_LOAD_FORMAT', 'auto')
-    # Test GPTQ Marlin
-    compare_two_settings("Qwen/Qwen2-1.5B-Instruct-GPTQ-Int4", [],
-                         ["--cpu-offload-gb", "1"],
-                         max_wait_seconds=480)
-    # Test GPTQ
-    compare_two_settings("Qwen/Qwen2-1.5B-Instruct-GPTQ-Int4",
-                         ["--quantization", "gptq"],
-                         ["--quantization", "gptq", "--cpu-offload-gb", "1"],
-                         max_wait_seconds=480)
-
-
-@pytest.mark.skipif(not is_quant_method_supported("awq_marlin"),
-                    reason="awq_marlin is not supported on this GPU type.")
-def test_cpu_offload_awq(monkeypatch):
-    # This quant method is sensitive to dummy weights, so we force real weights
-    monkeypatch.setenv('VLLM_TEST_FORCE_LOAD_FORMAT', 'auto')
-    # Test AWQ Marlin
-    compare_two_settings("Qwen/Qwen2-1.5B-Instruct-AWQ", [],
-                         ["--cpu-offload-gb", "1"],
-                         max_wait_seconds=480)
-    # Test AWQ
-    compare_two_settings("Qwen/Qwen2-1.5B-Instruct-AWQ",
-                         ["--quantization", "awq"],
-                         ["--quantization", "awq", "--cpu-offload-gb", "1"],
-                         max_wait_seconds=480)
-
-
-@pytest.mark.skipif(not is_quant_method_supported("gptq_marlin"),
-                    reason="gptq_marlin is not supported on this GPU type.")
-def test_cpu_offload_compressed_tensors(monkeypatch):
-    # This quant method is sensitive to dummy weights, so we force real weights
-    monkeypatch.setenv('VLLM_TEST_FORCE_LOAD_FORMAT', 'auto')
-    # Test wNa16
-    compare_two_settings("nm-testing/tinyllama-oneshot-w4a16-channel-v2", [],
-                         ["--cpu-offload-gb", "1"],
-                         max_wait_seconds=480)
-    # Test w4a16_marlin24
-    compare_two_settings("nm-testing/llama7b-one-shot-2_4-w4a16-marlin24-t",
-                         [], ["--cpu-offload-gb", "1"],
-                         max_wait_seconds=480)
-    # Test w8a8
-    compare_two_settings(
-        "nm-testing/tinyllama-oneshot-w8w8-test-static-shape-change", [],
-        ["--cpu-offload-gb", "1"],
-        max_wait_seconds=480)
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+# Expanded quantized model tests for CPU offloading
+# Base tests: tests/basic_correctness/test_cpu_offload.py
+
+import pytest
+
+from tests.quantization.utils import is_quant_method_supported
+
+from ..utils import compare_two_settings
+
+
+@pytest.mark.skipif(
+    not is_quant_method_supported("fp8"),
+    reason="fp8 is not supported on this GPU type.",
+)
+def test_cpu_offload_fp8():
+    # Test quantization of an unquantized checkpoint
+    compare_two_settings(
+        "meta-llama/Llama-3.2-1B-Instruct",
+        ["--quantization", "fp8"],
+        ["--quantization", "fp8", "--cpu-offload-gb", "1"],
+        max_wait_seconds=480,
+    )
+    # Test loading a quantized checkpoint
+    compare_two_settings(
+        "neuralmagic/Qwen2-1.5B-Instruct-FP8",
+        [],
+        ["--cpu-offload-gb", "1"],
+        max_wait_seconds=480,
+    )
+
+
+@pytest.mark.skipif(
+    not is_quant_method_supported("gptq_marlin"),
+    reason="gptq_marlin is not supported on this GPU type.",
+)
+def test_cpu_offload_gptq(monkeypatch):
+    # This quant method is sensitive to dummy weights, so we force real weights
+    monkeypatch.setenv("VLLM_TEST_FORCE_LOAD_FORMAT", "auto")
+    # Test GPTQ Marlin
+    compare_two_settings(
+        "Qwen/Qwen2-1.5B-Instruct-GPTQ-Int4",
+        [],
+        ["--cpu-offload-gb", "1"],
+        max_wait_seconds=480,
+    )
+    # Test GPTQ
+    compare_two_settings(
+        "Qwen/Qwen2-1.5B-Instruct-GPTQ-Int4",
+        ["--quantization", "gptq"],
+        ["--quantization", "gptq", "--cpu-offload-gb", "1"],
+        max_wait_seconds=480,
+    )
+
+
+@pytest.mark.skipif(
+    not is_quant_method_supported("awq_marlin"),
+    reason="awq_marlin is not supported on this GPU type.",
+)
+def test_cpu_offload_awq(monkeypatch):
+    # This quant method is sensitive to dummy weights, so we force real weights
+    monkeypatch.setenv("VLLM_TEST_FORCE_LOAD_FORMAT", "auto")
+    # Test AWQ Marlin
+    compare_two_settings(
+        "Qwen/Qwen2-1.5B-Instruct-AWQ",
+        [],
+        ["--cpu-offload-gb", "1"],
+        max_wait_seconds=480,
+    )
+    # Test AWQ
+    compare_two_settings(
+        "Qwen/Qwen2-1.5B-Instruct-AWQ",
+        ["--quantization", "awq"],
+        ["--quantization", "awq", "--cpu-offload-gb", "1"],
+        max_wait_seconds=480,
+    )
+
+
+@pytest.mark.skipif(
+    not is_quant_method_supported("gptq_marlin"),
+    reason="gptq_marlin is not supported on this GPU type.",
+)
+def test_cpu_offload_compressed_tensors(monkeypatch):
+    # This quant method is sensitive to dummy weights, so we force real weights
+    monkeypatch.setenv("VLLM_TEST_FORCE_LOAD_FORMAT", "auto")
+    # Test wNa16
+    compare_two_settings(
+        "nm-testing/tinyllama-oneshot-w4a16-channel-v2",
+        [],
+        ["--cpu-offload-gb", "1"],
+        max_wait_seconds=480,
+    )
+    # Test w4a16_marlin24
+    compare_two_settings(
+        "nm-testing/llama7b-one-shot-2_4-w4a16-marlin24-t",
+        [],
+        ["--cpu-offload-gb", "1"],
+        max_wait_seconds=480,
+    )
+    # Test w8a8
+    compare_two_settings(
+        "nm-testing/tinyllama-oneshot-w8w8-test-static-shape-change",
+        [],
+        ["--cpu-offload-gb", "1"],
+        max_wait_seconds=480,
+    )
diff --git a/tests/quantization/test_experts_int8.py b/tests/quantization/test_experts_int8.py
index 1e3e69e008bd..2a72f734e431 100644
--- a/tests/quantization/test_experts_int8.py
+++ b/tests/quantization/test_experts_int8.py
@@ -2,9 +2,10 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 # flake8: noqa
-"""Tests experts_int8 quantization startup and generation, 
+"""Tests experts_int8 quantization startup and generation,
 doesn't test correctness
 """
+
 import pytest
 
 from tests.quantization.utils import is_quant_method_supported
@@ -14,8 +15,10 @@
 MODELS = ["ai21labs/Jamba-tiny-random", "pfnet/plamo-2-1b"]
 
 
-@pytest.mark.skipif(not is_quant_method_supported("experts_int8"),
-                    reason="ExpertsInt8 is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("experts_int8"),
+    reason="ExpertsInt8 is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("model", MODELS)
 @pytest.mark.parametrize("dtype", ["bfloat16"])
 @pytest.mark.parametrize("max_tokens", [10])
@@ -30,6 +33,5 @@ def test_model_experts_int8_startup(
     model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
     model_info.check_transformers_version(on_fail="skip")
 
-    with vllm_runner(model, dtype=dtype,
-                     quantization="experts_int8") as vllm_model:
+    with vllm_runner(model, dtype=dtype, quantization="experts_int8") as vllm_model:
         vllm_model.generate_greedy(example_prompts, max_tokens)
diff --git a/tests/quantization/test_fp8.py b/tests/quantization/test_fp8.py
index db53061cf2d1..6b9a33059815 100644
--- a/tests/quantization/test_fp8.py
+++ b/tests/quantization/test_fp8.py
@@ -4,13 +4,16 @@
 
 Run `pytest tests/quantization/test_fp8.py --forked`.
 """
+
 import pytest
 import torch
 
 from tests.quantization.utils import is_quant_method_supported
 from vllm import _custom_ops as ops
-from vllm.model_executor.layers.quantization.fp8 import (Fp8KVCacheMethod,
-                                                         Fp8LinearMethod)
+from vllm.model_executor.layers.quantization.fp8 import (
+    Fp8KVCacheMethod,
+    Fp8LinearMethod,
+)
 from vllm.platforms import current_platform
 
 MODELS = [
@@ -20,15 +23,18 @@
 ]
 
 
-@pytest.mark.skipif(not is_quant_method_supported("fp8"),
-                    reason="FP8 is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("fp8"),
+    reason="FP8 is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("model_id", MODELS)
 @pytest.mark.parametrize("force_marlin", [False, True])
 @pytest.mark.parametrize(
-    "use_rocm_aiter", [True, False] if current_platform.is_rocm() else [False])
-def test_model_load_and_run(vllm_runner, model_id: str, force_marlin: bool,
-                            use_rocm_aiter: bool, monkeypatch) -> None:
-
+    "use_rocm_aiter", [True, False] if current_platform.is_rocm() else [False]
+)
+def test_model_load_and_run(
+    vllm_runner, model_id: str, force_marlin: bool, use_rocm_aiter: bool, monkeypatch
+) -> None:
     if use_rocm_aiter:
         monkeypatch.setenv("VLLM_ROCM_USE_AITER", "1")
 
@@ -50,13 +56,17 @@ def test_model_load_and_run(vllm_runner, model_id: str, force_marlin: bool,
 ]
 
 
-@pytest.mark.skipif(not is_quant_method_supported("fp8"),
-                    reason="FP8 is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("fp8"),
+    reason="FP8 is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("model_id", KV_CACHE_MODELS)
 @pytest.mark.parametrize(
-    "use_rocm_aiter", [True, False] if current_platform.is_rocm() else [False])
-def test_kv_cache_model_load_and_run(vllm_runner, model_id: str,
-                                     use_rocm_aiter: bool, monkeypatch):
+    "use_rocm_aiter", [True, False] if current_platform.is_rocm() else [False]
+)
+def test_kv_cache_model_load_and_run(
+    vllm_runner, model_id: str, use_rocm_aiter: bool, monkeypatch
+):
     if use_rocm_aiter:
         monkeypatch.setenv("VLLM_ROCM_USE_AITER", "1")
 
@@ -93,14 +103,22 @@ def check_model(model):
         print(outputs[0][1])
 
 
-@pytest.mark.skipif(not is_quant_method_supported("fp8"),
-                    reason="FP8 is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("fp8"),
+    reason="FP8 is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("kv_cache_dtype", ["auto", "fp8"])
 @pytest.mark.parametrize("force_marlin", [False, True])
 @pytest.mark.parametrize(
-    "use_rocm_aiter", [True, False] if current_platform.is_rocm() else [False])
-def test_load_fp16_model(vllm_runner, kv_cache_dtype: str, force_marlin: bool,
-                         use_rocm_aiter: bool, monkeypatch) -> None:
+    "use_rocm_aiter", [True, False] if current_platform.is_rocm() else [False]
+)
+def test_load_fp16_model(
+    vllm_runner,
+    kv_cache_dtype: str,
+    force_marlin: bool,
+    use_rocm_aiter: bool,
+    monkeypatch,
+) -> None:
     if use_rocm_aiter:
         monkeypatch.setenv("VLLM_ROCM_USE_AITER", "1")
 
@@ -110,9 +128,9 @@ def test_load_fp16_model(vllm_runner, kv_cache_dtype: str, force_marlin: bool,
     if force_marlin:
         monkeypatch.setenv("VLLM_TEST_FORCE_FP8_MARLIN", "1")
 
-    with vllm_runner("facebook/opt-125m",
-                     quantization="fp8",
-                     kv_cache_dtype=kv_cache_dtype) as llm:
+    with vllm_runner(
+        "facebook/opt-125m", quantization="fp8", kv_cache_dtype=kv_cache_dtype
+    ) as llm:
 
         def check_model(model):
             fc1 = model.model.decoder.layers[0].fc1
@@ -139,26 +157,29 @@ def check_model(model):
                     pytest.skip(
                         "Skip `test_load_fp16_model`. "
                         "It only runs on ROCm platform with FP8 compute."
-                        " e.g. MI300X and above.")
+                        " e.g. MI300X and above."
+                    )
             else:  # unsupported platform
-                pytest.skip("Skip `test_load_fp16_model`. "
-                            "It only runs on CUDA and ROCm platform.")
+                pytest.skip(
+                    "Skip `test_load_fp16_model`. "
+                    "It only runs on CUDA and ROCm platform."
+                )
 
         llm.apply_model(check_model)
 
 
-@pytest.mark.skipif(not is_quant_method_supported("fp8"),
-                    reason="FP8 is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("fp8"),
+    reason="FP8 is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("dtype", [torch.float16, torch.bfloat16])
 def test_scaled_fp8_quant(dtype) -> None:
-
     def quantize_ref(tensor, inv_scale):
         # The reference implementation that fully aligns to
         # the kernel being tested.
         finfo = torch.finfo(torch.float8_e4m3fn)
         scale = inv_scale.reciprocal()
-        qweight = (tensor.to(torch.float32) * scale).clamp(min=finfo.min,
-                                                           max=finfo.max)
+        qweight = (tensor.to(torch.float32) * scale).clamp(min=finfo.min, max=finfo.max)
         qweight = qweight.to(torch.float8_e4m3fn)
         return qweight
 
@@ -177,26 +198,23 @@ def per_tensor_dequantize(tensor, inv_scale, dtype):
 
     # Reference dynamic quantizaton
     y = quantize_ref(x, inv_scale)
-    torch.testing.assert_close(ref_y,
-                               per_tensor_dequantize(y, inv_scale, dtype))
+    torch.testing.assert_close(ref_y, per_tensor_dequantize(y, inv_scale, dtype))
 
     # Static quantization
     y, _ = ops.scaled_fp8_quant(x, inv_scale)
-    torch.testing.assert_close(ref_y,
-                               per_tensor_dequantize(y, inv_scale, dtype))
+    torch.testing.assert_close(ref_y, per_tensor_dequantize(y, inv_scale, dtype))
 
     # Padding
     y, _ = ops.scaled_fp8_quant(x, inv_scale, num_token_padding=17)
     assert y.shape[0] == 17
     torch.testing.assert_close(
         ref_y,
-        per_tensor_dequantize(torch.narrow(y, 0, 0, x.shape[0]), inv_scale,
-                              dtype))
+        per_tensor_dequantize(torch.narrow(y, 0, 0, x.shape[0]), inv_scale, dtype),
+    )
 
     # non-contiguous input with padding
     m, n, padded_stride = 975, 512, 576
-    padded_tensor = (torch.randn(size=(m, padded_stride), device="cuda") *
-                     13).to(dtype)
+    padded_tensor = (torch.randn(size=(m, padded_stride), device="cuda") * 13).to(dtype)
     x_nc = padded_tensor[:, :n]  # shape (m, n) with stride (padded_stride, 1)
 
     assert not x_nc.is_contiguous()
@@ -209,19 +227,21 @@ def per_tensor_dequantize(tensor, inv_scale, dtype):
     # reference dynamic quantization
     y_nc = quantize_ref(x_nc, inv_scale_nc)
     torch.testing.assert_close(
-        ref_y_nc, per_tensor_dequantize(y_nc, inv_scale_nc, dtype))
+        ref_y_nc, per_tensor_dequantize(y_nc, inv_scale_nc, dtype)
+    )
 
     # static quantization
     y_nc, _ = ops.scaled_fp8_quant(x_nc, inv_scale_nc)
     torch.testing.assert_close(
-        ref_y_nc, per_tensor_dequantize(y_nc, inv_scale_nc, dtype))
+        ref_y_nc, per_tensor_dequantize(y_nc, inv_scale_nc, dtype)
+    )
 
     # padding after non-contiguous input quantization
-    y_nc_pad, _ = ops.scaled_fp8_quant(x_nc,
-                                       inv_scale_nc,
-                                       num_token_padding=m + 10)
+    y_nc_pad, _ = ops.scaled_fp8_quant(x_nc, inv_scale_nc, num_token_padding=m + 10)
     assert y_nc_pad.shape[0] == m + 10
     torch.testing.assert_close(
         ref_y_nc,
-        per_tensor_dequantize(torch.narrow(y_nc_pad, 0, 0, x_nc.shape[0]),
-                              inv_scale_nc, dtype))
+        per_tensor_dequantize(
+            torch.narrow(y_nc_pad, 0, 0, x_nc.shape[0]), inv_scale_nc, dtype
+        ),
+    )
diff --git a/tests/quantization/test_gptq_dynamic.py b/tests/quantization/test_gptq_dynamic.py
index 00a5946ed015..c71f4b815611 100644
--- a/tests/quantization/test_gptq_dynamic.py
+++ b/tests/quantization/test_gptq_dynamic.py
@@ -10,10 +10,10 @@
 
 from vllm.model_executor.layers.linear import UnquantizedLinearMethod
 from vllm.model_executor.layers.quantization.gptq import GPTQLinearMethod
-from vllm.model_executor.layers.quantization.gptq_marlin import (
-    GPTQMarlinLinearMethod)
+from vllm.model_executor.layers.quantization.gptq_marlin import GPTQMarlinLinearMethod
 from vllm.model_executor.layers.quantization.utils.gptq_utils import (
-    get_dynamic_override)
+    get_dynamic_override,
+)
 
 PROMPT = "On the surface of Mars, we found"
 
@@ -21,56 +21,59 @@
 # The second layer is quantized using bits=8, group_size=32
 # All other layers (layer index >= 2) are not quantized
 MODEL_QUANT = [
-    ("ModelCloud/Qwen1.5-1.8B-Chat-GPTQ-4bits-dynamic-cfg-with-lm_head-symTrue",
-     True),
-    ("ModelCloud/Qwen1.5-1.8B-Chat-GPTQ-4bits-dynamic-cfg-with-lm_head-symFalse",
-     False),
+    ("ModelCloud/Qwen1.5-1.8B-Chat-GPTQ-4bits-dynamic-cfg-with-lm_head-symTrue", True),
+    (
+        "ModelCloud/Qwen1.5-1.8B-Chat-GPTQ-4bits-dynamic-cfg-with-lm_head-symFalse",
+        False,
+    ),
 ]
 
 
 @pytest.mark.parametrize("model_id, use_marlin_kernel", MODEL_QUANT)
-def test_gptq_with_dynamic(vllm_runner, model_id: str, use_marlin_kernel: bool,
-                           monkeypatch):
+def test_gptq_with_dynamic(
+    vllm_runner, model_id: str, use_marlin_kernel: bool, monkeypatch
+):
     # `LLM.apply_model` requires pickling a function.
     monkeypatch.setenv("VLLM_ALLOW_INSECURE_SERIALIZATION", "1")
 
-    linear_method_cls = GPTQMarlinLinearMethod if use_marlin_kernel else (
-        GPTQLinearMethod)
+    linear_method_cls = (
+        GPTQMarlinLinearMethod if use_marlin_kernel else (GPTQLinearMethod)
+    )
 
     with vllm_runner(model_id, dtype=torch.float16, max_model_len=2048) as llm:
 
         def check_model(model):
             for name, submodule in model.named_modules():
                 if name == "lm_head":
-                    assert isinstance(submodule.quant_method,
-                                      linear_method_cls)
-                elif name == 'model.layers.0.self_attn.qkv_proj':
+                    assert isinstance(submodule.quant_method, linear_method_cls)
+                elif name == "model.layers.0.self_attn.qkv_proj":
                     # The first layer is quantized using bits=4, group_size=128
                     # desc_act=True
-                    assert isinstance(submodule.quant_method,
-                                      linear_method_cls)
+                    assert isinstance(submodule.quant_method, linear_method_cls)
                     config = submodule.quant_method.quant_config
                     assert config.weight_bits == 4
                     assert config.group_size == 128
                     assert config.desc_act
-                elif name == 'model.layers.1.self_attn.qkv_proj':
+                elif name == "model.layers.1.self_attn.qkv_proj":
                     # The second layer is quantized using bits=8, group_size=32
                     # desc_act=False
-                    assert isinstance(submodule.quant_method,
-                                      linear_method_cls)
+                    assert isinstance(submodule.quant_method, linear_method_cls)
                     config = submodule.quant_method.quant_config
-                    assert get_dynamic_override(config,
-                                                layer_name=name,
-                                                key="bits") == 8
-                    assert get_dynamic_override(config,
-                                                layer_name=name,
-                                                key="group_size") == 32
+                    assert (
+                        get_dynamic_override(config, layer_name=name, key="bits") == 8
+                    )
+                    assert (
+                        get_dynamic_override(config, layer_name=name, key="group_size")
+                        == 32
+                    )
                     assert not get_dynamic_override(
-                        config, layer_name=name, key="desc_act")
-                elif (name == 'model.layers.2.self_attn.qkv_proj'
-                      or name == 'model.layers.2.mlp.gate_up_proj'):
+                        config, layer_name=name, key="desc_act"
+                    )
+                elif (
+                    name == "model.layers.2.self_attn.qkv_proj"
+                    or name == "model.layers.2.mlp.gate_up_proj"
+                ):
                     # All other layers (layer index >= 2) are not quantized
-                    assert isinstance(submodule.quant_method,
-                                      UnquantizedLinearMethod)
+                    assert isinstance(submodule.quant_method, UnquantizedLinearMethod)
 
         llm.apply_model(check_model)
diff --git a/tests/quantization/test_ipex_quant.py b/tests/quantization/test_ipex_quant.py
index 34b1b6c2e5b6..ae9b1df3377d 100644
--- a/tests/quantization/test_ipex_quant.py
+++ b/tests/quantization/test_ipex_quant.py
@@ -1,11 +1,11 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Test model set-up and inference for quantized HF models supported
- on the CPU/GPU backend using IPEX (including AWQ/GPTQ).
- 
- Validating the configuration and printing results for manual checking.
+on the CPU/GPU backend using IPEX (including AWQ/GPTQ).
 
- Run `pytest tests/quantization/test_ipex_quant.py`.
+Validating the configuration and printing results for manual checking.
+
+Run `pytest tests/quantization/test_ipex_quant.py`.
 """
 
 import pytest
@@ -19,14 +19,14 @@
 DTYPE = ["bfloat16"]
 
 
-@pytest.mark.skipif(not current_platform.is_cpu()
-                    and not current_platform.is_xpu(),
-                    reason="only supports Intel CPU/XPU backend.")
+@pytest.mark.skipif(
+    not current_platform.is_cpu() and not current_platform.is_xpu(),
+    reason="only supports Intel CPU/XPU backend.",
+)
 @pytest.mark.parametrize("model", MODELS)
 @pytest.mark.parametrize("dtype", DTYPE)
 def test_ipex_quant(vllm_runner, model, dtype):
     with vllm_runner(model, dtype=dtype) as llm:
-        output = llm.generate_greedy(["The capital of France is"],
-                                     max_tokens=32)
+        output = llm.generate_greedy(["The capital of France is"], max_tokens=32)
     assert output
     print(output)
diff --git a/tests/quantization/test_lm_head.py b/tests/quantization/test_lm_head.py
index e69d4ad349c3..bae8b7f7d535 100644
--- a/tests/quantization/test_lm_head.py
+++ b/tests/quantization/test_lm_head.py
@@ -9,10 +9,10 @@
 import torch
 
 from vllm.model_executor.layers.quantization.gptq import GPTQLinearMethod
-from vllm.model_executor.layers.quantization.gptq_marlin import (
-    GPTQMarlinLinearMethod)
+from vllm.model_executor.layers.quantization.gptq_marlin import GPTQMarlinLinearMethod
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    UnquantizedEmbeddingMethod)
+    UnquantizedEmbeddingMethod,
+)
 
 PROMPT = "On the surface of Mars, we found"
 
@@ -31,20 +31,20 @@ def test_lm_head(
 ) -> None:
     # `LLM.apply_model` requires pickling a function.
     monkeypatch.setenv("VLLM_ALLOW_INSECURE_SERIALIZATION", "1")
-    with vllm_runner(model_id, dtype=torch.float16,
-                     max_model_len=2048) as vllm_model:
+    with vllm_runner(model_id, dtype=torch.float16, max_model_len=2048) as vllm_model:
 
         def check_model(model):
             lm_head_layer = model.lm_head
             if lm_head_quantized:
-                assert isinstance(lm_head_layer.quant_method,
-                                  (GPTQLinearMethod, GPTQMarlinLinearMethod))
+                assert isinstance(
+                    lm_head_layer.quant_method,
+                    (GPTQLinearMethod, GPTQMarlinLinearMethod),
+                )
             else:
-                assert isinstance(lm_head_layer.quant_method,
-                                  UnquantizedEmbeddingMethod)
+                assert isinstance(
+                    lm_head_layer.quant_method, UnquantizedEmbeddingMethod
+                )
 
         vllm_model.apply_model(check_model)
 
-        print(
-            vllm_model.generate_greedy(["Hello my name is"],
-                                       max_tokens=10)[0][1])
+        print(vllm_model.generate_greedy(["Hello my name is"], max_tokens=10)[0][1])
diff --git a/tests/quantization/test_modelopt.py b/tests/quantization/test_modelopt.py
index e7174be73626..8abf65d29784 100644
--- a/tests/quantization/test_modelopt.py
+++ b/tests/quantization/test_modelopt.py
@@ -19,21 +19,26 @@ def enable_pickle(monkeypatch):
     monkeypatch.setenv("VLLM_ALLOW_INSECURE_SERIALIZATION", "1")
 
 
-@pytest.mark.skipif(not is_quant_method_supported("modelopt"),
-                    reason="ModelOpt FP8 is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("modelopt"),
+    reason="ModelOpt FP8 is not supported on this GPU type.",
+)
 def test_modelopt_fp8_checkpoint_setup(vllm_runner):
     """Test ModelOpt FP8 checkpoint loading and structure validation."""
     # TODO: provide a small publicly available test checkpoint
-    model_path = ("/home/scratch.omniml_data_1/zhiyu/ckpts/test_ckpts/"
-                  "TinyLlama-1.1B-Chat-v1.0-fp8-0710")
+    model_path = (
+        "/home/scratch.omniml_data_1/zhiyu/ckpts/test_ckpts/"
+        "TinyLlama-1.1B-Chat-v1.0-fp8-0710"
+    )
 
     # Skip test if checkpoint doesn't exist
     if not os.path.exists(model_path):
-        pytest.skip(f"Test checkpoint not found at {model_path}. "
-                    "This test requires a local ModelOpt FP8 checkpoint.")
+        pytest.skip(
+            f"Test checkpoint not found at {model_path}. "
+            "This test requires a local ModelOpt FP8 checkpoint."
+        )
 
-    with vllm_runner(model_path, quantization="modelopt",
-                     enforce_eager=True) as llm:
+    with vllm_runner(model_path, quantization="modelopt", enforce_eager=True) as llm:
 
         def check_model(model):
             layer = model.model.layers[0]
@@ -45,11 +50,12 @@ def check_model(model):
 
             # Check that ModelOpt quantization method is properly applied
             from vllm.model_executor.layers.quantization.modelopt import (
-                ModelOptFp8LinearMethod)
+                ModelOptFp8LinearMethod,
+            )
+
             assert isinstance(qkv_proj.quant_method, ModelOptFp8LinearMethod)
             assert isinstance(o_proj.quant_method, ModelOptFp8LinearMethod)
-            assert isinstance(gate_up_proj.quant_method,
-                              ModelOptFp8LinearMethod)
+            assert isinstance(gate_up_proj.quant_method, ModelOptFp8LinearMethod)
             assert isinstance(down_proj.quant_method, ModelOptFp8LinearMethod)
 
             # Check weight dtype is FP8
@@ -59,23 +65,23 @@ def check_model(model):
             assert down_proj.weight.dtype == torch.float8_e4m3fn
 
             # Check scales are present and have correct dtype
-            assert hasattr(qkv_proj, 'weight_scale')
-            assert hasattr(qkv_proj, 'input_scale')
+            assert hasattr(qkv_proj, "weight_scale")
+            assert hasattr(qkv_proj, "input_scale")
             assert qkv_proj.weight_scale.dtype == torch.float32
             assert qkv_proj.input_scale.dtype == torch.float32
 
-            assert hasattr(o_proj, 'weight_scale')
-            assert hasattr(o_proj, 'input_scale')
+            assert hasattr(o_proj, "weight_scale")
+            assert hasattr(o_proj, "input_scale")
             assert o_proj.weight_scale.dtype == torch.float32
             assert o_proj.input_scale.dtype == torch.float32
 
-            assert hasattr(gate_up_proj, 'weight_scale')
-            assert hasattr(gate_up_proj, 'input_scale')
+            assert hasattr(gate_up_proj, "weight_scale")
+            assert hasattr(gate_up_proj, "input_scale")
             assert gate_up_proj.weight_scale.dtype == torch.float32
             assert gate_up_proj.input_scale.dtype == torch.float32
 
-            assert hasattr(down_proj, 'weight_scale')
-            assert hasattr(down_proj, 'input_scale')
+            assert hasattr(down_proj, "weight_scale")
+            assert hasattr(down_proj, "input_scale")
             assert down_proj.weight_scale.dtype == torch.float32
             assert down_proj.input_scale.dtype == torch.float32
 
diff --git a/tests/quantization/test_ptpc_fp8.py b/tests/quantization/test_ptpc_fp8.py
index 088b68510cff..e8ea4148585b 100644
--- a/tests/quantization/test_ptpc_fp8.py
+++ b/tests/quantization/test_ptpc_fp8.py
@@ -4,18 +4,19 @@
 
 Run `pytest tests/quantization/test_ptpc_fp8.py --forked`.
 """
+
 import pytest
 import torch
 
 from tests.quantization.utils import is_quant_method_supported
 from vllm.model_executor.layers.quantization.fp8 import Fp8KVCacheMethod
-from vllm.model_executor.layers.quantization.ptpc_fp8 import (
-    PTPCFp8LinearMethod)
+from vllm.model_executor.layers.quantization.ptpc_fp8 import PTPCFp8LinearMethod
 from vllm.platforms import current_platform
 
 UNSUPPORTED_STR = (
     "Currently torch._scaled_mm (hipBLASLt) rowwise gemm only "
-    "support output dtype of bfloat16. torch.float16 is specified.")
+    "support output dtype of bfloat16. torch.float16 is specified."
+)
 
 
 @pytest.fixture(scope="function", autouse=True)
@@ -24,18 +25,21 @@ def enable_pickle(monkeypatch):
     monkeypatch.setenv("VLLM_ALLOW_INSECURE_SERIALIZATION", "1")
 
 
-@pytest.mark.skipif(not is_quant_method_supported("ptpc_fp8"),
-                    reason="PTPC FP8 is not supported on this GPU type.")
-@pytest.mark.skipif(not current_platform.is_rocm(),
-                    reason="This test is for ROCm GPU.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("ptpc_fp8"),
+    reason="PTPC FP8 is not supported on this GPU type.",
+)
+@pytest.mark.skipif(not current_platform.is_rocm(), reason="This test is for ROCm GPU.")
 @pytest.mark.parametrize("dtype", ["auto", "bfloat16", "float16"])
 @pytest.mark.parametrize("kv_cache_dtype", ["auto", "fp8", "fp8_e4m3"])
 def test_ptpc_fp8_rocm(vllm_runner, dtype: str, kv_cache_dtype: str) -> None:
     try:
-        llm = vllm_runner("facebook/opt-125m",
-                          dtype=dtype,
-                          quantization="ptpc_fp8",
-                          kv_cache_dtype=kv_cache_dtype)
+        llm = vllm_runner(
+            "facebook/opt-125m",
+            dtype=dtype,
+            quantization="ptpc_fp8",
+            kv_cache_dtype=kv_cache_dtype,
+        )
     except AssertionError as e:
         if str(e) == UNSUPPORTED_STR:
             # If the error message matches, the test passes
diff --git a/tests/quantization/test_quark.py b/tests/quantization/test_quark.py
index 930f4acb328f..6c047259c177 100644
--- a/tests/quantization/test_quark.py
+++ b/tests/quantization/test_quark.py
@@ -19,23 +19,27 @@
 from packaging import version
 
 from vllm.model_executor.layers.quantization.quark.quark import (  # noqa: E501
-    QuarkLinearMethod, QuarkW8A8Fp8, QuarkW8A8Int8)
+    QuarkLinearMethod,
+    QuarkW8A8Fp8,
+    QuarkW8A8Int8,
+)
 from vllm.platforms import current_platform
 
 from .reference_mxfp4 import dq_mxfp4_torch, qdq_mxfp4_torch
 
 QUARK_MXFP4_AVAILABLE = find_spec("quark") is not None and version.parse(
-    importlib.metadata.version("amd-quark")) >= version.parse('0.8.99')
+    importlib.metadata.version("amd-quark")
+) >= version.parse("0.8.99")
 
 if QUARK_MXFP4_AVAILABLE:
-    from quark.torch.export.nn.modules.realquantizer import (
-        StaticScaledRealQuantizer)
+    from quark.torch.export.nn.modules.realquantizer import StaticScaledRealQuantizer
     from quark.torch.kernel import mx as mx_kernel
     from quark.torch.quantization.config.config import FP4PerGroupSpec
 
 try:
     huggingface_hub.list_repo_refs(
-        "amd/Llama-3.3-70B-Instruct-WMXFP4-AMXFP4-KVFP8-Scale-UINT8-SQ")
+        "amd/Llama-3.3-70B-Instruct-WMXFP4-AMXFP4-KVFP8-Scale-UINT8-SQ"
+    )
     HF_HUB_AMD_ORG_ACCESS = True
 except huggingface_hub.errors.RepositoryNotFoundError:
     HF_HUB_AMD_ORG_ACCESS = False
@@ -47,13 +51,13 @@ def enable_pickle(monkeypatch):
     monkeypatch.setenv("VLLM_ALLOW_INSECURE_SERIALIZATION", "1")
 
 
-@pytest.mark.parametrize('kv_cache_dtype', ['auto', 'fp8'])
-@pytest.mark.parametrize('tp', [1])
+@pytest.mark.parametrize("kv_cache_dtype", ["auto", "fp8"])
+@pytest.mark.parametrize("tp", [1])
 def test_quark_fp8_w_per_tensor_a_per_tensor(vllm_runner, kv_cache_dtype, tp):
     model_path = "amd/Llama-3.1-8B-Instruct-FP8-KV-Quark-test"
-    with vllm_runner(model_path,
-                     kv_cache_dtype=kv_cache_dtype,
-                     tensor_parallel_size=tp) as llm:
+    with vllm_runner(
+        model_path, kv_cache_dtype=kv_cache_dtype, tensor_parallel_size=tp
+    ) as llm:
 
         def check_model(model):
             layer = model.model.layers[0]
@@ -74,7 +78,7 @@ def check_model(model):
         assert output
 
 
-@pytest.mark.parametrize('tp', [1])
+@pytest.mark.parametrize("tp", [1])
 def test_quark_fp8_w_per_channel_a_per_token(vllm_runner, tp):
     model_path = "amd/Qwen2.5-1.5B-Instruct-ptpc-Quark-ts"
     with vllm_runner(model_path, tensor_parallel_size=tp) as llm:
@@ -89,8 +93,7 @@ def check_model(model):
 
             if isinstance(qkv_proj.scheme, QuarkW8A8Fp8):
                 assert qkv_proj.weight.dtype is current_platform.fp8_dtype()
-                assert qkv_proj.weight_scale.shape[0] == qkv_proj.weight.shape[
-                    1]
+                assert qkv_proj.weight_scale.shape[0] == qkv_proj.weight.shape[1]
                 assert qkv_proj.weight_scale.shape[1] == 1
 
         llm.apply_model(check_model)
@@ -99,7 +102,7 @@ def check_model(model):
         assert output
 
 
-@pytest.mark.parametrize('tp', [1])
+@pytest.mark.parametrize("tp", [1])
 def test_quark_int8_w_per_tensor_a_per_tensor(vllm_runner, tp):
     model_path = "amd/Llama-3.1-8B-Instruct-w-int8-a-int8-sym-test"
     with vllm_runner(model_path, tensor_parallel_size=tp) as llm:
@@ -125,16 +128,18 @@ def test_quark_fp8_parity(vllm_runner):
     llm_kwargs = {
         "tensor_parallel_size": 1,
         "enforce_eager": True,
-        "gpu_memory_utilization": 0.1
+        "gpu_memory_utilization": 0.1,
     }
-    with (vllm_runner(quark_model_id, **llm_kwargs) as
-          quark_handle, vllm_runner(fp8_model_id, **llm_kwargs) as fp8_handle):
+    with (
+        vllm_runner(quark_model_id, **llm_kwargs) as quark_handle,
+        vllm_runner(fp8_model_id, **llm_kwargs) as fp8_handle,
+    ):
 
         def get_state_dict(model):
             return {k: v.cpu() for k, v in model.state_dict().items()}
 
-        quark_state_dict, = quark_handle.apply_model(get_state_dict)
-        fp8_state_dict, = fp8_handle.apply_model(get_state_dict)
+        (quark_state_dict,) = quark_handle.apply_model(get_state_dict)
+        (fp8_state_dict,) = fp8_handle.apply_model(get_state_dict)
 
     assert fp8_state_dict.keys() == quark_state_dict.keys()
 
@@ -164,16 +169,17 @@ def get_model_args(self) -> str:
     # Private model.
     GSM8KAccuracyTestConfig(
         model_name="amd/DeepSeek-R1-WMXFP4-AMXFP4-Scale-UINT8-MoE-Quant",
-        excepted_value=0.96),
+        excepted_value=0.96,
+    ),
 ]
 
 
 @pytest.mark.parametrize("config", ACCURACY_CONFIGS)
-@pytest.mark.skipif(not QUARK_MXFP4_AVAILABLE,
-                    reason="amd-quark>=0.9 is not available")
+@pytest.mark.skipif(not QUARK_MXFP4_AVAILABLE, reason="amd-quark>=0.9 is not available")
 @pytest.mark.skipif(
     not HF_HUB_AMD_ORG_ACCESS,
-    reason="Read access to huggingface.co/amd is required for this test.")
+    reason="Read access to huggingface.co/amd is required for this test.",
+)
 def test_mxfp4_gsm8k_correctness(config: GSM8KAccuracyTestConfig):
     if torch.cuda.device_count() < 8:
         pytest.skip(
@@ -195,28 +201,26 @@ def test_mxfp4_gsm8k_correctness(config: GSM8KAccuracyTestConfig):
 
     EXPECTED_VALUE = config.excepted_value
     measured_value = results["results"][task]["exact_match,strict-match"]
-    assert (measured_value - rtol < EXPECTED_VALUE
-            and measured_value + rtol > EXPECTED_VALUE
-            ), f"Expected: {EXPECTED_VALUE} |  Measured: {measured_value}"
+    assert (
+        measured_value - rtol < EXPECTED_VALUE
+        and measured_value + rtol > EXPECTED_VALUE
+    ), f"Expected: {EXPECTED_VALUE} |  Measured: {measured_value}"
 
     del os.environ["VLLM_USE_TRITON_FLASH_ATTN"]
 
 
-@pytest.mark.skipif(not QUARK_MXFP4_AVAILABLE,
-                    reason="amd-quark>=0.9 is not available")
+@pytest.mark.skipif(not QUARK_MXFP4_AVAILABLE, reason="amd-quark>=0.9 is not available")
 @pytest.mark.parametrize("float_dtype", [torch.bfloat16, torch.float16])
-@pytest.mark.parametrize("scalings",
-                         [[2.3, 0.03, 7.3, 0.1, 0.004, 17.3, 1e4, 1e-4]])
-def test_mxfp4_fused_qdq_match_quark(float_dtype: torch.dtype,
-                                     scalings: list[int]):
+@pytest.mark.parametrize("scalings", [[2.3, 0.03, 7.3, 0.1, 0.004, 17.3, 1e4, 1e-4]])
+def test_mxfp4_fused_qdq_match_quark(float_dtype: torch.dtype, scalings: list[int]):
     torch.manual_seed(0)
 
     hidden_size = 64 * 32
-    inp = (torch.rand(1, hidden_size, dtype=float_dtype, device="cuda") -
-           0.5) * 2
+    inp = (torch.rand(1, hidden_size, dtype=float_dtype, device="cuda") - 0.5) * 2
     for i in range(hidden_size // 32):
-        inp[:, i * 32:(i + 1) *
-            32] = inp[:, i * 32:(i + 1) * 32] * scalings[i % len(scalings)]
+        inp[:, i * 32 : (i + 1) * 32] = (
+            inp[:, i * 32 : (i + 1) * 32] * scalings[i % len(scalings)]
+        )
 
     inp_kernel = inp.clone()
     inp_kernel_clone = inp_kernel.clone()
@@ -225,20 +229,20 @@ def test_mxfp4_fused_qdq_match_quark(float_dtype: torch.dtype,
     res_torch = qdq_mxfp4_torch(inp_kernel, "even")
 
     for i in range(hidden_size // 32):
-        assert torch.all(torch.isfinite(res_hip[:, i * 32:(i + 1) * 32]))
-        assert torch.all(torch.isfinite(res_torch[:, i * 32:(i + 1) * 32]))
+        assert torch.all(torch.isfinite(res_hip[:, i * 32 : (i + 1) * 32]))
+        assert torch.all(torch.isfinite(res_torch[:, i * 32 : (i + 1) * 32]))
 
-        torch.testing.assert_close(res_hip[:, i * 32:(i + 1) * 32],
-                                   res_torch[:, i * 32:(i + 1) * 32])
+        torch.testing.assert_close(
+            res_hip[:, i * 32 : (i + 1) * 32], res_torch[:, i * 32 : (i + 1) * 32]
+        )
 
 
-@pytest.mark.skipif(not QUARK_MXFP4_AVAILABLE,
-                    reason="amd-quark>=0.9 is not available")
+@pytest.mark.skipif(not QUARK_MXFP4_AVAILABLE, reason="amd-quark>=0.9 is not available")
 @pytest.mark.parametrize("float_dtype", [torch.bfloat16, torch.float16])
-@pytest.mark.parametrize("scalings",
-                         [[2.3, 0.03, 7.3, 0.1, 0.004, 17.3, 1e4, 1e-4]])
-def test_mxfp4_dequant_kernel_match_quark(float_dtype: torch.dtype,
-                                          scalings: list[int]):
+@pytest.mark.parametrize("scalings", [[2.3, 0.03, 7.3, 0.1, 0.004, 17.3, 1e4, 1e-4]])
+def test_mxfp4_dequant_kernel_match_quark(
+    float_dtype: torch.dtype, scalings: list[int]
+):
     qspec = FP4PerGroupSpec(
         ch_axis=-1,
         group_size=32,
@@ -265,8 +269,9 @@ def test_mxfp4_dequant_kernel_match_quark(float_dtype: torch.dtype,
 
     # Make it so that different groups have different scales.
     for i in range(hidden_size // 32):
-        w[:, i * 32:(i + 1) *
-          32] = w[:, i * 32:(i + 1) * 32] * scalings[i % len(scalings)]
+        w[:, i * 32 : (i + 1) * 32] = (
+            w[:, i * 32 : (i + 1) * 32] * scalings[i % len(scalings)]
+        )
 
     observer(w)
     scale, _ = observer._calculate_qparams()
diff --git a/tests/quantization/test_register_quantization_config.py b/tests/quantization/test_register_quantization_config.py
index 03fe59d7e3bf..b70c2ee7fe2e 100644
--- a/tests/quantization/test_register_quantization_config.py
+++ b/tests/quantization/test_register_quantization_config.py
@@ -6,18 +6,25 @@
 
 Run `pytest tests/quantization/test_register_quantization_config.py`.
 """
+
 from typing import Any, Optional
 
 import pytest
 import torch
 import torch.nn.functional as F
 
-from vllm.model_executor.layers.linear import LinearBase  # noqa: E501
-from vllm.model_executor.layers.linear import UnquantizedLinearMethod
+from vllm.model_executor.layers.linear import (
+    LinearBase,  # noqa: E501
+    UnquantizedLinearMethod,
+)
 from vllm.model_executor.layers.quantization import (
-    QuantizationMethods, get_quantization_config, register_quantization_config)
+    QuantizationMethods,
+    get_quantization_config,
+    register_quantization_config,
+)
 from vllm.model_executor.layers.quantization.base_config import (  # noqa: E501
-    QuantizationConfig)
+    QuantizationConfig,
+)
 
 
 class FakeQuantLinearMethod(UnquantizedLinearMethod):
@@ -28,10 +35,12 @@ def __init__(self, num_bits: int = 8) -> None:
         super().__init__()
         self.num_bits = num_bits
 
-    def apply(self,
-              layer: "torch.nn.Module",
-              x: "torch.Tensor",
-              bias: Optional["torch.Tensor"] = None) -> "torch.Tensor":
+    def apply(
+        self,
+        layer: "torch.nn.Module",
+        x: "torch.Tensor",
+        bias: Optional["torch.Tensor"] = None,
+    ) -> "torch.Tensor":
         """Perform fake quantization before the linear layer."""
 
         # Calculate the scales dynamically
@@ -40,8 +49,11 @@ def apply(self,
         scales = (max_val - min_val) / (2**self.num_bits - 1)
 
         # Fake quantize the input
-        quant_x = torch.clamp(torch.round(x / scales), -2**(self.num_bits - 1),
-                              2**(self.num_bits - 1) - 1)
+        quant_x = torch.clamp(
+            torch.round(x / scales),
+            -(2 ** (self.num_bits - 1)),
+            2 ** (self.num_bits - 1) - 1,
+        )
         dequant_x = quant_x * scales
 
         return F.linear(dequant_x, layer.weight, bias)
@@ -79,8 +91,9 @@ def from_config(cls, config: dict[str, Any]) -> "CustomQuantConfig":
         """Create a config class from the model's quantization config."""
         return CustomQuantConfig(num_bits=config.get("num_bits", 8))
 
-    def get_quant_method(self, layer: "torch.nn.Module",
-                         prefix: str) -> Optional["FakeQuantLinearMethod"]:
+    def get_quant_method(
+        self, layer: "torch.nn.Module", prefix: str
+    ) -> Optional["FakeQuantLinearMethod"]:
         """Get the quantize method to use for the quantized layer."""
         if isinstance(layer, LinearBase):
             return FakeQuantLinearMethod(num_bits=self.num_bits)
@@ -99,18 +112,20 @@ def test_register_quantization_config():
         register_quantization_config("custom_quant")(CustomQuantConfig)
 
 
-@pytest.mark.parametrize(argnames="model",
-                         argvalues=[
-                             "meta-llama/Llama-3.2-1B-Instruct",
-                         ])
+@pytest.mark.parametrize(
+    argnames="model",
+    argvalues=[
+        "meta-llama/Llama-3.2-1B-Instruct",
+    ],
+)
 def test_custom_quant(vllm_runner, model, monkeypatch):
     """Test infer with the custom quantization method."""
     # `LLM.apply_model` requires pickling a function.
     monkeypatch.setenv("VLLM_ALLOW_INSECURE_SERIALIZATION", "1")
 
-    with vllm_runner(model_name=model,
-                     quantization="custom_quant",
-                     enforce_eager=True) as llm:
+    with vllm_runner(
+        model_name=model, quantization="custom_quant", enforce_eager=True
+    ) as llm:
 
         def check_model(model):
             layer = model.model.layers[0]
diff --git a/tests/quantization/test_rtn.py b/tests/quantization/test_rtn.py
index bc2b468f97d8..370625ed3479 100644
--- a/tests/quantization/test_rtn.py
+++ b/tests/quantization/test_rtn.py
@@ -1,9 +1,10 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 # Copyright © 2025, Oracle and/or its affiliates.
-"""Tests RTN quantization startup and generation, 
+"""Tests RTN quantization startup and generation,
 doesn't test correctness
 """
+
 import pytest
 
 from tests.quantization.utils import is_quant_method_supported
@@ -14,8 +15,10 @@
 ]
 
 
-@pytest.mark.skipif(not is_quant_method_supported("rtn"),
-                    reason="RTN is not supported on this GPU type.")
+@pytest.mark.skipif(
+    not is_quant_method_supported("rtn"),
+    reason="RTN is not supported on this GPU type.",
+)
 @pytest.mark.parametrize("model", MODELS)
 @pytest.mark.parametrize("dtype", ["bfloat16"])
 @pytest.mark.parametrize("max_tokens", [10])
@@ -27,6 +30,5 @@ def test_model_rtn_startup(
     dtype: str,
     max_tokens: int,
 ) -> None:
-
     with vllm_runner(model, dtype=dtype, quantization="rtn") as vllm_model:
         vllm_model.generate_greedy(example_prompts, max_tokens)
diff --git a/tests/quantization/test_torchao.py b/tests/quantization/test_torchao.py
index 37cf7ef8417b..45ee94119bbb 100644
--- a/tests/quantization/test_torchao.py
+++ b/tests/quantization/test_torchao.py
@@ -13,12 +13,13 @@
 
 @pytest.mark.skipif(not TORCHAO_AVAILABLE, reason="torchao is not available")
 def test_pre_quantized_model(vllm_runner):
-    with vllm_runner("drisspg/fp8-opt-125m",
-                     quantization="torchao",
-                     dtype="bfloat16",
-                     enforce_eager=True) as llm:
-        output = llm.generate_greedy(["The capital of France is"],
-                                     max_tokens=32)
+    with vllm_runner(
+        "drisspg/fp8-opt-125m",
+        quantization="torchao",
+        dtype="bfloat16",
+        enforce_eager=True,
+    ) as llm:
+        output = llm.generate_greedy(["The capital of France is"], max_tokens=32)
     assert output
 
 
@@ -28,17 +29,18 @@ def test_pre_quantized_model(vllm_runner):
     [
         "cuda:0",
         # {"": "cuda"},
-    ])
-def test_opt_125m_int8wo_model_loading_with_params(vllm_runner,
-                                                   pt_load_map_location):
+    ],
+)
+def test_opt_125m_int8wo_model_loading_with_params(vllm_runner, pt_load_map_location):
     torch._dynamo.reset()
     model_name = "jerryzh168/opt-125m-int8wo-partial-quant"
-    with vllm_runner(model_name=model_name,
-                     quantization="torchao",
-                     dtype="bfloat16",
-                     pt_load_map_location=pt_load_map_location) as llm:
-        output = llm.generate_greedy(["The capital of France is"],
-                                     max_tokens=32)
+    with vllm_runner(
+        model_name=model_name,
+        quantization="torchao",
+        dtype="bfloat16",
+        pt_load_map_location=pt_load_map_location,
+    ) as llm:
+        output = llm.generate_greedy(["The capital of France is"], max_tokens=32)
 
         assert output
 
@@ -47,12 +49,13 @@ def test_opt_125m_int8wo_model_loading_with_params(vllm_runner,
 def test_opt_125m_int4wo_model_per_module_quant(vllm_runner):
     torch._dynamo.reset()
     model_name = "jerryzh168/opt-125m-int4wo-per-module"
-    with vllm_runner(model_name=model_name,
-                     quantization="torchao",
-                     dtype="bfloat16",
-                     pt_load_map_location="cuda:0") as llm:
-        output = llm.generate_greedy(["The capital of France is"],
-                                     max_tokens=32)
+    with vllm_runner(
+        model_name=model_name,
+        quantization="torchao",
+        dtype="bfloat16",
+        pt_load_map_location="cuda:0",
+    ) as llm:
+        output = llm.generate_greedy(["The capital of France is"], max_tokens=32)
 
         assert output
 
@@ -61,12 +64,13 @@ def test_opt_125m_int4wo_model_per_module_quant(vllm_runner):
 def test_qwenvl_int8wo_model_loading_with_params(vllm_runner):
     torch._dynamo.reset()
     model_name = "mobicham/Qwen2.5-VL-3B-Instruct_int8wo_ao"
-    with vllm_runner(model_name=model_name,
-                     quantization="torchao",
-                     dtype="bfloat16",
-                     pt_load_map_location="cuda:0") as llm:
-        output = llm.generate_greedy(["The capital of France is"],
-                                     max_tokens=32)
+    with vllm_runner(
+        model_name=model_name,
+        quantization="torchao",
+        dtype="bfloat16",
+        pt_load_map_location="cuda:0",
+    ) as llm:
+        output = llm.generate_greedy(["The capital of France is"], max_tokens=32)
 
         assert output
 
@@ -75,17 +79,18 @@ def test_qwenvl_int8wo_model_loading_with_params(vllm_runner):
 @pytest.mark.skip(
     reason="since torchao nightly is only compatible with torch nightly"
     "currently https://github.com/pytorch/ao/issues/2919, we'll have to skip "
-    "torchao tests that requires newer versions (0.14.0.dev+) for now")
+    "torchao tests that requires newer versions (0.14.0.dev+) for now"
+)
 def test_opt_125m_awq_int4wo_model_loading_with_params(vllm_runner):
     torch._dynamo.reset()
-    model_name = ("torchao-testing/opt-125m-AWQConfig-Int4WeightOnlyConfig-v2"
-                  "-0.14.0.dev")
-    with vllm_runner(model_name=model_name,
-                     quantization="torchao",
-                     dtype="bfloat16",
-                     pt_load_map_location="cuda:0") as llm:
-        output = llm.generate_greedy(["The capital of France is"],
-                                     max_tokens=32)
+    model_name = "torchao-testing/opt-125m-AWQConfig-Int4WeightOnlyConfig-v2-0.14.0.dev"
+    with vllm_runner(
+        model_name=model_name,
+        quantization="torchao",
+        dtype="bfloat16",
+        pt_load_map_location="cuda:0",
+    ) as llm:
+        output = llm.generate_greedy(["The capital of France is"], max_tokens=32)
 
         assert output
 
@@ -101,22 +106,24 @@ def test_on_the_fly_quant_config_dict_json(vllm_runner):
     import json
 
     from torchao.core.config import config_to_dict
-    from torchao.quantization import (
-        Float8DynamicActivationFloat8WeightConfig, PerRow)
+    from torchao.quantization import Float8DynamicActivationFloat8WeightConfig, PerRow
 
     torchao_quant_config = Float8DynamicActivationFloat8WeightConfig(
-        granularity=PerRow())
+        granularity=PerRow()
+    )
     hf_overrides = {
-        "quantization_config_dict_json":
-        json.dumps(config_to_dict(torchao_quant_config))
+        "quantization_config_dict_json": json.dumps(
+            config_to_dict(torchao_quant_config)
+        )
     }
-    with vllm_runner(model_name=model_name,
-                     dtype="bfloat16",
-                     pt_load_map_location="cuda:0",
-                     quantization="torchao",
-                     hf_overrides=hf_overrides) as llm:
-        output = llm.generate_greedy(["The capital of France is"],
-                                     max_tokens=32)
+    with vllm_runner(
+        model_name=model_name,
+        dtype="bfloat16",
+        pt_load_map_location="cuda:0",
+        quantization="torchao",
+        hf_overrides=hf_overrides,
+    ) as llm:
+        output = llm.generate_greedy(["The capital of France is"], max_tokens=32)
 
         assert output
 
@@ -132,8 +139,7 @@ def test_on_the_fly_quant_config_file(vllm_runner):
     from tempfile import NamedTemporaryFile
 
     from torchao.core.config import config_to_dict
-    from torchao.quantization import (
-        Float8DynamicActivationFloat8WeightConfig, PerRow)
+    from torchao.quantization import Float8DynamicActivationFloat8WeightConfig, PerRow
 
     config = Float8DynamicActivationFloat8WeightConfig(granularity=PerRow())
 
@@ -144,13 +150,14 @@ def test_on_the_fly_quant_config_file(vllm_runner):
         config_file_name = str(f.name)
 
         hf_overrides = {"quantization_config_file": config_file_name}
-        with vllm_runner(model_name=model_name,
-                         dtype="bfloat16",
-                         pt_load_map_location="cuda:0",
-                         quantization="torchao",
-                         hf_overrides=hf_overrides) as llm:
-            output = llm.generate_greedy(["The capital of France is"],
-                                         max_tokens=32)
+        with vllm_runner(
+            model_name=model_name,
+            dtype="bfloat16",
+            pt_load_map_location="cuda:0",
+            quantization="torchao",
+            hf_overrides=hf_overrides,
+        ) as llm:
+            output = llm.generate_greedy(["The capital of France is"], max_tokens=32)
 
             assert output
 
@@ -160,17 +167,18 @@ def test_reload_weights():
     import json
 
     from torchao.core.config import config_to_dict
-    from torchao.quantization import (
-        Float8DynamicActivationFloat8WeightConfig, PerRow)
+    from torchao.quantization import Float8DynamicActivationFloat8WeightConfig, PerRow
 
     from vllm import LLM, SamplingParams
 
     torchao_quant_config = Float8DynamicActivationFloat8WeightConfig(
-        granularity=PerRow())
+        granularity=PerRow()
+    )
 
     hf_overrides = {
-        "quantization_config_dict_json":
-        json.dumps(config_to_dict(torchao_quant_config))
+        "quantization_config_dict_json": json.dumps(
+            config_to_dict(torchao_quant_config)
+        )
     }
 
     llm = LLM(
@@ -182,12 +190,9 @@ def test_reload_weights():
         hf_overrides=hf_overrides,
     )
     # Update load format from `dummy` to `auto`
-    llm.collective_rpc("update_config",
-                       args=({
-                           "load_config": {
-                               "load_format": "auto"
-                           }
-                       }, ))
+    llm.collective_rpc(
+        "update_config", args=({"load_config": {"load_format": "auto"}},)
+    )
     # Now reload real weights inplace
     llm.collective_rpc("reload_weights")
     prompts = [
diff --git a/tests/reasoning/test_base_thinking_reasoning_parser.py b/tests/reasoning/test_base_thinking_reasoning_parser.py
index 6a939dcfc2c9..ddda50fe770a 100644
--- a/tests/reasoning/test_base_thinking_reasoning_parser.py
+++ b/tests/reasoning/test_base_thinking_reasoning_parser.py
@@ -44,9 +44,7 @@ def test_tokenizer():
     # Add custom test tokens
     test_tokens = ["<test:think>", "</test:think>", "<alt:start>", "<alt:end>"]
     existing_tokens = set(tokenizer.get_vocab().keys())
-    new_tokens = [
-        token for token in test_tokens if token not in existing_tokens
-    ]
+    new_tokens = [token for token in test_tokens if token not in existing_tokens]
     if new_tokens:
         tokenizer.add_tokens(new_tokens)
     return tokenizer
@@ -54,8 +52,8 @@ def test_tokenizer():
 
 class TestBaseThinkingReasoningParserInit:
     """
-        Test initialization and basic properties of
-        BaseThinkingReasoningParser.
+    Test initialization and basic properties of
+    BaseThinkingReasoningParser.
     """
 
     def test_successful_initialization(self, test_tokenizer):
@@ -76,7 +74,6 @@ def test_initialization_with_missing_tokens(self, test_tokenizer):
 
         # Create a parser with tokens not in vocabulary
         class MissingTokenParser(BaseThinkingReasoningParser):
-
             @property
             def start_token(self) -> str:
                 return "<missing:start>"
@@ -85,15 +82,15 @@ def start_token(self) -> str:
             def end_token(self) -> str:
                 return "<missing:end>"
 
-        with pytest.raises(RuntimeError,
-                           match="could not locate think start/end tokens"):
+        with pytest.raises(
+            RuntimeError, match="could not locate think start/end tokens"
+        ):
             MissingTokenParser(test_tokenizer)
 
     def test_initialization_with_empty_tokens(self, test_tokenizer):
         """Test that initialization fails with empty token strings."""
 
         class EmptyTokenParser(BaseThinkingReasoningParser):
-
             @property
             def start_token(self) -> str:
                 return ""
@@ -102,8 +99,9 @@ def start_token(self) -> str:
             def end_token(self) -> str:
                 return ""
 
-        with pytest.raises(ValueError,
-                           match="start_token and end_token must be defined"):
+        with pytest.raises(
+            ValueError, match="start_token and end_token must be defined"
+        ):
             EmptyTokenParser(test_tokenizer)
 
 
@@ -158,10 +156,8 @@ def test_extract_reasoning_content_with_both_tokens(self, test_tokenizer):
         parser = TestThinkingReasoningParser(test_tokenizer)
         request = ChatCompletionRequest(messages=[], model="test-model")
 
-        model_output = ("<test:think>This is reasoning"
-                        "</test:think>This is content")
-        reasoning, content = parser.extract_reasoning_content(
-            model_output, request)
+        model_output = "<test:think>This is reasoning</test:think>This is content"
+        reasoning, content = parser.extract_reasoning_content(model_output, request)
 
         assert reasoning == "This is reasoning"
         assert content == "This is content"
@@ -171,9 +167,8 @@ def test_extract_reasoning_content_only_end_token(self, test_tokenizer):
         parser = TestThinkingReasoningParser(test_tokenizer)
         request = ChatCompletionRequest(messages=[], model="test-model")
 
-        model_output = ("This is reasoning</test:think>This is content")
-        reasoning, content = parser.extract_reasoning_content(
-            model_output, request)
+        model_output = "This is reasoning</test:think>This is content"
+        reasoning, content = parser.extract_reasoning_content(model_output, request)
 
         assert reasoning == "This is reasoning"
         assert content == "This is content"
@@ -184,8 +179,7 @@ def test_extract_reasoning_content_no_end_token(self, test_tokenizer):
         request = ChatCompletionRequest(messages=[], model="test-model")
 
         model_output = "This is just content"
-        reasoning, content = parser.extract_reasoning_content(
-            model_output, request)
+        reasoning, content = parser.extract_reasoning_content(model_output, request)
 
         assert reasoning == "This is just content"
         assert content is None
@@ -196,8 +190,7 @@ def test_extract_reasoning_content_empty_output(self, test_tokenizer):
         request = ChatCompletionRequest(messages=[], model="test-model")
 
         model_output = ""
-        reasoning, content = parser.extract_reasoning_content(
-            model_output, request)
+        reasoning, content = parser.extract_reasoning_content(model_output, request)
 
         assert reasoning == ""
         assert content is None
@@ -207,9 +200,8 @@ def test_extract_reasoning_content_only_tokens(self, test_tokenizer):
         parser = TestThinkingReasoningParser(test_tokenizer)
         request = ChatCompletionRequest(messages=[], model="test-model")
 
-        model_output = ("<test:think></test:think>")
-        reasoning, content = parser.extract_reasoning_content(
-            model_output, request)
+        model_output = "<test:think></test:think>"
+        reasoning, content = parser.extract_reasoning_content(model_output, request)
 
         assert reasoning == ""
         assert content is None
@@ -221,19 +213,24 @@ class TestBaseThinkingReasoningParserStreaming:
     @pytest.mark.parametrize("streaming", [True, False])
     def test_simple_reasoning_extraction(self, test_tokenizer, streaming):
         """
-            Test basic reasoning extraction in both
-            streaming and non-streaming modes.
+        Test basic reasoning extraction in both
+        streaming and non-streaming modes.
         """
         parser = TestThinkingReasoningParser(test_tokenizer)
 
         model_output = [
-            "<test:think>", "Some ", "reasoning ", "content", "</test:think>",
-            "Final ", "answer"
+            "<test:think>",
+            "Some ",
+            "reasoning ",
+            "content",
+            "</test:think>",
+            "Final ",
+            "answer",
         ]
 
-        reasoning, content = run_reasoning_extraction(parser,
-                                                      model_output,
-                                                      streaming=streaming)
+        reasoning, content = run_reasoning_extraction(
+            parser, model_output, streaming=streaming
+        )
 
         assert reasoning == "Some reasoning content"
         assert content == "Final answer"
@@ -252,9 +249,7 @@ def test_streaming_with_incremental_deltas(self, test_tokenizer):
             "answer",
         ]
 
-        reasoning, content = run_reasoning_extraction(parser,
-                                                      deltas,
-                                                      streaming=True)
+        reasoning, content = run_reasoning_extraction(parser, deltas, streaming=True)
 
         assert reasoning == "Some reasoning content"
         assert content == "Final answer"
@@ -271,9 +266,7 @@ def test_streaming_with_start_token(self, test_tokenizer):
             "Answer",
         ]
 
-        reasoning, content = run_reasoning_extraction(parser,
-                                                      deltas,
-                                                      streaming=True)
+        reasoning, content = run_reasoning_extraction(parser, deltas, streaming=True)
 
         assert reasoning == "Some reasoning"
         assert content == "Answer"
@@ -290,9 +283,7 @@ def test_streaming_no_end_token(self, test_tokenizer):
             "end",
         ]
 
-        reasoning, content = run_reasoning_extraction(parser,
-                                                      deltas,
-                                                      streaming=True)
+        reasoning, content = run_reasoning_extraction(parser, deltas, streaming=True)
 
         assert reasoning == "Some reasoning without end"
         assert content is None
@@ -309,9 +300,7 @@ def test_streaming_only_end_token(self, test_tokenizer):
             "Final",
         ]
 
-        reasoning, content = run_reasoning_extraction(parser,
-                                                      deltas,
-                                                      streaming=True)
+        reasoning, content = run_reasoning_extraction(parser, deltas, streaming=True)
 
         assert reasoning == "Reasoning content"
         assert content == "Final"
@@ -319,29 +308,27 @@ def test_streaming_only_end_token(self, test_tokenizer):
 
 class TestBaseThinkingReasoningParserMultipleImplementations:
     """
-        Test that multiple implementations of
-        BaseThinkingReasoningParser work correctly.
+    Test that multiple implementations of
+    BaseThinkingReasoningParser work correctly.
     """
 
     def test_different_token_implementations(self, test_tokenizer):
         """
-            Test that different implementations 
-            with different tokens work independently.
+        Test that different implementations
+        with different tokens work independently.
         """
         parser1 = TestThinkingReasoningParser(test_tokenizer)
         parser2 = TestThinkingReasoningParserAlt(test_tokenizer)
 
         # Test parser1
-        model_output1 = ("Reasoning1</test:think>Content1")
-        reasoning1, content1 = run_reasoning_extraction(
-            parser1, [model_output1])
+        model_output1 = "Reasoning1</test:think>Content1"
+        reasoning1, content1 = run_reasoning_extraction(parser1, [model_output1])
         assert reasoning1 == "Reasoning1"
         assert content1 == "Content1"
 
         # Test parser2
         model_output2 = "Reasoning2<alt:end>Content2"
-        reasoning2, content2 = run_reasoning_extraction(
-            parser2, [model_output2])
+        reasoning2, content2 = run_reasoning_extraction(parser2, [model_output2])
         assert reasoning2 == "Reasoning2"
         assert content2 == "Content2"
 
@@ -359,7 +346,7 @@ def test_multiple_end_tokens(self, test_tokenizer):
         """Test behavior with multiple end tokens."""
         parser = TestThinkingReasoningParser(test_tokenizer)
 
-        model_output = ("First</test:think>Middle</test:think>Last")
+        model_output = "First</test:think>Middle</test:think>Last"
         reasoning, content = run_reasoning_extraction(parser, [model_output])
 
         # Should stop at first end token
@@ -370,8 +357,7 @@ def test_nested_tokens(self, test_tokenizer):
         """Test behavior with nested-like token patterns."""
         parser = TestThinkingReasoningParser(test_tokenizer)
 
-        model_output = ("<test:think>Outer"
-                        "<test:think>Inner</test:think>Content")
+        model_output = "<test:think>Outer<test:think>Inner</test:think>Content"
         reasoning, content = run_reasoning_extraction(parser, [model_output])
 
         # Should process normally, start from first start token
@@ -382,11 +368,9 @@ def test_malformed_tokens(self, test_tokenizer):
         """Test behavior with malformed token-like strings."""
         parser = TestThinkingReasoningParser(test_tokenizer)
 
-        model_output = ("<test:thinking>Not a real token"
-                        "</test:thinking>Content")
+        model_output = "<test:thinking>Not a real token</test:thinking>Content"
         reasoning, content = run_reasoning_extraction(parser, [model_output])
 
         # Should treat as regular content since tokens don't match exactly
-        assert reasoning == ("<test:thinking>Not a real token"
-                             "</test:thinking>Content")
+        assert reasoning == ("<test:thinking>Not a real token</test:thinking>Content")
         assert content is None
diff --git a/tests/reasoning/test_deepseekr1_reasoning_parser.py b/tests/reasoning/test_deepseekr1_reasoning_parser.py
index 987f3c48de0c..946d01c123c5 100644
--- a/tests/reasoning/test_deepseekr1_reasoning_parser.py
+++ b/tests/reasoning/test_deepseekr1_reasoning_parser.py
@@ -259,15 +259,15 @@ def test_reasoning(
     output = deepseek_r1_qwen_tokenizer.tokenize(param_dict["output"])
     # decode everything to tokens
     output_tokens: list[str] = [
-        deepseek_r1_qwen_tokenizer.convert_tokens_to_string([token])
-        for token in output
+        deepseek_r1_qwen_tokenizer.convert_tokens_to_string([token]) for token in output
     ]
-    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(
-        parser_name)(deepseek_r1_qwen_tokenizer)
+    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(parser_name)(
+        deepseek_r1_qwen_tokenizer
+    )
 
-    reasoning, content = run_reasoning_extraction(parser,
-                                                  output_tokens,
-                                                  streaming=streaming)
+    reasoning, content = run_reasoning_extraction(
+        parser, output_tokens, streaming=streaming
+    )
 
     assert reasoning == param_dict["reasoning_content"]
     assert content == param_dict["content"]
@@ -281,7 +281,8 @@ def test_reasoning(
     if param_dict["content"] is not None:
         content = parser.extract_content_ids(output_ids)
         assert content == deepseek_r1_qwen_tokenizer.convert_tokens_to_ids(
-            deepseek_r1_qwen_tokenizer.tokenize(param_dict["content"]))
+            deepseek_r1_qwen_tokenizer.tokenize(param_dict["content"])
+        )
     else:
         content = parser.extract_content_ids(output)
         assert content == []
diff --git a/tests/reasoning/test_glm4_moe_reasoning_parser.py b/tests/reasoning/test_glm4_moe_reasoning_parser.py
index 4c5ec2c9b408..0a8595a00fcb 100644
--- a/tests/reasoning/test_glm4_moe_reasoning_parser.py
+++ b/tests/reasoning/test_glm4_moe_reasoning_parser.py
@@ -54,8 +54,7 @@ def glm45_tokenizer():
     "is_reasoning_end": True,
 }
 MULTILINE_REASONING = {
-    "output":
-    "<think>This is a reasoning\nsection</think>This is the rest\nThat",
+    "output": "<think>This is a reasoning\nsection</think>This is the rest\nThat",
     "reasoning_content": "This is a reasoning\nsection",
     "content": "This is the rest\nThat",
     "is_reasoning_end": True,
@@ -158,12 +157,12 @@ def glm45_tokenizer():
 REASONING_END_TEST_CASES = [
     pytest.param(STILL_REASONING_PROMPT, False, id="still_reasoning"),
     pytest.param(DONE_REASONING_PROMPT, True, id="done_reasoning"),
-    pytest.param(MULTI_TURN_STILL_REASONING_PROMPT,
-                 False,
-                 id="multi_turn_still_reasoning"),
-    pytest.param(MULTI_TURN_DONE_REASONING_PROMPT,
-                 True,
-                 id="multi_turn_done_reasoning")
+    pytest.param(
+        MULTI_TURN_STILL_REASONING_PROMPT, False, id="multi_turn_still_reasoning"
+    ),
+    pytest.param(
+        MULTI_TURN_DONE_REASONING_PROMPT, True, id="multi_turn_done_reasoning"
+    ),
 ]
 
 
@@ -177,12 +176,13 @@ def test_reasoning(
     output_tokens: list[str] = [
         glm45_tokenizer.convert_tokens_to_string([token]) for token in output
     ]
-    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(
-        parser_name)(glm45_tokenizer)
+    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(parser_name)(
+        glm45_tokenizer
+    )
 
-    reasoning, content = run_reasoning_extraction(parser,
-                                                  output_tokens,
-                                                  streaming=streaming)
+    reasoning, content = run_reasoning_extraction(
+        parser, output_tokens, streaming=streaming
+    )
 
     assert reasoning == param_dict["reasoning_content"]
     assert content == param_dict["content"]
@@ -193,10 +193,12 @@ def test_reasoning(
 
 
 @pytest.mark.parametrize("prompt, is_reasoning_end", REASONING_END_TEST_CASES)
-def test_is_reasoning_end_full_prompt(prompt: str, is_reasoning_end: bool,
-                                      glm45_tokenizer):
-    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(
-        parser_name)(glm45_tokenizer)
+def test_is_reasoning_end_full_prompt(
+    prompt: str, is_reasoning_end: bool, glm45_tokenizer
+):
+    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(parser_name)(
+        glm45_tokenizer
+    )
     tokens = glm45_tokenizer.tokenize(prompt)
     token_ids = glm45_tokenizer.convert_tokens_to_ids(tokens)
     check_is_reasoning_end = parser.is_reasoning_end(token_ids)
diff --git a/tests/reasoning/test_granite_reasoning_parser.py b/tests/reasoning/test_granite_reasoning_parser.py
index 38cab73a45f2..de1663408d72 100644
--- a/tests/reasoning/test_granite_reasoning_parser.py
+++ b/tests/reasoning/test_granite_reasoning_parser.py
@@ -11,8 +11,7 @@
 START_RESPONSE = "Here is my response:"
 
 SIMPLE_REASONING = {
-    "output":
-    f"{START_REASONING}This is a reasoning section{START_RESPONSE}This is the rest",  #noqa: E501
+    "output": f"{START_REASONING}This is a reasoning section{START_RESPONSE}This is the rest",  # noqa: E501
     "reasoning_content": "This is a reasoning section",
     "content": "This is the rest",
 }
@@ -27,14 +26,12 @@
     "content": "This is content",
 }
 MULTIPLE_LINES = {
-    "output":
-    f"{START_REASONING}This\nThat{START_RESPONSE}This is the rest\nThat",
+    "output": f"{START_REASONING}This\nThat{START_RESPONSE}This is the rest\nThat",
     "reasoning_content": "This\nThat",
     "content": "This is the rest\nThat",
 }
 REASONING_WITH_THINK = {
-    "output":
-    f"{START_REASONING}This is a reasoning section{START_RESPONSE}This is the rest",  #noqa: E501
+    "output": f"{START_REASONING}This is a reasoning section{START_RESPONSE}This is the rest",  # noqa: E501
     "reasoning_content": "This is a reasoning section",
     "content": "This is the rest",
 }
@@ -44,8 +41,7 @@
     "content": None,
 }
 MULTIPLE_LINES_WITH_THINK = {
-    "output":
-    f"{START_REASONING}This\nThat{START_RESPONSE}This is the rest\nThat",
+    "output": f"{START_REASONING}This\nThat{START_RESPONSE}This is the rest\nThat",
     "reasoning_content": "This\nThat",
     "content": "This is the rest\nThat",
 }
@@ -137,12 +133,13 @@ def test_reasoning(
     output_tokens: list[str] = [
         tokenizer.convert_tokens_to_string([token]) for token in output
     ]
-    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(
-        parser_name)(tokenizer)
+    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(parser_name)(
+        tokenizer
+    )
 
-    reasoning, content = run_reasoning_extraction(parser,
-                                                  output_tokens,
-                                                  streaming=streaming)
+    reasoning, content = run_reasoning_extraction(
+        parser, output_tokens, streaming=streaming
+    )
 
     assert reasoning == param_dict["reasoning_content"]
     assert content == param_dict["content"]
@@ -229,18 +226,15 @@ def test_reasoning(
 ## The Response is ongoing, and the delta mixes reasoning content / content
 STREAMING_10 = {
     "previous_text": "Here is my thought process: foo",
-    "current_text":
-    "Here is my thought process: foo bar Here is my response: baz",
+    "current_text": "Here is my thought process: foo bar Here is my response: baz",
     "delta_text": " bar Here is my response: baz",
     "reasoning_content": " bar ",
     "content": " baz",
 }
 # The delta text starts a new substring that might be a response special seq
 STREAMING_11 = {
-    "previous_text":
-    "Here is my thought process: This is a reasoning section ",
-    "current_text":
-    "Here is my thought process: This is a reasoning section Here",
+    "previous_text": "Here is my thought process: This is a reasoning section ",
+    "current_text": "Here is my thought process: This is a reasoning section Here",
     "delta_text": "Here",
     "reasoning_content": None,
     "content": None,
@@ -320,14 +314,17 @@ def test_reasoning(
 @pytest.mark.parametrize("param_dict", STREAMING_SUBCASES)
 def test_streaming_subcases(param_dict):
     # Get all of the token IDs
-    previous_token_ids = tokenizer.encode(
-        param_dict["previous_text"]
-    ) if param_dict["previous_text"] is not None else []
+    previous_token_ids = (
+        tokenizer.encode(param_dict["previous_text"])
+        if param_dict["previous_text"] is not None
+        else []
+    )
     current_token_ids = tokenizer.encode(param_dict["current_text"])
     delta_token_ids = tokenizer.encode(param_dict["delta_text"])
 
-    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(
-        parser_name)(tokenizer)
+    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(parser_name)(
+        tokenizer
+    )
 
     response = parser.extract_reasoning_content_streaming(
         previous_text=param_dict["previous_text"],
@@ -339,8 +336,7 @@ def test_streaming_subcases(param_dict):
     )
     # Streaming currently expects at least one of reasoning content / content,
     # so the response should return None in that case.
-    if param_dict["reasoning_content"] is None and param_dict[
-            "content"] is None:
+    if param_dict["reasoning_content"] is None and param_dict["content"] is None:
         assert response is None
     else:
         assert isinstance(response, DeltaMessage)
diff --git a/tests/reasoning/test_hunyuan_reasoning_parser.py b/tests/reasoning/test_hunyuan_reasoning_parser.py
index f9238267f02e..b7e3ea73ccde 100644
--- a/tests/reasoning/test_hunyuan_reasoning_parser.py
+++ b/tests/reasoning/test_hunyuan_reasoning_parser.py
@@ -13,15 +13,13 @@
 END_RESPONSE = "\n</answer>"
 
 NO_REASONING_QUICK_THROUGHT = {
-    "output":
-    f"{START_REASONING}{START_RESPONSE}This is the rest{END_RESPONSE}",  #noqa: E501
+    "output": f"{START_REASONING}{START_RESPONSE}This is the rest{END_RESPONSE}",  # noqa: E501
     "reasoning_content": None,
     "content": "This is the rest",
 }
 
 SIMPLE_REASONING = {
-    "output":
-    f"{START_REASONING}This is a reasoning section{START_RESPONSE}This is the rest{END_RESPONSE}",  #noqa: E501
+    "output": f"{START_REASONING}This is a reasoning section{START_RESPONSE}This is the rest{END_RESPONSE}",  # noqa: E501
     "reasoning_content": "This is a reasoning section",
     "content": "This is the rest",
 }
@@ -42,14 +40,12 @@
     "content": "This is content",
 }
 MULTIPLE_LINES = {
-    "output":
-    f"{START_REASONING}This\nThat{START_RESPONSE}This is the rest\nThat",
+    "output": f"{START_REASONING}This\nThat{START_RESPONSE}This is the rest\nThat",
     "reasoning_content": "This\nThat",
     "content": "This is the rest\nThat",
 }
 REASONING_WITH_THINK = {
-    "output":
-    f"{START_REASONING}This is a reasoning section{START_RESPONSE}This is the rest",  #noqa: E501
+    "output": f"{START_REASONING}This is a reasoning section{START_RESPONSE}This is the rest",  # noqa: E501
     "reasoning_content": "This is a reasoning section",
     "content": "This is the rest",
 }
@@ -59,8 +55,7 @@
     "content": None,
 }
 MULTIPLE_LINES_WITH_THINK = {
-    "output":
-    f"{START_REASONING}This\nThat{START_RESPONSE}This is the rest\nThat",
+    "output": f"{START_REASONING}This\nThat{START_RESPONSE}This is the rest\nThat",
     "reasoning_content": "This\nThat",
     "content": "This is the rest\nThat",
 }
@@ -122,9 +117,7 @@
         NO_REASONING,
         id="no_reasoning_streaming",
     ),
-    pytest.param(True,
-                 NO_REASONING_QUICK_THROUGHT,
-                 id="no_reasoning_quick_stream"),
+    pytest.param(True, NO_REASONING_QUICK_THROUGHT, id="no_reasoning_quick_stream"),
     pytest.param(
         True,
         MULTIPLE_LINES,
@@ -148,8 +141,9 @@
 ]
 
 # Global tokenizer initialization to avoid repeated loading
-tokenizer = AutoTokenizer.from_pretrained("tencent/Hunyuan-A13B-Instruct",
-                                          trust_remote_code=True)
+tokenizer = AutoTokenizer.from_pretrained(
+    "tencent/Hunyuan-A13B-Instruct", trust_remote_code=True
+)
 
 
 @pytest.mark.parametrize("streaming, param_dict", TEST_CASES)
@@ -162,12 +156,13 @@ def test_reasoning(
     output_tokens: list[str] = [
         tokenizer.convert_tokens_to_string([token]) for token in output
     ]
-    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(
-        parser_name)(tokenizer)
+    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(parser_name)(
+        tokenizer
+    )
 
-    reasoning, content = run_reasoning_extraction(parser,
-                                                  output_tokens,
-                                                  streaming=streaming)
+    reasoning, content = run_reasoning_extraction(
+        parser, output_tokens, streaming=streaming
+    )
 
     assert reasoning == param_dict["reasoning_content"]
     assert content == param_dict["content"]
diff --git a/tests/reasoning/test_mistral_reasoning_parser.py b/tests/reasoning/test_mistral_reasoning_parser.py
index 91a22f6f5d72..96107c0c1193 100644
--- a/tests/reasoning/test_mistral_reasoning_parser.py
+++ b/tests/reasoning/test_mistral_reasoning_parser.py
@@ -3,8 +3,7 @@
 
 import pytest
 from mistral_common.tokens.tokenizers.base import SpecialTokens
-from mistral_common.tokens.tokenizers.tekken import (SpecialTokenInfo,
-                                                     Tekkenizer)
+from mistral_common.tokens.tokenizers.tekken import SpecialTokenInfo, Tekkenizer
 
 from tests.reasoning.utils import run_reasoning_extraction_mistral
 from vllm.reasoning import ReasoningParser, ReasoningParserManager
@@ -18,23 +17,27 @@ def mistral_tokenizer():
     # TODO(Julien): upon model release change to a tokenizer already configured.
     # =================================================================
     mistral_tokenizer = MistralTokenizer.from_pretrained(
-        "mistralai/Devstral-Small-2507")
+        "mistralai/Devstral-Small-2507"
+    )
     assert isinstance(mistral_tokenizer.tokenizer, Tekkenizer)
     # Add think special tokens to the tokenizer
     mistral_tokenizer.tokenizer._all_special_tokens[35] = SpecialTokenInfo(
-        rank=35, is_control=True, token_str=SpecialTokens.begin_think.value)
+        rank=35, is_control=True, token_str=SpecialTokens.begin_think.value
+    )
     mistral_tokenizer.tokenizer._all_special_tokens[36] = SpecialTokenInfo(
-        rank=36, is_control=True, token_str=SpecialTokens.end_think.value)
+        rank=36, is_control=True, token_str=SpecialTokens.end_think.value
+    )
     mistral_tokenizer.tokenizer._special_tokens_reverse_vocab = {
         k: v
-        for k, v in
-        mistral_tokenizer.tokenizer._special_tokens_reverse_vocab.items()
+        for k, v in mistral_tokenizer.tokenizer._special_tokens_reverse_vocab.items()
         if v not in {35, 36}
     }
     mistral_tokenizer.tokenizer._special_tokens_reverse_vocab[
-        SpecialTokens.begin_think.value] = 35
+        SpecialTokens.begin_think.value
+    ] = 35
     mistral_tokenizer.tokenizer._special_tokens_reverse_vocab[
-        SpecialTokens.end_think.value] = 36
+        SpecialTokens.end_think.value
+    ] = 36
     mistral_tokenizer.instruct.BEGIN_THINK = 35
     mistral_tokenizer.instruct.END_THINK = 36
     # =================================================================
@@ -290,39 +293,45 @@ def test_mistral_reasoning(
     if index_think != -1:
         output_before_think = output[:index_think]
         output_tokens += mistral_tokenizer.tokenizer.encode(
-            output_before_think, False, False)
+            output_before_think, False, False
+        )
         output_tokens += [mistral_tokenizer.instruct.BEGIN_THINK]
 
         if index_end_think != -1:
-            output_middle = output[index_think + len_think:index_end_think]
-            output_after_think = output[index_end_think + len_end_think:]
+            output_middle = output[index_think + len_think : index_end_think]
+            output_after_think = output[index_end_think + len_end_think :]
             output_tokens += mistral_tokenizer.tokenizer.encode(
-                output_middle, False, False)
+                output_middle, False, False
+            )
             output_tokens += [mistral_tokenizer.instruct.END_THINK]
             output_tokens += mistral_tokenizer.tokenizer.encode(
-                output_after_think, False, False)
+                output_after_think, False, False
+            )
         else:
-            output_middle = output[index_think + len_think:]
+            output_middle = output[index_think + len_think :]
             output_tokens += mistral_tokenizer.tokenizer.encode(
-                output_middle, False, False)
+                output_middle, False, False
+            )
     elif index_end_think != -1:
         output_before_think = output[:index_end_think]
-        output_after_think = output[index_end_think + len_end_think:]
+        output_after_think = output[index_end_think + len_end_think :]
         output_tokens += mistral_tokenizer.tokenizer.encode(
-            output_before_think, False, False)
+            output_before_think, False, False
+        )
         output_tokens += [mistral_tokenizer.instruct.END_THINK]
         output_tokens += mistral_tokenizer.tokenizer.encode(
-            output_after_think, False, False)
+            output_after_think, False, False
+        )
     else:
-        output_tokens += mistral_tokenizer.tokenizer.encode(
-            output, False, False)
+        output_tokens += mistral_tokenizer.tokenizer.encode(output, False, False)
 
-    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(
-        parser_name)(mistral_tokenizer)
+    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(parser_name)(
+        mistral_tokenizer
+    )
 
-    reasoning, content = run_reasoning_extraction_mistral(parser,
-                                                          output_tokens,
-                                                          streaming=streaming)
+    reasoning, content = run_reasoning_extraction_mistral(
+        parser, output_tokens, streaming=streaming
+    )
 
     assert reasoning == param_dict["reasoning_content"]
     assert content == param_dict["content"]
@@ -335,7 +344,8 @@ def test_mistral_reasoning(
     if param_dict["content"] is not None:
         content = parser.extract_content_ids(output_tokens)
         assert content == mistral_tokenizer.tokenizer.encode(
-            param_dict["content"], bos=False, eos=False)
+            param_dict["content"], bos=False, eos=False
+        )
     else:
         content = parser.extract_content_ids(output_tokens)
         assert content == []
diff --git a/tests/reasoning/test_olmo3_reasoning_parser.py b/tests/reasoning/test_olmo3_reasoning_parser.py
index 067be1ea2996..4a2eca994610 100644
--- a/tests/reasoning/test_olmo3_reasoning_parser.py
+++ b/tests/reasoning/test_olmo3_reasoning_parser.py
@@ -18,29 +18,25 @@
 }
 
 NO_REASONING_WITH_NEWLINE = {
-    "output":
-    f"{START_REASONING}\n{END_REASONING}\n\nNo thoughts, head empty!",
+    "output": f"{START_REASONING}\n{END_REASONING}\n\nNo thoughts, head empty!",
     "reasoning_content": "\n",
     "content": "\n\nNo thoughts, head empty!",
 }
 
 SIMPLE_REASONING = {
-    "output":
-    f"{START_REASONING}This is a reasoning section{END_REASONING}This is the rest",  # noqa: E501
+    "output": f"{START_REASONING}This is a reasoning section{END_REASONING}This is the rest",  # noqa: E501
     "reasoning_content": "This is a reasoning section",
     "content": "This is the rest",
 }
 
 SIMPLE_REASONING_WITH_NEWLINE = {
-    "output":
-    f"{START_REASONING} Look!\n\nI'm thinking...{END_REASONING}\nThis is the rest",  # noqa: E501
+    "output": f"{START_REASONING} Look!\n\nI'm thinking...{END_REASONING}\nThis is the rest",  # noqa: E501
     "reasoning_content": " Look!\n\nI'm thinking...",
     "content": "\nThis is the rest",
 }
 
 SIMPLE_REASONING_WITH_MULTIPLE_NEWLINES = {
-    "output":
-    f"{START_REASONING}\nLook!\nI'm thinking...\n\n{END_REASONING}\n\n\nThis is the rest",  # noqa: E501
+    "output": f"{START_REASONING}\nLook!\nI'm thinking...\n\n{END_REASONING}\n\n\nThis is the rest",  # noqa: E501
     "reasoning_content": "\nLook!\nI'm thinking...\n\n",
     "content": "\n\n\nThis is the rest",
 }
@@ -52,8 +48,7 @@
 }
 
 REASONING_ONLY_END_THINK = {
-    "output":
-    f"The user is asking me not to think.{END_REASONING}No thoughts!",
+    "output": f"The user is asking me not to think.{END_REASONING}No thoughts!",
     "reasoning_content": "The user is asking me not to think.",
     "content": "No thoughts!",
 }
@@ -149,9 +144,9 @@ def test_reasoning(
     parser_cls = ReasoningParserManager.get_reasoning_parser(parser_name)
     parser: ReasoningParser = parser_cls(tokenizer)
 
-    reasoning, content = run_reasoning_extraction(reasoning_parser=parser,
-                                                  model_output=model_output,
-                                                  streaming=streaming)
+    reasoning, content = run_reasoning_extraction(
+        reasoning_parser=parser, model_output=model_output, streaming=streaming
+    )
 
     assert reasoning == param_dict["reasoning_content"]
     assert content == param_dict["content"]
diff --git a/tests/reasoning/test_qwen3_reasoning_parser.py b/tests/reasoning/test_qwen3_reasoning_parser.py
index 2d5557d5cdc1..c06e40d72de2 100644
--- a/tests/reasoning/test_qwen3_reasoning_parser.py
+++ b/tests/reasoning/test_qwen3_reasoning_parser.py
@@ -50,8 +50,7 @@ def qwen3_tokenizer():
     "content": None,
 }
 MULTILINE_REASONING = {
-    "output":
-    "<think>This is a reasoning\nsection</think>This is the rest\nThat",
+    "output": "<think>This is a reasoning\nsection</think>This is the rest\nThat",
     "reasoning_content": "This is a reasoning\nsection",
     "content": "This is the rest\nThat",
 }
@@ -131,12 +130,13 @@ def test_reasoning(
     output_tokens: list[str] = [
         qwen3_tokenizer.convert_tokens_to_string([token]) for token in output
     ]
-    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(
-        parser_name)(qwen3_tokenizer)
+    parser: ReasoningParser = ReasoningParserManager.get_reasoning_parser(parser_name)(
+        qwen3_tokenizer
+    )
 
-    reasoning, content = run_reasoning_extraction(parser,
-                                                  output_tokens,
-                                                  streaming=streaming)
+    reasoning, content = run_reasoning_extraction(
+        parser, output_tokens, streaming=streaming
+    )
 
     assert reasoning == param_dict["reasoning_content"]
     assert content == param_dict["content"]
diff --git a/tests/reasoning/test_seedoss_reasoning_parser.py b/tests/reasoning/test_seedoss_reasoning_parser.py
index bb5dc0f4ffe4..b356b8545f41 100644
--- a/tests/reasoning/test_seedoss_reasoning_parser.py
+++ b/tests/reasoning/test_seedoss_reasoning_parser.py
@@ -57,14 +57,10 @@ def seedoss_tokenizer():
     "is_reasoning_end": True,
 }
 WITH_START_TOKEN: dict[str, Any] = {
-    "output": ("<seed:think>This is a reasoning section"
-               "</seed:think>This is the rest"),
-    "reasoning_content":
-    "This is a reasoning section",
-    "content":
-    "This is the rest",
-    "is_reasoning_end":
-    True,
+    "output": ("<seed:think>This is a reasoning section</seed:think>This is the rest"),
+    "reasoning_content": "This is a reasoning section",
+    "content": "This is the rest",
+    "is_reasoning_end": True,
 }
 ONLY_END_TOKEN: dict[str, Any] = {
     "output": "Some reasoning</seed:think>This is the rest",
@@ -96,7 +92,8 @@ def test_simple_reasoning(seedoss_tokenizer, streaming):
     parser = parser_cls(seedoss_tokenizer)
 
     reasoning, content = run_reasoning_extraction(
-        parser, [cast(str, SIMPLE_REASONING["output"])], streaming=streaming)
+        parser, [cast(str, SIMPLE_REASONING["output"])], streaming=streaming
+    )
 
     assert reasoning == SIMPLE_REASONING["reasoning_content"]
     assert content == SIMPLE_REASONING["content"]
@@ -109,7 +106,8 @@ def test_complete_reasoning(seedoss_tokenizer, streaming):
     parser = parser_cls(seedoss_tokenizer)
 
     reasoning, content = run_reasoning_extraction(
-        parser, [cast(str, COMPLETE_REASONING["output"])], streaming=streaming)
+        parser, [cast(str, COMPLETE_REASONING["output"])], streaming=streaming
+    )
 
     assert reasoning == COMPLETE_REASONING["reasoning_content"]
     assert content == COMPLETE_REASONING["content"]
@@ -122,7 +120,8 @@ def test_no_content(seedoss_tokenizer, streaming):
     parser = parser_cls(seedoss_tokenizer)
 
     reasoning, content = run_reasoning_extraction(
-        parser, [cast(str, NO_CONTENT["output"])], streaming=streaming)
+        parser, [cast(str, NO_CONTENT["output"])], streaming=streaming
+    )
 
     assert reasoning == NO_CONTENT["reasoning_content"]
     assert content == NO_CONTENT["content"]
@@ -135,7 +134,8 @@ def test_multiple_lines(seedoss_tokenizer, streaming):
     parser = parser_cls(seedoss_tokenizer)
 
     reasoning, content = run_reasoning_extraction(
-        parser, [cast(str, MULTIPLE_LINES["output"])], streaming=streaming)
+        parser, [cast(str, MULTIPLE_LINES["output"])], streaming=streaming
+    )
 
     assert reasoning == MULTIPLE_LINES["reasoning_content"]
     assert content == MULTIPLE_LINES["content"]
@@ -148,7 +148,8 @@ def test_with_start_token(seedoss_tokenizer, streaming):
     parser = parser_cls(seedoss_tokenizer)
 
     reasoning, content = run_reasoning_extraction(
-        parser, [cast(str, WITH_START_TOKEN["output"])], streaming=streaming)
+        parser, [cast(str, WITH_START_TOKEN["output"])], streaming=streaming
+    )
 
     assert reasoning == WITH_START_TOKEN["reasoning_content"]
     assert content == WITH_START_TOKEN["content"]
@@ -157,14 +158,15 @@ def test_with_start_token(seedoss_tokenizer, streaming):
 @pytest.mark.parametrize("streaming", [True, False])
 def test_only_end_token(seedoss_tokenizer, streaming):
     """
-        Test reasoning extraction with only end token
-        (SeedOSS typical behavior).
+    Test reasoning extraction with only end token
+    (SeedOSS typical behavior).
     """
     parser_cls = ReasoningParserManager.get_reasoning_parser(parser_name)
     parser = parser_cls(seedoss_tokenizer)
 
     reasoning, content = run_reasoning_extraction(
-        parser, [cast(str, ONLY_END_TOKEN["output"])], streaming=streaming)
+        parser, [cast(str, ONLY_END_TOKEN["output"])], streaming=streaming
+    )
 
     assert reasoning == ONLY_END_TOKEN["reasoning_content"]
     assert content == ONLY_END_TOKEN["content"]
@@ -177,7 +179,8 @@ def test_no_tokens(seedoss_tokenizer, streaming):
     parser = parser_cls(seedoss_tokenizer)
 
     reasoning, content = run_reasoning_extraction(
-        parser, [cast(str, NO_TOKENS["output"])], streaming=streaming)
+        parser, [cast(str, NO_TOKENS["output"])], streaming=streaming
+    )
 
     assert reasoning == NO_TOKENS["reasoning_content"]
     assert content == NO_TOKENS["content"]
@@ -225,13 +228,9 @@ def test_streaming_delta_processing(seedoss_tokenizer):
     parser = parser_cls(seedoss_tokenizer)
 
     # Test streaming with incremental tokens
-    deltas = [
-        "Some ", "reasoning ", "content", "</seed:think>", "Final ", "answer"
-    ]
+    deltas = ["Some ", "reasoning ", "content", "</seed:think>", "Final ", "answer"]
 
-    reasoning, content = run_reasoning_extraction(parser,
-                                                  deltas,
-                                                  streaming=True)
+    reasoning, content = run_reasoning_extraction(parser, deltas, streaming=True)
 
     assert reasoning == "Some reasoning content"
     assert content == "Final answer"
diff --git a/tests/reasoning/utils.py b/tests/reasoning/utils.py
index 9af5fa5addbc..788136e99681 100644
--- a/tests/reasoning/utils.py
+++ b/tests/reasoning/utils.py
@@ -3,14 +3,12 @@
 
 from typing import Optional, Union
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaMessage)
+from vllm.entrypoints.openai.protocol import ChatCompletionRequest, DeltaMessage
 from vllm.reasoning import ReasoningParser
 from vllm.transformers_utils.tokenizers.mistral import MistralTokenizer
 
 
 class StreamingReasoningReconstructor:
-
     def __init__(self):
         self.reasoning_content = None
         self.other_content = None
@@ -19,8 +17,8 @@ def append_delta(self, delta: DeltaMessage):
         # content and the reasoning content should not be present
         # at the same time
         assert delta.content is None or delta.reasoning_content is None, (
-            "Both content and reasoning content are present in the "
-            "delta message")
+            "Both content and reasoning content are present in the delta message"
+        )
         if delta.content is not None:
             if self.other_content is None:
                 self.other_content = delta.content
@@ -51,7 +49,8 @@ def run_reasoning_extraction(
         )
     else:
         reasoning, content = run_reasoning_extraction_nonstreaming(
-            reasoning_parser, model_output, request)
+            reasoning_parser, model_output, request
+        )
         return reasoning, content
 
 
@@ -61,8 +60,9 @@ def run_reasoning_extraction_mistral(
     request: Union[ChatCompletionRequest, None] = None,
     streaming: bool = False,
 ) -> tuple[Optional[str], Optional[str]]:
-    assert isinstance(reasoning_parser.model_tokenizer,
-                      MistralTokenizer), type(reasoning_parser.model_tokenizer)
+    assert isinstance(reasoning_parser.model_tokenizer, MistralTokenizer), type(
+        reasoning_parser.model_tokenizer
+    )
     if streaming:
         reconstructor = run_reasoning_extraction_streaming_mistral(
             reasoning_parser,
@@ -75,9 +75,11 @@ def run_reasoning_extraction_mistral(
         )
     else:
         str_output = reasoning_parser.model_tokenizer.convert_ids_to_tokens(
-            model_output)
+            model_output
+        )
         reasoning, content = run_reasoning_extraction_nonstreaming(
-            reasoning_parser, str_output, request)
+            reasoning_parser, str_output, request
+        )
         return reasoning, content
 
 
@@ -88,7 +90,8 @@ def run_reasoning_extraction_nonstreaming(
 ) -> tuple[Optional[str], Optional[str]]:
     request = request or ChatCompletionRequest(messages=[], model="test-model")
     return reasoning_parser.extract_reasoning_content(
-        model_output=''.join(model_output), request=request)
+        model_output="".join(model_output), request=request
+    )
 
 
 def run_reasoning_extraction_streaming(
@@ -128,16 +131,16 @@ def run_reasoning_extraction_streaming_mistral(
     model_deltas: list[int],
     request: Union[ChatCompletionRequest, None] = None,
 ) -> StreamingReasoningReconstructor:
-    assert isinstance(reasoning_parser.model_tokenizer,
-                      MistralTokenizer), type(reasoning_parser.model_tokenizer)
+    assert isinstance(reasoning_parser.model_tokenizer, MistralTokenizer), type(
+        reasoning_parser.model_tokenizer
+    )
     request = request or ChatCompletionRequest(messages=[], model="test-model")
     reconstructor = StreamingReasoningReconstructor()
     previous_text = ""
     previous_tokens: list[int] = []
     for model_delta in model_deltas:
         token_delta = [model_delta]
-        delta = reasoning_parser.model_tokenizer.convert_ids_to_tokens(
-            [model_delta])[0]
+        delta = reasoning_parser.model_tokenizer.convert_ids_to_tokens([model_delta])[0]
         current_text = previous_text + delta
         current_tokens = previous_tokens + token_delta
         delta_message = reasoning_parser.extract_reasoning_content_streaming(
diff --git a/tests/samplers/test_beam_search.py b/tests/samplers/test_beam_search.py
index 2960ffcbd9ea..78f5ab3e2d19 100644
--- a/tests/samplers/test_beam_search.py
+++ b/tests/samplers/test_beam_search.py
@@ -36,19 +36,21 @@ def test_beam_search_single_input(
 ) -> None:
     example_prompts = example_prompts[:1]
     with hf_runner(model, dtype=dtype) as hf_model:
-        hf_outputs = hf_model.generate_beam_search(example_prompts, beam_width,
-                                                   max_tokens)
+        hf_outputs = hf_model.generate_beam_search(
+            example_prompts, beam_width, max_tokens
+        )
 
     with vllm_runner(model, dtype=dtype) as vllm_model:
-        vllm_outputs = vllm_model.generate_beam_search(example_prompts,
-                                                       beam_width, max_tokens)
+        vllm_outputs = vllm_model.generate_beam_search(
+            example_prompts, beam_width, max_tokens
+        )
 
     for i in range(len(example_prompts)):
         hf_output_ids, hf_output_texts = hf_outputs[i]
         vllm_output_ids, vllm_output_texts = vllm_outputs[i]
-        for j, (hf_text,
-                vllm_text) in enumerate(zip(hf_output_texts,
-                                            vllm_output_texts)):
+        for j, (hf_text, vllm_text) in enumerate(
+            zip(hf_output_texts, vllm_output_texts)
+        ):
             print(f">>>{j}-th hf output:")
             print(hf_text)
             print(f">>>{j}-th vllm output:")
@@ -56,8 +58,8 @@ def test_beam_search_single_input(
         assert len(hf_output_ids) == len(vllm_output_ids)
         for j in range(len(hf_output_ids)):
             assert hf_output_ids[j] == vllm_output_ids[j], (
-                f"Test{i} output{j}:\nHF: {hf_output_ids}\n"
-                f"vLLM: {vllm_output_ids}")
+                f"Test{i} output{j}:\nHF: {hf_output_ids}\nvLLM: {vllm_output_ids}"
+            )
 
 
 @pytest.mark.skip_v1  # FIXME: This fails on V1 right now.
@@ -76,30 +78,29 @@ def test_beam_search_with_concurrency_limit(
 ) -> None:
     # example_prompts[1]&[3]&[7] fails due to unknown reason even without
     # concurrency limit. skip them for now.
-    example_prompts = (example_prompts[:8])
+    example_prompts = example_prompts[:8]
     concurrency_limit = 2
     assert len(example_prompts) > concurrency_limit
     with vllm_runner(model, dtype=dtype) as vllm_model:
         outputs_with_limit = vllm_model.generate_beam_search(
-            example_prompts,
-            beam_width,
-            max_tokens,
-            concurrency_limit=concurrency_limit)
+            example_prompts, beam_width, max_tokens, concurrency_limit=concurrency_limit
+        )
         outputs_without_limit = []
 
         for i in range(0, len(example_prompts), concurrency_limit):
             outputs_without_limit.extend(
                 vllm_model.generate_beam_search(
-                    example_prompts[i:i + concurrency_limit], beam_width,
-                    max_tokens))
+                    example_prompts[i : i + concurrency_limit], beam_width, max_tokens
+                )
+            )
 
     correct = True
     for i in range(len(example_prompts)):
         output_ids_with_limit, output_texts_with_limit = outputs_with_limit[i]
-        output_ids_without_limit, output_texts_without_limit = (
-            outputs_without_limit[i])
+        output_ids_without_limit, output_texts_without_limit = outputs_without_limit[i]
         for j, (text_with_limit, text_without_limit) in enumerate(
-                zip(output_texts_with_limit, output_texts_without_limit)):
+            zip(output_texts_with_limit, output_texts_without_limit)
+        ):
             print(f">>>{j}-th with limit output:")
             print(text_with_limit)
             print(f">>>{j}-th without limit output:")
@@ -107,8 +108,10 @@ def test_beam_search_with_concurrency_limit(
         assert len(output_ids_with_limit) == len(output_ids_without_limit)
         for j in range(len(output_ids_with_limit)):
             if output_ids_with_limit[j] != output_ids_without_limit[j]:
-                print(f"Test{i} output{j}:\n+limit: {output_ids_with_limit}\n"
-                      f"-limit: {output_ids_without_limit}")
+                print(
+                    f"Test{i} output{j}:\n+limit: {output_ids_with_limit}\n"
+                    f"-limit: {output_ids_without_limit}"
+                )
                 correct = False
     assert correct
 
@@ -131,11 +134,10 @@ def test_beam_search_passes_multimodal_data(
     model = "Qwen/Qwen2-Audio-7B-Instruct"
     audio_seq = "<|audio_bos|><|AUDIO|><|audio_eos|>"
     prompts = [
-        f"<|im_start|>user\n{audio_seq}Can you transcribe this?<|im_end|>\n<|im_start|>assistant\n"  #noqa: E501
+        f"<|im_start|>user\n{audio_seq}Can you transcribe this?<|im_end|>\n<|im_start|>assistant\n"  # noqa: E501
     ]
 
-    with hf_runner(model, dtype=dtype,
-                   auto_cls=AutoModelForSeq2SeqLM) as hf_model:
+    with hf_runner(model, dtype=dtype, auto_cls=AutoModelForSeq2SeqLM) as hf_model:
         audio_token_id = hf_model.config.audio_token_index
         eos_token_id = hf_model.tokenizer.eos_token_id  # <|im_end|>
         hf_outputs = hf_model.generate_beam_search(
@@ -153,17 +155,15 @@ def test_beam_search_passes_multimodal_data(
             audios=audios,
         )
 
-    seq_with_no_audio_toks = lambda seq: [
-        tok for tok in seq if tok != audio_token_id
-    ]
+    seq_with_no_audio_toks = lambda seq: [tok for tok in seq if tok != audio_token_id]
 
     for i in range(len(prompts)):
         hf_output_ids, hf_output_texts = hf_outputs[i]
         vllm_output_ids, vllm_output_texts = vllm_outputs[i]
 
-        for j, (hf_text,
-                vllm_text) in enumerate(zip(hf_output_texts,
-                                            vllm_output_texts)):
+        for j, (hf_text, vllm_text) in enumerate(
+            zip(hf_output_texts, vllm_output_texts)
+        ):
             print(f">>>{j}-th hf output [NOTE: special tokens are filtered]:")
             print(hf_text)
             print(f">>>{j}-th vllm output:")
@@ -176,12 +176,10 @@ def test_beam_search_passes_multimodal_data(
             # token to match features, while the vLLM helper maintains the
             # single audio token in the input text
             filtered_hf_output_ids = seq_with_no_audio_toks(hf_output_ids[j])
-            filtered_vllm_output_ids = seq_with_no_audio_toks(
-                vllm_output_ids[j])
+            filtered_vllm_output_ids = seq_with_no_audio_toks(vllm_output_ids[j])
 
             # HF output IDs may contain the end of sequence
-            if len(filtered_hf_output_ids
-                   ) == len(filtered_vllm_output_ids) + 1:
+            if len(filtered_hf_output_ids) == len(filtered_vllm_output_ids) + 1:
                 assert filtered_hf_output_ids[-1] == eos_token_id
                 filtered_hf_output_ids = filtered_hf_output_ids[:-1]
 
diff --git a/tests/samplers/test_ignore_eos.py b/tests/samplers/test_ignore_eos.py
index 1d77d37a5d58..d1609b24cc5a 100644
--- a/tests/samplers/test_ignore_eos.py
+++ b/tests/samplers/test_ignore_eos.py
@@ -25,11 +25,11 @@ def test_ignore_eos(
     max_tokens: int,
 ) -> None:
     with vllm_runner(model, dtype=dtype) as vllm_model:
-        sampling_params = SamplingParams(max_tokens=max_tokens,
-                                         ignore_eos=True)
+        sampling_params = SamplingParams(max_tokens=max_tokens, ignore_eos=True)
 
         for prompt in example_prompts:
             ignore_eos_output = vllm_model.llm.generate(
-                prompt, sampling_params=sampling_params)
+                prompt, sampling_params=sampling_params
+            )
             output_length = len(ignore_eos_output[0].outputs[0].token_ids)
             assert output_length == max_tokens
diff --git a/tests/samplers/test_no_bad_words.py b/tests/samplers/test_no_bad_words.py
index 128e8f552a16..42aebcd52414 100644
--- a/tests/samplers/test_no_bad_words.py
+++ b/tests/samplers/test_no_bad_words.py
@@ -5,6 +5,7 @@
 Run `pytest tests/samplers/test_no_bad_words.py`.
 
 """
+
 from typing import Optional
 
 import pytest
@@ -16,7 +17,7 @@
 @pytest.fixture(autouse=True)
 def v1(monkeypatch):
     """Only run on vLLM v1."""
-    monkeypatch.setenv('VLLM_USE_V1', '1')
+    monkeypatch.setenv("VLLM_USE_V1", "1")
 
 
 def _generate(
@@ -49,25 +50,24 @@ class TestOneTokenBadWord:
     TARGET_TOKEN = "you"
 
     def setup_method(self, method):
-        self.tokenizer = AutoTokenizer.from_pretrained(self.MODEL,
-                                                       add_prefix_space=True)
+        self.tokenizer = AutoTokenizer.from_pretrained(
+            self.MODEL, add_prefix_space=True
+        )
 
         self.num_prompt_tokens = len(self._encode(self.PROMPT))
-        self.target_token_id = self._encode(self.TARGET_TOKEN,
-                                            add_special_tokens=False)[0]
+        self.target_token_id = self._encode(
+            self.TARGET_TOKEN, add_special_tokens=False
+        )[0]
 
     def test_one_token_bad_word(self, vllm_runner):
         with vllm_runner(self.MODEL) as llm:
             output_token_ids = self._generate(llm)
             assert output_token_ids[0] == self.target_token_id
 
-            output_token_ids = self._generate(llm,
-                                              bad_words=[self.TARGET_TOKEN])
+            output_token_ids = self._generate(llm, bad_words=[self.TARGET_TOKEN])
             assert self.target_token_id not in output_token_ids
 
-    def _generate(self,
-                  llm: LLM,
-                  bad_words: Optional[list[str]] = None) -> list[int]:
+    def _generate(self, llm: LLM, bad_words: Optional[list[str]] = None) -> list[int]:
         return _generate(
             llm=llm,
             prompt=self.PROMPT,
@@ -75,11 +75,8 @@ def _generate(self,
             bad_words=bad_words,
         )
 
-    def _encode(self,
-                prompt: str,
-                add_special_tokens: bool = True) -> list[int]:
-        return self.tokenizer(prompt,
-                              add_special_tokens=add_special_tokens).input_ids
+    def _encode(self, prompt: str, add_special_tokens: bool = True) -> list[int]:
+        return self.tokenizer(prompt, add_special_tokens=add_special_tokens).input_ids
 
 
 class TestTwoTokenBadWord:
@@ -92,72 +89,80 @@ class TestTwoTokenBadWord:
     NEIGHBOUR_TOKEN2 = "older"
 
     def setup_method(self, method):
-        self.tokenizer = AutoTokenizer.from_pretrained(self.MODEL,
-                                                       add_prefix_space=True)
+        self.tokenizer = AutoTokenizer.from_pretrained(
+            self.MODEL, add_prefix_space=True
+        )
 
         self.num_prompt_tokens = len(self._encode(self.PROMPT))
-        self.target_token_id1 = self._encode(self.TARGET_TOKEN1,
-                                             add_special_tokens=False)[0]
-        self.target_token_id2 = self._encode(self.TARGET_TOKEN2,
-                                             add_special_tokens=False)[0]
-        self.neighbour_token_id2 = self._encode(self.NEIGHBOUR_TOKEN2,
-                                                add_special_tokens=False)[0]
+        self.target_token_id1 = self._encode(
+            self.TARGET_TOKEN1, add_special_tokens=False
+        )[0]
+        self.target_token_id2 = self._encode(
+            self.TARGET_TOKEN2, add_special_tokens=False
+        )[0]
+        self.neighbour_token_id2 = self._encode(
+            self.NEIGHBOUR_TOKEN2, add_special_tokens=False
+        )[0]
 
     def test_two_token_bad_word(self, vllm_runner):
         with vllm_runner(self.MODEL, dtype="half") as llm:
             output_token_ids = self._generate(llm)
             assert output_token_ids[:2] == [
-                self.target_token_id1, self.target_token_id2
+                self.target_token_id1,
+                self.target_token_id2,
             ]
 
-            output_token_ids = self._generate(llm,
-                                              bad_words=[self.TARGET_TOKEN1])
+            output_token_ids = self._generate(llm, bad_words=[self.TARGET_TOKEN1])
             assert self.target_token_id1 not in output_token_ids
 
-            output_token_ids = self._generate(llm,
-                                              bad_words=[self.TARGET_TOKEN2])
+            output_token_ids = self._generate(llm, bad_words=[self.TARGET_TOKEN2])
             assert output_token_ids[0] == self.target_token_id1
             assert self.target_token_id2 not in output_token_ids
 
             output_token_ids = self._generate(
-                llm, bad_words=[f'{self.TARGET_TOKEN1} {self.TARGET_TOKEN2}'])
+                llm, bad_words=[f"{self.TARGET_TOKEN1} {self.TARGET_TOKEN2}"]
+            )
             assert output_token_ids[0] == self.target_token_id1
             assert output_token_ids[:2] != [
-                self.target_token_id1, self.target_token_id2
+                self.target_token_id1,
+                self.target_token_id2,
             ]
             assert not self._contains(
-                output_token_ids,
-                [self.target_token_id1, self.target_token_id2])
+                output_token_ids, [self.target_token_id1, self.target_token_id2]
+            )
             # Model dependent behaviour
             assert output_token_ids[:2] == [
-                self.target_token_id1, self.neighbour_token_id2
+                self.target_token_id1,
+                self.neighbour_token_id2,
             ]
 
             output_token_ids = self._generate(
                 llm,
                 bad_words=[
-                    f'{self.TARGET_TOKEN1} {self.TARGET_TOKEN2}',
-                    f'{self.TARGET_TOKEN1} {self.NEIGHBOUR_TOKEN2}'
-                ])
+                    f"{self.TARGET_TOKEN1} {self.TARGET_TOKEN2}",
+                    f"{self.TARGET_TOKEN1} {self.NEIGHBOUR_TOKEN2}",
+                ],
+            )
             assert output_token_ids[0] == self.target_token_id1
             assert output_token_ids[:2] != [
-                self.target_token_id1, self.target_token_id2
+                self.target_token_id1,
+                self.target_token_id2,
             ]
             assert not self._contains(
-                output_token_ids,
-                [self.target_token_id1, self.target_token_id2])
+                output_token_ids, [self.target_token_id1, self.target_token_id2]
+            )
             assert output_token_ids[:2] != [
-                self.target_token_id1, self.neighbour_token_id2
+                self.target_token_id1,
+                self.neighbour_token_id2,
             ]
             assert not self._contains(
-                output_token_ids,
-                [self.target_token_id1, self.neighbour_token_id2])
-            assert ((self.target_token_id2 in output_token_ids)
-                    or (self.neighbour_token_id2 in output_token_ids))
-
-    def _generate(self,
-                  llm: LLM,
-                  bad_words: Optional[list[str]] = None) -> list[int]:
+                output_token_ids, [self.target_token_id1, self.neighbour_token_id2]
+            )
+            assert (self.target_token_id2 in output_token_ids) or (
+                self.neighbour_token_id2 in output_token_ids
+            )
+
+    def _generate(self, llm: LLM, bad_words: Optional[list[str]] = None) -> list[int]:
         return _generate(
             llm=llm,
             prompt=self.PROMPT,
@@ -187,8 +192,5 @@ def _contains(sequence: list[int], subsequence: list[int]) -> bool:
 
         return False
 
-    def _encode(self,
-                prompt: str,
-                add_special_tokens: bool = True) -> list[int]:
-        return self.tokenizer(prompt,
-                              add_special_tokens=add_special_tokens).input_ids
+    def _encode(self, prompt: str, add_special_tokens: bool = True) -> list[int]:
+        return self.tokenizer(prompt, add_special_tokens=add_special_tokens).input_ids
diff --git a/tests/samplers/test_ranks.py b/tests/samplers/test_ranks.py
index 220a4a53f467..1359e6403e4c 100644
--- a/tests/samplers/test_ranks.py
+++ b/tests/samplers/test_ranks.py
@@ -20,25 +20,27 @@ def test_ranks(
     num_top_logprobs = 5
     num_prompt_logprobs = 5
 
-    with vllm_runner(model, dtype=dtype,
-                     max_logprobs=num_top_logprobs) as vllm_model:
-
+    with vllm_runner(model, dtype=dtype, max_logprobs=num_top_logprobs) as vllm_model:
         ## Test greedy logprobs ranks
         vllm_sampling_params = SamplingParams(
             temperature=0.0,
             top_p=1.0,
             max_tokens=max_tokens,
             logprobs=num_top_logprobs,
-            prompt_logprobs=num_prompt_logprobs)
-        vllm_results = vllm_model.generate_w_logprobs(example_prompts,
-                                                      vllm_sampling_params)
+            prompt_logprobs=num_prompt_logprobs,
+        )
+        vllm_results = vllm_model.generate_w_logprobs(
+            example_prompts, vllm_sampling_params
+        )
 
         ## Test non-greedy logprobs ranks
-        sampling_params = SamplingParams(temperature=1.0,
-                                         top_p=1.0,
-                                         max_tokens=max_tokens,
-                                         logprobs=num_top_logprobs,
-                                         prompt_logprobs=num_prompt_logprobs)
+        sampling_params = SamplingParams(
+            temperature=1.0,
+            top_p=1.0,
+            max_tokens=max_tokens,
+            logprobs=num_top_logprobs,
+            prompt_logprobs=num_prompt_logprobs,
+        )
         res = vllm_model.generate_w_logprobs(example_prompts, sampling_params)
 
     for result in vllm_results:
diff --git a/tests/speculative_decoding/speculators/test_eagle3.py b/tests/speculative_decoding/speculators/test_eagle3.py
index 87d799a5fed7..5ce6e1593b5c 100644
--- a/tests/speculative_decoding/speculators/test_eagle3.py
+++ b/tests/speculative_decoding/speculators/test_eagle3.py
@@ -7,19 +7,26 @@
 from vllm.model_executor.models.interfaces import supports_eagle3
 
 
-@pytest.mark.parametrize("model_path", [
-    pytest.param(
-        "nm-testing/SpeculatorLlama3-1-8B-Eagle3-converted-0717-quantized",
-        id="llama3-eagle3-speculator"),
-    pytest.param(
-        "nm-testing/Speculator-Qwen3-8B-Eagle3-converted-071-quantized",
-        id="qwen3-eagle3-speculator"),
-    pytest.param(
-        "nm-testing/Speculator-Qwen3-8B-Eagle3-converted-071-quantized-w4a16",
-        id="qwen3-eagle3-speculator-w4a16-verifier"),
-])
-def test_eagle3_speculators_model(vllm_runner, example_prompts, model_path,
-                                  monkeypatch):
+@pytest.mark.parametrize(
+    "model_path",
+    [
+        pytest.param(
+            "nm-testing/SpeculatorLlama3-1-8B-Eagle3-converted-0717-quantized",
+            id="llama3-eagle3-speculator",
+        ),
+        pytest.param(
+            "nm-testing/Speculator-Qwen3-8B-Eagle3-converted-071-quantized",
+            id="qwen3-eagle3-speculator",
+        ),
+        pytest.param(
+            "nm-testing/Speculator-Qwen3-8B-Eagle3-converted-071-quantized-w4a16",
+            id="qwen3-eagle3-speculator-w4a16-verifier",
+        ),
+    ],
+)
+def test_eagle3_speculators_model(
+    vllm_runner, example_prompts, model_path, monkeypatch
+):
     """
     Test Eagle3 speculators models properly initialize speculative decoding.
 
@@ -40,18 +47,19 @@ def test_eagle3_speculators_model(vllm_runner, example_prompts, model_path,
 
         vllm_config = vllm_model.llm.llm_engine.vllm_config
 
-        assert isinstance(vllm_config.speculative_config, SpeculativeConfig), \
+        assert isinstance(vllm_config.speculative_config, SpeculativeConfig), (
             "Speculative config should be initialized for speculators model"
+        )
 
         spec_config = vllm_config.speculative_config
-        assert spec_config.num_speculative_tokens > 0, \
-            (f"Expected positive speculative tokens, "
-             f"got {spec_config.num_speculative_tokens}")
+        assert spec_config.num_speculative_tokens > 0, (
+            f"Expected positive speculative tokens, "
+            f"got {spec_config.num_speculative_tokens}"
+        )
 
-        assert spec_config.model == model_path, \
+        assert spec_config.model == model_path, (
             f"Draft model should be {model_path}, got {spec_config.model}"
+        )
 
-        vllm_outputs = vllm_model.generate_greedy(example_prompts,
-                                                  max_tokens=20)
-        assert vllm_outputs, \
-            f"No outputs generated for speculators model {model_path}"
+        vllm_outputs = vllm_model.generate_greedy(example_prompts, max_tokens=20)
+        assert vllm_outputs, f"No outputs generated for speculators model {model_path}"
diff --git a/tests/standalone_tests/lazy_imports.py b/tests/standalone_tests/lazy_imports.py
index 21bcb6b822d1..ddcdd2a51ab9 100644
--- a/tests/standalone_tests/lazy_imports.py
+++ b/tests/standalone_tests/lazy_imports.py
@@ -37,4 +37,5 @@ def any_module_imported():
 
 assert not any_module_imported(), (
     f"Some the modules in {module_names} are imported. To see the first"
-    f" import location, run the test with `use_blame=True`.")
+    f" import location, run the test with `use_blame=True`."
+)
diff --git a/tests/test_config.py b/tests/test_config.py
index 90d0c78c451f..f3d40a7d8081 100644
--- a/tests/test_config.py
+++ b/tests/test_config.py
@@ -23,8 +23,8 @@ def test_compile_config_repr_succeeds():
 
     # test that repr(config) succeeds
     val = repr(config)
-    assert 'VllmConfig' in val
-    assert 'inductor_passes' in val
+    assert "VllmConfig" in val
+    assert "inductor_passes" in val
 
 
 @dataclass
@@ -51,8 +51,7 @@ def test_get_field():
 
 @dataclass
 class _TestNestedConfig:
-    a: _TestConfigFields = field(
-        default_factory=lambda: _TestConfigFields(a=0))
+    a: _TestConfigFields = field(default_factory=lambda: _TestConfigFields(a=0))
 
 
 def test_update_config():
@@ -79,20 +78,19 @@ def test_update_config():
 
 # Can remove once --task option is fully deprecated
 @pytest.mark.parametrize(
-    ("model_id", "expected_runner_type", "expected_convert_type",
-     "expected_task"),
+    ("model_id", "expected_runner_type", "expected_convert_type", "expected_task"),
     [
         ("distilbert/distilgpt2", "generate", "none", "generate"),
         ("intfloat/multilingual-e5-small", "pooling", "none", "embed"),
         ("jason9693/Qwen2.5-1.5B-apeach", "pooling", "classify", "classify"),
-        ("cross-encoder/ms-marco-MiniLM-L-6-v2", "pooling", "none",
-         "classify"),
+        ("cross-encoder/ms-marco-MiniLM-L-6-v2", "pooling", "none", "classify"),
         ("Qwen/Qwen2.5-Math-RM-72B", "pooling", "none", "reward"),
         ("openai/whisper-small", "generate", "none", "transcription"),
     ],
 )
-def test_auto_task(model_id, expected_runner_type, expected_convert_type,
-                   expected_task):
+def test_auto_task(
+    model_id, expected_runner_type, expected_convert_type, expected_task
+):
     config = ModelConfig(model_id, task="auto")
 
     assert config.runner_type == expected_runner_type
@@ -101,20 +99,19 @@ def test_auto_task(model_id, expected_runner_type, expected_convert_type,
 
 # Can remove once --task option is fully deprecated
 @pytest.mark.parametrize(
-    ("model_id", "expected_runner_type", "expected_convert_type",
-     "expected_task"),
+    ("model_id", "expected_runner_type", "expected_convert_type", "expected_task"),
     [
         ("distilbert/distilgpt2", "pooling", "embed", "embed"),
         ("intfloat/multilingual-e5-small", "pooling", "embed", "embed"),
         ("jason9693/Qwen2.5-1.5B-apeach", "pooling", "classify", "classify"),
-        ("cross-encoder/ms-marco-MiniLM-L-6-v2", "pooling", "classify",
-         "classify"),
+        ("cross-encoder/ms-marco-MiniLM-L-6-v2", "pooling", "classify", "classify"),
         ("Qwen/Qwen2.5-Math-RM-72B", "pooling", "embed", "embed"),
         ("openai/whisper-small", "pooling", "embed", "embed"),
     ],
 )
-def test_score_task(model_id, expected_runner_type, expected_convert_type,
-                    expected_task):
+def test_score_task(
+    model_id, expected_runner_type, expected_convert_type, expected_task
+):
     config = ModelConfig(model_id, task="score")
 
     assert config.runner_type == expected_runner_type
@@ -123,14 +120,14 @@ def test_score_task(model_id, expected_runner_type, expected_convert_type,
 
 # Can remove once --task option is fully deprecated
 @pytest.mark.parametrize(
-    ("model_id", "expected_runner_type", "expected_convert_type",
-     "expected_task"),
+    ("model_id", "expected_runner_type", "expected_convert_type", "expected_task"),
     [
         ("openai/whisper-small", "generate", "none", "transcription"),
     ],
 )
-def test_transcription_task(model_id, expected_runner_type,
-                            expected_convert_type, expected_task):
+def test_transcription_task(
+    model_id, expected_runner_type, expected_convert_type, expected_task
+):
     config = ModelConfig(model_id, task="transcription")
 
     assert config.runner_type == expected_runner_type
@@ -200,8 +197,9 @@ def test_disable_sliding_window(model_id_expected):
     assert model_config.max_model_len == expected
 
 
-@pytest.mark.skipif(current_platform.is_rocm(),
-                    reason="Xformers backend is not supported on ROCm.")
+@pytest.mark.skipif(
+    current_platform.is_rocm(), reason="Xformers backend is not supported on ROCm."
+)
 def test_get_pooling_config():
     model_id = "sentence-transformers/all-MiniLM-L12-v2"
     model_config = ModelConfig(model_id)
@@ -211,8 +209,9 @@ def test_get_pooling_config():
     assert model_config.pooler_config.pooling_type == PoolingType.MEAN.name
 
 
-@pytest.mark.skipif(current_platform.is_rocm(),
-                    reason="Xformers backend is not supported on ROCm.")
+@pytest.mark.skipif(
+    current_platform.is_rocm(), reason="Xformers backend is not supported on ROCm."
+)
 def test_get_pooling_config_from_args():
     model_id = "sentence-transformers/all-MiniLM-L12-v2"
     pooler_config = PoolerConfig(pooling_type="CLS", normalize=True)
@@ -227,16 +226,18 @@ def test_get_pooling_config_from_args():
         ("tomaarsen/Qwen3-Reranker-0.6B-seq-cls", "LAST", "LAST"),  # LLM
         ("intfloat/e5-small", "CLS", "MEAN"),  # BertModel
         ("Qwen/Qwen2.5-Math-RM-72B", "ALL", "ALL"),  # reward
-        ("Qwen/Qwen2.5-Math-PRM-7B", "STEP", "STEP")  # step reward
-    ])
+        ("Qwen/Qwen2.5-Math-PRM-7B", "STEP", "STEP"),  # step reward
+    ],
+)
 def test_default_pooling_type(model_id, default_pooling_type, pooling_type):
     model_config = ModelConfig(model_id)
     assert model_config._model_info.default_pooling_type == default_pooling_type
     assert model_config.pooler_config.pooling_type == pooling_type
 
 
-@pytest.mark.skipif(current_platform.is_rocm(),
-                    reason="Xformers backend is not supported on ROCm.")
+@pytest.mark.skipif(
+    current_platform.is_rocm(), reason="Xformers backend is not supported on ROCm."
+)
 def test_get_bert_tokenization_sentence_transformer_config():
     model_id = "BAAI/bge-base-en-v1.5"
     bge_model_config = ModelConfig(model_id)
@@ -264,17 +265,18 @@ def test_rope_customization():
             "rope_theta": TEST_ROPE_THETA,
         },
     )
-    assert getattr(llama_model_config.hf_config, "rope_scaling",
-                   None) == TEST_ROPE_SCALING
-    assert getattr(llama_model_config.hf_config, "rope_theta",
-                   None) == TEST_ROPE_THETA
+    assert (
+        getattr(llama_model_config.hf_config, "rope_scaling", None) == TEST_ROPE_SCALING
+    )
+    assert getattr(llama_model_config.hf_config, "rope_theta", None) == TEST_ROPE_THETA
     assert llama_model_config.max_model_len == 16384
 
     longchat_model_config = ModelConfig("lmsys/longchat-13b-16k")
     # Check if LONGCHAT_ROPE_SCALING entries are in longchat_model_config
     assert all(
         longchat_model_config.hf_config.rope_scaling.get(key) == value
-        for key, value in LONGCHAT_ROPE_SCALING.items())
+        for key, value in LONGCHAT_ROPE_SCALING.items()
+    )
     assert longchat_model_config.max_model_len == 16384
 
     longchat_model_config = ModelConfig(
@@ -283,28 +285,37 @@ def test_rope_customization():
             "rope_scaling": TEST_ROPE_SCALING,
         },
     )
-    assert getattr(longchat_model_config.hf_config, "rope_scaling",
-                   None) == TEST_ROPE_SCALING
+    assert (
+        getattr(longchat_model_config.hf_config, "rope_scaling", None)
+        == TEST_ROPE_SCALING
+    )
     assert longchat_model_config.max_model_len == 4096
 
 
-@pytest.mark.skipif(current_platform.is_rocm(),
-                    reason="Encoder Decoder models not supported on ROCm.")
-@pytest.mark.parametrize(("model_id", "is_encoder_decoder"), [
-    ("facebook/opt-125m", False),
-    ("openai/whisper-tiny", True),
-    ("meta-llama/Llama-3.2-1B-Instruct", False),
-])
+@pytest.mark.skipif(
+    current_platform.is_rocm(), reason="Encoder Decoder models not supported on ROCm."
+)
+@pytest.mark.parametrize(
+    ("model_id", "is_encoder_decoder"),
+    [
+        ("facebook/opt-125m", False),
+        ("openai/whisper-tiny", True),
+        ("meta-llama/Llama-3.2-1B-Instruct", False),
+    ],
+)
 def test_is_encoder_decoder(model_id, is_encoder_decoder):
     config = ModelConfig(model_id)
 
     assert config.is_encoder_decoder == is_encoder_decoder
 
 
-@pytest.mark.parametrize(("model_id", "uses_mrope"), [
-    ("facebook/opt-125m", False),
-    ("Qwen/Qwen2-VL-2B-Instruct", True),
-])
+@pytest.mark.parametrize(
+    ("model_id", "uses_mrope"),
+    [
+        ("facebook/opt-125m", False),
+        ("Qwen/Qwen2-VL-2B-Instruct", True),
+    ],
+)
 def test_uses_mrope(model_id, uses_mrope):
     config = ModelConfig(model_id)
 
@@ -338,7 +349,8 @@ def test_generation_config_loading():
     model_config = ModelConfig(
         model_id,
         generation_config="auto",
-        override_generation_config=override_generation_config)
+        override_generation_config=override_generation_config,
+    )
 
     override_result = correct_generation_config.copy()
     override_result.update(override_generation_config)
@@ -350,17 +362,19 @@ def test_generation_config_loading():
     model_config = ModelConfig(
         model_id,
         generation_config="vllm",
-        override_generation_config=override_generation_config)
+        override_generation_config=override_generation_config,
+    )
 
     assert model_config.get_diff_sampling_param() == override_generation_config
 
 
-@pytest.mark.parametrize("pt_load_map_location", [
-    "cuda",
-    {
-        "": "cuda"
-    },
-])
+@pytest.mark.parametrize(
+    "pt_load_map_location",
+    [
+        "cuda",
+        {"": "cuda"},
+    ],
+)
 def test_load_config_pt_load_map_location(pt_load_map_location):
     load_config = LoadConfig(pt_load_map_location=pt_load_map_location)
     config = VllmConfig(load_config=load_config)
@@ -369,15 +383,18 @@ def test_load_config_pt_load_map_location(pt_load_map_location):
 
 
 @pytest.mark.parametrize(
-    ("model_id", "max_model_len", "expected_max_len", "should_raise"), [
+    ("model_id", "max_model_len", "expected_max_len", "should_raise"),
+    [
         ("BAAI/bge-reranker-base", None, 512, False),
         ("BAAI/bge-reranker-base", 256, 256, False),
         ("BAAI/bge-reranker-base", 513, 512, True),
         ("deepseek-ai/DeepSeek-R1-Distill-Qwen-7B", None, 131072, False),
         ("deepseek-ai/DeepSeek-R1-Distill-Qwen-7B", 131073, 131072, True),
-    ])
-def test_get_and_verify_max_len(model_id, max_model_len, expected_max_len,
-                                should_raise):
+    ],
+)
+def test_get_and_verify_max_len(
+    model_id, max_model_len, expected_max_len, should_raise
+):
     """Test get_and_verify_max_len with different configurations."""
     model_config = ModelConfig(model_id)
 
@@ -398,11 +415,14 @@ def __init__(self, model: str, tokenizer: str):
         self.model_weights = None
 
 
-@pytest.mark.parametrize("s3_url", [
-    "s3://example-bucket-1/model/",
-    "s3://example-bucket-2/model/",
-])
-@patch('vllm.transformers_utils.runai_utils.ObjectStorageModel.pull_files')
+@pytest.mark.parametrize(
+    "s3_url",
+    [
+        "s3://example-bucket-1/model/",
+        "s3://example-bucket-2/model/",
+    ],
+)
+@patch("vllm.transformers_utils.runai_utils.ObjectStorageModel.pull_files")
 def test_s3_url_model_tokenizer_paths(mock_pull_files, s3_url):
     """Test that S3 URLs create deterministic local directories for model and
     tokenizer."""
@@ -414,22 +434,24 @@ def test_s3_url_model_tokenizer_paths(mock_pull_files, s3_url):
     ModelConfig.maybe_pull_model_tokenizer_for_runai(config1, s3_url, s3_url)
 
     # Check that model and tokenizer point to existing directories
-    assert os.path.exists(
-        config1.model), f"Model directory does not exist: {config1.model}"
-    assert os.path.isdir(
-        config1.model), f"Model path is not a directory: {config1.model}"
-    assert os.path.exists(
-        config1.tokenizer
-    ), f"Tokenizer directory does not exist: {config1.tokenizer}"
-    assert os.path.isdir(
-        config1.tokenizer
-    ), f"Tokenizer path is not a directory: {config1.tokenizer}"
+    assert os.path.exists(config1.model), (
+        f"Model directory does not exist: {config1.model}"
+    )
+    assert os.path.isdir(config1.model), (
+        f"Model path is not a directory: {config1.model}"
+    )
+    assert os.path.exists(config1.tokenizer), (
+        f"Tokenizer directory does not exist: {config1.tokenizer}"
+    )
+    assert os.path.isdir(config1.tokenizer), (
+        f"Tokenizer path is not a directory: {config1.tokenizer}"
+    )
 
     # Verify that the paths are different from the original S3 URL
-    assert config1.model != s3_url, (
-        "Model path should be converted to local directory")
+    assert config1.model != s3_url, "Model path should be converted to local directory"
     assert config1.tokenizer != s3_url, (
-        "Tokenizer path should be converted to local directory")
+        "Tokenizer path should be converted to local directory"
+    )
 
     # Store the original paths
     created_model_dir = config1.model
@@ -440,27 +462,31 @@ def test_s3_url_model_tokenizer_paths(mock_pull_files, s3_url):
     ModelConfig.maybe_pull_model_tokenizer_for_runai(config2, s3_url, s3_url)
 
     # Check that the new directories exist
-    assert os.path.exists(
-        config2.model), f"Model directory does not exist: {config2.model}"
-    assert os.path.isdir(
-        config2.model), f"Model path is not a directory: {config2.model}"
-    assert os.path.exists(
-        config2.tokenizer
-    ), f"Tokenizer directory does not exist: {config2.tokenizer}"
-    assert os.path.isdir(
-        config2.tokenizer
-    ), f"Tokenizer path is not a directory: {config2.tokenizer}"
+    assert os.path.exists(config2.model), (
+        f"Model directory does not exist: {config2.model}"
+    )
+    assert os.path.isdir(config2.model), (
+        f"Model path is not a directory: {config2.model}"
+    )
+    assert os.path.exists(config2.tokenizer), (
+        f"Tokenizer directory does not exist: {config2.tokenizer}"
+    )
+    assert os.path.isdir(config2.tokenizer), (
+        f"Tokenizer path is not a directory: {config2.tokenizer}"
+    )
 
     # Verify that the paths are deterministic (same as before)
     assert config2.model == created_model_dir, (
         f"Model paths are not deterministic. "
-        f"Original: {created_model_dir}, New: {config2.model}")
+        f"Original: {created_model_dir}, New: {config2.model}"
+    )
     assert config2.tokenizer == create_tokenizer_dir, (
         f"Tokenizer paths are not deterministic. "
-        f"Original: {create_tokenizer_dir}, New: {config2.tokenizer}")
+        f"Original: {create_tokenizer_dir}, New: {config2.tokenizer}"
+    )
 
 
-@patch('vllm.transformers_utils.runai_utils.ObjectStorageModel.pull_files')
+@patch("vllm.transformers_utils.runai_utils.ObjectStorageModel.pull_files")
 def test_s3_url_different_models_create_different_directories(mock_pull_files):
     """Test that different S3 URLs create different local directories."""
     # Mock pull_files to avoid actually downloading files during tests
@@ -479,16 +505,16 @@ def test_s3_url_different_models_create_different_directories(mock_pull_files):
     # Verify that different URLs produce different directories
     assert config1.model != config2.model, (
         f"Different S3 URLs should create different model directories. "
-        f"URL1 model: {config1.model}, URL2 model: {config2.model}")
+        f"URL1 model: {config1.model}, URL2 model: {config2.model}"
+    )
     assert config1.tokenizer != config2.tokenizer, (
         f"Different S3 URLs should create different tokenizer directories. "
         f"URL1 tokenizer: {config1.tokenizer}, "
-        f"URL2 tokenizer: {config2.tokenizer}")
+        f"URL2 tokenizer: {config2.tokenizer}"
+    )
 
     # Verify that both sets of directories exist
     assert os.path.exists(config1.model) and os.path.isdir(config1.model)
-    assert os.path.exists(config1.tokenizer) and os.path.isdir(
-        config1.tokenizer)
+    assert os.path.exists(config1.tokenizer) and os.path.isdir(config1.tokenizer)
     assert os.path.exists(config2.model) and os.path.isdir(config2.model)
-    assert os.path.exists(config2.tokenizer) and os.path.isdir(
-        config2.tokenizer)
+    assert os.path.exists(config2.tokenizer) and os.path.isdir(config2.tokenizer)
diff --git a/tests/test_embedded_commit.py b/tests/test_embedded_commit.py
index b9593e2a3b7c..687a15446fc2 100644
--- a/tests/test_embedded_commit.py
+++ b/tests/test_embedded_commit.py
@@ -1,11 +1,11 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-import vllm
-
-
-def test_embedded_commit_defined():
-    assert hasattr(vllm, "__version__")
-    assert hasattr(vllm, "__version_tuple__")
-    assert vllm.__version__ != "dev"
-    assert vllm.__version_tuple__ != (0, 0, "dev")
+import vllm
+
+
+def test_embedded_commit_defined():
+    assert hasattr(vllm, "__version__")
+    assert hasattr(vllm, "__version_tuple__")
+    assert vllm.__version__ != "dev"
+    assert vllm.__version_tuple__ != (0, 0, "dev")
diff --git a/tests/test_envs.py b/tests/test_envs.py
index f81a6e2e415c..62d529c36360 100644
--- a/tests/test_envs.py
+++ b/tests/test_envs.py
@@ -14,68 +14,71 @@ class TestEnvWithChoices:
 
     def test_default_value_returned_when_env_not_set(self):
         """Test default is returned when env var is not set."""
-        env_func = env_with_choices("NONEXISTENT_ENV", "default",
-                                    ["option1", "option2"])
+        env_func = env_with_choices(
+            "NONEXISTENT_ENV", "default", ["option1", "option2"]
+        )
         assert env_func() == "default"
 
     def test_none_default_returned_when_env_not_set(self):
         """Test that None is returned when env not set and default is None."""
-        env_func = env_with_choices("NONEXISTENT_ENV", None,
-                                    ["option1", "option2"])
+        env_func = env_with_choices("NONEXISTENT_ENV", None, ["option1", "option2"])
         assert env_func() is None
 
     def test_valid_value_returned_case_sensitive(self):
         """Test that valid value is returned in case sensitive mode."""
         with patch.dict(os.environ, {"TEST_ENV": "option1"}):
-            env_func = env_with_choices("TEST_ENV",
-                                        "default", ["option1", "option2"],
-                                        case_sensitive=True)
+            env_func = env_with_choices(
+                "TEST_ENV", "default", ["option1", "option2"], case_sensitive=True
+            )
             assert env_func() == "option1"
 
     def test_valid_lowercase_value_returned_case_insensitive(self):
         """Test that lowercase value is accepted in case insensitive mode."""
         with patch.dict(os.environ, {"TEST_ENV": "option1"}):
-            env_func = env_with_choices("TEST_ENV",
-                                        "default", ["OPTION1", "OPTION2"],
-                                        case_sensitive=False)
+            env_func = env_with_choices(
+                "TEST_ENV", "default", ["OPTION1", "OPTION2"], case_sensitive=False
+            )
             assert env_func() == "option1"
 
     def test_valid_uppercase_value_returned_case_insensitive(self):
         """Test that uppercase value is accepted in case insensitive mode."""
         with patch.dict(os.environ, {"TEST_ENV": "OPTION1"}):
-            env_func = env_with_choices("TEST_ENV",
-                                        "default", ["option1", "option2"],
-                                        case_sensitive=False)
+            env_func = env_with_choices(
+                "TEST_ENV", "default", ["option1", "option2"], case_sensitive=False
+            )
             assert env_func() == "OPTION1"
 
     def test_invalid_value_raises_error_case_sensitive(self):
         """Test that invalid value raises ValueError in case sensitive mode."""
         with patch.dict(os.environ, {"TEST_ENV": "invalid"}):
-            env_func = env_with_choices("TEST_ENV",
-                                        "default", ["option1", "option2"],
-                                        case_sensitive=True)
-            with pytest.raises(ValueError,
-                               match="Invalid value 'invalid' for TEST_ENV"):
+            env_func = env_with_choices(
+                "TEST_ENV", "default", ["option1", "option2"], case_sensitive=True
+            )
+            with pytest.raises(
+                ValueError, match="Invalid value 'invalid' for TEST_ENV"
+            ):
                 env_func()
 
     def test_case_mismatch_raises_error_case_sensitive(self):
         """Test that case mismatch raises ValueError in case sensitive mode."""
         with patch.dict(os.environ, {"TEST_ENV": "OPTION1"}):
-            env_func = env_with_choices("TEST_ENV",
-                                        "default", ["option1", "option2"],
-                                        case_sensitive=True)
-            with pytest.raises(ValueError,
-                               match="Invalid value 'OPTION1' for TEST_ENV"):
+            env_func = env_with_choices(
+                "TEST_ENV", "default", ["option1", "option2"], case_sensitive=True
+            )
+            with pytest.raises(
+                ValueError, match="Invalid value 'OPTION1' for TEST_ENV"
+            ):
                 env_func()
 
     def test_invalid_value_raises_error_case_insensitive(self):
         """Test that invalid value raises ValueError when case insensitive."""
         with patch.dict(os.environ, {"TEST_ENV": "invalid"}):
-            env_func = env_with_choices("TEST_ENV",
-                                        "default", ["option1", "option2"],
-                                        case_sensitive=False)
-            with pytest.raises(ValueError,
-                               match="Invalid value 'invalid' for TEST_ENV"):
+            env_func = env_with_choices(
+                "TEST_ENV", "default", ["option1", "option2"], case_sensitive=False
+            )
+            with pytest.raises(
+                ValueError, match="Invalid value 'invalid' for TEST_ENV"
+            ):
                 env_func()
 
     def test_callable_choices_resolved_correctly(self):
@@ -96,8 +99,9 @@ def get_choices():
 
         with patch.dict(os.environ, {"TEST_ENV": "invalid"}):
             env_func = env_with_choices("TEST_ENV", "default", get_choices)
-            with pytest.raises(ValueError,
-                               match="Invalid value 'invalid' for TEST_ENV"):
+            with pytest.raises(
+                ValueError, match="Invalid value 'invalid' for TEST_ENV"
+            ):
                 env_func()
 
 
@@ -106,84 +110,78 @@ class TestEnvListWithChoices:
 
     def test_default_list_returned_when_env_not_set(self):
         """Test that default list is returned when env var is not set."""
-        env_func = env_list_with_choices("NONEXISTENT_ENV",
-                                         ["default1", "default2"],
-                                         ["option1", "option2"])
+        env_func = env_list_with_choices(
+            "NONEXISTENT_ENV", ["default1", "default2"], ["option1", "option2"]
+        )
         assert env_func() == ["default1", "default2"]
 
     def test_empty_default_list_returned_when_env_not_set(self):
         """Test that empty default list is returned when env not set."""
-        env_func = env_list_with_choices("NONEXISTENT_ENV", [],
-                                         ["option1", "option2"])
+        env_func = env_list_with_choices("NONEXISTENT_ENV", [], ["option1", "option2"])
         assert env_func() == []
 
     def test_single_valid_value_parsed_correctly(self):
         """Test that single valid value is parsed correctly."""
         with patch.dict(os.environ, {"TEST_ENV": "option1"}):
-            env_func = env_list_with_choices("TEST_ENV", [],
-                                             ["option1", "option2"])
+            env_func = env_list_with_choices("TEST_ENV", [], ["option1", "option2"])
             assert env_func() == ["option1"]
 
     def test_multiple_valid_values_parsed_correctly(self):
         """Test that multiple valid values are parsed correctly."""
         with patch.dict(os.environ, {"TEST_ENV": "option1,option2"}):
-            env_func = env_list_with_choices("TEST_ENV", [],
-                                             ["option1", "option2"])
+            env_func = env_list_with_choices("TEST_ENV", [], ["option1", "option2"])
             assert env_func() == ["option1", "option2"]
 
     def test_values_with_whitespace_trimmed(self):
         """Test that values with whitespace are trimmed correctly."""
         with patch.dict(os.environ, {"TEST_ENV": " option1 , option2 "}):
-            env_func = env_list_with_choices("TEST_ENV", [],
-                                             ["option1", "option2"])
+            env_func = env_list_with_choices("TEST_ENV", [], ["option1", "option2"])
             assert env_func() == ["option1", "option2"]
 
     def test_empty_values_filtered_out(self):
         """Test that empty values are filtered out."""
         with patch.dict(os.environ, {"TEST_ENV": "option1,,option2,"}):
-            env_func = env_list_with_choices("TEST_ENV", [],
-                                             ["option1", "option2"])
+            env_func = env_list_with_choices("TEST_ENV", [], ["option1", "option2"])
             assert env_func() == ["option1", "option2"]
 
     def test_empty_string_returns_default(self):
         """Test that empty string returns default."""
         with patch.dict(os.environ, {"TEST_ENV": ""}):
-            env_func = env_list_with_choices("TEST_ENV", ["default"],
-                                             ["option1", "option2"])
+            env_func = env_list_with_choices(
+                "TEST_ENV", ["default"], ["option1", "option2"]
+            )
             assert env_func() == ["default"]
 
     def test_only_commas_returns_default(self):
         """Test that string with only commas returns default."""
         with patch.dict(os.environ, {"TEST_ENV": ",,,"}):
-            env_func = env_list_with_choices("TEST_ENV", ["default"],
-                                             ["option1", "option2"])
+            env_func = env_list_with_choices(
+                "TEST_ENV", ["default"], ["option1", "option2"]
+            )
             assert env_func() == ["default"]
 
     def test_case_sensitive_validation(self):
         """Test case sensitive validation."""
         with patch.dict(os.environ, {"TEST_ENV": "option1,OPTION2"}):
-            env_func = env_list_with_choices("TEST_ENV", [],
-                                             ["option1", "option2"],
-                                             case_sensitive=True)
-            with pytest.raises(ValueError,
-                               match="Invalid value 'OPTION2' in TEST_ENV"):
+            env_func = env_list_with_choices(
+                "TEST_ENV", [], ["option1", "option2"], case_sensitive=True
+            )
+            with pytest.raises(ValueError, match="Invalid value 'OPTION2' in TEST_ENV"):
                 env_func()
 
     def test_case_insensitive_validation(self):
         """Test case insensitive validation."""
         with patch.dict(os.environ, {"TEST_ENV": "OPTION1,option2"}):
-            env_func = env_list_with_choices("TEST_ENV", [],
-                                             ["option1", "option2"],
-                                             case_sensitive=False)
+            env_func = env_list_with_choices(
+                "TEST_ENV", [], ["option1", "option2"], case_sensitive=False
+            )
             assert env_func() == ["OPTION1", "option2"]
 
     def test_invalid_value_in_list_raises_error(self):
         """Test that invalid value in list raises ValueError."""
         with patch.dict(os.environ, {"TEST_ENV": "option1,invalid,option2"}):
-            env_func = env_list_with_choices("TEST_ENV", [],
-                                             ["option1", "option2"])
-            with pytest.raises(ValueError,
-                               match="Invalid value 'invalid' in TEST_ENV"):
+            env_func = env_list_with_choices("TEST_ENV", [], ["option1", "option2"])
+            with pytest.raises(ValueError, match="Invalid value 'invalid' in TEST_ENV"):
                 env_func()
 
     def test_callable_choices_resolved_correctly(self):
@@ -204,13 +202,11 @@ def get_choices():
 
         with patch.dict(os.environ, {"TEST_ENV": "dynamic1,invalid"}):
             env_func = env_list_with_choices("TEST_ENV", [], get_choices)
-            with pytest.raises(ValueError,
-                               match="Invalid value 'invalid' in TEST_ENV"):
+            with pytest.raises(ValueError, match="Invalid value 'invalid' in TEST_ENV"):
                 env_func()
 
     def test_duplicate_values_preserved(self):
         """Test that duplicate values in the list are preserved."""
         with patch.dict(os.environ, {"TEST_ENV": "option1,option1,option2"}):
-            env_func = env_list_with_choices("TEST_ENV", [],
-                                             ["option1", "option2"])
+            env_func = env_list_with_choices("TEST_ENV", [], ["option1", "option2"])
             assert env_func() == ["option1", "option1", "option2"]
diff --git a/tests/test_inputs.py b/tests/test_inputs.py
index 02cd10379574..41b9665bd7a9 100644
--- a/tests/test_inputs.py
+++ b/tests/test_inputs.py
@@ -12,11 +12,11 @@
 pytestmark = pytest.mark.cpu_test
 
 STRING_INPUTS = [
-    '',
-    'foo',
-    'foo bar',
-    'foo baz bar',
-    'foo bar qux baz',
+    "",
+    "foo",
+    "foo bar",
+    "foo baz bar",
+    "foo bar qux baz",
 ]
 
 TOKEN_INPUTS = [
@@ -42,22 +42,21 @@ def test_parse_raw_single_batch_empty():
         parse_raw_prompts([[]])
 
 
-@pytest.mark.parametrize('string_input', STRING_INPUTS)
+@pytest.mark.parametrize("string_input", STRING_INPUTS)
 def test_parse_raw_single_batch_string_consistent(string_input: str):
-    assert parse_raw_prompts(string_input) \
-        == parse_raw_prompts([string_input])
+    assert parse_raw_prompts(string_input) == parse_raw_prompts([string_input])
 
 
-@pytest.mark.parametrize('token_input', TOKEN_INPUTS)
+@pytest.mark.parametrize("token_input", TOKEN_INPUTS)
 def test_parse_raw_single_batch_token_consistent(token_input: list[int]):
-    assert parse_raw_prompts(token_input) \
-        == parse_raw_prompts([token_input])
+    assert parse_raw_prompts(token_input) == parse_raw_prompts([token_input])
 
 
-@pytest.mark.parametrize('inputs_slice', INPUTS_SLICES)
+@pytest.mark.parametrize("inputs_slice", INPUTS_SLICES)
 def test_parse_raw_single_batch_string_slice(inputs_slice: slice):
-    assert parse_raw_prompts(STRING_INPUTS)[inputs_slice] \
-        == parse_raw_prompts(STRING_INPUTS[inputs_slice])
+    assert parse_raw_prompts(STRING_INPUTS)[inputs_slice] == parse_raw_prompts(
+        STRING_INPUTS[inputs_slice]
+    )
 
 
 # yapf: disable
diff --git a/tests/test_logger.py b/tests/test_logger.py
index 0bfb449cdf21..ec368d4897b5 100644
--- a/tests/test_logger.py
+++ b/tests/test_logger.py
@@ -16,8 +16,13 @@
 import pytest
 
 from vllm.entrypoints.logger import RequestLogger
-from vllm.logger import (_DATE_FORMAT, _FORMAT, _configure_vllm_root_logger,
-                         enable_trace_function_call, init_logger)
+from vllm.logger import (
+    _DATE_FORMAT,
+    _FORMAT,
+    _configure_vllm_root_logger,
+    enable_trace_function_call,
+    init_logger,
+)
 from vllm.logging_utils import NewLineFormatter
 from vllm.logging_utils.dump_input import prepare_object_to_dump
 
@@ -129,8 +134,7 @@ def test_an_error_is_raised_when_custom_logging_config_is_invalid_json():
     with NamedTemporaryFile(encoding="utf-8", mode="w") as logging_config_file:
         logging_config_file.write("---\nloggers: []\nversion: 1")
         logging_config_file.flush()
-        with patch("vllm.logger.VLLM_LOGGING_CONFIG_PATH",
-                   logging_config_file.name):
+        with patch("vllm.logger.VLLM_LOGGING_CONFIG_PATH", logging_config_file.name):
             with pytest.raises(JSONDecodeError) as ex_info:
                 _configure_vllm_root_logger()
             assert ex_info.type == JSONDecodeError
@@ -138,24 +142,24 @@ def test_an_error_is_raised_when_custom_logging_config_is_invalid_json():
 
 
 @patch("vllm.logger.VLLM_CONFIGURE_LOGGING", 1)
-@pytest.mark.parametrize("unexpected_config", (
-    "Invalid string",
-    [{
-        "version": 1,
-        "loggers": []
-    }],
-    0,
-))
+@pytest.mark.parametrize(
+    "unexpected_config",
+    (
+        "Invalid string",
+        [{"version": 1, "loggers": []}],
+        0,
+    ),
+)
 def test_an_error_is_raised_when_custom_logging_config_is_unexpected_json(
-        unexpected_config: Any):
+    unexpected_config: Any,
+):
     """This test calls _configure_vllm_root_logger again to test custom logging
     config behavior, however it fails before any change in behavior or
     configuration occurs."""
     with NamedTemporaryFile(encoding="utf-8", mode="w") as logging_config_file:
         logging_config_file.write(json.dumps(unexpected_config))
         logging_config_file.flush()
-        with patch("vllm.logger.VLLM_LOGGING_CONFIG_PATH",
-                   logging_config_file.name):
+        with patch("vllm.logger.VLLM_LOGGING_CONFIG_PATH", logging_config_file.name):
             with pytest.raises(ValueError) as ex_info:
                 _configure_vllm_root_logger()
             assert ex_info.type == ValueError  # noqa: E721
@@ -174,14 +178,15 @@ def test_custom_logging_config_is_parsed_and_used_when_provided():
                 "propagate": False,
             }
         },
-        "version": 1
+        "version": 1,
     }
     with NamedTemporaryFile(encoding="utf-8", mode="w") as logging_config_file:
         logging_config_file.write(json.dumps(valid_logging_config))
         logging_config_file.flush()
-        with patch("vllm.logger.VLLM_LOGGING_CONFIG_PATH",
-                   logging_config_file.name), patch(
-                       "vllm.logger.dictConfig") as dict_config_mock:
+        with (
+            patch("vllm.logger.VLLM_LOGGING_CONFIG_PATH", logging_config_file.name),
+            patch("vllm.logger.dictConfig") as dict_config_mock,
+        ):
             _configure_vllm_root_logger()
             dict_config_mock.assert_called_with(valid_logging_config)
 
@@ -197,19 +202,19 @@ def test_custom_logging_config_causes_an_error_if_configure_logging_is_off():
                 "handlers": [],
             }
         },
-        "version": 1
+        "version": 1,
     }
     with NamedTemporaryFile(encoding="utf-8", mode="w") as logging_config_file:
         logging_config_file.write(json.dumps(valid_logging_config))
         logging_config_file.flush()
-        with patch("vllm.logger.VLLM_LOGGING_CONFIG_PATH",
-                   logging_config_file.name):
+        with patch("vllm.logger.VLLM_LOGGING_CONFIG_PATH", logging_config_file.name):
             with pytest.raises(RuntimeError) as ex_info:
                 _configure_vllm_root_logger()
             assert ex_info.type is RuntimeError
             expected_message_snippet = (
                 "VLLM_CONFIGURE_LOGGING evaluated to false, but "
-                "VLLM_LOGGING_CONFIG_PATH was given.")
+                "VLLM_LOGGING_CONFIG_PATH was given."
+            )
             assert expected_message_snippet in str(ex_info)
 
         # Remember! The root logger is assumed to have been configured as
@@ -223,11 +228,11 @@ def test_custom_logging_config_causes_an_error_if_configure_logging_is_off():
 
 
 def test_prepare_object_to_dump():
-    str_obj = 'str'
+    str_obj = "str"
     assert prepare_object_to_dump(str_obj) == "'str'"
 
     list_obj = [1, 2, 3]
-    assert prepare_object_to_dump(list_obj) == '[1, 2, 3]'
+    assert prepare_object_to_dump(list_obj) == "[1, 2, 3]"
 
     dict_obj = {"a": 1, "b": "b"}
     assert prepare_object_to_dump(dict_obj) in [
@@ -236,9 +241,9 @@ def test_prepare_object_to_dump():
     ]
 
     set_obj = {1, 2, 3}
-    assert prepare_object_to_dump(set_obj) == '[1, 2, 3]'
+    assert prepare_object_to_dump(set_obj) == "[1, 2, 3]"
 
-    tuple_obj = ('a', 'b', 'c')
+    tuple_obj = ("a", "b", "c")
     assert prepare_object_to_dump(tuple_obj) == "['a', 'b', 'c']"
 
     class CustomEnum(enum.Enum):
@@ -253,8 +258,7 @@ class CustomClass:
         a: int
         b: str
 
-    assert (prepare_object_to_dump(CustomClass(
-        1, "b")) == "CustomClass(a=1, b='b')")
+    assert prepare_object_to_dump(CustomClass(1, "b")) == "CustomClass(a=1, b='b')"
 
 
 def test_request_logger_log_outputs():
@@ -467,7 +471,7 @@ def test_request_logger_log_outputs_integration():
 
 def test_streaming_complete_logs_full_text_content():
     """Test that streaming complete logging includes
-      full accumulated text, not just token count."""
+    full accumulated text, not just token count."""
     mock_logger = MagicMock()
 
     with patch("vllm.entrypoints.logger.logger", mock_logger):
diff --git a/tests/test_outputs.py b/tests/test_outputs.py
index 46da83a428e5..7b234884c569 100644
--- a/tests/test_outputs.py
+++ b/tests/test_outputs.py
@@ -9,11 +9,13 @@
 
 
 def test_request_output_forward_compatible():
-    output = RequestOutput(request_id="test_request_id",
-                           prompt="test prompt",
-                           prompt_token_ids=[1, 2, 3],
-                           prompt_logprobs=None,
-                           outputs=[],
-                           finished=False,
-                           example_arg_added_in_new_version="some_value")
+    output = RequestOutput(
+        request_id="test_request_id",
+        prompt="test prompt",
+        prompt_token_ids=[1, 2, 3],
+        prompt_logprobs=None,
+        outputs=[],
+        finished=False,
+        example_arg_added_in_new_version="some_value",
+    )
     assert output is not None
diff --git a/tests/test_pooling_params.py b/tests/test_pooling_params.py
index 52c03015483c..e3561ac3a577 100644
--- a/tests/test_pooling_params.py
+++ b/tests/test_pooling_params.py
@@ -8,9 +8,11 @@
 
 EMBEDDING_MODELS = [
     EmbedModelInfo("intfloat/multilingual-e5-small", is_matryoshka=False),
-    EmbedModelInfo("Snowflake/snowflake-arctic-embed-m-v1.5",
-                   is_matryoshka=True,
-                   matryoshka_dimensions=[256]),
+    EmbedModelInfo(
+        "Snowflake/snowflake-arctic-embed-m-v1.5",
+        is_matryoshka=True,
+        matryoshka_dimensions=[256],
+    ),
 ]
 
 
@@ -65,8 +67,7 @@ def test_embed_dimensions(model_info: EmbedModelInfo):
 
     if model_info.is_matryoshka:
         assert model_info.matryoshka_dimensions is not None
-        pooling_params = PoolingParams(
-            dimensions=model_info.matryoshka_dimensions[0])
+        pooling_params = PoolingParams(dimensions=model_info.matryoshka_dimensions[0])
         pooling_params.verify(task=task, model_config=model_config)
 
 
diff --git a/tests/test_regression.py b/tests/test_regression.py
index f5f1ed8e805e..8a9829e4dba5 100644
--- a/tests/test_regression.py
+++ b/tests/test_regression.py
@@ -6,6 +6,7 @@
 will never happen again.
 
 """
+
 import gc
 
 import pytest
@@ -18,12 +19,12 @@
 def test_duplicated_ignored_sequence_group():
     """https://github.com/vllm-project/vllm/issues/1655"""
 
-    sampling_params = SamplingParams(temperature=0.01,
-                                     top_p=0.1,
-                                     max_tokens=256)
-    llm = LLM(model="distilbert/distilgpt2",
-              max_num_batched_tokens=4096,
-              tensor_parallel_size=1)
+    sampling_params = SamplingParams(temperature=0.01, top_p=0.1, max_tokens=256)
+    llm = LLM(
+        model="distilbert/distilgpt2",
+        max_num_batched_tokens=4096,
+        tensor_parallel_size=1,
+    )
     prompts = ["This is a short prompt", "This is a very long prompt " * 1000]
     outputs = llm.generate(prompts, sampling_params=sampling_params)
 
@@ -31,12 +32,12 @@ def test_duplicated_ignored_sequence_group():
 
 
 def test_max_tokens_none():
-    sampling_params = SamplingParams(temperature=0.01,
-                                     top_p=0.1,
-                                     max_tokens=None)
-    llm = LLM(model="distilbert/distilgpt2",
-              max_num_batched_tokens=4096,
-              tensor_parallel_size=1)
+    sampling_params = SamplingParams(temperature=0.01, top_p=0.1, max_tokens=None)
+    llm = LLM(
+        model="distilbert/distilgpt2",
+        max_num_batched_tokens=4096,
+        tensor_parallel_size=1,
+    )
     prompts = ["Just say hello!"]
     outputs = llm.generate(prompts, sampling_params=sampling_params)
 
diff --git a/tests/test_routing_simulator.py b/tests/test_routing_simulator.py
index 77501f4bddc2..5a162fa8f791 100644
--- a/tests/test_routing_simulator.py
+++ b/tests/test_routing_simulator.py
@@ -13,7 +13,9 @@
 import torch
 
 from vllm.model_executor.layers.fused_moe.routing_simulator import (
-    DistributionBasedRouting, RoutingSimulator)
+    DistributionBasedRouting,
+    RoutingSimulator,
+)
 
 
 @pytest.fixture
@@ -60,10 +62,10 @@ def test_basic_functionality(
         ), f"Wrong ids shape for {strategy}"
 
         # Check that expert IDs are valid
-        assert (topk_ids.min()
-                >= 0), f"Invalid expert ID (negative) for {strategy}"
-        assert (topk_ids.max()
-                < num_experts), f"Invalid expert ID (too large) for {strategy}"
+        assert topk_ids.min() >= 0, f"Invalid expert ID (negative) for {strategy}"
+        assert topk_ids.max() < num_experts, (
+            f"Invalid expert ID (too large) for {strategy}"
+        )
 
 
 def test_routing_strategy_integration(monkeypatch, device):
@@ -102,19 +104,20 @@ def test_routing_strategy_integration(monkeypatch, device):
             top_k=top_k,
             use_grouped_topk=False,
             renormalize=True,
-            indices_type=torch.long)
+            indices_type=torch.long,
+        )
 
         # Verify output shapes
-        assert topk_weights.shape == (
-            num_tokens, top_k), f"Wrong weights shape for {strategy}"
-        assert topk_ids.shape == (num_tokens,
-                                  top_k), f"Wrong ids shape for {strategy}"
+        assert topk_weights.shape == (num_tokens, top_k), (
+            f"Wrong weights shape for {strategy}"
+        )
+        assert topk_ids.shape == (num_tokens, top_k), f"Wrong ids shape for {strategy}"
 
         # Verify expert IDs are valid
-        assert topk_ids.min(
-        ) >= 0, f"Invalid expert ID (negative) for {strategy}"
-        assert topk_ids.max(
-        ) < num_experts, f"Invalid expert ID (too large) for {strategy}"
+        assert topk_ids.min() >= 0, f"Invalid expert ID (negative) for {strategy}"
+        assert topk_ids.max() < num_experts, (
+            f"Invalid expert ID (too large) for {strategy}"
+        )
 
 
 def test_distribution_based_routing_with_custom_strategy():
@@ -123,9 +126,7 @@ def test_distribution_based_routing_with_custom_strategy():
     device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 
     # Register custom distribution-based strategy
-    custom_strategy = DistributionBasedRouting(distribution="normal",
-                                               mean=2.0,
-                                               std=0.5)
+    custom_strategy = DistributionBasedRouting(distribution="normal", mean=2.0, std=0.5)
     RoutingSimulator.register_strategy("custom_normal", custom_strategy)
 
     # Test data
@@ -142,7 +143,8 @@ def test_distribution_based_routing_with_custom_strategy():
         hidden_states=hidden_states,
         router_logits=router_logits,
         strategy_name="custom_normal",
-        top_k=top_k)
+        top_k=top_k,
+    )
 
     # Check output shapes
     assert topk_weights.shape == (num_tokens, top_k)
@@ -165,7 +167,8 @@ def test_instance_compatibility():
         hidden_states=hidden_states,
         router_logits=router_logits,
         strategy_name="uniform_random",
-        top_k=2)
+        top_k=2,
+    )
 
     assert topk_weights.shape == (10, 2)
     assert topk_ids.shape == (10, 2)
diff --git a/tests/test_scalartype.py b/tests/test_scalartype.py
index ef4aef3afc2e..5361efbbdf6f 100644
--- a/tests/test_scalartype.py
+++ b/tests/test_scalartype.py
@@ -7,21 +7,24 @@
 from vllm.scalar_type import scalar_types
 
 
-@pytest.mark.parametrize("type_tuple", (
-    (-8, 7, scalar_types.int4),
-    (0, 15, scalar_types.uint4),
-    (-8, 7, scalar_types.uint4b8),
-    (-128, 127, scalar_types.uint8b128),
-    (-6., 6., scalar_types.float4_e2m1f),
-    (-28., 28., scalar_types.float6_e3m2f),
-    (torch.int8, scalar_types.int8),
-    (torch.uint8, scalar_types.uint8),
-    (torch.float8_e5m2, scalar_types.float8_e5m2),
-    (torch.float8_e4m3fn, scalar_types.float8_e4m3fn),
-    (torch.bfloat16, scalar_types.float16_e8m7),
-    (torch.float16, scalar_types.float16_e5m10),
-),
-                         ids=lambda x: str(x))
+@pytest.mark.parametrize(
+    "type_tuple",
+    (
+        (-8, 7, scalar_types.int4),
+        (0, 15, scalar_types.uint4),
+        (-8, 7, scalar_types.uint4b8),
+        (-128, 127, scalar_types.uint8b128),
+        (-6.0, 6.0, scalar_types.float4_e2m1f),
+        (-28.0, 28.0, scalar_types.float6_e3m2f),
+        (torch.int8, scalar_types.int8),
+        (torch.uint8, scalar_types.uint8),
+        (torch.float8_e5m2, scalar_types.float8_e5m2),
+        (torch.float8_e4m3fn, scalar_types.float8_e4m3fn),
+        (torch.bfloat16, scalar_types.float16_e8m7),
+        (torch.float16, scalar_types.float16_e5m10),
+    ),
+    ids=lambda x: str(x),
+)
 def test_scalar_type_min_max(type_tuple):
     print(type_tuple)
     if len(type_tuple) == 3:
diff --git a/tests/test_seed_behavior.py b/tests/test_seed_behavior.py
index e9138b9e8eb6..adc8a1a4bf08 100644
--- a/tests/test_seed_behavior.py
+++ b/tests/test_seed_behavior.py
@@ -1,25 +1,25 @@
 # SPDX-License-Identifier: Apache-2.0
-# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-import random
-
-import numpy as np
-import torch
-
-from vllm.platforms.interface import Platform
-
-
-def test_seed_behavior():
-    # Test with a specific seed
-    Platform.seed_everything(42)
-    random_value_1 = random.randint(0, 100)
-    np_random_value_1 = np.random.randint(0, 100)
-    torch_random_value_1 = torch.randint(0, 100, (1, )).item()
-
-    Platform.seed_everything(42)
-    random_value_2 = random.randint(0, 100)
-    np_random_value_2 = np.random.randint(0, 100)
-    torch_random_value_2 = torch.randint(0, 100, (1, )).item()
-
-    assert random_value_1 == random_value_2
-    assert np_random_value_1 == np_random_value_2
-    assert torch_random_value_1 == torch_random_value_2
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import random
+
+import numpy as np
+import torch
+
+from vllm.platforms.interface import Platform
+
+
+def test_seed_behavior():
+    # Test with a specific seed
+    Platform.seed_everything(42)
+    random_value_1 = random.randint(0, 100)
+    np_random_value_1 = np.random.randint(0, 100)
+    torch_random_value_1 = torch.randint(0, 100, (1,)).item()
+
+    Platform.seed_everything(42)
+    random_value_2 = random.randint(0, 100)
+    np_random_value_2 = np.random.randint(0, 100)
+    torch_random_value_2 = torch.randint(0, 100, (1,)).item()
+
+    assert random_value_1 == random_value_2
+    assert np_random_value_1 == np_random_value_2
+    assert torch_random_value_1 == torch_random_value_2
diff --git a/tests/test_sequence.py b/tests/test_sequence.py
index da9826ff0505..27af05bec22d 100644
--- a/tests/test_sequence.py
+++ b/tests/test_sequence.py
@@ -7,7 +7,6 @@
 
 
 def test_sequence_intermediate_tensors_equal():
-
     class AnotherIntermediateTensors(IntermediateTensors):
         pass
 
@@ -20,22 +19,31 @@ class AnotherIntermediateTensors(IntermediateTensors):
     assert empty_intermediate_tensors_1 == empty_intermediate_tensors_2
 
     different_key_intermediate_tensors_1 = IntermediateTensors(
-        {"1": torch.zeros([2, 4], dtype=torch.int32)})
+        {"1": torch.zeros([2, 4], dtype=torch.int32)}
+    )
     difference_key_intermediate_tensors_2 = IntermediateTensors(
-        {"2": torch.zeros([2, 4], dtype=torch.int32)})
-    assert (different_key_intermediate_tensors_1
-            != difference_key_intermediate_tensors_2)
+        {"2": torch.zeros([2, 4], dtype=torch.int32)}
+    )
+    assert different_key_intermediate_tensors_1 != difference_key_intermediate_tensors_2
 
     same_key_different_value_intermediate_tensors_1 = IntermediateTensors(
-        {"1": torch.zeros([2, 4], dtype=torch.int32)})
+        {"1": torch.zeros([2, 4], dtype=torch.int32)}
+    )
     same_key_different_value_intermediate_tensors_2 = IntermediateTensors(
-        {"1": torch.zeros([2, 5], dtype=torch.int32)})
-    assert (same_key_different_value_intermediate_tensors_1
-            != same_key_different_value_intermediate_tensors_2)
+        {"1": torch.zeros([2, 5], dtype=torch.int32)}
+    )
+    assert (
+        same_key_different_value_intermediate_tensors_1
+        != same_key_different_value_intermediate_tensors_2
+    )
 
     same_key_same_value_intermediate_tensors_1 = IntermediateTensors(
-        {"1": torch.zeros([2, 4], dtype=torch.int32)})
+        {"1": torch.zeros([2, 4], dtype=torch.int32)}
+    )
     same_key_same_value_intermediate_tensors_2 = IntermediateTensors(
-        {"1": torch.zeros([2, 4], dtype=torch.int32)})
-    assert (same_key_same_value_intermediate_tensors_1 ==
-            same_key_same_value_intermediate_tensors_2)
+        {"1": torch.zeros([2, 4], dtype=torch.int32)}
+    )
+    assert (
+        same_key_same_value_intermediate_tensors_1
+        == same_key_same_value_intermediate_tensors_2
+    )
diff --git a/tests/test_triton_utils.py b/tests/test_triton_utils.py
index ebb69e627e95..7fe0a5d9c517 100644
--- a/tests/test_triton_utils.py
+++ b/tests/test_triton_utils.py
@@ -5,8 +5,7 @@
 import types
 from unittest import mock
 
-from vllm.triton_utils.importing import (TritonLanguagePlaceholder,
-                                         TritonPlaceholder)
+from vllm.triton_utils.importing import TritonLanguagePlaceholder, TritonPlaceholder
 
 
 def test_triton_placeholder_is_module():
@@ -52,8 +51,7 @@ def foo(x):
     def bar(x):
         return x
 
-    @triton.heuristics(
-        {"BLOCK_SIZE": lambda args: 128 if args["x"] > 1024 else 64})
+    @triton.heuristics({"BLOCK_SIZE": lambda args: 128 if args["x"] > 1024 else 64})
     def baz(x):
         return x
 
@@ -89,6 +87,7 @@ def test_no_triton_fallback():
     # mock triton not being installed
     with mock.patch.dict(sys.modules, {"triton": None}):
         from vllm.triton_utils import HAS_TRITON, tl, triton
+
         assert HAS_TRITON is False
         assert triton.__class__.__name__ == "TritonPlaceholder"
         assert triton.language.__class__.__name__ == "TritonLanguagePlaceholder"
diff --git a/tests/test_version.py b/tests/test_version.py
index fd07abb59b1f..928f742f1de8 100644
--- a/tests/test_version.py
+++ b/tests/test_version.py
@@ -31,7 +31,8 @@ def test_version_tuple():
         ((1, 0, 0), "1.-1", True),
         ((1, 0, 0), "0.9", False),
         ((1, 0, 0), "0.17", False),
-    ])
+    ],
+)
 def test_prev_minor_version_was(version_tuple, version_str, expected):
     with patch("vllm.version.__version_tuple__", version_tuple):
         assert version._prev_minor_version_was(version_str) == expected
diff --git a/tests/test_vllm_port.py b/tests/test_vllm_port.py
index 88e1efd8fdbb..68bd511635dc 100644
--- a/tests/test_vllm_port.py
+++ b/tests/test_vllm_port.py
@@ -23,14 +23,17 @@ def test_get_vllm_port_valid():
 
 def test_get_vllm_port_invalid():
     """Test when VLLM_PORT is set to a non-integer value."""
-    with (patch.dict(os.environ, {"VLLM_PORT": "abc"}, clear=True),
-          pytest.raises(ValueError, match="must be a valid integer")):
+    with (
+        patch.dict(os.environ, {"VLLM_PORT": "abc"}, clear=True),
+        pytest.raises(ValueError, match="must be a valid integer"),
+    ):
         get_vllm_port()
 
 
 def test_get_vllm_port_uri():
     """Test when VLLM_PORT is set to a URI."""
-    with (patch.dict(os.environ, {"VLLM_PORT": "tcp://localhost:5678"},
-                     clear=True),
-          pytest.raises(ValueError, match="appears to be a URI")):
+    with (
+        patch.dict(os.environ, {"VLLM_PORT": "tcp://localhost:5678"}, clear=True),
+        pytest.raises(ValueError, match="appears to be a URI"),
+    ):
         get_vllm_port()
diff --git a/tests/tokenization/test_cached_tokenizer.py b/tests/tokenization/test_cached_tokenizer.py
index 07217611ea4d..074039f9e513 100644
--- a/tests/tokenization/test_cached_tokenizer.py
+++ b/tests/tokenization/test_cached_tokenizer.py
@@ -6,17 +6,16 @@
 import pytest
 from transformers import AutoTokenizer
 
-from vllm.transformers_utils.tokenizer import (AnyTokenizer,
-                                               get_cached_tokenizer)
+from vllm.transformers_utils.tokenizer import AnyTokenizer, get_cached_tokenizer
 
 
 @pytest.mark.parametrize("model_id", ["gpt2", "zai-org/chatglm3-6b"])
 def test_cached_tokenizer(model_id: str):
-    reference_tokenizer = AutoTokenizer.from_pretrained(model_id,
-                                                        trust_remote_code=True)
+    reference_tokenizer = AutoTokenizer.from_pretrained(
+        model_id, trust_remote_code=True
+    )
     reference_tokenizer.add_special_tokens({"cls_token": "<CLS>"})
-    reference_tokenizer.add_special_tokens(
-        {"additional_special_tokens": ["<SEP>"]})
+    reference_tokenizer.add_special_tokens({"additional_special_tokens": ["<SEP>"]})
 
     cached_tokenizer = get_cached_tokenizer(deepcopy(reference_tokenizer))
     _check_consistency(cached_tokenizer, reference_tokenizer)
@@ -32,13 +31,13 @@ def _check_consistency(target: AnyTokenizer, expected: AnyTokenizer):
     # Cached attributes
     assert target.all_special_ids == expected.all_special_ids
     assert target.all_special_tokens == expected.all_special_tokens
-    assert (target.all_special_tokens_extended ==
-            expected.all_special_tokens_extended)
+    assert target.all_special_tokens_extended == expected.all_special_tokens_extended
     assert target.get_vocab() == expected.get_vocab()
     assert len(target) == len(expected)
 
     # Other attributes
-    assert getattr(target, "padding_side",
-                   None) == getattr(expected, "padding_side", None)
+    assert getattr(target, "padding_side", None) == getattr(
+        expected, "padding_side", None
+    )
 
     assert target.encode("prompt") == expected.encode("prompt")
diff --git a/tests/tokenization/test_detokenize.py b/tests/tokenization/test_detokenize.py
index fe6c313d2966..14dcab7707d4 100644
--- a/tests/tokenization/test_detokenize.py
+++ b/tests/tokenization/test_detokenize.py
@@ -5,15 +5,16 @@
 from typing import Any, Optional
 
 import pytest
-from transformers import (AutoTokenizer, PreTrainedTokenizer,
-                          PreTrainedTokenizerFast)
+from transformers import AutoTokenizer, PreTrainedTokenizer, PreTrainedTokenizerFast
 
 from vllm.sampling_params import SamplingParams
 from vllm.transformers_utils.tokenizers.mistral import MistralTokenizer
 from vllm.v1.engine import EngineCoreRequest
-from vllm.v1.engine.detokenizer import (FastIncrementalDetokenizer,
-                                        IncrementalDetokenizer,
-                                        SlowIncrementalDetokenizer)
+from vllm.v1.engine.detokenizer import (
+    FastIncrementalDetokenizer,
+    IncrementalDetokenizer,
+    SlowIncrementalDetokenizer,
+)
 
 SPECIAL_TOKS_TRUTH = [
     "Some text with adjacent special tokens                <|padding|><|padding|><fim_prefix><fim_middle><fim_suffix>other text<fim_pad>",  # noqa
@@ -45,33 +46,35 @@
 ]
 
 
-def _run_incremental_decode(tokenizer,
-                            all_input_ids,
-                            skip_special_tokens: bool,
-                            starting_index: int,
-                            spaces_between_special_tokens: bool = True,
-                            fast: Optional[bool] = None):
-
+def _run_incremental_decode(
+    tokenizer,
+    all_input_ids,
+    skip_special_tokens: bool,
+    starting_index: int,
+    spaces_between_special_tokens: bool = True,
+    fast: Optional[bool] = None,
+):
     prompt_token_ids = all_input_ids[:starting_index]
 
     params = SamplingParams(
         skip_special_tokens=skip_special_tokens,
         spaces_between_special_tokens=spaces_between_special_tokens,
     )
-    request = EngineCoreRequest(request_id="",
-                                prompt_token_ids=prompt_token_ids,
-                                mm_features=None,
-                                sampling_params=params,
-                                pooling_params=None,
-                                eos_token_id=None,
-                                arrival_time=0.0,
-                                lora_request=None,
-                                cache_salt=None,
-                                data_parallel_rank=None)
+    request = EngineCoreRequest(
+        request_id="",
+        prompt_token_ids=prompt_token_ids,
+        mm_features=None,
+        sampling_params=params,
+        pooling_params=None,
+        eos_token_id=None,
+        arrival_time=0.0,
+        lora_request=None,
+        cache_salt=None,
+        data_parallel_rank=None,
+    )
 
     if fast is None:
-        detokenizer = IncrementalDetokenizer.from_new_request(
-            tokenizer, request)
+        detokenizer = IncrementalDetokenizer.from_new_request(tokenizer, request)
     elif fast:
         detokenizer = FastIncrementalDetokenizer(tokenizer, request)
     else:
@@ -88,9 +91,11 @@ def _run_incremental_decode(tokenizer,
 
 @pytest.fixture
 def tokenizer(tokenizer_name):
-    return (MistralTokenizer.from_pretrained(tokenizer_name)
-            if "mistral" in tokenizer_name else
-            AutoTokenizer.from_pretrained(tokenizer_name))
+    return (
+        MistralTokenizer.from_pretrained(tokenizer_name)
+        if "mistral" in tokenizer_name
+        else AutoTokenizer.from_pretrained(tokenizer_name)
+    )
 
 
 @pytest.mark.parametrize("tokenizer_name", ["mistralai/Pixtral-12B-2409"])
@@ -102,7 +107,8 @@ def tokenizer(tokenizer_name):
         "ပုံပြင်လေးပြောပြပါ",
         # Using "URGENCY" since "CY" has token id 130282
         "URGENCY🌶️",
-    ])
+    ],
+)
 def test_mistral_edge_case(tokenizer, truth):
     """Test for a specific edge cases with V3-Tekken MistralTokenizer.
 
@@ -115,7 +121,8 @@ def test_mistral_edge_case(tokenizer, truth):
         tokenizer,
         all_input_ids,
         skip_special_tokens=True,
-        starting_index=starting_index)
+        starting_index=starting_index,
+    )
     assert decoded_text == truth
     assert out_ids == all_input_ids[starting_index:]
 
@@ -124,8 +131,10 @@ def test_mistral_edge_case(tokenizer, truth):
 def skip_special_tokens(request, tokenizer_name) -> Generator[bool, Any, None]:
     if "mistral" in tokenizer_name:
         yield (
-            True if request.param else
-            pytest.skip("mistral doesn't support skip_special_tokens=False"))
+            True
+            if request.param
+            else pytest.skip("mistral doesn't support skip_special_tokens=False")
+        )
     else:
         yield bool(request.param)
 
@@ -136,8 +145,14 @@ def skip_special_tokens(request, tokenizer_name) -> Generator[bool, Any, None]:
 @pytest.mark.parametrize("skip_special_tokens", (True, False), indirect=True)
 @pytest.mark.parametrize("spaces_between_special_tokens", (True, False))
 @pytest.mark.parametrize("fast", (True, False))
-def test_decode_streaming(tokenizer, truth, with_prompt, skip_special_tokens,
-                          spaces_between_special_tokens, fast):
+def test_decode_streaming(
+    tokenizer,
+    truth,
+    with_prompt,
+    skip_special_tokens,
+    spaces_between_special_tokens,
+    fast,
+):
     if fast and not isinstance(tokenizer, PreTrainedTokenizerFast):
         pytest.skip()
 
@@ -146,30 +161,35 @@ def test_decode_streaming(tokenizer, truth, with_prompt, skip_special_tokens,
 
     if not fast and isinstance(tokenizer, PreTrainedTokenizerFast):
         # Fix up inconsistency in fast/slow tokenizer behaviour.
-        tokenizer.add_special_tokens({
-            "additional_special_tokens": [
-                at for at in
-                tokenizer._tokenizer.get_added_tokens_decoder().values()
-                if at.special
-            ]
-        })
-
-    extra_decode_args = {} if not isinstance(tokenizer,  PreTrainedTokenizer) \
+        tokenizer.add_special_tokens(
+            {
+                "additional_special_tokens": [
+                    at
+                    for at in tokenizer._tokenizer.get_added_tokens_decoder().values()
+                    if at.special
+                ]
+            }
+        )
+
+    extra_decode_args = (
+        {}
+        if not isinstance(tokenizer, PreTrainedTokenizer)
         else {"spaces_between_special_tokens": spaces_between_special_tokens}
+    )
 
     truth_tokens = tokenizer(truth, add_special_tokens=False).input_ids
     if tokenizer.bos_token_id is not None:
         truth_tokens.insert(0, tokenizer.bos_token_id)
     truth_tokens.append(tokenizer.eos_token_id)
 
-    new_truth = tokenizer.decode(truth_tokens,
-                                 skip_special_tokens=skip_special_tokens,
-                                 **extra_decode_args)
+    new_truth = tokenizer.decode(
+        truth_tokens, skip_special_tokens=skip_special_tokens, **extra_decode_args
+    )
 
     if with_prompt:
         num_prompt_tokens = len(
-            tokenizer(truth[:len(truth) // 2],
-                      add_special_tokens=False).input_ids)
+            tokenizer(truth[: len(truth) // 2], add_special_tokens=False).input_ids
+        )
         if tokenizer.bos_token_id is not None:
             num_prompt_tokens += 1
 
@@ -177,11 +197,13 @@ def test_decode_streaming(tokenizer, truth, with_prompt, skip_special_tokens,
         generated_input_ids = truth_tokens[num_prompt_tokens:]
         all_input_ids = prompt_input_ids + generated_input_ids
         starting_index = len(prompt_input_ids)
-        prompt = tokenizer.decode(prompt_input_ids,
-                                  skip_special_tokens=skip_special_tokens,
-                                  **extra_decode_args)
+        prompt = tokenizer.decode(
+            prompt_input_ids,
+            skip_special_tokens=skip_special_tokens,
+            **extra_decode_args,
+        )
 
-        generated = new_truth[len(prompt):]
+        generated = new_truth[len(prompt) :]
     else:
         generated = new_truth
         starting_index = 0
@@ -193,7 +215,8 @@ def test_decode_streaming(tokenizer, truth, with_prompt, skip_special_tokens,
         skip_special_tokens=skip_special_tokens,
         starting_index=starting_index,
         spaces_between_special_tokens=spaces_between_special_tokens,
-        fast=fast)
+        fast=fast,
+    )
 
     assert decoded_text == generated
     assert out_ids == all_input_ids[starting_index:]
@@ -206,11 +229,13 @@ def test_oov_decode(tokenizer, fast):
         pytest.skip()
 
     decoded_text, out_ids = _run_incremental_decode(
-        tokenizer, [len(tokenizer)],
+        tokenizer,
+        [len(tokenizer)],
         skip_special_tokens=True,
         starting_index=0,
         spaces_between_special_tokens=True,
-        fast=fast)
+        fast=fast,
+    )
 
-    assert decoded_text == ''
+    assert decoded_text == ""
     assert out_ids == [len(tokenizer)]
diff --git a/tests/tokenization/test_do_lower_case.py b/tests/tokenization/test_do_lower_case.py
index 7aa655e1c3b4..8aff50b351e3 100644
--- a/tests/tokenization/test_do_lower_case.py
+++ b/tests/tokenization/test_do_lower_case.py
@@ -13,6 +13,6 @@
 def test_special_tokens(tokenizer_name: str, n_tokens: int):
     tokenizer = get_tokenizer(tokenizer_name, revision="main")
 
-    prompts = '[UNK]' * n_tokens
+    prompts = "[UNK]" * n_tokens
     prompt_token_ids = tokenizer.encode(prompts)
     assert len(prompt_token_ids) == n_tokens + 2
diff --git a/tests/tokenization/test_get_eos.py b/tests/tokenization/test_get_eos.py
index d8288429351c..921d77b1b335 100644
--- a/tests/tokenization/test_get_eos.py
+++ b/tests/tokenization/test_get_eos.py
@@ -5,6 +5,7 @@
 only get the `eos_token_id` from the tokenizer as defined by
 {meth}`vllm.LLMEngine._get_eos_token_id`.
 """
+
 from vllm.transformers_utils.config import try_get_generation_config
 from vllm.transformers_utils.tokenizer import get_tokenizer
 
@@ -15,8 +16,7 @@ def test_get_llama3_eos_token():
     tokenizer = get_tokenizer(model_name)
     assert tokenizer.eos_token_id == 128009
 
-    generation_config = try_get_generation_config(model_name,
-                                                  trust_remote_code=False)
+    generation_config = try_get_generation_config(model_name, trust_remote_code=False)
     assert generation_config is not None
     assert generation_config.eos_token_id == [128001, 128008, 128009]
 
@@ -27,7 +27,6 @@ def test_get_blip2_eos_token():
     tokenizer = get_tokenizer(model_name)
     assert tokenizer.eos_token_id == 2
 
-    generation_config = try_get_generation_config(model_name,
-                                                  trust_remote_code=False)
+    generation_config = try_get_generation_config(model_name, trust_remote_code=False)
     assert generation_config is not None
     assert generation_config.eos_token_id == 50118
diff --git a/tests/tokenization/test_mistral_tokenizer.py b/tests/tokenization/test_mistral_tokenizer.py
index 69b3c6294284..a034188387d0 100644
--- a/tests/tokenization/test_mistral_tokenizer.py
+++ b/tests/tokenization/test_mistral_tokenizer.py
@@ -2,187 +2,206 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 import pytest
-from mistral_common.protocol.instruct.messages import (AssistantMessage,
-                                                       ToolMessage,
-                                                       UserMessage)
+from mistral_common.protocol.instruct.messages import (
+    AssistantMessage,
+    ToolMessage,
+    UserMessage,
+)
 from mistral_common.protocol.instruct.request import ChatCompletionRequest
-from mistral_common.protocol.instruct.tool_calls import (Function,
-                                                         FunctionCall, Tool,
-                                                         ToolCall)
+from mistral_common.protocol.instruct.tool_calls import (
+    Function,
+    FunctionCall,
+    Tool,
+    ToolCall,
+)
 
 from vllm.transformers_utils.tokenizers.mistral import (
-    make_mistral_chat_completion_request)
+    make_mistral_chat_completion_request,
+)
 
 
 @pytest.mark.parametrize(
     "openai_request,expected_mistral_request",
-    [(
-        {
-            "messages": [{
-                "role": "user",
-                "content": "What is the current local date and time?",
-            }],
-            "tools": [{
-                "type": "function",
-                "function": {
-                    "description": "Fetch the current local date and time.",
-                    "name": "get_current_time",
-                },
-            }],
-        },
-        ChatCompletionRequest(
-            messages=[
-                UserMessage(content="What is the current local date and time?")
-            ],
-            tools=[
-                Tool(
-                    type="function",
-                    function=Function(
-                        name="get_current_time",
-                        description="Fetch the current local date and time.",
-                        parameters={},
-                    ),
-                )
-            ],
+    [
+        (
+            {
+                "messages": [
+                    {
+                        "role": "user",
+                        "content": "What is the current local date and time?",
+                    }
+                ],
+                "tools": [
+                    {
+                        "type": "function",
+                        "function": {
+                            "description": "Fetch the current local date and time.",
+                            "name": "get_current_time",
+                        },
+                    }
+                ],
+            },
+            ChatCompletionRequest(
+                messages=[
+                    UserMessage(content="What is the current local date and time?")
+                ],
+                tools=[
+                    Tool(
+                        type="function",
+                        function=Function(
+                            name="get_current_time",
+                            description="Fetch the current local date and time.",
+                            parameters={},
+                        ),
+                    )
+                ],
+            ),
         ),
-    ),
-     (
-         {
-             "messages":
-             [{
-                 "role": "user",
-                 "content": "What is the current local date and time?",
-             }],
-             "tools": [{
-                 "type": "function",
-                 "function": {
-                     "description": "Fetch the current local date and time.",
-                     "name": "get_current_time",
-                     "parameters": None,
-                 },
-             }],
-         },
-         ChatCompletionRequest(
-             messages=[
-                 UserMessage(
-                     content="What is the current local date and time?")
-             ],
-             tools=[
-                 Tool(
-                     type="function",
-                     function=Function(
-                         name="get_current_time",
-                         description="Fetch the current local date and time.",
-                         parameters={},
-                     ),
-                 )
-             ],
-         ),
-     )],
+        (
+            {
+                "messages": [
+                    {
+                        "role": "user",
+                        "content": "What is the current local date and time?",
+                    }
+                ],
+                "tools": [
+                    {
+                        "type": "function",
+                        "function": {
+                            "description": "Fetch the current local date and time.",
+                            "name": "get_current_time",
+                            "parameters": None,
+                        },
+                    }
+                ],
+            },
+            ChatCompletionRequest(
+                messages=[
+                    UserMessage(content="What is the current local date and time?")
+                ],
+                tools=[
+                    Tool(
+                        type="function",
+                        function=Function(
+                            name="get_current_time",
+                            description="Fetch the current local date and time.",
+                            parameters={},
+                        ),
+                    )
+                ],
+            ),
+        ),
+    ],
 )
-def test_make_mistral_chat_completion_request(openai_request,
-                                              expected_mistral_request):
+def test_make_mistral_chat_completion_request(openai_request, expected_mistral_request):
     actual_request = make_mistral_chat_completion_request(
-        openai_request["messages"], openai_request["tools"])
+        openai_request["messages"], openai_request["tools"]
+    )
     assert actual_request == expected_mistral_request
 
 
 # Tool use with list content and reasoning_content
-@pytest.mark.parametrize("openai_request,expected_mistral_request", [(
-    {
-        "messages": [
-            {
-                "role": "user",
-                "content": "What's the weather in Paris?",
-            },
+@pytest.mark.parametrize(
+    "openai_request,expected_mistral_request",
+    [
+        (
             {
-                "role":
-                "assistant",
-                "reasoning_content":
-                None,
-                "content":
-                None,
-                "tool_calls": [{
-                    "id": "call123",
-                    "type": "function",
-                    "function": {
-                        "name": "get_weather",
-                        "arguments": '{"city": "Paris"}',
+                "messages": [
+                    {
+                        "role": "user",
+                        "content": "What's the weather in Paris?",
                     },
-                }],
-            },
-            {
-                "role": "tool",
-                "content": [{
-                    "type": "text",
-                    "text": "Rainy"
-                }],
-                "name": "get_weather",
-                "tool_call_id": "call123",
-            },
-        ],
-        "tools": [{
-            "type": "function",
-            "function": {
-                "name": "get_weather",
-                "description": "Gets the current weather in a city.",
-                "parameters": {
-                    "type": "object",
-                    "properties": {
-                        "city": {
-                            "type": "string",
-                            "description": "The city name"
-                        }
+                    {
+                        "role": "assistant",
+                        "reasoning_content": None,
+                        "content": None,
+                        "tool_calls": [
+                            {
+                                "id": "call123",
+                                "type": "function",
+                                "function": {
+                                    "name": "get_weather",
+                                    "arguments": '{"city": "Paris"}',
+                                },
+                            }
+                        ],
+                    },
+                    {
+                        "role": "tool",
+                        "content": [{"type": "text", "text": "Rainy"}],
+                        "name": "get_weather",
+                        "tool_call_id": "call123",
                     },
-                    "required": ["city"],
-                },
+                ],
+                "tools": [
+                    {
+                        "type": "function",
+                        "function": {
+                            "name": "get_weather",
+                            "description": "Gets the current weather in a city.",
+                            "parameters": {
+                                "type": "object",
+                                "properties": {
+                                    "city": {
+                                        "type": "string",
+                                        "description": "The city name",
+                                    }
+                                },
+                                "required": ["city"],
+                            },
+                        },
+                    }
+                ],
             },
-        }],
-    },
-    ChatCompletionRequest(
-        messages=[
-            UserMessage(content="What's the weather in Paris?"),
-            AssistantMessage(
-                content=None,
-                tool_calls=[
-                    ToolCall(
-                        id="call123",
-                        function=FunctionCall(
+            ChatCompletionRequest(
+                messages=[
+                    UserMessage(content="What's the weather in Paris?"),
+                    AssistantMessage(
+                        content=None,
+                        tool_calls=[
+                            ToolCall(
+                                id="call123",
+                                function=FunctionCall(
+                                    name="get_weather",
+                                    arguments='{"city": "Paris"}',
+                                ),
+                            )
+                        ],
+                    ),
+                    ToolMessage(
+                        content="Rainy",
+                        tool_call_id="call123",
+                        name="get_weather",
+                    ),
+                ],
+                tools=[
+                    Tool(
+                        type="function",
+                        function=Function(
                             name="get_weather",
-                            arguments='{"city": "Paris"}',
+                            description="Gets the current weather in a city.",
+                            parameters={
+                                "type": "object",
+                                "properties": {
+                                    "city": {
+                                        "type": "string",
+                                        "description": "The city name",
+                                    }
+                                },
+                                "required": ["city"],
+                            },
                         ),
                     )
                 ],
             ),
-            ToolMessage(
-                content="Rainy",
-                tool_call_id="call123",
-                name="get_weather",
-            ),
-        ],
-        tools=[
-            Tool(
-                type="function",
-                function=Function(
-                    name="get_weather",
-                    description="Gets the current weather in a city.",
-                    parameters={
-                        "type": "object",
-                        "properties": {
-                            "city": {
-                                "type": "string",
-                                "description": "The city name"
-                            }
-                        },
-                        "required": ["city"],
-                    },
-                ),
-            )
-        ],
-    ),
-)])
+        )
+    ],
+)
 def test_make_mistral_chat_completion_request_list_content(
-        openai_request, expected_mistral_request):
+    openai_request, expected_mistral_request
+):
     actual_request = make_mistral_chat_completion_request(
-        openai_request["messages"], openai_request["tools"])
+        openai_request["messages"], openai_request["tools"]
+    )
     assert actual_request == expected_mistral_request
diff --git a/tests/tokenization/test_tokenizer.py b/tests/tokenization/test_tokenizer.py
index 09a3638fd2ed..e86bb03883b5 100644
--- a/tests/tokenization/test_tokenizer.py
+++ b/tests/tokenization/test_tokenizer.py
@@ -19,5 +19,5 @@ def test_tokenizer_revision(tokenizer_name: str):
     assert isinstance(tokenizer, PreTrainedTokenizerBase)
 
     # Assume that "never" branch always does not exist
-    with pytest.raises(OSError, match='not a valid git identifier'):
+    with pytest.raises(OSError, match="not a valid git identifier"):
         get_tokenizer(tokenizer_name, revision="never")
diff --git a/tests/tokenization/test_tokenizer_registry.py b/tests/tokenization/test_tokenizer_registry.py
index 68d4b416b4c9..de67c3e798c4 100644
--- a/tests/tokenization/test_tokenizer_registry.py
+++ b/tests/tokenization/test_tokenizer_registry.py
@@ -4,15 +4,13 @@
 from typing import TYPE_CHECKING, Any, Optional, Union
 
 from vllm.transformers_utils.tokenizer import get_tokenizer
-from vllm.transformers_utils.tokenizer_base import (TokenizerBase,
-                                                    TokenizerRegistry)
+from vllm.transformers_utils.tokenizer_base import TokenizerBase, TokenizerRegistry
 
 if TYPE_CHECKING:
     from vllm.entrypoints.chat_utils import ChatCompletionMessageParam
 
 
 class TestTokenizer(TokenizerBase):
-
     @classmethod
     def from_pretrained(cls, *args, **kwargs) -> "TestTokenizer":
         return TestTokenizer()
@@ -85,23 +83,23 @@ def encode_one(
     ) -> list[int]:
         raise NotImplementedError()
 
-    def encode(self,
-               text: str,
-               add_special_tokens: Optional[bool] = None) -> list[int]:
+    def encode(self, text: str, add_special_tokens: Optional[bool] = None) -> list[int]:
         raise NotImplementedError()
 
-    def apply_chat_template(self,
-                            messages: list["ChatCompletionMessageParam"],
-                            tools: Optional[list[dict[str, Any]]] = None,
-                            **kwargs) -> list[int]:
+    def apply_chat_template(
+        self,
+        messages: list["ChatCompletionMessageParam"],
+        tools: Optional[list[dict[str, Any]]] = None,
+        **kwargs,
+    ) -> list[int]:
         raise NotImplementedError()
 
     def convert_tokens_to_string(self, tokens: list[str]) -> str:
         raise NotImplementedError()
 
-    def decode(self,
-               ids: Union[list[int], int],
-               skip_special_tokens: bool = True) -> str:
+    def decode(
+        self, ids: Union[list[int], int], skip_special_tokens: bool = True
+    ) -> str:
         raise NotImplementedError()
 
     def convert_ids_to_tokens(
@@ -113,9 +111,9 @@ def convert_ids_to_tokens(
 
 
 def test_customized_tokenizer():
-    TokenizerRegistry.register("test_tokenizer",
-                               "tests.tokenization.test_tokenizer_registry",
-                               "TestTokenizer")
+    TokenizerRegistry.register(
+        "test_tokenizer", "tests.tokenization.test_tokenizer_registry", "TestTokenizer"
+    )
 
     tokenizer = TokenizerRegistry.get_tokenizer("test_tokenizer")
     assert isinstance(tokenizer, TestTokenizer)
diff --git a/tests/tool_use/conftest.py b/tests/tool_use/conftest.py
index 510b54790cd9..ff9cdeeb7375 100644
--- a/tests/tool_use/conftest.py
+++ b/tests/tool_use/conftest.py
@@ -13,13 +13,13 @@
 
 # select models to test based on command line arguments
 def pytest_addoption(parser):
-    parser.addoption("--models",
-                     nargs="+",
-                     help="Specify one or more models to test")
-    parser.addoption("--extended",
-                     action="store_true",
-                     default=False,
-                     help="invoke extended tests requiring large GPUs")
+    parser.addoption("--models", nargs="+", help="Specify one or more models to test")
+    parser.addoption(
+        "--extended",
+        action="store_true",
+        default=False,
+        help="invoke extended tests requiring large GPUs",
+    )
 
 
 # for each server config, download the model and return the config
@@ -29,8 +29,10 @@ def server_config(request):
     models = request.config.getoption("--models")
 
     config_keys_to_test = [
-        key for key in CONFIGS if (models is None or key in models) and (
-            extended or not CONFIGS[key].get("extended", False))
+        key
+        for key in CONFIGS
+        if (models is None or key in models)
+        and (extended or not CONFIGS[key].get("extended", False))
     ]
 
     config_key = request.param
@@ -40,8 +42,9 @@ def server_config(request):
     config = CONFIGS[config_key]
 
     if current_platform.is_rocm() and not config.get("supports_rocm", True):
-        pytest.skip("The {} model can't be tested on the ROCm platform".format(
-            config["model"]))
+        pytest.skip(
+            "The {} model can't be tested on the ROCm platform".format(config["model"])
+        )
 
     # download model and tokenizer using transformers
     snapshot_download(config["model"])
@@ -53,8 +56,9 @@ def server_config(request):
 def server(request, server_config: ServerConfig):
     model = server_config["model"]
     args_for_model = server_config["arguments"]
-    with RemoteOpenAIServer(model, ARGS + args_for_model,
-                            max_wait_seconds=480) as server:
+    with RemoteOpenAIServer(
+        model, ARGS + args_for_model, max_wait_seconds=480
+    ) as server:
         yield server
 
 
diff --git a/tests/tool_use/mistral/conftest.py b/tests/tool_use/mistral/conftest.py
index e9dddccdc8c0..9b0a6eb27fca 100644
--- a/tests/tool_use/mistral/conftest.py
+++ b/tests/tool_use/mistral/conftest.py
@@ -17,8 +17,9 @@ def server_config(request):
     config = CONFIGS[request.param]
 
     if current_platform.is_rocm() and not config.get("supports_rocm", True):
-        pytest.skip("The {} model can't be tested on the ROCm platform".format(
-            config["model"]))
+        pytest.skip(
+            "The {} model can't be tested on the ROCm platform".format(config["model"])
+        )
 
     # download model and tokenizer using transformers
     snapshot_download(config["model"])
@@ -30,8 +31,9 @@ def server_config(request):
 def server(request, server_config: ServerConfig):
     model = server_config["model"]
     args_for_model = server_config["arguments"]
-    with RemoteOpenAIServer(model, ARGS + args_for_model,
-                            max_wait_seconds=480) as server:
+    with RemoteOpenAIServer(
+        model, ARGS + args_for_model, max_wait_seconds=480
+    ) as server:
         yield server
 
 
diff --git a/tests/tool_use/mistral/test_mistral_tool_calls.py b/tests/tool_use/mistral/test_mistral_tool_calls.py
index 9bf6863f3f2b..3c4a543abe41 100644
--- a/tests/tool_use/mistral/test_mistral_tool_calls.py
+++ b/tests/tool_use/mistral/test_mistral_tool_calls.py
@@ -19,12 +19,12 @@ async def test_tool_call_with_tool_choice(client: openai.AsyncOpenAI):
         model=model_name,
         tools=[WEATHER_TOOL],
         tool_choice=WEATHER_TOOL,
-        logprobs=False)
+        logprobs=False,
+    )
 
     choice = chat_completion.choices[0]
 
     assert choice.finish_reason != "tool_calls"  # "stop" or "length"
     assert choice.message.role == "assistant"
-    assert choice.message.tool_calls is None \
-           or len(choice.message.tool_calls) == 1
+    assert choice.message.tool_calls is None or len(choice.message.tool_calls) == 1
     assert len(choice.message.tool_calls[0].id) == 9  # length of 9 for mistral
diff --git a/tests/tool_use/mistral/utils.py b/tests/tool_use/mistral/utils.py
index 7a026cd9bb61..13a234f8e26b 100644
--- a/tests/tool_use/mistral/utils.py
+++ b/tests/tool_use/mistral/utils.py
@@ -18,17 +18,16 @@ class ServerConfig(TypedDict, total=False):
 
 CONFIGS: dict[str, ServerConfig] = {
     "mistral": {
-        "model":
-        "mistralai/Mistral-7B-Instruct-v0.3",
+        "model": "mistralai/Mistral-7B-Instruct-v0.3",
         "arguments": [
-            "--tokenizer-mode", "mistral",
-            "--ignore-patterns=\"consolidated.safetensors\""
+            "--tokenizer-mode",
+            "mistral",
+            '--ignore-patterns="consolidated.safetensors"',
         ],
-        "system_prompt":
-        "You are a helpful assistant with access to tools. If a tool"
+        "system_prompt": "You are a helpful assistant with access to tools. If a tool"
         " that you have would be helpful to answer a user query, "
         "call the tool. Otherwise, answer the user's query directly "
         "without calling a tool. DO NOT CALL A TOOL THAT IS IRRELEVANT "
-        "to the user's question - just respond to it normally."
+        "to the user's question - just respond to it normally.",
     },
 }
diff --git a/tests/tool_use/test_chat_completion_request_validations.py b/tests/tool_use/test_chat_completion_request_validations.py
index a30c58b09fe8..50cd9e4279b2 100644
--- a/tests/tool_use/test_chat_completion_request_validations.py
+++ b/tests/tool_use/test_chat_completion_request_validations.py
@@ -8,68 +8,56 @@
 
 def test_chat_completion_request_with_no_tools():
     # tools key is not present
-    request = ChatCompletionRequest.model_validate({
-        'messages': [{
-            'role': 'user',
-            'content': 'Hello'
-        }],
-        'model':
-        'facebook/opt-125m',
-    })
-    assert request.tool_choice == 'none'
+    request = ChatCompletionRequest.model_validate(
+        {
+            "messages": [{"role": "user", "content": "Hello"}],
+            "model": "facebook/opt-125m",
+        }
+    )
+    assert request.tool_choice == "none"
 
     # tools key is None
-    request = ChatCompletionRequest.model_validate({
-        'messages': [{
-            'role': 'user',
-            'content': 'Hello'
-        }],
-        'model':
-        'facebook/opt-125m',
-        'tools':
-        None
-    })
-    assert request.tool_choice == 'none'
+    request = ChatCompletionRequest.model_validate(
+        {
+            "messages": [{"role": "user", "content": "Hello"}],
+            "model": "facebook/opt-125m",
+            "tools": None,
+        }
+    )
+    assert request.tool_choice == "none"
 
     # tools key present but empty
-    request = ChatCompletionRequest.model_validate({
-        'messages': [{
-            'role': 'user',
-            'content': 'Hello'
-        }],
-        'model':
-        'facebook/opt-125m',
-        'tools': []
-    })
-    assert request.tool_choice == 'none'
+    request = ChatCompletionRequest.model_validate(
+        {
+            "messages": [{"role": "user", "content": "Hello"}],
+            "model": "facebook/opt-125m",
+            "tools": [],
+        }
+    )
+    assert request.tool_choice == "none"
 
 
-@pytest.mark.parametrize('tool_choice', ['auto', 'required'])
+@pytest.mark.parametrize("tool_choice", ["auto", "required"])
 def test_chat_completion_request_with_tool_choice_but_no_tools(tool_choice):
-    with pytest.raises(ValueError,
-                       match="When using `tool_choice`, `tools` must be set."):
-        ChatCompletionRequest.model_validate({
-            'messages': [{
-                'role': 'user',
-                'content': 'Hello'
-            }],
-            'model':
-            'facebook/opt-125m',
-            'tool_choice':
-            tool_choice
-        })
-
-    with pytest.raises(ValueError,
-                       match="When using `tool_choice`, `tools` must be set."):
-        ChatCompletionRequest.model_validate({
-            'messages': [{
-                'role': 'user',
-                'content': 'Hello'
-            }],
-            'model':
-            'facebook/opt-125m',
-            'tool_choice':
-            tool_choice,
-            'tools':
-            None
-        })
+    with pytest.raises(
+        ValueError, match="When using `tool_choice`, `tools` must be set."
+    ):
+        ChatCompletionRequest.model_validate(
+            {
+                "messages": [{"role": "user", "content": "Hello"}],
+                "model": "facebook/opt-125m",
+                "tool_choice": tool_choice,
+            }
+        )
+
+    with pytest.raises(
+        ValueError, match="When using `tool_choice`, `tools` must be set."
+    ):
+        ChatCompletionRequest.model_validate(
+            {
+                "messages": [{"role": "user", "content": "Hello"}],
+                "model": "facebook/opt-125m",
+                "tool_choice": tool_choice,
+                "tools": None,
+            }
+        )
diff --git a/tests/tool_use/test_chat_completions.py b/tests/tool_use/test_chat_completions.py
index 8c01c86e29f2..425d3879985e 100644
--- a/tests/tool_use/test_chat_completions.py
+++ b/tests/tool_use/test_chat_completions.py
@@ -4,16 +4,21 @@
 import openai
 import pytest
 
-from .utils import (MESSAGES_WITHOUT_TOOLS, WEATHER_TOOL, ServerConfig,
-                    ensure_system_prompt)
+from .utils import (
+    MESSAGES_WITHOUT_TOOLS,
+    WEATHER_TOOL,
+    ServerConfig,
+    ensure_system_prompt,
+)
 
 
 # test: make sure chat completions without tools provided work even when tools
 # are enabled. This makes sure tool call chat templates work, AND that the tool
 # parser stream processing doesn't change the output of the model.
 @pytest.mark.asyncio
-async def test_chat_completion_without_tools(client: openai.AsyncOpenAI,
-                                             server_config: ServerConfig):
+async def test_chat_completion_without_tools(
+    client: openai.AsyncOpenAI, server_config: ServerConfig
+):
     models = await client.models.list()
     model_name: str = models.data[0].id
     chat_completion = await client.chat.completions.create(
@@ -21,7 +26,8 @@ async def test_chat_completion_without_tools(client: openai.AsyncOpenAI,
         temperature=0,
         max_completion_tokens=150,
         model=model_name,
-        logprobs=False)
+        logprobs=False,
+    )
     choice = chat_completion.choices[0]
     stop_reason = chat_completion.choices[0].finish_reason
     output_text = chat_completion.choices[0].message.content
@@ -32,8 +38,7 @@ async def test_chat_completion_without_tools(client: openai.AsyncOpenAI,
     assert stop_reason != "tool_calls"
 
     # check to make sure no tool calls were returned
-    assert (choice.message.tool_calls is None
-            or len(choice.message.tool_calls) == 0)
+    assert choice.message.tool_calls is None or len(choice.message.tool_calls) == 0
 
     # make the same request, streaming
     stream = await client.chat.completions.create(
@@ -55,7 +60,7 @@ async def test_chat_completion_without_tools(client: openai.AsyncOpenAI,
         # make sure the role is assistant
         if delta.role:
             assert not role_sent
-            assert delta.role == 'assistant'
+            assert delta.role == "assistant"
             role_sent = True
 
         if delta.content:
@@ -80,8 +85,9 @@ async def test_chat_completion_without_tools(client: openai.AsyncOpenAI,
 # tools, to make sure we can still get normal chat completion responses
 # and that they won't be parsed as tools
 @pytest.mark.asyncio
-async def test_chat_completion_with_tools(client: openai.AsyncOpenAI,
-                                          server_config: ServerConfig):
+async def test_chat_completion_with_tools(
+    client: openai.AsyncOpenAI, server_config: ServerConfig
+):
     models = await client.models.list()
     model_name: str = models.data[0].id
     chat_completion = await client.chat.completions.create(
@@ -90,19 +96,19 @@ async def test_chat_completion_with_tools(client: openai.AsyncOpenAI,
         max_completion_tokens=150,
         model=model_name,
         tools=[WEATHER_TOOL],
-        logprobs=False)
+        logprobs=False,
+    )
     choice = chat_completion.choices[0]
     stop_reason = chat_completion.choices[0].finish_reason
     output_text = chat_completion.choices[0].message.content
 
     # check to make sure we got text
     assert output_text is not None
-    assert stop_reason != 'tool_calls'
+    assert stop_reason != "tool_calls"
     assert len(output_text) > 0
 
     # check to make sure no tool calls were returned
-    assert (choice.message.tool_calls is None
-            or len(choice.message.tool_calls) == 0)
+    assert choice.message.tool_calls is None or len(choice.message.tool_calls) == 0
 
     # make the same request, streaming
     stream = await client.chat.completions.create(
@@ -125,7 +131,7 @@ async def test_chat_completion_with_tools(client: openai.AsyncOpenAI,
 
         # make sure the role is assistant
         if delta.role:
-            assert delta.role == 'assistant'
+            assert delta.role == "assistant"
             role_sent = True
 
         if delta.content:
@@ -142,6 +148,6 @@ async def test_chat_completion_with_tools(client: openai.AsyncOpenAI,
     assert role_sent
     assert finish_reason_count == 1
     assert chunk.choices[0].finish_reason == stop_reason
-    assert chunk.choices[0].finish_reason != 'tool_calls'
+    assert chunk.choices[0].finish_reason != "tool_calls"
     assert len(chunks)
     assert "".join(chunks) == output_text
diff --git a/tests/tool_use/test_deepseekv31_tool_parser.py b/tests/tool_use/test_deepseekv31_tool_parser.py
index 5f6b266d3aa1..9b7e71b49c05 100644
--- a/tests/tool_use/test_deepseekv31_tool_parser.py
+++ b/tests/tool_use/test_deepseekv31_tool_parser.py
@@ -21,23 +21,28 @@ def parser(deepseekv31_tokenizer):
 
 def test_extract_tool_calls_with_tool(parser):
     model_output = (
-        "normal text" + "<｜tool▁calls▁begin｜>" +
-        "<｜tool▁call▁begin｜>foo<｜tool▁sep｜>{\"x\":1}<｜tool▁call▁end｜>" +
-        "<｜tool▁calls▁end｜>")
+        "normal text"
+        + "<｜tool▁calls▁begin｜>"
+        + '<｜tool▁call▁begin｜>foo<｜tool▁sep｜>{"x":1}<｜tool▁call▁end｜>'
+        + "<｜tool▁calls▁end｜>"
+    )
     result = parser.extract_tool_calls(model_output, None)
     assert result.tools_called
     assert len(result.tool_calls) == 1
     assert result.tool_calls[0].function.name == "foo"
-    assert result.tool_calls[0].function.arguments == "{\"x\":1}"
+    assert result.tool_calls[0].function.arguments == '{"x":1}'
     assert result.content == "normal text"
 
 
 def test_extract_tool_calls_with_multiple_tools(parser):
     model_output = (
-        "some prefix text" + "<｜tool▁calls▁begin｜>" +
-        "<｜tool▁call▁begin｜>foo<｜tool▁sep｜>{\"x\":1}<｜tool▁call▁end｜>" +
-        "<｜tool▁call▁begin｜>bar<｜tool▁sep｜>{\"y\":2}<｜tool▁call▁end｜>" +
-        "<｜tool▁calls▁end｜>" + " some suffix text")
+        "some prefix text"
+        + "<｜tool▁calls▁begin｜>"
+        + '<｜tool▁call▁begin｜>foo<｜tool▁sep｜>{"x":1}<｜tool▁call▁end｜>'
+        + '<｜tool▁call▁begin｜>bar<｜tool▁sep｜>{"y":2}<｜tool▁call▁end｜>'
+        + "<｜tool▁calls▁end｜>"
+        + " some suffix text"
+    )
 
     result = parser.extract_tool_calls(model_output, None)
 
@@ -45,10 +50,10 @@ def test_extract_tool_calls_with_multiple_tools(parser):
     assert len(result.tool_calls) == 2
 
     assert result.tool_calls[0].function.name == "foo"
-    assert result.tool_calls[0].function.arguments == "{\"x\":1}"
+    assert result.tool_calls[0].function.arguments == '{"x":1}'
 
     assert result.tool_calls[1].function.name == "bar"
-    assert result.tool_calls[1].function.arguments == "{\"y\":2}"
+    assert result.tool_calls[1].function.arguments == '{"y":2}'
 
     # prefix is content
     assert result.content == "some prefix text"
diff --git a/tests/tool_use/test_glm4_moe_tool_parser.py b/tests/tool_use/test_glm4_moe_tool_parser.py
index bb8c36fb13ad..6f1f6671d9b3 100644
--- a/tests/tool_use/test_glm4_moe_tool_parser.py
+++ b/tests/tool_use/test_glm4_moe_tool_parser.py
@@ -27,12 +27,14 @@ def glm4_moe_tool_parser(glm4_moe_tokenizer):
     return Glm4MoeModelToolParser(glm4_moe_tokenizer)
 
 
-def assert_tool_calls(actual_tool_calls: list[ToolCall],
-                      expected_tool_calls: list[ToolCall]):
+def assert_tool_calls(
+    actual_tool_calls: list[ToolCall], expected_tool_calls: list[ToolCall]
+):
     assert len(actual_tool_calls) == len(expected_tool_calls)
 
-    for actual_tool_call, expected_tool_call in zip(actual_tool_calls,
-                                                    expected_tool_calls):
+    for actual_tool_call, expected_tool_call in zip(
+        actual_tool_calls, expected_tool_calls
+    ):
         assert isinstance(actual_tool_call.id, str)
         assert len(actual_tool_call.id) > 0
 
@@ -47,7 +49,8 @@ def assert_tool_calls(actual_tool_calls: list[ToolCall],
 def test_extract_tool_calls_no_tools(glm4_moe_tool_parser):
     model_output = "This is a test"
     extracted_tool_calls = glm4_moe_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
     assert not extracted_tool_calls.tools_called
     assert extracted_tool_calls.tool_calls == []
     assert extracted_tool_calls.content == model_output
@@ -73,14 +76,18 @@ def test_extract_tool_calls_no_tools(glm4_moe_tool_parser):
     <arg_value>fahrenheit</arg_value>
     </tool_call>""",
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Dallas",
-                        "state": "TX",
-                        "unit": "fahrenheit",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Dallas",
+                                "state": "TX",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                )
             ],
             None,
         ),
@@ -102,22 +109,30 @@ def test_extract_tool_calls_no_tools(glm4_moe_tool_parser):
     <arg_value>fahrenheit</arg_value>
     </tool_call>""",
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Dallas",
-                        "state": "TX",
-                        "unit": "fahrenheit",
-                    }),
-                )),
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Orlando",
-                        "state": "FL",
-                        "unit": "fahrenheit",
-                    }),
-                )),
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Dallas",
+                                "state": "TX",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                ),
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Orlando",
+                                "state": "FL",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                ),
             ],
             None,
         ),
@@ -131,14 +146,18 @@ def test_extract_tool_calls_no_tools(glm4_moe_tool_parser):
     <arg_value>celsius</arg_value>
     </tool_call>""",
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Seattle",
-                        "state": "WA",
-                        "unit": "celsius",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Seattle",
+                                "state": "WA",
+                                "unit": "celsius",
+                            }
+                        ),
+                    )
+                )
             ],
             "I'll help you check the weather.",
         ),
@@ -152,37 +171,51 @@ def test_extract_tool_calls_no_tools(glm4_moe_tool_parser):
     <arg_value>celsius</arg_value>
     </tool_call>""",
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "New York",
-                        "state": "NY",
-                        "unit": "celsius",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "New York",
+                                "state": "NY",
+                                "unit": "celsius",
+                            }
+                        ),
+                    )
+                )
             ],
             None,
         ),
-        ("""I will help you get the weather.<tool_call>get_weather
+        (
+            """I will help you get the weather.<tool_call>get_weather
     <arg_key>city</arg_key>
     <arg_value>Beijing</arg_value>
     <arg_key>date</arg_key>
     <arg_value>2025-08-01</arg_value>
-    </tool_call>""", [
-            ToolCall(function=FunctionCall(
-                name="get_weather",
-                arguments=json.dumps({
-                    "city": "Beijing",
-                    "date": "2025-08-01",
-                }),
-            ))
-        ], "I will help you get the weather."),
+    </tool_call>""",
+            [
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Beijing",
+                                "date": "2025-08-01",
+                            }
+                        ),
+                    )
+                )
+            ],
+            "I will help you get the weather.",
+        ),
     ],
 )
-def test_extract_tool_calls(glm4_moe_tool_parser, model_output,
-                            expected_tool_calls, expected_content):
+def test_extract_tool_calls(
+    glm4_moe_tool_parser, model_output, expected_tool_calls, expected_content
+):
     extracted_tool_calls = glm4_moe_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
     assert extracted_tool_calls.tools_called
     assert_tool_calls(extracted_tool_calls.tool_calls, expected_tool_calls)
 
@@ -202,7 +235,8 @@ def test_extract_tool_calls_with_thinking_tags(glm4_moe_tool_parser):
 </tool_call>"""
 
     extracted_tool_calls = glm4_moe_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
 
     assert extracted_tool_calls.tools_called
     assert len(extracted_tool_calls.tool_calls) == 1
@@ -224,7 +258,8 @@ def test_extract_tool_calls_malformed_xml(glm4_moe_tool_parser):
 </tool_call>"""
 
     extracted_tool_calls = glm4_moe_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
 
     # Should handle malformed XML gracefully
     # The parser should either extract what it can or return no tool calls
@@ -239,12 +274,12 @@ def test_extract_tool_calls_empty_arguments(glm4_moe_tool_parser):
 </tool_call>"""
 
     extracted_tool_calls = glm4_moe_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
 
     assert extracted_tool_calls.tools_called
     assert len(extracted_tool_calls.tool_calls) == 1
-    assert extracted_tool_calls.tool_calls[
-        0].function.name == "get_current_time"
+    assert extracted_tool_calls.tool_calls[0].function.name == "get_current_time"
     # Empty arguments should result in empty JSON object
     assert extracted_tool_calls.tool_calls[0].function.arguments == "{}"
 
@@ -270,7 +305,8 @@ def test_extract_tool_calls_mixed_content(glm4_moe_tool_parser):
 </tool_call>"""
 
     extracted_tool_calls = glm4_moe_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
 
     assert extracted_tool_calls.tools_called
     assert len(extracted_tool_calls.tool_calls) == 2
@@ -321,8 +357,7 @@ def test_streaming_basic_functionality(glm4_moe_tool_parser):
 
     # The result behavior depends on the streaming state
     # This test mainly ensures no exceptions are thrown
-    assert result is None or hasattr(result, 'tool_calls') or hasattr(
-        result, 'content')
+    assert result is None or hasattr(result, "tool_calls") or hasattr(result, "content")
 
 
 def test_streaming_no_tool_calls(glm4_moe_tool_parser):
@@ -341,7 +376,7 @@ def test_streaming_no_tool_calls(glm4_moe_tool_parser):
 
     # Should return the delta text as content
     assert result is not None
-    assert hasattr(result, 'content')
+    assert hasattr(result, "content")
     assert result.content == " without any tool calls."
 
 
@@ -367,7 +402,7 @@ def test_streaming_with_content_before_tool_calls(glm4_moe_tool_parser):
 
     # Should return content when no tool call tokens are detected
     assert result is not None
-    assert hasattr(result, 'content')
+    assert hasattr(result, "content")
     assert result.content == "get the weather.<tool_call>"
 
 
@@ -383,7 +418,8 @@ def test_extract_tool_calls_special_characters(glm4_moe_tool_parser):
 </tool_call>"""
 
     extracted_tool_calls = glm4_moe_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
 
     assert extracted_tool_calls.tools_called
     assert len(extracted_tool_calls.tool_calls) == 1
@@ -404,7 +440,8 @@ def test_extract_tool_calls_incomplete_tool_call(glm4_moe_tool_parser):
 <arg_value>2025-08-01</arg_value>"""
 
     extracted_tool_calls = glm4_moe_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
 
     # Incomplete tool calls should not be extracted
     assert not extracted_tool_calls.tools_called
diff --git a/tests/tool_use/test_jamba_tool_parser.py b/tests/tool_use/test_jamba_tool_parser.py
index 8f819301e264..44d42bbd72b0 100644
--- a/tests/tool_use/test_jamba_tool_parser.py
+++ b/tests/tool_use/test_jamba_tool_parser.py
@@ -9,8 +9,7 @@
 import pytest
 from partial_json_parser.core.options import Allow
 
-from vllm.entrypoints.openai.protocol import (DeltaMessage, FunctionCall,
-                                              ToolCall)
+from vllm.entrypoints.openai.protocol import DeltaMessage, FunctionCall, ToolCall
 from vllm.entrypoints.openai.tool_parsers import JambaToolParser
 from vllm.transformers_utils.detokenizer_utils import detokenize_incrementally
 from vllm.transformers_utils.tokenizer import AnyTokenizer, get_tokenizer
@@ -30,12 +29,14 @@ def jamba_tool_parser(jamba_tokenizer):
     return JambaToolParser(jamba_tokenizer)
 
 
-def assert_tool_calls(actual_tool_calls: list[ToolCall],
-                      expected_tool_calls: list[ToolCall]):
+def assert_tool_calls(
+    actual_tool_calls: list[ToolCall], expected_tool_calls: list[ToolCall]
+):
     assert len(actual_tool_calls) == len(expected_tool_calls)
 
-    for actual_tool_call, expected_tool_call in zip(actual_tool_calls,
-                                                    expected_tool_calls):
+    for actual_tool_call, expected_tool_call in zip(
+        actual_tool_calls, expected_tool_calls
+    ):
         assert isinstance(actual_tool_call.id, str)
         assert len(actual_tool_call.id) > 16
 
@@ -44,10 +45,9 @@ def assert_tool_calls(actual_tool_calls: list[ToolCall],
 
 
 def stream_delta_message_generator(
-        jamba_tool_parser: JambaToolParser, jamba_tokenizer: AnyTokenizer,
-        model_output: str) -> Generator[DeltaMessage, None, None]:
-    all_token_ids = jamba_tokenizer.encode(model_output,
-                                           add_special_tokens=False)
+    jamba_tool_parser: JambaToolParser, jamba_tokenizer: AnyTokenizer, model_output: str
+) -> Generator[DeltaMessage, None, None]:
+    all_token_ids = jamba_tokenizer.encode(model_output, add_special_tokens=False)
 
     previous_text = ""
     previous_tokens = None
@@ -56,18 +56,19 @@ def stream_delta_message_generator(
     for i, delta_token in enumerate(all_token_ids):
         delta_token_ids = [delta_token]
         previous_token_ids = all_token_ids[:i]
-        current_token_ids = all_token_ids[:i + 1]
-
-        (new_tokens, delta_text, new_prefix_offset,
-         new_read_offset) = detokenize_incrementally(
-             tokenizer=jamba_tokenizer,
-             all_input_ids=current_token_ids,
-             prev_tokens=previous_tokens,
-             prefix_offset=prefix_offset,
-             read_offset=read_offset,
-             skip_special_tokens=False,
-             spaces_between_special_tokens=True,
-         )
+        current_token_ids = all_token_ids[: i + 1]
+
+        (new_tokens, delta_text, new_prefix_offset, new_read_offset) = (
+            detokenize_incrementally(
+                tokenizer=jamba_tokenizer,
+                all_input_ids=current_token_ids,
+                prev_tokens=previous_tokens,
+                prefix_offset=prefix_offset,
+                read_offset=read_offset,
+                skip_special_tokens=False,
+                spaces_between_special_tokens=True,
+            )
+        )
 
         current_text = previous_text + delta_text
 
@@ -84,8 +85,9 @@ def stream_delta_message_generator(
             yield delta_message
 
         previous_text = current_text
-        previous_tokens = previous_tokens + new_tokens if previous_tokens\
-            else new_tokens
+        previous_tokens = (
+            previous_tokens + new_tokens if previous_tokens else new_tokens
+        )
         prefix_offset = new_prefix_offset
         read_offset = new_read_offset
 
@@ -93,7 +95,8 @@ def stream_delta_message_generator(
 def test_extract_tool_calls_no_tools(jamba_tool_parser):
     model_output = "This is a test"
     extracted_tool_calls = jamba_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
     assert not extracted_tool_calls.tools_called
     assert extracted_tool_calls.tool_calls == []
     assert extracted_tool_calls.content == model_output
@@ -108,54 +111,63 @@ def test_extract_tool_calls_no_tools(jamba_tool_parser):
     argnames=["model_output", "expected_tool_calls", "expected_content"],
     argvalues=[
         (
-            ''' <tool_calls>[\n    {"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}\n]</tool_calls>''',  # noqa: E501
+            """ <tool_calls>[\n    {"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}\n]</tool_calls>""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(name="get_current_weather",
-                                               arguments=json.dumps(
-                                                   {
-                                                       "city": "Dallas",
-                                                       "state": "TX",
-                                                       "unit": "fahrenheit"
-                                                   })))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}
+                        ),
+                    )
+                )
             ],
-            None),
+            None,
+        ),
         (
-            ''' Sure! let me call the tool for you.<tool_calls>[\n    {"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}\n]</tool_calls>''',  # noqa: E501
+            """ Sure! let me call the tool for you.<tool_calls>[\n    {"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}\n]</tool_calls>""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(name="get_current_weather",
-                                               arguments=json.dumps(
-                                                   {
-                                                       "city": "Dallas",
-                                                       "state": "TX",
-                                                       "unit": "fahrenheit"
-                                                   })))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}
+                        ),
+                    )
+                )
             ],
-            " Sure! let me call the tool for you."),
+            " Sure! let me call the tool for you.",
+        ),
         (
-            ''' <tool_calls>[\n    {"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}},\n    {"name": "get_current_weather", "arguments": {"city": "Orlando", "state": "FL", "unit": "fahrenheit"}}\n]</tool_calls>''',  # noqa: E501
+            """ <tool_calls>[\n    {"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}},\n    {"name": "get_current_weather", "arguments": {"city": "Orlando", "state": "FL", "unit": "fahrenheit"}}\n]</tool_calls>""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(name="get_current_weather",
-                                               arguments=json.dumps(
-                                                   {
-                                                       "city": "Dallas",
-                                                       "state": "TX",
-                                                       "unit": "fahrenheit"
-                                                   }))),
-                ToolCall(function=FunctionCall(name="get_current_weather",
-                                               arguments=json.dumps(
-                                                   {
-                                                       "city": "Orlando",
-                                                       "state": "FL",
-                                                       "unit": "fahrenheit"
-                                                   })))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}
+                        ),
+                    )
+                ),
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Orlando", "state": "FL", "unit": "fahrenheit"}
+                        ),
+                    )
+                ),
             ],
-            None)
+            None,
+        ),
     ],
 )
-def test_extract_tool_calls(jamba_tool_parser, model_output,
-                            expected_tool_calls, expected_content):
+def test_extract_tool_calls(
+    jamba_tool_parser, model_output, expected_tool_calls, expected_content
+):
     extracted_tool_calls = jamba_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
     assert extracted_tool_calls.tools_called
 
     assert_tool_calls(extracted_tool_calls.tool_calls, expected_tool_calls)
@@ -172,63 +184,75 @@ def test_extract_tool_calls(jamba_tool_parser, model_output,
     ],
     argnames=["model_output", "expected_tool_calls", "expected_content"],
     argvalues=[
-        ('''This is a test''', [], '''This is a test'''),
+        ("""This is a test""", [], """This is a test"""),
         (
-            ''' <tool_calls>[\n    {"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}\n]</tool_calls>''',  # noqa: E501
+            """ <tool_calls>[\n    {"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}\n]</tool_calls>""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(name="get_current_weather",
-                                               arguments=json.dumps(
-                                                   {
-                                                       "city": "Dallas",
-                                                       "state": "TX",
-                                                       "unit": "fahrenheit"
-                                                   })))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}
+                        ),
+                    )
+                )
             ],
-            " "),
+            " ",
+        ),
         (
-            ''' Sure! let me call the tool for you.<tool_calls>[\n    {"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}\n]</tool_calls>''',  # noqa: E501
+            """ Sure! let me call the tool for you.<tool_calls>[\n    {"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}\n]</tool_calls>""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(name="get_current_weather",
-                                               arguments=json.dumps(
-                                                   {
-                                                       "city": "Dallas",
-                                                       "state": "TX",
-                                                       "unit": "fahrenheit"
-                                                   })))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}
+                        ),
+                    )
+                )
             ],
-            " Sure! let me call the tool for you."),
+            " Sure! let me call the tool for you.",
+        ),
         (
-            ''' <tool_calls>[\n    {"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}},\n    {"name": "get_current_weather", "arguments": {"city": "Orlando", "state": "FL", "unit": "fahrenheit"}}\n]</tool_calls>''',  # noqa: E501
+            """ <tool_calls>[\n    {"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}},\n    {"name": "get_current_weather", "arguments": {"city": "Orlando", "state": "FL", "unit": "fahrenheit"}}\n]</tool_calls>""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(name="get_current_weather",
-                                               arguments=json.dumps(
-                                                   {
-                                                       "city": "Dallas",
-                                                       "state": "TX",
-                                                       "unit": "fahrenheit"
-                                                   }))),
-                ToolCall(function=FunctionCall(name="get_current_weather",
-                                               arguments=json.dumps(
-                                                   {
-                                                       "city": "Orlando",
-                                                       "state": "FL",
-                                                       "unit": "fahrenheit"
-                                                   })))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}
+                        ),
+                    )
+                ),
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Orlando", "state": "FL", "unit": "fahrenheit"}
+                        ),
+                    )
+                ),
             ],
-            " ")
+            " ",
+        ),
     ],
 )
-def test_extract_tool_calls_streaming(jamba_tool_parser, jamba_tokenizer,
-                                      model_output, expected_tool_calls,
-                                      expected_content):
-    other_content: str = ''
+def test_extract_tool_calls_streaming(
+    jamba_tool_parser,
+    jamba_tokenizer,
+    model_output,
+    expected_tool_calls,
+    expected_content,
+):
+    other_content: str = ""
     function_names: list[str] = []
     function_args_strs: list[str] = []
     tool_call_idx: int = -1
     tool_call_ids: list[Optional[str]] = []
 
     for delta_message in stream_delta_message_generator(
-            jamba_tool_parser, jamba_tokenizer, model_output):
+        jamba_tool_parser, jamba_tokenizer, model_output
+    ):
         # role should never be streamed from tool parser
         assert not delta_message.role
 
@@ -264,18 +288,22 @@ def test_extract_tool_calls_streaming(jamba_tool_parser, jamba_tokenizer,
                     # make sure they're a string and then add them to the list
                     assert isinstance(tool_call.function.arguments, str)
 
-                    function_args_strs[
-                        tool_call.index] += tool_call.function.arguments
+                    function_args_strs[tool_call.index] += tool_call.function.arguments
 
     assert other_content == expected_content
 
     actual_tool_calls = [
-        ToolCall(id=tool_call_id,
-                 function=FunctionCall(
-                     name=function_name,
-                     arguments=partial_json_parser.ensure_json(
-                         function_args_str, Allow.OBJ | Allow.STR)))
+        ToolCall(
+            id=tool_call_id,
+            function=FunctionCall(
+                name=function_name,
+                arguments=partial_json_parser.ensure_json(
+                    function_args_str, Allow.OBJ | Allow.STR
+                ),
+            ),
+        )
         for tool_call_id, function_name, function_args_str in zip(
-            tool_call_ids, function_names, function_args_strs)
+            tool_call_ids, function_names, function_args_strs
+        )
     ]
     assert_tool_calls(actual_tool_calls, expected_tool_calls)
diff --git a/tests/tool_use/test_kimi_k2_tool_parser.py b/tests/tool_use/test_kimi_k2_tool_parser.py
index ad9af6361802..43feae4d865e 100644
--- a/tests/tool_use/test_kimi_k2_tool_parser.py
+++ b/tests/tool_use/test_kimi_k2_tool_parser.py
@@ -26,27 +26,31 @@ def kimi_k2_tool_parser(kimi_k2_tokenizer):
     return KimiK2ToolParser(kimi_k2_tokenizer)
 
 
-def assert_tool_calls(actual_tool_calls: list[ToolCall],
-                      expected_tool_calls: list[ToolCall]):
+def assert_tool_calls(
+    actual_tool_calls: list[ToolCall], expected_tool_calls: list[ToolCall]
+):
     assert len(actual_tool_calls) == len(expected_tool_calls)
 
-    for actual_tool_call, expected_tool_call in zip(actual_tool_calls,
-                                                    expected_tool_calls):
-
+    for actual_tool_call, expected_tool_call in zip(
+        actual_tool_calls, expected_tool_calls
+    ):
         assert actual_tool_call.type == "function"
         assert actual_tool_call.function == expected_tool_call.function
 
         # assert tool call id format
         assert actual_tool_call.id.startswith("functions.")
-        assert actual_tool_call.id.split(':')[-1].isdigit()
-        assert actual_tool_call.id.split('.')[1].split(
-            ':')[0] == expected_tool_call.function.name
+        assert actual_tool_call.id.split(":")[-1].isdigit()
+        assert (
+            actual_tool_call.id.split(".")[1].split(":")[0]
+            == expected_tool_call.function.name
+        )
 
 
 def test_extract_tool_calls_no_tools(kimi_k2_tool_parser):
     model_output = "This is a test"
     extracted_tool_calls = kimi_k2_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
     assert not extracted_tool_calls.tools_called
     assert extracted_tool_calls.tool_calls == []
     assert extracted_tool_calls.content == model_output
@@ -63,14 +67,18 @@ def test_extract_tool_calls_no_tools(kimi_k2_tool_parser):
             """I'll help you check the weather. <|tool_calls_section_begin|> <|tool_call_begin|>
 functions.get_weather:0 <|tool_call_argument_begin|> {"city": "Beijing"} <|tool_call_end|> <|tool_calls_section_end|>""",
             [
-                ToolCall(id='functions.get_weather:0',
-                         function=FunctionCall(
-                             name="get_weather",
-                             arguments=json.dumps({
-                                 "city": "Beijing",
-                             }, ),
-                         ),
-                         type='function')
+                ToolCall(
+                    id="functions.get_weather:0",
+                    function=FunctionCall(
+                        name="get_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Beijing",
+                            },
+                        ),
+                    ),
+                    type="function",
+                )
             ],
             "I'll help you check the weather. ",
         ),
@@ -79,31 +87,41 @@ def test_extract_tool_calls_no_tools(kimi_k2_tool_parser):
 functions.get_weather:0 <|tool_call_argument_begin|> {"city": "Beijing"} <|tool_call_end|> <|tool_call_begin|>
 functions.get_weather:1 <|tool_call_argument_begin|> {"city": "Shanghai"} <|tool_call_end|> <|tool_calls_section_end|>""",
             [
-                ToolCall(id='functions.get_weather:0',
-                         function=FunctionCall(
-                             name="get_weather",
-                             arguments=json.dumps({
-                                 "city": "Beijing",
-                             }, ),
-                         ),
-                         type='function'),
-                ToolCall(id='functions.get_weather:1',
-                         function=FunctionCall(
-                             name="get_weather",
-                             arguments=json.dumps({
-                                 "city": "Shanghai",
-                             }, ),
-                         ),
-                         type='function')
+                ToolCall(
+                    id="functions.get_weather:0",
+                    function=FunctionCall(
+                        name="get_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Beijing",
+                            },
+                        ),
+                    ),
+                    type="function",
+                ),
+                ToolCall(
+                    id="functions.get_weather:1",
+                    function=FunctionCall(
+                        name="get_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Shanghai",
+                            },
+                        ),
+                    ),
+                    type="function",
+                ),
             ],
             "I'll help you check the weather. ",
         ),
     ],
 )
-def test_extract_tool_calls(kimi_k2_tool_parser, model_output,
-                            expected_tool_calls, expected_content):
+def test_extract_tool_calls(
+    kimi_k2_tool_parser, model_output, expected_tool_calls, expected_content
+):
     extracted_tool_calls = kimi_k2_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
     assert extracted_tool_calls.tools_called
 
     assert_tool_calls(extracted_tool_calls.tool_calls, expected_tool_calls)
@@ -118,15 +136,14 @@ def test_extract_tool_calls_invalid_json(kimi_k2_tool_parser):
 functions.valid_get_weather:1 <|tool_call_argument_begin|> {"city": "Shanghai"} <|tool_call_end|> <|tool_calls_section_end|>"""
 
     extracted_tool_calls = kimi_k2_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
 
     assert extracted_tool_calls.tools_called
     # Should extract only the valid JSON tool calls
     assert len(extracted_tool_calls.tool_calls) == 2
-    assert extracted_tool_calls.tool_calls[
-        0].function.name == "invalid_get_weather"
-    assert extracted_tool_calls.tool_calls[
-        1].function.name == "valid_get_weather"
+    assert extracted_tool_calls.tool_calls[0].function.name == "invalid_get_weather"
+    assert extracted_tool_calls.tool_calls[1].function.name == "valid_get_weather"
 
 
 def test_extract_tool_calls_invalid_funcall(kimi_k2_tool_parser):
@@ -136,13 +153,13 @@ def test_extract_tool_calls_invalid_funcall(kimi_k2_tool_parser):
 functions.valid_get_weather:1 <|tool_call_argument_begin|> {"city": "Shanghai"} <|tool_call_end|> <|tool_calls_section_end|>"""
 
     extracted_tool_calls = kimi_k2_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
 
     assert extracted_tool_calls.tools_called
     # Should extract only the valid JSON tool calls
     assert len(extracted_tool_calls.tool_calls) == 1
-    assert extracted_tool_calls.tool_calls[
-        0].function.name == "valid_get_weather"
+    assert extracted_tool_calls.tool_calls[0].function.name == "valid_get_weather"
 
 
 def test_streaming_basic_functionality(kimi_k2_tool_parser):
@@ -170,8 +187,7 @@ def test_streaming_basic_functionality(kimi_k2_tool_parser):
 
     # The result might be None or contain tool call information
     # This depends on the internal state management
-    if result is not None and hasattr(result,
-                                      'tool_calls') and result.tool_calls:
+    if result is not None and hasattr(result, "tool_calls") and result.tool_calls:
         assert len(result.tool_calls) >= 0
 
 
@@ -191,5 +207,5 @@ def test_streaming_no_tool_calls(kimi_k2_tool_parser):
 
     # Should return the delta text as content
     assert result is not None
-    assert hasattr(result, 'content')
+    assert hasattr(result, "content")
     assert result.content == " without any tool calls."
diff --git a/tests/tool_use/test_minimax_tool_parser.py b/tests/tool_use/test_minimax_tool_parser.py
index 7aa19c9a51c9..8610656fa288 100644
--- a/tests/tool_use/test_minimax_tool_parser.py
+++ b/tests/tool_use/test_minimax_tool_parser.py
@@ -7,8 +7,11 @@
 
 import pytest
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionToolsParam,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionToolsParam,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers import MinimaxToolParser
 from vllm.transformers_utils.tokenizer import get_tokenizer
 
@@ -31,60 +34,48 @@ def minimax_tool_parser(minimax_tokenizer):
 @pytest.fixture
 def sample_tools():
     return [
-        ChatCompletionToolsParam(type="function",
-                                 function={
-                                     "name": "get_current_weather",
-                                     "description": "Get the current weather",
-                                     "parameters": {
-                                         "type": "object",
-                                         "properties": {
-                                             "city": {
-                                                 "type": "string",
-                                                 "description": "The city name"
-                                             },
-                                             "state": {
-                                                 "type": "string",
-                                                 "description":
-                                                 "The state code"
-                                             },
-                                             "unit": {
-                                                 "type": "string",
-                                                 "enum":
-                                                 ["fahrenheit", "celsius"]
-                                             }
-                                         },
-                                         "required": ["city", "state"]
-                                     }
-                                 }),
-        ChatCompletionToolsParam(type="function",
-                                 function={
-                                     "name": "calculate_area",
-                                     "description":
-                                     "Calculate area of a shape",
-                                     "parameters": {
-                                         "type": "object",
-                                         "properties": {
-                                             "shape": {
-                                                 "type": "string"
-                                             },
-                                             "dimensions": {
-                                                 "type": "object"
-                                             },
-                                             "precision": {
-                                                 "type": "integer"
-                                             }
-                                         }
-                                     }
-                                 })
+        ChatCompletionToolsParam(
+            type="function",
+            function={
+                "name": "get_current_weather",
+                "description": "Get the current weather",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "city": {"type": "string", "description": "The city name"},
+                        "state": {"type": "string", "description": "The state code"},
+                        "unit": {"type": "string", "enum": ["fahrenheit", "celsius"]},
+                    },
+                    "required": ["city", "state"],
+                },
+            },
+        ),
+        ChatCompletionToolsParam(
+            type="function",
+            function={
+                "name": "calculate_area",
+                "description": "Calculate area of a shape",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "shape": {"type": "string"},
+                        "dimensions": {"type": "object"},
+                        "precision": {"type": "integer"},
+                    },
+                },
+            },
+        ),
     ]
 
 
-def assert_tool_calls(actual_tool_calls: list[ToolCall],
-                      expected_tool_calls: list[ToolCall]):
+def assert_tool_calls(
+    actual_tool_calls: list[ToolCall], expected_tool_calls: list[ToolCall]
+):
     assert len(actual_tool_calls) == len(expected_tool_calls)
 
-    for actual_tool_call, expected_tool_call in zip(actual_tool_calls,
-                                                    expected_tool_calls):
+    for actual_tool_call, expected_tool_call in zip(
+        actual_tool_calls, expected_tool_calls
+    ):
         assert isinstance(actual_tool_call.id, str)
         assert len(actual_tool_call.id) > 16
 
@@ -95,7 +86,8 @@ def assert_tool_calls(actual_tool_calls: list[ToolCall],
 def test_extract_tool_calls_no_tools(minimax_tool_parser):
     model_output = "This is a test"
     extracted_tool_calls = minimax_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
     assert not extracted_tool_calls.tools_called
     assert extracted_tool_calls.tool_calls == []
     assert extracted_tool_calls.content == model_output
@@ -116,14 +108,18 @@ def test_extract_tool_calls_no_tools(minimax_tool_parser):
 {"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}
 </tool_calls>""",
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Dallas",
-                        "state": "TX",
-                        "unit": "fahrenheit",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Dallas",
+                                "state": "TX",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                )
             ],
             None,
         ),
@@ -133,22 +129,30 @@ def test_extract_tool_calls_no_tools(minimax_tool_parser):
 {"name": "get_current_weather", "arguments": {"city": "Orlando", "state": "FL", "unit": "fahrenheit"}}
 </tool_calls>""",
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Dallas",
-                        "state": "TX",
-                        "unit": "fahrenheit",
-                    }),
-                )),
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Orlando",
-                        "state": "FL",
-                        "unit": "fahrenheit",
-                    }),
-                )),
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Dallas",
+                                "state": "TX",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                ),
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Orlando",
+                                "state": "FL",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                ),
             ],
             None,
         ),
@@ -157,14 +161,18 @@ def test_extract_tool_calls_no_tools(minimax_tool_parser):
 {"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}
 </tool_calls>""",
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Seattle",
-                        "state": "WA",
-                        "unit": "celsius",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Seattle",
+                                "state": "WA",
+                                "unit": "celsius",
+                            }
+                        ),
+                    )
+                )
             ],
             "I'll help you check the weather.",
         ),
@@ -173,14 +181,18 @@ def test_extract_tool_calls_no_tools(minimax_tool_parser):
 {"name": "get_current_weather", "arguments": {"city": "New York", "state": "NY", "unit": "celsius"}}
 </tool_calls>""",
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "New York",
-                        "state": "NY",
-                        "unit": "celsius",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "New York",
+                                "state": "NY",
+                                "unit": "celsius",
+                            }
+                        ),
+                    )
+                )
             ],
             None,
         ),
@@ -188,22 +200,28 @@ def test_extract_tool_calls_no_tools(minimax_tool_parser):
             """<tool_calls>
 {"name": "get_current_weather", "arguments": {"city": "Boston", "state": "MA"}}""",
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Boston",
-                        "state": "MA",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Boston",
+                                "state": "MA",
+                            }
+                        ),
+                    )
+                )
             ],
             None,
         ),
     ],
 )
-def test_extract_tool_calls(minimax_tool_parser, model_output,
-                            expected_tool_calls, expected_content):
+def test_extract_tool_calls(
+    minimax_tool_parser, model_output, expected_tool_calls, expected_content
+):
     extracted_tool_calls = minimax_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
     assert extracted_tool_calls.tools_called
 
     assert_tool_calls(extracted_tool_calls.tool_calls, expected_tool_calls)
@@ -221,8 +239,7 @@ def test_preprocess_model_output_with_thinking_tags(minimax_tool_parser):
 {"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA"}}
 </tool_calls>"""
 
-    processed_output = minimax_tool_parser.preprocess_model_output(
-        model_output)
+    processed_output = minimax_tool_parser.preprocess_model_output(model_output)
 
     # The tool call within thinking tags should be removed
     assert "fake_tool" not in processed_output
@@ -244,12 +261,12 @@ def test_extract_tool_calls_with_thinking_tags(minimax_tool_parser):
 </tool_calls>"""
 
     extracted_tool_calls = minimax_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
 
     assert extracted_tool_calls.tools_called
     assert len(extracted_tool_calls.tool_calls) == 1
-    assert extracted_tool_calls.tool_calls[
-        0].function.name == "get_current_weather"
+    assert extracted_tool_calls.tool_calls[0].function.name == "get_current_weather"
 
     # Content extraction is based on the position of the first <tool_calls> in the original model_output
     # Since preprocessing removes tool calls within thinking tags, the actual first <tool_calls> is the external one
@@ -270,14 +287,14 @@ def test_extract_tool_calls_invalid_json(minimax_tool_parser):
 </tool_calls>"""
 
     extracted_tool_calls = minimax_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
 
     assert extracted_tool_calls.tools_called
     # Should extract only the valid JSON tool calls
     assert len(extracted_tool_calls.tool_calls) == 2
     assert extracted_tool_calls.tool_calls[0].function.name == "valid_tool"
-    assert extracted_tool_calls.tool_calls[
-        1].function.name == "another_valid_tool"
+    assert extracted_tool_calls.tool_calls[1].function.name == "another_valid_tool"
 
 
 def test_extract_tool_calls_missing_name_or_arguments(minimax_tool_parser):
@@ -290,14 +307,14 @@ def test_extract_tool_calls_missing_name_or_arguments(minimax_tool_parser):
 </tool_calls>"""
 
     extracted_tool_calls = minimax_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
 
     assert extracted_tool_calls.tools_called
     # Should extract only the valid tool calls with both name and arguments
     assert len(extracted_tool_calls.tool_calls) == 2
     assert extracted_tool_calls.tool_calls[0].function.name == "valid_tool"
-    assert extracted_tool_calls.tool_calls[
-        1].function.name == "another_valid_tool"
+    assert extracted_tool_calls.tool_calls[1].function.name == "another_valid_tool"
 
 
 def test_streaming_basic_functionality(minimax_tool_parser):
@@ -326,8 +343,7 @@ def test_streaming_basic_functionality(minimax_tool_parser):
 
     # The result might be None or contain tool call information
     # This depends on the internal state management
-    if result is not None and hasattr(result,
-                                      'tool_calls') and result.tool_calls:
+    if result is not None and hasattr(result, "tool_calls") and result.tool_calls:
         assert len(result.tool_calls) >= 0
 
 
@@ -352,7 +368,7 @@ def test_streaming_with_content_before_tool_calls(minimax_tool_parser):
         request=None,
     )
 
-    if result is not None and hasattr(result, 'content'):
+    if result is not None and hasattr(result, "content"):
         # Should contain some content
         assert result.content is not None
 
@@ -373,7 +389,7 @@ def test_streaming_no_tool_calls(minimax_tool_parser):
 
     # Should return the delta text as content
     assert result is not None
-    assert hasattr(result, 'content')
+    assert hasattr(result, "content")
     assert result.content == " without any tool calls."
 
 
@@ -399,8 +415,7 @@ def test_streaming_with_thinking_tags(minimax_tool_parser):
 
     # The preprocessing should remove tool calls from thinking tags
     # and only process the real tool call
-    if result is not None and hasattr(result,
-                                      'tool_calls') and result.tool_calls:
+    if result is not None and hasattr(result, "tool_calls") and result.tool_calls:
         for tool_call in result.tool_calls:
             assert tool_call.function.name != "ignored"
 
@@ -419,7 +434,8 @@ def test_extract_tool_calls_multiline_json_not_supported(minimax_tool_parser):
 </tool_calls>"""
 
     extracted_tool_calls = minimax_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
 
     # Multiline JSON is currently not supported, should return no tools called
     assert not extracted_tool_calls.tools_called
@@ -449,7 +465,7 @@ def test_streaming_arguments_incremental_output(minimax_tool_parser):
         '<tool_calls>\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}',
         # Stage 6: Tool calls closed
         '<tool_calls>\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}\n</tool',
-        '<tool_calls>\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}\n</tool_calls>'
+        '<tool_calls>\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}\n</tool_calls>',
     ]
 
     function_name_sent = False
@@ -457,8 +473,7 @@ def test_streaming_arguments_incremental_output(minimax_tool_parser):
 
     for i, current_text in enumerate(stages):
         previous_text = stages[i - 1] if i > 0 else ""
-        delta_text = current_text[len(previous_text
-                                      ):] if i > 0 else current_text
+        delta_text = current_text[len(previous_text) :] if i > 0 else current_text
 
         result = minimax_tool_parser.extract_tool_calls_streaming(
             previous_text=previous_text,
@@ -473,30 +488,27 @@ def test_streaming_arguments_incremental_output(minimax_tool_parser):
         print(f"Stage {i}: Current text: {repr(current_text)}")
         print(f"Stage {i}: Delta text: {repr(delta_text)}")
 
-        if result is not None and hasattr(result,
-                                          'tool_calls') and result.tool_calls:
+        if result is not None and hasattr(result, "tool_calls") and result.tool_calls:
             tool_call = result.tool_calls[0]
 
             # Check if function name is sent (should happen only once)
             if tool_call.function and tool_call.function.name:
                 assert tool_call.function.name == "get_current_weather"
                 function_name_sent = True
-                print(
-                    f"Stage {i}: Function name sent: {tool_call.function.name}"
-                )
+                print(f"Stage {i}: Function name sent: {tool_call.function.name}")
 
             # Check if arguments are sent incrementally
             if tool_call.function and tool_call.function.arguments:
                 args_fragment = tool_call.function.arguments
-                print(
-                    f"Stage {i}: Got arguments fragment: {repr(args_fragment)}"
-                )
+                print(f"Stage {i}: Got arguments fragment: {repr(args_fragment)}")
 
                 # For incremental output, each fragment should be new content only
                 # The fragment should not contain all previous content
                 if i >= 2 and previous_args_content:  # After we start getting arguments
                     # The new fragment should not be identical to or contain all previous content
-                    assert args_fragment != previous_args_content, f"Fragment should be incremental, not cumulative: {args_fragment}"
+                    assert args_fragment != previous_args_content, (
+                        f"Fragment should be incremental, not cumulative: {args_fragment}"
+                    )
 
                     # If this is truly incremental, the fragment should be relatively small
                     # compared to the complete arguments so far
@@ -520,7 +532,9 @@ def test_streaming_arguments_delta_only(minimax_tool_parser):
     minimax_tool_parser.streamed_args_for_tool = []
 
     # Simulate two consecutive calls with growing arguments
-    call1_text = '<tool_calls>\n{"name": "test_tool", "arguments": {"param1": "value1"}}'
+    call1_text = (
+        '<tool_calls>\n{"name": "test_tool", "arguments": {"param1": "value1"}}'
+    )
     call2_text = '<tool_calls>\n{"name": "test_tool", "arguments": {"param1": "value1", "param2": "value2"}}'
 
     print(f"Call 1 text: {repr(call1_text)}")
@@ -538,7 +552,7 @@ def test_streaming_arguments_delta_only(minimax_tool_parser):
     )
 
     print(f"Result 1: {result1}")
-    if result1 and hasattr(result1, 'tool_calls') and result1.tool_calls:
+    if result1 and hasattr(result1, "tool_calls") and result1.tool_calls:
         for i, tc in enumerate(result1.tool_calls):
             print(f"  Tool call {i}: {tc}")
 
@@ -554,13 +568,12 @@ def test_streaming_arguments_delta_only(minimax_tool_parser):
     )
 
     print(f"Result 2: {result2}")
-    if result2 and hasattr(result2, 'tool_calls') and result2.tool_calls:
+    if result2 and hasattr(result2, "tool_calls") and result2.tool_calls:
         for i, tc in enumerate(result2.tool_calls):
             print(f"  Tool call {i}: {tc}")
 
     # Verify the second call only returns the delta
-    if result2 is not None and hasattr(result2,
-                                       'tool_calls') and result2.tool_calls:
+    if result2 is not None and hasattr(result2, "tool_calls") and result2.tool_calls:
         tool_call = result2.tool_calls[0]
         if tool_call.function and tool_call.function.arguments:
             args_delta = tool_call.function.arguments
@@ -568,17 +581,21 @@ def test_streaming_arguments_delta_only(minimax_tool_parser):
 
             # Should only contain the new part, not the full arguments
             # The delta should be something like ', "param2": "value2"}' or just '"param2": "value2"'
-            assert ', "param2": "value2"}' in args_delta or '"param2": "value2"' in args_delta, f"Expected delta containing param2, got: {args_delta}"
+            assert (
+                ', "param2": "value2"}' in args_delta
+                or '"param2": "value2"' in args_delta
+            ), f"Expected delta containing param2, got: {args_delta}"
 
             # Should NOT contain the previous parameter data
-            assert '"param1": "value1"' not in args_delta, f"Arguments delta should not contain previous data: {args_delta}"
+            assert '"param1": "value1"' not in args_delta, (
+                f"Arguments delta should not contain previous data: {args_delta}"
+            )
 
             # The delta should be relatively short (incremental, not cumulative)
-            expected_max_length = len(
-                ', "param2": "value2"}') + 10  # Some tolerance
-            assert len(
-                args_delta
-            ) <= expected_max_length, f"Delta seems too long (possibly cumulative): {args_delta}"
+            expected_max_length = len(', "param2": "value2"}') + 10  # Some tolerance
+            assert len(args_delta) <= expected_max_length, (
+                f"Delta seems too long (possibly cumulative): {args_delta}"
+            )
 
             print("✓ Delta validation passed")
         else:
@@ -605,40 +622,39 @@ def test_streaming_openai_compatibility(minimax_tool_parser):
     # Test scenario: simple buffering without complex tool call context
     test_cases: list[dict[str, Any]] = [
         {
-            'stage': 'Token: <',
-            'previous': '',
-            'current': '<',
-            'delta': '<',
-            'expected_content': None,  # Should be buffered
+            "stage": "Token: <",
+            "previous": "",
+            "current": "<",
+            "delta": "<",
+            "expected_content": None,  # Should be buffered
         },
         {
-            'stage': 'Token: tool_calls>',
-            'previous': '<',
-            'current': '<tool_calls>',
-            'delta': 'tool_calls>',
-            'expected_content': None,  # Complete tag, should not output
+            "stage": "Token: tool_calls>",
+            "previous": "<",
+            "current": "<tool_calls>",
+            "delta": "tool_calls>",
+            "expected_content": None,  # Complete tag, should not output
         },
         {
-            'stage': 'Regular content',
-            'previous': 'Hello',
-            'current': 'Hello world',
-            'delta': ' world',
-            'expected_content': ' world',  # Normal content should pass through
+            "stage": "Regular content",
+            "previous": "Hello",
+            "current": "Hello world",
+            "delta": " world",
+            "expected_content": " world",  # Normal content should pass through
         },
         {
-            'stage': 'Content with end tag start',
-            'previous': 'Text',
-            'current': 'Text content</tool_',
-            'delta': ' content</tool_',
-            'expected_content':
-            ' content',  # Content part output, </tool_ buffered
+            "stage": "Content with end tag start",
+            "previous": "Text",
+            "current": "Text content</tool_",
+            "delta": " content</tool_",
+            "expected_content": " content",  # Content part output, </tool_ buffered
         },
         {
-            'stage': 'Complete end tag',
-            'previous': 'Text content</tool_',
-            'current': 'Text content</tool_calls>',
-            'delta': 'calls>',
-            'expected_content': None,  # Complete close tag, should not output
+            "stage": "Complete end tag",
+            "previous": "Text content</tool_",
+            "current": "Text content</tool_calls>",
+            "delta": "calls>",
+            "expected_content": None,  # Complete close tag, should not output
         },
     ]
 
@@ -649,9 +665,9 @@ def test_streaming_openai_compatibility(minimax_tool_parser):
         print(f"Delta:    {repr(test_case['delta'])}")
 
         result = minimax_tool_parser.extract_tool_calls_streaming(
-            previous_text=test_case['previous'],
-            current_text=test_case['current'],
-            delta_text=test_case['delta'],
+            previous_text=test_case["previous"],
+            current_text=test_case["current"],
+            delta_text=test_case["delta"],
             previous_token_ids=[],
             current_token_ids=[],
             delta_token_ids=[],
@@ -661,15 +677,18 @@ def test_streaming_openai_compatibility(minimax_tool_parser):
         print(f"Result: {result}")
 
         # Check expected content
-        if test_case['expected_content'] is None:
-            assert result is None or not getattr(result, 'content', None), \
+        if test_case["expected_content"] is None:
+            assert result is None or not getattr(result, "content", None), (
                 f"Stage {i}: Expected no content, got {result}"
+            )
             print("✓ No content output as expected")
         else:
-            assert result is not None and hasattr(result, 'content'), \
+            assert result is not None and hasattr(result, "content"), (
                 f"Stage {i}: Expected content, got {result}"
-            assert result.content == test_case['expected_content'], \
+            )
+            assert result.content == test_case["expected_content"], (
                 f"Stage {i}: Expected content {test_case['expected_content']}, got {result.content}"
+            )
             print(f"✓ Content matches: {repr(result.content)}")
 
     print("✓ Streaming test with buffering completed successfully")
@@ -690,35 +709,26 @@ def test_streaming_thinking_tag_buffering(minimax_tool_parser):
     # Test scenario: tool calls within thinking tags should be ignored
     test_cases: list[dict[str, Any]] = [
         {
-            'stage': 'Start thinking',
-            'previous': '',
-            'current': '<think>I need to use a tool. <tool_calls>',
-            'delta': '<think>I need to use a tool. <tool_calls>',
-            'expected_content':
-            '<think>I need to use a tool. <tool_calls>',  # Should pass through as content
+            "stage": "Start thinking",
+            "previous": "",
+            "current": "<think>I need to use a tool. <tool_calls>",
+            "delta": "<think>I need to use a tool. <tool_calls>",
+            "expected_content": "<think>I need to use a tool. <tool_calls>",  # Should pass through as content
         },
         {
-            'stage':
-            'Tool call in thinking',
-            'previous':
-            '<think>I need to use a tool. <tool_calls>',
-            'current':
-            '<think>I need to use a tool. <tool_calls>\n{"name": "ignored_tool", "arguments": {"param": "value"}}\n</tool_calls>',
-            'delta':
-            '\n{"name": "ignored_tool", "arguments": {"param": "value"}}\n</tool_calls>',
-            'expected_content':
-            '\n{"name": "ignored_tool", "arguments": {"param": "value"}}\n</tool_calls>',  # </tool_calls> should be preserved in thinking tags
+            "stage": "Tool call in thinking",
+            "previous": "<think>I need to use a tool. <tool_calls>",
+            "current": '<think>I need to use a tool. <tool_calls>\n{"name": "ignored_tool", "arguments": {"param": "value"}}\n</tool_calls>',
+            "delta": '\n{"name": "ignored_tool", "arguments": {"param": "value"}}\n</tool_calls>',
+            "expected_content": '\n{"name": "ignored_tool", "arguments": {"param": "value"}}\n</tool_calls>',  # </tool_calls> should be preserved in thinking tags
         },
         {
-            'stage': 'Real tool call after thinking',
-            'previous':
-            '<think>I need to use a tool. <tool_calls>\n{"name": "ignored_tool", "arguments": {"param": "value"}}\n</tool_calls></think>',
-            'current':
-            '<think>I need to use a tool. <tool_calls>\n{"name": "ignored_tool", "arguments": {"param": "value"}}\n</tool_calls></think>\n<tool_calls>',
-            'delta': '\n<tool_calls>',
-            'expected_content':
-            '\n',  # Should output '\n' and suppress <tool_calls>
-        }
+            "stage": "Real tool call after thinking",
+            "previous": '<think>I need to use a tool. <tool_calls>\n{"name": "ignored_tool", "arguments": {"param": "value"}}\n</tool_calls></think>',
+            "current": '<think>I need to use a tool. <tool_calls>\n{"name": "ignored_tool", "arguments": {"param": "value"}}\n</tool_calls></think>\n<tool_calls>',
+            "delta": "\n<tool_calls>",
+            "expected_content": "\n",  # Should output '\n' and suppress <tool_calls>
+        },
     ]
 
     for i, test_case in enumerate(test_cases):
@@ -728,9 +738,9 @@ def test_streaming_thinking_tag_buffering(minimax_tool_parser):
         print(f"Delta:    {repr(test_case['delta'])}")
 
         result = minimax_tool_parser.extract_tool_calls_streaming(
-            previous_text=test_case['previous'],
-            current_text=test_case['current'],
-            delta_text=test_case['delta'],
+            previous_text=test_case["previous"],
+            current_text=test_case["current"],
+            delta_text=test_case["delta"],
             previous_token_ids=[],
             current_token_ids=[],
             delta_token_ids=[],
@@ -740,25 +750,32 @@ def test_streaming_thinking_tag_buffering(minimax_tool_parser):
         print(f"Result: {result}")
 
         # Check expected content
-        if 'expected_content' in test_case:
-            if test_case['expected_content'] is None:
-                assert result is None or not getattr(result, 'content', None), \
+        if "expected_content" in test_case:
+            if test_case["expected_content"] is None:
+                assert result is None or not getattr(result, "content", None), (
                     f"Stage {i}: Expected no content, got {result}"
+                )
             else:
-                assert result is not None and hasattr(result, 'content'), \
+                assert result is not None and hasattr(result, "content"), (
                     f"Stage {i}: Expected content, got {result}"
-                assert result.content == test_case['expected_content'], \
+                )
+                assert result.content == test_case["expected_content"], (
                     f"Stage {i}: Expected content {test_case['expected_content']}, got {result.content}"
+                )
                 print(f"✓ Content matches: {repr(result.content)}")
 
         # Check tool calls
-        if test_case.get('expected_tool_call'):
-            assert result is not None and hasattr(result, 'tool_calls') and result.tool_calls, \
-                f"Stage {i}: Expected tool call, got {result}"
+        if test_case.get("expected_tool_call"):
+            assert (
+                result is not None
+                and hasattr(result, "tool_calls")
+                and result.tool_calls
+            ), f"Stage {i}: Expected tool call, got {result}"
 
             tool_call = result.tool_calls[0]
-            assert tool_call.function.name == "real_tool", \
+            assert tool_call.function.name == "real_tool", (
                 f"Expected real_tool, got {tool_call.function.name}"
+            )
             print(f"✓ Real tool call detected: {tool_call.function.name}")
 
     print("✓ Thinking tag buffering test completed successfully")
@@ -784,104 +801,79 @@ def test_streaming_complex_scenario_with_multiple_tools(minimax_tool_parser):
     # Complex scenario: tools inside thinking tags and multiple tools in one group
     test_stages: list[dict[str, Any]] = [
         {
-            'stage': 'Initial content',
-            'previous': '',
-            'current': 'Let me help you with this task.',
-            'delta': 'Let me help you with this task.',
-            'expected_content': 'Let me help you with this task.',
-            'expected_tool_calls': 0,
+            "stage": "Initial content",
+            "previous": "",
+            "current": "Let me help you with this task.",
+            "delta": "Let me help you with this task.",
+            "expected_content": "Let me help you with this task.",
+            "expected_tool_calls": 0,
         },
         {
-            'stage': 'Start thinking tag',
-            'previous': 'Let me help you with this task.',
-            'current':
-            'Let me help you with this task.<think>I need to analyze this situation first.',
-            'delta': '<think>I need to analyze this situation first.',
-            'expected_content':
-            '<think>I need to analyze this situation first.',
-            'expected_tool_calls': 0,
+            "stage": "Start thinking tag",
+            "previous": "Let me help you with this task.",
+            "current": "Let me help you with this task.<think>I need to analyze this situation first.",
+            "delta": "<think>I need to analyze this situation first.",
+            "expected_content": "<think>I need to analyze this situation first.",
+            "expected_tool_calls": 0,
         },
         {
-            'stage': 'Tool call inside thinking tag starts',
-            'previous':
-            'Let me help you with this task.<think>I need to analyze this situation first.',
-            'current':
-            'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>',
-            'delta': '<tool_calls>',
-            'expected_content':
-            '<tool_calls>',  # Inside thinking tags, tool tags should be preserved as content
-            'expected_tool_calls': 0,
+            "stage": "Tool call inside thinking tag starts",
+            "previous": "Let me help you with this task.<think>I need to analyze this situation first.",
+            "current": "Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>",
+            "delta": "<tool_calls>",
+            "expected_content": "<tool_calls>",  # Inside thinking tags, tool tags should be preserved as content
+            "expected_tool_calls": 0,
         },
         {
-            'stage': 'Complete tool call inside thinking tag',
-            'previous':
-            'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>',
-            'current':
-            'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls>',
-            'delta':
-            '\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls>',
-            'expected_content':
-            '\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls>',
-            'expected_tool_calls':
-            0,  # Tools inside thinking tags should be ignored
+            "stage": "Complete tool call inside thinking tag",
+            "previous": "Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>",
+            "current": 'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls>',
+            "delta": '\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls>',
+            "expected_content": '\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls>',
+            "expected_tool_calls": 0,  # Tools inside thinking tags should be ignored
         },
         {
-            'stage': 'End thinking tag',
-            'previous':
-            'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls>',
-            'current':
-            'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>',
-            'delta': '</think>',
-            'expected_content': '</think>',
-            'expected_tool_calls': 0,
+            "stage": "End thinking tag",
+            "previous": 'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls>',
+            "current": 'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>',
+            "delta": "</think>",
+            "expected_content": "</think>",
+            "expected_tool_calls": 0,
         },
         {
-            'stage': 'Multiple tools group starts',
-            'previous':
-            'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>',
-            'current':
-            'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>\nNow I need to get weather information and calculate area.<tool_calls>',
-            'delta':
-            '\nNow I need to get weather information and calculate area.<tool_calls>',
-            'expected_content':
-            '\nNow I need to get weather information and calculate area.',  # <tool_calls> should be filtered
-            'expected_tool_calls': 0,
+            "stage": "Multiple tools group starts",
+            "previous": 'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>',
+            "current": 'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>\nNow I need to get weather information and calculate area.<tool_calls>',
+            "delta": "\nNow I need to get weather information and calculate area.<tool_calls>",
+            "expected_content": "\nNow I need to get weather information and calculate area.",  # <tool_calls> should be filtered
+            "expected_tool_calls": 0,
         },
         {
-            'stage': 'First tool in group',
-            'previous':
-            'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>\nNow I need to get weather information and calculate area.<tool_calls>',
-            'current':
-            'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>\nNow I need to get weather information and calculate area.<tool_calls>\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}',
-            'delta':
-            '\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}',
-            'expected_content':
-            None,  # No content should be output when tool call is in progress
-            'expected_tool_calls': 1,
-            'expected_tool_name': 'get_current_weather',
+            "stage": "First tool in group",
+            "previous": 'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>\nNow I need to get weather information and calculate area.<tool_calls>',
+            "current": 'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>\nNow I need to get weather information and calculate area.<tool_calls>\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}',
+            "delta": '\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}',
+            "expected_content": None,  # No content should be output when tool call is in progress
+            "expected_tool_calls": 1,
+            "expected_tool_name": "get_current_weather",
         },
         {
-            'stage': 'Second tool in group',
-            'previous':
-            'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>\nNow I need to get weather information and calculate area.<tool_calls>\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}',
-            'current':
-            'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>\nNow I need to get weather information and calculate area.<tool_calls>\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}\n{"name": "calculate_area", "arguments": {"shape": "rectangle", "dimensions": {"width": 10, "height": 5}}}',
-            'delta':
-            '\n{"name": "calculate_area", "arguments": {"shape": "rectangle", "dimensions": {"width": 10, "height": 5}}}',
-            'expected_content': None,
-            'expected_tool_calls': 1,
-            'expected_tool_name': 'calculate_area',
+            "stage": "Second tool in group",
+            "previous": 'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>\nNow I need to get weather information and calculate area.<tool_calls>\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}',
+            "current": 'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>\nNow I need to get weather information and calculate area.<tool_calls>\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}\n{"name": "calculate_area", "arguments": {"shape": "rectangle", "dimensions": {"width": 10, "height": 5}}}',
+            "delta": '\n{"name": "calculate_area", "arguments": {"shape": "rectangle", "dimensions": {"width": 10, "height": 5}}}',
+            "expected_content": None,
+            "expected_tool_calls": 1,
+            "expected_tool_name": "calculate_area",
         },
         {
-            'stage': 'Complete tool calls group',
-            'previous':
-            'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>\nNow I need to get weather information and calculate area.<tool_calls>\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}\n{"name": "calculate_area", "arguments": {"shape": "rectangle", "dimensions": {"width": 10, "height": 5}}}',
-            'current':
-            'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>\nNow I need to get weather information and calculate area.<tool_calls>\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}\n{"name": "calculate_area", "arguments": {"shape": "rectangle", "dimensions": {"width": 10, "height": 5}}}</tool_calls>',
-            'delta': '</tool_calls>',
-            'expected_content': None,
-            'expected_tool_calls': 0,
-        }
+            "stage": "Complete tool calls group",
+            "previous": 'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>\nNow I need to get weather information and calculate area.<tool_calls>\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}\n{"name": "calculate_area", "arguments": {"shape": "rectangle", "dimensions": {"width": 10, "height": 5}}}',
+            "current": 'Let me help you with this task.<think>I need to analyze this situation first.<tool_calls>\n{"name": "internal_analysis", "arguments": {"query": "analyze situation"}}\n</tool_calls></think>\nNow I need to get weather information and calculate area.<tool_calls>\n{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}\n{"name": "calculate_area", "arguments": {"shape": "rectangle", "dimensions": {"width": 10, "height": 5}}}</tool_calls>',
+            "delta": "</tool_calls>",
+            "expected_content": None,
+            "expected_tool_calls": 0,
+        },
     ]
 
     tool_calls_count = 0
@@ -895,9 +887,9 @@ def test_streaming_complex_scenario_with_multiple_tools(minimax_tool_parser):
         print(f"Delta:    {repr(test_case['delta'])}")
 
         result = minimax_tool_parser.extract_tool_calls_streaming(
-            previous_text=test_case['previous'],
-            current_text=test_case['current'],
-            delta_text=test_case['delta'],
+            previous_text=test_case["previous"],
+            current_text=test_case["current"],
+            delta_text=test_case["delta"],
             previous_token_ids=[],
             current_token_ids=[],
             delta_token_ids=[],
@@ -907,53 +899,64 @@ def test_streaming_complex_scenario_with_multiple_tools(minimax_tool_parser):
         print(f"Result: {result}")
 
         # Check expected content
-        if test_case['expected_content'] is None:
-            assert result is None or not getattr(result, 'content', None), \
+        if test_case["expected_content"] is None:
+            assert result is None or not getattr(result, "content", None), (
                 f"Stage {i}: Expected no content output, got {result}"
+            )
             print("✓ No content output as expected")
         else:
-            assert result is not None and hasattr(result, 'content'), \
+            assert result is not None and hasattr(result, "content"), (
                 f"Stage {i}: Expected content output, got {result}"
-            assert result.content == test_case['expected_content'], \
+            )
+            assert result.content == test_case["expected_content"], (
                 f"Stage {i}: Expected content {repr(test_case['expected_content'])}, got {repr(result.content)}"
+            )
             print(f"✓ Content matches: {repr(result.content)}")
 
         # Check tool calls
-        expected_tool_calls = test_case['expected_tool_calls']
-        actual_tool_calls = len(result.tool_calls) if result and hasattr(
-            result, 'tool_calls') and result.tool_calls else 0
+        expected_tool_calls = test_case["expected_tool_calls"]
+        actual_tool_calls = (
+            len(result.tool_calls)
+            if result and hasattr(result, "tool_calls") and result.tool_calls
+            else 0
+        )
 
         if expected_tool_calls > 0:
-            assert actual_tool_calls >= expected_tool_calls, \
+            assert actual_tool_calls >= expected_tool_calls, (
                 f"Stage {i}: Expected at least {expected_tool_calls} tool calls, got {actual_tool_calls}"
+            )
 
-            if 'expected_tool_name' in test_case:
+            if "expected_tool_name" in test_case:
                 # Find the tool call with the expected name
                 found_tool_call = None
                 for tool_call in result.tool_calls:
-                    if tool_call.function.name == test_case[
-                            'expected_tool_name']:
+                    if tool_call.function.name == test_case["expected_tool_name"]:
                         found_tool_call = tool_call
                         break
 
-                assert found_tool_call is not None, \
+                assert found_tool_call is not None, (
                     f"Stage {i}: Expected tool name {test_case['expected_tool_name']} not found in tool calls: {[tc.function.name for tc in result.tool_calls]}"
+                )
                 print(f"✓ Tool call correct: {found_tool_call.function.name}")
 
                 # Ensure tools inside thinking tags are not called
-                assert found_tool_call.function.name != "internal_analysis", \
+                assert found_tool_call.function.name != "internal_analysis", (
                     f"Stage {i}: Tool 'internal_analysis' inside thinking tags should not be called"
+                )
 
             tool_calls_count += actual_tool_calls
             print(f"✓ Detected {actual_tool_calls} tool calls")
         else:
-            assert actual_tool_calls == 0, \
+            assert actual_tool_calls == 0, (
                 f"Stage {i}: Expected no tool calls, got {actual_tool_calls}"
+            )
 
     # Verify overall results
     print("\n=== Test Summary ===")
     print(f"Total tool calls count: {tool_calls_count}")
-    assert tool_calls_count >= 2, f"Expected at least 2 valid tool calls (outside thinking tags), but got {tool_calls_count}"
+    assert tool_calls_count >= 2, (
+        f"Expected at least 2 valid tool calls (outside thinking tags), but got {tool_calls_count}"
+    )
 
     print("✓ Complex streaming test completed:")
     print("  - ✓ Tools inside thinking tags correctly ignored")
@@ -987,8 +990,8 @@ def test_streaming_character_by_character_output(minimax_tool_parser):
     # Stream character by character
     for i in range(1, len(complete_text) + 1):
         current_text = complete_text[:i]
-        previous_text = complete_text[:i - 1] if i > 1 else ""
-        delta_text = complete_text[i - 1:i]
+        previous_text = complete_text[: i - 1] if i > 1 else ""
+        delta_text = complete_text[i - 1 : i]
 
         # Show progress every 50 characters
         if i % 50 == 0 or i == len(complete_text):
@@ -1007,36 +1010,35 @@ def test_streaming_character_by_character_output(minimax_tool_parser):
 
         # Collect results
         if result is not None:
-            if hasattr(result, 'content') and result.content:
+            if hasattr(result, "content") and result.content:
                 content_fragments.append(result.content)
                 # Log important content fragments
                 if any(
-                        keyword in result.content for keyword in
-                    ['<think>', '</think>', '<tool_calls>', '</tool_calls>']):
-                    print(
-                        f"  Char {i}: Content fragment: {repr(result.content)}"
-                    )
-
-            if hasattr(result, 'tool_calls') and result.tool_calls:
+                    keyword in result.content
+                    for keyword in [
+                        "<think>",
+                        "</think>",
+                        "<tool_calls>",
+                        "</tool_calls>",
+                    ]
+                ):
+                    print(f"  Char {i}: Content fragment: {repr(result.content)}")
+
+            if hasattr(result, "tool_calls") and result.tool_calls:
                 for tool_call in result.tool_calls:
                     tool_info = {
-                        'character_position':
-                        i,
-                        'function_name':
-                        tool_call.function.name
-                        if tool_call.function else None,
-                        'arguments':
-                        tool_call.function.arguments
-                        if tool_call.function else None,
+                        "character_position": i,
+                        "function_name": tool_call.function.name
+                        if tool_call.function
+                        else None,
+                        "arguments": tool_call.function.arguments
+                        if tool_call.function
+                        else None,
                     }
                     tool_calls_detected.append(tool_info)
-                    print(
-                        f"  Char {i}: Tool call detected: {tool_call.function.name}"
-                    )
+                    print(f"  Char {i}: Tool call detected: {tool_call.function.name}")
                     if tool_call.function.arguments:
-                        print(
-                            f"    Arguments: {repr(tool_call.function.arguments)}"
-                        )
+                        print(f"    Arguments: {repr(tool_call.function.arguments)}")
 
     # Verify results
     print("\n=== Streaming Test Results ===")
@@ -1044,68 +1046,74 @@ def test_streaming_character_by_character_output(minimax_tool_parser):
     print(f"Total tool calls detected: {len(tool_calls_detected)}")
 
     # Reconstruct content from fragments
-    reconstructed_content = ''.join(content_fragments)
+    reconstructed_content = "".join(content_fragments)
     print(f"Reconstructed content length: {len(reconstructed_content)}")
 
     # Verify thinking tags content is preserved
-    assert '<think>' in reconstructed_content, "Opening thinking tag should be preserved in content"
-    assert '</think>' in reconstructed_content, "Closing thinking tag should be preserved in content"
+    assert "<think>" in reconstructed_content, (
+        "Opening thinking tag should be preserved in content"
+    )
+    assert "</think>" in reconstructed_content, (
+        "Closing thinking tag should be preserved in content"
+    )
 
     # Verify that tool calls inside thinking tags are NOT extracted as actual tool calls
     thinking_tool_calls = [
-        tc for tc in tool_calls_detected
-        if tc['function_name'] == 'internal_analysis'
+        tc for tc in tool_calls_detected if tc["function_name"] == "internal_analysis"
     ]
-    assert len(
-        thinking_tool_calls
-    ) == 0, f"Tool calls inside thinking tags should be ignored, but found: {thinking_tool_calls}"
+    assert len(thinking_tool_calls) == 0, (
+        f"Tool calls inside thinking tags should be ignored, but found: {thinking_tool_calls}"
+    )
 
     # Verify that real tool calls outside thinking tags ARE extracted
     weather_tool_calls = [
-        tc for tc in tool_calls_detected
-        if tc['function_name'] == 'get_current_weather'
+        tc for tc in tool_calls_detected if tc["function_name"] == "get_current_weather"
     ]
     area_tool_calls = [
-        tc for tc in tool_calls_detected
-        if tc['function_name'] == 'calculate_area'
+        tc for tc in tool_calls_detected if tc["function_name"] == "calculate_area"
     ]
     print(tool_calls_detected)
-    assert len(weather_tool_calls
-               ) > 0, "get_current_weather tool call should be detected"
-    assert len(
-        area_tool_calls) > 0, "calculate_area tool call should be detected"
+    assert len(weather_tool_calls) > 0, (
+        "get_current_weather tool call should be detected"
+    )
+    assert len(area_tool_calls) > 0, "calculate_area tool call should be detected"
 
     # Verify tool call arguments are properly streamed
-    weather_args_found = any(tc['arguments'] for tc in weather_tool_calls
-                             if tc['arguments'])
-    area_args_found = any(tc['arguments'] for tc in area_tool_calls
-                          if tc['arguments'])
+    weather_args_found = any(
+        tc["arguments"] for tc in weather_tool_calls if tc["arguments"]
+    )
+    area_args_found = any(tc["arguments"] for tc in area_tool_calls if tc["arguments"])
 
     print(f"Weather tool call with arguments: {weather_args_found}")
     print(f"Area tool call with arguments: {area_args_found}")
 
     # Verify content before and after tool calls
-    assert 'I\'ll help you with the weather analysis.' in reconstructed_content, "Initial content should be preserved"
-    assert 'Here are the results.' in reconstructed_content, "Final content should be preserved"
+    assert "I'll help you with the weather analysis." in reconstructed_content, (
+        "Initial content should be preserved"
+    )
+    assert "Here are the results." in reconstructed_content, (
+        "Final content should be preserved"
+    )
 
     # Verify that <tool_calls> and </tool_calls> tags are not included in the final content
     # (they should be filtered out when not inside thinking tags)
     content_outside_thinking = reconstructed_content
     # Remove thinking tag content to check content outside
-    if '<think>' in content_outside_thinking and '</think>' in content_outside_thinking:
-        start_think = content_outside_thinking.find('<think>')
-        end_think = content_outside_thinking.find('</think>') + len('</think>')
-        content_outside_thinking = content_outside_thinking[:
-                                                            start_think] + content_outside_thinking[
-                                                                end_think:]
+    if "<think>" in content_outside_thinking and "</think>" in content_outside_thinking:
+        start_think = content_outside_thinking.find("<think>")
+        end_think = content_outside_thinking.find("</think>") + len("</think>")
+        content_outside_thinking = (
+            content_outside_thinking[:start_think]
+            + content_outside_thinking[end_think:]
+        )
 
     # Outside thinking tags, tool_calls tags should be filtered
-    tool_calls_in_content = content_outside_thinking.count('<tool_calls>')
-    assert tool_calls_in_content == 0, f"<tool_calls> tags should be filtered from content outside thinking tags, but found {tool_calls_in_content}"
-
-    print(
-        "\n=== Character-by-character streaming test completed successfully ==="
+    tool_calls_in_content = content_outside_thinking.count("<tool_calls>")
+    assert tool_calls_in_content == 0, (
+        f"<tool_calls> tags should be filtered from content outside thinking tags, but found {tool_calls_in_content}"
     )
+
+    print("\n=== Character-by-character streaming test completed successfully ===")
     print("✓ Tool calls inside thinking tags correctly ignored")
     print("✓ Tool calls outside thinking tags correctly detected")
     print("✓ Content properly streamed and reconstructed")
@@ -1113,8 +1121,7 @@ def test_streaming_character_by_character_output(minimax_tool_parser):
     print("✓ Character-level streaming works correctly")
 
 
-def test_streaming_character_by_character_simple_tool_call(
-        minimax_tool_parser):
+def test_streaming_character_by_character_simple_tool_call(minimax_tool_parser):
     """Test character-by-character streaming for a simple tool call scenario."""
     # Reset streaming state
     reset_streaming_state(minimax_tool_parser)
@@ -1131,8 +1138,8 @@ def test_streaming_character_by_character_simple_tool_call(
 
     for i in range(1, len(simple_text) + 1):
         current_text = simple_text[:i]
-        previous_text = simple_text[:i - 1] if i > 1 else ""
-        delta_text = simple_text[i - 1:i]
+        previous_text = simple_text[: i - 1] if i > 1 else ""
+        delta_text = simple_text[i - 1 : i]
 
         result = minimax_tool_parser.extract_tool_calls_streaming(
             previous_text=previous_text,
@@ -1145,19 +1152,17 @@ def test_streaming_character_by_character_simple_tool_call(
         )
 
         if result:
-            if hasattr(result, 'content') and result.content:
+            if hasattr(result, "content") and result.content:
                 content_parts.append(result.content)
                 print(
                     f"  Char {i} ({repr(delta_text)}): Content: {repr(result.content)}"
                 )
 
-            if hasattr(result, 'tool_calls') and result.tool_calls:
+            if hasattr(result, "tool_calls") and result.tool_calls:
                 for tool_call in result.tool_calls:
                     if tool_call.function and tool_call.function.name:
                         tool_name_sent = True
-                        print(
-                            f"  Char {i}: Tool name: {tool_call.function.name}"
-                        )
+                        print(f"  Char {i}: Tool name: {tool_call.function.name}")
                     if tool_call.function and tool_call.function.arguments:
                         tool_args_sent = True
                         print(
@@ -1165,12 +1170,14 @@ def test_streaming_character_by_character_simple_tool_call(
                         )
 
     # Verify basic expectations
-    reconstructed_content = ''.join(content_parts)
+    reconstructed_content = "".join(content_parts)
     print(f"Final reconstructed content: {repr(reconstructed_content)}")
 
     assert tool_name_sent, "Tool name should be sent during streaming"
     assert tool_args_sent, "Tool arguments should be sent during streaming"
-    assert "Let me check the weather." in reconstructed_content, "Initial content should be preserved"
+    assert "Let me check the weather." in reconstructed_content, (
+        "Initial content should be preserved"
+    )
 
     print("✓ Simple character-by-character test passed")
 
@@ -1190,8 +1197,8 @@ def test_streaming_character_by_character_with_buffering(minimax_tool_parser):
 
     for i in range(1, len(buffering_text) + 1):
         current_text = buffering_text[:i]
-        previous_text = buffering_text[:i - 1] if i > 1 else ""
-        delta_text = buffering_text[i - 1:i]
+        previous_text = buffering_text[: i - 1] if i > 1 else ""
+        delta_text = buffering_text[i - 1 : i]
 
         result = minimax_tool_parser.extract_tool_calls_streaming(
             previous_text=previous_text,
@@ -1203,16 +1210,18 @@ def test_streaming_character_by_character_with_buffering(minimax_tool_parser):
             request=None,
         )
 
-        if result and hasattr(result, 'content') and result.content:
+        if result and hasattr(result, "content") and result.content:
             all_content.append(result.content)
             print(f"  Char {i} ({repr(delta_text)}): {repr(result.content)}")
 
-    final_content = ''.join(all_content)
+    final_content = "".join(all_content)
     print(f"Final content: {repr(final_content)}")
 
     # The parser should handle the edge case where </tool_calls> appears before <tool_calls>
     assert "Hello" in final_content, "Initial 'Hello' should be preserved"
-    assert "world" in final_content, "Content after false closing tag should be preserved"
+    assert "world" in final_content, (
+        "Content after false closing tag should be preserved"
+    )
     assert "done" in final_content, "Final content should be preserved"
 
     print("✓ Buffering character-by-character test passed")
diff --git a/tests/tool_use/test_openai_tool_parser.py b/tests/tool_use/test_openai_tool_parser.py
index 2551c41c6275..f6223f3fdce4 100644
--- a/tests/tool_use/test_openai_tool_parser.py
+++ b/tests/tool_use/test_openai_tool_parser.py
@@ -4,9 +4,15 @@
 import json
 
 import pytest
-from openai_harmony import (Conversation, DeveloperContent,
-                            HarmonyEncodingName, Message, Role, SystemContent,
-                            load_harmony_encoding)
+from openai_harmony import (
+    Conversation,
+    DeveloperContent,
+    HarmonyEncodingName,
+    Message,
+    Role,
+    SystemContent,
+    load_harmony_encoding,
+)
 
 from vllm.entrypoints.openai.protocol import FunctionCall, ToolCall
 from vllm.entrypoints.openai.tool_parsers import OpenAIToolParser
@@ -37,8 +43,9 @@ def assert_tool_calls(
 ):
     assert len(actual_tool_calls) == len(expected_tool_calls)
 
-    for actual_tool_call, expected_tool_call in zip(actual_tool_calls,
-                                                    expected_tool_calls):
+    for actual_tool_call, expected_tool_call in zip(
+        actual_tool_calls, expected_tool_calls
+    ):
         assert isinstance(actual_tool_call.id, str)
         assert len(actual_tool_call.id) > 16  # Default from protocol.py
         assert actual_tool_call.type == "function"
@@ -46,20 +53,25 @@ def assert_tool_calls(
 
 
 def test_extract_tool_calls_no_tools(openai_tool_parser, harmony_encoding):
-    convo = Conversation.from_messages([
-        Message.from_role_and_content(
-            Role.SYSTEM,
-            SystemContent.new(),
-        ),
-        Message.from_role_and_content(
-            Role.DEVELOPER,
-            DeveloperContent.new().with_instructions("Talk like a pirate!")),
-        Message.from_role_and_content(Role.USER, "Arrr, how be you?"),
-        Message.from_role_and_content(Role.ASSISTANT,
-                                      "This is a test").with_channel("final")
-    ])
+    convo = Conversation.from_messages(
+        [
+            Message.from_role_and_content(
+                Role.SYSTEM,
+                SystemContent.new(),
+            ),
+            Message.from_role_and_content(
+                Role.DEVELOPER,
+                DeveloperContent.new().with_instructions("Talk like a pirate!"),
+            ),
+            Message.from_role_and_content(Role.USER, "Arrr, how be you?"),
+            Message.from_role_and_content(
+                Role.ASSISTANT, "This is a test"
+            ).with_channel("final"),
+        ]
+    )
     token_ids = harmony_encoding.render_conversation_for_completion(
-        convo, Role.ASSISTANT)
+        convo, Role.ASSISTANT
+    )
     extracted_info = openai_tool_parser.extract_tool_calls(
         "",
         request=None,
@@ -70,26 +82,32 @@ def test_extract_tool_calls_no_tools(openai_tool_parser, harmony_encoding):
     assert extracted_info.content == "This is a test"
 
 
-@pytest.mark.parametrize("tool_args", [
-    '{"location": "Tokyo"}',
-    '{\n"location": "Tokyo"\n}',
-])
-def test_extract_tool_calls_single_tool(openai_tool_parser, harmony_encoding,
-                                        tool_args):
-    convo = Conversation.from_messages([
-        Message.from_role_and_content(Role.USER,
-                                      "What is the weather in Tokyo?"),
-        Message.from_role_and_content(
-            Role.ASSISTANT,
-            'User asks: "What is the weather in Tokyo?" We need to use get_current_weather tool.',  #  noqa: E501
-        ).with_channel("analysis"),
-        Message.from_role_and_content(
-            Role.ASSISTANT,
-            tool_args).with_channel("commentary").with_recipient(
-                "functions.get_current_weather").with_content_type("json"),
-    ])
+@pytest.mark.parametrize(
+    "tool_args",
+    [
+        '{"location": "Tokyo"}',
+        '{\n"location": "Tokyo"\n}',
+    ],
+)
+def test_extract_tool_calls_single_tool(
+    openai_tool_parser, harmony_encoding, tool_args
+):
+    convo = Conversation.from_messages(
+        [
+            Message.from_role_and_content(Role.USER, "What is the weather in Tokyo?"),
+            Message.from_role_and_content(
+                Role.ASSISTANT,
+                'User asks: "What is the weather in Tokyo?" We need to use get_current_weather tool.',  #  noqa: E501
+            ).with_channel("analysis"),
+            Message.from_role_and_content(Role.ASSISTANT, tool_args)
+            .with_channel("commentary")
+            .with_recipient("functions.get_current_weather")
+            .with_content_type("json"),
+        ]
+    )
     token_ids = harmony_encoding.render_conversation_for_completion(
-        convo, Role.ASSISTANT)
+        convo, Role.ASSISTANT
+    )
 
     extracted_info = openai_tool_parser.extract_tool_calls(
         "",
@@ -98,10 +116,12 @@ def test_extract_tool_calls_single_tool(openai_tool_parser, harmony_encoding,
     )
     assert extracted_info.tools_called
     expected_tool_calls = [
-        ToolCall(function=FunctionCall(
-            name="get_current_weather",
-            arguments=json.dumps({"location": "Tokyo"}),
-        ))
+        ToolCall(
+            function=FunctionCall(
+                name="get_current_weather",
+                arguments=json.dumps({"location": "Tokyo"}),
+            )
+        )
     ]
     assert_tool_calls(extracted_info.tool_calls, expected_tool_calls)
     assert extracted_info.content is None
@@ -111,33 +131,39 @@ def test_extract_tool_calls_multiple_tools(
     openai_tool_parser,
     harmony_encoding,
 ):
-    convo = Conversation.from_messages([
-        Message.from_role_and_content(
-            Role.USER, "What is the weather in Tokyo based on where I'm at?"),
-        Message.from_role_and_content(
-            Role.ASSISTANT,
-            'User asks: "What is the weather in Tokyo?" based on their location. We need to use get_current_weather tool and get_user_location tool.',  #  noqa: E501
-        ).with_channel("analysis"),
-        Message.from_role_and_content(
-            Role.ASSISTANT,
-            '{"location": "Tokyo"}').with_channel("commentary").with_recipient(
-                "functions.get_current_weather").with_content_type("json"),
-        Message.from_role_and_content(
-            Role.ASSISTANT,
-            '{"location": "Tokyo"}').with_channel("commentary").with_recipient(
-                "functions.get_user_location").with_content_type("json"),
-        Message.from_role_and_content(
-            Role.ASSISTANT, '{"location": "Tokyo"}').with_channel(
-                "commentary").with_recipient("functions.no_content_type"),
-        Message.from_role_and_content(Role.ASSISTANT, "foo").with_channel(
-            "commentary").with_recipient("functions.not_json_no_content_type"),
-        Message.from_role_and_content(
-            Role.ASSISTANT, '{}').with_channel("commentary").with_recipient(
-                "functions.empty_args").with_content_type("json"),
-        Message.from_role_and_content(
-            Role.ASSISTANT, '').with_channel("commentary").with_recipient(
-                "functions.no_args").with_content_type("json"),
-    ])
+    convo = Conversation.from_messages(
+        [
+            Message.from_role_and_content(
+                Role.USER, "What is the weather in Tokyo based on where I'm at?"
+            ),
+            Message.from_role_and_content(
+                Role.ASSISTANT,
+                'User asks: "What is the weather in Tokyo?" based on their location. We need to use get_current_weather tool and get_user_location tool.',  #  noqa: E501
+            ).with_channel("analysis"),
+            Message.from_role_and_content(Role.ASSISTANT, '{"location": "Tokyo"}')
+            .with_channel("commentary")
+            .with_recipient("functions.get_current_weather")
+            .with_content_type("json"),
+            Message.from_role_and_content(Role.ASSISTANT, '{"location": "Tokyo"}')
+            .with_channel("commentary")
+            .with_recipient("functions.get_user_location")
+            .with_content_type("json"),
+            Message.from_role_and_content(Role.ASSISTANT, '{"location": "Tokyo"}')
+            .with_channel("commentary")
+            .with_recipient("functions.no_content_type"),
+            Message.from_role_and_content(Role.ASSISTANT, "foo")
+            .with_channel("commentary")
+            .with_recipient("functions.not_json_no_content_type"),
+            Message.from_role_and_content(Role.ASSISTANT, "{}")
+            .with_channel("commentary")
+            .with_recipient("functions.empty_args")
+            .with_content_type("json"),
+            Message.from_role_and_content(Role.ASSISTANT, "")
+            .with_channel("commentary")
+            .with_recipient("functions.no_args")
+            .with_content_type("json"),
+        ]
+    )
     token_ids = harmony_encoding.render_conversation_for_completion(
         convo,
         Role.ASSISTANT,
@@ -150,30 +176,42 @@ def test_extract_tool_calls_multiple_tools(
     )
     assert extracted_info.tools_called
     expected_tool_calls = [
-        ToolCall(function=FunctionCall(
-            name="get_current_weather",
-            arguments=json.dumps({"location": "Tokyo"}),
-        )),
-        ToolCall(function=FunctionCall(
-            name="get_user_location",
-            arguments=json.dumps({"location": "Tokyo"}),
-        )),
-        ToolCall(function=FunctionCall(
-            name="no_content_type",
-            arguments=json.dumps({"location": "Tokyo"}),
-        )),
-        ToolCall(function=FunctionCall(
-            name="not_json_no_content_type",
-            arguments="foo",
-        )),
-        ToolCall(function=FunctionCall(
-            name="empty_args",
-            arguments=json.dumps({}),
-        )),
-        ToolCall(function=FunctionCall(
-            name="no_args",
-            arguments="",
-        ))
+        ToolCall(
+            function=FunctionCall(
+                name="get_current_weather",
+                arguments=json.dumps({"location": "Tokyo"}),
+            )
+        ),
+        ToolCall(
+            function=FunctionCall(
+                name="get_user_location",
+                arguments=json.dumps({"location": "Tokyo"}),
+            )
+        ),
+        ToolCall(
+            function=FunctionCall(
+                name="no_content_type",
+                arguments=json.dumps({"location": "Tokyo"}),
+            )
+        ),
+        ToolCall(
+            function=FunctionCall(
+                name="not_json_no_content_type",
+                arguments="foo",
+            )
+        ),
+        ToolCall(
+            function=FunctionCall(
+                name="empty_args",
+                arguments=json.dumps({}),
+            )
+        ),
+        ToolCall(
+            function=FunctionCall(
+                name="no_args",
+                arguments="",
+            )
+        ),
     ]
     assert_tool_calls(extracted_info.tool_calls, expected_tool_calls)
     assert extracted_info.content is None
@@ -184,20 +222,24 @@ def test_extract_tool_calls_with_content(
     harmony_encoding,
 ):
     final_content = "This tool call will get the weather."
-    convo = Conversation.from_messages([
-        Message.from_role_and_content(
-            Role.USER, "What is the weather in Tokyo based on where I'm at?"),
-        Message.from_role_and_content(
-            Role.ASSISTANT,
-            'User asks: "What is the weather in Tokyo?" based on their location. We need to use get_current_weather tool and get_user_location tool.',  #  noqa: E501
-        ).with_channel("analysis"),
-        Message.from_role_and_content(
-            Role.ASSISTANT,
-            '{"location": "Tokyo"}').with_channel("commentary").with_recipient(
-                "functions.get_current_weather").with_content_type("json"),
-        Message.from_role_and_content(Role.ASSISTANT,
-                                      final_content).with_channel("final"),
-    ])
+    convo = Conversation.from_messages(
+        [
+            Message.from_role_and_content(
+                Role.USER, "What is the weather in Tokyo based on where I'm at?"
+            ),
+            Message.from_role_and_content(
+                Role.ASSISTANT,
+                'User asks: "What is the weather in Tokyo?" based on their location. We need to use get_current_weather tool and get_user_location tool.',  #  noqa: E501
+            ).with_channel("analysis"),
+            Message.from_role_and_content(Role.ASSISTANT, '{"location": "Tokyo"}')
+            .with_channel("commentary")
+            .with_recipient("functions.get_current_weather")
+            .with_content_type("json"),
+            Message.from_role_and_content(Role.ASSISTANT, final_content).with_channel(
+                "final"
+            ),
+        ]
+    )
     token_ids = harmony_encoding.render_conversation_for_completion(
         convo,
         Role.ASSISTANT,
@@ -210,10 +252,12 @@ def test_extract_tool_calls_with_content(
     )
     assert extracted_info.tools_called
     expected_tool_calls = [
-        ToolCall(function=FunctionCall(
-            name="get_current_weather",
-            arguments=json.dumps({"location": "Tokyo"}),
-        )),
+        ToolCall(
+            function=FunctionCall(
+                name="get_current_weather",
+                arguments=json.dumps({"location": "Tokyo"}),
+            )
+        ),
     ]
     assert_tool_calls(extracted_info.tool_calls, expected_tool_calls)
     assert extracted_info.content == final_content
diff --git a/tests/tool_use/test_parallel_tool_calls.py b/tests/tool_use/test_parallel_tool_calls.py
index fff20c68d621..159966365ec4 100644
--- a/tests/tool_use/test_parallel_tool_calls.py
+++ b/tests/tool_use/test_parallel_tool_calls.py
@@ -7,9 +7,13 @@
 import openai
 import pytest
 
-from .utils import (MESSAGES_ASKING_FOR_PARALLEL_TOOLS,
-                    MESSAGES_WITH_PARALLEL_TOOL_RESPONSE, SEARCH_TOOL,
-                    WEATHER_TOOL, ServerConfig)
+from .utils import (
+    MESSAGES_ASKING_FOR_PARALLEL_TOOLS,
+    MESSAGES_WITH_PARALLEL_TOOL_RESPONSE,
+    SEARCH_TOOL,
+    WEATHER_TOOL,
+    ServerConfig,
+)
 
 
 # test: getting the model to generate parallel tool calls (streaming/not)
@@ -17,12 +21,15 @@
 # may be added in the future. e.g. llama 3.1 models are not designed to support
 # parallel tool calls.
 @pytest.mark.asyncio
-async def test_parallel_tool_calls(client: openai.AsyncOpenAI,
-                                   server_config: ServerConfig):
-
+async def test_parallel_tool_calls(
+    client: openai.AsyncOpenAI, server_config: ServerConfig
+):
     if not server_config.get("supports_parallel", True):
-        pytest.skip("The {} model doesn't support parallel tool calls".format(
-            server_config["model"]))
+        pytest.skip(
+            "The {} model doesn't support parallel tool calls".format(
+                server_config["model"]
+            )
+        )
 
     models = await client.models.list()
     model_name: str = models.data[0].id
@@ -32,7 +39,8 @@ async def test_parallel_tool_calls(client: openai.AsyncOpenAI,
         max_completion_tokens=200,
         model=model_name,
         tools=[WEATHER_TOOL, SEARCH_TOOL],
-        logprobs=False)
+        logprobs=False,
+    )
 
     choice = chat_completion.choices[0]
     stop_reason = chat_completion.choices[0].finish_reason
@@ -69,7 +77,8 @@ async def test_parallel_tool_calls(client: openai.AsyncOpenAI,
         max_completion_tokens=200,
         tools=[WEATHER_TOOL, SEARCH_TOOL],
         logprobs=False,
-        stream=True)
+        stream=True,
+    )
 
     role_name: Optional[str] = None
     finish_reason_count: int = 0
@@ -80,24 +89,22 @@ async def test_parallel_tool_calls(client: openai.AsyncOpenAI,
     tool_call_id_count: int = 0
 
     async for chunk in stream:
-
         # if there's a finish reason make sure it's tools
         if chunk.choices[0].finish_reason:
             finish_reason_count += 1
-            assert chunk.choices[0].finish_reason == 'tool_calls'
+            assert chunk.choices[0].finish_reason == "tool_calls"
 
         # if a role is being streamed make sure it wasn't already set to
         # something else
         if chunk.choices[0].delta.role:
-            assert not role_name or role_name == 'assistant'
-            role_name = 'assistant'
+            assert not role_name or role_name == "assistant"
+            role_name = "assistant"
 
         # if a tool call is streamed make sure there's exactly one
         # (based on the request parameters
         streamed_tool_calls = chunk.choices[0].delta.tool_calls
 
         if streamed_tool_calls and len(streamed_tool_calls) > 0:
-
             # make sure only one diff is present - correct even for parallel
             assert len(streamed_tool_calls) == 1
             tool_call = streamed_tool_calls[0]
@@ -110,8 +117,7 @@ async def test_parallel_tool_calls(client: openai.AsyncOpenAI,
             # if a tool call ID is streamed, make sure one hasn't been already
             if tool_call.id:
                 tool_call_id_count += 1
-                assert (isinstance(tool_call.id, str)
-                        and (len(tool_call.id) >= 9))
+                assert isinstance(tool_call.id, str) and (len(tool_call.id) >= 9)
 
             # if parts of the function start being streamed
             if tool_call.function:
@@ -125,32 +131,32 @@ async def test_parallel_tool_calls(client: openai.AsyncOpenAI,
                     # make sure they're a string and then add them to the list
                     assert isinstance(tool_call.function.arguments, str)
 
-                    tool_call_args[
-                        tool_call.index] += tool_call.function.arguments
+                    tool_call_args[tool_call.index] += tool_call.function.arguments
 
     assert finish_reason_count == 1
-    assert role_name == 'assistant'
+    assert role_name == "assistant"
 
-    assert (len(non_streamed_tool_calls) == len(tool_call_names) ==
-            len(tool_call_args))
+    assert len(non_streamed_tool_calls) == len(tool_call_names) == len(tool_call_args)
 
     for i in range(2):
         assert non_streamed_tool_calls[i].function.name == tool_call_names[i]
         streamed_args = json.loads(tool_call_args[i])
-        non_streamed_args = json.loads(
-            non_streamed_tool_calls[i].function.arguments)
+        non_streamed_args = json.loads(non_streamed_tool_calls[i].function.arguments)
         assert streamed_args == non_streamed_args
 
 
 # test: providing parallel tool calls back to the model to get a response
 # (streaming/not)
 @pytest.mark.asyncio
-async def test_parallel_tool_calls_with_results(client: openai.AsyncOpenAI,
-                                                server_config: ServerConfig):
-
+async def test_parallel_tool_calls_with_results(
+    client: openai.AsyncOpenAI, server_config: ServerConfig
+):
     if not server_config.get("supports_parallel", True):
-        pytest.skip("The {} model doesn't support parallel tool calls".format(
-            server_config["model"]))
+        pytest.skip(
+            "The {} model doesn't support parallel tool calls".format(
+                server_config["model"]
+            )
+        )
 
     models = await client.models.list()
     model_name: str = models.data[0].id
@@ -160,14 +166,14 @@ async def test_parallel_tool_calls_with_results(client: openai.AsyncOpenAI,
         max_completion_tokens=200,
         model=model_name,
         tools=[WEATHER_TOOL, SEARCH_TOOL],
-        logprobs=False)
+        logprobs=False,
+    )
 
     choice = chat_completion.choices[0]
 
     assert choice.finish_reason != "tool_calls"  # "stop" or "length"
     assert choice.message.role == "assistant"
-    assert choice.message.tool_calls is None \
-           or len(choice.message.tool_calls) == 0
+    assert choice.message.tool_calls is None or len(choice.message.tool_calls) == 0
     assert choice.message.content is not None
     assert "98" in choice.message.content  # Dallas temp in tool response
     assert "78" in choice.message.content  # Orlando temp in tool response
@@ -179,7 +185,8 @@ async def test_parallel_tool_calls_with_results(client: openai.AsyncOpenAI,
         model=model_name,
         tools=[WEATHER_TOOL, SEARCH_TOOL],
         logprobs=False,
-        stream=True)
+        stream=True,
+    )
 
     chunks: list[str] = []
     finish_reason_count = 0
diff --git a/tests/tool_use/test_qwen3coder_tool_parser.py b/tests/tool_use/test_qwen3coder_tool_parser.py
index ade089e8246e..20fa3b08c7b9 100644
--- a/tests/tool_use/test_qwen3coder_tool_parser.py
+++ b/tests/tool_use/test_qwen3coder_tool_parser.py
@@ -7,14 +7,17 @@
 
 import pytest
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              ChatCompletionToolsParam,
-                                              DeltaMessage, FunctionCall,
-                                              ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    ChatCompletionToolsParam,
+    DeltaMessage,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.qwen3coder_tool_parser import (
-    Qwen3CoderToolParser)
-from vllm.entrypoints.openai.tool_parsers.qwen3xml_tool_parser import (
-    Qwen3XMLToolParser)
+    Qwen3CoderToolParser,
+)
+from vllm.entrypoints.openai.tool_parsers.qwen3xml_tool_parser import Qwen3XMLToolParser
 from vllm.transformers_utils.detokenizer_utils import detokenize_incrementally
 from vllm.transformers_utils.tokenizer import AnyTokenizer, get_tokenizer
 
@@ -39,8 +42,7 @@ def qwen3_xml_tool_parser(qwen3_tokenizer):
 
 
 @pytest.fixture(params=["original", "xml"])
-def qwen3_tool_parser_parametrized(qwen3_tool_parser, qwen3_xml_tool_parser,
-                                   request):
+def qwen3_tool_parser_parametrized(qwen3_tool_parser, qwen3_xml_tool_parser, request):
     """Parameterized fixture that provides both parser types for testing"""
     if request.param == "original":
         return qwen3_tool_parser
@@ -51,76 +53,63 @@ def qwen3_tool_parser_parametrized(qwen3_tool_parser, qwen3_xml_tool_parser,
 @pytest.fixture
 def sample_tools():
     return [
-        ChatCompletionToolsParam(type="function",
-                                 function={
-                                     "name": "get_current_weather",
-                                     "description": "Get the current weather",
-                                     "parameters": {
-                                         "type": "object",
-                                         "properties": {
-                                             "city": {
-                                                 "type": "string",
-                                                 "description": "The city name"
-                                             },
-                                             "state": {
-                                                 "type": "string",
-                                                 "description":
-                                                 "The state code"
-                                             },
-                                             "unit": {
-                                                 "type": "string",
-                                                 "enum":
-                                                 ["fahrenheit", "celsius"]
-                                             }
-                                         },
-                                         "required": ["city", "state"]
-                                     }
-                                 }),
-        ChatCompletionToolsParam(type="function",
-                                 function={
-                                     "name": "calculate_area",
-                                     "description":
-                                     "Calculate area of a shape",
-                                     "parameters": {
-                                         "type": "object",
-                                         "properties": {
-                                             "shape": {
-                                                 "type": "string"
-                                             },
-                                             "dimensions": {
-                                                 "type": "object"
-                                             },
-                                             "precision": {
-                                                 "type": "integer"
-                                             }
-                                         }
-                                     }
-                                 })
+        ChatCompletionToolsParam(
+            type="function",
+            function={
+                "name": "get_current_weather",
+                "description": "Get the current weather",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "city": {"type": "string", "description": "The city name"},
+                        "state": {"type": "string", "description": "The state code"},
+                        "unit": {"type": "string", "enum": ["fahrenheit", "celsius"]},
+                    },
+                    "required": ["city", "state"],
+                },
+            },
+        ),
+        ChatCompletionToolsParam(
+            type="function",
+            function={
+                "name": "calculate_area",
+                "description": "Calculate area of a shape",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "shape": {"type": "string"},
+                        "dimensions": {"type": "object"},
+                        "precision": {"type": "integer"},
+                    },
+                },
+            },
+        ),
     ]
 
 
-def assert_tool_calls(actual_tool_calls: list[ToolCall],
-                      expected_tool_calls: list[ToolCall]):
+def assert_tool_calls(
+    actual_tool_calls: list[ToolCall], expected_tool_calls: list[ToolCall]
+):
     assert len(actual_tool_calls) == len(expected_tool_calls)
 
-    for actual_tool_call, expected_tool_call in zip(actual_tool_calls,
-                                                    expected_tool_calls):
+    for actual_tool_call, expected_tool_call in zip(
+        actual_tool_calls, expected_tool_calls
+    ):
         # Qwen3 parser doesn't generate IDs during extraction
         assert actual_tool_call.type == "function"
-        assert (
-            actual_tool_call.function.name == expected_tool_call.function.name)
-        assert (json.loads(actual_tool_call.function.arguments) == json.loads(
-            expected_tool_call.function.arguments))
+        assert actual_tool_call.function.name == expected_tool_call.function.name
+        assert json.loads(actual_tool_call.function.arguments) == json.loads(
+            expected_tool_call.function.arguments
+        )
 
 
 def stream_delta_message_generator(
     qwen3_tool_parser,
     qwen3_tokenizer: AnyTokenizer,
     model_output: str,
-    request: Optional[ChatCompletionRequest] = None
+    request: Optional[ChatCompletionRequest] = None,
 ) -> Generator[DeltaMessage, None, None]:
-    all_token_ids = qwen3_tokenizer.encode(model_output,
-                                           add_special_tokens=False)
+    all_token_ids = qwen3_tokenizer.encode(model_output, add_special_tokens=False)
 
     previous_text = ""
     previous_tokens = None
@@ -129,18 +118,19 @@ def stream_delta_message_generator(
     for i, delta_token in enumerate(all_token_ids):
         delta_token_ids = [delta_token]
         previous_token_ids = all_token_ids[:i]
-        current_token_ids = all_token_ids[:i + 1]
-
-        (new_tokens, delta_text, new_prefix_offset,
-         new_read_offset) = detokenize_incrementally(
-             tokenizer=qwen3_tokenizer,
-             all_input_ids=current_token_ids,
-             prev_tokens=previous_tokens,
-             prefix_offset=prefix_offset,
-             read_offset=read_offset,
-             skip_special_tokens=False,
-             spaces_between_special_tokens=True,
-         )
+        current_token_ids = all_token_ids[: i + 1]
+
+        (new_tokens, delta_text, new_prefix_offset, new_read_offset) = (
+            detokenize_incrementally(
+                tokenizer=qwen3_tokenizer,
+                all_input_ids=current_token_ids,
+                prev_tokens=previous_tokens,
+                prefix_offset=prefix_offset,
+                read_offset=read_offset,
+                skip_special_tokens=False,
+                spaces_between_special_tokens=True,
+            )
+        )
 
         current_text = previous_text + delta_text
 
@@ -157,8 +147,9 @@ def stream_delta_message_generator(
             yield delta_message
 
         previous_text = current_text
-        previous_tokens = (previous_tokens +
-                           new_tokens if previous_tokens else new_tokens)
+        previous_tokens = (
+            previous_tokens + new_tokens if previous_tokens else new_tokens
+        )
         prefix_offset = new_prefix_offset
         read_offset = new_read_offset
 
@@ -166,7 +157,8 @@ def stream_delta_message_generator(
 def test_extract_tool_calls_no_tools(qwen3_tool_parser_parametrized):
     model_output = "This is a test response without any tool calls"
     extracted_tool_calls = qwen3_tool_parser_parametrized.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
     assert not extracted_tool_calls.tools_called
     assert extracted_tool_calls.tool_calls == []
     assert extracted_tool_calls.content == model_output
@@ -182,7 +174,8 @@ def test_extract_tool_calls_no_tools(qwen3_tool_parser_parametrized):
     ],
     argnames=["model_output", "expected_tool_calls", "expected_content"],
     argvalues=[
-        ('''<tool_call>
+        (
+            """<tool_call>
 <function=get_current_weather>
 <parameter=city>
 Dallas
@@ -194,16 +187,21 @@ def test_extract_tool_calls_no_tools(qwen3_tool_parser_parametrized):
 fahrenheit
 </parameter>
 </function>
-</tool_call>''', [
-            ToolCall(
-                function=FunctionCall(name="get_current_weather",
-                                      arguments=json.dumps({
-                                          "city": "Dallas",
-                                          "state": "TX",
-                                          "unit": "fahrenheit"
-                                      })))
-        ], None),
-        ('''Sure! Let me check the weather for you.<tool_call>
+</tool_call>""",
+            [
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}
+                        ),
+                    )
+                )
+            ],
+            None,
+        ),
+        (
+            """Sure! Let me check the weather for you.<tool_call>
 <function=get_current_weather>
 <parameter=city>
 Dallas
@@ -215,16 +213,21 @@ def test_extract_tool_calls_no_tools(qwen3_tool_parser_parametrized):
 fahrenheit
 </parameter>
 </function>
-</tool_call>''', [
-            ToolCall(
-                function=FunctionCall(name="get_current_weather",
-                                      arguments=json.dumps({
-                                          "city": "Dallas",
-                                          "state": "TX",
-                                          "unit": "fahrenheit"
-                                      })))
-        ], "Sure! Let me check the weather for you."),
-        ('''<tool_call>
+</tool_call>""",
+            [
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}
+                        ),
+                    )
+                )
+            ],
+            "Sure! Let me check the weather for you.",
+        ),
+        (
+            """<tool_call>
 <function=calculate_area>
 <parameter=shape>
 rectangle
@@ -237,18 +240,25 @@ def test_extract_tool_calls_no_tools(qwen3_tool_parser_parametrized):
 2
 </parameter>
 </function>
-</tool_call>''', [
-            ToolCall(function=FunctionCall(name="calculate_area",
-                                           arguments=json.dumps({
-                                               "shape": "rectangle",
-                                               "dimensions": {
-                                                   "width": 10,
-                                                   "height": 20
-                                               },
-                                               "precision": 2
-                                           })))
-        ], None),
-        ('''<tool_call>
+</tool_call>""",
+            [
+                ToolCall(
+                    function=FunctionCall(
+                        name="calculate_area",
+                        arguments=json.dumps(
+                            {
+                                "shape": "rectangle",
+                                "dimensions": {"width": 10, "height": 20},
+                                "precision": 2,
+                            }
+                        ),
+                    )
+                )
+            ],
+            None,
+        ),
+        (
+            """<tool_call>
 <function=get_current_weather>
 <parameter=city>
 Dallas
@@ -273,23 +283,29 @@ def test_extract_tool_calls_no_tools(qwen3_tool_parser_parametrized):
 fahrenheit
 </parameter>
 </function>
-</tool_call>''', [
-            ToolCall(
-                function=FunctionCall(name="get_current_weather",
-                                      arguments=json.dumps({
-                                          "city": "Dallas",
-                                          "state": "TX",
-                                          "unit": "fahrenheit"
-                                      }))),
-            ToolCall(
-                function=FunctionCall(name="get_current_weather",
-                                      arguments=json.dumps({
-                                          "city": "Orlando",
-                                          "state": "FL",
-                                          "unit": "fahrenheit"
-                                      })))
-        ], None),
-        ('''Let me calculate that area for you.<tool_call>
+</tool_call>""",
+            [
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}
+                        ),
+                    )
+                ),
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Orlando", "state": "FL", "unit": "fahrenheit"}
+                        ),
+                    )
+                ),
+            ],
+            None,
+        ),
+        (
+            """Let me calculate that area for you.<tool_call>
 <function=calculate_area>
 <parameter=shape>
 circle
@@ -301,26 +317,36 @@ def test_extract_tool_calls_no_tools(qwen3_tool_parser_parametrized):
 3
 </parameter>
 </function>
-</tool_call>''', [
-            ToolCall(function=FunctionCall(name="calculate_area",
-                                           arguments=json.dumps({
-                                               "shape": "circle",
-                                               "dimensions": {
-                                                   "radius": 15.5
-                                               },
-                                               "precision": 3
-                                           })))
-        ], "Let me calculate that area for you."),
+</tool_call>""",
+            [
+                ToolCall(
+                    function=FunctionCall(
+                        name="calculate_area",
+                        arguments=json.dumps(
+                            {
+                                "shape": "circle",
+                                "dimensions": {"radius": 15.5},
+                                "precision": 3,
+                            }
+                        ),
+                    )
+                )
+            ],
+            "Let me calculate that area for you.",
+        ),
     ],
 )
-def test_extract_tool_calls(qwen3_tool_parser_parametrized, sample_tools,
-                            model_output, expected_tool_calls,
-                            expected_content):
-    request = ChatCompletionRequest(model=MODEL,
-                                    messages=[],
-                                    tools=sample_tools)
+def test_extract_tool_calls(
+    qwen3_tool_parser_parametrized,
+    sample_tools,
+    model_output,
+    expected_tool_calls,
+    expected_content,
+):
+    request = ChatCompletionRequest(model=MODEL, messages=[], tools=sample_tools)
     extracted_tool_calls = qwen3_tool_parser_parametrized.extract_tool_calls(
-        model_output, request=request)
+        model_output, request=request
+    )
     assert extracted_tool_calls.tools_called
 
     assert_tool_calls(extracted_tool_calls.tool_calls, expected_tool_calls)
@@ -328,60 +354,51 @@ def test_extract_tool_calls(qwen3_tool_parser_parametrized, sample_tools,
     assert extracted_tool_calls.content == expected_content
 
 
-def test_extract_tool_calls_fallback_no_tags(qwen3_tool_parser_parametrized,
-                                             sample_tools):
+def test_extract_tool_calls_fallback_no_tags(
+    qwen3_tool_parser_parametrized, sample_tools
+):
     """Test fallback parsing when XML tags are missing"""
-    model_output = '''<function=get_current_weather>
+    model_output = """<function=get_current_weather>
 <parameter=city>
 Dallas
 </parameter>
 <parameter=state>
 TX
 </parameter>
-</function>'''
+</function>"""
 
-    request = ChatCompletionRequest(model=MODEL,
-                                    messages=[],
-                                    tools=sample_tools)
+    request = ChatCompletionRequest(model=MODEL, messages=[], tools=sample_tools)
     extracted_tool_calls = qwen3_tool_parser_parametrized.extract_tool_calls(
-        model_output, request=request)
+        model_output, request=request
+    )
 
     assert extracted_tool_calls.tools_called
     assert len(extracted_tool_calls.tool_calls) == 1
-    assert (extracted_tool_calls.tool_calls[0].function.name ==
-            "get_current_weather")
+    assert extracted_tool_calls.tool_calls[0].function.name == "get_current_weather"
 
 
 def test_extract_tool_calls_type_conversion(qwen3_tool_parser_parametrized):
     """Test parameter type conversion based on tool schema"""
     tools = [
-        ChatCompletionToolsParam(type="function",
-                                 function={
-                                     "name": "test_types",
-                                     "parameters": {
-                                         "type": "object",
-                                         "properties": {
-                                             "int_param": {
-                                                 "type": "integer"
-                                             },
-                                             "float_param": {
-                                                 "type": "float"
-                                             },
-                                             "bool_param": {
-                                                 "type": "boolean"
-                                             },
-                                             "str_param": {
-                                                 "type": "string"
-                                             },
-                                             "obj_param": {
-                                                 "type": "object"
-                                             }
-                                         }
-                                     }
-                                 })
+        ChatCompletionToolsParam(
+            type="function",
+            function={
+                "name": "test_types",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "int_param": {"type": "integer"},
+                        "float_param": {"type": "float"},
+                        "bool_param": {"type": "boolean"},
+                        "str_param": {"type": "string"},
+                        "obj_param": {"type": "object"},
+                    },
+                },
+            },
+        )
     ]
 
-    model_output = '''<tool_call>
+    model_output = """<tool_call>
 <function=test_types>
 <parameter=int_param>
 42
@@ -399,11 +416,12 @@ def test_extract_tool_calls_type_conversion(qwen3_tool_parser_parametrized):
 {"key": "value"}
 </parameter>
 </function>
-</tool_call>'''
+</tool_call>"""
 
     request = ChatCompletionRequest(model=MODEL, messages=[], tools=tools)
     extracted_tool_calls = qwen3_tool_parser_parametrized.extract_tool_calls(
-        model_output, request=request)
+        model_output, request=request
+    )
 
     args = json.loads(extracted_tool_calls.tool_calls[0].function.arguments)
     assert args["int_param"] == 42
@@ -425,7 +443,8 @@ def test_extract_tool_calls_type_conversion(qwen3_tool_parser_parametrized):
     argnames=["model_output", "expected_tool_calls", "expected_content"],
     argvalues=[
         ("This is a test without tools", [], "This is a test without tools"),
-        ('''<tool_call>
+        (
+            """<tool_call>
 <function=get_current_weather>
 <parameter=city>
 Dallas
@@ -437,16 +456,21 @@ def test_extract_tool_calls_type_conversion(qwen3_tool_parser_parametrized):
 fahrenheit
 </parameter>
 </function>
-</tool_call>''', [
-            ToolCall(
-                function=FunctionCall(name="get_current_weather",
-                                      arguments=json.dumps({
-                                          "city": "Dallas",
-                                          "state": "TX",
-                                          "unit": "fahrenheit"
-                                      })))
-        ], None),
-        ('''Sure! Let me check the weather for you.<tool_call>
+</tool_call>""",
+            [
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}
+                        ),
+                    )
+                )
+            ],
+            None,
+        ),
+        (
+            """Sure! Let me check the weather for you.<tool_call>
 <function=get_current_weather>
 <parameter=city>
 Dallas
@@ -458,16 +482,21 @@ def test_extract_tool_calls_type_conversion(qwen3_tool_parser_parametrized):
 fahrenheit
 </parameter>
 </function>
-</tool_call>''', [
-            ToolCall(
-                function=FunctionCall(name="get_current_weather",
-                                      arguments=json.dumps({
-                                          "city": "Dallas",
-                                          "state": "TX",
-                                          "unit": "fahrenheit"
-                                      })))
-        ], "Sure! Let me check the weather for you."),
-        ('''<tool_call>
+</tool_call>""",
+            [
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}
+                        ),
+                    )
+                )
+            ],
+            "Sure! Let me check the weather for you.",
+        ),
+        (
+            """<tool_call>
 <function=calculate_area>
 <parameter=shape>
 rectangle
@@ -480,18 +509,25 @@ def test_extract_tool_calls_type_conversion(qwen3_tool_parser_parametrized):
 2
 </parameter>
 </function>
-</tool_call>''', [
-            ToolCall(function=FunctionCall(name="calculate_area",
-                                           arguments=json.dumps({
-                                               "shape": "rectangle",
-                                               "dimensions": {
-                                                   "width": 10,
-                                                   "height": 20
-                                               },
-                                               "precision": 2
-                                           })))
-        ], None),
-        ('''<tool_call>
+</tool_call>""",
+            [
+                ToolCall(
+                    function=FunctionCall(
+                        name="calculate_area",
+                        arguments=json.dumps(
+                            {
+                                "shape": "rectangle",
+                                "dimensions": {"width": 10, "height": 20},
+                                "precision": 2,
+                            }
+                        ),
+                    )
+                )
+            ],
+            None,
+        ),
+        (
+            """<tool_call>
 <function=get_current_weather>
 <parameter=city>
 Dallas
@@ -516,24 +552,30 @@ def test_extract_tool_calls_type_conversion(qwen3_tool_parser_parametrized):
 celsius
 </parameter>
 </function>
-</tool_call>''', [
-            ToolCall(
-                function=FunctionCall(name="get_current_weather",
-                                      arguments=json.dumps({
-                                          "city": "Dallas",
-                                          "state": "TX",
-                                          "unit": "fahrenheit"
-                                      }))),
-            ToolCall(
-                function=FunctionCall(name="get_current_weather",
-                                      arguments=json.dumps({
-                                          "city": "Orlando",
-                                          "state": "FL",
-                                          "unit": "celsius"
-                                      })))
-        ], None),
+</tool_call>""",
+            [
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}
+                        ),
+                    )
+                ),
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {"city": "Orlando", "state": "FL", "unit": "celsius"}
+                        ),
+                    )
+                ),
+            ],
+            None,
+        ),
         # Added tool_with_typed_params test case
-        ('''Let me calculate that area for you.<tool_call>
+        (
+            """Let me calculate that area for you.<tool_call>
 <function=calculate_area>
 <parameter=shape>
 circle
@@ -545,33 +587,42 @@ def test_extract_tool_calls_type_conversion(qwen3_tool_parser_parametrized):
 3
 </parameter>
 </function>
-</tool_call>''', [
-            ToolCall(function=FunctionCall(name="calculate_area",
-                                           arguments=json.dumps({
-                                               "shape": "circle",
-                                               "dimensions": {
-                                                   "radius": 15.5
-                                               },
-                                               "precision": 3
-                                           })))
-        ], "Let me calculate that area for you."),
+</tool_call>""",
+            [
+                ToolCall(
+                    function=FunctionCall(
+                        name="calculate_area",
+                        arguments=json.dumps(
+                            {
+                                "shape": "circle",
+                                "dimensions": {"radius": 15.5},
+                                "precision": 3,
+                            }
+                        ),
+                    )
+                )
+            ],
+            "Let me calculate that area for you.",
+        ),
     ],
 )
-def test_extract_tool_calls_streaming(qwen3_tool_parser_parametrized,
-                                      qwen3_tokenizer, sample_tools,
-                                      model_output, expected_tool_calls,
-                                      expected_content):
+def test_extract_tool_calls_streaming(
+    qwen3_tool_parser_parametrized,
+    qwen3_tokenizer,
+    sample_tools,
+    model_output,
+    expected_tool_calls,
+    expected_content,
+):
     """Test incremental streaming behavior including typed parameters"""
-    request = ChatCompletionRequest(model=MODEL,
-                                    messages=[],
-                                    tools=sample_tools)
+    request = ChatCompletionRequest(model=MODEL, messages=[], tools=sample_tools)
 
-    other_content = ''
+    other_content = ""
     tool_states = {}  # Track state per tool index
 
     for delta_message in stream_delta_message_generator(
-            qwen3_tool_parser_parametrized, qwen3_tokenizer, model_output,
-            request):
+        qwen3_tool_parser_parametrized, qwen3_tokenizer, model_output, request
+    ):
         # role should never be streamed from tool parser
         assert not delta_message.role
 
@@ -588,7 +639,7 @@ def test_extract_tool_calls_streaming(qwen3_tool_parser_parametrized,
                         "id": None,
                         "name": None,
                         "arguments": "",
-                        "type": None
+                        "type": None,
                     }
 
                 # First chunk should have id, name, and type
@@ -607,8 +658,7 @@ def test_extract_tool_calls_streaming(qwen3_tool_parser_parametrized,
 
                     if tool_call.function.arguments is not None:
                         # Accumulate arguments incrementally
-                        tool_states[idx][
-                            "arguments"] += tool_call.function.arguments
+                        tool_states[idx]["arguments"] += tool_call.function.arguments
 
     # Verify final content
     assert other_content == (expected_content or "")  # Handle None case
@@ -632,10 +682,11 @@ def test_extract_tool_calls_streaming(qwen3_tool_parser_parametrized,
 
 
 def test_extract_tool_calls_missing_closing_parameter_tag(
-        qwen3_tool_parser_parametrized, sample_tools):
+    qwen3_tool_parser_parametrized, sample_tools
+):
     """Test handling of missing closing </parameter> tag"""
     # Using get_current_weather from sample_tools but with malformed XML
-    model_output = '''Let me check the weather for you:
+    model_output = """Let me check the weather for you:
 <tool_call>
 <function=get_current_weather>
 <parameter=city>
@@ -647,21 +698,19 @@ def test_extract_tool_calls_missing_closing_parameter_tag(
 fahrenheit
 </parameter>
 </function>
-</tool_call>'''
+</tool_call>"""
 
-    request = ChatCompletionRequest(model=MODEL,
-                                    messages=[],
-                                    tools=sample_tools)
+    request = ChatCompletionRequest(model=MODEL, messages=[], tools=sample_tools)
     extracted_tool_calls = qwen3_tool_parser_parametrized.extract_tool_calls(
-        model_output, request=request)
+        model_output, request=request
+    )
 
     # The parser should handle the malformed XML gracefully
     assert extracted_tool_calls.tools_called
     assert len(extracted_tool_calls.tool_calls) == 1
 
     # Verify the function name is correct
-    assert extracted_tool_calls.tool_calls[
-        0].function.name == "get_current_weather"
+    assert extracted_tool_calls.tool_calls[0].function.name == "get_current_weather"
 
     # Verify the arguments are parsed despite the missing closing tag
     args = json.loads(extracted_tool_calls.tool_calls[0].function.arguments)
@@ -675,10 +724,11 @@ def test_extract_tool_calls_missing_closing_parameter_tag(
 
 
 def test_extract_tool_calls_streaming_missing_closing_tag(
-        qwen3_tool_parser_parametrized, qwen3_tokenizer, sample_tools):
+    qwen3_tool_parser_parametrized, qwen3_tokenizer, sample_tools
+):
     """Test streaming with missing closing </parameter> tag"""
     # Using get_current_weather from sample_tools but with malformed XML
-    model_output = '''Let me check the weather for you:
+    model_output = """Let me check the weather for you:
 <tool_call>
 <function=get_current_weather>
 <parameter=city>
@@ -690,19 +740,16 @@ def test_extract_tool_calls_streaming_missing_closing_tag(
 fahrenheit
 </parameter>
 </function>
-</tool_call>'''
+</tool_call>"""
 
-    request = ChatCompletionRequest(model=MODEL,
-                                    messages=[],
-                                    tools=sample_tools)
+    request = ChatCompletionRequest(model=MODEL, messages=[], tools=sample_tools)
 
-    other_content = ''
+    other_content = ""
     tool_states = {}
 
     for delta_message in stream_delta_message_generator(
-            qwen3_tool_parser_parametrized, qwen3_tokenizer, model_output,
-            request):
-
+        qwen3_tool_parser_parametrized, qwen3_tokenizer, model_output, request
+    ):
         if delta_message.content:
             other_content += delta_message.content
 
@@ -715,7 +762,7 @@ def test_extract_tool_calls_streaming_missing_closing_tag(
                         "id": None,
                         "name": None,
                         "arguments": "",
-                        "type": None
+                        "type": None,
                     }
 
                 if tool_call.id:
@@ -730,8 +777,7 @@ def test_extract_tool_calls_streaming_missing_closing_tag(
                         tool_states[idx]["name"] = tool_call.function.name
 
                     if tool_call.function.arguments is not None:
-                        tool_states[idx][
-                            "arguments"] += tool_call.function.arguments
+                        tool_states[idx]["arguments"] += tool_call.function.arguments
 
     # Verify content was streamed
     assert "Let me check the weather for you:" in other_content
@@ -752,9 +798,10 @@ def test_extract_tool_calls_streaming_missing_closing_tag(
 
 
 def test_extract_tool_calls_streaming_incremental(
-        qwen3_tool_parser_parametrized, qwen3_tokenizer, sample_tools):
+    qwen3_tool_parser_parametrized, qwen3_tokenizer, sample_tools
+):
     """Test that streaming is truly incremental"""
-    model_output = '''I'll check the weather.<tool_call>
+    model_output = """I'll check the weather.<tool_call>
 <function=get_current_weather>
 <parameter=city>
 Dallas
@@ -763,16 +810,14 @@ def test_extract_tool_calls_streaming_incremental(
 TX
 </parameter>
 </function>
-</tool_call>'''
+</tool_call>"""
 
-    request = ChatCompletionRequest(model=MODEL,
-                                    messages=[],
-                                    tools=sample_tools)
+    request = ChatCompletionRequest(model=MODEL, messages=[], tools=sample_tools)
 
     chunks = []
     for delta_message in stream_delta_message_generator(
-            qwen3_tool_parser_parametrized, qwen3_tokenizer, model_output,
-            request):
+        qwen3_tool_parser_parametrized, qwen3_tokenizer, model_output, request
+    ):
         chunks.append(delta_message)
 
     # Should have multiple chunks
@@ -787,7 +832,7 @@ def test_extract_tool_calls_streaming_incremental(
     for chunk in chunks:
         if chunk.tool_calls and chunk.tool_calls[0].id:
             header_found = True
-            assert (chunk.tool_calls[0].function.name == "get_current_weather")
+            assert chunk.tool_calls[0].function.name == "get_current_weather"
             assert chunk.tool_calls[0].type == "function"
             # Empty initially
             assert chunk.tool_calls[0].function.arguments == ""
@@ -811,46 +856,40 @@ def test_extract_tool_calls_streaming_incremental(
 
 
 def test_extract_tool_calls_complex_type_with_single_quote(
-        qwen3_tool_parser_parametrized):
+    qwen3_tool_parser_parametrized,
+):
     """Test parameter type conversion based on tool schema"""
     tools = [
-        ChatCompletionToolsParam(type="function",
-                                 function={
-                                     "name": "test_types",
-                                     "parameters": {
-                                         "type": "object",
-                                         "properties": {
-                                             "int_param": {
-                                                 "type": "integer"
-                                             },
-                                             "float_param": {
-                                                 "type": "float"
-                                             },
-                                             "bool_param": {
-                                                 "type": "boolean"
-                                             },
-                                             "str_param": {
-                                                 "type": "string"
-                                             },
-                                             "obj_param": {
-                                                 "type": "object"
-                                             }
-                                         }
-                                     }
-                                 })
+        ChatCompletionToolsParam(
+            type="function",
+            function={
+                "name": "test_types",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "int_param": {"type": "integer"},
+                        "float_param": {"type": "float"},
+                        "bool_param": {"type": "boolean"},
+                        "str_param": {"type": "string"},
+                        "obj_param": {"type": "object"},
+                    },
+                },
+            },
+        )
     ]
 
-    model_output = '''<tool_call>
+    model_output = """<tool_call>
 <function=test_types>
 <parameter=obj_param>
 {'key': 'value'}
 </parameter>
 </function>
-</tool_call>'''
+</tool_call>"""
 
     request = ChatCompletionRequest(model=MODEL, messages=[], tools=tools)
     extracted_tool_calls = qwen3_tool_parser_parametrized.extract_tool_calls(
-        model_output, request=request)
+        model_output, request=request
+    )
 
     args = json.loads(extracted_tool_calls.tool_calls[0].function.arguments)
     assert args["obj_param"] == {"key": "value"}
diff --git a/tests/tool_use/test_seed_oss_tool_parser.py b/tests/tool_use/test_seed_oss_tool_parser.py
index 5100b5ac120b..eddb5a9b9f5e 100644
--- a/tests/tool_use/test_seed_oss_tool_parser.py
+++ b/tests/tool_use/test_seed_oss_tool_parser.py
@@ -8,10 +8,13 @@
 
 import pytest
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              ChatCompletionToolsParam,
-                                              DeltaMessage, FunctionCall,
-                                              ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    ChatCompletionToolsParam,
+    DeltaMessage,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers import SeedOssToolParser
 from vllm.transformers_utils.detokenizer_utils import detokenize_incrementally
 from vllm.transformers_utils.tokenizer import AnyTokenizer, get_tokenizer
@@ -45,51 +48,56 @@ def sample_tools():
                     "properties": {
                         "location": {
                             "type": "string",
-                            "description":
-                            "City and country e.g. Bogotá, Colombia"
+                            "description": "City and country e.g. Bogotá, Colombia",
                         },
                         "unit": {
                             "type": "string",
-                            "description": "this is the unit of temperature"
-                        }
+                            "description": "this is the unit of temperature",
+                        },
                     },
                     "required": ["location"],
-                    "additionalProperties": False
+                    "additionalProperties": False,
                 },
                 "returns": {
                     "type": "object",
                     "properties": {
                         "temperature": {
                             "type": "number",
-                            "description": "temperature in celsius"
+                            "description": "temperature in celsius",
                         }
                     },
                     "required": ["temperature"],
-                    "additionalProperties": False
+                    "additionalProperties": False,
                 },
-                "strict": True
-            }),
+                "strict": True,
+            },
+        ),
     ]
 
 
-def assert_tool_calls(actual_tool_calls: list[ToolCall],
-                      expected_tool_calls: list[ToolCall]):
+def assert_tool_calls(
+    actual_tool_calls: list[ToolCall], expected_tool_calls: list[ToolCall]
+):
     assert len(actual_tool_calls) == len(expected_tool_calls)
 
-    for actual_tool_call, expected_tool_call in zip(actual_tool_calls,
-                                                    expected_tool_calls):
+    for actual_tool_call, expected_tool_call in zip(
+        actual_tool_calls, expected_tool_calls
+    ):
         # Seed-OSS tool call will not generate id
         assert actual_tool_call.type == "function"
         assert actual_tool_call.function == expected_tool_call.function
 
         assert actual_tool_call.function.name == expected_tool_call.function.name
-        assert actual_tool_call.function.arguments == expected_tool_call.function.arguments
+        assert (
+            actual_tool_call.function.arguments == expected_tool_call.function.arguments
+        )
 
 
 def test_extract_tool_calls_no_tools(seed_oss_tool_parser):
     model_output = "This is a test response without any tool calls"
     extracted_tool_calls = seed_oss_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
 
     assert not extracted_tool_calls.tools_called
     assert extracted_tool_calls.tool_calls == []
@@ -104,17 +112,24 @@ def test_extract_tool_calls_no_tools(seed_oss_tool_parser):
     ],
     argnames=["model_output", "expected_tool_calls", "expected_content"],
     argvalues=[
-        ("""<seed:tool_call>\n<function=get_weather>\n"""
-         """<parameter=location>Barcelona, Spain</parameter>\n</function>\n</seed:tool_call>""",
-         [
-             ToolCall(function=FunctionCall(
-                 name="get_weather",
-                 arguments=json.dumps({
-                     "location": "Barcelona, Spain",
-                 }, ),
-             ),
-                      type='function')
-         ], None),
+        (
+            """<seed:tool_call>\n<function=get_weather>\n"""
+            """<parameter=location>Barcelona, Spain</parameter>\n</function>\n</seed:tool_call>""",
+            [
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_weather",
+                        arguments=json.dumps(
+                            {
+                                "location": "Barcelona, Spain",
+                            },
+                        ),
+                    ),
+                    type="function",
+                )
+            ],
+            None,
+        ),
         (
             """<seed:think>The user\'s current thinking budget is 512.</seed:cot_budget_reflect>\nLet me analyze the """
             """question. The user wants to know the weather in Barcelona, Spain. Looking at the functions available, """
@@ -131,13 +146,17 @@ def test_extract_tool_calls_no_tools(seed_oss_tool_parser):
             """<seed:tool_call>\n<function=get_weather>\n<parameter=location>Barcelona, Spain</parameter>\n</function>"""
             """\n</seed:tool_call>""",
             [
-                ToolCall(function=FunctionCall(
-                    name="get_weather",
-                    arguments=json.dumps({
-                        "location": "Barcelona, Spain",
-                    }, ),
-                ),
-                         type='function')
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_weather",
+                        arguments=json.dumps(
+                            {
+                                "location": "Barcelona, Spain",
+                            },
+                        ),
+                    ),
+                    type="function",
+                )
             ],
             """<seed:think>The user\'s current thinking budget is 512.</seed:cot_budget_reflect>\nLet me analyze the """
             """question. The user wants to know the weather in Barcelona, Spain. Looking at the functions available, """
@@ -169,15 +188,18 @@ def test_extract_tool_calls_no_tools(seed_oss_tool_parser):
             """temperature in Celsius.</seed:think><seed:tool_call>\n<function=get_weather>\n<parameter=location>"""
             """Barcelona, Spain</parameter>\n<parameter=unit>celsius</parameter>\n</function>\n</seed:tool_call>""",
             [
-                ToolCall(function=FunctionCall(
-                    name="get_weather",
-                    arguments=json.dumps(
-                        {
-                            "location": "Barcelona, Spain",
-                            "unit": "celsius",
-                        }, ),
-                ),
-                         type='function')
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_weather",
+                        arguments=json.dumps(
+                            {
+                                "location": "Barcelona, Spain",
+                                "unit": "celsius",
+                            },
+                        ),
+                    ),
+                    type="function",
+                )
             ],
             """<seed:think>\nGot it, let\'s see. The user asked for the weather in Barcelona, Spain. """
             """First, I need to remember the function I can use: get_weather. The function requires a """
@@ -196,13 +218,17 @@ def test_extract_tool_calls_no_tools(seed_oss_tool_parser):
         ),
     ],
 )
-def test_extract_tool_calls(seed_oss_tool_parser, sample_tools, model_output,
-                            expected_tool_calls, expected_content):
-    request = ChatCompletionRequest(model=MODEL,
-                                    messages=[],
-                                    tools=sample_tools)
+def test_extract_tool_calls(
+    seed_oss_tool_parser,
+    sample_tools,
+    model_output,
+    expected_tool_calls,
+    expected_content,
+):
+    request = ChatCompletionRequest(model=MODEL, messages=[], tools=sample_tools)
     extracted_tool_calls = seed_oss_tool_parser.extract_tool_calls(
-        model_output, request=request)  # type: ignore[arg-type]
+        model_output, request=request
+    )  # type: ignore[arg-type]
     assert extracted_tool_calls.tools_called
 
     assert_tool_calls(extracted_tool_calls.tool_calls, expected_tool_calls)
@@ -225,7 +251,7 @@ def test_streaming_tool_calls_no_tools(seed_oss_tool_parser):
 
     # Should return the delta text as content
     assert result is not None
-    assert hasattr(result, 'content')
+    assert hasattr(result, "content")
     assert result.content == " without any tool calls."
 
 
@@ -233,10 +259,9 @@ def stream_delta_message_generator(
     seed_oss_tool_parser: SeedOssToolParser,
     seed_oss_tokenizer: AnyTokenizer,
     model_output: str,
-    request: Optional[ChatCompletionRequest] = None
+    request: Optional[ChatCompletionRequest] = None,
 ) -> Generator[DeltaMessage, None, None]:
-    all_token_ids = seed_oss_tokenizer.encode(model_output,
-                                              add_special_tokens=False)
+    all_token_ids = seed_oss_tokenizer.encode(model_output, add_special_tokens=False)
 
     previous_text = ""
     previous_tokens = None
@@ -245,18 +270,19 @@ def stream_delta_message_generator(
     for i, delta_token in enumerate(all_token_ids):
         delta_token_ids = [delta_token]
         previous_token_ids = all_token_ids[:i]
-        current_token_ids = all_token_ids[:i + 1]
-
-        (new_tokens, delta_text, new_prefix_offset,
-         new_read_offset) = detokenize_incrementally(
-             tokenizer=seed_oss_tokenizer,
-             all_input_ids=current_token_ids,
-             prev_tokens=previous_tokens,
-             prefix_offset=prefix_offset,
-             read_offset=read_offset,
-             skip_special_tokens=False,
-             spaces_between_special_tokens=True,
-         )
+        current_token_ids = all_token_ids[: i + 1]
+
+        (new_tokens, delta_text, new_prefix_offset, new_read_offset) = (
+            detokenize_incrementally(
+                tokenizer=seed_oss_tokenizer,
+                all_input_ids=current_token_ids,
+                prev_tokens=previous_tokens,
+                prefix_offset=prefix_offset,
+                read_offset=read_offset,
+                skip_special_tokens=False,
+                spaces_between_special_tokens=True,
+            )
+        )
 
         current_text = previous_text + delta_text
 
@@ -273,8 +299,9 @@ def stream_delta_message_generator(
             yield delta_message
 
         previous_text = current_text
-        previous_tokens = (previous_tokens +
-                           new_tokens if previous_tokens else new_tokens)
+        previous_tokens = (
+            previous_tokens + new_tokens if previous_tokens else new_tokens
+        )
         prefix_offset = new_prefix_offset
         read_offset = new_read_offset
 
@@ -287,22 +314,27 @@ def stream_delta_message_generator(
     ],
     argnames=["model_output", "expected_tool_calls", "expected_content"],
     argvalues=[
-        ("""<seed:think>\n</seed:cot_budget_reflect>\n</seed:cot_budget_reflect>\n"""
-         """The current thinking budget is 0, so I will directly start answering the question.\n</seed:think>\n"""
-         """<seed:tool_call>\n<function=get_weather>\n"""
-         """<parameter=location>Barcelona, Spain</parameter>\n</function>\n</seed:tool_call>""",
-         [
-             ToolCall(function=FunctionCall(
-                 name="get_weather",
-                 arguments=json.dumps({
-                     "location": "Barcelona, Spain",
-                 }, ),
-             ),
-                      type='function')
-         ],
-         """<seed:think>\n</seed:cot_budget_reflect>\n</seed:cot_budget_reflect>\n"""
-         """The current thinking budget is 0, so I will directly start answering the question.\n</seed:think>\n"""
-         ),
+        (
+            """<seed:think>\n</seed:cot_budget_reflect>\n</seed:cot_budget_reflect>\n"""
+            """The current thinking budget is 0, so I will directly start answering the question.\n</seed:think>\n"""
+            """<seed:tool_call>\n<function=get_weather>\n"""
+            """<parameter=location>Barcelona, Spain</parameter>\n</function>\n</seed:tool_call>""",
+            [
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_weather",
+                        arguments=json.dumps(
+                            {
+                                "location": "Barcelona, Spain",
+                            },
+                        ),
+                    ),
+                    type="function",
+                )
+            ],
+            """<seed:think>\n</seed:cot_budget_reflect>\n</seed:cot_budget_reflect>\n"""
+            """The current thinking budget is 0, so I will directly start answering the question.\n</seed:think>\n""",
+        ),
         (
             """<seed:think>The user\'s current thinking budget is 512.</seed:cot_budget_reflect>\nLet me analyze the """
             """question. The user wants to know the weather in Barcelona, Spain. Looking at the functions available, """
@@ -319,13 +351,17 @@ def stream_delta_message_generator(
             """<seed:tool_call>\n<function=get_weather>\n<parameter=location>Barcelona, Spain</parameter>\n</function>"""
             """\n</seed:tool_call>""",
             [
-                ToolCall(function=FunctionCall(
-                    name="get_weather",
-                    arguments=json.dumps({
-                        "location": "Barcelona, Spain",
-                    }, ),
-                ),
-                         type='function')
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_weather",
+                        arguments=json.dumps(
+                            {
+                                "location": "Barcelona, Spain",
+                            },
+                        ),
+                    ),
+                    type="function",
+                )
             ],
             """<seed:think>The user\'s current thinking budget is 512.</seed:cot_budget_reflect>\nLet me analyze the """
             """question. The user wants to know the weather in Barcelona, Spain. Looking at the functions available, """
@@ -357,15 +393,18 @@ def stream_delta_message_generator(
             """temperature in Celsius.</seed:think><seed:tool_call>\n<function=get_weather>\n<parameter=location>"""
             """Barcelona, Spain</parameter>\n<parameter=unit>celsius</parameter>\n</function>\n</seed:tool_call>""",
             [
-                ToolCall(function=FunctionCall(
-                    name="get_weather",
-                    arguments=json.dumps(
-                        {
-                            "location": "Barcelona, Spain",
-                            "unit": "celsius",
-                        }, ),
-                ),
-                         type='function')
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_weather",
+                        arguments=json.dumps(
+                            {
+                                "location": "Barcelona, Spain",
+                                "unit": "celsius",
+                            },
+                        ),
+                    ),
+                    type="function",
+                )
             ],
             """<seed:think>\nGot it, let\'s see. The user asked for the weather in Barcelona, Spain. """
             """First, I need to remember the function I can use: get_weather. The function requires a """
@@ -384,19 +423,23 @@ def stream_delta_message_generator(
         ),
     ],
 )
-def test_streaming_tool_calls(seed_oss_tool_parser, seed_oss_tokenizer,
-                              sample_tools, model_output, expected_tool_calls,
-                              expected_content):
+def test_streaming_tool_calls(
+    seed_oss_tool_parser,
+    seed_oss_tokenizer,
+    sample_tools,
+    model_output,
+    expected_tool_calls,
+    expected_content,
+):
     """Test incremental streaming behavior"""
-    request = ChatCompletionRequest(model=MODEL,
-                                    messages=[],
-                                    tools=sample_tools)
+    request = ChatCompletionRequest(model=MODEL, messages=[], tools=sample_tools)
 
-    other_content = ''
+    other_content = ""
     tool_states = {}  # Track state per tool index
 
     for delta_message in stream_delta_message_generator(
-            seed_oss_tool_parser, seed_oss_tokenizer, model_output, request):
+        seed_oss_tool_parser, seed_oss_tokenizer, model_output, request
+    ):
         # role should never be streamed from tool parser
         assert not delta_message.role
 
@@ -413,7 +456,7 @@ def test_streaming_tool_calls(seed_oss_tool_parser, seed_oss_tokenizer,
                         "id": None,
                         "name": None,
                         "arguments": "",
-                        "type": None
+                        "type": None,
                     }
 
                 # First chunk should have id, name, and type
@@ -432,8 +475,7 @@ def test_streaming_tool_calls(seed_oss_tool_parser, seed_oss_tokenizer,
 
                     if tool_call.function.arguments is not None:
                         # Accumulate arguments incrementally
-                        tool_states[idx][
-                            "arguments"] += tool_call.function.arguments
+                        tool_states[idx]["arguments"] += tool_call.function.arguments
 
     # Verify final content
     assert other_content == expected_content
diff --git a/tests/tool_use/test_tool_calls.py b/tests/tool_use/test_tool_calls.py
index 53ba03a0ae10..64186aaac6a7 100644
--- a/tests/tool_use/test_tool_calls.py
+++ b/tests/tool_use/test_tool_calls.py
@@ -7,8 +7,12 @@
 import openai
 import pytest
 
-from .utils import (MESSAGES_ASKING_FOR_TOOLS, MESSAGES_WITH_TOOL_RESPONSE,
-                    SEARCH_TOOL, WEATHER_TOOL)
+from .utils import (
+    MESSAGES_ASKING_FOR_TOOLS,
+    MESSAGES_WITH_TOOL_RESPONSE,
+    SEARCH_TOOL,
+    WEATHER_TOOL,
+)
 
 
 # test: request a chat completion that should return tool calls, so we know they
@@ -23,17 +27,18 @@ async def test_tool_call_and_choice(client: openai.AsyncOpenAI):
         max_completion_tokens=100,
         model=model_name,
         tools=[WEATHER_TOOL, SEARCH_TOOL],
-        logprobs=False)
+        logprobs=False,
+    )
 
     choice = chat_completion.choices[0]
     stop_reason = chat_completion.choices[0].finish_reason
     tool_calls = chat_completion.choices[0].message.tool_calls
 
     # make sure a tool call is present
-    assert choice.message.role == 'assistant'
+    assert choice.message.role == "assistant"
     assert tool_calls is not None
     assert len(tool_calls) == 1
-    assert tool_calls[0].type == 'function'
+    assert tool_calls[0].type == "function"
     assert tool_calls[0].function is not None
     assert isinstance(tool_calls[0].id, str)
     assert len(tool_calls[0].id) >= 9
@@ -54,7 +59,7 @@ async def test_tool_call_and_choice(client: openai.AsyncOpenAI):
     assert stop_reason == "tool_calls"
 
     function_name: Optional[str] = None
-    function_args_str: str = ''
+    function_args_str: str = ""
     tool_call_id: Optional[str] = None
     role_name: Optional[str] = None
     finish_reason_count: int = 0
@@ -67,20 +72,21 @@ async def test_tool_call_and_choice(client: openai.AsyncOpenAI):
         max_completion_tokens=100,
         tools=[WEATHER_TOOL, SEARCH_TOOL],
         logprobs=False,
-        stream=True)
+        stream=True,
+    )
 
     async for chunk in stream:
         assert chunk.choices[0].index == 0
 
         if chunk.choices[0].finish_reason:
             finish_reason_count += 1
-            assert chunk.choices[0].finish_reason == 'tool_calls'
+            assert chunk.choices[0].finish_reason == "tool_calls"
 
         # if a role is being streamed make sure it wasn't already set to
         # something else
         if chunk.choices[0].delta.role:
-            assert not role_name or role_name == 'assistant'
-            role_name = 'assistant'
+            assert not role_name or role_name == "assistant"
+            role_name = "assistant"
 
         # if a tool call is streamed make sure there's exactly one
         # (based on the request parameters
@@ -108,7 +114,7 @@ async def test_tool_call_and_choice(client: openai.AsyncOpenAI):
                     function_args_str += tool_call.function.arguments
 
     assert finish_reason_count == 1
-    assert role_name == 'assistant'
+    assert role_name == "assistant"
     assert isinstance(tool_call_id, str) and (len(tool_call_id) >= 9)
 
     # validate the name and arguments
@@ -148,14 +154,14 @@ async def test_tool_call_with_results(client: openai.AsyncOpenAI):
         max_completion_tokens=100,
         model=model_name,
         tools=[WEATHER_TOOL, SEARCH_TOOL],
-        logprobs=False)
+        logprobs=False,
+    )
 
     choice = chat_completion.choices[0]
 
     assert choice.finish_reason != "tool_calls"  # "stop" or "length"
     assert choice.message.role == "assistant"
-    assert choice.message.tool_calls is None \
-           or len(choice.message.tool_calls) == 0
+    assert choice.message.tool_calls is None or len(choice.message.tool_calls) == 0
     assert choice.message.content is not None
     assert "98" in choice.message.content  # the temperature from the response
 
@@ -166,7 +172,8 @@ async def test_tool_call_with_results(client: openai.AsyncOpenAI):
         model=model_name,
         tools=[WEATHER_TOOL, SEARCH_TOOL],
         logprobs=False,
-        stream=True)
+        stream=True,
+    )
 
     chunks: list[str] = []
     finish_reason_count = 0
diff --git a/tests/tool_use/test_tool_choice_required.py b/tests/tool_use/test_tool_choice_required.py
index 7c63816cd6f5..0d0b8ccf0b80 100644
--- a/tests/tool_use/test_tool_choice_required.py
+++ b/tests/tool_use/test_tool_choice_required.py
@@ -8,8 +8,10 @@
 import regex as re
 from pydantic import TypeAdapter
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              ChatCompletionToolsParam)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    ChatCompletionToolsParam,
+)
 from vllm.entrypoints.openai.serving_chat import OpenAIServingChat
 
 pytestmark = pytest.mark.cpu_test
@@ -24,18 +26,16 @@
                 "type": "object",
                 "properties": {
                     "city": {
-                        "type":
-                        "string",
-                        "description":
-                        "The city to find the weather for"
+                        "type": "string",
+                        "description": "The city to find the weather for"
                         ", e.g. 'San Francisco'",
                     },
                 },
                 "required": ["city"],
-                "additionalProperties": False
+                "additionalProperties": False,
             },
         },
-        "strict": True
+        "strict": True,
     },
     {
         "type": "function",
@@ -46,35 +46,33 @@
                 "type": "object",
                 "properties": {
                     "city": {
-                        "type":
-                        "string",
-                        "description":
-                        "The city to get the forecast for, e.g. 'New York'",
+                        "type": "string",
+                        "description": "The city to get the forecast for, e.g. 'New York'",
                     },
                     "days": {
-                        "type":
-                        "integer",
-                        "description":
-                        "Number of days to get the forecast for (1-7)",
+                        "type": "integer",
+                        "description": "Number of days to get the forecast for (1-7)",
                     },
                 },
                 "required": ["city", "days"],
-                "additionalProperties": False
+                "additionalProperties": False,
             },
         },
-        "strict": True
+        "strict": True,
     },
 ]
 
 
-def _compile_and_check(tools: list[ChatCompletionToolsParam], sample_output,
-                       should_match: bool):
+def _compile_and_check(
+    tools: list[ChatCompletionToolsParam], sample_output, should_match: bool
+):
     self = MagicMock(tool_choice="required", tools=tools)
     schema = ChatCompletionRequest._get_json_schema_from_tool(self)
     assert isinstance(schema, dict)
 
     # use build_regex_from_schema used in JSONLogitsProcessor to create Guide
     from outlines_core.json_schema import build_regex_from_schema
+
     regex = build_regex_from_schema(json.dumps(schema))
     compiled = re.compile(regex)
     matches = compiled.fullmatch(json.dumps(sample_output)) is not None
@@ -83,65 +81,31 @@ def _compile_and_check(tools: list[ChatCompletionToolsParam], sample_output,
 
 
 VALID_TOOL_OUTPUTS = [
-    ([{
-        "name": "get_current_weather",
-        "parameters": {
-            "city": "Vienna"
-        }
-    }], True),
-    ([{
-        "name": "get_current_weather",
-        "parameters": {
-            "city": "Vienna"
-        }
-    }, {
-        "name": "get_current_weather",
-        "parameters": {
-            "city": "Berlin"
-        }
-    }], True),
-    ([{
-        "name": "get_forecast",
-        "parameters": {
-            "city": "Vienna",
-            "days": 7
-        }
-    }], True),
-    ([{
-        "name": "get_forecast",
-        "parameters": {
-            "city": "Vienna",
-            "days": 7
-        }
-    }, {
-        "name": "get_current_weather",
-        "parameters": {
-            "city": "Vienna"
-        }
-    }], True),
-    ([{
-        "name": "get_forecast",
-        "parameters": {
-            "city": "Vienna",
-            "days": 7
-        }
-    }, {
-        "name": "get_current_weather",
-        "parameters": {
-            "city": "Vienna"
-        }
-    }, {
-        "name": "get_forecast",
-        "parameters": {
-            "city": "Berlin",
-            "days": 7
-        }
-    }, {
-        "name": "get_current_weather",
-        "parameters": {
-            "city": "Berlin"
-        }
-    }], True),
+    ([{"name": "get_current_weather", "parameters": {"city": "Vienna"}}], True),
+    (
+        [
+            {"name": "get_current_weather", "parameters": {"city": "Vienna"}},
+            {"name": "get_current_weather", "parameters": {"city": "Berlin"}},
+        ],
+        True,
+    ),
+    ([{"name": "get_forecast", "parameters": {"city": "Vienna", "days": 7}}], True),
+    (
+        [
+            {"name": "get_forecast", "parameters": {"city": "Vienna", "days": 7}},
+            {"name": "get_current_weather", "parameters": {"city": "Vienna"}},
+        ],
+        True,
+    ),
+    (
+        [
+            {"name": "get_forecast", "parameters": {"city": "Vienna", "days": 7}},
+            {"name": "get_current_weather", "parameters": {"city": "Vienna"}},
+            {"name": "get_forecast", "parameters": {"city": "Berlin", "days": 7}},
+            {"name": "get_current_weather", "parameters": {"city": "Berlin"}},
+        ],
+        True,
+    ),
 ]
 
 VALID_TOOLS = [t[0] for t in VALID_TOOL_OUTPUTS]
@@ -149,92 +113,100 @@ def _compile_and_check(tools: list[ChatCompletionToolsParam], sample_output,
 
 @pytest.mark.parametrize(
     "sample_output, should_match",
-    VALID_TOOL_OUTPUTS + [
+    VALID_TOOL_OUTPUTS
+    + [
         (None, False),
         ([], False),  # empty list cannot be generated
         ({}, False),  # empty object cannot be generated
         ([{}], False),  # list with empty object cannot be generated
         (
-            [{  # function without required parameters cannot be generated
-                "name": "get_current_weather"
-            }],
-            False),
+            [
+                {  # function without required parameters cannot be generated
+                    "name": "get_current_weather"
+                }
+            ],
+            False,
+        ),
         (
-            [{  # function without required parameters cannot be generated
-                "name": "get_current_weather",
-                "parameters": {}
-            }],
-            False),
+            [
+                {  # function without required parameters cannot be generated
+                    "name": "get_current_weather",
+                    "parameters": {},
+                }
+            ],
+            False,
+        ),
         (
-            [{  # function without required parameters cannot be generated
-                "name": "get_current_weather",
-                "parameters": None
-            }],
-            False),
+            [
+                {  # function without required parameters cannot be generated
+                    "name": "get_current_weather",
+                    "parameters": None,
+                }
+            ],
+            False,
+        ),
         (
             {  # tool call without lists cannot be generated
                 "name": "get_current_weather",
-                "parameters": {
-                    "city": "Vienna"
-                }
+                "parameters": {"city": "Vienna"},
             },
-            False),
+            False,
+        ),
         (
-            [{  # tool call with extra parameters cannot be generated
-                "name": "get_current_weather",
-                "parameters": {
-                    "city": "Vienna",
-                    "extra": "value"
+            [
+                {  # tool call with extra parameters cannot be generated
+                    "name": "get_current_weather",
+                    "parameters": {"city": "Vienna", "extra": "value"},
                 }
-            }],
-            False),
+            ],
+            False,
+        ),
         (
-            [{  # tool call where parameters are first cannot be generated
-                "parameters": {
-                    "city": "Vienna"
-                },
-                "name": "get_current_weather"
-            }],
-            False),
+            [
+                {  # tool call where parameters are first cannot be generated
+                    "parameters": {"city": "Vienna"},
+                    "name": "get_current_weather",
+                }
+            ],
+            False,
+        ),
         (
-            [{  # tool call without all required parameters cannot be generated
-                "name": "get_forecast",
-                "parameters": {
-                    "city": "Vienna"
+            [
+                {  # tool call without all required parameters cannot be generated
+                    "name": "get_forecast",
+                    "parameters": {"city": "Vienna"},
                 }
-            }],
-            False),
+            ],
+            False,
+        ),
         (  # tool call with incorrect name/parameters cannot be generated
-            [{
-                "name": "get_weather",
-                "parameters": {
-                    "city": "Vienna",
-                    "days": 7
-                }
-            }], False),
+            [{"name": "get_weather", "parameters": {"city": "Vienna", "days": 7}}],
+            False,
+        ),
         (  #  tool call with both valid and empty function cannot be generated
-            [{
-                "name": "get_current_weather",
-                "parameters": {
-                    "city": "Vienna"
-                }
-            }, {}], False),
-    ])
+            [{"name": "get_current_weather", "parameters": {"city": "Vienna"}}, {}],
+            False,
+        ),
+    ],
+)
 def test_structured_outputs_json(sample_output, should_match):
-    _compile_and_check(tools=TypeAdapter(
-        list[ChatCompletionToolsParam]).validate_python(EXAMPLE_TOOLS),
-                       sample_output=sample_output,
-                       should_match=should_match)
+    _compile_and_check(
+        tools=TypeAdapter(list[ChatCompletionToolsParam]).validate_python(
+            EXAMPLE_TOOLS
+        ),
+        sample_output=sample_output,
+        should_match=should_match,
+    )
 
 
-def update_parameters_none(
-        tool: ChatCompletionToolsParam) -> ChatCompletionToolsParam:
+def update_parameters_none(tool: ChatCompletionToolsParam) -> ChatCompletionToolsParam:
     tool.function.parameters = None
     return tool
 
 
 def update_parameters_empty_dict(
-        tool: ChatCompletionToolsParam) -> ChatCompletionToolsParam:
+    tool: ChatCompletionToolsParam,
+) -> ChatCompletionToolsParam:
     tool.function.parameters = {}
     return tool
 
@@ -247,48 +219,60 @@ def update_parameters_empty_dict(
         ({}, False),  # empty object cannot be generated
         ([{}], False),  # list with empty object cannot be generated
         (
-            [{  # function without required parameters cannot be generated
-                "name": "get_current_weather"
-            }],
-            False),
+            [
+                {  # function without required parameters cannot be generated
+                    "name": "get_current_weather"
+                }
+            ],
+            False,
+        ),
         (
-            [{  # function without required parameters cannot be generated
-                "name": "get_current_weather",
-                "parameters": None
-            }],
-            False),
+            [
+                {  # function without required parameters cannot be generated
+                    "name": "get_current_weather",
+                    "parameters": None,
+                }
+            ],
+            False,
+        ),
         (
-            [{  # function with extra parameters cannot be generated
-                "name": "get_current_weather",
-                "parameters": {
-                    "extra": "value"
+            [
+                {  # function with extra parameters cannot be generated
+                    "name": "get_current_weather",
+                    "parameters": {"extra": "value"},
                 }
-            }],
-            False),
+            ],
+            False,
+        ),
         (
-            [{  # only function with empty parameters object is valid
-                "name": "get_current_weather",
-                "parameters": {}
-            }],
-            True),
-    ])
+            [
+                {  # only function with empty parameters object is valid
+                    "name": "get_current_weather",
+                    "parameters": {},
+                }
+            ],
+            True,
+        ),
+    ],
+)
 @pytest.mark.parametrize(
-    "update_parameters",
-    [update_parameters_none, update_parameters_empty_dict])
-def test_structured_outputs_json_without_parameters(sample_output,
-                                                    should_match,
-                                                    update_parameters):
+    "update_parameters", [update_parameters_none, update_parameters_empty_dict]
+)
+def test_structured_outputs_json_without_parameters(
+    sample_output, should_match, update_parameters
+):
     updated_tools = [deepcopy(EXAMPLE_TOOLS[0])]
-    tools = TypeAdapter(
-        list[ChatCompletionToolsParam]).validate_python(updated_tools)
+    tools = TypeAdapter(list[ChatCompletionToolsParam]).validate_python(updated_tools)
     tools = list(map(update_parameters, tools))
-    assert all([
-        tool.function.parameters is None or tool.function.parameters == {}
-        for tool in tools
-    ])
-    _compile_and_check(tools=tools,
-                       sample_output=sample_output,
-                       should_match=should_match)
+    assert all(
+        [
+            tool.function.parameters is None or tool.function.parameters == {}
+            for tool in tools
+        ]
+    )
+    _compile_and_check(
+        tools=tools, sample_output=sample_output, should_match=should_match
+    )
 
 
 @pytest.mark.parametrize("output", VALID_TOOLS)
@@ -306,7 +290,7 @@ def test_streaming_output_valid(output, empty_params, delta_len):
     function_name_returned = False
     messages = []
     for i in range(0, len(output_json), delta_len):
-        delta_text = output_json[i:i + delta_len]
+        delta_text = output_json[i : i + delta_len]
         current_text = previous_text + delta_text
 
         delta_message, function_name_returned = (
@@ -315,7 +299,9 @@ def test_streaming_output_valid(output, empty_params, delta_len):
                 previous_text=previous_text,
                 current_text=current_text,
                 delta_text=delta_text,
-                function_name_returned=function_name_returned))
+                function_name_returned=function_name_returned,
+            )
+        )
 
         if delta_message:
             messages.append(delta_message)
@@ -329,10 +315,12 @@ def test_streaming_output_valid(output, empty_params, delta_len):
             if len(combined_messages) > 1:
                 combined_messages += "},"
 
-            combined_messages += '{"name": "' + \
-                message.tool_calls[0].function.name  + \
-                    '", "parameters": ' + \
-                        message.tool_calls[0].function.arguments
+            combined_messages += (
+                '{"name": "'
+                + message.tool_calls[0].function.name
+                + '", "parameters": '
+                + message.tool_calls[0].function.arguments
+            )
         else:
             combined_messages += message.tool_calls[0].function.arguments
     combined_messages += "}]"
diff --git a/tests/tool_use/test_xlam_tool_parser.py b/tests/tool_use/test_xlam_tool_parser.py
index 94e2a37cbf63..bdac878db4e7 100644
--- a/tests/tool_use/test_xlam_tool_parser.py
+++ b/tests/tool_use/test_xlam_tool_parser.py
@@ -7,9 +7,12 @@
 
 import pytest
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaMessage, FunctionCall,
-                                              ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaMessage,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers import xLAMToolParser
 from vllm.transformers_utils.detokenizer_utils import detokenize_incrementally
 from vllm.transformers_utils.tokenizer import AnyTokenizer, get_tokenizer
@@ -30,12 +33,14 @@ def xlam_tool_parser(xlam_tokenizer):
     return xLAMToolParser(xlam_tokenizer)
 
 
-def assert_tool_calls(actual_tool_calls: list[ToolCall],
-                      expected_tool_calls: list[ToolCall]):
+def assert_tool_calls(
+    actual_tool_calls: list[ToolCall], expected_tool_calls: list[ToolCall]
+):
     assert len(actual_tool_calls) == len(expected_tool_calls)
 
-    for actual_tool_call, expected_tool_call in zip(actual_tool_calls,
-                                                    expected_tool_calls):
+    for actual_tool_call, expected_tool_call in zip(
+        actual_tool_calls, expected_tool_calls
+    ):
         assert isinstance(actual_tool_call.id, str)
         assert len(actual_tool_call.id) > 16
 
@@ -49,8 +54,7 @@ def stream_delta_message_generator(
     model_output: str,
     request: Optional[ChatCompletionRequest] = None,
 ) -> Generator[DeltaMessage, None, None]:
-    all_token_ids = xlam_tokenizer.encode(model_output,
-                                          add_special_tokens=False)
+    all_token_ids = xlam_tokenizer.encode(model_output, add_special_tokens=False)
 
     previous_text = ""
     previous_tokens = None
@@ -59,18 +63,19 @@ def stream_delta_message_generator(
     for i, delta_token in enumerate(all_token_ids):
         delta_token_ids = [delta_token]
         previous_token_ids = all_token_ids[:i]
-        current_token_ids = all_token_ids[:i + 1]
-
-        (new_tokens, delta_text, new_prefix_offset,
-         new_read_offset) = (detokenize_incrementally(
-             tokenizer=xlam_tokenizer,
-             all_input_ids=current_token_ids,
-             prev_tokens=previous_tokens,
-             prefix_offset=prefix_offset,
-             read_offset=read_offset,
-             skip_special_tokens=False,
-             spaces_between_special_tokens=True,
-         ))
+        current_token_ids = all_token_ids[: i + 1]
+
+        (new_tokens, delta_text, new_prefix_offset, new_read_offset) = (
+            detokenize_incrementally(
+                tokenizer=xlam_tokenizer,
+                all_input_ids=current_token_ids,
+                prev_tokens=previous_tokens,
+                prefix_offset=prefix_offset,
+                read_offset=read_offset,
+                skip_special_tokens=False,
+                spaces_between_special_tokens=True,
+            )
+        )
 
         current_text = previous_text + delta_text
 
@@ -87,8 +92,9 @@ def stream_delta_message_generator(
             yield delta_message
 
         previous_text = current_text
-        previous_tokens = (previous_tokens +
-                           new_tokens if previous_tokens else new_tokens)
+        previous_tokens = (
+            previous_tokens + new_tokens if previous_tokens else new_tokens
+        )
         prefix_offset = new_prefix_offset
         read_offset = new_read_offset
 
@@ -96,7 +102,8 @@ def stream_delta_message_generator(
 def test_extract_tool_calls_no_tools(xlam_tool_parser):
     model_output = "This is a test"
     extracted_tool_calls = xlam_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
     assert not extracted_tool_calls.tools_called
     assert extracted_tool_calls.tool_calls == []
     assert extracted_tool_calls.content == model_output
@@ -115,87 +122,113 @@ def test_extract_tool_calls_no_tools(xlam_tool_parser):
         (
             """[{"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}, {"name": "get_current_weather", "arguments": {"city": "Orlando", "state": "FL", "unit": "fahrenheit"}}]""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Dallas",
-                        "state": "TX",
-                        "unit": "fahrenheit",
-                    }),
-                )),
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Orlando",
-                        "state": "FL",
-                        "unit": "fahrenheit",
-                    }),
-                )),
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Dallas",
+                                "state": "TX",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                ),
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Orlando",
+                                "state": "FL",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                ),
             ],
             None,
         ),
         (
             """<think>I'll help you with that.</think>[{"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}]""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Dallas",
-                        "state": "TX",
-                        "unit": "fahrenheit",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Dallas",
+                                "state": "TX",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                )
             ],
             "<think>I'll help you with that.</think>",
         ),
         (
             """I'll help you with that.\n```json\n[{"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}]\n```""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Dallas",
-                        "state": "TX",
-                        "unit": "fahrenheit",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Dallas",
+                                "state": "TX",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                )
             ],
             "I'll help you with that.",
         ),
         (
             """I'll check the weather for you.[TOOL_CALLS][{"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}]""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Dallas",
-                        "state": "TX",
-                        "unit": "fahrenheit",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Dallas",
+                                "state": "TX",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                )
             ],
             "I'll check the weather for you.",
         ),
         (
             """I'll help you check the weather.<tool_call>[{"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}]</tool_call>""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Dallas",
-                        "state": "TX",
-                        "unit": "fahrenheit",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Dallas",
+                                "state": "TX",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                )
             ],
             "I'll help you check the weather.",
         ),
     ],
 )
-def test_extract_tool_calls(xlam_tool_parser, model_output,
-                            expected_tool_calls, expected_content):
+def test_extract_tool_calls(
+    xlam_tool_parser, model_output, expected_tool_calls, expected_content
+):
     extracted_tool_calls = xlam_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
     assert extracted_tool_calls.tools_called
 
     assert_tool_calls(extracted_tool_calls.tool_calls, expected_tool_calls)
@@ -210,25 +243,30 @@ def test_extract_tool_calls(xlam_tool_parser, model_output,
         (
             """[{"name": "get_current_weather", "arguments": {"city": "Seattle", "state": "WA", "unit": "celsius"}}]""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Seattle",
-                        "state": "WA",
-                        "unit": "celsius",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Seattle",
+                                "state": "WA",
+                                "unit": "celsius",
+                            }
+                        ),
+                    )
+                )
             ],
             None,
         ),
     ],
 )
-def test_extract_tool_calls_list_structure(xlam_tool_parser, model_output,
-                                           expected_tool_calls,
-                                           expected_content):
+def test_extract_tool_calls_list_structure(
+    xlam_tool_parser, model_output, expected_tool_calls, expected_content
+):
     """Test extraction of tool calls when the model outputs a list-structured tool call."""  # noqa: E501
     extracted_tool_calls = xlam_tool_parser.extract_tool_calls(
-        model_output, request=None)  # type: ignore[arg-type]
+        model_output, request=None
+    )  # type: ignore[arg-type]
     assert extracted_tool_calls.tools_called
 
     assert_tool_calls(extracted_tool_calls.tool_calls, expected_tool_calls)
@@ -239,20 +277,25 @@ def test_extract_tool_calls_list_structure(xlam_tool_parser, model_output,
 # Test for preprocess_model_output method
 def test_preprocess_model_output(xlam_tool_parser):
     # Test with list structure
-    model_output = """[{"name": "get_current_weather", "arguments": {"city": "Seattle"}}]"""  # noqa: E501
+    model_output = (
+        """[{"name": "get_current_weather", "arguments": {"city": "Seattle"}}]"""  # noqa: E501
+    )
     content, potential_tool_calls = xlam_tool_parser.preprocess_model_output(
-        model_output)
+        model_output
+    )
     assert content is None
     assert potential_tool_calls == model_output
 
     # Test with thinking tag
     model_output = """<think>I'll help you with that.</think>[{"name": "get_current_weather", "arguments": {"city": "Seattle"}}]"""  # noqa: E501
     content, potential_tool_calls = xlam_tool_parser.preprocess_model_output(
-        model_output)
+        model_output
+    )
     assert content == "<think>I'll help you with that.</think>"
     assert (
-        potential_tool_calls ==
-        '[{"name": "get_current_weather", "arguments": {"city": "Seattle"}}]')
+        potential_tool_calls
+        == '[{"name": "get_current_weather", "arguments": {"city": "Seattle"}}]'
+    )
 
     # Test with JSON code block
     model_output = """I'll help you with that.
@@ -260,14 +303,16 @@ def test_preprocess_model_output(xlam_tool_parser):
 [{"name": "get_current_weather", "arguments": {"city": "Seattle"}}]
 ```"""
     content, potential_tool_calls = xlam_tool_parser.preprocess_model_output(
-        model_output)
+        model_output
+    )
     assert content == "I'll help you with that."
     assert "get_current_weather" in potential_tool_calls
 
     # Test with no tool calls
     model_output = """I'll help you with that."""
     content, potential_tool_calls = xlam_tool_parser.preprocess_model_output(
-        model_output)
+        model_output
+    )
     assert content == model_output
     assert potential_tool_calls is None
 
@@ -281,7 +326,9 @@ def test_streaming_with_list_structure(xlam_tool_parser):
     xlam_tool_parser.current_tool_id = -1
 
     # Simulate receiving a message with list structure
-    current_text = """[{"name": "get_current_weather", "arguments": {"city": "Seattle"}}]"""  # noqa: E501
+    current_text = (
+        """[{"name": "get_current_weather", "arguments": {"city": "Seattle"}}]"""  # noqa: E501
+    )
 
     # First call to set up the tool
     xlam_tool_parser.extract_tool_calls_streaming(
@@ -295,8 +342,7 @@ def test_streaming_with_list_structure(xlam_tool_parser):
     )
 
     # Make sure the tool is set up correctly
-    assert (xlam_tool_parser.current_tool_id
-            >= 0), "Tool index should be initialized"
+    assert xlam_tool_parser.current_tool_id >= 0, "Tool index should be initialized"
 
     # Manually set up the state for sending the tool name
     xlam_tool_parser.current_tools_sent = [False]
@@ -332,78 +378,102 @@ def test_streaming_with_list_structure(xlam_tool_parser):
         (
             """[{"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}, {"name": "get_current_weather", "arguments": {"city": "Orlando", "state": "FL", "unit": "fahrenheit"}}]""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Dallas",
-                        "state": "TX",
-                        "unit": "fahrenheit",
-                    }),
-                )),
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Orlando",
-                        "state": "FL",
-                        "unit": "fahrenheit",
-                    }),
-                )),
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Dallas",
+                                "state": "TX",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                ),
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Orlando",
+                                "state": "FL",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                ),
             ],
             "",
         ),
         (
             """<think>I'll help you with that.</think>[{"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}]""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Dallas",
-                        "state": "TX",
-                        "unit": "fahrenheit",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Dallas",
+                                "state": "TX",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                )
             ],
             "<think>I'll help you with that.</think>",
         ),
         (
             """```json\n[{"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}]\n```""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Dallas",
-                        "state": "TX",
-                        "unit": "fahrenheit",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Dallas",
+                                "state": "TX",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                )
             ],
             "",
         ),
         (
             """[TOOL_CALLS][{"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}]""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Dallas",
-                        "state": "TX",
-                        "unit": "fahrenheit",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Dallas",
+                                "state": "TX",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                )
             ],
             "",
         ),
         (
             """I can help with that.<tool_call>[{"name": "get_current_weather", "arguments": {"city": "Dallas", "state": "TX", "unit": "fahrenheit"}}]</tool_call>""",  # noqa: E501
             [
-                ToolCall(function=FunctionCall(
-                    name="get_current_weather",
-                    arguments=json.dumps({
-                        "city": "Dallas",
-                        "state": "TX",
-                        "unit": "fahrenheit",
-                    }),
-                ))
+                ToolCall(
+                    function=FunctionCall(
+                        name="get_current_weather",
+                        arguments=json.dumps(
+                            {
+                                "city": "Dallas",
+                                "state": "TX",
+                                "unit": "fahrenheit",
+                            }
+                        ),
+                    )
+                )
             ],
             "I can help with that.",
         ),
@@ -421,7 +491,8 @@ def test_extract_tool_calls_streaming_incremental(
 
     chunks = []
     for delta_message in stream_delta_message_generator(
-            xlam_tool_parser, xlam_tokenizer, model_output, request):
+        xlam_tool_parser, xlam_tokenizer, model_output, request
+    ):
         chunks.append(delta_message)
 
     # Should have multiple chunks
@@ -433,8 +504,9 @@ def test_extract_tool_calls_streaming_incremental(
     for chunk in chunks:
         if chunk.tool_calls and chunk.tool_calls[0].id:
             header_found = True
-            assert (chunk.tool_calls[0].function.name ==
-                    expected_first_tool.function.name)
+            assert (
+                chunk.tool_calls[0].function.name == expected_first_tool.function.name
+            )
             assert chunk.tool_calls[0].type == "function"
             # Arguments may be empty initially or None
             if chunk.tool_calls[0].function.arguments is not None:
@@ -446,11 +518,13 @@ def test_extract_tool_calls_streaming_incremental(
     # Should have chunks with incremental arguments
     arg_chunks = []
     for chunk in chunks:
-        if (chunk.tool_calls and chunk.tool_calls[0].function.arguments
-                and chunk.tool_calls[0].function.arguments != ""
-                and chunk.tool_calls[0].index ==
-                0  # Only collect arguments from the first tool call
-            ):
+        if (
+            chunk.tool_calls
+            and chunk.tool_calls[0].function.arguments
+            and chunk.tool_calls[0].function.arguments != ""
+            and chunk.tool_calls[0].index
+            == 0  # Only collect arguments from the first tool call
+        ):
             arg_chunks.append(chunk.tool_calls[0].function.arguments)
 
     # Arguments should be streamed incrementally
diff --git a/tests/tool_use/utils.py b/tests/tool_use/utils.py
index a17fab9aecbc..835d07608e40 100644
--- a/tests/tool_use/utils.py
+++ b/tests/tool_use/utils.py
@@ -4,8 +4,7 @@
 from copy import deepcopy
 from typing import Any, Optional
 
-from openai.types.chat import (ChatCompletionMessageParam,
-                               ChatCompletionToolParam)
+from openai.types.chat import ChatCompletionMessageParam, ChatCompletionToolParam
 from typing_extensions import TypedDict
 
 from tests.utils import VLLM_PATH
@@ -20,8 +19,9 @@ class ServerConfig(TypedDict, total=False):
     extended: Optional[bool]  # tests do not run in CI automatically
 
 
-def patch_system_prompt(messages: list[dict[str, Any]],
-                        system_prompt: str) -> list[dict[str, Any]]:
+def patch_system_prompt(
+    messages: list[dict[str, Any]], system_prompt: str
+) -> list[dict[str, Any]]:
     new_messages = deepcopy(messages)
     if new_messages[0]["role"] == "system":
         new_messages[0]["content"] = system_prompt
@@ -30,8 +30,9 @@ def patch_system_prompt(messages: list[dict[str, Any]],
     return new_messages
 
 
-def ensure_system_prompt(messages: list[dict[str, Any]],
-                         config: ServerConfig) -> list[dict[str, Any]]:
+def ensure_system_prompt(
+    messages: list[dict[str, Any]], config: ServerConfig
+) -> list[dict[str, Any]]:
     prompt = config.get("system_prompt")
     if prompt:
         return patch_system_prompt(messages, prompt)
@@ -42,92 +43,102 @@ def ensure_system_prompt(messages: list[dict[str, Any]],
 # universal args for all models go here. also good if you need to test locally
 # and change type or KV cache quantization or something.
 ARGS: list[str] = [
-    "--enable-auto-tool-choice", "--max-model-len", "1024", "--max-num-seqs",
-    "256"
+    "--enable-auto-tool-choice",
+    "--max-model-len",
+    "1024",
+    "--max-num-seqs",
+    "256",
 ]
 
 CONFIGS: dict[str, ServerConfig] = {
     "hermes": {
-        "model":
-        "NousResearch/Hermes-3-Llama-3.1-8B",
+        "model": "NousResearch/Hermes-3-Llama-3.1-8B",
         "arguments": [
-            "--enforce-eager", "--no-enable-prefix-caching",
-            "--tool-call-parser", "hermes", "--chat-template",
-            str(VLLM_PATH / "examples/tool_chat_template_hermes.jinja")
+            "--enforce-eager",
+            "--no-enable-prefix-caching",
+            "--tool-call-parser",
+            "hermes",
+            "--chat-template",
+            str(VLLM_PATH / "examples/tool_chat_template_hermes.jinja"),
         ],
-        "system_prompt":
-        "You are a helpful assistant with access to tools. If a tool"
+        "system_prompt": "You are a helpful assistant with access to tools. If a tool"
         " that you have would be helpful to answer a user query, "
         "call the tool. Otherwise, answer the user's query directly "
         "without calling a tool. DO NOT CALL A TOOL THAT IS IRRELEVANT "
-        "to the user's question - just respond to it normally."
+        "to the user's question - just respond to it normally.",
     },
     "llama": {
-        "model":
-        "meta-llama/Meta-Llama-3.1-8B-Instruct",
+        "model": "meta-llama/Meta-Llama-3.1-8B-Instruct",
         "arguments": [
-            "--enforce-eager", "--no-enable-prefix-caching",
-            "--tool-call-parser", "llama3_json", "--chat-template",
-            str(VLLM_PATH / "examples/tool_chat_template_llama3.1_json.jinja")
+            "--enforce-eager",
+            "--no-enable-prefix-caching",
+            "--tool-call-parser",
+            "llama3_json",
+            "--chat-template",
+            str(VLLM_PATH / "examples/tool_chat_template_llama3.1_json.jinja"),
         ],
-        "supports_parallel":
-        False,
+        "supports_parallel": False,
     },
     "llama3.2": {
-        "model":
-        "meta-llama/Llama-3.2-3B-Instruct",
+        "model": "meta-llama/Llama-3.2-3B-Instruct",
         "arguments": [
-            "--enforce-eager", "--no-enable-prefix-caching",
-            "--tool-call-parser", "llama3_json", "--chat-template",
-            str(VLLM_PATH / "examples/tool_chat_template_llama3.2_json.jinja")
+            "--enforce-eager",
+            "--no-enable-prefix-caching",
+            "--tool-call-parser",
+            "llama3_json",
+            "--chat-template",
+            str(VLLM_PATH / "examples/tool_chat_template_llama3.2_json.jinja"),
         ],
-        "supports_parallel":
-        False,
+        "supports_parallel": False,
     },
     "llama4": {
-        "model":
-        "meta-llama/Llama-4-Scout-17B-16E-Instruct",
+        "model": "meta-llama/Llama-4-Scout-17B-16E-Instruct",
         "arguments": [
-            "--enforce-eager", "--no-enable-prefix-caching",
-            "--tool-call-parser", "llama4_pythonic", "--chat-template",
-            str(VLLM_PATH /
-                "examples/tool_chat_template_llama4_pythonic.jinja"), "-tp",
-            "4"
+            "--enforce-eager",
+            "--no-enable-prefix-caching",
+            "--tool-call-parser",
+            "llama4_pythonic",
+            "--chat-template",
+            str(VLLM_PATH / "examples/tool_chat_template_llama4_pythonic.jinja"),
+            "-tp",
+            "4",
         ],
-        "supports_parallel":
-        False,
-        "extended":
-        True
+        "supports_parallel": False,
+        "extended": True,
     },
     "llama4_json": {
-        "model":
-        "meta-llama/Llama-4-Scout-17B-16E-Instruct",
+        "model": "meta-llama/Llama-4-Scout-17B-16E-Instruct",
         "arguments": [
-            "--enforce-eager", "--no-enable-prefix-caching", "-tp", "4",
-            "--distributed-executor-backend", "mp", "--tool-call-parser",
-            "llama4_json", "--chat-template",
-            str(VLLM_PATH / "examples/tool_chat_template_llama4_json.jinja")
+            "--enforce-eager",
+            "--no-enable-prefix-caching",
+            "-tp",
+            "4",
+            "--distributed-executor-backend",
+            "mp",
+            "--tool-call-parser",
+            "llama4_json",
+            "--chat-template",
+            str(VLLM_PATH / "examples/tool_chat_template_llama4_json.jinja"),
         ],
-        "supports_parallel":
-        True,
-        "extended":
-        True
+        "supports_parallel": True,
+        "extended": True,
     },
     "mistral": {
-        "model":
-        "mistralai/Mistral-7B-Instruct-v0.3",
+        "model": "mistralai/Mistral-7B-Instruct-v0.3",
         "arguments": [
-            "--enforce-eager", "--no-enable-prefix-caching",
-            "--tool-call-parser", "mistral", "--chat-template",
+            "--enforce-eager",
+            "--no-enable-prefix-caching",
+            "--tool-call-parser",
+            "mistral",
+            "--chat-template",
             str(VLLM_PATH / "examples/tool_chat_template_mistral.jinja"),
-            "--ignore-patterns=\"consolidated.safetensors\""
+            '--ignore-patterns="consolidated.safetensors"',
         ],
-        "system_prompt":
-        "You are a helpful assistant with access to tools. If a tool"
+        "system_prompt": "You are a helpful assistant with access to tools. If a tool"
         " that you have would be helpful to answer a user query, "
         "call the tool. Otherwise, answer the user's query directly "
         "without calling a tool. DO NOT CALL A TOOL THAT IS IRRELEVANT "
-        "to the user's question - just respond to it normally."
+        "to the user's question - just respond to it normally.",
     },
     # V1 Test: Passing locally but failing in CI. This runs the
     # V0 Engine because of CPU offloading. Need to debug why.
@@ -146,49 +157,50 @@ def ensure_system_prompt(messages: list[dict[str, Any]],
     #     False,
     # },
     "granite-3.0-8b": {
-        "model":
-        "ibm-granite/granite-3.0-8b-instruct",
+        "model": "ibm-granite/granite-3.0-8b-instruct",
         "arguments": [
-            "--enforce-eager", "--no-enable-prefix-caching",
-            "--tool-call-parser", "granite", "--chat-template",
-            str(VLLM_PATH / "examples/tool_chat_template_granite.jinja")
+            "--enforce-eager",
+            "--no-enable-prefix-caching",
+            "--tool-call-parser",
+            "granite",
+            "--chat-template",
+            str(VLLM_PATH / "examples/tool_chat_template_granite.jinja"),
         ],
     },
     "granite-3.1-8b": {
-        "model":
-        "ibm-granite/granite-3.1-8b-instruct",
+        "model": "ibm-granite/granite-3.1-8b-instruct",
         "arguments": [
             "--enforce-eager",
             "--no-enable-prefix-caching",
             "--tool-call-parser",
             "granite",
         ],
-        "supports_parallel":
-        True,
+        "supports_parallel": True,
     },
     "internlm": {
-        "model":
-        "internlm/internlm2_5-7b-chat",
+        "model": "internlm/internlm2_5-7b-chat",
         "arguments": [
-            "--enforce-eager", "--no-enable-prefix-caching",
-            "--tool-call-parser", "internlm", "--chat-template",
-            str(VLLM_PATH /
-                "examples/tool_chat_template_internlm2_tool.jinja"),
-            "--trust_remote_code"
+            "--enforce-eager",
+            "--no-enable-prefix-caching",
+            "--tool-call-parser",
+            "internlm",
+            "--chat-template",
+            str(VLLM_PATH / "examples/tool_chat_template_internlm2_tool.jinja"),
+            "--trust_remote_code",
         ],
-        "supports_parallel":
-        False,
+        "supports_parallel": False,
     },
     "toolACE": {
-        "model":
-        "Team-ACE/ToolACE-8B",
+        "model": "Team-ACE/ToolACE-8B",
         "arguments": [
-            "--enforce-eager", "--no-enable-prefix-caching",
-            "--tool-call-parser", "pythonic", "--chat-template",
-            str(VLLM_PATH / "examples/tool_chat_template_toolace.jinja")
+            "--enforce-eager",
+            "--no-enable-prefix-caching",
+            "--tool-call-parser",
+            "pythonic",
+            "--chat-template",
+            str(VLLM_PATH / "examples/tool_chat_template_toolace.jinja"),
         ],
-        "supports_parallel":
-        True,
+        "supports_parallel": True,
     },
 }
 
@@ -201,37 +213,31 @@ def ensure_system_prompt(messages: list[dict[str, Any]],
             "type": "object",
             "properties": {
                 "city": {
-                    "type":
-                    "string",
-                    "description":
-                    "The city to find the weather for, "
-                    "e.g. 'San Francisco'"
+                    "type": "string",
+                    "description": "The city to find the weather for, "
+                    "e.g. 'San Francisco'",
                 },
                 "state": {
-                    "type":
-                    "string",
-                    "description":
-                    "must the two-letter abbreviation for the state "
+                    "type": "string",
+                    "description": "must the two-letter abbreviation for the state "
                     "that the city is in, e.g. 'CA' which would "
-                    "mean 'California'"
+                    "mean 'California'",
                 },
                 "unit": {
                     "type": "string",
                     "description": "The unit to fetch the temperature in",
-                    "enum": ["celsius", "fahrenheit"]
-                }
-            }
-        }
-    }
+                    "enum": ["celsius", "fahrenheit"],
+                },
+            },
+        },
+    },
 }
 
 SEARCH_TOOL: ChatCompletionToolParam = {
     "type": "function",
     "function": {
-        "name":
-        "web_search",
-        "description":
-        "Search the internet and get a summary of the top "
+        "name": "web_search",
+        "description": "Search the internet and get a summary of the top "
         "10 webpages. Should only be used if you don't know "
         "the answer to a user query, and the results are likely"
         "to be able to be found with a web search",
@@ -239,124 +245,98 @@ def ensure_system_prompt(messages: list[dict[str, Any]],
             "type": "object",
             "properties": {
                 "search_term": {
-                    "type":
-                    "string",
-                    "description":
-                    "The term to use in the search. This should"
+                    "type": "string",
+                    "description": "The term to use in the search. This should"
                     "ideally be keywords to search for, not a"
-                    "natural-language question"
+                    "natural-language question",
                 }
             },
-            "required": ["search_term"]
-        }
-    }
+            "required": ["search_term"],
+        },
+    },
 }
 
-MESSAGES_WITHOUT_TOOLS: list[ChatCompletionMessageParam] = [{
-    "role":
-    "user",
-    "content":
-    "Hi! How are you?"
-}, {
-    "role":
-    "assistant",
-    "content":
-    "I'm doing great! How can I assist you?"
-}, {
-    "role":
-    "user",
-    "content":
-    "Can you tell me a joke please?"
-}]
+MESSAGES_WITHOUT_TOOLS: list[ChatCompletionMessageParam] = [
+    {"role": "user", "content": "Hi! How are you?"},
+    {"role": "assistant", "content": "I'm doing great! How can I assist you?"},
+    {"role": "user", "content": "Can you tell me a joke please?"},
+]
 
-MESSAGES_ASKING_FOR_TOOLS: list[ChatCompletionMessageParam] = [{
-    "role":
-    "user",
-    "content":
-    "What is the weather in Dallas, Texas in Fahrenheit?"
-}]
+MESSAGES_ASKING_FOR_TOOLS: list[ChatCompletionMessageParam] = [
+    {"role": "user", "content": "What is the weather in Dallas, Texas in Fahrenheit?"}
+]
 
-MESSAGES_WITH_TOOL_RESPONSE: list[ChatCompletionMessageParam] = [{
-    "role":
-    "user",
-    "content":
-    "What is the weather in Dallas, Texas in Fahrenheit?"
-}, {
-    "role":
-    "assistant",
-    "tool_calls": [{
-        "id": "chatcmpl-tool-03e6481b146e408e9523d9c956696295",
-        "type": "function",
-        "function": {
-            "name":
-            WEATHER_TOOL["function"]["name"],
-            "arguments":
-            '{"city": "Dallas", "state": "TX", '
-            '"unit": "fahrenheit"}'
-        }
-    }]
-}, {
-    "role":
-    "tool",
-    "tool_call_id":
-    "chatcmpl-tool-03e6481b146e408e9523d9c956696295",
-    "content":
-    "The weather in Dallas is 98 degrees fahrenheit, with partly"
-    "cloudy skies and a low chance of rain."
-}]
+MESSAGES_WITH_TOOL_RESPONSE: list[ChatCompletionMessageParam] = [
+    {"role": "user", "content": "What is the weather in Dallas, Texas in Fahrenheit?"},
+    {
+        "role": "assistant",
+        "tool_calls": [
+            {
+                "id": "chatcmpl-tool-03e6481b146e408e9523d9c956696295",
+                "type": "function",
+                "function": {
+                    "name": WEATHER_TOOL["function"]["name"],
+                    "arguments": '{"city": "Dallas", "state": "TX", '
+                    '"unit": "fahrenheit"}',
+                },
+            }
+        ],
+    },
+    {
+        "role": "tool",
+        "tool_call_id": "chatcmpl-tool-03e6481b146e408e9523d9c956696295",
+        "content": "The weather in Dallas is 98 degrees fahrenheit, with partly"
+        "cloudy skies and a low chance of rain.",
+    },
+]
 
-MESSAGES_ASKING_FOR_PARALLEL_TOOLS: list[ChatCompletionMessageParam] = [{
-    "role":
-    "user",
-    "content":
-    "What is the weather in Dallas, Texas and Orlando, Florida in "
-    "Fahrenheit?"
-}]
+MESSAGES_ASKING_FOR_PARALLEL_TOOLS: list[ChatCompletionMessageParam] = [
+    {
+        "role": "user",
+        "content": "What is the weather in Dallas, Texas and Orlando, Florida in "
+        "Fahrenheit?",
+    }
+]
 
-MESSAGES_WITH_PARALLEL_TOOL_RESPONSE: list[ChatCompletionMessageParam] = [{
-    "role":
-    "user",
-    "content":
-    "What is the weather in Dallas, Texas and Orlando, Florida in "
-    "Fahrenheit?"
-}, {
-    "role":
-    "assistant",
-    "tool_calls": [{
-        "id": "chatcmpl-tool-03e6481b146e408e9523d9c956696295",
-        "type": "function",
-        "function": {
-            "name":
-            WEATHER_TOOL["function"]["name"],
-            "arguments":
-            '{"city": "Dallas", "state": "TX", '
-            '"unit": "fahrenheit"}'
-        }
-    }, {
-        "id": "chatcmpl-tool-d027061e1bd21cda48bee7da829c1f5b",
-        "type": "function",
-        "function": {
-            "name":
-            WEATHER_TOOL["function"]["name"],
-            "arguments":
-            '{"city": "Orlando", "state": "Fl", '
-            '"unit": "fahrenheit"}'
-        }
-    }]
-}, {
-    "role":
-    "tool",
-    "tool_call_id":
-    "chatcmpl-tool-03e6481b146e408e9523d9c956696295",
-    "content":
-    "The weather in Dallas TX is 98 degrees fahrenheit with mostly "
-    "cloudy skies and a chance of rain in the evening."
-}, {
-    "role":
-    "tool",
-    "tool_call_id":
-    "chatcmpl-tool-d027061e1bd21cda48bee7da829c1f5b",
-    "content":
-    "The weather in Orlando FL is 78 degrees fahrenheit with clear"
-    "skies."
-}]
+MESSAGES_WITH_PARALLEL_TOOL_RESPONSE: list[ChatCompletionMessageParam] = [
+    {
+        "role": "user",
+        "content": "What is the weather in Dallas, Texas and Orlando, Florida in "
+        "Fahrenheit?",
+    },
+    {
+        "role": "assistant",
+        "tool_calls": [
+            {
+                "id": "chatcmpl-tool-03e6481b146e408e9523d9c956696295",
+                "type": "function",
+                "function": {
+                    "name": WEATHER_TOOL["function"]["name"],
+                    "arguments": '{"city": "Dallas", "state": "TX", '
+                    '"unit": "fahrenheit"}',
+                },
+            },
+            {
+                "id": "chatcmpl-tool-d027061e1bd21cda48bee7da829c1f5b",
+                "type": "function",
+                "function": {
+                    "name": WEATHER_TOOL["function"]["name"],
+                    "arguments": '{"city": "Orlando", "state": "Fl", '
+                    '"unit": "fahrenheit"}',
+                },
+            },
+        ],
+    },
+    {
+        "role": "tool",
+        "tool_call_id": "chatcmpl-tool-03e6481b146e408e9523d9c956696295",
+        "content": "The weather in Dallas TX is 98 degrees fahrenheit with mostly "
+        "cloudy skies and a chance of rain in the evening.",
+    },
+    {
+        "role": "tool",
+        "tool_call_id": "chatcmpl-tool-d027061e1bd21cda48bee7da829c1f5b",
+        "content": "The weather in Orlando FL is 78 degrees fahrenheit with clear"
+        "skies.",
+    },
+]
diff --git a/tests/tools/test_config_validator.py b/tests/tools/test_config_validator.py
index b0475894a114..22d838d27264 100644
--- a/tests/tools/test_config_validator.py
+++ b/tests/tools/test_config_validator.py
@@ -7,11 +7,11 @@
 
 from tools.validate_config import validate_ast
 
-_TestConfig1 = '''
+_TestConfig1 = """
 @config
 class _TestConfig1:
     pass
-'''
+"""
 
 _TestConfig2 = '''
 @config
@@ -21,12 +21,12 @@ class _TestConfig2:
     """docstring"""
 '''
 
-_TestConfig3 = '''
+_TestConfig3 = """
 @config
 @dataclass
 class _TestConfig3:
     a: int = 1
-'''
+"""
 
 _TestConfig4 = '''
 @config
@@ -37,12 +37,15 @@ class _TestConfig4:
 '''
 
 
-@pytest.mark.parametrize(("test_config", "expected_error"), [
-    (_TestConfig1, "must be a dataclass"),
-    (_TestConfig2, "must have a default"),
-    (_TestConfig3, "must have a docstring"),
-    (_TestConfig4, "must use a single Literal"),
-])
+@pytest.mark.parametrize(
+    ("test_config", "expected_error"),
+    [
+        (_TestConfig1, "must be a dataclass"),
+        (_TestConfig2, "must have a default"),
+        (_TestConfig3, "must have a docstring"),
+        (_TestConfig4, "must use a single Literal"),
+    ],
+)
 def test_config(test_config, expected_error):
     tree = ast.parse(test_config)
     with pytest.raises(Exception, match=expected_error):
diff --git a/tests/tpu/lora/test_lora.py b/tests/tpu/lora/test_lora.py
index 5196a92cb727..5999c9cf1e0e 100644
--- a/tests/tpu/lora/test_lora.py
+++ b/tests/tpu/lora/test_lora.py
@@ -29,17 +29,20 @@ def use_v1_only(monkeypatch: pytest.MonkeyPatch):
 
 
 def setup_vllm(num_loras: int, tp: int) -> vllm.LLM:
-    return vllm.LLM(model="Qwen/Qwen2.5-3B-Instruct",
-                    max_model_len=256,
-                    max_num_seqs=8,
-                    tensor_parallel_size=tp,
-                    enable_lora=True,
-                    max_loras=num_loras,
-                    max_lora_rank=8)
+    return vllm.LLM(
+        model="Qwen/Qwen2.5-3B-Instruct",
+        max_model_len=256,
+        max_num_seqs=8,
+        tensor_parallel_size=tp,
+        enable_lora=True,
+        max_loras=num_loras,
+        max_lora_rank=8,
+    )
 
 
-TPU_TENSOR_PARALLEL_SIZES = [1, tpu.num_available_chips()
-                             ] if tpu.num_available_chips() > 1 else [1]
+TPU_TENSOR_PARALLEL_SIZES = (
+    [1, tpu.num_available_chips()] if tpu.num_available_chips() > 1 else [1]
+)
 
 
 @pytest.mark.parametrize("tp", TPU_TENSOR_PARALLEL_SIZES)
@@ -55,12 +58,19 @@ def test_single_lora(tp: int):
     prompt = "What is 1+1? \n"
 
     lora_request = LoRARequest(
-        "lora_adapter_1", 1,
-        "Username6568/Qwen2.5-3B-Instruct-1_plus_1_equals_1_adapter")
-    output = llm.generate(prompt,
-                          sampling_params=vllm.SamplingParams(max_tokens=256,
-                                                              temperature=0),
-                          lora_request=lora_request)[0].outputs[0].text
+        "lora_adapter_1",
+        1,
+        "Username6568/Qwen2.5-3B-Instruct-1_plus_1_equals_1_adapter",
+    )
+    output = (
+        llm.generate(
+            prompt,
+            sampling_params=vllm.SamplingParams(max_tokens=256, temperature=0),
+            lora_request=lora_request,
+        )[0]
+        .outputs[0]
+        .text
+    )
 
     answer = output.strip()[0]
 
@@ -73,13 +83,12 @@ def test_lora_hotswapping(tp: int):
     """
     This test ensures we can run multiple LoRA adapters on the TPU backend, even
     if we only have space to store 1.
-    
+
     We run "Username6568/Qwen2.5-3B-Instruct-1_plus_1_equals_x_adapter" which
     will force Qwen2.5-3B-Instruct to claim 1+1=x, for a range of x.
     """
 
-    lora_name_template = \
-        "Username6568/Qwen2.5-3B-Instruct-1_plus_1_equals_{}_adapter"
+    lora_name_template = "Username6568/Qwen2.5-3B-Instruct-1_plus_1_equals_{}_adapter"
     lora_requests = [
         LoRARequest(f"lora_adapter_{i}", i, lora_name_template.format(i))
         for i in range(1, 5)
@@ -90,10 +99,15 @@ def test_lora_hotswapping(tp: int):
     prompt = "What is 1+1? \n"
 
     for i, req in enumerate(lora_requests):
-        output = llm.generate(prompt,
-                              sampling_params=vllm.SamplingParams(
-                                  max_tokens=256, temperature=0),
-                              lora_request=req)[0].outputs[0].text
+        output = (
+            llm.generate(
+                prompt,
+                sampling_params=vllm.SamplingParams(max_tokens=256, temperature=0),
+                lora_request=req,
+            )[0]
+            .outputs[0]
+            .text
+        )
         answer = output.strip()[0]
 
         assert answer.isdigit()
@@ -105,12 +119,11 @@ def test_multi_lora(tp: int):
     """
     This test ensures we can run multiple LoRA adapters on the TPU backend, when
     we have enough space to store all of them.
-    
+
     We run "Username6568/Qwen2.5-3B-Instruct-1_plus_1_equals_x_adapter" which
     will force Qwen2.5-3B-Instruct to claim 1+1=x, for a range of x.
     """
-    lora_name_template = \
-        "Username6568/Qwen2.5-3B-Instruct-1_plus_1_equals_{}_adapter"
+    lora_name_template = "Username6568/Qwen2.5-3B-Instruct-1_plus_1_equals_{}_adapter"
     lora_requests = [
         LoRARequest(f"lora_adapter_{i}", i, lora_name_template.format(i))
         for i in range(1, 5)
@@ -121,10 +134,15 @@ def test_multi_lora(tp: int):
     prompt = "What is 1+1? \n"
 
     for i, req in enumerate(lora_requests):
-        output = llm.generate(prompt,
-                              sampling_params=vllm.SamplingParams(
-                                  max_tokens=256, temperature=0),
-                              lora_request=req)[0].outputs[0].text
+        output = (
+            llm.generate(
+                prompt,
+                sampling_params=vllm.SamplingParams(max_tokens=256, temperature=0),
+                lora_request=req,
+            )[0]
+            .outputs[0]
+            .text
+        )
 
         answer = output.strip()[0]
 
diff --git a/tests/tpu/test_compilation.py b/tests/tpu/test_compilation.py
index 448b8b2bc094..5acfa484f0c1 100644
--- a/tests/tpu/test_compilation.py
+++ b/tests/tpu/test_compilation.py
@@ -26,16 +26,15 @@ def test_tpu_compilation():
 
         # Currently, top-p sampling is disabled. `top_p` should be 1.0.
         N = 1
-        sampling_params = SamplingParams(temperature=0.7,
-                                         top_p=1.0,
-                                         n=N,
-                                         max_tokens=16)
+        sampling_params = SamplingParams(temperature=0.7, top_p=1.0, n=N, max_tokens=16)
 
-        llm = LLM(model="Qwen/Qwen2-1.5B-Instruct",
-                  max_num_batched_tokens=256,
-                  max_model_len=256,
-                  max_num_seqs=32,
-                  enforce_eager=False)
+        llm = LLM(
+            model="Qwen/Qwen2-1.5B-Instruct",
+            max_num_batched_tokens=256,
+            max_model_len=256,
+            max_num_seqs=32,
+            enforce_eager=False,
+        )
 
         outputs = llm.generate(prompts, sampling_params)
         for output, answer in zip(outputs, answers):
@@ -45,7 +44,8 @@ def test_tpu_compilation():
             assert generated_text.startswith(answer)
 
     compiled_codes = sorted(
-        glob.glob(os.path.join(temp_dir, "__transformed_code*for_forward.py")))
+        glob.glob(os.path.join(temp_dir, "__transformed_code*for_forward.py"))
+    )
 
     for i, compiled_code in enumerate(compiled_codes):
         print("{} file: {}".format(i + 1, compiled_code))
@@ -66,9 +66,10 @@ def extract_compiled_index(s):
 
     # Check all the compilations are as expected. The dump files include the
     # captured graph for the forward function of the nn.Module.
-    compiled_fns = sorted(glob.glob(
-        os.path.join(temp_dir, "__compiled_fn*Forward_graph*.py")),
-                          key=lambda s: extract_compiled_index(s))
+    compiled_fns = sorted(
+        glob.glob(os.path.join(temp_dir, "__compiled_fn*Forward_graph*.py")),
+        key=lambda s: extract_compiled_index(s),
+    )
 
     for i, compiled_fn in enumerate(compiled_fns):
         print("{} file: {}".format(i + 1, compiled_fn))
@@ -82,4 +83,4 @@ def extract_compiled_index(s):
     # ragged_paged_attention
     with open(compiled_fns[1]) as f:
         content = f.read()
-        assert (kv_cache_prefix in content and attn_prefix in content)
+        assert kv_cache_prefix in content and attn_prefix in content
diff --git a/tests/tpu/test_custom_dispatcher.py b/tests/tpu/test_custom_dispatcher.py
index 9c90df1b7701..102e5ddf16d6 100644
--- a/tests/tpu/test_custom_dispatcher.py
+++ b/tests/tpu/test_custom_dispatcher.py
@@ -15,17 +15,20 @@
 def test_custom_dispatcher(monkeypatch: pytest.MonkeyPatch):
     with monkeypatch.context() as m:
         m.setenv("VLLM_RPC_TIMEOUT", "30000")
-        compare_two_settings("Qwen/Qwen2.5-1.5B-Instruct",
-                             arg1=[
-                                 "--max-model-len=256",
-                                 "--max-num-seqs=32",
-                                 "--enforce-eager",
-                                 f"-O{CompilationLevel.DYNAMO_ONCE}",
-                             ],
-                             arg2=[
-                                 "--max-model-len=256", "--max-num-seqs=32",
-                                 "--enforce-eager",
-                                 f"-O{CompilationLevel.DYNAMO_AS_IS}"
-                             ],
-                             env1={},
-                             env2={})
+        compare_two_settings(
+            "Qwen/Qwen2.5-1.5B-Instruct",
+            arg1=[
+                "--max-model-len=256",
+                "--max-num-seqs=32",
+                "--enforce-eager",
+                f"-O{CompilationLevel.DYNAMO_ONCE}",
+            ],
+            arg2=[
+                "--max-model-len=256",
+                "--max-num-seqs=32",
+                "--enforce-eager",
+                f"-O{CompilationLevel.DYNAMO_AS_IS}",
+            ],
+            env1={},
+            env2={},
+        )
diff --git a/tests/tpu/test_moe_pallas.py b/tests/tpu/test_moe_pallas.py
index 1e5d9d923d00..a0f3e9d2c7e9 100644
--- a/tests/tpu/test_moe_pallas.py
+++ b/tests/tpu/test_moe_pallas.py
@@ -4,16 +4,18 @@
 
 Run `pytest tests/kernels/moe/test_moe_pallas.py`.
 """
+
 import pytest
 import torch
 import torch_xla
 
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.model_executor.layers.fused_moe.moe_pallas import (
-    fused_moe as pallas_moe)
+from vllm.model_executor.layers.fused_moe.moe_pallas import fused_moe as pallas_moe
 from vllm.model_executor.layers.fused_moe.moe_torch_iterative import (
-    fused_moe as torch_moe)
+    fused_moe as torch_moe,
+)
+
 # yapf: enable
 from vllm.platforms import current_platform
 
@@ -43,6 +45,7 @@ def test_pallas_moe(
     dtype: torch.dtype,
 ):
     import torch_xla.core.xla_model as xm
+
     with torch.device(xm.xla_device()):
         a = torch.randn((m, k), dtype=dtype) / 10
         w1 = torch.randn((e, 2 * n, k), dtype=dtype) / 10
diff --git a/tests/tpu/test_quantization_accuracy.py b/tests/tpu/test_quantization_accuracy.py
index 8d9fbd280317..151be5f17fe8 100644
--- a/tests/tpu/test_quantization_accuracy.py
+++ b/tests/tpu/test_quantization_accuracy.py
@@ -17,15 +17,15 @@ class GSM8KAccuracyTestConfig:
     expected_value: float
 
     def get_model_args(self) -> str:
-        return (f"pretrained={self.model_name},"
-                "max_model_len=4096,max_num_seqs=32")
+        return f"pretrained={self.model_name},max_model_len=4096,max_num_seqs=32"
 
 
 # NOTE: Accuracy scores measured on GPUs.
 ACCURACY_CONFIGS = [
     GSM8KAccuracyTestConfig(
         model_name="neuralmagic/Meta-Llama-3.1-8B-Instruct-quantized.w8a8",
-        expected_value=0.76),  # no bias
+        expected_value=0.76,
+    ),  # no bias
     # NOTE(rob): We cannot re-initialize vLLM in the same process for TPU,
     # so only one of these tests can run in a single call to pytest. As
     # a follow-up, move this into the LM-EVAL section of the CI.
@@ -37,7 +37,6 @@ def get_model_args(self) -> str:
 
 @pytest.mark.parametrize("config", ACCURACY_CONFIGS)
 def test_gsm8k_correctness(config: GSM8KAccuracyTestConfig):
-
     results = lm_eval.simple_evaluate(
         model="vllm",
         model_args=config.get_model_args(),
@@ -47,6 +46,7 @@ def test_gsm8k_correctness(config: GSM8KAccuracyTestConfig):
 
     EXPECTED_VALUE = config.expected_value
     measured_value = results["results"][TASK][FILTER]
-    assert (measured_value - RTOL < EXPECTED_VALUE
-            and measured_value + RTOL > EXPECTED_VALUE
-            ), f"Expected: {EXPECTED_VALUE} |  Measured: {measured_value}"
+    assert (
+        measured_value - RTOL < EXPECTED_VALUE
+        and measured_value + RTOL > EXPECTED_VALUE
+    ), f"Expected: {EXPECTED_VALUE} |  Measured: {measured_value}"
diff --git a/tests/transformers_utils/test_config_parser_registry.py b/tests/transformers_utils/test_config_parser_registry.py
index 13c654e05d2a..9372cb9d46d3 100644
--- a/tests/transformers_utils/test_config_parser_registry.py
+++ b/tests/transformers_utils/test_config_parser_registry.py
@@ -7,26 +7,25 @@
 import pytest
 from transformers import PretrainedConfig
 
-from vllm.transformers_utils.config import (get_config_parser,
-                                            register_config_parser)
+from vllm.transformers_utils.config import get_config_parser, register_config_parser
 from vllm.transformers_utils.config_parser_base import ConfigParserBase
 
 
 @register_config_parser("custom_config_parser")
 class CustomConfigParser(ConfigParserBase):
-
-    def parse(self,
-              model: Union[str, Path],
-              trust_remote_code: bool,
-              revision: Optional[str] = None,
-              code_revision: Optional[str] = None,
-              **kwargs) -> tuple[dict, PretrainedConfig]:
+    def parse(
+        self,
+        model: Union[str, Path],
+        trust_remote_code: bool,
+        revision: Optional[str] = None,
+        code_revision: Optional[str] = None,
+        **kwargs,
+    ) -> tuple[dict, PretrainedConfig]:
         raise NotImplementedError
 
 
 def test_register_config_parser():
-    assert isinstance(get_config_parser("custom_config_parser"),
-                      CustomConfigParser)
+    assert isinstance(get_config_parser("custom_config_parser"), CustomConfigParser)
 
 
 def test_invalid_config_parser():
diff --git a/tests/utils.py b/tests/utils.py
index ffdc0f732543..b853542c241f 100644
--- a/tests/utils.py
+++ b/tests/utils.py
@@ -33,20 +33,29 @@
 
 import vllm.envs as envs
 from tests.models.utils import TextTextLogprobs
-from vllm.distributed import (ensure_model_parallel_initialized,
-                              init_distributed_environment)
+from vllm.distributed import (
+    ensure_model_parallel_initialized,
+    init_distributed_environment,
+)
 from vllm.engine.arg_utils import AsyncEngineArgs
 from vllm.entrypoints.cli.serve import ServeSubcommand
 from vllm.model_executor.model_loader import get_model_loader
 from vllm.platforms import current_platform
 from vllm.transformers_utils.tokenizer import get_tokenizer
-from vllm.utils import (FlexibleArgumentParser, GB_bytes,
-                        cuda_device_count_stateless, get_open_port)
+from vllm.utils import (
+    FlexibleArgumentParser,
+    GB_bytes,
+    cuda_device_count_stateless,
+    get_open_port,
+)
 
 if current_platform.is_rocm():
-    from amdsmi import (amdsmi_get_gpu_vram_usage,
-                        amdsmi_get_processor_handles, amdsmi_init,
-                        amdsmi_shut_down)
+    from amdsmi import (
+        amdsmi_get_gpu_vram_usage,
+        amdsmi_get_processor_handles,
+        amdsmi_init,
+        amdsmi_shut_down,
+    )
 
     @contextmanager
     def _nvml():
@@ -56,9 +65,12 @@ def _nvml():
         finally:
             amdsmi_shut_down()
 elif current_platform.is_cuda():
-    from vllm.third_party.pynvml import (nvmlDeviceGetHandleByIndex,
-                                         nvmlDeviceGetMemoryInfo, nvmlInit,
-                                         nvmlShutdown)
+    from vllm.third_party.pynvml import (
+        nvmlDeviceGetHandleByIndex,
+        nvmlDeviceGetMemoryInfo,
+        nvmlInit,
+        nvmlShutdown,
+    )
 
     @contextmanager
     def _nvml():
@@ -81,14 +93,14 @@ def _nvml():
 class RemoteOpenAIServer:
     DUMMY_API_KEY = "token-abc123"  # vLLM's OpenAI server does not need API key
 
-    def _start_server(self, model: str, vllm_serve_args: list[str],
-                      env_dict: Optional[dict[str, str]]) -> None:
-        """Subclasses override this method to customize server process launch
-        """
+    def _start_server(
+        self, model: str, vllm_serve_args: list[str], env_dict: Optional[dict[str, str]]
+    ) -> None:
+        """Subclasses override this method to customize server process launch"""
         env = os.environ.copy()
         # the current process might initialize cuda,
         # to be safe, we should use spawn method
-        env['VLLM_WORKER_MULTIPROC_METHOD'] = 'spawn'
+        env["VLLM_WORKER_MULTIPROC_METHOD"] = "spawn"
         if env_dict is not None:
             env.update(env_dict)
         serve_cmd = ["vllm", "serve", model, *vllm_serve_args]
@@ -100,41 +112,42 @@ def _start_server(self, model: str, vllm_serve_args: list[str],
             stderr=sys.stderr,
         )
 
-    def __init__(self,
-                 model: str,
-                 vllm_serve_args: list[str],
-                 *,
-                 env_dict: Optional[dict[str, str]] = None,
-                 seed: Optional[int] = 0,
-                 auto_port: bool = True,
-                 max_wait_seconds: Optional[float] = None,
-                 override_hf_configs: Optional[dict[str, Any]] = None) -> None:
+    def __init__(
+        self,
+        model: str,
+        vllm_serve_args: list[str],
+        *,
+        env_dict: Optional[dict[str, str]] = None,
+        seed: Optional[int] = 0,
+        auto_port: bool = True,
+        max_wait_seconds: Optional[float] = None,
+        override_hf_configs: Optional[dict[str, Any]] = None,
+    ) -> None:
         if auto_port:
             if "-p" in vllm_serve_args or "--port" in vllm_serve_args:
-                raise ValueError("You have manually specified the port "
-                                 "when `auto_port=True`.")
+                raise ValueError(
+                    "You have manually specified the port when `auto_port=True`."
+                )
 
             # No need for a port if using unix sockets
             if "--uds" not in vllm_serve_args:
                 # Don't mutate the input args
-                vllm_serve_args = vllm_serve_args + [
-                    "--port", str(get_open_port())
-                ]
+                vllm_serve_args = vllm_serve_args + ["--port", str(get_open_port())]
         if seed is not None:
             if "--seed" in vllm_serve_args:
-                raise ValueError("You have manually specified the seed "
-                                 f"when `seed={seed}`.")
+                raise ValueError(
+                    f"You have manually specified the seed when `seed={seed}`."
+                )
 
             vllm_serve_args = vllm_serve_args + ["--seed", str(seed)]
 
         if override_hf_configs is not None:
             vllm_serve_args = vllm_serve_args + [
                 "--hf-overrides",
-                json.dumps(override_hf_configs)
+                json.dumps(override_hf_configs),
             ]
 
-        parser = FlexibleArgumentParser(
-            description="vLLM's remote OpenAI server.")
+        parser = FlexibleArgumentParser(description="vLLM's remote OpenAI server.")
         subparsers = parser.add_subparsers(required=False, dest="subparser")
         parser = ServeSubcommand().subparser_init(subparsers)
         args = parser.parse_args(["--model", model, *vllm_serve_args])
@@ -143,11 +156,10 @@ def __init__(self,
             self.host = None
             self.port = None
         else:
-            self.host = str(args.host or 'localhost')
+            self.host = str(args.host or "localhost")
             self.port = int(args.port)
 
-        self.show_hidden_metrics = \
-            args.show_hidden_metrics_for_version is not None
+        self.show_hidden_metrics = args.show_hidden_metrics_for_version is not None
 
         # download the model before starting the server to avoid timeout
         is_local = os.path.isdir(model)
@@ -161,8 +173,7 @@ def __init__(self,
 
         self._start_server(model, vllm_serve_args, env_dict)
         max_wait_seconds = max_wait_seconds or 240
-        self._wait_for_server(url=self.url_for("health"),
-                              timeout=max_wait_seconds)
+        self._wait_for_server(url=self.url_for("health"), timeout=max_wait_seconds)
 
     def __enter__(self):
         return self
@@ -182,8 +193,11 @@ def _poll(self) -> Optional[int]:
     def _wait_for_server(self, *, url: str, timeout: float):
         # run health check
         start = time.time()
-        client = (httpx.Client(transport=httpx.HTTPTransport(
-            uds=self.uds)) if self.uds else requests)
+        client = (
+            httpx.Client(transport=httpx.HTTPTransport(uds=self.uds))
+            if self.uds
+            else requests
+        )
         while True:
             try:
                 if client.get(url).status_code == 200:
@@ -199,13 +213,15 @@ def _wait_for_server(self, *, url: str, timeout: float):
 
                 time.sleep(0.5)
                 if time.time() - start > timeout:
-                    raise RuntimeError(
-                        "Server failed to start in time.") from None
+                    raise RuntimeError("Server failed to start in time.") from None
 
     @property
     def url_root(self) -> str:
-        return (f"http://{self.uds.split('/')[-1]}"
-                if self.uds else f"http://{self.host}:{self.port}")
+        return (
+            f"http://{self.uds.split('/')[-1]}"
+            if self.uds
+            else f"http://{self.host}:{self.port}"
+        )
 
     def url_for(self, *parts: str) -> str:
         return self.url_root + "/" + "/".join(parts)
@@ -223,42 +239,47 @@ def get_client(self, **kwargs):
     def get_async_client(self, **kwargs):
         if "timeout" not in kwargs:
             kwargs["timeout"] = 600
-        return openai.AsyncOpenAI(base_url=self.url_for("v1"),
-                                  api_key=self.DUMMY_API_KEY,
-                                  max_retries=0,
-                                  **kwargs)
+        return openai.AsyncOpenAI(
+            base_url=self.url_for("v1"),
+            api_key=self.DUMMY_API_KEY,
+            max_retries=0,
+            **kwargs,
+        )
 
 
 class RemoteOpenAIServerCustom(RemoteOpenAIServer):
     """Launch test server with custom child process"""
 
-    def _start_server(self, model: str, vllm_serve_args: list[str],
-                      env_dict: Optional[dict[str, str]]) -> None:
+    def _start_server(
+        self, model: str, vllm_serve_args: list[str], env_dict: Optional[dict[str, str]]
+    ) -> None:
         self.proc: Process = Process(
-            target=self.child_process_fxn,
-            args=(env_dict, model,
-                  vllm_serve_args))  # type: ignore[assignment]
+            target=self.child_process_fxn, args=(env_dict, model, vllm_serve_args)
+        )  # type: ignore[assignment]
         self.proc.start()
 
-    def __init__(self,
-                 model: str,
-                 vllm_serve_args: list[str],
-                 child_process_fxn: Callable[
-                     [Optional[dict[str, str]], str, list[str]], None],
-                 *,
-                 env_dict: Optional[dict[str, str]] = None,
-                 seed: Optional[int] = 0,
-                 auto_port: bool = True,
-                 max_wait_seconds: Optional[float] = None) -> None:
+    def __init__(
+        self,
+        model: str,
+        vllm_serve_args: list[str],
+        child_process_fxn: Callable[[Optional[dict[str, str]], str, list[str]], None],
+        *,
+        env_dict: Optional[dict[str, str]] = None,
+        seed: Optional[int] = 0,
+        auto_port: bool = True,
+        max_wait_seconds: Optional[float] = None,
+    ) -> None:
         """Store custom child process function then invoke superclass
         constructor which will indirectly launch it."""
         self.child_process_fxn = child_process_fxn
-        super().__init__(model=model,
-                         vllm_serve_args=vllm_serve_args,
-                         env_dict=env_dict,
-                         seed=seed,
-                         auto_port=auto_port,
-                         max_wait_seconds=max_wait_seconds)
+        super().__init__(
+            model=model,
+            vllm_serve_args=vllm_serve_args,
+            env_dict=env_dict,
+            seed=seed,
+            auto_port=auto_port,
+            max_wait_seconds=max_wait_seconds,
+        )
 
     def _poll(self) -> Optional[int]:
         return self.proc.exitcode
@@ -280,17 +301,18 @@ def _test_completion(
     results = []
 
     # test with text prompt
-    completion = client.completions.create(model=model,
-                                           prompt=prompt,
-                                           max_tokens=5,
-                                           temperature=0.0)
-
-    results.append({
-        "test": "single_completion",
-        "text": completion.choices[0].text,
-        "finish_reason": completion.choices[0].finish_reason,
-        "usage": completion.usage,
-    })
+    completion = client.completions.create(
+        model=model, prompt=prompt, max_tokens=5, temperature=0.0
+    )
+
+    results.append(
+        {
+            "test": "single_completion",
+            "text": completion.choices[0].text,
+            "finish_reason": completion.choices[0].finish_reason,
+            "usage": completion.usage,
+        }
+    )
 
     # test using token IDs
     completion = client.completions.create(
@@ -300,43 +322,42 @@ def _test_completion(
         temperature=0.0,
     )
 
-    results.append({
-        "test": "token_ids",
-        "text": completion.choices[0].text,
-        "finish_reason": completion.choices[0].finish_reason,
-        "usage": completion.usage,
-    })
+    results.append(
+        {
+            "test": "token_ids",
+            "text": completion.choices[0].text,
+            "finish_reason": completion.choices[0].finish_reason,
+            "usage": completion.usage,
+        }
+    )
 
     # test seeded random sampling
-    completion = client.completions.create(model=model,
-                                           prompt=prompt,
-                                           max_tokens=5,
-                                           seed=33,
-                                           temperature=1.0)
-
-    results.append({
-        "test": "seeded_sampling",
-        "text": completion.choices[0].text,
-        "finish_reason": completion.choices[0].finish_reason,
-        "usage": completion.usage,
-    })
+    completion = client.completions.create(
+        model=model, prompt=prompt, max_tokens=5, seed=33, temperature=1.0
+    )
+
+    results.append(
+        {
+            "test": "seeded_sampling",
+            "text": completion.choices[0].text,
+            "finish_reason": completion.choices[0].finish_reason,
+            "usage": completion.usage,
+        }
+    )
 
     # test seeded random sampling with multiple prompts
-    completion = client.completions.create(model=model,
-                                           prompt=[prompt, prompt],
-                                           max_tokens=5,
-                                           seed=33,
-                                           temperature=1.0)
-
-    results.append({
-        "test":
-        "seeded_sampling",
-        "text": [choice.text for choice in completion.choices],
-        "finish_reason":
-        [choice.finish_reason for choice in completion.choices],
-        "usage":
-        completion.usage,
-    })
+    completion = client.completions.create(
+        model=model, prompt=[prompt, prompt], max_tokens=5, seed=33, temperature=1.0
+    )
+
+    results.append(
+        {
+            "test": "seeded_sampling",
+            "text": [choice.text for choice in completion.choices],
+            "finish_reason": [choice.finish_reason for choice in completion.choices],
+            "usage": completion.usage,
+        }
+    )
 
     # test simple list
     batch = client.completions.create(
@@ -346,11 +367,13 @@ def _test_completion(
         temperature=0.0,
     )
 
-    results.append({
-        "test": "simple_list",
-        "text0": batch.choices[0].text,
-        "text1": batch.choices[1].text,
-    })
+    results.append(
+        {
+            "test": "simple_list",
+            "text0": batch.choices[0].text,
+            "text1": batch.choices[1].text,
+        }
+    )
 
     # test streaming
     batch = client.completions.create(
@@ -367,10 +390,12 @@ def _test_completion(
         choice = chunk.choices[0]
         texts[choice.index] += choice.text
 
-    results.append({
-        "test": "streaming",
-        "texts": texts,
-    })
+    results.append(
+        {
+            "test": "streaming",
+            "texts": texts,
+        }
+    )
 
     return results
 
@@ -383,19 +408,19 @@ def _test_completion_close(
     results = []
 
     # test with text prompt
-    completion = client.completions.create(model=model,
-                                           prompt=prompt,
-                                           max_tokens=1,
-                                           logprobs=5,
-                                           temperature=0.0)
+    completion = client.completions.create(
+        model=model, prompt=prompt, max_tokens=1, logprobs=5, temperature=0.0
+    )
 
     logprobs = completion.choices[0].logprobs.top_logprobs[0]
     logprobs = {k: round(v, 2) for k, v in logprobs.items()}
 
-    results.append({
-        "test": "completion_close",
-        "logprobs": logprobs,
-    })
+    results.append(
+        {
+            "test": "completion_close",
+            "logprobs": logprobs,
+        }
+    )
 
     return results
 
@@ -407,26 +432,21 @@ def _test_chat(
 ):
     results = []
 
-    messages = [{
-        "role": "user",
-        "content": [{
-            "type": "text",
-            "text": prompt
-        }]
-    }]
+    messages = [{"role": "user", "content": [{"type": "text", "text": prompt}]}]
 
     # test with text prompt
-    chat_response = client.chat.completions.create(model=model,
-                                                   messages=messages,
-                                                   max_tokens=5,
-                                                   temperature=0.0)
-
-    results.append({
-        "test": "completion_close",
-        "text": chat_response.choices[0].message.content,
-        "finish_reason": chat_response.choices[0].finish_reason,
-        "usage": chat_response.usage,
-    })
+    chat_response = client.chat.completions.create(
+        model=model, messages=messages, max_tokens=5, temperature=0.0
+    )
+
+    results.append(
+        {
+            "test": "completion_close",
+            "text": chat_response.choices[0].message.content,
+            "finish_reason": chat_response.choices[0].finish_reason,
+            "usage": chat_response.usage,
+        }
+    )
 
     return results
 
@@ -445,11 +465,13 @@ def _test_embeddings(
         encoding_format="float",
     )
 
-    results.append({
-        "test": "single_embedding",
-        "embedding": embeddings.data[0].embedding,
-        "usage": embeddings.usage,
-    })
+    results.append(
+        {
+            "test": "single_embedding",
+            "embedding": embeddings.data[0].embedding,
+            "usage": embeddings.usage,
+        }
+    )
 
     return results
 
@@ -462,74 +484,75 @@ def _test_image_text(
     results = []
 
     # test pure text input
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "text",
-                "text": "How do you feel today?"
-            },
-        ],
-    }]
-
-    chat_completion = client.chat.completions.create(model=model_name,
-                                                     messages=messages,
-                                                     temperature=0.0,
-                                                     max_tokens=1,
-                                                     logprobs=True,
-                                                     top_logprobs=5)
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {"type": "text", "text": "How do you feel today?"},
+            ],
+        }
+    ]
+
+    chat_completion = client.chat.completions.create(
+        model=model_name,
+        messages=messages,
+        temperature=0.0,
+        max_tokens=1,
+        logprobs=True,
+        top_logprobs=5,
+    )
     top_logprobs = chat_completion.choices[0].logprobs.content[0].top_logprobs
 
     for x in top_logprobs:
         x.logprob = round(x.logprob, 2)
 
-    results.append({
-        "test": "pure_text",
-        "logprobs": top_logprobs,
-    })
-
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "image_url",
-                "image_url": {
-                    "url": image_url
-                }
-            },
-            {
-                "type": "text",
-                "text": "What's in this image?"
-            },
-        ],
-    }]
-
-    chat_completion = client.chat.completions.create(model=model_name,
-                                                     messages=messages,
-                                                     temperature=0.0,
-                                                     max_tokens=1,
-                                                     logprobs=True,
-                                                     top_logprobs=5)
+    results.append(
+        {
+            "test": "pure_text",
+            "logprobs": top_logprobs,
+        }
+    )
+
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {"type": "image_url", "image_url": {"url": image_url}},
+                {"type": "text", "text": "What's in this image?"},
+            ],
+        }
+    ]
+
+    chat_completion = client.chat.completions.create(
+        model=model_name,
+        messages=messages,
+        temperature=0.0,
+        max_tokens=1,
+        logprobs=True,
+        top_logprobs=5,
+    )
     top_logprobs = chat_completion.choices[0].logprobs.content[0].top_logprobs
 
-    results.append({
-        "test": "text_image",
-        "logprobs": top_logprobs,
-    })
+    results.append(
+        {
+            "test": "text_image",
+            "logprobs": top_logprobs,
+        }
+    )
 
     return results
 
 
-def compare_two_settings(model: str,
-                         arg1: list[str],
-                         arg2: list[str],
-                         env1: Optional[dict[str, str]] = None,
-                         env2: Optional[dict[str, str]] = None,
-                         *,
-                         method: str = "generate",
-                         max_wait_seconds: Optional[float] = None) -> None:
+def compare_two_settings(
+    model: str,
+    arg1: list[str],
+    arg2: list[str],
+    env1: Optional[dict[str, str]] = None,
+    env2: Optional[dict[str, str]] = None,
+    *,
+    method: str = "generate",
+    max_wait_seconds: Optional[float] = None,
+) -> None:
     """
     Launch API server with two different sets of arguments/environments
     and compare the results of the API calls.
@@ -551,12 +574,14 @@ def compare_two_settings(model: str,
     )
 
 
-def compare_all_settings(model: str,
-                         all_args: list[list[str]],
-                         all_envs: list[Optional[dict[str, str]]],
-                         *,
-                         method: str = "generate",
-                         max_wait_seconds: Optional[float] = None) -> None:
+def compare_all_settings(
+    model: str,
+    all_args: list[list[str]],
+    all_envs: list[Optional[dict[str, str]]],
+    *,
+    method: str = "generate",
+    max_wait_seconds: Optional[float] = None,
+) -> None:
     """
     Launch API server with several different sets of arguments/environments
     and compare the results of the API calls with the first set of arguments.
@@ -606,21 +631,22 @@ def compare_all_settings(model: str,
             args = args + ["--load-format", envs.VLLM_TEST_FORCE_LOAD_FORMAT]
         compare_results: list = []
         results = ref_results if i == 0 else compare_results
-        with RemoteOpenAIServer(model,
-                                args,
-                                env_dict=env,
-                                max_wait_seconds=max_wait_seconds) as server:
+        with RemoteOpenAIServer(
+            model, args, env_dict=env, max_wait_seconds=max_wait_seconds
+        ) as server:
             client = server.get_client()
 
             # test models list
             models = client.models.list()
             models = models.data
             served_model = models[0]
-            results.append({
-                "test": "models_list",
-                "id": served_model.id,
-                "root": served_model.root,
-            })
+            results.append(
+                {
+                    "test": "models_list",
+                    "id": served_model.id,
+                    "root": served_model.root,
+                }
+            )
 
             if method == "generate":
                 results += _test_completion(client, model, prompt, token_ids)
@@ -630,8 +656,9 @@ def compare_all_settings(model: str,
                 results += _test_chat(client, model, prompt)
             elif method == "generate_with_image":
                 results += _test_image_text(
-                    client, model,
-                    "https://upload.wikimedia.org/wikipedia/commons/0/0b/RGBA_comp.png"
+                    client,
+                    model,
+                    "https://upload.wikimedia.org/wikipedia/commons/0/0b/RGBA_comp.png",
                 )
             elif method == "encode":
                 results += _test_embeddings(client, model, prompt)
@@ -644,8 +671,7 @@ def compare_all_settings(model: str,
                 ref_envs = all_envs[0]
                 compare_args = all_args[i]
                 compare_envs = all_envs[i]
-                for ref_result, compare_result in zip(ref_results,
-                                                      compare_results):
+                for ref_result, compare_result in zip(ref_results, compare_results):
                     ref_result = copy.deepcopy(ref_result)
                     compare_result = copy.deepcopy(compare_result)
                     if "embedding" in ref_result and method == "encode":
@@ -656,7 +682,8 @@ def compare_all_settings(model: str,
                         )
                         assert sim >= 0.999, (
                             f"Embedding for {model=} are not the same.\n"
-                            f"cosine_similarity={sim}\n")
+                            f"cosine_similarity={sim}\n"
+                        )
                         del ref_result["embedding"]
                         del compare_result["embedding"]
                     assert ref_result == compare_result, (
@@ -664,7 +691,8 @@ def compare_all_settings(model: str,
                         f"{ref_args=} {ref_envs=}\n"
                         f"{compare_args=} {compare_envs=}\n"
                         f"{ref_result=}\n"
-                        f"{compare_result=}\n")
+                        f"{compare_result=}\n"
+                    )
 
 
 def init_test_distributed_environment(
@@ -679,7 +707,8 @@ def init_test_distributed_environment(
         world_size=pp_size * tp_size,
         rank=rank,
         distributed_init_method=distributed_init_method,
-        local_rank=local_rank)
+        local_rank=local_rank,
+    )
     ensure_model_parallel_initialized(tp_size, pp_size)
 
 
@@ -701,13 +730,17 @@ def multi_process_parallel(
     os.environ["RAY_RUNTIME_ENV_IGNORE_GITIGNORE"] = "1"
     ray.init(
         runtime_env={
-            "working_dir":
-            VLLM_PATH,
+            "working_dir": VLLM_PATH,
             "excludes": [
-                "build", ".git", "cmake-build-*", "shellcheck", "dist",
-                "ep_kernels_workspace"
-            ]
-        })
+                "build",
+                ".git",
+                "cmake-build-*",
+                "shellcheck",
+                "dist",
+                "ep_kernels_workspace",
+            ],
+        }
+    )
 
     distributed_init_port = get_open_port()
     refs = []
@@ -719,7 +752,8 @@ def multi_process_parallel(
                 pp_size,
                 rank,
                 distributed_init_port,
-            ), )
+            ),
+        )
     ray.get(refs)
 
     ray.shutdown()
@@ -748,11 +782,13 @@ def get_physical_device_indices(devices):
 
 
 @_nvml()
-def wait_for_gpu_memory_to_clear(*,
-                                 devices: list[int],
-                                 threshold_bytes: Optional[int] = None,
-                                 threshold_ratio: Optional[float] = None,
-                                 timeout_s: float = 120) -> None:
+def wait_for_gpu_memory_to_clear(
+    *,
+    devices: list[int],
+    threshold_bytes: Optional[int] = None,
+    threshold_ratio: Optional[float] = None,
+    timeout_s: float = 120,
+) -> None:
     assert threshold_bytes is not None or threshold_ratio is not None
     # Use nvml instead of pytorch to reduce measurement error from torch cuda
     # context.
@@ -773,29 +809,33 @@ def wait_for_gpu_memory_to_clear(*,
                 gb_used = mem_info.used / 2**30
                 gb_total = mem_info.total / 2**30
             output_raw[device] = (gb_used, gb_total)
-            output[device] = f'{gb_used:.02f}/{gb_total:.02f}'
+            output[device] = f"{gb_used:.02f}/{gb_total:.02f}"
 
-        print('gpu memory used/total (GiB): ', end='')
+        print("gpu memory used/total (GiB): ", end="")
         for k, v in output.items():
-            print(f'{k}={v}; ', end='')
-        print('')
+            print(f"{k}={v}; ", end="")
+        print("")
 
         if threshold_bytes is not None:
             is_free = lambda used, total: used <= threshold_bytes / 2**30
-            threshold = f"{threshold_bytes/2**30} GiB"
+            threshold = f"{threshold_bytes / 2**30} GiB"
         else:
             is_free = lambda used, total: used / total <= threshold_ratio
             threshold = f"{threshold_ratio:.2f}"
 
         dur_s = time.time() - start_time
         if all(is_free(used, total) for used, total in output_raw.values()):
-            print(f'Done waiting for free GPU memory on devices {devices=} '
-                  f'({threshold=}) {dur_s=:.02f}')
+            print(
+                f"Done waiting for free GPU memory on devices {devices=} "
+                f"({threshold=}) {dur_s=:.02f}"
+            )
             break
 
         if dur_s >= timeout_s:
-            raise ValueError(f'Memory of devices {devices=} not free after '
-                             f'{dur_s=:.02f} ({threshold=})')
+            raise ValueError(
+                f"Memory of devices {devices=} not free after "
+                f"{dur_s=:.02f} ({threshold=})"
+            )
 
         time.sleep(5)
 
@@ -803,8 +843,7 @@ def wait_for_gpu_memory_to_clear(*,
 _P = ParamSpec("_P")
 
 
-def fork_new_process_for_each_test(
-        func: Callable[_P, None]) -> Callable[_P, None]:
+def fork_new_process_for_each_test(func: Callable[_P, None]) -> Callable[_P, None]:
     """Decorator to fork a new process for each test function.
     See https://github.com/vllm-project/vllm/issues/7053 for more details.
     """
@@ -818,11 +857,15 @@ def wrapper(*args: _P.args, **kwargs: _P.kwargs) -> None:
 
         # Create a unique temporary file to store exception info from child
         # process. Use test function name and process ID to avoid collisions.
-        with tempfile.NamedTemporaryFile(
+        with (
+            tempfile.NamedTemporaryFile(
                 delete=False,
-                mode='w+b',
+                mode="w+b",
                 prefix=f"vllm_test_{func.__name__}_{os.getpid()}_",
-                suffix=".exc") as exc_file, ExitStack() as delete_after:
+                suffix=".exc",
+            ) as exc_file,
+            ExitStack() as delete_after,
+        ):
             exc_file_path = exc_file.name
             delete_after.callback(os.remove, exc_file_path)
 
@@ -840,6 +883,7 @@ def wrapper(*args: _P.args, **kwargs: _P.kwargs) -> None:
                     os._exit(0)
                 except Exception as e:
                     import traceback
+
                     tb_string = traceback.format_exc()
 
                     # Try to serialize the exception object first
@@ -847,18 +891,18 @@ def wrapper(*args: _P.args, **kwargs: _P.kwargs) -> None:
                     try:
                         # First, try to pickle the actual exception with
                         # its traceback.
-                        exc_to_serialize = {'pickled_exception': e}
+                        exc_to_serialize = {"pickled_exception": e}
                         # Test if it can be pickled
                         cloudpickle.dumps(exc_to_serialize)
                     except (Exception, KeyboardInterrupt):
                         # Fall back to string-based approach.
                         exc_to_serialize = {
-                            'exception_type': type(e).__name__,
-                            'exception_msg': str(e),
-                            'traceback': tb_string,
+                            "exception_type": type(e).__name__,
+                            "exception_msg": str(e),
+                            "traceback": tb_string,
                         }
                     try:
-                        with open(exc_file_path, 'wb') as f:
+                        with open(exc_file_path, "wb") as f:
                             cloudpickle.dump(exc_to_serialize, f)
                     except Exception:
                         # Fallback: just print the traceback.
@@ -870,8 +914,7 @@ def wrapper(*args: _P.args, **kwargs: _P.kwargs) -> None:
                 pgid = os.getpgid(pid)
                 _pid, _exitcode = os.waitpid(pid, 0)
                 # ignore SIGTERM signal itself
-                old_signal_handler = signal.signal(signal.SIGTERM,
-                                                   signal.SIG_IGN)
+                old_signal_handler = signal.signal(signal.SIGTERM, signal.SIG_IGN)
                 # kill all child processes
                 os.killpg(pgid, signal.SIGTERM)
                 # restore the signal handler
@@ -880,12 +923,15 @@ def wrapper(*args: _P.args, **kwargs: _P.kwargs) -> None:
                     # Try to read the exception from the child process
                     exc_info = {}
                     if os.path.exists(exc_file_path):
-                        with contextlib.suppress(Exception), \
-                            open(exc_file_path, 'rb') as f:
+                        with (
+                            contextlib.suppress(Exception),
+                            open(exc_file_path, "rb") as f,
+                        ):
                             exc_info = cloudpickle.load(f)
 
-                    if (original_exception :=
-                            exc_info.get('pickled_exception')) is not None:
+                    if (
+                        original_exception := exc_info.get("pickled_exception")
+                    ) is not None:
                         # Re-raise the actual exception object if it was
                         # successfully pickled.
                         assert isinstance(original_exception, Exception)
@@ -903,33 +949,33 @@ def wrapper(*args: _P.args, **kwargs: _P.kwargs) -> None:
                     raise AssertionError(
                         f"function {func.__name__} failed when called with"
                         f" args {args} and kwargs {kwargs}"
-                        f" (exit code: {_exitcode})") from None
+                        f" (exit code: {_exitcode})"
+                    ) from None
 
     return wrapper
 
 
-def spawn_new_process_for_each_test(
-        f: Callable[_P, None]) -> Callable[_P, None]:
-    """Decorator to spawn a new process for each test function.
-    """
+def spawn_new_process_for_each_test(f: Callable[_P, None]) -> Callable[_P, None]:
+    """Decorator to spawn a new process for each test function."""
 
     @functools.wraps(f)
     def wrapper(*args: _P.args, **kwargs: _P.kwargs) -> None:
         # Check if we're already in a subprocess
-        if os.environ.get('RUNNING_IN_SUBPROCESS') == '1':
+        if os.environ.get("RUNNING_IN_SUBPROCESS") == "1":
             # If we are, just run the function directly
             return f(*args, **kwargs)
 
         import torch.multiprocessing as mp
+
         with suppress(RuntimeError):
-            mp.set_start_method('spawn')
+            mp.set_start_method("spawn")
 
         # Get the module
         module_name = f.__module__
 
         # Create a process with environment variable set
         env = os.environ.copy()
-        env['RUNNING_IN_SUBPROCESS'] = '1'
+        env["RUNNING_IN_SUBPROCESS"] = "1"
 
         with tempfile.TemporaryDirectory() as tempdir:
             output_filepath = os.path.join(tempdir, "new_process.tmp")
@@ -939,29 +985,29 @@ def wrapper(*args: _P.args, **kwargs: _P.kwargs) -> None:
 
             cmd = [sys.executable, "-m", f"{module_name}"]
 
-            returned = subprocess.run(cmd,
-                                      input=input_bytes,
-                                      capture_output=True,
-                                      env=env)
+            returned = subprocess.run(
+                cmd, input=input_bytes, capture_output=True, env=env
+            )
 
             # check if the subprocess is successful
             try:
                 returned.check_returncode()
             except Exception as e:
                 # wrap raised exception to provide more information
-                raise RuntimeError(f"Error raised in subprocess:\n"
-                                   f"{returned.stderr.decode()}") from e
+                raise RuntimeError(
+                    f"Error raised in subprocess:\n{returned.stderr.decode()}"
+                ) from e
 
     return wrapper
 
 
 def create_new_process_for_each_test(
-    method: Optional[Literal["spawn", "fork"]] = None
+    method: Optional[Literal["spawn", "fork"]] = None,
 ) -> Callable[[Callable[_P, None]], Callable[_P, None]]:
     """Creates a decorator that runs each test function in a new process.
 
     Args:
-        method: The process creation method. Can be either "spawn" or "fork". 
+        method: The process creation method. Can be either "spawn" or "fork".
                If not specified, it defaults to "spawn" on ROCm and XPU
                platforms and "fork" otherwise.
 
@@ -972,8 +1018,7 @@ def create_new_process_for_each_test(
         use_spawn = current_platform.is_rocm() or current_platform.is_xpu()
         method = "spawn" if use_spawn else "fork"
 
-    assert method in ["spawn",
-                      "fork"], "Method must be either 'spawn' or 'fork'"
+    assert method in ["spawn", "fork"], "Method must be either 'spawn' or 'fork'"
 
     if method == "fork":
         return fork_new_process_for_each_test
@@ -1057,7 +1102,7 @@ async def completions_with_server_args(
     max_wait_seconds: int = 240,
     max_tokens: Union[int, list] = 5,
 ) -> list[Completion]:
-    '''Construct a remote OpenAI server, obtain an async client to the
+    """Construct a remote OpenAI server, obtain an async client to the
     server & invoke the completions API to obtain completions.
 
     Args:
@@ -1073,7 +1118,7 @@ async def completions_with_server_args(
 
     Returns:
       OpenAI Completion instance
-    '''
+    """
 
     if isinstance(max_tokens, int):
         max_tokens = [max_tokens] * len(prompts)
@@ -1081,17 +1126,21 @@ async def completions_with_server_args(
     assert len(max_tokens) == len(prompts)
 
     outputs = None
-    with RemoteOpenAIServer(model_name,
-                            server_cli_args,
-                            max_wait_seconds=max_wait_seconds) as server:
+    with RemoteOpenAIServer(
+        model_name, server_cli_args, max_wait_seconds=max_wait_seconds
+    ) as server:
         client = server.get_async_client()
-        outputs = [ client.completions.create(model=model_name,
-                                              prompt=[p],
-                                              temperature=0,
-                                              stream=False,
-                                              max_tokens=max_tok,
-                                              logprobs=num_logprobs) \
-                    for p, max_tok in zip(prompts, max_tokens) ]
+        outputs = [
+            client.completions.create(
+                model=model_name,
+                prompt=[p],
+                temperature=0,
+                stream=False,
+                max_tokens=max_tok,
+                logprobs=num_logprobs,
+            )
+            for p, max_tok in zip(prompts, max_tokens)
+        ]
         outputs = await asyncio.gather(*outputs)
 
     assert outputs is not None, "Completion API call failed."
@@ -1100,24 +1149,31 @@ async def completions_with_server_args(
 
 
 def get_client_text_generations(completions: list[Completion]) -> list[str]:
-    '''Extract generated tokens from the output of a
+    """Extract generated tokens from the output of a
     request made to an Open-AI-protocol completions endpoint.
-    '''
+    """
     assert all([len(x.choices) == 1 for x in completions])
     return [x.choices[0].text for x in completions]
 
 
 def get_client_text_logprob_generations(
-        completions: list[Completion]) -> list[TextTextLogprobs]:
-    '''Operates on the output of a request made to an Open-AI-protocol
+    completions: list[Completion],
+) -> list[TextTextLogprobs]:
+    """Operates on the output of a request made to an Open-AI-protocol
     completions endpoint; obtains top-rank logprobs for each token in
     each {class}`SequenceGroup`
-    '''
+    """
     text_generations = get_client_text_generations(completions)
-    text = ''.join(text_generations)
-    return [(text_generations, text,
-             (None if x.logprobs is None else x.logprobs.top_logprobs))
-            for completion in completions for x in completion.choices]
+    text = "".join(text_generations)
+    return [
+        (
+            text_generations,
+            text,
+            (None if x.logprobs is None else x.logprobs.top_logprobs),
+        )
+        for completion in completions
+        for x in completion.choices
+    ]
 
 
 def has_module_attribute(module_name, attribute_name):
@@ -1138,6 +1194,7 @@ def get_attn_backend_list_based_on_platform() -> list[str]:
         attn_backend_list = ["TRITON_ATTN"]
         try:
             import aiter  # noqa: F401
+
             attn_backend_list.append("FLASH_ATTN")
         except Exception:
             print("Skip FLASH_ATTN on ROCm as aiter is not installed")
@@ -1152,8 +1209,9 @@ def get_attn_backend_list_based_on_platform() -> list[str]:
 @contextmanager
 def override_cutlass_fp8_supported(value: bool):
     with patch(
-            "vllm.model_executor.layers.quantization.utils.w8a8_utils.cutlass_fp8_supported",
-            return_value=value):
+        "vllm.model_executor.layers.quantization.utils.w8a8_utils.cutlass_fp8_supported",
+        return_value=value,
+    ):
         yield
 
 
@@ -1174,8 +1232,10 @@ def prep_prompts(batch_size: int, ln_range: tuple[int, int] = (800, 1100)):
     for _ in range(batch_size):
         idx = random.randint(30, 90)
         indices.append(idx)
-        prompt = "```python\n# We set a number of variables, " + \
-                 f"x{idx} will be important later\n"
+        prompt = (
+            "```python\n# We set a number of variables, "
+            + f"x{idx} will be important later\n"
+        )
         ln = random.randint(*ln_range)
         for k in range(30, ln):
             v = random.randint(10, 99)
@@ -1188,10 +1248,9 @@ def prep_prompts(batch_size: int, ln_range: tuple[int, int] = (800, 1100)):
     return prompts, answer, indices
 
 
-def check_answers(indices: list[int],
-                  answer: list[int],
-                  outputs: list[str],
-                  accept_rate: float = 0.7):
+def check_answers(
+    indices: list[int], answer: list[int], outputs: list[str], accept_rate: float = 0.7
+):
     answer2 = [int(text[0:2].strip()) for text in outputs]
     print(list(zip(indices, zip(answer, answer2))))
     numok = 0
diff --git a/tests/utils_/test_gc_utils.py b/tests/utils_/test_gc_utils.py
index 265761b069ca..f1d0de87c81b 100644
--- a/tests/utils_/test_gc_utils.py
+++ b/tests/utils_/test_gc_utils.py
@@ -3,8 +3,11 @@
 from dataclasses import dataclass
 from typing import Any
 
-from vllm.utils.gc_utils import (GCDebugConfig, _compute_detailed_type,
-                                 _compute_top_gc_collected_objects)
+from vllm.utils.gc_utils import (
+    GCDebugConfig,
+    _compute_detailed_type,
+    _compute_top_gc_collected_objects,
+)
 
 
 @dataclass
@@ -21,38 +24,51 @@ def __len__(self) -> int:
 
 
 def test_compute_detailed_type():
-    assert _compute_detailed_type(
-        Normal(v=8)) == "<class 'tests.utils_.test_gc_utils.Normal'>"
+    assert (
+        _compute_detailed_type(Normal(v=8))
+        == "<class 'tests.utils_.test_gc_utils.Normal'>"
+    )
 
     assert _compute_detailed_type([1, 2, 3]) == "<class 'list'>(size:3)"
     assert _compute_detailed_type({4, 5}) == "<class 'set'>(size:2)"
     assert _compute_detailed_type({6: 7}) == "<class 'dict'>(size:1)"
-    assert _compute_detailed_type(ListWrapper(
-        vs=[])) == "<class 'tests.utils_.test_gc_utils.ListWrapper'>(size:0)"
+    assert (
+        _compute_detailed_type(ListWrapper(vs=[]))
+        == "<class 'tests.utils_.test_gc_utils.ListWrapper'>(size:0)"
+    )
 
 
 def test_compute_top_gc_collected_objects():
-    objects: list[Any] = [[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12],
-                          {13, 14}, {
-                              15: 16,
-                              17: 18
-                          },
-                          Normal(v=19),
-                          Normal(v=20),
-                          Normal(v=21)]
+    objects: list[Any] = [
+        [1, 2, 3],
+        [4, 5, 6],
+        [7, 8, 9],
+        [10, 11, 12],
+        {13, 14},
+        {15: 16, 17: 18},
+        Normal(v=19),
+        Normal(v=20),
+        Normal(v=21),
+    ]
     assert _compute_top_gc_collected_objects(objects, top=-1) == ""
     assert _compute_top_gc_collected_objects(objects, top=0) == ""
-    assert _compute_top_gc_collected_objects(
-        objects, top=1) == "    4:<class 'list'>(size:3)"
-    assert _compute_top_gc_collected_objects(objects, top=2) == "\n".join([
-        "    4:<class 'list'>(size:3)",
-        "    3:<class 'tests.utils_.test_gc_utils.Normal'>"
-    ])
-    assert _compute_top_gc_collected_objects(objects, top=3) == "\n".join([
-        "    4:<class 'list'>(size:3)",
-        "    3:<class 'tests.utils_.test_gc_utils.Normal'>",
-        "    1:<class 'set'>(size:2)"
-    ])
+    assert (
+        _compute_top_gc_collected_objects(objects, top=1)
+        == "    4:<class 'list'>(size:3)"
+    )
+    assert _compute_top_gc_collected_objects(objects, top=2) == "\n".join(
+        [
+            "    4:<class 'list'>(size:3)",
+            "    3:<class 'tests.utils_.test_gc_utils.Normal'>",
+        ]
+    )
+    assert _compute_top_gc_collected_objects(objects, top=3) == "\n".join(
+        [
+            "    4:<class 'list'>(size:3)",
+            "    3:<class 'tests.utils_.test_gc_utils.Normal'>",
+            "    1:<class 'set'>(size:2)",
+        ]
+    )
 
 
 def test_gc_debug_config():
@@ -64,6 +80,6 @@ def test_gc_debug_config():
     assert config.enabled
     assert config.top_objects == -1
 
-    config = GCDebugConfig("{\"top_objects\":5}")
+    config = GCDebugConfig('{"top_objects":5}')
     assert config.enabled
     assert config.top_objects == 5
diff --git a/tests/utils_/test_tensor_schema.py b/tests/utils_/test_tensor_schema.py
index 102d58ec452b..c86bed75472c 100644
--- a/tests/utils_/test_tensor_schema.py
+++ b/tests/utils_/test_tensor_schema.py
@@ -6,8 +6,7 @@
 
 from vllm.model_executor.models.glm4_1v import Glm4vImageEmbeddingInputs
 from vllm.model_executor.models.granite_speech import GraniteSpeechAudioInputs
-from vllm.model_executor.models.hyperclovax_vision import (
-    HCXVisionVideoPixelInputs)
+from vllm.model_executor.models.hyperclovax_vision import HCXVisionVideoPixelInputs
 from vllm.model_executor.models.phi3v import Phi3VImagePixelInputs
 
 
@@ -56,9 +55,10 @@ def test_tensor_schema_rank_mismatch():
 
 
 def test_tensor_schema_missing_required_field():
-    with pytest.raises(ValueError,
-                       match="Required field 'pixel_values' is missing"):
-        Phi3VImagePixelInputs(image_sizes=torch.randint(0, 256, (16, 2)), )
+    with pytest.raises(ValueError, match="Required field 'pixel_values' is missing"):
+        Phi3VImagePixelInputs(
+            image_sizes=torch.randint(0, 256, (16, 2)),
+        )
 
 
 def test_tensor_schema_symbolic_dim_mismatch():
@@ -140,10 +140,7 @@ def test_tensor_schema_with_valid_resolve_binding_dims():
     Phi3VImagePixelInputs(
         pixel_values=pixel_values,
         image_sizes=image_sizes,
-        resolve_bindings={
-            "h": 336,
-            "w": 336
-        },
+        resolve_bindings={"h": 336, "w": 336},
     )
 
 
@@ -156,10 +153,7 @@ def test_tensor_schema_with_invalid_resolve_binding_dims():
         Phi3VImagePixelInputs(
             pixel_values=pixel_values,
             image_sizes=image_sizes,
-            resolve_bindings={
-                "h": 336,
-                "w": 336
-            },
+            resolve_bindings={"h": 336, "w": 336},
         )
 
 
diff --git a/tests/utils_/test_utils.py b/tests/utils_/test_utils.py
index bdd92cc8e35e..db94845a8139 100644
--- a/tests/utils_/test_utils.py
+++ b/tests/utils_/test_utils.py
@@ -21,24 +21,41 @@
 from vllm_test_utils.monitor import monitor
 
 from vllm.config import ParallelConfig, VllmConfig, set_current_vllm_config
-from vllm.transformers_utils.detokenizer_utils import (
-    convert_ids_list_to_tokens)
+from vllm.transformers_utils.detokenizer_utils import convert_ids_list_to_tokens
 
 # isort: off
 from vllm.utils import (
-    CacheInfo, FlexibleArgumentParser, LRUCache, MemorySnapshot,
-    PlaceholderModule, bind_kv_cache, common_broadcastable_dtype,
-    current_stream, deprecate_kwargs, get_open_port, get_tcp_uri,
-    is_lossless_cast, join_host_port, make_zmq_path, make_zmq_socket,
-    memory_profiling, merge_async_iterators, sha256, split_host_port,
-    split_zmq_path, supports_kw, swap_dict_values, unique_filepath)
+    CacheInfo,
+    FlexibleArgumentParser,
+    LRUCache,
+    MemorySnapshot,
+    PlaceholderModule,
+    bind_kv_cache,
+    common_broadcastable_dtype,
+    current_stream,
+    deprecate_kwargs,
+    get_open_port,
+    get_tcp_uri,
+    is_lossless_cast,
+    join_host_port,
+    make_zmq_path,
+    make_zmq_socket,
+    memory_profiling,
+    merge_async_iterators,
+    sha256,
+    split_host_port,
+    split_zmq_path,
+    supports_kw,
+    swap_dict_values,
+    unique_filepath,
+)
+
 # isort: on
 from ..utils import create_new_process_for_each_test, error_on_warning
 
 
 @pytest.mark.asyncio
 async def test_merge_async_iterators():
-
     async def mock_async_iterator(idx: int):
         try:
             while True:
@@ -72,7 +89,6 @@ async def stream_output(generator: AsyncIterator[tuple[int, str]]):
 
 
 def test_deprecate_kwargs_always():
-
     @deprecate_kwargs("old_arg", is_deprecated=True)
     def dummy(*, old_arg: object = None, new_arg: object = None):
         pass
@@ -85,7 +101,6 @@ def dummy(*, old_arg: object = None, new_arg: object = None):
 
 
 def test_deprecate_kwargs_never():
-
     @deprecate_kwargs("old_arg", is_deprecated=False)
     def dummy(*, old_arg: object = None, new_arg: object = None):
         pass
@@ -120,7 +135,6 @@ def dummy(*, old_arg: object = None, new_arg: object = None):
 
 
 def test_deprecate_kwargs_additional_message():
-
     @deprecate_kwargs("old_arg", is_deprecated=True, additional_message="abcd")
     def dummy(*, old_arg: object = None, new_arg: object = None):
         pass
@@ -145,99 +159,107 @@ def test_get_open_port(monkeypatch: pytest.MonkeyPatch):
 @pytest.fixture
 def parser():
     parser = FlexibleArgumentParser()
-    parser.add_argument('--image-input-type',
-                        choices=['pixel_values', 'image_features'])
-    parser.add_argument('--model-name')
-    parser.add_argument('--batch-size', type=int)
-    parser.add_argument('--enable-feature', action='store_true')
-    parser.add_argument('--hf-overrides', type=json.loads)
-    parser.add_argument('-O', '--compilation-config', type=json.loads)
+    parser.add_argument(
+        "--image-input-type", choices=["pixel_values", "image_features"]
+    )
+    parser.add_argument("--model-name")
+    parser.add_argument("--batch-size", type=int)
+    parser.add_argument("--enable-feature", action="store_true")
+    parser.add_argument("--hf-overrides", type=json.loads)
+    parser.add_argument("-O", "--compilation-config", type=json.loads)
     return parser
 
 
 @pytest.fixture
 def parser_with_config():
     parser = FlexibleArgumentParser()
-    parser.add_argument('serve')
-    parser.add_argument('model_tag', nargs='?')
-    parser.add_argument('--model', type=str)
-    parser.add_argument('--served-model-name', type=str)
-    parser.add_argument('--config', type=str)
-    parser.add_argument('--port', type=int)
-    parser.add_argument('--tensor-parallel-size', type=int)
-    parser.add_argument('--trust-remote-code', action='store_true')
+    parser.add_argument("serve")
+    parser.add_argument("model_tag", nargs="?")
+    parser.add_argument("--model", type=str)
+    parser.add_argument("--served-model-name", type=str)
+    parser.add_argument("--config", type=str)
+    parser.add_argument("--port", type=int)
+    parser.add_argument("--tensor-parallel-size", type=int)
+    parser.add_argument("--trust-remote-code", action="store_true")
     return parser
 
 
 def test_underscore_to_dash(parser):
-    args = parser.parse_args(['--image_input_type', 'pixel_values'])
-    assert args.image_input_type == 'pixel_values'
+    args = parser.parse_args(["--image_input_type", "pixel_values"])
+    assert args.image_input_type == "pixel_values"
 
 
 def test_mixed_usage(parser):
-    args = parser.parse_args([
-        '--image_input_type', 'image_features', '--model-name',
-        'facebook/opt-125m'
-    ])
-    assert args.image_input_type == 'image_features'
-    assert args.model_name == 'facebook/opt-125m'
+    args = parser.parse_args(
+        ["--image_input_type", "image_features", "--model-name", "facebook/opt-125m"]
+    )
+    assert args.image_input_type == "image_features"
+    assert args.model_name == "facebook/opt-125m"
 
 
 def test_with_equals_sign(parser):
     args = parser.parse_args(
-        ['--image_input_type=pixel_values', '--model-name=facebook/opt-125m'])
-    assert args.image_input_type == 'pixel_values'
-    assert args.model_name == 'facebook/opt-125m'
+        ["--image_input_type=pixel_values", "--model-name=facebook/opt-125m"]
+    )
+    assert args.image_input_type == "pixel_values"
+    assert args.model_name == "facebook/opt-125m"
 
 
 def test_with_int_value(parser):
-    args = parser.parse_args(['--batch_size', '32'])
+    args = parser.parse_args(["--batch_size", "32"])
     assert args.batch_size == 32
-    args = parser.parse_args(['--batch-size', '32'])
+    args = parser.parse_args(["--batch-size", "32"])
     assert args.batch_size == 32
 
 
 def test_with_bool_flag(parser):
-    args = parser.parse_args(['--enable_feature'])
+    args = parser.parse_args(["--enable_feature"])
     assert args.enable_feature is True
-    args = parser.parse_args(['--enable-feature'])
+    args = parser.parse_args(["--enable-feature"])
     assert args.enable_feature is True
 
 
 def test_invalid_choice(parser):
     with pytest.raises(SystemExit):
-        parser.parse_args(['--image_input_type', 'invalid_choice'])
+        parser.parse_args(["--image_input_type", "invalid_choice"])
 
 
 def test_missing_required_argument(parser):
-    parser.add_argument('--required-arg', required=True)
+    parser.add_argument("--required-arg", required=True)
     with pytest.raises(SystemExit):
         parser.parse_args([])
 
 
 def test_cli_override_to_config(parser_with_config, cli_config_file):
-    args = parser_with_config.parse_args([
-        'serve', 'mymodel', '--config', cli_config_file,
-        '--tensor-parallel-size', '3'
-    ])
+    args = parser_with_config.parse_args(
+        ["serve", "mymodel", "--config", cli_config_file, "--tensor-parallel-size", "3"]
+    )
     assert args.tensor_parallel_size == 3
-    args = parser_with_config.parse_args([
-        'serve', 'mymodel', '--tensor-parallel-size', '3', '--config',
-        cli_config_file
-    ])
+    args = parser_with_config.parse_args(
+        ["serve", "mymodel", "--tensor-parallel-size", "3", "--config", cli_config_file]
+    )
     assert args.tensor_parallel_size == 3
     assert args.port == 12312
-    args = parser_with_config.parse_args([
-        'serve', 'mymodel', '--tensor-parallel-size', '3', '--config',
-        cli_config_file, '--port', '666'
-    ])
+    args = parser_with_config.parse_args(
+        [
+            "serve",
+            "mymodel",
+            "--tensor-parallel-size",
+            "3",
+            "--config",
+            cli_config_file,
+            "--port",
+            "666",
+        ]
+    )
     assert args.tensor_parallel_size == 3
     assert args.port == 666
 
 
 def test_config_args(parser_with_config, cli_config_file):
     args = parser_with_config.parse_args(
-        ['serve', 'mymodel', '--config', cli_config_file])
+        ["serve", "mymodel", "--config", cli_config_file]
+    )
     assert args.tensor_parallel_size == 2
     assert args.trust_remote_code
 
@@ -245,22 +267,31 @@ def test_config_args(parser_with_config, cli_config_file):
 def test_config_file(parser_with_config):
     with pytest.raises(FileNotFoundError):
         parser_with_config.parse_args(
-            ['serve', 'mymodel', '--config', 'test_config.yml'])
+            ["serve", "mymodel", "--config", "test_config.yml"]
+        )
 
     with pytest.raises(ValueError):
         parser_with_config.parse_args(
-            ['serve', 'mymodel', '--config', './data/test_config.json'])
+            ["serve", "mymodel", "--config", "./data/test_config.json"]
+        )
 
     with pytest.raises(ValueError):
-        parser_with_config.parse_args([
-            'serve', 'mymodel', '--tensor-parallel-size', '3', '--config',
-            '--batch-size', '32'
-        ])
+        parser_with_config.parse_args(
+            [
+                "serve",
+                "mymodel",
+                "--tensor-parallel-size",
+                "3",
+                "--config",
+                "--batch-size",
+                "32",
+            ]
+        )
 
 
 def test_no_model_tag(parser_with_config, cli_config_file):
     with pytest.raises(ValueError):
-        parser_with_config.parse_args(['serve', '--config', cli_config_file])
+        parser_with_config.parse_args(["serve", "--config", cli_config_file])
 
 
 def test_dict_args(parser):
@@ -323,7 +354,7 @@ def test_dict_args(parser):
         },
         "key14": {
             "key15": "-minus.and.dot",
-        }
+        },
     }
     assert parsed_args.compilation_config == {
         "level": 1,
@@ -375,24 +406,29 @@ def test_duplicate_dict_args(caplog_vllm, parser):
         (lambda foo, **kwargs: None, "something_else", False, True, True),
         (lambda foo, **kwargs: None, "kwargs", True, True, False),
         (lambda foo, **kwargs: None, "foo", True, True, False),
-    ])
+    ],
+)
 # yapf: disable
-def test_supports_kw(callable,kw_name,requires_kw_only,
-                     allow_var_kwargs,is_supported):
-    assert supports_kw(
+def test_supports_kw(
+    callable, kw_name, requires_kw_only, allow_var_kwargs, is_supported
+):
+    assert (
+        supports_kw(
             callable=callable,
             kw_name=kw_name,
             requires_kw_only=requires_kw_only,
-        allow_var_kwargs=allow_var_kwargs
-    ) == is_supported
+            allow_var_kwargs=allow_var_kwargs,
+        )
+        == is_supported
+    )
 
 
 @create_new_process_for_each_test()
 def test_memory_profiling():
     # Fake out some model loading + inference memory usage to test profiling
     # Memory used by other processes will show up as cuda usage outside of torch
-    from vllm.distributed.device_communicators.cuda_wrapper import (
-        CudaRTLibrary)
+    from vllm.distributed.device_communicators.cuda_wrapper import CudaRTLibrary
+
     lib = CudaRTLibrary()
     # 512 MiB allocation outside of this instance
     handle1 = lib.cudaMalloc(512 * 1024 * 1024)
@@ -401,9 +437,9 @@ def test_memory_profiling():
 
     # load weights
 
-    weights = torch.randn(128, 1024, 1024, device='cuda', dtype=torch.float32)
+    weights = torch.randn(128, 1024, 1024, device="cuda", dtype=torch.float32)
 
-    weights_memory = 128 * 1024 * 1024 * 4 # 512 MiB
+    weights_memory = 128 * 1024 * 1024 * 4  # 512 MiB
 
     def measure_current_non_torch():
         free, total = torch.cuda.mem_get_info()
@@ -412,11 +448,14 @@ def measure_current_non_torch():
         current_non_torch = current_used - current_torch
         return current_non_torch
 
-    with memory_profiling(baseline_snapshot=baseline_snapshot,
-    weights_memory=weights_memory) as result, \
-        monitor(measure_current_non_torch) as monitored_values:
+    with (
+        memory_profiling(
+            baseline_snapshot=baseline_snapshot, weights_memory=weights_memory
+        ) as result,
+        monitor(measure_current_non_torch) as monitored_values,
+    ):
         # make a memory spike, 1 GiB
-        spike = torch.randn(256, 1024, 1024, device='cuda', dtype=torch.float32)
+        spike = torch.randn(256, 1024, 1024, device="cuda", dtype=torch.float32)
         del spike
 
         # Add some extra non-torch memory 256 MiB (simulate NCCL)
@@ -431,7 +470,7 @@ def measure_current_non_torch():
     # 5% tolerance is caused by cuda runtime.
     # we cannot control cuda runtime in the granularity of bytes,
     # which causes a small error (<10 MiB in practice)
-    non_torch_ratio = result.non_torch_increase / (256 * 1024 * 1024) # noqa
+    non_torch_ratio = result.non_torch_increase / (256 * 1024 * 1024)  # noqa
     assert abs(non_torch_ratio - 1) <= 0.05
     assert result.torch_peak_increase == 1024 * 1024 * 1024
     del weights
@@ -443,87 +482,84 @@ def test_bind_kv_cache():
     from vllm.attention import Attention
 
     ctx = {
-        'layers.0.self_attn': Attention(32, 128, 0.1),
-        'layers.1.self_attn': Attention(32, 128, 0.1),
-        'layers.2.self_attn': Attention(32, 128, 0.1),
-        'layers.3.self_attn': Attention(32, 128, 0.1),
+        "layers.0.self_attn": Attention(32, 128, 0.1),
+        "layers.1.self_attn": Attention(32, 128, 0.1),
+        "layers.2.self_attn": Attention(32, 128, 0.1),
+        "layers.3.self_attn": Attention(32, 128, 0.1),
     }
     kv_cache = [
-        torch.zeros((1, )),
-        torch.zeros((1, )),
-        torch.zeros((1, )),
-        torch.zeros((1, )),
+        torch.zeros((1,)),
+        torch.zeros((1,)),
+        torch.zeros((1,)),
+        torch.zeros((1,)),
     ]
     bind_kv_cache(ctx, [kv_cache])
-    assert ctx['layers.0.self_attn'].kv_cache[0] is kv_cache[0]
-    assert ctx['layers.1.self_attn'].kv_cache[0] is kv_cache[1]
-    assert ctx['layers.2.self_attn'].kv_cache[0] is kv_cache[2]
-    assert ctx['layers.3.self_attn'].kv_cache[0] is kv_cache[3]
+    assert ctx["layers.0.self_attn"].kv_cache[0] is kv_cache[0]
+    assert ctx["layers.1.self_attn"].kv_cache[0] is kv_cache[1]
+    assert ctx["layers.2.self_attn"].kv_cache[0] is kv_cache[2]
+    assert ctx["layers.3.self_attn"].kv_cache[0] is kv_cache[3]
+
 
 def test_bind_kv_cache_kv_sharing():
     from vllm.attention import Attention
 
     ctx = {
-        'layers.0.self_attn': Attention(32, 128, 0.1),
-        'layers.1.self_attn': Attention(32, 128, 0.1),
-        'layers.2.self_attn': Attention(32, 128, 0.1),
-        'layers.3.self_attn': Attention(32, 128, 0.1),
+        "layers.0.self_attn": Attention(32, 128, 0.1),
+        "layers.1.self_attn": Attention(32, 128, 0.1),
+        "layers.2.self_attn": Attention(32, 128, 0.1),
+        "layers.3.self_attn": Attention(32, 128, 0.1),
     }
     kv_cache = [
-        torch.zeros((1, )),
-        torch.zeros((1, )),
-        torch.zeros((1, )),
-        torch.zeros((1, )),
+        torch.zeros((1,)),
+        torch.zeros((1,)),
+        torch.zeros((1,)),
+        torch.zeros((1,)),
     ]
     shared_kv_cache_layers = {
-        'layers.2.self_attn': 'layers.1.self_attn',
-        'layers.3.self_attn': 'layers.0.self_attn'
+        "layers.2.self_attn": "layers.1.self_attn",
+        "layers.3.self_attn": "layers.0.self_attn",
     }
     bind_kv_cache(ctx, [kv_cache], shared_kv_cache_layers)
-    assert ctx['layers.0.self_attn'].kv_cache[0] is kv_cache[0]
-    assert ctx['layers.1.self_attn'].kv_cache[0] is kv_cache[1]
-    assert ctx['layers.2.self_attn'].kv_cache[0] is kv_cache[1]
-    assert ctx['layers.3.self_attn'].kv_cache[0] is kv_cache[0]
+    assert ctx["layers.0.self_attn"].kv_cache[0] is kv_cache[0]
+    assert ctx["layers.1.self_attn"].kv_cache[0] is kv_cache[1]
+    assert ctx["layers.2.self_attn"].kv_cache[0] is kv_cache[1]
+    assert ctx["layers.3.self_attn"].kv_cache[0] is kv_cache[0]
+
 
 def test_bind_kv_cache_non_attention():
     from vllm.attention import Attention
 
     # example from Jamba PP=2
     ctx = {
-        'model.layers.20.attn': Attention(32, 128, 0.1),
-        'model.layers.28.attn': Attention(32, 128, 0.1),
+        "model.layers.20.attn": Attention(32, 128, 0.1),
+        "model.layers.28.attn": Attention(32, 128, 0.1),
     }
     kv_cache = [
-        torch.zeros((1, )),
-        torch.zeros((1, )),
+        torch.zeros((1,)),
+        torch.zeros((1,)),
     ]
     bind_kv_cache(ctx, [kv_cache])
-    assert ctx['model.layers.20.attn'].kv_cache[0] is kv_cache[0]
-    assert ctx['model.layers.28.attn'].kv_cache[0] is kv_cache[1]
+    assert ctx["model.layers.20.attn"].kv_cache[0] is kv_cache[0]
+    assert ctx["model.layers.28.attn"].kv_cache[0] is kv_cache[1]
 
 
 def test_bind_kv_cache_pp():
     with patch("vllm.utils.cuda_device_count_stateless", lambda: 2):
         # this test runs with 1 GPU, but we simulate 2 GPUs
-        cfg = VllmConfig(
-            parallel_config=ParallelConfig(pipeline_parallel_size=2))
+        cfg = VllmConfig(parallel_config=ParallelConfig(pipeline_parallel_size=2))
     with set_current_vllm_config(cfg):
         from vllm.attention import Attention
 
         ctx = {
-            'layers.0.self_attn': Attention(32, 128, 0.1),
+            "layers.0.self_attn": Attention(32, 128, 0.1),
         }
-        kv_cache = [
-            [torch.zeros((1, ))],
-            [torch.zeros((1, ))]
-        ]
+        kv_cache = [[torch.zeros((1,))], [torch.zeros((1,))]]
         bind_kv_cache(ctx, kv_cache)
-        assert ctx['layers.0.self_attn'].kv_cache[0] is kv_cache[0][0]
-        assert ctx['layers.0.self_attn'].kv_cache[1] is kv_cache[1][0]
+        assert ctx["layers.0.self_attn"].kv_cache[0] is kv_cache[0][0]
+        assert ctx["layers.0.self_attn"].kv_cache[1] is kv_cache[1][0]
 
 
 class TestLRUCache(LRUCache):
-
     def _on_remove(self, key, value):
         if not hasattr(self, "_remove_counter"):
             self._remove_counter = 0
diff --git a/tests/v1/attention/test_attention_backends.py b/tests/v1/attention/test_attention_backends.py
index 24cdd8afbb3b..188482e071ee 100644
--- a/tests/v1/attention/test_attention_backends.py
+++ b/tests/v1/attention/test_attention_backends.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Tests for v1 attention backends without GPUModelRunner dependency."""
+
 from functools import partial
 from typing import Optional, Union
 
@@ -8,21 +9,30 @@
 import torch
 from torch.nn.attention.flex_attention import create_block_mask, flex_attention
 
-from tests.v1.attention.utils import (BatchSpec, create_common_attn_metadata,
-                                      create_standard_kv_cache_spec,
-                                      create_vllm_config,
-                                      get_attention_backend)
+from tests.v1.attention.utils import (
+    BatchSpec,
+    create_common_attn_metadata,
+    create_standard_kv_cache_spec,
+    create_vllm_config,
+    get_attention_backend,
+)
 from vllm.attention.backends.registry import _Backend
 from vllm.config import ModelConfig
 from vllm.platforms import current_platform
 from vllm.utils import STR_DTYPE_TO_TORCH_DTYPE, cdiv, is_torch_equal_or_newer
-from vllm.v1.attention.backends.utils import (CommonAttentionMetadata,
-                                              set_kv_cache_layout)
+from vllm.v1.attention.backends.utils import (
+    CommonAttentionMetadata,
+    set_kv_cache_layout,
+)
 from vllm.v1.kv_cache_interface import FullAttentionSpec
 
 BACKENDS_TO_TEST = [
-    _Backend.FLASH_ATTN, _Backend.FLASHINFER, _Backend.FLEX_ATTENTION,
-    _Backend.TRITON_ATTN, _Backend.TREE_ATTN, "FLEX_ATTENTION_SLOW"
+    _Backend.FLASH_ATTN,
+    _Backend.FLASHINFER,
+    _Backend.FLEX_ATTENTION,
+    _Backend.TRITON_ATTN,
+    _Backend.TREE_ATTN,
+    "FLEX_ATTENTION_SLOW",
 ]
 
 # Remove flashinfer from the list if it's not available
@@ -49,42 +59,38 @@ def _convert_dtype_to_torch(dtype):
 
 # Define common batch configurations
 BATCH_SPECS = {
-    "small_decode":
-    BatchSpec(seq_lens=[32, 40], query_lens=[1, 1]),
-    "small_prefill":
-    BatchSpec(seq_lens=[32, 40], query_lens=[8, 8]),
-    "mixed_small":
-    BatchSpec(seq_lens=[32, 40, 48, 56], query_lens=[1, 1, 5, 5]),
-    "medium_decode":
-    BatchSpec(seq_lens=[128, 256, 512, 1024, 128, 256, 512, 1024],
-              query_lens=[1, 1, 1, 1, 1, 1, 1, 1]),
-    "medium_prefill":
-    BatchSpec(seq_lens=[256, 512, 1024, 2048], query_lens=[16, 16, 16, 16]),
-    "mixed_medium":
-    BatchSpec(seq_lens=[512, 1024, 2048, 512, 1024, 2048],
-              query_lens=[1, 1, 1, 7, 7, 7]),
-    "large_decode":
-    BatchSpec(seq_lens=[2048] * 32, query_lens=[1] * 32),
-    "large_prefill":
-    BatchSpec(seq_lens=[4096] * 8, query_lens=[32] * 8),
-    "single_decode":
-    BatchSpec(seq_lens=[1024], query_lens=[1]),
-    "single_prefill":
-    BatchSpec(seq_lens=[1024], query_lens=[64]),
+    "small_decode": BatchSpec(seq_lens=[32, 40], query_lens=[1, 1]),
+    "small_prefill": BatchSpec(seq_lens=[32, 40], query_lens=[8, 8]),
+    "mixed_small": BatchSpec(seq_lens=[32, 40, 48, 56], query_lens=[1, 1, 5, 5]),
+    "medium_decode": BatchSpec(
+        seq_lens=[128, 256, 512, 1024, 128, 256, 512, 1024],
+        query_lens=[1, 1, 1, 1, 1, 1, 1, 1],
+    ),
+    "medium_prefill": BatchSpec(
+        seq_lens=[256, 512, 1024, 2048], query_lens=[16, 16, 16, 16]
+    ),
+    "mixed_medium": BatchSpec(
+        seq_lens=[512, 1024, 2048, 512, 1024, 2048], query_lens=[1, 1, 1, 7, 7, 7]
+    ),
+    "large_decode": BatchSpec(seq_lens=[2048] * 32, query_lens=[1] * 32),
+    "large_prefill": BatchSpec(seq_lens=[4096] * 8, query_lens=[32] * 8),
+    "single_decode": BatchSpec(seq_lens=[1024], query_lens=[1]),
+    "single_prefill": BatchSpec(seq_lens=[1024], query_lens=[64]),
 }
 
 
 def create_and_prepopulate_kv_cache(
-        k_contexts: list[torch.Tensor],
-        v_contexts: list[torch.Tensor],
-        block_size: int,
-        num_kv_heads: int,
-        head_size: int,
-        dtype: torch.dtype,
-        device: torch.device,
-        num_blocks: int,
-        common_attn_metadata: CommonAttentionMetadata,
-        randomize_blocks: bool = True) -> torch.Tensor:
+    k_contexts: list[torch.Tensor],
+    v_contexts: list[torch.Tensor],
+    block_size: int,
+    num_kv_heads: int,
+    head_size: int,
+    dtype: torch.dtype,
+    device: torch.device,
+    num_blocks: int,
+    common_attn_metadata: CommonAttentionMetadata,
+    randomize_blocks: bool = True,
+) -> torch.Tensor:
     """Create and prepopulate a KV cache with context data.
 
     Args:
@@ -106,20 +112,18 @@ def create_and_prepopulate_kv_cache(
     """
     batch_size = len(k_contexts)
     seq_lens = common_attn_metadata.seq_lens_cpu
-    query_lens = common_attn_metadata.query_start_loc_cpu[
-        1:] - common_attn_metadata.query_start_loc_cpu[:-1]
+    query_lens = (
+        common_attn_metadata.query_start_loc_cpu[1:]
+        - common_attn_metadata.query_start_loc_cpu[:-1]
+    )
     context_lens = common_attn_metadata.num_computed_tokens_cpu
     block_table = common_attn_metadata.block_table_tensor
     slot_mapping = common_attn_metadata.slot_mapping
 
     # Create KV cache
-    kv_cache = torch.empty(2,
-                           num_blocks,
-                           block_size,
-                           num_kv_heads,
-                           head_size,
-                           dtype=dtype,
-                           device=device)
+    kv_cache = torch.empty(
+        2, num_blocks, block_size, num_kv_heads, head_size, dtype=dtype, device=device
+    )
     kv_cache_flat = kv_cache.view(2, -1, num_kv_heads, head_size)
 
     # Populate the cache with the context tokens
@@ -168,8 +172,8 @@ def create_and_prepopulate_kv_cache(
         start = common_attn_metadata.query_start_loc_cpu[i]
         end = common_attn_metadata.query_start_loc_cpu[i + 1]
         slot_mapping[start:end] = block_table[
-            i,
-            block_indices] * block_size + token_inter_block_offsets.to(device)
+            i, block_indices
+        ] * block_size + token_inter_block_offsets.to(device)
 
     return kv_cache
 
@@ -222,20 +226,19 @@ def mock_get_per_layer_parameters(vllm_config, layer_names, impl_cls):
             # Return mock parameters for a single layer
             head_size = vllm_config.model_config.get_head_size()
             return {
-                layer_name:
-                PerLayerParameters(
+                layer_name: PerLayerParameters(
                     window_left=-1,  # No sliding window
                     logits_soft_cap=0.0,  # No soft cap
-                    sm_scale=1.0 / (head_size**0.5)  # Standard scale
+                    sm_scale=1.0 / (head_size**0.5),  # Standard scale
                 )
                 for layer_name in layer_names
             }
 
         with unittest.mock.patch(
-                'vllm.v1.attention.backends.flashinfer.get_per_layer_parameters',
-                mock_get_per_layer_parameters):
-            builder = builder_cls(kv_cache_spec, layer_names, vllm_config,
-                                  device)
+            "vllm.v1.attention.backends.flashinfer.get_per_layer_parameters",
+            mock_get_per_layer_parameters,
+        ):
+            builder = builder_cls(kv_cache_spec, layer_names, vllm_config, device)
             attn_metadata = builder.build(
                 common_prefix_len=0,
                 common_attn_metadata=common_attn_metadata,
@@ -252,9 +255,11 @@ def mock_get_per_layer_parameters(vllm_config, layer_names, impl_cls):
 
     # Instantiate implementation
     num_heads = vllm_config.model_config.get_num_attention_heads(
-        vllm_config.parallel_config)
+        vllm_config.parallel_config
+    )
     num_kv_heads = vllm_config.model_config.get_num_kv_heads(
-        vllm_config.parallel_config)
+        vllm_config.parallel_config
+    )
     head_size = vllm_config.model_config.get_head_size()
     scale = 1.0 / (head_size**0.5)
     impl = impl_cls(
@@ -274,13 +279,9 @@ def mock_get_per_layer_parameters(vllm_config, layer_names, impl_cls):
     # Run forward pass
     # NOTE: The query, key, and value are already shaped correctly
     # in the calling test function.
-    output = impl.forward(mock_layer,
-                          query,
-                          key,
-                          value,
-                          kv_cache,
-                          attn_metadata,
-                          output=output)
+    output = impl.forward(
+        mock_layer, query, key, value, kv_cache, attn_metadata, output=output
+    )
 
     return output
 
@@ -311,10 +312,12 @@ def _test_backend_correctness(
     5. Comparing the vLLM backend's output to the ground-truth SDPA output.
     """
     current_platform.seed_everything(42)
-    vllm_config = create_vllm_config(model_name=model,
-                                     max_model_len=max(batch_spec.seq_lens),
-                                     block_size=block_size,
-                                     num_gpu_blocks=8192)
+    vllm_config = create_vllm_config(
+        model_name=model,
+        max_model_len=max(batch_spec.seq_lens),
+        block_size=block_size,
+        num_gpu_blocks=8192,
+    )
     device = torch.device("cuda:0")
 
     kv_cache_spec = create_standard_kv_cache_spec(vllm_config)
@@ -324,9 +327,11 @@ def _test_backend_correctness(
     seq_lens = batch_spec.seq_lens
     query_lens = batch_spec.query_lens
     num_q_heads = vllm_config.model_config.get_num_attention_heads(
-        vllm_config.parallel_config)
+        vllm_config.parallel_config
+    )
     num_kv_heads = vllm_config.model_config.get_num_kv_heads(
-        vllm_config.parallel_config)
+        vllm_config.parallel_config
+    )
     head_size = vllm_config.model_config.get_head_size()
     sliding_window = vllm_config.model_config.get_sliding_window()
     dtype = _convert_dtype_to_torch(vllm_config.model_config.dtype)
@@ -344,21 +349,9 @@ def _test_backend_correctness(
         context_len = s_len - q_len
 
         # Generate Q, K, V for the whole sequence to be used in SDPA
-        q = torch.randn(q_len,
-                        num_q_heads,
-                        head_size,
-                        dtype=dtype,
-                        device=device)
-        k_full = torch.randn(s_len,
-                             num_kv_heads,
-                             head_size,
-                             dtype=dtype,
-                             device=device)
-        v_full = torch.randn(s_len,
-                             num_kv_heads,
-                             head_size,
-                             dtype=dtype,
-                             device=device)
+        q = torch.randn(q_len, num_q_heads, head_size, dtype=dtype, device=device)
+        k_full = torch.randn(s_len, num_kv_heads, head_size, dtype=dtype, device=device)
+        v_full = torch.randn(s_len, num_kv_heads, head_size, dtype=dtype, device=device)
 
         # SDPA expects (N, H, L, D), so unsqueeze batch and permute
         q_sdpa_in = q.unsqueeze(0).transpose(1, 2)
@@ -368,7 +361,8 @@ def _test_backend_correctness(
         if num_q_heads != num_kv_heads:
             assert num_q_heads % num_kv_heads == 0, (
                 f"num_q_heads ({num_q_heads}) must be divisible by "
-                f"num_kv_heads ({num_kv_heads})")
+                f"num_kv_heads ({num_kv_heads})"
+            )
             repeats = num_q_heads // num_kv_heads
             k_sdpa_in = k_sdpa_in.repeat_interleave(repeats, dim=1)
             v_sdpa_in = v_sdpa_in.repeat_interleave(repeats, dim=1)
@@ -378,18 +372,17 @@ def _test_backend_correctness(
         kv_len = s_len
 
         final_mask_mod = partial(mask_mod, context_len=context_len)
-        block_mask = create_block_mask(final_mask_mod,
-                                       B=None,
-                                       H=None,
-                                       Q_LEN=q_len,
-                                       KV_LEN=kv_len,
-                                       device=device)
-        sdpa_out_i = flex_attention(q_sdpa_in,
-                                    k_sdpa_in,
-                                    v_sdpa_in,
-                                    block_mask=block_mask,
-                                    scale=scale,
-                                    enable_gqa=True)
+        block_mask = create_block_mask(
+            final_mask_mod, B=None, H=None, Q_LEN=q_len, KV_LEN=kv_len, device=device
+        )
+        sdpa_out_i = flex_attention(
+            q_sdpa_in,
+            k_sdpa_in,
+            v_sdpa_in,
+            block_mask=block_mask,
+            scale=scale,
+            enable_gqa=True,
+        )
 
         all_sdpa_outputs.append(sdpa_out_i.transpose(1, 2).squeeze(0))
 
@@ -408,7 +401,8 @@ def _test_backend_correctness(
     sdpa_output = torch.cat(all_sdpa_outputs, dim=0)
 
     common_attn_metadata = create_common_attn_metadata(
-        batch_spec, vllm_config.cache_config.block_size, device)
+        batch_spec, vllm_config.cache_config.block_size, device
+    )
 
     # 3. Simulate Paged KV Cache and a realistic slot_mapping
     kv_cache = create_and_prepopulate_kv_cache(
@@ -421,7 +415,8 @@ def _test_backend_correctness(
         device=device,
         num_blocks=vllm_config.cache_config.num_gpu_blocks or 1000,
         common_attn_metadata=common_attn_metadata,
-        randomize_blocks=True)
+        randomize_blocks=True,
+    )
 
     # 4. Run vLLM backends and compare
     # Note: flex_attention has known Triton kernel compatibility issues
@@ -437,8 +432,9 @@ def _test_backend_correctness(
             kv_cache_for_backend = kv_cache.transpose(0, 1)
 
             # For FlashInfer default to HND layout and
-            kv_cache_for_backend = kv_cache_for_backend.transpose(
-                2, 3).contiguous().transpose(2, 3)
+            kv_cache_for_backend = (
+                kv_cache_for_backend.transpose(2, 3).contiguous().transpose(2, 3)
+            )
             set_kv_cache_layout("HND")
 
         backend_output = run_attention_backend(
@@ -458,32 +454,45 @@ def _test_backend_correctness(
         # Check shape and dtype consistency
         assert backend_output.shape == sdpa_output.shape, (
             f"[{backend_name}] shape {backend_output.shape} != "
-            f"SDPA shape {sdpa_output.shape}")
+            f"SDPA shape {sdpa_output.shape}"
+        )
         assert backend_output.dtype == sdpa_output.dtype, (
             f"[{backend_name}] dtype {backend_output.dtype} != "
-            f"SDPA dtype {sdpa_output.dtype}")
+            f"SDPA dtype {sdpa_output.dtype}"
+        )
 
         assert torch.isfinite(backend_output).all(), (
-            f"[{backend_name}] produced non-finite values")
+            f"[{backend_name}] produced non-finite values"
+        )
 
         # Check numerical similarity
         def error_msg(msg: str, backend_name: str):
-            return (f"[{backend_name}] output differs from SDPA baseline. "
-                    f"{msg}")
-
-        torch.testing.assert_close(backend_output,
-                                   sdpa_output,
-                                   rtol=rtol,
-                                   atol=atol,
-                                   msg=partial(error_msg,
-                                               backend_name=backend_name))
-
-
-@pytest.mark.parametrize("batch_spec_name", [
-    "small_decode", "small_prefill", "mixed_small", "medium_decode",
-    "medium_prefill", "mixed_medium", "large_decode", "large_prefill",
-    "single_decode", "single_prefill"
-])
+            return f"[{backend_name}] output differs from SDPA baseline. {msg}"
+
+        torch.testing.assert_close(
+            backend_output,
+            sdpa_output,
+            rtol=rtol,
+            atol=atol,
+            msg=partial(error_msg, backend_name=backend_name),
+        )
+
+
+@pytest.mark.parametrize(
+    "batch_spec_name",
+    [
+        "small_decode",
+        "small_prefill",
+        "mixed_small",
+        "medium_decode",
+        "medium_prefill",
+        "mixed_medium",
+        "large_decode",
+        "large_prefill",
+        "single_decode",
+        "single_prefill",
+    ],
+)
 @pytest.mark.parametrize("model", ["meta-llama/Meta-Llama-3-8B"])
 def test_causal_backend_correctness(batch_spec_name: str, model: str):
     """Test backend's correctness with causal attention."""
@@ -499,33 +508,33 @@ def causal_mask_mod(
         return (q_idx + context_len) >= kv_idx
 
     batch_spec = BATCH_SPECS[batch_spec_name]
-    LARGE_BLOCK_BACKENDS = ([_Backend.FLEX_ATTENTION]
-                            if is_torch_equal_or_newer("2.9.0.dev0") else [])
+    LARGE_BLOCK_BACKENDS = (
+        [_Backend.FLEX_ATTENTION] if is_torch_equal_or_newer("2.9.0.dev0") else []
+    )
     SMALL_BLOCK_BACKENDS = [
         x for x in BACKENDS_TO_TEST if x not in LARGE_BLOCK_BACKENDS
     ]
-    _test_backend_correctness(batch_spec, model, SMALL_BLOCK_BACKENDS,
-                              causal_mask_mod)
+    _test_backend_correctness(batch_spec, model, SMALL_BLOCK_BACKENDS, causal_mask_mod)
 
     # Fast FlexAttention needs to run with block_size=128
     if LARGE_BLOCK_BACKENDS:
-        _test_backend_correctness(batch_spec,
-                                  model,
-                                  LARGE_BLOCK_BACKENDS,
-                                  causal_mask_mod,
-                                  block_size=128)
+        _test_backend_correctness(
+            batch_spec, model, LARGE_BLOCK_BACKENDS, causal_mask_mod, block_size=128
+        )
 
 
 SLIDING_WINDOW_BACKENDS_TO_TEST = [
-    _Backend.FLASH_ATTN, _Backend.FLEX_ATTENTION, _Backend.TRITON_ATTN,
-    "FLEX_ATTENTION_SLOW"
+    _Backend.FLASH_ATTN,
+    _Backend.FLEX_ATTENTION,
+    _Backend.TRITON_ATTN,
+    "FLEX_ATTENTION_SLOW",
 ]
 
 
-@pytest.mark.parametrize("batch_spec_name", [
-    "small_decode", "small_prefill", "mixed_medium", "large_decode",
-    "large_prefill"
-])
+@pytest.mark.parametrize(
+    "batch_spec_name",
+    ["small_decode", "small_prefill", "mixed_medium", "large_decode", "large_prefill"],
+)
 @pytest.mark.parametrize("model", ["microsoft/Phi-tiny-MoE-instruct"])
 def test_sliding_window_backend_correctness(batch_spec_name: str, model: str):
     """Test backend's correctness with sliding window attention."""
@@ -544,25 +553,28 @@ def sliding_window_mask_mod(
         return causal_mask & window_mask
 
     batch_spec = BATCH_SPECS[batch_spec_name]
-    model_config = ModelConfig(model=model,
-                               max_model_len=max(batch_spec.seq_lens))
+    model_config = ModelConfig(model=model, max_model_len=max(batch_spec.seq_lens))
     sliding_window = model_config.get_sliding_window()
-    sliding_window_mask_mod_fn = partial(sliding_window_mask_mod,
-                                         sliding_window=sliding_window)
+    sliding_window_mask_mod_fn = partial(
+        sliding_window_mask_mod, sliding_window=sliding_window
+    )
 
-    LARGE_BLOCK_BACKENDS = ([_Backend.FLEX_ATTENTION]
-                            if is_torch_equal_or_newer("2.9.0.dev0") else [])
+    LARGE_BLOCK_BACKENDS = (
+        [_Backend.FLEX_ATTENTION] if is_torch_equal_or_newer("2.9.0.dev0") else []
+    )
     SMALL_BLOCK_BACKENDS = [
-        x for x in SLIDING_WINDOW_BACKENDS_TO_TEST
-        if x not in LARGE_BLOCK_BACKENDS
+        x for x in SLIDING_WINDOW_BACKENDS_TO_TEST if x not in LARGE_BLOCK_BACKENDS
     ]
-    _test_backend_correctness(batch_spec, model, SMALL_BLOCK_BACKENDS,
-                              sliding_window_mask_mod_fn)
+    _test_backend_correctness(
+        batch_spec, model, SMALL_BLOCK_BACKENDS, sliding_window_mask_mod_fn
+    )
 
     # Fast FlexAttention needs to run with block_size=128
     if LARGE_BLOCK_BACKENDS:
-        _test_backend_correctness(batch_spec,
-                                  model,
-                                  LARGE_BLOCK_BACKENDS,
-                                  sliding_window_mask_mod_fn,
-                                  block_size=128)
+        _test_backend_correctness(
+            batch_spec,
+            model,
+            LARGE_BLOCK_BACKENDS,
+            sliding_window_mask_mod_fn,
+            block_size=128,
+        )
diff --git a/tests/v1/attention/test_attention_backends_selection.py b/tests/v1/attention/test_attention_backends_selection.py
index 59e562814946..6464bb52a4ea 100644
--- a/tests/v1/attention/test_attention_backends_selection.py
+++ b/tests/v1/attention/test_attention_backends_selection.py
@@ -9,17 +9,16 @@
 from vllm.model_executor.layers.mamba.mamba_mixer import MambaMixer
 from vllm.model_executor.layers.mamba.mamba_mixer2 import MambaMixer2
 from vllm.model_executor.layers.mamba.short_conv import ShortConv
-from vllm.model_executor.models.minimax_text_01 import (
-    MiniMaxText01LinearAttention)
+from vllm.model_executor.models.minimax_text_01 import MiniMaxText01LinearAttention
 from vllm.v1.attention.backends.linear_attn import LinearAttentionBackend
 from vllm.v1.attention.backends.mamba1_attn import Mamba1AttentionBackend
 from vllm.v1.attention.backends.mamba2_attn import Mamba2AttentionBackend
-from vllm.v1.attention.backends.short_conv_attn import (
-    ShortConvAttentionBackend)
+from vllm.v1.attention.backends.short_conv_attn import ShortConvAttentionBackend
 
 
 @pytest.mark.parametrize(
-    "layer_class, init_kwargs, expected_backend, expected_mamba_type", [
+    "layer_class, init_kwargs, expected_backend, expected_mamba_type",
+    [
         (
             MambaMixer,
             dict(
@@ -77,9 +76,11 @@
             ShortConvAttentionBackend,
             "short_conv",
         ),
-    ])
-def test_mamba_layers_get_attn_backend(dist_init, layer_class, init_kwargs,
-                                       expected_backend, expected_mamba_type):
+    ],
+)
+def test_mamba_layers_get_attn_backend(
+    dist_init, layer_class, init_kwargs, expected_backend, expected_mamba_type
+):
     """Test that Mamba-like layers return the correct attention backend."""
     layer = layer_class(**init_kwargs)
 
@@ -88,17 +89,23 @@ def test_mamba_layers_get_attn_backend(dist_init, layer_class, init_kwargs,
     assert layer.mamba_type == expected_mamba_type
 
 
-@pytest.mark.parametrize("layer_class,expected_backend,expected_mamba_type", [
-    (MambaMixer, Mamba1AttentionBackend, "mamba1"),
-    (MambaMixer2, Mamba2AttentionBackend, "mamba2"),
-    (MiniMaxText01LinearAttention, LinearAttentionBackend, "linear_attention"),
-    (ShortConv, ShortConvAttentionBackend, "short_conv"),
-])
-def test_mamba_layers_have_unified_interface(layer_class, expected_backend,
-                                             expected_mamba_type):
-    """Test that all Mamba layers have the unified get_attn_backend 
+@pytest.mark.parametrize(
+    "layer_class,expected_backend,expected_mamba_type",
+    [
+        (MambaMixer, Mamba1AttentionBackend, "mamba1"),
+        (MambaMixer2, Mamba2AttentionBackend, "mamba2"),
+        (MiniMaxText01LinearAttention, LinearAttentionBackend, "linear_attention"),
+        (ShortConv, ShortConvAttentionBackend, "short_conv"),
+    ],
+)
+def test_mamba_layers_have_unified_interface(
+    layer_class, expected_backend, expected_mamba_type
+):
+    """Test that all Mamba layers have the unified get_attn_backend
     interface."""
-    assert hasattr(layer_class, 'get_attn_backend'), (
-        f"{layer_class.__name__} should have get_attn_backend method")
-    assert hasattr(layer_class, 'mamba_type'), (
-        f"{layer_class.__name__} should have mamba_type property")
+    assert hasattr(layer_class, "get_attn_backend"), (
+        f"{layer_class.__name__} should have get_attn_backend method"
+    )
+    assert hasattr(layer_class, "mamba_type"), (
+        f"{layer_class.__name__} should have mamba_type property"
+    )
diff --git a/tests/v1/attention/test_attention_splitting.py b/tests/v1/attention/test_attention_splitting.py
index d81f3da7e9cd..6335d2a7db5e 100644
--- a/tests/v1/attention/test_attention_splitting.py
+++ b/tests/v1/attention/test_attention_splitting.py
@@ -6,11 +6,13 @@
 
 from tests.v1.attention.test_attention_backends import BATCH_SPECS
 from tests.v1.attention.utils import BatchSpec, create_common_attn_metadata
-from vllm.v1.attention.backends.utils import (UBatchSlice,
-                                              _make_metadata_with_slice,
-                                              slice_query_start_locs,
-                                              split_attn_metadata,
-                                              split_decodes_and_prefills)
+from vllm.v1.attention.backends.utils import (
+    UBatchSlice,
+    _make_metadata_with_slice,
+    slice_query_start_locs,
+    split_attn_metadata,
+    split_decodes_and_prefills,
+)
 from vllm.v1.worker.ubatch_splitting import create_ubatch_slices
 
 
@@ -79,9 +81,7 @@ def small_decode_metadata():
     """Create metadata for small decode batch"""
     batch_spec = BATCH_SPECS["small_decode"]
     device = torch.device("cpu")
-    return create_common_attn_metadata(batch_spec,
-                                       block_size=16,
-                                       device=device)
+    return create_common_attn_metadata(batch_spec, block_size=16, device=device)
 
 
 @pytest.fixture
@@ -89,9 +89,7 @@ def large_decode_metadata():
     """Create metadata for small decode batch"""
     batch_spec = BATCH_SPECS["large_decode"]
     device = torch.device("cpu")
-    return create_common_attn_metadata(batch_spec,
-                                       block_size=16,
-                                       device=device)
+    return create_common_attn_metadata(batch_spec, block_size=16, device=device)
 
 
 @pytest.fixture
@@ -99,9 +97,7 @@ def mixed_small_metadata():
     """Create metadata for mixed small batch"""
     batch_spec = BATCH_SPECS["mixed_small"]
     device = torch.device("cpu")
-    return create_common_attn_metadata(batch_spec,
-                                       block_size=16,
-                                       device=device)
+    return create_common_attn_metadata(batch_spec, block_size=16, device=device)
 
 
 # Tests for _make_metadata_with_slice
@@ -122,8 +118,7 @@ def test_make_metadata_with_slice_decode_batch(small_decode_metadata):
 
 def test_make_metadata_with_slice_mixed_batch(mixed_small_metadata):
     """Test slicing mixed batch metadata"""
-    ubatch_slice = UBatchSlice(slice(1, 3),
-                               slice(1, 7))  # Requests 1-3, tokens 1-7
+    ubatch_slice = UBatchSlice(slice(1, 3), slice(1, 7))  # Requests 1-3, tokens 1-7
 
     result = _make_metadata_with_slice(ubatch_slice, mixed_small_metadata)
 
@@ -140,8 +135,7 @@ def test_split_attn_metadata_decode_batch(large_decode_metadata):
     mid_point = num_tokens // 2
     ubatch_slices = [
         UBatchSlice(slice(0, mid_point), slice(0, mid_point)),
-        UBatchSlice(slice(mid_point, num_tokens), slice(mid_point,
-                                                        num_tokens)),
+        UBatchSlice(slice(mid_point, num_tokens), slice(mid_point, num_tokens)),
     ]
 
     results = split_attn_metadata(ubatch_slices, large_decode_metadata)
@@ -159,26 +153,30 @@ def test_split_attn_metadata_decode_batch(large_decode_metadata):
     assert torch.equal(results[1].seq_lens, torch.tensor([2048] * mid_point))
 
 
-def apply_split_decodes_and_prefills(query_lens: list[int],
-                                     decode_threshold: int,
-                                     require_uniform: bool):
+def apply_split_decodes_and_prefills(
+    query_lens: list[int], decode_threshold: int, require_uniform: bool
+):
     """Helper function to apply split_decodes_and_prefills and return
     the results."""
     device = torch.device("cpu")
     seq_lens = [10 * (i + 1) for i in range(len(query_lens))]
-    common_metadata = create_common_attn_metadata(BatchSpec(
-        seq_lens=seq_lens, query_lens=query_lens),
-                                                  block_size=16,
-                                                  device=device)
-    return split_decodes_and_prefills(common_metadata,
-                                      decode_threshold=decode_threshold,
-                                      require_uniform=require_uniform)
+    common_metadata = create_common_attn_metadata(
+        BatchSpec(seq_lens=seq_lens, query_lens=query_lens),
+        block_size=16,
+        device=device,
+    )
+    return split_decodes_and_prefills(
+        common_metadata,
+        decode_threshold=decode_threshold,
+        require_uniform=require_uniform,
+    )
 
 
 def test_split_decodes_and_prefills_nonuniform_all_ones():
     query_lens = [1, 1, 1]
     num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
-        apply_split_decodes_and_prefills(query_lens, 1, False))
+        apply_split_decodes_and_prefills(query_lens, 1, False)
+    )
     assert num_decodes == 3
     assert num_prefills == 0
     assert num_decode_tokens == 3
@@ -188,7 +186,8 @@ def test_split_decodes_and_prefills_nonuniform_all_ones():
 def test_split_decodes_and_prefills_nonuniform_all_short_decodes():
     query_lens = [1, 2, 1, 3, 2, 1, 2]
     num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
-        apply_split_decodes_and_prefills(query_lens, 3, False))
+        apply_split_decodes_and_prefills(query_lens, 3, False)
+    )
     assert num_decodes == 7
     assert num_prefills == 0
     assert num_decode_tokens == sum(query_lens)
@@ -198,7 +197,8 @@ def test_split_decodes_and_prefills_nonuniform_all_short_decodes():
 def test_split_decodes_and_prefills_nonuniform_all_prefills():
     query_lens = [4, 5, 6, 7]
     num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
-        apply_split_decodes_and_prefills(query_lens, 3, False))
+        apply_split_decodes_and_prefills(query_lens, 3, False)
+    )
     assert num_decodes == 0
     assert num_prefills == 4
     assert num_decode_tokens == 0
@@ -208,7 +208,8 @@ def test_split_decodes_and_prefills_nonuniform_all_prefills():
 def test_split_decodes_and_prefills_nonuniform_mixed_batch():
     query_lens = [2, 1, 3, 4, 5, 6, 7, 8]
     num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
-        apply_split_decodes_and_prefills(query_lens, 4, False))
+        apply_split_decodes_and_prefills(query_lens, 4, False)
+    )
     assert num_decodes == 4  # 2, 1, 3, 4 are all <= 4
     assert num_prefills == 4  # 5, 6, 7, 8 are all > 4
     assert num_decode_tokens == 10  # 2 + 1 + 3 + 4
@@ -218,7 +219,8 @@ def test_split_decodes_and_prefills_nonuniform_mixed_batch():
 def test_split_decodes_and_prefills_uniform_all_ones():
     query_lens = [1, 1, 1]
     num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
-        apply_split_decodes_and_prefills(query_lens, 1, True))
+        apply_split_decodes_and_prefills(query_lens, 1, True)
+    )
     assert num_decodes == 3
     assert num_prefills == 0
     assert num_decode_tokens == 3
@@ -228,7 +230,8 @@ def test_split_decodes_and_prefills_uniform_all_ones():
 def test_split_decodes_and_prefills_uniform_all_short_decodes():
     query_lens = [2, 2, 1, 3, 2, 1, 2]
     num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
-        apply_split_decodes_and_prefills(query_lens, 3, True))
+        apply_split_decodes_and_prefills(query_lens, 3, True)
+    )
     assert num_decodes == 2
     assert num_prefills == 5
     assert num_decode_tokens == 4
@@ -238,7 +241,8 @@ def test_split_decodes_and_prefills_uniform_all_short_decodes():
 def test_split_decodes_and_prefills_uniform_all_prefills():
     query_lens = [4, 5, 6, 7]
     num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
-        apply_split_decodes_and_prefills(query_lens, 3, True))
+        apply_split_decodes_and_prefills(query_lens, 3, True)
+    )
     assert num_decodes == 0
     assert num_prefills == 4
     assert num_decode_tokens == 0
@@ -248,7 +252,8 @@ def test_split_decodes_and_prefills_uniform_all_prefills():
 def test_split_decodes_and_prefills_uniform_mixed_batch_all_uniform_decodes():
     query_lens = [2, 2, 2, 4, 5, 6, 7, 8]
     num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
-        apply_split_decodes_and_prefills(query_lens, 4, True))
+        apply_split_decodes_and_prefills(query_lens, 4, True)
+    )
     assert num_decodes == 3  # 2, 2, 2 are all <= 4 and uniform
     assert num_prefills == 5  # 4, 5, 6, 7, 8 are all > 4
     assert num_decode_tokens == 6  # 2 + 2 + 2
@@ -258,7 +263,8 @@ def test_split_decodes_and_prefills_uniform_mixed_batch_all_uniform_decodes():
 def test_split_decodes_and_prefills_uniform_mixed_batch_non_uniform_decodes():
     query_lens = [2, 1, 2, 4, 5, 6, 7, 8]
     num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
-        apply_split_decodes_and_prefills(query_lens, 4, True))
+        apply_split_decodes_and_prefills(query_lens, 4, True)
+    )
     assert num_decodes == 1  # only the first 2 is taken as decode
     assert num_prefills == 7  # 1, 2, 4, 5, 6, 7, 8 are all > 4 or non-uniform
     assert num_decode_tokens == 2  # only the first 2
@@ -274,17 +280,15 @@ def test_split_decodes_and_prefills_uniform_mixed_batch_non_uniform_decodes():
         ([32, 40], [8, 8], 4, 1, 2),
     ],
 )
-def test_prefill_split_across_ubatches(seq_lens, query_lens, split_point,
-                                       expected_first_reqs,
-                                       expected_second_reqs):
+def test_prefill_split_across_ubatches(
+    seq_lens, query_lens, split_point, expected_first_reqs, expected_second_reqs
+):
     """Test splitting a prefill across ubatches"""
     import numpy as np
 
     device = torch.device("cpu")
     batch_spec = BatchSpec(seq_lens=seq_lens, query_lens=query_lens)
-    common = create_common_attn_metadata(batch_spec,
-                                         block_size=16,
-                                         device=device)
+    common = create_common_attn_metadata(batch_spec, block_size=16, device=device)
 
     num_scheduled_tokens = np.array(query_lens, dtype=np.int32)
     qsl_np = common.query_start_loc_cpu.numpy()
@@ -307,19 +311,19 @@ def test_prefill_split_across_ubatches(seq_lens, query_lens, split_point,
     # Identify which request is split and how many tokens are in the first chunk
     split_req_idx = int(np.searchsorted(qsl_np, split_point, side="right") - 1)
     tokens_in_first_chunk = split_point - int(qsl_np[split_req_idx])
-    orig_q_lens = (common.query_start_loc_cpu[1:] -
-                   common.query_start_loc_cpu[:-1])
+    orig_q_lens = common.query_start_loc_cpu[1:] - common.query_start_loc_cpu[:-1]
 
     # Check query length continuity: first-chunk + second-chunk == original qlen
     # First ubatch last request query length
-    qlen_first_last = int(first_meta.query_start_loc_cpu[-1] -
-                          first_meta.query_start_loc_cpu[-2])
+    qlen_first_last = int(
+        first_meta.query_start_loc_cpu[-1] - first_meta.query_start_loc_cpu[-2]
+    )
     # Second ubatch first request query length
-    qlen_second_first = int(second_meta.query_start_loc_cpu[1] -
-                            second_meta.query_start_loc_cpu[0])
+    qlen_second_first = int(
+        second_meta.query_start_loc_cpu[1] - second_meta.query_start_loc_cpu[0]
+    )
     assert qlen_first_last == tokens_in_first_chunk
-    assert qlen_first_last + qlen_second_first == int(
-        orig_q_lens[split_req_idx])
+    assert qlen_first_last + qlen_second_first == int(orig_q_lens[split_req_idx])
 
     # Check seq_lens adjustments
     # Context lengths per original request
diff --git a/tests/v1/attention/test_chunked_local_attention.py b/tests/v1/attention/test_chunked_local_attention.py
index be77256a0d2f..faace3473a28 100644
--- a/tests/v1/attention/test_chunked_local_attention.py
+++ b/tests/v1/attention/test_chunked_local_attention.py
@@ -7,8 +7,7 @@
 import torch
 
 from tests.v1.attention.utils import BatchSpec, create_common_attn_metadata
-from vllm.v1.attention.backends.utils import (
-    make_local_attention_virtual_batches)
+from vllm.v1.attention.backends.utils import make_local_attention_virtual_batches
 
 
 @dataclass
@@ -46,21 +45,24 @@ class LocalAttentionTestData:
             [17, 17],  # local-batch 5, (batch 1, starting from k[16])
             [20, 21],  # local-batch 6, (batch 2, starting from k[4])
             [22, 23],  # local-batch 7, (batch 2, starting from k[8])
-        ]),
+        ],
+    ),
     # Case where block indices are not clipped to block table ncols-1
     # because tokens_in_last_block == attn_chunk_size
-    LocalAttentionTestData(batch_spec=BatchSpec(
-        query_lens=[8],
-        seq_lens=[12],
+    LocalAttentionTestData(
+        batch_spec=BatchSpec(
+            query_lens=[8],
+            seq_lens=[12],
+        ),
+        attn_chunk_size=4,
+        block_size=2,
+        expected_q_seqlens=[4, 4],
+        expected_k_seqlens=[4, 4],
+        expected_local_block_table=[
+            [2, 3],
+            [4, 5],
+        ],
     ),
-                           attn_chunk_size=4,
-                           block_size=2,
-                           expected_q_seqlens=[4, 4],
-                           expected_k_seqlens=[4, 4],
-                           expected_local_block_table=[
-                               [2, 3],
-                               [4, 5],
-                           ]),
     # Case where all kv_seq positions are involved in attn
     LocalAttentionTestData(
         batch_spec=BatchSpec(
@@ -76,7 +78,8 @@ class LocalAttentionTestData:
             [0, 1],
             [2, 3],
             [4, 4],
-        ]),
+        ],
+    ),
     # Case where attn_chunk_size > kv_seq_len
     # so no extra mini virtual batches are created
     LocalAttentionTestData(
@@ -97,7 +100,8 @@ class LocalAttentionTestData:
         # is calculated as (attn_chunk_size // block_size)
         expected_local_block_table=[
             [0, 1, 2, 2, 2],
-        ]),
+        ],
+    ),
     # Block size equal to chunk size
     # Expect single page per batch in local batch table
     LocalAttentionTestData(
@@ -118,7 +122,8 @@ class LocalAttentionTestData:
             [1],  # local-batch 1, (batch 0, starting from k[4])
             [2],  # local-batch 1, (batch 0, starting from k[0])
             [3],  # local-batch 1, (batch 0, starting from k[4])
-        ]),
+        ],
+    ),
     # Case where query falls in the second attention chunk
     #  k_toks >   0 1 2 3 4
     #  q_toks v  _____________
@@ -128,17 +133,19 @@ class LocalAttentionTestData:
     #         3 | 1 1 1 1
     #         4 |         1
     #  where tokens 0,1,2,3 have been pre-computed
-    LocalAttentionTestData(batch_spec=BatchSpec(
-        query_lens=[1],
-        seq_lens=[5],
+    LocalAttentionTestData(
+        batch_spec=BatchSpec(
+            query_lens=[1],
+            seq_lens=[5],
+        ),
+        attn_chunk_size=4,
+        block_size=2,
+        expected_q_seqlens=[1],
+        expected_k_seqlens=[1],
+        expected_local_block_table=[
+            [2, 2],
+        ],
     ),
-                           attn_chunk_size=4,
-                           block_size=2,
-                           expected_q_seqlens=[1],
-                           expected_k_seqlens=[1],
-                           expected_local_block_table=[
-                               [2, 2],
-                           ]),
 ]
 
 
@@ -165,9 +172,9 @@ def test_local_attention_virtual_batches(test_data: LocalAttentionTestData):
     )
 
     # Call the function
-    result = make_local_attention_virtual_batches(attn_chunk_size,
-                                                  common_attn_metadata,
-                                                  block_size)
+    result = make_local_attention_virtual_batches(
+        attn_chunk_size, common_attn_metadata, block_size
+    )
 
     # Convert to numpy for easier comparison
     actual_q_seqlens = np.diff(result.query_start_loc_cpu.numpy())
@@ -184,13 +191,11 @@ def test_local_attention_virtual_batches(test_data: LocalAttentionTestData):
     np.testing.assert_array_equal(actual_q_seqlens, expected_q_seqlens)
     np.testing.assert_array_equal(actual_k_seqlens, expected_k_seqlens)
 
-    expected_block_table_tensor =\
-        torch.tensor(expected_local_block_table,
-        dtype=torch.int32,
-        device=device)
+    expected_block_table_tensor = torch.tensor(
+        expected_local_block_table, dtype=torch.int32, device=device
+    )
 
     print(f"Expected block table:\n{expected_block_table_tensor}")
     print(f"Actual block table:\n{result.block_table_tensor}")
 
-    torch.testing.assert_close(result.block_table_tensor,
-                               expected_block_table_tensor)
+    torch.testing.assert_close(result.block_table_tensor, expected_block_table_tensor)
diff --git a/tests/v1/attention/test_mla_backends.py b/tests/v1/attention/test_mla_backends.py
index f2d0a5b2407a..debaa6a5e009 100644
--- a/tests/v1/attention/test_mla_backends.py
+++ b/tests/v1/attention/test_mla_backends.py
@@ -1,15 +1,19 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Tests for v1 MLA backends without GPUModelRunner dependency."""
+
 from typing import Optional, Union
 
 import pytest
 import torch
 
-from tests.v1.attention.utils import (BatchSpec, create_common_attn_metadata,
-                                      create_standard_kv_cache_spec,
-                                      create_vllm_config,
-                                      get_attention_backend)
+from tests.v1.attention.utils import (
+    BatchSpec,
+    create_common_attn_metadata,
+    create_standard_kv_cache_spec,
+    create_vllm_config,
+    get_attention_backend,
+)
 from vllm import _custom_ops as ops
 from vllm.attention.backends.registry import _Backend
 from vllm.utils import STR_DTYPE_TO_TORCH_DTYPE, cdiv
@@ -17,13 +21,14 @@
 from vllm.v1.kv_cache_interface import FullAttentionSpec
 
 BACKENDS_TO_TEST = [
-    _Backend.CUTLASS_MLA, _Backend.FLASHMLA, _Backend.FLASH_ATTN_MLA,
-    _Backend.TRITON_MLA
+    _Backend.CUTLASS_MLA,
+    _Backend.FLASHMLA,
+    _Backend.FLASH_ATTN_MLA,
+    _Backend.TRITON_MLA,
 ]
 
 # Remove CUTLASS_MLA from the list if not using sm100
-if not torch.cuda.is_available() or torch.cuda.get_device_properties(
-        0).major < 10:
+if not torch.cuda.is_available() or torch.cuda.get_device_properties(0).major < 10:
     BACKENDS_TO_TEST.remove(_Backend.CUTLASS_MLA)
 
 torch.manual_seed(42)
@@ -46,45 +51,41 @@ def _convert_dtype_to_torch(dtype):
 
 # Define common batch configurations
 BATCH_SPECS = {
-    "small_decode":
-    BatchSpec(seq_lens=[32, 40], query_lens=[1, 1]),
-    "small_prefill":
-    BatchSpec(seq_lens=[32, 40], query_lens=[8, 8]),
-    "mixed_small":
-    BatchSpec(seq_lens=[32, 40, 48, 56], query_lens=[1, 1, 5, 5]),
-    "medium_decode":
-    BatchSpec(seq_lens=[128, 256, 512, 1024, 128, 256, 512, 1024],
-              query_lens=[1, 1, 1, 1, 1, 1, 1, 1]),
-    "medium_prefill":
-    BatchSpec(seq_lens=[256, 512, 1024, 2048], query_lens=[16, 16, 16, 16]),
-    "mixed_medium":
-    BatchSpec(seq_lens=[512, 1024, 2048, 512, 1024, 2048],
-              query_lens=[1, 1, 1, 7, 7, 7]),
-    "large_decode":
-    BatchSpec(seq_lens=[2048] * 32, query_lens=[1] * 32),
-    "large_prefill":
-    BatchSpec(seq_lens=[4096] * 8, query_lens=[32] * 8),
-    "single_decode":
-    BatchSpec(seq_lens=[1024], query_lens=[1]),
-    "single_prefill":
-    BatchSpec(seq_lens=[1024], query_lens=[64]),
+    "small_decode": BatchSpec(seq_lens=[32, 40], query_lens=[1, 1]),
+    "small_prefill": BatchSpec(seq_lens=[32, 40], query_lens=[8, 8]),
+    "mixed_small": BatchSpec(seq_lens=[32, 40, 48, 56], query_lens=[1, 1, 5, 5]),
+    "medium_decode": BatchSpec(
+        seq_lens=[128, 256, 512, 1024, 128, 256, 512, 1024],
+        query_lens=[1, 1, 1, 1, 1, 1, 1, 1],
+    ),
+    "medium_prefill": BatchSpec(
+        seq_lens=[256, 512, 1024, 2048], query_lens=[16, 16, 16, 16]
+    ),
+    "mixed_medium": BatchSpec(
+        seq_lens=[512, 1024, 2048, 512, 1024, 2048], query_lens=[1, 1, 1, 7, 7, 7]
+    ),
+    "large_decode": BatchSpec(seq_lens=[2048] * 32, query_lens=[1] * 32),
+    "large_prefill": BatchSpec(seq_lens=[4096] * 8, query_lens=[32] * 8),
+    "single_decode": BatchSpec(seq_lens=[1024], query_lens=[1]),
+    "single_prefill": BatchSpec(seq_lens=[1024], query_lens=[64]),
 }
 
 
 def create_and_prepopulate_kv_cache(
-        kv_c_contexts: list[torch.Tensor],
-        k_pe_contexts: list[torch.Tensor],
-        block_size: int,
-        head_size: int,
-        dtype: torch.dtype,
-        device: torch.device,
-        num_blocks: int,
-        common_attn_metadata: CommonAttentionMetadata,
-        randomize_blocks: bool = True,
-        kv_cache_dtype: Optional[str] = None,
-        scale: Union[float, torch.Tensor] = 1.0) -> torch.Tensor:
+    kv_c_contexts: list[torch.Tensor],
+    k_pe_contexts: list[torch.Tensor],
+    block_size: int,
+    head_size: int,
+    dtype: torch.dtype,
+    device: torch.device,
+    num_blocks: int,
+    common_attn_metadata: CommonAttentionMetadata,
+    randomize_blocks: bool = True,
+    kv_cache_dtype: Optional[str] = None,
+    scale: Union[float, torch.Tensor] = 1.0,
+) -> torch.Tensor:
     """Create and prepopulate an MLA KV cache with context data.
-    
+
     Args:
         kv_c_contexts: List of latent KV context tensors for each sequence
         k_pe_contexts: List of key positional embedding context tensors
@@ -95,21 +96,23 @@ def create_and_prepopulate_kv_cache(
         device: Device to create the cache on
         num_blocks: Total number of blocks in the cache
         common_attn_metadata: Common attention metadata
-        randomize_blocks: Whether to randomly permute blocks 
+        randomize_blocks: Whether to randomly permute blocks
                           or use sequential order
         kv_cache_dtype: Optional kv cache dtype string. When set to
                         "fp8_ds_mla" the cache is populated using the
                         fp8 DeepSeek MLA layout via concat_and_cache_mla.
         scale: Scaling factor forwarded to concat_and_cache_mla when the
                fp8 cache layout is requested.
-        
+
     Returns:
         MLA KV cache tensor
     """
     batch_size = len(kv_c_contexts)
     seq_lens = common_attn_metadata.seq_lens_cpu
-    query_lens = common_attn_metadata.query_start_loc_cpu[
-        1:] - common_attn_metadata.query_start_loc_cpu[:-1]
+    query_lens = (
+        common_attn_metadata.query_start_loc_cpu[1:]
+        - common_attn_metadata.query_start_loc_cpu[:-1]
+    )
     context_lens = common_attn_metadata.num_computed_tokens_cpu
     block_table = common_attn_metadata.block_table_tensor
     slot_mapping = common_attn_metadata.slot_mapping
@@ -118,27 +121,26 @@ def create_and_prepopulate_kv_cache(
 
     if use_fp8_ds_mla:
         if not kv_c_contexts:
-            raise ValueError("kv_c_contexts cannot be empty when using"
-                             " fp8_ds_mla cache dtype")
+            raise ValueError(
+                "kv_c_contexts cannot be empty when using fp8_ds_mla cache dtype"
+            )
         kv_lora_rank = kv_c_contexts[0].shape[-1]
         rope_dim = k_pe_contexts[0].shape[-1]
         entry_size = kv_lora_rank + 4 * 4 + 2 * rope_dim
-        kv_cache = torch.zeros(num_blocks,
-                               block_size,
-                               entry_size,
-                               dtype=torch.uint8,
-                               device=device)
-        scale_tensor = (scale
-                        if isinstance(scale, torch.Tensor) else torch.tensor(
-                            scale, dtype=torch.float32, device=device))
+        kv_cache = torch.zeros(
+            num_blocks, block_size, entry_size, dtype=torch.uint8, device=device
+        )
+        scale_tensor = (
+            scale
+            if isinstance(scale, torch.Tensor)
+            else torch.tensor(scale, dtype=torch.float32, device=device)
+        )
         scale_tensor = scale_tensor.to(device=device, dtype=torch.float32)
     else:
         # Create MLA KV cache: (num_blocks, block_size, head_size)
-        kv_cache = torch.empty(num_blocks,
-                               block_size,
-                               head_size,
-                               dtype=dtype,
-                               device=device)
+        kv_cache = torch.empty(
+            num_blocks, block_size, head_size, dtype=dtype, device=device
+        )
         kv_cache_flat = kv_cache.view(-1, head_size)
 
     # Populate the cache with the context tokens
@@ -154,8 +156,7 @@ def create_and_prepopulate_kv_cache(
         start = start_block_idx * block_size
 
         if use_fp8_ds_mla:
-            slots = torch.arange(context_len, device=device,
-                                 dtype=torch.long) + start
+            slots = torch.arange(context_len, device=device, dtype=torch.long) + start
             ops.concat_and_cache_mla(
                 kv_c_context,
                 k_pe_context.squeeze(1),
@@ -165,8 +166,7 @@ def create_and_prepopulate_kv_cache(
                 scale=scale_tensor,
             )
         else:
-            kv_context = torch.cat(
-                [kv_c_context, k_pe_context.squeeze(1)], dim=-1)
+            kv_context = torch.cat([kv_c_context, k_pe_context.squeeze(1)], dim=-1)
             end = start + kv_context.shape[0]
             kv_cache_flat[start:end, ...] = kv_context
 
@@ -177,15 +177,14 @@ def create_and_prepopulate_kv_cache(
 
     # Permute the context blocks (excluding block 0 which is null)
     if randomize_blocks:
-        perm = torch.randperm(
-            blocks_end - 1) + 1  # Random permutation starting from block 1
+        perm = (
+            torch.randperm(blocks_end - 1) + 1
+        )  # Random permutation starting from block 1
     else:
-        perm = torch.arange(
-            1, blocks_end)  # Sequential order starting from block 1
+        perm = torch.arange(1, blocks_end)  # Sequential order starting from block 1
 
     inv_perm = torch.zeros(blocks_end, dtype=torch.long, device=device)
-    inv_perm[1:] = torch.argsort(
-        perm) + 1  # Add 1 to account for starting from block 1
+    inv_perm[1:] = torch.argsort(perm) + 1  # Add 1 to account for starting from block 1
     kv_cache[1:blocks_end, ...] = kv_cache[perm, ...]
 
     # Construct the right block table
@@ -206,8 +205,8 @@ def create_and_prepopulate_kv_cache(
         start = common_attn_metadata.query_start_loc_cpu[i]
         end = common_attn_metadata.query_start_loc_cpu[i + 1]
         slot_mapping[start:end] = block_table[
-            i,
-            block_indices] * block_size + token_inter_block_offsets.to(device)
+            i, block_indices
+        ] * block_size + token_inter_block_offsets.to(device)
 
     return kv_cache
 
@@ -221,15 +220,23 @@ def __init__(self, device: torch.device):
         self._v_scale = torch.tensor(1.0, device=device)
 
 
-def run_attention_backend(backend: _Backend, kv_cache_spec: FullAttentionSpec,
-                          layer_names: list[str], vllm_config,
-                          device: torch.device,
-                          common_attn_metadata: CommonAttentionMetadata,
-                          query: torch.Tensor, kv_c: torch.Tensor,
-                          k_pe: torch.Tensor, kv_cache: torch.Tensor,
-                          kv_lora_rank: int, qk_nope_head_dim: int,
-                          qk_rope_head_dim: int, v_head_dim: int,
-                          mock_kv_b_proj) -> torch.Tensor:
+def run_attention_backend(
+    backend: _Backend,
+    kv_cache_spec: FullAttentionSpec,
+    layer_names: list[str],
+    vllm_config,
+    device: torch.device,
+    common_attn_metadata: CommonAttentionMetadata,
+    query: torch.Tensor,
+    kv_c: torch.Tensor,
+    k_pe: torch.Tensor,
+    kv_cache: torch.Tensor,
+    kv_lora_rank: int,
+    qk_nope_head_dim: int,
+    qk_rope_head_dim: int,
+    v_head_dim: int,
+    mock_kv_b_proj,
+) -> torch.Tensor:
     """Run attention computation using the specified backend's AttentionImpl."""
 
     builder_cls, impl_cls = get_attention_backend(backend)
@@ -243,9 +250,11 @@ def run_attention_backend(backend: _Backend, kv_cache_spec: FullAttentionSpec,
 
     # Instantiate MLA implementation
     num_heads = vllm_config.model_config.get_num_attention_heads(
-        vllm_config.parallel_config)
+        vllm_config.parallel_config
+    )
     num_kv_heads = vllm_config.model_config.get_num_kv_heads(
-        vllm_config.parallel_config)
+        vllm_config.parallel_config
+    )
     head_size = vllm_config.model_config.get_head_size()
     scale = 1.0 / (head_size**0.5)
     impl = impl_cls(
@@ -275,30 +284,35 @@ def run_attention_backend(backend: _Backend, kv_cache_spec: FullAttentionSpec,
     # Create mock layer and output buffer
     mock_layer = MockAttentionLayer(device)
     num_tokens = query.shape[0]
-    output = torch.empty(num_tokens,
-                         num_heads * v_head_dim,
-                         dtype=query.dtype,
-                         device=query.device)
+    output = torch.empty(
+        num_tokens, num_heads * v_head_dim, dtype=query.dtype, device=query.device
+    )
 
     # Run forward pass
     # NOTE: The query, key, and value are already shaped correctly
     # in the calling test function.
-    output = impl.forward(mock_layer,
-                          query,
-                          kv_c,
-                          k_pe,
-                          kv_cache,
-                          attn_metadata,
-                          output=output)
+    output = impl.forward(
+        mock_layer, query, kv_c, k_pe, kv_cache, attn_metadata, output=output
+    )
 
     return output
 
 
-@pytest.mark.parametrize("batch_spec_name", [
-    "small_decode", "small_prefill", "mixed_small", "medium_decode",
-    "medium_prefill", "mixed_medium", "large_decode", "large_prefill",
-    "single_decode", "single_prefill"
-])
+@pytest.mark.parametrize(
+    "batch_spec_name",
+    [
+        "small_decode",
+        "small_prefill",
+        "mixed_small",
+        "medium_decode",
+        "medium_prefill",
+        "mixed_medium",
+        "large_decode",
+        "large_prefill",
+        "single_decode",
+        "single_prefill",
+    ],
+)
 @pytest.mark.parametrize("model", ["deepseek-ai/DeepSeek-V2-Lite-Chat"])
 def test_backend_correctness(dist_init, batch_spec_name: str, model: str):
     """
@@ -317,9 +331,9 @@ def test_backend_correctness(dist_init, batch_spec_name: str, model: str):
     5. Comparing the vLLM backend's output to the ground-truth SDPA output.
     """
     batch_spec = BATCH_SPECS[batch_spec_name]
-    vllm_config = create_vllm_config(model_name=model,
-                                     max_model_len=max(batch_spec.seq_lens),
-                                     num_gpu_blocks=2048)
+    vllm_config = create_vllm_config(
+        model_name=model, max_model_len=max(batch_spec.seq_lens), num_gpu_blocks=2048
+    )
     device = torch.device("cuda:0")
 
     kv_cache_spec = create_standard_kv_cache_spec(vllm_config)
@@ -329,7 +343,8 @@ def test_backend_correctness(dist_init, batch_spec_name: str, model: str):
     seq_lens = batch_spec.seq_lens
     query_lens = batch_spec.query_lens
     num_q_heads = vllm_config.model_config.get_num_attention_heads(
-        vllm_config.parallel_config)
+        vllm_config.parallel_config
+    )
     head_size = vllm_config.model_config.get_head_size()
     dtype = _convert_dtype_to_torch(vllm_config.model_config.dtype)
     block_size = vllm_config.cache_config.block_size
@@ -338,8 +353,9 @@ def test_backend_correctness(dist_init, batch_spec_name: str, model: str):
     qk_nope_head_dim = 128
     v_head_dim = 128
     total_head_size = kv_lora_rank + qk_rope_head_dim
-    assert kv_lora_rank + qk_rope_head_dim == head_size, \
+    assert kv_lora_rank + qk_rope_head_dim == head_size, (
         f"MLA dimensions don't match: {total_head_size} != {head_size}"
+    )
     scale = 1.0 / (total_head_size**0.5)
 
     # 2. Generate data and compute SDPA reference output for MLA
@@ -348,16 +364,12 @@ def test_backend_correctness(dist_init, batch_spec_name: str, model: str):
     kv_c_contexts, k_pe_contexts = [], []
 
     # Create shared MLA weight matrices for consistency across all sequences
-    W_UK = torch.randn(kv_lora_rank,
-                       num_q_heads,
-                       qk_nope_head_dim,
-                       dtype=dtype,
-                       device=device)
-    W_UV = torch.randn(kv_lora_rank,
-                       num_q_heads,
-                       v_head_dim,
-                       dtype=dtype,
-                       device=device)
+    W_UK = torch.randn(
+        kv_lora_rank, num_q_heads, qk_nope_head_dim, dtype=dtype, device=device
+    )
+    W_UV = torch.randn(
+        kv_lora_rank, num_q_heads, v_head_dim, dtype=dtype, device=device
+    )
     kv_b_proj_weight = torch.cat([W_UK, W_UV], dim=-1)
 
     for i, backend in enumerate(BACKENDS_TO_TEST):
@@ -371,24 +383,19 @@ def test_backend_correctness(dist_init, batch_spec_name: str, model: str):
         # Generate MLA tensors
         # Q has both nope and rope components:
         # [q_len, num_heads, qk_nope_head_dim + qk_rope_head_dim]
-        q_c = torch.randn(q_len,
-                          num_q_heads,
-                          qk_nope_head_dim + qk_rope_head_dim,
-                          dtype=dtype,
-                          device=device)
+        q_c = torch.randn(
+            q_len,
+            num_q_heads,
+            qk_nope_head_dim + qk_rope_head_dim,
+            dtype=dtype,
+            device=device,
+        )
 
         # KV_C (latent K/V): [s_len, kv_lora_rank]
-        kv_c_full = torch.randn(s_len,
-                                kv_lora_rank,
-                                dtype=dtype,
-                                device=device)
+        kv_c_full = torch.randn(s_len, kv_lora_rank, dtype=dtype, device=device)
 
         # K_PE (rope component): [s_len, 1, qk_rope_head_dim]
-        k_pe_full = torch.randn(s_len,
-                                1,
-                                qk_rope_head_dim,
-                                dtype=dtype,
-                                device=device)
+        k_pe_full = torch.randn(s_len, 1, qk_rope_head_dim, dtype=dtype, device=device)
 
         # Determine if this is decode or prefill
         is_decode = []
@@ -404,8 +411,9 @@ def test_backend_correctness(dist_init, batch_spec_name: str, model: str):
         # Transform q_nope to latent space: q_nope @ W_UK
         # q_nope: [1, num_heads, qk_nope_head_dim]
         # W_UK: [kv_lora_rank, num_heads, qk_nope_head_dim]
-        ql_nope = torch.einsum("qnh,lnh->qnl", q_nope,
-                               W_UK)  # [1, num_heads, kv_lora_rank]
+        ql_nope = torch.einsum(
+            "qnh,lnh->qnl", q_nope, W_UK
+        )  # [1, num_heads, kv_lora_rank]
 
         # Build MQA attention inputs
         # Q: [1, num_heads, kv_lora_rank + qk_rope_head_dim]
@@ -431,25 +439,24 @@ def test_backend_correctness(dist_init, batch_spec_name: str, model: str):
         v_sdpa_in = v_mqa.unsqueeze(0).transpose(1, 2)
 
         sdpa_out_i_decode = torch.nn.functional.scaled_dot_product_attention(
-            q_sdpa_in, k_sdpa_in, v_sdpa_in, attn_mask=attn_mask, scale=scale)
+            q_sdpa_in, k_sdpa_in, v_sdpa_in, attn_mask=attn_mask, scale=scale
+        )
         sdpa_out_i_decode = sdpa_out_i_decode.transpose(1, 2).squeeze(
-            0)  # [1, num_heads, kv_lora_rank]
+            0
+        )  # [1, num_heads, kv_lora_rank]
 
         # Project back to output space: sdpa_out @ W_UV
-        sdpa_out_i_decode = torch.einsum("qnl,lnv->qnv", sdpa_out_i_decode,
-                                         W_UV)
+        sdpa_out_i_decode = torch.einsum("qnl,lnv->qnv", sdpa_out_i_decode, W_UV)
         sdpa_out_i_decode = sdpa_out_i_decode.flatten(start_dim=-2)
 
         #######################################################
         # Prefill path: MHA-style attention with full sequence
         # Apply kv_b_proj to the full kv_c tensor
         kv_nope_full = torch.einsum("sl,lnh->snh", kv_c_full, kv_b_proj_weight)
-        k_nope_full, v_full = kv_nope_full.split(
-            [qk_nope_head_dim, v_head_dim], dim=-1)
+        k_nope_full, v_full = kv_nope_full.split([qk_nope_head_dim, v_head_dim], dim=-1)
 
         # Build attention inputs for full sequence
-        q_mha = torch.cat([q_nope, q_pe],
-                          dim=-1)  # [q_len, num_heads, total_dim]
+        q_mha = torch.cat([q_nope, q_pe], dim=-1)  # [q_len, num_heads, total_dim]
         k_pe_full_expanded = k_pe_full.expand(-1, num_q_heads, -1)
         k_full = torch.cat([k_nope_full, k_pe_full_expanded], dim=-1)
 
@@ -468,7 +475,8 @@ def test_backend_correctness(dist_init, batch_spec_name: str, model: str):
 
         # Single attention call with custom mask
         sdpa_out_i_prefill = torch.nn.functional.scaled_dot_product_attention(
-            q_sdpa_in, k_sdpa_in, v_sdpa_in, attn_mask=attn_mask, scale=scale)
+            q_sdpa_in, k_sdpa_in, v_sdpa_in, attn_mask=attn_mask, scale=scale
+        )
         sdpa_out_i_prefill = sdpa_out_i_prefill.transpose(1, 2).squeeze(0)
         sdpa_out_i_prefill = sdpa_out_i_prefill.flatten(start_dim=-2)
 
@@ -497,22 +505,25 @@ def test_backend_correctness(dist_init, batch_spec_name: str, model: str):
 
     # Create mock kv_b_proj using the same weights as reference implementation
     from vllm.model_executor.layers.linear import ColumnParallelLinear
-    mock_kv_b_proj = ColumnParallelLinear(input_size=kv_lora_rank,
-                                          output_size=num_q_heads *
-                                          (qk_nope_head_dim + v_head_dim),
-                                          bias=False).to(device=device,
-                                                         dtype=dtype)
+
+    mock_kv_b_proj = ColumnParallelLinear(
+        input_size=kv_lora_rank,
+        output_size=num_q_heads * (qk_nope_head_dim + v_head_dim),
+        bias=False,
+    ).to(device=device, dtype=dtype)
 
     # Set the mock weights to match our reference implementation
     # Reshape W_UK and W_UV to match the expected kv_b_proj format
     # [kv_lora_rank, num_heads, qk_nope_head_dim + v_head_dim]
     kv_b_proj_weight = kv_b_proj_weight.view(
-        kv_lora_rank, num_q_heads * (qk_nope_head_dim + v_head_dim))
+        kv_lora_rank, num_q_heads * (qk_nope_head_dim + v_head_dim)
+    )
     mock_kv_b_proj.weight = torch.nn.Parameter(kv_b_proj_weight.T)
 
     # Create metadata using original batch spec
     common_attn_metadata = create_common_attn_metadata(
-        batch_spec, vllm_config.cache_config.block_size, device)
+        batch_spec, vllm_config.cache_config.block_size, device
+    )
 
     # 3. Simulate Paged KV Cache and a realistic slot_mapping
     kv_cache = create_and_prepopulate_kv_cache(
@@ -524,41 +535,56 @@ def test_backend_correctness(dist_init, batch_spec_name: str, model: str):
         device=device,
         num_blocks=vllm_config.cache_config.num_gpu_blocks,
         common_attn_metadata=common_attn_metadata,
-        randomize_blocks=True)
+        randomize_blocks=True,
+    )
 
     # 4. Run vLLM backends and compare
     for i, backend_name in enumerate(BACKENDS_TO_TEST):
         backend_output = run_attention_backend(
-            backend_name, kv_cache_spec, ["placeholder"], vllm_config, device,
-            common_attn_metadata, query_vllm, kv_c_vllm, k_pe_vllm, kv_cache,
-            kv_lora_rank, qk_nope_head_dim, qk_rope_head_dim, v_head_dim,
-            mock_kv_b_proj)
+            backend_name,
+            kv_cache_spec,
+            ["placeholder"],
+            vllm_config,
+            device,
+            common_attn_metadata,
+            query_vllm,
+            kv_c_vllm,
+            k_pe_vllm,
+            kv_cache,
+            kv_lora_rank,
+            qk_nope_head_dim,
+            qk_rope_head_dim,
+            v_head_dim,
+            mock_kv_b_proj,
+        )
 
         # Check shape and dtype consistency
         assert backend_output.shape == sdpa_outputs[i].shape, (
             f"[{backend_name}] shape {backend_output.shape} != "
-            f"SDPA shape {sdpa_outputs[i].shape}")
+            f"SDPA shape {sdpa_outputs[i].shape}"
+        )
         assert backend_output.dtype == sdpa_outputs[i].dtype, (
             f"[{backend_name}] dtype {backend_output.dtype} != "
-            f"SDPA dtype {sdpa_outputs[i].dtype}")
+            f"SDPA dtype {sdpa_outputs[i].dtype}"
+        )
 
         assert torch.isfinite(backend_output).all(), (
-            f"[{backend_name}] produced non-finite values")
+            f"[{backend_name}] produced non-finite values"
+        )
 
         # Check numerical similarity
         rtol = 1e-2
         atol = 5e-1
 
-        max_diff = torch.max(torch.abs(backend_output -
-                                       sdpa_outputs[i])).item()
+        max_diff = torch.max(torch.abs(backend_output - sdpa_outputs[i])).item()
         max_rel_diff = torch.max(
-            torch.abs(backend_output - sdpa_outputs[i]) /
-            torch.abs(sdpa_outputs[i])).item()
-        all_close = torch.allclose(backend_output,
-                                   sdpa_outputs[i],
-                                   rtol=rtol,
-                                   atol=atol)
+            torch.abs(backend_output - sdpa_outputs[i]) / torch.abs(sdpa_outputs[i])
+        ).item()
+        all_close = torch.allclose(
+            backend_output, sdpa_outputs[i], rtol=rtol, atol=atol
+        )
 
         assert all_close, (
             f"[{backend_name}] output differs from SDPA baseline. "
-            f"Max diff: {max_diff:.6f}, max rel diff: {max_rel_diff:.6f})")
+            f"Max diff: {max_diff:.6f}, max rel diff: {max_rel_diff:.6f})"
+        )
diff --git a/tests/v1/attention/test_sparse_mla_backends.py b/tests/v1/attention/test_sparse_mla_backends.py
index ddad9342fad0..f84951485310 100644
--- a/tests/v1/attention/test_sparse_mla_backends.py
+++ b/tests/v1/attention/test_sparse_mla_backends.py
@@ -10,18 +10,26 @@
 import torch
 
 from tests.v1.attention.test_mla_backends import (
-    BATCH_SPECS, BatchSpec, MockAttentionLayer,
-    create_and_prepopulate_kv_cache)
-from tests.v1.attention.utils import (create_common_attn_metadata,
-                                      create_standard_kv_cache_spec,
-                                      create_vllm_config)
+    BATCH_SPECS,
+    BatchSpec,
+    MockAttentionLayer,
+    create_and_prepopulate_kv_cache,
+)
+from tests.v1.attention.utils import (
+    create_common_attn_metadata,
+    create_standard_kv_cache_spec,
+    create_vllm_config,
+)
 from vllm import _custom_ops as ops
 from vllm.attention.ops import flashmla
 from vllm.model_executor.layers.linear import ColumnParallelLinear
 from vllm.utils import cdiv
 from vllm.v1.attention.backends.mla.flashmla_sparse import (
-    FlashMLASparseBackend, FlashMLASparseDecodeAndContextMetadata,
-    FlashMLASparseImpl, FlashMLASparseMetadata)
+    FlashMLASparseBackend,
+    FlashMLASparseDecodeAndContextMetadata,
+    FlashMLASparseImpl,
+    FlashMLASparseMetadata,
+)
 from vllm.v1.attention.backends.mla.indexer import split_prefill_chunks
 
 SPARSE_BACKEND_BATCH_SPECS = {
@@ -35,41 +43,42 @@
     ]
 }
 
-SPARSE_BACKEND_BATCH_SPECS["large_q_prefill"] = BatchSpec(seq_lens=[1024] * 2,
-                                                          query_lens=[256] * 2)
+SPARSE_BACKEND_BATCH_SPECS["large_q_prefill"] = BatchSpec(
+    seq_lens=[1024] * 2, query_lens=[256] * 2
+)
 SPARSE_BACKEND_BATCH_SPECS["large_q_pure_prefill"] = BatchSpec(
-    seq_lens=[256] * 2, query_lens=[256] * 2)
+    seq_lens=[256] * 2, query_lens=[256] * 2
+)
 
 
 def _dequantize_fp8_ds_mla_entry(
-        cache_slice: torch.Tensor, kv_lora_rank: int, rope_dim: int,
-        dtype: torch.dtype) -> tuple[torch.Tensor, torch.Tensor]:
+    cache_slice: torch.Tensor, kv_lora_rank: int, rope_dim: int, dtype: torch.dtype
+) -> tuple[torch.Tensor, torch.Tensor]:
     """Dequantize a single fp8_ds_mla cache entry back to latent + rope."""
 
     # The first kv_lora_rank bytes store FP8 latent values with one scale per
     # 128 element tile written as float32 right after the latent payload.
-    scales = cache_slice.view(torch.float32)[kv_lora_rank //
-                                             4:kv_lora_rank // 4 + 4]
-    latent = torch.empty(kv_lora_rank,
-                         dtype=torch.float16,
-                         device=cache_slice.device)
+    scales = cache_slice.view(torch.float32)[kv_lora_rank // 4 : kv_lora_rank // 4 + 4]
+    latent = torch.empty(kv_lora_rank, dtype=torch.float16, device=cache_slice.device)
     for tile_idx in range(4):
         tile_start = tile_idx * 128
         tile_end = tile_start + 128
-        ops.convert_fp8(latent[tile_start:tile_end],
-                        cache_slice[tile_start:tile_end],
-                        float(scales[tile_idx].item()),
-                        kv_dtype="fp8")
+        ops.convert_fp8(
+            latent[tile_start:tile_end],
+            cache_slice[tile_start:tile_end],
+            float(scales[tile_idx].item()),
+            kv_dtype="fp8",
+        )
     latent = latent.to(dtype)
 
     rope_offset = kv_lora_rank // 2 + 8
-    rope_vals = cache_slice.view(dtype)[rope_offset:rope_offset + rope_dim]
+    rope_vals = cache_slice.view(dtype)[rope_offset : rope_offset + rope_dim]
     return latent, rope_vals.clone()
 
 
 def _quantize_dequantize_fp8_ds_mla(
-        kv_c: torch.Tensor, k_pe: torch.Tensor, block_size: int,
-        scale: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+    kv_c: torch.Tensor, k_pe: torch.Tensor, block_size: int, scale: torch.Tensor
+) -> tuple[torch.Tensor, torch.Tensor]:
     """Round-trip kv_c/k_pe though the fp8_ds_mla cache layout."""
 
     if kv_c.numel() == 0:
@@ -81,21 +90,14 @@ def _quantize_dequantize_fp8_ds_mla(
     num_blocks = max(1, math.ceil(num_tokens / block_size))
     entry_size = kv_lora_rank + 4 * 4 + 2 * rope_dim
 
-    tmp_cache = torch.zeros(num_blocks,
-                            block_size,
-                            entry_size,
-                            dtype=torch.uint8,
-                            device=kv_c.device)
-    slot_mapping = torch.arange(num_tokens,
-                                dtype=torch.long,
-                                device=kv_c.device)
-
-    ops.concat_and_cache_mla(kv_c,
-                             k_pe,
-                             tmp_cache,
-                             slot_mapping,
-                             kv_cache_dtype="fp8_ds_mla",
-                             scale=scale)
+    tmp_cache = torch.zeros(
+        num_blocks, block_size, entry_size, dtype=torch.uint8, device=kv_c.device
+    )
+    slot_mapping = torch.arange(num_tokens, dtype=torch.long, device=kv_c.device)
+
+    ops.concat_and_cache_mla(
+        kv_c, k_pe, tmp_cache, slot_mapping, kv_cache_dtype="fp8_ds_mla", scale=scale
+    )
 
     dequant_kv_c = torch.empty_like(kv_c)
     dequant_k_pe = torch.empty_like(k_pe)
@@ -106,7 +108,8 @@ def _quantize_dequantize_fp8_ds_mla(
         block_offset = slot % block_size
         cache_slice = tmp_cache[block_idx, block_offset]
         latent, rope_vals = _dequantize_fp8_ds_mla_entry(
-            cache_slice, kv_lora_rank, rope_dim, kv_c.dtype)
+            cache_slice, kv_lora_rank, rope_dim, kv_c.dtype
+        )
         dequant_kv_c[token_idx] = latent
         dequant_k_pe[token_idx] = rope_vals
 
@@ -123,10 +126,9 @@ def test_sparse_backend_metadata_registration():
     dtype_list = backend.get_supported_dtypes()
     assert torch.bfloat16 in dtype_list
 
-    shape = backend.get_kv_cache_shape(num_blocks=2,
-                                       block_size=64,
-                                       num_kv_heads=1,
-                                       head_size=576)
+    shape = backend.get_kv_cache_shape(
+        num_blocks=2, block_size=64, num_kv_heads=1, head_size=576
+    )
     assert shape == (2, 64, 576)
 
 
@@ -141,13 +143,10 @@ def test_sparse_decode_metadata_filters_prefill_indices():
 
     indices = torch.tensor([[0, 3, 5], [1, 2, 4]], dtype=torch.int32)
 
-    context_indices, new_token_indices = metadata.filter_prefill_indices(
-        indices)
+    context_indices, new_token_indices = metadata.filter_prefill_indices(indices)
 
-    expected_context = torch.tensor([[-1, -1, 5], [-1, -1, 4]],
-                                    dtype=torch.int32)
-    expected_new_tokens = torch.tensor([[-1, -1, 1], [-1, 0, 2]],
-                                       dtype=torch.int32)
+    expected_context = torch.tensor([[-1, -1, 5], [-1, -1, 4]], dtype=torch.int32)
+    expected_new_tokens = torch.tensor([[-1, -1, 1], [-1, 0, 2]], dtype=torch.int32)
 
     assert torch.equal(context_indices, expected_context)
     assert torch.equal(new_token_indices, expected_new_tokens)
@@ -162,14 +161,9 @@ def test_sparse_impl_zero_fills_when_metadata_missing():
     kv_cache = torch.zeros((1, 1, 1))
     output = torch.ones((2, 4))
 
-    result = FlashMLASparseImpl.forward(impl,
-                                        dummy_layer,
-                                        q,
-                                        k_c,
-                                        k_pe,
-                                        kv_cache,
-                                        attn_metadata=None,
-                                        output=output)
+    result = FlashMLASparseImpl.forward(
+        impl, dummy_layer, q, k_c, k_pe, kv_cache, attn_metadata=None, output=output
+    )
 
     assert result is output
     assert torch.all(result == 0)
@@ -177,8 +171,7 @@ def test_sparse_impl_zero_fills_when_metadata_missing():
 
 @pytest.mark.parametrize("batch_name", list(SPARSE_BACKEND_BATCH_SPECS.keys()))
 @pytest.mark.parametrize("kv_cache_dtype", ["fp8_ds_mla", "auto"])
-def test_sparse_backend_decode_correctness(dist_init, batch_name,
-                                           kv_cache_dtype):
+def test_sparse_backend_decode_correctness(dist_init, batch_name, kv_cache_dtype):
     if not torch.cuda.is_available():
         pytest.skip("CUDA is required for sparse MLA decode test")
 
@@ -203,14 +196,13 @@ def test_sparse_backend_decode_correctness(dist_init, batch_name,
     vllm_config = create_vllm_config(
         model_name="deepseek-ai/DeepSeek-V2-Lite-Chat",
         max_model_len=max_seqlen,
-        num_gpu_blocks=max(2048,
-                           cdiv(total_cache_tokens, block_size) + 1),
-        block_size=block_size)
+        num_gpu_blocks=max(2048, cdiv(total_cache_tokens, block_size) + 1),
+        block_size=block_size,
+    )
     model_config = vllm_config.model_config
     model_config.hf_config = SimpleNamespace(
-        attn_module_list_cfg=[{
-            "topk_tokens": topk_tokens
-        }])
+        attn_module_list_cfg=[{"topk_tokens": topk_tokens}]
+    )
     model_config.hf_text_config = SimpleNamespace(
         q_lora_rank=None,
         kv_lora_rank=kv_lora_rank,
@@ -221,13 +213,13 @@ def test_sparse_backend_decode_correctness(dist_init, batch_name,
     )
     model_config.dtype = dtype
     model_config.get_num_attention_heads = MethodType(
-        lambda self, parallel_config: num_heads, model_config)
-    model_config.get_num_kv_heads = MethodType(lambda self, parallel_config: 1,
-                                               model_config)
-    model_config.get_head_size = MethodType(lambda self: head_size,
-                                            model_config)
-    model_config.get_sliding_window = MethodType(lambda self: None,
-                                                 model_config)
+        lambda self, parallel_config: num_heads, model_config
+    )
+    model_config.get_num_kv_heads = MethodType(
+        lambda self, parallel_config: 1, model_config
+    )
+    model_config.get_head_size = MethodType(lambda self: head_size, model_config)
+    model_config.get_sliding_window = MethodType(lambda self: None, model_config)
 
     kv_cache_spec = create_standard_kv_cache_spec(vllm_config)
 
@@ -236,16 +228,10 @@ def test_sparse_backend_decode_correctness(dist_init, batch_name,
     scale = 1.0 / math.sqrt(head_size)
 
     # Shared MLA projection weights to keep reference and backend in sync
-    W_UK = torch.randn(kv_lora_rank,
-                       num_heads,
-                       qk_nope_head_dim,
-                       dtype=dtype,
-                       device=device)
-    W_UV = torch.randn(kv_lora_rank,
-                       num_heads,
-                       v_head_dim,
-                       dtype=dtype,
-                       device=device)
+    W_UK = torch.randn(
+        kv_lora_rank, num_heads, qk_nope_head_dim, dtype=dtype, device=device
+    )
+    W_UV = torch.randn(kv_lora_rank, num_heads, v_head_dim, dtype=dtype, device=device)
 
     # Build synthetic decode-only workload
     seq_lens = batch_spec.seq_lens
@@ -262,17 +248,15 @@ def test_sparse_backend_decode_correctness(dist_init, batch_name,
         q_len = query_lens[i]
         ctx_len = s_len - q_len
 
-        q_c = torch.rand(q_len,
-                         num_heads,
-                         qk_nope_head_dim + qk_rope_head_dim,
-                         dtype=dtype,
-                         device=device)
+        q_c = torch.rand(
+            q_len,
+            num_heads,
+            qk_nope_head_dim + qk_rope_head_dim,
+            dtype=dtype,
+            device=device,
+        )
         kv_c_full = torch.rand(s_len, kv_lora_rank, dtype=dtype, device=device)
-        k_pe_full = torch.rand(s_len,
-                               1,
-                               qk_rope_head_dim,
-                               dtype=dtype,
-                               device=device)
+        k_pe_full = torch.rand(s_len, 1, qk_rope_head_dim, dtype=dtype, device=device)
 
         kv_c_full, k_pe_full = _quantize_dequantize_fp8_ds_mla(
             kv_c_full,
@@ -298,7 +282,8 @@ def test_sparse_backend_decode_correctness(dist_init, batch_name,
         v_sdpa_in = v_mqa.unsqueeze(0).transpose(1, 2)
 
         sdpa_out = torch.nn.functional.scaled_dot_product_attention(
-            q_sdpa_in, k_sdpa_in, v_sdpa_in, attn_mask=attn_mask, scale=scale)
+            q_sdpa_in, k_sdpa_in, v_sdpa_in, attn_mask=attn_mask, scale=scale
+        )
         sdpa_out = sdpa_out.transpose(1, 2).squeeze(0)
 
         sdpa_out = torch.einsum("qnl,lnv->qnv", sdpa_out, W_UV)
@@ -307,8 +292,8 @@ def test_sparse_backend_decode_correctness(dist_init, batch_name,
         all_q_vllm.append(q_c)
         all_kv_c_vllm.append(kv_c_full[ctx_len:])
         all_k_pe_vllm.append(k_pe_full[ctx_len:])
-        kv_c_contexts.append(kv_c_full[:ctx_len + 1])
-        k_pe_contexts.append(k_pe_full[:ctx_len + 1])
+        kv_c_contexts.append(kv_c_full[: ctx_len + 1])
+        k_pe_contexts.append(k_pe_full[: ctx_len + 1])
 
     query_vllm = torch.cat(all_q_vllm, dim=0)
     kv_c_vllm = torch.cat(all_kv_c_vllm, dim=0)
@@ -321,7 +306,8 @@ def test_sparse_backend_decode_correctness(dist_init, batch_name,
         batch_spec,
         vllm_config.cache_config.block_size,
         device,
-        arange_block_indices=True)
+        arange_block_indices=True,
+    )
 
     kv_cache = create_and_prepopulate_kv_cache(
         kv_c_contexts=kv_c_contexts,
@@ -339,31 +325,31 @@ def test_sparse_backend_decode_correctness(dist_init, batch_name,
 
     builder_cls = FlashMLASparseBackend.get_builder_cls()
     builder = builder_cls(kv_cache_spec, ["placeholder"], vllm_config, device)
-    metadata = builder.build(common_prefix_len=0,
-                             common_attn_metadata=common_attn_metadata)
+    metadata = builder.build(
+        common_prefix_len=0, common_attn_metadata=common_attn_metadata
+    )
 
-    starts = np.asarray(common_attn_metadata.query_start_loc_cpu,
-                        dtype=np.int32)
+    starts = np.asarray(common_attn_metadata.query_start_loc_cpu, dtype=np.int32)
     seg_lengths = np.diff(starts)
     positions = np.arange(starts[-1], dtype=np.int32) - np.repeat(
-        starts[:-1], seg_lengths)
+        starts[:-1], seg_lengths
+    )
     seq_lengths = np.asarray(common_attn_metadata.seq_lens_cpu, dtype=np.int32)
     prefix_lengths = seq_lengths - seg_lengths
     positions += np.repeat(prefix_lengths, seg_lengths)
 
     pos_gpu = torch.as_tensor(positions, device=device, dtype=torch.int32)
     topk = metadata.topk_tokens
-    debug_indices = torch.arange(topk, device=device,
-                                 dtype=torch.int32).unsqueeze(0)
+    debug_indices = torch.arange(topk, device=device, dtype=torch.int32).unsqueeze(0)
     token_positions = pos_gpu.unsqueeze(1)
-    causal_mask = (debug_indices <= token_positions)
-    debug_indices = torch.where(causal_mask, debug_indices,
-                                torch.full_like(debug_indices, -1))
+    causal_mask = debug_indices <= token_positions
+    debug_indices = torch.where(
+        causal_mask, debug_indices, torch.full_like(debug_indices, -1)
+    )
 
     # FlashMLASparseImpl now reads top-k indices from the indexer-provided
     # buffer, so emulate that contract with a simple namespace mock.
-    debug_indices = debug_indices.expand(metadata.num_actual_tokens,
-                                         -1).clone()
+    debug_indices = debug_indices.expand(metadata.num_actual_tokens, -1).clone()
     mock_indexer = SimpleNamespace(topk_indices_buffer=debug_indices)
 
     ok, reason = flashmla.is_flashmla_supported()
@@ -372,59 +358,54 @@ def test_sparse_backend_decode_correctness(dist_init, batch_name,
 
     kv_b_proj_weight = torch.cat([W_UK, W_UV], dim=-1)
     kv_b_proj_weight = kv_b_proj_weight.view(
-        kv_lora_rank, num_heads * (qk_nope_head_dim + v_head_dim))
+        kv_lora_rank, num_heads * (qk_nope_head_dim + v_head_dim)
+    )
 
-    mock_kv_b_proj = ColumnParallelLinear(input_size=kv_lora_rank,
-                                          output_size=num_heads *
-                                          (qk_nope_head_dim + v_head_dim),
-                                          bias=False).to(device=device,
-                                                         dtype=dtype)
+    mock_kv_b_proj = ColumnParallelLinear(
+        input_size=kv_lora_rank,
+        output_size=num_heads * (qk_nope_head_dim + v_head_dim),
+        bias=False,
+    ).to(device=device, dtype=dtype)
     mock_kv_b_proj.weight = torch.nn.Parameter(kv_b_proj_weight.T.contiguous())
 
     impl_cls = FlashMLASparseBackend.get_impl_cls()
-    impl = impl_cls(num_heads=num_heads,
-                    head_size=head_size,
-                    scale=scale,
-                    num_kv_heads=1,
-                    alibi_slopes=None,
-                    sliding_window=None,
-                    kv_cache_dtype=vllm_config.cache_config.cache_dtype,
-                    logits_soft_cap=None,
-                    attn_type="decoder",
-                    kv_sharing_target_layer_name=None,
-                    q_lora_rank=None,
-                    kv_lora_rank=kv_lora_rank,
-                    qk_nope_head_dim=qk_nope_head_dim,
-                    qk_rope_head_dim=qk_rope_head_dim,
-                    qk_head_dim=qk_nope_head_dim + qk_rope_head_dim,
-                    v_head_dim=v_head_dim,
-                    kv_b_proj=mock_kv_b_proj,
-                    indexer=mock_indexer)
+    impl = impl_cls(
+        num_heads=num_heads,
+        head_size=head_size,
+        scale=scale,
+        num_kv_heads=1,
+        alibi_slopes=None,
+        sliding_window=None,
+        kv_cache_dtype=vllm_config.cache_config.cache_dtype,
+        logits_soft_cap=None,
+        attn_type="decoder",
+        kv_sharing_target_layer_name=None,
+        q_lora_rank=None,
+        kv_lora_rank=kv_lora_rank,
+        qk_nope_head_dim=qk_nope_head_dim,
+        qk_rope_head_dim=qk_rope_head_dim,
+        qk_head_dim=qk_nope_head_dim + qk_rope_head_dim,
+        v_head_dim=v_head_dim,
+        kv_b_proj=mock_kv_b_proj,
+        indexer=mock_indexer,
+    )
 
     impl.process_weights_after_loading(dtype)
 
     layer = MockAttentionLayer(device)
-    out_buffer = torch.empty(metadata.num_actual_tokens,
-                             num_heads * v_head_dim,
-                             dtype=dtype,
-                             device=device)
-
-    backend_output = impl.forward(layer,
-                                  query_vllm,
-                                  kv_c_vllm,
-                                  k_pe_vllm,
-                                  kv_cache,
-                                  metadata,
-                                  output=out_buffer)
+    out_buffer = torch.empty(
+        metadata.num_actual_tokens, num_heads * v_head_dim, dtype=dtype, device=device
+    )
+
+    backend_output = impl.forward(
+        layer, query_vllm, kv_c_vllm, k_pe_vllm, kv_cache, metadata, output=out_buffer
+    )
 
     assert backend_output.shape == sdpa_reference.shape
     assert backend_output.dtype == sdpa_reference.dtype
     assert torch.isfinite(backend_output).all()
 
-    torch.testing.assert_close(backend_output,
-                               sdpa_reference,
-                               rtol=0.5,
-                               atol=0.5)
+    torch.testing.assert_close(backend_output, sdpa_reference, rtol=0.5, atol=0.5)
 
 
 @pytest.mark.parametrize(
diff --git a/tests/v1/attention/utils.py b/tests/v1/attention/utils.py
index 2bea45210ff3..d8b2f7ab8a87 100644
--- a/tests/v1/attention/utils.py
+++ b/tests/v1/attention/utils.py
@@ -9,9 +9,17 @@
 import torch
 
 from vllm.attention.backends.registry import _Backend
-from vllm.config import (CacheConfig, CompilationConfig, DeviceConfig,
-                         LoadConfig, ModelConfig, ModelDType, ParallelConfig,
-                         SchedulerConfig, VllmConfig)
+from vllm.config import (
+    CacheConfig,
+    CompilationConfig,
+    DeviceConfig,
+    LoadConfig,
+    ModelConfig,
+    ModelDType,
+    ParallelConfig,
+    SchedulerConfig,
+    VllmConfig,
+)
 from vllm.platforms import current_platform
 from vllm.utils import resolve_obj_by_qualname
 from vllm.v1.attention.backends.utils import CommonAttentionMetadata
@@ -21,6 +29,7 @@
 @dataclass
 class BatchSpec:
     """Specification for a batch configuration (workload shape only)."""
+
     seq_lens: list[int]
     query_lens: list[int]
 
@@ -38,26 +47,25 @@ def compute_num_tokens(self):
 
 
 def create_common_attn_metadata(
-        batch_spec: BatchSpec,
-        block_size: int,
-        device: torch.device,
-        max_block_idx: int = 1000,
-        arange_block_indices: bool = False) -> CommonAttentionMetadata:
+    batch_spec: BatchSpec,
+    block_size: int,
+    device: torch.device,
+    max_block_idx: int = 1000,
+    arange_block_indices: bool = False,
+) -> CommonAttentionMetadata:
     """Create CommonAttentionMetadata from a BatchSpec and ModelParams."""
     # Create query start locations
-    query_start_loc = torch.zeros(batch_spec.batch_size + 1,
-                                  dtype=torch.int32,
-                                  device=device)
-    query_start_loc[1:] = torch.tensor(batch_spec.query_lens,
-                                       dtype=torch.int32,
-                                       device=device).cumsum(0)
+    query_start_loc = torch.zeros(
+        batch_spec.batch_size + 1, dtype=torch.int32, device=device
+    )
+    query_start_loc[1:] = torch.tensor(
+        batch_spec.query_lens, dtype=torch.int32, device=device
+    ).cumsum(0)
     query_start_loc_cpu = query_start_loc.cpu()
     num_tokens = batch_spec.compute_num_tokens()
 
     # Create sequence lengths
-    seq_lens = torch.tensor(batch_spec.seq_lens,
-                            dtype=torch.int32,
-                            device=device)
+    seq_lens = torch.tensor(batch_spec.seq_lens, dtype=torch.int32, device=device)
     seq_lens_cpu = seq_lens.cpu()
     max_seq_len = int(seq_lens_cpu.max())
 
@@ -72,24 +80,23 @@ def create_common_attn_metadata(
     max_blocks = (max(batch_spec.seq_lens) + block_size - 1) // block_size
     if arange_block_indices:
         num_blocks = batch_spec.batch_size * max_blocks
-        block_table_tensor = torch.arange(num_blocks,
-                                          dtype=torch.int32,
-                                          device=device).view(
-                                              batch_spec.batch_size,
-                                              max_blocks)
-        slot_mapping = torch.arange(num_tokens,
-                                    dtype=torch.int64,
-                                    device=device).view(num_tokens)
+        block_table_tensor = torch.arange(
+            num_blocks, dtype=torch.int32, device=device
+        ).view(batch_spec.batch_size, max_blocks)
+        slot_mapping = torch.arange(num_tokens, dtype=torch.int64, device=device).view(
+            num_tokens
+        )
     else:
-        block_table_tensor = torch.randint(0,
-                                           max_block_idx,
-                                           (batch_spec.batch_size, max_blocks),
-                                           dtype=torch.int32,
-                                           device=device)
-        slot_mapping = torch.randint(0,
-                                     max_block_idx, (num_tokens, ),
-                                     dtype=torch.int64,
-                                     device=device)
+        block_table_tensor = torch.randint(
+            0,
+            max_block_idx,
+            (batch_spec.batch_size, max_blocks),
+            dtype=torch.int32,
+            device=device,
+        )
+        slot_mapping = torch.randint(
+            0, max_block_idx, (num_tokens,), dtype=torch.int64, device=device
+        )
 
     # Calculate max query length
     max_query_len = max(batch_spec.query_lens)
@@ -121,31 +128,21 @@ def get_attention_backend(backend_name: _Backend):
         Tuple of (backend_builder_class, backend_impl_class)
     """
     backend_map = {
-        _Backend.FLASH_ATTN:
-        ("vllm.v1.attention.backends.flash_attn.FlashAttentionBackend"
-         if current_platform.is_cuda() else
-         "vllm.v1.attention.backends.rocm_aiter_fa.AiterFlashAttentionBackend"
-         ),
-        _Backend.FLASHINFER:
-        "vllm.v1.attention.backends.flashinfer.FlashInferBackend",
-        _Backend.FLEX_ATTENTION:
-        "vllm.v1.attention.backends.flex_attention.FlexAttentionBackend",
-        _Backend.TRITON_ATTN:
-        "vllm.v1.attention.backends.triton_attn.TritonAttentionBackend",
-        _Backend.TREE_ATTN:
-        "vllm.v1.attention.backends.tree_attn.TreeAttentionBackend",
-        _Backend.XFORMERS:
-        "vllm.v1.attention.backends.xformers.XFormersAttentionBackend",
-        _Backend.CUTLASS_MLA:
-        "vllm.v1.attention.backends.mla.cutlass_mla.CutlassMLABackend",
-        _Backend.FLASHMLA:
-        "vllm.v1.attention.backends.mla.flashmla.FlashMLABackend",
-        _Backend.FLASH_ATTN_MLA:
-        "vllm.v1.attention.backends.mla.flashattn_mla.FlashAttnMLABackend",
-        _Backend.FLASHINFER_MLA:
-        "vllm.v1.attention.backends.mla.flashinfer_mla.FlashInferMLABackend",
-        _Backend.TRITON_MLA:
-        "vllm.v1.attention.backends.mla.triton_mla.TritonMLABackend",
+        _Backend.FLASH_ATTN: (
+            "vllm.v1.attention.backends.flash_attn.FlashAttentionBackend"
+            if current_platform.is_cuda()
+            else "vllm.v1.attention.backends.rocm_aiter_fa.AiterFlashAttentionBackend"
+        ),
+        _Backend.FLASHINFER: "vllm.v1.attention.backends.flashinfer.FlashInferBackend",
+        _Backend.FLEX_ATTENTION: "vllm.v1.attention.backends.flex_attention.FlexAttentionBackend",
+        _Backend.TRITON_ATTN: "vllm.v1.attention.backends.triton_attn.TritonAttentionBackend",
+        _Backend.TREE_ATTN: "vllm.v1.attention.backends.tree_attn.TreeAttentionBackend",
+        _Backend.XFORMERS: "vllm.v1.attention.backends.xformers.XFormersAttentionBackend",
+        _Backend.CUTLASS_MLA: "vllm.v1.attention.backends.mla.cutlass_mla.CutlassMLABackend",
+        _Backend.FLASHMLA: "vllm.v1.attention.backends.mla.flashmla.FlashMLABackend",
+        _Backend.FLASH_ATTN_MLA: "vllm.v1.attention.backends.mla.flashattn_mla.FlashAttnMLABackend",
+        _Backend.FLASHINFER_MLA: "vllm.v1.attention.backends.mla.flashinfer_mla.FlashInferMLABackend",
+        _Backend.TRITON_MLA: "vllm.v1.attention.backends.mla.triton_mla.TritonMLABackend",
     }
 
     if backend_name not in backend_map:
@@ -160,29 +157,31 @@ def get_attention_backend(backend_name: _Backend):
         pytest.skip(f"{backend_name} not available: {e}")
 
 
-def create_standard_kv_cache_spec(
-        vllm_config: VllmConfig) -> FullAttentionSpec:
+def create_standard_kv_cache_spec(vllm_config: VllmConfig) -> FullAttentionSpec:
     """Create a FullAttentionSpec from ModelParams only."""
     return FullAttentionSpec(
         block_size=vllm_config.cache_config.block_size,
         num_kv_heads=vllm_config.model_config.get_num_kv_heads(
-            vllm_config.parallel_config),
+            vllm_config.parallel_config
+        ),
         head_size=vllm_config.model_config.get_head_size(),
         dtype=vllm_config.model_config.dtype,
         sliding_window=vllm_config.model_config.get_sliding_window(),
     )
 
 
-def create_vllm_config(model_name: str = "meta-llama/Meta-Llama-3-8B",
-                       tensor_parallel_size: int = 1,
-                       max_model_len: int = 1024,
-                       dtype: Union[ModelDType, torch.dtype] = "auto",
-                       num_gpu_blocks: int = 1000,
-                       block_size: int = 16,
-                       max_num_seqs: int = 256,
-                       max_num_batched_tokens: int = 8192,
-                       enable_chunked_prefill: bool = True,
-                       add_mock_model_methods: bool = True) -> VllmConfig:
+def create_vllm_config(
+    model_name: str = "meta-llama/Meta-Llama-3-8B",
+    tensor_parallel_size: int = 1,
+    max_model_len: int = 1024,
+    dtype: Union[ModelDType, torch.dtype] = "auto",
+    num_gpu_blocks: int = 1000,
+    block_size: int = 16,
+    max_num_seqs: int = 256,
+    max_num_batched_tokens: int = 8192,
+    enable_chunked_prefill: bool = True,
+    add_mock_model_methods: bool = True,
+) -> VllmConfig:
     """Create a VllmConfig for testing with reasonable defaults."""
 
     model_config = ModelConfig(
@@ -205,7 +204,8 @@ def create_vllm_config(model_name: str = "meta-llama/Meta-Llama-3-8B",
     cache_config.num_cpu_blocks = 0
 
     parallel_config = ParallelConfig(
-        tensor_parallel_size=tensor_parallel_size, )
+        tensor_parallel_size=tensor_parallel_size,
+    )
 
     scheduler_config = SchedulerConfig(
         max_num_seqs=max_num_seqs,
@@ -223,15 +223,17 @@ def create_vllm_config(model_name: str = "meta-llama/Meta-Llama-3-8B",
         # but some backends expect to query the model for layer-specific
         # parameters
         import types
-        model_config.get_num_layers = types.MethodType(lambda self: 1,
-                                                       model_config)
+
+        model_config.get_num_layers = types.MethodType(lambda self: 1, model_config)
         model_config.get_sliding_window_for_layer = types.MethodType(
-            lambda self, i: None, model_config)
+            lambda self, i: None, model_config
+        )
         model_config.get_logits_soft_cap_for_layer = types.MethodType(
-            lambda self, i: 0.0, model_config)
+            lambda self, i: 0.0, model_config
+        )
         model_config.get_sm_scale_for_layer = types.MethodType(
-            lambda self, i: 1.0 / model_config.get_head_size()**0.5,
-            model_config)
+            lambda self, i: 1.0 / model_config.get_head_size() ** 0.5, model_config
+        )
 
     return VllmConfig(
         model_config=model_config,
@@ -244,12 +246,14 @@ def create_vllm_config(model_name: str = "meta-llama/Meta-Llama-3-8B",
     )
 
 
-def create_dummy_kv_cache(block_size: int,
-                          num_kv_heads: int,
-                          head_size: int,
-                          dtype: torch.dtype,
-                          device: torch.device,
-                          num_blocks: int = 100) -> torch.Tensor:
+def create_dummy_kv_cache(
+    block_size: int,
+    num_kv_heads: int,
+    head_size: int,
+    dtype: torch.dtype,
+    device: torch.device,
+    num_blocks: int = 100,
+) -> torch.Tensor:
     """Create a dummy KV cache tensor for testing."""
     kv_cache = torch.randn(
         num_blocks,
@@ -258,7 +262,8 @@ def create_dummy_kv_cache(block_size: int,
         num_kv_heads,
         head_size,
         dtype=dtype,
-        device=device)
+        device=device,
+    )
     return kv_cache
 
 
@@ -273,75 +278,80 @@ class BackendConfig:
 # Define all backend configurations of full cudagraph to be tested
 full_cg_backend_configs = {
     # FA3 on Hopper
-    "FA3":
-    BackendConfig(name="FA3",
-                  env_vars={
-                      "VLLM_ATTENTION_BACKEND": "FLASH_ATTN",
-                      "VLLM_FLASH_ATTN_VERSION": "3",
-                      "VLLM_FLASH_ATTN_MAX_NUM_SPLITS_FOR_CUDA_GRAPH": "16",
-                  },
-                  comp_config={
-                      "cudagraph_mode": "FULL",
-                  },
-                  specific_gpu_arch=(9, 0)),
+    "FA3": BackendConfig(
+        name="FA3",
+        env_vars={
+            "VLLM_ATTENTION_BACKEND": "FLASH_ATTN",
+            "VLLM_FLASH_ATTN_VERSION": "3",
+            "VLLM_FLASH_ATTN_MAX_NUM_SPLITS_FOR_CUDA_GRAPH": "16",
+        },
+        comp_config={
+            "cudagraph_mode": "FULL",
+        },
+        specific_gpu_arch=(9, 0),
+    ),
     # FlashMLA on Hopper
-    "FlashMLA":
-    BackendConfig(name="FlashMLA",
-                  env_vars={
-                      "VLLM_ATTENTION_BACKEND": "FLASHMLA",
-                  },
-                  comp_config={
-                      "cudagraph_mode": "FULL_AND_PIECEWISE",
-                  },
-                  specific_gpu_arch=(9, 0)),
+    "FlashMLA": BackendConfig(
+        name="FlashMLA",
+        env_vars={
+            "VLLM_ATTENTION_BACKEND": "FLASHMLA",
+        },
+        comp_config={
+            "cudagraph_mode": "FULL_AND_PIECEWISE",
+        },
+        specific_gpu_arch=(9, 0),
+    ),
     # Cutlass MLA on Blackwell
-    "CutlassMLA":
-    BackendConfig(
+    "CutlassMLA": BackendConfig(
         name="CutlassMLA",
         env_vars={
             "VLLM_USE_V1": "1",
             "VLLM_ATTENTION_BACKEND": "CUTLASS_MLA",
-            "FORCE_NUM_KV_SPLITS":
-            "1",  # TODO: remove this when hang issue is fixed
+            "FORCE_NUM_KV_SPLITS": "1",  # TODO: remove this when hang issue is fixed
         },
         comp_config={
             "cudagraph_mode": "FULL_AND_PIECEWISE",
         },
-        specific_gpu_arch=(10, 0)),
+        specific_gpu_arch=(10, 0),
+    ),
     # FlashAttention MLA on Hopper
-    "FlashAttentionMLA":
-    BackendConfig(name="FlashAttentionMLA",
-                  env_vars={
-                      "VLLM_ATTENTION_BACKEND": "FLASH_ATTN_MLA",
-                      "VLLM_FLASH_ATTN_MAX_NUM_SPLITS_FOR_CUDA_GRAPH": "16",
-                  },
-                  comp_config={
-                      "cudagraph_mode": "FULL_DECODE_ONLY",
-                  },
-                  specific_gpu_arch=(9, 0)),
+    "FlashAttentionMLA": BackendConfig(
+        name="FlashAttentionMLA",
+        env_vars={
+            "VLLM_ATTENTION_BACKEND": "FLASH_ATTN_MLA",
+            "VLLM_FLASH_ATTN_MAX_NUM_SPLITS_FOR_CUDA_GRAPH": "16",
+        },
+        comp_config={
+            "cudagraph_mode": "FULL_DECODE_ONLY",
+        },
+        specific_gpu_arch=(9, 0),
+    ),
     # FA2
-    "FA2":
-    BackendConfig(name="FA2",
-                  env_vars={
-                      "VLLM_ATTENTION_BACKEND": "FLASH_ATTN",
-                      "VLLM_FLASH_ATTN_VERSION": "2",
-                      "VLLM_FLASH_ATTN_MAX_NUM_SPLITS_FOR_CUDA_GRAPH": "16",
-                  },
-                  comp_config={
-                      "cudagraph_mode": "FULL_AND_PIECEWISE",
-                  }),
+    "FA2": BackendConfig(
+        name="FA2",
+        env_vars={
+            "VLLM_ATTENTION_BACKEND": "FLASH_ATTN",
+            "VLLM_FLASH_ATTN_VERSION": "2",
+            "VLLM_FLASH_ATTN_MAX_NUM_SPLITS_FOR_CUDA_GRAPH": "16",
+        },
+        comp_config={
+            "cudagraph_mode": "FULL_AND_PIECEWISE",
+        },
+    ),
     # Triton Attention
-    "TritonAttn":
-    BackendConfig(name="TritonAttn",
-                  env_vars={"VLLM_ATTENTION_BACKEND": "TRITON_ATTN"},
-                  comp_config={
-                      "cudagraph_mode": "FULL_AND_PIECEWISE",
-                  }),
+    "TritonAttn": BackendConfig(
+        name="TritonAttn",
+        env_vars={"VLLM_ATTENTION_BACKEND": "TRITON_ATTN"},
+        comp_config={
+            "cudagraph_mode": "FULL_AND_PIECEWISE",
+        },
+    ),
     # FlashInfer
-    "FlashInfer":
-    BackendConfig(name="FlashInfer",
-                  env_vars={"VLLM_ATTENTION_BACKEND": "FLASHINFER"},
-                  comp_config={
-                      "cudagraph_mode": "FULL_AND_PIECEWISE",
-                  }),
+    "FlashInfer": BackendConfig(
+        name="FlashInfer",
+        env_vars={"VLLM_ATTENTION_BACKEND": "FLASHINFER"},
+        comp_config={
+            "cudagraph_mode": "FULL_AND_PIECEWISE",
+        },
+    ),
 }
diff --git a/tests/v1/core/test_async_scheduler.py b/tests/v1/core/test_async_scheduler.py
index 8ffe2e57b532..6d870b5640df 100644
--- a/tests/v1/core/test_async_scheduler.py
+++ b/tests/v1/core/test_async_scheduler.py
@@ -15,14 +15,12 @@
 
 
 def _make_model_runner_output(
-    scheduler_output: SchedulerOutput, ) -> ModelRunnerOutput:
+    scheduler_output: SchedulerOutput,
+) -> ModelRunnerOutput:
     req_ids = list(scheduler_output.num_scheduled_tokens.keys())
     return ModelRunnerOutput(
         req_ids=req_ids,
-        req_id_to_index={
-            req_id: i
-            for i, req_id in enumerate(req_ids)
-        },
+        req_id_to_index={req_id: i for i, req_id in enumerate(req_ids)},
         sampled_token_ids=[[i] for i in range(len(req_ids))],
         logprobs=None,
         prompt_logprobs_dict={},
@@ -75,8 +73,7 @@ def abort_request():
         if not abort_order:
             return
         req = requests[abort_order.pop(0)]
-        scheduler.finish_requests(req.request_id,
-                                  RequestStatus.FINISHED_ABORTED)
+        scheduler.finish_requests(req.request_id, RequestStatus.FINISHED_ABORTED)
 
     while sched_outputs:
         # Abort a scheduled request.
@@ -112,8 +109,7 @@ def abort_request():
         if not abort_order:
             return
         req = requests[abort_order.pop(0)]
-        scheduler.finish_requests(req.request_id,
-                                  RequestStatus.FINISHED_ABORTED)
+        scheduler.finish_requests(req.request_id, RequestStatus.FINISHED_ABORTED)
 
     while sched_outputs:
         # Abort a scheduled request.
@@ -135,15 +131,19 @@ def test_prefix_caching_for_prefill_dedup():
     CHUNK_SIZE = 1000
     BLOCK_SIZE = 16
     num_prompt_tokens = 100
-    scheduler = create_scheduler(async_scheduling=True,
-                                 max_num_batched_tokens=CHUNK_SIZE,
-                                 enable_prefix_caching=True,
-                                 block_size=BLOCK_SIZE)
-    requests = create_requests(num_requests=5,
-                               num_tokens=num_prompt_tokens,
-                               max_tokens=3,
-                               same_prompt=True,
-                               block_size=BLOCK_SIZE)
+    scheduler = create_scheduler(
+        async_scheduling=True,
+        max_num_batched_tokens=CHUNK_SIZE,
+        enable_prefix_caching=True,
+        block_size=BLOCK_SIZE,
+    )
+    requests = create_requests(
+        num_requests=5,
+        num_tokens=num_prompt_tokens,
+        max_tokens=3,
+        same_prompt=True,
+        block_size=BLOCK_SIZE,
+    )
     requests_copy = requests.copy()
 
     # Two requests with the same prompt.
@@ -185,14 +185,18 @@ def test_prefix_caching_for_multi_turn():
     BLOCK_SIZE = 16
     num_prompt_tokens = 100
     num_output_tokens = 200
-    scheduler = create_scheduler(async_scheduling=True,
-                                 max_num_batched_tokens=CHUNK_SIZE,
-                                 enable_prefix_caching=True,
-                                 block_size=BLOCK_SIZE)
-    requests = create_requests(num_requests=5,
-                               num_tokens=num_prompt_tokens,
-                               max_tokens=num_output_tokens,
-                               block_size=BLOCK_SIZE)
+    scheduler = create_scheduler(
+        async_scheduling=True,
+        max_num_batched_tokens=CHUNK_SIZE,
+        enable_prefix_caching=True,
+        block_size=BLOCK_SIZE,
+    )
+    requests = create_requests(
+        num_requests=5,
+        num_tokens=num_prompt_tokens,
+        max_tokens=num_output_tokens,
+        block_size=BLOCK_SIZE,
+    )
 
     for req in requests:
         scheduler.add_request(req)
@@ -212,14 +216,16 @@ def test_prefix_caching_for_multi_turn():
 
     # Create next-turn requests whose prompts are the full output of the
     # previous turn.
-    next_turn_requests = create_requests(num_requests=5,
-                                         num_tokens=num_prompt_tokens +
-                                         num_output_tokens,
-                                         max_tokens=num_output_tokens,
-                                         block_size=BLOCK_SIZE)
+    next_turn_requests = create_requests(
+        num_requests=5,
+        num_tokens=num_prompt_tokens + num_output_tokens,
+        max_tokens=num_output_tokens,
+        block_size=BLOCK_SIZE,
+    )
     for i, req in enumerate(next_turn_requests):
-        req.prompt_token_ids = (requests[i].prompt_token_ids +
-                                list(requests[i].output_token_ids))
+        req.prompt_token_ids = requests[i].prompt_token_ids + list(
+            requests[i].output_token_ids
+        )
         req._all_token_ids = req.prompt_token_ids.copy()
         req.all_token_ids = ConstantList(req._all_token_ids)
         req.block_hashes = []
@@ -233,5 +239,4 @@ def test_prefix_caching_for_multi_turn():
     # Make sure the next-turn requests get prefix cache hit by the previous
     # requests.
     for req in next_turn_requests:
-        assert (req.num_cached_tokens == req.num_prompt_tokens // BLOCK_SIZE *
-                BLOCK_SIZE)
+        assert req.num_cached_tokens == req.num_prompt_tokens // BLOCK_SIZE * BLOCK_SIZE
diff --git a/tests/v1/core/test_encoder_cache_manager.py b/tests/v1/core/test_encoder_cache_manager.py
index 6ef15b337ef0..8a52b5bd7897 100644
--- a/tests/v1/core/test_encoder_cache_manager.py
+++ b/tests/v1/core/test_encoder_cache_manager.py
@@ -10,7 +10,6 @@
 
 # ------------------ Mock Classes ------------------ #
 class MockRequest:
-
     def __init__(self, request_id, mm_hashes, token_counts):
         self.request_id = request_id
         self._token_counts = token_counts
@@ -20,8 +19,7 @@ def __init__(self, request_id, mm_hashes, token_counts):
                 data=None,
                 modality="image",
                 identifier=mm_hash,
-                mm_position=PlaceholderRange(offset=0,
-                                             length=self._token_counts[i]),
+                mm_position=PlaceholderRange(offset=0, length=self._token_counts[i]),
             )
             self.mm_features.append(feature)
 
@@ -167,8 +165,7 @@ def test_schedule_request_multi_images_respect_space_limit():
     num_tokens_to_schedule += req.get_num_encoder_tokens(0)
     compute_budget -= req.get_num_encoder_tokens(0)
 
-    assert not manager.can_allocate(req, 1, compute_budget,
-                                    num_tokens_to_schedule)
+    assert not manager.can_allocate(req, 1, compute_budget, num_tokens_to_schedule)
 
 
 def test_schedule_request_multi_images_respect_compute_limit():
@@ -180,5 +177,4 @@ def test_schedule_request_multi_images_respect_compute_limit():
     num_tokens_to_schedule += req.get_num_encoder_tokens(0)
     compute_budget -= req.get_num_encoder_tokens(0)
 
-    assert not manager.can_allocate(req, 1, compute_budget,
-                                    num_tokens_to_schedule)
+    assert not manager.can_allocate(req, 1, compute_budget, num_tokens_to_schedule)
diff --git a/tests/v1/core/test_kv_cache_utils.py b/tests/v1/core/test_kv_cache_utils.py
index 09f43a793db2..53c71609cfc1 100644
--- a/tests/v1/core/test_kv_cache_utils.py
+++ b/tests/v1/core/test_kv_cache_utils.py
@@ -8,25 +8,43 @@
 
 import vllm.v1.core.kv_cache_utils as kv_cache_utils
 from vllm.config import ModelConfig, SchedulerConfig, VllmConfig
-from vllm.multimodal.inputs import (MultiModalFeatureSpec,
-                                    MultiModalKwargsItem, PlaceholderRange)
+from vllm.multimodal.inputs import (
+    MultiModalFeatureSpec,
+    MultiModalKwargsItem,
+    PlaceholderRange,
+)
 from vllm.sampling_params import SamplingParams
 from vllm.utils import GiB_bytes, sha256, sha256_cbor
 from vllm.v1.core.kv_cache_manager import KVCacheManager
+
 # disable yapf here as it formats differently than isort such that both fail
 # yapf: disable
 from vllm.v1.core.kv_cache_utils import (
-    BlockHash, FreeKVCacheBlockQueue, KVCacheBlock, PrefixCachingMetrics,
-    estimate_max_model_len, generate_block_hash_extra_keys,
-    generate_scheduler_kv_cache_config, get_kv_cache_configs,
-    get_max_concurrency_for_kv_cache_config, get_request_block_hasher,
-    hash_block_tokens, init_none_hash, is_kv_cache_spec_uniform,
-    make_block_hash_with_group_id)
-from vllm.v1.kv_cache_interface import (FullAttentionSpec, KVCacheConfig,
-                                        KVCacheGroupSpec, KVCacheSpec,
-                                        KVCacheTensor, MLAAttentionSpec,
-                                        SlidingWindowSpec,
-                                        UniformTypeKVCacheSpecs)
+    BlockHash,
+    FreeKVCacheBlockQueue,
+    KVCacheBlock,
+    PrefixCachingMetrics,
+    estimate_max_model_len,
+    generate_block_hash_extra_keys,
+    generate_scheduler_kv_cache_config,
+    get_kv_cache_configs,
+    get_max_concurrency_for_kv_cache_config,
+    get_request_block_hasher,
+    hash_block_tokens,
+    init_none_hash,
+    is_kv_cache_spec_uniform,
+    make_block_hash_with_group_id,
+)
+from vllm.v1.kv_cache_interface import (
+    FullAttentionSpec,
+    KVCacheConfig,
+    KVCacheGroupSpec,
+    KVCacheSpec,
+    KVCacheTensor,
+    MLAAttentionSpec,
+    SlidingWindowSpec,
+    UniformTypeKVCacheSpecs,
+)
 from vllm.v1.metrics.stats import PrefixCacheStats
 from vllm.v1.request import Request
 
@@ -62,42 +80,49 @@ def make_request(
                 data=MultiModalKwargsItem.dummy("dummy_m"),
                 mm_position=position,
                 identifier=identifier,
-                modality="image")
+                modality="image",
+            )
             mm_features.append(mm_feature)
 
-    return Request(request_id=request_id,
-                   prompt_token_ids=prompt_token_ids,
-                   mm_features=mm_features if mm_features else None,
-                   sampling_params=SamplingParams(max_tokens=17),
-                   pooling_params=None,
-                   eos_token_id=100,
-                   lora_request=None,
-                   cache_salt=cache_salt,
-                   block_hasher=get_request_block_hasher(block_size, hash_fn))
-
-
-def new_kv_cache_spec(block_size=16,
-                      num_kv_heads=2,
-                      head_size=64,
-                      dtype=torch.float32,
-                      sliding_window=None):
-    return FullAttentionSpec(block_size=block_size,
-                             num_kv_heads=num_kv_heads,
-                             head_size=head_size,
-                             dtype=dtype,
-                             sliding_window=sliding_window)
-
-
-def new_sliding_window_spec(block_size=16,
-                            num_kv_heads=2,
-                            head_size=64,
-                            dtype=torch.float32,
-                            sliding_window=1):
-    return SlidingWindowSpec(block_size=block_size,
-                             num_kv_heads=num_kv_heads,
-                             head_size=head_size,
-                             dtype=dtype,
-                             sliding_window=sliding_window)
+    return Request(
+        request_id=request_id,
+        prompt_token_ids=prompt_token_ids,
+        mm_features=mm_features if mm_features else None,
+        sampling_params=SamplingParams(max_tokens=17),
+        pooling_params=None,
+        eos_token_id=100,
+        lora_request=None,
+        cache_salt=cache_salt,
+        block_hasher=get_request_block_hasher(block_size, hash_fn),
+    )
+
+
+def new_kv_cache_spec(
+    block_size=16,
+    num_kv_heads=2,
+    head_size=64,
+    dtype=torch.float32,
+    sliding_window=None,
+):
+    return FullAttentionSpec(
+        block_size=block_size,
+        num_kv_heads=num_kv_heads,
+        head_size=head_size,
+        dtype=dtype,
+        sliding_window=sliding_window,
+    )
+
+
+def new_sliding_window_spec(
+    block_size=16, num_kv_heads=2, head_size=64, dtype=torch.float32, sliding_window=1
+):
+    return SlidingWindowSpec(
+        block_size=block_size,
+        num_kv_heads=num_kv_heads,
+        head_size=head_size,
+        dtype=dtype,
+        sliding_window=sliding_window,
+    )
 
 
 @pytest.mark.parametrize("hash_fn", [sha256, sha256_cbor])
@@ -106,7 +131,7 @@ def test_none_hash(monkeypatch, hash_fn):
 
     # case 1: PYTHONHASHSEED is not set, use random
     with monkeypatch.context() as m:
-        m.delenv('PYTHONHASHSEED', raising=False)
+        m.delenv("PYTHONHASHSEED", raising=False)
         reloaded_kv_cache_utils = importlib.reload(vllm.v1.core.kv_cache_utils)
         reloaded_kv_cache_utils.init_none_hash(hash_fn)
         assert reloaded_kv_cache_utils.NONE_HASH is not None
@@ -115,16 +140,15 @@ def test_none_hash(monkeypatch, hash_fn):
 
     # case 2: PYTHONHASHSEED is set, use the seed and hash_fn
     with monkeypatch.context() as m:
-        m.setenv('PYTHONHASHSEED', 'python hash seed')
+        m.setenv("PYTHONHASHSEED", "python hash seed")
         reloaded_kv_cache_utils = importlib.reload(vllm.v1.core.kv_cache_utils)
         reloaded_kv_cache_utils.init_none_hash(hash_fn)
         assert reloaded_kv_cache_utils.NONE_HASH is not None
         assert isinstance(reloaded_kv_cache_utils.NONE_HASH, bytes)
-        assert hash_fn('python hash seed') == reloaded_kv_cache_utils.NONE_HASH
+        assert hash_fn("python hash seed") == reloaded_kv_cache_utils.NONE_HASH
 
 
 def test_kv_cache_block():
-
     # Test KVCacheBlock initialization
     block = KVCacheBlock(block_id=0)
     assert block.block_id == 0
@@ -192,10 +216,8 @@ def test_free_kv_cache_block_queue_operations():
     for _ in range(4):
         queue.popleft()
     assert queue.num_free_blocks == 0
-    assert (queue.fake_free_list_head.next_free_block
-            is queue.fake_free_list_tail)
-    assert (queue.fake_free_list_tail.prev_free_block
-            is queue.fake_free_list_head)
+    assert queue.fake_free_list_head.next_free_block is queue.fake_free_list_tail
+    assert queue.fake_free_list_tail.prev_free_block is queue.fake_free_list_head
 
     # Attempt to pop from an empty queue
     with pytest.raises(ValueError) as e:
@@ -211,10 +233,8 @@ def test_free_kv_cache_block_queue_append_n():
     # fake_head->fake_tail
     queue.append_n([])
     assert queue.num_free_blocks == 0
-    assert (queue.fake_free_list_head.next_free_block
-            is queue.fake_free_list_tail)
-    assert (queue.fake_free_list_tail.prev_free_block
-            is queue.fake_free_list_head)
+    assert queue.fake_free_list_head.next_free_block is queue.fake_free_list_tail
+    assert queue.fake_free_list_tail.prev_free_block is queue.fake_free_list_head
     # Append 1 block
     # fake_head->b0->fake_tail
     queue.append_n(blocks[0:1])
@@ -263,15 +283,18 @@ def test_free_kv_cache_block_queue_append_n():
         # fake_head->fake_tail
         invalid_queue.append_n(blocks[0:1])
     assert invalid_queue.num_free_blocks == 0
-    assert (invalid_queue.fake_free_list_head.next_free_block ==
-            invalid_queue.fake_free_list_tail)
+    assert (
+        invalid_queue.fake_free_list_head.next_free_block
+        == invalid_queue.fake_free_list_tail
+    )
 
 
 def test_free_kv_cache_block_queue_popleft_n():
     blocks = [KVCacheBlock(block_id=i) for i in range(6)]
     # Create an empty FreeKVCacheBlockQueue with these blocks
     queue = FreeKVCacheBlockQueue(
-        [blocks[1], blocks[3], blocks[5], blocks[4], blocks[0], blocks[2]])
+        [blocks[1], blocks[3], blocks[5], blocks[4], blocks[0], blocks[2]]
+    )
     assert queue.num_free_blocks == 6
     assert queue.fake_free_list_head.next_free_block is blocks[1]
     assert blocks[1].prev_free_block is queue.fake_free_list_head
@@ -345,8 +368,7 @@ def test_free_kv_cache_block_queue_get_all_free_blocks():
 
     # Append a block back and check again
     queue.append(block_to_remove)
-    assert queue.get_all_free_blocks() == \
-        blocks[1:2] + blocks[3:] + [block_to_remove]
+    assert queue.get_all_free_blocks() == blocks[1:2] + blocks[3:] + [block_to_remove]
 
 
 def test_generate_block_hash_extra_keys():
@@ -362,12 +384,12 @@ def test_generate_block_hash_extra_keys():
 
     # Test with no extra keys
     extra_keys, next_mm_idx = generate_block_hash_extra_keys(request, 0, 5, 0)
-    assert extra_keys == ("hash1", )
+    assert extra_keys == ("hash1",)
     assert next_mm_idx == 1
 
     # Test with partial overlap
     extra_keys, next_mm_idx = generate_block_hash_extra_keys(request, 3, 8, 0)
-    assert extra_keys == ("hash1", )
+    assert extra_keys == ("hash1",)
     assert next_mm_idx == 1
 
     # Test with no overlap
@@ -377,7 +399,7 @@ def test_generate_block_hash_extra_keys():
 
     # Test with multiple extra keys
     extra_keys, next_mm_idx = generate_block_hash_extra_keys(request, 0, 15, 0)
-    assert extra_keys == ('hash1', 'hash2')
+    assert extra_keys == ("hash1", "hash2")
     assert next_mm_idx == 2
 
 
@@ -405,9 +427,9 @@ def test_generate_block_hash_extra_keys_cache_salt():
 
     # salt is added for the first token
     extra_keys, _ = generate_block_hash_extra_keys(request, 0, 1, 0)
-    assert extra_keys == ('salt', )
+    assert extra_keys == ("salt",)
     extra_keys, _ = generate_block_hash_extra_keys(request, 0, 10, 0)
-    assert extra_keys == ('salt', )
+    assert extra_keys == ("salt",)
 
     # no salt added for other tokens
     extra_keys, _ = generate_block_hash_extra_keys(request, 1, 2, 0)
@@ -427,8 +449,7 @@ def test_generate_block_hash_extra_keys_cache_salt():
     )
 
     # Test with no extra keys
-    extra_keys, next_mm_idx = generate_block_hash_extra_keys(
-        request_mm, 0, 5, 0)
+    extra_keys, next_mm_idx = generate_block_hash_extra_keys(request_mm, 0, 5, 0)
     assert extra_keys == ("hash1", "salt")
     assert next_mm_idx == 1
 
@@ -439,8 +460,9 @@ def test_hash_block_tokens(hash_fn):
     curr_block_token_ids = (1, 2, 3)
     extra_keys = ("key1", "key2")
 
-    block_hash = hash_block_tokens(hash_fn, parent_block_hash,
-                                   curr_block_token_ids, extra_keys)
+    block_hash = hash_block_tokens(
+        hash_fn, parent_block_hash, curr_block_token_ids, extra_keys
+    )
     expected = hash_fn((parent_block_hash, curr_block_token_ids, extra_keys))
     assert block_hash == expected
 
@@ -461,10 +483,8 @@ def test_request_block_hasher(hash_fn):
 
     block_hashes = request.block_hashes
     assert len(block_hashes) == 2
-    assert block_hashes[0] == hash_fn(
-        (kv_cache_utils.NONE_HASH, (0, 1, 2), ("hash1", )))
-    assert block_hashes[1] == hash_fn(
-        (block_hashes[0], (3, 4, 5), ("hash2", )))
+    assert block_hashes[0] == hash_fn((kv_cache_utils.NONE_HASH, (0, 1, 2), ("hash1",)))
+    assert block_hashes[1] == hash_fn((block_hashes[0], (3, 4, 5), ("hash2",)))
 
 
 @pytest.mark.parametrize("hash_fn", [sha256, sha256_cbor])
@@ -509,8 +529,7 @@ def test_hash_request_tokens_no_mm_inputs(hash_fn):
     block_hashes = request.block_hashes
 
     assert len(block_hashes) == 2
-    assert block_hashes[0] == hash_fn(
-        (kv_cache_utils.NONE_HASH, (0, 1, 2), None))
+    assert block_hashes[0] == hash_fn((kv_cache_utils.NONE_HASH, (0, 1, 2), None))
     assert block_hashes[1] == hash_fn((block_hashes[0], (3, 4, 5), None))
 
 
@@ -587,27 +606,36 @@ def test_get_kv_cache_configs_multiple_workers():
     vllm_config = VllmConfig(model_config=model_config)
 
     ref_kv_cache_spec = new_kv_cache_spec()
-    same_kv_cache_specs = [{
-        "layer1": new_kv_cache_spec(),
-        "layer2": new_kv_cache_spec(),
-    }, {
-        "layer1": new_kv_cache_spec(),
-        "layer2": new_kv_cache_spec(),
-    }]
+    same_kv_cache_specs = [
+        {
+            "layer1": new_kv_cache_spec(),
+            "layer2": new_kv_cache_spec(),
+        },
+        {
+            "layer1": new_kv_cache_spec(),
+            "layer2": new_kv_cache_spec(),
+        },
+    ]
 
     # Basic case. All things are the same.
-    kv_cache_configs = get_kv_cache_configs(vllm_config, same_kv_cache_specs, [
-        ref_kv_cache_spec.page_size_bytes * 2 * 10,
-        ref_kv_cache_spec.page_size_bytes * 2 * 10
-    ])
+    kv_cache_configs = get_kv_cache_configs(
+        vllm_config,
+        same_kv_cache_specs,
+        [
+            ref_kv_cache_spec.page_size_bytes * 2 * 10,
+            ref_kv_cache_spec.page_size_bytes * 2 * 10,
+        ],
+    )
     assert kv_cache_configs == [
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer1"]),
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer2"]),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer1"]
+                ),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer2"]
+                ),
             ],
             kv_cache_groups=[
                 KVCacheGroupSpec(["layer1", "layer2"], ref_kv_cache_spec),
@@ -616,10 +644,12 @@ def test_get_kv_cache_configs_multiple_workers():
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer1"]),
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer2"]),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer1"]
+                ),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer2"]
+                ),
             ],
             kv_cache_groups=[
                 KVCacheGroupSpec(["layer1", "layer2"], ref_kv_cache_spec),
@@ -629,18 +659,24 @@ def test_get_kv_cache_configs_multiple_workers():
 
     # Different available memory. This is the case for TP.
     # Use the smallest memory available.
-    kv_cache_configs = get_kv_cache_configs(vllm_config, same_kv_cache_specs, [
-        ref_kv_cache_spec.page_size_bytes * 2 * 10,
-        ref_kv_cache_spec.page_size_bytes * 2 * 20
-    ])
+    kv_cache_configs = get_kv_cache_configs(
+        vllm_config,
+        same_kv_cache_specs,
+        [
+            ref_kv_cache_spec.page_size_bytes * 2 * 10,
+            ref_kv_cache_spec.page_size_bytes * 2 * 20,
+        ],
+    )
     assert kv_cache_configs == [
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer1"]),
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer2"]),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer1"]
+                ),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer2"]
+                ),
             ],
             kv_cache_groups=[
                 KVCacheGroupSpec(["layer1", "layer2"], ref_kv_cache_spec),
@@ -649,10 +685,12 @@ def test_get_kv_cache_configs_multiple_workers():
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 20,
-                              shared_by=["layer1"]),
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 20,
-                              shared_by=["layer2"]),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 20, shared_by=["layer1"]
+                ),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 20, shared_by=["layer2"]
+                ),
             ],
             kv_cache_groups=[
                 KVCacheGroupSpec(["layer1", "layer2"], ref_kv_cache_spec),
@@ -661,25 +699,32 @@ def test_get_kv_cache_configs_multiple_workers():
     ]
 
     # Different KV cache specs. This is the case for PP.
-    different_layer_specs = [{
-        "layer1": new_kv_cache_spec(),
-    }, {
-        "layer2": new_kv_cache_spec(),
-        "layer3": new_kv_cache_spec(),
-    }]
+    different_layer_specs = [
+        {
+            "layer1": new_kv_cache_spec(),
+        },
+        {
+            "layer2": new_kv_cache_spec(),
+            "layer3": new_kv_cache_spec(),
+        },
+    ]
 
     # Different workers have different layers.
     kv_cache_configs = get_kv_cache_configs(
-        vllm_config, different_layer_specs, [
+        vllm_config,
+        different_layer_specs,
+        [
+            ref_kv_cache_spec.page_size_bytes * 2 * 10,
             ref_kv_cache_spec.page_size_bytes * 2 * 10,
-            ref_kv_cache_spec.page_size_bytes * 2 * 10
-        ])
+        ],
+    )
     assert kv_cache_configs == [
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 20,
-                              shared_by=["layer1"]),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 20, shared_by=["layer1"]
+                ),
             ],
             kv_cache_groups=[
                 KVCacheGroupSpec(["layer1"], new_kv_cache_spec()),
@@ -688,10 +733,12 @@ def test_get_kv_cache_configs_multiple_workers():
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer2"]),
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer3"]),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer2"]
+                ),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer3"]
+                ),
             ],
             kv_cache_groups=[
                 KVCacheGroupSpec(["layer2", "layer3"], new_kv_cache_spec()),
@@ -700,33 +747,43 @@ def test_get_kv_cache_configs_multiple_workers():
     ]
 
     # Some layers are the same, some are different. This is the case for TP+PP
-    tp_pp_kv_cache_specs = [{
-        "layer1": new_kv_cache_spec(),
-        "layer2": new_kv_cache_spec(),
-    }, {
-        "layer1": new_kv_cache_spec(),
-        "layer2": new_kv_cache_spec(),
-    }, {
-        "layer3": new_kv_cache_spec(),
-    }, {
-        "layer3": new_kv_cache_spec(),
-    }]
+    tp_pp_kv_cache_specs = [
+        {
+            "layer1": new_kv_cache_spec(),
+            "layer2": new_kv_cache_spec(),
+        },
+        {
+            "layer1": new_kv_cache_spec(),
+            "layer2": new_kv_cache_spec(),
+        },
+        {
+            "layer3": new_kv_cache_spec(),
+        },
+        {
+            "layer3": new_kv_cache_spec(),
+        },
+    ]
 
     kv_cache_configs = get_kv_cache_configs(
-        vllm_config, tp_pp_kv_cache_specs, [
+        vllm_config,
+        tp_pp_kv_cache_specs,
+        [
             ref_kv_cache_spec.page_size_bytes * 2 * 10,
             ref_kv_cache_spec.page_size_bytes * 2 * 10,
             ref_kv_cache_spec.page_size_bytes * 2 * 10,
             ref_kv_cache_spec.page_size_bytes * 2 * 10,
-        ])
+        ],
+    )
     assert kv_cache_configs == [
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer1"]),
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer2"]),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer1"]
+                ),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer2"]
+                ),
             ],
             kv_cache_groups=[
                 KVCacheGroupSpec(["layer1", "layer2"], ref_kv_cache_spec),
@@ -735,10 +792,12 @@ def test_get_kv_cache_configs_multiple_workers():
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer1"]),
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer2"]),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer1"]
+                ),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer2"]
+                ),
             ],
             kv_cache_groups=[
                 KVCacheGroupSpec(["layer1", "layer2"], ref_kv_cache_spec),
@@ -747,8 +806,9 @@ def test_get_kv_cache_configs_multiple_workers():
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 20,
-                              shared_by=["layer3"]),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 20, shared_by=["layer3"]
+                ),
             ],
             kv_cache_groups=[
                 KVCacheGroupSpec(["layer3"], ref_kv_cache_spec),
@@ -757,8 +817,9 @@ def test_get_kv_cache_configs_multiple_workers():
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 20,
-                              shared_by=["layer3"]),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 20, shared_by=["layer3"]
+                ),
             ],
             kv_cache_groups=[
                 KVCacheGroupSpec(["layer3"], ref_kv_cache_spec),
@@ -768,26 +829,34 @@ def test_get_kv_cache_configs_multiple_workers():
 
     # Different workers have different types of layers. This is the case for
     # hybrid models + PP.
-    different_type_layer_specs = [{
-        "layer1": new_kv_cache_spec(),
-        "layer2": new_kv_cache_spec(),
-    }, {
-        "layer3": new_sliding_window_spec(),
-        "layer4": new_sliding_window_spec(),
-    }]
+    different_type_layer_specs = [
+        {
+            "layer1": new_kv_cache_spec(),
+            "layer2": new_kv_cache_spec(),
+        },
+        {
+            "layer3": new_sliding_window_spec(),
+            "layer4": new_sliding_window_spec(),
+        },
+    ]
     kv_cache_configs = get_kv_cache_configs(
-        vllm_config, different_type_layer_specs, [
+        vllm_config,
+        different_type_layer_specs,
+        [
             ref_kv_cache_spec.page_size_bytes * 2 * 10,
             ref_kv_cache_spec.page_size_bytes * 2 * 10,
-        ])
+        ],
+    )
     assert kv_cache_configs == [
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer1"]),
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer2"]),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer1"]
+                ),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer2"]
+                ),
             ],
             kv_cache_groups=[
                 KVCacheGroupSpec(["layer1", "layer2"], ref_kv_cache_spec),
@@ -797,41 +866,50 @@ def test_get_kv_cache_configs_multiple_workers():
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer3"]),
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer4"]),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer3"]
+                ),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10, shared_by=["layer4"]
+                ),
             ],
             kv_cache_groups=[
                 KVCacheGroupSpec([], ref_kv_cache_spec),
-                KVCacheGroupSpec(["layer3", "layer4"],
-                                 new_sliding_window_spec()),
+                KVCacheGroupSpec(["layer3", "layer4"], new_sliding_window_spec()),
             ],
         ),
     ]
 
     # When divided into multiple KVCacheGroups, need to ensure the number of
     # layers per group is similar.
-    different_type_layer_specs = [{
-        "layer1": new_kv_cache_spec(),
-        "layer2": new_sliding_window_spec(),
-        "layer3": new_sliding_window_spec(),
-    }, {
-        "layer4": new_kv_cache_spec(),
-        "layer5": new_sliding_window_spec(),
-        "layer6": new_sliding_window_spec(),
-    }]
+    different_type_layer_specs = [
+        {
+            "layer1": new_kv_cache_spec(),
+            "layer2": new_sliding_window_spec(),
+            "layer3": new_sliding_window_spec(),
+        },
+        {
+            "layer4": new_kv_cache_spec(),
+            "layer5": new_sliding_window_spec(),
+            "layer6": new_sliding_window_spec(),
+        },
+    ]
     kv_cache_configs = get_kv_cache_configs(
-        vllm_config, different_type_layer_specs, [
+        vllm_config,
+        different_type_layer_specs,
+        [
             ref_kv_cache_spec.page_size_bytes * 10,
             ref_kv_cache_spec.page_size_bytes * 10,
-        ])
+        ],
+    )
     assert kv_cache_configs == [
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer1", "layer2", "layer3"]),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10,
+                    shared_by=["layer1", "layer2", "layer3"],
+                ),
             ],
             kv_cache_groups=[
                 KVCacheGroupSpec(["layer1"], ref_kv_cache_spec),
@@ -842,8 +920,10 @@ def test_get_kv_cache_configs_multiple_workers():
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[
-                KVCacheTensor(size=ref_kv_cache_spec.page_size_bytes * 10,
-                              shared_by=["layer4", "layer5", "layer6"]),
+                KVCacheTensor(
+                    size=ref_kv_cache_spec.page_size_bytes * 10,
+                    shared_by=["layer4", "layer5", "layer6"],
+                ),
             ],
             kv_cache_groups=[
                 KVCacheGroupSpec(["layer4"], ref_kv_cache_spec),
@@ -854,16 +934,23 @@ def test_get_kv_cache_configs_multiple_workers():
     ]
 
     # Have conflicting layers. Need to raise an error.
-    conflicting_layer_specs = [{
-        "layer1": new_kv_cache_spec(),
-    }, {
-        "layer1": new_sliding_window_spec(),
-    }]
+    conflicting_layer_specs = [
+        {
+            "layer1": new_kv_cache_spec(),
+        },
+        {
+            "layer1": new_sliding_window_spec(),
+        },
+    ]
     with pytest.raises(AssertionError):
-        get_kv_cache_configs(vllm_config, conflicting_layer_specs, [
-            ref_kv_cache_spec.page_size_bytes * 2 * 10,
-            ref_kv_cache_spec.page_size_bytes * 2 * 10,
-        ])
+        get_kv_cache_configs(
+            vllm_config,
+            conflicting_layer_specs,
+            [
+                ref_kv_cache_spec.page_size_bytes * 2 * 10,
+                ref_kv_cache_spec.page_size_bytes * 2 * 10,
+            ],
+        )
 
 
 def test_merge_kv_cache_spec():
@@ -908,14 +995,16 @@ def test_merge_kv_cache_spec():
     ]
     with pytest.raises(ValueError):
         different_sliding_window_layer_specs[0].merge(
-            different_sliding_window_layer_specs)
+            different_sliding_window_layer_specs
+        )
 
     same_sliding_window_layer_specs = [
         new_kv_cache_spec(num_kv_heads=32, sliding_window=1),
         new_kv_cache_spec(num_kv_heads=32, sliding_window=1),
     ]
     merged_layer_spec = same_sliding_window_layer_specs[0].merge(
-        same_sliding_window_layer_specs)
+        same_sliding_window_layer_specs
+    )
     assert merged_layer_spec.sliding_window == 1
 
     same_sliding_window_layer_spec_with_none = [
@@ -923,7 +1012,8 @@ def test_merge_kv_cache_spec():
         new_kv_cache_spec(num_kv_heads=32, sliding_window=None),
     ]
     merged_layer_spec = same_sliding_window_layer_spec_with_none[0].merge(
-        same_sliding_window_layer_spec_with_none)
+        same_sliding_window_layer_spec_with_none
+    )
     assert merged_layer_spec.sliding_window == 1
 
 
@@ -960,12 +1050,13 @@ def test_is_kv_cache_spec_uniform():
 
 
 @pytest.mark.parametrize(
-    ("model_id", "max_model_len", "want_estimated_max_len"), [
+    ("model_id", "max_model_len", "want_estimated_max_len"),
+    [
         ("Qwen/Qwen1.5-7B", 16385, 16384),
         ("Qwen/Qwen1.5-7B", 16383, 16383),
-    ])
-def test_estimate_max_model_len(model_id, max_model_len,
-                                want_estimated_max_len):
+    ],
+)
+def test_estimate_max_model_len(model_id, max_model_len, want_estimated_max_len):
     # Create a VllmConfig
     model_config = ModelConfig(
         model_id,
@@ -991,8 +1082,9 @@ def test_estimate_max_model_len(model_id, max_model_len,
             dtype=torch.float16,
         )
     # Estimate the maximum model length, 16384 model_len need 8GB
-    estimated_max_len = estimate_max_model_len(vllm_config, kv_cache_spec,
-                                               8 * GiB_bytes)
+    estimated_max_len = estimate_max_model_len(
+        vllm_config, kv_cache_spec, 8 * GiB_bytes
+    )
     assert estimated_max_len == want_estimated_max_len
 
 
@@ -1006,8 +1098,9 @@ def test_get_max_concurrency_for_kv_cache_config():
         dtype="float16",
         max_model_len=max_model_len,
     )
-    scheduler_config = SchedulerConfig(max_num_batched_tokens=1024,
-                                       enable_chunked_prefill=True)
+    scheduler_config = SchedulerConfig(
+        max_num_batched_tokens=1024, enable_chunked_prefill=True
+    )
 
     vllm_config = VllmConfig(
         model_config=model_config,
@@ -1033,38 +1126,39 @@ def test_get_max_concurrency_for_kv_cache_config():
         num_blocks=int(1024 * 1.5),
         kv_cache_tensors=[],
         kv_cache_groups=[
-            KVCacheGroupSpec([f"layer_{i}" for i in range(32)],
-                             full_attention_spec),
+            KVCacheGroupSpec([f"layer_{i}" for i in range(32)], full_attention_spec),
         ],
     )
     max_concurrency_full_attention = get_max_concurrency_for_kv_cache_config(
-        vllm_config, kv_cache_config_full_attention)
+        vllm_config, kv_cache_config_full_attention
+    )
     assert max_concurrency_full_attention == 1.5
 
     kv_cache_config_sliding_window = KVCacheConfig(
         num_blocks=129 * 3,
         kv_cache_tensors=[],
         kv_cache_groups=[
-            KVCacheGroupSpec([f"layer_{i}" for i in range(32)],
-                             sliding_window_spec),
+            KVCacheGroupSpec([f"layer_{i}" for i in range(32)], sliding_window_spec),
         ],
     )
     max_concurrency_sliding_window = get_max_concurrency_for_kv_cache_config(
-        vllm_config, kv_cache_config_sliding_window)
+        vllm_config, kv_cache_config_sliding_window
+    )
     assert max_concurrency_sliding_window == 3
 
     kv_cache_config_hybrid_model = KVCacheConfig(
         num_blocks=(1024 + 129) * 3,
         kv_cache_tensors=[],
         kv_cache_groups=[
-            KVCacheGroupSpec([f"layer_{i}" for i in range(32)],
-                             full_attention_spec),
-            KVCacheGroupSpec([f"layer_{i}" for i in range(32, 64)],
-                             sliding_window_spec),
+            KVCacheGroupSpec([f"layer_{i}" for i in range(32)], full_attention_spec),
+            KVCacheGroupSpec(
+                [f"layer_{i}" for i in range(32, 64)], sliding_window_spec
+            ),
         ],
     )
     max_concurrency_hybrid_model = get_max_concurrency_for_kv_cache_config(
-        vllm_config, kv_cache_config_hybrid_model)
+        vllm_config, kv_cache_config_hybrid_model
+    )
     assert max_concurrency_hybrid_model == 3
 
 
@@ -1077,8 +1171,7 @@ def test_allocate_with_lookahead():
             KVCacheTensor(size=100, shared_by=["layer1"]),
         ],
         kv_cache_groups=[
-            KVCacheGroupSpec(["layer1"],
-                             new_kv_cache_spec(block_size=block_size)),
+            KVCacheGroupSpec(["layer1"], new_kv_cache_spec(block_size=block_size)),
         ],
     )
 
@@ -1091,8 +1184,7 @@ def test_allocate_with_lookahead():
     )
 
     # Test case 1: Requires additional lookahead tokens
-    kv_cache_manager = KVCacheManager(kv_cache_config=config,
-                                      max_model_len=100)
+    kv_cache_manager = KVCacheManager(kv_cache_config=config, max_model_len=100)
     blocks = kv_cache_manager.allocate_slots(
         request,
         num_new_tokens=3,
@@ -1101,8 +1193,7 @@ def test_allocate_with_lookahead():
     assert len(blocks.get_block_ids()[0]) == 2  # ceil(5/4)=2 blocks
 
     # Test case 2: With precomputed blocks
-    kv_cache_manager = KVCacheManager(kv_cache_config=config,
-                                      max_model_len=100)
+    kv_cache_manager = KVCacheManager(kv_cache_config=config, max_model_len=100)
     # required_blocks = ceil((3 + 2) /4) = 2
     blocks = kv_cache_manager.allocate_slots(
         request,
@@ -1113,8 +1204,7 @@ def test_allocate_with_lookahead():
 
     # Test case 3: With precomputed blocks
     # required_blocks = ceil((3 + 4) / 4) = 2
-    kv_cache_manager = KVCacheManager(kv_cache_config=config,
-                                      max_model_len=100)
+    kv_cache_manager = KVCacheManager(kv_cache_config=config, max_model_len=100)
     blocks = kv_cache_manager.allocate_slots(
         request,
         num_new_tokens=3,
@@ -1131,82 +1221,78 @@ def test_get_kv_cache_config_one_worker():
     mem_per_block_per_layer = 16 * 2 * 64 * 4 * 2
     # all layers are full attention -> single group
     kv_cache_specs_full = {
-        'layer_1': new_kv_cache_spec(),
-        'layer_2': new_kv_cache_spec(),
+        "layer_1": new_kv_cache_spec(),
+        "layer_2": new_kv_cache_spec(),
     }
     kv_cache_config_full = get_kv_cache_configs(
-        vllm_config, [kv_cache_specs_full],
-        [mem_per_block_per_layer * 2 * 32])[0]
+        vllm_config, [kv_cache_specs_full], [mem_per_block_per_layer * 2 * 32]
+    )[0]
     print(kv_cache_config_full)
     assert kv_cache_config_full == KVCacheConfig(
         num_blocks=32,
         kv_cache_tensors=[
-            KVCacheTensor(size=mem_per_block_per_layer * 32,
-                          shared_by=["layer_1"]),
-            KVCacheTensor(size=mem_per_block_per_layer * 32,
-                          shared_by=["layer_2"]),
+            KVCacheTensor(size=mem_per_block_per_layer * 32, shared_by=["layer_1"]),
+            KVCacheTensor(size=mem_per_block_per_layer * 32, shared_by=["layer_2"]),
         ],
-        kv_cache_groups=[
-            KVCacheGroupSpec(["layer_1", "layer_2"], new_kv_cache_spec())
-        ])
+        kv_cache_groups=[KVCacheGroupSpec(["layer_1", "layer_2"], new_kv_cache_spec())],
+    )
 
     # all layers are sliding window -> single group
     kv_cache_specs_sliding = {
-        'layer_1': new_sliding_window_spec(),
-        'layer_2': new_sliding_window_spec(),
+        "layer_1": new_sliding_window_spec(),
+        "layer_2": new_sliding_window_spec(),
     }
     kv_cache_config_sliding = get_kv_cache_configs(
-        vllm_config, [kv_cache_specs_sliding],
-        [mem_per_block_per_layer * 2 * 32])[0]
+        vllm_config, [kv_cache_specs_sliding], [mem_per_block_per_layer * 2 * 32]
+    )[0]
     assert kv_cache_config_sliding == KVCacheConfig(
         num_blocks=32,
         kv_cache_tensors=[
-            KVCacheTensor(size=mem_per_block_per_layer * 32,
-                          shared_by=["layer_1"]),
-            KVCacheTensor(size=mem_per_block_per_layer * 32,
-                          shared_by=["layer_2"]),
+            KVCacheTensor(size=mem_per_block_per_layer * 32, shared_by=["layer_1"]),
+            KVCacheTensor(size=mem_per_block_per_layer * 32, shared_by=["layer_2"]),
         ],
         kv_cache_groups=[
             KVCacheGroupSpec(["layer_1", "layer_2"], new_sliding_window_spec())
-        ])
+        ],
+    )
 
     # full + sliding, but disable_hybrid_kv_cache_manager
     vllm_config.scheduler_config.disable_hybrid_kv_cache_manager = True
     kv_cache_specs_hybrid = {
-        'layer_1': new_kv_cache_spec(),
-        'layer_2': new_sliding_window_spec(),
+        "layer_1": new_kv_cache_spec(),
+        "layer_2": new_sliding_window_spec(),
     }
     kv_cache_config_hybrid = get_kv_cache_configs(
-        vllm_config, [kv_cache_specs_hybrid],
-        [mem_per_block_per_layer * 2 * 32])[0]
+        vllm_config, [kv_cache_specs_hybrid], [mem_per_block_per_layer * 2 * 32]
+    )[0]
     assert kv_cache_config_hybrid == KVCacheConfig(
         num_blocks=32,
         kv_cache_tensors=[
-            KVCacheTensor(size=mem_per_block_per_layer * 32,
-                          shared_by=["layer_1"]),
-            KVCacheTensor(size=mem_per_block_per_layer * 32,
-                          shared_by=["layer_2"]),
+            KVCacheTensor(size=mem_per_block_per_layer * 32, shared_by=["layer_1"]),
+            KVCacheTensor(size=mem_per_block_per_layer * 32, shared_by=["layer_2"]),
         ],
         kv_cache_groups=[
-            KVCacheGroupSpec(["layer_1", "layer_2"],
-                             new_kv_cache_spec(sliding_window=1)),
+            KVCacheGroupSpec(
+                ["layer_1", "layer_2"], new_kv_cache_spec(sliding_window=1)
+            ),
         ],
     )
     vllm_config.scheduler_config.disable_hybrid_kv_cache_manager = False
 
     # full + sliding, with hybrid_kv_cache_manager
     kv_cache_specs_hybrid = {
-        'layer_1': new_kv_cache_spec(),
-        'layer_2': new_sliding_window_spec(),
+        "layer_1": new_kv_cache_spec(),
+        "layer_2": new_sliding_window_spec(),
     }
     kv_cache_config_hybrid = get_kv_cache_configs(
-        vllm_config, [kv_cache_specs_hybrid],
-        [mem_per_block_per_layer * 2 * 32])[0]
+        vllm_config, [kv_cache_specs_hybrid], [mem_per_block_per_layer * 2 * 32]
+    )[0]
     assert kv_cache_config_hybrid == KVCacheConfig(
         num_blocks=64,
         kv_cache_tensors=[
-            KVCacheTensor(size=mem_per_block_per_layer * 64,
-                          shared_by=["layer_1", "layer_2"]),
+            KVCacheTensor(
+                size=mem_per_block_per_layer * 64, shared_by=["layer_1", "layer_2"]
+            ),
         ],
         kv_cache_groups=[
             KVCacheGroupSpec(["layer_1"], new_kv_cache_spec()),
@@ -1216,112 +1302,113 @@ def test_get_kv_cache_config_one_worker():
 
     # 2 full + 4 sliding, 2 layers per group
     kv_cache_specs_hybrid = {
-        'layer_1': new_kv_cache_spec(),
-        'layer_2': new_kv_cache_spec(),
-        'layer_3': new_sliding_window_spec(),
-        'layer_4': new_sliding_window_spec(),
-        'layer_5': new_sliding_window_spec(),
-        'layer_6': new_sliding_window_spec(),
+        "layer_1": new_kv_cache_spec(),
+        "layer_2": new_kv_cache_spec(),
+        "layer_3": new_sliding_window_spec(),
+        "layer_4": new_sliding_window_spec(),
+        "layer_5": new_sliding_window_spec(),
+        "layer_6": new_sliding_window_spec(),
     }
     kv_cache_config_hybrid = get_kv_cache_configs(
-        vllm_config, [kv_cache_specs_hybrid],
-        [mem_per_block_per_layer * 2 * 32])[0]
+        vllm_config, [kv_cache_specs_hybrid], [mem_per_block_per_layer * 2 * 32]
+    )[0]
     assert kv_cache_config_hybrid == KVCacheConfig(
         num_blocks=32,
         kv_cache_tensors=[
-            KVCacheTensor(size=mem_per_block_per_layer * 32,
-                          shared_by=["layer_1", "layer_3", "layer_4"]),
-            KVCacheTensor(size=mem_per_block_per_layer * 32,
-                          shared_by=["layer_2", "layer_5", "layer_6"]),
+            KVCacheTensor(
+                size=mem_per_block_per_layer * 32,
+                shared_by=["layer_1", "layer_3", "layer_4"],
+            ),
+            KVCacheTensor(
+                size=mem_per_block_per_layer * 32,
+                shared_by=["layer_2", "layer_5", "layer_6"],
+            ),
         ],
         kv_cache_groups=[
             KVCacheGroupSpec(["layer_1", "layer_2"], new_kv_cache_spec()),
-            KVCacheGroupSpec(["layer_3", "layer_5"],
-                             new_sliding_window_spec()),
-            KVCacheGroupSpec(["layer_4", "layer_6"],
-                             new_sliding_window_spec()),
+            KVCacheGroupSpec(["layer_3", "layer_5"], new_sliding_window_spec()),
+            KVCacheGroupSpec(["layer_4", "layer_6"], new_sliding_window_spec()),
         ],
     )
 
     # 3 full + 7 sliding, pad to 3 full + 9 sliding
     kv_cache_specs_hybrid = {
-        'layer_1': new_kv_cache_spec(),
-        'layer_2': new_kv_cache_spec(),
-        'layer_3': new_kv_cache_spec(),
-        'layer_4': new_sliding_window_spec(),
-        'layer_5': new_sliding_window_spec(),
-        'layer_6': new_sliding_window_spec(),
-        'layer_7': new_sliding_window_spec(),
-        'layer_8': new_sliding_window_spec(),
-        'layer_9': new_sliding_window_spec(),
-        'layer_10': new_sliding_window_spec(),
+        "layer_1": new_kv_cache_spec(),
+        "layer_2": new_kv_cache_spec(),
+        "layer_3": new_kv_cache_spec(),
+        "layer_4": new_sliding_window_spec(),
+        "layer_5": new_sliding_window_spec(),
+        "layer_6": new_sliding_window_spec(),
+        "layer_7": new_sliding_window_spec(),
+        "layer_8": new_sliding_window_spec(),
+        "layer_9": new_sliding_window_spec(),
+        "layer_10": new_sliding_window_spec(),
     }
     kv_cache_config_hybrid = get_kv_cache_configs(
-        vllm_config, [kv_cache_specs_hybrid],
-        [mem_per_block_per_layer * 3 * 32])[0]
+        vllm_config, [kv_cache_specs_hybrid], [mem_per_block_per_layer * 3 * 32]
+    )[0]
     assert kv_cache_config_hybrid == KVCacheConfig(
         num_blocks=32,
         kv_cache_tensors=[
             KVCacheTensor(
                 size=mem_per_block_per_layer * 32,
-                shared_by=["layer_1", "layer_4", "layer_5", "layer_6"]),
+                shared_by=["layer_1", "layer_4", "layer_5", "layer_6"],
+            ),
             KVCacheTensor(
                 size=mem_per_block_per_layer * 32,
-                shared_by=["layer_2", "layer_7", "layer_8", "layer_9"]),
-            KVCacheTensor(size=mem_per_block_per_layer * 32,
-                          shared_by=["layer_3", "layer_10"]),
+                shared_by=["layer_2", "layer_7", "layer_8", "layer_9"],
+            ),
+            KVCacheTensor(
+                size=mem_per_block_per_layer * 32, shared_by=["layer_3", "layer_10"]
+            ),
         ],
         kv_cache_groups=[
-            KVCacheGroupSpec(["layer_1", "layer_2", "layer_3"],
-                             new_kv_cache_spec()),
-            KVCacheGroupSpec(["layer_4", "layer_7", "layer_10"],
-                             new_sliding_window_spec()),
-            KVCacheGroupSpec(["layer_5", "layer_8"],
-                             new_sliding_window_spec()),
-            KVCacheGroupSpec(["layer_6", "layer_9"],
-                             new_sliding_window_spec()),
+            KVCacheGroupSpec(["layer_1", "layer_2", "layer_3"], new_kv_cache_spec()),
+            KVCacheGroupSpec(
+                ["layer_4", "layer_7", "layer_10"], new_sliding_window_spec()
+            ),
+            KVCacheGroupSpec(["layer_5", "layer_8"], new_sliding_window_spec()),
+            KVCacheGroupSpec(["layer_6", "layer_9"], new_sliding_window_spec()),
         ],
     )
 
     # different hidden size
     kv_cache_specs_hybrid = {
-        'layer_1': new_kv_cache_spec(head_size=128),
-        'layer_2': new_kv_cache_spec(head_size=64),
+        "layer_1": new_kv_cache_spec(head_size=128),
+        "layer_2": new_kv_cache_spec(head_size=64),
     }
     kv_cache_config_hybrid = get_kv_cache_configs(
-        vllm_config, [kv_cache_specs_hybrid],
-        [mem_per_block_per_layer * 3 * 32])[0]
+        vllm_config, [kv_cache_specs_hybrid], [mem_per_block_per_layer * 3 * 32]
+    )[0]
     assert kv_cache_config_hybrid == KVCacheConfig(
         num_blocks=32,
         kv_cache_tensors=[
-            KVCacheTensor(size=mem_per_block_per_layer * 32 * 2,
-                          shared_by=["layer_1"]),
-            KVCacheTensor(size=mem_per_block_per_layer * 32,
-                          shared_by=["layer_2"]),
+            KVCacheTensor(size=mem_per_block_per_layer * 32 * 2, shared_by=["layer_1"]),
+            KVCacheTensor(size=mem_per_block_per_layer * 32, shared_by=["layer_2"]),
         ],
         kv_cache_groups=[
-            KVCacheGroupSpec(["layer_1", "layer_2"],
-                             UniformTypeKVCacheSpecs(
-                                 block_size=16,
-                                 kv_cache_specs=kv_cache_specs_hybrid))
-        ])
+            KVCacheGroupSpec(
+                ["layer_1", "layer_2"],
+                UniformTypeKVCacheSpecs(
+                    block_size=16, kv_cache_specs=kv_cache_specs_hybrid
+                ),
+            )
+        ],
+    )
 
     # Test num_gpu_blocks_override
     vllm_config.cache_config.num_gpu_blocks_override = 16
     kv_cache_config_override_blocks = get_kv_cache_configs(
-        vllm_config, [kv_cache_specs_full],
-        [mem_per_block_per_layer * 2 * 32])[0]
+        vllm_config, [kv_cache_specs_full], [mem_per_block_per_layer * 2 * 32]
+    )[0]
     assert kv_cache_config_override_blocks == KVCacheConfig(
         num_blocks=16,
         kv_cache_tensors=[
-            KVCacheTensor(size=mem_per_block_per_layer * 16,
-                          shared_by=["layer_1"]),
-            KVCacheTensor(size=mem_per_block_per_layer * 16,
-                          shared_by=["layer_2"]),
+            KVCacheTensor(size=mem_per_block_per_layer * 16, shared_by=["layer_1"]),
+            KVCacheTensor(size=mem_per_block_per_layer * 16, shared_by=["layer_2"]),
         ],
-        kv_cache_groups=[
-            KVCacheGroupSpec(["layer_1", "layer_2"], new_kv_cache_spec())
-        ])
+        kv_cache_groups=[KVCacheGroupSpec(["layer_1", "layer_2"], new_kv_cache_spec())],
+    )
 
 
 def test_get_kv_cache_configs_attention_free():
@@ -1340,42 +1427,44 @@ def test_get_kv_cache_configs_attention_free():
 def test_generate_uniform_type_kv_cache_specs():
     # All layers are full attention, can be merged
     kv_cache_specs = {
-        'layer_1': new_kv_cache_spec(),
-        'layer_2': new_kv_cache_spec(head_size=128),
+        "layer_1": new_kv_cache_spec(),
+        "layer_2": new_kv_cache_spec(head_size=128),
     }
     uniform_spec = UniformTypeKVCacheSpecs.from_specs(kv_cache_specs)
     assert uniform_spec == UniformTypeKVCacheSpecs(
-        block_size=16, kv_cache_specs=kv_cache_specs)
+        block_size=16, kv_cache_specs=kv_cache_specs
+    )
 
     # Full attention + sliding window, cannot be merged
     kv_cache_specs = {
-        'layer_1': new_kv_cache_spec(),
-        'layer_2': new_sliding_window_spec(sliding_window=1),
+        "layer_1": new_kv_cache_spec(),
+        "layer_2": new_sliding_window_spec(sliding_window=1),
     }
     uniform_spec = UniformTypeKVCacheSpecs.from_specs(kv_cache_specs)
     assert uniform_spec is None
 
     # different order of full attention + sliding window, cannot be merged
     kv_cache_specs = {
-        'layer_1': new_sliding_window_spec(sliding_window=1),
-        'layer_2': new_kv_cache_spec(),
+        "layer_1": new_sliding_window_spec(sliding_window=1),
+        "layer_2": new_kv_cache_spec(),
     }
     uniform_spec = UniformTypeKVCacheSpecs.from_specs(kv_cache_specs)
     assert uniform_spec is None
 
     # Same-size sliding window, can be merged
     kv_cache_specs = {
-        'layer_1': new_sliding_window_spec(sliding_window=1),
-        'layer_2': new_sliding_window_spec(sliding_window=1, head_size=128),
+        "layer_1": new_sliding_window_spec(sliding_window=1),
+        "layer_2": new_sliding_window_spec(sliding_window=1, head_size=128),
     }
     uniform_spec = UniformTypeKVCacheSpecs.from_specs(kv_cache_specs)
     assert uniform_spec == UniformTypeKVCacheSpecs(
-        block_size=16, kv_cache_specs=kv_cache_specs)
+        block_size=16, kv_cache_specs=kv_cache_specs
+    )
 
     # different block sizes, cannot be merged
     kv_cache_specs = {
-        'layer_1': new_kv_cache_spec(block_size=16),
-        'layer_2': new_kv_cache_spec(block_size=32),
+        "layer_1": new_kv_cache_spec(block_size=16),
+        "layer_2": new_kv_cache_spec(block_size=32),
     }
     uniform_spec = UniformTypeKVCacheSpecs.from_specs(kv_cache_specs)
     assert uniform_spec is None
@@ -1383,38 +1472,39 @@ def test_generate_uniform_type_kv_cache_specs():
 
 def test_generate_scheduler_kv_cache_config():
     kv_cache_specs = {
-        'layer_1': new_kv_cache_spec(),
-        'layer_2': new_kv_cache_spec(head_size=128),
+        "layer_1": new_kv_cache_spec(),
+        "layer_2": new_kv_cache_spec(head_size=128),
     }
     kv_cache_configs = [
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[],
             kv_cache_groups=[
-                KVCacheGroupSpec(['layer_1', 'layer_2'],
-                                 UniformTypeKVCacheSpecs(
-                                     block_size=16,
-                                     kv_cache_specs=kv_cache_specs)),
+                KVCacheGroupSpec(
+                    ["layer_1", "layer_2"],
+                    UniformTypeKVCacheSpecs(
+                        block_size=16, kv_cache_specs=kv_cache_specs
+                    ),
+                ),
             ],
         )
     ]
-    scheduler_kv_cache_config = generate_scheduler_kv_cache_config(
-        kv_cache_configs)
+    scheduler_kv_cache_config = generate_scheduler_kv_cache_config(kv_cache_configs)
     assert scheduler_kv_cache_config == KVCacheConfig(
         num_blocks=10,
         kv_cache_tensors=[],
-        kv_cache_groups=[
-            KVCacheGroupSpec(['layer_1', 'layer_2'], new_kv_cache_spec())
-        ],
+        kv_cache_groups=[KVCacheGroupSpec(["layer_1", "layer_2"], new_kv_cache_spec())],
     )
 
 
 def new_mla_spec(cache_dtype_str=None):
-    return MLAAttentionSpec(block_size=16,
-                            num_kv_heads=16,
-                            head_size=64,
-                            dtype=torch.float32,
-                            cache_dtype_str=cache_dtype_str)
+    return MLAAttentionSpec(
+        block_size=16,
+        num_kv_heads=16,
+        head_size=64,
+        dtype=torch.float32,
+        cache_dtype_str=cache_dtype_str,
+    )
 
 
 def test_merge_mla_spec():
diff --git a/tests/v1/core/test_kv_sharing.py b/tests/v1/core/test_kv_sharing.py
index 31a74101faf9..328f2640f218 100644
--- a/tests/v1/core/test_kv_sharing.py
+++ b/tests/v1/core/test_kv_sharing.py
@@ -26,8 +26,7 @@ def test_initialize_kv_cache_for_kv_sharing_different_attn_groups():
     # However, if they have different attention backends, they will be
     # placed in different attention groups for KV cache group 0
     kv_cache_groups = [
-        KVCacheGroupSpec(["model.layers.0", "model.layers.1"],
-                         new_kv_cache_spec()),
+        KVCacheGroupSpec(["model.layers.0", "model.layers.1"], new_kv_cache_spec()),
     ]
 
     add_kv_sharing_layers_to_kv_cache_groups(
@@ -38,7 +37,10 @@ def test_initialize_kv_cache_for_kv_sharing_different_attn_groups():
     # Check that the layers were added to the correct KV cache group
     assert len(kv_cache_groups) == 1
     assert kv_cache_groups[0].layer_names == [
-        "model.layers.0", "model.layers.1", "model.layers.2", "model.layers.3"
+        "model.layers.0",
+        "model.layers.1",
+        "model.layers.2",
+        "model.layers.3",
     ]
 
 
@@ -53,8 +55,7 @@ def test_initialize_kv_cache_for_kv_sharing_same_attn_groups():
     }
 
     kv_cache_groups = [
-        KVCacheGroupSpec(["model.layers.0", "model.layers.1"],
-                         new_kv_cache_spec()),
+        KVCacheGroupSpec(["model.layers.0", "model.layers.1"], new_kv_cache_spec()),
     ]
 
     add_kv_sharing_layers_to_kv_cache_groups(
@@ -65,14 +66,17 @@ def test_initialize_kv_cache_for_kv_sharing_same_attn_groups():
     # Check that the layers were added to the correct KV cache group
     assert len(kv_cache_groups) == 1
     assert kv_cache_groups[0].layer_names == [
-        "model.layers.0", "model.layers.1", "model.layers.2", "model.layers.3"
+        "model.layers.0",
+        "model.layers.1",
+        "model.layers.2",
+        "model.layers.3",
     ]
 
 
 def test_initialize_kv_cache_for_kv_sharing_no_attn_groups():
     """
     Test KV sharing set up when no attention groups are provided.
-    This is the case for the TPU model runner, which doesn't have 
+    This is the case for the TPU model runner, which doesn't have
     support for attention groups yet.
     """
     shared_kv_cache_layers = {
@@ -92,9 +96,5 @@ def test_initialize_kv_cache_for_kv_sharing_no_attn_groups():
 
     # Check that the layers were added to the correct KV cache group
     assert len(kv_cache_groups) == 2
-    assert kv_cache_groups[0].layer_names == [
-        "model.layers.0", "model.layers.2"
-    ]
-    assert kv_cache_groups[1].layer_names == [
-        "model.layers.1", "model.layers.3"
-    ]
+    assert kv_cache_groups[0].layer_names == ["model.layers.0", "model.layers.2"]
+    assert kv_cache_groups[1].layer_names == ["model.layers.1", "model.layers.3"]
diff --git a/tests/v1/core/test_prefix_caching.py b/tests/v1/core/test_prefix_caching.py
index 93ad4d8080e6..d08c1bcc57bd 100644
--- a/tests/v1/core/test_prefix_caching.py
+++ b/tests/v1/core/test_prefix_caching.py
@@ -10,20 +10,32 @@
 
 import vllm.v1.core.kv_cache_utils as kv_cache_utils
 from vllm.distributed.kv_events import AllBlocksCleared, BlockRemoved
-from vllm.multimodal.inputs import (MultiModalFeatureSpec,
-                                    MultiModalKwargsItem, PlaceholderRange)
+from vllm.multimodal.inputs import (
+    MultiModalFeatureSpec,
+    MultiModalKwargsItem,
+    PlaceholderRange,
+)
 from vllm.sampling_params import SamplingParams
 from vllm.utils import sha256, sha256_cbor
 from vllm.v1.core.block_pool import BlockHashToBlockMap, BlockPool
 from vllm.v1.core.kv_cache_manager import KVCacheManager, Request
-from vllm.v1.core.kv_cache_utils import (BlockHash, BlockHashWithGroupId,
-                                         KVCacheBlock, get_block_hash,
-                                         get_group_id,
-                                         get_request_block_hasher,
-                                         hash_block_tokens, init_none_hash,
-                                         make_block_hash_with_group_id)
-from vllm.v1.kv_cache_interface import (FullAttentionSpec, KVCacheConfig,
-                                        KVCacheGroupSpec, SlidingWindowSpec)
+from vllm.v1.core.kv_cache_utils import (
+    BlockHash,
+    BlockHashWithGroupId,
+    KVCacheBlock,
+    get_block_hash,
+    get_group_id,
+    get_request_block_hasher,
+    hash_block_tokens,
+    init_none_hash,
+    make_block_hash_with_group_id,
+)
+from vllm.v1.kv_cache_interface import (
+    FullAttentionSpec,
+    KVCacheConfig,
+    KVCacheGroupSpec,
+    SlidingWindowSpec,
+)
 
 pytestmark = pytest.mark.cpu_test
 
@@ -56,19 +68,21 @@ def make_request(
                 data=MultiModalKwargsItem.dummy("dummy_m"),
                 mm_position=position,
                 identifier=identifier,
-                modality="image")
+                modality="image",
+            )
             mm_features.append(mm_feature)
 
-    return Request(request_id=request_id,
-                   prompt_token_ids=prompt_token_ids,
-                   mm_features=mm_features if mm_features else None,
-                   sampling_params=SamplingParams(
-                       max_tokens=17, prompt_logprobs=prompt_logprobs),
-                   pooling_params=None,
-                   eos_token_id=100,
-                   lora_request=None,
-                   cache_salt=cache_salt,
-                   block_hasher=get_request_block_hasher(block_size, hash_fn))
+    return Request(
+        request_id=request_id,
+        prompt_token_ids=prompt_token_ids,
+        mm_features=mm_features if mm_features else None,
+        sampling_params=SamplingParams(max_tokens=17, prompt_logprobs=prompt_logprobs),
+        pooling_params=None,
+        eos_token_id=100,
+        lora_request=None,
+        cache_salt=cache_salt,
+        block_hasher=get_request_block_hasher(block_size, hash_fn),
+    )
 
 
 def make_kv_cache_config(block_size: int, num_blocks: int) -> KVCacheConfig:
@@ -84,8 +98,9 @@ def make_kv_cache_config(block_size: int, num_blocks: int) -> KVCacheConfig:
     )
 
 
-def make_kv_cache_config_hybrid_model(block_size: int,
-                                      num_blocks: int) -> KVCacheConfig:
+def make_kv_cache_config_hybrid_model(
+    block_size: int, num_blocks: int
+) -> KVCacheConfig:
     return KVCacheConfig(
         num_blocks=num_blocks,
         kv_cache_tensors=[],
@@ -96,19 +111,15 @@ def make_kv_cache_config_hybrid_model(block_size: int,
             ),
             KVCacheGroupSpec(
                 ["layer2"],
-                SlidingWindowSpec(block_size,
-                                  1,
-                                  1,
-                                  torch.float32,
-                                  sliding_window=2 * block_size),
+                SlidingWindowSpec(
+                    block_size, 1, 1, torch.float32, sliding_window=2 * block_size
+                ),
             ),
             KVCacheGroupSpec(
                 ["layer3"],
-                SlidingWindowSpec(block_size,
-                                  1,
-                                  1,
-                                  torch.float32,
-                                  sliding_window=2 * block_size),
+                SlidingWindowSpec(
+                    block_size, 1, 1, torch.float32, sliding_window=2 * block_size
+                ),
             ),
         ],
     )
@@ -116,7 +127,6 @@ def make_kv_cache_config_hybrid_model(block_size: int,
 
 @pytest.mark.parametrize("hash_fn", [sha256, sha256_cbor])
 def test_prefill(hash_fn):
-
     block_size = 16
     manager = KVCacheManager(
         make_kv_cache_config(block_size, 11),
@@ -136,17 +146,16 @@ def test_prefill(hash_fn):
     assert len(req0.block_hashes) == 3
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    blocks = manager.allocate_slots(req0, 55,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
-    assert blocks is not None and blocks.get_block_ids() == ([1, 2, 3, 4], )
+    blocks = manager.allocate_slots(
+        req0, 55, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
+    assert blocks is not None and blocks.get_block_ids() == ([1, 2, 3, 4],)
 
     # Check full block metadata
     parent_block_hash = None
     for block_id in (1, 2, 3):
-        block_tokens = tuple(all_token_ids[(block_id - 1) * 16:block_id * 16])
-        block_hash = hash_block_tokens(hash_fn, parent_block_hash,
-                                       block_tokens)
+        block_tokens = tuple(all_token_ids[(block_id - 1) * 16 : block_id * 16])
+        block_hash = hash_block_tokens(hash_fn, parent_block_hash, block_tokens)
         blk_hash = manager.block_pool.blocks[block_id].block_hash
         assert blk_hash is not None
         assert get_block_hash(blk_hash) == block_hash
@@ -155,24 +164,23 @@ def test_prefill(hash_fn):
         parent_block_hash = block_hash
 
     # Check partial block metadata
-    for block_id in (4, ):
+    for block_id in (4,):
         assert manager.block_pool.blocks[block_id].block_hash is None
         assert manager.block_pool.blocks[block_id].ref_cnt == 1
 
     # Cache hit in the common prefix when the original block is still in use.
     # Incomplete 1 block (5 tokens)
     unique_token_ids = [3] * 5
-    req1 = make_request("1", common_token_ids + unique_token_ids, block_size,
-                        hash_fn)
+    req1 = make_request("1", common_token_ids + unique_token_ids, block_size, hash_fn)
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req1)
     assert len(req1.block_hashes) == 3
-    assert computed_blocks.get_block_ids() == ([1, 2, 3], )
+    assert computed_blocks.get_block_ids() == ([1, 2, 3],)
     assert num_computed_tokens == 3 * 16
     num_new_tokens = 53 - 3 * 16
-    blocks = manager.allocate_slots(req1, num_new_tokens,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
-    assert blocks is not None and blocks.get_block_ids() == ([5], )
+    blocks = manager.allocate_slots(
+        req1, num_new_tokens, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
+    assert blocks is not None and blocks.get_block_ids() == ([5],)
     for block in computed_blocks.blocks[0]:
         assert block.ref_cnt == 2
 
@@ -191,30 +199,27 @@ def test_prefill(hash_fn):
     # [unique_req1 (5)]
     # [common (3, 2, 1)]
     assert [
-        b.block_id
-        for b in manager.block_pool.free_block_queue.get_all_free_blocks()
+        b.block_id for b in manager.block_pool.free_block_queue.get_all_free_blocks()
     ] == [6, 7, 8, 9, 10, 4, 5, 3, 2, 1]
 
     # Cache hit in the common prefix when the original block is already free.
     # Incomplete 1 block (6 tokens)
     unique_token_ids = [3] * 6
-    req2 = make_request("2", common_token_ids + unique_token_ids, block_size,
-                        hash_fn)
+    req2 = make_request("2", common_token_ids + unique_token_ids, block_size, hash_fn)
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req2)
     assert len(req2.block_hashes) == 3
-    assert computed_blocks.get_block_ids() == ([1, 2, 3], )
+    assert computed_blocks.get_block_ids() == ([1, 2, 3],)
     assert num_computed_tokens == 3 * 16
     num_new_tokens = 53 - 3 * 16
-    blocks = manager.allocate_slots(req2, num_new_tokens,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
-    assert blocks is not None and blocks.get_block_ids() == ([6], )
+    blocks = manager.allocate_slots(
+        req2, num_new_tokens, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
+    assert blocks is not None and blocks.get_block_ids() == ([6],)
 
     # Although we only have 6 free blocks, we have 8 blocks in
     # the free block queue due to lazy removal.
     assert free_block_queue.num_free_blocks == 6
-    assert all(
-        [b.ref_cnt == 0 for b in free_block_queue.get_all_free_blocks()])
+    assert all([b.ref_cnt == 0 for b in free_block_queue.get_all_free_blocks()])
     assert len([b for b in free_block_queue.get_all_free_blocks()]) == 6
 
     manager.free(req2)
@@ -224,19 +229,23 @@ def test_prefill(hash_fn):
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req3)
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    blocks = manager.allocate_slots(req3, 16 * 10,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
+    blocks = manager.allocate_slots(
+        req3, 16 * 10, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     # This block ID order also checks the eviction order.
-    assert blocks is not None and blocks.get_block_ids() == ([
-        7, 8, 9, 10, 4, 5, 6, 3, 2, 1
-    ], )
+    assert blocks is not None and blocks.get_block_ids() == (
+        [7, 8, 9, 10, 4, 5, 6, 3, 2, 1],
+    )
 
     assert free_block_queue.num_free_blocks == 0
-    assert (free_block_queue.fake_free_list_head.next_free_block
-            is free_block_queue.fake_free_list_tail)
-    assert (free_block_queue.fake_free_list_tail.prev_free_block
-            is free_block_queue.fake_free_list_head)
+    assert (
+        free_block_queue.fake_free_list_head.next_free_block
+        is free_block_queue.fake_free_list_tail
+    )
+    assert (
+        free_block_queue.fake_free_list_tail.prev_free_block
+        is free_block_queue.fake_free_list_head
+    )
 
 
 def test_prefill_hybrid_model():
@@ -261,20 +270,20 @@ def test_prefill_hybrid_model():
     assert len(req0.block_hashes) == 3
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    blocks = manager.allocate_slots(req0, 55,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
-    assert blocks is not None and blocks.get_block_ids() == ([1, 2, 3, 4], [
-        5, 6, 7, 8
-    ], [9, 10, 11, 12])
+    blocks = manager.allocate_slots(
+        req0, 55, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
+    assert blocks is not None and blocks.get_block_ids() == (
+        [1, 2, 3, 4],
+        [5, 6, 7, 8],
+        [9, 10, 11, 12],
+    )
 
     # Check full block metadata
     parent_block_hash = None
-    for length, block_ids in zip((1, 2, 3),
-                                 ((1, 5, 9), (2, 6, 10), (3, 7, 11))):
-        block_tokens = tuple(all_token_ids[(length - 1) * 16:length * 16])
-        block_hash = hash_block_tokens(hash_fn, parent_block_hash,
-                                       block_tokens)
+    for length, block_ids in zip((1, 2, 3), ((1, 5, 9), (2, 6, 10), (3, 7, 11))):
+        block_tokens = tuple(all_token_ids[(length - 1) * 16 : length * 16])
+        block_hash = hash_block_tokens(hash_fn, parent_block_hash, block_tokens)
         for group_id, block_id in enumerate(block_ids):
             blk_hash = manager.block_pool.blocks[block_id].block_hash
             assert blk_hash is not None
@@ -291,17 +300,15 @@ def test_prefill_hybrid_model():
     # Cache hit in the common prefix
     # Incomplete 1 block (5 tokens)
     unique_token_ids = [3] * 5
-    req1 = make_request("1", common_token_ids + unique_token_ids, block_size,
-                        hash_fn)
+    req1 = make_request("1", common_token_ids + unique_token_ids, block_size, hash_fn)
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req1)
     assert len(req1.block_hashes) == 3
-    assert computed_blocks.get_block_ids() == ([1, 2, 3], [0, 6,
-                                                           7], [0, 10, 11])
+    assert computed_blocks.get_block_ids() == ([1, 2, 3], [0, 6, 7], [0, 10, 11])
     assert num_computed_tokens == 3 * 16
     num_new_tokens = 53 - 3 * 16
-    blocks = manager.allocate_slots(req1, num_new_tokens,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
+    blocks = manager.allocate_slots(
+        req1, num_new_tokens, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert blocks is not None and blocks.get_block_ids() == ([13], [14], [15])
     for block_per_group in computed_blocks.blocks:
         for block in block_per_group:
@@ -313,55 +320,70 @@ def test_prefill_hybrid_model():
     manager.free(req1)
 
     cached_block_hash_to_block_bak = copy.copy(
-        manager.block_pool.cached_block_hash_to_block._cache)
+        manager.block_pool.cached_block_hash_to_block._cache
+    )
 
-    def test_partial_request_hit(request_id: str,
-                                 hash_to_evict: list[BlockHashWithGroupId],
-                                 expect_hit_length: int):
-        req = make_request(request_id, common_token_ids + unique_token_ids,
-                           block_size, sha256)
+    def test_partial_request_hit(
+        request_id: str,
+        hash_to_evict: list[BlockHashWithGroupId],
+        expect_hit_length: int,
+    ):
+        req = make_request(
+            request_id, common_token_ids + unique_token_ids, block_size, sha256
+        )
         for hash_with_group_id in hash_to_evict:
-            manager.block_pool.cached_block_hash_to_block._cache.pop(
-                hash_with_group_id)
+            manager.block_pool.cached_block_hash_to_block._cache.pop(hash_with_group_id)
         computed_blocks, num_computed_tokens = manager.get_computed_blocks(req)
         assert len(req.block_hashes) == 3
         assert num_computed_tokens == expect_hit_length * block_size
         for block_per_group in computed_blocks.blocks:
             assert len(block_per_group) == num_computed_tokens // block_size
         for hash_with_group_id in hash_to_evict:
-            manager.block_pool.cached_block_hash_to_block._cache[
-                hash_with_group_id] = cached_block_hash_to_block_bak[
-                    hash_with_group_id]
+            manager.block_pool.cached_block_hash_to_block._cache[hash_with_group_id] = (
+                cached_block_hash_to_block_bak[hash_with_group_id]
+            )
         manager.free(req)
 
     # Evict the blocks outside sliding window, does not affect the hit length.
-    test_partial_request_hit("2", [
-        make_block_hash_with_group_id(block_hashes[0], 1),
-        make_block_hash_with_group_id(block_hashes[0], 2)
-    ], 3)
+    test_partial_request_hit(
+        "2",
+        [
+            make_block_hash_with_group_id(block_hashes[0], 1),
+            make_block_hash_with_group_id(block_hashes[0], 2),
+        ],
+        3,
+    )
 
     # Evict the first block of full attention, makes total cache miss.
     test_partial_request_hit(
-        "3", [make_block_hash_with_group_id(block_hashes[0], 0)], 0)
+        "3", [make_block_hash_with_group_id(block_hashes[0], 0)], 0
+    )
 
     # Evict the last block of all layers, reduces the hit length to 2.
-    test_partial_request_hit("4", [
-        make_block_hash_with_group_id(block_hashes[2], 0),
-        make_block_hash_with_group_id(block_hashes[2], 1),
-        make_block_hash_with_group_id(block_hashes[2], 2),
-    ], 2)
+    test_partial_request_hit(
+        "4",
+        [
+            make_block_hash_with_group_id(block_hashes[2], 0),
+            make_block_hash_with_group_id(block_hashes[2], 1),
+            make_block_hash_with_group_id(block_hashes[2], 2),
+        ],
+        2,
+    )
 
     # Evict the last block of full attention, reduces the hit length to 2.
     test_partial_request_hit(
-        "5", [make_block_hash_with_group_id(block_hashes[2], 0)], 2)
+        "5", [make_block_hash_with_group_id(block_hashes[2], 0)], 2
+    )
 
     # Evict the last block of sliding window, reduces the hit length to 2.
     test_partial_request_hit(
-        "6", [make_block_hash_with_group_id(block_hashes[2], 1)], 2)
+        "6", [make_block_hash_with_group_id(block_hashes[2], 1)], 2
+    )
 
     # Evict the last block of sliding window, reduces the hit length to 2.
     test_partial_request_hit(
-        "7", [make_block_hash_with_group_id(block_hashes[2], 2)], 2)
+        "7", [make_block_hash_with_group_id(block_hashes[2], 2)], 2
+    )
 
     # Evict different set of blocks for full attention and sliding window makes
     # total cache miss.
@@ -369,20 +391,24 @@ def test_partial_request_hit(request_id: str,
     # The cache hit length of sliding window is 2 * block_size.
     # Then it is cache miss as the two type of layers
     # have different hit length.
-    test_partial_request_hit("8", [
-        make_block_hash_with_group_id(block_hashes[2], 0),
-        make_block_hash_with_group_id(block_hashes[0], 1),
-        make_block_hash_with_group_id(block_hashes[0], 2),
-    ], 0)
+    test_partial_request_hit(
+        "8",
+        [
+            make_block_hash_with_group_id(block_hashes[2], 0),
+            make_block_hash_with_group_id(block_hashes[0], 1),
+            make_block_hash_with_group_id(block_hashes[0], 2),
+        ],
+        0,
+    )
 
 
 def test_prefill_plp():
-    '''Test prefill with APC and some prompt logprobs (plp) requests.
+    """Test prefill with APC and some prompt logprobs (plp) requests.
 
     1. Schedule plp request and validate APC block allocation
     2. Schedule non-plp request and validate blocks
     3. Schedule plp request; no hit should occur; validate blocks
-    '''
+    """
     block_size = 16
     manager = KVCacheManager(
         make_kv_cache_config(block_size, 11),
@@ -400,28 +426,23 @@ def test_prefill_plp():
     # Incomplete 1 block (7 tokens)
     unique_token_ids = [3] * 7
     all_token_ids = common_token_ids + unique_token_ids
-    req0 = make_request("0",
-                        all_token_ids,
-                        block_size,
-                        hash_fn,
-                        prompt_logprobs=5)
+    req0 = make_request("0", all_token_ids, block_size, hash_fn, prompt_logprobs=5)
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req0)
     assert len(req0.block_hashes) == 3
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    blocks = manager.allocate_slots(req0, 55,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
-    assert blocks is not None and blocks.get_block_ids() == ([1, 2, 3, 4], )
+    blocks = manager.allocate_slots(
+        req0, 55, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
+    assert blocks is not None and blocks.get_block_ids() == ([1, 2, 3, 4],)
     req0_block_hashes = [b.block_hash for b in blocks.blocks[0]]
 
     # Check full block metadata
     parent_block_hash = None
     for block_id in (1, 2, 3):
-        block_tokens = tuple(all_token_ids[(block_id - 1) * 16:block_id * 16])
-        block_hash = hash_block_tokens(hash_fn, parent_block_hash,
-                                       block_tokens)
-        blk_hash = (manager.block_pool.blocks[block_id].block_hash)
+        block_tokens = tuple(all_token_ids[(block_id - 1) * 16 : block_id * 16])
+        block_hash = hash_block_tokens(hash_fn, parent_block_hash, block_tokens)
+        blk_hash = manager.block_pool.blocks[block_id].block_hash
         assert blk_hash is not None
         assert get_block_hash(blk_hash) == block_hash
         assert get_group_id(blk_hash) == 0
@@ -429,7 +450,7 @@ def test_prefill_plp():
         parent_block_hash = block_hash
 
     # Check partial block metadata
-    for block_id in (4, ):
+    for block_id in (4,):
         assert manager.block_pool.blocks[block_id].block_hash is None
         assert manager.block_pool.blocks[block_id].ref_cnt == 1
 
@@ -437,17 +458,16 @@ def test_prefill_plp():
     # Cache hit in the common prefix when the original block is still in use.
     # Incomplete 1 block (5 tokens)
     unique_token_ids = [3] * 5
-    req1 = make_request("1", common_token_ids + unique_token_ids, block_size,
-                        hash_fn)
+    req1 = make_request("1", common_token_ids + unique_token_ids, block_size, hash_fn)
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req1)
     assert len(req1.block_hashes) == 3
-    assert computed_blocks.get_block_ids() == ([1, 2, 3], )
+    assert computed_blocks.get_block_ids() == ([1, 2, 3],)
     assert num_computed_tokens == 3 * 16
     num_new_tokens = 53 - 3 * 16
-    blocks = manager.allocate_slots(req1, num_new_tokens,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
-    assert blocks is not None and blocks.get_block_ids() == ([5], )
+    blocks = manager.allocate_slots(
+        req1, num_new_tokens, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
+    assert blocks is not None and blocks.get_block_ids() == ([5],)
     for block in computed_blocks.blocks[0]:
         assert block.ref_cnt == 2
 
@@ -465,30 +485,27 @@ def test_prefill_plp():
     # [unique_req1 (5)]
     # [common (3, 2, 1)]
     assert [
-        b.block_id
-        for b in manager.block_pool.free_block_queue.get_all_free_blocks()
+        b.block_id for b in manager.block_pool.free_block_queue.get_all_free_blocks()
     ] == [6, 7, 8, 9, 10, 4, 5, 3, 2, 1]
 
     # Request #2 is a prompt-logprobs request:
     # NO cache hit in the common prefix; duplicates request #0 cached blocks
     unique_token_ids = [3] * 6
-    req2 = make_request("2",
-                        common_token_ids + unique_token_ids,
-                        block_size,
-                        hash_fn,
-                        prompt_logprobs=5)
+    req2 = make_request(
+        "2", common_token_ids + unique_token_ids, block_size, hash_fn, prompt_logprobs=5
+    )
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req2)
     assert len(req2.block_hashes) == 3
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    blocks = manager.allocate_slots(req2, 55,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
+    blocks = manager.allocate_slots(
+        req2, 55, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert blocks is not None
     block_ids = blocks.get_block_ids()
     # Duplicate cached blocks have different ids but same hashes vs request #0
     assert [b.block_hash for b in blocks.blocks[0]] == req0_block_hashes
-    assert block_ids != ([1, 2, 3, 4], )
+    assert block_ids != ([1, 2, 3, 4],)
 
     # Request #2 block hashes are valid since request #0 hashes are.
     # Check block reference counts.
@@ -512,26 +529,29 @@ def test_decode():
     # Fully cache miss
     # Incomplete 1 block (7 tokens)
     unique_token_ids = [3] * 7
-    req0 = make_request("0", common_token_ids + unique_token_ids, block_size,
-                        sha256)
+    req0 = make_request("0", common_token_ids + unique_token_ids, block_size, sha256)
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req0)
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    blocks = manager.allocate_slots(req0, 55,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
-    assert blocks is not None and blocks.get_block_ids() == ([1, 2, 3, 4], )
+    blocks = manager.allocate_slots(
+        req0, 55, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
+    assert blocks is not None and blocks.get_block_ids() == ([1, 2, 3, 4],)
 
     # Append slots without allocating a new block.
     req0.num_computed_tokens = 55
     for _ in range(4):
         req0.append_output_token_ids(8)
-    new_blocks = manager.allocate_slots(req0, 4,
-                                        len(computed_blocks.blocks[0]) * 16,
-                                        computed_blocks)
+    new_blocks = manager.allocate_slots(
+        req0, 4, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert new_blocks is not None and len(new_blocks.blocks[0]) == 0
-    assert manager.coordinator.single_type_managers[0].req_to_blocks[
-        req0.request_id][-1].block_hash is None
+    assert (
+        manager.coordinator.single_type_managers[0]
+        .req_to_blocks[req0.request_id][-1]
+        .block_hash
+        is None
+    )
 
     # Append slots with allocating a new block.
     req0.num_computed_tokens = 59
@@ -539,14 +559,22 @@ def test_decode():
     # the preallocated block.
     for _ in range(9 + 10):
         req0.append_output_token_ids(7)
-    new_blocks = manager.allocate_slots(req0, 19,
-                                        len(computed_blocks.blocks[0]) * 16,
-                                        computed_blocks)
+    new_blocks = manager.allocate_slots(
+        req0, 19, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert new_blocks is not None and len(new_blocks.blocks[0]) == 1
-    assert manager.coordinator.single_type_managers[0].req_to_blocks[
-        req0.request_id][-2].block_hash is not None
-    assert manager.coordinator.single_type_managers[0].req_to_blocks[
-        req0.request_id][-1].block_hash is None
+    assert (
+        manager.coordinator.single_type_managers[0]
+        .req_to_blocks[req0.request_id][-2]
+        .block_hash
+        is not None
+    )
+    assert (
+        manager.coordinator.single_type_managers[0]
+        .req_to_blocks[req0.request_id][-1]
+        .block_hash
+        is None
+    )
 
 
 def test_evict():
@@ -562,22 +590,22 @@ def test_evict():
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req0)
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    blocks = manager.allocate_slots(req0, 5 * 16 + 7,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
+    blocks = manager.allocate_slots(
+        req0, 5 * 16 + 7, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     # 5 full + 1 partial
     assert blocks is not None and len(blocks.blocks[0]) == 6
 
     # 3 blocks.
-    req1 = make_request("1", list(range(last_token_id,
-                                        last_token_id + 3 * 16)), block_size,
-                        sha256)
+    req1 = make_request(
+        "1", list(range(last_token_id, last_token_id + 3 * 16)), block_size, sha256
+    )
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req1)
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    blocks = manager.allocate_slots(req1, 3 * 16,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
+    blocks = manager.allocate_slots(
+        req1, 3 * 16, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert blocks is not None and len(blocks.blocks[0]) == 3  # 3 full blocks
     last_token_id += 3 * 16
 
@@ -588,19 +616,18 @@ def test_evict():
     manager.free(req1)
     assert manager.block_pool.free_block_queue.num_free_blocks == 10
     assert [
-        b.block_id
-        for b in manager.block_pool.free_block_queue.get_all_free_blocks()
+        b.block_id for b in manager.block_pool.free_block_queue.get_all_free_blocks()
     ] == [10, 6, 5, 4, 3, 2, 1, 9, 8, 7]
 
     # Touch the first 2 blocks.
     req2 = make_request("2", list(range(2 * 16 + 3)), block_size, sha256)
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req2)
-    assert computed_blocks.get_block_ids() == ([1, 2], )
+    assert computed_blocks.get_block_ids() == ([1, 2],)
     assert num_computed_tokens == 2 * 16
-    blocks = manager.allocate_slots(req2, 3,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
-    assert blocks is not None and blocks.get_block_ids() == ([10], )
+    blocks = manager.allocate_slots(
+        req2, 3, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
+    assert blocks is not None and blocks.get_block_ids() == ([10],)
     assert manager.block_pool.free_block_queue.num_free_blocks == 7
 
 
@@ -622,9 +649,9 @@ def test_hash_block_correct_reuse():
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req)
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    blocks = manager.allocate_slots(req, num_tokens,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
+    blocks = manager.allocate_slots(
+        req, num_tokens, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert blocks is not None and len(blocks.blocks[0]) == 1
 
     # Deallocate the block.
@@ -636,13 +663,12 @@ def test_hash_block_correct_reuse():
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req)
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    blocks = manager.allocate_slots(req, num_tokens - 1,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
+    blocks = manager.allocate_slots(
+        req, num_tokens - 1, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert blocks is not None and len(blocks.blocks[0]) == 1
 
-    assert manager.block_pool.blocks[blocks.blocks[0]
-                                     [0].block_id].block_hash is None
+    assert manager.block_pool.blocks[blocks.blocks[0][0].block_id].block_hash is None
 
 
 def test_computed_blocks_not_evicted():
@@ -663,21 +689,22 @@ def test_computed_blocks_not_evicted():
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req0)
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    blocks = manager.allocate_slots(req0, num_tokens,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
+    blocks = manager.allocate_slots(
+        req0, num_tokens, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert blocks is not None and len(blocks.blocks[0]) == 1
     assert blocks.blocks[0][0].block_id == 1
 
     # Allocate another block.
-    req1 = make_request("1", list(range(num_tokens, num_tokens * 2)),
-                        block_size, sha256)
+    req1 = make_request(
+        "1", list(range(num_tokens, num_tokens * 2)), block_size, sha256
+    )
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req1)
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    blocks = manager.allocate_slots(req1, num_tokens,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
+    blocks = manager.allocate_slots(
+        req1, num_tokens, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert blocks is not None and len(blocks.blocks[0]) == 1
     assert blocks.blocks[0][0].block_id == 2
 
@@ -693,9 +720,12 @@ def test_computed_blocks_not_evicted():
     assert computed_blocks.blocks[0][0].block_id == 1
     assert num_computed_tokens == block_size
 
-    blocks = manager.allocate_slots(req2, num_tokens * 2 - num_tokens,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
+    blocks = manager.allocate_slots(
+        req2,
+        num_tokens * 2 - num_tokens,
+        len(computed_blocks.blocks[0]) * 16,
+        computed_blocks,
+    )
     assert blocks is not None and len(blocks.blocks[0]) == 1
     assert blocks.blocks[0][0].block_id == 2
 
@@ -711,29 +741,29 @@ def test_basic_prefix_caching_disabled():
         enable_caching=False,
     )
 
-    req1 = make_request("1", list(range(10)), block_size,
-                        sha256)  # 2 blocks and some more
+    req1 = make_request(
+        "1", list(range(10)), block_size, sha256
+    )  # 2 blocks and some more
 
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req1)
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    blocks = manager.allocate_slots(req1, 10,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
+    blocks = manager.allocate_slots(
+        req1, 10, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert blocks is not None and len(blocks.blocks[0]) == 3
 
     # Free the blocks.
     manager.free(req1)
 
     # No caching.
-    req2 = make_request("2", list(range(16)), block_size,
-                        sha256)  # shared prefix
+    req2 = make_request("2", list(range(16)), block_size, sha256)  # shared prefix
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req2)
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    blocks = manager.allocate_slots(req2, 16,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
+    blocks = manager.allocate_slots(
+        req2, 16, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert blocks is not None and len(blocks.blocks[0]) == 4
 
     # New requests should not have any blocks.
@@ -741,9 +771,9 @@ def test_basic_prefix_caching_disabled():
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req3)
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    blocks = manager.allocate_slots(req3, 4,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
+    blocks = manager.allocate_slots(
+        req3, 4, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert not blocks
 
 
@@ -842,24 +872,41 @@ def test_cache_blocks_multi_group():
     # Block hash 1: hit for group 0 and 1
     # Block hash 2: hit for group 1
 
-    assert block_pool.get_cached_block(req.block_hashes[0],
-                                       kv_cache_group_ids=[0]) is not None
-    assert block_pool.get_cached_block(req.block_hashes[1],
-                                       kv_cache_group_ids=[0]) is not None
-    assert block_pool.get_cached_block(req.block_hashes[2],
-                                       kv_cache_group_ids=[0]) is None
-    assert block_pool.get_cached_block(req.block_hashes[0],
-                                       kv_cache_group_ids=[1]) is not None
-    assert block_pool.get_cached_block(req.block_hashes[1],
-                                       kv_cache_group_ids=[1]) is not None
-    assert block_pool.get_cached_block(req.block_hashes[2],
-                                       kv_cache_group_ids=[1]) is not None
-    assert block_pool.get_cached_block(req.block_hashes[0],
-                                       kv_cache_group_ids=[0, 1]) is not None
-    assert block_pool.get_cached_block(req.block_hashes[1],
-                                       kv_cache_group_ids=[0, 1]) is not None
-    assert block_pool.get_cached_block(req.block_hashes[2],
-                                       kv_cache_group_ids=[0, 1]) is None
+    assert (
+        block_pool.get_cached_block(req.block_hashes[0], kv_cache_group_ids=[0])
+        is not None
+    )
+    assert (
+        block_pool.get_cached_block(req.block_hashes[1], kv_cache_group_ids=[0])
+        is not None
+    )
+    assert (
+        block_pool.get_cached_block(req.block_hashes[2], kv_cache_group_ids=[0]) is None
+    )
+    assert (
+        block_pool.get_cached_block(req.block_hashes[0], kv_cache_group_ids=[1])
+        is not None
+    )
+    assert (
+        block_pool.get_cached_block(req.block_hashes[1], kv_cache_group_ids=[1])
+        is not None
+    )
+    assert (
+        block_pool.get_cached_block(req.block_hashes[2], kv_cache_group_ids=[1])
+        is not None
+    )
+    assert (
+        block_pool.get_cached_block(req.block_hashes[0], kv_cache_group_ids=[0, 1])
+        is not None
+    )
+    assert (
+        block_pool.get_cached_block(req.block_hashes[1], kv_cache_group_ids=[0, 1])
+        is not None
+    )
+    assert (
+        block_pool.get_cached_block(req.block_hashes[2], kv_cache_group_ids=[0, 1])
+        is None
+    )
 
 
 def test_mm_prefix_caching():
@@ -889,16 +936,16 @@ def test_mm_prefix_caching():
     # A unique image plus some text tokens.
     unique_token_ids = [-1] * 7 + [100] * 4
     all_token_ids = common_token_ids + unique_token_ids
-    mm_positions = common_mm_positions + [
-        PlaceholderRange(offset=48, length=7)
-    ]
+    mm_positions = common_mm_positions + [PlaceholderRange(offset=48, length=7)]
     mm_hashes = common_mm_hashes + ["ccc"]
-    req0 = make_request("0",
-                        all_token_ids,
-                        block_size,
-                        sha256,
-                        mm_positions=mm_positions,
-                        mm_hashes=mm_hashes)
+    req0 = make_request(
+        "0",
+        all_token_ids,
+        block_size,
+        sha256,
+        mm_positions=mm_positions,
+        mm_hashes=mm_hashes,
+    )
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req0)
 
     # Completed block should have hashes
@@ -907,47 +954,55 @@ def test_mm_prefix_caching():
     block_hashes = req0.block_hashes
     assert len(block_hashes) == 3
     assert block_hashes[0] == sha256(
-        (kv_cache_utils.NONE_HASH, tuple(all_token_ids[:block_size]),
-         ("aaa", )))
+        (kv_cache_utils.NONE_HASH, tuple(all_token_ids[:block_size]), ("aaa",))
+    )
     assert block_hashes[1] == sha256(
-        (block_hashes[0], tuple(all_token_ids[block_size:block_size * 2]),
-         ("aaa", "bbb")))
+        (
+            block_hashes[0],
+            tuple(all_token_ids[block_size : block_size * 2]),
+            ("aaa", "bbb"),
+        )
+    )
     assert block_hashes[2] == sha256(
-        (block_hashes[1], tuple(all_token_ids[block_size * 2:block_size * 3]),
-         ("bbb", )))
+        (
+            block_hashes[1],
+            tuple(all_token_ids[block_size * 2 : block_size * 3]),
+            ("bbb",),
+        )
+    )
 
-    blocks = manager.allocate_slots(req0, 59,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
+    blocks = manager.allocate_slots(
+        req0, 59, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert blocks is not None
-    assert blocks.get_block_ids() == ([1, 2, 3, 4], )
+    assert blocks.get_block_ids() == ([1, 2, 3, 4],)
     req0.num_computed_tokens = 59
 
     # Append slots without allocating a new block.
     for _ in range(5):
         req0.append_output_token_ids(8)
-    new_blocks = manager.allocate_slots(req0, 5,
-                                        len(computed_blocks.blocks[0]) * 16,
-                                        computed_blocks)
+    new_blocks = manager.allocate_slots(
+        req0, 5, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert new_blocks is not None and len(new_blocks.blocks[0]) == 0
     assert len(block_hashes) == 4
     assert block_hashes[3] == sha256(
-        (block_hashes[2], tuple(all_token_ids[3 * block_size:] + [8] * 5),
-         ("ccc", )))
+        (block_hashes[2], tuple(all_token_ids[3 * block_size :] + [8] * 5), ("ccc",))
+    )
 
     # Cache hit.
     unique_token_ids = [-1] * 7 + [200] * 5
     all_token_ids = common_token_ids + unique_token_ids
-    mm_positions = common_mm_positions + [
-        PlaceholderRange(offset=48, length=7)
-    ]
+    mm_positions = common_mm_positions + [PlaceholderRange(offset=48, length=7)]
     mm_hashes = common_mm_hashes + ["ccc"]
-    req1 = make_request("1",
-                        all_token_ids,
-                        block_size,
-                        sha256,
-                        mm_positions=mm_positions,
-                        mm_hashes=mm_hashes)
+    req1 = make_request(
+        "1",
+        all_token_ids,
+        block_size,
+        sha256,
+        mm_positions=mm_positions,
+        mm_hashes=mm_hashes,
+    )
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req1)
     assert len(computed_blocks.blocks[0]) == 3
     assert num_computed_tokens == 3 * 16
@@ -977,30 +1032,33 @@ def test_cache_key_salting():
     block_hashes = req0.block_hashes
     assert len(block_hashes) == 3
     assert block_hashes[0] == sha256(
-        (kv_cache_utils.NONE_HASH, tuple(token_ids[:block_size]), ("salt1", )))
+        (kv_cache_utils.NONE_HASH, tuple(token_ids[:block_size]), ("salt1",))
+    )
     assert block_hashes[1] == sha256(
-        (block_hashes[0], tuple(token_ids[block_size:block_size * 2]), None))
+        (block_hashes[0], tuple(token_ids[block_size : block_size * 2]), None)
+    )
     assert block_hashes[2] == sha256(
-        (block_hashes[1], tuple(token_ids[block_size * 2:block_size * 3]),
-         None))
+        (block_hashes[1], tuple(token_ids[block_size * 2 : block_size * 3]), None)
+    )
 
-    blocks = manager.allocate_slots(req0, 59,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
+    blocks = manager.allocate_slots(
+        req0, 59, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert blocks is not None
-    assert blocks.get_block_ids() == ([1, 2, 3, 4], )
+    assert blocks.get_block_ids() == ([1, 2, 3, 4],)
     req0.num_computed_tokens = 59
 
     # Append slots without allocating a new block.
     for _ in range(5):
         req0.append_output_token_ids(8)
-    new_blocks = manager.allocate_slots(req0, 5,
-                                        len(computed_blocks.blocks[0]) * 16,
-                                        computed_blocks)
+    new_blocks = manager.allocate_slots(
+        req0, 5, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     assert new_blocks is not None and len(new_blocks.blocks[0]) == 0
     assert len(block_hashes) == 4
     assert block_hashes[3] == sha256(
-        (block_hashes[2], tuple(token_ids[3 * block_size:] + [8] * 5), None))
+        (block_hashes[2], tuple(token_ids[3 * block_size :] + [8] * 5), None)
+    )
 
     # Test cache hit with a new request that has the same salt.
     token_ids = common_token_ids + [4] * 11
@@ -1019,12 +1077,14 @@ def test_cache_key_salting():
     block_hashes = req2.block_hashes
     assert len(block_hashes) == 3
     assert block_hashes[0] == sha256(
-        (kv_cache_utils.NONE_HASH, tuple(token_ids[:block_size]), ("salt2", )))
+        (kv_cache_utils.NONE_HASH, tuple(token_ids[:block_size]), ("salt2",))
+    )
     assert block_hashes[1] == sha256(
-        (block_hashes[0], tuple(token_ids[block_size:block_size * 2]), None))
+        (block_hashes[0], tuple(token_ids[block_size : block_size * 2]), None)
+    )
     assert block_hashes[2] == sha256(
-        (block_hashes[1], tuple(token_ids[block_size * 2:block_size * 3]),
-         None))
+        (block_hashes[1], tuple(token_ids[block_size * 2 : block_size * 3]), None)
+    )
 
 
 def test_prefill_not_enough_free_blocks_with_computed_blocks():
@@ -1047,22 +1107,24 @@ def test_prefill_not_enough_free_blocks_with_computed_blocks():
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req0)
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    manager.allocate_slots(req0, 48,
-                           len(computed_blocks.blocks[0]) * 16,
-                           computed_blocks)
+    manager.allocate_slots(
+        req0, 48, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     block_part0 = manager.coordinator.single_type_managers[0].req_to_blocks[
-        req0.request_id]
+        req0.request_id
+    ]
 
     # | Common-0 | Common-1 | Common-2 | Req1-3 | Req1-4 | Req1-5 | ... |
     req1 = make_request("1", common_token_ids * 2, block_size, sha256)
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req1)
     assert computed_blocks.blocks[0] == block_part0
     assert num_computed_tokens == 3 * 16
-    manager.allocate_slots(req1, 48,
-                           len(computed_blocks.blocks[0]) * 16,
-                           computed_blocks)
+    manager.allocate_slots(
+        req1, 48, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     block_part1 = manager.coordinator.single_type_managers[0].req_to_blocks[
-        req1.request_id]
+        req1.request_id
+    ]
     # | Common-0 | Common-1 | Common-2 | Req1-3 (F) | Req1-4 (F) |
     # | Req1-5(F)| ... |
     manager.free(req1)
@@ -1075,9 +1137,12 @@ def test_prefill_not_enough_free_blocks_with_computed_blocks():
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req2)
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    manager.allocate_slots(req2, block_size * 2,
-                           len(computed_blocks.blocks[0]) * block_size,
-                           computed_blocks)
+    manager.allocate_slots(
+        req2,
+        block_size * 2,
+        len(computed_blocks.blocks[0]) * block_size,
+        computed_blocks,
+    )
 
     # Req3 is Req2 + 3 new blocks, so the first 6 blocks are computed,
     # but it cannot be allocated due to insufficient free blocks (2).
@@ -1088,9 +1153,12 @@ def test_prefill_not_enough_free_blocks_with_computed_blocks():
     assert computed_blocks.blocks[0] == block_part1
     assert num_computed_tokens == 6 * 16
     # Req3 cannot be allocated.
-    assert manager.allocate_slots(req3, 48,
-                                  len(computed_blocks.blocks[0]) * 16,
-                                  computed_blocks) is None
+    assert (
+        manager.allocate_slots(
+            req3, 48, len(computed_blocks.blocks[0]) * 16, computed_blocks
+        )
+        is None
+    )
     # Block 0-2 are used by Req 1.
     assert {block.ref_cnt for block in block_part1[:3]} == {1}
     # Block 3-5 are free.
@@ -1110,7 +1178,7 @@ def test_reset_prefix_cache():
     all_token_ids = full_block_token_ids + unique_token_ids
     req0 = make_request("0", all_token_ids, block_size, sha256)
     blocks = manager.allocate_slots(req0, 55)
-    assert blocks is not None and blocks.get_block_ids() == ([1, 2, 3, 4], )
+    assert blocks is not None and blocks.get_block_ids() == ([1, 2, 3, 4],)
 
     unique_token_ids = [4] * 7
     all_token_ids = full_block_token_ids + unique_token_ids
@@ -1118,10 +1186,10 @@ def test_reset_prefix_cache():
     computed_blocks, _ = manager.get_computed_blocks(req1)
     assert len(req1.block_hashes) == 3
     assert len(computed_blocks.blocks[0]) == 3
-    blocks = manager.allocate_slots(req1, 7,
-                                    len(computed_blocks.blocks[0]) * 16,
-                                    computed_blocks)
-    assert blocks is not None and blocks.get_block_ids() == ([5], )
+    blocks = manager.allocate_slots(
+        req1, 7, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
+    assert blocks is not None and blocks.get_block_ids() == ([5],)
 
     # Failed to reset prefix cache because some blocks are not freed yet.
     assert not manager.reset_prefix_cache()
@@ -1152,9 +1220,9 @@ def test_prefix_cache_stats_disabled():
     computed_blocks, num_computed_tokens = manager.get_computed_blocks(req)
     assert not computed_blocks.blocks[0]
     assert num_computed_tokens == 0
-    manager.allocate_slots(req, 16,
-                           len(computed_blocks.blocks[0]) * 16,
-                           computed_blocks)
+    manager.allocate_slots(
+        req, 16, len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     manager.reset_prefix_cache()
 
     # Ensure prefix_cache_stats remains None
@@ -1191,19 +1259,14 @@ def test_maybe_evict_cached_block():
     # Evict block1
     pool._maybe_evict_cached_block(block1)
     assert pool.cached_block_hash_to_block._cache == {
-        block_hash0: {
-            block0.block_id: block0,
-            block3.block_id: block3
-        },
+        block_hash0: {block0.block_id: block0, block3.block_id: block3},
         block_hash2: block2,
     }
     # Evict block0: block_hash0 entry should NOT be removed, as block3
     # also use the same hash
     pool._maybe_evict_cached_block(block0)
     assert pool.cached_block_hash_to_block._cache == {
-        block_hash0: {
-            block3.block_id: block3
-        },
+        block_hash0: {block3.block_id: block3},
         block_hash2: block2,
     }
     # Evict block2
@@ -1236,8 +1299,11 @@ def test_kv_cache_events(blocks_to_cache: int):
     events = manager.take_events()
 
     block = events[-1]
-    assert (len(block.block_hashes) == blocks_to_cache == len(
-        manager.block_pool.cached_block_hash_to_block))
+    assert (
+        len(block.block_hashes)
+        == blocks_to_cache
+        == len(manager.block_pool.cached_block_hash_to_block)
+    )
     assert len(block.token_ids) == block.block_size * len(block.block_hashes)
     assert len(manager.block_pool.kv_event_queue) == 0
 
@@ -1254,9 +1320,12 @@ def test_kv_cache_events(blocks_to_cache: int):
     for blocks in events[:-1]:
         assert blocks.block_hashes[0] in stored_block_hash
     assert len(events) == blocks_to_cache + 1
-    assert (isinstance(events[-2], BlockRemoved))
-    assert (len(events[-1].block_hashes) == blocks_to_cache == len(
-        manager.block_pool.cached_block_hash_to_block))
+    assert isinstance(events[-2], BlockRemoved)
+    assert (
+        len(events[-1].block_hashes)
+        == blocks_to_cache
+        == len(manager.block_pool.cached_block_hash_to_block)
+    )
 
     # All Blocks Cleared
     # Should see a single all blocks cleared event
@@ -1285,9 +1354,9 @@ def test_eagle_enabled_removes_last_block():
 
     # Prime the cache
     computed_blocks, _ = manager.get_computed_blocks(req)
-    manager.allocate_slots(req, len(token_ids),
-                           len(computed_blocks.blocks[0]) * 16,
-                           computed_blocks)
+    manager.allocate_slots(
+        req, len(token_ids), len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     manager.free(req)
 
     # New request with same tokens + Eagle enabled
@@ -1316,9 +1385,9 @@ def test_eagle_with_partial_blocks():
 
     # Prime the cache
     computed_blocks, _ = manager.get_computed_blocks(req)
-    manager.allocate_slots(req, len(token_ids),
-                           len(computed_blocks.blocks[0]) * 16,
-                           computed_blocks)
+    manager.allocate_slots(
+        req, len(token_ids), len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     manager.free(req)
 
     # New request with Eagle enabled
@@ -1343,7 +1412,7 @@ def test_eagle_with_sliding_window():
         KVCacheConfig(
             num_blocks=10,
             kv_cache_tensors=[],
-            kv_cache_groups=[KVCacheGroupSpec(['layer'], sliding_window_spec)],
+            kv_cache_groups=[KVCacheGroupSpec(["layer"], sliding_window_spec)],
         ),
         max_model_len=8192,
         enable_caching=True,
@@ -1356,9 +1425,9 @@ def test_eagle_with_sliding_window():
 
     # Prime the cache
     computed_blocks, _ = manager.get_computed_blocks(req)
-    manager.allocate_slots(req, len(token_ids),
-                           len(computed_blocks.blocks[0]) * 16,
-                           computed_blocks)
+    manager.allocate_slots(
+        req, len(token_ids), len(computed_blocks.blocks[0]) * 16, computed_blocks
+    )
     # record the block hash of the first block in the request for later use
     block_hash_first_block = req.block_hashes[0]
     assert block_hash_first_block is not None
@@ -1372,14 +1441,20 @@ def test_eagle_with_sliding_window():
     assert num_tokens == 1 * block_size
 
     # Evict the first block in the request
-    assert manager.block_pool.get_cached_block(
-        block_hash_first_block, kv_cache_group_ids=[0]) is not None
+    assert (
+        manager.block_pool.get_cached_block(
+            block_hash_first_block, kv_cache_group_ids=[0]
+        )
+        is not None
+    )
     manager.block_pool.cached_block_hash_to_block._cache.pop(
-        make_block_hash_with_group_id(block_hash_first_block, 0))
+        make_block_hash_with_group_id(block_hash_first_block, 0)
+    )
 
     # New request
-    req_after_evict = make_request("partial_eagle_after_evict", token_ids,
-                                   block_size, sha256)
+    req_after_evict = make_request(
+        "partial_eagle_after_evict", token_ids, block_size, sha256
+    )
     computed_blocks, num_tokens = manager.get_computed_blocks(req_after_evict)
     # Cache miss. The only hit prefix is [NULL_BLOCK, BLOCK_2] if eagle is
     # not considered. But after dropping the last matched block due to eagle,
diff --git a/tests/v1/core/test_scheduler.py b/tests/v1/core/test_scheduler.py
index 92fa1eb8ac2b..e78cced2d2db 100644
--- a/tests/v1/core/test_scheduler.py
+++ b/tests/v1/core/test_scheduler.py
@@ -7,15 +7,27 @@
 import pytest
 import torch
 
-from vllm.config import (CacheConfig, KVTransferConfig, ModelConfig,
-                         SchedulerConfig, SpeculativeConfig, VllmConfig)
-from vllm.multimodal.inputs import (MultiModalFeatureSpec,
-                                    MultiModalKwargsItem, PlaceholderRange)
+from vllm.config import (
+    CacheConfig,
+    KVTransferConfig,
+    ModelConfig,
+    SchedulerConfig,
+    SpeculativeConfig,
+    VllmConfig,
+)
+from vllm.multimodal.inputs import (
+    MultiModalFeatureSpec,
+    MultiModalKwargsItem,
+    PlaceholderRange,
+)
 from vllm.sampling_params import SamplingParams, StructuredOutputsParams
 from vllm.v1.core.sched.output import CachedRequestData, SchedulerOutput
 from vllm.v1.core.sched.scheduler import Scheduler
-from vllm.v1.kv_cache_interface import (FullAttentionSpec, KVCacheConfig,
-                                        KVCacheGroupSpec)
+from vllm.v1.kv_cache_interface import (
+    FullAttentionSpec,
+    KVCacheConfig,
+    KVCacheGroupSpec,
+)
 from vllm.v1.outputs import DraftTokenIds, ModelRunnerOutput
 from vllm.v1.request import Request, RequestStatus
 from vllm.v1.structured_output import StructuredOutputManager
@@ -43,8 +55,7 @@ def test_finish_request():
         scheduler.add_request(request)
 
     for i, request in enumerate(requests):
-        scheduler.finish_requests(request.request_id,
-                                  RequestStatus.FINISHED_ABORTED)
+        scheduler.finish_requests(request.request_id, RequestStatus.FINISHED_ABORTED)
         assert request.request_id not in scheduler.requests
         assert len(scheduler.waiting) == 9 - i
 
@@ -56,23 +67,25 @@ def test_get_num_unfinished_requests():
         scheduler.add_request(request)
 
     for i, request in enumerate(requests):
-        scheduler.finish_requests(request.request_id,
-                                  RequestStatus.FINISHED_STOPPED)
+        scheduler.finish_requests(request.request_id, RequestStatus.FINISHED_STOPPED)
         assert scheduler.get_num_unfinished_requests() == len(requests) - i - 1
 
 
-@pytest.mark.parametrize("enable_prefix_caching, prompt_logprobs", [
-    (None, None),
-    (True, 5),
-])
-def test_schedule(enable_prefix_caching: Optional[bool],
-                  prompt_logprobs: Optional[int]):
-    '''Test scheduling.
+@pytest.mark.parametrize(
+    "enable_prefix_caching, prompt_logprobs",
+    [
+        (None, None),
+        (True, 5),
+    ],
+)
+def test_schedule(
+    enable_prefix_caching: Optional[bool], prompt_logprobs: Optional[int]
+):
+    """Test scheduling.
     Two cases: default APC/no prompt logprobs; APC=True + prompt logprobs
-    '''
+    """
     scheduler = create_scheduler(enable_prefix_caching=enable_prefix_caching)
-    requests = create_requests(num_requests=10,
-                               prompt_logprobs=prompt_logprobs)
+    requests = create_requests(num_requests=10, prompt_logprobs=prompt_logprobs)
     for request in requests:
         scheduler.add_request(request)
 
@@ -94,8 +107,7 @@ def test_schedule(enable_prefix_caching: Optional[bool],
 
 def test_schedule_multimodal_requests():
     scheduler = create_scheduler(model="llava-hf/llava-1.5-7b-hf")
-    mm_positions = [[PlaceholderRange(offset=i, length=100)]
-                    for i in range(10)]
+    mm_positions = [[PlaceholderRange(offset=i, length=100)] for i in range(10)]
     requests = create_requests(
         num_requests=10,
         num_tokens=200,
@@ -128,8 +140,7 @@ def test_schedule_partial_requests():
         model="llava-hf/llava-1.5-7b-hf",
         max_num_batched_tokens=1024,
     )
-    mm_positions = [[PlaceholderRange(offset=100, length=600)]
-                    for _ in range(3)]
+    mm_positions = [[PlaceholderRange(offset=100, length=600)] for _ in range(3)]
     requests = create_requests(
         num_requests=3,
         num_tokens=800,
@@ -152,10 +163,7 @@ def test_schedule_partial_requests():
     # The third request is also scheduled partially.
     # The <img> tokens are not scheduled because of the encoder budget.
     assert output.num_scheduled_tokens[requests[2].request_id] == 100
-    req_to_index = {
-        request.request_id: i
-        for i, request in enumerate(requests)
-    }
+    req_to_index = {request.request_id: i for i, request in enumerate(requests)}
     model_runner_output = ModelRunnerOutput(
         req_ids=[request.request_id for request in requests],
         req_id_to_index=req_to_index,
@@ -191,9 +199,9 @@ def test_no_mm_input_chunking():
         max_model_len=2048,
     )
     mm_positions = [[PlaceholderRange(offset=400, length=800)]]
-    requests = create_requests(num_requests=1,
-                               num_tokens=1200,
-                               mm_positions=mm_positions)
+    requests = create_requests(
+        num_requests=1, num_tokens=1200, mm_positions=mm_positions
+    )
     for request in requests:
         scheduler.add_request(request)
 
@@ -204,10 +212,7 @@ def test_no_mm_input_chunking():
     # We want to only see the 400 text tokens at the start scheduled
     assert output.num_scheduled_tokens[requests[0].request_id] == 400
 
-    req_to_index = {
-        request.request_id: i
-        for i, request in enumerate(requests)
-    }
+    req_to_index = {request.request_id: i for i, request in enumerate(requests)}
     model_runner_output = ModelRunnerOutput(
         req_ids=[request.request_id for request in requests],
         req_id_to_index=req_to_index,
@@ -267,10 +272,7 @@ def test_schedule_concurrent_partial_requests(enable_prefix_caching: bool):
     assert output.num_scheduled_tokens[requests[1].request_id] == 400
     # The third request is also scheduled partially - 1024 - 400 - 400 = 224.
     assert output.num_scheduled_tokens[requests[2].request_id] == 224
-    req_to_index = {
-        request.request_id: i
-        for i, request in enumerate(requests)
-    }
+    req_to_index = {request.request_id: i for i, request in enumerate(requests)}
     model_runner_output = ModelRunnerOutput(
         req_ids=[request.request_id for request in requests],
         req_id_to_index=req_to_index,
@@ -311,8 +313,7 @@ def test_schedule_concurrent_partial_requests(enable_prefix_caching: bool):
     assert len(output2.finished_req_ids) == 0
     assert output2.num_scheduled_tokens[requests[0].request_id] == 1
     assert output2.num_scheduled_tokens[requests[1].request_id] == 1
-    assert output2.num_scheduled_tokens[
-        requests[2].request_id] == 800 - 224 - 224
+    assert output2.num_scheduled_tokens[requests[2].request_id] == 800 - 224 - 224
 
 
 def test_stop_via_update_from_output():
@@ -330,34 +331,31 @@ def test_stop_via_update_from_output():
     scheduler_output = SchedulerOutput(
         scheduled_new_reqs=[],
         scheduled_cached_reqs=CachedRequestData.make_empty(),
-        num_scheduled_tokens={
-            requests[0].request_id: 1,
-            requests[1].request_id: 2
-        },
+        num_scheduled_tokens={requests[0].request_id: 1, requests[1].request_id: 2},
         total_num_scheduled_tokens=3,
         scheduled_encoder_inputs={},
         scheduled_spec_decode_tokens={
             requests[0].request_id: [],
-            requests[1].request_id: [10]
+            requests[1].request_id: [10],
         },
         num_common_prefix_blocks=0,
         finished_req_ids=set(),
         free_encoder_mm_hashes=[],
         structured_output_request_ids={},
-        grammar_bitmask=None)
+        grammar_bitmask=None,
+    )
 
     model_output = ModelRunnerOutput(
         req_ids=[req.request_id for req in requests],
-        req_id_to_index={
-            req.request_id: i
-            for i, req in enumerate(requests)
-        },
-        sampled_token_ids=[[EOS_TOKEN_ID],
-                           [10,
-                            11]],  # First request hits EOS, second continues
+        req_id_to_index={req.request_id: i for i, req in enumerate(requests)},
+        sampled_token_ids=[
+            [EOS_TOKEN_ID],
+            [10, 11],
+        ],  # First request hits EOS, second continues
         logprobs=None,
         prompt_logprobs_dict={},
-        pooler_output=[])
+        pooler_output=[],
+    )
 
     scheduler.update_from_output(scheduler_output, model_output)
 
@@ -371,9 +369,7 @@ def test_stop_via_update_from_output():
 
     # Test case 2: Stop on custom stop token
     scheduler = create_scheduler(num_speculative_tokens=2)
-    requests = create_requests(num_requests=2,
-                               max_tokens=10,
-                               stop_token_ids=[42, 43])
+    requests = create_requests(num_requests=2, max_tokens=10, stop_token_ids=[42, 43])
     for req in requests:
         req.num_computed_tokens = req.num_tokens
         scheduler.requests[req.request_id] = req
@@ -383,15 +379,12 @@ def test_stop_via_update_from_output():
     scheduler_output = SchedulerOutput(
         scheduled_new_reqs=[],
         scheduled_cached_reqs=CachedRequestData.make_empty(),
-        num_scheduled_tokens={
-            requests[0].request_id: 3,
-            requests[1].request_id: 2
-        },
+        num_scheduled_tokens={requests[0].request_id: 3, requests[1].request_id: 2},
         total_num_scheduled_tokens=5,
         scheduled_encoder_inputs={},
         scheduled_spec_decode_tokens={
             requests[0].request_id: [10, 42],
-            requests[1].request_id: [13]
+            requests[1].request_id: [13],
         },
         num_common_prefix_blocks=0,
         finished_req_ids=set(),
@@ -402,15 +395,12 @@ def test_stop_via_update_from_output():
 
     model_output = ModelRunnerOutput(
         req_ids=[req.request_id for req in requests],
-        req_id_to_index={
-            req.request_id: i
-            for i, req in enumerate(requests)
-        },
-        sampled_token_ids=[[10, 42, 12],
-                           [13, 14]],  # First request hits stop token
+        req_id_to_index={req.request_id: i for i, req in enumerate(requests)},
+        sampled_token_ids=[[10, 42, 12], [13, 14]],  # First request hits stop token
         logprobs=None,
         prompt_logprobs_dict={},
-        pooler_output=[])
+        pooler_output=[],
+    )
 
     scheduler.update_from_output(scheduler_output, model_output)
 
@@ -435,15 +425,12 @@ def test_stop_via_update_from_output():
     scheduler_output = SchedulerOutput(
         scheduled_new_reqs=[],
         scheduled_cached_reqs=CachedRequestData.make_empty(),
-        num_scheduled_tokens={
-            requests[0].request_id: 3,
-            requests[1].request_id: 1
-        },
+        num_scheduled_tokens={requests[0].request_id: 3, requests[1].request_id: 1},
         total_num_scheduled_tokens=4,
         scheduled_encoder_inputs={},
         scheduled_spec_decode_tokens={
             requests[0].request_id: [10, 11],
-            requests[1].request_id: []
+            requests[1].request_id: [],
         },
         num_common_prefix_blocks=0,
         finished_req_ids=set(),
@@ -454,15 +441,12 @@ def test_stop_via_update_from_output():
 
     model_output = ModelRunnerOutput(
         req_ids=[req.request_id for req in requests],
-        req_id_to_index={
-            req.request_id: i
-            for i, req in enumerate(requests)
-        },
-        sampled_token_ids=[[10, 11, 12],
-                           [13]],  # First request exceeds max_tokens
+        req_id_to_index={req.request_id: i for i, req in enumerate(requests)},
+        sampled_token_ids=[[10, 11, 12], [13]],  # First request exceeds max_tokens
         logprobs=None,
         prompt_logprobs_dict={},
-        pooler_output=[])
+        pooler_output=[],
+    )
 
     scheduler.update_from_output(scheduler_output, model_output)
 
@@ -471,8 +455,7 @@ def test_stop_via_update_from_output():
     assert scheduler.running[0].request_id == requests[1].request_id
     assert requests[0].status == RequestStatus.FINISHED_LENGTH_CAPPED
     assert requests[0].request_id in scheduler.finished_req_ids
-    assert list(requests[0].output_token_ids) == [10, 11
-                                                  ]  # Truncated to max_tokens
+    assert list(requests[0].output_token_ids) == [10, 11]  # Truncated to max_tokens
     assert list(requests[1].output_token_ids) == [13]
 
     # Test case 4: Ignore EOS flag
@@ -489,14 +472,13 @@ def test_stop_via_update_from_output():
         num_scheduled_tokens={requests[0].request_id: 3},
         total_num_scheduled_tokens=3,
         scheduled_encoder_inputs={},
-        scheduled_spec_decode_tokens={
-            requests[0].request_id: [EOS_TOKEN_ID, 10]
-        },
+        scheduled_spec_decode_tokens={requests[0].request_id: [EOS_TOKEN_ID, 10]},
         num_common_prefix_blocks=0,
         finished_req_ids=set(),
         free_encoder_mm_hashes=[],
         structured_output_request_ids={},
-        grammar_bitmask=None)
+        grammar_bitmask=None,
+    )
 
     model_output = ModelRunnerOutput(
         req_ids=[requests[0].request_id],
@@ -504,7 +486,8 @@ def test_stop_via_update_from_output():
         sampled_token_ids=[[EOS_TOKEN_ID, 10, 11]],
         logprobs=None,
         prompt_logprobs_dict={},
-        pooler_output=[])
+        pooler_output=[],
+    )
 
     scheduler.update_from_output(scheduler_output, model_output)
 
@@ -514,12 +497,16 @@ def test_stop_via_update_from_output():
     assert list(requests[0].output_token_ids) == [EOS_TOKEN_ID, 10, 11]
 
 
-@pytest.mark.parametrize("enable_prefix_caching, prompt_logprobs", [
-    (None, None),
-    (True, 5),
-])
-def test_schedule_concurrent_batches(enable_prefix_caching: Optional[bool],
-                                     prompt_logprobs: Optional[int]):
+@pytest.mark.parametrize(
+    "enable_prefix_caching, prompt_logprobs",
+    [
+        (None, None),
+        (True, 5),
+    ],
+)
+def test_schedule_concurrent_batches(
+    enable_prefix_caching: Optional[bool], prompt_logprobs: Optional[int]
+):
     scheduler = create_scheduler(
         max_num_batched_tokens=1024,
         max_num_seqs=2,
@@ -535,15 +522,13 @@ def test_schedule_concurrent_batches(enable_prefix_caching: Optional[bool],
     scheduler.add_request(requests[0])
     scheduler_output0 = scheduler.schedule()
     assert len(scheduler_output0.scheduled_new_reqs) == 1
-    assert scheduler_output0.num_scheduled_tokens[
-        requests[0].request_id] == 512
+    assert scheduler_output0.num_scheduled_tokens[requests[0].request_id] == 512
 
     # The first request is still running, so only schedule the second request.
     scheduler.add_request(requests[1])
     scheduler_output1 = scheduler.schedule()
     assert len(scheduler_output1.scheduled_new_reqs) == 1
-    assert scheduler_output1.num_scheduled_tokens[
-        requests[1].request_id] == 512
+    assert scheduler_output1.num_scheduled_tokens[requests[1].request_id] == 512
 
     # Model output of the first request.
     model_runner_output = ModelRunnerOutput(
@@ -577,10 +562,12 @@ def test_schedule_concurrent_batches(enable_prefix_caching: Optional[bool],
 def test_preempt_during_execution():
     # NOTE(woosuk): The actual number of available blocks is 10 instead of 11
     # because block 0 is reserved as the null block.
-    scheduler = create_scheduler(max_num_batched_tokens=100,
-                                 block_size=16,
-                                 num_blocks=11,
-                                 enable_prefix_caching=False)
+    scheduler = create_scheduler(
+        max_num_batched_tokens=100,
+        block_size=16,
+        num_blocks=11,
+        enable_prefix_caching=False,
+    )
     requests = create_requests(num_requests=2, num_tokens=80, block_size=16)
 
     # Schedule the first request.
@@ -637,13 +624,16 @@ def test_preempt_during_execution():
     [
         ([[1, 2, 3]], [[1, 2, 3, 4]], (1, 3, 3, [1, 1, 1])),  # perfect match
         ([[1, 2, 3]], [[1, 5]], (1, 3, 1, [1, 0, 0])),  # early mismatch
-        ([[1, 2], [3]], [[1, 2, 5], [3, 4]],
-         (2, 3, 3, [2, 1])),  # multiple sequences
+        ([[1, 2], [3]], [[1, 2, 5], [3, 4]], (2, 3, 3, [2, 1])),  # multiple sequences
         ([[1]], [[1, 2]], (1, 1, 1, [1])),  # single token sequence
         ([[]], [[5]], (0, 0, 0, [0])),  # empty sequence
-        ([[1, 2, 3], [4, 5, 6]], [[1, 2, 7], [4, 8]],
-         (2, 6, 3, [2, 1, 0])),  # multiple mismatches
-    ])
+        (
+            [[1, 2, 3], [4, 5, 6]],
+            [[1, 2, 7], [4, 8]],
+            (2, 6, 3, [2, 1, 0]),
+        ),  # multiple mismatches
+    ],
+)
 def test_schedule_spec_decoding_stats(spec_tokens, output_tokens, expected):
     """Test scheduling behavior with speculative decoding.
 
@@ -678,8 +668,7 @@ def test_schedule_spec_decoding_stats(spec_tokens, output_tokens, expected):
         prompt_logprobs_dict={},
         pooler_output=[],
     )
-    engine_core_outputs = scheduler.update_from_output(output,
-                                                       model_runner_output)
+    engine_core_outputs = scheduler.update_from_output(output, model_runner_output)
     draft_token_ids = DraftTokenIds(req_ids, spec_tokens)
     scheduler.update_draft_token_ids(draft_token_ids)
 
@@ -694,20 +683,23 @@ def test_schedule_spec_decoding_stats(spec_tokens, output_tokens, expected):
 
     # No draft or accepted tokens counted yet
     assert not engine_core_outputs or (
-        engine_core_outputs[0].scheduler_stats.spec_decoding_stats is None)
+        engine_core_outputs[0].scheduler_stats.spec_decoding_stats is None
+    )
 
     # Schedule the speculated tokens for validation
     output = scheduler.schedule()
     assert len(output.scheduled_new_reqs) == 0
     # The sampled token and speculated tokens
-    assert output.total_num_scheduled_tokens == \
-        len(requests) + sum(len(ids) for ids in spec_tokens)
+    assert output.total_num_scheduled_tokens == len(requests) + sum(
+        len(ids) for ids in spec_tokens
+    )
     for i in range(len(requests)):
         req_id = requests[i].request_id
         assert output.num_scheduled_tokens[req_id] == 1 + len(spec_tokens[i])
         if spec_tokens[i]:
-            assert len(output.scheduled_spec_decode_tokens[req_id]) == \
-                len(spec_tokens[i])
+            assert len(output.scheduled_spec_decode_tokens[req_id]) == len(
+                spec_tokens[i]
+            )
         else:
             assert req_id not in output.scheduled_spec_decode_tokens
 
@@ -719,11 +711,11 @@ def test_schedule_spec_decoding_stats(spec_tokens, output_tokens, expected):
         prompt_logprobs_dict={},
         pooler_output=[],
     )
-    engine_core_outputs = scheduler.update_from_output(output,
-                                                       model_runner_output)
+    engine_core_outputs = scheduler.update_from_output(output, model_runner_output)
 
-    scheduler_stats = engine_core_outputs[0].scheduler_stats \
-        if engine_core_outputs else None
+    scheduler_stats = (
+        engine_core_outputs[0].scheduler_stats if engine_core_outputs else None
+    )
     if expected[0] == 0:
         assert scheduler_stats.spec_decoding_stats is None
     else:
@@ -763,18 +755,25 @@ def _assert_right_kv_cache_manager(
     # Make sure the request stats are right.
     EXPECTED_TOTAL_BLOCKS = num_tokens // block_size
     for req in requests:
-        blocks = (scheduler.kv_cache_manager.coordinator.
-                  single_type_managers[0].req_to_blocks[req.request_id])
+        blocks = scheduler.kv_cache_manager.coordinator.single_type_managers[
+            0
+        ].req_to_blocks[req.request_id]
         hashes = req.block_hashes
-        assert (scheduler.kv_cache_manager.coordinator.single_type_managers[0].
-                num_cached_block[req.request_id] == EXPECTED_TOTAL_BLOCKS)
+        assert (
+            scheduler.kv_cache_manager.coordinator.single_type_managers[
+                0
+            ].num_cached_block[req.request_id]
+            == EXPECTED_TOTAL_BLOCKS
+        )
         assert len(blocks) == EXPECTED_TOTAL_BLOCKS
         assert len(hashes) == EXPECTED_TOTAL_BLOCKS
 
     # Make sure we actually touched all the blocks.
     BLOCKS_PER_REQ = num_tokens / block_size
-    assert (scheduler.kv_cache_manager.block_pool.get_num_free_blocks() ==
-            num_total_blocks - num_requests * BLOCKS_PER_REQ)
+    assert (
+        scheduler.kv_cache_manager.block_pool.get_num_free_blocks()
+        == num_total_blocks - num_requests * BLOCKS_PER_REQ
+    )
 
 
 def _step_until_done(
@@ -813,25 +812,28 @@ def test_kv_connector_basic():
         enable_prefix_caching=True,
         use_kv_connector=True,
     )
-    NUM_TOTAL_BLOCKS = (
-        scheduler.kv_cache_manager.block_pool.get_num_free_blocks())
+    NUM_TOTAL_BLOCKS = scheduler.kv_cache_manager.block_pool.get_num_free_blocks()
     BLOCK_SIZE = scheduler.cache_config.block_size
 
     # Mock External Cache Hit.
     NUM_MATCHED_NEW_TOKENS = BLOCK_SIZE * 2
     scheduler.connector.get_num_new_matched_tokens = Mock(name="method")
     scheduler.connector.get_num_new_matched_tokens.return_value = (
-        NUM_MATCHED_NEW_TOKENS, False)
+        NUM_MATCHED_NEW_TOKENS,
+        False,
+    )
 
     ######################################################
     # FIRST SET OF REQUESTS - External Hit Only
     NUM_REQUESTS = 2
     NUM_TOKENS = NUM_MATCHED_NEW_TOKENS * 2
     MAX_TOKENS = 3
-    requests = create_requests(num_requests=NUM_REQUESTS,
-                               num_tokens=NUM_TOKENS,
-                               max_tokens=MAX_TOKENS,
-                               block_size=BLOCK_SIZE)
+    requests = create_requests(
+        num_requests=NUM_REQUESTS,
+        num_tokens=NUM_TOKENS,
+        max_tokens=MAX_TOKENS,
+        block_size=BLOCK_SIZE,
+    )
     req_ids = []
     req_to_index = {}
     for i, request in enumerate(requests):
@@ -858,15 +860,17 @@ def test_kv_connector_basic():
     )
 
     # Ensure KVCacheManager is correct.
-    _assert_right_kv_cache_manager(scheduler, requests, NUM_TOKENS, BLOCK_SIZE,
-                                   NUM_REQUESTS, NUM_TOTAL_BLOCKS)
+    _assert_right_kv_cache_manager(
+        scheduler, requests, NUM_TOKENS, BLOCK_SIZE, NUM_REQUESTS, NUM_TOTAL_BLOCKS
+    )
 
     # Continue Generation until done.
     _step_until_done(scheduler, output, MODEL_RUNNER_OUTPUT)
     _ = scheduler.schedule()
     # Confirm we clean up the memory properly.
-    assert scheduler.kv_cache_manager.block_pool.get_num_free_blocks() \
-        == NUM_TOTAL_BLOCKS
+    assert (
+        scheduler.kv_cache_manager.block_pool.get_num_free_blocks() == NUM_TOTAL_BLOCKS
+    )
 
     ######################################################
     # SECOND SET OF REQUESTS - Local And External Hit
@@ -874,10 +878,12 @@ def test_kv_connector_basic():
     # We will get a local prefix cache hit for the first
     # NUM_TOKENS_PREFIX tokens since they are used above.
     NUM_TOKENS = NUM_TOKENS_PREFIX * 2
-    requests = create_requests(num_requests=NUM_REQUESTS,
-                               num_tokens=NUM_TOKENS,
-                               max_tokens=MAX_TOKENS,
-                               block_size=BLOCK_SIZE)
+    requests = create_requests(
+        num_requests=NUM_REQUESTS,
+        num_tokens=NUM_TOKENS,
+        max_tokens=MAX_TOKENS,
+        block_size=BLOCK_SIZE,
+    )
     req_ids = []
     req_to_index = {}
     for i, request in enumerate(requests):
@@ -901,19 +907,23 @@ def test_kv_connector_basic():
         output=output,
         num_requests=NUM_REQUESTS,
         # Just the incremental tokens after local + remote cache hit.
-        expected_num_scheduled_tokens=(NUM_TOKENS - NUM_TOKENS_PREFIX -
-                                       NUM_MATCHED_NEW_TOKENS))
+        expected_num_scheduled_tokens=(
+            NUM_TOKENS - NUM_TOKENS_PREFIX - NUM_MATCHED_NEW_TOKENS
+        ),
+    )
 
     # Ensure KVCacheManager is correct.
-    _assert_right_kv_cache_manager(scheduler, requests, NUM_TOKENS, BLOCK_SIZE,
-                                   NUM_REQUESTS, NUM_TOTAL_BLOCKS)
+    _assert_right_kv_cache_manager(
+        scheduler, requests, NUM_TOKENS, BLOCK_SIZE, NUM_REQUESTS, NUM_TOTAL_BLOCKS
+    )
 
     # Continue Generation until done.
     _step_until_done(scheduler, output, MODEL_RUNNER_OUTPUT)
     _ = scheduler.schedule()
     # Confirm we clean up the memory properly.
-    assert scheduler.kv_cache_manager.block_pool.get_num_free_blocks() \
-        == NUM_TOTAL_BLOCKS
+    assert (
+        scheduler.kv_cache_manager.block_pool.get_num_free_blocks() == NUM_TOTAL_BLOCKS
+    )
 
 
 def test_kv_connector_unable_to_allocate():
@@ -934,17 +944,21 @@ def test_kv_connector_unable_to_allocate():
     NUM_MATCHED_NEW_TOKENS = BLOCK_SIZE * 2
     scheduler.connector.get_num_new_matched_tokens = Mock(name="method")
     scheduler.connector.get_num_new_matched_tokens.return_value = (
-        NUM_MATCHED_NEW_TOKENS, False)
+        NUM_MATCHED_NEW_TOKENS,
+        False,
+    )
 
     # Create two requests. The second request will not be able to
     # allocate slots because it will not have enough blocks.
     NUM_REQUESTS = 2
     NUM_TOKENS = (NUM_BLOCKS // 2 + 1) * BLOCK_SIZE
     MAX_TOKENS = 2
-    requests = create_requests(num_requests=NUM_REQUESTS,
-                               num_tokens=NUM_TOKENS,
-                               max_tokens=MAX_TOKENS,
-                               block_size=BLOCK_SIZE)
+    requests = create_requests(
+        num_requests=NUM_REQUESTS,
+        num_tokens=NUM_TOKENS,
+        max_tokens=MAX_TOKENS,
+        block_size=BLOCK_SIZE,
+    )
     req_ids = []
     req_to_index = {}
     for i, request in enumerate(requests):
@@ -963,33 +977,33 @@ def test_kv_connector_unable_to_allocate():
 
     # Just one request should be running.
     output = scheduler.schedule()
-    _assert_right_scheduler_output(output,
-                                   num_requests=1,
-                                   expected_num_scheduled_tokens=NUM_TOKENS -
-                                   NUM_MATCHED_NEW_TOKENS)
+    _assert_right_scheduler_output(
+        output,
+        num_requests=1,
+        expected_num_scheduled_tokens=NUM_TOKENS - NUM_MATCHED_NEW_TOKENS,
+    )
     assert len(scheduler.running) == 1
     assert len(scheduler.waiting) == 1
 
     # All memory should be freed, with one request waiting.
     _step_until_done(scheduler, output, MODEL_RUNNER_OUTPUT)
-    assert scheduler.kv_cache_manager.block_pool.get_num_free_blocks() \
-        == NUM_BLOCKS - 1
+    assert scheduler.kv_cache_manager.block_pool.get_num_free_blocks() == NUM_BLOCKS - 1
     assert len(scheduler.running) == 0
     assert len(scheduler.waiting) == 1
 
     # Just one request should be running.
     output = scheduler.schedule()
-    _assert_right_scheduler_output(output,
-                                   num_requests=1,
-                                   expected_num_scheduled_tokens=NUM_TOKENS -
-                                   NUM_MATCHED_NEW_TOKENS)
+    _assert_right_scheduler_output(
+        output,
+        num_requests=1,
+        expected_num_scheduled_tokens=NUM_TOKENS - NUM_MATCHED_NEW_TOKENS,
+    )
     assert len(scheduler.running) == 1
     assert len(scheduler.waiting) == 0
 
     # All memory should be freed, with no requests waiting / running.
     _step_until_done(scheduler, output, MODEL_RUNNER_OUTPUT)
-    assert scheduler.kv_cache_manager.block_pool.get_num_free_blocks() \
-        == NUM_BLOCKS - 1
+    assert scheduler.kv_cache_manager.block_pool.get_num_free_blocks() == NUM_BLOCKS - 1
     assert len(scheduler.running) == 0
     assert len(scheduler.waiting) == 0
 
@@ -1014,7 +1028,9 @@ def test_kv_connector_handles_preemption():
     NUM_MATCHED_NEW_TOKENS = BLOCK_SIZE
     scheduler.connector.get_num_new_matched_tokens = Mock(name="method")
     scheduler.connector.get_num_new_matched_tokens.return_value = (
-        NUM_MATCHED_NEW_TOKENS, False)
+        NUM_MATCHED_NEW_TOKENS,
+        False,
+    )
 
     # Create two requests.
     # Both can be scheduled at first, but the second request
@@ -1022,10 +1038,12 @@ def test_kv_connector_handles_preemption():
     NUM_REQUESTS = 2
     NUM_TOKENS = BLOCK_SIZE * 2 + 1
     MAX_TOKENS = BLOCK_SIZE * 2
-    requests = create_requests(num_requests=NUM_REQUESTS,
-                               num_tokens=NUM_TOKENS,
-                               max_tokens=MAX_TOKENS,
-                               block_size=BLOCK_SIZE)
+    requests = create_requests(
+        num_requests=NUM_REQUESTS,
+        num_tokens=NUM_TOKENS,
+        max_tokens=MAX_TOKENS,
+        block_size=BLOCK_SIZE,
+    )
     req_ids = []
     req_to_index = {}
     for i, request in enumerate(requests):
@@ -1048,7 +1066,8 @@ def test_kv_connector_handles_preemption():
         output,
         # 2 remote kv cache hits.
         num_requests=2,
-        expected_num_scheduled_tokens=NUM_TOKENS - NUM_MATCHED_NEW_TOKENS)
+        expected_num_scheduled_tokens=NUM_TOKENS - NUM_MATCHED_NEW_TOKENS,
+    )
     assert len(scheduler.running) == 2
     _ = scheduler.update_from_output(output, MODEL_RUNNER_OUTPUT)
 
@@ -1058,7 +1077,8 @@ def test_kv_connector_handles_preemption():
         output,
         # no connector_metadata
         num_requests=0,
-        expected_num_scheduled_tokens=1)
+        expected_num_scheduled_tokens=1,
+    )
     assert len(scheduler.running) == 2
     _ = scheduler.update_from_output(output, MODEL_RUNNER_OUTPUT)
 
@@ -1068,7 +1088,8 @@ def test_kv_connector_handles_preemption():
         output,
         # no connector_metadata
         num_requests=0,
-        expected_num_scheduled_tokens=1)
+        expected_num_scheduled_tokens=1,
+    )
     assert len(scheduler.running) == 1
     assert len(scheduler.waiting) == 1
     _ = scheduler.update_from_output(output, MODEL_RUNNER_OUTPUT)
@@ -1081,14 +1102,14 @@ def test_kv_connector_handles_preemption():
         output,
         # no connector_metadata
         num_requests=0,
-        expected_num_scheduled_tokens=1)
+        expected_num_scheduled_tokens=1,
+    )
     assert len(scheduler.waiting) == 1
     assert len(scheduler.running) == 1
     _ = scheduler.update_from_output(output, MODEL_RUNNER_OUTPUT)
     assert len(scheduler.running) == 0
     # All memory should be freed since nothing is running.
-    assert scheduler.kv_cache_manager.block_pool.get_num_free_blocks() \
-        == NUM_BLOCKS - 1
+    assert scheduler.kv_cache_manager.block_pool.get_num_free_blocks() == NUM_BLOCKS - 1
 
     # Restarts the preempted request - generate 3rd token.
     # This will have a local and remote cache hit.
@@ -1113,22 +1134,19 @@ def test_kv_connector_handles_preemption():
         output,
         # no connector_metadata
         num_requests=0,
-        expected_num_scheduled_tokens=1)
+        expected_num_scheduled_tokens=1,
+    )
     assert len(scheduler.running) == 1
     _ = scheduler.update_from_output(output, MODEL_RUNNER_OUTPUT)
     assert len(scheduler.running) == 0
     # All memory should be freed since nothing is running.
-    assert scheduler.kv_cache_manager.block_pool.get_num_free_blocks() \
-        == NUM_BLOCKS - 1
+    assert scheduler.kv_cache_manager.block_pool.get_num_free_blocks() == NUM_BLOCKS - 1
 
 
 def make_output(scheduler: Scheduler):
     return ModelRunnerOutput(
         req_ids=[req.request_id for req in scheduler.running],
-        req_id_to_index={
-            req.request_id: i
-            for i, req in enumerate(scheduler.running)
-        },
+        req_id_to_index={req.request_id: i for i, req in enumerate(scheduler.running)},
         sampled_token_ids=[[1000]] * len(scheduler.running),
         logprobs=None,
         prompt_logprobs_dict={},
@@ -1149,14 +1167,24 @@ def assert_scheduler_empty(scheduler: Scheduler):
     assert len(scheduler.encoder_cache_manager.cached) == 0
 
     # KVCache Manager.
-    assert len(scheduler.kv_cache_manager.coordinator.single_type_managers[0].
-               req_to_blocks) == 0
-    assert len(scheduler.kv_cache_manager.coordinator.single_type_managers[0].
-               num_cached_block) == 0
+    assert (
+        len(
+            scheduler.kv_cache_manager.coordinator.single_type_managers[0].req_to_blocks
+        )
+        == 0
+    )
+    assert (
+        len(
+            scheduler.kv_cache_manager.coordinator.single_type_managers[
+                0
+            ].num_cached_block
+        )
+        == 0
+    )
     num_free_blocks = (
-        scheduler.kv_cache_manager.block_pool.free_block_queue.num_free_blocks)
-    assert num_free_blocks == (
-        scheduler.kv_cache_manager.block_pool.num_gpu_blocks - 1)
+        scheduler.kv_cache_manager.block_pool.free_block_queue.num_free_blocks
+    )
+    assert num_free_blocks == (scheduler.kv_cache_manager.block_pool.num_gpu_blocks - 1)
 
     # NOTE(rob): just the ref count on blocks will be 0. The hash
     # value, etc will remain since we lazily evict for prefix cache.
@@ -1176,9 +1204,9 @@ def test_memory_leak():
     NUM_REQUESTS = 5
     NUM_TOKENS = 10
     MAX_TOKENS = 10
-    requests = create_requests(num_requests=NUM_REQUESTS,
-                               num_tokens=NUM_TOKENS,
-                               max_tokens=MAX_TOKENS)
+    requests = create_requests(
+        num_requests=NUM_REQUESTS, num_tokens=NUM_TOKENS, max_tokens=MAX_TOKENS
+    )
 
     # Add each request.
     for request in requests:
@@ -1212,7 +1240,7 @@ def create_scheduler_with_priority(
     max_model_len: Optional[int] = None,
     num_speculative_tokens: Optional[int] = None,
 ) -> Scheduler:
-    '''Create scheduler with priority policy enabled.
+    """Create scheduler with priority policy enabled.
 
     Args:
       model: model under test
@@ -1224,7 +1252,7 @@ def create_scheduler_with_priority(
 
     Returns:
       {class}`Scheduler` instance with priority scheduling
-    '''
+    """
     if max_model_len is None:
         max_model_len = max_num_batched_tokens
     scheduler_config = SchedulerConfig(
@@ -1243,9 +1271,11 @@ def create_scheduler_with_priority(
         seed=42,
     )
     # Cache config, optionally force APC
-    kwargs_cache = ({} if enable_prefix_caching is None else {
-        'enable_prefix_caching': enable_prefix_caching
-    })
+    kwargs_cache = (
+        {}
+        if enable_prefix_caching is None
+        else {"enable_prefix_caching": enable_prefix_caching}
+    )
     cache_config = CacheConfig(
         block_size=block_size,
         gpu_memory_utilization=0.9,
@@ -1253,16 +1283,21 @@ def create_scheduler_with_priority(
         cache_dtype="auto",
         **kwargs_cache,
     )
-    kv_transfer_config = KVTransferConfig(
-        kv_connector="SharedStorageConnector",
-        kv_role="kv_both",
-        kv_connector_extra_config={"shared_storage_path": "local_storage"},
-    ) if use_kv_connector else None
+    kv_transfer_config = (
+        KVTransferConfig(
+            kv_connector="SharedStorageConnector",
+            kv_role="kv_both",
+            kv_connector_extra_config={"shared_storage_path": "local_storage"},
+        )
+        if use_kv_connector
+        else None
+    )
 
     speculative_config: Optional[SpeculativeConfig] = None
     if num_speculative_tokens is not None:
         speculative_config = SpeculativeConfig(
-            model="ngram", num_speculative_tokens=num_speculative_tokens)
+            model="ngram", num_speculative_tokens=num_speculative_tokens
+        )
 
     vllm_config = VllmConfig(
         scheduler_config=scheduler_config,
@@ -1275,9 +1310,9 @@ def create_scheduler_with_priority(
         num_blocks=num_blocks,  # A large number of blocks to hold all requests
         kv_cache_tensors=[],
         kv_cache_groups=[
-            KVCacheGroupSpec(['layer'],
-                             FullAttentionSpec(block_size, 1, 1, torch.float32,
-                                               False))
+            KVCacheGroupSpec(
+                ["layer"], FullAttentionSpec(block_size, 1, 1, torch.float32, False)
+            )
         ],
     )
     cache_config.num_gpu_blocks = num_blocks
@@ -1290,15 +1325,16 @@ def create_scheduler_with_priority(
 
 
 def create_requests_with_priority(
-        num_requests: int,
-        priorities: list[int],
-        arrival_times: Optional[list[float]] = None,
-        num_tokens: int = 10,
-        mm_positions: Optional[list[list[PlaceholderRange]]] = None,
-        max_tokens: int = 16,
-        stop_token_ids: Optional[list[int]] = None,
-        prompt_logprobs: Optional[int] = None,
-        starting_idx: int = 0):
+    num_requests: int,
+    priorities: list[int],
+    arrival_times: Optional[list[float]] = None,
+    num_tokens: int = 10,
+    mm_positions: Optional[list[list[PlaceholderRange]]] = None,
+    max_tokens: int = 16,
+    stop_token_ids: Optional[list[int]] = None,
+    prompt_logprobs: Optional[int] = None,
+    starting_idx: int = 0,
+):
     """Create requests with specified priorities and arrival times."""
     assert len(priorities) == num_requests
     if arrival_times is not None:
@@ -1306,10 +1342,12 @@ def create_requests_with_priority(
     else:
         arrival_times = [float(i) for i in range(num_requests)]
 
-    sampling_params = SamplingParams(ignore_eos=False,
-                                     max_tokens=max_tokens,
-                                     stop_token_ids=stop_token_ids,
-                                     prompt_logprobs=prompt_logprobs)
+    sampling_params = SamplingParams(
+        ignore_eos=False,
+        max_tokens=max_tokens,
+        stop_token_ids=stop_token_ids,
+        prompt_logprobs=prompt_logprobs,
+    )
     requests = []
     for i in range(num_requests):
         mm_features = []
@@ -1321,7 +1359,8 @@ def create_requests_with_priority(
                     data=MultiModalKwargsItem.dummy("dummy_m"),
                     mm_position=position,
                     identifier=identifier,
-                    modality="image")
+                    modality="image",
+                )
                 mm_features.append(mm_feature)
 
         request = Request(
@@ -1347,9 +1386,9 @@ def test_priority_scheduling_basic_ordering():
     # Priority 0 (highest), 1, 2 (lowest)
     priorities = [2, 0, 1]  # Add in non-priority order
     arrival_times = [1.0, 2.0, 3.0]  # All different arrival times
-    requests = create_requests_with_priority(num_requests=3,
-                                             priorities=priorities,
-                                             arrival_times=arrival_times)
+    requests = create_requests_with_priority(
+        num_requests=3, priorities=priorities, arrival_times=arrival_times
+    )
 
     # Add requests in non-priority order
     for request in requests:
@@ -1375,9 +1414,9 @@ def test_priority_scheduling_arrival_time_tiebreaker():
     # Create requests with same priority but different arrival times
     priorities = [1, 1, 1]  # All same priority
     arrival_times = [3.0, 1.0, 2.0]  # Different arrival times
-    requests = create_requests_with_priority(num_requests=3,
-                                             priorities=priorities,
-                                             arrival_times=arrival_times)
+    requests = create_requests_with_priority(
+        num_requests=3, priorities=priorities, arrival_times=arrival_times
+    )
 
     # Add requests in non-arrival order
     for request in requests:
@@ -1402,9 +1441,9 @@ def test_priority_scheduling_mixed_priority_and_arrival():
     # Create requests with mixed priorities and arrival times
     priorities = [2, 1, 1, 0]  # Mixed priorities
     arrival_times = [1.0, 3.0, 2.0, 4.0]  # Mixed arrival times
-    requests = create_requests_with_priority(num_requests=4,
-                                             priorities=priorities,
-                                             arrival_times=arrival_times)
+    requests = create_requests_with_priority(
+        num_requests=4, priorities=priorities, arrival_times=arrival_times
+    )
 
     # Add requests
     for request in requests:
@@ -1441,7 +1480,7 @@ def test_priority_scheduling_preemption():
         num_requests=2,
         priorities=[5, 5],  # Low priority
         arrival_times=[1.0, 2.0],
-        num_tokens=30  # Large enough to consume significant memory
+        num_tokens=30,  # Large enough to consume significant memory
     )
 
     # Add and schedule low priority requests
@@ -1455,8 +1494,7 @@ def test_priority_scheduling_preemption():
     model_output = ModelRunnerOutput(
         req_ids=[req.request_id for req in low_priority_requests],
         req_id_to_index={
-            req.request_id: i
-            for i, req in enumerate(low_priority_requests)
+            req.request_id: i for i, req in enumerate(low_priority_requests)
         },
         sampled_token_ids=[[100] for _ in low_priority_requests],
         logprobs=None,
@@ -1474,7 +1512,7 @@ def test_priority_scheduling_preemption():
         num_requests=1,
         priorities=[0],  # High priority
         arrival_times=[3.0],
-        num_tokens=30  # Large enough to require significant memory
+        num_tokens=30,  # Large enough to require significant memory
     )[0]
 
     scheduler.add_request(high_priority_request)
@@ -1515,10 +1553,8 @@ def test_priority_scheduling_no_preemption_when_space_available():
 
     # Add two low-priority running requests
     low_priority_requests = create_requests_with_priority(
-        num_requests=2,
-        priorities=[5, 5],
-        arrival_times=[1.0, 2.0],
-        num_tokens=30)
+        num_requests=2, priorities=[5, 5], arrival_times=[1.0, 2.0], num_tokens=30
+    )
 
     for request in low_priority_requests:
         scheduler.add_request(request)
@@ -1527,8 +1563,7 @@ def test_priority_scheduling_no_preemption_when_space_available():
     model_output = ModelRunnerOutput(
         req_ids=[req.request_id for req in low_priority_requests],
         req_id_to_index={
-            req.request_id: i
-            for i, req in enumerate(low_priority_requests)
+            req.request_id: i for i, req in enumerate(low_priority_requests)
         },
         sampled_token_ids=[[100] for _ in low_priority_requests],
         logprobs=None,
@@ -1538,10 +1573,9 @@ def test_priority_scheduling_no_preemption_when_space_available():
     scheduler.update_from_output(output, model_output)
 
     # Add high-priority request
-    high_priority_request = create_requests_with_priority(num_requests=1,
-                                                          priorities=[0],
-                                                          arrival_times=[3.0],
-                                                          num_tokens=30)[0]
+    high_priority_request = create_requests_with_priority(
+        num_requests=1, priorities=[0], arrival_times=[3.0], num_tokens=30
+    )[0]
 
     scheduler.add_request(high_priority_request)
 
@@ -1569,7 +1603,8 @@ def test_priority_scheduling_preemption_victim_selection():
         num_requests=3,
         priorities=[3, 2, 0],  # Different priorities: low, medium, high
         arrival_times=[1.0, 2.0, 3.0],
-        num_tokens=10)
+        num_tokens=10,
+    )
 
     # Add all requests
     for request in requests:
@@ -1608,7 +1643,8 @@ def test_priority_scheduling_equal_priority_preemption():
         num_requests=3,
         priorities=[2, 2, 2],  # Same priority
         arrival_times=[3.0, 1.0, 2.0],  # Different arrival times
-        num_tokens=10)
+        num_tokens=10,
+    )
 
     # Add all requests
     for request in requests:
@@ -1644,7 +1680,8 @@ def test_priority_scheduling_waiting_queue_order():
         num_requests=4,
         priorities=[3, 1, 2, 0],  # Mixed priorities
         arrival_times=[1.0, 2.0, 3.0, 4.0],
-        num_tokens=10)
+        num_tokens=10,
+    )
 
     # Add all requests
     for request in requests:
@@ -1679,9 +1716,9 @@ def test_priority_scheduling_fcfs_fallback():
     # Create requests with same priority but different arrival times
     priorities = [1, 1, 1, 1]  # All same priority
     arrival_times = [4.0, 1.0, 3.0, 2.0]  # Different arrival times
-    requests = create_requests_with_priority(num_requests=4,
-                                             priorities=priorities,
-                                             arrival_times=arrival_times)
+    requests = create_requests_with_priority(
+        num_requests=4, priorities=priorities, arrival_times=arrival_times
+    )
 
     # Add requests
     for request in requests:
@@ -1711,7 +1748,8 @@ def test_priority_scheduling_with_limited_slots():
         num_requests=4,
         priorities=[3, 1, 2, 0],  # Mixed priorities
         arrival_times=[1.0, 2.0, 3.0, 4.0],
-        num_tokens=10)
+        num_tokens=10,
+    )
 
     # Add all requests
     for request in requests:
@@ -1749,10 +1787,12 @@ def test_priority_scheduling_heap_property():
     # Add requests in random priority order
     priorities = [5, 1, 8, 3, 2, 7, 4, 6]
     arrival_times = [float(i) for i in range(len(priorities))]
-    requests = create_requests_with_priority(num_requests=len(priorities),
-                                             priorities=priorities,
-                                             arrival_times=arrival_times,
-                                             num_tokens=10)
+    requests = create_requests_with_priority(
+        num_requests=len(priorities),
+        priorities=priorities,
+        arrival_times=arrival_times,
+        num_tokens=10,
+    )
 
     # Add all requests
     for request in requests:
@@ -1779,8 +1819,7 @@ def test_priority_scheduling_heap_property():
             scheduler.update_from_output(output, model_output)
 
             # Finish the request to make room for the next one
-            scheduler.finish_requests(req.req_id,
-                                      RequestStatus.FINISHED_STOPPED)
+            scheduler.finish_requests(req.req_id, RequestStatus.FINISHED_STOPPED)
 
     # Verify requests were scheduled in priority order (lowest value first)
     expected_priorities = sorted(priorities)
@@ -1879,10 +1918,7 @@ def test_priority_scheduling_preemption_when_out_of_kv():
     requests = [request_low, request_high]
     model_output = ModelRunnerOutput(
         req_ids=[req.request_id for req in requests],
-        req_id_to_index={
-            req.request_id: i
-            for i, req in enumerate(requests)
-        },
+        req_id_to_index={req.request_id: i for i, req in enumerate(requests)},
         sampled_token_ids=[[100] for _ in requests],
         # spec_token_ids=None,
         logprobs=None,
@@ -1913,10 +1949,11 @@ def test_priority_scheduling_preemption_when_out_of_kv():
         # Encoder-decoder models should always have it disabled
         (False, True, False),
         (True, True, False),
-    ])
+    ],
+)
 def test_chunked_prefill_disabled_for_encoder_decoder(
-        enable_chunked_prefill: bool, is_encoder_decoder: bool,
-        expect_enabled: bool) -> None:
+    enable_chunked_prefill: bool, is_encoder_decoder: bool, expect_enabled: bool
+) -> None:
     """Validate that chunked prefill is appropriately disabled for
     encoder-decoder models."""
     scheduler_config = SchedulerConfig(
@@ -1931,17 +1968,19 @@ def test_chunked_prefill_disabled_for_encoder_decoder(
         f.name for f in dataclasses.fields(scheduler_config)
     ]
     _validate_chunked_prefill_settings_for_encoder_decoder(
-        scheduler_config, is_encoder_decoder, expect_enabled)
+        scheduler_config, is_encoder_decoder, expect_enabled
+    )
 
     # Ensure it is retained in VllmConfig, even after its post-init.
     vllm_config = VllmConfig(scheduler_config=scheduler_config)
     _validate_chunked_prefill_settings_for_encoder_decoder(
-        vllm_config.scheduler_config, is_encoder_decoder, expect_enabled)
+        vllm_config.scheduler_config, is_encoder_decoder, expect_enabled
+    )
 
 
 def _validate_chunked_prefill_settings_for_encoder_decoder(
-        scheduler_config: SchedulerConfig, is_encoder_decoder: bool,
-        expect_enabled: bool) -> None:
+    scheduler_config: SchedulerConfig, is_encoder_decoder: bool, expect_enabled: bool
+) -> None:
     """Validate chunked prefill settings in the scheduler config for
     encoder-decoder models."""
     assert scheduler_config.chunked_prefill_enabled is expect_enabled
diff --git a/tests/v1/core/test_scheduler_e2e.py b/tests/v1/core/test_scheduler_e2e.py
index bd0320baef87..6983c3b92f6b 100644
--- a/tests/v1/core/test_scheduler_e2e.py
+++ b/tests/v1/core/test_scheduler_e2e.py
@@ -15,13 +15,15 @@
 
 @pytest.fixture(scope="module")
 def llm() -> LLM:
-    return LLM(MODEL,
-               enforce_eager=True,
-               enable_prefix_caching=True,
-               long_prefill_token_threshold=2,
-               max_num_batched_tokens=6,
-               max_num_seqs=3,
-               block_size=16)
+    return LLM(
+        MODEL,
+        enforce_eager=True,
+        enable_prefix_caching=True,
+        long_prefill_token_threshold=2,
+        max_num_batched_tokens=6,
+        max_num_seqs=3,
+        block_size=16,
+    )
 
 
 def test_concurrent_partial_prefill(llm):
diff --git a/tests/v1/core/test_single_type_kv_cache_manager.py b/tests/v1/core/test_single_type_kv_cache_manager.py
index 166be8bda05e..a27f32938c08 100644
--- a/tests/v1/core/test_single_type_kv_cache_manager.py
+++ b/tests/v1/core/test_single_type_kv_cache_manager.py
@@ -7,27 +7,28 @@
 import torch
 
 from vllm.v1.core.block_pool import BlockPool
-from vllm.v1.core.kv_cache_utils import (BlockHash, KVCacheBlock,
-                                         make_block_hash_with_group_id)
+from vllm.v1.core.kv_cache_utils import (
+    BlockHash,
+    KVCacheBlock,
+    make_block_hash_with_group_id,
+)
 from vllm.v1.core.single_type_kv_cache_manager import (
-    ChunkedLocalAttentionManager, SlidingWindowManager)
-from vllm.v1.kv_cache_interface import (ChunkedLocalAttentionSpec,
-                                        SlidingWindowSpec)
+    ChunkedLocalAttentionManager,
+    SlidingWindowManager,
+)
+from vllm.v1.kv_cache_interface import ChunkedLocalAttentionSpec, SlidingWindowSpec
 
 pytestmark = pytest.mark.cpu_test
 
 
 def get_sliding_window_manager(sliding_window_spec, block_pool):
-    return SlidingWindowManager(sliding_window_spec,
-                                block_pool,
-                                kv_cache_group_id=0)
+    return SlidingWindowManager(sliding_window_spec, block_pool, kv_cache_group_id=0)
 
 
-def get_chunked_local_attention_manager(chunked_local_attention_spec,
-                                        block_pool):
-    return ChunkedLocalAttentionManager(chunked_local_attention_spec,
-                                        block_pool,
-                                        kv_cache_group_id=0)
+def get_chunked_local_attention_manager(chunked_local_attention_spec, block_pool):
+    return ChunkedLocalAttentionManager(
+        chunked_local_attention_spec, block_pool, kv_cache_group_id=0
+    )
 
 
 def test_chunked_local_attention_possible_cached_prefix():
@@ -41,8 +42,9 @@ def test_chunked_local_attention_possible_cached_prefix():
     )
 
     block_pool = BlockPool(num_gpu_blocks=100, enable_caching=True)
-    manager = get_chunked_local_attention_manager(chunked_local_attention_spec,
-                                                  block_pool)
+    manager = get_chunked_local_attention_manager(
+        chunked_local_attention_spec, block_pool
+    )
 
     def run_one_case(block_is_cached, tail_token, expect_length):
         block_hash_list = [
@@ -52,12 +54,14 @@ def run_one_case(block_is_cached, tail_token, expect_length):
         block_pool.cached_block_hash_to_block._cache.clear()
 
         # Mock the block pool with the cached blocks
-        for i, (block_hash,
-                is_cached) in enumerate(zip(block_hash_list, block_is_cached)):
+        for i, (block_hash, is_cached) in enumerate(
+            zip(block_hash_list, block_is_cached)
+        ):
             if is_cached:
                 block_pool.cached_block_hash_to_block.insert(
                     make_block_hash_with_group_id(block_hash, 0),
-                    block_pool.blocks[i + 10])
+                    block_pool.blocks[i + 10],
+                )
 
         computed_blocks = manager.find_longest_cache_hit(
             block_hashes=block_hash_list,
@@ -65,11 +69,14 @@ def run_one_case(block_is_cached, tail_token, expect_length):
             kv_cache_group_ids=[0],
             block_pool=block_pool,
             kv_cache_spec=chunked_local_attention_spec,
-            use_eagle=False)[0]
+            use_eagle=False,
+        )[0]
         assert len(computed_blocks) == expect_length
 
-        assert all(block == block_pool.null_block
-                   for block in computed_blocks[:(expect_length - 1) // 2])
+        assert all(
+            block == block_pool.null_block
+            for block in computed_blocks[: (expect_length - 1) // 2]
+        )
 
     run_one_case([True], 0, 1)
     run_one_case([True], 1, 1)
@@ -115,12 +122,14 @@ def run_one_case(block_is_cached, expect_length):
         block_pool.cached_block_hash_to_block._cache.clear()
 
         # Mock the block pool with the cached blocks
-        for i, (block_hash,
-                is_cached) in enumerate(zip(block_hash_list, block_is_cached)):
+        for i, (block_hash, is_cached) in enumerate(
+            zip(block_hash_list, block_is_cached)
+        ):
             if is_cached:
                 block_pool.cached_block_hash_to_block.insert(
                     make_block_hash_with_group_id(block_hash, 0),
-                    block_pool.blocks[i + 10])
+                    block_pool.blocks[i + 10],
+                )
 
         computed_blocks = manager.find_longest_cache_hit(
             block_hashes=block_hash_list,
@@ -128,16 +137,18 @@ def run_one_case(block_is_cached, expect_length):
             kv_cache_group_ids=[0],
             block_pool=block_pool,
             kv_cache_spec=sliding_window_spec,
-            use_eagle=False)[0]
+            use_eagle=False,
+        )[0]
         assert len(computed_blocks) == expect_length
 
-        assert all(block == block_pool.null_block
-                   for block in computed_blocks[:expect_length - 2])
+        assert all(
+            block == block_pool.null_block
+            for block in computed_blocks[: expect_length - 2]
+        )
         for i in range(2):
             if i < expect_length:
                 block_index = expect_length - i - 1
-                assert computed_blocks[
-                    block_index].block_id == block_index + 10
+                assert computed_blocks[block_index].block_id == block_index + 10
 
     run_one_case([False] * 10, 0)
     run_one_case([True], 1)
@@ -146,17 +157,16 @@ def run_one_case(block_is_cached, expect_length):
     run_one_case([True, True, False], 2)
     run_one_case([True, True, True], 3)
     run_one_case([True, True, True, False], 3)
-    run_one_case([
-        True, True, False, True, False, False, True, True, False, True, True,
-        True
-    ], 12)
-    run_one_case([
-        True, True, False, True, False, False, True, True, False, False, False
-    ], 8)
-    run_one_case([
-        True, True, False, True, False, False, True, True, False, False, False,
-        True
-    ], 8)
+    run_one_case(
+        [True, True, False, True, False, False, True, True, False, True, True, True], 12
+    )
+    run_one_case(
+        [True, True, False, True, False, False, True, True, False, False, False], 8
+    )
+    run_one_case(
+        [True, True, False, True, False, False, True, True, False, False, False, True],
+        8,
+    )
 
 
 def test_chunked_local_attention_remove_skipped_blocks():
@@ -176,8 +186,8 @@ def test_chunked_local_attention_remove_skipped_blocks():
 
     def id_to_block_table(ids) -> list[KVCacheBlock]:
         return [
-            KVCacheBlock(id_)
-            if id_ != null_block_id else block_pool.null_block for id_ in ids
+            KVCacheBlock(id_) if id_ != null_block_id else block_pool.null_block
+            for id_ in ids
         ]
 
     def assert_block_id(block_table: list[KVCacheBlock], ids: list[int]):
@@ -188,7 +198,17 @@ def assert_block_id(block_table: list[KVCacheBlock], ids: list[int]):
                 assert block.block_id == id_
 
     original_block_ids = [
-        1000, 1001, 1002, 1003, 1004, 1005, 1006, 1007, 1008, 1009, 1010
+        1000,
+        1001,
+        1002,
+        1003,
+        1004,
+        1005,
+        1006,
+        1007,
+        1008,
+        1009,
+        1010,
     ]
     block_table = id_to_block_table(original_block_ids)
     manager.req_to_blocks["test"] = block_table
@@ -227,8 +247,8 @@ def test_sliding_window_remove_skipped_blocks():
 
     def id_to_block_table(ids) -> list[KVCacheBlock]:
         return [
-            KVCacheBlock(id_)
-            if id_ != null_block_id else block_pool.null_block for id_ in ids
+            KVCacheBlock(id_) if id_ != null_block_id else block_pool.null_block
+            for id_ in ids
         ]
 
     def assert_block_id(block_table: list[KVCacheBlock], ids: list[int]):
@@ -239,7 +259,17 @@ def assert_block_id(block_table: list[KVCacheBlock], ids: list[int]):
                 assert block.block_id == id_
 
     original_block_ids = [
-        1000, 1001, 1002, 1003, 1004, 1005, 1006, 1007, 1008, 1009, 1010
+        1000,
+        1001,
+        1002,
+        1003,
+        1004,
+        1005,
+        1006,
+        1007,
+        1008,
+        1009,
+        1010,
     ]
     block_table = id_to_block_table(original_block_ids)
     manager.req_to_blocks["test"] = block_table
@@ -289,13 +319,16 @@ def test_get_num_blocks_to_allocate():
     block_pool = BlockPool(num_gpu_blocks=100, enable_caching=True)
     manager = get_sliding_window_manager(sliding_window_spec, block_pool)
     cached_blocks_1 = [KVCacheBlock(i + 1) for i in range(10)]
-    cached_blocks_2 = [block_pool.null_block for _ in range(5)
-                       ] + [KVCacheBlock(i + 1) for i in range(5)]
+    cached_blocks_2 = [block_pool.null_block for _ in range(5)] + [
+        KVCacheBlock(i + 1) for i in range(5)
+    ]
 
-    assert manager.get_num_blocks_to_allocate("1", 20 * block_size,
-                                              cached_blocks_1) == 20
-    assert manager.get_num_blocks_to_allocate("2", 20 * block_size,
-                                              cached_blocks_2) == 15
+    assert (
+        manager.get_num_blocks_to_allocate("1", 20 * block_size, cached_blocks_1) == 20
+    )
+    assert (
+        manager.get_num_blocks_to_allocate("2", 20 * block_size, cached_blocks_2) == 15
+    )
 
 
 def test_chunked_local_attention_get_num_blocks_to_allocate():
@@ -311,10 +344,13 @@ def test_chunked_local_attention_get_num_blocks_to_allocate():
     block_pool = BlockPool(num_gpu_blocks=100, enable_caching=True)
     manager = get_chunked_local_attention_manager(attention_spec, block_pool)
     cached_blocks_1 = [KVCacheBlock(i + 1) for i in range(10)]
-    cached_blocks_2 = [block_pool.null_block for _ in range(5)
-                       ] + [KVCacheBlock(i + 1) for i in range(5)]
+    cached_blocks_2 = [block_pool.null_block for _ in range(5)] + [
+        KVCacheBlock(i + 1) for i in range(5)
+    ]
 
-    assert manager.get_num_blocks_to_allocate("1", 20 * block_size,
-                                              cached_blocks_1) == 20
-    assert manager.get_num_blocks_to_allocate("2", 20 * block_size,
-                                              cached_blocks_2) == 15
+    assert (
+        manager.get_num_blocks_to_allocate("1", 20 * block_size, cached_blocks_1) == 20
+    )
+    assert (
+        manager.get_num_blocks_to_allocate("2", 20 * block_size, cached_blocks_2) == 15
+    )
diff --git a/tests/v1/core/utils.py b/tests/v1/core/utils.py
index d343141cdf4c..75ef1a5ec165 100644
--- a/tests/v1/core/utils.py
+++ b/tests/v1/core/utils.py
@@ -4,18 +4,29 @@
 
 import torch
 
-from vllm.config import (CacheConfig, KVTransferConfig, ModelConfig,
-                         SchedulerConfig, SpeculativeConfig, VllmConfig)
-from vllm.multimodal.inputs import (MultiModalFeatureSpec,
-                                    MultiModalKwargsItem, PlaceholderRange)
+from vllm.config import (
+    CacheConfig,
+    KVTransferConfig,
+    ModelConfig,
+    SchedulerConfig,
+    SpeculativeConfig,
+    VllmConfig,
+)
+from vllm.multimodal.inputs import (
+    MultiModalFeatureSpec,
+    MultiModalKwargsItem,
+    PlaceholderRange,
+)
 from vllm.sampling_params import SamplingParams
 from vllm.utils import sha256
-from vllm.v1.core.kv_cache_utils import (get_request_block_hasher,
-                                         init_none_hash)
+from vllm.v1.core.kv_cache_utils import get_request_block_hasher, init_none_hash
 from vllm.v1.core.sched.async_scheduler import AsyncScheduler
 from vllm.v1.core.sched.scheduler import Scheduler
-from vllm.v1.kv_cache_interface import (FullAttentionSpec, KVCacheConfig,
-                                        KVCacheGroupSpec)
+from vllm.v1.kv_cache_interface import (
+    FullAttentionSpec,
+    KVCacheConfig,
+    KVCacheGroupSpec,
+)
 from vllm.v1.request import Request
 from vllm.v1.structured_output import StructuredOutputManager
 
@@ -37,7 +48,7 @@ def create_scheduler(
     skip_tokenizer_init: bool = False,
     async_scheduling: bool = False,
 ) -> Union[Scheduler, AsyncScheduler]:
-    '''Create scheduler under test.
+    """Create scheduler under test.
 
     Args:
       model: model under test
@@ -49,7 +60,7 @@ def create_scheduler(
 
     Returns:
       {class}`Scheduler` instance
-    '''
+    """
     if max_model_len is None:
         max_model_len = max_num_batched_tokens
     scheduler_config = SchedulerConfig(
@@ -69,9 +80,11 @@ def create_scheduler(
         skip_tokenizer_init=skip_tokenizer_init,
     )
     # Cache config, optionally force APC
-    kwargs_cache = ({} if enable_prefix_caching is None else {
-        'enable_prefix_caching': enable_prefix_caching
-    })
+    kwargs_cache = (
+        {}
+        if enable_prefix_caching is None
+        else {"enable_prefix_caching": enable_prefix_caching}
+    )
     cache_config = CacheConfig(
         block_size=block_size,
         gpu_memory_utilization=0.9,
@@ -79,16 +92,21 @@ def create_scheduler(
         cache_dtype="auto",
         **kwargs_cache,
     )
-    kv_transfer_config = KVTransferConfig(
-        kv_connector="SharedStorageConnector",
-        kv_role="kv_both",
-        kv_connector_extra_config={"shared_storage_path": "local_storage"},
-    ) if use_kv_connector else None
+    kv_transfer_config = (
+        KVTransferConfig(
+            kv_connector="SharedStorageConnector",
+            kv_role="kv_both",
+            kv_connector_extra_config={"shared_storage_path": "local_storage"},
+        )
+        if use_kv_connector
+        else None
+    )
 
     speculative_config: Optional[SpeculativeConfig] = None
     if num_speculative_tokens is not None:
         speculative_config = SpeculativeConfig(
-            model="ngram", num_speculative_tokens=num_speculative_tokens)
+            model="ngram", num_speculative_tokens=num_speculative_tokens
+        )
 
     vllm_config = VllmConfig(
         scheduler_config=scheduler_config,
@@ -101,9 +119,9 @@ def create_scheduler(
         num_blocks=num_blocks,  # A large number of blocks to hold all requests
         kv_cache_tensors=[],
         kv_cache_groups=[
-            KVCacheGroupSpec(['layer'],
-                             FullAttentionSpec(block_size, 1, 1, torch.float32,
-                                               False))
+            KVCacheGroupSpec(
+                ["layer"], FullAttentionSpec(block_size, 1, 1, torch.float32, False)
+            )
         ],
     )
     cache_config.num_gpu_blocks = num_blocks
@@ -135,10 +153,12 @@ def create_requests(
         _none_hash_initialized = True
 
     block_hasher = get_request_block_hasher(block_size, sha256)
-    sampling_params = SamplingParams(ignore_eos=False,
-                                     max_tokens=max_tokens,
-                                     stop_token_ids=stop_token_ids,
-                                     prompt_logprobs=prompt_logprobs)
+    sampling_params = SamplingParams(
+        ignore_eos=False,
+        max_tokens=max_tokens,
+        stop_token_ids=stop_token_ids,
+        prompt_logprobs=prompt_logprobs,
+    )
     requests = []
     for i in range(num_requests):
         mm_features = []
@@ -152,11 +172,11 @@ def create_requests(
                     data=MultiModalKwargsItem.dummy("dummy_m"),
                     mm_position=position,
                     identifier=identifier,
-                    modality="image")
+                    modality="image",
+                )
                 mm_features.append(mm_feature)
 
-        prompt_token_ids = ([0] * num_tokens if same_prompt else [i] *
-                            num_tokens)
+        prompt_token_ids = [0] * num_tokens if same_prompt else [i] * num_tokens
         request = Request(
             request_id=f"{i}",
             prompt_token_ids=prompt_token_ids,
diff --git a/tests/v1/cudagraph/test_cudagraph_dispatch.py b/tests/v1/cudagraph/test_cudagraph_dispatch.py
index b6b85e4440d0..59841a446db3 100644
--- a/tests/v1/cudagraph/test_cudagraph_dispatch.py
+++ b/tests/v1/cudagraph/test_cudagraph_dispatch.py
@@ -9,8 +9,14 @@
 from tests.utils import create_new_process_for_each_test
 from vllm.compilation.cuda_graph import CUDAGraphWrapper
 from vllm.compilation.monitor import set_cudagraph_capturing_enabled
-from vllm.config import (CompilationConfig, CompilationLevel, CUDAGraphMode,
-                         ParallelConfig, SchedulerConfig, VllmConfig)
+from vllm.config import (
+    CompilationConfig,
+    CompilationLevel,
+    CUDAGraphMode,
+    ParallelConfig,
+    SchedulerConfig,
+    VllmConfig,
+)
 from vllm.forward_context import BatchDescriptor, set_forward_context
 from vllm.platforms import current_platform
 from vllm.v1.cudagraph_dispatcher import CudagraphDispatcher
@@ -18,7 +24,6 @@
 
 # Helper MLP for testing
 class SimpleMLP(nn.Module):
-
     def __init__(self):
         super().__init__()
         self.fc1 = nn.Linear(10, 10)
@@ -28,8 +33,9 @@ def forward(self, x):
         return self.fc2(self.fc1(x))
 
 
-def _create_vllm_config(compilation_config: CompilationConfig,
-                        max_num_seqs: int = 8) -> MagicMock:
+def _create_vllm_config(
+    compilation_config: CompilationConfig, max_num_seqs: int = 8
+) -> MagicMock:
     mock_config = MagicMock(spec=VllmConfig)
     mock_config.compilation_config = compilation_config
     mock_config.scheduler_config = SchedulerConfig(max_num_seqs=max_num_seqs)
@@ -43,7 +49,6 @@ def _create_vllm_config(compilation_config: CompilationConfig,
 
 
 class TestCudagraphDispatcher:
-
     @pytest.mark.parametrize(
         "case_id,cudagraph_mode_str,compilation_level",
         [
@@ -55,18 +60,21 @@ class TestCudagraphDispatcher:
             (2, "FULL_DECODE_ONLY", CompilationLevel.NO_COMPILATION),
             # Test case 3: Piecewise for all
             (3, "PIECEWISE", CompilationLevel.PIECEWISE),
-        ])
+        ],
+    )
     def test_dispatcher(self, cudagraph_mode_str, compilation_level):
         # Setup dispatcher
-        comp_config = CompilationConfig(cudagraph_mode=cudagraph_mode_str,
-                                        level=compilation_level,
-                                        cudagraph_capture_sizes=[1, 8])
+        comp_config = CompilationConfig(
+            cudagraph_mode=cudagraph_mode_str,
+            level=compilation_level,
+            cudagraph_capture_sizes=[1, 8],
+        )
 
         config = _create_vllm_config(comp_config, max_num_seqs=8)
         dispatcher = CudagraphDispatcher(config)
         dispatcher.initialize_cudagraph_keys(
-            cudagraph_mode=comp_config.cudagraph_mode,
-            uniform_decode_query_len=1)
+            cudagraph_mode=comp_config.cudagraph_mode, uniform_decode_query_len=1
+        )
 
         # Verify the key is initialized correctly
         if cudagraph_mode_str in ["FULL_AND_PIECEWISE", "PIECEWISE"]:
@@ -114,8 +122,7 @@ def test_dispatcher(self, cudagraph_mode_str, compilation_level):
 
         # 4. Cascade attention should have a fall back mode
         desc_full_exact = BatchDescriptor(num_tokens=8, uniform_decode=False)
-        rt_mode, key = dispatcher.dispatch(desc_full_exact,
-                                           use_cascade_attn=True)
+        rt_mode, key = dispatcher.dispatch(desc_full_exact, use_cascade_attn=True)
         if "PIECEWISE" in cudagraph_mode_str:  # string contains check
             assert rt_mode == CUDAGraphMode.PIECEWISE
             assert key == desc_full_exact.non_uniform
@@ -125,7 +132,6 @@ def test_dispatcher(self, cudagraph_mode_str, compilation_level):
 
 @pytest.mark.skipif(not current_platform.is_cuda(), reason="Skip if not cuda")
 class TestCUDAGraphWrapper:
-
     def setup_method(self):
         self.vllm_config = _create_vllm_config(CompilationConfig())
         self.model = SimpleMLP().to("cuda")
@@ -134,26 +140,30 @@ def setup_method(self):
 
     @create_new_process_for_each_test("spawn")
     def test_capture_and_replay(self):
-        wrapper = CUDAGraphWrapper(self.model,
-                                   self.vllm_config,
-                                   runtime_mode=CUDAGraphMode.FULL)
+        wrapper = CUDAGraphWrapper(
+            self.model, self.vllm_config, runtime_mode=CUDAGraphMode.FULL
+        )
         batch_descriptor = BatchDescriptor(num_tokens=10)
 
         # 0. global warmup
-        with set_forward_context(attn_metadata=None,
-                                 vllm_config=self.vllm_config,
-                                 cudagraph_runtime_mode=CUDAGraphMode.NONE,
-                                 batch_descriptor=None):
+        with set_forward_context(
+            attn_metadata=None,
+            vllm_config=self.vllm_config,
+            cudagraph_runtime_mode=CUDAGraphMode.NONE,
+            batch_descriptor=None,
+        ):
             wrapper(self.input_tensor)
 
         # 1. Capture
-        with set_forward_context(
+        with (
+            set_forward_context(
                 attn_metadata=None,
                 vllm_config=self.vllm_config,
                 cudagraph_runtime_mode=CUDAGraphMode.FULL,
-                batch_descriptor=batch_descriptor),\
-            patch("torch.cuda.graph",
-                       wraps=torch.cuda.graph) as mock_cuda_graph:
+                batch_descriptor=batch_descriptor,
+            ),
+            patch("torch.cuda.graph", wraps=torch.cuda.graph) as mock_cuda_graph,
+        ):
             output1 = wrapper(self.input_tensor)
             # capturing phase should generate a zero output
             assert torch.allclose(output1, torch.zeros_like(output1))
@@ -164,13 +174,17 @@ def test_capture_and_replay(self):
         assert entry.cudagraph is not None
 
         # 2. Replay
-        with set_forward_context(
+        with (
+            set_forward_context(
                 attn_metadata=None,
                 vllm_config=self.vllm_config,
                 cudagraph_runtime_mode=CUDAGraphMode.FULL,
-                batch_descriptor=batch_descriptor),\
-            patch.object(entry.cudagraph, 'replay',
-                         wraps=entry.cudagraph.replay) as mock_replay:
+                batch_descriptor=batch_descriptor,
+            ),
+            patch.object(
+                entry.cudagraph, "replay", wraps=entry.cudagraph.replay
+            ) as mock_replay,
+        ):
             output2 = wrapper(self.input_tensor)
             mock_replay.assert_called_once()
 
@@ -180,20 +194,23 @@ def test_capture_and_replay(self):
 
     @create_new_process_for_each_test("spawn")
     def test_bypass_on_mode_mismatch(self):
-        wrapper = CUDAGraphWrapper(self.model,
-                                   self.vllm_config,
-                                   runtime_mode=CUDAGraphMode.FULL)
+        wrapper = CUDAGraphWrapper(
+            self.model, self.vllm_config, runtime_mode=CUDAGraphMode.FULL
+        )
         batch_descriptor = BatchDescriptor(num_tokens=10)
 
-        with set_forward_context(
+        with (
+            set_forward_context(
                 attn_metadata=None,
                 vllm_config=self.vllm_config,
                 cudagraph_runtime_mode=CUDAGraphMode.PIECEWISE,
-                batch_descriptor=batch_descriptor), \
-            patch('torch.cuda.graph',
-                  wraps=torch.cuda.graph) as mock_cuda_graph, \
-            patch.object(self.model, 'forward',
-                         wraps=self.model.forward) as mock_forward:
+                batch_descriptor=batch_descriptor,
+            ),
+            patch("torch.cuda.graph", wraps=torch.cuda.graph) as mock_cuda_graph,
+            patch.object(
+                self.model, "forward", wraps=self.model.forward
+            ) as mock_forward,
+        ):
             wrapper(self.input_tensor)
             mock_cuda_graph.assert_not_called()
             mock_forward.assert_called_once()
@@ -201,18 +218,20 @@ def test_bypass_on_mode_mismatch(self):
 
     @create_new_process_for_each_test("spawn")
     def test_bypass_on_mode_none(self):
-        wrapper = CUDAGraphWrapper(self.model,
-                                   self.vllm_config,
-                                   runtime_mode=CUDAGraphMode.FULL)
+        wrapper = CUDAGraphWrapper(
+            self.model, self.vllm_config, runtime_mode=CUDAGraphMode.FULL
+        )
         batch_descriptor = BatchDescriptor(num_tokens=10)
 
-        with set_forward_context(
+        with (
+            set_forward_context(
                 attn_metadata=None,
                 vllm_config=self.vllm_config,
                 cudagraph_runtime_mode=CUDAGraphMode.NONE,
-                batch_descriptor=batch_descriptor), \
-            patch('torch.cuda.graph',
-                  wraps=torch.cuda.graph) as mock_cuda_graph:
+                batch_descriptor=batch_descriptor,
+            ),
+            patch("torch.cuda.graph", wraps=torch.cuda.graph) as mock_cuda_graph,
+        ):
             wrapper(self.input_tensor)
             mock_cuda_graph.assert_not_called()
         assert not wrapper.concrete_cudagraph_entries
@@ -220,38 +239,44 @@ def test_bypass_on_mode_none(self):
 
 @pytest.mark.skipif(not current_platform.is_cuda(), reason="Skip if not cuda")
 class TestCudagraphIntegration:
-
     def setup_method(self):
         # only FULL mode for non-uniform batches
-        self.comp_config = CompilationConfig(level=CompilationLevel.PIECEWISE,
-                                             cudagraph_mode="FULL",
-                                             cudagraph_capture_sizes=[10, 20])
+        self.comp_config = CompilationConfig(
+            level=CompilationLevel.PIECEWISE,
+            cudagraph_mode="FULL",
+            cudagraph_capture_sizes=[10, 20],
+        )
         self.vllm_config = _create_vllm_config(self.comp_config)
         self.dispatcher = CudagraphDispatcher(self.vllm_config)
         self.dispatcher.initialize_cudagraph_keys(
-            self.comp_config.cudagraph_mode, uniform_decode_query_len=1)
+            self.comp_config.cudagraph_mode, uniform_decode_query_len=1
+        )
 
-    def _run_and_monitor_call(self, wrapper, input_tensor, runtime_mode,
-                              batch_descriptor):
+    def _run_and_monitor_call(
+        self, wrapper, input_tensor, runtime_mode, batch_descriptor
+    ):
         """Helper to run a single call and monitor the action."""
 
-        with patch('torch.cuda.graph',
-                wraps=torch.cuda.graph) as mock_graph_context, \
-            patch.object(wrapper, 'runnable',
-                        wraps=wrapper.runnable) as mock_runnable:
+        with (
+            patch("torch.cuda.graph", wraps=torch.cuda.graph) as mock_graph_context,
+            patch.object(wrapper, "runnable", wraps=wrapper.runnable) as mock_runnable,
+        ):
+            entry = wrapper.concrete_cudagraph_entries.get(batch_descriptor, None)
 
-            entry = wrapper.concrete_cudagraph_entries.get(
-                batch_descriptor, None)
-
-            context = set_forward_context(attn_metadata=None,
-                                          vllm_config=self.vllm_config,
-                                          cudagraph_runtime_mode=runtime_mode,
-                                          batch_descriptor=batch_descriptor)
+            context = set_forward_context(
+                attn_metadata=None,
+                vllm_config=self.vllm_config,
+                cudagraph_runtime_mode=runtime_mode,
+                batch_descriptor=batch_descriptor,
+            )
             mock_replay = MagicMock()
             if entry and entry.cudagraph:
-                with context, \
-                    patch.object(entry.cudagraph, 'replay',
-                                new_callable=MagicMock) as mock_replay:
+                with (
+                    context,
+                    patch.object(
+                        entry.cudagraph, "replay", new_callable=MagicMock
+                    ) as mock_replay,
+                ):
                     wrapper(input_tensor)
             else:
                 with context:
@@ -272,8 +297,7 @@ def _run_and_monitor_call(self, wrapper, input_tensor, runtime_mode,
     @create_new_process_for_each_test("spawn")
     def test_capture_replay_bypass_logic(self):
         model = SimpleMLP().to("cuda")
-        full_wrapper = CUDAGraphWrapper(model, self.vllm_config,
-                                        CUDAGraphMode.FULL)
+        full_wrapper = CUDAGraphWrapper(model, self.vllm_config, CUDAGraphMode.FULL)
         max_bs = 16
         persistent_input_buffer = torch.zeros(max_bs, 10, device="cuda")
         input_1 = persistent_input_buffer[:1]
@@ -285,75 +309,79 @@ def test_capture_replay_bypass_logic(self):
         desc_3_unseen = BatchDescriptor(num_tokens=3)
 
         # 0. global warmup
-        with set_forward_context(attn_metadata=None,
-                                 vllm_config=self.vllm_config,
-                                 cudagraph_runtime_mode=CUDAGraphMode.NONE,
-                                 batch_descriptor=None):
+        with set_forward_context(
+            attn_metadata=None,
+            vllm_config=self.vllm_config,
+            cudagraph_runtime_mode=CUDAGraphMode.NONE,
+            batch_descriptor=None,
+        ):
             full_wrapper(input_1)
 
         rt_mode, key = self.dispatcher.dispatch(desc_1)
         # 1. Capture first shape
-        action = self._run_and_monitor_call(full_wrapper, input_1, rt_mode,
-                                            key)
+        action = self._run_and_monitor_call(full_wrapper, input_1, rt_mode, key)
         assert action == "capture_global"
 
         # 2. Replay first shape
-        action = self._run_and_monitor_call(full_wrapper, input_1, rt_mode,
-                                            key)
+        action = self._run_and_monitor_call(full_wrapper, input_1, rt_mode, key)
         assert action == "replay"
 
         rt_mode, key = self.dispatcher.dispatch(desc_2)
         # 3. Capture second shape
-        action = self._run_and_monitor_call(full_wrapper, input_2, rt_mode,
-                                            key)
+        action = self._run_and_monitor_call(full_wrapper, input_2, rt_mode, key)
         assert action == "capture_global"
 
         # 4. Replay second shape
-        action = self._run_and_monitor_call(full_wrapper, input_2,
-                                            CUDAGraphMode.FULL, desc_2)
+        action = self._run_and_monitor_call(
+            full_wrapper, input_2, CUDAGraphMode.FULL, desc_2
+        )
         assert action == "replay"
 
         # 5. Bypass if no key match
         rt_mode, key = self.dispatcher.dispatch(desc_3_unseen)
         assert rt_mode == CUDAGraphMode.NONE
-        action = self._run_and_monitor_call(full_wrapper, input_3, rt_mode,
-                                            key)
+        action = self._run_and_monitor_call(full_wrapper, input_3, rt_mode, key)
         assert action == "bypass"
 
         # capture unseen shape is not allowed after disable
         set_cudagraph_capturing_enabled(False)
         with pytest.raises(RuntimeError):
-            self._run_and_monitor_call(full_wrapper, input_3,
-                                       CUDAGraphMode.FULL, desc_3_unseen)
+            self._run_and_monitor_call(
+                full_wrapper, input_3, CUDAGraphMode.FULL, desc_3_unseen
+            )
         set_cudagraph_capturing_enabled(True)
 
     @create_new_process_for_each_test("spawn")
     def test_nested_wrappers(self):
         """Tests a scenario with a PIECEWISE wrapper inside a FULL one."""
         model = SimpleMLP().to("cuda")
-        full_wrapper = CUDAGraphWrapper(model, self.vllm_config,
-                                        CUDAGraphMode.FULL)
+        full_wrapper = CUDAGraphWrapper(model, self.vllm_config, CUDAGraphMode.FULL)
         input_1 = torch.randn(1, 10, device="cuda")
 
         # Setup: Inner model is wrapped with PIECEWISE, outer with FULL
         inner_model = SimpleMLP().to("cuda")
-        piecewise_wrapper = CUDAGraphWrapper(inner_model, self.vllm_config,
-                                             CUDAGraphMode.PIECEWISE)
+        piecewise_wrapper = CUDAGraphWrapper(
+            inner_model, self.vllm_config, CUDAGraphMode.PIECEWISE
+        )
         inner_model.forward = MagicMock(wraps=inner_model.forward)
         outer_model = SimpleMLP().to("cuda")
         # When outer model is called, it calls the piecewise_wrapper
-        outer_model.forward = MagicMock(wraps=outer_model.forward,
-                                        side_effect=piecewise_wrapper)
-        full_wrapper = CUDAGraphWrapper(outer_model, self.vllm_config,
-                                        CUDAGraphMode.FULL)
+        outer_model.forward = MagicMock(
+            wraps=outer_model.forward, side_effect=piecewise_wrapper
+        )
+        full_wrapper = CUDAGraphWrapper(
+            outer_model, self.vllm_config, CUDAGraphMode.FULL
+        )
 
         desc_1 = BatchDescriptor(num_tokens=1)
 
         # 0. global warmup
-        with set_forward_context(attn_metadata=None,
-                                 vllm_config=self.vllm_config,
-                                 cudagraph_runtime_mode=CUDAGraphMode.NONE,
-                                 batch_descriptor=None):
+        with set_forward_context(
+            attn_metadata=None,
+            vllm_config=self.vllm_config,
+            cudagraph_runtime_mode=CUDAGraphMode.NONE,
+            batch_descriptor=None,
+        ):
             full_wrapper(input_1)
 
         # --- Test runtime mode FULL---
@@ -361,8 +389,9 @@ def test_nested_wrappers(self):
         # The inner mock should be called once inside the graph capture.
         outer_model.forward.reset_mock()
         inner_model.forward.reset_mock()
-        action = self._run_and_monitor_call(full_wrapper, input_1,
-                                            CUDAGraphMode.FULL, desc_1)
+        action = self._run_and_monitor_call(
+            full_wrapper, input_1, CUDAGraphMode.FULL, desc_1
+        )
         assert action == "capture_global"
         assert outer_model.forward.call_count == 1
         assert inner_model.forward.call_count == 1
@@ -370,8 +399,9 @@ def test_nested_wrappers(self):
         # Run again. Expect outer wrapper to replay.
         # The outer model should NOT be called because the whole graph
         # is replayed.
-        action = self._run_and_monitor_call(full_wrapper, input_1,
-                                            CUDAGraphMode.FULL, desc_1)
+        action = self._run_and_monitor_call(
+            full_wrapper, input_1, CUDAGraphMode.FULL, desc_1
+        )
         assert action == "replay"
         assert outer_model.forward.call_count == 1  # No new call
         assert inner_model.forward.call_count == 1
@@ -382,16 +412,18 @@ def test_nested_wrappers(self):
         # Run with PIECEWISE mode context.
         # Expect outer wrapper to bypass and call inner wrapper.
         # Inner wrapper should capture.
-        action = self._run_and_monitor_call(full_wrapper, input_1,
-                                            CUDAGraphMode.PIECEWISE, desc_1)
+        action = self._run_and_monitor_call(
+            full_wrapper, input_1, CUDAGraphMode.PIECEWISE, desc_1
+        )
         assert action == "capture_global"
         assert outer_model.forward.call_count == 1
         assert inner_model.forward.call_count == 1
 
         # Run again with PIECEWISE.
         # Outer bypasses, inner replays.
-        action = self._run_and_monitor_call(full_wrapper, input_1,
-                                            CUDAGraphMode.PIECEWISE, desc_1)
+        action = self._run_and_monitor_call(
+            full_wrapper, input_1, CUDAGraphMode.PIECEWISE, desc_1
+        )
         assert action == "bypass"
         assert outer_model.forward.call_count == 2
         assert inner_model.forward.call_count == 1
diff --git a/tests/v1/cudagraph/test_cudagraph_mode.py b/tests/v1/cudagraph/test_cudagraph_mode.py
index c4116247bb7c..77d5c5d87fc1 100644
--- a/tests/v1/cudagraph/test_cudagraph_mode.py
+++ b/tests/v1/cudagraph/test_cudagraph_mode.py
@@ -45,10 +45,8 @@ def temporary_environ(env_vars):
 ]
 
 
-@pytest.mark.parametrize("backend_name, cudagraph_mode, supported",
-                         combo_cases_1)
-def test_backend_and_cudagraph_mode_combo(backend_name, cudagraph_mode,
-                                          supported):
+@pytest.mark.parametrize("backend_name, cudagraph_mode, supported", combo_cases_1)
+def test_backend_and_cudagraph_mode_combo(backend_name, cudagraph_mode, supported):
     if backend_name == "FlashInfer":
         try:
             import flashinfer  # noqa: F401
@@ -56,8 +54,10 @@ def test_backend_and_cudagraph_mode_combo(backend_name, cudagraph_mode,
             pytest.skip("FlashInfer is not installed")
     backend_config = backend_configs[backend_name]
     # Dynamically skip test if GPU capability is not met
-    if backend_config.specific_gpu_arch and backend_config.specific_gpu_arch\
-        != current_platform.get_device_capability():
+    if (
+        backend_config.specific_gpu_arch
+        and backend_config.specific_gpu_arch != current_platform.get_device_capability()
+    ):
         pytest.skip("Only Hopper GPUs support FA3 and FlashMLA")
 
     env_vars = {"VLLM_USE_V1": "1", **backend_configs[backend_name].env_vars}
@@ -66,13 +66,16 @@ def test_backend_and_cudagraph_mode_combo(backend_name, cudagraph_mode,
         if not supported:
             stack.enter_context(pytest.raises(Exception))
 
-        llm = LLM(model="Qwen/Qwen2-1.5B-Instruct",
-                  max_num_seqs=256,
-                  trust_remote_code=True,
-                  gpu_memory_utilization=0.45,
-                  max_model_len=1024,
-                  compilation_config=CompilationConfig(
-                      level=3, cudagraph_mode=cudagraph_mode))
+        llm = LLM(
+            model="Qwen/Qwen2-1.5B-Instruct",
+            max_num_seqs=256,
+            trust_remote_code=True,
+            gpu_memory_utilization=0.45,
+            max_model_len=1024,
+            compilation_config=CompilationConfig(
+                level=3, cudagraph_mode=cudagraph_mode
+            ),
+        )
         llm.generate(["Hello, my name is"] * 10)
     # when above code raises, `llm` may be undefined, so we need to catch that
     try:
@@ -93,10 +96,13 @@ def test_backend_and_cudagraph_mode_combo(backend_name, cudagraph_mode,
     ("FA2", "FULL", 0, True),  # no compilation + full cudagraph
     ("FA2", "FULL", 3, True),  # piecewise compilation + full cudagraph
     ("FA2", "PIECEWISE", 0, False),  # no compilation + piecewise cudagraph
-    ("FA2", "PIECEWISE", 3,
-     True),  # piecewise compilation + piecewise cudagraph
-    ("FA2", "FULL_AND_PIECEWISE", 0,
-     False),  # piecewise cudagraph not supported without piecewise compilation
+    ("FA2", "PIECEWISE", 3, True),  # piecewise compilation + piecewise cudagraph
+    (
+        "FA2",
+        "FULL_AND_PIECEWISE",
+        0,
+        False,
+    ),  # piecewise cudagraph not supported without piecewise compilation
     ("FA2", "FULL_AND_PIECEWISE", 3, True),
     ("FA2", "FULL_DECODE_ONLY", 0, True),
     ("FA2", "FULL_DECODE_ONLY", 3, True),
@@ -105,11 +111,11 @@ def test_backend_and_cudagraph_mode_combo(backend_name, cudagraph_mode,
 ]
 
 
-@pytest.mark.parametrize("backend_name,cudagraph_mode,compilation_level,"\
-                         "supported", combo_cases_2)
+@pytest.mark.parametrize(
+    "backend_name,cudagraph_mode,compilation_level,supported", combo_cases_2
+)
 def test_cudagraph_compilation_combo(combo_case):
-    backend_name, cudagraph_mode, compilation_level, supported\
-        = combo_case
+    backend_name, cudagraph_mode, compilation_level, supported = combo_case
 
     env_vars = {"VLLM_USE_V1": "1", **backend_configs[backend_name].env_vars}
 
@@ -117,13 +123,16 @@ def test_cudagraph_compilation_combo(combo_case):
         if not supported:
             stack.enter_context(pytest.raises(Exception))
 
-        llm = LLM(model="Qwen/Qwen2-1.5B-Instruct",
-                  max_num_seqs=256,
-                  trust_remote_code=True,
-                  gpu_memory_utilization=0.45,
-                  max_model_len=1024,
-                  compilation_config=CompilationConfig(
-                      level=compilation_level, cudagraph_mode=cudagraph_mode))
+        llm = LLM(
+            model="Qwen/Qwen2-1.5B-Instruct",
+            max_num_seqs=256,
+            trust_remote_code=True,
+            gpu_memory_utilization=0.45,
+            max_model_len=1024,
+            compilation_config=CompilationConfig(
+                level=compilation_level, cudagraph_mode=cudagraph_mode
+            ),
+        )
         llm.generate(["Hello, my name is"] * 10)
     # when above code raises, `llm` may be undefined, so we need to catch that
     try:
diff --git a/tests/v1/distributed/test_async_llm_dp.py b/tests/v1/distributed/test_async_llm_dp.py
index cef0f362cff8..75314dc37303 100644
--- a/tests/v1/distributed/test_async_llm_dp.py
+++ b/tests/v1/distributed/test_async_llm_dp.py
@@ -30,34 +30,38 @@
 
 
 async def generate(
-        engine: AsyncLLM,
-        request_id: str,
-        prompt: PromptType,
-        output_kind: RequestOutputKind,
-        max_tokens: int,
-        prompt_logprobs: Optional[int] = None,
-        data_parallel_rank: Optional[int] = None) -> tuple[int, str]:
+    engine: AsyncLLM,
+    request_id: str,
+    prompt: PromptType,
+    output_kind: RequestOutputKind,
+    max_tokens: int,
+    prompt_logprobs: Optional[int] = None,
+    data_parallel_rank: Optional[int] = None,
+) -> tuple[int, str]:
     # Ensure generate doesn't complete too fast for cancellation test.
     await asyncio.sleep(0.2)
 
     count = 0
-    sampling_params = SamplingParams(max_tokens=max_tokens,
-                                     ignore_eos=True,
-                                     output_kind=output_kind,
-                                     temperature=0,
-                                     prompt_logprobs=prompt_logprobs)
-    async for out in engine.generate(request_id=request_id,
-                                     prompt=prompt,
-                                     sampling_params=sampling_params,
-                                     data_parallel_rank=data_parallel_rank):
-
+    sampling_params = SamplingParams(
+        max_tokens=max_tokens,
+        ignore_eos=True,
+        output_kind=output_kind,
+        temperature=0,
+        prompt_logprobs=prompt_logprobs,
+    )
+    async for out in engine.generate(
+        request_id=request_id,
+        prompt=prompt,
+        sampling_params=sampling_params,
+        data_parallel_rank=data_parallel_rank,
+    ):
         num_tokens = len(out.outputs[0].token_ids)
         if output_kind == RequestOutputKind.DELTA:
             count += num_tokens
         else:
             count = num_tokens
 
-        await asyncio.sleep(0.)
+        await asyncio.sleep(0.0)
 
     return count, request_id
 
@@ -72,9 +76,9 @@ async def generate(
 @pytest.mark.parametrize("data_parallel_backend", ["mp", "ray"])
 @pytest.mark.parametrize("async_scheduling", [True, False])
 @pytest.mark.asyncio
-async def test_load(output_kind: RequestOutputKind, data_parallel_backend: str,
-                    async_scheduling: bool):
-
+async def test_load(
+    output_kind: RequestOutputKind, data_parallel_backend: str, async_scheduling: bool
+):
     stats_loggers = {}
 
     @dataclass
@@ -85,25 +89,26 @@ class SimpleStatsLogger(StatLoggerBase):
         def __init__(self, vllm_config: VllmConfig, engine_index: int = 0):
             stats_loggers[engine_index] = self
 
-        def record(self,
-                   scheduler_stats: Optional[SchedulerStats],
-                   iteration_stats: Optional[IterationStats],
-                   engine_idx: int = 0):
+        def record(
+            self,
+            scheduler_stats: Optional[SchedulerStats],
+            iteration_stats: Optional[IterationStats],
+            engine_idx: int = 0,
+        ):
             if iteration_stats:
-                self.finished_req_count += len(
-                    iteration_stats.finished_requests)
+                self.finished_req_count += len(iteration_stats.finished_requests)
 
         def log_engine_initialized(self):
             self.init_count += 1
 
     with ExitStack() as after:
-
         prompt = "This is a test of data parallel"
 
         engine_args.data_parallel_backend = data_parallel_backend
         engine_args.async_scheduling = async_scheduling
-        engine = AsyncLLM.from_engine_args(engine_args,
-                                           stat_loggers=[SimpleStatsLogger])
+        engine = AsyncLLM.from_engine_args(
+            engine_args, stat_loggers=[SimpleStatsLogger]
+        )
         after.callback(engine.shutdown)
 
         NUM_REQUESTS = 100
@@ -116,20 +121,23 @@ def log_engine_initialized(self):
         for request_id in request_ids:
             tasks.append(
                 asyncio.create_task(
-                    generate(engine, request_id, prompt, output_kind,
-                             NUM_EXPECTED_TOKENS)))
+                    generate(
+                        engine, request_id, prompt, output_kind, NUM_EXPECTED_TOKENS
+                    )
+                )
+            )
             # Short sleep to ensure that requests are distributed.
             await asyncio.sleep(0.01)
         # Confirm that we got all the EXPECTED tokens from the requests.
-        done, pending = await asyncio.wait(tasks,
-                                           return_when=asyncio.FIRST_EXCEPTION)
+        done, pending = await asyncio.wait(tasks, return_when=asyncio.FIRST_EXCEPTION)
         for task in pending:
             task.cancel()
         for task in done:
             num_generated_tokens, request_id = await task
             assert num_generated_tokens == NUM_EXPECTED_TOKENS, (
                 f"{request_id} generated {num_generated_tokens} but "
-                f"expected {NUM_EXPECTED_TOKENS}")
+                f"expected {NUM_EXPECTED_TOKENS}"
+            )
 
         assert not engine.output_processor.has_unfinished_requests()
 
@@ -153,5 +161,6 @@ def log_engine_initialized(self):
         for sl in stats_loggers.values():
             slogger: SimpleStatsLogger = sl
 
-            assert slogger.finished_req_count > NUM_REQUESTS // (
-                DP_SIZE + 1), f"requests are imbalanced: {stats_loggers}"
+            assert slogger.finished_req_count > NUM_REQUESTS // (DP_SIZE + 1), (
+                f"requests are imbalanced: {stats_loggers}"
+            )
diff --git a/tests/v1/distributed/test_external_lb_dp.py b/tests/v1/distributed/test_external_lb_dp.py
index 862a76f3c4e2..912f8cffe7f6 100644
--- a/tests/v1/distributed/test_external_lb_dp.py
+++ b/tests/v1/distributed/test_external_lb_dp.py
@@ -26,12 +26,14 @@ class ExternalLBServerManager:
     """Manages data parallel vLLM server instances for external
     load balancer testing."""
 
-    def __init__(self,
-                 model_name: str,
-                 dp_size: int,
-                 api_server_count: int,
-                 base_server_args: list,
-                 tp_size: int = TP_SIZE):
+    def __init__(
+        self,
+        model_name: str,
+        dp_size: int,
+        api_server_count: int,
+        base_server_args: list,
+        tp_size: int = TP_SIZE,
+    ):
         self.model_name = model_name
         self.dp_size = dp_size
         self.tp_size = tp_size
@@ -47,20 +49,22 @@ def __enter__(self) -> list[tuple[RemoteOpenAIServer, list[str]]]:
             server_args = self.base_server_args.copy()
 
             # Add external LB specific arguments
-            server_args.extend([
-                "--data-parallel-size",
-                str(self.dp_size),
-                "--data-parallel-rank",
-                str(rank),
-                "--data-parallel-size-local",
-                "1",
-                "--tensor-parallel-size",
-                str(self.tp_size),
-                "--port",
-                str(8000 + rank),  # Different port for each rank
-                "--api-server-count",
-                str(self.api_server_count),
-            ])
+            server_args.extend(
+                [
+                    "--data-parallel-size",
+                    str(self.dp_size),
+                    "--data-parallel-rank",
+                    str(rank),
+                    "--data-parallel-size-local",
+                    "1",
+                    "--tensor-parallel-size",
+                    str(self.tp_size),
+                    "--port",
+                    str(8000 + rank),  # Different port for each rank
+                    "--api-server-count",
+                    str(self.api_server_count),
+                ]
+            )
 
             # Use a thread to start each server to allow parallel initialization
             def start_server(r: int, sargs: list[str]):
@@ -71,25 +75,24 @@ def start_server(r: int, sargs: list[str]):
                         sargs,
                         auto_port=False,
                         env_dict={
-                            "VLLM_SERVER_DEV_MODE":
-                            "1",
-                            current_platform.device_control_env_var:
-                            ",".join(
-                                str(
-                                    current_platform.
-                                    device_id_to_physical_device_id(i))
-                                for i in range(r * TP_SIZE, (r + 1) * TP_SIZE))
-                        })
+                            "VLLM_SERVER_DEV_MODE": "1",
+                            current_platform.device_control_env_var: ",".join(
+                                str(current_platform.device_id_to_physical_device_id(i))
+                                for i in range(r * TP_SIZE, (r + 1) * TP_SIZE)
+                            ),
+                        },
+                    )
                     server.__enter__()
-                    print(f"Server rank {r} started successfully with "
-                          f"{self.api_server_count} API servers")
+                    print(
+                        f"Server rank {r} started successfully with "
+                        f"{self.api_server_count} API servers"
+                    )
                     self.servers.append((server, sargs))
                 except Exception as e:
                     print(f"Failed to start server rank {r}: {e}")
                     raise
 
-            thread = threading.Thread(target=start_server,
-                                      args=(rank, server_args))
+            thread = threading.Thread(target=start_server, args=(rank, server_args))
             thread.start()
 
             self.server_threads.append(thread)
@@ -132,9 +135,9 @@ def default_server_args():
 @pytest.fixture(scope="module", params=[1, 4])
 def server_manager(request, default_server_args):
     api_server_count = request.param
-    server_manager = ExternalLBServerManager(MODEL_NAME, DP_SIZE,
-                                             api_server_count,
-                                             default_server_args)
+    server_manager = ExternalLBServerManager(
+        MODEL_NAME, DP_SIZE, api_server_count, default_server_args
+    )
 
     with server_manager:
         yield server_manager
@@ -174,18 +177,16 @@ def test_external_lb_server_info(server_manager):
         # `n_reqs` is set so that there is a good chance each server
         # receives at least one request
         n_reqs = 2 * api_server_count * api_server_count
-        parallel_configs = [
-            _get_parallel_config(server) for _ in range(n_reqs)
-        ]
-        api_process_counts = [
-            c["_api_process_count"] for c in parallel_configs
-        ]
+        parallel_configs = [_get_parallel_config(server) for _ in range(n_reqs)]
+        api_process_counts = [c["_api_process_count"] for c in parallel_configs]
         api_process_ranks = [c["_api_process_rank"] for c in parallel_configs]
 
-        assert all(c == api_server_count
-                   for c in api_process_counts), api_process_counts
-        assert all(0 <= r < api_server_count
-                   for r in api_process_ranks), api_process_ranks
+        assert all(c == api_server_count for c in api_process_counts), (
+            api_process_counts
+        )
+        assert all(0 <= r < api_server_count for r in api_process_ranks), (
+            api_process_ranks
+        )
 
 
 @pytest.mark.asyncio
@@ -193,16 +194,15 @@ def test_external_lb_server_info(server_manager):
     "model_name",
     [MODEL_NAME],
 )
-async def test_external_lb_single_completion(clients: list[
-    openai.AsyncOpenAI], servers: list[tuple[RemoteOpenAIServer, list[str]]],
-                                             model_name: str) -> None:
-
+async def test_external_lb_single_completion(
+    clients: list[openai.AsyncOpenAI],
+    servers: list[tuple[RemoteOpenAIServer, list[str]]],
+    model_name: str,
+) -> None:
     async def make_request(client: openai.AsyncOpenAI):
         completion = await client.completions.create(
-            model=model_name,
-            prompt="Hello, my name is",
-            max_tokens=10,
-            temperature=1.0)
+            model=model_name, prompt="Hello, my name is", max_tokens=10, temperature=1.0
+        )
 
         assert completion.id is not None
         assert completion.choices is not None and len(completion.choices) == 1
@@ -256,11 +256,14 @@ async def make_request(client: openai.AsyncOpenAI):
 
     _, server_args = servers[0]
     api_server_count = (
-        server_args.count('--api-server-count')
-        and server_args[server_args.index('--api-server-count') + 1] or 1)
+        server_args.count("--api-server-count")
+        and server_args[server_args.index("--api-server-count") + 1]
+        or 1
+    )
     print(
         f"Successfully completed external LB test with {len(clients)} servers "
-        f"(API server count: {api_server_count})")
+        f"(API server count: {api_server_count})"
+    )
 
 
 @pytest.mark.asyncio
@@ -268,9 +271,11 @@ async def make_request(client: openai.AsyncOpenAI):
     "model_name",
     [MODEL_NAME],
 )
-async def test_external_lb_completion_streaming(clients: list[
-    openai.AsyncOpenAI], servers: list[tuple[RemoteOpenAIServer, list[str]]],
-                                                model_name: str) -> None:
+async def test_external_lb_completion_streaming(
+    clients: list[openai.AsyncOpenAI],
+    servers: list[tuple[RemoteOpenAIServer, list[str]]],
+    model_name: str,
+) -> None:
     prompt = "What is an LLM?"
 
     async def make_streaming_request(client: openai.AsyncOpenAI):
@@ -284,11 +289,9 @@ async def make_streaming_request(client: openai.AsyncOpenAI):
         single_output = single_completion.choices[0].text
 
         # Perform the streaming request
-        stream = await client.completions.create(model=model_name,
-                                                 prompt=prompt,
-                                                 max_tokens=5,
-                                                 temperature=0.0,
-                                                 stream=True)
+        stream = await client.completions.create(
+            model=model_name, prompt=prompt, max_tokens=5, temperature=0.0, stream=True
+        )
         chunks: list[str] = []
         finish_reason_count = 0
         last_chunk = None
@@ -299,16 +302,15 @@ async def make_streaming_request(client: openai.AsyncOpenAI):
             last_chunk = chunk  # Keep track of the last chunk
 
         # finish reason should only return in the last block for OpenAI API
-        assert finish_reason_count == 1, (
-            "Finish reason should appear exactly once.")
-        assert last_chunk is not None, (
-            "Stream should have yielded at least one chunk.")
-        assert last_chunk.choices[
-            0].finish_reason == "length", "Finish reason should be 'length'."
+        assert finish_reason_count == 1, "Finish reason should appear exactly once."
+        assert last_chunk is not None, "Stream should have yielded at least one chunk."
+        assert last_chunk.choices[0].finish_reason == "length", (
+            "Finish reason should be 'length'."
+        )
         # Check that the combined text matches the non-streamed version.
-        assert "".join(
-            chunks
-        ) == single_output, "Streamed output should match non-streamed output."
+        assert "".join(chunks) == single_output, (
+            "Streamed output should match non-streamed output."
+        )
         return True  # Indicate success for this request
 
     # Test single request to each server
@@ -324,10 +326,7 @@ async def make_streaming_request(client: openai.AsyncOpenAI):
     all_tasks = []
 
     for i, client in enumerate(clients):
-        tasks = [
-            make_streaming_request(client)
-            for _ in range(num_requests_per_server)
-        ]
+        tasks = [make_streaming_request(client) for _ in range(num_requests_per_server)]
         all_tasks.extend(tasks)
 
     results = await asyncio.gather(*all_tasks)
@@ -339,10 +338,7 @@ async def make_streaming_request(client: openai.AsyncOpenAI):
     # Second burst of streaming requests
     all_tasks = []
     for i, client in enumerate(clients):
-        tasks = [
-            make_streaming_request(client)
-            for _ in range(num_requests_per_server)
-        ]
+        tasks = [make_streaming_request(client) for _ in range(num_requests_per_server)]
         all_tasks.extend(tasks)
 
     results = await asyncio.gather(*all_tasks)
@@ -351,7 +347,11 @@ async def make_streaming_request(client: openai.AsyncOpenAI):
 
     _, server_args = servers[0]
     api_server_count = (
-        server_args.count('--api-server-count')
-        and server_args[server_args.index('--api-server-count') + 1] or 1)
-    print(f"Successfully completed external LB streaming test with "
-          f"{len(clients)} servers (API server count: {api_server_count})")
+        server_args.count("--api-server-count")
+        and server_args[server_args.index("--api-server-count") + 1]
+        or 1
+    )
+    print(
+        f"Successfully completed external LB streaming test with "
+        f"{len(clients)} servers (API server count: {api_server_count})"
+    )
diff --git a/tests/v1/distributed/test_hybrid_lb_dp.py b/tests/v1/distributed/test_hybrid_lb_dp.py
index 21d8009a6dbb..aa25130752a4 100644
--- a/tests/v1/distributed/test_hybrid_lb_dp.py
+++ b/tests/v1/distributed/test_hybrid_lb_dp.py
@@ -28,17 +28,19 @@
 
 
 class HybridLBServerManager:
-    """Manages hybrid data parallel vLLM server instances where each node 
-    runs a single logical API server that balances requests only to the 
+    """Manages hybrid data parallel vLLM server instances where each node
+    runs a single logical API server that balances requests only to the
     DP engines running on that same node."""
 
-    def __init__(self,
-                 model_name: str,
-                 dp_size: int,
-                 api_server_count: int,
-                 base_server_args: list,
-                 dp_size_local: int = DP_SIZE_LOCAL,
-                 tp_size: int = TP_SIZE):
+    def __init__(
+        self,
+        model_name: str,
+        dp_size: int,
+        api_server_count: int,
+        base_server_args: list,
+        dp_size_local: int = DP_SIZE_LOCAL,
+        tp_size: int = TP_SIZE,
+    ):
         self.model_name = model_name
         self.dp_size = dp_size
         self.dp_size_local = dp_size_local
@@ -59,25 +61,27 @@ def __enter__(self) -> list[tuple[RemoteOpenAIServer, list[str]]]:
             start_rank = node_id * self.dp_size_local
 
             # Add hybrid LB specific arguments
-            server_args.extend([
-                "--data-parallel-size",
-                str(self.dp_size),
-                "--data-parallel-size-local",
-                str(self.dp_size_local),
-                "--data-parallel-start-rank",
-                str(start_rank),
-                "--data-parallel-hybrid-lb",  # Enable hybrid LB mode
-                "--tensor-parallel-size",
-                str(self.tp_size),
-                "--port",
-                str(8000 + node_id),  # Different port for each node
-                "--api-server-count",
-                str(self.api_server_count),
-                "--data-parallel-address",
-                "127.0.0.1",
-                "--data-parallel-rpc-port",
-                "13345",
-            ])
+            server_args.extend(
+                [
+                    "--data-parallel-size",
+                    str(self.dp_size),
+                    "--data-parallel-size-local",
+                    str(self.dp_size_local),
+                    "--data-parallel-start-rank",
+                    str(start_rank),
+                    "--data-parallel-hybrid-lb",  # Enable hybrid LB mode
+                    "--tensor-parallel-size",
+                    str(self.tp_size),
+                    "--port",
+                    str(8000 + node_id),  # Different port for each node
+                    "--api-server-count",
+                    str(self.api_server_count),
+                    "--data-parallel-address",
+                    "127.0.0.1",
+                    "--data-parallel-rpc-port",
+                    "13345",
+                ]
+            )
 
             # Use a thread to start each server to allow parallel initialization
             def start_server(node: int, sargs: list[str]):
@@ -93,26 +97,25 @@ def start_server(node: int, sargs: list[str]):
                         sargs,
                         auto_port=False,
                         env_dict={
-                            "VLLM_SERVER_DEV_MODE":
-                            "1",
-                            current_platform.device_control_env_var:
-                            ",".join(
-                                str(
-                                    current_platform.
-                                    device_id_to_physical_device_id(i))
-                                for i in range(gpu_start, gpu_end))
-                        })
+                            "VLLM_SERVER_DEV_MODE": "1",
+                            current_platform.device_control_env_var: ",".join(
+                                str(current_platform.device_id_to_physical_device_id(i))
+                                for i in range(gpu_start, gpu_end)
+                            ),
+                        },
+                    )
                     server.__enter__()
-                    print(f"Hybrid LB node {node} started successfully with "
-                          f"{self.dp_size_local} local DP ranks and "
-                          f"{self.api_server_count} API servers")
+                    print(
+                        f"Hybrid LB node {node} started successfully with "
+                        f"{self.dp_size_local} local DP ranks and "
+                        f"{self.api_server_count} API servers"
+                    )
                     self.servers.append((server, sargs))
                 except Exception as e:
                     print(f"Failed to start hybrid LB node {node}: {e}")
                     raise
 
-            thread = threading.Thread(target=start_server,
-                                      args=(node_id, server_args))
+            thread = threading.Thread(target=start_server, args=(node_id, server_args))
             thread.start()
 
             self.server_threads.append(thread)
@@ -155,10 +158,14 @@ def default_server_args():
 @pytest.fixture(scope="module", params=[1, 4])
 def server_manager(request, default_server_args):
     api_server_count = request.param
-    server_manager = HybridLBServerManager(MODEL_NAME, DP_SIZE,
-                                           api_server_count,
-                                           default_server_args, DP_SIZE_LOCAL,
-                                           TP_SIZE)
+    server_manager = HybridLBServerManager(
+        MODEL_NAME,
+        DP_SIZE,
+        api_server_count,
+        default_server_args,
+        DP_SIZE_LOCAL,
+        TP_SIZE,
+    )
 
     with server_manager:
         yield server_manager
@@ -198,18 +205,16 @@ def test_hybrid_dp_server_info(server_manager):
         # `n_reqs` is set so that there is a good chance each server
         # receives at least one request
         n_reqs = 2 * api_server_count * api_server_count
-        parallel_configs = [
-            _get_parallel_config(server) for _ in range(n_reqs)
-        ]
-        api_process_counts = [
-            c["_api_process_count"] for c in parallel_configs
-        ]
+        parallel_configs = [_get_parallel_config(server) for _ in range(n_reqs)]
+        api_process_counts = [c["_api_process_count"] for c in parallel_configs]
         api_process_ranks = [c["_api_process_rank"] for c in parallel_configs]
 
-        assert all(c == api_server_count
-                   for c in api_process_counts), api_process_counts
-        assert all(0 <= r < api_server_count
-                   for r in api_process_ranks), api_process_ranks
+        assert all(c == api_server_count for c in api_process_counts), (
+            api_process_counts
+        )
+        assert all(0 <= r < api_server_count for r in api_process_ranks), (
+            api_process_ranks
+        )
 
 
 @pytest.mark.asyncio
@@ -217,17 +222,15 @@ def test_hybrid_dp_server_info(server_manager):
     "model_name",
     [MODEL_NAME],
 )
-async def test_hybrid_lb_completion(clients: list[openai.AsyncOpenAI],
-                                    servers: list[tuple[RemoteOpenAIServer,
-                                                        list[str]]],
-                                    model_name: str) -> None:
-
+async def test_hybrid_lb_completion(
+    clients: list[openai.AsyncOpenAI],
+    servers: list[tuple[RemoteOpenAIServer, list[str]]],
+    model_name: str,
+) -> None:
     async def make_request(client: openai.AsyncOpenAI):
         completion = await client.completions.create(
-            model=model_name,
-            prompt="Hello, my name is",
-            max_tokens=5,
-            temperature=1.0)
+            model=model_name, prompt="Hello, my name is", max_tokens=5, temperature=1.0
+        )
 
         assert completion.id is not None
         assert completion.choices is not None and len(completion.choices) == 1
@@ -251,9 +254,7 @@ async def make_request(client: openai.AsyncOpenAI):
     for i, client in enumerate(clients):
         result = await make_request(client)
         assert result is not None
-        print(
-            f"Hybrid LB node {i} handled single completion request successfully"
-        )
+        print(f"Hybrid LB node {i} handled single completion request successfully")
 
     await asyncio.sleep(0.5)
 
@@ -284,8 +285,10 @@ async def make_request(client: openai.AsyncOpenAI):
 
     _, server_args = servers[0]
     api_server_count = (
-        server_args.count('--api-server-count')
-        and server_args[server_args.index('--api-server-count') + 1] or 1)
+        server_args.count("--api-server-count")
+        and server_args[server_args.index("--api-server-count") + 1]
+        or 1
+    )
     print(
         f"Successfully completed hybrid LB test with {len(clients)} nodes "
         f"({DP_SIZE_LOCAL} DP ranks each, API server count: {api_server_count})"
@@ -302,9 +305,11 @@ async def make_request(client: openai.AsyncOpenAI):
     "model_name",
     [MODEL_NAME],
 )
-async def test_hybrid_lb_completion_streaming(clients: list[
-    openai.AsyncOpenAI], servers: list[tuple[RemoteOpenAIServer, list[str]]],
-                                              model_name: str) -> None:
+async def test_hybrid_lb_completion_streaming(
+    clients: list[openai.AsyncOpenAI],
+    servers: list[tuple[RemoteOpenAIServer, list[str]]],
+    model_name: str,
+) -> None:
     prompt = "What is an LLM?"
 
     async def make_streaming_request(client: openai.AsyncOpenAI):
@@ -318,11 +323,9 @@ async def make_streaming_request(client: openai.AsyncOpenAI):
         single_output = single_completion.choices[0].text
 
         # Perform the streaming request
-        stream = await client.completions.create(model=model_name,
-                                                 prompt=prompt,
-                                                 max_tokens=5,
-                                                 temperature=0.0,
-                                                 stream=True)
+        stream = await client.completions.create(
+            model=model_name, prompt=prompt, max_tokens=5, temperature=0.0, stream=True
+        )
         chunks: list[str] = []
         finish_reason_count = 0
         last_chunk = None
@@ -333,25 +336,22 @@ async def make_streaming_request(client: openai.AsyncOpenAI):
             last_chunk = chunk  # Keep track of the last chunk
 
         # finish reason should only return in the last block for OpenAI API
-        assert finish_reason_count == 1, (
-            "Finish reason should appear exactly once.")
-        assert last_chunk is not None, (
-            "Stream should have yielded at least one chunk.")
-        assert last_chunk.choices[
-            0].finish_reason == "length", "Finish reason should be 'length'."
+        assert finish_reason_count == 1, "Finish reason should appear exactly once."
+        assert last_chunk is not None, "Stream should have yielded at least one chunk."
+        assert last_chunk.choices[0].finish_reason == "length", (
+            "Finish reason should be 'length'."
+        )
         # Check that the combined text matches the non-streamed version.
-        assert "".join(
-            chunks
-        ) == single_output, "Streamed output should match non-streamed output."
+        assert "".join(chunks) == single_output, (
+            "Streamed output should match non-streamed output."
+        )
         return True  # Indicate success for this request
 
     # Test single request to each node
     for i, client in enumerate(clients):
         result = await make_streaming_request(client)
         assert result is not None
-        print(
-            f"Hybrid LB node {i} handled single streaming request successfully"
-        )
+        print(f"Hybrid LB node {i} handled single streaming request successfully")
 
     await asyncio.sleep(0.5)
 
@@ -382,11 +382,15 @@ async def make_streaming_request(client: openai.AsyncOpenAI):
 
     _, server_args = servers[0]
     api_server_count = (
-        server_args.count('--api-server-count')
-        and server_args[server_args.index('--api-server-count') + 1] or 1)
-    print(f"Successfully completed hybrid LB streaming test with "
-          f"{len(clients)} nodes ({DP_SIZE_LOCAL} DP ranks each, "
-          f"API server count: {api_server_count})")
+        server_args.count("--api-server-count")
+        and server_args[server_args.index("--api-server-count") + 1]
+        or 1
+    )
+    print(
+        f"Successfully completed hybrid LB streaming test with "
+        f"{len(clients)} nodes ({DP_SIZE_LOCAL} DP ranks each, "
+        f"API server count: {api_server_count})"
+    )
 
     # Check request balancing within each node
     for i, (server, _) in enumerate(servers):
diff --git a/tests/v1/distributed/test_internal_lb_dp.py b/tests/v1/distributed/test_internal_lb_dp.py
index 3f9defd13dea..452d3682e65d 100644
--- a/tests/v1/distributed/test_internal_lb_dp.py
+++ b/tests/v1/distributed/test_internal_lb_dp.py
@@ -31,66 +31,71 @@ class MultinodeInternalLBServerManager:
     """Manages multi-node data parallel vLLM server instances for internal
     load balancer testing using --headless mode."""
 
-    def __init__(self,
-                 model_name: str,
-                 dp_size: int,
-                 api_server_count: int,
-                 base_server_args: list,
-                 dp_per_node: int = 1,
-                 tp_size: int = TP_SIZE):
+    def __init__(
+        self,
+        model_name: str,
+        dp_size: int,
+        api_server_count: int,
+        base_server_args: list,
+        dp_per_node: int = 1,
+        tp_size: int = TP_SIZE,
+    ):
         self.model_name = model_name
         self.dp_size = dp_size
         self.dp_per_node = dp_per_node
         self.tp_size = tp_size
         self.api_server_count = api_server_count
         self.base_server_args = base_server_args
-        self.servers: list[Optional[tuple[RemoteOpenAIServer,
-                                          list[str]]]] = [None] * (dp_size //
-                                                                   dp_per_node)
+        self.servers: list[Optional[tuple[RemoteOpenAIServer, list[str]]]] = [None] * (
+            dp_size // dp_per_node
+        )
         self.server_threads: list[threading.Thread] = []
 
     def __enter__(self) -> list[tuple[RemoteOpenAIServer, list[str]]]:
         """Start all server instances for multi-node internal LB mode."""
-        for server_idx, rank in enumerate(
-                range(0, self.dp_size, self.dp_per_node)):
+        for server_idx, rank in enumerate(range(0, self.dp_size, self.dp_per_node)):
             # Create server args for this specific rank
             server_args = self.base_server_args.copy()
 
             if rank == 0:
                 # Head node - runs API server and first DP rank
-                server_args.extend([
-                    "--data-parallel-size",
-                    str(self.dp_size),
-                    "--data-parallel-size-local",
-                    str(self.dp_per_node),
-                    "--tensor-parallel-size",
-                    str(self.tp_size),
-                    "--port",
-                    "8000",  # Single endpoint for all requests
-                    "--api-server-count",
-                    str(self.api_server_count),
-                    "--data-parallel-address",
-                    "127.0.0.1",
-                    "--data-parallel-rpc-port",
-                    "13345",
-                ])
+                server_args.extend(
+                    [
+                        "--data-parallel-size",
+                        str(self.dp_size),
+                        "--data-parallel-size-local",
+                        str(self.dp_per_node),
+                        "--tensor-parallel-size",
+                        str(self.tp_size),
+                        "--port",
+                        "8000",  # Single endpoint for all requests
+                        "--api-server-count",
+                        str(self.api_server_count),
+                        "--data-parallel-address",
+                        "127.0.0.1",
+                        "--data-parallel-rpc-port",
+                        "13345",
+                    ]
+                )
             else:
                 # Secondary nodes - run in headless mode
-                server_args.extend([
-                    "--headless",
-                    "--data-parallel-size",
-                    str(self.dp_size),
-                    "--data-parallel-size-local",
-                    str(self.dp_per_node),
-                    "--data-parallel-start-rank",
-                    str(rank),
-                    "--tensor-parallel-size",
-                    str(self.tp_size),
-                    "--data-parallel-address",
-                    "127.0.0.1",
-                    "--data-parallel-rpc-port",
-                    "13345",
-                ])
+                server_args.extend(
+                    [
+                        "--headless",
+                        "--data-parallel-size",
+                        str(self.dp_size),
+                        "--data-parallel-size-local",
+                        str(self.dp_per_node),
+                        "--data-parallel-start-rank",
+                        str(rank),
+                        "--tensor-parallel-size",
+                        str(self.tp_size),
+                        "--data-parallel-address",
+                        "127.0.0.1",
+                        "--data-parallel-rpc-port",
+                        "13345",
+                    ]
+                )
 
             # Use a thread to start each server to allow parallel initialization
             def start_server(sidx: int, r: int, sargs: list[str]):
@@ -102,20 +107,19 @@ def start_server(sidx: int, r: int, sargs: list[str]):
                         sargs,
                         auto_port=False,
                         env_dict={
-                            "VLLM_SERVER_DEV_MODE":
-                            "1",
-                            current_platform.device_control_env_var:
-                            ",".join(
-                                str(
-                                    current_platform.
-                                    device_id_to_physical_device_id(i))
-                                for i in range(r, r + gpus_per_node))
-                        })
+                            "VLLM_SERVER_DEV_MODE": "1",
+                            current_platform.device_control_env_var: ",".join(
+                                str(current_platform.device_id_to_physical_device_id(i))
+                                for i in range(r, r + gpus_per_node)
+                            ),
+                        },
+                    )
                     server.__enter__()
                     if r == 0:
                         print(
                             f"Head node (rank {r}) started successfully with "
-                            f"{self.api_server_count} API servers")
+                            f"{self.api_server_count} API servers"
+                        )
                     else:
                         print(f"Headless node (rank {r}) started successfully")
                     self.servers[sidx] = (server, sargs)
@@ -124,8 +128,9 @@ def start_server(sidx: int, r: int, sargs: list[str]):
                     traceback.print_exc()
                     raise
 
-            thread = threading.Thread(target=start_server,
-                                      args=(server_idx, rank, server_args))
+            thread = threading.Thread(
+                target=start_server, args=(server_idx, rank, server_args)
+            )
             thread.start()
 
             self.server_threads.append(thread)
@@ -157,19 +162,20 @@ class APIOnlyServerManager:
     """Manages API-only server (Node 0) and headless engines server (Node 1)
     for testing separated API server and engine configuration."""
 
-    def __init__(self,
-                 model_name: str,
-                 dp_size: int,
-                 api_server_count: int,
-                 base_server_args: list,
-                 tp_size: int = TP_SIZE):
+    def __init__(
+        self,
+        model_name: str,
+        dp_size: int,
+        api_server_count: int,
+        base_server_args: list,
+        tp_size: int = TP_SIZE,
+    ):
         self.model_name = model_name
         self.dp_size = dp_size
         self.tp_size = tp_size
         self.api_server_count = api_server_count
         self.base_server_args = base_server_args
-        self.servers: list[Optional[tuple[RemoteOpenAIServer,
-                                          list[str]]]] = [None] * 2
+        self.servers: list[Optional[tuple[RemoteOpenAIServer, list[str]]]] = [None] * 2
         self.server_threads: list[threading.Thread] = []
 
     def __enter__(self) -> list[tuple[RemoteOpenAIServer, list[str]]]:
@@ -177,38 +183,42 @@ def __enter__(self) -> list[tuple[RemoteOpenAIServer, list[str]]]:
 
         # Start API-only server (Node 0) - no engines, only API server
         api_server_args = self.base_server_args.copy()
-        api_server_args.extend([
-            "--data-parallel-size",
-            str(self.dp_size),
-            "--data-parallel-size-local",
-            "0",  # No engines on this node
-            "--tensor-parallel-size",
-            str(self.tp_size),
-            "--port",
-            "8000",
-            "--api-server-count",
-            str(self.api_server_count),
-            "--data-parallel-address",
-            "127.0.0.1",
-            "--data-parallel-rpc-port",
-            "13345",
-        ])
+        api_server_args.extend(
+            [
+                "--data-parallel-size",
+                str(self.dp_size),
+                "--data-parallel-size-local",
+                "0",  # No engines on this node
+                "--tensor-parallel-size",
+                str(self.tp_size),
+                "--port",
+                "8000",
+                "--api-server-count",
+                str(self.api_server_count),
+                "--data-parallel-address",
+                "127.0.0.1",
+                "--data-parallel-rpc-port",
+                "13345",
+            ]
+        )
 
         # Start headless engines server (Node 1) - all engines, no API server
         engines_server_args = self.base_server_args.copy()
-        engines_server_args.extend([
-            "--headless",
-            "--data-parallel-size",
-            str(self.dp_size),
-            "--data-parallel-size-local",
-            str(self.dp_size),  # All engines on this node
-            "--tensor-parallel-size",
-            str(self.tp_size),
-            "--data-parallel-address",
-            "127.0.0.1",
-            "--data-parallel-rpc-port",
-            "13345",
-        ])
+        engines_server_args.extend(
+            [
+                "--headless",
+                "--data-parallel-size",
+                str(self.dp_size),
+                "--data-parallel-size-local",
+                str(self.dp_size),  # All engines on this node
+                "--tensor-parallel-size",
+                str(self.tp_size),
+                "--data-parallel-address",
+                "127.0.0.1",
+                "--data-parallel-rpc-port",
+                "13345",
+            ]
+        )
 
         # Use threads to start both servers in parallel
         def start_api_server():
@@ -220,10 +230,13 @@ def start_api_server():
                     env_dict={
                         "VLLM_SERVER_DEV_MODE": "1",
                         # No GPUs needed for API-only server
-                    })
+                    },
+                )
                 server.__enter__()
-                print(f"API-only server started successfully with "
-                      f"{self.api_server_count} API servers")
+                print(
+                    f"API-only server started successfully with "
+                    f"{self.api_server_count} API servers"
+                )
                 self.servers[0] = (server, api_server_args)
             except Exception as e:
                 print(f"Failed to start API-only server: {e}")
@@ -236,16 +249,17 @@ def start_engines_server():
                     engines_server_args,
                     auto_port=False,
                     env_dict={
-                        current_platform.device_control_env_var:
-                        ",".join(
-                            str(
-                                current_platform.
-                                device_id_to_physical_device_id(i))
-                            for i in range(self.dp_size * self.tp_size))
-                    })
+                        current_platform.device_control_env_var: ",".join(
+                            str(current_platform.device_id_to_physical_device_id(i))
+                            for i in range(self.dp_size * self.tp_size)
+                        )
+                    },
+                )
                 server.__enter__()
-                print(f"Headless engines server started successfully with "
-                      f"{self.dp_size} engines")
+                print(
+                    f"Headless engines server started successfully with "
+                    f"{self.dp_size} engines"
+                )
                 self.servers[1] = (server, engines_server_args)
             except Exception as e:
                 print(f"Failed to start headless engines server: {e}")
@@ -301,11 +315,14 @@ def default_server_args():
 @pytest.fixture(scope="module", params=[1, 4])
 def server_manager(request, default_server_args):
     api_server_count = request.param
-    server_manager = MultinodeInternalLBServerManager(MODEL_NAME, DP_SIZE,
-                                                      api_server_count,
-                                                      default_server_args,
-                                                      DP_SIZE // NUM_NODES,
-                                                      TP_SIZE)
+    server_manager = MultinodeInternalLBServerManager(
+        MODEL_NAME,
+        DP_SIZE,
+        api_server_count,
+        default_server_args,
+        DP_SIZE // NUM_NODES,
+        TP_SIZE,
+    )
 
     with server_manager:
         yield server_manager
@@ -320,8 +337,9 @@ def servers(server_manager):
 def api_only_servers(request, default_server_args):
     """Fixture for API-only server + headless engines configuration."""
     api_server_count = request.param
-    with APIOnlyServerManager(MODEL_NAME, DP_SIZE, api_server_count,
-                              default_server_args, TP_SIZE) as server_list:
+    with APIOnlyServerManager(
+        MODEL_NAME, DP_SIZE, api_server_count, default_server_args, TP_SIZE
+    ) as server_list:
         yield server_list
 
 
@@ -335,8 +353,7 @@ async def client(servers: list[tuple[RemoteOpenAIServer, list[str]]]):
 
 
 @pytest_asyncio.fixture
-async def api_only_client(api_only_servers: list[tuple[RemoteOpenAIServer,
-                                                       list[str]]]):
+async def api_only_client(api_only_servers: list[tuple[RemoteOpenAIServer, list[str]]]):
     """Client fixture for API-only server configuration."""
     # Connect to the API-only server (first server in the list)
     api_server = api_only_servers[0][0]
@@ -360,16 +377,12 @@ def test_multinode_dp_server_info(server_manager):
     # `n_reqs` is set so that there is a good chance each server
     # receives at least one request
     n_reqs = 2 * api_server_count * api_server_count
-    parallel_configs = [
-        _get_parallel_config(head_server) for _ in range(n_reqs)
-    ]
+    parallel_configs = [_get_parallel_config(head_server) for _ in range(n_reqs)]
     api_process_counts = [c["_api_process_count"] for c in parallel_configs]
     api_process_ranks = [c["_api_process_rank"] for c in parallel_configs]
 
-    assert all(c == api_server_count
-               for c in api_process_counts), api_process_counts
-    assert all(0 <= r < api_server_count
-               for r in api_process_ranks), api_process_ranks
+    assert all(c == api_server_count for c in api_process_counts), api_process_counts
+    assert all(0 <= r < api_server_count for r in api_process_ranks), api_process_ranks
 
 
 @pytest.mark.asyncio
@@ -377,17 +390,15 @@ def test_multinode_dp_server_info(server_manager):
     "model_name",
     [MODEL_NAME],
 )
-async def test_multinode_dp_completion(client: openai.AsyncOpenAI,
-                                       servers: list[tuple[RemoteOpenAIServer,
-                                                           list[str]]],
-                                       model_name: str) -> None:
-
+async def test_multinode_dp_completion(
+    client: openai.AsyncOpenAI,
+    servers: list[tuple[RemoteOpenAIServer, list[str]]],
+    model_name: str,
+) -> None:
     async def make_request():
         completion = await client.completions.create(
-            model=model_name,
-            prompt="Hello, my name is",
-            max_tokens=5,
-            temperature=1.0)
+            model=model_name, prompt="Hello, my name is", max_tokens=5, temperature=1.0
+        )
 
         assert completion.id is not None
         assert completion.choices is not None and len(completion.choices) == 1
@@ -410,9 +421,7 @@ async def make_request():
     # Test single request
     result = await make_request()
     assert result is not None
-    print(
-        "Multi-node internal LB handled single completion request successfully"
-    )
+    print("Multi-node internal LB handled single completion request successfully")
 
     await asyncio.sleep(0.5)
 
@@ -441,10 +450,14 @@ async def make_request():
 
     _, server_args = servers[0]
     api_server_count = (
-        server_args.count('--api-server-count')
-        and server_args[server_args.index('--api-server-count') + 1] or 1)
-    print(f"Successfully completed multi-node internal LB test with "
-          f"{len(servers)} DP ranks (API server count: {api_server_count})")
+        server_args.count("--api-server-count")
+        and server_args[server_args.index("--api-server-count") + 1]
+        or 1
+    )
+    print(
+        f"Successfully completed multi-node internal LB test with "
+        f"{len(servers)} DP ranks (API server count: {api_server_count})"
+    )
 
     # Check request balancing via Prometheus metrics
     head_server = servers[0][0]
@@ -456,11 +469,11 @@ async def make_request():
     "model_name",
     [MODEL_NAME],
 )
-async def test_multinode_dp_completion_streaming(client: openai.AsyncOpenAI,
-                                                 servers: list[
-                                                     tuple[RemoteOpenAIServer,
-                                                           list[str]]],
-                                                 model_name: str) -> None:
+async def test_multinode_dp_completion_streaming(
+    client: openai.AsyncOpenAI,
+    servers: list[tuple[RemoteOpenAIServer, list[str]]],
+    model_name: str,
+) -> None:
     prompt = "What is an LLM?"
 
     async def make_streaming_request():
@@ -474,11 +487,9 @@ async def make_streaming_request():
         single_output = single_completion.choices[0].text
 
         # Perform the streaming request
-        stream = await client.completions.create(model=model_name,
-                                                 prompt=prompt,
-                                                 max_tokens=5,
-                                                 temperature=0.0,
-                                                 stream=True)
+        stream = await client.completions.create(
+            model=model_name, prompt=prompt, max_tokens=5, temperature=0.0, stream=True
+        )
         chunks: list[str] = []
         finish_reason_count = 0
         last_chunk = None
@@ -489,23 +500,21 @@ async def make_streaming_request():
             last_chunk = chunk  # Keep track of the last chunk
 
         # finish reason should only return in the last block for OpenAI API
-        assert finish_reason_count == 1, (
-            "Finish reason should appear exactly once.")
-        assert last_chunk is not None, (
-            "Stream should have yielded at least one chunk.")
-        assert last_chunk.choices[
-            0].finish_reason == "length", "Finish reason should be 'length'."
+        assert finish_reason_count == 1, "Finish reason should appear exactly once."
+        assert last_chunk is not None, "Stream should have yielded at least one chunk."
+        assert last_chunk.choices[0].finish_reason == "length", (
+            "Finish reason should be 'length'."
+        )
         # Check that the combined text matches the non-streamed version.
-        assert "".join(
-            chunks
-        ) == single_output, "Streamed output should match non-streamed output."
+        assert "".join(chunks) == single_output, (
+            "Streamed output should match non-streamed output."
+        )
         return True  # Indicate success for this request
 
     # Test single streaming request
     result = await make_streaming_request()
     assert result is not None
-    print(
-        "Multi-node internal LB handled single streaming request successfully")
+    print("Multi-node internal LB handled single streaming request successfully")
 
     await asyncio.sleep(0.5)
 
@@ -535,10 +544,14 @@ async def make_streaming_request():
 
     _, server_args = servers[0]
     api_server_count = (
-        server_args.count('--api-server-count')
-        and server_args[server_args.index('--api-server-count') + 1] or 1)
-    print(f"Successfully completed multi-node internal LB streaming test with "
-          f"{len(servers)} DP ranks (API server count: {api_server_count})")
+        server_args.count("--api-server-count")
+        and server_args[server_args.index("--api-server-count") + 1]
+        or 1
+    )
+    print(
+        f"Successfully completed multi-node internal LB streaming test with "
+        f"{len(servers)} DP ranks (API server count: {api_server_count})"
+    )
 
     # Check request balancing via Prometheus metrics
     head_server = servers[0][0]
@@ -551,17 +564,16 @@ async def make_streaming_request():
     [MODEL_NAME],
 )
 async def test_api_only_multinode_dp_completion(
-        api_only_client: openai.AsyncOpenAI,
-        api_only_servers: list[tuple[RemoteOpenAIServer,
-                                     list[str]]], model_name: str) -> None:
+    api_only_client: openai.AsyncOpenAI,
+    api_only_servers: list[tuple[RemoteOpenAIServer, list[str]]],
+    model_name: str,
+) -> None:
     """Test API-only server with all engines on separate headless server."""
 
     async def make_request():
         completion = await api_only_client.completions.create(
-            model=model_name,
-            prompt="Hello, my name is",
-            max_tokens=5,
-            temperature=1.0)
+            model=model_name, prompt="Hello, my name is", max_tokens=5, temperature=1.0
+        )
 
         assert completion.id is not None
         assert completion.choices is not None and len(completion.choices) == 1
@@ -614,11 +626,14 @@ async def make_request():
 
     api_server, api_server_args = api_only_servers[0]
     api_server_count = (
-        api_server_args.count('--api-server-count')
-        and api_server_args[api_server_args.index('--api-server-count') + 1]
-        or 1)
-    print(f"Successfully completed API-only multi-node test with {DP_SIZE} "
-          f"engines on headless server (API server count: {api_server_count})")
+        api_server_args.count("--api-server-count")
+        and api_server_args[api_server_args.index("--api-server-count") + 1]
+        or 1
+    )
+    print(
+        f"Successfully completed API-only multi-node test with {DP_SIZE} "
+        f"engines on headless server (API server count: {api_server_count})"
+    )
 
     # Check request balancing via Prometheus metrics
     check_request_balancing(api_server, DP_SIZE)
@@ -630,9 +645,10 @@ async def make_request():
     [MODEL_NAME],
 )
 async def test_api_only_multinode_dp_completion_streaming(
-        api_only_client: openai.AsyncOpenAI,
-        api_only_servers: list[tuple[RemoteOpenAIServer,
-                                     list[str]]], model_name: str) -> None:
+    api_only_client: openai.AsyncOpenAI,
+    api_only_servers: list[tuple[RemoteOpenAIServer, list[str]]],
+    model_name: str,
+) -> None:
     """Test API-only server streaming with all engines on separate
     headless server."""
     prompt = "What is an LLM?"
@@ -648,11 +664,9 @@ async def make_streaming_request():
         single_output = single_completion.choices[0].text
 
         # Perform the streaming request
-        stream = await api_only_client.completions.create(model=model_name,
-                                                          prompt=prompt,
-                                                          max_tokens=5,
-                                                          temperature=0.0,
-                                                          stream=True)
+        stream = await api_only_client.completions.create(
+            model=model_name, prompt=prompt, max_tokens=5, temperature=0.0, stream=True
+        )
         chunks: list[str] = []
         finish_reason_count = 0
         last_chunk = None
@@ -663,16 +677,15 @@ async def make_streaming_request():
             last_chunk = chunk  # Keep track of the last chunk
 
         # finish reason should only return in the last block for OpenAI API
-        assert finish_reason_count == 1, (
-            "Finish reason should appear exactly once.")
-        assert last_chunk is not None, (
-            "Stream should have yielded at least one chunk.")
-        assert last_chunk.choices[
-            0].finish_reason == "length", "Finish reason should be 'length'."
+        assert finish_reason_count == 1, "Finish reason should appear exactly once."
+        assert last_chunk is not None, "Stream should have yielded at least one chunk."
+        assert last_chunk.choices[0].finish_reason == "length", (
+            "Finish reason should be 'length'."
+        )
         # Check that the combined text matches the non-streamed version.
-        assert "".join(
-            chunks
-        ) == single_output, "Streamed output should match non-streamed output."
+        assert "".join(chunks) == single_output, (
+            "Streamed output should match non-streamed output."
+        )
         return True  # Indicate success for this request
 
     # Test single streaming request
@@ -707,11 +720,14 @@ async def make_streaming_request():
 
     _, api_server_args = api_only_servers[0]
     api_server_count = (
-        api_server_args.count('--api-server-count')
-        and api_server_args[api_server_args.index('--api-server-count') + 1]
-        or 1)
-    print(f"Successfully completed API-only streaming test with {DP_SIZE} "
-          f"engines on headless server (API server count: {api_server_count})")
+        api_server_args.count("--api-server-count")
+        and api_server_args[api_server_args.index("--api-server-count") + 1]
+        or 1
+    )
+    print(
+        f"Successfully completed API-only streaming test with {DP_SIZE} "
+        f"engines on headless server (API server count: {api_server_count})"
+    )
 
     # Check request balancing via Prometheus metrics
     api_server = api_only_servers[0][0]
diff --git a/tests/v1/e2e/test_cascade_attention.py b/tests/v1/e2e/test_cascade_attention.py
index 5022347a87a4..5f26c2f1c651 100644
--- a/tests/v1/e2e/test_cascade_attention.py
+++ b/tests/v1/e2e/test_cascade_attention.py
@@ -14,8 +14,10 @@ def test_cascade_attention(example_system_message, monkeypatch, attn_backend):
     prompt = "\n<User>: Implement fibonacci sequence in Python.\n<Claude>:"
 
     if attn_backend == "FLASHINFER":
-        pytest.skip("This test is failing with FlashInfer backend and "
-                    "needs investigation. See issue #25679.")
+        pytest.skip(
+            "This test is failing with FlashInfer backend and "
+            "needs investigation. See issue #25679."
+        )
 
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
diff --git a/tests/v1/e2e/test_context_length.py b/tests/v1/e2e/test_context_length.py
index b8891d961906..4076b1fa0615 100644
--- a/tests/v1/e2e/test_context_length.py
+++ b/tests/v1/e2e/test_context_length.py
@@ -92,7 +92,7 @@ def test_max_context_length(
         )
 
         # HF returns the prompt + generated tokens. Slice off the prompt.
-        hf_output_ids = hf_generated.cpu().tolist()[0][len(prompt_ids[0]):]
+        hf_output_ids = hf_generated.cpu().tolist()[0][len(prompt_ids[0]) :]
 
     # check that exactly max_tokens tokens were generated with vLLM and HF
     assert len(vllm_output_ids) == len(hf_output_ids) == max_tokens
diff --git a/tests/v1/e2e/test_correctness_sliding_window.py b/tests/v1/e2e/test_correctness_sliding_window.py
index 5b0c15472251..c9018ee177e8 100644
--- a/tests/v1/e2e/test_correctness_sliding_window.py
+++ b/tests/v1/e2e/test_correctness_sliding_window.py
@@ -26,12 +26,14 @@ class TestConfig:
     [
         "bigcode/starcoder2-3b",  # sliding window only
         "google/gemma-3-1b-it",  # sliding window + full attention
-    ])
+    ],
+)
 @pytest.mark.parametrize("batch_size", [5])
 @pytest.mark.parametrize("seed", [1])
 @pytest.mark.parametrize("disable_hybrid_kv_cache_manager", [True, False])
-def test_sliding_window_retrieval(monkeypatch, model, batch_size, seed,
-                                  disable_hybrid_kv_cache_manager):
+def test_sliding_window_retrieval(
+    monkeypatch, model, batch_size, seed, disable_hybrid_kv_cache_manager
+):
     """
     The test does a bunch of assignments "x1 = 10\nx2 = 33\n..." and then
     asks for value of one of them (which is outside the sliding window).
@@ -44,33 +46,38 @@ def test_sliding_window_retrieval(monkeypatch, model, batch_size, seed,
         test_config = model_config[model]
 
         llm = LLM(
-            model=model,
-            disable_hybrid_kv_cache_manager=disable_hybrid_kv_cache_manager)
+            model=model, disable_hybrid_kv_cache_manager=disable_hybrid_kv_cache_manager
+        )
         sampling_params = SamplingParams(temperature=0.0, max_tokens=100)
 
-        prompts, answer, indices = prep_prompts(batch_size,
-                                                ln_range=test_config.ln_range)
+        prompts, answer, indices = prep_prompts(
+            batch_size, ln_range=test_config.ln_range
+        )
 
         check_length(prompts, llm, test_config.sliding_window)
 
         # Fresh generation
         responses = llm.generate(prompts, sampling_params)
-        check_answers(indices,
-                      answer,
-                      [response.outputs[0].text for response in responses],
-                      accept_rate=1.0)
+        check_answers(
+            indices,
+            answer,
+            [response.outputs[0].text for response in responses],
+            accept_rate=1.0,
+        )
 
         # Re-generate with the same prompts to test prefix caching
         responses = llm.generate(prompts, sampling_params)
-        check_answers(indices,
-                      answer,
-                      [response.outputs[0].text for response in responses],
-                      accept_rate=1.0)
+        check_answers(
+            indices,
+            answer,
+            [response.outputs[0].text for response in responses],
+            accept_rate=1.0,
+        )
 
 
 def check_length(prompts: list[str], llm: LLM, sliding_window: int):
     """
-    Check if the prompt length is valid, i.e., longer than the sliding window 
+    Check if the prompt length is valid, i.e., longer than the sliding window
     size and shorter than the model's max length.
 
     Args:
@@ -80,9 +87,9 @@ def check_length(prompts: list[str], llm: LLM, sliding_window: int):
     """
     tokenizer = llm.get_tokenizer()
     max_model_len = llm.llm_engine.model_config.max_model_len
-    assert any(
-        len(tokenizer.encode(prompt)) > sliding_window
-        for prompt in prompts), "Prompt is too short for test"
-    assert all(
-        len(tokenizer.encode(prompt)) <= max_model_len
-        for prompt in prompts), "Prompt is too long for test"
+    assert any(len(tokenizer.encode(prompt)) > sliding_window for prompt in prompts), (
+        "Prompt is too short for test"
+    )
+    assert all(len(tokenizer.encode(prompt)) <= max_model_len for prompt in prompts), (
+        "Prompt is too long for test"
+    )
diff --git a/tests/v1/e2e/test_kv_sharing_fast_prefill.py b/tests/v1/e2e/test_kv_sharing_fast_prefill.py
index 6bc9b2b1d82d..b9052d8a58b8 100644
--- a/tests/v1/e2e/test_kv_sharing_fast_prefill.py
+++ b/tests/v1/e2e/test_kv_sharing_fast_prefill.py
@@ -76,7 +76,9 @@ def test_kv_sharing_fast_prefill(
         # managing buffers for cudagraph
         cudagraph_copy_inputs=True,
         level=CompilationLevel.PIECEWISE
-        if not enforce_eager else CompilationLevel.NO_COMPILATION)
+        if not enforce_eager
+        else CompilationLevel.NO_COMPILATION,
+    )
 
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
@@ -94,21 +96,21 @@ def test_kv_sharing_fast_prefill(
 
         cleanup(llm, compilation_config)
 
-        llm = LLM(model="google/gemma-3n-E2B-it",
-                  enforce_eager=enforce_eager,
-                  compilation_config=compilation_config,
-                  seed=SEED,
-                  kv_sharing_fast_prefill=True)
+        llm = LLM(
+            model="google/gemma-3n-E2B-it",
+            enforce_eager=enforce_eager,
+            compilation_config=compilation_config,
+            seed=SEED,
+            kv_sharing_fast_prefill=True,
+        )
         optimized_responses = llm.generate(test_prompts, sampling_params)
 
         cleanup(llm, compilation_config)
 
         misses = 0
 
-        for ref_response, optimized_response in zip(ref_responses,
-                                                    optimized_responses):
-            if ref_response.outputs[0].text != optimized_response.outputs[
-                    0].text:
+        for ref_response, optimized_response in zip(ref_responses, optimized_responses):
+            if ref_response.outputs[0].text != optimized_response.outputs[0].text:
                 misses += 1
 
         assert misses == 0
diff --git a/tests/v1/e2e/test_min_tokens.py b/tests/v1/e2e/test_min_tokens.py
index f013425cb59d..f15982b7e5f3 100644
--- a/tests/v1/e2e/test_min_tokens.py
+++ b/tests/v1/e2e/test_min_tokens.py
@@ -46,29 +46,36 @@ def __init__(
         self.expected_exact_len = expected_exact_len
 
     def __str__(self):
-        return (f"{self.name}: min={self.min_tokens}, "
-                f"max={self.max_tokens}, stop={self.stop}")
+        return (
+            f"{self.name}: min={self.min_tokens}, "
+            f"max={self.max_tokens}, stop={self.stop}"
+        )
 
 
 # Test scenarios covering all critical cases
 MIN_TOKENS_TEST_CASES = [
     # === BASIC FUNCTIONALITY (should work) ===
-    MinTokensTestCase(name="basic_min_tokens_no_stop",
-                      min_tokens=8,
-                      max_tokens=20,
-                      stop=None,
-                      expected_min_len=8),
-    MinTokensTestCase(name="min_tokens_zero",
-                      min_tokens=0,
-                      max_tokens=10,
-                      stop=None,
-                      expected_min_len=0),
-    MinTokensTestCase(name="min_equals_max_no_stop",
-                      min_tokens=15,
-                      max_tokens=15,
-                      stop=None,
-                      expected_exact_len=15),
-
+    MinTokensTestCase(
+        name="basic_min_tokens_no_stop",
+        min_tokens=8,
+        max_tokens=20,
+        stop=None,
+        expected_min_len=8,
+    ),
+    MinTokensTestCase(
+        name="min_tokens_zero",
+        min_tokens=0,
+        max_tokens=10,
+        stop=None,
+        expected_min_len=0,
+    ),
+    MinTokensTestCase(
+        name="min_equals_max_no_stop",
+        min_tokens=15,
+        max_tokens=15,
+        stop=None,
+        expected_exact_len=15,
+    ),
     # === STOP STRINGS WITH MIN_TOKENS ===
     # These tests expose the detokenizer bug where stop strings
     # bypass min_tokens
@@ -94,9 +101,11 @@ def __str__(self):
             expected_min_len=5,
         ),
         marks=pytest.mark.xfail(
-            reason=("Known bug #21987: stop strings bypass min_tokens "
-                    "(fixed by PR #22014)"),
-            strict=False),
+            reason=(
+                "Known bug #21987: stop strings bypass min_tokens (fixed by PR #22014)"
+            ),
+            strict=False,
+        ),
         id="min_tokens_with_comprehensive_stops",
     ),
     pytest.param(
@@ -108,12 +117,13 @@ def __str__(self):
             expected_min_len=3,
         ),
         marks=pytest.mark.xfail(
-            reason=("Known bug #21987: stop strings bypass min_tokens "
-                    "(fixed by PR #22014)"),
-            strict=False),
+            reason=(
+                "Known bug #21987: stop strings bypass min_tokens (fixed by PR #22014)"
+            ),
+            strict=False,
+        ),
         id="min_tokens_with_simple_char_stop",
     ),
-
     # === EOS TOKEN WITH MIN_TOKENS (potential LogitsProcessor bug) ===
     # These test the MinTokensLogitsProcessor handling of EOS tokens
     pytest.param(
@@ -125,26 +135,26 @@ def __str__(self):
             expected_exact_len=20,
         ),
         marks=pytest.mark.xfail(
-            reason=
-            ("Potential logits-processor bug: EOS tokens may bypass min_tokens"
-             ),
+            reason=("Potential logits-processor bug: EOS tokens may bypass min_tokens"),
             strict=False,
         ),
         id="min_equals_max_eos_only",
     ),
-
     # === EDGE CASES ===
-    MinTokensTestCase(name="large_min_tokens",
-                      min_tokens=50,
-                      max_tokens=60,
-                      stop=None,
-                      expected_min_len=50),
+    MinTokensTestCase(
+        name="large_min_tokens",
+        min_tokens=50,
+        max_tokens=60,
+        stop=None,
+        expected_min_len=50,
+    ),
     MinTokensTestCase(
         name="min_tokens_with_empty_stop_list",
         min_tokens=5,
         max_tokens=15,
         stop=[],  # Empty stop list
-        expected_min_len=5),
+        expected_min_len=5,
+    ),
 ]
 
 
@@ -170,25 +180,27 @@ def get_token_count(output: RequestOutput) -> int:
     return len(output.outputs[0].token_ids)
 
 
-def assert_min_tokens_satisfied(output: RequestOutput,
-                                test_case: MinTokensTestCase) -> None:
+def assert_min_tokens_satisfied(
+    output: RequestOutput, test_case: MinTokensTestCase
+) -> None:
     """Assert that min_tokens requirement is satisfied"""
     token_count = get_token_count(output)
-    stop_reason = (output.outputs[0].stop_reason
-                   if output.outputs else "no output")
+    stop_reason = output.outputs[0].stop_reason if output.outputs else "no output"
 
     if test_case.expected_exact_len is not None:
         # Exact length requirement
         assert token_count == test_case.expected_exact_len, (
             f"Expected exactly {test_case.expected_exact_len} tokens, "
             f"got {token_count} tokens. "
-            f"Stop reason: {stop_reason}")
+            f"Stop reason: {stop_reason}"
+        )
     else:
         # Minimum length requirement
         assert token_count >= (test_case.expected_min_len or 0), (
             f"Expected at least {test_case.expected_min_len} tokens, "
             f"got {token_count} tokens. "
-            f"Stop reason: {stop_reason}")
+            f"Stop reason: {stop_reason}"
+        )
 
 
 @pytest.mark.parametrize(
@@ -199,13 +211,13 @@ def assert_min_tokens_satisfied(output: RequestOutput,
 def test_min_tokens_comprehensive(llm_v1: LLM, test_case: MinTokensTestCase):
     """
     Comprehensive test for min_tokens functionality in V1 engine.
-    
+
     This test covers all critical scenarios for min_tokens:
     - Basic functionality (should work)
     - Stop strings with min_tokens (known bug)
     - EOS tokens with min_tokens (potential bug)
     - Edge cases
-    
+
     Args:
         llm_v1: V1 LLM instance
         test_case: Test scenario parameters
@@ -218,7 +230,7 @@ def test_min_tokens_comprehensive(llm_v1: LLM, test_case: MinTokensTestCase):
         max_tokens=test_case.max_tokens,
         stop=test_case.stop,
         temperature=GREEDY,
-        include_stop_str_in_output=True  # Include stop strings for debugging
+        include_stop_str_in_output=True,  # Include stop strings for debugging
     )
 
     # Use simple prompt. Comprehensive stop lists should catch any generation
@@ -250,13 +262,11 @@ def test_min_tokens_comprehensive(llm_v1: LLM, test_case: MinTokensTestCase):
 def test_min_tokens_basic_functionality(llm_v1: LLM):
     """
     Test basic min_tokens functionality without stop conditions.
-    
+
     This is a baseline test that should always pass and validates
     that min_tokens works correctly in the simple case.
     """
-    sampling_params = SamplingParams(min_tokens=10,
-                                     max_tokens=20,
-                                     temperature=GREEDY)
+    sampling_params = SamplingParams(min_tokens=10, max_tokens=20, temperature=GREEDY)
 
     prompt = "Once upon a time"
     outputs = llm_v1.generate([prompt], sampling_params)
@@ -269,17 +279,16 @@ def test_min_tokens_basic_functionality(llm_v1: LLM):
 
 
 @pytest.mark.xfail(
-    reason=("Known bug #21987: stop strings bypass min_tokens "
-            "(fixed by PR #22014)"),
+    reason=("Known bug #21987: stop strings bypass min_tokens (fixed by PR #22014)"),
     strict=False,
 )
 def test_min_tokens_stop_strings_bug(llm_v1: LLM):
     """
     Test the specific bug where stop strings bypass min_tokens.
-    
+
     This test specifically reproduces the bug Calvin is fixing in PR #22014.
     It should fail until that fix is merged.
-    
+
     Strategy: Use guaranteed stop characters that will appear
     in any generated text.
     """
@@ -291,7 +300,8 @@ def test_min_tokens_stop_strings_bug(llm_v1: LLM):
         # Common letter; likely appears early
         stop=["e"],
         temperature=GREEDY,
-        include_stop_str_in_output=True)
+        include_stop_str_in_output=True,
+    )
 
     # Simple prompt that will generate text containing "e"
     prompt = "The quick brown fox"
@@ -308,23 +318,25 @@ def test_min_tokens_stop_strings_bug(llm_v1: LLM):
 
     # This assertion should fail due to the bug - if stop string is found early,
     # the model should still continue generating until min_tokens is reached
-    stop_reason = (outputs[0].outputs[0].stop_reason
-                   if outputs[0].outputs else "no output")
-    assert token_count >= 15, ("Bug confirmed: "
-                               f"{token_count} tokens < min_tokens=15. "
-                               f"Reason: {stop_reason}. "
-                               f"Text: {repr(generated_text)}")
+    stop_reason = (
+        outputs[0].outputs[0].stop_reason if outputs[0].outputs else "no output"
+    )
+    assert token_count >= 15, (
+        "Bug confirmed: "
+        f"{token_count} tokens < min_tokens=15. "
+        f"Reason: {stop_reason}. "
+        f"Text: {repr(generated_text)}"
+    )
 
 
 @pytest.mark.xfail(
-    reason=("Known bug #21987: stop strings bypass min_tokens "
-            "(fixed by PR #22014)"),
+    reason=("Known bug #21987: stop strings bypass min_tokens (fixed by PR #22014)"),
     strict=False,
 )
 def test_min_tokens_stop_strings_guaranteed_early_trigger(llm_v1: LLM):
     """
     Guaranteed test for stop strings bypassing min_tokens bug.
-    
+
     Strategy: Use very low temperature and multiple common stop strings
     to virtually guarantee early detection, combined with long min_tokens
     to ensure the bug is exposed regardless of model behavior.
@@ -337,7 +349,8 @@ def test_min_tokens_stop_strings_guaranteed_early_trigger(llm_v1: LLM):
         # Use multiple very common patterns - at least one will appear
         stop=["e", "a", "i", "o", "u", " ", "t", "n", "s", "r"],
         temperature=GREEDY,
-        include_stop_str_in_output=True)
+        include_stop_str_in_output=True,
+    )
 
     # Simple prompt that will generate some text
     prompt = "The cat"
@@ -346,8 +359,7 @@ def test_min_tokens_stop_strings_guaranteed_early_trigger(llm_v1: LLM):
     assert len(outputs) == 1
     token_count = get_token_count(outputs[0])
     generated_text = outputs[0].outputs[0].text if outputs[0].outputs else ""
-    stop_reason = (outputs[0].outputs[0].stop_reason
-                   if outputs[0].outputs else "unknown")
+    stop_reason = outputs[0].outputs[0].stop_reason if outputs[0].outputs else "unknown"
 
     print(f"Generated text: {repr(generated_text)}")
     print(f"Token count: {token_count}")
@@ -357,21 +369,23 @@ def test_min_tokens_stop_strings_guaranteed_early_trigger(llm_v1: LLM):
     # will trigger early termination before min_tokens=50 is reached
     # It's virtually impossible to generate 50 tokens without hitting
     # at least one of: e, a, i, o, u, space, t, n, s, r
-    finish_reason = (outputs[0].outputs[0].finish_reason
-                     if outputs[0].outputs else "unknown")
+    finish_reason = (
+        outputs[0].outputs[0].finish_reason if outputs[0].outputs else "unknown"
+    )
 
     print(f"Finish reason: {finish_reason}")
 
     if finish_reason == "stop":
-        assert token_count >= 50, ("Bug confirmed: "
-                                   f"{token_count} tokens < min_tokens=50. "
-                                   f"Reason: {finish_reason}. "
-                                   f"Text: {repr(generated_text)}")
+        assert token_count >= 50, (
+            "Bug confirmed: "
+            f"{token_count} tokens < min_tokens=50. "
+            f"Reason: {finish_reason}. "
+            f"Text: {repr(generated_text)}"
+        )
 
 
 @pytest.mark.xfail(
-    reason=(
-        "Potential logits-processor bug: EOS tokens may bypass min_tokens"),
+    reason=("Potential logits-processor bug: EOS tokens may bypass min_tokens"),
     strict=False,
 )
 def test_min_tokens_eos_behavior(llm_v1: LLM):
@@ -404,8 +418,14 @@ def test_min_tokens_eos_behavior(llm_v1: LLM):
     finish_no_min = choice_no_min.finish_reason
     stop_no_min = choice_no_min.stop_reason
 
-    print("[no-min] tokens=", len(ids_no_min), " finish=", finish_no_min,
-          " stop_reason=", stop_no_min)
+    print(
+        "[no-min] tokens=",
+        len(ids_no_min),
+        " finish=",
+        finish_no_min,
+        " stop_reason=",
+        stop_no_min,
+    )
 
     assert finish_no_min == "stop", (
         f"Expected finish_reason 'stop' without min_tokens, got {finish_no_min}"
@@ -414,7 +434,8 @@ def test_min_tokens_eos_behavior(llm_v1: LLM):
         "For EOS-based stop (no user stop strings), stop_reason should be None."
     )
     assert len(ids_no_min) < max_toks, (
-        f"Expected early EOS with < {max_toks} tokens, got {len(ids_no_min)}")
+        f"Expected early EOS with < {max_toks} tokens, got {len(ids_no_min)}"
+    )
 
     # Case 2: WITH min_tokens
     sp_with_min = SamplingParams(
@@ -430,23 +451,31 @@ def test_min_tokens_eos_behavior(llm_v1: LLM):
     finish_with_min = choice_with_min.finish_reason
     stop_with_min = choice_with_min.stop_reason
 
-    print("[with-min] tokens=", len(ids_with_min), " finish=", finish_with_min,
-          " stop_reason=", stop_with_min)
+    print(
+        "[with-min] tokens=",
+        len(ids_with_min),
+        " finish=",
+        finish_with_min,
+        " stop_reason=",
+        stop_with_min,
+    )
 
     # Exact length reached; EOS should have been blocked
     assert len(ids_with_min) == max_toks, (
-        f"Expected exactly {max_toks} tokens with min_tokens; "
-        f"got {len(ids_with_min)}")
+        f"Expected exactly {max_toks} tokens with min_tokens; got {len(ids_with_min)}"
+    )
     assert finish_with_min == "length", (
-        f"Expected finish_reason 'length'; got {finish_with_min}")
+        f"Expected finish_reason 'length'; got {finish_with_min}"
+    )
     assert eos_token_id not in ids_with_min, (
-        "EOS token id should not appear when min_tokens prevents early EOS.")
+        "EOS token id should not appear when min_tokens prevents early EOS."
+    )
 
 
 def test_min_tokens_validation():
     """
     Test that SamplingParams correctly validates min_tokens parameters.
-    
+
     This tests the parameter validation logic in SamplingParams.
     """
     # Valid cases
@@ -456,14 +485,14 @@ def test_min_tokens_validation():
 
     # Invalid cases
     with pytest.raises(
-            ValueError,
-            match="min_tokens must be greater than or equal to 0",
+        ValueError,
+        match="min_tokens must be greater than or equal to 0",
     ):
         SamplingParams(min_tokens=-1, max_tokens=10)
 
     with pytest.raises(
-            ValueError,
-            match="min_tokens must be less than or equal to max_tokens",
+        ValueError,
+        match="min_tokens must be less than or equal to max_tokens",
     ):
         SamplingParams(min_tokens=15, max_tokens=10)
 
diff --git a/tests/v1/e2e/test_spec_decode.py b/tests/v1/e2e/test_spec_decode.py
index 8f048775352e..9ed9cd7950a9 100644
--- a/tests/v1/e2e/test_spec_decode.py
+++ b/tests/v1/e2e/test_spec_decode.py
@@ -48,19 +48,17 @@ def get_test_prompts(mm_enabled: bool):
             give no other output than that simple sentence without quotes.
             """
         elif kind == "mm":
-            placeholders = [{
-                "type": "image_url",
-                "image_url": {
-                    "url":
-                    f"{VLLM_S3_BUCKET_URL}/{VLM_IMAGES_DIR}/stop_sign.jpg"
-                },
-            }]
+            placeholders = [
+                {
+                    "type": "image_url",
+                    "image_url": {
+                        "url": f"{VLLM_S3_BUCKET_URL}/{VLM_IMAGES_DIR}/stop_sign.jpg"
+                    },
+                }
+            ]
             prompt = [
                 *placeholders,
-                {
-                    "type": "text",
-                    "text": "The meaning of the image is"
-                },
+                {"type": "text", "text": "The meaning of the image is"},
             ]
         else:
             raise ValueError(f"Unknown prompt type: {kind}")
@@ -84,10 +82,10 @@ def test_ngram_correctness(
     sampling_config: SamplingParams,
     model_name: str,
 ):
-    '''
+    """
     Compare the outputs of an original LLM and a speculative LLM
     should be the same when using ngram speculative decoding.
-    '''
+    """
     test_prompts = get_test_prompts(mm_enabled=False)
 
     ref_llm = LLM(model=model_name, max_model_len=1024)
@@ -129,32 +127,77 @@ def test_ngram_correctness(
     ["model_setup", "mm_enabled"],
     [
         (("eagle3", "Qwen/Qwen3-8B", "AngelSlim/Qwen3-8B_eagle3", 1), False),
-        pytest.param(("eagle3", "Qwen/Qwen2.5-VL-7B-Instruct",
-                      "Rayzl/qwen2.5-vl-7b-eagle3-sgl", 1),
-                     False,
-                     marks=pytest.mark.skip(reason="Skipping due to its " \
-                               "head_dim not being a a multiple of 32")),
-        (("eagle", "meta-llama/Llama-3.1-8B-Instruct",
-          "yuhuili/EAGLE-LLaMA3.1-Instruct-8B", 1), False),
-        (("eagle3", "meta-llama/Llama-3.1-8B-Instruct",
-          "yuhuili/EAGLE3-LLaMA3.1-Instruct-8B", 1), False),
-        pytest.param(("eagle", "meta-llama/Llama-4-Scout-17B-16E-Instruct",
-                      "morgendave/EAGLE-Llama-4-Scout-17B-16E-Instruct", 4),
-                     False,
-                     marks=large_gpu_mark(min_gb=80)),  # works on 4x H100
-        pytest.param(("eagle", "meta-llama/Llama-4-Scout-17B-16E-Instruct",
-                      "morgendave/EAGLE-Llama-4-Scout-17B-16E-Instruct", 4),
-                     True,
-                     marks=large_gpu_mark(min_gb=80)),  # works on 4x H100
-        (("eagle", "eagle618/deepseek-v3-random",
-          "eagle618/eagle-deepseek-v3-random", 1), False),
+        pytest.param(
+            (
+                "eagle3",
+                "Qwen/Qwen2.5-VL-7B-Instruct",
+                "Rayzl/qwen2.5-vl-7b-eagle3-sgl",
+                1,
+            ),
+            False,
+            marks=pytest.mark.skip(
+                reason="Skipping due to its head_dim not being a a multiple of 32"
+            ),
+        ),
+        (
+            (
+                "eagle",
+                "meta-llama/Llama-3.1-8B-Instruct",
+                "yuhuili/EAGLE-LLaMA3.1-Instruct-8B",
+                1,
+            ),
+            False,
+        ),
+        (
+            (
+                "eagle3",
+                "meta-llama/Llama-3.1-8B-Instruct",
+                "yuhuili/EAGLE3-LLaMA3.1-Instruct-8B",
+                1,
+            ),
+            False,
+        ),
+        pytest.param(
+            (
+                "eagle",
+                "meta-llama/Llama-4-Scout-17B-16E-Instruct",
+                "morgendave/EAGLE-Llama-4-Scout-17B-16E-Instruct",
+                4,
+            ),
+            False,
+            marks=large_gpu_mark(min_gb=80),
+        ),  # works on 4x H100
+        pytest.param(
+            (
+                "eagle",
+                "meta-llama/Llama-4-Scout-17B-16E-Instruct",
+                "morgendave/EAGLE-Llama-4-Scout-17B-16E-Instruct",
+                4,
+            ),
+            True,
+            marks=large_gpu_mark(min_gb=80),
+        ),  # works on 4x H100
+        (
+            (
+                "eagle",
+                "eagle618/deepseek-v3-random",
+                "eagle618/eagle-deepseek-v3-random",
+                1,
+            ),
+            False,
+        ),
     ],
     ids=[
-        "qwen3_eagle3", "qwen2_5_vl_eagle3", "llama3_eagle", "llama3_eagle3",
-        "llama4_eagle", "llama4_eagle_mm", "deepseek_eagle"
-    ])
-@pytest.mark.parametrize("attn_backend",
-                         get_attn_backend_list_based_on_platform())
+        "qwen3_eagle3",
+        "qwen2_5_vl_eagle3",
+        "llama3_eagle",
+        "llama3_eagle3",
+        "llama4_eagle",
+        "llama4_eagle_mm",
+        "deepseek_eagle",
+    ],
+)
+@pytest.mark.parametrize("attn_backend", get_attn_backend_list_based_on_platform())
 def test_eagle_correctness(
     monkeypatch: pytest.MonkeyPatch,
     sampling_config: SamplingParams,
@@ -166,15 +209,16 @@ def test_eagle_correctness(
         # TODO: Fix this flaky test
         pytest.skip(
             "TREE_ATTN is flaky in the test disable for now until it can be "
-            "resolved (see https://github.com/vllm-project/vllm/issues/22922)")
+            "resolved (see https://github.com/vllm-project/vllm/issues/22922)"
+        )
 
     # Generate test prompts inside the function instead of using fixture
     test_prompts = get_test_prompts(mm_enabled)
-    '''
+    """
     Compare the outputs of a original LLM and a speculative LLM
     should be the same when using eagle speculative decoding.
     model_setup: (method, model_name, eagle_model_name, tp_size)
-    '''
+    """
     with monkeypatch.context() as m:
         if "Llama-4-Scout" in model_setup[1] and attn_backend == "FLASH_ATTN":
             # Scout requires default backend selection
@@ -185,18 +229,20 @@ def test_eagle_correctness(
             m.setenv("VLLM_MLA_DISABLE", "1")
             m.setenv("VLLM_ATTENTION_BACKEND", attn_backend)
 
-        if (attn_backend == "TRITON_ATTN" and not current_platform.is_rocm()):
-            pytest.skip("TRITON_ATTN does not support "
-                        "multi-token eagle spec decode on current platform")
+        if attn_backend == "TRITON_ATTN" and not current_platform.is_rocm():
+            pytest.skip(
+                "TRITON_ATTN does not support "
+                "multi-token eagle spec decode on current platform"
+            )
 
         if attn_backend == "FLASH_ATTN" and current_platform.is_rocm():
             m.setenv("VLLM_ROCM_USE_AITER", "1")
 
         method, model_name, spec_model_name, tp_size = model_setup
 
-        ref_llm = LLM(model=model_name,
-                      max_model_len=2048,
-                      tensor_parallel_size=tp_size)
+        ref_llm = LLM(
+            model=model_name, max_model_len=2048, tensor_parallel_size=tp_size
+        )
         ref_outputs = ref_llm.chat(test_prompts, sampling_config)
         del ref_llm
         torch.cuda.empty_cache()
@@ -233,11 +279,14 @@ def test_eagle_correctness(
         cleanup_dist_env_and_memory()
 
 
-@pytest.mark.parametrize(["model_setup", "mm_enabled"], [
-    (("mtp", "XiaomiMiMo/MiMo-7B-Base", 1), False),
-    (("mtp", "ZixiQi/DeepSeek-V3-4layers-MTP-FP8", 1), False),
-],
-                         ids=["mimo", "deepseek"])
+@pytest.mark.parametrize(
+    ["model_setup", "mm_enabled"],
+    [
+        (("mtp", "XiaomiMiMo/MiMo-7B-Base", 1), False),
+        (("mtp", "ZixiQi/DeepSeek-V3-4layers-MTP-FP8", 1), False),
+    ],
+    ids=["mimo", "deepseek"],
+)
 def test_mtp_correctness(
     monkeypatch: pytest.MonkeyPatch,
     sampling_config: SamplingParams,
@@ -246,21 +295,23 @@ def test_mtp_correctness(
 ):
     # Generate test prompts inside the function instead of using fixture
     test_prompts = get_test_prompts(mm_enabled)
-    '''
+    """
     Compare the outputs of a original LLM and a speculative LLM
     should be the same when using MTP speculative decoding.
     model_setup: (method, model_name, tp_size)
-    '''
+    """
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
         m.setenv("VLLM_MLA_DISABLE", "1")
 
         method, model_name, tp_size = model_setup
 
-        ref_llm = LLM(model=model_name,
-                      max_model_len=2048,
-                      tensor_parallel_size=tp_size,
-                      trust_remote_code=True)
+        ref_llm = LLM(
+            model=model_name,
+            max_model_len=2048,
+            tensor_parallel_size=tp_size,
+            trust_remote_code=True,
+        )
         ref_outputs = ref_llm.chat(test_prompts, sampling_config)
         del ref_llm
         torch.cuda.empty_cache()
diff --git a/tests/v1/engine/conftest.py b/tests/v1/engine/conftest.py
index a73a9a6999f7..c5c5d35b83c3 100644
--- a/tests/v1/engine/conftest.py
+++ b/tests/v1/engine/conftest.py
@@ -5,12 +5,15 @@
 import torch
 from transformers import AutoTokenizer
 
-from tests.v1.engine.utils import (NUM_PROMPT_LOGPROBS_UNDER_TEST,
-                                   NUM_SAMPLE_LOGPROBS_UNDER_TEST, PROMPT_LEN,
-                                   TOKENIZER_NAME,
-                                   DummyOutputProcessorTestVectors,
-                                   generate_dummy_prompt_logprobs_tensors,
-                                   generate_dummy_sample_logprobs)
+from tests.v1.engine.utils import (
+    NUM_PROMPT_LOGPROBS_UNDER_TEST,
+    NUM_SAMPLE_LOGPROBS_UNDER_TEST,
+    PROMPT_LEN,
+    TOKENIZER_NAME,
+    DummyOutputProcessorTestVectors,
+    generate_dummy_prompt_logprobs_tensors,
+    generate_dummy_sample_logprobs,
+)
 from vllm.engine.arg_utils import EngineArgs
 
 from ...distributed.conftest import publisher_config, random_port  # noqa: F401
@@ -31,9 +34,7 @@ def _build_test_vectors_no_logprobs() -> DummyOutputProcessorTestVectors:
     tokenizer = AutoTokenizer.from_pretrained(TOKENIZER_NAME)
     vllm_config = EngineArgs(model=TOKENIZER_NAME).create_engine_config()
     # Tokenize prompts under test & create dummy generated tokens
-    prompt_tokens = [
-        tokenizer(text).input_ids[:PROMPT_LEN] for text in FULL_STRINGS
-    ]
+    prompt_tokens = [tokenizer(text).input_ids[:PROMPT_LEN] for text in FULL_STRINGS]
     generation_tokens = [
         tokenizer(text).input_ids[PROMPT_LEN:] for text in FULL_STRINGS
     ]
@@ -42,9 +43,7 @@ def _build_test_vectors_no_logprobs() -> DummyOutputProcessorTestVectors:
         tokenizer.decode(prompt_tokens, skip_special_tokens=True)
         for prompt_tokens in prompt_tokens
     ]
-    prompt_strings_len = [
-        len(prompt_string) for prompt_string in prompt_strings
-    ]
+    prompt_strings_len = [len(prompt_string) for prompt_string in prompt_strings]
     return DummyOutputProcessorTestVectors(
         tokenizer=tokenizer,
         vllm_config=vllm_config,
@@ -58,7 +57,8 @@ def _build_test_vectors_no_logprobs() -> DummyOutputProcessorTestVectors:
             for text, prompt_len in zip(FULL_STRINGS, prompt_strings_len)
         ],
         prompt_logprobs=[],
-        generation_logprobs=[])
+        generation_logprobs=[],
+    )
 
 
 @pytest.fixture
@@ -76,12 +76,16 @@ def dummy_test_vectors() -> DummyOutputProcessorTestVectors:
         generate_dummy_sample_logprobs(
             sampled_tokens_list=tokens_list,
             num_logprobs=NUM_SAMPLE_LOGPROBS_UNDER_TEST,
-            tokenizer=dtv.tokenizer) for tokens_list in dtv.generation_tokens
+            tokenizer=dtv.tokenizer,
+        )
+        for tokens_list in dtv.generation_tokens
     ]
     dtv.prompt_logprobs = [
         generate_dummy_prompt_logprobs_tensors(
             prompt_tokens_list=tokens_list,
             num_logprobs=NUM_PROMPT_LOGPROBS_UNDER_TEST,
-            tokenizer=dtv.tokenizer) for tokens_list in dtv.prompt_tokens
+            tokenizer=dtv.tokenizer,
+        )
+        for tokens_list in dtv.prompt_tokens
     ]
     return dtv
diff --git a/tests/v1/engine/test_async_llm.py b/tests/v1/engine/test_async_llm.py
index aca546600d0b..3e30d28111c8 100644
--- a/tests/v1/engine/test_async_llm.py
+++ b/tests/v1/engine/test_async_llm.py
@@ -21,16 +21,16 @@
 from vllm.v1.metrics.loggers import LoggingStatLogger
 
 if not current_platform.is_cuda():
-    pytest.skip(reason="V1 currently only supported on CUDA.",
-                allow_module_level=True)
+    pytest.skip(reason="V1 currently only supported on CUDA.", allow_module_level=True)
 
 TEXT_ENGINE_ARGS = AsyncEngineArgs(
     model="meta-llama/Llama-3.2-1B-Instruct",
     enforce_eager=True,
 )
 
-VISION_ENGINE_ARGS = AsyncEngineArgs(model="Qwen/Qwen2-VL-2B-Instruct",
-                                     enforce_eager=True)
+VISION_ENGINE_ARGS = AsyncEngineArgs(
+    model="Qwen/Qwen2-VL-2B-Instruct", enforce_eager=True
+)
 
 TEXT_PROMPT = "Hello my name is Robert and"
 
@@ -38,12 +38,11 @@
     "<|im_start|>system\nYou are a helpful assistant.<|im_end|>"
     "\n<|im_start|>user\n<|vision_start|><|image_pad|><|vision_end|>"
     "What is in the image?<|im_end|>\n"
-    "<|im_start|>assistant\n")
+    "<|im_start|>assistant\n"
+)
 VISION_PROMPT = {
     "prompt": VISION_PROMPT_TEMPLATE,
-    "multi_modal_data": {
-        "image": ImageAsset("stop_sign").pil_image
-    },
+    "multi_modal_data": {"image": ImageAsset("stop_sign").pil_image},
 }
 
 
@@ -70,10 +69,9 @@ async def generate(
         n=n,
         prompt_logprobs=prompt_logprobs,
     )
-    async for out in engine.generate(request_id=request_id,
-                                     prompt=prompt,
-                                     sampling_params=sampling_params):
-
+    async for out in engine.generate(
+        request_id=request_id, prompt=prompt, sampling_params=sampling_params
+    ):
         num_tokens = sum(len(output.token_ids) for output in out.outputs)
         if output_kind == RequestOutputKind.DELTA:
             count += num_tokens
@@ -89,7 +87,8 @@ async def generate(
 
 
 @pytest.mark.parametrize(
-    "output_kind", [RequestOutputKind.DELTA, RequestOutputKind.FINAL_ONLY])
+    "output_kind", [RequestOutputKind.DELTA, RequestOutputKind.FINAL_ONLY]
+)
 @pytest.mark.parametrize(
     "engine_args,prompt",
     [(TEXT_ENGINE_ARGS, TEXT_PROMPT), (VISION_ENGINE_ARGS, VISION_PROMPT)],
@@ -121,25 +120,29 @@ async def test_load(
         for request_id in request_ids:
             tasks.append(
                 asyncio.create_task(
-                    generate(engine, request_id, prompt, output_kind,
-                             NUM_EXPECTED_TOKENS)))
+                    generate(
+                        engine, request_id, prompt, output_kind, NUM_EXPECTED_TOKENS
+                    )
+                )
+            )
 
         # Confirm that we got all the EXPECTED tokens from the requests.
-        done, pending = await asyncio.wait(tasks,
-                                           return_when=asyncio.FIRST_EXCEPTION)
+        done, pending = await asyncio.wait(tasks, return_when=asyncio.FIRST_EXCEPTION)
         for task in pending:
             task.cancel()
         for task in done:
             num_generated_tokens, request_id = await task
             assert num_generated_tokens == NUM_EXPECTED_TOKENS, (
                 f"{request_id} generated {num_generated_tokens} but "
-                f"expected {NUM_EXPECTED_TOKENS}")
+                f"expected {NUM_EXPECTED_TOKENS}"
+            )
 
         assert not engine.output_processor.has_unfinished_requests()
 
 
 @pytest.mark.parametrize(
-    "output_kind", [RequestOutputKind.DELTA, RequestOutputKind.FINAL_ONLY])
+    "output_kind", [RequestOutputKind.DELTA, RequestOutputKind.FINAL_ONLY]
+)
 @pytest.mark.parametrize(
     "engine_args,prompt",
     [(TEXT_ENGINE_ARGS, TEXT_PROMPT), (VISION_ENGINE_ARGS, VISION_PROMPT)],
@@ -151,7 +154,6 @@ async def test_abort(
     engine_args: AsyncEngineArgs,
     prompt: PromptType,
 ):
-
     with monkeypatch.context() as m, ExitStack() as after:
         m.setenv("VLLM_USE_V1", "1")
 
@@ -170,14 +172,17 @@ async def test_abort(
         # Create concurrent requests.
         tasks: list[asyncio.Task] = []
         for idx, request_id in enumerate(request_ids):
-            max_tokens = (NUM_EXPECTED_TOKENS_LONG if
-                          (idx
-                           in REQUEST_IDS_TO_ABORT) else NUM_EXPECTED_TOKENS)
+            max_tokens = (
+                NUM_EXPECTED_TOKENS_LONG
+                if (idx in REQUEST_IDS_TO_ABORT)
+                else NUM_EXPECTED_TOKENS
+            )
             n = 3 if idx in PARALLEL_SAMPLE_REQ_IDS else 1
             tasks.append(
                 asyncio.create_task(
-                    generate(engine, request_id, prompt, output_kind,
-                             max_tokens, n)))
+                    generate(engine, request_id, prompt, output_kind, max_tokens, n)
+                )
+            )
 
         # API server cancels requests when they disconnect.
         for idx in REQUEST_IDS_TO_ABORT:
@@ -197,7 +202,8 @@ async def test_abort(
                 expected_tokens = NUM_EXPECTED_TOKENS * n
                 assert num_generated_tokens == expected_tokens, (
                     f"{request_id} generated {num_generated_tokens} but "
-                    f"expected {expected_tokens}")
+                    f"expected {expected_tokens}"
+                )
 
         # Make sure all aborted requests were really aborted.
         assert not engine.output_processor.has_unfinished_requests()
@@ -205,21 +211,21 @@ async def test_abort(
         # Confirm we can do another generation.
         request_id = f"request-{REQUEST_IDS_TO_ABORT[0]}"
         task = asyncio.create_task(
-            generate(engine, request_id, prompt, output_kind,
-                     NUM_EXPECTED_TOKENS))
+            generate(engine, request_id, prompt, output_kind, NUM_EXPECTED_TOKENS)
+        )
         num_generated_tokens, request_id = await task
         assert num_generated_tokens == NUM_EXPECTED_TOKENS
         assert not engine.output_processor.has_unfinished_requests()
 
 
 @pytest.mark.parametrize(
-    "output_kind", [RequestOutputKind.DELTA, RequestOutputKind.FINAL_ONLY])
+    "output_kind", [RequestOutputKind.DELTA, RequestOutputKind.FINAL_ONLY]
+)
 @pytest.mark.asyncio
 async def test_multi_abort(
     monkeypatch: pytest.MonkeyPatch,
     output_kind: RequestOutputKind,
 ):
-
     with monkeypatch.context() as m, ExitStack() as after:
         m.setenv("VLLM_USE_V1", "1")
 
@@ -238,14 +244,19 @@ async def test_multi_abort(
         # Create concurrent requests.
         tasks: list[asyncio.Task] = []
         for idx, request_id in enumerate(request_ids):
-            max_tokens = (NUM_EXPECTED_TOKENS_LONG if
-                          (idx
-                           in REQUEST_IDS_TO_ABORT) else NUM_EXPECTED_TOKENS)
+            max_tokens = (
+                NUM_EXPECTED_TOKENS_LONG
+                if (idx in REQUEST_IDS_TO_ABORT)
+                else NUM_EXPECTED_TOKENS
+            )
             n = 3 if idx in PARALLEL_SAMPLE_REQ_IDS else 1
             tasks.append(
                 asyncio.create_task(
-                    generate(engine, request_id, TEXT_PROMPT, output_kind,
-                             max_tokens, n)))
+                    generate(
+                        engine, request_id, TEXT_PROMPT, output_kind, max_tokens, n
+                    )
+                )
+            )
 
         # Let requests start
         await asyncio.sleep(0.5)
@@ -261,25 +272,26 @@ async def test_multi_abort(
         for idx, result in enumerate(results):
             if idx in REQUEST_IDS_TO_ABORT:
                 # Aborted requests should return partial results
-                assert isinstance(
-                    result, tuple
-                ), f"Request {idx} should have completed with partial results"
+                assert isinstance(result, tuple), (
+                    f"Request {idx} should have completed with partial results"
+                )
                 num_generated_tokens, request_id = result
                 # Should have generated some tokens before abort
                 assert num_generated_tokens > 0, (
-                    f"Aborted request "
-                    f"{request_id} should have generated some tokens")
+                    f"Aborted request {request_id} should have generated some tokens"
+                )
             else:
                 # Non-aborted requests should complete normally
-                assert isinstance(
-                    result,
-                    tuple), f"Request {idx} should have completed successfully"
+                assert isinstance(result, tuple), (
+                    f"Request {idx} should have completed successfully"
+                )
                 num_generated_tokens, request_id = result
                 n = 3 if idx in PARALLEL_SAMPLE_REQ_IDS else 1
                 expected_tokens = NUM_EXPECTED_TOKENS * n
                 assert num_generated_tokens == expected_tokens, (
                     f"{request_id} generated {num_generated_tokens} but "
-                    f"expected {expected_tokens}")
+                    f"expected {expected_tokens}"
+                )
 
         # Make sure all aborted requests were cleaned up
         assert not engine.output_processor.has_unfinished_requests()
@@ -297,7 +309,6 @@ async def test_finished_flag(
     engine_args: AsyncEngineArgs,
     prompt: PromptType,
 ):
-
     with monkeypatch.context() as m, ExitStack() as after:
         m.setenv("VLLM_USE_V1", "1")
 
@@ -314,9 +325,9 @@ async def test_finished_flag(
         )
         outputs = [
             out
-            async for out in engine.generate(request_id="request-33",
-                                             prompt=prompt,
-                                             sampling_params=sampling_params)
+            async for out in engine.generate(
+                request_id="request-33", prompt=prompt, sampling_params=sampling_params
+            )
         ]
 
         # Assert only the last output has the finished flag set
@@ -329,9 +340,9 @@ async def test_finished_flag(
     [(TEXT_ENGINE_ARGS, TEXT_PROMPT), (VISION_ENGINE_ARGS, VISION_PROMPT)],
 )
 @pytest.mark.asyncio
-async def test_mid_stream_cancellation(monkeypatch: pytest.MonkeyPatch,
-                                       engine_args: AsyncEngineArgs,
-                                       prompt: PromptType):
+async def test_mid_stream_cancellation(
+    monkeypatch: pytest.MonkeyPatch, engine_args: AsyncEngineArgs, prompt: PromptType
+):
     """Test that requests can be cancelled mid-stream."""
     with monkeypatch.context() as m, ExitStack() as after:
         m.setenv("VLLM_USE_V1", "1")
@@ -358,7 +369,9 @@ async def test_mid_stream_cancellation(monkeypatch: pytest.MonkeyPatch,
                         RequestOutputKind.DELTA,
                         NUM_TOKENS,
                         cancel_after=NUM_EXPECTED_TOKENS,
-                    )))
+                    )
+                )
+            )
 
         # Wait for all tasks to complete
         results = await asyncio.gather(*tasks)
@@ -367,7 +380,8 @@ async def test_mid_stream_cancellation(monkeypatch: pytest.MonkeyPatch,
         for num_generated_tokens, request_id in results:
             assert num_generated_tokens == NUM_EXPECTED_TOKENS, (
                 f"{request_id} generated {num_generated_tokens} tokens but "
-                f"expected to cancel after {NUM_EXPECTED_TOKENS}")
+                f"expected to cancel after {NUM_EXPECTED_TOKENS}"
+            )
 
         # Make sure no requests are left hanging
         assert not engine.output_processor.has_unfinished_requests()
@@ -375,15 +389,16 @@ async def test_mid_stream_cancellation(monkeypatch: pytest.MonkeyPatch,
         # Confirm we can reuse the request id after the cancellations.
         request_id = request_ids[0]
         task = asyncio.create_task(
-            generate(engine, request_id, prompt, RequestOutputKind.DELTA,
-                     NUM_EXPECTED_TOKENS))
+            generate(
+                engine, request_id, prompt, RequestOutputKind.DELTA, NUM_EXPECTED_TOKENS
+            )
+        )
         num_generated_tokens, request_id = await task
         assert num_generated_tokens == NUM_EXPECTED_TOKENS
         assert not engine.output_processor.has_unfinished_requests()
 
 
 class MockLoggingStatLogger(LoggingStatLogger):
-
     def __init__(self, vllm_config: VllmConfig, engine_index: int = 0):
         super().__init__(vllm_config, engine_index)
         self.log = MagicMock()
@@ -410,8 +425,7 @@ async def test_customize_loggers(monkeypatch):
 
         stat_loggers = engine.logger_manager.per_engine_logger_dict
         assert len(stat_loggers) == 1
-        assert len(
-            stat_loggers[0]) == 2  # LoggingStatLogger + MockLoggingStatLogger
+        assert len(stat_loggers[0]) == 2  # LoggingStatLogger + MockLoggingStatLogger
         stat_loggers[0][0].log.assert_called_once()
 
 
@@ -424,24 +438,30 @@ async def test_dp_rank_argument(monkeypatch: pytest.MonkeyPatch):
             engine = AsyncLLM.from_engine_args(TEXT_ENGINE_ARGS)
         after.callback(engine.shutdown)
 
-        sampling_params = SamplingParams(max_tokens=100,
-                                         output_kind=RequestOutputKind.DELTA,
-                                         temperature=1.0,
-                                         seed=33)
+        sampling_params = SamplingParams(
+            max_tokens=100,
+            output_kind=RequestOutputKind.DELTA,
+            temperature=1.0,
+            seed=33,
+        )
 
         # Test with valid DP rank.
-        async for _ in engine.generate(request_id="request-34",
-                                       prompt=TEXT_PROMPT,
-                                       sampling_params=sampling_params,
-                                       data_parallel_rank=0):
+        async for _ in engine.generate(
+            request_id="request-34",
+            prompt=TEXT_PROMPT,
+            sampling_params=sampling_params,
+            data_parallel_rank=0,
+        ):
             pass
 
         # Test with out-of-range DP rank.
         with pytest.raises(ValueError):
-            async for _ in engine.generate(request_id="request-35",
-                                           prompt=TEXT_PROMPT,
-                                           sampling_params=sampling_params,
-                                           data_parallel_rank=1):
+            async for _ in engine.generate(
+                request_id="request-35",
+                prompt=TEXT_PROMPT,
+                sampling_params=sampling_params,
+                data_parallel_rank=1,
+            ):
                 pass
 
 
@@ -465,10 +485,14 @@ async def test_check_health(monkeypatch: pytest.MonkeyPatch):
         await engine.check_health()
 
         # Test 2: Mock the errored property to simulate a dead engine
-        with patch.object(type(engine),
-                          'errored',
-                          new_callable=lambda: property(lambda self: True)
-                          ), pytest.raises(EngineDeadError):
+        with (
+            patch.object(
+                type(engine),
+                "errored",
+                new_callable=lambda: property(lambda self: True),
+            ),
+            pytest.raises(EngineDeadError),
+        ):
             await engine.check_health()
 
         # Test 3: Verify healthy engine still works after mock
@@ -476,7 +500,8 @@ async def test_check_health(monkeypatch: pytest.MonkeyPatch):
 
 
 @pytest.mark.parametrize(
-    "output_kind", [RequestOutputKind.DELTA, RequestOutputKind.FINAL_ONLY])
+    "output_kind", [RequestOutputKind.DELTA, RequestOutputKind.FINAL_ONLY]
+)
 @pytest.mark.asyncio
 async def test_abort_final_output(
     monkeypatch: pytest.MonkeyPatch,
@@ -504,8 +529,8 @@ async def test_abort_final_output(
 
         outputs: list[RequestOutput] = []
         generated = asyncio.create_task(
-            collect_outputs(engine, request_id, TEXT_PROMPT, sampling_params,
-                            outputs))
+            collect_outputs(engine, request_id, TEXT_PROMPT, sampling_params, outputs)
+        )
 
         # Let it generate some tokens
         await asyncio.sleep(0.5)
@@ -525,14 +550,13 @@ async def test_abort_final_output(
         assert final_output.outputs[0].stop_reason is None
 
         # Verify num_cached_tokens is set correctly
-        assert hasattr(final_output, 'num_cached_tokens')
+        assert hasattr(final_output, "num_cached_tokens")
         assert final_output.num_cached_tokens >= 0
 
         # If we got intermediate outputs, verify they are consistent
         if output_kind == RequestOutputKind.DELTA:
             # For DELTA, sum all intermediate tokens should <= final tokens
-            token_count = sum(
-                len(output.outputs[0].token_ids) for output in outputs)
+            token_count = sum(len(output.outputs[0].token_ids) for output in outputs)
             assert token_count > 0
             # This would ordinarily be 0, but could end up > 0 if the
             # final abort is coalesced with another chunk in the output queue.
@@ -554,9 +578,9 @@ async def collect_outputs(
 ) -> Optional[RequestOutput]:
     """Helper to collect outputs and return the final one."""
     final_output: Optional[RequestOutput] = None
-    async for output in engine.generate(request_id=request_id,
-                                        prompt=prompt,
-                                        sampling_params=sampling_params):
+    async for output in engine.generate(
+        request_id=request_id, prompt=prompt, sampling_params=sampling_params
+    ):
         if not output.finished:
             outputs_list.append(output)
         final_output = output
diff --git a/tests/v1/engine/test_engine_args.py b/tests/v1/engine/test_engine_args.py
index 23ec3673b10b..f6b10fa67b3b 100644
--- a/tests/v1/engine/test_engine_args.py
+++ b/tests/v1/engine/test_engine_args.py
@@ -22,8 +22,9 @@ def test_prefix_caching_from_cli():
     parser = EngineArgs.add_cli_args(FlexibleArgumentParser())
     args = parser.parse_args([])
     vllm_config = EngineArgs.from_cli_args(args=args).create_engine_config()
-    assert (vllm_config.cache_config.enable_prefix_caching
-            ), "V1 turns on prefix caching by default."
+    assert vllm_config.cache_config.enable_prefix_caching, (
+        "V1 turns on prefix caching by default."
+    )
 
     # Turn it off possible with flag.
     args = parser.parse_args(["--no-enable-prefix-caching"])
@@ -41,8 +42,7 @@ def test_prefix_caching_from_cli():
     # set hash algorithm to sha256_cbor
     args = parser.parse_args(["--prefix-caching-hash-algo", "sha256_cbor"])
     vllm_config = EngineArgs.from_cli_args(args=args).create_engine_config()
-    assert vllm_config.cache_config.prefix_caching_hash_algo == \
-        "sha256_cbor"
+    assert vllm_config.cache_config.prefix_caching_hash_algo == "sha256_cbor"
 
     # set hash algorithm to sha256
     args = parser.parse_args(["--prefix-caching-hash-algo", "sha256"])
@@ -57,10 +57,10 @@ def test_prefix_caching_from_cli():
 
 def test_defaults_with_usage_context():
     engine_args = EngineArgs(model="facebook/opt-125m")
-    vllm_config: VllmConfig = engine_args.create_engine_config(
-        UsageContext.LLM_CLASS)
+    vllm_config: VllmConfig = engine_args.create_engine_config(UsageContext.LLM_CLASS)
 
     from vllm.platforms import current_platform
+
     device_name = current_platform.get_device_name().lower()
     if "h100" in device_name or "h200" in device_name:
         # For H100 and H200, we use larger default values.
@@ -76,7 +76,6 @@ def test_defaults_with_usage_context():
     assert vllm_config.scheduler_config.max_num_batched_tokens == default_llm_tokens  # noqa: E501
 
     engine_args = EngineArgs(model="facebook/opt-125m")
-    vllm_config = engine_args.create_engine_config(
-        UsageContext.OPENAI_API_SERVER)
+    vllm_config = engine_args.create_engine_config(UsageContext.OPENAI_API_SERVER)
     assert vllm_config.scheduler_config.max_num_seqs == default_max_num_seqs
     assert vllm_config.scheduler_config.max_num_batched_tokens == default_server_tokens  # noqa: E501
diff --git a/tests/v1/engine/test_engine_core.py b/tests/v1/engine/test_engine_core.py
index 17b136aa4273..28d7854ab5d2 100644
--- a/tests/v1/engine/test_engine_core.py
+++ b/tests/v1/engine/test_engine_core.py
@@ -22,8 +22,7 @@
 from ...utils import create_new_process_for_each_test, multi_gpu_test
 
 if not current_platform.is_cuda():
-    pytest.skip(reason="V1 currently only supported on CUDA.",
-                allow_module_level=True)
+    pytest.skip(reason="V1 currently only supported on CUDA.", allow_module_level=True)
 
 MODEL_NAME = "meta-llama/Llama-3.2-1B-Instruct"
 TOKENIZER = AutoTokenizer.from_pretrained(MODEL_NAME)
@@ -48,7 +47,6 @@ def make_request() -> EngineCoreRequest:
 
 @create_new_process_for_each_test()
 def test_engine_core(monkeypatch: pytest.MonkeyPatch):
-
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
         """Setup the EngineCore."""
@@ -57,14 +55,13 @@ def test_engine_core(monkeypatch: pytest.MonkeyPatch):
         executor_class = Executor.get_class(vllm_config)
 
         with set_default_torch_num_threads(1):
-            engine_core = EngineCore(vllm_config=vllm_config,
-                                     executor_class=executor_class,
-                                     log_stats=True)
+            engine_core = EngineCore(
+                vllm_config=vllm_config, executor_class=executor_class, log_stats=True
+            )
         """Test basic request lifecycle."""
 
         # First request.
-        engine_core.add_request(
-            *engine_core.preprocess_add_request(make_request()))
+        engine_core.add_request(*engine_core.preprocess_add_request(make_request()))
         assert len(engine_core.scheduler.waiting) == 1
         assert len(engine_core.scheduler.running) == 0
 
@@ -73,8 +70,7 @@ def test_engine_core(monkeypatch: pytest.MonkeyPatch):
         assert len(engine_core.scheduler.running) == 1
 
         # Second request.
-        engine_core.add_request(
-            *engine_core.preprocess_add_request(make_request()))
+        engine_core.add_request(*engine_core.preprocess_add_request(make_request()))
         assert len(engine_core.scheduler.waiting) == 1
         assert len(engine_core.scheduler.running) == 1
 
@@ -83,10 +79,8 @@ def test_engine_core(monkeypatch: pytest.MonkeyPatch):
         assert len(engine_core.scheduler.running) == 2
 
         # Add two requests in a row.
-        engine_core.add_request(
-            *engine_core.preprocess_add_request(make_request()))
-        engine_core.add_request(
-            *engine_core.preprocess_add_request(make_request()))
+        engine_core.add_request(*engine_core.preprocess_add_request(make_request()))
+        engine_core.add_request(*engine_core.preprocess_add_request(make_request()))
         assert len(engine_core.scheduler.waiting) == 2
         assert len(engine_core.scheduler.running) == 2
 
@@ -196,9 +190,9 @@ def test_engine_core_advanced_sampling(monkeypatch: pytest.MonkeyPatch):
         executor_class = Executor.get_class(vllm_config)
 
         with set_default_torch_num_threads(1):
-            engine_core = EngineCore(vllm_config=vllm_config,
-                                     executor_class=executor_class,
-                                     log_stats=True)
+            engine_core = EngineCore(
+                vllm_config=vllm_config, executor_class=executor_class, log_stats=True
+            )
         """Test basic request lifecycle."""
         # First request.
         request: EngineCoreRequest = make_request()
@@ -238,17 +232,14 @@ def test_engine_core_concurrent_batches(monkeypatch: pytest.MonkeyPatch):
     Test that the engine can handle multiple concurrent batches.
     """
 
-    def make_request_with_max_tokens(req_id: str,
-                                     max_tokens: int) -> EngineCoreRequest:
+    def make_request_with_max_tokens(req_id: str, max_tokens: int) -> EngineCoreRequest:
         request = make_request()
         request.request_id = req_id
         request.sampling_params.max_tokens = max_tokens
         return request
 
     class DummyExecutor(UniProcExecutor):
-
-        def initialize_from_config(
-                self, kv_cache_configs: list[KVCacheConfig]) -> None:
+        def initialize_from_config(self, kv_cache_configs: list[KVCacheConfig]) -> None:
             super().initialize_from_config(kv_cache_configs)
 
             # Create a thread pool with a single worker
@@ -265,8 +256,7 @@ def execute_model(
             assert non_block
 
             def _execute():
-                output = self.collective_rpc("execute_model",
-                                             args=(scheduler_output, ))
+                output = self.collective_rpc("execute_model", args=(scheduler_output,))
                 # Make a copy because output[0] may be reused
                 # by the next batch.
                 return copy.deepcopy(output[0])
@@ -279,7 +269,7 @@ def max_concurrent_batches(self) -> int:
             return 2
 
         def shutdown(self):
-            if hasattr(self, 'thread_pool'):
+            if hasattr(self, "thread_pool"):
                 self.thread_pool.shutdown(wait=False)
 
     with monkeypatch.context() as m:
@@ -297,9 +287,9 @@ def shutdown(self):
         )
         vllm_config = engine_args.create_engine_config()
         with set_default_torch_num_threads(1):
-            engine_core = EngineCore(vllm_config=vllm_config,
-                                     log_stats=False,
-                                     executor_class=DummyExecutor)
+            engine_core = EngineCore(
+                vllm_config=vllm_config, log_stats=False, executor_class=DummyExecutor
+            )
         assert engine_core.batch_queue is not None
 
         # Add two requests in a row. Each request have 12 prompt tokens.
@@ -314,8 +304,7 @@ def shutdown(self):
         scheduler_output = engine_core.batch_queue[-1][1]
         assert scheduler_output.num_scheduled_tokens["0"] == 10
         # num_computed_tokens should have been updated immediately.
-        assert engine_core.scheduler.requests[
-            req0.request_id].num_computed_tokens == 10
+        assert engine_core.scheduler.requests[req0.request_id].num_computed_tokens == 10
 
         # Schedule Batch 2: (2, req0), (8, req1)
         assert engine_core.step_with_batch_queue()[0] == {}
@@ -366,8 +355,10 @@ def shutdown(self):
             assert output is not None
             assert len(output[0].outputs) == 1
             if req_id in engine_core.scheduler.requests:
-                assert engine_core.scheduler.requests[
-                    req_id].num_tokens == expected_num_tokens[req_id]
+                assert (
+                    engine_core.scheduler.requests[req_id].num_tokens
+                    == expected_num_tokens[req_id]
+                )
             expected_num_tokens[req_id] += 1
             req_id = (req_id + 1) % 2
 
@@ -391,17 +382,19 @@ def test_engine_core_tp(monkeypatch: pytest.MonkeyPatch):
         executor_class = Executor.get_class(vllm_config)
 
         with set_default_torch_num_threads(1):
-            engine_core = EngineCore(vllm_config=vllm_config,
-                                     executor_class=executor_class,
-                                     log_stats=True)
+            engine_core = EngineCore(
+                vllm_config=vllm_config, executor_class=executor_class, log_stats=True
+            )
 
         def get_worker_cache_config_field(worker, key: str):
             return getattr(worker.cache_config, key)
 
         num_gpu_blocks = engine_core.collective_rpc(
-            get_worker_cache_config_field, args=("num_gpu_blocks", ))
+            get_worker_cache_config_field, args=("num_gpu_blocks",)
+        )
         num_cpu_blocks = engine_core.collective_rpc(
-            get_worker_cache_config_field, args=("num_cpu_blocks", ))
+            get_worker_cache_config_field, args=("num_cpu_blocks",)
+        )
         assert all(x is not None for x in num_gpu_blocks)
         assert all(x is not None for x in num_cpu_blocks)
 
@@ -417,40 +410,35 @@ def test_engine_core_invalid_request_id_type(monkeypatch: pytest.MonkeyPatch):
         executor_class = Executor.get_class(vllm_config)
 
         with set_default_torch_num_threads(1):
-            engine_core = EngineCore(vllm_config=vllm_config,
-                                     executor_class=executor_class,
-                                     log_stats=True)
+            engine_core = EngineCore(
+                vllm_config=vllm_config, executor_class=executor_class, log_stats=True
+            )
 
         # Test with UUID object (common mistake)
         uuid_request = make_request()
         uuid_request.request_id = uuid.uuid4()  # UUID object instead of string
 
-        with pytest.raises(TypeError,
-                           match="request_id must be a string, got.*UUID"):
-            engine_core.add_request(
-                *engine_core.preprocess_add_request(uuid_request))
+        with pytest.raises(TypeError, match="request_id must be a string, got.*UUID"):
+            engine_core.add_request(*engine_core.preprocess_add_request(uuid_request))
 
         # Test with integer
         int_request = make_request()
         int_request.request_id = 12345
 
-        with pytest.raises(TypeError,
-                           match="request_id must be a string, got.*int"):
-            engine_core.add_request(
-                *engine_core.preprocess_add_request(int_request))
+        with pytest.raises(TypeError, match="request_id must be a string, got.*int"):
+            engine_core.add_request(*engine_core.preprocess_add_request(int_request))
 
         # Test with None
         none_request = make_request()
         none_request.request_id = None
 
-        with pytest.raises(TypeError,
-                           match="request_id must be a string, got.*NoneType"):
-            engine_core.add_request(
-                *engine_core.preprocess_add_request(none_request))
+        with pytest.raises(
+            TypeError, match="request_id must be a string, got.*NoneType"
+        ):
+            engine_core.add_request(*engine_core.preprocess_add_request(none_request))
 
         # Verify engine is still functional after errors
         valid_request = make_request()
-        engine_core.add_request(
-            *engine_core.preprocess_add_request(valid_request))
+        engine_core.add_request(*engine_core.preprocess_add_request(valid_request))
         assert len(engine_core.scheduler.waiting) == 1
         assert len(engine_core.scheduler.running) == 0
diff --git a/tests/v1/engine/test_engine_core_client.py b/tests/v1/engine/test_engine_core_client.py
index 10adac9bab5f..90284fc54d06 100644
--- a/tests/v1/engine/test_engine_core_client.py
+++ b/tests/v1/engine/test_engine_core_client.py
@@ -17,16 +17,14 @@
 
 from tests.utils import multi_gpu_test
 from vllm import SamplingParams
-from vllm.distributed.kv_events import (BlockStored, KVEventBatch,
-                                        ZmqEventPublisher)
+from vllm.distributed.kv_events import BlockStored, KVEventBatch, ZmqEventPublisher
 from vllm.engine.arg_utils import EngineArgs
 from vllm.platforms import current_platform
 from vllm.usage.usage_lib import UsageContext
 from vllm.utils import set_default_torch_num_threads
 from vllm.v1.engine import EngineCoreRequest
 from vllm.v1.engine.core import EngineCore
-from vllm.v1.engine.core_client import (AsyncMPClient, EngineCoreClient,
-                                        SyncMPClient)
+from vllm.v1.engine.core_client import AsyncMPClient, EngineCoreClient, SyncMPClient
 from vllm.v1.engine.utils import CoreEngineProcManager
 from vllm.v1.executor.abstract import Executor
 
@@ -34,8 +32,7 @@
 from ...utils import create_new_process_for_each_test
 
 if not current_platform.is_cuda():
-    pytest.skip(reason="V1 currently only supported on CUDA.",
-                allow_module_level=True)
+    pytest.skip(reason="V1 currently only supported on CUDA.", allow_module_level=True)
 
 MODEL_NAME = "meta-llama/Llama-3.2-1B-Instruct"
 TOKENIZER = AutoTokenizer.from_pretrained(MODEL_NAME)
@@ -44,8 +41,8 @@
 
 
 def make_request(
-        params: SamplingParams,
-        prompt_tokens_ids: Optional[list[int]] = None) -> EngineCoreRequest:
+    params: SamplingParams, prompt_tokens_ids: Optional[list[int]] = None
+) -> EngineCoreRequest:
     if not prompt_tokens_ids:
         prompt_tokens_ids = PROMPT_TOKENS
 
@@ -64,7 +61,6 @@ def make_request(
 
 
 def loop_until_done(client: EngineCoreClient, outputs: dict):
-
     while True:
         engine_core_outputs = client.get_output().outputs
 
@@ -82,7 +78,6 @@ def loop_until_done(client: EngineCoreClient, outputs: dict):
 
 
 async def loop_until_done_async(client: EngineCoreClient, outputs: dict):
-
     while True:
         engine_core_outputs = (await client.get_output_async()).outputs
 
@@ -100,7 +95,6 @@ async def loop_until_done_async(client: EngineCoreClient, outputs: dict):
 
 
 async def loop_until_fully_done_async(client: EngineCoreClient, outputs: dict):
-
     while True:
         engine_core_outputs = (await client.get_output_async()).outputs
 
@@ -119,10 +113,9 @@ async def loop_until_fully_done_async(client: EngineCoreClient, outputs: dict):
 
 
 # Dummy utility function to monkey-patch into engine core.
-def echo(self,
-         msg: str,
-         err_msg: Optional[str] = None,
-         sleep: Optional[float] = None) -> str:
+def echo(
+    self, msg: str, err_msg: Optional[str] = None, sleep: Optional[float] = None
+) -> str:
     print(f"echo util function called: {msg}, {err_msg}")
     if sleep is not None:
         time.sleep(sleep)
@@ -133,9 +126,9 @@ def echo(self,
 
 @create_new_process_for_each_test()
 @pytest.mark.parametrize("multiprocessing_mode", [True, False])
-def test_engine_core_client(monkeypatch: pytest.MonkeyPatch,
-                            multiprocessing_mode: bool):
-
+def test_engine_core_client(
+    monkeypatch: pytest.MonkeyPatch, multiprocessing_mode: bool
+):
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
 
@@ -143,8 +136,7 @@ def test_engine_core_client(monkeypatch: pytest.MonkeyPatch,
         m.setattr(EngineCore, "echo", echo, raising=False)
 
         engine_args = EngineArgs(model=MODEL_NAME, enforce_eager=True)
-        vllm_config = engine_args.create_engine_config(
-            UsageContext.UNKNOWN_CONTEXT)
+        vllm_config = engine_args.create_engine_config(UsageContext.UNKNOWN_CONTEXT)
         executor_class = Executor.get_class(vllm_config)
 
         with set_default_torch_num_threads(1):
@@ -172,7 +164,8 @@ def test_engine_core_client(monkeypatch: pytest.MonkeyPatch,
 
         for req_id in request_ids:
             assert len(outputs[req_id]) == MAX_TOKENS, (
-                f"{outputs[req_id]=}, {MAX_TOKENS=}")
+                f"{outputs[req_id]=}, {MAX_TOKENS=}"
+            )
         """Abort Request Cycle."""
 
         # Note: this code pathway will only work for multiprocessing
@@ -191,10 +184,12 @@ def test_engine_core_client(monkeypatch: pytest.MonkeyPatch,
         for idx, req_id in enumerate(request_ids):
             if idx % 2 == 0:
                 assert len(outputs[req_id]) < MAX_TOKENS, (
-                    f"{len(outputs[req_id])=}, {MAX_TOKENS=}")
+                    f"{len(outputs[req_id])=}, {MAX_TOKENS=}"
+                )
             else:
                 assert len(outputs[req_id]) == MAX_TOKENS, (
-                    f"{len(outputs[req_id])=}, {MAX_TOKENS=}")
+                    f"{len(outputs[req_id])=}, {MAX_TOKENS=}"
+                )
         """Abort after request is finished."""
 
         # Note: this code pathway will only work for multiprocessing
@@ -202,7 +197,7 @@ def test_engine_core_client(monkeypatch: pytest.MonkeyPatch,
 
         request = requests[0]
         client.add_request(request)
-        time.sleep(10.)
+        time.sleep(10.0)
 
         client.abort_requests([request.request_id])
 
@@ -222,7 +217,6 @@ def test_engine_core_client(monkeypatch: pytest.MonkeyPatch,
 
 @pytest.mark.asyncio(loop_scope="function")
 async def test_engine_core_client_asyncio(monkeypatch: pytest.MonkeyPatch):
-
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
 
@@ -231,7 +225,8 @@ async def test_engine_core_client_asyncio(monkeypatch: pytest.MonkeyPatch):
 
         engine_args = EngineArgs(model=MODEL_NAME, enforce_eager=True)
         vllm_config = engine_args.create_engine_config(
-            usage_context=UsageContext.UNKNOWN_CONTEXT)
+            usage_context=UsageContext.UNKNOWN_CONTEXT
+        )
         executor_class = Executor.get_class(vllm_config)
 
         with set_default_torch_num_threads(1):
@@ -261,7 +256,8 @@ async def test_engine_core_client_asyncio(monkeypatch: pytest.MonkeyPatch):
 
             for req_id in request_ids:
                 assert len(outputs[req_id]) == MAX_TOKENS, (
-                    f"{outputs[req_id]=}, {MAX_TOKENS=}")
+                    f"{outputs[req_id]=}, {MAX_TOKENS=}"
+                )
             """Abort Request Cycle."""
 
             # Add requests to the engine.
@@ -277,10 +273,12 @@ async def test_engine_core_client_asyncio(monkeypatch: pytest.MonkeyPatch):
             for idx, req_id in enumerate(request_ids):
                 if idx % 2 == 0:
                     assert len(outputs[req_id]) < MAX_TOKENS, (
-                        f"{len(outputs[req_id])=}, {MAX_TOKENS=}")
+                        f"{len(outputs[req_id])=}, {MAX_TOKENS=}"
+                    )
                 else:
                     assert len(outputs[req_id]) == MAX_TOKENS, (
-                        f"{len(outputs[req_id])=}, {MAX_TOKENS=}")
+                        f"{len(outputs[req_id])=}, {MAX_TOKENS=}"
+                    )
             """Utility method invocation"""
 
             core_client: AsyncMPClient = client
@@ -296,8 +294,8 @@ async def test_engine_core_client_asyncio(monkeypatch: pytest.MonkeyPatch):
             # Test that cancelling the utility call doesn't destabilize the
             # engine.
             util_task = asyncio.create_task(
-                core_client.call_utility_async("echo", "testarg2", None,
-                                               0.5))  # sleep for 0.5 sec
+                core_client.call_utility_async("echo", "testarg2", None, 0.5)
+            )  # sleep for 0.5 sec
             await asyncio.sleep(0.05)
             cancelled = util_task.cancel()
             assert cancelled
@@ -305,9 +303,9 @@ async def test_engine_core_client_asyncio(monkeypatch: pytest.MonkeyPatch):
             # Ensure client is still functional. The engine runs utility
             # methods in a single thread so this request won't be processed
             # until the cancelled sleeping one is complete.
-            result = await asyncio.wait_for(core_client.call_utility_async(
-                "echo", "testarg3"),
-                                            timeout=1.0)
+            result = await asyncio.wait_for(
+                core_client.call_utility_async("echo", "testarg3"), timeout=1.0
+            )
             assert result == "testarg3"
         finally:
             client.shutdown()
@@ -353,8 +351,7 @@ def echo_dc_nested(
     msg: str,
     structure_type: str = "list_of_dicts",
 ) -> Any:
-    print(f"echo dc nested util function called: {msg}, "
-          f"structure: {structure_type}")
+    print(f"echo dc nested util function called: {msg}, structure: {structure_type}")
     val = None if msg is None else MyDataclass(msg)
 
     if structure_type == "list_of_dicts":  # noqa
@@ -373,8 +370,8 @@ def echo_dc_nested(
 
 @pytest.mark.asyncio(loop_scope="function")
 async def test_engine_core_client_util_method_custom_return(
-        monkeypatch: pytest.MonkeyPatch):
-
+    monkeypatch: pytest.MonkeyPatch,
+):
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
 
@@ -386,7 +383,8 @@ async def test_engine_core_client_util_method_custom_return(
 
         engine_args = EngineArgs(model=MODEL_NAME, enforce_eager=True)
         vllm_config = engine_args.create_engine_config(
-            usage_context=UsageContext.UNKNOWN_CONTEXT)
+            usage_context=UsageContext.UNKNOWN_CONTEXT
+        )
         executor_class = Executor.get_class(vllm_config)
 
         with set_default_torch_num_threads(1):
@@ -402,22 +400,17 @@ async def test_engine_core_client_util_method_custom_return(
             # Test utility method returning custom / non-native data type.
             core_client: AsyncMPClient = client
 
-            result = await core_client.call_utility_async(
-                "echo_dc", "testarg2", False)
-            assert isinstance(result,
-                              MyDataclass) and result.message == "testarg2"
-            result = await core_client.call_utility_async(
-                "echo_dc", "testarg2", True)
+            result = await core_client.call_utility_async("echo_dc", "testarg2", False)
+            assert isinstance(result, MyDataclass) and result.message == "testarg2"
+            result = await core_client.call_utility_async("echo_dc", "testarg2", True)
             assert isinstance(result, list) and all(
-                isinstance(r, MyDataclass) and r.message == "testarg2"
-                for r in result)
+                isinstance(r, MyDataclass) and r.message == "testarg2" for r in result
+            )
 
             # Test returning None and list of Nones
-            result = await core_client.call_utility_async(
-                "echo_dc", None, False)
+            result = await core_client.call_utility_async("echo_dc", None, False)
             assert result is None
-            result = await core_client.call_utility_async(
-                "echo_dc", None, True)
+            result = await core_client.call_utility_async("echo_dc", None, True)
             assert isinstance(result, list) and all(r is None for r in result)
 
         finally:
@@ -426,8 +419,8 @@ async def test_engine_core_client_util_method_custom_return(
 
 @pytest.mark.asyncio(loop_scope="function")
 async def test_engine_core_client_util_method_custom_dict_return(
-        monkeypatch: pytest.MonkeyPatch):
-
+    monkeypatch: pytest.MonkeyPatch,
+):
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
 
@@ -439,7 +432,8 @@ async def test_engine_core_client_util_method_custom_dict_return(
 
         engine_args = EngineArgs(model=MODEL_NAME, enforce_eager=True)
         vllm_config = engine_args.create_engine_config(
-            usage_context=UsageContext.UNKNOWN_CONTEXT)
+            usage_context=UsageContext.UNKNOWN_CONTEXT
+        )
         executor_class = Executor.get_class(vllm_config)
 
         with set_default_torch_num_threads(1):
@@ -457,22 +451,21 @@ async def test_engine_core_client_util_method_custom_dict_return(
 
             # Test single object return
             result = await core_client.call_utility_async(
-                "echo_dc_dict", "testarg3", False)
-            assert isinstance(result,
-                              MyDataclass) and result.message == "testarg3"
+                "echo_dc_dict", "testarg3", False
+            )
+            assert isinstance(result, MyDataclass) and result.message == "testarg3"
 
             # Test dict return with custom value types
             result = await core_client.call_utility_async(
-                "echo_dc_dict", "testarg3", True)
+                "echo_dc_dict", "testarg3", True
+            )
             assert isinstance(result, dict) and len(result) == 3
             for key, val in result.items():
                 assert key in ["key1", "key2", "key3"]
-                assert isinstance(val,
-                                  MyDataclass) and val.message == "testarg3"
+                assert isinstance(val, MyDataclass) and val.message == "testarg3"
 
             # Test returning dict with None values
-            result = await core_client.call_utility_async(
-                "echo_dc_dict", None, True)
+            result = await core_client.call_utility_async("echo_dc_dict", None, True)
             assert isinstance(result, dict) and len(result) == 3
             for key, val in result.items():
                 assert key in ["key1", "key2", "key3"]
@@ -484,8 +477,8 @@ async def test_engine_core_client_util_method_custom_dict_return(
 
 @pytest.mark.asyncio(loop_scope="function")
 async def test_engine_core_client_util_method_nested_structures(
-        monkeypatch: pytest.MonkeyPatch):
-
+    monkeypatch: pytest.MonkeyPatch,
+):
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
 
@@ -497,7 +490,8 @@ async def test_engine_core_client_util_method_nested_structures(
 
         engine_args = EngineArgs(model=MODEL_NAME, enforce_eager=True)
         vllm_config = engine_args.create_engine_config(
-            usage_context=UsageContext.UNKNOWN_CONTEXT)
+            usage_context=UsageContext.UNKNOWN_CONTEXT
+        )
         executor_class = Executor.get_class(vllm_config)
 
         with set_default_torch_num_threads(1):
@@ -514,42 +508,48 @@ async def test_engine_core_client_util_method_nested_structures(
 
             # Test list of dicts: [{"a": val, "b": val}, {"c": val, "d": val}]
             result = await core_client.call_utility_async(
-                "echo_dc_nested", "nested1", "list_of_dicts")
+                "echo_dc_nested", "nested1", "list_of_dicts"
+            )
             assert isinstance(result, list) and len(result) == 2
             for i, item in enumerate(result):
                 assert isinstance(item, dict)
                 if i == 0:
                     assert "a" in item and "b" in item
-                    assert isinstance(
-                        item["a"],
-                        MyDataclass) and item["a"].message == "nested1"
-                    assert isinstance(
-                        item["b"],
-                        MyDataclass) and item["b"].message == "nested1"
+                    assert (
+                        isinstance(item["a"], MyDataclass)
+                        and item["a"].message == "nested1"
+                    )
+                    assert (
+                        isinstance(item["b"], MyDataclass)
+                        and item["b"].message == "nested1"
+                    )
                 else:
                     assert "c" in item and "d" in item
-                    assert isinstance(
-                        item["c"],
-                        MyDataclass) and item["c"].message == "nested1"
-                    assert isinstance(
-                        item["d"],
-                        MyDataclass) and item["d"].message == "nested1"
+                    assert (
+                        isinstance(item["c"], MyDataclass)
+                        and item["c"].message == "nested1"
+                    )
+                    assert (
+                        isinstance(item["d"], MyDataclass)
+                        and item["d"].message == "nested1"
+                    )
 
             # Test dict of lists: {"list1": [val, val], "list2": [val, val]}
             result = await core_client.call_utility_async(
-                "echo_dc_nested", "nested2", "dict_of_lists")
+                "echo_dc_nested", "nested2", "dict_of_lists"
+            )
             assert isinstance(result, dict) and len(result) == 2
             assert "list1" in result and "list2" in result
             for key, lst in result.items():
                 assert isinstance(lst, list) and len(lst) == 2
                 for item in lst:
-                    assert isinstance(
-                        item, MyDataclass) and item.message == "nested2"
+                    assert isinstance(item, MyDataclass) and item.message == "nested2"
 
             # Test deeply nested: {"outer": [{"inner": [val, val]},
             # {"inner": [val]}]}
             result = await core_client.call_utility_async(
-                "echo_dc_nested", "nested3", "deep_nested")
+                "echo_dc_nested", "nested3", "deep_nested"
+            )
             assert isinstance(result, dict) and "outer" in result
             outer_list = result["outer"]
             assert isinstance(outer_list, list) and len(outer_list) == 2
@@ -560,21 +560,22 @@ async def test_engine_core_client_util_method_nested_structures(
             inner_list1 = inner_dict1["inner"]
             assert isinstance(inner_list1, list) and len(inner_list1) == 2
             for item in inner_list1:
-                assert isinstance(item,
-                                  MyDataclass) and item.message == "nested3"
+                assert isinstance(item, MyDataclass) and item.message == "nested3"
 
             # Second dict in outer list should have "inner" with 1 item
             inner_dict2 = outer_list[1]
             assert isinstance(inner_dict2, dict) and "inner" in inner_dict2
             inner_list2 = inner_dict2["inner"]
             assert isinstance(inner_list2, list) and len(inner_list2) == 1
-            assert isinstance(
-                inner_list2[0],
-                MyDataclass) and inner_list2[0].message == "nested3"
+            assert (
+                isinstance(inner_list2[0], MyDataclass)
+                and inner_list2[0].message == "nested3"
+            )
 
             # Test with None values in nested structures
             result = await core_client.call_utility_async(
-                "echo_dc_nested", None, "list_of_dicts")
+                "echo_dc_nested", None, "list_of_dicts"
+            )
             assert isinstance(result, list) and len(result) == 2
             for item in result:
                 assert isinstance(item, dict)
@@ -595,7 +596,6 @@ def test_kv_cache_events(
     multiprocessing_mode: bool,
     publisher_config,
 ):
-
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
         block_size = 16
@@ -609,8 +609,7 @@ def test_kv_cache_events(
         )
         engine_args.kv_events_config = publisher_config
 
-        vllm_config = engine_args.create_engine_config(
-            UsageContext.UNKNOWN_CONTEXT)
+        vllm_config = engine_args.create_engine_config(UsageContext.UNKNOWN_CONTEXT)
 
         executor_class = Executor.get_class(vllm_config)
         with set_default_torch_num_threads(1):
@@ -622,9 +621,9 @@ def test_kv_cache_events(
                 log_stats=False,
             )
         endpoint = publisher_config.endpoint.replace("*", "127.0.0.1")
-        subscriber = MockSubscriber(endpoint,
-                                    topic=publisher_config.topic,
-                                    decode_type=KVEventBatch)
+        subscriber = MockSubscriber(
+            endpoint, topic=publisher_config.topic, decode_type=KVEventBatch
+        )
 
         try:
             custom_tokens = list(range(num_blocks * block_size))
@@ -641,22 +640,25 @@ def test_kv_cache_events(
             seq, received = result
 
             assert seq == 0, "Sequence number mismatch"
-            assert (len(received.events) == 1
-                    ), "We should have exactly one BlockStored event"
+            assert len(received.events) == 1, (
+                "We should have exactly one BlockStored event"
+            )
             event = received.events[0]
-            assert isinstance(
-                event, BlockStored), "We should have a BlockStored event"
-            assert (len(event.block_hashes) == num_blocks
-                    ), "We should have a BlockStored event with 2 block_hashes"
-            assert (event.block_size == block_size
-                    ), "Block size should be the same as the block size"
-            assert (event.parent_block_hash
-                    is None), "Parent block hash should be None"
+            assert isinstance(event, BlockStored), "We should have a BlockStored event"
+            assert len(event.block_hashes) == num_blocks, (
+                "We should have a BlockStored event with 2 block_hashes"
+            )
+            assert event.block_size == block_size, (
+                "Block size should be the same as the block size"
+            )
+            assert event.parent_block_hash is None, "Parent block hash should be None"
             assert event.lora_id is None, "Lora id should be None"
-            assert (len(event.token_ids) == num_blocks * block_size
-                    ), "Token ids should be the same as the custom tokens"
-            assert (event.token_ids == custom_tokens
-                    ), "Token ids should be the same as the custom tokens"
+            assert len(event.token_ids) == num_blocks * block_size, (
+                "Token ids should be the same as the custom tokens"
+            )
+            assert event.token_ids == custom_tokens, (
+                "Token ids should be the same as the custom tokens"
+            )
         finally:
             client.shutdown()
             subscriber.close()
@@ -674,7 +676,6 @@ async def test_kv_cache_events_dp(
     multiprocessing_mode: bool,
     publisher_config,
 ):
-
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
         block_size = 16
@@ -692,8 +693,7 @@ async def test_kv_cache_events_dp(
         )
         engine_args.kv_events_config = publisher_config
 
-        vllm_config = engine_args.create_engine_config(
-            UsageContext.UNKNOWN_CONTEXT)
+        vllm_config = engine_args.create_engine_config(UsageContext.UNKNOWN_CONTEXT)
 
         executor_class = Executor.get_class(vllm_config)
         with set_default_torch_num_threads(1):
@@ -710,13 +710,12 @@ async def test_kv_cache_events_dp(
         base_endpoint = publisher_config.endpoint.replace("*", "127.0.0.1")
         endpoints = []
         for i in range(dp_size):
-            offset_endpoint = ZmqEventPublisher.offset_endpoint_port(
-                base_endpoint, i)
+            offset_endpoint = ZmqEventPublisher.offset_endpoint_port(base_endpoint, i)
             endpoints.append(offset_endpoint)
 
-        subscriber = MockSubscriber(endpoints,
-                                    topic=publisher_config.topic,
-                                    decode_type=KVEventBatch)
+        subscriber = MockSubscriber(
+            endpoints, topic=publisher_config.topic, decode_type=KVEventBatch
+        )
 
         try:
             custom_tokens = list(range(num_blocks * block_size))
@@ -734,15 +733,12 @@ async def test_kv_cache_events_dp(
             await asyncio.sleep(0.1)
 
             # Initialize outputs dict for all requests
-            outputs: dict[str, list] = {
-                req_id: []
-                for req_id in all_request_ids
-            }
+            outputs: dict[str, list] = {req_id: [] for req_id in all_request_ids}
 
             print("processing requests...")
-            await asyncio.wait_for(loop_until_fully_done_async(
-                client, outputs),
-                                   timeout=20.0)
+            await asyncio.wait_for(
+                loop_until_fully_done_async(client, outputs), timeout=20.0
+            )
 
             # Receive from subscriber until no more messages
             print("collecting results...")
@@ -755,13 +751,11 @@ async def test_kv_cache_events_dp(
                 results.append(result)
 
             # Collect all events and data_parallel_ranks from all results
-            all_dp_ranks = [
-                received.data_parallel_rank for (_, received) in results
-            ]
+            all_dp_ranks = [received.data_parallel_rank for (_, received) in results]
             unique_dps = set(all_dp_ranks)
-            assert (
-                len(unique_dps) == 2
-            ), f"Expected 2 unique data_parallel_ranks, got {len(unique_dps)}"
+            assert len(unique_dps) == 2, (
+                f"Expected 2 unique data_parallel_ranks, got {len(unique_dps)}"
+            )
 
         finally:
             client.shutdown()
@@ -770,7 +764,6 @@ async def test_kv_cache_events_dp(
 
 @pytest.mark.timeout(20)
 def test_startup_failure(monkeypatch: pytest.MonkeyPatch):
-
     with monkeypatch.context() as m, pytest.raises(Exception) as e_info:
         m.setenv("VLLM_USE_V1", "1")
 
@@ -787,7 +780,8 @@ def patched_cepm_ctor(self: CoreEngineProcManager, *args, **kwargs):
         t = time.time()
         engine_args = EngineArgs(model=MODEL_NAME)
         vllm_config = engine_args.create_engine_config(
-            usage_context=UsageContext.UNKNOWN_CONTEXT)
+            usage_context=UsageContext.UNKNOWN_CONTEXT
+        )
         executor_class = Executor.get_class(vllm_config)
         print(f"VllmConfig creation took {time.time() - t:.2f} seconds.")
 
@@ -815,8 +809,7 @@ def kill_first_child():
 
 
 @create_new_process_for_each_test()
-def test_engine_core_proc_instantiation_cuda_empty(
-        monkeypatch: pytest.MonkeyPatch):
+def test_engine_core_proc_instantiation_cuda_empty(monkeypatch: pytest.MonkeyPatch):
     """
     Test that EngineCoreProc can be instantiated when CUDA_VISIBLE_DEVICES
     is empty. This ensures the engine frontend does not need access to GPUs.
@@ -833,17 +826,13 @@ def create_mock_executor(vllm_config):
 
         # Only implement the methods that are actually called during init
         from vllm.v1.kv_cache_interface import FullAttentionSpec
-        mock_spec = FullAttentionSpec(block_size=16,
-                                      num_kv_heads=1,
-                                      head_size=64,
-                                      dtype=torch.float16)
-
-        mock_executor.get_kv_cache_specs.return_value = [{
-            "default": mock_spec
-        }]
-        mock_executor.determine_available_memory.return_value = [
-            1024 * 1024 * 1024
-        ]
+
+        mock_spec = FullAttentionSpec(
+            block_size=16, num_kv_heads=1, head_size=64, dtype=torch.float16
+        )
+
+        mock_executor.get_kv_cache_specs.return_value = [{"default": mock_spec}]
+        mock_executor.determine_available_memory.return_value = [1024 * 1024 * 1024]
         mock_executor.initialize_from_config.return_value = None
         mock_executor.max_concurrent_batches = 1
 
@@ -857,19 +846,22 @@ def create_mock_executor(vllm_config):
 
         from vllm.v1.engine.utils import EngineZmqAddresses
 
-        def mock_startup_handshake(self, handshake_socket, local_client,
-                                   headless, parallel_config):
-            return EngineZmqAddresses(inputs=["tcp://127.0.0.1:5555"],
-                                      outputs=["tcp://127.0.0.1:5556"],
-                                      coordinator_input=None,
-                                      coordinator_output=None)
+        def mock_startup_handshake(
+            self, handshake_socket, local_client, headless, parallel_config
+        ):
+            return EngineZmqAddresses(
+                inputs=["tcp://127.0.0.1:5555"],
+                outputs=["tcp://127.0.0.1:5556"],
+                coordinator_input=None,
+                coordinator_output=None,
+            )
 
         # Background processes are not important here
         m.setattr(EngineCoreProc, "startup_handshake", mock_startup_handshake)
 
         vllm_config = EngineArgs(
-            model="deepseek-ai/DeepSeek-V2-Lite",
-            trust_remote_code=True).create_engine_config()
+            model="deepseek-ai/DeepSeek-V2-Lite", trust_remote_code=True
+        ).create_engine_config()
         engine_core_proc = EngineCoreProc(
             vllm_config=vllm_config,
             local_client=True,
diff --git a/tests/v1/engine/test_fast_incdec_prefix_err.py b/tests/v1/engine/test_fast_incdec_prefix_err.py
index f3d8e13088b0..fc1fc259f259 100644
--- a/tests/v1/engine/test_fast_incdec_prefix_err.py
+++ b/tests/v1/engine/test_fast_incdec_prefix_err.py
@@ -40,23 +40,139 @@ def test_fast_inc_detok_invalid_utf8_err_case():
 
     detokenizer = IncrementalDetokenizer.from_new_request(tokenizer, request)
 
-    assert detokenizer.__class__.__name__ == "FastIncrementalDetokenizer", \
+    assert detokenizer.__class__.__name__ == "FastIncrementalDetokenizer", (
         "Should use FastIncrementalDetokenizer by default"
+    )
 
     # Process tokens incrementally
     test_tokens = [
-        236840, 107, 138, 236782, 107, 140, 236775, 6265, 1083, 623, 121908,
-        147418, 827, 107, 140, 236775, 6265, 236779, 2084, 1083, 623, 203292,
-        827, 107, 140, 236775, 6265, 236779, 7777, 1083, 623, 121908, 147418,
-        569, 537, 236789, 65880, 569, 537, 236789, 62580, 853, 115693, 210118,
-        35178, 16055, 1270, 759, 215817, 4758, 1925, 1117, 827, 107, 140,
-        236775, 5654, 1083, 623, 110733, 46291, 827, 107, 140, 236775, 5654,
-        236779, 2084, 1083, 623, 136955, 56731, 827, 107, 140, 236775, 5654,
-        236779, 7777, 1083, 623, 194776, 2947, 496, 109811, 1608, 890, 215817,
-        4758, 1925, 1117, 2789, 432, 398, 602, 31118, 569, 124866, 134772, 509,
-        19478, 1640, 33779, 236743, 236770, 236819, 236825, 236771, 432, 398,
-        432, 237167, 827, 107, 140, 236775, 77984, 1083, 623, 2709, 236745,
-        2555, 513, 236789, 602, 31118, 569
+        236840,
+        107,
+        138,
+        236782,
+        107,
+        140,
+        236775,
+        6265,
+        1083,
+        623,
+        121908,
+        147418,
+        827,
+        107,
+        140,
+        236775,
+        6265,
+        236779,
+        2084,
+        1083,
+        623,
+        203292,
+        827,
+        107,
+        140,
+        236775,
+        6265,
+        236779,
+        7777,
+        1083,
+        623,
+        121908,
+        147418,
+        569,
+        537,
+        236789,
+        65880,
+        569,
+        537,
+        236789,
+        62580,
+        853,
+        115693,
+        210118,
+        35178,
+        16055,
+        1270,
+        759,
+        215817,
+        4758,
+        1925,
+        1117,
+        827,
+        107,
+        140,
+        236775,
+        5654,
+        1083,
+        623,
+        110733,
+        46291,
+        827,
+        107,
+        140,
+        236775,
+        5654,
+        236779,
+        2084,
+        1083,
+        623,
+        136955,
+        56731,
+        827,
+        107,
+        140,
+        236775,
+        5654,
+        236779,
+        7777,
+        1083,
+        623,
+        194776,
+        2947,
+        496,
+        109811,
+        1608,
+        890,
+        215817,
+        4758,
+        1925,
+        1117,
+        2789,
+        432,
+        398,
+        602,
+        31118,
+        569,
+        124866,
+        134772,
+        509,
+        19478,
+        1640,
+        33779,
+        236743,
+        236770,
+        236819,
+        236825,
+        236771,
+        432,
+        398,
+        432,
+        237167,
+        827,
+        107,
+        140,
+        236775,
+        77984,
+        1083,
+        623,
+        2709,
+        236745,
+        2555,
+        513,
+        236789,
+        602,
+        31118,
+        569,
     ]
 
     output = ""
@@ -66,8 +182,7 @@ def test_fast_inc_detok_invalid_utf8_err_case():
         finished = i == len(test_tokens) - 1
         output += detokenizer.get_next_output_text(finished, delta=True)
 
-
-# fmt: off
+    # fmt: off
     assert output == r'''[
   {
     "source": "Résultats",
diff --git a/tests/v1/engine/test_llm_engine.py b/tests/v1/engine/test_llm_engine.py
index 7529c3780ec2..820c2709284e 100644
--- a/tests/v1/engine/test_llm_engine.py
+++ b/tests/v1/engine/test_llm_engine.py
@@ -43,7 +43,8 @@ def _vllm_model(
     # env var adjustment via monkeypatch
     scope="function",
     # Prefix caching
-    params=[False, True])
+    params=[False, True],
+)
 def vllm_model(vllm_runner, request, monkeypatch):
     """VllmRunner test fixture parameterized by APC True/False."""
     with _vllm_model(request.param, vllm_runner, monkeypatch) as vllm_model:
@@ -62,14 +63,15 @@ def vllm_model_apc(vllm_runner, monkeypatch):
     # env var adjustment via monkeypatch
     scope="function",
     # Prefix caching
-    params=[False, True])
+    params=[False, True],
+)
 def vllm_model_skip_tokenizer_init(vllm_runner, request, monkeypatch):
     """VllmRunner test fixture with APC."""
     with _vllm_model(
-            request.param,
-            vllm_runner,
-            monkeypatch,
-            skip_tokenizer_init=True,
+        request.param,
+        vllm_runner,
+        monkeypatch,
+        skip_tokenizer_init=True,
     ) as vllm_model:
         yield vllm_model
 
@@ -97,9 +99,11 @@ def get_mostly_n_gt1() -> int:
             top_p=0.95,
             n=n,
             seed=seed,
-            structured_outputs=StructuredOutputsParams(
-                regex="[0-9]+") if structured_outputs else None,
-        ) for n in n_list
+            structured_outputs=StructuredOutputsParams(regex="[0-9]+")
+            if structured_outputs
+            else None,
+        )
+        for n in n_list
     ], n_list
 
 
@@ -132,23 +136,20 @@ def test_parallel_sampling(vllm_model, example_prompts) -> None:
     for out, n in zip(outputs, n_list):
         completion_counts: dict[str, int] = {}
         # Assert correct number of completions
-        assert len(out.outputs) == n, (
-            f"{len(out.outputs)} completions; {n} expected.")
+        assert len(out.outputs) == n, f"{len(out.outputs)} completions; {n} expected."
         for idx in range(n):
             comp = out.outputs[idx]
             # Assert correct completion indices
-            assert comp.index == idx, (f"Index {comp.index}; expected {idx}.")
+            assert comp.index == idx, f"Index {comp.index}; expected {idx}."
             text = comp.text
             completion_counts[text] = completion_counts.get(text, 0) + 1
         # Assert unique completions
         if len(completion_counts) != n:
-            repeats = {
-                txt: num
-                for (txt, num) in completion_counts.items() if num > 1
-            }
+            repeats = {txt: num for (txt, num) in completion_counts.items() if num > 1}
             raise AssertionError(
                 f"{len(completion_counts)} unique completions; expected"
-                f" {n}. Repeats: {repeats}")
+                f" {n}. Repeats: {repeats}"
+            )
 
 
 def test_engine_metrics(vllm_runner, monkeypatch, example_prompts):
@@ -162,13 +163,12 @@ def test_engine_metrics(vllm_runner, monkeypatch, example_prompts):
     }
     monkeypatch.setenv("VLLM_USE_V1", "1")
     with vllm_runner(
-            MODEL,
-            speculative_config=speculative_config,
-            disable_log_stats=False,
+        MODEL,
+        speculative_config=speculative_config,
+        disable_log_stats=False,
     ) as vllm_model:
         llm: LLM = vllm_model.llm
-        sampling_params = SamplingParams(temperature=0.0,
-                                         max_tokens=max_tokens)
+        sampling_params = SamplingParams(temperature=0.0, max_tokens=max_tokens)
         outputs = llm.generate(example_prompts, sampling_params)
 
         n_prompts = len(example_prompts)
@@ -192,15 +192,14 @@ def find_metric(name) -> list[Metric]:
         num_requests_running = find_metric("vllm:num_requests_running")
         assert len(num_requests_running) == 1
         assert isinstance(num_requests_running[0], Gauge)
-        assert num_requests_running[0].value == .0
+        assert num_requests_running[0].value == 0.0
 
         generation_tokens = find_metric("vllm:generation_tokens")
         assert len(generation_tokens) == 1
         assert isinstance(generation_tokens[0], Counter)
         assert generation_tokens[0].value == total_tokens
 
-        request_generation_tokens = find_metric(
-            "vllm:request_generation_tokens")
+        request_generation_tokens = find_metric("vllm:request_generation_tokens")
         assert len(request_generation_tokens) == 1
         assert isinstance(request_generation_tokens[0], Histogram)
         assert "+Inf" in request_generation_tokens[0].buckets
@@ -209,15 +208,15 @@ def find_metric(name) -> list[Metric]:
         assert request_generation_tokens[0].sum == total_tokens
 
         num_accepted_tokens_per_pos = find_metric(
-            "vllm:spec_decode_num_accepted_tokens_per_pos")
+            "vllm:spec_decode_num_accepted_tokens_per_pos"
+        )
         assert len(num_accepted_tokens_per_pos) == 1
         assert isinstance(num_accepted_tokens_per_pos[0], Vector)
         assert len(num_accepted_tokens_per_pos[0].values) == 5
 
 
 @pytest.mark.parametrize("model", ["meta-llama/Llama-3.2-1B-Instruct"])
-def test_skip_tokenizer_initialization(model: str,
-                                       monkeypatch: pytest.MonkeyPatch):
+def test_skip_tokenizer_initialization(model: str, monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_V1", "1")
     # This test checks if the flag skip_tokenizer_init skips the initialization
     # of tokenizer and detokenizer. The generated output is expected to contain
@@ -232,8 +231,9 @@ def test_skip_tokenizer_initialization(model: str,
     with pytest.raises(ValueError, match="cannot pass text prompts when"):
         llm.generate("abc", sampling_params)
 
-    outputs = llm.generate({"prompt_token_ids": [1, 2, 3]},
-                           sampling_params=sampling_params)
+    outputs = llm.generate(
+        {"prompt_token_ids": [1, 2, 3]}, sampling_params=sampling_params
+    )
     assert len(outputs) > 0
     completions = outputs[0].outputs
     assert len(completions) > 0
diff --git a/tests/v1/engine/test_output_processor.py b/tests/v1/engine/test_output_processor.py
index 72c0a9a13e23..9ebf7f09503e 100644
--- a/tests/v1/engine/test_output_processor.py
+++ b/tests/v1/engine/test_output_processor.py
@@ -7,19 +7,20 @@
 
 import pytest
 
-from tests.v1.engine.utils import (NUM_PROMPT_LOGPROBS_UNDER_TEST,
-                                   NUM_SAMPLE_LOGPROBS_UNDER_TEST,
-                                   STOP_STRINGS,
-                                   DummyOutputProcessorTestVectors,
-                                   MockEngineCore)
+from tests.v1.engine.utils import (
+    NUM_PROMPT_LOGPROBS_UNDER_TEST,
+    NUM_SAMPLE_LOGPROBS_UNDER_TEST,
+    STOP_STRINGS,
+    DummyOutputProcessorTestVectors,
+    MockEngineCore,
+)
 from vllm import PoolingParams
 from vllm.logprobs import PromptLogprobs, SampleLogprobs
 from vllm.outputs import CompletionOutput, RequestOutput
 from vllm.sampling_params import RequestOutputKind, SamplingParams
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 from vllm.v1.engine import EngineCoreRequest
-from vllm.v1.engine.output_processor import (OutputProcessor,
-                                             RequestOutputCollector)
+from vllm.v1.engine.output_processor import OutputProcessor, RequestOutputCollector
 from vllm.v1.metrics.stats import IterationStats
 
 
@@ -40,33 +41,34 @@ def _ref_convert_id_to_token(
 
 
 @pytest.mark.parametrize(
-    "request_output_kind",
-    [RequestOutputKind.DELTA, RequestOutputKind.FINAL_ONLY])
-def test_incremental_detokenization(request_output_kind: RequestOutputKind,
-                                    dummy_test_vectors):
-    output_processor = OutputProcessor(dummy_test_vectors.tokenizer,
-                                       log_stats=False)
-    engine_core = MockEngineCore(
-        tokens_list=dummy_test_vectors.generation_tokens)
+    "request_output_kind", [RequestOutputKind.DELTA, RequestOutputKind.FINAL_ONLY]
+)
+def test_incremental_detokenization(
+    request_output_kind: RequestOutputKind, dummy_test_vectors
+):
+    output_processor = OutputProcessor(dummy_test_vectors.tokenizer, log_stats=False)
+    engine_core = MockEngineCore(tokens_list=dummy_test_vectors.generation_tokens)
 
     # Make N requests.
     requests = [
-        EngineCoreRequest(request_id=f"request-{idx}",
-                          prompt_token_ids=prompt_tokens,
-                          mm_features=None,
-                          eos_token_id=None,
-                          arrival_time=0,
-                          lora_request=None,
-                          cache_salt=None,
-                          data_parallel_rank=None,
-                          sampling_params=SamplingParams(
-                              skip_special_tokens=False,
-                              spaces_between_special_tokens=False,
-                              output_kind=request_output_kind,
-                              stop=[],
-                              include_stop_str_in_output=False,
-                          ),
-                          pooling_params=None)
+        EngineCoreRequest(
+            request_id=f"request-{idx}",
+            prompt_token_ids=prompt_tokens,
+            mm_features=None,
+            eos_token_id=None,
+            arrival_time=0,
+            lora_request=None,
+            cache_salt=None,
+            data_parallel_rank=None,
+            sampling_params=SamplingParams(
+                skip_special_tokens=False,
+                spaces_between_special_tokens=False,
+                output_kind=request_output_kind,
+                stop=[],
+                include_stop_str_in_output=False,
+            ),
+            pooling_params=None,
+        )
         for idx, prompt_tokens in enumerate(dummy_test_vectors.prompt_tokens)
     ]
 
@@ -102,8 +104,8 @@ def test_incremental_detokenization(request_output_kind: RequestOutputKind,
 
     # Confirmed tracked values matches what we expected.
     for idx, (ref_gen_str, ref_gen_toks) in enumerate(
-            zip(dummy_test_vectors.generation_strings,
-                dummy_test_vectors.generation_tokens)):
+        zip(dummy_test_vectors.generation_strings, dummy_test_vectors.generation_tokens)
+    ):
         gen_str = gen_strings[f"request-{idx}"]
         gen_toks = gen_tokens[f"request-{idx}"]
 
@@ -134,9 +136,11 @@ def _validate_logprobs(
         ref_prompt_logprobs = dtv.prompt_logprobs[req_idx]
         if num_sample_logprobs is not None:
             # Validate sample logprobs
-            assert logprobs is not None, (f"Request {req_id} requires sample"
-                                          " logprobs but sample logprobs are"
-                                          " None.")
+            assert logprobs is not None, (
+                f"Request {req_id} requires sample"
+                " logprobs but sample logprobs are"
+                " None."
+            )
             # Require num sampled tokens to match num
             # sampled logprobs - especially important
             # to check since the detokenizer can cause
@@ -147,44 +151,51 @@ def _validate_logprobs(
             assert num_new_tokens == len_sample_logprobs, (
                 f"Request {req_id} has {num_new_tokens}"
                 " completion tokens but has"
-                f" {len_sample_logprobs} sample logprobs.")
+                f" {len_sample_logprobs} sample logprobs."
+            )
             ref_cumulative_logprob = 0.0
-            for idx, (sampled_token,
-                      pos_logprob_dict) in enumerate(zip(new_tokens,
-                                                         logprobs)):
+            for idx, (sampled_token, pos_logprob_dict) in enumerate(
+                zip(new_tokens, logprobs)
+            ):
                 # Break out the reference log probability value &
                 # logprob token id tensors associated with this
                 # position in the completion. Also break out the
                 # sampled token ranks
-                (ref_pos_logprob_toks, ref_pos_logprob_vals,
-                 ref_sampled_token_rank) = ref_logprobs[idx]
+                (ref_pos_logprob_toks, ref_pos_logprob_vals, ref_sampled_token_rank) = (
+                    ref_logprobs[idx]
+                )
                 # For each position in the completion sequence,
                 # ensure the actual sampled token is among the
                 # logprobs
                 assert sampled_token in pos_logprob_dict, (
                     f"Sampled token {sampled_token} not"
-                    f" present in logprob at index {idx}")
+                    f" present in logprob at index {idx}"
+                )
 
                 # Validate number of sample logprobs
                 num_lp_toks = len(pos_logprob_dict)
-                assert (num_lp_toks == num_sample_logprobs
-                        or num_lp_toks == num_sample_logprobs +
-                        1), ("Valid numbers of sample logprobs are"
-                             f" {num_sample_logprobs} or"
-                             f" {num_sample_logprobs+1} but"
-                             f" {num_lp_toks} logprobs found at"
-                             f" position {idx}. Logprobs dict:"
-                             f" {pos_logprob_dict}")
+                assert (
+                    num_lp_toks == num_sample_logprobs
+                    or num_lp_toks == num_sample_logprobs + 1
+                ), (
+                    "Valid numbers of sample logprobs are"
+                    f" {num_sample_logprobs} or"
+                    f" {num_sample_logprobs + 1} but"
+                    f" {num_lp_toks} logprobs found at"
+                    f" position {idx}. Logprobs dict:"
+                    f" {pos_logprob_dict}"
+                )
 
                 # Validate sampled token logprob rank
                 smp_lp = pos_logprob_dict[sampled_token]
                 smp_lp_rank = smp_lp.rank
-                assert (ref_sampled_token_rank == smp_lp_rank), (
+                assert ref_sampled_token_rank == smp_lp_rank, (
                     "Sampled token logprob rank"
                     f" {smp_lp_rank} does not match"
                     " correct value"
                     f" {ref_sampled_token_rank}"
-                    f" in Logprob {smp_lp}")
+                    f" in Logprob {smp_lp}"
+                )
 
                 # Validate that the logprob processor yields
                 # the correct log probabilities and valid
@@ -198,7 +209,8 @@ def _validate_logprobs(
                     ref_tok_id = ref_pos_logprob_toks[jdx]
                     assert ref_tok_id in pos_logprob_dict, (
                         f"Expected token {ref_tok_id} to be"
-                        f" in logprob dict but it is not.")
+                        f" in logprob dict but it is not."
+                    )
 
                     # Extract actually-generated logprob
                     # info
@@ -208,40 +220,43 @@ def _validate_logprobs(
 
                     # A "top" (rank 1) logprob must be
                     # present
-                    rank_one_appears = (True
-                                        if lp_rank == 1 else rank_one_appears)
+                    rank_one_appears = True if lp_rank == 1 else rank_one_appears
 
                     # Rank must be >= 1
-                    assert lp_rank >= 1, (f"Logprob {lp} has invalid"
-                                          f" rank {lp_rank} < 1."
-                                          f" Logprob dict: {pos_logprob_dict}")
+                    assert lp_rank >= 1, (
+                        f"Logprob {lp} has invalid"
+                        f" rank {lp_rank} < 1."
+                        f" Logprob dict: {pos_logprob_dict}"
+                    )
 
                     # Validate log probability
                     assert math.isclose(lp_val, ref_lp_val), (
                         f"Token id {ref_tok_id} appears in logprobs dict"
                         f" at position {idx} in completion with log"
                         f" probability {lp_val} but {ref_lp_val} was"
-                        f" expected. Logprob: {lp}")
+                        f" expected. Logprob: {lp}"
+                    )
 
-                assert rank_one_appears, (f"No Logprob has rank 1"
-                                          " in the following Logprob"
-                                          f" dict: {pos_logprob_dict}")
+                assert rank_one_appears, (
+                    f"No Logprob has rank 1"
+                    " in the following Logprob"
+                    f" dict: {pos_logprob_dict}"
+                )
 
                 # Validate logprobs detokenization
                 for lp_tok in pos_logprob_dict:
                     # Confirm that sample logprob decoded token matches
                     # the logprob token id at this sequence position
                     decoded_token = pos_logprob_dict[lp_tok].decoded_token
-                    ref_decoded_token = _ref_convert_id_to_token(
-                        dtv.tokenizer, lp_tok)
+                    ref_decoded_token = _ref_convert_id_to_token(dtv.tokenizer, lp_tok)
                     assert decoded_token == ref_decoded_token, (
                         f"Sampled logprob token id {lp_tok} decodes to"
                         f" {ref_decoded_token} but Logprob decoded"
                         f" token is {decoded_token} instead"
-                        f" (at position {idx})")
+                        f" (at position {idx})"
+                    )
 
-                ref_cumulative_logprob += pos_logprob_dict[
-                    sampled_token].logprob
+                ref_cumulative_logprob += pos_logprob_dict[sampled_token].logprob
             # Assert that cumulative logprobs are correct
             assert math.isclose(cumulative_logprob, ref_cumulative_logprob)
         else:
@@ -254,7 +269,8 @@ def _validate_logprobs(
             assert prompt_logprobs is not None, (
                 f"Request {req_id} requires prompt"
                 " logprobs but prompt logprobs are"
-                " None.")
+                " None."
+            )
             # Require num prompt tokens to match num
             # prompt logprobs
             num_prompt_tokens = len(prompt_token_ids)
@@ -262,56 +278,70 @@ def _validate_logprobs(
             assert num_prompt_tokens == len_prompt_logprobs, (
                 f"Request {req_id} has {num_prompt_tokens}"
                 " prompt tokens but has"
-                f" {len_prompt_logprobs} prompt logprobs.")
+                f" {len_prompt_logprobs} prompt logprobs."
+            )
             # First prompt logprob is None
             first_plp_dict = prompt_logprobs[0]
             assert first_plp_dict is None, (
                 f"Request {req_id} first prompt logprob"
                 f" should be None but has following value"
-                f" instead: {first_plp_dict}")
+                f" instead: {first_plp_dict}"
+            )
             # Break out the reference prompt log prob value &
             # logprob token id matrices for the whole prompt.
             # Also break out the prompt token rank vector
-            (ref_prompt_logprob_toks, ref_prompt_logprob_vals,
-             ref_prompt_token_ranks) = ref_prompt_logprobs
+            (
+                ref_prompt_logprob_toks,
+                ref_prompt_logprob_vals,
+                ref_prompt_token_ranks,
+            ) = ref_prompt_logprobs
             for idx, (prompt_token, pos_logprob_dict) in enumerate(
-                    zip(prompt_token_ids[1:], prompt_logprobs[1:])):
-
+                zip(prompt_token_ids[1:], prompt_logprobs[1:])
+            ):
                 # Break out the reference prompt log prob value
                 # vector, prompt logprob token id vector, and
                 # prompt token rank at the current position.
-                (ref_pos_prompt_logprob_toks, ref_pos_prompt_logprob_vals,
-                 ref_pos_prompt_token_rank) = (ref_prompt_logprob_toks[idx, :],
-                                               ref_prompt_logprob_vals[idx, :],
-                                               ref_prompt_token_ranks[idx])
+                (
+                    ref_pos_prompt_logprob_toks,
+                    ref_pos_prompt_logprob_vals,
+                    ref_pos_prompt_token_rank,
+                ) = (
+                    ref_prompt_logprob_toks[idx, :],
+                    ref_prompt_logprob_vals[idx, :],
+                    ref_prompt_token_ranks[idx],
+                )
 
                 # For each position in the prompt sequence,
                 # ensure the actual prompt token is among the
                 # logprobs
                 assert prompt_token in pos_logprob_dict, (
-                    f"Prompt token {prompt_token} not"
-                    f" present in logprob at index {idx}")
+                    f"Prompt token {prompt_token} not present in logprob at index {idx}"
+                )
                 # Validate number of prompt logprobs
                 num_plp_toks = len(pos_logprob_dict)
-                assert (num_plp_toks == num_prompt_logprobs
-                        or num_plp_toks == num_prompt_logprobs +
-                        1), ("Valid numbers of prompt logprobs are"
-                             f" {num_prompt_logprobs} or"
-                             f" {num_prompt_logprobs+1} but"
-                             f" {num_plp_toks} logprobs found at"
-                             f" position {idx}. Logprobs dict:"
-                             f" {pos_logprob_dict}")
+                assert (
+                    num_plp_toks == num_prompt_logprobs
+                    or num_plp_toks == num_prompt_logprobs + 1
+                ), (
+                    "Valid numbers of prompt logprobs are"
+                    f" {num_prompt_logprobs} or"
+                    f" {num_prompt_logprobs + 1} but"
+                    f" {num_plp_toks} logprobs found at"
+                    f" position {idx}. Logprobs dict:"
+                    f" {pos_logprob_dict}"
+                )
 
                 # Validate prompt token logprob rank
                 prmpt_tok_lp = pos_logprob_dict[prompt_token]
                 prmpt_tok_lp_rank = prmpt_tok_lp.rank
                 ref_prmpt_tok_lp_rank = ref_pos_prompt_token_rank
-                assert (ref_prmpt_tok_lp_rank == prmpt_tok_lp_rank), (
+                assert ref_prmpt_tok_lp_rank == prmpt_tok_lp_rank, (
                     "Prompt token logprob rank"
                     f" {prmpt_tok_lp_rank} does not match"
                     " correct value"
                     f" {ref_prmpt_tok_lp_rank}"
-                    f" in Logprob {prmpt_tok_lp}")
+                    f" in Logprob {prmpt_tok_lp}"
+                )
 
                 # Validate that the logprob processor yields
                 # the correct prompt log probs and valid
@@ -325,7 +355,8 @@ def _validate_logprobs(
                     ref_tok_id = int(ref_pos_prompt_logprob_toks[jdx])
                     assert ref_tok_id in pos_logprob_dict, (
                         f"Expected token {ref_tok_id} to be"
-                        f" in logprob dict but it is not.")
+                        f" in logprob dict but it is not."
+                    )
 
                     # Extract actually-generated logprob
                     # info
@@ -335,87 +366,93 @@ def _validate_logprobs(
 
                     # A "top" (rank 1) logprob must be
                     # present
-                    rank_one_appears = (True
-                                        if plp_rank == 1 else rank_one_appears)
+                    rank_one_appears = True if plp_rank == 1 else rank_one_appears
 
                     # Rank must be >= 1
                     assert plp_rank >= 1, (
                         f"Logprob {plp} has invalid"
                         f" rank {plp_rank} < 1."
-                        f" Logprob dict: {pos_logprob_dict}")
+                        f" Logprob dict: {pos_logprob_dict}"
+                    )
 
                     # Validate log probability
                     assert math.isclose(plp_val, ref_plp_val), (
                         f"Token id {ref_tok_id} appears in logprobs dict"
                         f" at position {idx} in completion with log"
                         f" probability {plp_val} but {ref_plp_val} was"
-                        f" expected. Logprob: {plp}")
+                        f" expected. Logprob: {plp}"
+                    )
 
-                assert rank_one_appears, (f"No Logprob has rank 1"
-                                          " in the following Logprob"
-                                          f" dict: {pos_logprob_dict}")
+                assert rank_one_appears, (
+                    f"No Logprob has rank 1"
+                    " in the following Logprob"
+                    f" dict: {pos_logprob_dict}"
+                )
 
                 # Validate prompt logprob detokenization
                 for plp_tok in pos_logprob_dict:
                     # Confirm that prompt logprob decoded token matches
                     # the logprob token id at this sequence position
                     decoded_token = pos_logprob_dict[plp_tok].decoded_token
-                    ref_decoded_token = _ref_convert_id_to_token(
-                        dtv.tokenizer, plp_tok)
+                    ref_decoded_token = _ref_convert_id_to_token(dtv.tokenizer, plp_tok)
                     assert decoded_token == ref_decoded_token, (
                         f"Prompt logprob token id {plp_tok} decodes to"
                         f" {ref_decoded_token} but Logprob decoded"
                         f" token is {decoded_token} instead"
-                        f" (at position {idx})")
+                        f" (at position {idx})"
+                    )
         else:
             # Prompt logprobs disabled for this request
             assert prompt_logprobs is None
 
 
 @pytest.mark.parametrize(
-    "request_output_kind",
-    [RequestOutputKind.DELTA, RequestOutputKind.FINAL_ONLY])
-@pytest.mark.parametrize("num_sample_logprobs",
-                         [None, NUM_SAMPLE_LOGPROBS_UNDER_TEST])
-@pytest.mark.parametrize("num_prompt_logprobs",
-                         [None, NUM_PROMPT_LOGPROBS_UNDER_TEST])
-def test_logprobs_processor(request_output_kind: RequestOutputKind,
-                            num_sample_logprobs: Optional[int],
-                            num_prompt_logprobs: Optional[int],
-                            dummy_test_vectors):
-    output_processor = OutputProcessor(dummy_test_vectors.tokenizer,
-                                       log_stats=False)
+    "request_output_kind", [RequestOutputKind.DELTA, RequestOutputKind.FINAL_ONLY]
+)
+@pytest.mark.parametrize("num_sample_logprobs", [None, NUM_SAMPLE_LOGPROBS_UNDER_TEST])
+@pytest.mark.parametrize("num_prompt_logprobs", [None, NUM_PROMPT_LOGPROBS_UNDER_TEST])
+def test_logprobs_processor(
+    request_output_kind: RequestOutputKind,
+    num_sample_logprobs: Optional[int],
+    num_prompt_logprobs: Optional[int],
+    dummy_test_vectors,
+):
+    output_processor = OutputProcessor(dummy_test_vectors.tokenizer, log_stats=False)
     engine_core = MockEngineCore(
         tokens_list=dummy_test_vectors.generation_tokens,
-        generated_logprobs_raw=None if num_sample_logprobs is None else
-        dummy_test_vectors.generation_logprobs,
+        generated_logprobs_raw=None
+        if num_sample_logprobs is None
+        else dummy_test_vectors.generation_logprobs,
         prompt_logprobs_raw=None
-        if num_prompt_logprobs is None else dummy_test_vectors.prompt_logprobs)
+        if num_prompt_logprobs is None
+        else dummy_test_vectors.prompt_logprobs,
+    )
 
     # Make N requests.
     request_id_list = [
-        f"request-{idx}"
-        for idx in range(len(dummy_test_vectors.prompt_strings))
+        f"request-{idx}" for idx in range(len(dummy_test_vectors.prompt_strings))
     ]
     requests = [
-        EngineCoreRequest(request_id=request_id_list[idx],
-                          prompt_token_ids=prompt_tokens,
-                          mm_features=None,
-                          eos_token_id=None,
-                          arrival_time=0,
-                          lora_request=None,
-                          cache_salt=None,
-                          data_parallel_rank=None,
-                          sampling_params=SamplingParams(
-                              skip_special_tokens=False,
-                              spaces_between_special_tokens=False,
-                              output_kind=request_output_kind,
-                              stop=[],
-                              include_stop_str_in_output=False,
-                              logprobs=num_sample_logprobs,
-                              prompt_logprobs=num_prompt_logprobs,
-                          ),
-                          pooling_params=None)
+        EngineCoreRequest(
+            request_id=request_id_list[idx],
+            prompt_token_ids=prompt_tokens,
+            mm_features=None,
+            eos_token_id=None,
+            arrival_time=0,
+            lora_request=None,
+            cache_salt=None,
+            data_parallel_rank=None,
+            sampling_params=SamplingParams(
+                skip_special_tokens=False,
+                spaces_between_special_tokens=False,
+                output_kind=request_output_kind,
+                stop=[],
+                include_stop_str_in_output=False,
+                logprobs=num_sample_logprobs,
+                prompt_logprobs=num_prompt_logprobs,
+            ),
+            pooling_params=None,
+        )
         for idx, prompt_tokens in enumerate(dummy_test_vectors.prompt_tokens)
     ]
 
@@ -446,7 +483,8 @@ def test_logprobs_processor(request_output_kind: RequestOutputKind,
             prompt_logprobs = request_output.prompt_logprobs
             logprobs = request_output.outputs[0].logprobs
             gen_cumulative_logprobs[request_id] = request_output.outputs[
-                0].cumulative_logprob
+                0
+            ].cumulative_logprob
             if request_id not in gen_logprobs:
                 # Start tracking sample and prompt logprobs for this request
                 gen_tokens[request_id] = new_tokens
@@ -463,10 +501,16 @@ def test_logprobs_processor(request_output_kind: RequestOutputKind,
                     plp.extend(prompt_logprobs)
 
     # Confirmed tracked logprobs match what we expect
-    _validate_logprobs(gen_tokens, gen_logprobs, gen_prompt_logprobs,
-                       gen_cumulative_logprobs, dummy_test_vectors,
-                       request_id_list, num_sample_logprobs,
-                       num_prompt_logprobs)
+    _validate_logprobs(
+        gen_tokens,
+        gen_logprobs,
+        gen_prompt_logprobs,
+        gen_cumulative_logprobs,
+        dummy_test_vectors,
+        request_id_list,
+        num_sample_logprobs,
+        num_prompt_logprobs,
+    )
 
     assert output_processor.get_num_unfinished_requests() == 0
     assert not output_processor.has_unfinished_requests()
@@ -474,15 +518,23 @@ def test_logprobs_processor(request_output_kind: RequestOutputKind,
 
 @pytest.mark.parametrize(
     "include_stop_str_in_output,stop_token_type,ignore_eos,num_sample_logprobs",
-    [(False, "stop_token_ids", False, None),
-     (True, "stop_token_ids", False, None),
-     (False, "stop_token_ids", False, NUM_SAMPLE_LOGPROBS_UNDER_TEST),
-     (True, "stop_token_ids", False, NUM_SAMPLE_LOGPROBS_UNDER_TEST),
-     (False, "eos_token_id", False, None), (True, "eos_token_id", False, None),
-     (False, "eos_token_id", True, None)])
-def test_stop_token(include_stop_str_in_output: bool,
-                    num_sample_logprobs: Optional[int], stop_token_type: str,
-                    ignore_eos: bool, dummy_test_vectors):
+    [
+        (False, "stop_token_ids", False, None),
+        (True, "stop_token_ids", False, None),
+        (False, "stop_token_ids", False, NUM_SAMPLE_LOGPROBS_UNDER_TEST),
+        (True, "stop_token_ids", False, NUM_SAMPLE_LOGPROBS_UNDER_TEST),
+        (False, "eos_token_id", False, None),
+        (True, "eos_token_id", False, None),
+        (False, "eos_token_id", True, None),
+    ],
+)
+def test_stop_token(
+    include_stop_str_in_output: bool,
+    num_sample_logprobs: Optional[int],
+    stop_token_type: str,
+    ignore_eos: bool,
+    dummy_test_vectors,
+):
     """Test output processor EOS/stop token handling.
 
     Send mock engine core request to mock engine core and pass core outputs
@@ -523,9 +575,10 @@ def test_stop_token(include_stop_str_in_output: bool,
         dummy_test_vectors: dummy engine core outputs and other data structures
     """
     model_id = dummy_test_vectors.tokenizer.name_or_path
-    if model_id != 'meta-llama/Llama-3.2-1B':
-        raise AssertionError("Test requires meta-llama/Llama-3.2-1B but "
-                             f"{model_id} is in use.")
+    if model_id != "meta-llama/Llama-3.2-1B":
+        raise AssertionError(
+            f"Test requires meta-llama/Llama-3.2-1B but {model_id} is in use."
+        )
     do_logprobs = num_sample_logprobs is not None
     # EOS under test; if False, stop_token_ids under test
     is_eos_test = stop_token_type == "eos_token_id"
@@ -536,18 +589,16 @@ def test_stop_token(include_stop_str_in_output: bool,
     )  # '<|end_of_text|>'
     stop_token_ids = [128009] if not is_eos_test else None  # '<|eot_id|>'
 
-    output_processor = OutputProcessor(dummy_test_vectors.tokenizer,
-                                       log_stats=False)
+    output_processor = OutputProcessor(dummy_test_vectors.tokenizer, log_stats=False)
     # Dummy engine core outputs, with control tokens suffixed to test stops
-    suffix_token = ([eos_token_id] if is_eos_test else stop_token_ids)
+    suffix_token = [eos_token_id] if is_eos_test else stop_token_ids
     assert suffix_token is not None and isinstance(suffix_token[0], int)
     generation_string = dummy_test_vectors.generation_strings[0]
-    generation_tokens = (dummy_test_vectors.generation_tokens[0] +
-                         2 * suffix_token)
+    generation_tokens = dummy_test_vectors.generation_tokens[0] + 2 * suffix_token
     if do_logprobs:
-        generation_logprobs = (
-            dummy_test_vectors.generation_logprobs[0] +
-            2 * [dummy_test_vectors.generation_logprobs[0][-1]])
+        generation_logprobs = dummy_test_vectors.generation_logprobs[0] + 2 * [
+            dummy_test_vectors.generation_logprobs[0][-1]
+        ]
     prompt_string = dummy_test_vectors.prompt_strings[0]
     prompt_tokens = dummy_test_vectors.prompt_tokens[0]
     engine_core = MockEngineCore(
@@ -556,7 +607,8 @@ def test_stop_token(include_stop_str_in_output: bool,
         prompt_logprobs_raw=None,
         eos_token_id=eos_token_id,
         stop_token_ids=stop_token_ids,
-        ignore_eos=ignore_eos)
+        ignore_eos=ignore_eos,
+    )
 
     # Make request.
     request_id = "request-0"
@@ -580,7 +632,8 @@ def test_stop_token(include_stop_str_in_output: bool,
             prompt_logprobs=None,
             ignore_eos=ignore_eos,
         ),
-        pooling_params=None)
+        pooling_params=None,
+    )
 
     # Add request to the detokenizer.
     output_processor.add_request(request, prompt_string)
@@ -605,7 +658,7 @@ def test_stop_token(include_stop_str_in_output: bool,
         # Update tracking.
         request_output = request_outputs[0]
         if request_output.finished:
-            finish_reason = ("length" if is_eos_ignore_test else "stop")
+            finish_reason = "length" if is_eos_ignore_test else "stop"
             assert request_output.outputs[0].finish_reason == finish_reason
 
         gen_string += request_output.outputs[0].text
@@ -614,7 +667,7 @@ def test_stop_token(include_stop_str_in_output: bool,
             gen_logprobs.extend(request_output.outputs[0].logprobs)
 
     # Validate generated text
-    control_token = '<|end_of_text|>' if is_eos_test else '<|eot_id|>'
+    control_token = "<|end_of_text|>" if is_eos_test else "<|eot_id|>"
     if is_eos_ignore_test:
         # Length-based stop; expect full string
         ref_str = generation_string + 2 * control_token
@@ -624,14 +677,15 @@ def test_stop_token(include_stop_str_in_output: bool,
     else:
         # Stop token triggered but not in output
         ref_str = generation_string
-    assert gen_string == ref_str, (f"{gen_string=}, {ref_str=}")
+    assert gen_string == ref_str, f"{gen_string=}, {ref_str=}"
 
     if do_logprobs:
         # Validate number of sample logprobs
         num_tokens = len(gen_tokens)
         num_logprobs = len(gen_logprobs)
         assert num_tokens == num_logprobs, (
-            f"Token count ({num_tokens}) != logprobs count ({num_logprobs})")
+            f"Token count ({num_tokens}) != logprobs count ({num_logprobs})"
+        )
 
     # Check requests are finished
     assert output_processor.get_num_unfinished_requests() == 0
@@ -639,22 +693,24 @@ def test_stop_token(include_stop_str_in_output: bool,
 
 
 @pytest.mark.parametrize("include_stop_str_in_output", [True, False])
-@pytest.mark.parametrize("num_sample_logprobs",
-                         [None, NUM_SAMPLE_LOGPROBS_UNDER_TEST])
-def test_stop_string(include_stop_str_in_output: bool,
-                     num_sample_logprobs: Optional[int], dummy_test_vectors):
-    output_processor = OutputProcessor(dummy_test_vectors.tokenizer,
-                                       log_stats=False)
+@pytest.mark.parametrize("num_sample_logprobs", [None, NUM_SAMPLE_LOGPROBS_UNDER_TEST])
+def test_stop_string(
+    include_stop_str_in_output: bool,
+    num_sample_logprobs: Optional[int],
+    dummy_test_vectors,
+):
+    output_processor = OutputProcessor(dummy_test_vectors.tokenizer, log_stats=False)
     engine_core = MockEngineCore(
         tokens_list=dummy_test_vectors.generation_tokens,
         generated_logprobs_raw=dummy_test_vectors.generation_logprobs
-        if num_sample_logprobs else None,
-        prompt_logprobs_raw=None)
+        if num_sample_logprobs
+        else None,
+        prompt_logprobs_raw=None,
+    )
 
     # Make N requests.
     request_id_list = [
-        f"request-{idx}"
-        for idx in range(len(dummy_test_vectors.prompt_strings))
+        f"request-{idx}" for idx in range(len(dummy_test_vectors.prompt_strings))
     ]
     requests = [
         EngineCoreRequest(
@@ -675,7 +731,8 @@ def test_stop_string(include_stop_str_in_output: bool,
                 logprobs=num_sample_logprobs,
                 prompt_logprobs=None,
             ),
-            pooling_params=None)
+            pooling_params=None,
+        )
         for idx, prompt_tokens in enumerate(dummy_test_vectors.prompt_tokens)
     ]
 
@@ -715,7 +772,8 @@ def test_stop_string(include_stop_str_in_output: bool,
             prompt_logprobs = request_output.prompt_logprobs
             logprobs = request_output.outputs[0].logprobs
             gen_cumulative_logprobs[request_id] = request_output.outputs[
-                0].cumulative_logprob
+                0
+            ].cumulative_logprob
             if request_id not in gen_strings:
                 gen_strings[request_id] = new_text
                 gen_tokens[request_id] = new_tokens
@@ -733,8 +791,8 @@ def test_stop_string(include_stop_str_in_output: bool,
 
     # Confirmed tracked values matches what we expected.
     for idx, (ref_gen_str, stop_str) in enumerate(
-            zip(dummy_test_vectors.generation_strings, STOP_STRINGS)):
-
+        zip(dummy_test_vectors.generation_strings, STOP_STRINGS)
+    ):
         # Request should be aborted.
         request_id = f"request-{idx}"
         assert request_id in aborted
@@ -748,24 +806,28 @@ def test_stop_string(include_stop_str_in_output: bool,
         ref_str_inc_stop = ref_gen_str[:stop_str_idx] + stop_str
 
         if include_stop_str_in_output:
-            assert gen_str == ref_str_inc_stop, (
-                f"{gen_str=}, {ref_str_inc_stop=}")
+            assert gen_str == ref_str_inc_stop, f"{gen_str=}, {ref_str_inc_stop=}"
         else:
-            assert gen_str == ref_str_exc_stop, (
-                f"{gen_str=}, {ref_str_exc_stop=}")
+            assert gen_str == ref_str_exc_stop, f"{gen_str=}, {ref_str_exc_stop=}"
 
     # Confirmed tracked logprobs match what we expect
-    _validate_logprobs(gen_tokens, gen_logprobs, gen_prompt_logprobs,
-                       gen_cumulative_logprobs, dummy_test_vectors,
-                       request_id_list, num_sample_logprobs, None)
+    _validate_logprobs(
+        gen_tokens,
+        gen_logprobs,
+        gen_prompt_logprobs,
+        gen_cumulative_logprobs,
+        dummy_test_vectors,
+        request_id_list,
+        num_sample_logprobs,
+        None,
+    )
 
     assert output_processor.get_num_unfinished_requests() == 0
     assert not output_processor.has_unfinished_requests()
 
 
 def test_iteration_stats(dummy_test_vectors):
-    output_processor = OutputProcessor(dummy_test_vectors.tokenizer,
-                                       log_stats=True)
+    output_processor = OutputProcessor(dummy_test_vectors.tokenizer, log_stats=True)
     engine_core = MockEngineCore(dummy_test_vectors.generation_tokens)
     engine_core_timestamp = time.monotonic()
 
@@ -782,7 +844,8 @@ def test_iteration_stats(dummy_test_vectors):
             data_parallel_rank=None,
             sampling_params=SamplingParams(),
             pooling_params=None,
-        ) for idx, prompt_tokens in enumerate(dummy_test_vectors.prompt_tokens)
+        )
+        for idx, prompt_tokens in enumerate(dummy_test_vectors.prompt_tokens)
     ]
 
     # Add all requests except one to the OutputProcessor.
@@ -794,12 +857,13 @@ def test_iteration_stats(dummy_test_vectors):
     # First iteration has 2 prefills.
     outputs = engine_core.get_outputs()[:num_active]
     iteration_stats = IterationStats()
-    output_processor.process_outputs(outputs, engine_core_timestamp,
-                                     iteration_stats)
-    total_prompt_tokens = sum([
-        len(prompt_tokens)
-        for prompt_tokens in dummy_test_vectors.prompt_tokens[:num_active]
-    ])
+    output_processor.process_outputs(outputs, engine_core_timestamp, iteration_stats)
+    total_prompt_tokens = sum(
+        [
+            len(prompt_tokens)
+            for prompt_tokens in dummy_test_vectors.prompt_tokens[:num_active]
+        ]
+    )
 
     assert iteration_stats.num_prompt_tokens == total_prompt_tokens
     assert iteration_stats.num_generation_tokens == num_active
@@ -807,8 +871,7 @@ def test_iteration_stats(dummy_test_vectors):
     # Just decodes in this step.
     outputs = engine_core.get_outputs()[:num_active]
     iteration_stats = IterationStats()
-    output_processor.process_outputs(outputs, engine_core_timestamp,
-                                     iteration_stats)
+    output_processor.process_outputs(outputs, engine_core_timestamp, iteration_stats)
 
     assert iteration_stats.num_prompt_tokens == 0
     assert iteration_stats.num_generation_tokens == num_active
@@ -818,8 +881,7 @@ def test_iteration_stats(dummy_test_vectors):
     num_active += 1
     outputs = engine_core.get_outputs()[:num_active]
     iteration_stats = IterationStats()
-    output_processor.process_outputs(outputs, engine_core_timestamp,
-                                     iteration_stats)
+    output_processor.process_outputs(outputs, engine_core_timestamp, iteration_stats)
     total_prompt_tokens = len(dummy_test_vectors.prompt_tokens[num_active - 1])
 
     assert iteration_stats.num_prompt_tokens == total_prompt_tokens
@@ -828,8 +890,7 @@ def test_iteration_stats(dummy_test_vectors):
     # Just decodes in this step.
     outputs = engine_core.get_outputs()[:num_active]
     iteration_stats = IterationStats()
-    output_processor.process_outputs(outputs, engine_core_timestamp,
-                                     iteration_stats)
+    output_processor.process_outputs(outputs, engine_core_timestamp, iteration_stats)
 
     assert iteration_stats.num_prompt_tokens == 0
     assert iteration_stats.num_generation_tokens == num_active
@@ -853,16 +914,13 @@ def make_outputs() -> list[RequestOutput]:
                         text=TEXT,
                         token_ids=[idx],
                         cumulative_logprob=(idx + 1 * 1.0),
-                        logprobs=[{
-                            "a": idx,
-                            "b": idx
-                        }],
-                        finish_reason="length" if
-                        (idx == NUM_REQS - 1) else None,
+                        logprobs=[{"a": idx, "b": idx}],
+                        finish_reason="length" if (idx == NUM_REQS - 1) else None,
                     )
                 ],
                 finished=(idx == NUM_REQS - 1),
-            ) for idx in range(NUM_REQS)
+            )
+            for idx in range(NUM_REQS)
         ]
 
     collector = RequestOutputCollector(RequestOutputKind.DELTA)
@@ -888,8 +946,7 @@ def make_outputs() -> list[RequestOutput]:
     assert not output.finished
     # Text, token_ids, and logprobs should get merged.
     assert output.outputs[0].text == TEXT * num_to_put
-    for tok_0, tok_1 in zip(output.outputs[0].token_ids,
-                            list(range(num_to_put))):
+    for tok_0, tok_1 in zip(output.outputs[0].token_ids, list(range(num_to_put))):
         assert tok_0 == tok_1
     assert len(output.outputs[0].logprobs) == num_to_put
 
@@ -910,8 +967,7 @@ def make_outputs() -> list[RequestOutput]:
     assert output.outputs[0].finish_reason == "length"
     # Text, token_ids, and logprobs should get merged.
     assert output.outputs[0].text == TEXT * num_to_put
-    for tok_0, tok_1 in zip(output.outputs[0].token_ids,
-                            list(range(num_to_put))):
+    for tok_0, tok_1 in zip(output.outputs[0].token_ids, list(range(num_to_put))):
         assert tok_0 == tok_1
     assert len(output.outputs[0].logprobs) == num_to_put
 
@@ -1003,8 +1059,7 @@ async def test_cumulative_output_collector_n():
 
 @pytest.mark.parametrize("runner", ["generate", "pooling"])
 def test_abort_requests(runner: str, dummy_test_vectors):
-    output_processor = OutputProcessor(dummy_test_vectors.tokenizer,
-                                       log_stats=True)
+    output_processor = OutputProcessor(dummy_test_vectors.tokenizer, log_stats=True)
     requests = [
         EngineCoreRequest(
             request_id=f"request-{idx}",
@@ -1016,9 +1071,9 @@ def test_abort_requests(runner: str, dummy_test_vectors):
             cache_salt=None,
             data_parallel_rank=None,
             sampling_params=SamplingParams() if runner == "generate" else None,
-            pooling_params=PoolingParams(
-                task="embed") if runner == "pooling" else None,
-        ) for idx, prompt_tokens in enumerate(dummy_test_vectors.prompt_tokens)
+            pooling_params=PoolingParams(task="embed") if runner == "pooling" else None,
+        )
+        for idx, prompt_tokens in enumerate(dummy_test_vectors.prompt_tokens)
     ]
 
     for request in requests:
diff --git a/tests/v1/engine/test_processor_multi_modal_uuids.py b/tests/v1/engine/test_processor_multi_modal_uuids.py
index 3a7bcb957182..9c29c42f5465 100644
--- a/tests/v1/engine/test_processor_multi_modal_uuids.py
+++ b/tests/v1/engine/test_processor_multi_modal_uuids.py
@@ -16,35 +16,33 @@
 
 
 # Mock processor for testing
-def _mk_processor(monkeypatch,
-                  *,
-                  mm_cache_gb: float = 4.0,
-                  enable_prefix_caching: bool = True) -> Processor:
+def _mk_processor(
+    monkeypatch, *, mm_cache_gb: float = 4.0, enable_prefix_caching: bool = True
+) -> Processor:
     """
     Create a Processor instance with minimal configuration suitable for unit
     tests without accessing external resources.
     """
-    monkeypatch.setattr(ModelConfig,
-                        "try_get_generation_config",
-                        lambda self: {},
-                        raising=True)
-    monkeypatch.setattr(ModelConfig,
-                        "__post_init__",
-                        lambda self, *args: None,
-                        raising=True)
-    monkeypatch.setattr(ModelConfig,
-                        "verify_with_parallel_config",
-                        lambda self, parallel_config: None,
-                        raising=True)
-    monkeypatch.setattr(processor_mod,
-                        "processor_cache_from_config",
-                        lambda vllm_config, mm_registry: None,
-                        raising=True)
-
-    monkeypatch.setattr(VllmConfig,
-                        "__post_init__",
-                        lambda self: None,
-                        raising=True)
+    monkeypatch.setattr(
+        ModelConfig, "try_get_generation_config", lambda self: {}, raising=True
+    )
+    monkeypatch.setattr(
+        ModelConfig, "__post_init__", lambda self, *args: None, raising=True
+    )
+    monkeypatch.setattr(
+        ModelConfig,
+        "verify_with_parallel_config",
+        lambda self, parallel_config: None,
+        raising=True,
+    )
+    monkeypatch.setattr(
+        processor_mod,
+        "processor_cache_from_config",
+        lambda vllm_config, mm_registry: None,
+        raising=True,
+    )
+
+    monkeypatch.setattr(VllmConfig, "__post_init__", lambda self: None, raising=True)
 
     model_config = ModelConfig(
         skip_tokenizer_init=True,
@@ -57,12 +55,10 @@ def _mk_processor(monkeypatch,
     # Minimal multimodal_config to satisfy references in
     # Processor.process_inputs.
     class _MockMMConfig:
-
         def __init__(self, gb: float):
             self.mm_processor_cache_gb = gb
 
-    model_config.multimodal_config = _MockMMConfig(
-        mm_cache_gb)  # type: ignore[attr-defined]
+    model_config.multimodal_config = _MockMMConfig(mm_cache_gb)  # type: ignore[attr-defined]
     vllm_config = VllmConfig(
         model_config=model_config,
         cache_config=CacheConfig(enable_prefix_caching=enable_prefix_caching),
@@ -79,13 +75,9 @@ def test_multi_modal_uuids_length_mismatch_raises(monkeypatch):
 
     prompt = {
         "prompt": "USER: <image>\nDescribe\nASSISTANT:",
-        "multi_modal_data": {
-            "image": [cherry_pil_image, stop_pil_image]
-        },
+        "multi_modal_data": {"image": [cherry_pil_image, stop_pil_image]},
         # Mismatch: 2 items but only 1 uuid provided
-        "multi_modal_uuids": {
-            "image": ["hash_cherry"]
-        },
+        "multi_modal_uuids": {"image": ["hash_cherry"]},
     }
 
     with pytest.raises(ValueError, match="must have same length as data"):
@@ -104,16 +96,13 @@ def test_multi_modal_uuids_missing_modality_raises(monkeypatch):
         # Two modalities provided in data
         "multi_modal_data": {
             "image": [cherry_pil_image],
-            "video": [baby_reading_np_ndarrays]
+            "video": [baby_reading_np_ndarrays],
         },
         # Only image uuids provided; video missing should raise
-        "multi_modal_uuids": {
-            "image": ["hash_cherry"]
-        },
+        "multi_modal_uuids": {"image": ["hash_cherry"]},
     }
 
-    with pytest.raises(ValueError,
-                       match="must be provided if multi_modal_data"):
+    with pytest.raises(ValueError, match="must be provided if multi_modal_data"):
         processor.process_inputs(
             request_id="req-2",
             prompt=prompt,  # type: ignore[arg-type]
@@ -130,28 +119,28 @@ def test_multi_modal_uuids_missing_modality_raises(monkeypatch):
     ],
 )
 def test_multi_modal_uuids_accepts_none_and_passes_through(
-        monkeypatch, mm_cache_gb: float, enable_prefix_caching: bool):
-    processor = _mk_processor(monkeypatch,
-                              mm_cache_gb=mm_cache_gb,
-                              enable_prefix_caching=enable_prefix_caching)
+    monkeypatch, mm_cache_gb: float, enable_prefix_caching: bool
+):
+    processor = _mk_processor(
+        monkeypatch,
+        mm_cache_gb=mm_cache_gb,
+        enable_prefix_caching=enable_prefix_caching,
+    )
 
     # Capture the overrides passed to InputPreprocessor.preprocess
     captured: dict[str, object] = {}
 
-    def fake_preprocess(prompt,
-                        *,
-                        tokenization_kwargs=None,
-                        lora_request=None,
-                        mm_uuids=None):
+    def fake_preprocess(
+        prompt, *, tokenization_kwargs=None, lora_request=None, mm_uuids=None
+    ):
         captured["mm_uuids"] = mm_uuids
         # Minimal processed inputs for decoder-only flow
         return {"type": "token", "prompt_token_ids": [1]}
 
     # Monkeypatch only the bound preprocess method on this instance
-    monkeypatch.setattr(processor.input_preprocessor,
-                        "preprocess",
-                        fake_preprocess,
-                        raising=True)
+    monkeypatch.setattr(
+        processor.input_preprocessor, "preprocess", fake_preprocess, raising=True
+    )
 
     # Use a consistent two-image scenario across all configurations
     mm_uuids = {"image": [None, "hash_stop"], "video": None}
@@ -176,24 +165,19 @@ def fake_preprocess(prompt,
 def test_multi_modal_uuids_ignored_when_caching_disabled(monkeypatch):
     # When both processor cache is 0 and prefix caching disabled, the
     # processor builds overrides from request id instead of using user UUIDs.
-    processor = _mk_processor(monkeypatch,
-                              mm_cache_gb=0.0,
-                              enable_prefix_caching=False)
+    processor = _mk_processor(monkeypatch, mm_cache_gb=0.0, enable_prefix_caching=False)
 
     captured: dict[str, object] = {}
 
-    def fake_preprocess(prompt,
-                        *,
-                        tokenization_kwargs=None,
-                        lora_request=None,
-                        mm_uuids=None):
+    def fake_preprocess(
+        prompt, *, tokenization_kwargs=None, lora_request=None, mm_uuids=None
+    ):
         captured["mm_uuids"] = mm_uuids
         return {"type": "token", "prompt_token_ids": [1]}
 
-    monkeypatch.setattr(processor.input_preprocessor,
-                        "preprocess",
-                        fake_preprocess,
-                        raising=True)
+    monkeypatch.setattr(
+        processor.input_preprocessor, "preprocess", fake_preprocess, raising=True
+    )
 
     request_id = "req-42"
     mm_uuids = {"image": ["hash_cherry", "hash_stop"], "video": "hash_video"}
diff --git a/tests/v1/engine/utils.py b/tests/v1/engine/utils.py
index 689b2c95f927..9b720f6eb668 100644
--- a/tests/v1/engine/utils.py
+++ b/tests/v1/engine/utils.py
@@ -82,11 +82,12 @@ def _create_random_top_logprob_test_matrix(
 
 
 def _create_random_top_token_test_vector(
-        num_logprobs: int,
-        lower: int,
-        upper: int,
-        sampled_token_id: int,
-        adjust_num_logprobs: bool = True) -> tuple[torch.Tensor, int]:
+    num_logprobs: int,
+    lower: int,
+    upper: int,
+    sampled_token_id: int,
+    adjust_num_logprobs: bool = True,
+) -> tuple[torch.Tensor, int]:
     """Create a random vector of top logprob token indices
 
     Use to create fake sample logprobs for testing. The sampled token
@@ -127,8 +128,9 @@ def _create_random_top_token_test_vector(
 
     # Check if the sampled_token_id occurs in choice_tensor[1:]
     if sampled_token_id in choice_tensor[1:]:
-        sampled_token_rank = (choice_tensor[1:] == sampled_token_id).nonzero(
-            as_tuple=True)[0].item()
+        sampled_token_rank = (
+            (choice_tensor[1:] == sampled_token_id).nonzero(as_tuple=True)[0].item()
+        )
     else:
         # If not found, assign a random int between num_logprobs and 50700
         sampled_token_rank = random.randint(num_logprobs, 50700)
@@ -164,9 +166,12 @@ def _create_random_top_token_test_matrix(
     num_elements = shape[0] * shape[1]
     choice_tensor = torch.randperm(upper - lower)[:num_elements] + lower
     matrix = torch.cat(
-        (torch.tensor(tokens_list, dtype=torch.int).unsqueeze(-1),
-         choice_tensor.view(shape)),
-        dim=1)
+        (
+            torch.tensor(tokens_list, dtype=torch.int).unsqueeze(-1),
+            choice_tensor.view(shape),
+        ),
+        dim=1,
+    )
 
     # Initialize the tensor for storing the ranks
     prompt_token_ranks = torch.empty(shape[0], dtype=torch.int)
@@ -174,8 +179,7 @@ def _create_random_top_token_test_matrix(
     # Iterate over each row to check presence of
     # tokens_list[rdx] and determine its index
     for rdx in range(shape[0]):
-        row = matrix[rdx,
-                     1:]  # Skip the first column as it contains the token list
+        row = matrix[rdx, 1:]  # Skip the first column as it contains the token list
         token_index = (row == tokens_list[rdx]).nonzero(as_tuple=True)[0]
         if token_index.numel() > 0:
             prompt_token_ranks[rdx] = token_index.item()
@@ -229,19 +233,21 @@ def generate_dummy_sample_logprobs(
         (
             token_vector,
             sampled_token_rank,
-        ) = _create_random_top_token_test_vector(num_logprobs, 0,
-                                                 len(tokenizer.vocab) - 1,
-                                                 sampled_token_id)
+        ) = _create_random_top_token_test_vector(
+            num_logprobs, 0, len(tokenizer.vocab) - 1, sampled_token_id
+        )
 
         res.append(
-            (token_vector,
-             _create_random_top_logprob_test_vector(num_logprobs + 1, -100,
-                                                    0), sampled_token_rank))
+            (
+                token_vector,
+                _create_random_top_logprob_test_vector(num_logprobs + 1, -100, 0),
+                sampled_token_rank,
+            )
+        )
 
     # Convert tensors in the list tuples to Python lists
     res_list_format = [
-        (log_probs_tensor.tolist(), token_ids_tensor.tolist(),
-         sampled_token_rank)
+        (log_probs_tensor.tolist(), token_ids_tensor.tolist(), sampled_token_rank)
         for log_probs_tensor, token_ids_tensor, sampled_token_rank in res
     ]
 
@@ -282,18 +288,24 @@ def generate_dummy_prompt_logprobs_tensors(
         token_vector,
         prompt_token_ranks,
     ) = _create_random_top_token_test_matrix(
-        (num_prompt_logprobs, num_logprobs), 0,
-        len(tokenizer.vocab) - 1, prompt_tokens_list[1:])
+        (num_prompt_logprobs, num_logprobs),
+        0,
+        len(tokenizer.vocab) - 1,
+        prompt_tokens_list[1:],
+    )
     return LogprobsTensors(
         token_vector,
         _create_random_top_logprob_test_matrix(
-            (num_prompt_logprobs, num_logprobs + 1), -100, 0),
-        prompt_token_ranks)
+            (num_prompt_logprobs, num_logprobs + 1), -100, 0
+        ),
+        prompt_token_ranks,
+    )
 
 
 @dataclass
 class DummyOutputProcessorTestVectors:
     """Dummy test vectors for output processor tests"""
+
     tokenizer: GeneralTokenizerType
     vllm_config: EngineArgs
     full_tokens: list[list[int]]  # Prompt + generated tokens
@@ -320,9 +332,9 @@ def __init__(
         # For each request, for each sampled token offset,
         # a tuple of
         # (list of topk token ids, list of sample logprob vals, rank)
-        generated_logprobs_raw: Optional[list[list[tuple[list[int],
-                                                         list[float],
-                                                         int]]]] = None,
+        generated_logprobs_raw: Optional[
+            list[list[tuple[list[int], list[float], int]]]
+        ] = None,
         # For each request, a tuple of
         # (prompt logprob val matrix, prompt logprob tok id matrix);
         # each matrix has dimensions
@@ -355,7 +367,8 @@ def get_outputs(self) -> list[EngineCoreOutput]:
                 if do_logprobs:
                     assert self.generated_logprobs_raw is not None
                     (logprobs_token_ids_, logprobs_, sampled_token_ranks_) = (
-                        self.generated_logprobs_raw[req_idx][token_idx])
+                        self.generated_logprobs_raw[req_idx][token_idx]
+                    )
                     logprobs = LogprobsLists(
                         [logprobs_token_ids_],
                         [logprobs_],
diff --git a/tests/v1/entrypoints/conftest.py b/tests/v1/entrypoints/conftest.py
index 46b953fe3743..40b9d1fe850c 100644
--- a/tests/v1/entrypoints/conftest.py
+++ b/tests/v1/entrypoints/conftest.py
@@ -26,8 +26,10 @@ def sample_token_ids():
 
 @pytest.fixture
 def sample_regex():
-    return (r"((25[0-5]|(2[0-4]|1\d|[1-9]|)\d)\.){3}"
-            r"(25[0-5]|(2[0-4]|1\d|[1-9]|)\d)")
+    return (
+        r"((25[0-5]|(2[0-4]|1\d|[1-9]|)\d)\.){3}"
+        r"(25[0-5]|(2[0-4]|1\d|[1-9]|)\d)"
+    )
 
 
 # Note: Ensure this only uses attributes compatible with xgrammar
@@ -36,53 +38,44 @@ def sample_json_schema():
     return {
         "type": "object",
         "properties": {
-            "name": {
-                "type": "string"
-            },
-            "age": {
-                "type": "integer"
-            },
+            "name": {"type": "string"},
+            "age": {"type": "integer"},
             "skills": {
                 "type": "array",
                 "items": {
                     "type": "string",
-                }
+                },
             },
             "grade": {
                 "type": "string",
-                "pattern": "^[A-D]$"  # Regex pattern
+                "pattern": "^[A-D]$",  # Regex pattern
             },
             "email": {
                 "type": "string",
-                "pattern": "^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,}$"
+                "pattern": "^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,}$",
             },
             "work_history": {
                 "type": "array",
                 "items": {
                     "type": "object",
                     "properties": {
-                        "company": {
-                            "type": "string"
-                        },
+                        "company": {"type": "string"},
                         "duration": {
                             "type": "number",
                             "minimum": 0.0,
                             "maximum": 100.0,  # Numeric range
                         },
-                        "position": {
-                            "type": "string"
-                        }
+                        "position": {"type": "string"},
                     },
                     "required": ["company", "duration", "position"],
-                    "additionalProperties": False
+                    "additionalProperties": False,
                 },
                 "minItems": 0,
-                "maxItems": 3
-            }
+                "maxItems": 3,
+            },
         },
-        "required":
-        ["name", "age", "skills", "grade", "email", "work_history"],
-        "additionalProperties": False
+        "required": ["name", "age", "skills", "grade", "email", "work_history"],
+        "additionalProperties": False,
     }
 
 
@@ -94,67 +87,60 @@ def unsupported_json_schema():
         "properties": {
             "score": {
                 "type": "integer",
-                "multipleOf": 5  # Numeric multiple
+                "multipleOf": 5,  # Numeric multiple
             },
             "tags": {
                 "type": "array",
-                "items": {
-                    "type": "string",
-                    "minLength": 10,
-                    "maxLength": 20
-                }
-            }
+                "items": {"type": "string", "minLength": 10, "maxLength": 20},
+            },
         },
         "required": ["score", "tags"],
-        "additionalProperties": False
+        "additionalProperties": False,
     }
 
 
 @pytest.fixture
 def sample_definition_json_schema():
     return {
-        '$defs': {
-            'Step': {
-                'properties': {
-                    'explanation': {
-                        'title': 'Explanation',
-                        'type': 'string'
-                    },
-                    'output': {
-                        'title': 'Output',
-                        'type': 'string'
-                    }
+        "$defs": {
+            "Step": {
+                "properties": {
+                    "explanation": {"title": "Explanation", "type": "string"},
+                    "output": {"title": "Output", "type": "string"},
                 },
-                'required': ['explanation', 'output'],
-                'title': 'Step',
-                'type': 'object'
+                "required": ["explanation", "output"],
+                "title": "Step",
+                "type": "object",
             }
         },
-        'properties': {
-            'steps': {
-                'items': {
-                    '$ref': '#/$defs/Step'
-                },
-                'title': 'Steps',
-                'type': 'array'
+        "properties": {
+            "steps": {
+                "items": {"$ref": "#/$defs/Step"},
+                "title": "Steps",
+                "type": "array",
             },
-            'final_answer': {
-                'title': 'Final Answer',
-                'type': 'string'
-            }
+            "final_answer": {"title": "Final Answer", "type": "string"},
         },
-        'required': ['steps', 'final_answer'],
-        'title': 'MathReasoning',
-        'type': 'object',
-        "additionalProperties": False
+        "required": ["steps", "final_answer"],
+        "title": "MathReasoning",
+        "type": "object",
+        "additionalProperties": False,
     }
 
 
 @pytest.fixture
 def sample_structured_outputs_choices():
     return [
-        "Python", "Java", "JavaScript", "C++", "C#", "PHP", "TypeScript",
-        "Ruby", "Swift", "Kotlin"
+        "Python",
+        "Java",
+        "JavaScript",
+        "C++",
+        "C#",
+        "PHP",
+        "TypeScript",
+        "Ruby",
+        "Swift",
+        "Kotlin",
     ]
 
 
@@ -172,11 +158,11 @@ def sample_sql_ebnf():
 
 @pytest.fixture
 def sample_sql_lark():
-    return ("""
+    return """
 start: select_statement
 select_statement: "SELECT" column "from" table "where" condition
 column: "col_1" | "col_2"
 table: "table_1" | "table_2"
 condition: column "=" number
 number: "1" | "2"
-""")
+"""
diff --git a/tests/v1/entrypoints/llm/test_struct_output_generate.py b/tests/v1/entrypoints/llm/test_struct_output_generate.py
index 83493e25b7a6..d4c33f6cbbe2 100644
--- a/tests/v1/entrypoints/llm/test_struct_output_generate.py
+++ b/tests/v1/entrypoints/llm/test_struct_output_generate.py
@@ -22,8 +22,11 @@
 from vllm.outputs import RequestOutput
 from vllm.platforms import current_platform
 from vllm.reasoning.abs_reasoning_parsers import ReasoningParserManager
-from vllm.sampling_params import (GuidedDecodingParams, SamplingParams,
-                                  StructuredOutputsParams)
+from vllm.sampling_params import (
+    GuidedDecodingParams,
+    SamplingParams,
+    StructuredOutputsParams,
+)
 
 if TYPE_CHECKING:
     from vllm.config import TokenizerMode
@@ -44,22 +47,18 @@
 PARAMS_MODELS_BACKENDS_TOKENIZER_MODE = [
     ("mistralai/Ministral-8B-Instruct-2410", "xgrammar", "auto", None),
     ("mistralai/Ministral-8B-Instruct-2410", "guidance", "auto", None),
-    ("mistralai/Ministral-8B-Instruct-2410", "lm-format-enforcer", "auto",
-     None),
+    ("mistralai/Ministral-8B-Instruct-2410", "lm-format-enforcer", "auto", None),
     ("mistralai/Ministral-8B-Instruct-2410", "xgrammar", "mistral", None),
     ("Qwen/Qwen2.5-1.5B-Instruct", "xgrammar", "auto", None),
     ("Qwen/Qwen2.5-1.5B-Instruct", "lm-format-enforcer", "auto", None),
-    #FIXME: This tests are flaky on CI thus disabled. Tracking in Issue #24402
+    # FIXME: This tests are flaky on CI thus disabled. Tracking in Issue #24402
     # ("mistralai/Ministral-8B-Instruct-2410", "outlines", "auto", None),
     # ("mistralai/Ministral-8B-Instruct-2410", "outlines", "mistral", None),
-    #("Qwen/Qwen2.5-1.5B-Instruct", "guidance", "auto"),
-    ("mistralai/Ministral-8B-Instruct-2410", "outlines", "auto",
-     NGRAM_SPEC_CONFIG),
-    ("mistralai/Ministral-8B-Instruct-2410", "guidance", "auto",
-     NGRAM_SPEC_CONFIG),
+    # ("Qwen/Qwen2.5-1.5B-Instruct", "guidance", "auto"),
+    ("mistralai/Ministral-8B-Instruct-2410", "outlines", "auto", NGRAM_SPEC_CONFIG),
+    ("mistralai/Ministral-8B-Instruct-2410", "guidance", "auto", NGRAM_SPEC_CONFIG),
     ("Qwen/Qwen2.5-1.5B-Instruct", "xgrammar", "auto", NGRAM_SPEC_CONFIG),
-    ("meta-llama/Meta-Llama-3.1-8B-Instruct", "xgrammar", "auto",
-     EAGLE_SPEC_CONFIG)
+    ("meta-llama/Meta-Llama-3.1-8B-Instruct", "xgrammar", "auto", EAGLE_SPEC_CONFIG),
 ]
 
 PARAMS_MODELS_TOKENIZER_MODE = [
@@ -82,19 +81,16 @@ class CarDescription(BaseModel):
 
 
 def test_guided_decoding_deprecated():
-    with pytest.warns(DeprecationWarning,
-                      match="GuidedDecodingParams is deprecated.*"):
+    with pytest.warns(DeprecationWarning, match="GuidedDecodingParams is deprecated.*"):
         guided_decoding = GuidedDecodingParams(json_object=True)
 
     structured_outputs = StructuredOutputsParams(json_object=True)
     assert fields(guided_decoding) == fields(structured_outputs)
 
-    with pytest.warns(DeprecationWarning,
-                      match="guided_decoding is deprecated.*"):
+    with pytest.warns(DeprecationWarning, match="guided_decoding is deprecated.*"):
         sp1 = SamplingParams(guided_decoding=guided_decoding)
 
-    with pytest.warns(DeprecationWarning,
-                      match="guided_decoding is deprecated.*"):
+    with pytest.warns(DeprecationWarning, match="guided_decoding is deprecated.*"):
         sp2 = SamplingParams.from_optional(guided_decoding=guided_decoding)
 
     assert sp1 == sp2
@@ -104,7 +100,8 @@ def test_guided_decoding_deprecated():
 @pytest.mark.skip_global_cleanup
 @pytest.mark.parametrize(
     "model_name, backend, tokenizer_mode, speculative_config",
-    PARAMS_MODELS_BACKENDS_TOKENIZER_MODE)
+    PARAMS_MODELS_BACKENDS_TOKENIZER_MODE,
+)
 def test_structured_output(
     monkeypatch: pytest.MonkeyPatch,
     sample_json_schema: dict[str, Any],
@@ -125,15 +122,17 @@ def test_structured_output(
 
     # Use a single LLM instance for several scenarios to
     # speed up the test suite.
-    llm = LLM(model=model_name,
-              enforce_eager=True,
-              max_model_len=1024,
-              structured_outputs_config=dict(backend=backend,
-                                             disable_any_whitespace=backend
-                                             in {"xgrammar", "guidance"}),
-              seed=120,
-              tokenizer_mode=tokenizer_mode,
-              speculative_config=speculative_config)
+    llm = LLM(
+        model=model_name,
+        enforce_eager=True,
+        max_model_len=1024,
+        structured_outputs_config=dict(
+            backend=backend, disable_any_whitespace=backend in {"xgrammar", "guidance"}
+        ),
+        seed=120,
+        tokenizer_mode=tokenizer_mode,
+        speculative_config=speculative_config,
+    )
 
     #
     # Test 1: Generate JSON output based on a provided schema
@@ -141,11 +140,14 @@ def test_structured_output(
     sampling_params = SamplingParams(
         temperature=1.0,
         max_tokens=4096,
-        structured_outputs=StructuredOutputsParams(json=sample_json_schema))
+        structured_outputs=StructuredOutputsParams(json=sample_json_schema),
+    )
 
-    prompt = ("Give an example JSON for an employee profile that fits this "
-              "schema. Make the response as short as possible. Schema: "
-              f"{sample_json_schema}")
+    prompt = (
+        "Give an example JSON for an employee profile that fits this "
+        "schema. Make the response as short as possible. Schema: "
+        f"{sample_json_schema}"
+    )
     outputs = llm.generate(
         [prompt] * 2,
         sampling_params=sampling_params,
@@ -161,7 +163,7 @@ def test_structured_output(
 
         generated_text = output.outputs[0].text
         assert generated_text is not None
-        if backend != 'lm-format-enforcer':
+        if backend != "lm-format-enforcer":
             assert "\n" not in generated_text
         print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")
         try:
@@ -169,7 +171,8 @@ def test_structured_output(
         except json.JSONDecodeError as e:
             pytest.fail(
                 f"Invalid JSON from backend={backend}: {generated_text!r}\n"
-                f"Schema: {sample_json_schema}\nError: {e}")
+                f"Schema: {sample_json_schema}\nError: {e}"
+            )
         jsonschema.validate(instance=output_json, schema=sample_json_schema)
 
     #
@@ -180,14 +183,18 @@ def test_structured_output(
             temperature=1.0,
             max_tokens=4096,
             n=2,
-            structured_outputs=StructuredOutputsParams(json_object=True))
+            structured_outputs=StructuredOutputsParams(json_object=True),
+        )
 
-        outputs = llm.generate(prompts=(
-            "Generate a JSON object with curly braces for a person with "
-            "name and age fields for John Smith who is 31 years old. "
-            "Make the response as short as possible."),
-                               sampling_params=sampling_params,
-                               use_tqdm=True)
+        outputs = llm.generate(
+            prompts=(
+                "Generate a JSON object with curly braces for a person with "
+                "name and age fields for John Smith who is 31 years old. "
+                "Make the response as short as possible."
+            ),
+            sampling_params=sampling_params,
+            use_tqdm=True,
+        )
 
         assert outputs is not None
         for output in outputs:
@@ -209,25 +216,30 @@ def test_structured_output(
     sampling_params = SamplingParams(
         temperature=1.0,
         max_tokens=4096,
-        structured_outputs=StructuredOutputsParams(
-            json=unsupported_json_schema))
+        structured_outputs=StructuredOutputsParams(json=unsupported_json_schema),
+    )
     if backend.startswith("xgrammar"):
-        with pytest.raises(ValueError,
-                           match="The provided JSON schema contains features "
-                           "not supported by xgrammar."):
-
-            prompt = (f"Give an example JSON for an employee profile that "
-                      f"fits this schema: {unsupported_json_schema}. "
-                      f"Make the response as short as possible.")
+        with pytest.raises(
+            ValueError,
+            match="The provided JSON schema contains features "
+            "not supported by xgrammar.",
+        ):
+            prompt = (
+                f"Give an example JSON for an employee profile that "
+                f"fits this schema: {unsupported_json_schema}. "
+                f"Make the response as short as possible."
+            )
             llm.generate(
                 [prompt] * 2,
                 sampling_params=sampling_params,
                 use_tqdm=True,
             )
     else:
-        prompt = (f"Give an example JSON object for a grade that "
-                  f"fits this schema: {unsupported_json_schema}. "
-                  f"Make the response as short as possible.")
+        prompt = (
+            f"Give an example JSON object for a grade that "
+            f"fits this schema: {unsupported_json_schema}. "
+            f"Make the response as short as possible."
+        )
         outputs = llm.generate(
             prompt,
             sampling_params=sampling_params,
@@ -253,12 +265,14 @@ def test_structured_output(
             temperature=0.8,
             top_p=0.95,
             max_tokens=1000,
-            structured_outputs=StructuredOutputsParams(
-                grammar=sample_sql_ebnf))
+            structured_outputs=StructuredOutputsParams(grammar=sample_sql_ebnf),
+        )
         outputs = llm.generate(
-            ("Generate a sql statement that selects col_1 from "
-             "table_1 where it is equal to 1. Make the response as short as "
-             "possible."),
+            (
+                "Generate a sql statement that selects col_1 from "
+                "table_1 where it is equal to 1. Make the response as short as "
+                "possible."
+            ),
             sampling_params=sampling_params,
             use_tqdm=True,
         )
@@ -273,8 +287,7 @@ def test_structured_output(
             assert generated_text is not None
 
             # remove spaces for comparison b/c we removed them in the grammar
-            ground_truth = "SELECT col_1 from table_1 where col_1 = 1".replace(
-                " ", "")
+            ground_truth = "SELECT col_1 from table_1 where col_1 = 1".replace(" ", "")
 
             assert generated_text.strip() == ground_truth
 
@@ -287,12 +300,14 @@ def test_structured_output(
             temperature=0.8,
             top_p=0.95,
             max_tokens=1000,
-            structured_outputs=StructuredOutputsParams(
-                grammar=sample_sql_lark))
+            structured_outputs=StructuredOutputsParams(grammar=sample_sql_lark),
+        )
         outputs = llm.generate(
-            ("Generate a sql statement that selects col_1 from "
-             "table_1 where it is equal to 1. Make the response as short as "
-             "possible."),
+            (
+                "Generate a sql statement that selects col_1 from "
+                "table_1 where it is equal to 1. Make the response as short as "
+                "possible."
+            ),
             sampling_params=sampling_params,
             use_tqdm=True,
         )
@@ -308,12 +323,12 @@ def test_structured_output(
 
             # use Lark to parse the output, and make sure it's a valid parse tree
             from lark import Lark
+
             parser = Lark(sample_sql_lark)
             parser.parse(generated_text)
 
             # remove spaces for comparison b/c we removed them in the grammar
-            ground_truth = "SELECT col_1 from table_1 where col_1 = 1".replace(
-                " ", "")
+            ground_truth = "SELECT col_1 from table_1 where col_1 = 1".replace(" ", "")
 
             assert generated_text.strip() == ground_truth
 
@@ -326,13 +341,15 @@ def test_structured_output(
             temperature=0.8,
             top_p=0.95,
             max_tokens=1000,
-            structured_outputs=StructuredOutputsParams(
-                grammar="not a grammar"))
+            structured_outputs=StructuredOutputsParams(grammar="not a grammar"),
+        )
         with pytest.raises(ValueError, match="Failed to convert the grammar "):
             llm.generate(
-                ("Generate a sql statement that selects col_1 from "
-                 "table_1 where it is equal to 1. Make the response as short "
-                 "as possible."),
+                (
+                    "Generate a sql statement that selects col_1 from "
+                    "table_1 where it is equal to 1. Make the response as short "
+                    "as possible."
+                ),
                 sampling_params=sampling_params,
                 use_tqdm=True,
             )
@@ -343,10 +360,13 @@ def test_structured_output(
     sampling_params = SamplingParams(
         temperature=0.8,
         top_p=0.95,
-        structured_outputs=StructuredOutputsParams(regex=sample_regex))
+        structured_outputs=StructuredOutputsParams(regex=sample_regex),
+    )
 
-    prompt = (f"Give an example IPv4 address with this regex: {sample_regex}. "
-              f"Make the response as short as possible.")
+    prompt = (
+        f"Give an example IPv4 address with this regex: {sample_regex}. "
+        f"Make the response as short as possible."
+    )
     outputs = llm.generate(
         [prompt] * 2,
         sampling_params=sampling_params,
@@ -371,11 +391,15 @@ def test_structured_output(
         temperature=0.8,
         top_p=0.95,
         structured_outputs=StructuredOutputsParams(
-            choice=sample_structured_outputs_choices))
+            choice=sample_structured_outputs_choices
+        ),
+    )
 
     outputs = llm.generate(
-        ("The best language for type-safe systems programming is "
-         "(Make the response as short as possible.) "),
+        (
+            "The best language for type-safe systems programming is "
+            "(Make the response as short as possible.) "
+        ),
         sampling_params=sampling_params,
         use_tqdm=True,
     )
@@ -397,12 +421,15 @@ def test_structured_output(
     sampling_params = SamplingParams(
         temperature=1.0,
         max_tokens=1000,
-        structured_outputs=StructuredOutputsParams(json=json_schema))
+        structured_outputs=StructuredOutputsParams(json=json_schema),
+    )
 
     outputs = llm.generate(
-        ("Generate a JSON with the brand, model and car_type of the most "
-         "iconic car from the 90's. Make the response as short as "
-         "possible."),
+        (
+            "Generate a JSON with the brand, model and car_type of the most "
+            "iconic car from the 90's. Make the response as short as "
+            "possible."
+        ),
         sampling_params=sampling_params,
         use_tqdm=True,
     )
@@ -422,7 +449,8 @@ def test_structured_output(
         except json.JSONDecodeError as e:
             pytest.fail(
                 f"Invalid JSON from backend={backend}: {generated_text!r}\n"
-                f"Schema: {json_schema}\nError: {e}")
+                f"Schema: {json_schema}\nError: {e}"
+            )
         jsonschema.validate(instance=output_json, schema=json_schema)
 
     #
@@ -436,21 +464,24 @@ def test_structured_output(
             "description": {
                 "type": "string",
                 "maxLength": max_length,
-                "minLength": min_length
+                "minLength": min_length,
             }
         },
         "required": ["description"],
-        "additionalProperties": False
+        "additionalProperties": False,
     }
 
     sampling_params = SamplingParams(
         temperature=1.0,
         max_tokens=4096,
-        structured_outputs=StructuredOutputsParams(json=json_schema))
+        structured_outputs=StructuredOutputsParams(json=json_schema),
+    )
 
     outputs = llm.generate(
-        ("Generate a description of a frog using 50 characters. "
-         "Make the response as short as possible."),
+        (
+            "Generate a description of a frog using 50 characters. "
+            "Make the response as short as possible."
+        ),
         sampling_params=sampling_params,
         use_tqdm=True,
     )
@@ -470,7 +501,8 @@ def test_structured_output(
         except json.JSONDecodeError as e:
             pytest.fail(
                 f"Invalid JSON from backend={backend}: {generated_text!r}\n"
-                f"Schema: {json_schema}\nError: {e}")
+                f"Schema: {json_schema}\nError: {e}"
+            )
         jsonschema.validate(instance=output_json, schema=json_schema)
 
     if backend not in ["outlines", "lm-format-enforcer"]:
@@ -478,29 +510,28 @@ def test_structured_output(
         # Test 11: Generate structured output using structural_tag format
         #
         structural_tag_config = {
-            "type":
-            "structural_tag",
-            "structures": [{
-                "begin": "<function=get_weather>",
-                "schema": {
-                    "type": "object",
-                    "properties": {
-                        "city": {
-                            "type": "string"
-                        }
+            "type": "structural_tag",
+            "structures": [
+                {
+                    "begin": "<function=get_weather>",
+                    "schema": {
+                        "type": "object",
+                        "properties": {"city": {"type": "string"}},
+                        "additionalProperties": False,
                     },
-                    "additionalProperties": False
-                },
-                "end": "</function>"
-            }],
-            "triggers": ["<function="]
+                    "end": "</function>",
+                }
+            ],
+            "triggers": ["<function="],
         }
 
         sampling_params = SamplingParams(
             temperature=0.0,
             max_tokens=4096,
             structured_outputs=StructuredOutputsParams(
-                structural_tag=json.dumps(structural_tag_config)))
+                structural_tag=json.dumps(structural_tag_config)
+            ),
+        )
 
         prompt = """
 You have access to the following function to retrieve the weather in a city:
@@ -542,9 +573,7 @@ def test_structured_output(
 """
 
         # Change this once other backends support structural_tag
-        outputs = llm.generate(prompt,
-                               sampling_params=sampling_params,
-                               use_tqdm=True)
+        outputs = llm.generate(prompt, sampling_params=sampling_params, use_tqdm=True)
         assert outputs is not None
 
         for output in outputs:
@@ -554,12 +583,13 @@ def test_structured_output(
             assert generated_text is not None
 
             # Search for function call pattern in the response
-            function_call_pattern = r'<function=get_weather>(.*?)</function>'
+            function_call_pattern = r"<function=get_weather>(.*?)</function>"
             matches = re.findall(function_call_pattern, generated_text)
 
             if not matches:
-                print(f"Warning: No function calls found in response: "
-                      f"{generated_text!r}")
+                print(
+                    f"Warning: No function calls found in response: {generated_text!r}"
+                )
                 continue
 
             # Take the first function call if multiple are found
@@ -570,16 +600,22 @@ def test_structured_output(
                 assert isinstance(json_content["city"], str)
                 print(f"Found valid function call: {generated_text!r}")
             except (json.JSONDecodeError, AssertionError) as e:
-                pytest.fail("Invalid function call format: "
-                            f"{generated_text!r}\nError: {str(e)}")
+                pytest.fail(
+                    f"Invalid function call format: {generated_text!r}\nError: {str(e)}"
+                )
 
 
 @pytest.mark.skip_global_cleanup
 @pytest.mark.parametrize(
     "model_name, backend, tokenizer_mode, reasoning_parser, speculative_config",  # noqa: E501
     [
-        ("deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B", "xgrammar", "auto",
-         "deepseek_r1", NGRAM_SPEC_CONFIG),
+        (
+            "deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B",
+            "xgrammar",
+            "auto",
+            "deepseek_r1",
+            NGRAM_SPEC_CONFIG,
+        ),
         ("Qwen/Qwen3-1.7B", "xgrammar", "auto", "deepseek_r1", None),
     ],
 )
@@ -605,27 +641,25 @@ def test_structured_output_with_reasoning_matrices(
         enforce_eager=bool(not current_platform.is_tpu()),
         max_model_len=1024,
         max_num_seqs=16,
-        structured_outputs_config=dict(backend=backend,
-                                       disable_any_whitespace=backend
-                                       in {"xgrammar", "guidance"},
-                                       reasoning_parser=reasoning_parser),
+        structured_outputs_config=dict(
+            backend=backend,
+            disable_any_whitespace=backend in {"xgrammar", "guidance"},
+            reasoning_parser=reasoning_parser,
+        ),
         tokenizer_mode=tokenizer_mode,
         speculative_config=speculative_config,
     )
     tokenizer = llm.get_tokenizer()
     reasoner = ReasoningParserManager.get_reasoning_parser(reasoning_parser)(
-        tokenizer=tokenizer)
+        tokenizer=tokenizer
+    )
 
     reasoning_prompt = "Solve the following math problem step-by-step, then provide the final answer as JSON object with a single key 'result'. Make sure to correct your reasoning if there are any issue should it arise.\nProblem: What is 5 * 8 + 2?"  # noqa: E501
     reasoning_schema = {
         "type": "object",
-        "properties": {
-            "result": {
-                "type": "integer"
-            }
-        },
+        "properties": {"result": {"type": "integer"}},
         "required": ["result"],
-        "additionalProperties": False
+        "additionalProperties": False,
     }
     if "Qwen3" in model_name:
         reasoning_prompt += "<think>\n"
@@ -646,11 +680,8 @@ def test_structured_output_with_reasoning_matrices(
     assert output is not None and isinstance(output, RequestOutput)
     prompt = output.prompt
     generated_text = output.outputs[0].text
-    reasoning_content, content = run_reasoning_extraction(
-        reasoner, [generated_text])
-    print(
-        f"Prompt: {prompt!r}\nReasoning: {reasoning_content!r}\nContent: {content!r}"
-    )
+    reasoning_content, content = run_reasoning_extraction(reasoner, [generated_text])
+    print(f"Prompt: {prompt!r}\nReasoning: {reasoning_content!r}\nContent: {content!r}")
 
     assert content is not None and reasoning_content is not None
     output_json = json.loads(content)
@@ -658,8 +689,7 @@ def test_structured_output_with_reasoning_matrices(
 
 
 @pytest.mark.skip_global_cleanup
-@pytest.mark.parametrize("model_name, tokenizer_mode",
-                         PARAMS_MODELS_TOKENIZER_MODE)
+@pytest.mark.parametrize("model_name, tokenizer_mode", PARAMS_MODELS_TOKENIZER_MODE)
 def test_structured_output_auto_mode(
     monkeypatch: pytest.MonkeyPatch,
     unsupported_json_schema: dict[str, Any],
@@ -668,30 +698,32 @@ def test_structured_output_auto_mode(
 ):
     monkeypatch.setenv("VLLM_USE_V1", "1")
 
-    llm = LLM(model=model_name,
-              max_model_len=1024,
-              structured_outputs_config=dict(backend="auto"),
-              tokenizer_mode=tokenizer_mode)
+    llm = LLM(
+        model=model_name,
+        max_model_len=1024,
+        structured_outputs_config=dict(backend="auto"),
+        tokenizer_mode=tokenizer_mode,
+    )
 
     sampling_params = SamplingParams(
         temperature=1.0,
         max_tokens=1000,
-        structured_outputs=StructuredOutputsParams(
-            json=unsupported_json_schema))
+        structured_outputs=StructuredOutputsParams(json=unsupported_json_schema),
+    )
 
     prompts = (
         "Give an example JSON object for a grade "
         "that fits this schema: "
-        f"{unsupported_json_schema}. Make the response as short as possible.")
+        f"{unsupported_json_schema}. Make the response as short as possible."
+    )
     # This would fail with the default of "xgrammar", but in "auto"
     # we will handle fallback automatically.
-    outputs = llm.generate(prompts,
-                           sampling_params=sampling_params,
-                           use_tqdm=True)
+    outputs = llm.generate(prompts, sampling_params=sampling_params, use_tqdm=True)
     # Make sure `auto` backend handling doesn't mess up sampling_params
     # and that we can reuse it without error.
     outputs.extend(
-        llm.generate(prompts, sampling_params=sampling_params, use_tqdm=True))
+        llm.generate(prompts, sampling_params=sampling_params, use_tqdm=True)
+    )
 
     assert outputs is not None
     for output in outputs:
@@ -710,27 +742,24 @@ def test_structured_output_auto_mode(
 def test_guidance_no_additional_properties(monkeypatch: pytest.MonkeyPatch):
     monkeypatch.setenv("VLLM_USE_V1", "1")
 
-    llm = LLM(model="Qwen/Qwen2.5-1.5B-Instruct",
-              max_model_len=1024,
-              structured_outputs_config=dict(
-                  backend="guidance",
-                  disable_any_whitespace=True,
-                  disable_additional_properties=True))
+    llm = LLM(
+        model="Qwen/Qwen2.5-1.5B-Instruct",
+        max_model_len=1024,
+        structured_outputs_config=dict(
+            backend="guidance",
+            disable_any_whitespace=True,
+            disable_additional_properties=True,
+        ),
+    )
 
     schema = {
-        'type': 'object',
-        'properties': {
-            'a1': {
-                'type': 'string'
-            },
-            'a2': {
-                'type': 'string'
-            },
-            'a3': {
-                'type': 'string'
-            }
+        "type": "object",
+        "properties": {
+            "a1": {"type": "string"},
+            "a2": {"type": "string"},
+            "a3": {"type": "string"},
         },
-        'required': ['a1', 'a2', 'a3'],
+        "required": ["a1", "a2", "a3"],
     }
 
     prompt = (
@@ -738,18 +767,19 @@ def test_guidance_no_additional_properties(monkeypatch: pytest.MonkeyPatch):
         "helpful assistant.<|im_end|>\n<|im_start|>user\nPlease generate a "
         "large JSON object with key-value pairs a1=b1, a2=b2, ..., a20=b20. "
         "Make the response as short as possible."
-        "<|im_end|>\n<|im_start|>assistant\n")
+        "<|im_end|>\n<|im_start|>assistant\n"
+    )
 
     def generate_with_backend(backend):
         structured_outputs_params = StructuredOutputsParams(
             json=schema,
             backend=backend,
             disable_any_whitespace=True,
-            disable_additional_properties=True)
+            disable_additional_properties=True,
+        )
         sampling_params = SamplingParams(
-            temperature=0,
-            max_tokens=256,
-            structured_outputs=structured_outputs_params)
+            temperature=0, max_tokens=256, structured_outputs=structured_outputs_params
+        )
 
         outputs = llm.generate(prompt, sampling_params=sampling_params)
         assert outputs is not None
@@ -794,16 +824,18 @@ def test_structured_output_batched_with_non_structured_outputs_requests(
     structured_outputs_prompt = (
         "Give an example JSON for an employee profile that fits this "
         "schema. Make the response as short as possible. Schema: "
-        f"{sample_json_schema}")
+        f"{sample_json_schema}"
+    )
 
     non_structured_outputs_prompt = "The diameter of the Earth in kilometers is "
 
     prompts = [structured_outputs_prompt, non_structured_outputs_prompt]
     sampling_params = [
-        SamplingParams(temperature=1.0,
-                       max_tokens=400,
-                       structured_outputs=StructuredOutputsParams(
-                           json=sample_json_schema)),
+        SamplingParams(
+            temperature=1.0,
+            max_tokens=400,
+            structured_outputs=StructuredOutputsParams(json=sample_json_schema),
+        ),
         # No max tokens, temp=0 to assert on contents
         SamplingParams(
             seed=42,
@@ -812,9 +844,9 @@ def test_structured_output_batched_with_non_structured_outputs_requests(
         ),
     ]
 
-    outputs = llm.generate(prompts=prompts,
-                           sampling_params=sampling_params,
-                           use_tqdm=True)
+    outputs = llm.generate(
+        prompts=prompts, sampling_params=sampling_params, use_tqdm=True
+    )
 
     assert outputs is not None
 
@@ -837,8 +869,7 @@ def test_structured_output_batched_with_non_structured_outputs_requests(
             # First prompt is structured outputs, expect valid JSON
             assert "\n" not in generated_text
             output_json = json.loads(generated_text)
-            jsonschema.validate(instance=output_json,
-                                schema=sample_json_schema)
+            jsonschema.validate(instance=output_json, schema=sample_json_schema)
         else:
             # Second prompt is not structured outputs, expect valid output
             # Cannot assert on exact output, but we can expect it to be factual
diff --git a/tests/v1/entrypoints/openai/responses/conftest.py b/tests/v1/entrypoints/openai/responses/conftest.py
index 2d677a00b646..ad7594a3dd6d 100644
--- a/tests/v1/entrypoints/openai/responses/conftest.py
+++ b/tests/v1/entrypoints/openai/responses/conftest.py
@@ -23,9 +23,9 @@ def default_server_args():
 @pytest.fixture(scope="module")
 def server_with_store(default_server_args):
     with RemoteOpenAIServer(
-            MODEL_NAME,
-            default_server_args,
-            env_dict={"VLLM_ENABLE_RESPONSES_API_STORE": "1"},
+        MODEL_NAME,
+        default_server_args,
+        env_dict={"VLLM_ENABLE_RESPONSES_API_STORE": "1"},
     ) as remote_server:
         yield remote_server
 
diff --git a/tests/v1/entrypoints/openai/responses/test_basic.py b/tests/v1/entrypoints/openai/responses/test_basic.py
index 2ee1004493a1..dd3a563e9570 100644
--- a/tests/v1/entrypoints/openai/responses/test_basic.py
+++ b/tests/v1/entrypoints/openai/responses/test_basic.py
@@ -36,24 +36,14 @@ async def test_instructions(client: openai.AsyncOpenAI):
 
 @pytest.mark.asyncio
 async def test_chat(client: openai.AsyncOpenAI):
-    response = await client.responses.create(input=[
-        {
-            "role": "system",
-            "content": "Finish the answer with QED."
-        },
-        {
-            "role": "user",
-            "content": "What is 5 * 3?"
-        },
-        {
-            "role": "assistant",
-            "content": "15. QED."
-        },
-        {
-            "role": "user",
-            "content": "Multiply the result by 2."
-        },
-    ], )
+    response = await client.responses.create(
+        input=[
+            {"role": "system", "content": "Finish the answer with QED."},
+            {"role": "user", "content": "What is 5 * 3?"},
+            {"role": "assistant", "content": "15. QED."},
+            {"role": "user", "content": "Multiply the result by 2."},
+        ],
+    )
     print(response)
 
     output_text = response.output[-1].content[0].text
@@ -63,15 +53,14 @@ async def test_chat(client: openai.AsyncOpenAI):
 
 @pytest.mark.asyncio
 async def test_chat_with_input_type(client: openai.AsyncOpenAI):
-    response = await client.responses.create(input=[
-        {
-            "role": "user",
-            "content": [{
-                "type": "input_text",
-                "text": "Hello!"
-            }],
-        },
-    ], )
+    response = await client.responses.create(
+        input=[
+            {
+                "role": "user",
+                "content": [{"type": "input_text", "text": "Hello!"}],
+            },
+        ],
+    )
     print(response)
     assert response.status == "completed"
 
@@ -99,6 +88,6 @@ async def test_streaming(client: openai.AsyncOpenAI):
     assert isinstance(events[0], openai_responses_types.ResponseCreatedEvent)
     assert any(
         isinstance(event, openai_responses_types.ResponseTextDeltaEvent)
-        for event in events)
-    assert isinstance(events[-1],
-                      openai_responses_types.ResponseCompletedEvent)
+        for event in events
+    )
+    assert isinstance(events[-1], openai_responses_types.ResponseCompletedEvent)
diff --git a/tests/v1/entrypoints/openai/responses/test_image.py b/tests/v1/entrypoints/openai/responses/test_image.py
index 3ed36ca678c0..46e625690352 100644
--- a/tests/v1/entrypoints/openai/responses/test_image.py
+++ b/tests/v1/entrypoints/openai/responses/test_image.py
@@ -38,9 +38,9 @@ def default_image_server_args():
 @pytest.fixture(scope="module")
 def image_server(default_image_server_args):
     with RemoteOpenAIServer(
-            MODEL_NAME,
-            default_image_server_args,
-            env_dict={"VLLM_ENABLE_RESPONSES_API_STORE": "1"},
+        MODEL_NAME,
+        default_image_server_args,
+        env_dict={"VLLM_ENABLE_RESPONSES_API_STORE": "1"},
     ) as remote_server:
         yield remote_server
 
@@ -54,8 +54,7 @@ async def client(image_server):
 @pytest.fixture(scope="session")
 def base64_encoded_image(local_asset_server) -> dict[str, str]:
     return {
-        image_url:
-        encode_image_base64(local_asset_server.get_image_asset(image_url))
+        image_url: encode_image_base64(local_asset_server.get_image_asset(image_url))
         for image_url in TEST_IMAGE_ASSETS
     }
 
@@ -63,24 +62,23 @@ def base64_encoded_image(local_asset_server) -> dict[str, str]:
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 @pytest.mark.parametrize("image_url", TEST_IMAGE_ASSETS, indirect=True)
-async def test_single_chat_session_image(client: openai.AsyncOpenAI,
-                                         model_name: str, image_url: str):
+async def test_single_chat_session_image(
+    client: openai.AsyncOpenAI, model_name: str, image_url: str
+):
     content_text = "What's in this image?"
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "input_image",
-                "image_url": image_url,
-                "detail": "auto",
-            },
-            {
-                "type": "input_text",
-                "text": content_text
-            },
-        ],
-    }]
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {
+                    "type": "input_image",
+                    "image_url": image_url,
+                    "detail": "auto",
+                },
+                {"type": "input_text", "text": content_text},
+            ],
+        }
+    ]
 
     # test image url
     response = await client.responses.create(
@@ -100,22 +98,19 @@ async def test_single_chat_session_image_base64encoded(
     base64_encoded_image: dict[str, str],
 ):
     content_text = "What's in this image?"
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            {
-                "type": "input_image",
-                "image_url":
-                f"data:image/jpeg;base64,{base64_encoded_image[raw_image_url]}",
-                "detail": "auto",
-            },
-            {
-                "type": "input_text",
-                "text": content_text
-            },
-        ],
-    }]
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                {
+                    "type": "input_image",
+                    "image_url": f"data:image/jpeg;base64,{base64_encoded_image[raw_image_url]}",
+                    "detail": "auto",
+                },
+                {"type": "input_text", "text": content_text},
+            ],
+        }
+    ]
     # test image base64
     response = await client.responses.create(
         model=model_name,
@@ -129,24 +124,27 @@ async def test_single_chat_session_image_base64encoded(
 @pytest.mark.parametrize(
     "image_urls",
     [TEST_IMAGE_ASSETS[:i] for i in range(2, len(TEST_IMAGE_ASSETS))],
-    indirect=True)
-async def test_multi_image_input(client: openai.AsyncOpenAI, model_name: str,
-                                 image_urls: list[str]):
-    messages = [{
-        "role":
-        "user",
-        "content": [
-            *({
-                "type": "input_image",
-                "image_url": image_url,
-                "detail": "auto",
-            } for image_url in image_urls),
-            {
-                "type": "input_text",
-                "text": "What's in this image?"
-            },
-        ],
-    }]
+    indirect=True,
+)
+async def test_multi_image_input(
+    client: openai.AsyncOpenAI, model_name: str, image_urls: list[str]
+):
+    messages = [
+        {
+            "role": "user",
+            "content": [
+                *(
+                    {
+                        "type": "input_image",
+                        "image_url": image_url,
+                        "detail": "auto",
+                    }
+                    for image_url in image_urls
+                ),
+                {"type": "input_text", "text": "What's in this image?"},
+            ],
+        }
+    ]
 
     if len(image_urls) > MAXIMUM_IMAGES:
         with pytest.raises(openai.BadRequestError):  # test multi-image input
@@ -157,10 +155,12 @@ async def test_multi_image_input(client: openai.AsyncOpenAI, model_name: str,
         # the server should still work afterwards
         response = await client.responses.create(
             model=model_name,
-            input=[{
-                "role": "user",
-                "content": "What's the weather like in Paris today?",
-            }],
+            input=[
+                {
+                    "role": "user",
+                    "content": "What's the weather like in Paris today?",
+                }
+            ],
         )
         assert len(response.output_text) > 0
     else:
diff --git a/tests/v1/entrypoints/openai/responses/test_stateful.py b/tests/v1/entrypoints/openai/responses/test_stateful.py
index a2d581ef7ced..6f7edb6bd7e7 100644
--- a/tests/v1/entrypoints/openai/responses/test_stateful.py
+++ b/tests/v1/entrypoints/openai/responses/test_stateful.py
@@ -24,8 +24,7 @@ async def test_store(client: openai.AsyncOpenAI):
     assert response.status == "completed"
 
     # The response should not be found.
-    with pytest.raises(openai.NotFoundError,
-                       match="Response with id .* not found."):
+    with pytest.raises(openai.NotFoundError, match="Response with id .* not found."):
         await client.responses.retrieve(response.id)
 
 
@@ -53,8 +52,8 @@ async def test_background(client: openai.AsyncOpenAI):
 @pytest.mark.asyncio
 async def test_background_error(client: openai.AsyncOpenAI):
     with pytest.raises(
-            openai.BadRequestError,
-            match="background can only be used when `store` is true"):
+        openai.BadRequestError, match="background can only be used when `store` is true"
+    ):
         _ = await client.responses.create(
             input="What is 13 * 24?",
             background=True,
@@ -87,8 +86,9 @@ async def test_cancel_completed(client: openai.AsyncOpenAI):
     response = await client.responses.create(input="Hello")
     assert response.status == "completed"
 
-    with pytest.raises(openai.BadRequestError,
-                       match="Cannot cancel a synchronous response."):
+    with pytest.raises(
+        openai.BadRequestError, match="Cannot cancel a synchronous response."
+    ):
         await client.responses.cancel(response.id)
 
 
@@ -97,7 +97,8 @@ async def test_previous_response_id(client: openai.AsyncOpenAI):
     response1 = await client.responses.create(
         instructions="You are tested on your ability to retrieve the correct "
         "information from the previous response.",
-        input="Hello, my name is John.")
+        input="Hello, my name is John.",
+    )
 
     response2 = await client.responses.create(
         input="Actually, my name is not John. My real name is Mark.",
@@ -118,7 +119,8 @@ async def test_two_responses_with_same_prev_id(client: openai.AsyncOpenAI):
     response1 = await client.responses.create(
         instructions="You are tested on your ability to retrieve the correct "
         "information from the previous response.",
-        input="Hello, my name is John.")
+        input="Hello, my name is John.",
+    )
 
     # Both response 2 and 3 use response 1 as the previous response.
     response2 = client.responses.create(
diff --git a/tests/v1/entrypoints/openai/responses/test_structured_output.py b/tests/v1/entrypoints/openai/responses/test_structured_output.py
index c4c43a87b601..db8b87768e44 100644
--- a/tests/v1/entrypoints/openai/responses/test_structured_output.py
+++ b/tests/v1/entrypoints/openai/responses/test_structured_output.py
@@ -11,14 +11,10 @@
 async def test_structured_output(client: openai.AsyncOpenAI):
     response = await client.responses.create(
         input=[
-            {
-                "role": "system",
-                "content": "Extract the event information."
-            },
+            {"role": "system", "content": "Extract the event information."},
             {
                 "role": "user",
-                "content":
-                "Alice and Bob are going to a science fair on Friday.",
+                "content": "Alice and Bob are going to a science fair on Friday.",
             },
         ],
         text={
@@ -28,18 +24,9 @@ async def test_structured_output(client: openai.AsyncOpenAI):
                 "schema": {
                     "type": "object",
                     "properties": {
-                        "event_name": {
-                            "type": "string"
-                        },
-                        "date": {
-                            "type": "string"
-                        },
-                        "participants": {
-                            "type": "array",
-                            "items": {
-                                "type": "string"
-                            }
-                        },
+                        "event_name": {"type": "string"},
+                        "date": {"type": "string"},
+                        "participants": {"type": "array", "items": {"type": "string"}},
                     },
                     "required": ["event_name", "date", "participants"],
                     "additionalProperties": False,
@@ -65,7 +52,6 @@ async def test_structured_output(client: openai.AsyncOpenAI):
 
 @pytest.mark.asyncio
 async def test_structured_output_with_parse(client: openai.AsyncOpenAI):
-
     class CalendarEvent(BaseModel):
         event_name: str
         date: str
diff --git a/tests/v1/entrypoints/openai/test_chat_completion.py b/tests/v1/entrypoints/openai/test_chat_completion.py
index 9aa285aa9b18..522c72b55955 100644
--- a/tests/v1/entrypoints/openai/test_chat_completion.py
+++ b/tests/v1/entrypoints/openai/test_chat_completion.py
@@ -40,8 +40,7 @@ async def client(server):
     "model_name",
     [MODEL_NAME],
 )
-async def test_invalid_json_schema(client: openai.AsyncOpenAI,
-                                   model_name: str) -> None:
+async def test_invalid_json_schema(client: openai.AsyncOpenAI, model_name: str) -> None:
     invalid_json_schema = {
         "$defs": {
             "CarType": {
@@ -51,35 +50,29 @@ async def test_invalid_json_schema(client: openai.AsyncOpenAI,
             }
         },
         "properties": {
-            "brand": {
-                "title": "Brand",
-                "type": "string"
-            },
-            "model": {
-                "title": "Model",
-                "type": "string"
-            },
-            "car_type": {
-                "$ref": "#/$defs/CarType"
-            },
+            "brand": {"title": "Brand", "type": "string"},
+            "model": {"title": "Model", "type": "string"},
+            "car_type": {"$ref": "#/$defs/CarType"},
             "foo": "bar",
         },
         "required": ["brand", "model", "car_type"],
         "title": "CarDescription",
         "type": "object",
     }
-    prompt = ("Generate a JSON with the brand, model and car_type of"
-              "the most iconic car from the 90's")
+    prompt = (
+        "Generate a JSON with the brand, model and car_type of"
+        "the most iconic car from the 90's"
+    )
     with pytest.raises((openai.BadRequestError, openai.APIError)):
         await client.chat.completions.create(
             model=model_name,
-            messages=[{
-                "role": "user",
-                "content": prompt,
-            }],
-            extra_body={"structured_outputs": {
-                "json": invalid_json_schema
-            }},
+            messages=[
+                {
+                    "role": "user",
+                    "content": prompt,
+                }
+            ],
+            extra_body={"structured_outputs": {"json": invalid_json_schema}},
         )
 
 
@@ -89,23 +82,22 @@ async def test_invalid_json_schema(client: openai.AsyncOpenAI,
     [MODEL_NAME],
 )
 async def test_invalid_regex(client: openai.AsyncOpenAI, model_name: str):
-    prompt = ("Generate an email address for Alan Turing, who works in Enigma."
-              "End in .com and new line. Example result:"
-              "alan.turing@enigma.com\n")
+    prompt = (
+        "Generate an email address for Alan Turing, who works in Enigma."
+        "End in .com and new line. Example result:"
+        "alan.turing@enigma.com\n"
+    )
 
     with pytest.raises((openai.BadRequestError, openai.APIError)):
         await client.chat.completions.create(
             model=model_name,
-            messages=[{
-                "role": "user",
-                "content": prompt,
-            }],
-            extra_body={
-                "structured_outputs": {
-                    "regex": r"[.*"
-                },
-                "stop": ["\n"]
-            },
+            messages=[
+                {
+                    "role": "user",
+                    "content": prompt,
+                }
+            ],
+            extra_body={"structured_outputs": {"regex": r"[.*"}, "stop": ["\n"]},
         )
 
 
@@ -129,18 +121,20 @@ async def test_invalid_grammar(client: openai.AsyncOpenAI, model_name: str):
         number ::= "1 " | "2 "
     """
 
-    prompt = ("Generate an SQL query to show the 'username' and 'email'"
-              "from the 'users' table.")
+    prompt = (
+        "Generate an SQL query to show the 'username' and 'email'"
+        "from the 'users' table."
+    )
     with pytest.raises((openai.BadRequestError, openai.APIError)):
         await client.chat.completions.create(
             model=model_name,
-            messages=[{
-                "role": "user",
-                "content": prompt,
-            }],
-            extra_body={
-                "structured_outputs": {
-                    "grammar": invalid_simplified_sql_grammar
+            messages=[
+                {
+                    "role": "user",
+                    "content": prompt,
                 }
+            ],
+            extra_body={
+                "structured_outputs": {"grammar": invalid_simplified_sql_grammar}
             },
         )
diff --git a/tests/v1/entrypoints/openai/test_completion.py b/tests/v1/entrypoints/openai/test_completion.py
index 9090beb4bbd2..35287f5b979a 100644
--- a/tests/v1/entrypoints/openai/test_completion.py
+++ b/tests/v1/entrypoints/openai/test_completion.py
@@ -31,12 +31,13 @@ def default_server_args():
     ]
 
 
-@pytest.fixture(scope="module",
-                params=[["--no-enable-prefix-caching"],
-                        [
-                            "--no-enable-prefix-caching",
-                            "--disable-frontend-multiprocessing"
-                        ]])
+@pytest.fixture(
+    scope="module",
+    params=[
+        ["--no-enable-prefix-caching"],
+        ["--no-enable-prefix-caching", "--disable-frontend-multiprocessing"],
+    ],
+)
 def server(default_server_args, request):
     if request.param:
         default_server_args = default_server_args + request.param
@@ -55,12 +56,10 @@ async def client(server):
     "model_name",
     [MODEL_NAME],
 )
-async def test_single_completion(client: openai.AsyncOpenAI,
-                                 model_name: str) -> None:
-    completion = await client.completions.create(model=model_name,
-                                                 prompt="Hello, my name is",
-                                                 max_tokens=5,
-                                                 temperature=0.0)
+async def test_single_completion(client: openai.AsyncOpenAI, model_name: str) -> None:
+    completion = await client.completions.create(
+        model=model_name, prompt="Hello, my name is", max_tokens=5, temperature=0.0
+    )
 
     assert completion.id is not None
     assert completion.choices is not None and len(completion.choices) == 1
@@ -69,7 +68,8 @@ async def test_single_completion(client: openai.AsyncOpenAI,
     assert len(choice.text) >= 5
     assert choice.finish_reason == "length"
     assert completion.usage == openai.types.CompletionUsage(
-        completion_tokens=5, prompt_tokens=6, total_tokens=11)
+        completion_tokens=5, prompt_tokens=6, total_tokens=11
+    )
 
     # test using token IDs
     completion = await client.completions.create(
@@ -147,11 +147,12 @@ async def test_some_logprobs(client: openai.AsyncOpenAI, model_name: str):
     "model_name",
     [MODEL_NAME],
 )
-async def test_too_many_completion_logprobs(client: openai.AsyncOpenAI,
-                                            model_name: str) -> None:
-
+async def test_too_many_completion_logprobs(
+    client: openai.AsyncOpenAI, model_name: str
+) -> None:
     with pytest.raises(
-        (openai.BadRequestError, openai.APIError)):  # test using token IDs
+        (openai.BadRequestError, openai.APIError)
+    ):  # test using token IDs
         await client.completions.create(
             model=model_name,
             prompt=[0, 0, 0, 0, 0],
@@ -163,7 +164,8 @@ async def test_too_many_completion_logprobs(client: openai.AsyncOpenAI,
         )
         ...
     with pytest.raises(
-        (openai.BadRequestError, openai.APIError)):  # test using token IDs
+        (openai.BadRequestError, openai.APIError)
+    ):  # test using token IDs
         stream = await client.completions.create(
             model=model_name,
             prompt=[0, 0, 0, 0, 0],
@@ -188,13 +190,13 @@ async def test_too_many_completion_logprobs(client: openai.AsyncOpenAI,
 
 
 @pytest.mark.asyncio
-@pytest.mark.parametrize("model_name, prompt_logprobs", [(MODEL_NAME, -1),
-                                                         (MODEL_NAME, 0),
-                                                         (MODEL_NAME, 1),
-                                                         (MODEL_NAME, None)])
-async def test_prompt_logprobs_completion(client: openai.AsyncOpenAI,
-                                          model_name: str,
-                                          prompt_logprobs: Optional[int]):
+@pytest.mark.parametrize(
+    "model_name, prompt_logprobs",
+    [(MODEL_NAME, -1), (MODEL_NAME, 0), (MODEL_NAME, 1), (MODEL_NAME, None)],
+)
+async def test_prompt_logprobs_completion(
+    client: openai.AsyncOpenAI, model_name: str, prompt_logprobs: Optional[int]
+):
     params: dict = {
         "prompt": ["A robot may not injure another robot", "My name is"],
         "model": model_name,
@@ -223,8 +225,9 @@ async def test_prompt_logprobs_completion(client: openai.AsyncOpenAI,
     "model_name",
     [MODEL_NAME],
 )
-async def test_completion_streaming(client: openai.AsyncOpenAI,
-                                    model_name: str) -> None:
+async def test_completion_streaming(
+    client: openai.AsyncOpenAI, model_name: str
+) -> None:
     prompt = "What is an LLM?"
 
     single_completion = await client.completions.create(
@@ -234,11 +237,9 @@ async def test_completion_streaming(client: openai.AsyncOpenAI,
         temperature=0.0,
     )
     single_output = single_completion.choices[0].text
-    stream = await client.completions.create(model=model_name,
-                                             prompt=prompt,
-                                             max_tokens=5,
-                                             temperature=0.0,
-                                             stream=True)
+    stream = await client.completions.create(
+        model=model_name, prompt=prompt, max_tokens=5, temperature=0.0, stream=True
+    )
     chunks: list[str] = []
     finish_reason_count = 0
     async for chunk in stream:
@@ -257,8 +258,7 @@ async def test_completion_streaming(client: openai.AsyncOpenAI,
     "model_name",
     [MODEL_NAME],
 )
-async def test_parallel_no_streaming(client: openai.AsyncOpenAI,
-                                     model_name: str):
+async def test_parallel_no_streaming(client: openai.AsyncOpenAI, model_name: str):
     """Parallel sampling without streaming.
     A single request output contains a list of completions.
     """
@@ -268,27 +268,26 @@ async def test_parallel_no_streaming(client: openai.AsyncOpenAI,
     max_tokens = 50  # we want some to finish earlier than others
 
     # High temperature to maximize chance of unique completions.
-    completion = await client.completions.create(model=model_name,
-                                                 prompt=prompt,
-                                                 max_tokens=max_tokens,
-                                                 n=n,
-                                                 temperature=1.0,
-                                                 stream=False,
-                                                 logprobs=0,
-                                                 seed=42)
+    completion = await client.completions.create(
+        model=model_name,
+        prompt=prompt,
+        max_tokens=max_tokens,
+        n=n,
+        temperature=1.0,
+        stream=False,
+        logprobs=0,
+        seed=42,
+    )
 
     # Assert `n` completions
     num_completions = len(completion.choices)
-    assert num_completions == n, (
-        f"Num completions {num_completions} but expected {n}.")
+    assert num_completions == n, f"Num completions {num_completions} but expected {n}."
     completion_repeats: dict[str, int] = {}
     output_token_lengths = set()
     for idx, choice in enumerate(completion.choices):
         # Assert correct completion index & some finish reason.
-        assert choice.index == idx, (
-            f"Index {choice.index} but expected {idx}.")
-        assert choice.finish_reason is not None, (
-            "None finish_reason is invalid.")
+        assert choice.index == idx, f"Index {choice.index} but expected {idx}."
+        assert choice.finish_reason is not None, "None finish_reason is invalid."
         text = choice.text
         completion_repeats[text] = completion_repeats.get(text, 0) + 1
         output_token_lengths.add(len(choice.logprobs.tokens))
@@ -297,13 +296,10 @@ async def test_parallel_no_streaming(client: openai.AsyncOpenAI,
     # Assert `n` unique completions
     num_unique = len(completion_repeats)
     if num_unique != n:
-        repeats = {
-            txt: num
-            for (txt, num) in completion_repeats.items() if num > 1
-        }
+        repeats = {txt: num for (txt, num) in completion_repeats.items() if num > 1}
         raise AssertionError(
-            f"Expected {n} unique completions, got {num_unique};"
-            f" repeats: {repeats}.")
+            f"Expected {n} unique completions, got {num_unique}; repeats: {repeats}."
+        )
 
 
 @pytest.mark.asyncio
@@ -321,13 +317,15 @@ async def test_parallel_streaming(client: openai.AsyncOpenAI, model_name: str):
     n = 3
     max_tokens = 50  # we want some to finish earlier than others
 
-    stream = await client.completions.create(model=model_name,
-                                             prompt=prompt,
-                                             max_tokens=max_tokens,
-                                             n=n,
-                                             temperature=1.0,
-                                             stream=True,
-                                             seed=42)
+    stream = await client.completions.create(
+        model=model_name,
+        prompt=prompt,
+        max_tokens=max_tokens,
+        n=n,
+        temperature=1.0,
+        stream=True,
+        seed=42,
+    )
     chunks: list[list[str]] = [[] for _ in range(n)]
     finish_reason_count = 0
     async for chunk in stream:
@@ -338,7 +336,8 @@ async def test_parallel_streaming(client: openai.AsyncOpenAI, model_name: str):
             finish_reason_count += 1
     # Assert `n` completions with correct finish reasons
     assert finish_reason_count == n, (
-        f"Expected {n} completions with valid indices and finish_reason.")
+        f"Expected {n} completions with valid indices and finish_reason."
+    )
     completion_repeats: dict[str, int] = {}
     chunk_lengths = set()
     for chunk in chunks:
@@ -346,7 +345,8 @@ async def test_parallel_streaming(client: openai.AsyncOpenAI, model_name: str):
         # Assert correct number of completion tokens
         chunk_lengths.add(chunk_len)
         assert chunk_len <= max_tokens, (
-            f"max_tokens={max_tokens} but chunk len is {chunk_len}.")
+            f"max_tokens={max_tokens} but chunk len is {chunk_len}."
+        )
         text = "".join(chunk)
         completion_repeats[text] = completion_repeats.get(text, 0) + 1
         print(text)
@@ -355,12 +355,10 @@ async def test_parallel_streaming(client: openai.AsyncOpenAI, model_name: str):
     # Assert `n` unique completions
     num_unique = len(completion_repeats)
     if num_unique != n:
-        repeats = {
-            txt: num
-            for (txt, num) in completion_repeats.items() if num > 1
-        }
-        raise AssertionError(f"{num_unique} unique completions, expected {n};"
-                             f" repeats: {repeats}")
+        repeats = {txt: num for (txt, num) in completion_repeats.items() if num > 1}
+        raise AssertionError(
+            f"{num_unique} unique completions, expected {n}; repeats: {repeats}"
+        )
 
 
 @pytest.mark.asyncio
@@ -368,53 +366,55 @@ async def test_parallel_streaming(client: openai.AsyncOpenAI, model_name: str):
     "model_name",
     [MODEL_NAME],
 )
-async def test_completion_stream_options(client: openai.AsyncOpenAI,
-                                         model_name: str):
+async def test_completion_stream_options(client: openai.AsyncOpenAI, model_name: str):
     prompt = "What is the capital of France?"
 
     # Test stream=True, stream_options=
     #     {"include_usage": False, "continuous_usage_stats": False}
-    stream = await client.completions.create(model=model_name,
-                                             prompt=prompt,
-                                             max_tokens=5,
-                                             temperature=0.0,
-                                             stream=True,
-                                             stream_options={
-                                                 "include_usage": False,
-                                                 "continuous_usage_stats":
-                                                 False,
-                                             })
+    stream = await client.completions.create(
+        model=model_name,
+        prompt=prompt,
+        max_tokens=5,
+        temperature=0.0,
+        stream=True,
+        stream_options={
+            "include_usage": False,
+            "continuous_usage_stats": False,
+        },
+    )
 
     async for chunk in stream:
         assert chunk.usage is None
 
     # Test stream=True, stream_options=
     #     {"include_usage": False, "continuous_usage_stats": True}
-    stream = await client.completions.create(model=model_name,
-                                             prompt=prompt,
-                                             max_tokens=5,
-                                             temperature=0.0,
-                                             stream=True,
-                                             stream_options={
-                                                 "include_usage": False,
-                                                 "continuous_usage_stats":
-                                                 True,
-                                             })
+    stream = await client.completions.create(
+        model=model_name,
+        prompt=prompt,
+        max_tokens=5,
+        temperature=0.0,
+        stream=True,
+        stream_options={
+            "include_usage": False,
+            "continuous_usage_stats": True,
+        },
+    )
     async for chunk in stream:
         assert chunk.usage is None
 
     # Test stream=True, stream_options=
     #     {"include_usage": True, "continuous_usage_stats": False}
-    stream = await client.completions.create(model=model_name,
-                                             prompt=prompt,
-                                             max_tokens=5,
-                                             temperature=0.0,
-                                             stream=True,
-                                             stream_options={
-                                                 "include_usage": True,
-                                                 "continuous_usage_stats":
-                                                 False,
-                                             })
+    stream = await client.completions.create(
+        model=model_name,
+        prompt=prompt,
+        max_tokens=5,
+        temperature=0.0,
+        stream=True,
+        stream_options={
+            "include_usage": True,
+            "continuous_usage_stats": False,
+        },
+    )
     async for chunk in stream:
         if chunk.choices[0].finish_reason is None:
             assert chunk.usage is None
@@ -425,57 +425,63 @@ async def test_completion_stream_options(client: openai.AsyncOpenAI,
             assert final_chunk.usage.prompt_tokens > 0
             assert final_chunk.usage.completion_tokens > 0
             assert final_chunk.usage.total_tokens == (
-                final_chunk.usage.prompt_tokens +
-                final_chunk.usage.completion_tokens)
+                final_chunk.usage.prompt_tokens + final_chunk.usage.completion_tokens
+            )
             assert final_chunk.choices == []
 
     # Test stream=True, stream_options=
     #     {"include_usage": True, "continuous_usage_stats": True}
-    stream = await client.completions.create(model=model_name,
-                                             prompt=prompt,
-                                             max_tokens=5,
-                                             temperature=0.0,
-                                             stream=True,
-                                             stream_options={
-                                                 "include_usage": True,
-                                                 "continuous_usage_stats":
-                                                 True,
-                                             })
+    stream = await client.completions.create(
+        model=model_name,
+        prompt=prompt,
+        max_tokens=5,
+        temperature=0.0,
+        stream=True,
+        stream_options={
+            "include_usage": True,
+            "continuous_usage_stats": True,
+        },
+    )
     async for chunk in stream:
         assert chunk.usage is not None
         assert chunk.usage.prompt_tokens > 0
         assert chunk.usage.completion_tokens > 0
-        assert chunk.usage.total_tokens == (chunk.usage.prompt_tokens +
-                                            chunk.usage.completion_tokens)
+        assert chunk.usage.total_tokens == (
+            chunk.usage.prompt_tokens + chunk.usage.completion_tokens
+        )
         if chunk.choices[0].finish_reason is not None:
             final_chunk = await stream.__anext__()
             assert final_chunk.usage is not None
             assert final_chunk.usage.prompt_tokens > 0
             assert final_chunk.usage.completion_tokens > 0
             assert final_chunk.usage.total_tokens == (
-                final_chunk.usage.prompt_tokens +
-                final_chunk.usage.completion_tokens)
+                final_chunk.usage.prompt_tokens + final_chunk.usage.completion_tokens
+            )
             assert final_chunk.choices == []
 
     # Test stream=False, stream_options=
     #     {"include_usage": None}
     with pytest.raises(BadRequestError):
-        await client.completions.create(model=model_name,
-                                        prompt=prompt,
-                                        max_tokens=5,
-                                        temperature=0.0,
-                                        stream=False,
-                                        stream_options={"include_usage": None})
+        await client.completions.create(
+            model=model_name,
+            prompt=prompt,
+            max_tokens=5,
+            temperature=0.0,
+            stream=False,
+            stream_options={"include_usage": None},
+        )
 
     # Test stream=False, stream_options=
     #    {"include_usage": True}
     with pytest.raises(BadRequestError):
-        await client.completions.create(model=model_name,
-                                        prompt=prompt,
-                                        max_tokens=5,
-                                        temperature=0.0,
-                                        stream=False,
-                                        stream_options={"include_usage": True})
+        await client.completions.create(
+            model=model_name,
+            prompt=prompt,
+            max_tokens=5,
+            temperature=0.0,
+            stream=False,
+            stream_options={"include_usage": True},
+        )
 
     # Test stream=False, stream_options=
     #     {"continuous_usage_stats": None}
@@ -486,7 +492,8 @@ async def test_completion_stream_options(client: openai.AsyncOpenAI,
             max_tokens=5,
             temperature=0.0,
             stream=False,
-            stream_options={"continuous_usage_stats": None})
+            stream_options={"continuous_usage_stats": None},
+        )
 
     # Test stream=False, stream_options=
     #    {"continuous_usage_stats": True}
@@ -497,7 +504,8 @@ async def test_completion_stream_options(client: openai.AsyncOpenAI,
             max_tokens=5,
             temperature=0.0,
             stream=False,
-            stream_options={"continuous_usage_stats": True})
+            stream_options={"continuous_usage_stats": True},
+        )
 
 
 @pytest.mark.asyncio
@@ -528,15 +536,19 @@ async def test_batch_completions(client: openai.AsyncOpenAI, model_name: str):
             extra_body=dict(
                 # NOTE: this has to be true for n > 1 in vLLM, but
                 # not necessary for official client.
-                use_beam_search=True),
+                use_beam_search=True
+            ),
         )
         assert len(batch.choices) == 4
-        assert batch.choices[0].text != batch.choices[
-            1].text, "beam search should be different"
-        assert batch.choices[0].text == batch.choices[
-            2].text, "two copies of the same prompt should be the same"
-        assert batch.choices[1].text == batch.choices[
-            3].text, "two copies of the same prompt should be the same"
+        assert batch.choices[0].text != batch.choices[1].text, (
+            "beam search should be different"
+        )
+        assert batch.choices[0].text == batch.choices[2].text, (
+            "two copies of the same prompt should be the same"
+        )
+        assert batch.choices[1].text == batch.choices[3].text, (
+            "two copies of the same prompt should be the same"
+        )
 
         # test streaming
         batch = await client.completions.create(
@@ -560,31 +572,30 @@ async def test_batch_completions(client: openai.AsyncOpenAI, model_name: str):
     [MODEL_NAME],
 )
 @pytest.mark.parametrize("logprobs_arg", [1, 0])
-async def test_echo_logprob_completion(client: openai.AsyncOpenAI,
-                                       model_name: str, logprobs_arg: int):
+async def test_echo_logprob_completion(
+    client: openai.AsyncOpenAI, model_name: str, logprobs_arg: int
+):
     tokenizer = get_tokenizer(tokenizer_name=MODEL_NAME)
     # test using text and token IDs
     for prompt in ("Hello, my name is", [0, 0, 0, 0, 0]):
-        completion = await client.completions.create(model=model_name,
-                                                     prompt=prompt,
-                                                     max_tokens=5,
-                                                     temperature=0.0,
-                                                     echo=True,
-                                                     logprobs=logprobs_arg)
-
-        prompt_text = tokenizer.decode(prompt) if isinstance(prompt,
-                                                             list) else prompt
+        completion = await client.completions.create(
+            model=model_name,
+            prompt=prompt,
+            max_tokens=5,
+            temperature=0.0,
+            echo=True,
+            logprobs=logprobs_arg,
+        )
+
+        prompt_text = tokenizer.decode(prompt) if isinstance(prompt, list) else prompt
         assert re.search(r"^" + prompt_text, completion.choices[0].text)
         logprobs = completion.choices[0].logprobs
         assert logprobs is not None
         assert len(logprobs.text_offset) > 5
-        assert (len(logprobs.token_logprobs) > 5
-                and logprobs.token_logprobs[0] is None)
-        assert (len(logprobs.top_logprobs) > 5
-                and logprobs.top_logprobs[0] is None)
+        assert len(logprobs.token_logprobs) > 5 and logprobs.token_logprobs[0] is None
+        assert len(logprobs.top_logprobs) > 5 and logprobs.top_logprobs[0] is None
         for top_logprobs in logprobs.top_logprobs[1:]:
-            assert max(logprobs_arg,
-                       1) <= len(top_logprobs) <= logprobs_arg + 1
+            assert max(logprobs_arg, 1) <= len(top_logprobs) <= logprobs_arg + 1
         assert len(logprobs.tokens) > 5
 
 
@@ -593,8 +604,7 @@ async def test_echo_logprob_completion(client: openai.AsyncOpenAI,
     "model_name",
     [MODEL_NAME],
 )
-async def test_invalid_json_schema(client: openai.AsyncOpenAI,
-                                   model_name: str) -> None:
+async def test_invalid_json_schema(client: openai.AsyncOpenAI, model_name: str) -> None:
     invalid_json_schema = {
         "$defs": {
             "CarType": {
@@ -604,32 +614,24 @@ async def test_invalid_json_schema(client: openai.AsyncOpenAI,
             }
         },
         "properties": {
-            "brand": {
-                "title": "Brand",
-                "type": "string"
-            },
-            "model": {
-                "title": "Model",
-                "type": "string"
-            },
-            "car_type": {
-                "$ref": "#/$defs/CarType"
-            },
+            "brand": {"title": "Brand", "type": "string"},
+            "model": {"title": "Model", "type": "string"},
+            "car_type": {"$ref": "#/$defs/CarType"},
             "foo": "bar",
         },
         "required": ["brand", "model", "car_type"],
         "title": "CarDescription",
         "type": "object",
     }
-    prompt = ("Generate a JSON with the brand, model and car_type of"
-              "the most iconic car from the 90's")
+    prompt = (
+        "Generate a JSON with the brand, model and car_type of"
+        "the most iconic car from the 90's"
+    )
     with pytest.raises((openai.BadRequestError, openai.APIError)):
         await client.completions.create(
             model=model_name,
             prompt=prompt,
-            extra_body={"structured_outputs": {
-                "json": invalid_json_schema
-            }},
+            extra_body={"structured_outputs": {"json": invalid_json_schema}},
         )
 
 
@@ -639,20 +641,17 @@ async def test_invalid_json_schema(client: openai.AsyncOpenAI,
     [MODEL_NAME],
 )
 async def test_invalid_regex(client: openai.AsyncOpenAI, model_name: str):
-    prompt = ("Generate an email address for Alan Turing, who works in Enigma."
-              "End in .com and new line. Example result:"
-              "alan.turing@enigma.com\n")
+    prompt = (
+        "Generate an email address for Alan Turing, who works in Enigma."
+        "End in .com and new line. Example result:"
+        "alan.turing@enigma.com\n"
+    )
 
     with pytest.raises((openai.BadRequestError, openai.APIError)):
         await client.completions.create(
             model=model_name,
             prompt=prompt,
-            extra_body={
-                "structured_outputs": {
-                    "regex": r"[.*"
-                },
-                "stop": ["\n"]
-            },
+            extra_body={"structured_outputs": {"regex": r"[.*"}, "stop": ["\n"]},
         )
 
 
@@ -676,29 +675,29 @@ async def test_invalid_grammar(client: openai.AsyncOpenAI, model_name: str):
         number ::= "1 " | "2 "
     """
 
-    prompt = ("Generate an SQL query to show the 'username' and 'email'"
-              "from the 'users' table.")
+    prompt = (
+        "Generate an SQL query to show the 'username' and 'email'"
+        "from the 'users' table."
+    )
     with pytest.raises((openai.BadRequestError, openai.APIError)):
         await client.completions.create(
             model=model_name,
             prompt=prompt,
             extra_body={
-                "structured_outputs": {
-                    "grammar": invalid_simplified_sql_grammar
-                }
+                "structured_outputs": {"grammar": invalid_simplified_sql_grammar}
             },
         )
 
 
 @pytest.mark.asyncio
-async def test_completion_with_empty_prompt_embeds(
-        client: openai.AsyncOpenAI) -> None:
+async def test_completion_with_empty_prompt_embeds(client: openai.AsyncOpenAI) -> None:
     """Test completion with empty prompt embeds."""
     payload: dict[str, object] = {"prompt": "Hello", "prompt_embeds": []}
     headers: dict[str, str] = {"Content-Type": "application/json"}
     # base_url = http://localhost:8000/v1/completions
-    response = requests.post(f"{client.base_url}completions",
-                             headers=headers,
-                             json=payload)
+    response = requests.post(
+        f"{client.base_url}completions", headers=headers, json=payload
+    )
     assert response.status_code == 200, (
-        f"Expected status code 200, got {response.status_code}. ")
+        f"Expected status code 200, got {response.status_code}. "
+    )
diff --git a/tests/v1/entrypoints/openai/test_completion_with_image_embeds.py b/tests/v1/entrypoints/openai/test_completion_with_image_embeds.py
index 41f1d02bf787..3c2b3de33958 100644
--- a/tests/v1/entrypoints/openai/test_completion_with_image_embeds.py
+++ b/tests/v1/entrypoints/openai/test_completion_with_image_embeds.py
@@ -37,9 +37,9 @@ def default_image_embeds_server_args() -> list[str]:
 
 @pytest.fixture(scope="module")
 def server_with_image_embeds(default_image_embeds_server_args):
-    with RemoteOpenAIServer(MODEL_NAME,
-                            default_image_embeds_server_args,
-                            max_wait_seconds=600) as remote_server:
+    with RemoteOpenAIServer(
+        MODEL_NAME, default_image_embeds_server_args, max_wait_seconds=600
+    ) as remote_server:
         yield remote_server
 
 
@@ -57,7 +57,7 @@ def encode_image_embedding_to_base64(image_embedding) -> str:
     torch.save(image_embedding, buffer)
     buffer.seek(0)
     binary_data = buffer.read()
-    base64_image_embedding = base64.b64encode(binary_data).decode('utf-8')
+    base64_image_embedding = base64.b64encode(binary_data).decode("utf-8")
     return base64_image_embedding
 
 
@@ -75,19 +75,13 @@ async def test_completions_with_image_embeds(
     base64_image_embedding = encode_image_embedding_to_base64(image_embeds)
     chat_completion = await client_with_image_embeds.chat.completions.create(
         messages=[
+            {"role": "system", "content": "You are a helpful assistant."},
             {
-                "role": "system",
-                "content": "You are a helpful assistant."
-            },
-            {
-                "role":
-                "user",
+                "role": "user",
                 "content": [
                     {
-                        "type":
-                        "text",
-                        "text":
-                        "Describe these images separately. For each image,"
+                        "type": "text",
+                        "text": "Describe these images separately. For each image,"
                         "reply with a short sentence (no more than 10 words).",
                     },
                     {
diff --git a/tests/v1/entrypoints/openai/test_multi_api_servers.py b/tests/v1/entrypoints/openai/test_multi_api_servers.py
index 35f75191d9c8..55328f0cf0f0 100644
--- a/tests/v1/entrypoints/openai/test_multi_api_servers.py
+++ b/tests/v1/entrypoints/openai/test_multi_api_servers.py
@@ -50,16 +50,13 @@ async def client(server):
     "model_name",
     [MODEL_NAME],
 )
-async def test_single_completion(client: openai.AsyncOpenAI,
-                                 server: RemoteOpenAIServer,
-                                 model_name: str) -> None:
-
+async def test_single_completion(
+    client: openai.AsyncOpenAI, server: RemoteOpenAIServer, model_name: str
+) -> None:
     async def make_request():
         completion = await client.completions.create(
-            model=model_name,
-            prompt="Hello, my name is",
-            max_tokens=10,
-            temperature=1.0)
+            model=model_name, prompt="Hello, my name is", max_tokens=10, temperature=1.0
+        )
 
         assert completion.id is not None
         assert completion.choices is not None and len(completion.choices) == 1
@@ -108,9 +105,9 @@ async def make_request():
     "model_name",
     [MODEL_NAME],
 )
-async def test_completion_streaming(client: openai.AsyncOpenAI,
-                                    server: RemoteOpenAIServer,
-                                    model_name: str) -> None:
+async def test_completion_streaming(
+    client: openai.AsyncOpenAI, server: RemoteOpenAIServer, model_name: str
+) -> None:
     prompt = "What is an LLM?"
 
     async def make_streaming_request():
@@ -124,11 +121,9 @@ async def make_streaming_request():
         single_output = single_completion.choices[0].text
 
         # Perform the streaming request
-        stream = await client.completions.create(model=model_name,
-                                                 prompt=prompt,
-                                                 max_tokens=5,
-                                                 temperature=0.0,
-                                                 stream=True)
+        stream = await client.completions.create(
+            model=model_name, prompt=prompt, max_tokens=5, temperature=0.0, stream=True
+        )
         chunks: list[str] = []
         finish_reason_count = 0
         last_chunk = None
@@ -139,16 +134,15 @@ async def make_streaming_request():
             last_chunk = chunk  # Keep track of the last chunk
 
         # finish reason should only return in the last block for OpenAI API
-        assert finish_reason_count == 1, (
-            "Finish reason should appear exactly once.")
-        assert last_chunk is not None, (
-            "Stream should have yielded at least one chunk.")
-        assert last_chunk.choices[
-            0].finish_reason == "length", "Finish reason should be 'length'."
+        assert finish_reason_count == 1, "Finish reason should appear exactly once."
+        assert last_chunk is not None, "Stream should have yielded at least one chunk."
+        assert last_chunk.choices[0].finish_reason == "length", (
+            "Finish reason should be 'length'."
+        )
         # Check that the combined text matches the non-streamed version.
-        assert "".join(
-            chunks
-        ) == single_output, "Streamed output should match non-streamed output."
+        assert "".join(chunks) == single_output, (
+            "Streamed output should match non-streamed output."
+        )
         return True  # Indicate success for this request
 
     # Test single request
@@ -162,9 +156,9 @@ async def make_streaming_request():
     tasks = [make_streaming_request() for _ in range(num_requests)]
     results = await asyncio.gather(*tasks)
 
-    assert len(
-        results
-    ) == num_requests, f"Expected {num_requests} results, got {len(results)}"
+    assert len(results) == num_requests, (
+        f"Expected {num_requests} results, got {len(results)}"
+    )
     assert all(results), "Not all streaming requests completed successfully."
 
     await asyncio.sleep(0.5)
@@ -172,9 +166,9 @@ async def make_streaming_request():
     tasks = [make_streaming_request() for _ in range(num_requests)]
     results = await asyncio.gather(*tasks)
 
-    assert len(
-        results
-    ) == num_requests, f"Expected {num_requests} results, got {len(results)}"
+    assert len(results) == num_requests, (
+        f"Expected {num_requests} results, got {len(results)}"
+    )
     assert all(results), "Not all streaming requests completed successfully."
 
     # Check request balancing via Prometheus metrics if DP_SIZE > 1
diff --git a/tests/v1/executor/test_executor.py b/tests/v1/executor/test_executor.py
index 4e83e2f9d4b6..c8bcd62d6680 100644
--- a/tests/v1/executor/test_executor.py
+++ b/tests/v1/executor/test_executor.py
@@ -14,19 +14,19 @@
 from vllm.v1.executor.multiproc_executor import MultiprocExecutor
 
 
-class Mock:
-    ...
+class Mock: ...
 
 
 class CustomMultiprocExecutor(MultiprocExecutor):
-
-    def collective_rpc(self,
-                       method: Union[str, Callable],
-                       timeout: Optional[float] = None,
-                       args: tuple = (),
-                       kwargs: Optional[dict] = None,
-                       non_block: bool = False,
-                       unique_reply_rank: Optional[int] = None) -> list[Any]:
+    def collective_rpc(
+        self,
+        method: Union[str, Callable],
+        timeout: Optional[float] = None,
+        args: tuple = (),
+        kwargs: Optional[dict] = None,
+        non_block: bool = False,
+        unique_reply_rank: Optional[int] = None,
+    ) -> list[Any]:
         # Drop marker to show that this was run
         with open(".marker", "w"):
             ...
@@ -47,17 +47,22 @@ def test_custom_executor_type_checking():
         )
         LLMEngine.from_engine_args(engine_args)
     with pytest.raises(ValueError):
-        engine_args = AsyncEngineArgs(model=MODEL,
-                                      gpu_memory_utilization=0.2,
-                                      max_model_len=8192,
-                                      distributed_executor_backend=Mock)
+        engine_args = AsyncEngineArgs(
+            model=MODEL,
+            gpu_memory_utilization=0.2,
+            max_model_len=8192,
+            distributed_executor_backend=Mock,
+        )
         AsyncLLM.from_engine_args(engine_args)
 
 
-@pytest.mark.parametrize("distributed_executor_backend", [
-    CustomMultiprocExecutor,
-    "tests.v1.executor.test_executor.CustomMultiprocExecutor"
-])
+@pytest.mark.parametrize(
+    "distributed_executor_backend",
+    [
+        CustomMultiprocExecutor,
+        "tests.v1.executor.test_executor.CustomMultiprocExecutor",
+    ],
+)
 def test_custom_executor(distributed_executor_backend, tmp_path):
     cwd = os.path.abspath(".")
     os.chdir(tmp_path)
@@ -82,10 +87,13 @@ def test_custom_executor(distributed_executor_backend, tmp_path):
         os.chdir(cwd)
 
 
-@pytest.mark.parametrize("distributed_executor_backend", [
-    CustomMultiprocExecutorAsync,
-    "tests.v1.executor.test_executor.CustomMultiprocExecutorAsync"
-])
+@pytest.mark.parametrize(
+    "distributed_executor_backend",
+    [
+        CustomMultiprocExecutorAsync,
+        "tests.v1.executor.test_executor.CustomMultiprocExecutorAsync",
+    ],
+)
 def test_custom_executor_async(distributed_executor_backend, tmp_path):
     cwd = os.path.abspath(".")
     os.chdir(tmp_path)
@@ -103,9 +111,9 @@ def test_custom_executor_async(distributed_executor_backend, tmp_path):
         sampling_params = SamplingParams(max_tokens=1)
 
         async def t():
-            stream = engine.generate(request_id="0",
-                                     prompt="foo",
-                                     sampling_params=sampling_params)
+            stream = engine.generate(
+                request_id="0", prompt="foo", sampling_params=sampling_params
+            )
             async for x in stream:
                 ...
 
diff --git a/tests/v1/generation/test_batch_invariance.py b/tests/v1/generation/test_batch_invariance.py
index b864f9a31836..db1c757521f0 100644
--- a/tests/v1/generation/test_batch_invariance.py
+++ b/tests/v1/generation/test_batch_invariance.py
@@ -72,7 +72,7 @@ def test_v1_generation_is_deterministic_across_batch_sizes_with_needle():
     Notes:
     - Use seeded stochastic sampling with a fixed seed to test determinism.
     - Outputs are intentionally longer and sampled at higher temperature/top_p
-      to produce a more random-sounding phrase, yet remain deterministic by 
+      to produce a more random-sounding phrase, yet remain deterministic by
       seed.
     - Keep max_tokens and max_model_len bounded for speed and memory use.
     """
@@ -103,7 +103,7 @@ def test_v1_generation_is_deterministic_across_batch_sizes_with_needle():
         seed=20240919,
     )
 
-    needle_prompt = ("There once was a ")
+    needle_prompt = "There once was a "
 
     llm_bs1 = None
     llm_bsN = None
@@ -158,13 +158,16 @@ def test_v1_generation_is_deterministic_across_batch_sizes_with_needle():
 
         passes = num_trials - mismatches
         # Dump how many passed vs failed
-        print(f"[determinism] total={num_trials}, passed={passes}, "
-              f"failed={mismatches}, batch_size={batch_size}")
+        print(
+            f"[determinism] total={num_trials}, passed={passes}, "
+            f"failed={mismatches}, batch_size={batch_size}"
+        )
 
         if mismatches > 0:
             pytest.fail(
                 f"Nondeterministic outputs detected: {mismatches} failed out "
-                f"of {num_trials} trials (batch_size={batch_size}).")
+                f"of {num_trials} trials (batch_size={batch_size})."
+            )
 
     finally:
         # Ensure engines are shutdown to free GPU/VRAM across test sessions
@@ -197,8 +200,7 @@ def _extract_step_logprobs(request_output):
     reason="Requires CUDA to match production inference path.",
 )
 def test_logprobs_bitwise_batch_invariance_bs1_vs_bs2():
-
-    #model_name = os.getenv("VLLM_TEST_MODEL", "facebook/opt-125m")
+    # model_name = os.getenv("VLLM_TEST_MODEL", "facebook/opt-125m")
     model_name = os.getenv("VLLM_TEST_MODEL", "Qwen/Qwen3-1.7B")
     tp_size = int(os.getenv("VLLM_TEST_TP_SIZE", "1"))
 
@@ -230,8 +232,10 @@ def test_logprobs_bitwise_batch_invariance_bs1_vs_bs2():
         assert len(outs) == 1
         step_logprobs = _extract_step_logprobs(outs[0])
         if step_logprobs is None:
-            pytest.skip("Logits are not available on RequestOutput; "
-                        "enable logprobs return to run this test.")
+            pytest.skip(
+                "Logits are not available on RequestOutput; "
+                "enable logprobs return to run this test."
+            )
         bs1_logprobs_per_prompt.append(step_logprobs)
 
     # BS=2: run prompts in a batch and collect logprobs per step for each
@@ -242,24 +246,29 @@ def test_logprobs_bitwise_batch_invariance_bs1_vs_bs2():
     for o in outs_batched:
         step_logprobs = _extract_step_logprobs(o)
         if step_logprobs is None:
-            pytest.skip("Logits are not available on RequestOutput; "
-                        "enable logprobs return to run this test.")
+            pytest.skip(
+                "Logits are not available on RequestOutput; "
+                "enable logprobs return to run this test."
+            )
         bs2_logprobs_per_prompt.append(step_logprobs)
 
     # Compare step-by-step logprobs for each prompt between BS=1 and BS=2 runs.
     for i, (logprobs_bs1, logprobs_bs2) in enumerate(
-            zip(bs1_logprobs_per_prompt, bs2_logprobs_per_prompt)):
+        zip(bs1_logprobs_per_prompt, bs2_logprobs_per_prompt)
+    ):
         assert len(logprobs_bs1) == len(logprobs_bs2), (
             f"Different number of generation steps for prompt index {i}: "
-            f"{len(logprobs_bs1)} (BS=1) vs {len(logprobs_bs2)} (BS=2)")
+            f"{len(logprobs_bs1)} (BS=1) vs {len(logprobs_bs2)} (BS=2)"
+        )
         for t, (a, b) in enumerate(zip(logprobs_bs1, logprobs_bs2)):
             assert a.shape == b.shape, (
-                f"Logits shape mismatch at prompt {i}, step {t}: "
-                f"{a.shape} vs {b.shape}")
+                f"Logits shape mismatch at prompt {i}, step {t}: {a.shape} vs {b.shape}"
+            )
             # Bitwise exact equality.
-            assert torch.equal(
-                a, b), (f"Bitwise logprobs mismatch at prompt {i}, step {t} "
-                        f"(dtype={a.dtype}, shape={a.shape}).")
+            assert torch.equal(a, b), (
+                f"Bitwise logprobs mismatch at prompt {i}, step {t} "
+                f"(dtype={a.dtype}, shape={a.shape})."
+            )
 
 
 def LLM_with_max_seqs(
diff --git a/tests/v1/kv_connector/nixl_integration/test_accuracy.py b/tests/v1/kv_connector/nixl_integration/test_accuracy.py
index e5d66ffeeeb2..81bd5e30d40e 100644
--- a/tests/v1/kv_connector/nixl_integration/test_accuracy.py
+++ b/tests/v1/kv_connector/nixl_integration/test_accuracy.py
@@ -12,12 +12,11 @@
 RTOL = 0.03
 
 # Model-specific expected values
-EXPECTED_VALUES = {
-    "Qwen/Qwen3-0.6B": 0.41,
-    "deepseek-ai/deepseek-vl2-small": 0.59
-}
+EXPECTED_VALUES = {"Qwen/Qwen3-0.6B": 0.41, "deepseek-ai/deepseek-vl2-small": 0.59}
 
-SIMPLE_PROMPT = "The best part about working on vLLM is that I got to meet so many people across various different organizations like UCB, Google, and Meta which means",  # noqa: E501
+SIMPLE_PROMPT = (
+    "The best part about working on vLLM is that I got to meet so many people across various different organizations like UCB, Google, and Meta which means",
+)  # noqa: E501
 
 # Get model name from environment variable
 MODEL_NAME = os.environ.get("TEST_MODEL", "Qwen/Qwen3-0.6B")
@@ -25,8 +24,7 @@
 
 def run_simple_prompt():
     client = openai.OpenAI(api_key="EMPTY", base_url=BASE_URL)
-    completion = client.completions.create(model=MODEL_NAME,
-                                           prompt=SIMPLE_PROMPT)
+    completion = client.completions.create(model=MODEL_NAME, prompt=SIMPLE_PROMPT)
 
     print("-" * 50)
     print(f"Completion results for {MODEL_NAME}:")
@@ -38,9 +36,11 @@ def test_accuracy():
     """Run the end to end accuracy test."""
     run_simple_prompt()
 
-    model_args = (f"model={MODEL_NAME},"
-                  f"base_url={BASE_URL}/completions,"
-                  f"num_concurrent={NUM_CONCURRENT},tokenized_requests=False")
+    model_args = (
+        f"model={MODEL_NAME},"
+        f"base_url={BASE_URL}/completions,"
+        f"num_concurrent={NUM_CONCURRENT},tokenized_requests=False"
+    )
 
     results = lm_eval.simple_evaluate(
         model="local-completions",
@@ -52,11 +52,14 @@ def test_accuracy():
     expected_value = EXPECTED_VALUES.get(MODEL_NAME)
 
     if expected_value is None:
-        print(f"Warning: No expected value found for {MODEL_NAME}. "
-              "Skipping accuracy check.")
+        print(
+            f"Warning: No expected value found for {MODEL_NAME}. "
+            "Skipping accuracy check."
+        )
         print(f"Measured value: {measured_value}")
         return
 
-    assert (measured_value - RTOL < expected_value
-            and measured_value + RTOL > expected_value
-            ), f"Expected: {expected_value} | Measured: {measured_value}"
+    assert (
+        measured_value - RTOL < expected_value
+        and measured_value + RTOL > expected_value
+    ), f"Expected: {expected_value} | Measured: {measured_value}"
diff --git a/tests/v1/kv_connector/nixl_integration/test_disagg_accuracy.py b/tests/v1/kv_connector/nixl_integration/test_disagg_accuracy.py
index 697e101c3592..caa4aab870ab 100644
--- a/tests/v1/kv_connector/nixl_integration/test_disagg_accuracy.py
+++ b/tests/v1/kv_connector/nixl_integration/test_disagg_accuracy.py
@@ -43,37 +43,39 @@ def check_vllm_server(url: str, timeout=5, retries=3) -> bool:
             if response.status_code == 200:
                 return True
             else:
-                print(f"Attempt {attempt + 1}: Server returned status code "
-                      "{response.status_code}")
+                print(
+                    f"Attempt {attempt + 1}: Server returned status code "
+                    "{response.status_code}"
+                )
         except requests.exceptions.RequestException as e:
             print(f"Attempt {attempt + 1}: Error connecting to server: {e}")
         time.sleep(1)  # Wait before retrying
     return False
 
 
-def run_simple_prompt(base_url: str, model_name: str, input_prompt: str,
-                      use_chat_endpoint: bool) -> str:
+def run_simple_prompt(
+    base_url: str, model_name: str, input_prompt: str, use_chat_endpoint: bool
+) -> str:
     client = openai.OpenAI(api_key="EMPTY", base_url=base_url)
     if use_chat_endpoint:
         completion = client.chat.completions.create(
             model=model_name,
-            messages=[{
-                "role": "user",
-                "content": [{
-                    "type": "text",
-                    "text": input_prompt
-                }]
-            }],
+            messages=[
+                {"role": "user", "content": [{"type": "text", "text": input_prompt}]}
+            ],
             max_completion_tokens=MAX_OUTPUT_LEN,
             temperature=0.0,
-            seed=42)
+            seed=42,
+        )
         return completion.choices[0].message.content
     else:
-        completion = client.completions.create(model=model_name,
-                                               prompt=input_prompt,
-                                               max_tokens=MAX_OUTPUT_LEN,
-                                               temperature=0.0,
-                                               seed=42)
+        completion = client.completions.create(
+            model=model_name,
+            prompt=input_prompt,
+            max_tokens=MAX_OUTPUT_LEN,
+            temperature=0.0,
+            seed=42,
+        )
 
         return completion.choices[0].text
 
@@ -90,7 +92,8 @@ def main():
         "--service_url",  # Name of the first argument
         type=str,
         required=True,
-        help="The vLLM service URL.")
+        help="The vLLM service URL.",
+    )
 
     parser.add_argument(
         "--model_name",  # Name of the first argument
@@ -127,28 +130,30 @@ def main():
         if not os.path.exists(args.file_name):
             raise ValueError(
                 f"In disagg mode, the output file {args.file_name} from "
-                "non-disagg. baseline does not exist.")
+                "non-disagg. baseline does not exist."
+            )
 
     service_url = f"{args.service_url}/v1"
 
     if not check_vllm_server(health_check_url):
-        raise RuntimeError(
-            f"vllm server: {args.service_url} is not ready yet!")
+        raise RuntimeError(f"vllm server: {args.service_url} is not ready yet!")
 
     output_strs = dict()
     for i, prompt in enumerate(SAMPLE_PROMPTS):
-        use_chat_endpoint = (i % 2 == 1)
-        output_str = run_simple_prompt(base_url=service_url,
-                                       model_name=args.model_name,
-                                       input_prompt=prompt,
-                                       use_chat_endpoint=use_chat_endpoint)
+        use_chat_endpoint = i % 2 == 1
+        output_str = run_simple_prompt(
+            base_url=service_url,
+            model_name=args.model_name,
+            input_prompt=prompt,
+            use_chat_endpoint=use_chat_endpoint,
+        )
         print(f"Prompt: {prompt}, output: {output_str}")
         output_strs[prompt] = output_str
 
     if args.mode == "baseline":
         # baseline: save outputs
         try:
-            with open(args.file_name, 'w') as json_file:
+            with open(args.file_name, "w") as json_file:
                 json.dump(output_strs, json_file, indent=4)
         except OSError as e:
             print(f"Error writing to file: {e}")
diff --git a/tests/v1/kv_connector/nixl_integration/test_edge_cases.py b/tests/v1/kv_connector/nixl_integration/test_edge_cases.py
index 8439e30be154..268a1845a2bb 100644
--- a/tests/v1/kv_connector/nixl_integration/test_edge_cases.py
+++ b/tests/v1/kv_connector/nixl_integration/test_edge_cases.py
@@ -12,8 +12,7 @@
 PROXY_PORT = os.getenv("PROXY_PORT", None)
 
 if PREFILL_PORT is None or DECODE_PORT is None or PROXY_PORT is None:
-    raise ValueError(
-        "Please set the PREFILL_PORT, DECODE_PORT, and PROXY_PORT.")
+    raise ValueError("Please set the PREFILL_PORT, DECODE_PORT, and PROXY_PORT.")
 
 LONG_PROMPT = "Red Hat is the best company in the world to work for because it works on open source software, which means that all the contributions are delivered to the community. As a result, when working on projects like vLLM we are able to meet many amazing people from various organizations like AMD, Google, NVIDIA, "  # noqa: E501
 PROMPT = "Red Hat is the best company in the world to work for because it works on open source software, which means that all the contributions are delivered to the community. As a result,"  # noqa: E501
@@ -41,13 +40,13 @@ def test_edge_cases():
 
     # (1) Check that we can handle a very short prompt,
     # less than the length of the block size.
-    completion = proxy_client.completions.create(model=MODEL,
-                                                 prompt=SHORT_PROMPT,
-                                                 temperature=0)
+    completion = proxy_client.completions.create(
+        model=MODEL, prompt=SHORT_PROMPT, temperature=0
+    )
     proxy_response = completion.choices[0].text
-    completion = prefill_client.completions.create(model=MODEL,
-                                                   prompt=SHORT_PROMPT,
-                                                   temperature=0)
+    completion = prefill_client.completions.create(
+        model=MODEL, prompt=SHORT_PROMPT, temperature=0
+    )
     prefill_response = completion.choices[0].text
     print(f"SMALL PROMPT: {proxy_response=}")
     assert proxy_response == prefill_response
@@ -55,27 +54,27 @@ def test_edge_cases():
     # (2) Check that we can handle a full prefix cache
     # hit on the D worker but not on the P worker.
     # (2a): prime the D worker.
-    completion = decode_client.completions.create(model=MODEL,
-                                                  prompt=PROMPT,
-                                                  temperature=0)
+    completion = decode_client.completions.create(
+        model=MODEL, prompt=PROMPT, temperature=0
+    )
     decode_response = completion.choices[0].text
     # (2b): send via the P/D setup
-    completion = proxy_client.completions.create(model=MODEL,
-                                                 prompt=PROMPT,
-                                                 temperature=0)
+    completion = proxy_client.completions.create(
+        model=MODEL, prompt=PROMPT, temperature=0
+    )
     proxy_response = completion.choices[0].text
     print(f"FULL CACHE HIT: {proxy_response=}")
     assert proxy_response == decode_response
 
     # (3) Check that we can handle a partial prefix cache
     # hit on the D worker.
-    completion = proxy_client.completions.create(model=MODEL,
-                                                 prompt=LONG_PROMPT,
-                                                 temperature=0)
+    completion = proxy_client.completions.create(
+        model=MODEL, prompt=LONG_PROMPT, temperature=0
+    )
     proxy_response = completion.choices[0].text
-    completion = prefill_client.completions.create(model=MODEL,
-                                                   prompt=LONG_PROMPT,
-                                                   temperature=0)
+    completion = prefill_client.completions.create(
+        model=MODEL, prompt=LONG_PROMPT, temperature=0
+    )
     prefill_response = completion.choices[0].text
     print(f"PARTIAL CACHE HIT: {proxy_response=}")
     assert proxy_response == prefill_response
diff --git a/tests/v1/kv_connector/nixl_integration/toy_proxy_server.py b/tests/v1/kv_connector/nixl_integration/toy_proxy_server.py
index 905ae0ea7172..37d70510fe25 100644
--- a/tests/v1/kv_connector/nixl_integration/toy_proxy_server.py
+++ b/tests/v1/kv_connector/nixl_integration/toy_proxy_server.py
@@ -27,49 +27,45 @@ async def lifespan(app: FastAPI):
 
     # Create prefill clients
     for i, (host, port) in enumerate(global_args.prefiller_instances):
-        prefiller_base_url = f'http://{host}:{port}/v1'
-        app.state.prefill_clients.append({
-            'client':
-            httpx.AsyncClient(timeout=None, base_url=prefiller_base_url),
-            'host':
-            host,
-            'port':
-            port,
-            'id':
-            i
-        })
+        prefiller_base_url = f"http://{host}:{port}/v1"
+        app.state.prefill_clients.append(
+            {
+                "client": httpx.AsyncClient(timeout=None, base_url=prefiller_base_url),
+                "host": host,
+                "port": port,
+                "id": i,
+            }
+        )
 
     # Create decode clients
     for i, (host, port) in enumerate(global_args.decoder_instances):
-        decoder_base_url = f'http://{host}:{port}/v1'
-        app.state.decode_clients.append({
-            'client':
-            httpx.AsyncClient(timeout=None, base_url=decoder_base_url),
-            'host':
-            host,
-            'port':
-            port,
-            'id':
-            i
-        })
+        decoder_base_url = f"http://{host}:{port}/v1"
+        app.state.decode_clients.append(
+            {
+                "client": httpx.AsyncClient(timeout=None, base_url=decoder_base_url),
+                "host": host,
+                "port": port,
+                "id": i,
+            }
+        )
 
     # Initialize round-robin iterators
-    app.state.prefill_iterator = itertools.cycle(
-        range(len(app.state.prefill_clients)))
-    app.state.decode_iterator = itertools.cycle(
-        range(len(app.state.decode_clients)))
+    app.state.prefill_iterator = itertools.cycle(range(len(app.state.prefill_clients)))
+    app.state.decode_iterator = itertools.cycle(range(len(app.state.decode_clients)))
 
-    print(f"Initialized {len(app.state.prefill_clients)} prefill clients "
-          f"and {len(app.state.decode_clients)} decode clients.")
+    print(
+        f"Initialized {len(app.state.prefill_clients)} prefill clients "
+        f"and {len(app.state.decode_clients)} decode clients."
+    )
 
     yield
 
     # Shutdown: Close all clients
     for client_info in app.state.prefill_clients:
-        await client_info['client'].aclose()
+        await client_info["client"].aclose()
 
     for client_info in app.state.decode_clients:
-        await client_info['client'].aclose()
+        await client_info["client"].aclose()
 
 
 # Update FastAPI app initialization to use lifespan
@@ -83,43 +79,38 @@ def parse_args():
     parser.add_argument("--host", type=str, default="localhost")
 
     # For prefiller instances
-    parser.add_argument("--prefiller-hosts",
-                        "--prefiller-host",
-                        type=str,
-                        nargs="+",
-                        default=["localhost"])
-    parser.add_argument("--prefiller-ports",
-                        "--prefiller-port",
-                        type=int,
-                        nargs="+",
-                        default=[8100])
+    parser.add_argument(
+        "--prefiller-hosts",
+        "--prefiller-host",
+        type=str,
+        nargs="+",
+        default=["localhost"],
+    )
+    parser.add_argument(
+        "--prefiller-ports", "--prefiller-port", type=int, nargs="+", default=[8100]
+    )
 
     # For decoder instances
-    parser.add_argument("--decoder-hosts",
-                        "--decoder-host",
-                        type=str,
-                        nargs="+",
-                        default=["localhost"])
-    parser.add_argument("--decoder-ports",
-                        "--decoder-port",
-                        type=int,
-                        nargs="+",
-                        default=[8200])
+    parser.add_argument(
+        "--decoder-hosts", "--decoder-host", type=str, nargs="+", default=["localhost"]
+    )
+    parser.add_argument(
+        "--decoder-ports", "--decoder-port", type=int, nargs="+", default=[8200]
+    )
 
     args = parser.parse_args()
 
     # Validate and pair hosts with ports
     if len(args.prefiller_hosts) != len(args.prefiller_ports):
         raise ValueError(
-            "Number of prefiller hosts must match number of prefiller ports")
+            "Number of prefiller hosts must match number of prefiller ports"
+        )
 
     if len(args.decoder_hosts) != len(args.decoder_ports):
-        raise ValueError(
-            "Number of decoder hosts must match number of decoder ports")
+        raise ValueError("Number of decoder hosts must match number of decoder ports")
 
     # Create tuples of (host, port) for each service type
-    args.prefiller_instances = list(
-        zip(args.prefiller_hosts, args.prefiller_ports))
+    args.prefiller_instances = list(zip(args.prefiller_hosts, args.prefiller_ports))
     args.decoder_instances = list(zip(args.decoder_hosts, args.decoder_ports))
 
     return args
@@ -136,29 +127,30 @@ def get_next_client(app, service_type: str):
     Returns:
         The next client to use
     """
-    if service_type == 'prefill':
+    if service_type == "prefill":
         client_idx = next(app.state.prefill_iterator)
         return app.state.prefill_clients[client_idx]
-    elif service_type == 'decode':
+    elif service_type == "decode":
         client_idx = next(app.state.decode_iterator)
         return app.state.decode_clients[client_idx]
     else:
         raise ValueError(f"Unknown service type: {service_type}")
 
 
-async def send_request_to_service(client_info: dict, endpoint: str,
-                                  req_data: dict, request_id: str):
+async def send_request_to_service(
+    client_info: dict, endpoint: str, req_data: dict, request_id: str
+):
     """
     Send a request to a service using a client from the pool.
     """
     req_data = req_data.copy()
-    req_data['kv_transfer_params'] = {
+    req_data["kv_transfer_params"] = {
         "do_remote_decode": True,
         "do_remote_prefill": False,
         "remote_engine_id": None,
         "remote_block_ids": None,
         "remote_host": None,
-        "remote_port": None
+        "remote_port": None,
     }
     req_data["stream"] = False
     req_data["max_tokens"] = 1
@@ -168,31 +160,31 @@ async def send_request_to_service(client_info: dict, endpoint: str,
         del req_data["stream_options"]
     headers = {
         "Authorization": f"Bearer {os.environ.get('OPENAI_API_KEY')}",
-        "X-Request-Id": request_id
+        "X-Request-Id": request_id,
     }
 
-    response = await client_info['client'].post(endpoint,
-                                                json=req_data,
-                                                headers=headers)
+    response = await client_info["client"].post(
+        endpoint, json=req_data, headers=headers
+    )
     response.raise_for_status()
 
     return response
 
 
-async def stream_service_response(client_info: dict, endpoint: str,
-                                  req_data: dict, request_id: str):
+async def stream_service_response(
+    client_info: dict, endpoint: str, req_data: dict, request_id: str
+):
     """
     Asynchronously stream response from a service using a client from the pool.
     """
     headers = {
         "Authorization": f"Bearer {os.environ.get('OPENAI_API_KEY')}",
-        "X-Request-Id": request_id
+        "X-Request-Id": request_id,
     }
 
-    async with client_info['client'].stream("POST",
-                                            endpoint,
-                                            json=req_data,
-                                            headers=headers) as response:
+    async with client_info["client"].stream(
+        "POST", endpoint, json=req_data, headers=headers
+    ) as response:
         response.raise_for_status()
         async for chunk in response.aiter_bytes():
             yield chunk
@@ -204,40 +196,39 @@ async def _handle_completions(api: str, request: Request):
         request_id = str(uuid.uuid4())
 
         # Get the next prefill client in round-robin fashion
-        prefill_client_info = get_next_client(request.app, 'prefill')
+        prefill_client_info = get_next_client(request.app, "prefill")
 
         # Send request to prefill service
-        response = await send_request_to_service(prefill_client_info, api,
-                                                 req_data, request_id)
+        response = await send_request_to_service(
+            prefill_client_info, api, req_data, request_id
+        )
 
         # Extract the needed fields
         response_json = response.json()
-        kv_transfer_params = response_json.get('kv_transfer_params', {})
+        kv_transfer_params = response_json.get("kv_transfer_params", {})
         if kv_transfer_params:
             req_data["kv_transfer_params"] = kv_transfer_params
 
         # Get the next decode client in round-robin fashion
-        decode_client_info = get_next_client(request.app, 'decode')
+        decode_client_info = get_next_client(request.app, "decode")
 
         logger.debug("Using %s %s", prefill_client_info, decode_client_info)
 
         # Stream response from decode service
         async def generate_stream():
-            async for chunk in stream_service_response(decode_client_info,
-                                                       api,
-                                                       req_data,
-                                                       request_id=request_id):
+            async for chunk in stream_service_response(
+                decode_client_info, api, req_data, request_id=request_id
+            ):
                 yield chunk
 
-        return StreamingResponse(generate_stream(),
-                                 media_type="application/json")
+        return StreamingResponse(generate_stream(), media_type="application/json")
 
     except Exception as e:
         import sys
         import traceback
+
         exc_info = sys.exc_info()
-        print("Error occurred in disagg prefill proxy server"
-              f" - {api} endpoint")
+        print(f"Error occurred in disagg prefill proxy server - {api} endpoint")
         print(e)
         print("".join(traceback.format_exception(*exc_info)))
         raise
@@ -259,13 +250,14 @@ async def healthcheck():
     return {
         "status": "ok",
         "prefill_instances": len(app.state.prefill_clients),
-        "decode_instances": len(app.state.decode_clients)
+        "decode_instances": len(app.state.decode_clients),
     }
 
 
-if __name__ == '__main__':
+if __name__ == "__main__":
     global global_args
     global_args = parse_args()
 
     import uvicorn
+
     uvicorn.run(app, host=global_args.host, port=global_args.port)
diff --git a/tests/v1/kv_connector/unit/test_kv_connector_lifecyle.py b/tests/v1/kv_connector/unit/test_kv_connector_lifecyle.py
index fe6296cf12ea..0bb67b574fa1 100644
--- a/tests/v1/kv_connector/unit/test_kv_connector_lifecyle.py
+++ b/tests/v1/kv_connector/unit/test_kv_connector_lifecyle.py
@@ -2,12 +2,14 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 from vllm.distributed.kv_transfer.kv_connector.v1.shared_storage_connector import (  # noqa: E501
-    SharedStorageConnectorMetadata)
+    SharedStorageConnectorMetadata,
+)
 from vllm.distributed.kv_transfer.kv_transfer_state import (
-    ensure_kv_transfer_initialized, get_kv_transfer_group)
+    ensure_kv_transfer_initialized,
+    get_kv_transfer_group,
+)
 from vllm.v1.core.sched.output import CachedRequestData, SchedulerOutput
-from vllm.v1.worker.kv_connector_model_runner_mixin import (
-    KVConnectorModelRunnerMixin)
+from vllm.v1.worker.kv_connector_model_runner_mixin import KVConnectorModelRunnerMixin
 
 # Importing utils registers TestSharedStorageConnector with the factory
 from .utils import create_vllm_config
@@ -34,7 +36,7 @@ def test_kv_connector_mixin_clears_metadata():
     vllm_config = create_vllm_config()
     vllm_config.kv_transfer_config.kv_connector = "TestSharedStorageConnector"
     vllm_config.kv_transfer_config.kv_role = "kv_both"
-    vllm_config.kv_transfer_config.kv_connector_extra_config["name"] = ("unit")
+    vllm_config.kv_transfer_config.kv_connector_extra_config["name"] = "unit"
 
     # Initialize the global connector instance
     ensure_kv_transfer_initialized(vllm_config)
@@ -46,7 +48,8 @@ def test_kv_connector_mixin_clears_metadata():
 
         # Invoke the no-forward path which uses the mixin context manager
         KVConnectorModelRunnerMixin.kv_connector_no_forward(
-            scheduler_output, vllm_config)
+            scheduler_output, vllm_config
+        )
 
         # Verify clear_connector_metadata was called on the connector
         connector = get_kv_transfer_group()
diff --git a/tests/v1/kv_connector/unit/test_kv_load_failure_recovery.py b/tests/v1/kv_connector/unit/test_kv_load_failure_recovery.py
index 549e85875025..0902fbfe85f3 100644
--- a/tests/v1/kv_connector/unit/test_kv_load_failure_recovery.py
+++ b/tests/v1/kv_connector/unit/test_kv_load_failure_recovery.py
@@ -9,17 +9,19 @@
 from vllm.v1.core.sched.scheduler import Scheduler
 from vllm.v1.request import Request, RequestStatus
 
-from .utils import (create_model_runner_output, create_request,
-                    create_scheduler, create_vllm_config)
+from .utils import (
+    create_model_runner_output,
+    create_request,
+    create_scheduler,
+    create_vllm_config,
+)
 
 
 def _make_get_num_new_matched_tokens(
     req_num_new_matched_tokens: dict[str, int],
     async_load,
 ) -> Callable[[Request, int], tuple[int, bool]]:
-
-    def get_num_new_matched_tokens(request: Request,
-                                   _: int) -> tuple[int, bool]:
+    def get_num_new_matched_tokens(request: Request, _: int) -> tuple[int, bool]:
         value = req_num_new_matched_tokens.get(request.request_id, 0)
         return value, async_load
 
@@ -33,9 +35,7 @@ def scheduler():
 
 
 @pytest.mark.parametrize(
-    "num_prompt_blocks,"
-    "num_external_computed_blocks,"
-    "invalid_block_idxs",
+    "num_prompt_blocks,num_external_computed_blocks,invalid_block_idxs",
     [
         (100, 99, {0, 98}),
         (100, 99, {50, 98}),
@@ -51,8 +51,7 @@ def test_async_load_failure(
     assert num_prompt_blocks >= num_external_computed_blocks
 
     num_prompt_tokens = num_prompt_blocks * scheduler.block_size
-    num_external_computed_tokens = (num_external_computed_blocks *
-                                    scheduler.block_size)
+    num_external_computed_tokens = num_external_computed_blocks * scheduler.block_size
 
     request1 = create_request(num_tokens=num_prompt_tokens)
     scheduler.add_request(request=request1)
@@ -71,8 +70,8 @@ def test_async_load_failure(
 
     scheduler.connector = Mock()
     scheduler.connector.get_num_new_matched_tokens.side_effect = (
-        _make_get_num_new_matched_tokens(req_num_new_matched_tokens,
-                                         async_load=True))
+        _make_get_num_new_matched_tokens(req_num_new_matched_tokens, async_load=True)
+    )
     scheduler.connector.take_events.return_value = ()
 
     scheduler_output = scheduler.schedule()
@@ -84,14 +83,14 @@ def test_async_load_failure(
     assert scheduler.connector.get_num_new_matched_tokens.call_count == 3
 
     # Simulate a failure in loading some of request2 blocks.
-    (req2_block_ids, ) = scheduler.kv_cache_manager.get_block_ids(
-        request2.request_id)
+    (req2_block_ids,) = scheduler.kv_cache_manager.get_block_ids(request2.request_id)
     invalid_block_ids = {req2_block_ids[i] for i in invalid_block_idxs}
     model_runner_output = create_model_runner_output(
         reqs=[],
         finished_recving={request1.request_id, request3.request_id},
         invalid_block_ids=invalid_block_ids,
-        use_eos=True)
+        use_eos=True,
+    )
 
     scheduler.update_from_output(scheduler_output, model_runner_output)
 
@@ -100,8 +99,9 @@ def test_async_load_failure(
     assert len(scheduler.waiting) == 3
     for request in scheduler.waiting:
         if request.request_id == request2.request_id:
-            assert request.num_computed_tokens == (min_invalid_block_idx *
-                                                   scheduler.block_size)
+            assert request.num_computed_tokens == (
+                min_invalid_block_idx * scheduler.block_size
+            )
         else:
             assert request.num_computed_tokens == 0
         assert request.status == RequestStatus.WAITING_FOR_REMOTE_KVS
@@ -110,9 +110,7 @@ def test_async_load_failure(
 
 
 @pytest.mark.parametrize(
-    "num_prompt_blocks,"
-    "num_external_computed_blocks,"
-    "invalid_block_idxs",
+    "num_prompt_blocks,num_external_computed_blocks,invalid_block_idxs",
     [
         (100, 99, {0, 98}),
         (100, 99, {50, 98}),
@@ -128,8 +126,7 @@ def test_sync_load_failure(
     assert num_prompt_blocks >= num_external_computed_blocks
 
     num_prompt_tokens = num_prompt_blocks * scheduler.block_size
-    num_external_computed_tokens = (num_external_computed_blocks *
-                                    scheduler.block_size)
+    num_external_computed_tokens = num_external_computed_blocks * scheduler.block_size
 
     request1 = create_request(num_tokens=num_prompt_tokens)
     scheduler.add_request(request=request1)
@@ -148,8 +145,8 @@ def test_sync_load_failure(
 
     scheduler.connector = Mock()
     scheduler.connector.get_num_new_matched_tokens.side_effect = (
-        _make_get_num_new_matched_tokens(req_num_new_matched_tokens,
-                                         async_load=False))
+        _make_get_num_new_matched_tokens(req_num_new_matched_tokens, async_load=False)
+    )
     scheduler.connector.request_finished.return_value = (False, None)
     scheduler.connector.take_events.return_value = ()
 
@@ -165,8 +162,7 @@ def test_sync_load_failure(
     assert len(scheduler.running) == 3
     assert len(scheduler_output.scheduled_new_reqs) == 3
     for request in scheduler_output.scheduled_new_reqs:
-        assert request.num_computed_tokens == expected_computed_tokens[
-            request.req_id]
+        assert request.num_computed_tokens == expected_computed_tokens[request.req_id]
     assert scheduler.connector.get_num_new_matched_tokens.call_count == 3
 
     # Simulate a failure in loading some of request2 blocks.
@@ -175,14 +171,16 @@ def test_sync_load_failure(
     model_runner_output = create_model_runner_output(
         [request1, request2, request3],
         invalid_block_ids=invalid_block_ids,
-        use_eos=True)
+        use_eos=True,
+    )
 
     scheduler.update_from_output(scheduler_output, model_runner_output)
 
     assert len(scheduler.running) == 1
     assert scheduler.running[0].request_id == request2.request_id
     assert scheduler.running[0].num_computed_tokens == (
-        min(invalid_block_idxs) * scheduler.block_size)
+        min(invalid_block_idxs) * scheduler.block_size
+    )
     assert scheduler.connector.get_num_new_matched_tokens.call_count == 3
     assert scheduler.connector.request_finished.call_count == 2
 
@@ -205,19 +203,19 @@ def test_sync_load_failure_with_shared_blocks(
     num_common_prefix_blocks: int,
     invalid_block_idxs: set[int],
 ):
-    assert (num_prompt_blocks >= num_external_computed_blocks >=
-            num_common_prefix_blocks)
+    assert num_prompt_blocks >= num_external_computed_blocks >= num_common_prefix_blocks
 
     num_prompt_tokens = num_prompt_blocks * scheduler.block_size
-    num_external_computed_tokens = (num_external_computed_blocks *
-                                    scheduler.block_size)
+    num_external_computed_tokens = num_external_computed_blocks * scheduler.block_size
     common_prefix_len = num_common_prefix_blocks * scheduler.block_size
 
-    request1 = create_request(num_tokens=num_prompt_tokens,
-                              common_prefix_len=common_prefix_len)
+    request1 = create_request(
+        num_tokens=num_prompt_tokens, common_prefix_len=common_prefix_len
+    )
     scheduler.add_request(request=request1)
-    request2 = create_request(num_tokens=num_prompt_tokens,
-                              common_prefix_len=common_prefix_len)
+    request2 = create_request(
+        num_tokens=num_prompt_tokens, common_prefix_len=common_prefix_len
+    )
     scheduler.add_request(request=request2)
 
     # Mock KV connector method.
@@ -228,8 +226,8 @@ def test_sync_load_failure_with_shared_blocks(
 
     scheduler.connector = Mock()
     scheduler.connector.get_num_new_matched_tokens.side_effect = (
-        _make_get_num_new_matched_tokens(req_num_new_matched_tokens,
-                                         async_load=False))
+        _make_get_num_new_matched_tokens(req_num_new_matched_tokens, async_load=False)
+    )
     scheduler.connector.take_events.return_value = ()
 
     scheduler_output = scheduler.schedule()
@@ -243,17 +241,15 @@ def test_sync_load_failure_with_shared_blocks(
     assert len(scheduler.running) == 2
     assert len(scheduler_output.scheduled_new_reqs) == 2
     for request in scheduler_output.scheduled_new_reqs:
-        assert request.num_computed_tokens == expected_computed_tokens[
-            request.req_id]
+        assert request.num_computed_tokens == expected_computed_tokens[request.req_id]
     assert scheduler.connector.get_num_new_matched_tokens.call_count == 2
 
     # Simulate a failure in loading some of the shared blocks.
     req1_block_ids = scheduler_output.scheduled_new_reqs[0].block_ids[0]
     invalid_block_ids = {req1_block_ids[i] for i in invalid_block_idxs}
     model_runner_output = create_model_runner_output(
-        [request1, request2],
-        invalid_block_ids=invalid_block_ids,
-        use_eos=True)
+        [request1, request2], invalid_block_ids=invalid_block_ids, use_eos=True
+    )
 
     scheduler.update_from_output(scheduler_output, model_runner_output)
 
@@ -266,15 +262,14 @@ def test_sync_load_failure_with_shared_blocks(
 
     assert len(scheduler.running) == 2
     for request in scheduler.running:
-        assert request.num_computed_tokens == expected_computed_tokens[
-            request.request_id]
+        assert (
+            request.num_computed_tokens == expected_computed_tokens[request.request_id]
+        )
     assert scheduler.connector.get_num_new_matched_tokens.call_count == 2
 
 
 @pytest.mark.parametrize(
-    "num_prompt_blocks,"
-    "num_external_computed_blocks,"
-    "invalid_block_idxs",
+    "num_prompt_blocks,num_external_computed_blocks,invalid_block_idxs",
     [
         (100, 99, {0, 50, 98}),
         (100, 99, {98, 50, 0}),
@@ -289,8 +284,7 @@ def test_async_progressive_load_failure(
     assert num_prompt_blocks >= num_external_computed_blocks
 
     num_prompt_tokens = num_prompt_blocks * scheduler.block_size
-    num_external_computed_tokens = (num_external_computed_blocks *
-                                    scheduler.block_size)
+    num_external_computed_tokens = num_external_computed_blocks * scheduler.block_size
 
     request = create_request(num_tokens=num_prompt_tokens)
     scheduler.add_request(request=request)
@@ -303,8 +297,8 @@ def test_async_progressive_load_failure(
 
     scheduler.connector = Mock()
     scheduler.connector.get_num_new_matched_tokens.side_effect = (
-        _make_get_num_new_matched_tokens(req_num_new_matched_tokens,
-                                         async_load=True))
+        _make_get_num_new_matched_tokens(req_num_new_matched_tokens, async_load=True)
+    )
     scheduler.connector.take_events.return_value = ()
 
     scheduler_output = scheduler.schedule()
@@ -318,24 +312,24 @@ def test_async_progressive_load_failure(
     min_invalid_block_idx = max(invalid_block_idxs) + 1
     # Simulate failures when progressively loading request blocks.
     for invalid_block_idx in invalid_block_idxs:
-        (req_block_ids, ) = scheduler.kv_cache_manager.get_block_ids(
-            request.request_id)
+        (req_block_ids,) = scheduler.kv_cache_manager.get_block_ids(request.request_id)
         invalid_block_ids = {req_block_ids[invalid_block_idx]}
         model_runner_output = create_model_runner_output(
             reqs=[],
             finished_recving=set(),
             invalid_block_ids=invalid_block_ids,
-            use_eos=True)
+            use_eos=True,
+        )
 
         scheduler.update_from_output(scheduler_output, model_runner_output)
 
         min_invalid_block_idx = min(min_invalid_block_idx, invalid_block_idx)
 
         assert len(scheduler.waiting) == 1
-        assert scheduler.waiting.peek_request(
-        ).request_id == request.request_id
-        assert request.num_computed_tokens == (min_invalid_block_idx *
-                                               scheduler.block_size)
+        assert scheduler.waiting.peek_request().request_id == request.request_id
+        assert request.num_computed_tokens == (
+            min_invalid_block_idx * scheduler.block_size
+        )
         assert request.status == RequestStatus.WAITING_FOR_REMOTE_KVS
         assert scheduler.failed_recving_kv_req_ids == {request.request_id}
         assert scheduler.connector.get_num_new_matched_tokens.call_count == 1
diff --git a/tests/v1/kv_connector/unit/test_multi_connector.py b/tests/v1/kv_connector/unit/test_multi_connector.py
index b1780d8a9af8..74ae3ca9a863 100644
--- a/tests/v1/kv_connector/unit/test_multi_connector.py
+++ b/tests/v1/kv_connector/unit/test_multi_connector.py
@@ -52,29 +52,26 @@ def test_multi_shared_storage_connector_consistency():
         kv_connector="MultiConnector",
         kv_role="kv_both",
         kv_connector_extra_config={
-            "connectors": [{
-                "kv_connector":
-                "TestSharedStorageConnector",
-                "kv_role":
-                "kv_both",
-                "kv_connector_extra_config": {
-                    "shared_storage_path": str(storage_1_path),
-                    "name": "storage1",
+            "connectors": [
+                {
+                    "kv_connector": "TestSharedStorageConnector",
+                    "kv_role": "kv_both",
+                    "kv_connector_extra_config": {
+                        "shared_storage_path": str(storage_1_path),
+                        "name": "storage1",
+                    },
+                    "kv_connector_module_path": "tests.v1.kv_connector.unit.utils",
                 },
-                "kv_connector_module_path":
-                "tests.v1.kv_connector.unit.utils",
-            }, {
-                "kv_connector":
-                "TestSharedStorageConnector",
-                "kv_role":
-                "kv_both",
-                "kv_connector_extra_config": {
-                    "shared_storage_path": str(storage_2_path),
-                    "name": "storage2",
+                {
+                    "kv_connector": "TestSharedStorageConnector",
+                    "kv_role": "kv_both",
+                    "kv_connector_extra_config": {
+                        "shared_storage_path": str(storage_2_path),
+                        "name": "storage2",
+                    },
+                    "kv_connector_module_path": "tests.v1.kv_connector.unit.utils",
                 },
-                "kv_connector_module_path":
-                "tests.v1.kv_connector.unit.utils",
-            }]
+            ]
         },
     )
 
@@ -93,14 +90,16 @@ def test_multi_shared_storage_connector_consistency():
     local_subdirs = list(storage_1_path.iterdir())
     external_subdirs = list(storage_2_path.iterdir())
 
-    assert len(
-        local_subdirs
-    ) > 0, f"Local storage path {storage_1_path} is empty after generation."
+    assert len(local_subdirs) > 0, (
+        f"Local storage path {storage_1_path} is empty after generation."
+    )
     assert len(external_subdirs) > 0, (
-        f"External storage path {storage_2_path} is empty after generation.")
+        f"External storage path {storage_2_path} is empty after generation."
+    )
     assert len(local_subdirs) == len(external_subdirs), (
         f"Mismatch in number of cache entries: "
-        f"Local={len(local_subdirs)}, External={len(external_subdirs)}")
+        f"Local={len(local_subdirs)}, External={len(external_subdirs)}"
+    )
 
     # The subdirectories should correspond to the prompt hashes
     # Since prompts are the same, the hash directories should be the same name
@@ -113,29 +112,39 @@ def test_multi_shared_storage_connector_consistency():
     # Compare the contents of each corresponding cache directory
     for subdir_name in local_subdir_names:
         print(f"Comparing contents of cache directory: {subdir_name}")
-        assert _compare_directories(storage_1_path / subdir_name,
-                                    storage_2_path / subdir_name), \
-            (f"Contents differ for cache directory '{subdir_name}' between "
-             f"{storage_1_path} and {storage_2_path}")
+        assert _compare_directories(
+            storage_1_path / subdir_name, storage_2_path / subdir_name
+        ), (
+            f"Contents differ for cache directory '{subdir_name}' between "
+            f"{storage_1_path} and {storage_2_path}"
+        )
 
     events = get_connector_events()
     # get_num_new_matched_tokens and update_state_after_alloc will be called
     # on each connector in turn.
     assert events["storage1-SCHEDULER"][:3] == [
-        'get_num_new_matched_tokens 0',
-        'update_state_after_alloc num_blocks=[0] 0', 'build_connector_meta'
+        "get_num_new_matched_tokens 0",
+        "update_state_after_alloc num_blocks=[0] 0",
+        "build_connector_meta",
     ]
     assert events["storage1-WORKER"][:5] == [
-        'register_kv_caches', 'bind_connector_metadata', 'start_load_kv',
-        'wait_for_layer_load', 'save_kv_layer'
+        "register_kv_caches",
+        "bind_connector_metadata",
+        "start_load_kv",
+        "wait_for_layer_load",
+        "save_kv_layer",
     ]
     assert events["storage2-SCHEDULER"][:3] == [
-        'get_num_new_matched_tokens 0',
-        'update_state_after_alloc num_blocks=[0] 0', 'build_connector_meta'
+        "get_num_new_matched_tokens 0",
+        "update_state_after_alloc num_blocks=[0] 0",
+        "build_connector_meta",
     ]
     assert events["storage2-WORKER"][:5] == [
-        'register_kv_caches', 'bind_connector_metadata', 'start_load_kv',
-        'wait_for_layer_load', 'save_kv_layer'
+        "register_kv_caches",
+        "bind_connector_metadata",
+        "start_load_kv",
+        "wait_for_layer_load",
+        "save_kv_layer",
     ]
 
     # Reset prefix cache or else we'll just get the tokens back from there.
@@ -151,12 +160,14 @@ def test_multi_shared_storage_connector_consistency():
     # on that one but with zero blocks for others (first nonzero match is
     # chosen).
     assert events["storage1-SCHEDULER"][:3] == [
-        'get_num_new_matched_tokens 0',
-        'update_state_after_alloc num_blocks=[7] 96', 'build_connector_meta'
+        "get_num_new_matched_tokens 0",
+        "update_state_after_alloc num_blocks=[7] 96",
+        "build_connector_meta",
     ]
     assert events["storage2-SCHEDULER"][:3] == [
-        'get_num_new_matched_tokens 0',
-        'update_state_after_alloc num_blocks=[0] 0', 'build_connector_meta'
+        "get_num_new_matched_tokens 0",
+        "update_state_after_alloc num_blocks=[0] 0",
+        "build_connector_meta",
     ]
 
     # Delete storage1 connector state
@@ -175,12 +186,14 @@ def test_multi_shared_storage_connector_consistency():
     # a hit, so update_state_after_alloc will only be called with allocated
     # blocks for the second connector.
     assert events["storage1-SCHEDULER"][:3] == [
-        'get_num_new_matched_tokens 0',
-        'update_state_after_alloc num_blocks=[0] 0', 'build_connector_meta'
+        "get_num_new_matched_tokens 0",
+        "update_state_after_alloc num_blocks=[0] 0",
+        "build_connector_meta",
     ]
     assert events["storage2-SCHEDULER"][:3] == [
-        'get_num_new_matched_tokens 0',
-        'update_state_after_alloc num_blocks=[7] 96', 'build_connector_meta'
+        "get_num_new_matched_tokens 0",
+        "update_state_after_alloc num_blocks=[7] 96",
+        "build_connector_meta",
     ]
 
     # Clean up
@@ -191,15 +204,14 @@ def test_multi_shared_storage_connector_consistency():
 def get_connector_events() -> dict[str, list[str]]:
     # Read in connector events and reset the files.
     import glob
+
     event_files = glob.glob(tempfile.gettempdir() + "/connector_*_events.log")
     connector_events = {}
     for fname in event_files:
         name = fname.split("connector_")[1].split("_events.log")[0]
         try:
             with open(fname, "r+") as f:
-                connector_events[name] = [
-                    line.strip() for line in f if line.strip()
-                ]
+                connector_events[name] = [line.strip() for line in f if line.strip()]
                 f.truncate(0)
         except Exception as e:
             print(f"[ERROR] Could not read connector events for {name}: {e}")
@@ -211,5 +223,5 @@ def test_engine_id_conflict():
     configs = [KVTransferConfig() for _ in range(2)]
     ids = [config.engine_id for config in configs]
     assert ids[0] != ids[1], (
-        "Engine IDs should be different for different configs. "
-        f"Got {ids}")
+        f"Engine IDs should be different for different configs. Got {ids}"
+    )
diff --git a/tests/v1/kv_connector/unit/test_nixl_connector.py b/tests/v1/kv_connector/unit/test_nixl_connector.py
index 08c0fdefdfc9..a1f53cb25563 100644
--- a/tests/v1/kv_connector/unit/test_nixl_connector.py
+++ b/tests/v1/kv_connector/unit/test_nixl_connector.py
@@ -19,15 +19,22 @@
 from vllm import LLM
 from vllm.config import KVTransferConfig
 from vllm.distributed.kv_transfer.kv_connector.utils import KVOutputAggregator
-from vllm.distributed.kv_transfer.kv_connector.v1.metrics import (
-    KVConnectorStats)
+from vllm.distributed.kv_transfer.kv_connector.v1.metrics import KVConnectorStats
 from vllm.distributed.kv_transfer.kv_connector.v1.multi_connector import (
-    MultiKVConnectorStats)
+    MultiKVConnectorStats,
+)
 from vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector import (
-    KVConnectorRole, NixlAgentMetadata, NixlConnector, NixlConnectorMetadata,
-    NixlConnectorWorker, NixlKVConnectorStats)
+    KVConnectorRole,
+    NixlAgentMetadata,
+    NixlConnector,
+    NixlConnectorMetadata,
+    NixlConnectorWorker,
+    NixlKVConnectorStats,
+)
 from vllm.distributed.kv_transfer.kv_transfer_state import (
-    ensure_kv_transfer_shutdown, has_kv_transfer_group)
+    ensure_kv_transfer_shutdown,
+    has_kv_transfer_group,
+)
 from vllm.forward_context import ForwardContext
 from vllm.platforms.interface import Platform
 from vllm.sampling_params import SamplingParams
@@ -42,14 +49,14 @@
 def clear_kv_transfer():
     """
     The test cases in this file use `VLLM_ENABLE_V1_MULTIPROCESSING=0`,
-    causing the global variable `_KV_CONNECTOR_AGENT` 
+    causing the global variable `_KV_CONNECTOR_AGENT`
     to be assigned but never deleted.
 
-    Since the current pytest process does not terminate and instead 
+    Since the current pytest process does not terminate and instead
     continues running tests from other files,
-    this global variable remains in memory and interferes 
+    this global variable remains in memory and interferes
     with test cases in other modules.
-    
+
     So we use this fixture to ensure that the global variable
     `_KV_CONNECTOR_AGENT` is properly cleaned up after each test.
     """
@@ -58,11 +65,12 @@ def clear_kv_transfer():
         ensure_kv_transfer_shutdown()
 
 
-def get_default_xfer_telemetry(xferDurationS: float = 1,
-                               postDurationS: float = 1,
-                               totalBytes: int = 1,
-                               descCount: int = 1) -> dict:
-
+def get_default_xfer_telemetry(
+    xferDurationS: float = 1,
+    postDurationS: float = 1,
+    totalBytes: int = 1,
+    descCount: int = 1,
+) -> dict:
     class AttributeDict(dict):
         __slots__ = ()
         __getattr__ = dict.__getitem__
@@ -83,7 +91,7 @@ class FakeNixlWrapper:
 
     We don't inherit from nixl._api.nixl_agent because nixl may not be
     installed.
-    
+
     Note: The complete source of this class is also used in the
     `_make_fake_nixl_pkg` function to create a fake nixl package
     for Ray workers.
@@ -94,8 +102,7 @@ class FakeNixlWrapper:
 
     def __init__(self, agent_name: str, *args, **kwargs):
         self._cycles_before_xfer_done = 0
-        self._check_xfer_state_cycles: defaultdict[int, int] = defaultdict(
-            lambda: 0)
+        self._check_xfer_state_cycles: defaultdict[int, int] = defaultdict(lambda: 0)
 
     def get_reg_descs(self, caches_data, memory_type: str) -> list:
         return [str(uuid.uuid4()) for _ in caches_data]
@@ -123,8 +130,7 @@ def get_new_notifs(self) -> dict[str, list[bytes]]:
         return {}
 
     def check_xfer_state(self, handle: int) -> str:
-        if self._check_xfer_state_cycles[
-                handle] >= self._cycles_before_xfer_done:
+        if self._check_xfer_state_cycles[handle] >= self._cycles_before_xfer_done:
             return "DONE"
         self._check_xfer_state_cycles[handle] += 1
         return "PROC"
@@ -141,13 +147,15 @@ def remove_remote_agent(self, agent: str) -> None:
     def send_notif(self, agent_name: str, notif_msg: bytes) -> None:
         pass
 
-    def make_prepped_xfer(self,
-                          xfer_type: str,
-                          local_xfer_side_handle: int,
-                          local_block_descs_ids: list[int],
-                          remote_xfer_side_handle: int,
-                          remote_block_descs_ids: list[int],
-                          notif_msg: Optional[bytes] = None) -> int:
+    def make_prepped_xfer(
+        self,
+        xfer_type: str,
+        local_xfer_side_handle: int,
+        local_block_descs_ids: list[int],
+        remote_xfer_side_handle: int,
+        remote_block_descs_ids: list[int],
+        notif_msg: Optional[bytes] = None,
+    ) -> int:
         return uuid.uuid4().int
 
     def transfer(self, handle: int) -> str:
@@ -168,7 +176,7 @@ def set_cycles_before_xfer_done(self, cycles: int):
 def _make_fake_nixl_pkg():
     """Context manager that creates a temporary package making
        `from nixl._api import nixl_agent` resolve to our FakeNixlWrapper.
-       
+
     Automatically cleans up the temporary directory when done.
     """
     with tempfile.TemporaryDirectory() as td:
@@ -214,10 +222,12 @@ def test_basic_interface():
     NUM_EXTERNAL_FULL_BLOCKS = 2
     NUM_TOKENS = int(BLOCK_SIZE * (NUM_EXTERNAL_FULL_BLOCKS + 0.5))
 
-    request = create_request(request_id=1,
-                             block_size=BLOCK_SIZE,
-                             num_tokens=NUM_TOKENS,
-                             do_remote_prefill=True)
+    request = create_request(
+        request_id=1,
+        block_size=BLOCK_SIZE,
+        num_tokens=NUM_TOKENS,
+        do_remote_prefill=True,
+    )
     request_id = request.request_id
 
     scheduler.add_request(request)
@@ -233,8 +243,11 @@ def test_basic_interface():
     req_meta = kv_connector_metadata.reqs_to_recv[request_id]
 
     for block_id, block in zip(
-            req_meta.local_block_ids, scheduler.kv_cache_manager.coordinator.
-            single_type_managers[0].req_to_blocks[request_id]):
+        req_meta.local_block_ids,
+        scheduler.kv_cache_manager.coordinator.single_type_managers[0].req_to_blocks[
+            request_id
+        ],
+    ):
         assert block_id == block.block_id
 
 
@@ -254,11 +267,13 @@ def test_prompt_less_than_block_size():
     NUM_TOKENS = int(BLOCK_SIZE * 0.5)
 
     # Request will have 1 partial remote block.
-    request = create_request(request_id=1,
-                             block_size=BLOCK_SIZE,
-                             num_tokens=NUM_TOKENS,
-                             do_remote_prefill=True,
-                             num_remote_blocks=1)
+    request = create_request(
+        request_id=1,
+        block_size=BLOCK_SIZE,
+        num_tokens=NUM_TOKENS,
+        do_remote_prefill=True,
+        num_remote_blocks=1,
+    )
     scheduler.add_request(request)
     scheduler_output = scheduler.schedule()
 
@@ -271,15 +286,15 @@ def test_prompt_less_than_block_size():
 
 
 class FakeNixlConnectorWorker(NixlConnectorWorker):
-
     REMOTE_ENGINE_ID = "remote_engine"
 
     def __init__(self, *args, hand_shake_latency: float = 1.8, **kwargs):
         super().__init__(*args, **kwargs)
         self._hand_shake_latency = hand_shake_latency
 
-    def _nixl_handshake(self, host: str, port: int, remote_tp_size: int,
-                        expected_engine_id: str) -> dict[int, str]:
+    def _nixl_handshake(
+        self, host: str, port: int, remote_tp_size: int, expected_engine_id: str
+    ) -> dict[int, str]:
         # Mimic slow _nixl_handshake, as well as bypass zmq communication.
         time.sleep(self._hand_shake_latency)
         # These should've been done in register_kv_caches(), called by
@@ -304,21 +319,23 @@ def _nixl_handshake(self, host: str, port: int, remote_tp_size: int,
                 # is started. We mock HND here.
                 kv_cache_layout="HND",
             ),
-            remote_tp_size=remote_tp_size)
+            remote_tp_size=remote_tp_size,
+        )
         return {0: remote_agent_name}
 
 
 class TestNixlHandshake:
-
     @patch(
         "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.NixlWrapper",
-        FakeNixlWrapper)
+        FakeNixlWrapper,
+    )
     def test_multi_xfer_one_engine(
         self,
         # dist_init is a fixture that initializes the distributed environment.
-        dist_init):
+        dist_init,
+    ):
         """Test case where multiple xfers are initiated to the same engine.
-        
+
         This test triggers the connector to load remote KV for the same
         `request_id`. The transfer is not done immediately due to
         `set_cycles_before_xfer_done`, so there is a state where there are
@@ -332,9 +349,9 @@ def test_multi_xfer_one_engine(
         # Test worker role in decode server.
         connector = NixlConnector(vllm_config, KVConnectorRole.WORKER)
         connector.connector_worker = FakeNixlConnectorWorker(
-            vllm_config, connector.engine_id, hand_shake_latency=0)
-        assert isinstance(connector.connector_worker.nixl_wrapper,
-                          FakeNixlWrapper)
+            vllm_config, connector.engine_id, hand_shake_latency=0
+        )
+        assert isinstance(connector.connector_worker.nixl_wrapper, FakeNixlWrapper)
         connector.connector_worker.nixl_wrapper.set_cycles_before_xfer_done(3)
         num_xfers = 4
         while True:
@@ -345,21 +362,19 @@ def test_multi_xfer_one_engine(
                 num_xfers -= 1
                 metadata.add_new_req(
                     request_id=request_id,
-                    local_block_ids=[
-                        num_xfers + 1, num_xfers + 2, num_xfers + 3
-                    ],
+                    local_block_ids=[num_xfers + 1, num_xfers + 2, num_xfers + 3],
                     kv_transfer_params={
-                        "remote_block_ids":
-                        [num_xfers + 4, num_xfers + 5, num_xfers + 6],
-                        "remote_engine_id":
-                        FakeNixlConnectorWorker.REMOTE_ENGINE_ID,
-                        "remote_host":
-                        "localhost",
-                        "remote_port":
-                        1234,
-                        "remote_tp_size":
-                        1,
-                    })
+                        "remote_block_ids": [
+                            num_xfers + 4,
+                            num_xfers + 5,
+                            num_xfers + 6,
+                        ],
+                        "remote_engine_id": FakeNixlConnectorWorker.REMOTE_ENGINE_ID,
+                        "remote_host": "localhost",
+                        "remote_port": 1234,
+                        "remote_tp_size": 1,
+                    },
+                )
             connector.bind_connector_metadata(metadata)
 
             # Mimic maybe_setup_kv_connector in gpu_model_runner.
@@ -371,8 +386,9 @@ def test_multi_xfer_one_engine(
             _before_load = time.perf_counter()
             connector.start_load_kv(dummy_ctx)
             _after_load = time.perf_counter()
-            assert _after_load - _before_load < 0.1, "start_load_kv took " \
-                f"{_after_load - _before_load} seconds"
+            assert _after_load - _before_load < 0.1, (
+                f"start_load_kv took {_after_load - _before_load} seconds"
+            )
 
             # Mimic get_finished_kv_transfers in gpu_model_runner.
             _, done_recving = connector.get_finished(finished_req_ids=set())
@@ -384,20 +400,25 @@ def test_multi_xfer_one_engine(
 
     @patch(
         "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.NixlWrapper",
-        FakeNixlWrapper)
-    @pytest.mark.parametrize("decode_tp_size, prefill_tp_size", [
-        (1, 1),
-        (2, 1),
-        (4, 2),
-        (4, 4),
-    ])
+        FakeNixlWrapper,
+    )
+    @pytest.mark.parametrize(
+        "decode_tp_size, prefill_tp_size",
+        [
+            (1, 1),
+            (2, 1),
+            (4, 2),
+            (4, 4),
+        ],
+    )
     def test_async_load_kv(
-            self,
-            # Fixture that initializes the distributed environment.
-            dist_init,
-            # Simulate consumer-producer TP sizes.
-            decode_tp_size,
-            prefill_tp_size):
+        self,
+        # Fixture that initializes the distributed environment.
+        dist_init,
+        # Simulate consumer-producer TP sizes.
+        decode_tp_size,
+        prefill_tp_size,
+    ):
         """Test that NixlConnector's start_load_kv should be non-blocking."""
 
         vllm_config = create_vllm_config()
@@ -406,18 +427,20 @@ def test_async_load_kv(
         # Test worker role in decode server.
         connector = NixlConnector(vllm_config, KVConnectorRole.WORKER)
         connector.connector_worker = FakeNixlConnectorWorker(
-            vllm_config, connector.engine_id)
+            vllm_config, connector.engine_id
+        )
         metadata = NixlConnectorMetadata()
-        metadata.add_new_req(request_id="id",
-                             local_block_ids=[1, 2, 3],
-                             kv_transfer_params={
-                                 "remote_block_ids": [4, 5, 6],
-                                 "remote_engine_id":
-                                 FakeNixlConnectorWorker.REMOTE_ENGINE_ID,
-                                 "remote_host": "localhost",
-                                 "remote_port": 1234,
-                                 "remote_tp_size": prefill_tp_size,
-                             })
+        metadata.add_new_req(
+            request_id="id",
+            local_block_ids=[1, 2, 3],
+            kv_transfer_params={
+                "remote_block_ids": [4, 5, 6],
+                "remote_engine_id": FakeNixlConnectorWorker.REMOTE_ENGINE_ID,
+                "remote_host": "localhost",
+                "remote_port": 1234,
+                "remote_tp_size": prefill_tp_size,
+            },
+        )
         connector.bind_connector_metadata(metadata)
 
         timeout = 2.5
@@ -431,8 +454,9 @@ def test_async_load_kv(
             _before_load = time.perf_counter()
             connector.start_load_kv(dummy_ctx)
             _after_load = time.perf_counter()
-            assert _after_load - _before_load < 0.1, "start_load_kv took " \
-                f"{_after_load - _before_load} seconds"
+            assert _after_load - _before_load < 0.1, (
+                f"start_load_kv took {_after_load - _before_load} seconds"
+            )
             time.sleep(0.5)  # backoff for the async handshake to complete.
             connector.bind_connector_metadata(NixlConnectorMetadata())
             _, done_recving = connector.get_finished(finished_req_ids=set())
@@ -442,11 +466,13 @@ def test_async_load_kv(
 
     @patch(
         "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.NixlWrapper",
-        FakeNixlWrapper)
+        FakeNixlWrapper,
+    )
     def test_concurrent_load_kv(
         self,
         # dist_init is a fixture that initializes the distributed environment.
-        dist_init):
+        dist_init,
+    ):
         """Test that multiple start_load_kv calls should occur concurrently."""
 
         vllm_config = create_vllm_config()
@@ -454,20 +480,22 @@ def test_concurrent_load_kv(
         # Test worker role in decode server.
         connector = NixlConnector(vllm_config, KVConnectorRole.WORKER)
         connector.connector_worker = FakeNixlConnectorWorker(
-            vllm_config, connector.engine_id)
+            vllm_config, connector.engine_id
+        )
         metadata = NixlConnectorMetadata()
         total_reqs = 5
         for i in range(total_reqs):
-            metadata.add_new_req(request_id=f"id_{i}",
-                                 local_block_ids=[1, 2, 3],
-                                 kv_transfer_params={
-                                     "remote_block_ids": [4, 5, 6],
-                                     "remote_engine_id":
-                                     FakeNixlConnectorWorker.REMOTE_ENGINE_ID,
-                                     "remote_host": "localhost",
-                                     "remote_port": 1234,
-                                     "remote_tp_size": 1,
-                                 })
+            metadata.add_new_req(
+                request_id=f"id_{i}",
+                local_block_ids=[1, 2, 3],
+                kv_transfer_params={
+                    "remote_block_ids": [4, 5, 6],
+                    "remote_engine_id": FakeNixlConnectorWorker.REMOTE_ENGINE_ID,
+                    "remote_host": "localhost",
+                    "remote_port": 1234,
+                    "remote_tp_size": 1,
+                },
+            )
         connector.bind_connector_metadata(metadata)
 
         timeout = 2.5 * total_reqs
@@ -482,8 +510,9 @@ def test_concurrent_load_kv(
             _before_load = time.perf_counter()
             connector.start_load_kv(dummy_ctx)
             _after_load = time.perf_counter()
-            assert _after_load - _before_load < 0.1, "start_load_kv took " \
-                f"{_after_load - _before_load} seconds"
+            assert _after_load - _before_load < 0.1, (
+                f"start_load_kv took {_after_load - _before_load} seconds"
+            )
             time.sleep(0.5)  # backoff for the async handshake to complete.
             connector.bind_connector_metadata(NixlConnectorMetadata())
             _, done_recving = connector.get_finished(finished_req_ids=set())
@@ -495,7 +524,8 @@ def test_concurrent_load_kv(
 
     @patch(
         "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.NixlWrapper",
-        FakeNixlWrapper)
+        FakeNixlWrapper,
+    )
     def test_handshake_fails_on_kv_cache_layout_mismatch(self, dist_init):
         """
         Verify that adding a remote agent fails if kv_cache_layout differs.
@@ -506,12 +536,14 @@ def test_handshake_fails_on_kv_cache_layout_mismatch(self, dist_init):
         # Mock TP world size to 2 to force heterogeneous TP when
         # remote_tp_size=1
         with patch(
-                "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.get_tensor_model_parallel_world_size",  # noqa: E501
-                return_value=2):
+            "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.get_tensor_model_parallel_world_size",  # noqa: E501
+            return_value=2,
+        ):
             # Initialize connector and worker (with fake NIXL wrapper)
             connector = NixlConnector(vllm_config, KVConnectorRole.WORKER)
             connector.connector_worker = FakeNixlConnectorWorker(
-                vllm_config, connector.engine_id, hand_shake_latency=0)
+                vllm_config, connector.engine_id, hand_shake_latency=0
+            )
             worker = connector.connector_worker
 
             # Minimal local registration params used by add_remote_agent
@@ -521,8 +553,7 @@ def test_handshake_fails_on_kv_cache_layout_mismatch(self, dist_init):
             worker.dst_num_blocks[worker.engine_id] = worker.num_blocks
 
             # Metadata with different kv_cache_layout than local worker
-            mismatched_layout = "HND" if worker.kv_cache_layout != "HND" \
-                else "NHD"
+            mismatched_layout = "HND" if worker.kv_cache_layout != "HND" else "NHD"
             meta = NixlAgentMetadata(
                 engine_id=FakeNixlConnectorWorker.REMOTE_ENGINE_ID,
                 agent_metadata=FakeNixlWrapper.AGENT_METADATA,
@@ -545,16 +576,17 @@ def test_handshake_fails_on_kv_cache_layout_mismatch(self, dist_init):
 # the rest of the tests.
 @patch(
     "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.NixlWrapper",
-    FakeNixlWrapper)
+    FakeNixlWrapper,
+)
 def test_kv_connector_stats(dist_init):
     """Test that KV transfer stats are properly recorded and retrieved."""
     vllm_config = create_vllm_config()
 
     # Test worker role in decode server.
     connector = NixlConnector(vllm_config, KVConnectorRole.WORKER)
-    connector.connector_worker = FakeNixlConnectorWorker(vllm_config,
-                                                         connector.engine_id,
-                                                         hand_shake_latency=0)
+    connector.connector_worker = FakeNixlConnectorWorker(
+        vllm_config, connector.engine_id, hand_shake_latency=0
+    )
 
     # Verify that xfer_stats starts empty
     initial_stats = connector.get_kv_connector_stats()
@@ -563,16 +595,17 @@ def test_kv_connector_stats(dist_init):
     # Create transfer metadata
     request_id = "test_req_for_stats"
     metadata = NixlConnectorMetadata()
-    metadata.add_new_req(request_id=request_id,
-                         local_block_ids=[1, 2, 3],
-                         kv_transfer_params={
-                             "remote_block_ids": [4, 5, 6],
-                             "remote_engine_id":
-                             FakeNixlConnectorWorker.REMOTE_ENGINE_ID,
-                             "remote_host": "localhost",
-                             "remote_port": 1234,
-                             "remote_tp_size": 1,
-                         })
+    metadata.add_new_req(
+        request_id=request_id,
+        local_block_ids=[1, 2, 3],
+        kv_transfer_params={
+            "remote_block_ids": [4, 5, 6],
+            "remote_engine_id": FakeNixlConnectorWorker.REMOTE_ENGINE_ID,
+            "remote_host": "localhost",
+            "remote_port": 1234,
+            "remote_tp_size": 1,
+        },
+    )
     connector.bind_connector_metadata(metadata)
 
     # Start the transfer
@@ -593,8 +626,7 @@ def test_kv_connector_stats(dist_init):
         _, done_recving = connector.get_finished(finished_req_ids=set())
         if len(done_recving) > 0 and request_id in done_recving:
             break
-        time.sleep(
-            0.1)  # Small delay to allow background handshake to complete
+        time.sleep(0.1)  # Small delay to allow background handshake to complete
     else:
         assert "Transfer did not complete within expected iterations"
 
@@ -613,7 +645,7 @@ def test_kv_connector_stats(dist_init):
 
 def test_kv_connector_stats_aggregation():
     """
-    Test KV transfer stats aggregation across TP ranks using 
+    Test KV transfer stats aggregation across TP ranks using
     KVOutputAggregator (used by MultiprocExecutor).
     """
 
@@ -636,18 +668,16 @@ def test_kv_connector_stats_aggregation():
     worker2_stats.record_transfer(stats)
 
     # Worker 3: 3 transfers
-    stats = get_default_xfer_telemetry(xferDurationS=2,
-                                       postDurationS=2,
-                                       totalBytes=2,
-                                       descCount=2)
+    stats = get_default_xfer_telemetry(
+        xferDurationS=2, postDurationS=2, totalBytes=2, descCount=2
+    )
     worker3_stats.record_transfer(stats)
     worker3_stats.record_transfer(stats)
     worker3_stats.record_transfer(stats)
 
     # Create ModelRunnerOutput instances for each worker
     worker_outputs = []
-    for i, worker_stats in enumerate(
-        [worker1_stats, worker2_stats, worker3_stats]):
+    for i, worker_stats in enumerate([worker1_stats, worker2_stats, worker3_stats]):
         output = ModelRunnerOutput(
             req_ids=[f"req_{i}"],
             req_id_to_index={f"req_{i}": 0},
@@ -657,17 +687,19 @@ def test_kv_connector_stats_aggregation():
             pooler_output=[None],
             kv_connector_output=KVConnectorOutput(
                 finished_sending=set([f"req_{i}_send"])
-                if i < 2 else None,  # Workers 0,1 finished sending
+                if i < 2
+                else None,  # Workers 0,1 finished sending
                 finished_recving=set([f"req_{i}_recv"])
-                if i > 0 else None,  # Workers 1,2 finished receiving
+                if i > 0
+                else None,  # Workers 1,2 finished receiving
                 kv_connector_stats=worker_stats,
-            ))
+            ),
+        )
         worker_outputs.append(output)
 
     # Use the real aggregation mechanism (like MultiprocExecutor.execute_model)
     aggregated_output = aggregator.aggregate(worker_outputs, output_rank=0)
-    kv_connector_stats = \
-        aggregated_output.kv_connector_output.kv_connector_stats
+    kv_connector_stats = aggregated_output.kv_connector_output.kv_connector_stats
     assert isinstance(kv_connector_stats, NixlKVConnectorStats)
     # Number of total transfers across all workers.
     assert kv_connector_stats.num_successful_transfers == 6
@@ -691,7 +723,6 @@ def test_multi_kv_connector_stats_aggregation():
     # Mock a KVConnectorStats class for testing aggregation over connectors.
     @dataclass
     class FooKVConnectorStats(KVConnectorStats):
-
         def reset(self):
             self.data = {"num_foo_transfers": 0}
 
@@ -703,15 +734,12 @@ def record_transfer(self):
         def is_empty(self) -> bool:
             return self.data["num_foo_transfers"] == 0
 
-        def aggregate(self,
-                      other: "FooKVConnectorStats") -> "FooKVConnectorStats":
+        def aggregate(self, other: "FooKVConnectorStats") -> "FooKVConnectorStats":
             if not other.is_empty():
-                self.data["num_foo_transfers"] += other.data[
-                    "num_foo_transfers"]
+                self.data["num_foo_transfers"] += other.data["num_foo_transfers"]
             return self
 
-    def make_multi_stats(nixl_count: int,
-                         foo_count: int) -> MultiKVConnectorStats:
+    def make_multi_stats(nixl_count: int, foo_count: int) -> MultiKVConnectorStats:
         data: dict[str, KVConnectorStats] = {}
         if nixl_count > 0:
             nixl_stats = NixlKVConnectorStats()
@@ -747,13 +775,11 @@ def make_multi_stats(nixl_count: int,
         worker_outputs.append(output)
 
     aggregated_output = aggregator.aggregate(worker_outputs, output_rank=0)
-    kv_connector_stats = \
-        aggregated_output.kv_connector_output.kv_connector_stats
+    kv_connector_stats = aggregated_output.kv_connector_output.kv_connector_stats
     assert isinstance(kv_connector_stats, MultiKVConnectorStats)
 
     # Validate per-connector totals across workers
-    assert isinstance(kv_connector_stats["NixlConnector"],
-                      NixlKVConnectorStats)
+    assert isinstance(kv_connector_stats["NixlConnector"], NixlKVConnectorStats)
     assert kv_connector_stats["NixlConnector"].num_successful_transfers == 5
     assert isinstance(kv_connector_stats["FooConnector"], FooKVConnectorStats)
     assert kv_connector_stats["FooConnector"].data["num_foo_transfers"] == 6
@@ -762,11 +788,12 @@ def make_multi_stats(nixl_count: int,
 @pytest.mark.parametrize("distributed_executor_backend", ["ray", None])
 @patch(
     "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.NixlWrapper",
-    FakeNixlWrapper)
+    FakeNixlWrapper,
+)
 def test_abort_timeout_on_prefiller(monkeypatch, distributed_executor_backend):
     """
     Test lifecycle of an aborted Remote Prefill request hitting the timeout.
-    -----> P 
+    -----> P
             |  {process request}
      <-/--- |  {result is NOT delivered, eg proxy is down}
             |
@@ -823,39 +850,38 @@ def _run_abort_timeout_test(llm_kwargs: dict, timeout: int):
     sampling_params = SamplingParams(
         temperature=0.0,
         max_tokens=1,
-        extra_args={"kv_transfer_params": remote_prefill_opts})
+        extra_args={"kv_transfer_params": remote_prefill_opts},
+    )
     scheduler = llm.llm_engine.engine_core.engine_core.scheduler
     req_to_blocks = scheduler.kv_cache_manager.coordinator.single_type_managers[
-        0].req_to_blocks
+        0
+    ].req_to_blocks
 
     padding = "Just making this request a little longer so that we're sure "
     "we're not hitting the small-request lower bound beneath which we don't "
     "actually trigger the whole kv transfer, but rather just recompute the "
     "blocks on D."
-    _ = llm.generate([f"What is the capital of Japan? {padding}"],
-                     sampling_params)
+    _ = llm.generate([f"What is the capital of Japan? {padding}"], sampling_params)
 
     # Request finished but not freed
-    assert '0' in scheduler.finished_req_ids and '0' in req_to_blocks
+    assert "0" in scheduler.finished_req_ids and "0" in req_to_blocks
     # Some other request, 0 still not freed
-    _ = llm.generate([f"What is the capital of Italy? {padding}"],
-                     sampling_params)
-    assert '0' in req_to_blocks
-    assert '1' in scheduler.finished_req_ids and '1' in req_to_blocks
+    _ = llm.generate([f"What is the capital of Italy? {padding}"], sampling_params)
+    assert "0" in req_to_blocks
+    assert "1" in scheduler.finished_req_ids and "1" in req_to_blocks
 
     # Wait for timeout and trigger another scheduler loop
     time.sleep(timeout)
-    _ = llm.generate([f"What is the capital of France? {padding}"],
-                     sampling_params)
+    _ = llm.generate([f"What is the capital of France? {padding}"], sampling_params)
     # Request-0 times out and is cleared!
-    assert '0' not in req_to_blocks
+    assert "0" not in req_to_blocks
 
 
 def test_register_kv_caches(dist_init):
     """
     Test that register_kv_caches() properly calls nixl_wrapper methods with
     correct data.
-    
+
     This test verifies:
     1. nixl_wrapper.get_reg_descs() is called with caches_data containing
        tensor metadata
@@ -866,10 +892,9 @@ def test_register_kv_caches(dist_init):
     vllm_config = create_vllm_config()
 
     # Create test kv cache tensors using proper backend shape
-    kv_cache_shape = FlashAttentionBackend.get_kv_cache_shape(num_blocks=2,
-                                                              block_size=16,
-                                                              num_kv_heads=4,
-                                                              head_size=64)
+    kv_cache_shape = FlashAttentionBackend.get_kv_cache_shape(
+        num_blocks=2, block_size=16, num_kv_heads=4, head_size=64
+    )
     shared_tensor = torch.zeros(*kv_cache_shape, dtype=torch.float16)
     unique_tensor = torch.zeros(*kv_cache_shape, dtype=torch.float16)
     kv_caches = {
@@ -879,21 +904,30 @@ def test_register_kv_caches(dist_init):
     }
 
     # Store tensor info for validation
-    expected_tensor_size = shared_tensor[0].element_size(
-    ) * shared_tensor[0].numel()
+    expected_tensor_size = shared_tensor[0].element_size() * shared_tensor[0].numel()
     expected_base_addrs = [
-        shared_tensor[0].data_ptr(), shared_tensor[1].data_ptr(),
-        unique_tensor[0].data_ptr(), unique_tensor[1].data_ptr()
+        shared_tensor[0].data_ptr(),
+        shared_tensor[1].data_ptr(),
+        unique_tensor[0].data_ptr(),
+        unique_tensor[1].data_ptr(),
     ]
 
-    with patch("vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.NixlWrapper") as mock_nixl_wrapper, \
-         patch("vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.threading.Event"), \
-         patch("vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.threading.Thread"):  # noqa: E501
-
+    with (
+        patch(
+            "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.NixlWrapper"
+        ) as mock_nixl_wrapper,
+        patch(
+            "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.threading.Event"
+        ),
+        patch(
+            "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.threading.Thread"
+        ),
+    ):  # noqa: E501
         # Create connector
         connector = NixlConnector(vllm_config, KVConnectorRole.WORKER)
         connector.connector_worker = FakeNixlConnectorWorker(
-            vllm_config, connector.engine_id, hand_shake_latency=0)
+            vllm_config, connector.engine_id, hand_shake_latency=0
+        )
 
         # Get the mock instance
         mock_wrapper_instance = mock_nixl_wrapper.return_value
@@ -909,12 +943,13 @@ def test_register_kv_caches(dist_init):
 
         for i, cache_entry in enumerate(caches_data):
             base_addr, size, _tp_rank, _ = cache_entry
-            assert size == expected_tensor_size, \
-                f"Entry {i}: Expected tensor size {expected_tensor_size}, " \
-                f"got {size}"
-            assert base_addr == expected_base_addrs[i], \
-                f"Entry {i}: Expected base address {expected_base_addrs[i]}, " \
+            assert size == expected_tensor_size, (
+                f"Entry {i}: Expected tensor size {expected_tensor_size}, got {size}"
+            )
+            assert base_addr == expected_base_addrs[i], (
+                f"Entry {i}: Expected base address {expected_base_addrs[i]}, "
                 f"got {base_addr}"
+            )
 
         # Verify get_xfer_descs was called with blocks_data
         assert mock_wrapper_instance.get_xfer_descs.called
@@ -922,16 +957,17 @@ def test_register_kv_caches(dist_init):
 
         # Validate blocks_data structure and size
         expected_blocks_count = 8
-        assert len(blocks_data) == expected_blocks_count, \
-            f"Expected {expected_blocks_count} blocks, " \
-            f"got {len(blocks_data)}"
+        assert len(blocks_data) == expected_blocks_count, (
+            f"Expected {expected_blocks_count} blocks, got {len(blocks_data)}"
+        )
 
         expected_block_len = expected_tensor_size // 2
         for i, block_entry in enumerate(blocks_data):
             block_start_addr, block_len, tp_rank = block_entry
-            assert block_len == expected_block_len, \
-                f"Block entry {i}: Expected block len {expected_block_len}, " \
+            assert block_len == expected_block_len, (
+                f"Block entry {i}: Expected block len {expected_block_len}, "
                 f"got {block_len}"
+            )
 
 
 class FakePlatform(Platform):
@@ -940,24 +976,26 @@ class FakePlatform(Platform):
     @classmethod
     def get_nixl_supported_devices(cls) -> dict[str, tuple[str, ...]]:
         """
-        Returns a mapping from device_type to a tuple of supported 
+        Returns a mapping from device_type to a tuple of supported
         kv_buffer_device for nixl.
         """
-        return {'oot': ('oot', )}
+        return {"oot": ("oot",)}
 
     @classmethod
     def get_nixl_memory_type(cls) -> Optional[str]:
         """
         Returns the nixl memory type for the current platform.
         """
-        return 'VRAM'
+        return "VRAM"
 
 
-@pytest.mark.parametrize("kv_buffer_device, nixl_memory_type", [
-    ("oot", "VRAM"),
-])
-def test_kv_buffer_to_nixl_memory_types(dist_init, kv_buffer_device,
-                                        nixl_memory_type):
+@pytest.mark.parametrize(
+    "kv_buffer_device, nixl_memory_type",
+    [
+        ("oot", "VRAM"),
+    ],
+)
+def test_kv_buffer_to_nixl_memory_types(dist_init, kv_buffer_device, nixl_memory_type):
     """
     Test that register_kv_caches() passes the correct memory types from the
     config to the nixl_wrapper.
@@ -966,15 +1004,30 @@ def test_kv_buffer_to_nixl_memory_types(dist_init, kv_buffer_device,
     # Override the default memory types in the config
     vllm_config.kv_transfer_config.kv_buffer_device = kv_buffer_device
     from vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector import (
-        _NIXL_SUPPORTED_DEVICE)
-    _NIXL_SUPPORTED_DEVICE.update(FakePlatform.get_nixl_supported_devices())
+        _NIXL_SUPPORTED_DEVICE,
+    )
 
-    with patch("vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.NixlWrapper"), \
-         patch("vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.threading.Event"), \
-         patch("vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.threading.Thread"), \
-         patch("vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.current_platform", FakePlatform), \
-         patch("vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector._NIXL_SUPPORTED_DEVICE", _NIXL_SUPPORTED_DEVICE):  # noqa: E501
+    _NIXL_SUPPORTED_DEVICE.update(FakePlatform.get_nixl_supported_devices())
 
+    with (
+        patch(
+            "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.NixlWrapper"
+        ),
+        patch(
+            "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.threading.Event"
+        ),
+        patch(
+            "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.threading.Thread"
+        ),
+        patch(
+            "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.current_platform",
+            FakePlatform,
+        ),
+        patch(
+            "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector._NIXL_SUPPORTED_DEVICE",
+            _NIXL_SUPPORTED_DEVICE,
+        ),
+    ):  # noqa: E501
         # Create connector and replace its worker with a fake one for isolation
         connector = NixlConnector(vllm_config, KVConnectorRole.WORKER)
 
@@ -985,22 +1038,23 @@ def test_kv_buffer_to_nixl_memory_types(dist_init, kv_buffer_device,
 
 @patch(
     "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.NixlWrapper",
-    FakeNixlWrapper)
+    FakeNixlWrapper,
+)
 def test_shutdown_cleans_up_resources(dist_init):
     """Test that shutdown() properly cleans up all resources."""
     vllm_config = create_vllm_config()
 
-    worker = NixlConnectorWorker(vllm_config,
-                                 vllm_config.kv_transfer_config.engine_id)
+    worker = NixlConnectorWorker(vllm_config, vllm_config.kv_transfer_config.engine_id)
     nixl_wrapper = worker.nixl_wrapper
 
-    with patch.object(worker, '_handshake_initiation_executor') as mock_exec, \
-         patch.object(worker, '_nixl_handshake_listener_t') as mock_listener, \
-         patch.object(nixl_wrapper, 'release_xfer_handle') as mock_rel_xfer, \
-         patch.object(nixl_wrapper, 'release_dlist_handle') as mock_rel_dlist, \
-         patch.object(nixl_wrapper, 'remove_remote_agent') as mock_rem_agent, \
-         patch.object(nixl_wrapper, 'deregister_memory') as mock_dereg:
-
+    with (
+        patch.object(worker, "_handshake_initiation_executor") as mock_exec,
+        patch.object(worker, "_nixl_handshake_listener_t") as mock_listener,
+        patch.object(nixl_wrapper, "release_xfer_handle") as mock_rel_xfer,
+        patch.object(nixl_wrapper, "release_dlist_handle") as mock_rel_dlist,
+        patch.object(nixl_wrapper, "remove_remote_agent") as mock_rem_agent,
+        patch.object(nixl_wrapper, "deregister_memory") as mock_dereg,
+    ):
         worker._recving_transfers = {"req1": [(123, time.perf_counter())]}
         worker.src_xfer_side_handle = 456
         worker.dst_xfer_side_handles = {"engine1": 789}
@@ -1028,7 +1082,8 @@ def test_shutdown_cleans_up_resources(dist_init):
 
 @patch(
     "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector.NixlWrapper",
-    FakeNixlWrapper)
+    FakeNixlWrapper,
+)
 def test_aborted_request_removed_from_worker_in_batch(dist_init):
     """
     Create and schedule a request so that P adds it to in-batch tracking via
@@ -1040,9 +1095,9 @@ def test_aborted_request_removed_from_worker_in_batch(dist_init):
     scheduler = create_scheduler(vllm_config)
     # KVConnector Worker in P
     connector = NixlConnector(vllm_config, KVConnectorRole.WORKER)
-    connector.connector_worker = FakeNixlConnectorWorker(vllm_config,
-                                                         connector.engine_id,
-                                                         hand_shake_latency=0)
+    connector.connector_worker = FakeNixlConnectorWorker(
+        vllm_config, connector.engine_id, hand_shake_latency=0
+    )
 
     # Create a request that triggers do_remote_decode so that
     # the scheduler adds it to reqs_in_batch
diff --git a/tests/v1/kv_connector/unit/test_offloading_connector.py b/tests/v1/kv_connector/unit/test_offloading_connector.py
index f728b25d7834..9784053750ba 100644
--- a/tests/v1/kv_connector/unit/test_offloading_connector.py
+++ b/tests/v1/kv_connector/unit/test_offloading_connector.py
@@ -14,27 +14,42 @@
 from vllm.distributed.kv_events import BlockRemoved, BlockStored
 from vllm.distributed.kv_transfer.kv_connector.v1 import KVConnectorRole
 from vllm.distributed.kv_transfer.kv_connector.v1.offloading_connector import (
-    OffloadingConnector, OffloadingConnectorMetadata)
+    OffloadingConnector,
+    OffloadingConnectorMetadata,
+)
 from vllm.forward_context import ForwardContext
 from vllm.utils import sha256
-from vllm.v1.core.kv_cache_utils import (BlockHash, get_request_block_hasher,
-                                         init_none_hash)
+from vllm.v1.core.kv_cache_utils import (
+    BlockHash,
+    get_request_block_hasher,
+    init_none_hash,
+)
 from vllm.v1.core.sched.scheduler import Scheduler
-from vllm.v1.kv_offload.abstract import (LoadStoreSpec, OffloadingEvent,
-                                         OffloadingManager, PrepareStoreOutput)
+from vllm.v1.kv_offload.abstract import (
+    LoadStoreSpec,
+    OffloadingEvent,
+    OffloadingManager,
+    PrepareStoreOutput,
+)
 from vllm.v1.kv_offload.mediums import GPULoadStoreSpec
 from vllm.v1.kv_offload.spec import OffloadingSpec
-from vllm.v1.kv_offload.worker.worker import (OffloadingHandler,
-                                              TransferResult, TransferSpec)
+from vllm.v1.kv_offload.worker.worker import (
+    OffloadingHandler,
+    TransferResult,
+    TransferSpec,
+)
 from vllm.v1.outputs import EMPTY_MODEL_RUNNER_OUTPUT, KVConnectorOutput
 from vllm.v1.request import Request
 
-from .utils import (EOS_TOKEN_ID, create_model_runner_output, create_scheduler,
-                    create_vllm_config)
+from .utils import (
+    EOS_TOKEN_ID,
+    create_model_runner_output,
+    create_scheduler,
+    create_vllm_config,
+)
 
 
 class MockLoadStoreSpec(LoadStoreSpec):
-
     def __init__(self, block_hashes: Iterable[BlockHash]):
         self.block_hashes: list[BlockHash] = list(block_hashes)
 
@@ -47,7 +62,6 @@ def __repr__(self) -> str:
 
 
 class MockOffloadingHandler(OffloadingHandler):
-
     def __init__(self):
         self.completed_transfers: list[TransferResult] = []
         self.completed_specs: list[TransferSpec] = []
@@ -64,14 +78,14 @@ def transfer_async(self, job_id: int, spec: TransferSpec) -> bool:
 
 
 class MockOffloadingSpec(OffloadingSpec):
-
     def __init__(self, vllm_config: VllmConfig):
         super().__init__(vllm_config)
 
         self.manager = MagicMock(spec=OffloadingManager)
         self.manager.lookup.return_value = 0
-        self.manager.prepare_load = lambda block_hashes: (MockLoadStoreSpec(
-            block_hashes))
+        self.manager.prepare_load = lambda block_hashes: (
+            MockLoadStoreSpec(block_hashes)
+        )
         self.handler = MockOffloadingHandler()
 
     def get_manager(self) -> OffloadingManager:
@@ -79,9 +93,7 @@ def get_manager(self) -> OffloadingManager:
 
     def get_handlers(
         self, _
-    ) -> Iterator[tuple[type[LoadStoreSpec], type[LoadStoreSpec],
-                        OffloadingHandler]]:
-
+    ) -> Iterator[tuple[type[LoadStoreSpec], type[LoadStoreSpec], OffloadingHandler]]:
         yield GPULoadStoreSpec, MockLoadStoreSpec, self.handler
         yield MockLoadStoreSpec, GPULoadStoreSpec, self.handler
 
@@ -98,35 +110,35 @@ class TransferSummary:
 
 
 class RequestRunner:
-
-    def __init__(self, offloaded_block_size: int, gpu_block_size: int,
-                 num_gpu_blocks: int):
+    def __init__(
+        self, offloaded_block_size: int, gpu_block_size: int, num_gpu_blocks: int
+    ):
         self.offloaded_block_size: int = offloaded_block_size
         self.gpu_block_size: int = gpu_block_size
         self.num_gpu_blocks: int = num_gpu_blocks
 
         self.req_id: int = -1
 
-        vllm_config = create_vllm_config(block_size=gpu_block_size,
-                                         max_num_batched_tokens=1000)
+        vllm_config = create_vllm_config(
+            block_size=gpu_block_size, max_num_batched_tokens=1000
+        )
         vllm_config.kv_transfer_config = KVTransferConfig(
             kv_connector="OffloadingConnector",
             kv_role="kv_both",
             kv_connector_extra_config={
                 "spec_name": "MockOffloadingSpec",
-                "spec_module_path":
-                "tests.v1.kv_connector.unit.test_offloading_connector",
+                "spec_module_path": "tests.v1.kv_connector.unit.test_offloading_connector",
                 "block_size": offloaded_block_size,
-            })
+            },
+        )
 
-        self.scheduler: Scheduler = create_scheduler(vllm_config,
-                                                     num_blocks=num_gpu_blocks)
-        self.worker_connector = OffloadingConnector(vllm_config,
-                                                    KVConnectorRole.WORKER)
+        self.scheduler: Scheduler = create_scheduler(
+            vllm_config, num_blocks=num_gpu_blocks
+        )
+        self.worker_connector = OffloadingConnector(vllm_config, KVConnectorRole.WORKER)
 
         # register worker kv_caches to enable OffloadingWorker creations
-        self.worker_connector.register_kv_caches(
-            kv_caches={"a": torch.empty(0)})
+        self.worker_connector.register_kv_caches(kv_caches={"a": torch.empty(0)})
 
         # extract connector of scheduler
         scheduler_connector = self.scheduler.connector
@@ -166,9 +178,9 @@ def __init__(self, offloaded_block_size: int, gpu_block_size: int,
         init_none_hash(sha256)
         self._block_hasher = get_request_block_hasher(gpu_block_size, sha256)
 
-        self._dummy_ctx: ForwardContext = ForwardContext(no_compile_layers={},
-                                                         attn_metadata={},
-                                                         virtual_engine=0)
+        self._dummy_ctx: ForwardContext = ForwardContext(
+            no_compile_layers={}, attn_metadata={}, virtual_engine=0
+        )
 
     def new_request(self, token_ids: list[int]):
         assert not self.scheduler.requests
@@ -189,8 +201,7 @@ def _wait_for_transfers(self):
         block_size_factor = self.offloaded_block_size // self.gpu_block_size
 
         while self.pending_loads_count or self.pending_stores_count:
-            for transfer_spec in (
-                    self.offloading_spec.get_completed_transfers()):
+            for transfer_spec in self.offloading_spec.get_completed_transfers():
                 src_spec, dst_spec = transfer_spec
 
                 if isinstance(src_spec, GPULoadStoreSpec):
@@ -207,8 +218,7 @@ def _wait_for_transfers(self):
 
                 gpu_block_indices: list[int] = []
                 for block_id in gpu_spec.block_ids:
-                    gpu_block_indices.append(
-                        self.gpu_block_index[block_id.item()])
+                    gpu_block_indices.append(self.gpu_block_index[block_id.item()])
 
                 # list of (block_hash, sub_block_offset)
                 offload_addresses: list[Any] = []
@@ -220,23 +230,26 @@ def _wait_for_transfers(self):
                     assert len(gpu_block_indices) == len(offload_addresses)
 
                     self.completed_stores.append(
-                        TransferSummary(gpu_block_indices, offload_addresses))
+                        TransferSummary(gpu_block_indices, offload_addresses)
+                    )
                     self.pending_stores_count -= 1
                 else:
-                    remainder_sub_block_count = (len(offload_addresses) -
-                                                 len(gpu_block_indices))
+                    remainder_sub_block_count = len(offload_addresses) - len(
+                        gpu_block_indices
+                    )
                     assert remainder_sub_block_count >= 0
                     assert remainder_sub_block_count < block_size_factor
-                    offload_addresses = offload_addresses[
-                        remainder_sub_block_count:]
+                    offload_addresses = offload_addresses[remainder_sub_block_count:]
 
                     self.completed_loads.append(
-                        TransferSummary(gpu_block_indices, offload_addresses))
+                        TransferSummary(gpu_block_indices, offload_addresses)
+                    )
                     self.pending_loads_count -= 1
 
     def _update_gpu_block_idx(self):
-        for blocks in (self.scheduler.kv_cache_manager.coordinator.
-                       single_type_managers[0].req_to_blocks.values()):
+        for blocks in self.scheduler.kv_cache_manager.coordinator.single_type_managers[
+            0
+        ].req_to_blocks.values():
             for block_idx, block in enumerate(blocks):
                 self.gpu_block_index[block.block_id] = block_idx
 
@@ -259,23 +272,20 @@ def _run(self, decoded_tokens: list[int]):
 
             kv_connector_metadata = scheduler_output.kv_connector_metadata
             assert kv_connector_metadata is not None
-            assert isinstance(kv_connector_metadata,
-                              OffloadingConnectorMetadata)
+            assert isinstance(kv_connector_metadata, OffloadingConnectorMetadata)
 
             self.pending_loads_count += len(kv_connector_metadata.reqs_to_load)
-            self.pending_stores_count += len(
-                kv_connector_metadata.reqs_to_store)
+            self.pending_stores_count += len(kv_connector_metadata.reqs_to_store)
 
-            self.worker_connector.bind_connector_metadata(
-                kv_connector_metadata)
+            self.worker_connector.bind_connector_metadata(kv_connector_metadata)
             self.worker_connector.start_load_kv(self._dummy_ctx)
 
             if scheduler_output.total_num_scheduled_tokens > 0:
                 self.worker_connector.wait_for_save()
 
-            finished_sending, finished_recving = (
-                self.worker_connector.get_finished(
-                    scheduler_output.finished_req_ids))
+            finished_sending, finished_recving = self.worker_connector.get_finished(
+                scheduler_output.finished_req_ids
+            )
 
             self.worker_connector.clear_connector_metadata()
 
@@ -283,13 +293,13 @@ def _run(self, decoded_tokens: list[int]):
                 reqs=self.scheduler.running,
                 finished_sending=finished_sending,
                 finished_recving=finished_recving,
-                token_id=token_id)
+                token_id=token_id,
+            )
 
             if self.scheduler.running:
                 token_id = next(tokens_iter, None)
 
-            self.scheduler.update_from_output(scheduler_output,
-                                              model_runner_output)
+            self.scheduler.update_from_output(scheduler_output, model_runner_output)
 
         self._wait_for_transfers()
 
@@ -300,24 +310,24 @@ def _run(self, decoded_tokens: list[int]):
             while self.scheduler.requests:
                 scheduler_output = self.scheduler.schedule()
 
-                finished_sending, finished_recving = (
-                    self.worker_connector.get_finished(
-                        scheduler_output.finished_req_ids))
+                finished_sending, finished_recving = self.worker_connector.get_finished(
+                    scheduler_output.finished_req_ids
+                )
 
                 assert not finished_recving
 
                 model_runner_output = copy.deepcopy(EMPTY_MODEL_RUNNER_OUTPUT)
                 model_runner_output.kv_connector_output = KVConnectorOutput(
-                    finished_sending=finished_sending)
+                    finished_sending=finished_sending
+                )
 
-                self.scheduler.update_from_output(scheduler_output,
-                                                  model_runner_output)
+                self.scheduler.update_from_output(scheduler_output, model_runner_output)
 
     def run(
-            self,
-            decoded_tokens: list[int],
-            expected_stored_gpu_block_indexes: tuple[int, ...] = (),
-            expected_loaded_gpu_block_indexes: tuple[int, ...] = (),
+        self,
+        decoded_tokens: list[int],
+        expected_stored_gpu_block_indexes: tuple[int, ...] = (),
+        expected_loaded_gpu_block_indexes: tuple[int, ...] = (),
     ):
         """
         Runs multiple engine (scheduler + worker) steps.
@@ -337,23 +347,23 @@ def run(
         loaded_gpu_block_indexes: set[int] = set()
         for transfer in self.completed_loads:
             for gpu_block_idx, offloaded_address in zip(
-                    transfer.gpu_block_indices, transfer.offload_addresses):
+                transfer.gpu_block_indices, transfer.offload_addresses
+            ):
                 loaded_gpu_block_indexes.add(gpu_block_idx)
                 assert gpu_block_idx == self.offloaded[offloaded_address]
 
-        assert (
-            set(expected_loaded_gpu_block_indexes) == loaded_gpu_block_indexes)
+        assert set(expected_loaded_gpu_block_indexes) == loaded_gpu_block_indexes
         self.completed_loads.clear()
 
         stored_gpu_block_indexes: set[int] = set()
         for transfer in self.completed_stores:
             for gpu_block_idx, offloaded_address in zip(
-                    transfer.gpu_block_indices, transfer.offload_addresses):
+                transfer.gpu_block_indices, transfer.offload_addresses
+            ):
                 stored_gpu_block_indexes.add(gpu_block_idx)
                 self.offloaded[offloaded_address] = gpu_block_idx
 
-        assert (
-            set(expected_stored_gpu_block_indexes) == stored_gpu_block_indexes)
+        assert set(expected_stored_gpu_block_indexes) == stored_gpu_block_indexes
         self.completed_stores.clear()
 
 
@@ -362,9 +372,11 @@ def request_runner():
     runners = []
 
     def runner_factory(offloaded_block_size, gpu_block_size, num_gpu_blocks):
-        runner = RequestRunner(offloaded_block_size=offloaded_block_size,
-                               gpu_block_size=gpu_block_size,
-                               num_gpu_blocks=num_gpu_blocks)
+        runner = RequestRunner(
+            offloaded_block_size=offloaded_block_size,
+            gpu_block_size=gpu_block_size,
+            num_gpu_blocks=num_gpu_blocks,
+        )
         runners.append(runner)
         return runner
 
@@ -386,15 +398,18 @@ def test_offloading_connector(request_runner):
     num_gpu_blocks = 100
     block_size_factor = offloaded_block_size // gpu_block_size
 
-    runner = request_runner(offloaded_block_size=offloaded_block_size,
-                            gpu_block_size=gpu_block_size,
-                            num_gpu_blocks=num_gpu_blocks)
+    runner = request_runner(
+        offloaded_block_size=offloaded_block_size,
+        gpu_block_size=gpu_block_size,
+        num_gpu_blocks=num_gpu_blocks,
+    )
 
     # 3 blocks, store just the middle block (skip first and last)
     # blocks = [0, 1, 2], [3, 4, 5], [6, 7, 8]
     runner.new_request(token_ids=[0] * offloaded_block_size * 3)
-    runner.manager.prepare_store.side_effect = \
+    runner.manager.prepare_store.side_effect = (
         lambda block_hashes: generate_store_output(list(block_hashes)[1:2])
+    )
     runner.run(decoded_tokens=[0], expected_stored_gpu_block_indexes=(3, 4, 5))
 
     # add block missing 1 token -> no offload
@@ -402,21 +417,24 @@ def test_offloading_connector(request_runner):
     runner.manager.prepare_store.assert_not_called()
 
     # +1 token -> single block, fail prepare_store
-    runner.manager.prepare_store.side_effect = \
-        lambda block_hashes: None
+    runner.manager.prepare_store.side_effect = lambda block_hashes: None
     runner.run(decoded_tokens=[0])
     runner.manager.prepare_store.assert_called()
 
     # 1 more block, now set block_hashes_to_store = []
-    runner.manager.prepare_store.side_effect = \
+    runner.manager.prepare_store.side_effect = (
         lambda block_hashes: generate_store_output([])
+    )
     runner.run(decoded_tokens=[0] * offloaded_block_size)
 
     # 1 more block, now check touch was called with all 6 blocks
-    runner.manager.prepare_store.side_effect = \
+    runner.manager.prepare_store.side_effect = (
         lambda block_hashes: generate_store_output(block_hashes)
-    runner.run(decoded_tokens=[0] * offloaded_block_size,
-               expected_stored_gpu_block_indexes=(15, 16, 17))
+    )
+    runner.run(
+        decoded_tokens=[0] * offloaded_block_size,
+        expected_stored_gpu_block_indexes=(15, 16, 17),
+    )
     runner.manager.touch.assert_called()
     block_hashes1 = list(runner.manager.touch.call_args.args[0])
     assert len(block_hashes1) == 6
@@ -426,9 +444,10 @@ def test_offloading_connector(request_runner):
 
     # create a new request differing only on the last token
     runner.new_request(token_ids=[0] * (offloaded_block_size * 6 - 1) + [1])
-    runner.run(decoded_tokens=[0],
-               expected_stored_gpu_block_indexes=tuple(
-                   range(6 * block_size_factor)))
+    runner.run(
+        decoded_tokens=[0],
+        expected_stored_gpu_block_indexes=tuple(range(6 * block_size_factor)),
+    )
     runner.manager.touch.assert_called()
     block_hashes2 = list(runner.manager.touch.call_args.args[0])
     assert len(block_hashes2) == 6
@@ -441,17 +460,20 @@ def test_offloading_connector(request_runner):
     runner.run(decoded_tokens=[EOS_TOKEN_ID])
 
     # full_block_tokens - num_computed_tokens < offloaded_block_size
-    runner.new_request(token_ids=[0] * gpu_block_size + [1] *
-                       (offloaded_block_size - gpu_block_size))
-    runner.manager.prepare_store.side_effect = \
+    runner.new_request(
+        token_ids=[0] * gpu_block_size + [1] * (offloaded_block_size - gpu_block_size)
+    )
+    runner.manager.prepare_store.side_effect = (
         lambda block_hashes: generate_store_output([])
+    )
     runner.run(decoded_tokens=[EOS_TOKEN_ID])
     runner.manager.lookup.assert_not_called()
 
     # single block lookup with no hits
     runner.new_request(token_ids=[1] * offloaded_block_size)
-    runner.manager.prepare_store.side_effect = \
+    runner.manager.prepare_store.side_effect = (
         lambda block_hashes: generate_store_output([])
+    )
     runner.run(decoded_tokens=[EOS_TOKEN_ID])
     runner.manager.lookup.assert_called()
     assert len(list(runner.manager.lookup.call_args.args[0])) == 1
@@ -459,34 +481,37 @@ def test_offloading_connector(request_runner):
     # single block lookup with a hit
     runner.scheduler.reset_prefix_cache()
     runner.new_request(token_ids=[0] * offloaded_block_size)
-    runner.manager.prepare_store.side_effect = \
+    runner.manager.prepare_store.side_effect = (
         lambda block_hashes: generate_store_output([])
+    )
     runner.manager.lookup.return_value = 1
-    runner.run(decoded_tokens=[EOS_TOKEN_ID],
-               expected_loaded_gpu_block_indexes=(0, 1, 2))
+    runner.run(
+        decoded_tokens=[EOS_TOKEN_ID], expected_loaded_gpu_block_indexes=(0, 1, 2)
+    )
 
     # single block lookup with a hit in a middle block
-    runner.new_request(token_ids=[0] * offloaded_block_size * 2 +
-                       [1] * offloaded_block_size)
-    runner.manager.prepare_store.side_effect = \
+    runner.new_request(
+        token_ids=[0] * offloaded_block_size * 2 + [1] * offloaded_block_size
+    )
+    runner.manager.prepare_store.side_effect = (
         lambda block_hashes: generate_store_output([])
+    )
     runner.manager.lookup.return_value = 1
-    runner.run(decoded_tokens=[EOS_TOKEN_ID],
-               expected_loaded_gpu_block_indexes=(3, 4, 5))
+    runner.run(
+        decoded_tokens=[EOS_TOKEN_ID], expected_loaded_gpu_block_indexes=(3, 4, 5)
+    )
 
     # test take_events
     def to_hashes(int_hashes: list[int]) -> list[BlockHash]:
         return [BlockHash(str(i).encode()) for i in int_hashes]
 
     def take_events() -> Iterable[OffloadingEvent]:
-        yield OffloadingEvent(block_hashes=to_hashes([1, 2, 3]),
-                              block_size=16,
-                              medium="A",
-                              removed=False)
-        yield OffloadingEvent(block_hashes=to_hashes([4, 5, 6]),
-                              block_size=32,
-                              medium="B",
-                              removed=True)
+        yield OffloadingEvent(
+            block_hashes=to_hashes([1, 2, 3]), block_size=16, medium="A", removed=False
+        )
+        yield OffloadingEvent(
+            block_hashes=to_hashes([4, 5, 6]), block_size=32, medium="B", removed=True
+        )
 
     runner.manager.take_events.side_effect = take_events
     events = list(runner.scheduler_connector.take_events())
diff --git a/tests/v1/kv_connector/unit/test_output_aggreagator.py b/tests/v1/kv_connector/unit/test_output_aggreagator.py
index 8c85732297f2..d05cbe1a2fd4 100644
--- a/tests/v1/kv_connector/unit/test_output_aggreagator.py
+++ b/tests/v1/kv_connector/unit/test_output_aggreagator.py
@@ -12,22 +12,25 @@
 
 
 class DummyModelRunnerOutput(ModelRunnerOutput):
-
-    def __init__(self,
-                 finished_sending: Optional[set[str]] = None,
-                 finished_recving: Optional[set[str]] = None,
-                 invalid_block_ids: Optional[set[int]] = None):
+    def __init__(
+        self,
+        finished_sending: Optional[set[str]] = None,
+        finished_recving: Optional[set[str]] = None,
+        invalid_block_ids: Optional[set[int]] = None,
+    ):
         self.kv_connector_output = KVConnectorOutput(
             finished_sending=finished_sending,
             finished_recving=finished_recving,
-            invalid_block_ids=invalid_block_ids or set())
+            invalid_block_ids=invalid_block_ids or set(),
+        )
 
     def __repr__(self):
         return (
             f"DummyModelRunnerOutput("
             f"finished_sending={self.kv_connector_output.finished_sending},"
             f"finished_recving={self.kv_connector_output.finished_recving})"
-            f"invalid_block_ids={self.kv_connector_output.invalid_block_ids})")
+            f"invalid_block_ids={self.kv_connector_output.invalid_block_ids})"
+        )
 
 
 def test_aggregate_workers_output():
@@ -44,8 +47,9 @@ def test_aggregate_workers_output():
     assert aggregated.finished_recving is None
     assert not aggregated.invalid_block_ids
 
-    output1 = DummyModelRunnerOutput(finished_sending={'req1'},
-                                     finished_recving={'req2'})
+    output1 = DummyModelRunnerOutput(
+        finished_sending={"req1"}, finished_recving={"req2"}
+    )
     output2 = DummyModelRunnerOutput(invalid_block_ids={1})
 
     aggregated = aggregator.aggregate([output1, output2])
@@ -57,26 +61,27 @@ def test_aggregate_workers_output():
     assert aggregated.invalid_block_ids == {1}
 
     output1 = DummyModelRunnerOutput(invalid_block_ids={2})
-    output2 = DummyModelRunnerOutput(finished_sending={'req1'})
+    output2 = DummyModelRunnerOutput(finished_sending={"req1"})
 
     aggregated = aggregator.aggregate([output1, output2])
 
     assert aggregated is output1
     aggregated = aggregated.kv_connector_output
-    assert aggregated.finished_sending == {'req1'}
+    assert aggregated.finished_sending == {"req1"}
     assert aggregated.finished_recving is None
     assert aggregated.invalid_block_ids == {2}
 
     output1 = DummyModelRunnerOutput(invalid_block_ids={3, 4})
-    output2 = DummyModelRunnerOutput(finished_recving={'req2'},
-                                     invalid_block_ids={4, 5})
+    output2 = DummyModelRunnerOutput(
+        finished_recving={"req2"}, invalid_block_ids={4, 5}
+    )
 
     aggregated = aggregator.aggregate([output1, output2])
 
     assert aggregated is output1
     aggregated = aggregated.kv_connector_output
     assert aggregated.finished_sending is None
-    assert aggregated.finished_recving == {'req2'}
+    assert aggregated.finished_recving == {"req2"}
     assert aggregated.invalid_block_ids == {3, 4, 5}
 
 
@@ -104,8 +109,9 @@ def test_async_aggregate_workers_output():
     future2 = Future()
     result_future = aggregator.async_aggregate([future1, future2])
 
-    output1 = DummyModelRunnerOutput(finished_sending={'req1'},
-                                     finished_recving={'req2'})
+    output1 = DummyModelRunnerOutput(
+        finished_sending={"req1"}, finished_recving={"req2"}
+    )
     output2 = DummyModelRunnerOutput(invalid_block_ids={1})
     future1.set_result(output1)
     future2.set_result(output2)
@@ -123,7 +129,7 @@ def test_async_aggregate_workers_output():
     result_future = aggregator.async_aggregate([future1, future2])
 
     output1 = DummyModelRunnerOutput(invalid_block_ids={2})
-    output2 = DummyModelRunnerOutput(finished_sending={'req1'})
+    output2 = DummyModelRunnerOutput(finished_sending={"req1"})
     future1.set_result(output1)
     future2.set_result(output2)
 
@@ -131,7 +137,7 @@ def test_async_aggregate_workers_output():
     aggregated = result_future.result()
     assert aggregated is output1
     aggregated = aggregated.kv_connector_output
-    assert aggregated.finished_sending == {'req1'}
+    assert aggregated.finished_sending == {"req1"}
     assert aggregated.finished_recving is None
     assert aggregated.invalid_block_ids == {2}
 
@@ -140,8 +146,9 @@ def test_async_aggregate_workers_output():
     result_future = aggregator.async_aggregate([future1, future2])
 
     output1 = DummyModelRunnerOutput(invalid_block_ids={3, 4})
-    output2 = DummyModelRunnerOutput(finished_recving={'req2'},
-                                     invalid_block_ids={4, 5})
+    output2 = DummyModelRunnerOutput(
+        finished_recving={"req2"}, invalid_block_ids={4, 5}
+    )
     future1.set_result(output1)
     future2.set_result(output2)
 
@@ -150,5 +157,5 @@ def test_async_aggregate_workers_output():
     assert aggregated is output1
     aggregated = aggregated.kv_connector_output
     assert aggregated.finished_sending is None
-    assert aggregated.finished_recving == {'req2'}
+    assert aggregated.finished_recving == {"req2"}
     assert aggregated.invalid_block_ids == {3, 4, 5}
diff --git a/tests/v1/kv_connector/unit/test_remote_decode_lifecycle.py b/tests/v1/kv_connector/unit/test_remote_decode_lifecycle.py
index e2c4d05bba71..e0404186eb2d 100644
--- a/tests/v1/kv_connector/unit/test_remote_decode_lifecycle.py
+++ b/tests/v1/kv_connector/unit/test_remote_decode_lifecycle.py
@@ -7,8 +7,13 @@
 from vllm.v1.outputs import EMPTY_MODEL_RUNNER_OUTPUT, KVConnectorOutput
 from vllm.v1.request import FinishReason, RequestStatus
 
-from .utils import (assert_scheduler_empty, create_model_runner_output,
-                    create_request, create_scheduler, create_vllm_config)
+from .utils import (
+    assert_scheduler_empty,
+    create_model_runner_output,
+    create_request,
+    create_scheduler,
+    create_vllm_config,
+)
 
 pytestmark = pytest.mark.cpu_test
 
@@ -24,11 +29,13 @@ def test_basic_lifecycle():
     NUM_EXTERNAL_FULL_BLOCKS = 2
     NUM_TOKENS = int(BLOCK_SIZE * (NUM_EXTERNAL_FULL_BLOCKS + 0.5))
 
-    request = create_request(request_id=1,
-                             block_size=BLOCK_SIZE,
-                             max_tokens=1,
-                             num_tokens=NUM_TOKENS,
-                             do_remote_decode=True)
+    request = create_request(
+        request_id=1,
+        block_size=BLOCK_SIZE,
+        max_tokens=1,
+        num_tokens=NUM_TOKENS,
+        do_remote_decode=True,
+    )
 
     scheduler.add_request(request)
     request_id = request.request_id
@@ -43,8 +50,9 @@ def test_basic_lifecycle():
     model_runner_output = create_model_runner_output(reqs=[request])
 
     # (1c): update_from_output()
-    engine_core_outputs = scheduler.update_from_output(scheduler_output,
-                                                       model_runner_output)
+    engine_core_outputs = scheduler.update_from_output(
+        scheduler_output, model_runner_output
+    )
 
     # Ensure the request is finished after 1 token.
     assert request.is_finished()
@@ -60,7 +68,8 @@ def test_basic_lifecycle():
 
     # ... but blocks should not be freed.
     blocks = scheduler.kv_cache_manager.coordinator.single_type_managers[
-        0].req_to_blocks[request_id]
+        0
+    ].req_to_blocks[request_id]
     for block in blocks:
         assert block.ref_cnt == 1
 
@@ -92,7 +101,8 @@ def test_basic_lifecycle():
     # (3b): execute_model()
     model_runner_output = copy.deepcopy(EMPTY_MODEL_RUNNER_OUTPUT)
     model_runner_output.kv_connector_output = KVConnectorOutput(
-        finished_sending={request_id})
+        finished_sending={request_id}
+    )
 
     # (3c): update_from_output()
     scheduler.update_from_output(scheduler_output, model_runner_output)
@@ -110,11 +120,13 @@ def test_short_prompt_lifecycle():
     # Not enough tokens for full block.
     BLOCK_SIZE = vllm_config.cache_config.block_size
     NUM_TOKENS = BLOCK_SIZE // 2
-    request = create_request(request_id=1,
-                             block_size=BLOCK_SIZE,
-                             max_tokens=1,
-                             num_tokens=NUM_TOKENS,
-                             do_remote_decode=True)
+    request = create_request(
+        request_id=1,
+        block_size=BLOCK_SIZE,
+        max_tokens=1,
+        num_tokens=NUM_TOKENS,
+        do_remote_decode=True,
+    )
 
     scheduler.add_request(request)
 
@@ -132,14 +144,15 @@ def test_short_prompt_lifecycle():
     eco = scheduler.update_from_output(scheduler_output, model_runner_output)
     kv_transfer_params = eco[0].outputs[0].kv_transfer_params
 
-    assert (len(kv_transfer_params["remote_block_ids"]) == 1)
+    assert len(kv_transfer_params["remote_block_ids"]) == 1
 
     # Confirm we do not have any memory leaks after req lifecycle.
     # We need to mark sending finish to clear data for persistent batch.
     scheduler_output = scheduler.schedule()
     # Use create_model_runner_output to pass kv_connector_output along
     model_runner_output = create_model_runner_output(
-        reqs=[request], finished_sending={request.request_id})
+        reqs=[request], finished_sending={request.request_id}
+    )
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert_scheduler_empty(scheduler)
 
@@ -155,14 +168,15 @@ def test_prefix_cache_lifecycle():
     NUM_EXTERNAL_FULL_BLOCKS = 3
     NUM_TOKENS = int(BLOCK_SIZE * (NUM_EXTERNAL_FULL_BLOCKS + 0.5))
 
-    request_normal = create_request(request_id=1,
-                                    block_size=BLOCK_SIZE,
-                                    num_tokens=NUM_TOKENS)
+    request_normal = create_request(
+        request_id=1, block_size=BLOCK_SIZE, num_tokens=NUM_TOKENS
+    )
 
     scheduler.add_request(request_normal)
     scheduler_output = scheduler.schedule()
-    model_runner_output = create_model_runner_output(reqs=[request_normal],
-                                                     use_eos=True)
+    model_runner_output = create_model_runner_output(
+        reqs=[request_normal], use_eos=True
+    )
     scheduler.update_from_output(scheduler_output, model_runner_output)
     scheduler.schedule()
     scheduler.update_from_output(scheduler_output, EMPTY_MODEL_RUNNER_OUTPUT)
@@ -174,10 +188,12 @@ def test_prefix_cache_lifecycle():
     NUM_EXTERNAL_FULL_BLOCKS -= 1
     NUM_TOKENS = int(BLOCK_SIZE * (NUM_EXTERNAL_FULL_BLOCKS + 0.5))
 
-    request_remote = create_request(request_id=1,
-                                    block_size=BLOCK_SIZE,
-                                    num_tokens=NUM_TOKENS,
-                                    do_remote_decode=True)
+    request_remote = create_request(
+        request_id=1,
+        block_size=BLOCK_SIZE,
+        num_tokens=NUM_TOKENS,
+        do_remote_decode=True,
+    )
 
     scheduler.add_request(request_remote)
     scheduler_output = scheduler.schedule()
@@ -187,14 +203,13 @@ def test_prefix_cache_lifecycle():
 
     # Ensure we send all block ids, including the partial blocks,
     # even if there is a cache hit.
-    assert (len(
-        kv_transfer_params["remote_block_ids"]) == (NUM_EXTERNAL_FULL_BLOCKS +
-                                                    1))
+    assert len(kv_transfer_params["remote_block_ids"]) == (NUM_EXTERNAL_FULL_BLOCKS + 1)
 
     # STEP (2): Ensure it is freed.
     scheduler_output = scheduler.schedule()
     model_runner_output = copy.deepcopy(EMPTY_MODEL_RUNNER_OUTPUT)
     model_runner_output.kv_connector_output = KVConnectorOutput(
-        finished_sending={request_remote.request_id})
+        finished_sending={request_remote.request_id}
+    )
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert_scheduler_empty(scheduler)
diff --git a/tests/v1/kv_connector/unit/test_remote_prefill_lifecycle.py b/tests/v1/kv_connector/unit/test_remote_prefill_lifecycle.py
index 196483d76e87..b9588ebcd211 100644
--- a/tests/v1/kv_connector/unit/test_remote_prefill_lifecycle.py
+++ b/tests/v1/kv_connector/unit/test_remote_prefill_lifecycle.py
@@ -7,8 +7,13 @@
 from vllm.v1.outputs import EMPTY_MODEL_RUNNER_OUTPUT, KVConnectorOutput
 from vllm.v1.request import FinishReason, RequestStatus
 
-from .utils import (assert_scheduler_empty, create_model_runner_output,
-                    create_request, create_scheduler, create_vllm_config)
+from .utils import (
+    assert_scheduler_empty,
+    create_model_runner_output,
+    create_request,
+    create_scheduler,
+    create_vllm_config,
+)
 
 pytestmark = pytest.mark.cpu_test
 
@@ -24,12 +29,15 @@ def test_basic_lifecycle():
     NUM_EXTERNAL_FULL_BLOCKS = 2
     NUM_TOKENS = int(BLOCK_SIZE * (NUM_EXTERNAL_FULL_BLOCKS + 0.5))
     START_FREE_BLOCK_QUEUE_SIZE = (
-        scheduler.kv_cache_manager.block_pool.free_block_queue.num_free_blocks)
+        scheduler.kv_cache_manager.block_pool.free_block_queue.num_free_blocks
+    )
 
-    request = create_request(request_id=1,
-                             block_size=BLOCK_SIZE,
-                             num_tokens=NUM_TOKENS,
-                             do_remote_prefill=True)
+    request = create_request(
+        request_id=1,
+        block_size=BLOCK_SIZE,
+        num_tokens=NUM_TOKENS,
+        do_remote_prefill=True,
+    )
 
     scheduler.add_request(request)
     request_id = request.request_id
@@ -48,16 +56,16 @@ def test_basic_lifecycle():
     # Req waiting for KVs with no computed/scheduled toks ...
     assert len(scheduler.waiting) == 1
     assert request in scheduler.waiting
-    assert (request.status == RequestStatus.WAITING_FOR_REMOTE_KVS)
-    assert (request.num_computed_tokens == 0)
+    assert request.status == RequestStatus.WAITING_FOR_REMOTE_KVS
+    assert request.num_computed_tokens == 0
 
     # ... but should have (uncached) blocks allocated to it.
     block_pool = scheduler.kv_cache_manager.block_pool
-    assert (block_pool.free_block_queue.num_free_blocks
-            < START_FREE_BLOCK_QUEUE_SIZE)
+    assert block_pool.free_block_queue.num_free_blocks < START_FREE_BLOCK_QUEUE_SIZE
     assert len(block_pool.cached_block_hash_to_block) == 0
     blocks = scheduler.kv_cache_manager.coordinator.single_type_managers[
-        0].req_to_blocks[request_id]
+        0
+    ].req_to_blocks[request_id]
     for block in blocks:
         assert block._block_hash is None
 
@@ -65,8 +73,9 @@ def test_basic_lifecycle():
     model_runner_output = EMPTY_MODEL_RUNNER_OUTPUT
 
     # (1c): update_from_output()
-    engine_core_outputs = scheduler.update_from_output(scheduler_output,
-                                                       model_runner_output)
+    engine_core_outputs = scheduler.update_from_output(
+        scheduler_output, model_runner_output
+    )
     assert not engine_core_outputs or not engine_core_outputs[0].outputs
 
     # STEP (2):
@@ -78,13 +87,15 @@ def test_basic_lifecycle():
     # (2b): forward(): request finishes recv.
     model_runner_output = copy.deepcopy(EMPTY_MODEL_RUNNER_OUTPUT)
     model_runner_output.kv_connector_output = KVConnectorOutput(
-        finished_recving={request_id})
+        finished_recving={request_id}
+    )
 
     # (2c): update_from_output():
-    engine_core_outputs = scheduler.update_from_output(scheduler_output,
-                                                       model_runner_output)
+    engine_core_outputs = scheduler.update_from_output(
+        scheduler_output, model_runner_output
+    )
     assert len(scheduler.waiting) == 1
-    assert (request_id in scheduler.finished_recving_kv_req_ids)
+    assert request_id in scheduler.finished_recving_kv_req_ids
 
     # STEP (3):
     # (3a): schedule(): this should actually schedule.
@@ -94,10 +105,11 @@ def test_basic_lifecycle():
     # Confirm the block are actually allocated.
     num_hashed_blocks = 0
     blocks = scheduler.kv_cache_manager.coordinator.single_type_managers[
-        0].req_to_blocks[request_id]
+        0
+    ].req_to_blocks[request_id]
     for block in blocks:
         assert block.ref_cnt == 1
-        num_hashed_blocks += (1 if block._block_hash is not None else 0)
+        num_hashed_blocks += 1 if block._block_hash is not None else 0
     assert num_hashed_blocks == NUM_EXTERNAL_FULL_BLOCKS
 
     # Confirm the rest of the prompt is scheduled in this step.
@@ -105,7 +117,7 @@ def test_basic_lifecycle():
     num_scheduled_tokens = scheduler_output.num_scheduled_tokens[request_id]
     num_computed_tokens = scheduled_req.num_computed_tokens
     total_prompt_tokens = len(scheduled_req.prompt_token_ids)
-    assert (num_scheduled_tokens == total_prompt_tokens - num_computed_tokens)
+    assert num_scheduled_tokens == total_prompt_tokens - num_computed_tokens
 
     # (3b): execute_model()
     model_runner_output = create_model_runner_output([request])
@@ -115,8 +127,9 @@ def test_basic_lifecycle():
     # Step (4): Hit EOS.
     scheduler_output = scheduler.schedule()
     model_runner_output = create_model_runner_output([request], use_eos=True)
-    engine_core_outputs = scheduler.update_from_output(scheduler_output,
-                                                       model_runner_output)
+    engine_core_outputs = scheduler.update_from_output(
+        scheduler_output, model_runner_output
+    )
     scheduler.schedule()
 
     outputs = engine_core_outputs[0].outputs
@@ -137,10 +150,12 @@ def test_interleaved_lifecycle():
     NUM_EXTERNAL_FULL_BLOCKS = 2
     NUM_TOKENS = int(BLOCK_SIZE * (NUM_EXTERNAL_FULL_BLOCKS + 0.5))
 
-    request_remote = create_request(request_id=1,
-                                    block_size=BLOCK_SIZE,
-                                    num_tokens=NUM_TOKENS,
-                                    do_remote_prefill=True)
+    request_remote = create_request(
+        request_id=1,
+        block_size=BLOCK_SIZE,
+        num_tokens=NUM_TOKENS,
+        do_remote_prefill=True,
+    )
     request_local_a = create_request(
         request_id=2,
         block_size=BLOCK_SIZE,
@@ -169,8 +184,7 @@ def test_interleaved_lifecycle():
     assert len(scheduler_output.scheduled_new_reqs) == 1
     assert scheduler_output.scheduled_cached_reqs.num_reqs == 1
 
-    model_runner_output = create_model_runner_output(
-        [request_local_a, request_local_b])
+    model_runner_output = create_model_runner_output([request_local_a, request_local_b])
     scheduler.update_from_output(scheduler_output, model_runner_output)
 
     # STEP 3: continue running, KVs not arrived yet.
@@ -181,7 +195,8 @@ def test_interleaved_lifecycle():
     assert scheduler_output.scheduled_cached_reqs.num_reqs == 2
 
     model_runner_output = create_model_runner_output(
-        reqs=[request_local_a, request_local_b])
+        reqs=[request_local_a, request_local_b]
+    )
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert len(scheduler.running) == 2
     assert len(scheduler.waiting) == 1
@@ -196,8 +211,8 @@ def test_interleaved_lifecycle():
     assert scheduler_output.scheduled_cached_reqs.num_reqs == 2
 
     model_runner_output = create_model_runner_output(
-        [request_local_a, request_local_b],
-        finished_recving={request_remote.request_id})
+        [request_local_a, request_local_b], finished_recving={request_remote.request_id}
+    )
     scheduler.update_from_output(scheduler_output, model_runner_output)
 
     # STEP 5: RECVed KVs are sent to ModelRunner.
@@ -208,7 +223,8 @@ def test_interleaved_lifecycle():
     assert scheduler_output.scheduled_cached_reqs.num_reqs == 2
 
     model_runner_output = create_model_runner_output(
-        [request_local_a, request_local_b, request_remote])
+        [request_local_a, request_local_b, request_remote]
+    )
     scheduler.update_from_output(scheduler_output, model_runner_output)
 
     # STEP 6: Hit EOS and free.
@@ -273,15 +289,17 @@ def test_no_spurious_prefix_caching():
     assert len(scheduler.waiting) == 1
 
     local_blocks = scheduler.kv_cache_manager.coordinator.single_type_managers[
-        0].req_to_blocks[request_local.request_id]
+        0
+    ].req_to_blocks[request_local.request_id]
     remote_blocks = scheduler.kv_cache_manager.coordinator.single_type_managers[
-        0].req_to_blocks[request_remote.request_id]
+        0
+    ].req_to_blocks[request_remote.request_id]
 
     # Local should have cached blocks (but not all due to preallocate).
     num_hashed_blocks = 0
     for block in local_blocks:
         assert block.ref_cnt == 1
-        num_hashed_blocks += (1 if block._block_hash is not None else 0)
+        num_hashed_blocks += 1 if block._block_hash is not None else 0
     assert num_hashed_blocks > 0
 
     # Remote blocks should not be cached.
@@ -301,10 +319,12 @@ def test_full_block_prompt():
     NUM_EXTERNAL_FULL_BLOCKS = 2
     NUM_TOKENS = int(BLOCK_SIZE * NUM_EXTERNAL_FULL_BLOCKS)
 
-    request = create_request(request_id=1,
-                             block_size=BLOCK_SIZE,
-                             num_tokens=NUM_TOKENS,
-                             do_remote_prefill=True)
+    request = create_request(
+        request_id=1,
+        block_size=BLOCK_SIZE,
+        num_tokens=NUM_TOKENS,
+        do_remote_prefill=True,
+    )
 
     scheduler.add_request(request)
     request_id = request.request_id
@@ -312,8 +332,11 @@ def test_full_block_prompt():
     # STEP (1): Initialize a recv.
     scheduler_output = scheduler.schedule()
     # All blocks should be allocated.
-    num_blocks = len(scheduler.kv_cache_manager.coordinator.
-                     single_type_managers[0].req_to_blocks[request_id])
+    num_blocks = len(
+        scheduler.kv_cache_manager.coordinator.single_type_managers[0].req_to_blocks[
+            request_id
+        ]
+    )
     assert num_blocks == NUM_EXTERNAL_FULL_BLOCKS
     model_runner_output = EMPTY_MODEL_RUNNER_OUTPUT
     scheduler.update_from_output(scheduler_output, model_runner_output)
@@ -322,22 +345,25 @@ def test_full_block_prompt():
     scheduler_output = scheduler.schedule()
     model_runner_output = copy.deepcopy(EMPTY_MODEL_RUNNER_OUTPUT)
     model_runner_output.kv_connector_output = KVConnectorOutput(
-        finished_recving={request_id})
+        finished_recving={request_id}
+    )
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert len(scheduler.waiting) == 1
-    assert (request_id in scheduler.finished_recving_kv_req_ids)
+    assert request_id in scheduler.finished_recving_kv_req_ids
 
     # # STEP (3): Run as usual.
     scheduler_output = scheduler.schedule()
 
     # We need to recompute the final token of the prompt to generate
     # the first new token, so we should not have a new block.
-    num_blocks = len(scheduler.kv_cache_manager.coordinator.
-                     single_type_managers[0].req_to_blocks[request_id])
+    num_blocks = len(
+        scheduler.kv_cache_manager.coordinator.single_type_managers[0].req_to_blocks[
+            request_id
+        ]
+    )
     assert num_blocks == NUM_EXTERNAL_FULL_BLOCKS
-    assert (scheduler_output.scheduled_new_reqs[0].num_computed_tokens ==
-            NUM_TOKENS - 1)
-    assert (scheduler_output.num_scheduled_tokens[request_id] == 1)
+    assert scheduler_output.scheduled_new_reqs[0].num_computed_tokens == NUM_TOKENS - 1
+    assert scheduler_output.num_scheduled_tokens[request_id] == 1
 
     model_runner_output = create_model_runner_output([request])
     scheduler.update_from_output(scheduler_output, model_runner_output)
@@ -345,8 +371,9 @@ def test_full_block_prompt():
     # # Step (4): Hit EOS.
     scheduler_output = scheduler.schedule()
     model_runner_output = create_model_runner_output([request], use_eos=True)
-    engine_core_outputs = scheduler.update_from_output(scheduler_output,
-                                                       model_runner_output)
+    engine_core_outputs = scheduler.update_from_output(
+        scheduler_output, model_runner_output
+    )
     scheduler.schedule()
 
     outputs = engine_core_outputs[0].outputs
@@ -375,13 +402,15 @@ def test_cannot_schedule_after_recv():
     NUM_TOKENS_LOCAL = int(BLOCK_SIZE * NUM_PROMPT_BLOCKS)
     NUM_TOKENS_REMOTE = int(BLOCK_SIZE * NUM_PROMPT_BLOCKS)
 
-    request_normal = create_request(request_id=1,
-                                    block_size=BLOCK_SIZE,
-                                    num_tokens=NUM_TOKENS_LOCAL)
-    request_remote = create_request(request_id=2,
-                                    block_size=BLOCK_SIZE,
-                                    num_tokens=NUM_TOKENS_REMOTE,
-                                    do_remote_prefill=True)
+    request_normal = create_request(
+        request_id=1, block_size=BLOCK_SIZE, num_tokens=NUM_TOKENS_LOCAL
+    )
+    request_remote = create_request(
+        request_id=2,
+        block_size=BLOCK_SIZE,
+        num_tokens=NUM_TOKENS_REMOTE,
+        do_remote_prefill=True,
+    )
 
     # STEP 1: 3 blocks are in use (2 for prompt, 1 for decode).
     scheduler.add_request(request_normal)
@@ -402,7 +431,8 @@ def test_cannot_schedule_after_recv():
     # Step 3: finish recving (5 blocks in use)
     scheduler_output = scheduler.schedule()
     model_runner_output = create_model_runner_output(
-        reqs=[request_normal], finished_recving={request_remote.request_id})
+        reqs=[request_normal], finished_recving={request_remote.request_id}
+    )
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert len(scheduler.running) == 1
     assert len(scheduler.waiting) == 1
@@ -411,7 +441,8 @@ def test_cannot_schedule_after_recv():
     # because the transfer is completed.
     scheduler_output = scheduler.schedule()
     model_runner_output = create_model_runner_output(
-        reqs=[request_normal, request_remote])
+        reqs=[request_normal, request_remote]
+    )
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert len(scheduler.running) == 2
     assert len(scheduler.waiting) == 0
@@ -426,8 +457,9 @@ def test_cannot_schedule_after_recv():
 
     # Step 6: finish the request, free it.
     scheduler_output = scheduler.schedule()
-    model_runner_output = create_model_runner_output(reqs=[request_normal],
-                                                     use_eos=True)
+    model_runner_output = create_model_runner_output(
+        reqs=[request_normal], use_eos=True
+    )
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert len(scheduler.running) == 0
     assert len(scheduler.waiting) == 1
@@ -436,16 +468,19 @@ def test_cannot_schedule_after_recv():
     # request is retrieved from preempted list.
     scheduler_output = scheduler.schedule()
     model_runner_output = create_model_runner_output(reqs=[request_remote])
-    assert (scheduler_output.scheduled_cached_reqs.num_computed_tokens[0] ==
-            NUM_PROMPT_BLOCKS * BLOCK_SIZE)
+    assert (
+        scheduler_output.scheduled_cached_reqs.num_computed_tokens[0]
+        == NUM_PROMPT_BLOCKS * BLOCK_SIZE
+    )
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert len(scheduler.running) == 1
     assert len(scheduler.waiting) == 0
 
     # Step 8: free everything.
     scheduler_output = scheduler.schedule()
-    model_runner_output = create_model_runner_output(reqs=[request_remote],
-                                                     use_eos=True)
+    model_runner_output = create_model_runner_output(
+        reqs=[request_remote], use_eos=True
+    )
     scheduler.update_from_output(scheduler_output, model_runner_output)
     _ = scheduler.schedule()
     assert_scheduler_empty(scheduler)
@@ -470,13 +505,15 @@ def test_cannot_recv():
     NUM_TOKENS_LOCAL = int(BLOCK_SIZE * NUM_PROMPT_BLOCKS)
     NUM_TOKENS_REMOTE = int(BLOCK_SIZE * (NUM_PROMPT_BLOCKS + 0.5))
 
-    request_normal = create_request(request_id=1,
-                                    block_size=BLOCK_SIZE,
-                                    num_tokens=NUM_TOKENS_LOCAL)
-    request_remote = create_request(request_id=2,
-                                    block_size=BLOCK_SIZE,
-                                    num_tokens=NUM_TOKENS_REMOTE,
-                                    do_remote_prefill=True)
+    request_normal = create_request(
+        request_id=1, block_size=BLOCK_SIZE, num_tokens=NUM_TOKENS_LOCAL
+    )
+    request_remote = create_request(
+        request_id=2,
+        block_size=BLOCK_SIZE,
+        num_tokens=NUM_TOKENS_REMOTE,
+        do_remote_prefill=True,
+    )
 
     # STEP 1: 3 blocks are in use (2 for prompt, 1 for decode).
     scheduler.add_request(request_normal)
@@ -495,12 +532,13 @@ def test_cannot_recv():
     assert len(scheduler.running) == 1
     assert len(scheduler.waiting) == 1
     # Should not have KV transfer in progress.
-    assert (request_remote.status != RequestStatus.WAITING_FOR_REMOTE_KVS)
+    assert request_remote.status != RequestStatus.WAITING_FOR_REMOTE_KVS
 
     # Step 3: finish the request, free it.
     scheduler_output = scheduler.schedule()
-    model_runner_output = create_model_runner_output(reqs=[request_normal],
-                                                     use_eos=True)
+    model_runner_output = create_model_runner_output(
+        reqs=[request_normal], use_eos=True
+    )
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert len(scheduler.running) == 0
     assert len(scheduler.waiting) == 1
@@ -511,12 +549,13 @@ def test_cannot_recv():
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert len(scheduler.running) == 0
     assert len(scheduler.waiting) == 1
-    assert (request_remote.status == RequestStatus.WAITING_FOR_REMOTE_KVS)
+    assert request_remote.status == RequestStatus.WAITING_FOR_REMOTE_KVS
 
     # Step 5: finish recving (5 blocks in use)
     scheduler_output = scheduler.schedule()
     model_runner_output = create_model_runner_output(
-        reqs=[], finished_recving={request_remote.request_id})
+        reqs=[], finished_recving={request_remote.request_id}
+    )
     scheduler.update_from_output(scheduler_output, model_runner_output)
     assert len(scheduler.running) == 0
     assert len(scheduler.waiting) == 1
@@ -530,8 +569,9 @@ def test_cannot_recv():
 
     # Step 7: free everything.
     scheduler_output = scheduler.schedule()
-    model_runner_output = create_model_runner_output(reqs=[request_remote],
-                                                     use_eos=True)
+    model_runner_output = create_model_runner_output(
+        reqs=[request_remote], use_eos=True
+    )
     scheduler.update_from_output(scheduler_output, model_runner_output)
     _ = scheduler.schedule()
     assert_scheduler_empty(scheduler)
diff --git a/tests/v1/kv_connector/unit/test_shared_storage_connector.py b/tests/v1/kv_connector/unit/test_shared_storage_connector.py
index 6be261e45cb0..e7013a794a8c 100644
--- a/tests/v1/kv_connector/unit/test_shared_storage_connector.py
+++ b/tests/v1/kv_connector/unit/test_shared_storage_connector.py
@@ -37,16 +37,22 @@ def _list_path(path):
     return list(path.iterdir())
 
 
-def run_test(tmp_path, processor, llm: LLM, question: str,
-             image_urls: list[Image], expected_len: int, info: str):
+def run_test(
+    tmp_path,
+    processor,
+    llm: LLM,
+    question: str,
+    image_urls: list[Image],
+    expected_len: int,
+    info: str,
+):
     """
     One individual test to process the prompt and output base on 1 set of input
     Then check if the length in the storage path matches the expected length
     `info` introduces details or purpose of the individual test
     """
     print(f"***info: {info}***")
-    print(
-        f"**Expected storage path length after llm generate: {expected_len}**")
+    print(f"**Expected storage path length after llm generate: {expected_len}**")
     process_prompt(processor, llm, question, image_urls)
 
     print(f"Path matched expected length: {_check_path_len(tmp_path)}")
@@ -54,51 +60,42 @@ def run_test(tmp_path, processor, llm: LLM, question: str,
 
     assert _check_path_len(tmp_path) == expected_len, (
         f"Expect storage path length {expected_len} ;",
-        f"but end up {_check_path_len(tmp_path)} instead. ", f"Info: {info}")
+        f"but end up {_check_path_len(tmp_path)} instead. ",
+        f"Info: {info}",
+    )
 
 
-def process_prompt(processor, llm: LLM, question: str,
-                   image_urls: list[Image]):
+def process_prompt(processor, llm: LLM, question: str, image_urls: list[Image]):
     """
     Form the prompt based on the text and image input, then llm generate output
     """
-    placeholders = [{
-        "type": "image_url",
-        "image_url": {
-            "url": f"data:image;base64,{encode_image_base64(image_pil)}"
+    placeholders = [
+        {
+            "type": "image_url",
+            "image_url": {"url": f"data:image;base64,{encode_image_base64(image_pil)}"},
         }
-    } for image_pil in image_urls]
+        for image_pil in image_urls
+    ]
 
     messages = [
-        {
-            "role": "system",
-            "content": "You are a helpful assistant."
-        },
+        {"role": "system", "content": "You are a helpful assistant."},
         {
             "role": "user",
             "content": [
                 *placeholders,
-                {
-                    "type": "text",
-                    "text": question
-                },
+                {"type": "text", "text": question},
             ],
         },
     ]
 
-    prompt = processor.apply_chat_template(messages,
-                                           tokenize=False,
-                                           add_generation_prompt=True)
+    prompt = processor.apply_chat_template(
+        messages, tokenize=False, add_generation_prompt=True
+    )
 
     outputs = llm.generate(
         {
-            "prompt":
-            prompt,
-            **({
-                "multi_modal_data": {
-                    "image": [*image_urls]
-                }
-            } if image_urls else {})
+            "prompt": prompt,
+            **({"multi_modal_data": {"image": [*image_urls]}} if image_urls else {}),
         },
         sampling_params=SAMPLING_PARAMS,
     )
@@ -114,7 +111,7 @@ def process_prompt(processor, llm: LLM, question: str,
 def test_shared_storage_connector_hashes(tmp_path):
     """
     Tests that SharedStorageConnector saves KV to the storage locations
-    with proper hashes; that are unique for inputs with identical text but 
+    with proper hashes; that are unique for inputs with identical text but
     different images (same size), or same multiple images but different orders.
     """
     # Using tmp_path as the storage path to store KV
@@ -124,7 +121,8 @@ def test_shared_storage_connector_hashes(tmp_path):
     kv_transfer_config = KVTransferConfig(
         kv_connector="SharedStorageConnector",
         kv_role="kv_both",
-        kv_connector_extra_config={"shared_storage_path": str(tmp_path)})
+        kv_connector_extra_config={"shared_storage_path": str(tmp_path)},
+    )
 
     engine_args = EngineArgs(
         model=MODEL_NAME,
@@ -157,56 +155,88 @@ def test_shared_storage_connector_hashes(tmp_path):
 
     # Prepare the input cases
     input_cases = [
-        InputCase(text=TEXT_PROMPTS[0],
-                  img=[image_1],
-                  expected_len=1,
-                  info="image_1 single input the first time."),
-        InputCase(text=TEXT_PROMPTS[0],
-                  img=[image_2],
-                  expected_len=2,
-                  info=("image_2 single input the first time. "
-                        "It is in same pixel size with image_1, yet it "
-                        "should be able to form a new unique hash.")),
-        InputCase(text=TEXT_PROMPTS[0],
-                  img=[image_1],
-                  expected_len=2,
-                  info=("image_1 single input the 2nd time. "
-                        "It should not form another new hash.")),
-        InputCase(text=TEXT_PROMPTS[0],
-                  img=[image_2],
-                  expected_len=2,
-                  info=("image_2 single input the 2nd time. "
-                        "It should not form another new hash.")),
-        InputCase(text=TEXT_PROMPTS[0],
-                  img=[image_1, image_2],
-                  expected_len=3,
-                  info="image_1 with image_2 input the first time."),
-        InputCase(text=TEXT_PROMPTS[0],
-                  img=[image_2, image_1],
-                  expected_len=4,
-                  info="The image order is swapped. Should form new hash."),
-        InputCase(text=TEXT_PROMPTS[0],
-                  img=[image_1, image_2],
-                  expected_len=4,
-                  info=("[image_1, image_2] input the 2nd time. "
-                        "It should not form another new hash.")),
-        InputCase(text=TEXT_PROMPTS[0],
-                  img=[image_2, image_1],
-                  expected_len=4,
-                  info=("[image_2, image_1] input the 2nd time. "
-                        "It should not form another new hash.")),
-        InputCase(text=TEXT_PROMPTS[0],
-                  img=[],
-                  expected_len=5,
-                  info="Pure text input test as a case-control"),
-        InputCase(text=TEXT_PROMPTS[0],
-                  img=[],
-                  expected_len=5,
-                  info="Identical pure text input as a case-control"),
-        InputCase(text=TEXT_PROMPTS[1],
-                  img=[],
-                  expected_len=6,
-                  info="Another pure text input as a case-control"),
+        InputCase(
+            text=TEXT_PROMPTS[0],
+            img=[image_1],
+            expected_len=1,
+            info="image_1 single input the first time.",
+        ),
+        InputCase(
+            text=TEXT_PROMPTS[0],
+            img=[image_2],
+            expected_len=2,
+            info=(
+                "image_2 single input the first time. "
+                "It is in same pixel size with image_1, yet it "
+                "should be able to form a new unique hash."
+            ),
+        ),
+        InputCase(
+            text=TEXT_PROMPTS[0],
+            img=[image_1],
+            expected_len=2,
+            info=(
+                "image_1 single input the 2nd time. "
+                "It should not form another new hash."
+            ),
+        ),
+        InputCase(
+            text=TEXT_PROMPTS[0],
+            img=[image_2],
+            expected_len=2,
+            info=(
+                "image_2 single input the 2nd time. "
+                "It should not form another new hash."
+            ),
+        ),
+        InputCase(
+            text=TEXT_PROMPTS[0],
+            img=[image_1, image_2],
+            expected_len=3,
+            info="image_1 with image_2 input the first time.",
+        ),
+        InputCase(
+            text=TEXT_PROMPTS[0],
+            img=[image_2, image_1],
+            expected_len=4,
+            info="The image order is swapped. Should form new hash.",
+        ),
+        InputCase(
+            text=TEXT_PROMPTS[0],
+            img=[image_1, image_2],
+            expected_len=4,
+            info=(
+                "[image_1, image_2] input the 2nd time. "
+                "It should not form another new hash."
+            ),
+        ),
+        InputCase(
+            text=TEXT_PROMPTS[0],
+            img=[image_2, image_1],
+            expected_len=4,
+            info=(
+                "[image_2, image_1] input the 2nd time. "
+                "It should not form another new hash."
+            ),
+        ),
+        InputCase(
+            text=TEXT_PROMPTS[0],
+            img=[],
+            expected_len=5,
+            info="Pure text input test as a case-control",
+        ),
+        InputCase(
+            text=TEXT_PROMPTS[0],
+            img=[],
+            expected_len=5,
+            info="Identical pure text input as a case-control",
+        ),
+        InputCase(
+            text=TEXT_PROMPTS[1],
+            img=[],
+            expected_len=6,
+            info="Another pure text input as a case-control",
+        ),
     ]
 
     # Run tests
diff --git a/tests/v1/kv_connector/unit/utils.py b/tests/v1/kv_connector/unit/utils.py
index 3928cdc37b9d..24c0bd51216d 100644
--- a/tests/v1/kv_connector/unit/utils.py
+++ b/tests/v1/kv_connector/unit/utils.py
@@ -8,19 +8,27 @@
 import torch
 
 from vllm import SamplingParams
-from vllm.config import (CacheConfig, DeviceConfig, KVTransferConfig,
-                         ModelConfig, SchedulerConfig, VllmConfig)
-from vllm.distributed.kv_transfer.kv_connector.factory import (
-    KVConnectorFactory)
+from vllm.config import (
+    CacheConfig,
+    DeviceConfig,
+    KVTransferConfig,
+    ModelConfig,
+    SchedulerConfig,
+    VllmConfig,
+)
+from vllm.distributed.kv_transfer.kv_connector.factory import KVConnectorFactory
 from vllm.distributed.kv_transfer.kv_connector.v1.shared_storage_connector import (  # noqa
-    SharedStorageConnector)
+    SharedStorageConnector,
+)
 from vllm.utils import sha256
 from vllm.v1.core.kv_cache_manager import KVCacheBlocks
-from vllm.v1.core.kv_cache_utils import (get_request_block_hasher,
-                                         init_none_hash)
+from vllm.v1.core.kv_cache_utils import get_request_block_hasher, init_none_hash
 from vllm.v1.core.sched.scheduler import Scheduler
-from vllm.v1.kv_cache_interface import (FullAttentionSpec, KVCacheConfig,
-                                        KVCacheGroupSpec)
+from vllm.v1.kv_cache_interface import (
+    FullAttentionSpec,
+    KVCacheConfig,
+    KVCacheGroupSpec,
+)
 from vllm.v1.outputs import KVConnectorOutput, ModelRunnerOutput
 from vllm.v1.request import Request
 from vllm.v1.structured_output import StructuredOutputManager
@@ -42,14 +50,24 @@ def assert_scheduler_empty(scheduler: Scheduler):
     assert len(scheduler.encoder_cache_manager.cached) == 0
 
     # KVCache Manager.
-    assert len(scheduler.kv_cache_manager.coordinator.single_type_managers[0].
-               req_to_blocks) == 0
-    assert len(scheduler.kv_cache_manager.coordinator.single_type_managers[0].
-               num_cached_block) == 0
+    assert (
+        len(
+            scheduler.kv_cache_manager.coordinator.single_type_managers[0].req_to_blocks
+        )
+        == 0
+    )
+    assert (
+        len(
+            scheduler.kv_cache_manager.coordinator.single_type_managers[
+                0
+            ].num_cached_block
+        )
+        == 0
+    )
     num_free_blocks = (
-        scheduler.kv_cache_manager.block_pool.free_block_queue.num_free_blocks)
-    assert num_free_blocks == (
-        scheduler.kv_cache_manager.block_pool.num_gpu_blocks - 1)
+        scheduler.kv_cache_manager.block_pool.free_block_queue.num_free_blocks
+    )
+    assert num_free_blocks == (scheduler.kv_cache_manager.block_pool.num_gpu_blocks - 1)
 
     # NOTE(rob): just the ref count on blocks will be 0. The hash
     # value, etc will remain since we lazily evict for prefix cache.
@@ -90,11 +108,13 @@ def create_vllm_config(
         kv_connector="NixlConnector",
         kv_role="kv_both",
     )
-    return VllmConfig(scheduler_config=scheduler_config,
-                      model_config=model_config,
-                      cache_config=cache_config,
-                      kv_transfer_config=kv_transfer_config,
-                      device_config=DeviceConfig("cpu"))
+    return VllmConfig(
+        scheduler_config=scheduler_config,
+        model_config=model_config,
+        cache_config=cache_config,
+        kv_transfer_config=kv_transfer_config,
+        device_config=DeviceConfig("cpu"),
+    )
 
 
 def create_scheduler(
@@ -107,9 +127,9 @@ def create_scheduler(
         num_blocks=num_blocks,  # A large number of blocks to hold all requests
         kv_cache_tensors=[],
         kv_cache_groups=[
-            KVCacheGroupSpec(['layer'],
-                             FullAttentionSpec(block_size, 1, 1, torch.float32,
-                                               False))
+            KVCacheGroupSpec(
+                ["layer"], FullAttentionSpec(block_size, 1, 1, torch.float32, False)
+            )
         ],
     )
     vllm_config.cache_config.num_gpu_blocks = num_blocks
@@ -151,16 +171,16 @@ def create_request(
 
     if do_remote_decode:
         assert not do_remote_prefill
-        kv_transfer_params = dict(do_remote_prefill=False,
-                                  do_remote_decode=True)
+        kv_transfer_params = dict(do_remote_prefill=False, do_remote_decode=True)
     elif do_remote_prefill:
-        kv_transfer_params = dict(do_remote_prefill=True,
-                                  do_remote_decode=False,
-                                  remote_engine_id="my-engine-id",
-                                  remote_block_ids=list(
-                                      range(num_remote_blocks)),
-                                  remote_host="my-host",
-                                  remote_port=1234)
+        kv_transfer_params = dict(
+            do_remote_prefill=True,
+            do_remote_decode=False,
+            remote_engine_id="my-engine-id",
+            remote_block_ids=list(range(num_remote_blocks)),
+            remote_host="my-host",
+            remote_port=1234,
+        )
 
     max_tokens = 1 if do_remote_decode else max_tokens
     sampling_params = SamplingParams(max_tokens=max_tokens)
@@ -200,13 +220,19 @@ def create_model_runner_output(
     sampled_token = EOS_TOKEN_ID if use_eos else token_id
     sampled_token_ids = [[sampled_token] for _ in req_ids]
 
-    kv_connector_output = None if (
-        finished_sending is None and finished_recving is None
-        and invalid_block_ids is None) else KVConnectorOutput(
+    kv_connector_output = (
+        None
+        if (
+            finished_sending is None
+            and finished_recving is None
+            and invalid_block_ids is None
+        )
+        else KVConnectorOutput(
             finished_sending=finished_sending,
             finished_recving=finished_recving,
             invalid_block_ids=invalid_block_ids or set(),
         )
+    )
 
     # Make output data structure.
     return ModelRunnerOutput(
@@ -221,22 +247,30 @@ def create_model_runner_output(
 
 
 class TestSharedStorageConnector(SharedStorageConnector):
-
     def __init__(self, config: VllmConfig, role):
         self.name = config.kv_transfer_config.kv_connector_extra_config["name"]
         self._connector = SharedStorageConnector(config, role)
         self.call_record: dict[str, int] = defaultdict(int)
         # Use a unique temp file per connector
-        self._event_file = tempfile.gettempdir(
-        ) + f"/connector_{self.name}-{self.role.name}_events.log"
+        self._event_file = (
+            tempfile.gettempdir()
+            + f"/connector_{self.name}-{self.role.name}_events.log"
+        )
         # Start with an empty file
         with open(self._event_file, "w") as _:
             pass
 
     def __getattribute__(self, name):
-        if name in ("_connector", "call_record", "name", "_event_file",
-                    "__class__", "__dict__", "__getattribute__",
-                    "__init__"):  # avoid recursion
+        if name in (
+            "_connector",
+            "call_record",
+            "name",
+            "_event_file",
+            "__class__",
+            "__dict__",
+            "__getattribute__",
+            "__init__",
+        ):  # avoid recursion
             return object.__getattribute__(self, name)
         if not hasattr(self._connector, name):
             return object.__getattribute__(self, name)
@@ -255,21 +289,20 @@ def wrapper(*args, **kwargs):
                     if isinstance(arg, int):
                         to_log.append(str(arg))
                     elif isinstance(arg, KVCacheBlocks):
-                        to_log.append(
-                            f"num_blocks={[len(b) for b in arg.blocks]}")
+                        to_log.append(f"num_blocks={[len(b) for b in arg.blocks]}")
 
                 # Log the event as a line to the file
                 try:
                     with open(self._event_file, "a") as f:
-                        f.write(' '.join(to_log) + "\n")
+                        f.write(" ".join(to_log) + "\n")
                 except Exception as e:
-                    print(f"[ERROR] Could not log event {name} "
-                          f"for {self.name}: {e}")
+                    print(f"[ERROR] Could not log event {name} for {self.name}: {e}")
                 return attr(*args, **kwargs)
 
             return wrapper
         return attr
 
 
-KVConnectorFactory.register_connector("TestSharedStorageConnector", __name__,
-                                      TestSharedStorageConnector.__name__)
+KVConnectorFactory.register_connector(
+    "TestSharedStorageConnector", __name__, TestSharedStorageConnector.__name__
+)
diff --git a/tests/v1/kv_offload/test_cpu_gpu.py b/tests/v1/kv_offload/test_cpu_gpu.py
index 0edb9513e3ff..81b57f1ca0c8 100644
--- a/tests/v1/kv_offload/test_cpu_gpu.py
+++ b/tests/v1/kv_offload/test_cpu_gpu.py
@@ -22,7 +22,7 @@
 NUM_LAYERS = [4]
 DTYPES = [torch.bfloat16]
 SEEDS = [0]
-CUDA_DEVICES = ['cuda:0']
+CUDA_DEVICES = ["cuda:0"]
 NUM_MAPPINGS = [3]
 
 
@@ -56,35 +56,35 @@ def test_transfer(
     current_platform.seed_everything(seed)
 
     # create per-layer GPU KV caches
-    attn_backends_list = [
-        FlashAttentionBackend, FlashInferBackend, FlashAttnMLABackend
-    ]
+    attn_backends_list = [FlashAttentionBackend, FlashInferBackend, FlashAttnMLABackend]
 
     gpu_caches = {}
     attn_backends = {}
     for i in range(num_layers):
-        layer_name = f'layer {i}'
+        layer_name = f"layer {i}"
 
         attn_backend = attn_backends_list[i % len(attn_backends_list)]
         attn_backends[layer_name] = attn_backend
 
         gpu_cache_shape = attn_backend.get_kv_cache_shape(
-            num_gpu_blocks, gpu_block_size, num_heads, head_size)
-        gpu_caches[layer_name] = torch.rand(gpu_cache_shape,
-                                            dtype=dtype,
-                                            device=device)
+            num_gpu_blocks, gpu_block_size, num_heads, head_size
+        )
+        gpu_caches[layer_name] = torch.rand(gpu_cache_shape, dtype=dtype, device=device)
 
     # create handler
     cpu_block_size = gpu_blocks_per_cpu_block * gpu_block_size
-    handler = CpuGpuOffloadingHandler(attn_backends=attn_backends,
-                                      gpu_block_size=gpu_block_size,
-                                      cpu_block_size=cpu_block_size,
-                                      num_cpu_blocks=num_cpu_blocks,
-                                      gpu_caches=gpu_caches)
+    handler = CpuGpuOffloadingHandler(
+        attn_backends=attn_backends,
+        gpu_block_size=gpu_block_size,
+        cpu_block_size=cpu_block_size,
+        num_cpu_blocks=num_cpu_blocks,
+        gpu_caches=gpu_caches,
+    )
 
     # select block mappings
-    gpu_blocks = random.sample(range(num_gpu_blocks),
-                               num_mappings * gpu_blocks_per_cpu_block)
+    gpu_blocks = random.sample(
+        range(num_gpu_blocks), num_mappings * gpu_blocks_per_cpu_block
+    )
     cpu_blocks = random.sample(range(num_cpu_blocks), num_mappings)
 
     # convert cpu blocks to gpu block size
@@ -96,9 +96,10 @@ def test_transfer(
 
     # maybe skip a GPU block to test writing to the middle of a CPU block
     if gpu_to_cpu:
-        gpu_blocks = gpu_blocks[gpu_blocks_per_cpu_block - 1:]
+        gpu_blocks = gpu_blocks[gpu_blocks_per_cpu_block - 1 :]
         cpu_blocks_in_gpu_block_size = cpu_blocks_in_gpu_block_size[
-            gpu_blocks_per_cpu_block - 1:]
+            gpu_blocks_per_cpu_block - 1 :
+        ]
 
     # set transfer direction
     if gpu_to_cpu:
@@ -124,8 +125,9 @@ def test_transfer(
 
     # build dst -> src mapping
     dst_to_src = {}
-    for src_block, dst_block in zip(src_blocks_in_gpu_block_size,
-                                    dst_blocks_in_gpu_block_size):
+    for src_block, dst_block in zip(
+        src_blocks_in_gpu_block_size, dst_blocks_in_gpu_block_size
+    ):
         dst_to_src[dst_block] = src_block
 
     # build transfer specs
@@ -157,8 +159,11 @@ def test_transfer(
     for dst_block in range(dst_size_in_gpu_blocks):
         src_block_candidate = dst_to_src.get(dst_block)
         for src_cache, dst_cache, orig_dst_cache, kv_dim in zip(
-                src_kv_caches, dst_kv_caches, orig_dst_caches,
-                handler.kv_dim_before_num_blocks):
+            src_kv_caches,
+            dst_kv_caches,
+            orig_dst_caches,
+            handler.kv_dim_before_num_blocks,
+        ):
             if kv_dim:
                 # iterate over key, value
                 for i in range(2):
@@ -166,12 +171,14 @@ def test_transfer(
                         expected_value = src_cache[i][src_block_candidate]
                     else:
                         expected_value = orig_dst_cache[i][dst_block]
-                    torch.testing.assert_close(dst_cache[i][dst_block].cpu(),
-                                               expected_value.cpu())
+                    torch.testing.assert_close(
+                        dst_cache[i][dst_block].cpu(), expected_value.cpu()
+                    )
             else:
                 if src_block_candidate is not None:
                     expected_value = src_cache[src_block_candidate]
                 else:
                     expected_value = orig_dst_cache[dst_block]
-                torch.testing.assert_close(dst_cache[dst_block].cpu(),
-                                           expected_value.cpu())
+                torch.testing.assert_close(
+                    dst_cache[dst_block].cpu(), expected_value.cpu()
+                )
diff --git a/tests/v1/kv_offload/test_cpu_manager.py b/tests/v1/kv_offload/test_cpu_manager.py
index cdee7811d85b..57884f846b51 100644
--- a/tests/v1/kv_offload/test_cpu_manager.py
+++ b/tests/v1/kv_offload/test_cpu_manager.py
@@ -7,8 +7,11 @@
 import numpy as np
 
 from vllm.v1.core.kv_cache_utils import BlockHash
-from vllm.v1.kv_offload.abstract import (LoadStoreSpec, OffloadingEvent,
-                                         PrepareStoreOutput)
+from vllm.v1.kv_offload.abstract import (
+    LoadStoreSpec,
+    OffloadingEvent,
+    PrepareStoreOutput,
+)
 from vllm.v1.kv_offload.backends.cpu import CPUBackend
 from vllm.v1.kv_offload.lru_manager import LRUOffloadingManager
 from vllm.v1.kv_offload.mediums import CPULoadStoreSpec
@@ -26,31 +29,38 @@ def to_hashes(int_hashes: list[int]) -> list[BlockHash]:
 
 
 def verify_store_output(
-        prepare_store_output: Optional[PrepareStoreOutput],
-        expected_prepare_store_output: ExpectedPrepareStoreOutput):
+    prepare_store_output: Optional[PrepareStoreOutput],
+    expected_prepare_store_output: ExpectedPrepareStoreOutput,
+):
     assert prepare_store_output is not None
-    assert (prepare_store_output.block_hashes_to_store == to_hashes(
-        expected_prepare_store_output.block_hashes_to_store))
-    assert (prepare_store_output.block_hashes_evicted == to_hashes(
-        expected_prepare_store_output.block_hashes_evicted))
+    assert prepare_store_output.block_hashes_to_store == to_hashes(
+        expected_prepare_store_output.block_hashes_to_store
+    )
+    assert prepare_store_output.block_hashes_evicted == to_hashes(
+        expected_prepare_store_output.block_hashes_evicted
+    )
     store_spec = prepare_store_output.store_spec
     assert isinstance(store_spec, CPULoadStoreSpec)
-    expected_array = np.array(expected_prepare_store_output.store_block_ids,
-                              dtype=np.int64)
+    expected_array = np.array(
+        expected_prepare_store_output.store_block_ids, dtype=np.int64
+    )
     assert np.array_equal(expected_array, store_spec.block_ids)
 
 
-def verify_load_output(prepare_load_output: LoadStoreSpec,
-                       expected_prepare_load_output: list[int]):
+def verify_load_output(
+    prepare_load_output: LoadStoreSpec, expected_prepare_load_output: list[int]
+):
     assert isinstance(prepare_load_output, CPULoadStoreSpec)
     expected_array = np.array(expected_prepare_load_output, dtype=np.int64)
     assert np.array_equal(expected_array, prepare_load_output.block_ids)
 
 
-def verify_events(events: Iterable[OffloadingEvent],
-                  block_size: int,
-                  expected_stores: tuple[set[int], ...] = (),
-                  expected_evictions: tuple[set[int], ...] = ()):
+def verify_events(
+    events: Iterable[OffloadingEvent],
+    block_size: int,
+    expected_stores: tuple[set[int], ...] = (),
+    expected_evictions: tuple[set[int], ...] = (),
+):
     stores: list[set[BlockHash]] = []
     evictions: list[set[BlockHash]] = []
     for event in events:
@@ -61,8 +71,7 @@ def verify_events(events: Iterable[OffloadingEvent],
         else:
             stores.append(set(event.block_hashes))
 
-    def to_hash_sets(
-            int_sets: tuple[set[int], ...]) -> tuple[set[BlockHash], ...]:
+    def to_hash_sets(int_sets: tuple[set[int], ...]) -> tuple[set[BlockHash], ...]:
         return tuple([set(to_hashes(list(int_set))) for int_set in int_sets])
 
     assert tuple(evictions) == to_hash_sets(expected_evictions)
@@ -86,7 +95,8 @@ def test_cpu_manager():
             block_hashes_to_store=[1, 2],
             store_block_ids=[0, 1],
             block_hashes_evicted=[],
-        ))
+        ),
+    )
 
     # lookup [1, 2] -> not ready
     assert cpu_manager.lookup(to_hashes([1, 2])) == 0
@@ -96,9 +106,9 @@ def test_cpu_manager():
 
     # complete store [1, 2]
     cpu_manager.complete_store(to_hashes([1, 2]))
-    verify_events(cpu_manager.take_events(),
-                  block_size=block_size,
-                  expected_stores=({1, 2}, ))
+    verify_events(
+        cpu_manager.take_events(), block_size=block_size, expected_stores=({1, 2},)
+    )
 
     # lookup [1, 2]
     assert cpu_manager.lookup(to_hashes([1])) == 1
@@ -113,12 +123,13 @@ def test_cpu_manager():
             block_hashes_to_store=[3, 4, 5],
             store_block_ids=[2, 3, 0],
             block_hashes_evicted=[1],
-        ))
+        ),
+    )
 
     # verify eviction event
-    verify_events(cpu_manager.take_events(),
-                  block_size=block_size,
-                  expected_evictions=({1}, ))
+    verify_events(
+        cpu_manager.take_events(), block_size=block_size, expected_evictions=({1},)
+    )
 
     # prepare store with no space
     assert cpu_manager.prepare_store(to_hashes([1, 6])) is None
@@ -144,7 +155,8 @@ def test_cpu_manager():
             block_hashes_to_store=[6, 7, 8],
             store_block_ids=[3, 2, 1],
             block_hashes_evicted=[2, 3, 4],
-        ))
+        ),
+    )
 
     # complete store [6, 7, 8]
     cpu_manager.complete_store(to_hashes([6, 7, 8]))
@@ -160,7 +172,8 @@ def test_cpu_manager():
             block_hashes_to_store=[9],
             store_block_ids=[1],
             block_hashes_evicted=[8],
-        ))
+        ),
+    )
 
     # complete store [7, 9] with failure
     cpu_manager.complete_store(to_hashes([7, 9]), success=False)
@@ -169,7 +182,9 @@ def test_cpu_manager():
     assert cpu_manager.lookup(to_hashes([7])) == 1
     assert cpu_manager.lookup(to_hashes([9])) == 0
 
-    verify_events(cpu_manager.take_events(),
-                  block_size=block_size,
-                  expected_stores=({3, 4, 5}, {6, 7, 8}),
-                  expected_evictions=({2, 3, 4}, {8}))
+    verify_events(
+        cpu_manager.take_events(),
+        block_size=block_size,
+        expected_stores=({3, 4, 5}, {6, 7, 8}),
+        expected_evictions=({2, 3, 4}, {8}),
+    )
diff --git a/tests/v1/kv_offload/test_cpu_offloading.py b/tests/v1/kv_offload/test_cpu_offloading.py
index fc8ca09bea3d..0d90cc715fd4 100644
--- a/tests/v1/kv_offload/test_cpu_offloading.py
+++ b/tests/v1/kv_offload/test_cpu_offloading.py
@@ -20,10 +20,7 @@ def test_cpu_offloading(cpu_block_size: int) -> None:
     kv_transfer_config = KVTransferConfig(
         kv_connector="OffloadingConnector",
         kv_role="kv_both",
-        kv_connector_extra_config={
-            "num_cpu_blocks": 100,
-            "block_size": cpu_block_size
-        },
+        kv_connector_extra_config={"num_cpu_blocks": 100, "block_size": cpu_block_size},
     )
 
     llm = LLM(
diff --git a/tests/v1/kv_offload/test_worker.py b/tests/v1/kv_offload/test_worker.py
index 6cf8aa0875d6..6fcd408f3c59 100644
--- a/tests/v1/kv_offload/test_worker.py
+++ b/tests/v1/kv_offload/test_worker.py
@@ -1,17 +1,21 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from vllm.v1.kv_offload.abstract import LoadStoreSpec
-from vllm.v1.kv_offload.worker.worker import (OffloadingHandler,
-                                              OffloadingWorker, TransferResult,
-                                              TransferSpec)
+from vllm.v1.kv_offload.worker.worker import (
+    OffloadingHandler,
+    OffloadingWorker,
+    TransferResult,
+    TransferSpec,
+)
 
 
 class LoadStoreSpec1(LoadStoreSpec):
-
-    def __init__(self,
-                 submit_success: bool = True,
-                 async_success: bool = True,
-                 exception: bool = False):
+    def __init__(
+        self,
+        submit_success: bool = True,
+        async_success: bool = True,
+        exception: bool = False,
+    ):
         self.finished = False
         self.submit_success = submit_success
         self.async_success = async_success
@@ -26,7 +30,6 @@ def __repr__(self):
 
 
 class LoadStoreSpec2(LoadStoreSpec):
-
     @staticmethod
     def medium() -> str:
         return "2"
@@ -36,7 +39,6 @@ def __repr__(self):
 
 
 class OffloadingHandler1To2(OffloadingHandler):
-
     def __init__(self):
         self.transfers: dict[int, LoadStoreSpec1] = {}
 
@@ -63,7 +65,6 @@ def get_finished(self) -> list[TransferResult]:
 
 
 class OffloadingHandler2To1(OffloadingHandler):
-
     def __init__(self):
         self.transfers: dict[int, LoadStoreSpec1] = {}
 
@@ -144,9 +145,9 @@ def test_offloading_worker():
     assert 7 in handler2to1.transfers
 
     # verify result of 3rd and 4th transfers
-    assert (sorted(worker.get_finished()) == [(3, False), (4, True)])
+    assert sorted(worker.get_finished()) == [(3, False), (4, True)]
 
     # complete 6th and 7th transfers
     src6.finished = True
     dst7.finished = True
-    assert (sorted(worker.get_finished()) == [(6, True), (7, True)])
+    assert sorted(worker.get_finished()) == [(6, True), (7, True)]
diff --git a/tests/v1/logits_processors/test_correctness.py b/tests/v1/logits_processors/test_correctness.py
index 43caef79b02f..5baa11af024b 100644
--- a/tests/v1/logits_processors/test_correctness.py
+++ b/tests/v1/logits_processors/test_correctness.py
@@ -10,23 +10,31 @@
 import torch
 
 from tests.utils import create_new_process_for_each_test
-from tests.v1.sample.utils import (LogitsprocsTestFakes, create_fake_logits,
-                                   create_penalty_tensor,
-                                   create_prompt_tokens_tensor,
-                                   fake_apply_logitsprocs,
-                                   fake_update_logitsprocs_state)
+from tests.v1.sample.utils import (
+    LogitsprocsTestFakes,
+    create_fake_logits,
+    create_penalty_tensor,
+    create_prompt_tokens_tensor,
+    fake_apply_logitsprocs,
+    fake_update_logitsprocs_state,
+)
 from vllm.config import VllmConfig
 from vllm.platforms import current_platform
 from vllm.sampling_params import SamplingParams
 from vllm.utils import is_pin_memory_available
+
 # yapf: disable
-from vllm.v1.sample.logits_processor import (BatchUpdate, BatchUpdateBuilder,
-                                             LogitBiasLogitsProcessor,
-                                             LogitsProcessor,
-                                             MinPLogitsProcessor,
-                                             MinTokensLogitsProcessor,
-                                             MoveDirectionality,
-                                             build_logitsprocs)
+from vllm.v1.sample.logits_processor import (
+    BatchUpdate,
+    BatchUpdateBuilder,
+    LogitBiasLogitsProcessor,
+    LogitsProcessor,
+    MinPLogitsProcessor,
+    MinTokensLogitsProcessor,
+    MoveDirectionality,
+    build_logitsprocs,
+)
+
 # yapf: enable
 from vllm.v1.sample.metadata import SamplingMetadata
 
@@ -49,9 +57,10 @@
 
 class LogitsProcsRequestParams:
     """Encapsulates key params for a single request in a batch.
-    
+
     Params can be customized based on the enabled logitproc
     """
+
     workload_index: int
     logitproc_type: LogitprocType  # Logitproc enabled, specified by str id
     out_tokens: list[int]  # Output tokens required for min tokens test
@@ -64,14 +73,13 @@ def __init__(self, workload_index: int, logitproc_type: LogitprocType):
         # Number of output tokens is randomly 0 or twice the min-tokens
         # threshold which will be used in testing. Output token values
         # don't matter *for these tests* so use 0 as a dummy value
-        self.out_tokens = ([0] *
-                           (MIN_TOKENS_LEN_THRESHOLD * random.randint(0, 2)))
+        self.out_tokens = [0] * (MIN_TOKENS_LEN_THRESHOLD * random.randint(0, 2))
         self.prompt_tokens = []
         self.params = _sampling_params_from_logitproc(logitproc_type)
 
     def __str__(self):
         """For debugging"""
-        summ = ', '.join(f'{k}={v}' for k, v in vars(self).items())
+        summ = ", ".join(f"{k}={v}" for k, v in vars(self).items())
         return f"MyClass({summ})"
 
 
@@ -86,12 +94,13 @@ def _generate_fake_sampling_metadata(
     prompt_token_ids: list[list[int]] = []
     for _ in range(batch_size):
         output_token_ids.append(
-            np.random.randint(0, vocab_size, size=num_output_tokens).tolist())
+            np.random.randint(0, vocab_size, size=num_output_tokens).tolist()
+        )
         prompt_token_ids.append(
-            np.random.randint(0,
-                              vocab_size,
-                              size=np.random.randint(
-                                  1, MAX_NUM_PROMPT_TOKENS)).tolist())
+            np.random.randint(
+                0, vocab_size, size=np.random.randint(1, MAX_NUM_PROMPT_TOKENS)
+            ).tolist()
+        )
     logitsprocs = build_logitsprocs(
         vllm_config=VllmConfig(),
         device=device,
@@ -99,15 +108,16 @@ def _generate_fake_sampling_metadata(
         is_pooling_model=False,
     )
     fake_sampling_metadata = SamplingMetadata(
-        temperature=torch.full((batch_size, ), 0.0),
+        temperature=torch.full((batch_size,), 0.0),
         all_greedy=True,
         all_random=False,
         top_p=None,
         top_k=None,
         generators={},
         max_num_logprobs=0,
-        prompt_token_ids=create_prompt_tokens_tensor(prompt_token_ids,
-                                                     vocab_size, device),
+        prompt_token_ids=create_prompt_tokens_tensor(
+            prompt_token_ids, vocab_size, device
+        ),
         output_token_ids=output_token_ids,
         frequency_penalties=create_penalty_tensor(batch_size, 0.0, device),
         presence_penalties=create_penalty_tensor(batch_size, 0.0, device),
@@ -115,7 +125,8 @@ def _generate_fake_sampling_metadata(
         no_penalties=True,
         allowed_token_ids_mask=None,
         bad_words_token_ids={},
-        logitsprocs=logitsprocs)
+        logitsprocs=logitsprocs,
+    )
     return fake_sampling_metadata
 
 
@@ -127,15 +138,15 @@ def _generate_test_fakes(batch_size: int, device: str) -> LogitsprocsTestFakes:
         fake_logits[i, 0] = 10.0  # High logit for first token
         fake_logits[i, 1:] = 1e-2  # Others remain low
     sampling_metadata = _generate_fake_sampling_metadata(
-        NUM_OUTPUT_TOKENS, batch_size, VOCAB_SIZE, torch.device(device))
+        NUM_OUTPUT_TOKENS, batch_size, VOCAB_SIZE, torch.device(device)
+    )
     return LogitsprocsTestFakes(
         logits=fake_logits,
         sampling_metadata=sampling_metadata,
     )
 
 
-def _sampling_params_from_logitproc(
-        logitproc_type: LogitprocType) -> SamplingParams:
+def _sampling_params_from_logitproc(logitproc_type: LogitprocType) -> SamplingParams:
     """Customize request SamplingParams for a specified logitproc"""
     # SamplingParams for req with no logitproc
     kwargs = {"min_p": 0.0, "logit_bias": None, "min_tokens": 0}
@@ -150,7 +161,7 @@ def _generate_mixed_logitsprocs_batch_params(
 ) -> list[LogitsProcsRequestParams]:
     """Define key params for a batch of requests with a different
     logitproc enabled per request.
-    
+
     The batch will have `reqs_per_logitproc` repeats for all
     `logitsprocs_types` under test, including the case where
     no logitsproc is enabled. The batch is randomly shuffled. The
@@ -173,7 +184,8 @@ def _generate_mixed_logitsprocs_batch_params(
     return [
         LogitsProcsRequestParams(
             workload_index=idx,
-            logitproc_type=logitsprocs_types[pdx // reqs_per_logitproc])
+            logitproc_type=logitsprocs_types[pdx // reqs_per_logitproc],
+        )
         for idx, pdx in enumerate(batch_perm)
     ]
 
@@ -185,10 +197,12 @@ def _raise_error_invalid(
     step_idx: int,
     err_cls: type[Exception] = ValueError,
 ) -> None:
-    raise err_cls(f"Validation failed for step={step_idx}, "
-                  f"batch_index={batch_index}, "
-                  f"workload_index={request_params.workload_index}, "
-                  f"req_params={request_params}. Reason: {msg_suffix}")
+    raise err_cls(
+        f"Validation failed for step={step_idx}, "
+        f"batch_index={batch_index}, "
+        f"workload_index={request_params.workload_index}, "
+        f"req_params={request_params}. Reason: {msg_suffix}"
+    )
 
 
 def _logit_bias_params(kwargs: dict) -> None:
@@ -208,8 +222,7 @@ def _logit_bias_validate(
 ) -> None:
     """Validate logit bias logitproc applied correctly"""
     logit_bias = request_params.params.logit_bias
-    logits_old = (
-        test_fakes.logits[persistent_batch[batch_index].workload_index].cpu())
+    logits_old = test_fakes.logits[persistent_batch[batch_index].workload_index].cpu()
     logits_new = logits_new[batch_index].cpu()
     for token_id in range(VOCAB_SIZE):
         logit_old_value = logits_old[token_id]
@@ -218,22 +231,28 @@ def _logit_bias_validate(
             bias_value = logit_bias[token_id]
             exp_value = bias_value + logit_old_value
             if logit_new_value != pytest.approx(exp_value):
-                _raise_error_invalid(msg_suffix=(
-                    f"Biased token {token_id} logit value {logit_new_value} "
-                    f"does not match expected value {exp_value} "
-                    f"given bias {bias_value}"),
-                                     batch_index=batch_index,
-                                     request_params=request_params,
-                                     step_idx=step_idx)
+                _raise_error_invalid(
+                    msg_suffix=(
+                        f"Biased token {token_id} logit value {logit_new_value} "
+                        f"does not match expected value {exp_value} "
+                        f"given bias {bias_value}"
+                    ),
+                    batch_index=batch_index,
+                    request_params=request_params,
+                    step_idx=step_idx,
+                )
 
         else:
             if logit_new_value != pytest.approx(logit_old_value):
-                _raise_error_invalid(msg_suffix=(
-                    f"Unbiased token {token_id} logit value {logit_new_value} "
-                    f"does not match expected value {logit_old_value}"),
-                                     batch_index=batch_index,
-                                     request_params=request_params,
-                                     step_idx=step_idx)
+                _raise_error_invalid(
+                    msg_suffix=(
+                        f"Unbiased token {token_id} logit value {logit_new_value} "
+                        f"does not match expected value {logit_old_value}"
+                    ),
+                    batch_index=batch_index,
+                    request_params=request_params,
+                    step_idx=step_idx,
+                )
 
 
 def _min_p_params(kwargs: dict) -> None:
@@ -259,26 +278,27 @@ def _min_p_validate(
                     msg_suffix="Invalid: dominant token 0 masked (-inf)",
                     batch_index=batch_index,
                     request_params=request_params,
-                    step_idx=step_idx)
+                    step_idx=step_idx,
+                )
         else:
             if request_params.params.min_p > 0.0:
                 # Non-dominant tokens should be masked when min_p > 0
                 if logits_for_token != -float("inf"):
                     _raise_error_invalid(
-                        msg_suffix=
-                        f"Invalid: non-dominant token {token_id} not masked",
+                        msg_suffix=f"Invalid: non-dominant token {token_id} not masked",
                         batch_index=batch_index,
                         request_params=request_params,
-                        step_idx=step_idx)
+                        step_idx=step_idx,
+                    )
             else:
                 # No masking when min_p is 0
                 if logits_for_token == -float("inf"):
                     _raise_error_invalid(
-                        msg_suffix=
-                        f"Invalid: token {token_id} masked when min_p=0.0",
+                        msg_suffix=f"Invalid: token {token_id} masked when min_p=0.0",
                         batch_index=batch_index,
                         request_params=request_params,
-                        step_idx=step_idx)
+                        step_idx=step_idx,
+                    )
 
 
 def _min_tokens_params(kwargs: dict) -> None:
@@ -303,7 +323,8 @@ def _min_tokens_validate(
     min_reached = ref_num_out_tokens >= MIN_TOKENS_LEN_THRESHOLD
     ref_all_stop_token_ids = request_params.params.all_stop_token_ids
     mt_lp: MinTokensLogitsProcessor = next(
-        test_fakes.get_logitsprocs_by_cls(MinTokensLogitsProcessor))
+        test_fakes.get_logitsprocs_by_cls(MinTokensLogitsProcessor)
+    )
     assert isinstance(mt_lp, MinTokensLogitsProcessor)
     min_tok = mt_lp.min_toks.get(batch_index, None)
 
@@ -312,38 +333,50 @@ def _min_tokens_validate(
         (_, out_tok, all_stop_token_ids) = min_tok
         num_out_tokens = len(out_tok)
         if num_out_tokens != ref_num_out_tokens:
-            _raise_error_invalid(msg_suffix=(
-                "Number of output tokens in min-token logit processor "
-                f"request metadata ({num_out_tokens}) does not match "
-                f"reference ({ref_num_out_tokens})."),
-                                 batch_index=batch_index,
-                                 request_params=request_params,
-                                 step_idx=step_idx)
+            _raise_error_invalid(
+                msg_suffix=(
+                    "Number of output tokens in min-token logit processor "
+                    f"request metadata ({num_out_tokens}) does not match "
+                    f"reference ({ref_num_out_tokens})."
+                ),
+                batch_index=batch_index,
+                request_params=request_params,
+                step_idx=step_idx,
+            )
         if ref_all_stop_token_ids != all_stop_token_ids:
-            _raise_error_invalid(msg_suffix=(
-                "Stop token ids do not match reference; all_stop_token_ids: "
-                f"{sorted(all_stop_token_ids)}, ref_all_stop_token_ids: "
-                f"{sorted(ref_all_stop_token_ids)}"),
-                                 batch_index=batch_index,
-                                 request_params=request_params,
-                                 step_idx=step_idx)
+            _raise_error_invalid(
+                msg_suffix=(
+                    "Stop token ids do not match reference; all_stop_token_ids: "
+                    f"{sorted(all_stop_token_ids)}, ref_all_stop_token_ids: "
+                    f"{sorted(ref_all_stop_token_ids)}"
+                ),
+                batch_index=batch_index,
+                request_params=request_params,
+                step_idx=step_idx,
+            )
         if min_reached:
-            _raise_error_invalid(msg_suffix=(
-                "Expected min-tokens request with min reached, but batch "
-                "index is recognized by min-tokens logits processor."),
-                                 batch_index=batch_index,
-                                 request_params=request_params,
-                                 step_idx=step_idx,
-                                 err_cls=RuntimeError)
+            _raise_error_invalid(
+                msg_suffix=(
+                    "Expected min-tokens request with min reached, but batch "
+                    "index is recognized by min-tokens logits processor."
+                ),
+                batch_index=batch_index,
+                request_params=request_params,
+                step_idx=step_idx,
+                err_cls=RuntimeError,
+            )
 
     elif not min_reached:
-        _raise_error_invalid(msg_suffix=(
-            "Expected min-tokens request with min not reached, but batch "
-            "index is not recognized by min-tokens logits processor."),
-                             batch_index=batch_index,
-                             request_params=request_params,
-                             step_idx=step_idx,
-                             err_cls=RuntimeError)
+        _raise_error_invalid(
+            msg_suffix=(
+                "Expected min-tokens request with min not reached, but batch "
+                "index is not recognized by min-tokens logits processor."
+            ),
+            batch_index=batch_index,
+            request_params=request_params,
+            step_idx=step_idx,
+            err_cls=RuntimeError,
+        )
 
     # Validate min-token logits
     for token_id in range(VOCAB_SIZE):
@@ -351,21 +384,27 @@ def _min_tokens_validate(
         if token_id in ref_all_stop_token_ids and not min_reached:
             if logits_for_token != -float("inf"):
                 _raise_error_invalid(
-                    msg_suffix=(f"Token {token_id} is a stop token and "
-                                "the sequence has not reached min length, "
-                                "but the token is not masked "
-                                f"(logit={logits_for_token})"),
+                    msg_suffix=(
+                        f"Token {token_id} is a stop token and "
+                        "the sequence has not reached min length, "
+                        "but the token is not masked "
+                        f"(logit={logits_for_token})"
+                    ),
                     batch_index=batch_index,
                     request_params=request_params,
-                    step_idx=step_idx)
+                    step_idx=step_idx,
+                )
         else:
             if logits_for_token == -float("inf"):
                 _raise_error_invalid(
-                    msg_suffix=(f"Token {token_id} should not be masked but "
-                                f"is (output len={ref_num_out_tokens})"),
+                    msg_suffix=(
+                        f"Token {token_id} should not be masked but "
+                        f"is (output len={ref_num_out_tokens})"
+                    ),
                     batch_index=batch_index,
                     request_params=request_params,
-                    step_idx=step_idx)
+                    step_idx=step_idx,
+                )
 
 
 def _none_validate(
@@ -377,52 +416,58 @@ def _none_validate(
     step_idx: int,
 ) -> None:
     """Validate that no logits processors are applied"""
-    logits = (
-        test_fakes.logits[persistent_batch[batch_index].workload_index].cpu())
+    logits = test_fakes.logits[persistent_batch[batch_index].workload_index].cpu()
     ref_logits = logits_new[batch_index]
     if not torch.all(ref_logits == logits):
-        mismatch_toks = (ref_logits
-                         != logits).nonzero(as_tuple=True)[0].tolist()
+        mismatch_toks = (ref_logits != logits).nonzero(as_tuple=True)[0].tolist()
         mismatch_strs = []
         for token in mismatch_toks:
             val = float(logits[token])
             ref_val = float(ref_logits[token])
             mismatch_strs.append(f"({token=},{val=},{ref_val=})")
-        _raise_error_invalid(msg_suffix=(
-            f"Unexpected modification of logits: {','.join(mismatch_strs)}"),
-                             batch_index=batch_index,
-                             request_params=request_params,
-                             step_idx=step_idx)
+        _raise_error_invalid(
+            msg_suffix=(
+                f"Unexpected modification of logits: {','.join(mismatch_strs)}"
+            ),
+            batch_index=batch_index,
+            request_params=request_params,
+            step_idx=step_idx,
+        )
 
 
 class LogitsprocTestHelpers(NamedTuple):
     """Supports setting up and validating logitsprocs unit tests."""
+
     eval_fxn: Callable
     gen_request_fxn: Optional[Callable] = None
 
 
 logitsprocs_test_mapping = {
-    STR_NO_LOGITPROC:
-    LogitsprocTestHelpers(eval_fxn=_none_validate),
-    LogitBiasLogitsProcessor:
-    LogitsprocTestHelpers(gen_request_fxn=_logit_bias_params,
-                          eval_fxn=_logit_bias_validate),
-    MinPLogitsProcessor:
-    LogitsprocTestHelpers(gen_request_fxn=_min_p_params,
-                          eval_fxn=_min_p_validate),
-    MinTokensLogitsProcessor:
-    LogitsprocTestHelpers(gen_request_fxn=_min_tokens_params,
-                          eval_fxn=_min_tokens_validate),
+    STR_NO_LOGITPROC: LogitsprocTestHelpers(eval_fxn=_none_validate),
+    LogitBiasLogitsProcessor: LogitsprocTestHelpers(
+        gen_request_fxn=_logit_bias_params, eval_fxn=_logit_bias_validate
+    ),
+    MinPLogitsProcessor: LogitsprocTestHelpers(
+        gen_request_fxn=_min_p_params, eval_fxn=_min_p_validate
+    ),
+    MinTokensLogitsProcessor: LogitsprocTestHelpers(
+        gen_request_fxn=_min_tokens_params, eval_fxn=_min_tokens_validate
+    ),
 }
 
 
 def _get_test_cases() -> list[list[str]]:
     """Each test case is a set of logitsprocs"""
     logitsprocs_types = list(logitsprocs_test_mapping.keys())
-    return [[STR_NO_LOGITPROC]] + [[logitproc_type, STR_NO_LOGITPROC]
-                                   for logitproc_type in logitsprocs_types
-                                   if logitproc_type != STR_NO_LOGITPROC
-                                   ] + [logitsprocs_types]
+    return (
+        [[STR_NO_LOGITPROC]]
+        + [
+            [logitproc_type, STR_NO_LOGITPROC]
+            for logitproc_type in logitsprocs_types
+            if logitproc_type != STR_NO_LOGITPROC
+        ]
+        + [logitsprocs_types]
+    )
 
 
 def _generate_fake_step_update(
@@ -440,11 +485,18 @@ def _generate_fake_step_update(
     # Other 50%: add a limited number of reqs (less than the number
     # of workload reqs remaining, less than an arbitrary max)
     # If no workload reqs remain: 100% of steps have 0 adds
-    num_step_add = random.choice([
-        0,
-        random.randint(1, min(max_add_remove_per_step,
-                              workload_reqs_remaining))
-    ]) if workload_reqs_remaining else 0
+    num_step_add = (
+        random.choice(
+            [
+                0,
+                random.randint(
+                    1, min(max_add_remove_per_step, workload_reqs_remaining)
+                ),
+            ]
+        )
+        if workload_reqs_remaining
+        else 0
+    )
 
     # 50% of steps: remove no requests
     # Other 50%: remove a limited number of reqs (less than the number
@@ -452,9 +504,11 @@ def _generate_fake_step_update(
     # If persistent batch is empty: 100% of steps have 0 removals until
     # more requests are added. Assume that removed requests are always
     # drawn from the current batch, before new adds
-    num_step_remove = random.choice([
-        0, random.randint(1, min(max_add_remove_per_step, batch_size))
-    ]) if batch_size else 0
+    num_step_remove = (
+        random.choice([0, random.randint(1, min(max_add_remove_per_step, batch_size))])
+        if batch_size
+        else 0
+    )
 
     num_step_add_replace = min(num_step_add, num_step_remove)
 
@@ -463,23 +517,34 @@ def _generate_fake_step_update(
         batch_update_builder.removed_append(removal)
 
     # Get added requests from workload
-    for add_req_params in workload_params[wdx:(wdx + num_step_add_replace)]:
+    for add_req_params in workload_params[wdx : (wdx + num_step_add_replace)]:
         # Replace as many removed requests as possible with added requests
         add_remove_idx = batch_update_builder.pop_removed()
         batch_update_builder.added.append(
-            (add_remove_idx, add_req_params.params,
-             add_req_params.prompt_tokens, add_req_params.out_tokens))
+            (
+                add_remove_idx,
+                add_req_params.params,
+                add_req_params.prompt_tokens,
+                add_req_params.out_tokens,
+            )
+        )
         persistent_batch[add_remove_idx] = add_req_params
 
     # Append remaining added requests to end of batch
-    add_reqs_append = workload_params[(wdx +
-                                       num_step_add_replace):(wdx +
-                                                              num_step_add)]
-    batch_update_builder.added.extend([
-        (adx + batch_size, add_req_params.params, add_req_params.prompt_tokens,
-         add_req_params.out_tokens)
-        for adx, add_req_params in enumerate(add_reqs_append)
-    ])
+    add_reqs_append = workload_params[
+        (wdx + num_step_add_replace) : (wdx + num_step_add)
+    ]
+    batch_update_builder.added.extend(
+        [
+            (
+                adx + batch_size,
+                add_req_params.params,
+                add_req_params.prompt_tokens,
+                add_req_params.out_tokens,
+            )
+            for adx, add_req_params in enumerate(add_reqs_append)
+        ]
+    )
     persistent_batch.extend(add_reqs_append)
     pre_condense_batch_size = len(persistent_batch)
     wdx += num_step_add  # Update workload offset
@@ -488,8 +553,10 @@ def _generate_fake_step_update(
     last_nonempty_index = pre_condense_batch_size - 1
     condensed_to_idxs = set()
     while batch_update_builder.removed:
-        if (last_nonempty_index in batch_update_builder.removed
-                or last_nonempty_index in condensed_to_idxs):
+        if (
+            last_nonempty_index in batch_update_builder.removed
+            or last_nonempty_index in condensed_to_idxs
+        ):
             last_nonempty_index -= 1
             continue
         # last_nonempty_index is the highest persistent batch index that was
@@ -504,11 +571,10 @@ def _generate_fake_step_update(
         # move last_nonempty_index -> first_empty_index
         batch_update_builder.pop_removed()
         condensed_to_idxs.add(first_empty_index)
-        persistent_batch[first_empty_index] = persistent_batch[
-            last_nonempty_index]
+        persistent_batch[first_empty_index] = persistent_batch[last_nonempty_index]
         batch_update_builder.moved.append(
-            (last_nonempty_index, first_empty_index,
-             MoveDirectionality.UNIDIRECTIONAL))
+            (last_nonempty_index, first_empty_index, MoveDirectionality.UNIDIRECTIONAL)
+        )
 
         last_nonempty_index -= 1
 
@@ -524,18 +590,21 @@ def _generate_fake_step_update(
         k = random.randint(0, condensed_batch_size // 2)
         idxs = list(range(condensed_batch_size))
         random.shuffle(idxs)
-        swaps = [
-            tuple(sorted([idxs[2 * i], idxs[2 * i + 1]])) for i in range(k)
-        ]
-        batch_update_builder.moved.extend([
-            (sw[0], sw[1], MoveDirectionality.SWAP) for sw in swaps
-        ])
+        swaps = [tuple(sorted([idxs[2 * i], idxs[2 * i + 1]])) for i in range(k)]
+        batch_update_builder.moved.extend(
+            [(sw[0], sw[1], MoveDirectionality.SWAP) for sw in swaps]
+        )
         for adx, bdx in swaps:
-            persistent_batch[adx], persistent_batch[bdx] = persistent_batch[
-                bdx], persistent_batch[adx]
-
-    return (batch_update_builder.get_and_reset(condensed_batch_size), wdx,
-            workload_size - wdx)
+            persistent_batch[adx], persistent_batch[bdx] = (
+                persistent_batch[bdx],
+                persistent_batch[adx],
+            )
+
+    return (
+        batch_update_builder.get_and_reset(condensed_batch_size),
+        wdx,
+        workload_size - wdx,
+    )
 
 
 def _assert_valid(
@@ -550,8 +619,10 @@ def _assert_valid(
         # Trivial case of empty persistent batch
         assert len(persistent_batch) == 0
         if logits_w_lp.shape[0] != 0:
-            raise ValueError("Fake persistent batch is empty but logitsprocs "
-                             f"output batch has shape {logits_w_lp.shape}")
+            raise ValueError(
+                "Fake persistent batch is empty but logitsprocs "
+                f"output batch has shape {logits_w_lp.shape}"
+            )
         return
 
     # Validate logits for each fake request
@@ -560,36 +631,40 @@ def _assert_valid(
         # Invoke the appropriate validation function for
         # the logitproc employed by this request
         fxn = logitsprocs_test_mapping[request_params.logitproc_type].eval_fxn
-        fxn(test_fakes=test_fakes,
+        fxn(
+            test_fakes=test_fakes,
             persistent_batch=persistent_batch,
             logits_new=logits_w_lp,
             batch_index=batch_index,
             request_params=request_params,
-            step_idx=step_idx)
+            step_idx=step_idx,
+        )
 
 
 @create_new_process_for_each_test()
 @pytest.mark.parametrize("device", CUDA_DEVICES)
 @pytest.mark.parametrize("reqs_per_logitproc", [REQS_PER_LOGITPROC])
 @pytest.mark.parametrize("logitsprocs_under_test", _get_test_cases())
-def test_logitsprocs(device: str, reqs_per_logitproc: int,
-                     logitsprocs_under_test: list[str]):
+def test_logitsprocs(
+    device: str, reqs_per_logitproc: int, logitsprocs_under_test: list[str]
+):
     random.seed(40)
     torch.set_default_device(device)
 
     # Define a shuffled batch of requests which individually use a different
     # logitproc, or no logitproc at all
     workload_params = _generate_mixed_logitsprocs_batch_params(
-        reqs_per_logitproc=reqs_per_logitproc,
-        logitsprocs_types=logitsprocs_under_test)
+        reqs_per_logitproc=reqs_per_logitproc, logitsprocs_types=logitsprocs_under_test
+    )
     workload_size = len(workload_params)
 
     # Create fake test data structures for testing.
     test_fakes = _generate_test_fakes(workload_size, device)
 
     wdx = 0  # Next request index in workload to add
-    persistent_batch: list[LogitsProcsRequestParams] = [
-    ]  # Persistent batch state, as list of workload indices
+    persistent_batch: list[
+        LogitsProcsRequestParams
+    ] = []  # Persistent batch state, as list of workload indices
 
     # Generate fake removed request indices from current persistent
     # batch before adds
diff --git a/tests/v1/logits_processors/test_custom_offline.py b/tests/v1/logits_processors/test_custom_offline.py
index 891f55a14633..6ee474270c69 100644
--- a/tests/v1/logits_processors/test_custom_offline.py
+++ b/tests/v1/logits_processors/test_custom_offline.py
@@ -7,32 +7,44 @@
 import pytest
 
 from tests.utils import create_new_process_for_each_test
+
 # yapf: disable
-from tests.v1.logits_processors.utils import (DUMMY_LOGITPROC_ARG,
-                                              DUMMY_LOGITPROC_FQCN,
-                                              DUMMY_LOGITPROC_MODULE,
-                                              MAX_TOKENS, MODEL_NAME,
-                                              POOLING_MODEL_NAME, TEMP_GREEDY,
-                                              CustomLogitprocSource,
-                                              DummyLogitsProcessor,
-                                              WrappedPerReqLogitsProcessor,
-                                              dummy_module)
+from tests.v1.logits_processors.utils import (
+    DUMMY_LOGITPROC_ARG,
+    DUMMY_LOGITPROC_FQCN,
+    DUMMY_LOGITPROC_MODULE,
+    MAX_TOKENS,
+    MODEL_NAME,
+    POOLING_MODEL_NAME,
+    TEMP_GREEDY,
+    CustomLogitprocSource,
+    DummyLogitsProcessor,
+    WrappedPerReqLogitsProcessor,
+    dummy_module,
+    prompts,
+)
 from tests.v1.logits_processors.utils import entry_points as fake_entry_points
-from tests.v1.logits_processors.utils import prompts
+
 # yapf: enable
 from vllm import LLM, SamplingParams
-from vllm.v1.sample.logits_processor import (STR_POOLING_REJECTS_LOGITSPROCS,
-                                             LogitsProcessor)
+from vllm.v1.sample.logits_processor import (
+    STR_POOLING_REJECTS_LOGITSPROCS,
+    LogitsProcessor,
+)
 
 # Create a mixture of requests which do and don't utilize the dummy logitproc
 sampling_params_list = [
-    SamplingParams(temperature=TEMP_GREEDY,
-                   max_tokens=MAX_TOKENS,
-                   extra_args={DUMMY_LOGITPROC_ARG: 128}),
+    SamplingParams(
+        temperature=TEMP_GREEDY,
+        max_tokens=MAX_TOKENS,
+        extra_args={DUMMY_LOGITPROC_ARG: 128},
+    ),
     SamplingParams(temperature=TEMP_GREEDY, max_tokens=MAX_TOKENS),
-    SamplingParams(temperature=TEMP_GREEDY,
-                   max_tokens=MAX_TOKENS,
-                   extra_args={DUMMY_LOGITPROC_ARG: 67}),
+    SamplingParams(
+        temperature=TEMP_GREEDY,
+        max_tokens=MAX_TOKENS,
+        extra_args={DUMMY_LOGITPROC_ARG: 67},
+    ),
     SamplingParams(temperature=TEMP_GREEDY, max_tokens=MAX_TOKENS),
 ]
 
@@ -49,7 +61,7 @@ def _run_test(kwargs: dict, logitproc_loaded: bool) -> None:
     2. Server has *not* loaded dummy logitproc; test that all requests
        behave as if logitproc is *not* operating (output matches reference
        `LLM` output.)
-    
+
     Args:
       kwargs: `LLM` constructor kwargs
       logitproc_loaded: server has loaded dummy logitproc if True
@@ -73,7 +85,8 @@ def _run_test(kwargs: dict, logitproc_loaded: bool) -> None:
 
     # Validate outputs
     for bdx, (out_lp, out_ref, params) in enumerate(
-            zip(outputs_logitproc, outputs_ref, sampling_params_list)):
+        zip(outputs_logitproc, outputs_ref, sampling_params_list)
+    ):
         lp_toks = out_lp.outputs[0].token_ids
         if logitproc_loaded and params.extra_args:
             # This request exercises custom logitproc; validate that logitproc
@@ -81,8 +94,8 @@ def _run_test(kwargs: dict, logitproc_loaded: bool) -> None:
             target_token = params.extra_args[DUMMY_LOGITPROC_ARG]
             if not all(x == target_token for x in lp_toks):
                 raise AssertionError(
-                    f"Request {bdx} generated {lp_toks}, should all be "
-                    f"{target_token}")
+                    f"Request {bdx} generated {lp_toks}, should all be {target_token}"
+                )
         else:
             # This request does not exercise custom logitproc (or custom
             # logitproc is not enabled on this server); validate against
@@ -90,16 +103,15 @@ def _run_test(kwargs: dict, logitproc_loaded: bool) -> None:
             ref_toks = out_ref.outputs[0].token_ids
             if lp_toks != ref_toks:
                 raise AssertionError(
-                    f"Request {bdx} generated {lp_toks}, should match "
-                    f"{ref_toks}")
+                    f"Request {bdx} generated {lp_toks}, should match {ref_toks}"
+                )
 
 
 @create_new_process_for_each_test()
 @pytest.mark.parametrize("logitproc_source", list(CustomLogitprocSource))
-def test_custom_logitsprocs(monkeypatch,
-                            logitproc_source: CustomLogitprocSource):
+def test_custom_logitsprocs(monkeypatch, logitproc_source: CustomLogitprocSource):
     """Test offline Python interface for passing custom logitsprocs
-    
+
     Construct an `LLM` instance which loads a custom logitproc that has a
     well-defined behavior (mask out all tokens except one `target_token`)
 
@@ -118,7 +130,7 @@ def test_custom_logitsprocs(monkeypatch,
       instance output
     * Logitproc passed in via {entrypoint, class object, fully-qualified class
       name (FQCN)} - test that dummy logitproc is utilized correctly when
-      provided via any of these three possible sources 
+      provided via any of these three possible sources
 
     Args:
       monkeypatch: for setting env vars
@@ -142,6 +154,7 @@ def test_custom_logitsprocs(monkeypatch,
         # Scenario: vLLM loads a logitproc from a preconfigured entrypoint
         # To that end, mock a dummy logitproc entrypoint
         import importlib.metadata
+
         importlib.metadata.entry_points = fake_entry_points  # type: ignore
 
         # fork is required for workers to see entrypoint patch
@@ -165,7 +178,7 @@ def test_custom_logitsprocs(monkeypatch,
 @create_new_process_for_each_test()
 def test_custom_logitsprocs_req(monkeypatch):
     """Test passing request-level logits processor to offline Python interface
-    
+
     Wrap a request-level logits processor to create a batch level logits
     processor that has a well-defined behavior (mask out all tokens except one
     `target_token`)
@@ -190,18 +203,23 @@ def test_custom_logitsprocs_req(monkeypatch):
     # Test that logitproc info is passed to workers
     monkeypatch.setenv("VLLM_ENABLE_V1_MULTIPROCESSING", "1")
     random.seed(40)
-    _run_test({"logits_processors": [WrappedPerReqLogitsProcessor]},
-              logitproc_loaded=True)
+    _run_test(
+        {"logits_processors": [WrappedPerReqLogitsProcessor]}, logitproc_loaded=True
+    )
 
 
 @create_new_process_for_each_test()
-@pytest.mark.parametrize("logitproc_source", [
-    CustomLogitprocSource.LOGITPROC_SOURCE_ENTRYPOINT,
-    CustomLogitprocSource.LOGITPROC_SOURCE_FQCN,
-    CustomLogitprocSource.LOGITPROC_SOURCE_CLASS,
-])
+@pytest.mark.parametrize(
+    "logitproc_source",
+    [
+        CustomLogitprocSource.LOGITPROC_SOURCE_ENTRYPOINT,
+        CustomLogitprocSource.LOGITPROC_SOURCE_FQCN,
+        CustomLogitprocSource.LOGITPROC_SOURCE_CLASS,
+    ],
+)
 def test_pooling_rejects_custom_logitsprocs(
-        monkeypatch, logitproc_source: CustomLogitprocSource):
+    monkeypatch, logitproc_source: CustomLogitprocSource
+):
     """Validate that vLLM engine initialization properly rejects custom
     logitsprocs when the model is a pooling model.
 
@@ -233,6 +251,7 @@ def test_pooling_rejects_custom_logitsprocs(
 
         # Patch in dummy logitproc entrypoint
         import importlib.metadata
+
         importlib.metadata.entry_points = fake_entry_points  # type: ignore
 
         # fork is required for entrypoint patch to be visible to workers,
@@ -245,10 +264,15 @@ def test_pooling_rejects_custom_logitsprocs(
             gpu_memory_utilization=0.1,
         )
         # Require that no logitsprocs have been loaded
-        assert sum([
-            1 for _ in llm.llm_engine.model_executor.driver_worker.worker.
-            model_runner.input_batch.logitsprocs.all
-        ]) == 0
+        assert (
+            sum(
+                [
+                    1
+                    for _ in llm.llm_engine.model_executor.driver_worker.worker.model_runner.input_batch.logitsprocs.all
+                ]
+            )
+            == 0
+        )
         return
 
     kwargs: dict[str, list[Union[str, type[LogitsProcessor]]]] = {}
diff --git a/tests/v1/logits_processors/test_custom_online.py b/tests/v1/logits_processors/test_custom_online.py
index a01a479e5b24..dbec35a50894 100644
--- a/tests/v1/logits_processors/test_custom_online.py
+++ b/tests/v1/logits_processors/test_custom_online.py
@@ -10,16 +10,20 @@
 import pytest
 import pytest_asyncio
 
-from tests.utils import (RemoteOpenAIServerCustom,
-                         create_new_process_for_each_test)
+from tests.utils import RemoteOpenAIServerCustom, create_new_process_for_each_test
+
 # yapf: disable
-from tests.v1.logits_processors.utils import (DUMMY_LOGITPROC_ARG,
-                                              DUMMY_LOGITPROC_FQCN,
-                                              DUMMY_LOGITPROC_MODULE,
-                                              MAX_TOKENS, MODEL_NAME,
-                                              TEMP_GREEDY, dummy_module)
+from tests.v1.logits_processors.utils import (
+    DUMMY_LOGITPROC_ARG,
+    DUMMY_LOGITPROC_FQCN,
+    DUMMY_LOGITPROC_MODULE,
+    MAX_TOKENS,
+    MODEL_NAME,
+    TEMP_GREEDY,
+    dummy_module,
+    prompts,
+)
 from tests.v1.logits_processors.utils import entry_points as fake_entry_points
-from tests.v1.logits_processors.utils import prompts
 
 # yapf: enable
 
@@ -33,11 +37,12 @@ def _server_with_logitproc_entrypoint(
 
     # Patch `entry_points` to inject logitproc entrypoint
     import importlib.metadata
+
     importlib.metadata.entry_points = fake_entry_points  # type: ignore
     from vllm.entrypoints.cli import main
 
     # fork is required for workers to see entrypoint patch
-    os.environ['VLLM_WORKER_MULTIPROC_METHOD'] = "fork"
+    os.environ["VLLM_WORKER_MULTIPROC_METHOD"] = "fork"
     if env_dict is not None:
         os.environ.update(env_dict)
 
@@ -55,10 +60,11 @@ def _server_with_logitproc_module(
 
     # Patch `modules` to inject dummy logitproc module
     from vllm.entrypoints.cli import main
+
     sys.modules[DUMMY_LOGITPROC_MODULE] = dummy_module
 
     # fork is required for workers to see entrypoint patch
-    os.environ['VLLM_WORKER_MULTIPROC_METHOD'] = "fork"
+    os.environ["VLLM_WORKER_MULTIPROC_METHOD"] = "fork"
     if env_dict is not None:
         os.environ.update(env_dict)
 
@@ -80,8 +86,9 @@ def default_server_args():
     ]
 
 
-@pytest.fixture(scope="function",
-                params=[[], ["--logits-processors", DUMMY_LOGITPROC_FQCN]])
+@pytest.fixture(
+    scope="function", params=[[], ["--logits-processors", DUMMY_LOGITPROC_FQCN]]
+)
 def server(default_server_args, request, monkeypatch):
     """Consider two server configurations:
     (1) --logits-processors cli arg specifies dummy logits processor via fully-
@@ -102,8 +109,7 @@ def server(default_server_args, request, monkeypatch):
         args = default_server_args
         _server_fxn = _server_with_logitproc_entrypoint
 
-    with RemoteOpenAIServerCustom(MODEL_NAME, args,
-                                  _server_fxn) as remote_server:
+    with RemoteOpenAIServerCustom(MODEL_NAME, args, _server_fxn) as remote_server:
         yield remote_server
 
 
@@ -133,7 +139,7 @@ async def client(server):
 )
 async def test_custom_logitsprocs(client: openai.AsyncOpenAI, model_name: str):
     """Test custom logitsprocs when starting OpenAI server from CLI
-    
+
     Launch vLLM OpenAI-compatible server, configured to load a custom logitproc
     that has a well-defined behavior (mask out all tokens except one
     `target_token`).
@@ -157,9 +163,7 @@ async def test_custom_logitsprocs(client: openai.AsyncOpenAI, model_name: str):
             # For requests which activate the dummy logitproc, choose one of
             # two `target_token` values which are known not to be EOS tokens
             request_keyword_args["extra_body"] = {
-                "vllm_xargs": {
-                    DUMMY_LOGITPROC_ARG: target_token
-                }
+                "vllm_xargs": {DUMMY_LOGITPROC_ARG: target_token}
             }
         batch = await client.completions.create(
             model=model_name,
@@ -173,8 +177,7 @@ async def test_custom_logitsprocs(client: openai.AsyncOpenAI, model_name: str):
             choices: openai.types.CompletionChoice = batch.choices
             toks = choices[0].logprobs.tokens
             if not all([x == toks[0] for x in toks]):
-                raise AssertionError(
-                    f"Generated {toks} should all be {toks[0]}")
+                raise AssertionError(f"Generated {toks} should all be {toks[0]}")
 
         # Alternate whether to activate dummy logitproc for each request
         use_dummy_logitproc = not use_dummy_logitproc
diff --git a/tests/v1/logits_processors/utils.py b/tests/v1/logits_processors/utils.py
index d3b7f314da09..9a1d5505a5f9 100644
--- a/tests/v1/logits_processors/utils.py
+++ b/tests/v1/logits_processors/utils.py
@@ -10,10 +10,13 @@
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.sampling_params import SamplingParams
-from vllm.v1.sample.logits_processor import (LOGITSPROCS_GROUP,
-                                             AdapterLogitsProcessor,
-                                             BatchUpdate, LogitsProcessor,
-                                             RequestLogitsProcessor)
+from vllm.v1.sample.logits_processor import (
+    LOGITSPROCS_GROUP,
+    AdapterLogitsProcessor,
+    BatchUpdate,
+    LogitsProcessor,
+    RequestLogitsProcessor,
+)
 from vllm.v1.sample.logits_processor.builtin import process_dict_updates
 
 logger = init_logger(__name__)
@@ -30,6 +33,7 @@
 
 class CustomLogitprocSource(Enum):
     """How to source a logitproc for testing purposes"""
+
     LOGITPROC_SOURCE_NONE = auto()  # No custom logitproc
     LOGITPROC_SOURCE_ENTRYPOINT = auto()  # Via entrypoint
     LOGITPROC_SOURCE_FQCN = auto()  # Via fully-qualified class name (FQCN)
@@ -48,8 +52,9 @@ class CustomLogitprocSource(Enum):
 class DummyLogitsProcessor(LogitsProcessor):
     """Fake logit processor to support unit testing and examples"""
 
-    def __init__(self, vllm_config: "VllmConfig", device: torch.device,
-                 is_pin_memory: bool):
+    def __init__(
+        self, vllm_config: "VllmConfig", device: torch.device, is_pin_memory: bool
+    ):
         self.req_info: dict[int, int] = {}
 
     def is_argmax_invariant(self) -> bool:
@@ -60,8 +65,8 @@ def update_state(self, batch_update: Optional[BatchUpdate]):
         process_dict_updates(
             self.req_info,
             batch_update,
-            lambda params, _, __: params.extra_args and
-            (params.extra_args.get("target_token")),
+            lambda params, _, __: params.extra_args
+            and (params.extra_args.get("target_token")),
         )
 
     def apply(self, logits: torch.Tensor) -> torch.Tensor:
@@ -69,16 +74,16 @@ def apply(self, logits: torch.Tensor) -> torch.Tensor:
             return logits
 
         # Save target values before modification
-        cols = torch.tensor(list(self.req_info.values()),
-                            dtype=torch.long,
-                            device=logits.device)
-        rows = torch.tensor(list(self.req_info.keys()),
-                            dtype=torch.long,
-                            device=logits.device)
+        cols = torch.tensor(
+            list(self.req_info.values()), dtype=torch.long, device=logits.device
+        )
+        rows = torch.tensor(
+            list(self.req_info.keys()), dtype=torch.long, device=logits.device
+        )
         values_to_keep = logits[rows, cols].clone()
 
         # Mask all but target tokens
-        logits[rows] = float('-inf')
+        logits[rows] = float("-inf")
         logits[rows, cols] = values_to_keep
 
         return logits
@@ -154,14 +159,17 @@ def new_req_logits_processor(
         Returns:
           `Callable` request logits processor, or None
         """
-        target_token: Optional[
-            Any] = params.extra_args and params.extra_args.get("target_token")
+        target_token: Optional[Any] = params.extra_args and params.extra_args.get(
+            "target_token"
+        )
         if target_token is None:
             return None
         if not isinstance(target_token, int):
             logger.warning(
                 "target_token value %s is not int; not applying logits"
-                " processor to request.", target_token)
+                " processor to request.",
+                target_token,
+            )
             return None
         return DummyPerReqLogitsProcessor(target_token)
 
diff --git a/tests/v1/metrics/test_engine_logger_apis.py b/tests/v1/metrics/test_engine_logger_apis.py
index e6a4d0a2a2e8..bf780b1f36ad 100644
--- a/tests/v1/metrics/test_engine_logger_apis.py
+++ b/tests/v1/metrics/test_engine_logger_apis.py
@@ -46,23 +46,22 @@ def log_stats_enabled_engine_args():
 
 
 @pytest.mark.asyncio
-async def test_async_llm_replace_default_loggers(
-        log_stats_enabled_engine_args):
+async def test_async_llm_replace_default_loggers(log_stats_enabled_engine_args):
     """
     RayPrometheusStatLogger should replace the default PrometheusStatLogger
     """
 
-    engine = AsyncLLM.from_engine_args(log_stats_enabled_engine_args,
-                                       stat_loggers=[RayPrometheusStatLogger])
-    assert isinstance(engine.logger_manager.prometheus_logger,
-                      RayPrometheusStatLogger)
+    engine = AsyncLLM.from_engine_args(
+        log_stats_enabled_engine_args, stat_loggers=[RayPrometheusStatLogger]
+    )
+    assert isinstance(engine.logger_manager.prometheus_logger, RayPrometheusStatLogger)
     engine.shutdown()
 
 
 @pytest.mark.asyncio
 async def test_async_llm_add_to_default_loggers(log_stats_enabled_engine_args):
     """
-    It's still possible to use custom stat loggers exclusively by passing 
+    It's still possible to use custom stat loggers exclusively by passing
     disable_log_stats=True in addition to a list of custom stat loggers.
     """
     # Create engine_args with disable_log_stats=True for this test
@@ -70,12 +69,14 @@ async def test_async_llm_add_to_default_loggers(log_stats_enabled_engine_args):
     disabled_log_engine_args.disable_log_stats = True
 
     # Disable default loggers; pass custom stat logger to the constructor
-    engine = AsyncLLM.from_engine_args(disabled_log_engine_args,
-                                       stat_loggers=[DummyStatLogger])
+    engine = AsyncLLM.from_engine_args(
+        disabled_log_engine_args, stat_loggers=[DummyStatLogger]
+    )
 
     assert len(engine.logger_manager.per_engine_logger_dict[0]) == 1
-    assert isinstance(engine.logger_manager.per_engine_logger_dict[0][0],
-                      DummyStatLogger)
+    assert isinstance(
+        engine.logger_manager.per_engine_logger_dict[0][0], DummyStatLogger
+    )
 
     # log_stats is still True, since custom stat loggers are used
     assert engine.log_stats
diff --git a/tests/v1/metrics/test_metrics_reader.py b/tests/v1/metrics/test_metrics_reader.py
index 16bca359fc2f..1c90e6d33527 100644
--- a/tests/v1/metrics/test_metrics_reader.py
+++ b/tests/v1/metrics/test_metrics_reader.py
@@ -4,8 +4,13 @@
 import prometheus_client
 import pytest
 
-from vllm.v1.metrics.reader import (Counter, Gauge, Histogram, Vector,
-                                    get_metrics_snapshot)
+from vllm.v1.metrics.reader import (
+    Counter,
+    Gauge,
+    Histogram,
+    Vector,
+    get_metrics_snapshot,
+)
 
 pytestmark = pytest.mark.cpu_test
 
@@ -20,10 +25,12 @@ def test_registry(monkeypatch):
 
 @pytest.mark.parametrize("num_engines", [1, 4])
 def test_gauge_metric(test_registry, num_engines):
-    g = prometheus_client.Gauge("vllm:test_gauge",
-                                "Test gauge metric",
-                                labelnames=["model", "engine_index"],
-                                registry=test_registry)
+    g = prometheus_client.Gauge(
+        "vllm:test_gauge",
+        "Test gauge metric",
+        labelnames=["model", "engine_index"],
+        registry=test_registry,
+    )
     for i in range(num_engines):
         g.labels(model="foo", engine_index=str(i)).set(98.5)
 
@@ -41,10 +48,12 @@ def test_gauge_metric(test_registry, num_engines):
 
 @pytest.mark.parametrize("num_engines", [1, 4])
 def test_counter_metric(test_registry, num_engines):
-    c = prometheus_client.Counter("vllm:test_counter",
-                                  "Test counter metric",
-                                  labelnames=["model", "engine_index"],
-                                  registry=test_registry)
+    c = prometheus_client.Counter(
+        "vllm:test_counter",
+        "Test counter metric",
+        labelnames=["model", "engine_index"],
+        registry=test_registry,
+    )
     for i in range(num_engines):
         c.labels(model="bar", engine_index=str(i)).inc(19)
 
@@ -62,11 +71,13 @@ def test_counter_metric(test_registry, num_engines):
 
 @pytest.mark.parametrize("num_engines", [1, 4])
 def test_histogram_metric(test_registry, num_engines):
-    h = prometheus_client.Histogram("vllm:test_histogram",
-                                    "Test histogram metric",
-                                    labelnames=["model", "engine_index"],
-                                    buckets=[10, 20, 30, 40, 50],
-                                    registry=test_registry)
+    h = prometheus_client.Histogram(
+        "vllm:test_histogram",
+        "Test histogram metric",
+        labelnames=["model", "engine_index"],
+        buckets=[10, 20, 30, 40, 50],
+        registry=test_registry,
+    )
     for i in range(num_engines):
         hist = h.labels(model="blaa", engine_index=str(i))
         hist.observe(42)
@@ -97,7 +108,8 @@ def test_vector_metric(test_registry, num_engines):
         "vllm:spec_decode_num_accepted_tokens_per_pos",
         "Vector-like counter metric",
         labelnames=["position", "model", "engine_index"],
-        registry=test_registry)
+        registry=test_registry,
+    )
     for i in range(num_engines):
         c.labels(position="0", model="llama", engine_index=str(i)).inc(10)
         c.labels(position="1", model="llama", engine_index=str(i)).inc(5)
diff --git a/tests/v1/metrics/test_ray_metrics.py b/tests/v1/metrics/test_ray_metrics.py
index 0c9f83f049e4..c844330bb466 100644
--- a/tests/v1/metrics/test_ray_metrics.py
+++ b/tests/v1/metrics/test_ray_metrics.py
@@ -8,8 +8,7 @@
 from vllm.config import ModelDType
 from vllm.sampling_params import SamplingParams
 from vllm.v1.engine.async_llm import AsyncEngineArgs, AsyncLLM
-from vllm.v1.metrics.ray_wrappers import (RayPrometheusMetric,
-                                          RayPrometheusStatLogger)
+from vllm.v1.metrics.ray_wrappers import RayPrometheusMetric, RayPrometheusStatLogger
 
 
 @pytest.fixture(scope="function", autouse=True)
@@ -17,7 +16,7 @@ def use_v1_only(monkeypatch):
     """
     The change relies on V1 APIs, so set VLLM_USE_V1=1.
     """
-    monkeypatch.setenv('VLLM_USE_V1', '1')
+    monkeypatch.setenv("VLLM_USE_V1", "1")
 
 
 MODELS = [
@@ -34,24 +33,23 @@ def test_engine_log_metrics_ray(
     dtype: ModelDType,
     max_tokens: int,
 ) -> None:
-    """ Simple smoke test, verifying this can be used without exceptions.
+    """Simple smoke test, verifying this can be used without exceptions.
     Need to start a Ray cluster in order to verify outputs."""
 
     @ray.remote(num_gpus=1)
     class EngineTestActor:
-
         async def run(self):
             # Set environment variable inside the Ray actor since environment
             # variables from pytest fixtures don't propagate to Ray actors
-            os.environ['VLLM_USE_V1'] = '1'
+            os.environ["VLLM_USE_V1"] = "1"
 
-            engine_args = AsyncEngineArgs(model=model,
-                                          dtype=dtype,
-                                          disable_log_stats=False,
-                                          enforce_eager=True)
+            engine_args = AsyncEngineArgs(
+                model=model, dtype=dtype, disable_log_stats=False, enforce_eager=True
+            )
 
             engine = AsyncLLM.from_engine_args(
-                engine_args, stat_loggers=[RayPrometheusStatLogger])
+                engine_args, stat_loggers=[RayPrometheusStatLogger]
+            )
 
             for i, prompt in enumerate(example_prompts):
                 results = engine.generate(
@@ -73,32 +71,40 @@ def test_sanitized_opentelemetry_name():
 
     # Only a-z, A-Z, 0-9, _, test valid characters are preserved
     valid_name = "valid_metric_123_abcDEF"
-    assert RayPrometheusMetric._get_sanitized_opentelemetry_name(
-        valid_name) == valid_name
+    assert (
+        RayPrometheusMetric._get_sanitized_opentelemetry_name(valid_name) == valid_name
+    )
 
     # Test dash, dot, are replaced
     name_with_dash_dot = "metric-name.test"
     expected = "metric_name_test"
-    assert RayPrometheusMetric._get_sanitized_opentelemetry_name(
-        name_with_dash_dot) == expected
+    assert (
+        RayPrometheusMetric._get_sanitized_opentelemetry_name(name_with_dash_dot)
+        == expected
+    )
 
     # Test colon is replaced with underscore
     name_with_colon = "metric:name"
     expected = "metric_name"
-    assert RayPrometheusMetric._get_sanitized_opentelemetry_name(
-        name_with_colon) == expected
+    assert (
+        RayPrometheusMetric._get_sanitized_opentelemetry_name(name_with_colon)
+        == expected
+    )
 
     # Test multiple invalid characters are replaced
     name_with_invalid = "metric:name@with#special%chars"
     expected = "metric_name_with_special_chars"
-    assert RayPrometheusMetric._get_sanitized_opentelemetry_name(
-        name_with_invalid) == expected
+    assert (
+        RayPrometheusMetric._get_sanitized_opentelemetry_name(name_with_invalid)
+        == expected
+    )
 
     # Test mixed valid and invalid characters
     complex_name = "vllm:engine_stats/time.latency_ms-99p"
     expected = "vllm_engine_stats_time_latency_ms_99p"
-    assert RayPrometheusMetric._get_sanitized_opentelemetry_name(
-        complex_name) == expected
+    assert (
+        RayPrometheusMetric._get_sanitized_opentelemetry_name(complex_name) == expected
+    )
 
     # Test empty string
     assert RayPrometheusMetric._get_sanitized_opentelemetry_name("") == ""
diff --git a/tests/v1/metrics/test_stats.py b/tests/v1/metrics/test_stats.py
index 3a25c69c5a2f..67a2d1739b6b 100644
--- a/tests/v1/metrics/test_stats.py
+++ b/tests/v1/metrics/test_stats.py
@@ -6,16 +6,18 @@
 def test_iteration_stats_repr():
     iteration_stats = IterationStats()
     iteration_stats.iteration_timestamp = 0
-    expected_repr = ("IterationStats("
-                     "iteration_timestamp=0, "
-                     "num_generation_tokens=0, "
-                     "num_prompt_tokens=0, "
-                     "num_preempted_reqs=0, "
-                     "finished_requests=[], "
-                     "max_num_generation_tokens_iter=[], "
-                     "n_params_iter=[], "
-                     "time_to_first_tokens_iter=[], "
-                     "inter_token_latencies_iter=[], "
-                     "waiting_lora_adapters={}, "
-                     "running_lora_adapters={})")
+    expected_repr = (
+        "IterationStats("
+        "iteration_timestamp=0, "
+        "num_generation_tokens=0, "
+        "num_prompt_tokens=0, "
+        "num_preempted_reqs=0, "
+        "finished_requests=[], "
+        "max_num_generation_tokens_iter=[], "
+        "n_params_iter=[], "
+        "time_to_first_tokens_iter=[], "
+        "inter_token_latencies_iter=[], "
+        "waiting_lora_adapters={}, "
+        "running_lora_adapters={})"
+    )
     assert repr(iteration_stats) == expected_repr
diff --git a/tests/v1/sample/test_logprobs.py b/tests/v1/sample/test_logprobs.py
index 71aa9e3d379c..f83bc90778b0 100644
--- a/tests/v1/sample/test_logprobs.py
+++ b/tests/v1/sample/test_logprobs.py
@@ -9,9 +9,12 @@
 import torch
 
 from tests.v1.sample.utils import (
-    BatchLogprobsComposition, BatchLogprobsSpecType,
+    BatchLogprobsComposition,
+    BatchLogprobsSpecType,
     assert_incr_detok_str_matches_non_incr_detok_str,
-    compute_correct_cumulative_logprob, get_test_batch)
+    compute_correct_cumulative_logprob,
+    get_test_batch,
+)
 from vllm import SamplingParams
 from vllm.config import LogprobsMode
 
@@ -29,22 +32,23 @@
 @pytest.fixture(
     scope="module",
     # Parameterize APC
-    params=[False, True])
+    params=[False, True],
+)
 def vllm_model(vllm_runner, request) -> Generator[VllmRunner, None, None]:
     with vllm_runner(
-            MODEL,
-            dtype=DTYPE,
-            max_logprobs=7,
-            # Very small number of batched tokens to ensure
-            # that we test chunking.
-            max_num_batched_tokens=16,
-            max_num_seqs=16,
-            max_model_len=128,
-            enforce_eager=True,
-            #TODO: enable this once we support it for
-            # prompt logprobs.
-            enable_prefix_caching=request.param,
-            gpu_memory_utilization=0.4,  # up to 2 alive concurrently
+        MODEL,
+        dtype=DTYPE,
+        max_logprobs=7,
+        # Very small number of batched tokens to ensure
+        # that we test chunking.
+        max_num_batched_tokens=16,
+        max_num_seqs=16,
+        max_model_len=128,
+        enforce_eager=True,
+        # TODO: enable this once we support it for
+        # prompt logprobs.
+        enable_prefix_caching=request.param,
+        gpu_memory_utilization=0.4,  # up to 2 alive concurrently
     ) as vllm_model:
         yield vllm_model
 
@@ -96,8 +100,8 @@ def _repeat_logprob_config(
     num_test_prompts = len(test_prompts)
     # Make sure there is a logprobs configuration for each test prompt
     logprob_prompt_logprob_list = list(
-        itertools.islice(itertools.cycle(logprob_prompt_logprob_list),
-                         num_test_prompts))
+        itertools.islice(itertools.cycle(logprob_prompt_logprob_list), num_test_prompts)
+    )
     # Now the number of prompts should match the number of sample params combos
     assert num_test_prompts == len(logprob_prompt_logprob_list)
     return logprob_prompt_logprob_list
@@ -115,24 +119,28 @@ def _run_and_validate(
     do_apc: bool,
 ) -> None:
     vllm_results = vllm_model.llm.generate(
-        test_prompts, sampling_params=vllm_sampling_params)
+        test_prompts, sampling_params=vllm_sampling_params
+    )
 
     for vllm_result, hf_logprob, hf_output, logprob_prompt_logprob in zip(
-            vllm_results, hf_logprobs, hf_outputs,
-            logprob_prompt_logprob_list):
-
+        vllm_results, hf_logprobs, hf_outputs, logprob_prompt_logprob_list
+    ):
         # Extract request-level (prompt)logprobs config
         num_top_logprobs, num_top_prompt_logprobs = logprob_prompt_logprob
 
         # Test whether sampled token output is consistent between vLLM and HF
         # vLLM prompt+completion should match HF output
         if temperature == 0.0:
-            assert (vllm_result.prompt_token_ids +
-                    vllm_result.outputs[0].token_ids == hf_output[0])
+            assert (
+                vllm_result.prompt_token_ids + vllm_result.outputs[0].token_ids
+                == hf_output[0]
+            )
         else:
             # Sampled tokens won't match if not greedy
-            assert (vllm_result.prompt_token_ids == hf_output[0]
-                    [:len(vllm_result.prompt_token_ids)])
+            assert (
+                vllm_result.prompt_token_ids
+                == hf_output[0][: len(vllm_result.prompt_token_ids)]
+            )
 
         # Validate sample logprobs
         if num_top_logprobs is not None:
@@ -141,8 +149,9 @@ def _run_and_validate(
             # correct
             assert vllm_result.outputs[0].logprobs is not None
             assert len(vllm_result.outputs[0].logprobs) == max_tokens
-            for logprobs, token_id in zip(vllm_result.outputs[0].logprobs,
-                                          vllm_result.outputs[0].token_ids):
+            for logprobs, token_id in zip(
+                vllm_result.outputs[0].logprobs, vllm_result.outputs[0].token_ids
+            ):
                 assert logprobs is not None
 
                 # Confirm that the output token appears among the logprobs
@@ -159,23 +168,26 @@ def _run_and_validate(
                 if num_top_logprobs > 0:
                     # We should have an entry for each of the topk ranks
                     all_ranks = {lp.rank for lp in logprobs.values()}
-                    assert all(r in all_ranks
-                               for r in range(1, num_top_logprobs + 1))
+                    assert all(r in all_ranks for r in range(1, num_top_logprobs + 1))
 
             output_text = vllm_result.outputs[0].text
             output_string_from_most_likely_tokens_lst: list[str] = []
             for top_logprobs in vllm_result.outputs[0].logprobs:
                 top_logprob = next(iter(top_logprobs.values()))
                 output_string_from_most_likely_tokens_lst.append(
-                    top_logprob.decoded_token)
+                    top_logprob.decoded_token
+                )
 
             output_string_from_most_likely_tokens = "".join(
-                output_string_from_most_likely_tokens_lst)
+                output_string_from_most_likely_tokens_lst
+            )
             assert_incr_detok_str_matches_non_incr_detok_str(
-                output_text, output_string_from_most_likely_tokens,
+                output_text,
+                output_string_from_most_likely_tokens,
                 "The output text from the top logprob for each token "
                 "position should be the same as the output text in the "
-                "result.")
+                "result.",
+            )
 
             # Compare vLLM sample logprobs to HF
             vllm_sample_logprobs = vllm_result.outputs[0].logprobs
@@ -187,11 +199,12 @@ def _run_and_validate(
                             logprob,
                             hf_logprob[i][-1][token_id].item(),
                             atol=1e-2,
-                            rtol=1e-2)
-                    assert isinstance(
-                        sample_logprob.decoded_token,
-                        str), ("The token should be decoded by the time it is"
-                               " returned to the user.")
+                            rtol=1e-2,
+                        )
+                    assert isinstance(sample_logprob.decoded_token, str), (
+                        "The token should be decoded by the time it is"
+                        " returned to the user."
+                    )
 
             # At this point we know the sample logprobs are correct for this
             # request. Validate that cumulative_logprob is actually the sum.
@@ -201,7 +214,8 @@ def _run_and_validate(
                 vllm_result.outputs[0].cumulative_logprob,
                 compute_correct_cumulative_logprob(vllm_result.outputs[0]),
                 atol=1e-6,
-                rtol=1e-6)
+                rtol=1e-6,
+            )
         else:
             # Logprobs disabled for this request; should be None
             assert vllm_result.outputs[0].logprobs is None
@@ -214,17 +228,17 @@ def _run_and_validate(
             assert vllm_result.prompt_logprobs[0] is None
             # - Prompt logprobs are returned for all indices in
             #   the prompt
-            assert len(vllm_result.prompt_logprobs) == len(
-                vllm_result.prompt_token_ids)
+            assert len(vllm_result.prompt_logprobs) == len(vllm_result.prompt_token_ids)
             for prompt_logprobs, prompt_token_id in zip(
-                    vllm_result.prompt_logprobs[1:],
-                    vllm_result.prompt_token_ids[1:]):
+                vllm_result.prompt_logprobs[1:], vllm_result.prompt_token_ids[1:]
+            ):
                 assert prompt_logprobs is not None
 
                 # Confirm that the prompt token appears among the logprobs
                 assert prompt_token_id in prompt_logprobs
-                token_in_topk = prompt_logprobs[
-                    prompt_token_id].rank <= num_top_prompt_logprobs
+                token_in_topk = (
+                    prompt_logprobs[prompt_token_id].rank <= num_top_prompt_logprobs
+                )
 
                 # If the prompt token is not included in the top K
                 # logprob, it can return 1 more data
@@ -236,8 +250,9 @@ def _run_and_validate(
                 if num_top_prompt_logprobs > 0:
                     # We should have an entry for each of the topk ranks
                     all_ranks = {lp.rank for lp in prompt_logprobs.values()}
-                    assert all(r in all_ranks
-                               for r in range(1, num_top_prompt_logprobs + 1))
+                    assert all(
+                        r in all_ranks for r in range(1, num_top_prompt_logprobs + 1)
+                    )
 
             # Compare prompt logprobs to HF
             # The first prompt logprob is always None, so we compare it from
@@ -249,19 +264,24 @@ def _run_and_validate(
                         logprob.logprob,
                         hf_logprob[0][i][token_id].item(),
                         atol=2e-2,
-                        rtol=2e-2)
+                        rtol=2e-2,
+                    )
         else:
             assert vllm_result.prompt_logprobs is None
 
 
-@pytest.mark.parametrize("batch_logprobs_composition",
-                         [NONE, SAMPLE, PROMPT, SAMPLE_PROMPT])
+@pytest.mark.parametrize(
+    "batch_logprobs_composition", [NONE, SAMPLE, PROMPT, SAMPLE_PROMPT]
+)
 @pytest.mark.parametrize("temperature", [0.0, 2.0])
 def test_get_logprobs_and_prompt_logprobs(
-        hf_model, vllm_model,
-        batch_logprobs_composition: BatchLogprobsComposition,
-        temperature: float, example_prompts: list[str],
-        monkeypatch: pytest.MonkeyPatch) -> None:
+    hf_model,
+    vllm_model,
+    batch_logprobs_composition: BatchLogprobsComposition,
+    temperature: float,
+    example_prompts: list[str],
+    monkeypatch: pytest.MonkeyPatch,
+) -> None:
     """Test V1 Engine logprobs & prompt logprobs
 
     Exercise a variety of combinations of `logprobs` and `prompt_logprobs`
@@ -291,8 +311,9 @@ def test_get_logprobs_and_prompt_logprobs(
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
         do_apc = vllm_model.llm.llm_engine.cache_config.enable_prefix_caching
-        if do_apc and (temperature < 2.0
-                       or batch_logprobs_composition != SAMPLE_PROMPT):
+        if do_apc and (
+            temperature < 2.0 or batch_logprobs_composition != SAMPLE_PROMPT
+        ):
             # Skip some test-cases to save time.
             pytest.skip()
         test_prompts = example_prompts
@@ -309,19 +330,21 @@ def test_get_logprobs_and_prompt_logprobs(
 
         # Batch has mixed sample params
         # (different logprobs/prompt logprobs combos)
-        logprob_prompt_logprob_list = get_test_batch(
-            batch_logprobs_composition)
+        logprob_prompt_logprob_list = get_test_batch(batch_logprobs_composition)
 
         # Ensure that each test prompt has a logprob config for testing
         logprob_prompt_logprob_list = _repeat_logprob_config(
-            test_prompts, logprob_prompt_logprob_list)
+            test_prompts, logprob_prompt_logprob_list
+        )
         # Generate SamplingParams
         vllm_sampling_params = [
-            SamplingParams(max_tokens=max_tokens,
-                           logprobs=num_lp,
-                           prompt_logprobs=num_plp,
-                           temperature=temperature,
-                           seed=1984)
+            SamplingParams(
+                max_tokens=max_tokens,
+                logprobs=num_lp,
+                prompt_logprobs=num_plp,
+                temperature=temperature,
+                seed=1984,
+            )
             for num_lp, num_plp in logprob_prompt_logprob_list
         ]
         for _ in range(2 if do_apc else 1):
@@ -334,7 +357,8 @@ def test_get_logprobs_and_prompt_logprobs(
                 logprob_prompt_logprob_list=logprob_prompt_logprob_list,
                 temperature=temperature,
                 max_tokens=max_tokens,
-                do_apc=do_apc)
+                do_apc=do_apc,
+            )
 
 
 def test_max_logprobs(monkeypatch: pytest.MonkeyPatch):
@@ -351,19 +375,18 @@ def test_max_logprobs(monkeypatch: pytest.MonkeyPatch):
             enable_prefix_caching=False,
             # 2 other llms alive during whole session
             gpu_memory_utilization=0.15,
-            max_model_len=256)
+            max_model_len=256,
+        )
         vllm_sampling_params = SamplingParams(logprobs=1)
         # should pass
         runner.generate(["Hello world"], sampling_params=vllm_sampling_params)
 
         bad_sampling_params = SamplingParams(logprobs=2)
         with pytest.raises(ValueError):
-            runner.generate(["Hello world"],
-                            sampling_params=bad_sampling_params)
+            runner.generate(["Hello world"], sampling_params=bad_sampling_params)
 
 
-def test_none_logprobs(vllm_model, example_prompts,
-                       monkeypatch: pytest.MonkeyPatch):
+def test_none_logprobs(vllm_model, example_prompts, monkeypatch: pytest.MonkeyPatch):
     """Engine should return `logprobs` and `prompt_logprobs` as `None`
 
     Args:
@@ -388,14 +411,12 @@ def test_none_logprobs(vllm_model, example_prompts,
         for i in range(len(results_logprobs_none)):
             # Check sample logprobs are None
             assert results_logprobs_none[i].outputs[0].logprobs is None
-            assert results_logprobs_none[i].outputs[
-                0].cumulative_logprob is None
+            assert results_logprobs_none[i].outputs[0].cumulative_logprob is None
             # Check prompt logprobs are None
             assert results_logprobs_none[i].prompt_logprobs is None
 
 
-def test_zero_logprobs(vllm_model, example_prompts,
-                       monkeypatch: pytest.MonkeyPatch):
+def test_zero_logprobs(vllm_model, example_prompts, monkeypatch: pytest.MonkeyPatch):
     """Engine should return sampled token and prompt token logprobs
 
     Args:
@@ -406,12 +427,12 @@ def test_zero_logprobs(vllm_model, example_prompts,
         m.setenv("VLLM_USE_V1", "1")
         max_tokens = 5
 
-        sampling_params_logprobs_zero = SamplingParams(max_tokens=max_tokens,
-                                                       logprobs=0,
-                                                       prompt_logprobs=0,
-                                                       temperature=0.0)
+        sampling_params_logprobs_zero = SamplingParams(
+            max_tokens=max_tokens, logprobs=0, prompt_logprobs=0, temperature=0.0
+        )
         results_logprobs_zero = vllm_model.llm.generate(
-            example_prompts, sampling_params=sampling_params_logprobs_zero)
+            example_prompts, sampling_params=sampling_params_logprobs_zero
+        )
 
         for i in range(len(results_logprobs_zero)):
             # Check that there is one sample logprob dict for each
@@ -422,8 +443,7 @@ def test_zero_logprobs(vllm_model, example_prompts,
             prompt_token_ids = results_logprobs_zero[i].prompt_token_ids
             assert logprobs is not None
             assert len(sampled_token_ids) == len(logprobs)
-            assert results_logprobs_zero[i].outputs[
-                0].cumulative_logprob is not None
+            assert results_logprobs_zero[i].outputs[0].cumulative_logprob is not None
             # Check that there is one prompt logprob dict for each
             # prompt token
             assert prompt_logprobs is not None
@@ -444,13 +464,15 @@ def test_all_logprobs(example_prompts, monkeypatch: pytest.MonkeyPatch):
             enable_prefix_caching=False,
             # 2 other llms alive during whole session
             gpu_memory_utilization=0.15,
-            max_model_len=256)
+            max_model_len=256,
+        )
 
-        sampling_params_logprobs_all = SamplingParams(max_tokens=5,
-                                                      logprobs=-1,
-                                                      prompt_logprobs=-1)
+        sampling_params_logprobs_all = SamplingParams(
+            max_tokens=5, logprobs=-1, prompt_logprobs=-1
+        )
         results_logprobs_all = runner.llm.generate(
-            example_prompts, sampling_params=sampling_params_logprobs_all)
+            example_prompts, sampling_params=sampling_params_logprobs_all
+        )
         vocab_size = runner.llm.llm_engine.get_model_config().get_vocab_size()
 
         for i in range(len(results_logprobs_all)):
@@ -466,13 +488,13 @@ def test_all_logprobs(example_prompts, monkeypatch: pytest.MonkeyPatch):
 
 
 @pytest.mark.parametrize("logprobs_mode", get_args(LogprobsMode))
-def test_logprobs_mode(logprobs_mode: LogprobsMode,
-                       monkeypatch: pytest.MonkeyPatch):
+def test_logprobs_mode(logprobs_mode: LogprobsMode, monkeypatch: pytest.MonkeyPatch):
     """Test with LLM engine with different logprobs_mode.
     For logprobs, we should have non-positive values.
     For logits, we should expect at least one positive values.
     """
     from vllm import LLM
+
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
 
@@ -483,10 +505,10 @@ def test_logprobs_mode(logprobs_mode: LogprobsMode,
             # 2 other llms alive during whole session
             gpu_memory_utilization=0.05,
             max_model_len=16,
-            logprobs_mode=logprobs_mode)
+            logprobs_mode=logprobs_mode,
+        )
         vllm_sampling_params = SamplingParams(logprobs=1)
-        results = llm.generate(["Hello world"],
-                               sampling_params=vllm_sampling_params)
+        results = llm.generate(["Hello world"], sampling_params=vllm_sampling_params)
 
         total_token_with_logprobs = 0
         positive_values = 0
diff --git a/tests/v1/sample/test_logprobs_e2e.py b/tests/v1/sample/test_logprobs_e2e.py
index 7f41355ff7ce..b3233e50fbf1 100644
--- a/tests/v1/sample/test_logprobs_e2e.py
+++ b/tests/v1/sample/test_logprobs_e2e.py
@@ -15,22 +15,23 @@
 MODEL = "meta-llama/Llama-3.2-1B-Instruct"
 MODEL_ARGS = f"pretrained={MODEL},enforce_eager=True,enable_prefix_caching=False,gpu_memory_utilization=0.8"  # noqa: E501
 SERVER_ARGS = [
-    "--enforce_eager", "--no_enable_prefix_caching",
-    "--gpu-memory-utilization=0.8"
+    "--enforce_eager",
+    "--no_enable_prefix_caching",
+    "--gpu-memory-utilization=0.8",
 ]
 NUM_CONCURRENT = 100
 
 
 def test_prompt_logprobs_e2e():
-    results = lm_eval.simple_evaluate(model="vllm",
-                                      model_args=MODEL_ARGS,
-                                      tasks=TASK,
-                                      batch_size="auto")
+    results = lm_eval.simple_evaluate(
+        model="vllm", model_args=MODEL_ARGS, tasks=TASK, batch_size="auto"
+    )
 
     measured_value = results["results"][TASK][FILTER]
-    assert (measured_value - RTOL < EXPECTED_VALUE
-            and measured_value + RTOL > EXPECTED_VALUE
-            ), f"Expected: {EXPECTED_VALUE} |  Measured: {measured_value}"
+    assert (
+        measured_value - RTOL < EXPECTED_VALUE
+        and measured_value + RTOL > EXPECTED_VALUE
+    ), f"Expected: {EXPECTED_VALUE} |  Measured: {measured_value}"
 
 
 def test_prompt_logprobs_e2e_server():
@@ -40,7 +41,8 @@ def test_prompt_logprobs_e2e_server():
         model_args = (
             f"model={MODEL},"
             f"base_url={url},"
-            f"num_concurrent={NUM_CONCURRENT},tokenized_requests=False")
+            f"num_concurrent={NUM_CONCURRENT},tokenized_requests=False"
+        )
 
         results = lm_eval.simple_evaluate(
             model="local-completions",
@@ -49,6 +51,7 @@ def test_prompt_logprobs_e2e_server():
         )
 
         measured_value = results["results"][TASK][FILTER]
-        assert (measured_value - RTOL < EXPECTED_VALUE
-                and measured_value + RTOL > EXPECTED_VALUE
-                ), f"Expected: {EXPECTED_VALUE} |  Measured: {measured_value}"
+        assert (
+            measured_value - RTOL < EXPECTED_VALUE
+            and measured_value + RTOL > EXPECTED_VALUE
+        ), f"Expected: {EXPECTED_VALUE} |  Measured: {measured_value}"
diff --git a/tests/v1/sample/test_rejection_sampler.py b/tests/v1/sample/test_rejection_sampler.py
index 4e912f98f376..36e2e2698810 100644
--- a/tests/v1/sample/test_rejection_sampler.py
+++ b/tests/v1/sample/test_rejection_sampler.py
@@ -9,8 +9,7 @@
 from vllm.platforms import current_platform
 from vllm.v1.sample.logits_processor import LogitsProcessors
 from vllm.v1.sample.metadata import SamplingMetadata
-from vllm.v1.sample.rejection_sampler import (PLACEHOLDER_TOKEN_ID,
-                                              RejectionSampler)
+from vllm.v1.sample.rejection_sampler import PLACEHOLDER_TOKEN_ID, RejectionSampler
 from vllm.v1.spec_decode.metadata import SpecDecodeMetadata
 
 DEVICE = current_platform.device_type
@@ -21,10 +20,11 @@ def rejection_sampler():
     return RejectionSampler()
 
 
-def create_logits_tensor(output_token_ids: list[list[int]],
-                         vocab_size: int = 100) -> torch.Tensor:
+def create_logits_tensor(
+    output_token_ids: list[list[int]], vocab_size: int = 100
+) -> torch.Tensor:
     """Helper function to create logits tensor that
-       will produce desired token ids on argmax"""
+    will produce desired token ids on argmax"""
     token_ids = [tokens[:-1] for tokens in output_token_ids]
     num_total_tokens = sum(len(tokens) for tokens in token_ids)
     logits = torch.full((num_total_tokens, vocab_size), -100.0, device=DEVICE)
@@ -44,8 +44,8 @@ def create_sampling_metadata(
     generators: Optional[dict[int, Any]] = None,
 ) -> SamplingMetadata:
     """Create a v1 sampling metadata object with all_greedy set
-        to the given value. Either all greedy or all random sampling
-        is used.
+    to the given value. Either all greedy or all random sampling
+    is used.
     """
     generators = generators or {}
     if all_greedy:
@@ -81,10 +81,10 @@ def test_perfect_match(rejection_sampler):
 
     metadata = create_sampling_metadata(all_greedy=True)
     logits = create_logits_tensor(output_tokens)
-    bonus_token_tensor = torch.tensor([output_tokens[0][-1]],
-                                      device=logits.device)
-    spec_decode_metadata = SpecDecodeMetadata.make_dummy(spec_tokens,
-                                                         device=logits.device)
+    bonus_token_tensor = torch.tensor([output_tokens[0][-1]], device=logits.device)
+    spec_decode_metadata = SpecDecodeMetadata.make_dummy(
+        spec_tokens, device=logits.device
+    )
 
     output = rejection_sampler(
         spec_decode_metadata,
@@ -93,9 +93,7 @@ def test_perfect_match(rejection_sampler):
         bonus_token_ids=bonus_token_tensor,
         sampling_metadata=metadata,
     )
-    expected = torch.tensor([[1, 2, 3, 4]],
-                            dtype=torch.int,
-                            device=logits.device)
+    expected = torch.tensor([[1, 2, 3, 4]], dtype=torch.int, device=logits.device)
     assert torch.equal(output, expected)
 
 
@@ -106,10 +104,10 @@ def test_early_mismatch(rejection_sampler):
 
     metadata = create_sampling_metadata(all_greedy=True)
     logits = create_logits_tensor(output_tokens)
-    bonus_token_tensor = torch.tensor([output_tokens[0][-1]],
-                                      device=logits.device)
-    spec_decode_metadata = SpecDecodeMetadata.make_dummy(spec_tokens,
-                                                         device=logits.device)
+    bonus_token_tensor = torch.tensor([output_tokens[0][-1]], device=logits.device)
+    spec_decode_metadata = SpecDecodeMetadata.make_dummy(
+        spec_tokens, device=logits.device
+    )
 
     output = rejection_sampler(
         spec_decode_metadata,
@@ -129,15 +127,16 @@ def test_early_mismatch(rejection_sampler):
 def test_multiple_sequences(rejection_sampler):
     """Test handling multiple sequences of speculated tokens"""
     spec_tokens = [[1, 2], [3]]
-    output_tokens = [[1, 2, 5], [3,
-                                 4]]  # Two sequences with bonus tokens 5 and 4
+    output_tokens = [[1, 2, 5], [3, 4]]  # Two sequences with bonus tokens 5 and 4
 
     metadata = create_sampling_metadata(all_greedy=True)
     logits = create_logits_tensor(output_tokens)
     bonus_token_tensor = torch.tensor(
-        [output_tokens[0][-1], output_tokens[1][-1]], device=logits.device)
-    spec_decode_metadata = SpecDecodeMetadata.make_dummy(spec_tokens,
-                                                         device=logits.device)
+        [output_tokens[0][-1], output_tokens[1][-1]], device=logits.device
+    )
+    spec_decode_metadata = SpecDecodeMetadata.make_dummy(
+        spec_tokens, device=logits.device
+    )
 
     output = rejection_sampler(
         spec_decode_metadata,
@@ -146,9 +145,9 @@ def test_multiple_sequences(rejection_sampler):
         bonus_token_ids=bonus_token_tensor,
         sampling_metadata=metadata,
     )
-    expected = torch.tensor([[1, 2, 5], [3, 4, PLACEHOLDER_TOKEN_ID]],
-                            dtype=torch.int,
-                            device=logits.device)
+    expected = torch.tensor(
+        [[1, 2, 5], [3, 4, PLACEHOLDER_TOKEN_ID]], dtype=torch.int, device=logits.device
+    )
     assert torch.equal(output, expected)
 
 
@@ -159,10 +158,10 @@ def test_single_token_sequence(rejection_sampler):
 
     metadata = create_sampling_metadata(all_greedy=True)
     logits = create_logits_tensor(output_tokens)
-    bonus_token_tensor = torch.tensor([output_tokens[0][-1]],
-                                      device=logits.device)
-    spec_decode_metadata = SpecDecodeMetadata.make_dummy(spec_tokens,
-                                                         device=logits.device)
+    bonus_token_tensor = torch.tensor([output_tokens[0][-1]], device=logits.device)
+    spec_decode_metadata = SpecDecodeMetadata.make_dummy(
+        spec_tokens, device=logits.device
+    )
 
     output = rejection_sampler(
         spec_decode_metadata,
@@ -182,10 +181,10 @@ def test_empty_sequence(rejection_sampler):
 
     metadata = create_sampling_metadata(all_greedy=True)
     logits = create_logits_tensor(output_tokens)
-    bonus_token_tensor = torch.tensor([output_tokens[0][-1]],
-                                      device=logits.device)
-    spec_decode_metadata = SpecDecodeMetadata.make_dummy(spec_tokens,
-                                                         device=logits.device)
+    bonus_token_tensor = torch.tensor([output_tokens[0][-1]], device=logits.device)
+    spec_decode_metadata = SpecDecodeMetadata.make_dummy(
+        spec_tokens, device=logits.device
+    )
 
     output = rejection_sampler(
         spec_decode_metadata,
@@ -201,15 +200,16 @@ def test_empty_sequence(rejection_sampler):
 def test_multiple_mismatches(rejection_sampler):
     """Test handling multiple sequences with mismatches"""
     spec_tokens = [[1, 2, 3], [4, 5, 6]]
-    output_tokens = [[1, 2, 7, 6], [4, 8, 6,
-                                    9]]  # Mismatches in both sequences
+    output_tokens = [[1, 2, 7, 6], [4, 8, 6, 9]]  # Mismatches in both sequences
 
     metadata = create_sampling_metadata(all_greedy=True)
     logits = create_logits_tensor(output_tokens)
     bonus_token_tensor = torch.tensor(
-        [output_tokens[0][-1], output_tokens[1][-1]], device=logits.device)
-    spec_decode_metadata = SpecDecodeMetadata.make_dummy(spec_tokens,
-                                                         device=logits.device)
+        [output_tokens[0][-1], output_tokens[1][-1]], device=logits.device
+    )
+    spec_decode_metadata = SpecDecodeMetadata.make_dummy(
+        spec_tokens, device=logits.device
+    )
 
     output = rejection_sampler(
         spec_decode_metadata,
@@ -219,8 +219,10 @@ def test_multiple_mismatches(rejection_sampler):
         sampling_metadata=metadata,
     )
     expected = torch.tensor(
-        [[1, 2, 7, PLACEHOLDER_TOKEN_ID],
-         [4, 8, PLACEHOLDER_TOKEN_ID, PLACEHOLDER_TOKEN_ID]],
+        [
+            [1, 2, 7, PLACEHOLDER_TOKEN_ID],
+            [4, 8, PLACEHOLDER_TOKEN_ID, PLACEHOLDER_TOKEN_ID],
+        ],
         dtype=torch.int,
         device=logits.device,
     )
@@ -232,18 +234,23 @@ def test_multiple_mismatches(rejection_sampler):
     [
         ([[1, 2]], [[1, 2, 3]], [[1, 2, 3]]),  # Perfect match with bonus
         ([[1]], [[2, 3]], [[2, PLACEHOLDER_TOKEN_ID]]),  # First mismatch
-        ([[1, 2], [3, 4]], [[1, 5, 6], [3, 4, 7]],
-         [[1, 5, PLACEHOLDER_TOKEN_ID], [3, 4, 7]]),  # Mixed matches
-    ])
-def test_parametrized_cases(rejection_sampler, spec_tokens, output_tokens,
-                            expected):
+        (
+            [[1, 2], [3, 4]],
+            [[1, 5, 6], [3, 4, 7]],
+            [[1, 5, PLACEHOLDER_TOKEN_ID], [3, 4, 7]],
+        ),  # Mixed matches
+    ],
+)
+def test_parametrized_cases(rejection_sampler, spec_tokens, output_tokens, expected):
     """Parametrized test for various matching scenarios"""
     metadata = create_sampling_metadata(all_greedy=True)
     logits = create_logits_tensor(output_tokens)
-    bonus_token_tensor = torch.tensor([tokens[-1] for tokens in output_tokens],
-                                      device=logits.device)
-    spec_decode_metadata = SpecDecodeMetadata.make_dummy(spec_tokens,
-                                                         device=logits.device)
+    bonus_token_tensor = torch.tensor(
+        [tokens[-1] for tokens in output_tokens], device=logits.device
+    )
+    spec_decode_metadata = SpecDecodeMetadata.make_dummy(
+        spec_tokens, device=logits.device
+    )
 
     output = rejection_sampler(
         spec_decode_metadata,
@@ -252,9 +259,7 @@ def test_parametrized_cases(rejection_sampler, spec_tokens, output_tokens,
         bonus_token_ids=bonus_token_tensor,
         sampling_metadata=metadata,
     )
-    expected_tensor = torch.tensor(expected,
-                                   dtype=torch.int,
-                                   device=logits.device)
+    expected_tensor = torch.tensor(expected, dtype=torch.int, device=logits.device)
     assert torch.equal(output, expected_tensor)
 
 
@@ -273,22 +278,15 @@ def test_deterministic_when_seeded(
     n_rep: int,
 ):
     num_tokens = batch_size * k
-    draft_probs = torch.rand(num_tokens,
-                             vocab_size,
-                             dtype=torch.float32,
-                             device=DEVICE)
+    draft_probs = torch.rand(num_tokens, vocab_size, dtype=torch.float32, device=DEVICE)
     draft_probs = F.softmax(draft_probs, dim=-1)
     target_logits = torch.rand_like(draft_probs)
-    bonus_token_ids = torch.randint(low=0,
-                                    high=vocab_size,
-                                    size=(batch_size, 1),
-                                    dtype=torch.int64,
-                                    device=DEVICE)
-    draft_token_ids = torch.randint(low=0,
-                                    high=vocab_size,
-                                    size=(batch_size, k),
-                                    dtype=torch.int64,
-                                    device=DEVICE)
+    bonus_token_ids = torch.randint(
+        low=0, high=vocab_size, size=(batch_size, 1), dtype=torch.int64, device=DEVICE
+    )
+    draft_token_ids = torch.randint(
+        low=0, high=vocab_size, size=(batch_size, k), dtype=torch.int64, device=DEVICE
+    )
 
     seeded_mask = torch.rand(batch_size, dtype=torch.float32) <= frac_seeded
 
@@ -296,17 +294,17 @@ def test_deterministic_when_seeded(
     for _ in range(n_rep):
         seeded_seqs = {
             i: torch.Generator(device=DEVICE).manual_seed(i)
-            for i in range(batch_size) if seeded_mask[i]
+            for i in range(batch_size)
+            if seeded_mask[i]
         }
 
-        temperature = torch.ones(batch_size,
-                                 dtype=torch.float32,
-                                 device=DEVICE)
-        sampling_metadata = create_sampling_metadata(all_greedy=False,
-                                                     temperature=temperature,
-                                                     generators=seeded_seqs)
+        temperature = torch.ones(batch_size, dtype=torch.float32, device=DEVICE)
+        sampling_metadata = create_sampling_metadata(
+            all_greedy=False, temperature=temperature, generators=seeded_seqs
+        )
         spec_decode_metadata = SpecDecodeMetadata.make_dummy(
-            draft_token_ids.tolist(), device=DEVICE)
+            draft_token_ids.tolist(), device=DEVICE
+        )
         rep_result = rejection_sampler(
             spec_decode_metadata,
             draft_probs=draft_probs,
@@ -352,8 +350,7 @@ def test_rejection_sampling_approximates_target_distribution():
     num_reference_probs = 100
 
     # Prepare draft, target, and reference probability distributions
-    draft_probs = F.softmax(torch.rand(vocab_size, dtype=torch.float32),
-                            dim=-1)
+    draft_probs = F.softmax(torch.rand(vocab_size, dtype=torch.float32), dim=-1)
     target_logits = torch.rand(vocab_size, dtype=torch.float32)
     target_probs = F.softmax(target_logits, dim=-1)
     reference_probs = F.softmax(
@@ -368,38 +365,48 @@ def test_rejection_sampling_approximates_target_distribution():
     for num_samples in sample_sizes:
         # Sample using rejection sampling.
         rej_sample_probs = estimate_rejection_sampling_pdf(
-            draft_probs, target_logits, k, vocab_size, num_samples)
+            draft_probs, target_logits, k, vocab_size, num_samples
+        )
         rej_sample_probs = rej_sample_probs.to(DEVICE)
 
         # Average distance from reference probs.
-        reference_vs_rejsample_dist = torch.dist(
-            reference_probs,
-            rej_sample_probs).item() / reference_probs.shape[0]
-        target_vs_rejsample_dist = torch.dist(target_probs,
-                                              rej_sample_probs).item()
+        reference_vs_rejsample_dist = (
+            torch.dist(reference_probs, rej_sample_probs).item()
+            / reference_probs.shape[0]
+        )
+        target_vs_rejsample_dist = torch.dist(target_probs, rej_sample_probs).item()
 
         distance_wrt_reference.append(reference_vs_rejsample_dist)
         distance_wrt_target.append(target_vs_rejsample_dist)
 
         relative_change_in_distance_wrt_target = get_ratio_first_to_last(
-            distance_wrt_target)
+            distance_wrt_target
+        )
         relative_change_in_distance_wrt_reference = get_ratio_first_to_last(
-            distance_wrt_reference)
+            distance_wrt_reference
+        )
 
-        print(f"{num_samples=} {target_vs_rejsample_dist=:.05f} "
-              f"{reference_vs_rejsample_dist=:.05f}")
-        print(f"{num_samples=} {relative_change_in_distance_wrt_target=:.02f} "
-              f"{relative_change_in_distance_wrt_reference=:.02f}")
+        print(
+            f"{num_samples=} {target_vs_rejsample_dist=:.05f} "
+            f"{reference_vs_rejsample_dist=:.05f}"
+        )
+        print(
+            f"{num_samples=} {relative_change_in_distance_wrt_target=:.02f} "
+            f"{relative_change_in_distance_wrt_reference=:.02f}"
+        )
 
     relative_change_in_distance_wrt_target = get_ratio_first_to_last(
-        distance_wrt_target)
+        distance_wrt_target
+    )
     relative_change_in_distance_wrt_reference = get_ratio_first_to_last(
-        distance_wrt_reference)
+        distance_wrt_reference
+    )
 
     expected_improvement_multiplier = 20
-    assert (relative_change_in_distance_wrt_target
-            > relative_change_in_distance_wrt_reference *
-            expected_improvement_multiplier)
+    assert (
+        relative_change_in_distance_wrt_target
+        > relative_change_in_distance_wrt_reference * expected_improvement_multiplier
+    )
 
 
 def get_ratio_first_to_last(elements: list[float]) -> float:
@@ -427,28 +434,29 @@ def estimate_rejection_sampling_pdf(
     rejection_sampler = RejectionSampler()
     num_tokens = num_samples * k
     # Repeat draft probs num_samples * k times.
-    draft_probs = draft_probs.reshape(1, 1,
-                                      vocab_size).repeat(num_samples, k, 1)
+    draft_probs = draft_probs.reshape(1, 1, vocab_size).repeat(num_samples, k, 1)
 
     # Repeat target probs num_tokens times.
     target_logits = target_logits.reshape(1, vocab_size).repeat(num_tokens, 1)
 
     # Randomly sample draft token ids from draft probs.
-    draft_token_ids = torch.multinomial(draft_probs[:, 0, :],
-                                        num_samples=k,
-                                        replacement=True).reshape(
-                                            num_samples, k)
+    draft_token_ids = torch.multinomial(
+        draft_probs[:, 0, :], num_samples=k, replacement=True
+    ).reshape(num_samples, k)
     draft_probs = draft_probs.view(num_tokens, vocab_size)
 
     # Bonus tokens not used but required.
-    bonus_token_ids = torch.zeros((1, 1), dtype=torch.int64,
-                                  device=DEVICE).repeat(num_samples, 1)
+    bonus_token_ids = torch.zeros((1, 1), dtype=torch.int64, device=DEVICE).repeat(
+        num_samples, 1
+    )
 
     temperature = torch.ones(num_samples, dtype=torch.float32, device=DEVICE)
-    sampling_metadata = create_sampling_metadata(all_greedy=False,
-                                                 temperature=temperature)
+    sampling_metadata = create_sampling_metadata(
+        all_greedy=False, temperature=temperature
+    )
     spec_decode_metadata = SpecDecodeMetadata.make_dummy(
-        draft_token_ids.tolist(), device=bonus_token_ids.device)
+        draft_token_ids.tolist(), device=bonus_token_ids.device
+    )
     output_token_ids = rejection_sampler(
         spec_decode_metadata,
         draft_probs=draft_probs,
@@ -458,11 +466,12 @@ def estimate_rejection_sampling_pdf(
     )
     output_token_ids = output_token_ids[:, :-1].flatten()
 
-    hist = torch.histogram(output_token_ids.to(dtype=torch.float,
-                                               device="cpu"),
-                           bins=vocab_size,
-                           range=(0, vocab_size),
-                           density=True)
+    hist = torch.histogram(
+        output_token_ids.to(dtype=torch.float, device="cpu"),
+        bins=vocab_size,
+        range=(0, vocab_size),
+        density=True,
+    )
 
     return hist.hist
 
@@ -480,9 +489,9 @@ def _test_masked_logits(
     num_tokens = batch_size * num_draft_tokens
 
     # Create random draft probabilities.
-    draft_probs = torch.rand((num_tokens, vocab_size),
-                             dtype=torch.float32,
-                             device=DEVICE)
+    draft_probs = torch.rand(
+        (num_tokens, vocab_size), dtype=torch.float32, device=DEVICE
+    )
     draft_probs = F.softmax(draft_probs, dim=-1)
 
     # Randomly sample draft token ids from draft probs
@@ -491,9 +500,7 @@ def _test_masked_logits(
     draft_token_ids = draft_token_ids.tolist()
 
     # Bonus tokens not used but required
-    bonus_token_ids = torch.zeros((batch_size, 1),
-                                  dtype=torch.int64,
-                                  device=DEVICE)
+    bonus_token_ids = torch.zeros((batch_size, 1), dtype=torch.int64, device=DEVICE)
 
     # Create spec decode metadata
     spec_decode_metadata = SpecDecodeMetadata.make_dummy(
@@ -531,8 +538,7 @@ def test_top_k(rejection_sampler, top_k):
 
     # Randomly create top-k indices.
     top_k_indices = [
-        torch.randperm(vocab_size, device=DEVICE)[:top_k]
-        for _ in range(num_tokens)
+        torch.randperm(vocab_size, device=DEVICE)[:top_k] for _ in range(num_tokens)
     ]
     top_k_indices = torch.stack(top_k_indices)
 
@@ -550,9 +556,7 @@ def test_top_k(rejection_sampler, top_k):
     sampling_metadata = create_sampling_metadata(
         all_greedy=False,
         temperature=temperature,
-        top_k=torch.tensor([top_k] * batch_size,
-                           device=DEVICE,
-                           dtype=torch.int64),
+        top_k=torch.tensor([top_k] * batch_size, device=DEVICE, dtype=torch.int64),
     )
 
     _test_masked_logits(
@@ -595,9 +599,7 @@ def test_top_p(rejection_sampler, top_p):
     sampling_metadata = create_sampling_metadata(
         all_greedy=False,
         temperature=temperature,
-        top_p=torch.tensor([top_p] * batch_size,
-                           device=DEVICE,
-                           dtype=torch.float32),
+        top_p=torch.tensor([top_p] * batch_size, device=DEVICE, dtype=torch.float32),
     )
 
     _test_masked_logits(
diff --git a/tests/v1/sample/test_sampler.py b/tests/v1/sample/test_sampler.py
index 6ff000043265..5b34e27e79ac 100644
--- a/tests/v1/sample/test_sampler.py
+++ b/tests/v1/sample/test_sampler.py
@@ -29,12 +29,12 @@ def _create_fake_logits(batch_size: int, vocab_size: int) -> torch.Tensor:
     return fake_logits
 
 
-def _create_penalty_tensor(batch_size: int, penalty_value: float,
-                           device: torch.device) -> torch.Tensor:
-    return torch.full((batch_size, ),
-                      fill_value=penalty_value,
-                      dtype=torch.float,
-                      device=device)
+def _create_penalty_tensor(
+    batch_size: int, penalty_value: float, device: torch.device
+) -> torch.Tensor:
+    return torch.full(
+        (batch_size,), fill_value=penalty_value, dtype=torch.float, device=device
+    )
 
 
 def _create_prompt_tokens_tensor(
@@ -62,9 +62,9 @@ def _create_allowed_token_ids(
         if i % 2 == 1:
             continue
         if mask is None:
-            mask = torch.zeros((batch_size, vocab_size),
-                               dtype=torch.bool,
-                               device=device)
+            mask = torch.zeros(
+                (batch_size, vocab_size), dtype=torch.bool, device=device
+            )
         start = min(i, vocab_size - 1)
         end = min(i + num_allowed_token_ids, vocab_size - 1)
         mask[i, start:end] = True
@@ -80,9 +80,9 @@ def _create_bad_words_token_ids(
     for batch_idx in range(batch_size):
         token_ids_single_batch = []
         for bad_words_length in bad_words_lengths:
-            token_ids = np.random.choice(vocab_size,
-                                         size=bad_words_length,
-                                         replace=True).tolist()
+            token_ids = np.random.choice(
+                vocab_size, size=bad_words_length, replace=True
+            ).tolist()
             token_ids_single_batch.append(token_ids)
         bad_words_token_ids[batch_idx] = token_ids_single_batch
     if batch_size >= 2:
@@ -95,26 +95,27 @@ def _create_bad_words_token_ids(
 # Returns all last tokens of bad word sequences that share the same prefix
 # as `given_prefix` (excluding the last token).
 def _collect_suffixes_with_same_prefix(
-        given_prefix: list[int],
-        bad_words_token_ids: list[list[int]]) -> list[int]:
+    given_prefix: list[int], bad_words_token_ids: list[list[int]]
+) -> list[int]:
     return [bwt[-1] for bwt in bad_words_token_ids if bwt[:-1] == given_prefix]
 
 
 # generate a valid token id that is not in bad_words_token_ids
-def _generate_valid_token_id(bad_words_token_ids: list[list[int]],
-                             vocab_size: int) -> int:
+def _generate_valid_token_id(
+    bad_words_token_ids: list[list[int]], vocab_size: int
+) -> int:
     forbidden_start_tokens = set()
     for bad_word in bad_words_token_ids:
         forbidden_start_tokens.add(bad_word[0])
     # Get a safe token that's not in forbidden starts
-    safe_token_candidates = list(
-        set(range(vocab_size)) - forbidden_start_tokens)
+    safe_token_candidates = list(set(range(vocab_size)) - forbidden_start_tokens)
     # Pick a random safe token
     return np.random.choice(safe_token_candidates)
 
 
 def _update_output_token_ids_for_bad_words(
-        metadata: SamplingMetadata, vocab_size: int) -> dict[int, list[int]]:
+    metadata: SamplingMetadata, vocab_size: int
+) -> dict[int, list[int]]:
     bad_words_last_tokens = {}
     for batch_idx, bad_words_token_ids in metadata.bad_words_token_ids.items():
         output_token_ids = metadata.output_token_ids[batch_idx]
@@ -132,12 +133,13 @@ def _update_output_token_ids_for_bad_words(
                     # Collect all last tokens from other bad words
                     # that share this prefix
                     bad_words_last_token.extend(
-                        _collect_suffixes_with_same_prefix(
-                            prefix, bad_words_token_ids))
+                        _collect_suffixes_with_same_prefix(prefix, bad_words_token_ids)
+                    )
                     break  # Maximum one update to output_token_ids
                 else:  # Make sure no accidental match to bad words
                     output_token_ids[-1] = _generate_valid_token_id(
-                        bad_words_token_ids, vocab_size)
+                        bad_words_token_ids, vocab_size
+                    )
         bad_words_last_tokens[batch_idx] = bad_words_last_token
     return bad_words_last_tokens
 
@@ -152,22 +154,24 @@ def _create_default_sampling_metadata(
     prompt_token_ids: list[list[int]] = []
     for _ in range(batch_size):
         output_token_ids.append(
-            np.random.randint(0, vocab_size, size=num_output_tokens).tolist())
+            np.random.randint(0, vocab_size, size=num_output_tokens).tolist()
+        )
         prompt_token_ids.append(
-            np.random.randint(0,
-                              vocab_size,
-                              size=np.random.randint(
-                                  1, MAX_NUM_PROMPT_TOKENS)).tolist())
+            np.random.randint(
+                0, vocab_size, size=np.random.randint(1, MAX_NUM_PROMPT_TOKENS)
+            ).tolist()
+        )
     fake_sampling_metadata = SamplingMetadata(
-        temperature=torch.full((batch_size, ), 0.0),
+        temperature=torch.full((batch_size,), 0.0),
         all_greedy=True,
         all_random=False,
         top_p=None,
         top_k=None,
         generators={},
         max_num_logprobs=0,
-        prompt_token_ids=_create_prompt_tokens_tensor(prompt_token_ids,
-                                                      vocab_size, device),
+        prompt_token_ids=_create_prompt_tokens_tensor(
+            prompt_token_ids, vocab_size, device
+        ),
         output_token_ids=output_token_ids,
         frequency_penalties=_create_penalty_tensor(batch_size, 0.0, device),
         presence_penalties=_create_penalty_tensor(batch_size, 0.0, device),
@@ -181,8 +185,8 @@ def _create_default_sampling_metadata(
 
 
 def _create_weighted_output_token_list(
-        batch_size: int,
-        vocab_size: int) -> tuple[list[list[int]], list[list[int]]]:
+    batch_size: int, vocab_size: int
+) -> tuple[list[list[int]], list[list[int]]]:
     """
     Creates an output token list where each token occurs a distinct
     number of times.
@@ -203,14 +207,13 @@ def _create_weighted_output_token_list(
     output_token_ids: list[list[int]] = []
     sorted_token_ids_in_output: list[list[int]] = []
     for _ in range(batch_size):
-        distinct_token_ids = np.random.choice(vocab_size,
-                                              size=np.random.randint(1, 10),
-                                              replace=False).tolist()
+        distinct_token_ids = np.random.choice(
+            vocab_size, size=np.random.randint(1, 10), replace=False
+        ).tolist()
         sorted_token_ids_in_output.append(distinct_token_ids)
         output_token_ids_for_batch = []
         for index, token_id in enumerate(distinct_token_ids):
-            output_token_ids_for_batch.extend(
-                [token_id for _ in range(index + 1)])
+            output_token_ids_for_batch.extend([token_id for _ in range(index + 1)])
         output_token_ids.append(output_token_ids_for_batch)
     return output_token_ids, sorted_token_ids_in_output
 
@@ -218,8 +221,9 @@ def _create_weighted_output_token_list(
 @pytest.mark.parametrize("device", CUDA_DEVICES)
 @pytest.mark.parametrize("batch_size", [1, 2, 32])
 @pytest.mark.parametrize("presence_penalty", [-2.0, 2.0])
-def test_sampler_presence_penalty(device: str, batch_size: int,
-                                  presence_penalty: float):
+def test_sampler_presence_penalty(
+    device: str, batch_size: int, presence_penalty: float
+):
     """
     Test to verify that if presence penalty is enabled then tokens
     are penalized as per their presence in the existing output.
@@ -229,10 +233,12 @@ def test_sampler_presence_penalty(device: str, batch_size: int,
     # logit value.
     fake_logits = _create_fake_logits(batch_size, VOCAB_SIZE)
     sampling_metadata = _create_default_sampling_metadata(
-        NUM_OUTPUT_TOKENS, batch_size, VOCAB_SIZE, torch.device(device))
+        NUM_OUTPUT_TOKENS, batch_size, VOCAB_SIZE, torch.device(device)
+    )
     output_token_ids = sampling_metadata.output_token_ids
     sampling_metadata.presence_penalties = _create_penalty_tensor(
-        batch_size, presence_penalty, torch.device(device))
+        batch_size, presence_penalty, torch.device(device)
+    )
     sampling_metadata.no_penalties = False
     sampler = Sampler()
     logits = sampler.apply_penalties(fake_logits, sampling_metadata)
@@ -263,8 +269,9 @@ def test_sampler_presence_penalty(device: str, batch_size: int,
 @pytest.mark.parametrize("device", CUDA_DEVICES)
 @pytest.mark.parametrize("batch_size", [1, 2, 32])
 @pytest.mark.parametrize("frequency_penalty", [-2.0, 2.0])
-def test_sampler_frequency_penalty(device: str, batch_size: int,
-                                   frequency_penalty: float):
+def test_sampler_frequency_penalty(
+    device: str, batch_size: int, frequency_penalty: float
+):
     """
     Test to verify that if frequency penalty is enabled then tokens are
     penalized as per their frequency of occurrence.
@@ -274,14 +281,15 @@ def test_sampler_frequency_penalty(device: str, batch_size: int,
     # logit value.
     fake_logits = _create_fake_logits(batch_size, VOCAB_SIZE)
     sampling_metadata = _create_default_sampling_metadata(
-        NUM_OUTPUT_TOKENS, batch_size, VOCAB_SIZE, torch.device(device))
+        NUM_OUTPUT_TOKENS, batch_size, VOCAB_SIZE, torch.device(device)
+    )
     sampling_metadata.frequency_penalties = _create_penalty_tensor(
-        batch_size, frequency_penalty, torch.device(device))
-    output_token_ids, sorted_token_ids_in_output = \
-        _create_weighted_output_token_list(
-            batch_size,
-            VOCAB_SIZE,
-        )
+        batch_size, frequency_penalty, torch.device(device)
+    )
+    output_token_ids, sorted_token_ids_in_output = _create_weighted_output_token_list(
+        batch_size,
+        VOCAB_SIZE,
+    )
     sampling_metadata.output_token_ids = output_token_ids
     sampling_metadata.no_penalties = False
     sampler = Sampler()
@@ -290,18 +298,17 @@ def test_sampler_frequency_penalty(device: str, batch_size: int,
     for batch_idx in range(batch_size):
         non_penalized_token_id = logits[batch_idx].argmax().item()
         penalized_token_id = logits[batch_idx].argmin().item()
-        distinct_sorted_token_ids_in_output = sorted_token_ids_in_output[
-            batch_idx]
+        distinct_sorted_token_ids_in_output = sorted_token_ids_in_output[batch_idx]
         most_frequent_token_id = distinct_sorted_token_ids_in_output[
-            len(distinct_sorted_token_ids_in_output) - 1]
+            len(distinct_sorted_token_ids_in_output) - 1
+        ]
         if frequency_penalty > 0:
             # If `frequency_penalty` is set to > 0, it indicates
             # a preference for new tokens over existing ones. Verify that the
             # non-penalized token ID is not present in the output, while the
             # most penalized token is the one that occurs most frequently in
             # the output.
-            assert (non_penalized_token_id
-                    not in distinct_sorted_token_ids_in_output)
+            assert non_penalized_token_id not in distinct_sorted_token_ids_in_output
             assert penalized_token_id == most_frequent_token_id
         elif frequency_penalty < 0:
             # If `frequency_penalty` is set to < 0, it indicates
@@ -316,8 +323,9 @@ def test_sampler_frequency_penalty(device: str, batch_size: int,
 @pytest.mark.parametrize("device", CUDA_DEVICES)
 @pytest.mark.parametrize("batch_size", [1, 2, 32])
 @pytest.mark.parametrize("repetition_penalty", [0.1, 1.9])
-def test_sampler_repetition_penalty(device: str, batch_size: int,
-                                    repetition_penalty: float):
+def test_sampler_repetition_penalty(
+    device: str, batch_size: int, repetition_penalty: float
+):
     """
     Test to verify that when the repetition penalty is enabled, tokens
     are penalized based on their presence in the prompt or the existing
@@ -328,9 +336,11 @@ def test_sampler_repetition_penalty(device: str, batch_size: int,
     # logit value.
     fake_logits = _create_fake_logits(batch_size, VOCAB_SIZE)
     sampling_metadata = _create_default_sampling_metadata(
-        NUM_OUTPUT_TOKENS, batch_size, VOCAB_SIZE, torch.device(device))
+        NUM_OUTPUT_TOKENS, batch_size, VOCAB_SIZE, torch.device(device)
+    )
     sampling_metadata.repetition_penalties = _create_penalty_tensor(
-        batch_size, repetition_penalty, torch.device(device))
+        batch_size, repetition_penalty, torch.device(device)
+    )
     sampling_metadata.no_penalties = False
     sampler = Sampler()
     logits = sampler.apply_penalties(fake_logits, sampling_metadata)
@@ -338,32 +348,40 @@ def test_sampler_repetition_penalty(device: str, batch_size: int,
     for batch_idx in range(batch_size):
         non_penalized_token_id = logits[batch_idx].argmax().item()
         penalized_token_id = logits[batch_idx].argmin().item()
-        prompt_tokens = sampling_metadata.prompt_token_ids[
-            batch_idx][:].tolist()
+        prompt_tokens = sampling_metadata.prompt_token_ids[batch_idx][:].tolist()
         output_tokens = sampling_metadata.output_token_ids[batch_idx]
         if repetition_penalty > 1.0:
             # If `repetition_penalty` > 1.0, verify that the non-penalized
             # token ID has not been seen before, while the penalized token ID
             # exists either in the prompt or the output.
-            assert (non_penalized_token_id not in prompt_tokens
-                    and non_penalized_token_id not in output_tokens)
-            assert (penalized_token_id in prompt_tokens
-                    or penalized_token_id in output_tokens)
+            assert (
+                non_penalized_token_id not in prompt_tokens
+                and non_penalized_token_id not in output_tokens
+            )
+            assert (
+                penalized_token_id in prompt_tokens
+                or penalized_token_id in output_tokens
+            )
         elif repetition_penalty < 1.0:
             # If `repetition_penalty` < 1.0, verify that the penalized
             # token ID has not been seen before, while the non-penalized
             # token ID exists either in the prompt or the output.
-            assert (penalized_token_id not in prompt_tokens
-                    and penalized_token_id not in output_tokens)
-            assert (non_penalized_token_id in prompt_tokens
-                    or non_penalized_token_id in output_tokens)
+            assert (
+                penalized_token_id not in prompt_tokens
+                and penalized_token_id not in output_tokens
+            )
+            assert (
+                non_penalized_token_id in prompt_tokens
+                or non_penalized_token_id in output_tokens
+            )
 
 
 @pytest.mark.parametrize("device", CUDA_DEVICES)
 @pytest.mark.parametrize("batch_size", [1, 2, 32])
 @pytest.mark.parametrize("num_allowed_token_ids", [0, 1, 2])
-def test_sampler_allowed_token_ids(device: str, batch_size: int,
-                                   num_allowed_token_ids: int):
+def test_sampler_allowed_token_ids(
+    device: str, batch_size: int, num_allowed_token_ids: int
+):
     """
     Test to verify that when the repetition penalty is enabled, tokens
     are penalized based on their presence in the prompt or the existing
@@ -374,7 +392,8 @@ def test_sampler_allowed_token_ids(device: str, batch_size: int,
     # logit value.
     fake_logits = _create_fake_logits(batch_size, VOCAB_SIZE)
     sampling_metadata = _create_default_sampling_metadata(
-        NUM_OUTPUT_TOKENS, batch_size, VOCAB_SIZE, torch.device(device))
+        NUM_OUTPUT_TOKENS, batch_size, VOCAB_SIZE, torch.device(device)
+    )
     mask = _create_allowed_token_ids(
         batch_size=batch_size,
         vocab_size=VOCAB_SIZE,
@@ -394,17 +413,19 @@ def test_sampler_allowed_token_ids(device: str, batch_size: int,
             start = min(batch_idx, VOCAB_SIZE - 1)
             end = min(batch_idx + num_allowed_token_ids, VOCAB_SIZE - 1)
             if token_id >= start and token_id < end:
-                assert logits_for_req[token_id] == -float(
-                    "inf"), f"{batch_idx}, {token_id}"
+                assert logits_for_req[token_id] == -float("inf"), (
+                    f"{batch_idx}, {token_id}"
+                )
             else:
                 assert logits_for_req[token_id] != -float("inf")
 
 
 @pytest.mark.parametrize("device", CUDA_DEVICES)
 @pytest.mark.parametrize("batch_size", [1, 2, 32])
-@pytest.mark.parametrize("bad_words_lengths", [(1, ), (1, 3), (2, 2)])
-def test_sampler_bad_words(device: str, batch_size: int,
-                           bad_words_lengths: tuple[int, ...]):
+@pytest.mark.parametrize("bad_words_lengths", [(1,), (1, 3), (2, 2)])
+def test_sampler_bad_words(
+    device: str, batch_size: int, bad_words_lengths: tuple[int, ...]
+):
     """
     Test to verify that when the bad words restriction is present, tokens
     are penalized based on their match with the bad words.
@@ -414,19 +435,24 @@ def test_sampler_bad_words(device: str, batch_size: int,
     # logit value.
     fake_logits = _create_fake_logits(batch_size, VOCAB_SIZE)
     sampling_metadata = _create_default_sampling_metadata(
-        NUM_OUTPUT_TOKENS, batch_size, VOCAB_SIZE, torch.device(device))
+        NUM_OUTPUT_TOKENS, batch_size, VOCAB_SIZE, torch.device(device)
+    )
     sampling_metadata.bad_words_token_ids = _create_bad_words_token_ids(
-        batch_size, VOCAB_SIZE, bad_words_lengths)
+        batch_size, VOCAB_SIZE, bad_words_lengths
+    )
     bad_words_last_tokens = _update_output_token_ids_for_bad_words(
-        sampling_metadata, VOCAB_SIZE)
+        sampling_metadata, VOCAB_SIZE
+    )
     sampler = Sampler()
     logits = sampler.apply_bad_words(fake_logits, sampling_metadata)
     logits = logits.cpu()
     for batch_idx in range(batch_size):
         logits_for_req = logits[batch_idx]
         for token_id in range(VOCAB_SIZE):
-            if (batch_idx in bad_words_last_tokens
-                    and token_id in bad_words_last_tokens[batch_idx]):
+            if (
+                batch_idx in bad_words_last_tokens
+                and token_id in bad_words_last_tokens[batch_idx]
+            ):
                 assert logits_for_req[token_id] == -float("inf")
             else:
                 assert logits_for_req[token_id] != -float("inf")
diff --git a/tests/v1/sample/test_sampling_params_e2e.py b/tests/v1/sample/test_sampling_params_e2e.py
index f53e1e1c485d..24f9397cc4c6 100644
--- a/tests/v1/sample/test_sampling_params_e2e.py
+++ b/tests/v1/sample/test_sampling_params_e2e.py
@@ -66,9 +66,9 @@ def test_stop(llm):
     # Output should not contain the stop word.
     assert len(new_split_text) == STOP_IDX
 
-    params = SamplingParams(temperature=0,
-                            stop=split_text[STOP_IDX],
-                            include_stop_str_in_output=True)
+    params = SamplingParams(
+        temperature=0, stop=split_text[STOP_IDX], include_stop_str_in_output=True
+    )
     output = llm.generate(PROMPT, params)
     new_split_text = output[0].outputs[0].text.split()
 
@@ -103,8 +103,8 @@ def test_detokenize_false(llm):
     assert len(output[0].outputs[0].text) == 0
 
     output = llm.generate(
-        PROMPT, SamplingParams(detokenize=False, logprobs=3,
-                               prompt_logprobs=3))
+        PROMPT, SamplingParams(detokenize=False, logprobs=3, prompt_logprobs=3)
+    )
     assert len(output[0].outputs[0].token_ids) > 0
     assert len(output[0].outputs[0].text) == 0
 
@@ -131,8 +131,7 @@ def test_bad_words(llm):
     assert bad_words_1 not in new_text
 
     bad_words_2 = new_text.split()[-1]
-    params = SamplingParams(temperature=0,
-                            bad_words=[bad_words_1, bad_words_2])
+    params = SamplingParams(temperature=0, bad_words=[bad_words_1, bad_words_2])
     output = llm.generate(PROMPT, params)
     new_text = output[0].outputs[0].text
     assert bad_words_1 not in new_text
@@ -158,8 +157,7 @@ def test_allowed_token_ids(llm):
 
     TOKEN_ID = 10
     allowed_token_ids = [TOKEN_ID]
-    output = llm.generate(PROMPT,
-                          SamplingParams(allowed_token_ids=allowed_token_ids))
+    output = llm.generate(PROMPT, SamplingParams(allowed_token_ids=allowed_token_ids))
     assert output[0].outputs[0].token_ids[-1] == TOKEN_ID
 
     # Reject empty allowed_token_ids.
diff --git a/tests/v1/sample/test_topk_topp_sampler.py b/tests/v1/sample/test_topk_topp_sampler.py
index ccf38c31d39e..c70cbebe22ca 100644
--- a/tests/v1/sample/test_topk_topp_sampler.py
+++ b/tests/v1/sample/test_topk_topp_sampler.py
@@ -5,8 +5,10 @@
 from torch import Generator
 
 from vllm.platforms import current_platform
-from vllm.v1.sample.ops.topk_topp_sampler import (apply_top_k_top_p,
-                                                  is_flashinfer_available)
+from vllm.v1.sample.ops.topk_topp_sampler import (
+    apply_top_k_top_p,
+    is_flashinfer_available,
+)
 
 DEVICE = current_platform.device_type
 
@@ -30,19 +32,18 @@ def reset_default_device():
 
 
 def test_topk_impl_equivalence():
-
     torch.set_default_device(DEVICE)
     generator = Generator(device=DEVICE).manual_seed(33)
 
     logits = torch.rand((BATCH_SIZE, VOCAB_SIZE), generator=generator)
 
     # Random top-k values between 1 and 9.
-    k = torch.randint(1, 10, (BATCH_SIZE, ), generator=generator)
+    k = torch.randint(1, 10, (BATCH_SIZE,), generator=generator)
 
     # Set k=vocab_size for ~50% of requests in the batch (top-k disabled).
     k.masked_fill_(
-        torch.randint(0, 2, (BATCH_SIZE, ), generator=generator, dtype=bool),
-        VOCAB_SIZE)
+        torch.randint(0, 2, (BATCH_SIZE,), generator=generator, dtype=bool), VOCAB_SIZE
+    )
 
     # Top-k only implementation
     result1 = apply_top_k_top_p(logits=logits.clone(), k=k, p=None)
@@ -55,7 +56,7 @@ def test_topk_impl_equivalence():
 
 
 def test_flashinfer_sampler():
-    '''
+    """
     This test verifies that the FlashInfer top-k and top-p sampling
     implementation produces the same results as the Python implementation.
 
@@ -63,11 +64,10 @@ def test_flashinfer_sampler():
     top-p prob renorm (it did provide fused sampling but we cannot compare
     sampling results due to randomness), so we will compare the probability
     renormed consequently by top-k and then top-p of FlashInfer implementation.
-    '''
+    """
 
     if not FLASHINFER_ENABLED:
-        pytest.skip(
-            "FlashInfer not installed or not available on this platform.")
+        pytest.skip("FlashInfer not installed or not available on this platform.")
 
     torch.set_default_device(DEVICE)
     generator = Generator(device=DEVICE).manual_seed(42)
@@ -76,23 +76,21 @@ def test_flashinfer_sampler():
     logits = torch.rand((BATCH_SIZE, VOCAB_SIZE), generator=generator)
 
     # Generate various top-k and top-p values
-    k_values = torch.randint(1, 1000, (BATCH_SIZE, ), generator=generator)
-    p_values = torch.rand(
-        (BATCH_SIZE, ), generator=generator) * 0.5 + 0.5  # range in [0.5, 1.0]
+    k_values = torch.randint(1, 1000, (BATCH_SIZE,), generator=generator)
+    p_values = (
+        torch.rand((BATCH_SIZE,), generator=generator) * 0.5 + 0.5
+    )  # range in [0.5, 1.0]
 
     # Sometimes disable top-k (k=vocab_size)
     k_values.masked_fill_(
-        torch.randint(0,
-                      2, (BATCH_SIZE, ),
-                      generator=generator,
-                      dtype=torch.bool), VOCAB_SIZE)
+        torch.randint(0, 2, (BATCH_SIZE,), generator=generator, dtype=torch.bool),
+        VOCAB_SIZE,
+    )
 
     # Sometimes disable top-p (p=1.0)
     p_values.masked_fill_(
-        torch.randint(0,
-                      2, (BATCH_SIZE, ),
-                      generator=generator,
-                      dtype=torch.bool), 1.0)
+        torch.randint(0, 2, (BATCH_SIZE,), generator=generator, dtype=torch.bool), 1.0
+    )
 
     python_logits = apply_top_k_top_p(
         logits=logits.clone(),
@@ -113,5 +111,6 @@ def test_flashinfer_sampler():
     )
 
     # Compare the results
-    assert torch.allclose(python_probs, flashinfer_probs, atol=2e-2), \
+    assert torch.allclose(python_probs, flashinfer_probs, atol=2e-2), (
         "FlashInfer and Python sampling implementations do not match!"
+    )
diff --git a/tests/v1/sample/utils.py b/tests/v1/sample/utils.py
index e33efb413d02..0f1214e9745c 100644
--- a/tests/v1/sample/utils.py
+++ b/tests/v1/sample/utils.py
@@ -16,6 +16,7 @@
 
 class BatchLogprobsComposition(Enum):
     """Types of logprobs configs to include in test batch"""
+
     NONE = 0
     SAMPLE = 1
     PROMPT = 2
@@ -26,10 +27,10 @@ class BatchLogprobsComposition(Enum):
 
 
 def get_test_batch(
-    batch_logprobs_composition: BatchLogprobsComposition
+    batch_logprobs_composition: BatchLogprobsComposition,
 ) -> BatchLogprobsSpecType:
     """Generate logprobs configs for a batch of requests
-    
+
     A given request's logprobs configuration is (1) num_sample_logprobs and (2)
     num_prompt_logprobs. The batch logprobs configuration is the list of request
     logprobs configs.
@@ -101,7 +102,7 @@ def assert_incr_detok_str_matches_non_incr_detok_str(
     msg: str,
 ) -> None:
     """Compare incrementally detok. text to non-incrementally detok. text
-    
+
     Fail if the strings mismatch after non-alphanumeric characters are stripped
     out.
 
@@ -120,15 +121,15 @@ def assert_incr_detok_str_matches_non_incr_detok_str(
                                           tokens
       msg: error message if `assert` fails
     """
-    rgx = r'[^a-zA-Z0-9]+'
-    assert (re.sub(rgx, '', incremental_detokenization_str) == re.sub(
-        rgx, '', non_incremental_detokenization_str)), (msg)
+    rgx = r"[^a-zA-Z0-9]+"
+    assert re.sub(rgx, "", incremental_detokenization_str) == re.sub(
+        rgx, "", non_incremental_detokenization_str
+    ), msg
 
 
-def compute_correct_cumulative_logprob(
-        completion_output: CompletionOutput) -> float:
+def compute_correct_cumulative_logprob(completion_output: CompletionOutput) -> float:
     """Compute known-good value for evaluating cumulative logprob
-    
+
     Args:
       completion_output: completion output from engine
 
@@ -146,12 +147,12 @@ def create_fake_logits(batch_size: int, vocab_size: int) -> torch.Tensor:
     return fake_logits
 
 
-def create_penalty_tensor(batch_size: int, penalty_value: float,
-                          device: torch.device) -> torch.Tensor:
-    return torch.full((batch_size, ),
-                      fill_value=penalty_value,
-                      dtype=torch.float,
-                      device=device)
+def create_penalty_tensor(
+    batch_size: int, penalty_value: float, device: torch.device
+) -> torch.Tensor:
+    return torch.full(
+        (batch_size,), fill_value=penalty_value, dtype=torch.float, device=device
+    )
 
 
 def create_prompt_tokens_tensor(
@@ -170,6 +171,7 @@ def create_prompt_tokens_tensor(
 
 class LogitsprocsTestFakes(NamedTuple):
     """Wraps fake data structures to support testing"""
+
     logits: torch.Tensor
     sampling_metadata: SamplingMetadata
 
@@ -178,15 +180,16 @@ def get_logitsprocs_by_cls(
         cls: type[LogitsProcessor],
     ) -> Iterator[LogitsProcessor]:
         """Yield logits processors of a specific class.
-        
+
         Args:
           cls: :class:`LogitsProcessor` subclass
 
         Returns:
           Iterator over logits processors
         """
-        return (lp for lp in self.sampling_metadata.logitsprocs.all
-                if isinstance(lp, cls))
+        return (
+            lp for lp in self.sampling_metadata.logitsprocs.all if isinstance(lp, cls)
+        )
 
     def get_logitsprocs(self) -> Iterator[LogitsProcessor]:
         """Iterator over all logits processors."""
@@ -208,8 +211,7 @@ def fake_apply_logitsprocs(
     slice_indices: list[int],
 ) -> torch.Tensor:
     """Imitate application of logits processors in engine core"""
-    logits = test_fakes.logits[torch.tensor(slice_indices,
-                                            dtype=torch.long)].clone()
+    logits = test_fakes.logits[torch.tensor(slice_indices, dtype=torch.long)].clone()
     for processor in test_fakes.get_logitsprocs():
         logits = processor.apply(logits)
     return logits
diff --git a/tests/v1/shutdown/test_delete.py b/tests/v1/shutdown/test_delete.py
index 682d84dc23d1..d94357827864 100644
--- a/tests/v1/shutdown/test_delete.py
+++ b/tests/v1/shutdown/test_delete.py
@@ -5,8 +5,10 @@
 import pytest
 
 from tests.utils import wait_for_gpu_memory_to_clear
-from tests.v1.shutdown.utils import (SHUTDOWN_TEST_THRESHOLD_BYTES,
-                                     SHUTDOWN_TEST_TIMEOUT_SEC)
+from tests.v1.shutdown.utils import (
+    SHUTDOWN_TEST_THRESHOLD_BYTES,
+    SHUTDOWN_TEST_TIMEOUT_SEC,
+)
 from vllm import LLM, SamplingParams
 from vllm.engine.arg_utils import AsyncEngineArgs
 from vllm.sampling_params import RequestOutputKind
@@ -21,8 +23,9 @@
 @pytest.mark.parametrize("model", MODELS)
 @pytest.mark.parametrize("tensor_parallel_size", [2, 1])
 @pytest.mark.parametrize("send_one_request", [False, True])
-async def test_async_llm_delete(model: str, tensor_parallel_size: int,
-                                send_one_request: bool) -> None:
+async def test_async_llm_delete(
+    model: str, tensor_parallel_size: int, send_one_request: bool
+) -> None:
     """Test that AsyncLLM frees GPU memory upon deletion.
     AsyncLLM always uses an MP client.
 
@@ -34,19 +37,21 @@ async def test_async_llm_delete(model: str, tensor_parallel_size: int,
     if cuda_device_count_stateless() < tensor_parallel_size:
         pytest.skip(reason="Not enough CUDA devices")
 
-    engine_args = AsyncEngineArgs(model=model,
-                                  enforce_eager=True,
-                                  tensor_parallel_size=tensor_parallel_size)
+    engine_args = AsyncEngineArgs(
+        model=model, enforce_eager=True, tensor_parallel_size=tensor_parallel_size
+    )
 
     # Instantiate AsyncLLM; make request to complete any deferred
     # initialization; then delete instance
     async_llm = AsyncLLM.from_engine_args(engine_args)
     if send_one_request:
         async for _ in async_llm.generate(
-                "Hello my name is",
-                request_id="abc",
-                sampling_params=SamplingParams(
-                    max_tokens=1, output_kind=RequestOutputKind.DELTA)):
+            "Hello my name is",
+            request_id="abc",
+            sampling_params=SamplingParams(
+                max_tokens=1, output_kind=RequestOutputKind.DELTA
+            ),
+        ):
             pass
     del async_llm
 
@@ -62,9 +67,13 @@ async def test_async_llm_delete(model: str, tensor_parallel_size: int,
 @pytest.mark.parametrize("tensor_parallel_size", [2, 1])
 @pytest.mark.parametrize("enable_multiprocessing", [True])
 @pytest.mark.parametrize("send_one_request", [False, True])
-def test_llm_delete(monkeypatch, model: str, tensor_parallel_size: int,
-                    enable_multiprocessing: bool,
-                    send_one_request: bool) -> None:
+def test_llm_delete(
+    monkeypatch,
+    model: str,
+    tensor_parallel_size: int,
+    enable_multiprocessing: bool,
+    send_one_request: bool,
+) -> None:
     """Test that LLM frees GPU memory upon deletion.
     TODO(andy) - LLM without multiprocessing.
 
@@ -83,12 +92,13 @@ def test_llm_delete(monkeypatch, model: str, tensor_parallel_size: int,
 
         # Instantiate LLM; make request to complete any deferred
         # initialization; then delete instance
-        llm = LLM(model=model,
-                  enforce_eager=True,
-                  tensor_parallel_size=tensor_parallel_size)
+        llm = LLM(
+            model=model, enforce_eager=True, tensor_parallel_size=tensor_parallel_size
+        )
         if send_one_request:
-            llm.generate("Hello my name is",
-                         sampling_params=SamplingParams(max_tokens=1))
+            llm.generate(
+                "Hello my name is", sampling_params=SamplingParams(max_tokens=1)
+            )
         del llm
 
         # Confirm all the processes are cleaned up.
diff --git a/tests/v1/shutdown/test_forward_error.py b/tests/v1/shutdown/test_forward_error.py
index 523b7ee23115..383348e88540 100644
--- a/tests/v1/shutdown/test_forward_error.py
+++ b/tests/v1/shutdown/test_forward_error.py
@@ -7,8 +7,10 @@
 import pytest
 
 from tests.utils import wait_for_gpu_memory_to_clear
-from tests.v1.shutdown.utils import (SHUTDOWN_TEST_THRESHOLD_BYTES,
-                                     SHUTDOWN_TEST_TIMEOUT_SEC)
+from tests.v1.shutdown.utils import (
+    SHUTDOWN_TEST_THRESHOLD_BYTES,
+    SHUTDOWN_TEST_TIMEOUT_SEC,
+)
 from vllm import LLM, AsyncEngineArgs, SamplingParams
 from vllm.distributed import get_tensor_model_parallel_rank
 from vllm.model_executor.models.llama import LlamaForCausalLM
@@ -26,8 +28,10 @@ def evil_forward(self, *args, **kwargs):
     if not hasattr(self, "num_calls"):
         self.num_calls = 0
 
-    if (self.num_calls == NUMBER_OF_GOOD_PASSES
-            and get_tensor_model_parallel_rank() == 0):
+    if (
+        self.num_calls == NUMBER_OF_GOOD_PASSES
+        and get_tensor_model_parallel_rank() == 0
+    ):
         raise Exception("Simulated illegal memory access on Rank 0!")
     self.num_calls += 1
 
@@ -37,10 +41,11 @@ def evil_forward(self, *args, **kwargs):
 @pytest.mark.asyncio
 @pytest.mark.parametrize("tensor_parallel_size", [2, 1])
 @pytest.mark.parametrize("model", MODELS)
-async def test_async_llm_model_error(monkeypatch, tensor_parallel_size: int,
-                                     model: str) -> None:
+async def test_async_llm_model_error(
+    monkeypatch, tensor_parallel_size: int, model: str
+) -> None:
     """Test that AsyncLLM propagates a forward pass error and frees memory.
-    
+
     AsyncLLM always uses an MP client.
     """
     if cuda_device_count_stateless() < tensor_parallel_size:
@@ -49,15 +54,15 @@ async def test_async_llm_model_error(monkeypatch, tensor_parallel_size: int,
     # Monkeypatch an error in the model.
     monkeypatch.setattr(LlamaForCausalLM, "forward", evil_forward)
 
-    engine_args = AsyncEngineArgs(model=model,
-                                  enforce_eager=True,
-                                  tensor_parallel_size=tensor_parallel_size)
+    engine_args = AsyncEngineArgs(
+        model=model, enforce_eager=True, tensor_parallel_size=tensor_parallel_size
+    )
     async_llm = AsyncLLM.from_engine_args(engine_args)
 
     async def generate(request_id: str):
-        generator = async_llm.generate("Hello my name is",
-                                       request_id=request_id,
-                                       sampling_params=SamplingParams())
+        generator = async_llm.generate(
+            "Hello my name is", request_id=request_id, sampling_params=SamplingParams()
+        )
         try:
             async for _ in generator:
                 pass
@@ -77,9 +82,9 @@ async def generate(request_id: str):
 
     # We should not be able to make another request.
     with pytest.raises(EngineDeadError):
-        async for _ in async_llm.generate("Hello my name is",
-                                          request_id="abc",
-                                          sampling_params=SamplingParams()):
+        async for _ in async_llm.generate(
+            "Hello my name is", request_id="abc", sampling_params=SamplingParams()
+        ):
             raise Exception("We should not get here.")
 
     # Confirm all the processes are cleaned up.
@@ -98,8 +103,9 @@ async def generate(request_id: str):
 @pytest.mark.parametrize("enable_multiprocessing", [True])
 @pytest.mark.parametrize("tensor_parallel_size", [2, 1])
 @pytest.mark.parametrize("model", MODELS)
-def test_llm_model_error(monkeypatch, tensor_parallel_size: int,
-                         enable_multiprocessing: bool, model: str) -> None:
+def test_llm_model_error(
+    monkeypatch, tensor_parallel_size: int, enable_multiprocessing: bool, model: str
+) -> None:
     """Test that LLM propagates a forward pass error and frees memory.
     TODO(andy) - LLM without multiprocessing; LLM with multiprocessing
     and >1 rank
@@ -108,19 +114,17 @@ def test_llm_model_error(monkeypatch, tensor_parallel_size: int,
         pytest.skip(reason="Not enough CUDA devices")
 
     with monkeypatch.context() as m:
-
         MP_VALUE = "1" if enable_multiprocessing else "0"
         m.setenv("VLLM_ENABLE_V1_MULTIPROCESSING", MP_VALUE)
 
         # Monkeypatch an error in the model.
         m.setattr(LlamaForCausalLM, "forward", evil_forward)
 
-        llm = LLM(model=model,
-                  enforce_eager=True,
-                  tensor_parallel_size=tensor_parallel_size)
+        llm = LLM(
+            model=model, enforce_eager=True, tensor_parallel_size=tensor_parallel_size
+        )
 
-        with pytest.raises(
-                EngineDeadError if enable_multiprocessing else Exception):
+        with pytest.raises(EngineDeadError if enable_multiprocessing else Exception):
             llm.generate("Hello my name is Robert and I")
 
         # Confirm all the processes are cleaned up.
diff --git a/tests/v1/shutdown/test_processor_error.py b/tests/v1/shutdown/test_processor_error.py
index a077d48fecbb..013b929e3df6 100644
--- a/tests/v1/shutdown/test_processor_error.py
+++ b/tests/v1/shutdown/test_processor_error.py
@@ -30,9 +30,9 @@ async def test_async_llm_processor_error(model: str) -> None:
 
     async def generate(request_id: str):
         # [] is not allowed and will raise a ValueError in Processor.
-        generator = async_llm.generate(TokensPrompt([]),
-                                       request_id=request_id,
-                                       sampling_params=SamplingParams())
+        generator = async_llm.generate(
+            TokensPrompt([]), request_id=request_id, sampling_params=SamplingParams()
+        )
         try:
             async for _ in generator:
                 pass
@@ -55,11 +55,12 @@ async def generate(request_id: str):
     EXPECTED_TOKENS = 5
     outputs = []
     async for out in async_llm.generate(
-            "Hello my name is",
-            request_id="abc",
-            sampling_params=SamplingParams(
-                max_tokens=EXPECTED_TOKENS,
-                output_kind=RequestOutputKind.DELTA)):
+        "Hello my name is",
+        request_id="abc",
+        sampling_params=SamplingParams(
+            max_tokens=EXPECTED_TOKENS, output_kind=RequestOutputKind.DELTA
+        ),
+    ):
         outputs.append(out)
 
     generated_tokens = []
diff --git a/tests/v1/shutdown/test_startup_error.py b/tests/v1/shutdown/test_startup_error.py
index 88fc5297aaf5..019c0c4d7cf0 100644
--- a/tests/v1/shutdown/test_startup_error.py
+++ b/tests/v1/shutdown/test_startup_error.py
@@ -5,8 +5,10 @@
 import pytest
 
 from tests.utils import wait_for_gpu_memory_to_clear
-from tests.v1.shutdown.utils import (SHUTDOWN_TEST_THRESHOLD_BYTES,
-                                     SHUTDOWN_TEST_TIMEOUT_SEC)
+from tests.v1.shutdown.utils import (
+    SHUTDOWN_TEST_THRESHOLD_BYTES,
+    SHUTDOWN_TEST_TIMEOUT_SEC,
+)
 from vllm import LLM
 from vllm.distributed import get_tensor_model_parallel_rank
 from vllm.engine.arg_utils import AsyncEngineArgs
@@ -30,9 +32,9 @@ def evil_method(self, *args, **kwargs):
 @pytest.mark.parametrize("model", MODELS)
 @pytest.mark.parametrize("tensor_parallel_size", [2, 1])
 @pytest.mark.parametrize("failing_method", ["forward", "load_weights"])
-def test_async_llm_startup_error(monkeypatch, model: str,
-                                 tensor_parallel_size: int,
-                                 failing_method: str) -> None:
+def test_async_llm_startup_error(
+    monkeypatch, model: str, tensor_parallel_size: int, failing_method: str
+) -> None:
     """Test that AsyncLLM propagates an __init__ error & frees memory.
     Test profiling (forward()) and load weights failures.
     AsyncLLM always uses an MP client.
@@ -43,9 +45,9 @@ def test_async_llm_startup_error(monkeypatch, model: str,
     # Monkeypatch an error in the model.
     monkeypatch.setattr(LlamaForCausalLM, failing_method, evil_method)
 
-    engine_args = AsyncEngineArgs(model=model,
-                                  enforce_eager=True,
-                                  tensor_parallel_size=tensor_parallel_size)
+    engine_args = AsyncEngineArgs(
+        model=model, enforce_eager=True, tensor_parallel_size=tensor_parallel_size
+    )
 
     # Confirm we get an exception.
     with pytest.raises(Exception, match="initialization failed"):
@@ -63,9 +65,13 @@ def test_async_llm_startup_error(monkeypatch, model: str,
 @pytest.mark.parametrize("tensor_parallel_size", [2, 1])
 @pytest.mark.parametrize("enable_multiprocessing", [True])
 @pytest.mark.parametrize("failing_method", ["forward", "load_weights"])
-def test_llm_startup_error(monkeypatch, model: str, tensor_parallel_size: int,
-                           enable_multiprocessing: bool,
-                           failing_method: str) -> None:
+def test_llm_startup_error(
+    monkeypatch,
+    model: str,
+    tensor_parallel_size: int,
+    enable_multiprocessing: bool,
+    failing_method: str,
+) -> None:
     """Test that LLM propagates an __init__ error and frees memory.
     Test profiling (forward()) and load weights failures.
     TODO(andy) - LLM without multiprocessing.
@@ -76,7 +82,6 @@ def test_llm_startup_error(monkeypatch, model: str, tensor_parallel_size: int,
         pytest.skip(reason="Not enough CUDA devices")
 
     with monkeypatch.context() as m:
-
         MP_VALUE = "1" if enable_multiprocessing else "0"
         m.setenv("VLLM_ENABLE_V1_MULTIPROCESSING", MP_VALUE)
 
@@ -84,12 +89,16 @@ def test_llm_startup_error(monkeypatch, model: str, tensor_parallel_size: int,
         monkeypatch.setattr(LlamaForCausalLM, failing_method, evil_method)
 
         with pytest.raises(
-                Exception,
-                match="initialization failed"
-                if enable_multiprocessing else "Simulated Error in startup!"):
-            _ = LLM(model=model,
-                    enforce_eager=True,
-                    tensor_parallel_size=tensor_parallel_size)
+            Exception,
+            match="initialization failed"
+            if enable_multiprocessing
+            else "Simulated Error in startup!",
+        ):
+            _ = LLM(
+                model=model,
+                enforce_eager=True,
+                tensor_parallel_size=tensor_parallel_size,
+            )
 
         # Confirm all the processes are cleaned up.
         wait_for_gpu_memory_to_clear(
diff --git a/tests/v1/spec_decode/test_eagle.py b/tests/v1/spec_decode/test_eagle.py
index 938c6543e9b0..4c490f2188aa 100644
--- a/tests/v1/spec_decode/test_eagle.py
+++ b/tests/v1/spec_decode/test_eagle.py
@@ -8,13 +8,22 @@
 import torch
 
 from tests.utils import get_attn_backend_list_based_on_platform
-from tests.v1.attention.utils import (BatchSpec, create_common_attn_metadata,
-                                      create_standard_kv_cache_spec,
-                                      get_attention_backend)
+from tests.v1.attention.utils import (
+    BatchSpec,
+    create_common_attn_metadata,
+    create_standard_kv_cache_spec,
+    get_attention_backend,
+)
 from vllm.attention.backends.registry import _Backend
-from vllm.config import (CacheConfig, DeviceConfig, ModelConfig,
-                         ParallelConfig, SchedulerConfig, SpeculativeConfig,
-                         VllmConfig)
+from vllm.config import (
+    CacheConfig,
+    DeviceConfig,
+    ModelConfig,
+    ParallelConfig,
+    SchedulerConfig,
+    SpeculativeConfig,
+    VllmConfig,
+)
 from vllm.config.load import LoadConfig
 from vllm.model_executor.models.llama import LlamaForCausalLM
 from vllm.platforms import current_platform
@@ -32,9 +41,7 @@ def _create_proposer(
     num_speculative_tokens: int,
     speculative_token_tree: Optional[list[tuple[int, ...]]] = None,
 ) -> EagleProposer:
-    model_config = ModelConfig(model=model_dir,
-                               runner="generate",
-                               max_model_len=100)
+    model_config = ModelConfig(model=model_dir, runner="generate", max_model_len=100)
 
     # Choose model directory based on method
     draft_model_dir = eagle_dir if method == "eagle" else eagle3_dir
@@ -60,10 +67,10 @@ def _create_proposer(
         device_config=DeviceConfig(device=current_platform.device_type),
         parallel_config=ParallelConfig(),
         load_config=LoadConfig(),
-        scheduler_config=SchedulerConfig())
+        scheduler_config=SchedulerConfig(),
+    )
 
-    return EagleProposer(vllm_config=vllm_config,
-                         device=current_platform.device_type)
+    return EagleProposer(vllm_config=vllm_config, device=current_platform.device_type)
 
 
 def test_prepare_next_token_ids():
@@ -82,7 +89,7 @@ def test_prepare_next_token_ids():
         query_lens=[num_speculative_tokens + 1] * num_requests,
     )
 
-    req_ids = [f"req_{i+1}" for i in range(num_requests)]
+    req_ids = [f"req_{i + 1}" for i in range(num_requests)]
     mock_input_batch = mock.MagicMock(spec=InputBatch)
     mock_input_batch.req_ids = req_ids
     mock_input_batch.num_reqs = num_requests
@@ -101,24 +108,26 @@ def test_prepare_next_token_ids():
         [0, 1, -1, -1, -1],  # 1 accepted, 3 rejected, "1" sampled
         [0, 1, 2, 3, 4],  # all accepted, "4" sampled
         [-1, -1, -1, -1, -1],  # sampling skipped, use backup token "30"
-        [-1, -1, -1, -1, -1]  # this request will be discarded
+        [-1, -1, -1, -1, -1],  # this request will be discarded
     ]
-    sampled_token_ids_tensor = torch.tensor(sampled_token_ids,
-                                            dtype=torch.int32,
-                                            device=device)
-    sampled_token_ids_cpu = [[i for i in seq if i != -1]
-                             for seq in sampled_token_ids]
+    sampled_token_ids_tensor = torch.tensor(
+        sampled_token_ids, dtype=torch.int32, device=device
+    )
+    sampled_token_ids_cpu = [[i for i in seq if i != -1] for seq in sampled_token_ids]
 
     expected_next_token_ids_cpu = [1, 4, 30, 40]
-    expected_next_token_ids_tensor = torch.tensor(expected_next_token_ids_cpu,
-                                                  dtype=torch.int32,
-                                                  device=device)
+    expected_next_token_ids_tensor = torch.tensor(
+        expected_next_token_ids_cpu, dtype=torch.int32, device=device
+    )
 
     proposer = _create_proposer("eagle", num_speculative_tokens)
 
     next_token_ids_from_cpu = proposer.prepare_next_token_ids_cpu(
-        sampled_token_ids_cpu, mock_requests, mock_input_batch,
-        mock_num_scheduled_tokens)
+        sampled_token_ids_cpu,
+        mock_requests,
+        mock_input_batch,
+        mock_num_scheduled_tokens,
+    )
 
     assert torch.equal(next_token_ids_from_cpu, expected_next_token_ids_tensor)
 
@@ -131,19 +140,23 @@ def test_prepare_next_token_ids():
     discarded_req_indices = torch.tensor([3], dtype=torch.int64, device=device)
     num_discarded_reqs = 1
 
-    expected_valid_sampled_tokens_count = torch.tensor([2, 5, 0, 0],
-                                                       dtype=torch.int32,
-                                                       device=device)
+    expected_valid_sampled_tokens_count = torch.tensor(
+        [2, 5, 0, 0], dtype=torch.int32, device=device
+    )
 
-    next_token_ids_from_padded, valid_sampled_tokens_count = \
+    next_token_ids_from_padded, valid_sampled_tokens_count = (
         proposer.prepare_next_token_ids_padded(
-            common_attn_metadata, sampled_token_ids_tensor, mock_requests,
-            mock_input_batch, discarded_req_indices, num_discarded_reqs)
+            common_attn_metadata,
+            sampled_token_ids_tensor,
+            mock_requests,
+            mock_input_batch,
+            discarded_req_indices,
+            num_discarded_reqs,
+        )
+    )
 
-    assert torch.equal(next_token_ids_from_padded,
-                       expected_next_token_ids_tensor)
-    assert torch.equal(valid_sampled_tokens_count,
-                       expected_valid_sampled_tokens_count)
+    assert torch.equal(next_token_ids_from_padded, expected_next_token_ids_tensor)
+    assert torch.equal(valid_sampled_tokens_count, expected_valid_sampled_tokens_count)
 
 
 def test_prepare_inputs():
@@ -183,21 +196,27 @@ def test_prepare_inputs():
     sampled_token_ids = [
         [ACCEPT_TOKEN, ACCEPT_TOKEN, REJECT_TOKEN, BONUS_TOKEN],
         [
-            ACCEPT_TOKEN, ACCEPT_TOKEN, ACCEPT_TOKEN, REJECT_TOKEN,
-            REJECT_TOKEN, REJECT_TOKEN, BONUS_TOKEN
+            ACCEPT_TOKEN,
+            ACCEPT_TOKEN,
+            ACCEPT_TOKEN,
+            REJECT_TOKEN,
+            REJECT_TOKEN,
+            REJECT_TOKEN,
+            BONUS_TOKEN,
         ],
-        [ACCEPT_TOKEN, ACCEPT_TOKEN, REJECT_TOKEN, REJECT_TOKEN, BONUS_TOKEN]
+        [ACCEPT_TOKEN, ACCEPT_TOKEN, REJECT_TOKEN, REJECT_TOKEN, BONUS_TOKEN],
+    ]
+    sampled_token_ids = [
+        [i for i in seq if i != REJECT_TOKEN] for seq in sampled_token_ids
     ]
-    sampled_token_ids = [[i for i in seq if i != REJECT_TOKEN]
-                         for seq in sampled_token_ids]
 
     # Expected calculations:
     # query_len_per_req = [4, 7, 5]
     # num_tokens_per_req = [3, 4, 3]  (after subtracting rejected tokens)
     # Expected cumulative counts: [0, 3, 7, 10]
-    expected_cu_num_tokens = torch.tensor([0, 3, 7, 10],
-                                          dtype=torch.int32,
-                                          device=device)
+    expected_cu_num_tokens = torch.tensor(
+        [0, 3, 7, 10], dtype=torch.int32, device=device
+    )
 
     # Expected token indices (mapped from original positions):
     # First request: indices 0, 1, 2      (keeping first 3 from positions 0-3)
@@ -214,17 +233,18 @@ def test_prepare_inputs():
             7,  # Second request: 4 tokens (7-3)
             11,
             12,
-            13  # Third request: 3 tokens (5-2)
+            13,  # Third request: 3 tokens (5-2)
         ],
         dtype=torch.int32,
-        device=device)
+        device=device,
+    )
     proposer = _create_proposer("eagle", 1)
 
     updated_metadata, token_indices = proposer.prepare_inputs(
-        common_attn_metadata, sampled_token_ids, num_draft_tokens)
+        common_attn_metadata, sampled_token_ids, num_draft_tokens
+    )
 
-    assert torch.equal(updated_metadata.query_start_loc,
-                       expected_cu_num_tokens)
+    assert torch.equal(updated_metadata.query_start_loc, expected_cu_num_tokens)
     assert token_indices.shape[0] == expected_cu_num_tokens[-1].item()
     assert torch.equal(token_indices, expected_token_indices)
 
@@ -249,12 +269,12 @@ def test_prepare_inputs_padded():
 
     device = torch.device(current_platform.device_type)
 
-    expected_token_indices = torch.tensor([0, 1, 2, 3, 4, 5, 6, 7, 8],
-                                          dtype=torch.int32,
-                                          device=device)
-    expected_token_indices_to_sample = torch.tensor([1, 5, 6],
-                                                    dtype=torch.int32,
-                                                    device=device)
+    expected_token_indices = torch.tensor(
+        [0, 1, 2, 3, 4, 5, 6, 7, 8], dtype=torch.int32, device=device
+    )
+    expected_token_indices_to_sample = torch.tensor(
+        [1, 5, 6], dtype=torch.int32, device=device
+    )
 
     num_speculative_tokens = 2
     batch_spec = BatchSpec(
@@ -269,9 +289,9 @@ def test_prepare_inputs_padded():
     )
 
     # Needed for cu_num_draft_tokens, which is expected to be [3, 6, 9]
-    expected_query_start_loc = torch.tensor([0, 3, 6, 9],
-                                            dtype=torch.int32,
-                                            device=device)
+    expected_query_start_loc = torch.tensor(
+        [0, 3, 6, 9], dtype=torch.int32, device=device
+    )
     spec_decode_metadata = SpecDecodeMetadata.make_dummy(
         draft_token_ids=[[0] * num_speculative_tokens] * 3,
         device=device,
@@ -280,43 +300,48 @@ def test_prepare_inputs_padded():
     # num_rejected_tokens = [1, 0, 2]
     # num_draft_tokens = [2, 2, 2]
     # valid_sampled_tokens_count = num_draft_tokens + 1 - num_rejected_tokens
-    valid_sampled_tokens_count = torch.tensor([2, 3, 1],
-                                              dtype=torch.int32,
-                                              device=device)
+    valid_sampled_tokens_count = torch.tensor(
+        [2, 3, 1], dtype=torch.int32, device=device
+    )
 
     proposer = _create_proposer("eagle", num_speculative_tokens)
 
-    output_metadata, token_indices, token_indices_to_sample = \
+    output_metadata, token_indices, token_indices_to_sample = (
         proposer.prepare_inputs_padded(
-            common_attn_metadata,
-            spec_decode_metadata,
-            valid_sampled_tokens_count)
+            common_attn_metadata, spec_decode_metadata, valid_sampled_tokens_count
+        )
+    )
 
     assert output_metadata.max_query_len == 3
-    assert torch.equal(output_metadata.query_start_loc,
-                       expected_query_start_loc)
+    assert torch.equal(output_metadata.query_start_loc, expected_query_start_loc)
     assert torch.equal(token_indices, expected_token_indices)
-    assert torch.equal(token_indices_to_sample,
-                       expected_token_indices_to_sample)
+    assert torch.equal(token_indices_to_sample, expected_token_indices_to_sample)
 
 
 @pytest.mark.parametrize("method", ["eagle", "eagle3"])
-@pytest.mark.parametrize("attn_backend",
-                         get_attn_backend_list_based_on_platform())
+@pytest.mark.parametrize("attn_backend", get_attn_backend_list_based_on_platform())
 @pytest.mark.parametrize("pp_size", [1, 2])
 @pytest.mark.parametrize("use_distinct_embed_tokens", [True, False])
-@mock.patch('vllm.v1.spec_decode.eagle.get_pp_group')
-@mock.patch('vllm.v1.spec_decode.eagle.get_layers_from_vllm_config')
-@mock.patch('vllm.v1.spec_decode.eagle.get_model')
-def test_load_model(mock_get_model, mock_get_layers, mock_get_pp_group, method,
-                    attn_backend, pp_size, use_distinct_embed_tokens,
-                    monkeypatch):
-
+@mock.patch("vllm.v1.spec_decode.eagle.get_pp_group")
+@mock.patch("vllm.v1.spec_decode.eagle.get_layers_from_vllm_config")
+@mock.patch("vllm.v1.spec_decode.eagle.get_model")
+def test_load_model(
+    mock_get_model,
+    mock_get_layers,
+    mock_get_pp_group,
+    method,
+    attn_backend,
+    pp_size,
+    use_distinct_embed_tokens,
+    monkeypatch,
+):
     monkeypatch.setenv("VLLM_ATTENTION_BACKEND", attn_backend)
 
-    if (attn_backend == "TRITON_ATTN" and not current_platform.is_rocm()):
-        pytest.skip("TRITON_ATTN does not support "
-                    "multi-token eagle spec decode on current platform")
+    if attn_backend == "TRITON_ATTN" and not current_platform.is_rocm():
+        pytest.skip(
+            "TRITON_ATTN does not support "
+            "multi-token eagle spec decode on current platform"
+        )
 
     if attn_backend == "FLASH_ATTN" and current_platform.is_rocm():
         monkeypatch.setenv("VLLM_ROCM_USE_AITER", "1")
@@ -335,20 +360,20 @@ def test_load_model(mock_get_model, mock_get_layers, mock_get_pp_group, method,
     # Setup mocks for attention layers
     target_attn_layers = {
         "target_attn_1": mock.MagicMock(),
-        "target_attn_2": mock.MagicMock()
+        "target_attn_2": mock.MagicMock(),
     }
     target_indx_layers: dict[str, mock.MagicMock] = {}
     # Draft model has one extra attention layer compared to target model
-    all_attn_layers = {
-        **target_attn_layers, "draft_extra_attn": mock.MagicMock()
-    }
+    all_attn_layers = {**target_attn_layers, "draft_extra_attn": mock.MagicMock()}
 
     all_indx_layers: dict[str, mock.MagicMock] = {}
 
     # Make mock_get_layers return different values for each call
     mock_get_layers.side_effect = [
-        target_attn_layers, target_indx_layers, all_attn_layers,
-        all_indx_layers
+        target_attn_layers,
+        target_indx_layers,
+        all_attn_layers,
+        all_indx_layers,
     ]
 
     # Setup mock for pp group to return the appropriate value for world size
@@ -367,6 +392,7 @@ class _TargetModelStub(LlamaForCausalLM):
     target_model.model.embed_tokens.weight.shape = (131072, 4096)
 
     from vllm.model_executor.models import SupportsMultiModal
+
     assert not isinstance(target_model, SupportsMultiModal)
 
     if method == "eagle":
@@ -388,30 +414,30 @@ class _TargetModelStub(LlamaForCausalLM):
     # Verify that the embed tokens are set correctly
     # If pp_size is > 1, the embed tokens should be distinct
     if pp_size > 1 or use_distinct_embed_tokens:
-        assert proposer.model.model.embed_tokens != \
-            target_model.model.embed_tokens
+        assert proposer.model.model.embed_tokens != target_model.model.embed_tokens
     else:
         # When pp_size is 1 and the draft and target models have
         # embed_tokens of the same shape, they should be shared.
-        assert proposer.model.model.embed_tokens == \
-            target_model.model.embed_tokens
+        assert proposer.model.model.embed_tokens == target_model.model.embed_tokens
 
 
 @pytest.mark.parametrize("method", ["eagle", "eagle3"])
-@pytest.mark.parametrize("attn_backend",
-                         get_attn_backend_list_based_on_platform())
+@pytest.mark.parametrize("attn_backend", get_attn_backend_list_based_on_platform())
 @pytest.mark.parametrize("num_speculative_tokens", [1, 3, 8])
 def test_propose(method, attn_backend, num_speculative_tokens, monkeypatch):
-
     monkeypatch.setenv("VLLM_ATTENTION_BACKEND", attn_backend)
 
-    if (attn_backend == "TRITON_ATTN" and not current_platform.is_rocm()):
-        pytest.skip("TRITON_ATTN does not support "
-                    "multi-token eagle spec decode on current platform")
+    if attn_backend == "TRITON_ATTN" and not current_platform.is_rocm():
+        pytest.skip(
+            "TRITON_ATTN does not support "
+            "multi-token eagle spec decode on current platform"
+        )
 
-    if (attn_backend == "TREE_ATTN"):
-        pytest.skip("TREE_ATTN is tested separately in test_propose_tree"
-                    "because it requires special input mocking.")
+    if attn_backend == "TREE_ATTN":
+        pytest.skip(
+            "TREE_ATTN is tested separately in test_propose_tree"
+            "because it requires special input mocking."
+        )
 
     if attn_backend == "FLASH_ATTN" and current_platform.is_rocm():
         monkeypatch.setenv("VLLM_ROCM_USE_AITER", "1")
@@ -498,31 +524,22 @@ def create_deterministic_logits(token_ids):
         device=device,
     )
 
-    target_token_ids = torch.randint(0,
-                                     vocab_size, (total_tokens, ),
-                                     device=device)
-    target_positions = torch.cat([
-        torch.arange(seq_len_1, device=device),
-        torch.arange(seq_len_2, device=device)
-    ])
-    target_hidden_states = torch.randn(total_tokens,
-                                       hidden_size,
-                                       device=device)
-    next_token_ids = torch.randint(0,
-                                   vocab_size, (batch_size, ),
-                                   dtype=torch.int32,
-                                   device=device)
+    target_token_ids = torch.randint(0, vocab_size, (total_tokens,), device=device)
+    target_positions = torch.cat(
+        [torch.arange(seq_len_1, device=device), torch.arange(seq_len_2, device=device)]
+    )
+    target_hidden_states = torch.randn(total_tokens, hidden_size, device=device)
+    next_token_ids = torch.randint(
+        0, vocab_size, (batch_size,), dtype=torch.int32, device=device
+    )
     sampling_metadata = mock.MagicMock()
 
     if attn_backend == "FLASH_ATTN":
-        attn_metadata_builder_cls, _ = get_attention_backend(
-            _Backend.FLASH_ATTN)
+        attn_metadata_builder_cls, _ = get_attention_backend(_Backend.FLASH_ATTN)
     elif attn_backend == "TRITON_ATTN":
-        attn_metadata_builder_cls, _ = get_attention_backend(
-            _Backend.TRITON_ATTN)
+        attn_metadata_builder_cls, _ = get_attention_backend(_Backend.TRITON_ATTN)
     elif attn_backend == "TREE_ATTN":
-        attn_metadata_builder_cls, _ = get_attention_backend(
-            _Backend.TREE_ATTN)
+        attn_metadata_builder_cls, _ = get_attention_backend(_Backend.TREE_ATTN)
     else:
         raise ValueError(f"Unsupported attention backend: {attn_backend}")
 
@@ -536,18 +553,22 @@ def create_deterministic_logits(token_ids):
     # Mock runner for attention metadata building
     proposer.runner = mock.MagicMock()
     proposer.runner.attn_groups.append([mock.MagicMock()])
-    proposer.runner.attn_groups[0][0].get_metadata_builder.return_value = \
-        attn_metadata_builder
+    proposer.runner.attn_groups[0][
+        0
+    ].get_metadata_builder.return_value = attn_metadata_builder
     proposer._get_attention_metadata_builder = mock.MagicMock(
-        return_value=attn_metadata_builder)
+        return_value=attn_metadata_builder
+    )
 
-    result = proposer.propose(target_token_ids=target_token_ids,
-                              target_positions=target_positions,
-                              target_hidden_states=target_hidden_states,
-                              next_token_ids=next_token_ids,
-                              last_token_indices=None,
-                              common_attn_metadata=common_attn_metadata,
-                              sampling_metadata=sampling_metadata)
+    result = proposer.propose(
+        target_token_ids=target_token_ids,
+        target_positions=target_positions,
+        target_hidden_states=target_hidden_states,
+        next_token_ids=next_token_ids,
+        last_token_indices=None,
+        common_attn_metadata=common_attn_metadata,
+        sampling_metadata=sampling_metadata,
+    )
 
     assert result.shape == (batch_size, num_speculative_tokens)
 
@@ -556,13 +577,14 @@ def create_deterministic_logits(token_ids):
         # Example for num_speculative_tokens=1:
         # [[42], [60]]
         expected_tokens = torch.tensor(
-            [[base_token_ids[0]], [base_token_ids[1]]], device=device)
+            [[base_token_ids[0]], [base_token_ids[1]]], device=device
+        )
     else:
         # Example for num_speculative_tokens=3:
         # [[42, 43, 44], [60, 61, 62]]
-        expected_tokens = torch.zeros((batch_size, num_speculative_tokens),
-                                      dtype=torch.int64,
-                                      device=device)
+        expected_tokens = torch.zeros(
+            (batch_size, num_speculative_tokens), dtype=torch.int64, device=device
+        )
         for i in range(batch_size):
             for j in range(num_speculative_tokens):
                 expected_tokens[i, j] = base_token_ids[i] + j
@@ -574,12 +596,12 @@ def create_deterministic_logits(token_ids):
 @pytest.mark.parametrize(
     "spec_token_tree",
     [
-        [(0, )],  # A single token
-        [(0, ), (0, 0), (0, 0, 0)],  # Chain
-        [(0, ), (1, ), (2, )],  # Parallel
-        [(0, ), (1, ), (2, ), (0, 0), (0, 1), (1, 0), (1, 1), (2, 0),
-         (2, 1)],  # Tree
-    ])
+        [(0,)],  # A single token
+        [(0,), (0, 0), (0, 0, 0)],  # Chain
+        [(0,), (1,), (2,)],  # Parallel
+        [(0,), (1,), (2,), (0, 0), (0, 1), (1, 0), (1, 1), (2, 0), (2, 1)],  # Tree
+    ],
+)
 def test_propose_tree(spec_token_tree):
     # Get GPU device.
     device = torch.device(current_platform.device_type)
@@ -594,9 +616,9 @@ def test_propose_tree(spec_token_tree):
     num_speculative_tokens = len(spec_token_tree)
 
     # Create proposer first so we can use its actual hidden_size.
-    proposer = _create_proposer("eagle",
-                                num_speculative_tokens,
-                                speculative_token_tree=spec_token_tree)
+    proposer = _create_proposer(
+        "eagle", num_speculative_tokens, speculative_token_tree=spec_token_tree
+    )
     # Get the hidden_size from the proposer to ensure consistency.
     hidden_size = proposer.hidden_size
 
@@ -617,32 +639,31 @@ def create_deterministic_logits(token_ids, k: int):
     model_mock = mock.MagicMock()
 
     # Mock the model forward calls.
-    forward_returns = [(torch.zeros(total_tokens, hidden_size, device=device),
-                        torch.zeros(total_tokens, hidden_size, device=device))]
+    forward_returns = [
+        (
+            torch.zeros(total_tokens, hidden_size, device=device),
+            torch.zeros(total_tokens, hidden_size, device=device),
+        )
+    ]
     for cu_num_drafts in proposer.cu_drafts_per_level:
-        h_logits = torch.zeros(batch_size * cu_num_drafts,
-                               hidden_size,
-                               device=device)
-        h_states = torch.zeros(batch_size * cu_num_drafts,
-                               hidden_size,
-                               device=device)
+        h_logits = torch.zeros(batch_size * cu_num_drafts, hidden_size, device=device)
+        h_states = torch.zeros(batch_size * cu_num_drafts, hidden_size, device=device)
         forward_returns.append((h_logits, h_states))
     model_mock.side_effect = forward_returns
 
     # Mock the compute_logits calls.
-    cu_num_drafts_tensor = torch.tensor([0] + proposer.cu_drafts_per_level,
-                                        dtype=torch.int32,
-                                        device=device)
+    cu_num_drafts_tensor = torch.tensor(
+        [0] + proposer.cu_drafts_per_level, dtype=torch.int32, device=device
+    )
     logits_returns = []
     for level, num_children in enumerate(proposer.child_drafts_per_level):
         token_ids = base_token_ids + cu_num_drafts_tensor[level]
-        level_num_drafts = cu_num_drafts_tensor[
-            level + 1] - cu_num_drafts_tensor[level]
+        level_num_drafts = cu_num_drafts_tensor[level + 1] - cu_num_drafts_tensor[level]
         level_logits = []
         for i in range(level_num_drafts // num_children):
             level_logits.append(
-                create_deterministic_logits(token_ids + i * num_children,
-                                            num_children))
+                create_deterministic_logits(token_ids + i * num_children, num_children)
+            )
         logits_returns.append(torch.stack(level_logits, dim=1))
     model_mock.compute_logits.side_effect = logits_returns
 
@@ -664,29 +685,23 @@ def create_deterministic_logits(token_ids, k: int):
     # Mock runner for attention metadata building.
     proposer.runner = mock.MagicMock()
     proposer.runner.attn_groups.append([mock.MagicMock()])
-    proposer.runner.attn_groups[0][0].metadata_builders = [
-        attn_metadata_builder
-    ]
-    proposer.runner.attn_groups[0][0].get_metadata_builder.return_value = \
-        attn_metadata_builder
+    proposer.runner.attn_groups[0][0].metadata_builders = [attn_metadata_builder]
+    proposer.runner.attn_groups[0][
+        0
+    ].get_metadata_builder.return_value = attn_metadata_builder
     proposer._get_attention_metadata_builder = mock.MagicMock(
-        return_value=attn_metadata_builder)
+        return_value=attn_metadata_builder
+    )
 
     # Setup inputs for the proposer.
-    target_token_ids = torch.randint(0,
-                                     vocab_size, (total_tokens, ),
-                                     device=device)
-    target_positions = torch.cat([
-        torch.arange(seq_len_1, device=device),
-        torch.arange(seq_len_2, device=device)
-    ])
-    target_hidden_states = torch.randn(total_tokens,
-                                       hidden_size,
-                                       device=device)
-    next_token_ids = torch.randint(0,
-                                   vocab_size, (batch_size, ),
-                                   dtype=torch.int32,
-                                   device=device)
+    target_token_ids = torch.randint(0, vocab_size, (total_tokens,), device=device)
+    target_positions = torch.cat(
+        [torch.arange(seq_len_1, device=device), torch.arange(seq_len_2, device=device)]
+    )
+    target_hidden_states = torch.randn(total_tokens, hidden_size, device=device)
+    next_token_ids = torch.randint(
+        0, vocab_size, (batch_size,), dtype=torch.int32, device=device
+    )
     batch_spec = BatchSpec(
         seq_lens=seq_lens,
         query_lens=seq_lens,
@@ -699,19 +714,22 @@ def create_deterministic_logits(token_ids, k: int):
     sampling_metadata = mock.MagicMock()
 
     # Propose draft tokens.
-    result = proposer.propose(target_token_ids=target_token_ids,
-                              target_positions=target_positions,
-                              target_hidden_states=target_hidden_states,
-                              next_token_ids=next_token_ids,
-                              last_token_indices=None,
-                              common_attn_metadata=common_attn_metadata,
-                              sampling_metadata=sampling_metadata)
+    result = proposer.propose(
+        target_token_ids=target_token_ids,
+        target_positions=target_positions,
+        target_hidden_states=target_hidden_states,
+        next_token_ids=next_token_ids,
+        last_token_indices=None,
+        common_attn_metadata=common_attn_metadata,
+        sampling_metadata=sampling_metadata,
+    )
     assert result.shape == (batch_size, num_speculative_tokens)
 
     # The tokens are expected to be consecutive integers starting
     # from the base token IDs.
     expected_tokens = base_token_ids[:, None] + torch.arange(
-        num_speculative_tokens, dtype=torch.int64, device=device)
+        num_speculative_tokens, dtype=torch.int64, device=device
+    )
 
     # Verify that the draft tokens match our expectations.
     assert torch.equal(result, expected_tokens)
diff --git a/tests/v1/spec_decode/test_max_len.py b/tests/v1/spec_decode/test_max_len.py
index f93593f2d482..647887812f8a 100644
--- a/tests/v1/spec_decode/test_max_len.py
+++ b/tests/v1/spec_decode/test_max_len.py
@@ -33,17 +33,19 @@ def test_ngram_max_len(num_speculative_tokens: int):
 
 
 @pytest.mark.parametrize("num_speculative_tokens", [1, 3, 10])
-@pytest.mark.parametrize("attn_backend",
-                         get_attn_backend_list_based_on_platform())
-def test_eagle_max_len(monkeypatch: pytest.MonkeyPatch,
-                       num_speculative_tokens: int, attn_backend: str):
+@pytest.mark.parametrize("attn_backend", get_attn_backend_list_based_on_platform())
+def test_eagle_max_len(
+    monkeypatch: pytest.MonkeyPatch, num_speculative_tokens: int, attn_backend: str
+):
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
         m.setenv("VLLM_ATTENTION_BACKEND", attn_backend)
 
-        if (attn_backend == "TRITON_ATTN" and not current_platform.is_rocm()):
-            pytest.skip("TRITON_ATTN does not support "
-                        "multi-token eagle spec decode on current platform")
+        if attn_backend == "TRITON_ATTN" and not current_platform.is_rocm():
+            pytest.skip(
+                "TRITON_ATTN does not support "
+                "multi-token eagle spec decode on current platform"
+            )
 
         if attn_backend == "FLASH_ATTN" and current_platform.is_rocm():
             m.setenv("VLLM_ROCM_USE_AITER", "1")
diff --git a/tests/v1/spec_decode/test_mtp.py b/tests/v1/spec_decode/test_mtp.py
index dc4a56c66de6..d7d9ef07e46c 100644
--- a/tests/v1/spec_decode/test_mtp.py
+++ b/tests/v1/spec_decode/test_mtp.py
@@ -6,13 +6,22 @@
 import pytest
 import torch
 
-from tests.v1.attention.utils import (BatchSpec, create_common_attn_metadata,
-                                      create_standard_kv_cache_spec,
-                                      get_attention_backend)
+from tests.v1.attention.utils import (
+    BatchSpec,
+    create_common_attn_metadata,
+    create_standard_kv_cache_spec,
+    get_attention_backend,
+)
 from vllm.attention.backends.registry import _Backend
-from vllm.config import (CacheConfig, DeviceConfig, ModelConfig,
-                         ParallelConfig, SchedulerConfig, SpeculativeConfig,
-                         VllmConfig)
+from vllm.config import (
+    CacheConfig,
+    DeviceConfig,
+    ModelConfig,
+    ParallelConfig,
+    SchedulerConfig,
+    SpeculativeConfig,
+    VllmConfig,
+)
 from vllm.config.load import LoadConfig
 from vllm.model_executor.models.llama import LlamaForCausalLM
 from vllm.platforms import current_platform
@@ -23,10 +32,9 @@
 
 def _create_mtp_proposer(num_speculative_tokens: int) -> EagleProposer:
     """Create an MTP proposer with unified model configuration."""
-    model_config = ModelConfig(model=mimo_7b_dir,
-                               runner="generate",
-                               max_model_len=100,
-                               trust_remote_code=True)
+    model_config = ModelConfig(
+        model=mimo_7b_dir, runner="generate", max_model_len=100, trust_remote_code=True
+    )
 
     speculative_config = SpeculativeConfig(
         target_model_config=model_config,
@@ -43,17 +51,16 @@ def _create_mtp_proposer(num_speculative_tokens: int) -> EagleProposer:
         device_config=DeviceConfig(device=current_platform.device_type),
         parallel_config=ParallelConfig(),
         load_config=LoadConfig(),
-        scheduler_config=SchedulerConfig())
+        scheduler_config=SchedulerConfig(),
+    )
 
-    return EagleProposer(vllm_config=vllm_config,
-                         device=current_platform.device_type)
+    return EagleProposer(vllm_config=vllm_config, device=current_platform.device_type)
 
 
-@mock.patch('vllm.v1.spec_decode.eagle.get_pp_group')
-@mock.patch('vllm.v1.spec_decode.eagle.get_layers_from_vllm_config')
-@mock.patch('vllm.v1.spec_decode.eagle.get_model')
-def test_mtp_load_model_unified(mock_get_model, mock_get_layers,
-                                mock_get_pp_group):
+@mock.patch("vllm.v1.spec_decode.eagle.get_pp_group")
+@mock.patch("vllm.v1.spec_decode.eagle.get_layers_from_vllm_config")
+@mock.patch("vllm.v1.spec_decode.eagle.get_model")
+def test_mtp_load_model_unified(mock_get_model, mock_get_layers, mock_get_pp_group):
     """Test MTP-specific model loading with unified model approach."""
 
     # Setup mocks
@@ -67,8 +74,10 @@ def test_mtp_load_model_unified(mock_get_model, mock_get_layers,
     all_indexer_layers: dict = {}
 
     mock_get_layers.side_effect = [
-        target_attn_layers, target_indexer_layers, all_attn_layers,
-        all_indexer_layers
+        target_attn_layers,
+        target_indexer_layers,
+        all_attn_layers,
+        all_indexer_layers,
     ]
 
     mock_pp_group = mock.MagicMock()
@@ -116,17 +125,13 @@ def test_mtp_propose(num_speculative_tokens, monkeypatch):
 
     # MTP returns hidden states directly
     if num_speculative_tokens == 1:
-        model_mock.return_value = torch.zeros(total_tokens,
-                                              hidden_size,
-                                              device=device)
+        model_mock.return_value = torch.zeros(total_tokens, hidden_size, device=device)
     else:
         # Multiple forward passes for multi-token speculation
         forward_returns = []
         for i in range(num_speculative_tokens):
             if i == 0:
-                h_states = torch.zeros(total_tokens,
-                                       hidden_size,
-                                       device=device)
+                h_states = torch.zeros(total_tokens, hidden_size, device=device)
             else:
                 h_states = torch.zeros(batch_size, hidden_size, device=device)
             forward_returns.append(h_states)
@@ -140,7 +145,8 @@ def create_deterministic_logits(batch_size, vocab_size, token_offset):
 
     if num_speculative_tokens == 1:
         model_mock.compute_logits.return_value = create_deterministic_logits(
-            batch_size, vocab_size, 42)
+            batch_size, vocab_size, 42
+        )
     else:
         logits_returns = [
             create_deterministic_logits(batch_size, vocab_size, 42 + i)
@@ -153,24 +159,21 @@ def create_deterministic_logits(batch_size, vocab_size, token_offset):
 
     # Prepare inputs
     batch_spec = BatchSpec(seq_lens=seq_lens, query_lens=seq_lens)
-    common_attn_metadata = create_common_attn_metadata(batch_spec,
-                                                       block_size=16,
-                                                       device=device)
-
-    target_token_ids = torch.randint(0,
-                                     vocab_size, (total_tokens, ),
-                                     device=device)
-    target_positions = torch.cat([
-        torch.arange(seq_lens[0], device=device),
-        torch.arange(seq_lens[1], device=device)
-    ])
-    target_hidden_states = torch.randn(total_tokens,
-                                       hidden_size,
-                                       device=device)
-    next_token_ids = torch.randint(0,
-                                   vocab_size, (batch_size, ),
-                                   dtype=torch.int32,
-                                   device=device)
+    common_attn_metadata = create_common_attn_metadata(
+        batch_spec, block_size=16, device=device
+    )
+
+    target_token_ids = torch.randint(0, vocab_size, (total_tokens,), device=device)
+    target_positions = torch.cat(
+        [
+            torch.arange(seq_lens[0], device=device),
+            torch.arange(seq_lens[1], device=device),
+        ]
+    )
+    target_hidden_states = torch.randn(total_tokens, hidden_size, device=device)
+    next_token_ids = torch.randint(
+        0, vocab_size, (batch_size,), dtype=torch.int32, device=device
+    )
     sampling_metadata = mock.MagicMock()
 
     # Setup attention metadata
@@ -187,13 +190,15 @@ def create_deterministic_logits(batch_size, vocab_size, token_offset):
     proposer.attn_metadata_builder = attn_metadata_builder
 
     # Run propose
-    result = proposer.propose(target_token_ids=target_token_ids,
-                              target_positions=target_positions,
-                              target_hidden_states=target_hidden_states,
-                              next_token_ids=next_token_ids,
-                              last_token_indices=None,
-                              common_attn_metadata=common_attn_metadata,
-                              sampling_metadata=sampling_metadata)
+    result = proposer.propose(
+        target_token_ids=target_token_ids,
+        target_positions=target_positions,
+        target_hidden_states=target_hidden_states,
+        next_token_ids=next_token_ids,
+        last_token_indices=None,
+        common_attn_metadata=common_attn_metadata,
+        sampling_metadata=sampling_metadata,
+    )
 
     # Verify the model was called correctly
     assert model_mock.called
diff --git a/tests/v1/spec_decode/test_ngram.py b/tests/v1/spec_decode/test_ngram.py
index 344d19c60db7..692c39282c37 100644
--- a/tests/v1/spec_decode/test_ngram.py
+++ b/tests/v1/spec_decode/test_ngram.py
@@ -4,77 +4,75 @@
 
 from vllm.config import ModelConfig, SpeculativeConfig, VllmConfig
 from vllm.v1.spec_decode.ngram_proposer import (
-    NgramProposer, _find_longest_matched_ngram_and_propose_tokens)
+    NgramProposer,
+    _find_longest_matched_ngram_and_propose_tokens,
+)
 
 
 def test_find_longest_matched_ngram_and_propose_tokens():
     tokens = np.array([1, 2, 3, 4, 1, 2, 3, 5, 6])
     result = _find_longest_matched_ngram_and_propose_tokens(
-        origin_tokens=tokens,
-        min_ngram=2,
-        max_ngram=2,
-        max_model_len=1024,
-        k=2)
+        origin_tokens=tokens, min_ngram=2, max_ngram=2, max_model_len=1024, k=2
+    )
     assert len(result) == 0
 
     tokens = np.array([1, 2, 3, 4, 1, 2, 3])
     np.testing.assert_array_equal(
-        _find_longest_matched_ngram_and_propose_tokens(origin_tokens=tokens,
-                                                       min_ngram=2,
-                                                       max_ngram=2,
-                                                       max_model_len=1024,
-                                                       k=3),
-        np.array([4, 1, 2]))
+        _find_longest_matched_ngram_and_propose_tokens(
+            origin_tokens=tokens, min_ngram=2, max_ngram=2, max_model_len=1024, k=3
+        ),
+        np.array([4, 1, 2]),
+    )
     np.testing.assert_array_equal(
-        _find_longest_matched_ngram_and_propose_tokens(origin_tokens=tokens,
-                                                       min_ngram=2,
-                                                       max_ngram=2,
-                                                       max_model_len=1024,
-                                                       k=2), np.array([4, 1]))
+        _find_longest_matched_ngram_and_propose_tokens(
+            origin_tokens=tokens, min_ngram=2, max_ngram=2, max_model_len=1024, k=2
+        ),
+        np.array([4, 1]),
+    )
     np.testing.assert_array_equal(
-        _find_longest_matched_ngram_and_propose_tokens(origin_tokens=tokens,
-                                                       min_ngram=1,
-                                                       max_ngram=1,
-                                                       max_model_len=1024,
-                                                       k=3),
-        np.array([4, 1, 2]))
+        _find_longest_matched_ngram_and_propose_tokens(
+            origin_tokens=tokens, min_ngram=1, max_ngram=1, max_model_len=1024, k=3
+        ),
+        np.array([4, 1, 2]),
+    )
     np.testing.assert_array_equal(
-        _find_longest_matched_ngram_and_propose_tokens(origin_tokens=tokens,
-                                                       min_ngram=1,
-                                                       max_ngram=1,
-                                                       max_model_len=1024,
-                                                       k=2), np.array([4, 1]))
+        _find_longest_matched_ngram_and_propose_tokens(
+            origin_tokens=tokens, min_ngram=1, max_ngram=1, max_model_len=1024, k=2
+        ),
+        np.array([4, 1]),
+    )
 
     tokens = np.array([1, 3, 6, 2, 3, 4, 1, 2, 3])
     np.testing.assert_array_equal(
-        _find_longest_matched_ngram_and_propose_tokens(origin_tokens=tokens,
-                                                       min_ngram=2,
-                                                       max_ngram=2,
-                                                       max_model_len=1024,
-                                                       k=3),
-        np.array([4, 1, 2]))
+        _find_longest_matched_ngram_and_propose_tokens(
+            origin_tokens=tokens, min_ngram=2, max_ngram=2, max_model_len=1024, k=3
+        ),
+        np.array([4, 1, 2]),
+    )
     # Return on the first match
     np.testing.assert_array_equal(
-        _find_longest_matched_ngram_and_propose_tokens(origin_tokens=tokens,
-                                                       min_ngram=1,
-                                                       max_ngram=1,
-                                                       max_model_len=1024,
-                                                       k=2), np.array([6, 2]))
+        _find_longest_matched_ngram_and_propose_tokens(
+            origin_tokens=tokens, min_ngram=1, max_ngram=1, max_model_len=1024, k=2
+        ),
+        np.array([6, 2]),
+    )
 
 
 def test_ngram_proposer():
-
     def get_ngram_proposer(min_n: int, max_n: int, k: int) -> NgramProposer:
         # Dummy model config. Just to set max_model_len.
         model_config = ModelConfig(model="facebook/opt-125m")
         return NgramProposer(
-            vllm_config=VllmConfig(model_config=model_config,
-                                   speculative_config=SpeculativeConfig(
-                                       prompt_lookup_min=min_n,
-                                       prompt_lookup_max=max_n,
-                                       num_speculative_tokens=k,
-                                       method="ngram",
-                                   )))
+            vllm_config=VllmConfig(
+                model_config=model_config,
+                speculative_config=SpeculativeConfig(
+                    prompt_lookup_min=min_n,
+                    prompt_lookup_max=max_n,
+                    num_speculative_tokens=k,
+                    method="ngram",
+                ),
+            )
+        )
 
     # No match.
     token_ids_cpu = np.array([[1, 2, 3, 4, 5]])
@@ -133,8 +131,7 @@ def get_ngram_proposer(min_n: int, max_n: int, k: int) -> NgramProposer:
     assert np.array_equal(result, np.array([[1, 2]]))  # Not [5, 2]]
 
     # Multiple 3-gram matched, but always pick the first one.
-    token_ids_cpu = np.array(
-        [[1, 2, 3, 100, 1, 2, 3, 200, 1, 2, 3, 300, 1, 2, 3]])
+    token_ids_cpu = np.array([[1, 2, 3, 100, 1, 2, 3, 200, 1, 2, 3, 300, 1, 2, 3]])
     result = get_ngram_proposer(min_n=3, max_n=3, k=2).propose(
         sampled_token_ids=[[0]],
         req_ids=["0"],
@@ -191,6 +188,5 @@ def get_ngram_proposer(min_n: int, max_n: int, k: int) -> NgramProposer:
         spec_decode_unsupported_reqs=(),
     )
     assert len(result[0]) == 2
-    assert np.array_equal(result[0],
-                          np.array([middle_integer + 2, middle_integer + 3]))
+    assert np.array_equal(result[0], np.array([middle_integer + 2, middle_integer + 3]))
     assert np.array_equal(result[1], np.array([]))
diff --git a/tests/v1/spec_decode/test_tree_attention.py b/tests/v1/spec_decode/test_tree_attention.py
index ebb9a3d97861..a46e8e3ec755 100644
--- a/tests/v1/spec_decode/test_tree_attention.py
+++ b/tests/v1/spec_decode/test_tree_attention.py
@@ -6,9 +6,11 @@
 
 import torch
 
-from tests.v1.attention.utils import (create_standard_kv_cache_spec,
-                                      create_vllm_config,
-                                      get_attention_backend)
+from tests.v1.attention.utils import (
+    create_standard_kv_cache_spec,
+    create_vllm_config,
+    get_attention_backend,
+)
 from vllm.attention.backends.registry import _Backend
 from vllm.config import ParallelConfig, SpeculativeConfig
 from vllm.v1.attention.backends.utils import CommonAttentionMetadata
@@ -42,10 +44,11 @@ def forward_attention(
     num_kv_heads = k.shape[-2]
     # Initialize the query and KV sequence lengths.
     query_start_loc = q_len * torch.arange(
-        batch_size + 1, device=q.device, dtype=torch.int32)
+        batch_size + 1, device=q.device, dtype=torch.int32
+    )
     query_lens = torch.diff(query_start_loc)
     seq_lens = torch.full(
-        (batch_size, ),
+        (batch_size,),
         seqlen_k,
         device=q.device,
         dtype=torch.int32,
@@ -55,14 +58,13 @@ def forward_attention(
     max_query_len = q_len
     num_actual_tokens = query_start_loc[-1]
 
-    softmax_scale = q.shape[-1]**(-0.5)
+    softmax_scale = q.shape[-1] ** (-0.5)
     layer = MockAttentionLayer()
 
     # Build common metadata.
     model_name = "meta-llama/Meta-Llama-3-8B"
     builder_cls, impl_cls = get_attention_backend(backend)
-    vllm_config = create_vllm_config(model_name=model_name,
-                                     max_model_len=max(seq_lens))
+    vllm_config = create_vllm_config(model_name=model_name, max_model_len=max(seq_lens))
     if spec_token_tree is not None:
         # Create speculative config if token tree is specified.
         vllm_config.speculative_config = SpeculativeConfig(
@@ -71,7 +73,8 @@ def forward_attention(
             model=model_name,
             method="eagle",
             num_speculative_tokens=num_spec_tokens,
-            speculative_token_tree=spec_token_tree)
+            speculative_token_tree=spec_token_tree,
+        )
     kv_cache_spec = create_standard_kv_cache_spec(vllm_config)
     builder = builder_cls(kv_cache_spec, [], vllm_config, q.device)
     common_attn_metadata = CommonAttentionMetadata(
@@ -128,8 +131,7 @@ def test_tree_attn_correctness() -> None:
     device = "cuda"
     tree_attn_masks = {
         # Chain.
-        "[(0,), (0, 0), (0, 0, 0)]":
-        torch.tensor(
+        "[(0,), (0, 0), (0, 0, 0)]": torch.tensor(
             [
                 [1, 0, 0, 0],
                 [1, 1, 0, 0],
@@ -140,8 +142,7 @@ def test_tree_attn_correctness() -> None:
             dtype=torch.int32,
         ),
         # Tree.
-        "[(0,), (1,), (0, 0), (0, 1), (1, 0), (1, 1)]":
-        torch.tensor(
+        "[(0,), (1,), (0, 0), (0, 1), (1, 0), (1, 1)]": torch.tensor(
             [
                 [1, 0, 0, 0, 0, 0, 0],
                 [1, 1, 0, 0, 0, 0, 0],
@@ -202,8 +203,7 @@ def test_tree_attn_correctness() -> None:
                         device=q.device,
                         dtype=torch.bfloat16,
                     )
-                    num_alloc_blocks_per_batch = math.ceil(seqlen_k /
-                                                           block_size)
+                    num_alloc_blocks_per_batch = math.ceil(seqlen_k / block_size)
                     block_table = torch.zeros(
                         (batch_size, max_blocks_per_batch),
                         device=q.device,
@@ -217,11 +217,10 @@ def test_tree_attn_correctness() -> None:
                     )
                     if randomize_blocks:
                         # Randomize the block ids.
-                        block_ids = block_ids[torch.randperm(
-                            block_ids.numel())]
-                    block_table[:, :
-                                num_alloc_blocks_per_batch] = block_ids.view(
-                                    -1, num_alloc_blocks_per_batch)
+                        block_ids = block_ids[torch.randperm(block_ids.numel())]
+                    block_table[:, :num_alloc_blocks_per_batch] = block_ids.view(
+                        -1, num_alloc_blocks_per_batch
+                    )
 
                     # Set up the slot mapping for the input KVs.
                     tree_positions = sequence_position + torch.arange(
@@ -231,7 +230,8 @@ def test_tree_attn_correctness() -> None:
                         dtype=torch.int64,
                     ).repeat(batch_size, 1)
                     tree_slot_mapping = _gen_slot_mapping(
-                        tree_positions, block_table, block_size)
+                        tree_positions, block_table, block_size
+                    )
 
                     # Compute attention for the tree.
                     tree_attn_output = forward_attention(
@@ -253,8 +253,7 @@ def test_tree_attn_correctness() -> None:
                     for q_index in range(tree_size_q):
                         # Get the q, k, and v for the branch.
                         branch_mask = tree_attn_mask[q_index, :]
-                        branch_indices = torch.nonzero(branch_mask,
-                                                       as_tuple=True)[0]
+                        branch_indices = torch.nonzero(branch_mask, as_tuple=True)[0]
                         q_len = branch_indices.shape[0]
                         q_branch = q[:, branch_indices]
                         k_branch = k[:, branch_indices]
@@ -268,7 +267,8 @@ def test_tree_attn_correctness() -> None:
                             dtype=torch.int64,
                         ).repeat(batch_size, 1)
                         branch_slot_mapping = _gen_slot_mapping(
-                            branch_positions, block_table, block_size)
+                            branch_positions, block_table, block_size
+                        )
 
                         # Compute flash attention for the branch.
                         flash_attn_output = forward_attention(
@@ -287,16 +287,19 @@ def test_tree_attn_correctness() -> None:
                             tree_attn_output[:, branch_indices],
                             flash_attn_output,
                             atol=7.81e-3,
-                        ), (f"outputs are not close for "
+                        ), (
+                            f"outputs are not close for "
                             f"batch_size: {batch_size}, "
                             f"num_heads: {num_heads}, "
                             f"sequence_position: {sequence_position}, "
                             f"tree_attn_mask: {tree_attn_mask}, "
-                            f"q_index: {q_index}.")
+                            f"q_index: {q_index}."
+                        )
 
 
-def _gen_slot_mapping(positions: torch.Tensor, block_table: torch.Tensor,
-                      block_size: int):
+def _gen_slot_mapping(
+    positions: torch.Tensor, block_table: torch.Tensor, block_size: int
+):
     block_indices = positions // block_size
     blocks = block_table.gather(dim=1, index=block_indices)
     return (blocks * block_size + positions % block_size).view(-1)
diff --git a/tests/v1/structured_output/test_utils.py b/tests/v1/structured_output/test_utils.py
index 0e2658304d12..b285658af3d1 100644
--- a/tests/v1/structured_output/test_utils.py
+++ b/tests/v1/structured_output/test_utils.py
@@ -4,7 +4,8 @@
 import pytest
 
 from vllm.v1.structured_output.backend_xgrammar import (
-    has_xgrammar_unsupported_json_features)
+    has_xgrammar_unsupported_json_features,
+)
 
 pytestmark = pytest.mark.cpu_test
 
@@ -12,82 +13,41 @@
 @pytest.fixture
 def unsupported_string_schemas():
     return [
-        {
-            "type": "string",
-            "format": "email"
-        },
+        {"type": "string", "format": "email"},
     ]
 
 
 @pytest.fixture
 def unsupported_integer_schemas():
     return [
-        {
-            "type": "integer",
-            "multipleOf": 120
-        },
+        {"type": "integer", "multipleOf": 120},
     ]
 
 
 @pytest.fixture
 def unsupported_number_schemas():
     return [
-        {
-            "type": "number",
-            "multipleOf": 120
-        },
+        {"type": "number", "multipleOf": 120},
     ]
 
 
 @pytest.fixture
 def unsupported_array_schemas():
     return [
-        {
-            "type": "array",
-            "uniqueItems": True
-        },
-        {
-            "type": "array",
-            "contains": {
-                "type": "string"
-            }
-        },
-        {
-            "type": "array",
-            "minContains": 1
-        },
-        {
-            "type": "array",
-            "maxContains": 5
-        },
+        {"type": "array", "uniqueItems": True},
+        {"type": "array", "contains": {"type": "string"}},
+        {"type": "array", "minContains": 1},
+        {"type": "array", "maxContains": 5},
     ]
 
 
 @pytest.fixture
 def unsupported_object_schemas():
     return [
-        {
-            "type": "object",
-            "minProperties": 1
-        },
-        {
-            "type": "object",
-            "maxProperties": 5
-        },
-        {
-            "type": "object",
-            "propertyNames": {
-                "pattern": "^[a-z]+$"
-            }
-        },
-        {
-            "type": "object",
-            "patternProperties": {
-                "^S": {
-                    "type": "string"
-                }
-            }
-        },
+        {"type": "object", "minProperties": 1},
+        {"type": "object", "maxProperties": 5},
+        {"type": "object", "propertyNames": {"pattern": "^[a-z]+$"}},
+        {"type": "object", "patternProperties": {"^S": {"type": "string"}}},
     ]
 
 
@@ -96,75 +56,50 @@ def supported_schema():
     return {
         "type": "object",
         "properties": {
-            "name": {
-                "type": "string"
-            },
-            "age": {
-                "type": "integer"
-            },
-            "status": {
-                "type": "string"
-            },
-            "scores": {
-                "type": "array",
-                "items": {
-                    "type": "number"
-                }
-            },
-            "car_type": {
-                "type": "string",
-                "enum": ["sedan", "suv", "truck"]
-            },
-            "car_brand": {
-                "type": "string",
-                "pattern": "^[a-zA-Z]+$"
-            },
-            "short_description": {
-                "type": "string",
-                "maxLength": 50
-            },
-            "mileage": {
-                "type": "number",
-                "minimum": 0,
-                "maximum": 1000000
-            },
+            "name": {"type": "string"},
+            "age": {"type": "integer"},
+            "status": {"type": "string"},
+            "scores": {"type": "array", "items": {"type": "number"}},
+            "car_type": {"type": "string", "enum": ["sedan", "suv", "truck"]},
+            "car_brand": {"type": "string", "pattern": "^[a-zA-Z]+$"},
+            "short_description": {"type": "string", "maxLength": 50},
+            "mileage": {"type": "number", "minimum": 0, "maximum": 1000000},
             "model_year": {
                 "type": "integer",
                 "exclusiveMinimum": 1900,
-                "exclusiveMaximum": 2100
-            },
-            "long_description": {
-                "type": "string",
-                "minLength": 50,
-                "maxLength": 2000
+                "exclusiveMaximum": 2100,
             },
+            "long_description": {"type": "string", "minLength": 50, "maxLength": 2000},
             "address": {
                 "type": "object",
                 "properties": {
-                    "street": {
-                        "type": "string"
-                    },
-                    "city": {
-                        "type": "string"
-                    }
-                }
-            }
-        }
+                    "street": {"type": "string"},
+                    "city": {"type": "string"},
+                },
+            },
+        },
     }
 
 
-@pytest.mark.parametrize("schema_type", [
-    "unsupported_string_schemas", "unsupported_integer_schemas",
-    "unsupported_number_schemas", "unsupported_array_schemas",
-    "unsupported_object_schemas"
-])
+@pytest.mark.parametrize(
+    "schema_type",
+    [
+        "unsupported_string_schemas",
+        "unsupported_integer_schemas",
+        "unsupported_number_schemas",
+        "unsupported_array_schemas",
+        "unsupported_object_schemas",
+    ],
+)
 def test_unsupported_json_features_by_type(schema_type, request):
     schemas = request.getfixturevalue(schema_type)
     for schema in schemas:
-        assert has_xgrammar_unsupported_json_features(
-            schema), f"Schema should be unsupported: {schema}"
+        assert has_xgrammar_unsupported_json_features(schema), (
+            f"Schema should be unsupported: {schema}"
+        )
 
 
 def test_supported_json_features(supported_schema):
-    assert not has_xgrammar_unsupported_json_features(
-        supported_schema), "Schema should be supported"
+    assert not has_xgrammar_unsupported_json_features(supported_schema), (
+        "Schema should be supported"
+    )
diff --git a/tests/v1/test_oracle.py b/tests/v1/test_oracle.py
index 74aa20a2f7f9..5d3bb924590a 100644
--- a/tests/v1/test_oracle.py
+++ b/tests/v1/test_oracle.py
@@ -17,7 +17,6 @@ def test_reject_bad_config(monkeypatch):
 
 
 def test_unsupported_configs(monkeypatch):
-
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
 
diff --git a/tests/v1/test_serial_utils.py b/tests/v1/test_serial_utils.py
index 5d467687c308..a306a2b040d3 100644
--- a/tests/v1/test_serial_utils.py
+++ b/tests/v1/test_serial_utils.py
@@ -9,18 +9,21 @@
 import pytest
 import torch
 
-from vllm.multimodal.inputs import (MultiModalBatchedField,
-                                    MultiModalFieldElem, MultiModalFlatField,
-                                    MultiModalKwargsItem,
-                                    MultiModalKwargsItems,
-                                    MultiModalSharedField, NestedTensors)
+from vllm.multimodal.inputs import (
+    MultiModalBatchedField,
+    MultiModalFieldElem,
+    MultiModalFlatField,
+    MultiModalKwargsItem,
+    MultiModalKwargsItems,
+    MultiModalSharedField,
+    NestedTensors,
+)
 from vllm.v1.serial_utils import MsgpackDecoder, MsgpackEncoder
 
 pytestmark = pytest.mark.cpu_test
 
 
 class UnrecognizedType(UserDict):
-
     def __init__(self, an_int: int):
         super().__init__()
         self.an_int = an_int
@@ -47,10 +50,7 @@ def test_encode_decode(monkeypatch: pytest.MonkeyPatch):
         m.setenv("VLLM_ALLOW_INSECURE_SERIALIZATION", "1")
 
         obj = MyType(
-            tensor1=torch.randint(low=0,
-                                  high=100,
-                                  size=(1024, ),
-                                  dtype=torch.int32),
+            tensor1=torch.randint(low=0, high=100, size=(1024,), dtype=torch.int32),
             a_string="hello",
             list_of_tensors=[
                 torch.rand((1, 10), dtype=torch.float32),
@@ -58,8 +58,9 @@ def test_encode_decode(monkeypatch: pytest.MonkeyPatch):
                 torch.tensor(1984),  # test scalar too
                 # Make sure to test bf16 which numpy doesn't support.
                 torch.rand((3, 5, 1000), dtype=torch.bfloat16),
-                torch.tensor([float("-inf"), float("inf")] * 1024,
-                             dtype=torch.bfloat16),
+                torch.tensor(
+                    [float("-inf"), float("inf")] * 1024, dtype=torch.bfloat16
+                ),
             ],
             numpy_array=np.arange(512),
             unrecognized=UnrecognizedType(33),
@@ -103,22 +104,24 @@ class MyRequest(msgspec.Struct):
 
 
 def test_multimodal_kwargs():
-    e1 = MultiModalFieldElem("audio", "a0",
-                             torch.zeros(1000, dtype=torch.bfloat16),
-                             MultiModalBatchedField())
+    e1 = MultiModalFieldElem(
+        "audio", "a0", torch.zeros(1000, dtype=torch.bfloat16), MultiModalBatchedField()
+    )
     e2 = MultiModalFieldElem(
         "video",
         "v0",
         [torch.zeros(1000, dtype=torch.int8) for _ in range(4)],
-        MultiModalFlatField(
-            [[slice(1, 2, 3), slice(4, 5, 6)], [slice(None, 2)]], 0),
+        MultiModalFlatField([[slice(1, 2, 3), slice(4, 5, 6)], [slice(None, 2)]], 0),
+    )
+    e3 = MultiModalFieldElem(
+        "image", "i0", torch.zeros(1000, dtype=torch.int32), MultiModalSharedField(4)
     )
-    e3 = MultiModalFieldElem("image", "i0", torch.zeros(1000,
-                                                        dtype=torch.int32),
-                             MultiModalSharedField(4))
     e4 = MultiModalFieldElem(
-        "image", "i1", torch.zeros(1000, dtype=torch.int32),
-        MultiModalFlatField([slice(1, 2, 3), slice(4, 5, 6)], 2))
+        "image",
+        "i1",
+        torch.zeros(1000, dtype=torch.int32),
+        MultiModalFlatField([slice(1, 2, 3), slice(4, 5, 6)], 2),
+    )
     audio = MultiModalKwargsItem.from_elems([e1])
     video = MultiModalKwargsItem.from_elems([e2])
     image = MultiModalKwargsItem.from_elems([e3, e4])
@@ -164,16 +167,14 @@ def assert_equal(obj1: MyType, obj2: MyType):
     assert torch.equal(obj1.tensor1, obj2.tensor1)
     assert obj1.a_string == obj2.a_string
     assert all(
-        torch.equal(a, b)
-        for a, b in zip(obj1.list_of_tensors, obj2.list_of_tensors))
+        torch.equal(a, b) for a, b in zip(obj1.list_of_tensors, obj2.list_of_tensors)
+    )
     assert np.array_equal(obj1.numpy_array, obj2.numpy_array)
     assert obj1.unrecognized.an_int == obj2.unrecognized.an_int
     assert torch.equal(obj1.small_f_contig_tensor, obj2.small_f_contig_tensor)
     assert torch.equal(obj1.large_f_contig_tensor, obj2.large_f_contig_tensor)
-    assert torch.equal(obj1.small_non_contig_tensor,
-                       obj2.small_non_contig_tensor)
-    assert torch.equal(obj1.large_non_contig_tensor,
-                       obj2.large_non_contig_tensor)
+    assert torch.equal(obj1.small_non_contig_tensor, obj2.small_non_contig_tensor)
+    assert torch.equal(obj1.large_non_contig_tensor, obj2.large_non_contig_tensor)
     assert torch.equal(obj1.empty_tensor, obj2.empty_tensor)
 
 
@@ -210,8 +211,9 @@ def test_tensor_serialization():
     decoded = decoder.decode(encoded)
 
     # Verify the decoded tensor matches the original
-    assert torch.allclose(
-        tensor, decoded), "Decoded tensor does not match the original tensor."
+    assert torch.allclose(tensor, decoded), (
+        "Decoded tensor does not match the original tensor."
+    )
 
 
 def test_numpy_array_serialization():
@@ -229,13 +231,12 @@ def test_numpy_array_serialization():
     decoded = decoder.decode(encoded)
 
     # Verify the decoded array matches the original
-    assert np.allclose(
-        array,
-        decoded), "Decoded numpy array does not match the original array."
+    assert np.allclose(array, decoded), (
+        "Decoded numpy array does not match the original array."
+    )
 
 
 class CustomClass:
-
     def __init__(self, value):
         self.value = value
 
@@ -244,7 +245,8 @@ def __eq__(self, other):
 
 
 def test_custom_class_serialization_allowed_with_pickle(
-        monkeypatch: pytest.MonkeyPatch):
+    monkeypatch: pytest.MonkeyPatch,
+):
     """Test that serializing a custom class succeeds when allow_pickle=True."""
 
     with monkeypatch.context() as m:
@@ -261,8 +263,7 @@ def test_custom_class_serialization_allowed_with_pickle(
         decoded = decoder.decode(encoded)
 
         # Verify the decoded object matches the original
-        assert obj == decoded, (
-            "Decoded object does not match the original object.")
+        assert obj == decoded, "Decoded object does not match the original object."
 
 
 def test_custom_class_serialization_disallowed_without_pickle():
diff --git a/tests/v1/tpu/test_basic.py b/tests/v1/tpu/test_basic.py
index 865b58bc7f4b..1518987ded04 100644
--- a/tests/v1/tpu/test_basic.py
+++ b/tests/v1/tpu/test_basic.py
@@ -4,6 +4,7 @@
 
 Run `pytest tests/v1/tpu/test_basic.py`.
 """
+
 from __future__ import annotations
 
 from typing import TYPE_CHECKING
@@ -32,8 +33,9 @@
 # TENSOR_PARALLEL_SIZES = [1, 4]
 
 
-@pytest.mark.skipif(not current_platform.is_tpu(),
-                    reason="This is a basic test for TPU only")
+@pytest.mark.skipif(
+    not current_platform.is_tpu(), reason="This is a basic test for TPU only"
+)
 @pytest.mark.parametrize("model", MODELS)
 @pytest.mark.parametrize("max_tokens", [5])
 @pytest.mark.parametrize("tensor_parallel_size", TENSOR_PARALLEL_SIZES)
@@ -46,32 +48,36 @@ def test_basic(
     tensor_parallel_size: int,
     max_num_seqs: int,
 ) -> None:
-    prompt = "The next numbers of the sequence " + ", ".join(
-        str(i) for i in range(1024)) + " are:"
+    prompt = (
+        "The next numbers of the sequence "
+        + ", ".join(str(i) for i in range(1024))
+        + " are:"
+    )
     example_prompts = [prompt]
 
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
 
         with vllm_runner(
-                model,
-                # Note: max_num_batched_tokens == 1024 is needed here to
-                # actually test chunked prompt
-                max_num_batched_tokens=1024,
-                max_model_len=8192,
-                gpu_memory_utilization=0.7,
-                max_num_seqs=max_num_seqs,
-                tensor_parallel_size=tensor_parallel_size) as vllm_model:
-            vllm_outputs = vllm_model.generate_greedy(example_prompts,
-                                                      max_tokens)
+            model,
+            # Note: max_num_batched_tokens == 1024 is needed here to
+            # actually test chunked prompt
+            max_num_batched_tokens=1024,
+            max_model_len=8192,
+            gpu_memory_utilization=0.7,
+            max_num_seqs=max_num_seqs,
+            tensor_parallel_size=tensor_parallel_size,
+        ) as vllm_model:
+            vllm_outputs = vllm_model.generate_greedy(example_prompts, max_tokens)
         output = vllm_outputs[0][1]
 
         assert "1024" in output or "0, 1" in output
 
 
 @pytest.mark.skip(reason="Temporarily disabled due to timeout")
-@pytest.mark.skipif(not current_platform.is_tpu(),
-                    reason="This is a basic test for TPU only")
+@pytest.mark.skipif(
+    not current_platform.is_tpu(), reason="This is a basic test for TPU only"
+)
 @pytest.mark.parametrize("max_tokens", [8])
 @pytest.mark.parametrize("max_num_seqs", [16])
 def test_phi3(
@@ -96,9 +102,9 @@ def test_phi3(
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
 
-        with vllm_runner(model,
-                         max_num_batched_tokens=256,
-                         max_num_seqs=max_num_seqs) as vllm_model:
+        with vllm_runner(
+            model, max_num_batched_tokens=256, max_num_seqs=max_num_seqs
+        ) as vllm_model:
             vllm_outputs = vllm_model.generate_greedy(prompts, max_tokens)
         # vllm_outputs is a list of tuples whose first element is the token id
         # and the second element is the output (including the prompt).
@@ -110,10 +116,11 @@ def test_phi3(
 TP_SIZE_8 = 8
 
 
-@pytest.mark.skipif(not current_platform.is_tpu(),
-                    reason="This is a test for TPU only")
-@pytest.mark.skipif(tpu.num_available_chips() < TP_SIZE_8,
-                    reason=f"This test requires {TP_SIZE_8} TPU chips.")
+@pytest.mark.skipif(not current_platform.is_tpu(), reason="This is a test for TPU only")
+@pytest.mark.skipif(
+    tpu.num_available_chips() < TP_SIZE_8,
+    reason=f"This test requires {TP_SIZE_8} TPU chips.",
+)
 def test_gemma3_27b_with_text_input_and_tp(
     vllm_runner: type[VllmRunner],
     monkeypatch: pytest.MonkeyPatch,
@@ -137,10 +144,11 @@ def test_gemma3_27b_with_text_input_and_tp(
         m.setenv("VLLM_USE_V1", "1")
 
         with vllm_runner(
-                model,
-                max_num_batched_tokens=256,
-                max_num_seqs=max_num_seqs,
-                tensor_parallel_size=tensor_parallel_size) as vllm_model:
+            model,
+            max_num_batched_tokens=256,
+            max_num_seqs=max_num_seqs,
+            tensor_parallel_size=tensor_parallel_size,
+        ) as vllm_model:
             vllm_outputs = vllm_model.generate_greedy(prompts, max_tokens)
         # vllm_outputs is a list of tuples whose first element is the token id
         # and the second element is the output (including the prompt).
@@ -149,8 +157,9 @@ def test_gemma3_27b_with_text_input_and_tp(
             assert answer in generated_text
 
 
-@pytest.mark.skipif(not current_platform.is_tpu(),
-                    reason="This is a basic test for TPU only")
+@pytest.mark.skipif(
+    not current_platform.is_tpu(), reason="This is a basic test for TPU only"
+)
 def test_w8a8_quantization(
     vllm_runner: type[VllmRunner],
     monkeypatch: pytest.MonkeyPatch,
@@ -160,22 +169,25 @@ def test_w8a8_quantization(
     tensor_parallel_size = 1
     max_num_seqs = 4
 
-    prompt = "The next numbers of the sequence " + ", ".join(
-        str(i) for i in range(1024)) + " are:"
+    prompt = (
+        "The next numbers of the sequence "
+        + ", ".join(str(i) for i in range(1024))
+        + " are:"
+    )
     example_prompts = [prompt]
 
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
 
         with vllm_runner(
-                model,
-                max_num_batched_tokens=64,
-                max_model_len=4096,
-                gpu_memory_utilization=0.7,
-                max_num_seqs=max_num_seqs,
-                tensor_parallel_size=tensor_parallel_size) as vllm_model:
-            vllm_outputs = vllm_model.generate_greedy(example_prompts,
-                                                      max_tokens)
+            model,
+            max_num_batched_tokens=64,
+            max_model_len=4096,
+            gpu_memory_utilization=0.7,
+            max_num_seqs=max_num_seqs,
+            tensor_parallel_size=tensor_parallel_size,
+        ) as vllm_model:
+            vllm_outputs = vllm_model.generate_greedy(example_prompts, max_tokens)
         output = vllm_outputs[0][1]
 
         assert "1024" in output or "0, 1" in output
diff --git a/tests/v1/tpu/test_kv_cache_update_kernel.py b/tests/v1/tpu/test_kv_cache_update_kernel.py
index acb607247d75..99d5f98351ad 100644
--- a/tests/v1/tpu/test_kv_cache_update_kernel.py
+++ b/tests/v1/tpu/test_kv_cache_update_kernel.py
@@ -10,61 +10,69 @@
 from vllm.platforms import current_platform
 
 
-@pytest.mark.skipif(not current_platform.is_tpu(),
-                    reason="This is a test for TPU only")
+@pytest.mark.skipif(not current_platform.is_tpu(), reason="This is a test for TPU only")
 @pytest.mark.parametrize("page_size", [32, 33])
 @pytest.mark.parametrize("combined_kv_head_num", [2, 16])
 @pytest.mark.parametrize("head_dim", [128, 256])
 @pytest.mark.parametrize("num_slices_per_block", [4, 8])
-def test_kv_cache_update_kernel(page_size: int, combined_kv_head_num: int,
-                                head_dim: int, num_slices_per_block: int):
+def test_kv_cache_update_kernel(
+    page_size: int, combined_kv_head_num: int, head_dim: int, num_slices_per_block: int
+):
     page_num = 1000
     padded_num_tokens = 128
     kv_cache_cpu = torch.zeros(
         (page_num * page_size, combined_kv_head_num, head_dim),
         dtype=torch.bfloat16,
-        device="cpu")
+        device="cpu",
+    )
     kv_cache_xla = kv_cache_cpu.to(torch_xla.device())
     new_kv_cpu = torch.randn(
         (padded_num_tokens, combined_kv_head_num, head_dim),
         dtype=torch.bfloat16,
-        device="cpu")
+        device="cpu",
+    )
     new_kv_xla = new_kv_cpu.to(torch_xla.device())
-    slice_lens = np.array([7, page_size, page_size, 1, 1, 1, 9],
-                          dtype=np.int32)
+    slice_lens = np.array([7, page_size, page_size, 1, 1, 1, 9], dtype=np.int32)
     num_kv_update_slices = len(slice_lens)
-    kv_cache_start_indices = np.array([
-        page_size * 2 - 7, page_size * 2, page_size * 3, page_size * 4 + 6,
-        page_size * 5 + 7, page_size * 6 + 8, page_size * 15 + 3
-    ],
-                                      dtype=np.int32)
+    kv_cache_start_indices = np.array(
+        [
+            page_size * 2 - 7,
+            page_size * 2,
+            page_size * 3,
+            page_size * 4 + 6,
+            page_size * 5 + 7,
+            page_size * 6 + 8,
+            page_size * 15 + 3,
+        ],
+        dtype=np.int32,
+    )
     new_kv_cache_indices = np.concatenate(
-        [np.array([0], dtype=np.int32),
-         np.cumsum(slice_lens[:-1])])
+        [np.array([0], dtype=np.int32), np.cumsum(slice_lens[:-1])]
+    )
     slot_mapping = np.stack(
-        [kv_cache_start_indices, new_kv_cache_indices, slice_lens], axis=1)
+        [kv_cache_start_indices, new_kv_cache_indices, slice_lens], axis=1
+    )
     slot_mapping = np.transpose(slot_mapping)
-    slot_mapping_cpu = torch.tensor(slot_mapping,
-                                    device="cpu",
-                                    dtype=torch.int32)
+    slot_mapping_cpu = torch.tensor(slot_mapping, device="cpu", dtype=torch.int32)
     slot_mapping_xla = slot_mapping_cpu.to(torch_xla.device())
-    num_kv_update_slices_xla = torch.tensor([num_kv_update_slices],
-                                            device=torch_xla.device(),
-                                            dtype=torch.int32)
+    num_kv_update_slices_xla = torch.tensor(
+        [num_kv_update_slices], device=torch_xla.device(), dtype=torch.int32
+    )
     torch_xla.sync()
 
     torch.ops.xla.dynamo_set_buffer_donor_(kv_cache_xla, True)
     new_kv_cache_xla = torch.ops.xla.kv_cache_update_op(
-        new_kv_xla, slot_mapping_xla, kv_cache_xla, num_kv_update_slices_xla,
-        page_size, num_slices_per_block)
+        new_kv_xla,
+        slot_mapping_xla,
+        kv_cache_xla,
+        num_kv_update_slices_xla,
+        page_size,
+        num_slices_per_block,
+    )
     kv_cache_xla.copy_(new_kv_cache_xla)
     torch_xla.sync()
 
-    for ni, ci, sl in zip(new_kv_cache_indices, kv_cache_start_indices,
-                          slice_lens):
-        kv_cache_cpu[ci:ci + sl, :, :] = new_kv_cpu[ni:ni + sl, :, :]
+    for ni, ci, sl in zip(new_kv_cache_indices, kv_cache_start_indices, slice_lens):
+        kv_cache_cpu[ci : ci + sl, :, :] = new_kv_cpu[ni : ni + sl, :, :]
 
-    assert torch.allclose(kv_cache_xla.cpu(),
-                          kv_cache_cpu,
-                          atol=1e-4,
-                          rtol=1e-4)
+    assert torch.allclose(kv_cache_xla.cpu(), kv_cache_cpu, atol=1e-4, rtol=1e-4)
diff --git a/tests/v1/tpu/test_mha_attn.py b/tests/v1/tpu/test_mha_attn.py
index 9d690851b70e..5debdf85bea8 100644
--- a/tests/v1/tpu/test_mha_attn.py
+++ b/tests/v1/tpu/test_mha_attn.py
@@ -19,8 +19,7 @@
 
 @pytest.fixture(autouse=True)
 def clear_cache():
-    """Clear lru cache to ensure each test case runs without caching.
-    """
+    """Clear lru cache to ensure each test case runs without caching."""
     _cached_get_attn_backend.cache_clear()
 
 
@@ -49,8 +48,7 @@ def ref_attention(
 HEAD_SIZES = [64, 80]
 
 
-@pytest.mark.skipif(not current_platform.is_tpu(),
-                    reason="This test needs a TPU")
+@pytest.mark.skipif(not current_platform.is_tpu(), reason="This test needs a TPU")
 @pytest.mark.parametrize("batch_size", BATCH_SIZES)
 @pytest.mark.parametrize("seq_len", SEQ_LENS)
 @pytest.mark.parametrize("num_heads", NUM_HEADS)
@@ -68,19 +66,12 @@ def test_mha_attn_forward(
     current_platform.seed_everything(0)
     # These are expected to be f32
     q = torch.randn(batch_size, seq_len, num_heads * head_size, device=device)
-    k = torch.randn(batch_size,
-                    seq_len,
-                    num_kv_heads * head_size,
-                    device=device)
-    v = torch.randn(batch_size,
-                    seq_len,
-                    num_kv_heads * head_size,
-                    device=device)
+    k = torch.randn(batch_size, seq_len, num_kv_heads * head_size, device=device)
+    v = torch.randn(batch_size, seq_len, num_kv_heads * head_size, device=device)
     scale = 1.0 / head_size**0.5
-    attn = MultiHeadAttention(num_heads,
-                              head_size,
-                              scale=scale,
-                              num_kv_heads=num_kv_heads)
+    attn = MultiHeadAttention(
+        num_heads, head_size, scale=scale, num_kv_heads=num_kv_heads
+    )
     output = attn(q, k, v)
 
     assert num_heads % num_kv_heads == 0
diff --git a/tests/v1/tpu/test_multimodal.py b/tests/v1/tpu/test_multimodal.py
index 9947fcbe7313..5bf823417d4d 100644
--- a/tests/v1/tpu/test_multimodal.py
+++ b/tests/v1/tpu/test_multimodal.py
@@ -14,38 +14,32 @@
 @pytest.fixture(scope="session")
 def base64_encoded_image(local_asset_server) -> dict[str, str]:
     return {
-        image_asset:
-        encode_image_base64(local_asset_server.get_image_asset(image_asset))
+        image_asset: encode_image_base64(
+            local_asset_server.get_image_asset(image_asset)
+        )
         for image_asset in TEST_IMAGE_ASSETS
     }
 
 
 @pytest.mark.asyncio
-@pytest.mark.skipif(not current_platform.is_tpu(),
-                    reason="This test needs a TPU")
+@pytest.mark.skipif(not current_platform.is_tpu(), reason="This test needs a TPU")
 @pytest.mark.parametrize("model_name", ["llava-hf/llava-1.5-7b-hf"])
-async def test_basic_vision(model_name: str, base64_encoded_image: dict[str,
-                                                                        str]):
-
+async def test_basic_vision(model_name: str, base64_encoded_image: dict[str, str]):
     pytest.skip("Skip this test until it's fixed.")
 
     def whats_in_this_image_msg(b64):
-        return [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "text",
-                    "text": "What's in this image?"
-                },
-                {
-                    "type": "image_url",
-                    "image_url": {
-                        "url": f"data:image/jpeg;base64,{b64}"
+        return [
+            {
+                "role": "user",
+                "content": [
+                    {"type": "text", "text": "What's in this image?"},
+                    {
+                        "type": "image_url",
+                        "image_url": {"url": f"data:image/jpeg;base64,{b64}"},
                     },
-                },
-            ],
-        }]
+                ],
+            }
+        ]
 
     server_args = [
         "--max-model-len",
@@ -62,19 +56,20 @@ def whats_in_this_image_msg(b64):
     ]
 
     # Server will pre-compile on first startup (takes a long time).
-    with RemoteOpenAIServer(model_name, server_args,
-                            max_wait_seconds=600) as remote_server:
+    with RemoteOpenAIServer(
+        model_name, server_args, max_wait_seconds=600
+    ) as remote_server:
         client: openai.AsyncOpenAI = remote_server.get_async_client()
 
         # Other requests now should be much faster
         for image_url in TEST_IMAGE_ASSETS:
             image_base64 = base64_encoded_image[image_url]
-            chat_completion_from_base64 = await client.chat.completions\
-                .create(
+            chat_completion_from_base64 = await client.chat.completions.create(
                 model=model_name,
                 messages=whats_in_this_image_msg(image_base64),
                 max_completion_tokens=24,
-                temperature=0.0)
+                temperature=0.0,
+            )
             result = chat_completion_from_base64
             assert result
             choice = result.choices[0]
diff --git a/tests/v1/tpu/test_pallas.py b/tests/v1/tpu/test_pallas.py
index 1bc8dff317a7..0a994e99bade 100644
--- a/tests/v1/tpu/test_pallas.py
+++ b/tests/v1/tpu/test_pallas.py
@@ -5,8 +5,7 @@
 import torch
 
 from vllm.attention.backends.abstract import AttentionType
-from vllm.v1.attention.backends.pallas import (PallasAttentionBackendImpl,
-                                               PallasMetadata)
+from vllm.v1.attention.backends.pallas import PallasAttentionBackendImpl, PallasMetadata
 
 
 def test_ragged_paged_attention():
@@ -53,14 +52,14 @@ class FakeAttentionLayer:
     max_num_reqs = 8
     max_num_blocks_per_req = 8
     num_kv_update_slices = torch.tensor([num_tokens], dtype=torch.int32)
-    block_tables = torch.zeros((max_num_reqs, max_num_blocks_per_req),
-                               dtype=torch.int32)
-    context_lens = torch.ones((max_num_reqs, ), dtype=torch.int32)
+    block_tables = torch.zeros(
+        (max_num_reqs, max_num_blocks_per_req), dtype=torch.int32
+    )
+    context_lens = torch.ones((max_num_reqs,), dtype=torch.int32)
     query_lens = [1] * max_num_reqs
-    query_start_loc = torch.cumsum(torch.tensor([0] + query_lens,
-                                                dtype=torch.int32),
-                                   dim=0,
-                                   dtype=torch.int32)
+    query_start_loc = torch.cumsum(
+        torch.tensor([0] + query_lens, dtype=torch.int32), dim=0, dtype=torch.int32
+    )
     num_seqs = torch.tensor([max_num_reqs], dtype=torch.int32)
     attn_metadata = PallasMetadata(
         slot_mapping=slot_mapping,
@@ -72,8 +71,7 @@ class FakeAttentionLayer:
         num_slices_per_kv_cache_update_block=8,
     )
 
-    with patch("torch.ops.xla.ragged_paged_attention"
-               ) as mock_ragged_paged_attention:
+    with patch("torch.ops.xla.ragged_paged_attention") as mock_ragged_paged_attention:
         attn_impl.forward(
             layer=layer,
             query=query,
diff --git a/tests/v1/tpu/test_perf.py b/tests/v1/tpu/test_perf.py
index f4a2d5ac853a..e8cc396f970e 100644
--- a/tests/v1/tpu/test_perf.py
+++ b/tests/v1/tpu/test_perf.py
@@ -4,6 +4,7 @@
 
 Run `pytest tests/v1/tpu/test_perf.py`.
 """
+
 from __future__ import annotations
 
 import time
@@ -37,7 +38,6 @@ class TestParams:
     #   open(/dev/vfio/0): Device or resource busy: Device or resource busy;
     #   Couldn't open iommu group /dev/vfio/0
     # => Investigate
-
     # TestParams(
     #     model="Qwen/Qwen2.5-1.5B-Instruct",
     #     num_prompts=1,
@@ -59,16 +59,14 @@ class TestParams:
         num_prompts=64,
         prefix_len=500,
         decode_len=50,
-
         # commit id: ccb246776d93ef105904a8ec015b3587240a1183
         # tpu: v5lite (old vllm CI/CD)
         # expected_avg_time=1.4,
         # err_tol=0.30,
-
         # (This is the active CI/CD instance)
         # commit id: ccb246776d93ef105904a8ec015b3587240a1183
         # tpu: v6e (current vllm CI/CD)
-        expected_avg_time=1.7,  # measured with VLLM_XLA_CACHE_PATH=  
+        expected_avg_time=1.7,  # measured with VLLM_XLA_CACHE_PATH=
         err_tol=0.20,
     ),
 ]
@@ -81,44 +79,50 @@ class TestParams:
 GPU_UTIL = 0.9
 
 
-@pytest.mark.skipif(not current_platform.is_tpu(),
-                    reason="This is a basic performance test for TPU only")
+@pytest.mark.skipif(
+    not current_platform.is_tpu(),
+    reason="This is a basic performance test for TPU only",
+)
 @pytest.mark.parametrize("params", TEST_PARAMS)
 def test_perf(
     vllm_runner: type[VllmRunner],
     monkeypatch: pytest.MonkeyPatch,
     params: TestParams,
 ) -> None:
-    tokenizer = get_tokenizer(params.model,
-                              tokenizer_mode="auto",
-                              trust_remote_code=True)
+    tokenizer = get_tokenizer(
+        params.model, tokenizer_mode="auto", trust_remote_code=True
+    )
 
     prompts = []
     for i in range(params.num_prompts):
-        prefix_token_ids = np.random.randint(0,
-                                             tokenizer.vocab_size,
-                                             size=params.prefix_len).tolist()
+        prefix_token_ids = np.random.randint(
+            0, tokenizer.vocab_size, size=params.prefix_len
+        ).tolist()
         prompt = tokenizer.decode(prefix_token_ids)
         prompts.append(prompt)
 
     print(
         "-- Running: num_prompts = {} prefix_len = {} decode_len = {}".format(
-            len(prompts), params.prefix_len, params.decode_len))
+            len(prompts), params.prefix_len, params.decode_len
+        )
+    )
 
     with monkeypatch.context() as m:
         m.setenv("VLLM_USE_V1", "1")
 
-        sampling_params = SamplingParams(max_tokens=params.decode_len,
-                                         temperature=1.0,
-                                         min_p=0.0)
-
-        with vllm_runner(params.model,
-                         max_num_batched_tokens=MAX_MODEL_LEN,
-                         max_model_len=MAX_MODEL_LEN,
-                         max_num_seqs=MAX_NUM_SEQS,
-                         gpu_memory_utilization=GPU_UTIL,
-                         enforce_eager=False,
-                         tensor_parallel_size=1) as vllm_model:
+        sampling_params = SamplingParams(
+            max_tokens=params.decode_len, temperature=1.0, min_p=0.0
+        )
+
+        with vllm_runner(
+            params.model,
+            max_num_batched_tokens=MAX_MODEL_LEN,
+            max_model_len=MAX_MODEL_LEN,
+            max_num_seqs=MAX_NUM_SEQS,
+            gpu_memory_utilization=GPU_UTIL,
+            enforce_eager=False,
+            tensor_parallel_size=1,
+        ) as vllm_model:
             print("  -- Warmup / Compile")
             for i in range(NUM_WARMUPS):
                 _ = vllm_model.generate(prompts, sampling_params)
@@ -133,14 +137,18 @@ def test_perf(
             avg_time = sum(times) / len(times)
 
             print("  -- avg_time = {}".format(avg_time))
-            print("  -- expected_avg_time = {} with err_tol = {}".format(
-                params.expected_avg_time, params.err_tol))
+            print(
+                "  -- expected_avg_time = {} with err_tol = {}".format(
+                    params.expected_avg_time, params.err_tol
+                )
+            )
             diff = avg_time - params.expected_avg_time
             ok = diff < params.err_tol
             if diff < -params.err_tol:
-                print("  !! WARNING !! Performance has improved by {}, "
-                      "it may be necessary to fine-tune the "
-                      "expected_avg_time = {}".format(
-                          -diff, params.expected_avg_time))
+                print(
+                    "  !! WARNING !! Performance has improved by {}, "
+                    "it may be necessary to fine-tune the "
+                    "expected_avg_time = {}".format(-diff, params.expected_avg_time)
+                )
 
             assert ok, " !! ERROR !! Regression detected"
diff --git a/tests/v1/tpu/test_sampler.py b/tests/v1/tpu/test_sampler.py
index fa950e5f7f85..58f6292b05a7 100644
--- a/tests/v1/tpu/test_sampler.py
+++ b/tests/v1/tpu/test_sampler.py
@@ -10,21 +10,20 @@
 
 
 @pytest.mark.parametrize("model_name", ["Qwen/Qwen2.5-1.5B-Instruct"])
-@pytest.mark.skipif(not current_platform.is_tpu(),
-                    reason="This test needs a TPU")
+@pytest.mark.skipif(not current_platform.is_tpu(), reason="This test needs a TPU")
 def test_sampler_different(model_name: str):
     """
-    Test significantly different sampling params to assert the model produces 
+    Test significantly different sampling params to assert the model produces
     different results.
     """
-    llm = LLM(model_name,
-              enforce_eager=False,
-              max_num_seqs=1,
-              max_model_len=512,
-              max_num_batched_tokens=256)
-    prompts = [
-        "Write a short story about a robot that dreams for the first time."
-    ]
+    llm = LLM(
+        model_name,
+        enforce_eager=False,
+        max_num_seqs=1,
+        max_model_len=512,
+        max_num_batched_tokens=256,
+    )
+    prompts = ["Write a short story about a robot that dreams for the first time."]
     sampling_params = SamplingParams(temperature=0.9, min_p=0.2, max_tokens=64)
     output = llm.generate(prompts, sampling_params)
 
@@ -47,7 +46,9 @@ def test_sampler_different(model_name: str):
                 max_tokens=64,
                 # Vary number of ks
                 top_k=random.randint(4, 12),
-                top_p=random.random()) for _ in range(B)
+                top_p=random.random(),
+            )
+            for _ in range(B)
         ]
         # Make sure first two reqs have the same K/P
         sampling_params[0] = sampling_params[1]
@@ -61,20 +62,18 @@ def test_sampler_different(model_name: str):
 @pytest.mark.parametrize("model_name", ["Qwen/Qwen2.5-1.5B-Instruct"])
 # TODO TPU will appear busy if we fan-out test params here
 @pytest.mark.parametrize("n_prompts", [1])
-@pytest.mark.skipif(not current_platform.is_tpu(),
-                    reason="This test needs a TPU")
+@pytest.mark.skipif(not current_platform.is_tpu(), reason="This test needs a TPU")
 def test_logprobs(model_name: str, n_prompts: int):
     """
     Request top logprobs with different sampling settings and check
-    that results contains the requested number, ordered ascendingly.  
+    that results contains the requested number, ordered ascendingly.
     """
 
     def check_num_logprobs(logprobs, expected_num: int):
         for step in logprobs:
             prev_logp = 1.0
             # order by rank
-            sorted_step = dict(
-                sorted(step.items(), key=lambda item: item[1].rank))
+            sorted_step = dict(sorted(step.items(), key=lambda item: item[1].rank))
 
             # Can contain the sampled token
             assert len(step) == expected_num or len(step) == expected_num + 1
@@ -84,23 +83,23 @@ def check_num_logprobs(logprobs, expected_num: int):
                 prev_logp = logp.logprob
                 assert logp.rank == rankno + 1
 
-    llm = LLM(model_name,
-              enforce_eager=False,
-              max_num_seqs=1,
-              max_model_len=128,
-              max_num_batched_tokens=128)
+    llm = LLM(
+        model_name,
+        enforce_eager=False,
+        max_num_seqs=1,
+        max_model_len=128,
+        max_num_batched_tokens=128,
+    )
     prompts = [
         "Write a short story about a robot that dreams for the first time."
     ] * n_prompts
-    greedy_sampling_params = SamplingParams(temperature=0.0, max_tokens=64,\
-         logprobs=4)
-    regular_sampling_params = SamplingParams(temperature=0.4, max_tokens=64,\
-         logprobs=4)
-    topkp_sampling_params = SamplingParams(temperature=0.4, max_tokens=64,\
-         logprobs=4, top_k=12, top_p=0.5)
+    greedy_sampling_params = SamplingParams(temperature=0.0, max_tokens=64, logprobs=4)
+    regular_sampling_params = SamplingParams(temperature=0.4, max_tokens=64, logprobs=4)
+    topkp_sampling_params = SamplingParams(
+        temperature=0.4, max_tokens=64, logprobs=4, top_k=12, top_p=0.5
+    )
 
-    for sp in [greedy_sampling_params, regular_sampling_params, \
-               topkp_sampling_params]:
+    for sp in [greedy_sampling_params, regular_sampling_params, topkp_sampling_params]:
         output = llm.generate(prompts, sp)
         for o in output:
             check_num_logprobs(o.outputs[0].logprobs, 4)
diff --git a/tests/v1/tpu/test_spmd_model_weight_loading.py b/tests/v1/tpu/test_spmd_model_weight_loading.py
index ad234df0c8ed..be866bf90a79 100644
--- a/tests/v1/tpu/test_spmd_model_weight_loading.py
+++ b/tests/v1/tpu/test_spmd_model_weight_loading.py
@@ -9,14 +9,18 @@
 import torch_xla.runtime as xr
 
 from vllm.config import set_current_vllm_config
-from vllm.distributed.parallel_state import (ensure_model_parallel_initialized,
-                                             init_distributed_environment)
+from vllm.distributed.parallel_state import (
+    ensure_model_parallel_initialized,
+    init_distributed_environment,
+)
 from vllm.engine.arg_utils import EngineArgs
 from vllm.model_executor.model_loader.tpu import TPUModelLoader
 
 
 def _setup_environment(model):
-    engine_args = EngineArgs(model=model, )
+    engine_args = EngineArgs(
+        model=model,
+    )
     vllm_config = engine_args.create_engine_config()
     with set_current_vllm_config(vllm_config):
         temp_file = tempfile.mkstemp()[1]
@@ -25,7 +29,8 @@ def _setup_environment(model):
             0,
             local_rank=0,
             distributed_init_method=f"file://{temp_file}",
-            backend="gloo")
+            backend="gloo",
+        )
         # Under single worker mode, full model is init first and then
         # partitioned using GSPMD.
         ensure_model_parallel_initialized(1, 1)
@@ -42,7 +47,7 @@ def _get_spmd_mesh():
         num_devices = xr.global_runtime_device_count()
         mesh_shape = (num_devices, 1)
         device_ids = np.array(range(num_devices))
-        MESH = xs.Mesh(device_ids, mesh_shape, ('x', 'y'))
+        MESH = xs.Mesh(device_ids, mesh_shape, ("x", "y"))
     return MESH
 
 
@@ -53,15 +58,17 @@ def _get_spmd_mesh():
         # Skip large models due to CI runner disk space limitations
         # "meta-llama/Llama-3.1-8B-Instruct",
         # "meta-llama/Llama-3.1-70B-Instruct",
-    ])
+    ],
+)
 def test_tpu_model_loader(model):
     # Skip the 70B test if there are less than 8 chips
     # TODO: Query using torch xla API, the query API is not working
     # with SPMD now. However, This test is running under SPMD mode.
-    if '70B' in model and xr.global_runtime_device_count() < 8:
+    if "70B" in model and xr.global_runtime_device_count() < 8:
         pytest.skip(
             "Skipping 70B model if the TPU VM has less than 8 chips to \
-                     avoid OOM.")
+                     avoid OOM."
+        )
 
     vllm_config = _setup_environment(model)
     loader = TPUModelLoader(load_config=vllm_config.load_config)
diff --git a/tests/v1/tpu/test_topk_topp_sampler.py b/tests/v1/tpu/test_topk_topp_sampler.py
index 665cf8cd2629..c2fc24442c7c 100644
--- a/tests/v1/tpu/test_topk_topp_sampler.py
+++ b/tests/v1/tpu/test_topk_topp_sampler.py
@@ -10,8 +10,7 @@
 from vllm.v1.sample.ops.topk_topp_sampler import apply_top_k_top_p
 
 # isort: off
-from vllm.v1.sample.tpu.sampler import (apply_top_k_top_p as
-                                        apply_top_k_top_p_tpu)
+from vllm.v1.sample.tpu.sampler import apply_top_k_top_p as apply_top_k_top_p_tpu
 # isort: on
 
 if not current_platform.is_tpu():
@@ -30,11 +29,10 @@ def test_topk_equivalence_to_native_impl():
         logits = torch.rand((BATCH_SIZE, VOCAB_SIZE))
 
         # Random top-k values between 1 and 10.
-        k = torch.randint(1, 10, (BATCH_SIZE, ))
+        k = torch.randint(1, 10, (BATCH_SIZE,))
 
         # Set k=vocab_size for ~50% of requests in the batch (top-k disabled).
-        k.masked_fill_(torch.randint(0, 2, (BATCH_SIZE, ), dtype=bool),
-                       VOCAB_SIZE)
+        k.masked_fill_(torch.randint(0, 2, (BATCH_SIZE,), dtype=bool), VOCAB_SIZE)
 
         result_tpu = apply_top_k_top_p_tpu(logits=logits.clone(), k=k, p=None)
 
@@ -50,15 +48,13 @@ def test_topp_result_sums_past_p():
         probs = logits.softmax(dim=-1)
 
         # Random top-p values between 0 and 1.
-        p = torch.rand((BATCH_SIZE, ))
+        p = torch.rand((BATCH_SIZE,))
 
         # Set p=1 for ~50% of requests in the batch (top-p disabled).
-        p.masked_fill_(torch.randint(0, 2, (BATCH_SIZE, ), dtype=bool), 1)
+        p.masked_fill_(torch.randint(0, 2, (BATCH_SIZE,), dtype=bool), 1)
 
         no_op_k = torch.tensor([VOCAB_SIZE])
-        logits_masked = apply_top_k_top_p_tpu(logits=logits.clone(),
-                                              k=no_op_k,
-                                              p=p)
+        logits_masked = apply_top_k_top_p_tpu(logits=logits.clone(), k=no_op_k, p=p)
 
         # Verify that the masked logit's probability sums to at least p.
         probs.masked_fill_(logits_masked.isinf(), 0)
@@ -72,16 +68,16 @@ def test_topp_result_sums_past_p():
 
 def test_topp_basic():
     with torch.device(xm.xla_device()):
-        logits = torch.tensor([[math.log(0.2),
-                                math.log(0.3),
-                                math.log(0.5)],
-                               [math.log(0.5),
-                                math.log(0.1),
-                                math.log(0.4)]])
+        logits = torch.tensor(
+            [
+                [math.log(0.2), math.log(0.3), math.log(0.5)],
+                [math.log(0.5), math.log(0.1), math.log(0.4)],
+            ]
+        )
 
-        result = apply_top_k_top_p_tpu(logits=logits.clone(),
-                                       k=torch.tensor([3, 3]),
-                                       p=torch.tensor([0.79, 0.79]))
+        result = apply_top_k_top_p_tpu(
+            logits=logits.clone(), k=torch.tensor([3, 3]), p=torch.tensor([0.79, 0.79])
+        )
 
         torch_xla.sync()
 
@@ -94,16 +90,16 @@ def test_topp_basic():
 
 def test_topp_select_all():
     with torch.device(xm.xla_device()):
-        logits = torch.tensor([[math.log(0.2),
-                                math.log(0.3),
-                                math.log(0.5)],
-                               [math.log(0.5),
-                                math.log(0.1),
-                                math.log(0.4)]])
+        logits = torch.tensor(
+            [
+                [math.log(0.2), math.log(0.3), math.log(0.5)],
+                [math.log(0.5), math.log(0.1), math.log(0.4)],
+            ]
+        )
 
-        result = apply_top_k_top_p_tpu(logits=logits.clone(),
-                                       k=torch.tensor([3, 3]),
-                                       p=torch.tensor([1.0, 1.0]))
+        result = apply_top_k_top_p_tpu(
+            logits=logits.clone(), k=torch.tensor([3, 3]), p=torch.tensor([1.0, 1.0])
+        )
 
         torch_xla.sync()
 
@@ -114,14 +110,12 @@ def test_topp_with_ties():
     with torch.device(xm.xla_device()):
         # Input has multiple math.log(0.3).
         logits = torch.tensor(
-            [[math.log(0.3),
-              math.log(0.3),
-              math.log(0.3),
-              math.log(0.1)]])
+            [[math.log(0.3), math.log(0.3), math.log(0.3), math.log(0.1)]]
+        )
 
-        result = apply_top_k_top_p_tpu(logits=logits.clone(),
-                                       k=torch.tensor([4]),
-                                       p=torch.tensor([0.2]))
+        result = apply_top_k_top_p_tpu(
+            logits=logits.clone(), k=torch.tensor([4]), p=torch.tensor([0.2])
+        )
 
         torch_xla.sync()
 
@@ -135,17 +129,17 @@ def test_topp_with_ties():
 
 def test_both_topk_topp():
     with torch.device(xm.xla_device()):
-        logits = torch.tensor([[math.log(0.2),
-                                math.log(0.3),
-                                math.log(0.5)],
-                               [math.log(0.5),
-                                math.log(0.1),
-                                math.log(0.4)]])
+        logits = torch.tensor(
+            [
+                [math.log(0.2), math.log(0.3), math.log(0.5)],
+                [math.log(0.5), math.log(0.1), math.log(0.4)],
+            ]
+        )
 
         # Set k=1 for the first batch.
-        result = apply_top_k_top_p_tpu(logits=logits.clone(),
-                                       k=torch.tensor([1, 3]),
-                                       p=torch.tensor([0.79, 0.79]))
+        result = apply_top_k_top_p_tpu(
+            logits=logits.clone(), k=torch.tensor([1, 3]), p=torch.tensor([0.79, 0.79])
+        )
 
         torch_xla.sync()
 
diff --git a/tests/v1/tpu/test_tpu_int8.py b/tests/v1/tpu/test_tpu_int8.py
index f39a8021a29e..50001567a958 100644
--- a/tests/v1/tpu/test_tpu_int8.py
+++ b/tests/v1/tpu/test_tpu_int8.py
@@ -4,11 +4,11 @@
 
 Run `pytest tests/quantization/test_tpu_int8.py`.
 """
+
 import pytest
 
 from vllm.model_executor.layers.linear import LinearBase
-from vllm.model_executor.layers.quantization.tpu_int8 import (
-    TPUInt8LinearMethod)
+from vllm.model_executor.layers.quantization.tpu_int8 import TPUInt8LinearMethod
 from vllm.platforms import current_platform
 
 from ...models.registry import HF_EXAMPLE_MODELS
@@ -16,8 +16,9 @@
 MODELS = ["Qwen/Qwen2.5-0.5B-Instruct"]
 
 
-@pytest.mark.skipif(not current_platform.is_tpu(),
-                    reason="TPU Int8 is only enabled for TPUs.")
+@pytest.mark.skipif(
+    not current_platform.is_tpu(), reason="TPU Int8 is only enabled for TPUs."
+)
 @pytest.mark.parametrize("model", MODELS)
 @pytest.mark.parametrize("dtype", ["bfloat16"])
 @pytest.mark.parametrize("max_tokens", [10])
@@ -26,20 +27,28 @@
     [
         # w8a8 dynamic activation
         {
-            'quantization_config': {
-                'quant_method': 'tpu_int8',
-                'activation_scheme': 'dynamic'
+            "quantization_config": {
+                "quant_method": "tpu_int8",
+                "activation_scheme": "dynamic",
             }
         }
-    ])
-def test_model_tpu_int8(vllm_runner, model: str, dtype: str, max_tokens: int,
-                        hf_overrides: dict, monkeypatch) -> None:
+    ],
+)
+def test_model_tpu_int8(
+    vllm_runner,
+    model: str,
+    dtype: str,
+    max_tokens: int,
+    hf_overrides: dict,
+    monkeypatch,
+) -> None:
     model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
     model_info.check_transformers_version(on_fail="skip")
 
-    activation_scheme = hf_overrides.get('quantization_config',
-                                         {}).get('activation_scheme')
-    quantize_activation = activation_scheme == 'dynamic'
+    activation_scheme = hf_overrides.get("quantization_config", {}).get(
+        "activation_scheme"
+    )
+    quantize_activation = activation_scheme == "dynamic"
 
     # Allows using apply_model
     monkeypatch.setenv("VLLM_ENABLE_V1_MULTIPROCESSING", "0")
diff --git a/tests/v1/tpu/test_tpu_qkv_linear.py b/tests/v1/tpu/test_tpu_qkv_linear.py
index 46fa1193881f..098d92550542 100644
--- a/tests/v1/tpu/test_tpu_qkv_linear.py
+++ b/tests/v1/tpu/test_tpu_qkv_linear.py
@@ -9,8 +9,10 @@
 import torch_xla.runtime as xr
 
 from vllm.config import set_current_vllm_config
-from vllm.distributed.parallel_state import (ensure_model_parallel_initialized,
-                                             init_distributed_environment)
+from vllm.distributed.parallel_state import (
+    ensure_model_parallel_initialized,
+    init_distributed_environment,
+)
 from vllm.distributed.tpu_distributed_utils import XlaQKVParallelLinear
 from vllm.engine.arg_utils import EngineArgs
 from vllm.model_executor.layers.linear import QKVParallelLinear
@@ -36,7 +38,8 @@ def setup_environment():
             0,
             local_rank=0,
             distributed_init_method=f"file://{temp_file}",
-            backend="gloo")
+            backend="gloo",
+        )
         ensure_model_parallel_initialized(1, 1)
         yield
 
@@ -51,7 +54,7 @@ def _get_spmd_mesh():
         num_devices = xr.global_runtime_device_count()
         mesh_shape = (num_devices, 1)
         device_ids = np.array(range(num_devices))
-        MESH = xs.Mesh(device_ids, mesh_shape, ('x', 'y'))
+        MESH = xs.Mesh(device_ids, mesh_shape, ("x", "y"))
     return MESH
 
 
@@ -59,7 +62,7 @@ def _get_spmd_mesh():
 # `xr.use_spmd()` will set a global state, and this state is not reversible.
 # Therefore, non-SPMD tests should be run before SPMD tests.
 @pytest.mark.parametrize("mesh", [None, _get_spmd_mesh()])
-@pytest.mark.parametrize("device", ['cpu', 'xla'])
+@pytest.mark.parametrize("device", ["cpu", "xla"])
 @torch.no_grad()
 def test_xla_qkv_linear(bias, mesh, device):
     torch.manual_seed(123)
diff --git a/tests/v1/tpu/worker/test_tpu_model_runner.py b/tests/v1/tpu/worker/test_tpu_model_runner.py
index 4f4a9c7db88a..df9fcdc37fa3 100644
--- a/tests/v1/tpu/worker/test_tpu_model_runner.py
+++ b/tests/v1/tpu/worker/test_tpu_model_runner.py
@@ -4,18 +4,25 @@
 import pytest
 
 from vllm.attention.layer import Attention
-from vllm.config import (CacheConfig, ModelConfig, SchedulerConfig, VllmConfig,
-                         set_current_vllm_config)
+from vllm.config import (
+    CacheConfig,
+    ModelConfig,
+    SchedulerConfig,
+    VllmConfig,
+    set_current_vllm_config,
+)
 from vllm.pooling_params import PoolingParams
 from vllm.sampling_params import SamplingParams
 from vllm.utils import GiB_bytes
-from vllm.v1.core.kv_cache_utils import (estimate_max_model_len,
-                                         get_kv_cache_configs)
-from vllm.v1.core.sched.output import (CachedRequestData, NewRequestData,
-                                       SchedulerOutput)
+from vllm.v1.core.kv_cache_utils import estimate_max_model_len, get_kv_cache_configs
+from vllm.v1.core.sched.output import CachedRequestData, NewRequestData, SchedulerOutput
 from vllm.v1.worker.tpu_model_runner import (
-    TPUModelRunner, _get_padded_num_reqs_with_upper_limit,
-    _get_padded_token_len, _get_req_paddings, _get_token_paddings)
+    TPUModelRunner,
+    _get_padded_num_reqs_with_upper_limit,
+    _get_padded_token_len,
+    _get_req_paddings,
+    _get_token_paddings,
+)
 
 
 def get_vllm_config():
@@ -67,10 +74,11 @@ def _schedule_new_request(*req_ids: str) -> SchedulerOutput:
                 mm_features=[],
                 sampling_params=SamplingParams(),
                 pooling_params=PoolingParams(),
-                block_ids=([0], ),  # block_ids should be tuple[list[int]]
+                block_ids=([0],),  # block_ids should be tuple[list[int]]
                 num_computed_tokens=0,
                 lora_request=None,
-            ))
+            )
+        )
         num_scheduled_tokens[req_id] = 3
         total_num_scheduled_tokens += num_scheduled_tokens[req_id]
 
@@ -99,7 +107,7 @@ def _is_req_added(model_runner, req_id: str) -> bool:
 
 def _is_req_state_block_table_match(model_runner, req_id: str) -> bool:
     """Check if the request state block IDs match the block table.
-    
+
     This function handles both legacy BlockTable and new MultiGroupBlockTable
     structures for backward compatibility.
     """
@@ -206,7 +214,7 @@ def test_update_states_request_resumed(model_runner):
         req_ids=[req_id],
         resumed_from_preemption=[False],
         new_token_ids=[[]],
-        new_block_ids=[([], )],
+        new_block_ids=[([],)],
         num_computed_tokens=[0],
     )
 
@@ -303,27 +311,23 @@ def test_get_paddings():
     # Bucketed padding
     min_token_size, max_token_size, padding_gap = 16, 512, 64
     expected_paddings = [16, 32, 64, 128, 192, 256, 320, 384, 448, 512]
-    actual_paddings = _get_token_paddings(min_token_size, max_token_size,
-                                          padding_gap)
+    actual_paddings = _get_token_paddings(min_token_size, max_token_size, padding_gap)
 
     # Bucketed padding with max_token_size not a power of two.
     max_token_size = 317
     expected_paddings = [16, 32, 64, 128, 192, 256, 320]
-    actual_paddings = _get_token_paddings(min_token_size, max_token_size,
-                                          padding_gap)
+    actual_paddings = _get_token_paddings(min_token_size, max_token_size, padding_gap)
     assert actual_paddings == expected_paddings
 
     # Exponential padding.
     max_token_size, padding_gap = 1024, 0
     expected_paddings = [16, 32, 64, 128, 256, 512, 1024]
-    actual_paddings = _get_token_paddings(min_token_size, max_token_size,
-                                          padding_gap)
+    actual_paddings = _get_token_paddings(min_token_size, max_token_size, padding_gap)
     assert actual_paddings == expected_paddings
     # Exponential padding with max_token_size not a power of two.
     max_token_size = 317
     expected_paddings = [16, 32, 64, 128, 256, 512]
-    actual_paddings = _get_token_paddings(min_token_size, max_token_size,
-                                          padding_gap)
+    actual_paddings = _get_token_paddings(min_token_size, max_token_size, padding_gap)
     assert actual_paddings == expected_paddings
 
 
@@ -350,32 +354,31 @@ def test_get_req_paddings():
     assert _get_req_paddings(8, 36) == [8, 16, 32, 36]
 
 
-def test_init_kv_cache_with_kv_sharing_invalid_target_layer_order(
-        model_runner):
+def test_init_kv_cache_with_kv_sharing_invalid_target_layer_order(model_runner):
     layer_0 = "model.layers.0.self_attn.attn"
     layer_1 = "model.layers.1.self_attn.attn"
     error_msg = f"{layer_1} must come before the current layer"
     vllm_config = model_runner.vllm_config
-    with pytest.raises(ValueError, match=error_msg), \
-        set_current_vllm_config(vllm_config):
+    with (
+        pytest.raises(ValueError, match=error_msg),
+        set_current_vllm_config(vllm_config),
+    ):
         fwd_context = {
             # initialization below will fail because target layer is invalid;
             # the target layer needs to come before layer 1
-            layer_0:
-            Attention(
+            layer_0: Attention(
                 num_heads=8,
                 head_size=128,
                 scale=1.0,
                 prefix=layer_0,
                 kv_sharing_target_layer_name=layer_1,
             ),
-            layer_1:
-            Attention(
+            layer_1: Attention(
                 num_heads=8,
                 head_size=128,
                 scale=1.0,
                 prefix=layer_1,
-            )
+            ),
         }
         # suppress var not used error
         assert fwd_context is not None
@@ -387,25 +390,25 @@ def test_init_kv_cache_with_kv_sharing_target_layer_not_exist(model_runner):
     invalid_layer = "model.layers.0.cross_attn.attn"
     error_msg = f"{invalid_layer} is not a valid Attention layer in the model"
     vllm_config = model_runner.vllm_config
-    with pytest.raises(ValueError, match=error_msg), \
-        set_current_vllm_config(vllm_config):
+    with (
+        pytest.raises(ValueError, match=error_msg),
+        set_current_vllm_config(vllm_config),
+    ):
         fwd_context = {
-            layer_0:
-            Attention(
+            layer_0: Attention(
                 num_heads=8,
                 head_size=128,
                 scale=1.0,
                 prefix=layer_0,
             ),
-            layer_1:
-            Attention(
+            layer_1: Attention(
                 num_heads=8,
                 head_size=128,
                 scale=1.0,
                 prefix=layer_1,
                 # invalid layer: cross_attn.atn doesn't exist!
                 kv_sharing_target_layer_name=invalid_layer,
-            )
+            ),
         }
         # suppress var not used error
         assert fwd_context is not None
@@ -416,26 +419,26 @@ def test_init_kv_cache_with_kv_sharing_target_same_as_current(model_runner):
     layer_1 = "model.layers.1.self_attn.attn"
     error_msg = f"{layer_1} cannot be the same as the current layer"
     vllm_config = model_runner.vllm_config
-    with pytest.raises(ValueError, match=error_msg), \
-        set_current_vllm_config(vllm_config):
+    with (
+        pytest.raises(ValueError, match=error_msg),
+        set_current_vllm_config(vllm_config),
+    ):
         fwd_context = {
             # initialization below will fail because target layer is invalid;
             # the target layer needs to come before layer 1
-            layer_0:
-            Attention(
+            layer_0: Attention(
                 num_heads=8,
                 head_size=128,
                 scale=1.0,
                 prefix=layer_0,
             ),
-            layer_1:
-            Attention(
+            layer_1: Attention(
                 num_heads=8,
                 head_size=128,
                 scale=1.0,
                 prefix=layer_1,
                 kv_sharing_target_layer_name=layer_1,
-            )
+            ),
         }
         # suppress var not used error
         assert fwd_context is not None
@@ -447,20 +450,18 @@ def test_init_kv_cache_without_kv_sharing():
     vllm_config = get_vllm_config()
     with set_current_vllm_config(vllm_config):
         fwd_context = {
-            layer_0:
-            Attention(
+            layer_0: Attention(
                 num_heads=8,
                 head_size=128,
                 scale=1.0,
                 prefix=layer_0,
             ),
-            layer_1:
-            Attention(
+            layer_1: Attention(
                 num_heads=8,
                 head_size=128,
                 scale=1.0,
                 prefix=layer_1,
-            )
+            ),
         }
         # suppress var not used error
         assert fwd_context is not None
@@ -475,17 +476,17 @@ def test_init_kv_cache_without_kv_sharing():
     available_memory = 20 * GiB_bytes
     # page size for each layer KV can be calculated as
     # 2 (non-MLA) * 8 (num_heads) * 128 (head_dim)
-    # * 2 (bfloat16, kv_cache dtype) * 128 (block_size) = 512KB
+    # * 2 (bfloat16, kv_cache dtype) * 128 (block_size) = 512KB
     num_expected_blocks = 20480  # 20GB / 512KB / 2 (num layers)
-    kv_cache_config = get_kv_cache_configs(vllm_config, [kv_cache_spec],
-                                           [available_memory])[0]
+    kv_cache_config = get_kv_cache_configs(
+        vllm_config, [kv_cache_spec], [available_memory]
+    )[0]
     assert kv_cache_config.num_blocks == num_expected_blocks
     assert len(kv_cache_config.kv_cache_tensors) == 2
     assert kv_cache_config.kv_cache_tensors[0].size == available_memory // 2
     assert kv_cache_config.kv_cache_tensors[1].size == available_memory // 2
 
-    max_context_len =\
-        estimate_max_model_len(vllm_config, kv_cache_spec, 5 * GiB_bytes)
+    max_context_len = estimate_max_model_len(vllm_config, kv_cache_spec, 5 * GiB_bytes)
     # max context len with KV sharing should be 2x as large as without
     # max_context_len = available_memory / (page_size / block_size) / num_caches
     # max_context_len = 5GB / (512KB / 128) / 2 = 655360
@@ -495,8 +496,9 @@ def test_init_kv_cache_without_kv_sharing():
     # this will only allocate 2 block worth of memory (2 * 512kb)
     kv_cache_config.num_blocks = 1
     for kv_cache_tensor in kv_cache_config.kv_cache_tensors:
-        kv_cache_tensor.size = (
-            kv_cache_spec[kv_cache_tensor.shared_by[0]].page_size_bytes)
+        kv_cache_tensor.size = kv_cache_spec[
+            kv_cache_tensor.shared_by[0]
+        ].page_size_bytes
 
     model_runner.initialize_kv_cache(kv_cache_config)
 
@@ -518,21 +520,19 @@ def test_init_kv_cache_with_kv_sharing_valid():
     vllm_config = get_vllm_config()
     with set_current_vllm_config(vllm_config):
         fwd_context = {
-            layer_0:
-            Attention(
+            layer_0: Attention(
                 num_heads=8,
                 head_size=128,
                 scale=1.0,
                 prefix=layer_0,
             ),
-            layer_1:
-            Attention(
+            layer_1: Attention(
                 num_heads=8,
                 head_size=128,
                 scale=1.0,
                 prefix=layer_1,
                 kv_sharing_target_layer_name="model.layers.0.self_attn.attn",
-            )
+            ),
         }
         # suppress var not used error
         assert fwd_context is not None
@@ -550,24 +550,23 @@ def test_init_kv_cache_with_kv_sharing_valid():
     # with KV sharing, we can allocate (available_mem//page_size//1) blocks
     # which is twice as many as without KV sharing
     num_expected_blocks = 2 * 20480  # 20GB / 512KB
-    kv_cache_config = get_kv_cache_configs(vllm_config, [kv_cache_spec],
-                                           [available_memory])[0]
+    kv_cache_config = get_kv_cache_configs(
+        vllm_config, [kv_cache_spec], [available_memory]
+    )[0]
     assert kv_cache_config.num_blocks == num_expected_blocks
     assert len(kv_cache_config.kv_cache_tensors) == 1
     # Each layer now has twice the available memory for KV cache
     # compared to no KV sharing
     assert kv_cache_config.kv_cache_tensors[0].size == available_memory
 
-    max_context_len =\
-        estimate_max_model_len(vllm_config, kv_cache_spec, 5 * GiB_bytes)
+    max_context_len = estimate_max_model_len(vllm_config, kv_cache_spec, 5 * GiB_bytes)
     # max context len with KV sharing should be 2x as large as without
     assert max_context_len == (2 * 655360)
 
     # important: override tensor size to prevent large mem alloc during test
     # this will only allocate 1 block worth of memory (512kb)
     kv_cache_config.num_blocks = 1
-    kv_cache_config.kv_cache_tensors[0].size =\
-        kv_cache_spec[layer_0].page_size_bytes
+    kv_cache_config.kv_cache_tensors[0].size = kv_cache_spec[layer_0].page_size_bytes
 
     model_runner.initialize_kv_cache(kv_cache_config)
 
diff --git a/tests/v1/tracing/test_tracing.py b/tests/v1/tracing/test_tracing.py
index da8655f95e19..e7767aceec55 100644
--- a/tests/v1/tracing/test_tracing.py
+++ b/tests/v1/tracing/test_tracing.py
@@ -12,20 +12,23 @@
 import grpc
 import pytest
 from opentelemetry.proto.collector.trace.v1.trace_service_pb2 import (
-    ExportTraceServiceResponse)
+    ExportTraceServiceResponse,
+)
 from opentelemetry.proto.collector.trace.v1.trace_service_pb2_grpc import (
-    TraceServiceServicer, add_TraceServiceServicer_to_server)
+    TraceServiceServicer,
+    add_TraceServiceServicer_to_server,
+)
 from opentelemetry.proto.common.v1.common_pb2 import AnyValue, KeyValue
-from opentelemetry.sdk.environment_variables import (
-    OTEL_EXPORTER_OTLP_TRACES_INSECURE)
+from opentelemetry.sdk.environment_variables import OTEL_EXPORTER_OTLP_TRACES_INSECURE
 
 from vllm import LLM, SamplingParams
 from vllm.tracing import SpanAttributes
 
 FAKE_TRACE_SERVER_ADDRESS = "localhost:4317"
 
-FieldName = Literal['bool_value', 'string_value', 'int_value', 'double_value',
-                    'array_value']
+FieldName = Literal[
+    "bool_value", "string_value", "int_value", "double_value", "array_value"
+]
 
 
 def decode_value(value: AnyValue):
@@ -34,8 +37,9 @@ def decode_value(value: AnyValue):
         "string_value": (lambda v: v.string_value),
         "int_value": (lambda v: v.int_value),
         "double_value": (lambda v: v.double_value),
-        "array_value":
-        (lambda v: [decode_value(item) for item in v.array_value.values]),
+        "array_value": (
+            lambda v: [decode_value(item) for item in v.array_value.values]
+        ),
     }
     for field, decoder in field_decoders.items():
         if value.HasField(field):
@@ -48,7 +52,6 @@ def decode_attributes(attributes: Iterable[KeyValue]):
 
 
 class FakeTraceService(TraceServiceServicer):
-
     def __init__(self):
         self.request = None
         self.evt = threading.Event()
@@ -86,10 +89,12 @@ def test_traces(
             max_tokens=256,
         )
         model = "facebook/opt-125m"
-        llm = LLM(model=model,
-                  otlp_traces_endpoint=FAKE_TRACE_SERVER_ADDRESS,
-                  gpu_memory_utilization=0.3,
-                  disable_log_stats=False)
+        llm = LLM(
+            model=model,
+            otlp_traces_endpoint=FAKE_TRACE_SERVER_ADDRESS,
+            gpu_memory_utilization=0.3,
+            disable_log_stats=False,
+        )
         prompts = ["This is a short prompt"]
         outputs = llm.generate(prompts, sampling_params=sampling_params)
         print(f"test_traces outputs is : {outputs}")
@@ -98,40 +103,48 @@ def test_traces(
         if not trace_service.evt.wait(timeout):
             raise TimeoutError(
                 f"The fake trace service didn't receive a trace within "
-                f"the {timeout} seconds timeout")
+                f"the {timeout} seconds timeout"
+            )
 
         request = trace_service.request
         assert len(request.resource_spans) == 1, (
-            f"Expected 1 resource span, "
-            f"but got {len(request.resource_spans)}")
+            f"Expected 1 resource span, but got {len(request.resource_spans)}"
+        )
         assert len(request.resource_spans[0].scope_spans) == 1, (
             f"Expected 1 scope span, "
-            f"but got {len(request.resource_spans[0].scope_spans)}")
+            f"but got {len(request.resource_spans[0].scope_spans)}"
+        )
         assert len(request.resource_spans[0].scope_spans[0].spans) == 1, (
             f"Expected 1 span, "
-            f"but got {len(request.resource_spans[0].scope_spans[0].spans)}")
+            f"but got {len(request.resource_spans[0].scope_spans[0].spans)}"
+        )
 
         attributes = decode_attributes(
-            request.resource_spans[0].scope_spans[0].spans[0].attributes)
+            request.resource_spans[0].scope_spans[0].spans[0].attributes
+        )
         # assert attributes.get(SpanAttributes.GEN_AI_RESPONSE_MODEL) == model
-        assert attributes.get(
-            SpanAttributes.GEN_AI_REQUEST_ID) == outputs[0].request_id
-        assert attributes.get(SpanAttributes.GEN_AI_REQUEST_TEMPERATURE
-                              ) == sampling_params.temperature
-        assert attributes.get(
-            SpanAttributes.GEN_AI_REQUEST_TOP_P) == sampling_params.top_p
-        assert attributes.get(SpanAttributes.GEN_AI_REQUEST_MAX_TOKENS
-                              ) == sampling_params.max_tokens
-        assert attributes.get(
-            SpanAttributes.GEN_AI_REQUEST_N) == sampling_params.n
-        assert attributes.get(
-            SpanAttributes.GEN_AI_USAGE_PROMPT_TOKENS) == len(
-                outputs[0].prompt_token_ids)
+        assert attributes.get(SpanAttributes.GEN_AI_REQUEST_ID) == outputs[0].request_id
+        assert (
+            attributes.get(SpanAttributes.GEN_AI_REQUEST_TEMPERATURE)
+            == sampling_params.temperature
+        )
+        assert (
+            attributes.get(SpanAttributes.GEN_AI_REQUEST_TOP_P) == sampling_params.top_p
+        )
+        assert (
+            attributes.get(SpanAttributes.GEN_AI_REQUEST_MAX_TOKENS)
+            == sampling_params.max_tokens
+        )
+        assert attributes.get(SpanAttributes.GEN_AI_REQUEST_N) == sampling_params.n
+        assert attributes.get(SpanAttributes.GEN_AI_USAGE_PROMPT_TOKENS) == len(
+            outputs[0].prompt_token_ids
+        )
         completion_tokens = sum(len(o.token_ids) for o in outputs[0].outputs)
-        assert attributes.get(
-            SpanAttributes.GEN_AI_USAGE_COMPLETION_TOKENS) == completion_tokens
+        assert (
+            attributes.get(SpanAttributes.GEN_AI_USAGE_COMPLETION_TOKENS)
+            == completion_tokens
+        )
 
         assert attributes.get(SpanAttributes.GEN_AI_LATENCY_TIME_IN_QUEUE) > 0
-        assert attributes.get(
-            SpanAttributes.GEN_AI_LATENCY_TIME_TO_FIRST_TOKEN) > 0
+        assert attributes.get(SpanAttributes.GEN_AI_LATENCY_TIME_TO_FIRST_TOKEN) > 0
         assert attributes.get(SpanAttributes.GEN_AI_LATENCY_E2E) > 0
diff --git a/tests/v1/utils.py b/tests/v1/utils.py
index b3f560c11e8f..993ad8a947d0 100644
--- a/tests/v1/utils.py
+++ b/tests/v1/utils.py
@@ -9,10 +9,9 @@
 # Prometheus metrics utilities for testing
 
 
-def get_prometheus_metrics(
-        server: RemoteOpenAIServer) -> dict[str, dict[str, float]]:
+def get_prometheus_metrics(server: RemoteOpenAIServer) -> dict[str, dict[str, float]]:
     """Fetch and parse Prometheus metrics from the /metrics endpoint.
-    
+
     Returns:
         Dict mapping metric names to their values grouped by labels.
         For example: {"vllm:request_success": {
@@ -27,14 +26,14 @@ def get_prometheus_metrics(
 
         # Regex patterns for Prometheus metrics
         metric_with_labels = re.compile(
-            r'^([a-zA-Z_:][a-zA-Z0-9_:]*)\{([^}]*)\}\s+([\d\.\-\+e]+)$')
-        metric_simple = re.compile(
-            r'^([a-zA-Z_:][a-zA-Z0-9_:]*)\s+([\d\.\-\+e]+)$')
+            r"^([a-zA-Z_:][a-zA-Z0-9_:]*)\{([^}]*)\}\s+([\d\.\-\+e]+)$"
+        )
+        metric_simple = re.compile(r"^([a-zA-Z_:][a-zA-Z0-9_:]*)\s+([\d\.\-\+e]+)$")
 
-        for line in response.text.split('\n'):
+        for line in response.text.split("\n"):
             line = line.strip()
             # Skip comments and empty lines
-            if not line or line.startswith('#'):
+            if not line or line.startswith("#"):
                 continue
 
             # Try to match metric with labels first
@@ -45,7 +44,7 @@ def get_prometheus_metrics(
                     value = float(value_str)
                     if metric_name not in metrics:
                         metrics[metric_name] = {}
-                    metrics[metric_name][f'{{{labels_part}}}'] = value
+                    metrics[metric_name][f"{{{labels_part}}}"] = value
                 except ValueError:
                     continue
             else:
@@ -57,7 +56,7 @@ def get_prometheus_metrics(
                         value = float(value_str)
                         if metric_name not in metrics:
                             metrics[metric_name] = {}
-                        metrics[metric_name][''] = value
+                        metrics[metric_name][""] = value
                     except ValueError:
                         continue
 
@@ -67,10 +66,9 @@ def get_prometheus_metrics(
         return {}
 
 
-def get_engine_request_counts(
-        metrics: dict[str, dict[str, float]]) -> dict[str, float]:
+def get_engine_request_counts(metrics: dict[str, dict[str, float]]) -> dict[str, float]:
     """Extract request counts per engine from Prometheus metrics.
-    
+
     Returns:
         Dict mapping engine indices to request counts.
         For example: {"0": 15.0, "1": 12.0}
@@ -95,7 +93,7 @@ def get_engine_request_counts(
 
 def check_request_balancing(server: RemoteOpenAIServer, dp_size: int):
     """Check request balancing via Prometheus metrics if dp_size > 1.
-    
+
     Args:
         server: The RemoteOpenAIServer instance
         dp_size: Number of data parallel ranks
@@ -114,7 +112,8 @@ def check_request_balancing(server: RemoteOpenAIServer, dp_size: int):
     assert len(engines_with_requests) == dp_size, (
         f"Expected requests to be distributed across multiple engines,"
         f" but only engine(s) {engines_with_requests} received "
-        f"requests. Engine counts: {engine_counts}")
+        f"requests. Engine counts: {engine_counts}"
+    )
 
     # Verify that the load is reasonably balanced
     # (no engine should handle all requests)
@@ -122,4 +121,5 @@ def check_request_balancing(server: RemoteOpenAIServer, dp_size: int):
 
     for count in engine_counts.values():
         assert count > total_requests // (dp_size + 1), (
-            f"requests are imbalanced: {engine_counts}")
+            f"requests are imbalanced: {engine_counts}"
+        )
diff --git a/tests/v1/worker/test_gpu_input_batch.py b/tests/v1/worker/test_gpu_input_batch.py
index 98700ff73fd1..c834577f1adb 100644
--- a/tests/v1/worker/test_gpu_input_batch.py
+++ b/tests/v1/worker/test_gpu_input_batch.py
@@ -29,14 +29,11 @@
 MAX_NUM_PROMPT_TOKENS = 64
 
 
-def _compare_objs(obj1,
-                  obj2,
-                  skip: Sequence = ("logitsprocs", "batch_update_builder")):
+def _compare_objs(obj1, obj2, skip: Sequence = ("logitsprocs", "batch_update_builder")):
     attrs = inspect.getmembers(obj1, lambda a: not (inspect.isroutine(a)))
-    attr_names = set([
-        a[0] for a in attrs
-        if not (a[0].startswith('__') and a[0].endswith('__'))
-    ])
+    attr_names = set(
+        [a[0] for a in attrs if not (a[0].startswith("__") and a[0].endswith("__"))]
+    )
     for attr_name in attr_names:
         if attr_name in skip:
             continue
@@ -47,7 +44,7 @@ def _compare_objs(obj1,
         is_same = False
         if isinstance(a, torch.Tensor):
             if a.numel() == 0 or b.numel() == 0:
-                is_same = (a.numel() == 0 and b.numel() == 0)
+                is_same = a.numel() == 0 and b.numel() == 0
             elif torch.allclose(a, b):
                 is_same = True
         elif isinstance(a, np.ndarray):
@@ -64,12 +61,14 @@ def _compare_objs(obj1,
             is_same = True
         elif isinstance(a, CpuGpuBuffer):
             is_same = np.allclose(a.np, b.np) and torch.allclose(a.gpu, b.gpu)
-        assert is_same, f"Attribute {attr_name} is different"\
-            f" in {obj1} and {obj2}: {a} != {b}"
+        assert is_same, (
+            f"Attribute {attr_name} is different in {obj1} and {obj2}: {a} != {b}"
+        )
 
 
-def _remove_requests(input_batch: InputBatch, batch_size: int,
-                     reqs: list[CachedRequestState]) -> set[str]:
+def _remove_requests(
+    input_batch: InputBatch, batch_size: int, reqs: list[CachedRequestState]
+) -> set[str]:
     """
     Remove some requests randomly from the batch and returns
     set of request removed
@@ -109,10 +108,9 @@ def _construct_expected_sampling_metadata(
     temperature = [0.0 for _ in range(num_reqs)]
     min_tokens = {}
     logit_bias = [None] * num_reqs
-    allowed_token_ids_mask = torch.zeros(num_reqs,
-                                         VOCAB_SIZE,
-                                         dtype=torch.bool,
-                                         device=device)
+    allowed_token_ids_mask = torch.zeros(
+        num_reqs, VOCAB_SIZE, dtype=torch.bool, device=device
+    )
     bad_words_token_ids = {}
     for req in reqs:
         if req.req_id not in req_ids_retained:
@@ -120,35 +118,40 @@ def _construct_expected_sampling_metadata(
         index_in_input_batch = req_id_index_in_input_batch[req.req_id]
         output_token_ids[index_in_input_batch] = req.output_token_ids
         prompt_token_ids[index_in_input_batch] = req.prompt_token_ids
-        presence_penalties[
-            index_in_input_batch] = req.sampling_params.presence_penalty
+        presence_penalties[index_in_input_batch] = req.sampling_params.presence_penalty
         frequency_penalties[index_in_input_batch] = (
-            req.sampling_params.frequency_penalty)
+            req.sampling_params.frequency_penalty
+        )
         repetition_penalties[index_in_input_batch] = (
-            req.sampling_params.repetition_penalty)
+            req.sampling_params.repetition_penalty
+        )
         top_k[index_in_input_batch] = req.sampling_params.top_k
         top_p[index_in_input_batch] = req.sampling_params.top_p
         temperature[index_in_input_batch] = req.sampling_params.temperature
         min_tokens[index_in_input_batch] = (
             req.sampling_params.min_tokens,
-            req.sampling_params.all_stop_token_ids)
+            req.sampling_params.all_stop_token_ids,
+        )
         logit_bias[index_in_input_batch] = req.sampling_params.logit_bias
         if req.sampling_params.allowed_token_ids:
             allowed_token_ids_mask[index_in_input_batch][
-                req.sampling_params.allowed_token_ids] = True
+                req.sampling_params.allowed_token_ids
+            ] = True
         if req.sampling_params.bad_words_token_ids:
-            bad_words_token_ids[
-                index_in_input_batch] = req.sampling_params.bad_words_token_ids
+            bad_words_token_ids[index_in_input_batch] = (
+                req.sampling_params.bad_words_token_ids
+            )
 
     return SamplingMetadata(
-        temperature=torch.tensor(temperature, dtype=torch.float,
-                                 device=device),
+        temperature=torch.tensor(temperature, dtype=torch.float, device=device),
         all_greedy=False,
         all_random=True,
-        top_p=None if all(x == 1.0 for x in top_p) else torch.tensor(
-            top_p, dtype=torch.float, device=device),
-        top_k=None if all(x == 0 for x in top_k) else torch.tensor(
-            top_k, dtype=torch.int, device=device),
+        top_p=None
+        if all(x == 1.0 for x in top_p)
+        else torch.tensor(top_p, dtype=torch.float, device=device),
+        top_k=None
+        if all(x == 0 for x in top_k)
+        else torch.tensor(top_k, dtype=torch.int, device=device),
         generators={},
         max_num_logprobs=0,
         prompt_token_ids=make_tensor_with_pad(
@@ -157,19 +160,21 @@ def _construct_expected_sampling_metadata(
             device=torch.device(device),
             dtype=torch.int64,
         ),
-        frequency_penalties=torch.tensor(frequency_penalties,
-                                         dtype=torch.float,
-                                         device=device),
-        presence_penalties=torch.tensor(presence_penalties,
-                                        dtype=torch.float,
-                                        device=device),
-        repetition_penalties=torch.tensor(repetition_penalties,
-                                          dtype=torch.float,
-                                          device=device),
+        frequency_penalties=torch.tensor(
+            frequency_penalties, dtype=torch.float, device=device
+        ),
+        presence_penalties=torch.tensor(
+            presence_penalties, dtype=torch.float, device=device
+        ),
+        repetition_penalties=torch.tensor(
+            repetition_penalties, dtype=torch.float, device=device
+        ),
         output_token_ids=output_token_ids,
-        no_penalties=(all(x == 0 for x in presence_penalties)
-                      and all(x == 0 for x in frequency_penalties)
-                      and all(x == 1 for x in repetition_penalties)),
+        no_penalties=(
+            all(x == 0 for x in presence_penalties)
+            and all(x == 0 for x in frequency_penalties)
+            and all(x == 1 for x in repetition_penalties)
+        ),
         allowed_token_ids_mask=allowed_token_ids_mask,
         bad_words_token_ids=bad_words_token_ids,
         logitsprocs=LogitsProcessors(),
@@ -185,8 +190,7 @@ def _create_sampling_params():
         frequency_penalty=np.random.uniform(-2.0, 2.0),
         min_tokens=np.random.randint(1, 10),
         stop_token_ids=[
-            np.random.randint(0, VOCAB_SIZE)
-            for _ in range(np.random.randint(10))
+            np.random.randint(0, VOCAB_SIZE) for _ in range(np.random.randint(10))
         ],
         logit_bias={0: np.random.uniform(-3.0, 3.0)},
     )
@@ -207,7 +211,7 @@ def _construct_cached_request_state(req_id_suffix: int):
         sampling_params=_create_sampling_params(),
         pooling_params=None,
         mm_features=[],
-        block_ids=([], ),
+        block_ids=([],),
         generator=None,
         num_computed_tokens=len(output_token_ids),
         output_token_ids=output_token_ids,
@@ -262,19 +266,18 @@ def test_sampling_metadata_in_input_batch(device: str, batch_size: int):
 
     # Create expected output.
     expected_sampling_metadata = _construct_expected_sampling_metadata(
-        reqs,
-        req_ids_retained,
-        input_batch.req_id_to_index,
-        device=torch.device(device))
+        reqs, req_ids_retained, input_batch.req_id_to_index, device=torch.device(device)
+    )
 
     def same(t1: Optional[torch.Tensor], t2: Optional[torch.Tensor]) -> bool:
-        return (t1 is None
-                and t2 is None) or (t1 is not None and t2 is not None
-                                    and torch.allclose(t1, t2))
+        return (t1 is None and t2 is None) or (
+            t1 is not None and t2 is not None and torch.allclose(t1, t2)
+        )
 
     # Assert the actual and expected output.
-    assert torch.allclose(expected_sampling_metadata.temperature,
-                          sampling_metadata.temperature)
+    assert torch.allclose(
+        expected_sampling_metadata.temperature, sampling_metadata.temperature
+    )
     assert same(expected_sampling_metadata.top_p, sampling_metadata.top_p)
     assert same(expected_sampling_metadata.top_k, sampling_metadata.top_k)
     assert torch.allclose(
@@ -289,25 +292,29 @@ def same(t1: Optional[torch.Tensor], t2: Optional[torch.Tensor]) -> bool:
         expected_sampling_metadata.repetition_penalties,
         sampling_metadata.repetition_penalties,
     )
-    assert torch.allclose(expected_sampling_metadata.prompt_token_ids,
-                          sampling_metadata.prompt_token_ids)
-    assert (expected_sampling_metadata.output_token_ids ==
-            sampling_metadata.output_token_ids)
-    assert expected_sampling_metadata.no_penalties == \
-           sampling_metadata.no_penalties
+    assert torch.allclose(
+        expected_sampling_metadata.prompt_token_ids, sampling_metadata.prompt_token_ids
+    )
+    assert (
+        expected_sampling_metadata.output_token_ids
+        == sampling_metadata.output_token_ids
+    )
+    assert expected_sampling_metadata.no_penalties == sampling_metadata.no_penalties
     if sampling_metadata.allowed_token_ids_mask:
         assert torch.allclose(
             expected_sampling_metadata.allowed_token_ids_mask,
-            sampling_metadata.allowed_token_ids_mask)
-    assert expected_sampling_metadata.bad_words_token_ids == \
-        sampling_metadata.bad_words_token_ids
+            sampling_metadata.allowed_token_ids_mask,
+        )
+    assert (
+        expected_sampling_metadata.bad_words_token_ids
+        == sampling_metadata.bad_words_token_ids
+    )
 
 
 @pytest.mark.parametrize("device", CUDA_DEVICES)
 @pytest.mark.parametrize("batch_size", [32])
-@pytest.mark.parametrize("swap_list", [((0, 1), )])
-def test_swap_states_in_input_batch(device: str, batch_size: int,
-                                    swap_list: list):
+@pytest.mark.parametrize("swap_list", [((0, 1),)])
+def test_swap_states_in_input_batch(device: str, batch_size: int, swap_list: list):
     """
     Tests the logic for managing sampling metadata in the InputBatch.
 
@@ -352,8 +359,10 @@ def test_swap_states_in_input_batch(device: str, batch_size: int,
 
     reordered_reqs = reqs.copy()
     for swap_pair in swap_list:
-        reordered_reqs[swap_pair[0]], reordered_reqs[swap_pair[1]] = \
-            reordered_reqs[swap_pair[1]], reordered_reqs[swap_pair[0]]
+        reordered_reqs[swap_pair[0]], reordered_reqs[swap_pair[1]] = (
+            reordered_reqs[swap_pair[1]],
+            reordered_reqs[swap_pair[0]],
+        )
         input_batch.swap_states(swap_pair[0], swap_pair[1])
 
     for req_index in range(batch_size):
diff --git a/tests/v1/worker/test_gpu_model_runner.py b/tests/v1/worker/test_gpu_model_runner.py
index 23d7ce4cefa3..ef2956bd3ec2 100644
--- a/tests/v1/worker/test_gpu_model_runner.py
+++ b/tests/v1/worker/test_gpu_model_runner.py
@@ -6,20 +6,30 @@
 import torch
 
 from vllm.attention import Attention
-from vllm.config import (CacheConfig, ModelConfig, ParallelConfig,
-                         SchedulerConfig, VllmConfig, set_current_vllm_config)
-from vllm.distributed.parallel_state import (init_distributed_environment,
-                                             initialize_model_parallel)
+from vllm.config import (
+    CacheConfig,
+    ModelConfig,
+    ParallelConfig,
+    SchedulerConfig,
+    VllmConfig,
+    set_current_vllm_config,
+)
+from vllm.distributed.parallel_state import (
+    init_distributed_environment,
+    initialize_model_parallel,
+)
 from vllm.model_executor.layers.mamba.mamba_mixer2 import MambaMixer2
 from vllm.platforms import current_platform
 from vllm.sampling_params import SamplingParams
 from vllm.utils import GiB_bytes, update_environment_variables
-from vllm.v1.core.kv_cache_utils import (estimate_max_model_len,
-                                         get_kv_cache_configs)
-from vllm.v1.core.sched.output import (CachedRequestData, NewRequestData,
-                                       SchedulerOutput)
-from vllm.v1.kv_cache_interface import (FullAttentionSpec, KVCacheConfig,
-                                        KVCacheGroupSpec, KVCacheTensor)
+from vllm.v1.core.kv_cache_utils import estimate_max_model_len, get_kv_cache_configs
+from vllm.v1.core.sched.output import CachedRequestData, NewRequestData, SchedulerOutput
+from vllm.v1.kv_cache_interface import (
+    FullAttentionSpec,
+    KVCacheConfig,
+    KVCacheGroupSpec,
+    KVCacheTensor,
+)
 from vllm.v1.sample.metadata import SamplingMetadata
 from vllm.v1.worker.gpu_input_batch import InputBatch
 from vllm.v1.worker.gpu_model_runner import GPUModelRunner
@@ -35,8 +45,7 @@ def initialize_kv_cache(runner: GPUModelRunner):
     """
     attn_spec = FullAttentionSpec(
         block_size=BLOCK_SIZE,
-        num_kv_heads=runner.model_config.get_num_kv_heads(
-            runner.parallel_config),
+        num_kv_heads=runner.model_config.get_num_kv_heads(runner.parallel_config),
         head_size=runner.model_config.get_head_size(),
         dtype=runner.kv_cache_dtype,
     )
@@ -58,9 +67,7 @@ def initialize_kv_cache(runner: GPUModelRunner):
         device=runner.device,
         pin_memory=runner.pin_memory,
         vocab_size=runner.model_config.get_vocab_size(),
-        block_sizes=[
-            kv_cache_config.kv_cache_groups[0].kv_cache_spec.block_size
-        ],
+        block_sizes=[kv_cache_config.kv_cache_groups[0].kv_cache_spec.block_size],
     )
     runner.initialize_attn_backend(kv_cache_config)
 
@@ -98,8 +105,9 @@ def model_runner():
     model_config = vllm_config.model_config
     num_heads = model_config.get_num_kv_heads(vllm_config.parallel_config)
     head_size = model_config.get_head_size()
-    vllm_config.compilation_config.static_forward_context[
-        "layer.0"] = Attention(num_heads, head_size, 0.1)
+    vllm_config.compilation_config.static_forward_context["layer.0"] = Attention(
+        num_heads, head_size, 0.1
+    )
     runner = GPUModelRunner(vllm_config, DEVICE)
     initialize_kv_cache(runner)
     return runner
@@ -120,10 +128,11 @@ def _schedule_new_request(*req_ids: str) -> SchedulerOutput:
                 mm_features=[],
                 sampling_params=SamplingParams(),
                 pooling_params=None,
-                block_ids=([0], ),
+                block_ids=([0],),
                 num_computed_tokens=0,
                 lora_request=None,
-            ))
+            )
+        )
         num_scheduled_tokens[req_id] = 3
         total_num_scheduled_tokens += num_scheduled_tokens[req_id]
 
@@ -150,22 +159,22 @@ def _is_req_added(model_runner, req_id: str) -> bool:
     return req_id in model_runner.requests
 
 
-def _is_sampling_metadata_changed(model_runner,
-                                  sampling_metadata_before: SamplingMetadata):
-    return model_runner.input_batch.sampling_metadata is not (
-        sampling_metadata_before)
+def _is_sampling_metadata_changed(
+    model_runner, sampling_metadata_before: SamplingMetadata
+):
+    return model_runner.input_batch.sampling_metadata is not (sampling_metadata_before)
 
 
 def _is_req_state_block_table_match(model_runner, req_id: str) -> bool:
     req_index = model_runner.input_batch.req_id_to_index[req_id]
     block_table = model_runner.input_batch.block_table[0]
     req_state = model_runner.requests[req_id]
-    if block_table.num_blocks_per_row[req_index] != len(
-            req_state.block_ids[0]):
+    if block_table.num_blocks_per_row[req_index] != len(req_state.block_ids[0]):
         return False
     num_blocks = block_table.num_blocks_per_row[req_index]
-    return (block_table.block_table.np[req_index, :num_blocks] ==
-            req_state.block_ids[0]).all()
+    return (
+        block_table.block_table.np[req_index, :num_blocks] == req_state.block_ids[0]
+    ).all()
 
 
 def test_update_states_new_request(model_runner, dist_init):
@@ -248,7 +257,7 @@ def test_update_states_request_resumed(model_runner, dist_init):
         req_ids=[req_id],
         resumed_from_preemption=[False],
         new_token_ids=[[]],
-        new_block_ids=([[0]], ),
+        new_block_ids=([[0]],),
         num_computed_tokens=[0],
         num_output_tokens=[0],
     )
@@ -281,46 +290,58 @@ def test_get_nans_in_logits(model_runner, dist_init):
     scheduler_output = _schedule_new_request(*req_ids)
     model_runner._update_states(scheduler_output)
 
-    logits = torch.tensor([
-        [1.0, 2.0, 3.0],
-        [3.0, 2.0, 1.0],
-    ], device=DEVICE)
+    logits = torch.tensor(
+        [
+            [1.0, 2.0, 3.0],
+            [3.0, 2.0, 1.0],
+        ],
+        device=DEVICE,
+    )
     result = model_runner._get_nans_in_logits(logits)
     assert result == {"req_0": 0, "req_1": 0}
 
-    logits = torch.tensor([
-        [1.0, float('nan'), 3.0],
-        [4.0, float('nan'), float('nan')],
-    ],
-                          device=DEVICE)
+    logits = torch.tensor(
+        [
+            [1.0, float("nan"), 3.0],
+            [4.0, float("nan"), float("nan")],
+        ],
+        device=DEVICE,
+    )
     result = model_runner._get_nans_in_logits(logits)
     assert result == {"req_0": 1, "req_1": 2}
 
-    logits = torch.tensor([
-        [1.0, 2.0, 3.0],
-        [4.0, float('nan'), float('nan')],
-    ],
-                          device=DEVICE)
+    logits = torch.tensor(
+        [
+            [1.0, 2.0, 3.0],
+            [4.0, float("nan"), float("nan")],
+        ],
+        device=DEVICE,
+    )
     result = model_runner._get_nans_in_logits(logits)
     assert result == {"req_0": 0, "req_1": 2}
 
     result = model_runner._get_nans_in_logits(logits=None)
     assert result == {"req_0": 0, "req_1": 0}
 
-    logits = torch.tensor([
-        [1.0, float('nan'), 3.0],
-    ], device=DEVICE)
+    logits = torch.tensor(
+        [
+            [1.0, float("nan"), 3.0],
+        ],
+        device=DEVICE,
+    )
     result = model_runner._get_nans_in_logits(logits)
-    assert result == {'req_0': 1, 'req_1': 0}
-
-    logits = torch.tensor([
-        [float('nan'), float('nan'), 2.0],
-        [1.0, 2.0, 3.0],
-        [float('nan'), 2.0, 3.0],
-    ],
-                          device=DEVICE)
+    assert result == {"req_0": 1, "req_1": 0}
+
+    logits = torch.tensor(
+        [
+            [float("nan"), float("nan"), 2.0],
+            [1.0, 2.0, 3.0],
+            [float("nan"), 2.0, 3.0],
+        ],
+        device=DEVICE,
+    )
     result = model_runner._get_nans_in_logits(logits)
-    assert result == {'req_0': 2, 'req_1': 0}
+    assert result == {"req_0": 2, "req_1": 0}
 
 
 def test_update_states_no_changes(model_runner, dist_init):
@@ -398,11 +419,13 @@ def test_update_states_request_unscheduled(model_runner, dist_init):
 def test_kv_cache_stride_order(monkeypatch, model_runner):
     # This test checks if GPUModelRunner initializes correctly when an attention
     # backend enforces a non-default KV cache stride order.
-    n_heads = model_runner.model_config.get_num_kv_heads(
-        model_runner.parallel_config)
+    n_heads = model_runner.model_config.get_num_kv_heads(model_runner.parallel_config)
     expected_kv_cache_shape = [
-        2, NUM_BLOCKS, BLOCK_SIZE, n_heads,
-        model_runner.model_config.get_head_size()
+        2,
+        NUM_BLOCKS,
+        BLOCK_SIZE,
+        n_heads,
+        model_runner.model_config.get_head_size(),
     ]
     # TODO mla test
     default_stride = tuple(range(5))
@@ -415,8 +438,9 @@ def rnd_stride_order(test_stride=test_stride):
         # Patch the attention backend class and re-trigger the KV cache creation
         for attn_group in model_runner._attn_group_iterator():
             attn_backend = attn_group.backend
-            monkeypatch.setattr(attn_backend, "get_kv_cache_stride_order",
-                                rnd_stride_order)
+            monkeypatch.setattr(
+                attn_backend, "get_kv_cache_stride_order", rnd_stride_order
+            )
 
         model_runner.attn_groups = []
         model_runner.kv_caches = []
@@ -448,14 +472,13 @@ def test_load_model_weights_inplace(dist_init, model_runner, model_runner_2):
     model_runner_2.update_config({"load_config": {"load_format": "dummy"}})
     model_runner_2.load_model()  # Initial model loading with dummy weights
     assert str(model_runner.get_model().state_dict()) != str(
-        model_runner_2.get_model().state_dict())
-    model_runner_2.update_config(
-        {"load_config": {
-            "load_format": original_load_format
-        }})
+        model_runner_2.get_model().state_dict()
+    )
+    model_runner_2.update_config({"load_config": {"load_format": original_load_format}})
     model_runner_2.reload_weights()  # Load real weights inplace
     assert str(model_runner.get_model().state_dict()) == str(
-        model_runner_2.get_model().state_dict())
+        model_runner_2.get_model().state_dict()
+    )
 
 
 def test_reload_weights_before_load_model(model_runner):
@@ -472,21 +495,19 @@ def test_init_kv_cache_with_kv_sharing_invalid_target_layer_order():
         fwd_context = {
             # initialization below will fail because target layer is invalid;
             # the target layer needs to come before layer 1
-            layer_0:
-            Attention(
+            layer_0: Attention(
                 num_heads=8,
                 head_size=64,
                 scale=1.0,
                 prefix=layer_0,
                 kv_sharing_target_layer_name=layer_1,
             ),
-            layer_1:
-            Attention(
+            layer_1: Attention(
                 num_heads=8,
                 head_size=64,
                 scale=1.0,
                 prefix=layer_1,
-            )
+            ),
         }
         # suppress var not used error
         assert fwd_context is not None
@@ -500,22 +521,20 @@ def test_init_kv_cache_with_kv_sharing_target_layer_not_exist():
     error_msg = f"{invalid_layer} is not a valid Attention layer in the model"
     with pytest.raises(ValueError, match=error_msg):
         fwd_context = {
-            layer_0:
-            Attention(
+            layer_0: Attention(
                 num_heads=8,
                 head_size=64,
                 scale=1.0,
                 prefix=layer_0,
             ),
-            layer_1:
-            Attention(
+            layer_1: Attention(
                 num_heads=8,
                 head_size=64,
                 scale=1.0,
                 prefix=layer_1,
                 # invalid layer: cross_attn.atn doesn't exist!
                 kv_sharing_target_layer_name=invalid_layer,
-            )
+            ),
         }
         # suppress var not used error
         assert fwd_context is not None
@@ -530,21 +549,19 @@ def test_init_kv_cache_with_kv_sharing_target_same_as_current():
         fwd_context = {
             # initialization below will fail because target layer is invalid;
             # the target layer needs to come before layer 1
-            layer_0:
-            Attention(
+            layer_0: Attention(
                 num_heads=8,
                 head_size=64,
                 scale=1.0,
                 prefix=layer_0,
             ),
-            layer_1:
-            Attention(
+            layer_1: Attention(
                 num_heads=8,
                 head_size=64,
                 scale=1.0,
                 prefix=layer_1,
                 kv_sharing_target_layer_name=layer_1,
-            )
+            ),
         }
         # suppress var not used error
         assert fwd_context is not None
@@ -557,20 +574,18 @@ def test_init_kv_cache_without_kv_sharing():
     vllm_config = get_vllm_config()
     with set_current_vllm_config(vllm_config):
         fwd_context = {
-            layer_0:
-            Attention(
+            layer_0: Attention(
                 num_heads=8,
                 head_size=64,
                 scale=1.0,
                 prefix=layer_0,
             ),
-            layer_1:
-            Attention(
+            layer_1: Attention(
                 num_heads=8,
                 head_size=64,
                 scale=1.0,
                 prefix=layer_1,
-            )
+            ),
         }
         # suppress var not used error
         assert fwd_context is not None
@@ -585,15 +600,15 @@ def test_init_kv_cache_without_kv_sharing():
     available_memory = 20 * GiB_bytes
     # page size for layer 0's kv_cache_spec is 32KB
     num_expected_blocks = 327680  # 20GB / 32KB / 2 (num layers)
-    kv_cache_config = get_kv_cache_configs(vllm_config, [kv_cache_spec],
-                                           [available_memory])[0]
+    kv_cache_config = get_kv_cache_configs(
+        vllm_config, [kv_cache_spec], [available_memory]
+    )[0]
     assert kv_cache_config.num_blocks == num_expected_blocks
     assert len(kv_cache_config.kv_cache_tensors) == 2
     assert kv_cache_config.kv_cache_tensors[0].size == available_memory // 2
     assert kv_cache_config.kv_cache_tensors[1].size == available_memory // 2
 
-    max_context_len =\
-        estimate_max_model_len(vllm_config, kv_cache_spec, 5 * GiB_bytes)
+    max_context_len = estimate_max_model_len(vllm_config, kv_cache_spec, 5 * GiB_bytes)
     # max context len with KV sharing should be 2x as large as without
     assert max_context_len == 1310720
 
@@ -601,8 +616,9 @@ def test_init_kv_cache_without_kv_sharing():
     # this will only allocate 2 block worth of memory (2 * 32kb)
     kv_cache_config.num_blocks = 1
     for kv_cache_tensor in kv_cache_config.kv_cache_tensors:
-        kv_cache_tensor.size = (
-            kv_cache_spec[kv_cache_tensor.shared_by[0]].page_size_bytes)
+        kv_cache_tensor.size = kv_cache_spec[
+            kv_cache_tensor.shared_by[0]
+        ].page_size_bytes
 
     runner.initialize_kv_cache(kv_cache_config)
 
@@ -625,21 +641,19 @@ def test_init_kv_cache_with_kv_sharing_valid():
     vllm_config = get_vllm_config()
     with set_current_vllm_config(vllm_config):
         fwd_context = {
-            layer_0:
-            Attention(
+            layer_0: Attention(
                 num_heads=8,
                 head_size=64,
                 scale=1.0,
                 prefix=layer_0,
             ),
-            layer_1:
-            Attention(
+            layer_1: Attention(
                 num_heads=8,
                 head_size=64,
                 scale=1.0,
                 prefix=layer_1,
                 kv_sharing_target_layer_name="model.layers.0.self_attn.attn",
-            )
+            ),
         }
         # suppress var not used error
         assert fwd_context is not None
@@ -657,24 +671,23 @@ def test_init_kv_cache_with_kv_sharing_valid():
     # with KV sharing, we can allocate (available_mem//page_size//1) blocks
     # which is twice as many as without KV sharing
     num_expected_blocks = 655360  # 20GB / 32KB
-    kv_cache_config = get_kv_cache_configs(vllm_config, [kv_cache_spec],
-                                           [available_memory])[0]
+    kv_cache_config = get_kv_cache_configs(
+        vllm_config, [kv_cache_spec], [available_memory]
+    )[0]
     assert kv_cache_config.num_blocks == num_expected_blocks
     assert len(kv_cache_config.kv_cache_tensors) == 1
     # Each layer now has twice the available memory for KV cache
     # compared to no KV sharing
     assert kv_cache_config.kv_cache_tensors[0].size == available_memory
 
-    max_context_len =\
-        estimate_max_model_len(vllm_config, kv_cache_spec, 5 * GiB_bytes)
+    max_context_len = estimate_max_model_len(vllm_config, kv_cache_spec, 5 * GiB_bytes)
     # max context len with KV sharing should be 2x as large as without
     assert max_context_len == 2 * 1310720
 
     # important: override tensor size to prevent large mem alloc during test
     # this will only allocate 1 block worth of memory (32kb)
     kv_cache_config.num_blocks = 1
-    kv_cache_config.kv_cache_tensors[0].size =\
-        kv_cache_spec[layer_0].page_size_bytes
+    kv_cache_config.kv_cache_tensors[0].size = kv_cache_spec[layer_0].page_size_bytes
 
     runner.initialize_kv_cache(kv_cache_config)
     kv_cache_config_after_init = runner.kv_cache_config
@@ -687,30 +700,30 @@ def test_init_kv_cache_with_kv_sharing_valid():
     # check layer 1 added to kv cache group's layer names
     assert len(kv_cache_config_after_init.kv_cache_groups) == 1
     assert len(kv_cache_config_after_init.kv_cache_groups[0].layer_names) == 2
-    assert kv_cache_config_after_init.kv_cache_groups[0].layer_names[
-        0] == layer_0
-    assert kv_cache_config_after_init.kv_cache_groups[0].layer_names[
-        1] == layer_1
+    assert kv_cache_config_after_init.kv_cache_groups[0].layer_names[0] == layer_0
+    assert kv_cache_config_after_init.kv_cache_groups[0].layer_names[1] == layer_1
 
 
 def test_hybrid_attention_mamba_tensor_shapes(monkeypatch):
-    '''
+    """
     The GPU model runner creates different views into the
     KVCacheTensors for the attention and mamba layers
     (via _reshape_kv_cache_tensors function). This test verifies
     that the views are compatible: writing a mamba block
     will not corrupt an attention block and vice versa
-    '''
+    """
 
     current_platform.seed_everything(42)
 
-    update_environment_variables({
-        'RANK': "0",
-        'LOCAL_RANK': "0",
-        'WORLD_SIZE': "1",
-        'MASTER_ADDR': 'localhost',
-        'MASTER_PORT': '12345',
-    })
+    update_environment_variables(
+        {
+            "RANK": "0",
+            "LOCAL_RANK": "0",
+            "WORLD_SIZE": "1",
+            "MASTER_ADDR": "localhost",
+            "MASTER_PORT": "12345",
+        }
+    )
     init_distributed_environment()
     initialize_model_parallel(tensor_model_parallel_size=1)
     torch.set_default_dtype(torch.float16)
@@ -751,8 +764,7 @@ def test_hybrid_attention_mamba_tensor_shapes(monkeypatch):
         fwd_context = {}
         for key in [layer_0, layer_1]:
             fwd_context[key] = Attention(
-                num_heads=model_config.get_num_attention_heads(
-                    parallel_config),
+                num_heads=model_config.get_num_attention_heads(parallel_config),
                 num_kv_heads=model_config.get_num_kv_heads(parallel_config),
                 head_size=model_config.get_head_size(),
                 scale=1.0,
@@ -760,13 +772,12 @@ def test_hybrid_attention_mamba_tensor_shapes(monkeypatch):
             )
         for key in [layer_2, layer_3, layer_4, layer_5]:
             fwd_context[key] = MambaMixer2(
-                hidden_size = hf_config.hidden_size,
-                ssm_state_size = hf_config.mamba_d_state,
-                conv_kernel_size = hf_config.mamba_d_conv,
-                intermediate_size = hf_config.mamba_expand *\
-                                    hf_config.hidden_size,
-                use_conv_bias = hf_config.mamba_conv_bias,
-                use_bias = hf_config.mamba_proj_bias,
+                hidden_size=hf_config.hidden_size,
+                ssm_state_size=hf_config.mamba_d_state,
+                conv_kernel_size=hf_config.mamba_d_conv,
+                intermediate_size=hf_config.mamba_expand * hf_config.hidden_size,
+                use_conv_bias=hf_config.mamba_conv_bias,
+                use_bias=hf_config.mamba_proj_bias,
                 n_groups=hf_config.mamba_n_groups,
                 num_heads=hf_config.mamba_n_heads,
                 head_dim=hf_config.mamba_d_head,
@@ -781,15 +792,15 @@ def test_hybrid_attention_mamba_tensor_shapes(monkeypatch):
     vllm_ctx = vllm_config.compilation_config.static_forward_context
 
     with monkeypatch.context() as m:
-
         m.setenv("VLLM_ATTENTION_BACKEND", "FLASHINFER")
 
         runner = GPUModelRunner(vllm_config, DEVICE)
         kv_cache_spec = runner.get_kv_cache_spec()
 
         available_memory = 5 * GiB_bytes
-        kv_cache_config = get_kv_cache_configs(vllm_config, [kv_cache_spec],
-                                               [available_memory])[0]
+        kv_cache_config = get_kv_cache_configs(
+            vllm_config, [kv_cache_spec], [available_memory]
+        )[0]
         runner.initialize_kv_cache(kv_cache_config)
 
         # random partition of blocks
@@ -798,7 +809,7 @@ def test_hybrid_attention_mamba_tensor_shapes(monkeypatch):
         num_blocks = kv_cache_config.num_blocks
         ind = np.arange(num_blocks)
         np.random.shuffle(ind)
-        blocks0, blocks1 = ind[:(num_blocks // 2)], ind[(num_blocks // 2):]
+        blocks0, blocks1 = ind[: (num_blocks // 2)], ind[(num_blocks // 2) :]
 
         attn_shape = vllm_ctx[layer_0].kv_cache[0].shape
         conv_shape = vllm_ctx[layer_2].kv_cache[0][0].shape
@@ -807,34 +818,40 @@ def test_hybrid_attention_mamba_tensor_shapes(monkeypatch):
         # assert we are using FlashInfer
         assert attn_shape[0] == num_blocks
 
-        attn_blocks_constant = torch.full((len(blocks0), *attn_shape[1:]),
-                                          device=DEVICE,
-                                          fill_value=3.33)
-        conv_blocks_constant = torch.full((len(blocks1), *conv_shape[1:]),
-                                          device=DEVICE,
-                                          fill_value=6.66)
-        ssm_blocks_constant = torch.full((len(blocks1), *ssm_shape[1:]),
-                                         device=DEVICE,
-                                         fill_value=9.99)
+        attn_blocks_constant = torch.full(
+            (len(blocks0), *attn_shape[1:]), device=DEVICE, fill_value=3.33
+        )
+        conv_blocks_constant = torch.full(
+            (len(blocks1), *conv_shape[1:]), device=DEVICE, fill_value=6.66
+        )
+        ssm_blocks_constant = torch.full(
+            (len(blocks1), *ssm_shape[1:]), device=DEVICE, fill_value=9.99
+        )
 
         # fill all attention blocks with constant
         for layer in [layer_0, layer_1]:
-            vllm_ctx[layer].kv_cache[0][
-                blocks0, :] = attn_blocks_constant.detach().clone()
+            vllm_ctx[layer].kv_cache[0][blocks0, :] = (
+                attn_blocks_constant.detach().clone()
+            )
 
         # fill all mamba blocks with constant
         for layer in [layer_2, layer_3, layer_4, layer_5]:
-            vllm_ctx[layer].kv_cache[0][0][
-                blocks1, :] = conv_blocks_constant.detach().clone()
-            vllm_ctx[layer].kv_cache[0][1][
-                blocks1, :] = ssm_blocks_constant.detach().clone()
+            vllm_ctx[layer].kv_cache[0][0][blocks1, :] = (
+                conv_blocks_constant.detach().clone()
+            )
+            vllm_ctx[layer].kv_cache[0][1][blocks1, :] = (
+                ssm_blocks_constant.detach().clone()
+            )
 
         # verify attention and mamba contents are correct
         for layer in [layer_0, layer_1]:
-            assert torch.equal(vllm_ctx[layer].kv_cache[0][blocks0, :],
-                               attn_blocks_constant)
+            assert torch.equal(
+                vllm_ctx[layer].kv_cache[0][blocks0, :], attn_blocks_constant
+            )
         for layer in [layer_2, layer_3, layer_4, layer_5]:
-            assert torch.equal(vllm_ctx[layer].kv_cache[0][0][blocks1, :],
-                               conv_blocks_constant)
-            assert torch.equal(vllm_ctx[layer].kv_cache[0][1][blocks1, :],
-                               ssm_blocks_constant)
+            assert torch.equal(
+                vllm_ctx[layer].kv_cache[0][0][blocks1, :], conv_blocks_constant
+            )
+            assert torch.equal(
+                vllm_ctx[layer].kv_cache[0][1][blocks1, :], ssm_blocks_constant
+            )
diff --git a/tests/v1/worker/test_utils.py b/tests/v1/worker/test_utils.py
index fd0e630ce178..f987b09e603e 100644
--- a/tests/v1/worker/test_utils.py
+++ b/tests/v1/worker/test_utils.py
@@ -10,32 +10,28 @@ def test_bind_kv_cache():
     from vllm.attention import Attention
 
     ctx = {
-        'layers.0.self_attn': Attention(32, 128, 0.1),
-        'layers.1.self_attn': Attention(32, 128, 0.1),
-        'layers.2.self_attn': Attention(32, 128, 0.1),
-        'layers.3.self_attn': Attention(32, 128, 0.1),
+        "layers.0.self_attn": Attention(32, 128, 0.1),
+        "layers.1.self_attn": Attention(32, 128, 0.1),
+        "layers.2.self_attn": Attention(32, 128, 0.1),
+        "layers.3.self_attn": Attention(32, 128, 0.1),
     }
     kv_cache = {
-        'layers.0.self_attn': torch.zeros((1, )),
-        'layers.1.self_attn': torch.zeros((1, )),
-        'layers.2.self_attn': torch.zeros((1, )),
-        'layers.3.self_attn': torch.zeros((1, )),
+        "layers.0.self_attn": torch.zeros((1,)),
+        "layers.1.self_attn": torch.zeros((1,)),
+        "layers.2.self_attn": torch.zeros((1,)),
+        "layers.3.self_attn": torch.zeros((1,)),
     }
     runner_kv_caches: list[torch.Tensor] = []
     bind_kv_cache(kv_cache, ctx, runner_kv_caches)
-    assert ctx['layers.0.self_attn'].kv_cache[0] is kv_cache[
-        'layers.0.self_attn']
-    assert ctx['layers.1.self_attn'].kv_cache[0] is kv_cache[
-        'layers.1.self_attn']
-    assert ctx['layers.2.self_attn'].kv_cache[0] is kv_cache[
-        'layers.2.self_attn']
-    assert ctx['layers.3.self_attn'].kv_cache[0] is kv_cache[
-        'layers.3.self_attn']
+    assert ctx["layers.0.self_attn"].kv_cache[0] is kv_cache["layers.0.self_attn"]
+    assert ctx["layers.1.self_attn"].kv_cache[0] is kv_cache["layers.1.self_attn"]
+    assert ctx["layers.2.self_attn"].kv_cache[0] is kv_cache["layers.2.self_attn"]
+    assert ctx["layers.3.self_attn"].kv_cache[0] is kv_cache["layers.3.self_attn"]
 
-    assert runner_kv_caches[0] is kv_cache['layers.0.self_attn']
-    assert runner_kv_caches[1] is kv_cache['layers.1.self_attn']
-    assert runner_kv_caches[2] is kv_cache['layers.2.self_attn']
-    assert runner_kv_caches[3] is kv_cache['layers.3.self_attn']
+    assert runner_kv_caches[0] is kv_cache["layers.0.self_attn"]
+    assert runner_kv_caches[1] is kv_cache["layers.1.self_attn"]
+    assert runner_kv_caches[2] is kv_cache["layers.2.self_attn"]
+    assert runner_kv_caches[3] is kv_cache["layers.3.self_attn"]
 
 
 def test_bind_kv_cache_non_attention():
@@ -43,21 +39,19 @@ def test_bind_kv_cache_non_attention():
 
     # example from Jamba PP=2
     ctx = {
-        'model.layers.20.attn': Attention(32, 128, 0.1),
-        'model.layers.28.attn': Attention(32, 128, 0.1),
+        "model.layers.20.attn": Attention(32, 128, 0.1),
+        "model.layers.28.attn": Attention(32, 128, 0.1),
     }
     kv_cache = {
-        'model.layers.20.attn': torch.zeros((1, )),
-        'model.layers.28.attn': torch.zeros((1, )),
+        "model.layers.20.attn": torch.zeros((1,)),
+        "model.layers.28.attn": torch.zeros((1,)),
     }
 
     runner_kv_caches: list[torch.Tensor] = []
     bind_kv_cache(kv_cache, ctx, runner_kv_caches)
 
-    assert ctx['model.layers.20.attn'].kv_cache[0] is kv_cache[
-        'model.layers.20.attn']
-    assert ctx['model.layers.28.attn'].kv_cache[0] is kv_cache[
-        'model.layers.28.attn']
+    assert ctx["model.layers.20.attn"].kv_cache[0] is kv_cache["model.layers.20.attn"]
+    assert ctx["model.layers.28.attn"].kv_cache[0] is kv_cache["model.layers.28.attn"]
 
-    assert runner_kv_caches[0] is kv_cache['model.layers.20.attn']
-    assert runner_kv_caches[1] is kv_cache['model.layers.28.attn']
+    assert runner_kv_caches[0] is kv_cache["model.layers.20.attn"]
+    assert runner_kv_caches[1] is kv_cache["model.layers.28.attn"]
diff --git a/tests/v1/worker/test_worker_memory_snapshot.py b/tests/v1/worker/test_worker_memory_snapshot.py
index 6faa6bcc591c..cbfb9a8dc0b6 100644
--- a/tests/v1/worker/test_worker_memory_snapshot.py
+++ b/tests/v1/worker/test_worker_memory_snapshot.py
@@ -13,8 +13,7 @@
 
 from vllm.engine.arg_utils import EngineArgs
 from vllm.utils import MemorySnapshot
-from vllm.v1.worker.gpu_worker import (Worker,
-                                       init_worker_distributed_environment)
+from vllm.v1.worker.gpu_worker import Worker, init_worker_distributed_environment
 
 # Global queue to track operation order across processes
 _QUEUE: Optional[Queue] = None
@@ -28,11 +27,11 @@ def track_operation(operation: str, rank: int):
 
 def make_operation_tracker(operation_name: str, original_func):
     """Create a mock function that tracks when an operation is called.
-    
+
     Args:
         operation_name: Name to use when tracking this operation
         original_func: The original function to wrap
-    
+
     Returns:
         A wrapper function that tracks the operation and calls the original
     """
@@ -45,8 +44,13 @@ def wrapper(*args, **kwargs):
     return wrapper
 
 
-def worker_process(rank: int, world_size: int, distributed_init_method: str,
-                   queue: Queue, error_queue: Queue):
+def worker_process(
+    rank: int,
+    world_size: int,
+    distributed_init_method: str,
+    queue: Queue,
+    error_queue: Queue,
+):
     """Worker process that initializes a GPU worker with proper tracking."""
     global _QUEUE
     _QUEUE = queue
@@ -58,9 +62,9 @@ def worker_process(rank: int, world_size: int, distributed_init_method: str,
         os.environ["WORLD_SIZE"] = str(world_size)
 
         # Create vLLM config with small model
-        vllm_config = EngineArgs(model="facebook/opt-125m",
-                                 tensor_parallel_size=2,
-                                 load_format="dummy").create_engine_config()
+        vllm_config = EngineArgs(
+            model="facebook/opt-125m", tensor_parallel_size=2, load_format="dummy"
+        ).create_engine_config()
 
         # Create worker
         worker = Worker(
@@ -77,19 +81,22 @@ def worker_process(rank: int, world_size: int, distributed_init_method: str,
 
         # Apply minimal patches to track operation order
         init_patch = patch(
-            'vllm.v1.worker.gpu_worker.init_worker_distributed_environment',
-            side_effect=make_operation_tracker("init_distributed",
-                                               original_init_worker))
+            "vllm.v1.worker.gpu_worker.init_worker_distributed_environment",
+            side_effect=make_operation_tracker(
+                "init_distributed", original_init_worker
+            ),
+        )
         memory_patch = patch.object(
-            MemorySnapshot, '__init__',
-            make_operation_tracker("memory_snapshot",
-                                   original_memory_snapshot_init))
-        all_reduce_patch = patch('torch.distributed.all_reduce',
-                                 side_effect=make_operation_tracker(
-                                     "nccl_all_reduce", original_all_reduce))
+            MemorySnapshot,
+            "__init__",
+            make_operation_tracker("memory_snapshot", original_memory_snapshot_init),
+        )
+        all_reduce_patch = patch(
+            "torch.distributed.all_reduce",
+            side_effect=make_operation_tracker("nccl_all_reduce", original_all_reduce),
+        )
 
         with init_patch, memory_patch, all_reduce_patch:
-
             # Initialize device (this is where we test the order)
             worker.init_device()
 
@@ -104,13 +111,14 @@ def worker_process(rank: int, world_size: int, distributed_init_method: str,
         raise
 
 
-@pytest.mark.skipif(torch.cuda.device_count() < 2,
-                    reason="Need at least 2 GPUs for tensor parallelism")
+@pytest.mark.skipif(
+    torch.cuda.device_count() < 2, reason="Need at least 2 GPUs for tensor parallelism"
+)
 def test_init_distributed_is_called_before_memory_snapshot():
     """Test that distributed env is setup before memory snapshot.
-    
-    This test makes sure during worker initialization, the initial memory 
-    snapshot is taken after distributed env is setup to include all the buffers 
+
+    This test makes sure during worker initialization, the initial memory
+    snapshot is taken after distributed env is setup to include all the buffers
     allocated by distributed env.
     """
     world_size = 2
@@ -127,9 +135,16 @@ def test_init_distributed_is_called_before_memory_snapshot():
     # Start worker processes
     processes = []
     for rank in range(world_size):
-        p = ctx.Process(target=worker_process,
-                        args=(rank, world_size, distributed_init_method,
-                              operation_queue, error_queue))
+        p = ctx.Process(
+            target=worker_process,
+            args=(
+                rank,
+                world_size,
+                distributed_init_method,
+                operation_queue,
+                error_queue,
+            ),
+        )
         p.start()
         processes.append(p)
 
@@ -168,7 +183,8 @@ def test_init_distributed_is_called_before_memory_snapshot():
         assert init_distributed < nccl_all_reduce < memory_snapshot, (
             f"Rank {rank}: init_distributed (index {init_distributed}) "
             f"must happen before nccl_all_reduce (index {nccl_all_reduce}) "
-            f"and memory_snapshot (index {memory_snapshot})")
+            f"and memory_snapshot (index {memory_snapshot})"
+        )
 
     # Clean up
     os.unlink(distributed_init_method.replace("file://", ""))
diff --git a/tests/vllm_test_utils/setup.py b/tests/vllm_test_utils/setup.py
index 83be8bdce85c..4cb66b556e5a 100644
--- a/tests/vllm_test_utils/setup.py
+++ b/tests/vllm_test_utils/setup.py
@@ -4,7 +4,7 @@
 from setuptools import setup
 
 setup(
-    name='vllm_test_utils',
-    version='0.1',
-    packages=['vllm_test_utils'],
+    name="vllm_test_utils",
+    version="0.1",
+    packages=["vllm_test_utils"],
 )
diff --git a/tests/vllm_test_utils/vllm_test_utils/blame.py b/tests/vllm_test_utils/vllm_test_utils/blame.py
index 49fd083ef19c..e2cab92ea22b 100644
--- a/tests/vllm_test_utils/vllm_test_utils/blame.py
+++ b/tests/vllm_test_utils/vllm_test_utils/blame.py
@@ -26,7 +26,7 @@ def blame(func: Callable) -> Generator[BlameResult, None, None]:
     ```python
     with blame(lambda: some_condition()) as result:
         # do something
-    
+
     if result.found:
         print(result.trace_stack)
     """
@@ -34,7 +34,7 @@ def blame(func: Callable) -> Generator[BlameResult, None, None]:
 
     def _trace_calls(frame, event, arg=None):
         nonlocal result
-        if event in ['call', 'return']:
+        if event in ["call", "return"]:
             # for every function call or return
             try:
                 # Temporarily disable the trace function
diff --git a/tests/vllm_test_utils/vllm_test_utils/monitor.py b/tests/vllm_test_utils/vllm_test_utils/monitor.py
index 9454221b273e..e2f1212ed554 100644
--- a/tests/vllm_test_utils/vllm_test_utils/monitor.py
+++ b/tests/vllm_test_utils/vllm_test_utils/monitor.py
@@ -19,8 +19,8 @@ class MonitoredValues(Generic[_T]):
 
 @contextlib.contextmanager
 def monitor(
-    measure_func: Callable[[],
-                           _T]) -> Generator[MonitoredValues[_T], None, None]:
+    measure_func: Callable[[], _T],
+) -> Generator[MonitoredValues[_T], None, None]:
     """
     Trace the function calls to continuously monitor the change of
     a value.
@@ -28,23 +28,23 @@ def monitor(
     Usage:
 
     ```python
-
     def measure_func():
-        ... # measure the current value
+        ...  # measure the current value
         return current_value
 
+
     with monitor(measure_func) as monitored_values:
         # do something
-    
-        monitored_values.values # all changes of the values
-        monitored_values.trace_stacks # trace stacks of every change
+
+        monitored_values.values  # all changes of the values
+        monitored_values.trace_stacks  # trace stacks of every change
     ```
     """
     monitored_values = MonitoredValues[_T]()
 
     def _trace_calls(frame, event, arg=None):
         nonlocal monitored_values
-        if event in ['line']:
+        if event in ["line"]:
             # triggered by every line of Python code.
             # only Python functions will trigger it,
             # c/cpp functions will not trigger it.
@@ -53,11 +53,14 @@ def _trace_calls(frame, event, arg=None):
                 sys.settrace(None)
                 # do a measurement
                 current_value = measure_func()
-                if len(monitored_values.values
-                       ) == 0 or current_value != monitored_values.values[-1]:
+                if (
+                    len(monitored_values.values) == 0
+                    or current_value != monitored_values.values[-1]
+                ):
                     monitored_values.values.append(current_value)
-                    monitored_values.trace_stacks.append("".join(
-                        traceback.format_stack()))
+                    monitored_values.trace_stacks.append(
+                        "".join(traceback.format_stack())
+                    )
                 # Re-enable the trace function
                 sys.settrace(_trace_calls)
             except NameError:
diff --git a/tests/weight_loading/test_weight_loading.py b/tests/weight_loading/test_weight_loading.py
index 3aabae099073..658773068208 100644
--- a/tests/weight_loading/test_weight_loading.py
+++ b/tests/weight_loading/test_weight_loading.py
@@ -9,35 +9,39 @@
 from vllm.platforms import current_platform
 
 MAX_MODEL_LEN = 1024
-MODEL_NAME = os.environ.get("MODEL_NAME",
-                            "robertgshaw2/zephyr-7b-beta-channelwise-gptq")
+MODEL_NAME = os.environ.get(
+    "MODEL_NAME", "robertgshaw2/zephyr-7b-beta-channelwise-gptq"
+)
 REVISION = os.environ.get("REVISION", "main")
 QUANTIZATION = os.environ.get("QUANTIZATION", "gptq_marlin")
 MIN_CAPABILITY = os.environ.get("MIN_CAPABILITY", "80")
 
 
 @pytest.mark.skipif(
-    MODEL_NAME == "casperhansen/deepseek-coder-v2-instruct-awq",
-    reason="OOM in the CI")
+    MODEL_NAME == "casperhansen/deepseek-coder-v2-instruct-awq", reason="OOM in the CI"
+)
 @pytest.mark.skipif(
     not current_platform.has_device_capability(int(MIN_CAPABILITY)),
-    reason="Current system does not have minimum capability.")
+    reason="Current system does not have minimum capability.",
+)
 def test_weight_loading(vllm_runner):
     """
     Test parameter weight loading with tp>1.
     """
 
     # MoE models need fp16.
-    NEEDS_FP16 = (QUANTIZATION == "gptq" or MODEL_NAME
-                  == "nm-testing/test-w4a16-mixtral-actorder-group")
+    NEEDS_FP16 = (
+        QUANTIZATION == "gptq"
+        or MODEL_NAME == "nm-testing/test-w4a16-mixtral-actorder-group"
+    )
     with vllm_runner(
-            model_name=MODEL_NAME,
-            revision=REVISION,
-            dtype=torch.half if NEEDS_FP16 else "auto",
-            quantization=None if QUANTIZATION == "None" else QUANTIZATION,
-            max_model_len=MAX_MODEL_LEN,
-            tensor_parallel_size=2) as model:
-
+        model_name=MODEL_NAME,
+        revision=REVISION,
+        dtype=torch.half if NEEDS_FP16 else "auto",
+        quantization=None if QUANTIZATION == "None" else QUANTIZATION,
+        max_model_len=MAX_MODEL_LEN,
+        tensor_parallel_size=2,
+    ) as model:
         output = model.generate_greedy("Hello world!", max_tokens=20)
         print(output)
         assert output
diff --git a/tools/check_init_lazy_imports.py b/tools/check_init_lazy_imports.py
index e8e6f07cc33f..9255aa17db6a 100644
--- a/tools/check_init_lazy_imports.py
+++ b/tools/check_init_lazy_imports.py
@@ -17,12 +17,16 @@
 INIT_PATH: Final = REPO_ROOT / "vllm" / "__init__.py"
 
 # If you need to add items to whitelist, do it here.
-ALLOWED_IMPORTS: Final[frozenset[str]] = frozenset({
-    "vllm.env_override",
-})
-ALLOWED_FROM_MODULES: Final[frozenset[str]] = frozenset({
-    ".version",
-})
+ALLOWED_IMPORTS: Final[frozenset[str]] = frozenset(
+    {
+        "vllm.env_override",
+    }
+)
+ALLOWED_FROM_MODULES: Final[frozenset[str]] = frozenset(
+    {
+        ".version",
+    }
+)
 
 
 def _is_internal(name: str | None, *, level: int = 0) -> bool:
@@ -34,8 +38,7 @@ def _is_internal(name: str | None, *, level: int = 0) -> bool:
 
 
 def _fail(violations: Iterable[tuple[int, str]]) -> None:
-    print("ERROR: Disallowed eager imports in vllm/__init__.py:\n",
-          file=sys.stderr)
+    print("ERROR: Disallowed eager imports in vllm/__init__.py:\n", file=sys.stderr)
     for lineno, msg in violations:
         print(f"  Line {lineno}: {msg}", file=sys.stderr)
     sys.exit(1)
@@ -48,7 +51,6 @@ def main() -> None:
     violations: list[tuple[int, str]] = []
 
     class Visitor(ast.NodeVisitor):
-
         def __init__(self) -> None:
             super().__init__()
             self._in_type_checking = False
@@ -56,10 +58,10 @@ def __init__(self) -> None:
         def visit_If(self, node: ast.If) -> None:
             guard_is_type_checking = False
             test = node.test
-            if isinstance(test, ast.Attribute) and isinstance(
-                    test.value, ast.Name):
-                guard_is_type_checking = (test.value.id == "typing"
-                                          and test.attr == "TYPE_CHECKING")
+            if isinstance(test, ast.Attribute) and isinstance(test.value, ast.Name):
+                guard_is_type_checking = (
+                    test.value.id == "typing" and test.attr == "TYPE_CHECKING"
+                )
             elif isinstance(test, ast.Name):
                 guard_is_type_checking = test.id == "TYPE_CHECKING"
 
@@ -79,24 +81,28 @@ def visit_Import(self, node: ast.Import) -> None:
                 return
             for alias in node.names:
                 module_name = alias.name
-                if _is_internal(
-                        module_name) and module_name not in ALLOWED_IMPORTS:
-                    violations.append((
-                        node.lineno,
-                        f"import '{module_name}' must be inside typing.TYPE_CHECKING",  # noqa: E501
-                    ))
+                if _is_internal(module_name) and module_name not in ALLOWED_IMPORTS:
+                    violations.append(
+                        (
+                            node.lineno,
+                            f"import '{module_name}' must be inside typing.TYPE_CHECKING",  # noqa: E501
+                        )
+                    )
 
         def visit_ImportFrom(self, node: ast.ImportFrom) -> None:
             if self._in_type_checking:
                 return
             module_as_written = ("." * node.level) + (node.module or "")
-            if _is_internal(
-                    node.module, level=node.level
-            ) and module_as_written not in ALLOWED_FROM_MODULES:
-                violations.append((
-                    node.lineno,
-                    f"from '{module_as_written}' import ... must be inside typing.TYPE_CHECKING",  # noqa: E501
-                ))
+            if (
+                _is_internal(node.module, level=node.level)
+                and module_as_written not in ALLOWED_FROM_MODULES
+            ):
+                violations.append(
+                    (
+                        node.lineno,
+                        f"from '{module_as_written}' import ... must be inside typing.TYPE_CHECKING",  # noqa: E501
+                    )
+                )
 
     Visitor().visit(tree)
 
diff --git a/tools/check_spdx_header.py b/tools/check_spdx_header.py
index ced10ba9097b..1fcca12519ff 100644
--- a/tools/check_spdx_header.py
+++ b/tools/check_spdx_header.py
@@ -7,6 +7,7 @@
 
 class SPDXStatus(Enum):
     """SPDX header status enumeration"""
+
     EMPTY = "empty"  # empty __init__.py
     COMPLETE = "complete"
     MISSING_LICENSE = "missing_license"  # Only has copyright line
@@ -16,7 +17,8 @@ class SPDXStatus(Enum):
 
 FULL_SPDX_HEADER = (
     "# SPDX-License-Identifier: Apache-2.0\n"
-    "# SPDX-FileCopyrightText: Copyright contributors to the vLLM project")
+    "# SPDX-FileCopyrightText: Copyright contributors to the vLLM project"
+)
 
 LICENSE_LINE = "# SPDX-License-Identifier: Apache-2.0"
 COPYRIGHT_LINE = "# SPDX-FileCopyrightText: Copyright contributors to the vLLM project"  # noqa: E501
@@ -123,8 +125,9 @@ def main():
             continue
 
     # Collect all files that need fixing
-    all_files_to_fix = (files_missing_both + files_missing_copyright +
-                        files_missing_license)
+    all_files_to_fix = (
+        files_missing_both + files_missing_copyright + files_missing_license
+    )
     if all_files_to_fix:
         print("The following files are missing the SPDX header:")
         if files_missing_both:
diff --git a/tools/check_triton_import.py b/tools/check_triton_import.py
index c01d9d4ab079..1b83074fe0d2 100644
--- a/tools/check_triton_import.py
+++ b/tools/check_triton_import.py
@@ -23,8 +23,7 @@ def is_allowed_file(current_file: str) -> bool:
 
 def is_forbidden_import(line: str) -> bool:
     stripped = line.strip()
-    return bool(
-        FORBIDDEN_IMPORT_RE.match(stripped)) and stripped not in ALLOWED_LINES
+    return bool(FORBIDDEN_IMPORT_RE.match(stripped)) and stripped not in ALLOWED_LINES
 
 
 def parse_diff(diff: str) -> list[str]:
@@ -42,24 +41,24 @@ def parse_diff(diff: str) -> list[str]:
         elif line.startswith("@@"):
             match = re.search(r"\+(\d+)", line)
             if match:
-                current_lineno = int(
-                    match.group(1)) - 1  # next "+ line" is here
+                current_lineno = int(match.group(1)) - 1  # next "+ line" is here
         elif line.startswith("+") and not line.startswith("++"):
             current_lineno += 1
             code_line = line[1:]
             if is_forbidden_import(code_line):
                 violations.append(
-                    f"{current_file}:{current_lineno}: {code_line.strip()}")
+                    f"{current_file}:{current_lineno}: {code_line.strip()}"
+                )
     return violations
 
 
 def get_diff(diff_type: str) -> str:
     if diff_type == "staged":
         return subprocess.check_output(
-            ["git", "diff", "--cached", "--unified=0"], text=True)
+            ["git", "diff", "--cached", "--unified=0"], text=True
+        )
     elif diff_type == "unstaged":
-        return subprocess.check_output(["git", "diff", "--unified=0"],
-                                       text=True)
+        return subprocess.check_output(["git", "diff", "--unified=0"], text=True)
     else:
         raise ValueError(f"Unknown diff_type: {diff_type}")
 
@@ -75,8 +74,10 @@ def main():
             print(f"[{diff_type}] Git diff failed: {e}", file=sys.stderr)
 
     if all_violations:
-        print("❌ Forbidden direct `import triton` detected."
-              " ➤ Use `from vllm.triton_utils import triton` instead.\n")
+        print(
+            "❌ Forbidden direct `import triton` detected."
+            " ➤ Use `from vllm.triton_utils import triton` instead.\n"
+        )
         for v in all_violations:
             print(f"❌ {v}")
         return 1
diff --git a/tools/enforce_regex_import.py b/tools/enforce_regex_import.py
index 63ceee5829ab..69f43cadc767 100644
--- a/tools/enforce_regex_import.py
+++ b/tools/enforce_regex_import.py
@@ -7,24 +7,23 @@
 
 import regex as re
 
-FORBIDDEN_PATTERNS = re.compile(
-    r'^\s*(?:import\s+re(?:$|\s|,)|from\s+re\s+import)')
+FORBIDDEN_PATTERNS = re.compile(r"^\s*(?:import\s+re(?:$|\s|,)|from\s+re\s+import)")
 ALLOWED_PATTERNS = [
-    re.compile(r'^\s*import\s+regex\s+as\s+re\s*$'),
-    re.compile(r'^\s*import\s+regex\s*$'),
+    re.compile(r"^\s*import\s+regex\s+as\s+re\s*$"),
+    re.compile(r"^\s*import\s+regex\s*$"),
 ]
 
 
 def get_staged_python_files() -> list[str]:
     try:
         result = subprocess.run(
-            ['git', 'diff', '--cached', '--name-only', '--diff-filter=AM'],
+            ["git", "diff", "--cached", "--name-only", "--diff-filter=AM"],
             capture_output=True,
             text=True,
-            check=True)
-        files = result.stdout.strip().split(
-            '\n') if result.stdout.strip() else []
-        return [f for f in files if f.endswith('.py')]
+            check=True,
+        )
+        files = result.stdout.strip().split("\n") if result.stdout.strip() else []
+        return [f for f in files if f.endswith(".py")]
     except subprocess.CalledProcessError:
         return []
 
@@ -33,13 +32,14 @@ def is_forbidden_import(line: str) -> bool:
     line = line.strip()
     return bool(
         FORBIDDEN_PATTERNS.match(line)
-        and not any(pattern.match(line) for pattern in ALLOWED_PATTERNS))
+        and not any(pattern.match(line) for pattern in ALLOWED_PATTERNS)
+    )
 
 
 def check_file(filepath: str) -> list[tuple[int, str]]:
     violations = []
     try:
-        with open(filepath, encoding='utf-8') as f:
+        with open(filepath, encoding="utf-8") as f:
             for line_num, line in enumerate(f, 1):
                 if is_forbidden_import(line):
                     violations.append((line_num, line.strip()))
@@ -72,9 +72,7 @@ def main() -> int:
     if total_violations > 0:
         print(f"\n💡 Found {total_violations} violation(s).")
         print("❌ Please replace 'import re' with 'import regex as re'")
-        print(
-            "   Also replace 'from re import ...' with 'from regex import ...'"
-        )  # noqa: E501
+        print("   Also replace 'from re import ...' with 'from regex import ...'")  # noqa: E501
         print("✅ Allowed imports:")
         print("   - import regex as re")
         print("   - import regex")  # noqa: E501
diff --git a/tools/generate_cmake_presets.py b/tools/generate_cmake_presets.py
index 4869a71307e4..85847c2c0fe8 100644
--- a/tools/generate_cmake_presets.py
+++ b/tools/generate_cmake_presets.py
@@ -12,8 +12,7 @@
     # most reliable source of truth for vLLM's build.
     from torch.utils.cpp_extension import CUDA_HOME
 except ImportError:
-    print("Warning: PyTorch not found. "
-          "Falling back to CUDA_HOME environment variable.")
+    print("Warning: PyTorch not found. Falling back to CUDA_HOME environment variable.")
     CUDA_HOME = os.environ.get("CUDA_HOME")
 
 
@@ -27,8 +26,7 @@ def get_cpu_cores():
     return multiprocessing.cpu_count()
 
 
-def generate_presets(output_path="CMakeUserPresets.json",
-                     force_overwrite=False):
+def generate_presets(output_path="CMakeUserPresets.json", force_overwrite=False):
     """Generates the CMakeUserPresets.json file."""
 
     print("Attempting to detect your system configuration...")
@@ -39,8 +37,7 @@ def generate_presets(output_path="CMakeUserPresets.json",
         prospective_path = os.path.join(CUDA_HOME, "bin", "nvcc")
         if os.path.exists(prospective_path):
             nvcc_path = prospective_path
-            print("Found nvcc via torch.utils.cpp_extension.CUDA_HOME: "
-                  f"{nvcc_path}")
+            print(f"Found nvcc via torch.utils.cpp_extension.CUDA_HOME: {nvcc_path}")
 
     if not nvcc_path:
         nvcc_path = which("nvcc")
@@ -50,7 +47,8 @@ def generate_presets(output_path="CMakeUserPresets.json",
     if not nvcc_path:
         nvcc_path_input = input(
             "Could not automatically find 'nvcc'. Please provide the full "
-            "path to nvcc (e.g., /usr/local/cuda/bin/nvcc): ")
+            "path to nvcc (e.g., /usr/local/cuda/bin/nvcc): "
+        )
         nvcc_path = nvcc_path_input.strip()
     print(f"Using NVCC path: {nvcc_path}")
 
@@ -63,12 +61,13 @@ def generate_presets(output_path="CMakeUserPresets.json",
             "Could not automatically find Python executable. Please provide "
             "the full path to your Python executable for vLLM development "
             "(typically from your virtual environment, e.g., "
-            "/home/user/venvs/vllm/bin/python): ")
+            "/home/user/venvs/vllm/bin/python): "
+        )
         python_executable = input(python_executable_prompt).strip()
         if not python_executable:
             raise ValueError(
-                "Could not determine Python executable. Please provide it "
-                "manually.")
+                "Could not determine Python executable. Please provide it manually."
+            )
 
     print(f"Using Python executable: {python_executable}")
 
@@ -76,20 +75,23 @@ def generate_presets(output_path="CMakeUserPresets.json",
     cpu_cores = get_cpu_cores()
     nvcc_threads = min(4, cpu_cores)
     cmake_jobs = max(1, cpu_cores // nvcc_threads)
-    print(f"Detected {cpu_cores} CPU cores. "
-          f"Setting NVCC_THREADS={nvcc_threads} and CMake jobs={cmake_jobs}.")
+    print(
+        f"Detected {cpu_cores} CPU cores. "
+        f"Setting NVCC_THREADS={nvcc_threads} and CMake jobs={cmake_jobs}."
+    )
 
     # Get vLLM project root (assuming this script is in vllm/tools/)
-    project_root = os.path.abspath(
-        os.path.join(os.path.dirname(__file__), ".."))
+    project_root = os.path.abspath(os.path.join(os.path.dirname(__file__), ".."))
     print(f"VLLM project root detected as: {project_root}")
 
     # Ensure python_executable path is absolute or resolvable
     if not os.path.isabs(python_executable) and which(python_executable):
         python_executable = os.path.abspath(which(python_executable))
     elif not os.path.isabs(python_executable):
-        print(f"Warning: Python executable '{python_executable}' is not an "
-              "absolute path and not found in PATH. CMake might not find it.")
+        print(
+            f"Warning: Python executable '{python_executable}' is not an "
+            "absolute path and not found in PATH. CMake might not find it."
+        )
 
     cache_variables = {
         "CMAKE_CUDA_COMPILER": nvcc_path,
@@ -122,24 +124,20 @@ def generate_presets(output_path="CMakeUserPresets.json",
         configure_preset["generator"] = "Ninja"
         cache_variables["CMAKE_JOB_POOLS"] = f"compile={cmake_jobs}"
     else:
-        print("Ninja not found, using default generator. "
-              "Build may be slower.")
+        print("Ninja not found, using default generator. Build may be slower.")
 
     presets = {
-        "version":
-        6,
+        "version": 6,
         # Keep in sync with CMakeLists.txt and requirements/build.txt
-        "cmakeMinimumRequired": {
-            "major": 3,
-            "minor": 26,
-            "patch": 1
-        },
+        "cmakeMinimumRequired": {"major": 3, "minor": 26, "patch": 1},
         "configurePresets": [configure_preset],
-        "buildPresets": [{
-            "name": "release",
-            "configurePreset": "release",
-            "jobs": cmake_jobs,
-        }],
+        "buildPresets": [
+            {
+                "name": "release",
+                "configurePreset": "release",
+                "jobs": cmake_jobs,
+            }
+        ],
     }
 
     output_file_path = os.path.join(project_root, output_path)
@@ -148,10 +146,12 @@ def generate_presets(output_path="CMakeUserPresets.json",
         if force_overwrite:
             print(f"Overwriting existing file '{output_file_path}'")
         else:
-            overwrite = input(
-                f"'{output_file_path}' already exists. Overwrite? (y/N): "
-            ).strip().lower()
-            if overwrite != 'y':
+            overwrite = (
+                input(f"'{output_file_path}' already exists. Overwrite? (y/N): ")
+                .strip()
+                .lower()
+            )
+            if overwrite != "y":
                 print("Generation cancelled.")
                 return
 
@@ -160,11 +160,9 @@ def generate_presets(output_path="CMakeUserPresets.json",
             json.dump(presets, f, indent=4)
         print(f"Successfully generated '{output_file_path}'")
         print("\nTo use this preset:")
-        print(
-            f"1. Ensure you are in the vLLM root directory: cd {project_root}")
+        print(f"1. Ensure you are in the vLLM root directory: cd {project_root}")
         print("2. Initialize CMake: cmake --preset release")
-        print("3. Build+install: cmake --build --preset release "
-              "--target install")
+        print("3. Build+install: cmake --build --preset release --target install")
 
     except OSError as e:
         print(f"Error writing file: {e}")
@@ -175,7 +173,7 @@ def generate_presets(output_path="CMakeUserPresets.json",
     parser.add_argument(
         "--force-overwrite",
         action="store_true",
-        help="Force overwrite existing CMakeUserPresets.json without prompting"
+        help="Force overwrite existing CMakeUserPresets.json without prompting",
     )
 
     args = parser.parse_args()
diff --git a/tools/pre_commit/check_pickle_imports.py b/tools/pre_commit/check_pickle_imports.py
index c97a5b0b6c71..bceb894a7a5f 100644
--- a/tools/pre_commit/check_pickle_imports.py
+++ b/tools/pre_commit/check_pickle_imports.py
@@ -17,44 +17,48 @@
 #  add to this list if absolutely necessary and after careful security review.
 ALLOWED_FILES = {
     # pickle
-    'vllm/v1/serial_utils.py',
-    'vllm/v1/executor/multiproc_executor.py',
-    'vllm/multimodal/hasher.py',
-    'vllm/transformers_utils/config.py',
-    'vllm/model_executor/models/registry.py',
-    'tests/utils_/test_utils.py',
-    'tests/tokenization/test_cached_tokenizer.py',
-    'vllm/distributed/utils.py',
-    'vllm/distributed/parallel_state.py',
-    'vllm/distributed/device_communicators/all_reduce_utils.py',
-    'vllm/distributed/device_communicators/shm_broadcast.py',
-    'vllm/distributed/device_communicators/shm_object_storage.py',
-    'benchmarks/kernels/graph_machete_bench.py',
-    'benchmarks/kernels/benchmark_lora.py',
-    'benchmarks/kernels/benchmark_machete.py',
-    'benchmarks/fused_kernels/layernorm_rms_benchmarks.py',
-    'benchmarks/cutlass_benchmarks/w8a8_benchmarks.py',
-    'benchmarks/cutlass_benchmarks/sparse_benchmarks.py',
+    "vllm/v1/serial_utils.py",
+    "vllm/v1/executor/multiproc_executor.py",
+    "vllm/multimodal/hasher.py",
+    "vllm/transformers_utils/config.py",
+    "vllm/model_executor/models/registry.py",
+    "tests/utils_/test_utils.py",
+    "tests/tokenization/test_cached_tokenizer.py",
+    "vllm/distributed/utils.py",
+    "vllm/distributed/parallel_state.py",
+    "vllm/distributed/device_communicators/all_reduce_utils.py",
+    "vllm/distributed/device_communicators/shm_broadcast.py",
+    "vllm/distributed/device_communicators/shm_object_storage.py",
+    "benchmarks/kernels/graph_machete_bench.py",
+    "benchmarks/kernels/benchmark_lora.py",
+    "benchmarks/kernels/benchmark_machete.py",
+    "benchmarks/fused_kernels/layernorm_rms_benchmarks.py",
+    "benchmarks/cutlass_benchmarks/w8a8_benchmarks.py",
+    "benchmarks/cutlass_benchmarks/sparse_benchmarks.py",
     # cloudpickle
-    'vllm/executor/mp_distributed_executor.py',
-    'vllm/executor/ray_distributed_executor.py',
-    'vllm/entrypoints/llm.py',
-    'tests/utils.py',
+    "vllm/executor/mp_distributed_executor.py",
+    "vllm/executor/ray_distributed_executor.py",
+    "vllm/entrypoints/llm.py",
+    "tests/utils.py",
     # pickle and cloudpickle
-    'vllm/utils/__init__.py',
+    "vllm/utils/__init__.py",
 }
 
-PICKLE_RE = re.compile(r"^\s*(import\s+(pickle|cloudpickle)(\s|$|\sas)"
-                       r"|from\s+(pickle|cloudpickle)\s+import\b)")
+PICKLE_RE = re.compile(
+    r"^\s*(import\s+(pickle|cloudpickle)(\s|$|\sas)"
+    r"|from\s+(pickle|cloudpickle)\s+import\b)"
+)
 
 
 def scan_file(path: str) -> int:
-    with open(path, encoding='utf-8') as f:
+    with open(path, encoding="utf-8") as f:
         for i, line in enumerate(f, 1):
             if PICKLE_RE.match(line):
-                print(f"{path}:{i}: "
-                      "\033[91merror:\033[0m "  # red color
-                      "Found pickle/cloudpickle import")
+                print(
+                    f"{path}:{i}: "
+                    "\033[91merror:\033[0m "  # red color
+                    "Found pickle/cloudpickle import"
+                )
                 return 1
     return 0
 
@@ -92,13 +96,13 @@ def test_regex():
     for i, (line, should_match) in enumerate(test_cases):
         result = bool(PICKLE_RE.match(line))
         assert result == should_match, (
-            f"Test case {i} failed: '{line}' "
-            f"(expected {should_match}, got {result})")
+            f"Test case {i} failed: '{line}' (expected {should_match}, got {result})"
+        )
     print("All regex tests passed.")
 
 
-if __name__ == '__main__':
-    if '--test-regex' in sys.argv:
+if __name__ == "__main__":
+    if "--test-regex" in sys.argv:
         test_regex()
     else:
         sys.exit(main())
diff --git a/tools/pre_commit/mypy.py b/tools/pre_commit/mypy.py
index 039cf6075f63..22ee08535bdd 100755
--- a/tools/pre_commit/mypy.py
+++ b/tools/pre_commit/mypy.py
@@ -94,11 +94,15 @@ def group_files(changed_files: list[str]) -> dict[str, list[str]]:
     return file_groups
 
 
-def mypy(targets: list[str], python_version: Optional[str],
-         follow_imports: Optional[str], file_group: str) -> int:
+def mypy(
+    targets: list[str],
+    python_version: Optional[str],
+    follow_imports: Optional[str],
+    file_group: str,
+) -> int:
     """
     Run mypy on the given targets.
-    
+
     Args:
         targets: List of files or directories to check.
         python_version: Python version to use (e.g., "3.10") or None to use
@@ -131,8 +135,9 @@ def main():
     for file_group, changed_files in file_groups.items():
         follow_imports = None if ci and file_group == "" else "skip"
         if changed_files:
-            returncode |= mypy(changed_files, python_version, follow_imports,
-                               file_group)
+            returncode |= mypy(
+                changed_files, python_version, follow_imports, file_group
+            )
     return returncode
 
 
diff --git a/tools/profiler/nsys_profile_tools/gputrc2graph.py b/tools/profiler/nsys_profile_tools/gputrc2graph.py
index 42dfede9e987..fd237c0b214a 100755
--- a/tools/profiler/nsys_profile_tools/gputrc2graph.py
+++ b/tools/profiler/nsys_profile_tools/gputrc2graph.py
@@ -1,10 +1,11 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """
-    This generates gpu kernel analysis output from nsys rep. Will call nsys
-    stats  -r cuda_gpu_kern_trace, get non-overlapped gpu cycles, then generate
-    csv and html output for analysis
+This generates gpu kernel analysis output from nsys rep. Will call nsys
+stats  -r cuda_gpu_kern_trace, get non-overlapped gpu cycles, then generate
+csv and html output for analysis
 """
+
 import argparse
 import logging
 import os
@@ -16,13 +17,13 @@
 
 # helper data class for annotating kernels
 def load_engine_model():
-    """ returns engine_model built from all json files in the current dir """
+    """returns engine_model built from all json files in the current dir"""
     import glob
     import json
+
     engine_model = {}
 
-    json_files = glob.glob(
-        os.path.join(os.path.dirname(__file__) or ".", "*.json"))
+    json_files = glob.glob(os.path.join(os.path.dirname(__file__) or ".", "*.json"))
     for fname in json_files:
         with open(fname, encoding="utf-8") as f:
             engine_model.update(json.load(f))
@@ -30,54 +31,54 @@ def load_engine_model():
 
 
 class GPUTrace2Graph:
-    """ 
-        Parses output of nsys report, generates csv and bar chart output
+    """
+    Parses output of nsys report, generates csv and bar chart output
     """
 
     def __init__(self):
         import pandas as pd  # avoid importing till needed
+
         self.pd = pd
         self.pd.options.mode.copy_on_write = True
 
     # helper functions for generating trace->summary csvs
     def gen_nonoverlapped_sum_from_gputrace(self, in_file, out_file):
-        logger.info('loading %s', in_file)
+        logger.info("loading %s", in_file)
         df = self.pd.read_csv(
-            in_file,
-            usecols=['Start (ns)', 'Duration (ns)', 'Device', 'Strm', 'Name'])
-        df['End (ns)'] = df['Start (ns)'] + df['Duration (ns)']
+            in_file, usecols=["Start (ns)", "Duration (ns)", "Device", "Strm", "Name"]
+        )
+        df["End (ns)"] = df["Start (ns)"] + df["Duration (ns)"]
         df = self.sum_non_overlapping_intervals(df)
         # get ready to print table with elapsed times per kernel
-        df['Instances'] = 1
-        df_sum = df.groupby('Name', as_index=False).agg({
-            'Elapsed Time (ns)': 'sum',
-            'Duration (ns)': 'sum',
-            'Instances': 'size'
-        })
+        df["Instances"] = 1
+        df_sum = df.groupby("Name", as_index=False).agg(
+            {"Elapsed Time (ns)": "sum", "Duration (ns)": "sum", "Instances": "size"}
+        )
 
         # generate csv
-        df_sum['Total Time (sec)'] = df_sum['Duration (ns)'] / 1e9
-        df_sum['Elapsed Time (sec)'] = df_sum['Elapsed Time (ns)'] / 1e9
-        df_sum = df_sum.sort_values(by='Elapsed Time (sec)', ascending=False)
-        df_sum[['Elapsed Time (sec)', 'Total Time (sec)', 'Instances',
-                'Name']].to_csv(out_file, index=False)
+        df_sum["Total Time (sec)"] = df_sum["Duration (ns)"] / 1e9
+        df_sum["Elapsed Time (sec)"] = df_sum["Elapsed Time (ns)"] / 1e9
+        df_sum = df_sum.sort_values(by="Elapsed Time (sec)", ascending=False)
+        df_sum[["Elapsed Time (sec)", "Total Time (sec)", "Instances", "Name"]].to_csv(
+            out_file, index=False
+        )
 
     def sum_non_overlapping_intervals(self, df):
-        """ 
-            returns new sorted df with Elapsed Time (ns) column using 
-            vectorized operations 
+        """
+        returns new sorted df with Elapsed Time (ns) column using
+        vectorized operations
         """
         logger.info("sorting %s trace records by start time", str(df.shape))
 
         # Sort by start time and reset index
-        df = df.sort_values(by='Start (ns)').reset_index(drop=True)
+        df = df.sort_values(by="Start (ns)").reset_index(drop=True)
 
         # Initialize elapsed time as duration
-        df['Elapsed Time (ns)'] = df['Duration (ns)']
+        df["Elapsed Time (ns)"] = df["Duration (ns)"]
 
         # Get numpy arrays for faster operations
-        starts = df['Start (ns)'].values
-        ends = df['End (ns)'].values
+        starts = df["Start (ns)"].values
+        ends = df["End (ns)"].values
 
         # Keep track of current interval end
         current_end = ends[0]
@@ -85,16 +86,17 @@ def sum_non_overlapping_intervals(self, df):
         # Update current_end for overlapping intervals
         for i in range(1, len(df)):
             if i % display_units == 0:
-                print(f'processing trace: {int(i/len(df) * 100)} %', end="\r")
+                print(f"processing trace: {int(i / len(df) * 100)} %", end="\r")
             if starts[i] <= current_end:
                 if ends[i] > current_end:
                     # Partial overlap
-                    df.iloc[i, df.columns.get_loc('Elapsed Time (ns)'
-                                                  )] = ends[i] - current_end
+                    df.iloc[i, df.columns.get_loc("Elapsed Time (ns)")] = (
+                        ends[i] - current_end
+                    )
                     current_end = ends[i]
                 else:
                     # Complete overlap
-                    df.iloc[i, df.columns.get_loc('Elapsed Time (ns)')] = 0
+                    df.iloc[i, df.columns.get_loc("Elapsed Time (ns)")] = 0
             else:
                 # No overlap
                 current_end = ends[i]
@@ -103,147 +105,167 @@ def sum_non_overlapping_intervals(self, df):
 
     # functions for generating html files
     def make_html(self, df, output_dir, title):
-        """ make html graph from df """
+        """make html graph from df"""
         import plotly.express as px
+
         if df.empty:
             return
-        output_name = output_dir + '/result'
+        output_name = output_dir + "/result"
         if not title:
-            title = 'Model_Engine'
-        x = 'Model_Engine'
-        y = 'Elapsed Time (sec)'
-        color = 'Category'
+            title = "Model_Engine"
+        x = "Model_Engine"
+        y = "Elapsed Time (sec)"
+        color = "Category"
         """ generate kernel mapping table  """
         # Sort Model_Engine categories by last field after underscore
-        df['Model_Engine'] = self.pd.Categorical(
-            df['Model_Engine'],
-            sorted(df['Model_Engine'].unique(),
-                   key=lambda x: x.split('_')[-1]))
-        df[['Model_Engine', color, 'Instances', 'Name',
-            y]].sort_values(by=color).to_csv(f'{output_name}.csv', index=False)
-        graph = px.histogram(df.round(2),
-                             x=x,
-                             y=y,
-                             title=(f'{y} for {title}'),
-                             color=color,
-                             text_auto=True)
+        df["Model_Engine"] = self.pd.Categorical(
+            df["Model_Engine"],
+            sorted(df["Model_Engine"].unique(), key=lambda x: x.split("_")[-1]),
+        )
+        df[["Model_Engine", color, "Instances", "Name", y]].sort_values(
+            by=color
+        ).to_csv(f"{output_name}.csv", index=False)
+        graph = px.histogram(
+            df.round(2),
+            x=x,
+            y=y,
+            title=(f"{y} for {title}"),
+            color=color,
+            text_auto=True,
+        )
         # wrap x axis labels
         graph.update_xaxes(automargin=True)
-        graph.write_html(f'{output_name}.html')
+        graph.write_html(f"{output_name}.html")
         """
             Generate data table with columns per Model_Engine into result.html
         """
-        pivot_df = df.pivot_table(values='Elapsed Time (sec)',
-                                  index='Category',
-                                  columns='Model_Engine',
-                                  aggfunc='sum',
-                                  observed=False).round(2)
+        pivot_df = df.pivot_table(
+            values="Elapsed Time (sec)",
+            index="Category",
+            columns="Model_Engine",
+            aggfunc="sum",
+            observed=False,
+        ).round(2)
         # Add sum row at bottom
-        pivot_df.loc['total_elapsed_sec'] = pivot_df.sum()
-        pivot_df.fillna('').to_html('temp.html')
-        with (open(f'{output_name}.html', 'a', encoding='utf-8') as
-              outfile, open('temp.html', encoding='utf-8') as infile):
+        pivot_df.loc["total_elapsed_sec"] = pivot_df.sum()
+        pivot_df.fillna("").to_html("temp.html")
+        with (
+            open(f"{output_name}.html", "a", encoding="utf-8") as outfile,
+            open("temp.html", encoding="utf-8") as infile,
+        ):
             outfile.write(infile.read())
-        os.remove('temp.html')
+        os.remove("temp.html")
 
-        print(f'Finished generating: \n'
-              f' {output_name}.html for stack bar chart \n'
-              f' {output_name}.csv for Kernel-Category mapping')
+        print(
+            f"Finished generating: \n"
+            f" {output_name}.html for stack bar chart \n"
+            f" {output_name}.csv for Kernel-Category mapping"
+        )
 
     def anno_gpu_kernname(self, df, mapping):
-        """ add "Category" column """
+        """add "Category" column"""
 
         def anno_gpu_kernname_helper(name):
             for kern_name, val in mapping.items():
                 if re.search(kern_name, name):
                     return val
 
-        df['Category'] = df['Name'].apply(anno_gpu_kernname_helper)
+        df["Category"] = df["Name"].apply(anno_gpu_kernname_helper)
 
     def make_nongpu_row(self, df, nongpu_sec):
-        """ this will append non-gpu time entry at end of df """
+        """this will append non-gpu time entry at end of df"""
         nongpu_row = self.pd.DataFrame([df.iloc[-1]])
-        nongpu_row['Category'] = nongpu_row['Name'] = 'CPU(non-GPU)'
-        nongpu_row['Instances'] = 1
-        nongpu_row['Elapsed Time (sec)'] = nongpu_sec
-        return (nongpu_row)
+        nongpu_row["Category"] = nongpu_row["Name"] = "CPU(non-GPU)"
+        nongpu_row["Instances"] = 1
+        nongpu_row["Elapsed Time (sec)"] = nongpu_sec
+        return nongpu_row
 
     def is_valid_file(self, base_file):
-        """ asserts if base_file is non-existent or is empty """
-        assert os.path.isfile(base_file) and os.path.getsize(base_file) > 0, \
-           f"{base_file} doesn't exist or is empty"
+        """asserts if base_file is non-existent or is empty"""
+        assert os.path.isfile(base_file) and os.path.getsize(base_file) > 0, (
+            f"{base_file} doesn't exist or is empty"
+        )
 
     def should_gen_file(self, new_file, base_file):
-        """ figure out if new file should be generated from base_file """
+        """figure out if new file should be generated from base_file"""
         self.is_valid_file(base_file)
-        if (os.path.exists(new_file)
-                and (os.path.getmtime(new_file) > os.path.getmtime(base_file))
-                and (os.path.getsize(base_file) > 0)):
-            logger.info('reusing %s', new_file)
+        if (
+            os.path.exists(new_file)
+            and (os.path.getmtime(new_file) > os.path.getmtime(base_file))
+            and (os.path.getsize(base_file) > 0)
+        ):
+            logger.info("reusing %s", new_file)
             return False
         else:
-            logger.info('generating %s', new_file)
+            logger.info("generating %s", new_file)
             return True
 
     def gen_sum_file(self, file, nsys_cmd):
-        """ 
-            generates sum file from nsys trace with times per kernel and
-            returns the name of the sum file
+        """
+        generates sum file from nsys trace with times per kernel and
+        returns the name of the sum file
         """
         import subprocess
+
         file_dir = os.path.dirname(file)
         file_name = os.path.basename(file)
 
         if not file_dir:
-            file_dir = '.'
+            file_dir = "."
         # Walk through trace and get the total non-overlapped time
-        nsys_stats_file = f'{file_dir}/{file_name}_cuda_gpu_trace.csv'
-        sum_file = f'{file_dir}/{file_name}_cuda_gpu_kernel_tracesum.csv'
+        nsys_stats_file = f"{file_dir}/{file_name}_cuda_gpu_trace.csv"
+        sum_file = f"{file_dir}/{file_name}_cuda_gpu_kernel_tracesum.csv"
         if self.should_gen_file(nsys_stats_file, file):
             cmd = [
-                nsys_cmd, 'stats', '-r', 'cuda_gpu_trace', file, '-o',
-                f'{file_dir}/{file_name}'
+                nsys_cmd,
+                "stats",
+                "-r",
+                "cuda_gpu_trace",
+                file,
+                "-o",
+                f"{file_dir}/{file_name}",
             ]
-            cmd_str = ' '.join(cmd)
-            logger.info('+ %s', cmd_str)
+            cmd_str = " ".join(cmd)
+            logger.info("+ %s", cmd_str)
             # estimate time based on calibrated 240M/min
             file_size_mb = os.path.getsize(file) / 1e6
             logger.info(
-                'nsys stats for %.2f MB file expected to take %.2f min',
-                file_size_mb, file_size_mb / 240)
+                "nsys stats for %.2f MB file expected to take %.2f min",
+                file_size_mb,
+                file_size_mb / 240,
+            )
             try:
                 subprocess.run(cmd, check=True)
             except Exception:
-                logger.error("%s failed; Use --nsys_cmd to specify nsys path",
-                             cmd_str)
+                logger.error("%s failed; Use --nsys_cmd to specify nsys path", cmd_str)
                 exit(1)
-            logger.info('generating non-overalapped sum %s', sum_file)
+            logger.info("generating non-overalapped sum %s", sum_file)
             self.gen_nonoverlapped_sum_from_gputrace(nsys_stats_file, sum_file)
         self.is_valid_file(sum_file)
-        logger.info('Finished generating %s', sum_file)
+        logger.info("Finished generating %s", sum_file)
         return sum_file
 
     def gen_graph(self, in_file, out_dir, title, nsys_cmd, engine_model):
-        """ generates graph and csv file from in_file into out_dir """
+        """generates graph and csv file from in_file into out_dir"""
         # Initialize an empty DataFrame to store combined data
         combined_df = self.pd.DataFrame()
         for idx, (file, engine, model, total_sec) in enumerate(in_file):
             file_dir = os.path.dirname(file)
             file_name = os.path.basename(file)
             if not file_dir:
-                file_dir = '.'
+                file_dir = "."
             sum_file = self.gen_sum_file(file, nsys_cmd)
             # read kernel summary file
             df = self.pd.read_csv(sum_file)
             # annotate kernel to their categories
-            assert engine_model.get(engine), f'engine {engine} unknown'
-            assert engine_model[engine].get(model), f'model {model} unknown'
+            assert engine_model.get(engine), f"engine {engine} unknown"
+            assert engine_model[engine].get(model), f"model {model} unknown"
             # remove nsys-rep from file_name for shorter x-label
-            file_name = file_name.replace('.nsys-rep', '')
-            df['Model_Engine'] = f'{model}_{engine}_{file_name}_{idx}'
+            file_name = file_name.replace(".nsys-rep", "")
+            df["Model_Engine"] = f"{model}_{engine}_{file_name}_{idx}"
             self.anno_gpu_kernname(df, engine_model[engine][model])
             # patch in non-gpu time
-            gpu_sec = round(df['Elapsed Time (sec)'].sum(), 1)
+            gpu_sec = round(df["Elapsed Time (sec)"].sum(), 1)
             total_sec = round(float(total_sec), 1)
             if total_sec < gpu_sec:
                 logger.warning(
@@ -256,7 +278,7 @@ def gen_graph(self, in_file, out_dir, title, nsys_cmd, engine_model):
             df = self.pd.concat([df, nongpu_row], ignore_index=True)
             combined_df = self.pd.concat([combined_df, df], ignore_index=True)
         if out_dir is None:
-            out_dir = '.'
+            out_dir = "."
         else:
             os.makedirs(out_dir, exist_ok=True)
         # generate html file
@@ -264,50 +286,59 @@ def gen_graph(self, in_file, out_dir, title, nsys_cmd, engine_model):
 
 
 def parse_tuple(s):
-    return tuple(s.split(','))
+    return tuple(s.split(","))
 
 
 def main():
-    logging.basicConfig(format=('%(asctime)s - %(levelname)s - %(message)s'),
-                        level=logging.INFO)
+    logging.basicConfig(
+        format=("%(asctime)s - %(levelname)s - %(message)s"), level=logging.INFO
+    )
     parser = argparse.ArgumentParser(
         description=(
-            'Process nsys rep and generate kernel non-overlapped cycles. \n'
-            'Example:\n'
+            "Process nsys rep and generate kernel non-overlapped cycles. \n"
+            "Example:\n"
             "gputrc2graph.py --in_file d1.nsys-rep,vllm,llama,100 \n"
             "d2.nsys-rep,vllm,gpt-oss,102 "
-            "--out_dir results/ --title \"Model=gpt-oss vLLM chart\""),
-        formatter_class=argparse.RawDescriptionHelpFormatter)
+            '--out_dir results/ --title "Model=gpt-oss vLLM chart"'
+        ),
+        formatter_class=argparse.RawDescriptionHelpFormatter,
+    )
 
     # load supported engine_model
     engine_model_supported = load_engine_model()
     # Get a string representation of supported engine/model combinations
-    engine_model_supported_str = ', '.join(
+    engine_model_supported_str = ", ".join(
         f"{engine}:[{', '.join(models.keys())}]"
-        for engine, models in engine_model_supported.items())
+        for engine, models in engine_model_supported.items()
+    )
     parser.add_argument(
-        '--in_file',
+        "--in_file",
         type=parse_tuple,
-        nargs='+',
+        nargs="+",
         help=(
-            'list of (nsys-rep, engine, model, elapsed_nonprofiled_sec) '
-            'separated by space. Elapsed_nonprofiled_sec is runtime without '
-            'profiling used to calculate non-gpu time. Specify 0 to use '
-            'elapsed time from nsys-rep but that might inflate non-gpu time. '
-            f'Available engine:[model] are: {engine_model_supported_str} '
-            f'Example: --infile d1.nsys-rep,vllm,llama,100 '
-            'd2.nsys-rep,vllm,gpt-oss,102'),
-        required=True)
-    parser.add_argument('--out_dir', help=('output dir for result.csv/html'))
-    parser.add_argument('--title', help=('title for html chart'))
-    parser.add_argument('--nsys_cmd',
-                        help=('nsys cmd, e.g. /usr/bin/nsys, Default: nsys'),
-                        default="nsys")
+            "list of (nsys-rep, engine, model, elapsed_nonprofiled_sec) "
+            "separated by space. Elapsed_nonprofiled_sec is runtime without "
+            "profiling used to calculate non-gpu time. Specify 0 to use "
+            "elapsed time from nsys-rep but that might inflate non-gpu time. "
+            f"Available engine:[model] are: {engine_model_supported_str} "
+            f"Example: --infile d1.nsys-rep,vllm,llama,100 "
+            "d2.nsys-rep,vllm,gpt-oss,102"
+        ),
+        required=True,
+    )
+    parser.add_argument("--out_dir", help=("output dir for result.csv/html"))
+    parser.add_argument("--title", help=("title for html chart"))
+    parser.add_argument(
+        "--nsys_cmd",
+        help=("nsys cmd, e.g. /usr/bin/nsys, Default: nsys"),
+        default="nsys",
+    )
     args = parser.parse_args()
     gputrace = GPUTrace2Graph()
-    gputrace.gen_graph(args.in_file, args.out_dir, args.title, args.nsys_cmd,
-                       engine_model_supported)
+    gputrace.gen_graph(
+        args.in_file, args.out_dir, args.title, args.nsys_cmd, engine_model_supported
+    )
 
 
-if __name__ == '__main__':
+if __name__ == "__main__":
     main()
diff --git a/tools/profiler/print_layerwise_table.py b/tools/profiler/print_layerwise_table.py
index 209c3a576aee..bc2272bb6af5 100644
--- a/tools/profiler/print_layerwise_table.py
+++ b/tools/profiler/print_layerwise_table.py
@@ -29,48 +29,50 @@ def get_entries(node, curr_depth=0):
 if __name__ == "__main__":
     parser = argparse.ArgumentParser()
 
-    parser.add_argument("--json-trace",
-                        type=str,
-                        required=True,
-                        help="json trace file output by "
-                        "examples/offline_inference/profiling.py")
-    parser.add_argument("--phase",
-                        type=str,
-                        required=True,
-                        help="The phase to print the table for. This is either"
-                        "prefill or decode_n, where n is the decode step "
-                        "number")
-    parser.add_argument("--table",
-                        type=str,
-                        choices=["summary", "model"],
-                        default="summary",
-                        help="Which table to print, the summary table or the "
-                        "layerwise model table")
+    parser.add_argument(
+        "--json-trace",
+        type=str,
+        required=True,
+        help="json trace file output by examples/offline_inference/profiling.py",
+    )
+    parser.add_argument(
+        "--phase",
+        type=str,
+        required=True,
+        help="The phase to print the table for. This is either"
+        "prefill or decode_n, where n is the decode step "
+        "number",
+    )
+    parser.add_argument(
+        "--table",
+        type=str,
+        choices=["summary", "model"],
+        default="summary",
+        help="Which table to print, the summary table or the layerwise model table",
+    )
 
     args = parser.parse_args()
 
     with open(args.json_trace) as f:
         profile_data = json.load(f)
 
-    assert args.phase in profile_data, \
-       (f"Cannot find phase {args.phase} in profile data. Choose one among"
-        f'{[x for x in profile_data.keys() if "prefill" in x or "decode" in x]}') #noqa
+    assert args.phase in profile_data, (
+        f"Cannot find phase {args.phase} in profile data. Choose one among"
+        f"{[x for x in profile_data.keys() if 'prefill' in x or 'decode' in x]}"
+    )  # noqa
 
     if args.table == "summary":
         entries_and_depths = flatten_entries(
-            SummaryStatsEntry, profile_data[args.phase]["summary_stats"])
-        column_widths = dict(name=80,
-                             cuda_time_us=12,
-                             pct_cuda_time=12,
-                             invocations=15)
+            SummaryStatsEntry, profile_data[args.phase]["summary_stats"]
+        )
+        column_widths = dict(name=80, cuda_time_us=12, pct_cuda_time=12, invocations=15)
     elif args.table == "model":
         entries_and_depths = flatten_entries(
-            ModelStatsEntry, profile_data[args.phase]["model_stats"])
-        column_widths = dict(name=60,
-                             cpu_time_us=12,
-                             cuda_time_us=12,
-                             pct_cuda_time=12,
-                             trace=60)
+            ModelStatsEntry, profile_data[args.phase]["model_stats"]
+        )
+        column_widths = dict(
+            name=60, cpu_time_us=12, cuda_time_us=12, pct_cuda_time=12, trace=60
+        )
 
     # indent entry names based on the depth
     entries = []
@@ -78,7 +80,8 @@ def get_entries(node, curr_depth=0):
         entry.name = indent_string(
             entry.name,
             indent=depth,
-            indent_style=lambda indent: "|" + "-" * indent + " ")
+            indent_style=lambda indent: "|" + "-" * indent + " ",
+        )
         entries.append(entry)
 
     TablePrinter(type(entries[0]), column_widths).print_table(entries)
diff --git a/tools/profiler/visualize_layerwise_profile.py b/tools/profiler/visualize_layerwise_profile.py
index 30d6547073d3..cdab004366f9 100644
--- a/tools/profiler/visualize_layerwise_profile.py
+++ b/tools/profiler/visualize_layerwise_profile.py
@@ -18,17 +18,18 @@
 def largest_dist_from_leaf(node: dict, depth: int = 0):
     if len(node["children"]) == 0:
         return depth
-    return max([
-        largest_dist_from_leaf(child, depth=depth + 1)
-        for child in node["children"]
-    ])
-
-
-def get_entries_at_depth(depth: int,
-                         entries_and_traces: list[tuple[Any, Any]],
-                         node: dict,
-                         curr_depth: int = 0,
-                         trace=()):
+    return max(
+        [largest_dist_from_leaf(child, depth=depth + 1) for child in node["children"]]
+    )
+
+
+def get_entries_at_depth(
+    depth: int,
+    entries_and_traces: list[tuple[Any, Any]],
+    node: dict,
+    curr_depth: int = 0,
+    trace=(),
+):
     # assert that the query is at kernel or module level
     assert depth == -1 or depth == -2
 
@@ -40,21 +41,18 @@ def get_entries_at_depth(depth: int,
     if largest_dist_from_leaf(node) == (abs(depth) - 1):
         entries_and_traces.append((node["entry"], trace))
 
-    trace = (node["entry"]["name"], ) + trace
+    trace = (node["entry"]["name"],) + trace
     for child in node["children"]:
-        get_entries_at_depth(depth,
-                             entries_and_traces,
-                             child,
-                             curr_depth=curr_depth + 1,
-                             trace=trace)
+        get_entries_at_depth(
+            depth, entries_and_traces, child, curr_depth=curr_depth + 1, trace=trace
+        )
 
 
 def fold_nodes(root: dict, nodes_to_fold: list[str]):
-
     stack: list[dict] = [root]
     while len(stack) != 0:
         node = stack.pop()
-        if node['entry']['name'] in nodes_to_fold:
+        if node["entry"]["name"] in nodes_to_fold:
             node["children"] = []
             continue
         for child in node["children"]:
@@ -76,9 +74,7 @@ def trim_string_back(string: str, width: int) -> str:
 
 def shorten_plot_legend_strings(legend, max_char_len: int):
     for t in legend.get_texts():
-        t.set_text(
-            trim_string_back(abbreviate_known_names(t.get_text()),
-                             max_char_len))
+        t.set_text(trim_string_back(abbreviate_known_names(t.get_text()), max_char_len))
 
 
 def abbreviate_known_names(name: str) -> str:
@@ -108,15 +104,21 @@ def all_the_same(items) -> bool:
             names.add(entry["name"])
 
     for name in non_unique_names:
-        entries_and_traces_with_name = [(entry, trace)
-                                        for entry, trace in entries_and_traces
-                                        if entry["name"] == name]
+        entries_and_traces_with_name = [
+            (entry, trace)
+            for entry, trace in entries_and_traces
+            if entry["name"] == name
+        ]
 
-        zipped_traces = list(
-            zip(*[trace for _, trace in entries_and_traces_with_name]))
+        zipped_traces = list(zip(*[trace for _, trace in entries_and_traces_with_name]))
         first_trace_difference = next(
-            (i for i, trace_eles in enumerate(zipped_traces)
-             if not all_the_same(trace_eles)), None)
+            (
+                i
+                for i, trace_eles in enumerate(zipped_traces)
+                if not all_the_same(trace_eles)
+            ),
+            None,
+        )
 
         if first_trace_difference is None:
             # can't create a unique name, leave the names as they
@@ -124,34 +126,32 @@ def all_the_same(items) -> bool:
             continue
 
         for entry, trace in entries_and_traces_with_name:
-            entry["name"] = " <- ".join((entry["name"], ) +
-                                        trace[:first_trace_difference + 1])
+            entry["name"] = " <- ".join(
+                (entry["name"],) + trace[: first_trace_difference + 1]
+            )
 
 
 ## Operation grouping utils ####
-'''
+"""
     Group operations in the given dataframe by some high-level ops like,
     - gemms
     - attention
     - rms_norm 
     etc.
-'''
+"""
 
 
 def group_trace_by_operations(trace_df: pd.DataFrame) -> pd.DataFrame:
-
     def is_rms_norm(op_name: str):
         if "rms_norm_kernel" in op_name:
             return True
 
     def is_attention_block(op_name: str):
-        if "flash_fwd" in op_name or \
-            "reshape_and_cache_flash_kernel" in op_name:
+        if "flash_fwd" in op_name or "reshape_and_cache_flash_kernel" in op_name:
             return True
 
     def is_quant(op_name: str):
-        if "scaled_fp8_quant" in op_name or \
-           "scaled_int8_quant" in op_name:
+        if "scaled_fp8_quant" in op_name or "scaled_int8_quant" in op_name:
             return True
 
     # LoRA ops
@@ -168,24 +168,27 @@ def is_bgmv_expand(op_name: str):
         return "bgmv_expand" in op_name
 
     def is_cutlass_gemm_op(op_name: str):
-        return "void cutlass::Kernel" in op_name or \
-           "void cutlass::device_kernel" in op_name
+        return (
+            "void cutlass::Kernel" in op_name
+            or "void cutlass::device_kernel" in op_name
+        )
 
     def is_gemm_op(op_name: str):
         if is_quant(op_name):
             return False
-        return is_cutlass_gemm_op(op_name) or \
-           "xmma_gemm" in op_name  or \
-           "gemv2T_kernel" in op_name or \
-           "splitKreduce" in op_name or \
-           "s16816gemm" in op_name
+        return (
+            is_cutlass_gemm_op(op_name)
+            or "xmma_gemm" in op_name
+            or "gemv2T_kernel" in op_name
+            or "splitKreduce" in op_name
+            or "s16816gemm" in op_name
+        )
 
     def is_elementwise_op(op_name: str):
         return "elementwise_kernel" in op_name
 
     def is_mem_op(op_name: str):
-        return "memcpy" in op_name.lower() or \
-               "memset" in op_name.lower()
+        return "memcpy" in op_name.lower() or "memset" in op_name.lower()
 
     def is_vocab_embedding_op(op_name: str):
         return "vocabparallelembed" in op_name.lower()
@@ -195,17 +198,15 @@ def is_nccl_op(op_name: str):
         return "nccl" in op_name.lower()
 
     def is_nccl_all_reduce(op_name: str):
-        return is_nccl_op(op_name) and \
-                ("all_reduce" in op_name.lower() or \
-                "allreduce" in op_name.lower())
+        return is_nccl_op(op_name) and (
+            "all_reduce" in op_name.lower() or "allreduce" in op_name.lower()
+        )
 
     def is_nccl_gather(op_name: str):
-        return is_nccl_op(op_name) and \
-                "gather" in op_name.lower()
+        return is_nccl_op(op_name) and "gather" in op_name.lower()
 
     def is_nccl_broadcast(op_name: str):
-        return is_nccl_op(op_name) and \
-                "broadcast" in op_name.lower()
+        return is_nccl_op(op_name) and "broadcast" in op_name.lower()
 
     # Reduce ops types
     def is_cross_device_reduce_1stage(op_name: str):
@@ -269,114 +270,122 @@ def is_reduce_kernel(op_name: str):
     ops = list(filter(lambda x: x not in nccl_other_ops, ops))
 
     cross_device_reduce_1stage_ops = list(
-        filter(lambda x: is_cross_device_reduce_1stage(x), ops))
+        filter(lambda x: is_cross_device_reduce_1stage(x), ops)
+    )
     ops = list(filter(lambda x: x not in cross_device_reduce_1stage_ops, ops))
 
     cross_device_reduce_2stage_ops = list(
-        filter(lambda x: is_cross_device_reduce_2stage(x), ops))
+        filter(lambda x: is_cross_device_reduce_2stage(x), ops)
+    )
     ops = list(filter(lambda x: x not in cross_device_reduce_2stage_ops, ops))
 
-    custom_ar_all_reduce_ops = list(
-        filter(lambda x: is_custom_ar_all_reduce(x), ops))
+    custom_ar_all_reduce_ops = list(filter(lambda x: is_custom_ar_all_reduce(x), ops))
     ops = list(filter(lambda x: x not in custom_ar_all_reduce_ops, ops))
 
     reduce_kernel_ops = list(filter(lambda x: is_reduce_kernel(x), ops))
     ops = list(filter(lambda x: x not in reduce_kernel_ops, ops))
 
     if len(attention_ops):
-        trace_df['attention'] = trace_df[attention_ops].agg("sum", axis=1)
+        trace_df["attention"] = trace_df[attention_ops].agg("sum", axis=1)
     if len(quant_ops):
-        trace_df['quant_ops'] = trace_df[quant_ops].agg("sum", axis=1)
+        trace_df["quant_ops"] = trace_df[quant_ops].agg("sum", axis=1)
 
     if len(sgmv_shrink_ops):
-        trace_df['sgmv_shrink_ops'] = trace_df[sgmv_shrink_ops].agg("sum",
-                                                                    axis=1)
+        trace_df["sgmv_shrink_ops"] = trace_df[sgmv_shrink_ops].agg("sum", axis=1)
     if len(sgmv_expand_ops):
-        trace_df['sgmv_expand_ops'] = trace_df[sgmv_expand_ops].agg("sum",
-                                                                    axis=1)
+        trace_df["sgmv_expand_ops"] = trace_df[sgmv_expand_ops].agg("sum", axis=1)
     if len(bgmv_shrink_ops):
-        trace_df['bgmv_shrink_ops'] = trace_df[bgmv_shrink_ops].agg("sum",
-                                                                    axis=1)
+        trace_df["bgmv_shrink_ops"] = trace_df[bgmv_shrink_ops].agg("sum", axis=1)
     if len(bgmv_expand_ops):
-        trace_df['bgmv_expand_ops'] = trace_df[bgmv_expand_ops].agg("sum",
-                                                                    axis=1)
+        trace_df["bgmv_expand_ops"] = trace_df[bgmv_expand_ops].agg("sum", axis=1)
 
     if len(cutlass_gemm_ops):
-        trace_df['cutlass_gemm_ops'] = trace_df[cutlass_gemm_ops].agg("sum",
-                                                                      axis=1)
+        trace_df["cutlass_gemm_ops"] = trace_df[cutlass_gemm_ops].agg("sum", axis=1)
 
     if len(gemm_ops):
-        trace_df['gemm_ops'] = trace_df[gemm_ops].agg("sum", axis=1)
+        trace_df["gemm_ops"] = trace_df[gemm_ops].agg("sum", axis=1)
     if len(rms_norm_ops):
-        trace_df['rms_norm_ops'] = trace_df[rms_norm_ops].agg("sum", axis=1)
+        trace_df["rms_norm_ops"] = trace_df[rms_norm_ops].agg("sum", axis=1)
     if len(vocab_embed_ops):
-        trace_df['vocab_embed_ops'] = trace_df[vocab_embed_ops].agg("sum",
-                                                                    axis=1)
+        trace_df["vocab_embed_ops"] = trace_df[vocab_embed_ops].agg("sum", axis=1)
     if len(mem_ops):
-        trace_df['mem_ops'] = trace_df[mem_ops].agg("sum", axis=1)
+        trace_df["mem_ops"] = trace_df[mem_ops].agg("sum", axis=1)
     if len(elementwise_ops):
-        trace_df['elementwise_ops'] = trace_df[elementwise_ops].agg("sum",
-                                                                    axis=1)
+        trace_df["elementwise_ops"] = trace_df[elementwise_ops].agg("sum", axis=1)
 
     if len(nccl_all_reduce_ops):
-        trace_df['nccl_all_reduce_ops'] = trace_df[nccl_all_reduce_ops].agg(
-            "sum", axis=1)
+        trace_df["nccl_all_reduce_ops"] = trace_df[nccl_all_reduce_ops].agg(
+            "sum", axis=1
+        )
     if len(nccl_gather_ops):
-        trace_df['nccl_gather_ops'] = trace_df[nccl_gather_ops].agg("sum",
-                                                                    axis=1)
+        trace_df["nccl_gather_ops"] = trace_df[nccl_gather_ops].agg("sum", axis=1)
     if len(nccl_broadcast_ops):
-        trace_df['nccl_broadcast_ops'] = trace_df[nccl_broadcast_ops].agg(
-            "sum", axis=1)
+        trace_df["nccl_broadcast_ops"] = trace_df[nccl_broadcast_ops].agg("sum", axis=1)
     if len(nccl_other_ops):
-        trace_df['nccl_other_ops'] = trace_df[nccl_other_ops].agg("sum",
-                                                                  axis=1)
+        trace_df["nccl_other_ops"] = trace_df[nccl_other_ops].agg("sum", axis=1)
 
     if len(cross_device_reduce_1stage_ops):
-        trace_df['cross_device_reduce_1stage_ops'] = trace_df[
-            cross_device_reduce_1stage_ops].agg("sum", axis=1)
+        trace_df["cross_device_reduce_1stage_ops"] = trace_df[
+            cross_device_reduce_1stage_ops
+        ].agg("sum", axis=1)
     if len(cross_device_reduce_2stage_ops):
-        trace_df['cross_device_reduce_2stage_ops'] = trace_df[
-            cross_device_reduce_2stage_ops].agg("sum", axis=1)
+        trace_df["cross_device_reduce_2stage_ops"] = trace_df[
+            cross_device_reduce_2stage_ops
+        ].agg("sum", axis=1)
     if len(custom_ar_all_reduce_ops):
-        trace_df['custom_ar_all_reduce_ops'] = trace_df[
-            custom_ar_all_reduce_ops].agg("sum", axis=1)
+        trace_df["custom_ar_all_reduce_ops"] = trace_df[custom_ar_all_reduce_ops].agg(
+            "sum", axis=1
+        )
     if len(reduce_kernel_ops):
-        trace_df['reduce_kernel_ops'] = trace_df[reduce_kernel_ops].agg("sum",
-                                                                        axis=1)
-
-    trace_df.drop(attention_ops + quant_ops + sgmv_shrink_ops +
-                  sgmv_expand_ops + bgmv_shrink_ops + bgmv_expand_ops +
-                  cutlass_gemm_ops + gemm_ops + rms_norm_ops +
-                  vocab_embed_ops + mem_ops + elementwise_ops +
-                  nccl_all_reduce_ops + nccl_gather_ops + nccl_broadcast_ops +
-                  nccl_other_ops + cross_device_reduce_1stage_ops +
-                  cross_device_reduce_2stage_ops + custom_ar_all_reduce_ops +
-                  reduce_kernel_ops,
-                  axis=1,
-                  inplace=True)
+        trace_df["reduce_kernel_ops"] = trace_df[reduce_kernel_ops].agg("sum", axis=1)
+
+    trace_df.drop(
+        attention_ops
+        + quant_ops
+        + sgmv_shrink_ops
+        + sgmv_expand_ops
+        + bgmv_shrink_ops
+        + bgmv_expand_ops
+        + cutlass_gemm_ops
+        + gemm_ops
+        + rms_norm_ops
+        + vocab_embed_ops
+        + mem_ops
+        + elementwise_ops
+        + nccl_all_reduce_ops
+        + nccl_gather_ops
+        + nccl_broadcast_ops
+        + nccl_other_ops
+        + cross_device_reduce_1stage_ops
+        + cross_device_reduce_2stage_ops
+        + custom_ar_all_reduce_ops
+        + reduce_kernel_ops,
+        axis=1,
+        inplace=True,
+    )
     return trace_df
 
 
 ## Data plotting utils ####
 
 
-def plot_trace_df(traces_df: pd.DataFrame,
-                  plot_metric: str,
-                  plot_title: str,
-                  output: Optional[Path] = None):
-
+def plot_trace_df(
+    traces_df: pd.DataFrame,
+    plot_metric: str,
+    plot_title: str,
+    output: Optional[Path] = None,
+):
     def get_phase_description(traces_df: pd.DataFrame, phase: str) -> str:
         phase_df = traces_df.query(f'phase == "{phase}"')
-        descs = phase_df['phase_desc'].to_list()
+        descs = phase_df["phase_desc"].to_list()
         assert all([desc == descs[0] for desc in descs])
         return descs[0]
 
-    phases = traces_df['phase'].unique()
+    phases = traces_df["phase"].unique()
     phase_descs = [get_phase_description(traces_df, p) for p in phases]
-    traces_df = traces_df.pivot_table(index="phase",
-                                      columns="name",
-                                      values=plot_metric,
-                                      aggfunc="sum")
+    traces_df = traces_df.pivot_table(
+        index="phase", columns="name", values=plot_metric, aggfunc="sum"
+    )
 
     traces_df = group_trace_by_operations(traces_df)
 
@@ -396,20 +405,19 @@ def get_phase_description(traces_df: pd.DataFrame, phase: str) -> str:
     # Write the values as text on the bars
     for bar in ax.patches:
         if bar.get_height() != 0:
-            ax.text(bar.get_x() + bar.get_width() / 2,
-                    bar.get_height() / 2 + bar.get_y(),
-                    f"{round(bar.get_height(), 2)}",
-                    ha='center',
-                    color='w',
-                    weight='bold',
-                    size=5)
+            ax.text(
+                bar.get_x() + bar.get_width() / 2,
+                bar.get_height() / 2 + bar.get_y(),
+                f"{round(bar.get_height(), 2)}",
+                ha="center",
+                color="w",
+                weight="bold",
+                size=5,
+            )
 
     # Setup legend
     handles, labels = plt.gca().get_legend_handles_labels()
-    legend = fig.legend(handles,
-                        labels,
-                        loc='center left',
-                        bbox_to_anchor=(1, 1))
+    legend = fig.legend(handles, labels, loc="center left", bbox_to_anchor=(1, 1))
     shorten_plot_legend_strings(legend, 50)
 
     # Setup labels and title
@@ -417,21 +425,20 @@ def get_phase_description(traces_df: pd.DataFrame, phase: str) -> str:
     ax.set_ylabel(plot_metric)
     plt.suptitle(plot_title)
 
-    plt.savefig(output, bbox_inches='tight')
+    plt.savefig(output, bbox_inches="tight")
     print("Created: ", output)
 
 
 def main(
-        json_trace: Path,
-        output_directory: Path,
-        depth: int,  # Fetch/Plot operations at this depth of the Json tree
-        plot_metric: str,
-        make_names_unique: bool,
-        top_k: int,
-        json_nodes_to_fold: list[str]):
-
+    json_trace: Path,
+    output_directory: Path,
+    depth: int,  # Fetch/Plot operations at this depth of the Json tree
+    plot_metric: str,
+    make_names_unique: bool,
+    top_k: int,
+    json_nodes_to_fold: list[str],
+):
     def prepare_data(profile_json: dict, step_keys: list[str]) -> pd.DataFrame:
-
         def get_entries_and_traces(key: str):
             entries_and_traces: list[tuple[Any, Any]] = []
             for root in profile_json[key]["summary_stats"]:
@@ -441,16 +448,14 @@ def get_entries_and_traces(key: str):
                 get_entries_at_depth(depth, entries_and_traces, root)
             return entries_and_traces
 
-        def keep_only_top_entries(df: pd.DataFrame,
-                                  metric: str,
-                                  top_k: int = 9) -> pd.DataFrame:
-            df.loc[df.nsmallest(len(df) - top_k + 1, metric).index,
-                   ["name"]] = "others"
+        def keep_only_top_entries(
+            df: pd.DataFrame, metric: str, top_k: int = 9
+        ) -> pd.DataFrame:
+            df.loc[df.nsmallest(len(df) - top_k + 1, metric).index, ["name"]] = "others"
             return df
 
         def get_phase_description(key: str) -> str:
-            num_running_seqs = profile_json[key]['metadata'][
-                'num_running_seqs']
+            num_running_seqs = profile_json[key]["metadata"]["num_running_seqs"]
             if num_running_seqs is not None:
                 return f"{key}-seqs-{num_running_seqs}"
             else:
@@ -466,20 +471,24 @@ def get_phase_description(key: str) -> str:
 
         # To pandas dataframe
         trace_dfs = list(
-            map(lambda t: pd.DataFrame([entry for entry, _ in t]).fillna(0),
-                traces))
+            map(lambda t: pd.DataFrame([entry for entry, _ in t]).fillna(0), traces)
+        )
 
         # Respect top_k
         if top_k:
             trace_dfs = list(
                 map(
                     lambda trace_df: keep_only_top_entries(
-                        trace_df, "cuda_time_us", top_k), trace_dfs))
+                        trace_df, "cuda_time_us", top_k
+                    ),
+                    trace_dfs,
+                )
+            )
 
         # Fill in information about the step-keys
         for trace_df, step_key in zip(trace_dfs, step_keys):
-            trace_df['phase'] = step_key
-            trace_df['phase_desc'] = get_phase_description(step_key)
+            trace_df["phase"] = step_key
+            trace_df["phase_desc"] = get_phase_description(step_key)
 
         # Combine all data frames so they can be put in a single plot
         traces_df = pd.concat(trace_dfs)
@@ -492,17 +501,23 @@ def get_phase_description(key: str) -> str:
 
     def make_plot_title_suffix(profile_json: dict) -> str:
         context = profile_json["context"]
-        sparsity = context.get('sparsity', None)
-        run_type = \
-            f'Run {context["num_steps"]} steps' if context['num_steps'] else \
-                (f'Complete {context["complete_num_requests_per_step"]} per '
-                 f'step; Run till completion')
-        return (f"{context['engine_args']['model']}\n"
-                f"Batch={context['batch_size']}, "
-                f"PromptLen={context['prompt_len']}, "
-                f"NumGpus={context['engine_args']['tensor_parallel_size']}"
-                f"{', Sparsity ' + sparsity if sparsity else ''}\n"
-                f"Run Type: {run_type}")
+        sparsity = context.get("sparsity", None)
+        run_type = (
+            f"Run {context['num_steps']} steps"
+            if context["num_steps"]
+            else (
+                f"Complete {context['complete_num_requests_per_step']} per "
+                f"step; Run till completion"
+            )
+        )
+        return (
+            f"{context['engine_args']['model']}\n"
+            f"Batch={context['batch_size']}, "
+            f"PromptLen={context['prompt_len']}, "
+            f"NumGpus={context['engine_args']['tensor_parallel_size']}"
+            f"{', Sparsity ' + sparsity if sparsity else ''}\n"
+            f"Run Type: {run_type}"
+        )
 
     profile_json = None
     with open(json_trace) as f:
@@ -511,14 +526,14 @@ def make_plot_title_suffix(profile_json: dict) -> str:
 
     # Get all `llm.generate.step()` profile
     step_traces = list(profile_json.keys())
-    assert (step_traces[0] == 'context')
+    assert step_traces[0] == "context"
     step_traces = step_traces[1:]  # have only prefill and decodes
     prefills = list(filter(lambda x: "prefill" in x, step_traces))
     all_decodes = list(filter(lambda x: "decode" in x, step_traces))
     assert len(prefills) + len(all_decodes) == len(step_traces)
     assert len(prefills) == 1
 
-    decodes = all_decodes[::args.step_plot_interval]
+    decodes = all_decodes[:: args.step_plot_interval]
     if decodes[-1] != all_decodes[-1]:
         # Always have the last decode
         decodes.append(all_decodes[-1])
@@ -528,48 +543,63 @@ def make_plot_title_suffix(profile_json: dict) -> str:
 
     plot_title_suffix = make_plot_title_suffix(profile_json)
 
-    plot_trace_df(prefill_traces, plot_metric, "prefill " + plot_title_suffix,
-                  output_directory / Path("prefill.png"))
-    plot_trace_df(decode_traces, plot_metric, "decodes " + plot_title_suffix,
-                  output_directory / Path("decode_steps.png"))
+    plot_trace_df(
+        prefill_traces,
+        plot_metric,
+        "prefill " + plot_title_suffix,
+        output_directory / Path("prefill.png"),
+    )
+    plot_trace_df(
+        decode_traces,
+        plot_metric,
+        "decodes " + plot_title_suffix,
+        output_directory / Path("decode_steps.png"),
+    )
 
 
 if __name__ == "__main__":
     parser = argparse.ArgumentParser()
 
-    parser.add_argument("--json-trace",
-                        type=str,
-                        required=True,
-                        help="json trace file output by \
-                              examples/offline_inference/profiling.py")
-    parser.add_argument("--output-directory",
-                        type=str,
-                        required=False,
-                        help="Directory to output plots")
-    parser.add_argument("--level",
-                        type=str,
-                        default="module",
-                        choices=["module", "kernel"])
-    parser.add_argument("--top-k",
-                        type=int,
-                        default=12,
-                        help="Only graph the top `top_k` entries by time.")
-    parser.add_argument("--fold-json-node",
-                        nargs='+',
-                        default=['Sampler', 'LogitsProcessor'],
-                        help='Do not plot the children of these nodes. Let, \
+    parser.add_argument(
+        "--json-trace",
+        type=str,
+        required=True,
+        help="json trace file output by \
+                              examples/offline_inference/profiling.py",
+    )
+    parser.add_argument(
+        "--output-directory", type=str, required=False, help="Directory to output plots"
+    )
+    parser.add_argument(
+        "--level", type=str, default="module", choices=["module", "kernel"]
+    )
+    parser.add_argument(
+        "--top-k",
+        type=int,
+        default=12,
+        help="Only graph the top `top_k` entries by time.",
+    )
+    parser.add_argument(
+        "--fold-json-node",
+        nargs="+",
+        default=["Sampler", "LogitsProcessor"],
+        help="Do not plot the children of these nodes. Let, \
                               the node represent the aggregate of all its \
-                              children')
-    parser.add_argument("--plot-metric",
-                        type=str,
-                        default="cuda_time_ms",
-                        help='Metric to plot. some options are cuda_time_ms, \
-                                pct_cuda_time')
+                              children",
+    )
+    parser.add_argument(
+        "--plot-metric",
+        type=str,
+        default="cuda_time_ms",
+        help="Metric to plot. some options are cuda_time_ms, \
+                                pct_cuda_time",
+    )
     parser.add_argument(
         "--step-plot-interval",
         type=int,
         default=4,
-        help="For every `step_plot_interval` steps, plot 1 step")
+        help="For every `step_plot_interval` steps, plot 1 step",
+    )
 
     args = parser.parse_args()
 
@@ -583,11 +613,19 @@ def make_plot_title_suffix(profile_json: dict) -> str:
     else:
         raise Exception(f"Unexpected level value ({args.level})")
 
-    output_directory = args.output_directory if args.output_directory else Path(
-        args.json_trace).parent
+    output_directory = (
+        args.output_directory if args.output_directory else Path(args.json_trace).parent
+    )
 
     if not os.path.exists(output_directory):
         os.makedirs(output_directory)
 
-    main(Path(args.json_trace), output_directory, depth, args.plot_metric,
-         make_names_unique, args.top_k, args.fold_json_node)
+    main(
+        Path(args.json_trace),
+        output_directory,
+        depth,
+        args.plot_metric,
+        make_names_unique,
+        args.top_k,
+        args.fold_json_node,
+    )
diff --git a/tools/report_build_time_ninja.py b/tools/report_build_time_ninja.py
index 7386cdd9f724..fe3f352fe153 100644
--- a/tools/report_build_time_ninja.py
+++ b/tools/report_build_time_ninja.py
@@ -83,9 +83,9 @@ def WeightedDuration(self):
         """
         # Allow for modest floating-point errors
         epsilon = 0.000002
-        if (self.weighted_duration > self.Duration() + epsilon):
-            print('{} > {}?'.format(self.weighted_duration, self.Duration()))
-        assert (self.weighted_duration <= self.Duration() + epsilon)
+        if self.weighted_duration > self.Duration() + epsilon:
+            print("{} > {}?".format(self.weighted_duration, self.Duration()))
+        assert self.weighted_duration <= self.Duration() + epsilon
         return self.weighted_duration
 
     def DescribeTargets(self):
@@ -93,10 +93,10 @@ def DescribeTargets(self):
         # Some build steps generate dozens of outputs - handle them sanely.
         # The max_length was chosen so that it can fit most of the long
         # single-target names, while minimizing word wrapping.
-        result = ', '.join(self.targets)
+        result = ", ".join(self.targets)
         max_length = 65
         if len(result) > max_length:
-            result = result[:max_length] + '...'
+            result = result[:max_length] + "..."
         return result
 
 
@@ -106,12 +106,13 @@ def ReadTargets(log, show_all):
 
     The result is a list of Target objects."""
     header = log.readline()
-    assert header == '# ninja log v5\n', \
-           'unrecognized ninja log version {!r}'.format(header)
+    assert header == "# ninja log v5\n", "unrecognized ninja log version {!r}".format(
+        header
+    )
     targets_dict = {}
     last_end_seen = 0.0
     for line in log:
-        parts = line.strip().split('\t')
+        parts = line.strip().split("\t")
         if len(parts) != 5:
             # If ninja.exe is rudely halted then the .ninja_log file may be
             # corrupt. Silently continue.
@@ -150,17 +151,17 @@ def ReadTargets(log, show_all):
 def GetExtension(target, extra_patterns):
     """Return the file extension that best represents a target.
 
-  For targets that generate multiple outputs it is important to return a
-  consistent 'canonical' extension. Ultimately the goal is to group build steps
-  by type."""
+    For targets that generate multiple outputs it is important to return a
+    consistent 'canonical' extension. Ultimately the goal is to group build steps
+    by type."""
     for output in target.targets:
         if extra_patterns:
-            for fn_pattern in extra_patterns.split(';'):
-                if fnmatch.fnmatch(output, '*' + fn_pattern + '*'):
+            for fn_pattern in extra_patterns.split(";"):
+                if fnmatch.fnmatch(output, "*" + fn_pattern + "*"):
                     return fn_pattern
         # Not a true extension, but a good grouping.
-        if output.endswith('type_mappings'):
-            extension = 'type_mappings'
+        if output.endswith("type_mappings"):
+            extension = "type_mappings"
             break
 
         # Capture two extensions if present. For example: file.javac.jar should
@@ -170,26 +171,26 @@ def GetExtension(target, extra_patterns):
         extension = ext2 + ext1  # Preserve the order in the file name.
 
         if len(extension) == 0:
-            extension = '(no extension found)'
+            extension = "(no extension found)"
 
-        if ext1 in ['.pdb', '.dll', '.exe']:
-            extension = 'PEFile (linking)'
+        if ext1 in [".pdb", ".dll", ".exe"]:
+            extension = "PEFile (linking)"
             # Make sure that .dll and .exe are grouped together and that the
             # .dll.lib files don't cause these to be listed as libraries
             break
-        if ext1 in ['.so', '.TOC']:
-            extension = '.so (linking)'
+        if ext1 in [".so", ".TOC"]:
+            extension = ".so (linking)"
             # Attempt to identify linking, avoid identifying as '.TOC'
             break
         # Make sure .obj files don't get categorized as mojo files
-        if ext1 in ['.obj', '.o']:
+        if ext1 in [".obj", ".o"]:
             break
         # Jars are the canonical output of java targets.
-        if ext1 == '.jar':
+        if ext1 == ".jar":
             break
         # Normalize all mojo related outputs to 'mojo'.
-        if output.count('.mojom') > 0:
-            extension = 'mojo'
+        if output.count(".mojom") > 0:
+            extension = "mojo"
             break
     return extension
 
@@ -214,8 +215,8 @@ def SummarizeEntries(entries, extra_step_types):
         if target.end > latest:
             latest = target.end
         total_cpu_time += target.Duration()
-        task_start_stop_times.append((target.start, 'start', target))
-        task_start_stop_times.append((target.end, 'stop', target))
+        task_start_stop_times.append((target.start, "start", target))
+        task_start_stop_times.append((target.end, "stop", target))
     length = latest - earliest
     weighted_total = 0.0
 
@@ -241,10 +242,10 @@ def SummarizeEntries(entries, extra_step_types):
         if num_running > 0:
             # Update the total weighted time up to this moment.
             last_weighted_time += (time - last_time) / float(num_running)
-        if action_name == 'start':
+        if action_name == "start":
             # Record the total weighted task time when this task starts.
             running_tasks[target] = last_weighted_time
-        if action_name == 'stop':
+        if action_name == "stop":
             # Record the change in the total weighted task time while this task
             # ran.
             weighted_duration = last_weighted_time - running_tasks[target]
@@ -252,13 +253,16 @@ def SummarizeEntries(entries, extra_step_types):
             weighted_total += weighted_duration
             del running_tasks[target]
         last_time = time
-    assert (len(running_tasks) == 0)
+    assert len(running_tasks) == 0
 
     # Warn if the sum of weighted times is off by more than half a second.
     if abs(length - weighted_total) > 500:
-        print('Warning: Possible corrupt ninja log, results may be '
-              'untrustworthy. Length = {:.3f}, weighted total = {:.3f}'.format(
-                  length, weighted_total))
+        print(
+            "Warning: Possible corrupt ninja log, results may be "
+            "untrustworthy. Length = {:.3f}, weighted total = {:.3f}".format(
+                length, weighted_total
+            )
+        )
 
     entries_by_ext = defaultdict(list)
     for target in entries:
@@ -266,32 +270,38 @@ def SummarizeEntries(entries, extra_step_types):
         entries_by_ext[extension].append(target)
 
     for key, values in entries_by_ext.items():
-        print('    Longest build steps for {}:'.format(key))
+        print("    Longest build steps for {}:".format(key))
         values.sort(key=lambda x: x.WeightedDuration())
         for target in values[-long_count:]:
             print(
-                '      {:8.1f} weighted s to build {} ({:.1f} s elapsed time)'.
-                format(target.WeightedDuration(), target.DescribeTargets(),
-                       target.Duration()))
-
-    print('    {:.1f} s weighted time ({:.1f} s elapsed time sum, {:1.1f}x '
-          'parallelism)'.format(length, total_cpu_time,
-                                total_cpu_time * 1.0 / length))
-    print('    {} build steps completed, average of {:1.2f}/s'.format(
-        len(entries),
-        len(entries) / (length)))
+                "      {:8.1f} weighted s to build {} ({:.1f} s elapsed time)".format(
+                    target.WeightedDuration(),
+                    target.DescribeTargets(),
+                    target.Duration(),
+                )
+            )
+
+    print(
+        "    {:.1f} s weighted time ({:.1f} s elapsed time sum, {:1.1f}x "
+        "parallelism)".format(length, total_cpu_time, total_cpu_time * 1.0 / length)
+    )
+    print(
+        "    {} build steps completed, average of {:1.2f}/s".format(
+            len(entries), len(entries) / (length)
+        )
+    )
 
 
 def main():
-    log_file = '.ninja_log'
+    log_file = ".ninja_log"
     parser = argparse.ArgumentParser()
-    parser.add_argument('-C', dest='build_directory', help='Build directory.')
+    parser.add_argument("-C", dest="build_directory", help="Build directory.")
     parser.add_argument(
-        '-s',
-        '--step-types',
-        help='semicolon separated fnmatch patterns for build-step grouping')
-    parser.add_argument('--log-file',
-                        help="specific ninja log file to analyze.")
+        "-s",
+        "--step-types",
+        help="semicolon separated fnmatch patterns for build-step grouping",
+    )
+    parser.add_argument("--log-file", help="specific ninja log file to analyze.")
     args, _extra_args = parser.parse_known_args()
     if args.build_directory:
         log_file = os.path.join(args.build_directory, log_file)
@@ -300,17 +310,16 @@ def main():
     if args.step_types:
         # Make room for the extra build types.
         global long_ext_count
-        long_ext_count += len(args.step_types.split(';'))
+        long_ext_count += len(args.step_types.split(";"))
 
     try:
         with open(log_file) as log:
             entries = ReadTargets(log, False)
             SummarizeEntries(entries, args.step_types)
     except OSError:
-        print('Log file {!r} not found, no build summary created.'.format(
-            log_file))
+        print("Log file {!r} not found, no build summary created.".format(log_file))
         return errno.ENOENT
 
 
-if __name__ == '__main__':
+if __name__ == "__main__":
     sys.exit(main())
diff --git a/tools/validate_config.py b/tools/validate_config.py
index f6439fa9ada5..d779edabc841 100644
--- a/tools/validate_config.py
+++ b/tools/validate_config.py
@@ -38,10 +38,12 @@ def pairwise(iterable):
     # Consider each pair of nodes.
     for a, b in pairwise(cls_node.body):
         # Must be an assignment then a constant string.
-        if (not isinstance(a, (ast.Assign, ast.AnnAssign))
-                or not isinstance(b, ast.Expr)
-                or not isinstance(b.value, ast.Constant)
-                or not isinstance(b.value.value, str)):
+        if (
+            not isinstance(a, (ast.Assign, ast.AnnAssign))
+            or not isinstance(b, ast.Expr)
+            or not isinstance(b.value, ast.Constant)
+            or not isinstance(b.value.value, str)
+        ):
             continue
 
         doc = inspect.cleandoc(b.value.value)
@@ -61,25 +63,27 @@ def pairwise(iterable):
 
 
 class ConfigValidator(ast.NodeVisitor):
-
-    def __init__(self):
-        ...
+    def __init__(self): ...
 
     def visit_ClassDef(self, node):
         # Validate class with both @config and @dataclass decorators
         decorators = [
-            id for d in node.decorator_list if (isinstance(d, ast.Name) and (
-                (id := d.id) == 'config' or id == 'dataclass')) or
-            (isinstance(d, ast.Call) and (isinstance(d.func, ast.Name) and
-                                          (id := d.func.id) == 'dataclass'))
+            id
+            for d in node.decorator_list
+            if (
+                isinstance(d, ast.Name)
+                and ((id := d.id) == "config" or id == "dataclass")
+            )
+            or (
+                isinstance(d, ast.Call)
+                and (isinstance(d.func, ast.Name) and (id := d.func.id) == "dataclass")
+            )
         ]
 
-        if set(decorators) == {'config', 'dataclass'}:
+        if set(decorators) == {"config", "dataclass"}:
             validate_class(node)
-        elif set(decorators) == {'config'}:
-            fail(
-                f"Class {node.name} with config decorator must be a dataclass.",
-                node)
+        elif set(decorators) == {"config"}:
+            fail(f"Class {node.name} with config decorator must be a dataclass.", node)
 
         self.generic_visit(node)
 
@@ -93,9 +97,11 @@ def validate_class(class_node: ast.ClassDef):
             # Skip ClassVar and InitVar
             # see https://docs.python.org/3/library/dataclasses.html#class-variables
             # and https://docs.python.org/3/library/dataclasses.html#init-only-variables
-            if (isinstance(stmt.annotation, ast.Subscript)
-                    and isinstance(stmt.annotation.value, ast.Name)
-                    and stmt.annotation.value.id in {"ClassVar", "InitVar"}):
+            if (
+                isinstance(stmt.annotation, ast.Subscript)
+                and isinstance(stmt.annotation.value, ast.Name)
+                and stmt.annotation.value.id in {"ClassVar", "InitVar"}
+            ):
                 continue
 
             if isinstance(stmt.target, ast.Name):
@@ -103,22 +109,30 @@ def validate_class(class_node: ast.ClassDef):
                 if stmt.value is None:
                     fail(
                         f"Field '{field_name}' in {class_node.name} must have "
-                        "a default value.", stmt)
+                        "a default value.",
+                        stmt,
+                    )
 
                 if field_name not in attr_docs:
                     fail(
                         f"Field '{field_name}' in {class_node.name} must have "
-                        "a docstring.", stmt)
+                        "a docstring.",
+                        stmt,
+                    )
 
-                if isinstance(stmt.annotation, ast.Subscript) and \
-                   isinstance(stmt.annotation.value, ast.Name) \
-                    and stmt.annotation.value.id == "Union" and \
-                        isinstance(stmt.annotation.slice, ast.Tuple):
+                if (
+                    isinstance(stmt.annotation, ast.Subscript)
+                    and isinstance(stmt.annotation.value, ast.Name)
+                    and stmt.annotation.value.id == "Union"
+                    and isinstance(stmt.annotation.slice, ast.Tuple)
+                ):
                     args = stmt.annotation.slice.elts
                     literal_args = [
-                        arg for arg in args
-                        if isinstance(arg, ast.Subscript) and isinstance(
-                            arg.value, ast.Name) and arg.value.id == "Literal"
+                        arg
+                        for arg in args
+                        if isinstance(arg, ast.Subscript)
+                        and isinstance(arg.value, ast.Name)
+                        and arg.value.id == "Literal"
                     ]
                     if len(literal_args) > 1:
                         fail(
@@ -126,7 +140,9 @@ def validate_class(class_node: ast.ClassDef):
                             "use a single "
                             "Literal type. Please use 'Literal[Literal1, "
                             "Literal2]' instead of 'Union[Literal1, Literal2]'"
-                            ".", stmt)
+                            ".",
+                            stmt,
+                        )
 
 
 def validate_ast(tree: ast.stmt):
diff --git a/use_existing_torch.py b/use_existing_torch.py
index 76480f3e58fe..fd4caa69ec9c 100644
--- a/use_existing_torch.py
+++ b/use_existing_torch.py
@@ -3,7 +3,7 @@
 
 import glob
 
-requires_files = glob.glob('requirements/*.txt')
+requires_files = glob.glob("requirements/*.txt")
 requires_files += ["pyproject.toml"]
 for file in requires_files:
     print(f">>> cleaning {file}")
@@ -11,11 +11,11 @@
         lines = f.readlines()
     if "torch" in "".join(lines).lower():
         print("removed:")
-        with open(file, 'w') as f:
+        with open(file, "w") as f:
             for line in lines:
-                if 'torch' not in line.lower():
+                if "torch" not in line.lower():
                     f.write(line)
                 else:
                     print(line.strip())
     print(f"<<< done cleaning {file}")
-    print()
\ No newline at end of file
+    print()
diff --git a/vllm/__init__.py b/vllm/__init__.py
index 3a5c1b1ce0da..b9c868de6886 100644
--- a/vllm/__init__.py
+++ b/vllm/__init__.py
@@ -48,12 +48,18 @@
     from vllm.executor.ray_utils import initialize_ray_cluster
     from vllm.inputs import PromptType, TextPrompt, TokensPrompt
     from vllm.model_executor.models import ModelRegistry
-    from vllm.outputs import (ClassificationOutput,
-                              ClassificationRequestOutput, CompletionOutput,
-                              EmbeddingOutput, EmbeddingRequestOutput,
-                              PoolingOutput, PoolingRequestOutput,
-                              RequestOutput, ScoringOutput,
-                              ScoringRequestOutput)
+    from vllm.outputs import (
+        ClassificationOutput,
+        ClassificationRequestOutput,
+        CompletionOutput,
+        EmbeddingOutput,
+        EmbeddingRequestOutput,
+        PoolingOutput,
+        PoolingRequestOutput,
+        RequestOutput,
+        ScoringOutput,
+        ScoringRequestOutput,
+    )
     from vllm.pooling_params import PoolingParams
     from vllm.sampling_params import SamplingParams
 
@@ -68,8 +74,7 @@ def __getattr__(name: str) -> typing.Any:
             module = import_module(module_name, __package__)
             return getattr(module, attr_name)
         else:
-            raise AttributeError(
-                f'module {__package__} has no attribute {name}')
+            raise AttributeError(f"module {__package__} has no attribute {name}")
 
 
 __all__ = [
diff --git a/vllm/_bc_linter.py b/vllm/_bc_linter.py
index 52a95dbee186..af68396af0b5 100644
--- a/vllm/_bc_linter.py
+++ b/vllm/_bc_linter.py
@@ -9,13 +9,11 @@
 
 
 @overload
-def bc_linter_skip(obj: T) -> T:
-    ...
+def bc_linter_skip(obj: T) -> T: ...
 
 
 @overload
-def bc_linter_skip(*, reason: str | None = ...) -> Callable[[T], T]:
-    ...
+def bc_linter_skip(*, reason: str | None = ...) -> Callable[[T], T]: ...
 
 
 def bc_linter_skip(obj: Any = None, *, reason: str | None = None):
@@ -34,13 +32,11 @@ def _wrap(x: T) -> T:
 
 
 @overload
-def bc_linter_include(obj: T) -> T:
-    ...
+def bc_linter_include(obj: T) -> T: ...
 
 
 @overload
-def bc_linter_include(*, reason: str | None = ...) -> Callable[[T], T]:
-    ...
+def bc_linter_include(*, reason: str | None = ...) -> Callable[[T], T]: ...
 
 
 def bc_linter_include(obj: Any = None, *, reason: str | None = None):
diff --git a/vllm/_custom_ops.py b/vllm/_custom_ops.py
index 0a83faba513f..dd556f4ff394 100644
--- a/vllm/_custom_ops.py
+++ b/vllm/_custom_ops.py
@@ -49,11 +49,26 @@ def paged_attention_v1(
     blocksparse_head_sliding_step: int = 0,
 ) -> None:
     torch.ops._C.paged_attention_v1(
-        out, query, key_cache, value_cache, num_kv_heads, scale, block_tables,
-        seq_lens, block_size, max_seq_len, alibi_slopes, kv_cache_dtype,
-        k_scale, v_scale, tp_rank, blocksparse_local_blocks,
-        blocksparse_vert_stride, blocksparse_block_size,
-        blocksparse_head_sliding_step)
+        out,
+        query,
+        key_cache,
+        value_cache,
+        num_kv_heads,
+        scale,
+        block_tables,
+        seq_lens,
+        block_size,
+        max_seq_len,
+        alibi_slopes,
+        kv_cache_dtype,
+        k_scale,
+        v_scale,
+        tp_rank,
+        blocksparse_local_blocks,
+        blocksparse_vert_stride,
+        blocksparse_block_size,
+        blocksparse_head_sliding_step,
+    )
 
 
 def paged_attention_v2(
@@ -81,11 +96,29 @@ def paged_attention_v2(
     blocksparse_head_sliding_step: int = 0,
 ) -> None:
     torch.ops._C.paged_attention_v2(
-        out, exp_sum, max_logits, tmp_out, query, key_cache, value_cache,
-        num_kv_heads, scale, block_tables, seq_lens, block_size, max_seq_len,
-        alibi_slopes, kv_cache_dtype, k_scale, v_scale, tp_rank,
-        blocksparse_local_blocks, blocksparse_vert_stride,
-        blocksparse_block_size, blocksparse_head_sliding_step)
+        out,
+        exp_sum,
+        max_logits,
+        tmp_out,
+        query,
+        key_cache,
+        value_cache,
+        num_kv_heads,
+        scale,
+        block_tables,
+        seq_lens,
+        block_size,
+        max_seq_len,
+        alibi_slopes,
+        kv_cache_dtype,
+        k_scale,
+        v_scale,
+        tp_rank,
+        blocksparse_local_blocks,
+        blocksparse_vert_stride,
+        blocksparse_block_size,
+        blocksparse_head_sliding_step,
+    )
 
 
 def paged_attention_rocm(
@@ -110,12 +143,28 @@ def paged_attention_rocm(
     fp8_out_scale: Optional[torch.Tensor] = None,
     mfma_type: str = "fp8" if envs.VLLM_ROCM_FP8_MFMA_PAGE_ATTN else "f16",
 ) -> None:
-    torch.ops._rocm_C.paged_attention(out, exp_sum, max_logits, tmp_out, query,
-                                      key_cache, value_cache, num_kv_heads,
-                                      scale, block_tables, seq_lens,
-                                      query_start_loc, block_size, max_seq_len,
-                                      alibi_slopes, kv_cache_dtype, k_scale,
-                                      v_scale, fp8_out_scale, mfma_type)
+    torch.ops._rocm_C.paged_attention(
+        out,
+        exp_sum,
+        max_logits,
+        tmp_out,
+        query,
+        key_cache,
+        value_cache,
+        num_kv_heads,
+        scale,
+        block_tables,
+        seq_lens,
+        query_start_loc,
+        block_size,
+        max_seq_len,
+        alibi_slopes,
+        kv_cache_dtype,
+        k_scale,
+        v_scale,
+        fp8_out_scale,
+        mfma_type,
+    )
 
 
 def mla_decode_kvcache_cpu(
@@ -126,19 +175,23 @@ def mla_decode_kvcache_cpu(
     block_tables: torch.Tensor,
     seq_lens: torch.Tensor,
 ) -> None:
-    torch.ops._C_cpu.mla_decode_kvcache(out, query, kv_cache, scale,
-                                        block_tables, seq_lens)
+    torch.ops._C_cpu.mla_decode_kvcache(
+        out, query, kv_cache, scale, block_tables, seq_lens
+    )
 
 
 # merge attn states ops
-def merge_attn_states(output: torch.Tensor,
-                      prefix_output: torch.Tensor,
-                      prefix_lse: torch.Tensor,
-                      suffix_output: torch.Tensor,
-                      suffix_lse: torch.Tensor,
-                      output_lse: Optional[torch.Tensor] = None) -> None:
-    torch.ops._C.merge_attn_states(output, output_lse, prefix_output,
-                                   prefix_lse, suffix_output, suffix_lse)
+def merge_attn_states(
+    output: torch.Tensor,
+    prefix_output: torch.Tensor,
+    prefix_lse: torch.Tensor,
+    suffix_output: torch.Tensor,
+    suffix_lse: torch.Tensor,
+    output_lse: Optional[torch.Tensor] = None,
+) -> None:
+    torch.ops._C.merge_attn_states(
+        output, output_lse, prefix_output, prefix_lse, suffix_output, suffix_lse
+    )
 
 
 def convert_vertical_slash_indexes(
@@ -157,33 +210,43 @@ def convert_vertical_slash_indexes(
     nnz_vertical = vertical_indexes.size(2)
     num_rows = (context_size + block_size_M - 1) // block_size_M
 
-    block_count = torch.zeros(batch_size,
-                              num_heads,
-                              num_rows,
-                              dtype=q_seqlens.dtype,
-                              device=q_seqlens.device)
-    block_offset = torch.zeros(batch_size,
-                               num_heads,
-                               num_rows,
-                               nnz_slash,
-                               dtype=q_seqlens.dtype,
-                               device=q_seqlens.device)
-    column_count = torch.zeros(batch_size,
-                               num_heads,
-                               num_rows,
-                               dtype=q_seqlens.dtype,
-                               device=q_seqlens.device)
-    column_index = torch.zeros(batch_size,
-                               num_heads,
-                               num_rows,
-                               nnz_vertical,
-                               dtype=q_seqlens.dtype,
-                               device=q_seqlens.device)
+    block_count = torch.zeros(
+        batch_size, num_heads, num_rows, dtype=q_seqlens.dtype, device=q_seqlens.device
+    )
+    block_offset = torch.zeros(
+        batch_size,
+        num_heads,
+        num_rows,
+        nnz_slash,
+        dtype=q_seqlens.dtype,
+        device=q_seqlens.device,
+    )
+    column_count = torch.zeros(
+        batch_size, num_heads, num_rows, dtype=q_seqlens.dtype, device=q_seqlens.device
+    )
+    column_index = torch.zeros(
+        batch_size,
+        num_heads,
+        num_rows,
+        nnz_vertical,
+        dtype=q_seqlens.dtype,
+        device=q_seqlens.device,
+    )
 
     torch.ops._C.convert_vertical_slash_indexes(
-        block_count, block_offset, column_count, column_index, q_seqlens,
-        kv_seqlens, vertical_indexes, slash_indexes, context_size,
-        block_size_M, block_size_N, causal)
+        block_count,
+        block_offset,
+        column_count,
+        column_index,
+        q_seqlens,
+        kv_seqlens,
+        vertical_indexes,
+        slash_indexes,
+        context_size,
+        block_size_M,
+        block_size_N,
+        causal,
+    )
     return block_count, block_offset, column_count, column_index
 
 
@@ -206,33 +269,45 @@ def convert_vertical_slash_indexes_mergehead(
     nnz_vertical = vertical_indexes.size(2)
     num_rows = (context_size + block_size_M - 1) // block_size_M
 
-    block_count = torch.empty(batch_size,
-                              num_heads,
-                              num_rows,
-                              dtype=q_seqlens.dtype,
-                              device=q_seqlens.device)
-    block_offset = torch.empty(batch_size,
-                               num_heads,
-                               num_rows,
-                               nnz_slash,
-                               dtype=q_seqlens.dtype,
-                               device=q_seqlens.device)
-    column_count = torch.empty(batch_size,
-                               num_heads,
-                               num_rows,
-                               dtype=q_seqlens.dtype,
-                               device=q_seqlens.device)
-    column_index = torch.empty(batch_size,
-                               num_heads,
-                               num_rows,
-                               nnz_vertical,
-                               dtype=q_seqlens.dtype,
-                               device=q_seqlens.device)
+    block_count = torch.empty(
+        batch_size, num_heads, num_rows, dtype=q_seqlens.dtype, device=q_seqlens.device
+    )
+    block_offset = torch.empty(
+        batch_size,
+        num_heads,
+        num_rows,
+        nnz_slash,
+        dtype=q_seqlens.dtype,
+        device=q_seqlens.device,
+    )
+    column_count = torch.empty(
+        batch_size, num_heads, num_rows, dtype=q_seqlens.dtype, device=q_seqlens.device
+    )
+    column_index = torch.empty(
+        batch_size,
+        num_heads,
+        num_rows,
+        nnz_vertical,
+        dtype=q_seqlens.dtype,
+        device=q_seqlens.device,
+    )
 
     torch.ops._C.convert_vertical_slash_indexes_mergehead(
-        block_count, block_offset, column_count, column_index, q_seqlens,
-        kv_seqlens, vertical_indexes, slash_indexes, vertical_indices_count,
-        slash_indices_count, context_size, block_size_M, block_size_N, causal)
+        block_count,
+        block_offset,
+        column_count,
+        column_index,
+        q_seqlens,
+        kv_seqlens,
+        vertical_indexes,
+        slash_indexes,
+        vertical_indices_count,
+        slash_indices_count,
+        context_size,
+        block_size_M,
+        block_size_N,
+        causal,
+    )
     return block_count, block_offset, column_count, column_index
 
 
@@ -245,53 +320,71 @@ def rotary_embedding(
     cos_sin_cache: torch.Tensor,
     is_neox: bool,
 ) -> None:
-    torch.ops._C.rotary_embedding(positions, query, key, head_size,
-                                  cos_sin_cache, is_neox)
+    torch.ops._C.rotary_embedding(
+        positions, query, key, head_size, cos_sin_cache, is_neox
+    )
 
 
 # layer norm ops
-def rms_norm(out: torch.Tensor, input: torch.Tensor, weight: torch.Tensor,
-             epsilon: float) -> None:
+def rms_norm(
+    out: torch.Tensor, input: torch.Tensor, weight: torch.Tensor, epsilon: float
+) -> None:
     # TODO: Remove this contiguous call when the kernel is updated to support non-contiguous input
     input_contiguous = input.contiguous()
     torch.ops._C.rms_norm(out, input_contiguous, weight, epsilon)
 
 
-def fused_add_rms_norm(input: torch.Tensor, residual: torch.Tensor,
-                       weight: torch.Tensor, epsilon: float) -> None:
+def fused_add_rms_norm(
+    input: torch.Tensor, residual: torch.Tensor, weight: torch.Tensor, epsilon: float
+) -> None:
     torch.ops._C.fused_add_rms_norm(input, residual, weight, epsilon)
 
 
-def poly_norm(out: torch.Tensor, input: torch.Tensor, weight: torch.Tensor,
-              bias: torch.Tensor, epsilon: float) -> None:
+def poly_norm(
+    out: torch.Tensor,
+    input: torch.Tensor,
+    weight: torch.Tensor,
+    bias: torch.Tensor,
+    epsilon: float,
+) -> None:
     # TODO: Remove this contiguous call when the kernel is updated to support non-contiguous input
     input_contiguous = input.contiguous()
     torch.ops._C.poly_norm(out, input_contiguous, weight, bias, epsilon)
 
 
 def apply_repetition_penalties_torch(
-        logits: torch.Tensor, prompt_mask: torch.Tensor,
-        output_mask: torch.Tensor, repetition_penalties: torch.Tensor) -> None:
+    logits: torch.Tensor,
+    prompt_mask: torch.Tensor,
+    output_mask: torch.Tensor,
+    repetition_penalties: torch.Tensor,
+) -> None:
     repetition_penalties = repetition_penalties.unsqueeze(dim=1).repeat(
-        1, logits.size(1))
+        1, logits.size(1)
+    )
     # If token appears in prompt or output, apply, otherwise use 1.0 for no-op.
-    penalties = torch.where(prompt_mask | output_mask, repetition_penalties,
-                            1.0)
+    penalties = torch.where(prompt_mask | output_mask, repetition_penalties, 1.0)
     # If logits are positive, divide by penalty, otherwise multiply by penalty.
     scaling = torch.where(logits > 0, 1.0 / penalties, penalties)
     logits *= scaling
 
 
 def apply_repetition_penalties_cuda(
-        logits: torch.Tensor, prompt_mask: torch.Tensor,
-        output_mask: torch.Tensor, repetition_penalties: torch.Tensor) -> None:
-    torch.ops._C.apply_repetition_penalties_(logits, prompt_mask, output_mask,
-                                             repetition_penalties)
+    logits: torch.Tensor,
+    prompt_mask: torch.Tensor,
+    output_mask: torch.Tensor,
+    repetition_penalties: torch.Tensor,
+) -> None:
+    torch.ops._C.apply_repetition_penalties_(
+        logits, prompt_mask, output_mask, repetition_penalties
+    )
 
 
-def apply_repetition_penalties(logits: torch.Tensor, prompt_mask: torch.Tensor,
-                               output_mask: torch.Tensor,
-                               repetition_penalties: torch.Tensor) -> None:
+def apply_repetition_penalties(
+    logits: torch.Tensor,
+    prompt_mask: torch.Tensor,
+    output_mask: torch.Tensor,
+    repetition_penalties: torch.Tensor,
+) -> None:
     """Apply repetition penalties to logits in-place.
 
     Args:
@@ -301,11 +394,13 @@ def apply_repetition_penalties(logits: torch.Tensor, prompt_mask: torch.Tensor,
         repetition_penalties: The repetition penalties of shape (num_seqs, ).
     """
     if logits.is_cuda and logits.is_contiguous():
-        apply_repetition_penalties_cuda(logits, prompt_mask, output_mask,
-                                        repetition_penalties)
+        apply_repetition_penalties_cuda(
+            logits, prompt_mask, output_mask, repetition_penalties
+        )
     else:
-        apply_repetition_penalties_torch(logits, prompt_mask, output_mask,
-                                         repetition_penalties)
+        apply_repetition_penalties_torch(
+            logits, prompt_mask, output_mask, repetition_penalties
+        )
 
 
 # fused quant layer norm ops
@@ -315,128 +410,172 @@ def rms_norm_dynamic_per_token_quant(
     epsilon: float,
     quant_dtype: torch.dtype,
     scale_ub: Optional[torch.Tensor] = None,
-    residual: Optional[torch.Tensor] = None
+    residual: Optional[torch.Tensor] = None,
 ) -> tuple[torch.Tensor, torch.Tensor]:
     output = torch.empty_like(input, dtype=quant_dtype)
-    scales = torch.empty((input.numel() // input.shape[-1], 1),
-                         device=input.device,
-                         dtype=torch.float32)
+    scales = torch.empty(
+        (input.numel() // input.shape[-1], 1), device=input.device, dtype=torch.float32
+    )
 
-    torch.ops._C.rms_norm_dynamic_per_token_quant(output, input, weight,
-                                                  scales, epsilon, scale_ub,
-                                                  residual)
+    torch.ops._C.rms_norm_dynamic_per_token_quant(
+        output, input, weight, scales, epsilon, scale_ub, residual
+    )
     return output, scales
 
 
 # quantization ops
 # awq
-def awq_dequantize(qweight: torch.Tensor, scales: torch.Tensor,
-                   zeros: torch.Tensor, split_k_iters: int, thx: int,
-                   thy: int) -> torch.Tensor:
+def awq_dequantize(
+    qweight: torch.Tensor,
+    scales: torch.Tensor,
+    zeros: torch.Tensor,
+    split_k_iters: int,
+    thx: int,
+    thy: int,
+) -> torch.Tensor:
     if envs.VLLM_USE_TRITON_AWQ:
         from vllm.model_executor.layers.quantization.awq_triton import (
-            awq_dequantize_triton)
+            awq_dequantize_triton,
+        )
+
         return awq_dequantize_triton(qweight, scales, zeros)
-    return torch.ops._C.awq_dequantize(qweight, scales, zeros, split_k_iters,
-                                       thx, thy)
+    return torch.ops._C.awq_dequantize(qweight, scales, zeros, split_k_iters, thx, thy)
 
 
-def awq_gemm(input: torch.Tensor, qweight: torch.Tensor, qzeros: torch.Tensor,
-             scales: torch.Tensor, split_k_iters: int) -> torch.Tensor:
+def awq_gemm(
+    input: torch.Tensor,
+    qweight: torch.Tensor,
+    qzeros: torch.Tensor,
+    scales: torch.Tensor,
+    split_k_iters: int,
+) -> torch.Tensor:
     if envs.VLLM_USE_TRITON_AWQ:
-        from vllm.model_executor.layers.quantization.awq_triton import (
-            awq_gemm_triton)
+        from vllm.model_executor.layers.quantization.awq_triton import awq_gemm_triton
+
         return awq_gemm_triton(input, qweight, qzeros, scales, split_k_iters)
     return torch.ops._C.awq_gemm(input, qweight, qzeros, scales, split_k_iters)
 
 
 # gptq
-def gptq_gemm(a: torch.Tensor, b_q_weight: torch.Tensor,
-              b_gptq_qzeros: torch.Tensor, b_gptq_scales: torch.Tensor,
-              b_g_idx: torch.Tensor, use_exllama: bool,
-              bit: int) -> torch.Tensor:
-    return torch.ops._C.gptq_gemm(a, b_q_weight, b_gptq_qzeros, b_gptq_scales,
-                                  b_g_idx, use_exllama, bit)
+def gptq_gemm(
+    a: torch.Tensor,
+    b_q_weight: torch.Tensor,
+    b_gptq_qzeros: torch.Tensor,
+    b_gptq_scales: torch.Tensor,
+    b_g_idx: torch.Tensor,
+    use_exllama: bool,
+    bit: int,
+) -> torch.Tensor:
+    return torch.ops._C.gptq_gemm(
+        a, b_q_weight, b_gptq_qzeros, b_gptq_scales, b_g_idx, use_exllama, bit
+    )
 
 
 if hasattr(torch.ops._C, "gptq_gemm"):
 
     @register_fake("_C::gptq_gemm")
-    def _gptq_gemm_fake(a: torch.Tensor, b_q_weight: torch.Tensor,
-                        b_gptq_qzeros: torch.Tensor,
-                        b_gptq_scales: torch.Tensor, b_g_idx: torch.Tensor,
-                        use_exllama: bool, bit: int) -> torch.Tensor:
-        return torch.empty((a.size(0), b_q_weight.size(1)),
-                           dtype=a.dtype,
-                           device=a.device)
+    def _gptq_gemm_fake(
+        a: torch.Tensor,
+        b_q_weight: torch.Tensor,
+        b_gptq_qzeros: torch.Tensor,
+        b_gptq_scales: torch.Tensor,
+        b_g_idx: torch.Tensor,
+        use_exllama: bool,
+        bit: int,
+    ) -> torch.Tensor:
+        return torch.empty(
+            (a.size(0), b_q_weight.size(1)), dtype=a.dtype, device=a.device
+        )
 
 
-def gptq_shuffle(q_weight: torch.Tensor, q_perm: torch.Tensor,
-                 bit: int) -> None:
+def gptq_shuffle(q_weight: torch.Tensor, q_perm: torch.Tensor, bit: int) -> None:
     torch.ops._C.gptq_shuffle(q_weight, q_perm, bit)
 
 
 # marlin_24
-def gptq_marlin_24_gemm(a: torch.Tensor, b_q_weight: torch.Tensor,
-                        b_meta: torch.Tensor, b_scales: torch.Tensor,
-                        workspace: torch.Tensor, b_q_type: ScalarType,
-                        size_m: int, size_n: int, size_k: int) -> torch.Tensor:
-    return torch.ops._C.gptq_marlin_24_gemm(a, b_q_weight, b_meta, b_scales,
-                                            workspace, b_q_type.id, size_m,
-                                            size_n, size_k)
+def gptq_marlin_24_gemm(
+    a: torch.Tensor,
+    b_q_weight: torch.Tensor,
+    b_meta: torch.Tensor,
+    b_scales: torch.Tensor,
+    workspace: torch.Tensor,
+    b_q_type: ScalarType,
+    size_m: int,
+    size_n: int,
+    size_k: int,
+) -> torch.Tensor:
+    return torch.ops._C.gptq_marlin_24_gemm(
+        a, b_q_weight, b_meta, b_scales, workspace, b_q_type.id, size_m, size_n, size_k
+    )
 
 
 if hasattr(torch.ops._C, "gptq_marlin_24_gemm"):
 
     @register_fake("_C::gptq_marlin_24_gemm")
-    def _gptq_marlin_24_gemm_fake(a: torch.Tensor, b_q_weight: torch.Tensor,
-                                  b_meta: torch.Tensor, b_scales: torch.Tensor,
-                                  workspace: torch.Tensor,
-                                  b_q_type: ScalarType, size_m: torch.SymInt,
-                                  size_n: torch.SymInt,
-                                  size_k: torch.SymInt) -> torch.Tensor:
+    def _gptq_marlin_24_gemm_fake(
+        a: torch.Tensor,
+        b_q_weight: torch.Tensor,
+        b_meta: torch.Tensor,
+        b_scales: torch.Tensor,
+        workspace: torch.Tensor,
+        b_q_type: ScalarType,
+        size_m: torch.SymInt,
+        size_n: torch.SymInt,
+        size_k: torch.SymInt,
+    ) -> torch.Tensor:
         return torch.empty((size_m, size_n), device=a.device, dtype=a.dtype)
 
     @register_fake("_C::gptq_marlin_gemm")
-    def _gptq_marlin_gemm_fake(a: torch.Tensor,
-                               c: Optional[torch.Tensor],
-                               b_q_weight: torch.Tensor,
-                               b_bias: Optional[torch.Tensor],
-                               b_scales: torch.Tensor,
-                               global_scale: Optional[torch.Tensor],
-                               b_zeros: Optional[torch.Tensor],
-                               g_idx: Optional[torch.Tensor],
-                               perm: Optional[torch.Tensor],
-                               workspace: torch.Tensor,
-                               b_q_type_id: int,
-                               size_m: torch.SymInt,
-                               size_n: torch.SymInt,
-                               size_k: torch.SymInt,
-                               is_k_full: bool = True,
-                               use_atomic_add: bool = False,
-                               use_fp32_reduce: bool = False,
-                               is_zp_float: bool = False) -> torch.Tensor:
+    def _gptq_marlin_gemm_fake(
+        a: torch.Tensor,
+        c: Optional[torch.Tensor],
+        b_q_weight: torch.Tensor,
+        b_bias: Optional[torch.Tensor],
+        b_scales: torch.Tensor,
+        global_scale: Optional[torch.Tensor],
+        b_zeros: Optional[torch.Tensor],
+        g_idx: Optional[torch.Tensor],
+        perm: Optional[torch.Tensor],
+        workspace: torch.Tensor,
+        b_q_type_id: int,
+        size_m: torch.SymInt,
+        size_n: torch.SymInt,
+        size_k: torch.SymInt,
+        is_k_full: bool = True,
+        use_atomic_add: bool = False,
+        use_fp32_reduce: bool = False,
+        is_zp_float: bool = False,
+    ) -> torch.Tensor:
         return torch.empty((size_m, size_n), device=a.device, dtype=a.dtype)
 
     @register_fake("_C::awq_dequantize")
-    def _awq_dequantize_fake(qweight: torch.Tensor, scales: torch.Tensor,
-                             zeros: torch.Tensor, split_k_iters: torch.SymInt,
-                             thx: int, thy: int) -> torch.Tensor:
+    def _awq_dequantize_fake(
+        qweight: torch.Tensor,
+        scales: torch.Tensor,
+        zeros: torch.Tensor,
+        split_k_iters: torch.SymInt,
+        thx: int,
+        thy: int,
+    ) -> torch.Tensor:
         in_c = qweight.size(0)
         qout_c = qweight.size(1)
         out_c = qout_c * 8
-        return torch.empty((in_c, out_c),
-                           dtype=scales.dtype,
-                           device=scales.device)
+        return torch.empty((in_c, out_c), dtype=scales.dtype, device=scales.device)
 
     @register_fake("_C::awq_gemm")
-    def _awq_gemm_fake(input: torch.Tensor, qweight: torch.Tensor,
-                       qzeros: torch.Tensor, scales: torch.Tensor,
-                       split_k_iters: torch.SymInt) -> torch.Tensor:
+    def _awq_gemm_fake(
+        input: torch.Tensor,
+        qweight: torch.Tensor,
+        qzeros: torch.Tensor,
+        scales: torch.Tensor,
+        split_k_iters: torch.SymInt,
+    ) -> torch.Tensor:
         num_in_feats = input.size(0)
-        return torch.empty((split_k_iters, num_in_feats, qweight.size(1) * 8),
-                           dtype=input.dtype,
-                           device=input.device).sum(0)
+        return torch.empty(
+            (split_k_iters, num_in_feats, qweight.size(1) * 8),
+            dtype=input.dtype,
+            device=input.device,
+        ).sum(0)
 
     @register_fake("_C::machete_mm")
     def machete_mm_fake(
@@ -458,22 +597,25 @@ def machete_mm_fake(
 
     @register_fake("_C::machete_prepack_B")
     def machete_prepack_B_fake(
-            b_q_weight: torch.Tensor, a_type: torch.dtype, b_type: ScalarType,
-            group_scales_type: Optional[torch.dtype]) -> torch.Tensor:
-        return torch.empty_like(b_q_weight,
-                                memory_format=torch.contiguous_format)
+        b_q_weight: torch.Tensor,
+        a_type: torch.dtype,
+        b_type: ScalarType,
+        group_scales_type: Optional[torch.dtype],
+    ) -> torch.Tensor:
+        return torch.empty_like(b_q_weight, memory_format=torch.contiguous_format)
 
     @register_fake("_C::cutlass_w4a8_mm")
     def cutlass_w4a8_mm_fake(
-            a: torch.Tensor,
-            # b_q Should be the tensor returned by cutlass_encode_and_reorder_int4b
-            b_q: torch.Tensor,
-            b_group_scales: torch.Tensor,
-            b_group_size: int,
-            b_channel_scales: torch.Tensor,
-            a_token_scales: torch.Tensor,
-            out_type: Optional[torch.dtype] = None,
-            maybe_schedule: Optional[str] = None) -> torch.Tensor:
+        a: torch.Tensor,
+        # b_q Should be the tensor returned by cutlass_encode_and_reorder_int4b
+        b_q: torch.Tensor,
+        b_group_scales: torch.Tensor,
+        b_group_size: int,
+        b_channel_scales: torch.Tensor,
+        a_token_scales: torch.Tensor,
+        out_type: Optional[torch.dtype] = None,
+        maybe_schedule: Optional[str] = None,
+    ) -> torch.Tensor:
         m = a.size(0)
         n = b_q.size(1)
         out_dtype = out_type if out_type is not None else torch.bfloat16
@@ -491,15 +633,19 @@ def cutlass_encode_and_reorder_int4b_fake(b: torch.Tensor) -> torch.Tensor:
 if hasattr(torch.ops._C, "allspark_w8a16_gemm"):
 
     @register_fake("_C::allspark_w8a16_gemm")
-    def _allspark_w8a16_gemm_fake(a: torch.Tensor, b_qweight: torch.Tensor,
-                                  b_scales: torch.Tensor,
-                                  b_qzeros: Optional[torch.Tensor],
-                                  n: torch.SymInt, group_size: torch.SymInt,
-                                  sm_count: torch.SymInt,
-                                  sm_version: torch.SymInt,
-                                  CUBLAS_M_THRESHOLD: torch.SymInt,
-                                  has_zp: bool,
-                                  n32k16_reorder: bool) -> torch.Tensor:
+    def _allspark_w8a16_gemm_fake(
+        a: torch.Tensor,
+        b_qweight: torch.Tensor,
+        b_scales: torch.Tensor,
+        b_qzeros: Optional[torch.Tensor],
+        n: torch.SymInt,
+        group_size: torch.SymInt,
+        sm_count: torch.SymInt,
+        sm_version: torch.SymInt,
+        CUBLAS_M_THRESHOLD: torch.SymInt,
+        has_zp: bool,
+        n32k16_reorder: bool,
+    ) -> torch.Tensor:
         m = a.size(0)
         return torch.empty((m, n), device=a.device, dtype=a.dtype)
 
@@ -508,11 +654,12 @@ def _allspark_w8a16_gemm_fake(a: torch.Tensor, b_qweight: torch.Tensor,
 
     @register_fake("_C::ggml_dequantize")
     def _ggml_dequantize_fake(
-            W: torch.Tensor,
-            quant_type: int,
-            m: torch.SymInt,
-            n: torch.SymInt,
-            dtype: Optional[torch.dtype] = None) -> torch.Tensor:
+        W: torch.Tensor,
+        quant_type: int,
+        m: torch.SymInt,
+        n: torch.SymInt,
+        dtype: Optional[torch.dtype] = None,
+    ) -> torch.Tensor:
         return torch.empty((m, n), dtype=torch.float16, device=W.device)
 
     @register_fake("_C::ggml_mul_mat_vec_a8")
@@ -547,9 +694,7 @@ def _ggml_moe_a8_fake(
         tokens: torch.SymInt,
     ) -> torch.Tensor:
         tokens = X.size(0)
-        return torch.empty((tokens * top_k, row),
-                           dtype=torch.float16,
-                           device=W.device)
+        return torch.empty((tokens * top_k, row), dtype=torch.float16, device=W.device)
 
 
 if hasattr(torch.ops._C, "ggml_moe_a8_vec"):
@@ -565,9 +710,7 @@ def _ggml_moe_a8_vec_fake(
         tokens: torch.SymInt,
     ) -> torch.Tensor:
         tokens = X.size(0)
-        return torch.empty((tokens * top_k, row),
-                           dtype=X.dtype,
-                           device=W.device)
+        return torch.empty((tokens * top_k, row), dtype=X.dtype, device=W.device)
 
 
 # cutlass
@@ -584,20 +727,23 @@ def cutlass_blockwise_scaled_grouped_mm(
     problem_sizes: torch.Tensor,
     expert_offsets: torch.Tensor,
 ):
-    torch.ops._C.cutlass_blockwise_scaled_grouped_mm(output, a, b, scales_a,
-                                                     scales_b, problem_sizes,
-                                                     expert_offsets)
+    torch.ops._C.cutlass_blockwise_scaled_grouped_mm(
+        output, a, b, scales_a, scales_b, problem_sizes, expert_offsets
+    )
 
 
-def cutlass_scaled_fp4_mm(a: torch.Tensor, b: torch.Tensor,
-                          block_scale_a: torch.Tensor,
-                          block_scale_b: torch.Tensor, alpha: torch.Tensor,
-                          out_dtype: torch.dtype) -> torch.Tensor:
+def cutlass_scaled_fp4_mm(
+    a: torch.Tensor,
+    b: torch.Tensor,
+    block_scale_a: torch.Tensor,
+    block_scale_b: torch.Tensor,
+    alpha: torch.Tensor,
+    out_dtype: torch.dtype,
+) -> torch.Tensor:
     assert a.ndim == 2 and b.ndim == 2
     m, n = a.shape[0], b.shape[0]
     out = torch.empty((m, n), dtype=out_dtype, device=a.device)
-    torch.ops._C.cutlass_scaled_fp4_mm(out, a, b, block_scale_a, block_scale_b,
-                                       alpha)
+    torch.ops._C.cutlass_scaled_fp4_mm(out, a, b, block_scale_a, block_scale_b, alpha)
     return out
 
 
@@ -606,16 +752,17 @@ def cutlass_scaled_mm_supports_fp8(cuda_device_capability: int) -> bool:
 
 
 def cutlass_scaled_mm_supports_block_fp8(cuda_device_capability: int) -> bool:
-    return torch.ops._C.cutlass_scaled_mm_supports_block_fp8(
-        cuda_device_capability)
+    return torch.ops._C.cutlass_scaled_mm_supports_block_fp8(cuda_device_capability)
 
 
-def cutlass_scaled_mm(a: torch.Tensor,
-                      b: torch.Tensor,
-                      scale_a: torch.Tensor,
-                      scale_b: torch.Tensor,
-                      out_dtype: torch.dtype,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+def cutlass_scaled_mm(
+    a: torch.Tensor,
+    b: torch.Tensor,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    out_dtype: torch.dtype,
+    bias: Optional[torch.Tensor] = None,
+) -> torch.Tensor:
     """
     `cutlass_scaled_mm` implements a fused version of
         `output = torch.mm((scale_a * a), (scale_b * b)).to(out_dtype)`
@@ -638,70 +785,65 @@ def cutlass_scaled_mm(a: torch.Tensor,
         scale_a.shape * [1, 128] == a.shape
         scale_b.shape * [128, 128] == b.shape
     """
-    assert (out_dtype is torch.bfloat16 or out_dtype is torch.float16)
-    assert bias is None or bias.numel(
-    ) == b.shape[1] and bias.dtype == out_dtype
+    assert out_dtype is torch.bfloat16 or out_dtype is torch.float16
+    assert bias is None or bias.numel() == b.shape[1] and bias.dtype == out_dtype
 
     # Massage the input to be 2D
     target_shape = (*a.shape[:-1], b.shape[1])
     a = a.view(-1, a.shape[-1])
 
-    cutlass_compatible_b = (b.shape[0] % 16 == 0 and b.shape[1] % 16 == 0)
+    cutlass_compatible_b = b.shape[0] % 16 == 0 and b.shape[1] % 16 == 0
     if current_platform.is_rocm() or not cutlass_compatible_b:
         from vllm.model_executor.layers.quantization.compressed_tensors.triton_scaled_mm import (  # noqa
-            triton_scaled_mm)
+            triton_scaled_mm,
+        )
+
         out = triton_scaled_mm(a, b, scale_a, scale_b, out_dtype, bias)
     else:
-        out = torch.empty((a.shape[0], b.shape[1]),
-                          dtype=out_dtype,
-                          device=a.device)
+        out = torch.empty((a.shape[0], b.shape[1]), dtype=out_dtype, device=a.device)
         torch.ops._C.cutlass_scaled_mm(out, a, b, scale_a, scale_b, bias)
 
     return out.view(*target_shape)
 
 
-def cutlass_scaled_mm_azp(a: torch.Tensor,
-                          b: torch.Tensor,
-                          scale_a: torch.Tensor,
-                          scale_b: torch.Tensor,
-                          out_dtype: torch.dtype,
-                          azp_adj: torch.Tensor,
-                          azp: Optional[torch.Tensor] = None,
-                          bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+def cutlass_scaled_mm_azp(
+    a: torch.Tensor,
+    b: torch.Tensor,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    out_dtype: torch.dtype,
+    azp_adj: torch.Tensor,
+    azp: Optional[torch.Tensor] = None,
+    bias: Optional[torch.Tensor] = None,
+) -> torch.Tensor:
     """
     :param azp_adj: In the per-tensor case, this should include the azp.
     Always per-channel.
     :param azp: Only set in the per-token case. Per-token if set.
     """
-    assert (b.shape[0] % 16 == 0 and b.shape[1] % 16 == 0)
-    assert (out_dtype is torch.bfloat16 or out_dtype is torch.float16)
-    assert bias is None or bias.numel(
-    ) == b.shape[1] and bias.dtype == out_dtype
+    assert b.shape[0] % 16 == 0 and b.shape[1] % 16 == 0
+    assert out_dtype is torch.bfloat16 or out_dtype is torch.float16
+    assert bias is None or bias.numel() == b.shape[1] and bias.dtype == out_dtype
 
     # Massage the input to be 2D
     target_shape = (*a.shape[:-1], b.shape[1])
     a = a.view(-1, a.shape[-1])
     assert azp is None or azp.numel() == a.shape[0]
 
-    out = torch.empty((a.shape[0], b.shape[1]),
-                      dtype=out_dtype,
-                      device=a.device)
-    torch.ops._C.cutlass_scaled_mm_azp(out, a, b, scale_a, scale_b, azp_adj,
-                                       azp, bias)
+    out = torch.empty((a.shape[0], b.shape[1]), dtype=out_dtype, device=a.device)
+    torch.ops._C.cutlass_scaled_mm_azp(out, a, b, scale_a, scale_b, azp_adj, azp, bias)
     return out.view(*target_shape)
 
 
 def cutlass_sparse_scaled_mm_supported(cuda_device_capability: int) -> bool:
-    return torch.ops._C.cutlass_sparse_scaled_mm_supported(
-        cuda_device_capability)
+    return torch.ops._C.cutlass_sparse_scaled_mm_supported(cuda_device_capability)
 
 
 def cutlass_group_gemm_supported(cuda_device_capability: int) -> bool:
     return torch.ops._C.cutlass_group_gemm_supported(cuda_device_capability)
 
 
-def cutlass_sparse_compress(a: torch.Tensor) \
-    -> tuple[torch.Tensor, torch.Tensor]:
+def cutlass_sparse_compress(a: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
     """
     Compresses a sparse matrix for use with Cutlass sparse operations.
 
@@ -732,26 +874,25 @@ def cutlass_sparse_compress(a: torch.Tensor) \
         - The shape of `a_nzs` is `(m, k // 2)`, where `m` and `k` are the dimensions of the input tensor.
         - The shape of `a_meta` is `(m, k // 2 // elemsPerMetaElem)`.
     """
-    assert (a.dtype in [
-        torch.int8, torch.float8_e4m3fn, torch.bfloat16, torch.float16
-    ])
-    assert (a.is_contiguous())
+    assert a.dtype in [torch.int8, torch.float8_e4m3fn, torch.bfloat16, torch.float16]
+    assert a.is_contiguous()
 
     # a_meta.dtype: torch.uint8 so elemsPerMetaElem = 8b / 2b_per_nz = 4
     elemsPerMetaElem = 4
-    assert (a.shape[1] % (2 * elemsPerMetaElem) == 0)
+    assert a.shape[1] % (2 * elemsPerMetaElem) == 0
 
     return torch.ops._C.cutlass_sparse_compress(a)
 
 
 def cutlass_scaled_sparse_mm(
-        a: torch.Tensor,
-        bt_nzs: torch.Tensor,
-        bt_meta: torch.Tensor,
-        scale_a: torch.Tensor,
-        scale_b: torch.Tensor,
-        out_dtype: torch.dtype,
-        bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    a: torch.Tensor,
+    bt_nzs: torch.Tensor,
+    bt_meta: torch.Tensor,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    out_dtype: torch.dtype,
+    bias: Optional[torch.Tensor] = None,
+) -> torch.Tensor:
     """
     Performs a scaled sparse matrix multiplication using Cutlass.
 
@@ -775,31 +916,33 @@ def cutlass_scaled_sparse_mm(
     Returns:
     - The result of the scaled sparse matrix multiplication.
     """
-    assert (bt_nzs.shape[0] % 16 == 0 and bt_nzs.shape[1] % 16 == 0)
-    assert (out_dtype is torch.bfloat16 or out_dtype is torch.float16)
-    assert bias is None or bias.shape[0] == bt_nzs.shape[0] \
-        and bias.dtype == out_dtype
+    assert bt_nzs.shape[0] % 16 == 0 and bt_nzs.shape[1] % 16 == 0
+    assert out_dtype is torch.bfloat16 or out_dtype is torch.float16
+    assert bias is None or bias.shape[0] == bt_nzs.shape[0] and bias.dtype == out_dtype
 
     m = a.shape[0]
     n = bt_nzs.shape[0]
     out = torch.empty((m, n), dtype=out_dtype, device=a.device)
 
-    torch.ops._C.cutlass_scaled_sparse_mm(out, a, bt_nzs, bt_meta, scale_a,
-                                          scale_b, bias)
+    torch.ops._C.cutlass_scaled_sparse_mm(
+        out, a, bt_nzs, bt_meta, scale_a, scale_b, bias
+    )
 
     return out
 
 
-def get_cutlass_moe_mm_data(topk_ids: torch.Tensor,
-                            expert_offsets: torch.Tensor,
-                            problem_sizes1: torch.Tensor,
-                            problem_sizes2: torch.Tensor,
-                            input_permutation: torch.Tensor,
-                            output_permutation: torch.Tensor,
-                            num_experts: int,
-                            n: int,
-                            k: int,
-                            blockscale_offsets: Optional[torch.Tensor] = None):
+def get_cutlass_moe_mm_data(
+    topk_ids: torch.Tensor,
+    expert_offsets: torch.Tensor,
+    problem_sizes1: torch.Tensor,
+    problem_sizes2: torch.Tensor,
+    input_permutation: torch.Tensor,
+    output_permutation: torch.Tensor,
+    num_experts: int,
+    n: int,
+    k: int,
+    blockscale_offsets: Optional[torch.Tensor] = None,
+):
     """
     Prepare data necessary to perform CUTLASS grouped matrix multiplications
     used in CUTLASS-based fused MoE.
@@ -823,22 +966,29 @@ def get_cutlass_moe_mm_data(topk_ids: torch.Tensor,
                           computed with expert E is blockscale_offsets[E + 1] -
                           blockscale_offsets[E]
     """
-    return torch.ops._C.get_cutlass_moe_mm_data(topk_ids, expert_offsets,
-                                                problem_sizes1, problem_sizes2,
-                                                input_permutation,
-                                                output_permutation,
-                                                num_experts, n, k,
-                                                blockscale_offsets)
+    return torch.ops._C.get_cutlass_moe_mm_data(
+        topk_ids,
+        expert_offsets,
+        problem_sizes1,
+        problem_sizes2,
+        input_permutation,
+        output_permutation,
+        num_experts,
+        n,
+        k,
+        blockscale_offsets,
+    )
 
 
 def get_cutlass_moe_mm_problem_sizes(
-        topk_ids: torch.Tensor,
-        problem_sizes1: torch.Tensor,
-        problem_sizes2: torch.Tensor,
-        num_experts: int,
-        n: int,
-        k: int,
-        blockscale_offsets: Optional[torch.Tensor] = None):
+    topk_ids: torch.Tensor,
+    problem_sizes1: torch.Tensor,
+    problem_sizes2: torch.Tensor,
+    num_experts: int,
+    n: int,
+    k: int,
+    blockscale_offsets: Optional[torch.Tensor] = None,
+):
     """
     Compute only the per-expert problem sizes needed by the two grouped matrix
     multiplications used in CUTLASS-based fused MoE.
@@ -849,8 +999,8 @@ def get_cutlass_moe_mm_problem_sizes(
                                     used in the fused MoE operation.
     """
     return torch.ops._C.get_cutlass_moe_mm_problem_sizes(
-        topk_ids, problem_sizes1, problem_sizes2, num_experts, n, k,
-        blockscale_offsets)
+        topk_ids, problem_sizes1, problem_sizes2, num_experts, n, k, blockscale_offsets
+    )
 
 
 def shuffle_rows(input_tensor: torch.Tensor, dst2src_map: torch.Tensor):
@@ -859,25 +1009,31 @@ def shuffle_rows(input_tensor: torch.Tensor, dst2src_map: torch.Tensor):
     This is used in MoE to permute the input tensor before performing grouped matrix multiplications.
     """
     num_tokens_permuted = dst2src_map.shape[0]
-    output_tensor = torch.empty((num_tokens_permuted, input_tensor.shape[1]),
-                                device=input_tensor.device,
-                                dtype=input_tensor.dtype)
+    output_tensor = torch.empty(
+        (num_tokens_permuted, input_tensor.shape[1]),
+        device=input_tensor.device,
+        dtype=input_tensor.dtype,
+    )
     torch.ops._moe_C.shuffle_rows(input_tensor, dst2src_map, output_tensor)
     return output_tensor
 
 
-def get_cutlass_pplx_moe_mm_data(expert_offsets: torch.Tensor,
-                                 problem_sizes1: torch.Tensor,
-                                 problem_sizes2: torch.Tensor,
-                                 expert_num_tokens: torch.Tensor,
-                                 num_local_experts: int, padded_m: int, n: int,
-                                 k: int):
+def get_cutlass_pplx_moe_mm_data(
+    expert_offsets: torch.Tensor,
+    problem_sizes1: torch.Tensor,
+    problem_sizes2: torch.Tensor,
+    expert_num_tokens: torch.Tensor,
+    num_local_experts: int,
+    padded_m: int,
+    n: int,
+    k: int,
+):
     """
     Prepare data necessary to perform CUTLASS grouped matrix multiplications
     used in CUTLASS-based fused MoE.
 
     The function takes in expert_num_tokens (token count per expert) and
-    non_zero_expert_idxs (consecutive indices of experts with non-zero token 
+    non_zero_expert_idxs (consecutive indices of experts with non-zero token
     counts) and uses them to compute:
     - expert_offsets: Indices that mark at which token index each expert begins
                       its computation.
@@ -886,16 +1042,31 @@ def get_cutlass_pplx_moe_mm_data(expert_offsets: torch.Tensor,
                                       the fused MoE operation.
     """
     return torch.ops._C.get_cutlass_pplx_moe_mm_data(
-        expert_offsets, problem_sizes1, problem_sizes2, expert_num_tokens,
-        num_local_experts, padded_m, n, k)
+        expert_offsets,
+        problem_sizes1,
+        problem_sizes2,
+        expert_num_tokens,
+        num_local_experts,
+        padded_m,
+        n,
+        k,
+    )
 
 
-def cutlass_moe_mm(out_tensors: torch.Tensor, a_tensors: torch.Tensor,
-                   b_tensors: torch.Tensor, a_scales: torch.Tensor,
-                   b_scales: torch.Tensor, expert_offsets: torch.Tensor,
-                   problem_sizes: torch.Tensor, a_strides: torch.Tensor,
-                   b_strides: torch.Tensor, c_strides: torch.Tensor,
-                   per_act_token: bool, per_out_ch: bool):
+def cutlass_moe_mm(
+    out_tensors: torch.Tensor,
+    a_tensors: torch.Tensor,
+    b_tensors: torch.Tensor,
+    a_scales: torch.Tensor,
+    b_scales: torch.Tensor,
+    expert_offsets: torch.Tensor,
+    problem_sizes: torch.Tensor,
+    a_strides: torch.Tensor,
+    b_strides: torch.Tensor,
+    c_strides: torch.Tensor,
+    per_act_token: bool,
+    per_out_ch: bool,
+):
     """
     A single grouped matrix multiplication used in CUTLASS-based fused MoE.
     The function executes fp8-quantized OUT = AB matrix multiplication.
@@ -907,17 +1078,33 @@ def cutlass_moe_mm(out_tensors: torch.Tensor, a_tensors: torch.Tensor,
                      MMs used in the fused MoE operation.
     - a/b/c_strides: The data strides passed to grouped matrix multiplication.
     """
-    return torch.ops._C.cutlass_moe_mm(out_tensors, a_tensors, b_tensors,
-                                       a_scales, b_scales, expert_offsets,
-                                       problem_sizes, a_strides, b_strides,
-                                       c_strides, per_act_token, per_out_ch)
+    return torch.ops._C.cutlass_moe_mm(
+        out_tensors,
+        a_tensors,
+        b_tensors,
+        a_scales,
+        b_scales,
+        expert_offsets,
+        problem_sizes,
+        a_strides,
+        b_strides,
+        c_strides,
+        per_act_token,
+        per_out_ch,
+    )
 
 
-def cutlass_fp4_moe_mm(out_tensors: torch.Tensor, a_tensors: torch.Tensor,
-                       b_tensors: torch.Tensor, a_scales: torch.Tensor,
-                       b_scales: torch.Tensor, alphas: torch.Tensor,
-                       problem_sizes: torch.Tensor,
-                       expert_offsets: torch.Tensor, sf_offsets: torch.Tensor):
+def cutlass_fp4_moe_mm(
+    out_tensors: torch.Tensor,
+    a_tensors: torch.Tensor,
+    b_tensors: torch.Tensor,
+    a_scales: torch.Tensor,
+    b_scales: torch.Tensor,
+    alphas: torch.Tensor,
+    problem_sizes: torch.Tensor,
+    expert_offsets: torch.Tensor,
+    sf_offsets: torch.Tensor,
+):
     """
     An FP4 Blockscaled Group Gemm that takes in  a_tensors, b_tensors and runs
     the gemms for each combination based on the specified problem sizes.
@@ -934,132 +1121,202 @@ def cutlass_fp4_moe_mm(out_tensors: torch.Tensor, a_tensors: torch.Tensor,
     - problem_sizes: MxNxK sizes of each expert's multiplication in two grouped
                      MMs used in the fused MoE operation.
     """
-    return torch.ops._C.cutlass_fp4_group_mm(out_tensors, a_tensors, b_tensors,
-                                             a_scales, b_scales, alphas,
-                                             problem_sizes, expert_offsets,
-                                             sf_offsets)
+    return torch.ops._C.cutlass_fp4_group_mm(
+        out_tensors,
+        a_tensors,
+        b_tensors,
+        a_scales,
+        b_scales,
+        alphas,
+        problem_sizes,
+        expert_offsets,
+        sf_offsets,
+    )
 
 
 # gptq_marlin
-def gptq_marlin_repack(b_q_weight: torch.Tensor, perm: torch.Tensor,
-                       size_k: int, size_n: int,
-                       num_bits: int) -> torch.Tensor:
-    return torch.ops._C.gptq_marlin_repack(b_q_weight, perm, size_k, size_n,
-                                           num_bits)
+def gptq_marlin_repack(
+    b_q_weight: torch.Tensor,
+    perm: torch.Tensor,
+    size_k: int,
+    size_n: int,
+    num_bits: int,
+) -> torch.Tensor:
+    return torch.ops._C.gptq_marlin_repack(b_q_weight, perm, size_k, size_n, num_bits)
 
 
 # gptq_marlin
-def awq_marlin_repack(b_q_weight: torch.Tensor, size_k: int, size_n: int,
-                      num_bits: int) -> torch.Tensor:
+def awq_marlin_repack(
+    b_q_weight: torch.Tensor, size_k: int, size_n: int, num_bits: int
+) -> torch.Tensor:
     return torch.ops._C.awq_marlin_repack(b_q_weight, size_k, size_n, num_bits)
 
 
-def gptq_marlin_moe_repack(b_q_weight: torch.Tensor, perm: torch.Tensor,
-                           size_k: int, size_n: int,
-                           num_bits: int) -> torch.Tensor:
+def gptq_marlin_moe_repack(
+    b_q_weight: torch.Tensor,
+    perm: torch.Tensor,
+    size_k: int,
+    size_n: int,
+    num_bits: int,
+) -> torch.Tensor:
     num_experts = b_q_weight.shape[0]
     assert size_k % 16 == 0
-    output = torch.empty((num_experts, size_k // 16, size_n * (num_bits // 2)),
-                         device=b_q_weight.device,
-                         dtype=b_q_weight.dtype)
+    output = torch.empty(
+        (num_experts, size_k // 16, size_n * (num_bits // 2)),
+        device=b_q_weight.device,
+        dtype=b_q_weight.dtype,
+    )
     for e in range(num_experts):
-        output[e] = torch.ops._C.gptq_marlin_repack(b_q_weight[e], perm[e],
-                                                    size_k, size_n, num_bits)
+        output[e] = torch.ops._C.gptq_marlin_repack(
+            b_q_weight[e], perm[e], size_k, size_n, num_bits
+        )
     return output
 
 
-def awq_marlin_moe_repack(b_q_weight: torch.Tensor, perm: torch.Tensor,
-                          size_k: int, size_n: int,
-                          num_bits: int) -> torch.Tensor:
+def awq_marlin_moe_repack(
+    b_q_weight: torch.Tensor,
+    perm: torch.Tensor,
+    size_k: int,
+    size_n: int,
+    num_bits: int,
+) -> torch.Tensor:
     num_experts = b_q_weight.shape[0]
     assert size_k % 16 == 0
-    output = torch.empty((num_experts, size_k // 16, size_n * (num_bits // 2)),
-                         device=b_q_weight.device,
-                         dtype=b_q_weight.dtype)
+    output = torch.empty(
+        (num_experts, size_k // 16, size_n * (num_bits // 2)),
+        device=b_q_weight.device,
+        dtype=b_q_weight.dtype,
+    )
     for e in range(num_experts):
-        output[e] = torch.ops._C.awq_marlin_repack(b_q_weight[e], size_k,
-                                                   size_n, num_bits)
+        output[e] = torch.ops._C.awq_marlin_repack(
+            b_q_weight[e], size_k, size_n, num_bits
+        )
     return output
 
 
-def gptq_marlin_gemm(a: torch.Tensor,
-                     c: Optional[torch.Tensor],
-                     b_q_weight: torch.Tensor,
-                     b_bias: Optional[torch.Tensor],
-                     b_scales: torch.Tensor,
-                     global_scale: Optional[torch.Tensor],
-                     b_zeros: Optional[torch.Tensor],
-                     g_idx: Optional[torch.Tensor],
-                     perm: Optional[torch.Tensor],
-                     workspace: torch.Tensor,
-                     b_q_type: ScalarType,
-                     size_m: int,
-                     size_n: int,
-                     size_k: int,
-                     is_k_full: bool = True,
-                     use_atomic_add: bool = False,
-                     use_fp32_reduce: bool = False,
-                     is_zp_float: bool = False) -> torch.Tensor:
-    return torch.ops._C.gptq_marlin_gemm(a, c, b_q_weight, b_bias, b_scales,
-                                         global_scale, b_zeros, g_idx, perm,
-                                         workspace, b_q_type.id, size_m,
-                                         size_n, size_k, is_k_full,
-                                         use_atomic_add, use_fp32_reduce,
-                                         is_zp_float)
+def gptq_marlin_gemm(
+    a: torch.Tensor,
+    c: Optional[torch.Tensor],
+    b_q_weight: torch.Tensor,
+    b_bias: Optional[torch.Tensor],
+    b_scales: torch.Tensor,
+    global_scale: Optional[torch.Tensor],
+    b_zeros: Optional[torch.Tensor],
+    g_idx: Optional[torch.Tensor],
+    perm: Optional[torch.Tensor],
+    workspace: torch.Tensor,
+    b_q_type: ScalarType,
+    size_m: int,
+    size_n: int,
+    size_k: int,
+    is_k_full: bool = True,
+    use_atomic_add: bool = False,
+    use_fp32_reduce: bool = False,
+    is_zp_float: bool = False,
+) -> torch.Tensor:
+    return torch.ops._C.gptq_marlin_gemm(
+        a,
+        c,
+        b_q_weight,
+        b_bias,
+        b_scales,
+        global_scale,
+        b_zeros,
+        g_idx,
+        perm,
+        workspace,
+        b_q_type.id,
+        size_m,
+        size_n,
+        size_k,
+        is_k_full,
+        use_atomic_add,
+        use_fp32_reduce,
+        is_zp_float,
+    )
 
 
 # machete
 def machete_supported_schedules(
-        a_type: torch.dtype,
-        b_type: ScalarType,
-        group_scales_type: Optional[torch.dtype],
-        group_zeros_type: Optional[torch.dtype] = None,
-        channel_scales_type: Optional[torch.dtype] = None,
-        token_scales_type: Optional[torch.dtype] = None,
-        out_type: Optional[torch.dtype] = None) -> list[str]:
+    a_type: torch.dtype,
+    b_type: ScalarType,
+    group_scales_type: Optional[torch.dtype],
+    group_zeros_type: Optional[torch.dtype] = None,
+    channel_scales_type: Optional[torch.dtype] = None,
+    token_scales_type: Optional[torch.dtype] = None,
+    out_type: Optional[torch.dtype] = None,
+) -> list[str]:
     return torch.ops._C.machete_supported_schedules(
-        a_type, b_type.id, group_scales_type, group_zeros_type,
-        channel_scales_type, token_scales_type, out_type)
+        a_type,
+        b_type.id,
+        group_scales_type,
+        group_zeros_type,
+        channel_scales_type,
+        token_scales_type,
+        out_type,
+    )
 
 
 def machete_mm(
-        a: torch.Tensor,
-        # b_q Should be the tensor returned by machete_prepack_B
-        b_q: torch.Tensor,
-        b_type: ScalarType,
-        out_type: Optional[torch.dtype] = None,
-        b_group_scales: Optional[torch.Tensor] = None,
-        b_group_zeros: Optional[torch.Tensor] = None,
-        b_group_size: Optional[int] = None,
-        b_channel_scales: Optional[torch.Tensor] = None,
-        a_token_scales: Optional[torch.Tensor] = None,
-        schedule: Optional[str] = None) -> torch.Tensor:
-    return torch.ops._C.machete_mm(a, b_q, b_type.id, out_type, b_group_scales,
-                                   b_group_zeros, b_group_size,
-                                   b_channel_scales, a_token_scales, schedule)
+    a: torch.Tensor,
+    # b_q Should be the tensor returned by machete_prepack_B
+    b_q: torch.Tensor,
+    b_type: ScalarType,
+    out_type: Optional[torch.dtype] = None,
+    b_group_scales: Optional[torch.Tensor] = None,
+    b_group_zeros: Optional[torch.Tensor] = None,
+    b_group_size: Optional[int] = None,
+    b_channel_scales: Optional[torch.Tensor] = None,
+    a_token_scales: Optional[torch.Tensor] = None,
+    schedule: Optional[str] = None,
+) -> torch.Tensor:
+    return torch.ops._C.machete_mm(
+        a,
+        b_q,
+        b_type.id,
+        out_type,
+        b_group_scales,
+        b_group_zeros,
+        b_group_size,
+        b_channel_scales,
+        a_token_scales,
+        schedule,
+    )
 
 
 def machete_prepack_B(
-        b_q_weight: torch.Tensor, a_type: torch.dtype, b_type: ScalarType,
-        group_scales_type: Optional[torch.dtype]) -> torch.Tensor:
-    return torch.ops._C.machete_prepack_B(b_q_weight, a_type, b_type.id,
-                                          group_scales_type)
+    b_q_weight: torch.Tensor,
+    a_type: torch.dtype,
+    b_type: ScalarType,
+    group_scales_type: Optional[torch.dtype],
+) -> torch.Tensor:
+    return torch.ops._C.machete_prepack_B(
+        b_q_weight, a_type, b_type.id, group_scales_type
+    )
 
 
 # CUTLASS W4A8
 def cutlass_w4a8_mm(
-        a: torch.Tensor,
-        # b_q Should be the tensor returned by cutlass_encode_and_reorder_int4b
-        b_q: torch.Tensor,
-        b_group_scales: torch.Tensor,
-        b_group_size: int,
-        b_channel_scales: torch.Tensor,
-        a_token_scales: torch.Tensor,
-        out_type: Optional[torch.dtype] = None,
-        maybe_schedule: Optional[str] = None) -> torch.Tensor:
-    return torch.ops._C.cutlass_w4a8_mm(a, b_q, b_group_scales, b_group_size,
-                                        b_channel_scales, a_token_scales,
-                                        out_type, maybe_schedule)
+    a: torch.Tensor,
+    # b_q Should be the tensor returned by cutlass_encode_and_reorder_int4b
+    b_q: torch.Tensor,
+    b_group_scales: torch.Tensor,
+    b_group_size: int,
+    b_channel_scales: torch.Tensor,
+    a_token_scales: torch.Tensor,
+    out_type: Optional[torch.dtype] = None,
+    maybe_schedule: Optional[str] = None,
+) -> torch.Tensor:
+    return torch.ops._C.cutlass_w4a8_mm(
+        a,
+        b_q,
+        b_group_scales,
+        b_group_size,
+        b_channel_scales,
+        a_token_scales,
+        out_type,
+        maybe_schedule,
+    )
 
 
 def cutlass_pack_scale_fp8(scales: torch.Tensor) -> torch.Tensor:
@@ -1073,8 +1330,7 @@ def cutlass_encode_and_reorder_int4b(b: torch.Tensor) -> torch.Tensor:
 if hasattr(torch.ops._C, "permute_cols"):
 
     @register_fake("_C::permute_cols")
-    def _permute_cols_fake(a: torch.Tensor,
-                           perm: torch.Tensor) -> torch.Tensor:
+    def _permute_cols_fake(a: torch.Tensor, perm: torch.Tensor) -> torch.Tensor:
         return torch.empty_like(a)
 
 
@@ -1084,8 +1340,8 @@ def permute_cols(a: torch.Tensor, perm: torch.Tensor) -> torch.Tensor:
 
 # fp4
 def scaled_fp4_quant(
-        input: torch.Tensor,
-        input_global_scale: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+    input: torch.Tensor, input_global_scale: torch.Tensor
+) -> tuple[torch.Tensor, torch.Tensor]:
     """
     Quantize input tensor to FP4 and return quantized tensor and scale.
 
@@ -1105,18 +1361,17 @@ def scaled_fp4_quant(
             in the sizzled layout.
     """
     assert not current_platform.is_rocm()
-    assert input.ndim >= 1, (
-        f'input.ndim needs to be >= 1, but got {input.ndim}.')
+    assert input.ndim >= 1, f"input.ndim needs to be >= 1, but got {input.ndim}."
     other_dims = 1 if input.ndim == 1 else -1
     input = input.reshape(other_dims, input.shape[-1])
     m, n = input.shape
     block_size = 16
     device = input.device
 
-    assert n % block_size == 0, (
-        f'last dim has to be multiple of 16, but got {n}.')
+    assert n % block_size == 0, f"last dim has to be multiple of 16, but got {n}."
     assert input.dtype in (torch.float16, torch.bfloat16), (
-        f'input.dtype needs to be fp16 or bf16 but got {input.dtype}.')
+        f"input.dtype needs to be fp16 or bf16 but got {input.dtype}."
+    )
 
     # Two fp4 values will be packed into an uint8.
     output = torch.empty((m, n // 2), device=device, dtype=torch.uint8)
@@ -1130,12 +1385,11 @@ def scaled_fp4_quant(
     rounded_m = round_up(m, 128)
     scale_n = n // block_size
     rounded_n = round_up(scale_n, 4)
-    output_scale = torch.empty((rounded_m, rounded_n // 4),
-                               device=device,
-                               dtype=torch.int32)
+    output_scale = torch.empty(
+        (rounded_m, rounded_n // 4), device=device, dtype=torch.int32
+    )
 
-    torch.ops._C.scaled_fp4_quant(output, input, output_scale,
-                                  input_global_scale)
+    torch.ops._C.scaled_fp4_quant(output, input, output_scale, input_global_scale)
     output_scale = output_scale.view(torch.float8_e4m3fn)
     return output, output_scale
 
@@ -1161,7 +1415,8 @@ def scaled_fp4_experts_quant(
     """
     assert not current_platform.is_rocm()
     assert input_tensor.ndim == 2, (
-        f'input.ndim needs to be == 2, but got {input_tensor.ndim}.')
+        f"input.ndim needs to be == 2, but got {input_tensor.ndim}."
+    )
 
     # Control the maximum number of tokens per expert supported by the
     # NVFP4 MoE Expert Quantization. This is used to prevent the kernel
@@ -1170,26 +1425,33 @@ def scaled_fp4_experts_quant(
     MAX_TOKENS_PER_EXPERT = envs.VLLM_MAX_TOKENS_PER_EXPERT_FP4_MOE
     m_numtopk, k = input_tensor.shape
 
-    assert (m_numtopk <= MAX_TOKENS_PER_EXPERT * topk), (
+    assert m_numtopk <= MAX_TOKENS_PER_EXPERT * topk, (
         f"m_numtopk must be less than MAX_TOKENS_PER_EXPERT("
         f"{MAX_TOKENS_PER_EXPERT})"
         f" for cutlass_moe_fp4, observed m_numtopk = {m_numtopk}. Use"
-        f" VLLM_MAX_TOKENS_PER_EXPERT_FP4_MOE to set this value.")
+        f" VLLM_MAX_TOKENS_PER_EXPERT_FP4_MOE to set this value."
+    )
     scales_k = k // 16
     padded_k = (scales_k + (4 - 1)) // 4
 
     # output is uint8 and packed fp4 values
-    output = torch.empty(m_numtopk,
-                         k // 2,
-                         device=input_tensor.device,
-                         dtype=torch.uint8)
-    output_scales = torch.empty(MAX_TOKENS_PER_EXPERT * topk,
-                                padded_k,
-                                dtype=torch.int32,
-                                device=input_tensor.device)
-    torch.ops._C.scaled_fp4_experts_quant(output, output_scales, input_tensor,
-                                          input_global_scale, expert_offsets,
-                                          blockscale_offsets)
+    output = torch.empty(
+        m_numtopk, k // 2, device=input_tensor.device, dtype=torch.uint8
+    )
+    output_scales = torch.empty(
+        MAX_TOKENS_PER_EXPERT * topk,
+        padded_k,
+        dtype=torch.int32,
+        device=input_tensor.device,
+    )
+    torch.ops._C.scaled_fp4_experts_quant(
+        output,
+        output_scales,
+        input_tensor,
+        input_global_scale,
+        expert_offsets,
+        blockscale_offsets,
+    )
     output_scales = output_scales.view(torch.float8_e4m3fn)
     return output, output_scales
 
@@ -1227,7 +1489,7 @@ def scaled_fp8_quant(
             scaling factor.
     """
     # This code assumes batch_dim and num_tokens are flattened
-    assert (input.ndim == 2)
+    assert input.ndim == 2
     shape: Union[tuple[int, int], torch.Size] = input.shape
     # For ROCm on MI300, the output fp8 dtype is torch.float_e3m3fnuz
     out_dtype: torch.dtype = current_platform.fp8_dtype()
@@ -1236,17 +1498,15 @@ def scaled_fp8_quant(
     if output is None:
         output = torch.empty(shape, device=input.device, dtype=out_dtype)
     else:
-        assert num_token_padding is None, \
-            "padding not supported if output passed in"
+        assert num_token_padding is None, "padding not supported if output passed in"
         assert output.dtype == out_dtype
 
     if scale is None:
         if use_per_token_if_dynamic:
-            scale = torch.empty((shape[0], 1),
-                                device=input.device,
-                                dtype=torch.float32)
+            scale = torch.empty((shape[0], 1), device=input.device, dtype=torch.float32)
             torch.ops._C.dynamic_per_token_scaled_fp8_quant(
-                output, input, scale, scale_ub)
+                output, input, scale, scale_ub
+            )
         else:
             scale = torch.empty(1, device=input.device, dtype=torch.float32)
             torch.ops._C.dynamic_scaled_fp8_quant(output, input, scale)
@@ -1259,10 +1519,10 @@ def scaled_fp8_quant(
 
 # gptq allspark
 def allspark_repack_weight(
-        qweight: torch.Tensor,
-        scale: torch.Tensor,
-        zero_point: Optional[torch.Tensor] = None,
-        has_zp: bool = False
+    qweight: torch.Tensor,
+    scale: torch.Tensor,
+    zero_point: Optional[torch.Tensor] = None,
+    has_zp: bool = False,
 ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
     """
     Rearrange qweight, scale, and zero_point(if asymmetric) to n32k16 format
@@ -1284,38 +1544,61 @@ def allspark_repack_weight(
     N = qweight.shape[1]
     N_32align = (N + 32 - 1) // 32 * 32
 
-    qweight_reorder = torch.empty((N_32align, K),
-                                  device=qweight.device,
-                                  dtype=qweight.dtype)
-    scale_reorder = torch.empty((1, N_32align),
-                                device=scale.device,
-                                dtype=scale.dtype)
+    qweight_reorder = torch.empty(
+        (N_32align, K), device=qweight.device, dtype=qweight.dtype
+    )
+    scale_reorder = torch.empty((1, N_32align), device=scale.device, dtype=scale.dtype)
     zero_point_reorder = None
     if has_zp:
         assert zero_point is not None, (
-            "zero_point must be provided for asymmetric quantization.")
-        zero_point_reorder = torch.empty((1, N_32align),
-                                         device=zero_point.device,
-                                         dtype=zero_point.dtype)
+            "zero_point must be provided for asymmetric quantization."
+        )
+        zero_point_reorder = torch.empty(
+            (1, N_32align), device=zero_point.device, dtype=zero_point.dtype
+        )
 
     torch.ops._C.rearrange_kn_weight_as_n32k16_order(
-        qweight, scale, zero_point, has_zp, qweight_reorder, scale_reorder,
-        zero_point_reorder, K, N, N_32align)
+        qweight,
+        scale,
+        zero_point,
+        has_zp,
+        qweight_reorder,
+        scale_reorder,
+        zero_point_reorder,
+        K,
+        N,
+        N_32align,
+    )
 
     return qweight_reorder, scale_reorder, zero_point_reorder
 
 
-def allspark_w8a16_gemm(a: torch.Tensor, b_qweight: torch.Tensor,
-                        b_scales: torch.Tensor,
-                        b_qzeros: Optional[torch.Tensor], n: int,
-                        group_size: int, sm_count: int, sm_version: int,
-                        CUBLAS_M_THRESHOLD: int, has_zp: bool,
-                        n32k16_reorder: bool) -> torch.Tensor:
-
-    return torch.ops._C.allspark_w8a16_gemm(a, b_qweight, b_scales, b_qzeros,
-                                            n, group_size, sm_count,
-                                            sm_version, CUBLAS_M_THRESHOLD,
-                                            has_zp, n32k16_reorder)
+def allspark_w8a16_gemm(
+    a: torch.Tensor,
+    b_qweight: torch.Tensor,
+    b_scales: torch.Tensor,
+    b_qzeros: Optional[torch.Tensor],
+    n: int,
+    group_size: int,
+    sm_count: int,
+    sm_version: int,
+    CUBLAS_M_THRESHOLD: int,
+    has_zp: bool,
+    n32k16_reorder: bool,
+) -> torch.Tensor:
+    return torch.ops._C.allspark_w8a16_gemm(
+        a,
+        b_qweight,
+        b_scales,
+        b_qzeros,
+        n,
+        group_size,
+        sm_count,
+        sm_version,
+        CUBLAS_M_THRESHOLD,
+        has_zp,
+        n32k16_reorder,
+    )
 
 
 # int8
@@ -1323,7 +1606,7 @@ def scaled_int8_quant(
     input: torch.Tensor,
     scale: Optional[torch.Tensor] = None,
     azp: Optional[torch.Tensor] = None,
-    symmetric: bool = True
+    symmetric: bool = True,
 ) -> tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor]]:
     """
     Quantize the input tensor to int8 and return the quantized tensor and scale, and maybe azp.
@@ -1342,26 +1625,27 @@ def scaled_int8_quant(
     output = torch.empty_like(input, dtype=torch.int8)
     if scale is not None:
         # static-per-tensor quantization.
-        assert symmetric == (
-            azp
-            is None), "azp must only be provided for asymmetric quantization."
+        assert symmetric == (azp is None), (
+            "azp must only be provided for asymmetric quantization."
+        )
         torch.ops._C.static_scaled_int8_quant(output, input, scale, azp)
         return output, scale, azp
 
     # dynamic-per-token quantization.
-    input_scales = torch.empty((input.numel() // input.shape[-1], 1),
-                               device=input.device,
-                               dtype=torch.float32)
-    input_azp = None if symmetric else torch.empty_like(input_scales,
-                                                        dtype=torch.int32)
-    torch.ops._C.dynamic_scaled_int8_quant(output, input.contiguous(),
-                                           input_scales, input_azp)
+    input_scales = torch.empty(
+        (input.numel() // input.shape[-1], 1), device=input.device, dtype=torch.float32
+    )
+    input_azp = None if symmetric else torch.empty_like(input_scales, dtype=torch.int32)
+    torch.ops._C.dynamic_scaled_int8_quant(
+        output, input.contiguous(), input_scales, input_azp
+    )
     return output, input_scales, input_azp
 
 
 # gguf
-def ggml_dequantize(W: torch.Tensor, quant_type: int, m: int, n: int,
-                    dtype: Optional[torch.dtype]) -> torch.Tensor:
+def ggml_dequantize(
+    W: torch.Tensor, quant_type: int, m: int, n: int, dtype: Optional[torch.dtype]
+) -> torch.Tensor:
     return torch.ops._C.ggml_dequantize(W, quant_type, m, n, dtype)
 
 
@@ -1394,9 +1678,17 @@ def ggml_moe_a8(
     top_k: int,
     tokens: int,
 ) -> torch.Tensor:
-    return torch.ops._C.ggml_moe_a8(X, W, sorted_token_ids, expert_ids,
-                                    num_tokens_post_padded, quant_type, row,
-                                    top_k, tokens)
+    return torch.ops._C.ggml_moe_a8(
+        X,
+        W,
+        sorted_token_ids,
+        expert_ids,
+        num_tokens_post_padded,
+        quant_type,
+        row,
+        top_k,
+        tokens,
+    )
 
 
 def ggml_moe_a8_vec(
@@ -1408,8 +1700,7 @@ def ggml_moe_a8_vec(
     row: torch.SymInt,
     tokens: torch.SymInt,
 ) -> torch.Tensor:
-    return torch.ops._C.ggml_moe_a8_vec(X, W, topk_ids, top_k, quant_type, row,
-                                        tokens)
+    return torch.ops._C.ggml_moe_a8_vec(X, W, topk_ids, top_k, quant_type, row, tokens)
 
 
 def ggml_moe_get_block_size(quant_type: int) -> int:
@@ -1417,44 +1708,61 @@ def ggml_moe_get_block_size(quant_type: int) -> int:
 
 
 # mamba
-def selective_scan_fwd(u: torch.Tensor, delta: torch.Tensor, A: torch.Tensor,
-                       B: torch.Tensor, C: torch.Tensor,
-                       D_: Optional[torch.Tensor], z_: Optional[torch.Tensor],
-                       delta_bias_: Optional[torch.Tensor],
-                       delta_softplus: bool,
-                       query_start_loc: Optional[torch.Tensor],
-                       cache_indices: Optional[torch.Tensor],
-                       has_initial_state: Optional[torch.Tensor],
-                       ssm_states: torch.Tensor, pad_slot_id: int):
-    torch.ops._C.selective_scan_fwd(u, delta, A, B, C, D_, z_, delta_bias_,
-                                    delta_softplus, query_start_loc,
-                                    cache_indices, has_initial_state,
-                                    ssm_states, pad_slot_id)
+def selective_scan_fwd(
+    u: torch.Tensor,
+    delta: torch.Tensor,
+    A: torch.Tensor,
+    B: torch.Tensor,
+    C: torch.Tensor,
+    D_: Optional[torch.Tensor],
+    z_: Optional[torch.Tensor],
+    delta_bias_: Optional[torch.Tensor],
+    delta_softplus: bool,
+    query_start_loc: Optional[torch.Tensor],
+    cache_indices: Optional[torch.Tensor],
+    has_initial_state: Optional[torch.Tensor],
+    ssm_states: torch.Tensor,
+    pad_slot_id: int,
+):
+    torch.ops._C.selective_scan_fwd(
+        u,
+        delta,
+        A,
+        B,
+        C,
+        D_,
+        z_,
+        delta_bias_,
+        delta_softplus,
+        query_start_loc,
+        cache_indices,
+        has_initial_state,
+        ssm_states,
+        pad_slot_id,
+    )
 
 
 # ROCm skinny gemms
-def LLMM1(a: torch.Tensor, b: torch.Tensor,
-          rows_per_block: int) -> torch.Tensor:
+def LLMM1(a: torch.Tensor, b: torch.Tensor, rows_per_block: int) -> torch.Tensor:
     return torch.ops._rocm_C.LLMM1(a, b, rows_per_block)
 
 
-def wvSplitK(a: torch.Tensor,
-             b: torch.Tensor,
-             cu_count: int,
-             bias: torch.Tensor = None) -> torch.Tensor:
+def wvSplitK(
+    a: torch.Tensor, b: torch.Tensor, cu_count: int, bias: torch.Tensor = None
+) -> torch.Tensor:
     return torch.ops._rocm_C.wvSplitK(a, b, bias, cu_count)
 
 
-def wvSplitKQ(a: torch.Tensor,
-              b: torch.Tensor,
-              out_dtype: torch.dtype,
-              scale_a: torch.Tensor,
-              scale_b: torch.Tensor,
-              cu_count: int,
-              bias: torch.Tensor = None) -> torch.Tensor:
-    out = torch.empty((b.shape[0], a.shape[0]),
-                      dtype=out_dtype,
-                      device=b.device)
+def wvSplitKQ(
+    a: torch.Tensor,
+    b: torch.Tensor,
+    out_dtype: torch.dtype,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    cu_count: int,
+    bias: torch.Tensor = None,
+) -> torch.Tensor:
+    out = torch.empty((b.shape[0], a.shape[0]), dtype=out_dtype, device=b.device)
     torch.ops._rocm_C.wvSplitKQ(a, b, bias, out, scale_a, scale_b, cu_count)
     return out
 
@@ -1464,118 +1772,212 @@ def moe_sum(input: torch.Tensor, output: torch.Tensor):
     torch.ops._moe_C.moe_sum(input, output)
 
 
-def moe_align_block_size(topk_ids: torch.Tensor, num_experts: int,
-                         block_size: int, sorted_token_ids: torch.Tensor,
-                         experts_ids: torch.Tensor,
-                         num_tokens_post_pad: torch.Tensor) -> None:
-    torch.ops._moe_C.moe_align_block_size(topk_ids, num_experts, block_size,
-                                          sorted_token_ids, experts_ids,
-                                          num_tokens_post_pad)
+def moe_align_block_size(
+    topk_ids: torch.Tensor,
+    num_experts: int,
+    block_size: int,
+    sorted_token_ids: torch.Tensor,
+    experts_ids: torch.Tensor,
+    num_tokens_post_pad: torch.Tensor,
+) -> None:
+    torch.ops._moe_C.moe_align_block_size(
+        topk_ids,
+        num_experts,
+        block_size,
+        sorted_token_ids,
+        experts_ids,
+        num_tokens_post_pad,
+    )
 
 
-def moe_wna16_gemm(input: torch.Tensor, output: torch.Tensor,
-                   b_qweight: torch.Tensor, b_scales: torch.Tensor,
-                   b_qzeros: Optional[torch.Tensor],
-                   topk_weights: Optional[torch.Tensor],
-                   sorted_token_ids: torch.Tensor, experts_ids: torch.Tensor,
-                   num_tokens_post_pad: torch.Tensor, top_k: int,
-                   BLOCK_SIZE_M: int, BLOCK_SIZE_N: int, BLOCK_SIZE_K: int,
-                   bit: int) -> torch.Tensor:
+def moe_wna16_gemm(
+    input: torch.Tensor,
+    output: torch.Tensor,
+    b_qweight: torch.Tensor,
+    b_scales: torch.Tensor,
+    b_qzeros: Optional[torch.Tensor],
+    topk_weights: Optional[torch.Tensor],
+    sorted_token_ids: torch.Tensor,
+    experts_ids: torch.Tensor,
+    num_tokens_post_pad: torch.Tensor,
+    top_k: int,
+    BLOCK_SIZE_M: int,
+    BLOCK_SIZE_N: int,
+    BLOCK_SIZE_K: int,
+    bit: int,
+) -> torch.Tensor:
     if not current_platform.is_cuda():
         raise NotImplementedError(
-            "The optimized moe_wna16_gemm kernel is only "
-            "available on CUDA platforms")
-    torch.ops._moe_C.moe_wna16_gemm(input, output, b_qweight, b_scales,
-                                    b_qzeros, topk_weights, sorted_token_ids,
-                                    experts_ids, num_tokens_post_pad, top_k,
-                                    BLOCK_SIZE_M, BLOCK_SIZE_N, BLOCK_SIZE_K,
-                                    bit)
+            "The optimized moe_wna16_gemm kernel is only available on CUDA platforms"
+        )
+    torch.ops._moe_C.moe_wna16_gemm(
+        input,
+        output,
+        b_qweight,
+        b_scales,
+        b_qzeros,
+        topk_weights,
+        sorted_token_ids,
+        experts_ids,
+        num_tokens_post_pad,
+        top_k,
+        BLOCK_SIZE_M,
+        BLOCK_SIZE_N,
+        BLOCK_SIZE_K,
+        bit,
+    )
 
 
-def topk_softmax(topk_weights: torch.Tensor, topk_ids: torch.Tensor,
-                 token_expert_indices: torch.Tensor,
-                 gating_output: torch.Tensor) -> None:
-    torch.ops._moe_C.topk_softmax(topk_weights, topk_ids, token_expert_indices,
-                                  gating_output)
+def topk_softmax(
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    token_expert_indices: torch.Tensor,
+    gating_output: torch.Tensor,
+) -> None:
+    torch.ops._moe_C.topk_softmax(
+        topk_weights, topk_ids, token_expert_indices, gating_output
+    )
 
 
-def grouped_topk(scores: torch.Tensor, scores_with_bias: torch.Tensor,
-                 num_expert_group: int, topk_group: int, topk: int,
-                 renormalize: bool, routed_scaling_factor: float):
+def grouped_topk(
+    scores: torch.Tensor,
+    scores_with_bias: torch.Tensor,
+    num_expert_group: int,
+    topk_group: int,
+    topk: int,
+    renormalize: bool,
+    routed_scaling_factor: float,
+):
     if not current_platform.is_cuda():
-        raise NotImplementedError("The fused grouped_topk kernel is only "
-                                  "available on CUDA platforms")
-    return torch.ops._moe_C.grouped_topk(scores, scores_with_bias,
-                                         num_expert_group, topk_group, topk,
-                                         renormalize, routed_scaling_factor)
-
-
-def moe_wna16_marlin_gemm(input: torch.Tensor, output: Optional[torch.Tensor],
-                          b_qweight: torch.Tensor,
-                          b_bias: Optional[torch.Tensor],
-                          b_scales: torch.Tensor,
-                          global_scale: Optional[torch.Tensor],
-                          b_qzeros: Optional[torch.Tensor],
-                          g_idx: Optional[torch.Tensor],
-                          perm: Optional[torch.Tensor],
-                          workspace: torch.Tensor,
-                          sorted_token_ids: torch.Tensor,
-                          expert_ids: torch.Tensor,
-                          num_tokens_past_padded: torch.Tensor,
-                          topk_weights: torch.Tensor, moe_block_size: int,
-                          top_k: int, mul_topk_weights: bool, is_ep: bool,
-                          b_q_type: ScalarType, size_m: int, size_n: int,
-                          size_k: int, is_k_full: bool, use_atomic_add: bool,
-                          use_fp32_reduce: bool,
-                          is_zp_float: bool) -> torch.Tensor:
+        raise NotImplementedError(
+            "The fused grouped_topk kernel is only available on CUDA platforms"
+        )
+    return torch.ops._moe_C.grouped_topk(
+        scores,
+        scores_with_bias,
+        num_expert_group,
+        topk_group,
+        topk,
+        renormalize,
+        routed_scaling_factor,
+    )
+
+
+def moe_wna16_marlin_gemm(
+    input: torch.Tensor,
+    output: Optional[torch.Tensor],
+    b_qweight: torch.Tensor,
+    b_bias: Optional[torch.Tensor],
+    b_scales: torch.Tensor,
+    global_scale: Optional[torch.Tensor],
+    b_qzeros: Optional[torch.Tensor],
+    g_idx: Optional[torch.Tensor],
+    perm: Optional[torch.Tensor],
+    workspace: torch.Tensor,
+    sorted_token_ids: torch.Tensor,
+    expert_ids: torch.Tensor,
+    num_tokens_past_padded: torch.Tensor,
+    topk_weights: torch.Tensor,
+    moe_block_size: int,
+    top_k: int,
+    mul_topk_weights: bool,
+    is_ep: bool,
+    b_q_type: ScalarType,
+    size_m: int,
+    size_n: int,
+    size_k: int,
+    is_k_full: bool,
+    use_atomic_add: bool,
+    use_fp32_reduce: bool,
+    is_zp_float: bool,
+) -> torch.Tensor:
     return torch.ops._moe_C.moe_wna16_marlin_gemm(
-        input, output, b_qweight, b_bias, b_scales, global_scale, b_qzeros,
-        g_idx, perm, workspace, sorted_token_ids, expert_ids,
-        num_tokens_past_padded, topk_weights, moe_block_size, top_k,
-        mul_topk_weights, is_ep, b_q_type.id, size_m, size_n, size_k,
-        is_k_full, use_atomic_add, use_fp32_reduce, is_zp_float)
+        input,
+        output,
+        b_qweight,
+        b_bias,
+        b_scales,
+        global_scale,
+        b_qzeros,
+        g_idx,
+        perm,
+        workspace,
+        sorted_token_ids,
+        expert_ids,
+        num_tokens_past_padded,
+        topk_weights,
+        moe_block_size,
+        top_k,
+        mul_topk_weights,
+        is_ep,
+        b_q_type.id,
+        size_m,
+        size_n,
+        size_k,
+        is_k_full,
+        use_atomic_add,
+        use_fp32_reduce,
+        is_zp_float,
+    )
 
 
 if supports_moe_ops and hasattr(torch.ops._moe_C, "marlin_gemm_moe"):
 
     @register_fake("_moe_C::marlin_gemm_moe")
-    def marlin_gemm_moe_fake(a: torch.Tensor, b_q_weights: torch.Tensor,
-                             sorted_ids: torch.Tensor,
-                             topk_weights: torch.Tensor,
-                             topk_ids: torch.Tensor, b_scales: torch.Tensor,
-                             b_zero_points: torch.Tensor, g_idx: torch.Tensor,
-                             perm: torch.Tensor, workspace: torch.Tensor,
-                             b_q_type: ScalarType, size_m: torch.SymInt,
-                             size_n: torch.SymInt, size_k: torch.SymInt,
-                             is_k_full: bool, num_experts: int, topk: int,
-                             moe_block_size: int, replicate_input: bool,
-                             apply_weights: bool) -> torch.Tensor:
-        return torch.empty((size_m, topk, size_n),
-                           dtype=a.dtype,
-                           device=a.device)
+    def marlin_gemm_moe_fake(
+        a: torch.Tensor,
+        b_q_weights: torch.Tensor,
+        sorted_ids: torch.Tensor,
+        topk_weights: torch.Tensor,
+        topk_ids: torch.Tensor,
+        b_scales: torch.Tensor,
+        b_zero_points: torch.Tensor,
+        g_idx: torch.Tensor,
+        perm: torch.Tensor,
+        workspace: torch.Tensor,
+        b_q_type: ScalarType,
+        size_m: torch.SymInt,
+        size_n: torch.SymInt,
+        size_k: torch.SymInt,
+        is_k_full: bool,
+        num_experts: int,
+        topk: int,
+        moe_block_size: int,
+        replicate_input: bool,
+        apply_weights: bool,
+    ) -> torch.Tensor:
+        return torch.empty((size_m, topk, size_n), dtype=a.dtype, device=a.device)
 
     @register_fake("_moe_C::moe_wna16_marlin_gemm")
-    def moe_wna16_marlin_gemm_fake(input: torch.Tensor,
-                                   output: Optional[torch.Tensor],
-                                   b_qweight: torch.Tensor,
-                                   b_scales: torch.Tensor,
-                                   b_qzeros: Optional[torch.Tensor],
-                                   g_idx: Optional[torch.Tensor],
-                                   perm: Optional[torch.Tensor],
-                                   workspace: torch.Tensor,
-                                   sorted_token_ids: torch.Tensor,
-                                   expert_ids: torch.Tensor,
-                                   num_tokens_past_padded: torch.Tensor,
-                                   topk_weights: torch.Tensor,
-                                   moe_block_size: int, top_k: int,
-                                   mul_topk_weights: bool, is_ep: bool,
-                                   b_q_type: ScalarType, size_m: int,
-                                   size_n: int, size_k: int, is_k_full: bool,
-                                   use_atomic_add: bool, use_fp32_reduce: bool,
-                                   is_zp_float: bool) -> torch.Tensor:
-        return torch.empty((size_m * top_k, size_n),
-                           dtype=input.dtype,
-                           device=input.device)
+    def moe_wna16_marlin_gemm_fake(
+        input: torch.Tensor,
+        output: Optional[torch.Tensor],
+        b_qweight: torch.Tensor,
+        b_scales: torch.Tensor,
+        b_qzeros: Optional[torch.Tensor],
+        g_idx: Optional[torch.Tensor],
+        perm: Optional[torch.Tensor],
+        workspace: torch.Tensor,
+        sorted_token_ids: torch.Tensor,
+        expert_ids: torch.Tensor,
+        num_tokens_past_padded: torch.Tensor,
+        topk_weights: torch.Tensor,
+        moe_block_size: int,
+        top_k: int,
+        mul_topk_weights: bool,
+        is_ep: bool,
+        b_q_type: ScalarType,
+        size_m: int,
+        size_n: int,
+        size_k: int,
+        is_k_full: bool,
+        use_atomic_add: bool,
+        use_fp32_reduce: bool,
+        is_zp_float: bool,
+    ) -> torch.Tensor:
+        return torch.empty(
+            (size_m * top_k, size_n), dtype=input.dtype, device=input.device
+        )
 
 
 def reshape_and_cache(
@@ -1588,9 +1990,16 @@ def reshape_and_cache(
     k_scale: torch.Tensor,
     v_scale: torch.Tensor,
 ) -> None:
-    torch.ops._C_cache_ops.reshape_and_cache(key, value, key_cache,
-                                             value_cache, slot_mapping,
-                                             kv_cache_dtype, k_scale, v_scale)
+    torch.ops._C_cache_ops.reshape_and_cache(
+        key,
+        value,
+        key_cache,
+        value_cache,
+        slot_mapping,
+        kv_cache_dtype,
+        k_scale,
+        v_scale,
+    )
 
 
 def reshape_and_cache_flash(
@@ -1603,10 +2012,16 @@ def reshape_and_cache_flash(
     k_scale: torch.Tensor,
     v_scale: torch.Tensor,
 ) -> None:
-    torch.ops._C_cache_ops.reshape_and_cache_flash(key, value, key_cache,
-                                                   value_cache, slot_mapping,
-                                                   kv_cache_dtype, k_scale,
-                                                   v_scale)
+    torch.ops._C_cache_ops.reshape_and_cache_flash(
+        key,
+        value,
+        key_cache,
+        value_cache,
+        slot_mapping,
+        kv_cache_dtype,
+        k_scale,
+        v_scale,
+    )
 
 
 def concat_and_cache_mla(
@@ -1617,65 +2032,80 @@ def concat_and_cache_mla(
     kv_cache_dtype: str,
     scale: torch.Tensor,
 ) -> None:
-    torch.ops._C_cache_ops.concat_and_cache_mla(kv_c, k_pe, kv_cache,
-                                                slot_mapping, kv_cache_dtype,
-                                                scale)
+    torch.ops._C_cache_ops.concat_and_cache_mla(
+        kv_c, k_pe, kv_cache, slot_mapping, kv_cache_dtype, scale
+    )
 
 
-def copy_blocks(key_caches: list[torch.Tensor],
-                value_caches: list[torch.Tensor],
-                block_mapping: torch.Tensor) -> None:
+def copy_blocks(
+    key_caches: list[torch.Tensor],
+    value_caches: list[torch.Tensor],
+    block_mapping: torch.Tensor,
+) -> None:
     torch.ops._C_cache_ops.copy_blocks(key_caches, value_caches, block_mapping)
 
 
-def copy_blocks_mla(kv_caches: list[torch.Tensor],
-                    block_mapping: torch.Tensor) -> None:
+def copy_blocks_mla(kv_caches: list[torch.Tensor], block_mapping: torch.Tensor) -> None:
     torch.ops._C_cache_ops.copy_blocks_mla(kv_caches, block_mapping)
 
 
-def swap_blocks(src: torch.Tensor, dst: torch.Tensor,
-                block_mapping: torch.Tensor) -> None:
+def swap_blocks(
+    src: torch.Tensor, dst: torch.Tensor, block_mapping: torch.Tensor
+) -> None:
     torch.ops._C_cache_ops.swap_blocks(src, dst, block_mapping)
 
 
-def convert_fp8(output: torch.Tensor,
-                input: torch.Tensor,
-                scale: float = 1.0,
-                kv_dtype: str = "fp8") -> None:
+def convert_fp8(
+    output: torch.Tensor, input: torch.Tensor, scale: float = 1.0, kv_dtype: str = "fp8"
+) -> None:
     torch.ops._C_cache_ops.convert_fp8(output, input, scale, kv_dtype)
 
 
 def gather_and_maybe_dequant_cache(
-        src_cache: torch.Tensor,
-        dst: torch.Tensor,
-        block_table: torch.Tensor,
-        cu_seq_lens: torch.Tensor,
-        batch_size: int,
-        kv_cache_dtype: str,
-        scale: torch.Tensor,
-        seq_starts: Optional[torch.Tensor] = None) -> None:
+    src_cache: torch.Tensor,
+    dst: torch.Tensor,
+    block_table: torch.Tensor,
+    cu_seq_lens: torch.Tensor,
+    batch_size: int,
+    kv_cache_dtype: str,
+    scale: torch.Tensor,
+    seq_starts: Optional[torch.Tensor] = None,
+) -> None:
     torch.ops._C_cache_ops.gather_and_maybe_dequant_cache(
-        src_cache, dst, block_table, cu_seq_lens, batch_size, kv_cache_dtype,
-        scale, seq_starts)
+        src_cache,
+        dst,
+        block_table,
+        cu_seq_lens,
+        batch_size,
+        kv_cache_dtype,
+        scale,
+        seq_starts,
+    )
 
 
-def cp_gather_cache(src_cache: torch.Tensor,
-                    dst: torch.Tensor,
-                    block_table: torch.Tensor,
-                    cu_seq_lens: torch.Tensor,
-                    batch_size: int,
-                    seq_starts: Optional[torch.Tensor] = None) -> None:
-    torch.ops._C_cache_ops.cp_gather_cache(src_cache, dst, block_table,
-                                           cu_seq_lens, batch_size, seq_starts)
+def cp_gather_cache(
+    src_cache: torch.Tensor,
+    dst: torch.Tensor,
+    block_table: torch.Tensor,
+    cu_seq_lens: torch.Tensor,
+    batch_size: int,
+    seq_starts: Optional[torch.Tensor] = None,
+) -> None:
+    torch.ops._C_cache_ops.cp_gather_cache(
+        src_cache, dst, block_table, cu_seq_lens, batch_size, seq_starts
+    )
 
 
-def indexer_k_quant_and_cache(k: torch.Tensor, kv_cache: torch.Tensor,
-                              slot_mapping: torch.Tensor,
-                              quant_block_size: int,
-                              kv_cache_dtype: str) -> None:
-    torch.ops._C_cache_ops.indexer_k_quant_and_cache(k, kv_cache, slot_mapping,
-                                                     quant_block_size,
-                                                     kv_cache_dtype)
+def indexer_k_quant_and_cache(
+    k: torch.Tensor,
+    kv_cache: torch.Tensor,
+    slot_mapping: torch.Tensor,
+    quant_block_size: int,
+    kv_cache_dtype: str,
+) -> None:
+    torch.ops._C_cache_ops.indexer_k_quant_and_cache(
+        k, kv_cache, slot_mapping, quant_block_size, kv_cache_dtype
+    )
 
 
 def get_device_attribute(attribute: int, device: int) -> int:
@@ -1685,20 +2115,30 @@ def get_device_attribute(attribute: int, device: int) -> int:
 def get_max_shared_memory_per_block_device_attribute(device: int) -> int:
     # ruff: noqa: E501
     return torch.ops._C_cuda_utils.get_max_shared_memory_per_block_device_attribute(
-        device)
+        device
+    )
 
 
 # custom ar
-def init_custom_ar(ipc_tensors: list[torch.Tensor], rank_data: torch.Tensor,
-                   rank: int, fully_connected: bool) -> int:
-    return torch.ops._C_custom_ar.init_custom_ar(ipc_tensors, rank_data, rank,
-                                                 fully_connected)
+def init_custom_ar(
+    ipc_tensors: list[torch.Tensor],
+    rank_data: torch.Tensor,
+    rank: int,
+    fully_connected: bool,
+) -> int:
+    return torch.ops._C_custom_ar.init_custom_ar(
+        ipc_tensors, rank_data, rank, fully_connected
+    )
 
 
-def all_reduce(fa: int, inp: torch.Tensor, out: torch.Tensor, reg_buffer: int,
-               reg_buffer_sz_bytes: int) -> None:
-    torch.ops._C_custom_ar.all_reduce(fa, inp, out, reg_buffer,
-                                      reg_buffer_sz_bytes)
+def all_reduce(
+    fa: int,
+    inp: torch.Tensor,
+    out: torch.Tensor,
+    reg_buffer: int,
+    reg_buffer_sz_bytes: int,
+) -> None:
+    torch.ops._C_custom_ar.all_reduce(fa, inp, out, reg_buffer, reg_buffer_sz_bytes)
 
 
 def dispose(fa: int) -> None:
@@ -1717,8 +2157,9 @@ def get_graph_buffer_ipc_meta(fa: int) -> tuple[list[int], list[int]]:
     return torch.ops._C_custom_ar.get_graph_buffer_ipc_meta(fa)
 
 
-def register_graph_buffers(fa: int, handles: list[list[int]],
-                           offsets: list[list[int]]) -> None:
+def register_graph_buffers(
+    fa: int, handles: list[list[int]], offsets: list[list[int]]
+) -> None:
     torch.ops._C_custom_ar.register_graph_buffers(fa, handles, offsets)
 
 
@@ -1735,9 +2176,9 @@ def free_shared_buffer(ptr: int) -> None:
 
 
 # quick all reduce
-def init_custom_qr(rank: int,
-                   world_size: int,
-                   qr_max_size: Optional[int] = None) -> int:
+def init_custom_qr(
+    rank: int, world_size: int, qr_max_size: Optional[int] = None
+) -> int:
     return torch.ops._C_custom_ar.init_custom_qr(rank, world_size, qr_max_size)
 
 
@@ -1745,13 +2186,14 @@ def qr_destroy(fa: int) -> None:
     torch.ops._C_custom_ar.qr_destroy(fa)
 
 
-def qr_all_reduce(fa: int,
-                  inp: torch.Tensor,
-                  out: torch.Tensor,
-                  quant_level: int,
-                  cast_bf2half: bool = False) -> None:
-    torch.ops._C_custom_ar.qr_all_reduce(fa, inp, out, quant_level,
-                                         cast_bf2half)
+def qr_all_reduce(
+    fa: int,
+    inp: torch.Tensor,
+    out: torch.Tensor,
+    quant_level: int,
+    cast_bf2half: bool = False,
+) -> None:
+    torch.ops._C_custom_ar.qr_all_reduce(fa, inp, out, quant_level, cast_bf2half)
 
 
 def qr_get_handle(fa: int) -> torch.Tensor:
@@ -1781,9 +2223,9 @@ def get_flash_mla_metadata(
         tile_scheduler_metadata: (num_sm_parts, TileSchedulerMetaDataSize), dtype torch.int32.
         num_splits: (batch_size + 1), dtype torch.int32.
     """
-    return torch.ops._C.get_flash_mla_metadata(cache_seqlens,
-                                               num_heads_per_head_k,
-                                               num_heads_k)
+    return torch.ops._C.get_flash_mla_metadata(
+        cache_seqlens, num_heads_per_head_k, num_heads_k
+    )
 
 
 def flash_mla_with_kvcache(
@@ -1814,7 +2256,7 @@ def flash_mla_with_kvcache(
         softmax_lse: (batch_size, num_heads_q, seq_len_q), torch.float32.
     """
     if softmax_scale is None:
-        softmax_scale = q.shape[-1]**(-0.5)
+        softmax_scale = q.shape[-1] ** (-0.5)
     out, softmax_lse = torch.ops._C.flash_mla_fwd_kvcache(
         q,
         k_cache,
@@ -1830,35 +2272,53 @@ def flash_mla_with_kvcache(
     return out, softmax_lse
 
 
-def sm100_cutlass_mla_decode(out: torch.Tensor, lse: torch.Tensor,
-                             q_nope: torch.Tensor, q_pe: torch.Tensor,
-                             kv_c_and_k_pe_cache: torch.Tensor,
-                             seq_lens: torch.Tensor, page_table: torch.Tensor,
-                             workspace: torch.Tensor, scale: float,
-                             num_kv_splits: int) -> torch.Tensor:
-    torch.ops._C.sm100_cutlass_mla_decode(out, lse, q_nope, q_pe,
-                                          kv_c_and_k_pe_cache, seq_lens,
-                                          page_table, workspace, scale,
-                                          num_kv_splits)
+def sm100_cutlass_mla_decode(
+    out: torch.Tensor,
+    lse: torch.Tensor,
+    q_nope: torch.Tensor,
+    q_pe: torch.Tensor,
+    kv_c_and_k_pe_cache: torch.Tensor,
+    seq_lens: torch.Tensor,
+    page_table: torch.Tensor,
+    workspace: torch.Tensor,
+    scale: float,
+    num_kv_splits: int,
+) -> torch.Tensor:
+    torch.ops._C.sm100_cutlass_mla_decode(
+        out,
+        lse,
+        q_nope,
+        q_pe,
+        kv_c_and_k_pe_cache,
+        seq_lens,
+        page_table,
+        workspace,
+        scale,
+        num_kv_splits,
+    )
     return out
 
 
-def sm100_cutlass_mla_get_workspace_size(max_seq_len: int, num_batches: int,
-                                         sm_count: int,
-                                         num_kv_splits: int) -> int:
+def sm100_cutlass_mla_get_workspace_size(
+    max_seq_len: int, num_batches: int, sm_count: int, num_kv_splits: int
+) -> int:
     return torch.ops._C.sm100_cutlass_mla_get_workspace_size(
-        max_seq_len, num_batches, sm_count, num_kv_splits)
+        max_seq_len, num_batches, sm_count, num_kv_splits
+    )
 
 
 if hasattr(torch.ops._C, "weight_packed_linear"):
 
     @register_fake("_C::weight_packed_linear")
-    def weight_packed_linear_fake(mat1: torch.Tensor, mat2: torch.Tensor,
-                                  bias: Optional[torch.Tensor],
-                                  is_vnni: bool) -> torch.Tensor:
-        return torch.empty((mat1.size(0), mat2.size(0)),
-                           dtype=mat1.dtype,
-                           device=mat2.device)
+    def weight_packed_linear_fake(
+        mat1: torch.Tensor,
+        mat2: torch.Tensor,
+        bias: Optional[torch.Tensor],
+        is_vnni: bool,
+    ) -> torch.Tensor:
+        return torch.empty(
+            (mat1.size(0), mat2.size(0)), dtype=mat1.dtype, device=mat2.device
+        )
 
 
 if hasattr(torch.ops._C, "fused_experts_cpu"):
@@ -1900,7 +2360,6 @@ def int8_scaled_mm_with_quant_fake(
 
 
 class CPUDNNLGEMMHandler:
-
     def __init__(self) -> None:
         self.handler: Optional[int] = None
         self.n = -1
@@ -1928,7 +2387,8 @@ def create_onednn_mm(
     handler = CPUDNNLGEMMHandler()
     handler.k, handler.n = weight.size()
     handler.handler = torch.ops._C.create_onednn_mm_handler(
-        weight, primitive_cache_size)
+        weight, primitive_cache_size
+    )
     return handler
 
 
@@ -1938,8 +2398,9 @@ def onednn_mm(
     bias: Optional[torch.Tensor],
 ) -> torch.Tensor:
     output = torch.empty((*x.shape[0:-1], dnnl_handler.n), dtype=x.dtype)
-    torch.ops._C.onednn_mm(output, x.reshape(-1, dnnl_handler.k), bias,
-                           dnnl_handler.handler)
+    torch.ops._C.onednn_mm(
+        output, x.reshape(-1, dnnl_handler.k), bias, dnnl_handler.handler
+    )
 
     return output
 
@@ -1955,15 +2416,17 @@ def create_onednn_scaled_mm(
     handler = CPUDNNLGEMMHandler()
     handler.k, handler.n = weight.size()
     handler.handler = torch.ops._C.create_onednn_scaled_mm_handler(
-        weight, weight_scales, output_type, dynamic_quant, use_azp,
-        primitive_cache_size)
+        weight, weight_scales, output_type, dynamic_quant, use_azp, primitive_cache_size
+    )
     return handler
 
 
-def onednn_scaled_int8_quant(input: torch.Tensor,
-                             scale: Optional[torch.Tensor] = None,
-                             azp: Optional[torch.Tensor] = None,
-                             symmetric: bool = True):
+def onednn_scaled_int8_quant(
+    input: torch.Tensor,
+    scale: Optional[torch.Tensor] = None,
+    azp: Optional[torch.Tensor] = None,
+    symmetric: bool = True,
+):
     """
     Quantize the input tensor to int8 and return the quantized tensor and scale, and maybe azp.
 
@@ -1983,20 +2446,16 @@ def onednn_scaled_int8_quant(input: torch.Tensor,
     input = input.view((token_num, input.shape[-1]))
     if scale is not None:
         # static-per-tensor quantization.
-        assert symmetric == (
-            azp
-            is None), "azp must only be provided for asymmetric quantization."
+        assert symmetric == (azp is None), (
+            "azp must only be provided for asymmetric quantization."
+        )
         torch.ops._C.static_scaled_int8_quant(output, input, scale, azp)
         return output, scale, azp
 
     # dynamic-per-token quantization.
-    input_scales = torch.empty((token_num, 1),
-                               device=input.device,
-                               dtype=torch.float32)
-    input_azp = None if symmetric else torch.empty_like(input_scales,
-                                                        dtype=torch.int32)
-    torch.ops._C.dynamic_scaled_int8_quant(output, input, input_scales,
-                                           input_azp)
+    input_scales = torch.empty((token_num, 1), device=input.device, dtype=torch.float32)
+    input_azp = None if symmetric else torch.empty_like(input_scales, dtype=torch.int32)
+    torch.ops._C.dynamic_scaled_int8_quant(output, input, input_scales, input_azp)
     return output, input_scales, input_azp
 
 
@@ -2009,8 +2468,9 @@ def onednn_scaled_mm(
     input_zp_adj: Optional[torch.Tensor],
     bias: Optional[torch.Tensor],
 ) -> torch.Tensor:
-    torch.ops._C.onednn_scaled_mm(output, x, input_scale, input_zp,
-                                  input_zp_adj, bias, dnnl_handler.handler)
+    torch.ops._C.onednn_scaled_mm(
+        output, x, input_scale, input_zp, input_zp_adj, bias, dnnl_handler.handler
+    )
 
     return output
 
@@ -2023,7 +2483,7 @@ def hadacore_transform(x: torch.Tensor, inplace: bool = True) -> torch.Tensor:
 
     Note that sylvester hadamard transforms are also symmetric, which means that
     this function is also applies the (transpose <=> inverse) transform.
-    
+
     :param x: value to be transformed inplace
     :param inplace: modify value in place
     :return: value after transformation
@@ -2034,6 +2494,5 @@ def hadacore_transform(x: torch.Tensor, inplace: bool = True) -> torch.Tensor:
 if hasattr(torch.ops._C, "hadacore_transform"):
 
     @register_fake("_C::hadacore_transform")
-    def _hadacore_transform_fake(x: torch.Tensor,
-                                 inplace: bool) -> torch.Tensor:
+    def _hadacore_transform_fake(x: torch.Tensor, inplace: bool) -> torch.Tensor:
         return torch.empty_like(x) if not inplace else x
diff --git a/vllm/_ipex_ops.py b/vllm/_ipex_ops.py
index 9d2eda482fcf..1f458f940a28 100644
--- a/vllm/_ipex_ops.py
+++ b/vllm/_ipex_ops.py
@@ -17,10 +17,10 @@
 
 
 class ipex_ops:
-
     @staticmethod
     def _reshape_activation_tensor(
-            x: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+        x: torch.Tensor,
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         num = x.size(0)
         d = x.size(1) // 2
         x = x.reshape(num, 2, d)
@@ -144,20 +144,26 @@ def rotary_embedding(
         is_neox: bool,
     ) -> None:
         rot_dim = cos_sin_cache.size(1)
-        ipex.llm.functional.rotary_embedding_batched(positions, query, key,
-                                                     head_size, cos_sin_cache,
-                                                     is_neox, rot_dim)
+        ipex.llm.functional.rotary_embedding_batched(
+            positions, query, key, head_size, cos_sin_cache, is_neox, rot_dim
+        )
 
     @staticmethod
-    def rms_norm(input: torch.Tensor, weight: torch.Tensor,
-                 epsilon: float) -> torch.Tensor:
+    def rms_norm(
+        input: torch.Tensor, weight: torch.Tensor, epsilon: float
+    ) -> torch.Tensor:
         return ipex.llm.functional.rms_norm(input, weight, epsilon)
 
     @staticmethod
-    def fused_add_rms_norm(input: torch.Tensor, residual: torch.Tensor,
-                           weight: torch.Tensor, epsilon: float) -> None:
-        tmp = ipex.llm.functional.add_rms_norm(residual, input, weight, None,
-                                               epsilon, True)
+    def fused_add_rms_norm(
+        input: torch.Tensor,
+        residual: torch.Tensor,
+        weight: torch.Tensor,
+        epsilon: float,
+    ) -> None:
+        tmp = ipex.llm.functional.add_rms_norm(
+            residual, input, weight, None, epsilon, True
+        )
         input.copy_(tmp)
 
     @staticmethod
@@ -186,22 +192,43 @@ def varlen_attention(
                 raise ValueError("IPEX CPU does not support logits_soft_cap")
             assert alibi_slopes is None
             assert window_size_left < 0 and window_size_right < 0
-            ipex.llm.functional.varlen_attention(query.contiguous(),
-                                                 key.contiguous(),
-                                                 value.contiguous(), out,
-                                                 seqlen_q.int(),
-                                                 seqlen_k.int(), max_seqlen_q,
-                                                 max_seqlen_k, pdropout,
-                                                 softmax_scale, zero_tensors,
-                                                 is_causal, return_softmax,
-                                                 gen_)
+            ipex.llm.functional.varlen_attention(
+                query.contiguous(),
+                key.contiguous(),
+                value.contiguous(),
+                out,
+                seqlen_q.int(),
+                seqlen_k.int(),
+                max_seqlen_q,
+                max_seqlen_k,
+                pdropout,
+                softmax_scale,
+                zero_tensors,
+                is_causal,
+                return_softmax,
+                gen_,
+            )
         else:  # XPU build
             ipex.llm.functional.varlen_attention(
-                query.contiguous(), key.contiguous(), value.contiguous(), out,
-                seqlen_q.int(), seqlen_k.int(), alibi_slopes, max_seqlen_q,
-                max_seqlen_k, pdropout, softmax_scale, zero_tensors, is_causal,
-                return_softmax, gen_, window_size_left, window_size_right,
-                logits_soft_cap)
+                query.contiguous(),
+                key.contiguous(),
+                value.contiguous(),
+                out,
+                seqlen_q.int(),
+                seqlen_k.int(),
+                alibi_slopes,
+                max_seqlen_q,
+                max_seqlen_k,
+                pdropout,
+                softmax_scale,
+                zero_tensors,
+                is_causal,
+                return_softmax,
+                gen_,
+                window_size_left,
+                window_size_right,
+                logits_soft_cap,
+            )
 
     @staticmethod
     def reshape_and_cache(
@@ -216,7 +243,8 @@ def reshape_and_cache(
     ) -> None:
         assert kv_cache_dtype == "auto"
         ipex.llm.modules.PagedAttention.reshape_and_cache(
-            key, value, key_cache, value_cache, slot_mapping)
+            key, value, key_cache, value_cache, slot_mapping
+        )
 
     @staticmethod
     def reshape_and_cache_flash(
@@ -232,8 +260,15 @@ def reshape_and_cache_flash(
         v_scale_float: float = 1.0,
     ) -> None:
         ipex.llm.modules.PagedAttention.reshape_and_cache_flash(
-            key, value, key_cache, value_cache, slot_mapping, kv_cache_dtype,
-            k_scale_float, v_scale_float)
+            key,
+            value,
+            key_cache,
+            value_cache,
+            slot_mapping,
+            kv_cache_dtype,
+            k_scale_float,
+            v_scale_float,
+        )
 
     @staticmethod
     def flash_attn_varlen_func(
@@ -265,10 +300,12 @@ def flash_attn_varlen_func(
         if cu_seqlens_k is None:
             # cu_seqlens_k is not used in ipex kernel.
             cu_seqlens_k = torch.cumsum(seqused_k, dim=0)
-            cu_seqlens_k = torch.cat([
-                torch.tensor([0], device=seqused_k.device, dtype=torch.int32),
-                cu_seqlens_k
-            ]).to(torch.int32)
+            cu_seqlens_k = torch.cat(
+                [
+                    torch.tensor([0], device=seqused_k.device, dtype=torch.int32),
+                    cu_seqlens_k,
+                ]
+            ).to(torch.int32)
 
         real_window_size: tuple[int, int]
         if window_size is None:
@@ -298,36 +335,38 @@ def flash_attn_varlen_func(
 
     @staticmethod
     def get_scheduler_metadata(
-            batch_size,
-            max_seqlen_q,
-            max_seqlen_k,
-            num_heads_q,
-            num_heads_kv,
-            headdim,
-            cache_seqlens: torch.Tensor,
-            qkv_dtype=torch.bfloat16,
-            headdim_v=None,
-            cu_seqlens_q: Optional[torch.Tensor] = None,
-            cu_seqlens_k_new: Optional[torch.Tensor] = None,
-            cache_leftpad: Optional[torch.Tensor] = None,
-            page_size: Optional[int] = None,
-            max_seqlen_k_new=0,
-            causal=False,
-            window_size=(-1, -1),  # -1 means infinite context window
-            has_softcap=False,
-            num_splits=0,  # Can be tuned for speed
-            pack_gqa=None,  # Can be tuned for speed
-            sm_margin=0,  # Can be tuned if some SMs are used for communication
+        batch_size,
+        max_seqlen_q,
+        max_seqlen_k,
+        num_heads_q,
+        num_heads_kv,
+        headdim,
+        cache_seqlens: torch.Tensor,
+        qkv_dtype=torch.bfloat16,
+        headdim_v=None,
+        cu_seqlens_q: Optional[torch.Tensor] = None,
+        cu_seqlens_k_new: Optional[torch.Tensor] = None,
+        cache_leftpad: Optional[torch.Tensor] = None,
+        page_size: Optional[int] = None,
+        max_seqlen_k_new=0,
+        causal=False,
+        window_size=(-1, -1),  # -1 means infinite context window
+        has_softcap=False,
+        num_splits=0,  # Can be tuned for speed
+        pack_gqa=None,  # Can be tuned for speed
+        sm_margin=0,  # Can be tuned if some SMs are used for communication
     ) -> None:
         logger.warning_once(
-            "get_scheduler_metadata is not implemented for ipex_ops, "
-            "returning None.")
+            "get_scheduler_metadata is not implemented for ipex_ops, returning None."
+        )
         return None
 
     @staticmethod
-    def copy_blocks(key_caches: list[torch.Tensor],
-                    value_caches: list[torch.Tensor],
-                    block_mapping: torch.Tensor) -> None:
+    def copy_blocks(
+        key_caches: list[torch.Tensor],
+        value_caches: list[torch.Tensor],
+        block_mapping: torch.Tensor,
+    ) -> None:
         torch.xpu.copy_blocks(  # type: ignore
             key_caches,
             value_caches,
@@ -335,8 +374,9 @@ def copy_blocks(key_caches: list[torch.Tensor],
         )
 
     @staticmethod
-    def swap_blocks(src: torch.Tensor, dst: torch.Tensor,
-                    block_mapping: torch.Tensor) -> None:
+    def swap_blocks(
+        src: torch.Tensor, dst: torch.Tensor, block_mapping: torch.Tensor
+    ) -> None:
         torch.xpu.swap_blocks(src, dst, block_mapping)  # type: ignore
 
     @staticmethod
@@ -350,7 +390,7 @@ def scaled_fp8_quant(
     ) -> tuple[torch.Tensor, torch.Tensor]:
         """
         Quantize input tensor to FP8 and return quantized tensor and scale.
-        
+
         This function is designed for both static and dynamic quantization:
         If you provide the scale, it will use static scaling and if you omit
         it, the scale will be determined dynamically. Currently, XPU platform
@@ -367,13 +407,13 @@ def scaled_fp8_quant(
                 of the output to at least this value.
             use_per_token_if_dynamic: Whether to do per_tensor or per_token
                 in the dynamic quantization case.
-    
+
         Returns:
             tuple[torch.Tensor, torch.Tensor]: The output tensor in FP8 and
                 scaling factor.
         """
         # This code assumes batch_dim and num_tokens are flattened
-        assert (input.ndim == 2)
+        assert input.ndim == 2
         shape: Union[tuple[int, int], torch.Size] = input.shape
         out_dtype: torch.dtype = current_platform.fp8_dtype()
         if num_token_padding:
@@ -381,12 +421,14 @@ def scaled_fp8_quant(
         if output is None:
             output = torch.empty(shape, device=input.device, dtype=out_dtype)
         else:
-            assert num_token_padding is None, \
+            assert num_token_padding is None, (
                 "padding not supported if output passed in"
+            )
             assert output.dtype == out_dtype
         assert scale is None, "only dynamic fp8 quantization supported on XPU"
         assert not use_per_token_if_dynamic, (
-            "per token dynamic fp8 quantization not supported on XPU")
+            "per token dynamic fp8 quantization not supported on XPU"
+        )
         scale = torch.zeros(1, device=input.device, dtype=torch.float32)
         torch.ops.torch_ipex.dynamic_scaled_fp8_quant(output, input, scale)
 
diff --git a/vllm/assets/audio.py b/vllm/assets/audio.py
index 1c16230849bc..61c2dbf55fe3 100644
--- a/vllm/assets/audio.py
+++ b/vllm/assets/audio.py
@@ -32,13 +32,11 @@ def filename(self) -> str:
 
     @property
     def audio_and_sample_rate(self) -> tuple[npt.NDArray, float]:
-        audio_path = get_vllm_public_assets(filename=self.filename,
-                                            s3_prefix=ASSET_DIR)
+        audio_path = get_vllm_public_assets(filename=self.filename, s3_prefix=ASSET_DIR)
         return librosa.load(audio_path, sr=None)
 
     def get_local_path(self) -> Path:
-        return get_vllm_public_assets(filename=self.filename,
-                                      s3_prefix=ASSET_DIR)
+        return get_vllm_public_assets(filename=self.filename, s3_prefix=ASSET_DIR)
 
     @property
     def url(self) -> str:
diff --git a/vllm/assets/base.py b/vllm/assets/base.py
index 31cde431b5b6..409bfc18ff8c 100644
--- a/vllm/assets/base.py
+++ b/vllm/assets/base.py
@@ -20,8 +20,7 @@ def get_cache_dir() -> Path:
 
 
 @lru_cache
-def get_vllm_public_assets(filename: str,
-                           s3_prefix: Optional[str] = None) -> Path:
+def get_vllm_public_assets(filename: str, s3_prefix: Optional[str] = None) -> Path:
     """
     Download an asset file from ``s3://vllm-public-assets``
     and return the path to the downloaded file.
@@ -36,6 +35,7 @@ def get_vllm_public_assets(filename: str,
         global_http_connection.download_file(
             f"{VLLM_S3_BUCKET_URL}/{filename}",
             asset_path,
-            timeout=envs.VLLM_IMAGE_FETCH_TIMEOUT)
+            timeout=envs.VLLM_IMAGE_FETCH_TIMEOUT,
+        )
 
     return asset_path
diff --git a/vllm/assets/image.py b/vllm/assets/image.py
index 4639a11187d0..c1a0f2b9cc29 100644
--- a/vllm/assets/image.py
+++ b/vllm/assets/image.py
@@ -12,12 +12,21 @@
 
 VLM_IMAGES_DIR = "vision_model_images"
 
-ImageAssetName = Literal["stop_sign", "cherry_blossom", "hato",
-                         "2560px-Gfp-wisconsin-madison-the-nature-boardwalk",
-                         "Grayscale_8bits_palette_sample_image",
-                         "1280px-Venn_diagram_rgb", "RGBA_comp", "237-400x300",
-                         "231-200x300", "27-500x500", "17-150x600",
-                         "handelsblatt-preview", "paper-11"]
+ImageAssetName = Literal[
+    "stop_sign",
+    "cherry_blossom",
+    "hato",
+    "2560px-Gfp-wisconsin-madison-the-nature-boardwalk",
+    "Grayscale_8bits_palette_sample_image",
+    "1280px-Venn_diagram_rgb",
+    "RGBA_comp",
+    "237-400x300",
+    "231-200x300",
+    "27-500x500",
+    "17-150x600",
+    "handelsblatt-preview",
+    "paper-11",
+]
 
 
 @dataclass(frozen=True)
@@ -28,12 +37,12 @@ def get_path(self, ext: str) -> Path:
         """
         Return s3 path for given image.
         """
-        return get_vllm_public_assets(filename=f"{self.name}.{ext}",
-                                      s3_prefix=VLM_IMAGES_DIR)
+        return get_vllm_public_assets(
+            filename=f"{self.name}.{ext}", s3_prefix=VLM_IMAGES_DIR
+        )
 
     @property
     def pil_image(self, ext="jpg") -> Image.Image:
-
         image_path = self.get_path(ext)
         return Image.open(image_path)
 
@@ -42,7 +51,7 @@ def image_embeds(self) -> torch.Tensor:
         """
         Image embeddings, only used for testing purposes with llava 1.5.
         """
-        image_path = self.get_path('pt')
+        image_path = self.get_path("pt")
         return torch.load(image_path, map_location="cpu", weights_only=True)
 
     def read_bytes(self, ext: str) -> bytes:
diff --git a/vllm/assets/video.py b/vllm/assets/video.py
index 5c9e403c4b91..6b2ca8f867e0 100644
--- a/vllm/assets/video.py
+++ b/vllm/assets/video.py
@@ -65,13 +65,14 @@ def video_to_ndarrays(path: str, num_frames: int = -1) -> npt.NDArray:
 
     frames = np.stack(frames)
     if len(frames) < num_frames:
-        raise ValueError(f"Could not read enough frames from video file {path}"
-                         f" (expected {num_frames} frames, got {len(frames)})")
+        raise ValueError(
+            f"Could not read enough frames from video file {path}"
+            f" (expected {num_frames} frames, got {len(frames)})"
+        )
     return frames
 
 
-def video_to_pil_images_list(path: str,
-                             num_frames: int = -1) -> list[Image.Image]:
+def video_to_pil_images_list(path: str, num_frames: int = -1) -> list[Image.Image]:
     frames = video_to_ndarrays(path, num_frames)
     return [Image.fromarray(frame) for frame in frames]
 
@@ -139,7 +140,7 @@ def metadata(self) -> dict[str, Any]:
     def get_audio(self, sampling_rate: Optional[float] = None) -> npt.NDArray:
         """
         Read audio data from the video asset, used in Qwen2.5-Omni examples.
-        
+
         See also: examples/offline_inference/qwen2_5_omni/only_thinker.py
         """
         return librosa.load(self.video_path, sr=sampling_rate)[0]
diff --git a/vllm/attention/__init__.py b/vllm/attention/__init__.py
index 1b37bd1f6100..dd35165d5415 100644
--- a/vllm/attention/__init__.py
+++ b/vllm/attention/__init__.py
@@ -1,8 +1,11 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from vllm.attention.backends.abstract import (AttentionBackend,
-                                              AttentionMetadata, AttentionType)
+from vllm.attention.backends.abstract import (
+    AttentionBackend,
+    AttentionMetadata,
+    AttentionType,
+)
 from vllm.attention.layer import Attention
 from vllm.attention.selector import get_attn_backend
 
diff --git a/vllm/attention/backends/abstract.py b/vllm/attention/backends/abstract.py
index b49e1c007c57..d746c3295c56 100644
--- a/vllm/attention/backends/abstract.py
+++ b/vllm/attention/backends/abstract.py
@@ -14,6 +14,7 @@ class AttentionType:
     Attention type.
     Use string to be compatible with `torch.compile`.
     """
+
     DECODER = "decoder"
     """Decoder attention between previous layer Q/K/V."""
     ENCODER = "encoder"
@@ -26,6 +27,7 @@ class AttentionType:
 
 class AttentionBackend(ABC):
     """Abstract class for attention backends."""
+
     # For some attention backends, we allocate an output tensor before
     # calling the custom op. When piecewise cudagraph is enabled, this
     # makes sure the output tensor is allocated inside the cudagraph.
@@ -91,7 +93,6 @@ class AttentionMetadata:
 
 
 class AttentionLayer(Protocol):
-
     _q_scale: torch.Tensor
     _k_scale: torch.Tensor
     _v_scale: torch.Tensor
@@ -107,12 +108,10 @@ def forward(
         value: torch.Tensor,
         kv_cache: torch.Tensor,
         attn_metadata: AttentionMetadata,
-    ) -> torch.Tensor:
-        ...
+    ) -> torch.Tensor: ...
 
 
 class AttentionImpl(ABC, Generic[T]):
-
     # Whether the attention impl can return the softmax lse for decode.
     # Some features like decode context parallelism require the softmax lse.
     can_return_lse_for_decode: bool = False
@@ -129,14 +128,16 @@ def __new__(cls, *args, **kwargs):
         self = super().__new__(cls)
         try:
             from vllm.distributed.parallel_state import get_dcp_group
+
             self.dcp_world_size = get_dcp_group().world_size
             self.dcp_rank = get_dcp_group().rank_in_group
         except AssertionError:
             # DCP might not be initialized in testing
             self.dcp_world_size = 1
             self.dcp_rank = 0
-        self.need_to_return_lse_for_decode = self.dcp_world_size > 1 \
-            and self.can_return_lse_for_decode
+        self.need_to_return_lse_for_decode = (
+            self.dcp_world_size > 1 and self.can_return_lse_for_decode
+        )
         return self
 
     @abstractmethod
@@ -183,7 +184,6 @@ def fused_output_quant_supported(self, quant_key: QuantKey):
 
 
 class MLAAttentionImpl(AttentionImpl[T], Generic[T]):
-
     @abstractmethod
     def forward(
         self,
diff --git a/vllm/attention/backends/utils.py b/vllm/attention/backends/utils.py
index 6b8d97be7050..46a87bdd1f7e 100644
--- a/vllm/attention/backends/utils.py
+++ b/vllm/attention/backends/utils.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Attention backend utils"""
+
 from dataclasses import dataclass
 from typing import Optional
 
diff --git a/vllm/attention/layer.py b/vllm/attention/layer.py
index 6632ee6b0dc3..6f3b67b281ce 100644
--- a/vllm/attention/layer.py
+++ b/vllm/attention/layer.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Attention layer."""
+
 from typing import Callable, List, Optional
 
 import torch
@@ -14,9 +15,11 @@
 from vllm.attention.selector import backend_name_to_enum, get_attn_backend
 from vllm.attention.utils.kv_sharing_utils import validate_kv_sharing_target
 from vllm.config import CacheConfig, get_current_vllm_config
-from vllm.distributed.kv_transfer import (get_kv_transfer_group,
-                                          has_kv_transfer_group,
-                                          is_v1_kv_transfer_group)
+from vllm.distributed.kv_transfer import (
+    get_kv_transfer_group,
+    has_kv_transfer_group,
+    is_v1_kv_transfer_group,
+)
 from vllm.forward_context import ForwardContext, get_forward_context
 from vllm.logger import init_logger
 from vllm.model_executor.layers.attention_layer_base import AttentionLayerBase
@@ -24,8 +27,7 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.input_quant_fp8 import QuantFP8
 from vllm.model_executor.layers.quantization.kv_cache import BaseKVCacheMethod
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape)
+from vllm.model_executor.layers.quantization.utils.quant_utils import GroupShape
 from vllm.model_executor.models.vision import get_vit_attn_backend
 from vllm.platforms import current_platform
 from vllm.utils import GiB_bytes, direct_register_custom_op
@@ -33,7 +35,7 @@
 logger = init_logger(__name__)
 USE_XFORMERS_OPS = None
 try:
-    tag_cudagraph_unsafe = (torch._C.Tag.cudagraph_unsafe, )
+    tag_cudagraph_unsafe = (torch._C.Tag.cudagraph_unsafe,)
 except AttributeError:
     tag_cudagraph_unsafe = ()  # type: ignore[assignment]
 
@@ -43,8 +45,7 @@ def check_xformers_availability():
     if USE_XFORMERS_OPS is not None:
         return USE_XFORMERS_OPS
 
-    if current_platform.is_cuda() and current_platform.has_device_capability(
-            100):
+    if current_platform.is_cuda() and current_platform.has_device_capability(100):
         # Xformers FA is not compatible with B200
         USE_XFORMERS_OPS = False
     else:
@@ -64,30 +65,36 @@ def check_xformers_availability():
 
 
 def check_upstream_fa_availability(dtype: torch.dtype):
-    if dtype in (torch.float16, torch.bfloat16) and current_platform.is_cuda(
-    ) and current_platform.has_device_capability(80):
+    if (
+        dtype in (torch.float16, torch.bfloat16)
+        and current_platform.is_cuda()
+        and current_platform.has_device_capability(80)
+    ):
         from transformers.utils import is_flash_attn_2_available
+
         return is_flash_attn_2_available()
     if current_platform.is_rocm():
         from importlib.util import find_spec
+
         return find_spec("flash_attn") is not None
     return False
 
 
 def maybe_get_vit_flash_attn_backend(
-        attn_backend: _Backend,
-        use_upstream_fa: bool) -> tuple[_Backend, Callable]:
-    if attn_backend != _Backend.FLASH_ATTN and \
-        attn_backend != _Backend.ROCM_AITER_FA and \
-                check_upstream_fa_availability(torch.get_default_dtype()):
+    attn_backend: _Backend, use_upstream_fa: bool
+) -> tuple[_Backend, Callable]:
+    if (
+        attn_backend != _Backend.FLASH_ATTN
+        and attn_backend != _Backend.ROCM_AITER_FA
+        and check_upstream_fa_availability(torch.get_default_dtype())
+    ):
         attn_backend = _Backend.FLASH_ATTN
         use_upstream_fa = True
 
-    if current_platform.is_rocm() and \
-        attn_backend == _Backend.FLASH_ATTN:
+    if current_platform.is_rocm() and attn_backend == _Backend.FLASH_ATTN:
         use_upstream_fa = True
 
-    if (attn_backend in {_Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA}):
+    if attn_backend in {_Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA}:
         if attn_backend == _Backend.ROCM_AITER_FA:
             from aiter import flash_attn_varlen_func
         else:
@@ -156,9 +163,9 @@ def __init__(
             calculate_kv_scales = False
         if num_kv_heads is None:
             num_kv_heads = num_heads
-        assert num_heads % num_kv_heads == 0, \
-            f"num_heads ({num_heads}) is not " \
-            f"divisible by num_kv_heads ({num_kv_heads})"
+        assert num_heads % num_kv_heads == 0, (
+            f"num_heads ({num_heads}) is not divisible by num_kv_heads ({num_kv_heads})"
+        )
 
         # The default k/v_scale is set to 1.0. This is ignored
         # when kv-cache is not fp8, and should be used with
@@ -193,16 +200,19 @@ def __init__(
         self.sliding_window = sliding_window
         self.has_sink = extra_impl_args.get("sinks") is not None
 
-        quant_method = quant_config.get_quant_method(
-            self, prefix=prefix) if quant_config else None
+        quant_method = (
+            quant_config.get_quant_method(self, prefix=prefix) if quant_config else None
+        )
         if quant_method is not None and not isinstance(
-                quant_method, UnquantizedLinearMethod):
+            quant_method, UnquantizedLinearMethod
+        ):
             assert isinstance(quant_method, BaseKVCacheMethod)
             # TODO (mgoin): kv cache dtype should be specified in the FP8
             # checkpoint config and become the "auto" behavior
             if self.kv_cache_dtype == "fp8_e5m2":
-                raise ValueError("fp8_e5m2 kv-cache is not supported with "
-                                 "fp8 checkpoints.")
+                raise ValueError(
+                    "fp8_e5m2 kv-cache is not supported with fp8 checkpoints."
+                )
             # If quantization is enabled, we make "k_scale" and "v_scale"
             # parameters so that it can be loaded from the model checkpoint.
             # The k/v_scale will then be converted back to native float32
@@ -214,21 +224,32 @@ def __init__(
         # weight and activation dtype.
         dtype = torch.get_default_dtype()
         if attn_backend is None:
-            self.attn_backend = get_attn_backend(head_size,
-                                                 dtype,
-                                                 kv_cache_dtype,
-                                                 block_size,
-                                                 use_mla=use_mla,
-                                                 has_sink=self.has_sink,
-                                                 use_sparse=use_sparse)
+            self.attn_backend = get_attn_backend(
+                head_size,
+                dtype,
+                kv_cache_dtype,
+                block_size,
+                use_mla=use_mla,
+                has_sink=self.has_sink,
+                use_sparse=use_sparse,
+            )
         else:
             self.attn_backend = attn_backend
 
         impl_cls = self.attn_backend.get_impl_cls()
-        self.impl = impl_cls(num_heads, head_size, scale, num_kv_heads,
-                             alibi_slopes, sliding_window, kv_cache_dtype,
-                             logits_soft_cap, attn_type,
-                             kv_sharing_target_layer_name, **extra_impl_args)
+        self.impl = impl_cls(
+            num_heads,
+            head_size,
+            scale,
+            num_kv_heads,
+            alibi_slopes,
+            sliding_window,
+            kv_cache_dtype,
+            logits_soft_cap,
+            attn_type,
+            kv_sharing_target_layer_name,
+            **extra_impl_args,
+        )
         self.backend = backend_name_to_enum(self.attn_backend.get_name())
         self.dtype = dtype
 
@@ -258,37 +279,39 @@ def __init__(
         # by bind_kv_cache
         # this variable will not be accessed if use_direct_call is True
         self.kv_cache = [
-            torch.tensor([]) for _ in range(get_current_vllm_config(
-            ).parallel_config.pipeline_parallel_size)
+            torch.tensor([])
+            for _ in range(
+                get_current_vllm_config().parallel_config.pipeline_parallel_size
+            )
         ]
 
         try:
-            self.q_range = torch.tensor(envs.Q_SCALE_CONSTANT,
-                                        dtype=torch.float32)
-            self.k_range = torch.tensor(envs.K_SCALE_CONSTANT,
-                                        dtype=torch.float32)
-            self.v_range = torch.tensor(envs.V_SCALE_CONSTANT,
-                                        dtype=torch.float32)
+            self.q_range = torch.tensor(envs.Q_SCALE_CONSTANT, dtype=torch.float32)
+            self.k_range = torch.tensor(envs.K_SCALE_CONSTANT, dtype=torch.float32)
+            self.v_range = torch.tensor(envs.V_SCALE_CONSTANT, dtype=torch.float32)
         except torch.cuda.OutOfMemoryError as e:
-            logger.error(
-                "Failed to initialize attention q/k/v range constants: %s", e)
+            logger.error("Failed to initialize attention q/k/v range constants: %s", e)
             if torch.cuda.is_available():
                 logger.debug("CUDA device: %s", torch.cuda.current_device())
-                logger.debug("Allocated: %.2f GiB",
-                             torch.cuda.memory_allocated() / GiB_bytes)
-                logger.debug("Reserved: %.2f GiB",
-                             torch.cuda.memory_reserved() / GiB_bytes)
+                logger.debug(
+                    "Allocated: %.2f GiB", torch.cuda.memory_allocated() / GiB_bytes
+                )
+                logger.debug(
+                    "Reserved: %.2f GiB", torch.cuda.memory_reserved() / GiB_bytes
+                )
             raise RuntimeError(
                 "Failed to initialize q/k/v range constants. "
                 "This may be caused by insufficient memory to allocate "
-                "kv cache.") from e
+                "kv cache."
+            ) from e
 
         # for attn backends supporting query quantization
         self.query_quant = None
-        if self.kv_cache_dtype.startswith(
-                "fp8") and self.attn_backend.supports_quant_query_input:
-            self.query_quant = QuantFP8(static=True,
-                                        group_shape=GroupShape.PER_TENSOR)
+        if (
+            self.kv_cache_dtype.startswith("fp8")
+            and self.attn_backend.supports_quant_query_input
+        ):
+            self.query_quant = QuantFP8(static=True, group_shape=GroupShape.PER_TENSOR)
 
     def forward(
         self,
@@ -310,8 +333,7 @@ def forward(
         `vllm.forward_context.get_forward_context().attn_metadata`.
         """
         if self.calculate_kv_scales:
-            torch.ops.vllm.maybe_calc_kv_scales(query, key, value,
-                                                self.layer_name)
+            torch.ops.vllm.maybe_calc_kv_scales(query, key, value, self.layer_name)
 
         output_dtype = query.dtype
         if self.query_quant is not None:
@@ -324,11 +346,8 @@ def forward(
             query, _ = self.query_quant(query, self._q_scale)
 
         if self.use_output:
-            output_shape = (output_shape
-                            if output_shape is not None else query.shape)
-            output = torch.zeros(output_shape,
-                                 dtype=output_dtype,
-                                 device=query.device)
+            output_shape = output_shape if output_shape is not None else query.shape
+            output = torch.zeros(output_shape, dtype=output_dtype, device=query.device)
             hidden_size = output_shape[-1]
             # We skip reshaping query, key and value tensors for the MLA
             # backend since these tensors have different semantics and are
@@ -349,16 +368,13 @@ def forward(
                 if isinstance(attn_metadata, dict):
                     attn_metadata = attn_metadata[self.layer_name]
                 self_kv_cache = self.kv_cache[forward_context.virtual_engine]
-                self.impl.forward(self,
-                                  query,
-                                  key,
-                                  value,
-                                  self_kv_cache,
-                                  attn_metadata,
-                                  output=output)
+                self.impl.forward(
+                    self, query, key, value, self_kv_cache, attn_metadata, output=output
+                )
             else:
                 torch.ops.vllm.unified_attention_with_output(
-                    query, key, value, output, self.layer_name)
+                    query, key, value, output, self.layer_name
+                )
             return output.view(-1, hidden_size)
         else:
             if self.use_direct_call:
@@ -367,11 +383,13 @@ def forward(
                 if isinstance(attn_metadata, dict):
                     attn_metadata = attn_metadata[self.layer_name]
                 self_kv_cache = self.kv_cache[forward_context.virtual_engine]
-                return self.impl.forward(self, query, key, value,
-                                         self_kv_cache, attn_metadata)
+                return self.impl.forward(
+                    self, query, key, value, self_kv_cache, attn_metadata
+                )
             else:
                 return torch.ops.vllm.unified_attention(
-                    query, key, value, self.layer_name)
+                    query, key, value, self.layer_name
+                )
 
     def calc_kv_scales(self, query, key, value):
         self._q_scale.copy_(torch.abs(query).max() / self.q_range)
@@ -396,12 +414,11 @@ def process_weights_after_loading(self, act_dtype: torch.dtype):
             self.impl.process_weights_after_loading(act_dtype)
 
         # FlashInfer requires attention sinks to be float32
-        if (self.backend == _Backend.FLASHINFER
-                and hasattr(self.impl, 'sinks')):
+        if self.backend == _Backend.FLASHINFER and hasattr(self.impl, "sinks"):
             from vllm.v1.attention.backends.flashinfer import FlashInferImpl
+
             assert isinstance(self.impl, FlashInferImpl)
-            if (self.impl.sinks is not None
-                    and self.impl.sinks.dtype != torch.float32):
+            if self.impl.sinks is not None and self.impl.sinks.dtype != torch.float32:
                 self.impl.sinks = self.impl.sinks.to(torch.float32)
 
     def get_attn_backend(self) -> type[AttentionBackend]:
@@ -428,9 +445,10 @@ def __init__(
         self.num_kv_heads = num_heads if num_kv_heads is None else num_kv_heads
         self.layer_name = prefix
 
-        assert self.num_heads % self.num_kv_heads == 0, \
-            f"num_heads ({self.num_heads}) is not " \
+        assert self.num_heads % self.num_kv_heads == 0, (
+            f"num_heads ({self.num_heads}) is not "
             f"divisible by num_kv_heads ({self.num_kv_heads})"
+        )
         self.num_queries_per_kv = self.num_heads // self.num_kv_heads
 
         # During model initialization, the default dtype is set as the model
@@ -449,38 +467,43 @@ def __init__(
             # currently, only torch_sdpa is supported on xpu
             self.attn_backend = _Backend.TORCH_SDPA
         else:
+            self.attn_backend = (
+                backend
+                if backend
+                in {
+                    _Backend.TORCH_SDPA,
+                    _Backend.XFORMERS,
+                    _Backend.PALLAS,
+                    _Backend.ROCM_AITER_FA,
+                    _Backend.FLASH_ATTN,
+                }
+                else _Backend.TORCH_SDPA
+            )
 
-            self.attn_backend = backend if backend in {
-                _Backend.TORCH_SDPA,
-                _Backend.XFORMERS,
-                _Backend.PALLAS,
-                _Backend.ROCM_AITER_FA,
-                _Backend.FLASH_ATTN,
-            } else _Backend.TORCH_SDPA
-
-        self.attn_backend, self._flash_attn_varlen_func \
-            = maybe_get_vit_flash_attn_backend(
+        self.attn_backend, self._flash_attn_varlen_func = (
+            maybe_get_vit_flash_attn_backend(
                 self.attn_backend,
                 use_upstream_fa,
             )
+        )
 
-        if (self.attn_backend == _Backend.XFORMERS
-                and not check_xformers_availability()):
+        if self.attn_backend == _Backend.XFORMERS and not check_xformers_availability():
             self.attn_backend = _Backend.TORCH_SDPA
 
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA
+            _Backend.FLASH_ATTN,
+            _Backend.ROCM_AITER_FA,
         }
 
         # this condition is just to make sure that the
         # use_upstream_fa in the log is correct
-        if current_platform.is_rocm() \
-            and self.attn_backend == _Backend.FLASH_ATTN:
+        if current_platform.is_rocm() and self.attn_backend == _Backend.FLASH_ATTN:
             use_upstream_fa = True
 
         logger.info_once(
             f"MultiHeadAttention attn_backend: {self.attn_backend}, "
-            f"use_upstream_fa: {use_upstream_fa}")
+            f"use_upstream_fa: {use_upstream_fa}"
+        )
 
     def forward(
         self,
@@ -488,7 +511,7 @@ def forward(
         key: torch.Tensor,
         value: torch.Tensor,
     ) -> torch.Tensor:
-        """Input shape: 
+        """Input shape:
         (batch_size x seq_len x hidden_size) or
         (batch_size x seq_len x num_heads x head_size)
         """
@@ -505,14 +528,12 @@ def forward(
             value = torch.repeat_interleave(value, num_repeat, dim=2)
 
         if self.is_flash_attn_backend:
-            cu_seqlens_q = torch.arange(0, (bsz + 1) * q_len,
-                                        step=q_len,
-                                        dtype=torch.int32,
-                                        device=query.device)
-            cu_seqlens_k = torch.arange(0, (bsz + 1) * kv_len,
-                                        step=kv_len,
-                                        dtype=torch.int32,
-                                        device=key.device)
+            cu_seqlens_q = torch.arange(
+                0, (bsz + 1) * q_len, step=q_len, dtype=torch.int32, device=query.device
+            )
+            cu_seqlens_k = torch.arange(
+                0, (bsz + 1) * kv_len, step=kv_len, dtype=torch.int32, device=key.device
+            )
 
             out = self._flash_attn_varlen_func(
                 query.flatten(0, 1),
@@ -527,29 +548,24 @@ def forward(
         elif self.attn_backend == _Backend.XFORMERS:
             from xformers import ops as xops
 
-            out = xops.memory_efficient_attention_forward(query,
-                                                          key,
-                                                          value,
-                                                          scale=self.scale)
+            out = xops.memory_efficient_attention_forward(
+                query, key, value, scale=self.scale
+            )
         elif self.attn_backend == _Backend.TORCH_SDPA:
-            query, key, value = (x.transpose(1, 2)
-                                 for x in (query, key, value))
-            out = F.scaled_dot_product_attention(query,
-                                                 key,
-                                                 value,
-                                                 scale=self.scale)
+            query, key, value = (x.transpose(1, 2) for x in (query, key, value))
+            out = F.scaled_dot_product_attention(query, key, value, scale=self.scale)
             out = out.transpose(1, 2)
         elif self.attn_backend == _Backend.PALLAS:
-            query, key, value = (x.transpose(1, 2)
-                                 for x in (query, key, value))
+            query, key, value = (x.transpose(1, 2) for x in (query, key, value))
             from torch_xla.experimental.custom_kernel import flash_attention
+
             out = flash_attention(query, key, value, sm_scale=self.scale)
             out = out.transpose(1, 2)
         else:
             # ViT attention hasn't supported this backend yet
             raise NotImplementedError(
-                f"ViT attention hasn't supported {self.attn_backend} "
-                f"backend yet.")
+                f"ViT attention hasn't supported {self.attn_backend} backend yet."
+            )
 
         return out.reshape(bsz, q_len, -1)
 
@@ -582,8 +598,7 @@ def maybe_save_kv_layer_to_connector(
     if attn_metadata is None:
         return
     assert isinstance(attn_metadata, dict)
-    connector.save_kv_layer(layer_name, kv_cache_layer,
-                            attn_metadata[layer_name])
+    connector.save_kv_layer(layer_name, kv_cache_layer, attn_metadata[layer_name])
 
 
 def maybe_calc_kv_scales(
@@ -592,7 +607,6 @@ def maybe_calc_kv_scales(
     value: torch.Tensor,
     layer_name: str,
 ) -> None:
-
     forward_context: ForwardContext = get_forward_context()
     attn_metadata = forward_context.attn_metadata
 
@@ -600,7 +614,8 @@ def maybe_calc_kv_scales(
         attn_metadata = attn_metadata[layer_name]
 
     if attn_metadata is None or not getattr(
-            attn_metadata, 'enable_kv_scales_calculation', False):
+        attn_metadata, "enable_kv_scales_calculation", False
+    ):
         return
 
     self = forward_context.no_compile_layers[layer_name]
@@ -638,8 +653,7 @@ def unified_attention(
         attn_metadata = attn_metadata[layer_name]
     self = forward_context.no_compile_layers[layer_name]
     kv_cache = self.kv_cache[forward_context.virtual_engine]
-    output = self.impl.forward(self, query, key, value, kv_cache,
-                               attn_metadata)
+    output = self.impl.forward(self, query, key, value, kv_cache, attn_metadata)
 
     maybe_save_kv_layer_to_connector(layer_name, kv_cache)
     return output
@@ -678,15 +692,17 @@ def unified_attention_with_output(
         attn_metadata = attn_metadata[layer_name]
     self = forward_context.no_compile_layers[layer_name]
     kv_cache = self.kv_cache[forward_context.virtual_engine]
-    self.impl.forward(self,
-                      query,
-                      key,
-                      value,
-                      kv_cache,
-                      attn_metadata,
-                      output=output,
-                      output_scale=output_scale,
-                      output_block_scale=output_block_scale)
+    self.impl.forward(
+        self,
+        query,
+        key,
+        value,
+        kv_cache,
+        attn_metadata,
+        output=output,
+        output_scale=output_scale,
+        output_block_scale=output_block_scale,
+    )
 
     maybe_save_kv_layer_to_connector(layer_name, kv_cache)
 
diff --git a/vllm/attention/layers/chunked_local_attention.py b/vllm/attention/layers/chunked_local_attention.py
index 2d11b2238e78..7554a4102289 100644
--- a/vllm/attention/layers/chunked_local_attention.py
+++ b/vllm/attention/layers/chunked_local_attention.py
@@ -6,14 +6,16 @@
 import torch
 
 from vllm import envs
-from vllm.attention.backends.abstract import (AttentionBackend,
-                                              AttentionMetadata)
+from vllm.attention.backends.abstract import AttentionBackend, AttentionMetadata
 from vllm.attention.selector import get_attn_backend
 from vllm.config import CacheConfig
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.v1.attention.backends.utils import (
-    AttentionCGSupport, CommonAttentionMetadata,
-    make_local_attention_virtual_batches, subclass_attention_backend)
+    AttentionCGSupport,
+    CommonAttentionMetadata,
+    make_local_attention_virtual_batches,
+    subclass_attention_backend,
+)
 
 from ..layer import Attention
 
@@ -29,39 +31,42 @@ def create_chunked_local_attention_backend(
     underlying_builder = underlying_attn_backend.get_builder_cls()
 
     class ChunkedLocalAttentionBuilder(underlying_builder):  # type: ignore
-        cudagraph_support: ClassVar[AttentionCGSupport] = \
-            AttentionCGSupport.NEVER
-
-        def build(self,
-                  common_prefix_len: int,
-                  common_attn_metadata: CommonAttentionMetadata,
-                  fast_build: bool = False) -> AttentionMetadata:
+        cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.NEVER
+
+        def build(
+            self,
+            common_prefix_len: int,
+            common_attn_metadata: CommonAttentionMetadata,
+            fast_build: bool = False,
+        ) -> AttentionMetadata:
             common_attn_metadata = make_local_attention_virtual_batches(
-                attention_chunk_size, common_attn_metadata, block_size)
-            return super().build(common_prefix_len, common_attn_metadata,
-                                 fast_build)
+                attention_chunk_size, common_attn_metadata, block_size
+            )
+            return super().build(common_prefix_len, common_attn_metadata, fast_build)
 
     attn_backend = subclass_attention_backend(
         name_prefix=prefix,
         attention_backend_cls=underlying_attn_backend,
-        builder_cls=ChunkedLocalAttentionBuilder)
+        builder_cls=ChunkedLocalAttentionBuilder,
+    )
 
     return attn_backend
 
 
 class ChunkedLocalAttention(Attention):
-
-    def __init__(self,
-                 num_heads: int,
-                 head_size: int,
-                 scale: float,
-                 attention_chunk_size: int,
-                 num_kv_heads: Optional[int] = None,
-                 alibi_slopes: Optional[List[float]] = None,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 kv_sharing_target_layer_name: Optional[str] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        num_heads: int,
+        head_size: int,
+        scale: float,
+        attention_chunk_size: int,
+        num_kv_heads: Optional[int] = None,
+        alibi_slopes: Optional[List[float]] = None,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        kv_sharing_target_layer_name: Optional[str] = None,
+        prefix: str = "",
+    ):
         dtype = torch.get_default_dtype()
         if cache_config is not None:
             kv_cache_dtype = cache_config.cache_dtype
@@ -71,12 +76,13 @@ def __init__(self,
             block_size = 16
 
         if envs.VLLM_USE_V1:
-            underlying_attn_backend = get_attn_backend(head_size, dtype,
-                                                       kv_cache_dtype,
-                                                       block_size)
+            underlying_attn_backend = get_attn_backend(
+                head_size, dtype, kv_cache_dtype, block_size
+            )
 
             attn_backend = create_chunked_local_attention_backend(
-                underlying_attn_backend, attention_chunk_size, block_size)
+                underlying_attn_backend, attention_chunk_size, block_size
+            )
         else:
             # in v0 the local attention is handled inside the backends
             attn_backend = None
@@ -91,4 +97,5 @@ def __init__(self,
             quant_config=quant_config,
             prefix=prefix,
             kv_sharing_target_layer_name=kv_sharing_target_layer_name,
-            attn_backend=attn_backend)
+            attn_backend=attn_backend,
+        )
diff --git a/vllm/attention/layers/cross_attention.py b/vllm/attention/layers/cross_attention.py
index 9400c5bffa38..fb7004f86538 100644
--- a/vllm/attention/layers/cross_attention.py
+++ b/vllm/attention/layers/cross_attention.py
@@ -8,33 +8,40 @@
 import torch
 
 from vllm import envs
-from vllm.attention.backends.abstract import (AttentionBackend,
-                                              AttentionMetadata, AttentionType)
+from vllm.attention.backends.abstract import (
+    AttentionBackend,
+    AttentionMetadata,
+    AttentionType,
+)
 from vllm.attention.layer import Attention
 from vllm.attention.selector import get_attn_backend
 from vllm.config import CacheConfig, VllmConfig
 from vllm.logger import init_logger
 from vllm.utils import cdiv
-from vllm.v1.attention.backends.utils import (CommonAttentionMetadata,
-                                              subclass_attention_backend)
+from vllm.v1.attention.backends.utils import (
+    CommonAttentionMetadata,
+    subclass_attention_backend,
+)
 from vllm.v1.kv_cache_interface import CrossAttentionSpec
 
 logger = init_logger(__name__)
 
 
 def _get_max_encoder_len(vllm_config: "VllmConfig") -> int:
-    """Gets the max number of encoder input tokens from the config.
-    """
+    """Gets the max number of encoder input tokens from the config."""
     sc = vllm_config.scheduler_config
-    assert sc and isinstance(sc.max_num_encoder_input_tokens, int), \
+    assert sc and isinstance(sc.max_num_encoder_input_tokens, int), (
         "max_num_encoder_input_tokens must be int for enc-dec models"
+    )
     return sc.max_num_encoder_input_tokens
 
 
-def _get_cross_slot_mapping(encoder_seq_lens: np.ndarray,
-                            block_table_tensor: torch.Tensor,
-                            kv_cache_spec: CrossAttentionSpec,
-                            device: torch.device) -> torch.Tensor:
+def _get_cross_slot_mapping(
+    encoder_seq_lens: np.ndarray,
+    block_table_tensor: torch.Tensor,
+    kv_cache_spec: CrossAttentionSpec,
+    device: torch.device,
+) -> torch.Tensor:
     """Get cross-attention slot mappings."""
 
     block_size = kv_cache_spec.block_size
@@ -58,9 +65,7 @@ def _get_cross_slot_mapping(encoder_seq_lens: np.ndarray,
         needed_block_ids = req_block_ids[:num_blocks_needed]
 
         # All needed blocks are allocated
-        i_values = torch.arange(encoder_seq_len,
-                                dtype=torch.int64,
-                                device=device)
+        i_values = torch.arange(encoder_seq_len, dtype=torch.int64, device=device)
         block_indices = i_values // block_size
         block_offsets = i_values % block_size
         block_numbers = needed_block_ids[block_indices]
@@ -76,42 +81,48 @@ def _get_cross_slot_mapping(encoder_seq_lens: np.ndarray,
 
 @functools.lru_cache
 def create_cross_attention_backend(
-    underlying_attn_backend: AttentionBackend, ) -> type[AttentionBackend]:
+    underlying_attn_backend: AttentionBackend,
+) -> type[AttentionBackend]:
     prefix = "CrossAttention_"
     underlying_builder = underlying_attn_backend.get_builder_cls()
 
     class CrossAttentionBuilder(underlying_builder):  # type: ignore
-
-        def build(self,
-                  common_prefix_len: int,
-                  common_attn_metadata: CommonAttentionMetadata,
-                  fast_build: bool = False) -> AttentionMetadata:
+        def build(
+            self,
+            common_prefix_len: int,
+            common_attn_metadata: CommonAttentionMetadata,
+            fast_build: bool = False,
+        ) -> AttentionMetadata:
             new_metadata = copy(common_attn_metadata)
             new_metadata.causal = False
             max_encoder_len = _get_max_encoder_len(self.vllm_config)
             new_metadata.max_seq_len = max_encoder_len
 
             new_metadata.seq_lens = torch.full(
-                (new_metadata.num_reqs, ),
+                (new_metadata.num_reqs,),
                 max_encoder_len,
                 dtype=torch.int32,
                 device=self.device,
             )
             new_metadata.seq_lens_cpu = torch.full(
-                (new_metadata.num_reqs, ),
+                (new_metadata.num_reqs,),
                 max_encoder_len,
                 dtype=torch.int32,
                 device="cpu",
             )
             new_metadata.slot_mapping = _get_cross_slot_mapping(
-                new_metadata.encoder_seq_lens, new_metadata.block_table_tensor,
-                self.kv_cache_spec, self.device)
+                new_metadata.encoder_seq_lens,
+                new_metadata.block_table_tensor,
+                self.kv_cache_spec,
+                self.device,
+            )
             return super().build(common_prefix_len, new_metadata, fast_build)
 
     attn_backend = subclass_attention_backend(
         name_prefix=prefix,
         attention_backend_cls=underlying_attn_backend,
-        builder_cls=CrossAttentionBuilder)
+        builder_cls=CrossAttentionBuilder,
+    )
 
     return attn_backend
 
@@ -122,13 +133,15 @@ class CrossAttention(Attention):
     Handles attention between decoder queries and encoder keys/values.
     """
 
-    def __init__(self,
-                 num_heads: int,
-                 head_size: int,
-                 scale: float,
-                 cache_config: Optional[CacheConfig] = None,
-                 attn_type: Optional[str] = None,
-                 **kwargs):
+    def __init__(
+        self,
+        num_heads: int,
+        head_size: int,
+        scale: float,
+        cache_config: Optional[CacheConfig] = None,
+        attn_type: Optional[str] = None,
+        **kwargs,
+    ):
         dtype = torch.get_default_dtype()
 
         if cache_config is not None:
@@ -139,24 +152,26 @@ def __init__(self,
             block_size = 16
 
         if envs.VLLM_USE_V1:
-            underlying_attn_backend = get_attn_backend(head_size, dtype,
-                                                       kv_cache_dtype,
-                                                       block_size)
+            underlying_attn_backend = get_attn_backend(
+                head_size, dtype, kv_cache_dtype, block_size
+            )
 
-            attn_backend = create_cross_attention_backend(
-                underlying_attn_backend)
+            attn_backend = create_cross_attention_backend(underlying_attn_backend)
         else:
             # in v0 cross attention is handled inside the backends
             attn_backend = None
 
         if attn_type is not None:
             assert attn_type == AttentionType.ENCODER_DECODER, (
-                "CrossAttention only supports AttentionType.ENCODER_DECODER")
-
-        super().__init__(num_heads=num_heads,
-                         head_size=head_size,
-                         scale=scale,
-                         cache_config=cache_config,
-                         attn_backend=attn_backend,
-                         attn_type=AttentionType.ENCODER_DECODER,
-                         **kwargs)
+                "CrossAttention only supports AttentionType.ENCODER_DECODER"
+            )
+
+        super().__init__(
+            num_heads=num_heads,
+            head_size=head_size,
+            scale=scale,
+            cache_config=cache_config,
+            attn_backend=attn_backend,
+            attn_type=AttentionType.ENCODER_DECODER,
+            **kwargs,
+        )
diff --git a/vllm/attention/layers/encoder_only_attention.py b/vllm/attention/layers/encoder_only_attention.py
index cea05df5b96d..f49f195563dc 100644
--- a/vllm/attention/layers/encoder_only_attention.py
+++ b/vllm/attention/layers/encoder_only_attention.py
@@ -7,36 +7,45 @@
 import torch
 
 from vllm import envs
-from vllm.attention.backends.abstract import (AttentionBackend,
-                                              AttentionMetadata, AttentionType)
+from vllm.attention.backends.abstract import (
+    AttentionBackend,
+    AttentionMetadata,
+    AttentionType,
+)
 from vllm.attention.layer import Attention
 from vllm.attention.selector import get_attn_backend
 from vllm.config import CacheConfig
-from vllm.v1.attention.backends.utils import (CommonAttentionMetadata,
-                                              subclass_attention_backend)
+from vllm.v1.attention.backends.utils import (
+    CommonAttentionMetadata,
+    subclass_attention_backend,
+)
 
 
 @functools.lru_cache
 def create_encoder_only_attention_backend(
-    underlying_attn_backend: AttentionBackend, ) -> type[AttentionBackend]:
+    underlying_attn_backend: AttentionBackend,
+) -> type[AttentionBackend]:
     prefix = "EncoderOnlyAttention_"
     underlying_builder = underlying_attn_backend.get_builder_cls()
 
     class EncoderOnlyAttentionBuilder(underlying_builder):  # type: ignore
-
-        def build(self,
-                  common_prefix_len: int,
-                  common_attn_metadata: CommonAttentionMetadata,
-                  fast_build: bool = False) -> AttentionMetadata:
+        def build(
+            self,
+            common_prefix_len: int,
+            common_attn_metadata: CommonAttentionMetadata,
+            fast_build: bool = False,
+        ) -> AttentionMetadata:
             new_common_attn_metadata = copy(common_attn_metadata)
             new_common_attn_metadata.causal = False
-            return super().build(common_prefix_len, new_common_attn_metadata,
-                                 fast_build)
+            return super().build(
+                common_prefix_len, new_common_attn_metadata, fast_build
+            )
 
     attn_backend = subclass_attention_backend(
         name_prefix=prefix,
         attention_backend_cls=underlying_attn_backend,
-        builder_cls=EncoderOnlyAttentionBuilder)
+        builder_cls=EncoderOnlyAttentionBuilder,
+    )
 
     return attn_backend
 
@@ -46,13 +55,15 @@ class EncoderOnlyAttention(Attention):
     Encoder attention is a special case that doesn't need a KV Cache.
     """
 
-    def __init__(self,
-                 num_heads: int,
-                 head_size: int,
-                 scale: float,
-                 cache_config: Optional[CacheConfig] = None,
-                 attn_type: Optional[str] = None,
-                 **kwargs):
+    def __init__(
+        self,
+        num_heads: int,
+        head_size: int,
+        scale: float,
+        cache_config: Optional[CacheConfig] = None,
+        attn_type: Optional[str] = None,
+        **kwargs,
+    ):
         dtype = torch.get_default_dtype()
 
         if cache_config is not None:
@@ -63,24 +74,28 @@ def __init__(self,
             block_size = 16
 
         if envs.VLLM_USE_V1:
-            underlying_attn_backend = get_attn_backend(head_size, dtype,
-                                                       kv_cache_dtype,
-                                                       block_size)
+            underlying_attn_backend = get_attn_backend(
+                head_size, dtype, kv_cache_dtype, block_size
+            )
 
             attn_backend = create_encoder_only_attention_backend(
-                underlying_attn_backend)
+                underlying_attn_backend
+            )
         else:
             # in v0 encoder only attention is handled inside the backends
             attn_backend = None
 
         if attn_type is not None:
-            assert attn_type == AttentionType.ENCODER_ONLY, \
+            assert attn_type == AttentionType.ENCODER_ONLY, (
                 "EncoderOnlyAttention only supports AttentionType.ENCODER_ONLY"
-
-        super().__init__(num_heads=num_heads,
-                         head_size=head_size,
-                         scale=scale,
-                         cache_config=cache_config,
-                         attn_backend=attn_backend,
-                         attn_type=AttentionType.ENCODER_ONLY,
-                         **kwargs)
+            )
+
+        super().__init__(
+            num_heads=num_heads,
+            head_size=head_size,
+            scale=scale,
+            cache_config=cache_config,
+            attn_backend=attn_backend,
+            attn_type=AttentionType.ENCODER_ONLY,
+            **kwargs,
+        )
diff --git a/vllm/attention/ops/chunked_prefill_paged_decode.py b/vllm/attention/ops/chunked_prefill_paged_decode.py
index bf4b06512a3c..aa791fe97006 100644
--- a/vllm/attention/ops/chunked_prefill_paged_decode.py
+++ b/vllm/attention/ops/chunked_prefill_paged_decode.py
@@ -25,72 +25,73 @@ def cdiv_fn(x, y):
 
 @triton.jit
 def kernel_paged_attention_2d(
-        output_ptr,  # [num_tokens, num_query_heads, head_size]
-        query_ptr,  # [num_tokens, num_query_heads, head_size]
-        key_cache_ptr,  # [num_blks, num_kv_heads, head_size // x, blk_size, x]
-        value_cache_ptr,  # [num_blks, num_kv_heads, head_size, blk_size]
-        sink_ptr,  # [num_query_heads]
-        block_tables_ptr,  # [num_seqs, max_num_blocks_per_seq]
-        seq_lens_ptr,  # [num_seqs]
-        alibi_slopes_ptr,  # [num_query_heads]
-        scale,  # float32
-        k_scale,  # float32
-        v_scale,  # float32
-        out_scale_inv,
-        num_query_heads: tl.constexpr,  # int
-        num_queries_per_kv: tl.constexpr,  # int
-        num_queries_per_kv_padded: tl.constexpr,  # int
-        block_table_stride: tl.int64,  # int
-        query_stride_0: tl.int64,  # int
-        query_stride_1: tl.int64,  # int, should be equal to head_size
-        output_stride_0: tl.int64,  # int
-        output_stride_1: tl.int64,  # int, should be equal to head_size
-        BLOCK_SIZE: tl.constexpr,  # int
-        HEAD_SIZE: tl.constexpr,  # int
-        HEAD_SIZE_PADDED: tl.constexpr,  # int, must be power of 2
-        USE_ALIBI_SLOPES: tl.constexpr,  # bool
-        SLIDING_WINDOW: tl.constexpr,  # int
-        x: tl.constexpr,  # int
-        stride_k_cache_0: tl.int64,  # int
-        stride_k_cache_1: tl.int64,  # int
-        stride_k_cache_2: tl.int64,  # int
-        stride_k_cache_3: tl.int64,  # int
-        stride_k_cache_4: tl.int64,  # int
-        stride_v_cache_0: tl.int64,  # int
-        stride_v_cache_1: tl.int64,  # int
-        stride_v_cache_2: tl.int64,  # int
-        stride_v_cache_3: tl.int64,  # int
-        filter_by_query_len: tl.constexpr,  # bool
-        query_start_len_ptr,  # [num_seqs+1]
-        USE_SINKS: tl.constexpr,  # bool
-        USE_FP8: tl.constexpr,
-        FP8_MIN: tl.constexpr = float8_info.min,
-        FP8_MAX: tl.constexpr = float8_info.max):
+    output_ptr,  # [num_tokens, num_query_heads, head_size]
+    query_ptr,  # [num_tokens, num_query_heads, head_size]
+    key_cache_ptr,  # [num_blks, num_kv_heads, head_size // x, blk_size, x]
+    value_cache_ptr,  # [num_blks, num_kv_heads, head_size, blk_size]
+    sink_ptr,  # [num_query_heads]
+    block_tables_ptr,  # [num_seqs, max_num_blocks_per_seq]
+    seq_lens_ptr,  # [num_seqs]
+    alibi_slopes_ptr,  # [num_query_heads]
+    scale,  # float32
+    k_scale,  # float32
+    v_scale,  # float32
+    out_scale_inv,
+    num_query_heads: tl.constexpr,  # int
+    num_queries_per_kv: tl.constexpr,  # int
+    num_queries_per_kv_padded: tl.constexpr,  # int
+    block_table_stride: tl.int64,  # int
+    query_stride_0: tl.int64,  # int
+    query_stride_1: tl.int64,  # int, should be equal to head_size
+    output_stride_0: tl.int64,  # int
+    output_stride_1: tl.int64,  # int, should be equal to head_size
+    BLOCK_SIZE: tl.constexpr,  # int
+    HEAD_SIZE: tl.constexpr,  # int
+    HEAD_SIZE_PADDED: tl.constexpr,  # int, must be power of 2
+    USE_ALIBI_SLOPES: tl.constexpr,  # bool
+    SLIDING_WINDOW: tl.constexpr,  # int
+    x: tl.constexpr,  # int
+    stride_k_cache_0: tl.int64,  # int
+    stride_k_cache_1: tl.int64,  # int
+    stride_k_cache_2: tl.int64,  # int
+    stride_k_cache_3: tl.int64,  # int
+    stride_k_cache_4: tl.int64,  # int
+    stride_v_cache_0: tl.int64,  # int
+    stride_v_cache_1: tl.int64,  # int
+    stride_v_cache_2: tl.int64,  # int
+    stride_v_cache_3: tl.int64,  # int
+    filter_by_query_len: tl.constexpr,  # bool
+    query_start_len_ptr,  # [num_seqs+1]
+    USE_SINKS: tl.constexpr,  # bool
+    USE_FP8: tl.constexpr,
+    FP8_MIN: tl.constexpr = float8_info.min,
+    FP8_MAX: tl.constexpr = float8_info.max,
+):
     seq_idx = tl.program_id(0)
     kv_head_idx = tl.program_id(1)
 
     if filter_by_query_len:
         cur_batch_in_all_start_index = tl.load(query_start_len_ptr + seq_idx)
-        cur_batch_in_all_stop_index = tl.load(query_start_len_ptr + seq_idx +
-                                              1)
-        cur_batch_query_len = cur_batch_in_all_stop_index \
-            - cur_batch_in_all_start_index
+        cur_batch_in_all_stop_index = tl.load(query_start_len_ptr + seq_idx + 1)
+        cur_batch_query_len = cur_batch_in_all_stop_index - cur_batch_in_all_start_index
         if cur_batch_query_len > 1:
             return
     else:
         cur_batch_in_all_start_index = seq_idx
 
     query_head_idx = kv_head_idx * num_queries_per_kv + tl.arange(
-        0, num_queries_per_kv_padded)
+        0, num_queries_per_kv_padded
+    )
 
-    query_offset = (cur_batch_in_all_start_index * query_stride_0 +
-                    query_head_idx[:, None] * query_stride_1)
+    query_offset = (
+        cur_batch_in_all_start_index * query_stride_0
+        + query_head_idx[:, None] * query_stride_1
+    )
 
     head_mask = query_head_idx < (kv_head_idx + 1) * num_queries_per_kv
     head_mask = head_mask & (query_head_idx < num_query_heads)
 
-    dim_mask = tl.where(tl.arange(0, HEAD_SIZE_PADDED) < HEAD_SIZE, 1,
-                        0).to(tl.int1)
+    dim_mask = tl.where(tl.arange(0, HEAD_SIZE_PADDED) < HEAD_SIZE, 1, 0).to(tl.int1)
 
     # Q : (num_queries_per_kv, HEAD_SIZE,)
     Q = tl.load(
@@ -102,9 +103,7 @@ def kernel_paged_attention_2d(
     block_table_offset = seq_idx * block_table_stride
 
     if not USE_SINKS:
-        M = tl.full([num_queries_per_kv_padded],
-                    float("-inf"),
-                    dtype=tl.float32)
+        M = tl.full([num_queries_per_kv_padded], float("-inf"), dtype=tl.float32)
     else:
         M = tl.load(
             sink_ptr + query_head_idx,
@@ -113,43 +112,43 @@ def kernel_paged_attention_2d(
         ).to(dtype=tl.float32)
 
     L = tl.full([num_queries_per_kv_padded], 1.0, dtype=tl.float32)
-    acc = tl.zeros([num_queries_per_kv_padded, HEAD_SIZE_PADDED],
-                   dtype=tl.float32)
+    acc = tl.zeros([num_queries_per_kv_padded, HEAD_SIZE_PADDED], dtype=tl.float32)
 
     # sequence len for this particular sequence
     seq_len = tl.load(seq_lens_ptr + seq_idx)
 
     # alibi slope for this head
     if USE_ALIBI_SLOPES:
-        alibi_slope = tl.load(alibi_slopes_ptr + query_head_idx,
-                              mask=head_mask,
-                              other=0.0)
+        alibi_slope = tl.load(
+            alibi_slopes_ptr + query_head_idx, mask=head_mask, other=0.0
+        )
 
     num_blocks = cdiv_fn(seq_len, BLOCK_SIZE)
 
     # iterate through tiles
     for j in range(0, num_blocks):
-
         physical_block_idx = tl.load(block_tables_ptr + block_table_offset + j)
 
         offs_n = tl.arange(0, BLOCK_SIZE)
         offs_d = tl.arange(0, HEAD_SIZE_PADDED)
 
-        v_offset = (physical_block_idx * stride_v_cache_0 +
-                    kv_head_idx * stride_v_cache_1 +
-                    offs_d[None, :] * stride_v_cache_2 +
-                    offs_n[:, None] * stride_v_cache_3)
+        v_offset = (
+            physical_block_idx * stride_v_cache_0
+            + kv_head_idx * stride_v_cache_1
+            + offs_d[None, :] * stride_v_cache_2
+            + offs_n[:, None] * stride_v_cache_3
+        )
 
-        k_offset = (physical_block_idx * stride_k_cache_0 +
-                    kv_head_idx * stride_k_cache_1 +
-                    (offs_d[:, None] // x) * stride_k_cache_2 +
-                    offs_n[None, :] * stride_k_cache_3 +
-                    (offs_d[:, None] % x) * stride_k_cache_4)
+        k_offset = (
+            physical_block_idx * stride_k_cache_0
+            + kv_head_idx * stride_k_cache_1
+            + (offs_d[:, None] // x) * stride_k_cache_2
+            + offs_n[None, :] * stride_k_cache_3
+            + (offs_d[:, None] % x) * stride_k_cache_4
+        )
 
         # K : (HEAD_SIZE, BLOCK_SIZE)
-        K_load = tl.load(key_cache_ptr + k_offset,
-                         mask=dim_mask[:, None],
-                         other=0.0)
+        K_load = tl.load(key_cache_ptr + k_offset, mask=dim_mask[:, None], other=0.0)
 
         if K_load.dtype.is_fp8():
             K = (K_load.to(tl.float32) * tl.load(k_scale)).to(Q.dtype)
@@ -157,9 +156,7 @@ def kernel_paged_attention_2d(
             K = K_load
 
         # V : (BLOCK_SIZE, HEAD_SIZE)
-        V_load = tl.load(value_cache_ptr + v_offset,
-                         mask=dim_mask[None, :],
-                         other=0.0)
+        V_load = tl.load(value_cache_ptr + v_offset, mask=dim_mask[None, :], other=0.0)
 
         if V_load.dtype.is_fp8():
             V = (V_load.to(tl.float32) * tl.load(v_scale)).to(Q.dtype)
@@ -171,15 +168,13 @@ def kernel_paged_attention_2d(
         seq_mask = seq_offset[None, :] < boundary
 
         # S : (num_queries_per_kv, BLOCK_SIZE,)
-        S = tl.where(head_mask[:, None] & seq_mask, 0.0,
-                     float("-inf")).to(tl.float32)
+        S = tl.where(head_mask[:, None] & seq_mask, 0.0, float("-inf")).to(tl.float32)
         S += scale * tl.dot(Q, K)
 
         context_len = seq_len - 1
 
         if SLIDING_WINDOW > 0:
-            S = tl.where((context_len - seq_offset) < SLIDING_WINDOW, S,
-                         -10000)
+            S = tl.where((context_len - seq_offset) < SLIDING_WINDOW, S, -10000)
 
         if USE_ALIBI_SLOPES:
             S += alibi_slope[:, None] * (seq_offset - context_len)
@@ -213,12 +208,13 @@ def kernel_paged_attention_2d(
         acc = acc * tl.load(out_scale_inv)
         acc = tl.clamp(acc, FP8_MIN, FP8_MAX)
 
-    output_offset = (cur_batch_in_all_start_index * output_stride_0 +
-                     query_head_idx * output_stride_1)
+    output_offset = (
+        cur_batch_in_all_start_index * output_stride_0
+        + query_head_idx * output_stride_1
+    )
 
     tl.store(
-        output_ptr + output_offset[:, None] +
-        tl.arange(0, HEAD_SIZE_PADDED)[None, :],
+        output_ptr + output_offset[:, None] + tl.arange(0, HEAD_SIZE_PADDED)[None, :],
         acc,
         mask=dim_mask[None, :] & head_mask[:, None],
     )
@@ -246,9 +242,8 @@ def chunked_prefill_paged_decode(
     # Optional tensor for sinks
     sinks=None,
 ):
-
     if sm_scale is None:
-        sm_scale = 1.0 / (query.shape[1]**0.5)
+        sm_scale = 1.0 / (query.shape[1] ** 0.5)
 
     use_alibi_slopes = alibi_slopes is not None
 
@@ -302,10 +297,10 @@ def chunked_prefill_paged_decode(
         key_cache = key_cache.view(target_dtype)
         value_cache = value_cache.view(target_dtype)
 
-    num_queries_per_kv_padded = max(triton.next_power_of_2(num_queries_per_kv),
-                                    16)
+    num_queries_per_kv_padded = max(triton.next_power_of_2(num_queries_per_kv), 16)
 
     from vllm.platforms.rocm import use_rocm_custom_paged_attention
+
     use_custom = use_rocm_custom_paged_attention(
         query.dtype,
         head_size,
@@ -319,13 +314,13 @@ def chunked_prefill_paged_decode(
     )
     if use_custom:
         _PARTITION_SIZE_ROCM = 256
-        max_num_partitions = ((max_seq_len + _PARTITION_SIZE_ROCM - 1) //
-                              _PARTITION_SIZE_ROCM)
+        max_num_partitions = (
+            max_seq_len + _PARTITION_SIZE_ROCM - 1
+        ) // _PARTITION_SIZE_ROCM
         assert _PARTITION_SIZE_ROCM % block_size == 0
         total_num_seq = block_table.shape[0]
         tmp_output = torch.empty(
-            size=(total_num_seq, num_query_heads, max_num_partitions,
-                  head_size),
+            size=(total_num_seq, num_query_heads, max_num_partitions, head_size),
             dtype=query.dtype,
             device=output.device,
         )
@@ -358,10 +353,12 @@ def chunked_prefill_paged_decode(
             fp8_out_scale=output_scale,
         )
     else:
-        kernel_paged_attention_2d[(
-            num_seqs,
-            num_kv_heads,
-        )](
+        kernel_paged_attention_2d[
+            (
+                num_seqs,
+                num_kv_heads,
+            )
+        ](
             output_ptr=output,
             query_ptr=query,
             key_cache_ptr=key_cache,
@@ -373,8 +370,7 @@ def chunked_prefill_paged_decode(
             scale=sm_scale,
             k_scale=k_scale,
             v_scale=v_scale,
-            out_scale_inv=1.0 /
-            output_scale if output_scale is not None else 1.0,
+            out_scale_inv=1.0 / output_scale if output_scale is not None else 1.0,
             num_query_heads=num_query_heads,
             num_queries_per_kv=num_queries_per_kv,
             num_queries_per_kv_padded=num_queries_per_kv_padded,
diff --git a/vllm/attention/ops/common.py b/vllm/attention/ops/common.py
index e659f1f3eae9..097fbae68cda 100644
--- a/vllm/attention/ops/common.py
+++ b/vllm/attention/ops/common.py
@@ -7,11 +7,21 @@
 
 
 @triton.jit
-def _correct_attn_cp_out_kernel(outputs_ptr, new_output_ptr, lses_ptr,
-                                vlse_ptr, outputs_stride_B, outputs_stride_H,
-                                outputs_stride_D, lses_stride_N, lses_stride_B,
-                                lses_stride_H, lse_idx, HEAD_DIM: tl.constexpr,
-                                N_ROUNDED: tl.constexpr):
+def _correct_attn_cp_out_kernel(
+    outputs_ptr,
+    new_output_ptr,
+    lses_ptr,
+    vlse_ptr,
+    outputs_stride_B,
+    outputs_stride_H,
+    outputs_stride_D,
+    lses_stride_N,
+    lses_stride_B,
+    lses_stride_H,
+    lse_idx,
+    HEAD_DIM: tl.constexpr,
+    N_ROUNDED: tl.constexpr,
+):
     """
     Apply the all-gathered lses to correct each local rank's attention
     output. we still need perform a cross-rank reduction to obtain the
@@ -33,12 +43,15 @@ def _correct_attn_cp_out_kernel(outputs_ptr, new_output_ptr, lses_ptr,
     num_n_offsets = tl.arange(0, N_ROUNDED)
 
     # shape = [N]
-    lse_offsets = num_n_offsets * lses_stride_N + batch_idx * \
-        lses_stride_B + head_idx * lses_stride_H
+    lse_offsets = (
+        num_n_offsets * lses_stride_N
+        + batch_idx * lses_stride_B
+        + head_idx * lses_stride_H
+    )
 
     # calc final lse
     lse = tl.load(lses_ptr + lse_offsets)
-    lse = tl.where((lse != lse) | (lse == float('inf')), -float('inf'), lse)
+    lse = tl.where((lse != lse) | (lse == float("inf")), -float("inf"), lse)
     lse_max = tl.max(lse, axis=0)
     lse -= lse_max
     lse_exp = tl.exp(lse)
@@ -50,18 +63,23 @@ def _correct_attn_cp_out_kernel(outputs_ptr, new_output_ptr, lses_ptr,
     tl.store(vlse_ptr + lse_offsets, lse)
 
     # shape = [D]
-    output_offsets = batch_idx * outputs_stride_B + \
-                    head_idx * outputs_stride_H + \
-                    d_offsets * outputs_stride_D
+    output_offsets = (
+        batch_idx * outputs_stride_B
+        + head_idx * outputs_stride_H
+        + d_offsets * outputs_stride_D
+    )
 
     # correct output
-    lse_offset = lse_idx * lses_stride_N + batch_idx * \
-        lses_stride_B + head_idx * lses_stride_H
+    lse_offset = (
+        lse_idx * lses_stride_N + batch_idx * lses_stride_B + head_idx * lses_stride_H
+    )
     lse_tmp = tl.load(lses_ptr + lse_offset)
     lse_finally = lse_tmp - lse
     lse_finally = tl.where(
-        (lse_finally != lse_finally) | (lse_finally == float('inf')),
-        -float('inf'), lse_finally)
+        (lse_finally != lse_finally) | (lse_finally == float("inf")),
+        -float("inf"),
+        lse_finally,
+    )
     factor = tl.exp(lse_finally)
     output = tl.load(outputs_ptr + output_offsets)
     output = output * factor
@@ -70,8 +88,7 @@ def _correct_attn_cp_out_kernel(outputs_ptr, new_output_ptr, lses_ptr,
 
 
 class CPTritonContext:
-    """ The CPTritonContext is used to avoid recompilation of the Triton JIT.
-    """
+    """The CPTritonContext is used to avoid recompilation of the Triton JIT."""
 
     def __init__(self):
         self.inner_kernel = None
@@ -84,8 +101,8 @@ def call_kernel(self, kernel, grid, *regular_args, **const_args):
 
 
 def correct_attn_out(
-        out: torch.Tensor, lses: torch.Tensor, cp_rank: int,
-        ctx: CPTritonContext) -> tuple[torch.Tensor, torch.Tensor]:
+    out: torch.Tensor, lses: torch.Tensor, cp_rank: int, ctx: CPTritonContext
+) -> tuple[torch.Tensor, torch.Tensor]:
     """Correct the attention output using the all-gathered lses.
 
     Args:
@@ -103,22 +120,22 @@ def correct_attn_out(
     lse = torch.empty_like(lses[0])
 
     grid = (out.shape[0], out.shape[1], 1)
-    regular_args = (out, out, lses, lse, *out.stride(), *lses.stride(),
-                    cp_rank)
+    regular_args = (out, out, lses, lse, *out.stride(), *lses.stride(), cp_rank)
     const_args = {
         "HEAD_DIM": out.shape[-1],
         "N_ROUNDED": lses.shape[0],
     }
 
-    ctx.call_kernel(_correct_attn_cp_out_kernel, grid, *regular_args,
-                    **const_args)
+    ctx.call_kernel(_correct_attn_cp_out_kernel, grid, *regular_args, **const_args)
     return out, lse
 
 
-def cp_lse_ag_out_rs(cp_attn_out: torch.Tensor,
-                     cp_attn_lse: torch.Tensor,
-                     cp_group: GroupCoordinator,
-                     ctx: CPTritonContext = None):
+def cp_lse_ag_out_rs(
+    cp_attn_out: torch.Tensor,
+    cp_attn_lse: torch.Tensor,
+    cp_group: GroupCoordinator,
+    ctx: CPTritonContext = None,
+):
     """
     cp_attn_out: [ B, H, D ]
     cp_attn_lse: [ B, H ]
@@ -129,9 +146,11 @@ def cp_lse_ag_out_rs(cp_attn_out: torch.Tensor,
     if ctx is None:
         ctx = CPTritonContext()
 
-    lses = torch.empty((cp_group.world_size, ) + cp_attn_lse.shape,
-                       dtype=cp_attn_lse.dtype,
-                       device=cp_attn_lse.device)
+    lses = torch.empty(
+        (cp_group.world_size,) + cp_attn_lse.shape,
+        dtype=cp_attn_lse.dtype,
+        device=cp_attn_lse.device,
+    )
 
     cp_attn_lse = cp_attn_lse.contiguous()
     lses = cp_group.all_gather(cp_attn_lse, dim=0).view_as(lses)
@@ -142,15 +161,15 @@ def cp_lse_ag_out_rs(cp_attn_out: torch.Tensor,
 
 @triton.jit
 def _pack_seq_kernel(
-        x_ptr,  # [N, D]
-        out_ptr,  # [B, Lmax, D]
-        lengths_ptr,  # *i32, [B]
-        N: tl.constexpr,
-        D: tl.constexpr,
-        Lmax: tl.constexpr,
-        PAD_VALUE: tl.constexpr,
-        BLOCK_T: tl.constexpr,  # timesteps per program
-        BLOCK_D: tl.constexpr  # features per program
+    x_ptr,  # [N, D]
+    out_ptr,  # [B, Lmax, D]
+    lengths_ptr,  # *i32, [B]
+    N: tl.constexpr,
+    D: tl.constexpr,
+    Lmax: tl.constexpr,
+    PAD_VALUE: tl.constexpr,
+    BLOCK_T: tl.constexpr,  # timesteps per program
+    BLOCK_D: tl.constexpr,  # features per program
 ):
     pid_b = tl.program_id(0)  # batch id
     pid_t = tl.program_id(1)  # block over time dimension
@@ -176,8 +195,7 @@ def _pack_seq_kernel(
     x_row_ptr = x_ptr + in_row[:, None] * D + off_d[None, :]
 
     # out_ptr: row-major [B, Lmax, D]
-    out_row_ptr = out_ptr + (pid_b * Lmax + off_t)[:,
-                                                   None] * D + off_d[None, :]
+    out_row_ptr = out_ptr + (pid_b * Lmax + off_t)[:, None] * D + off_d[None, :]
 
     # Initialize with PAD (cast will occur as needed based on out_ptr dtype)
     d_mask = off_d[None, :] < D
@@ -189,21 +207,23 @@ def _pack_seq_kernel(
     tl.store(out_row_ptr, x_vals, mask=valid_row[:, None] & d_mask)
 
 
-def pack_seq_triton(x: torch.Tensor,
-                    lengths: torch.Tensor,
-                    pad_value: float = -float('inf'),
-                    block_t: int = 64,
-                    block_d: int = 64) -> torch.Tensor:
+def pack_seq_triton(
+    x: torch.Tensor,
+    lengths: torch.Tensor,
+    pad_value: float = -float("inf"),
+    block_t: int = 64,
+    block_d: int = 64,
+) -> torch.Tensor:
     """
     Pack sequences of different lengths into a batched tensor.
-    
+
     Args:
         x: [N, ...] - input tensor where N is total number of tokens
         lengths: [B] - sequence lengths for each batch
         pad_value: value to use for padding
         block_t: block size for time dimension
         block_d: block size for feature dimension
-        
+
     Returns:
         packed: [B, Lmax, ...] - packed tensor
     """
@@ -226,17 +246,19 @@ def pack_seq_triton(x: torch.Tensor,
     out = torch.empty((B, Lmax, D), device=x.device, dtype=x.dtype)
 
     grid = (B, triton.cdiv(Lmax, block_t), triton.cdiv(D, block_d))
-    _pack_seq_kernel[grid](x_reshaped,
-                           out,
-                           lengths.int(),
-                           N,
-                           D,
-                           Lmax,
-                           PAD_VALUE=float(pad_value),
-                           BLOCK_T=block_t,
-                           BLOCK_D=block_d,
-                           num_warps=4,
-                           num_stages=2)
+    _pack_seq_kernel[grid](
+        x_reshaped,
+        out,
+        lengths.int(),
+        N,
+        D,
+        Lmax,
+        PAD_VALUE=float(pad_value),
+        BLOCK_T=block_t,
+        BLOCK_D=block_d,
+        num_warps=4,
+        num_stages=2,
+    )
 
     # Reshape output back to original dimensions (except first dimension)
     if len(original_shape) > 2:
@@ -248,14 +270,14 @@ def pack_seq_triton(x: torch.Tensor,
 
 @triton.jit
 def _unpack_seq_triton_kernel(
-        packed_ptr,  # [B, Lmax, D]
-        out_ptr,  # [N, D]
-        lengths_ptr,  # *i32, [B]
-        B: tl.constexpr,
-        Lmax: tl.constexpr,
-        D: tl.constexpr,
-        BLOCK_T: tl.constexpr,  # timesteps per program
-        BLOCK_D: tl.constexpr  # features per program
+    packed_ptr,  # [B, Lmax, D]
+    out_ptr,  # [N, D]
+    lengths_ptr,  # *i32, [B]
+    B: tl.constexpr,
+    Lmax: tl.constexpr,
+    D: tl.constexpr,
+    BLOCK_T: tl.constexpr,  # timesteps per program
+    BLOCK_D: tl.constexpr,  # features per program
 ):
     pid_b = tl.program_id(0)  # batch id
     pid_t = tl.program_id(1)  # block over time dimension
@@ -278,8 +300,7 @@ def _unpack_seq_triton_kernel(
 
     # Pointers
     # packed_ptr: row-major [B, Lmax, D]
-    packed_row_ptr = packed_ptr + (pid_b * Lmax +
-                                   off_t)[:, None] * D + off_d[None, :]
+    packed_row_ptr = packed_ptr + (pid_b * Lmax + off_t)[:, None] * D + off_d[None, :]
 
     # out_ptr: row-major [N, D]
     out_row_ptr = out_ptr + out_row[:, None] * D + off_d[None, :]
@@ -290,20 +311,22 @@ def _unpack_seq_triton_kernel(
     tl.store(out_row_ptr, packed_vals, mask=valid_row[:, None] & d_mask)
 
 
-def unpack_seq_triton(packed_tensor: torch.Tensor,
-                      lengths: torch.Tensor,
-                      block_t: int = 64,
-                      block_d: int = 64) -> torch.Tensor:
+def unpack_seq_triton(
+    packed_tensor: torch.Tensor,
+    lengths: torch.Tensor,
+    block_t: int = 64,
+    block_d: int = 64,
+) -> torch.Tensor:
     """
     Unpack a packed decode query tensor back to the original format.
     Efficient Triton implementation.
-    
+
     Args:
         packed_tensor: [B, Lmax, ...] - packed tensor from pack_seq_triton
         lengths: [B] - sequence lengths for each batch
         block_t: block size for time dimension
         block_d: block size for feature dimension
-        
+
     Returns:
         unpacked_tensor: [N, ...] where N = sum(lengths)
     """
@@ -321,25 +344,25 @@ def unpack_seq_triton(packed_tensor: torch.Tensor,
     # Calculate total number of elements
     N = int(lengths.sum().item())
 
-    out = torch.empty((N, D),
-                      device=packed_tensor.device,
-                      dtype=packed_tensor.dtype)
+    out = torch.empty((N, D), device=packed_tensor.device, dtype=packed_tensor.dtype)
 
     grid = (B, triton.cdiv(Lmax, block_t), triton.cdiv(D, block_d))
-    _unpack_seq_triton_kernel[grid](packed_reshaped,
-                                    out,
-                                    lengths.int(),
-                                    B,
-                                    Lmax,
-                                    D,
-                                    BLOCK_T=block_t,
-                                    BLOCK_D=block_d,
-                                    num_warps=4,
-                                    num_stages=2)
+    _unpack_seq_triton_kernel[grid](
+        packed_reshaped,
+        out,
+        lengths.int(),
+        B,
+        Lmax,
+        D,
+        BLOCK_T=block_t,
+        BLOCK_D=block_d,
+        num_warps=4,
+        num_stages=2,
+    )
 
     # Reshape output back to original dimensions (except first dimension)
     if len(original_shape) > 3:
-        output_shape = (N, ) + original_shape[2:]
+        output_shape = (N,) + original_shape[2:]
         out = out.reshape(output_shape)
 
     return out
diff --git a/vllm/attention/ops/flashmla.py b/vllm/attention/ops/flashmla.py
index 9654f9f6775a..20eaeb6bd405 100644
--- a/vllm/attention/ops/flashmla.py
+++ b/vllm/attention/ops/flashmla.py
@@ -13,6 +13,7 @@
 if current_platform.is_cuda():
     try:
         import vllm._flashmla_C  # noqa: F401
+
         _flashmla_C_AVAILABLE = True
     except ImportError:
         _flashmla_C_AVAILABLE = False
@@ -22,6 +23,7 @@
 if current_platform.is_cuda():
     try:
         import vllm._flashmla_extension_C  # noqa: F401
+
         _flashmla_extension_C_AVAILABLE = True
     except ImportError:
         _flashmla_extension_C_AVAILABLE = False
@@ -38,42 +40,51 @@ def is_flashmla_supported() -> Tuple[bool, Optional[str]]:
     if current_platform.get_device_capability()[0] != 9:
         return False, "FlashMLA is only supported on Hopper devices."
     if not _flashmla_C_AVAILABLE:
-        return False, "vllm._flashmla_C is not available, likely was not "\
-            "compiled due to insufficient nvcc version or a supported arch "\
-            "(only sm90a currently) was not in the list of target arches to "\
-            "compile for."
+        return (
+            False,
+            "vllm._flashmla_C is not available, likely was not "
+            "compiled due to insufficient nvcc version or a supported arch "
+            "(only sm90a currently) was not in the list of target arches to "
+            "compile for.",
+        )
     return True, None
 
 
 def get_mla_metadata(
-        cache_seqlens: torch.Tensor,
-        num_q_tokens_per_head_k: int,
-        num_heads_k: int,
-        num_heads_q: Optional[int] = None,
-        is_fp8_kvcache: bool = False,
-        topk: Optional[int] = None) -> Tuple[torch.Tensor, torch.Tensor]:
+    cache_seqlens: torch.Tensor,
+    num_q_tokens_per_head_k: int,
+    num_heads_k: int,
+    num_heads_q: Optional[int] = None,
+    is_fp8_kvcache: bool = False,
+    topk: Optional[int] = None,
+) -> Tuple[torch.Tensor, torch.Tensor]:
     """
     Arguments:
     - cache_seqlens: (batch_size), dtype torch.int32.
-    - num_q_tokens_per_head_k: 
+    - num_q_tokens_per_head_k:
             Equals to num_q_tokens_per_q_seq * num_heads_q // num_heads_k.
     - num_heads_k: The number of k heads.
-    - num_heads_q: 
-            The number of q heads. 
+    - num_heads_q:
+            The number of q heads.
             This argument is optional when sparse attention is not enabled
     - is_fp8_kvcache: Whether the k_cache and v_cache are in fp8 format.
-    - topk: If not None, sparse attention will be enabled, 
-            and only tokens in the `indices` array 
+    - topk: If not None, sparse attention will be enabled,
+            and only tokens in the `indices` array
             passed to `flash_mla_with_kvcache_sm90` will be attended to.
 
     Returns:
-    - tile_scheduler_metadata: 
+    - tile_scheduler_metadata:
             (num_sm_parts, TileSchedulerMetaDataSize), dtype torch.int32.
     - num_splits: (batch_size + 1), dtype torch.int32.
     """
     return torch.ops._flashmla_C.get_mla_decoding_metadata(
-        cache_seqlens, num_q_tokens_per_head_k, num_heads_k, num_heads_q,
-        is_fp8_kvcache, topk)
+        cache_seqlens,
+        num_q_tokens_per_head_k,
+        num_heads_k,
+        num_heads_q,
+        is_fp8_kvcache,
+        topk,
+    )
 
 
 def flash_mla_with_kvcache(
@@ -98,26 +109,26 @@ def flash_mla_with_kvcache(
     - block_table: (batch_size, max_num_blocks_per_seq), torch.int32.
     - cache_seqlens: (batch_size), torch.int32.
     - head_dim_v: Head dimension of v.
-    - tile_scheduler_metadata: 
-        (num_sm_parts, TileSchedulerMetaDataSize), torch.int32, 
+    - tile_scheduler_metadata:
+        (num_sm_parts, TileSchedulerMetaDataSize), torch.int32,
         returned by get_mla_metadata.
-    - num_splits: 
+    - num_splits:
         (batch_size + 1), torch.int32, returned by get_mla_metadata.
-    - softmax_scale: float. 
-        The scale of QK^T before applying softmax. 
+    - softmax_scale: float.
+        The scale of QK^T before applying softmax.
         Default to 1 / sqrt(head_dim).
     - causal: bool. Whether to apply causal attention mask.
-    - descale_q: (batch_size), 
+    - descale_q: (batch_size),
         torch.float32. Descaling factors for Q, used for fp8 quantization.
-    - descale_k: (batch_size), 
+    - descale_k: (batch_size),
         torch.float32. Descaling factors for K, used for fp8 quantization.
-    - is_fp8_kvcache: bool. 
-        Whether the k_cache and v_cache are in fp8 format. 
+    - is_fp8_kvcache: bool.
+        Whether the k_cache and v_cache are in fp8 format.
         For the format of FP8 KV cache, please refer to README.md
-    - indices: (batch_size, seq_len_q, topk), torch.int32. 
-        If not None, sparse attention will be enabled, 
-        and only tokens in the `indices` array will be attended to. 
-        Invalid indices should be set to -1 or numbers >= total_seq_len_kv. 
+    - indices: (batch_size, seq_len_q, topk), torch.int32.
+        If not None, sparse attention will be enabled,
+        and only tokens in the `indices` array will be attended to.
+        Invalid indices should be set to -1 or numbers >= total_seq_len_kv.
         For details about how to set up `indices`, please refer to README.md.
 
     Returns:
@@ -125,26 +136,44 @@ def flash_mla_with_kvcache(
     - softmax_lse: (batch_size, num_heads_q, seq_len_q), torch.float32.
     """
     if softmax_scale is None:
-        softmax_scale = q.shape[-1]**(-0.5)
+        softmax_scale = q.shape[-1] ** (-0.5)
     if indices is not None:
         # NOTE (zyongye): sparse attention is also causal
         # since it only attend to the tokens before
         # but here `causal` should not be specified
-        assert not causal, \
-            "causal must be `false` if sparse attention is enabled."
-    assert (descale_q is None) == (
-        descale_k is None
-    ), "descale_q and descale_k should be both None or both not None"
+        assert not causal, "causal must be `false` if sparse attention is enabled."
+    assert (descale_q is None) == (descale_k is None), (
+        "descale_q and descale_k should be both None or both not None"
+    )
 
     if indices is None and q.element_size() == 1:
         out, softmax_lse = torch.ops._flashmla_extension_C.fwd_kvcache_mla_fp8(
-            q, k_cache, head_dim_v, cache_seqlens, block_table, softmax_scale,
-            causal, tile_scheduler_metadata, num_splits, descale_q, descale_k)
+            q,
+            k_cache,
+            head_dim_v,
+            cache_seqlens,
+            block_table,
+            softmax_scale,
+            causal,
+            tile_scheduler_metadata,
+            num_splits,
+            descale_q,
+            descale_k,
+        )
     else:
         out, softmax_lse = torch.ops._flashmla_C.fwd_kvcache_mla(
-            q, k_cache, head_dim_v, cache_seqlens, block_table, softmax_scale,
-            causal, tile_scheduler_metadata, num_splits, is_fp8_kvcache,
-            indices)
+            q,
+            k_cache,
+            head_dim_v,
+            cache_seqlens,
+            block_table,
+            softmax_scale,
+            causal,
+            tile_scheduler_metadata,
+            num_splits,
+            is_fp8_kvcache,
+            indices,
+        )
     return out, softmax_lse
 
 
@@ -161,21 +190,20 @@ def flash_mla_sparse_prefill(
     Args:
     - q: [s_q, h_q, d_qk], bfloat16
     - kv: [s_kv, h_kv, d_qk], bfloat16
-    - indices: [s_q, h_kv, topk], int32. 
+    - indices: [s_q, h_kv, topk], int32.
         Invalid indices should be set to -1 or numbers >= s_kv
     - sm_scale: float
     - d_v: The dimension of value vectors. Can only be 512
 
     Returns:
     - (output, max_logits, lse)
-        About the definition of output, 
+        About the definition of output,
         max_logits and lse, please refer to README.md
     - output: [s_q, h_q, d_v], bfloat16
     - max_logits:  [s_q, h_q], float
     - lse: [s_q, h_q], float, 2-based log-sum-exp
     """
-    results = torch.ops._flashmla_C.sparse_prefill_fwd(q, kv, indices,
-                                                       sm_scale, d_v)
+    results = torch.ops._flashmla_C.sparse_prefill_fwd(q, kv, indices, sm_scale, d_v)
     return results
 
 
diff --git a/vllm/attention/ops/merge_attn_states.py b/vllm/attention/ops/merge_attn_states.py
index 5cb1a47394cf..79800eb40766 100644
--- a/vllm/attention/ops/merge_attn_states.py
+++ b/vllm/attention/ops/merge_attn_states.py
@@ -15,7 +15,6 @@ def merge_attn_states(
     suffix_lse: torch.Tensor,
     output_lse: Optional[torch.Tensor] = None,
 ) -> None:
-
     # NOTE(DefTruth): Currently, custom merge_attn_states CUDA kernel
     # is not support for FP8 dtype, fallback to use Triton kernel.
     def supported_dtypes(o: torch.Tensor) -> bool:
@@ -31,13 +30,19 @@ def supported_headdim(o: torch.Tensor) -> bool:
             return headdim % 4 == 0
         return headdim % 8 == 0
 
-    if (current_platform.is_cuda() and supported_dtypes(output)
-            and supported_headdim(output)):
+    if (
+        current_platform.is_cuda()
+        and supported_dtypes(output)
+        and supported_headdim(output)
+    ):
         from vllm._custom_ops import merge_attn_states
-        return merge_attn_states(output, prefix_output, prefix_lse,
-                                 suffix_output, suffix_lse, output_lse)
+
+        return merge_attn_states(
+            output, prefix_output, prefix_lse, suffix_output, suffix_lse, output_lse
+        )
     else:
-        from vllm.attention.ops.triton_merge_attn_states import (
-            merge_attn_states)
-        return merge_attn_states(output, prefix_output, prefix_lse,
-                                 suffix_output, suffix_lse, output_lse)
+        from vllm.attention.ops.triton_merge_attn_states import merge_attn_states
+
+        return merge_attn_states(
+            output, prefix_output, prefix_lse, suffix_output, suffix_lse, output_lse
+        )
diff --git a/vllm/attention/ops/paged_attn.py b/vllm/attention/ops/paged_attn.py
index 539b57e41de7..cdf0c929cea9 100644
--- a/vllm/attention/ops/paged_attn.py
+++ b/vllm/attention/ops/paged_attn.py
@@ -24,6 +24,7 @@
 @dataclass
 class PagedAttentionMetadata:
     """Metadata for PagedAttention."""
+
     # (batch_size,). The length of sequences (entire tokens seen so far) per
     # sequence.
     seq_lens_tensor: Optional[torch.Tensor]
@@ -39,7 +40,6 @@ class PagedAttentionMetadata:
 
 
 class PagedAttention:
-
     @staticmethod
     def get_supported_head_sizes() -> List[int]:
         return [32, 64, 80, 96, 112, 120, 128, 192, 256]
@@ -64,8 +64,7 @@ def split_kv_cache(
         num_blocks = kv_cache.shape[1]
 
         key_cache = kv_cache[0]
-        key_cache = key_cache.view(num_blocks, num_kv_heads, head_size // x,
-                                   -1, x)
+        key_cache = key_cache.view(num_blocks, num_kv_heads, head_size // x, -1, x)
         value_cache = kv_cache[1]
         value_cache = value_cache.view(num_blocks, num_kv_heads, head_size, -1)
         return key_cache, value_cache
@@ -115,16 +114,17 @@ def forward_decode(
         if blocksparse_vert_stride is not None and blocksparse_vert_stride > 1:
             # use blocksparse paged attention
             block_size = value_cache.size(-1)
-            assert (blocksparse_block_size > 0 and
-                    blocksparse_block_size % block_size == 0), \
-                (f"{blocksparse_block_size=} needs to be a multiple of"
-                 f"{block_size=} used in block_tables.")
+            assert (
+                blocksparse_block_size > 0 and blocksparse_block_size % block_size == 0
+            ), (
+                f"{blocksparse_block_size=} needs to be a multiple of"
+                f"{block_size=} used in block_tables."
+            )
 
         output = torch.empty_like(query)
         block_size = value_cache.shape[3]
         num_seqs, num_heads, head_size = query.shape
-        max_num_partitions = ((max_seq_len + _PARTITION_SIZE - 1) //
-                              _PARTITION_SIZE)
+        max_num_partitions = (max_seq_len + _PARTITION_SIZE - 1) // _PARTITION_SIZE
         # NOTE(woosuk): We use a simple heuristic to decide whether to use
         # PagedAttention V1 or V2. If the number of partitions is 1, we use
         # V1 to avoid the overhead of reduction. Also, if the number of
@@ -132,8 +132,9 @@ def forward_decode(
         # to parallelize.
         # TODO(woosuk): Tune this heuristic.
         # For context len > 8192, use V2 kernel to avoid shared memory shortage.
-        use_v1 = (max_seq_len <= 8192
-                  and (max_num_partitions == 1 or num_seqs * num_heads > 512))
+        use_v1 = max_seq_len <= 8192 and (
+            max_num_partitions == 1 or num_seqs * num_heads > 512
+        )
 
         if use_v1:
             # Run PagedAttention V1.
diff --git a/vllm/attention/ops/pallas_kv_cache_update.py b/vllm/attention/ops/pallas_kv_cache_update.py
index d75983bd407d..357e3d609ae2 100644
--- a/vllm/attention/ops/pallas_kv_cache_update.py
+++ b/vllm/attention/ops/pallas_kv_cache_update.py
@@ -33,10 +33,12 @@ def _kv_cache_update_kernel(
     # Copy from new_kv_hbm_ref to scratch
     for i in range(num_slices_per_block):
         offset_i = i + block_idx * num_slices_per_block
-        new_kv_start = jax.lax.select(offset_i < num_slices_ref[0],
-                                      slices_ref[1, offset_i], 0)
-        length = jax.lax.select(offset_i < num_slices_ref[0],
-                                slices_ref[2, offset_i], 0)
+        new_kv_start = jax.lax.select(
+            offset_i < num_slices_ref[0], slices_ref[1, offset_i], 0
+        )
+        length = jax.lax.select(
+            offset_i < num_slices_ref[0], slices_ref[2, offset_i], 0
+        )
         async_copy = pltpu.make_async_copy(
             new_kv_hbm_ref.at[pl.ds(new_kv_start, length), ...],
             scratch.at[i, pl.ds(0, length), ...],
@@ -52,10 +54,12 @@ def _kv_cache_update_kernel(
     async_copies.clear()
     for i in range(num_slices_per_block):
         offset_i = i + block_idx * num_slices_per_block
-        kv_cache_start = jax.lax.select(offset_i < num_slices_ref[0],
-                                        slices_ref[0, offset_i], 0)
-        length = jax.lax.select(offset_i < num_slices_ref[0],
-                                slices_ref[2, offset_i], 0)
+        kv_cache_start = jax.lax.select(
+            offset_i < num_slices_ref[0], slices_ref[0, offset_i], 0
+        )
+        length = jax.lax.select(
+            offset_i < num_slices_ref[0], slices_ref[2, offset_i], 0
+        )
         async_copy = pltpu.make_async_copy(
             scratch.at[i, pl.ds(0, length), ...],
             kv_cache_hbm_ref.at[pl.ds(kv_cache_start, length), ...],
@@ -73,10 +77,8 @@ def _kv_cache_update_kernel(
 )
 def kv_cache_update(
     new_kv: jax.Array,  # [total_num_token, num_combined_kv_heads, head_dim]
-    slices: jax.
-    Array,  # [3, slices], list of (kv_cache_start, new_kv_start, slice_len)
-    kv_cache: jax.
-    Array,  # [total_num_pages * page_size, num_combined_kv_heads, head_dim]
+    slices: jax.Array,  # [3, slices], list of (kv_cache_start, new_kv_start, slice_len)
+    kv_cache: jax.Array,  # [total_num_pages * page_size, num_combined_kv_heads, head_dim]
     num_kv_update_slices: jax.Array,  # [1]
     *,
     page_size: int = 32,
@@ -114,7 +116,7 @@ def kv_cache_update(
             num_scalar_prefetch=len(scalar_prefetches),
             in_specs=in_specs,
             out_specs=out_specs,
-            grid=(cdiv(num_kv_update_slices[0], num_slices_per_block), ),
+            grid=(cdiv(num_kv_update_slices[0], num_slices_per_block),),
             scratch_shapes=scratch_shapes,
         ),
         out_shape=out_shape,
diff --git a/vllm/attention/ops/prefix_prefill.py b/vllm/attention/ops/prefix_prefill.py
index 7e5c2b6c62e9..addf1d9dea73 100644
--- a/vllm/attention/ops/prefix_prefill.py
+++ b/vllm/attention/ops/prefix_prefill.py
@@ -34,62 +34,63 @@
 #     key=["BLOCK_SIZE", "MAX_Q_LEN", "MAX_CTX_LEN"]
 # )
 @triton.jit
-def _fwd_kernel(Q,
-                K,
-                V,
-                K_cache,
-                V_cache,
-                sink_ptr,
-                B_Loc,
-                sm_scale,
-                k_scale,
-                v_scale,
-                out_scale_inv,
-                B_Start_Loc,
-                B_Seqlen,
-                x: tl.constexpr,
-                Out,
-                stride_b_loc_b,
-                stride_b_loc_s,
-                stride_qbs,
-                stride_qh,
-                stride_qd,
-                stride_kbs,
-                stride_kh,
-                stride_kd,
-                stride_vbs,
-                stride_vh,
-                stride_vd,
-                stride_obs,
-                stride_oh,
-                stride_od,
-                stride_k_cache_bs,
-                stride_k_cache_h,
-                stride_k_cache_d,
-                stride_k_cache_bl: tl.constexpr,
-                stride_k_cache_x,
-                stride_v_cache_bs,
-                stride_v_cache_h,
-                stride_v_cache_d,
-                stride_v_cache_bl,
-                num_queries_per_kv: tl.constexpr,
-                IN_PRECISION: tl.constexpr,
-                BLOCK_M: tl.constexpr,
-                BLOCK_DMODEL: tl.constexpr,
-                BLOCK_DMODEL_PADDED: tl.constexpr,
-                BLOCK_SIZE: tl.constexpr,
-                BLOCK_N: tl.constexpr,
-                SLIDING_WINDOW: tl.constexpr,
-                num_unroll_cache: tl.constexpr,
-                num_unroll_request: tl.constexpr,
-                SKIP_DECODE: tl.constexpr,
-                USE_SINKS: tl.constexpr,
-                USE_FP8: tl.constexpr,
-                MAX_Q_LEN: tl.constexpr = 0,
-                MAX_CTX_LEN: tl.constexpr = 0,
-                FP8_MIN: tl.constexpr = float8_info.min,
-                FP8_MAX: tl.constexpr = float8_info.max):
-
+def _fwd_kernel(
+    Q,
+    K,
+    V,
+    K_cache,
+    V_cache,
+    sink_ptr,
+    B_Loc,
+    sm_scale,
+    k_scale,
+    v_scale,
+    out_scale_inv,
+    B_Start_Loc,
+    B_Seqlen,
+    x: tl.constexpr,
+    Out,
+    stride_b_loc_b,
+    stride_b_loc_s,
+    stride_qbs,
+    stride_qh,
+    stride_qd,
+    stride_kbs,
+    stride_kh,
+    stride_kd,
+    stride_vbs,
+    stride_vh,
+    stride_vd,
+    stride_obs,
+    stride_oh,
+    stride_od,
+    stride_k_cache_bs,
+    stride_k_cache_h,
+    stride_k_cache_d,
+    stride_k_cache_bl: tl.constexpr,
+    stride_k_cache_x,
+    stride_v_cache_bs,
+    stride_v_cache_h,
+    stride_v_cache_d,
+    stride_v_cache_bl,
+    num_queries_per_kv: tl.constexpr,
+    IN_PRECISION: tl.constexpr,
+    BLOCK_M: tl.constexpr,
+    BLOCK_DMODEL: tl.constexpr,
+    BLOCK_DMODEL_PADDED: tl.constexpr,
+    BLOCK_SIZE: tl.constexpr,
+    BLOCK_N: tl.constexpr,
+    SLIDING_WINDOW: tl.constexpr,
+    num_unroll_cache: tl.constexpr,
+    num_unroll_request: tl.constexpr,
+    SKIP_DECODE: tl.constexpr,
+    USE_SINKS: tl.constexpr,
+    USE_FP8: tl.constexpr,
+    MAX_Q_LEN: tl.constexpr = 0,
+    MAX_CTX_LEN: tl.constexpr = 0,
+    FP8_MIN: tl.constexpr = float8_info.min,
+    FP8_MAX: tl.constexpr = float8_info.max,
+):
     cur_batch = tl.program_id(0)
     cur_head = tl.program_id(1)
     start_m = tl.program_id(2)
@@ -99,8 +100,7 @@ def _fwd_kernel(Q,
     cur_batch_seq_len = tl.load(B_Seqlen + cur_batch)
     cur_batch_in_all_start_index = tl.load(B_Start_Loc + cur_batch)
     cur_batch_in_all_stop_index = tl.load(B_Start_Loc + cur_batch + 1)
-    cur_batch_query_len = (cur_batch_in_all_stop_index -
-                           cur_batch_in_all_start_index)
+    cur_batch_query_len = cur_batch_in_all_stop_index - cur_batch_in_all_start_index
     cur_batch_ctx_len = cur_batch_seq_len - cur_batch_query_len
 
     if SKIP_DECODE and cur_batch_query_len == 1:
@@ -120,17 +120,21 @@ def _fwd_kernel(Q,
     # [M]; starts at current position in query
     offs_m = start_m * BLOCK_M + tl.arange(0, BLOCK_M)
     # [M,D]
-    off_q = ((cur_batch_in_all_start_index + offs_m[:, None]) * stride_qbs +
-             cur_head * stride_qh + offs_d[None, :] * stride_qd)
-
-    dim_mask = tl.where(
-        tl.arange(0, BLOCK_DMODEL_PADDED) < BLOCK_DMODEL, 1,
-        0).to(tl.int1)  # [D]
-
-    q = tl.load(Q + off_q,
-                mask=dim_mask[None, :] &
-                (offs_m[:, None] < cur_batch_query_len),
-                other=0.0)  # [M,D]
+    off_q = (
+        (cur_batch_in_all_start_index + offs_m[:, None]) * stride_qbs
+        + cur_head * stride_qh
+        + offs_d[None, :] * stride_qd
+    )
+
+    dim_mask = tl.where(tl.arange(0, BLOCK_DMODEL_PADDED) < BLOCK_DMODEL, 1, 0).to(
+        tl.int1
+    )  # [D]
+
+    q = tl.load(
+        Q + off_q,
+        mask=dim_mask[None, :] & (offs_m[:, None] < cur_batch_query_len),
+        other=0.0,
+    )  # [M,D]
 
     # initialize pointer to m and l
     if not USE_SINKS:
@@ -146,32 +150,43 @@ def _fwd_kernel(Q,
     acc = tl.zeros([BLOCK_M, BLOCK_DMODEL_PADDED], dtype=tl.float32)  # [M,D]
 
     # compute query against context (no causal mask here)
-    for start_n in tl.range(0, cur_batch_ctx_len, BLOCK_SIZE, \
-                            loop_unroll_factor=num_unroll_cache):
+    for start_n in tl.range(
+        0, cur_batch_ctx_len, BLOCK_SIZE, loop_unroll_factor=num_unroll_cache
+    ):
         start_n = tl.multiple_of(start_n, BLOCK_SIZE)
         # -- compute qk ----
-        bn = tl.load(B_Loc + cur_batch * stride_b_loc_b +
-                     (start_n // BLOCK_SIZE) * stride_b_loc_s).to(tl.int64)
+        bn = tl.load(
+            B_Loc
+            + cur_batch * stride_b_loc_b
+            + (start_n // BLOCK_SIZE) * stride_b_loc_s
+        ).to(tl.int64)
         # [D,BLOCK_SIZE]
         off_k = (
-            bn[None, :] * stride_k_cache_bs + cur_kv_head * stride_k_cache_h +
-            (offs_d[:, None] // x) * stride_k_cache_d +
-            ((start_n + offs_bs_n[None, :]) % BLOCK_SIZE) * stride_k_cache_bl +
-            (offs_d[:, None] % x) * stride_k_cache_x)
+            bn[None, :] * stride_k_cache_bs
+            + cur_kv_head * stride_k_cache_h
+            + (offs_d[:, None] // x) * stride_k_cache_d
+            + ((start_n + offs_bs_n[None, :]) % BLOCK_SIZE) * stride_k_cache_bl
+            + (offs_d[:, None] % x) * stride_k_cache_x
+        )
 
         # [BLOCK_SIZE,D]
-        off_v = (bn[:, None] * stride_v_cache_bs +
-                 cur_kv_head * stride_v_cache_h +
-                 offs_d[None, :] * stride_v_cache_d +
-                 offs_bs_n[:, None] * stride_v_cache_bl)
+        off_v = (
+            bn[:, None] * stride_v_cache_bs
+            + cur_kv_head * stride_v_cache_h
+            + offs_d[None, :] * stride_v_cache_d
+            + offs_bs_n[:, None] * stride_v_cache_bl
+        )
 
-        if start_n + BLOCK_SIZE > cur_batch_ctx_len or \
-            BLOCK_DMODEL != BLOCK_DMODEL_PADDED:
+        if (
+            start_n + BLOCK_SIZE > cur_batch_ctx_len
+            or BLOCK_DMODEL != BLOCK_DMODEL_PADDED
+        ):
             k_load = tl.load(
                 K_cache + off_k,
-                mask=dim_mask[:, None] &
-                ((start_n + offs_bs_n[None, :]) < cur_batch_ctx_len),
-                other=0.0)  # [D,N]
+                mask=dim_mask[:, None]
+                & ((start_n + offs_bs_n[None, :]) < cur_batch_ctx_len),
+                other=0.0,
+            )  # [D,N]
         else:
             k_load = tl.load(K_cache + off_k)
 
@@ -182,8 +197,9 @@ def _fwd_kernel(Q,
 
         qk = tl.zeros([BLOCK_M, BLOCK_SIZE], dtype=tl.float32)  # [M,N]
         qk = tl.dot(q, k, acc=qk, input_precision=IN_PRECISION)
-        qk = tl.where((start_n + offs_bs_n[None, :]) < cur_batch_ctx_len, qk,
-                      float("-inf"))
+        qk = tl.where(
+            (start_n + offs_bs_n[None, :]) < cur_batch_ctx_len, qk, float("-inf")
+        )
         qk *= sm_scale
         if SLIDING_WINDOW > 0:
             # (cur_batch_ctx_len + offs_m[:, None]) are the positions of
@@ -197,9 +213,12 @@ def _fwd_kernel(Q,
             # sliding window may lead to the entire row being masked.
             # This then makes m_ij contain -inf, which causes NaNs in
             # exp().
-            qk = tl.where((cur_batch_ctx_len + offs_m[:, None]) -
-                          (start_n + offs_bs_n[None, :]) < SLIDING_WINDOW, qk,
-                          -10000)
+            qk = tl.where(
+                (cur_batch_ctx_len + offs_m[:, None]) - (start_n + offs_bs_n[None, :])
+                < SLIDING_WINDOW,
+                qk,
+                -10000,
+            )
 
         # compute running maximum
         m_ij = tl.maximum(m_i, tl.max(qk, axis=1))
@@ -209,13 +228,16 @@ def _fwd_kernel(Q,
         acc = acc * alpha[:, None]
 
         # update acc
-        if start_n + BLOCK_SIZE > cur_batch_ctx_len or \
-            BLOCK_DMODEL != BLOCK_DMODEL_PADDED:
+        if (
+            start_n + BLOCK_SIZE > cur_batch_ctx_len
+            or BLOCK_DMODEL != BLOCK_DMODEL_PADDED
+        ):
             v_load = tl.load(
                 V_cache + off_v,
-                mask=dim_mask[None, :] &
-                ((start_n + offs_bs_n[:, None]) < cur_batch_ctx_len),
-                other=0.0)  # [N,D]
+                mask=dim_mask[None, :]
+                & ((start_n + offs_bs_n[:, None]) < cur_batch_ctx_len),
+                other=0.0,
+            )  # [N,D]
         else:
             v_load = tl.load(V_cache + off_v)
 
@@ -230,10 +252,16 @@ def _fwd_kernel(Q,
         l_i = l_i * alpha + l_ij
         m_i = m_ij
 
-    off_k = (offs_n[None, :] * stride_kbs + cur_kv_head * stride_kh +
-             offs_d[:, None] * stride_kd)
-    off_v = (offs_n[:, None] * stride_vbs + cur_kv_head * stride_vh +
-             offs_d[None, :] * stride_vd)
+    off_k = (
+        offs_n[None, :] * stride_kbs
+        + cur_kv_head * stride_kh
+        + offs_d[:, None] * stride_kd
+    )
+    off_v = (
+        offs_n[:, None] * stride_vbs
+        + cur_kv_head * stride_vh
+        + offs_d[None, :] * stride_vd
+    )
     k_ptrs = K + off_k
     v_ptrs = V + off_v
 
@@ -241,27 +269,32 @@ def _fwd_kernel(Q,
     block_mask = tl.where(block_start_loc < cur_batch_query_len, 1, 0)
 
     # compute query against itself (with causal mask)
-    for start_n in tl.range(0, \
-                        block_mask * (start_m + 1) * BLOCK_M, BLOCK_N, \
-                        loop_unroll_factor=num_unroll_request):
+    for start_n in tl.range(
+        0,
+        block_mask * (start_m + 1) * BLOCK_M,
+        BLOCK_N,
+        loop_unroll_factor=num_unroll_request,
+    ):
         start_n = tl.multiple_of(start_n, BLOCK_N)
         # -- compute qk ----
-        k = tl.load(k_ptrs +
-                    (cur_batch_in_all_start_index + start_n) * stride_kbs,
-                    mask=dim_mask[:, None] &
-                    ((start_n + offs_n[None, :]) < cur_batch_query_len),
-                    other=0.0)
+        k = tl.load(
+            k_ptrs + (cur_batch_in_all_start_index + start_n) * stride_kbs,
+            mask=dim_mask[:, None]
+            & ((start_n + offs_n[None, :]) < cur_batch_query_len),
+            other=0.0,
+        )
 
         qk = tl.zeros([BLOCK_M, BLOCK_N], dtype=tl.float32)
         qk = tl.dot(q, k, acc=qk, input_precision=IN_PRECISION)
         qk *= sm_scale
         # apply causal mask
-        qk = tl.where(offs_m[:, None] >= (start_n + offs_n[None, :]), qk,
-                      float("-inf"))
+        qk = tl.where(offs_m[:, None] >= (start_n + offs_n[None, :]), qk, float("-inf"))
         if SLIDING_WINDOW > 0:
             qk = tl.where(
                 offs_m[:, None] - (start_n + offs_n[None, :]) < SLIDING_WINDOW,
-                qk, -10000)
+                qk,
+                -10000,
+            )
 
         # compute running maximum
         m_ij = tl.maximum(m_i, tl.max(qk, axis=1))
@@ -271,11 +304,12 @@ def _fwd_kernel(Q,
         acc = acc * alpha[:, None]
 
         # update acc
-        v = tl.load(v_ptrs +
-                    (cur_batch_in_all_start_index + start_n) * stride_vbs,
-                    mask=dim_mask[None, :] &
-                    ((start_n + offs_n[:, None]) < cur_batch_query_len),
-                    other=0.0)
+        v = tl.load(
+            v_ptrs + (cur_batch_in_all_start_index + start_n) * stride_vbs,
+            mask=dim_mask[None, :]
+            & ((start_n + offs_n[:, None]) < cur_batch_query_len),
+            other=0.0,
+        )
         p = p.to(v.dtype)
 
         acc = tl.dot(p, v, acc=acc, input_precision=IN_PRECISION)
@@ -286,15 +320,18 @@ def _fwd_kernel(Q,
     acc = acc / l_i[:, None]
 
     # initialize pointers to output
-    off_o = ((cur_batch_in_all_start_index + offs_m[:, None]) * stride_obs +
-             cur_head * stride_oh + offs_d[None, :] * stride_od)
+    off_o = (
+        (cur_batch_in_all_start_index + offs_m[:, None]) * stride_obs
+        + cur_head * stride_oh
+        + offs_d[None, :] * stride_od
+    )
     out_ptrs = Out + off_o
     if USE_FP8:
         acc = acc * tl.load(out_scale_inv)
         acc = tl.clamp(acc, FP8_MIN, FP8_MAX)
-    tl.store(out_ptrs,
-             acc,
-             mask=dim_mask[None, :] & (offs_m[:, None] < cur_batch_query_len))
+    tl.store(
+        out_ptrs, acc, mask=dim_mask[None, :] & (offs_m[:, None] < cur_batch_query_len)
+    )
     return
 
 
@@ -357,12 +394,17 @@ def _fwd_kernel_flash_attn_v2(
     offs_n = tl.arange(0, BLOCK_N)
     offs_d = tl.arange(0, BLOCK_DMODEL)
     offs_m = start_m * BLOCK_M + tl.arange(0, BLOCK_M)
-    off_q = ((cur_batch_in_all_start_index + offs_m[:, None]) * stride_qbs +
-             cur_head * stride_qh + offs_d[None, :] * stride_qd)
-
-    q = tl.load(Q + off_q,
-                mask=offs_m[:, None] < cur_batch_seq_len - cur_batch_ctx_len,
-                other=0.0)
+    off_q = (
+        (cur_batch_in_all_start_index + offs_m[:, None]) * stride_qbs
+        + cur_head * stride_qh
+        + offs_d[None, :] * stride_qd
+    )
+
+    q = tl.load(
+        Q + off_q,
+        mask=offs_m[:, None] < cur_batch_seq_len - cur_batch_ctx_len,
+        other=0.0,
+    )
 
     # # initialize pointer to m and l
     m_i = tl.zeros([BLOCK_M], dtype=tl.float32) - float("inf")
@@ -372,26 +414,36 @@ def _fwd_kernel_flash_attn_v2(
     for start_n in range(0, cur_batch_ctx_len, BLOCK_N):
         start_n = tl.multiple_of(start_n, BLOCK_N)
         # -- compute qk ----
-        bn = tl.load(B_Loc + cur_batch * stride_b_loc_b +
-                     ((start_n + offs_n) // block_size) * stride_b_loc_s,
-                     mask=(start_n + offs_n) < cur_batch_ctx_len,
-                     other=0).to(tl.int64)
+        bn = tl.load(
+            B_Loc
+            + cur_batch * stride_b_loc_b
+            + ((start_n + offs_n) // block_size) * stride_b_loc_s,
+            mask=(start_n + offs_n) < cur_batch_ctx_len,
+            other=0,
+        ).to(tl.int64)
         off_k = (
-            bn[None, :] * stride_k_cache_bs + cur_kv_head * stride_k_cache_h +
-            (offs_d[:, None] // x) * stride_k_cache_d +
-            ((start_n + offs_n[None, :]) % block_size) * stride_k_cache_bl +
-            (offs_d[:, None] % x) * stride_k_cache_x)
-        off_v = (bn[:, None] * stride_v_cache_bs +
-                 cur_kv_head * stride_v_cache_h +
-                 offs_d[None, :] * stride_v_cache_d +
-                 (start_n + offs_n[:, None]) % block_size * stride_v_cache_bl)
-        k = tl.load(K_cache + off_k,
-                    mask=(start_n + offs_n[None, :]) < cur_batch_ctx_len,
-                    other=0.0)
+            bn[None, :] * stride_k_cache_bs
+            + cur_kv_head * stride_k_cache_h
+            + (offs_d[:, None] // x) * stride_k_cache_d
+            + ((start_n + offs_n[None, :]) % block_size) * stride_k_cache_bl
+            + (offs_d[:, None] % x) * stride_k_cache_x
+        )
+        off_v = (
+            bn[:, None] * stride_v_cache_bs
+            + cur_kv_head * stride_v_cache_h
+            + offs_d[None, :] * stride_v_cache_d
+            + (start_n + offs_n[:, None]) % block_size * stride_v_cache_bl
+        )
+        k = tl.load(
+            K_cache + off_k,
+            mask=(start_n + offs_n[None, :]) < cur_batch_ctx_len,
+            other=0.0,
+        )
         qk = tl.zeros([BLOCK_M, BLOCK_N], dtype=tl.float32)
         qk += tl.dot(q, k)
-        qk = tl.where((start_n + offs_n[None, :]) < cur_batch_ctx_len, qk,
-                      float("-inf"))
+        qk = tl.where(
+            (start_n + offs_n[None, :]) < cur_batch_ctx_len, qk, float("-inf")
+        )
         qk *= sm_scale
 
         # -- compute m_ij, p, l_ij
@@ -410,9 +462,11 @@ def _fwd_kernel_flash_attn_v2(
         # acc_scale = l_i / l_i_new * alpha
         acc = acc * acc_scale[:, None]
         # update acc
-        v = tl.load(V_cache + off_v,
-                    mask=(start_n + offs_n[:, None]) < cur_batch_ctx_len,
-                    other=0.0)
+        v = tl.load(
+            V_cache + off_v,
+            mask=(start_n + offs_n[:, None]) < cur_batch_ctx_len,
+            other=0.0,
+        )
 
         p = p.to(v.dtype)
         acc += tl.dot(p, v)
@@ -420,30 +474,34 @@ def _fwd_kernel_flash_attn_v2(
         l_i = l_i_new
         m_i = m_i_new
 
-    off_k = (offs_n[None, :] * stride_kbs + cur_kv_head * stride_kh +
-             offs_d[:, None] * stride_kd)
-    off_v = (offs_n[:, None] * stride_vbs + cur_kv_head * stride_vh +
-             offs_d[None, :] * stride_vd)
+    off_k = (
+        offs_n[None, :] * stride_kbs
+        + cur_kv_head * stride_kh
+        + offs_d[:, None] * stride_kd
+    )
+    off_v = (
+        offs_n[:, None] * stride_vbs
+        + cur_kv_head * stride_vh
+        + offs_d[None, :] * stride_vd
+    )
     k_ptrs = K + off_k
     v_ptrs = V + off_v
 
-    block_mask = tl.where(
-        block_start_loc < cur_batch_seq_len - cur_batch_ctx_len, 1, 0)
+    block_mask = tl.where(block_start_loc < cur_batch_seq_len - cur_batch_ctx_len, 1, 0)
 
     for start_n in range(0, block_mask * (start_m + 1) * BLOCK_M, BLOCK_N):
         start_n = tl.multiple_of(start_n, BLOCK_N)
         # -- compute qk ----
-        k = tl.load(k_ptrs +
-                    (cur_batch_in_all_start_index + start_n) * stride_kbs,
-                    mask=(start_n + offs_n[None, :])
-                    < cur_batch_seq_len - cur_batch_ctx_len,
-                    other=0.0)
+        k = tl.load(
+            k_ptrs + (cur_batch_in_all_start_index + start_n) * stride_kbs,
+            mask=(start_n + offs_n[None, :]) < cur_batch_seq_len - cur_batch_ctx_len,
+            other=0.0,
+        )
 
         qk = tl.zeros([BLOCK_M, BLOCK_N], dtype=tl.float32)
         qk += tl.dot(q, k)
         qk *= sm_scale
-        qk = tl.where(offs_m[:, None] >= (start_n + offs_n[None, :]), qk,
-                      float("-inf"))
+        qk = tl.where(offs_m[:, None] >= (start_n + offs_n[None, :]), qk, float("-inf"))
 
         # -- compute m_ij, p, l_ij
         m_ij = tl.max(qk, 1)
@@ -461,11 +519,11 @@ def _fwd_kernel_flash_attn_v2(
         # acc_scale = l_i / l_i_new * alpha
         acc = acc * acc_scale[:, None]
         # update acc
-        v = tl.load(v_ptrs +
-                    (cur_batch_in_all_start_index + start_n) * stride_vbs,
-                    mask=(start_n + offs_n[:, None])
-                    < cur_batch_seq_len - cur_batch_ctx_len,
-                    other=0.0)
+        v = tl.load(
+            v_ptrs + (cur_batch_in_all_start_index + start_n) * stride_vbs,
+            mask=(start_n + offs_n[:, None]) < cur_batch_seq_len - cur_batch_ctx_len,
+            other=0.0,
+        )
 
         p = p.to(v.dtype)
         acc += tl.dot(p, v)
@@ -475,12 +533,15 @@ def _fwd_kernel_flash_attn_v2(
 
     # acc /= l_i[:, None]
     # initialize pointers to output
-    off_o = ((cur_batch_in_all_start_index + offs_m[:, None]) * stride_obs +
-             cur_head * stride_oh + offs_d[None, :] * stride_od)
+    off_o = (
+        (cur_batch_in_all_start_index + offs_m[:, None]) * stride_obs
+        + cur_head * stride_oh
+        + offs_d[None, :] * stride_od
+    )
     out_ptrs = Out + off_o
-    tl.store(out_ptrs,
-             acc,
-             mask=offs_m[:, None] < cur_batch_seq_len - cur_batch_ctx_len)
+    tl.store(
+        out_ptrs, acc, mask=offs_m[:, None] < cur_batch_seq_len - cur_batch_ctx_len
+    )
     return
 
 
@@ -545,8 +606,7 @@ def _fwd_kernel_alibi(
     cur_batch_seq_len = tl.load(B_Seqlen + cur_batch)
     cur_batch_in_all_start_index = tl.load(B_Start_Loc + cur_batch)
     cur_batch_in_all_stop_index = tl.load(B_Start_Loc + cur_batch + 1)
-    cur_batch_query_len = (cur_batch_in_all_stop_index -
-                           cur_batch_in_all_start_index)
+    cur_batch_query_len = cur_batch_in_all_stop_index - cur_batch_in_all_start_index
     cur_batch_ctx_len = cur_batch_seq_len - cur_batch_query_len
 
     if SKIP_DECODE and cur_batch_query_len == 1:
@@ -558,16 +618,22 @@ def _fwd_kernel_alibi(
     offs_n = tl.arange(0, BLOCK_N)
     offs_d = tl.arange(0, BLOCK_DMODEL_PADDED)
     offs_m = start_m * BLOCK_M + tl.arange(0, BLOCK_M)
-    off_q = ((cur_batch_in_all_start_index + offs_m[:, None]) * stride_qbs +
-             cur_head * stride_qh + offs_d[None, :] * stride_qd)
-
-    dim_mask = tl.where(
-        tl.arange(0, BLOCK_DMODEL_PADDED) < BLOCK_DMODEL, 1, 0).to(tl.int1)
-
-    q = tl.load(Q + off_q,
-                mask=dim_mask[None, :] &
-                (offs_m[:, None] < cur_batch_seq_len - cur_batch_ctx_len),
-                other=0.0)
+    off_q = (
+        (cur_batch_in_all_start_index + offs_m[:, None]) * stride_qbs
+        + cur_head * stride_qh
+        + offs_d[None, :] * stride_qd
+    )
+
+    dim_mask = tl.where(tl.arange(0, BLOCK_DMODEL_PADDED) < BLOCK_DMODEL, 1, 0).to(
+        tl.int1
+    )
+
+    q = tl.load(
+        Q + off_q,
+        mask=dim_mask[None, :]
+        & (offs_m[:, None] < cur_batch_seq_len - cur_batch_ctx_len),
+        other=0.0,
+    )
 
     # # initialize pointer to m and l
     m_i = tl.zeros([BLOCK_M], dtype=tl.float32) - float("inf")
@@ -580,23 +646,31 @@ def _fwd_kernel_alibi(
     for start_n in range(0, cur_batch_ctx_len, BLOCK_N):
         start_n = tl.multiple_of(start_n, BLOCK_N)
         # -- compute qk ----
-        bn = tl.load(B_Loc + cur_batch * stride_b_loc_b +
-                     ((start_n + offs_n) // block_size) * stride_b_loc_s,
-                     mask=(start_n + offs_n) < cur_batch_ctx_len,
-                     other=0).to(tl.int64)
+        bn = tl.load(
+            B_Loc
+            + cur_batch * stride_b_loc_b
+            + ((start_n + offs_n) // block_size) * stride_b_loc_s,
+            mask=(start_n + offs_n) < cur_batch_ctx_len,
+            other=0,
+        ).to(tl.int64)
         off_k = (
-            bn[None, :] * stride_k_cache_bs + cur_kv_head * stride_k_cache_h +
-            (offs_d[:, None] // x) * stride_k_cache_d +
-            ((start_n + offs_n[None, :]) % block_size) * stride_k_cache_bl +
-            (offs_d[:, None] % x) * stride_k_cache_x)
-        off_v = (bn[:, None] * stride_v_cache_bs +
-                 cur_kv_head * stride_v_cache_h +
-                 offs_d[None, :] * stride_v_cache_d +
-                 (start_n + offs_n[:, None]) % block_size * stride_v_cache_bl)
-        k_load = tl.load(K_cache + off_k,
-                         mask=dim_mask[:, None] &
-                         ((start_n + offs_n[None, :]) < cur_batch_ctx_len),
-                         other=0.0)  # [D,N]
+            bn[None, :] * stride_k_cache_bs
+            + cur_kv_head * stride_k_cache_h
+            + (offs_d[:, None] // x) * stride_k_cache_d
+            + ((start_n + offs_n[None, :]) % block_size) * stride_k_cache_bl
+            + (offs_d[:, None] % x) * stride_k_cache_x
+        )
+        off_v = (
+            bn[:, None] * stride_v_cache_bs
+            + cur_kv_head * stride_v_cache_h
+            + offs_d[None, :] * stride_v_cache_d
+            + (start_n + offs_n[:, None]) % block_size * stride_v_cache_bl
+        )
+        k_load = tl.load(
+            K_cache + off_k,
+            mask=dim_mask[:, None] & ((start_n + offs_n[None, :]) < cur_batch_ctx_len),
+            other=0.0,
+        )  # [D,N]
 
         if k_load.dtype.is_fp8():
             k = (k_load.to(tl.float32) * tl.load(k_scale)).to(q.dtype)
@@ -605,16 +679,20 @@ def _fwd_kernel_alibi(
 
         qk = tl.zeros([BLOCK_M, BLOCK_N], dtype=tl.float32)
         qk = tl.dot(q, k, acc=qk, input_precision=IN_PRECISION)
-        qk = tl.where((start_n + offs_n[None, :]) < cur_batch_ctx_len, qk,
-                      float("-inf"))
+        qk = tl.where(
+            (start_n + offs_n[None, :]) < cur_batch_ctx_len, qk, float("-inf")
+        )
         qk *= sm_scale
 
         # load alibi
-        alibi = (tl.arange(0, BLOCK_N)[None, :] + alibi_start_k -
-                 alibi_start_q[:, None]) * alibi_slope
+        alibi = (
+            tl.arange(0, BLOCK_N)[None, :] + alibi_start_k - alibi_start_q[:, None]
+        ) * alibi_slope
         alibi = tl.where(
-            (alibi <= 0) & (alibi_start_q[:, None] < cur_batch_seq_len), alibi,
-            float("-inf"))
+            (alibi <= 0) & (alibi_start_q[:, None] < cur_batch_seq_len),
+            alibi,
+            float("-inf"),
+        )
         qk += alibi
         alibi_start_k += BLOCK_N
 
@@ -634,30 +712,36 @@ def _fwd_kernel_alibi(
         # acc_scale = l_i / l_i_new * alpha
         acc = acc * acc_scale[:, None]
         # update acc
-        v_load = tl.load(V_cache + off_v,
-                         mask=dim_mask[None, :] &
-                         ((start_n + offs_n[:, None]) < cur_batch_ctx_len),
-                         other=0.0)
+        v_load = tl.load(
+            V_cache + off_v,
+            mask=dim_mask[None, :] & ((start_n + offs_n[:, None]) < cur_batch_ctx_len),
+            other=0.0,
+        )
         if v_load.dtype.is_fp8():
             v = (v_load.to(tl.float32) * tl.load(v_scale)).to(q.dtype)
         else:
             v = v_load
         p = p.to(v.dtype)
 
-        acc = tl.dot(p, v, acc=acc, input_precision='ieee')
+        acc = tl.dot(p, v, acc=acc, input_precision="ieee")
         # update m_i and l_i
         l_i = l_i_new
         m_i = m_i_new
 
-    off_k = (offs_n[None, :] * stride_kbs + cur_kv_head * stride_kh +
-             offs_d[:, None] * stride_kd)
-    off_v = (offs_n[:, None] * stride_vbs + cur_kv_head * stride_vh +
-             offs_d[None, :] * stride_vd)
+    off_k = (
+        offs_n[None, :] * stride_kbs
+        + cur_kv_head * stride_kh
+        + offs_d[:, None] * stride_kd
+    )
+    off_v = (
+        offs_n[:, None] * stride_vbs
+        + cur_kv_head * stride_vh
+        + offs_d[None, :] * stride_vd
+    )
     k_ptrs = K + off_k
     v_ptrs = V + off_v
 
-    block_mask = tl.where(
-        block_start_loc < cur_batch_seq_len - cur_batch_ctx_len, 1, 0)
+    block_mask = tl.where(block_start_loc < cur_batch_seq_len - cur_batch_ctx_len, 1, 0)
 
     # init alibi
     alibi_slope = tl.load(Alibi_slopes + cur_head)
@@ -672,22 +756,25 @@ def _fwd_kernel_alibi(
         # -- compute qk ----
         k = tl.load(
             k_ptrs + (cur_batch_in_all_start_index + start_n) * stride_kbs,
-            mask=dim_mask[:, None] & ((start_n + offs_n[None, :])
-                                      < cur_batch_seq_len - cur_batch_ctx_len),
-            other=0.0)
+            mask=dim_mask[:, None]
+            & ((start_n + offs_n[None, :]) < cur_batch_seq_len - cur_batch_ctx_len),
+            other=0.0,
+        )
 
         qk = tl.zeros([BLOCK_M, BLOCK_N], dtype=tl.float32)
-        qk = tl.dot(q, k, acc=qk, input_precision='ieee')
+        qk = tl.dot(q, k, acc=qk, input_precision="ieee")
         qk *= sm_scale
-        qk = tl.where(offs_m[:, None] >= (start_n + offs_n[None, :]), qk,
-                      float("-inf"))
+        qk = tl.where(offs_m[:, None] >= (start_n + offs_n[None, :]), qk, float("-inf"))
 
         # load alibi
-        alibi = (tl.arange(0, BLOCK_N)[None, :] + alibi_start_k -
-                 alibi_start_q[:, None]) * alibi_slope
+        alibi = (
+            tl.arange(0, BLOCK_N)[None, :] + alibi_start_k - alibi_start_q[:, None]
+        ) * alibi_slope
         alibi = tl.where(
-            (alibi <= 0) & (alibi_start_q[:, None] < cur_batch_seq_len), alibi,
-            float("-inf"))
+            (alibi <= 0) & (alibi_start_q[:, None] < cur_batch_seq_len),
+            alibi,
+            float("-inf"),
+        )
         qk += alibi
         alibi_start_k += BLOCK_N
 
@@ -709,12 +796,13 @@ def _fwd_kernel_alibi(
         # update acc
         v = tl.load(
             v_ptrs + (cur_batch_in_all_start_index + start_n) * stride_vbs,
-            mask=dim_mask[None, :] & ((start_n + offs_n[:, None])
-                                      < cur_batch_seq_len - cur_batch_ctx_len),
-            other=0.0)
+            mask=dim_mask[None, :]
+            & ((start_n + offs_n[:, None]) < cur_batch_seq_len - cur_batch_ctx_len),
+            other=0.0,
+        )
         p = p.to(v.dtype)
 
-        acc = tl.dot(p, v, acc=acc, input_precision='ieee')
+        acc = tl.dot(p, v, acc=acc, input_precision="ieee")
         # update m_i and l_i
         l_i = l_i_new
         m_i = m_i_new
@@ -722,45 +810,51 @@ def _fwd_kernel_alibi(
     acc = acc / l_i[:, None]
 
     # initialize pointers to output
-    off_o = ((cur_batch_in_all_start_index + offs_m[:, None]) * stride_obs +
-             cur_head * stride_oh + offs_d[None, :] * stride_od)
+    off_o = (
+        (cur_batch_in_all_start_index + offs_m[:, None]) * stride_obs
+        + cur_head * stride_oh
+        + offs_d[None, :] * stride_od
+    )
     out_ptrs = Out + off_o
-    tl.store(out_ptrs,
-             acc,
-             mask=dim_mask[None, :] &
-             (offs_m[:, None] < cur_batch_seq_len - cur_batch_ctx_len))
+    tl.store(
+        out_ptrs,
+        acc,
+        mask=dim_mask[None, :]
+        & (offs_m[:, None] < cur_batch_seq_len - cur_batch_ctx_len),
+    )
     return
 
 
 @torch.inference_mode()
-def context_attention_fwd(q,
-                          k,
-                          v,
-                          o,
-                          kv_cache_dtype: str,
-                          k_cache,
-                          v_cache,
-                          b_loc,
-                          b_start_loc,
-                          b_seq_len,
-                          max_seq_len,
-                          max_input_len,
-                          k_scale: torch.Tensor,
-                          v_scale: torch.Tensor,
-                          alibi_slopes=None,
-                          sliding_window=None,
-                          sm_scale=None,
-                          skip_decode=False,
-                          fp8_out_scale=None,
-                          sinks=None):
-
+def context_attention_fwd(
+    q,
+    k,
+    v,
+    o,
+    kv_cache_dtype: str,
+    k_cache,
+    v_cache,
+    b_loc,
+    b_start_loc,
+    b_seq_len,
+    max_seq_len,
+    max_input_len,
+    k_scale: torch.Tensor,
+    v_scale: torch.Tensor,
+    alibi_slopes=None,
+    sliding_window=None,
+    sm_scale=None,
+    skip_decode=False,
+    fp8_out_scale=None,
+    sinks=None,
+):
     q_dtype_is_f32 = q.dtype is torch.float32
 
     # Turing does have tensor core for float32 multiplication
     # use ieee as fallback for triton kernels work. There is also
     # warning on vllm/config.py to inform users this fallback
     # implementation
-    IN_PRECISION = 'ieee' if IS_TURING and q_dtype_is_f32 else None
+    IN_PRECISION = "ieee" if IS_TURING and q_dtype_is_f32 else None
 
     # Conversion of FP8 Tensor from uint8 storage to
     # appropriate torch.dtype for interpretation by Triton
@@ -778,10 +872,15 @@ def context_attention_fwd(q,
         k_cache = k_cache.view(target_dtype)
         v_cache = v_cache.view(target_dtype)
 
-    if (k_cache.dtype == torch.uint8
-            or v_cache.dtype == torch.uint8 and kv_cache_dtype == "auto"):
-        raise ValueError("kv_cache_dtype='auto' unsupported for\
-            FP8 KV Cache prefill kernel")
+    if (
+        k_cache.dtype == torch.uint8
+        or v_cache.dtype == torch.uint8
+        and kv_cache_dtype == "auto"
+    ):
+        raise ValueError(
+            "kv_cache_dtype='auto' unsupported for\
+            FP8 KV Cache prefill kernel"
+        )
 
     # shape constraints
     Lq, Lk, Lv = q.shape[-1], k.shape[-1], v.shape[-1]
@@ -843,13 +942,11 @@ def context_attention_fwd(q,
             k_cache.stride(1),
             k_cache.stride(2),
             k_cache.stride(3),
-            k_cache.stride(
-                4),  #[num_blocks, num_kv_heads, head_size/x, block_size, x]
+            k_cache.stride(4),  # [num_blocks, num_kv_heads, head_size/x, block_size, x]
             v_cache.stride(0),
             v_cache.stride(1),
             v_cache.stride(2),
-            v_cache.stride(
-                3),  #[num_blocks, num_kv_heads, head_size, block_size]
+            v_cache.stride(3),  # [num_blocks, num_kv_heads, head_size, block_size]
             num_queries_per_kv=num_queries_per_kv,
             IN_PRECISION=IN_PRECISION,
             BLOCK_M=BLOCK,
@@ -867,8 +964,7 @@ def context_attention_fwd(q,
     if current_platform.is_rocm():
         extra_kargs = {"kpack": 1, "waves_per_eu": 2}
 
-    grid = lambda META: (batch, head,
-                         triton.cdiv(max_input_len, META["BLOCK_M"]))
+    grid = lambda META: (batch, head, triton.cdiv(max_input_len, META["BLOCK_M"]))
     _fwd_kernel[grid](
         q,
         k,
@@ -903,12 +999,11 @@ def context_attention_fwd(q,
         k_cache.stride(1),
         k_cache.stride(2),
         k_cache.stride(3),
-        k_cache.stride(
-            4),  #[num_blocks, num_kv_heads, head_size/x, block_size, x]
+        k_cache.stride(4),  # [num_blocks, num_kv_heads, head_size/x, block_size, x]
         v_cache.stride(0),
         v_cache.stride(1),
         v_cache.stride(2),
-        v_cache.stride(3),  #[num_blocks, num_kv_heads, head_size, block_size]
+        v_cache.stride(3),  # [num_blocks, num_kv_heads, head_size, block_size]
         BLOCK_SIZE=v_cache.shape[3],
         num_queries_per_kv=num_queries_per_kv,
         IN_PRECISION=IN_PRECISION,
@@ -924,5 +1019,6 @@ def context_attention_fwd(q,
         num_warps=4,
         num_stages=1,
         USE_SINKS=sinks is not None,
-        **extra_kargs)
+        **extra_kargs,
+    )
     return
diff --git a/vllm/attention/ops/rocm_aiter_mla.py b/vllm/attention/ops/rocm_aiter_mla.py
index d91cda255ff3..c358b5971f86 100644
--- a/vllm/attention/ops/rocm_aiter_mla.py
+++ b/vllm/attention/ops/rocm_aiter_mla.py
@@ -9,18 +9,16 @@
 from vllm.utils import direct_register_custom_op, is_torch_equal_or_newer
 
 
-def get_aiter_mla_metadata(max_batch_size: int, block_size: int,
-                           max_block_per_batch: int,
-                           device: torch.device) -> tuple[torch.Tensor, ...]:
-    paged_kv_indices = torch.zeros(max_batch_size * max_block_per_batch,
-                                   dtype=torch.int32,
-                                   device=device)
-    paged_kv_indptr = torch.zeros(max_batch_size + 1,
-                                  dtype=torch.int32,
-                                  device=device)
-    paged_kv_last_page_lens = torch.full((max_batch_size, ),
-                                         block_size,
-                                         dtype=torch.int32)
+def get_aiter_mla_metadata(
+    max_batch_size: int, block_size: int, max_block_per_batch: int, device: torch.device
+) -> tuple[torch.Tensor, ...]:
+    paged_kv_indices = torch.zeros(
+        max_batch_size * max_block_per_batch, dtype=torch.int32, device=device
+    )
+    paged_kv_indptr = torch.zeros(max_batch_size + 1, dtype=torch.int32, device=device)
+    paged_kv_last_page_lens = torch.full(
+        (max_batch_size,), block_size, dtype=torch.int32
+    )
     qo_indptr = torch.zeros(max_batch_size + 1, dtype=torch.int, device=device)
     return paged_kv_indices, paged_kv_indptr, paged_kv_last_page_lens, qo_indptr
 
@@ -37,18 +35,18 @@ def aiter_mla_decode_fwd(
     kv_last_page_lens: Optional[torch.Tensor] = None,
     logit_cap: float = 0.0,
 ):
-
-    torch.ops.vllm.rocm_aiter_mla_decode_fwd(q,
-                                             kv_buffer.view(
-                                                 -1, 1, 1, q.shape[-1]),
-                                             o,
-                                             qo_indptr,
-                                             max_seqlen_qo,
-                                             kv_indptr,
-                                             kv_indices,
-                                             kv_last_page_lens,
-                                             sm_scale=sm_scale,
-                                             logit_cap=logit_cap)
+    torch.ops.vllm.rocm_aiter_mla_decode_fwd(
+        q,
+        kv_buffer.view(-1, 1, 1, q.shape[-1]),
+        o,
+        qo_indptr,
+        max_seqlen_qo,
+        kv_indptr,
+        kv_indices,
+        kv_last_page_lens,
+        sm_scale=sm_scale,
+        logit_cap=logit_cap,
+    )
 
 
 def mla_decode_fwd_impl(
@@ -65,16 +63,18 @@ def mla_decode_fwd_impl(
 ) -> None:
     from aiter.mla import mla_decode_fwd
 
-    mla_decode_fwd(q,
-                   kv_buffer.view(-1, 1, 1, q.shape[-1]),
-                   o,
-                   qo_indptr,
-                   kv_indptr,
-                   kv_indices,
-                   kv_last_page_lens,
-                   max_seqlen_qo,
-                   sm_scale=sm_scale,
-                   logit_cap=logit_cap)
+    mla_decode_fwd(
+        q,
+        kv_buffer.view(-1, 1, 1, q.shape[-1]),
+        o,
+        qo_indptr,
+        kv_indptr,
+        kv_indices,
+        kv_last_page_lens,
+        max_seqlen_qo,
+        sm_scale=sm_scale,
+        logit_cap=logit_cap,
+    )
 
 
 def mla_decode_fwd_fake(
@@ -96,9 +96,11 @@ def mla_decode_fwd_fake(
     if is_torch_equal_or_newer("2.7.0"):
         tags = ()
     else:
-        tags = (torch.Tag.needs_fixed_stride_order, ),
-    direct_register_custom_op(op_name="rocm_aiter_mla_decode_fwd",
-                              op_func=mla_decode_fwd_impl,
-                              mutates_args=["o"],
-                              fake_impl=mla_decode_fwd_fake,
-                              tags=tags)
+        tags = ((torch.Tag.needs_fixed_stride_order,),)
+    direct_register_custom_op(
+        op_name="rocm_aiter_mla_decode_fwd",
+        op_func=mla_decode_fwd_impl,
+        mutates_args=["o"],
+        fake_impl=mla_decode_fwd_fake,
+        tags=tags,
+    )
diff --git a/vllm/attention/ops/rocm_aiter_paged_attn.py b/vllm/attention/ops/rocm_aiter_paged_attn.py
index 2a0336de8cf7..069cfcaf00aa 100644
--- a/vllm/attention/ops/rocm_aiter_paged_attn.py
+++ b/vllm/attention/ops/rocm_aiter_paged_attn.py
@@ -13,7 +13,6 @@
 
 
 class AITERPagedAttention(PagedAttention):
-
     @staticmethod
     def write_to_paged_cache(
         key: torch.Tensor,
@@ -26,19 +25,31 @@ def write_to_paged_cache(
         v_scale: torch.Tensor,
     ) -> None:
         if kv_cache_dtype not in ["int8", "fp8", "fp8_e4m3"]:
-            PagedAttention.write_to_paged_cache(key, value, key_cache,
-                                                value_cache, slot_mapping,
-                                                kv_cache_dtype, k_scale,
-                                                v_scale)
+            PagedAttention.write_to_paged_cache(
+                key,
+                value,
+                key_cache,
+                value_cache,
+                slot_mapping,
+                kv_cache_dtype,
+                k_scale,
+                v_scale,
+            )
         else:
-            kv_cache_torch_dtype = (FP8_DTYPE
-                                    if "fp8" in kv_cache_dtype else torch.int8)
+            kv_cache_torch_dtype = FP8_DTYPE if "fp8" in kv_cache_dtype else torch.int8
             key_cache = key_cache.view(kv_cache_torch_dtype)
             value_cache = value_cache.view(kv_cache_torch_dtype)
 
             rocm_aiter.reshape_and_cache_with_pertoken_quant(
-                key, value, key_cache, value_cache, k_scale, v_scale,
-                slot_mapping.flatten(), True)
+                key,
+                value,
+                key_cache,
+                value_cache,
+                k_scale,
+                v_scale,
+                slot_mapping.flatten(),
+                True,
+            )
 
     @staticmethod
     def forward_decode(
@@ -78,7 +89,8 @@ def forward_decode(
                 blocksparse_local_blocks=blocksparse_local_blocks,
                 blocksparse_vert_stride=blocksparse_vert_stride,
                 blocksparse_block_size=blocksparse_block_size,
-                blocksparse_head_sliding_step=blocksparse_head_sliding_step)
+                blocksparse_head_sliding_step=blocksparse_head_sliding_step,
+            )
 
         if "fp8" in kv_cache_dtype:
             key_cache = key_cache.view(current_platform.fp8_dtype())
@@ -87,16 +99,26 @@ def forward_decode(
         if blocksparse_vert_stride is not None and blocksparse_vert_stride > 1:
             # use blocksparse paged attention
             block_size = value_cache.size(-1)
-            assert (blocksparse_block_size > 0 and
-                    blocksparse_block_size % block_size == 0), \
-                (f"{blocksparse_block_size=} needs to be a multiple of"
-                 f"{block_size=} used in block_tables.")
+            assert (
+                blocksparse_block_size > 0 and blocksparse_block_size % block_size == 0
+            ), (
+                f"{blocksparse_block_size=} needs to be a multiple of"
+                f"{block_size=} used in block_tables."
+            )
 
         output = torch.empty_like(query)
         block_size = value_cache.shape[3]
         max_num_blocks_per_seq = cdiv(max_seq_len, block_size)
 
-        rocm_aiter.pa_fwd_asm(query, key_cache, value_cache, block_tables,
-                              seq_lens, max_num_blocks_per_seq, k_scale,
-                              v_scale, output)
+        rocm_aiter.pa_fwd_asm(
+            query,
+            key_cache,
+            value_cache,
+            block_tables,
+            seq_lens,
+            max_num_blocks_per_seq,
+            k_scale,
+            v_scale,
+            output,
+        )
         return output
diff --git a/vllm/attention/ops/triton_decode_attention.py b/vllm/attention/ops/triton_decode_attention.py
index 7f5a678615cf..aebc2e63cff6 100644
--- a/vllm/attention/ops/triton_decode_attention.py
+++ b/vllm/attention/ops/triton_decode_attention.py
@@ -42,10 +42,11 @@
 
 # Only print the following warnings when triton version < 3.2.0.
 # The issue won't affect performance or accuracy.
-if version.parse(triton.__version__) < version.parse('3.2.0'):
+if version.parse(triton.__version__) < version.parse("3.2.0"):
     logger.warning(
         "The following error message 'operation scheduled before its operands' "
-        "can be ignored.")
+        "can be ignored."
+    )
 
 
 @triton.jit
@@ -101,8 +102,7 @@ def _fwd_kernel_stage1(
 
     kv_len_per_split = tl.cdiv(cur_batch_seq_len, NUM_KV_SPLITS)
     split_kv_start = kv_len_per_split * split_kv_id
-    split_kv_end = tl.minimum(split_kv_start + kv_len_per_split,
-                              cur_batch_seq_len)
+    split_kv_end = tl.minimum(split_kv_start + kv_len_per_split, cur_batch_seq_len)
 
     e_max = -float("inf")
     e_sum = 0.0
@@ -112,14 +112,18 @@ def _fwd_kernel_stage1(
         for start_n in range(split_kv_start, split_kv_end, BLOCK_N):
             offs_n = start_n + tl.arange(0, BLOCK_N)
             kv_page_number = tl.load(
-                Req_to_tokens + stride_req_to_tokens_b * cur_batch_req_idx +
-                offs_n // PAGE_SIZE,
+                Req_to_tokens
+                + stride_req_to_tokens_b * cur_batch_req_idx
+                + offs_n // PAGE_SIZE,
                 mask=offs_n < split_kv_end,
                 other=0,
             )
             kv_loc = kv_page_number * PAGE_SIZE + offs_n % PAGE_SIZE
-            offs_buf_k = (kv_loc[:, None] * stride_buf_kbs +
-                          cur_kv_head * stride_buf_kh + offs_d[None, :])
+            offs_buf_k = (
+                kv_loc[:, None] * stride_buf_kbs
+                + cur_kv_head * stride_buf_kh
+                + offs_d[None, :]
+            )
             k = tl.load(
                 K_Buffer + offs_buf_k,
                 mask=(offs_n[:, None] < split_kv_end) & (mask_d[None, :]),
@@ -133,8 +137,11 @@ def _fwd_kernel_stage1(
 
             qk = tl.where(offs_n < split_kv_end, qk, float("-inf"))
 
-            offs_buf_v = (kv_loc[:, None] * stride_buf_vbs +
-                          cur_kv_head * stride_buf_vh + offs_dv[None, :])
+            offs_buf_v = (
+                kv_loc[:, None] * stride_buf_vbs
+                + cur_kv_head * stride_buf_vh
+                + offs_dv[None, :]
+            )
             v = tl.load(
                 V_Buffer + offs_buf_v,
                 mask=(offs_n[:, None] < split_kv_end) & (mask_dv[None, :]),
@@ -150,8 +157,12 @@ def _fwd_kernel_stage1(
             e_sum = e_sum * re_scale + tl.sum(p, 0)
             e_max = n_e_max
 
-        offs_mid_o = (cur_batch * stride_mid_ob + cur_head * stride_mid_oh +
-                      split_kv_id * stride_mid_os + offs_dv)
+        offs_mid_o = (
+            cur_batch * stride_mid_ob
+            + cur_head * stride_mid_oh
+            + split_kv_id * stride_mid_os
+            + offs_dv
+        )
 
         tl.store(
             Att_Out + offs_mid_o,
@@ -159,8 +170,12 @@ def _fwd_kernel_stage1(
             mask=(mask_dv),
         )
 
-        offs_mid_o_1 = (cur_batch * stride_mid_ob + cur_head * stride_mid_oh +
-                        split_kv_id * stride_mid_os + Lv)
+        offs_mid_o_1 = (
+            cur_batch * stride_mid_ob
+            + cur_head * stride_mid_oh
+            + split_kv_id * stride_mid_os
+            + Lv
+        )
 
         tl.store(
             Att_Out + offs_mid_o_1,
@@ -282,25 +297,22 @@ def _fwd_grouped_kernel_stage1(
     cur_batch_seq_len = tl.load(B_Seqlen + cur_batch)
     cur_batch_req_idx = cur_batch
 
-    offs_q = cur_batch * stride_qbs + cur_head[:, None] * stride_qh + offs_d[
-        None, :]
-    q = tl.load(Q + offs_q,
-                mask=(mask_h[:, None]) & (mask_d[None, :]),
-                other=0.0)
+    offs_q = cur_batch * stride_qbs + cur_head[:, None] * stride_qh + offs_d[None, :]
+    q = tl.load(Q + offs_q, mask=(mask_h[:, None]) & (mask_d[None, :]), other=0.0)
 
     if BLOCK_DPE > 0:
         offs_dpe = BLOCK_DMODEL + tl.arange(0, BLOCK_DPE)
         mask_dpe = offs_dpe < Lk
-        off_qpe = (cur_batch * stride_qbs + cur_head[:, None] * stride_qh +
-                   offs_dpe[None, :])
-        qpe = tl.load(Q + off_qpe,
-                      mask=(mask_h[:, None]) & (mask_dpe[None, :]),
-                      other=0.0)
+        off_qpe = (
+            cur_batch * stride_qbs + cur_head[:, None] * stride_qh + offs_dpe[None, :]
+        )
+        qpe = tl.load(
+            Q + off_qpe, mask=(mask_h[:, None]) & (mask_dpe[None, :]), other=0.0
+        )
 
     kv_len_per_split = tl.cdiv(cur_batch_seq_len, NUM_KV_SPLITS)
     split_kv_start = kv_len_per_split * split_kv_id
-    split_kv_end = tl.minimum(split_kv_start + kv_len_per_split,
-                              cur_batch_seq_len)
+    split_kv_end = tl.minimum(split_kv_start + kv_len_per_split, cur_batch_seq_len)
 
     e_max = tl.zeros([BLOCK_H], dtype=tl.float32) - float("inf")
     e_sum = tl.zeros([BLOCK_H], dtype=tl.float32)
@@ -310,14 +322,18 @@ def _fwd_grouped_kernel_stage1(
         for start_n in range(split_kv_start, split_kv_end, BLOCK_N):
             offs_n = start_n + tl.arange(0, BLOCK_N)
             kv_page_number = tl.load(
-                Req_to_tokens + stride_req_to_tokens_b * cur_batch_req_idx +
-                offs_n // PAGE_SIZE,
+                Req_to_tokens
+                + stride_req_to_tokens_b * cur_batch_req_idx
+                + offs_n // PAGE_SIZE,
                 mask=offs_n < split_kv_end,
                 other=0,
             )
             kv_loc = kv_page_number * PAGE_SIZE + offs_n % PAGE_SIZE
-            offs_buf_k = (kv_loc[None, :] * stride_buf_kbs +
-                          cur_kv_head * stride_buf_kh + offs_d[:, None])
+            offs_buf_k = (
+                kv_loc[None, :] * stride_buf_kbs
+                + cur_kv_head * stride_buf_kh
+                + offs_d[:, None]
+            )
             k = tl.load(
                 K_Buffer + offs_buf_k,
                 mask=(offs_n[None, :] < split_kv_end) & (mask_d[:, None]),
@@ -325,13 +341,14 @@ def _fwd_grouped_kernel_stage1(
             )
             qk = tl.dot(q, k.to(q.dtype))
             if BLOCK_DPE > 0:
-                offs_buf_kpe = (kv_loc[None, :] * stride_buf_kbs +
-                                cur_kv_head * stride_buf_kh +
-                                offs_dpe[:, None])
+                offs_buf_kpe = (
+                    kv_loc[None, :] * stride_buf_kbs
+                    + cur_kv_head * stride_buf_kh
+                    + offs_dpe[:, None]
+                )
                 kpe = tl.load(
                     K_Buffer + offs_buf_kpe,
-                    mask=(offs_n[None, :] < split_kv_end) &
-                    (mask_dpe[:, None]),
+                    mask=(offs_n[None, :] < split_kv_end) & (mask_dpe[:, None]),
                     other=0.0,
                 )
                 qk += tl.dot(qpe, kpe.to(qpe.dtype))
@@ -340,11 +357,15 @@ def _fwd_grouped_kernel_stage1(
             if logit_cap > 0:
                 qk = logit_cap * tanh(qk / logit_cap)
 
-            qk = tl.where(mask_h[:, None] & (offs_n[None, :] < split_kv_end),
-                          qk, float("-inf"))
+            qk = tl.where(
+                mask_h[:, None] & (offs_n[None, :] < split_kv_end), qk, float("-inf")
+            )
 
-            offs_buf_v = (kv_loc[:, None] * stride_buf_vbs +
-                          cur_kv_head * stride_buf_vh + offs_dv[None, :])
+            offs_buf_v = (
+                kv_loc[:, None] * stride_buf_vbs
+                + cur_kv_head * stride_buf_vh
+                + offs_dv[None, :]
+            )
             v = tl.load(
                 V_Buffer + offs_buf_v,
                 mask=(offs_n[:, None] < split_kv_end) & (mask_dv[None, :]),
@@ -360,9 +381,12 @@ def _fwd_grouped_kernel_stage1(
             e_sum = e_sum * re_scale + tl.sum(p, 1)
             e_max = n_e_max
 
-        offs_mid_o = (cur_batch * stride_mid_ob +
-                      cur_head[:, None] * stride_mid_oh +
-                      split_kv_id * stride_mid_os + offs_dv[None, :])
+        offs_mid_o = (
+            cur_batch * stride_mid_ob
+            + cur_head[:, None] * stride_mid_oh
+            + split_kv_id * stride_mid_os
+            + offs_dv[None, :]
+        )
 
         tl.store(
             Att_Out + offs_mid_o,
@@ -370,8 +394,12 @@ def _fwd_grouped_kernel_stage1(
             mask=(mask_h[:, None]) & (mask_dv[None, :]),
         )
 
-        offs_mid_o_1 = (cur_batch * stride_mid_ob + cur_head * stride_mid_oh +
-                        split_kv_id * stride_mid_os + Lv)
+        offs_mid_o_1 = (
+            cur_batch * stride_mid_ob
+            + cur_head * stride_mid_oh
+            + split_kv_id * stride_mid_os
+            + Lv
+        )
 
         tl.store(
             Att_Out + offs_mid_o_1,
@@ -427,11 +455,7 @@ def _decode_grouped_att_m_fwd(
     if is_hip_:
         # https://rocm.docs.amd.com/en/latest/how-to/rocm-for-ai/inference-optimization/workload.html#mi300x-triton-kernel-performance-optimization
         # https://github.com/triton-lang/triton/blob/main/third_party/amd/backend/compiler.py
-        extra_kargs = {
-            "waves_per_eu": 1,
-            "matrix_instr_nonkdim": 16,
-            "kpack": 2
-        }
+        extra_kargs = {"waves_per_eu": 1, "matrix_instr_nonkdim": 16, "kpack": 2}
         num_stages = 1
 
     _fwd_grouped_kernel_stage1[grid](
@@ -504,13 +528,12 @@ def _fwd_kernel_stage2(
     for split_kv_id in range(0, NUM_KV_SPLITS):
         kv_len_per_split = tl.cdiv(cur_batch_seq_len, NUM_KV_SPLITS)
         split_kv_start = kv_len_per_split * split_kv_id
-        split_kv_end = tl.minimum(split_kv_start + kv_len_per_split,
-                                  cur_batch_seq_len)
+        split_kv_end = tl.minimum(split_kv_start + kv_len_per_split, cur_batch_seq_len)
 
         if split_kv_end > split_kv_start:
-            tv = tl.load(Mid_O + offs_v + split_kv_id * stride_mid_os,
-                         mask=mask_d,
-                         other=0.0)
+            tv = tl.load(
+                Mid_O + offs_v + split_kv_id * stride_mid_os, mask=mask_d, other=0.0
+            )
             tlogic = tl.load(Mid_O + offs_logic + split_kv_id * stride_mid_os)
             n_e_max = tl.maximum(tlogic, e_max)
 
@@ -553,11 +576,7 @@ def _decode_softmax_reducev_fwd(
     if is_hip_:
         # https://rocm.docs.amd.com/en/docs-6.2.0/how-to/llm-fine-tuning-optimization/optimizing-triton-kernel.html
         # https://github.com/triton-lang/triton/blob/main/third_party/amd/backend/compiler.py
-        extra_kargs = {
-            "waves_per_eu": 4,
-            "matrix_instr_nonkdim": 16,
-            "kpack": 2
-        }
+        extra_kargs = {"waves_per_eu": 4, "matrix_instr_nonkdim": 16, "kpack": 2}
 
     grid = (batch, head_num)
     _fwd_kernel_stage2[grid](
@@ -606,8 +625,9 @@ def decode_attention_fwd_normal(
         page_size,
         logit_cap,
     )
-    _decode_softmax_reducev_fwd(attn_logits, q, o, lse, v_buffer, b_seq_len,
-                                num_kv_splits)
+    _decode_softmax_reducev_fwd(
+        attn_logits, q, o, lse, v_buffer, b_seq_len, num_kv_splits
+    )
 
 
 def decode_attention_fwd_grouped(
@@ -636,8 +656,9 @@ def decode_attention_fwd_grouped(
         page_size,
         logit_cap,
     )
-    _decode_softmax_reducev_fwd(attn_logits, q, o, lse, v_buffer, b_seq_len,
-                                num_kv_splits)
+    _decode_softmax_reducev_fwd(
+        attn_logits, q, o, lse, v_buffer, b_seq_len, num_kv_splits
+    )
 
 
 def decode_attention_fwd(
diff --git a/vllm/attention/ops/triton_flash_attention.py b/vllm/attention/ops/triton_flash_attention.py
index 49070e4c7ae6..c0ab35d07b1f 100644
--- a/vllm/attention/ops/triton_flash_attention.py
+++ b/vllm/attention/ops/triton_flash_attention.py
@@ -55,16 +55,16 @@ def dropout_offsets(philox_seed, philox_offset, dropout_p, m, n, stride):
 
 @triton.jit
 def dropout_rng(philox_seed, philox_offset, dropout_p, m, n, stride):
-    rng_offsets = dropout_offsets(philox_seed, philox_offset, dropout_p, m, n,
-                                  stride).to(tl.uint32)
+    rng_offsets = dropout_offsets(
+        philox_seed, philox_offset, dropout_p, m, n, stride
+    ).to(tl.uint32)
     # TODO: use tl.randint for better performance
     return tl.rand(philox_seed, rng_offsets)
 
 
 @triton.jit
 def dropout_mask(philox_seed, philox_offset, dropout_p, m, n, stride):
-    rng_output = dropout_rng(philox_seed, philox_offset, dropout_p, m, n,
-                             stride)
+    rng_output = dropout_rng(philox_seed, philox_offset, dropout_p, m, n, stride)
     rng_keep = rng_output > dropout_p
     return rng_keep
 
@@ -74,9 +74,9 @@ def load_fn(block_ptr, first, second, pad):
     if first and second:
         tensor = tl.load(block_ptr, boundary_check=(0, 1), padding_option=pad)
     elif first:
-        tensor = tl.load(block_ptr, boundary_check=(0, ), padding_option=pad)
+        tensor = tl.load(block_ptr, boundary_check=(0,), padding_option=pad)
     elif second:
-        tensor = tl.load(block_ptr, boundary_check=(1, ), padding_option=pad)
+        tensor = tl.load(block_ptr, boundary_check=(1,), padding_option=pad)
     else:
         tensor = tl.load(block_ptr)
     return tensor
@@ -145,9 +145,7 @@ def _attn_fwd_inner(
             # if not is_modulo_mn. last step might get wasted but that is okay.
             # check if this masking works for that case.
             if (start_n + BLOCK_N == block_max) and (n_extra_tokens != 0):
-                boundary_m = tl.full([BLOCK_M],
-                                     actual_seqlen_k,
-                                     dtype=tl.int32)
+                boundary_m = tl.full([BLOCK_M], actual_seqlen_k, dtype=tl.int32)
                 size_n = start_n + OFFS_N[None, :]
                 mask = size_n < boundary_m[:, None]
                 qk = tl.where(mask, qk, float("-inf"))
@@ -160,8 +158,9 @@ def _attn_fwd_inner(
         if USE_FP8:
             qk *= qk_scale
         if bias_ptr is not None:
-            bias = load_fn(bias_ptr, False, MASK_STEPS
-                           and (n_extra_tokens != 0), "zero")
+            bias = load_fn(
+                bias_ptr, False, MASK_STEPS and (n_extra_tokens != 0), "zero"
+            )
             # While bias is added after multiplying qk with sm_scale, our
             # optimization to use 2^x instead of e^x results in an additional
             # scale factor of log2(e) which we must also multiply the bias with.
@@ -173,9 +172,12 @@ def _attn_fwd_inner(
         # CAVEAT: Must update l_ij before applying dropout
         l_ij = tl.sum(p, 1)
         if ENABLE_DROPOUT:
-            philox_offset = (batch_philox_offset +
-                             start_m * BLOCK_M * actual_seqlen_k + start_n -
-                             BLOCK_N)
+            philox_offset = (
+                batch_philox_offset
+                + start_m * BLOCK_M * actual_seqlen_k
+                + start_n
+                - BLOCK_N
+            )
             keep = dropout_mask(
                 philox_seed,
                 philox_offset,
@@ -187,8 +189,7 @@ def _attn_fwd_inner(
             if RETURN_ENCODED_SOFTMAX:
                 tl.store(
                     encoded_softmax_block_ptr,
-                    tl.where(keep, p,
-                             -p).to(encoded_softmax_block_ptr.type.element_ty),
+                    tl.where(keep, p, -p).to(encoded_softmax_block_ptr.type.element_ty),
                 )
             p = tl.where(keep, p, 0.0)
         elif RETURN_ENCODED_SOFTMAX:
@@ -221,89 +222,57 @@ def _attn_fwd_inner(
         if bias_ptr is not None:
             bias_ptr = tl.advance(bias_ptr, (0, BLOCK_N))
         if RETURN_ENCODED_SOFTMAX:
-            encoded_softmax_block_ptr = tl.advance(encoded_softmax_block_ptr,
-                                                   (0, BLOCK_N))
+            encoded_softmax_block_ptr = tl.advance(
+                encoded_softmax_block_ptr, (0, BLOCK_N)
+            )
     return acc, l_i, m_i
 
 
 def get_cdna_autotune_configs():
     return [
         triton.Config(
-            {
-                'BLOCK_M': 256,
-                'BLOCK_N': 64,
-                'waves_per_eu': 2,
-                'PRE_LOAD_V': False
-            },
+            {"BLOCK_M": 256, "BLOCK_N": 64, "waves_per_eu": 2, "PRE_LOAD_V": False},
             num_stages=1,
-            num_warps=8),
+            num_warps=8,
+        ),
         triton.Config(
-            {
-                'BLOCK_M': 128,
-                'BLOCK_N': 128,
-                'waves_per_eu': 2,
-                'PRE_LOAD_V': False
-            },
+            {"BLOCK_M": 128, "BLOCK_N": 128, "waves_per_eu": 2, "PRE_LOAD_V": False},
             num_stages=1,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_M': 256,
-                'BLOCK_N': 128,
-                'waves_per_eu': 2,
-                'PRE_LOAD_V': False
-            },
+            {"BLOCK_M": 256, "BLOCK_N": 128, "waves_per_eu": 2, "PRE_LOAD_V": False},
             num_stages=1,
-            num_warps=8),
+            num_warps=8,
+        ),
         triton.Config(
-            {
-                'BLOCK_M': 128,
-                'BLOCK_N': 64,
-                'waves_per_eu': 1,
-                'PRE_LOAD_V': False
-            },
+            {"BLOCK_M": 128, "BLOCK_N": 64, "waves_per_eu": 1, "PRE_LOAD_V": False},
             num_stages=1,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_M': 128,
-                'BLOCK_N': 64,
-                'waves_per_eu': 3,
-                'PRE_LOAD_V': True
-            },
+            {"BLOCK_M": 128, "BLOCK_N": 64, "waves_per_eu": 3, "PRE_LOAD_V": True},
             num_stages=1,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_M': 128,
-                'BLOCK_N': 64,
-                'waves_per_eu': 3,
-                'PRE_LOAD_V': False
-            },
+            {"BLOCK_M": 128, "BLOCK_N": 64, "waves_per_eu": 3, "PRE_LOAD_V": False},
             num_stages=1,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_M': 64,
-                'BLOCK_N': 64,
-                'waves_per_eu': 4,
-                'PRE_LOAD_V': False
-            },
+            {"BLOCK_M": 64, "BLOCK_N": 64, "waves_per_eu": 4, "PRE_LOAD_V": False},
             num_stages=1,
-            num_warps=8),
+            num_warps=8,
+        ),
         triton.Config(
-            {
-                'BLOCK_M': 32,
-                'BLOCK_N': 32,
-                'waves_per_eu': 4,
-                'PRE_LOAD_V': False
-            },
+            {"BLOCK_M": 32, "BLOCK_N": 32, "waves_per_eu": 4, "PRE_LOAD_V": False},
             num_stages=1,
-            num_warps=8),
+            num_warps=8,
+        ),
         # TODO: This config fails with head_size not pow2 with data mismatches.
         #    triton.Config({'BLOCK_M': 32, 'BLOCK_N': 16, 'waves_per_eu': 1,
         #                   'PRE_LOAD_V': False}, num_stages=1, num_warps=4),
-
         # Fails in AccelerateAMDMatmul (Triton) assert when using FP8:
         # triton.Config(
         #     {
@@ -315,47 +284,31 @@ def get_cdna_autotune_configs():
         #     num_stages=1,
         #     num_warps=4,
         # ),
-    ], ['IS_CAUSAL', 'dropout_p', 'BLOCK_DMODEL', 'USE_FP8']
+    ], ["IS_CAUSAL", "dropout_p", "BLOCK_DMODEL", "USE_FP8"]
 
 
 def get_rdna_autotune_configs():
     return [
         triton.Config(
-            {
-                'BLOCK_M': 32,
-                'BLOCK_N': 32,
-                'waves_per_eu': 4,
-                'PRE_LOAD_V': False
-            },
+            {"BLOCK_M": 32, "BLOCK_N": 32, "waves_per_eu": 4, "PRE_LOAD_V": False},
             num_stages=1,
-            num_warps=2),
+            num_warps=2,
+        ),
         triton.Config(
-            {
-                'BLOCK_M': 32,
-                'BLOCK_N': 32,
-                'waves_per_eu': 2,
-                'PRE_LOAD_V': False
-            },
+            {"BLOCK_M": 32, "BLOCK_N": 32, "waves_per_eu": 2, "PRE_LOAD_V": False},
             num_stages=1,
-            num_warps=2),
+            num_warps=2,
+        ),
         triton.Config(
-            {
-                'BLOCK_M': 32,
-                'BLOCK_N': 16,
-                'waves_per_eu': 4,
-                'PRE_LOAD_V': False
-            },
+            {"BLOCK_M": 32, "BLOCK_N": 16, "waves_per_eu": 4, "PRE_LOAD_V": False},
             num_stages=1,
-            num_warps=2),
+            num_warps=2,
+        ),
         triton.Config(
-            {
-                'BLOCK_M': 32,
-                'BLOCK_N': 16,
-                'waves_per_eu': 2,
-                'PRE_LOAD_V': False
-            },
+            {"BLOCK_M": 32, "BLOCK_N": 16, "waves_per_eu": 2, "PRE_LOAD_V": False},
             num_stages=1,
-            num_warps=2),
+            num_warps=2,
+        ),
         # Fails in AccelerateAMDMatmul (Triton) assert when using FP8:
         # triton.Config(
         #     {
@@ -385,7 +338,7 @@ def get_rdna_autotune_configs():
         #     },
         #     num_stages=1,
         #     num_warps=2),
-    ], ['IS_CAUSAL', 'dropout_p', 'BLOCK_DMODEL', 'USE_FP8']
+    ], ["IS_CAUSAL", "dropout_p", "BLOCK_DMODEL", "USE_FP8"]
 
 
 def get_autotune_configs():
@@ -501,15 +454,17 @@ def attn_fwd(
         # This captures the decrease in n_blocks if we have a rectangular attn
         # matrix
         n_blocks_seqlen = cdiv_fn(
-            (start_m + 1) * BLOCK_M + seqlen_k - seqlen_q, BLOCK_N)
+            (start_m + 1) * BLOCK_M + seqlen_k - seqlen_q, BLOCK_N
+        )
         # This is what adjusts the block_max for the current WG, only
         # if IS_CAUSAL. Otherwise we want to always iterate through all n_blocks
         n_blocks = min(n_blocks, n_blocks_seqlen)
         # If we have no blocks after adjusting for seqlen deltas, this WG is
         # part of the blocks that are all 0. We exit early.
         if n_blocks <= 0:
-            o_offset = (off_z * stride_oz + cu_seqlens_q_start * stride_om +
-                        off_h_q * stride_oh)
+            o_offset = (
+                off_z * stride_oz + cu_seqlens_q_start * stride_om + off_h_q * stride_oh
+            )
             O_block_ptr = tl.make_block_ptr(
                 base=Out + o_offset,
                 shape=(seqlen_q, BLOCK_DMODEL),
@@ -545,8 +500,7 @@ def attn_fwd(
     padded_head = ACTUAL_BLOCK_DMODEL != BLOCK_DMODEL
 
     # Compute pointers for all the tensors used in this kernel.
-    q_offset = (off_z * stride_qz + off_h_q * stride_qh +
-                cu_seqlens_q_start * stride_qm)
+    q_offset = off_z * stride_qz + off_h_q * stride_qh + cu_seqlens_q_start * stride_qm
     Q_block_ptr = tl.make_block_ptr(
         base=Q + q_offset,
         shape=(seqlen_q, ACTUAL_BLOCK_DMODEL),
@@ -555,8 +509,7 @@ def attn_fwd(
         block_shape=(BLOCK_M, BLOCK_DMODEL),
         order=(1, 0),
     )
-    k_offset = (off_z * stride_kz + off_h_k * stride_kh +
-                cu_seqlens_k_start * stride_kn)
+    k_offset = off_z * stride_kz + off_h_k * stride_kh + cu_seqlens_k_start * stride_kn
     K_block_ptr = tl.make_block_ptr(
         base=K + k_offset,
         shape=(ACTUAL_BLOCK_DMODEL, seqlen_k),
@@ -565,8 +518,7 @@ def attn_fwd(
         block_shape=(BLOCK_DMODEL, BLOCK_N),
         order=(0, 1),
     )
-    v_offset = (off_z * stride_vz + off_h_k * stride_vh +
-                cu_seqlens_k_start * stride_vk)
+    v_offset = off_z * stride_vz + off_h_k * stride_vh + cu_seqlens_k_start * stride_vk
     V_block_ptr = tl.make_block_ptr(
         base=V + v_offset,
         shape=(seqlen_k, ACTUAL_BLOCK_DMODEL),
@@ -587,9 +539,9 @@ def attn_fwd(
     else:
         bias_ptr = None
     if ENABLE_DROPOUT:
-        batch_philox_offset = philox_offset_base \
-                              + (off_z * HQ + off_h_q) \
-                              * seqlen_q * seqlen_k
+        batch_philox_offset = (
+            philox_offset_base + (off_z * HQ + off_h_q) * seqlen_q * seqlen_k
+        )
     else:
         batch_philox_offset = 0
     # We can ask to return the dropout mask without actually doing any dropout.
@@ -692,8 +644,9 @@ def attn_fwd(
         if bias_ptr is not None:
             bias_ptr = tl.advance(bias_ptr, (0, n_full_blocks * BLOCK_N))
         if RETURN_ENCODED_SOFTMAX:
-            encoded_softmax_block_ptr = tl.advance(encoded_softmax_block_ptr,
-                                                   (0, n_full_blocks))
+            encoded_softmax_block_ptr = tl.advance(
+                encoded_softmax_block_ptr, (0, n_full_blocks)
+            )
         acc, l_i, m_i = _attn_fwd_inner(
             acc,
             l_i,
@@ -749,13 +702,12 @@ def attn_fwd(
     acc = acc.to(Out.type.element_ty)
     if IS_CAUSAL:  # noqa: SIM102
         if causal_start_idx > start_m_idx and causal_start_idx < end_m_idx:
-            out_mask_boundary = tl.full((BLOCK_DMODEL, ),
-                                        causal_start_idx,
-                                        dtype=tl.int32)
+            out_mask_boundary = tl.full(
+                (BLOCK_DMODEL,), causal_start_idx, dtype=tl.int32
+            )
             mask_m_offsets = start_m_idx + tl.arange(0, BLOCK_M)
-            out_ptrs_mask = (mask_m_offsets[:, None]
-                             >= out_mask_boundary[None, :])
-            z = tl.zeros((1, ), tl.float32)
+            out_ptrs_mask = mask_m_offsets[:, None] >= out_mask_boundary[None, :]
+            z = tl.zeros((1,), tl.float32)
             acc = tl.where(out_ptrs_mask, acc, z.to(acc.type.element_ty))
     # write back LSE
     # l_ptrs = L + off_z * HQ * MAX_SEQLENS_Q + off_h_q * MAX_SEQLENS_Q + offs_m
@@ -772,8 +724,7 @@ def attn_fwd(
     #    tl.store(l_ptrs, m_i + tl.math.log2(l_i))
 
     # write back O
-    o_offset = (off_z * stride_oz + cu_seqlens_q_start * stride_om +
-                off_h_q * stride_oh)
+    o_offset = off_z * stride_oz + cu_seqlens_q_start * stride_om + off_h_q * stride_oh
     O_block_ptr = tl.make_block_ptr(
         base=Out + o_offset,
         shape=(seqlen_q, ACTUAL_BLOCK_DMODEL),
@@ -821,7 +772,6 @@ def check_args(
 
 
 class _attention(torch.autograd.Function):
-
     @staticmethod
     def forward(
         ctx,
@@ -847,8 +797,7 @@ def forward(
             def check_and_convert(t, scale):
                 if t.dtype != float8:
                     descale = 1.0 / scale
-                    ts = (t * descale).clamp(min=float8_info.min,
-                                             max=float8_info.max)
+                    ts = (t * descale).clamp(min=float8_info.min, max=float8_info.max)
                     return ts.to(float8)
                 else:
                     return t
@@ -923,8 +872,7 @@ def check_and_convert(t, scale):
             bias_strides = (0, 0, 0, 0)
 
         p_descale = 1.0 / p_scale
-        o_descale = 1.0 / fp8_out_scale.item(
-        ) if fp8_out_scale is not None else 1.0
+        o_descale = 1.0 / fp8_out_scale.item() if fp8_out_scale is not None else 1.0
 
         arg_max_seqlens_q = 0 if on_gfx1x() else max_seqlens_q
         arg_max_seqlens_k = 0 if on_gfx1x() else max_seqlens_k
diff --git a/vllm/attention/ops/triton_merge_attn_states.py b/vllm/attention/ops/triton_merge_attn_states.py
index 56d78ed5ea6e..d29f92f8cecb 100644
--- a/vllm/attention/ops/triton_merge_attn_states.py
+++ b/vllm/attention/ops/triton_merge_attn_states.py
@@ -61,8 +61,8 @@ def merge_attn_states_kernel(
     # If we see an inf assume FA2 and convert inf to -inf for consistency
     # and correctness. Inf generally doesn't make sense in this context outside
     # of undefined-behavior/FA2-case, so I think this a safe assumption.
-    p_lse = float('-inf') if p_lse == float('inf') else p_lse
-    s_lse = float('-inf') if s_lse == float('inf') else s_lse
+    p_lse = float("-inf") if p_lse == float("inf") else p_lse
+    s_lse = float("-inf") if s_lse == float("inf") else s_lse
 
     max_lse = tl.maximum(p_lse, s_lse)
     p_lse = p_lse - max_lse
@@ -70,7 +70,7 @@ def merge_attn_states_kernel(
     # Will reuse precomputed Exp values for scale factor computation.
     p_se = tl.exp(p_lse)
     s_se = tl.exp(s_lse)
-    out_se = (p_se + s_se)
+    out_se = p_se + s_se
 
     if OUTPUT_LSE:
         out_lse = tl.log(out_se) + max_lse
@@ -78,12 +78,20 @@ def merge_attn_states_kernel(
 
     head_arange = tl.arange(0, PADDED_HEAD_SIZE)
     head_mask = head_arange < HEAD_SIZE
-    p_out = tl.load(prefix_output + token_idx * num_heads * HEAD_SIZE +
-                    head_idx * HEAD_SIZE + head_arange,
-                    mask=head_mask)
-    s_out = tl.load(suffix_output + token_idx * num_heads * HEAD_SIZE +
-                    head_idx * HEAD_SIZE + head_arange,
-                    mask=head_mask)
+    p_out = tl.load(
+        prefix_output
+        + token_idx * num_heads * HEAD_SIZE
+        + head_idx * HEAD_SIZE
+        + head_arange,
+        mask=head_mask,
+    )
+    s_out = tl.load(
+        suffix_output
+        + token_idx * num_heads * HEAD_SIZE
+        + head_idx * HEAD_SIZE
+        + head_arange,
+        mask=head_mask,
+    )
 
     # NOTE(woosuk): Be careful with the numerical stability.
     # We should compute the scale first, and then multiply it with the output.
@@ -91,7 +99,8 @@ def merge_attn_states_kernel(
     p_scale = p_se / out_se
     s_scale = s_se / out_se
     out = p_out * p_scale + s_out * s_scale
-    tl.store(output + token_idx * num_heads * HEAD_SIZE +
-             head_idx * HEAD_SIZE + head_arange,
-             out,
-             mask=head_mask)
+    tl.store(
+        output + token_idx * num_heads * HEAD_SIZE + head_idx * HEAD_SIZE + head_arange,
+        out,
+        mask=head_mask,
+    )
diff --git a/vllm/attention/ops/triton_reshape_and_cache_flash.py b/vllm/attention/ops/triton_reshape_and_cache_flash.py
index 0d82935bb418..ee1dbfbab88c 100644
--- a/vllm/attention/ops/triton_reshape_and_cache_flash.py
+++ b/vllm/attention/ops/triton_reshape_and_cache_flash.py
@@ -29,7 +29,6 @@ def reshape_and_cache_kernel_flash(
     # tune parameters
     TILE_SIZE: tl.constexpr,
 ):
-
     token_idx = tl.program_id(axis=0)
     slot_idx = tl.load(slot_mapping_ptr + token_idx).to(tl.int64)
     if slot_idx < 0:
@@ -49,8 +48,9 @@ def reshape_and_cache_kernel_flash(
     tgt_idx = block_idx * block_stride + block_offset * page_stride
 
     # [TILE_SIZE]
-    key_load = tl.load(key_ptr + src_key_idx + tile_pos,
-                       mask=tile_pos < (num_heads * head_size))
+    key_load = tl.load(
+        key_ptr + src_key_idx + tile_pos, mask=tile_pos < (num_heads * head_size)
+    )
     if FP8_KV_CACHE:
         if key_load.dtype.is_fp8():
             key_tile = key_load
@@ -62,8 +62,9 @@ def reshape_and_cache_kernel_flash(
         key_tile = key_load
 
     # [TILE_SIZE]
-    value_load = tl.load(value_ptr + src_value_idx + tile_pos,
-                         mask=tile_pos < (num_heads * head_size))
+    value_load = tl.load(
+        value_ptr + src_value_idx + tile_pos, mask=tile_pos < (num_heads * head_size)
+    )
     if FP8_KV_CACHE:
         if value_load.dtype.is_fp8():
             value_tile = value_load
@@ -88,16 +89,16 @@ def reshape_and_cache_kernel_flash(
 
 
 def triton_reshape_and_cache_flash(
-        key: torch.Tensor,  # [num_tokens, num_heads, head_size]
-        value: torch.Tensor,  # [num_tokens, num_heads, head_size]
-        # [num_blocks, block_size, num_heads, head_size]
+    key: torch.Tensor,  # [num_tokens, num_heads, head_size]
+    value: torch.Tensor,  # [num_tokens, num_heads, head_size]
+    # [num_blocks, block_size, num_heads, head_size]
     key_cache: torch.Tensor,
-        # [num_blocks, block_size, num_heads, head_size]
-        value_cache: torch.Tensor,
-        slot_mapping: torch.Tensor,  # [num_tokens]
-        kv_cache_dtype: str,  # "auto", "fp8"
-        k_scale: torch.Tensor,  # float32
-        v_scale: torch.Tensor,  # float32
+    # [num_blocks, block_size, num_heads, head_size]
+    value_cache: torch.Tensor,
+    slot_mapping: torch.Tensor,  # [num_tokens]
+    kv_cache_dtype: str,  # "auto", "fp8"
+    k_scale: torch.Tensor,  # float32
+    v_scale: torch.Tensor,  # float32
 ):
     num_tokens = key.shape[0]
     num_heads = key.shape[1]
@@ -113,27 +114,36 @@ def triton_reshape_and_cache_flash(
     head_stride = key_cache.stride()[2]
     assert head_stride == head_size, "only continous heads are supported"
 
-    assert kv_cache_dtype == "auto" or kv_cache_dtype.startswith("fp8"), \
+    assert kv_cache_dtype == "auto" or kv_cache_dtype.startswith("fp8"), (
         f"unsupported kv_cache_dtype (str), got {kv_cache_dtype}."
-    kv_cache_torch_dtype = current_platform.fp8_dtype() if \
-        kv_cache_dtype.startswith("fp8") else key_cache.dtype
+    )
+    kv_cache_torch_dtype = (
+        current_platform.fp8_dtype()
+        if kv_cache_dtype.startswith("fp8")
+        else key_cache.dtype
+    )
 
-    if key_cache.dtype != kv_cache_torch_dtype and kv_cache_dtype.startswith(
-            "fp8"):
+    if key_cache.dtype != kv_cache_torch_dtype and kv_cache_dtype.startswith("fp8"):
         # to avoid erounous implicit cast in triton kernel (tl.store to uint8)
         # (e.g. explicit cast to fp8e4m3fnuz is not supported in triton 3.4)
         key_cache = key_cache.view(kv_cache_torch_dtype)
         value_cache = value_cache.view(kv_cache_torch_dtype)
-    assert kv_cache_dtype != torch.uint8, "explicit fp8 cast and store to "\
+    assert kv_cache_dtype != torch.uint8, (
+        "explicit fp8 cast and store to "
         "uint8 is not supported by triton reshape_and_cache_flash"
+    )
 
     FP8_KV_CACHE = kv_cache_dtype.startswith("fp8")
     assert (not FP8_KV_CACHE) or kv_cache_torch_dtype in [
-        torch.float8_e4m3fn, torch.float8_e5m2, torch.uint8,
-        torch.float8_e4m3fnuz], \
-            "unsupported dtype of KV cache tensor, got "\
-            "{kv_cache_torch_dtype}. Supported kv cache dtypes: fp8e4m3fn, " \
-            "fp8e5m2, uint8, bfloat16, float16, float32, fp8e4m3fnuz."
+        torch.float8_e4m3fn,
+        torch.float8_e5m2,
+        torch.uint8,
+        torch.float8_e4m3fnuz,
+    ], (
+        "unsupported dtype of KV cache tensor, got "
+        "{kv_cache_torch_dtype}. Supported kv cache dtypes: fp8e4m3fn, "
+        "fp8e5m2, uint8, bfloat16, float16, float32, fp8e4m3fnuz."
+    )
 
     # heuristics instead of autotuning
     TILE_SIZE = min(2048, triton.next_power_of_2(n))
diff --git a/vllm/attention/ops/triton_unified_attention.py b/vllm/attention/ops/triton_unified_attention.py
index 9e7cafc17428..565be1c39bec 100644
--- a/vllm/attention/ops/triton_unified_attention.py
+++ b/vllm/attention/ops/triton_unified_attention.py
@@ -31,8 +31,13 @@ def apply_softcap(S, x):
 
 
 @triton.jit
-def find_seq_idx(query_start_len_ptr, target_idx, num_seqs,
-                 BLOCK_Q: tl.constexpr, use_q_block_mode: tl.constexpr):
+def find_seq_idx(
+    query_start_len_ptr,
+    target_idx,
+    num_seqs,
+    BLOCK_Q: tl.constexpr,
+    use_q_block_mode: tl.constexpr,
+):
     left: tl.int32 = 0
     right = num_seqs
     while left < right:
@@ -100,19 +105,18 @@ def kernel_unified_attention_2d(
     q_block_global_idx = tl.program_id(0)
     kv_head_idx = tl.program_id(1)
 
-    seq_idx = find_seq_idx(query_start_len_ptr, q_block_global_idx, num_seqs,
-                           BLOCK_Q, True)
+    seq_idx = find_seq_idx(
+        query_start_len_ptr, q_block_global_idx, num_seqs, BLOCK_Q, True
+    )
 
-    q_block_start_idx = tl.load(query_start_len_ptr +
-                                seq_idx) // BLOCK_Q + seq_idx
+    q_block_start_idx = tl.load(query_start_len_ptr + seq_idx) // BLOCK_Q + seq_idx
 
     q_block_local_idx = q_block_global_idx - q_block_start_idx
 
     cur_batch_in_all_start_index = tl.load(query_start_len_ptr + seq_idx)
     cur_batch_in_all_stop_index = tl.load(query_start_len_ptr + seq_idx + 1)
 
-    cur_batch_query_len = cur_batch_in_all_stop_index \
-        - cur_batch_in_all_start_index
+    cur_batch_query_len = cur_batch_in_all_stop_index - cur_batch_in_all_start_index
 
     if q_block_local_idx * BLOCK_Q >= cur_batch_query_len:
         return
@@ -123,10 +127,12 @@ def kernel_unified_attention_2d(
     query_pos = q_block_local_idx * BLOCK_Q + offs_m // num_queries_per_kv
 
     query_offset_0 = cur_batch_in_all_start_index + query_pos
-    query_offset_1 = kv_head_idx * num_queries_per_kv + \
-        offs_m % num_queries_per_kv
-    query_offset = (query_offset_0[:, None] * query_stride_0 +
-                    query_offset_1[:, None] * query_stride_1 + offs_d[None, :])
+    query_offset_1 = kv_head_idx * num_queries_per_kv + offs_m % num_queries_per_kv
+    query_offset = (
+        query_offset_0[:, None] * query_stride_0
+        + query_offset_1[:, None] * query_stride_1
+        + offs_d[None, :]
+    )
 
     dim_mask = tl.where(offs_d < HEAD_SIZE, 1, 0).to(tl.int1)
     query_mask_0 = tl.where(query_pos < cur_batch_query_len, 1, 0).to(tl.int1)
@@ -161,19 +167,24 @@ def kernel_unified_attention_2d(
 
     # alibi slope for this head
     if USE_ALIBI_SLOPES:
-        alibi_slope = tl.load(alibi_slopes_ptr + query_offset_1,
-                              mask=query_mask_1,
-                              other=0.0)
+        alibi_slope = tl.load(
+            alibi_slopes_ptr + query_offset_1, mask=query_mask_1, other=0.0
+        )
 
     # query-query attention bias
     if USE_QQ_BIAS:
-        qq_bias_row_ptrs = (qq_bias_ptr + query_pos[:, None] * qq_bias_stride_0
-                            )  # shape: [BLOCK_M]
+        qq_bias_row_ptrs = (
+            qq_bias_ptr + query_pos[:, None] * qq_bias_stride_0
+        )  # shape: [BLOCK_M]
 
     # compute the length of the longest sequence prefix spanned by any
     # query token in the current q_block (q_block_local_idx)
-    max_seq_prefix_len = context_len + q_block_local_idx * BLOCK_Q + (
-        BLOCK_M - 1) // num_queries_per_kv + 1
+    max_seq_prefix_len = (
+        context_len
+        + q_block_local_idx * BLOCK_Q
+        + (BLOCK_M - 1) // num_queries_per_kv
+        + 1
+    )
 
     # adjust for potential padding in the last q_block by considering the
     # actual sequence length
@@ -211,23 +222,30 @@ def kernel_unified_attention_2d(
         seq_offset = j * TILE_SIZE + offs_t
         tile_mask = seq_offset < max_seq_prefix_len
 
-        physical_block_idx = tl.load(block_tables_ptr + block_table_offset +
-                                     seq_offset // BLOCK_SIZE).to(tl.int64)
+        physical_block_idx = tl.load(
+            block_tables_ptr + block_table_offset + seq_offset // BLOCK_SIZE
+        ).to(tl.int64)
 
-        v_offset = (physical_block_idx[:, None] * stride_v_cache_0 +
-                    kv_head_idx * stride_v_cache_2 +
-                    offs_d[None, :] * stride_v_cache_3 +
-                    (seq_offset % BLOCK_SIZE)[:, None] * stride_v_cache_1)
+        v_offset = (
+            physical_block_idx[:, None] * stride_v_cache_0
+            + kv_head_idx * stride_v_cache_2
+            + offs_d[None, :] * stride_v_cache_3
+            + (seq_offset % BLOCK_SIZE)[:, None] * stride_v_cache_1
+        )
 
-        k_offset = (physical_block_idx[None, :] * stride_k_cache_0 +
-                    kv_head_idx * stride_k_cache_2 +
-                    offs_d[:, None] * stride_k_cache_3 +
-                    (seq_offset % BLOCK_SIZE)[None, :] * stride_k_cache_1)
+        k_offset = (
+            physical_block_idx[None, :] * stride_k_cache_0
+            + kv_head_idx * stride_k_cache_2
+            + offs_d[:, None] * stride_k_cache_3
+            + (seq_offset % BLOCK_SIZE)[None, :] * stride_k_cache_1
+        )
 
         # K : (HEAD_SIZE, TILE_SIZE)
-        K_load = tl.load(key_cache_ptr + k_offset,
-                         mask=dim_mask[:, None] & tile_mask[None, :],
-                         other=0.0)
+        K_load = tl.load(
+            key_cache_ptr + k_offset,
+            mask=dim_mask[:, None] & tile_mask[None, :],
+            other=0.0,
+        )
 
         if K_load.dtype.is_fp8():
             if Q.dtype.is_fp8():
@@ -238,9 +256,11 @@ def kernel_unified_attention_2d(
             K = K_load
 
         # V : (TILE_SIZE, HEAD_SIZE)
-        V_load = tl.load(value_cache_ptr + v_offset,
-                         mask=dim_mask[None, :] & tile_mask[:, None],
-                         other=0.0)
+        V_load = tl.load(
+            value_cache_ptr + v_offset,
+            mask=dim_mask[None, :] & tile_mask[:, None],
+            other=0.0,
+        )
 
         if V_load.dtype.is_fp8():
             if Q.dtype.is_fp8():
@@ -260,12 +280,16 @@ def kernel_unified_attention_2d(
         if USE_SOFTCAP:
             S = apply_softcap(S, softcap)
 
-        S = tl.where(query_mask_1[:, None] & query_mask_0[:, None] & seq_mask,
-                     S, float("-inf"))
+        S = tl.where(
+            query_mask_1[:, None] & query_mask_0[:, None] & seq_mask, S, float("-inf")
+        )
 
         if SLIDING_WINDOW > 0:
-            S = tl.where((context_len + query_pos[:, None] - seq_offset)
-                         < SLIDING_WINDOW, S, float("-inf"))
+            S = tl.where(
+                (context_len + query_pos[:, None] - seq_offset) < SLIDING_WINDOW,
+                S,
+                float("-inf"),
+            )
 
         if USE_ALIBI_SLOPES:
             S += alibi_slope[:, None] * (seq_offset - context_len)
@@ -315,9 +339,11 @@ def kernel_unified_attention_2d(
         acc = acc * tl.load(out_scale)
         acc = tl.clamp(acc, FP8_MIN, FP8_MAX)
 
-    output_offset = (query_offset_0[:, None] * output_stride_0 +
-                     query_offset_1[:, None] * output_stride_1 +
-                     offs_d[None, :])
+    output_offset = (
+        query_offset_0[:, None] * output_stride_0
+        + query_offset_1[:, None] * output_stride_1
+        + offs_d[None, :]
+    )
 
     tl.store(
         output_ptr + output_offset,
@@ -328,68 +354,67 @@ def kernel_unified_attention_2d(
 
 @triton.jit
 def kernel_unified_attention_3d(
-        segm_output_ptr,
-        # [num_tokens, num_query_heads, num_segments, head_size]
-        segm_max_ptr,  # [num_tokens, num_query_heads, num_segments]
-        segm_expsum_ptr,  # [num_tokens, num_query_heads, num_segments]
-        query_ptr,  # [num_tokens, num_query_heads, head_size]
-        key_cache_ptr,  # [num_blks, num_kv_heads, head_size // x, blk_size, x]
-        value_cache_ptr,  # [num_blks, num_kv_heads, head_size, blk_size]
-        sink_ptr,  # [num_query_heads]
-        block_tables_ptr,  # [num_seqs, max_num_blocks_per_seq]
-        seq_lens_ptr,  # [num_seqs]
-        alibi_slopes_ptr,  # [num_query_heads]
-        qq_bias_ptr,  # [num_query_tokens, num_query_tokens]
-        scale,  # float32
-        k_scale,  # float32
-        v_scale,  # float32
-        softcap,  # float32
-        num_query_heads: tl.constexpr,  # int
-        num_queries_per_kv: tl.constexpr,  # int
-        block_table_stride: tl.int64,  # int
-        query_stride_0: tl.int64,  # int
-        query_stride_1: tl.int64,  # int, should be equal to head_size
-        qq_bias_stride_0: tl.int64,  # int
-        BLOCK_SIZE: tl.constexpr,  # int
-        TILE_SIZE: tl.constexpr,  # int, must be power of 2
-        HEAD_SIZE: tl.constexpr,  # int
-        HEAD_SIZE_PADDED: tl.constexpr,  # int, must be power of 2
-        USE_ALIBI_SLOPES: tl.constexpr,  # bool
-        USE_QQ_BIAS: tl.constexpr,  # bool
-        USE_SOFTCAP: tl.constexpr,  # bool
-        USE_SINKS: tl.constexpr,  # bool
-        SLIDING_WINDOW: tl.constexpr,  # int
-        stride_k_cache_0: tl.int64,  # int
-        stride_k_cache_1: tl.int64,  # int
-        stride_k_cache_2: tl.int64,  # int
-        stride_k_cache_3: tl.constexpr,  # int
-        stride_v_cache_0: tl.int64,  # int
-        stride_v_cache_1: tl.int64,  # int
-        stride_v_cache_2: tl.int64,  # int
-        stride_v_cache_3: tl.constexpr,  # int
-        query_start_len_ptr,  # [num_seqs+1]
-        BLOCK_Q: tl.constexpr,  # int
-        num_seqs: tl.int32,
-        BLOCK_M: tl.constexpr,  # int
-        NUM_SEGMENTS_PER_SEQ: tl.constexpr,  # int
+    segm_output_ptr,
+    # [num_tokens, num_query_heads, num_segments, head_size]
+    segm_max_ptr,  # [num_tokens, num_query_heads, num_segments]
+    segm_expsum_ptr,  # [num_tokens, num_query_heads, num_segments]
+    query_ptr,  # [num_tokens, num_query_heads, head_size]
+    key_cache_ptr,  # [num_blks, num_kv_heads, head_size // x, blk_size, x]
+    value_cache_ptr,  # [num_blks, num_kv_heads, head_size, blk_size]
+    sink_ptr,  # [num_query_heads]
+    block_tables_ptr,  # [num_seqs, max_num_blocks_per_seq]
+    seq_lens_ptr,  # [num_seqs]
+    alibi_slopes_ptr,  # [num_query_heads]
+    qq_bias_ptr,  # [num_query_tokens, num_query_tokens]
+    scale,  # float32
+    k_scale,  # float32
+    v_scale,  # float32
+    softcap,  # float32
+    num_query_heads: tl.constexpr,  # int
+    num_queries_per_kv: tl.constexpr,  # int
+    block_table_stride: tl.int64,  # int
+    query_stride_0: tl.int64,  # int
+    query_stride_1: tl.int64,  # int, should be equal to head_size
+    qq_bias_stride_0: tl.int64,  # int
+    BLOCK_SIZE: tl.constexpr,  # int
+    TILE_SIZE: tl.constexpr,  # int, must be power of 2
+    HEAD_SIZE: tl.constexpr,  # int
+    HEAD_SIZE_PADDED: tl.constexpr,  # int, must be power of 2
+    USE_ALIBI_SLOPES: tl.constexpr,  # bool
+    USE_QQ_BIAS: tl.constexpr,  # bool
+    USE_SOFTCAP: tl.constexpr,  # bool
+    USE_SINKS: tl.constexpr,  # bool
+    SLIDING_WINDOW: tl.constexpr,  # int
+    stride_k_cache_0: tl.int64,  # int
+    stride_k_cache_1: tl.int64,  # int
+    stride_k_cache_2: tl.int64,  # int
+    stride_k_cache_3: tl.constexpr,  # int
+    stride_v_cache_0: tl.int64,  # int
+    stride_v_cache_1: tl.int64,  # int
+    stride_v_cache_2: tl.int64,  # int
+    stride_v_cache_3: tl.constexpr,  # int
+    query_start_len_ptr,  # [num_seqs+1]
+    BLOCK_Q: tl.constexpr,  # int
+    num_seqs: tl.int32,
+    BLOCK_M: tl.constexpr,  # int
+    NUM_SEGMENTS_PER_SEQ: tl.constexpr,  # int
 ):
     q_block_global_idx = tl.program_id(0)
     kv_head_idx = tl.program_id(1)
     segm_idx = tl.program_id(2)
 
-    seq_idx = find_seq_idx(query_start_len_ptr, q_block_global_idx, num_seqs,
-                           BLOCK_Q, True)
+    seq_idx = find_seq_idx(
+        query_start_len_ptr, q_block_global_idx, num_seqs, BLOCK_Q, True
+    )
 
-    q_block_start_idx = tl.load(query_start_len_ptr +
-                                seq_idx) // BLOCK_Q + seq_idx
+    q_block_start_idx = tl.load(query_start_len_ptr + seq_idx) // BLOCK_Q + seq_idx
 
     q_block_local_idx = q_block_global_idx - q_block_start_idx
 
     cur_batch_in_all_start_index = tl.load(query_start_len_ptr + seq_idx)
     cur_batch_in_all_stop_index = tl.load(query_start_len_ptr + seq_idx + 1)
 
-    cur_batch_query_len = cur_batch_in_all_stop_index \
-        - cur_batch_in_all_start_index
+    cur_batch_query_len = cur_batch_in_all_stop_index - cur_batch_in_all_start_index
 
     if q_block_local_idx * BLOCK_Q >= cur_batch_query_len:
         return
@@ -410,10 +435,12 @@ def kernel_unified_attention_3d(
     query_pos = q_block_local_idx * BLOCK_Q + offs_m // num_queries_per_kv
 
     query_offset_0 = cur_batch_in_all_start_index + query_pos
-    query_offset_1 = kv_head_idx * num_queries_per_kv + \
-        offs_m % num_queries_per_kv
-    query_offset = (query_offset_0[:, None] * query_stride_0 +
-                    query_offset_1[:, None] * query_stride_1 + offs_d[None, :])
+    query_offset_1 = kv_head_idx * num_queries_per_kv + offs_m % num_queries_per_kv
+    query_offset = (
+        query_offset_0[:, None] * query_stride_0
+        + query_offset_1[:, None] * query_stride_1
+        + offs_d[None, :]
+    )
 
     dim_mask = tl.where(offs_d < HEAD_SIZE, 1, 0).to(tl.int1)
     query_mask_0 = tl.where(query_pos < cur_batch_query_len, 1, 0).to(tl.int1)
@@ -448,19 +475,24 @@ def kernel_unified_attention_3d(
 
     # alibi slope for this head
     if USE_ALIBI_SLOPES:
-        alibi_slope = tl.load(alibi_slopes_ptr + query_offset_1,
-                              mask=query_mask_1,
-                              other=0.0)
+        alibi_slope = tl.load(
+            alibi_slopes_ptr + query_offset_1, mask=query_mask_1, other=0.0
+        )
 
     # query-query attention bias
     if USE_QQ_BIAS:
-        qq_bias_row_ptrs = (qq_bias_ptr + query_pos[:, None] * qq_bias_stride_0
-                            )  # shape: [BLOCK_M]
+        qq_bias_row_ptrs = (
+            qq_bias_ptr + query_pos[:, None] * qq_bias_stride_0
+        )  # shape: [BLOCK_M]
 
     # compute the length of the longest sequence prefix spanned by any
     # query token in the current q_block (q_block_local_idx)
-    max_seq_prefix_len = context_len + q_block_local_idx * BLOCK_Q + (
-        BLOCK_M - 1) // num_queries_per_kv + 1
+    max_seq_prefix_len = (
+        context_len
+        + q_block_local_idx * BLOCK_Q
+        + (BLOCK_M - 1) // num_queries_per_kv
+        + 1
+    )
 
     # adjust for potential padding in the last q_block by considering the
     # actual sequence length
@@ -473,29 +505,36 @@ def kernel_unified_attention_3d(
 
     # iterate through tiles within current segment
     for j in range(
-            segm_idx * tiles_per_segment,
-            min((segm_idx + 1) * tiles_per_segment, num_tiles),
+        segm_idx * tiles_per_segment,
+        min((segm_idx + 1) * tiles_per_segment, num_tiles),
     ):
         seq_offset = j * TILE_SIZE + offs_t
         tile_mask = seq_offset < max_seq_prefix_len
 
-        physical_block_idx = tl.load(block_tables_ptr + block_table_offset +
-                                     seq_offset // BLOCK_SIZE).to(tl.int64)
+        physical_block_idx = tl.load(
+            block_tables_ptr + block_table_offset + seq_offset // BLOCK_SIZE
+        ).to(tl.int64)
 
-        v_offset = (physical_block_idx[:, None] * stride_v_cache_0 +
-                    kv_head_idx * stride_v_cache_2 +
-                    offs_d[None, :] * stride_v_cache_3 +
-                    (seq_offset % BLOCK_SIZE)[:, None] * stride_v_cache_1)
+        v_offset = (
+            physical_block_idx[:, None] * stride_v_cache_0
+            + kv_head_idx * stride_v_cache_2
+            + offs_d[None, :] * stride_v_cache_3
+            + (seq_offset % BLOCK_SIZE)[:, None] * stride_v_cache_1
+        )
 
-        k_offset = (physical_block_idx[None, :] * stride_k_cache_0 +
-                    kv_head_idx * stride_k_cache_2 +
-                    offs_d[:, None] * stride_k_cache_3 +
-                    (seq_offset % BLOCK_SIZE)[None, :] * stride_k_cache_1)
+        k_offset = (
+            physical_block_idx[None, :] * stride_k_cache_0
+            + kv_head_idx * stride_k_cache_2
+            + offs_d[:, None] * stride_k_cache_3
+            + (seq_offset % BLOCK_SIZE)[None, :] * stride_k_cache_1
+        )
 
         # K : (HEAD_SIZE, TILE_SIZE)
-        K_load = tl.load(key_cache_ptr + k_offset,
-                         mask=dim_mask[:, None] & tile_mask[None, :],
-                         other=0.0)
+        K_load = tl.load(
+            key_cache_ptr + k_offset,
+            mask=dim_mask[:, None] & tile_mask[None, :],
+            other=0.0,
+        )
 
         if K_load.dtype.is_fp8():
             if Q.dtype.is_fp8():
@@ -506,9 +545,11 @@ def kernel_unified_attention_3d(
             K = K_load
 
         # V : (TILE_SIZE, HEAD_SIZE)
-        V_load = tl.load(value_cache_ptr + v_offset,
-                         mask=dim_mask[None, :] & tile_mask[:, None],
-                         other=0.0)
+        V_load = tl.load(
+            value_cache_ptr + v_offset,
+            mask=dim_mask[None, :] & tile_mask[:, None],
+            other=0.0,
+        )
 
         if V_load.dtype.is_fp8():
             if Q.dtype.is_fp8():
@@ -527,12 +568,16 @@ def kernel_unified_attention_3d(
         if USE_SOFTCAP:
             S = apply_softcap(S, softcap)
 
-        S = tl.where(query_mask_1[:, None] & query_mask_0[:, None] & seq_mask,
-                     S, float("-inf"))
+        S = tl.where(
+            query_mask_1[:, None] & query_mask_0[:, None] & seq_mask, S, float("-inf")
+        )
 
         if SLIDING_WINDOW > 0:
-            S = tl.where((context_len + query_pos[:, None] - seq_offset)
-                         < SLIDING_WINDOW, S, float("-inf"))
+            S = tl.where(
+                (context_len + query_pos[:, None] - seq_offset) < SLIDING_WINDOW,
+                S,
+                float("-inf"),
+            )
 
         if USE_ALIBI_SLOPES:
             S += alibi_slope[:, None] * (seq_offset - context_len)
@@ -577,29 +622,31 @@ def kernel_unified_attention_3d(
         acc += tl.dot(P.to(V.dtype), V)
 
     segm_output_offset = (
-        query_offset_0[:, None].to(tl.int64) *
-        (num_query_heads * NUM_SEGMENTS_PER_SEQ * HEAD_SIZE_PADDED) +
-        query_offset_1[:, None] * (NUM_SEGMENTS_PER_SEQ * HEAD_SIZE_PADDED) +
-        segm_idx * HEAD_SIZE_PADDED + tl.arange(0, HEAD_SIZE_PADDED)[None, :])
+        query_offset_0[:, None].to(tl.int64)
+        * (num_query_heads * NUM_SEGMENTS_PER_SEQ * HEAD_SIZE_PADDED)
+        + query_offset_1[:, None] * (NUM_SEGMENTS_PER_SEQ * HEAD_SIZE_PADDED)
+        + segm_idx * HEAD_SIZE_PADDED
+        + tl.arange(0, HEAD_SIZE_PADDED)[None, :]
+    )
     tl.store(
         segm_output_ptr + segm_output_offset,
         acc,
         mask=dim_mask[None, :] & query_mask_0[:, None] & query_mask_1[:, None],
     )
-    segm_offset = (query_offset_0.to(tl.int64) *
-                   (num_query_heads * NUM_SEGMENTS_PER_SEQ) +
-                   query_offset_1 * NUM_SEGMENTS_PER_SEQ + segm_idx)
+    segm_offset = (
+        query_offset_0.to(tl.int64) * (num_query_heads * NUM_SEGMENTS_PER_SEQ)
+        + query_offset_1 * NUM_SEGMENTS_PER_SEQ
+        + segm_idx
+    )
     tl.store(segm_max_ptr + segm_offset, M, mask=query_mask_0 & query_mask_1)
-    tl.store(segm_expsum_ptr + segm_offset,
-             L,
-             mask=query_mask_0 & query_mask_1)
+    tl.store(segm_expsum_ptr + segm_offset, L, mask=query_mask_0 & query_mask_1)
 
 
 @triton.jit
 def reduce_segments(
     output_ptr,  # [num_tokens, num_query_heads, head_size]
     segm_output_ptr,
-    #[num_tokens, num_query_heads, max_num_segments, head_size]
+    # [num_tokens, num_query_heads, max_num_segments, head_size]
     segm_max_ptr,  # [num_tokens, num_query_heads, max_num_segments]
     segm_expsum_ptr,  # [num_tokens, num_query_heads, max_num_segments]
     seq_lens_ptr,  # [num_seqs]
@@ -622,8 +669,9 @@ def reduce_segments(
     query_token_idx = tl.program_id(0)
     query_head_idx = tl.program_id(1)
 
-    seq_idx = find_seq_idx(query_start_len_ptr, query_token_idx, num_seqs,
-                           BLOCK_Q, False)
+    seq_idx = find_seq_idx(
+        query_start_len_ptr, query_token_idx, num_seqs, BLOCK_Q, False
+    )
 
     # sequence len for this particular sequence
     seq_len = tl.load(seq_lens_ptr + seq_idx)
@@ -635,34 +683,32 @@ def reduce_segments(
     # create masks for subsequent loads
     act_num_segments = cdiv_fn(seq_len, tiles_per_segment * TILE_SIZE)
     segm_mask = tl.arange(0, NUM_SEGMENTS_PER_SEQ) < tl.full(
-        [NUM_SEGMENTS_PER_SEQ], act_num_segments, dtype=tl.int32)
-    dim_mask = tl.where(tl.arange(0, HEAD_SIZE_PADDED) < HEAD_SIZE, 1,
-                        0).to(tl.int1)
+        [NUM_SEGMENTS_PER_SEQ], act_num_segments, dtype=tl.int32
+    )
+    dim_mask = tl.where(tl.arange(0, HEAD_SIZE_PADDED) < HEAD_SIZE, 1, 0).to(tl.int1)
 
     # load segment maxima
-    segm_offset = (query_token_idx.to(tl.int64) *
-                   (num_query_heads * NUM_SEGMENTS_PER_SEQ) +
-                   query_head_idx * NUM_SEGMENTS_PER_SEQ +
-                   tl.arange(0, NUM_SEGMENTS_PER_SEQ))
-    segm_max = tl.load(segm_max_ptr + segm_offset,
-                       mask=segm_mask,
-                       other=float("-inf"))
+    segm_offset = (
+        query_token_idx.to(tl.int64) * (num_query_heads * NUM_SEGMENTS_PER_SEQ)
+        + query_head_idx * NUM_SEGMENTS_PER_SEQ
+        + tl.arange(0, NUM_SEGMENTS_PER_SEQ)
+    )
+    segm_max = tl.load(segm_max_ptr + segm_offset, mask=segm_mask, other=float("-inf"))
     overall_max = tl.max(segm_max)
 
     # load and rescale segment exp sums
-    segm_expsum = tl.load(segm_expsum_ptr + segm_offset,
-                          mask=segm_mask,
-                          other=0.0)
+    segm_expsum = tl.load(segm_expsum_ptr + segm_offset, mask=segm_mask, other=0.0)
     segm_expsum = segm_expsum * tl.exp(segm_max - overall_max)
     overall_expsum = tl.sum(segm_expsum)
 
     # load, rescale, and add segment attention outputs
     segm_output_offset = (
-        query_token_idx.to(tl.int64) *
-        (num_query_heads * NUM_SEGMENTS_PER_SEQ * HEAD_SIZE_PADDED) +
-        query_head_idx * (NUM_SEGMENTS_PER_SEQ * HEAD_SIZE_PADDED) +
-        tl.arange(0, NUM_SEGMENTS_PER_SEQ)[:, None] * HEAD_SIZE_PADDED +
-        tl.arange(0, HEAD_SIZE_PADDED)[None, :])
+        query_token_idx.to(tl.int64)
+        * (num_query_heads * NUM_SEGMENTS_PER_SEQ * HEAD_SIZE_PADDED)
+        + query_head_idx * (NUM_SEGMENTS_PER_SEQ * HEAD_SIZE_PADDED)
+        + tl.arange(0, NUM_SEGMENTS_PER_SEQ)[:, None] * HEAD_SIZE_PADDED
+        + tl.arange(0, HEAD_SIZE_PADDED)[None, :]
+    )
     segm_output = tl.load(
         segm_output_ptr + segm_output_offset,
         mask=segm_mask[:, None] & dim_mask[None, :],
@@ -678,9 +724,11 @@ def reduce_segments(
         acc = tl.clamp(acc, FP8_MIN, FP8_MAX)
 
     # write result
-    output_offset = (query_token_idx * output_stride_0 +
-                     query_head_idx * output_stride_1 +
-                     tl.arange(0, HEAD_SIZE_PADDED))
+    output_offset = (
+        query_token_idx * output_stride_0
+        + query_head_idx * output_stride_1
+        + tl.arange(0, HEAD_SIZE_PADDED)
+    )
     tl.store(output_ptr + output_offset, acc, mask=dim_mask)
 
 
@@ -707,13 +755,11 @@ def unified_attention(
     # Optional tensor for sinks
     sinks=None,
 ):
-
     assert causal, "Only causal attention is supported"
     assert q_descale is None, "Q scales not supported"
 
     if sinks is not None:
-        assert sinks.shape[0] == q.shape[1], \
-        "Sinks must be num_query_heads size"
+        assert sinks.shape[0] == q.shape[1], "Sinks must be num_query_heads size"
 
     use_alibi_slopes = alibi_slopes is not None
     use_qq_bias = qq_bias is not None
@@ -725,8 +771,9 @@ def unified_attention(
     num_queries_per_kv = num_query_heads // num_kv_heads
     head_size = q.shape[2]
 
-    BLOCK_M = 16 if num_queries_per_kv <= 16 else triton.next_power_of_2(
-        num_queries_per_kv)
+    BLOCK_M = (
+        16 if num_queries_per_kv <= 16 else triton.next_power_of_2(num_queries_per_kv)
+    )
     BLOCK_Q = BLOCK_M // num_queries_per_kv
 
     # Ideally we would launch with kernel with:
@@ -748,10 +795,12 @@ def unified_attention(
 
     # if batch contains a prefill
     if max_seqlen_q > 1 or total_num_q_blocks * num_kv_heads > 128:
-        kernel_unified_attention_2d[(
-            total_num_q_blocks,
-            num_kv_heads,
-        )](
+        kernel_unified_attention_2d[
+            (
+                total_num_q_blocks,
+                num_kv_heads,
+            )
+        ](
             output_ptr=out,
             query_ptr=q,
             key_cache_ptr=k,
@@ -825,52 +874,51 @@ def unified_attention(
             device=q.device,
         )
 
-        kernel_unified_attention_3d[(
-            total_num_q_blocks, num_kv_heads, NUM_SEGMENTS)](
-                segm_output_ptr=segm_output,
-                segm_max_ptr=segm_max,
-                segm_expsum_ptr=segm_expsum,
-                query_ptr=q,
-                key_cache_ptr=k,
-                value_cache_ptr=v,
-                sink_ptr=sinks,
-                block_tables_ptr=block_table,
-                seq_lens_ptr=seqused_k,
-                alibi_slopes_ptr=alibi_slopes,
-                qq_bias_ptr=qq_bias,
-                scale=softmax_scale,
-                k_scale=k_descale,
-                v_scale=v_descale,
-                softcap=softcap,
-                num_query_heads=num_query_heads,
-                num_queries_per_kv=num_queries_per_kv,
-                block_table_stride=block_table.stride(0),
-                query_stride_0=q.stride(0),
-                query_stride_1=q.stride(1),
-                qq_bias_stride_0=qq_bias.stride(0) if use_qq_bias else 0,
-                BLOCK_SIZE=block_size,
-                TILE_SIZE=TILE_SIZE_DECODE,
-                HEAD_SIZE=head_size,
-                HEAD_SIZE_PADDED=triton.next_power_of_2(head_size),
-                USE_ALIBI_SLOPES=use_alibi_slopes,
-                USE_QQ_BIAS=use_qq_bias,
-                USE_SOFTCAP=(softcap > 0),
-                USE_SINKS=(sinks is not None),
-                SLIDING_WINDOW=(1 + window_size[0]),
-                stride_k_cache_0=k.stride(0),
-                stride_k_cache_1=k.stride(1),
-                stride_k_cache_2=k.stride(2),
-                stride_k_cache_3=k.stride(3),
-                stride_v_cache_0=v.stride(0),
-                stride_v_cache_1=v.stride(1),
-                stride_v_cache_2=v.stride(2),
-                stride_v_cache_3=v.stride(3),
-                query_start_len_ptr=cu_seqlens_q,
-                BLOCK_Q=BLOCK_Q,
-                num_seqs=num_seqs,
-                BLOCK_M=BLOCK_M,
-                NUM_SEGMENTS_PER_SEQ=NUM_SEGMENTS,
-            )
+        kernel_unified_attention_3d[(total_num_q_blocks, num_kv_heads, NUM_SEGMENTS)](
+            segm_output_ptr=segm_output,
+            segm_max_ptr=segm_max,
+            segm_expsum_ptr=segm_expsum,
+            query_ptr=q,
+            key_cache_ptr=k,
+            value_cache_ptr=v,
+            sink_ptr=sinks,
+            block_tables_ptr=block_table,
+            seq_lens_ptr=seqused_k,
+            alibi_slopes_ptr=alibi_slopes,
+            qq_bias_ptr=qq_bias,
+            scale=softmax_scale,
+            k_scale=k_descale,
+            v_scale=v_descale,
+            softcap=softcap,
+            num_query_heads=num_query_heads,
+            num_queries_per_kv=num_queries_per_kv,
+            block_table_stride=block_table.stride(0),
+            query_stride_0=q.stride(0),
+            query_stride_1=q.stride(1),
+            qq_bias_stride_0=qq_bias.stride(0) if use_qq_bias else 0,
+            BLOCK_SIZE=block_size,
+            TILE_SIZE=TILE_SIZE_DECODE,
+            HEAD_SIZE=head_size,
+            HEAD_SIZE_PADDED=triton.next_power_of_2(head_size),
+            USE_ALIBI_SLOPES=use_alibi_slopes,
+            USE_QQ_BIAS=use_qq_bias,
+            USE_SOFTCAP=(softcap > 0),
+            USE_SINKS=(sinks is not None),
+            SLIDING_WINDOW=(1 + window_size[0]),
+            stride_k_cache_0=k.stride(0),
+            stride_k_cache_1=k.stride(1),
+            stride_k_cache_2=k.stride(2),
+            stride_k_cache_3=k.stride(3),
+            stride_v_cache_0=v.stride(0),
+            stride_v_cache_1=v.stride(1),
+            stride_v_cache_2=v.stride(2),
+            stride_v_cache_3=v.stride(3),
+            query_start_len_ptr=cu_seqlens_q,
+            BLOCK_Q=BLOCK_Q,
+            num_seqs=num_seqs,
+            BLOCK_M=BLOCK_M,
+            NUM_SEGMENTS_PER_SEQ=NUM_SEGMENTS,
+        )
         reduce_segments[(q.shape[0], num_query_heads)](
             output_ptr=out,
             segm_output_ptr=segm_output,
@@ -879,8 +927,7 @@ def unified_attention(
             seq_lens_ptr=seqused_k,
             num_seqs=num_seqs,
             num_query_heads=num_query_heads,
-            out_scale_inv=1 /
-            output_scale if output_scale is not None else 1.0,
+            out_scale_inv=1 / output_scale if output_scale is not None else 1.0,
             output_stride_0=out.stride(0),
             output_stride_1=out.stride(1),
             block_table_stride=block_table.stride(0),
diff --git a/vllm/attention/selector.py b/vllm/attention/selector.py
index d3214fecfa70..effd35444d54 100644
--- a/vllm/attention/selector.py
+++ b/vllm/attention/selector.py
@@ -2,10 +2,11 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 import os
+from collections.abc import Generator
 from contextlib import contextmanager
 from dataclasses import dataclass
 from functools import cache
-from typing import Generator, Optional, Union
+from typing import Optional, Union
 
 import torch
 
@@ -29,12 +30,11 @@ def backend_name_to_enum(backend_name: str) -> Optional[_Backend]:
             loaded.
     """
     assert backend_name is not None
-    return _Backend[backend_name] if backend_name in _Backend.__members__ else \
-          None
+    return _Backend[backend_name] if backend_name in _Backend.__members__ else None
 
 
 def get_env_variable_attn_backend() -> Optional[_Backend]:
-    '''
+    """
     Get the backend override specified by the vLLM attention
     backend environment variable, if one is specified.
 
@@ -42,10 +42,9 @@ def get_env_variable_attn_backend() -> Optional[_Backend]:
 
     * _Backend enum value if an override is specified
     * None otherwise
-    '''
+    """
     backend_name = os.environ.get(STR_BACKEND_ENV_VAR)
-    return (None
-            if backend_name is None else backend_name_to_enum(backend_name))
+    return None if backend_name is None else backend_name_to_enum(backend_name)
 
 
 # Global state allows a particular choice of backend
@@ -59,7 +58,7 @@ def get_env_variable_attn_backend() -> Optional[_Backend]:
 
 
 def global_force_attn_backend(attn_backend: Optional[_Backend]) -> None:
-    '''
+    """
     Force all attention operations to use a specified backend.
 
     Passing `None` for the argument re-enables automatic
@@ -68,16 +67,16 @@ def global_force_attn_backend(attn_backend: Optional[_Backend]) -> None:
     Arguments:
 
     * attn_backend: backend selection (None to revert to auto)
-    '''
+    """
     global forced_attn_backend
     forced_attn_backend = attn_backend
 
 
 def get_global_forced_attn_backend() -> Optional[_Backend]:
-    '''
+    """
     Get the currently-forced choice of attention backend,
     or None if auto-selection is currently enabled.
-    '''
+    """
     return forced_attn_backend
 
 
@@ -110,26 +109,27 @@ def is_attn_backend_supported(
     assert isinstance(attn_backend, type)
 
     # TODO: Update the interface once V0 is removed
-    if get_supported_head_sizes := getattr(attn_backend,
-                                           "get_supported_head_sizes", None):
+    if get_supported_head_sizes := getattr(
+        attn_backend, "get_supported_head_sizes", None
+    ):
         is_head_size_supported = head_size in get_supported_head_sizes()
-    elif validate_head_size := getattr(attn_backend, "validate_head_size",
-                                       None):
+    elif validate_head_size := getattr(attn_backend, "validate_head_size", None):
         try:
             validate_head_size(head_size)
             is_head_size_supported = True
         except Exception:
             is_head_size_supported = False
     else:
-        raise NotImplementedError(f"{attn_backend.__name__} does not support "
-                                  "head size validation")
+        raise NotImplementedError(
+            f"{attn_backend.__name__} does not support head size validation"
+        )
 
-    if get_supported_dtypes := getattr(attn_backend, "get_supported_dtypes",
-                                       None):
+    if get_supported_dtypes := getattr(attn_backend, "get_supported_dtypes", None):
         is_dtype_supported = dtype in get_supported_dtypes()
     else:
-        raise NotImplementedError(f"{attn_backend.__name__} does not support "
-                                  "dtype validation")
+        raise NotImplementedError(
+            f"{attn_backend.__name__} does not support dtype validation"
+        )
 
     return _IsSupported(
         can_import=True,
@@ -175,15 +175,13 @@ def _cached_get_attn_backend(
     has_sink: bool = False,
     use_sparse: bool = False,
 ) -> type[AttentionBackend]:
-
     # Check whether a particular choice of backend was
     # previously forced.
     #
     # THIS SELECTION OVERRIDES THE VLLM_ATTENTION_BACKEND
     # ENVIRONMENT VARIABLE.
     selected_backend = None
-    backend_by_global_setting: Optional[_Backend] = (
-        get_global_forced_attn_backend())
+    backend_by_global_setting: Optional[_Backend] = get_global_forced_attn_backend()
     if backend_by_global_setting is not None:
         selected_backend = backend_by_global_setting
     else:
@@ -195,29 +193,41 @@ def _cached_get_attn_backend(
                     "The suffix '_VLLM_V1' in the environment variable "
                     "%s is no longer necessary as V0 backends have been "
                     "deprecated. Please remove this suffix from your "
-                    "environment variable setting.", STR_BACKEND_ENV_VAR)
-                backend_by_env_var = backend_by_env_var.removesuffix(
-                    "_VLLM_V1")
+                    "environment variable setting.",
+                    STR_BACKEND_ENV_VAR,
+                )
+                backend_by_env_var = backend_by_env_var.removesuffix("_VLLM_V1")
             selected_backend = backend_name_to_enum(backend_by_env_var)
             if selected_backend is None:
                 raise ValueError(
                     f"Invalid attention backend: '{backend_by_env_var}'. "
-                    f"Valid backends are: {list(_Backend.__members__.keys())}")
+                    f"Valid backends are: {list(_Backend.__members__.keys())}"
+                )
 
     # get device-specific attn_backend
     attention_cls = current_platform.get_attn_backend_cls(
-        selected_backend, head_size, dtype, kv_cache_dtype, block_size, use_v1,
-        use_mla, has_sink, use_sparse)
+        selected_backend,
+        head_size,
+        dtype,
+        kv_cache_dtype,
+        block_size,
+        use_v1,
+        use_mla,
+        has_sink,
+        use_sparse,
+    )
     if not attention_cls:
         raise ValueError(
-            f"Invalid attention backend for {current_platform.device_name}")
+            f"Invalid attention backend for {current_platform.device_name}"
+        )
     return resolve_obj_by_qualname(attention_cls)
 
 
 @contextmanager
 def global_force_attn_backend_context_manager(
-        attn_backend: _Backend) -> Generator[None, None, None]:
-    '''
+    attn_backend: _Backend,
+) -> Generator[None, None, None]:
+    """
     Globally force a vLLM attention backend override within a
     context manager, reverting the global attention backend
     override to its prior state upon exiting the context
@@ -230,7 +240,7 @@ def global_force_attn_backend_context_manager(
     Returns:
 
     * Generator
-    '''
+    """
 
     # Save the current state of the global backend override (if any)
     original_value = get_global_forced_attn_backend()
diff --git a/vllm/attention/utils/fa_utils.py b/vllm/attention/utils/fa_utils.py
index dc0af7e28e3e..e13afd46ee96 100644
--- a/vllm/attention/utils/fa_utils.py
+++ b/vllm/attention/utils/fa_utils.py
@@ -10,11 +10,12 @@
 
 if current_platform.is_cuda():
     from vllm import _custom_ops as ops
+
     reshape_and_cache_flash = ops.reshape_and_cache_flash
-    from vllm.vllm_flash_attn import (flash_attn_varlen_func,
-                                      get_scheduler_metadata)
+    from vllm.vllm_flash_attn import flash_attn_varlen_func, get_scheduler_metadata
 elif current_platform.is_xpu():
     from vllm._ipex_ops import ipex_ops as ops
+
     reshape_and_cache_flash = ops.reshape_and_cache_flash
     flash_attn_varlen_func = ops.flash_attn_varlen_func
     get_scheduler_metadata = ops.get_scheduler_metadata
@@ -23,18 +24,23 @@
 def get_flash_attn_version(requires_alibi: bool = False) -> Optional[int]:
     # import here to avoid circular dependencies
     from vllm.platforms import current_platform
+
     if current_platform.is_xpu():
         return 2
     try:
         from vllm.vllm_flash_attn.flash_attn_interface import (
-            fa_version_unsupported_reason, is_fa_version_supported)
+            fa_version_unsupported_reason,
+            is_fa_version_supported,
+        )
+
         device_capability = current_platform.get_device_capability()
 
         assert device_capability is not None
 
         # 1. default version depending on platform
-        fa_version = 3 if (device_capability.major == 9
-                           and is_fa_version_supported(3)) else 2
+        fa_version = (
+            3 if (device_capability.major == 9 and is_fa_version_supported(3)) else 2
+        )
 
         # 2. override if passed by environment
         if envs.VLLM_FLASH_ATTN_VERSION is not None:
@@ -45,17 +51,22 @@ def get_flash_attn_version(requires_alibi: bool = False) -> Optional[int]:
         if device_capability.major == 10 and fa_version == 3:
             logger.warning_once(
                 "Cannot use FA version 3 on Blackwell platform "
-                "defaulting to FA version 2.")
+                "defaulting to FA version 2."
+            )
             fa_version = 2
 
         if requires_alibi and fa_version == 3:
-            logger.warning_once("Cannot use FA version 3 with ALiBi, "
-                                "defaulting to FA version 2.")
+            logger.warning_once(
+                "Cannot use FA version 3 with ALiBi, defaulting to FA version 2."
+            )
             fa_version = 2
 
         if not is_fa_version_supported(fa_version):
-            logger.error("Cannot use FA version %d is not supported due to %s",
-                         fa_version, fa_version_unsupported_reason(fa_version))
+            logger.error(
+                "Cannot use FA version %d is not supported due to %s",
+                fa_version,
+                fa_version_unsupported_reason(fa_version),
+            )
 
         assert is_fa_version_supported(fa_version)
         return fa_version
@@ -64,18 +75,25 @@ def get_flash_attn_version(requires_alibi: bool = False) -> Optional[int]:
 
 
 def flash_attn_supports_fp8() -> bool:
-    return get_flash_attn_version() == 3 and \
-        current_platform.get_device_capability().major == 9
+    return (
+        get_flash_attn_version() == 3
+        and current_platform.get_device_capability().major == 9
+    )
 
 
 def flash_attn_supports_mla():
     from vllm.platforms import current_platform
+
     if current_platform.is_cuda():
         try:
             from vllm.vllm_flash_attn.flash_attn_interface import (
-                is_fa_version_supported)
-            return is_fa_version_supported(3) \
+                is_fa_version_supported,
+            )
+
+            return (
+                is_fa_version_supported(3)
                 and current_platform.get_device_capability()[0] == 9
+            )
         except (ImportError, AssertionError):
             pass
     return False
diff --git a/vllm/attention/utils/kv_sharing_utils.py b/vllm/attention/utils/kv_sharing_utils.py
index b4ae8bdf4d76..93af5bf7e13f 100644
--- a/vllm/attention/utils/kv_sharing_utils.py
+++ b/vllm/attention/utils/kv_sharing_utils.py
@@ -1,13 +1,15 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-def validate_kv_sharing_target(current_layer_name, target_layer_name,
-                               static_forward_context):
-    error_msg = (f"Specified KV sharing target layer for {current_layer_name} "
-                 f"is not valid: target layer {target_layer_name} ")
+def validate_kv_sharing_target(
+    current_layer_name, target_layer_name, static_forward_context
+):
+    error_msg = (
+        f"Specified KV sharing target layer for {current_layer_name} "
+        f"is not valid: target layer {target_layer_name} "
+    )
 
     if current_layer_name == target_layer_name:
-        raise ValueError(error_msg +
-                         "cannot be the same as the current layer.")
+        raise ValueError(error_msg + "cannot be the same as the current layer.")
 
     if target_layer_name not in static_forward_context:
         from vllm.model_executor.models.utils import extract_layer_index
@@ -20,14 +22,12 @@ def validate_kv_sharing_target(current_layer_name, target_layer_name,
         if current_layer_idx <= target_layer_idx:
             raise ValueError(error_msg + "must come before the current layer.")
         else:
-            raise ValueError(error_msg +
-                             "is not a valid Attention layer in the model.")
+            raise ValueError(error_msg + "is not a valid Attention layer in the model.")
 
     # Currently KV sharing is only supported between layers of the same type
-    target_layer_attn_type = static_forward_context[
-        target_layer_name].attn_type
+    target_layer_attn_type = static_forward_context[target_layer_name].attn_type
     expected = static_forward_context[current_layer_name].attn_type
     if target_layer_attn_type != expected:
         raise ValueError(
-            error_msg +
-            f"must be the same type as the current layer ({expected}).")
+            error_msg + f"must be the same type as the current layer ({expected})."
+        )
diff --git a/vllm/beam_search.py b/vllm/beam_search.py
index 01124872e98c..e0ba863b9210 100644
--- a/vllm/beam_search.py
+++ b/vllm/beam_search.py
@@ -18,6 +18,7 @@ class BeamSearchSequence:
     The text field is optional and will only be filled when the sequence is
     about to be returned to the user.
     """
+
     # The tokens include the prompt.
     tokens: list[int]
     logprobs: list[dict[int, Logprob]]
@@ -36,11 +37,11 @@ class BeamSearchOutput:
     It contains the list of the best beam search sequences.
     The length of the list is equal to the beam width.
     """
+
     sequences: list[BeamSearchSequence]
 
 
 class BeamSearchInstance:
-
     def __init__(
         self,
         prompt_tokens: list[int],
@@ -79,9 +80,9 @@ def get_beam_search_score(
 
 
 def create_sort_beams_key_function(eos_token_id: int, length_penalty: float):
-
     def sort_beams_key(x: BeamSearchSequence) -> float:
-        return get_beam_search_score(x.tokens, x.cum_logprob, eos_token_id,
-                                     length_penalty)
+        return get_beam_search_score(
+            x.tokens, x.cum_logprob, eos_token_id, length_penalty
+        )
 
     return sort_beams_key
diff --git a/vllm/benchmarks/datasets.py b/vllm/benchmarks/datasets.py
index bf0defc24542..1103c5a88837 100644
--- a/vllm/benchmarks/datasets.py
+++ b/vllm/benchmarks/datasets.py
@@ -11,6 +11,7 @@
   - HuggingFace
   - VisionArena
 """
+
 import argparse
 import ast
 import base64
@@ -77,9 +78,7 @@ class SampleRequest:
     prompt: Union[str, list[str]]
     prompt_len: int
     expected_output_len: int
-    multi_modal_data: Optional[
-        Union[MultiModalDataDict, dict, list[dict]]
-    ] = None
+    multi_modal_data: Optional[Union[MultiModalDataDict, dict, list[dict]]] = None
     lora_request: Optional[LoRARequest] = None
     request_id: Optional[str] = None
 
@@ -111,16 +110,14 @@ def __init__(
         self.dataset_path = dataset_path
         # Set the random seed, ensuring that a None value is replaced with the
         # default seed.
-        self.random_seed = (random_seed
-                            if random_seed is not None else self.DEFAULT_SEED)
+        self.random_seed = random_seed if random_seed is not None else self.DEFAULT_SEED
         self.data = None
 
     def apply_multimodal_chat_transformation(
-            self,
-            prompt: str,
-            mm_content: Optional[
-                        Union[MultiModalDataDict, dict, list[dict]]
-                             ] = None) -> list[dict]:
+        self,
+        prompt: str,
+        mm_content: Optional[Union[MultiModalDataDict, dict, list[dict]]] = None,
+    ) -> list[dict]:
         """
         Transform a prompt and optional multimodal content into a chat format.
         This method is used for chat models that expect a specific conversation
@@ -134,8 +131,8 @@ def apply_multimodal_chat_transformation(
                 content.append(mm_content)
             else:
                 raise TypeError(
-                    "Could not process multimodal content of type: " +
-                    f"{type(mm_content)}"
+                    "Could not process multimodal content of type: "
+                    + f"{type(mm_content)}"
                 )
         return [{"role": "user", "content": content}]
 
@@ -150,8 +147,7 @@ def load_data(self) -> None:
             NotImplementedError: If a subclass does not implement this method.
         """
         # TODO (jenniferzhao): add support for downloading data
-        raise NotImplementedError(
-            "load_data must be implemented in subclasses.")
+        raise NotImplementedError("load_data must be implemented in subclasses.")
 
     def get_random_lora_request(
         self,
@@ -187,10 +183,13 @@ def get_random_lora_request(
         return lora_request
 
     @abstractmethod
-    def sample(self, tokenizer: PreTrainedTokenizerBase,
-               num_requests: int,
-               request_id_prefix: str = "",
-               no_oversample: bool = False) -> list[SampleRequest]:
+    def sample(
+        self,
+        tokenizer: PreTrainedTokenizerBase,
+        num_requests: int,
+        request_id_prefix: str = "",
+        no_oversample: bool = False,
+    ) -> list[SampleRequest]:
         """
         Abstract method to generate sample requests from the dataset.
 
@@ -229,8 +228,7 @@ def maybe_oversample_requests(
 
         """
         if no_oversample:
-            logger.info("Skipping oversampling. " \
-            "Total samples: %d.", len(requests))
+            logger.info("Skipping oversampling. Total samples: %d.", len(requests))
             return
 
         if len(requests) < num_requests:
@@ -242,14 +240,15 @@ def maybe_oversample_requests(
                 req.request_id = request_id_prefix + str(len(requests) + i)
                 additional.append(req)
             requests.extend(additional)
-            logger.info("Oversampled requests to reach %d total samples.",
-                        num_requests)
+            logger.info("Oversampled requests to reach %d total samples.", num_requests)
 
         ids = [req.request_id for req in requests]
         if len(ids) != len(set(ids)):
-            raise ValueError("Duplicate request_id found in the sampled "
-                             "requests. Please ensure that each request_id "
-                             "is unique.")
+            raise ValueError(
+                "Duplicate request_id found in the sampled "
+                "requests. Please ensure that each request_id "
+                "is unique."
+            )
 
 
 # -----------------------------------------------------------------------------
@@ -274,14 +273,14 @@ def is_valid_sequence(
     """
     # Check for invalid conditions
     prompt_too_short = prompt_len < min_len
-    output_too_short = (not skip_min_output_len_check) and (output_len
-                                                            < min_len)
+    output_too_short = (not skip_min_output_len_check) and (output_len < min_len)
     prompt_too_long = prompt_len > max_prompt_len
     combined_too_long = (prompt_len + output_len) > max_total_len
 
     # Return True if none of the invalid conditions are met
-    return not (prompt_too_short or output_too_short or prompt_too_long
-                or combined_too_long)
+    return not (
+        prompt_too_short or output_too_short or prompt_too_long or combined_too_long
+    )
 
 
 @cache
@@ -313,28 +312,30 @@ def process_image(image: Any) -> Mapping[str, Any]:
     Raises:
         ValueError: If the input is not a supported type.
     """
-    if isinstance(image, dict) and 'bytes' in image:
-        image = Image.open(BytesIO(image['bytes']))
+    if isinstance(image, dict) and "bytes" in image:
+        image = Image.open(BytesIO(image["bytes"]))
     if isinstance(image, Image.Image):
         image = convert_image_mode(image, "RGB")
         with io.BytesIO() as image_data:
             image.save(image_data, format="JPEG")
-            image_base64 = base64.b64encode(
-                image_data.getvalue()).decode("utf-8")
+            image_base64 = base64.b64encode(image_data.getvalue()).decode("utf-8")
         return {
             "type": "image_url",
-            "image_url": {
-                "url": f"data:image/jpeg;base64,{image_base64}"
-            },
+            "image_url": {"url": f"data:image/jpeg;base64,{image_base64}"},
         }
 
     if isinstance(image, str):
-        image_url = (image if image.startswith(
-            ("http://", "https://", "file://")) else f"file://{image}")
+        image_url = (
+            image
+            if image.startswith(("http://", "https://", "file://"))
+            else f"file://{image}"
+        )
         return {"type": "image_url", "image_url": {"url": image_url}}
 
-    raise ValueError(f"Invalid image input {image}. Must be a PIL.Image.Image"
-                     " or str or dictionary with raw image bytes.")
+    raise ValueError(
+        f"Invalid image input {image}. Must be a PIL.Image.Image"
+        " or str or dictionary with raw image bytes."
+    )
 
 
 def process_video(video: Any) -> Mapping[str, Any]:
@@ -353,19 +354,20 @@ def process_video(video: Any) -> Mapping[str, Any]:
     Raises:
         ValueError: If the input is not a supported type.
     """
-    if isinstance(video, dict) and 'bytes' in video:
-        video_bytes = video['bytes']
+    if isinstance(video, dict) and "bytes" in video:
+        video_bytes = video["bytes"]
         video_base64 = base64.b64encode(video_bytes).decode("utf-8")
         return {
             "type": "video_url",
-            "video_url": {
-                "url": f"data:video/mp4;base64,{video_base64}"
-            },
+            "video_url": {"url": f"data:video/mp4;base64,{video_base64}"},
         }
 
     if isinstance(video, str):
-        video_url = (video if video.startswith(
-            ("http://", "https://", "file://")) else f"file://{video}")
+        video_url = (
+            video
+            if video.startswith(("http://", "https://", "file://"))
+            else f"file://{video}"
+        )
         return {"type": "video_url", "video_url": {"url": video_url}}
 
     raise ValueError(
@@ -385,8 +387,8 @@ def gen_prompt_decode_to_target_len(
     Ensure decoded-then-encoded prompt length matches the target token length.
 
     This function decodes an initial token sequence to text and re-encodes it
-    , iteratively adjusting the token sequence length to match a target. 
-    This is necessary because some tokenizers do not guarantee a 1:1 mapping 
+    , iteratively adjusting the token sequence length to match a target.
+    This is necessary because some tokenizers do not guarantee a 1:1 mapping
     between consecutive tokens and the decoded-then-encoded sequence length.
     For example, for GPT2Tokenizer:
     [6880, 6881] -> ['Ġcalls', 'here'] ->
@@ -398,14 +400,12 @@ def gen_prompt_decode_to_target_len(
     token_mismatch = 0
     while True:
         prompt = tokenizer.decode(token_sequence)
-        token_sequence = tokenizer.encode(
-            prompt, add_special_tokens=add_special_tokens
-        )
+        token_sequence = tokenizer.encode(prompt, add_special_tokens=add_special_tokens)
         if remain_num_try <= 0:
             if len(token_sequence) != target_token_len:
                 token_mismatch = len(token_sequence) - target_token_len
             break
-        
+
         if len(token_sequence) == target_token_len:
             break
         elif len(token_sequence) < target_token_len:
@@ -429,10 +429,12 @@ def gen_prompt_decode_to_target_len(
 
     return prompt, token_sequence, token_mismatch
 
+
 # -----------------------------------------------------------------------------
 # Random Dataset Implementation (Synthetic Data)
 # -----------------------------------------------------------------------------
 
+
 class RandomDataset(BenchmarkDataset):
     """
     Synthetic text-only dataset for serving/throughput benchmarks.
@@ -446,6 +448,7 @@ class RandomDataset(BenchmarkDataset):
     - Decode then re-encode/truncate to ensure prompt token counts match.
     - Uses numpy.default_rng seeded with random_seed for reproducible sampling.
     """
+
     # Default values copied from benchmark_serving.py for the random dataset.
     DEFAULT_PREFIX_LEN = 0
     DEFAULT_RANGE_RATIO = 0.0
@@ -472,7 +475,6 @@ def sample(
         batchsize: int = 1,
         **kwargs,
     ) -> list[SampleRequest]:
-
         input_lens, output_lens, offsets = self.get_sampling_params(
             num_requests, range_ratio, input_len, output_len, tokenizer
         )
@@ -484,7 +486,7 @@ def sample(
         requests = []
         token_mismatch_total = 0
         for i in range(num_requests):
-            prompt, total_input_len, token_mismatch = self.generate_token_sequence( # noqa: E501
+            prompt, total_input_len, token_mismatch = self.generate_token_sequence(  # noqa: E501
                 tokenizer=tokenizer,
                 prefix_token_ids=prefix_token_ids,
                 prefix_len=prefix_len,
@@ -517,7 +519,7 @@ def sample(
                     )
                 )
             requests = batch_requests
-        
+
         if token_mismatch_total != 0:
             sign = "more" if token_mismatch_total > 0 else "fewer"
             logger.warning(
@@ -538,8 +540,7 @@ def get_prefix(
         Get the prefix for the dataset.
         """
         return (
-            self._rng.integers(
-                0, tokenizer.vocab_size, size=prefix_len).tolist()
+            self._rng.integers(0, tokenizer.vocab_size, size=prefix_len).tolist()
             if prefix_len > 0
             else []
         )
@@ -571,8 +572,7 @@ def get_sampling_params(
 
         if input_low > input_high:
             raise ValueError(
-                "Invalid input sampling interval: "
-                f"low={input_low} > high={input_high}"
+                f"Invalid input sampling interval: low={input_low} > high={input_high}"
             )
         if output_low > output_high:
             raise ValueError(
@@ -588,12 +588,9 @@ def get_sampling_params(
             output_high,
         )
 
-        input_lens = self._rng.integers(input_low, input_high + 1,
-                                           size=num_requests)
-        output_lens = self._rng.integers(output_low, output_high + 1,
-                                            size=num_requests)
-        offsets = self._rng.integers(0, tokenizer.vocab_size,
-                                        size=num_requests)
+        input_lens = self._rng.integers(input_low, input_high + 1, size=num_requests)
+        output_lens = self._rng.integers(output_low, output_high + 1, size=num_requests)
+        offsets = self._rng.integers(0, tokenizer.vocab_size, size=num_requests)
         return input_lens, output_lens, offsets
 
     def generate_token_sequence(
@@ -620,18 +617,19 @@ def generate_token_sequence(
         the encoded sequence is truncated before being decoded again.
         """
         # Build the inner sequence by sampling sequentially from the vocab
-        inner_seq = ((offset + index + np.arange(input_len))
-                    % vocab_size).tolist()
+        inner_seq = ((offset + index + np.arange(input_len)) % vocab_size).tolist()
         token_sequence = prefix_token_ids + inner_seq
 
         # Decode, then re-encode and truncate to preserve token count invariants
         total_input_len = prefix_len + int(input_len)
-        prompt, adjusted_token_sequence, token_mismatch = gen_prompt_decode_to_target_len( # noqa: E501
-            tokenizer=tokenizer,
-            token_sequence=token_sequence,
-            target_token_len=total_input_len,
-            add_special_tokens=False,
-            rng=self._rng,
+        prompt, adjusted_token_sequence, token_mismatch = (
+            gen_prompt_decode_to_target_len(  # noqa: E501
+                tokenizer=tokenizer,
+                token_sequence=token_sequence,
+                target_token_len=total_input_len,
+                add_special_tokens=False,
+                rng=self._rng,
+            )
         )
         total_input_len = len(adjusted_token_sequence)
         return prompt, total_input_len, token_mismatch
@@ -641,6 +639,7 @@ def generate_token_sequence(
 # MultiModalDataset Implementation
 # -----------------------------------------------------------------------------
 
+
 class RandomMultiModalDataset(RandomDataset):
     """
     Synthetic multimodal dataset (text + images) that extends RandomDataset.
@@ -687,7 +686,6 @@ class RandomMultiModalDataset(RandomDataset):
     def __init__(self, **kwargs) -> None:
         super().__init__(**kwargs)
 
-
     def generate_synthetic_image(self, width: int, height: int) -> Image.Image:
         """Generate synthetic PIL image with random RGB values.
 
@@ -704,9 +702,7 @@ def generate_synthetic_image(self, width: int, height: int) -> Image.Image:
         )
         return Image.fromarray(random_pixels)
 
-    def generate_synthetic_video(self, width: int,
-                                    height: int,
-                                    num_frames: int) -> Any:
+    def generate_synthetic_video(self, width: int, height: int, num_frames: int) -> Any:
         """Generate synthetic video with random values.
 
         TODO: Finish this method.
@@ -722,8 +718,9 @@ def map_config_to_modality(self, config: tuple[int, int, int]) -> str:
         else:
             raise ValueError(f"Invalid multimodal item configuration: {config}")
 
-    def normalize_bucket_config(self, bucket_config: dict[tuple[int, int, int],
-                                float]) -> dict[tuple[int, int, int], float]:
+    def normalize_bucket_config(
+        self, bucket_config: dict[tuple[int, int, int], float]
+    ) -> dict[tuple[int, int, int], float]:
         """
         Remove zero probability entries
         and normalize the bucket config to sum to 1.
@@ -735,16 +732,17 @@ def normalize_bucket_config(self, bucket_config: dict[tuple[int, int, int],
         bucket_config = {k: v for k, v in bucket_config.items() if v > 0}
         # if bucket config is empty, raise error
         if not bucket_config:
-            raise ValueError("Got invalid bucket config. "
-                             "Bucket config values must be non-zero.")
+            raise ValueError(
+                "Got invalid bucket config. Bucket config values must be non-zero."
+            )
         # Normalize the remaining bucket config to sum to 1
         total = sum(bucket_config.values())
         return {k: v / total for k, v in bucket_config.items()}
 
-
-    def generate_mm_item(self,
-                         mm_item_config: tuple[int, int, int],
-                         ) -> Mapping[str, Any]:
+    def generate_mm_item(
+        self,
+        mm_item_config: tuple[int, int, int],
+    ) -> Mapping[str, Any]:
         """
         Create synthetic images and videos and
         apply process_image/process_video respectively.
@@ -753,18 +751,17 @@ def generate_mm_item(self,
         """
 
         if self.map_config_to_modality(mm_item_config) == "image":
-            return process_image(self.generate_synthetic_image(
-                                                            mm_item_config[1],
-                                                            mm_item_config[0]))
+            return process_image(
+                self.generate_synthetic_image(mm_item_config[1], mm_item_config[0])
+            )
         elif self.map_config_to_modality(mm_item_config) == "video":
-            return process_video(self.generate_synthetic_video(
-                                                            mm_item_config[1],
-                                                            mm_item_config[0],
-                                                            mm_item_config[2]))
+            return process_video(
+                self.generate_synthetic_video(
+                    mm_item_config[1], mm_item_config[0], mm_item_config[2]
+                )
+            )
         else:
-            raise ValueError(f"Invalid multimodal item configuration: "
-                             f"{mm_item_config}")
-
+            raise ValueError(f"Invalid multimodal item configuration: {mm_item_config}")
 
     def get_mm_item_sampling_params(
         self,
@@ -785,49 +782,53 @@ def get_mm_item_sampling_params(
             # get modality from bucket config
             modality = self.map_config_to_modality(k)
             if modality not in limit_mm_per_prompt:
-                raise ValueError(f"Modality {modality} is not in "
-                                 f"limit_mm_per_prompt: "
-                                 f"{limit_mm_per_prompt.keys()}")
+                raise ValueError(
+                    f"Modality {modality} is not in "
+                    f"limit_mm_per_prompt: "
+                    f"{limit_mm_per_prompt.keys()}"
+                )
 
         # Remove zero probability entries
         # and normalize bucket config to sum to 1
         bucket_config = self.normalize_bucket_config(bucket_config)
         logger.info(
-            "Normalized bucket config: %s", bucket_config,
+            "Normalized bucket config: %s",
+            bucket_config,
         )
         # Only consider limit per prompt for modalities in bucket config
-        allowed_modalities = {self.map_config_to_modality(cfg)
-                              for cfg in bucket_config}
+        allowed_modalities = {self.map_config_to_modality(cfg) for cfg in bucket_config}
         limit_mm_per_prompt = {
-            k: v for k, v in limit_mm_per_prompt.items()
-            if k in allowed_modalities}
+            k: v for k, v in limit_mm_per_prompt.items() if k in allowed_modalities
+        }
         if not limit_mm_per_prompt:
-            raise ValueError("No valid limits for modalities present in "
-                             "bucket_config.")
+            raise ValueError("No valid limits for modalities present in bucket_config.")
 
         logger.info(
-            "Updated mm-limit-per-prompt: %s", limit_mm_per_prompt,
+            "Updated mm-limit-per-prompt: %s",
+            limit_mm_per_prompt,
         )
 
         # Get max and min num mm items and ensure
         # it is at most the sum of limit_mm_per_prompt for all modalities
         max_num_mm_items = min(
             sum(limit_mm_per_prompt.values()),
-            math.ceil(base_items_per_request * (1 + num_mm_items_range_ratio))
+            math.ceil(base_items_per_request * (1 + num_mm_items_range_ratio)),
         )
         # Ensure min num mm items is at least 0
         min_num_mm_items = max(
-            0,
-            math.floor(base_items_per_request * (1 - num_mm_items_range_ratio))
+            0, math.floor(base_items_per_request * (1 - num_mm_items_range_ratio))
         )
         # Raise error if min num mm items is greater than max num mm items
         if min_num_mm_items > max_num_mm_items:
-            raise ValueError(f"Min num mm items is greater than max mm items: "
-                             f"{min_num_mm_items} > {max_num_mm_items}")
+            raise ValueError(
+                f"Min num mm items is greater than max mm items: "
+                f"{min_num_mm_items} > {max_num_mm_items}"
+            )
 
         logger.info(
             "Sampling number of multimodal items from [%s, %s]",
-            min_num_mm_items, max_num_mm_items,
+            min_num_mm_items,
+            max_num_mm_items,
         )
 
         return (
@@ -843,7 +844,7 @@ def get_mm_item_iterator(
         max_num_mm_items: int,
         bucket_config: dict[tuple[int, int, int], float],
         limit_mm_per_prompt: dict[str, int],
-    ) -> Iterator[tuple[int,int, int]]:
+    ) -> Iterator[tuple[int, int, int]]:
         """
         Iterator over the multimodal items for each request
         whose size is between min_num_mm_items and max_num_mm_items.
@@ -867,22 +868,20 @@ def get_mm_item_iterator(
         if request_num_mm_items == 0:
             return
         # Initialize modality counters
-        modality_counter = {self.map_config_to_modality(k): 0
-                            for k in bucket_config}
+        modality_counter = {self.map_config_to_modality(k): 0 for k in bucket_config}
         # Copy the bucket config to avoid modifying the original
         bucket_config_copy = bucket_config.copy()
         # Loop over the number of multimodal items to sample
         while sum(modality_counter.values()) < request_num_mm_items:
             # Sample a multimodal item config
-            mm_item_config = self._rng.choice(list(bucket_config_copy.keys()),
-                                                p=list(bucket_config_copy.values()))
+            mm_item_config = self._rng.choice(
+                list(bucket_config_copy.keys()), p=list(bucket_config_copy.values())
+            )
             modality = self.map_config_to_modality(mm_item_config)
             # Check that modality count is less than limit per prompt
             if modality_counter[modality] < limit_mm_per_prompt[modality]:
                 modality_counter[modality] += 1
-                yield (
-                    mm_item_config
-                )
+                yield (mm_item_config)
             else:
                 # If the counter is greater than the limit per prompt
                 # set all multimodal items of this modality to 0
@@ -893,14 +892,12 @@ def get_mm_item_iterator(
                 # This should not happen as request_num_mm_items is at most
                 # the sum of limit_mm_per_prompt for all modalities
                 if all(v == 0 for v in bucket_config_copy.values()):
-                    logger.warning("Exhausted all multimodal items "
-                                   "of modality %s",
-                                   modality)
+                    logger.warning(
+                        "Exhausted all multimodal items of modality %s", modality
+                    )
                     break
                 # Renormalize the bucket config
-                bucket_config_copy = self.normalize_bucket_config(
-                                        bucket_config_copy)
-
+                bucket_config_copy = self.normalize_bucket_config(bucket_config_copy)
 
     def sample(
         self,
@@ -915,18 +912,21 @@ def sample(
         limit_mm_per_prompt: dict[str, int] = DEFAULT_LIMIT_MM_PER_PROMPT,
         base_items_per_request: int = DEFAULT_BASE_ITEMS_PER_REQUEST,
         num_mm_items_range_ratio: float = DEFAULT_NUM_MM_ITEMS_RANGE_RATIO,
-        bucket_config: dict[tuple[int, int, int], float] =
-                                        DEFAULT_MM_ITEM_BUCKET_CONFIG,
+        bucket_config: dict[
+            tuple[int, int, int], float
+        ] = DEFAULT_MM_ITEM_BUCKET_CONFIG,
         enable_multimodal_chat: bool = DEFAULT_ENABLE_MULTIMODAL_CHAT,
         **kwargs,
     ) -> list[SampleRequest]:
-
         # NOTE: Video sampling is WIP. Raise error if video is in bucket config
         # and probability is non-zero.
-        if any(self.map_config_to_modality(cfg) == "video" and p > 0
-                for cfg, p in bucket_config.items()):
-            raise NotImplementedError("Video sampling not implemented; "
-                                      "set its probability to 0.")
+        if any(
+            self.map_config_to_modality(cfg) == "video" and p > 0
+            for cfg, p in bucket_config.items()
+        ):
+            raise NotImplementedError(
+                "Video sampling not implemented; set its probability to 0."
+            )
 
         # Get the sampling parameters for the dataset
         input_lens, output_lens, offsets = self.get_sampling_params(
@@ -952,7 +952,7 @@ def sample(
         mm_requests = []
         token_mismatch_total = 0
         for i in range(num_requests):
-            prompt, total_input_len, token_mismatch = self.generate_token_sequence( # noqa: E501
+            prompt, total_input_len, token_mismatch = self.generate_token_sequence(  # noqa: E501
                 tokenizer=tokenizer,
                 prefix_token_ids=prefix_token_ids,
                 prefix_len=prefix_len,
@@ -970,17 +970,21 @@ def sample(
                 limit_mm_per_prompt,
             )
 
-            mm_content = cast(list[dict[str, Any]], [
-                self.generate_mm_item(mm_item_config)
-                for mm_item_config in mm_item_iterator
-            ])
+            mm_content = cast(
+                list[dict[str, Any]],
+                [
+                    self.generate_mm_item(mm_item_config)
+                    for mm_item_config in mm_item_iterator
+                ],
+            )
 
             if enable_multimodal_chat:
                 # NOTE: For now this option is only provided for completeness
                 # given that the serve.py benchmark currently does not use it.
                 mm_chat_prompt: Any = prompt
                 mm_chat_prompt = self.apply_multimodal_chat_transformation(
-                    prompt, mm_content)
+                    prompt, mm_content
+                )
                 sample_request = SampleRequest(
                     prompt=mm_chat_prompt,
                     prompt_len=total_input_len,
@@ -1011,6 +1015,7 @@ def sample(
 
         return mm_requests
 
+
 # -----------------------------------------------------------------------------
 # ShareGPT Dataset Implementation
 # -----------------------------------------------------------------------------
@@ -1034,7 +1039,8 @@ def load_data(self) -> None:
             self.data = json.load(f)
         # Filter entries with at least two conversation turns.
         self.data = [
-            entry for entry in self.data
+            entry
+            for entry in self.data
             if "conversations" in entry and len(entry["conversations"]) >= 2
         ]
         random.seed(self.random_seed)
@@ -1063,16 +1069,17 @@ def sample(
             )
 
             lora_request = self.get_random_lora_request(
-                max_loras=max_loras, lora_path=lora_path)
+                max_loras=max_loras, lora_path=lora_path
+            )
             prompt_ids = tokenizer(prompt).input_ids
             completion_ids = tokenizer(completion).input_ids
             prompt_len = len(prompt_ids)
-            new_output_len = (len(completion_ids)
-                              if output_len is None else output_len)
-            if not is_valid_sequence(prompt_len,
-                                     new_output_len,
-                                     skip_min_output_len_check=output_len
-                                     is not None):
+            new_output_len = len(completion_ids) if output_len is None else output_len
+            if not is_valid_sequence(
+                prompt_len,
+                new_output_len,
+                skip_min_output_len_check=output_len is not None,
+            ):
                 continue
             if image_path := entry.get("image"):
                 mm_content = process_image(image_path)
@@ -1081,8 +1088,7 @@ def sample(
             else:
                 mm_content = None
             if enable_multimodal_chat:
-                prompt = self.apply_multimodal_chat_transformation(
-                    prompt, mm_content)
+                prompt = self.apply_multimodal_chat_transformation(prompt, mm_content)
             samples.append(
                 SampleRequest(
                     prompt=prompt,
@@ -1091,23 +1097,24 @@ def sample(
                     lora_request=lora_request,
                     multi_modal_data=mm_content,
                     request_id=request_id_prefix + str(ind),
-                ))
+                )
+            )
             ind += 1
-        self.maybe_oversample_requests(samples,
-                                       num_requests,
-                                       request_id_prefix,
-                                       no_oversample)
+        self.maybe_oversample_requests(
+            samples, num_requests, request_id_prefix, no_oversample
+        )
         return samples
 
 
 class _ValidateDatasetArgs(argparse.Action):
     """Argparse action to validate dataset name and path compatibility."""
+
     def __call__(self, parser, namespace, values, option_string=None):
         setattr(namespace, self.dest, values)
 
         # Get current values of both dataset_name and dataset_path
-        dataset_name = getattr(namespace, 'dataset_name', 'random')
-        dataset_path = getattr(namespace, 'dataset_path', None)
+        dataset_name = getattr(namespace, "dataset_name", "random")
+        dataset_path = getattr(namespace, "dataset_path", None)
 
         # Validate the combination
         if dataset_name == "random" and dataset_path is not None:
@@ -1133,8 +1140,15 @@ def add_dataset_parser(parser: FlexibleArgumentParser):
         default="random",
         action=_ValidateDatasetArgs,
         choices=[
-            "sharegpt", "burstgpt", "sonnet", "random", "random-mm", "hf",
-            "custom", "prefix_repetition", "spec_bench"
+            "sharegpt",
+            "burstgpt",
+            "sonnet",
+            "random",
+            "random-mm",
+            "hf",
+            "custom",
+            "prefix_repetition",
+            "spec_bench",
         ],
         help="Name of the dataset to benchmark on.",
     )
@@ -1154,14 +1168,12 @@ def add_dataset_parser(parser: FlexibleArgumentParser):
     parser.add_argument(
         "--no-oversample",
         action="store_true",
-        help="Do not oversample if the dataset has " \
-        "fewer samples than num-prompts.",
+        help="Do not oversample if the dataset has fewer samples than num-prompts.",
     )
     parser.add_argument(
         "--skip-chat-template",
         action="store_true",
-        help=
-        "Skip applying chat template to prompt for datasets that support it.",
+        help="Skip applying chat template to prompt for datasets that support it.",
     )
 
     # group for dataset specific arguments
@@ -1170,8 +1182,7 @@ def add_dataset_parser(parser: FlexibleArgumentParser):
         "--custom-output-len",
         type=int,
         default=256,
-        help=
-        "Number of output tokens per request, used only for custom dataset.",
+        help="Number of output tokens per request, used only for custom dataset.",
     )
 
     spec_bench_group = parser.add_argument_group("spec bench dataset options")
@@ -1179,15 +1190,13 @@ def add_dataset_parser(parser: FlexibleArgumentParser):
         "--spec-bench-output-len",
         type=int,
         default=256,
-        help=
-        "Num of output tokens per request, used only for spec bench dataset.",
+        help="Num of output tokens per request, used only for spec bench dataset.",
     )
     spec_bench_group.add_argument(
         "--spec-bench-category",
         type=str,
         default=None,
-        help=
-        "Category for spec bench dataset. If None, use all categories.",
+        help="Category for spec bench dataset. If None, use all categories.",
     )
 
     sonnet_group = parser.add_argument_group("sonnet dataset options")
@@ -1195,22 +1204,19 @@ def add_dataset_parser(parser: FlexibleArgumentParser):
         "--sonnet-input-len",
         type=int,
         default=550,
-        help=
-        "Number of input tokens per request, used only for sonnet dataset.",
+        help="Number of input tokens per request, used only for sonnet dataset.",
     )
     sonnet_group.add_argument(
         "--sonnet-output-len",
         type=int,
         default=150,
-        help=
-        "Number of output tokens per request, used only for sonnet dataset.",
+        help="Number of output tokens per request, used only for sonnet dataset.",
     )
     sonnet_group.add_argument(
         "--sonnet-prefix-len",
         type=int,
         default=200,
-        help=
-        "Number of prefix tokens per request, used only for sonnet dataset.",
+        help="Number of prefix tokens per request, used only for sonnet dataset.",
     )
 
     sharegpt_group = parser.add_argument_group("sharegpt dataset options")
@@ -1227,15 +1233,13 @@ def add_dataset_parser(parser: FlexibleArgumentParser):
         "--blazedit-min-distance",
         type=float,
         default=0.0,
-        help=
-        "Minimum distance for blazedit dataset. Min: 0, Max: 1.0",
+        help="Minimum distance for blazedit dataset. Min: 0, Max: 1.0",
     )
     blazedit_group.add_argument(
         "--blazedit-max-distance",
         type=float,
         default=1.0,
-        help=
-        "Maximum distance for blazedit dataset. Min: 0, Max: 1.0",
+        help="Maximum distance for blazedit dataset. Min: 0, Max: 1.0",
     )
 
     random_group = parser.add_argument_group("random dataset options")
@@ -1243,15 +1247,13 @@ def add_dataset_parser(parser: FlexibleArgumentParser):
         "--random-input-len",
         type=int,
         default=1024,
-        help=
-        "Number of input tokens per request, used only for random sampling.",
+        help="Number of input tokens per request, used only for random sampling.",
     )
     random_group.add_argument(
         "--random-output-len",
         type=int,
         default=128,
-        help=
-        "Number of output tokens per request, used only for random sampling.",
+        help="Number of output tokens per request, used only for random sampling.",
     )
     random_group.add_argument(
         "--random-range-ratio",
@@ -1266,24 +1268,26 @@ def add_dataset_parser(parser: FlexibleArgumentParser):
         "--random-prefix-len",
         type=int,
         default=0,
-        help=("Number of fixed prefix tokens before the random context "
-              "in a request. "
-              "The total input length is the sum of `random-prefix-len` and "
-              "a random "
-              "context length sampled from [input_len * (1 - range_ratio), "
-              "input_len * (1 + range_ratio)]."),
+        help=(
+            "Number of fixed prefix tokens before the random context "
+            "in a request. "
+            "The total input length is the sum of `random-prefix-len` and "
+            "a random "
+            "context length sampled from [input_len * (1 - range_ratio), "
+            "input_len * (1 + range_ratio)]."
+        ),
     )
     random_group.add_argument(
         "--random-batch-size",
         type=int,
         default=1,
-        help=("Batch size for random sampling. "
-              "Only used for embeddings benchmark."),
+        help=("Batch size for random sampling. Only used for embeddings benchmark."),
     )
 
     # random multimodal dataset options
     random_mm_group = parser.add_argument_group(
-        "random multimodal dataset options extended from random dataset")
+        "random multimodal dataset options extended from random dataset"
+    )
     random_mm_group.add_argument(
         "--random-mm-base-items-per-request",
         type=int,
@@ -1315,7 +1319,7 @@ def add_dataset_parser(parser: FlexibleArgumentParser):
         default=RandomMultiModalDataset.DEFAULT_LIMIT_MM_PER_PROMPT,
         help=(
             "Per-modality hard caps for items attached per request, e.g. "
-            "'{\"image\": 3, \"video\": 0}'. The sampled per-request item "
+            '\'{"image": 3, "video": 0}\'. The sampled per-request item '
             "count is clamped to the sum of these limits. When a modality "
             "reaches its cap, its buckets are excluded and probabilities are "
             "renormalized."
@@ -1332,8 +1336,11 @@ def normalize(d: dict) -> dict[tuple[int, int, int], float]:
                 if isinstance(key, str):
                     with suppress(Exception):
                         key = ast.literal_eval(key)
-                if not (isinstance(key, tuple) and len(key) == 3
-                        and all(isinstance(x, int) for x in key)):
+                if not (
+                    isinstance(key, tuple)
+                    and len(key) == 3
+                    and all(isinstance(x, int) for x in key)
+                ):
                     raise ValueError(
                         f"Invalid bucket key {k!r}. Expected tuple (H, W, T)."
                     )
@@ -1372,14 +1379,12 @@ def normalize(d: dict) -> dict[tuple[int, int, int], float]:
     )
 
     hf_group = parser.add_argument_group("hf dataset options")
-    hf_group.add_argument("--hf-subset",
-                          type=str,
-                          default=None,
-                          help="Subset of the HF dataset.")
-    hf_group.add_argument("--hf-split",
-                          type=str,
-                          default=None,
-                          help="Split of the HF dataset.")
+    hf_group.add_argument(
+        "--hf-subset", type=str, default=None, help="Subset of the HF dataset."
+    )
+    hf_group.add_argument(
+        "--hf-split", type=str, default=None, help="Split of the HF dataset."
+    )
     hf_group.add_argument(
         "--hf-name",
         type=str,
@@ -1399,7 +1404,8 @@ def normalize(d: dict) -> dict[tuple[int, int, int], float]:
     )
 
     prefix_repetition_group = parser.add_argument_group(
-        "prefix repetition dataset options")
+        "prefix repetition dataset options"
+    )
     prefix_repetition_group.add_argument(
         "--prefix-repetition-prefix-len",
         type=int,
@@ -1431,7 +1437,6 @@ def normalize(d: dict) -> dict[tuple[int, int, int], float]:
 
 
 def get_samples(args, tokenizer) -> list[SampleRequest]:
-
     if not hasattr(args, "request_id_prefix"):
         args.request_id_prefix = ""
 
@@ -1462,7 +1467,8 @@ def get_samples(args, tokenizer) -> list[SampleRequest]:
             )
         else:
             assert tokenizer.chat_template or tokenizer.default_chat_template, (
-                "Tokenizer/model must have chat template for sonnet dataset.")
+                "Tokenizer/model must have chat template for sonnet dataset."
+            )
             input_requests = dataset.sample(
                 num_requests=args.num_prompts,
                 input_len=args.sonnet_input_len,
@@ -1516,8 +1522,7 @@ def get_samples(args, tokenizer) -> list[SampleRequest]:
             dataset_class = AIMODataset
             args.hf_split = "train"
         elif (
-            args.dataset_path
-            in NextEditPredictionDataset.SUPPORTED_DATASET_PATHS  # noqa: E501
+            args.dataset_path in NextEditPredictionDataset.SUPPORTED_DATASET_PATHS  # noqa: E501
             or args.hf_name in NextEditPredictionDataset.SUPPORTED_DATASET_PATHS
         ):
             dataset_class = NextEditPredictionDataset
@@ -1549,26 +1554,31 @@ def get_samples(args, tokenizer) -> list[SampleRequest]:
             args.hf_split = "val"
             args.hf_subset = None
         else:
-            supported_datasets = set([
-                dataset_name for cls in HuggingFaceDataset.__subclasses__()
-                for dataset_name in cls.SUPPORTED_DATASET_PATHS
-            ])
+            supported_datasets = set(
+                [
+                    dataset_name
+                    for cls in HuggingFaceDataset.__subclasses__()
+                    for dataset_name in cls.SUPPORTED_DATASET_PATHS
+                ]
+            )
             raise ValueError(
                 f"Unsupported dataset path: {args.dataset_path}. "
                 "Huggingface dataset only supports dataset_path"
                 f" from one of following: {supported_datasets}. "
                 "Please consider contributing if you would "
-                "like to add support for additional dataset formats.")
+                "like to add support for additional dataset formats."
+            )
 
         if dataset_class.IS_MULTIMODAL and args.backend not in [
-                "openai-chat",
-                "openai-audio",
+            "openai-chat",
+            "openai-audio",
         ]:
             # multi-modal benchmark is only available on OpenAI Chat
             # endpoint-type.
             raise ValueError(
                 "Multi-modal content is only supported on 'openai-chat' and "
-                "'openai-audio' backends.")
+                "'openai-audio' backends."
+            )
         input_requests = dataset_class(
             dataset_path=args.dataset_path,
             dataset_subset=args.hf_subset,
@@ -1583,15 +1593,15 @@ def get_samples(args, tokenizer) -> list[SampleRequest]:
             request_id_prefix=args.request_id_prefix,
             no_oversample=args.no_oversample,
             skip_chat_template=args.skip_chat_template,
-            **hf_kwargs
+            **hf_kwargs,
         )
 
     else:
         # For datasets that follow a similar structure, use a mapping.
         dataset_mapping = {
-            "spec_bench":
-            lambda: SpecBench(dataset_path=args.dataset_path,
-                              category=args.spec_bench_category).sample(
+            "spec_bench": lambda: SpecBench(
+                dataset_path=args.dataset_path, category=args.spec_bench_category
+            ).sample(
                 num_requests=args.num_prompts,
                 tokenizer=tokenizer,
                 output_len=args.spec_bench_output_len,
@@ -1628,8 +1638,7 @@ def get_samples(args, tokenizer) -> list[SampleRequest]:
                 batchsize=args.random_batch_size,
                 no_oversample=args.no_oversample,
             ),
-            "random-mm":
-            lambda: RandomMultiModalDataset(
+            "random-mm": lambda: RandomMultiModalDataset(
                 random_seed=args.seed, dataset_path=args.dataset_path
             ).sample(
                 tokenizer=tokenizer,
@@ -1645,8 +1654,7 @@ def get_samples(args, tokenizer) -> list[SampleRequest]:
                 request_id_prefix=args.request_id_prefix,
                 no_oversample=args.no_oversample,
             ),
-            "prefix_repetition":
-            lambda: PrefixRepetitionRandomDataset(
+            "prefix_repetition": lambda: PrefixRepetitionRandomDataset(
                 random_seed=args.seed, dataset_path=args.dataset_path
             ).sample(
                 tokenizer=tokenizer,
@@ -1662,8 +1670,7 @@ def get_samples(args, tokenizer) -> list[SampleRequest]:
 
         try:
             # Enforce endpoint compatibility for multimodal datasets.
-            if args.dataset_name == "random-mm" and args.backend not in [
-                    "openai-chat"]:
+            if args.dataset_name == "random-mm" and args.backend not in ["openai-chat"]:
                 raise ValueError(
                     "Multi-modal content (images) is only supported on "
                     "'openai-chat' backend."
@@ -1708,8 +1715,7 @@ def load_data(self) -> None:
 
         # Load the JSONL file
         if self.dataset_path.endswith(".jsonl"):
-            jsonl_data = pd.read_json(path_or_buf=self.dataset_path,
-                                      lines=True)
+            jsonl_data = pd.read_json(path_or_buf=self.dataset_path, lines=True)
 
             # check if the JSONL file has a 'prompt' column
             if "prompt" not in jsonl_data.columns:
@@ -1723,7 +1729,8 @@ def load_data(self) -> None:
                 self.data.append(row.to_dict())
         else:
             raise NotImplementedError(
-                "Only JSONL format is supported for CustomDataset.")
+                "Only JSONL format is supported for CustomDataset."
+            )
 
         random.seed(self.random_seed)
         random.shuffle(self.data)
@@ -1745,9 +1752,11 @@ def sample(
         self.num_available_samples = len(self.data)
         if num_requests <= 0:
             num_requests = self.num_available_samples
-            logger.info("num_requests is set to 0 or negative, "
-                        "so using all available samples: %d",
-                        num_requests)
+            logger.info(
+                "num_requests is set to 0 or negative, "
+                "so using all available samples: %d",
+                num_requests,
+            )
 
         sampled_requests = []
         for i, item in enumerate(self.data):
@@ -1758,10 +1767,7 @@ def sample(
             # apply template
             if not skip_chat_template:
                 prompt = tokenizer.apply_chat_template(
-                    [{
-                        "role": "user",
-                        "content": prompt
-                    }],
+                    [{"role": "user", "content": prompt}],
                     add_generation_prompt=True,
                     tokenize=False,
                 )
@@ -1773,9 +1779,11 @@ def sample(
                     prompt_len=prompt_len,
                     expected_output_len=output_len,
                     request_id=request_id_prefix + str(i),
-                ))
-        self.maybe_oversample_requests(sampled_requests, num_requests,
-                                       request_id_prefix, no_oversample)
+                )
+            )
+        self.maybe_oversample_requests(
+            sampled_requests, num_requests, request_id_prefix, no_oversample
+        )
 
         return sampled_requests
 
@@ -1790,7 +1798,7 @@ class SpecBench(CustomDataset):
     Implements the SpecBench dataset: https://github.com/hemingkx/Spec-Bench
     Download the dataset using:
     wget https://raw.githubusercontent.com/hemingkx/Spec-Bench/refs/heads/main/data/spec_bench/question.jsonl
-    """ # noqa: E501
+    """  # noqa: E501
 
     def __init__(self, **kwargs) -> None:
         self.category = kwargs.pop("category", None)
@@ -1804,8 +1812,7 @@ def load_data(self) -> None:
         self.data = []
 
         # Load the JSONL file
-        jsonl_data = pd.read_json(path_or_buf=self.dataset_path,
-                                    lines=True)
+        jsonl_data = pd.read_json(path_or_buf=self.dataset_path, lines=True)
 
         # check if the JSONL file has a 'turns' column
         if "turns" not in jsonl_data.columns:
@@ -1813,7 +1820,7 @@ def load_data(self) -> None:
 
         for _, row in jsonl_data.iterrows():
             # sample only from a specific category if specified
-            if (not self.category) or (self.category == row['category']):
+            if (not self.category) or (self.category == row["category"]):
                 prompt = row["turns"][0]
                 self.data.append({"prompt": prompt})
 
@@ -1829,6 +1836,7 @@ def sample(self, **kwargs) -> list:
 # Sonnet Dataset Implementation
 # -----------------------------------------------------------------------------
 
+
 @deprecated(
     "SonnetDataset is deprecated and will be removed in a future version.",
 )
@@ -1870,20 +1878,20 @@ def sample(
     ) -> list:
         # Calculate average token length for a poem line.
         tokenized_lines = [tokenizer(line).input_ids for line in self.data]
-        avg_len = sum(len(tokens)
-                      for tokens in tokenized_lines) / len(tokenized_lines)
+        avg_len = sum(len(tokens) for tokens in tokenized_lines) / len(tokenized_lines)
 
         # Build the base prompt.
         base_prompt = "Pick as many lines as you can from these poem lines:\n"
         base_msg = [{"role": "user", "content": base_prompt}]
-        base_fmt = tokenizer.apply_chat_template(base_msg,
-                                                 add_generation_prompt=True,
-                                                 tokenize=False)
+        base_fmt = tokenizer.apply_chat_template(
+            base_msg, add_generation_prompt=True, tokenize=False
+        )
         base_offset = len(tokenizer(base_fmt).input_ids)
         if input_len <= base_offset:
             raise ValueError(
                 f"'input_len' must be higher than the base prompt length "
-                f"({base_offset}).")
+                f"({base_offset})."
+            )
 
         # Determine how many poem lines to use.
         num_input_lines = round((input_len - base_offset) / avg_len)
@@ -1893,22 +1901,24 @@ def sample(
         samples = []
         ind = 0
         while len(samples) < num_requests:
-            extra_lines = random.choices(self.data,
-                                         k=num_input_lines - num_prefix_lines)
+            extra_lines = random.choices(
+                self.data, k=num_input_lines - num_prefix_lines
+            )
             prompt = f"{base_prompt}{''.join(prefix_lines + extra_lines)}"
             msg = [{"role": "user", "content": prompt}]
             prompt_formatted = tokenizer.apply_chat_template(
-                msg, add_generation_prompt=True, tokenize=False)
+                msg, add_generation_prompt=True, tokenize=False
+            )
             prompt_len = len(tokenizer(prompt_formatted).input_ids)
             if prompt_len <= input_len:
                 samples.append(
                     SampleRequest(
-                        prompt=prompt_formatted
-                        if return_prompt_formatted else prompt,
+                        prompt=prompt_formatted if return_prompt_formatted else prompt,
                         prompt_len=prompt_len,
                         expected_output_len=output_len,
-                         request_id=request_id_prefix + str(ind),
-                    ))
+                        request_id=request_id_prefix + str(ind),
+                    )
+                )
                 ind += 1
         return samples
 
@@ -1929,7 +1939,9 @@ def __init__(self, **kwargs) -> None:
         super().__init__(**kwargs)
         self.load_data()
 
-    def load_data(self, ):
+    def load_data(
+        self,
+    ):
         if self.dataset_path is None:
             raise ValueError("dataset_path must be provided for loading data.")
 
@@ -1943,8 +1955,7 @@ def load_data(self, ):
 
     def _sample_loaded_data(self, num_requests: int) -> list:
         if num_requests <= len(self.data):
-            data = self.data.sample(n=num_requests,
-                                    random_state=self.random_seed)
+            data = self.data.sample(n=num_requests, random_state=self.random_seed)
         else:
             data = self.data.sample(
                 n=num_requests,
@@ -1970,7 +1981,8 @@ def sample(
             input_len = int(data[i][2])
             output_len = int(data[i][3])
             lora_req = self.get_random_lora_request(
-                max_loras=max_loras, lora_path=lora_path)
+                max_loras=max_loras, lora_path=lora_path
+            )
             vocab_size = tokenizer.vocab_size
             # Generate a synthetic prompt: a list of token IDs computed as (i +
             # j) modulo vocab_size.
@@ -1983,7 +1995,8 @@ def sample(
                     expected_output_len=output_len,
                     lora_request=lora_req,
                     request_id=request_id_prefix + str(i),
-                ))
+                )
+            )
         return samples
 
 
@@ -2030,22 +2043,25 @@ def load_data(self) -> None:
 
 class ConversationDataset(HuggingFaceDataset):
     """Dataset for conversation data with multimodal support."""
+
     SUPPORTED_DATASET_PATHS = {
-        'lmms-lab/LLaVA-OneVision-Data', 'Aeala/ShareGPT_Vicuna_unfiltered'
+        "lmms-lab/LLaVA-OneVision-Data",
+        "Aeala/ShareGPT_Vicuna_unfiltered",
     }
     IS_MULTIMODAL = True
 
-    def sample(self,
-               tokenizer: PreTrainedTokenizerBase,
-               num_requests: int,
-               output_len: Optional[int] = None,
-               enable_multimodal_chat: bool = False,
-               request_id_prefix: str = "",
-               no_oversample: bool = False,
-               **kwargs) -> list:
+    def sample(
+        self,
+        tokenizer: PreTrainedTokenizerBase,
+        num_requests: int,
+        output_len: Optional[int] = None,
+        enable_multimodal_chat: bool = False,
+        request_id_prefix: str = "",
+        no_oversample: bool = False,
+        **kwargs,
+    ) -> list:
         # Filter examples with at least 2 conversations
-        filtered_data = self.data.filter(
-            lambda x: len(x["conversations"]) >= 2)
+        filtered_data = self.data.filter(lambda x: len(x["conversations"]) >= 2)
         sampled_requests = []
         ind = 0
         dynamic_output = output_len is None
@@ -2062,17 +2078,14 @@ def sample(self,
             completion_len = len(completion_ids)
             output_len = completion_len if dynamic_output else output_len
             assert isinstance(output_len, int) and output_len > 0
-            if dynamic_output and not is_valid_sequence(
-                    prompt_len, completion_len):
+            if dynamic_output and not is_valid_sequence(prompt_len, completion_len):
                 continue
-            mm_content = process_image(
-                item["image"]) if "image" in item else None
+            mm_content = process_image(item["image"]) if "image" in item else None
             if enable_multimodal_chat:
                 # Note: when chat is enabled the request prompt_len is no longer
                 # accurate and we will be using request output to count the
                 # actual prompt len and output len
-                prompt = self.apply_multimodal_chat_transformation(
-                    prompt, mm_content)
+                prompt = self.apply_multimodal_chat_transformation(prompt, mm_content)
             sampled_requests.append(
                 SampleRequest(
                     prompt=prompt,
@@ -2080,10 +2093,12 @@ def sample(self,
                     expected_output_len=output_len,
                     multi_modal_data=mm_content,
                     request_id=request_id_prefix + str(ind),
-                ))
+                )
+            )
             ind += 1
-        self.maybe_oversample_requests(sampled_requests, num_requests,
-                                       request_id_prefix, no_oversample)
+        self.maybe_oversample_requests(
+            sampled_requests, num_requests, request_id_prefix, no_oversample
+        )
         return sampled_requests
 
 
@@ -2099,10 +2114,8 @@ class VisionArenaDataset(HuggingFaceDataset):
 
     DEFAULT_OUTPUT_LEN = 128
     SUPPORTED_DATASET_PATHS = {
-        "lmarena-ai/VisionArena-Chat":
-        lambda x: x["conversation"][0][0]["content"],
-        "lmarena-ai/vision-arena-bench-v0.1":
-        lambda x: x["turns"][0][0]["content"]
+        "lmarena-ai/VisionArena-Chat": lambda x: x["conversation"][0][0]["content"],
+        "lmarena-ai/vision-arena-bench-v0.1": lambda x: x["turns"][0][0]["content"],
     }
     IS_MULTIMODAL = True
 
@@ -2116,8 +2129,7 @@ def sample(
         no_oversample: bool = False,
         **kwargs,
     ) -> list:
-        output_len = (output_len
-                      if output_len is not None else self.DEFAULT_OUTPUT_LEN)
+        output_len = output_len if output_len is not None else self.DEFAULT_OUTPUT_LEN
         sampled_requests = []
         for i, item in enumerate(self.data):
             if len(sampled_requests) >= num_requests:
@@ -2132,8 +2144,7 @@ def sample(
                 # Note: when chat is enabled the request prompt_len is no longer
                 # accurate and we will be using request output to count the
                 # actual prompt len
-                prompt = self.apply_multimodal_chat_transformation(
-                    prompt, mm_content)
+                prompt = self.apply_multimodal_chat_transformation(prompt, mm_content)
             sampled_requests.append(
                 SampleRequest(
                     prompt=prompt,
@@ -2141,9 +2152,11 @@ def sample(
                     expected_output_len=output_len,
                     multi_modal_data=mm_content,
                     request_id=request_id_prefix + str(i),
-                ))
-        self.maybe_oversample_requests(sampled_requests, num_requests,
-                                       request_id_prefix, no_oversample)
+                )
+            )
+        self.maybe_oversample_requests(
+            sampled_requests, num_requests, request_id_prefix, no_oversample
+        )
         return sampled_requests
 
 
@@ -2155,10 +2168,9 @@ class MMVUDataset(HuggingFaceDataset):
 
     DEFAULT_OUTPUT_LEN = 128
     SUPPORTED_DATASET_PATHS = {
-        "yale-nlp/MMVU":
-        lambda x: x["question"] + " " + (
-            " ".join(f"{k}.{v}" for k, v in x["choices"].items())
-        ),
+        "yale-nlp/MMVU": lambda x: x["question"]
+        + " "
+        + (" ".join(f"{k}.{v}" for k, v in x["choices"].items())),
     }
 
     def sample(
@@ -2171,8 +2183,7 @@ def sample(
         no_oversample: bool = False,
         **kwargs,
     ) -> list:
-        output_len = (output_len
-                      if output_len is not None else self.DEFAULT_OUTPUT_LEN)
+        output_len = output_len if output_len is not None else self.DEFAULT_OUTPUT_LEN
         sampled_requests = []
         for i, item in enumerate(self.data):
             if len(sampled_requests) >= num_requests:
@@ -2187,8 +2198,7 @@ def sample(
                 # Note: when chat is enabled the request prompt_len is no longer
                 # accurate and we will be using request output to count the
                 # actual prompt len
-                prompt = self.apply_multimodal_chat_transformation(
-                    prompt, mm_content)
+                prompt = self.apply_multimodal_chat_transformation(prompt, mm_content)
             sampled_requests.append(
                 SampleRequest(
                     prompt=prompt,
@@ -2196,9 +2206,11 @@ def sample(
                     expected_output_len=output_len,
                     multi_modal_data=mm_content,
                     request_id=request_id_prefix + str(i),
-                ))
-        self.maybe_oversample_requests(sampled_requests, num_requests,
-                                       request_id_prefix, no_oversample)
+                )
+            )
+        self.maybe_oversample_requests(
+            sampled_requests, num_requests, request_id_prefix, no_oversample
+        )
         return sampled_requests
 
 
@@ -2222,17 +2234,18 @@ class InstructCoderDataset(HuggingFaceDataset):
         "likaixin/InstructCoder",
     }
 
-    def sample(self,
-               tokenizer: PreTrainedTokenizerBase,
-               num_requests: int,
-               output_len: Optional[int] = None,
-               enable_multimodal_chat: bool = False,
-               skip_chat_template: bool = False,
-               request_id_prefix: str = "",
-               no_oversample: bool = False,
-               **kwargs) -> list:
-        output_len = (output_len
-                      if output_len is not None else self.DEFAULT_OUTPUT_LEN)
+    def sample(
+        self,
+        tokenizer: PreTrainedTokenizerBase,
+        num_requests: int,
+        output_len: Optional[int] = None,
+        enable_multimodal_chat: bool = False,
+        skip_chat_template: bool = False,
+        request_id_prefix: str = "",
+        no_oversample: bool = False,
+        **kwargs,
+    ) -> list:
+        output_len = output_len if output_len is not None else self.DEFAULT_OUTPUT_LEN
         sampled_requests = []
         for i, item in enumerate(self.data):
             if len(sampled_requests) >= num_requests:
@@ -2245,10 +2258,7 @@ def sample(self,
             # apply template
             if not skip_chat_template:
                 prompt = tokenizer.apply_chat_template(
-                    [{
-                        "role": "user",
-                        "content": prompt
-                    }],
+                    [{"role": "user", "content": prompt}],
                     add_generation_prompt=True,
                     tokenize=False,
                 )
@@ -2260,9 +2270,11 @@ def sample(self,
                     prompt_len=prompt_len,
                     expected_output_len=output_len,
                     request_id=request_id_prefix + str(i),
-                ))
-        self.maybe_oversample_requests(sampled_requests, num_requests,
-                                       request_id_prefix, no_oversample)
+                )
+            )
+        self.maybe_oversample_requests(
+            sampled_requests, num_requests, request_id_prefix, no_oversample
+        )
         return sampled_requests
 
 
@@ -2297,8 +2309,7 @@ def sample(
         no_oversample: bool = False,
         **kwargs,
     ) -> list:
-        output_len = (output_len
-                      if output_len is not None else self.DEFAULT_OUTPUT_LEN)
+        output_len = output_len if output_len is not None else self.DEFAULT_OUTPUT_LEN
         sampled_requests = []
 
         for i, item in enumerate(self.data):
@@ -2309,10 +2320,7 @@ def sample(
             # apply template
             if not skip_chat_template:
                 prompt = tokenizer.apply_chat_template(
-                    [{
-                        "role": "user",
-                        "content": prompt
-                    }],
+                    [{"role": "user", "content": prompt}],
                     add_generation_prompt=True,
                     tokenize=False,
                 )
@@ -2324,9 +2332,11 @@ def sample(
                     prompt_len=prompt_len,
                     expected_output_len=output_len,
                     request_id=request_id_prefix + str(i),
-                ))
-        self.maybe_oversample_requests(sampled_requests, num_requests,
-                                       request_id_prefix, no_oversample)
+                )
+            )
+        self.maybe_oversample_requests(
+            sampled_requests, num_requests, request_id_prefix, no_oversample
+        )
         return sampled_requests
 
 
@@ -2366,8 +2376,7 @@ def sample(
         max_distance: float = 1.0,
         **kwargs,
     ) -> list:
-        output_len = (output_len
-                      if output_len is not None else self.DEFAULT_OUTPUT_LEN)
+        output_len = output_len if output_len is not None else self.DEFAULT_OUTPUT_LEN
         sampled_requests = []
 
         for i, item in enumerate(self.data):
@@ -2393,15 +2402,12 @@ def sample(
 Change request:
 {change_request}
 
-Please generate the new code file in the "New file" section below.""" # noqa: E501
+Please generate the new code file in the "New file" section below."""  # noqa: E501
 
             # apply template
             if not skip_chat_template:
                 prompt = tokenizer.apply_chat_template(
-                    [{
-                        "role": "user",
-                        "content": prompt
-                    }],
+                    [{"role": "user", "content": prompt}],
                     add_generation_prompt=True,
                     tokenize=False,
                 )
@@ -2414,9 +2420,11 @@ def sample(
                     prompt_len=prompt_len,
                     expected_output_len=output_len,
                     request_id=request_id_prefix + str(i),
-                ))
-        self.maybe_oversample_requests(sampled_requests, num_requests,
-                                       request_id_prefix, no_oversample)
+                )
+            )
+        self.maybe_oversample_requests(
+            sampled_requests, num_requests, request_id_prefix, no_oversample
+        )
 
         return sampled_requests
 
@@ -2430,18 +2438,22 @@ class AIMODataset(HuggingFaceDataset):
     """
     Dataset class for processing a AIMO dataset with reasoning questions.
     """
+
     SUPPORTED_DATASET_PATHS = {
-        "AI-MO/aimo-validation-aime", "AI-MO/NuminaMath-1.5",
-        "AI-MO/NuminaMath-CoT"
+        "AI-MO/aimo-validation-aime",
+        "AI-MO/NuminaMath-1.5",
+        "AI-MO/NuminaMath-CoT",
     }
 
-    def sample(self,
-               tokenizer: PreTrainedTokenizerBase,
-               num_requests: int,
-               output_len: Optional[int] = None,
-               request_id_prefix: str = "",
-               no_oversample: bool = False,
-               **kwargs) -> list:
+    def sample(
+        self,
+        tokenizer: PreTrainedTokenizerBase,
+        num_requests: int,
+        output_len: Optional[int] = None,
+        request_id_prefix: str = "",
+        no_oversample: bool = False,
+        **kwargs,
+    ) -> list:
         sampled_requests = []
         ind = 0
         dynamic_output = output_len is None
@@ -2449,7 +2461,7 @@ def sample(self,
         for item in self.data:
             if len(sampled_requests) >= num_requests:
                 break
-            prompt, completion = item['problem'], item["solution"]
+            prompt, completion = item["problem"], item["solution"]
 
             prompt_ids = tokenizer(prompt).input_ids
             completion_ids = tokenizer(completion).input_ids
@@ -2457,10 +2469,9 @@ def sample(self,
             completion_len = len(completion_ids)
             output_len = completion_len if dynamic_output else output_len
             assert isinstance(output_len, int) and output_len > 0
-            if dynamic_output and not is_valid_sequence(prompt_len,
-                                                        completion_len,
-                                                        max_prompt_len=2048,
-                                                        max_total_len=32000):
+            if dynamic_output and not is_valid_sequence(
+                prompt_len, completion_len, max_prompt_len=2048, max_total_len=32000
+            ):
                 continue
             sampled_requests.append(
                 SampleRequest(
@@ -2469,10 +2480,12 @@ def sample(self,
                     expected_output_len=output_len,
                     multi_modal_data=None,
                     request_id=request_id_prefix + str(ind),
-                ))
+                )
+            )
             ind += 1
-        self.maybe_oversample_requests(sampled_requests, num_requests,
-                                       request_id_prefix, no_oversample)
+        self.maybe_oversample_requests(
+            sampled_requests, num_requests, request_id_prefix, no_oversample
+        )
         return sampled_requests
 
 
@@ -2494,12 +2507,12 @@ def sample(self,
 
 ### Response:
 
-""" # noqa: E501
+"""  # noqa: E501
 
 
 def _format_zeta_prompt(
-        sample: dict,
-        original_start_marker: str = "<|editable_region_start|>") -> dict:
+    sample: dict, original_start_marker: str = "<|editable_region_start|>"
+) -> dict:
     """Format the zeta prompt for the Next Edit Prediction (NEP) dataset.
 
     This function formats examples from the NEP dataset
@@ -2542,10 +2555,14 @@ class NextEditPredictionDataset(HuggingFaceDataset):
         "zed-industries/zeta": _format_zeta_prompt,
     }
 
-    def sample(self, tokenizer: PreTrainedTokenizerBase, num_requests: int,
-               request_id_prefix: str = "",
-               no_oversample: bool = False,
-               **kwargs):
+    def sample(
+        self,
+        tokenizer: PreTrainedTokenizerBase,
+        num_requests: int,
+        request_id_prefix: str = "",
+        no_oversample: bool = False,
+        **kwargs,
+    ):
         formatting_prompt_func = self.MAPPING_PROMPT_FUNCS.get(self.hf_name)
         if formatting_prompt_func is None:
             raise ValueError(f"Unsupported dataset path: {self.hf_name}")
@@ -2557,15 +2574,16 @@ def sample(self, tokenizer: PreTrainedTokenizerBase, num_requests: int,
                     prompt=sample["prompt"],
                     prompt_len=len(tokenizer(sample["prompt"]).input_ids),
                     expected_output_len=len(
-                        tokenizer(sample["expected_output"]).input_ids),
+                        tokenizer(sample["expected_output"]).input_ids
+                    ),
                     request_id=request_id_prefix + str(i),
-                ))
+                )
+            )
             if len(samples) >= num_requests:
                 break
-        self.maybe_oversample_requests(samples,
-                                       num_requests,
-                                       request_id_prefix,
-                                       no_oversample)
+        self.maybe_oversample_requests(
+            samples, num_requests, request_id_prefix, no_oversample
+        )
         return samples
 
 
@@ -2606,8 +2624,7 @@ class ASRDataset(HuggingFaceDataset):
     IS_MULTIMODAL = True
 
     # TODO Whisper-specific. Abstract interface when more models are supported.
-    TRANSCRIPTION_PREAMBLE = (
-        "<|startoftranscript|><|en|><|transcribe|><|notimestamps|>")
+    TRANSCRIPTION_PREAMBLE = "<|startoftranscript|><|en|><|transcribe|><|notimestamps|>"
     skip_long_audios: bool = True
 
     def sample(
@@ -2619,8 +2636,7 @@ def sample(
         no_oversample: bool = False,
         **kwargs,
     ) -> list:
-        output_len = (output_len
-                      if output_len is not None else self.DEFAULT_OUTPUT_LEN)
+        output_len = output_len if output_len is not None else self.DEFAULT_OUTPUT_LEN
         prompt = ASRDataset.TRANSCRIPTION_PREAMBLE
         prompt_len = len(tokenizer(prompt).input_ids)
         sampled_requests = []
@@ -2645,7 +2661,8 @@ def sample(
                     expected_output_len=output_len,
                     multi_modal_data=mm_content,
                     request_id=request_id_prefix + str(ind),
-                ))
+                )
+            )
             ind += 1
         if skipped:
             logger.warning(
@@ -2654,8 +2671,9 @@ def sample(
                 " what Whisper supports.",
                 skipped,
             )
-        self.maybe_oversample_requests(sampled_requests, num_requests,
-                                       request_id_prefix, no_oversample)
+        self.maybe_oversample_requests(
+            sampled_requests, num_requests, request_id_prefix, no_oversample
+        )
         return sampled_requests
 
 
@@ -2739,8 +2757,9 @@ def sample(
             )
             ind += 1
 
-        self.maybe_oversample_requests(sampled_requests, num_requests,
-                                       request_id_prefix, no_oversample)
+        self.maybe_oversample_requests(
+            sampled_requests, num_requests, request_id_prefix, no_oversample
+        )
         return sampled_requests
 
 
@@ -2789,10 +2808,9 @@ def _generate_exact_length_tokens(target_length: int) -> list[int]:
             """Generate tokens that decode and re-encode to exactly
             target_length."""
             # Generate random tokens
-            tokens = np.random.randint(
-                0, vocab_size, size=target_length).tolist()
+            tokens = np.random.randint(0, vocab_size, size=target_length).tolist()
 
-            _, adjusted_tokens, token_mismatch = gen_prompt_decode_to_target_len( # noqa: E501
+            _, adjusted_tokens, token_mismatch = gen_prompt_decode_to_target_len(  # noqa: E501
                 tokenizer=tokenizer,
                 token_sequence=tokens,
                 target_token_len=target_length,
@@ -2806,7 +2824,9 @@ def _generate_exact_length_tokens(target_length: int) -> list[int]:
             prefix_tokens = _generate_exact_length_tokens(prefix_len)
 
             for _ in range(prompts_per_prefix):
-                suffix_tokens, token_mistmatch = _generate_exact_length_tokens(suffix_len) # noqa: E501
+                suffix_tokens, token_mistmatch = _generate_exact_length_tokens(
+                    suffix_len
+                )  # noqa: E501
                 token_mismatch_total += token_mistmatch
                 combined_tokens = prefix_tokens + suffix_tokens
                 prompt = tokenizer.decode(combined_tokens)
@@ -2843,6 +2863,7 @@ class MMStarDataset(HuggingFaceDataset):
     Lin-Chen/MMStar: https://huggingface.co/datasets/Lin-Chen/MMStar
     refer to: https://github.com/sgl-project/SpecForge/pull/106
     """
+
     DEFAULT_OUTPUT_LEN = 128
     SUPPORTED_DATASET_PATHS = {"Lin-Chen/MMStar"}
     IS_MULTIMODAL = True
@@ -2858,8 +2879,7 @@ def sample(
         **kwargs,
     ) -> list[SampleRequest]:
         # If --hf-output-len is not set, use the default output length.
-        output_len = (output_len
-                      if output_len is not None else self.DEFAULT_OUTPUT_LEN)
+        output_len = output_len if output_len is not None else self.DEFAULT_OUTPUT_LEN
         sampled_requests: list[SampleRequest] = []
 
         for ind, item in enumerate(self.data):
diff --git a/vllm/benchmarks/latency.py b/vllm/benchmarks/latency.py
index 05378ec74d2f..7692697fe768 100644
--- a/vllm/benchmarks/latency.py
+++ b/vllm/benchmarks/latency.py
@@ -13,20 +13,20 @@
 from tqdm import tqdm
 
 import vllm.envs as envs
-from vllm.benchmarks.lib.utils import (convert_to_pytorch_benchmark_format,
-                                       write_to_json)
+from vllm.benchmarks.lib.utils import convert_to_pytorch_benchmark_format, write_to_json
 from vllm.engine.arg_utils import EngineArgs
 from vllm.inputs import PromptType
 from vllm.sampling_params import BeamSearchParams
 
 
-def save_to_pytorch_benchmark_format(args: argparse.Namespace,
-                                     results: dict[str, Any]) -> None:
+def save_to_pytorch_benchmark_format(
+    args: argparse.Namespace, results: dict[str, Any]
+) -> None:
     pt_records = convert_to_pytorch_benchmark_format(
         args=args,
         metrics={"latency": results["latencies"]},
-        extra_info={k: results[k]
-                    for k in ["avg_latency", "percentiles"]})
+        extra_info={k: results[k] for k in ["avg_latency", "percentiles"]},
+    )
     if pt_records:
         pt_file = f"{os.path.splitext(args.output_json)[0]}.pytorch.json"
         write_to_json(pt_file, pt_records)
@@ -49,10 +49,9 @@ def add_cli_args(parser: argparse.ArgumentParser):
         default=10,
         help="Number of iterations to run for warmup.",
     )
-    parser.add_argument("--num-iters",
-                        type=int,
-                        default=30,
-                        help="Number of iterations to run.")
+    parser.add_argument(
+        "--num-iters", type=int, default=30, help="Number of iterations to run."
+    )
     parser.add_argument(
         "--profile",
         action="store_true",
@@ -67,8 +66,10 @@ def add_cli_args(parser: argparse.ArgumentParser):
     parser.add_argument(
         "--disable-detokenize",
         action="store_true",
-        help=("Do not detokenize responses (i.e. do not include "
-              "detokenization time in the latency measurement)"),
+        help=(
+            "Do not detokenize responses (i.e. do not include "
+            "detokenization time in the latency measurement)"
+        ),
     )
 
     parser = EngineArgs.add_cli_args(parser)
@@ -81,7 +82,8 @@ def main(args: argparse.Namespace):
     if args.profile and not envs.VLLM_TORCH_PROFILER_DIR:
         raise OSError(
             "The environment variable 'VLLM_TORCH_PROFILER_DIR' is not set. "
-            "Please set it to a valid path to use torch profiler.")
+            "Please set it to a valid path to use torch profiler."
+        )
     engine_args = EngineArgs.from_cli_args(args)
 
     # Lazy import to avoid importing LLM when the bench command is not selected.
@@ -91,9 +93,11 @@ def main(args: argparse.Namespace):
     # the engine will automatically process the request in multiple batches.
     llm = LLM(**dataclasses.asdict(engine_args))
     assert llm.llm_engine.model_config.max_model_len >= (
-        args.input_len +
-        args.output_len), ("Please ensure that max_model_len is greater than"
-                           " the sum of input_len and output_len.")
+        args.input_len + args.output_len
+    ), (
+        "Please ensure that max_model_len is greater than"
+        " the sum of input_len and output_len."
+    )
 
     sampling_params = SamplingParams(
         n=args.n,
@@ -103,18 +107,16 @@ def main(args: argparse.Namespace):
         max_tokens=args.output_len,
         detokenize=not args.disable_detokenize,
     )
-    dummy_prompt_token_ids = np.random.randint(10000,
-                                               size=(args.batch_size,
-                                                     args.input_len))
-    dummy_prompts: list[PromptType] = [{
-        "prompt_token_ids": batch
-    } for batch in dummy_prompt_token_ids.tolist()]
+    dummy_prompt_token_ids = np.random.randint(
+        10000, size=(args.batch_size, args.input_len)
+    )
+    dummy_prompts: list[PromptType] = [
+        {"prompt_token_ids": batch} for batch in dummy_prompt_token_ids.tolist()
+    ]
 
     def llm_generate():
         if not args.use_beam_search:
-            llm.generate(dummy_prompts,
-                         sampling_params=sampling_params,
-                         use_tqdm=False)
+            llm.generate(dummy_prompts, sampling_params=sampling_params, use_tqdm=False)
         else:
             llm.beam_search(
                 dummy_prompts,
diff --git a/vllm/benchmarks/lib/endpoint_request_func.py b/vllm/benchmarks/lib/endpoint_request_func.py
index 725b7df8b187..425a171c3c06 100644
--- a/vllm/benchmarks/lib/endpoint_request_func.py
+++ b/vllm/benchmarks/lib/endpoint_request_func.py
@@ -62,6 +62,7 @@ def add_chunk(self, chunk_bytes: bytes) -> list[str]:
 @dataclass
 class RequestFuncInput:
     """The input for the request function."""
+
     prompt: str
     api_url: str
     prompt_len: int
@@ -80,13 +81,13 @@ class RequestFuncInput:
 @dataclass
 class RequestFuncOutput:
     """The output of the request function including metrics."""
+
     generated_text: str = ""
     success: bool = False
     latency: float = 0.0
     output_tokens: int = 0
     ttft: float = 0.0  # Time to first token
-    itl: list[float] = field(
-        default_factory=list)  # list of inter-token latencies
+    itl: list[float] = field(default_factory=list)  # list of inter-token latencies
     tpot: float = 0.0  # avg next-token latencies
     prompt_len: int = 0
     error: str = ""
@@ -99,8 +100,7 @@ def __call__(
         request_func_input: RequestFuncInput,
         session: aiohttp.ClientSession,
         pbar: Optional[tqdm] = None,
-    ) -> Awaitable[RequestFuncOutput]:
-        ...
+    ) -> Awaitable[RequestFuncOutput]: ...
 
 
 async def async_request_openai_completions(
@@ -118,13 +118,14 @@ async def async_request_openai_completions(
         The output of the request function.
     """
     api_url = request_func_input.api_url
-    assert api_url.endswith(
-        ("completions", "profile")
-    ), "OpenAI Completions API URL must end with 'completions' or 'profile'."
+    assert api_url.endswith(("completions", "profile")), (
+        "OpenAI Completions API URL must end with 'completions' or 'profile'."
+    )
 
     payload = {
         "model": request_func_input.model_name
-        if request_func_input.model_name else request_func_input.model,
+        if request_func_input.model_name
+        else request_func_input.model,
         "prompt": request_func_input.prompt,
         "temperature": 0.0,
         "repetition_penalty": 1.0,
@@ -139,9 +140,7 @@ async def async_request_openai_completions(
         payload["ignore_eos"] = request_func_input.ignore_eos
     if request_func_input.extra_body:
         payload.update(request_func_input.extra_body)
-    headers = {
-        "Authorization": f"Bearer {os.environ.get('OPENAI_API_KEY')}"
-    }
+    headers = {"Authorization": f"Bearer {os.environ.get('OPENAI_API_KEY')}"}
     if request_func_input.extra_headers:
         headers |= request_func_input.extra_headers
     if request_func_input.request_id:
@@ -155,8 +154,7 @@ async def async_request_openai_completions(
     output.start_time = st
     most_recent_timestamp = st
     try:
-        async with session.post(url=api_url, json=payload,
-                                headers=headers) as response:
+        async with session.post(url=api_url, json=payload, headers=headers) as response:
             if response.status == 200:
                 first_chunk_received = False
                 handler = StreamedResponseHandler()
@@ -195,21 +193,20 @@ async def async_request_openai_completions(
 
                                 # Decoding phase
                                 else:
-                                    output.itl.append(timestamp -
-                                                    most_recent_timestamp)
+                                    output.itl.append(timestamp - most_recent_timestamp)
 
                                 most_recent_timestamp = timestamp
                                 generated_text += text or ""
                             elif usage := data.get("usage"):
-                                output.output_tokens = usage.get(
-                                    "completion_tokens")
+                                output.output_tokens = usage.get("completion_tokens")
                 if first_chunk_received:
                     output.success = True
                 else:
                     output.success = False
                     output.error = (
                         "Never received a valid chunk to calculate TTFT."
-                        "This response will be marked as failed!")
+                        "This response will be marked as failed!"
+                    )
                 output.generated_text = generated_text
                 output.latency = most_recent_timestamp - st
             else:
@@ -232,7 +229,8 @@ async def async_request_openai_chat_completions(
 ) -> RequestFuncOutput:
     api_url = request_func_input.api_url
     assert api_url.endswith(("chat/completions", "profile")), (
-        "OpenAI Chat Completions API URL must end with 'chat/completions'.")
+        "OpenAI Chat Completions API URL must end with 'chat/completions'."
+    )
 
     content = [{"type": "text", "text": request_func_input.prompt}]
     if request_func_input.multi_modal_content:
@@ -243,25 +241,18 @@ async def async_request_openai_chat_completions(
             content.append(mm_content)
         else:
             raise TypeError(
-                "multi_modal_content must be a dict or list[dict] "
-                "for openai-chat"
+                "multi_modal_content must be a dict or list[dict] for openai-chat"
             )
     payload = {
-        "model":
-        request_func_input.model_name
-        if request_func_input.model_name else request_func_input.model,
+        "model": request_func_input.model_name
+        if request_func_input.model_name
+        else request_func_input.model,
         "messages": [
-            {
-                "role": "user",
-                "content": content
-            },
+            {"role": "user", "content": content},
         ],
-        "temperature":
-        0.0,
-        "max_completion_tokens":
-        request_func_input.output_len,
-        "stream":
-        True,
+        "temperature": 0.0,
+        "max_completion_tokens": request_func_input.output_len,
+        "stream": True,
         "stream_options": {
             "include_usage": True,
         },
@@ -288,8 +279,7 @@ async def async_request_openai_chat_completions(
     output.start_time = st
     most_recent_timestamp = st
     try:
-        async with session.post(url=api_url, json=payload,
-                                headers=headers) as response:
+        async with session.post(url=api_url, json=payload, headers=headers) as response:
             if response.status == 200:
                 handler = StreamedResponseHandler()
                 async for chunk_bytes in response.content.iter_any():
@@ -320,13 +310,11 @@ async def async_request_openai_chat_completions(
 
                                 # Decoding phase
                                 else:
-                                    output.itl.append(timestamp -
-                                                    most_recent_timestamp)
+                                    output.itl.append(timestamp - most_recent_timestamp)
 
                                 generated_text += content or ""
                             elif usage := data.get("usage"):
-                                output.output_tokens = usage.get(
-                                    "completion_tokens")
+                                output.output_tokens = usage.get("completion_tokens")
 
                             most_recent_timestamp = timestamp
 
@@ -356,27 +344,22 @@ async def async_request_openai_audio(
 
     api_url = request_func_input.api_url
     assert api_url.endswith(("transcriptions", "translations")), (
-        "OpenAI Chat Completions API URL must end with 'transcriptions' ")
+        "OpenAI Chat Completions API URL must end with 'transcriptions' "
+    )
     "or `translations`."
 
     content = [{"type": "text", "text": request_func_input.prompt}]
     payload = {
-        "model":
-        request_func_input.model_name
-        if request_func_input.model_name else request_func_input.model,
-        "temperature":
-        0.0,
-        "max_completion_tokens":
-        request_func_input.output_len,
-        "stream":
-        True,
-        "language":
-        "en",
+        "model": request_func_input.model_name
+        if request_func_input.model_name
+        else request_func_input.model,
+        "temperature": 0.0,
+        "max_completion_tokens": request_func_input.output_len,
+        "stream": True,
+        "language": "en",
         # Flattened due to multipart/form-data
-        "stream_include_usage":
-        True,
-        "stream_continuous_usage_stats":
-        True,
+        "stream_include_usage": True,
+        "stream_continuous_usage_stats": True,
     }
     if request_func_input.extra_body:
         payload.update(request_func_input.extra_body)
@@ -413,9 +396,9 @@ def to_bytes(y, sr):
         output.start_time = st
         most_recent_timestamp = st
         try:
-            async with session.post(url=api_url,
-                                    data=form,
-                                    headers=headers) as response:
+            async with session.post(
+                url=api_url, data=form, headers=headers
+            ) as response:
                 if response.status == 200:
                     handler = StreamedResponseHandler()
 
@@ -426,15 +409,13 @@ def to_bytes(y, sr):
 
                         messages = handler.add_chunk(chunk_bytes)
                         for message in messages:
-                            chunk = message.decode("utf-8").removeprefix(
-                                "data: ")
+                            chunk = message.decode("utf-8").removeprefix("data: ")
                             if chunk != "[DONE]":
                                 timestamp = time.perf_counter()
                                 data = json.loads(chunk)
 
                                 if choices := data.get("choices"):
-                                    content = choices[0]["delta"].get(
-                                        "content")
+                                    content = choices[0]["delta"].get("content")
                                     # First token
                                     if ttft == 0.0:
                                         ttft = timestamp - st
@@ -443,12 +424,14 @@ def to_bytes(y, sr):
                                     # Decoding phase
                                     else:
                                         output.itl.append(
-                                            timestamp - most_recent_timestamp)
+                                            timestamp - most_recent_timestamp
+                                        )
 
                                     generated_text += content or ""
                                 elif usage := data.get("usage"):
                                     output.output_tokens = usage.get(
-                                        "completion_tokens")
+                                        "completion_tokens"
+                                    )
 
                                 most_recent_timestamp = timestamp
 
@@ -474,9 +457,9 @@ async def async_request_openai_embeddings(
     pbar: Optional[tqdm] = None,
 ):
     api_url = request_func_input.api_url
-    assert api_url.endswith(
-        "embeddings"
-    ), "OpenAI Embeddings API URL must end with 'embeddings'."
+    assert api_url.endswith("embeddings"), (
+        "OpenAI Embeddings API URL must end with 'embeddings'."
+    )
 
     headers = {
         "Content-Type": "application/json",
@@ -492,19 +475,13 @@ async def async_request_openai_embeddings(
     st = time.perf_counter()
     output.start_time = st
     try:
-        async with session.post(
-            url=api_url,
-            headers=headers,
-            json=payload
-        ) as response:
+        async with session.post(url=api_url, headers=headers, json=payload) as response:
             if response.status == 200:
                 output.latency = time.perf_counter() - st
                 data = await response.json()
                 output.success = True
                 output.generated_text = ""
-                output.prompt_len = data.get(
-                    "usage", {}).get(
-                    "prompt_tokens", 0)
+                output.prompt_len = data.get("usage", {}).get("prompt_tokens", 0)
             else:
                 output.success = False
                 output.error = response.reason or ""
@@ -527,7 +504,7 @@ async def async_request_openai_embeddings(
 }
 
 OPENAI_COMPATIBLE_BACKENDS = [
-    k for k, v in ASYNC_REQUEST_FUNCS.items()
-    if v in (async_request_openai_completions,
-             async_request_openai_chat_completions)
+    k
+    for k, v in ASYNC_REQUEST_FUNCS.items()
+    if v in (async_request_openai_completions, async_request_openai_chat_completions)
 ]
diff --git a/vllm/benchmarks/lib/ready_checker.py b/vllm/benchmarks/lib/ready_checker.py
index 87fc16b55012..5649faf05597 100644
--- a/vllm/benchmarks/lib/ready_checker.py
+++ b/vllm/benchmarks/lib/ready_checker.py
@@ -8,8 +8,7 @@
 import aiohttp
 from tqdm.asyncio import tqdm
 
-from .endpoint_request_func import (RequestFunc, RequestFuncInput,
-                                    RequestFuncOutput)
+from .endpoint_request_func import RequestFunc, RequestFuncInput, RequestFuncOutput
 
 
 async def wait_for_endpoint(
@@ -21,30 +20,29 @@ async def wait_for_endpoint(
 ) -> RequestFuncOutput:
     """
     Wait for an endpoint to become available before starting benchmarks.
-    
+
     Args:
         request_func: The async request function to call
         test_input: The RequestFuncInput to test with
         timeout_seconds: Maximum time to wait in seconds (default: 10 minutes)
         retry_interval: Time between retries in seconds (default: 5 seconds)
-        
+
     Returns:
         RequestFuncOutput: The successful response
-        
+
     Raises:
         ValueError: If the endpoint doesn't become available within the timeout
     """
     deadline = time.perf_counter() + timeout_seconds
     output = RequestFuncOutput(success=False)
     print(f"Waiting for endpoint to become up in {timeout_seconds} seconds")
-    
+
     with tqdm(
-        total=timeout_seconds, 
+        total=timeout_seconds,
         bar_format="{desc} |{bar}| {elapsed} elapsed, {remaining} remaining",
         unit="s",
     ) as pbar:
-
-        while True:            
+        while True:
             # update progress bar
             remaining = deadline - time.perf_counter()
             elapsed = timeout_seconds - remaining
@@ -58,16 +56,17 @@ async def wait_for_endpoint(
             # ping the endpoint using request_func
             try:
                 output = await request_func(
-                    request_func_input=test_input, session=session)
+                    request_func_input=test_input, session=session
+                )
                 if output.success:
                     pbar.close()
                     return output
             except aiohttp.ClientConnectorError:
                 pass
-            
+
             # retry after a delay
             sleep_duration = min(retry_interval, remaining)
             if sleep_duration > 0:
                 await asyncio.sleep(sleep_duration)
-    
+
     return output
diff --git a/vllm/benchmarks/lib/utils.py b/vllm/benchmarks/lib/utils.py
index 0c27687dcf16..32e9db499007 100644
--- a/vllm/benchmarks/lib/utils.py
+++ b/vllm/benchmarks/lib/utils.py
@@ -8,9 +8,9 @@
 from typing import Any
 
 
-def convert_to_pytorch_benchmark_format(args: argparse.Namespace,
-                                        metrics: dict[str, list],
-                                        extra_info: dict[str, Any]) -> list:
+def convert_to_pytorch_benchmark_format(
+    args: argparse.Namespace, metrics: dict[str, list], extra_info: dict[str, Any]
+) -> list:
     """
     Save the benchmark results in the format used by PyTorch OSS benchmark with
     on metric per record
@@ -38,12 +38,12 @@ def convert_to_pytorch_benchmark_format(args: argparse.Namespace,
             },
         }
 
-        tp = record["benchmark"]["extra_info"]["args"].get(
-            "tensor_parallel_size")
+        tp = record["benchmark"]["extra_info"]["args"].get("tensor_parallel_size")
         # Save tensor_parallel_size parameter if it's part of the metadata
         if not tp and "tensor_parallel_size" in extra_info:
-            record["benchmark"]["extra_info"]["args"][
-                "tensor_parallel_size"] = extra_info["tensor_parallel_size"]
+            record["benchmark"]["extra_info"]["args"]["tensor_parallel_size"] = (
+                extra_info["tensor_parallel_size"]
+            )
 
         records.append(record)
 
@@ -51,7 +51,6 @@ def convert_to_pytorch_benchmark_format(args: argparse.Namespace,
 
 
 class InfEncoder(json.JSONEncoder):
-
     def clear_inf(self, o: Any):
         if isinstance(o, dict):
             return {
diff --git a/vllm/benchmarks/serve.py b/vllm/benchmarks/serve.py
index 2371bbf27079..cad1d2eb2c6a 100644
--- a/vllm/benchmarks/serve.py
+++ b/vllm/benchmarks/serve.py
@@ -15,6 +15,7 @@
         --request-rate <request_rate. Default inf> \
         --num-prompts <num_prompts. Default 1000>
 """
+
 import argparse
 import asyncio
 import gc
@@ -36,20 +37,22 @@
 from tqdm.asyncio import tqdm
 from transformers import PreTrainedTokenizerBase
 
-from vllm.benchmarks.datasets import (SampleRequest, add_dataset_parser,
-                                      get_samples)
+from vllm.benchmarks.datasets import SampleRequest, add_dataset_parser, get_samples
 from vllm.benchmarks.lib.endpoint_request_func import (
-    ASYNC_REQUEST_FUNCS, OPENAI_COMPATIBLE_BACKENDS, RequestFuncInput,
-    RequestFuncOutput)
+    ASYNC_REQUEST_FUNCS,
+    OPENAI_COMPATIBLE_BACKENDS,
+    RequestFuncInput,
+    RequestFuncOutput,
+)
 from vllm.benchmarks.lib.ready_checker import wait_for_endpoint
-from vllm.benchmarks.lib.utils import (convert_to_pytorch_benchmark_format,
-                                       write_to_json)
+from vllm.benchmarks.lib.utils import convert_to_pytorch_benchmark_format, write_to_json
 from vllm.transformers_utils.tokenizer import get_tokenizer
 
 MILLISECONDS_TO_SECONDS_CONVERSION = 1000
 
-TERM_PLOTLIB_AVAILABLE = ((importlib.util.find_spec("termplotlib") is not None)
-                          and (shutil.which("gnuplot") is not None))
+TERM_PLOTLIB_AVAILABLE = (importlib.util.find_spec("termplotlib") is not None) and (
+    shutil.which("gnuplot") is not None
+)
 
 
 class TaskType(Enum):
@@ -110,8 +113,11 @@ def _get_current_request_rate(
     total_requests: int,
     request_rate: float,
 ) -> float:
-    if (ramp_up_strategy and ramp_up_start_rps is not None
-            and ramp_up_end_rps is not None):
+    if (
+        ramp_up_strategy
+        and ramp_up_start_rps is not None
+        and ramp_up_end_rps is not None
+    ):
         progress = request_index / max(total_requests - 1, 1)
         if ramp_up_strategy == "linear":
             increase = (ramp_up_end_rps - ramp_up_start_rps) * progress
@@ -158,10 +164,10 @@ async def get_request(
             The ending request rate for ramp-up.
     """
     assert burstiness > 0, (
-        f"A positive burstiness factor is expected, but given {burstiness}.")
+        f"A positive burstiness factor is expected, but given {burstiness}."
+    )
     # Convert to list to get length for ramp-up calculations
-    if isinstance(input_requests,
-                  Iterable) and not isinstance(input_requests, list):
+    if isinstance(input_requests, Iterable) and not isinstance(input_requests, list):
         input_requests = list(input_requests)
 
     total_requests = len(input_requests)
@@ -172,8 +178,13 @@ async def get_request(
     delay_ts = []
     for request_index, request in enumerate(input_requests):
         current_request_rate = _get_current_request_rate(
-            ramp_up_strategy, ramp_up_start_rps, ramp_up_end_rps,
-            request_index, total_requests, request_rate)
+            ramp_up_strategy,
+            ramp_up_start_rps,
+            ramp_up_end_rps,
+            request_index,
+            total_requests,
+            request_rate,
+        )
         request_rates.append(current_request_rate)
         if current_request_rate == float("inf"):
             delay_ts.append(0)
@@ -213,8 +224,8 @@ async def get_request(
 
 
 def calculate_metrics_for_embeddings(
-        outputs: list[RequestFuncOutput], dur_s: float,
-        selected_percentiles: list[float]) -> EmbedBenchmarkMetrics:
+    outputs: list[RequestFuncOutput], dur_s: float, selected_percentiles: list[float]
+) -> EmbedBenchmarkMetrics:
     """Calculate the metrics for the embedding requests.
 
     Args:
@@ -238,7 +249,8 @@ def calculate_metrics_for_embeddings(
         warnings.warn(
             "All requests failed. This is likely due to a misconfiguration "
             "on the benchmark arguments.",
-            stacklevel=2)
+            stacklevel=2,
+        )
     metrics = EmbedBenchmarkMetrics(
         completed=completed,
         total_input=total_input,
@@ -247,8 +259,9 @@ def calculate_metrics_for_embeddings(
         mean_e2el_ms=np.mean(e2els or 0) * 1000,
         std_e2el_ms=np.std(e2els or 0) * 1000,
         median_e2el_ms=np.median(e2els or 0) * 1000,
-        percentiles_e2el_ms=[(p, np.percentile(e2els or 0, p) * 1000)
-                             for p in selected_percentiles],
+        percentiles_e2el_ms=[
+            (p, np.percentile(e2els or 0, p) * 1000) for p in selected_percentiles
+        ],
     )
     return metrics
 
@@ -294,8 +307,10 @@ def calculate_metrics(
                 # bundled together
                 # Note : this may inflate the output token count slightly
                 output_len = len(
-                    tokenizer(outputs[i].generated_text,
-                              add_special_tokens=False).input_ids)
+                    tokenizer(
+                        outputs[i].generated_text, add_special_tokens=False
+                    ).input_ids
+                )
             actual_output_lens.append(output_len)
             total_input += input_requests[i].prompt_len
             tpot = 0
@@ -318,16 +333,19 @@ def calculate_metrics(
 
         if "ttft" in goodput_config_dict:
             valid_metrics.append(ttfts)
-            slo_values.append(goodput_config_dict["ttft"] /
-                              MILLISECONDS_TO_SECONDS_CONVERSION)
+            slo_values.append(
+                goodput_config_dict["ttft"] / MILLISECONDS_TO_SECONDS_CONVERSION
+            )
         if "tpot" in goodput_config_dict:
             valid_metrics.append(all_tpots)
-            slo_values.append(goodput_config_dict["tpot"] /
-                              MILLISECONDS_TO_SECONDS_CONVERSION)
+            slo_values.append(
+                goodput_config_dict["tpot"] / MILLISECONDS_TO_SECONDS_CONVERSION
+            )
         if "e2el" in goodput_config_dict:
             valid_metrics.append(e2els)
-            slo_values.append(goodput_config_dict["e2el"] /
-                              MILLISECONDS_TO_SECONDS_CONVERSION)
+            slo_values.append(
+                goodput_config_dict["e2el"] / MILLISECONDS_TO_SECONDS_CONVERSION
+            )
 
         for req_metric in zip(*valid_metrics):
             is_good_req = all([s >= r for s, r in zip(slo_values, req_metric)])
@@ -338,7 +356,8 @@ def calculate_metrics(
         warnings.warn(
             "All requests failed. This is likely due to a misconfiguration "
             "on the benchmark arguments.",
-            stacklevel=2)
+            stacklevel=2,
+        )
 
     # Calculate max output tokens per second metric
     max_output_tokens_per_s = 0.0
@@ -347,10 +366,10 @@ def calculate_metrics(
     # Find the time range across all successful requests
     successful_outputs = [output for output in outputs if output.success]
     if successful_outputs:
-        min_start_time = min(output.start_time
-                             for output in successful_outputs)
-        max_end_time = max(output.start_time + output.latency
-                           for output in successful_outputs)
+        min_start_time = min(output.start_time for output in successful_outputs)
+        max_end_time = max(
+            output.start_time + output.latency for output in successful_outputs
+        )
 
         # Create second buckets (ceiling to ensure we capture all time)
         duration_seconds = int(np.ceil(max_end_time - min_start_time)) + 1
@@ -374,8 +393,9 @@ def calculate_metrics(
 
             # Track concurrent requests for each second this request was active
             request_start_second = int(output.start_time - min_start_time)
-            request_end_second = int((output.start_time + output.latency) -
-                                     min_start_time)
+            request_end_second = int(
+                (output.start_time + output.latency) - min_start_time
+            )
 
             for second in range(request_start_second, request_end_second + 1):
                 concurrent_requests_per_second[second] += 1
@@ -384,18 +404,22 @@ def calculate_metrics(
         # concurrent requests
         if len(tokens_per_second) > 0:
             max_output_tokens_per_s = float(np.max(tokens_per_second))
-            max_concurrent_requests = int(
-                np.max(concurrent_requests_per_second))
+            max_concurrent_requests = int(np.max(concurrent_requests_per_second))
 
         if TERM_PLOTLIB_AVAILABLE:
             import termplotlib as tpl
+
             fig = tpl.figure()
-            fig.plot(np.arange(len(tokens_per_second)),
-                     tokens_per_second,
-                     title="Output tokens per second")
-            fig.plot(np.arange(len(concurrent_requests_per_second)),
-                     concurrent_requests_per_second,
-                     title="Concurrent requests per second")
+            fig.plot(
+                np.arange(len(tokens_per_second)),
+                tokens_per_second,
+                title="Output tokens per second",
+            )
+            fig.plot(
+                np.arange(len(concurrent_requests_per_second)),
+                concurrent_requests_per_second,
+                title="Concurrent requests per second",
+            )
             fig.show()
         else:
             print("tip: install termplotlib and gnuplot to plot the metrics")
@@ -408,27 +432,31 @@ def calculate_metrics(
         request_goodput=good_completed / dur_s,
         output_throughput=sum(actual_output_lens) / dur_s,
         total_token_throughput=(total_input + sum(actual_output_lens)) / dur_s,
-        mean_ttft_ms=np.mean(ttfts or 0) *
-        1000,  # ttfts is empty if streaming is not supported by the endpoint
+        mean_ttft_ms=np.mean(ttfts or 0)
+        * 1000,  # ttfts is empty if streaming is not supported by the endpoint
         std_ttft_ms=np.std(ttfts or 0) * 1000,
         median_ttft_ms=np.median(ttfts or 0) * 1000,
-        percentiles_ttft_ms=[(p, np.percentile(ttfts or 0, p) * 1000)
-                             for p in selected_percentiles],
+        percentiles_ttft_ms=[
+            (p, np.percentile(ttfts or 0, p) * 1000) for p in selected_percentiles
+        ],
         mean_tpot_ms=np.mean(tpots or 0) * 1000,
         std_tpot_ms=np.std(tpots or 0) * 1000,
         median_tpot_ms=np.median(tpots or 0) * 1000,
-        percentiles_tpot_ms=[(p, np.percentile(tpots or 0, p) * 1000)
-                             for p in selected_percentiles],
+        percentiles_tpot_ms=[
+            (p, np.percentile(tpots or 0, p) * 1000) for p in selected_percentiles
+        ],
         mean_itl_ms=np.mean(itls or 0) * 1000,
         std_itl_ms=np.std(itls or 0) * 1000,
         median_itl_ms=np.median(itls or 0) * 1000,
-        percentiles_itl_ms=[(p, np.percentile(itls or 0, p) * 1000)
-                            for p in selected_percentiles],
+        percentiles_itl_ms=[
+            (p, np.percentile(itls or 0, p) * 1000) for p in selected_percentiles
+        ],
         mean_e2el_ms=np.mean(e2els or 0) * 1000,
         std_e2el_ms=np.std(e2els or 0) * 1000,
         median_e2el_ms=np.median(e2els or 0) * 1000,
-        percentiles_e2el_ms=[(p, np.percentile(e2els or 0, p) * 1000)
-                             for p in selected_percentiles],
+        percentiles_e2el_ms=[
+            (p, np.percentile(e2els or 0, p) * 1000) for p in selected_percentiles
+        ],
         max_output_tokens_per_s=max_output_tokens_per_s,
         max_concurrent_requests=max_concurrent_requests,
     )
@@ -462,8 +490,11 @@ async def benchmark(
     ramp_up_end_rps: Optional[int] = None,
     ready_check_timeout_sec: int = 600,
 ):
-    task_type = (TaskType.EMBEDDING if api_url.endswith("/v1/embeddings") else
-                 TaskType.GENERATION)
+    task_type = (
+        TaskType.EMBEDDING
+        if api_url.endswith("/v1/embeddings")
+        else TaskType.GENERATION
+    )
     if endpoint_type in ASYNC_REQUEST_FUNCS:
         if task_type == TaskType.EMBEDDING:
             request_func = ASYNC_REQUEST_FUNCS["openai-embeddings"]
@@ -498,10 +529,14 @@ async def benchmark(
         input_requests[0].multi_modal_data,
     )
 
-    assert (test_mm_content is None or isinstance(test_mm_content, dict)
-            or (isinstance(test_mm_content, list)
-                and all(isinstance(item, dict) for item in test_mm_content))
-            ), "multi_modal_data must be a dict or list[dict]"
+    assert (
+        test_mm_content is None
+        or isinstance(test_mm_content, dict)
+        or (
+            isinstance(test_mm_content, list)
+            and all(isinstance(item, dict) for item in test_mm_content)
+        )
+    ), "multi_modal_data must be a dict or list[dict]"
     test_input = RequestFuncInput(
         model=model_id,
         model_name=model_name,
@@ -527,7 +562,8 @@ async def benchmark(
             raise ValueError(
                 "Initial test run failed - Please make sure benchmark "
                 "arguments are correctly specified. "
-                f"Error: {test_output.error}")
+                f"Error: {test_output.error}"
+            )
         else:
             print("Initial test run completed. Starting main benchmark run...")
     else:
@@ -536,33 +572,38 @@ async def benchmark(
     if lora_modules:
         # For each input request, choose a LoRA module at random.
         lora_modules = iter(
-            [random.choice(lora_modules) for _ in range(len(input_requests))])
+            [random.choice(lora_modules) for _ in range(len(input_requests))]
+        )
 
     if profile:
         print("Starting profiler...")
-        profile_input = RequestFuncInput(model=model_id,
-                                         model_name=model_name,
-                                         prompt=test_prompt,
-                                         api_url=base_url + "/start_profile",
-                                         prompt_len=test_prompt_len,
-                                         output_len=test_output_len,
-                                         logprobs=logprobs,
-                                         multi_modal_content=test_mm_content,
-                                         ignore_eos=ignore_eos,
-                                         extra_headers=extra_headers,
-                                         extra_body=extra_body)
-        profile_output = await request_func(request_func_input=profile_input,
-                                            session=session)
+        profile_input = RequestFuncInput(
+            model=model_id,
+            model_name=model_name,
+            prompt=test_prompt,
+            api_url=base_url + "/start_profile",
+            prompt_len=test_prompt_len,
+            output_len=test_output_len,
+            logprobs=logprobs,
+            multi_modal_content=test_mm_content,
+            ignore_eos=ignore_eos,
+            extra_headers=extra_headers,
+            extra_body=extra_body,
+        )
+        profile_output = await request_func(
+            request_func_input=profile_input, session=session
+        )
         if profile_output.success:
             print("Profiler started")
 
-    distribution = ("Poisson process"
-                    if burstiness == 1.0 else "Gamma distribution")
+    distribution = "Poisson process" if burstiness == 1.0 else "Gamma distribution"
 
     if ramp_up_strategy is not None:
         print(f"Traffic ramp-up strategy: {ramp_up_strategy}.")
-        print(f"Will increase RPS from {ramp_up_start_rps} to "
-              f"{ramp_up_end_rps} RPS over the duration of the benchmark.")
+        print(
+            f"Will increase RPS from {ramp_up_start_rps} to "
+            f"{ramp_up_end_rps} RPS over the duration of the benchmark."
+        )
     else:
         print(f"Traffic request rate: {request_rate}")
 
@@ -575,18 +616,17 @@ async def benchmark(
     # and it will simplify the code in limited_request_func.
     #    semaphore = (asyncio.Semaphore(max_concurrency)
     #                 if max_concurrency else contextlib.nullcontext())
-    semaphore = (asyncio.Semaphore(max_concurrency)
-                 if max_concurrency else None)
+    semaphore = asyncio.Semaphore(max_concurrency) if max_concurrency else None
 
     async def limited_request_func(request_func_input, session, pbar):
         if semaphore is None:
-            return await request_func(request_func_input=request_func_input,
-                                      session=session,
-                                      pbar=pbar)
+            return await request_func(
+                request_func_input=request_func_input, session=session, pbar=pbar
+            )
         async with semaphore:
-            return await request_func(request_func_input=request_func_input,
-                                      session=session,
-                                      pbar=pbar)
+            return await request_func(
+                request_func_input=request_func_input, session=session, pbar=pbar
+            )
 
     benchmark_start_time = time.perf_counter()
     tasks: list[asyncio.Task] = []
@@ -595,23 +635,27 @@ async def limited_request_func(request_func_input, session, pbar):
     last_int_rps = -1
     if ramp_up_strategy is not None and ramp_up_start_rps is not None:
         last_int_rps = ramp_up_start_rps
-        rps_change_events.append({
-            "rps": last_int_rps,
-            "timestamp": datetime.now().isoformat(),
-        })
+        rps_change_events.append(
+            {
+                "rps": last_int_rps,
+                "timestamp": datetime.now().isoformat(),
+            }
+        )
 
     async for request, current_request_rate in get_request(
-            input_requests, request_rate, burstiness, ramp_up_strategy,
-            ramp_up_start_rps, ramp_up_end_rps):
+        input_requests,
+        request_rate,
+        burstiness,
+        ramp_up_strategy,
+        ramp_up_start_rps,
+        ramp_up_end_rps,
+    ):
         if ramp_up_strategy is not None:
             current_int_rps = int(current_request_rate)
             if current_int_rps > last_int_rps:
                 timestamp = datetime.now().isoformat()
                 for rps_val in range(last_int_rps + 1, current_int_rps + 1):
-                    rps_change_events.append({
-                        "rps": rps_val,
-                        "timestamp": timestamp
-                    })
+                    rps_change_events.append({"rps": rps_val, "timestamp": timestamp})
                 last_int_rps = current_int_rps
         prompt, prompt_len, output_len, mm_content, request_id = (
             request.prompt,
@@ -641,9 +685,11 @@ async def limited_request_func(request_func_input, session, pbar):
         )
         tasks.append(
             asyncio.create_task(
-                limited_request_func(request_func_input=request_func_input,
-                                     session=session,
-                                     pbar=pbar)))
+                limited_request_func(
+                    request_func_input=request_func_input, session=session, pbar=pbar
+                )
+            )
+        )
     outputs: list[RequestFuncOutput] = await asyncio.gather(*tasks)
 
     if pbar is not None:
@@ -668,35 +714,48 @@ async def limited_request_func(request_func_input, session, pbar):
         )
         actual_output_lens = 0
 
-    print("{s:{c}^{n}}".format(s=' Serving Benchmark Result ', n=50, c='='))
+    print("{s:{c}^{n}}".format(s=" Serving Benchmark Result ", n=50, c="="))
     print("{:<40} {:<10}".format("Successful requests:", metrics.completed))
     if max_concurrency is not None:
-        print("{:<40} {:<10}".format("Maximum request concurrency:",
-                                     max_concurrency))
-    if request_rate != float('inf'):
-        print("{:<40} {:<10.2f}".format("Request rate configured (RPS):",
-                                        request_rate))
-    print("{:<40} {:<10.2f}".format("Benchmark duration (s):",
-                                    benchmark_duration))
+        print("{:<40} {:<10}".format("Maximum request concurrency:", max_concurrency))
+    if request_rate != float("inf"):
+        print("{:<40} {:<10.2f}".format("Request rate configured (RPS):", request_rate))
+    print("{:<40} {:<10.2f}".format("Benchmark duration (s):", benchmark_duration))
     print("{:<40} {:<10}".format("Total input tokens:", metrics.total_input))
     if isinstance(metrics, BenchmarkMetrics):
-        print("{:<40} {:<10}".format("Total generated tokens:",
-                                     metrics.total_output))
-    print("{:<40} {:<10.2f}".format("Request throughput (req/s):",
-                                    metrics.request_throughput))
+        print("{:<40} {:<10}".format("Total generated tokens:", metrics.total_output))
+    print(
+        "{:<40} {:<10.2f}".format(
+            "Request throughput (req/s):", metrics.request_throughput
+        )
+    )
     if goodput_config_dict:
-        print("{:<40} {:<10.2f}".format("Request goodput (req/s):",
-                                        metrics.request_goodput))
+        print(
+            "{:<40} {:<10.2f}".format(
+                "Request goodput (req/s):", metrics.request_goodput
+            )
+        )
     if isinstance(metrics, BenchmarkMetrics):
-        print("{:<40} {:<10.2f}".format("Output token throughput (tok/s):",
-                                        metrics.output_throughput))
-        print("{:<40} {:<10.2f}".format(
-            "Peak output token throughput (tok/s):",
-            metrics.max_output_tokens_per_s))
-        print("{:<40} {:<10.2f}".format("Peak concurrent requests:",
-                                        metrics.max_concurrent_requests))
-    print("{:<40} {:<10.2f}".format("Total Token throughput (tok/s):",
-                                    metrics.total_token_throughput))
+        print(
+            "{:<40} {:<10.2f}".format(
+                "Output token throughput (tok/s):", metrics.output_throughput
+            )
+        )
+        print(
+            "{:<40} {:<10.2f}".format(
+                "Peak output token throughput (tok/s):", metrics.max_output_tokens_per_s
+            )
+        )
+        print(
+            "{:<40} {:<10.2f}".format(
+                "Peak concurrent requests:", metrics.max_concurrent_requests
+            )
+        )
+    print(
+        "{:<40} {:<10.2f}".format(
+            "Total Token throughput (tok/s):", metrics.total_token_throughput
+        )
+    )
 
     if isinstance(metrics, BenchmarkMetrics):
         result = {
@@ -705,8 +764,7 @@ async def limited_request_func(request_func_input, session, pbar):
             "total_input_tokens": metrics.total_input,
             "total_output_tokens": metrics.total_output,
             "request_throughput": metrics.request_throughput,
-            "request_goodput":
-            metrics.request_goodput if goodput_config_dict else None,
+            "request_goodput": metrics.request_goodput if goodput_config_dict else None,
             "output_throughput": metrics.output_throughput,
             "total_token_throughput": metrics.total_token_throughput,
             "input_lens": [output.prompt_len for output in outputs],
@@ -744,30 +802,36 @@ def process_one_metric(
         # metric.
         if metric_attribute_name not in selected_percentile_metrics:
             return
-        print("{s:{c}^{n}}".format(s=metric_header, n=50, c='-'))
-        print("{:<40} {:<10.2f}".format(
-            f"Mean {metric_name} (ms):",
-            getattr(metrics, f"mean_{metric_attribute_name}_ms")))
-        print("{:<40} {:<10.2f}".format(
-            f"Median {metric_name} (ms):",
-            getattr(metrics, f"median_{metric_attribute_name}_ms")))
+        print("{s:{c}^{n}}".format(s=metric_header, n=50, c="-"))
+        print(
+            "{:<40} {:<10.2f}".format(
+                f"Mean {metric_name} (ms):",
+                getattr(metrics, f"mean_{metric_attribute_name}_ms"),
+            )
+        )
+        print(
+            "{:<40} {:<10.2f}".format(
+                f"Median {metric_name} (ms):",
+                getattr(metrics, f"median_{metric_attribute_name}_ms"),
+            )
+        )
         result[f"mean_{metric_attribute_name}_ms"] = getattr(
-            metrics, f"mean_{metric_attribute_name}_ms")
+            metrics, f"mean_{metric_attribute_name}_ms"
+        )
         result[f"median_{metric_attribute_name}_ms"] = getattr(
-            metrics, f"median_{metric_attribute_name}_ms")
+            metrics, f"median_{metric_attribute_name}_ms"
+        )
         result[f"std_{metric_attribute_name}_ms"] = getattr(
-            metrics, f"std_{metric_attribute_name}_ms")
-        for p, value in getattr(metrics,
-                                f"percentiles_{metric_attribute_name}_ms"):
+            metrics, f"std_{metric_attribute_name}_ms"
+        )
+        for p, value in getattr(metrics, f"percentiles_{metric_attribute_name}_ms"):
             p_word = str(int(p)) if int(p) == p else str(p)
-            print("{:<40} {:<10.2f}".format(f"P{p_word} {metric_name} (ms):",
-                                            value))
+            print("{:<40} {:<10.2f}".format(f"P{p_word} {metric_name} (ms):", value))
             result[f"p{p_word}_{metric_attribute_name}_ms"] = value
 
     if task_type == TaskType.GENERATION:
         process_one_metric("ttft", "TTFT", "Time to First Token")
-        process_one_metric("tpot", "TPOT",
-                           "Time per Output Token (excl. 1st token)")
+        process_one_metric("tpot", "TPOT", "Time per Output Token (excl. 1st token)")
         process_one_metric("itl", "ITL", "Inter-token Latency")
     process_one_metric("e2el", "E2EL", "End-to-end Latency")
 
@@ -783,8 +847,9 @@ def process_one_metric(
             output_len=test_output_len,
             logprobs=logprobs,
         )
-        profile_output = await request_func(request_func_input=profile_input,
-                                            session=session)
+        profile_output = await request_func(
+            request_func_input=profile_input, session=session
+        )
         if profile_output.success:
             print("Profiler stopped")
 
@@ -803,12 +868,14 @@ def check_goodput_args(args):
                 raise ValueError(
                     f"Invalid metric name found, {slo_name}: {slo_val}. "
                     "The service level objective name should be one of "
-                    f"{str(VALID_NAMES)}. ")
+                    f"{str(VALID_NAMES)}. "
+                )
             if slo_val < 0:
                 raise ValueError(
                     f"Invalid value found, {slo_name}: {slo_val}. "
                     "The service level objective value should be "
-                    "non-negative.")
+                    "non-negative."
+                )
     return goodput_config_dict
 
 
@@ -821,31 +888,42 @@ def parse_goodput(slo_pairs):
     except ValueError as err:
         raise argparse.ArgumentTypeError(
             "Invalid format found for service level objectives. "
-            "Specify service level objectives for goodput as \"KEY:VALUE\" "
+            'Specify service level objectives for goodput as "KEY:VALUE" '
             "pairs, where the key is a metric name, and the value is a "
-            "number in milliseconds.") from err
+            "number in milliseconds."
+        ) from err
     return goodput_config_dict
 
 
-def save_to_pytorch_benchmark_format(args: argparse.Namespace,
-                                     results: dict[str, Any],
-                                     file_name: str) -> None:
+def save_to_pytorch_benchmark_format(
+    args: argparse.Namespace, results: dict[str, Any], file_name: str
+) -> None:
     metrics = [
-        "median_ttft_ms", "mean_ttft_ms", "std_ttft_ms", "p99_ttft_ms",
-        "mean_tpot_ms", "median_tpot_ms", "std_tpot_ms", "p99_tpot_ms",
-        "median_itl_ms", "mean_itl_ms", "std_itl_ms", "p99_itl_ms"
+        "median_ttft_ms",
+        "mean_ttft_ms",
+        "std_ttft_ms",
+        "p99_ttft_ms",
+        "mean_tpot_ms",
+        "median_tpot_ms",
+        "std_tpot_ms",
+        "p99_tpot_ms",
+        "median_itl_ms",
+        "mean_itl_ms",
+        "std_itl_ms",
+        "p99_itl_ms",
     ]
     # These raw data might be useful, but they are rather big. They can be added
     # later if needed
     ignored_metrics = ["ttfts", "itls", "generated_texts", "errors"]
     pt_records = convert_to_pytorch_benchmark_format(
         args=args,
-        metrics={k: [results[k]]
-                 for k in metrics if k in results},
+        metrics={k: [results[k]] for k in metrics if k in results},
         extra_info={
             k: results[k]
-            for k in results if k not in metrics and k not in ignored_metrics
-        })
+            for k in results
+            if k not in metrics and k not in ignored_metrics
+        },
+    )
     if pt_records:
         # Don't use json suffix here as we don't want CI to pick it up
         pt_file = f"{os.path.splitext(file_name)[0]}.pytorch.json"
@@ -866,7 +944,7 @@ def add_cli_args(parser: argparse.ArgumentParser):
         type=str,
         default="openai",
         choices=list(ASYNC_REQUEST_FUNCS.keys()),
-        help="The type of backend or endpoint to use for the benchmark."
+        help="The type of backend or endpoint to use for the benchmark.",
     )
     parser.add_argument(
         "--base-url",
@@ -888,9 +966,9 @@ def add_cli_args(parser: argparse.ArgumentParser):
         metavar="KEY=VALUE",
         nargs="*",
         help="Key-value pairs (e.g, --header x-additional-info=0.3.3) "
-        "for headers to be passed with each request. These headers override " \
-        "per backend constants and values set via environment variable, and " \
-        "will be overriden by other arguments (such as request ids)."
+        "for headers to be passed with each request. These headers override "
+        "per backend constants and values set via environment variable, and "
+        "will be overriden by other arguments (such as request ids).",
     )
     parser.add_argument(
         "--max-concurrency",
@@ -915,19 +993,20 @@ def add_cli_args(parser: argparse.ArgumentParser):
     parser.add_argument(
         "--tokenizer",
         type=str,
-        help=
-        "Name or path of the tokenizer, if not using the default tokenizer.",  # noqa: E501
+        help="Name or path of the tokenizer, if not using the default tokenizer.",  # noqa: E501
     )
     parser.add_argument("--use-beam-search", action="store_true")
     parser.add_argument(
         "--logprobs",
         type=int,
         default=None,
-        help=("Number of logprobs-per-token to compute & return as part of "
-              "the request. If unspecified, then either (1) if beam search "
-              "is disabled, no logprobs are computed & a single dummy "
-              "logprob is returned for each token; or (2) if beam search "
-              "is enabled 1 logprob per token is computed"),
+        help=(
+            "Number of logprobs-per-token to compute & return as part of "
+            "the request. If unspecified, then either (1) if beam search "
+            "is disabled, no logprobs are computed & a single dummy "
+            "logprob is returned for each token; or (2) if beam search "
+            "is enabled 1 logprob per token is computed"
+        ),
     )
     parser.add_argument(
         "--request-rate",
@@ -1010,32 +1089,34 @@ def add_cli_args(parser: argparse.ArgumentParser):
         "--ignore-eos",
         action="store_true",
         help="Set ignore_eos flag when sending the benchmark request."
-        "Warning: ignore_eos is not supported in deepspeed_mii and tgi.")
+        "Warning: ignore_eos is not supported in deepspeed_mii and tgi.",
+    )
     parser.add_argument(
         "--percentile-metrics",
         type=str,
         default="ttft,tpot,itl",
         help="Comma-separated list of selected metrics to report percentils. "
         "This argument specifies the metrics to report percentiles. "
-        "Allowed metric names are \"ttft\", \"tpot\", \"itl\", \"e2el\". ")
+        'Allowed metric names are "ttft", "tpot", "itl", "e2el". ',
+    )
     parser.add_argument(
         "--metric-percentiles",
         type=str,
         default="99",
         help="Comma-separated list of percentiles for selected metrics. "
-        "To report 25-th, 50-th, and 75-th percentiles, use \"25,50,75\". "
-        "Default value is \"99\"."
-        "Use \"--percentile-metrics\" to select metrics.",
+        'To report 25-th, 50-th, and 75-th percentiles, use "25,50,75". '
+        'Default value is "99".'
+        'Use "--percentile-metrics" to select metrics.',
     )
     parser.add_argument(
         "--goodput",
         nargs="+",
         required=False,
-        help="Specify service level objectives for goodput as \"KEY:VALUE\" "
+        help='Specify service level objectives for goodput as "KEY:VALUE" '
         "pairs, where the key is a metric name, and the value is in "
-        "milliseconds. Multiple \"KEY:VALUE\" pairs can be provided, "
+        'milliseconds. Multiple "KEY:VALUE" pairs can be provided, '
         "separated by spaces. Allowed request level metric names are "
-        "\"ttft\", \"tpot\", \"e2el\". For more context on the definition of "
+        '"ttft", "tpot", "e2el". For more context on the definition of '
         "goodput, refer to DistServe paper: https://arxiv.org/pdf/2401.09670 "
         "and the blog: https://hao-ai-lab.github.io/blogs/distserve",
     )
@@ -1052,22 +1133,19 @@ def add_cli_args(parser: argparse.ArgumentParser):
         "--top-p",
         type=float,
         default=None,
-        help="Top-p sampling parameter. Only has effect on "
-        "openai-compatible backends.",
+        help="Top-p sampling parameter. Only has effect on openai-compatible backends.",
     )
     sampling_group.add_argument(
         "--top-k",
         type=int,
         default=None,
-        help="Top-k sampling parameter. Only has effect on "
-        "openai-compatible backends.",
+        help="Top-k sampling parameter. Only has effect on openai-compatible backends.",
     )
     sampling_group.add_argument(
         "--min-p",
         type=float,
         default=None,
-        help="Min-p sampling parameter. Only has effect on "
-        "openai-compatible backends.",
+        help="Min-p sampling parameter. Only has effect on openai-compatible backends.",
     )
     sampling_group.add_argument(
         "--temperature",
@@ -1100,29 +1178,34 @@ def add_cli_args(parser: argparse.ArgumentParser):
     )
 
     parser.add_argument(
-        '--tokenizer-mode',
+        "--tokenizer-mode",
         type=str,
         default="auto",
-        choices=['auto', 'slow', 'mistral', 'custom'],
+        choices=["auto", "slow", "mistral", "custom"],
         help='The tokenizer mode.\n\n* "auto" will use the '
         'fast tokenizer if available.\n* "slow" will '
-        'always use the slow tokenizer. \n* '
+        "always use the slow tokenizer. \n* "
         '"mistral" will always use the `mistral_common` tokenizer. \n*'
-        '"custom" will use --tokenizer to select the preregistered tokenizer.')
-
-    parser.add_argument("--served-model-name",
-                        type=str,
-                        default=None,
-                        help="The model name used in the API. "
-                        "If not specified, the model name will be the "
-                        "same as the ``--model`` argument. ")
-
-    parser.add_argument("--lora-modules",
-                        nargs='+',
-                        default=None,
-                        help="A subset of LoRA module names passed in when "
-                        "launching the server. For each request, the "
-                        "script chooses a LoRA module at random.")
+        '"custom" will use --tokenizer to select the preregistered tokenizer.',
+    )
+
+    parser.add_argument(
+        "--served-model-name",
+        type=str,
+        default=None,
+        help="The model name used in the API. "
+        "If not specified, the model name will be the "
+        "same as the ``--model`` argument. ",
+    )
+
+    parser.add_argument(
+        "--lora-modules",
+        nargs="+",
+        default=None,
+        help="A subset of LoRA module names passed in when "
+        "launching the server. For each request, the "
+        "script chooses a LoRA module at random.",
+    )
 
     parser.add_argument(
         "--ramp-up-strategy",
@@ -1132,7 +1215,8 @@ def add_cli_args(parser: argparse.ArgumentParser):
         help="The ramp-up strategy. This would be used to "
         "ramp up the request rate from initial RPS to final "
         "RPS rate (specified by --ramp-up-start-rps and "
-        "--ramp-up-end-rps.) over the duration of the benchmark.")
+        "--ramp-up-end-rps.) over the duration of the benchmark.",
+    )
     parser.add_argument(
         "--ramp-up-start-rps",
         type=int,
@@ -1153,7 +1237,7 @@ def add_cli_args(parser: argparse.ArgumentParser):
         default=600,
         help="Maximum time to wait for the endpoint to become ready "
         "in seconds (default: 600 seconds / 10 minutes). If set to 0, "
-        "the ready check will be skipped."
+        "the ready check will be skipped.",
     )
 
 
@@ -1172,19 +1256,19 @@ async def main_async(args: argparse.Namespace) -> dict[str, Any]:
             raise ValueError(
                 "When using ramp-up, do not specify --request-rate. "
                 "The request rate will be controlled by ramp-up parameters. "
-                "Please remove the --request-rate argument.")
+                "Please remove the --request-rate argument."
+            )
         if args.ramp_up_start_rps is None or args.ramp_up_end_rps is None:
             raise ValueError(
                 "When using --ramp-up-strategy, both --ramp-up-start-rps and "
-                "--ramp-up-end-rps must be specified")
+                "--ramp-up-end-rps must be specified"
+            )
         if args.ramp_up_start_rps < 0 or args.ramp_up_end_rps < 0:
             raise ValueError("Ramp-up start and end RPS must be non-negative")
         if args.ramp_up_start_rps > args.ramp_up_end_rps:
             raise ValueError("Ramp-up start RPS must be less than end RPS")
-        if (args.ramp_up_strategy == "exponential"
-                and args.ramp_up_start_rps == 0):
-            raise ValueError(
-                "For exponential ramp-up, the start RPS cannot be 0.")
+        if args.ramp_up_strategy == "exponential" and args.ramp_up_start_rps == 0:
+            raise ValueError("For exponential ramp-up, the start RPS cannot be 0.")
 
     label = args.label
     model_id = args.model
@@ -1208,17 +1292,19 @@ async def main_async(args: argparse.Namespace) -> dict[str, Any]:
                 kvstring = item.split("=", 1)
                 headers[kvstring[0].strip()] = kvstring[1].strip()
             else:
-                raise ValueError(
-                    "Invalid header format. Please use KEY=VALUE format.")
+                raise ValueError("Invalid header format. Please use KEY=VALUE format.")
 
-    tokenizer = get_tokenizer(tokenizer_id,
-                              tokenizer_mode=tokenizer_mode,
-                              trust_remote_code=args.trust_remote_code)
+    tokenizer = get_tokenizer(
+        tokenizer_id,
+        tokenizer_mode=tokenizer_mode,
+        trust_remote_code=args.trust_remote_code,
+    )
 
     if args.dataset_name is None:
         raise ValueError(
             "Please specify '--dataset-name' and the corresponding "
-            "'--dataset-path' if required.")
+            "'--dataset-path' if required."
+        )
 
     # Load the dataset.
     input_requests = get_samples(args, tokenizer)
@@ -1235,13 +1321,15 @@ async def main_async(args: argparse.Namespace) -> dict[str, Any]:
             "frequency_penalty": args.frequency_penalty,
             "presence_penalty": args.presence_penalty,
             "repetition_penalty": args.repetition_penalty,
-        }.items() if v is not None
+        }.items()
+        if v is not None
     }
 
     # Sampling parameters are only supported by openai-compatible backend.
     if sampling_params and args.backend not in OPENAI_COMPATIBLE_BACKENDS:
-        raise ValueError("Sampling parameters are only supported by "
-                         "openai-compatible backends.")
+        raise ValueError(
+            "Sampling parameters are only supported by openai-compatible backends."
+        )
 
     if "temperature" not in sampling_params:
         sampling_params["temperature"] = 0.0  # Default to greedy decoding.
@@ -1264,9 +1352,7 @@ async def main_async(args: argparse.Namespace) -> dict[str, Any]:
         disable_tqdm=args.disable_tqdm,
         profile=args.profile,
         selected_percentile_metrics=args.percentile_metrics.split(","),
-        selected_percentiles=[
-            float(p) for p in args.metric_percentiles.split(",")
-        ],
+        selected_percentiles=[float(p) for p in args.metric_percentiles.split(",")],
         ignore_eos=args.ignore_eos,
         goodput_config_dict=goodput_config_dict,
         max_concurrency=args.max_concurrency,
@@ -1285,7 +1371,7 @@ async def main_async(args: argparse.Namespace) -> dict[str, Any]:
     # Setup
     current_dt = datetime.now().strftime("%Y%m%d-%H%M%S")
     result_json["date"] = current_dt
-    result_json["endpoint_type"] = args.backend # for backward compatibility
+    result_json["endpoint_type"] = args.backend  # for backward compatibility
     result_json["backend"] = args.backend
     result_json["label"] = label
     result_json["model_id"] = model_id
@@ -1300,11 +1386,13 @@ async def main_async(args: argparse.Namespace) -> dict[str, Any]:
                 result_json[kvstring[0].strip()] = kvstring[1].strip()
             else:
                 raise ValueError(
-                    "Invalid metadata format. Please use KEY=VALUE format.")
+                    "Invalid metadata format. Please use KEY=VALUE format."
+                )
 
     # Traffic
-    result_json["request_rate"] = (args.request_rate if args.request_rate
-                                   < float("inf") else "inf")
+    result_json["request_rate"] = (
+        args.request_rate if args.request_rate < float("inf") else "inf"
+    )
     result_json["burstiness"] = args.burstiness
     result_json["max_concurrency"] = args.max_concurrency
 
@@ -1319,12 +1407,12 @@ async def main_async(args: argparse.Namespace) -> dict[str, Any]:
     if not args.save_detailed:
         # Remove fields with too many data points
         for field in [
-                "input_lens",
-                "output_lens",
-                "ttfts",
-                "itls",
-                "generated_texts",
-                "errors",
+            "input_lens",
+            "output_lens",
+            "ttfts",
+            "itls",
+            "generated_texts",
+            "errors",
         ]:
             if field in result_json:
                 del result_json[field]
@@ -1334,8 +1422,11 @@ async def main_async(args: argparse.Namespace) -> dict[str, Any]:
         # Save to file
     if args.save_result or args.append_result:
         base_model_id = model_id.split("/")[-1]
-        max_concurrency_str = (f"-concurrency{args.max_concurrency}"
-                               if args.max_concurrency is not None else "")
+        max_concurrency_str = (
+            f"-concurrency{args.max_concurrency}"
+            if args.max_concurrency is not None
+            else ""
+        )
         label = label or args.backend
         if args.ramp_up_strategy is not None:
             file_name = f"{label}-ramp-up-{args.ramp_up_strategy}-{args.ramp_up_start_rps}qps-{args.ramp_up_end_rps}qps{max_concurrency_str}-{base_model_id}-{current_dt}.json"  # noqa
@@ -1346,9 +1437,9 @@ async def main_async(args: argparse.Namespace) -> dict[str, Any]:
         if args.result_dir:
             os.makedirs(args.result_dir, exist_ok=True)
             file_name = os.path.join(args.result_dir, file_name)
-        with open(file_name,
-                  mode="a+" if args.append_result else "w",
-                  encoding="utf-8") as outfile:
+        with open(
+            file_name, mode="a+" if args.append_result else "w", encoding="utf-8"
+        ) as outfile:
             # Append a newline.
             if args.append_result and outfile.tell() != 0:
                 outfile.write("\n")
diff --git a/vllm/benchmarks/throughput.py b/vllm/benchmarks/throughput.py
index 9e38e63a0883..721eb554d026 100644
--- a/vllm/benchmarks/throughput.py
+++ b/vllm/benchmarks/throughput.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Benchmark offline inference throughput."""
+
 import argparse
 import dataclasses
 import json
@@ -13,18 +14,21 @@
 import torch
 import uvloop
 from tqdm import tqdm
-from transformers import (AutoModelForCausalLM, AutoTokenizer,
-                          PreTrainedTokenizerBase)
-
-from vllm.benchmarks.datasets import (AIMODataset, BurstGPTDataset,
-                                      ConversationDataset,
-                                      InstructCoderDataset,
-                                      PrefixRepetitionRandomDataset,
-                                      RandomDataset, SampleRequest,
-                                      ShareGPTDataset, SonnetDataset,
-                                      VisionArenaDataset)
-from vllm.benchmarks.lib.utils import (convert_to_pytorch_benchmark_format,
-                                       write_to_json)
+from transformers import AutoModelForCausalLM, AutoTokenizer, PreTrainedTokenizerBase
+
+from vllm.benchmarks.datasets import (
+    AIMODataset,
+    BurstGPTDataset,
+    ConversationDataset,
+    InstructCoderDataset,
+    PrefixRepetitionRandomDataset,
+    RandomDataset,
+    SampleRequest,
+    ShareGPTDataset,
+    SonnetDataset,
+    VisionArenaDataset,
+)
+from vllm.benchmarks.lib.utils import convert_to_pytorch_benchmark_format, write_to_json
 from vllm.engine.arg_utils import AsyncEngineArgs, EngineArgs
 from vllm.inputs import TextPrompt, TokensPrompt
 from vllm.lora.request import LoRARequest
@@ -41,23 +45,30 @@ def run_vllm(
     disable_detokenize: bool = False,
 ) -> tuple[float, Optional[list[RequestOutput]]]:
     from vllm import LLM, SamplingParams
+
     llm = LLM(**dataclasses.asdict(engine_args))
     assert all(
-        llm.llm_engine.model_config.max_model_len >= (
-            request.prompt_len + request.expected_output_len)
-        for request in requests), (
-            "Please ensure that max_model_len is greater than the sum of"
-            " prompt_len and expected_output_len for all requests.")
+        llm.llm_engine.model_config.max_model_len
+        >= (request.prompt_len + request.expected_output_len)
+        for request in requests
+    ), (
+        "Please ensure that max_model_len is greater than the sum of"
+        " prompt_len and expected_output_len for all requests."
+    )
     # Add the requests to the engine.
     prompts: list[Union[TextPrompt, TokensPrompt]] = []
     sampling_params: list[SamplingParams] = []
     for request in requests:
         prompts.append(
-            TokensPrompt(prompt_token_ids=request.prompt["prompt_token_ids"],
-                       multi_modal_data=request.multi_modal_data)
-            if "prompt_token_ids" in request.prompt else \
-            TextPrompt(prompt=request.prompt,
-                       multi_modal_data=request.multi_modal_data))
+            TokensPrompt(
+                prompt_token_ids=request.prompt["prompt_token_ids"],
+                multi_modal_data=request.multi_modal_data,
+            )
+            if "prompt_token_ids" in request.prompt
+            else TextPrompt(
+                prompt=request.prompt, multi_modal_data=request.multi_modal_data
+            )
+        )
         sampling_params.append(
             SamplingParams(
                 n=n,
@@ -66,7 +77,8 @@ def run_vllm(
                 ignore_eos=True,
                 max_tokens=request.expected_output_len,
                 detokenize=not disable_detokenize,
-            ))
+            )
+        )
     lora_requests: Optional[list[LoRARequest]] = None
     if engine_args.enable_lora:
         lora_requests = [request.lora_request for request in requests]
@@ -78,10 +90,9 @@ def run_vllm(
         start = time.perf_counter()
         if do_profile:
             llm.start_profile()
-        outputs = llm.generate(prompts,
-                               sampling_params,
-                               lora_request=lora_requests,
-                               use_tqdm=True)
+        outputs = llm.generate(
+            prompts, sampling_params, lora_request=lora_requests, use_tqdm=True
+        )
         if do_profile:
             llm.stop_profile()
         end = time.perf_counter()
@@ -101,7 +112,8 @@ def run_vllm(
                 beam_width=n,
                 max_tokens=output_len,
                 ignore_eos=True,
-            ))
+            ),
+        )
         if do_profile:
             llm.stop_profile()
         end = time.perf_counter()
@@ -109,25 +121,29 @@ def run_vllm(
 
 
 def run_vllm_chat(
-        requests: list[SampleRequest],
-        n: int,
-        engine_args: EngineArgs,
-        do_profile: bool,
-        disable_detokenize: bool = False) -> tuple[float, list[RequestOutput]]:
+    requests: list[SampleRequest],
+    n: int,
+    engine_args: EngineArgs,
+    do_profile: bool,
+    disable_detokenize: bool = False,
+) -> tuple[float, list[RequestOutput]]:
     """
     Run vLLM chat benchmark. This function is recommended ONLY for benchmarking
     multimodal models as it properly handles multimodal inputs and chat
     formatting. For non-multimodal models, use run_vllm() instead.
     """
     from vllm import LLM, SamplingParams
+
     llm = LLM(**dataclasses.asdict(engine_args))
 
     assert all(
-        llm.llm_engine.model_config.max_model_len >= (
-            request.prompt_len + request.expected_output_len)
-        for request in requests), (
-            "Please ensure that max_model_len is greater than the sum of "
-            "prompt_len and expected_output_len for all requests.")
+        llm.llm_engine.model_config.max_model_len
+        >= (request.prompt_len + request.expected_output_len)
+        for request in requests
+    ), (
+        "Please ensure that max_model_len is greater than the sum of "
+        "prompt_len and expected_output_len for all requests."
+    )
 
     prompts = []
     sampling_params: list[SamplingParams] = []
@@ -141,7 +157,8 @@ def run_vllm_chat(
                 ignore_eos=True,
                 max_tokens=request.expected_output_len,
                 detokenize=not disable_detokenize,
-            ))
+            )
+        )
     start = time.perf_counter()
     if do_profile:
         llm.start_profile()
@@ -162,7 +179,8 @@ async def run_vllm_async(
 ) -> float:
     from vllm import SamplingParams
     from vllm.entrypoints.openai.api_server import (
-        build_async_engine_client_from_engine_args)
+        build_async_engine_client_from_engine_args,
+    )
 
     async with build_async_engine_client_from_engine_args(
         engine_args,
@@ -170,11 +188,13 @@ async def run_vllm_async(
     ) as llm:
         model_config = await llm.get_model_config()
         assert all(
-            model_config.max_model_len >= (request.prompt_len +
-                                           request.expected_output_len)
-            for request in requests), (
-                "Please ensure that max_model_len is greater than the sum of"
-                " prompt_len and expected_output_len for all requests.")
+            model_config.max_model_len
+            >= (request.prompt_len + request.expected_output_len)
+            for request in requests
+        ), (
+            "Please ensure that max_model_len is greater than the sum of"
+            " prompt_len and expected_output_len for all requests."
+        )
 
         # Add the requests to the engine.
         prompts: list[Union[TextPrompt, TokensPrompt]] = []
@@ -182,11 +202,15 @@ async def run_vllm_async(
         lora_requests: list[Optional[LoRARequest]] = []
         for request in requests:
             prompts.append(
-                TokensPrompt(prompt_token_ids=request.prompt["prompt_token_ids"],
-                        multi_modal_data=request.multi_modal_data)
-                if "prompt_token_ids" in request.prompt else \
-                TextPrompt(prompt=request.prompt,
-                           multi_modal_data=request.multi_modal_data))
+                TokensPrompt(
+                    prompt_token_ids=request.prompt["prompt_token_ids"],
+                    multi_modal_data=request.multi_modal_data,
+                )
+                if "prompt_token_ids" in request.prompt
+                else TextPrompt(
+                    prompt=request.prompt, multi_modal_data=request.multi_modal_data
+                )
+            )
             sampling_params.append(
                 SamplingParams(
                     n=n,
@@ -195,19 +219,18 @@ async def run_vllm_async(
                     ignore_eos=True,
                     max_tokens=request.expected_output_len,
                     detokenize=not disable_detokenize,
-                ))
+                )
+            )
             lora_requests.append(request.lora_request)
 
         generators = []
         start = time.perf_counter()
         if do_profile:
             await llm.start_profile()
-        for i, (prompt, sp,
-                lr) in enumerate(zip(prompts, sampling_params, lora_requests)):
-            generator = llm.generate(prompt,
-                                     sp,
-                                     lora_request=lr,
-                                     request_id=f"test{i}")
+        for i, (prompt, sp, lr) in enumerate(
+            zip(prompts, sampling_params, lora_requests)
+        ):
+            generator = llm.generate(prompt, sp, lora_request=lr, request_id=f"test{i}")
             generators.append(generator)
         all_gens = merge_async_iterators(*generators)
         async for i, res in all_gens:
@@ -228,7 +251,8 @@ def run_hf(
     disable_detokenize: bool = False,
 ) -> float:
     llm = AutoModelForCausalLM.from_pretrained(
-        model, torch_dtype=torch.float16, trust_remote_code=trust_remote_code)
+        model, torch_dtype=torch.float16, trust_remote_code=trust_remote_code
+    )
     if llm.config.model_type == "llama":
         # To enable padding in the HF backend.
         tokenizer.pad_token = tokenizer.eos_token
@@ -251,14 +275,15 @@ def run_hf(
             # Check if we can add more requests to the batch.
             next_prompt_len = requests[i + 1].prompt_len
             next_output_len = requests[i + 1].expected_output_len
-            if (max(max_prompt_len, next_prompt_len) +
-                    max(max_output_len, next_output_len)) <= 2048:
+            if (
+                max(max_prompt_len, next_prompt_len)
+                + max(max_output_len, next_output_len)
+            ) <= 2048:
                 # We can add more requests to the batch.
                 continue
 
         # Generate the sequences.
-        input_ids = tokenizer(batch, return_tensors="pt",
-                              padding=True).input_ids
+        input_ids = tokenizer(batch, return_tensors="pt", padding=True).input_ids
         llm_outputs = llm.generate(
             input_ids=input_ids.cuda(),
             do_sample=True,
@@ -281,8 +306,9 @@ def run_hf(
     return end - start
 
 
-def save_to_pytorch_benchmark_format(args: argparse.Namespace,
-                                     results: dict[str, Any]) -> None:
+def save_to_pytorch_benchmark_format(
+    args: argparse.Namespace, results: dict[str, Any]
+) -> None:
     pt_records = convert_to_pytorch_benchmark_format(
         args=args,
         metrics={
@@ -290,9 +316,9 @@ def save_to_pytorch_benchmark_format(args: argparse.Namespace,
             "tokens_per_second": [results["tokens_per_second"]],
         },
         extra_info={
-            k: results[k]
-            for k in ["elapsed_time", "num_requests", "total_num_tokens"]
-        })
+            k: results[k] for k in ["elapsed_time", "num_requests", "total_num_tokens"]
+        },
+    )
     if pt_records:
         # Don't use json suffix here as we don't want CI to pick it up
         pt_file = f"{os.path.splitext(args.output_json)[0]}.pytorch.json"
@@ -324,7 +350,8 @@ def get_requests(args, tokenizer):
             sample_kwargs["enable_multimodal_chat"] = True
     elif args.dataset_name == "sonnet":
         assert tokenizer.chat_template or tokenizer.default_chat_template, (
-            "Tokenizer/model must have chat template for sonnet dataset.")
+            "Tokenizer/model must have chat template for sonnet dataset."
+        )
         dataset_cls = SonnetDataset
         sample_kwargs["prefix_len"] = args.prefix_len
         sample_kwargs["return_prompt_formatted"] = True
@@ -333,21 +360,21 @@ def get_requests(args, tokenizer):
     elif args.dataset_name == "hf":
         if args.dataset_path in VisionArenaDataset.SUPPORTED_DATASET_PATHS:
             dataset_cls = VisionArenaDataset
-            common_kwargs['dataset_subset'] = None
-            common_kwargs['dataset_split'] = "train"
+            common_kwargs["dataset_subset"] = None
+            common_kwargs["dataset_split"] = "train"
             sample_kwargs["enable_multimodal_chat"] = True
         elif args.dataset_path in InstructCoderDataset.SUPPORTED_DATASET_PATHS:
             dataset_cls = InstructCoderDataset
-            common_kwargs['dataset_split'] = "train"
+            common_kwargs["dataset_split"] = "train"
         elif args.dataset_path in ConversationDataset.SUPPORTED_DATASET_PATHS:
             dataset_cls = ConversationDataset
-            common_kwargs['dataset_subset'] = args.hf_subset
-            common_kwargs['dataset_split'] = args.hf_split
+            common_kwargs["dataset_subset"] = args.hf_subset
+            common_kwargs["dataset_split"] = args.hf_split
             sample_kwargs["enable_multimodal_chat"] = True
         elif args.dataset_path in AIMODataset.SUPPORTED_DATASET_PATHS:
             dataset_cls = AIMODataset
-            common_kwargs['dataset_subset'] = None
-            common_kwargs['dataset_split'] = "train"
+            common_kwargs["dataset_subset"] = None
+            common_kwargs["dataset_split"] = "train"
     elif args.dataset_name == "prefix_repetition":
         dataset_cls = PrefixRepetitionRandomDataset
         sample_kwargs["prefix_len"] = args.prefix_repetition_prefix_len
@@ -373,8 +400,11 @@ def filter_requests_for_dp(requests, data_parallel_size):
     global_rank = int(os.environ["RANK"])
     world_size = int(os.environ["WORLD_SIZE"])
     data_parallel_rank = global_rank // (world_size // data_parallel_size)
-    return [r for i, r in enumerate(requests)
-            if i % data_parallel_size == data_parallel_rank]
+    return [
+        r
+        for i, r in enumerate(requests)
+        if i % data_parallel_size == data_parallel_rank
+    ]
 
 
 def validate_args(args):
@@ -387,7 +417,8 @@ def validate_args(args):
         warnings.warn(
             "The '--dataset' argument will be deprecated in the next release. "
             "Please use '--dataset-name' and '--dataset-path' instead.",
-            stacklevel=2)
+            stacklevel=2,
+        )
         args.dataset_path = args.dataset
 
     if not getattr(args, "tokenizer", None):
@@ -404,9 +435,8 @@ def validate_args(args):
         and not args.dataset_path
         and args.dataset_name not in {"prefix_repetition"}
     ):
-        print(
-            "When dataset path is not set, it will default to random dataset")
-        args.dataset_name = 'random'
+        print("When dataset path is not set, it will default to random dataset")
+        args.dataset_name = "random"
         if args.input_len is None:
             raise ValueError("input_len must be provided for a random dataset")
 
@@ -414,41 +444,55 @@ def validate_args(args):
     # --hf-subset and --hf-split: only used
     # when dataset_name is 'hf'
     if args.dataset_name != "hf" and (
-            getattr(args, "hf_subset", None) is not None
-            or getattr(args, "hf_split", None) is not None):
-        warnings.warn("--hf-subset and --hf-split will be ignored \
+        getattr(args, "hf_subset", None) is not None
+        or getattr(args, "hf_split", None) is not None
+    ):
+        warnings.warn(
+            "--hf-subset and --hf-split will be ignored \
                 since --dataset-name is not 'hf'.",
-                      stacklevel=2)
+            stacklevel=2,
+        )
     elif args.dataset_name == "hf":
         if args.dataset_path in (
-                VisionArenaDataset.SUPPORTED_DATASET_PATHS.keys()
-                | ConversationDataset.SUPPORTED_DATASET_PATHS):
-            assert args.backend == "vllm-chat", f"{args.dataset_path} needs to use vllm-chat as the backend."  #noqa: E501
-        elif args.dataset_path in (InstructCoderDataset.SUPPORTED_DATASET_PATHS
-                                   | AIMODataset.SUPPORTED_DATASET_PATHS):
-            assert args.backend == "vllm", f"{args.dataset_path} needs to use vllm as the backend."  #noqa: E501
+            VisionArenaDataset.SUPPORTED_DATASET_PATHS.keys()
+            | ConversationDataset.SUPPORTED_DATASET_PATHS
+        ):
+            assert args.backend == "vllm-chat", (
+                f"{args.dataset_path} needs to use vllm-chat as the backend."
+            )  # noqa: E501
+        elif args.dataset_path in (
+            InstructCoderDataset.SUPPORTED_DATASET_PATHS
+            | AIMODataset.SUPPORTED_DATASET_PATHS
+        ):
+            assert args.backend == "vllm", (
+                f"{args.dataset_path} needs to use vllm as the backend."
+            )  # noqa: E501
         else:
-            raise ValueError(
-                f"{args.dataset_path} is not supported by hf dataset.")
+            raise ValueError(f"{args.dataset_path} is not supported by hf dataset.")
 
     # --random-range-ratio: only used when dataset_name is 'random'
-    if args.dataset_name != 'random' and args.random_range_ratio is not None:
-        warnings.warn("--random-range-ratio will be ignored since \
+    if args.dataset_name != "random" and args.random_range_ratio is not None:
+        warnings.warn(
+            "--random-range-ratio will be ignored since \
                 --dataset-name is not 'random'.",
-                      stacklevel=2)
+            stacklevel=2,
+        )
 
     # --prefix-len: only used when dataset_name is 'random', 'sonnet', or not
     # set.
-    if args.dataset_name not in {"random", "sonnet", None
-                                 } and args.prefix_len is not None:
-        warnings.warn("--prefix-len will be ignored since --dataset-name\
+    if (
+        args.dataset_name not in {"random", "sonnet", None}
+        and args.prefix_len is not None
+    ):
+        warnings.warn(
+            "--prefix-len will be ignored since --dataset-name\
                  is not 'random', 'sonnet', or not set.",
-                      stacklevel=2)
+            stacklevel=2,
+        )
 
     # === LoRA Settings ===
     if getattr(args, "enable_lora", False) and args.backend != "vllm":
-        raise ValueError(
-            "LoRA benchmarking is only supported for vLLM backend")
+        raise ValueError("LoRA benchmarking is only supported for vLLM backend")
     if getattr(args, "enable_lora", False) and args.lora_path is None:
         raise ValueError("LoRA path must be provided when enable_lora is True")
 
@@ -458,8 +502,10 @@ def validate_args(args):
     if args.backend != "hf" and args.hf_max_batch_size is not None:
         raise ValueError("HF max batch size is only for HF backend.")
 
-    if args.backend in {"hf", "mii"} and getattr(args, "quantization",
-                                                 None) is not None:
+    if (
+        args.backend in {"hf", "mii"}
+        and getattr(args, "quantization", None) is not None
+    ):
         raise ValueError("Quantization is only for vLLM backend.")
 
     if args.backend == "mii" and args.dtype != "auto":
@@ -467,12 +513,11 @@ def validate_args(args):
     if args.backend == "mii" and args.n != 1:
         raise ValueError("n must be 1 for MII backend.")
     if args.backend == "mii" and args.tokenizer != args.model:
-        raise ValueError(
-            "Tokenizer must be the same as the model for MII backend.")
+        raise ValueError("Tokenizer must be the same as the model for MII backend.")
 
     if args.data_parallel_size > 1 and (
-        args.distributed_executor_backend != "external_launcher"
-        or args.async_engine):
+        args.distributed_executor_backend != "external_launcher" or args.async_engine
+    ):
         # --data-parallel is not supported fully.
         # Old issue: https://github.com/vllm-project/vllm/issues/16222
         # Currently we only support data parallel with external launcher
@@ -485,19 +530,19 @@ def validate_args(args):
 
 
 def add_cli_args(parser: argparse.ArgumentParser):
-    parser.add_argument("--backend",
-                        type=str,
-                        choices=["vllm", "hf", "mii", "vllm-chat"],
-                        default="vllm")
+    parser.add_argument(
+        "--backend",
+        type=str,
+        choices=["vllm", "hf", "mii", "vllm-chat"],
+        default="vllm",
+    )
     parser.add_argument(
         "--dataset-name",
         type=str,
-        choices=[
-            "sharegpt", "random", "sonnet", "burstgpt", "hf",
-            "prefix_repetition"
-        ],
+        choices=["sharegpt", "random", "sonnet", "burstgpt", "hf", "prefix_repetition"],
         help="Name of the dataset to benchmark on.",
-        default="sharegpt")
+        default="sharegpt",
+    )
     parser.add_argument(
         "--dataset",
         type=str,
@@ -505,57 +550,70 @@ def add_cli_args(parser: argparse.ArgumentParser):
         help="Path to the ShareGPT dataset, will be deprecated in\
             the next release. The dataset is expected to "
         "be a json in form of list[dict[..., conversations: "
-        "list[dict[..., value: <prompt_or_response>]]]]")
-    parser.add_argument("--dataset-path",
-                        type=str,
-                        default=None,
-                        help="Path to the dataset")
-    parser.add_argument("--input-len",
-                        type=int,
-                        default=None,
-                        help="Input prompt length for each request")
-    parser.add_argument("--output-len",
-                        type=int,
-                        default=None,
-                        help="Output length for each request. Overrides the "
-                        "output length from the dataset.")
-    parser.add_argument("--n",
-                        type=int,
-                        default=1,
-                        help="Number of generated sequences per prompt.")
-    parser.add_argument("--num-prompts",
-                        type=int,
-                        default=1000,
-                        help="Number of prompts to process.")
-    parser.add_argument("--hf-max-batch-size",
-                        type=int,
-                        default=None,
-                        help="Maximum batch size for HF backend.")
+        "list[dict[..., value: <prompt_or_response>]]]]",
+    )
+    parser.add_argument(
+        "--dataset-path", type=str, default=None, help="Path to the dataset"
+    )
+    parser.add_argument(
+        "--input-len",
+        type=int,
+        default=None,
+        help="Input prompt length for each request",
+    )
+    parser.add_argument(
+        "--output-len",
+        type=int,
+        default=None,
+        help="Output length for each request. Overrides the "
+        "output length from the dataset.",
+    )
     parser.add_argument(
-        '--output-json',
+        "--n", type=int, default=1, help="Number of generated sequences per prompt."
+    )
+    parser.add_argument(
+        "--num-prompts", type=int, default=1000, help="Number of prompts to process."
+    )
+    parser.add_argument(
+        "--hf-max-batch-size",
+        type=int,
+        default=None,
+        help="Maximum batch size for HF backend.",
+    )
+    parser.add_argument(
+        "--output-json",
         type=str,
         default=None,
-        help='Path to save the throughput results in JSON format.')
-    parser.add_argument("--async-engine",
-                        action='store_true',
-                        default=False,
-                        help="Use vLLM async engine rather than LLM class.")
-    parser.add_argument("--disable-frontend-multiprocessing",
-                        action='store_true',
-                        default=False,
-                        help="Disable decoupled async engine frontend.")
+        help="Path to save the throughput results in JSON format.",
+    )
+    parser.add_argument(
+        "--async-engine",
+        action="store_true",
+        default=False,
+        help="Use vLLM async engine rather than LLM class.",
+    )
+    parser.add_argument(
+        "--disable-frontend-multiprocessing",
+        action="store_true",
+        default=False,
+        help="Disable decoupled async engine frontend.",
+    )
     parser.add_argument(
         "--disable-detokenize",
         action="store_true",
-        help=("Do not detokenize the response (i.e. do not include "
-              "detokenization time in the measurement)"))
+        help=(
+            "Do not detokenize the response (i.e. do not include "
+            "detokenization time in the measurement)"
+        ),
+    )
     # LoRA
     parser.add_argument(
         "--lora-path",
         type=str,
         default=None,
         help="Path to the lora adapters to use. This can be an absolute path, "
-        "a relative path, or a Hugging Face model identifier.")
+        "a relative path, or a Hugging Face model identifier.",
+    )
     parser.add_argument(
         "--prefix-len",
         type=int,
@@ -575,24 +633,24 @@ def add_cli_args(parser: argparse.ArgumentParser):
     )
 
     # hf dtaset
-    parser.add_argument("--hf-subset",
-                        type=str,
-                        default=None,
-                        help="Subset of the HF dataset.")
-    parser.add_argument("--hf-split",
-                        type=str,
-                        default=None,
-                        help="Split of the HF dataset.")
+    parser.add_argument(
+        "--hf-subset", type=str, default=None, help="Subset of the HF dataset."
+    )
+    parser.add_argument(
+        "--hf-split", type=str, default=None, help="Split of the HF dataset."
+    )
     parser.add_argument(
         "--profile",
         action="store_true",
         default=False,
         help="Use Torch Profiler. The env variable "
-        "VLLM_TORCH_PROFILER_DIR must be set to enable profiler.")
+        "VLLM_TORCH_PROFILER_DIR must be set to enable profiler.",
+    )
 
     # prefix repetition dataset
     prefix_repetition_group = parser.add_argument_group(
-        "prefix repetition dataset options")
+        "prefix repetition dataset options"
+    )
     prefix_repetition_group.add_argument(
         "--prefix-repetition-prefix-len",
         type=int,
@@ -634,10 +692,10 @@ def main(args: argparse.Namespace):
     random.seed(args.seed)
     # Sample the requests.
     tokenizer = AutoTokenizer.from_pretrained(
-        args.tokenizer, trust_remote_code=args.trust_remote_code)
+        args.tokenizer, trust_remote_code=args.trust_remote_code
+    )
     requests = get_requests(args, tokenizer)
-    is_multi_modal = any(request.multi_modal_data is not None
-                         for request in requests)
+    is_multi_modal = any(request.multi_modal_data is not None for request in requests)
     request_outputs: Optional[list[RequestOutput]] = None
     if args.backend == "vllm":
         if args.async_engine:
@@ -649,24 +707,37 @@ def main(args: argparse.Namespace):
                     disable_frontend_multiprocessing=args.disable_frontend_multiprocessing,
                     disable_detokenize=args.disable_detokenize,
                     do_profile=args.profile,
-                ))
+                )
+            )
         else:
             elapsed_time, request_outputs = run_vllm(
-                requests, args.n, EngineArgs.from_cli_args(args),
+                requests,
+                args.n,
+                EngineArgs.from_cli_args(args),
                 disable_detokenize=args.disable_detokenize,
-                do_profile=args.profile)
+                do_profile=args.profile,
+            )
     elif args.backend == "hf":
         assert args.tensor_parallel_size == 1
         if args.profile:
-            raise NotImplementedError(
-                "Profiling not implemented yet for backend='hf'.")
-        elapsed_time = run_hf(requests, args.model, tokenizer, args.n,
-                              args.hf_max_batch_size, args.trust_remote_code,
-                              args.disable_detokenize)
+            raise NotImplementedError("Profiling not implemented yet for backend='hf'.")
+        elapsed_time = run_hf(
+            requests,
+            args.model,
+            tokenizer,
+            args.n,
+            args.hf_max_batch_size,
+            args.trust_remote_code,
+            args.disable_detokenize,
+        )
     elif args.backend == "vllm-chat":
         elapsed_time, request_outputs = run_vllm_chat(
-            requests, args.n, EngineArgs.from_cli_args(args),
-            disable_detokenize=args.disable_detokenize, do_profile=args.profile)
+            requests,
+            args.n,
+            EngineArgs.from_cli_args(args),
+            disable_detokenize=args.disable_detokenize,
+            do_profile=args.profile,
+        )
     else:
         raise ValueError(f"Unknown backend: {args.backend}")
 
@@ -678,28 +749,31 @@ def main(args: argparse.Namespace):
         for ro in request_outputs:
             if not isinstance(ro, RequestOutput):
                 continue
-            total_prompt_tokens += len(
-                ro.prompt_token_ids) if ro.prompt_token_ids else 0
-            total_output_tokens += sum(
-                len(o.token_ids) for o in ro.outputs if o)
+            total_prompt_tokens += (
+                len(ro.prompt_token_ids) if ro.prompt_token_ids else 0
+            )
+            total_output_tokens += sum(len(o.token_ids) for o in ro.outputs if o)
         total_num_tokens = total_prompt_tokens + total_output_tokens
     else:
-        total_num_tokens = sum(r.prompt_len + r.expected_output_len
-                               for r in requests)
+        total_num_tokens = sum(r.prompt_len + r.expected_output_len for r in requests)
         total_output_tokens = sum(r.expected_output_len for r in requests)
         total_prompt_tokens = total_num_tokens - total_output_tokens
 
     if is_multi_modal and args.backend != "vllm-chat":
-        print("\033[91mWARNING\033[0m: Multi-modal request with "
-              f"{args.backend} backend detected. The "
-              "following metrics are not accurate because image tokens are not"
-              " counted. See vllm-project/vllm/issues/9778 for details.")
+        print(
+            "\033[91mWARNING\033[0m: Multi-modal request with "
+            f"{args.backend} backend detected. The "
+            "following metrics are not accurate because image tokens are not"
+            " counted. See vllm-project/vllm/issues/9778 for details."
+        )
         # TODO(vllm-project/vllm/issues/9778): Count multi-modal token length.
         # vllm-chat backend counts the image tokens now
 
-    print(f"Throughput: {len(requests) / elapsed_time:.2f} requests/s, "
-          f"{total_num_tokens / elapsed_time:.2f} total tokens/s, "
-          f"{total_output_tokens / elapsed_time:.2f} output tokens/s")
+    print(
+        f"Throughput: {len(requests) / elapsed_time:.2f} requests/s, "
+        f"{total_num_tokens / elapsed_time:.2f} total tokens/s, "
+        f"{total_output_tokens / elapsed_time:.2f} output tokens/s"
+    )
     print(f"Total num prompt tokens:  {total_prompt_tokens}")
     print(f"Total num output tokens:  {total_output_tokens}")
 
diff --git a/vllm/collect_env.py b/vllm/collect_env.py
index fb9d3657790c..4ca0852e3998 100644
--- a/vllm/collect_env.py
+++ b/vllm/collect_env.py
@@ -9,6 +9,7 @@
 import os
 import subprocess
 import sys
+
 # Unlike the rest of the PyTorch this file must be python2 compliant.
 # This script outputs relevant system environment info
 # Run it with `python collect_env.py` or `python -m torch.utils.collect_env`
@@ -20,45 +21,47 @@
 
 try:
     import torch
+
     TORCH_AVAILABLE = True
 except (ImportError, NameError, AttributeError, OSError):
     TORCH_AVAILABLE = False
 
 # System Environment Information
 SystemEnv = namedtuple(
-    'SystemEnv',
+    "SystemEnv",
     [
-        'torch_version',
-        'is_debug_build',
-        'cuda_compiled_version',
-        'gcc_version',
-        'clang_version',
-        'cmake_version',
-        'os',
-        'libc_version',
-        'python_version',
-        'python_platform',
-        'is_cuda_available',
-        'cuda_runtime_version',
-        'cuda_module_loading',
-        'nvidia_driver_version',
-        'nvidia_gpu_models',
-        'cudnn_version',
-        'pip_version',  # 'pip' or 'pip3'
-        'pip_packages',
-        'conda_packages',
-        'hip_compiled_version',
-        'hip_runtime_version',
-        'miopen_runtime_version',
-        'caching_allocator_config',
-        'is_xnnpack_available',
-        'cpu_info',
-        'rocm_version',  # vllm specific field
-        'vllm_version',  # vllm specific field
-        'vllm_build_flags',  # vllm specific field
-        'gpu_topo',  # vllm specific field
-        'env_vars',
-    ])
+        "torch_version",
+        "is_debug_build",
+        "cuda_compiled_version",
+        "gcc_version",
+        "clang_version",
+        "cmake_version",
+        "os",
+        "libc_version",
+        "python_version",
+        "python_platform",
+        "is_cuda_available",
+        "cuda_runtime_version",
+        "cuda_module_loading",
+        "nvidia_driver_version",
+        "nvidia_gpu_models",
+        "cudnn_version",
+        "pip_version",  # 'pip' or 'pip3'
+        "pip_packages",
+        "conda_packages",
+        "hip_compiled_version",
+        "hip_runtime_version",
+        "miopen_runtime_version",
+        "caching_allocator_config",
+        "is_xnnpack_available",
+        "cpu_info",
+        "rocm_version",  # vllm specific field
+        "vllm_version",  # vllm specific field
+        "vllm_build_flags",  # vllm specific field
+        "gpu_topo",  # vllm specific field
+        "env_vars",
+    ],
+)
 
 DEFAULT_CONDA_PATTERNS = {
     "torch",
@@ -98,18 +101,17 @@ def run(command):
     """Return (return-code, stdout, stderr)."""
     shell = True if type(command) is str else False
     try:
-        p = subprocess.Popen(command,
-                             stdout=subprocess.PIPE,
-                             stderr=subprocess.PIPE,
-                             shell=shell)
+        p = subprocess.Popen(
+            command, stdout=subprocess.PIPE, stderr=subprocess.PIPE, shell=shell
+        )
         raw_output, raw_err = p.communicate()
         rc = p.returncode
-        if get_platform() == 'win32':
-            enc = 'oem'
+        if get_platform() == "win32":
+            enc = "oem"
         else:
             enc = locale.getpreferredencoding()
         output = raw_output.decode(enc)
-        if command == 'nvidia-smi topo -m':
+        if command == "nvidia-smi topo -m":
             # don't remove the leading whitespace of `nvidia-smi topo -m`
             #   because they are meaningful
             output = output.rstrip()
@@ -120,7 +122,7 @@ def run(command):
 
     except FileNotFoundError:
         cmd_str = command if isinstance(command, str) else command[0]
-        return 127, '', f"Command not found: {cmd_str}"
+        return 127, "", f"Command not found: {cmd_str}"
 
 
 def run_and_read_all(run_lambda, command):
@@ -147,49 +149,54 @@ def run_and_return_first_line(run_lambda, command):
     rc, out, _ = run_lambda(command)
     if rc != 0:
         return None
-    return out.split('\n')[0]
+    return out.split("\n")[0]
 
 
 def get_conda_packages(run_lambda, patterns=None):
     if patterns is None:
         patterns = DEFAULT_CONDA_PATTERNS
-    conda = os.environ.get('CONDA_EXE', 'conda')
-    out = run_and_read_all(run_lambda, [conda, 'list'])
+    conda = os.environ.get("CONDA_EXE", "conda")
+    out = run_and_read_all(run_lambda, [conda, "list"])
     if out is None:
         return out
 
-    return "\n".join(line for line in out.splitlines()
-                     if not line.startswith("#") and any(name in line
-                                                         for name in patterns))
+    return "\n".join(
+        line
+        for line in out.splitlines()
+        if not line.startswith("#") and any(name in line for name in patterns)
+    )
 
 
 def get_gcc_version(run_lambda):
-    return run_and_parse_first_match(run_lambda, 'gcc --version', r'gcc (.*)')
+    return run_and_parse_first_match(run_lambda, "gcc --version", r"gcc (.*)")
 
 
 def get_clang_version(run_lambda):
-    return run_and_parse_first_match(run_lambda, 'clang --version',
-                                     r'clang version (.*)')
+    return run_and_parse_first_match(
+        run_lambda, "clang --version", r"clang version (.*)"
+    )
 
 
 def get_cmake_version(run_lambda):
-    return run_and_parse_first_match(run_lambda, 'cmake --version',
-                                     r'cmake (.*)')
+    return run_and_parse_first_match(run_lambda, "cmake --version", r"cmake (.*)")
 
 
 def get_nvidia_driver_version(run_lambda):
-    if get_platform() == 'darwin':
-        cmd = 'kextstat | grep -i cuda'
-        return run_and_parse_first_match(run_lambda, cmd,
-                                         r'com[.]nvidia[.]CUDA [(](.*?)[)]')
+    if get_platform() == "darwin":
+        cmd = "kextstat | grep -i cuda"
+        return run_and_parse_first_match(
+            run_lambda, cmd, r"com[.]nvidia[.]CUDA [(](.*?)[)]"
+        )
     smi = get_nvidia_smi()
-    return run_and_parse_first_match(run_lambda, smi,
-                                     r'Driver Version: (.*?) ')
+    return run_and_parse_first_match(run_lambda, smi, r"Driver Version: (.*?) ")
 
 
 def get_gpu_info(run_lambda):
-    if get_platform() == 'darwin' or (TORCH_AVAILABLE and hasattr(
-            torch.version, 'hip') and torch.version.hip is not None):
+    if get_platform() == "darwin" or (
+        TORCH_AVAILABLE
+        and hasattr(torch.version, "hip")
+        and torch.version.hip is not None
+    ):
         if TORCH_AVAILABLE and torch.cuda.is_available():
             if torch.version.hip is not None:
                 prop = torch.cuda.get_device_properties(0)
@@ -202,43 +209,42 @@ def get_gpu_info(run_lambda):
             return torch.cuda.get_device_name(None) + gcnArch
         return None
     smi = get_nvidia_smi()
-    uuid_regex = re.compile(r' \(UUID: .+?\)')
-    rc, out, _ = run_lambda(smi + ' -L')
+    uuid_regex = re.compile(r" \(UUID: .+?\)")
+    rc, out, _ = run_lambda(smi + " -L")
     if rc != 0:
         return None
     # Anonymize GPUs by removing their UUID
-    return re.sub(uuid_regex, '', out)
+    return re.sub(uuid_regex, "", out)
 
 
 def get_running_cuda_version(run_lambda):
-    return run_and_parse_first_match(run_lambda, 'nvcc --version',
-                                     r'release .+ V(.*)')
+    return run_and_parse_first_match(run_lambda, "nvcc --version", r"release .+ V(.*)")
 
 
 def get_cudnn_version(run_lambda):
     """Return a list of libcudnn.so; it's hard to tell which one is being used."""
-    if get_platform() == 'win32':
-        system_root = os.environ.get('SYSTEMROOT', 'C:\\Windows')
-        cuda_path = os.environ.get('CUDA_PATH', "%CUDA_PATH%")
-        where_cmd = os.path.join(system_root, 'System32', 'where')
+    if get_platform() == "win32":
+        system_root = os.environ.get("SYSTEMROOT", "C:\\Windows")
+        cuda_path = os.environ.get("CUDA_PATH", "%CUDA_PATH%")
+        where_cmd = os.path.join(system_root, "System32", "where")
         cudnn_cmd = '{} /R "{}\\bin" cudnn*.dll'.format(where_cmd, cuda_path)
-    elif get_platform() == 'darwin':
+    elif get_platform() == "darwin":
         # CUDA libraries and drivers can be found in /usr/local/cuda/. See
         # https://docs.nvidia.com/cuda/cuda-installation-guide-mac-os-x/index.html#install
         # https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#installmac
         # Use CUDNN_LIBRARY when cudnn library is installed elsewhere.
-        cudnn_cmd = 'ls /usr/local/cuda/lib/libcudnn*'
+        cudnn_cmd = "ls /usr/local/cuda/lib/libcudnn*"
     else:
         cudnn_cmd = 'ldconfig -p | grep libcudnn | rev | cut -d" " -f1 | rev'
     rc, out, _ = run_lambda(cudnn_cmd)
     # find will return 1 if there are permission errors or if not found
     if len(out) == 0 or (rc != 1 and rc != 0):
-        l = os.environ.get('CUDNN_LIBRARY')
+        l = os.environ.get("CUDNN_LIBRARY")
         if l is not None and os.path.isfile(l):
             return os.path.realpath(l)
         return None
     files_set = set()
-    for fn in out.split('\n'):
+    for fn in out.split("\n"):
         fn = os.path.realpath(fn)  # eliminate symbolic links
         if os.path.isfile(fn):
             files_set.add(fn)
@@ -248,20 +254,20 @@ def get_cudnn_version(run_lambda):
     files = sorted(files_set)
     if len(files) == 1:
         return files[0]
-    result = '\n'.join(files)
-    return 'Probably one of the following:\n{}'.format(result)
+    result = "\n".join(files)
+    return "Probably one of the following:\n{}".format(result)
 
 
 def get_nvidia_smi():
     # Note: nvidia-smi is currently available only on Windows and Linux
-    smi = 'nvidia-smi'
-    if get_platform() == 'win32':
-        system_root = os.environ.get('SYSTEMROOT', 'C:\\Windows')
-        program_files_root = os.environ.get('PROGRAMFILES',
-                                            'C:\\Program Files')
-        legacy_path = os.path.join(program_files_root, 'NVIDIA Corporation',
-                                   'NVSMI', smi)
-        new_path = os.path.join(system_root, 'System32', smi)
+    smi = "nvidia-smi"
+    if get_platform() == "win32":
+        system_root = os.environ.get("SYSTEMROOT", "C:\\Windows")
+        program_files_root = os.environ.get("PROGRAMFILES", "C:\\Program Files")
+        legacy_path = os.path.join(
+            program_files_root, "NVIDIA Corporation", "NVSMI", smi
+        )
+        new_path = os.path.join(system_root, "System32", smi)
         smis = [new_path, legacy_path]
         for candidate_smi in smis:
             if os.path.exists(candidate_smi):
@@ -272,8 +278,9 @@ def get_nvidia_smi():
 
 def get_rocm_version(run_lambda):
     """Returns the ROCm version if available, otherwise 'N/A'."""
-    return run_and_parse_first_match(run_lambda, 'hipcc --version',
-                                     r'HIP version: (\S+)')
+    return run_and_parse_first_match(
+        run_lambda, "hipcc --version", r"HIP version: (\S+)"
+    )
 
 
 def get_vllm_version():
@@ -282,12 +289,12 @@ def get_vllm_version():
     if __version__ == "dev":
         return "N/A (dev)"
     version_str = __version_tuple__[-1]
-    if isinstance(version_str, str) and version_str.startswith('g'):
+    if isinstance(version_str, str) and version_str.startswith("g"):
         # it's a dev build
-        if '.' in version_str:
+        if "." in version_str:
             # it's a dev build containing local changes
-            git_sha = version_str.split('.')[0][1:]
-            date = version_str.split('.')[-1][1:]
+            git_sha = version_str.split(".")[0][1:]
+            date = version_str.split(".")[-1][1:]
             return f"{__version__} (git sha: {git_sha}, date: {date})"
         else:
             # it's a dev build without local changes
@@ -298,19 +305,19 @@ def get_vllm_version():
 
 def summarize_vllm_build_flags():
     # This could be a static method if the flags are constant, or dynamic if you need to check environment variables, etc.
-    return 'CUDA Archs: {}; ROCm: {}'.format(
-        os.environ.get('TORCH_CUDA_ARCH_LIST', 'Not Set'),
-        'Enabled' if os.environ.get('ROCM_HOME') else 'Disabled',
+    return "CUDA Archs: {}; ROCm: {}".format(
+        os.environ.get("TORCH_CUDA_ARCH_LIST", "Not Set"),
+        "Enabled" if os.environ.get("ROCM_HOME") else "Disabled",
     )
 
 
 def get_gpu_topo(run_lambda):
     output = None
 
-    if get_platform() == 'linux':
-        output = run_and_read_all(run_lambda, 'nvidia-smi topo -m')
+    if get_platform() == "linux":
+        output = run_and_read_all(run_lambda, "nvidia-smi topo -m")
         if output is None:
-            output = run_and_read_all(run_lambda, 'rocm-smi --showtopo')
+            output = run_and_read_all(run_lambda, "rocm-smi --showtopo")
 
     return output
 
@@ -392,17 +399,17 @@ def get_gpu_topo(run_lambda):
 
 
 def get_cpu_info(run_lambda):
-    rc, out, err = 0, '', ''
-    if get_platform() == 'linux':
-        rc, out, err = run_lambda('lscpu')
-    elif get_platform() == 'win32':
+    rc, out, err = 0, "", ""
+    if get_platform() == "linux":
+        rc, out, err = run_lambda("lscpu")
+    elif get_platform() == "win32":
         rc, out, err = run_lambda(
-            'wmic cpu get Name,Manufacturer,Family,Architecture,ProcessorType,DeviceID, \
-        CurrentClockSpeed,MaxClockSpeed,L2CacheSize,L2CacheSpeed,Revision /VALUE'
+            "wmic cpu get Name,Manufacturer,Family,Architecture,ProcessorType,DeviceID, \
+        CurrentClockSpeed,MaxClockSpeed,L2CacheSize,L2CacheSpeed,Revision /VALUE"
         )
-    elif get_platform() == 'darwin':
+    elif get_platform() == "darwin":
         rc, out, err = run_lambda("sysctl -n machdep.cpu.brand_string")
-    cpu_info = 'None'
+    cpu_info = "None"
     if rc == 0:
         cpu_info = out
     else:
@@ -411,67 +418,69 @@ def get_cpu_info(run_lambda):
 
 
 def get_platform():
-    if sys.platform.startswith('linux'):
-        return 'linux'
-    elif sys.platform.startswith('win32'):
-        return 'win32'
-    elif sys.platform.startswith('cygwin'):
-        return 'cygwin'
-    elif sys.platform.startswith('darwin'):
-        return 'darwin'
+    if sys.platform.startswith("linux"):
+        return "linux"
+    elif sys.platform.startswith("win32"):
+        return "win32"
+    elif sys.platform.startswith("cygwin"):
+        return "cygwin"
+    elif sys.platform.startswith("darwin"):
+        return "darwin"
     else:
         return sys.platform
 
 
 def get_mac_version(run_lambda):
-    return run_and_parse_first_match(run_lambda, 'sw_vers -productVersion',
-                                     r'(.*)')
+    return run_and_parse_first_match(run_lambda, "sw_vers -productVersion", r"(.*)")
 
 
 def get_windows_version(run_lambda):
-    system_root = os.environ.get('SYSTEMROOT', 'C:\\Windows')
-    wmic_cmd = os.path.join(system_root, 'System32', 'Wbem', 'wmic')
-    findstr_cmd = os.path.join(system_root, 'System32', 'findstr')
+    system_root = os.environ.get("SYSTEMROOT", "C:\\Windows")
+    wmic_cmd = os.path.join(system_root, "System32", "Wbem", "wmic")
+    findstr_cmd = os.path.join(system_root, "System32", "findstr")
     return run_and_read_all(
-        run_lambda,
-        '{} os get Caption | {} /v Caption'.format(wmic_cmd, findstr_cmd))
+        run_lambda, "{} os get Caption | {} /v Caption".format(wmic_cmd, findstr_cmd)
+    )
 
 
 def get_lsb_version(run_lambda):
-    return run_and_parse_first_match(run_lambda, 'lsb_release -a',
-                                     r'Description:\t(.*)')
+    return run_and_parse_first_match(
+        run_lambda, "lsb_release -a", r"Description:\t(.*)"
+    )
 
 
 def check_release_file(run_lambda):
-    return run_and_parse_first_match(run_lambda, 'cat /etc/*-release',
-                                     r'PRETTY_NAME="(.*)"')
+    return run_and_parse_first_match(
+        run_lambda, "cat /etc/*-release", r'PRETTY_NAME="(.*)"'
+    )
 
 
 def get_os(run_lambda):
     from platform import machine
+
     platform = get_platform()
 
-    if platform == 'win32' or platform == 'cygwin':
+    if platform == "win32" or platform == "cygwin":
         return get_windows_version(run_lambda)
 
-    if platform == 'darwin':
+    if platform == "darwin":
         version = get_mac_version(run_lambda)
         if version is None:
             return None
-        return 'macOS {} ({})'.format(version, machine())
+        return "macOS {} ({})".format(version, machine())
 
-    if platform == 'linux':
+    if platform == "linux":
         # Ubuntu/Debian based
         desc = get_lsb_version(run_lambda)
         if desc is not None:
-            return '{} ({})'.format(desc, machine())
+            return "{} ({})".format(desc, machine())
 
         # Try reading /etc/*-release
         desc = check_release_file(run_lambda)
         if desc is not None:
-            return '{} ({})'.format(desc, machine())
+            return "{} ({})".format(desc, machine())
 
-        return '{} ({})'.format(platform, machine())
+        return "{} ({})".format(platform, machine())
 
     # Unknown platform
     return platform
@@ -479,23 +488,25 @@ def get_os(run_lambda):
 
 def get_python_platform():
     import platform
+
     return platform.platform()
 
 
 def get_libc_version():
     import platform
-    if get_platform() != 'linux':
-        return 'N/A'
-    return '-'.join(platform.libc_ver())
+
+    if get_platform() != "linux":
+        return "N/A"
+    return "-".join(platform.libc_ver())
 
 
 def is_uv_venv():
     if os.environ.get("UV"):
         return True
-    pyvenv_cfg_path = os.path.join(sys.prefix, 'pyvenv.cfg')
+    pyvenv_cfg_path = os.path.join(sys.prefix, "pyvenv.cfg")
     if os.path.exists(pyvenv_cfg_path):
-        with open(pyvenv_cfg_path, 'r') as f:
-            return any(line.startswith('uv = ') for line in f)
+        with open(pyvenv_cfg_path, "r") as f:
+            return any(line.startswith("uv = ") for line in f)
     return False
 
 
@@ -507,13 +518,14 @@ def get_pip_packages(run_lambda, patterns=None):
     def run_with_pip():
         try:
             import importlib.util
-            pip_spec = importlib.util.find_spec('pip')
+
+            pip_spec = importlib.util.find_spec("pip")
             pip_available = pip_spec is not None
         except ImportError:
             pip_available = False
 
         if pip_available:
-            cmd = [sys.executable, '-mpip', 'list', '--format=freeze']
+            cmd = [sys.executable, "-mpip", "list", "--format=freeze"]
         elif is_uv_venv():
             print("uv is set")
             cmd = ["uv", "pip", "list", "--format=freeze"]
@@ -523,23 +535,24 @@ def run_with_pip():
             )
 
         out = run_and_read_all(run_lambda, cmd)
-        return "\n".join(line for line in out.splitlines()
-                         if any(name in line for name in patterns))
+        return "\n".join(
+            line for line in out.splitlines() if any(name in line for name in patterns)
+        )
 
-    pip_version = 'pip3' if sys.version[0] == '3' else 'pip'
+    pip_version = "pip3" if sys.version[0] == "3" else "pip"
     out = run_with_pip()
     return pip_version, out
 
 
 def get_cachingallocator_config():
-    ca_config = os.environ.get('PYTORCH_CUDA_ALLOC_CONF', '')
+    ca_config = os.environ.get("PYTORCH_CUDA_ALLOC_CONF", "")
     return ca_config
 
 
 def get_cuda_module_loading_config():
     if TORCH_AVAILABLE and torch.cuda.is_available():
         torch.cuda.init()
-        config = os.environ.get('CUDA_MODULE_LOADING', '')
+        config = os.environ.get("CUDA_MODULE_LOADING", "")
         return config
     else:
         return "N/A"
@@ -548,17 +561,26 @@ def get_cuda_module_loading_config():
 def is_xnnpack_available():
     if TORCH_AVAILABLE:
         import torch.backends.xnnpack
-        return str(
-            torch.backends.xnnpack.enabled)  # type: ignore[attr-defined]
+
+        return str(torch.backends.xnnpack.enabled)  # type: ignore[attr-defined]
     else:
         return "N/A"
 
 
 def get_env_vars():
-    env_vars = ''
-    secret_terms = ('secret', 'token', 'api', 'access', 'password')
-    report_prefix = ("TORCH", "NCCL", "PYTORCH", "CUDA", "CUBLAS", "CUDNN",
-                     "OMP_", "MKL_", "NVIDIA")
+    env_vars = ""
+    secret_terms = ("secret", "token", "api", "access", "password")
+    report_prefix = (
+        "TORCH",
+        "NCCL",
+        "PYTORCH",
+        "CUDA",
+        "CUBLAS",
+        "CUDNN",
+        "OMP_",
+        "MKL_",
+        "NVIDIA",
+    )
     for k, v in os.environ.items():
         if any(term in k.lower() for term in secret_terms):
             continue
@@ -579,23 +601,24 @@ def get_env_info():
         debug_mode_str = str(torch.version.debug)
         cuda_available_str = str(torch.cuda.is_available())
         cuda_version_str = torch.version.cuda
-        if not hasattr(torch.version,
-                       'hip') or torch.version.hip is None:  # cuda version
-            hip_compiled_version = hip_runtime_version = miopen_runtime_version = 'N/A'
+        if (
+            not hasattr(torch.version, "hip") or torch.version.hip is None
+        ):  # cuda version
+            hip_compiled_version = hip_runtime_version = miopen_runtime_version = "N/A"
         else:  # HIP version
 
             def get_version_or_na(cfg, prefix):
                 _lst = [s.rsplit(None, 1)[-1] for s in cfg if prefix in s]
-                return _lst[0] if _lst else 'N/A'
+                return _lst[0] if _lst else "N/A"
 
-            cfg = torch._C._show_config().split('\n')
-            hip_runtime_version = get_version_or_na(cfg, 'HIP Runtime')
-            miopen_runtime_version = get_version_or_na(cfg, 'MIOpen')
-            cuda_version_str = 'N/A'
+            cfg = torch._C._show_config().split("\n")
+            hip_runtime_version = get_version_or_na(cfg, "HIP Runtime")
+            miopen_runtime_version = get_version_or_na(cfg, "MIOpen")
+            cuda_version_str = "N/A"
             hip_compiled_version = torch.version.hip
     else:
-        version_str = debug_mode_str = cuda_available_str = cuda_version_str = 'N/A'
-        hip_compiled_version = hip_runtime_version = miopen_runtime_version = 'N/A'
+        version_str = debug_mode_str = cuda_available_str = cuda_version_str = "N/A"
+        hip_compiled_version = hip_runtime_version = miopen_runtime_version = "N/A"
 
     sys_version = sys.version.replace("\n", " ")
 
@@ -609,9 +632,9 @@ def get_version_or_na(cfg, prefix):
     return SystemEnv(
         torch_version=version_str,
         is_debug_build=debug_mode_str,
-        python_version='{} ({}-bit runtime)'.format(
-            sys_version,
-            sys.maxsize.bit_length() + 1),
+        python_version="{} ({}-bit runtime)".format(
+            sys_version, sys.maxsize.bit_length() + 1
+        ),
         python_platform=get_python_platform(),
         is_cuda_available=cuda_available_str,
         cuda_compiled_version=cuda_version_str,
@@ -715,15 +738,14 @@ def get_version_or_na(cfg, prefix):
 
 
 def pretty_str(envinfo):
-
-    def replace_nones(dct, replacement='Could not collect'):
+    def replace_nones(dct, replacement="Could not collect"):
         for key in dct.keys():
             if dct[key] is not None:
                 continue
             dct[key] = replacement
         return dct
 
-    def replace_bools(dct, true='Yes', false='No'):
+    def replace_bools(dct, true="Yes", false="No"):
         for key in dct.keys():
             if dct[key] is True:
                 dct[key] = true
@@ -731,43 +753,48 @@ def replace_bools(dct, true='Yes', false='No'):
                 dct[key] = false
         return dct
 
-    def prepend(text, tag='[prepend]'):
-        lines = text.split('\n')
+    def prepend(text, tag="[prepend]"):
+        lines = text.split("\n")
         updated_lines = [tag + line for line in lines]
-        return '\n'.join(updated_lines)
+        return "\n".join(updated_lines)
 
-    def replace_if_empty(text, replacement='No relevant packages'):
+    def replace_if_empty(text, replacement="No relevant packages"):
         if text is not None and len(text) == 0:
             return replacement
         return text
 
     def maybe_start_on_next_line(string):
         # If `string` is multiline, prepend a \n to it.
-        if string is not None and len(string.split('\n')) > 1:
-            return '\n{}\n'.format(string)
+        if string is not None and len(string.split("\n")) > 1:
+            return "\n{}\n".format(string)
         return string
 
     mutable_dict = envinfo._asdict()
 
     # If nvidia_gpu_models is multiline, start on the next line
-    mutable_dict['nvidia_gpu_models'] = \
-        maybe_start_on_next_line(envinfo.nvidia_gpu_models)
+    mutable_dict["nvidia_gpu_models"] = maybe_start_on_next_line(
+        envinfo.nvidia_gpu_models
+    )
 
     # If the machine doesn't have CUDA, report some fields as 'No CUDA'
     dynamic_cuda_fields = [
-        'cuda_runtime_version',
-        'nvidia_gpu_models',
-        'nvidia_driver_version',
+        "cuda_runtime_version",
+        "nvidia_gpu_models",
+        "nvidia_driver_version",
     ]
-    all_cuda_fields = dynamic_cuda_fields + ['cudnn_version']
-    all_dynamic_cuda_fields_missing = all(mutable_dict[field] is None
-                                          for field in dynamic_cuda_fields)
-    if TORCH_AVAILABLE and not torch.cuda.is_available(
-    ) and all_dynamic_cuda_fields_missing:
+    all_cuda_fields = dynamic_cuda_fields + ["cudnn_version"]
+    all_dynamic_cuda_fields_missing = all(
+        mutable_dict[field] is None for field in dynamic_cuda_fields
+    )
+    if (
+        TORCH_AVAILABLE
+        and not torch.cuda.is_available()
+        and all_dynamic_cuda_fields_missing
+    ):
         for field in all_cuda_fields:
-            mutable_dict[field] = 'No CUDA'
+            mutable_dict[field] = "No CUDA"
         if envinfo.cuda_compiled_version is None:
-            mutable_dict['cuda_compiled_version'] = 'None'
+            mutable_dict["cuda_compiled_version"] = "None"
 
     # Replace True with Yes, False with No
     mutable_dict = replace_bools(mutable_dict)
@@ -776,20 +803,20 @@ def maybe_start_on_next_line(string):
     mutable_dict = replace_nones(mutable_dict)
 
     # If either of these are '', replace with 'No relevant packages'
-    mutable_dict['pip_packages'] = replace_if_empty(
-        mutable_dict['pip_packages'])
-    mutable_dict['conda_packages'] = replace_if_empty(
-        mutable_dict['conda_packages'])
+    mutable_dict["pip_packages"] = replace_if_empty(mutable_dict["pip_packages"])
+    mutable_dict["conda_packages"] = replace_if_empty(mutable_dict["conda_packages"])
 
     # Tag conda and pip packages with a prefix
     # If they were previously None, they'll show up as ie '[conda] Could not collect'
-    if mutable_dict['pip_packages']:
-        mutable_dict['pip_packages'] = prepend(
-            mutable_dict['pip_packages'], '[{}] '.format(envinfo.pip_version))
-    if mutable_dict['conda_packages']:
-        mutable_dict['conda_packages'] = prepend(
-            mutable_dict['conda_packages'], '[conda] ')
-    mutable_dict['cpu_info'] = envinfo.cpu_info
+    if mutable_dict["pip_packages"]:
+        mutable_dict["pip_packages"] = prepend(
+            mutable_dict["pip_packages"], "[{}] ".format(envinfo.pip_version)
+        )
+    if mutable_dict["conda_packages"]:
+        mutable_dict["conda_packages"] = prepend(
+            mutable_dict["conda_packages"], "[conda] "
+        )
+    mutable_dict["cpu_info"] = envinfo.cpu_info
     return env_info_fmt.format(**mutable_dict)
 
 
@@ -802,22 +829,29 @@ def main():
     output = get_pretty_env_info()
     print(output)
 
-    if TORCH_AVAILABLE and hasattr(torch, 'utils') and hasattr(
-            torch.utils, '_crash_handler'):
+    if (
+        TORCH_AVAILABLE
+        and hasattr(torch, "utils")
+        and hasattr(torch.utils, "_crash_handler")
+    ):
         minidump_dir = torch.utils._crash_handler.DEFAULT_MINIDUMP_DIR
         if sys.platform == "linux" and os.path.exists(minidump_dir):
             dumps = [
-                os.path.join(minidump_dir, dump)
-                for dump in os.listdir(minidump_dir)
+                os.path.join(minidump_dir, dump) for dump in os.listdir(minidump_dir)
             ]
             latest = max(dumps, key=os.path.getctime)
             ctime = os.path.getctime(latest)
             creation_time = datetime.datetime.fromtimestamp(ctime).strftime(
-                '%Y-%m-%d %H:%M:%S')
-            msg = "\n*** Detected a minidump at {} created on {}, ".format(latest, creation_time) + \
-                  "if this is related to your bug please include it when you file a report ***"
+                "%Y-%m-%d %H:%M:%S"
+            )
+            msg = (
+                "\n*** Detected a minidump at {} created on {}, ".format(
+                    latest, creation_time
+                )
+                + "if this is related to your bug please include it when you file a report ***"
+            )
             print(msg, file=sys.stderr)
 
 
-if __name__ == '__main__':
+if __name__ == "__main__":
     main()
diff --git a/vllm/compilation/activation_quant_fusion.py b/vllm/compilation/activation_quant_fusion.py
index 74462fb37ca9..7448bb122152 100644
--- a/vllm/compilation/activation_quant_fusion.py
+++ b/vllm/compilation/activation_quant_fusion.py
@@ -5,14 +5,21 @@
 
 import torch
 from torch._higher_order_ops.auto_functionalize import auto_functionalized
-from torch._inductor.pattern_matcher import (PatternMatcherPass, fwd_only,
-                                             register_replacement)
+from torch._inductor.pattern_matcher import (
+    PatternMatcherPass,
+    fwd_only,
+    register_replacement,
+)
 from torch._ops import OpOverload
 
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    QuantKey, kFp8StaticTensorSym, kNvfp4Quant, kStaticTensorScale)
+    QuantKey,
+    kFp8StaticTensorSym,
+    kNvfp4Quant,
+    kStaticTensorScale,
+)
 from vllm.platforms import current_platform
 
 from .fusion import QUANT_OPS, empty_bf16, empty_fp32, empty_i32
@@ -29,11 +36,11 @@
 FUSED_OPS: dict[QuantKey, OpOverload] = {
     kFp8StaticTensorSym: torch.ops._C.silu_and_mul_quant.default,  # noqa: E501
 }
-silu_and_mul_nvfp4_quant_supported = (current_platform.is_cuda() and hasattr(
-    torch.ops._C, "silu_and_mul_nvfp4_quant"))
+silu_and_mul_nvfp4_quant_supported = current_platform.is_cuda() and hasattr(
+    torch.ops._C, "silu_and_mul_nvfp4_quant"
+)
 if silu_and_mul_nvfp4_quant_supported:
-    FUSED_OPS[
-        kNvfp4Quant] = torch.ops._C.silu_and_mul_nvfp4_quant.default  # noqa: E501
+    FUSED_OPS[kNvfp4Quant] = torch.ops._C.silu_and_mul_nvfp4_quant.default  # noqa: E501
 
 
 class ActivationQuantPattern(ABC):
@@ -49,16 +56,18 @@ def __init__(
         self.quant_key = quant_key
         self.quant_dtype = quant_key.dtype
 
-        assert self.quant_key in QUANT_OPS, \
+        assert self.quant_key in QUANT_OPS, (
             f"unsupported quantization scheme {self.quant_key}"
+        )
         self.QUANT_OP = QUANT_OPS[self.quant_key]
 
-        assert self.quant_key in FUSED_OPS, \
+        assert self.quant_key in FUSED_OPS, (
             f"unsupported fusion scheme {self.quant_key}"
+        )
         self.FUSED_OP = FUSED_OPS[self.quant_key]
 
     def empty_quant(self, *args, **kwargs):
-        kwargs = {'dtype': self.quant_dtype, 'device': "cuda", **kwargs}
+        kwargs = {"dtype": self.quant_dtype, "device": "cuda", **kwargs}
         return torch.empty(*args, **kwargs)
 
     @abstractmethod
@@ -72,37 +81,40 @@ class SiluMulFp8StaticQuantPattern(ActivationQuantPattern):
     """
 
     def __init__(self, symmetric: bool = True):
-        quant_key = QuantKey(dtype=FP8_DTYPE,
-                             scale=kStaticTensorScale,
-                             symmetric=symmetric)
+        quant_key = QuantKey(
+            dtype=FP8_DTYPE, scale=kStaticTensorScale, symmetric=symmetric
+        )
         super().__init__(quant_key)
 
     def register(self, pm_pass: PatternMatcherPass):
-
-        def pattern(result: torch.Tensor, result_silu_mul: torch.Tensor,
-                    input: torch.Tensor, scale: torch.Tensor):
-            at1 = auto_functionalized(SILU_MUL_OP,
-                                      result=result_silu_mul,
-                                      input=input)
-            at2 = auto_functionalized(self.QUANT_OP,
-                                      result=result,
-                                      input=at1[1],
-                                      scale=scale)
+        def pattern(
+            result: torch.Tensor,
+            result_silu_mul: torch.Tensor,
+            input: torch.Tensor,
+            scale: torch.Tensor,
+        ):
+            at1 = auto_functionalized(SILU_MUL_OP, result=result_silu_mul, input=input)
+            at2 = auto_functionalized(
+                self.QUANT_OP, result=result, input=at1[1], scale=scale
+            )
             return at2[1]
 
-        def replacement(result: torch.Tensor, result_silu_mul: torch.Tensor,
-                        input: torch.Tensor, scale: torch.Tensor):
-            at = auto_functionalized(self.FUSED_OP,
-                                     result=result,
-                                     input=input,
-                                     scale=scale)
+        def replacement(
+            result: torch.Tensor,
+            result_silu_mul: torch.Tensor,
+            input: torch.Tensor,
+            scale: torch.Tensor,
+        ):
+            at = auto_functionalized(
+                self.FUSED_OP, result=result, input=input, scale=scale
+            )
             return at[1]
 
         inputs = [
             self.empty_quant(5, 4),  # result
             empty_bf16(5, 4),  # result_silu_mul
             empty_bf16(5, 4),  # input
-            empty_fp32(1, 1)  # scale
+            empty_fp32(1, 1),  # scale
         ]
 
         register_replacement(pattern, replacement, inputs, fwd_only, pm_pass)
@@ -117,28 +129,37 @@ def __init__(self):
         super().__init__(kNvfp4Quant)
 
     def register(self, pm_pass: PatternMatcherPass):
-
-        def pattern(result: torch.Tensor, output_scale: torch.Tensor,
-                    result_silu_mul: torch.Tensor, input: torch.Tensor,
-                    scale: torch.Tensor):
-            at1 = auto_functionalized(SILU_MUL_OP,
-                                      result=result_silu_mul,
-                                      input=input)
-            at2 = auto_functionalized(self.QUANT_OP,
-                                      output=result,
-                                      input=at1[1],
-                                      output_scale=output_scale,
-                                      input_scale=scale)
+        def pattern(
+            result: torch.Tensor,
+            output_scale: torch.Tensor,
+            result_silu_mul: torch.Tensor,
+            input: torch.Tensor,
+            scale: torch.Tensor,
+        ):
+            at1 = auto_functionalized(SILU_MUL_OP, result=result_silu_mul, input=input)
+            at2 = auto_functionalized(
+                self.QUANT_OP,
+                output=result,
+                input=at1[1],
+                output_scale=output_scale,
+                input_scale=scale,
+            )
             return at2[1], at2[2]
 
-        def replacement(result: torch.Tensor, output_scale: torch.Tensor,
-                        result_silu_mul: torch.Tensor, input: torch.Tensor,
-                        scale: torch.Tensor):
-            at = auto_functionalized(self.FUSED_OP,
-                                     result=result,
-                                     result_block_scale=output_scale,
-                                     input=input,
-                                     input_global_scale=scale)
+        def replacement(
+            result: torch.Tensor,
+            output_scale: torch.Tensor,
+            result_silu_mul: torch.Tensor,
+            input: torch.Tensor,
+            scale: torch.Tensor,
+        ):
+            at = auto_functionalized(
+                self.FUSED_OP,
+                result=result,
+                result_block_scale=output_scale,
+                input=input,
+                input_global_scale=scale,
+            )
             return at[1], at[2]
 
         inputs = [
@@ -146,7 +167,7 @@ def replacement(result: torch.Tensor, output_scale: torch.Tensor,
             empty_i32(128, 4),  # output_scale
             empty_bf16(5, 64),  # result_silu_mul
             empty_bf16(5, 64),  # input
-            empty_fp32(1, 1)  # scale
+            empty_fp32(1, 1),  # scale
         ]
 
         register_replacement(pattern, replacement, inputs, fwd_only, pm_pass)
@@ -167,7 +188,8 @@ def __init__(self, config: VllmConfig):
         super().__init__(config)
 
         self.patterns: PatternMatcherPass = PatternMatcherPass(
-            pass_name="activation_quant_fusion_pass")
+            pass_name="activation_quant_fusion_pass"
+        )
 
         pattern_silu_mul_fp8 = SiluMulFp8StaticQuantPattern()
         pattern_silu_mul_fp8.register(self.patterns)
@@ -184,6 +206,9 @@ def __call__(self, graph: torch.fx.Graph):
         logger.debug("Replaced %s patterns", self.matched_count)
 
     def uuid(self):
-        return VllmInductorPass.hash_source(self, ActivationQuantPattern,
-                                            SiluMulFp8StaticQuantPattern,
-                                            SiluMulNvfp4QuantPattern)
+        return VllmInductorPass.hash_source(
+            self,
+            ActivationQuantPattern,
+            SiluMulFp8StaticQuantPattern,
+            SiluMulNvfp4QuantPattern,
+        )
diff --git a/vllm/compilation/backends.py b/vllm/compilation/backends.py
index 335bbda5e4eb..da9debbb0e27 100644
--- a/vllm/compilation/backends.py
+++ b/vllm/compilation/backends.py
@@ -20,8 +20,12 @@
 from vllm.platforms import current_platform
 from vllm.utils import is_torch_equal_or_newer, resolve_obj_by_qualname
 
-from .compiler_interface import (CompilerInterface, EagerAdaptor,
-                                 InductorAdaptor, InductorStandaloneAdaptor)
+from .compiler_interface import (
+    CompilerInterface,
+    EagerAdaptor,
+    InductorAdaptor,
+    InductorStandaloneAdaptor,
+)
 from .counter import compilation_counter
 from .inductor_pass import InductorPass
 from .pass_manager import PostGradPassManager
@@ -33,9 +37,11 @@ def make_compiler(compilation_config: CompilationConfig) -> CompilerInterface:
     if compilation_config.use_inductor:
         # Use standalone compile only if requested, version is new enough,
         # and the symbol actually exists in this PyTorch build.
-        if (envs.VLLM_USE_STANDALONE_COMPILE
-                and is_torch_equal_or_newer("2.8.0.dev")
-                and hasattr(torch._inductor, "standalone_compile")):
+        if (
+            envs.VLLM_USE_STANDALONE_COMPILE
+            and is_torch_equal_or_newer("2.8.0.dev")
+            and hasattr(torch._inductor, "standalone_compile")
+        ):
             logger.debug("Using InductorStandaloneAdaptor")
             return InductorStandaloneAdaptor()
         else:
@@ -70,10 +76,9 @@ def __init__(self, compilation_config: CompilationConfig):
     def compute_hash(self, vllm_config: VllmConfig) -> str:
         return self.compiler.compute_hash(vllm_config)
 
-    def initialize_cache(self,
-                         cache_dir: str,
-                         disable_cache: bool = False,
-                         prefix: str = ""):
+    def initialize_cache(
+        self, cache_dir: str, disable_cache: bool = False, prefix: str = ""
+    ):
         """
         Initialize the cache directory for the compiler.
 
@@ -101,9 +106,9 @@ def initialize_cache(self,
                 # do not use eval(), it is unsafe.
                 self.cache = ast.literal_eval(f.read())
 
-        self.compiler.initialize_cache(cache_dir=cache_dir,
-                                       disable_cache=disable_cache,
-                                       prefix=prefix)
+        self.compiler.initialize_cache(
+            cache_dir=cache_dir, disable_cache=disable_cache, prefix=prefix
+        )
 
     def save_to_file(self):
         if self.disable_cache or not self.is_cache_updated:
@@ -113,35 +118,46 @@ def save_to_file(self):
         with open(self.cache_file_path, "w") as f:
             f.write(data)
 
-    def load(self,
-             graph: fx.GraphModule,
-             example_inputs: list[Any],
-             graph_index: int,
-             runtime_shape: Optional[int] = None) -> Optional[Callable]:
+    def load(
+        self,
+        graph: fx.GraphModule,
+        example_inputs: list[Any],
+        graph_index: int,
+        runtime_shape: Optional[int] = None,
+    ) -> Optional[Callable]:
         if (runtime_shape, graph_index, self.compiler.name) not in self.cache:
             return None
         handle = self.cache[(runtime_shape, graph_index, self.compiler.name)]
-        compiled_graph = self.compiler.load(handle, graph, example_inputs,
-                                            graph_index, runtime_shape)
+        compiled_graph = self.compiler.load(
+            handle, graph, example_inputs, graph_index, runtime_shape
+        )
         if runtime_shape is None:
             logger.debug(
-                "Directly load the %s-th graph for dynamic shape from %s via "
-                "handle %s", graph_index, self.compiler.name, handle)
+                "Directly load the %s-th graph for dynamic shape from %s via handle %s",
+                graph_index,
+                self.compiler.name,
+                handle,
+            )
         else:
             logger.debug(
-                "Directly load the %s-th graph for shape %s from %s via "
-                "handle %s", graph_index, str(runtime_shape),
-                self.compiler.name, handle)
+                "Directly load the %s-th graph for shape %s from %s via handle %s",
+                graph_index,
+                str(runtime_shape),
+                self.compiler.name,
+                handle,
+            )
         return compiled_graph
 
-    def compile(self,
-                graph: fx.GraphModule,
-                example_inputs,
-                additional_inductor_config,
-                compilation_config: CompilationConfig,
-                graph_index: int = 0,
-                num_graphs: int = 1,
-                runtime_shape: Optional[int] = None) -> Any:
+    def compile(
+        self,
+        graph: fx.GraphModule,
+        example_inputs,
+        additional_inductor_config,
+        compilation_config: CompilationConfig,
+        graph_index: int = 0,
+        num_graphs: int = 1,
+        runtime_shape: Optional[int] = None,
+    ) -> Any:
         if graph_index == 0:
             # before compiling the first graph, record the start time
             global compilation_start_time
@@ -152,8 +168,7 @@ def compile(self,
         compiled_graph = None
 
         # try to load from the cache
-        compiled_graph = self.load(graph, example_inputs, graph_index,
-                                   runtime_shape)
+        compiled_graph = self.load(graph, example_inputs, graph_index, runtime_shape)
         if compiled_graph is not None:
             if graph_index == num_graphs - 1:
                 # after loading the last graph for this shape, record the time.
@@ -163,12 +178,16 @@ def compile(self,
                 if runtime_shape is None:
                     logger.info(
                         "Directly load the compiled graph(s) for dynamic shape "
-                        "from the cache, took %.3f s", elapsed)
+                        "from the cache, took %.3f s",
+                        elapsed,
+                    )
                 else:
                     logger.info(
                         "Directly load the compiled graph(s) for shape %s "
-                        "from the cache, took %.3f s", str(runtime_shape),
-                        elapsed)
+                        "from the cache, took %.3f s",
+                        str(runtime_shape),
+                        elapsed,
+                    )
             return compiled_graph
 
         # no compiler cached the graph, or the cache is disabled,
@@ -177,37 +196,41 @@ def compile(self,
             # Let compile_fx generate a key for us
             maybe_key = None
         else:
-            maybe_key = \
-                f"artifact_shape_{runtime_shape}_subgraph_{graph_index}"
+            maybe_key = f"artifact_shape_{runtime_shape}_subgraph_{graph_index}"
         compiled_graph, handle = self.compiler.compile(
-            graph, example_inputs, additional_inductor_config, runtime_shape,
-            maybe_key)
+            graph, example_inputs, additional_inductor_config, runtime_shape, maybe_key
+        )
 
         assert compiled_graph is not None, "Failed to compile the graph"
 
         # store the artifact in the cache
         if not envs.VLLM_DISABLE_COMPILE_CACHE and handle is not None:
-            self.cache[(runtime_shape, graph_index,
-                        self.compiler.name)] = handle
+            self.cache[(runtime_shape, graph_index, self.compiler.name)] = handle
             compilation_counter.num_cache_entries_updated += 1
             self.is_cache_updated = True
             if graph_index == 0:
                 # adds some info logging for the first graph
                 if runtime_shape is None:
-                    logger.info(
-                        "Cache the graph for dynamic shape for later use")
+                    logger.info("Cache the graph for dynamic shape for later use")
                 else:
-                    logger.info("Cache the graph of shape %s for later use",
-                                str(runtime_shape))
+                    logger.info(
+                        "Cache the graph of shape %s for later use", str(runtime_shape)
+                    )
             if runtime_shape is None:
                 logger.debug(
-                    "Store the %s-th graph for dynamic shape from %s via "
-                    "handle %s", graph_index, self.compiler.name, handle)
+                    "Store the %s-th graph for dynamic shape from %s via handle %s",
+                    graph_index,
+                    self.compiler.name,
+                    handle,
+                )
             else:
                 logger.debug(
                     "Store the %s-th graph for shape %s from %s via handle %s",
-                    graph_index, str(runtime_shape), self.compiler.name,
-                    handle)
+                    graph_index,
+                    str(runtime_shape),
+                    self.compiler.name,
+                    handle,
+                )
 
         # after compiling the last graph, record the end time
         if graph_index == num_graphs - 1:
@@ -215,11 +238,13 @@ def compile(self,
             elapsed = now - compilation_start_time
             compilation_config.compilation_time += elapsed
             if runtime_shape is None:
-                logger.info("Compiling a graph for dynamic shape takes %.2f s",
-                            elapsed)
+                logger.info("Compiling a graph for dynamic shape takes %.2f s", elapsed)
             else:
-                logger.info("Compiling a graph for shape %s takes %.2f s",
-                            runtime_shape, elapsed)
+                logger.info(
+                    "Compiling a graph for shape %s takes %.2f s",
+                    runtime_shape,
+                    elapsed,
+                )
 
         return compiled_graph
 
@@ -232,8 +257,9 @@ class SplitItem:
     graph: fx.GraphModule
 
 
-def split_graph(graph: fx.GraphModule,
-                ops: list[str]) -> tuple[fx.GraphModule, list[SplitItem]]:
+def split_graph(
+    graph: fx.GraphModule, ops: list[str]
+) -> tuple[fx.GraphModule, list[SplitItem]]:
     # split graph by ops
     subgraph_id = 0
     node_to_subgraph_id = {}
@@ -241,7 +267,7 @@ def split_graph(graph: fx.GraphModule,
     for node in graph.graph.nodes:
         if node.op in ("output", "placeholder"):
             continue
-        if node.op == 'call_function' and str(node.target) in ops:
+        if node.op == "call_function" and str(node.target) in ops:
             subgraph_id += 1
             node_to_subgraph_id[node] = subgraph_id
             split_op_graphs.append(subgraph_id)
@@ -254,10 +280,8 @@ def split_graph(graph: fx.GraphModule,
     # the semantics of the graph will change when we
     # have mutations in the graph
     split_gm = torch.fx.passes.split_module.split_module(
-        graph,
-        None,
-        lambda node: node_to_subgraph_id[node],
-        keep_original_order=True)
+        graph, None, lambda node: node_to_subgraph_id[node], keep_original_order=True
+    )
 
     outputs = []
 
@@ -271,8 +295,7 @@ def split_graph(graph: fx.GraphModule,
         module = getattr(split_gm, name)
 
         graph_id = int(name.replace("submod_", ""))
-        outputs.append(
-            SplitItem(name, graph_id, (graph_id in split_op_graphs), module))
+        outputs.append(SplitItem(name, graph_id, (graph_id in split_op_graphs), module))
 
     # sort by integer graph_id, rather than string name
     outputs.sort(key=lambda x: x.graph_id)
@@ -295,11 +318,16 @@ class PiecewiseCompileInterpreter(torch.fx.Interpreter):
     has some special cudagraph output handling.
     """
 
-    def __init__(self, module: torch.fx.GraphModule,
-                 compile_submod_names: list[str], vllm_config: VllmConfig,
-                 vllm_backend: "VllmBackend"):
+    def __init__(
+        self,
+        module: torch.fx.GraphModule,
+        compile_submod_names: list[str],
+        vllm_config: VllmConfig,
+        vllm_backend: "VllmBackend",
+    ):
         super().__init__(module)
         from torch._guards import detect_fake_mode
+
         self.fake_mode = detect_fake_mode()
         self.compile_submod_names = compile_submod_names
         self.compilation_config = vllm_config.compilation_config
@@ -316,9 +344,12 @@ def run(self, *args):
         with self.fake_mode, enable_python_dispatcher():
             return super().run(*fake_args)
 
-    def call_module(self, target: torch.fx.node.Target,
-                    args: tuple[torch.fx.node.Argument,
-                                ...], kwargs: dict[str, Any]) -> Any:
+    def call_module(
+        self,
+        target: torch.fx.node.Target,
+        args: tuple[torch.fx.node.Argument, ...],
+        kwargs: dict[str, Any],
+    ) -> Any:
         assert isinstance(target, str)
         output = super().call_module(target, args, kwargs)
 
@@ -330,26 +361,34 @@ def call_module(self, target: torch.fx.node.Target,
             ]
             global compilation_start_time
 
-            compiled_graph_for_dynamic_shape = self.vllm_backend.\
-                compiler_manager.compile(
-                submod,
-                args,
-                self.compilation_config.inductor_compile_config,
-                self.compilation_config,
-                graph_index=index,
-                num_graphs=len(self.compile_submod_names),
-                runtime_shape=None)
+            compiled_graph_for_dynamic_shape = (
+                self.vllm_backend.compiler_manager.compile(
+                    submod,
+                    args,
+                    self.compilation_config.inductor_compile_config,
+                    self.compilation_config,
+                    graph_index=index,
+                    num_graphs=len(self.compile_submod_names),
+                    runtime_shape=None,
+                )
+            )
             # Lazy import here to avoid circular import
             from .piecewise_backend import PiecewiseBackend
 
             piecewise_backend = PiecewiseBackend(
-                submod, self.vllm_config, index,
-                len(self.compile_submod_names), sym_shape_indices,
-                compiled_graph_for_dynamic_shape, self.vllm_backend)
+                submod,
+                self.vllm_config,
+                index,
+                len(self.compile_submod_names),
+                sym_shape_indices,
+                compiled_graph_for_dynamic_shape,
+                self.vllm_backend,
+            )
 
-            if (self.compilation_config.cudagraph_mode.\
-                    has_piecewise_cudagraphs() and
-                    not self.compilation_config.use_inductor_graph_partition):
+            if (
+                self.compilation_config.cudagraph_mode.has_piecewise_cudagraphs()
+                and not self.compilation_config.use_inductor_graph_partition
+            ):
                 # We're using Dynamo-based piecewise splitting, so we wrap
                 # the whole subgraph with a static graph wrapper.
                 from .cuda_graph import CUDAGraphOptions
@@ -357,7 +396,8 @@ def call_module(self, target: torch.fx.node.Target,
                 # resolve the static graph wrapper class (e.g. CUDAGraphWrapper
                 # class) as platform dependent.
                 static_graph_wrapper_class = resolve_obj_by_qualname(
-                    current_platform.get_static_graph_wrapper_cls())
+                    current_platform.get_static_graph_wrapper_cls()
+                )
 
                 # Always assign PIECEWISE runtime mode to the
                 # CUDAGraphWrapper for piecewise_backend, to distinguish
@@ -370,7 +410,9 @@ def call_module(self, target: torch.fx.node.Target,
                     cudagraph_options=CUDAGraphOptions(
                         debug_log_enable=piecewise_backend.is_first_graph,
                         gc_disable=not piecewise_backend.is_first_graph,
-                        weak_ref_output=piecewise_backend.is_last_graph))
+                        weak_ref_output=piecewise_backend.is_last_graph,
+                    ),
+                )
             else:
                 self.module.__dict__[target] = piecewise_backend
 
@@ -388,8 +430,9 @@ def call_module(self, target: torch.fx.node.Target,
 def set_model_tag(tag: str):
     """Context manager to set the model tag."""
     global model_tag
-    assert tag != model_tag, \
+    assert tag != model_tag, (
         f"Model tag {tag} is the same as the current tag {model_tag}."
+    )
     old_tag = model_tag
     model_tag = tag
     try:
@@ -430,7 +473,6 @@ def __init__(
         vllm_config: VllmConfig,
         prefix: str = "",
     ):
-
         # if the model is initialized with a non-empty prefix,
         # then usually it's enough to use that prefix,
         # e.g. language_model, vision_model, etc.
@@ -449,7 +491,8 @@ def __init__(
         self.compilation_config = vllm_config.compilation_config
 
         self.compiler_manager: CompilerManager = CompilerManager(
-            self.compilation_config)
+            self.compilation_config
+        )
 
         # `torch.compile` is JIT compiled, so we don't need to
         # do anything here
@@ -465,8 +508,10 @@ def configure_post_pass(self):
         if PASS_KEY in inductor_config:
             if isinstance(inductor_config[PASS_KEY], PostGradPassManager):
                 # PassManager already added to config, make sure it's correct
-                assert (inductor_config[PASS_KEY].uuid() ==
-                        self.post_grad_pass_manager.uuid())
+                assert (
+                    inductor_config[PASS_KEY].uuid()
+                    == self.post_grad_pass_manager.uuid()
+                )
             else:
                 # Config should automatically wrap all inductor passes
                 assert isinstance(inductor_config[PASS_KEY], InductorPass)
@@ -474,7 +519,6 @@ def configure_post_pass(self):
         inductor_config[PASS_KEY] = self.post_grad_pass_manager
 
     def __call__(self, graph: fx.GraphModule, example_inputs) -> Callable:
-
         vllm_config = self.vllm_config
         if not self.compilation_config.cache_dir:
             # no provided cache dir, generate one based on the known factors
@@ -495,12 +539,12 @@ def __call__(self, graph: fx.GraphModule, example_inputs) -> Callable:
 
             # 2. factors come from the code files that are traced by Dynamo (
             #    it mainly summarizes how the model is used in forward pass)
-            forward_code_files = list(
-                sorted(self.compilation_config.traced_files))
+            forward_code_files = list(sorted(self.compilation_config.traced_files))
             self.compilation_config.traced_files.clear()
             logger.debug(
                 "Traced files (to be considered for compilation cache):\n%s",
-                "\n".join(forward_code_files))
+                "\n".join(forward_code_files),
+            )
             hash_content = []
             for filepath in forward_code_files:
                 hash_content.append(filepath)
@@ -511,8 +555,10 @@ def __call__(self, graph: fx.GraphModule, example_inputs) -> Callable:
                 with open(filepath) as f:
                     hash_content.append(f.read())
             import hashlib
-            code_hash = hashlib.md5("\n".join(hash_content).encode(),
-                                    usedforsecurity=False).hexdigest()
+
+            code_hash = hashlib.md5(
+                "\n".join(hash_content).encode(), usedforsecurity=False
+            ).hexdigest()
             factors.append(code_hash)
 
             # 3. compiler hash
@@ -520,8 +566,9 @@ def __call__(self, graph: fx.GraphModule, example_inputs) -> Callable:
             factors.append(compiler_hash)
 
             # combine all factors to generate the cache dir
-            hash_key = hashlib.md5(str(factors).encode(),
-                                   usedforsecurity=False).hexdigest()[:10]
+            hash_key = hashlib.md5(
+                str(factors).encode(), usedforsecurity=False
+            ).hexdigest()[:10]
 
             cache_dir = os.path.join(
                 envs.VLLM_CACHE_ROOT,
@@ -535,8 +582,7 @@ def __call__(self, graph: fx.GraphModule, example_inputs) -> Callable:
         self.compilation_config.cache_dir = cache_dir
         rank = vllm_config.parallel_config.rank
         dp_rank = vllm_config.parallel_config.data_parallel_rank
-        local_cache_dir = os.path.join(cache_dir, f"rank_{rank}_{dp_rank}",
-                                       self.prefix)
+        local_cache_dir = os.path.join(cache_dir, f"rank_{rank}_{dp_rank}", self.prefix)
         os.makedirs(local_cache_dir, exist_ok=True)
         self.compilation_config.local_cache_dir = local_cache_dir
 
@@ -545,16 +591,19 @@ def __call__(self, graph: fx.GraphModule, example_inputs) -> Callable:
         if disable_cache:
             logger.info("vLLM's torch.compile cache is disabled.")
         else:
-            logger.info("Using cache directory: %s for vLLM's torch.compile",
-                        local_cache_dir)
+            logger.info(
+                "Using cache directory: %s for vLLM's torch.compile", local_cache_dir
+            )
 
-        self.compiler_manager.initialize_cache(local_cache_dir, disable_cache,
-                                               self.prefix)
+        self.compiler_manager.initialize_cache(
+            local_cache_dir, disable_cache, self.prefix
+        )
 
         # when dynamo calls the backend, it means the bytecode
         # transform and analysis are done
         compilation_counter.num_graphs_seen += 1
         from .monitor import torch_compile_start_time
+
         dynamo_time = time.time() - torch_compile_start_time
         logger.info("Dynamo bytecode transform time: %.2f s", dynamo_time)
         self.compilation_config.compilation_time += dynamo_time
@@ -567,7 +616,8 @@ def __call__(self, graph: fx.GraphModule, example_inputs) -> Callable:
         self.configure_post_pass()
 
         self.split_gm, self.piecewise_graphs = split_graph(
-            graph, self.compilation_config.splitting_ops)
+            graph, self.compilation_config.splitting_ops
+        )
 
         from torch._dynamo.utils import lazy_format_graph_code
 
@@ -576,25 +626,27 @@ def __call__(self, graph: fx.GraphModule, example_inputs) -> Callable:
         lazy_format_graph_code("before split", self.graph)
         lazy_format_graph_code("after split", self.split_gm)
 
-        compilation_counter.num_piecewise_graphs_seen += len(
-            self.piecewise_graphs)
+        compilation_counter.num_piecewise_graphs_seen += len(self.piecewise_graphs)
         submod_names_to_compile = [
-            item.submod_name for item in self.piecewise_graphs
+            item.submod_name
+            for item in self.piecewise_graphs
             if not item.is_splitting_graph
         ]
 
         # propagate the split graph to the piecewise backend,
         # compile submodules with symbolic shapes
-        PiecewiseCompileInterpreter(self.split_gm, submod_names_to_compile,
-                                    self.vllm_config,
-                                    self).run(*example_inputs)
+        PiecewiseCompileInterpreter(
+            self.split_gm, submod_names_to_compile, self.vllm_config, self
+        ).run(*example_inputs)
 
         graph_path = os.path.join(local_cache_dir, "computation_graph.py")
         if not os.path.exists(graph_path):
             # code adapted from https://github.com/thuml/depyf/blob/dab831108a752d1facc00acdd6d4243891845c37/depyf/explain/patched_lazy_format_graph_code.py#L30 # noqa
             # use `print_readable` because it can include submodules
-            src = "from __future__ import annotations\nimport torch\n" + \
-                self.split_gm.print_readable(print_output=False)
+            src = (
+                "from __future__ import annotations\nimport torch\n"
+                + self.split_gm.print_readable(print_output=False)
+            )
             src = src.replace("<lambda>", "GraphModule")
             with open(graph_path, "w") as f:
                 f.write(src)
@@ -603,12 +655,15 @@ def __call__(self, graph: fx.GraphModule, example_inputs) -> Callable:
 
         self._called = True
 
-        if self.compilation_config.cudagraph_mode == CUDAGraphMode.NONE or \
-            not self.compilation_config.cudagraph_copy_inputs:
+        if (
+            self.compilation_config.cudagraph_mode == CUDAGraphMode.NONE
+            or not self.compilation_config.cudagraph_copy_inputs
+        ):
             return self.split_gm
 
         # if we need to copy input buffers for cudagraph
         from torch._guards import detect_fake_mode
+
         fake_mode = detect_fake_mode()
         fake_args = [
             fake_mode.from_tensor(t) if isinstance(t, torch.Tensor) else t
@@ -619,10 +674,12 @@ def __call__(self, graph: fx.GraphModule, example_inputs) -> Callable:
         # for weights and static buffers, they will have concrete shapes.
         # symbolic shape only happens for input tensors.
         from torch.fx.experimental.symbolic_shapes import is_symbolic
+
         self.sym_tensor_indices = [
-            i for i, x in enumerate(fake_args)
-            if isinstance(x, torch._subclasses.fake_tensor.FakeTensor) and \
-                any(is_symbolic(d) for d in x.size())
+            i
+            for i, x in enumerate(fake_args)
+            if isinstance(x, torch._subclasses.fake_tensor.FakeTensor)
+            and any(is_symbolic(d) for d in x.size())
         ]
 
         # compiler managed cudagraph input buffers
diff --git a/vllm/compilation/collective_fusion.py b/vllm/compilation/collective_fusion.py
index 04b76a9c2d22..5860833c14ce 100644
--- a/vllm/compilation/collective_fusion.py
+++ b/vllm/compilation/collective_fusion.py
@@ -14,7 +14,9 @@
 from vllm.config import VllmConfig
 from vllm.distributed import get_tp_group, tensor_model_parallel_all_reduce
 from vllm.distributed.parallel_state import (
-    get_tensor_model_parallel_rank, get_tensor_model_parallel_world_size)
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 from vllm.utils import direct_register_custom_op
@@ -27,8 +29,12 @@
 if find_spec("flashinfer"):
     try:
         import flashinfer.comm as flashinfer_comm
-        flashinfer_comm = (flashinfer_comm if hasattr(
-            flashinfer_comm, "trtllm_allreduce_fusion") else None)
+
+        flashinfer_comm = (
+            flashinfer_comm
+            if hasattr(flashinfer_comm, "trtllm_allreduce_fusion")
+            else None
+        )
     except ImportError:
         flashinfer_comm = None
 else:
@@ -44,7 +50,6 @@
 
 
 class BasePattern:
-
     def __init__(self, dtype: torch.dtype, device: str):
         self.dtype = dtype
         self.device = device
@@ -53,14 +58,12 @@ def __init__(self, dtype: torch.dtype, device: str):
 
 
 class GEMMReduceScatterPattern(BasePattern):
-
     def get_inputs(self):
         mul = torch.empty([16, 4], device=self.device, dtype=self.dtype)
         mm_weight = torch.empty([4, 4], device=self.device, dtype=self.dtype)
         return [mul, mm_weight]
 
     def register(self, pm_pass: PatternMatcherPass):
-
         def pattern(mul: torch.Tensor, mm_weight: torch.Tensor):
             mm = torch.ops.aten.mm.default(mul, mm_weight)
             reduce_scatter = torch.ops.vllm.reduce_scatter.default(
@@ -82,12 +85,12 @@ def replacement(mul: torch.Tensor, mm_weight: torch.Tensor):
 
             return gemm_rs
 
-        pm.register_replacement(pattern, replacement, self.get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, self.get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class AllGatherGEMMPattern(BasePattern):
-
     def get_inputs(self):
         x = torch.empty([4, 4], device=self.device, dtype=self.dtype)
         weight = torch.empty([4, 4], device=self.device, dtype=self.dtype)
@@ -95,7 +98,6 @@ def get_inputs(self):
         return [x, weight]
 
     def register(self, pm_pass: PatternMatcherPass):
-
         def pattern(
             x: torch.Tensor,
             weight: torch.Tensor,
@@ -110,8 +112,8 @@ def pattern(
             return torch.ops.aten.mm.default(all_gather, weight)
 
         def replacement(
-                x: torch.Tensor,
-                weight: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+            x: torch.Tensor, weight: torch.Tensor
+        ) -> tuple[torch.Tensor, torch.Tensor]:
             ag_output, mm_outputs = torch.ops.symm_mem.fused_all_gather_matmul(
                 x,
                 [weight],
@@ -120,42 +122,53 @@ def replacement(
             )
             return mm_outputs
 
-        pm.register_replacement(pattern, replacement, self.get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, self.get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class ScaledMMReduceScatterPattern(BasePattern):
-
     def get_inputs(self):
         input = torch.empty([16, 16], device=self.device, dtype=FP8_DTYPE)
-        mm_weight = torch.empty([16, 16], device=self.device,
-                                dtype=FP8_DTYPE).contiguous().transpose(0, 1)
+        mm_weight = (
+            torch.empty([16, 16], device=self.device, dtype=FP8_DTYPE)
+            .contiguous()
+            .transpose(0, 1)
+        )
         scale_a = torch.empty([16, 1], device=self.device, dtype=torch.float32)
         scale_b = torch.empty([1, 16], device=self.device, dtype=torch.float32)
         return [input, mm_weight, scale_a, scale_b]
 
     def register(self, pm_pass: PatternMatcherPass):
-
-        def pattern(input: torch.Tensor, mat2: torch.Tensor,
-                    scale_a: torch.Tensor,
-                    scale_b: torch.Tensor) -> torch.Tensor:
-            scaled_mm = torch.ops.aten._scaled_mm.default(input,
-                                                          mat2=mat2,
-                                                          scale_a=scale_a,
-                                                          scale_b=scale_b,
-                                                          bias=None,
-                                                          scale_result=None,
-                                                          out_dtype=self.dtype)
+        def pattern(
+            input: torch.Tensor,
+            mat2: torch.Tensor,
+            scale_a: torch.Tensor,
+            scale_b: torch.Tensor,
+        ) -> torch.Tensor:
+            scaled_mm = torch.ops.aten._scaled_mm.default(
+                input,
+                mat2=mat2,
+                scale_a=scale_a,
+                scale_b=scale_b,
+                bias=None,
+                scale_result=None,
+                out_dtype=self.dtype,
+            )
             reduce_scatter = torch.ops.vllm.reduce_scatter.default(
                 scaled_mm,
                 dim=0,
                 world_size=self.tp_size,
-                group_name=self.tp.unique_name)
+                group_name=self.tp.unique_name,
+            )
             return reduce_scatter
 
-        def replacement(input: torch.Tensor, mat2: torch.Tensor,
-                        scale_a: torch.Tensor,
-                        scale_b: torch.Tensor) -> torch.Tensor:
+        def replacement(
+            input: torch.Tensor,
+            mat2: torch.Tensor,
+            scale_a: torch.Tensor,
+            scale_b: torch.Tensor,
+        ) -> torch.Tensor:
             gemm_rs = torch.ops.symm_mem.fused_scaled_matmul_reduce_scatter(
                 input,
                 mat2,
@@ -169,16 +182,19 @@ def replacement(input: torch.Tensor, mat2: torch.Tensor,
 
             return gemm_rs
 
-        pm.register_replacement(pattern, replacement, self.get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, self.get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class AllGatherScaledMMPattern(BasePattern):
-
     def get_inputs(self):
         x = torch.empty([8, 16], device=self.device, dtype=FP8_DTYPE)
-        weight = torch.empty([16, 16], device=self.device,
-                             dtype=FP8_DTYPE).contiguous().transpose(0, 1)
+        weight = (
+            torch.empty([16, 16], device=self.device, dtype=FP8_DTYPE)
+            .contiguous()
+            .transpose(0, 1)
+        )
 
         s1 = x.shape[0] * self.tp_size
 
@@ -188,7 +204,6 @@ def get_inputs(self):
         return [x, weight, scale_a, scale_b]
 
     def register(self, pm_pass: PatternMatcherPass):
-
         def pattern(
             x: torch.Tensor,
             weight: torch.Tensor,
@@ -196,22 +211,25 @@ def pattern(
             scale_b: torch.Tensor,
         ) -> torch.Tensor:
             all_gather = torch.ops.vllm.all_gather.default(
-                x,
-                dim=0,
-                world_size=self.tp_size,
-                group_name=self.tp.unique_name)
-
-            return torch.ops.aten._scaled_mm.default(all_gather,
-                                                     mat2=weight,
-                                                     scale_a=scale_a,
-                                                     scale_b=scale_b,
-                                                     bias=None,
-                                                     scale_result=None,
-                                                     out_dtype=self.dtype)
-
-        def replacement(x: torch.Tensor, weight: torch.Tensor,
-                        scale_a: torch.Tensor,
-                        scale_b: torch.Tensor) -> torch.Tensor:
+                x, dim=0, world_size=self.tp_size, group_name=self.tp.unique_name
+            )
+
+            return torch.ops.aten._scaled_mm.default(
+                all_gather,
+                mat2=weight,
+                scale_a=scale_a,
+                scale_b=scale_b,
+                bias=None,
+                scale_result=None,
+                out_dtype=self.dtype,
+            )
+
+        def replacement(
+            x: torch.Tensor,
+            weight: torch.Tensor,
+            scale_a: torch.Tensor,
+            scale_b: torch.Tensor,
+        ) -> torch.Tensor:
             ag_output, mm_outputs = torch.ops.symm_mem.fused_all_gather_scaled_matmul(  # noqa
                 x,
                 [weight],
@@ -226,29 +244,33 @@ def replacement(x: torch.Tensor, weight: torch.Tensor,
             )
             return mm_outputs
 
-        pm.register_replacement(pattern, replacement, self.get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, self.get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class CutlassScaledMMReduceScatterPattern(BasePattern):
-
     def get_inputs(self):
         input = torch.empty([16, 16], device=self.device, dtype=FP8_DTYPE)
-        mm_weight = torch.empty([16, 16], device=self.device,
-                                dtype=FP8_DTYPE).contiguous().transpose(0, 1)
+        mm_weight = (
+            torch.empty([16, 16], device=self.device, dtype=FP8_DTYPE)
+            .contiguous()
+            .transpose(0, 1)
+        )
         scale_a = torch.empty([16, 1], device=self.device, dtype=torch.float32)
         scale_b = torch.empty([1, 16], device=self.device, dtype=torch.float32)
 
-        cutlass_mm_output = torch.empty([16, 16],
-                                        device=self.device,
-                                        dtype=self.dtype)
+        cutlass_mm_output = torch.empty([16, 16], device=self.device, dtype=self.dtype)
         return [input, mm_weight, scale_a, scale_b, cutlass_mm_output]
 
     def register(self, pm_pass: PatternMatcherPass):
-
-        def pattern(input: torch.Tensor, weight: torch.Tensor,
-                    scale_a: torch.Tensor, scale_b: torch.Tensor,
-                    cutlass_mm_output: torch.Tensor) -> torch.Tensor:
+        def pattern(
+            input: torch.Tensor,
+            weight: torch.Tensor,
+            scale_a: torch.Tensor,
+            scale_b: torch.Tensor,
+            cutlass_mm_output: torch.Tensor,
+        ) -> torch.Tensor:
             cutlass_scaled_mm = torch.ops.higher_order.auto_functionalized(
                 torch.ops._C.cutlass_scaled_mm.default,
                 out=cutlass_mm_output,
@@ -256,18 +278,24 @@ def pattern(input: torch.Tensor, weight: torch.Tensor,
                 b=weight,
                 a_scales=scale_a,
                 b_scales=scale_b,
-                bias=None)
+                bias=None,
+            )
 
             reduce_scatter = torch.ops.vllm.reduce_scatter.default(
                 cutlass_scaled_mm[1],
                 dim=0,
                 world_size=self.tp_size,
-                group_name=self.tp.unique_name)
+                group_name=self.tp.unique_name,
+            )
             return reduce_scatter
 
-        def replacement(input: torch.Tensor, mat2: torch.Tensor,
-                        scale_a: torch.Tensor, scale_b: torch.Tensor,
-                        cutlass_mm_output: torch.Tensor) -> torch.Tensor:
+        def replacement(
+            input: torch.Tensor,
+            mat2: torch.Tensor,
+            scale_a: torch.Tensor,
+            scale_b: torch.Tensor,
+            cutlass_mm_output: torch.Tensor,
+        ) -> torch.Tensor:
             gemm_rs = torch.ops.symm_mem.fused_scaled_matmul_reduce_scatter(
                 input,
                 mat2,
@@ -281,16 +309,19 @@ def replacement(input: torch.Tensor, mat2: torch.Tensor,
 
             return gemm_rs
 
-        pm.register_replacement(pattern, replacement, self.get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, self.get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class AllGatherCutlassScaledMMPattern(BasePattern):
-
     def get_inputs(self):
         x = torch.empty([8, 16], device=self.device, dtype=FP8_DTYPE)
-        weight = torch.empty([16, 16], device=self.device,
-                             dtype=FP8_DTYPE).contiguous().transpose(0, 1)
+        weight = (
+            torch.empty([16, 16], device=self.device, dtype=FP8_DTYPE)
+            .contiguous()
+            .transpose(0, 1)
+        )
 
         s1 = x.shape[0] * self.tp_size
 
@@ -303,7 +334,6 @@ def get_inputs(self):
         return [x, weight, scale_a, scale_b, output]
 
     def register(self, pm_pass: PatternMatcherPass):
-
         def pattern(
             x: torch.Tensor,
             weight: torch.Tensor,
@@ -312,10 +342,8 @@ def pattern(
             output: torch.Tensor,
         ) -> torch.Tensor:
             all_gather = torch.ops.vllm.all_gather.default(
-                x,
-                dim=0,
-                world_size=self.tp_size,
-                group_name=self.tp.unique_name)
+                x, dim=0, world_size=self.tp_size, group_name=self.tp.unique_name
+            )
 
             cutlass_scaled_mm = torch.ops.higher_order.auto_functionalized(
                 torch.ops._C.cutlass_scaled_mm.default,
@@ -324,12 +352,17 @@ def pattern(
                 b=weight,
                 a_scales=scale_a,
                 b_scales=scale_b,
-                bias=None)
+                bias=None,
+            )
             return cutlass_scaled_mm[1]
 
-        def replacement(x: torch.Tensor, weight: torch.Tensor,
-                        scale_a: torch.Tensor, scale_b: torch.Tensor,
-                        output: torch.Tensor) -> torch.Tensor:
+        def replacement(
+            x: torch.Tensor,
+            weight: torch.Tensor,
+            scale_a: torch.Tensor,
+            scale_b: torch.Tensor,
+            output: torch.Tensor,
+        ) -> torch.Tensor:
             ag_output, mm_outputs = torch.ops.symm_mem.fused_all_gather_scaled_matmul(  # noqa
                 x,
                 [weight],
@@ -344,12 +377,12 @@ def replacement(x: torch.Tensor, weight: torch.Tensor,
             )
             return mm_outputs
 
-        pm.register_replacement(pattern, replacement, self.get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, self.get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class AsyncTPPass(VllmPatternMatcherPass):
-
     @enable_fake_mode
     def __init__(self, config: VllmConfig):
         super().__init__(config)
@@ -357,26 +390,29 @@ def __init__(self, config: VllmConfig):
         # Enable symmetric memory for the TP process group
         enable_symm_mem_for_group(get_tp_group().device_group.group_name)
         self.patterns: PatternMatcherPass = PatternMatcherPass(
-            pass_name="async_tp_pass")
-        GEMMReduceScatterPattern(self.model_dtype,
-                                 self.device).register(self.patterns)
+            pass_name="async_tp_pass"
+        )
+        GEMMReduceScatterPattern(self.model_dtype, self.device).register(self.patterns)
 
-        AllGatherGEMMPattern(self.model_dtype,
-                             self.device).register(self.patterns)
+        AllGatherGEMMPattern(self.model_dtype, self.device).register(self.patterns)
 
         # These fusions are enabled only for bfloat16 models because
         # `scaled_mm` or `cutlass_scaled_mm` with per-token (row-wise) scaling
         # only supports bfloat16 as the output dtype.
         if self.model_dtype == torch.bfloat16:
-            ScaledMMReduceScatterPattern(self.model_dtype,
-                                         self.device).register(self.patterns)
-            AllGatherScaledMMPattern(self.model_dtype,
-                                     self.device).register(self.patterns)
+            ScaledMMReduceScatterPattern(self.model_dtype, self.device).register(
+                self.patterns
+            )
+            AllGatherScaledMMPattern(self.model_dtype, self.device).register(
+                self.patterns
+            )
 
-            CutlassScaledMMReduceScatterPattern(
-                self.model_dtype, self.device).register(self.patterns)
-            AllGatherCutlassScaledMMPattern(
-                self.model_dtype, self.device).register(self.patterns)
+            CutlassScaledMMReduceScatterPattern(self.model_dtype, self.device).register(
+                self.patterns
+            )
+            AllGatherCutlassScaledMMPattern(self.model_dtype, self.device).register(
+                self.patterns
+            )
 
         self.dump_patterns(config, self.patterns)
 
@@ -405,15 +441,16 @@ def __call__(self, graph: fx.Graph):
     }
 
     try:
-        _FI_MAX_SIZES.update({
-            int(k): int(float(v) * MiB)
-            for k, v in
-            envs.VLLM_FLASHINFER_ALLREDUCE_FUSION_THRESHOLDS_MB.items()
-        })
+        _FI_MAX_SIZES.update(
+            {
+                int(k): int(float(v) * MiB)
+                for k, v in envs.VLLM_FLASHINFER_ALLREDUCE_FUSION_THRESHOLDS_MB.items()
+            }
+        )
     except Exception as e:
         raise ValueError(
-            "Failed to parse VLLM_FLASHINFER_ALLREDUCE_FUSION_THRESHOLDS_MB: "
-            + str(e)) from e
+            "Failed to parse VLLM_FLASHINFER_ALLREDUCE_FUSION_THRESHOLDS_MB: " + str(e)
+        ) from e
 
     # opt for a more conservative default value
     # when world size is not in _FI_MAX_SIZES
@@ -446,8 +483,9 @@ def call_trtllm_fused_allreduce_norm(
             max_fusion_size,
         )
         if use_flashinfer:
-            assert (_FI_WORKSPACE_TENSOR is not None
-                    ), "Flashinfer must be enabled when using flashinfer"
+            assert _FI_WORKSPACE_TENSOR is not None, (
+                "Flashinfer must be enabled when using flashinfer"
+            )
             if norm_out is None:
                 norm_out = allreduce_in
                 residual_out = residual
@@ -479,38 +517,43 @@ def call_trtllm_fused_allreduce_norm(
                 quant_out=quant_out,
                 scale_out=scale_out,
                 # in vllm we only support swizzled layout
-                layout_code=flashinfer_comm.QuantizationSFLayout.
-                SWIZZLED_128x4,
+                layout_code=flashinfer_comm.QuantizationSFLayout.SWIZZLED_128x4,
                 scale_factor=scale_factor,
             )
         else:
             allreduce_out = tensor_model_parallel_all_reduce(allreduce_in)
-            if (scale_factor is not None and scale_out is None
-                    and fuse_rms_quant):
+            if scale_factor is not None and scale_out is None and fuse_rms_quant:
                 # Do fused rms norm static fp8 quant fused op
                 if norm_out is None:
                     torch.ops._C.fused_add_rms_norm_static_fp8_quant(
-                        quant_out, allreduce_out, residual, rms_gamma,
-                        scale_factor, rms_eps)
+                        quant_out,
+                        allreduce_out,
+                        residual,
+                        rms_gamma,
+                        scale_factor,
+                        rms_eps,
+                    )
                 else:
                     torch.ops._C.rms_norm_static_fp8_quant(
-                        quant_out, allreduce_out, rms_gamma, scale_factor,
-                        rms_eps)
+                        quant_out, allreduce_out, rms_gamma, scale_factor, rms_eps
+                    )
             else:
                 if norm_out is None:
-                    torch.ops._C.fused_add_rms_norm(allreduce_out, residual,
-                                                    rms_gamma, rms_eps)
+                    torch.ops._C.fused_add_rms_norm(
+                        allreduce_out, residual, rms_gamma, rms_eps
+                    )
                     norm_out = allreduce_out
                 else:
-                    torch.ops._C.rms_norm(norm_out, allreduce_out, rms_gamma,
-                                          rms_eps)
+                    torch.ops._C.rms_norm(norm_out, allreduce_out, rms_gamma, rms_eps)
                 if scale_factor is not None:
                     if scale_out is not None:
-                        torch.ops._C.scaled_fp4_quant(quant_out, norm_out,
-                                                      scale_out, scale_factor)
+                        torch.ops._C.scaled_fp4_quant(
+                            quant_out, norm_out, scale_out, scale_factor
+                        )
                     else:
                         torch.ops._C.static_scaled_fp8_quant(
-                            quant_out, norm_out, scale_factor)
+                            quant_out, norm_out, scale_factor
+                        )
             if scale_factor is None or norm_out is not None:
                 # we need to return allreduce output
                 # in cases of non quant fused AR + RMS norm
@@ -518,22 +561,23 @@ def call_trtllm_fused_allreduce_norm(
                 allreduce_in.copy_(allreduce_out)
 
     def call_trtllm_fused_allreduce_norm_fake(
-            allreduce_in: torch.Tensor,
-            residual: torch.Tensor,
-            rms_gamma: torch.Tensor,
-            rms_eps: float,
-            world_rank: int,
-            world_size: int,
-            launch_with_pdl: bool,
-            trigger_completion_at_end: bool,
-            fp32_acc: bool,
-            max_token_num: int,
-            pattern_code: int,
-            fuse_rms_quant: bool,
-            norm_out: Optional[torch.Tensor] = None,
-            quant_out: Optional[torch.Tensor] = None,
-            scale_out: Optional[torch.Tensor] = None,
-            scale_factor: Optional[torch.Tensor] = None) -> None:
+        allreduce_in: torch.Tensor,
+        residual: torch.Tensor,
+        rms_gamma: torch.Tensor,
+        rms_eps: float,
+        world_rank: int,
+        world_size: int,
+        launch_with_pdl: bool,
+        trigger_completion_at_end: bool,
+        fp32_acc: bool,
+        max_token_num: int,
+        pattern_code: int,
+        fuse_rms_quant: bool,
+        norm_out: Optional[torch.Tensor] = None,
+        quant_out: Optional[torch.Tensor] = None,
+        scale_out: Optional[torch.Tensor] = None,
+        scale_factor: Optional[torch.Tensor] = None,
+    ) -> None:
         pass
 
     direct_register_custom_op(
@@ -549,7 +593,8 @@ def call_trtllm_fused_allreduce_norm_fake(
         fake_impl=call_trtllm_fused_allreduce_norm_fake,
     )
     flashinfer_trtllm_fused_allreduce_norm = (
-        torch.ops.vllm.flashinfer_trtllm_fused_allreduce_norm.default)
+        torch.ops.vllm.flashinfer_trtllm_fused_allreduce_norm.default
+    )
 
 
 class FlashInferFusedAllReduceParams:
@@ -587,7 +632,7 @@ def get_trtllm_fused_allreduce_kwargs(self):
 
 class AllReduceRMSNormPattern(BasePattern):
     """
-    This pattern replaces the allreduce + rms norm (without residual) 
+    This pattern replaces the allreduce + rms norm (without residual)
     with fused flashinfer implementation.
     Applies to allreduce + rmsnorm before attn in the first Transformer block.
     """
@@ -605,17 +650,15 @@ def __init__(
 
     def get_inputs(self):
         input = torch.empty([1, 8, 4], device=self.device, dtype=self.dtype)
-        rms_result = torch.empty([1, 8, 4],
-                                 device=self.device,
-                                 dtype=self.dtype)
+        rms_result = torch.empty([1, 8, 4], device=self.device, dtype=self.dtype)
         weight = torch.empty([4], device=self.device, dtype=self.dtype)
 
         return [input, rms_result, weight]
 
     def register(self, pm_pass: PatternMatcherPass):
-
-        def pattern(input: torch.Tensor, rms_result: torch.Tensor,
-                    weight: torch.Tensor):
+        def pattern(
+            input: torch.Tensor, rms_result: torch.Tensor, weight: torch.Tensor
+        ):
             allreduce_output = tensor_model_parallel_all_reduce(input)
             rms = auto_functionalized(
                 RMS_OP,
@@ -627,8 +670,9 @@ def pattern(input: torch.Tensor, rms_result: torch.Tensor,
             # rms_result, allreduce_output
             return rms[1], allreduce_output
 
-        def replacement(input: torch.Tensor, rms_result: torch.Tensor,
-                        weight: torch.Tensor):
+        def replacement(
+            input: torch.Tensor, rms_result: torch.Tensor, weight: torch.Tensor
+        ):
             residual = torch.zeros_like(input)
             allreduce = auto_functionalized(
                 flashinfer_trtllm_fused_allreduce_norm,
@@ -639,20 +683,20 @@ def replacement(input: torch.Tensor, rms_result: torch.Tensor,
                 scale_out=None,
                 rms_gamma=weight,
                 rms_eps=self.epsilon,
-                pattern_code=flashinfer_comm.AllReduceFusionPattern.
-                kARResidualRMSNorm,
+                pattern_code=flashinfer_comm.AllReduceFusionPattern.kARResidualRMSNorm,
                 **self.allreduce_params.get_trtllm_fused_allreduce_kwargs(),
             )
             # rms_result, allreduce_in
             return allreduce[3], allreduce[1]
 
-        pm.register_replacement(pattern, replacement, self.get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, self.get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class AllReduceFusedAddRMSNormPattern(BasePattern):
     """
-    This pattern replaces the allreduce + rms norm (with residual) 
+    This pattern replaces the allreduce + rms norm (with residual)
     with fused flashinfer implementation.
     Applies to o_proj + rmsnorm after attn and mlp + rmsnorm before attn.
     """
@@ -679,9 +723,7 @@ def get_inputs(self):
         ]
 
     def register(self, pm_pass: PatternMatcherPass):
-
-        def pattern(residual: torch.Tensor, input: torch.Tensor,
-                    weight: torch.Tensor):
+        def pattern(residual: torch.Tensor, input: torch.Tensor, weight: torch.Tensor):
             allreduce_output = tensor_model_parallel_all_reduce(input)
             rms = auto_functionalized(
                 RMS_ADD_OP,
@@ -693,8 +735,9 @@ def pattern(residual: torch.Tensor, input: torch.Tensor,
             # input, residual
             return rms[1], rms[2]
 
-        def replacement(residual: torch.Tensor, input: torch.Tensor,
-                        weight: torch.Tensor):
+        def replacement(
+            residual: torch.Tensor, input: torch.Tensor, weight: torch.Tensor
+        ):
             allreduce = auto_functionalized(
                 flashinfer_trtllm_fused_allreduce_norm,
                 allreduce_in=input,
@@ -704,44 +747,46 @@ def replacement(residual: torch.Tensor, input: torch.Tensor,
                 scale_out=None,
                 rms_gamma=weight,
                 rms_eps=self.epsilon,
-                pattern_code=flashinfer_comm.AllReduceFusionPattern.
-                kARResidualRMSNorm,
+                pattern_code=flashinfer_comm.AllReduceFusionPattern.kARResidualRMSNorm,
                 **self.allreduce_params.get_trtllm_fused_allreduce_kwargs(),
             )
             # allreduce_in, residual
             return allreduce[1], allreduce[2]
 
-        pm.register_replacement(pattern, replacement, self.get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, self.get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class AllReduceFusedRMSNormStaticQuantFP8Pattern(BasePattern):
     """
-    This pattern replaces the allreduce + rms norm (without residual) 
+    This pattern replaces the allreduce + rms norm (without residual)
     + static fp8 quant with fused flashinfer implementation.
-    Applies to allreduce + rmsnorm + quant before attn 
+    Applies to allreduce + rmsnorm + quant before attn
     in the first Transformer block.
     """
 
-    def __init__(self, epsilon: float, dtype: torch.dtype, device: str,
-                 allreduce_params: FlashInferFusedAllReduceParams):
+    def __init__(
+        self,
+        epsilon: float,
+        dtype: torch.dtype,
+        device: str,
+        allreduce_params: FlashInferFusedAllReduceParams,
+    ):
         super().__init__(dtype, device)
         self.epsilon = epsilon
         self.allreduce_params = allreduce_params
         self.quant_dtype = torch.float8_e4m3fn
 
     def register(self, pm_pass: PatternMatcherPass):
-
         def get_inputs():
-            input = torch.zeros([1, 8, 4],
-                                device=self.device,
-                                dtype=self.dtype)
-            rmsnorm_result = torch.empty([1, 8, 4],
-                                         device=self.device,
-                                         dtype=self.dtype)
-            quant_result = torch.empty([1, 8, 4],
-                                       device=self.device,
-                                       dtype=self.quant_dtype)
+            input = torch.zeros([1, 8, 4], device=self.device, dtype=self.dtype)
+            rmsnorm_result = torch.empty(
+                [1, 8, 4], device=self.device, dtype=self.dtype
+            )
+            quant_result = torch.empty(
+                [1, 8, 4], device=self.device, dtype=self.quant_dtype
+            )
             weight = torch.empty([4], device=self.device, dtype=self.dtype)
             scale = torch.tensor(1.0, device=self.device, dtype=torch.float32)
             return [input, rmsnorm_result, quant_result, weight, scale]
@@ -754,23 +799,31 @@ def pattern(
             scale: torch.Tensor,
         ):
             all_reduce = tensor_model_parallel_all_reduce(input)
-            rmsnorm_out_tuple = auto_functionalized(RMS_OP,
-                                                    result=rmsnorm_result,
-                                                    input=all_reduce,
-                                                    weight=weight,
-                                                    epsilon=self.epsilon)
+            rmsnorm_out_tuple = auto_functionalized(
+                RMS_OP,
+                result=rmsnorm_result,
+                input=all_reduce,
+                weight=weight,
+                epsilon=self.epsilon,
+            )
 
-            quant_out_tuple = auto_functionalized(STATIC_FP8_QUANT_OP,
-                                                  result=quant_result,
-                                                  input=rmsnorm_out_tuple[1],
-                                                  scale=scale)
+            quant_out_tuple = auto_functionalized(
+                STATIC_FP8_QUANT_OP,
+                result=quant_result,
+                input=rmsnorm_out_tuple[1],
+                scale=scale,
+            )
 
             # quant_out, allreduce_output
             return quant_out_tuple[1], all_reduce
 
-        def replacement(input: torch.Tensor, result_rms: torch.Tensor,
-                        quant_result: torch.Tensor, weight: torch.Tensor,
-                        scale: torch.Tensor):
+        def replacement(
+            input: torch.Tensor,
+            result_rms: torch.Tensor,
+            quant_result: torch.Tensor,
+            weight: torch.Tensor,
+            scale: torch.Tensor,
+        ):
             residual = torch.zeros_like(input)
             allreduce = auto_functionalized(
                 flashinfer_trtllm_fused_allreduce_norm,
@@ -781,8 +834,7 @@ def replacement(input: torch.Tensor, result_rms: torch.Tensor,
                 scale_out=None,
                 rms_gamma=weight,
                 rms_eps=self.epsilon,
-                pattern_code=flashinfer_comm.AllReduceFusionPattern.
-                kARResidualRMSNormFP8Quant,  # we don't use norm_out afterwards
+                pattern_code=flashinfer_comm.AllReduceFusionPattern.kARResidualRMSNormFP8Quant,  # we don't use norm_out afterwards
                 scale_factor=scale,
                 **self.allreduce_params.get_trtllm_fused_allreduce_kwargs(),
             )
@@ -790,40 +842,41 @@ def replacement(input: torch.Tensor, result_rms: torch.Tensor,
             # quant_out, allreduce_output
             return allreduce[4], allreduce[1]
 
-        pm.register_replacement(pattern, replacement, get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class AllReduceFusedAddRMSNormStaticQuantFP8Pattern(BasePattern):
     """
     This pattern replaces the allreduce + rms norm (with residual)
     + static fp8 quant with fused flashinfer implementation.
-    Applies to o_proj + rmsnorm after attn + quant and 
+    Applies to o_proj + rmsnorm after attn + quant and
     mlp + rmsnorm + quant before attn.
     """
 
-    def __init__(self, epsilon: float, dtype: torch.dtype, device: str,
-                 allreduce_params: FlashInferFusedAllReduceParams):
+    def __init__(
+        self,
+        epsilon: float,
+        dtype: torch.dtype,
+        device: str,
+        allreduce_params: FlashInferFusedAllReduceParams,
+    ):
         super().__init__(dtype, device)
         self.epsilon = epsilon
         self.allreduce_params = allreduce_params
         self.quant_dtype = torch.float8_e4m3fn
 
     def register(self, pm_pass: PatternMatcherPass):
-
         def get_inputs():
             input = torch.empty([4, 4], device=self.device, dtype=self.dtype)
 
-            residual = torch.empty([4, 4],
-                                   device=self.device,
-                                   dtype=self.dtype)
+            residual = torch.empty([4, 4], device=self.device, dtype=self.dtype)
             weight = torch.empty([4, 4], device=self.device, dtype=self.dtype)
-            quant_result = torch.empty([4, 4],
-                                       device=self.device,
-                                       dtype=self.quant_dtype)
-            scale = torch.empty([1, 1],
-                                device=self.device,
-                                dtype=torch.float32)
+            quant_result = torch.empty(
+                [4, 4], device=self.device, dtype=self.quant_dtype
+            )
+            scale = torch.empty([1, 1], device=self.device, dtype=torch.float32)
 
             return [
                 quant_result,
@@ -842,25 +895,30 @@ def pattern(
         ):
             allreduce_output = tensor_model_parallel_all_reduce(input)
 
-            fused_add_rmsnorm_out_tuple = \
-            auto_functionalized(
+            fused_add_rmsnorm_out_tuple = auto_functionalized(
                 RMS_ADD_OP,
                 input=allreduce_output,
                 residual=residual,
                 weight=weight,
-                epsilon=self.epsilon)
+                epsilon=self.epsilon,
+            )
             quant_out_tuple = auto_functionalized(
                 STATIC_FP8_QUANT_OP,
                 result=quant_result,
                 input=fused_add_rmsnorm_out_tuple[1],
-                scale=scale)
+                scale=scale,
+            )
 
             # quant_out, allreduce_output
             return quant_out_tuple[1], fused_add_rmsnorm_out_tuple[2]
 
-        def replacement(quant_result: torch.Tensor, residual: torch.Tensor,
-                        input: torch.Tensor, weight: torch.Tensor,
-                        scale: torch.Tensor):
+        def replacement(
+            quant_result: torch.Tensor,
+            residual: torch.Tensor,
+            input: torch.Tensor,
+            weight: torch.Tensor,
+            scale: torch.Tensor,
+        ):
             allreduce = auto_functionalized(
                 flashinfer_trtllm_fused_allreduce_norm,
                 allreduce_in=input,
@@ -870,56 +928,58 @@ def replacement(quant_result: torch.Tensor, residual: torch.Tensor,
                 scale_out=None,
                 rms_gamma=weight,
                 rms_eps=self.epsilon,
-                pattern_code=flashinfer_comm.AllReduceFusionPattern.
-                kARResidualRMSNormFP8Quant,  # we don't use norm_out afterwards
+                pattern_code=flashinfer_comm.AllReduceFusionPattern.kARResidualRMSNormFP8Quant,  # we don't use norm_out afterwards
                 scale_factor=scale,
                 **self.allreduce_params.get_trtllm_fused_allreduce_kwargs(),
             )
             # # quant_out, rms_norm_residual
             return allreduce[4], allreduce[2]
 
-        pm.register_replacement(pattern, replacement, get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class AllReduceFusedRMSNormStaticQuantNVFP4Pattern(BasePattern):
     """
-    This pattern replaces the allreduce + rms norm (without residual) 
+    This pattern replaces the allreduce + rms norm (without residual)
     + static nvfp4 quant with fused flashinfer implementation.
-    Applies to allreduce + rmsnorm + quant before attn 
+    Applies to allreduce + rmsnorm + quant before attn
     in the first Transformer block.
     """
 
-    def __init__(self, epsilon: float, dtype: torch.dtype, device: str,
-                 allreduce_params: FlashInferFusedAllReduceParams):
+    def __init__(
+        self,
+        epsilon: float,
+        dtype: torch.dtype,
+        device: str,
+        allreduce_params: FlashInferFusedAllReduceParams,
+    ):
         super().__init__(dtype, device)
         self.epsilon = epsilon
         self.allreduce_params = allreduce_params
 
     def register(self, pm_pass: PatternMatcherPass):
-
         def get_inputs():
-            input = torch.empty([1, 16, 16],
-                                device=self.device,
-                                dtype=self.dtype)
-
-            rmsnorm_result = torch.empty([1, 16, 16],
-                                         device=self.device,
-                                         dtype=self.dtype)
-            quant_result = torch.empty((16, 8),
-                                       device=self.device,
-                                       dtype=torch.uint8)
-            input_global_scale = torch.empty([1, 1],
-                                             device=self.device,
-                                             dtype=torch.float32)
+            input = torch.empty([1, 16, 16], device=self.device, dtype=self.dtype)
+
+            rmsnorm_result = torch.empty(
+                [1, 16, 16], device=self.device, dtype=self.dtype
+            )
+            quant_result = torch.empty((16, 8), device=self.device, dtype=torch.uint8)
+            input_global_scale = torch.empty(
+                [1, 1], device=self.device, dtype=torch.float32
+            )
             weight = torch.empty([16], device=self.device, dtype=self.dtype)
-            output_scale = torch.empty([128, 4],
-                                       device=self.device,
-                                       dtype=torch.int32)
+            output_scale = torch.empty([128, 4], device=self.device, dtype=torch.int32)
 
             return [
-                input, rmsnorm_result, quant_result, weight,
-                input_global_scale, output_scale
+                input,
+                rmsnorm_result,
+                quant_result,
+                weight,
+                input_global_scale,
+                output_scale,
             ]
 
         def pattern(
@@ -931,26 +991,33 @@ def pattern(
             output_scale: torch.Tensor,
         ):
             all_reduce = tensor_model_parallel_all_reduce(input)
-            rmsnorm_out_tuple = auto_functionalized(RMS_OP,
-                                                    result=rmsnorm_result,
-                                                    input=all_reduce,
-                                                    weight=weight,
-                                                    epsilon=self.epsilon)
+            rmsnorm_out_tuple = auto_functionalized(
+                RMS_OP,
+                result=rmsnorm_result,
+                input=all_reduce,
+                weight=weight,
+                epsilon=self.epsilon,
+            )
 
             quant_out_tuple = auto_functionalized(
                 STATIC_FP4_QUANT_OP,
                 output=quant_result,
                 input=rmsnorm_out_tuple[1],
                 output_scale=output_scale,
-                input_scale=input_global_scale)
+                input_scale=input_global_scale,
+            )
 
             # quant_out, allreduce_output, output_scale
             return quant_out_tuple[1], all_reduce, quant_out_tuple[2]
 
-        def replacement(input: torch.Tensor, result_rms: torch.Tensor,
-                        quant_result: torch.Tensor, weight: torch.Tensor,
-                        input_global_scale: torch.Tensor,
-                        output_scale: torch.Tensor):
+        def replacement(
+            input: torch.Tensor,
+            result_rms: torch.Tensor,
+            quant_result: torch.Tensor,
+            weight: torch.Tensor,
+            input_global_scale: torch.Tensor,
+            output_scale: torch.Tensor,
+        ):
             residual = torch.zeros_like(input)
             allreduce = auto_functionalized(
                 flashinfer_trtllm_fused_allreduce_norm,
@@ -961,8 +1028,7 @@ def replacement(input: torch.Tensor, result_rms: torch.Tensor,
                 scale_out=output_scale,
                 rms_gamma=weight,
                 rms_eps=self.epsilon,
-                pattern_code=flashinfer_comm.AllReduceFusionPattern.
-                kARResidualRMSNormFP4Quant,  # we don't use norm_out afterwards
+                pattern_code=flashinfer_comm.AllReduceFusionPattern.kARResidualRMSNormFP4Quant,  # we don't use norm_out afterwards
                 scale_factor=input_global_scale,
                 **self.allreduce_params.get_trtllm_fused_allreduce_kwargs(),
             )
@@ -970,44 +1036,41 @@ def replacement(input: torch.Tensor, result_rms: torch.Tensor,
             # quant_out, allreduce_output, output_scale
             return allreduce[4], allreduce[1], allreduce[5]
 
-        pm.register_replacement(pattern, replacement, get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class AllReduceFusedAddRMSNormStaticQuantNVFP4Pattern(BasePattern):
     """
     This pattern replaces the allreduce + rms norm (with residual)
     + static nvfp4 quant with fused flashinfer implementation.
-    Applies to o_proj + rmsnorm after attn + quant and 
+    Applies to o_proj + rmsnorm after attn + quant and
     mlp + rmsnorm + quant before attn.
     """
 
-    def __init__(self, epsilon: float, dtype: torch.dtype, device: str,
-                 allreduce_params: FlashInferFusedAllReduceParams):
+    def __init__(
+        self,
+        epsilon: float,
+        dtype: torch.dtype,
+        device: str,
+        allreduce_params: FlashInferFusedAllReduceParams,
+    ):
         super().__init__(dtype, device)
         self.epsilon = epsilon
         self.allreduce_params = allreduce_params
 
     def register(self, pm_pass: PatternMatcherPass):
-
         def get_inputs():
             input = torch.empty([16, 16], device=self.device, dtype=self.dtype)
 
-            residual = torch.empty([16, 16],
-                                   device=self.device,
-                                   dtype=self.dtype)
-            weight = torch.empty([16, 16],
-                                 device=self.device,
-                                 dtype=self.dtype)
-            quant_result = torch.empty((16, 8),
-                                       device=self.device,
-                                       dtype=torch.uint8)
-            input_global_scale = torch.empty([1, 1],
-                                             device=self.device,
-                                             dtype=torch.float32)
-            output_scale = torch.empty([128, 4],
-                                       device=self.device,
-                                       dtype=torch.int32)
+            residual = torch.empty([16, 16], device=self.device, dtype=self.dtype)
+            weight = torch.empty([16, 16], device=self.device, dtype=self.dtype)
+            quant_result = torch.empty((16, 8), device=self.device, dtype=torch.uint8)
+            input_global_scale = torch.empty(
+                [1, 1], device=self.device, dtype=torch.float32
+            )
+            output_scale = torch.empty([128, 4], device=self.device, dtype=torch.int32)
 
             return [
                 quant_result,
@@ -1018,33 +1081,46 @@ def get_inputs():
                 input_global_scale,
             ]
 
-        def pattern(quant_result: torch.Tensor, residual: torch.Tensor,
-                    input: torch.Tensor, output_scale: torch.Tensor,
-                    weight: torch.Tensor, input_global_scale: torch.Tensor):
+        def pattern(
+            quant_result: torch.Tensor,
+            residual: torch.Tensor,
+            input: torch.Tensor,
+            output_scale: torch.Tensor,
+            weight: torch.Tensor,
+            input_global_scale: torch.Tensor,
+        ):
             allreduce_output = tensor_model_parallel_all_reduce(input)
 
-            fused_add_rmsnorm_out_tuple = \
-            auto_functionalized(
+            fused_add_rmsnorm_out_tuple = auto_functionalized(
                 RMS_ADD_OP,
                 input=allreduce_output,
                 residual=residual,
                 weight=weight,
-                epsilon=self.epsilon)
+                epsilon=self.epsilon,
+            )
             quant_out_tuple = auto_functionalized(
                 STATIC_FP4_QUANT_OP,
                 output=quant_result,
                 input=fused_add_rmsnorm_out_tuple[1],
                 output_scale=output_scale,
-                input_scale=input_global_scale)
+                input_scale=input_global_scale,
+            )
 
             # quant_out, allreduce_output, output_scale
-            return quant_out_tuple[1], fused_add_rmsnorm_out_tuple[
-                2], quant_out_tuple[2]
+            return (
+                quant_out_tuple[1],
+                fused_add_rmsnorm_out_tuple[2],
+                quant_out_tuple[2],
+            )
 
-        def replacement(quant_result: torch.Tensor, residual: torch.Tensor,
-                        input: torch.Tensor, output_scale: torch.Tensor,
-                        weight: torch.Tensor,
-                        input_global_scale: torch.Tensor):
+        def replacement(
+            quant_result: torch.Tensor,
+            residual: torch.Tensor,
+            input: torch.Tensor,
+            output_scale: torch.Tensor,
+            weight: torch.Tensor,
+            input_global_scale: torch.Tensor,
+        ):
             allreduce = auto_functionalized(
                 flashinfer_trtllm_fused_allreduce_norm,
                 allreduce_in=input,
@@ -1054,20 +1130,19 @@ def replacement(quant_result: torch.Tensor, residual: torch.Tensor,
                 scale_out=output_scale,
                 rms_gamma=weight,
                 rms_eps=self.epsilon,
-                pattern_code=flashinfer_comm.AllReduceFusionPattern.
-                kARResidualRMSNormFP4Quant,  # we don't use norm_out afterwards
+                pattern_code=flashinfer_comm.AllReduceFusionPattern.kARResidualRMSNormFP4Quant,  # we don't use norm_out afterwards
                 scale_factor=input_global_scale,
                 **self.allreduce_params.get_trtllm_fused_allreduce_kwargs(),
             )
             # quant_out, rms_norm_residual, output_scale
             return allreduce[4], allreduce[2], allreduce[5]
 
-        pm.register_replacement(pattern, replacement, get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class AllReduceFusionPass(VllmPatternMatcherPass):
-
     def __init__(self, config: VllmConfig):
         super().__init__(config)
         self.disabled = True
@@ -1075,7 +1150,8 @@ def __init__(self, config: VllmConfig):
         if self.tp_size <= 1:
             return
         self.patterns: PatternMatcherPass = PatternMatcherPass(
-            pass_name="all_reduce_fusion_pass")
+            pass_name="all_reduce_fusion_pass"
+        )
         if config.model_config is None:
             return
         self.hidden_dim = config.model_config.get_hidden_size()
@@ -1085,21 +1161,21 @@ def __init__(self, config: VllmConfig):
         if flashinfer_comm is None:
             logger.warning(
                 "Flashinfer is not installed or comm module not found, "
-                "skipping allreduce fusion pass")
+                "skipping allreduce fusion pass"
+            )
             return
         # Check if the world size is supported
         if self.tp_size not in _FI_MAX_SIZES:
             logger.warning(
-                "Flashinfer allreduce fusion is not "
-                "supported for world size %s",
+                "Flashinfer allreduce fusion is not supported for world size %s",
                 self.tp_size,
             )
             return
         max_num_token = min(
-            _FI_MAX_SIZES.get(self.tp_size, _DEFAULT_FI_MAX_SIZE) //
-            (self.hidden_dim * self.tp_size * (4 if use_fp32_lamport else 2)),
-            config.compilation_config.pass_config.
-            fi_allreduce_fusion_max_token_num)
+            _FI_MAX_SIZES.get(self.tp_size, _DEFAULT_FI_MAX_SIZE)
+            // (self.hidden_dim * self.tp_size * (4 if use_fp32_lamport else 2)),
+            config.compilation_config.pass_config.fi_allreduce_fusion_max_token_num,
+        )
         self.ipc_handles, workspace_tensor = (
             flashinfer_comm.trtllm_create_ipc_workspace_for_all_reduce_fusion(
                 tp_rank=rank,
@@ -1108,7 +1184,8 @@ def __init__(self, config: VllmConfig):
                 hidden_dim=self.hidden_dim,
                 group=self.group,
                 use_fp32_lamport=use_fp32_lamport,
-            ))
+            )
+        )
 
         global _FI_WORKSPACE_TENSOR
         _FI_WORKSPACE_TENSOR = workspace_tensor
@@ -1119,7 +1196,8 @@ def __init__(self, config: VllmConfig):
             max_token_num=max_num_token,
             # fuse rms norm static fp8 quant fused op
             # in fallback path, when we don't use flashinfer
-            fuse_rms_quant=config.compilation_config.pass_config.enable_fusion)
+            fuse_rms_quant=config.compilation_config.pass_config.enable_fusion,
+        )
 
         self.register_patterns()
         self.dump_patterns(config, self.patterns)
@@ -1185,4 +1263,5 @@ def __del__(self):
             return
         if flashinfer_comm is not None:
             flashinfer_comm.trtllm_destroy_ipc_workspace_for_all_reduce(
-                self.ipc_handles, self.group)
+                self.ipc_handles, self.group
+            )
diff --git a/vllm/compilation/compiler_interface.py b/vllm/compilation/compiler_interface.py
index eeca14d1296f..3b5fecaf189b 100644
--- a/vllm/compilation/compiler_interface.py
+++ b/vllm/compilation/compiler_interface.py
@@ -24,14 +24,14 @@ class CompilerInterface:
     """
     The interface for a compiler that can be used by vLLM.
     """
+
     # The name of the compiler, e.g. inductor.
     # This is a class-level attribute.
     name: str
 
-    def initialize_cache(self,
-                         cache_dir: str,
-                         disable_cache: bool = False,
-                         prefix: str = ""):
+    def initialize_cache(
+        self, cache_dir: str, disable_cache: bool = False, prefix: str = ""
+    ):
         """
         when the vLLM process uses `cache_dir` as the cache directory,
         the compiler should initialize itself with the cache directory,
@@ -93,12 +93,14 @@ def compile(
         """
         return None, None
 
-    def load(self,
-             handle: Any,
-             graph: fx.GraphModule,
-             example_inputs: list[Any],
-             graph_index: int,
-             runtime_shape: Optional[int] = None) -> Callable:
+    def load(
+        self,
+        handle: Any,
+        graph: fx.GraphModule,
+        example_inputs: list[Any],
+        graph_index: int,
+        runtime_shape: Optional[int] = None,
+    ) -> Callable:
         """
         Load the compiled function from the handle.
         Raises an error if the handle is invalid.
@@ -150,11 +152,13 @@ def get_inductor_factors() -> list[Any]:
     factors: list[Any] = []
     # summarize system state
     from torch._inductor.codecache import CacheBase
+
     system_factors = CacheBase.get_system()
     factors.append(system_factors)
 
     # summarize pytorch state
     from torch._inductor.codecache import torch_key
+
     torch_factors = torch_key()
     factors.append(torch_factors)
     return factors
@@ -169,18 +173,19 @@ class InductorStandaloneAdaptor(CompilerInterface):
 
     Use VLLM_USE_STANDALONE_COMPILE to toggle this on or off.
     """
+
     name = "inductor_standalone"
 
     def compute_hash(self, vllm_config: VllmConfig) -> str:
         factors = get_inductor_factors()
-        hash_str = hashlib.md5(str(factors).encode(),
-                               usedforsecurity=False).hexdigest()[:10]
+        hash_str = hashlib.md5(
+            str(factors).encode(), usedforsecurity=False
+        ).hexdigest()[:10]
         return hash_str
 
-    def initialize_cache(self,
-                         cache_dir: str,
-                         disable_cache: bool = False,
-                         prefix: str = ""):
+    def initialize_cache(
+        self, cache_dir: str, disable_cache: bool = False, prefix: str = ""
+    ):
         self.cache_dir = cache_dir
 
     def compile(
@@ -203,12 +208,14 @@ def compile(
             dynamic_shapes = "from_tracing_context"
 
         from torch._inductor import standalone_compile
+
         with pass_context(runtime_shape):
             compiled_graph = standalone_compile(
                 graph,
                 example_inputs,
                 dynamic_shapes=dynamic_shapes,
-                options={"config_patches": current_config})
+                options={"config_patches": current_config},
+            )
 
         # Save the compiled artifact to disk in the specified path
         assert key is not None
@@ -218,19 +225,23 @@ def compile(
             compilation_counter.num_compiled_artifacts_saved += 1
         return compiled_graph, (key, path)
 
-    def load(self,
-             handle: Any,
-             graph: fx.GraphModule,
-             example_inputs: list[Any],
-             graph_index: int,
-             runtime_shape: Optional[int] = None) -> Callable:
+    def load(
+        self,
+        handle: Any,
+        graph: fx.GraphModule,
+        example_inputs: list[Any],
+        graph_index: int,
+        runtime_shape: Optional[int] = None,
+    ) -> Callable:
         assert isinstance(handle, tuple)
         assert isinstance(handle[0], str)
         assert isinstance(handle[1], str)
         path = handle[1]
         inductor_compiled_graph = torch._inductor.CompiledArtifact.load(
-            path=path, format="unpacked")
+            path=path, format="unpacked"
+        )
         from torch._inductor.compile_fx import graph_returns_tuple
+
         returns_tuple = graph_returns_tuple(graph)
 
         def compiled_graph_wrapper(*args):
@@ -250,21 +261,22 @@ class InductorAdaptor(CompilerInterface):
     """
     The adaptor for the Inductor compiler, version 2.5, 2.6, 2.7.
     """
+
     name = "inductor"
 
     def compute_hash(self, vllm_config: VllmConfig) -> str:
         factors = get_inductor_factors()
-        hash_str = hashlib.md5(str(factors).encode(),
-                               usedforsecurity=False).hexdigest()[:10]
+        hash_str = hashlib.md5(
+            str(factors).encode(), usedforsecurity=False
+        ).hexdigest()[:10]
         return hash_str
 
-    def initialize_cache(self,
-                         cache_dir: str,
-                         disable_cache: bool = False,
-                         prefix: str = ""):
+    def initialize_cache(
+        self, cache_dir: str, disable_cache: bool = False, prefix: str = ""
+    ):
         self.cache_dir = cache_dir
         self.prefix = prefix
-        self.base_cache_dir = cache_dir[:-len(prefix)] if prefix else cache_dir
+        self.base_cache_dir = cache_dir[: -len(prefix)] if prefix else cache_dir
         if disable_cache:
             return
         # redirect the cache directory to a sub-directory
@@ -288,6 +300,7 @@ def compile(
     ) -> tuple[Optional[Callable], Optional[Any]]:
         compilation_counter.num_inductor_compiles += 1
         from torch._inductor.compile_fx import compile_fx
+
         current_config = {}
         if compiler_config is not None:
             current_config.update(compiler_config)
@@ -308,8 +321,8 @@ def compile(
         # it to get the hash of the compiled graph directly.
 
         hash_str, file_path = None, None
-        from torch._inductor.codecache import (FxGraphCache,
-                                               compiled_fx_graph_hash)
+        from torch._inductor.codecache import FxGraphCache, compiled_fx_graph_hash
+
         if torch.__version__.startswith("2.5"):
             original_load = FxGraphCache.load
             original_load_name = "torch._inductor.codecache.FxGraphCache.load"
@@ -326,7 +339,8 @@ def hijack_load(*args, **kwargs):
                         if not callable(cell.cell_contents):
                             continue
                         if cell.cell_contents.__code__.co_filename.startswith(
-                                self.base_cache_dir):
+                            self.base_cache_dir
+                        ):
                             # this is the real file path compiled from Inductor
                             file_path = cell.cell_contents.__code__.co_filename
                             break
@@ -338,8 +352,7 @@ def hijack_load(*args, **kwargs):
             original_load_name = None
 
             def hijacked_compile_fx_inner(*args, **kwargs):
-                output = torch._inductor.compile_fx.compile_fx_inner(
-                    *args, **kwargs)
+                output = torch._inductor.compile_fx.compile_fx_inner(*args, **kwargs)
                 nonlocal hash_str
                 inductor_compiled_graph = output
                 if inductor_compiled_graph is not None:
@@ -353,8 +366,7 @@ def hijacked_compile_fx_inner(*args, **kwargs):
                             if not callable(cell.cell_contents):
                                 continue
                             code = cell.cell_contents.__code__
-                            if code.co_filename.startswith(
-                                    self.base_cache_dir):
+                            if code.co_filename.startswith(self.base_cache_dir):
                                 # this is the real file path
                                 # compiled from Inductor
                                 file_path = code.co_filename
@@ -387,29 +399,38 @@ def _get_shape_env() -> AlwaysHitShapeEnv:
 
             # for hijacking the hash of the compiled graph
             stack.enter_context(
-                patch("torch._inductor.codecache.compiled_fx_graph_hash",
-                      hijack_compiled_fx_graph_hash))
+                patch(
+                    "torch._inductor.codecache.compiled_fx_graph_hash",
+                    hijack_compiled_fx_graph_hash,
+                )
+            )
 
             # for providing a dummy shape environment
             stack.enter_context(
-                patch("torch._inductor.codecache.FxGraphCache._get_shape_env",
-                      _get_shape_env))
+                patch(
+                    "torch._inductor.codecache.FxGraphCache._get_shape_env",
+                    _get_shape_env,
+                )
+            )
 
-            from torch._functorch._aot_autograd.autograd_cache import (
-                AOTAutogradCache)
+            from torch._functorch._aot_autograd.autograd_cache import AOTAutogradCache
 
             # torch 2.8+ on main uses _get_shape_env in AOTAutogradCache
             if hasattr(AOTAutogradCache, "_get_shape_env"):
                 stack.enter_context(
                     patch(
                         "torch._functorch._aot_autograd.autograd_cache.AOTAutogradCache._get_shape_env",
-                        _get_shape_env))
+                        _get_shape_env,
+                    )
+                )
 
             # for forcing the graph to be cached
             stack.enter_context(
                 patch(
                     "torch._inductor.codecache.FxGraphCache._check_can_cache",
-                    _check_can_cache))
+                    _check_can_cache,
+                )
+            )
 
             # Dynamo metrics context, see method for more details.
             stack.enter_context(self.metrics_context())
@@ -422,23 +443,26 @@ def _get_shape_env() -> AlwaysHitShapeEnv:
             # standalone_compile sometime.
             if is_torch_equal_or_newer("2.6"):
                 stack.enter_context(
-                    torch._inductor.config.patch(fx_graph_remote_cache=False))
+                    torch._inductor.config.patch(fx_graph_remote_cache=False)
+                )
                 # InductorAdaptor (unfortunately) requires AOTAutogradCache
                 # to be turned off to run. It will fail to acquire the hash_str
                 # and error if not.
                 # StandaloneInductorAdaptor (PyTorch 2.8+) fixes this problem.
                 stack.enter_context(
-                    torch._functorch.config.patch(enable_autograd_cache=False))
+                    torch._functorch.config.patch(enable_autograd_cache=False)
+                )
                 stack.enter_context(
-                    torch._functorch.config.patch(
-                        enable_remote_autograd_cache=False))
+                    torch._functorch.config.patch(enable_remote_autograd_cache=False)
+                )
 
             with pass_context(runtime_shape):
                 compiled_graph = compile_fx(
                     graph,
                     example_inputs,
                     inner_compile=hijacked_compile_fx_inner,
-                    config_patches=current_config)
+                    config_patches=current_config,
+                )
 
         # We treat VLLM_DISABLE_COMPILE_CACHE as the overall switch for torch
         # compilation cache. So turn off the checks if we disable the
@@ -451,52 +475,63 @@ def _get_shape_env() -> AlwaysHitShapeEnv:
                     "failed, leading to a corrupted compilation artifact. "
                     "We recommend trying to "
                     "remove ~/.cache/vllm/torch_compile_cache and try again "
-                    "to see the real issue. ")
+                    "to see the real issue. "
+                )
             assert file_path is not None, (
-                "failed to get the file path of the compiled graph")
+                "failed to get the file path of the compiled graph"
+            )
         return compiled_graph, (hash_str, file_path)
 
-    def load(self,
-             handle: Any,
-             graph: fx.GraphModule,
-             example_inputs: list[Any],
-             graph_index: int,
-             runtime_shape: Optional[int] = None) -> Callable:
+    def load(
+        self,
+        handle: Any,
+        graph: fx.GraphModule,
+        example_inputs: list[Any],
+        graph_index: int,
+        runtime_shape: Optional[int] = None,
+    ) -> Callable:
         assert isinstance(handle, tuple)
         assert isinstance(handle[0], str)
         assert isinstance(handle[1], str)
         hash_str = handle[0]
 
-        from torch._functorch._aot_autograd.autograd_cache import (
-            AOTAutogradCache)
+        from torch._functorch._aot_autograd.autograd_cache import AOTAutogradCache
         from torch._inductor.codecache import FxGraphCache
+
         with ExitStack() as exit_stack:
             exit_stack.enter_context(
-                patch("torch._inductor.codecache.FxGraphCache._get_shape_env",
-                      lambda *args, **kwargs: AlwaysHitShapeEnv()))
+                patch(
+                    "torch._inductor.codecache.FxGraphCache._get_shape_env",
+                    lambda *args, **kwargs: AlwaysHitShapeEnv(),
+                )
+            )
             # torch 2.8+ on main uses _get_shape_env in AOTAutogradCache
             if hasattr(AOTAutogradCache, "_get_shape_env"):
                 exit_stack.enter_context(
                     patch(
                         "torch._functorch._aot_autograd.autograd_cache.AOTAutogradCache._get_shape_env",
-                        lambda *args, **kwargs: AlwaysHitShapeEnv()))
+                        lambda *args, **kwargs: AlwaysHitShapeEnv(),
+                    )
+                )
 
             # Dynamo metrics context, see method for more details.
             exit_stack.enter_context(self.metrics_context())
 
             if torch.__version__.startswith("2.5"):
                 inductor_compiled_graph = FxGraphCache._lookup_graph(
-                    hash_str, example_inputs, True, False)
+                    hash_str, example_inputs, True, False
+                )
                 assert inductor_compiled_graph is not None, (
                     "Inductor cache lookup failed. Please remove"
                     f"the cache directory and try again."  # noqa
                 )
             elif torch.__version__ >= "2.6":
-                from torch._inductor.output_code import (
-                    CompiledFxGraphConstantsWithGm)
+                from torch._inductor.output_code import CompiledFxGraphConstantsWithGm
+
                 constants = CompiledFxGraphConstantsWithGm(graph)
                 inductor_compiled_graph, _ = FxGraphCache._lookup_graph(
-                    hash_str, example_inputs, True, None, constants)
+                    hash_str, example_inputs, True, None, constants
+                )
                 assert inductor_compiled_graph is not None, (
                     "Inductor cache lookup failed. Please remove"
                     f"the cache directory and try again."  # noqa
@@ -509,6 +544,7 @@ def load(self,
 
         # need to know if the graph returns a tuple
         from torch._inductor.compile_fx import graph_returns_tuple
+
         returns_tuple = graph_returns_tuple(graph)
 
         # this is the callable we return to Dynamo to run
@@ -542,6 +578,7 @@ def metrics_context(self) -> contextlib.AbstractContextManager:
         """
         if is_torch_equal_or_newer("2.6"):
             import torch._dynamo.utils
+
             return torch._dynamo.utils.get_metrics_context()
         else:
             return contextlib.nullcontext()
@@ -553,7 +590,8 @@ def set_inductor_config(config, runtime_shape):
         # can be beneficial
         config["max_autotune"] = envs.VLLM_ENABLE_INDUCTOR_MAX_AUTOTUNE
         config["coordinate_descent_tuning"] = (
-            envs.VLLM_ENABLE_INDUCTOR_COORDINATE_DESCENT_TUNING)
+            envs.VLLM_ENABLE_INDUCTOR_COORDINATE_DESCENT_TUNING
+        )
 
 
 class EagerAdaptor(CompilerInterface):
diff --git a/vllm/compilation/counter.py b/vllm/compilation/counter.py
index e01dd3915a3a..9e8de831bcb2 100644
--- a/vllm/compilation/counter.py
+++ b/vllm/compilation/counter.py
@@ -41,7 +41,8 @@ def expect(self, **kwargs):
             assert getattr(self, k) - getattr(old, k) == v, (
                 f"{k} not as expected, before it is {getattr(old, k)}"
                 f", after it is {getattr(self, k)}, "
-                f"expected diff is {v}")
+                f"expected diff is {v}"
+            )
 
 
 compilation_counter = CompilationCounter()
diff --git a/vllm/compilation/cuda_graph.py b/vllm/compilation/cuda_graph.py
index befb7736d75a..4c3ac9e56a37 100644
--- a/vllm/compilation/cuda_graph.py
+++ b/vllm/compilation/cuda_graph.py
@@ -12,8 +12,7 @@
 from vllm.compilation.counter import compilation_counter
 from vllm.compilation.monitor import validate_cudagraph_capturing_enabled
 from vllm.config import CUDAGraphMode, VllmConfig
-from vllm.distributed.device_communicators.pynccl_allocator import (
-    set_graph_pool_id)
+from vllm.distributed.device_communicators.pynccl_allocator import set_graph_pool_id
 from vllm.forward_context import BatchDescriptor, get_forward_context
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
@@ -46,10 +45,10 @@ class CUDAGraphWrapper:
 
     The workflow of this wrapper in the cudagraph dispatching is as follows:
     1. At initialization, a runtime mode is assigned to the wrapper (FULL or
-    PIECEWISE). 
-    2. At runtime, the wrapper receives a runtime_mode and a 
+    PIECEWISE).
+    2. At runtime, the wrapper receives a runtime_mode and a
     batch_descriptor(key) from the forward context and blindly trust them
-    for cudagraph dispatching. 
+    for cudagraph dispatching.
     3. If runtime_mode is NONE or runtime_mode does not match the mode of the
     wrapper, just call the runnable directly.
     4. Otherwise, i.e., the runtime_mode matches the mode of the wrapper,
@@ -58,18 +57,20 @@ class CUDAGraphWrapper:
 
     Note: CUDAGraphWrapper does not store persistent buffers or copy any
     runtime inputs into that buffers for replay. We assume implementing them
-    is done outside of the wrapper. That is because we do not make any 
+    is done outside of the wrapper. That is because we do not make any
     assumption on the dynamic shape (batch size) of the runtime inputs, as a
-    trade-off for staying orthogonal to compilation logic. Nevertheless, 
+    trade-off for staying orthogonal to compilation logic. Nevertheless,
     tracing and checking the input addresses to be consistent during replay is
     guaranteed when VLLM_LOGGING_LEVEL == "DEBUG".
     """
 
-    def __init__(self,
-                 runnable: Callable,
-                 vllm_config: VllmConfig,
-                 runtime_mode: CUDAGraphMode,
-                 cudagraph_options: Optional[CUDAGraphOptions] = None):
+    def __init__(
+        self,
+        runnable: Callable,
+        vllm_config: VllmConfig,
+        runtime_mode: CUDAGraphMode,
+        cudagraph_options: Optional[CUDAGraphOptions] = None,
+    ):
         self.runnable = runnable
         self.vllm_config = vllm_config
         self.runtime_mode = runtime_mode
@@ -91,15 +92,16 @@ def __init__(self,
         self.cudagraph_options = cudagraph_options
         # the entries for different batch descriptors that we need to capture
         # cudagraphs for.
-        self.concrete_cudagraph_entries: dict[BatchDescriptor, CUDAGraphEntry]\
-                                                                        = {}
+        self.concrete_cudagraph_entries: dict[BatchDescriptor, CUDAGraphEntry] = {}
 
     def __getattr__(self, key: str):
         # allow accessing the attributes of the runnable.
         if hasattr(self.runnable, key):
             return getattr(self.runnable, key)
-        raise AttributeError(f"Attribute {key} not exists in the runnable of "
-                             f"cudagraph wrapper: {self.runnable}")
+        raise AttributeError(
+            f"Attribute {key} not exists in the runnable of "
+            f"cudagraph wrapper: {self.runnable}"
+        )
 
     def unwrap(self) -> Callable:
         # in case we need to access the original runnable.
@@ -110,8 +112,10 @@ def __call__(self, *args, **kwargs):
         batch_descriptor = forward_context.batch_descriptor
         cudagraph_runtime_mode = forward_context.cudagraph_runtime_mode
 
-        if cudagraph_runtime_mode == CUDAGraphMode.NONE or \
-                            cudagraph_runtime_mode != self.runtime_mode:
+        if (
+            cudagraph_runtime_mode == CUDAGraphMode.NONE
+            or cudagraph_runtime_mode != self.runtime_mode
+        ):
             # CUDAGraphMode.NONE could mean the profile run, a warmup run, or
             # running without cudagraphs.
             # We do not trigger capture/replay if the runtime mode is not
@@ -122,8 +126,9 @@ def __call__(self, *args, **kwargs):
 
         if batch_descriptor not in self.concrete_cudagraph_entries:
             # create a new entry for this batch descriptor
-            self.concrete_cudagraph_entries[batch_descriptor] = \
-                CUDAGraphEntry(batch_descriptor=batch_descriptor)
+            self.concrete_cudagraph_entries[batch_descriptor] = CUDAGraphEntry(
+                batch_descriptor=batch_descriptor
+            )
 
         entry = self.concrete_cudagraph_entries[batch_descriptor]
 
@@ -133,8 +138,11 @@ def __call__(self, *args, **kwargs):
                 # capturing is fast, we don't need to log it for every
                 # shape. E.g. we only log it for the first subgraph in
                 # piecewise mode.
-                logger.debug("Capturing a cudagraph on (%s,%s)",
-                             self.runtime_mode.name, entry.batch_descriptor)
+                logger.debug(
+                    "Capturing a cudagraph on (%s,%s)",
+                    self.runtime_mode.name,
+                    entry.batch_descriptor,
+                )
             # validate that cudagraph capturing is legal at this point.
             validate_cudagraph_capturing_enabled()
 
@@ -153,8 +161,7 @@ def __call__(self, *args, **kwargs):
                     # therefore, we only run gc for the first graph,
                     # and disable gc for the rest of the graphs.
                     stack.enter_context(patch("gc.collect", lambda: None))
-                    stack.enter_context(
-                        patch("torch.cuda.empty_cache", lambda: None))
+                    stack.enter_context(patch("torch.cuda.empty_cache", lambda: None))
 
                 if self.graph_pool is not None:
                     set_graph_pool_id(self.graph_pool)
@@ -193,7 +200,8 @@ def __call__(self, *args, **kwargs):
             assert new_input_addresses == entry.input_addresses, (
                 f"Input addresses for cudagraphs are different "
                 f"during replay. Expected {entry.input_addresses}, "
-                f"got {new_input_addresses}")
+                f"got {new_input_addresses}"
+            )
 
         entry.cudagraph.replay()
         return entry.output
diff --git a/vllm/compilation/decorators.py b/vllm/compilation/decorators.py
index fa38cfe49a91..4f5648d3000a 100644
--- a/vllm/compilation/decorators.py
+++ b/vllm/compilation/decorators.py
@@ -34,11 +34,11 @@ def ignore_torch_compile(cls: _T) -> _T:
     a support_torch_compile decorator, but we don't want to
     compile the class `cls` that inherits the parent class.
     This only ignores compiling the forward of the class the
-    decorator is applied to. 
+    decorator is applied to.
 
     If the parent has ignore_torch_compile but the child has
     support_torch_compile, the child will still be compiled.
-    
+
     If the class has one or more submodules
     that have support_torch_compile decorator applied, compile will
     not be ignored for those submodules.
@@ -58,21 +58,18 @@ def _should_ignore_torch_compile(cls) -> bool:
 def support_torch_compile(
     *,
     enable_if: Optional[Callable[[VllmConfig], bool]] = None,
-) -> Callable[[_T], _T]:
-    ...
+) -> Callable[[_T], _T]: ...
 
 
 @overload
 def support_torch_compile(
     *,
     dynamic_arg_dims: Optional[dict[str, Union[int, list[int]]]],
-) -> Callable[[_T], _T]:
-    ...
+) -> Callable[[_T], _T]: ...
 
 
 @overload
-def support_torch_compile(cls: _T) -> _T:
-    ...
+def support_torch_compile(cls: _T) -> _T: ...
 
 
 def support_torch_compile(
@@ -89,8 +86,7 @@ def support_torch_compile(
     ```python
     @support_torch_compile
     class MyModel(nn.Module):
-        def forward(self, x: torch.Tensor, y: Optional[torch.Tensor]):
-            ...
+        def forward(self, x: torch.Tensor, y: Optional[torch.Tensor]): ...
     ```
 
     Usage 2: use as a decorator with arguments:
@@ -98,8 +94,7 @@ def forward(self, x: torch.Tensor, y: Optional[torch.Tensor]):
     ```python
     @support_torch_compile(dynamic_arg_dims={"x": 0, "y": 0})
     class MyModel(nn.Module):
-        def forward(self, x: torch.Tensor, y: Optional[torch.Tensor]):
-            ...
+        def forward(self, x: torch.Tensor, y: Optional[torch.Tensor]): ...
     ```
 
     `dynamic_arg_dims` is a dictionary that maps argument names to the dynamic
@@ -139,7 +134,7 @@ def forward(self, x: torch.Tensor, y: Optional[torch.Tensor]):
     def cls_decorator_helper(cls: _T) -> _T:
         # helper to pass `dynamic_arg_dims`` to `_support_torch_compile``
         # to avoid too much indentation for `_support_torch_compile``
-        if not hasattr(cls, 'forward'):
+        if not hasattr(cls, "forward"):
             raise TypeError("decorated class should have a forward method.")
         sig = inspect.signature(cls.forward)
         inferred_dynamic_arg_dims = dynamic_arg_dims
@@ -147,26 +142,31 @@ def cls_decorator_helper(cls: _T) -> _T:
             inferred_dynamic_arg_dims = {}
             for k, v in sig.parameters.items():
                 if v.annotation in [
-                        torch.Tensor, Optional[torch.Tensor],
-                        IntermediateTensors, Optional[IntermediateTensors]
+                    torch.Tensor,
+                    Optional[torch.Tensor],
+                    IntermediateTensors,
+                    Optional[IntermediateTensors],
                 ]:
                     inferred_dynamic_arg_dims[k] = 0
 
-            logger.debug(("Inferred dynamic dimensions for "
-                          "forward method of %s: %s"), cls,
-                         list(inferred_dynamic_arg_dims.keys()))
+            logger.debug(
+                ("Inferred dynamic dimensions for forward method of %s: %s"),
+                cls,
+                list(inferred_dynamic_arg_dims.keys()),
+            )
 
         if len(inferred_dynamic_arg_dims) == 0:
             raise ValueError(
                 "No dynamic dimensions found in the forward method of "
-                f"{cls}. Please provide dynamic_arg_dims explicitly.")
+                f"{cls}. Please provide dynamic_arg_dims explicitly."
+            )
 
         for k in inferred_dynamic_arg_dims:
             if k not in sig.parameters:
                 raise ValueError(
-                    f"Argument {k} not found in the forward method of {cls}")
-        return _support_torch_compile(cls, inferred_dynamic_arg_dims,
-                                      enable_if)
+                    f"Argument {k} not found in the forward method of {cls}"
+                )
+        return _support_torch_compile(cls, inferred_dynamic_arg_dims, enable_if)
 
     if cls is not None:
         # use `support_torch_compile` as a decorator without arguments
@@ -191,29 +191,32 @@ def _support_torch_compile(
     # take care of method resolution order
     # make sure super().__init__ is called on the base class
     #  other than TorchCompileWrapperWithCustomDispatcher
-    cls.__bases__ = cls.__bases__ + (TorchCompileWrapperWithCustomDispatcher, )
+    cls.__bases__ = cls.__bases__ + (TorchCompileWrapperWithCustomDispatcher,)
 
     old_init = cls.__init__
 
     setattr(cls, IGNORE_COMPILE_KEY, False)
 
-    def __init__(self, *, vllm_config: VllmConfig, prefix: str = '', **kwargs):
+    def __init__(self, *, vllm_config: VllmConfig, prefix: str = "", **kwargs):
         old_init(self, vllm_config=vllm_config, prefix=prefix, **kwargs)
         self.vllm_config = vllm_config
         enable_compile = enable_if is None or enable_if(vllm_config)
         # for CompilationLevel.DYNAMO_AS_IS , the upper level model runner
         # will handle the compilation, so we don't need to do anything here.
-        self.do_not_compile = \
-            vllm_config.compilation_config.level in [
-            CompilationLevel.NO_COMPILATION, CompilationLevel.DYNAMO_AS_IS
-        ] or not supports_dynamo() or _should_ignore_torch_compile(
-            self.__class__) or not enable_compile
+        self.do_not_compile = (
+            vllm_config.compilation_config.level
+            in [CompilationLevel.NO_COMPILATION, CompilationLevel.DYNAMO_AS_IS]
+            or not supports_dynamo()
+            or _should_ignore_torch_compile(self.__class__)
+            or not enable_compile
+        )
         if self.do_not_compile:
             return
 
         compilation_counter.num_models_seen += 1
         TorchCompileWrapperWithCustomDispatcher.__init__(
-            self, compilation_level=vllm_config.compilation_config.level)
+            self, compilation_level=vllm_config.compilation_config.level
+        )
 
     cls.__init__ = __init__
 
@@ -235,26 +238,23 @@ def __call__(self, *args, **kwargs):
                     dims = [dims] if isinstance(dims, int) else dims
                     if isinstance(arg, torch.Tensor):
                         # In case dims is specified with negative indexing
-                        dims = [
-                            arg.ndim + dim if dim < 0 else dim for dim in dims
-                        ]
+                        dims = [arg.ndim + dim if dim < 0 else dim for dim in dims]
                         torch._dynamo.mark_dynamic(arg, dims)
                     elif isinstance(arg, IntermediateTensors):
                         for tensor in arg.tensors.values():
                             # In case dims is specified with negative indexing
                             dims = [
-                                tensor.ndim + dim if dim < 0 else dim
-                                for dim in dims
+                                tensor.ndim + dim if dim < 0 else dim for dim in dims
                             ]
                             torch._dynamo.mark_dynamic(tensor, dims)
                     else:
                         raise ValueError(
                             "Unsupported dynamic dimensions"
-                            f" {dims} for argument {k} with type {type(arg)}.")
+                            f" {dims} for argument {k} with type {type(arg)}."
+                        )
             # here, it is the starting point of the `torch.compile` process
             start_monitoring_torch_compile(self.vllm_config)
-            logger.debug("Start compiling function %s",
-                         self.original_code_object)
+            logger.debug("Start compiling function %s", self.original_code_object)
 
         # if we don't use custom dispatcher, we can directly call the
         # compiled function and let torch.compile handle the dispatching,
@@ -263,8 +263,7 @@ def __call__(self, *args, **kwargs):
             # it seems Dynamo reuse the compilation across instances,
             # while we need to make sure the compiled code is not reused.
             # we need to control all the compilation of the model.
-            torch._dynamo.eval_frame.remove_from_cache(
-                self.original_code_object)
+            torch._dynamo.eval_frame.remove_from_cache(self.original_code_object)
 
             # collect all relevant files traced by Dynamo,
             # so that the compilation cache can trigger re-compilation
@@ -272,7 +271,8 @@ def __call__(self, *args, **kwargs):
 
             # 1. the file containing the top-level forward function
             self.vllm_config.compilation_config.traced_files.add(
-                self.original_code_object.co_filename)
+                self.original_code_object.co_filename
+            )
 
             # 2. every time Dynamo sees a function call, it will inline
             # the function by calling InliningInstructionTranslator.inline_call
@@ -282,8 +282,7 @@ def __call__(self, *args, **kwargs):
 
             def patched_inline_call(parent, func, args, kwargs):
                 code = func.get_code()
-                self.vllm_config.compilation_config.traced_files.add(
-                    code.co_filename)
+                self.vllm_config.compilation_config.traced_files.add(code.co_filename)
                 return inline_call(parent, func, args, kwargs)
 
             # Disable the C++ compilation of symbolic shape guards. C++-fication
@@ -293,20 +292,20 @@ def patched_inline_call(parent, func, args, kwargs):
             dynamo_config_patches = {}
             try:
                 _ = torch._dynamo.config.enable_cpp_symbolic_shape_guards
-                dynamo_config_patches[
-                    "enable_cpp_symbolic_shape_guards"] = False
+                dynamo_config_patches["enable_cpp_symbolic_shape_guards"] = False
             except AttributeError:
                 # Note: this config is not available in torch 2.6, we can skip
                 # if the config doesn't exist
-                logger.debug(
-                    "enable_cpp_symbolic_shape_guards config not available")
-
-            with patch.object(
-                    InliningInstructionTranslator, "inline_call",
-                    patched_inline_call), torch._dynamo.config.patch(
-                        **dynamo_config_patches
-                    ), maybe_use_cudagraph_partition_wrapper(
-                        self.vllm_config), _torch27_patch_tensor_subclasses():
+                logger.debug("enable_cpp_symbolic_shape_guards config not available")
+
+            with (
+                patch.object(
+                    InliningInstructionTranslator, "inline_call", patched_inline_call
+                ),
+                torch._dynamo.config.patch(**dynamo_config_patches),
+                maybe_use_cudagraph_partition_wrapper(self.vllm_config),
+                _torch27_patch_tensor_subclasses(),
+            ):
                 output = self.compiled_callable(*args, **kwargs)
             return output
 
@@ -336,18 +335,20 @@ def maybe_use_cudagraph_partition_wrapper(vllm_config: VllmConfig):
     from vllm.config import CUDAGraphMode
 
     compilation_config = vllm_config.compilation_config
-    if (compilation_config.cudagraph_mode.has_piecewise_cudagraphs()
-            and compilation_config.use_inductor_graph_partition):
+    if (
+        compilation_config.cudagraph_mode.has_piecewise_cudagraphs()
+        and compilation_config.use_inductor_graph_partition
+    ):
         from torch._inductor.utils import CUDAGraphWrapperMetadata
 
         from vllm.compilation.cuda_graph import CUDAGraphOptions
         from vllm.platforms import current_platform
 
         static_graph_wrapper_class = resolve_obj_by_qualname(
-            current_platform.get_static_graph_wrapper_cls())
+            current_platform.get_static_graph_wrapper_cls()
+        )
 
-        def customized_cudagraph_wrapper(f,
-                                         metadata: CUDAGraphWrapperMetadata):
+        def customized_cudagraph_wrapper(f, metadata: CUDAGraphWrapperMetadata):
             partition_id = metadata.partition_index
             num_partitions = metadata.num_partitions
             return static_graph_wrapper_class(
@@ -358,15 +359,19 @@ def customized_cudagraph_wrapper(f,
                     debug_log_enable=partition_id == 0,
                     gc_disable=partition_id != 0,
                     weak_ref_output=partition_id == num_partitions - 1,
-                ))
+                ),
+            )
 
         torch._inductor.utils.set_customized_partition_wrappers(
-            customized_cudagraph_wrapper)
+            customized_cudagraph_wrapper
+        )
 
     yield
 
-    if (compilation_config.cudagraph_mode.has_piecewise_cudagraphs()
-            and compilation_config.use_inductor_graph_partition):
+    if (
+        compilation_config.cudagraph_mode.has_piecewise_cudagraphs()
+        and compilation_config.use_inductor_graph_partition
+    ):
         torch._inductor.utils.set_customized_partition_wrappers(None)
 
 
@@ -378,23 +383,32 @@ def _torch27_patch_tensor_subclasses():
     `BasevLLMParameters` without having to replace them with regular tensors
     before `torch.compile`-time.
     """
-    from vllm.model_executor.parameter import (BasevLLMParameter,
-                                               ModelWeightParameter,
-                                               RowvLLMParameter,
-                                               _ColumnvLLMParameter)
+    from vllm.model_executor.parameter import (
+        BasevLLMParameter,
+        ModelWeightParameter,
+        RowvLLMParameter,
+        _ColumnvLLMParameter,
+    )
 
     def return_false(*args, **kwargs):
         return False
 
-    if version.parse("2.7") <= version.parse(
-            torch.__version__) < version.parse("2.8"):
+    if version.parse("2.7") <= version.parse(torch.__version__) < version.parse("2.8"):
         yield
         return
 
-    with (torch._dynamo.config.patch("traceable_tensor_subclasses", [
-            BasevLLMParameter, ModelWeightParameter, _ColumnvLLMParameter,
-            RowvLLMParameter
-    ]),
-          patch("torch._dynamo.variables.torch.can_dispatch_torch_function",
-                return_false)):
+    with (
+        torch._dynamo.config.patch(
+            "traceable_tensor_subclasses",
+            [
+                BasevLLMParameter,
+                ModelWeightParameter,
+                _ColumnvLLMParameter,
+                RowvLLMParameter,
+            ],
+        ),
+        patch(
+            "torch._dynamo.variables.torch.can_dispatch_torch_function", return_false
+        ),
+    ):
         yield
diff --git a/vllm/compilation/fix_functionalization.py b/vllm/compilation/fix_functionalization.py
index ce6db9c1ebca..0dffb343f9a2 100644
--- a/vllm/compilation/fix_functionalization.py
+++ b/vllm/compilation/fix_functionalization.py
@@ -31,8 +31,9 @@ def __call__(self, graph: torch.fx.Graph):
         # XPU does not support auto-functionalization yet.
         # Will enable this when switch to vllm-xpu-kernels.
         if current_platform.is_xpu():
-            logger.debug("XPU platform does not support fix functionalization"
-                         "pass currently.")
+            logger.debug(
+                "XPU platform does not support fix functionalizationpass currently."
+            )
             return
 
         self.nodes_to_remove: list[torch.fx.Node] = []
@@ -45,19 +46,21 @@ def __call__(self, graph: torch.fx.Graph):
             at_target = node.args[0]
 
             if at_target == torch.ops._C.rotary_embedding.default:
-                query = kwargs['query']
-                key = kwargs['key']
+                query = kwargs["query"]
+                key = kwargs["key"]
                 getitem_nodes = self.getitem_users(node)
 
-                if (is_func(query, operator.getitem)
-                        and is_func(key, operator.getitem)
-                        and query.args[0] == key.args[0]
-                        and is_func(query.args[0],
-                                    torch.ops.aten.split_with_sizes.default)
-                        and all(
-                            is_func(user, torch.ops.aten.slice_scatter.default)
-                            for getitem_node in getitem_nodes.values()
-                            for user in getitem_node.users)):
+                if (
+                    is_func(query, operator.getitem)
+                    and is_func(key, operator.getitem)
+                    and query.args[0] == key.args[0]
+                    and is_func(query.args[0], torch.ops.aten.split_with_sizes.default)
+                    and all(
+                        is_func(user, torch.ops.aten.slice_scatter.default)
+                        for getitem_node in getitem_nodes.values()
+                        for user in getitem_node.users
+                    )
+                ):
                     # Pattern where query and key are slices of an mm_node.
                     # While functionalized, results at [1] and [2] are scattered
                     # back into mm_node. So after de-functionalization, we can
@@ -66,8 +69,9 @@ def __call__(self, graph: torch.fx.Graph):
                     mm_node = query.args[0].args[0]
                     for user in getitem_nodes.values():
                         for user_of_getitem in user.users:
-                            if is_func(user_of_getitem,
-                                       torch.ops.aten.slice_scatter.default):
+                            if is_func(
+                                user_of_getitem, torch.ops.aten.slice_scatter.default
+                            ):
                                 user_of_getitem.replace_all_uses_with(mm_node)
                                 self._remove(user_of_getitem)
                         self._remove(user)
@@ -81,49 +85,54 @@ def __call__(self, graph: torch.fx.Graph):
                     # do this blindly, but in practice in vLLM it's ok. The best
                     # solution is to use auto_functionalization_v2 and then use
                     # inductor's builtin defunctionalization (reinplacing) pass.
-                    mutated_args = {1: 'query', 2: 'key'}
+                    mutated_args = {1: "query", 2: "key"}
                     self.defunctionalize(graph, node, mutated_args)
 
             # rms_norm replacements avoid the most copies for LLaMa.
             elif at_target == torch.ops._C.fused_add_rms_norm.default:
-                mutated_args = {1: 'input', 2: 'residual'}
+                mutated_args = {1: "input", 2: "residual"}
                 self.defunctionalize(graph, node, mutated_args)
             elif at_target == torch.ops._C.fused_add_rms_norm_static_fp8_quant.default:  # noqa: E501
-                mutated_args = {1: 'result', 2: 'residual'}
+                mutated_args = {1: "result", 2: "residual"}
                 self.defunctionalize(graph, node, mutated_args)
             elif at_target == torch.ops._C.rms_norm_dynamic_per_token_quant.default:  # noqa: E501
-                mutated_args = {1: 'result', 2: 'scale', 3: 'residual'}
+                mutated_args = {1: "result", 2: "scale", 3: "residual"}
                 self.defunctionalize(graph, node, mutated_args)
             elif at_target in [
-                    torch.ops._C.rms_norm.default,
-                    torch.ops._C.rms_norm_static_fp8_quant.default,
+                torch.ops._C.rms_norm.default,
+                torch.ops._C.rms_norm_static_fp8_quant.default,
             ]:
-                mutated_args = {1: 'result'}
+                mutated_args = {1: "result"}
                 self.defunctionalize(graph, node, mutated_args)
             # For some reason we need to specify the args for both
             # silu_and_mul and silu_and_mul_quant. The kwargs
             # pathway gets the wrong answer.
             elif at_target == torch.ops._C.silu_and_mul.default:
-                mutated_args = {1: 'result'}
-                self.defunctionalize(graph,
-                                     node,
-                                     mutated_args,
-                                     args=('result', 'input'))
+                mutated_args = {1: "result"}
+                self.defunctionalize(
+                    graph, node, mutated_args, args=("result", "input")
+                )
             elif at_target == torch.ops._C.silu_and_mul_quant.default:
-                mutated_args = {1: 'result'}
-                self.defunctionalize(graph,
-                                     node,
-                                     mutated_args,
-                                     args=('result', 'input', 'scale'))
-            elif hasattr(
-                    torch.ops._C, "silu_and_mul_nvfp4_quant"
-            ) and at_target == torch.ops._C.silu_and_mul_nvfp4_quant.default:
-                mutated_args = {1: 'result', 2: 'result_block_scale'}
-                self.defunctionalize(graph,
-                                     node,
-                                     mutated_args,
-                                     args=('result', 'result_block_scale',
-                                           'input', 'input_global_scale'))
+                mutated_args = {1: "result"}
+                self.defunctionalize(
+                    graph, node, mutated_args, args=("result", "input", "scale")
+                )
+            elif (
+                hasattr(torch.ops._C, "silu_and_mul_nvfp4_quant")
+                and at_target == torch.ops._C.silu_and_mul_nvfp4_quant.default
+            ):
+                mutated_args = {1: "result", 2: "result_block_scale"}
+                self.defunctionalize(
+                    graph,
+                    node,
+                    mutated_args,
+                    args=(
+                        "result",
+                        "result_block_scale",
+                        "input",
+                        "input_global_scale",
+                    ),
+                )
             else:
                 continue  # skip the count
 
@@ -136,12 +145,12 @@ def __call__(self, graph: torch.fx.Graph):
         for node in self.nodes_to_remove:
             graph.erase_node(node)
 
-        logger.debug("De-functionalized %s nodes, removed %s nodes", count,
-                     count_removed)
+        logger.debug(
+            "De-functionalized %s nodes, removed %s nodes", count, count_removed
+        )
         self.nodes_to_remove.clear()
 
-    def _remove(self, node_or_nodes: Union[torch.fx.Node,
-                                           Iterable[torch.fx.Node]]):
+    def _remove(self, node_or_nodes: Union[torch.fx.Node, Iterable[torch.fx.Node]]):
         """
         Stage a node (or nodes) for removal at the end of the pass.
         """
@@ -150,12 +159,13 @@ def _remove(self, node_or_nodes: Union[torch.fx.Node,
         else:
             self.nodes_to_remove.extend(node_or_nodes)
 
-    def defunctionalize(self,
-                        graph: torch.fx.Graph,
-                        node: torch.fx.Node,
-                        mutated_args: dict[int, Union[torch.fx.Node, str]],
-                        args: Optional[tuple[Union[torch.fx.Node, str],
-                                             ...]] = None):
+    def defunctionalize(
+        self,
+        graph: torch.fx.Graph,
+        node: torch.fx.Node,
+        mutated_args: dict[int, Union[torch.fx.Node, str]],
+        args: Optional[tuple[Union[torch.fx.Node, str], ...]] = None,
+    ):
         """
         De-functionalize a node by replacing it with a call to the original.
         It also replaces the getitem users with the mutated arguments.
@@ -165,10 +175,9 @@ def defunctionalize(self,
         self.insert_defunctionalized(graph, node, args=args)
         self._remove(node)
 
-    def replace_users_with_mutated_args(self, node: torch.fx.Node,
-                                        mutated_args: dict[int,
-                                                           Union[torch.fx.Node,
-                                                                 str]]):
+    def replace_users_with_mutated_args(
+        self, node: torch.fx.Node, mutated_args: dict[int, Union[torch.fx.Node, str]]
+    ):
         """
         Replace all getitem users of the auto-functionalized node with the
         mutated arguments.
@@ -194,11 +203,12 @@ def getitem_users(self, node: torch.fx.Node) -> dict[int, torch.fx.Node]:
                 users[idx] = user
         return users
 
-    def insert_defunctionalized(self,
-                                graph: torch.fx.Graph,
-                                node: torch.fx.Node,
-                                args: Optional[tuple[Union[torch.fx.Node, str],
-                                                     ...]] = None):
+    def insert_defunctionalized(
+        self,
+        graph: torch.fx.Graph,
+        node: torch.fx.Node,
+        args: Optional[tuple[Union[torch.fx.Node, str], ...]] = None,
+    ):
         """
         Insert a new defunctionalized node into the graph before node.
         If one of the kwargs is 'out', provide args directly,
@@ -210,8 +220,9 @@ def insert_defunctionalized(self,
         :param args: If we cannot use kwargs, specify args directly.
         If an arg is a string, `node.kwargs[arg]` is used.
         """  # noqa: E501
-        assert is_func(node, auto_functionalized), \
+        assert is_func(node, auto_functionalized), (
             f"node must be auto-functionalized, is {node} instead"
+        )
 
         # Create a new call to the original function
         with graph.inserting_before(node):
@@ -220,6 +231,7 @@ def insert_defunctionalized(self,
                 graph.call_function(function, kwargs=node.kwargs)
             else:
                 # Args passed as strings refer to items in node.kwargs
-                args = tuple(node.kwargs[arg] if isinstance(arg, str) else arg
-                             for arg in args)
+                args = tuple(
+                    node.kwargs[arg] if isinstance(arg, str) else arg for arg in args
+                )
                 graph.call_function(function, args=args)
diff --git a/vllm/compilation/fusion.py b/vllm/compilation/fusion.py
index 3034b6eaeaca..df54e94a03db 100644
--- a/vllm/compilation/fusion.py
+++ b/vllm/compilation/fusion.py
@@ -12,8 +12,15 @@
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape, QuantKey, ScaleDesc, kFp8DynamicTensorSym, kFp8DynamicTokenSym,
-    kFp8StaticTensorSym, kNvfp4Quant, kStaticTensorScale)
+    GroupShape,
+    QuantKey,
+    ScaleDesc,
+    kFp8DynamicTensorSym,
+    kFp8DynamicTokenSym,
+    kFp8StaticTensorSym,
+    kNvfp4Quant,
+    kStaticTensorScale,
+)
 from vllm.platforms import current_platform
 
 from .inductor_pass import enable_fake_mode
@@ -40,12 +47,9 @@ def empty_i32(*args, **kwargs):
 RMS_ADD_OP = torch.ops._C.fused_add_rms_norm.default
 
 QUANT_OPS: dict[QuantKey, OpOverload] = {
-    kFp8StaticTensorSym:
-    torch.ops._C.static_scaled_fp8_quant.default,  # noqa: E501
-    kFp8DynamicTensorSym:
-    torch.ops._C.dynamic_scaled_fp8_quant.default,  # noqa: E501
-    kFp8DynamicTokenSym:
-    torch.ops._C.dynamic_per_token_scaled_fp8_quant.default,  # noqa: E501
+    kFp8StaticTensorSym: torch.ops._C.static_scaled_fp8_quant.default,  # noqa: E501
+    kFp8DynamicTensorSym: torch.ops._C.dynamic_scaled_fp8_quant.default,  # noqa: E501
+    kFp8DynamicTokenSym: torch.ops._C.dynamic_per_token_scaled_fp8_quant.default,  # noqa: E501
 }
 if current_platform.is_cuda() and hasattr(torch.ops._C, "scaled_fp4_quant"):
     QUANT_OPS[kNvfp4Quant] = torch.ops._C.scaled_fp4_quant.default
@@ -57,80 +61,93 @@ class FusedRMSQuantKey(NamedTuple):
     quant: type of quantization
     fused_add: does the op also perform the residual add
     """
+
     quant: QuantKey
     fused_add: bool
 
     def __str__(self):
-        return (f"FusedQuantKey({self.quant}, with"
-                f"{'' if self.fused_add else 'out'} residual)")
+        return (
+            f"FusedQuantKey({self.quant}, with"
+            f"{'' if self.fused_add else 'out'} residual)"
+        )
 
 
 FUSED_OPS: dict[FusedRMSQuantKey, OpOverload] = {
-    FusedRMSQuantKey(kFp8StaticTensorSym, False):
-    torch.ops._C.rms_norm_static_fp8_quant.default,  # noqa: E501
-    FusedRMSQuantKey(kFp8StaticTensorSym, True):
-    torch.ops._C.fused_add_rms_norm_static_fp8_quant.default,  # noqa: E501
-    FusedRMSQuantKey(kFp8DynamicTokenSym, False):
-    torch.ops._C.rms_norm_dynamic_per_token_quant.default,  # noqa: E501
-    FusedRMSQuantKey(kFp8DynamicTokenSym, True):
-    torch.ops._C.rms_norm_dynamic_per_token_quant.default,  # noqa: E501
+    FusedRMSQuantKey(
+        kFp8StaticTensorSym, False
+    ): torch.ops._C.rms_norm_static_fp8_quant.default,  # noqa: E501
+    FusedRMSQuantKey(
+        kFp8StaticTensorSym, True
+    ): torch.ops._C.fused_add_rms_norm_static_fp8_quant.default,  # noqa: E501
+    FusedRMSQuantKey(
+        kFp8DynamicTokenSym, False
+    ): torch.ops._C.rms_norm_dynamic_per_token_quant.default,  # noqa: E501
+    FusedRMSQuantKey(
+        kFp8DynamicTokenSym, True
+    ): torch.ops._C.rms_norm_dynamic_per_token_quant.default,  # noqa: E501
 }
 
 
 class RMSNormQuantPattern:
-
     def __init__(self, epsilon: float, key: FusedRMSQuantKey):
         self.epsilon = epsilon
         self.quant_dtype = key.quant.dtype
 
-        assert key.quant in QUANT_OPS, \
-            f"unsupported quantization scheme {key.quant}"
+        assert key.quant in QUANT_OPS, f"unsupported quantization scheme {key.quant}"
         self.QUANT_OP = QUANT_OPS[key.quant]
 
-        assert key in FUSED_OPS, \
-            f"unsupported fused rmsnorm+quant op for {key}"
+        assert key in FUSED_OPS, f"unsupported fused rmsnorm+quant op for {key}"
         self.FUSED_OP = FUSED_OPS[key]
 
 
 class RMSNormStaticQuantPattern(RMSNormQuantPattern):
-
-    def __init__(self,
-                 epsilon: float,
-                 quant_dtype: torch.dtype,
-                 symmetric=True):
-        fused_key = FusedRMSQuantKey(fused_add=False,
-                                     quant=QuantKey(dtype=quant_dtype,
-                                                    scale=kStaticTensorScale,
-                                                    symmetric=symmetric))
+    def __init__(self, epsilon: float, quant_dtype: torch.dtype, symmetric=True):
+        fused_key = FusedRMSQuantKey(
+            fused_add=False,
+            quant=QuantKey(
+                dtype=quant_dtype, scale=kStaticTensorScale, symmetric=symmetric
+            ),
+        )
         super().__init__(epsilon, fused_key)
 
     def register(self, pm_pass: PatternMatcherPass):
         # Cannot use methods, as the self argument affects tracing
-        def pattern(result: torch.Tensor, result_rms: torch.Tensor,
-                    input: torch.Tensor, weight: torch.Tensor,
-                    scale: torch.Tensor):
-            at1 = auto_functionalized(RMS_OP,
-                                      result=result_rms,
-                                      input=input,
-                                      weight=weight,
-                                      epsilon=self.epsilon)
-            at2 = auto_functionalized(self.QUANT_OP,
-                                      result=result,
-                                      input=at1[1],
-                                      scale=scale)
+        def pattern(
+            result: torch.Tensor,
+            result_rms: torch.Tensor,
+            input: torch.Tensor,
+            weight: torch.Tensor,
+            scale: torch.Tensor,
+        ):
+            at1 = auto_functionalized(
+                RMS_OP,
+                result=result_rms,
+                input=input,
+                weight=weight,
+                epsilon=self.epsilon,
+            )
+            at2 = auto_functionalized(
+                self.QUANT_OP, result=result, input=at1[1], scale=scale
+            )
 
             # result
             return at2[1]
 
-        def replacement(result: torch.Tensor, result_rms: torch.Tensor,
-                        input: torch.Tensor, weight: torch.Tensor,
-                        scale: torch.Tensor):
-            at = auto_functionalized(self.FUSED_OP,
-                                     result=result,
-                                     input=input,
-                                     weight=weight,
-                                     scale=scale,
-                                     epsilon=self.epsilon)
+        def replacement(
+            result: torch.Tensor,
+            result_rms: torch.Tensor,
+            input: torch.Tensor,
+            weight: torch.Tensor,
+            scale: torch.Tensor,
+        ):
+            at = auto_functionalized(
+                self.FUSED_OP,
+                result=result,
+                input=input,
+                weight=weight,
+                scale=scale,
+                epsilon=self.epsilon,
+            )
 
             # result
             return at[1]
@@ -140,53 +157,60 @@ def replacement(result: torch.Tensor, result_rms: torch.Tensor,
             empty_bf16(5, 4),  # result_rms
             empty_bf16(5, 4),  # input
             empty_bf16(1, 5),  # weight
-            empty_fp32(1, 1)  # scale
+            empty_fp32(1, 1),  # scale
         ]
 
-        pm.register_replacement(pattern, replacement, inputs, pm.fwd_only,
-                                pm_pass)
+        pm.register_replacement(pattern, replacement, inputs, pm.fwd_only, pm_pass)
 
 
 class FusedAddRMSNormStaticQuantPattern(RMSNormQuantPattern):
-
-    def __init__(self,
-                 epsilon: float,
-                 quant_dtype: torch.dtype,
-                 symmetric=True):
-        key = FusedRMSQuantKey(fused_add=True,
-                               quant=QuantKey(dtype=quant_dtype,
-                                              scale=kStaticTensorScale,
-                                              symmetric=symmetric))
+    def __init__(self, epsilon: float, quant_dtype: torch.dtype, symmetric=True):
+        key = FusedRMSQuantKey(
+            fused_add=True,
+            quant=QuantKey(
+                dtype=quant_dtype, scale=kStaticTensorScale, symmetric=symmetric
+            ),
+        )
         super().__init__(epsilon, key)
 
     def register(self, pm_pass: PatternMatcherPass):
-
-        def pattern(result: torch.Tensor, input: torch.Tensor,
-                    residual: torch.Tensor, weight: torch.Tensor,
-                    scale: torch.Tensor):
-            at = auto_functionalized(RMS_ADD_OP,
-                                     input=input,
-                                     residual=residual,
-                                     weight=weight,
-                                     epsilon=self.epsilon)
-            at1 = auto_functionalized(self.QUANT_OP,
-                                      result=result,
-                                      input=at[1],
-                                      scale=scale)
+        def pattern(
+            result: torch.Tensor,
+            input: torch.Tensor,
+            residual: torch.Tensor,
+            weight: torch.Tensor,
+            scale: torch.Tensor,
+        ):
+            at = auto_functionalized(
+                RMS_ADD_OP,
+                input=input,
+                residual=residual,
+                weight=weight,
+                epsilon=self.epsilon,
+            )
+            at1 = auto_functionalized(
+                self.QUANT_OP, result=result, input=at[1], scale=scale
+            )
 
             # result, residual
             return at1[1], at[2]
 
-        def replacement(result: torch.Tensor, input: torch.Tensor,
-                        residual: torch.Tensor, weight: torch.Tensor,
-                        scale: torch.Tensor):
-            at = auto_functionalized(self.FUSED_OP,
-                                     result=result,
-                                     input=input,
-                                     residual=residual,
-                                     weight=weight,
-                                     scale=scale,
-                                     epsilon=self.epsilon)
+        def replacement(
+            result: torch.Tensor,
+            input: torch.Tensor,
+            residual: torch.Tensor,
+            weight: torch.Tensor,
+            scale: torch.Tensor,
+        ):
+            at = auto_functionalized(
+                self.FUSED_OP,
+                result=result,
+                input=input,
+                residual=residual,
+                weight=weight,
+                scale=scale,
+                epsilon=self.epsilon,
+            )
 
             # result, residual
             return at[1], at[2]
@@ -196,7 +220,7 @@ def replacement(result: torch.Tensor, input: torch.Tensor,
             empty_bf16(5, 4),  # input
             empty_bf16(5, 4),  # residual
             empty_bf16(1, 5),  # weight
-            empty_fp32(1, 1)  # scale
+            empty_fp32(1, 1),  # scale
         ]
 
         pm.register_replacement(
@@ -209,49 +233,59 @@ def replacement(result: torch.Tensor, input: torch.Tensor,
 
 
 class RMSNormDynamicQuantPattern(RMSNormQuantPattern):
-
-    def __init__(self,
-                 epsilon: float,
-                 quant_dtype: torch.dtype,
-                 group_shape: GroupShape = GroupShape.PER_TOKEN,
-                 symmetric=True):
+    def __init__(
+        self,
+        epsilon: float,
+        quant_dtype: torch.dtype,
+        group_shape: GroupShape = GroupShape.PER_TOKEN,
+        symmetric=True,
+    ):
         scale = ScaleDesc(torch.float32, False, group_shape)
-        key = FusedRMSQuantKey(fused_add=False,
-                               quant=QuantKey(dtype=quant_dtype,
-                                              scale=scale,
-                                              symmetric=symmetric))
+        key = FusedRMSQuantKey(
+            fused_add=False,
+            quant=QuantKey(dtype=quant_dtype, scale=scale, symmetric=symmetric),
+        )
         super().__init__(epsilon, key)
 
     def register(self, pm_pass: PatternMatcherPass):
-
-        def pattern(result: torch.Tensor, result_rms: torch.Tensor,
-                    input: torch.Tensor, weight: torch.Tensor,
-                    scale: torch.Tensor):
-            at1 = auto_functionalized(RMS_OP,
-                                      result=result_rms,
-                                      input=input,
-                                      weight=weight,
-                                      epsilon=self.epsilon)
-            at2 = auto_functionalized(self.QUANT_OP,
-                                      result=result,
-                                      input=at1[1],
-                                      scale=scale,
-                                      scale_ub=None)
+        def pattern(
+            result: torch.Tensor,
+            result_rms: torch.Tensor,
+            input: torch.Tensor,
+            weight: torch.Tensor,
+            scale: torch.Tensor,
+        ):
+            at1 = auto_functionalized(
+                RMS_OP,
+                result=result_rms,
+                input=input,
+                weight=weight,
+                epsilon=self.epsilon,
+            )
+            at2 = auto_functionalized(
+                self.QUANT_OP, result=result, input=at1[1], scale=scale, scale_ub=None
+            )
 
             # result, scale
             return at2[1], at2[2]
 
-        def replacement(result: torch.Tensor, result_rms: torch.Tensor,
-                        input: torch.Tensor, weight: torch.Tensor,
-                        scale: torch.Tensor):
-            at = auto_functionalized(self.FUSED_OP,
-                                     result=result,
-                                     input=input,
-                                     weight=weight,
-                                     scale=scale,
-                                     epsilon=self.epsilon,
-                                     scale_ub=None,
-                                     residual=None)
+        def replacement(
+            result: torch.Tensor,
+            result_rms: torch.Tensor,
+            input: torch.Tensor,
+            weight: torch.Tensor,
+            scale: torch.Tensor,
+        ):
+            at = auto_functionalized(
+                self.FUSED_OP,
+                result=result,
+                input=input,
+                weight=weight,
+                scale=scale,
+                epsilon=self.epsilon,
+                scale_ub=None,
+                residual=None,
+            )
 
             # result, scale
             return at[1], at[2]
@@ -261,7 +295,7 @@ def replacement(result: torch.Tensor, result_rms: torch.Tensor,
             empty_bf16(5, 4),  # result_rms
             empty_bf16(5, 4),  # input
             empty_bf16(1, 5),  # weight
-            empty_fp32(1, 1)  # scale
+            empty_fp32(1, 1),  # scale
         ]
 
         pm.register_replacement(
@@ -274,49 +308,59 @@ def replacement(result: torch.Tensor, result_rms: torch.Tensor,
 
 
 class FusedAddRMSNormDynamicQuantPattern(RMSNormQuantPattern):
-
-    def __init__(self,
-                 epsilon: float,
-                 quant_dtype: torch.dtype,
-                 group_shape: GroupShape = GroupShape.PER_TOKEN,
-                 symmetric=True):
+    def __init__(
+        self,
+        epsilon: float,
+        quant_dtype: torch.dtype,
+        group_shape: GroupShape = GroupShape.PER_TOKEN,
+        symmetric=True,
+    ):
         scale = ScaleDesc(torch.float32, False, group_shape)
-        key = FusedRMSQuantKey(fused_add=True,
-                               quant=QuantKey(dtype=quant_dtype,
-                                              scale=scale,
-                                              symmetric=symmetric))
+        key = FusedRMSQuantKey(
+            fused_add=True,
+            quant=QuantKey(dtype=quant_dtype, scale=scale, symmetric=symmetric),
+        )
         super().__init__(epsilon, key)
 
     def register(self, pm_pass: PatternMatcherPass):
-
-        def pattern(result: torch.Tensor, input: torch.Tensor,
-                    residual: torch.Tensor, weight: torch.Tensor,
-                    scale: torch.Tensor):
-            at = auto_functionalized(RMS_ADD_OP,
-                                     input=input,
-                                     residual=residual,
-                                     weight=weight,
-                                     epsilon=self.epsilon)
-            at1 = auto_functionalized(self.QUANT_OP,
-                                      result=result,
-                                      input=at[1],
-                                      scale=scale,
-                                      scale_ub=None)
+        def pattern(
+            result: torch.Tensor,
+            input: torch.Tensor,
+            residual: torch.Tensor,
+            weight: torch.Tensor,
+            scale: torch.Tensor,
+        ):
+            at = auto_functionalized(
+                RMS_ADD_OP,
+                input=input,
+                residual=residual,
+                weight=weight,
+                epsilon=self.epsilon,
+            )
+            at1 = auto_functionalized(
+                self.QUANT_OP, result=result, input=at[1], scale=scale, scale_ub=None
+            )
 
             # result, residual, scale
             return at1[1], at[2], at1[2]
 
-        def replacement(result: torch.Tensor, input: torch.Tensor,
-                        residual: torch.Tensor, weight: torch.Tensor,
-                        scale: torch.Tensor):
-            at = auto_functionalized(self.FUSED_OP,
-                                     result=result,
-                                     input=input,
-                                     weight=weight,
-                                     scale=scale,
-                                     epsilon=self.epsilon,
-                                     scale_ub=None,
-                                     residual=residual)
+        def replacement(
+            result: torch.Tensor,
+            input: torch.Tensor,
+            residual: torch.Tensor,
+            weight: torch.Tensor,
+            scale: torch.Tensor,
+        ):
+            at = auto_functionalized(
+                self.FUSED_OP,
+                result=result,
+                input=input,
+                weight=weight,
+                scale=scale,
+                epsilon=self.epsilon,
+                scale_ub=None,
+                residual=residual,
+            )
 
             # result, residual, scale
             return at[1], at[3], at[2]
@@ -326,7 +370,7 @@ def replacement(result: torch.Tensor, input: torch.Tensor,
             empty_bf16(5, 4),  # input
             empty_bf16(5, 4),  # residual
             empty_bf16(1, 5),  # weight
-            empty_fp32(1, 1)  # scale
+            empty_fp32(1, 1),  # scale
         ]
 
         pm.register_replacement(
@@ -349,24 +393,25 @@ def __init__(self, config: VllmConfig):
         super().__init__(config)
 
         self.patterns: PatternMatcherPass = PatternMatcherPass(
-            pass_name="rmsnorm_quant_fusion_pass")
+            pass_name="rmsnorm_quant_fusion_pass"
+        )
 
         for epsilon in [1e-5, 1e-6]:
             # Fuse rms_norm + static fp8 quant
-            RMSNormStaticQuantPattern(epsilon,
-                                      FP8_DTYPE).register(self.patterns)
+            RMSNormStaticQuantPattern(epsilon, FP8_DTYPE).register(self.patterns)
 
             # Fuse fused_add_rms_norm + static fp8 quant
             FusedAddRMSNormStaticQuantPattern(epsilon, FP8_DTYPE).register(
-                self.patterns)
+                self.patterns
+            )
 
             # Fuse rms_norm + dynamic per-token fp8 quant
-            RMSNormDynamicQuantPattern(epsilon,
-                                       FP8_DTYPE).register(self.patterns)
+            RMSNormDynamicQuantPattern(epsilon, FP8_DTYPE).register(self.patterns)
 
             # Fuse fused_add_rms_norm + dynamic per-token fp8 quant
             FusedAddRMSNormDynamicQuantPattern(epsilon, FP8_DTYPE).register(
-                self.patterns)
+                self.patterns
+            )
 
         self.dump_patterns(config, self.patterns)
 
@@ -376,8 +421,11 @@ def __call__(self, graph: fx.Graph):
         logger.debug("Replaced %s patterns", self.matched_count)
 
     def uuid(self) -> Any:
-        return self.hash_source(self, RMSNormQuantPattern,
-                                RMSNormStaticQuantPattern,
-                                RMSNormDynamicQuantPattern,
-                                FusedAddRMSNormStaticQuantPattern,
-                                FusedAddRMSNormDynamicQuantPattern)
+        return self.hash_source(
+            self,
+            RMSNormQuantPattern,
+            RMSNormStaticQuantPattern,
+            RMSNormDynamicQuantPattern,
+            FusedAddRMSNormStaticQuantPattern,
+            FusedAddRMSNormDynamicQuantPattern,
+        )
diff --git a/vllm/compilation/fusion_attn.py b/vllm/compilation/fusion_attn.py
index 2c6cf8f12fdc..ae36cef92653 100644
--- a/vllm/compilation/fusion_attn.py
+++ b/vllm/compilation/fusion_attn.py
@@ -12,7 +12,10 @@
 from vllm.config import VllmConfig, get_layers_from_vllm_config
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    QuantKey, kNvfp4Quant, kStaticTensorScale)
+    QuantKey,
+    kNvfp4Quant,
+    kStaticTensorScale,
+)
 from vllm.platforms import current_platform
 from vllm.utils import round_up
 
@@ -49,21 +52,21 @@ def __init__(
         self.quant_dtype = quant_key.dtype
         self.dtype = dtype
 
-        assert self.quant_key in QUANT_OPS, \
+        assert self.quant_key in QUANT_OPS, (
             f"unsupported quantization scheme {self.quant_key}"
+        )
         self.QUANT_OP = QUANT_OPS[self.quant_key]
 
     def empty(self, *args, **kwargs):
-        kwargs = {'dtype': self.dtype, 'device': "cuda", **kwargs}
+        kwargs = {"dtype": self.dtype, "device": "cuda", **kwargs}
         return torch.empty(*args, **kwargs)
 
     def empty_quant(self, *args, **kwargs):
-        kwargs = {'dtype': self.quant_dtype, 'device': "cuda", **kwargs}
+        kwargs = {"dtype": self.quant_dtype, "device": "cuda", **kwargs}
         return torch.empty(*args, **kwargs)
 
     @staticmethod
     def wrap_trace_fn(process_fx, trace_fn):
-
         def wrapped(*args, **kwargs):
             return process_fx(trace_fn(*args, **kwargs))
 
@@ -72,6 +75,7 @@ def wrapped(*args, **kwargs):
     @staticmethod
     def fx_view_to_reshape(gm: torch.fx.GraphModule):
         from torch._inductor.fx_passes.post_grad import view_to_reshape
+
         view_to_reshape(gm)
         return gm
 
@@ -100,70 +104,85 @@ def __init__(
         dtype: torch.dtype,
         symmetric: bool = True,
     ):
-        quant_key = QuantKey(dtype=FP8_DTYPE,
-                             scale=kStaticTensorScale,
-                             symmetric=symmetric)
+        quant_key = QuantKey(
+            dtype=FP8_DTYPE, scale=kStaticTensorScale, symmetric=symmetric
+        )
         super().__init__(layer, quant_key, dtype)
 
     def _register(self, pm_pass: PatternMatcherPass):
-
-        def pattern(q: torch.Tensor, k: torch.Tensor, v: torch.Tensor,
-                    output_attn: torch.Tensor, output_quant: torch.Tensor,
-                    scale: torch.Tensor):
-            at1 = auto_functionalized(ATTN_OP,
-                                      query=q,
-                                      key=k,
-                                      value=v,
-                                      output=output_attn,
-                                      layer_name=self.layer_name,
-                                      output_scale=None,
-                                      output_block_scale=None)
+        def pattern(
+            q: torch.Tensor,
+            k: torch.Tensor,
+            v: torch.Tensor,
+            output_attn: torch.Tensor,
+            output_quant: torch.Tensor,
+            scale: torch.Tensor,
+        ):
+            at1 = auto_functionalized(
+                ATTN_OP,
+                query=q,
+                key=k,
+                value=v,
+                output=output_attn,
+                layer_name=self.layer_name,
+                output_scale=None,
+                output_block_scale=None,
+            )
             attn_out_view = RESHAPE_OP(
-                at1[1], [q.shape[0], self.num_heads * self.head_size])
-            at2 = auto_functionalized(self.QUANT_OP,
-                                      result=output_quant,
-                                      input=attn_out_view,
-                                      scale=scale)
+                at1[1], [q.shape[0], self.num_heads * self.head_size]
+            )
+            at2 = auto_functionalized(
+                self.QUANT_OP, result=output_quant, input=attn_out_view, scale=scale
+            )
             return at2[1]
 
-        def replacement(q: torch.Tensor, k: torch.Tensor, v: torch.Tensor,
-                        output_attn: torch.Tensor, output_quant: torch.Tensor,
-                        scale: torch.Tensor):
+        def replacement(
+            q: torch.Tensor,
+            k: torch.Tensor,
+            v: torch.Tensor,
+            output_attn: torch.Tensor,
+            output_quant: torch.Tensor,
+            scale: torch.Tensor,
+        ):
             # attn output in quant_dtype
             output_attn = torch.ops.aten.full.default(
                 [q.shape[0], self.num_heads, self.head_size],
                 0.0,
                 dtype=self.quant_dtype,
-                device=q.device)
-            at1 = auto_functionalized(ATTN_OP,
-                                      query=q,
-                                      key=k,
-                                      value=v,
-                                      output=output_attn,
-                                      layer_name=self.layer_name,
-                                      output_scale=scale,
-                                      output_block_scale=None)
+                device=q.device,
+            )
+            at1 = auto_functionalized(
+                ATTN_OP,
+                query=q,
+                key=k,
+                value=v,
+                output=output_attn,
+                layer_name=self.layer_name,
+                output_scale=scale,
+                output_block_scale=None,
+            )
             return RESHAPE_OP(at1[1], [-1, self.num_heads * self.head_size])
 
         inputs = [
-            self.empty(5, self.num_heads, self.head_size,
-                       dtype=self.dtype),  # q
-            self.empty(5, self.num_heads, self.head_size,
-                       dtype=self.dtype),  # k
-            self.empty(5, self.num_heads, self.head_size,
-                       dtype=self.dtype),  # v
-            self.empty(5, self.num_heads, self.head_size,
-                       dtype=self.dtype),  # attn_output
-            self.empty_quant(5,
-                             self.num_heads * self.head_size),  # quant_output
-            empty_fp32(1, 1)  # scale
+            self.empty(5, self.num_heads, self.head_size, dtype=self.dtype),  # q
+            self.empty(5, self.num_heads, self.head_size, dtype=self.dtype),  # k
+            self.empty(5, self.num_heads, self.head_size, dtype=self.dtype),  # v
+            self.empty(
+                5, self.num_heads, self.head_size, dtype=self.dtype
+            ),  # attn_output
+            self.empty_quant(5, self.num_heads * self.head_size),  # quant_output
+            empty_fp32(1, 1),  # scale
         ]
 
         pm.register_replacement(
-            pattern, replacement, inputs,
+            pattern,
+            replacement,
+            inputs,
             AttentionQuantPattern.wrap_trace_fn(
-                AttentionQuantPattern.fx_view_to_reshape, pm.fwd_only),
-            pm_pass)
+                AttentionQuantPattern.fx_view_to_reshape, pm.fwd_only
+            ),
+            pm_pass,
+        )
 
 
 class AttentionNvfp4QuantPattern(AttentionQuantPattern):
@@ -180,50 +199,67 @@ def __init__(self, layer: Attention, dtype: torch.dtype):
         super().__init__(layer, kNvfp4Quant, dtype)
 
     def _register(self, pm_pass: PatternMatcherPass):
-
-        def pattern(q: torch.Tensor, k: torch.Tensor, v: torch.Tensor,
-                    output_attn: torch.Tensor, output_quant: torch.Tensor,
-                    output_scale: torch.Tensor, input_scale: torch.Tensor):
-            at1 = auto_functionalized(ATTN_OP,
-                                      query=q,
-                                      key=k,
-                                      value=v,
-                                      output=output_attn,
-                                      layer_name=self.layer_name,
-                                      output_scale=None,
-                                      output_block_scale=None)
+        def pattern(
+            q: torch.Tensor,
+            k: torch.Tensor,
+            v: torch.Tensor,
+            output_attn: torch.Tensor,
+            output_quant: torch.Tensor,
+            output_scale: torch.Tensor,
+            input_scale: torch.Tensor,
+        ):
+            at1 = auto_functionalized(
+                ATTN_OP,
+                query=q,
+                key=k,
+                value=v,
+                output=output_attn,
+                layer_name=self.layer_name,
+                output_scale=None,
+                output_block_scale=None,
+            )
             attn_out_view = RESHAPE_OP(
-                at1[1], [q.shape[0], self.num_heads * self.head_size])
-            at2 = auto_functionalized(self.QUANT_OP,
-                                      output=output_quant,
-                                      input=attn_out_view,
-                                      output_scale=output_scale,
-                                      input_scale=input_scale)
+                at1[1], [q.shape[0], self.num_heads * self.head_size]
+            )
+            at2 = auto_functionalized(
+                self.QUANT_OP,
+                output=output_quant,
+                input=attn_out_view,
+                output_scale=output_scale,
+                input_scale=input_scale,
+            )
             output_scale_view = torch.ops.aten.view.dtype(at2[2], FP8_DTYPE)
             return at2[1], output_scale_view
 
-        def replacement(q: torch.Tensor, k: torch.Tensor, v: torch.Tensor,
-                        output_attn: torch.Tensor, output_quant: torch.Tensor,
-                        output_scale: torch.Tensor, input_scale: torch.Tensor):
+        def replacement(
+            q: torch.Tensor,
+            k: torch.Tensor,
+            v: torch.Tensor,
+            output_attn: torch.Tensor,
+            output_quant: torch.Tensor,
+            output_scale: torch.Tensor,
+            input_scale: torch.Tensor,
+        ):
             # attention output in quant_dtype
             output_attn = torch.ops.aten.full.default(
                 [q.shape[0], self.num_heads, self.head_size // 2],
                 0.0,
                 dtype=self.quant_dtype,
-                device=q.device)
+                device=q.device,
+            )
             # attention output block scale
-            output_scale_view = torch.ops.aten.view.dtype(
-                output_scale, FP8_DTYPE)
-            at2 = auto_functionalized(ATTN_OP,
-                                      query=q,
-                                      key=k,
-                                      value=v,
-                                      output=output_attn,
-                                      layer_name=self.layer_name,
-                                      output_scale=input_scale,
-                                      output_block_scale=output_scale_view)
-            output = RESHAPE_OP(at2[1],
-                                [-1, self.num_heads * self.head_size // 2])
+            output_scale_view = torch.ops.aten.view.dtype(output_scale, FP8_DTYPE)
+            at2 = auto_functionalized(
+                ATTN_OP,
+                query=q,
+                key=k,
+                value=v,
+                output=output_attn,
+                layer_name=self.layer_name,
+                output_scale=input_scale,
+                output_block_scale=output_scale_view,
+            )
+            output = RESHAPE_OP(at2[1], [-1, self.num_heads * self.head_size // 2])
             return output, at2[2]
 
         inputs = [
@@ -231,18 +267,22 @@ def replacement(q: torch.Tensor, k: torch.Tensor, v: torch.Tensor,
             empty_bf16(5, self.num_heads, self.head_size),  # k
             empty_bf16(5, self.num_heads, self.head_size),  # v
             empty_bf16(5, self.num_heads, self.head_size),  # output_attn
-            self.empty_quant(5, self.num_heads * self.head_size //
-                             2),  # output_quant
-            empty_i32(128, round_up(self.num_heads * self.head_size // 16,
-                                    4)),  # output_scale
+            self.empty_quant(5, self.num_heads * self.head_size // 2),  # output_quant
+            empty_i32(
+                128, round_up(self.num_heads * self.head_size // 16, 4)
+            ),  # output_scale
             empty_fp32(1, 1),  # input_scale
         ]
 
         pm.register_replacement(
-            pattern, replacement, inputs,
+            pattern,
+            replacement,
+            inputs,
             AttentionQuantPattern.wrap_trace_fn(
-                AttentionQuantPattern.fx_view_to_reshape, pm.fwd_only),
-            pm_pass)
+                AttentionQuantPattern.fx_view_to_reshape, pm.fwd_only
+            ),
+            pm_pass,
+        )
 
 
 class AttnFusionPass(VllmPatternMatcherPass):
@@ -267,20 +307,22 @@ def __init__(self, config: VllmConfig):
         attn_layers = get_layers_from_vllm_config(config, Attention)
         for layer_name, layer in attn_layers.items():
             pattern_fp8 = AttentionFp8StaticQuantPattern(
-                layer, config.model_config.dtype)
+                layer, config.model_config.dtype
+            )
             pattern_fp8.register_if_supported(self.patterns)
 
-            if current_platform.is_cuda() and hasattr(torch.ops._C,
-                                                      "scaled_fp4_quant"):
+            if current_platform.is_cuda() and hasattr(torch.ops._C, "scaled_fp4_quant"):
                 pattern_nvfp4 = AttentionNvfp4QuantPattern(
-                    layer, config.model_config.dtype)
+                    layer, config.model_config.dtype
+                )
                 pattern_nvfp4.register_if_supported(self.patterns)
 
         if len(attn_layers) == 0:
             logger.warning(
                 "Attention + quant fusion is enabled, but no attention layers "
                 "were found in CompilationConfig.static_forward_context "
-                "so no fusion patterns were registered.")
+                "so no fusion patterns were registered."
+            )
 
         self.dump_patterns(config, self.patterns)
 
@@ -290,6 +332,9 @@ def __call__(self, graph: torch.fx.graph.Graph) -> None:
         logger.debug("Fused quant onto %s attention nodes", self.matched_count)
 
     def uuid(self):
-        return VllmInductorPass.hash_source(self, AttentionQuantPattern,
-                                            AttentionFp8StaticQuantPattern,
-                                            AttentionNvfp4QuantPattern)
+        return VllmInductorPass.hash_source(
+            self,
+            AttentionQuantPattern,
+            AttentionFp8StaticQuantPattern,
+            AttentionNvfp4QuantPattern,
+        )
diff --git a/vllm/compilation/fx_utils.py b/vllm/compilation/fx_utils.py
index 2db8b5441bd6..114b53c74c48 100644
--- a/vllm/compilation/fx_utils.py
+++ b/vllm/compilation/fx_utils.py
@@ -19,8 +19,9 @@ def is_auto_func(node: fx.Node, op: OpOverload) -> bool:
 
 
 # Returns the first specified node with the given op (if it exists)
-def find_specified_fn_maybe(nodes: Iterable[fx.Node],
-                            op: OpOverload) -> Optional[fx.Node]:
+def find_specified_fn_maybe(
+    nodes: Iterable[fx.Node], op: OpOverload
+) -> Optional[fx.Node]:
     for node in nodes:
         if node.target == op:
             return node
@@ -35,8 +36,7 @@ def find_specified_fn(nodes: Iterable[fx.Node], op: OpOverload) -> fx.Node:
 
 
 # Returns the first auto_functionalized node with the given op (if it exists)
-def find_auto_fn_maybe(nodes: Iterable[fx.Node],
-                       op: OpOverload) -> Optional[fx.Node]:
+def find_auto_fn_maybe(nodes: Iterable[fx.Node], op: OpOverload) -> Optional[fx.Node]:
     for node in nodes:
         if is_func(node, auto_functionalized) and node.args[0] == op:  # noqa
             return node
diff --git a/vllm/compilation/inductor_pass.py b/vllm/compilation/inductor_pass.py
index e1b691df385d..70392c5ac972 100644
--- a/vllm/compilation/inductor_pass.py
+++ b/vllm/compilation/inductor_pass.py
@@ -11,8 +11,7 @@
 
 import torch
 from torch import fx
-from torch._subclasses.fake_tensor import (FakeTensorMode,
-                                           unset_fake_temporarily)
+from torch._subclasses.fake_tensor import FakeTensorMode, unset_fake_temporarily
 
 from vllm.utils import is_torch_equal_or_newer
 
@@ -21,13 +20,13 @@
 else:
     # CustomGraphPass is not present in 2.5 or lower, import our version
     from .torch25_custom_graph_pass import (  # noqa: E501
-        Torch25CustomGraphPass as CustomGraphPass)
+        Torch25CustomGraphPass as CustomGraphPass,
+    )
 
 _pass_context = None
 
 
 class PassContext:
-
     def __init__(self, runtime_shape: Optional[int]):
         self.runtime_shape = runtime_shape
 
@@ -106,9 +105,9 @@ class CallableInductorPass(InductorPass):
     implementation of the UUID.
     """
 
-    def __init__(self,
-                 callable: Callable[[fx.Graph], None],
-                 uuid: Optional[Any] = None):
+    def __init__(
+        self, callable: Callable[[fx.Graph], None], uuid: Optional[Any] = None
+    ):
         self.callable = callable
         self._uuid = self.hash_source(callable) if uuid is None else uuid
 
@@ -127,8 +126,7 @@ def enable_fake_mode(fn: Callable[..., Any]) -> Callable[..., Any]:
 
     @functools.wraps(fn)
     def fn_new(*args, **kwargs) -> Any:
-        with torch._guards.tracing(
-                None), unset_fake_temporarily(), FakeTensorMode():
+        with torch._guards.tracing(None), unset_fake_temporarily(), FakeTensorMode():
             result = fn(*args, **kwargs)
 
         return result
diff --git a/vllm/compilation/monitor.py b/vllm/compilation/monitor.py
index 35658466d66d..d3c437795fab 100644
--- a/vllm/compilation/monitor.py
+++ b/vllm/compilation/monitor.py
@@ -20,6 +20,7 @@ def start_monitoring_torch_compile(vllm_config: VllmConfig):
     path = vllm_config.compile_debug_dump_path()
     if compilation_config.level == CompilationLevel.PIECEWISE and path:
         import depyf
+
         path.mkdir(parents=True, exist_ok=True)
         global context_manager
         context_manager = depyf.prepare_debug(path.as_posix())
@@ -29,8 +30,9 @@ def start_monitoring_torch_compile(vllm_config: VllmConfig):
 def end_monitoring_torch_compile(vllm_config: VllmConfig):
     compilation_config: CompilationConfig = vllm_config.compilation_config
     if compilation_config.level == CompilationLevel.PIECEWISE:
-        logger.info("torch.compile takes %.2f s in total",
-                    compilation_config.compilation_time)
+        logger.info(
+            "torch.compile takes %.2f s in total", compilation_config.compilation_time
+        )
         global context_manager
         if context_manager is not None:
             context_manager.__exit__(None, None, None)
@@ -46,8 +48,10 @@ def validate_cudagraph_capturing_enabled():
     # if an illegal cudagraph capturing happens, raise an error.
     global cudagraph_capturing_enabled
     if not cudagraph_capturing_enabled:
-        raise RuntimeError("CUDA graph capturing detected at an inappropriate "
-                           "time. This operation is currently disabled.")
+        raise RuntimeError(
+            "CUDA graph capturing detected at an inappropriate "
+            "time. This operation is currently disabled."
+        )
 
 
 def set_cudagraph_capturing_enabled(enabled: bool):
diff --git a/vllm/compilation/noop_elimination.py b/vllm/compilation/noop_elimination.py
index 2c453daf873d..3d807ab3a6de 100644
--- a/vllm/compilation/noop_elimination.py
+++ b/vllm/compilation/noop_elimination.py
@@ -122,8 +122,9 @@ def __call__(self, graph: torch.fx.Graph):
         logger.debug("Removed %s no-op reshapes and slices", count)
 
     # ---------------------- Reshape helpers ----------------------
-    def reshape_dims_equivalent(self, dim: Union[int, torch.fx.Node],
-                                i_dim: Union[int, SymInt]) -> bool:
+    def reshape_dims_equivalent(
+        self, dim: Union[int, torch.fx.Node], i_dim: Union[int, SymInt]
+    ) -> bool:
         """
         This function checks if two dimensions are equivalent.
         :param dim: The dimension arg to reshape/slice
@@ -153,6 +154,4 @@ def reshape_all_dims_equivalent(
         dims: Iterable[Union[int, torch.fx.Node]],
         i_dims: Iterable[Union[int, SymInt]],
     ) -> bool:
-        return all(
-            self.reshape_dims_equivalent(s, i_s)
-            for s, i_s in zip(dims, i_dims))
+        return all(self.reshape_dims_equivalent(s, i_s) for s, i_s in zip(dims, i_dims))
diff --git a/vllm/compilation/piecewise_backend.py b/vllm/compilation/piecewise_backend.py
index ae26e9f1bf2b..61551766a1c5 100644
--- a/vllm/compilation/piecewise_backend.py
+++ b/vllm/compilation/piecewise_backend.py
@@ -23,15 +23,19 @@ class ConcreteSizeEntry:
 
 
 class PiecewiseBackend:
-
-    def __init__(self, graph: fx.GraphModule, vllm_config: VllmConfig,
-                 piecewise_compile_index: int, total_piecewise_compiles: int,
-                 sym_shape_indices: list[int],
-                 compiled_graph_for_general_shape: Callable,
-                 vllm_backend: VllmBackend):
+    def __init__(
+        self,
+        graph: fx.GraphModule,
+        vllm_config: VllmConfig,
+        piecewise_compile_index: int,
+        total_piecewise_compiles: int,
+        sym_shape_indices: list[int],
+        compiled_graph_for_general_shape: Callable,
+        vllm_backend: VllmBackend,
+    ):
         """
         The backend for piecewise compilation.
-        It mainly handles the compilation of static shapes and 
+        It mainly handles the compilation of static shapes and
         dispatching based on runtime shape.
 
         We will compile `self.graph` once for the general shape,
@@ -46,13 +50,11 @@ def __init__(self, graph: fx.GraphModule, vllm_config: VllmConfig,
         self.vllm_backend = vllm_backend
 
         self.is_first_graph = piecewise_compile_index == 0
-        self.is_last_graph = (
-            piecewise_compile_index == total_piecewise_compiles - 1)
+        self.is_last_graph = piecewise_compile_index == total_piecewise_compiles - 1
 
         self.is_full_graph = total_piecewise_compiles == 1
 
-        self.compile_sizes: set[int] = set(
-            self.compilation_config.compile_sizes)
+        self.compile_sizes: set[int] = set(self.compilation_config.compile_sizes)
 
         self.first_run_finished = False
 
@@ -108,7 +110,8 @@ def __call__(self, *args) -> Any:
                 self.compilation_config,
                 graph_index=self.piecewise_compile_index,
                 num_graphs=self.total_piecewise_compiles,
-                runtime_shape=runtime_shape)
+                runtime_shape=runtime_shape,
+            )
 
             # finished compilations for all required shapes
             if self.is_last_graph and not self.to_be_compiled_sizes:
diff --git a/vllm/compilation/post_cleanup.py b/vllm/compilation/post_cleanup.py
index 6a31f3935da7..55117516838c 100644
--- a/vllm/compilation/post_cleanup.py
+++ b/vllm/compilation/post_cleanup.py
@@ -16,5 +16,6 @@ class PostCleanupPass(VllmInductorPass):
     @VllmInductorPass.time_and_log
     def __call__(self, graph: fx.Graph) -> None:
         from torch._inductor.pattern_matcher import stable_topological_sort
+
         stable_topological_sort(graph)
         graph.eliminate_dead_code()
diff --git a/vllm/compilation/sequence_parallelism.py b/vllm/compilation/sequence_parallelism.py
index a6ca50c925a2..2bc705c3b9a9 100644
--- a/vllm/compilation/sequence_parallelism.py
+++ b/vllm/compilation/sequence_parallelism.py
@@ -9,8 +9,7 @@
 
 from vllm.config import VllmConfig
 from vllm.distributed import get_tp_group, tensor_model_parallel_all_reduce
-from vllm.distributed.parallel_state import (
-    get_tensor_model_parallel_world_size)
+from vllm.distributed.parallel_state import get_tensor_model_parallel_world_size
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 
@@ -23,12 +22,14 @@
 class _RMSNormAndQuantOpHelper:
     """Base helper for RMSNorm and RMSNorm + Quantization functionalization."""
 
-    def __init__(self,
-                 epsilon: float,
-                 dtype: torch.dtype,
-                 device: str,
-                 quant_op: Optional[torch._ops.OpOverload] = None,
-                 **kwargs):
+    def __init__(
+        self,
+        epsilon: float,
+        dtype: torch.dtype,
+        device: str,
+        quant_op: Optional[torch._ops.OpOverload] = None,
+        **kwargs,
+    ):
         self.epsilon = epsilon
         self.dtype = dtype
         self.device = device
@@ -40,60 +41,78 @@ def _functional_rmsnorm(self, result_buffer, input_tensor, weight_tensor):
             result=result_buffer,
             input=input_tensor,
             weight=weight_tensor,
-            epsilon=self.epsilon)
+            epsilon=self.epsilon,
+        )
 
-    def _functional_fused_add_rmsnorm(self, input_tensor, residual_tensor,
-                                      weight_tensor):
+    def _functional_fused_add_rmsnorm(
+        self, input_tensor, residual_tensor, weight_tensor
+    ):
         return torch.ops.higher_order.auto_functionalized(
             torch.ops._C.fused_add_rms_norm.default,
             input=input_tensor,
             residual=residual_tensor,
             weight=weight_tensor,
-            epsilon=self.epsilon)
-
-    def _functional_rmsnorm_then_quant(self, rmsnorm_result_buffer,
-                                       quant_result_buffer, input_tensor,
-                                       weight_tensor, scale_tensor):
+            epsilon=self.epsilon,
+        )
+
+    def _functional_rmsnorm_then_quant(
+        self,
+        rmsnorm_result_buffer,
+        quant_result_buffer,
+        input_tensor,
+        weight_tensor,
+        scale_tensor,
+    ):
         if self.quant_op is None:
             raise RuntimeError(
                 "_RMSNormAndQuantOpHelper was not initialized with a quant_op."
             )
-        rmsnorm_out_tuple = self._functional_rmsnorm(rmsnorm_result_buffer,
-                                                     input_tensor,
-                                                     weight_tensor)
+        rmsnorm_out_tuple = self._functional_rmsnorm(
+            rmsnorm_result_buffer, input_tensor, weight_tensor
+        )
         quant_out_tuple = torch.ops.higher_order.auto_functionalized(
             self.quant_op,
             result=quant_result_buffer,
             input=rmsnorm_out_tuple[1],
-            scale=scale_tensor)
+            scale=scale_tensor,
+        )
         return quant_out_tuple
 
-    def _functional_fused_add_rmsnorm_then_quant(self, quant_result_buffer,
-                                                 input_tensor, residual_tensor,
-                                                 weight_tensor, scale_tensor):
+    def _functional_fused_add_rmsnorm_then_quant(
+        self,
+        quant_result_buffer,
+        input_tensor,
+        residual_tensor,
+        weight_tensor,
+        scale_tensor,
+    ):
         if self.quant_op is None:
             raise RuntimeError(
                 "_RMSNormAndQuantOpHelper was not initialized with a quant_op."
             )
         fused_add_rmsnorm_out_tuple = self._functional_fused_add_rmsnorm(
-            input_tensor, residual_tensor, weight_tensor)
+            input_tensor, residual_tensor, weight_tensor
+        )
         quant_out_tuple = torch.ops.higher_order.auto_functionalized(
             self.quant_op,
             result=quant_result_buffer,
             input=fused_add_rmsnorm_out_tuple[1],
-            scale=scale_tensor)
+            scale=scale_tensor,
+        )
         return quant_out_tuple, fused_add_rmsnorm_out_tuple[2]
 
 
 class _SequenceParallelPatternHelper(_RMSNormAndQuantOpHelper):
     """Helper for sequence parallelism patterns."""
 
-    def __init__(self,
-                 epsilon: float,
-                 dtype: torch.dtype,
-                 device: str,
-                 quant_op: Optional[torch._ops.OpOverload] = None,
-                 **kwargs):
+    def __init__(
+        self,
+        epsilon: float,
+        dtype: torch.dtype,
+        device: str,
+        quant_op: Optional[torch._ops.OpOverload] = None,
+        **kwargs,
+    ):
         super().__init__(epsilon, dtype, device, quant_op=quant_op, **kwargs)
         self.tp_group = get_tp_group()
         self.tp_size = get_tensor_model_parallel_world_size()
@@ -103,21 +122,16 @@ def _all_reduce(self, x: torch.Tensor) -> torch.Tensor:
 
     def _reduce_scatter(self, x: torch.Tensor) -> torch.Tensor:
         return torch.ops.vllm.reduce_scatter.default(
-            x,
-            dim=0,
-            world_size=self.tp_size,
-            group_name=self.tp_group.unique_name)
+            x, dim=0, world_size=self.tp_size, group_name=self.tp_group.unique_name
+        )
 
     def _all_gather(self, x: torch.Tensor) -> torch.Tensor:
         return torch.ops.vllm.all_gather.default(
-            x,
-            dim=0,
-            world_size=self.tp_size,
-            group_name=self.tp_group.unique_name)
+            x, dim=0, world_size=self.tp_size, group_name=self.tp_group.unique_name
+        )
 
 
 class FirstAllReduceRMSNormPattern(_SequenceParallelPatternHelper):
-
     def get_inputs(self):
         input = torch.empty([1, 8, 4], device=self.device, dtype=self.dtype)
         permute = torch.empty([1, 8, 4], device=self.device, dtype=self.dtype)
@@ -126,7 +140,6 @@ def get_inputs(self):
         return [input, permute, arg3_1]
 
     def register(self, pm_pass: PatternMatcherPass):
-
         def pattern(
             input: torch.Tensor,
             permute: torch.Tensor,
@@ -145,26 +158,23 @@ def replacement(
             reduce_scatter = self._reduce_scatter(input)
 
             rmsnorm_result = torch.empty_like(reduce_scatter)
-            rmsnorm = self._functional_rmsnorm(rmsnorm_result, reduce_scatter,
-                                               arg3_1)
+            rmsnorm = self._functional_rmsnorm(rmsnorm_result, reduce_scatter, arg3_1)
 
             all_gather = self._all_gather(rmsnorm[1])
 
             return all_gather, reduce_scatter
 
-        pm.register_replacement(pattern, replacement, self.get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, self.get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class MiddleAllReduceRMSNormPattern(_SequenceParallelPatternHelper):
-
     def get_inputs(self):
         mm_1 = torch.empty([4, 4], device=self.device, dtype=self.dtype)
 
         residual = torch.empty([4, 4], device=self.device, dtype=self.dtype)
-        rms_norm_weights = torch.empty([4, 4],
-                                       device=self.device,
-                                       dtype=self.dtype)
+        rms_norm_weights = torch.empty([4, 4], device=self.device, dtype=self.dtype)
 
         return [
             residual,
@@ -173,7 +183,6 @@ def get_inputs(self):
         ]
 
     def register(self, pm_pass: PatternMatcherPass):
-
         def pattern(
             residual: torch.Tensor,
             mm_1: torch.Tensor,
@@ -181,7 +190,8 @@ def pattern(
         ) -> tuple[torch.Tensor, torch.Tensor]:
             all_reduce = self._all_reduce(mm_1)
             rmsnorm = self._functional_fused_add_rmsnorm(
-                all_reduce, residual, rms_norm_weights)
+                all_reduce, residual, rms_norm_weights
+            )
             return rmsnorm[1], rmsnorm[2]
 
         def replacement(
@@ -191,23 +201,22 @@ def replacement(
         ) -> tuple[torch.Tensor, torch.Tensor]:
             reduce_scatter = self._reduce_scatter(mm_1)
             rmsnorm = self._functional_fused_add_rmsnorm(
-                reduce_scatter, residual, rms_norm_weights)
+                reduce_scatter, residual, rms_norm_weights
+            )
             all_gather = self._all_gather(rmsnorm[1])
             return all_gather, rmsnorm[2]
 
-        pm.register_replacement(pattern, replacement, self.get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, self.get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class LastAllReduceRMSNormPattern(_SequenceParallelPatternHelper):
-
     def get_inputs(self):
         mm_1 = torch.empty([4, 4], device=self.device, dtype=self.dtype)
 
         residual = torch.empty([4, 4], device=self.device, dtype=self.dtype)
-        rms_norm_weights = torch.empty([4, 4],
-                                       device=self.device,
-                                       dtype=self.dtype)
+        rms_norm_weights = torch.empty([4, 4], device=self.device, dtype=self.dtype)
 
         return [
             residual,
@@ -216,7 +225,6 @@ def get_inputs(self):
         ]
 
     def register(self, pm_pass: PatternMatcherPass):
-
         def pattern(
             residual: torch.Tensor,
             mm_1: torch.Tensor,
@@ -224,7 +232,8 @@ def pattern(
         ) -> tuple[torch.Tensor, torch.Tensor]:
             all_reduce = self._all_reduce(mm_1)
             rmsnorm = self._functional_fused_add_rmsnorm(
-                all_reduce, residual, rms_norm_weights)
+                all_reduce, residual, rms_norm_weights
+            )
             return rmsnorm[1]
 
         def replacement(
@@ -234,37 +243,34 @@ def replacement(
         ) -> tuple[torch.Tensor, torch.Tensor]:
             reduce_scatter = self._reduce_scatter(mm_1)
             rmsnorm = self._functional_fused_add_rmsnorm(
-                reduce_scatter, residual, rms_norm_weights)
+                reduce_scatter, residual, rms_norm_weights
+            )
             normalized = self._all_gather(rmsnorm[1])
             return normalized
 
-        pm.register_replacement(pattern, replacement, self.get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, self.get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 FP8_DTYPE = current_platform.fp8_dtype()
 
 
 class FirstAllReduceRMSNormStaticFP8Pattern(_SequenceParallelPatternHelper):
-
-    def __init__(self, epsilon: float, dtype: torch.dtype, device: str,
-                 op: torch._ops.OpOverload):
+    def __init__(
+        self, epsilon: float, dtype: torch.dtype, device: str, op: torch._ops.OpOverload
+    ):
         super().__init__(epsilon, dtype, device, quant_op=op)
 
     def get_inputs(self):
         input = torch.zeros([1, 8, 4], device=self.device, dtype=self.dtype)
-        rmsnorm_result = torch.empty([1, 8, 4],
-                                     device=self.device,
-                                     dtype=self.dtype)
-        quant_result = torch.empty([1, 8, 4],
-                                   device=self.device,
-                                   dtype=FP8_DTYPE)
+        rmsnorm_result = torch.empty([1, 8, 4], device=self.device, dtype=self.dtype)
+        quant_result = torch.empty([1, 8, 4], device=self.device, dtype=FP8_DTYPE)
         weight = torch.empty([4], device=self.device, dtype=self.dtype)
         scale = torch.tensor(1.0, device=self.device, dtype=torch.float32)
         return [input, rmsnorm_result, quant_result, weight, scale]
 
     def register(self, pm_pass: PatternMatcherPass):
-
         def pattern(
             input: torch.Tensor,
             rmsnorm_result: torch.Tensor,
@@ -274,7 +280,8 @@ def pattern(
         ):
             all_reduce = self._all_reduce(input)
             static_fp8 = self._functional_rmsnorm_then_quant(
-                rmsnorm_result, quant_result, all_reduce, weight, scale)
+                rmsnorm_result, quant_result, all_reduce, weight, scale
+            )
             return static_fp8[1], all_reduce
 
         def replacement(
@@ -286,34 +293,36 @@ def replacement(
         ):
             reduce_scatter = self._reduce_scatter(input)
 
-            rmsnorm_result = torch.empty_like(reduce_scatter,
-                                              dtype=rmsnorm_result.dtype)
+            rmsnorm_result = torch.empty_like(
+                reduce_scatter, dtype=rmsnorm_result.dtype
+            )
             quant_result = torch.empty_like(
                 rmsnorm_result,  # Output of RMSNorm
-                dtype=quant_result.dtype)
+                dtype=quant_result.dtype,
+            )
             static_fp8 = self._functional_rmsnorm_then_quant(
-                rmsnorm_result, quant_result, reduce_scatter, weight, scale)
+                rmsnorm_result, quant_result, reduce_scatter, weight, scale
+            )
             all_gather = self._all_gather(static_fp8[1])
 
             return all_gather, reduce_scatter
 
-        pm.register_replacement(pattern, replacement, self.get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, self.get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class MiddleAllReduceRMSNormStaticFP8Pattern(_SequenceParallelPatternHelper):
-
-    def __init__(self, epsilon: float, dtype: torch.dtype, device: str,
-                 op: torch._ops.OpOverload):
+    def __init__(
+        self, epsilon: float, dtype: torch.dtype, device: str, op: torch._ops.OpOverload
+    ):
         super().__init__(epsilon, dtype, device, quant_op=op)
 
     def get_inputs(self):
         mm_1 = torch.empty([4, 4], device=self.device, dtype=self.dtype)
 
         residual = torch.empty([4, 4], device=self.device, dtype=self.dtype)
-        rms_norm_weights = torch.empty([4, 4],
-                                       device=self.device,
-                                       dtype=self.dtype)
+        rms_norm_weights = torch.empty([4, 4], device=self.device, dtype=self.dtype)
         result = torch.empty([4, 4], device=self.device, dtype=FP8_DTYPE)
         scale = torch.empty([1, 1], device=self.device, dtype=torch.float32)
 
@@ -326,7 +335,6 @@ def get_inputs(self):
         ]
 
     def register(self, pm_pass: PatternMatcherPass):
-
         def pattern(
             result: torch.Tensor,
             residual: torch.Tensor,
@@ -335,8 +343,11 @@ def pattern(
             scale: torch.Tensor,
         ) -> tuple[torch.Tensor, torch.Tensor]:
             all_reduce = self._all_reduce(mm_1)
-            static_fp8, rmsnorm_residual_out = self._functional_fused_add_rmsnorm_then_quant(  # noqa: E501
-                result, all_reduce, residual, rms_norm_weights, scale)
+            static_fp8, rmsnorm_residual_out = (
+                self._functional_fused_add_rmsnorm_then_quant(  # noqa: E501
+                    result, all_reduce, residual, rms_norm_weights, scale
+                )
+            )
             return static_fp8[1], rmsnorm_residual_out
 
         def replacement(
@@ -347,31 +358,31 @@ def replacement(
             scale: torch.Tensor,
         ) -> tuple[torch.Tensor, torch.Tensor]:
             reduce_scatter = self._reduce_scatter(mm_1)
-            quant_result_buf = torch.empty_like(reduce_scatter,
-                                                dtype=result.dtype)
-            static_fp8, rmsnorm_residual_out = self._functional_fused_add_rmsnorm_then_quant(  # noqa: E501
-                quant_result_buf, reduce_scatter, residual, rms_norm_weights,
-                scale)
+            quant_result_buf = torch.empty_like(reduce_scatter, dtype=result.dtype)
+            static_fp8, rmsnorm_residual_out = (
+                self._functional_fused_add_rmsnorm_then_quant(  # noqa: E501
+                    quant_result_buf, reduce_scatter, residual, rms_norm_weights, scale
+                )
+            )
             all_gather = self._all_gather(static_fp8[1])
             return all_gather, rmsnorm_residual_out
 
-        pm.register_replacement(pattern, replacement, self.get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, self.get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class LastAllReduceRMSNormStaticFP8Pattern(_SequenceParallelPatternHelper):
-
-    def __init__(self, epsilon: float, dtype: torch.dtype, device: str,
-                 op: torch._ops.OpOverload):
+    def __init__(
+        self, epsilon: float, dtype: torch.dtype, device: str, op: torch._ops.OpOverload
+    ):
         super().__init__(epsilon, dtype, device, quant_op=op)
 
     def get_inputs(self):
         mm_1 = torch.empty([4, 4], device=self.device, dtype=self.dtype)
 
         residual = torch.empty([4, 4], device=self.device, dtype=self.dtype)
-        rms_norm_weights = torch.empty([4, 4],
-                                       device=self.device,
-                                       dtype=self.dtype)
+        rms_norm_weights = torch.empty([4, 4], device=self.device, dtype=self.dtype)
         result = torch.empty([4, 4], device=self.device, dtype=FP8_DTYPE)
         scale = torch.empty([1, 1], device=self.device, dtype=torch.float32)
 
@@ -384,7 +395,6 @@ def get_inputs(self):
         ]
 
     def register(self, pm_pass: PatternMatcherPass):
-
         def pattern(
             result: torch.Tensor,
             residual: torch.Tensor,
@@ -394,7 +404,8 @@ def pattern(
         ) -> tuple[torch.Tensor, torch.Tensor]:
             all_reduce = self._all_reduce(mm_1)
             static_fp8, _ = self._functional_fused_add_rmsnorm_then_quant(
-                result, all_reduce, residual, rms_norm_weights, scale)
+                result, all_reduce, residual, rms_norm_weights, scale
+            )
             return static_fp8[1]
 
         def replacement(
@@ -405,16 +416,16 @@ def replacement(
             scale: torch.Tensor,
         ) -> tuple[torch.Tensor, torch.Tensor]:
             reduce_scatter = self._reduce_scatter(mm_1)
-            quant_result_buf = torch.empty_like(reduce_scatter,
-                                                dtype=result.dtype)
+            quant_result_buf = torch.empty_like(reduce_scatter, dtype=result.dtype)
             static_fp8, _ = self._functional_fused_add_rmsnorm_then_quant(
-                quant_result_buf, reduce_scatter, residual, rms_norm_weights,
-                scale)
+                quant_result_buf, reduce_scatter, residual, rms_norm_weights, scale
+            )
             normalized = self._all_gather(static_fp8[1])
             return normalized
 
-        pm.register_replacement(pattern, replacement, self.get_inputs(),
-                                pm.fwd_only, pm_pass)
+        pm.register_replacement(
+            pattern, replacement, self.get_inputs(), pm.fwd_only, pm_pass
+        )
 
 
 class SequenceParallelismPass(VllmPatternMatcherPass):
@@ -442,30 +453,34 @@ def __init__(self, config: VllmConfig):
         super().__init__(config)
 
         self.patterns: PatternMatcherPass = PatternMatcherPass(
-            pass_name="sequence_parallelism_pass")
+            pass_name="sequence_parallelism_pass"
+        )
 
         for epsilon in [1e-5, 1e-6]:
             # RMSNorm + Static FP8 quantization patterns
             fp8_quant_op = torch.ops._C.static_scaled_fp8_quant.default
             FirstAllReduceRMSNormStaticFP8Pattern(
-                epsilon, self.model_dtype, self.device,
-                fp8_quant_op).register(self.patterns)
+                epsilon, self.model_dtype, self.device, fp8_quant_op
+            ).register(self.patterns)
             MiddleAllReduceRMSNormStaticFP8Pattern(
-                epsilon, self.model_dtype, self.device,
-                fp8_quant_op).register(self.patterns)
+                epsilon, self.model_dtype, self.device, fp8_quant_op
+            ).register(self.patterns)
             LastAllReduceRMSNormStaticFP8Pattern(
-                epsilon, self.model_dtype, self.device,
-                fp8_quant_op).register(self.patterns)
+                epsilon, self.model_dtype, self.device, fp8_quant_op
+            ).register(self.patterns)
 
             # Normal RMSNorm patterns
-            FirstAllReduceRMSNormPattern(epsilon, self.model_dtype,
-                                         self.device).register(self.patterns)
+            FirstAllReduceRMSNormPattern(
+                epsilon, self.model_dtype, self.device
+            ).register(self.patterns)
 
-            MiddleAllReduceRMSNormPattern(epsilon, self.model_dtype,
-                                          self.device).register(self.patterns)
+            MiddleAllReduceRMSNormPattern(
+                epsilon, self.model_dtype, self.device
+            ).register(self.patterns)
 
-            LastAllReduceRMSNormPattern(epsilon, self.model_dtype,
-                                        self.device).register(self.patterns)
+            LastAllReduceRMSNormPattern(
+                epsilon, self.model_dtype, self.device
+            ).register(self.patterns)
         self.dump_patterns(config, self.patterns)
 
     def is_applicable_for_shape(self, shape: Optional[int]) -> bool:
diff --git a/vllm/compilation/torch25_custom_graph_pass.py b/vllm/compilation/torch25_custom_graph_pass.py
index cd3970657522..ea8b56cf9d6a 100644
--- a/vllm/compilation/torch25_custom_graph_pass.py
+++ b/vllm/compilation/torch25_custom_graph_pass.py
@@ -37,6 +37,8 @@ def __getstate__(self):
         return self.uuid()
 
     def __setstate__(self, state):
-        raise ValueError("Cannot unpickle CustomGraphPass because pickling"
-                         " is used for cache key uuid. Use torch>=2.6 with"
-                         " native uuid support for custom passes.")
+        raise ValueError(
+            "Cannot unpickle CustomGraphPass because pickling"
+            " is used for cache key uuid. Use torch>=2.6 with"
+            " native uuid support for custom passes."
+        )
diff --git a/vllm/compilation/vllm_inductor_pass.py b/vllm/compilation/vllm_inductor_pass.py
index 59019d74cb80..5aa08220bc2d 100644
--- a/vllm/compilation/vllm_inductor_pass.py
+++ b/vllm/compilation/vllm_inductor_pass.py
@@ -8,8 +8,7 @@
 import regex as re
 import torch
 from torch._dynamo.utils import lazy_format_graph_code
-from torch._inductor.pattern_matcher import (PatternMatcherPass,
-                                             PatternPrettyPrinter)
+from torch._inductor.pattern_matcher import PatternMatcherPass, PatternPrettyPrinter
 
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
@@ -24,20 +23,18 @@ class VllmInductorPass(InductorPass):
     An inductor pass with access to vLLM PassConfig.
     It provides timing, logging, and dumping utilities.
     """
+
     dump_prefix: ClassVar[Optional[int]] = None
     """Keep track of pass index for debug dump ordering."""
 
     def __init__(self, config: VllmConfig):
         self.pass_config = config.compilation_config.pass_config
-        self.model_dtype = config.model_config.dtype if config.model_config \
-            else None
-        self.device = config.device_config.device if config.device_config \
-            else None
+        self.model_dtype = config.model_config.dtype if config.model_config else None
+        self.device = config.device_config.device if config.device_config else None
         self.pass_name = self.__class__.__name__
 
     @staticmethod
     def time_and_log(call_fn):
-
         @functools.wraps(call_fn)
         def wrapped(self: VllmInductorPass, graph: torch.fx.Graph):
             self.begin()
@@ -51,8 +48,9 @@ def wrapped(self: VllmInductorPass, graph: torch.fx.Graph):
     def dump_graph(self, graph: torch.fx.Graph, stage: str):
         i = VllmInductorPass.dump_prefix
         i_str = "" if i is None else f".{i}"
-        lazy_format_graph_code(f"post_grad{i_str}.{self.pass_name}.{stage}",
-                               graph.owning_module)
+        lazy_format_graph_code(
+            f"post_grad{i_str}.{self.pass_name}.{stage}", graph.owning_module
+        )
 
     def begin(self):
         self._start_time = time.perf_counter_ns()
@@ -71,11 +69,13 @@ class VllmPatternMatcherPass(VllmInductorPass):
 
     TODO(luka) move more utilities to this pass.
     """
+
     matched_count: int = 0
     """The number of matched patterns in the pass."""
 
     _OP_OVERLOAD_PATTERN: ClassVar[re.Pattern] = re.compile(
-        r"<OpOverload\(op='([^']*)', overload='([^']*)'\)>")
+        r"<OpOverload\(op='([^']*)', overload='([^']*)'\)>"
+    )
 
     def _replace_op_overloads(self, string: str) -> str:
         """Replace <OpOverload(..., ...)> with nicer formulations"""
@@ -102,19 +102,22 @@ def dump_patterns(self, config: VllmConfig, pm_pass: PatternMatcherPass):
         debug_dump_path.mkdir(parents=True, exist_ok=True)
 
         from vllm.utils import unique_filepath
+
         file_path = unique_filepath(
-            lambda i: debug_dump_path / f"patterns.{self.pass_name}.{i}.py")
+            lambda i: debug_dump_path / f"patterns.{self.pass_name}.{i}.py"
+        )
 
         with file_path.open("w") as f:
             print(
-                f'# This file was produced by VllmPatternMatcherPass.'
-                f'dump_patterns for {self.pass_name}.\n'
-                f'# It does its best to produce valid-Python-looking code but'
-                f' please add to dump_patterns if there are any errors.\n\n'
-                f'from torch._higher_order_ops.auto_functionalize import '
-                f'auto_functionalized as auto_functionalized\n'
-                f'from torch._inductor.pattern_matcher import *',
-                file=f)
+                f"# This file was produced by VllmPatternMatcherPass."
+                f"dump_patterns for {self.pass_name}.\n"
+                f"# It does its best to produce valid-Python-looking code but"
+                f" please add to dump_patterns if there are any errors.\n\n"
+                f"from torch._higher_order_ops.auto_functionalize import "
+                f"auto_functionalized as auto_functionalized\n"
+                f"from torch._inductor.pattern_matcher import *",
+                file=f,
+            )
 
             for node, patterns in pm_pass.patterns.items():
                 # fix the operator.getitem repr
@@ -133,18 +136,21 @@ def dump_patterns(self, config: VllmConfig, pm_pass: PatternMatcherPass):
 
                     # Assemble pattern
                     out_node = pp.pretty_print(pattern.pattern)
-                    pattern_repr = "\n".join([f"def pattern_{i}():"] + [
-                        f"{pp.memoized_objs_names[key]} = "
-                        f"{pp.memoized_objs_pp[key]}"
-                        for key in pp.memoized_objs_names
-                    ] + [f"return {out_node}"]).replace("\n", "\n    ")
+                    pattern_repr = "\n".join(
+                        [f"def pattern_{i}():"]
+                        + [
+                            f"{pp.memoized_objs_names[key]} = "
+                            f"{pp.memoized_objs_pp[key]}"
+                            for key in pp.memoized_objs_names
+                        ]
+                        + [f"return {out_node}"]
+                    ).replace("\n", "\n    ")
 
                     pattern_repr = self._replace_op_overloads(pattern_repr)
                     print(f"{pattern_repr}\n", file=f)
 
 
 class PrinterInductorPass(VllmInductorPass):
-
     def __init__(self, name: str, config: VllmConfig):
         super().__init__(config)
         self.name = name
diff --git a/vllm/compilation/wrapper.py b/vllm/compilation/wrapper.py
index 062c9dc27017..ca7c00725cdb 100644
--- a/vllm/compilation/wrapper.py
+++ b/vllm/compilation/wrapper.py
@@ -10,8 +10,7 @@
 
 import torch
 
-from vllm.config import (CompilationLevel, CUDAGraphMode,
-                         get_current_vllm_config)
+from vllm.config import CompilationLevel, CUDAGraphMode, get_current_vllm_config
 from vllm.logger import init_logger
 
 logger = init_logger(__name__)
@@ -30,10 +29,9 @@ class TorchCompileWrapperWithCustomDispatcher:
         `torch.compile` over the forward method.
     """
 
-    def __init__(self,
-                 compiled_callable: Optional[Callable] = None,
-                 compilation_level: int = 0):
-
+    def __init__(
+        self, compiled_callable: Optional[Callable] = None, compilation_level: int = 0
+    ):
         vllm_config = get_current_vllm_config()
         self.vllm_config = vllm_config
         if compiled_callable is None:
@@ -43,13 +41,13 @@ def __init__(self,
             backend = vllm_config.compilation_config.init_backend(vllm_config)
             options = None
             if isinstance(backend, str) and backend == "inductor":
-                options = get_current_vllm_config(
-                ).compilation_config.inductor_compile_config
+                options = (
+                    get_current_vllm_config().compilation_config.inductor_compile_config
+                )
 
-            compiled_callable = torch.compile(self.forward,
-                                              fullgraph=True,
-                                              backend=backend,
-                                              options=options)
+            compiled_callable = torch.compile(
+                self.forward, fullgraph=True, backend=backend, options=options
+            )
 
         self.compiled_callable = compiled_callable
         self.original_code_object = self.__class__.forward.__code__
@@ -59,8 +57,9 @@ def __init__(self,
         # read the env var to determine whether to use the custom dispatcher
         # subclasses can use this to switch between the custom dispatcher
         # and the default Dynamo guard mechanism.
-        self.use_custom_dispatcher: bool = \
+        self.use_custom_dispatcher: bool = (
             compilation_level >= CompilationLevel.DYNAMO_ONCE
+        )
 
     def __call__(self, *args, **kwargs):
         """Implement the dispatch logic here, beyond the torch.compile level.
@@ -70,8 +69,7 @@ def __call__(self, *args, **kwargs):
         return self.compiled_callable(*args, **kwargs)
 
     @abstractmethod
-    def forward(self, *args, **kwargs):
-        ...
+    def forward(self, *args, **kwargs): ...
 
     def bytecode_hook(self, old_code: CodeType, new_code: CodeType):
         """Hook to save the compiled bytecode for direct execution."""
@@ -103,21 +101,27 @@ def bytecode_hook(self, old_code: CodeType, new_code: CodeType):
                     # but there's no 100% guarantee, since decompliation is
                     # not a reversible process.
                     import depyf
+
                     src = depyf.decompile(new_code)
 
                     with open(decompiled_file, "w") as f:
                         f.write(src)
 
-                    logger.debug("Dynamo transformed code saved to %s",
-                                 decompiled_file)
+                    logger.debug("Dynamo transformed code saved to %s", decompiled_file)
                 except Exception:
                     pass
 
-        if self.vllm_config.compilation_config.cudagraph_mode != \
-            CUDAGraphMode.NONE and "update" in new_code.co_names:
+        if (
+            self.vllm_config.compilation_config.cudagraph_mode != CUDAGraphMode.NONE
+            and "update" in new_code.co_names
+        ):
             import depyf
+
             src = depyf.decompile(new_code)
-            msg = "Assigning / modifying buffers of nn.Module during forward pass is not allowed when using cudagraph inside the compiler because it will cause silent errors. Please use eager mode or fix the code. The following code contains clues about which buffer is being modified (please search for the usage of the function `update`):\n" + src  # noqa
+            msg = (
+                "Assigning / modifying buffers of nn.Module during forward pass is not allowed when using cudagraph inside the compiler because it will cause silent errors. Please use eager mode or fix the code. The following code contains clues about which buffer is being modified (please search for the usage of the function `update`):\n"
+                + src
+            )  # noqa
             raise RuntimeError(msg)
 
     @contextmanager
@@ -129,7 +133,7 @@ def dispatch_to_code(self, index: int):
         the code object in the function and call it.
 
         See https://dev-discuss.pytorch.org/t/what-is-the-relationship-requirement-among-original-bytecode-transformed-bytecode-and-bytecode-returned-by-hooks-in-dynamo/1693/7 for more details.
-        """ # noqa
+        """  # noqa
         self.__class__.forward.__code__ = self.compiled_codes[index]
         yield
         self.__class__.forward.__code__ = self.original_code_object
diff --git a/vllm/config/__init__.py b/vllm/config/__init__.py
index c909265c071d..7c5052c822f8 100644
--- a/vllm/config/__init__.py
+++ b/vllm/config/__init__.py
@@ -1,36 +1,60 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from vllm.config.cache import (BlockSize, CacheConfig, CacheDType, MambaDType,
-                               PrefixCachingHashAlgo)
-from vllm.config.compilation import (CompilationConfig, CompilationLevel,
-                                     CUDAGraphMode, PassConfig)
+from vllm.config.cache import (
+    BlockSize,
+    CacheConfig,
+    CacheDType,
+    MambaDType,
+    PrefixCachingHashAlgo,
+)
+from vllm.config.compilation import (
+    CompilationConfig,
+    CompilationLevel,
+    CUDAGraphMode,
+    PassConfig,
+)
 from vllm.config.device import Device, DeviceConfig
 from vllm.config.kv_events import KVEventsConfig
 from vllm.config.kv_transfer import KVTransferConfig
 from vllm.config.load import LoadConfig
 from vllm.config.lora import LoRAConfig
-from vllm.config.model import (ConvertOption, HfOverrides, LogprobsMode,
-                               ModelConfig, ModelDType, ModelImpl,
-                               RunnerOption, TaskOption, TokenizerMode,
-                               iter_architecture_defaults,
-                               try_match_architecture_defaults)
-from vllm.config.multimodal import (MMCacheType, MMEncoderTPMode,
-                                    MultiModalConfig)
+from vllm.config.model import (
+    ConvertOption,
+    HfOverrides,
+    LogprobsMode,
+    ModelConfig,
+    ModelDType,
+    ModelImpl,
+    RunnerOption,
+    TaskOption,
+    TokenizerMode,
+    iter_architecture_defaults,
+    try_match_architecture_defaults,
+)
+from vllm.config.multimodal import MMCacheType, MMEncoderTPMode, MultiModalConfig
 from vllm.config.observability import DetailedTraceModules, ObservabilityConfig
-from vllm.config.parallel import (DistributedExecutorBackend, EPLBConfig,
-                                  ParallelConfig)
+from vllm.config.parallel import DistributedExecutorBackend, EPLBConfig, ParallelConfig
 from vllm.config.pooler import PoolerConfig
 from vllm.config.scheduler import RunnerType, SchedulerConfig, SchedulerPolicy
 from vllm.config.speculative import SpeculativeConfig
 from vllm.config.speech_to_text import SpeechToTextConfig
 from vllm.config.structured_outputs import StructuredOutputsConfig
-from vllm.config.utils import (ConfigType, SupportsMetricsInfo, config,
-                               get_attr_docs, is_init_field, update_config)
-from vllm.config.vllm import (VllmConfig, get_cached_compilation_config,
-                              get_current_vllm_config,
-                              get_layers_from_vllm_config,
-                              set_current_vllm_config)
+from vllm.config.utils import (
+    ConfigType,
+    SupportsMetricsInfo,
+    config,
+    get_attr_docs,
+    is_init_field,
+    update_config,
+)
+from vllm.config.vllm import (
+    VllmConfig,
+    get_cached_compilation_config,
+    get_current_vllm_config,
+    get_layers_from_vllm_config,
+    set_current_vllm_config,
+)
 
 __all__ = [
     # From vllm.config.cache
diff --git a/vllm/config/cache.py b/vllm/config/cache.py
index bdfa99cd79a3..3d2496b7f21d 100644
--- a/vllm/config/cache.py
+++ b/vllm/config/cache.py
@@ -22,8 +22,7 @@
 logger = init_logger(__name__)
 
 BlockSize = Literal[1, 8, 16, 32, 64, 128]
-CacheDType = Literal["auto", "bfloat16", "fp8", "fp8_e4m3", "fp8_e5m2",
-                     "fp8_inc"]
+CacheDType = Literal["auto", "bfloat16", "fp8", "fp8_e4m3", "fp8_e5m2", "fp8_inc"]
 MambaDType = Literal["auto", "float32"]
 PrefixCachingHashAlgo = Literal["sha256", "sha256_cbor"]
 
@@ -145,8 +144,7 @@ def compute_hash(self) -> str:
         factors.append(self.mamba_cache_dtype)
         factors.append(self.mamba_ssm_cache_dtype)
         # `cpu_offload_gb` does not use `torch.compile` yet.
-        hash_str = hashlib.md5(str(factors).encode(),
-                               usedforsecurity=False).hexdigest()
+        hash_str = hashlib.md5(str(factors).encode(), usedforsecurity=False).hexdigest()
         return hash_str
 
     def __post_init__(self) -> None:
@@ -160,16 +158,18 @@ def metrics_info(self):
         # metrics info
         return {key: str(value) for key, value in self.__dict__.items()}
 
-    @model_validator(mode='after')
+    @model_validator(mode="after")
     def _verify_args(self) -> Self:
         if self.cpu_offload_gb < 0:
-            raise ValueError("CPU offload space must be non-negative"
-                             f", but got {self.cpu_offload_gb}")
+            raise ValueError(
+                f"CPU offload space must be non-negative, but got {self.cpu_offload_gb}"
+            )
 
         if self.gpu_memory_utilization > 1.0:
             raise ValueError(
                 "GPU memory utilization must be less than 1.0. Got "
-                f"{self.gpu_memory_utilization}.")
+                f"{self.gpu_memory_utilization}."
+            )
 
         return self
 
@@ -182,7 +182,8 @@ def _verify_cache_dtype(self) -> None:
                     "Using fp8 data type to store kv cache. It reduces the GPU "
                     "memory footprint and boosts the performance. "
                     "Meanwhile, it may cause accuracy drop without a proper "
-                    "scaling factor.")
+                    "scaling factor."
+                )
         else:
             raise ValueError(f"Unknown kv cache dtype: {self.cache_dtype}")
 
@@ -193,14 +194,17 @@ def _verify_prefix_caching(self) -> None:
         if self.sliding_window is not None and not envs.VLLM_USE_V1:
             raise NotImplementedError(
                 "Prefix caching is not supported with sliding window. "
-                "Run with --disable-sliding-window to use prefix caching.")
+                "Run with --disable-sliding-window to use prefix caching."
+            )
 
-        if (self.enable_prefix_caching and self.prefix_caching_hash_algo
-                not in get_args(PrefixCachingHashAlgo)):
+        if self.enable_prefix_caching and self.prefix_caching_hash_algo not in get_args(
+            PrefixCachingHashAlgo
+        ):
             raise ValueError(
                 "Unknown prefix caching hash algorithm: "
                 f"{self.prefix_caching_hash_algo}. Must be one of "
-                f"{get_args(PrefixCachingHashAlgo)}.")
+                f"{get_args(PrefixCachingHashAlgo)}."
+            )
 
     def verify_with_parallel_config(
         self,
@@ -212,9 +216,11 @@ def verify_with_parallel_config(
         num_gpus_per_node = parallel_config.tensor_parallel_size
         cpu_memory_usage = self.swap_space_bytes * num_gpus_per_node
 
-        msg = (f"{cpu_memory_usage / GiB_bytes:.2f} GiB out of the "
-               f"{total_cpu_memory / GiB_bytes:.2f} GiB total CPU memory "
-               "is allocated for the swap space.")
+        msg = (
+            f"{cpu_memory_usage / GiB_bytes:.2f} GiB out of the "
+            f"{total_cpu_memory / GiB_bytes:.2f} GiB total CPU memory "
+            "is allocated for the swap space."
+        )
         if cpu_memory_usage > 0.7 * total_cpu_memory:
             raise ValueError("Too large swap space. " + msg)
         elif cpu_memory_usage > 0.4 * total_cpu_memory:
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index ce173edb4b94..3443d2e1559e 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -33,31 +33,31 @@ class CompilationLevel:
 
 
 class CUDAGraphMode(enum.Enum):
-    """ Constants for the cudagraph mode in CompilationConfig.
+    """Constants for the cudagraph mode in CompilationConfig.
     Meanwhile, the subset enum `NONE`, `PIECEWISE` and `FULL` are also
     treated as concrete runtime mode for cudagraph runtime dispatching.
     """
+
     NONE = 0
     PIECEWISE = 1
     FULL = 2
     FULL_DECODE_ONLY = (FULL, NONE)
     FULL_AND_PIECEWISE = (FULL, PIECEWISE)
 
-    def decode_mode(self) -> 'CUDAGraphMode':
-        return CUDAGraphMode(self.value[0]) if \
-            self.separate_routine() else self
+    def decode_mode(self) -> "CUDAGraphMode":
+        return CUDAGraphMode(self.value[0]) if self.separate_routine() else self
 
-    def mixed_mode(self) -> 'CUDAGraphMode':
-        return CUDAGraphMode(self.value[1]) if \
-            self.separate_routine() else self
+    def mixed_mode(self) -> "CUDAGraphMode":
+        return CUDAGraphMode(self.value[1]) if self.separate_routine() else self
 
     def requires_piecewise_compilation(self) -> bool:
-        return (self.decode_mode() == CUDAGraphMode.PIECEWISE
-                or self.mixed_mode() == CUDAGraphMode.PIECEWISE)
+        return (
+            self.decode_mode() == CUDAGraphMode.PIECEWISE
+            or self.mixed_mode() == CUDAGraphMode.PIECEWISE
+        )
 
-    def max_cudagraph_mode(self) -> 'CUDAGraphMode':
-        return CUDAGraphMode(max(
-            self.value)) if self.separate_routine() else self
+    def max_cudagraph_mode(self) -> "CUDAGraphMode":
+        return CUDAGraphMode(max(self.value)) if self.separate_routine() else self
 
     def has_full_cudagraphs(self) -> bool:
         return self.max_cudagraph_mode() == CUDAGraphMode.FULL
@@ -69,9 +69,7 @@ def separate_routine(self) -> bool:
         return isinstance(self.value, tuple)
 
     def valid_runtime_modes(self) -> bool:
-        return self in [
-            CUDAGraphMode.NONE, CUDAGraphMode.PIECEWISE, CUDAGraphMode.FULL
-        ]
+        return self in [CUDAGraphMode.NONE, CUDAGraphMode.PIECEWISE, CUDAGraphMode.FULL]
 
     def __str__(self) -> str:
         return self.name
@@ -116,11 +114,13 @@ def __post_init__(self) -> None:
             if self.enable_fusion:
                 logger.warning_once(
                     "Fusion enabled but reshape elimination disabled. "
-                    "RMSNorm/SiluMul + quant (fp8) fusion might not work")
+                    "RMSNorm/SiluMul + quant (fp8) fusion might not work"
+                )
             if self.enable_attn_fusion:
                 logger.warning_once(
                     "Fusion enabled but reshape elimination disabled. "
-                    "Attention + quant (fp8) fusion might not work")
+                    "Attention + quant (fp8) fusion might not work"
+                )
 
 
 @config
@@ -163,6 +163,7 @@ class CompilationConfig:
         sufficient for most cases. It might be beneficial to compile for
         certain small batchsizes, where inductor is good at optimizing.
     """
+
     # Top-level Compilation control
     level: Optional[int] = None
     """The level of compilation:
@@ -340,26 +341,24 @@ class CompilationConfig:
     """local cache dir for each rank"""
     bs_to_padded_graph_size: list[int] = field(
         default=None,  # type: ignore
-        init=False)
+        init=False,
+    )
     """optimization:
     Intuitively, bs_to_padded_graph_size should be dict[int, int].
     since we know all keys are in a range [0, max_capture_size],
     we can optimize it to list[int] for better lookup performance."""
 
     # keep track of enabled and disabled custom ops
-    enabled_custom_ops: Counter[str] = field(default_factory=Counter,
-                                             init=False)
+    enabled_custom_ops: Counter[str] = field(default_factory=Counter, init=False)
     """custom ops that are enabled"""
-    disabled_custom_ops: Counter[str] = field(default_factory=Counter,
-                                              init=False)
+    disabled_custom_ops: Counter[str] = field(default_factory=Counter, init=False)
     """custom ops that are disabled"""
     traced_files: set[str] = field(default_factory=set, init=False)
     """files that are traced for compilation"""
     compilation_time: float = field(default=0.0, init=False)
     """time taken for compilation"""
 
-    static_forward_context: dict[str, Any] = field(default_factory=dict,
-                                                   init=False)
+    static_forward_context: dict[str, Any] = field(default_factory=dict, init=False)
     """Per-model forward context
     Map from layer name to layer objects that need to be accessed outside
     model code, e.g., Attention, FusedMOE when dp_size>1."""
@@ -421,9 +420,9 @@ def __repr__(self) -> str:
         if pass_config_exclude:
             exclude["pass_config"] = pass_config_exclude
 
-        config = TypeAdapter(CompilationConfig).dump_python(self,
-                                                            exclude=exclude,
-                                                            exclude_unset=True)
+        config = TypeAdapter(CompilationConfig).dump_python(
+            self, exclude=exclude, exclude_unset=True
+        )
 
         return str(config)
 
@@ -453,16 +452,16 @@ def __post_init__(self) -> None:
         #    https://github.com/vllm-project/vllm/issues/14703
 
         if is_torch_equal_or_newer("2.6"):
-            KEY = 'enable_auto_functionalized_v2'
+            KEY = "enable_auto_functionalized_v2"
             if KEY not in self.inductor_compile_config:
                 self.inductor_compile_config[KEY] = False
 
         for k, v in self.inductor_passes.items():
             if not isinstance(v, str):
-                assert callable(v), (
-                    f"pass {k} should be callable or a qualified name")
-                self.inductor_compile_config[k] = v if isinstance(
-                    v, InductorPass) else CallableInductorPass(v)
+                assert callable(v), f"pass {k} should be callable or a qualified name"
+                self.inductor_compile_config[k] = (
+                    v if isinstance(v, InductorPass) else CallableInductorPass(v)
+                )
                 continue
 
             # resolve function from qualified name
@@ -470,54 +469,68 @@ def __post_init__(self) -> None:
             module = ".".join(names[:-1])
             func_name = names[-1]
             func = __import__(module).__dict__[func_name]
-            self.inductor_compile_config[k] = func if isinstance(
-                func, InductorPass) else CallableInductorPass(func)
+            self.inductor_compile_config[k] = (
+                func if isinstance(func, InductorPass) else CallableInductorPass(func)
+            )
 
         if isinstance(self.pass_config, dict):
             self.pass_config = PassConfig(**self.pass_config)
 
         # migrate the deprecated flags
         if not self.use_cudagraph:
-            logger.warning("use_cudagraph is deprecated, use "
-                           "cudagraph_mode=NONE instead.")
-            if self.cudagraph_mode is not None and \
-                self.cudagraph_mode != CUDAGraphMode.NONE:
+            logger.warning(
+                "use_cudagraph is deprecated, use cudagraph_mode=NONE instead."
+            )
+            if (
+                self.cudagraph_mode is not None
+                and self.cudagraph_mode != CUDAGraphMode.NONE
+            ):
                 raise ValueError(
                     "use_cudagraph and cudagraph_mode are mutually"
                     " exclusive, prefer cudagraph_mode since "
-                    "use_cudagraph is deprecated.")
+                    "use_cudagraph is deprecated."
+                )
             self.cudagraph_mode = CUDAGraphMode.NONE
         if self.full_cuda_graph:
-            logger.warning("full_cuda_graph is deprecated, use "
-                           "cudagraph_mode=FULL instead.")
-            if self.cudagraph_mode is not None and \
-                not self.cudagraph_mode.has_full_cudagraphs():
-                raise ValueError("full_cuda_graph and cudagraph_mode are "
-                                 "mutually exclusive, prefer cudagraph_mode "
-                                 "since full_cuda_graph is deprecated.")
+            logger.warning(
+                "full_cuda_graph is deprecated, use cudagraph_mode=FULL instead."
+            )
+            if (
+                self.cudagraph_mode is not None
+                and not self.cudagraph_mode.has_full_cudagraphs()
+            ):
+                raise ValueError(
+                    "full_cuda_graph and cudagraph_mode are "
+                    "mutually exclusive, prefer cudagraph_mode "
+                    "since full_cuda_graph is deprecated."
+                )
             self.cudagraph_mode = CUDAGraphMode.FULL
 
-        if (self.use_inductor_graph_partition
-                and not is_torch_equal_or_newer("2.9.0.dev")):
-            raise ValueError("use_inductor_graph_partition is only "
-                             "supported with torch>=2.9.0.dev. Set "
-                             "use_inductor_graph_partition=False instead.")
+        if self.use_inductor_graph_partition and not is_torch_equal_or_newer(
+            "2.9.0.dev"
+        ):
+            raise ValueError(
+                "use_inductor_graph_partition is only "
+                "supported with torch>=2.9.0.dev. Set "
+                "use_inductor_graph_partition=False instead."
+            )
 
         for op in self.custom_ops:
-            if op[0] not in {'+', '-'} and op not in {'all', 'none'}:
-                raise ValueError(f"Invalid syntax '{op}' for custom op, "
-                                 "must be 'all', 'none', '+op' or '-op' "
-                                 "(where 'op' is the registered op name)")
+            if op[0] not in {"+", "-"} and op not in {"all", "none"}:
+                raise ValueError(
+                    f"Invalid syntax '{op}' for custom op, "
+                    "must be 'all', 'none', '+op' or '-op' "
+                    "(where 'op' is the registered op name)"
+                )
 
     def init_backend(self, vllm_config: "VllmConfig") -> Union[str, Callable]:
         if self.level == CompilationLevel.NO_COMPILATION:
             raise ValueError("No compilation level is set.")
 
         from torch._dynamo.backends.registry import list_backends
+
         torch_backends = list_backends(exclude_tags=tuple())
-        if self.level in [
-                CompilationLevel.DYNAMO_AS_IS, CompilationLevel.DYNAMO_ONCE
-        ]:
+        if self.level in [CompilationLevel.DYNAMO_AS_IS, CompilationLevel.DYNAMO_ONCE]:
             if self.backend == "":
                 return "eager"
             if self.backend in torch_backends:
@@ -529,10 +542,10 @@ def init_backend(self, vllm_config: "VllmConfig") -> Union[str, Callable]:
         assert self.level == CompilationLevel.PIECEWISE
 
         from vllm.compilation.backends import VllmBackend
+
         return VllmBackend(vllm_config)
 
-    def init_with_cudagraph_sizes(self,
-                                  cudagraph_capture_sizes: list[int]) -> None:
+    def init_with_cudagraph_sizes(self, cudagraph_capture_sizes: list[int]) -> None:
         """To complete the initialization of config,
         we need to know the cudagraph sizes."""
 
@@ -542,9 +555,14 @@ def init_with_cudagraph_sizes(self,
             # de-duplicate the sizes provided by the config
             dedup_sizes = list(set(self.cudagraph_capture_sizes))
             if len(dedup_sizes) < len(self.cudagraph_capture_sizes):
-                logger.info(("cudagraph sizes specified by model runner"
-                             " %s is overridden by config %s"),
-                            cudagraph_capture_sizes, dedup_sizes)
+                logger.info(
+                    (
+                        "cudagraph sizes specified by model runner"
+                        " %s is overridden by config %s"
+                    ),
+                    cudagraph_capture_sizes,
+                    dedup_sizes,
+                )
             self.cudagraph_capture_sizes = dedup_sizes
 
         computed_compile_sizes = []
@@ -553,9 +571,10 @@ def init_with_cudagraph_sizes(self,
             self.compile_sizes = list(set(self.compile_sizes))
             for x in self.compile_sizes:
                 if isinstance(x, str):
-                    assert x == "cudagraph_capture_sizes", \
-                        "Unrecognized size type in compile_sizes, " \
+                    assert x == "cudagraph_capture_sizes", (
+                        "Unrecognized size type in compile_sizes, "
                         f"expect 'cudagraph_capture_sizes', got {x}"
+                    )
                     computed_compile_sizes.extend(self.cudagraph_capture_sizes)
                 else:
                     assert isinstance(x, int)
@@ -564,29 +583,29 @@ def init_with_cudagraph_sizes(self,
 
         # sort to make sure cudagraph capture sizes are in descending order
         self.cudagraph_capture_sizes.sort(reverse=True)
-        self.max_capture_size = self.cudagraph_capture_sizes[
-            0] if self.cudagraph_capture_sizes else 0
+        self.max_capture_size = (
+            self.cudagraph_capture_sizes[0] if self.cudagraph_capture_sizes else 0
+        )
 
         # pre-compute the mapping from batch size to padded graph size
-        self.bs_to_padded_graph_size = [
-            0 for i in range(self.max_capture_size + 1)
-        ]
-        for end, start in zip(self.cudagraph_capture_sizes,
-                              self.cudagraph_capture_sizes[1:] + [0]):
+        self.bs_to_padded_graph_size = [0 for i in range(self.max_capture_size + 1)]
+        for end, start in zip(
+            self.cudagraph_capture_sizes, self.cudagraph_capture_sizes[1:] + [0]
+        ):
             for bs in range(start, end):
                 if bs == start:
                     self.bs_to_padded_graph_size[bs] = start
                 else:
                     self.bs_to_padded_graph_size[bs] = end
-        self.bs_to_padded_graph_size[
-            self.max_capture_size] = self.max_capture_size
+        self.bs_to_padded_graph_size[self.max_capture_size] = self.max_capture_size
 
     def set_splitting_ops_for_v1(self):
         # NOTE: this function needs to be called only when level is
         # CompilationLevel.PIECEWISE
         assert self.level == CompilationLevel.PIECEWISE, (
             "set_splitting_ops_for_v1 should only be called when "
-            "level is CompilationLevel.PIECEWISE")
+            "level is CompilationLevel.PIECEWISE"
+        )
 
         if self.use_inductor_graph_partition:
             self.set_splitting_ops_for_inductor_graph_partition()
@@ -608,22 +627,23 @@ def set_splitting_ops_for_v1(self):
             # list via reference.
             self.splitting_ops = list(self._attention_ops)
         elif len(self.splitting_ops) == 0:
-            logger.warning_once(
-                "Using piecewise compilation with empty splitting_ops")
+            logger.warning_once("Using piecewise compilation with empty splitting_ops")
             if self.cudagraph_mode == CUDAGraphMode.PIECEWISE:
                 logger.warning_once(
-                    "Piecewise compilation with empty splitting_ops do not" \
+                    "Piecewise compilation with empty splitting_ops do not"
                     "contains piecewise cudagraph. Setting cudagraph_"
                     "mode to NONE. Hint: If you are using attention backends "
                     "that support cudagraph, consider manually setting "
                     "cudagraph_mode to FULL or FULL_DECODE_ONLY to enable "
-                    "full cudagraphs.")
+                    "full cudagraphs."
+                )
                 self.cudagraph_mode = CUDAGraphMode.NONE
             elif self.cudagraph_mode == CUDAGraphMode.FULL_AND_PIECEWISE:
                 logger.warning_once(
                     "Piecewise compilation with empty splitting_ops do not "
                     "contains piecewise cudagraph. Setting cudagraph_mode "
-                    "to FULL.")
+                    "to FULL."
+                )
                 self.cudagraph_mode = CUDAGraphMode.FULL
             self.splitting_ops = []
 
@@ -632,10 +652,10 @@ def set_splitting_ops_for_inductor_graph_partition(self):
         use_inductor_graph_partition_msg = (
             "When use_inductor_graph_partition=True, splitting_ops "
             "are ignored and set to an empty list. Instead, "
-            "\"tags=(torch._C.Tag.cudagraph_unsafe, ),\" is "
-            "used to annotate custom ops for graph partition.")
-        if self.splitting_ops is not None and \
-            len(self.splitting_ops) > 0:
+            '"tags=(torch._C.Tag.cudagraph_unsafe, )," is '
+            "used to annotate custom ops for graph partition."
+        )
+        if self.splitting_ops is not None and len(self.splitting_ops) > 0:
             logger.warning_once(use_inductor_graph_partition_msg)
         self.splitting_ops = []
 
@@ -651,32 +671,38 @@ def set_splitting_ops_for_attn_fusion(self):
                     "list, and cudagraph_mode will be set to FULL. "
                     "Please ensure you are using attention backends that "
                     "support cudagraph or set cudagraph_mode to NONE "
-                    "explicitly if encountering any problems.")
+                    "explicitly if encountering any problems."
+                )
                 self.cudagraph_mode = CUDAGraphMode.FULL
 
         assert not self.splitting_ops_contain_attention(), (
             "attention ops should not be in splitting_ops "
-            "when enable_attn_fusion is True")
+            "when enable_attn_fusion is True"
+        )
 
     def splitting_ops_contain_attention(self) -> bool:
         return self.splitting_ops is not None and all(
-            op in self.splitting_ops for op in self._attention_ops)
+            op in self.splitting_ops for op in self._attention_ops
+        )
 
     def is_attention_compiled_piecewise(self) -> bool:
         use_fx_graph_piecewise_compilation = (
             self.level == CompilationLevel.PIECEWISE
-            and self.splitting_ops_contain_attention())
-
-        inductor_used = (self.level == CompilationLevel.PIECEWISE
-                         and self.use_inductor) or (
-                             self.level >= CompilationLevel.DYNAMO_AS_IS
-                             and self.backend == "inductor")
+            and self.splitting_ops_contain_attention()
+        )
+
+        inductor_used = (
+            self.level == CompilationLevel.PIECEWISE and self.use_inductor
+        ) or (
+            self.level >= CompilationLevel.DYNAMO_AS_IS and self.backend == "inductor"
+        )
         use_inductor_piecewise_compilation = (
-            inductor_used and self.use_inductor_graph_partition
-            and not self.splitting_ops_contain_attention())
+            inductor_used
+            and self.use_inductor_graph_partition
+            and not self.splitting_ops_contain_attention()
+        )
 
-        return use_fx_graph_piecewise_compilation or \
-            use_inductor_piecewise_compilation
+        return use_fx_graph_piecewise_compilation or use_inductor_piecewise_compilation
 
     def custom_op_log_check(self):
         """
@@ -693,13 +719,14 @@ def custom_op_log_check(self):
         logger.debug("enabled custom ops: %s", self.enabled_custom_ops)
         logger.debug("disabled custom ops: %s", self.disabled_custom_ops)
 
-        all_ops_in_model = (self.enabled_custom_ops | self.disabled_custom_ops)
+        all_ops_in_model = self.enabled_custom_ops | self.disabled_custom_ops
         for op in self.custom_ops:
             if op in {"all", "none"}:
                 continue
 
-            assert op[0] in {'+', '-'}, "Invalid custom op syntax " \
-                                        "(should be checked during init)"
+            assert op[0] in {"+", "-"}, (
+                "Invalid custom op syntax (should be checked during init)"
+            )
 
             # check if op name exists in model
             op_name = op[1:]
@@ -708,10 +735,17 @@ def custom_op_log_check(self):
 
                 # Does op exist at all or is it just not present in this model?
                 # Note: Only imported op classes appear in the registry.
-                missing_str = "doesn't exist (or wasn't imported/registered)" \
-                    if op_name not in CustomOp.op_registry \
+                missing_str = (
+                    "doesn't exist (or wasn't imported/registered)"
+                    if op_name not in CustomOp.op_registry
                     else "not present in model"
+                )
 
-                enable_str = "enabling" if op[0] == '+' else "disabling"
-                logger.warning_once("Op '%s' %s, %s with '%s' has no effect",
-                                    op_name, missing_str, enable_str, op)
+                enable_str = "enabling" if op[0] == "+" else "disabling"
+                logger.warning_once(
+                    "Op '%s' %s, %s with '%s' has no effect",
+                    op_name,
+                    missing_str,
+                    enable_str,
+                    op,
+                )
diff --git a/vllm/config/device.py b/vllm/config/device.py
index 4654ac96e0b7..4b6642479541 100644
--- a/vllm/config/device.py
+++ b/vllm/config/device.py
@@ -45,20 +45,21 @@ def compute_hash(self) -> str:
         # the device/platform information will be summarized
         # by torch/vllm automatically.
         factors: list[Any] = []
-        hash_str = hashlib.md5(str(factors).encode(),
-                               usedforsecurity=False).hexdigest()
+        hash_str = hashlib.md5(str(factors).encode(), usedforsecurity=False).hexdigest()
         return hash_str
 
     def __post_init__(self):
         if self.device == "auto":
             # Automated device type detection
             from vllm.platforms import current_platform
+
             self.device_type = current_platform.device_type
             if not self.device_type:
                 raise RuntimeError(
                     "Failed to infer device type, please set "
                     "the environment variable `VLLM_LOGGING_LEVEL=DEBUG` "
-                    "to turn on verbose logging to help debug the issue.")
+                    "to turn on verbose logging to help debug the issue."
+                )
         else:
             # Device type is assigned explicitly
             if isinstance(self.device, str):
diff --git a/vllm/config/kv_transfer.py b/vllm/config/kv_transfer.py
index c3d9a3309eb3..b33294fd66f7 100644
--- a/vllm/config/kv_transfer.py
+++ b/vllm/config/kv_transfer.py
@@ -76,8 +76,7 @@ def compute_hash(self) -> str:
         # no factors to consider.
         # this config will not affect the computation graph.
         factors: list[Any] = []
-        hash_str = hashlib.md5(str(factors).encode(),
-                               usedforsecurity=False).hexdigest()
+        hash_str = hashlib.md5(str(factors).encode(), usedforsecurity=False).hexdigest()
         return hash_str
 
     def __post_init__(self) -> None:
@@ -85,27 +84,28 @@ def __post_init__(self) -> None:
             self.engine_id = str(uuid.uuid4())
 
         if self.kv_role is not None and self.kv_role not in get_args(KVRole):
-            raise ValueError(f"Unsupported kv_role: {self.kv_role}. "
-                             f"Supported roles are {get_args(KVRole)}")
+            raise ValueError(
+                f"Unsupported kv_role: {self.kv_role}. "
+                f"Supported roles are {get_args(KVRole)}"
+            )
 
         if self.kv_connector is not None and self.kv_role is None:
-            raise ValueError("Please specify kv_disagg_role when kv_connector "
-                             f"is set, supported roles are {get_args(KVRole)}")
+            raise ValueError(
+                "Please specify kv_disagg_role when kv_connector "
+                f"is set, supported roles are {get_args(KVRole)}"
+            )
 
     @property
     def is_kv_transfer_instance(self) -> bool:
-        return self.kv_connector is not None and \
-            self.kv_role in get_args(KVRole)
+        return self.kv_connector is not None and self.kv_role in get_args(KVRole)
 
     @property
     def is_kv_producer(self) -> bool:
-        return self.kv_connector is not None and \
-            self.kv_role in get_args(KVProducer)
+        return self.kv_connector is not None and self.kv_role in get_args(KVProducer)
 
     @property
     def is_kv_consumer(self) -> bool:
-        return self.kv_connector is not None and \
-            self.kv_role in get_args(KVConsumer)
+        return self.kv_connector is not None and self.kv_role in get_args(KVConsumer)
 
     def get_from_extra_config(self, key, default) -> Any:
         return self.kv_connector_extra_config.get(key, default)
diff --git a/vllm/config/load.py b/vllm/config/load.py
index 26ffec23ad5c..6aacff60157b 100644
--- a/vllm/config/load.py
+++ b/vllm/config/load.py
@@ -61,7 +61,8 @@ class LoadConfig:
       initialization. However, it uses more CPU RAM.
     """
     model_loader_extra_config: Union[dict, TensorizerConfig] = field(
-        default_factory=dict)
+        default_factory=dict
+    )
     """Extra config for model loader. This will be passed to the model loader
     corresponding to the chosen load_format."""
     device: Optional[str] = None
@@ -99,8 +100,7 @@ def compute_hash(self) -> str:
         # no factors to consider.
         # this config will not affect the computation graph.
         factors: list[Any] = []
-        hash_str = hashlib.md5(str(factors).encode(),
-                               usedforsecurity=False).hexdigest()
+        hash_str = hashlib.md5(str(factors).encode(), usedforsecurity=False).hexdigest()
         return hash_str
 
     def __post_init__(self):
@@ -108,6 +108,7 @@ def __post_init__(self):
         if self.ignore_patterns is not None and len(self.ignore_patterns) > 0:
             logger.info(
                 "Ignoring the following patterns when downloading weights: %s",
-                self.ignore_patterns)
+                self.ignore_patterns,
+            )
         else:
             self.ignore_patterns = ["original/**/*"]
diff --git a/vllm/config/lora.py b/vllm/config/lora.py
index 3fe28f5dad4f..f97f2a111d41 100644
--- a/vllm/config/lora.py
+++ b/vllm/config/lora.py
@@ -47,8 +47,9 @@ class LoRAConfig:
     lora_extra_vocab_size: int = 256
     """(Deprecated) Maximum size of extra vocabulary that can be present in a 
     LoRA adapter. Will be removed in v0.12.0."""
-    lora_vocab_padding_size: ClassVar[int] = current_platform\
-        .get_lora_vocab_padding_size()
+    lora_vocab_padding_size: ClassVar[int] = (
+        current_platform.get_lora_vocab_padding_size()
+    )
     default_mm_loras: Optional[dict[str, str]] = None
     """Dictionary mapping specific modalities to LoRA model paths; this field
     is only applicable to multimodal models and should be leveraged when a
@@ -83,8 +84,7 @@ def compute_hash(self) -> str:
         factors.append(self.lora_extra_vocab_size)
         factors.append(self.lora_vocab_padding_size)
         factors.append(self.bias_enabled)
-        hash_str = hashlib.md5(str(factors).encode(),
-                               usedforsecurity=False).hexdigest()
+        hash_str = hashlib.md5(str(factors).encode(), usedforsecurity=False).hexdigest()
         return hash_str
 
     def __post_init__(self):
@@ -92,12 +92,14 @@ def __post_init__(self):
         logger.warning(
             "`lora_extra_vocab_size` is deprecated and will be removed "
             "in v0.12.0. Additional vocabulary support for "
-            "LoRA adapters is being phased out.")
+            "LoRA adapters is being phased out."
+        )
 
         # Deprecation warning for enable_lora_bias
         if self.bias_enabled:
-            logger.warning("`enable_lora_bias` is deprecated "
-                           "and will be removed in v0.12.0.")
+            logger.warning(
+                "`enable_lora_bias` is deprecated and will be removed in v0.12.0."
+            )
 
         # Setting the maximum rank to 512 should be able to satisfy the vast
         # majority of applications.
@@ -106,11 +108,13 @@ def __post_init__(self):
         if self.max_lora_rank not in possible_max_ranks:
             raise ValueError(
                 f"max_lora_rank ({self.max_lora_rank}) must be one of "
-                f"{possible_max_ranks}.")
+                f"{possible_max_ranks}."
+            )
         if self.lora_extra_vocab_size not in possible_lora_extra_vocab_size:
             raise ValueError(
                 f"lora_extra_vocab_size ({self.lora_extra_vocab_size}) "
-                f"must be one of {possible_lora_extra_vocab_size}.")
+                f"must be one of {possible_lora_extra_vocab_size}."
+            )
         if self.max_loras < 1:
             raise ValueError(f"max_loras ({self.max_loras}) must be >= 1.")
         if self.max_cpu_loras is None:
@@ -118,12 +122,12 @@ def __post_init__(self):
         elif self.max_cpu_loras < self.max_loras:
             raise ValueError(
                 f"max_cpu_loras ({self.max_cpu_loras}) must be >= "
-                f"max_loras ({self.max_loras})")
+                f"max_loras ({self.max_loras})"
+            )
 
     def verify_with_cache_config(self, cache_config: CacheConfig):
         if cache_config.cpu_offload_gb > 0 and not envs.VLLM_USE_V1:
-            raise ValueError(
-                "V0 LoRA does not support CPU offload, please use V1.")
+            raise ValueError("V0 LoRA does not support CPU offload, please use V1.")
 
     def verify_with_model_config(self, model_config: ModelConfig):
         if self.lora_dtype in (None, "auto"):
diff --git a/vllm/config/model.py b/vllm/config/model.py
index 0bf8a9fe1f0f..146ace9782b9 100644
--- a/vllm/config/model.py
+++ b/vllm/config/model.py
@@ -6,31 +6,44 @@
 import warnings
 from dataclasses import InitVar, field
 from importlib.util import find_spec
-from typing import (TYPE_CHECKING, Any, Callable, Literal, Optional, Union,
-                    cast, get_args)
+from typing import (
+    TYPE_CHECKING,
+    Any,
+    Callable,
+    Literal,
+    Optional,
+    Union,
+    cast,
+    get_args,
+)
 
 import torch
-from pydantic import (ConfigDict, SkipValidation, field_validator,
-                      model_validator)
+from pydantic import ConfigDict, SkipValidation, field_validator, model_validator
 from pydantic.dataclasses import dataclass
 from safetensors.torch import _TYPES as _SAFETENSORS_TO_TORCH_DTYPE
 
 import vllm.envs as envs
-from vllm.config.multimodal import (MMCacheType, MMEncoderTPMode,
-                                    MultiModalConfig)
+from vllm.config.multimodal import MMCacheType, MMEncoderTPMode, MultiModalConfig
 from vllm.config.pooler import PoolerConfig
 from vllm.config.scheduler import RunnerType
 from vllm.config.utils import assert_hashable, config, getattr_iter
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 from vllm.transformers_utils.config import (
-    ConfigFormat, get_config, get_hf_image_processor_config,
-    get_hf_text_config, get_pooling_config,
-    get_sentence_transformer_tokenizer_config, is_encoder_decoder,
-    is_interleaved, try_get_generation_config, try_get_safetensors_metadata,
-    try_get_tokenizer_config, uses_mrope)
-from vllm.transformers_utils.runai_utils import (ObjectStorageModel,
-                                                 is_runai_obj_uri)
+    ConfigFormat,
+    get_config,
+    get_hf_image_processor_config,
+    get_hf_text_config,
+    get_pooling_config,
+    get_sentence_transformer_tokenizer_config,
+    is_encoder_decoder,
+    is_interleaved,
+    try_get_generation_config,
+    try_get_safetensors_metadata,
+    try_get_tokenizer_config,
+    uses_mrope,
+)
+from vllm.transformers_utils.runai_utils import ObjectStorageModel, is_runai_obj_uri
 from vllm.transformers_utils.utils import maybe_model_redirect
 from vllm.utils import LayerBlockType, LazyLoader, common_broadcastable_dtype
 
@@ -46,10 +59,10 @@
 else:
     PretrainedConfig = Any
 
-    me_quant = LazyLoader("model_executor", globals(),
-                          "vllm.model_executor.layers.quantization")
-    me_models = LazyLoader("model_executor", globals(),
-                           "vllm.model_executor.models")
+    me_quant = LazyLoader(
+        "model_executor", globals(), "vllm.model_executor.layers.quantization"
+    )
+    me_models = LazyLoader("model_executor", globals(), "vllm.model_executor.models")
     LoadConfig = Any
     ParallelConfig = Any
     QuantizationMethods = Any
@@ -60,14 +73,23 @@
 RunnerOption = Literal["auto", RunnerType]
 ConvertType = Literal["none", "embed", "classify", "reward"]
 ConvertOption = Literal["auto", ConvertType]
-TaskOption = Literal["auto", "generate", "embedding", "embed", "classify",
-                     "score", "reward", "transcription", "draft"]
+TaskOption = Literal[
+    "auto",
+    "generate",
+    "embedding",
+    "embed",
+    "classify",
+    "score",
+    "reward",
+    "transcription",
+    "draft",
+]
 TokenizerMode = Literal["auto", "slow", "mistral", "custom"]
 ModelDType = Literal["auto", "half", "float16", "bfloat16", "float", "float32"]
-LogprobsMode = Literal["raw_logits", "raw_logprobs", "processed_logits",
-                       "processed_logprobs"]
-HfOverrides = Union[dict[str, Any], Callable[[PretrainedConfig],
-                                             PretrainedConfig]]
+LogprobsMode = Literal[
+    "raw_logits", "raw_logprobs", "processed_logits", "processed_logprobs"
+]
+HfOverrides = Union[dict[str, Any], Callable[[PretrainedConfig], PretrainedConfig]]
 ModelImpl = Literal["auto", "vllm", "transformers", "terratorch"]
 
 _RUNNER_TASKS: dict[RunnerType, list[TaskOption]] = {
@@ -276,9 +298,7 @@ class ModelConfig:
     multimodal_config: Optional[MultiModalConfig] = None
     """Configuration for multimodal model. If `None`, this will be inferred
     from the architecture of `self.model`."""
-    limit_mm_per_prompt: InitVar[Optional[dict[str, Union[int,
-                                                          dict[str,
-                                                               int]]]]] = None
+    limit_mm_per_prompt: InitVar[Optional[dict[str, Union[int, dict[str, int]]]]] = None
     media_io_kwargs: InitVar[Optional[dict[str, dict[str, Any]]]] = None
     mm_processor_kwargs: InitVar[Optional[dict[str, Any]]] = None
     mm_processor_cache_gb: InitVar[Optional[float]] = None
@@ -327,15 +347,19 @@ def compute_hash(self) -> str:
             from vllm.utils.jsontree import json_map_leaves
 
             # Handle nested HF configs with unserializable values gracefully
-            hf_config_json = json.dumps(
-                json_map_leaves(
-                    lambda v: v.to_dict()
-                    if isinstance(v, PretrainedConfig) else str(v),
-                    self.hf_config.to_dict(),
-                ),
-                indent=2,
-                sort_keys=True,
-            ) + "\n"
+            hf_config_json = (
+                json.dumps(
+                    json_map_leaves(
+                        lambda v: v.to_dict()
+                        if isinstance(v, PretrainedConfig)
+                        else str(v),
+                        self.hf_config.to_dict(),
+                    ),
+                    indent=2,
+                    sort_keys=True,
+                )
+                + "\n"
+            )
 
         factors.append(hf_config_json)
 
@@ -373,11 +397,14 @@ def __post_init__(
                     "The global random seed is set to %d. Since "
                     "VLLM_ENABLE_V1_MULTIPROCESSING is set to False, this may "
                     "affect the random state of the Python process that "
-                    "launched vLLM.", self.seed)
+                    "launched vLLM.",
+                    self.seed,
+                )
 
         # Keep set served_model_name before maybe_model_redirect(self.model)
-        self.served_model_name = get_served_model_name(self.model,
-                                                       self.served_model_name)
+        self.served_model_name = get_served_model_name(
+            self.model, self.served_model_name
+        )
         self.model = maybe_model_redirect(self.model)
         # The tokenizer is consistent with the model by default.
         if self.tokenizer is None:
@@ -402,7 +429,8 @@ def __post_init__(
             hf_overrides_str = json.dumps(hf_overrides_kw)
             msg = (
                 "`--rope-scaling` will be removed in a future release. "
-                f"'Please instead use `--hf-overrides '{hf_overrides_str}'`")
+                f"'Please instead use `--hf-overrides '{hf_overrides_str}'`"
+            )
             warnings.warn(DeprecationWarning(msg), stacklevel=2)
         if self.rope_theta is not None:
             hf_override = {"rope_theta": self.rope_theta}
@@ -410,52 +438,58 @@ def __post_init__(
             hf_overrides_str = json.dumps(hf_overrides_kw)
             msg = (
                 "`--rope-theta` will be removed in a future release. "
-                f"'Please instead use `--hf-overrides '{hf_overrides_str}'`")
+                f"'Please instead use `--hf-overrides '{hf_overrides_str}'`"
+            )
             warnings.warn(DeprecationWarning(msg), stacklevel=2)
 
         self.maybe_pull_model_tokenizer_for_runai(self.model, self.tokenizer)
 
-        if (backend := envs.VLLM_ATTENTION_BACKEND
-            ) and backend == "FLASHINFER" and find_spec("flashinfer") is None:
+        if (
+            (backend := envs.VLLM_ATTENTION_BACKEND)
+            and backend == "FLASHINFER"
+            and find_spec("flashinfer") is None
+        ):
             raise ValueError(
                 "VLLM_ATTENTION_BACKEND is set to FLASHINFER, but flashinfer "
                 "module was not found. See "
                 "https://github.com/vllm-project/vllm/blob/main/docker/Dockerfile "  # noqa: E501
-                "for instructions on how to install it.")
+                "for instructions on how to install it."
+            )
 
         from vllm.platforms import current_platform
 
-        if (self.override_attention_dtype is not None
-                and not current_platform.is_rocm()):
+        if self.override_attention_dtype is not None and not current_platform.is_rocm():
             warnings.warn(
                 "override-attention-dtype is set but not using ROCm platform",
-                stacklevel=2)
-
-        if (self.enable_sleep_mode
-                and not current_platform.is_sleep_mode_available()):
-            raise ValueError(
-                "Sleep mode is not supported on current platform.")
+                stacklevel=2,
+            )
 
-        hf_config = get_config(self.hf_config_path or self.model,
-                               self.trust_remote_code,
-                               self.revision,
-                               self.code_revision,
-                               self.config_format,
-                               hf_overrides_kw=hf_overrides_kw,
-                               hf_overrides_fn=hf_overrides_fn)
+        if self.enable_sleep_mode and not current_platform.is_sleep_mode_available():
+            raise ValueError("Sleep mode is not supported on current platform.")
+
+        hf_config = get_config(
+            self.hf_config_path or self.model,
+            self.trust_remote_code,
+            self.revision,
+            self.code_revision,
+            self.config_format,
+            hf_overrides_kw=hf_overrides_kw,
+            hf_overrides_fn=hf_overrides_fn,
+        )
 
         self.hf_config = hf_config
         self.hf_text_config = get_hf_text_config(self.hf_config)
-        self.attention_chunk_size = getattr(self.hf_text_config,
-                                            "attention_chunk_size", None)
+        self.attention_chunk_size = getattr(
+            self.hf_text_config, "attention_chunk_size", None
+        )
         self.encoder_config = self._get_encoder_config()
         self.hf_image_processor_config = get_hf_image_processor_config(
-            self.model, hf_token=self.hf_token, revision=self.revision)
+            self.model, hf_token=self.hf_token, revision=self.revision
+        )
 
         architectures = self.architectures
         registry = self.registry
-        is_generative_model = registry.is_text_generation_model(
-            architectures, self)
+        is_generative_model = registry.is_text_generation_model(architectures, self)
         is_pooling_model = registry.is_pooling_model(architectures, self)
 
         def _task_to_convert(task: TaskOption) -> ConvertType:
@@ -474,8 +508,10 @@ def _task_to_convert(task: TaskOption) -> ConvertType:
         if self.task is not None:
             runner: RunnerOption = "auto"
             convert: ConvertOption = "auto"
-            msg_prefix = ("The 'task' option has been deprecated and will be "
-                          "removed in v0.13.0 or v1.0, whichever comes first.")
+            msg_prefix = (
+                "The 'task' option has been deprecated and will be "
+                "removed in v0.13.0 or v1.0, whichever comes first."
+            )
             msg_hint = "Please remove this option."
 
             is_generative_task = self.task in _RUNNER_TASKS["generate"]
@@ -485,15 +521,19 @@ def _task_to_convert(task: TaskOption) -> ConvertType:
                 if is_generative_task:
                     runner = "generate"
                     convert = "auto"
-                    msg_hint = ("Please replace this option with `--runner "
-                                "generate` to continue using this model "
-                                "as a generative model.")
+                    msg_hint = (
+                        "Please replace this option with `--runner "
+                        "generate` to continue using this model "
+                        "as a generative model."
+                    )
                 elif is_pooling_task:
                     runner = "pooling"
                     convert = "auto"
-                    msg_hint = ("Please replace this option with `--runner "
-                                "pooling` to continue using this model "
-                                "as a pooling model.")
+                    msg_hint = (
+                        "Please replace this option with `--runner "
+                        "pooling` to continue using this model "
+                        "as a pooling model."
+                    )
                 else:  # task == "auto"
                     pass
             elif is_generative_model or is_pooling_model:
@@ -504,9 +544,11 @@ def _task_to_convert(task: TaskOption) -> ConvertType:
                 elif is_pooling_task:
                     runner = "pooling"
                     convert = _task_to_convert(self.task)
-                    msg_hint = ("Please replace this option with `--convert "
-                                f"{convert}` to continue using this model "
-                                "as a pooling model.")
+                    msg_hint = (
+                        "Please replace this option with `--convert "
+                        f"{convert}` to continue using this model "
+                        "as a pooling model."
+                    )
                 else:  # task == "auto"
                     pass
             else:
@@ -515,9 +557,11 @@ def _task_to_convert(task: TaskOption) -> ConvertType:
                     "is_generative_model": is_generative_model,
                     "is_pooling_model": is_pooling_model,
                 }
-                raise AssertionError("The model should be a generative or "
-                                     "pooling model when task is set to "
-                                     f"{self.task!r}. Found: {debug_info}")
+                raise AssertionError(
+                    "The model should be a generative or "
+                    "pooling model when task is set to "
+                    f"{self.task!r}. Found: {debug_info}"
+                )
 
             self.runner = runner
             self.convert = convert
@@ -526,16 +570,15 @@ def _task_to_convert(task: TaskOption) -> ConvertType:
             warnings.warn(msg, DeprecationWarning, stacklevel=2)
 
         self.runner_type = self._get_runner_type(architectures, self.runner)
-        self.convert_type = self._get_convert_type(architectures,
-                                                   self.runner_type,
-                                                   self.convert)
+        self.convert_type = self._get_convert_type(
+            architectures, self.runner_type, self.convert
+        )
 
         if self.runner_type == "generate" and not is_generative_model:
             generate_converts = _RUNNER_CONVERTS["generate"]
             if self.convert_type not in generate_converts:
                 # Currently we don't have any converters for generative models
-                raise ValueError(
-                    "This model does not support `--runner generate`.")
+                raise ValueError("This model does not support `--runner generate`.")
         if self.runner_type == "pooling" and not is_pooling_model:
             pooling_converts = _RUNNER_CONVERTS["pooling"]
             if self.convert_type not in pooling_converts:
@@ -543,7 +586,8 @@ def _task_to_convert(task: TaskOption) -> ConvertType:
                 raise ValueError(
                     "This model does not support `--runner pooling`. "
                     f"You can pass `--convert {convert_option} to adapt "
-                    "it into a pooling model.")
+                    "it into a pooling model."
+                )
 
         # Note: Initialize these attributes early because transformers fallback
         # may fail to load dynamic modules in child processes
@@ -558,11 +602,11 @@ def _task_to_convert(task: TaskOption) -> ConvertType:
                 logger.warning_once(
                     "`override_pooler_config` is deprecated and will be "
                     "removed in v0.12.0 or v1.0.0, whichever is sooner. "
-                    "Please use `pooler_config` instead.")
+                    "Please use `pooler_config` instead."
+                )
 
                 if isinstance(self.override_pooler_config, dict):
-                    self.pooler_config = PoolerConfig(
-                        **self.override_pooler_config)
+                    self.pooler_config = PoolerConfig(**self.override_pooler_config)
                 else:
                     self.pooler_config = self.override_pooler_config
 
@@ -589,11 +633,12 @@ def _task_to_convert(task: TaskOption) -> ConvertType:
         )
 
         # Interleaved attention is not supported by some backends in V0
-        if (not self.disable_sliding_window
-                and is_interleaved(self.hf_text_config)
-                and not envs.VLLM_USE_V1
-                and (backend := envs.VLLM_ATTENTION_BACKEND)
-                in ("XFORMERS", "FLASHINFER")):
+        if (
+            not self.disable_sliding_window
+            and is_interleaved(self.hf_text_config)
+            and not envs.VLLM_USE_V1
+            and (backend := envs.VLLM_ATTENTION_BACKEND) in ("XFORMERS", "FLASHINFER")
+        ):
             logger.warning_once(
                 "%s has interleaved attention, which is currently not "
                 "supported by the %s backend. Disabling sliding window and "
@@ -608,11 +653,14 @@ def _task_to_convert(task: TaskOption) -> ConvertType:
         self.max_model_len = self.get_and_verify_max_len(self.max_model_len)
         # Init multimodal config if needed
         if self._model_info.supports_multimodal:
-            if (mm_encoder_tp_mode == "data" and
-                    not self._model_info.supports_multimodal_encoder_tp_data):
+            if (
+                mm_encoder_tp_mode == "data"
+                and not self._model_info.supports_multimodal_encoder_tp_data
+            ):
                 logger.warning_once(
                     "This model does not support `--mm-encoder-tp-mode data`. "
-                    "Falling back to `--mm-encoder-tp-mode weights`.")
+                    "Falling back to `--mm-encoder-tp-mode weights`."
+                )
                 mm_encoder_tp_mode = "weights"
 
             mm_config_kwargs = dict(
@@ -629,8 +677,7 @@ def _task_to_convert(task: TaskOption) -> ConvertType:
             )
 
             mm_config_kwargs = {
-                k: v
-                for k, v in mm_config_kwargs.items() if v is not None
+                k: v for k, v in mm_config_kwargs.items() if v is not None
             }
 
             self.multimodal_config = MultiModalConfig(**mm_config_kwargs)
@@ -662,8 +709,7 @@ def validate_model_config_after(self: "ModelConfig") -> "ModelConfig":
         if not isinstance(self.tokenizer, str):
             raise ValueError("tokenizer must be a string after __post_init__.")
         if not isinstance(self.max_model_len, int):
-            raise ValueError(
-                "max_model_len must be an integer after __post_init__.")
+            raise ValueError("max_model_len must be an integer after __post_init__.")
         return self
 
     def _get_transformers_backend_cls(self) -> str:
@@ -718,8 +764,7 @@ def architecture(self) -> str:
         """The architecture vllm actually used."""
         return self._architecture
 
-    def maybe_pull_model_tokenizer_for_runai(self, model: str,
-                                             tokenizer: str) -> None:
+    def maybe_pull_model_tokenizer_for_runai(self, model: str, tokenizer: str) -> None:
         """Pull model/tokenizer from Object Storage to temporary
         directory when needed.
 
@@ -734,42 +779,45 @@ def maybe_pull_model_tokenizer_for_runai(self, model: str,
         if is_runai_obj_uri(model):
             object_storage_model = ObjectStorageModel(url=model)
             object_storage_model.pull_files(
-                model, allow_pattern=["*.model", "*.py", "*.json"])
+                model, allow_pattern=["*.model", "*.py", "*.json"]
+            )
             self.model_weights = model
             self.model = object_storage_model.dir
 
             # If tokenizer is same as model, download to same directory
             if model == tokenizer:
-                object_storage_model.pull_files(model,
-                                                ignore_pattern=[
-                                                    "*.pt", "*.safetensors",
-                                                    "*.bin", "*.tensors",
-                                                    "*.pth"
-                                                ])
+                object_storage_model.pull_files(
+                    model,
+                    ignore_pattern=[
+                        "*.pt",
+                        "*.safetensors",
+                        "*.bin",
+                        "*.tensors",
+                        "*.pth",
+                    ],
+                )
                 self.tokenizer = object_storage_model.dir
                 return
 
         # Only download tokenizer if needed and not already handled
         if is_runai_obj_uri(tokenizer):
             object_storage_tokenizer = ObjectStorageModel(url=tokenizer)
-            object_storage_tokenizer.pull_files(model,
-                                                ignore_pattern=[
-                                                    "*.pt", "*.safetensors",
-                                                    "*.bin", "*.tensors",
-                                                    "*.pth"
-                                                ])
+            object_storage_tokenizer.pull_files(
+                model,
+                ignore_pattern=["*.pt", "*.safetensors", "*.bin", "*.tensors", "*.pth"],
+            )
             self.tokenizer = object_storage_tokenizer.dir
 
     def _get_encoder_config(self):
-        return get_sentence_transformer_tokenizer_config(
-            self.model, self.revision)
+        return get_sentence_transformer_tokenizer_config(self.model, self.revision)
 
     def _verify_tokenizer_mode(self) -> None:
         tokenizer_mode = cast(TokenizerMode, self.tokenizer_mode.lower())
         if tokenizer_mode not in get_args(TokenizerMode):
             raise ValueError(
                 f"Unknown tokenizer mode: {self.tokenizer_mode}. Must be "
-                f"one of {get_args(TokenizerMode)}.")
+                f"one of {get_args(TokenizerMode)}."
+            )
         self.tokenizer_mode = tokenizer_mode
 
     def _get_default_runner_type(
@@ -811,7 +859,8 @@ def _get_runner_type(
             logger.info(
                 "Resolved `--runner auto` to `--runner %s`. "
                 "Pass the value explicitly to silence this message.",
-                runner_type)
+                runner_type,
+            )
 
         return runner_type
 
@@ -824,16 +873,16 @@ def _get_default_convert_type(
 
         for arch in architectures:
             if arch in registry.get_supported_archs():
-                if (runner_type == "generate"
-                        and registry.is_text_generation_model(
-                            architectures, self)):
+                if runner_type == "generate" and registry.is_text_generation_model(
+                    architectures, self
+                ):
                     return "none"
-                if (runner_type == "pooling"
-                        and registry.is_pooling_model(architectures, self)):
+                if runner_type == "pooling" and registry.is_pooling_model(
+                    architectures, self
+                ):
                     return "none"
 
-            match = try_match_architecture_defaults(arch,
-                                                    runner_type=runner_type)
+            match = try_match_architecture_defaults(arch, runner_type=runner_type)
             if match:
                 _, (_, convert_type) = match
                 return convert_type
@@ -855,15 +904,15 @@ def _get_convert_type(
         if convert != "auto":
             return convert
 
-        convert_type = self._get_default_convert_type(architectures,
-                                                      runner_type)
+        convert_type = self._get_default_convert_type(architectures, runner_type)
 
         # Don't log the most common case
         if convert_type != "none":
             logger.info(
                 "Resolved `--convert auto` to `--convert %s`. "
                 "Pass the value explicitly to silence this message.",
-                convert_type)
+                convert_type,
+            )
 
         return convert_type
 
@@ -875,8 +924,7 @@ def _get_default_pooling_task(
             return "classify"
 
         for arch in architectures:
-            match = try_match_architecture_defaults(arch,
-                                                    runner_type="pooling")
+            match = try_match_architecture_defaults(arch, runner_type="pooling")
             if match:
                 _, (_, convert_type) = match
                 assert convert_type != "none"
@@ -894,28 +942,26 @@ def _parse_quant_hf_config(self, hf_config: PretrainedConfig):
             # Set quant_method for ModelOpt models.
             producer_name = quant_cfg.get("producer", {}).get("name")
             if producer_name == "modelopt":
-                quant_algo = quant_cfg.get("quantization",
-                                           {}).get("quant_algo")
+                quant_algo = quant_cfg.get("quantization", {}).get("quant_algo")
                 if quant_algo == "FP8":
                     quant_cfg["quant_method"] = "modelopt"
                 elif quant_algo == "NVFP4":
                     quant_cfg["quant_method"] = "modelopt_fp4"
                 elif quant_algo is not None:
-                    raise ValueError(
-                        f"Unknown ModelOpt quant algo: {quant_algo}")
+                    raise ValueError(f"Unknown ModelOpt quant algo: {quant_algo}")
 
         return quant_cfg
 
     def _verify_quantization(self) -> None:
         supported_quantization = me_quant.QUANTIZATION_METHODS
         if self.quantization is not None:
-            self.quantization = cast(me_quant.QuantizationMethods,
-                                     self.quantization)
+            self.quantization = cast(me_quant.QuantizationMethods, self.quantization)
 
         # Parse quantization method from the HF model config, if available.
         quant_cfg = self._parse_quant_hf_config(self.hf_config)
-        if quant_cfg is None and (text_config := getattr(
-                self.hf_config, "text_config", None)):
+        if quant_cfg is None and (
+            text_config := getattr(self.hf_config, "text_config", None)
+        ):
             # Check the text config as well for multi-modal models.
             quant_cfg = self._parse_quant_hf_config(text_config)
 
@@ -924,8 +970,9 @@ def _verify_quantization(self) -> None:
             quant_method = quant_cfg.get("quant_method", "").lower()
 
             # Normalize library names
-            quant_method = quant_method.replace("compressed_tensors",
-                                                "compressed-tensors")
+            quant_method = quant_method.replace(
+                "compressed_tensors", "compressed-tensors"
+            )
 
             quant_cfg["quant_method"] = quant_method
 
@@ -959,18 +1006,22 @@ def _verify_quantization(self) -> None:
             for name in quantization_methods:
                 method = me_quant.get_quantization_config(name)
                 quantization_override = method.override_quantization_method(
-                    quant_cfg, self.quantization)
+                    quant_cfg, self.quantization
+                )
                 if quantization_override is not None:
                     # Raise error if the override is not custom (custom would
                     # be in QUANTIZATION_METHODS but not QuantizationMethods)
                     # and hasn't been added to the overrides list.
-                    if (name in get_args(me_quant.QuantizationMethods)
-                            and name not in overrides):
+                    if (
+                        name in get_args(me_quant.QuantizationMethods)
+                        and name not in overrides
+                    ):
                         raise ValueError(
                             f"Quantization method {name} is an override but "
                             "is has not been added to the `overrides` list "
                             "above. This is necessary to ensure that the "
-                            "overrides are checked in order of preference.")
+                            "overrides are checked in order of preference."
+                        )
                     quant_method = quantization_override
                     self.quantization = quantization_override
                     break
@@ -984,24 +1035,28 @@ def _verify_quantization(self) -> None:
                     "Quantization method specified in the model config "
                     f"({quant_method}) does not match the quantization "
                     f"method specified in the `quantization` argument "
-                    f"({self.quantization}).")
+                    f"({self.quantization})."
+                )
 
         if self.quantization is not None:
             if self.quantization not in supported_quantization:
                 raise ValueError(
                     f"Unknown quantization method: {self.quantization}. Must "
-                    f"be one of {supported_quantization}.")
+                    f"be one of {supported_quantization}."
+                )
             from vllm.platforms import current_platform
+
             current_platform.verify_quantization(self.quantization)
 
     def _verify_cuda_graph(self) -> None:
         # CUDAGraph capture not supported for encoder-decoder models on ROCm
         unsupported_rocm = self.is_encoder_decoder
-        if (unsupported_rocm and not self.enforce_eager
-                and current_platform.is_rocm()):
+        if unsupported_rocm and not self.enforce_eager and current_platform.is_rocm():
             logger.warning(
                 "CUDA graph is not supported for %s on ROCm yet, fallback "
-                "to eager mode.", self.hf_config.model_type)
+                "to eager mode.",
+                self.hf_config.model_type,
+            )
             self.enforce_eager = True
 
     def _verify_bnb_config(self) -> None:
@@ -1011,20 +1066,26 @@ def _verify_bnb_config(self) -> None:
         # TODO Remove this when bitsandbytes supports.
         """
         is_bitsandbytes = self.quantization == "bitsandbytes"
-        has_quantization_config = (getattr(self.hf_config,
-                                           "quantization_config", None)
-                                   is not None)
-        is_8bit = (self.hf_config.quantization_config.get(
-            "load_in_8bit", False) if has_quantization_config else False)
-        if all([
+        has_quantization_config = (
+            getattr(self.hf_config, "quantization_config", None) is not None
+        )
+        is_8bit = (
+            self.hf_config.quantization_config.get("load_in_8bit", False)
+            if has_quantization_config
+            else False
+        )
+        if all(
+            [
                 is_bitsandbytes,
                 has_quantization_config,
                 is_8bit,
                 not self.enforce_eager,
-        ]):
+            ]
+        ):
             logger.warning(
                 "CUDA graph is not supported on BitsAndBytes 8bit yet, "
-                "fallback to the eager mode.")
+                "fallback to the eager mode."
+            )
 
             self.enforce_eager = True
 
@@ -1033,7 +1094,8 @@ def _verify_with_expert_parallelism(self) -> None:
         if num_experts < 1:
             raise ValueError(
                 "Number of experts in the model must be greater than 0 "
-                "when expert parallelism is enabled.")
+                "when expert parallelism is enabled."
+            )
 
     def verify_dual_chunk_attention_config(
         self,
@@ -1042,45 +1104,54 @@ def verify_dual_chunk_attention_config(
         if hasattr(self.hf_config, "dual_chunk_attention_config"):
             # Try loading the sparse attention config
             from vllm.model_executor.model_loader.weight_utils import (
-                get_sparse_attention_config)
+                get_sparse_attention_config,
+            )
+
             sparse_attn_config = get_sparse_attention_config(self, load_config)
             if sparse_attn_config:
                 self.hf_config.dual_chunk_attention_config[
-                    "sparse_attention_config"] = sparse_attn_config
-                if "sparse_attention_enabled" not in \
-                        self.hf_config.dual_chunk_attention_config:
+                    "sparse_attention_config"
+                ] = sparse_attn_config
+                if (
+                    "sparse_attention_enabled"
+                    not in self.hf_config.dual_chunk_attention_config
+                ):
                     self.hf_config.dual_chunk_attention_config[
-                        "sparse_attention_enabled"] = True
+                        "sparse_attention_enabled"
+                    ] = True
 
     def verify_with_parallel_config(
         self,
         parallel_config: ParallelConfig,
     ) -> None:
-
         if parallel_config.distributed_executor_backend == "external_launcher":
             assert self.seed is not None, (
                 "Seed must be set when using external launcher backend to "
-                "make sure sampling results are the same across workers.")
+                "make sure sampling results are the same across workers."
+            )
 
-        total_num_attention_heads = getattr(self.hf_text_config,
-                                            "num_attention_heads", 0)
+        total_num_attention_heads = getattr(
+            self.hf_text_config, "num_attention_heads", 0
+        )
         tensor_parallel_size = parallel_config.tensor_parallel_size
         if total_num_attention_heads % tensor_parallel_size != 0:
             raise ValueError(
                 f"Total number of attention heads ({total_num_attention_heads})"
                 " must be divisible by tensor parallel size "
-                f"({tensor_parallel_size}).")
+                f"({tensor_parallel_size})."
+            )
 
         if parallel_config.enable_expert_parallel:
             self._verify_with_expert_parallelism()
 
         pipeline_parallel_size = parallel_config.pipeline_parallel_size
-        if (pipeline_parallel_size > 1
-                and not self.registry.is_pp_supported_model(
-                    self.architectures, self)):
+        if pipeline_parallel_size > 1 and not self.registry.is_pp_supported_model(
+            self.architectures, self
+        ):
             raise NotImplementedError(
                 "Pipeline parallelism is not supported for this model. "
-                "Supported models implement the `SupportsPP` interface.")
+                "Supported models implement the `SupportsPP` interface."
+            )
 
     def get_sliding_window(self) -> Optional[int]:
         """Get the sliding window size from the HF text config if present."""
@@ -1096,34 +1167,39 @@ def get_hidden_size(self) -> int:
     def is_deepseek_mla(self) -> bool:
         if not hasattr(self.hf_text_config, "model_type"):
             return False
-        elif self.hf_text_config.model_type in \
-            ('deepseek_v2', 'deepseek_v3', 'deepseek_v32', 'deepseek_mtp',
-              'kimi_k2', 'longcat_flash'):
+        elif self.hf_text_config.model_type in (
+            "deepseek_v2",
+            "deepseek_v3",
+            "deepseek_v32",
+            "deepseek_mtp",
+            "kimi_k2",
+            "longcat_flash",
+        ):
             return self.hf_text_config.kv_lora_rank is not None
-        elif self.hf_text_config.model_type == 'eagle':
+        elif self.hf_text_config.model_type == "eagle":
             # if the model is an EAGLE module, check for the
             # underlying architecture
-            return self.hf_text_config.model.model_type in \
-                    ('deepseek_v2', 'deepseek_v3', 'deepseek_v32') \
+            return (
+                self.hf_text_config.model.model_type
+                in ("deepseek_v2", "deepseek_v3", "deepseek_v32")
                 and self.hf_text_config.kv_lora_rank is not None
+            )
         return False
 
     def get_head_size(self) -> int:
         # TODO remove hard code
         if self.is_deepseek_mla:
-            qk_rope_head_dim = getattr(self.hf_text_config, "qk_rope_head_dim",
-                                       0)
+            qk_rope_head_dim = getattr(self.hf_text_config, "qk_rope_head_dim", 0)
             if self.use_mla:
                 return self.hf_text_config.kv_lora_rank + qk_rope_head_dim
             else:
-                qk_nope_head_dim = getattr(self.hf_text_config,
-                                           "qk_nope_head_dim", 0)
+                qk_nope_head_dim = getattr(self.hf_text_config, "qk_nope_head_dim", 0)
                 if qk_rope_head_dim and qk_nope_head_dim:
                     return qk_rope_head_dim + qk_nope_head_dim
 
-        if hasattr(self.hf_text_config,
-                   "model_type") and (self.hf_text_config.model_type
-                                      == "zamba2"):
+        if hasattr(self.hf_text_config, "model_type") and (
+            self.hf_text_config.model_type == "zamba2"
+        ):
             return self.hf_text_config.attention_head_dim
 
         if self.is_attention_free:
@@ -1134,13 +1210,13 @@ def get_head_size(self) -> int:
             return self.hf_text_config.head_dim
 
         # NOTE: Some models (such as PLaMo2.1) use `hidden_size_per_head`
-        if getattr(self.hf_text_config, "hidden_size_per_head",
-                   None) is not None:
+        if getattr(self.hf_text_config, "hidden_size_per_head", None) is not None:
             return self.hf_text_config.hidden_size_per_head
 
         # FIXME(woosuk): This may not be true for all models.
-        return (self.hf_text_config.hidden_size //
-                self.hf_text_config.num_attention_heads)
+        return (
+            self.hf_text_config.hidden_size // self.hf_text_config.num_attention_heads
+        )
 
     def get_total_num_kv_heads(self) -> int:
         """Returns the total number of KV heads."""
@@ -1151,9 +1227,11 @@ def get_total_num_kv_heads(self) -> int:
         falcon_model_types = ["falcon", "RefinedWeb", "RefinedWebModel"]
         new_decoder_arch_falcon = (
             self.hf_config.model_type in falcon_model_types
-            and getattr(self.hf_config, "new_decoder_architecture", False))
-        if not new_decoder_arch_falcon and getattr(self.hf_text_config,
-                                                   "multi_query", False):
+            and getattr(self.hf_config, "new_decoder_architecture", False)
+        )
+        if not new_decoder_arch_falcon and getattr(
+            self.hf_text_config, "multi_query", False
+        ):
             # Multi-query attention, only one KV head.
             # Currently, tensor parallelism is not supported in this case.
             return 1
@@ -1164,14 +1242,19 @@ def get_total_num_kv_heads(self) -> int:
                 return self.hf_config.attn_config["kv_n_heads"]
             return self.hf_config.num_attention_heads
         if self.hf_config.model_type == "dbrx":
-            return getattr(self.hf_config.attn_config, "kv_n_heads",
-                           self.hf_config.num_attention_heads)
+            return getattr(
+                self.hf_config.attn_config,
+                "kv_n_heads",
+                self.hf_config.num_attention_heads,
+            )
 
         if self.hf_config.model_type == "nemotron-nas":
             for block in self.hf_config.block_configs:
                 if not block.attention.no_op:
-                    return self.hf_config.num_attention_heads \
+                    return (
+                        self.hf_config.num_attention_heads
                         // block.attention.n_heads_in_group
+                    )
 
             raise RuntimeError("Couldn't determine number of kv heads")
 
@@ -1207,8 +1290,7 @@ def get_num_kv_heads(self, parallel_config: ParallelConfig) -> int:
         # the tensor parallel size. We will replicate the KV heads in the
         # case where the number of KV heads is smaller than the tensor
         # parallel size so each GPU has at least one KV head.
-        return max(1,
-                   total_num_kv_heads // parallel_config.tensor_parallel_size)
+        return max(1, total_num_kv_heads // parallel_config.tensor_parallel_size)
 
     def get_num_attention_heads(self, parallel_config: ParallelConfig) -> int:
         num_heads = getattr(self.hf_text_config, "num_attention_heads", 0)
@@ -1230,24 +1312,32 @@ def get_num_experts(self) -> int:
         return num_experts
 
     def get_layers_start_end_indices(
-            self, parallel_config: ParallelConfig) -> tuple[int, int]:
+        self, parallel_config: ParallelConfig
+    ) -> tuple[int, int]:
         from vllm.distributed.utils import get_pp_indices
-        if (self.hf_text_config.model_type == "deepseek_mtp"
-                or self.hf_config.model_type == "mimo_mtp"
-                or self.hf_config.model_type == "glm4_moe_mtp"
-                or self.hf_config.model_type == "ernie_mtp"
-                or self.hf_config.model_type == "qwen3_next_mtp"):
-            total_num_hidden_layers = getattr(self.hf_text_config,
-                                              "num_nextn_predict_layers", 0)
-        elif (self.hf_config.model_type == "longcat_flash_mtp"):
-            total_num_hidden_layers = getattr(self.hf_text_config,
-                                              "num_nextn_predict_layers", 1)
+
+        if (
+            self.hf_text_config.model_type == "deepseek_mtp"
+            or self.hf_config.model_type == "mimo_mtp"
+            or self.hf_config.model_type == "glm4_moe_mtp"
+            or self.hf_config.model_type == "ernie_mtp"
+            or self.hf_config.model_type == "qwen3_next_mtp"
+        ):
+            total_num_hidden_layers = getattr(
+                self.hf_text_config, "num_nextn_predict_layers", 0
+            )
+        elif self.hf_config.model_type == "longcat_flash_mtp":
+            total_num_hidden_layers = getattr(
+                self.hf_text_config, "num_nextn_predict_layers", 1
+            )
         else:
-            total_num_hidden_layers = getattr(self.hf_text_config,
-                                              "num_hidden_layers", 0)
+            total_num_hidden_layers = getattr(
+                self.hf_text_config, "num_hidden_layers", 0
+            )
         # the layout order is: DP x PP x TP
-        pp_rank = (parallel_config.rank // parallel_config.tensor_parallel_size
-                   ) % parallel_config.pipeline_parallel_size
+        pp_rank = (
+            parallel_config.rank // parallel_config.tensor_parallel_size
+        ) % parallel_config.pipeline_parallel_size
         pp_size = parallel_config.pipeline_parallel_size
         start, end = get_pp_indices(total_num_hidden_layers, pp_rank, pp_size)
         return start, end
@@ -1264,9 +1354,9 @@ def get_num_layers_by_block_type(
         # This function relies on 'layers_block_type' in hf_config,
         # for w/o this attribute, we will need to have workarounds like so
         attn_block_type = block_type == LayerBlockType.attention
-        is_transformer = not self.is_hybrid and \
-                            not self.has_noops and \
-                            not self.is_attention_free
+        is_transformer = (
+            not self.is_hybrid and not self.has_noops and not self.is_attention_free
+        )
         start, end = self.get_layers_start_end_indices(parallel_config)
 
         if is_transformer:
@@ -1279,23 +1369,25 @@ def get_num_layers_by_block_type(
             return 0 if attn_block_type else end - start
         elif self.has_noops:
             block_configs = self.hf_config.block_configs
-            return sum(not bc.attention.no_op
-                       for bc in block_configs[start:end])
+            return sum(not bc.attention.no_op for bc in block_configs[start:end])
         else:
             # Hybrid model Jamba
-            layers_block_type_value = getattr(self.hf_text_config,
-                                              "layers_block_type", None)
+            layers_block_type_value = getattr(
+                self.hf_text_config, "layers_block_type", None
+            )
             if layers_block_type_value is not None:
-                if hasattr(self.hf_text_config,
-                           "model_type") and (self.hf_text_config.model_type
-                                              == "zamba2"):
+                if hasattr(self.hf_text_config, "model_type") and (
+                    self.hf_text_config.model_type == "zamba2"
+                ):
                     if attn_block_type:
-                        return sum(t == "hybrid"
-                                   for t in layers_block_type_value[start:end])
+                        return sum(
+                            t == "hybrid" for t in layers_block_type_value[start:end]
+                        )
                     else:
                         return self.get_num_layers(parallel_config)
-                return sum(t == block_type.value
-                           for t in layers_block_type_value[start:end])
+                return sum(
+                    t == block_type.value for t in layers_block_type_value[start:end]
+                )
 
             # Hybrid model Minimax
             attn_type_list = getattr(self.hf_config, "attn_type_list", None)
@@ -1306,23 +1398,30 @@ def get_num_layers_by_block_type(
             layer_types_value = getattr(self.hf_config, "layer_types", None)
             if layer_types_value is not None:
                 if getattr(block_type, "value", block_type) == "attention":
-                    return sum(t == "full_attention"
-                               for t in layer_types_value[start:end])
-                elif getattr(block_type, "value",
-                             block_type) == "linear_attention":
-                    return sum(t == "linear_attention"
-                               for t in layer_types_value[start:end])
+                    return sum(
+                        t == "full_attention" for t in layer_types_value[start:end]
+                    )
+                elif getattr(block_type, "value", block_type) == "linear_attention":
+                    return sum(
+                        t == "linear_attention" for t in layer_types_value[start:end]
+                    )
                 else:
-                    return sum(t == getattr(block_type, "value", block_type)
-                               for t in layer_types_value[start:end])
-
-            if (layers_block_type_value is None and attn_type_list is None
-                    and layer_types_value is None):
+                    return sum(
+                        t == getattr(block_type, "value", block_type)
+                        for t in layer_types_value[start:end]
+                    )
+
+            if (
+                layers_block_type_value is None
+                and attn_type_list is None
+                and layer_types_value is None
+            ):
                 raise ValueError(
                     "The model is an hybrid without a"
                     "layers_block_type or an attn_type_list, or a layer_types "
                     "in the hf_config, cannot determine the num of "
-                    f"{block_type.value} layers")
+                    f"{block_type.value} layers"
+                )
 
     def get_mamba_chunk_size(self) -> Optional[int]:
         """
@@ -1411,14 +1510,14 @@ def get_diff_sampling_param(self) -> dict[str, Any]:
         ]
         if any(p in config for p in available_params):
             diff_sampling_param = {
-                p: config.get(p)
-                for p in available_params if config.get(p) is not None
+                p: config.get(p) for p in available_params if config.get(p) is not None
             }
             # Huggingface definition of max_new_tokens is equivalent
             # to vLLM's max_tokens
             if "max_new_tokens" in diff_sampling_param:
                 diff_sampling_param["max_tokens"] = diff_sampling_param.pop(
-                    "max_new_tokens")
+                    "max_new_tokens"
+                )
         else:
             diff_sampling_param = {}
 
@@ -1427,7 +1526,8 @@ def get_diff_sampling_param(self) -> dict[str, Any]:
                 "Default sampling parameters have been overridden by the "
                 "model's Hugging Face generation config recommended from the "
                 "model creator. If this is not intended, please relaunch "
-                "vLLM instance with `--generation-config vllm`.")
+                "vLLM instance with `--generation-config vllm`."
+            )
         return diff_sampling_param
 
     @property
@@ -1449,8 +1549,9 @@ def is_multimodal_raw_input_only_model(self) -> bool:
 
     @property
     def is_cross_encoder(self) -> bool:
-        return (self._model_info.supports_cross_encoding
-                or self.convert_type == "classify")
+        return (
+            self._model_info.supports_cross_encoding or self.convert_type == "classify"
+        )
 
     @property
     def is_pp_supported(self) -> bool:
@@ -1482,8 +1583,9 @@ def use_mla(self) -> bool:
 
     @property
     def is_matryoshka(self) -> bool:
-        return (bool(getattr(self.hf_config, "matryoshka_dimensions", None))
-                or getattr(self.hf_config, "is_matryoshka", False))
+        return bool(getattr(self.hf_config, "matryoshka_dimensions", None)) or getattr(
+            self.hf_config, "is_matryoshka", False
+        )
 
     @property
     def matryoshka_dimensions(self):
@@ -1507,20 +1609,25 @@ def head_dtype(self) -> torch.dtype:
         you can use --hf-overrides '{"head_dtype": "model"}' to disable it.
         """
 
-        head_dtype = _get_head_dtype(config=self.hf_config,
-                                     dtype=self.dtype,
-                                     runner_type=self.runner_type)
+        head_dtype = _get_head_dtype(
+            config=self.hf_config, dtype=self.dtype, runner_type=self.runner_type
+        )
 
         if self.runner_type != "pooling" and head_dtype != self.dtype:
             logger.warning_once(
                 "`head_dtype` currently only supports pooling models."
-                "fallback to model dtype [%s].", self.dtype)
+                "fallback to model dtype [%s].",
+                self.dtype,
+            )
             return self.dtype
 
         if head_dtype not in current_platform.supported_dtypes:
             logger.warning_once(
                 "The current platform does not support [%s] head dtype, "
-                "fallback to model dtype [%s].", head_dtype, self.dtype)
+                "fallback to model dtype [%s].",
+                head_dtype,
+                self.dtype,
+            )
             return self.dtype
 
         logger.debug_once("head dtype: %s", head_dtype)
@@ -1530,12 +1637,15 @@ def get_and_verify_max_len(self, max_model_len: int):
         # Consider max_model_len in tokenizer_config only when
         # pooling models use absolute position_embedding.
         tokenizer_config = None
-        if (self.runner_type == "pooling" and getattr(
-                self.hf_config, "position_embedding_type", "") == "absolute"):
+        if (
+            self.runner_type == "pooling"
+            and getattr(self.hf_config, "position_embedding_type", "") == "absolute"
+        ):
             tokenizer_config = try_get_tokenizer_config(
                 self.tokenizer,
                 trust_remote_code=self.trust_remote_code,
-                revision=self.tokenizer_revision)
+                revision=self.tokenizer_revision,
+            )
         max_model_len = _get_and_verify_max_len(
             hf_config=self.hf_text_config,
             tokenizer_config=tokenizer_config,
@@ -1543,13 +1653,15 @@ def get_and_verify_max_len(self, max_model_len: int):
             disable_sliding_window=self.disable_sliding_window,
             sliding_window=self.get_sliding_window(),
             spec_target_max_model_len=self.spec_target_max_model_len,
-            encoder_config=self.encoder_config)
+            encoder_config=self.encoder_config,
+        )
         logger.info("Using max model len %s", max_model_len)
         return max_model_len
 
 
-def get_served_model_name(model: str,
-                          served_model_name: Optional[Union[str, list[str]]]):
+def get_served_model_name(
+    model: str, served_model_name: Optional[Union[str, list[str]]]
+):
     """
     If the input is a non-empty list, the first model_name in
     `served_model_name` is taken.
@@ -1596,11 +1708,15 @@ def try_match_architecture_defaults(
     runner_type: Optional[RunnerType] = None,
     convert_type: Optional[ConvertType] = None,
 ) -> Optional[tuple[str, tuple[RunnerType, ConvertType]]]:
-    for suffix, (default_runner_type,
-                 default_convert_type) in iter_architecture_defaults():
-        if ((runner_type is None or runner_type == default_runner_type) and
-            (convert_type is None or convert_type == default_convert_type)
-                and architecture.endswith(suffix)):
+    for suffix, (
+        default_runner_type,
+        default_convert_type,
+    ) in iter_architecture_defaults():
+        if (
+            (runner_type is None or runner_type == default_runner_type)
+            and (convert_type is None or convert_type == default_convert_type)
+            and architecture.endswith(suffix)
+        ):
             return suffix, (default_runner_type, default_convert_type)
 
     return None
@@ -1618,8 +1734,7 @@ def try_match_architecture_defaults(
 _FLOAT16_NOT_SUPPORTED_MODELS = {
     "gemma2": "Numerical instability. Please use bfloat16 or float32 instead.",
     "gemma3": "Numerical instability. Please use bfloat16 or float32 instead.",
-    "gemma3_text":
-    "Numerical instability. Please use bfloat16 or float32 instead.",
+    "gemma3_text": "Numerical instability. Please use bfloat16 or float32 instead.",
     "plamo2": "Numerical instability. Please use bfloat16 or float32 instead.",
     "glm4": "Numerical instability. Please use bfloat16 or float32 instead.",
 }
@@ -1635,8 +1750,9 @@ def _is_valid_dtype(model_type: str, dtype: torch.dtype):
 def _check_valid_dtype(model_type: str, dtype: torch.dtype):
     if model_type in _FLOAT16_NOT_SUPPORTED_MODELS and dtype == torch.float16:
         reason = _FLOAT16_NOT_SUPPORTED_MODELS[model_type]
-        raise ValueError(f"The model type {model_type!r} "
-                         f"does not support float16. Reason: {reason}")
+        raise ValueError(
+            f"The model type {model_type!r} does not support float16. Reason: {reason}"
+        )
 
     return True
 
@@ -1690,7 +1806,8 @@ def _resolve_auto_dtype(
     from vllm.platforms import current_platform
 
     supported_dtypes = [
-        dtype for dtype in current_platform.supported_dtypes
+        dtype
+        for dtype in current_platform.supported_dtypes
         if _is_valid_dtype(model_type, dtype)
     ]
 
@@ -1717,8 +1834,7 @@ def _resolve_auto_dtype(
         device_str = f"{device_name!r} (with compute capability {version_str})"
 
     logger.warning(
-        "Your device %s doesn't support %s. "
-        "Falling back to %s for compatibility.",
+        "Your device %s doesn't support %s. Falling back to %s for compatibility.",
         device_str,
         config_dtype,
         preferred_dtype,
@@ -1772,11 +1888,10 @@ def _get_and_verify_dtype(
     return torch_dtype
 
 
-def _get_head_dtype(config: PretrainedConfig, dtype: torch.dtype,
-                    runner_type: str) -> torch.dtype:
-    head_dtype: Optional[Union[str,
-                               torch.dtype]] = getattr(config, "head_dtype",
-                                                       None)
+def _get_head_dtype(
+    config: PretrainedConfig, dtype: torch.dtype, runner_type: str
+) -> torch.dtype:
+    head_dtype: Optional[Union[str, torch.dtype]] = getattr(config, "head_dtype", None)
 
     if head_dtype == "model":
         return dtype
@@ -1831,8 +1946,7 @@ def _get_and_verify_max_len(
     for key in possible_keys:
         max_len = getattr(hf_config, key, None)
         if max_len is not None:
-            max_len_key = key if max_len < derived_max_model_len \
-                else max_len_key
+            max_len_key = key if max_len < derived_max_model_len else max_len_key
             derived_max_model_len = min(derived_max_model_len, max_len)
     # For Command-R / Cohere, Cohere2 / Aya Vision models
     if tmp_max_len := getattr(hf_config, "model_max_length", None):
@@ -1841,17 +1955,20 @@ def _get_and_verify_max_len(
 
     # If sliding window is manually disabled, max_length should be less
     # than the sliding window length in the model config.
-    if (disable_sliding_window and sliding_window is not None
-            and sliding_window < derived_max_model_len):
+    if (
+        disable_sliding_window
+        and sliding_window is not None
+        and sliding_window < derived_max_model_len
+    ):
         max_len_key = "sliding_window"
         derived_max_model_len = sliding_window
 
     # Consider model_max_length in tokenizer_config
     if tokenizer_config:
         tokenizer_model_max_length = tokenizer_config.get(
-            "model_max_length", derived_max_model_len)
-        derived_max_model_len = min(derived_max_model_len,
-                                    tokenizer_model_max_length)
+            "model_max_length", derived_max_model_len
+        )
+        derived_max_model_len = min(derived_max_model_len, tokenizer_model_max_length)
 
     # If none of the keys were found in the config, use a default and
     # log a warning.
@@ -1869,8 +1986,10 @@ def _get_and_verify_max_len(
         logger.warning(
             "The model's config.json does not contain any of the following "
             "keys to determine the original maximum length of the model: "
-            "%s. Assuming the model's maximum length is %d.", possible_keys,
-            default_max_len)
+            "%s. Assuming the model's maximum length is %d.",
+            possible_keys,
+            default_max_len,
+        )
         derived_max_model_len = default_max_len
 
     rope_scaling = getattr(hf_config, "rope_scaling", None)
@@ -1888,15 +2007,15 @@ def _get_and_verify_max_len(
                 raise NotImplementedError(
                     "Disabling sliding window is not supported for models "
                     "with rope_scaling. Please raise an issue so we can "
-                    "investigate.")
+                    "investigate."
+                )
 
             # NOTE: rope_type == "default" does not define factor
             # https://github.com/huggingface/transformers/blob/v4.45.2/src/transformers/modeling_rope_utils.py
             scaling_factor = rope_scaling.get("factor", 1.0)
 
             if rope_type == "yarn":
-                derived_max_model_len = rope_scaling[
-                    "original_max_position_embeddings"]
+                derived_max_model_len = rope_scaling["original_max_position_embeddings"]
             derived_max_model_len *= scaling_factor
 
     if encoder_config and "max_seq_length" in encoder_config:
@@ -1913,7 +2032,9 @@ def _get_and_verify_max_len(
                 "which might be too large."
                 "Please input with --max-model-len based on your "
                 "request input length and output length, to avoid "
-                "unnecessary degradation.", max_model_len)
+                "unnecessary degradation.",
+                max_model_len,
+            )
     elif max_model_len > derived_max_model_len:
         # Some models might have a separate key for specifying model_max_length
         # that will be bigger than derived_max_model_len. We compare user input
@@ -1926,24 +2047,28 @@ def _get_and_verify_max_len(
                 raise NotImplementedError(
                     "Disabling sliding window is not supported for models "
                     "model_max_length in the config. Please raise an issue "
-                    "so we can investigate.")
+                    "so we can investigate."
+                )
         else:
             msg = (
                 f"User-specified max_model_len ({max_model_len}) is greater "
                 f"than the derived max_model_len ({max_len_key}="
                 f"{derived_max_model_len} or model_max_length="
-                f"{model_max_length} in model's config.json).")
+                f"{model_max_length} in model's config.json)."
+            )
             warning = (
                 "VLLM_ALLOW_LONG_MAX_MODEL_LEN must be used with extreme "
                 "caution. If the model uses relative position encoding (RoPE), "
                 "positions exceeding derived_max_model_len lead to nan. If the "
                 "model uses absolute position encoding, positions exceeding "
                 "derived_max_model_len will cause a CUDA array out-of-bounds "
-                "error.")
+                "error."
+            )
             if envs.VLLM_ALLOW_LONG_MAX_MODEL_LEN:
                 logger.warning_once("%s %s", msg, warning)
             else:
                 raise ValueError(
                     f"{msg} To allow overriding this maximum, set "
-                    f"the env var VLLM_ALLOW_LONG_MAX_MODEL_LEN=1. {warning}")
+                    f"the env var VLLM_ALLOW_LONG_MAX_MODEL_LEN=1. {warning}"
+                )
     return int(max_model_len)
diff --git a/vllm/config/multimodal.py b/vllm/config/multimodal.py
index fd62d2411ade..fc8d2262dcb4 100644
--- a/vllm/config/multimodal.py
+++ b/vllm/config/multimodal.py
@@ -15,12 +15,14 @@
 @dataclass
 class BaseDummyOptions:
     """Base options for generating dummy data during profiling."""
+
     count: int = Field(999, ge=0)
 
 
 @dataclass(config=ConfigDict(extra="forbid"))
 class VideoDummyOptions(BaseDummyOptions):
     """Options for generating dummy video data during profiling."""
+
     num_frames: Optional[int] = Field(None, gt=0)
     width: Optional[int] = Field(None, gt=0)
     height: Optional[int] = Field(None, gt=0)
@@ -29,6 +31,7 @@ class VideoDummyOptions(BaseDummyOptions):
 @dataclass(config=ConfigDict(extra="forbid"))
 class ImageDummyOptions(BaseDummyOptions):
     """Options for generating dummy image data during profiling."""
+
     width: Optional[int] = Field(None, gt=0)
     height: Optional[int] = Field(None, gt=0)
 
@@ -36,13 +39,15 @@ class ImageDummyOptions(BaseDummyOptions):
 @dataclass(config=ConfigDict(extra="forbid"))
 class AudioDummyOptions(BaseDummyOptions):
     """Options for generating dummy audio data during profiling."""
+
     length: Optional[int] = Field(None, gt=0)
 
 
 MMEncoderTPMode = Literal["weights", "data"]
 MMCacheType = Literal["shm", "lru"]
-DummyOptions = Union[BaseDummyOptions, VideoDummyOptions, ImageDummyOptions,
-                     AudioDummyOptions]
+DummyOptions = Union[
+    BaseDummyOptions, VideoDummyOptions, ImageDummyOptions, AudioDummyOptions
+]
 
 
 @config
@@ -127,9 +132,8 @@ class MultiModalConfig:
     @field_validator("limit_per_prompt", mode="before")
     @classmethod
     def _validate_limit_per_prompt(
-        cls, value: dict[str, Union[int,
-                                    dict[str,
-                                         int]]]) -> dict[str, DummyOptions]:
+        cls, value: dict[str, Union[int, dict[str, int]]]
+    ) -> dict[str, DummyOptions]:
         for k, v in value.items():
             # Handle legacy format where only count is specified
             if isinstance(v, int):
@@ -160,8 +164,7 @@ def compute_hash(self) -> str:
         # no factors to consider.
         # this config will not affect the computation graph.
         factors: list[Any] = []
-        hash_str = hashlib.md5(str(factors).encode(),
-                               usedforsecurity=False).hexdigest()
+        hash_str = hashlib.md5(str(factors).encode(), usedforsecurity=False).hexdigest()
         return hash_str
 
     def get_limit_per_prompt(self, modality: str) -> int:
@@ -196,5 +199,4 @@ def merge_mm_processor_kwargs(
         return kwargs | dict(inference_kwargs)
 
     def is_multimodal_pruning_enabled(self):
-        return (self.video_pruning_rate is not None
-                and self.video_pruning_rate > 0)
+        return self.video_pruning_rate is not None and self.video_pruning_rate > 0
diff --git a/vllm/config/observability.py b/vllm/config/observability.py
index 766d03051e21..6c7b5fbbee47 100644
--- a/vllm/config/observability.py
+++ b/vllm/config/observability.py
@@ -31,8 +31,7 @@ def show_hidden_metrics(self) -> bool:
         """Check if the hidden metrics should be shown."""
         if self.show_hidden_metrics_for_version is None:
             return False
-        return version._prev_minor_version_was(
-            self.show_hidden_metrics_for_version)
+        return version._prev_minor_version_was(self.show_hidden_metrics_for_version)
 
     otlp_traces_endpoint: Optional[str] = None
     """Target URL to which OpenTelemetry traces will be sent."""
@@ -49,16 +48,18 @@ def show_hidden_metrics(self) -> bool:
     @cached_property
     def collect_model_forward_time(self) -> bool:
         """Whether to collect model forward time for the request."""
-        return (self.collect_detailed_traces is not None
-                and ("model" in self.collect_detailed_traces
-                     or "all" in self.collect_detailed_traces))
+        return self.collect_detailed_traces is not None and (
+            "model" in self.collect_detailed_traces
+            or "all" in self.collect_detailed_traces
+        )
 
     @cached_property
     def collect_model_execute_time(self) -> bool:
         """Whether to collect model execute time for the request."""
-        return (self.collect_detailed_traces is not None
-                and ("worker" in self.collect_detailed_traces
-                     or "all" in self.collect_detailed_traces))
+        return self.collect_detailed_traces is not None and (
+            "worker" in self.collect_detailed_traces
+            or "all" in self.collect_detailed_traces
+        )
 
     def compute_hash(self) -> str:
         """
@@ -75,25 +76,28 @@ def compute_hash(self) -> str:
         # no factors to consider.
         # this config will not affect the computation graph.
         factors: list[Any] = []
-        hash_str = hashlib.md5(str(factors).encode(),
-                               usedforsecurity=False).hexdigest()
+        hash_str = hashlib.md5(str(factors).encode(), usedforsecurity=False).hexdigest()
         return hash_str
 
     def __post_init__(self):
-        if (self.collect_detailed_traces is not None
-                and len(self.collect_detailed_traces) == 1
-                and "," in self.collect_detailed_traces[0]):
+        if (
+            self.collect_detailed_traces is not None
+            and len(self.collect_detailed_traces) == 1
+            and "," in self.collect_detailed_traces[0]
+        ):
             self._parse_collect_detailed_traces()
 
         from vllm.tracing import is_otel_available, otel_import_error_traceback
+
         if not is_otel_available() and self.otlp_traces_endpoint is not None:
             raise ValueError(
                 "OpenTelemetry is not available. Unable to configure "
                 "'otlp_traces_endpoint'. Ensure OpenTelemetry packages are "
-                f"installed. Original error:\n{otel_import_error_traceback}")
+                f"installed. Original error:\n{otel_import_error_traceback}"
+            )
 
     def _parse_collect_detailed_traces(self):
         assert isinstance(self.collect_detailed_traces, list)
         self.collect_detailed_traces = cast(
-            list[DetailedTraceModules],
-            self.collect_detailed_traces[0].split(","))
+            list[DetailedTraceModules], self.collect_detailed_traces[0].split(",")
+        )
diff --git a/vllm/config/parallel.py b/vllm/config/parallel.py
index 8b980458ddaf..649b2434ebbf 100644
--- a/vllm/config/parallel.py
+++ b/vllm/config/parallel.py
@@ -161,9 +161,9 @@ class ParallelConfig:
     placement_group: Optional[PlacementGroup] = None
     """ray distributed model workers placement group."""
 
-    distributed_executor_backend: Optional[Union[str,
-                                                 DistributedExecutorBackend,
-                                                 type[ExecutorBase]]] = None
+    distributed_executor_backend: Optional[
+        Union[str, DistributedExecutorBackend, type[ExecutorBase]]
+    ] = None
     """Backend to use for distributed model
     workers, either "ray" or "mp" (multiprocessing). If the product
     of pipeline_parallel_size and tensor_parallel_size is less than
@@ -253,7 +253,8 @@ def stateless_init_dp_group(self) -> ProcessGroup:
         from torch.distributed import DistNetworkError
 
         from vllm.distributed.utils import (
-            stateless_init_torch_distributed_process_group)
+            stateless_init_torch_distributed_process_group,
+        )
 
         max_retries = 5
         last_exc: Optional[Exception] = None
@@ -265,12 +266,12 @@ def stateless_init_dp_group(self) -> ProcessGroup:
                     self.get_next_dp_init_port(),
                     self.data_parallel_rank,
                     self.data_parallel_size,
-                    backend="gloo")
+                    backend="gloo",
+                )
             except DistNetworkError as e:
                 # We only want to retry when the root cause is EADDRINUSE.
                 if "EADDRINUSE" in str(e):
-                    logger.warning(
-                        "Address already in use. Retrying with a new port.")
+                    logger.warning("Address already in use. Retrying with a new port.")
                     last_exc = e
                     continue  # try again with a new port
                 raise e
@@ -290,19 +291,22 @@ def stateless_init_dp_group(self) -> ProcessGroup:
     # Not needed for pplx-kernels as it can handle duplicate input tokens.
     @property
     def use_sequence_parallel_moe(self) -> bool:
-        return (envs.VLLM_ALL2ALL_BACKEND
-                in ("allgather_reducescatter", "naive",
-                    "deepep_high_throughput", "deepep_low_latency")
-                and self.enable_expert_parallel
-                and self.tensor_parallel_size > 1
-                and self.data_parallel_size > 1)
+        return (
+            envs.VLLM_ALL2ALL_BACKEND
+            in (
+                "allgather_reducescatter",
+                "naive",
+                "deepep_high_throughput",
+                "deepep_low_latency",
+            )
+            and self.enable_expert_parallel
+            and self.tensor_parallel_size > 1
+            and self.data_parallel_size > 1
+        )
 
     @staticmethod
-    def has_unfinished_dp(dp_group: ProcessGroup,
-                          has_unfinished: bool) -> bool:
-        tensor = torch.tensor([has_unfinished],
-                              dtype=torch.int32,
-                              device="cpu")
+    def has_unfinished_dp(dp_group: ProcessGroup, has_unfinished: bool) -> bool:
+        tensor = torch.tensor([has_unfinished], dtype=torch.int32, device="cpu")
         # dp rank 0: has_unfinished_seqs=True
         # dp rank 1: has_unfinished_seqs=False
         # aggregated: has_unfinished_seqs=True
@@ -312,13 +316,10 @@ def has_unfinished_dp(dp_group: ProcessGroup,
         return aggregated_has_unfinished
 
     @staticmethod
-    def sync_kv_cache_memory_size(dp_group: ProcessGroup,
-                                  kv_cache_memory: int) -> int:
+    def sync_kv_cache_memory_size(dp_group: ProcessGroup, kv_cache_memory: int) -> int:
         if kv_cache_memory == -1:
             kv_cache_memory = torch.iinfo(torch.int64).max
-        tensor = torch.tensor([kv_cache_memory],
-                              dtype=torch.int64,
-                              device="cpu")
+        tensor = torch.tensor([kv_cache_memory], dtype=torch.int64, device="cpu")
         # we cannot use broadcast for stateless dp group since it depends
         # on global rank
         torch.distributed.all_reduce(tensor, op=ReduceOp.MIN, group=dp_group)
@@ -343,38 +344,40 @@ def compute_hash(self):
     def __post_init__(self) -> None:
         # Forward deprecated fields to their new location
         if self.num_redundant_experts is not None:
-            self.eplb_config.num_redundant_experts = (
-                self.num_redundant_experts)
+            self.eplb_config.num_redundant_experts = self.num_redundant_experts
             logger.warning_once(
                 "num_redundant_experts is deprecated and has been replaced "
                 "with eplb_config.num_redundant_experts. This will be removed "
                 "in v0.12.0. Changing this field after initialization will "
-                "have no effect.")
+                "have no effect."
+            )
         if self.eplb_window_size is not None:
             self.eplb_config.window_size = self.eplb_window_size
             logger.warning_once(
                 "eplb_window_size is deprecated and has been replaced "
                 "with eplb_config.window_size. This will be removed "
                 "in v0.12.0. Changing this field after initialization will "
-                "have no effect.")
+                "have no effect."
+            )
         if self.eplb_step_interval is not None:
             self.eplb_config.step_interval = self.eplb_step_interval
             logger.warning_once(
                 "eplb_step_interval is deprecated and has been replaced "
                 "with eplb_config.step_interval. This will be removed "
                 "in v0.12.0. Changing this field after initialization will "
-                "have no effect.")
+                "have no effect."
+            )
         if self.eplb_log_balancedness is not None:
             self.eplb_config.log_balancedness = self.eplb_log_balancedness
             logger.warning_once(
                 "eplb_log_balancedness is deprecated and has been replaced "
                 "with eplb_config.log_balancedness. This will be removed "
                 "in v0.12.0. Changing this field after initialization will "
-                "have no effect.")
+                "have no effect."
+            )
 
         # Continue with the rest of the initialization
-        self.world_size = self.pipeline_parallel_size * \
-            self.tensor_parallel_size
+        self.world_size = self.pipeline_parallel_size * self.tensor_parallel_size
 
         if self.distributed_executor_backend == "external_launcher":
             logger.info("Using external launcher for distributed inference.")
@@ -383,26 +386,30 @@ def __post_init__(self) -> None:
         if self.data_parallel_size_local > self.data_parallel_size:
             raise ValueError(
                 f"data_parallel_size_local ({self.data_parallel_size_local}) "
-                f"must be <= data_parallel_size ({self.data_parallel_size})")
+                f"must be <= data_parallel_size ({self.data_parallel_size})"
+            )
 
         if self.data_parallel_size > 1 or self.data_parallel_size_local == 0:
             # Data parallel was specified in the engine args.
             if self.distributed_executor_backend == "external_launcher":
                 # For external launcher,
                 # we need to set the data parallel rank automatically
-                self.data_parallel_rank = int(os.environ["RANK"]) \
-                    // (self.world_size // self.data_parallel_size)
-                logger.info("Set data_parallel_rank to %d automatically.",
-                            self.data_parallel_rank)
+                self.data_parallel_rank = int(os.environ["RANK"]) // (
+                    self.world_size // self.data_parallel_size
+                )
+                logger.info(
+                    "Set data_parallel_rank to %d automatically.",
+                    self.data_parallel_rank,
+                )
             if not self._data_parallel_master_port_list:
                 self._data_parallel_master_port_list = get_open_ports_list(5)
-            self.data_parallel_master_port = \
-                self._data_parallel_master_port_list.pop()
+            self.data_parallel_master_port = self._data_parallel_master_port_list.pop()
 
             if not (0 <= self.data_parallel_rank < self.data_parallel_size):
                 raise ValueError(
                     f"data_parallel_rank ({self.data_parallel_rank})"
-                    f" must be in the range [0, {self.data_parallel_size})")
+                    f" must be in the range [0, {self.data_parallel_size})"
+                )
         else:
             # Otherwise fall back to env vars (e.g. for offline SPMD case).
             self.data_parallel_size = envs.VLLM_DP_SIZE
@@ -412,8 +419,10 @@ def __post_init__(self) -> None:
             self.data_parallel_master_port = envs.VLLM_DP_MASTER_PORT
 
             if self.data_parallel_external_lb:
-                raise ValueError("data_parallel_external_lb can only "
-                                 "be set when data_parallel_size > 1")
+                raise ValueError(
+                    "data_parallel_external_lb can only "
+                    "be set when data_parallel_size > 1"
+                )
 
         if self.distributed_executor_backend == "external_launcher":
             os.environ["VLLM_ENABLE_V1_MULTIPROCESSING"] = "0"
@@ -423,14 +432,15 @@ def __post_init__(self) -> None:
             if not current_platform.is_cuda():
                 raise ValueError(
                     "Expert parallelism load balancing is only supported on "
-                    "CUDA devices now.")
+                    "CUDA devices now."
+                )
             if self.eplb_config.num_redundant_experts < 0:
                 raise ValueError(
                     "num_redundant_experts must be non-negative, but got "
-                    f"{self.eplb_config.num_redundant_experts}.")
+                    f"{self.eplb_config.num_redundant_experts}."
+                )
             if not self.enable_expert_parallel:
-                raise ValueError(
-                    "enable_expert_parallel must be True to use EPLB.")
+                raise ValueError("enable_expert_parallel must be True to use EPLB.")
             if self.tensor_parallel_size * self.data_parallel_size <= 1:
                 raise ValueError(
                     "EPLB requires tensor_parallel_size or data_parallel_size "
@@ -443,41 +453,50 @@ def __post_init__(self) -> None:
                     "num_redundant_experts is set to "
                     f"{self.eplb_config.num_redundant_experts} but EPLB is not "
                     "enabled. Either enable EPLB or unset "
-                    "num_redundant_experts.")
+                    "num_redundant_experts."
+                )
         if self.distributed_executor_backend is None and self.world_size > 1:
             # We use multiprocessing by default if world_size fits on the
             # current node and we aren't in a ray placement group.
 
             from vllm.executor import ray_utils
+
             backend: DistributedExecutorBackend = "mp"
             ray_found = ray_utils.ray_is_available()
             if current_platform.is_tpu() and envs.VLLM_XLA_USE_SPMD:
                 backend = "uni"
-            elif (current_platform.is_cuda()
-                  and cuda_device_count_stateless() < self.world_size):
+            elif (
+                current_platform.is_cuda()
+                and cuda_device_count_stateless() < self.world_size
+            ):
                 if not ray_found:
-                    raise ValueError("Unable to load Ray: "
-                                     f"{ray_utils.ray_import_err}. Ray is "
-                                     "required for multi-node inference, "
-                                     "please install Ray with `pip install "
-                                     "ray`.")
+                    raise ValueError(
+                        "Unable to load Ray: "
+                        f"{ray_utils.ray_import_err}. Ray is "
+                        "required for multi-node inference, "
+                        "please install Ray with `pip install "
+                        "ray`."
+                    )
                 backend = "ray"
             elif self.data_parallel_backend == "ray":
-                logger.info("Using ray distributed inference because "
-                            "data_parallel_backend is ray")
+                logger.info(
+                    "Using ray distributed inference because "
+                    "data_parallel_backend is ray"
+                )
                 backend = "ray"
             elif ray_found:
                 if self.placement_group:
                     backend = "ray"
                 else:
                     from ray import is_initialized as ray_is_initialized
+
                     if ray_is_initialized():
                         from ray.util import get_current_placement_group
+
                         if get_current_placement_group():
                             backend = "ray"
             self.distributed_executor_backend = backend
-            logger.debug("Defaulting to use %s for distributed inference",
-                         backend)
+            logger.debug("Defaulting to use %s for distributed inference", backend)
 
         if self.distributed_executor_backend is None and self.world_size == 1:
             self.distributed_executor_backend = "uni"
@@ -486,39 +505,50 @@ def __post_init__(self) -> None:
             raise ValueError(
                 "Invalid value of `_api_process_rank`. "
                 f"Expected to be `-1` or `[0, {self._api_process_count})`, "
-                f"but found: {self._api_process_rank}")
+                f"but found: {self._api_process_rank}"
+            )
 
     @property
     def use_ray(self) -> bool:
         return self.distributed_executor_backend == "ray" or (
             isinstance(self.distributed_executor_backend, type)
-            and getattr(self.distributed_executor_backend, "uses_ray", False))
+            and getattr(self.distributed_executor_backend, "uses_ray", False)
+        )
 
-    @model_validator(mode='after')
+    @model_validator(mode="after")
     def _verify_args(self) -> Self:
         # Lazy import to avoid circular import
         from vllm.executor.executor_base import ExecutorBase
         from vllm.platforms import current_platform
-        if self.distributed_executor_backend is not None and not isinstance(
-                self.distributed_executor_backend, str) and not (isinstance(
-                    self.distributed_executor_backend, type) and issubclass(
-                        self.distributed_executor_backend, ExecutorBase)):
+
+        if (
+            self.distributed_executor_backend is not None
+            and not isinstance(self.distributed_executor_backend, str)
+            and not (
+                isinstance(self.distributed_executor_backend, type)
+                and issubclass(self.distributed_executor_backend, ExecutorBase)
+            )
+        ):
             raise ValueError(
                 "Unrecognized distributed executor backend "
                 f"{self.distributed_executor_backend}. Supported "
                 "values are 'ray', 'mp' 'uni', 'external_launcher', "
-                " custom ExecutorBase subclass or its import path.")
+                " custom ExecutorBase subclass or its import path."
+            )
         if self.use_ray:
             from vllm.executor import ray_utils
+
             ray_utils.assert_ray_available()
 
         if not current_platform.use_custom_allreduce():
             self.disable_custom_all_reduce = True
             logger.debug(
                 "Disabled the custom all-reduce kernel because it is not "
-                "supported on current platform.")
+                "supported on current platform."
+            )
         if self.ray_workers_use_nsight and not self.use_ray:
-            raise ValueError("Unable to use nsight profiling unless workers "
-                             "run with Ray.")
+            raise ValueError(
+                "Unable to use nsight profiling unless workers run with Ray."
+            )
 
         return self
diff --git a/vllm/config/pooler.py b/vllm/config/pooler.py
index 85b5a1ace85f..8b10992faa02 100644
--- a/vllm/config/pooler.py
+++ b/vllm/config/pooler.py
@@ -92,6 +92,5 @@ def compute_hash(self) -> str:
         # no factors to consider.
         # this config will not affect the computation graph.
         factors: list[Any] = []
-        hash_str = hashlib.md5(str(factors).encode(),
-                               usedforsecurity=False).hexdigest()
+        hash_str = hashlib.md5(str(factors).encode(), usedforsecurity=False).hexdigest()
         return hash_str
diff --git a/vllm/config/scheduler.py b/vllm/config/scheduler.py
index 1b0a10d3a069..396258aac287 100644
--- a/vllm/config/scheduler.py
+++ b/vllm/config/scheduler.py
@@ -11,9 +11,11 @@
 
 from vllm.config.utils import config
 from vllm.logger import init_logger
-from vllm.utils import (DEFAULT_MAX_NUM_BATCHED_TOKENS,
-                        MULTIMODAL_MODEL_MAX_NUM_BATCHED_TOKENS,
-                        POOLING_MODEL_MAX_NUM_BATCHED_TOKENS)
+from vllm.utils import (
+    DEFAULT_MAX_NUM_BATCHED_TOKENS,
+    MULTIMODAL_MODEL_MAX_NUM_BATCHED_TOKENS,
+    POOLING_MODEL_MAX_NUM_BATCHED_TOKENS,
+)
 
 logger = init_logger(__name__)
 
@@ -164,8 +166,7 @@ def compute_hash(self) -> str:
         # no factors to consider.
         # this config will not affect the computation graph.
         factors: list[Any] = []
-        hash_str = hashlib.md5(str(factors).encode(),
-                               usedforsecurity=False).hexdigest()
+        hash_str = hashlib.md5(str(factors).encode(), usedforsecurity=False).hexdigest()
         return hash_str
 
     def __post_init__(self, is_encoder_decoder: bool) -> None:
@@ -183,7 +184,8 @@ def __post_init__(self, is_encoder_decoder: bool) -> None:
             self.long_prefill_token_threshold = 0
             logger.info(
                 "Encoder-decoder models do not support chunked prefill nor"
-                " prefix caching; disabling both.")
+                " prefix caching; disabling both."
+            )
 
         if self.max_num_batched_tokens is None:
             if self.enable_chunked_prefill:
@@ -193,7 +195,8 @@ def __post_init__(self, is_encoder_decoder: bool) -> None:
                 # DEFAULT_MAX_NUM_BATCHED_TOKENS as the default value
                 # for higher throughput.
                 self.max_num_batched_tokens = max(
-                    self.max_model_len, DEFAULT_MAX_NUM_BATCHED_TOKENS)
+                    self.max_model_len, DEFAULT_MAX_NUM_BATCHED_TOKENS
+                )
 
             if self.runner_type == "pooling":
                 # Choose specific value for higher throughput
@@ -212,8 +215,8 @@ def __post_init__(self, is_encoder_decoder: bool) -> None:
             # Ensure max_num_batched_tokens does not exceed model limit.
             # Some models (e.g., Whisper) have embeddings tied to max length.
             self.max_num_batched_tokens = min(
-                self.max_num_seqs * self.max_model_len,
-                self.max_num_batched_tokens)
+                self.max_num_seqs * self.max_model_len, self.max_num_batched_tokens
+            )
 
         self.max_num_encoder_input_tokens = self.max_num_batched_tokens
         self.encoder_cache_size = self.max_num_batched_tokens
@@ -221,20 +224,22 @@ def __post_init__(self, is_encoder_decoder: bool) -> None:
         if self.enable_chunked_prefill:
             logger.info(
                 "Chunked prefill is enabled with max_num_batched_tokens=%d.",
-                self.max_num_batched_tokens)
+                self.max_num_batched_tokens,
+            )
 
         self.chunked_prefill_enabled = self.enable_chunked_prefill
         if self.max_num_partial_prefills > 1:
             if self.long_prefill_token_threshold == 0:
-                self.long_prefill_token_threshold = int(self.max_model_len *
-                                                        0.04)
+                self.long_prefill_token_threshold = int(self.max_model_len * 0.04)
 
             logger.info(
                 "Concurrent partial prefills enabled with "
                 "max_num_partial_prefills=%d, max_long_partial_prefills=%d, "
                 "long_prefill_token_threshold=%d",
-                self.max_num_partial_prefills, self.max_long_partial_prefills,
-                self.long_prefill_token_threshold)
+                self.max_num_partial_prefills,
+                self.max_long_partial_prefills,
+                self.long_prefill_token_threshold,
+            )
 
         # NOTE: Default set cuda_graph_sizes to [min(max_num_seqs * 2, 512)].
         # This avoids OOM in tight memory scenarios with small max_num_seqs,
@@ -244,61 +249,71 @@ def __post_init__(self, is_encoder_decoder: bool) -> None:
             self.cuda_graph_sizes = [min(self.max_num_seqs * 2, 512)]
 
         if self.async_scheduling:
-            self.scheduler_cls = (
-                "vllm.v1.core.sched.async_scheduler.AsyncScheduler")
+            self.scheduler_cls = "vllm.v1.core.sched.async_scheduler.AsyncScheduler"
 
-    @model_validator(mode='after')
+    @model_validator(mode="after")
     def _verify_args(self) -> Self:
-        if (self.max_num_batched_tokens < self.max_model_len
-                and not self.chunked_prefill_enabled):
+        if (
+            self.max_num_batched_tokens < self.max_model_len
+            and not self.chunked_prefill_enabled
+        ):
             raise ValueError(
                 f"max_num_batched_tokens ({self.max_num_batched_tokens}) is "
                 f"smaller than max_model_len ({self.max_model_len}). "
                 "This effectively limits the maximum sequence length to "
                 "max_num_batched_tokens and makes vLLM reject longer "
                 "sequences. Please increase max_num_batched_tokens or "
-                "decrease max_model_len.")
+                "decrease max_model_len."
+            )
 
         if self.max_num_batched_tokens < self.max_num_seqs:
             raise ValueError(
                 f"max_num_batched_tokens ({self.max_num_batched_tokens}) must "
                 "be greater than or equal to max_num_seqs "
-                f"({self.max_num_seqs}).")
+                f"({self.max_num_seqs})."
+            )
 
         if self.max_num_batched_tokens > self.max_num_seqs * self.max_model_len:
             logger.warning(
                 "max_num_batched_tokens (%d) exceeds max_num_seqs "
                 "* max_model_len (%d). This may lead to unexpected behavior.",
                 self.max_num_batched_tokens,
-                self.max_num_seqs * self.max_model_len)
+                self.max_num_seqs * self.max_model_len,
+            )
 
         if self.num_lookahead_slots < 0:
             raise ValueError(
                 "num_lookahead_slots "
                 f"({self.num_lookahead_slots}) must be greater than or "
-                "equal to 0.")
+                "equal to 0."
+            )
 
         if self.max_num_partial_prefills < 1:
             raise ValueError(
                 f"max_num_partial_prefills ({self.max_num_partial_prefills}) "
-                "must be greater than or equal to 1.")
+                "must be greater than or equal to 1."
+            )
         elif self.max_num_partial_prefills > 1:
             if not self.chunked_prefill_enabled:
-                raise ValueError("Chunked prefill must be enabled to set "
-                                 "max_num_partial_prefills > 1.")
+                raise ValueError(
+                    "Chunked prefill must be enabled to set "
+                    "max_num_partial_prefills > 1."
+                )
 
             if self.long_prefill_token_threshold > self.max_model_len:
                 raise ValueError(
                     "long_prefill_token_threshold "
                     f"({self.long_prefill_token_threshold}) cannot be greater "
-                    f"than the max_model_len ({self.max_model_len}).")
+                    f"than the max_model_len ({self.max_model_len})."
+                )
 
-        if (self.max_long_partial_prefills
-                < 1) or (self.max_long_partial_prefills
-                         > self.max_num_partial_prefills):
+        if (self.max_long_partial_prefills < 1) or (
+            self.max_long_partial_prefills > self.max_num_partial_prefills
+        ):
             raise ValueError(
                 f"max_long_partial_prefills ({self.max_long_partial_prefills}) "
                 "must be greater than or equal to 1 and less than or equal to "
-                f"max_num_partial_prefills ({self.max_num_partial_prefills}).")
+                f"max_num_partial_prefills ({self.max_num_partial_prefills})."
+            )
 
         return self
diff --git a/vllm/config/speculative.py b/vllm/config/speculative.py
index d5c6d1d4d866..aa0c07cf62a3 100644
--- a/vllm/config/speculative.py
+++ b/vllm/config/speculative.py
@@ -24,23 +24,41 @@
     PretrainedConfig = Any
     ModelConfig = Any
 
-    me_quant = LazyLoader("model_executor", globals(),
-                          "vllm.model_executor.layers.quantization")
+    me_quant = LazyLoader(
+        "model_executor", globals(), "vllm.model_executor.layers.quantization"
+    )
 
 logger = init_logger(__name__)
 
-SpeculativeMethod = Literal["ngram", "eagle", "eagle3", "medusa",
-                            "mlp_speculator", "draft_model", "deepseek_mtp",
-                            "ernie_mtp", "qwen3_next_mtp", "mimo_mtp",
-                            "longcat_flash_mtp", "mtp"]
-MTP_MODEL_TYPES = ("deepseek_mtp", "mimo_mtp", "glm4_moe_mtp", "ernie_mtp",
-                   "qwen3_next_mtp", "longcat_flash_mtp")
+SpeculativeMethod = Literal[
+    "ngram",
+    "eagle",
+    "eagle3",
+    "medusa",
+    "mlp_speculator",
+    "draft_model",
+    "deepseek_mtp",
+    "ernie_mtp",
+    "qwen3_next_mtp",
+    "mimo_mtp",
+    "longcat_flash_mtp",
+    "mtp",
+]
+MTP_MODEL_TYPES = (
+    "deepseek_mtp",
+    "mimo_mtp",
+    "glm4_moe_mtp",
+    "ernie_mtp",
+    "qwen3_next_mtp",
+    "longcat_flash_mtp",
+)
 
 
 @config
 @dataclass
 class SpeculativeConfig:
     """Configuration for speculative decoding."""
+
     enforce_eager: Optional[bool] = None
     """Override the default enforce_eager from model_config"""
     # General speculative decoding control
@@ -107,8 +125,7 @@ class SpeculativeConfig:
     # required configuration params passed from engine
     target_model_config: SkipValidation[ModelConfig] = None  # type: ignore
     """The configuration of the target model."""
-    target_parallel_config: SkipValidation[
-        ParallelConfig] = None  # type: ignore
+    target_parallel_config: SkipValidation[ParallelConfig] = None  # type: ignore
     """The parallel configuration for the target model."""
     enable_chunked_prefill: SkipValidation[bool] = None  # type: ignore
     """Whether vLLM is configured to use chunked prefill or not. Used for
@@ -120,8 +137,7 @@ class SpeculativeConfig:
     # params generated in the post-init stage
     draft_model_config: SkipValidation[ModelConfig] = None  # type: ignore
     """The configuration of the draft model initialized internal."""
-    draft_parallel_config: SkipValidation[
-        ParallelConfig] = None  # type: ignore
+    draft_parallel_config: SkipValidation[ParallelConfig] = None  # type: ignore
     """The parallel configuration for the draft model initialized internal."""
 
     def compute_hash(self) -> str:
@@ -140,8 +156,7 @@ def compute_hash(self) -> str:
         # Eagle3 affects the computation graph because it returns intermediate
         # hidden states in addition to the final hidden state.
         factors.append(self.method == "eagle3")
-        hash_str = hashlib.md5(str(factors).encode(),
-                               usedforsecurity=False).hexdigest()
+        hash_str = hashlib.md5(str(factors).encode(), usedforsecurity=False).hexdigest()
         return hash_str
 
     @staticmethod
@@ -150,58 +165,57 @@ def hf_config_override(hf_config: PretrainedConfig) -> PretrainedConfig:
             hf_config.model_type = "deepseek_mtp"
         if hf_config.model_type == "deepseek_mtp":
             n_predict = getattr(hf_config, "num_nextn_predict_layers", None)
-            hf_config.update({
-                "n_predict": n_predict,
-                "architectures": ["DeepSeekMTPModel"]
-            })
+            hf_config.update(
+                {"n_predict": n_predict, "architectures": ["DeepSeekMTPModel"]}
+            )
 
         if hf_config.architectures[0] == "MiMoForCausalLM":
             hf_config.model_type = "mimo_mtp"
             n_predict = getattr(hf_config, "num_nextn_predict_layers", None)
-            hf_config.update({
-                "num_hidden_layers": 0,
-                "n_predict": n_predict,
-                "architectures": ["MiMoMTPModel"]
-            })
+            hf_config.update(
+                {
+                    "num_hidden_layers": 0,
+                    "n_predict": n_predict,
+                    "architectures": ["MiMoMTPModel"],
+                }
+            )
 
         if hf_config.architectures[0] == "Glm4MoeForCausalLM":
             hf_config.model_type = "glm4_moe_mtp"
             n_predict = getattr(hf_config, "num_nextn_predict_layers", None)
-            hf_config.update({
-                "num_hidden_layers": 0,
-                "n_predict": n_predict,
-                "architectures": ["Glm4MoeMTPModel"]
-            })
+            hf_config.update(
+                {
+                    "num_hidden_layers": 0,
+                    "n_predict": n_predict,
+                    "architectures": ["Glm4MoeMTPModel"],
+                }
+            )
 
         if hf_config.model_type == "ernie4_5_moe":
             hf_config.model_type = "ernie_mtp"
         if hf_config.model_type == "ernie_mtp":
             n_predict = getattr(hf_config, "num_nextn_predict_layers", None)
-            hf_config.update({
-                "n_predict": n_predict,
-                "architectures": ["ErnieMTPModel"]
-            })
+            hf_config.update(
+                {"n_predict": n_predict, "architectures": ["ErnieMTPModel"]}
+            )
 
         if hf_config.model_type == "qwen3_next":
             hf_config.model_type = "qwen3_next_mtp"
         if hf_config.model_type == "qwen3_next_mtp":
             n_predict = getattr(hf_config, "num_nextn_predict_layers", None)
-            hf_config.update({
-                "n_predict": n_predict,
-                "architectures": ["Qwen3NextMTP"]
-            })
+            hf_config.update(
+                {"n_predict": n_predict, "architectures": ["Qwen3NextMTP"]}
+            )
         if hf_config.model_type == "longcat_flash":
             hf_config.model_type = "longcat_flash_mtp"
             n_predict = getattr(hf_config, "num_nextn_predict_layers", 1)
-            hf_config.update({
-                "n_predict": n_predict,
-                "architectures": ["LongCatFlashMTPModel"]
-            })
+            hf_config.update(
+                {"n_predict": n_predict, "architectures": ["LongCatFlashMTPModel"]}
+            )
 
         return hf_config
 
     def __post_init__(self):
-
         # Note: "method" is a new parameter that helps to extend the
         # configuration of non-model-based proposers, and the "model" parameter
         # will be used to set the draft model, eagle head, or additional weight
@@ -211,17 +225,17 @@ def __post_init__(self):
         # default.
 
         if self.method in MTP_MODEL_TYPES:
-            logger.warning("method `%s` is deprecated and replaced with mtp.",
-                           self.method)
+            logger.warning(
+                "method `%s` is deprecated and replaced with mtp.", self.method
+            )
             self.method = "mtp"
 
         if self.model is None and self.num_speculative_tokens is not None:
             if self.method == "mtp":
-                assert (
-                    self.target_model_config
-                    is not None), "target_model_config must be present for mtp"
-                if self.target_model_config.hf_text_config.model_type \
-                    == "deepseek_v32":
+                assert self.target_model_config is not None, (
+                    "target_model_config must be present for mtp"
+                )
+                if self.target_model_config.hf_text_config.model_type == "deepseek_v32":
                     # FIXME(luccafong): cudgraph with v32 MTP is not supported,
                     # remove this when the issue is fixed.
                     self.enforce_eager = True
@@ -235,21 +249,21 @@ def __post_init__(self):
                 self.model = "ngram"
             else:
                 raise ValueError(
-                    "num_speculative_tokens was provided but without "
-                    "speculative model.")
+                    "num_speculative_tokens was provided but without speculative model."
+                )
 
         # Automatically configure the method for ngram when "model" is used
         # instead of "method"
-        if self.method is None and (self.model is not None
-                                    and self.model in ("ngram", "[ngram]")):
+        if self.method is None and (
+            self.model is not None and self.model in ("ngram", "[ngram]")
+        ):
             self.method = "ngram"
 
         if self.method in ("ngram", "[ngram]"):
             # Unified to "ngram" internally
             self.method = "ngram"
             # Set default values if not provided
-            if (self.prompt_lookup_min is None
-                    and self.prompt_lookup_max is None):
+            if self.prompt_lookup_min is None and self.prompt_lookup_max is None:
                 # TODO(woosuk): Tune these values. They are arbitrarily chosen.
                 self.prompt_lookup_min = 5
                 self.prompt_lookup_max = 5
@@ -263,14 +277,17 @@ def __post_init__(self):
             # Validate values
             if self.prompt_lookup_min < 1:
                 raise ValueError(
-                    f"prompt_lookup_min={self.prompt_lookup_min} must be > 0")
+                    f"prompt_lookup_min={self.prompt_lookup_min} must be > 0"
+                )
             if self.prompt_lookup_max < 1:
                 raise ValueError(
-                    f"prompt_lookup_max={self.prompt_lookup_max} must be > 0")
+                    f"prompt_lookup_max={self.prompt_lookup_max} must be > 0"
+                )
             if self.prompt_lookup_min > self.prompt_lookup_max:
                 raise ValueError(
                     f"prompt_lookup_min={self.prompt_lookup_min} must "
-                    f"be <= prompt_lookup_max={self.prompt_lookup_max}")
+                    f"be <= prompt_lookup_max={self.prompt_lookup_max}"
+                )
 
             # TODO: current we still need extract vocab_size from target model
             # config, in future, we may try refactor it out, and set
@@ -285,25 +302,21 @@ def __post_init__(self):
                 # TODO: Move this import to the top once `ModelConfig`
                 # lives in `vllm.config.model`.
                 from vllm.config import ModelConfig
+
                 self.draft_model_config = ModelConfig(
                     model=self.model,
                     runner="draft",
                     tokenizer=self.target_model_config.tokenizer,
                     tokenizer_mode=self.target_model_config.tokenizer_mode,
-                    trust_remote_code=self.target_model_config.
-                    trust_remote_code,
-                    allowed_local_media_path=self.target_model_config.
-                    allowed_local_media_path,
-                    allowed_media_domains=self.target_model_config.
-                    allowed_media_domains,
+                    trust_remote_code=self.target_model_config.trust_remote_code,
+                    allowed_local_media_path=self.target_model_config.allowed_local_media_path,
+                    allowed_media_domains=self.target_model_config.allowed_media_domains,
                     dtype=self.target_model_config.dtype,
                     seed=self.target_model_config.seed,
                     revision=self.revision,
                     code_revision=self.code_revision,
-                    tokenizer_revision=self.target_model_config.
-                    tokenizer_revision,
-                    spec_target_max_model_len=self.target_model_config.
-                    max_model_len,
+                    tokenizer_revision=self.target_model_config.tokenizer_revision,
+                    spec_target_max_model_len=self.target_model_config.max_model_len,
                     quantization=self.quantization,
                     enforce_eager=self.target_model_config.enforce_eager,
                     max_logprobs=self.target_model_config.max_logprobs,
@@ -311,7 +324,7 @@ def __post_init__(self):
                 )
 
                 # Automatically detect the method
-                if self.method in ('eagle', 'eagle3'):
+                if self.method in ("eagle", "eagle3"):
                     pass
                 # examples:
                 # yuhuili/EAGLE-LLaMA3-Instruct-8B
@@ -323,94 +336,101 @@ def __post_init__(self):
                     self.method = "eagle3"
                 elif self.draft_model_config.hf_config.model_type == "medusa":
                     self.method = "medusa"
-                elif (self.draft_model_config.hf_config.model_type ==
-                      "mlp_speculator"):
+                elif self.draft_model_config.hf_config.model_type == "mlp_speculator":
                     self.method = "mlp_speculator"
-                elif (self.draft_model_config.hf_config.model_type
-                      in MTP_MODEL_TYPES):
+                elif self.draft_model_config.hf_config.model_type in MTP_MODEL_TYPES:
                     self.method = "mtp"
                     if self.num_speculative_tokens > 1:
                         logger.warning(
-                                "Enabling num_speculative_tokens > 1 will run" \
-                                "multiple times of forward on same MTP layer" \
-                                ",which may result in lower acceptance rate" \
-                            )
-                elif (self.draft_model_config.hf_config.model_type
-                      in ("longcat_flash_mtp")):
+                            "Enabling num_speculative_tokens > 1 will run"
+                            "multiple times of forward on same MTP layer"
+                            ",which may result in lower acceptance rate"
+                        )
+                elif self.draft_model_config.hf_config.model_type in (
+                    "longcat_flash_mtp"
+                ):
                     self.method = "longcat_flash_mtp"
                     if self.num_speculative_tokens > 1:
                         logger.warning(
-                                "LongCat MTP models only have " \
-                                "one layer. Might need some code changes " \
-                                "to support multiple layers."
-                            )
+                            "LongCat MTP models only have "
+                            "one layer. Might need some code changes "
+                            "to support multiple layers."
+                        )
                 else:
                     self.method = "draft_model"
                     raise NotImplementedError(
                         "Speculative decoding with draft model is not "
                         "supported yet. Please consider using other "
                         "speculative decoding methods such as ngram, medusa, "
-                        "eagle, or mtp.")
+                        "eagle, or mtp."
+                    )
 
                 # Replace hf_config for EAGLE draft_model
                 if self.method in ("eagle", "eagle3"):
                     if self.enable_chunked_prefill and not envs.VLLM_USE_V1:
                         raise ValueError(
                             "Chunked prefill and EAGLE are not compatible "
-                            "when using V0.")
+                            "when using V0."
+                        )
 
-                    from vllm.transformers_utils.configs import (
-                        SpeculatorsConfig)
-                    from vllm.transformers_utils.configs.eagle import (
-                        EAGLEConfig)
+                    from vllm.transformers_utils.configs import SpeculatorsConfig
+                    from vllm.transformers_utils.configs.eagle import EAGLEConfig
 
-                    if isinstance(self.draft_model_config.hf_config,
-                                  (EAGLEConfig, SpeculatorsConfig)):
+                    if isinstance(
+                        self.draft_model_config.hf_config,
+                        (EAGLEConfig, SpeculatorsConfig),
+                    ):
                         pass
                     else:
                         eagle_config = EAGLEConfig(
                             self.draft_model_config.hf_config,
                             method=self.method,
-                            model_type="eagle")
+                            model_type="eagle",
+                        )
                         self.draft_model_config.hf_config = eagle_config
 
-                if (self.num_speculative_tokens is not None
-                        and hasattr(self.draft_model_config.hf_config,
-                                    "num_lookahead_tokens")):
-                    self.draft_model_config.hf_config.num_lookahead_tokens = \
-                    self.num_speculative_tokens
+                if self.num_speculative_tokens is not None and hasattr(
+                    self.draft_model_config.hf_config, "num_lookahead_tokens"
+                ):
+                    self.draft_model_config.hf_config.num_lookahead_tokens = (
+                        self.num_speculative_tokens
+                    )
 
-                n_predict = getattr(self.draft_model_config.hf_config,
-                                    "n_predict", None)
+                n_predict = getattr(
+                    self.draft_model_config.hf_config, "n_predict", None
+                )
                 if n_predict is not None:
                     if self.num_speculative_tokens is None:
                         # Default to max value defined in draft model config.
                         self.num_speculative_tokens = n_predict
-                    elif self.num_speculative_tokens > n_predict and \
-                            self.num_speculative_tokens % n_predict != 0:
+                    elif (
+                        self.num_speculative_tokens > n_predict
+                        and self.num_speculative_tokens % n_predict != 0
+                    ):
                         # Ensure divisibility for MTP module reuse.
                         raise ValueError(
                             f"num_speculative_tokens:{self.num_speculative_tokens}"
-                            f" must be divisible by {n_predict=}")
+                            f" must be divisible by {n_predict=}"
+                        )
 
                 if self.speculative_token_tree is None:
                     # Generate chain of tokens.
-                    self.speculative_token_tree = str([
-                        (i + 1) * (0, )
-                        for i in range(self.num_speculative_tokens)
-                    ])
+                    self.speculative_token_tree = str(
+                        [(i + 1) * (0,) for i in range(self.num_speculative_tokens)]
+                    )
                 else:
                     # Sort the token tree breadth-first.
-                    tree_choices = ast.literal_eval(
-                        self.speculative_token_tree)
+                    tree_choices = ast.literal_eval(self.speculative_token_tree)
                     self.speculative_token_tree = str(
-                        sorted(tree_choices, key=lambda t: (len(t), t)))
+                        sorted(tree_choices, key=lambda t: (len(t), t))
+                    )
 
-                self.draft_tensor_parallel_size = \
+                self.draft_tensor_parallel_size = (
                     SpeculativeConfig._verify_and_get_draft_tp(
                         self.target_parallel_config,
                         self.draft_tensor_parallel_size,
-                        self.draft_model_config.hf_config
+                        self.draft_model_config.hf_config,
+                    )
                 )
 
                 self.draft_model_config.max_model_len = (
@@ -418,12 +438,14 @@ def __post_init__(self):
                         self.max_model_len,
                         self.draft_model_config.max_model_len,
                         self.target_model_config.max_model_len,
-                    ))
+                    )
+                )
 
                 self.draft_parallel_config = (
                     SpeculativeConfig.create_draft_parallel_config(
-                        self.target_parallel_config,
-                        self.draft_tensor_parallel_size))
+                        self.target_parallel_config, self.draft_tensor_parallel_size
+                    )
+                )
 
     @staticmethod
     def _maybe_override_draft_max_model_len(
@@ -444,14 +466,17 @@ def _maybe_override_draft_max_model_len(
         """
 
         if speculative_max_model_len is not None:
-
             if speculative_max_model_len > draft_max_model_len:
-                raise ValueError(f"{speculative_max_model_len=} cannot be "
-                                 f"larger than {draft_max_model_len=}")
+                raise ValueError(
+                    f"{speculative_max_model_len=} cannot be "
+                    f"larger than {draft_max_model_len=}"
+                )
 
             if speculative_max_model_len > target_max_model_len:
-                raise ValueError(f"{speculative_max_model_len=} cannot be "
-                                 f"larger than {target_max_model_len=}")
+                raise ValueError(
+                    f"{speculative_max_model_len=} cannot be "
+                    f"larger than {target_max_model_len=}"
+                )
 
             return speculative_max_model_len
 
@@ -462,9 +487,10 @@ def _maybe_override_draft_max_model_len(
 
     @staticmethod
     def _verify_and_get_draft_tp(
-            target_parallel_config: ParallelConfig,
-            speculative_draft_tensor_parallel_size: Optional[int],
-            draft_hf_config: PretrainedConfig) -> int:
+        target_parallel_config: ParallelConfig,
+        speculative_draft_tensor_parallel_size: Optional[int],
+        draft_hf_config: PretrainedConfig,
+    ) -> int:
         """
         Verifies and adjusts the tensor parallel size for a draft model
         specified using speculative_draft_tensor_parallel_size.
@@ -478,15 +504,20 @@ def _verify_and_get_draft_tp(
                     logger.warning(
                         "%s cannot currently be run with tp>1; "
                         "setting speculative_draft_tensor_parallel_size=1",
-                        draft_hf_config.model_type)
+                        draft_hf_config.model_type,
+                    )
             else:
-                speculative_draft_tensor_parallel_size = \
+                speculative_draft_tensor_parallel_size = (
                     target_parallel_config.tensor_parallel_size
+                )
         elif speculative_draft_tensor_parallel_size not in (
-                1, target_parallel_config.tensor_parallel_size):
+            1,
+            target_parallel_config.tensor_parallel_size,
+        ):
             raise ValueError(
                 f"{speculative_draft_tensor_parallel_size=} cannot be "
-                f"other value than 1 or target model tensor_parallel_size")
+                f"other value than 1 or target model tensor_parallel_size"
+            )
         return speculative_draft_tensor_parallel_size
 
     @staticmethod
@@ -499,52 +530,57 @@ def create_draft_parallel_config(
         This is mostly a copy of the target parallel config, except the tp_size.
         """
         draft_parallel_config = ParallelConfig(
-            pipeline_parallel_size=target_parallel_config.
-            pipeline_parallel_size,
+            pipeline_parallel_size=target_parallel_config.pipeline_parallel_size,
             tensor_parallel_size=speculative_draft_tensor_parallel_size,
-            distributed_executor_backend=target_parallel_config.
-            distributed_executor_backend,
-            max_parallel_loading_workers=target_parallel_config.
-            max_parallel_loading_workers,
-            disable_custom_all_reduce=target_parallel_config.
-            disable_custom_all_reduce,
-            ray_workers_use_nsight=target_parallel_config.
-            ray_workers_use_nsight,
+            distributed_executor_backend=target_parallel_config.distributed_executor_backend,
+            max_parallel_loading_workers=target_parallel_config.max_parallel_loading_workers,
+            disable_custom_all_reduce=target_parallel_config.disable_custom_all_reduce,
+            ray_workers_use_nsight=target_parallel_config.ray_workers_use_nsight,
             placement_group=target_parallel_config.placement_group,
         )
 
         return draft_parallel_config
 
-    @model_validator(mode='after')
+    @model_validator(mode="after")
     def _verify_args(self) -> Self:
         if self.num_speculative_tokens is None:
             raise ValueError(
                 "num_speculative_tokens must be provided with "
                 "speculative model unless the draft model config contains an "
-                "n_predict parameter.")
+                "n_predict parameter."
+            )
 
         if self.num_speculative_tokens <= 0:
-            raise ValueError("Expected num_speculative_tokens to be greater "
-                             f"than zero ({self.num_speculative_tokens}).")
+            raise ValueError(
+                "Expected num_speculative_tokens to be greater "
+                f"than zero ({self.num_speculative_tokens})."
+            )
 
         if self.draft_model_config:
             self.draft_model_config.verify_with_parallel_config(
-                self.draft_parallel_config)
+                self.draft_parallel_config
+            )
 
-        if (self.disable_by_batch_size is not None
-                and self.disable_by_batch_size < 2):
-            raise ValueError("Expect the batch size threshold of disabling "
-                             "speculative decoding is > 1, but got "
-                             f"{self.disable_by_batch_size=}")
+        if self.disable_by_batch_size is not None and self.disable_by_batch_size < 2:
+            raise ValueError(
+                "Expect the batch size threshold of disabling "
+                "speculative decoding is > 1, but got "
+                f"{self.disable_by_batch_size=}"
+            )
 
         eagle3_target_supported = ["llama", "qwen", "minicpm", "gpt_oss"]
-        if self.method == "eagle3" and self.target_model_config and not any(
-                supported_model in
-                self.target_model_config.hf_text_config.model_type
-                for supported_model in eagle3_target_supported):
+        if (
+            self.method == "eagle3"
+            and self.target_model_config
+            and not any(
+                supported_model in self.target_model_config.hf_text_config.model_type
+                for supported_model in eagle3_target_supported
+            )
+        ):
             raise ValueError(
                 f"Eagle3 is only supported for {eagle3_target_supported} models. "  # noqa: E501
-                f"Got {self.target_model_config.hf_text_config.model_type=}")
+                f"Got {self.target_model_config.hf_text_config.model_type=}"
+            )
 
         return self
 
diff --git a/vllm/config/structured_outputs.py b/vllm/config/structured_outputs.py
index b1f14294510f..5111c9c77d90 100644
--- a/vllm/config/structured_outputs.py
+++ b/vllm/config/structured_outputs.py
@@ -8,8 +8,9 @@
 
 from vllm.config.utils import config
 
-StructuredOutputsBackend = Literal["auto", "xgrammar", "guidance", "outlines",
-                                   "lm-format-enforcer"]
+StructuredOutputsBackend = Literal[
+    "auto", "xgrammar", "guidance", "outlines", "lm-format-enforcer"
+]
 
 
 @config
@@ -50,15 +51,17 @@ def compute_hash(self) -> str:
         # no factors to consider.
         # this config will not affect the computation graph.
         factors: list[Any] = []
-        hash_str = hashlib.md5(str(factors).encode(),
-                               usedforsecurity=False).hexdigest()
+        hash_str = hashlib.md5(str(factors).encode(), usedforsecurity=False).hexdigest()
         return hash_str
 
     def __post_init__(self):
-        if (self.disable_any_whitespace
-                and self.backend not in ("xgrammar", "guidance")):
-            raise ValueError("disable_any_whitespace is only supported for "
-                             "xgrammar and guidance backends.")
-        if (self.disable_additional_properties and self.backend != "guidance"):
-            raise ValueError("disable_additional_properties is only supported "
-                             "for the guidance backend.")
+        if self.disable_any_whitespace and self.backend not in ("xgrammar", "guidance"):
+            raise ValueError(
+                "disable_any_whitespace is only supported for "
+                "xgrammar and guidance backends."
+            )
+        if self.disable_additional_properties and self.backend != "guidance":
+            raise ValueError(
+                "disable_additional_properties is only supported "
+                "for the guidance backend."
+            )
diff --git a/vllm/config/utils.py b/vllm/config/utils.py
index d355ff3a9023..889ebf45b12d 100644
--- a/vllm/config/utils.py
+++ b/vllm/config/utils.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Utility functions for vLLM config dataclasses."""
+
 import ast
 import inspect
 import textwrap
@@ -50,7 +51,8 @@ def get_field(cls: ConfigType, name: str) -> Field:
     if (default := named_field.default) is not MISSING:
         return field(default=default)
     raise ValueError(
-        f"{cls.__name__}.{name} must have a default value or default factory.")
+        f"{cls.__name__}.{name} must have a default value or default factory."
+    )
 
 
 def getattr_iter(object: object, names: Iterable[str], default: Any) -> Any:
@@ -78,7 +80,7 @@ def contains_object_print(text: str) -> bool:
     Returns:
         result (bool): `True` if a match is found, `False` otherwise.
     """
-    pattern = r'at 0x[a-fA-F0-9]{2,16}>'
+    pattern = r"at 0x[a-fA-F0-9]{2,16}>"
     match = re.search(pattern, text)
     return match is not None
 
@@ -89,7 +91,8 @@ def assert_hashable(text: str) -> bool:
     raise AssertionError(
         f"vLLM tried to hash some configs that may have Python objects ids "
         f"in them. This is a bug, please file an issue. "
-        f"Text being hashed: {text}")
+        f"Text being hashed: {text}"
+    )
 
 
 def get_attr_docs(cls: type[Any]) -> dict[str, str]:
@@ -132,10 +135,12 @@ def pairwise(iterable):
     # Consider each pair of nodes.
     for a, b in pairwise(cls_node.body):
         # Must be an assignment then a constant string.
-        if (not isinstance(a, (ast.Assign, ast.AnnAssign))
-                or not isinstance(b, ast.Expr)
-                or not isinstance(b.value, ast.Constant)
-                or not isinstance(b.value.value, str)):
+        if (
+            not isinstance(a, (ast.Assign, ast.AnnAssign))
+            or not isinstance(b, ast.Expr)
+            or not isinstance(b.value, ast.Constant)
+            or not isinstance(b.value.value, str)
+        ):
             continue
 
         doc = inspect.cleandoc(b.value.value)
@@ -160,29 +165,28 @@ def is_init_field(cls: ConfigType, name: str) -> bool:
 
 @runtime_checkable
 class SupportsHash(Protocol):
-
-    def compute_hash(self) -> str:
-        ...
+    def compute_hash(self) -> str: ...
 
 
 class SupportsMetricsInfo(Protocol):
-
-    def metrics_info(self) -> dict[str, str]:
-        ...
+    def metrics_info(self) -> dict[str, str]: ...
 
 
 def update_config(config: ConfigT, overrides: dict[str, Any]) -> ConfigT:
     processed_overrides = {}
     for field_name, value in overrides.items():
-        assert hasattr(
-            config, field_name), f"{type(config)} has no field `{field_name}`"
+        assert hasattr(config, field_name), (
+            f"{type(config)} has no field `{field_name}`"
+        )
         current_value = getattr(config, field_name)
         if is_dataclass(current_value) and not is_dataclass(value):
             assert isinstance(value, dict), (
                 f"Overrides to {type(config)}.{field_name} must be a dict"
-                f"  or {type(current_value)}, but got {type(value)}")
+                f"  or {type(current_value)}, but got {type(value)}"
+            )
             value = update_config(
                 current_value,  # type: ignore[type-var]
-                value)
+                value,
+            )
         processed_overrides[field_name] = value
     return replace(config, **processed_overrides)
diff --git a/vllm/config/vllm.py b/vllm/config/vllm.py
index 17d1055ace46..7b8dc0775eb0 100644
--- a/vllm/config/vllm.py
+++ b/vllm/config/vllm.py
@@ -38,8 +38,7 @@
 if TYPE_CHECKING:
     from transformers import PretrainedConfig
 
-    from vllm.model_executor.layers.quantization.base_config import (
-        QuantizationConfig)
+    from vllm.model_executor.layers.quantization.base_config import QuantizationConfig
 else:
     PretrainedConfig = Any
 
@@ -74,14 +73,14 @@ class VllmConfig:
     speculative_config: Optional[SpeculativeConfig] = None
     """Speculative decoding configuration."""
     structured_outputs_config: StructuredOutputsConfig = field(
-        default_factory=StructuredOutputsConfig)
+        default_factory=StructuredOutputsConfig
+    )
     """Structured outputs configuration."""
     observability_config: Optional[ObservabilityConfig] = None
     """Observability configuration."""
     quant_config: Optional[QuantizationConfig] = None
     """Quantization configuration."""
-    compilation_config: CompilationConfig = field(
-        default_factory=CompilationConfig)
+    compilation_config: CompilationConfig = field(default_factory=CompilationConfig)
     """`torch.compile` and cudagraph capture configuration for the model.
 
     As a shorthand, `-O<n>` can be used to directly specify the compilation
@@ -127,6 +126,7 @@ def compute_hash(self) -> str:
         # summarize vllm config
         vllm_factors: list[Any] = []
         from vllm import __version__
+
         vllm_factors.append(__version__)
         vllm_factors.append(envs.VLLM_USE_V1)
         if self.model_config:
@@ -158,8 +158,7 @@ def compute_hash(self) -> str:
             # LoRA creates static buffers based on max_num_batched_tokens.
             # The tensor sizes and strides get captured in the torch.compile
             # graph explicitly.
-            vllm_factors.append(
-                str(self.scheduler_config.max_num_batched_tokens))
+            vllm_factors.append(str(self.scheduler_config.max_num_batched_tokens))
         else:
             vllm_factors.append("None")
         if self.speculative_config:
@@ -197,8 +196,9 @@ def compute_hash(self) -> str:
             vllm_factors.append("None")
         factors.append(vllm_factors)
 
-        hash_str = hashlib.md5(str(factors).encode(),
-                               usedforsecurity=False).hexdigest()[:10]
+        hash_str = hashlib.md5(
+            str(factors).encode(), usedforsecurity=False
+        ).hexdigest()[:10]
         return hash_str
 
     def pad_for_cudagraph(self, batch_size: int) -> int:
@@ -210,13 +210,14 @@ def pad_for_cudagraph(self, batch_size: int) -> int:
 
     @staticmethod
     def _get_quantization_config(
-            model_config: ModelConfig,
-            load_config: LoadConfig) -> Optional[QuantizationConfig]:
+        model_config: ModelConfig, load_config: LoadConfig
+    ) -> Optional[QuantizationConfig]:
         """Get the quantization config."""
         from vllm.platforms import current_platform
+
         if model_config.quantization is not None:
-            from vllm.model_executor.model_loader.weight_utils import (
-                get_quant_config)
+            from vllm.model_executor.model_loader.weight_utils import get_quant_config
+
             quant_config = get_quant_config(model_config, load_config)
             capability_tuple = current_platform.get_device_capability()
 
@@ -227,27 +228,30 @@ def _get_quantization_config(
                         f"The quantization method {model_config.quantization} "
                         "is not supported for the current GPU. Minimum "
                         f"capability: {quant_config.get_min_capability()}. "
-                        f"Current capability: {capability}.")
+                        f"Current capability: {capability}."
+                    )
             supported_dtypes = quant_config.get_supported_act_dtypes()
             if model_config.dtype not in supported_dtypes:
                 raise ValueError(
                     f"{model_config.dtype} is not supported for quantization "
                     f"method {model_config.quantization}. Supported dtypes: "
-                    f"{supported_dtypes}")
+                    f"{supported_dtypes}"
+                )
             quant_config.maybe_update_config(model_config.model)
             return quant_config
         return None
 
     @staticmethod
     def get_quantization_config(
-            model_config: ModelConfig,
-            load_config: LoadConfig) -> Optional[QuantizationConfig]:
+        model_config: ModelConfig, load_config: LoadConfig
+    ) -> Optional[QuantizationConfig]:
         import copy
 
         # For some reason, the _ version of this modifies the model_config
         # object, so using deepcopy to avoid this problem.
-        return VllmConfig._get_quantization_config(copy.deepcopy(model_config),
-                                                   load_config)
+        return VllmConfig._get_quantization_config(
+            copy.deepcopy(model_config), load_config
+        )
 
     def with_hf_config(
         self,
@@ -264,15 +268,13 @@ def with_hf_config(
         return replace(self, model_config=model_config)
 
     def __post_init__(self):
-        """Verify configs are valid & consistent with each other.
-        """
+        """Verify configs are valid & consistent with each other."""
 
         self.try_verify_and_update_config()
 
         if self.model_config is not None:
             self.model_config.verify_with_parallel_config(self.parallel_config)
-            self.model_config.verify_dual_chunk_attention_config(
-                self.load_config)
+            self.model_config.verify_dual_chunk_attention_config(self.load_config)
 
         self.cache_config.verify_with_parallel_config(self.parallel_config)
 
@@ -282,29 +284,35 @@ def __post_init__(self):
 
         if self.quant_config is None and self.model_config is not None:
             self.quant_config = VllmConfig._get_quantization_config(
-                self.model_config, self.load_config)
+                self.model_config, self.load_config
+            )
 
         from vllm.platforms import current_platform
-        if self.model_config is not None and \
-            self.scheduler_config.chunked_prefill_enabled and \
-            self.model_config.dtype == torch.float32 and \
-            current_platform.get_device_capability() == (7, 5):
+
+        if (
+            self.model_config is not None
+            and self.scheduler_config.chunked_prefill_enabled
+            and self.model_config.dtype == torch.float32
+            and current_platform.get_device_capability() == (7, 5)
+        ):
             logger.warning_once(
                 "Turing devices tensor cores do not support float32 matmul. "
                 "To workaround this limitation, vLLM will set 'ieee' input "
-                "precision for chunked prefill triton kernels.")
+                "precision for chunked prefill triton kernels."
+            )
 
         # If the user does not explicitly set a compilation level, then
         # we use the default level. The default level depends on other
         # settings (see the below code).
         if self.compilation_config.level is None:
             if envs.VLLM_USE_V1:
-                if (self.model_config is not None
-                        and not self.model_config.enforce_eager):
+                if (
+                    self.model_config is not None
+                    and not self.model_config.enforce_eager
+                ):
                     self.compilation_config.level = CompilationLevel.PIECEWISE
                 else:
-                    self.compilation_config.level = \
-                            CompilationLevel.NO_COMPILATION
+                    self.compilation_config.level = CompilationLevel.NO_COMPILATION
 
             else:
                 # NB: Passing both --enforce-eager and a compilation level
@@ -314,8 +322,7 @@ def __post_init__(self):
         # async tp is built on top of sequence parallelism
         # and requires it to be enabled.
         if self.compilation_config.pass_config.enable_async_tp:
-            self.compilation_config.pass_config.enable_sequence_parallelism = \
-                True
+            self.compilation_config.pass_config.enable_sequence_parallelism = True
         if self.compilation_config.pass_config.enable_sequence_parallelism:
             self.compilation_config.custom_ops.append("+rms_norm")
 
@@ -323,25 +330,27 @@ def __post_init__(self):
             # if cudagraph_mode is not explicitly set by users, set default
             # value
             if self.compilation_config.cudagraph_mode is None:
-                if envs.VLLM_USE_V1 and self.compilation_config.level \
-                    == CompilationLevel.PIECEWISE:
+                if (
+                    envs.VLLM_USE_V1
+                    and self.compilation_config.level == CompilationLevel.PIECEWISE
+                ):
                     # default to full and piecewise for most models
-                    self.compilation_config.cudagraph_mode = \
+                    self.compilation_config.cudagraph_mode = (
                         CUDAGraphMode.FULL_AND_PIECEWISE
+                    )
 
                     # pooling models and encoder-decoder models
                     # do not support full cudagraphs
-                    if self.model_config is not None and \
-                        (self.model_config.pooler_config is not None
-                         or self.model_config.is_encoder_decoder):
-                        self.compilation_config.cudagraph_mode = \
-                            CUDAGraphMode.PIECEWISE
+                    if self.model_config is not None and (
+                        self.model_config.pooler_config is not None
+                        or self.model_config.is_encoder_decoder
+                    ):
+                        self.compilation_config.cudagraph_mode = CUDAGraphMode.PIECEWISE
                 else:
                     self.compilation_config.cudagraph_mode = CUDAGraphMode.NONE
 
             # disable cudagraph when enforce eager execution
-            if self.model_config is not None and \
-                    self.model_config.enforce_eager:
+            if self.model_config is not None and self.model_config.enforce_eager:
                 logger.info("Cudagraph is disabled under eager mode")
                 self.compilation_config.cudagraph_mode = CUDAGraphMode.NONE
             elif envs.VLLM_USE_V1:
@@ -352,18 +361,21 @@ def __post_init__(self):
             self.compilation_config.cudagraph_mode = CUDAGraphMode.NONE
 
         if self.cache_config.kv_sharing_fast_prefill:
-
-            if self.speculative_config is not None and \
-                self.speculative_config.use_eagle():
+            if (
+                self.speculative_config is not None
+                and self.speculative_config.use_eagle()
+            ):
                 raise NotImplementedError(
                     "Fast prefill optimization for KV sharing is not "
                     "compatible with EAGLE as EAGLE requires correct logits "
                     "for all tokens while fast prefill gives incorrect logits "
-                    "for prompt tokens.")
+                    "for prompt tokens."
+                )
 
             logger.warning_once(
                 "--kv-sharing-fast-prefill requires changes on model side for "
-                "correctness and to realize prefill savings. ")
+                "correctness and to realize prefill savings. "
+            )
 
         disable_chunked_prefill_reasons: list[str] = []
 
@@ -372,41 +384,51 @@ def __post_init__(self):
                 pooling_type = self.model_config.pooler_config.pooling_type
                 if pooling_type is None or pooling_type.lower() != "last":
                     disable_chunked_prefill_reasons.append(
-                        "Only \"last\" pooling supports chunked "
-                        "prefill and prefix caching; disabling both.")
+                        'Only "last" pooling supports chunked '
+                        "prefill and prefix caching; disabling both."
+                    )
                 if not getattr(self.model_config.hf_config, "is_causal", True):
                     disable_chunked_prefill_reasons.append(
                         "Only models using causal attention supports chunked "
-                        "prefill and prefix caching; disabling both.")
+                        "prefill and prefix caching; disabling both."
+                    )
             elif self.model_config.is_encoder_decoder:
                 from vllm.multimodal import MULTIMODAL_REGISTRY
-                self.scheduler_config.max_num_encoder_input_tokens = \
+
+                self.scheduler_config.max_num_encoder_input_tokens = (
                     MULTIMODAL_REGISTRY.get_encdec_max_encoder_len(self.model_config)
+                )
                 logger.debug(
                     "Encoder-decoder model detected: setting "
                     "`max_num_encoder_input_tokens` to encoder length (%s)",
-                    self.scheduler_config.max_num_encoder_input_tokens)
-                if (self.model_config.architecture
-                        == "WhisperForConditionalGeneration"
-                        and os.environ.get("VLLM_WORKER_MULTIPROC_METHOD")
-                        != "spawn"):
+                    self.scheduler_config.max_num_encoder_input_tokens,
+                )
+                if (
+                    self.model_config.architecture == "WhisperForConditionalGeneration"
+                    and os.environ.get("VLLM_WORKER_MULTIPROC_METHOD") != "spawn"
+                ):
                     logger.warning(
                         "Whisper is known to have issues with "
                         "forked workers. If startup is hanging, "
                         "try setting 'VLLM_WORKER_MULTIPROC_METHOD' "
-                        "to 'spawn'.")
+                        "to 'spawn'."
+                    )
 
         # Final off-switch for CP/APC:
         # Disable for (a) collected blockers, (b) encoder–decoder, or
         # (c) explicit CP=False when APC wasn't requested.
         # Do NOT disable merely because the resolved CP flag is False.
-        apc_requested = (self.cache_config is not None
-                         and self.cache_config.enable_prefix_caching)
-        if (disable_chunked_prefill_reasons
-                or (self.model_config is not None
-                    and self.model_config.is_encoder_decoder)
-                or (self.scheduler_config.enable_chunked_prefill is False
-                    and not apc_requested)):
+        apc_requested = (
+            self.cache_config is not None and self.cache_config.enable_prefix_caching
+        )
+        if (
+            disable_chunked_prefill_reasons
+            or (self.model_config is not None and self.model_config.is_encoder_decoder)
+            or (
+                self.scheduler_config.enable_chunked_prefill is False
+                and not apc_requested
+            )
+        ):
             for reason in disable_chunked_prefill_reasons:
                 logger.info(reason)
             self.scheduler_config.chunked_prefill_enabled = False
@@ -415,72 +437,85 @@ def __post_init__(self):
             if self.cache_config is not None:
                 self.cache_config.enable_prefix_caching = False
 
-        if (self.kv_events_config is not None
-                and self.kv_events_config.enable_kv_cache_events
-                and not self.cache_config.enable_prefix_caching):
+        if (
+            self.kv_events_config is not None
+            and self.kv_events_config.enable_kv_cache_events
+            and not self.cache_config.enable_prefix_caching
+        ):
             logger.warning(
                 "KV cache events are on, but prefix caching is not enabled."
-                "Use --enable-prefix-caching to enable.")
-        if (self.kv_events_config is not None
-                and self.kv_events_config.publisher != "null"
-                and not self.kv_events_config.enable_kv_cache_events):
-            logger.warning("KV cache events are disabled,"
-                           "but the scheduler is configured to publish them."
-                           "Modify KVEventsConfig.enable_kv_cache_events"
-                           "to True to enable.")
+                "Use --enable-prefix-caching to enable."
+            )
+        if (
+            self.kv_events_config is not None
+            and self.kv_events_config.publisher != "null"
+            and not self.kv_events_config.enable_kv_cache_events
+        ):
+            logger.warning(
+                "KV cache events are disabled,"
+                "but the scheduler is configured to publish them."
+                "Modify KVEventsConfig.enable_kv_cache_events"
+                "to True to enable."
+            )
         current_platform.check_and_update_config(self)
 
         # Do this after all the updates to compilation_config.level
-        if envs.VLLM_USE_V1 and \
-            self.compilation_config.level == CompilationLevel.PIECEWISE:
+        if (
+            envs.VLLM_USE_V1
+            and self.compilation_config.level == CompilationLevel.PIECEWISE
+        ):
             self.compilation_config.set_splitting_ops_for_v1()
 
         # final check of cudagraph mode after all possible updates
         if envs.VLLM_USE_V1 and current_platform.is_cuda_alike():
-            if self.compilation_config.cudagraph_mode.has_full_cudagraphs()\
-                and self.model_config is not None and \
-                not self.model_config.disable_cascade_attn and\
-                not self.compilation_config.cudagraph_mode.\
-                has_piecewise_cudagraphs():
+            if (
+                self.compilation_config.cudagraph_mode.has_full_cudagraphs()
+                and self.model_config is not None
+                and not self.model_config.disable_cascade_attn
+                and not self.compilation_config.cudagraph_mode.has_piecewise_cudagraphs()
+            ):
                 logger.warning_once(
                     "No piecewise cudagraph for executing cascade attention."
                     " Will fall back to eager execution if a batch runs "
-                    "into cascade attentions")
-
-            if self.compilation_config.cudagraph_mode\
-                .requires_piecewise_compilation():
-                assert self.compilation_config.level == \
-                    CompilationLevel.PIECEWISE, \
-                    "Compilation level should be CompilationLevel.PIECEWISE "\
-                    "when cudagraph_mode piecewise cudagraphs is used, "\
+                    "into cascade attentions"
+                )
+
+            if self.compilation_config.cudagraph_mode.requires_piecewise_compilation():
+                assert self.compilation_config.level == CompilationLevel.PIECEWISE, (
+                    "Compilation level should be CompilationLevel.PIECEWISE "
+                    "when cudagraph_mode piecewise cudagraphs is used, "
                     f"cudagraph_mode={self.compilation_config.cudagraph_mode}"
+                )
 
             # final migrate the deprecated flags
-            self.compilation_config.use_cudagraph = self.compilation_config.\
-                cudagraph_mode!= CUDAGraphMode.NONE
-            self.compilation_config.full_cuda_graph = self.compilation_config.\
-                cudagraph_mode.has_full_cudagraphs()
+            self.compilation_config.use_cudagraph = (
+                self.compilation_config.cudagraph_mode != CUDAGraphMode.NONE
+            )
+            self.compilation_config.full_cuda_graph = (
+                self.compilation_config.cudagraph_mode.has_full_cudagraphs()
+            )
 
         if self.parallel_config.enable_dbo:
             a2a_backend = envs.VLLM_ALL2ALL_BACKEND
-            assert a2a_backend in \
-                ["deepep_low_latency", "deepep_high_throughput"], \
-            "Microbatching currently only supports the deepep_low_latency and "\
-            f"deepep_high_throughput all2all backend. {a2a_backend} is not "\
-            "supported. To fix set the VLLM_ALL2ALL_BACKEND environment "\
-            "variable to deepep_low_latency or deepep_high_throughput and "\
-            "install the DeepEP kernels."
+            assert a2a_backend in ["deepep_low_latency", "deepep_high_throughput"], (
+                "Microbatching currently only supports the deepep_low_latency and "
+                f"deepep_high_throughput all2all backend. {a2a_backend} is not "
+                "supported. To fix set the VLLM_ALL2ALL_BACKEND environment "
+                "variable to deepep_low_latency or deepep_high_throughput and "
+                "install the DeepEP kernels."
+            )
 
             if not self.model_config.disable_cascade_attn:
                 self.model_config.disable_cascade_attn = True
-                logger.warning_once(
-                    "Disabling cascade attention when DBO is enabled.")
+                logger.warning_once("Disabling cascade attention when DBO is enabled.")
 
         if not self.instance_id:
             self.instance_id = random_uuid()[:5]
 
-        if (envs.VLLM_USE_V1
-                and not self.scheduler_config.disable_hybrid_kv_cache_manager):
+        if (
+            envs.VLLM_USE_V1
+            and not self.scheduler_config.disable_hybrid_kv_cache_manager
+        ):
             # logger should only print warning message for hybrid models. As we
             # can't know whether the model is hybrid or not now, so we don't log
             # warning message here and will log it later.
@@ -493,15 +528,18 @@ def __post_init__(self):
             if self.kv_events_config is not None:
                 # Hybrid KV cache manager is not compatible with KV events.
                 self.scheduler_config.disable_hybrid_kv_cache_manager = True
-            if self.model_config is not None and \
-                self.model_config.attention_chunk_size is not None:
-                if self.speculative_config is not None and \
-                    self.speculative_config.use_eagle():
+            if (
+                self.model_config is not None
+                and self.model_config.attention_chunk_size is not None
+            ):
+                if (
+                    self.speculative_config is not None
+                    and self.speculative_config.use_eagle()
+                ):
                     # Hybrid KV cache manager is not yet supported with chunked
                     # local attention + eagle.
                     self.scheduler_config.disable_hybrid_kv_cache_manager = True
-                elif \
-                    not envs.VLLM_ALLOW_CHUNKED_LOCAL_ATTN_WITH_HYBRID_KV_CACHE:
+                elif not envs.VLLM_ALLOW_CHUNKED_LOCAL_ATTN_WITH_HYBRID_KV_CACHE:
                     logger.warning(
                         "There is a latency regression when using chunked local"
                         " attention with the hybrid KV cache manager. Disabling"
@@ -513,14 +551,17 @@ def __post_init__(self):
                     self.scheduler_config.disable_hybrid_kv_cache_manager = True
 
         if self.compilation_config.debug_dump_path:
-            self.compilation_config.debug_dump_path = \
+            self.compilation_config.debug_dump_path = (
                 self.compilation_config.debug_dump_path.absolute().expanduser()
+            )
         if envs.VLLM_DEBUG_DUMP_PATH is not None:
             env_path = Path(envs.VLLM_DEBUG_DUMP_PATH).absolute().expanduser()
             if self.compilation_config.debug_dump_path:
                 logger.warning(
                     "Config-specified debug dump path is overridden"
-                    " by VLLM_DEBUG_DUMP_PATH to %s", env_path)
+                    " by VLLM_DEBUG_DUMP_PATH to %s",
+                    env_path,
+                )
             self.compilation_config.debug_dump_path = env_path
 
         def has_blocked_weights():
@@ -540,23 +581,26 @@ def has_blocked_weights():
             if "none" not in custom_ops and "-quant_fp8" not in custom_ops:
                 custom_ops.append("+quant_fp8")
 
-    def update_sizes_for_sequence_parallelism(self,
-                                              possible_sizes: list) -> list:
+    def update_sizes_for_sequence_parallelism(self, possible_sizes: list) -> list:
         # remove the sizes that not multiple of tp_size when
         # enable sequence parallelism
         removed_sizes = [
-            size for size in possible_sizes
+            size
+            for size in possible_sizes
             if size % self.parallel_config.tensor_parallel_size != 0
         ]
         if removed_sizes:
             logger.warning(
                 "Batch sizes %s are removed because they are not "
                 "multiple of tp_size %d when "
-                "sequence parallelism is enabled", removed_sizes,
-                self.parallel_config.tensor_parallel_size)
+                "sequence parallelism is enabled",
+                removed_sizes,
+                self.parallel_config.tensor_parallel_size,
+            )
 
         return [
-            size for size in possible_sizes
+            size
+            for size in possible_sizes
             if size % self.parallel_config.tensor_parallel_size == 0
         ]
 
@@ -600,13 +644,13 @@ def _set_cudagraph_sizes(self):
 
         # calculate the default `batch_size_capture_list`
         batch_size_capture_list = []
-        if self.model_config is not None and \
-            not self.model_config.enforce_eager:
+        if self.model_config is not None and not self.model_config.enforce_eager:
             cuda_graph_sizes = self.scheduler_config.cuda_graph_sizes
             if len(cuda_graph_sizes) == 1:
                 max_graph_size = cuda_graph_sizes[0]
-                assert max_graph_size >= 1, "Maximum cudagraph size should be" \
-                                            " greater than or equal to 1."
+                assert max_graph_size >= 1, (
+                    "Maximum cudagraph size should be greater than or equal to 1."
+                )
                 batch_size_capture_list = [
                     i for i in [1, 2, 4] if i <= max_graph_size
                 ] + list(range(8, max_graph_size + 1, 8))
@@ -614,18 +658,19 @@ def _set_cudagraph_sizes(self):
                 batch_size_capture_list = sorted(cuda_graph_sizes)
             else:
                 raise TypeError(f"Invalid value for {cuda_graph_sizes=}.")
-            if self.parallel_config.tensor_parallel_size > 1 and \
-                self.compilation_config.pass_config.enable_sequence_parallelism:
-                batch_size_capture_list = \
-                    self.update_sizes_for_sequence_parallelism(batch_size_capture_list)
+            if (
+                self.parallel_config.tensor_parallel_size > 1
+                and self.compilation_config.pass_config.enable_sequence_parallelism
+            ):
+                batch_size_capture_list = self.update_sizes_for_sequence_parallelism(
+                    batch_size_capture_list
+                )
             max_num_tokens = self.scheduler_config.max_num_batched_tokens
             batch_size_capture_list = [
-                size for size in batch_size_capture_list
-                if size <= max_num_tokens
+                size for size in batch_size_capture_list if size <= max_num_tokens
             ]
 
-        self.compilation_config.init_with_cudagraph_sizes(
-            batch_size_capture_list)
+        self.compilation_config.init_with_cudagraph_sizes(batch_size_capture_list)
 
     def recalculate_max_model_len(self, max_model_len: int):
         # Can only be called in try_verify_and_update_config
@@ -648,7 +693,10 @@ def try_verify_and_update_config(self):
             return
 
         from vllm.model_executor.models.config import (
-            MODELS_CONFIG_MAP, HybridAttentionMambaModelConfig)
+            MODELS_CONFIG_MAP,
+            HybridAttentionMambaModelConfig,
+        )
+
         cls = MODELS_CONFIG_MAP.get(architecture, None)
         if cls is not None:
             cls.verify_and_update_config(self)
@@ -658,21 +706,26 @@ def try_verify_and_update_config(self):
 
         if self.model_config.convert_type == "classify":
             # Maybe convert ForCausalLM into ForSequenceClassification model.
-            from vllm.model_executor.models.adapters import (
-                SequenceClassificationConfig)
+            from vllm.model_executor.models.adapters import SequenceClassificationConfig
+
             SequenceClassificationConfig.verify_and_update_config(self)
 
         if hasattr(self.model_config, "model_weights") and is_runai_obj_uri(
-                self.model_config.model_weights):
+            self.model_config.model_weights
+        ):
             if self.load_config.load_format == "auto":
-                logger.info("Detected Run:ai model config. "
-                            "Overriding `load_format` to 'runai_streamer'")
+                logger.info(
+                    "Detected Run:ai model config. "
+                    "Overriding `load_format` to 'runai_streamer'"
+                )
                 self.load_config.load_format = "runai_streamer"
             elif self.load_config.load_format != "runai_streamer":
-                raise ValueError(f"To load a model from S3, 'load_format' "
-                                 f"must be 'runai_streamer', "
-                                 f"but got '{self.load_config.load_format}'. "
-                                 f"Model: {self.model_config.model}")
+                raise ValueError(
+                    f"To load a model from S3, 'load_format' "
+                    f"must be 'runai_streamer', "
+                    f"but got '{self.load_config.load_format}'. "
+                    f"Model: {self.model_config.model}"
+                )
 
     def compile_debug_dump_path(self) -> Optional[Path]:
         """Returns a rank-aware path for dumping
@@ -683,8 +736,11 @@ def compile_debug_dump_path(self) -> Optional[Path]:
         tp_rank = self.parallel_config.rank
         dp_rank = self.parallel_config.data_parallel_rank
         data_parallel_size = self.parallel_config.data_parallel_size
-        append_path = f"rank_{tp_rank}" if data_parallel_size == 1 \
+        append_path = (
+            f"rank_{tp_rank}"
+            if data_parallel_size == 1
             else f"rank_{tp_rank}_dp_{dp_rank}"
+        )
         path = self.compilation_config.debug_dump_path / append_path
         return path
 
@@ -717,7 +773,8 @@ def __str__(self):
             f"enable_prefix_caching={self.cache_config.enable_prefix_caching}, "
             f"chunked_prefill_enabled={self.scheduler_config.chunked_prefill_enabled}, "  # noqa
             f"pooler_config={self.model_config.pooler_config!r}, "
-            f"compilation_config={self.compilation_config!r}")
+            f"compilation_config={self.compilation_config!r}"
+        )
 
 
 _current_vllm_config: Optional[VllmConfig] = None
@@ -725,9 +782,9 @@ def __str__(self):
 
 
 @contextmanager
-def set_current_vllm_config(vllm_config: VllmConfig,
-                            check_compile=False,
-                            prefix: Optional[str] = None):
+def set_current_vllm_config(
+    vllm_config: VllmConfig, check_compile=False, prefix: Optional[str] = None
+):
     """
     Temporarily set the current vLLM config.
     Used during model initialization.
@@ -739,6 +796,7 @@ def set_current_vllm_config(vllm_config: VllmConfig,
     old_vllm_config = _current_vllm_config
     old_prefix = _current_prefix
     from vllm.compilation.counter import compilation_counter
+
     num_models_seen = compilation_counter.num_models_seen
     try:
         _current_vllm_config = vllm_config
@@ -750,9 +808,11 @@ def set_current_vllm_config(vllm_config: VllmConfig,
         if check_compile:
             vllm_config.compilation_config.custom_op_log_check()
 
-        if check_compile and \
-            vllm_config.compilation_config.level == CompilationLevel.PIECEWISE \
-            and compilation_counter.num_models_seen == num_models_seen:
+        if (
+            check_compile
+            and vllm_config.compilation_config.level == CompilationLevel.PIECEWISE
+            and compilation_counter.num_models_seen == num_models_seen
+        ):
             # If the model supports compilation,
             # compilation_counter.num_models_seen should be increased
             # by at least 1.
@@ -762,7 +822,8 @@ def set_current_vllm_config(vllm_config: VllmConfig,
                 "`torch.compile` is turned on, but the model %s"
                 " does not support it. Please open an issue on GitHub"
                 " if you want it to be supported.",
-                vllm_config.model_config.model)
+                vllm_config.model_config.model,
+            )
     finally:
         _current_vllm_config = old_vllm_config
         _current_prefix = old_prefix
@@ -790,9 +851,10 @@ def get_current_vllm_config() -> VllmConfig:
 
 
 def get_layers_from_vllm_config(
-        vllm_config: VllmConfig,
-        layer_type: type[T],
-        layer_names: Optional[list[str]] = None) -> dict[str, T]:
+    vllm_config: VllmConfig,
+    layer_type: type[T],
+    layer_names: Optional[list[str]] = None,
+) -> dict[str, T]:
     """
     Get layers from the vLLM config.
 
@@ -803,8 +865,7 @@ def get_layers_from_vllm_config(
     """
 
     if layer_names is None:
-        layer_names = list(
-            vllm_config.compilation_config.static_forward_context.keys())
+        layer_names = list(vllm_config.compilation_config.static_forward_context.keys())
 
     forward_context = vllm_config.compilation_config.static_forward_context
 
diff --git a/vllm/connections.py b/vllm/connections.py
index 1f341719ae30..8d5e0e5cbf5d 100644
--- a/vllm/connections.py
+++ b/vllm/connections.py
@@ -41,8 +41,9 @@ def _validate_http_url(self, url: str):
         parsed_url = urlparse(url)
 
         if parsed_url.scheme not in ("http", "https"):
-            raise ValueError("Invalid HTTP URL: A valid HTTP URL "
-                             "must have scheme 'http' or 'https'.")
+            raise ValueError(
+                "Invalid HTTP URL: A valid HTTP URL must have scheme 'http' or 'https'."
+            )
 
     def _headers(self, **extras: str) -> MutableMapping[str, str]:
         return {"User-Agent": f"vLLM/{VLLM_VERSION}", **extras}
@@ -61,11 +62,13 @@ def get_response(
         client = self.get_sync_client()
         extra_headers = extra_headers or {}
 
-        return client.get(url,
-                          headers=self._headers(**extra_headers),
-                          stream=stream,
-                          timeout=timeout,
-                          allow_redirects=allow_redirects)
+        return client.get(
+            url,
+            headers=self._headers(**extra_headers),
+            stream=stream,
+            timeout=timeout,
+            allow_redirects=allow_redirects,
+        )
 
     async def get_async_response(
         self,
@@ -80,19 +83,19 @@ async def get_async_response(
         client = await self.get_async_client()
         extra_headers = extra_headers or {}
 
-        return client.get(url,
-                          headers=self._headers(**extra_headers),
-                          timeout=timeout,
-                          allow_redirects=allow_redirects)
-
-    def get_bytes(self,
-                  url: str,
-                  *,
-                  timeout: Optional[float] = None,
-                  allow_redirects: bool = True) -> bytes:
-        with self.get_response(url,
-                               timeout=timeout,
-                               allow_redirects=allow_redirects) as r:
+        return client.get(
+            url,
+            headers=self._headers(**extra_headers),
+            timeout=timeout,
+            allow_redirects=allow_redirects,
+        )
+
+    def get_bytes(
+        self, url: str, *, timeout: Optional[float] = None, allow_redirects: bool = True
+    ) -> bytes:
+        with self.get_response(
+            url, timeout=timeout, allow_redirects=allow_redirects
+        ) as r:
             r.raise_for_status()
 
             return r.content
@@ -105,7 +108,8 @@ async def async_get_bytes(
         allow_redirects: bool = True,
     ) -> bytes:
         async with await self.get_async_response(
-                url, timeout=timeout, allow_redirects=allow_redirects) as r:
+            url, timeout=timeout, allow_redirects=allow_redirects
+        ) as r:
             r.raise_for_status()
 
             return await r.read()
diff --git a/vllm/device_allocator/cumem.py b/vllm/device_allocator/cumem.py
index af7ca6be1fca..97c6654385b3 100644
--- a/vllm/device_allocator/cumem.py
+++ b/vllm/device_allocator/cumem.py
@@ -28,7 +28,7 @@ def find_loaded_library(lib_name) -> Optional[str]:
     the file `/proc/self/maps` contains the memory maps of the process, which includes the
     shared libraries loaded by the process. We can use this file to find the path of the
     a loaded library.
-    """ # noqa
+    """  # noqa
     found_line = None
     with open("/proc/self/maps") as f:
         for line in f:
@@ -43,17 +43,21 @@ def find_loaded_library(lib_name) -> Optional[str]:
     start = found_line.index("/")
     path = found_line[start:].strip()
     filename = path.split("/")[-1]
-    assert filename.rpartition(".so")[0].startswith(lib_name), \
+    assert filename.rpartition(".so")[0].startswith(lib_name), (
         f"Unexpected filename: {filename} for library {lib_name}"
+    )
     return path
 
 
 cumem_available = False
 try:
-    from vllm.cumem_allocator import (init_module, python_create_and_map,
-                                      python_unmap_and_release)
-    from vllm.distributed.device_communicators.cuda_wrapper import (
-        CudaRTLibrary)
+    from vllm.cumem_allocator import (
+        init_module,
+        python_create_and_map,
+        python_unmap_and_release,
+    )
+    from vllm.distributed.device_communicators.cuda_wrapper import CudaRTLibrary
+
     lib_name = find_loaded_library("cumem_allocator")
     libcudart = CudaRTLibrary()
     cumem_available = True
@@ -86,20 +90,19 @@ def unmap_and_release(allocation_handle: HandleType) -> None:
 
 
 def get_pluggable_allocator(
-    python_malloc_fn: Callable[[int],
-                               int], python_free_func: Callable[[int, int],
-                                                                None]
+    python_malloc_fn: Callable[[int], int], python_free_func: Callable[[int, int], None]
 ) -> torch.cuda.memory.CUDAPluggableAllocator:
     init_module(python_malloc_fn, python_free_func)
     new_alloc = torch.cuda.memory.CUDAPluggableAllocator(
-        lib_name, 'my_malloc', 'my_free')
+        lib_name, "my_malloc", "my_free"
+    )
     return new_alloc
 
 
 @contextmanager
 def use_memory_pool_with_allocator(
-        python_malloc_fn: Callable[[int], int],
-        python_free_func: Callable[[int, int], None]) -> None:
+    python_malloc_fn: Callable[[int], int], python_free_func: Callable[[int, int], None]
+) -> None:
     new_alloc = get_pluggable_allocator(python_malloc_fn, python_free_func)
     mem_pool = torch.cuda.memory.MemPool(new_alloc._allocator)
     with torch.cuda.memory.use_mem_pool(mem_pool):
@@ -130,6 +133,7 @@ class CuMemAllocator:
     the global variable will be overwritten and the free callback will
     not work as expected.
     """
+
     instance: "CuMemAllocator" = None
     default_tag: str = "default"
 
@@ -147,10 +151,11 @@ def get_instance() -> "CuMemAllocator":
 
     def __init__(self):
         conf = os.environ.get("PYTORCH_CUDA_ALLOC_CONF", "")
-        assert "expandable_segments:True" not in conf, \
-            ("Expandable segments are not compatible with memory pool. "
+        assert "expandable_segments:True" not in conf, (
+            "Expandable segments are not compatible with memory pool. "
             "Please track https://github.com/pytorch/pytorch/issues/147851 "
-            "for the latest updates.")
+            "for the latest updates."
+        )
 
         self.pointer_to_data: dict[int, AllocationData] = {}
         self.current_tag: str = CuMemAllocator.default_tag
@@ -167,10 +172,14 @@ def _python_malloc_callback(self, allocation_handle: HandleType) -> None:
         when memory is allocated in the memory pool."""
         py_d_mem = allocation_handle[2]
         self.pointer_to_data[py_d_mem] = AllocationData(
-            allocation_handle, self.current_tag)
+            allocation_handle, self.current_tag
+        )
         logger.debug(
             "Allocated %s bytes for %s with address %s from cumem allocator",
-            allocation_handle[1], self.current_tag, py_d_mem)
+            allocation_handle[1],
+            self.current_tag,
+            py_d_mem,
+        )
         return
 
     def _python_free_callback(self, ptr: int) -> HandleType:
@@ -182,13 +191,13 @@ def _python_free_callback(self, ptr: int) -> HandleType:
             data.cpu_backup_tensor = None
         logger.debug(
             "Freed %s bytes for %s with address %s from cumem allocator",
-            data.handle[1], data.tag, ptr)
+            data.handle[1],
+            data.tag,
+            ptr,
+        )
         return data.handle
 
-    def sleep(
-            self,
-            offload_tags: Optional[Union[tuple[str, ...],
-                                         str]] = None) -> None:
+    def sleep(self, offload_tags: Optional[Union[tuple[str, ...], str]] = None) -> None:
         """
         Put the allocator in sleep mode.
         All data in the memory allocation with the specified tag will be
@@ -200,9 +209,9 @@ def sleep(
         if offload_tags is None:
             # by default, allocated tensors are offloaded
             # when the allocator sleeps
-            offload_tags = (CuMemAllocator.default_tag, )
+            offload_tags = (CuMemAllocator.default_tag,)
         elif isinstance(offload_tags, str):
-            offload_tags = (offload_tags, )
+            offload_tags = (offload_tags,)
 
         assert isinstance(offload_tags, tuple)
 
@@ -218,8 +227,9 @@ def sleep(
                 cpu_backup_tensor = torch.empty(
                     size_in_bytes,
                     dtype=torch.uint8,
-                    device='cpu',
-                    pin_memory=is_pin_memory_available())
+                    device="cpu",
+                    pin_memory=is_pin_memory_available(),
+                )
                 cpu_ptr = cpu_backup_tensor.data_ptr()
                 libcudart.cudaMemcpy(cpu_ptr, ptr, size_in_bytes)
                 data.cpu_backup_tensor = cpu_backup_tensor
@@ -228,8 +238,11 @@ def sleep(
         logger.info(
             "CuMemAllocator: sleep freed %.2f GiB memory in total, of which "
             "%.2f GiB is backed up in CPU and the rest %.2f GiB is discarded "
-            "directly.", total_bytes / 1024**3, backup_bytes / 1024**3,
-            (total_bytes - backup_bytes) / 1024**3)
+            "directly.",
+            total_bytes / 1024**3,
+            backup_bytes / 1024**3,
+            (total_bytes - backup_bytes) / 1024**3,
+        )
 
         gc.collect()
         torch.cuda.empty_cache()
@@ -251,8 +264,9 @@ def wake_up(self, tags: Optional[list[str]] = None) -> None:
                 if data.cpu_backup_tensor is not None:
                     cpu_backup_tensor = data.cpu_backup_tensor
                     if cpu_backup_tensor is not None:
-                        size_in_bytes = cpu_backup_tensor.numel(
-                        ) * cpu_backup_tensor.element_size()
+                        size_in_bytes = (
+                            cpu_backup_tensor.numel() * cpu_backup_tensor.element_size()
+                        )
                         cpu_ptr = cpu_backup_tensor.data_ptr()
                         libcudart.cudaMemcpy(ptr, cpu_ptr, size_in_bytes)
                         data.cpu_backup_tensor = None
@@ -274,8 +288,9 @@ def use_memory_pool(self, tag: Optional[str] = None):
 
         old_tag = self.current_tag
         self.current_tag = tag
-        with use_memory_pool_with_allocator(self.python_malloc_callback,
-                                            self.python_free_callback) as data:
+        with use_memory_pool_with_allocator(
+            self.python_malloc_callback, self.python_free_callback
+        ) as data:
             # start to hit another PyTorch bug in PyTorch 2.6,
             # possibly because of gc-related issue w.r.t. the allocator and
             # the memory pool.
diff --git a/vllm/distributed/communication_op.py b/vllm/distributed/communication_op.py
index 0a5a95176f7c..46a735f22ed8 100644
--- a/vllm/distributed/communication_op.py
+++ b/vllm/distributed/communication_op.py
@@ -14,28 +14,30 @@ def tensor_model_parallel_all_reduce(input_: torch.Tensor) -> torch.Tensor:
     return get_tp_group().all_reduce(input_)
 
 
-def tensor_model_parallel_all_gather(input_: torch.Tensor,
-                                     dim: int = -1) -> torch.Tensor:
+def tensor_model_parallel_all_gather(
+    input_: torch.Tensor, dim: int = -1
+) -> torch.Tensor:
     """All-gather the input tensor across model parallel group."""
     return get_tp_group().all_gather(input_, dim)
 
 
-def tensor_model_parallel_reduce_scatter(input_: torch.Tensor,
-                                         dim: int = -1) -> torch.Tensor:
+def tensor_model_parallel_reduce_scatter(
+    input_: torch.Tensor, dim: int = -1
+) -> torch.Tensor:
     """Reduce-Scatter the input tensor across model parallel group."""
     return get_tp_group().reduce_scatter(input_, dim)
 
 
-def tensor_model_parallel_gather(input_: torch.Tensor,
-                                 dst: int = 0,
-                                 dim: int = -1) -> Optional[torch.Tensor]:
+def tensor_model_parallel_gather(
+    input_: torch.Tensor, dst: int = 0, dim: int = -1
+) -> Optional[torch.Tensor]:
     """Gather the input tensor across model parallel group."""
     return get_tp_group().gather(input_, dst, dim)
 
 
-def broadcast_tensor_dict(tensor_dict: Optional[dict[Any, Union[torch.Tensor,
-                                                                Any]]] = None,
-                          src: int = 0):
+def broadcast_tensor_dict(
+    tensor_dict: Optional[dict[Any, Union[torch.Tensor, Any]]] = None, src: int = 0
+):
     if not torch.distributed.is_initialized():
         return tensor_dict
     return get_tp_group().broadcast_tensor_dict(tensor_dict, src)
diff --git a/vllm/distributed/device_communicators/all2all.py b/vllm/distributed/device_communicators/all2all.py
index bb3fd657facd..603c3d1a8e0c 100644
--- a/vllm/distributed/device_communicators/all2all.py
+++ b/vllm/distributed/device_communicators/all2all.py
@@ -33,17 +33,19 @@ class NaiveAll2AllManager(All2AllManagerBase):
     def __init__(self, cpu_group):
         super().__init__(cpu_group)
 
-    def naive_multicast(self, x: torch.Tensor,
-                        cu_tokens_across_sp_cpu: torch.Tensor,
-                        is_sequence_parallel: bool) -> torch.Tensor:
-        assert (len(x.shape) == 2)
-        buffer = torch.empty((cu_tokens_across_sp_cpu[-1], x.size(1)),
-                             device=x.device,
-                             dtype=x.dtype)
+    def naive_multicast(
+        self,
+        x: torch.Tensor,
+        cu_tokens_across_sp_cpu: torch.Tensor,
+        is_sequence_parallel: bool,
+    ) -> torch.Tensor:
+        assert len(x.shape) == 2
+        buffer = torch.empty(
+            (cu_tokens_across_sp_cpu[-1], x.size(1)), device=x.device, dtype=x.dtype
+        )
 
         rank = self.rank if is_sequence_parallel else self.dp_rank
-        world_size = (self.world_size
-                      if is_sequence_parallel else self.dp_world_size)
+        world_size = self.world_size if is_sequence_parallel else self.dp_world_size
 
         start = 0 if rank == 0 else cu_tokens_across_sp_cpu[rank - 1]
         end = cu_tokens_across_sp_cpu[rank]
@@ -59,24 +61,23 @@ def dispatch(
         self,
         hidden_states: torch.Tensor,
         router_logits: torch.Tensor,
-        is_sequence_parallel: bool = False
+        is_sequence_parallel: bool = False,
     ) -> tuple[torch.Tensor, torch.Tensor]:
         sp_size = self.tp_group.world_size if is_sequence_parallel else 1
         dp_metadata = get_forward_context().dp_metadata
         cu_tokens_across_sp_cpu = dp_metadata.cu_tokens_across_sp(sp_size)
 
-        hidden_states = self.naive_multicast(hidden_states,
-                                             cu_tokens_across_sp_cpu,
-                                             is_sequence_parallel)
-        router_logits = self.naive_multicast(router_logits,
-                                             cu_tokens_across_sp_cpu,
-                                             is_sequence_parallel)
+        hidden_states = self.naive_multicast(
+            hidden_states, cu_tokens_across_sp_cpu, is_sequence_parallel
+        )
+        router_logits = self.naive_multicast(
+            router_logits, cu_tokens_across_sp_cpu, is_sequence_parallel
+        )
         return hidden_states, router_logits
 
-    def combine(self,
-                hidden_states: torch.Tensor,
-                is_sequence_parallel: bool = False) -> torch.Tensor:
-
+    def combine(
+        self, hidden_states: torch.Tensor, is_sequence_parallel: bool = False
+    ) -> torch.Tensor:
         ep_rank = self.rank if is_sequence_parallel else self.dp_rank
 
         dp_metadata = get_forward_context().dp_metadata
@@ -107,13 +108,12 @@ def dispatch(
         self,
         hidden_states: torch.Tensor,
         router_logits: torch.Tensor,
-        is_sequence_parallel: bool = False
+        is_sequence_parallel: bool = False,
     ) -> tuple[torch.Tensor, torch.Tensor]:
         """
         Gather hidden_states and router_logits from all dp ranks.
         """
-        sizes = get_forward_context(
-        ).dp_metadata.get_chunk_sizes_across_dp_rank()
+        sizes = get_forward_context().dp_metadata.get_chunk_sizes_across_dp_rank()
 
         dist_group = get_ep_group() if is_sequence_parallel else get_dp_group()
         assert sizes[dist_group.rank_in_group] == hidden_states.shape[0]
@@ -124,19 +124,16 @@ def dispatch(
         )
         return hidden_states, router_logits
 
-    def combine(self,
-                hidden_states: torch.Tensor,
-                is_sequence_parallel: bool = False) -> torch.Tensor:
+    def combine(
+        self, hidden_states: torch.Tensor, is_sequence_parallel: bool = False
+    ) -> torch.Tensor:
         """
         Reduce-scatter hidden_states across all dp ranks.
         """
-        sizes = get_forward_context(
-        ).dp_metadata.get_chunk_sizes_across_dp_rank()
+        sizes = get_forward_context().dp_metadata.get_chunk_sizes_across_dp_rank()
 
         dist_group = get_ep_group() if is_sequence_parallel else get_dp_group()
-        hidden_states = dist_group.reduce_scatterv(hidden_states,
-                                                   dim=0,
-                                                   sizes=sizes)
+        hidden_states = dist_group.reduce_scatterv(hidden_states, dim=0, sizes=sizes)
         return hidden_states
 
     def destroy(self):
@@ -149,24 +146,35 @@ class PPLXAll2AllManager(All2AllManagerBase):
     """
 
     def __init__(self, cpu_group):
-        assert has_pplx(
-        ), "pplx_kernels not found. Please follow https://github.com/vllm-project/vllm/blob/main/tools/ep_kernels/README.md to install pplx_kernels."  # noqa
+        assert has_pplx(), (
+            "pplx_kernels not found. Please follow https://github.com/vllm-project/vllm/blob/main/tools/ep_kernels/README.md to install pplx_kernels."
+        )  # noqa
         super().__init__(cpu_group)
 
         if self.internode:
             # inter-node communication needs nvshmem,
             # intra-node communication uses p2p mapping directly
-            from pplx_kernels.nvshmem import (nvshmem_alloc_empty_unique_id,
-                                              nvshmem_get_unique_id,
-                                              nvshmem_init)
+            from pplx_kernels.nvshmem import (
+                nvshmem_alloc_empty_unique_id,
+                nvshmem_get_unique_id,
+                nvshmem_init,
+            )
+
             logger.debug(
-                "Initialize NVSHMEM for pplx_kernels: "
-                "rank=%d, world size=%d", self.rank, self.world_size)
-            uid = nvshmem_get_unique_id(
-            ) if self.rank == 0 else nvshmem_alloc_empty_unique_id()
-            dist.broadcast(uid,
-                           src=dist.get_process_group_ranks(self.cpu_group)[0],
-                           group=self.cpu_group)
+                "Initialize NVSHMEM for pplx_kernels: rank=%d, world size=%d",
+                self.rank,
+                self.world_size,
+            )
+            uid = (
+                nvshmem_get_unique_id()
+                if self.rank == 0
+                else nvshmem_alloc_empty_unique_id()
+            )
+            dist.broadcast(
+                uid,
+                src=dist.get_process_group_ranks(self.cpu_group)[0],
+                group=self.cpu_group,
+            )
             logger.debug("PPLX NVSHMEM UID = %s", uid)
             nvshmem_init(uid, self.rank, self.world_size)
 
@@ -174,21 +182,23 @@ def __init__(self, cpu_group):
 
     def get_handle(self, kwargs):
         import pplx_kernels as pplx
+
         return self.handle_cache.get_or_create(
-            kwargs, pplx.AllToAll.internode
-            if self.internode else pplx.AllToAll.intranode)
+            kwargs,
+            pplx.AllToAll.internode if self.internode else pplx.AllToAll.intranode,
+        )
 
     def dispatch(
         self,
         hidden_states: torch.Tensor,
         router_logits: torch.Tensor,
-        is_sequence_parallel: bool = False
+        is_sequence_parallel: bool = False,
     ) -> tuple[torch.Tensor, torch.Tensor]:
         raise NotImplementedError
 
-    def combine(self,
-                hidden_states: torch.Tensor,
-                is_sequence_parallel: bool = False) -> torch.Tensor:
+    def combine(
+        self, hidden_states: torch.Tensor, is_sequence_parallel: bool = False
+    ) -> torch.Tensor:
         raise NotImplementedError
 
     def destroy(self):
@@ -198,6 +208,7 @@ def destroy(self):
 
         if self.internode:
             from pplx_kernels.nvshmem import nvshmem_finalize
+
             logger.debug("PPLX NVSHMEM finalize")
             nvshmem_finalize()
 
@@ -208,8 +219,9 @@ class DeepEPAll2AllManagerBase(All2AllManagerBase):
     """
 
     def __init__(self, cpu_group):
-        assert has_deep_ep(
-        ), "DeepEP kernels not found. Please follow https://github.com/vllm-project/vllm/blob/main/tools/ep_kernels/README.md to install DeepEP kernels."  # noqa
+        assert has_deep_ep(), (
+            "DeepEP kernels not found. Please follow https://github.com/vllm-project/vllm/blob/main/tools/ep_kernels/README.md to install DeepEP kernels."
+        )  # noqa
         super().__init__(cpu_group)
         self.handle_cache = Cache()
 
@@ -224,13 +236,13 @@ def dispatch(
         self,
         hidden_states: torch.Tensor,
         router_logits: torch.Tensor,
-        is_sequence_parallel: bool = False
+        is_sequence_parallel: bool = False,
     ) -> tuple[torch.Tensor, torch.Tensor]:
         raise NotImplementedError
 
-    def combine(self,
-                hidden_states: torch.Tensor,
-                is_sequence_parallel: bool = False) -> torch.Tensor:
+    def combine(
+        self, hidden_states: torch.Tensor, is_sequence_parallel: bool = False
+    ) -> torch.Tensor:
         raise NotImplementedError
 
     def destroy(self):
@@ -260,23 +272,27 @@ def _make_all2all_kwargs(self) -> dict[Any, Any]:
 
         assert num_rdma_bytes is not None
         assert num_qps_per_rank is not None
-        return dict(group=self.cpu_group,
-                    num_nvl_bytes=num_nvl_bytes,
-                    num_rdma_bytes=num_rdma_bytes,
-                    low_latency_mode=False,
-                    num_qps_per_rank=num_qps_per_rank)
+        return dict(
+            group=self.cpu_group,
+            num_nvl_bytes=num_nvl_bytes,
+            num_rdma_bytes=num_rdma_bytes,
+            low_latency_mode=False,
+            num_qps_per_rank=num_qps_per_rank,
+        )
 
     def get_handle(self, kwargs):
-
         assert len(kwargs) == 0, (
             "DeepEPHTAll2AllManager expects no arguments. All the required "
-            "args are computed in the Manager itself.")
+            "args are computed in the Manager itself."
+        )
 
         import deep_ep
+
         buffer_kwargs = self._make_all2all_kwargs()
         logger.debug("DeepEP all2all args %s", buffer_kwargs)
         handle: deep_ep.Buffer = self.handle_cache.get_or_create(
-            buffer_kwargs, deep_ep.Buffer)
+            buffer_kwargs, deep_ep.Buffer
+        )
         return handle
 
     def set_num_sms(self, num_sms: int):
@@ -323,14 +339,17 @@ def _make_all2all_kwargs(
             num_max_dispatch_tokens_per_rank=max_num_tokens_per_dp_rank,
             hidden=token_hidden_size,
             num_ranks=num_ep_ranks,
-            num_experts=num_global_experts)
+            num_experts=num_global_experts,
+        )
 
         assert num_rdma_bytes is not None
-        return dict(group=self.cpu_group,
-                    num_nvl_bytes=num_nvl_bytes,
-                    num_rdma_bytes=num_rdma_bytes,
-                    low_latency_mode=True,
-                    num_qps_per_rank=num_qps_per_rank)
+        return dict(
+            group=self.cpu_group,
+            num_nvl_bytes=num_nvl_bytes,
+            num_rdma_bytes=num_rdma_bytes,
+            low_latency_mode=True,
+            num_qps_per_rank=num_qps_per_rank,
+        )
 
     def get_handle(self, kwargs):
         """
@@ -338,10 +357,12 @@ def get_handle(self, kwargs):
         _make_all2all_kwargs.
         """
         import deep_ep
+
         buffer_kwargs = self._make_all2all_kwargs(**kwargs)
         logger.debug("DeepEP all2all args %s", buffer_kwargs)
         handle: deep_ep.Buffer = self.handle_cache.get_or_create(
-            buffer_kwargs, deep_ep.Buffer)
+            buffer_kwargs, deep_ep.Buffer
+        )
         return handle
 
     # DeepEP LL uses RDMA so no SMs are used for communication
@@ -355,12 +376,15 @@ class FlashInferAllToAllManager(All2AllManagerBase):
     """
 
     def __init__(self, cpu_group):
-        assert has_flashinfer_all2all(
-        ), "flashinfer all2all module not found. Please install/check flashinfer"  # noqa
+        assert has_flashinfer_all2all(), (
+            "flashinfer all2all module not found. Please install/check flashinfer"
+        )  # noqa
         super().__init__(cpu_group)
         logger.debug(
-            "Initialize for flashinfer All2All "
-            "rank=%d, world size=%d", self.rank, self.world_size)
+            "Initialize for flashinfer All2All rank=%d, world size=%d",
+            self.rank,
+            self.world_size,
+        )
         self.initialized = False
         self.alltoall_info = None
 
@@ -375,8 +399,7 @@ def initialize(
             return
 
         self.cleanup()
-        logger.debug("making map: "
-                     "rank=%d, world size=%d", rank, world_size)
+        logger.debug("making map: rank=%d, world size=%d", rank, world_size)
         self.mapping = Mapping(
             world_size,
             rank,
@@ -385,25 +408,28 @@ def initialize(
         )
 
         from vllm.distributed.device_communicators.mnnvl_compat import (
-            CustomCommunicator)
+            CustomCommunicator,
+        )
+
         dp_config = MnnvlConfig(
             comm_backend=CustomCommunicator(get_dp_group().cpu_group),
             fabric_page_size=1 << 29,  # 512MB
-            allocation_granularity=0  # Auto-detect
+            allocation_granularity=0,  # Auto-detect
         )
 
-        self.workspace_tensor = MnnvlMoe.get_moe_workspaces(
-            self.mapping, dp_config)
+        self.workspace_tensor = MnnvlMoe.get_moe_workspaces(self.mapping, dp_config)
         self.prepare_workspace_tensor = MnnvlMoe.get_moe_prepare_workspace(
-            self.mapping, dp_config)
+            self.mapping, dp_config
+        )
 
         self.world_size = world_size
         self.rank = rank
         self.gpus_per_node = gpus_per_node
         self.initialized = True
 
-        logger.info("FlashInfer All2All initialized for rank %s, size %s",
-                    rank, world_size)
+        logger.info(
+            "FlashInfer All2All initialized for rank %s, size %s", rank, world_size
+        )
 
     def ensure_alltoall_workspace_initialized(self):
         """Ensure workspace is initialized"""
@@ -426,8 +452,11 @@ def get_handle(self, kwargs):
 
     def cleanup(self):
         """Clean up workspace"""
-        if self.initialized and self.workspace_tensor is not None \
-            and self.prepare_workspace_tensor is not None:
+        if (
+            self.initialized
+            and self.workspace_tensor is not None
+            and self.prepare_workspace_tensor is not None
+        ):
             try:
                 del self.workspace_tensor
                 del self.prepare_workspace_tensor
diff --git a/vllm/distributed/device_communicators/all_reduce_utils.py b/vllm/distributed/device_communicators/all_reduce_utils.py
index 87e0f8e1a967..dabb48320be4 100644
--- a/vllm/distributed/device_communicators/all_reduce_utils.py
+++ b/vllm/distributed/device_communicators/all_reduce_utils.py
@@ -19,8 +19,7 @@
 import vllm.envs as envs
 from vllm.distributed.device_communicators.cuda_wrapper import CudaRTLibrary
 from vllm.logger import init_logger
-from vllm.utils import (cuda_device_count_stateless,
-                        update_environment_variables)
+from vllm.utils import cuda_device_count_stateless, update_environment_variables
 
 logger = init_logger(__name__)
 
@@ -39,7 +38,7 @@
         4: 2 * MiB,  # 2 MB
         6: 1 * MiB,  # 1 MB
         8: 1 * MiB,  # 1 MB
-    }
+    },
 }
 
 SYMM_MEM_ALL_REDUCE_MAX_SIZES = {
@@ -54,7 +53,7 @@
         4: 32 * MiB,  # 32 MB
         6: 128 * MiB,  # 128 MB
         8: 128 * MiB,  # 128 MB
-    }
+    },
 }
 
 NCCL_SYMM_MEM_ALL_REDUCE_CONFIG: dict[str, Any] = {
@@ -63,14 +62,15 @@
         4: 2 * MiB,  # 2 MB
         8: 1 * MiB,  # 1 MB
     },
-    "always_use_above_world_size": 8  # Always use symm mem for world_size > 8
+    "always_use_above_world_size": 8,  # Always use symm mem for world_size > 8
 }
 
 
-def should_nccl_symm_mem_allreduce(world_size: int,
-                                   input_tensor: torch.Tensor) -> bool:
+def should_nccl_symm_mem_allreduce(world_size: int, input_tensor: torch.Tensor) -> bool:
     from vllm.distributed.device_communicators.pynccl_allocator import (
-        is_symmetric_memory_enabled)
+        is_symmetric_memory_enabled,
+    )
+
     if not is_symmetric_memory_enabled():
         return False
     if world_size < NCCL_SYMM_MEM_ALL_REDUCE_CONFIG["min_world_size"]:
@@ -78,18 +78,18 @@ def should_nccl_symm_mem_allreduce(world_size: int,
     threshold = NCCL_SYMM_MEM_ALL_REDUCE_CONFIG["thresholds"].get(world_size)
     if threshold is not None and input_tensor.nbytes >= threshold:
         return True
-    return (world_size
-            > NCCL_SYMM_MEM_ALL_REDUCE_CONFIG["always_use_above_world_size"])
+    return world_size > NCCL_SYMM_MEM_ALL_REDUCE_CONFIG["always_use_above_world_size"]
 
 
-def producer(batch_src: Sequence[int],
-             producer_queue,
-             consumer_queue,
-             result_queue,
-             cuda_visible_devices: Optional[str] = None):
+def producer(
+    batch_src: Sequence[int],
+    producer_queue,
+    consumer_queue,
+    result_queue,
+    cuda_visible_devices: Optional[str] = None,
+):
     if cuda_visible_devices is not None:
-        update_environment_variables(
-            {"CUDA_VISIBLE_DEVICES": cuda_visible_devices})
+        update_environment_variables({"CUDA_VISIBLE_DEVICES": cuda_visible_devices})
 
     lib = CudaRTLibrary()
     for i in batch_src:
@@ -115,14 +115,15 @@ def producer(batch_src: Sequence[int],
         lib.cudaDeviceReset()
 
 
-def consumer(batch_tgt: Sequence[int],
-             producer_queue,
-             consumer_queue,
-             result_queue,
-             cuda_visible_devices: Optional[str] = None):
+def consumer(
+    batch_tgt: Sequence[int],
+    producer_queue,
+    consumer_queue,
+    result_queue,
+    cuda_visible_devices: Optional[str] = None,
+):
     if cuda_visible_devices is not None:
-        update_environment_variables(
-            {"CUDA_VISIBLE_DEVICES": cuda_visible_devices})
+        update_environment_variables({"CUDA_VISIBLE_DEVICES": cuda_visible_devices})
 
     lib = CudaRTLibrary()
     for j in batch_tgt:
@@ -198,12 +199,26 @@ def can_actually_p2p(
     producer_queue = smp.Queue()
     consumer_queue = smp.Queue()
     result_queue = smp.Queue()
-    p_src = smp.Process(target=producer,
-                        args=(batch_src, producer_queue, consumer_queue,
-                              result_queue, cuda_visible_devices))
-    p_tgt = smp.Process(target=consumer,
-                        args=(batch_tgt, producer_queue, consumer_queue,
-                              result_queue, cuda_visible_devices))
+    p_src = smp.Process(
+        target=producer,
+        args=(
+            batch_src,
+            producer_queue,
+            consumer_queue,
+            result_queue,
+            cuda_visible_devices,
+        ),
+    )
+    p_tgt = smp.Process(
+        target=consumer,
+        args=(
+            batch_tgt,
+            producer_queue,
+            consumer_queue,
+            result_queue,
+            cuda_visible_devices,
+        ),
+    )
     p_src.start()
     p_tgt.start()
     p_src.join()
@@ -216,7 +231,10 @@ def can_actually_p2p(
         if a != b:
             logger.warning(
                 "Two processes do not agree on the P2P access"
-                " status on %d -> %d, treat as disabled.", src, tgt)
+                " status on %d -> %d, treat as disabled.",
+                src,
+                tgt,
+            )
             result.append(False)
         else:
             result.append(a)
@@ -255,12 +273,14 @@ def gpu_p2p_access_check(src: int, tgt: int) -> bool:
         cuda_visible_devices = ",".join(str(i) for i in range(num_dev))
 
     path = os.path.join(
-        envs.VLLM_CACHE_ROOT,
-        f"gpu_p2p_access_cache_for_{cuda_visible_devices}.json")
+        envs.VLLM_CACHE_ROOT, f"gpu_p2p_access_cache_for_{cuda_visible_devices}.json"
+    )
     os.makedirs(os.path.dirname(path), exist_ok=True)
     from vllm.distributed.parallel_state import get_world_group
-    if ((not is_distributed or get_world_group().local_rank == 0)
-            and (not os.path.exists(path))):
+
+    if (not is_distributed or get_world_group().local_rank == 0) and (
+        not os.path.exists(path)
+    ):
         # only the local master process (with local_rank == 0) can
         #  enter this block to calculate the cache
         logger.info("generating GPU P2P access cache in %s", path)
@@ -279,11 +299,10 @@ def gpu_p2p_access_check(src: int, tgt: int) -> bool:
         # we don't use the output of the subprocess directly,
         # because the subprocess might produce logging output
         with tempfile.NamedTemporaryFile() as output_file:
-            input_bytes = pickle.dumps(
-                (batch_src, batch_tgt, output_file.name))
-            returned = subprocess.run([sys.executable, __file__],
-                                      input=input_bytes,
-                                      capture_output=True)
+            input_bytes = pickle.dumps((batch_src, batch_tgt, output_file.name))
+            returned = subprocess.run(
+                [sys.executable, __file__], input=input_bytes, capture_output=True
+            )
             # check if the subprocess is successful
             try:
                 returned.check_returncode()
@@ -292,7 +311,8 @@ def gpu_p2p_access_check(src: int, tgt: int) -> bool:
                 raise RuntimeError(
                     f"Error happened when batch testing "
                     f"peer-to-peer access from {batch_src} to {batch_tgt}:\n"
-                    f"{returned.stderr.decode()}") from e
+                    f"{returned.stderr.decode()}"
+                ) from e
             with open(output_file.name, "rb") as f:
                 result = pickle.load(f)
         for _i, _j, r in zip(batch_src, batch_tgt, result):
diff --git a/vllm/distributed/device_communicators/base_device_communicator.py b/vllm/distributed/device_communicators/base_device_communicator.py
index a42081fb0c15..c32be0bec55c 100644
--- a/vllm/distributed/device_communicators/base_device_communicator.py
+++ b/vllm/distributed/device_communicators/base_device_communicator.py
@@ -10,7 +10,6 @@
 
 
 class Cache:
-
     def __init__(self):
         self._cache: WeakValueDictionary = WeakValueDictionary()
         self._lock = threading.RLock()  # Reentrant lock for thread safety
@@ -35,9 +34,11 @@ def __init__(self, cpu_group):
         self.cpu_group = cpu_group
 
         # compute some common properties
-        from vllm.distributed.parallel_state import (get_dp_group,
-                                                     get_tp_group,
-                                                     in_the_same_node_as)
+        from vllm.distributed.parallel_state import (
+            get_dp_group,
+            get_tp_group,
+            in_the_same_node_as,
+        )
 
         # all2all lives in ep group, which is merged from dp and tp group
         self.dp_group = get_dp_group()
@@ -63,10 +64,12 @@ def get_handle(self, kwargs):
         # and reuse it for the same config.
         raise NotImplementedError
 
-    def dispatch(self,
-                 hidden_states: torch.Tensor,
-                 router_logits: torch.Tensor,
-                 is_sequence_parallel: bool = False):
+    def dispatch(
+        self,
+        hidden_states: torch.Tensor,
+        router_logits: torch.Tensor,
+        is_sequence_parallel: bool = False,
+    ):
         raise NotImplementedError
 
     def set_num_sms(self, num_sms: int):
@@ -75,9 +78,7 @@ def set_num_sms(self, num_sms: int):
     def max_sms_used(self) -> Optional[int]:
         return None  # None means it could use the whole GPU
 
-    def combine(self,
-                hidden_states: torch.Tensor,
-                is_sequence_parallel: bool = False):
+    def combine(self, hidden_states: torch.Tensor, is_sequence_parallel: bool = False):
         raise NotImplementedError
 
     def destroy(self):
@@ -92,11 +93,13 @@ class DeviceCommunicatorBase:
     communication backend), the `device_group` will also be given.
     """
 
-    def __init__(self,
-                 cpu_group: ProcessGroup,
-                 device: Optional[torch.device] = None,
-                 device_group: Optional[ProcessGroup] = None,
-                 unique_name: str = ""):
+    def __init__(
+        self,
+        cpu_group: ProcessGroup,
+        device: Optional[torch.device] = None,
+        device_group: Optional[ProcessGroup] = None,
+        unique_name: str = "",
+    ):
         self.device = device or torch.device("cpu")
         self.cpu_group = cpu_group
         self.device_group = device_group
@@ -106,11 +109,11 @@ def __init__(self,
         self.ranks = dist.get_process_group_ranks(cpu_group)
         self.global_rank = dist.get_rank()
         self.global_world_size = dist.get_world_size()
-        self.rank_in_group = dist.get_group_rank(self.cpu_group,
-                                                 self.global_rank)
+        self.rank_in_group = dist.get_group_rank(self.cpu_group, self.global_rank)
 
         use_ep = False
         from vllm.config import get_current_vllm_config
+
         config = get_current_vllm_config()
         if config is not None:
             # as long as we use data parallel (coupled data parallel
@@ -134,41 +137,39 @@ def all_gather(self, input_: torch.Tensor, dim: int = -1) -> torch.Tensor:
         # NOTE: we have to use concat-style all-gather here,
         # stack-style all-gather has compatibility issues with
         # torch.compile . see https://github.com/pytorch/pytorch/issues/138795
-        output_size = (input_size[0] * self.world_size, ) + input_size[1:]
+        output_size = (input_size[0] * self.world_size,) + input_size[1:]
         # Allocate output tensor.
-        output_tensor = torch.empty(output_size,
-                                    dtype=input_.dtype,
-                                    device=input_.device)
+        output_tensor = torch.empty(
+            output_size, dtype=input_.dtype, device=input_.device
+        )
         # All-gather.
-        dist.all_gather_into_tensor(output_tensor,
-                                    input_,
-                                    group=self.device_group)
+        dist.all_gather_into_tensor(output_tensor, input_, group=self.device_group)
         # Reshape
-        output_tensor = output_tensor.reshape((self.world_size, ) + input_size)
+        output_tensor = output_tensor.reshape((self.world_size,) + input_size)
         output_tensor = output_tensor.movedim(0, dim)
-        output_tensor = output_tensor.reshape(input_size[:dim] +
-                                              (self.world_size *
-                                               input_size[dim], ) +
-                                              input_size[dim + 1:])
+        output_tensor = output_tensor.reshape(
+            input_size[:dim]
+            + (self.world_size * input_size[dim],)
+            + input_size[dim + 1 :]
+        )
         return output_tensor
 
     def all_gatherv(
         self,
         input_: Union[torch.Tensor, list[torch.Tensor]],
         dim: int = 0,
-        sizes: Optional[list[int]] = None
+        sizes: Optional[list[int]] = None,
     ) -> Union[torch.Tensor, list[torch.Tensor]]:
         raise NotImplementedError
 
-    def reduce_scatter(self,
-                       input_: torch.Tensor,
-                       dim: int = -1) -> torch.Tensor:
+    def reduce_scatter(self, input_: torch.Tensor, dim: int = -1) -> torch.Tensor:
         world_size = self.world_size
         # Bypass the function if we are using only 1 GPU.
         if world_size == 1:
             return input_
         assert -input_.dim() <= dim < input_.dim(), (
-            f"Invalid dim ({dim}) for input tensor with shape {input_.size()}")
+            f"Invalid dim ({dim}) for input tensor with shape {input_.size()}"
+        )
 
         if dim < 0:
             # Convert negative dim to positive.
@@ -180,30 +181,28 @@ def reduce_scatter(self,
 
         assert input_tensor.shape[0] % world_size == 0
         chunk_size = input_tensor.shape[0] // world_size
-        output_shape = (chunk_size, ) + input_tensor.shape[1:]
+        output_shape = (chunk_size,) + input_tensor.shape[1:]
 
-        output_tensor = torch.empty(output_shape,
-                                    dtype=input_tensor.dtype,
-                                    device=input_tensor.device)
+        output_tensor = torch.empty(
+            output_shape, dtype=input_tensor.dtype, device=input_tensor.device
+        )
 
         # Perform reduce-scatter operation
-        torch.distributed.reduce_scatter_tensor(output_tensor,
-                                                input_tensor,
-                                                group=self.device_group)
+        torch.distributed.reduce_scatter_tensor(
+            output_tensor, input_tensor, group=self.device_group
+        )
 
         # Reshape before returning
         return output_tensor.movedim(0, dim).contiguous()
 
-    def reduce_scatterv(self,
-                        input_: torch.Tensor,
-                        dim: int = -1,
-                        sizes: Optional[list[int]] = None) -> torch.Tensor:
+    def reduce_scatterv(
+        self, input_: torch.Tensor, dim: int = -1, sizes: Optional[list[int]] = None
+    ) -> torch.Tensor:
         raise NotImplementedError
 
-    def gather(self,
-               input_: torch.Tensor,
-               dst: int = 0,
-               dim: int = -1) -> Optional[torch.Tensor]:
+    def gather(
+        self, input_: torch.Tensor, dst: int = 0, dim: int = -1
+    ) -> Optional[torch.Tensor]:
         """
         NOTE: We assume that the input tensor is on the same device across
         all the ranks.
@@ -211,7 +210,8 @@ def gather(self,
         """
         world_size = self.world_size
         assert -input_.dim() <= dim < input_.dim(), (
-            f"Invalid dim ({dim}) for input tensor with shape {input_.size()}")
+            f"Invalid dim ({dim}) for input tensor with shape {input_.size()}"
+        )
         if dim < 0:
             # Convert negative dim to positive.
             dim += input_.dim()
@@ -222,10 +222,9 @@ def gather(self,
         else:
             gather_list = None
         # Gather.
-        torch.distributed.gather(input_,
-                                 gather_list,
-                                 dst=self.ranks[dst],
-                                 group=self.device_group)
+        torch.distributed.gather(
+            input_, gather_list, dst=self.ranks[dst], group=self.device_group
+        )
         if self.rank_in_group == dst:
             output_tensor = torch.cat(gather_list, dim=dim)
         else:
@@ -239,10 +238,9 @@ def send(self, tensor: torch.Tensor, dst: Optional[int] = None) -> None:
             dst = (self.rank_in_group + 1) % self.world_size
         torch.distributed.send(tensor, self.ranks[dst], self.device_group)
 
-    def recv(self,
-             size: torch.Size,
-             dtype: torch.dtype,
-             src: Optional[int] = None) -> torch.Tensor:
+    def recv(
+        self, size: torch.Size, dtype: torch.dtype, src: Optional[int] = None
+    ) -> torch.Tensor:
         """Receives a tensor from the source rank."""
         """NOTE: `src` is the local rank of the source rank."""
         if src is None:
@@ -255,8 +253,7 @@ def recv(self,
     def destroy(self):
         pass
 
-    def prepare_communication_buffer_for_model(self,
-                                               model: torch.nn.Module) -> None:
+    def prepare_communication_buffer_for_model(self, model: torch.nn.Module) -> None:
         """
         Prepare the communication buffer for the model.
         """
@@ -264,11 +261,14 @@ def prepare_communication_buffer_for_model(self,
             return
 
         moe_modules = [
-            module for module in model.modules()
+            module
+            for module in model.modules()
             # TODO(bnell): Should use isinstance but can't.  Maybe search for
             # presence of quant_method.init_prepare_finalize?
-            if (module.__class__.__name__ == "FusedMoE"
-                or module.__class__.__name__ == "SharedFusedMoE")
+            if (
+                module.__class__.__name__ == "FusedMoE"
+                or module.__class__.__name__ == "SharedFusedMoE"
+            )
         ]
         for module in moe_modules:
             module.quant_method.init_prepare_finalize(module)
@@ -277,7 +277,7 @@ def dispatch(
         self,
         hidden_states: torch.Tensor,
         router_logits: torch.Tensor,
-        is_sequence_parallel: bool = False
+        is_sequence_parallel: bool = False,
     ) -> tuple[torch.Tensor, torch.Tensor]:
         """
         Dispatch the hidden states and router logits to the appropriate device.
@@ -285,9 +285,9 @@ def dispatch(
         """
         return hidden_states, router_logits
 
-    def combine(self,
-                hidden_states: torch.Tensor,
-                is_sequence_parallel: bool = False) -> torch.Tensor:
+    def combine(
+        self, hidden_states: torch.Tensor, is_sequence_parallel: bool = False
+    ) -> torch.Tensor:
         """
         Combine the hidden states and router logits from the appropriate device.
         This is a no-op in the base class.
diff --git a/vllm/distributed/device_communicators/cpu_communicator.py b/vllm/distributed/device_communicators/cpu_communicator.py
index bda567f8489c..c09b3ba9ceba 100644
--- a/vllm/distributed/device_communicators/cpu_communicator.py
+++ b/vllm/distributed/device_communicators/cpu_communicator.py
@@ -15,30 +15,30 @@
 
 
 class CpuCommunicator(DeviceCommunicatorBase):
-
-    def __init__(self,
-                 cpu_group: ProcessGroup,
-                 device: Optional[torch.device] = None,
-                 device_group: Optional[ProcessGroup] = None,
-                 unique_name: str = ""):
+    def __init__(
+        self,
+        cpu_group: ProcessGroup,
+        device: Optional[torch.device] = None,
+        device_group: Optional[ProcessGroup] = None,
+        unique_name: str = "",
+    ):
         super().__init__(cpu_group, device, device_group, unique_name)
         self.dist_module = torch.distributed
 
-        if (current_platform.get_cpu_architecture()
-                == CpuArchEnum.X86) and hasattr(
-                    torch.ops._C,
-                    "init_shm_manager") and (unique_name.startswith("tp")
-                                             or unique_name.startswith("pp")):
+        if (
+            (current_platform.get_cpu_architecture() == CpuArchEnum.X86)
+            and hasattr(torch.ops._C, "init_shm_manager")
+            and (unique_name.startswith("tp") or unique_name.startswith("pp"))
+        ):
             self.dist_module = _CPUSHMDistributed(self)
 
     def all_reduce(self, input_):
         self.dist_module.all_reduce(input_, group=self.device_group)
         return input_
 
-    def gather(self,
-               input_: torch.Tensor,
-               dst: int = 0,
-               dim: int = -1) -> Optional[torch.Tensor]:
+    def gather(
+        self, input_: torch.Tensor, dst: int = 0, dim: int = -1
+    ) -> Optional[torch.Tensor]:
         """
         NOTE: We assume that the input tensor is on the same device across
         all the ranks.
@@ -46,7 +46,8 @@ def gather(self,
         """
         world_size = self.world_size
         assert -input_.dim() <= dim < input_.dim(), (
-            f"Invalid dim ({dim}) for input tensor with shape {input_.size()}")
+            f"Invalid dim ({dim}) for input tensor with shape {input_.size()}"
+        )
         if dim < 0:
             # Convert negative dim to positive.
             dim += input_.dim()
@@ -58,10 +59,9 @@ def gather(self,
             gather_list = None
 
         # Gather.
-        self.dist_module.gather(input_,
-                                gather_list,
-                                dst=self.ranks[dst],
-                                group=self.device_group)
+        self.dist_module.gather(
+            input_, gather_list, dst=self.ranks[dst], group=self.device_group
+        )
 
         if self.rank_in_group == dst:
             output_tensor = torch.cat(gather_list, dim=dim)
@@ -77,23 +77,24 @@ def all_gather(self, input_: torch.Tensor, dim: int = -1) -> torch.Tensor:
         # NOTE: we have to use concat-style all-gather here,
         # stack-style all-gather has compatibility issues with
         # torch.compile . see https://github.com/pytorch/pytorch/issues/138795
-        output_size = (input_size[0] * self.world_size, ) + input_size[1:]
+        output_size = (input_size[0] * self.world_size,) + input_size[1:]
         # Allocate output tensor.
-        output_tensor = torch.empty(output_size,
-                                    dtype=input_.dtype,
-                                    device=input_.device)
+        output_tensor = torch.empty(
+            output_size, dtype=input_.dtype, device=input_.device
+        )
         # All-gather.
-        self.dist_module.all_gather_into_tensor(output_tensor,
-                                                input_,
-                                                group=self.device_group)
+        self.dist_module.all_gather_into_tensor(
+            output_tensor, input_, group=self.device_group
+        )
 
         # Reshape
-        output_tensor = output_tensor.reshape((self.world_size, ) + input_size)
+        output_tensor = output_tensor.reshape((self.world_size,) + input_size)
         output_tensor = output_tensor.movedim(0, dim)
-        output_tensor = output_tensor.reshape(input_size[:dim] +
-                                              (self.world_size *
-                                               input_size[dim], ) +
-                                              input_size[dim + 1:])
+        output_tensor = output_tensor.reshape(
+            input_size[:dim]
+            + (self.world_size * input_size[dim],)
+            + input_size[dim + 1 :]
+        )
         return output_tensor
 
     def send_tensor_dict(
@@ -111,7 +112,6 @@ def recv_tensor_dict(
 
 
 class _CPUSHMDistributed:
-
     def __init__(self, communicator: CpuCommunicator):
         instance_identifier = os.environ["VLLM_DIST_IDENT"]
         unique_name = communicator.unique_name
@@ -139,24 +139,32 @@ def _init_cpu_shm(self) -> int:
 
         return handle
 
-    def all_reduce(self,
-                   input: torch.Tensor,
-                   group: Optional[ProcessGroup] = None) -> None:
+    def all_reduce(
+        self, input: torch.Tensor, group: Optional[ProcessGroup] = None
+    ) -> None:
         torch.ops._C.shm_allreduce(self.handle, input)
 
-    def gather(self,
-               input: torch.Tensor,
-               gather_list: Optional[list[torch.Tensor]],
-               dst: int = -1,
-               group: Optional[ProcessGroup] = None) -> None:
+    def gather(
+        self,
+        input: torch.Tensor,
+        gather_list: Optional[list[torch.Tensor]],
+        dst: int = -1,
+        group: Optional[ProcessGroup] = None,
+    ) -> None:
         # Note: different from the torch gather, here we use local dst rank.
-        torch.ops._C.shm_gather(self.handle, input, gather_list,
-                                torch.distributed.get_group_rank(group, dst))
+        torch.ops._C.shm_gather(
+            self.handle,
+            input,
+            gather_list,
+            torch.distributed.get_group_rank(group, dst),
+        )
 
-    def all_gather_into_tensor(self,
-                               output: torch.Tensor,
-                               input: torch.Tensor,
-                               group: Optional[ProcessGroup] = None) -> None:
+    def all_gather_into_tensor(
+        self,
+        output: torch.Tensor,
+        input: torch.Tensor,
+        group: Optional[ProcessGroup] = None,
+    ) -> None:
         torch.ops._C.shm_all_gather(self.handle, input, output)
 
     def send_tensor_dict(
@@ -169,11 +177,11 @@ def send_tensor_dict(
         size_list = []
         for v in value_list:
             if not isinstance(v, torch.Tensor):
-                raise RuntimeError(
-                    "CpuCommunicator only supports sending tensors.")
+                raise RuntimeError("CpuCommunicator only supports sending tensors.")
             size_list.append(v.size())
-        key_size_tensor = torch.frombuffer(pickle.dumps([key_list, size_list]),
-                                           dtype=torch.uint8)
+        key_size_tensor = torch.frombuffer(
+            pickle.dumps([key_list, size_list]), dtype=torch.uint8
+        )
         value_list.append(key_size_tensor)
 
         torch.ops._C.shm_send_tensor_list(self.handle, value_list, dst)
diff --git a/vllm/distributed/device_communicators/cuda_communicator.py b/vllm/distributed/device_communicators/cuda_communicator.py
index 9c2bf51a813e..45096dffb5b6 100644
--- a/vllm/distributed/device_communicators/cuda_communicator.py
+++ b/vllm/distributed/device_communicators/cuda_communicator.py
@@ -8,11 +8,12 @@
 
 import vllm.envs as envs
 from vllm.distributed.device_communicators.all_reduce_utils import (
-    should_nccl_symm_mem_allreduce)
-from vllm.distributed.device_communicators.pynccl import (
-    register_nccl_symmetric_ops)
+    should_nccl_symm_mem_allreduce,
+)
+from vllm.distributed.device_communicators.pynccl import register_nccl_symmetric_ops
 from vllm.distributed.device_communicators.pynccl_allocator import (
-    is_symmetric_memory_enabled)
+    is_symmetric_memory_enabled,
+)
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 
@@ -22,20 +23,21 @@
 
 
 class CudaCommunicator(DeviceCommunicatorBase):
-
-    def __init__(self,
-                 cpu_group: ProcessGroup,
-                 device: Optional[torch.device] = None,
-                 device_group: Optional[ProcessGroup] = None,
-                 unique_name: str = ""):
+    def __init__(
+        self,
+        cpu_group: ProcessGroup,
+        device: Optional[torch.device] = None,
+        device_group: Optional[ProcessGroup] = None,
+        unique_name: str = "",
+    ):
         super().__init__(cpu_group, device, device_group, unique_name)
         if "tp" not in unique_name:
             # custom allreduce or torch symm mem can be used only by tp
             use_custom_allreduce = False
             use_torch_symm_mem = False
         else:
-            from vllm.distributed.parallel_state import (
-                _ENABLE_CUSTOM_ALL_REDUCE)
+            from vllm.distributed.parallel_state import _ENABLE_CUSTOM_ALL_REDUCE
+
             use_custom_allreduce = _ENABLE_CUSTOM_ALL_REDUCE
             use_torch_symm_mem = envs.VLLM_ALLREDUCE_USE_SYMM_MEM
 
@@ -44,13 +46,13 @@ def __init__(self,
 
         # lazy import to avoid documentation build error
         from vllm.distributed.device_communicators.custom_all_reduce import (
-            CustomAllreduce)
-        from vllm.distributed.device_communicators.pynccl import (
-            PyNcclCommunicator)
+            CustomAllreduce,
+        )
+        from vllm.distributed.device_communicators.pynccl import PyNcclCommunicator
         from vllm.distributed.device_communicators.quick_all_reduce import (
-            QuickAllReduce)
-        from vllm.distributed.device_communicators.symm_mem import (
-            SymmMemCommunicator)
+            QuickAllReduce,
+        )
+        from vllm.distributed.device_communicators.symm_mem import SymmMemCommunicator
 
         self.pynccl_comm: Optional[PyNcclCommunicator] = None
         if self.world_size > 1:
@@ -75,8 +77,9 @@ def __init__(self,
             self.ca_comm = CustomAllreduce(
                 group=self.cpu_group,
                 device=self.device,
-                symm_mem_enabled=(self.symm_mem_comm is not None
-                                  and not self.symm_mem_comm.disabled),
+                symm_mem_enabled=(
+                    self.symm_mem_comm is not None and not self.symm_mem_comm.disabled
+                ),
             )
 
             if current_platform.is_rocm():
@@ -85,35 +88,39 @@ def __init__(self,
                 # Based on quickreduce (https://github.com/mk1-project/quickreduce).
                 # If it's a rocm, 'use_custom_allreduce==True' means it must
                 # currently be an MI300 series.
-                self.qr_comm = QuickAllReduce(group=self.cpu_group,
-                                              device=self.device)
+                self.qr_comm = QuickAllReduce(group=self.cpu_group, device=self.device)
 
         if self.use_all2all:
             all2all_backend = envs.VLLM_ALL2ALL_BACKEND
             if all2all_backend == "naive":
                 from .all2all import NaiveAll2AllManager
+
                 self.all2all_manager = NaiveAll2AllManager(self.cpu_group)
                 logger.info("Using naive all2all manager.")
             elif all2all_backend == "allgather_reducescatter":
                 from .all2all import AgRsAll2AllManager
+
                 self.all2all_manager = AgRsAll2AllManager(self.cpu_group)
                 logger.info("Using AllGather-ReduceScatter all2all manager.")
             elif all2all_backend == "pplx":
                 from .all2all import PPLXAll2AllManager
+
                 self.all2all_manager = PPLXAll2AllManager(self.cpu_group)
                 logger.info("Using PPLX all2all manager.")
             elif all2all_backend == "deepep_high_throughput":
                 from .all2all import DeepEPHTAll2AllManager
+
                 self.all2all_manager = DeepEPHTAll2AllManager(self.cpu_group)
                 logger.info("Using DeepEP High-Throughput all2all manager.")
             elif all2all_backend == "deepep_low_latency":
                 from .all2all import DeepEPLLAll2AllManager
+
                 self.all2all_manager = DeepEPLLAll2AllManager(self.cpu_group)
                 logger.info("Using DeepEP Low-Latency all2all manager.")
             elif all2all_backend == "flashinfer_all2allv":
                 from .all2all import FlashInferAllToAllManager
-                self.all2all_manager = FlashInferAllToAllManager(
-                    self.cpu_group)
+
+                self.all2all_manager = FlashInferAllToAllManager(self.cpu_group)
                 logger.info("Using Flashinfer all2allv manager.")
             else:
                 raise ValueError(f"Unknown all2all backend: {all2all_backend}")
@@ -121,28 +128,34 @@ def __init__(self,
     def all_reduce(self, input_):
         # since currently we perform copy input -> symm_input -> out-of-place AR
         # return symm_output, we don't need to check if input is symmetric
-        if self.pynccl_comm is not None and \
-            should_nccl_symm_mem_allreduce(self.pynccl_comm.world_size,input_):
+        if self.pynccl_comm is not None and should_nccl_symm_mem_allreduce(
+            self.pynccl_comm.world_size, input_
+        ):
             out = torch.ops.vllm.all_reduce_symmetric_with_copy(input_)
             if out is not None:
                 return out
         # always try quick reduce first, then custom allreduce,
         # and then pynccl. (quick reduce just for ROCM MI3*)
         qr_comm = self.qr_comm
-        if qr_comm is not None and not qr_comm.disabled and \
-            qr_comm.should_quick_allreduce(input_):
+        if (
+            qr_comm is not None
+            and not qr_comm.disabled
+            and qr_comm.should_quick_allreduce(input_)
+        ):
             out = qr_comm.quick_all_reduce(input_)
             assert out is not None
             return out
         ca_comm = self.ca_comm
-        if ca_comm is not None and not ca_comm.disabled and \
-            ca_comm.should_custom_ar(input_):
+        if (
+            ca_comm is not None
+            and not ca_comm.disabled
+            and ca_comm.should_custom_ar(input_)
+        ):
             out = ca_comm.custom_all_reduce(input_)
             assert out is not None
             return out
         symm_mem_comm = self.symm_mem_comm
-        if symm_mem_comm is not None and \
-            symm_mem_comm.should_use_symm_mem(input_):
+        if symm_mem_comm is not None and symm_mem_comm.should_use_symm_mem(input_):
             out = symm_mem_comm.all_reduce(input_)
             assert out is not None
             return out
@@ -176,21 +189,20 @@ def reduce_scatter(self, input_: torch.Tensor, dim: int = -1):
 
         assert input_tensor.shape[0] % world_size == 0
         chunk_size = input_tensor.shape[0] // world_size
-        output_shape = (chunk_size, ) + input_tensor.shape[1:]
+        output_shape = (chunk_size,) + input_tensor.shape[1:]
 
-        output = torch.empty(output_shape,
-                             dtype=input_tensor.dtype,
-                             device=input_tensor.device)
+        output = torch.empty(
+            output_shape, dtype=input_tensor.dtype, device=input_tensor.device
+        )
 
         pynccl_comm.reduce_scatter(output, input_tensor)
 
         # Reshape before returning
         return output.movedim(0, dim).contiguous()
 
-    def reduce_scatterv(self,
-                        input_: torch.Tensor,
-                        dim: int = -1,
-                        sizes: Optional[list[int]] = None):
+    def reduce_scatterv(
+        self, input_: torch.Tensor, dim: int = -1, sizes: Optional[list[int]] = None
+    ):
         world_size = self.world_size
         pynccl_comm = self.pynccl_comm
         assert pynccl_comm is not None
@@ -209,11 +221,11 @@ def reduce_scatterv(self,
         else:
             assert input_tensor.shape[0] % world_size == 0
             chunk_size = input_tensor.shape[0] // world_size
-        output_shape = (chunk_size, ) + input_tensor.shape[1:]
+        output_shape = (chunk_size,) + input_tensor.shape[1:]
 
-        output = torch.empty(output_shape,
-                             dtype=input_tensor.dtype,
-                             device=input_tensor.device)
+        output = torch.empty(
+            output_shape, dtype=input_tensor.dtype, device=input_tensor.device
+        )
 
         if sizes is not None:
             pynccl_comm.reduce_scatterv(output, input_tensor, sizes=sizes)
@@ -235,10 +247,9 @@ def send(self, tensor: torch.Tensor, dst: Optional[int] = None) -> None:
         else:
             torch.distributed.send(tensor, self.ranks[dst], self.device_group)
 
-    def recv(self,
-             size: torch.Size,
-             dtype: torch.dtype,
-             src: Optional[int] = None) -> torch.Tensor:
+    def recv(
+        self, size: torch.Size, dtype: torch.dtype, src: Optional[int] = None
+    ) -> torch.Tensor:
         """Receives a tensor from the source rank."""
         """NOTE: `src` is the local rank of the source rank."""
         if src is None:
@@ -261,10 +272,12 @@ def destroy(self):
             self.all2all_manager.destroy()
             self.all2all_manager = None
 
-    def all_gatherv(self,
-                    input_: Union[torch.Tensor, list[torch.Tensor]],
-                    dim: int = 0,
-                    sizes: Optional[list[int]] = None):
+    def all_gatherv(
+        self,
+        input_: Union[torch.Tensor, list[torch.Tensor]],
+        dim: int = 0,
+        sizes: Optional[list[int]] = None,
+    ):
         if dim != 0:
             raise NotImplementedError("only dim 0 all-gatherv is supported")
         world_size = self.world_size
@@ -276,20 +289,20 @@ def all_gatherv(self,
         if sizes is not None and all(s == sizes[0] for s in sizes):
             sizes = None
 
-        def _all_gather_single(input_: torch.Tensor,
-                               sizes: Optional[list[int]] = None):
+        def _all_gather_single(input_: torch.Tensor, sizes: Optional[list[int]] = None):
             input_size = input_.size()
             if sizes is not None:
                 assert len(sizes) == world_size
                 assert input_.shape[dim] == sizes[self.rank_in_group], (
-                    f"{input_.shape[dim]} != {sizes[self.rank_in_group]}")
-                output_size = (sum(sizes), ) + input_size[1:]
+                    f"{input_.shape[dim]} != {sizes[self.rank_in_group]}"
+                )
+                output_size = (sum(sizes),) + input_size[1:]
             else:
-                output_size = (input_size[0] * world_size, ) + input_size[1:]
+                output_size = (input_size[0] * world_size,) + input_size[1:]
             # Allocate output tensor.
-            output_tensor = torch.empty(output_size,
-                                        dtype=input_.dtype,
-                                        device=input_.device)
+            output_tensor = torch.empty(
+                output_size, dtype=input_.dtype, device=input_.device
+            )
             if sizes is not None:
                 pynccl_comm.all_gatherv(output_tensor, input_, sizes=sizes)
             else:
@@ -311,17 +324,19 @@ def dispatch(
         self,
         hidden_states: torch.Tensor,
         router_logits: torch.Tensor,
-        is_sequence_parallel: bool = False
+        is_sequence_parallel: bool = False,
     ) -> tuple[torch.Tensor, torch.Tensor]:
         assert self.all2all_manager is not None
         hidden_states, router_logits = self.all2all_manager.dispatch(
-            hidden_states, router_logits, is_sequence_parallel)
+            hidden_states, router_logits, is_sequence_parallel
+        )
         return hidden_states, router_logits
 
-    def combine(self,
-                hidden_states: torch.Tensor,
-                is_sequence_parallel: bool = False) -> torch.Tensor:
+    def combine(
+        self, hidden_states: torch.Tensor, is_sequence_parallel: bool = False
+    ) -> torch.Tensor:
         assert self.all2all_manager is not None
-        hidden_states = self.all2all_manager.combine(hidden_states,
-                                                     is_sequence_parallel)
+        hidden_states = self.all2all_manager.combine(
+            hidden_states, is_sequence_parallel
+        )
         return hidden_states
diff --git a/vllm/distributed/device_communicators/cuda_wrapper.py b/vllm/distributed/device_communicators/cuda_wrapper.py
index 2c38e8ed21d7..a77d2666e2ce 100644
--- a/vllm/distributed/device_communicators/cuda_wrapper.py
+++ b/vllm/distributed/device_communicators/cuda_wrapper.py
@@ -42,7 +42,7 @@ def find_loaded_library(lib_name) -> Optional[str]:
     the file `/proc/self/maps` contains the memory maps of the process, which includes the
     shared libraries loaded by the process. We can use this file to find the path of the
     a loaded library.
-    """ # noqa
+    """  # noqa
     found = False
     with open("/proc/self/maps") as f:
         for line in f:
@@ -57,8 +57,9 @@ def find_loaded_library(lib_name) -> Optional[str]:
     start = line.index("/")
     path = line[start:].strip()
     filename = path.split("/")[-1]
-    assert filename.rpartition(".so")[0].startswith(lib_name), \
+    assert filename.rpartition(".so")[0].startswith(lib_name), (
         f"Unexpected filename: {filename} for library {lib_name}"
+    )
     return path
 
 
@@ -70,30 +71,38 @@ class CudaRTLibrary:
         Function("cudaDeviceSynchronize", cudaError_t, []),
         # ​cudaError_t cudaDeviceReset ( void )
         Function("cudaDeviceReset", cudaError_t, []),
-
         # const char* 	cudaGetErrorString ( cudaError_t error )
         Function("cudaGetErrorString", ctypes.c_char_p, [cudaError_t]),
-
         # ​cudaError_t 	cudaMalloc ( void** devPtr, size_t size )
-        Function("cudaMalloc", cudaError_t,
-                 [ctypes.POINTER(ctypes.c_void_p), ctypes.c_size_t]),
+        Function(
+            "cudaMalloc",
+            cudaError_t,
+            [ctypes.POINTER(ctypes.c_void_p), ctypes.c_size_t],
+        ),
         # ​cudaError_t 	cudaFree ( void* devPtr )
         Function("cudaFree", cudaError_t, [ctypes.c_void_p]),
         # ​cudaError_t cudaMemset ( void* devPtr, int  value, size_t count )
-        Function("cudaMemset", cudaError_t,
-                 [ctypes.c_void_p, ctypes.c_int, ctypes.c_size_t]),
+        Function(
+            "cudaMemset", cudaError_t, [ctypes.c_void_p, ctypes.c_int, ctypes.c_size_t]
+        ),
         # ​cudaError_t cudaMemcpy ( void* dst, const void* src, size_t count, cudaMemcpyKind kind ) # noqa
-        Function("cudaMemcpy", cudaError_t, [
-            ctypes.c_void_p, ctypes.c_void_p, ctypes.c_size_t, cudaMemcpyKind
-        ]),
-
+        Function(
+            "cudaMemcpy",
+            cudaError_t,
+            [ctypes.c_void_p, ctypes.c_void_p, ctypes.c_size_t, cudaMemcpyKind],
+        ),
         # cudaError_t cudaIpcGetMemHandle ( cudaIpcMemHandle_t* handle, void* devPtr ) # noqa
-        Function("cudaIpcGetMemHandle", cudaError_t,
-                 [ctypes.POINTER(cudaIpcMemHandle_t), ctypes.c_void_p]),
+        Function(
+            "cudaIpcGetMemHandle",
+            cudaError_t,
+            [ctypes.POINTER(cudaIpcMemHandle_t), ctypes.c_void_p],
+        ),
         # ​cudaError_t cudaIpcOpenMemHandle ( void** devPtr, cudaIpcMemHandle_t handle, unsigned int  flags ) # noqa
-        Function("cudaIpcOpenMemHandle", cudaError_t, [
-            ctypes.POINTER(ctypes.c_void_p), cudaIpcMemHandle_t, ctypes.c_uint
-        ]),
+        Function(
+            "cudaIpcOpenMemHandle",
+            cudaError_t,
+            [ctypes.POINTER(ctypes.c_void_p), cudaIpcMemHandle_t, ctypes.c_uint],
+        ),
     ]
 
     # class attribute to store the mapping from the path to the library
@@ -109,11 +118,10 @@ def __init__(self, so_file: Optional[str] = None):
             so_file = find_loaded_library("libcudart")
             if so_file is None:
                 so_file = envs.VLLM_CUDART_SO_PATH  # fallback to env var
-            assert so_file is not None, \
-                (
-                    "libcudart is not loaded in the current process, "
-                    "try setting VLLM_CUDART_SO_PATH"
-                )
+            assert so_file is not None, (
+                "libcudart is not loaded in the current process, "
+                "try setting VLLM_CUDART_SO_PATH"
+            )
         if so_file not in CudaRTLibrary.path_to_library_cache:
             lib = ctypes.CDLL(so_file)
             CudaRTLibrary.path_to_library_cache[so_file] = lib
@@ -154,27 +162,29 @@ def cudaMalloc(self, size: int) -> ctypes.c_void_p:
     def cudaFree(self, devPtr: ctypes.c_void_p) -> None:
         self.CUDART_CHECK(self.funcs["cudaFree"](devPtr))
 
-    def cudaMemset(self, devPtr: ctypes.c_void_p, value: int,
-                   count: int) -> None:
+    def cudaMemset(self, devPtr: ctypes.c_void_p, value: int, count: int) -> None:
         self.CUDART_CHECK(self.funcs["cudaMemset"](devPtr, value, count))
 
-    def cudaMemcpy(self, dst: ctypes.c_void_p, src: ctypes.c_void_p,
-                   count: int) -> None:
+    def cudaMemcpy(
+        self, dst: ctypes.c_void_p, src: ctypes.c_void_p, count: int
+    ) -> None:
         cudaMemcpyDefault = 4
         kind = cudaMemcpyDefault
         self.CUDART_CHECK(self.funcs["cudaMemcpy"](dst, src, count, kind))
 
-    def cudaIpcGetMemHandle(self,
-                            devPtr: ctypes.c_void_p) -> cudaIpcMemHandle_t:
+    def cudaIpcGetMemHandle(self, devPtr: ctypes.c_void_p) -> cudaIpcMemHandle_t:
         handle = cudaIpcMemHandle_t()
-        self.CUDART_CHECK(self.funcs["cudaIpcGetMemHandle"](
-            ctypes.byref(handle), devPtr))
+        self.CUDART_CHECK(
+            self.funcs["cudaIpcGetMemHandle"](ctypes.byref(handle), devPtr)
+        )
         return handle
 
-    def cudaIpcOpenMemHandle(self,
-                             handle: cudaIpcMemHandle_t) -> ctypes.c_void_p:
+    def cudaIpcOpenMemHandle(self, handle: cudaIpcMemHandle_t) -> ctypes.c_void_p:
         cudaIpcMemLazyEnablePeerAccess = 1
         devPtr = ctypes.c_void_p()
-        self.CUDART_CHECK(self.funcs["cudaIpcOpenMemHandle"](
-            ctypes.byref(devPtr), handle, cudaIpcMemLazyEnablePeerAccess))
+        self.CUDART_CHECK(
+            self.funcs["cudaIpcOpenMemHandle"](
+                ctypes.byref(devPtr), handle, cudaIpcMemLazyEnablePeerAccess
+            )
+        )
         return devPtr
diff --git a/vllm/distributed/device_communicators/custom_all_reduce.py b/vllm/distributed/device_communicators/custom_all_reduce.py
index 3cc4bbb25824..fd5c5dfd9da0 100644
--- a/vllm/distributed/device_communicators/custom_all_reduce.py
+++ b/vllm/distributed/device_communicators/custom_all_reduce.py
@@ -11,7 +11,9 @@
 import vllm.envs as envs
 from vllm import _custom_ops as ops
 from vllm.distributed.device_communicators.all_reduce_utils import (
-    CUSTOM_ALL_REDUCE_MAX_SIZES, gpu_p2p_access_check)
+    CUSTOM_ALL_REDUCE_MAX_SIZES,
+    gpu_p2p_access_check,
+)
 from vllm.distributed.parallel_state import in_the_same_node_as
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
@@ -32,8 +34,7 @@ def _can_p2p(rank: int, world_size: int) -> bool:
         if i == rank:
             continue
         if envs.VLLM_SKIP_P2P_CHECK:
-            logger.info(
-                "Skipping P2P check and trusting the driver's P2P report.")
+            logger.info("Skipping P2P check and trusting the driver's P2P report.")
             return torch.cuda.can_device_access_peer(rank, i)
         if not gpu_p2p_access_check(rank, i):
             return False
@@ -41,21 +42,23 @@ def _can_p2p(rank: int, world_size: int) -> bool:
 
 
 def is_weak_contiguous(inp: torch.Tensor):
-    return inp.is_contiguous() or (inp.storage().nbytes() -
-                                   inp.storage_offset() * inp.element_size()
-                                   == inp.numel() * inp.element_size())
+    return inp.is_contiguous() or (
+        inp.storage().nbytes() - inp.storage_offset() * inp.element_size()
+        == inp.numel() * inp.element_size()
+    )
 
 
 class CustomAllreduce:
-
     _SUPPORTED_WORLD_SIZES = [2, 4, 6, 8]
 
     # max_size: max supported allreduce size
-    def __init__(self,
-                 group: ProcessGroup,
-                 device: Union[int, str, torch.device],
-                 max_size=8192 * 1024,
-                 symm_mem_enabled=False) -> None:
+    def __init__(
+        self,
+        group: ProcessGroup,
+        device: Union[int, str, torch.device],
+        max_size=8192 * 1024,
+        symm_mem_enabled=False,
+    ) -> None:
         """
         Args:
             group: the process group to work on. If None, it will use the
@@ -72,20 +75,24 @@ def __init__(self,
         if not custom_ar:
             # disable because of missing custom allreduce library
             # e.g. in a non-GPU environment
-            logger.info("Custom allreduce is disabled because "
-                        "of missing custom allreduce library")
+            logger.info(
+                "Custom allreduce is disabled because "
+                "of missing custom allreduce library"
+            )
             return
 
         self.group = group
 
         assert dist.get_backend(group) != dist.Backend.NCCL, (
-            "CustomAllreduce should be attached to a non-NCCL group.")
+            "CustomAllreduce should be attached to a non-NCCL group."
+        )
 
         if not all(in_the_same_node_as(group, source_rank=0)):
             # No need to initialize custom allreduce for multi-node case.
             logger.warning(
                 "Custom allreduce is disabled because this process group"
-                " spans across nodes.")
+                " spans across nodes."
+            )
             return
 
         rank = dist.get_rank(group=self.group)
@@ -100,7 +107,9 @@ def __init__(self,
                 "Custom allreduce is disabled due to an unsupported world"
                 " size: %d. Supported world sizes: %s. To silence this "
                 "warning, specify disable_custom_all_reduce=True explicitly.",
-                world_size, str(CustomAllreduce._SUPPORTED_WORLD_SIZES))
+                world_size,
+                str(CustomAllreduce._SUPPORTED_WORLD_SIZES),
+            )
             return
 
         if isinstance(device, int):
@@ -110,13 +119,15 @@ def __init__(self,
         # now `device` is a `torch.device` object
         assert isinstance(device, torch.device)
         self.device = device
-        device_capability = current_platform.get_device_capability(
-        ).as_version_str()
-        if (current_platform.is_cuda() and symm_mem_enabled
-                and device_capability in CUSTOM_ALL_REDUCE_MAX_SIZES):
+        device_capability = current_platform.get_device_capability().as_version_str()
+        if (
+            current_platform.is_cuda()
+            and symm_mem_enabled
+            and device_capability in CUSTOM_ALL_REDUCE_MAX_SIZES
+        ):
             max_size = min(
-                CUSTOM_ALL_REDUCE_MAX_SIZES[device_capability][world_size],
-                max_size)
+                CUSTOM_ALL_REDUCE_MAX_SIZES[device_capability][world_size], max_size
+            )
         cuda_visible_devices = envs.CUDA_VISIBLE_DEVICES
         if cuda_visible_devices:
             device_ids = list(map(int, cuda_visible_devices.split(",")))
@@ -124,12 +135,9 @@ def __init__(self,
             device_ids = list(range(cuda_device_count_stateless()))
 
         physical_device_id = device_ids[device.index]
-        tensor = torch.tensor([physical_device_id],
-                              dtype=torch.int,
-                              device="cpu")
+        tensor = torch.tensor([physical_device_id], dtype=torch.int, device="cpu")
         gather_list = [
-            torch.tensor([0], dtype=torch.int, device="cpu")
-            for _ in range(world_size)
+            torch.tensor([0], dtype=torch.int, device="cpu") for _ in range(world_size)
         ]
         dist.all_gather(gather_list, tensor, group=self.group)
         physical_device_ids = [t.item() for t in gather_list]
@@ -138,13 +146,13 @@ def __init__(self,
         # where custom allreduce is not supported
         # this checks hardware and driver support for NVLink
         assert current_platform.is_cuda_alike()
-        fully_connected = current_platform.is_fully_connected(
-            physical_device_ids)
+        fully_connected = current_platform.is_fully_connected(physical_device_ids)
         if world_size > 2 and not fully_connected:
             logger.warning(
                 "Custom allreduce is disabled because it's not supported on"
                 " more than two PCIe-only GPUs. To silence this warning, "
-                "specify disable_custom_all_reduce=True explicitly.")
+                "specify disable_custom_all_reduce=True explicitly."
+            )
             return
         # test P2P capability, this checks software/cudaruntime support
         # this is expensive to compute at the first time
@@ -154,16 +162,17 @@ def __init__(self,
             logger.warning(
                 "Custom allreduce is disabled because your platform lacks "
                 "GPU P2P capability or P2P test failed. To silence this "
-                "warning, specify disable_custom_all_reduce=True explicitly.")
+                "warning, specify disable_custom_all_reduce=True explicitly."
+            )
             return
 
         self.disabled = False
         # Buffers memory are owned by this Python class and passed to C++.
         # Metadata composes of two parts: metadata for synchronization and a
         # temporary buffer for storing intermediate allreduce results.
-        self.meta_ptrs = self.create_shared_buffer(ops.meta_size() + max_size,
-                                                   group=group,
-                                                   uncached=True)
+        self.meta_ptrs = self.create_shared_buffer(
+            ops.meta_size() + max_size, group=group, uncached=True
+        )
         # This is a pre-registered IPC buffer. In eager mode, input tensors
         # are first copied into this buffer before allreduce is performed
         self.buffer_ptrs = self.create_shared_buffer(max_size, group=group)
@@ -172,21 +181,22 @@ def __init__(self,
         # 8*world_size bytes where world_size is at most 8. Allocating 8MB
         # is enough for 131072 such tuples. The largest model I've seen only
         # needs less than 10000 of registered tuples.
-        self.rank_data = torch.empty(8 * 1024 * 1024,
-                                     dtype=torch.uint8,
-                                     device=self.device)
+        self.rank_data = torch.empty(
+            8 * 1024 * 1024, dtype=torch.uint8, device=self.device
+        )
         self.max_size = max_size
         self.rank = rank
         self.world_size = world_size
         self.fully_connected = fully_connected
-        self._ptr = ops.init_custom_ar(self.meta_ptrs, self.rank_data, rank,
-                                       self.fully_connected)
+        self._ptr = ops.init_custom_ar(
+            self.meta_ptrs, self.rank_data, rank, self.fully_connected
+        )
         ops.register_buffer(self._ptr, self.buffer_ptrs)
 
     @contextmanager
     def capture(self):
         """
-        The main responsibility of this context manager is the 
+        The main responsibility of this context manager is the
         `register_graph_buffers` call at the end of the context.
         It records all the buffer addresses used in the CUDA graph.
         """
@@ -204,15 +214,13 @@ def register_graph_buffers(self):
         # We cannot directly use `dist.all_gather_object` here
         # because it is incompatible with `gloo` backend under inference mode.
         # see https://github.com/pytorch/pytorch/issues/126032 for details.
-        all_data = [[None, None]
-                    for _ in range(dist.get_world_size(group=self.group))]
+        all_data = [[None, None] for _ in range(dist.get_world_size(group=self.group))]
         all_data[self.rank] = [handle, offset]
         ranks = sorted(dist.get_process_group_ranks(group=self.group))
         for i, rank in enumerate(ranks):
-            dist.broadcast_object_list(all_data[i],
-                                       src=rank,
-                                       group=self.group,
-                                       device="cpu")
+            dist.broadcast_object_list(
+                all_data[i], src=rank, group=self.group, device="cpu"
+            )
         # Unpack list of tuples to tuple of lists.
         handles = [d[0] for d in all_data]  # type: ignore
         offsets = [d[1] for d in all_data]  # type: ignore
@@ -233,13 +241,11 @@ def should_custom_ar(self, inp: torch.Tensor):
             return inp_size < self.max_size
         return False
 
-    def all_reduce(self,
-                   inp: torch.Tensor,
-                   *,
-                   out: torch.Tensor = None,
-                   registered: bool = False):
+    def all_reduce(
+        self, inp: torch.Tensor, *, out: torch.Tensor = None, registered: bool = False
+    ):
         """Performs an out-of-place all reduce.
-        
+
         If registered is True, this assumes inp's pointer is already
         IPC-registered. Otherwise, inp is first copied into a pre-registered
         buffer.
@@ -249,8 +255,9 @@ def all_reduce(self,
         if registered:
             ops.all_reduce(self._ptr, inp, out, 0, 0)
         else:
-            ops.all_reduce(self._ptr, inp, out, self.buffer_ptrs[self.rank],
-                           self.max_size)
+            ops.all_reduce(
+                self._ptr, inp, out, self.buffer_ptrs[self.rank], self.max_size
+            )
         return out
 
     def custom_all_reduce(self, input: torch.Tensor) -> Optional[torch.Tensor]:
@@ -283,9 +290,11 @@ def __del__(self):
         self.close()
 
     @staticmethod
-    def create_shared_buffer(size_in_bytes: int,
-                             group: Optional[ProcessGroup] = None,
-                             uncached: Optional[bool] = False) -> list[int]:
+    def create_shared_buffer(
+        size_in_bytes: int,
+        group: Optional[ProcessGroup] = None,
+        uncached: Optional[bool] = False,
+    ) -> list[int]:
         pointer, handle = ops.allocate_shared_buffer_and_handle(size_in_bytes)
 
         world_size = dist.get_world_size(group=group)
@@ -302,9 +311,11 @@ def create_shared_buffer(size_in_bytes: int,
         return pointers
 
     @staticmethod
-    def free_shared_buffer(pointers: list[int],
-                           group: Optional[ProcessGroup] = None,
-                           rank: Optional[int] = None) -> None:
+    def free_shared_buffer(
+        pointers: list[int],
+        group: Optional[ProcessGroup] = None,
+        rank: Optional[int] = None,
+    ) -> None:
         if rank is None:
             rank = dist.get_rank(group=group)
         if ops is not None:
diff --git a/vllm/distributed/device_communicators/mnnvl_compat.py b/vllm/distributed/device_communicators/mnnvl_compat.py
index 80072c4fa643..61aee2db46b8 100644
--- a/vllm/distributed/device_communicators/mnnvl_compat.py
+++ b/vllm/distributed/device_communicators/mnnvl_compat.py
@@ -9,7 +9,6 @@
 
 
 class CustomCommunicator(CommBackend):
-
     def __init__(self, group):
         self._group = group
 
@@ -24,5 +23,5 @@ def allgather(self, data: int):
         dist.all_gather_object(gathered, data, group=self._group)
         return gathered
 
-    def Split(self, color: int, key: int) -> 'CustomCommunicator':
+    def Split(self, color: int, key: int) -> "CustomCommunicator":
         return self
diff --git a/vllm/distributed/device_communicators/pynccl.py b/vllm/distributed/device_communicators/pynccl.py
index 81c02d1899e5..59fa3f9c449b 100644
--- a/vllm/distributed/device_communicators/pynccl.py
+++ b/vllm/distributed/device_communicators/pynccl.py
@@ -10,8 +10,14 @@
 
 import vllm.envs as envs
 from vllm.distributed.device_communicators.pynccl_wrapper import (
-    NCCLLibrary, buffer_type, cudaStream_t, ncclComm_t, ncclDataTypeEnum,
-    ncclRedOpTypeEnum, ncclUniqueId)
+    NCCLLibrary,
+    buffer_type,
+    cudaStream_t,
+    ncclComm_t,
+    ncclDataTypeEnum,
+    ncclRedOpTypeEnum,
+    ncclUniqueId,
+)
 from vllm.distributed.utils import StatelessProcessGroup
 from vllm.logger import init_logger
 from vllm.utils import current_stream
@@ -23,7 +29,8 @@
 
 def register_nccl_symmetric_ops(pynccl_comm):
     from vllm.distributed.device_communicators.pynccl_allocator import (
-        nccl_symm_mem_context)
+        nccl_symm_mem_context,
+    )
     from vllm.utils import direct_register_custom_op
 
     global _NCCL_SYMM_OPS_REGISTERED
@@ -31,8 +38,7 @@ def register_nccl_symmetric_ops(pynccl_comm):
         return
     _NCCL_SYMM_OPS_REGISTERED = True
 
-    def all_reduce_symmetric_with_copy_impl(
-            input_tensor: torch.Tensor) -> torch.Tensor:
+    def all_reduce_symmetric_with_copy_impl(input_tensor: torch.Tensor) -> torch.Tensor:
         with nccl_symm_mem_context(pynccl_comm):
             symm_input = torch.empty_like(input_tensor)
             symm_output = torch.empty_like(input_tensor)
@@ -40,8 +46,7 @@ def all_reduce_symmetric_with_copy_impl(
         symm_output = pynccl_comm.all_reduce(symm_input, symm_output)
         return symm_output
 
-    def all_reduce_symmetric_with_copy_fake(
-            input_tensor: torch.Tensor) -> torch.Tensor:
+    def all_reduce_symmetric_with_copy_fake(input_tensor: torch.Tensor) -> torch.Tensor:
         return torch.empty_like(input_tensor)
 
     direct_register_custom_op(
@@ -52,7 +57,6 @@ def all_reduce_symmetric_with_copy_fake(
 
 
 class PyNcclCommunicator:
-
     def __init__(
         self,
         group: Union[ProcessGroup, StatelessProcessGroup],
@@ -73,7 +77,8 @@ def __init__(
         if not isinstance(group, StatelessProcessGroup):
             assert dist.is_initialized()
             assert dist.get_backend(group) != dist.Backend.NCCL, (
-                "PyNcclCommunicator should be attached to a non-NCCL group.")
+                "PyNcclCommunicator should be attached to a non-NCCL group."
+            )
             # note: this rank is the rank in the group
             self.rank = dist.get_rank(group)
             self.world_size = dist.get_world_size(group)
@@ -132,7 +137,8 @@ def __init__(
         # current cuda device to the specified one
         with torch.cuda.device(device):
             self.comm: ncclComm_t = self.nccl.ncclCommInitRank(
-                self.world_size, self.unique_id, self.rank)
+                self.world_size, self.unique_id, self.rank
+            )
 
             stream = current_stream()
             # A small all_reduce for warmup.
@@ -141,11 +147,13 @@ def __init__(
             stream.synchronize()
             del data
 
-    def all_reduce(self,
-                   in_tensor: torch.Tensor,
-                   out_tensor: torch.Tensor = None,
-                   op: ReduceOp = ReduceOp.SUM,
-                   stream=None) -> torch.Tensor:
+    def all_reduce(
+        self,
+        in_tensor: torch.Tensor,
+        out_tensor: torch.Tensor = None,
+        op: ReduceOp = ReduceOp.SUM,
+        stream=None,
+    ) -> torch.Tensor:
         if self.disabled:
             return None
         # nccl communicator created on a specific device
@@ -153,25 +161,28 @@ def all_reduce(self,
         # otherwise it will cause "illegal memory access"
         assert in_tensor.device == self.device, (
             f"this nccl communicator is created to work on {self.device}, "
-            f"but the input tensor is on {in_tensor.device}")
+            f"but the input tensor is on {in_tensor.device}"
+        )
 
         if out_tensor is None:
             out_tensor = torch.empty_like(in_tensor)
 
         if stream is None:
             stream = current_stream()
-        self.nccl.ncclAllReduce(buffer_type(in_tensor.data_ptr()),
-                                buffer_type(out_tensor.data_ptr()),
-                                in_tensor.numel(),
-                                ncclDataTypeEnum.from_torch(in_tensor.dtype),
-                                ncclRedOpTypeEnum.from_torch(op), self.comm,
-                                cudaStream_t(stream.cuda_stream))
+        self.nccl.ncclAllReduce(
+            buffer_type(in_tensor.data_ptr()),
+            buffer_type(out_tensor.data_ptr()),
+            in_tensor.numel(),
+            ncclDataTypeEnum.from_torch(in_tensor.dtype),
+            ncclRedOpTypeEnum.from_torch(op),
+            self.comm,
+            cudaStream_t(stream.cuda_stream),
+        )
         return out_tensor
 
-    def all_gather(self,
-                   output_tensor: torch.Tensor,
-                   input_tensor: torch.Tensor,
-                   stream=None):
+    def all_gather(
+        self, output_tensor: torch.Tensor, input_tensor: torch.Tensor, stream=None
+    ):
         if self.disabled:
             return
         # nccl communicator created on a specific device
@@ -179,14 +190,18 @@ def all_gather(self,
         # otherwise it will cause "illegal memory access"
         assert input_tensor.device == self.device, (
             f"this nccl communicator is created to work on {self.device}, "
-            f"but the input tensor is on {input_tensor.device}")
+            f"but the input tensor is on {input_tensor.device}"
+        )
         if stream is None:
             stream = current_stream()
         self.nccl.ncclAllGather(
             buffer_type(input_tensor.data_ptr()),
-            buffer_type(output_tensor.data_ptr()), input_tensor.numel(),
-            ncclDataTypeEnum.from_torch(input_tensor.dtype), self.comm,
-            cudaStream_t(stream.cuda_stream))
+            buffer_type(output_tensor.data_ptr()),
+            input_tensor.numel(),
+            ncclDataTypeEnum.from_torch(input_tensor.dtype),
+            self.comm,
+            cudaStream_t(stream.cuda_stream),
+        )
 
     def all_gatherv(
         self,
@@ -202,14 +217,15 @@ def all_gatherv(
         # otherwise it will cause "illegal memory access"
         assert input_tensor.device == self.device, (
             f"this nccl communicator is created to work on {self.device}, "
-            f"but the input tensor is on {input_tensor.device}")
+            f"but the input tensor is on {input_tensor.device}"
+        )
         if stream is None:
             stream = current_stream()
         assert output_tensor.shape[0] == sum(sizes)
         split_offset = 0
         self.nccl.ncclGroupStart()
         for root, split_size in enumerate(sizes):
-            dst_slice = output_tensor[split_offset:split_offset + split_size]
+            dst_slice = output_tensor[split_offset : split_offset + split_size]
             self.nccl.ncclBroadcast(
                 buffer_type(input_tensor.data_ptr()),
                 buffer_type(dst_slice.data_ptr()),
@@ -222,11 +238,13 @@ def all_gatherv(
             split_offset += split_size
         self.nccl.ncclGroupEnd()
 
-    def reduce_scatter(self,
-                       output_tensor: torch.Tensor,
-                       input_tensor: torch.Tensor,
-                       op: ReduceOp = ReduceOp.SUM,
-                       stream=None):
+    def reduce_scatter(
+        self,
+        output_tensor: torch.Tensor,
+        input_tensor: torch.Tensor,
+        op: ReduceOp = ReduceOp.SUM,
+        stream=None,
+    ):
         if self.disabled:
             return
         # nccl communicator created on a specific device
@@ -234,15 +252,19 @@ def reduce_scatter(self,
         # otherwise it will cause "illegal memory access"
         assert input_tensor.device == self.device, (
             f"this nccl communicator is created to work on {self.device}, "
-            f"but the input tensor is on {input_tensor.device}")
+            f"but the input tensor is on {input_tensor.device}"
+        )
         if stream is None:
             stream = current_stream()
         self.nccl.ncclReduceScatter(
             buffer_type(input_tensor.data_ptr()),
-            buffer_type(output_tensor.data_ptr()), output_tensor.numel(),
+            buffer_type(output_tensor.data_ptr()),
+            output_tensor.numel(),
             ncclDataTypeEnum.from_torch(input_tensor.dtype),
-            ncclRedOpTypeEnum.from_torch(op), self.comm,
-            cudaStream_t(stream.cuda_stream))
+            ncclRedOpTypeEnum.from_torch(op),
+            self.comm,
+            cudaStream_t(stream.cuda_stream),
+        )
 
     def reduce_scatterv(
         self,
@@ -259,20 +281,25 @@ def reduce_scatterv(
         # otherwise it will cause "illegal memory access"
         assert input_tensor.device == self.device, (
             f"this nccl communicator is created to work on {self.device}, "
-            f"but the input tensor is on {input_tensor.device}")
+            f"but the input tensor is on {input_tensor.device}"
+        )
         if stream is None:
             stream = current_stream()
 
         split_offset = 0
         self.nccl.ncclGroupStart()
         for root, split_size in enumerate(sizes):
-            chunk = input_tensor[split_offset:split_offset + split_size, ...]
+            chunk = input_tensor[split_offset : split_offset + split_size, ...]
             self.nccl.ncclReduce(
                 buffer_type(chunk.data_ptr()),
-                buffer_type(output_tensor.data_ptr()), chunk.numel(),
+                buffer_type(output_tensor.data_ptr()),
+                chunk.numel(),
                 ncclDataTypeEnum.from_torch(input_tensor.dtype),
-                ncclRedOpTypeEnum.from_torch(op), root, self.comm,
-                cudaStream_t(stream.cuda_stream))
+                ncclRedOpTypeEnum.from_torch(op),
+                root,
+                self.comm,
+                cudaStream_t(stream.cuda_stream),
+            )
             split_offset += split_size
         self.nccl.ncclGroupEnd()
 
@@ -281,31 +308,44 @@ def send(self, tensor: torch.Tensor, dst: int, stream=None):
             return
         assert tensor.device == self.device, (
             f"this nccl communicator is created to work on {self.device}, "
-            f"but the input tensor is on {tensor.device}")
+            f"but the input tensor is on {tensor.device}"
+        )
         if stream is None:
             stream = current_stream()
-        self.nccl.ncclSend(buffer_type(tensor.data_ptr()), tensor.numel(),
-                           ncclDataTypeEnum.from_torch(tensor.dtype), dst,
-                           self.comm, cudaStream_t(stream.cuda_stream))
+        self.nccl.ncclSend(
+            buffer_type(tensor.data_ptr()),
+            tensor.numel(),
+            ncclDataTypeEnum.from_torch(tensor.dtype),
+            dst,
+            self.comm,
+            cudaStream_t(stream.cuda_stream),
+        )
 
     def recv(self, tensor: torch.Tensor, src: int, stream=None):
         if self.disabled:
             return
         assert tensor.device == self.device, (
             f"this nccl communicator is created to work on {self.device}, "
-            f"but the input tensor is on {tensor.device}")
+            f"but the input tensor is on {tensor.device}"
+        )
         if stream is None:
             stream = current_stream()
-        self.nccl.ncclRecv(buffer_type(tensor.data_ptr()), tensor.numel(),
-                           ncclDataTypeEnum.from_torch(tensor.dtype), src,
-                           self.comm, cudaStream_t(stream.cuda_stream))
+        self.nccl.ncclRecv(
+            buffer_type(tensor.data_ptr()),
+            tensor.numel(),
+            ncclDataTypeEnum.from_torch(tensor.dtype),
+            src,
+            self.comm,
+            cudaStream_t(stream.cuda_stream),
+        )
 
     def broadcast(self, tensor: torch.Tensor, src: int, stream=None):
         if self.disabled:
             return
         assert tensor.device == self.device, (
             f"this nccl communicator is created to work on {self.device}, "
-            f"but the input tensor is on {tensor.device}")
+            f"but the input tensor is on {tensor.device}"
+        )
         if stream is None:
             stream = current_stream()
         if src == self.rank:
@@ -315,9 +355,15 @@ def broadcast(self, tensor: torch.Tensor, src: int, stream=None):
         else:
             sendbuff = buffer_type()
             recvbuff = buffer_type(tensor.data_ptr())
-        self.nccl.ncclBroadcast(sendbuff, recvbuff, tensor.numel(),
-                                ncclDataTypeEnum.from_torch(tensor.dtype), src,
-                                self.comm, cudaStream_t(stream.cuda_stream))
+        self.nccl.ncclBroadcast(
+            sendbuff,
+            recvbuff,
+            tensor.numel(),
+            ncclDataTypeEnum.from_torch(tensor.dtype),
+            src,
+            self.comm,
+            cudaStream_t(stream.cuda_stream),
+        )
 
     def group_start(self):
         self.nccl.ncclGroupStart()
@@ -334,8 +380,7 @@ def register_comm_window(self, tensor: torch.Tensor):
         )
 
     def register_comm_window_raw(self, ptr: int, size: int):
-        return self.nccl.ncclCommWindowRegister(self.comm, buffer_type(ptr),
-                                                size, 1)
+        return self.nccl.ncclCommWindowRegister(self.comm, buffer_type(ptr), size, 1)
 
     def deregister_comm_window(self, window):
         return self.nccl.ncclCommWindowDeregister(self.comm, window)
diff --git a/vllm/distributed/device_communicators/pynccl_allocator.py b/vllm/distributed/device_communicators/pynccl_allocator.py
index bc874c1e197e..3fe4fd744d77 100644
--- a/vllm/distributed/device_communicators/pynccl_allocator.py
+++ b/vllm/distributed/device_communicators/pynccl_allocator.py
@@ -98,7 +98,9 @@ def compile_nccl_allocator():
             "This is expected if NCCL headers are not available. "
             "optionally set VLLM_NCCL_INCLUDE_PATH to point to a directory "
             "containing the NCCL header. "
-            "Error: %s", str(e))
+            "Error: %s",
+            str(e),
+        )
 
 
 def get_nccl_mem_pool():
@@ -125,21 +127,24 @@ def _cleanup_nccl_allocator_wrapper():
 
 
 class nccl_symm_mem_context:
-
     def __init__(
         self,
         pynccl_comm: PyNcclCommunicator,
         disabled: bool = False,
     ):
-        self.disabled = (disabled or not is_symmetric_memory_enabled()
-                         or pynccl_comm.world_size == 1
-                         or not current_platform.is_cuda()
-                         or get_nccl_mem_pool() is None or version.parse(
-                             torch.__version__) < version.parse("2.8.0.a0"))
+        self.disabled = (
+            disabled
+            or not is_symmetric_memory_enabled()
+            or pynccl_comm.world_size == 1
+            or not current_platform.is_cuda()
+            or get_nccl_mem_pool() is None
+            or version.parse(torch.__version__) < version.parse("2.8.0.a0")
+        )
         if self.disabled:
             self.pynccl_comm: Optional[PyNcclCommunicator] = None
-            self._mem_pool_ctx: contextlib.AbstractContextManager[
-                Any] = contextlib.nullcontext()
+            self._mem_pool_ctx: contextlib.AbstractContextManager[Any] = (
+                contextlib.nullcontext()
+            )
             self.is_graph_capture = None
             self.device = None
         else:
@@ -151,16 +156,16 @@ def __init__(
     def __enter__(self):
         if self.disabled:
             return self
-        assert (
-            self.pynccl_comm
-            is not None), "Symmetric memory requires pynccl to be initalized"
-        assert (
-            self.pynccl_comm.nccl_version >= 22703
-        ), "NCCL version 2.27.3 or higher is required for NCCL symmetric memory"
+        assert self.pynccl_comm is not None, (
+            "Symmetric memory requires pynccl to be initalized"
+        )
+        assert self.pynccl_comm.nccl_version >= 22703, (
+            "NCCL version 2.27.3 or higher is required for NCCL symmetric memory"
+        )
         if self.is_graph_capture:
-            assert (
-                _graph_pool_id
-                is not None), "graph_pool_id is not set under graph capture"
+            assert _graph_pool_id is not None, (
+                "graph_pool_id is not set under graph capture"
+            )
             # Pause graph memory pool to use symmetric memory with cuda graph
             torch._C._cuda_endAllocateToPool(self.device, _graph_pool_id)
         self._mem_pool_ctx.__enter__()
@@ -179,8 +184,8 @@ def __exit__(self, exc_type, exc_val, exc_tb):
         for segment in _cached_pool_snapshot:
             if segment["address"] not in _registered_base_addrs:
                 self.pynccl_comm.register_comm_window_raw(
-                    segment["address"], segment["total_size"])
+                    segment["address"], segment["total_size"]
+                )
                 _registered_base_addrs.add(segment["address"])
         if self.is_graph_capture:
-            torch._C._cuda_beginAllocateCurrentThreadToPool(
-                self.device, _graph_pool_id)
+            torch._C._cuda_beginAllocateCurrentThreadToPool(self.device, _graph_pool_id)
diff --git a/vllm/distributed/device_communicators/pynccl_wrapper.py b/vllm/distributed/device_communicators/pynccl_wrapper.py
index 2e9a4e024de4..e4d7b0f8fb85 100644
--- a/vllm/distributed/device_communicators/pynccl_wrapper.py
+++ b/vllm/distributed/device_communicators/pynccl_wrapper.py
@@ -133,88 +133,141 @@ class NCCLLibrary:
         # const char* ncclGetErrorString(ncclResult_t result)
         Function("ncclGetErrorString", ctypes.c_char_p, [ncclResult_t]),
         # ncclResult_t  ncclGetVersion(int *version);
-        Function("ncclGetVersion", ncclResult_t,
-                 [ctypes.POINTER(ctypes.c_int)]),
+        Function("ncclGetVersion", ncclResult_t, [ctypes.POINTER(ctypes.c_int)]),
         # ncclResult_t ncclGetUniqueId(ncclUniqueId* uniqueId);
-        Function("ncclGetUniqueId", ncclResult_t,
-                 [ctypes.POINTER(ncclUniqueId)]),
+        Function("ncclGetUniqueId", ncclResult_t, [ctypes.POINTER(ncclUniqueId)]),
         # ncclResult_t  ncclCommInitRank(
         #   ncclComm_t* comm, int nranks, ncclUniqueId commId, int rank);
         # note that ncclComm_t is a pointer type, so the first argument
         # is a pointer to a pointer
-        Function("ncclCommInitRank", ncclResult_t, [
-            ctypes.POINTER(ncclComm_t), ctypes.c_int, ncclUniqueId,
-            ctypes.c_int
-        ]),
+        Function(
+            "ncclCommInitRank",
+            ncclResult_t,
+            [ctypes.POINTER(ncclComm_t), ctypes.c_int, ncclUniqueId, ctypes.c_int],
+        ),
         # ncclResult_t  ncclAllReduce(
         #   const void* sendbuff, void* recvbuff, size_t count,
         #   ncclDataType_t datatype, ncclRedOp_t op, ncclComm_t comm,
         #   cudaStream_t stream);
         # note that cudaStream_t is a pointer type, so the last argument
         # is a pointer
-        Function("ncclAllReduce", ncclResult_t, [
-            buffer_type, buffer_type, ctypes.c_size_t, ncclDataType_t,
-            ncclRedOp_t, ncclComm_t, cudaStream_t
-        ]),
-
+        Function(
+            "ncclAllReduce",
+            ncclResult_t,
+            [
+                buffer_type,
+                buffer_type,
+                ctypes.c_size_t,
+                ncclDataType_t,
+                ncclRedOp_t,
+                ncclComm_t,
+                cudaStream_t,
+            ],
+        ),
         # ncclResult_t  ncclReduce(
         #   const void* sendbuff, void* recvbuff, size_t count,
         #   ncclDataType_t datatype, ncclRedOp_t op, int root,
         #   ncclComm_t comm,  cudaStream_t stream);
         # note that cudaStream_t is a pointer type, so the last argument
         # is a pointer
-        Function("ncclReduce", ncclResult_t, [
-            buffer_type, buffer_type, ctypes.c_size_t, ncclDataType_t,
-            ncclRedOp_t, ctypes.c_int, ncclComm_t, cudaStream_t
-        ]),
-
+        Function(
+            "ncclReduce",
+            ncclResult_t,
+            [
+                buffer_type,
+                buffer_type,
+                ctypes.c_size_t,
+                ncclDataType_t,
+                ncclRedOp_t,
+                ctypes.c_int,
+                ncclComm_t,
+                cudaStream_t,
+            ],
+        ),
         # ncclResult_t  ncclAllGather(
         #   const void* sendbuff, void* recvbuff, size_t count,
         #   ncclDataType_t datatype, ncclComm_t comm,
         #   cudaStream_t stream);
         # note that cudaStream_t is a pointer type, so the last argument
         # is a pointer
-        Function("ncclAllGather", ncclResult_t, [
-            buffer_type, buffer_type, ctypes.c_size_t, ncclDataType_t,
-            ncclComm_t, cudaStream_t
-        ]),
-
+        Function(
+            "ncclAllGather",
+            ncclResult_t,
+            [
+                buffer_type,
+                buffer_type,
+                ctypes.c_size_t,
+                ncclDataType_t,
+                ncclComm_t,
+                cudaStream_t,
+            ],
+        ),
         # ncclResult_t  ncclReduceScatter(
         #   const void* sendbuff, void* recvbuff, size_t count,
         #   ncclDataType_t datatype, ncclRedOp_t op, ncclComm_t comm,
         #   cudaStream_t stream);
         # note that cudaStream_t is a pointer type, so the last argument
         # is a pointer
-        Function("ncclReduceScatter", ncclResult_t, [
-            buffer_type, buffer_type, ctypes.c_size_t, ncclDataType_t,
-            ncclRedOp_t, ncclComm_t, cudaStream_t
-        ]),
-
+        Function(
+            "ncclReduceScatter",
+            ncclResult_t,
+            [
+                buffer_type,
+                buffer_type,
+                ctypes.c_size_t,
+                ncclDataType_t,
+                ncclRedOp_t,
+                ncclComm_t,
+                cudaStream_t,
+            ],
+        ),
         # ncclResult_t  ncclSend(
         #   const void* sendbuff, size_t count, ncclDataType_t datatype,
         #   int dest, ncclComm_t comm, cudaStream_t stream);
-        Function("ncclSend", ncclResult_t, [
-            buffer_type, ctypes.c_size_t, ncclDataType_t, ctypes.c_int,
-            ncclComm_t, cudaStream_t
-        ]),
-
+        Function(
+            "ncclSend",
+            ncclResult_t,
+            [
+                buffer_type,
+                ctypes.c_size_t,
+                ncclDataType_t,
+                ctypes.c_int,
+                ncclComm_t,
+                cudaStream_t,
+            ],
+        ),
         # ncclResult_t  ncclRecv(
         #   void* recvbuff, size_t count, ncclDataType_t datatype,
         #   int src, ncclComm_t comm, cudaStream_t stream);
-        Function("ncclRecv", ncclResult_t, [
-            buffer_type, ctypes.c_size_t, ncclDataType_t, ctypes.c_int,
-            ncclComm_t, cudaStream_t
-        ]),
-
+        Function(
+            "ncclRecv",
+            ncclResult_t,
+            [
+                buffer_type,
+                ctypes.c_size_t,
+                ncclDataType_t,
+                ctypes.c_int,
+                ncclComm_t,
+                cudaStream_t,
+            ],
+        ),
         # ncclResult_t ncclBroadcast(
         #   const void* sendbuff, void* recvbuff, size_t count,
         #   ncclDataType_t datatype, int root, ncclComm_t comm,
         #   cudaStream_t stream);
-        Function("ncclBroadcast", ncclResult_t, [
-            buffer_type, buffer_type, ctypes.c_size_t, ncclDataType_t,
-            ctypes.c_int, ncclComm_t, cudaStream_t
-        ]),
-
+        Function(
+            "ncclBroadcast",
+            ncclResult_t,
+            [
+                buffer_type,
+                buffer_type,
+                ctypes.c_size_t,
+                ncclDataType_t,
+                ctypes.c_int,
+                ncclComm_t,
+                cudaStream_t,
+            ],
+        ),
         # be cautious! this is a collective call, it will block until all
         # processes in the communicator have called this function.
         # because Python object destruction can happen in random order,
@@ -241,8 +294,7 @@ class NCCLLibrary:
         ),
         # ncclResult_t ncclCommWindowDeregister(
         #   ncclComm_t comm, ncclWindow_t win);
-        Function("ncclCommWindowDeregister", ncclResult_t,
-                 [ncclComm_t, ncclWindow_t]),
+        Function("ncclCommWindowDeregister", ncclResult_t, [ncclComm_t, ncclWindow_t]),
     ]
 
     # class attribute to store the mapping from the path to the library
@@ -254,7 +306,6 @@ class NCCLLibrary:
     path_to_dict_mapping: dict[str, dict[str, Any]] = {}
 
     def __init__(self, so_file: Optional[str] = None):
-
         so_file = so_file or find_nccl_library()
 
         try:
@@ -270,8 +321,10 @@ def __init__(self, so_file: Optional[str] = None):
                 "or it does not support the current platform %s. "
                 "If you already have the library, please set the "
                 "environment variable VLLM_NCCL_SO_PATH"
-                " to point to the correct nccl library path.", so_file,
-                platform.platform())
+                " to point to the correct nccl library path.",
+                so_file,
+                platform.platform(),
+            )
             raise e
 
         if so_file not in NCCLLibrary.path_to_dict_mapping:
@@ -284,15 +337,18 @@ def __init__(self, so_file: Optional[str] = None):
                     _funcs[func.name] = f
                 except AttributeError:
                     if func.name in [
-                            "ncclCommWindowRegister",
-                            "ncclCommWindowDeregister"
+                        "ncclCommWindowRegister",
+                        "ncclCommWindowDeregister",
                     ]:
                         if envs.VLLM_USE_NCCL_SYMM_MEM:
                             logger.warning_once(
                                 "The symbol %s is not found in the NCCL "
                                 "library %s. To enable VLLM_USE_NCCL_SYMM_MEM "
                                 " please update your NCCL version to >= "
-                                "2.27.03.", func.name, so_file)
+                                "2.27.03.",
+                                func.name,
+                                so_file,
+                            )
                         if current_platform.is_rocm():
                             # Having an exception here on ROCm platform is
                             # not allowed during graph capturing
@@ -325,88 +381,153 @@ def ncclGetVersion(self) -> str:
 
     def ncclGetUniqueId(self) -> ncclUniqueId:
         unique_id = ncclUniqueId()
-        self.NCCL_CHECK(self._funcs["ncclGetUniqueId"](
-            ctypes.byref(unique_id)))
+        self.NCCL_CHECK(self._funcs["ncclGetUniqueId"](ctypes.byref(unique_id)))
         return unique_id
 
     def unique_id_from_bytes(self, data: bytes) -> ncclUniqueId:
         if len(data) != 128:
             raise ValueError(
-                f"Expected 128 bytes for ncclUniqueId, got {len(data)} bytes")
+                f"Expected 128 bytes for ncclUniqueId, got {len(data)} bytes"
+            )
         unique_id = ncclUniqueId()
         ctypes.memmove(ctypes.addressof(unique_id.internal), data, 128)
         return unique_id
 
-    def ncclCommInitRank(self, world_size: int, unique_id: ncclUniqueId,
-                         rank: int) -> ncclComm_t:
+    def ncclCommInitRank(
+        self, world_size: int, unique_id: ncclUniqueId, rank: int
+    ) -> ncclComm_t:
         comm = ncclComm_t()
-        self.NCCL_CHECK(self._funcs["ncclCommInitRank"](ctypes.byref(comm),
-                                                        world_size, unique_id,
-                                                        rank))
+        self.NCCL_CHECK(
+            self._funcs["ncclCommInitRank"](
+                ctypes.byref(comm), world_size, unique_id, rank
+            )
+        )
         return comm
 
-    def ncclAllReduce(self, sendbuff: buffer_type, recvbuff: buffer_type,
-                      count: int, datatype: int, op: int, comm: ncclComm_t,
-                      stream: cudaStream_t) -> None:
+    def ncclAllReduce(
+        self,
+        sendbuff: buffer_type,
+        recvbuff: buffer_type,
+        count: int,
+        datatype: int,
+        op: int,
+        comm: ncclComm_t,
+        stream: cudaStream_t,
+    ) -> None:
         # `datatype` actually should be `ncclDataType_t`
         # and `op` should be `ncclRedOp_t`
         # both are aliases of `ctypes.c_int`
         # when we pass int to a function, it will be converted to `ctypes.c_int`
         # by ctypes automatically
-        self.NCCL_CHECK(self._funcs["ncclAllReduce"](sendbuff, recvbuff, count,
-                                                     datatype, op, comm,
-                                                     stream))
-
-    def ncclReduce(self, sendbuff: buffer_type, recvbuff: buffer_type,
-                   count: int, datatype: int, op: int, root: int,
-                   comm: ncclComm_t, stream: cudaStream_t) -> None:
+        self.NCCL_CHECK(
+            self._funcs["ncclAllReduce"](
+                sendbuff, recvbuff, count, datatype, op, comm, stream
+            )
+        )
+
+    def ncclReduce(
+        self,
+        sendbuff: buffer_type,
+        recvbuff: buffer_type,
+        count: int,
+        datatype: int,
+        op: int,
+        root: int,
+        comm: ncclComm_t,
+        stream: cudaStream_t,
+    ) -> None:
         # `datatype` actually should be `ncclDataType_t`
         # and `op` should be `ncclRedOp_t`
         # both are aliases of `ctypes.c_int`
         # when we pass int to a function, it will be converted to `ctypes.c_int`
         # by ctypes automatically
-        self.NCCL_CHECK(self._funcs["ncclReduce"](sendbuff, recvbuff, count,
-                                                  datatype, op, root, comm,
-                                                  stream))
-
-    def ncclReduceScatter(self, sendbuff: buffer_type, recvbuff: buffer_type,
-                          count: int, datatype: int, op: int, comm: ncclComm_t,
-                          stream: cudaStream_t) -> None:
+        self.NCCL_CHECK(
+            self._funcs["ncclReduce"](
+                sendbuff, recvbuff, count, datatype, op, root, comm, stream
+            )
+        )
+
+    def ncclReduceScatter(
+        self,
+        sendbuff: buffer_type,
+        recvbuff: buffer_type,
+        count: int,
+        datatype: int,
+        op: int,
+        comm: ncclComm_t,
+        stream: cudaStream_t,
+    ) -> None:
         # `datatype` actually should be `ncclDataType_t`
         # and `op` should be `ncclRedOp_t`
         # both are aliases of `ctypes.c_int`
         # when we pass int to a function, it will be converted to `ctypes.c_int`
         # by ctypes automatically
-        self.NCCL_CHECK(self._funcs["ncclReduceScatter"](sendbuff, recvbuff,
-                                                         count, datatype, op,
-                                                         comm, stream))
-
-    def ncclAllGather(self, sendbuff: buffer_type, recvbuff: buffer_type,
-                      count: int, datatype: int, comm: ncclComm_t,
-                      stream: cudaStream_t) -> None:
+        self.NCCL_CHECK(
+            self._funcs["ncclReduceScatter"](
+                sendbuff, recvbuff, count, datatype, op, comm, stream
+            )
+        )
+
+    def ncclAllGather(
+        self,
+        sendbuff: buffer_type,
+        recvbuff: buffer_type,
+        count: int,
+        datatype: int,
+        comm: ncclComm_t,
+        stream: cudaStream_t,
+    ) -> None:
         # `datatype` actually should be `ncclDataType_t`
         # which is an aliases of `ctypes.c_int`
         # when we pass int to a function, it will be converted to `ctypes.c_int`
         # by ctypes automatically
-        self.NCCL_CHECK(self._funcs["ncclAllGather"](sendbuff, recvbuff, count,
-                                                     datatype, comm, stream))
-
-    def ncclSend(self, sendbuff: buffer_type, count: int, datatype: int,
-                 dest: int, comm: ncclComm_t, stream: cudaStream_t) -> None:
-        self.NCCL_CHECK(self._funcs["ncclSend"](sendbuff, count, datatype,
-                                                dest, comm, stream))
-
-    def ncclRecv(self, recvbuff: buffer_type, count: int, datatype: int,
-                 src: int, comm: ncclComm_t, stream: cudaStream_t) -> None:
-        self.NCCL_CHECK(self._funcs["ncclRecv"](recvbuff, count, datatype, src,
-                                                comm, stream))
-
-    def ncclBroadcast(self, sendbuff: buffer_type, recvbuff: buffer_type,
-                      count: int, datatype: int, root: int, comm: ncclComm_t,
-                      stream: cudaStream_t) -> None:
-        self.NCCL_CHECK(self._funcs["ncclBroadcast"](sendbuff, recvbuff, count,
-                                                     datatype, root, comm,
-                                                     stream))
+        self.NCCL_CHECK(
+            self._funcs["ncclAllGather"](
+                sendbuff, recvbuff, count, datatype, comm, stream
+            )
+        )
+
+    def ncclSend(
+        self,
+        sendbuff: buffer_type,
+        count: int,
+        datatype: int,
+        dest: int,
+        comm: ncclComm_t,
+        stream: cudaStream_t,
+    ) -> None:
+        self.NCCL_CHECK(
+            self._funcs["ncclSend"](sendbuff, count, datatype, dest, comm, stream)
+        )
+
+    def ncclRecv(
+        self,
+        recvbuff: buffer_type,
+        count: int,
+        datatype: int,
+        src: int,
+        comm: ncclComm_t,
+        stream: cudaStream_t,
+    ) -> None:
+        self.NCCL_CHECK(
+            self._funcs["ncclRecv"](recvbuff, count, datatype, src, comm, stream)
+        )
+
+    def ncclBroadcast(
+        self,
+        sendbuff: buffer_type,
+        recvbuff: buffer_type,
+        count: int,
+        datatype: int,
+        root: int,
+        comm: ncclComm_t,
+        stream: cudaStream_t,
+    ) -> None:
+        self.NCCL_CHECK(
+            self._funcs["ncclBroadcast"](
+                sendbuff, recvbuff, count, datatype, root, comm, stream
+            )
+        )
 
     def ncclCommDestroy(self, comm: ncclComm_t) -> None:
         self.NCCL_CHECK(self._funcs["ncclCommDestroy"](comm))
@@ -417,19 +538,27 @@ def ncclGroupStart(self) -> None:
     def ncclGroupEnd(self) -> None:
         self.NCCL_CHECK(self._funcs["ncclGroupEnd"]())
 
-    def ncclCommWindowRegister(self, comm: ncclComm_t, buff: buffer_type,
-                               size: int, win_flags: int) -> ncclWindow_t:
+    def ncclCommWindowRegister(
+        self, comm: ncclComm_t, buff: buffer_type, size: int, win_flags: int
+    ) -> ncclWindow_t:
         window = ncclWindow_t()
-        self.NCCL_CHECK(self._funcs["ncclCommWindowRegister"](
-            comm, buff, size, ctypes.byref(window), win_flags))
+        self.NCCL_CHECK(
+            self._funcs["ncclCommWindowRegister"](
+                comm, buff, size, ctypes.byref(window), win_flags
+            )
+        )
         return window
 
-    def ncclCommWindowDeregister(self, comm: ncclComm_t,
-                                 window: ncclWindow_t) -> None:
+    def ncclCommWindowDeregister(self, comm: ncclComm_t, window: ncclWindow_t) -> None:
         self.NCCL_CHECK(self._funcs["ncclCommWindowDeregister"](comm, window))
 
 
 __all__ = [
-    "NCCLLibrary", "ncclDataTypeEnum", "ncclRedOpTypeEnum", "ncclUniqueId",
-    "ncclComm_t", "cudaStream_t", "buffer_type"
+    "NCCLLibrary",
+    "ncclDataTypeEnum",
+    "ncclRedOpTypeEnum",
+    "ncclUniqueId",
+    "ncclComm_t",
+    "cudaStream_t",
+    "buffer_type",
 ]
diff --git a/vllm/distributed/device_communicators/quick_all_reduce.py b/vllm/distributed/device_communicators/quick_all_reduce.py
index 836241910e2f..16b6b6c28ea3 100644
--- a/vllm/distributed/device_communicators/quick_all_reduce.py
+++ b/vllm/distributed/device_communicators/quick_all_reduce.py
@@ -27,9 +27,10 @@
 
 
 def is_weak_contiguous(inp: torch.Tensor):
-    return inp.is_contiguous() or (inp.storage().nbytes() -
-                                   inp.storage_offset() * inp.element_size()
-                                   == inp.numel() * inp.element_size())
+    return inp.is_contiguous() or (
+        inp.storage().nbytes() - inp.storage_offset() * inp.element_size()
+        == inp.numel() * inp.element_size()
+    )
 
 
 class QuickReduceRegime(Enum):
@@ -44,7 +45,6 @@ class QuickReduceRegime(Enum):
 
 
 class QuickAllReduce:
-
     _SUPPORTED_WORLD_SIZES = [2, 4, 8]
     _SUPPORTED_DTYPES = [torch.float16, torch.bfloat16]
     # The following data is based on kernel tests.
@@ -58,20 +58,21 @@ class QuickAllReduce:
         (torch.bfloat16, 8): [16 * MB, 2048 * MB, 2048 * MB, 2048 * MB],
     }
 
-    def __init__(self, group: ProcessGroup,
-                 device: Union[int, str, torch.device]) -> None:
+    def __init__(
+        self, group: ProcessGroup, device: Union[int, str, torch.device]
+    ) -> None:
         """
-        Custom allreduce provides non-destructive acceleration and is 
+        Custom allreduce provides non-destructive acceleration and is
         available for CUDA and ROCm MI300 series.
 
-        Custom quick allreduce leverages quantization for further 
-        acceleration on ROCm. It currently supports Q8, Q6, and Q4 
+        Custom quick allreduce leverages quantization for further
+        acceleration on ROCm. It currently supports Q8, Q6, and Q4
         quantization formats and FP(float16, bfloat16).
 
-        Quick allreduce is designed as a complement to custom allreduce. 
-        Its initialization requires even stricter conditions. 
+        Quick allreduce is designed as a complement to custom allreduce.
+        Its initialization requires even stricter conditions.
 
-        Only the ROCm MI300 series is supported for quick allreduce at 
+        Only the ROCm MI300 series is supported for quick allreduce at
         this time.
 
         Args:
@@ -93,18 +94,23 @@ def __init__(self, group: ProcessGroup,
         if not quick_ar:
             # disable because of missing quick reduce library
             # e.g. in a cuda environment
-            logger.info("Custom quick allreduce is disabled because "
-                        "of missing custom quick allreduce library")
+            logger.info(
+                "Custom quick allreduce is disabled because "
+                "of missing custom quick allreduce library"
+            )
             return
 
         self.group = group
         assert dist.get_backend(group) != dist.Backend.NCCL, (
-            "Custom quick allreduce should be attached to a non-NCCL group.")
+            "Custom quick allreduce should be attached to a non-NCCL group."
+        )
         if not all(in_the_same_node_as(group, source_rank=0)):
             # No need to initialize custom quick allreduce for
             # multi-node case.
-            logger.warning("Custom quick allreduce is disabled because this "
-                           "process group spans across nodes.")
+            logger.warning(
+                "Custom quick allreduce is disabled because this "
+                "process group spans across nodes."
+            )
             return
         rank = dist.get_rank(group=self.group)
         world_size = dist.get_world_size(group=self.group)
@@ -118,7 +124,9 @@ def __init__(self, group: ProcessGroup,
             logger.warning(
                 "Custom quick allreduce is disabled due to an "
                 "unsupported world size: %d. Supported world sizes: %s.",
-                world_size, str(QuickAllReduce._SUPPORTED_WORLD_SIZES))
+                world_size,
+                str(QuickAllReduce._SUPPORTED_WORLD_SIZES),
+            )
             return
 
         if isinstance(device, int):
@@ -134,9 +142,7 @@ def __init__(self, group: ProcessGroup,
         else:
             device_ids = list(range(cuda_device_count_stateless()))
         physical_device_id = device_ids[device.index]
-        tensor = torch.tensor([physical_device_id],
-                              dtype=torch.int,
-                              device="cpu")
+        tensor = torch.tensor([physical_device_id], dtype=torch.int, device="cpu")
         gather_list = [
             torch.tensor([0], dtype=torch.int, device="cpu")
             for _ in range(self.world_size)
@@ -148,12 +154,12 @@ def __init__(self, group: ProcessGroup,
         # where custom quick allreduce is not supported
         # this checks hardware and driver support for NVLink
         assert current_platform.is_cuda_alike()
-        self.fully_connected = current_platform.is_fully_connected(
-            physical_device_ids)
+        self.fully_connected = current_platform.is_fully_connected(physical_device_ids)
         if self.world_size > 2 and not self.fully_connected:
             logger.debug(
                 "Custom quick allreduce is disabled because it's not supported "
-                "on more than two PCIe-only GPUs. ")
+                "on more than two PCIe-only GPUs. "
+            )
             return
 
         self.init_quick_all_reduce()
@@ -169,24 +175,31 @@ def init_quick_all_reduce(self):
                 "Custom quick allreduce:",
                 f"Invalid quantization level: {regime_str}. "
                 "Supported levels: "
-                f"{list(QuickReduceRegime.__members__.keys())}")
+                f"{list(QuickReduceRegime.__members__.keys())}",
+            )
             return
 
         if regime_str == "NONE":
-            logger.debug("Custom quick allreduce is disabled based "
-                         "on env variable "
-                         "VLLM_ROCM_QUICK_REDUCE_QUANTIZATION='NONE'")
+            logger.debug(
+                "Custom quick allreduce is disabled based "
+                "on env variable "
+                "VLLM_ROCM_QUICK_REDUCE_QUANTIZATION='NONE'"
+            )
             return
         self.qr_quant_level = QuickReduceRegime[regime_str]
         vllm_config = get_current_vllm_config()
-        if vllm_config is not None and \
-            hasattr(vllm_config, "model_config") and \
-            hasattr(vllm_config.model_config, "dtype"):
+        if (
+            vllm_config is not None
+            and hasattr(vllm_config, "model_config")
+            and hasattr(vllm_config.model_config, "dtype")
+        ):
             dtype = vllm_config.model_config.dtype
             if dtype not in [torch.float16, torch.bfloat16]:
                 logger.debug(
                     "Custom quick allreduce disabled: only supports "
-                    "float16 and float16, but get %s.", dtype)
+                    "float16 and float16, but get %s.",
+                    dtype,
+                )
                 return
 
             if dtype == torch.bfloat16 and self.use_fp16_kernels:
@@ -194,7 +207,8 @@ def init_quick_all_reduce(self):
                     "Custom quick allreduce: BF16 inputs will be converted "
                     "to FP16 to improve performance. set "
                     "envs.VLLM_ROCM_QUICK_REDUCE_CAST_BF16_TO_FP16=0 "
-                    "to turn off.")
+                    "to turn off."
+                )
 
         # VLLM_ROCM_QUICK_REDUCE_MAX_SIZE_BYTES_MB is specified in MB
         qr_max_size = envs.VLLM_ROCM_QUICK_REDUCE_MAX_SIZE_BYTES_MB
@@ -206,8 +220,7 @@ def init_quick_all_reduce(self):
                 )
             qr_max_size = qr_max_size * MB
         self._ptr = ops.init_custom_qr(self.rank, self.world_size, qr_max_size)
-        self.qr_max_size = qr_max_size if qr_max_size is not None \
-            else ops.qr_max_size()
+        self.qr_max_size = qr_max_size if qr_max_size is not None else ops.qr_max_size()
         self.create_shared_buffer()
         self.disabled = False
 
@@ -217,16 +230,15 @@ def _rocm_arch_available(self):
         try:
             props = torch.cuda.get_device_properties(0)
             gcn_arch = getattr(props, "gcnArchName", "")
-            supported_archs = ['gfx94', 'gfx95']
+            supported_archs = ["gfx94", "gfx95"]
             return any(gfx in gcn_arch for gfx in supported_archs)
         except Exception as e:
-            logger.warning("Failed to determine ROCm for quick allreduce: %s",
-                           e)
+            logger.warning("Failed to determine ROCm for quick allreduce: %s", e)
             return False
 
     def create_shared_buffer(self):
         """
-        Creates a shared buffer for quickreduce. 
+        Creates a shared buffer for quickreduce.
         Has to be called after init_custom_qr
         """
         handle = ops.qr_get_handle(self._ptr)
@@ -253,9 +265,11 @@ def should_quick_allreduce(self, inp: torch.Tensor):
         dtype = inp.dtype
         if self.use_fp16_kernels:
             dtype = torch.float16
-        return inp_size <= self.qr_max_size and \
-            inp_size >= self._QR_MIN_SIZE[(dtype, self.world_size)]\
-                [self.qr_quant_level.value]
+        return (
+            inp_size <= self.qr_max_size
+            and inp_size
+            >= self._QR_MIN_SIZE[(dtype, self.world_size)][self.qr_quant_level.value]
+        )
 
     def quick_all_reduce(self, inp: torch.Tensor, *, out: torch.Tensor = None):
         """Performs an out-of-place custom quick all reduce."""
@@ -263,8 +277,9 @@ def quick_all_reduce(self, inp: torch.Tensor, *, out: torch.Tensor = None):
         # as QR uses static IPC buffer.
         if out is None:
             out = torch.empty_like(inp)
-        ops.qr_all_reduce(self._ptr, inp, out, self.qr_quant_level.value,
-                          self.use_fp16_kernels)
+        ops.qr_all_reduce(
+            self._ptr, inp, out, self.qr_quant_level.value, self.use_fp16_kernels
+        )
         return out
 
     def close(self):
diff --git a/vllm/distributed/device_communicators/ray_communicator.py b/vllm/distributed/device_communicators/ray_communicator.py
index 69efc8b45270..da79afc7ac14 100644
--- a/vllm/distributed/device_communicators/ray_communicator.py
+++ b/vllm/distributed/device_communicators/ray_communicator.py
@@ -6,12 +6,12 @@
 import ray
 import torch
 from ray.exceptions import RayChannelError
-from ray.experimental.channel.communicator import (Communicator,
-                                                   TorchTensorAllocator)
+from ray.experimental.channel.communicator import Communicator, TorchTensorAllocator
 from torch.distributed import ReduceOp
 
 from vllm.distributed.device_communicators.base_device_communicator import (
-    DeviceCommunicatorBase)
+    DeviceCommunicatorBase,
+)
 from vllm.distributed.parallel_state import get_pp_group
 from vllm.logger import init_logger
 from vllm.utils import current_stream
@@ -59,11 +59,11 @@ def __init__(
         self._rank: Optional[int] = None
         self._actor_handles = actor_handles
         if use_communication_streams:
-            raise NotImplementedError(
-                "use_communication_streams is not supported")
+            raise NotImplementedError("use_communication_streams is not supported")
         if cuda_stream is not None and cuda_stream != current_stream():
             raise ValueError(
-                "cuda_stream other than the current stream is not supported")
+                "cuda_stream other than the current stream is not supported"
+            )
 
         if rank is not None:
             # Rank is not None, this is Ray worker
@@ -99,13 +99,14 @@ def _build_actor_rank_mapping(self):
 
         # Ray actor IDs are 32-character hex strings (128 bits)
         ACTOR_ID_LEN = 32
-        actor_id_bytes = actor_id_str.encode('utf-8')
-        assert len(
-            actor_id_bytes
-        ) == ACTOR_ID_LEN, f"Unexpected actor ID length: {len(actor_id_bytes)}"
+        actor_id_bytes = actor_id_str.encode("utf-8")
+        assert len(actor_id_bytes) == ACTOR_ID_LEN, (
+            f"Unexpected actor ID length: {len(actor_id_bytes)}"
+        )
 
-        actor_id_tensor = torch.frombuffer(
-            actor_id_bytes, dtype=torch.uint8).to(self._comm.device)
+        actor_id_tensor = torch.frombuffer(actor_id_bytes, dtype=torch.uint8).to(
+            self._comm.device
+        )
 
         # All-gather full actor IDs from all actors
         gathered_ids = self._comm.all_gather(actor_id_tensor, dim=0)
@@ -115,9 +116,8 @@ def _build_actor_rank_mapping(self):
         for rank in range(self._world_size):
             start_idx = rank * ACTOR_ID_LEN
             end_idx = (rank + 1) * ACTOR_ID_LEN
-            actor_bytes = gathered_ids[start_idx:end_idx].cpu().numpy(
-            ).tobytes()
-            actor_id = actor_bytes.decode('utf-8')
+            actor_bytes = gathered_ids[start_idx:end_idx].cpu().numpy().tobytes()
+            actor_id = actor_bytes.decode("utf-8")
             self._actor_id_to_rank[actor_id] = rank
 
     def initialize(self, rank: int) -> None:
@@ -131,9 +131,10 @@ def get_rank(self, actor: ray.actor.ActorHandle) -> int:
         """
         Return the given actor's rank using device communicator collective ops.
         """
-        assert hasattr(self, '_actor_id_to_rank'), (
+        assert hasattr(self, "_actor_id_to_rank"), (
             "Actor rank mapping not built. "
-            "This should have been done during initialization.")
+            "This should have been done during initialization."
+        )
 
         actor_id_str = actor._actor_id.hex()
 
diff --git a/vllm/distributed/device_communicators/shm_broadcast.py b/vllm/distributed/device_communicators/shm_broadcast.py
index 0fc9d1cf4f51..4cec60102728 100644
--- a/vllm/distributed/device_communicators/shm_broadcast.py
+++ b/vllm/distributed/device_communicators/shm_broadcast.py
@@ -14,14 +14,24 @@
 import torch.distributed as dist
 import zmq
 from torch.distributed import ProcessGroup
-from zmq import IPV6  # type: ignore
-from zmq import SUB, SUBSCRIBE, XPUB, XPUB_VERBOSE, Context  # type: ignore
+from zmq import (  # type: ignore
+    IPV6,  # type: ignore
+    SUB,
+    SUBSCRIBE,
+    XPUB,
+    XPUB_VERBOSE,
+    Context,
+)
 
 import vllm.envs as envs
 from vllm.distributed.utils import StatelessProcessGroup, sched_yield
 from vllm.logger import init_logger
-from vllm.utils import (get_ip, get_open_port, get_open_zmq_ipc_path,
-                        is_valid_ipv6_address)
+from vllm.utils import (
+    get_ip,
+    get_open_port,
+    get_open_zmq_ipc_path,
+    is_valid_ipv6_address,
+)
 
 VLLM_RINGBUFFER_WARNING_INTERVAL = envs.VLLM_RINGBUFFER_WARNING_INTERVAL
 
@@ -29,7 +39,6 @@
 
 
 class SpinTimer:
-
     def record_activity(self):
         pass
 
@@ -66,12 +75,13 @@ def spin(self):
 
 
 class ShmRingBuffer:
-
-    def __init__(self,
-                 n_reader: int,
-                 max_chunk_bytes: int,
-                 max_chunks: int,
-                 name: Optional[str] = None):
+    def __init__(
+        self,
+        n_reader: int,
+        max_chunk_bytes: int,
+        max_chunks: int,
+        name: Optional[str] = None,
+    ):
         """
         A shared memory ring buffer implementation for broadcast communication.
         Essentially, it is a queue where only one will `enqueue` and multiple
@@ -120,13 +130,14 @@ def __init__(self,
         created object to other processes by pickling it. The other processes will
         get the name of the shared memory and open it, so that they can access the
         same shared memory buffer.
-        """# noqa
+        """  # noqa
         self.n_reader = n_reader
         self.metadata_size = 1 + n_reader
         self.max_chunk_bytes = max_chunk_bytes
         self.max_chunks = max_chunks
-        self.total_bytes_of_buffer = (self.max_chunk_bytes +
-                                      self.metadata_size) * self.max_chunks
+        self.total_bytes_of_buffer = (
+            self.max_chunk_bytes + self.metadata_size
+        ) * self.max_chunks
         self.data_offset = 0
         self.metadata_offset = self.max_chunk_bytes * self.max_chunks
 
@@ -134,10 +145,10 @@ def __init__(self,
             # we are creating a buffer
             self.is_creator = True
             self.shared_memory = shared_memory.SharedMemory(
-                create=True, size=self.total_bytes_of_buffer)
+                create=True, size=self.total_bytes_of_buffer
+            )
             # initialize the metadata section to 0
-            with self.shared_memory.buf[self.
-                                        metadata_offset:] as metadata_buffer:
+            with self.shared_memory.buf[self.metadata_offset :] as metadata_buffer:
                 torch.frombuffer(metadata_buffer, dtype=torch.uint8).fill_(0)
         else:
             # we are opening an existing buffer
@@ -145,8 +156,10 @@ def __init__(self,
             # fix to https://stackoverflow.com/q/62748654/9191338
             # Python incorrectly tracks shared memory even if it is not
             # created by the process. The following patch is a workaround.
-            with patch("multiprocessing.resource_tracker.register",
-                       lambda *args, **kwargs: None):
+            with patch(
+                "multiprocessing.resource_tracker.register",
+                lambda *args, **kwargs: None,
+            ):
                 try:
                     self.shared_memory = shared_memory.SharedMemory(name=name)
                     # See https://docs.python.org/3/library/multiprocessing.shared_memory.html # noqa
@@ -154,8 +167,7 @@ def __init__(self,
                     # so the shared memory block size may be larger or equal
                     # to the requested size. The size parameter is ignored
                     # when attaching to an existing block.
-                    assert (self.shared_memory.size
-                            >= self.total_bytes_of_buffer)
+                    assert self.shared_memory.size >= self.total_bytes_of_buffer
                 except FileNotFoundError:
                     # we might deserialize the object in a different node
                     # in this case, this object is not used,
@@ -163,8 +175,12 @@ def __init__(self,
                     pass
 
     def handle(self):
-        return (self.n_reader, self.max_chunk_bytes, self.max_chunks,
-                self.shared_memory.name)
+        return (
+            self.n_reader,
+            self.max_chunk_bytes,
+            self.max_chunks,
+            self.shared_memory.name,
+        )
 
     def __reduce__(self):
         return (
@@ -204,7 +220,6 @@ class Handle:
 
 
 class MessageQueue:
-
     def __init__(
         self,
         n_reader,  # number of all readers
@@ -228,8 +243,7 @@ def __init__(
             # for local readers, we will:
             # 1. create a shared memory ring buffer to communicate small data
             # 2. create a publish-subscribe socket to communicate large data
-            self.buffer = ShmRingBuffer(n_local_reader, max_chunk_bytes,
-                                        max_chunks)
+            self.buffer = ShmRingBuffer(n_local_reader, max_chunk_bytes, max_chunks)
 
             # XPUB is very similar to PUB,
             # except that it can receive subscription messages
@@ -279,8 +293,7 @@ def __init__(
 
         self.handle = Handle(
             local_reader_ranks=local_reader_ranks,
-            buffer_handle=self.buffer.handle()
-            if self.buffer is not None else None,
+            buffer_handle=self.buffer.handle() if self.buffer is not None else None,
             local_subscribe_addr=local_subscribe_addr,
             remote_subscribe_addr=remote_subscribe_addr,
             remote_addr_ipv6=remote_addr_ipv6,
@@ -315,8 +328,9 @@ def create_from_handle(handle: Handle, rank) -> "MessageQueue":
 
             self.remote_socket = None
 
-            self._read_spin_timer = SpinSleepTimer(
-            ) if envs.VLLM_SLEEP_WHEN_IDLE else SpinTimer()
+            self._read_spin_timer = (
+                SpinSleepTimer() if envs.VLLM_SLEEP_WHEN_IDLE else SpinTimer()
+            )
         else:
             self.buffer = None  # type: ignore
             self.current_idx = -1
@@ -399,7 +413,8 @@ def acquire_write(self, timeout: Optional[float] = None):
                             " in %s seconds. This typically happens when some"
                             " processes are hanging or doing some"
                             " time-consuming work (e.g. compilation)",
-                            VLLM_RINGBUFFER_WARNING_INTERVAL)
+                            VLLM_RINGBUFFER_WARNING_INTERVAL,
+                        )
                         n_warning += 1
 
                     continue
@@ -423,15 +438,16 @@ def acquire_write(self, timeout: Optional[float] = None):
                     metadata_buffer[i] = 0
                 # mark the block as written
                 metadata_buffer[0] = 1
-                self.current_idx = (self.current_idx +
-                                    1) % self.buffer.max_chunks
+                self.current_idx = (self.current_idx + 1) % self.buffer.max_chunks
                 break
 
     @contextmanager
-    def acquire_read(self,
-                     timeout: Optional[float] = None,
-                     cancel: Optional[Event] = None,
-                     indefinite: bool = False):
+    def acquire_read(
+        self,
+        timeout: Optional[float] = None,
+        cancel: Optional[Event] = None,
+        indefinite: bool = False,
+    ):
         assert self._is_local_reader, "Only readers can acquire read"
         start_time = time.monotonic()
         n_warning = 1
@@ -460,15 +476,16 @@ def acquire_read(self,
                         raise TimeoutError
 
                     # if we wait for a long time, log a message
-                    if not indefinite and (elapsed
-                                           > VLLM_RINGBUFFER_WARNING_INTERVAL *
-                                           n_warning):
+                    if not indefinite and (
+                        elapsed > VLLM_RINGBUFFER_WARNING_INTERVAL * n_warning
+                    ):
                         logger.info(
                             "No available shared memory broadcast block found"
                             " in %s seconds. This typically happens when some"
                             " processes are hanging or doing some"
                             " time-consuming work (e.g. compilation).",
-                            VLLM_RINGBUFFER_WARNING_INTERVAL)
+                            VLLM_RINGBUFFER_WARNING_INTERVAL,
+                        )
                         n_warning += 1
 
                     continue
@@ -480,14 +497,13 @@ def acquire_read(self,
                 # caller has read from the buffer
                 # set the read flag
                 metadata_buffer[self.local_reader_rank + 1] = 1
-                self.current_idx = (self.current_idx +
-                                    1) % self.buffer.max_chunks
+                self.current_idx = (self.current_idx + 1) % self.buffer.max_chunks
 
                 self._read_spin_timer.record_activity()
                 break
 
     def enqueue(self, obj, timeout: Optional[float] = None):
-        """ Write to message queue with optional timeout (in seconds) """
+        """Write to message queue with optional timeout (in seconds)"""
         assert self._is_writer, "Only writers can enqueue"
         serialized_obj = pickle.dumps(obj, protocol=pickle.HIGHEST_PROTOCOL)
         if self.n_local_reader > 0:
@@ -498,15 +514,17 @@ def enqueue(self, obj, timeout: Optional[float] = None):
             else:
                 with self.acquire_write(timeout) as buf:
                     buf[0] = 0  # not overflow
-                    buf[1:len(serialized_obj) + 1] = serialized_obj
+                    buf[1 : len(serialized_obj) + 1] = serialized_obj
         if self.n_remote_reader > 0:
             self.remote_socket.send(serialized_obj)
 
-    def dequeue(self,
-                timeout: Optional[float] = None,
-                cancel: Optional[Event] = None,
-                indefinite: bool = False):
-        """ Read from message queue with optional timeout (in seconds) """
+    def dequeue(
+        self,
+        timeout: Optional[float] = None,
+        cancel: Optional[Event] = None,
+        indefinite: bool = False,
+    ):
+        """Read from message queue with optional timeout (in seconds)"""
         if self._is_local_reader:
             with self.acquire_read(timeout, cancel, indefinite) as buf:
                 overflow = buf[0] == 1
@@ -539,11 +557,12 @@ def broadcast_object(self, obj=None):
             return self.dequeue()
 
     @staticmethod
-    def create_from_process_group(pg: Union[ProcessGroup,
-                                            StatelessProcessGroup],
-                                  max_chunk_bytes,
-                                  max_chunks,
-                                  writer_rank=0) -> "MessageQueue":
+    def create_from_process_group(
+        pg: Union[ProcessGroup, StatelessProcessGroup],
+        max_chunk_bytes,
+        max_chunks,
+        writer_rank=0,
+    ) -> "MessageQueue":
         if isinstance(pg, ProcessGroup):
             group_rank = dist.get_rank(pg)
             group_world_size = dist.get_world_size(pg)
@@ -554,6 +573,7 @@ def create_from_process_group(pg: Union[ProcessGroup,
             global_ranks = list(range(pg.world_size))
 
         from vllm.distributed.parallel_state import in_the_same_node_as
+
         status = in_the_same_node_as(pg, source_rank=writer_rank)
         same_node_ranks = [i for i, s in enumerate(status) if s]
         n_reader = group_world_size - 1
@@ -570,17 +590,17 @@ def create_from_process_group(pg: Union[ProcessGroup,
             )
             handle = buffer_io.export_handle()
             if isinstance(pg, ProcessGroup):
-                dist.broadcast_object_list([handle],
-                                           src=global_ranks[writer_rank],
-                                           group=pg)
+                dist.broadcast_object_list(
+                    [handle], src=global_ranks[writer_rank], group=pg
+                )
             else:
                 pg.broadcast_obj(handle, writer_rank)
         else:
             if isinstance(pg, ProcessGroup):
                 recv = [None]
-                dist.broadcast_object_list(recv,
-                                           src=global_ranks[writer_rank],
-                                           group=pg)
+                dist.broadcast_object_list(
+                    recv, src=global_ranks[writer_rank], group=pg
+                )
                 handle = recv[0]  # type: ignore
             else:
                 handle = pg.broadcast_obj(None, writer_rank)
diff --git a/vllm/distributed/device_communicators/shm_object_storage.py b/vllm/distributed/device_communicators/shm_object_storage.py
index 0310fc14da25..a5486c30edf2 100644
--- a/vllm/distributed/device_communicators/shm_object_storage.py
+++ b/vllm/distributed/device_communicators/shm_object_storage.py
@@ -24,63 +24,63 @@ class SingleWriterShmRingBuffer:
     A single-writer, multiple-reader ring buffer implementation using shared
     memory. This class provides a thread-safe ring buffer where one process
     can write data while multiple processes/threads can read from it.
-    
+
     Architecture:
     - Uses shared memory for cross-process communication
     - Maintains metadata for each allocated buffer chunk in the writer process
     - Supports custom "is_free_fn" functions to determine when buffers can be
       reused
     - Each buffer chunk contains: `[4-byte id][4-byte size][actual_data]`
-    
+
     Key Concepts:
     - monotonic_id_start/end: Track the range of active buffer IDs
     - data_buffer_start/end: Track the physical memory range in use
     - Automatic wraparound when reaching buffer end
     - Lazy garbage collection based on is_free_fn checks
-    
+
     Example Usage Scenarios:
-    
+
     Scenario 1: Simple Linear Allocation
     ```
     Buffer size: 100 bytes
     Initial state: [................................................. ]
                    ^start=end(0)
-    
+
     After allocating 20 bytes (id=0):
     [id:0|size:20|data........][...................................]
     ^start(0)                  ^end(28)
-    
-    After allocating 30 bytes (id=1):  
+
+    After allocating 30 bytes (id=1):
     [id:0|size:20|data........][id:1|size:30|data..............][..]
     ^start(0)                                                   ^end(66)
     ```
-    
+
     Scenario 2: Memory Reclamation
     ```
     Before freeing (both buffers still in use):
     [id:0|size:20|data........][id:1|size:30|data..............][..]
     ^start(0)                                                   ^end(66)
-    
+
     After id:0 is marked free by readers:
     [FREED.................... ][id:1|size:30|data..............][..]
                                 ^start(28)                       ^end(66)
-    
+
     After both are freed:
     [FREED..............................................][..]
                                                          ^start=end(66)
     ```
-    
+
     Scenario 3: Wraparound Allocation (continuing from Scenario 2)
     ```
     Starting from after memory reclamation in Scenario 2:
     [FREED..............................................][..]
                                                          ^start=end(66)
-    
+
     Allocate 40 bytes (id=2) - only 34 bytes available at end, so wraparound:
     [id:2|size:40|data........................][FREED.............][..]
                                               ^end(148)            ^start(66)
     ```
-    
+
     Scenario 4: Error Handling - Out of Space
     ```
     Starting from after wraparound allocation in Scenario 3:
@@ -91,17 +91,17 @@ class SingleWriterShmRingBuffer:
     occupied_size_new = end + size - start = 148 + 28 - 66 > buffer_size(100)
     -> Raises MemoryError: "Not enough space in the data buffer"
     ```
-    
+
     Thread Safety:
     - Single writer: Only one process/thread should write (allocate_buf)
-    - Multiple readers: Multiple processes/threads can read (access_buf) 
+    - Multiple readers: Multiple processes/threads can read (access_buf)
     - Reader synchronization handled by is_free_fn callback
     - Writer handles garbage collection (free_buf) based on reader feedback
-    
+
     Memory Layout per Buffer Chunk:
     `[4-byte monotonic_id][4-byte chunk_size][actual_data...]`
     ^metadata_start                         ^data_start
-    
+
     The monotonic_id ensures data integrity - readers can verify they're
     accessing the correct data even after buffer wraparound or reuse.
     """
@@ -131,15 +131,16 @@ def __init__(
                 self.monotonic_id_end: self.data_buffer_end
             }  # monotonic_id -> start address
             self.shared_memory = shared_memory.SharedMemory(
-                create=True, size=self.data_buffer_size, name=name)
+                create=True, size=self.data_buffer_size, name=name
+            )
         else:
             # we are opening an existing buffer
             # fix to https://stackoverflow.com/q/62748654/9191338
             # Python incorrectly tracks shared memory even if it is not
             # created by the process. The following patch is a workaround.
             with patch(
-                    "multiprocessing.resource_tracker.register",
-                    lambda *args, **kwargs: None,
+                "multiprocessing.resource_tracker.register",
+                lambda *args, **kwargs: None,
             ):
                 self.shared_memory = shared_memory.SharedMemory(name=name)
                 # See https://docs.python.org/3/library/multiprocessing.shared_memory.html # noqa
@@ -149,8 +150,11 @@ def __init__(
                 # when attaching to an existing block.
                 assert self.shared_memory.size >= self.data_buffer_size
 
-        logger.debug("Shared memory created/opened with name: %s, size: %d",
-                     self.shared_memory.name, self.data_buffer_size)
+        logger.debug(
+            "Shared memory created/opened with name: %s, size: %d",
+            self.shared_memory.name,
+            self.data_buffer_size,
+        )
 
     def handle(self):
         return (
@@ -182,19 +186,20 @@ def byte2int(self, byte_data: bytes) -> int:
         return int.from_bytes(byte_data, "little", signed=True)
 
     def allocate_buf(self, size: int) -> tuple[int, int]:
-        '''
+        """
         Allocate a buffer `MD_SIZE` + `size` bytes in the shared memory.
         Memory layout:
         `[4-byte monotonic_id][4-byte size][buffer data...]`
-        '''
+        """
         assert self.is_writer, "Only the writer can allocate buffers."
         assert size > 0, "Size must be greater than 0"
         size += self.MD_SIZE  # add metadata size to the buffer size
         # reset to beginning if the buffer does have enough contiguous space
         buffer_end_reset = self.data_buffer_end % self.data_buffer_size
         if buffer_end_reset + size > self.data_buffer_size:
-            buffer_end_reset = (self.data_buffer_end // self.data_buffer_size +
-                                1) * self.data_buffer_size
+            buffer_end_reset = (
+                self.data_buffer_end // self.data_buffer_size + 1
+            ) * self.data_buffer_size
         else:  # no reset needed
             buffer_end_reset = self.data_buffer_end
 
@@ -203,21 +208,24 @@ def allocate_buf(self, size: int) -> tuple[int, int]:
         # exceeds the start of the data buffer
         occupied_size_new = buffer_end_reset + size - self.data_buffer_start
         if occupied_size_new > self.data_buffer_size:
-            raise MemoryError("Not enough space in the data buffer, "
-                              "try calling free_buf() to free up space")
+            raise MemoryError(
+                "Not enough space in the data buffer, "
+                "try calling free_buf() to free up space"
+            )
         self.data_buffer_end = buffer_end_reset
 
         # first 4 bytes as the monotonic id
         buf_idx = self.data_buffer_end % self.data_buffer_size
-        self.shared_memory.buf[buf_idx:buf_idx + self.ID_NBYTES] = \
-            self.int2byte(self.monotonic_id_end)
+        self.shared_memory.buf[buf_idx : buf_idx + self.ID_NBYTES] = self.int2byte(
+            self.monotonic_id_end
+        )
         # next 4 bytes as the size of the data buffer
-        self.shared_memory.buf[buf_idx + self.ID_NBYTES: \
-            buf_idx + self.MD_SIZE] = self.int2byte(size)
+        self.shared_memory.buf[buf_idx + self.ID_NBYTES : buf_idx + self.MD_SIZE] = (
+            self.int2byte(size)
+        )
 
         # record metadata
-        self.metadata[self.monotonic_id_end %
-                      self.ID_MAX] = self.data_buffer_end
+        self.metadata[self.monotonic_id_end % self.ID_MAX] = self.data_buffer_end
         # update buffer and monotonic id indices
         current_buffer_end = self.data_buffer_end
         current_id_end = self.monotonic_id_end
@@ -230,23 +238,26 @@ def access_buf(self, address: int):
         buf_idx = address % self.data_buffer_size
 
         # read metadata
-        metadata_buff = self.shared_memory.buf[buf_idx:buf_idx + self.MD_SIZE]
-        id = self.byte2int(metadata_buff[:self.ID_NBYTES])
-        size = self.byte2int(metadata_buff[self.ID_NBYTES:self.MD_SIZE])
+        metadata_buff = self.shared_memory.buf[buf_idx : buf_idx + self.MD_SIZE]
+        id = self.byte2int(metadata_buff[: self.ID_NBYTES])
+        size = self.byte2int(metadata_buff[self.ID_NBYTES : self.MD_SIZE])
 
         # yield the data buffer and metadata
-        data_buff = self.shared_memory.buf[buf_idx + self.MD_SIZE:buf_idx +
-                                           size]
-        with (memoryview(data_buff) as data_view, ):
+        data_buff = self.shared_memory.buf[buf_idx + self.MD_SIZE : buf_idx + size]
+        with (
+            memoryview(data_buff) as data_view,
+        ):
             yield data_view, (id, size)
 
-    def free_buf(self,
-                 is_free_fn: Callable[[int, memoryview], bool],
-                 nbytes: Optional[int] = None) -> Iterable[int]:
-        '''
+    def free_buf(
+        self,
+        is_free_fn: Callable[[int, memoryview], bool],
+        nbytes: Optional[int] = None,
+    ) -> Iterable[int]:
+        """
         Free a buffer of the given size. This is a no-op in shared memory,
         but we need to keep track of the metadata.
-        
+
         If freed memory spreads across the end and start of the ring buffer,
         the actual freed memory will be in two segments. In this case there
         still might not be a contiguous space of `nbytes` available.
@@ -254,13 +265,15 @@ def free_buf(self,
         Args:
             nbytes (int, optional): The size of the buffer to free. If None,
                 frees the maximum size of the ring buffer.
-        '''
+        """
 
         assert self.is_writer, "Only the writer can free buffers."
         logger.debug(
             "Freeing up space in the ring buffer, "
             "monotonic_id_start: %d, monotonic_id_end: %d",
-            self.monotonic_id_start, self.monotonic_id_end)
+            self.monotonic_id_start,
+            self.monotonic_id_end,
+        )
         monotonic_id_before = self.monotonic_id_start
         # if nbytes is None, free up the maximum size of the ring buffer
         if nbytes is None:
@@ -272,8 +285,9 @@ def free_buf(self,
                 if is_free_fn(self.monotonic_id_start, data_buff):
                     # check passed, we can free the buffer
                     del self.metadata[self.monotonic_id_start]
-                    self.monotonic_id_start = ((self.monotonic_id_start + 1) %
-                                               self.ID_MAX)
+                    self.monotonic_id_start = (
+                        self.monotonic_id_start + 1
+                    ) % self.ID_MAX
                     self.data_buffer_start = address
                     freed_bytes += metadata[1]
                 else:
@@ -282,8 +296,11 @@ def free_buf(self,
 
         logger.debug(
             "Freed %d bytes from the ring buffer, "
-            "monotonic_id_start: %d, monotonic_id_end: %d", freed_bytes,
-            self.monotonic_id_start, self.monotonic_id_end)
+            "monotonic_id_start: %d, monotonic_id_end: %d",
+            freed_bytes,
+            self.monotonic_id_start,
+            self.monotonic_id_end,
+        )
 
         # buffer wrap around
         if self.data_buffer_start >= self.data_buffer_size:
@@ -295,12 +312,12 @@ def free_buf(self,
         if monotonic_id_after >= monotonic_id_before:
             return range(monotonic_id_before, monotonic_id_after)
         else:
-            return chain(range(monotonic_id_before, self.ID_MAX),
-                         range(0, monotonic_id_after))
+            return chain(
+                range(monotonic_id_before, self.ID_MAX), range(0, monotonic_id_after)
+            )
 
 
 class ObjectSerde(ABC):
-
     @abstractmethod
     def serialize(self, value: Any) -> tuple[Any, int, bytes, int]:
         """Serialize an object to bytes."""
@@ -313,7 +330,6 @@ def deserialize(self, data: memoryview) -> Any:
 
 
 class MsgpackSerde(ObjectSerde):
-
     def __init__(self):
         # Delayed import to avoid circular dependency
         from vllm.multimodal.inputs import MultiModalKwargsItem
@@ -325,8 +341,8 @@ def __init__(self):
         self._mm_kwargs_item_cls = MultiModalKwargsItem
 
     def serialize(
-            self,
-            value: Any) -> tuple[Union[bytes, list[bytes]], int, bytes, int]:
+        self, value: Any
+    ) -> tuple[Union[bytes, list[bytes]], int, bytes, int]:
         len_arr = None
         if isinstance(value, (torch.Tensor, self._mm_kwargs_item_cls)):
             type_name = type(value).__name__
@@ -339,8 +355,9 @@ def serialize(
             nbytes = len(value)
 
         object_metadata = (type_name, nbytes, len_arr)
-        serialized_metadata = pickle.dumps(object_metadata,
-                                           protocol=pickle.HIGHEST_PROTOCOL)
+        serialized_metadata = pickle.dumps(
+            object_metadata, protocol=pickle.HIGHEST_PROTOCOL
+        )
         return value, nbytes, serialized_metadata, len(serialized_metadata)
 
     def deserialize(self, data_view: memoryview) -> Any:
@@ -353,7 +370,7 @@ def deserialize(self, data_view: memoryview) -> Any:
             obj = []
             start_idx = 0
             for length in len_arr:
-                item_bytes = serialized_data[start_idx:start_idx + length]
+                item_bytes = serialized_data[start_idx : start_idx + length]
                 obj.append(item_bytes)
                 start_idx += length
             obj = self.tensor_decoder.decode(obj)
@@ -361,15 +378,14 @@ def deserialize(self, data_view: memoryview) -> Any:
             obj = []
             start_idx = 0
             for length in len_arr:
-                item_bytes = serialized_data[start_idx:start_idx + length]
+                item_bytes = serialized_data[start_idx : start_idx + length]
                 obj.append(item_bytes)
                 start_idx += length
             obj = self.mm_decoder.decode(obj)
         elif type_name == bytes.__name__:
             obj = pickle.loads(serialized_data)
         else:
-            raise ValueError(
-                f"Unsupported object type '{type_name}' in metadata")
+            raise ValueError(f"Unsupported object type '{type_name}' in metadata")
 
         return obj
 
@@ -388,18 +404,18 @@ class SingleWriterShmObjectStorage:
     A single-writer, multiple-reader object storage system built on top of a
     shared memory ring buffer. Provides key-value storage with automatic memory
     management and cross-process serialization support.
-    
+
     This storage system follows a FIFO (First-In-First-Out) eviction policy
     where the oldest objects are automatically freed when memory runs low.
     Memory is reclaimed based on reader reference counting - objects are only
     freed when all readers have finished accessing them.
-    
+
     Architecture:
     - Single writer process can put(key, value) objects
     - Multiple reader processes can get(address, monotonic_id) objects
     - Built on SingleWriterShmRingBuffer for efficient shared memory management
     - Thread-safe operations with reader synchronization via locks
-    
+
     Key Features:
     - FIFO Eviction: Oldest objects are evicted first when memory is full
     - Reference Counting: Objects are only freed when no readers are
@@ -414,7 +430,7 @@ class SingleWriterShmObjectStorage:
 
     Memory Layout per Object:
     `[4-byte reference_count][metadata_size][serialized_object_data]`
-    
+
     Thread Safety:
     - Writer operations (put, clear) are single-threaded by design
     - Reader operations (get) are thread-safe with lock-based reference
@@ -482,18 +498,17 @@ def copy_to_buffer(
         md_bytes: int,
         data_view: memoryview,
     ) -> None:
-        data_view[self.flag_bytes:self.flag_bytes + md_bytes] = metadata
+        data_view[self.flag_bytes : self.flag_bytes + md_bytes] = metadata
         if isinstance(data, bytes):
             data_view[-data_bytes:] = data
         elif isinstance(data, list):
             start_idx = self.flag_bytes + md_bytes
             for item_bytes in data:
                 item_size = len(item_bytes)
-                data_view[start_idx:start_idx + item_size] = item_bytes
+                data_view[start_idx : start_idx + item_size] = item_bytes
                 start_idx += item_size
         else:
-            raise ValueError(
-                f"Unsupported data type for serialization: {type(data)}")
+            raise ValueError(f"Unsupported data type for serialization: {type(data)}")
 
     def increment_writer_flag(self, id: int) -> None:
         """Set the in-use flag for the writer."""
@@ -509,8 +524,9 @@ def free_unused(self) -> None:
         """Free unused buffers in the ring buffer."""
         # try to free up 2*max_object_size bytes of space in the ring buffer,
         # since the buffer might be fragmented
-        freed_ids = self.ring_buffer.free_buf(self.default_is_free_check,
-                                              2 * self.max_object_size)
+        freed_ids = self.ring_buffer.free_buf(
+            self.default_is_free_check, 2 * self.max_object_size
+        )
         # update the metadata after freeing up space
         for freed_id in freed_ids:
             key_to_free = self.id_index[freed_id]
@@ -537,7 +553,7 @@ def put(self, key: str, value: Any) -> tuple[int, int]:
         Store a key-value pair in the object storage.
         Attempts to free max_object_size bytes using FIFO order
         when the ring buffer runs out of space during a put() operation.
-        
+
         Args:
             key: String key to identify the object
             value: Any serializable Python object
@@ -550,15 +566,17 @@ def put(self, key: str, value: Any) -> tuple[int, int]:
         if key in self.key_index:
             raise ValueError(f"Key '{key}' already exists in the storage.")
 
-        object_data, data_bytes, object_metadata, md_bytes = \
-            self.ser_de.serialize(value)
+        object_data, data_bytes, object_metadata, md_bytes = self.ser_de.serialize(
+            value
+        )
         buffer_size = self.flag_bytes + data_bytes + md_bytes
 
         # Sanity checks
         if buffer_size > self.max_object_size:
             raise ValueError(
                 f"Serialized object size ({buffer_size} bytes) exceeds "
-                f"max object size ({self.max_object_size} bytes)")
+                f"max object size ({self.max_object_size} bytes)"
+            )
 
         # Allocate new buffer
         try:
@@ -570,9 +588,10 @@ def put(self, key: str, value: Any) -> tuple[int, int]:
 
         # Write data to buffer
         with self.ring_buffer.access_buf(address) as (data_view, metadata):
-            data_view[:self.flag_bytes] = self.ring_buffer.int2byte(0)
-            self.copy_to_buffer(object_data, data_bytes, object_metadata,
-                                md_bytes, data_view)
+            data_view[: self.flag_bytes] = self.ring_buffer.int2byte(0)
+            self.copy_to_buffer(
+                object_data, data_bytes, object_metadata, md_bytes, data_view
+            )
         self.increment_writer_flag(monotonic_id)
 
         # Update key index
@@ -587,14 +606,15 @@ def get(self, address: int, monotonic_id: int) -> Any:
             if buf_metadata[0] != monotonic_id:
                 raise ValueError(
                     f"Data for address:id '{address}:{monotonic_id}'"
-                    " has been modified or is invalid.")
+                    " has been modified or is invalid."
+                )
 
-            obj = self.ser_de.deserialize(data_view[self.flag_bytes:])
+            obj = self.ser_de.deserialize(data_view[self.flag_bytes :])
 
             # decrease the in-use flag for reader reads
             if self._reader_lock is not None:
                 with self._reader_lock:
-                    self.increment_reader_flag(data_view[:self.flag_bytes])
+                    self.increment_reader_flag(data_view[: self.flag_bytes])
             else:
                 # if self._reader_lock is None, it means we are the writer
                 # in this case, we do not need to decrease the reader count
@@ -614,7 +634,8 @@ def handle(self):
 
     @staticmethod
     def create_from_handle(
-            handle: ShmObjectStorageHandle) -> "SingleWriterShmObjectStorage":
+        handle: ShmObjectStorageHandle,
+    ) -> "SingleWriterShmObjectStorage":
         logger.debug("Creating storage from handle: %s", handle)
         ring_buffer = SingleWriterShmRingBuffer(*handle.ring_buffer_handle)
         return SingleWriterShmObjectStorage(
diff --git a/vllm/distributed/device_communicators/symm_mem.py b/vllm/distributed/device_communicators/symm_mem.py
index 09012d16978d..88451f9552c1 100644
--- a/vllm/distributed/device_communicators/symm_mem.py
+++ b/vllm/distributed/device_communicators/symm_mem.py
@@ -7,7 +7,8 @@
 from torch.distributed import ProcessGroup
 
 from vllm.distributed.device_communicators.all_reduce_utils import (
-    SYMM_MEM_ALL_REDUCE_MAX_SIZES)
+    SYMM_MEM_ALL_REDUCE_MAX_SIZES,
+)
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 
@@ -28,20 +29,20 @@ class SymmMemCommunicator:
     }
 
     def __init__(
-            self,
-            group: ProcessGroup,
-            device: Union[int, str, torch.device],
-            # add options for testing
-            force_multimem: Optional[bool] = None,
-            max_size_override: Optional[int] = None):
+        self,
+        group: ProcessGroup,
+        device: Union[int, str, torch.device],
+        # add options for testing
+        force_multimem: Optional[bool] = None,
+        max_size_override: Optional[int] = None,
+    ):
         self.disabled = True
 
         if not symm_mem_available:
             return
 
         if not current_platform.is_cuda():
-            logger.warning("SymmMemCommunicator: symmetric "
-                           "memory is not available.")
+            logger.warning("SymmMemCommunicator: symmetric memory is not available.")
             return
         if isinstance(device, int):
             device = torch.device(f"cuda:{device}")
@@ -52,8 +53,9 @@ def __init__(
         self.device = device
         self.group = group
         self.world_size = dist.get_world_size(self.group)
-        self.device_capability = current_platform.get_device_capability(
-        ).as_version_str()
+        self.device_capability = (
+            current_platform.get_device_capability().as_version_str()
+        )
         if self.device_capability not in SYMM_MEM_ALL_REDUCE_MAX_SIZES:
             logger.warning(
                 "SymmMemCommunicator: Device capability %s not supported, "
@@ -61,8 +63,7 @@ def __init__(
                 self.device_capability,
             )
             return
-        if self.world_size not in SYMM_MEM_ALL_REDUCE_MAX_SIZES[
-                self.device_capability]:
+        if self.world_size not in SYMM_MEM_ALL_REDUCE_MAX_SIZES[self.device_capability]:
             logger.warning(
                 "SymmMemCommunicator: World size %d not supported, "
                 "communicator is not available.",
@@ -77,8 +78,9 @@ def __init__(
                 self.max_size,
             )
         else:
-            self.max_size = SYMM_MEM_ALL_REDUCE_MAX_SIZES[
-                self.device_capability][self.world_size]
+            self.max_size = SYMM_MEM_ALL_REDUCE_MAX_SIZES[self.device_capability][
+                self.world_size
+            ]
 
         self.buffer = torch_symm_mem.empty(
             self.max_size // self.dtype.itemsize,
@@ -87,8 +89,10 @@ def __init__(
         )
         handle = torch_symm_mem.rendezvous(self.buffer, self.group.group_name)
         if handle.multicast_ptr == 0:
-            logger.warning("SymmMemCommunicator: symmetric memory "
-                           "multicast operations are not supported.")
+            logger.warning(
+                "SymmMemCommunicator: symmetric memory "
+                "multicast operations are not supported."
+            )
             return
         self.force_multimem = force_multimem
         self.disabled = False
@@ -104,15 +108,13 @@ def should_use_symm_mem(self, inp: torch.Tensor):
         return inp_size < self.max_size
 
     def all_reduce(
-            self,
-            inp: torch.Tensor,
-            *,
-            out: Optional[torch.Tensor] = None) -> Optional[torch.Tensor]:
+        self, inp: torch.Tensor, *, out: Optional[torch.Tensor] = None
+    ) -> Optional[torch.Tensor]:
         if not self.should_use_symm_mem(inp):
             return None
         if out is None:
             out = torch.empty_like(inp)
-        self.buffer[:inp.numel()].copy_(inp.view(-1))
+        self.buffer[: inp.numel()].copy_(inp.view(-1))
 
         # Determine which algorithm to use
         use_multimem = False
@@ -121,16 +123,17 @@ def all_reduce(
             use_multimem = self.force_multimem
         else:
             # Normal logic: use multimem for supported world sizes
-            use_multimem = self.world_size in self._WORLD_SIZES_MULTIMEM[
-                self.device_capability]
+            use_multimem = (
+                self.world_size in self._WORLD_SIZES_MULTIMEM[self.device_capability]
+            )
 
         if use_multimem:
-            torch.ops.symm_mem.multimem_all_reduce_(self.buffer[:inp.numel()],
-                                                    "sum",
-                                                    self.group.group_name)
+            torch.ops.symm_mem.multimem_all_reduce_(
+                self.buffer[: inp.numel()], "sum", self.group.group_name
+            )
         else:
-            torch.ops.symm_mem.two_shot_all_reduce_(self.buffer[:inp.numel()],
-                                                    "sum",
-                                                    self.group.group_name)
-        out.copy_(self.buffer[:inp.numel()].view(out.shape))
+            torch.ops.symm_mem.two_shot_all_reduce_(
+                self.buffer[: inp.numel()], "sum", self.group.group_name
+            )
+        out.copy_(self.buffer[: inp.numel()].view(out.shape))
         return out
diff --git a/vllm/distributed/device_communicators/tpu_communicator.py b/vllm/distributed/device_communicators/tpu_communicator.py
index 942dd67f065d..e0ac9df9a6af 100644
--- a/vllm/distributed/device_communicators/tpu_communicator.py
+++ b/vllm/distributed/device_communicators/tpu_communicator.py
@@ -14,8 +14,9 @@
 
 from .base_device_communicator import DeviceCommunicatorBase
 
-USE_RAY = parallel_config = get_current_vllm_config(
-).parallel_config.distributed_executor_backend == "ray"
+USE_RAY = parallel_config = (
+    get_current_vllm_config().parallel_config.distributed_executor_backend == "ray"
+)
 
 logger = init_logger(__name__)
 
@@ -27,18 +28,21 @@
         import torch_xla.runtime as xr
         from torch_xla._internal import pjrt
         from torch_xla.distributed.xla_multiprocessing import (
-            create_optimized_replica_groups)
+            create_optimized_replica_groups,
+        )
+
         if USE_RAY:
             from vllm.executor import ray_utils
 
 
 class TpuCommunicator(DeviceCommunicatorBase):
-
-    def __init__(self,
-                 cpu_group: ProcessGroup,
-                 device: Optional[torch.device] = None,
-                 device_group: Optional[ProcessGroup] = None,
-                 unique_name: str = ""):
+    def __init__(
+        self,
+        cpu_group: ProcessGroup,
+        device: Optional[torch.device] = None,
+        device_group: Optional[ProcessGroup] = None,
+        unique_name: str = "",
+    ):
         super().__init__(cpu_group, device, device_group, unique_name)
 
         # NOTE(woosuk): When using TP > 1 on TPUs, every TPU on the same node
@@ -98,5 +102,7 @@ def all_gather(self, input_: torch.Tensor, dim: int = -1) -> torch.Tensor:
 
 if USE_TPU_COMMONS:
     from tpu_commons.distributed.device_communicators import (
-        TpuCommunicator as TpuCommonsCommunicator)
+        TpuCommunicator as TpuCommonsCommunicator,
+    )
+
     TpuCommunicator = TpuCommonsCommunicator  # type: ignore
diff --git a/vllm/distributed/device_communicators/xpu_communicator.py b/vllm/distributed/device_communicators/xpu_communicator.py
index 27bd176554af..33d5b2cf1d87 100644
--- a/vllm/distributed/device_communicators/xpu_communicator.py
+++ b/vllm/distributed/device_communicators/xpu_communicator.py
@@ -16,12 +16,13 @@
 
 
 class XpuCommunicator(DeviceCommunicatorBase):
-
-    def __init__(self,
-                 cpu_group: ProcessGroup,
-                 device: Optional[torch.device] = None,
-                 device_group: Optional[ProcessGroup] = None,
-                 unique_name: str = ""):
+    def __init__(
+        self,
+        cpu_group: ProcessGroup,
+        device: Optional[torch.device] = None,
+        device_group: Optional[ProcessGroup] = None,
+        unique_name: str = "",
+    ):
         super().__init__(cpu_group, device, device_group, unique_name)
         if self.use_all2all:
             all2all_backend = envs.VLLM_ALL2ALL_BACKEND
@@ -29,10 +30,12 @@ def __init__(self,
                 logger.warning(
                     "`%s` all2all manager is not supported on XPU."
                     "Falling back to `naive` all2all manager for XPU.",
-                    all2all_backend)
+                    all2all_backend,
+                )
                 all2all_backend = "naive"
             if all2all_backend == "naive":
                 from .all2all import NaiveAll2AllManager
+
                 self.all2all_manager = NaiveAll2AllManager(self.cpu_group)
                 logger.info("Using naive all2all manager.")
 
@@ -40,12 +43,12 @@ def all_reduce(self, input_) -> torch.Tensor:
         dist.all_reduce(input_, group=self.device_group)
         return input_
 
-    def gather(self,
-               input_: torch.Tensor,
-               dst: int = 0,
-               dim: int = -1) -> Optional[torch.Tensor]:
+    def gather(
+        self, input_: torch.Tensor, dst: int = 0, dim: int = -1
+    ) -> Optional[torch.Tensor]:
         assert -input_.dim() <= dim < input_.dim(), (
-            f"Invalid dim ({dim}) for input tensor with shape {input_.size()}")
+            f"Invalid dim ({dim}) for input tensor with shape {input_.size()}"
+        )
         if dim < 0:
             # Convert negative dim to positive.
             dim += input_.dim()
@@ -53,20 +56,19 @@ def gather(self,
         # cluster so we use all_gather instead for now.
         input_size = input_.size()
         # Allocate output tensor.
-        output_tensor = torch.empty((self.world_size, ) + input_size,
-                                    dtype=input_.dtype,
-                                    device=input_.device)
+        output_tensor = torch.empty(
+            (self.world_size,) + input_size, dtype=input_.dtype, device=input_.device
+        )
         # All-gather.
-        dist.all_gather_into_tensor(output_tensor,
-                                    input_,
-                                    group=self.device_group)
+        dist.all_gather_into_tensor(output_tensor, input_, group=self.device_group)
         if self.rank_in_group == dst:
             # Reshape
             output_tensor = output_tensor.movedim(0, dim)
-            output_tensor = output_tensor.reshape(input_size[:dim] +
-                                                  (self.world_size *
-                                                   input_size[dim], ) +
-                                                  input_size[dim + 1:])
+            output_tensor = output_tensor.reshape(
+                input_size[:dim]
+                + (self.world_size * input_size[dim],)
+                + input_size[dim + 1 :]
+            )
         else:
             output_tensor = None
         return output_tensor
@@ -78,17 +80,19 @@ def dispatch(
         self,
         hidden_states: torch.Tensor,
         router_logits: torch.Tensor,
-        is_sequence_parallel: bool = False
+        is_sequence_parallel: bool = False,
     ) -> tuple[torch.Tensor, torch.Tensor]:
         assert self.all2all_manager is not None
         hidden_states, router_logits = self.all2all_manager.dispatch(
-            hidden_states, router_logits, is_sequence_parallel)
+            hidden_states, router_logits, is_sequence_parallel
+        )
         return hidden_states, router_logits
 
-    def combine(self,
-                hidden_states: torch.Tensor,
-                is_sequence_parallel: bool = False) -> torch.Tensor:
+    def combine(
+        self, hidden_states: torch.Tensor, is_sequence_parallel: bool = False
+    ) -> torch.Tensor:
         assert self.all2all_manager is not None
-        hidden_states = self.all2all_manager.combine(hidden_states,
-                                                     is_sequence_parallel)
+        hidden_states = self.all2all_manager.combine(
+            hidden_states, is_sequence_parallel
+        )
         return hidden_states
diff --git a/vllm/distributed/eplb/__init__.py b/vllm/distributed/eplb/__init__.py
index 80511024b930..4cd51dd384ad 100644
--- a/vllm/distributed/eplb/__init__.py
+++ b/vllm/distributed/eplb/__init__.py
@@ -1,8 +1,8 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-'''
+"""
 Expert parallelism load balancer (EPLB).
-'''
+"""
 
 from .eplb_state import *
 from .rebalance_algo import *
diff --git a/vllm/distributed/eplb/eplb_state.py b/vllm/distributed/eplb/eplb_state.py
index 3e318d784832..663f04027046 100644
--- a/vllm/distributed/eplb/eplb_state.py
+++ b/vllm/distributed/eplb/eplb_state.py
@@ -35,8 +35,11 @@
 from torch.distributed import ProcessGroup, all_reduce
 
 from vllm.config import ParallelConfig
-from vllm.distributed.parallel_state import (get_ep_group, get_node_count,
-                                             in_the_same_node_as)
+from vllm.distributed.parallel_state import (
+    get_ep_group,
+    get_node_count,
+    in_the_same_node_as,
+)
 from vllm.distributed.utils import StatelessProcessGroup
 from vllm.logger import init_logger
 from vllm.model_executor.models.interfaces import MixtureOfExperts
@@ -190,11 +193,10 @@ def build(
         """
         Build the initial EPLB state.
         """
-        physical_to_logical_map_list = (
-            cls.build_initial_global_physical_to_logical_map(
-                model.num_routed_experts,
-                model.num_redundant_experts,
-            ))
+        physical_to_logical_map_list = cls.build_initial_global_physical_to_logical_map(
+            model.num_routed_experts,
+            model.num_redundant_experts,
+        )
         physical_to_logical_map = torch.tensor(
             physical_to_logical_map_list,
             device=device,
@@ -205,7 +207,8 @@ def build(
         MAX_EXPERT_REDUNDANCY = 1023
         assert model.num_redundant_experts <= MAX_EXPERT_REDUNDANCY, (
             f"num_redundant_experts {model.num_redundant_experts} "
-            f"must be less than or equal to {MAX_EXPERT_REDUNDANCY}")
+            f"must be less than or equal to {MAX_EXPERT_REDUNDANCY}"
+        )
         max_slots_per_logical_expert = MAX_EXPERT_REDUNDANCY + 1
         logical_to_physical_map = torch.full(
             (model.num_logical_experts, max_slots_per_logical_expert),
@@ -213,31 +216,42 @@ def build(
             device=device,
         )
         logical_replica_count = torch.zeros(
-            (model.num_logical_experts, ),
+            (model.num_logical_experts,),
             device=device,
             dtype=torch.long,
         )
 
         for i in range(model.num_physical_experts):
             logical_idx = physical_to_logical_map[i]
-            logical_to_physical_map[logical_idx,
-                                    logical_replica_count[logical_idx]] = i
+            logical_to_physical_map[logical_idx, logical_replica_count[logical_idx]] = i
             logical_replica_count[logical_idx] += 1
 
         # Duplicate initial mapping for all layers
-        physical_to_logical_map = physical_to_logical_map.unsqueeze(0).expand(
-            model.num_moe_layers,
-            -1,
-        ).contiguous()
-        logical_to_physical_map = logical_to_physical_map.unsqueeze(0).expand(
-            model.num_moe_layers,
-            -1,
-            -1,
-        ).contiguous()
-        logical_replica_count = logical_replica_count.unsqueeze(0).expand(
-            model.num_moe_layers,
-            -1,
-        ).contiguous()
+        physical_to_logical_map = (
+            physical_to_logical_map.unsqueeze(0)
+            .expand(
+                model.num_moe_layers,
+                -1,
+            )
+            .contiguous()
+        )
+        logical_to_physical_map = (
+            logical_to_physical_map.unsqueeze(0)
+            .expand(
+                model.num_moe_layers,
+                -1,
+                -1,
+            )
+            .contiguous()
+        )
+        logical_replica_count = (
+            logical_replica_count.unsqueeze(0)
+            .expand(
+                model.num_moe_layers,
+                -1,
+            )
+            .contiguous()
+        )
 
         expert_load_pass = torch.zeros(
             (model.num_moe_layers, model.num_physical_experts),
@@ -246,21 +260,21 @@ def build(
         )
         expert_load_window_size = parallel_config.eplb_config.window_size
         expert_load_window = torch.zeros(
-            (expert_load_window_size, model.num_moe_layers,
-             model.num_physical_experts),
+            (expert_load_window_size, model.num_moe_layers, model.num_physical_experts),
             dtype=torch.int32,
             device=device,
         )
 
         # Set the initial progress of rearrangement to 3/4
         eplb_step_interval = parallel_config.eplb_config.step_interval
-        expert_rearrangement_step = max(
-            0, eplb_step_interval - eplb_step_interval // 4)
+        expert_rearrangement_step = max(0, eplb_step_interval - eplb_step_interval // 4)
 
         if global_expert_load is not None:
             ep_group = get_ep_group().device_group
-            assert global_expert_load.shape == (model.num_moe_layers,
-                                                model.num_logical_experts)
+            assert global_expert_load.shape == (
+                model.num_moe_layers,
+                model.num_logical_experts,
+            )
             assert global_expert_load.dtype == torch.int64
 
             num_replicas = model.num_physical_experts
@@ -273,20 +287,21 @@ def build(
                 logger.warning_once(
                     f"num_gpus % num_nodes != 0, "
                     "not using hierarchical rearrangement algorithm.\n"
-                    f"{num_gpus=}, {num_nodes=}")
+                    f"{num_gpus=}, {num_nodes=}"
+                )
 
             # Get new expert mappings
             (
                 new_physical_to_logical_map,
                 new_logical_to_physical_map,
                 new_logical_replica_count,
-            ) = (rebalance_experts(
+            ) = rebalance_experts(
                 global_expert_load,
                 num_replicas,
                 num_groups,
                 num_nodes,
                 num_gpus,
-            ))
+            )
 
             max_physical_slots = new_logical_to_physical_map.shape[-1]
             assert max_physical_slots <= logical_to_physical_map.shape[-1]
@@ -326,11 +341,13 @@ def build(
             expert_rearrangement_step_interval=eplb_step_interval,
         )
 
-    def step(self,
-             model: MixtureOfExperts,
-             is_dummy: bool = False,
-             is_profile: bool = False,
-             log_stats: bool = False) -> None:
+    def step(
+        self,
+        model: MixtureOfExperts,
+        is_dummy: bool = False,
+        is_profile: bool = False,
+        log_stats: bool = False,
+    ) -> None:
         """
         Step the EPLB state.
 
@@ -369,32 +386,40 @@ def step(self,
             all_reduce(total_expert_load_pass, group=ep_group)
 
             # num_tokens_per_rank: (num_moe_layers, num_ranks)
-            num_tokens_per_rank = total_expert_load_pass.reshape(
-                total_expert_load_pass.shape[0], ep_group.size(),
-                -1).sum(dim=-1).float()
+            num_tokens_per_rank = (
+                total_expert_load_pass.reshape(
+                    total_expert_load_pass.shape[0], ep_group.size(), -1
+                )
+                .sum(dim=-1)
+                .float()
+            )
 
             # Compute balancedness ratio:
             # for each layer:
             #   (mean load across ranks) / (max load across ranks)
             avg_tokens_tensor = num_tokens_per_rank.mean(dim=0).sum(dim=0)
-            max_tokens_tensor = num_tokens_per_rank.max(dim=0).values.sum(
-                dim=0)
+            max_tokens_tensor = num_tokens_per_rank.max(dim=0).values.sum(dim=0)
 
             # Just to make type checker happy
             tokens_tensors: list[float] = torch.stack(
-                [avg_tokens_tensor, max_tokens_tensor]).tolist()
+                [avg_tokens_tensor, max_tokens_tensor]
+            ).tolist()
             avg_tokens, max_tokens = tokens_tensors
             balancedness = avg_tokens / max_tokens if max_tokens > 0 else 0.0
 
             if ep_group.rank() == 0:
                 logger.info(
-                    "EPLB step: avg_tokens=%.2f, max_tokens=%d, "
-                    "balancedness=%.4f", avg_tokens, max_tokens, balancedness)
+                    "EPLB step: avg_tokens=%.2f, max_tokens=%d, balancedness=%.4f",
+                    avg_tokens,
+                    max_tokens,
+                    balancedness,
+                )
 
         # Update the expert load sliding window
         if not is_dummy:
             self.expert_load_window[self.expert_load_window_step] = (
-                self.expert_load_pass.clone())
+                self.expert_load_pass.clone()
+            )
             self.expert_load_window_step += 1
             if self.expert_load_window_step >= self.expert_load_window_size:
                 self.expert_load_window_step = 0
@@ -405,8 +430,7 @@ def step(self,
         # rearrangement step and perform rearrangement to ensure all ranks are
         # performing collective communication.
         self.expert_rearrangement_step += 1
-        if (self.expert_rearrangement_step
-                >= self.expert_rearrangement_step_interval):
+        if self.expert_rearrangement_step >= self.expert_rearrangement_step_interval:
             self.expert_rearrangement_step = 0
             self.rearrange(model)
 
@@ -416,8 +440,8 @@ def rearrange(
         is_profile: bool = False,
         execute_shuffle: bool = True,
         global_expert_load: Optional[torch.Tensor] = None,
-        rank_mapping: Optional[dict[int,
-                                    int]] = None) -> Optional[torch.Tensor]:
+        rank_mapping: Optional[dict[int, int]] = None,
+    ) -> Optional[torch.Tensor]:
         """
         Rearrange the experts according to the current load.
         """
@@ -430,8 +454,7 @@ def rearrange(
         if is_main_rank:
             torch.cuda.synchronize()
             time_start = time.perf_counter()
-            logger.info("Rearranging experts %s...",
-                        "(profile)" if is_profile else "")
+            logger.info("Rearranging experts %s...", "(profile)" if is_profile else "")
 
         if global_expert_load is None:
             # Map the physical expert load to global logical experts
@@ -444,23 +467,25 @@ def rearrange(
             )
             logical_expert_load_window.scatter_add_(
                 dim=-1,
-                index=self.physical_to_logical_map.unsqueeze(0).expand_as(
-                    self.expert_load_window).long(),
+                index=self.physical_to_logical_map.unsqueeze(0)
+                .expand_as(self.expert_load_window)
+                .long(),
                 src=self.expert_load_window,
             )
 
             if not execute_shuffle:
                 metadata = torch.tensor(
                     [
-                        model.num_moe_layers, model.num_logical_experts,
-                        self.physical_to_logical_map.shape[1]
+                        model.num_moe_layers,
+                        model.num_logical_experts,
+                        self.physical_to_logical_map.shape[1],
                     ],
                     dtype=torch.int32,
                     device="cpu",
                 )
-                torch.distributed.broadcast(metadata,
-                                            group=get_ep_group().cpu_group,
-                                            group_src=0)
+                torch.distributed.broadcast(
+                    metadata, group=get_ep_group().cpu_group, group_src=0
+                )
 
             # Perform all-reduce to get the expert load across all ranks
             global_expert_load_window = logical_expert_load_window.sum(dim=0)
@@ -469,9 +494,9 @@ def rearrange(
             if not execute_shuffle:
                 # (num_moe_layers, old_num_physical_experts)
                 old_global_expert_indices = self.physical_to_logical_map
-                torch.distributed.broadcast(old_global_expert_indices,
-                                            group=ep_group,
-                                            group_src=0)
+                torch.distributed.broadcast(
+                    old_global_expert_indices, group=ep_group, group_src=0
+                )
                 return global_expert_load_window
         else:
             assert execute_shuffle
@@ -486,10 +511,10 @@ def rearrange(
             # the GPUs to be released.
             cpu_group = get_ep_group().cpu_group
             num_nodes = _node_count_with_rank_mapping(cpu_group, rank_mapping)
-            num_gpus = sum(new_rank != -1
-                           for new_rank in rank_mapping.values())
-            num_replicas = num_replicas // ep_group.size(
-            ) * num_gpus  # handle num replicas change
+            num_gpus = sum(new_rank != -1 for new_rank in rank_mapping.values())
+            num_replicas = (
+                num_replicas // ep_group.size() * num_gpus
+            )  # handle num replicas change
         else:
             num_nodes = get_node_count()
             num_gpus = ep_group.size()
@@ -499,20 +524,21 @@ def rearrange(
             logger.warning_once(
                 f"num_gpus % num_nodes != 0, "
                 "not using hierarchical rearrangement algorithm.\n"
-                f"{num_gpus=}, {num_nodes=}")
+                f"{num_gpus=}, {num_nodes=}"
+            )
 
         # Get new expert mappings
         (
             new_physical_to_logical_map,
             new_logical_to_physical_map,
             new_logical_replica_count,
-        ) = (rebalance_experts(
+        ) = rebalance_experts(
             global_expert_load_window,
             num_replicas,
             num_groups,
             num_nodes,
             num_gpus,
-        ))
+        )
 
         # Update expert weights
         rearrange_expert_weights_inplace(
@@ -525,18 +551,20 @@ def rearrange(
         )
 
         if not is_profile:
-            if self.physical_to_logical_map.shape[
-                    1] != new_physical_to_logical_map.shape[1]:
+            if (
+                self.physical_to_logical_map.shape[1]
+                != new_physical_to_logical_map.shape[1]
+            ):
                 self.physical_to_logical_map = new_physical_to_logical_map.to(
-                    self.physical_to_logical_map.device)
+                    self.physical_to_logical_map.device
+                )
             else:
                 self.physical_to_logical_map.copy_(new_physical_to_logical_map)
             max_physical_slots = new_logical_to_physical_map.shape[-1]
             assert max_physical_slots <= self.logical_to_physical_map.shape[-1]
             new_logical_to_physical_map = torch.nn.functional.pad(
                 new_logical_to_physical_map,
-                (0,
-                 self.logical_to_physical_map.shape[-1] - max_physical_slots),
+                (0, self.logical_to_physical_map.shape[-1] - max_physical_slots),
                 value=-1,
             )
             self.logical_to_physical_map.copy_(new_logical_to_physical_map)
@@ -560,11 +588,10 @@ def recv_state() -> tuple[torch.Tensor, torch.Tensor]:
         """
         ep_group = get_ep_group()
         metadata = torch.empty(3, dtype=torch.int32, device="cpu")
-        torch.distributed.broadcast(metadata,
-                                    group=ep_group.cpu_group,
-                                    group_src=0)
+        torch.distributed.broadcast(metadata, group=ep_group.cpu_group, group_src=0)
         num_moe_layers, num_logical_experts, num_old_physical_experts = (
-            metadata.tolist())
+            metadata.tolist()
+        )
         global_expert_load = torch.zeros(
             (num_moe_layers, num_logical_experts),
             dtype=torch.int64,
@@ -576,9 +603,9 @@ def recv_state() -> tuple[torch.Tensor, torch.Tensor]:
             dtype=torch.int64,
             device=ep_group.device,
         )
-        torch.distributed.broadcast(old_global_expert_indices,
-                                    group=ep_group.device_group,
-                                    group_src=0)
+        torch.distributed.broadcast(
+            old_global_expert_indices, group=ep_group.device_group, group_src=0
+        )
 
         return global_expert_load, old_global_expert_indices
 
diff --git a/vllm/distributed/eplb/rebalance_algo.py b/vllm/distributed/eplb/rebalance_algo.py
index fc43dbe3b653..c9d30d6481ab 100644
--- a/vllm/distributed/eplb/rebalance_algo.py
+++ b/vllm/distributed/eplb/rebalance_algo.py
@@ -15,8 +15,9 @@
 import torch
 
 
-def balanced_packing(weight: torch.Tensor,
-                     num_packs: int) -> tuple[torch.Tensor, torch.Tensor]:
+def balanced_packing(
+    weight: torch.Tensor, num_packs: int
+) -> tuple[torch.Tensor, torch.Tensor]:
     """
     Pack n weighted objects to m packs, such that each bin contains exactly
     n/m objects and the weights of all packs are as balanced as possible.
@@ -34,25 +35,21 @@ def balanced_packing(weight: torch.Tensor,
     groups_per_pack = num_groups // num_packs
 
     if groups_per_pack == 1:
-        pack_index = torch.arange(weight.size(-1),
-                                  dtype=torch.int64,
-                                  device=weight.device).expand(weight.shape)
+        pack_index = torch.arange(
+            weight.size(-1), dtype=torch.int64, device=weight.device
+        ).expand(weight.shape)
         rank_in_pack = torch.zeros_like(weight, dtype=torch.int64)
         return pack_index, rank_in_pack
 
     indices = weight.float().sort(-1, descending=True).indices.cpu()
-    pack_index = torch.full_like(weight,
-                                 fill_value=-1,
-                                 dtype=torch.int64,
-                                 device="cpu")
+    pack_index = torch.full_like(weight, fill_value=-1, dtype=torch.int64, device="cpu")
     rank_in_pack = torch.full_like(pack_index, fill_value=-1)
     for i in range(num_layers):
         pack_weights = [0] * num_packs
         pack_items = [0] * num_packs
         for group in indices[i]:
             pack = min(
-                (i
-                 for i in range(num_packs) if pack_items[i] < groups_per_pack),
+                (i for i in range(num_packs) if pack_items[i] < groups_per_pack),
                 key=pack_weights.__getitem__,
             )
             assert pack_items[pack] < groups_per_pack
@@ -64,8 +61,8 @@ def balanced_packing(weight: torch.Tensor,
 
 
 def replicate_experts(
-        weight: torch.Tensor,
-        num_phy: int) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
+    weight: torch.Tensor, num_phy: int
+) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
     """
     Replicate `num_log` experts to `num_phy` replicas, such that the maximum
     load of all replicas is minimized.
@@ -83,8 +80,7 @@ def replicate_experts(
     num_redundant = num_phy - num_log
     assert num_redundant >= 0
     device = weight.device
-    phy2log = torch.arange(num_phy, dtype=torch.int64,
-                           device=device).repeat(n, 1)
+    phy2log = torch.arange(num_phy, dtype=torch.int64, device=device).repeat(n, 1)
     rank = torch.zeros(n, num_phy, dtype=torch.int64, device=device)
     logcnt = torch.ones(n, num_log, dtype=torch.int64, device=device)
     arangen = torch.arange(n, dtype=torch.int64, device=device)
@@ -108,7 +104,7 @@ def rebalance_experts_hierarchical(
         weight: [num_moe_layers, num_logical_experts]
         num_physical_experts: number of physical experts after replication
         num_groups: number of expert groups
-        num_nodes: number of server nodes, where the intra-node network 
+        num_nodes: number of server nodes, where the intra-node network
             (e.g., NVLink) is faster
         num_gpus: number of GPUs, must be a multiple of `num_nodes`
 
@@ -134,45 +130,51 @@ def inverse(perm: torch.Tensor) -> torch.Tensor:
         inv.scatter_(
             1,
             perm,
-            torch.arange(perm.size(1), dtype=torch.int64,
-                         device=perm.device).expand(perm.shape),
+            torch.arange(perm.size(1), dtype=torch.int64, device=perm.device).expand(
+                perm.shape
+            ),
         )
         return inv
 
     # Step 1: pack groups to nodes
     tokens_per_group = weight.unflatten(-1, (num_groups, group_size)).sum(-1)
-    group_pack_index, group_rank_in_pack = balanced_packing(
-        tokens_per_group, num_nodes)
-    log2mlog = (((group_pack_index * groups_per_node + group_rank_in_pack) *
-                 group_size).unsqueeze(-1) +
-                torch.arange(group_size,
-                             dtype=torch.int64,
-                             device=group_pack_index.device)).flatten(-2)
+    group_pack_index, group_rank_in_pack = balanced_packing(tokens_per_group, num_nodes)
+    log2mlog = (
+        (
+            (group_pack_index * groups_per_node + group_rank_in_pack) * group_size
+        ).unsqueeze(-1)
+        + torch.arange(group_size, dtype=torch.int64, device=group_pack_index.device)
+    ).flatten(-2)
     mlog2log = inverse(log2mlog)
 
     # Step 2: construct redundant experts within nodes
     # [num_layers * num_nodes, num_logical_experts // num_nodes]
     tokens_per_mlog = weight.gather(-1, mlog2log).view(
-        -1, num_logical_experts // num_nodes)
+        -1, num_logical_experts // num_nodes
+    )
     phy2mlog, phyrank, mlogcnt = replicate_experts(
-        tokens_per_mlog, num_physical_experts // num_nodes)
+        tokens_per_mlog, num_physical_experts // num_nodes
+    )
 
     # Step 3: pack physical_experts to GPUs
     # [num_layers * num_nodes, num_physical_experts // num_nodes]
     tokens_per_phy = (tokens_per_mlog / mlogcnt).gather(-1, phy2mlog)
-    pack_index, rank_in_pack = balanced_packing(tokens_per_phy,
-                                                num_gpus // num_nodes)
+    pack_index, rank_in_pack = balanced_packing(tokens_per_phy, num_gpus // num_nodes)
     phy2pphy = pack_index * phy_experts_per_gpu + rank_in_pack
     pphy2phy = inverse(phy2pphy)
 
     pphy2mlog = phy2mlog.gather(
-        -1, pphy2phy)  # [num_layers * num_nodes, num_log_per_nodes]
-    pphy2mlog = (pphy2mlog.view(num_layers, num_nodes, -1) + torch.arange(
-        0,
-        num_logical_experts,
-        num_logical_experts // num_nodes,
-        device=group_pack_index.device,
-    ).view(1, -1, 1)).flatten(-2)
+        -1, pphy2phy
+    )  # [num_layers * num_nodes, num_log_per_nodes]
+    pphy2mlog = (
+        pphy2mlog.view(num_layers, num_nodes, -1)
+        + torch.arange(
+            0,
+            num_logical_experts,
+            num_logical_experts // num_nodes,
+            device=group_pack_index.device,
+        ).view(1, -1, 1)
+    ).flatten(-2)
     pphy2log = mlog2log.gather(-1, pphy2mlog)
     pphyrank = phyrank.gather(-1, pphy2phy).view(num_layers, -1)
     logcnt = mlogcnt.view(num_layers, -1).gather(-1, log2mlog)
@@ -214,11 +216,13 @@ def rebalance_experts(
     if num_groups % num_nodes == 0:
         # use hierarchical load-balance policy
         phy2log, phyrank, logcnt = rebalance_experts_hierarchical(
-            weight, num_replicas, num_groups, num_nodes, num_gpus)
+            weight, num_replicas, num_groups, num_nodes, num_gpus
+        )
     else:
         # use global load-balance policy
         phy2log, phyrank, logcnt = rebalance_experts_hierarchical(
-            weight, num_replicas, 1, 1, num_gpus)
+            weight, num_replicas, 1, 1, num_gpus
+        )
     num_redundant_experts = num_replicas - num_logical_experts
     maxlogcnt = num_redundant_experts + 1
     log2phy: torch.Tensor = torch.full(
@@ -230,8 +234,9 @@ def rebalance_experts(
     log2phy.view(num_layers, -1).scatter_(
         -1,
         phy2log * maxlogcnt + phyrank,
-        torch.arange(num_replicas, dtype=torch.int64,
-                     device=log2phy.device).expand(num_layers, -1),
+        torch.arange(num_replicas, dtype=torch.int64, device=log2phy.device).expand(
+            num_layers, -1
+        ),
     )
     return phy2log, log2phy, logcnt
 
diff --git a/vllm/distributed/eplb/rebalance_execute.py b/vllm/distributed/eplb/rebalance_execute.py
index f8a7d1170bb0..344fae457c9b 100644
--- a/vllm/distributed/eplb/rebalance_execute.py
+++ b/vllm/distributed/eplb/rebalance_execute.py
@@ -11,8 +11,13 @@
 from typing import Optional
 
 import torch
-from torch.distributed import (P2POp, ProcessGroup, all_gather,
-                               batch_isend_irecv, get_global_rank)
+from torch.distributed import (
+    P2POp,
+    ProcessGroup,
+    all_gather,
+    batch_isend_irecv,
+    get_global_rank,
+)
 
 
 def idx_local_to_global(
@@ -132,8 +137,7 @@ def shuffle_layer(
                 continue
             if old_indices[src_global] == new_indices[dst_global]:
                 is_received_locally[dst] = True
-                for weight, buffer in zip(expert_weights,
-                                          expert_weights_buffer):
+                for weight, buffer in zip(expert_weights, expert_weights_buffer):
                     buffer[dst].copy_(weight[src])
 
     p2p_ops: list[P2POp] = []
@@ -177,7 +181,8 @@ def shuffle_layer(
                     torch.distributed.isend,
                     weight[src],
                     dst_global,
-                ) for weight in expert_weights
+                )
+                for weight in expert_weights
             ]
 
     # 3. Initiate receiving of weights.
@@ -216,7 +221,8 @@ def shuffle_layer(
                 torch.distributed.irecv,
                 weight[dst],
                 src_global,
-            ) for weight in expert_weights_buffer
+            )
+            for weight in expert_weights_buffer
         ]
 
     # 4. Execute the P2P operations. The real communication happens here.
@@ -271,29 +277,25 @@ def rearrange_expert_weights_inplace(
     if rank_mapping is not None:
         if len(rank_mapping) == ep_group.size():
             # scale down
-            new_global_expert_indices = \
-                _map_new_expert_indices_with_rank_mapping(
+            new_global_expert_indices = _map_new_expert_indices_with_rank_mapping(
                 new_global_expert_indices,
                 rank_mapping,
             )
         else:
             # scale up
-            old_global_expert_indices = \
-                _map_old_expert_indices_with_rank_mapping(
+            old_global_expert_indices = _map_old_expert_indices_with_rank_mapping(
                 old_global_expert_indices,
                 rank_mapping,
                 ep_group.size(),
             )
 
-    assert old_global_expert_indices.shape[
-        1] == new_global_expert_indices.shape[1]
+    assert old_global_expert_indices.shape[1] == new_global_expert_indices.shape[1]
 
     num_moe_layers, num_physical_experts = old_global_expert_indices.shape
     assert len(expert_weights) == num_moe_layers
 
     num_local_physical_experts = next(iter(expert_weights[0])).shape[0]
-    assert new_global_expert_indices.shape == (num_moe_layers,
-                                               num_physical_experts)
+    assert new_global_expert_indices.shape == (num_moe_layers, num_physical_experts)
 
     ep_rank = ep_group.rank()
     ep_size = ep_group.size()
@@ -342,13 +344,13 @@ def _map_old_expert_indices_with_rank_mapping(
 ) -> torch.Tensor:
     """
     Map the old global expert indices to the new global expert indices.
-    
+
     Args:
         old_global_expert_indices:
             Shape (num_layers, old_ep_size * num_local_physical_experts).
         rank_mapping: Mapping from old rank to new rank.
         new_ep_size: New expert parallelism size.
-    
+
     Returns:
         Mapped expert indices with shape
         (num_layers, new_ep_size * num_local_physical_experts).
@@ -379,8 +381,9 @@ def _map_old_expert_indices_with_rank_mapping(
             new_start_idx = new_rank * num_local_physical_experts
             new_end_idx = (new_rank + 1) * num_local_physical_experts
 
-            mapped_expert_indices[:, new_start_idx:new_end_idx] = \
+            mapped_expert_indices[:, new_start_idx:new_end_idx] = (
                 old_global_expert_indices[:, old_start_idx:old_end_idx]
+            )
         # If new_rank is None or >= new_ep_size, the experts remain -1
         # (scale down case)
 
@@ -415,8 +418,9 @@ def _map_new_expert_indices_with_rank_mapping(
             new_start_idx = new_rank * num_local_physical_experts
             new_end_idx = (new_rank + 1) * num_local_physical_experts
 
-            mapped_expert_indices[:, old_start_idx:old_end_idx] = \
+            mapped_expert_indices[:, old_start_idx:old_end_idx] = (
                 new_global_expert_indices[:, new_start_idx:new_end_idx]
+            )
 
     return mapped_expert_indices
 
diff --git a/vllm/distributed/kv_events.py b/vllm/distributed/kv_events.py
index 46f0cd9289b2..d93ae63e0eb4 100644
--- a/vllm/distributed/kv_events.py
+++ b/vllm/distributed/kv_events.py
@@ -22,10 +22,10 @@
 
 
 class EventBatch(
-        msgspec.Struct,
-        array_like=True,  # type: ignore[call-arg]
-        omit_defaults=True,  # type: ignore[call-arg]
-        gc=False,  # type: ignore[call-arg]
+    msgspec.Struct,
+    array_like=True,  # type: ignore[call-arg]
+    omit_defaults=True,  # type: ignore[call-arg]
+    gc=False,  # type: ignore[call-arg]
 ):
     ts: float
     events: list[Any]
@@ -33,11 +33,12 @@ class EventBatch(
 
 
 class KVCacheEvent(
-        msgspec.Struct,
-        array_like=True,  # type: ignore[call-arg]
-        omit_defaults=True,  # type: ignore[call-arg]
-        gc=False,  # type: ignore[call-arg]
-        tag=True):
+    msgspec.Struct,
+    array_like=True,  # type: ignore[call-arg]
+    omit_defaults=True,  # type: ignore[call-arg]
+    gc=False,  # type: ignore[call-arg]
+    tag=True,
+):
     """Base class for all KV cache-related events"""
 
 
@@ -69,14 +70,14 @@ class KVEventBatch(EventBatch):
 class EventPublisher(ABC):
     """Lightweight publisher for EventBatch batches with data parallelism
     support.
-    
+
     In data parallel setups, each DP rank runs its own EventPublisher instance
     to avoid duplicate events and ensure proper event attribution:
-    
+
     - Each DP rank creates a separate publisher
     - Publishers automatically annotate events with their data_parallel_rank
     - This allows consumers to distinguish events from different DP ranks
-    
+
     The publisher is responsible for adding DP metadata since the scheduler
     operates independently of DP topology and shouldn't need DP awareness.
     """
@@ -130,6 +131,7 @@ class ZmqEventPublisher(EventPublisher):
     topic:
         Topic to publish events to.
     """
+
     SHUTDOWN_TIMEOUT: float = 1.0
     END_SEQ = (-1).to_bytes(8, "big", signed=True)
 
@@ -156,21 +158,22 @@ def __init__(
 
         self._endpoint = self.offset_endpoint_port(endpoint, self._dp_rank)
         self._replay_endpoint = self.offset_endpoint_port(
-            replay_endpoint, self._dp_rank)
+            replay_endpoint, self._dp_rank
+        )
         self._hwm = hwm
         self._socket_setup()
 
         # Payload
         self._seq_gen = count()
-        self._topic_bytes = topic.encode('utf-8')
+        self._topic_bytes = topic.encode("utf-8")
 
         # Thread
         self._running = True
         logger.info("Starting ZMQ publisher thread")
 
-        self._thread = threading.Thread(target=self._publisher_thread,
-                                        daemon=True,
-                                        name="zmq-publisher")
+        self._thread = threading.Thread(
+            target=self._publisher_thread, daemon=True, name="zmq-publisher"
+        )
         self._thread.start()
 
     def publish(self, events: EventBatch) -> None:
@@ -220,10 +223,12 @@ def _socket_setup(self) -> None:
             self._pub.set_hwm(self._hwm)
             # Heuristic: bind if wildcard / * present, else connect.
             # bind stable, connect volatile convention
-            if (self._endpoint is not None
-                    and ("*" in self._endpoint or "::" in self._endpoint
-                         or self._endpoint.startswith("ipc://")
-                         or self._endpoint.startswith("inproc://"))):
+            if self._endpoint is not None and (
+                "*" in self._endpoint
+                or "::" in self._endpoint
+                or self._endpoint.startswith("ipc://")
+                or self._endpoint.startswith("inproc://")
+            ):
                 self._pub.bind(self._endpoint)
             elif self._endpoint is not None:
                 self._pub.connect(self._endpoint)
@@ -263,8 +268,7 @@ def _publisher_thread(self) -> None:
 
                 payload = self._pack.encode(event)
                 seq_bytes = seq.to_bytes(8, "big")
-                self._pub.send_multipart(
-                    (self._topic_bytes, seq_bytes, payload))
+                self._pub.send_multipart((self._topic_bytes, seq_bytes, payload))
 
                 self._buffer.append((seq, payload))
                 self._event_queue.task_done()
@@ -291,24 +295,26 @@ def _service_replay(self) -> None:
                 # (identity, empty_delim) are stripped off by the router
                 # receiving payload is (seq_bytes, payload)
                 self._replay.send_multipart(
-                    (client_id, b"", seq.to_bytes(8, "big"), buf))
+                    (client_id, b"", seq.to_bytes(8, "big"), buf)
+                )
         # Send end of sequence marker
         # receiving payload is (-1, b""")
         self._replay.send_multipart((client_id, b"", self.END_SEQ, b""))
 
     @staticmethod
-    def offset_endpoint_port(endpoint: Optional[str],
-                             data_parallel_rank: int) -> Optional[str]:
-        """Helper function to offset the port in an endpoint by 
+    def offset_endpoint_port(
+        endpoint: Optional[str], data_parallel_rank: int
+    ) -> Optional[str]:
+        """Helper function to offset the port in an endpoint by
             the data parallel rank.
 
         Args:
-            endpoint: The endpoint string 
+            endpoint: The endpoint string
                 (e.g., "tcp://*:5557" or "inproc://cache")
             data_parallel_rank: The data parallel rank to offset by
 
         Returns:
-            The endpoint with the port offset by data_parallel_rank 
+            The endpoint with the port offset by data_parallel_rank
                 or suffix appended
         """
         # Do nothing if input is None or data_parallel_rank is 0
@@ -322,7 +328,7 @@ def offset_endpoint_port(endpoint: Optional[str],
                 # Get everything after the last colon (the port)
                 last_colon_idx = endpoint.rfind(":")
                 base_addr = endpoint[:last_colon_idx]
-                base_port = int(endpoint[last_colon_idx + 1:])
+                base_port = int(endpoint[last_colon_idx + 1 :])
                 new_port = base_port + data_parallel_rank
                 return f"{base_addr}:{new_port}"
             return endpoint
@@ -336,16 +342,15 @@ class EventPublisherFactory:
     }
 
     @classmethod
-    def register_publisher(cls, name: str,
-                           ctor: Callable[..., EventPublisher]) -> None:
+    def register_publisher(cls, name: str, ctor: Callable[..., EventPublisher]) -> None:
         if name in cls._registry:
             raise KeyError(f"publisher '{name}' already registered")
         cls._registry[name] = ctor
 
     @classmethod
-    def create(cls,
-               config: Optional[KVEventsConfig],
-               data_parallel_rank: int = 0) -> EventPublisher:
+    def create(
+        cls, config: Optional[KVEventsConfig], data_parallel_rank: int = 0
+    ) -> EventPublisher:
         """Create publisher from a config mapping."""
         if not config:
             return NullEventPublisher()
@@ -358,5 +363,4 @@ def create(cls,
             constructor = cls._registry[kind]
         except KeyError as exc:
             raise ValueError(f"Unknown event publisher '{kind}'") from exc
-        return constructor(data_parallel_rank=data_parallel_rank,
-                           **config_dict)
+        return constructor(data_parallel_rank=data_parallel_rank, **config_dict)
diff --git a/vllm/distributed/kv_transfer/__init__.py b/vllm/distributed/kv_transfer/__init__.py
index cf58e7914972..2bf4e1feb703 100644
--- a/vllm/distributed/kv_transfer/__init__.py
+++ b/vllm/distributed/kv_transfer/__init__.py
@@ -2,12 +2,19 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 from vllm.distributed.kv_transfer.kv_transfer_state import (
-    KVConnectorBaseType, ensure_kv_transfer_initialized,
-    ensure_kv_transfer_shutdown, get_kv_transfer_group, has_kv_transfer_group,
-    is_v1_kv_transfer_group)
+    KVConnectorBaseType,
+    ensure_kv_transfer_initialized,
+    ensure_kv_transfer_shutdown,
+    get_kv_transfer_group,
+    has_kv_transfer_group,
+    is_v1_kv_transfer_group,
+)
 
 __all__ = [
-    "get_kv_transfer_group", "has_kv_transfer_group",
-    "is_v1_kv_transfer_group", "ensure_kv_transfer_initialized",
-    "ensure_kv_transfer_shutdown", "KVConnectorBaseType"
+    "get_kv_transfer_group",
+    "has_kv_transfer_group",
+    "is_v1_kv_transfer_group",
+    "ensure_kv_transfer_initialized",
+    "ensure_kv_transfer_shutdown",
+    "KVConnectorBaseType",
 ]
diff --git a/vllm/distributed/kv_transfer/kv_connector/factory.py b/vllm/distributed/kv_transfer/kv_connector/factory.py
index 873f130ed827..329263afba5a 100644
--- a/vllm/distributed/kv_transfer/kv_connector/factory.py
+++ b/vllm/distributed/kv_transfer/kv_connector/factory.py
@@ -7,7 +7,9 @@
 # yapf: disable
 import vllm.envs as envs
 from vllm.distributed.kv_transfer.kv_connector.base import (
-    KVConnectorBase, KVConnectorBaseType)
+    KVConnectorBase,
+    KVConnectorBaseType,
+)
 from vllm.distributed.kv_transfer.kv_connector.v1 import KVConnectorRole
 from vllm.logger import init_logger
 
@@ -24,8 +26,7 @@ class KVConnectorFactory:
     _registry: dict[str, Callable[[], type[KVConnectorBase]]] = {}
 
     @classmethod
-    def register_connector(cls, name: str, module_path: str,
-                           class_name: str) -> None:
+    def register_connector(cls, name: str, module_path: str, class_name: str) -> None:
         """Register a connector with a lazy-loading module and class name."""
         if name in cls._registry:
             raise ValueError(f"Connector '{name}' is already registered.")
@@ -43,13 +44,18 @@ def create_connector(
         role: KVConnectorRole,
     ) -> KVConnectorBase:
         if not envs.VLLM_USE_V1:
-            raise ValueError("Attempting to initialize a V1 Connector, "
-                             f"but found {envs.VLLM_USE_V1=}")
+            raise ValueError(
+                "Attempting to initialize a V1 Connector, "
+                f"but found {envs.VLLM_USE_V1=}"
+            )
 
         kv_transfer_config = config.kv_transfer_config
         connector_cls = cls.get_connector_class(kv_transfer_config)
-        logger.info("Creating v1 connector with name: %s and engine_id: %s",
-                    connector_cls.__name__, kv_transfer_config.engine_id)
+        logger.info(
+            "Creating v1 connector with name: %s and engine_id: %s",
+            connector_cls.__name__,
+            kv_transfer_config.engine_id,
+        )
         # NOTE(Kuntai): v1 connector is explicitly separated into two roles.
         # Scheduler connector:
         # - Co-locate with scheduler process
@@ -62,7 +68,7 @@ def create_connector(
 
     @classmethod
     def get_connector_class(
-            cls, kv_transfer_config: "KVTransferConfig"
+        cls, kv_transfer_config: "KVTransferConfig"
     ) -> type[KVConnectorBaseType]:
         """Get the connector class by name."""
         connector_name = kv_transfer_config.kv_connector
@@ -71,8 +77,7 @@ def get_connector_class(
         else:
             connector_module_path = kv_transfer_config.kv_connector_module_path
             if connector_module_path is None:
-                raise ValueError(
-                    f"Unsupported connector type: {connector_name}")
+                raise ValueError(f"Unsupported connector type: {connector_name}")
             connector_module = importlib.import_module(connector_module_path)
             connector_cls = getattr(connector_module, connector_name)
         return connector_cls
@@ -85,29 +90,35 @@ def get_connector_class(
 KVConnectorFactory.register_connector(
     "SharedStorageConnector",
     "vllm.distributed.kv_transfer.kv_connector.v1.shared_storage_connector",
-    "SharedStorageConnector")
+    "SharedStorageConnector",
+)
 
 KVConnectorFactory.register_connector(
     "P2pNcclConnector",
     "vllm.distributed.kv_transfer.kv_connector.v1.p2p.p2p_nccl_connector",
-    "P2pNcclConnector")
+    "P2pNcclConnector",
+)
 
 KVConnectorFactory.register_connector(
     "LMCacheConnectorV1",
     "vllm.distributed.kv_transfer.kv_connector.v1.lmcache_connector",
-    "LMCacheConnectorV1")
+    "LMCacheConnectorV1",
+)
 
 KVConnectorFactory.register_connector(
     "NixlConnector",
     "vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector",
-    "NixlConnector")
+    "NixlConnector",
+)
 
 KVConnectorFactory.register_connector(
     "MultiConnector",
     "vllm.distributed.kv_transfer.kv_connector.v1.multi_connector",
-    "MultiConnector")
+    "MultiConnector",
+)
 
 KVConnectorFactory.register_connector(
     "OffloadingConnector",
     "vllm.distributed.kv_transfer.kv_connector.v1.offloading_connector",
-    "OffloadingConnector")
+    "OffloadingConnector",
+)
diff --git a/vllm/distributed/kv_transfer/kv_connector/utils.py b/vllm/distributed/kv_transfer/kv_connector/utils.py
index 103fba41fcb4..056ece60e84d 100644
--- a/vllm/distributed/kv_transfer/kv_connector/utils.py
+++ b/vllm/distributed/kv_transfer/kv_connector/utils.py
@@ -3,6 +3,7 @@
 """
 KV cache helper for store.
 """
+
 from collections import defaultdict
 from collections.abc import Sequence
 from concurrent.futures import CancelledError, Future
@@ -13,8 +14,7 @@
 import vllm.envs as envs
 from vllm import _custom_ops as ops
 from vllm.config import VllmConfig, get_current_vllm_config
-from vllm.distributed.kv_transfer.kv_connector.factory import (
-    KVConnectorFactory)
+from vllm.distributed.kv_transfer.kv_connector.factory import KVConnectorFactory
 from vllm.logger import init_logger
 from vllm.v1.outputs import KVConnectorOutput, ModelRunnerOutput
 
@@ -22,14 +22,12 @@
 
 
 class model_aware_kv_ops_helper:
-
     def __init__(self, config: VllmConfig):
         self.is_deepseek_mla = config.model_config.is_deepseek_mla
         self.use_mla_opt = not envs.VLLM_MLA_DISABLE
         self.tp_size = config.parallel_config.tensor_parallel_size
 
     def get_model_args(self, model_executable: torch.nn.Module):
-
         model_config = model_executable.model.config
         self.model_executable = model_executable
         num_heads = int(model_config.num_key_value_heads / self.tp_size)
@@ -46,12 +44,10 @@ def get_model_args(self, model_executable: torch.nn.Module):
         # num_key_value_heads / tp, qk_nope_head_dim + qk_rope_head_dim].
         # For more details, see vllm/v1/attention/backends/mla/common.py.
         if self.is_deepseek_mla and self.use_mla_opt:
-            head_size = model_config.kv_lora_rank + \
-                model_config.qk_rope_head_dim
+            head_size = model_config.kv_lora_rank + model_config.qk_rope_head_dim
             num_heads = 1
         elif self.is_deepseek_mla and not self.use_mla_opt:
-            head_size = model_config.qk_nope_head_dim + \
-                model_config.qk_rope_head_dim
+            head_size = model_config.qk_nope_head_dim + model_config.qk_rope_head_dim
         else:
             head_size = getattr(model_config, "head_dim", None)
             if head_size is None:
@@ -68,16 +64,24 @@ def get_kv_from_cache(self, kv_cache, num_heads, head_size):
             value_cache = kv_cache[1].reshape(-1, num_heads, head_size)
         return key_cache, value_cache
 
-    def put_kv_to_cache(self, model_executable: torch.nn.Module, keys, values,
-                        layer, kv_cache, slot_mapping, start_pos, end_pos):
-
+    def put_kv_to_cache(
+        self,
+        model_executable: torch.nn.Module,
+        keys,
+        values,
+        layer,
+        kv_cache,
+        slot_mapping,
+        start_pos,
+        end_pos,
+    ):
         model_config = model_executable.model.config
 
         if self.is_deepseek_mla and self.use_mla_opt:
             layer.self_attn.attn = layer.self_attn.mla_attn
             k_c_normed_k_pe = keys.squeeze(1)
-            k_c_normed = k_c_normed_k_pe[:, :model_config.kv_lora_rank]
-            k_pe = k_c_normed_k_pe[:, model_config.kv_lora_rank:]
+            k_c_normed = k_c_normed_k_pe[:, : model_config.kv_lora_rank]
+            k_pe = k_c_normed_k_pe[:, model_config.kv_lora_rank :]
             ops.concat_and_cache_mla(
                 k_c_normed.to(kv_cache.device),
                 k_pe.to(kv_cache.device),
@@ -107,12 +111,12 @@ def get_kv_connector_cache_layout():
     kv_config = vllm_config.kv_transfer_config
     if kv_config is not None:
         connector_cls = KVConnectorFactory.get_connector_class(kv_config)
-        required_kvcache_layout = connector_cls.get_required_kvcache_layout(
-            vllm_config)
+        required_kvcache_layout = connector_cls.get_required_kvcache_layout(vllm_config)
         if required_kvcache_layout is not None:
             return required_kvcache_layout
-        logger.info_once("Connectors do not specify a " \
-                         "kv cache layout, defaulting to NHD.")
+        logger.info_once(
+            "Connectors do not specify a kv cache layout, defaulting to NHD."
+        )
     return "NHD"
 
 
@@ -126,14 +130,16 @@ def __init__(self, world_size: int):
         self._recv_remaining_count = defaultdict[str, int](lambda: world_size)
         self._send_remaining_count = defaultdict[str, int](lambda: world_size)
 
-    def aggregate(self,
-                  outputs: list[ModelRunnerOutput],
-                  output_rank: int = 0) -> ModelRunnerOutput:
+    def aggregate(
+        self, outputs: list[ModelRunnerOutput], output_rank: int = 0
+    ) -> ModelRunnerOutput:
         # Aggregate kv_connector_output from all workers
 
-        def update_finished_set(req_ids: Optional[set[str]],
-                                remaining_count_dict: dict[str, int],
-                                finished_set: set[str]) -> None:
+        def update_finished_set(
+            req_ids: Optional[set[str]],
+            remaining_count_dict: dict[str, int],
+            finished_set: set[str],
+        ) -> None:
             for req_id in req_ids or ():
                 remaining_count_dict[req_id] -= 1
                 if remaining_count_dict[req_id] == 0:
@@ -148,10 +154,12 @@ def update_finished_set(req_ids: Optional[set[str]],
             output = model_runner_output.kv_connector_output
             if not output:
                 continue
-            update_finished_set(output.finished_sending,
-                                self._send_remaining_count, finished_sending)
-            update_finished_set(output.finished_recving,
-                                self._recv_remaining_count, finished_recving)
+            update_finished_set(
+                output.finished_sending, self._send_remaining_count, finished_sending
+            )
+            update_finished_set(
+                output.finished_recving, self._recv_remaining_count, finished_recving
+            )
 
             # Aggregate kv_connector_stats from all workers.
             if aggregated_kv_connector_stats is None:
@@ -161,10 +169,12 @@ def update_finished_set(req_ids: Optional[set[str]],
                 if aggregated_kv_connector_stats is None:
                     aggregated_kv_connector_stats = kv_connector_stats
                 else:
-                    assert isinstance(aggregated_kv_connector_stats,
-                                      type(kv_connector_stats))
-                    aggregated_kv_connector_stats = \
+                    assert isinstance(
+                        aggregated_kv_connector_stats, type(kv_connector_stats)
+                    )
+                    aggregated_kv_connector_stats = (
                         aggregated_kv_connector_stats.aggregate(kv_connector_stats)
+                    )
 
             invalid_block_ids |= output.invalid_block_ids
 
@@ -180,18 +190,16 @@ def update_finished_set(req_ids: Optional[set[str]],
 
         return output
 
-    def async_aggregate(self,
-                        output_futures: Sequence[Future[ModelRunnerOutput]],
-                        output_rank: int = 0) -> Future[ModelRunnerOutput]:
+    def async_aggregate(
+        self, output_futures: Sequence[Future[ModelRunnerOutput]], output_rank: int = 0
+    ) -> Future[ModelRunnerOutput]:
         """Takes a list of futures and returns a single future which resolves
         to the respective list of outputs."""
         result_future: Future[ModelRunnerOutput] = Future()
 
-        outputs: list[Optional[ModelRunnerOutput]] = [None
-                                                      ] * len(output_futures)
+        outputs: list[Optional[ModelRunnerOutput]] = [None] * len(output_futures)
 
         def make_callback(idx):
-
             def callback(fut):
                 if result_future.done():
                     return
@@ -206,8 +214,10 @@ def callback(fut):
                 # this check assumes io_thread_pool uses a single thread
                 if all(outputs):
                     result_future.set_result(
-                        self.aggregate(cast(list[ModelRunnerOutput], outputs),
-                                       output_rank))
+                        self.aggregate(
+                            cast(list[ModelRunnerOutput], outputs), output_rank
+                        )
+                    )
 
             return callback
 
@@ -223,12 +233,8 @@ def _make_src_and_dst_indices(
     src_device: Union[torch.device, str],
     dst_device: Union[torch.device, str],
 ) -> tuple[torch.Tensor, torch.Tensor]:
-    src_indices = torch.tensor(src_block_ids,
-                               device=src_device,
-                               dtype=torch.int64)
-    dst_indices = torch.tensor(dst_block_ids,
-                               device=dst_device,
-                               dtype=torch.int64)
+    src_indices = torch.tensor(src_block_ids, device=src_device, dtype=torch.int64)
+    dst_indices = torch.tensor(dst_block_ids, device=dst_device, dtype=torch.int64)
     return src_indices, dst_indices
 
 
@@ -240,9 +246,13 @@ def copy_kv_blocks(
     direction: Literal["h2d", "d2h"],
 ) -> None:
     """Copy kv blocks between different buffers."""
-    if not src_kv_caches or not dst_kv_caches or \
-       not src_block_ids or not dst_block_ids or \
-       len(src_block_ids) != len(dst_block_ids):
+    if (
+        not src_kv_caches
+        or not dst_kv_caches
+        or not src_block_ids
+        or not dst_block_ids
+        or len(src_block_ids) != len(dst_block_ids)
+    ):
         return
 
     src_device = next(iter(src_kv_caches.values())).device
@@ -252,9 +262,11 @@ def copy_kv_blocks(
         src_block_ids=src_block_ids,
         dst_block_ids=dst_block_ids,
         src_device=src_device,
-        dst_device=dst_device)
+        dst_device=dst_device,
+    )
 
     from vllm.platforms import current_platform
+
     if direction == "h2d":
         copy_fn = current_platform.insert_blocks_to_device
     else:
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/__init__.py b/vllm/distributed/kv_transfer/kv_connector/v1/__init__.py
index f00f31dde915..034c7afe97a4 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/__init__.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/__init__.py
@@ -1,6 +1,8 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from vllm.distributed.kv_transfer.kv_connector.v1.base import (
-    KVConnectorBase_V1, KVConnectorRole)
+    KVConnectorBase_V1,
+    KVConnectorRole,
+)
 
 __all__ = ["KVConnectorRole", "KVConnectorBase_V1"]
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/base.py b/vllm/distributed/kv_transfer/kv_connector/v1/base.py
index e3b4bcbfd1e6..70225e95aed2 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/base.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/base.py
@@ -7,7 +7,7 @@
 The class provides the following primitives:
     Scheduler-side: runs in the scheduler, binds metadata, which
     is used by the worker-side to load/save KV cache.
-        get_num_new_matched_tokens() - get number of new tokens 
+        get_num_new_matched_tokens() - get number of new tokens
             that exist in the remote KV cache. Might be called multiple
             times for a given request and should be side-effect free.
         update_state_after_alloc() - update KVConnector state after
@@ -49,17 +49,22 @@
     from vllm.attention.backends.abstract import AttentionMetadata
     from vllm.config import VllmConfig
     from vllm.distributed.kv_events import KVCacheEvent
-    from vllm.distributed.kv_transfer.kv_connector.v1.metrics import (
-        KVConnectorStats)
+    from vllm.distributed.kv_transfer.kv_connector.v1.metrics import KVConnectorStats
     from vllm.forward_context import ForwardContext
     from vllm.v1.core.kv_cache_manager import KVCacheBlocks
     from vllm.v1.request import Request
 
 # s_tensor_list, d_tensor_list, s_indices, d_indices, direction
-CopyBlocksOp = Callable[[
-    dict[str, torch.Tensor], dict[
-        str, torch.Tensor], list[int], list[int], Literal["h2d", "d2h"]
-], None]
+CopyBlocksOp = Callable[
+    [
+        dict[str, torch.Tensor],
+        dict[str, torch.Tensor],
+        list[int],
+        list[int],
+        Literal["h2d", "d2h"],
+    ],
+    None,
+]
 
 logger = init_logger(__name__)
 
@@ -77,15 +82,16 @@ class KVConnectorMetadata(ABC):  # noqa: B024
     Abstract Metadata used to communicate between the
     Scheduler KVConnector and Worker KVConnector.
     """
+
     pass
 
 
 class KVConnectorBase_V1(ABC):
-
     def __init__(self, vllm_config: "VllmConfig", role: KVConnectorRole):
         logger.warning(
             "Initializing KVConnectorBase_V1. This API is experimental and "
-            "subject to change in the future as we iterate the design.")
+            "subject to change in the future as we iterate the design."
+        )
         self._connector_metadata: Optional[KVConnectorMetadata] = None
         self._vllm_config = vllm_config
         self._role = role
@@ -98,11 +104,10 @@ def role(self) -> KVConnectorRole:
     # Worker-side methods
     # ==============================
 
-    def bind_connector_metadata(
-            self, connector_metadata: KVConnectorMetadata) -> None:
+    def bind_connector_metadata(self, connector_metadata: KVConnectorMetadata) -> None:
         """Set the connector metadata from the scheduler.
 
-        This function should be called by the model runner every time 
+        This function should be called by the model runner every time
         before the model execution. The metadata will be used for runtime
         KV cache loading and saving.
 
@@ -114,7 +119,7 @@ def bind_connector_metadata(
     def clear_connector_metadata(self) -> None:
         """Clear the connector metadata.
 
-        This function should be called by the model runner every time 
+        This function should be called by the model runner every time
         after the model execution.
         """
         self._connector_metadata = None
@@ -137,7 +142,7 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
         Initialize with the KV caches. Useful for pre-registering the
         KV Caches in the KVConnector (e.g. for NIXL).
 
-        Args: 
+        Args:
             kv_caches: dictionary of layer names, kv cache
         """
         return
@@ -150,8 +155,7 @@ def set_host_xfer_buffer_ops(self, copy_operation: CopyBlocksOp):
         return
 
     @abstractmethod
-    def start_load_kv(self, forward_context: "ForwardContext",
-                      **kwargs: Any) -> None:
+    def start_load_kv(self, forward_context: "ForwardContext", **kwargs: Any) -> None:
         """
         Start loading the KV cache from the connector to vLLM's paged
         KV buffer. This is called from the forward context before the
@@ -162,9 +166,9 @@ def start_load_kv(self, forward_context: "ForwardContext",
             **kwargs: additional arguments for the load operation
 
         Note:
-            The number of elements in kv_caches and layer_names should be 
+            The number of elements in kv_caches and layer_names should be
             the same.
-            
+
         """
         pass
 
@@ -174,7 +178,7 @@ def wait_for_layer_load(self, layer_name: str) -> None:
         Block until the KV for a specific layer is loaded into vLLM's
         paged buffer. This is called from within attention layer to ensure
         async copying from start_load_kv is complete.
-        
+
         This interface will be useful for layer-by-layer pipelining.
 
         Args:
@@ -183,17 +187,21 @@ def wait_for_layer_load(self, layer_name: str) -> None:
         pass
 
     @abstractmethod
-    def save_kv_layer(self, layer_name: str, kv_layer: torch.Tensor,
-                      attn_metadata: "AttentionMetadata",
-                      **kwargs: Any) -> None:
+    def save_kv_layer(
+        self,
+        layer_name: str,
+        kv_layer: torch.Tensor,
+        attn_metadata: "AttentionMetadata",
+        **kwargs: Any,
+    ) -> None:
         """
-        Start saving a layer of KV cache from vLLM's paged buffer 
+        Start saving a layer of KV cache from vLLM's paged buffer
         to the connector. This is called from within attention layer to
         enable async copying during execution.
 
         Args:
             layer_name (str): the name of the layer.
-            kv_layer (torch.Tensor): the paged KV buffer of the current 
+            kv_layer (torch.Tensor): the paged KV buffer of the current
                 layer in vLLM.
             attn_metadata (AttentionMetadata): the attention metadata.
             **kwargs: additional arguments for the save operation.
@@ -276,7 +284,7 @@ def get_num_new_matched_tokens(
         """
         Get number of new tokens that can be loaded from the
         external KV cache beyond the num_computed_tokens.
-        
+
         Args:
             request (Request): the request object.
             num_computed_tokens (int): the number of locally
@@ -303,9 +311,9 @@ def get_num_new_matched_tokens(
         pass
 
     @abstractmethod
-    def update_state_after_alloc(self, request: "Request",
-                                 blocks: "KVCacheBlocks",
-                                 num_external_tokens: int):
+    def update_state_after_alloc(
+        self, request: "Request", blocks: "KVCacheBlocks", num_external_tokens: int
+    ):
         """
         Update KVConnector state after block allocation.
 
@@ -325,7 +333,8 @@ def update_state_after_alloc(self, request: "Request",
 
     @abstractmethod
     def build_connector_meta(
-            self, scheduler_output: SchedulerOutput) -> KVConnectorMetadata:
+        self, scheduler_output: SchedulerOutput
+    ) -> KVConnectorMetadata:
         """
         Build the connector metadata for this step.
 
@@ -374,8 +383,7 @@ def take_events(self) -> Iterable["KVCacheEvent"]:
         return ()
 
     @classmethod
-    def get_required_kvcache_layout(
-            cls, vllm_config: "VllmConfig") -> Optional[str]:
+    def get_required_kvcache_layout(cls, vllm_config: "VllmConfig") -> Optional[str]:
         """
         Get the required KV cache layout for this connector.
         Args:
@@ -387,8 +395,10 @@ def get_required_kvcache_layout(
         """
 
         if cls is KVConnectorBase_V1:
-            raise TypeError("get_required_kvcache_layout should not be called "
-                            "on the abstract base class")
+            raise TypeError(
+                "get_required_kvcache_layout should not be called "
+                "on the abstract base class"
+            )
         return None
 
     def get_finished_count(self) -> Optional[int]:
@@ -404,11 +414,10 @@ def get_finished_count(self) -> Optional[int]:
 
     @classmethod
     def build_kv_connector_stats(
-            cls,
-            data: Optional[dict[str,
-                                Any]] = None) -> Optional["KVConnectorStats"]:
+        cls, data: Optional[dict[str, Any]] = None
+    ) -> Optional["KVConnectorStats"]:
         """
-        KVConnectorStats resolution method. This method allows dynamically 
+        KVConnectorStats resolution method. This method allows dynamically
         registered connectors to return their own KVConnectorStats object,
         which can implement custom aggregation logic on the data dict.
         """
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_connector.py
index 2b0abe983fbb..b50cc3ab30fa 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_connector.py
@@ -7,7 +7,10 @@
 
 from vllm.config import VllmConfig
 from vllm.distributed.kv_transfer.kv_connector.v1.base import (
-    KVConnectorBase_V1, KVConnectorMetadata, KVConnectorRole)
+    KVConnectorBase_V1,
+    KVConnectorMetadata,
+    KVConnectorRole,
+)
 from vllm.logger import init_logger
 from vllm.v1.core.sched.output import SchedulerOutput
 
@@ -21,7 +24,6 @@
 
 
 class LMCacheConnectorV1(KVConnectorBase_V1):
-
     def __init__(self, vllm_config: "VllmConfig", role: KVConnectorRole):
         super().__init__(vllm_config=vllm_config, role=role)
         self._lmcache_engine = LMCacheConnectorV1Impl(vllm_config, role, self)
@@ -29,8 +31,7 @@ def __init__(self, vllm_config: "VllmConfig", role: KVConnectorRole):
     # ==============================
     # Worker-side methods
     # ==============================
-    def start_load_kv(self, forward_context: "ForwardContext",
-                      **kwargs: Any) -> None:
+    def start_load_kv(self, forward_context: "ForwardContext", **kwargs: Any) -> None:
         """
         Start loading the KV cache from the connector to vLLM's paged
         KV buffer. This is called from the forward context before the
@@ -41,9 +42,9 @@ def start_load_kv(self, forward_context: "ForwardContext",
             **kwargs: additional arguments for the load operation
 
         Note:
-            The number of elements in kv_caches and layer_names should be 
+            The number of elements in kv_caches and layer_names should be
             the same.
-            
+
         """
         self._lmcache_engine.start_load_kv(forward_context, **kwargs)
 
@@ -52,7 +53,7 @@ def wait_for_layer_load(self, layer_name: str) -> None:
         Block until the KV for a specific layer is loaded into vLLM's
         paged buffer. This is called from within attention layer to ensure
         async copying from start_load_kv is complete.
-        
+
         This interface will be useful for layer-by-layer pipelining.
 
         Args:
@@ -60,23 +61,28 @@ def wait_for_layer_load(self, layer_name: str) -> None:
         """
         self._lmcache_engine.wait_for_layer_load(layer_name)
 
-    def save_kv_layer(self, layer_name: str, kv_layer: torch.Tensor,
-                      attn_metadata: "AttentionMetadata",
-                      **kwargs: Any) -> None:
+    def save_kv_layer(
+        self,
+        layer_name: str,
+        kv_layer: torch.Tensor,
+        attn_metadata: "AttentionMetadata",
+        **kwargs: Any,
+    ) -> None:
         """
-        Start saving the a layer of KV cache from vLLM's paged buffer 
+        Start saving the a layer of KV cache from vLLM's paged buffer
         to the connector. This is called from within attention layer to
         enable async copying during execution.
 
         Args:
             layer_name (str): the name of the layer.
-            kv_layer (torch.Tensor): the paged KV buffer of the current 
+            kv_layer (torch.Tensor): the paged KV buffer of the current
                 layer in vLLM.
             attn_metadata (AttentionMetadata): the attention metadata.
             **kwargs: additional arguments for the save operation.
         """
-        self._lmcache_engine.save_kv_layer(layer_name, kv_layer, attn_metadata,
-                                           **kwargs)
+        self._lmcache_engine.save_kv_layer(
+            layer_name, kv_layer, attn_metadata, **kwargs
+        )
 
     def wait_for_save(self):
         """
@@ -115,30 +121,31 @@ def get_num_new_matched_tokens(
         """
         Get number of new tokens that can be loaded from the
         external KV cache beyond the num_computed_tokens.
-        
+
         Args:
             request (Request): the request object.
             num_computed_tokens (int): the number of locally
                 computed tokens for this request
 
         Returns:
-            the number of tokens that can be loaded from the 
+            the number of tokens that can be loaded from the
             external KV cache beyond what is already computed.
         """
         return self._lmcache_engine.get_num_new_matched_tokens(
-            request, num_computed_tokens), False
+            request, num_computed_tokens
+        ), False
 
-    def update_state_after_alloc(self, request: "Request",
-                                 blocks: "KVCacheBlocks",
-                                 num_external_tokens: int):
+    def update_state_after_alloc(
+        self, request: "Request", blocks: "KVCacheBlocks", num_external_tokens: int
+    ):
         """
         Update KVConnector state after block allocation.
         """
-        self._lmcache_engine.update_state_after_alloc(request,
-                                                      num_external_tokens)
+        self._lmcache_engine.update_state_after_alloc(request, num_external_tokens)
 
     def build_connector_meta(
-            self, scheduler_output: SchedulerOutput) -> KVConnectorMetadata:
+        self, scheduler_output: SchedulerOutput
+    ) -> KVConnectorMetadata:
         """
         Build the connector metadata for this step.
 
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/metrics.py b/vllm/distributed/kv_transfer/kv_connector/v1/metrics.py
index e40007230ba4..879cc9a23581 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/metrics.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/metrics.py
@@ -4,10 +4,8 @@
 from typing import Any, Optional, Union
 
 from vllm.config.kv_transfer import KVTransferConfig
-from vllm.distributed.kv_transfer.kv_connector.factory import (
-    KVConnectorFactory)
-from vllm.distributed.kv_transfer.kv_transfer_state import (
-    has_kv_transfer_group)
+from vllm.distributed.kv_transfer.kv_connector.factory import KVConnectorFactory
+from vllm.distributed.kv_transfer.kv_transfer_state import has_kv_transfer_group
 from vllm.logger import init_logger
 
 logger = init_logger(__name__)
@@ -16,11 +14,12 @@
 @dataclass
 class KVConnectorStats:
     """
-    Base class for KV Connector Stats, a container for transfer performance 
-    metrics or otherwise important telemetry from the connector. 
+    Base class for KV Connector Stats, a container for transfer performance
+    metrics or otherwise important telemetry from the connector.
     All sub-classes need to be serializable as stats are sent from worker to
     logger process.
     """
+
     data: dict[str, Any] = field(default_factory=dict)
 
     def reset(self):
@@ -35,8 +34,8 @@ def aggregate(self, other: "KVConnectorStats") -> "KVConnectorStats":
 
     def reduce(self) -> dict[str, Union[int, float]]:
         """
-        Reduce the observations collected during a time interval to one or 
-        more representative values (eg avg/median/sum of the series). 
+        Reduce the observations collected during a time interval to one or
+        more representative values (eg avg/median/sum of the series).
         This is meant to be called by the logger to produce a summary of the
         stats for the last time interval.
         """
@@ -48,14 +47,14 @@ def is_empty(self) -> bool:
 
 
 class KVConnectorLogging:
-
     def __init__(self, kv_tranfer_config: KVTransferConfig):
         # This should be called on frontend process.
         assert not has_kv_transfer_group()
         # Instantiate the connector's stats class.
         if kv_tranfer_config and kv_tranfer_config.kv_connector:
             self.connector_cls = KVConnectorFactory.get_connector_class(
-                kv_tranfer_config)
+                kv_tranfer_config
+            )
         self.reset()
 
     def reset(self):
@@ -69,32 +68,37 @@ def observe(self, transfer_stats_data: dict[str, Any]):
         # We expect transfer_stats_data to be aggregated across all workers and
         # consist of observations from a single connector or a MultiConnector.
         transfer_stats = self.connector_cls.build_kv_connector_stats(
-            transfer_stats_data)
+            transfer_stats_data
+        )
         if transfer_stats is None:
             logger.warning_once(
                 "The connector %s is collecting stats but "
                 "does not implement the "
                 "`build_kv_connector_stats` method. "
-                "Stats will not be logged.", self.connector_cls)
+                "Stats will not be logged.",
+                self.connector_cls,
+            )
             return
 
         if self.transfer_stats_accumulator is None:
             self.transfer_stats_accumulator = transfer_stats
         else:
             # Accumulate last interval stats.
-            self.transfer_stats_accumulator = \
-                self.transfer_stats_accumulator.aggregate(transfer_stats)
+            self.transfer_stats_accumulator = self.transfer_stats_accumulator.aggregate(
+                transfer_stats
+            )
 
     def log(self, log_fn=logger.info):
         """Log transfer metrics periodically, similar to throughput logging"""
-        if (self.transfer_stats_accumulator
-                and not self.transfer_stats_accumulator.is_empty()):
+        if (
+            self.transfer_stats_accumulator
+            and not self.transfer_stats_accumulator.is_empty()
+        ):
             # Produce a single cumulative stats object for the last time
             # interval from the recorded observations.
             xfer_metrics = self.transfer_stats_accumulator.reduce()
-            xfer_metrics_str = ", ".join(f"{k}={v}"
-                                         for k, v in xfer_metrics.items())
+            xfer_metrics_str = ", ".join(f"{k}={v}" for k, v in xfer_metrics.items())
             log_fn("KV Transfer metrics: %s", xfer_metrics_str)
 
             # Reset metrics for next interval
-            self.reset()
\ No newline at end of file
+            self.reset()
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/multi_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/multi_connector.py
index a7713ba326fc..e48d4ccd1d6c 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/multi_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/multi_connector.py
@@ -9,12 +9,13 @@
 
 from vllm.config import VllmConfig
 from vllm.config.kv_transfer import KVTransferConfig
-from vllm.distributed.kv_transfer.kv_connector.factory import (
-    KVConnectorFactory)
+from vllm.distributed.kv_transfer.kv_connector.factory import KVConnectorFactory
 from vllm.distributed.kv_transfer.kv_connector.v1.base import (
-    KVConnectorBase_V1, KVConnectorMetadata, KVConnectorRole)
-from vllm.distributed.kv_transfer.kv_connector.v1.metrics import (
-    KVConnectorStats)
+    KVConnectorBase_V1,
+    KVConnectorMetadata,
+    KVConnectorRole,
+)
+from vllm.distributed.kv_transfer.kv_connector.v1.metrics import KVConnectorStats
 from vllm.logger import init_logger
 from vllm.v1.core.sched.output import SchedulerOutput
 from vllm.v1.outputs import KVConnectorOutput
@@ -58,8 +59,7 @@ def reset(self):
     def reduce(self) -> dict[str, Any]:
         # TODO (NickLucche) Adjust for logging on separate lines
         return {
-            connector_id: stats.reduce()
-            for connector_id, stats in self.data.items()
+            connector_id: stats.reduce() for connector_id, stats in self.data.items()
         }
 
     def is_empty(self) -> bool:
@@ -87,16 +87,18 @@ def __init__(self, vllm_config: "VllmConfig", role: KVConnectorRole):
         self._connectors: list[KVConnectorBase_V1] = []
         self._ktc_kv_transfer_config = []
         ktcs = vllm_config.kv_transfer_config.kv_connector_extra_config.get(
-            "connectors")
+            "connectors"
+        )
         assert ktcs is not None
         for ktc in ktcs:
             temp_config = copy.copy(vllm_config)
-            engine_id = ktc.get("engine_id",
-                                vllm_config.kv_transfer_config.engine_id)
+            engine_id = ktc.get("engine_id", vllm_config.kv_transfer_config.engine_id)
             temp_config.kv_transfer_config = KVTransferConfig(
-                **ktc, engine_id=engine_id)
+                **ktc, engine_id=engine_id
+            )
             self._connectors.append(
-                KVConnectorFactory.create_connector(temp_config, role))
+                KVConnectorFactory.create_connector(temp_config, role)
+            )
             self._ktc_kv_transfer_config.append(temp_config.kv_transfer_config)
 
         # A mapping from request id to the index of the connector chosen to
@@ -116,12 +118,10 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
     # We must override the base class method here because we need to bind
     # the metadata to each connector in the order of the connectors in the
     # MultiKVConnectorMetadata.
-    def bind_connector_metadata(
-            self, connector_metadata: KVConnectorMetadata) -> None:
+    def bind_connector_metadata(self, connector_metadata: KVConnectorMetadata) -> None:
         assert isinstance(connector_metadata, MultiKVConnectorMetadata)
         if connector_metadata.extra_async_saves:
-            self._extra_async_saves.update(
-                connector_metadata.extra_async_saves)
+            self._extra_async_saves.update(connector_metadata.extra_async_saves)
         for c, cm in zip(self._connectors, connector_metadata.metadata):
             c.bind_connector_metadata(cm)
 
@@ -135,8 +135,9 @@ def shutdown(self):
             try:
                 c.shutdown()
             except Exception as e:
-                logger.exception("Exception during connector %s shutdown.",
-                                 c.__class__.__name__)
+                logger.exception(
+                    "Exception during connector %s shutdown.", c.__class__.__name__
+                )
                 exception = e
         if exception:
             raise exception
@@ -144,8 +145,7 @@ def shutdown(self):
     # ==============================
     # Worker-side methods
     # ==============================
-    def start_load_kv(self, forward_context: "ForwardContext",
-                      **kwargs) -> None:
+    def start_load_kv(self, forward_context: "ForwardContext", **kwargs) -> None:
         for c in self._connectors:
             c.start_load_kv(forward_context, **kwargs)
 
@@ -153,8 +153,13 @@ def wait_for_layer_load(self, layer_name: str) -> None:
         for c in self._connectors:
             c.wait_for_layer_load(layer_name)
 
-    def save_kv_layer(self, layer_name: str, kv_layer: torch.Tensor,
-                      attn_metadata: "AttentionMetadata", **kwargs) -> None:
+    def save_kv_layer(
+        self,
+        layer_name: str,
+        kv_layer: torch.Tensor,
+        attn_metadata: "AttentionMetadata",
+        **kwargs,
+    ) -> None:
         for c in self._connectors:
             c.save_kv_layer(layer_name, kv_layer, attn_metadata, **kwargs)
 
@@ -206,7 +211,8 @@ def get_num_new_matched_tokens(
         to_return = (0, False)
         for i, c in enumerate(self._connectors):
             toks, load_async = c.get_num_new_matched_tokens(
-                request, num_computed_tokens)
+                request, num_computed_tokens
+            )
             # If there is a connector still looking up the matches,
             # we return None to indicate that we are not done yet.
             if toks is None:
@@ -218,27 +224,27 @@ def get_num_new_matched_tokens(
                 to_return = (toks, load_async)
         return to_return
 
-    def update_state_after_alloc(self, request: "Request",
-                                 blocks: "KVCacheBlocks",
-                                 num_external_tokens: int):
-        chosen_connector = self._requests_to_connector.get(
-            request.request_id, -1)
+    def update_state_after_alloc(
+        self, request: "Request", blocks: "KVCacheBlocks", num_external_tokens: int
+    ):
+        chosen_connector = self._requests_to_connector.get(request.request_id, -1)
         empty_blocks = blocks.new_empty()
         for i, c in enumerate(self._connectors):
             if i == chosen_connector:
                 # Forward call to the chosen connector (if any).
-                c.update_state_after_alloc(request, blocks,
-                                           num_external_tokens)
+                c.update_state_after_alloc(request, blocks, num_external_tokens)
             else:
                 # Call with empty blocks for other connectors.
                 c.update_state_after_alloc(request, empty_blocks, 0)
 
     def build_connector_meta(
-            self,
-            scheduler_output: SchedulerOutput) -> MultiKVConnectorMetadata:
-        metadata = MultiKVConnectorMetadata(metadata=tuple(
-            c.build_connector_meta(scheduler_output)
-            for c in self._connectors))
+        self, scheduler_output: SchedulerOutput
+    ) -> MultiKVConnectorMetadata:
+        metadata = MultiKVConnectorMetadata(
+            metadata=tuple(
+                c.build_connector_meta(scheduler_output) for c in self._connectors
+            )
+        )
         if self._extra_async_saves:
             metadata.extra_async_saves = self._extra_async_saves
             self._extra_async_saves = {}
@@ -264,7 +270,8 @@ def request_finished(
                     # TODO we can probably change this to merge the dicts here,
                     # checking for key clashes.
                     raise RuntimeError(
-                        "Only one connector can produce KV transfer params")
+                        "Only one connector can produce KV transfer params"
+                    )
                 kv_txfer_params = txfer_params
         if async_saves > 1:
             self._extra_async_saves[request.request_id] = async_saves - 1
@@ -279,8 +286,7 @@ def take_events(self) -> Iterable["KVCacheEvent"]:
             yield from c.take_events()
 
     @classmethod
-    def get_required_kvcache_layout(
-            cls, vllm_config: "VllmConfig") -> Optional[str]:
+    def get_required_kvcache_layout(cls, vllm_config: "VllmConfig") -> Optional[str]:
         """
         Get the required KV cache layout for this connector.
         Args:
@@ -291,34 +297,39 @@ def get_required_kvcache_layout(
             None if the connector does not require a specific layout.
         """
         ktcs = vllm_config.kv_transfer_config.kv_connector_extra_config.get(
-            "connectors")
+            "connectors"
+        )
         assert ktcs is not None
         layouts: set[str] = set()
         temp_vllm_config = copy.copy(vllm_config)
         for ktc in ktcs:
             kv_transfer_config = KVTransferConfig(**ktc)
             temp_vllm_config.kv_transfer_config = kv_transfer_config
-            connector_cls = KVConnectorFactory.get_connector_class(
-                kv_transfer_config)
-            required_kvcache_layout = (
-                connector_cls.get_required_kvcache_layout(temp_vllm_config))
+            connector_cls = KVConnectorFactory.get_connector_class(kv_transfer_config)
+            required_kvcache_layout = connector_cls.get_required_kvcache_layout(
+                temp_vllm_config
+            )
             if required_kvcache_layout is not None:
                 layouts.add(required_kvcache_layout)
 
         if len(layouts) > 1:
-            raise ValueError(f"KV cache layout mismatch: "
-                             f"found {len(layouts)} different layouts "
-                             f"({', '.join(layouts) })."
-                             f"All connectors must use the same layout.")
+            raise ValueError(
+                f"KV cache layout mismatch: "
+                f"found {len(layouts)} different layouts "
+                f"({', '.join(layouts)})."
+                f"All connectors must use the same layout."
+            )
         return next(iter(layouts), None)
 
     @classmethod
     def build_kv_connector_stats(
-            cls,
-            data: Optional[dict[str,
-                                Any]] = None) -> Optional[KVConnectorStats]:
-        return MultiKVConnectorStats(data=data) if data is not None \
+        cls, data: Optional[dict[str, Any]] = None
+    ) -> Optional[KVConnectorStats]:
+        return (
+            MultiKVConnectorStats(data=data)
+            if data is not None
             else MultiKVConnectorStats()
+        )
 
     def get_kv_connector_stats(self) -> Optional[MultiKVConnectorStats]:
         # Group connector stats by connector type.
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
index c9a472ce86cb..e3e3389fd164 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
@@ -25,12 +25,17 @@
 from vllm.attention.selector import backend_name_to_enum, get_attn_backend
 from vllm.config import VllmConfig
 from vllm.distributed.kv_transfer.kv_connector.v1.base import (
-    CopyBlocksOp, KVConnectorBase_V1, KVConnectorMetadata, KVConnectorRole)
-from vllm.distributed.kv_transfer.kv_connector.v1.metrics import (
-    KVConnectorStats)
+    CopyBlocksOp,
+    KVConnectorBase_V1,
+    KVConnectorMetadata,
+    KVConnectorRole,
+)
+from vllm.distributed.kv_transfer.kv_connector.v1.metrics import KVConnectorStats
 from vllm.distributed.parallel_state import (
-    get_tensor_model_parallel_rank, get_tensor_model_parallel_world_size,
-    get_tp_group)
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    get_tp_group,
+)
 from vllm.distributed.utils import divide
 from vllm.forward_context import ForwardContext
 from vllm.logger import init_logger
@@ -56,6 +61,7 @@
 try:
     from nixl._api import nixl_agent as NixlWrapper
     from nixl._bindings import nixlXferTelemetry
+
     logger.info("NIXL is available")
 except ImportError:
     logger.warning("NIXL is not available")
@@ -75,18 +81,19 @@
         "cuda",
         "cpu",
     ),
-    "tpu": ("cpu", ),
-    "xpu": ("cpu", ),
+    "tpu": ("cpu",),
+    "xpu": ("cpu",),
 }
 # support for oot platform by providing mapping in current_platform
 _NIXL_SUPPORTED_DEVICE.update(current_platform.get_nixl_supported_devices())
 
 
 class NixlAgentMetadata(
-        msgspec.Struct,
-        omit_defaults=True,  # type: ignore[call-arg]
-        # required for @cached_property.
-        dict=True):
+    msgspec.Struct,
+    omit_defaults=True,  # type: ignore[call-arg]
+    # required for @cached_property.
+    dict=True,
+):
     engine_id: str
     agent_metadata: bytes
     kv_caches_base_addr: list[int]
@@ -107,7 +114,6 @@ class ReqMeta:
 
 
 class NixlConnectorMetadata(KVConnectorMetadata):
-
     def __init__(self):
         self.reqs_to_recv: dict[ReqId, ReqMeta] = {}
         self.reqs_to_save: dict[ReqId, ReqMeta] = {}
@@ -141,20 +147,19 @@ def add_new_req(
 
 
 class NixlConnector(KVConnectorBase_V1):
-
     def __init__(self, vllm_config: VllmConfig, role: KVConnectorRole):
         assert vllm_config.kv_transfer_config is not None
         assert vllm_config.kv_transfer_config.engine_id is not None
         self.engine_id: EngineId = vllm_config.kv_transfer_config.engine_id
 
         if role == KVConnectorRole.SCHEDULER:
-            self.connector_scheduler: Optional[NixlConnectorScheduler] = \
+            self.connector_scheduler: Optional[NixlConnectorScheduler] = (
                 NixlConnectorScheduler(vllm_config, self.engine_id)
+            )
             self.connector_worker: Optional[NixlConnectorWorker] = None
         elif role == KVConnectorRole.WORKER:
             self.connector_scheduler = None
-            self.connector_worker = NixlConnectorWorker(
-                vllm_config, self.engine_id)
+            self.connector_worker = NixlConnectorWorker(vllm_config, self.engine_id)
 
     ############################################################
     # Class Methods
@@ -162,8 +167,10 @@ def __init__(self, vllm_config: VllmConfig, role: KVConnectorRole):
     @classmethod
     def get_required_kvcache_layout(cls, vllm_config: VllmConfig):
         if vllm_config.model_config is None:
-            logger.warning_once("Unable to detect current VLLM config. "
-                                "Fallback to default kv cache layout.")
+            logger.warning_once(
+                "Unable to detect current VLLM config. "
+                "Fallback to default kv cache layout."
+            )
             return None
         use_mla = vllm_config.model_config.use_mla
         if use_mla:
@@ -171,8 +178,9 @@ def get_required_kvcache_layout(cls, vllm_config: VllmConfig):
             # as the layout should not matter in that case,
             # which fallback to the default behavior.
             return None
-        logger.info_once("NixlConnector setting KV cache "
-                         "layout to HND for better xfer performance.")
+        logger.info_once(
+            "NixlConnector setting KV cache layout to HND for better xfer performance."
+        )
         return "HND"
 
     ############################################################
@@ -180,18 +188,20 @@ def get_required_kvcache_layout(cls, vllm_config: VllmConfig):
     ############################################################
 
     def get_num_new_matched_tokens(
-            self, request: "Request",
-            num_computed_tokens: int) -> tuple[Optional[int], bool]:
+        self, request: "Request", num_computed_tokens: int
+    ) -> tuple[Optional[int], bool]:
         assert self.connector_scheduler is not None
         return self.connector_scheduler.get_num_new_matched_tokens(
-            request, num_computed_tokens)
+            request, num_computed_tokens
+        )
 
-    def update_state_after_alloc(self, request: "Request",
-                                 blocks: "KVCacheBlocks",
-                                 num_external_tokens: int):
+    def update_state_after_alloc(
+        self, request: "Request", blocks: "KVCacheBlocks", num_external_tokens: int
+    ):
         assert self.connector_scheduler is not None
         return self.connector_scheduler.update_state_after_alloc(
-            request, blocks, num_external_tokens)
+            request, blocks, num_external_tokens
+        )
 
     def build_connector_meta(
         self,
@@ -219,8 +229,7 @@ def set_host_xfer_buffer_ops(self, copy_operation: CopyBlocksOp):
         assert self.connector_worker is not None
         self.connector_worker.set_host_xfer_buffer_ops(copy_operation)
 
-    def get_finished(self,
-                     finished_req_ids: set[str]) -> tuple[set[str], set[str]]:
+    def get_finished(self, finished_req_ids: set[str]) -> tuple[set[str], set[str]]:
         """Get the finished recving and sending requests."""
         assert self.connector_worker is not None
         return self.connector_worker.get_finished()
@@ -231,14 +240,15 @@ def get_kv_connector_stats(self) -> Optional[KVConnectorStats]:
 
     @classmethod
     def build_kv_connector_stats(
-            cls,
-            data: Optional[dict[str,
-                                Any]] = None) -> Optional[KVConnectorStats]:
-        return NixlKVConnectorStats(data=data) if data is not None \
+        cls, data: Optional[dict[str, Any]] = None
+    ) -> Optional[KVConnectorStats]:
+        return (
+            NixlKVConnectorStats(data=data)
+            if data is not None
             else NixlKVConnectorStats()
+        )
 
-    def start_load_kv(self, forward_context: "ForwardContext",
-                      **kwargs) -> None:
+    def start_load_kv(self, forward_context: "ForwardContext", **kwargs) -> None:
         assert self.connector_worker is not None
         assert isinstance(self._connector_metadata, NixlConnectorMetadata)
         self.connector_worker.start_load_kv(self._connector_metadata)
@@ -247,16 +257,20 @@ def wait_for_layer_load(self, layer_name: str) -> None:
         """NixlConnector does not do layerwise saving."""
         pass
 
-    def save_kv_layer(self, layer_name: str, kv_layer: torch.Tensor,
-                      attn_metadata: "AttentionMetadata", **kwargs) -> None:
+    def save_kv_layer(
+        self,
+        layer_name: str,
+        kv_layer: torch.Tensor,
+        attn_metadata: "AttentionMetadata",
+        **kwargs,
+    ) -> None:
         """NixlConnector does not save explicitly."""
         pass
 
     def wait_for_save(self):
         assert self.connector_worker is not None
         assert isinstance(self._connector_metadata, NixlConnectorMetadata)
-        if self.connector_worker.use_host_buffer and \
-           self.connector_worker.copy_blocks:
+        if self.connector_worker.use_host_buffer and self.connector_worker.copy_blocks:
             self.connector_worker.save_kv_to_host(self._connector_metadata)
 
     def shutdown(self):
@@ -273,11 +287,11 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
         self.engine_id: EngineId = engine_id
         self.side_channel_host = envs.VLLM_NIXL_SIDE_CHANNEL_HOST
         self.side_channel_port = (
-            envs.VLLM_NIXL_SIDE_CHANNEL_PORT +
-            vllm_config.parallel_config.data_parallel_rank *
-            vllm_config.parallel_config.tensor_parallel_size)
-        self.use_host_buffer = \
-            vllm_config.kv_transfer_config.kv_buffer_device == "cpu"
+            envs.VLLM_NIXL_SIDE_CHANNEL_PORT
+            + vllm_config.parallel_config.data_parallel_rank
+            * vllm_config.parallel_config.tensor_parallel_size
+        )
+        self.use_host_buffer = vllm_config.kv_transfer_config.kv_buffer_device == "cpu"
         logger.info("Initializing NIXL Scheduler %s", engine_id)
 
         # Requests that need to start recv/send.
@@ -293,8 +307,8 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
         self._reqs_not_processed: set[ReqId] = set()
 
     def get_num_new_matched_tokens(
-            self, request: "Request",
-            num_computed_tokens: int) -> tuple[int, bool]:
+        self, request: "Request", num_computed_tokens: int
+    ) -> tuple[int, bool]:
         """
         For remote prefill, pull all prompt blocks from remote
         asynchronously relative to engine execution.
@@ -314,7 +328,9 @@ def get_num_new_matched_tokens(
         logger.debug(
             "NIXLConnector get_num_new_matched_tokens: "
             "num_computed_tokens=%s, kv_transfer_params=%s",
-            num_computed_tokens, params)
+            num_computed_tokens,
+            params,
+        )
 
         if params is not None and params.get("do_remote_prefill"):
             # Remote prefill: get all prompt blocks from remote.
@@ -325,15 +341,16 @@ def get_num_new_matched_tokens(
         # No remote prefill for this request.
         return 0, False
 
-    def update_state_after_alloc(self, request: "Request",
-                                 blocks: "KVCacheBlocks",
-                                 num_external_tokens: int):
-
+    def update_state_after_alloc(
+        self, request: "Request", blocks: "KVCacheBlocks", num_external_tokens: int
+    ):
         params = request.kv_transfer_params
         logger.debug(
             "NIXLConnector update_state_after_alloc: "
             "num_external_tokens=%s, kv_transfer_params=%s",
-            num_external_tokens, params)
+            num_external_tokens,
+            params,
+        )
 
         if not params:
             return
@@ -352,25 +369,33 @@ def update_state_after_alloc(self, request: "Request",
             # block is not overwritten; and it will be safe to skip saving them
             # to host xfer buffer.
             if block_ids:
-                self._reqs_need_save[request.request_id] = \
-                    (request, block_ids)
+                self._reqs_need_save[request.request_id] = (request, block_ids)
         elif params.get("do_remote_prefill"):
             if params.get("remote_block_ids"):
-                if all(p in params for p in ("remote_engine_id", "remote_host",
-                                             "remote_port")):
+                if all(
+                    p in params
+                    for p in ("remote_engine_id", "remote_host", "remote_port")
+                ):
                     # If remote_blocks and num_external_tokens = 0, we have
                     # a full prefix cache hit on the D worker. We need to call
                     # send_notif in _read_blocks to free the memory on the P.
-                    local_block_ids = (blocks.get_unhashed_block_ids()
-                                       if num_external_tokens > 0 else [])
+                    local_block_ids = (
+                        blocks.get_unhashed_block_ids()
+                        if num_external_tokens > 0
+                        else []
+                    )
                     # Get unhashed blocks to pull from remote.
                     self._reqs_need_recv[request.request_id] = (
-                        request, local_block_ids)
+                        request,
+                        local_block_ids,
+                    )
 
                 else:
                     logger.warning(
                         "Got invalid KVTransferParams: %s. This "
-                        "request will not utilize KVTransfer", params)
+                        "request will not utilize KVTransfer",
+                        params,
+                    )
             else:
                 assert num_external_tokens == 0
             # Only trigger 1 KV transfer per request.
@@ -429,8 +454,10 @@ def request_finished(
 
         params = request.kv_transfer_params
         logger.debug(
-            "NIXLConnector request_finished, request_status=%s, "
-            "kv_transfer_params=%s", request.status, params)
+            "NIXLConnector request_finished, request_status=%s, kv_transfer_params=%s",
+            request.status,
+            params,
+        )
         if not params:
             return False, None
 
@@ -459,8 +486,9 @@ def request_finished(
 
         if delay_free_blocks:
             # Prefill request on remote. It will be read from D upon completion
-            self._reqs_need_send[request.request_id] = time.perf_counter(
-            ) + envs.VLLM_NIXL_ABORT_REQUEST_TIMEOUT
+            self._reqs_need_send[request.request_id] = (
+                time.perf_counter() + envs.VLLM_NIXL_ABORT_REQUEST_TIMEOUT
+            )
 
         return delay_free_blocks, dict(
             do_remote_prefill=True,
@@ -469,7 +497,8 @@ def request_finished(
             remote_engine_id=self.engine_id,
             remote_host=self.side_channel_host,
             remote_port=self.side_channel_port,
-            tp_size=self.vllm_config.parallel_config.tensor_parallel_size)
+            tp_size=self.vllm_config.parallel_config.tensor_parallel_size,
+        )
 
 
 class NixlConnectorWorker:
@@ -486,9 +515,9 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
         self.vllm_config = vllm_config
         self.block_size = vllm_config.cache_config.block_size
 
-        self.nixl_backends = \
-            vllm_config.kv_transfer_config.get_from_extra_config(
-                "backends", ["UCX"])
+        self.nixl_backends = vllm_config.kv_transfer_config.get_from_extra_config(
+            "backends", ["UCX"]
+        )
         # TODO temporary, once nixl allows for telemetry flag in config
         # (next release), we can remove this env var.
         os.environ["NIXL_TELEMETRY_ENABLE"] = "1"
@@ -497,8 +526,11 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
         if nixl_agent_config is None:
             config = None
         else:
-            config = nixl_agent_config(backends=self.nixl_backends) if len(
-                non_ucx_backends) > 0 else nixl_agent_config(num_threads=8)
+            config = (
+                nixl_agent_config(backends=self.nixl_backends)
+                if len(non_ucx_backends) > 0
+                else nixl_agent_config(num_threads=8)
+            )
 
         self.nixl_wrapper = NixlWrapper(str(uuid.uuid4()), config)
         # Map of engine_id -> {rank0: agent_name0, rank1: agent_name1..}.
@@ -509,9 +541,10 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
         # base port (which is sent in the KVTransferParams).
         # Each TP rank listens/queries on the base_port + tp_rank.
         self.side_channel_port: int = (
-            envs.VLLM_NIXL_SIDE_CHANNEL_PORT +
-            vllm_config.parallel_config.data_parallel_rank *
-            vllm_config.parallel_config.tensor_parallel_size)
+            envs.VLLM_NIXL_SIDE_CHANNEL_PORT
+            + vllm_config.parallel_config.data_parallel_rank
+            * vllm_config.parallel_config.tensor_parallel_size
+        )
 
         # Metadata.
         self.engine_id: EngineId = engine_id
@@ -522,15 +555,14 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
 
         # KV Caches and nixl tracking data.
         self.device_type = current_platform.device_type
-        self.kv_buffer_device: str = \
-            vllm_config.kv_transfer_config.kv_buffer_device
+        self.kv_buffer_device: str = vllm_config.kv_transfer_config.kv_buffer_device
         if self.device_type not in _NIXL_SUPPORTED_DEVICE:
             raise RuntimeError(f"{self.device_type} is not supported.")
-        elif self.kv_buffer_device not in _NIXL_SUPPORTED_DEVICE[
-                self.device_type]:
+        elif self.kv_buffer_device not in _NIXL_SUPPORTED_DEVICE[self.device_type]:
             raise RuntimeError(
                 f"{self.device_type} with {self.kv_buffer_device} kv_buffer "
-                "is not supported.")
+                "is not supported."
+            )
         self.device_kv_caches: dict[str, torch.Tensor] = {}
 
         # cpu kv buffer for xfer
@@ -548,7 +580,8 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
         if self.nixl_memory_type is None:
             raise RuntimeError(
                 f"{self.device_type} with {self.kv_buffer_device} kv_buffer "
-                "is not supported.")
+                "is not supported."
+            )
 
         # Note: host xfer buffer ops when use_host_buffer is True
         self.copy_blocks: Optional[CopyBlocksOp] = None
@@ -587,7 +620,8 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
         self._handshake_initiation_executor = ThreadPoolExecutor(
             # NIXL is not guaranteed to be thread-safe, limit 1 worker.
             max_workers=1,
-            thread_name_prefix="vllm-nixl-handshake-initiator")
+            thread_name_prefix="vllm-nixl-handshake-initiator",
+        )
         self._ready_requests = queue.Queue[tuple[ReqId, ReqMeta]]()
         self._handshake_futures: dict[EngineId, Future[dict[int, str]]] = {}
         # Protects _handshake_futures and _remote_agents.
@@ -604,11 +638,13 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
         self.block_window_per_layer: list[Optional[int]] = []
         self.use_mla = self.model_config.use_mla
 
-        backend = get_attn_backend(self.model_config.get_head_size(),
-                                   self.model_config.dtype,
-                                   self.cache_config.cache_dtype,
-                                   self.block_size,
-                                   use_mla=self.use_mla)
+        backend = get_attn_backend(
+            self.model_config.get_head_size(),
+            self.model_config.dtype,
+            self.cache_config.cache_dtype,
+            self.block_size,
+            use_mla=self.use_mla,
+        )
         self.backend_name = backend.get_name()
         attn_backend = backend_name_to_enum(self.backend_name)
         self._use_flashinfer = attn_backend == _Backend.FLASHINFER
@@ -624,9 +660,12 @@ def __init__(self, vllm_config: VllmConfig, engine_id: str):
         self.xfer_stats = NixlKVConnectorStats()
 
     @staticmethod
-    def _nixl_handshake_listener(metadata: NixlAgentMetadata,
-                                 ready_event: threading.Event, base_port: int,
-                                 tp_rank: int):
+    def _nixl_handshake_listener(
+        metadata: NixlAgentMetadata,
+        ready_event: threading.Event,
+        base_port: int,
+        tp_rank: int,
+    ):
         """Background thread for getting new NIXL handshakes."""
         # NOTE(rob): this is a simple implementation. We will move
         # to a better approach via HTTP endpoint soon.
@@ -634,8 +673,7 @@ def _nixl_handshake_listener(metadata: NixlAgentMetadata,
         encoder = msgspec.msgpack.Encoder()
         encoded_data = encoder.encode(metadata)
         size_in_bytes = len(encoded_data)
-        logger.debug("Size of encoded NixlAgentMetadata: %s bytes",
-                     str(size_in_bytes))
+        logger.debug("Size of encoded NixlAgentMetadata: %s bytes", str(size_in_bytes))
 
         # Listen for new requests for metadata.
         host = envs.VLLM_NIXL_SIDE_CHANNEL_HOST
@@ -646,8 +684,7 @@ def _nixl_handshake_listener(metadata: NixlAgentMetadata,
             while True:
                 identity, _, msg = sock.recv_multipart()
                 if msg != GET_META_MSG:
-                    logger.warning(
-                        "Connection listener got unexpected message %s", msg)
+                    logger.warning("Connection listener got unexpected message %s", msg)
                 sock.send_multipart((identity, b"", encoded_data))
 
     def _nixl_handshake(
@@ -670,8 +707,9 @@ def _nixl_handshake(
         tp_ratio = self._tp_size[self.engine_id] // remote_tp_size
         p_remote_rank = self.tp_rank // tp_ratio
         path = make_zmq_path("tcp", host, port + p_remote_rank)
-        logger.debug("Querying metadata on path: %s at remote rank %s", path,
-                     p_remote_rank)
+        logger.debug(
+            "Querying metadata on path: %s at remote rank %s", path, p_remote_rank
+        )
 
         # Send query for the request.
         with zmq_ctx(zmq.REQ, path) as sock:
@@ -680,27 +718,32 @@ def _nixl_handshake(
             decoder = msgspec.msgpack.Decoder(NixlAgentMetadata)
             metadata = decoder.decode(metadata_bytes)
             got_metadata_time = time.perf_counter()
-            logger.debug("NIXL handshake: get metadata took: %s",
-                         got_metadata_time - start_time)
+            logger.debug(
+                "NIXL handshake: get metadata took: %s", got_metadata_time - start_time
+            )
 
             # Ensure engine id matches.
             if metadata.engine_id != expected_engine_id:
-                raise RuntimeError(f"Remote NIXL agent engine ID mismatch. "
-                                   f"Expected {expected_engine_id},"
-                                   f"received {metadata.engine_id}.")
+                raise RuntimeError(
+                    f"Remote NIXL agent engine ID mismatch. "
+                    f"Expected {expected_engine_id},"
+                    f"received {metadata.engine_id}."
+                )
 
             # Register Remote agent.
-            remote_agent_name = self.add_remote_agent(metadata, p_remote_rank,
-                                                      remote_tp_size)
+            remote_agent_name = self.add_remote_agent(
+                metadata, p_remote_rank, remote_tp_size
+            )
             setup_agent_time = time.perf_counter()
-            logger.debug("NIXL handshake: add agent took: %s",
-                         setup_agent_time - got_metadata_time)
+            logger.debug(
+                "NIXL handshake: add agent took: %s",
+                setup_agent_time - got_metadata_time,
+            )
 
         # Remote rank -> agent name.
         return {p_remote_rank: remote_agent_name}
 
-    def initialize_host_xfer_buffer(
-            self, kv_caches: dict[str, torch.Tensor]) -> None:
+    def initialize_host_xfer_buffer(self, kv_caches: dict[str, torch.Tensor]) -> None:
         """
         Initialize transfer buffer in CPU mem for accelerators
         NOT directly supported by NIXL (e.g., tpu)
@@ -710,9 +753,9 @@ def initialize_host_xfer_buffer(
             for layer_name, kv_cache in kv_caches.items():
                 kv_shape = kv_cache.shape
                 kv_dtype = kv_cache.dtype
-                xfer_buffers[layer_name] = torch.empty(kv_shape,
-                                                       dtype=kv_dtype,
-                                                       device="cpu")
+                xfer_buffers[layer_name] = torch.empty(
+                    kv_shape, dtype=kv_dtype, device="cpu"
+                )
         except MemoryError as e:
             logger.error("NIXLConnectorWorker gets %s.", e)
             raise
@@ -727,14 +770,19 @@ def set_host_xfer_buffer_ops(self, copy_operation: CopyBlocksOp):
         assert self.use_host_buffer
         self.copy_blocks = copy_operation
 
-    def _background_nixl_handshake(self, req_id: str,
-                                   remote_engine_id: EngineId, meta: ReqMeta):
+    def _background_nixl_handshake(
+        self, req_id: str, remote_engine_id: EngineId, meta: ReqMeta
+    ):
         # Do NIXL handshake in background and add to _ready_requests when done.
         fut = self._handshake_futures.get(remote_engine_id)
         if fut is None:
             fut = self._handshake_initiation_executor.submit(
-                self._nixl_handshake, meta.remote_host, meta.remote_port,
-                meta.tp_size, remote_engine_id)
+                self._nixl_handshake,
+                meta.remote_host,
+                meta.remote_port,
+                meta.tp_size,
+                remote_engine_id,
+            )
             self._handshake_futures[remote_engine_id] = fut
 
             def done_callback(f: Future[dict[int, str]], eid=remote_engine_id):
@@ -761,18 +809,23 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
             self.initialize_host_xfer_buffer(kv_caches=kv_caches)
             assert len(self.host_xfer_buffers) == len(kv_caches), (
                 f"host_buffer: {len(self.host_xfer_buffers)}, "
-                f"kv_caches: {len(kv_caches)}")
+                f"kv_caches: {len(kv_caches)}"
+            )
             xfer_buffers = self.host_xfer_buffers
         else:
             xfer_buffers = kv_caches
             assert not self.host_xfer_buffers, (
                 "host_xfer_buffer should not be initialized when "
-                f"kv_buffer_device is {self.kv_buffer_device}")
+                f"kv_buffer_device is {self.kv_buffer_device}"
+            )
 
         logger.info(
             "Registering KV_Caches. use_mla: %s, kv_buffer_device: %s, "
-            "use_host_buffer: %s", self.use_mla, self.kv_buffer_device,
-            self.use_host_buffer)
+            "use_host_buffer: %s",
+            self.use_mla,
+            self.kv_buffer_device,
+            self.use_host_buffer,
+        )
 
         caches_data = []
         # With hybrid allocator, layers can share a kv cache tensor
@@ -786,16 +839,13 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
         # (roughly 8KB vs 5KB).
         # Conversely for FlashInfer, K and V are registered in the same region
         # to better exploit the memory layout (ie num_blocks is the first dim).
-        split_k_and_v = not (self.use_mla or self._use_pallas
-                             or self._use_flashinfer)
+        split_k_and_v = not (self.use_mla or self._use_pallas or self._use_flashinfer)
         tensor_size_bytes = None
         # Enable different block lengths for different layers when MLA is used.
         self.block_len_per_layer = list[int]()
         self.slot_size_per_layer = list[int]()  # HD bytes in kv terms
         for layer_name, cache_or_caches in xfer_buffers.items():
-            cache_list = cache_or_caches if split_k_and_v else [
-                cache_or_caches
-            ]
+            cache_list = cache_or_caches if split_k_and_v else [cache_or_caches]
 
             for cache in cache_list:
                 base_addr = cache.data_ptr()
@@ -809,23 +859,29 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
                     tensor_size_bytes = curr_tensor_size_bytes
                     self.num_blocks = cache.shape[0]
 
-                assert cache.shape[0] == self.num_blocks, \
+                assert cache.shape[0] == self.num_blocks, (
                     "All kv cache tensors must have the same number of blocks"
+                )
 
-                self.block_len_per_layer.append(curr_tensor_size_bytes //
-                                                self.num_blocks)
-                self.slot_size_per_layer.append(self.block_len_per_layer[-1] //
-                                                self.block_size)
+                self.block_len_per_layer.append(
+                    curr_tensor_size_bytes // self.num_blocks
+                )
+                self.slot_size_per_layer.append(
+                    self.block_len_per_layer[-1] // self.block_size
+                )
 
                 if not self.use_mla:
                     # Different kv cache shape is not supported by HeteroTP
-                    assert tensor_size_bytes == curr_tensor_size_bytes, \
+                    assert tensor_size_bytes == curr_tensor_size_bytes, (
                         "All kv cache tensors must have the same size"
+                    )
                 caches_data.append(
-                    (base_addr, curr_tensor_size_bytes, self.tp_rank, ""))
+                    (base_addr, curr_tensor_size_bytes, self.tp_rank, "")
+                )
 
-        logger.debug("Different block lengths collected: %s",
-                     set(self.block_len_per_layer))
+        logger.debug(
+            "Different block lengths collected: %s", set(self.block_len_per_layer)
+        )
         assert len(self.block_len_per_layer) == len(seen_base_addresses)
         assert self.num_blocks != 0
 
@@ -833,8 +889,7 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
         self.num_regions = len(caches_data)
         self.num_layers = len(xfer_buffers.keys())
 
-        descs = self.nixl_wrapper.get_reg_descs(caches_data,
-                                                self.nixl_memory_type)
+        descs = self.nixl_wrapper.get_reg_descs(caches_data, self.nixl_memory_type)
         logger.debug("Registering descs: %s", caches_data)
         self.nixl_wrapper.register_memory(descs, backends=self.nixl_backends)
         logger.debug("Done registering descs")
@@ -880,21 +935,27 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
                     # Register addresses for V cache (K registered first).
                     v_addr = addr + kv_block_len
                     blocks_data.append((v_addr, kv_block_len, self.tp_rank))
-        logger.debug("Created %s blocks for src engine %s and rank %s",
-                     len(blocks_data), self.engine_id, self.tp_rank)
+        logger.debug(
+            "Created %s blocks for src engine %s and rank %s",
+            len(blocks_data),
+            self.engine_id,
+            self.tp_rank,
+        )
 
-        descs = self.nixl_wrapper.get_xfer_descs(blocks_data,
-                                                 self.nixl_memory_type)
+        descs = self.nixl_wrapper.get_xfer_descs(blocks_data, self.nixl_memory_type)
         # NIXL_INIT_AGENT to be used for preparations of local descs.
         self.src_xfer_side_handle = self.nixl_wrapper.prep_xfer_dlist(
-            "NIXL_INIT_AGENT", descs)
+            "NIXL_INIT_AGENT", descs
+        )
 
         # TODO(mgoin): Hybrid memory allocator is currently disabled for
         # models with local attention (Llama 4). Can remove this once enabled.
         if self.vllm_config.model_config.hf_config.model_type == "llama4":
             from transformers import Llama4TextConfig
-            assert isinstance(self.vllm_config.model_config.hf_text_config,
-                              Llama4TextConfig)
+
+            assert isinstance(
+                self.vllm_config.model_config.hf_text_config, Llama4TextConfig
+            )
             llama4_config = self.vllm_config.model_config.hf_text_config
             no_rope_layers = llama4_config.no_rope_layers
             chunk_size = llama4_config.attention_chunk_size
@@ -905,8 +966,10 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
                 is_local_attention = no_rope_layers[layer_idx] != 0
                 block_window = chunk_block_size if is_local_attention else None
                 self.block_window_per_layer.append(block_window)
-            logger.debug("Llama 4 block window per layer mapping: %s",
-                         self.block_window_per_layer)
+            logger.debug(
+                "Llama 4 block window per layer mapping: %s",
+                self.block_window_per_layer,
+            )
             assert len(self.block_window_per_layer) == self.num_layers
 
         # After KV Caches registered, listen for new connections.
@@ -917,33 +980,37 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
             num_blocks=self.num_blocks,
             block_lens=self.block_len_per_layer,
             attn_backend_name=self.backend_name,
-            kv_cache_layout=self.kv_cache_layout)
+            kv_cache_layout=self.kv_cache_layout,
+        )
         ready_event = threading.Event()
         self._nixl_handshake_listener_t = threading.Thread(
             target=self._nixl_handshake_listener,
             args=(metadata, ready_event, self.side_channel_port, self.tp_rank),
             daemon=True,
-            name="nixl_handshake_listener")
+            name="nixl_handshake_listener",
+        )
         self._nixl_handshake_listener_t.start()
         ready_event.wait()  # Wait for listener ZMQ socket to be ready.
 
-    def add_remote_agent(self,
-                         nixl_agent_meta: NixlAgentMetadata,
-                         remote_tp_rank: int = 0,
-                         remote_tp_size: int = 1) -> str:
+    def add_remote_agent(
+        self,
+        nixl_agent_meta: NixlAgentMetadata,
+        remote_tp_rank: int = 0,
+        remote_tp_size: int = 1,
+    ) -> str:
         """
         Add the remote NIXL agent and prepare the descriptors for reading cache
         blocks from remote.
 
         In particular, handle both homogeneous and heterogeneous TP. The former
-        requires local rank_i to read from remote rank_i. 
-        The latter, assuming D.world_size > P.world_size, requires that two or 
+        requires local rank_i to read from remote rank_i.
+        The latter, assuming D.world_size > P.world_size, requires that two or
         more local TP worker share the xfer from a single TP worker.
 
         Here's an example (non-MLA case):
 
         rank_offset     p_remote_tp_rank
-        (kv split no)    
+        (kv split no)
         --------------------------------
             0                 0      Worker0  ---- 1st half of KV ----> Worker0  [ KV Cache ]
                                                                         /
@@ -956,19 +1023,19 @@ def add_remote_agent(self,
 
                                 Decoder TP workers                     Prefix TP workers
                                   (world_size=4)                         (world_size=2)
-                                                 tp_ratio = 4 // 2 = 2                  
-                                
-        Considering the KV Caches, if P-Worker_i has cache size [2, num_blocksP, kv_heads, block_size, head_dim]  
+                                                 tp_ratio = 4 // 2 = 2
+
+        Considering the KV Caches, if P-Worker_i has cache size [2, num_blocksP, kv_heads, block_size, head_dim]
         then D-Worker_j has [2, num_blocksD, kv_heads//tp_ratio, block_size, head_dim]. Mind the "HND" layout format.
-        Assuming num_blocksD >= num_blocksP, D-Worker0 reads from P-Worker0 by preparing the kv_heads//tp_ratio 
+        Assuming num_blocksD >= num_blocksP, D-Worker0 reads from P-Worker0 by preparing the kv_heads//tp_ratio
         first heads from all the slots of all the blocks. D-Worker1 will do the same, but reading the second split
-        along the kv_heads dimension, and so forth until "tp_ratio" D TP workers have pulled from P-Worker0.   
-        
+        along the kv_heads dimension, and so forth until "tp_ratio" D TP workers have pulled from P-Worker0.
+
         Note that the above will also hold true for the homogeneous TP case, where tp_ratio evaluates to 1.
 
         Regarding MLA case, the cache is replicated across TP workers so the rank_offset will just always be 0
         so that the whole cache is shared by "tp_ratio" D TP workers.
-        """ # noqa: E501
+        """  # noqa: E501
         engine_id = nixl_agent_meta.engine_id
         # TODO re-evaluate refreshing for scaling/recovery
         if remote_tp_rank in self._remote_agents.get(engine_id, {}):
@@ -982,15 +1049,16 @@ def add_remote_agent(self,
         assert nixl_agent_meta.attn_backend_name == self.backend_name
 
         remote_agent_name = self.nixl_wrapper.add_remote_agent(
-            nixl_agent_meta.agent_metadata)
+            nixl_agent_meta.agent_metadata
+        )
 
         # Number of D TP workers reading from a single P TP worker. This is
         # 1 when P and D `--tensor-parallel-size` match.
-        tp_ratio = divide(self._tp_size[self.engine_id],
-                          self._tp_size[engine_id])
+        tp_ratio = divide(self._tp_size[self.engine_id], self._tp_size[engine_id])
         assert tp_ratio > 0, "Decode TP cannot be smaller than prefill TP"
-        assert not self._use_pallas or tp_ratio == 1, \
-               "TPU (pallas_v1) DOES NOT support heterogeneous TP yet."
+        assert not self._use_pallas or tp_ratio == 1, (
+            "TPU (pallas_v1) DOES NOT support heterogeneous TP yet."
+        )
 
         # Handle tp_size>num_kv_heads: replicate KV cache.
         total_num_kv_heads = self.model_config.get_total_num_kv_heads()
@@ -999,17 +1067,19 @@ def add_remote_agent(self,
         remote_block_len = nixl_agent_meta.block_lens[0]
         if self.use_mla or is_kv_replicated:
             # With replicated KV cache, only the number of blocks can differ.
-            assert self.block_len_per_layer == nixl_agent_meta.block_lens, \
+            assert self.block_len_per_layer == nixl_agent_meta.block_lens, (
                 "KV cache sizes must match between P and D when replicated"
-            remote_block_size = remote_block_len // (
-                self.slot_size_per_layer[0])
+            )
+            remote_block_size = remote_block_len // (self.slot_size_per_layer[0])
         else:
             # When MLA is not used, this is a list of the same block length
             for block_len in nixl_agent_meta.block_lens:
-                assert block_len == remote_block_len, \
+                assert block_len == remote_block_len, (
                     "All remote layers must have the same block size"
+                )
             remote_block_size = remote_block_len // (
-                self.slot_size_per_layer[0] * tp_ratio)
+                self.slot_size_per_layer[0] * tp_ratio
+            )
             if self._use_flashinfer:
                 # With flashinfer, KV are sent in the same message.
                 remote_block_size //= 2
@@ -1017,8 +1087,7 @@ def add_remote_agent(self,
                 # Heterogeneous TP expects same kv_cache_layout.
                 assert nixl_agent_meta.kv_cache_layout == self.kv_cache_layout
                 if self.device_type == "xpu":
-                    raise ValueError(
-                        "Heterogeneous TP is not supported on XPU")
+                    raise ValueError("Heterogeneous TP is not supported on XPU")
 
             assert remote_block_len == self.block_len_per_layer[0] * tp_ratio, (
                 "Remote P worker KV layer cache must be of shape [2, N, "
@@ -1027,7 +1096,8 @@ def add_remote_agent(self,
 
         assert self.block_size == remote_block_size, (
             "Remote P worker with different page/block size is not supported "
-            f"{self.block_size=}, {remote_block_size=}")
+            f"{self.block_size=}, {remote_block_size=}"
+        )
 
         # Create dst descs and xfer side handles. TP workers have same #blocks.
         if engine_id in self.dst_num_blocks:
@@ -1040,16 +1110,17 @@ def add_remote_agent(self,
         # rank. With heterogeneous TP, prepare the descriptors by splitting the
         # P KV cache along kv_head dim, of D worker's kv_head size (D>P).
         # Eg. PTP1 DTP2 => P0 KV:[block0-KV_0 | block0-KV_1..].
-        self.kv_caches_base_addr[
-            engine_id] = nixl_agent_meta.kv_caches_base_addr
+        self.kv_caches_base_addr[engine_id] = nixl_agent_meta.kv_caches_base_addr
 
-        assert len(nixl_agent_meta.kv_caches_base_addr) == len(
-            self.block_len_per_layer)
+        assert len(nixl_agent_meta.kv_caches_base_addr) == len(self.block_len_per_layer)
         # Register all remote blocks, but only the corresponding kv heads.
         for i, base_addr in enumerate(nixl_agent_meta.kv_caches_base_addr):
             kv_block_len = self.get_backend_aware_kv_block_len(layer_idx=i)
-            rank_offset = self.tp_rank % tp_ratio * kv_block_len \
-                if not (self.use_mla or is_kv_replicated) else 0
+            rank_offset = (
+                self.tp_rank % tp_ratio * kv_block_len
+                if not (self.use_mla or is_kv_replicated)
+                else 0
+            )
             for block_id in range(nixl_agent_meta.num_blocks):
                 block_offset = block_id * nixl_agent_meta.block_lens[i]
                 # For each block, grab the heads chunk belonging to rank_i
@@ -1068,16 +1139,18 @@ def add_remote_agent(self,
                     blocks_data.append((v_addr, kv_block_len, remote_tp_rank))
 
         logger.debug(
-            "Created %s blocks for dst engine %s with remote rank %s and "
-            "local rank %s", len(blocks_data), engine_id, remote_tp_rank,
-            self.tp_rank)
+            "Created %s blocks for dst engine %s with remote rank %s and local rank %s",
+            len(blocks_data),
+            engine_id,
+            remote_tp_rank,
+            self.tp_rank,
+        )
 
         # Register with NIXL.
-        descs = self.nixl_wrapper.get_xfer_descs(blocks_data,
-                                                 self.nixl_memory_type)
-        self.dst_xfer_side_handles[
-            engine_id] = self.nixl_wrapper.prep_xfer_dlist(
-                remote_agent_name, descs)
+        descs = self.nixl_wrapper.get_xfer_descs(blocks_data, self.nixl_memory_type)
+        self.dst_xfer_side_handles[engine_id] = self.nixl_wrapper.prep_xfer_dlist(
+            remote_agent_name, descs
+        )
 
         return remote_agent_name
 
@@ -1087,13 +1160,20 @@ def sync_recved_kv_to_device(self, req_id: str, meta: ReqMeta):
         assert self.copy_blocks is not None
 
         local_block_ids = meta.local_block_ids
-        self.copy_blocks(self.host_xfer_buffers, self.device_kv_caches,
-                         local_block_ids, local_block_ids, "h2d")
+        self.copy_blocks(
+            self.host_xfer_buffers,
+            self.device_kv_caches,
+            local_block_ids,
+            local_block_ids,
+            "h2d",
+        )
         if logger.isEnabledFor(logging.DEBUG):
             logger.debug(
                 "synced recved kv of request[%s] to device kv buffer,"
-                "local_block_ids: %s. ", req_id,
-                ",".join(map(str, meta.local_block_ids)))
+                "local_block_ids: %s. ",
+                req_id,
+                ",".join(map(str, meta.local_block_ids)),
+            )
 
     def save_kv_to_host(self, metadata: NixlConnectorMetadata):
         """copy kv from device to host buffer."""
@@ -1104,11 +1184,18 @@ def save_kv_to_host(self, metadata: NixlConnectorMetadata):
             if logger.isEnabledFor(logging.DEBUG):
                 logger.debug(
                     "save_load_kv for request[%s] to host xfer buffer."
-                    "local_block_ids: %s. ", req_id,
-                    ",".join(map(str, meta.local_block_ids)))
+                    "local_block_ids: %s. ",
+                    req_id,
+                    ",".join(map(str, meta.local_block_ids)),
+                )
             # blocking
-            self.copy_blocks(self.device_kv_caches, self.host_xfer_buffers,
-                             meta.local_block_ids, meta.local_block_ids, "d2h")
+            self.copy_blocks(
+                self.device_kv_caches,
+                self.host_xfer_buffers,
+                meta.local_block_ids,
+                meta.local_block_ids,
+                "d2h",
+            )
 
     def get_finished(self) -> tuple[set[str], set[str]]:
         """
@@ -1121,8 +1208,11 @@ def get_finished(self) -> tuple[set[str], set[str]]:
         if len(done_sending) > 0 or len(done_recving) > 0:
             logger.debug(
                 "Rank %s, get_finished: %s requests done sending "
-                "and %s requests done recving", self.tp_rank,
-                len(done_sending), len(done_recving))
+                "and %s requests done recving",
+                self.tp_rank,
+                len(done_sending),
+                len(done_recving),
+            )
 
         if self.use_host_buffer:
             for req_id in done_recving:
@@ -1140,8 +1230,11 @@ def get_finished(self) -> tuple[set[str], set[str]]:
             count = self.consumer_notification_counts_by_req.pop(req_id, 0)
             logger.warning(
                 "Releasing expired KV blocks for request %s which were "
-                "retrieved by %d decode worker(s) within %d seconds.", req_id,
-                count, envs.VLLM_NIXL_ABORT_REQUEST_TIMEOUT)
+                "retrieved by %d decode worker(s) within %d seconds.",
+                req_id,
+                count,
+                envs.VLLM_NIXL_ABORT_REQUEST_TIMEOUT,
+            )
             self._reqs_to_process.remove(req_id)
             del self._reqs_to_send[req_id]
             done_sending.add(req_id)
@@ -1158,18 +1251,21 @@ def _get_new_notifs(self) -> set[str]:
         for notifs in self.nixl_wrapper.get_new_notifs().values():
             for notif in notifs:
                 req_id, tp_ratio = notif.decode("utf-8").rsplit(":", 1)
-                if (req_id not in self._reqs_to_send
-                        and req_id not in self._reqs_to_process):
+                if (
+                    req_id not in self._reqs_to_send
+                    and req_id not in self._reqs_to_process
+                ):
                     logger.error(
                         "Potentially invalid KV blocks for "
                         "unrecognized request %s were retrieved by "
-                        "a decode worker. They may have expired.", req_id)
+                        "a decode worker. They may have expired.",
+                        req_id,
+                    )
                     continue
 
                 self.consumer_notification_counts_by_req[req_id] += 1
                 # Wait all consumers (D) to be done reading before freeing.
-                if self.consumer_notification_counts_by_req[req_id] == int(
-                        tp_ratio):
+                if self.consumer_notification_counts_by_req[req_id] == int(tp_ratio):
                     notified_req_ids.add(req_id)
                     del self.consumer_notification_counts_by_req[req_id]
                     self._reqs_to_process.remove(req_id)
@@ -1177,7 +1273,8 @@ def _get_new_notifs(self) -> set[str]:
         return notified_req_ids
 
     def _pop_done_transfers(
-            self, transfers: dict[str, list[tuple[int, float]]]) -> set[str]:
+        self, transfers: dict[str, list[tuple[int, float]]]
+    ) -> set[str]:
         """
         Pop completed xfers by checking for DONE state.
         Args:
@@ -1199,8 +1296,7 @@ def _pop_done_transfers(
                     in_progress = True
                     continue
                 else:
-                    raise RuntimeError("Transfer failed with state %s",
-                                       xfer_state)
+                    raise RuntimeError("Transfer failed with state %s", xfer_state)
             if not in_progress:
                 done_req_ids.add(req_id)
                 del transfers[req_id]
@@ -1215,17 +1311,19 @@ def start_load_kv(self, metadata: NixlConnectorMetadata):
             remote_engine_id = meta.remote_engine_id
             logger.debug(
                 "start_load_kv for request %s from remote engine %s. "
-                "Num local_block_ids: %s. Num remote_block_ids: %s. ", req_id,
-                remote_engine_id, len(meta.local_block_ids),
-                len(meta.remote_block_ids))
+                "Num local_block_ids: %s. Num remote_block_ids: %s. ",
+                req_id,
+                remote_engine_id,
+                len(meta.local_block_ids),
+                len(meta.remote_block_ids),
+            )
             if self.use_host_buffer:
                 self._recving_metadata[req_id] = meta
             if remote_engine_id not in self._remote_agents:
                 # Initiate handshake with remote engine to exchange metadata.
                 with self._handshake_lock:
                     if remote_engine_id not in self._remote_agents:
-                        self._background_nixl_handshake(
-                            req_id, remote_engine_id, meta)
+                        self._background_nixl_handshake(req_id, remote_engine_id, meta)
                         continue
 
             # Handshake already completed, start async read xfer.
@@ -1256,7 +1354,9 @@ def start_load_kv(self, metadata: NixlConnectorMetadata):
     def _read_blocks_for_req(self, req_id: str, meta: ReqMeta):
         logger.debug(
             "Remote agent %s available, calling _read_blocks for req %s",
-            meta.remote_engine_id, req_id)
+            meta.remote_engine_id,
+            req_id,
+        )
         self._read_blocks(
             request_id=req_id,
             dst_engine_id=meta.remote_engine_id,
@@ -1264,9 +1364,13 @@ def _read_blocks_for_req(self, req_id: str, meta: ReqMeta):
             remote_block_ids=meta.remote_block_ids,
         )
 
-    def _read_blocks(self, local_block_ids: list[int],
-                     remote_block_ids: list[int], dst_engine_id: str,
-                     request_id: str):
+    def _read_blocks(
+        self,
+        local_block_ids: list[int],
+        remote_block_ids: list[int],
+        dst_engine_id: str,
+        request_id: str,
+    ):
         # NOTE(rob): having the staging blocks be on the READER side is
         # not going to work well (since we will have to call rearrange tensors).
         # after we detect the txn is complete (which means we cannot make the
@@ -1279,8 +1383,7 @@ def _read_blocks(self, local_block_ids: list[int],
 
         # Number of D TP workers that will read from dst P. Propagate tp_ratio
         # on notification so that dst worker can wait before freeing blocks.
-        tp_ratio = self._tp_size[
-            self.engine_id] // self._tp_size[dst_engine_id]
+        tp_ratio = self._tp_size[self.engine_id] // self._tp_size[dst_engine_id]
         notif_id = f"{request_id}:{tp_ratio}".encode()
 
         # Full prefix cache hit: do not need to read remote blocks,
@@ -1312,16 +1415,17 @@ def _read_blocks(self, local_block_ids: list[int],
         if not self.block_window_per_layer:
             # Default case: assume global attention
             remote_block_descs_ids = self._get_block_descs_ids(
-                dst_engine_id, remote_block_ids)
+                dst_engine_id, remote_block_ids
+            )
             local_block_descs_ids = self._get_block_descs_ids(
-                self.engine_id, local_block_ids)
+                self.engine_id, local_block_ids
+            )
         else:
             # TODO(mgoin): remove this once we have hybrid memory allocator
             # Optimization for models with local attention (Llama 4)
             local_descs_list = []
             remote_descs_list = []
-            for layer_idx, block_window in enumerate(
-                    self.block_window_per_layer):
+            for layer_idx, block_window in enumerate(self.block_window_per_layer):
                 # For each layer:
                 if block_window is None:
                     # If not chunked, we just use the
@@ -1335,9 +1439,11 @@ def _read_blocks(self, local_block_ids: list[int],
 
                 # Get descs ids for the layer.
                 layer_local_desc_ids = self._get_block_descs_ids(
-                    self.engine_id, layer_local_block_ids, layer_idx)
+                    self.engine_id, layer_local_block_ids, layer_idx
+                )
                 layer_remote_desc_ids = self._get_block_descs_ids(
-                    dst_engine_id, layer_remote_block_ids, layer_idx)
+                    dst_engine_id, layer_remote_block_ids, layer_idx
+                )
 
                 local_descs_list.append(layer_local_desc_ids)
                 remote_descs_list.append(layer_remote_desc_ids)
@@ -1361,13 +1467,11 @@ def _read_blocks(self, local_block_ids: list[int],
         self.nixl_wrapper.transfer(handle)
 
         # Use handle to check completion in future step().
-        self._recving_transfers[request_id].append(
-            (handle, time.perf_counter()))
+        self._recving_transfers[request_id].append((handle, time.perf_counter()))
 
-    def _get_block_descs_ids(self,
-                             engine_id: str,
-                             block_ids: list[int],
-                             layer_idx: Optional[int] = None) -> np.ndarray:
+    def _get_block_descs_ids(
+        self, engine_id: str, block_ids: list[int], layer_idx: Optional[int] = None
+    ) -> np.ndarray:
         """
         Get the descs ids for a set of block ids.
         If layer_idx is provided, we use the region_ids for the given layer.
@@ -1400,7 +1504,7 @@ def get_backend_aware_kv_block_len(self, layer_idx: int):
         """
         Get the block length for one K/V element (K and V have the same size).
 
-        For FA and other backends, this is equal to the length of the whole 
+        For FA and other backends, this is equal to the length of the whole
         block, as K and V are in separate regions.
         For FlashInfer, this is half the length of the whole block, as K and V
         share the same region.
@@ -1456,10 +1560,9 @@ def zmq_ctx(socket_type: Any, addr: str) -> Iterator[zmq.Socket]:
     ctx: Optional[zmq.Context] = None
     try:
         ctx = zmq.Context()  # type: ignore[attr-defined]
-        yield make_zmq_socket(ctx=ctx,
-                              path=addr,
-                              socket_type=socket_type,
-                              bind=socket_type == zmq.ROUTER)
+        yield make_zmq_socket(
+            ctx=ctx, path=addr, socket_type=socket_type, bind=socket_type == zmq.ROUTER
+        )
     finally:
         if ctx is not None:
             ctx.destroy(linger=0)
@@ -1547,4 +1650,4 @@ def reduce(self) -> dict[str, Union[int, float]]:
 
     @property
     def num_successful_transfers(self) -> int:
-        return len(self.data["transfer_duration"])
\ No newline at end of file
+        return len(self.data["transfer_duration"])
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/offloading_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/offloading_connector.py
index 6936638c7f4e..745af0efba18 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/offloading_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/offloading_connector.py
@@ -11,10 +11,11 @@
 from vllm.attention import AttentionMetadata
 from vllm.config import VllmConfig
 from vllm.distributed.kv_events import BlockRemoved, BlockStored, KVCacheEvent
-from vllm.distributed.kv_transfer.kv_connector.v1 import (KVConnectorBase_V1,
-                                                          KVConnectorRole)
-from vllm.distributed.kv_transfer.kv_connector.v1.base import (
-    KVConnectorMetadata)
+from vllm.distributed.kv_transfer.kv_connector.v1 import (
+    KVConnectorBase_V1,
+    KVConnectorRole,
+)
+from vllm.distributed.kv_transfer.kv_connector.v1.base import KVConnectorMetadata
 from vllm.forward_context import ForwardContext
 from vllm.logger import init_logger
 from vllm.v1.core.kv_cache_manager import KVCacheBlocks
@@ -40,7 +41,6 @@ class OffloadingConnectorMetadata(KVConnectorMetadata):
 
 
 class OffloadingConnector(KVConnectorBase_V1):
-
     def __init__(self, vllm_config: VllmConfig, role: KVConnectorRole):
         super().__init__(vllm_config, role)
 
@@ -57,47 +57,51 @@ def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
         assert self.connector_worker is not None
         self.connector_worker.register_kv_caches(kv_caches)
 
-    def start_load_kv(self, forward_context: "ForwardContext",
-                      **kwargs) -> None:
+    def start_load_kv(self, forward_context: "ForwardContext", **kwargs) -> None:
         assert self.connector_worker is not None
-        assert isinstance(self._connector_metadata,
-                          OffloadingConnectorMetadata)
+        assert isinstance(self._connector_metadata, OffloadingConnectorMetadata)
         self.connector_worker.start_load_kv(self._connector_metadata)
 
     def wait_for_layer_load(self, layer_name: str) -> None:
         pass
 
-    def save_kv_layer(self, layer_name: str, kv_layer: torch.Tensor,
-                      attn_metadata: "AttentionMetadata", **kwargs) -> None:
+    def save_kv_layer(
+        self,
+        layer_name: str,
+        kv_layer: torch.Tensor,
+        attn_metadata: "AttentionMetadata",
+        **kwargs,
+    ) -> None:
         pass
 
     def wait_for_save(self):
         assert self.connector_worker is not None
-        assert isinstance(self._connector_metadata,
-                          OffloadingConnectorMetadata)
+        assert isinstance(self._connector_metadata, OffloadingConnectorMetadata)
         self.connector_worker.start_store_kv(self._connector_metadata)
 
-    def get_finished(self,
-                     finished_req_ids: set[str]) -> tuple[set[str], set[str]]:
+    def get_finished(self, finished_req_ids: set[str]) -> tuple[set[str], set[str]]:
         assert self.connector_worker is not None
         return self.connector_worker.get_finished(finished_req_ids)
 
     def get_num_new_matched_tokens(
-            self, request: "Request",
-            num_computed_tokens: int) -> tuple[int, bool]:
+        self, request: "Request", num_computed_tokens: int
+    ) -> tuple[int, bool]:
         assert self.connector_scheduler is not None
         return self.connector_scheduler.get_num_new_matched_tokens(
-            request, num_computed_tokens)
+            request, num_computed_tokens
+        )
 
-    def update_state_after_alloc(self, request: "Request",
-                                 blocks: "KVCacheBlocks",
-                                 num_external_tokens: int):
+    def update_state_after_alloc(
+        self, request: "Request", blocks: "KVCacheBlocks", num_external_tokens: int
+    ):
         assert self.connector_scheduler is not None
         return self.connector_scheduler.update_state_after_alloc(
-            request, blocks, num_external_tokens)
+            request, blocks, num_external_tokens
+        )
 
     def build_connector_meta(
-            self, scheduler_output: SchedulerOutput) -> KVConnectorMetadata:
+        self, scheduler_output: SchedulerOutput
+    ) -> KVConnectorMetadata:
         assert self.connector_scheduler is not None
         return self.connector_scheduler.build_connector_meta(scheduler_output)
 
@@ -124,8 +128,7 @@ class OffloadingConnectorScheduler:
     def __init__(self, spec: OffloadingSpec):
         self.gpu_block_size = spec.gpu_block_size
         self.offloaded_block_size = spec.offloaded_block_size
-        self.block_size_factor = (self.offloaded_block_size //
-                                  self.gpu_block_size)
+        self.block_size_factor = self.offloaded_block_size // self.gpu_block_size
         self.manager: OffloadingManager = spec.get_manager()
 
         self._requests: dict[ReqId, Request] = {}
@@ -151,11 +154,12 @@ def _get_block_hashes(
             req.block_hashes,
             self.block_size_factor * start_idx + self.block_size_factor - 1,
             self.block_size_factor * end_idx if end_idx else None,
-            self.block_size_factor)
+            self.block_size_factor,
+        )
 
     def get_num_new_matched_tokens(
-            self, request: Request,
-            num_computed_tokens: int) -> tuple[int, bool]:
+        self, request: Request, num_computed_tokens: int
+    ) -> tuple[int, bool]:
         """
         Get number of new tokens that can be loaded beyond the
         num_computed_tokens.
@@ -174,8 +178,7 @@ def get_num_new_matched_tokens(
         """
         num_blocks = request.num_tokens // self.offloaded_block_size
 
-        assert (len(request.block_hashes) //
-                self.block_size_factor == num_blocks)
+        assert len(request.block_hashes) // self.block_size_factor == num_blocks
         block_hashes = self._get_block_hashes(request)
 
         self.manager.touch(block_hashes)
@@ -187,12 +190,14 @@ def get_num_new_matched_tokens(
 
         start_block_idx = num_computed_tokens // self.offloaded_block_size
         hits = self.manager.lookup(
-            self._get_block_hashes(request, start_idx=start_block_idx))
+            self._get_block_hashes(request, start_idx=start_block_idx)
+        )
         if hits == 0:
             return 0, False
 
-        num_hit_tokens = (self.offloaded_block_size *
-                          (start_block_idx + hits) - num_computed_tokens)
+        num_hit_tokens = (
+            self.offloaded_block_size * (start_block_idx + hits) - num_computed_tokens
+        )
         logger.debug(
             "Request %s hit %s offloaded tokens after %s GPU hit tokens",
             request.request_id,
@@ -204,8 +209,9 @@ def get_num_new_matched_tokens(
 
         return num_hit_tokens, True
 
-    def update_state_after_alloc(self, request: Request, blocks: KVCacheBlocks,
-                                 num_external_tokens: int):
+    def update_state_after_alloc(
+        self, request: Request, blocks: KVCacheBlocks, num_external_tokens: int
+    ):
         self._requests[request.request_id] = request
         # the block ids are updated in _get_reqs_to_store
         self._request_block_ids[request.request_id] = []
@@ -216,31 +222,30 @@ def update_state_after_alloc(self, request: Request, blocks: KVCacheBlocks,
         block_groups = blocks.get_block_ids()
         block_ids = block_groups[0]
 
-        num_computed_gpu_blocks = sum(block.block_hash is not None
-                                      for block in blocks.blocks[0])
+        num_computed_gpu_blocks = sum(
+            block.block_hash is not None for block in blocks.blocks[0]
+        )
         num_computed_tokens = num_computed_gpu_blocks * self.gpu_block_size
         full_block_tokens = num_computed_tokens + num_external_tokens
         assert full_block_tokens % self.offloaded_block_size == 0
 
         num_pending_gpu_blocks = len(block_ids) - num_computed_gpu_blocks
-        assert (num_external_tokens == num_pending_gpu_blocks *
-                self.gpu_block_size)
+        assert num_external_tokens == num_pending_gpu_blocks * self.gpu_block_size
 
         start_block_idx = num_computed_tokens // self.offloaded_block_size
         num_blocks = full_block_tokens // self.offloaded_block_size
 
-        assert (len(request.block_hashes) // self.block_size_factor
-                >= num_blocks)
-        block_hashes = self._get_block_hashes(request,
-                                              start_idx=start_block_idx,
-                                              end_idx=num_blocks)
+        assert len(request.block_hashes) // self.block_size_factor >= num_blocks
+        block_hashes = self._get_block_hashes(
+            request, start_idx=start_block_idx, end_idx=num_blocks
+        )
 
         src_spec = self.manager.prepare_load(block_hashes)
         dst_spec = GPULoadStoreSpec(block_ids[num_computed_gpu_blocks:])
 
-        block_hashes = self._get_block_hashes(request,
-                                              start_idx=start_block_idx,
-                                              end_idx=num_blocks)
+        block_hashes = self._get_block_hashes(
+            request, start_idx=start_block_idx, end_idx=num_blocks
+        )
 
         self._reqs_to_load[request.request_id] = (src_spec, dst_spec)
         self._reqs_being_loaded[request.request_id].update(block_hashes)
@@ -249,9 +254,7 @@ def update_state_after_alloc(self, request: Request, blocks: KVCacheBlocks,
     def _get_reqs_to_store(self, scheduler_output: SchedulerOutput):
         reqs_to_store: dict[ReqId, TransferSpec] = {}
         # iterate over both new and cached requests
-        for req_id, new_block_id_groups, preempted in yield_req_data(
-                scheduler_output):
-
+        for req_id, new_block_id_groups, preempted in yield_req_data(scheduler_output):
             if preempted:
                 self._request_block_ids[req_id] = []
 
@@ -275,11 +278,13 @@ def _get_reqs_to_store(self, scheduler_output: SchedulerOutput):
             assert len(req.block_hashes) >= num_gpu_blocks
 
             new_block_hashes = self._get_block_hashes(
-                req, start_idx=start_block_idx, end_idx=num_blocks)
+                req, start_idx=start_block_idx, end_idx=num_blocks
+            )
             store_output = self.manager.prepare_store(new_block_hashes)
             if store_output is None:
-                logger.warning("Request %s: cannot store %s blocks", req_id,
-                               num_new_blocks)
+                logger.warning(
+                    "Request %s: cannot store %s blocks", req_id, num_new_blocks
+                )
                 continue
 
             self._next_stored_block_idx[req_id] = num_blocks
@@ -292,7 +297,8 @@ def _get_reqs_to_store(self, scheduler_output: SchedulerOutput):
             self.manager.touch(block_hashes)
 
             new_block_hashes = self._get_block_hashes(
-                req, start_idx=start_block_idx, end_idx=num_blocks)
+                req, start_idx=start_block_idx, end_idx=num_blocks
+            )
             dst_spec = store_output.store_spec
             src_block_ids: list[int] = []
             for idx, blk_hash in enumerate(new_block_hashes):
@@ -317,10 +323,12 @@ def _get_reqs_to_store(self, scheduler_output: SchedulerOutput):
         return reqs_to_store
 
     def build_connector_meta(
-            self, scheduler_output: SchedulerOutput) -> KVConnectorMetadata:
+        self, scheduler_output: SchedulerOutput
+    ) -> KVConnectorMetadata:
         meta = OffloadingConnectorMetadata(
             reqs_to_load=self._reqs_to_load,
-            reqs_to_store=self._get_reqs_to_store(scheduler_output))
+            reqs_to_store=self._get_reqs_to_store(scheduler_output),
+        )
         self._reqs_to_load = {}
         return meta
 
@@ -373,15 +381,16 @@ def take_events(self) -> Iterable[KVCacheEvent]:
         """
         for event in self.manager.take_events():
             if event.removed:
-                yield BlockRemoved(block_hashes=event.block_hashes,
-                                   medium=event.medium)
+                yield BlockRemoved(block_hashes=event.block_hashes, medium=event.medium)
             else:
-                yield BlockStored(block_hashes=event.block_hashes,
-                                  parent_block_hash=None,
-                                  token_ids=[],
-                                  lora_id=None,
-                                  block_size=event.block_size,
-                                  medium=event.medium)
+                yield BlockStored(
+                    block_hashes=event.block_hashes,
+                    parent_block_hash=None,
+                    token_ids=[],
+                    lora_id=None,
+                    block_size=event.block_size,
+                    medium=event.medium,
+                )
 
 
 class OffloadingConnectorWorker:
@@ -408,7 +417,7 @@ def _generate_job_id(self) -> int:
         return job_id
 
     def register_kv_caches(self, kv_caches: dict[str, torch.Tensor]):
-        for src_cls, dst_cls, handler in (self.spec.get_handlers(kv_caches)):
+        for src_cls, dst_cls, handler in self.spec.get_handlers(kv_caches):
             self.worker.register_handler(src_cls, dst_cls, handler)
 
     def start_load_kv(self, metadata: OffloadingConnectorMetadata):
@@ -426,8 +435,7 @@ def start_store_kv(self, metadata: OffloadingConnectorMetadata):
             self._store_jobs[req_id].add(job_id)
             assert self.worker.transfer_async(job_id, transfer_spec)
 
-    def get_finished(self,
-                     finished_req_ids: set[str]) -> tuple[set[str], set[str]]:
+    def get_finished(self, finished_req_ids: set[str]) -> tuple[set[str], set[str]]:
         """
         Notifies worker-side connector ids of requests that have
         finished generating tokens.
@@ -471,7 +479,8 @@ def get_finished(self,
 
 
 def yield_req_data(
-        scheduler_output) -> Iterator[tuple[str, tuple[list[int], ...], bool]]:
+    scheduler_output,
+) -> Iterator[tuple[str, tuple[list[int], ...], bool]]:
     """
     Yields:
         (req_id, new_block_id_groups, preempted)
@@ -482,5 +491,8 @@ def yield_req_data(
 
     # cached requests
     cached_reqs = scheduler_output.scheduled_cached_reqs
-    yield from zip(cached_reqs.req_ids, cached_reqs.new_block_ids,
-                   cached_reqs.resumed_from_preemption)
+    yield from zip(
+        cached_reqs.req_ids,
+        cached_reqs.new_block_ids,
+        cached_reqs.resumed_from_preemption,
+    )
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/p2p/p2p_nccl_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/p2p/p2p_nccl_connector.py
index 3dadfa595ef1..0e6693db5cd2 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/p2p/p2p_nccl_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/p2p/p2p_nccl_connector.py
@@ -9,9 +9,13 @@
 
 from vllm.config import VllmConfig
 from vllm.distributed.kv_transfer.kv_connector.v1.base import (
-    KVConnectorBase_V1, KVConnectorMetadata, KVConnectorRole)
+    KVConnectorBase_V1,
+    KVConnectorMetadata,
+    KVConnectorRole,
+)
 from vllm.distributed.kv_transfer.kv_connector.v1.p2p.p2p_nccl_engine import (
-    P2pNcclEngine)
+    P2pNcclEngine,
+)
 from vllm.distributed.parallel_state import get_world_group
 from vllm.logger import init_logger
 from vllm.v1.attention.backends.mla.common import MLACommonMetadata
@@ -36,8 +40,9 @@ class ReqMeta:
     num_tokens: int
 
     @staticmethod
-    def make_meta(request_id: str, token_ids: list[int], block_ids: list[int],
-                  block_size: int) -> "ReqMeta":
+    def make_meta(
+        request_id: str, token_ids: list[int], block_ids: list[int], block_size: int
+    ) -> "ReqMeta":
         block_ids_tensor = torch.tensor(block_ids)
         return ReqMeta(
             request_id=request_id,
@@ -61,11 +66,11 @@ def add_request(
         block_size: int,
     ) -> None:
         self.requests.append(
-            ReqMeta.make_meta(request_id, token_ids, block_ids, block_size))
+            ReqMeta.make_meta(request_id, token_ids, block_ids, block_size)
+        )
 
 
 class P2pNcclConnector(KVConnectorBase_V1):
-
     def __init__(self, vllm_config: "VllmConfig", role: KVConnectorRole):
         super().__init__(vllm_config=vllm_config, role=role)
         self._block_size = vllm_config.cache_config.block_size
@@ -74,24 +79,27 @@ def __init__(self, vllm_config: "VllmConfig", role: KVConnectorRole):
         self.is_producer = self.config.is_kv_producer
         self.chunked_prefill: dict[str, Any] = {}
 
-        self._rank = get_world_group().rank \
-            if role == KVConnectorRole.WORKER else 0
-        self._local_rank = get_world_group().local_rank \
-            if role == KVConnectorRole.WORKER else 0
+        self._rank = get_world_group().rank if role == KVConnectorRole.WORKER else 0
+        self._local_rank = (
+            get_world_group().local_rank if role == KVConnectorRole.WORKER else 0
+        )
 
-        self.p2p_nccl_engine = P2pNcclEngine(
-            local_rank=self._local_rank,
-            config=self.config,
-            hostname="",
-            port_offset=self._rank,
-        ) if role == KVConnectorRole.WORKER else None
+        self.p2p_nccl_engine = (
+            P2pNcclEngine(
+                local_rank=self._local_rank,
+                config=self.config,
+                hostname="",
+                port_offset=self._rank,
+            )
+            if role == KVConnectorRole.WORKER
+            else None
+        )
 
     # ==============================
     # Worker-side methods
     # ==============================
 
-    def start_load_kv(self, forward_context: "ForwardContext",
-                      **kwargs: Any) -> None:
+    def start_load_kv(self, forward_context: "ForwardContext", **kwargs: Any) -> None:
         """Start loading the KV cache from the connector buffer to vLLM's
         paged KV buffer.
 
@@ -143,8 +151,9 @@ def inject_kv_into_layer(
             Returns:
                 None. The function modifies `layer` in-place.
             """
-            if (isinstance(attn_metadata, MLACommonMetadata)
-                    or layer.shape[1] == 2):  # MLA or FlashInfer
+            if (
+                isinstance(attn_metadata, MLACommonMetadata) or layer.shape[1] == 2
+            ):  # MLA or FlashInfer
                 num_block = kv_cache.shape[0]
                 self.check_tensors_except_dim(layer, kv_cache, 0)
                 if len(block_ids) == num_block:
@@ -153,8 +162,11 @@ def inject_kv_into_layer(
                     layer[block_ids[:num_block], ...] = kv_cache
                     logger.warning(
                         "🚧kv_cache does not match, block_ids:%d, "
-                        "num_block:%d, request_id:%s", len(block_ids),
-                        num_block, request_id)
+                        "num_block:%d, request_id:%s",
+                        len(block_ids),
+                        num_block,
+                        request_id,
+                    )
 
             elif layer.shape[0] == 2:  # FlashAttention
                 num_block = kv_cache.shape[1]
@@ -165,12 +177,14 @@ def inject_kv_into_layer(
                     layer[:, block_ids[:num_block], ...] = kv_cache
                     logger.warning(
                         "🚧kv_cache does not match, block_ids:%d, "
-                        "num_block:%d, request_id:%s", len(block_ids),
-                        num_block, request_id)
+                        "num_block:%d, request_id:%s",
+                        len(block_ids),
+                        num_block,
+                        request_id,
+                    )
 
         # Get the metadata
-        metadata: KVConnectorMetadata = \
-            self._get_connector_metadata()
+        metadata: KVConnectorMetadata = self._get_connector_metadata()
         assert isinstance(metadata, P2pNcclConnectorMetadata)
 
         if metadata is None:
@@ -187,21 +201,23 @@ def inject_kv_into_layer(
                 # Only process layers that have kv_cache
                 # attribute (attention layers) Skip non-attention
                 # layers like FusedMoE
-                kv_cache = getattr(layer, 'kv_cache', None)
+                kv_cache = getattr(layer, "kv_cache", None)
                 if kv_cache is None:
                     continue
 
                 layer = kv_cache[forward_context.virtual_engine]
 
                 kv_cache = self.p2p_nccl_engine.recv_tensor(
-                    request.request_id + "#" + layer_name, remote_address)
+                    request.request_id + "#" + layer_name, remote_address
+                )
 
                 if kv_cache is None:
                     logger.warning("🚧kv_cache is None, %s", request.request_id)
                     continue
 
-                inject_kv_into_layer(layer, kv_cache, request.block_ids,
-                                     request.request_id)
+                inject_kv_into_layer(
+                    layer, kv_cache, request.block_ids, request.request_id
+                )
 
     def wait_for_layer_load(self, layer_name: str) -> None:
         """Blocking until the KV for a specific layer is loaded into vLLM's
@@ -214,9 +230,13 @@ def wait_for_layer_load(self, layer_name: str) -> None:
         """
         return
 
-    def save_kv_layer(self, layer_name: str, kv_layer: torch.Tensor,
-                      attn_metadata: "AttentionMetadata",
-                      **kwargs: Any) -> None:
+    def save_kv_layer(
+        self,
+        layer_name: str,
+        kv_layer: torch.Tensor,
+        attn_metadata: "AttentionMetadata",
+        **kwargs: Any,
+    ) -> None:
         """Start saving the KV cache of the layer from vLLM's paged buffer
         to the connector.
 
@@ -255,8 +275,9 @@ def extract_kv_from_layer(
                 torch.Tensor: A tensor containing the extracted KV slices.
                 Returns None if the layout is unsupported.
             """
-            if (isinstance(attn_metadata, MLACommonMetadata)
-                    or layer.shape[1] == 2):  # MLA or FlashInfer
+            if (
+                isinstance(attn_metadata, MLACommonMetadata) or layer.shape[1] == 2
+            ):  # MLA or FlashInfer
                 return layer[block_ids, ...]
 
             if layer.shape[0] == 2:  # FlashAttention
@@ -272,8 +293,9 @@ def extract_kv_from_layer(
             remote_address = ip + ":" + str(port + self._rank)
 
             kv_cache = extract_kv_from_layer(kv_layer, request.block_ids)
-            self.p2p_nccl_engine.send_tensor(request_id + "#" + layer_name,
-                                             kv_cache, remote_address)
+            self.p2p_nccl_engine.send_tensor(
+                request_id + "#" + layer_name, kv_cache, remote_address
+            )
 
     def wait_for_save(self):
         if self.is_producer:
@@ -281,8 +303,8 @@ def wait_for_save(self):
             self.p2p_nccl_engine.wait_for_sent()
 
     def get_finished(
-            self, finished_req_ids: set[str],
-            **kwargs: Any) -> tuple[Optional[set[str]], Optional[set[str]]]:
+        self, finished_req_ids: set[str], **kwargs: Any
+    ) -> tuple[Optional[set[str]], Optional[set[str]]]:
         """
         Notifies worker-side connector ids of requests that have
         finished generating tokens.
@@ -296,10 +318,8 @@ def get_finished(
 
         assert self.p2p_nccl_engine is not None
 
-        no_compile_layers = (
-            self._vllm_config.compilation_config.static_forward_context)
-        return self.p2p_nccl_engine.get_finished(finished_req_ids,
-                                                 no_compile_layers)
+        no_compile_layers = self._vllm_config.compilation_config.static_forward_context
+        return self.p2p_nccl_engine.get_finished(finished_req_ids, no_compile_layers)
 
     # ==============================
     # Scheduler-side methods
@@ -326,23 +346,24 @@ def get_num_new_matched_tokens(
         if self.is_producer:
             return 0, False
 
-        num_external_tokens = (len(request.prompt_token_ids) - 1 -
-                               num_computed_tokens)
+        num_external_tokens = len(request.prompt_token_ids) - 1 - num_computed_tokens
 
         if num_external_tokens < 0:
             num_external_tokens = 0
 
         return num_external_tokens, False
 
-    def update_state_after_alloc(self, request: "Request",
-                                 blocks: "KVCacheBlocks",
-                                 num_external_tokens: int):
+    def update_state_after_alloc(
+        self, request: "Request", blocks: "KVCacheBlocks", num_external_tokens: int
+    ):
         """
         Update KVConnector state after block allocation.
         """
         if not self.is_producer and num_external_tokens > 0:
             self._requests_need_load[request.request_id] = (
-                request, blocks.get_block_ids()[0])
+                request,
+                blocks.get_block_ids()[0],
+            )
 
     def build_connector_meta(
         self,
@@ -361,26 +382,33 @@ def build_connector_meta(
 
         for new_req in scheduler_output.scheduled_new_reqs:
             if self.is_producer:
-                num_scheduled_tokens = (
-                    scheduler_output.num_scheduled_tokens)[new_req.req_id]
+                num_scheduled_tokens = (scheduler_output.num_scheduled_tokens)[
+                    new_req.req_id
+                ]
                 num_tokens = num_scheduled_tokens + new_req.num_computed_tokens
                 # the request's prompt is chunked prefill
                 if num_tokens < len(new_req.prompt_token_ids):
                     # 'CachedRequestData' has no attribute 'prompt_token_ids'
                     self.chunked_prefill[new_req.req_id] = (
-                        new_req.block_ids[0], new_req.prompt_token_ids)
+                        new_req.block_ids[0],
+                        new_req.prompt_token_ids,
+                    )
                     continue
                 # the request's prompt is not chunked prefill
-                meta.add_request(request_id=new_req.req_id,
-                                 token_ids=new_req.prompt_token_ids,
-                                 block_ids=new_req.block_ids[0],
-                                 block_size=self._block_size)
+                meta.add_request(
+                    request_id=new_req.req_id,
+                    token_ids=new_req.prompt_token_ids,
+                    block_ids=new_req.block_ids[0],
+                    block_size=self._block_size,
+                )
                 continue
             if new_req.req_id in self._requests_need_load:
-                meta.add_request(request_id=new_req.req_id,
-                                 token_ids=new_req.prompt_token_ids,
-                                 block_ids=new_req.block_ids[0],
-                                 block_size=self._block_size)
+                meta.add_request(
+                    request_id=new_req.req_id,
+                    token_ids=new_req.prompt_token_ids,
+                    block_ids=new_req.block_ids[0],
+                    block_size=self._block_size,
+                )
                 self._requests_need_load.pop(new_req.req_id)
 
         cached_reqs = scheduler_output.scheduled_cached_reqs
@@ -390,24 +418,24 @@ def build_connector_meta(
             resumed_from_preemption = cached_reqs.resumed_from_preemption[i]
 
             if self.is_producer:
-                num_scheduled_tokens = (
-                    scheduler_output.num_scheduled_tokens)[req_id]
-                num_tokens = (num_scheduled_tokens + num_computed_tokens)
+                num_scheduled_tokens = (scheduler_output.num_scheduled_tokens)[req_id]
+                num_tokens = num_scheduled_tokens + num_computed_tokens
                 assert req_id in self.chunked_prefill
                 block_ids = new_block_ids[0]
                 if not resumed_from_preemption:
-                    block_ids = (self.chunked_prefill[req_id][0] + block_ids)
+                    block_ids = self.chunked_prefill[req_id][0] + block_ids
                 prompt_token_ids = self.chunked_prefill[req_id][1]
                 # the request's prompt is chunked prefill again
                 if num_tokens < len(prompt_token_ids):
-                    self.chunked_prefill[req_id] = (block_ids,
-                                                    prompt_token_ids)
+                    self.chunked_prefill[req_id] = (block_ids, prompt_token_ids)
                     continue
                 # the request's prompt is all prefilled finally
-                meta.add_request(request_id=req_id,
-                                 token_ids=prompt_token_ids,
-                                 block_ids=block_ids,
-                                 block_size=self._block_size)
+                meta.add_request(
+                    request_id=req_id,
+                    token_ids=prompt_token_ids,
+                    block_ids=block_ids,
+                    block_size=self._block_size,
+                )
                 self.chunked_prefill.pop(req_id, None)
                 continue
 
@@ -424,10 +452,12 @@ def build_connector_meta(
                 # of the block_ids for the request.
                 block_ids = new_block_ids[0]
 
-                meta.add_request(request_id=req_id,
-                                 token_ids=token_ids,
-                                 block_ids=block_ids,
-                                 block_size=self._block_size)
+                meta.add_request(
+                    request_id=req_id,
+                    token_ids=token_ids,
+                    block_ids=block_ids,
+                    block_size=self._block_size,
+                )
 
         self._requests_need_load.clear()
         return meta
@@ -472,8 +502,7 @@ def parse_request_id(request_id: str, is_prefill=True) -> tuple[str, int]:
             port = int(match.group(2))
 
             return ip, port
-        raise ValueError(
-            f"Request id {request_id} does not contain hostname and port")
+        raise ValueError(f"Request id {request_id} does not contain hostname and port")
 
     @staticmethod
     def check_tensors_except_dim(tensor1, tensor2, dim):
@@ -481,8 +510,9 @@ def check_tensors_except_dim(tensor1, tensor2, dim):
         shape2 = tensor2.size()
 
         if len(shape1) != len(shape2) or not all(
-                s1 == s2
-                for i, (s1, s2) in enumerate(zip(shape1, shape2)) if i != dim):
+            s1 == s2 for i, (s1, s2) in enumerate(zip(shape1, shape2)) if i != dim
+        ):
             raise NotImplementedError(
                 "Currently, only symmetric TP is supported. Asymmetric TP, PP,"
-                "and others will be supported in future PRs.")
+                "and others will be supported in future PRs."
+            )
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/p2p/p2p_nccl_engine.py b/vllm/distributed/kv_transfer/kv_connector/v1/p2p/p2p_nccl_engine.py
index 959bf0277a3f..cff68818ca70 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/p2p/p2p_nccl_engine.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/p2p/p2p_nccl_engine.py
@@ -17,9 +17,15 @@
 
 from vllm.config.kv_transfer import KVTransferConfig
 from vllm.distributed.device_communicators.pynccl_wrapper import (
-    NCCLLibrary, buffer_type, cudaStream_t, ncclComm_t, ncclDataTypeEnum)
+    NCCLLibrary,
+    buffer_type,
+    cudaStream_t,
+    ncclComm_t,
+    ncclDataTypeEnum,
+)
 from vllm.distributed.kv_transfer.kv_connector.v1.p2p.tensor_memory_pool import (  # noqa: E501
-    TensorMemoryPool)
+    TensorMemoryPool,
+)
 from vllm.utils import current_stream, get_ip
 
 logger = logging.getLogger(__name__)
@@ -31,12 +37,12 @@
 def set_p2p_nccl_context(num_channels: str):
     original_values: dict[str, Any] = {}
     env_vars = [
-        'NCCL_MAX_NCHANNELS',
-        'NCCL_MIN_NCHANNELS',
-        'NCCL_CUMEM_ENABLE',
-        'NCCL_BUFFSIZE',
-        'NCCL_PROTO',  # LL,LL128,SIMPLE
-        'NCCL_ALGO',  # RING,TREE
+        "NCCL_MAX_NCHANNELS",
+        "NCCL_MIN_NCHANNELS",
+        "NCCL_CUMEM_ENABLE",
+        "NCCL_BUFFSIZE",
+        "NCCL_PROTO",  # LL,LL128,SIMPLE
+        "NCCL_ALGO",  # RING,TREE
     ]
 
     for var in env_vars:
@@ -45,9 +51,9 @@ def set_p2p_nccl_context(num_channels: str):
     logger.info("set_p2p_nccl_context, original_values: %s", original_values)
 
     try:
-        os.environ['NCCL_MAX_NCHANNELS'] = num_channels
-        os.environ['NCCL_MIN_NCHANNELS'] = num_channels
-        os.environ['NCCL_CUMEM_ENABLE'] = '1'
+        os.environ["NCCL_MAX_NCHANNELS"] = num_channels
+        os.environ["NCCL_MIN_NCHANNELS"] = num_channels
+        os.environ["NCCL_CUMEM_ENABLE"] = "1"
         yield
     finally:
         for var in env_vars:
@@ -65,13 +71,14 @@ class SendQueueItem:
 
 
 class P2pNcclEngine:
-
-    def __init__(self,
-                 local_rank: int,
-                 config: KVTransferConfig,
-                 hostname: str = "",
-                 port_offset: int = 0,
-                 library_path: Optional[str] = None) -> None:
+    def __init__(
+        self,
+        local_rank: int,
+        config: KVTransferConfig,
+        hostname: str = "",
+        port_offset: int = 0,
+        library_path: Optional[str] = None,
+    ) -> None:
         self.config = config
         self.rank = port_offset
         self.local_rank = local_rank
@@ -91,8 +98,8 @@ def __init__(self,
 
         # The `http_port` must be consistent with the port of OpenAI.
         self.http_address = (
-            f"{self._hostname}:"
-            f"{self.config.kv_connector_extra_config['http_port']}")
+            f"{self._hostname}:{self.config.kv_connector_extra_config['http_port']}"
+        )
 
         # If `proxy_ip` or `proxy_port` is `""`,
         # then the ping thread will not be enabled.
@@ -118,15 +125,17 @@ def __init__(self,
         self.recv_stream = torch.cuda.Stream()
 
         mem_pool_size_gb = float(
-            self.config.get_from_extra_config("mem_pool_size_gb",
-                                              DEFAULT_MEM_POOL_SIZE_GB))
-        self.pool = TensorMemoryPool(max_block_size=int(mem_pool_size_gb *
-                                                        1024**3))  # GB
+            self.config.get_from_extra_config(
+                "mem_pool_size_gb", DEFAULT_MEM_POOL_SIZE_GB
+            )
+        )
+        self.pool = TensorMemoryPool(
+            max_block_size=int(mem_pool_size_gb * 1024**3)
+        )  # GB
 
         # The sending type includes tree mutually exclusive options:
         # PUT, GET, PUT_ASYNC.
-        self.send_type = self.config.get_from_extra_config(
-            "send_type", "PUT_ASYNC")
+        self.send_type = self.config.get_from_extra_config("send_type", "PUT_ASYNC")
         if self.send_type == "GET":
             # tensor_id: torch.Tensor
             self.send_store: dict[str, torch.Tensor] = {}
@@ -135,8 +144,9 @@ def __init__(self,
             # tensor_id: torch.Tensor
             self.send_queue: deque[SendQueueItem] = deque()
             if self.send_type == "PUT_ASYNC":
-                self._send_thread = threading.Thread(target=self.send_async,
-                                                     daemon=True)
+                self._send_thread = threading.Thread(
+                    target=self.send_async, daemon=True
+                )
                 self._send_thread.start()
 
         # tensor_id: torch.Tensor/(addr, dtype, shape)
@@ -150,10 +160,12 @@ def __init__(self,
         self.buffer_size_threshold = float(self.config.kv_buffer_size)
 
         self.nccl_num_channels = self.config.get_from_extra_config(
-            "nccl_num_channels", "8")
+            "nccl_num_channels", "8"
+        )
 
         self._listener_thread = threading.Thread(
-            target=self.listen_for_requests, daemon=True)
+            target=self.listen_for_requests, daemon=True
+        )
         self._listener_thread.start()
 
         self._ping_thread = None
@@ -164,9 +176,16 @@ def __init__(self,
         logger.info(
             "💯P2pNcclEngine init, rank:%d, local_rank:%d, http_address:%s, "
             "zmq_address:%s, proxy_address:%s, send_type:%s, buffer_size_"
-            "threshold:%.2f, nccl_num_channels:%s", self.rank, self.local_rank,
-            self.http_address, self.zmq_address, self.proxy_address,
-            self.send_type, self.buffer_size_threshold, self.nccl_num_channels)
+            "threshold:%.2f, nccl_num_channels:%s",
+            self.rank,
+            self.local_rank,
+            self.http_address,
+            self.zmq_address,
+            self.proxy_address,
+            self.send_type,
+            self.buffer_size_threshold,
+            self.nccl_num_channels,
+        )
 
     def create_connect(self, remote_address: typing.Optional[str] = None):
         assert remote_address is not None
@@ -176,8 +195,11 @@ def create_connect(self, remote_address: typing.Optional[str] = None):
             sock.connect(f"tcp://{remote_address}")
             self.socks[remote_address] = sock
             if remote_address in self.comms:
-                logger.info("👋comm exists, remote_address:%s, comms:%s",
-                            remote_address, self.comms)
+                logger.info(
+                    "👋comm exists, remote_address:%s, comms:%s",
+                    remote_address,
+                    self.comms,
+                )
                 return sock, self.comms[remote_address]
 
             unique_id = self.nccl.ncclGetUniqueId()
@@ -187,11 +209,14 @@ def create_connect(self, remote_address: typing.Optional[str] = None):
             with torch.cuda.device(self.device):
                 rank = 0
                 with set_p2p_nccl_context(self.nccl_num_channels):
-                    comm: ncclComm_t = self.nccl.ncclCommInitRank(
-                        2, unique_id, rank)
+                    comm: ncclComm_t = self.nccl.ncclCommInitRank(2, unique_id, rank)
                 self.comms[remote_address] = (comm, rank)
-                logger.info("🤝ncclCommInitRank Success, %s👉%s, MyRank:%s",
-                            self.zmq_address, remote_address, rank)
+                logger.info(
+                    "🤝ncclCommInitRank Success, %s👉%s, MyRank:%s",
+                    self.zmq_address,
+                    remote_address,
+                    rank,
+                )
 
         return self.socks[remote_address], self.comms[remote_address]
 
@@ -207,9 +232,9 @@ def send_tensor(
                 self.recv_store_cv.notify()
             return True
 
-        item = SendQueueItem(tensor_id=tensor_id,
-                             remote_address=remote_address,
-                             tensor=tensor)
+        item = SendQueueItem(
+            tensor_id=tensor_id, remote_address=remote_address, tensor=tensor
+        )
 
         if self.send_type == "PUT":
             return self.send_sync(item)
@@ -227,31 +252,45 @@ def send_tensor(
                 logger.warning(
                     "❗[GET]tensor_id:%s, tensor_size:%d, is greater than"
                     "buffer size threshold :%d, skip send to %s, rank:%d",
-                    tensor_id, tensor_size, self.buffer_size_threshold,
-                    remote_address, self.rank)
+                    tensor_id,
+                    tensor_size,
+                    self.buffer_size_threshold,
+                    remote_address,
+                    self.rank,
+                )
                 return False
-            while (self.buffer_size + tensor_size
-                   > self.buffer_size_threshold):
+            while self.buffer_size + tensor_size > self.buffer_size_threshold:
                 assert len(self.send_store) > 0
                 oldest_tensor_id = next(iter(self.send_store))
                 oldest_tensor = self.send_store.pop(oldest_tensor_id)
-                oldest_tensor_size = oldest_tensor.element_size(
-                ) * oldest_tensor.numel()
+                oldest_tensor_size = (
+                    oldest_tensor.element_size() * oldest_tensor.numel()
+                )
                 self.buffer_size -= oldest_tensor_size
                 logger.debug(
                     "⛔[GET]Send to %s, tensor_id:%s, tensor_size:%d,"
                     " buffer_size:%d, oldest_tensor_size:%d, rank:%d",
-                    remote_address, tensor_id, tensor_size, self.buffer_size,
-                    oldest_tensor_size, self.rank)
+                    remote_address,
+                    tensor_id,
+                    tensor_size,
+                    self.buffer_size,
+                    oldest_tensor_size,
+                    self.rank,
+                )
 
             self.send_store[tensor_id] = tensor
             self.buffer_size += tensor_size
             logger.debug(
                 "🔵[GET]Send to %s, tensor_id:%s, tensor_size:%d, "
-                "shape:%s, rank:%d, buffer_size:%d(%.2f%%)", remote_address,
-                tensor_id, tensor_size, tensor.shape, self.rank,
+                "shape:%s, rank:%d, buffer_size:%d(%.2f%%)",
+                remote_address,
+                tensor_id,
+                tensor_size,
+                tensor.shape,
+                self.rank,
                 self.buffer_size,
-                self.buffer_size / self.buffer_size_threshold * 100)
+                self.buffer_size / self.buffer_size_threshold * 100,
+            )
         return True
 
     def recv_tensor(
@@ -269,17 +308,18 @@ def recv_tensor(
             if tensor is not None:
                 if isinstance(tensor, tuple):
                     addr, dtype, shape = tensor
-                    tensor = self.pool.load_tensor(addr, dtype, shape,
-                                                   self.device)
+                    tensor = self.pool.load_tensor(addr, dtype, shape, self.device)
                 else:
-                    self.buffer_size -= (tensor.element_size() *
-                                         tensor.numel())
+                    self.buffer_size -= tensor.element_size() * tensor.numel()
             else:
                 duration = time.time() - start_time
                 logger.warning(
-                    "🔴[PUT]Recv From %s, tensor_id:%s, duration:%.3fms, "
-                    "rank:%d", remote_address, tensor_id, duration * 1000,
-                    self.rank)
+                    "🔴[PUT]Recv From %s, tensor_id:%s, duration:%.3fms, rank:%d",
+                    remote_address,
+                    tensor_id,
+                    duration * 1000,
+                    self.rank,
+                )
             return tensor
 
         # GET
@@ -298,14 +338,18 @@ def recv_tensor(
         message = sock.recv()
         data = msgpack.loads(message)
         if data["ret"] != 0:
-            logger.warning("🔴[GET]Recv From %s, tensor_id: %s, ret: %d",
-                           remote_address, tensor_id, data["ret"])
+            logger.warning(
+                "🔴[GET]Recv From %s, tensor_id: %s, ret: %d",
+                remote_address,
+                tensor_id,
+                data["ret"],
+            )
             return None
 
         with torch.cuda.stream(self.recv_stream):
-            tensor = torch.empty(data["shape"],
-                                 dtype=getattr(torch, data["dtype"]),
-                                 device=self.device)
+            tensor = torch.empty(
+                data["shape"], dtype=getattr(torch, data["dtype"]), device=self.device
+            )
 
         self.recv(comm, tensor, rank ^ 1, self.recv_stream)
 
@@ -320,38 +364,45 @@ def listen_for_requests(self):
             remote_address, message = self.router_socket.recv_multipart()
             data = msgpack.loads(message)
             if data["cmd"] == "NEW":
-                unique_id = self.nccl.unique_id_from_bytes(
-                    bytes(data["unique_id"]))
+                unique_id = self.nccl.unique_id_from_bytes(bytes(data["unique_id"]))
                 with torch.cuda.device(self.device):
                     rank = 1
                     with set_p2p_nccl_context(self.nccl_num_channels):
                         comm: ncclComm_t = self.nccl.ncclCommInitRank(
-                            2, unique_id, rank)
+                            2, unique_id, rank
+                        )
                     self.comms[remote_address.decode()] = (comm, rank)
-                    logger.info("🤝ncclCommInitRank Success, %s👈%s, MyRank:%s",
-                                self.zmq_address, remote_address.decode(),
-                                rank)
+                    logger.info(
+                        "🤝ncclCommInitRank Success, %s👈%s, MyRank:%s",
+                        self.zmq_address,
+                        remote_address.decode(),
+                        rank,
+                    )
             elif data["cmd"] == "PUT":
                 tensor_id = data["tensor_id"]
                 try:
                     with torch.cuda.stream(self.recv_stream):
-                        tensor = torch.empty(data["shape"],
-                                             dtype=getattr(
-                                                 torch, data["dtype"]),
-                                             device=self.device)
+                        tensor = torch.empty(
+                            data["shape"],
+                            dtype=getattr(torch, data["dtype"]),
+                            device=self.device,
+                        )
                     self.router_socket.send_multipart([remote_address, b"0"])
                     comm, rank = self.comms[remote_address.decode()]
                     self.recv(comm, tensor, rank ^ 1, self.recv_stream)
                     tensor_size = tensor.element_size() * tensor.numel()
-                    if (self.buffer_size + tensor_size
-                            > self.buffer_size_threshold):
+                    if self.buffer_size + tensor_size > self.buffer_size_threshold:
                         # Store Tensor in memory pool
                         addr = self.pool.store_tensor(tensor)
                         tensor = (addr, tensor.dtype, tensor.shape)
                         logger.warning(
                             "🔴[PUT]Recv Tensor, Out Of Threshold, "
-                            "%s👈%s, data:%s, addr:%d", self.zmq_address,
-                            remote_address.decode(), data, addr)
+                            "%s👈%s, data:%s, addr:%d",
+                            self.zmq_address,
+                            remote_address.decode(),
+                            data,
+                            addr,
+                        )
                     else:
                         self.buffer_size += tensor_size
 
@@ -359,9 +410,11 @@ def listen_for_requests(self):
                     self.router_socket.send_multipart([remote_address, b"1"])
                     tensor = None
                     logger.warning(
-                        "🔴[PUT]Recv Tensor, Out Of Memory, %s👈%s, "
-                        "data:%s", self.zmq_address, remote_address.decode(),
-                        data)
+                        "🔴[PUT]Recv Tensor, Out Of Memory, %s👈%s, data:%s",
+                        self.zmq_address,
+                        remote_address.decode(),
+                        data,
+                    )
 
                 with self.recv_store_cv:
                     self.recv_store[tensor_id] = tensor
@@ -376,7 +429,7 @@ def listen_for_requests(self):
                         data = {
                             "ret": 0,
                             "shape": tensor.shape,
-                            "dtype": str(tensor.dtype).replace("torch.", "")
+                            "dtype": str(tensor.dtype).replace("torch.", ""),
                         }
                         # LRU
                         self.send_store[tensor_id] = tensor
@@ -384,26 +437,26 @@ def listen_for_requests(self):
                     else:
                         data = {"ret": 1}
 
-                self.router_socket.send_multipart(
-                    [remote_address, msgpack.dumps(data)])
+                self.router_socket.send_multipart([remote_address, msgpack.dumps(data)])
 
                 if data["ret"] == 0:
                     comm, rank = self.comms[remote_address.decode()]
-                    self.send(comm, tensor.to(self.device), rank ^ 1,
-                              self.send_stream)
+                    self.send(comm, tensor.to(self.device), rank ^ 1, self.send_stream)
             else:
                 logger.warning(
                     "🚧Unexpected, Received message from %s, data:%s",
-                    remote_address, data)
+                    remote_address,
+                    data,
+                )
 
     def have_sent_tensor_id(self, tensor_id: str):
-        request_id = tensor_id.split('#')[0]
+        request_id = tensor_id.split("#")[0]
         if request_id not in self.send_request_id_to_tensor_ids:
             self.send_request_id_to_tensor_ids[request_id] = set()
         self.send_request_id_to_tensor_ids[request_id].add(tensor_id)
 
     def have_received_tensor_id(self, tensor_id: str):
-        request_id = tensor_id.split('#')[0]
+        request_id = tensor_id.split("#")[0]
         if request_id not in self.recv_request_id_to_tensor_ids:
             self.recv_request_id_to_tensor_ids[request_id] = set()
         self.recv_request_id_to_tensor_ids[request_id].add(tensor_id)
@@ -427,7 +480,10 @@ def wait_for_sent(self):
             duration = time.time() - start_time
             logger.debug(
                 "🚧[PUT_ASYNC]It took %.3fms to wait for the send_queue"
-                " to be empty, rank:%d", duration * 1000, self.rank)
+                " to be empty, rank:%d",
+                duration * 1000,
+                self.rank,
+            )
 
     def send_sync(self, item: SendQueueItem) -> bool:
         if item.remote_address is None:
@@ -443,7 +499,7 @@ def send_sync(self, item: SendQueueItem) -> bool:
             "cmd": "PUT",
             "tensor_id": item.tensor_id,
             "shape": tensor.shape,
-            "dtype": str(tensor.dtype).replace("torch.", "")
+            "dtype": str(tensor.dtype).replace("torch.", ""),
         }
         sock.send(msgpack.dumps(data))
 
@@ -452,10 +508,14 @@ def send_sync(self, item: SendQueueItem) -> bool:
             logger.error(
                 "🔴Send Tensor, Peer Out Of Memory/Threshold, %s 👉 %s, "
                 "MyRank:%s, data:%s, tensor:%s, size:%fGB, response:%s",
-                self.zmq_address, item.remote_address, rank, data,
+                self.zmq_address,
+                item.remote_address,
+                rank,
+                data,
                 tensor.shape,
                 tensor.element_size() * tensor.numel() / 1024**3,
-                response.decode())
+                response.decode(),
+            )
             return False
 
         self.send(comm, tensor.to(self.device), rank ^ 1, self.send_stream)
@@ -466,7 +526,7 @@ def send_sync(self, item: SendQueueItem) -> bool:
         return True
 
     def get_finished(
-            self, finished_req_ids: set[str], no_compile_layers
+        self, finished_req_ids: set[str], no_compile_layers
     ) -> tuple[Optional[set[str]], Optional[set[str]]]:
         """
         Notifies worker-side connector ids of requests that have
@@ -486,10 +546,8 @@ def get_finished(
                 if tensor_id in self.recv_store:
                     with self.recv_store_cv:
                         tensor = self.recv_store.pop(tensor_id, None)
-                        self.send_request_id_to_tensor_ids.pop(
-                            request_id, None)
-                        self.recv_request_id_to_tensor_ids.pop(
-                            request_id, None)
+                        self.send_request_id_to_tensor_ids.pop(request_id, None)
+                        self.recv_request_id_to_tensor_ids.pop(request_id, None)
                     if isinstance(tensor, tuple):
                         addr, _, _ = tensor
                         self.pool.free(addr)
@@ -510,7 +568,7 @@ def ping(self):
         data = {
             "type": "P" if self.config.is_kv_producer else "D",
             "http_address": self.http_address,
-            "zmq_address": self.zmq_address
+            "zmq_address": self.zmq_address,
         }
         while True:
             sock.send(msgpack.dumps(data))
@@ -519,27 +577,39 @@ def ping(self):
     def send(self, comm, tensor: torch.Tensor, dst: int, stream=None):
         assert tensor.device == self.device, (
             f"this nccl communicator is created to work on {self.device}, "
-            f"but the input tensor is on {tensor.device}")
+            f"but the input tensor is on {tensor.device}"
+        )
         if stream is None:
             stream = current_stream()
 
         with torch.cuda.stream(stream):
-            self.nccl.ncclSend(buffer_type(tensor.data_ptr()), tensor.numel(),
-                               ncclDataTypeEnum.from_torch(tensor.dtype), dst,
-                               comm, cudaStream_t(stream.cuda_stream))
+            self.nccl.ncclSend(
+                buffer_type(tensor.data_ptr()),
+                tensor.numel(),
+                ncclDataTypeEnum.from_torch(tensor.dtype),
+                dst,
+                comm,
+                cudaStream_t(stream.cuda_stream),
+            )
         stream.synchronize()
 
     def recv(self, comm, tensor: torch.Tensor, src: int, stream=None):
         assert tensor.device == self.device, (
             f"this nccl communicator is created to work on {self.device}, "
-            f"but the input tensor is on {tensor.device}")
+            f"but the input tensor is on {tensor.device}"
+        )
         if stream is None:
             stream = current_stream()
 
         with torch.cuda.stream(stream):
-            self.nccl.ncclRecv(buffer_type(tensor.data_ptr()), tensor.numel(),
-                               ncclDataTypeEnum.from_torch(tensor.dtype), src,
-                               comm, cudaStream_t(stream.cuda_stream))
+            self.nccl.ncclRecv(
+                buffer_type(tensor.data_ptr()),
+                tensor.numel(),
+                ncclDataTypeEnum.from_torch(tensor.dtype),
+                src,
+                comm,
+                cudaStream_t(stream.cuda_stream),
+            )
         stream.synchronize()
 
     def close(self) -> None:
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/p2p/tensor_memory_pool.py b/vllm/distributed/kv_transfer/kv_connector/v1/p2p/tensor_memory_pool.py
index 26070488bad8..899f1eae86d2 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/p2p/tensor_memory_pool.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/p2p/tensor_memory_pool.py
@@ -67,8 +67,7 @@ def __init__(self, max_block_size: int, min_block_size: int = 512):
         if max_block_size <= 0 or min_block_size <= 0:
             raise ValueError("Block sizes must be positive")
         if max_block_size < min_block_size:
-            raise ValueError(
-                "Max block size must be greater than min block size")
+            raise ValueError("Max block size must be greater than min block size")
 
         self.max_block_size = self._round_to_power_of_two(max_block_size)
         self.min_block_size = self._round_to_power_of_two(min_block_size)
@@ -91,17 +90,18 @@ def _initialize_free_lists(self):
             size //= 2
 
     def _allocate_pinned_memory(self):
-        self.base_tensor = torch.empty(self.max_block_size // 4,
-                                       dtype=torch.float32,
-                                       pin_memory=True)
+        self.base_tensor = torch.empty(
+            self.max_block_size // 4, dtype=torch.float32, pin_memory=True
+        )
         self.base_address = self.base_tensor.data_ptr()
-        initial_block = MemoryBlock(size=self.max_block_size,
-                                    addr=self.base_address)
-        self.free_lists[self.max_block_size][
-            initial_block.addr] = initial_block
+        initial_block = MemoryBlock(size=self.max_block_size, addr=self.base_address)
+        self.free_lists[self.max_block_size][initial_block.addr] = initial_block
 
-        logger.debug("TensorMemoryPool, base_address:%d, max_block_size:%d",
-                     self.base_address, self.max_block_size)
+        logger.debug(
+            "TensorMemoryPool, base_address:%d, max_block_size:%d",
+            self.base_address,
+            self.max_block_size,
+        )
 
     def allocate(self, size: int) -> int:
         """Allocates a memory block of at least the requested size.
@@ -118,8 +118,7 @@ def allocate(self, size: int) -> int:
         if size <= 0:
             raise ValueError("Allocation size must be positive")
 
-        required_size = self._round_to_power_of_two(
-            max(size, self.min_block_size))
+        required_size = self._round_to_power_of_two(max(size, self.min_block_size))
         if required_size > self.max_block_size:
             raise ValueError("Requested size exceeds maximum block size")
 
@@ -135,8 +134,7 @@ def allocate(self, size: int) -> int:
         raise ValueError("Insufficient memory")
 
     def _split_block(self, block: MemoryBlock, required_size: int):
-        while (block.size > required_size
-               and block.size // 2 >= self.min_block_size):
+        while block.size > required_size and block.size // 2 >= self.min_block_size:
             buddy_size = block.size // 2
             buddy_addr = block.addr + buddy_size
 
@@ -165,8 +163,11 @@ def _merge_buddies(self, block: MemoryBlock):
         depth = 0
 
         while depth < MAX_MERGE_DEPTH:
-            buddy_offset = block.size if (block.addr - self.base_address) % (
-                2 * block.size) == 0 else -block.size
+            buddy_offset = (
+                block.size
+                if (block.addr - self.base_address) % (2 * block.size) == 0
+                else -block.size
+            )
             buddy_addr = block.addr + buddy_offset
             buddy = self.free_lists[block.size].get(buddy_addr)
             if buddy:
@@ -202,14 +203,14 @@ def store_tensor(self, tensor: torch.Tensor) -> int:
             self.free(addr)
             raise ValueError(
                 f"Allocated block size {block.size} is smaller than "
-                f"required size {size}")
+                f"required size {size}"
+            )
 
         try:
             buffer = (ctypes.c_byte * block.size).from_address(block.addr)
-            cpu_tensor = torch.frombuffer(buffer,
-                                          dtype=tensor.dtype,
-                                          count=tensor.numel()).reshape(
-                                              tensor.shape)
+            cpu_tensor = torch.frombuffer(
+                buffer, dtype=tensor.dtype, count=tensor.numel()
+            ).reshape(tensor.shape)
         except ValueError as err:
             self.free(addr)
             raise ValueError(f"Failed to create tensor view: {err}") from err
@@ -218,9 +219,13 @@ def store_tensor(self, tensor: torch.Tensor) -> int:
 
         return addr
 
-    def load_tensor(self, addr: int, dtype: torch.dtype, shape: tuple[int,
-                                                                      ...],
-                    device: torch.device) -> torch.Tensor:
+    def load_tensor(
+        self,
+        addr: int,
+        dtype: torch.dtype,
+        shape: tuple[int, ...],
+        device: torch.device,
+    ) -> torch.Tensor:
         """Loads a tensor from pinned host memory to the specified device.
 
         Args:
@@ -247,8 +252,9 @@ def load_tensor(self, addr: int, dtype: torch.dtype, shape: tuple[int,
             raise ValueError("Requested tensor size exceeds block size")
 
         buffer = (ctypes.c_byte * block.size).from_address(block.addr)
-        cpu_tensor = torch.frombuffer(buffer, dtype=dtype,
-                                      count=num_elements).reshape(shape)
+        cpu_tensor = torch.frombuffer(buffer, dtype=dtype, count=num_elements).reshape(
+            shape
+        )
 
         cuda_tensor = torch.empty(shape, dtype=dtype, device=device)
 
@@ -260,7 +266,7 @@ def cleanup(self):
         """Cleans up all memory resources and resets the pool state."""
         self.free_lists.clear()
         self.allocated_blocks.clear()
-        if hasattr(self, 'base_tensor'):
+        if hasattr(self, "base_tensor"):
             del self.base_tensor
 
     def __del__(self):
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/shared_storage_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/shared_storage_connector.py
index c9949d81465c..a1bab4e06145 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/shared_storage_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/shared_storage_connector.py
@@ -10,7 +10,10 @@
 
 from vllm.config import VllmConfig
 from vllm.distributed.kv_transfer.kv_connector.v1.base import (
-    KVConnectorBase_V1, KVConnectorMetadata, KVConnectorRole)
+    KVConnectorBase_V1,
+    KVConnectorMetadata,
+    KVConnectorRole,
+)
 from vllm.logger import init_logger
 from vllm.v1.attention.backends.mla.common import MLACommonMetadata
 from vllm.v1.core.sched.output import SchedulerOutput
@@ -35,15 +38,22 @@ class ReqMeta:
     mm_hashes: list[str]
 
     @staticmethod
-    def make_meta(token_ids: list[int], block_ids: list[int], block_size: int,
-                  is_store: bool, mm_hashes: list[str]) -> "ReqMeta":
+    def make_meta(
+        token_ids: list[int],
+        block_ids: list[int],
+        block_size: int,
+        is_store: bool,
+        mm_hashes: list[str],
+    ) -> "ReqMeta":
         valid_num_tokens = align_to_block_size(len(token_ids), block_size)
         token_ids_tensor = torch.tensor(token_ids)[:valid_num_tokens]
         block_ids_tensor = torch.tensor(block_ids)
         num_blocks = block_ids_tensor.shape[0]
         block_offsets = torch.arange(0, block_size)
-        slot_mapping = block_offsets.reshape((1, block_size)) + \
-                block_ids_tensor.reshape((num_blocks, 1)) * block_size
+        slot_mapping = (
+            block_offsets.reshape((1, block_size))
+            + block_ids_tensor.reshape((num_blocks, 1)) * block_size
+        )
         slot_mapping = slot_mapping.flatten()[:valid_num_tokens]
         return ReqMeta(
             token_ids=token_ids_tensor,
@@ -66,8 +76,8 @@ def add_request(
         mm_hashes: list[str],
     ) -> None:
         self.requests.append(
-            ReqMeta.make_meta(token_ids, block_ids, block_size, is_store,
-                              mm_hashes))
+            ReqMeta.make_meta(token_ids, block_ids, block_size, is_store, mm_hashes)
+        )
 
 
 class SharedStorageConnector(KVConnectorBase_V1):
@@ -82,13 +92,13 @@ def __init__(self, vllm_config: "VllmConfig", role: KVConnectorRole):
         self._requests_need_load: dict[str, Request] = {}
         transfer_config = vllm_config.kv_transfer_config
         self._storage_path = transfer_config.get_from_extra_config(
-            "shared_storage_path", "/tmp")
+            "shared_storage_path", "/tmp"
+        )
         logger.info(vllm_config.kv_transfer_config)
         logger.info("Shared storage path is %s", self._storage_path)
 
-    def start_load_kv(self, forward_context: "ForwardContext",
-                      **kwargs: Any) -> None:
-        """Start loading the KV cache from the connector buffer to vLLM's 
+    def start_load_kv(self, forward_context: "ForwardContext", **kwargs: Any) -> None:
+        """Start loading the KV cache from the connector buffer to vLLM's
         paged KV buffer.
 
         Args:
@@ -96,7 +106,7 @@ def start_load_kv(self, forward_context: "ForwardContext",
             **kwargs: additional arguments for the load operation
 
         Note:
-            The number of elements in kv_caches and layer_names should be 
+            The number of elements in kv_caches and layer_names should be
             the same.
         """
         attn_metadata = forward_context.attn_metadata
@@ -109,13 +119,13 @@ def inject_kv_into_layer(
             """Inject the KV cache into the layer.
 
             Args:
-                dst_kv_cache_layer (torch.Tensor): the destination KV cache 
-                    layer. In shape [2, num_pages, page_size, xxx] if not 
+                dst_kv_cache_layer (torch.Tensor): the destination KV cache
+                    layer. In shape [2, num_pages, page_size, xxx] if not
                     using MLA, [num_pages, page_size, xxx] otherwise.
                 src_kv_cache (torch.Tensor): the source KV cache. In shape
-                    [2, num_tokens, xxx] if not using MLA, [num_tokens, xxx] 
+                    [2, num_tokens, xxx] if not using MLA, [num_tokens, xxx]
                     otherwise.
-                slot_mapping (torch.Tensor): the slot mapping. In shape 
+                slot_mapping (torch.Tensor): the slot mapping. In shape
                     [num_tokens].
             """
             dst_kv_cache_layer_shape = dst_kv_cache_layer.shape
@@ -123,14 +133,16 @@ def inject_kv_into_layer(
                 num_pages = dst_kv_cache_layer_shape[0]
                 page_size = dst_kv_cache_layer_shape[1]
                 dst_kv_cache_layer = dst_kv_cache_layer.reshape(
-                    num_pages * page_size, -1)
+                    num_pages * page_size, -1
+                )
                 dst_kv_cache_layer[slot_mapping, ...] = src_kv_cache
                 dst_kv_cache_layer.reshape(dst_kv_cache_layer_shape)
             else:
                 num_pages = dst_kv_cache_layer_shape[1]
                 page_size = dst_kv_cache_layer_shape[2]
                 dst_kv_cache_layer = dst_kv_cache_layer.reshape(
-                    2, num_pages * page_size, -1)
+                    2, num_pages * page_size, -1
+                )
                 dst_kv_cache_layer[:, slot_mapping, ...] = src_kv_cache
                 dst_kv_cache_layer.reshape(dst_kv_cache_layer_shape)
 
@@ -146,40 +158,39 @@ def inject_kv_into_layer(
 
         attn_metadata = forward_context.attn_metadata
         if attn_metadata is None:
-            logger.warning(
-                "In connector.start_load_kv, but the attn_metadata is None")
+            logger.warning("In connector.start_load_kv, but the attn_metadata is None")
             return
 
         # Load the KV for each request each layer
         for request in metadata.requests:
             if request.is_store:
                 continue
-            logger.info("Inject KV cache of %d tokens to the paged memory",
-                        len(request.slot_mapping))
+            logger.info(
+                "Inject KV cache of %d tokens to the paged memory",
+                len(request.slot_mapping),
+            )
             for layer_name in forward_context.no_compile_layers:
                 layer = forward_context.no_compile_layers[layer_name]
 
                 # Only process layers that have kv_cache
                 # attribute (attention layers) Skip non-attention
                 # layers like FusedMoE/MLP etc.
-                kv_cache_attr = getattr(layer, 'kv_cache', None)
+                kv_cache_attr = getattr(layer, "kv_cache", None)
                 if kv_cache_attr is None:
                     continue
 
-                kv_cache_layer = kv_cache_attr[ \
-                        forward_context.virtual_engine]
+                kv_cache_layer = kv_cache_attr[forward_context.virtual_engine]
 
                 filename = self._generate_filename_debug(
-                    layer_name, request.token_ids, request.mm_hashes)
-                kv_cache = safetensors.torch.load_file(
-                    filename)["kv_cache"].cuda()
-                inject_kv_into_layer(kv_cache_layer, kv_cache,
-                                     request.slot_mapping)
+                    layer_name, request.token_ids, request.mm_hashes
+                )
+                kv_cache = safetensors.torch.load_file(filename)["kv_cache"].cuda()
+                inject_kv_into_layer(kv_cache_layer, kv_cache, request.slot_mapping)
 
     def wait_for_layer_load(self, layer_name: str) -> None:
         """Blocking until the KV for a specific layer is loaded into vLLM's
-        paged buffer. 
-        
+        paged buffer.
+
         This interface will be useful for layer-by-layer pipelining.
 
         Args:
@@ -187,15 +198,19 @@ def wait_for_layer_load(self, layer_name: str) -> None:
         """
         return
 
-    def save_kv_layer(self, layer_name: str, kv_layer: torch.Tensor,
-                      attn_metadata: "AttentionMetadata",
-                      **kwargs: Any) -> None:
-        """Start saving the KV cache of the layer from vLLM's paged buffer 
+    def save_kv_layer(
+        self,
+        layer_name: str,
+        kv_layer: torch.Tensor,
+        attn_metadata: "AttentionMetadata",
+        **kwargs: Any,
+    ) -> None:
+        """Start saving the KV cache of the layer from vLLM's paged buffer
         to the connector.
 
         Args:
             layer_name (str): the name of the layer.
-            kv_layer (torch.Tensor): the paged KV buffer of the current 
+            kv_layer (torch.Tensor): the paged KV buffer of the current
                 layer in vLLM.
             attn_metadata (AttentionMetadata): the attention metadata.
             **kwargs: additional arguments for the save operation.
@@ -212,20 +227,18 @@ def extract_kv_from_layer(
             """
             if isinstance(attn_metadata, MLACommonMetadata):
                 num_pages, page_size = layer.shape[0], layer.shape[1]
-                return layer.reshape(num_pages * page_size, -1)[slot_mapping,
-                                                                ...]
+                return layer.reshape(num_pages * page_size, -1)[slot_mapping, ...]
             num_pages, page_size = layer.shape[1], layer.shape[2]
-            return layer.reshape(2, num_pages * page_size, -1)[:, slot_mapping,
-                                                               ...]
+            return layer.reshape(2, num_pages * page_size, -1)[:, slot_mapping, ...]
 
         connector_metadata = self._get_connector_metadata()
         assert isinstance(connector_metadata, SharedStorageConnectorMetadata)
         for request in connector_metadata.requests:
             if request.is_store:
                 filename = self._generate_filename_debug(
-                    layer_name, request.token_ids, request.mm_hashes)
-                kv_cache = extract_kv_from_layer(kv_layer,
-                                                 request.slot_mapping)
+                    layer_name, request.token_ids, request.mm_hashes
+                )
+                kv_cache = extract_kv_from_layer(kv_layer, request.slot_mapping)
                 tensors = {"kv_cache": kv_cache.detach().cpu()}
                 safetensors.torch.save_file(tensors, filename)
 
@@ -240,14 +253,14 @@ def get_num_new_matched_tokens(
         """
         Get number of new tokens that can be loaded from the
         external KV cache beyond the num_computed_tokens.
-        
+
         Args:
             request (Request): the request object.
             num_computed_tokens (int): the number of locally
                 computed tokens for this request
 
         Returns:
-            the number of tokens that can be loaded from the 
+            the number of tokens that can be loaded from the
             external KV cache beyond what is already computed.
         """
         # NOTE: in this debug implementation, we assume that the prompt is
@@ -265,13 +278,14 @@ def get_num_new_matched_tokens(
         # Now, first num_tokens_to_check tokens are hit, we need to prepare
         # the metadata for the worker connector to correctly load the KV
         num_tokens_to_check = align_to_block_size(
-            len(request.prompt_token_ids) - 1, self._block_size)
+            len(request.prompt_token_ids) - 1, self._block_size
+        )
 
         return num_tokens_to_check - num_computed_tokens, False
 
-    def update_state_after_alloc(self, request: "Request",
-                                 blocks: "KVCacheBlocks",
-                                 num_external_tokens: int):
+    def update_state_after_alloc(
+        self, request: "Request", blocks: "KVCacheBlocks", num_external_tokens: int
+    ):
         """
         Update KVConnector state after block allocation.
 
@@ -303,7 +317,8 @@ def build_connector_meta(
                     block_ids=new_req.block_ids[0],
                     block_size=self._block_size,
                     is_store=False,
-                    mm_hashes=[f.identifier for f in new_req.mm_features])
+                    mm_hashes=[f.identifier for f in new_req.mm_features],
+                )
                 total_need_load += 1
             else:
                 # NOTE: here, we set the store and load being exclusive,
@@ -316,7 +331,8 @@ def build_connector_meta(
                         block_ids=new_req.block_ids[0],
                         block_size=self._block_size,
                         is_store=True,
-                        mm_hashes=[f.identifier for f in new_req.mm_features])
+                        mm_hashes=[f.identifier for f in new_req.mm_features],
+                    )
 
         cached_reqs = scheduler_output.scheduled_cached_reqs
         for i, req_id in enumerate(cached_reqs.req_ids):
@@ -346,7 +362,8 @@ def build_connector_meta(
                     block_ids=block_ids,
                     block_size=self._block_size,
                     is_store=False,
-                    mm_hashes=[f.identifier for f in request.mm_features])
+                    mm_hashes=[f.identifier for f in request.mm_features],
+                )
                 total_need_load += 1
 
         assert total_need_load == len(self._requests_need_load)
@@ -361,14 +378,15 @@ def _found_match_for_request(
         self,
         request: "Request",
     ) -> bool:
-        """Check if the cache is hit for the request.
-        """
+        """Check if the cache is hit for the request."""
         num_tokens_to_check = align_to_block_size(
-            len(request.prompt_token_ids) - 1, self._block_size)
+            len(request.prompt_token_ids) - 1, self._block_size
+        )
         foldername = self._generate_foldername_debug(
             torch.tensor(request.prompt_token_ids)[:num_tokens_to_check],
             [f.identifier for f in request.mm_features],
-            create_folder=False)
+            create_folder=False,
+        )
         return os.path.exists(foldername)
 
     def _generate_foldername_debug(
@@ -377,7 +395,7 @@ def _generate_foldername_debug(
         mm_hashes: list[str],
         create_folder=False,
     ) -> str:
-        """Generate a folder name based on the hash of the bytes of the input 
+        """Generate a folder name based on the hash of the bytes of the input
         ids.
         """
         token_bytes = token_ids.numpy().tobytes()
@@ -385,9 +403,8 @@ def _generate_foldername_debug(
         # to create a canonical key.
         if mm_hashes:
             mm_str = "-".join(mm_hashes)
-            token_bytes += mm_str.encode('utf-8')
-        input_ids_hash = hashlib.md5(token_bytes,
-                                     usedforsecurity=False).hexdigest()
+            token_bytes += mm_str.encode("utf-8")
+        input_ids_hash = hashlib.md5(token_bytes, usedforsecurity=False).hexdigest()
 
         foldername = os.path.join(self._storage_path, input_ids_hash)
         if create_folder:
@@ -400,16 +417,15 @@ def _generate_filename_debug(
         token_ids: torch.Tensor,
         mm_hashes: list[str],
     ) -> str:
-        """Generate a file name based on the layer name and the hash 
+        """Generate a file name based on the layer name and the hash
         of the bytes of the input ids.
         """
-        foldername = self._generate_foldername_debug(token_ids,
-                                                     mm_hashes=mm_hashes,
-                                                     create_folder=True)
+        foldername = self._generate_foldername_debug(
+            token_ids, mm_hashes=mm_hashes, create_folder=True
+        )
         return os.path.join(foldername, f"{layer_name}.safetensors")
 
 
 def align_to_block_size(num_tokens: int, block_size) -> int:
-    """Align the number of tokens to the block size.
-    """
+    """Align the number of tokens to the block size."""
     return (num_tokens - 1) // block_size * block_size
diff --git a/vllm/distributed/kv_transfer/kv_lookup_buffer/base.py b/vllm/distributed/kv_transfer/kv_lookup_buffer/base.py
index eef14269f196..08b683bfe23f 100644
--- a/vllm/distributed/kv_transfer/kv_lookup_buffer/base.py
+++ b/vllm/distributed/kv_transfer/kv_lookup_buffer/base.py
@@ -42,39 +42,44 @@ class KVLookupBufferBase(KVCacheBufferBase):
     Abstract base class for a KVCache lookup buffer.
 
     This class provides an abstraction for a key-value (KV) cache lookup buffer.
-    
+
     The key of the lookup buffer:
     - input_tokens: token IDs of the request
     - roi: a binary mask on top of input_tokens.
-      - Purpose of roi: Since KV cache may only be available for a subset of 
-        tokens in the input (for example, when vLLM is connected to an external 
-        KV cache service), roi specifies the subset of tokens that the KV cache 
+      - Purpose of roi: Since KV cache may only be available for a subset of
+        tokens in the input (for example, when vLLM is connected to an external
+        KV cache service), roi specifies the subset of tokens that the KV cache
         is associated with.
-      - NOTE: roi can be further extended to describe which part of KV the 
-        current process is holding (each process may only hold a part of KV 
+      - NOTE: roi can be further extended to describe which part of KV the
+        current process is holding (each process may only hold a part of KV
         due to TP and PP). This is not implemented for now.
-        
+
     The value of the lookup buffer:
     - key: the key tensor in the KV cache
     - value: the value tensor in the KV cache
-    - hidden: the final hidden state generated by model forwarding. This allows 
+    - hidden: the final hidden state generated by model forwarding. This allows
       vLLM to bypass further model forwarding by transmitting the hidden state.
     """
 
     @abstractmethod
-    def insert(self, input_tokens: torch.Tensor, roi: torch.Tensor,
-               key: torch.Tensor, value: torch.Tensor,
-               hidden: torch.Tensor) -> None:
+    def insert(
+        self,
+        input_tokens: torch.Tensor,
+        roi: torch.Tensor,
+        key: torch.Tensor,
+        value: torch.Tensor,
+        hidden: torch.Tensor,
+    ) -> None:
         """Insert into the lookup buffer.
-        
+
         The functionality is similar to the following python statement
         ```
         buffer[input_tokens, roi] = [key, value, hidden]
         ```
-        
+
         FIXME: in the future, we should only have two arguments, key and value,
         where key is a tensor dict and value is a tensor dict.
-        
+
         FIXME: we should transmit both sampler outputs and the hidden states.
 
         Args:
@@ -82,8 +87,8 @@ def insert(self, input_tokens: torch.Tensor, roi: torch.Tensor,
             roi (torch.Tensor): A binary mask on top of the input tokens
             key (torch.Tensor): The key tensor in the KV cache.
             value (torch.Tensor): The value tensor in the KV cache.
-            hidden (torch.Tensor): The final hidden state tensor generated 
-                                   during model forwarding to bypass model 
+            hidden (torch.Tensor): The final hidden state tensor generated
+                                   during model forwarding to bypass model
                                    forwarding.
 
         Raises:
@@ -93,16 +98,16 @@ def insert(self, input_tokens: torch.Tensor, roi: torch.Tensor,
 
     @abstractmethod
     def drop_select(
-            self, input_tokens: Optional[torch.Tensor],
-            roi: Optional[torch.Tensor]) -> list[Optional[torch.Tensor]]:
+        self, input_tokens: Optional[torch.Tensor], roi: Optional[torch.Tensor]
+    ) -> list[Optional[torch.Tensor]]:
         """Select and *drop* KV cache entries from the lookup buffer.
-        
+
         The functionality is similar to the following python statements
         ```
         ret = buffer.pop(input_tokens, roi)
         return ret
         ```
-        
+
         If `input_tokens` and `roi` is `None`, it means selecting any of the
         KV caches in the buffer, return, and remove it from the buffer, useful
         when offloading KV cache to KV cache storage service.
diff --git a/vllm/distributed/kv_transfer/kv_lookup_buffer/mooncake_store.py b/vllm/distributed/kv_transfer/kv_lookup_buffer/mooncake_store.py
index 4381aad1e995..44fc6d8ac5ad 100644
--- a/vllm/distributed/kv_transfer/kv_lookup_buffer/mooncake_store.py
+++ b/vllm/distributed/kv_transfer/kv_lookup_buffer/mooncake_store.py
@@ -6,6 +6,7 @@
 into a remote KVStore-based lookup buffer and getting existing KV caches
 from this remote lookup buffer.
 """
+
 import json
 import os
 from dataclasses import dataclass
@@ -16,8 +17,7 @@
 from safetensors.torch import save as safetensors_save
 
 from vllm.config import VllmConfig
-from vllm.distributed.kv_transfer.kv_lookup_buffer.base import (
-    KVStoreBufferBase)
+from vllm.distributed.kv_transfer.kv_lookup_buffer.base import KVStoreBufferBase
 from vllm.logger import init_logger
 
 DEFAULT_GLOBAL_SEGMENT_SIZE = 3355443200  # 3.125 GiB
@@ -37,65 +37,69 @@ class MooncakeStoreConfig:
     master_server_address: str
 
     @staticmethod
-    def from_file(file_path: str) -> 'MooncakeStoreConfig':
+    def from_file(file_path: str) -> "MooncakeStoreConfig":
         """Load the config from a JSON file."""
         with open(file_path) as fin:
             config = json.load(fin)
         return MooncakeStoreConfig(
             local_hostname=config.get("local_hostname"),
             metadata_server=config.get("metadata_server"),
-            global_segment_size=config.get("global_segment_size",
-                                           DEFAULT_GLOBAL_SEGMENT_SIZE),
-            local_buffer_size=config.get("local_buffer_size",
-                                         DEFAULT_LOCAL_BUFFER_SIZE),
+            global_segment_size=config.get(
+                "global_segment_size", DEFAULT_GLOBAL_SEGMENT_SIZE
+            ),
+            local_buffer_size=config.get(
+                "local_buffer_size", DEFAULT_LOCAL_BUFFER_SIZE
+            ),
             protocol=config.get("protocol", "tcp"),
             device_name=config.get("device_name", ""),
             master_server_address=config.get("master_server_address"),
         )
 
     @staticmethod
-    def load_from_env() -> 'MooncakeStoreConfig':
+    def load_from_env() -> "MooncakeStoreConfig":
         """Load config from a file specified in the environment variable."""
-        config_file_path = os.getenv('MOONCAKE_CONFIG_PATH')
+        config_file_path = os.getenv("MOONCAKE_CONFIG_PATH")
         if config_file_path is None:
             raise ValueError(
-                "The environment variable 'MOONCAKE_CONFIG_PATH' is not set.")
+                "The environment variable 'MOONCAKE_CONFIG_PATH' is not set."
+            )
         return MooncakeStoreConfig.from_file(config_file_path)
 
 
 class MooncakeStore(KVStoreBufferBase):
-
     def __init__(
         self,
         config: VllmConfig,
     ):
-
         try:
             from mooncake.store import MooncakeDistributedStore
         except ImportError as e:
             raise ImportError(
                 "Please install mooncake by following the instructions at "
                 "https://github.com/kvcache-ai/Mooncake/blob/main/doc/en/build.md "  # noqa: E501
-                "to run vLLM with MooncakeConnector.") from e
+                "to run vLLM with MooncakeConnector."
+            ) from e
 
         try:
             self.store = MooncakeDistributedStore()
             self.config = MooncakeStoreConfig.load_from_env()
             logger.info("Mooncake Configuration loaded successfully.")
 
-            self.store.setup(self.config.local_hostname,
-                             self.config.metadata_server,
-                             self.config.global_segment_size,
-                             self.config.local_buffer_size,
-                             self.config.protocol, self.config.device_name,
-                             self.config.master_server_address)
+            self.store.setup(
+                self.config.local_hostname,
+                self.config.metadata_server,
+                self.config.global_segment_size,
+                self.config.local_buffer_size,
+                self.config.protocol,
+                self.config.device_name,
+                self.config.master_server_address,
+            )
 
         except ValueError as e:
             logger.error("Configuration loading failed: %s", e)
             raise
         except Exception as exc:
-            logger.error(
-                "An error occurred while loading the configuration: %s", exc)
+            logger.error("An error occurred while loading the configuration: %s", exc)
             raise
 
     def close(self):
@@ -126,12 +130,9 @@ def _put_impl(
         value: torch.Tensor,
     ) -> None:
         """Put KVCache to Mooncake Store"""
-        device_id = value.device.index if value.device.type == 'cuda' else -1
+        device_id = value.device.index if value.device.type == "cuda" else -1
         device_tensor = torch.tensor(device_id, dtype=torch.int32)
-        value_bytes = safetensors_save({
-            "tensor": value,
-            "device_id": device_tensor
-        })
+        value_bytes = safetensors_save({"tensor": value, "device_id": device_tensor})
         try:
             self.store.put(key, value_bytes)
         except TypeError as err:
@@ -154,8 +155,11 @@ def _get_impl(
             tensor = loaded_tensors["tensor"]
             device_id_tensor = loaded_tensors["device_id"]
             device_id = int(device_id_tensor.item())
-            device = torch.device(
-                'cuda', device_id) if device_id >= 0 else torch.device('cpu')
+            device = (
+                torch.device("cuda", device_id)
+                if device_id >= 0
+                else torch.device("cpu")
+            )
             return tensor.to(device)
 
         return None
diff --git a/vllm/distributed/kv_transfer/kv_lookup_buffer/simple_buffer.py b/vllm/distributed/kv_transfer/kv_lookup_buffer/simple_buffer.py
index a0ff7c320f61..cd58ec2e7639 100644
--- a/vllm/distributed/kv_transfer/kv_lookup_buffer/simple_buffer.py
+++ b/vllm/distributed/kv_transfer/kv_lookup_buffer/simple_buffer.py
@@ -1,23 +1,23 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """
-    Implements a distributed key-value (KV) cache transfer mechanism.
-
-    Key Features:
-    - Distributed KV cache transmission using PyNccl pipes.
-    - Non-blocking `insert`, blocking `drop_select`.
-    - Use CPU signal pipe to avoid racing condition
-    - Handles buffer size constraints and provide backpressure mechanism to
-      stop the prefill instance when the decode instance is slow.
+Implements a distributed key-value (KV) cache transfer mechanism.
+
+Key Features:
+- Distributed KV cache transmission using PyNccl pipes.
+- Non-blocking `insert`, blocking `drop_select`.
+- Use CPU signal pipe to avoid racing condition
+- Handles buffer size constraints and provide backpressure mechanism to
+  stop the prefill instance when the decode instance is slow.
 """
+
 import threading
 from collections import deque
 from typing import Optional, Union
 
 import torch
 
-from vllm.distributed.kv_transfer.kv_lookup_buffer.base import (
-    KVLookupBufferBase)
+from vllm.distributed.kv_transfer.kv_lookup_buffer.base import KVLookupBufferBase
 from vllm.distributed.kv_transfer.kv_pipe.base import KVPipeBase
 from vllm.logger import init_logger
 
@@ -25,9 +25,9 @@
 
 
 class SimpleBuffer(KVLookupBufferBase):
-
-    def __init__(self, signal_pipe: KVPipeBase, data_pipe: KVPipeBase,
-                 buffer_size_thresh: float):
+    def __init__(
+        self, signal_pipe: KVPipeBase, data_pipe: KVPipeBase, buffer_size_thresh: float
+    ):
         """
         signal_pipe: on CPU
 
@@ -51,9 +51,11 @@ def __init__(self, signal_pipe: KVPipeBase, data_pipe: KVPipeBase,
         self.normal_signal = torch.tensor([0], device="cpu")
         self.end_signal = None
 
-    def _matches(self, tokens_roi_sender: list[torch.Tensor],
-                 tokens_roi_recver: list[torch.Tensor]):
-
+    def _matches(
+        self,
+        tokens_roi_sender: list[torch.Tensor],
+        tokens_roi_recver: list[torch.Tensor],
+    ):
         # tokens_roi_sender: tokens and roi of the producer (in the buffer)
         # tokens_roi_recver: tokens and roi of the consumer (query)
 
@@ -74,15 +76,12 @@ def _matches(self, tokens_roi_sender: list[torch.Tensor],
 
         # simple common prefix matching
         min_length = min(len(tokens_sender), len(tokens_recver))
-        if torch.allclose(tokens_sender[:min_length],
-                          tokens_recver[:min_length]):
+        if torch.allclose(tokens_sender[:min_length], tokens_recver[:min_length]):
             return min_length
 
         return 0
 
-    def _send_tensor_and_dec_size(self,
-                                  tensor: Optional[torch.Tensor]) -> None:
-
+    def _send_tensor_and_dec_size(self, tensor: Optional[torch.Tensor]) -> None:
         assert tensor is not None, "Use self.data_pipe.send(None) instead"
         self.buffer_size -= tensor.element_size() * tensor.numel()
         if tensor.dtype == torch.bool:
@@ -90,7 +89,6 @@ def _send_tensor_and_dec_size(self,
         self.data_pipe.send_tensor(tensor)
 
     def _get_element_size(self, data: Optional[Union[list, torch.Tensor]]):
-
         if isinstance(data, torch.Tensor):
             return data.element_size() * data.numel()
         if not data:
@@ -100,10 +98,14 @@ def _get_element_size(self, data: Optional[Union[list, torch.Tensor]]):
 
         raise AssertionError(f"Unknown data type {type(data)}")
 
-    def _add_to_buffer(self, input_tokens: torch.Tensor, roi: torch.Tensor,
-                       key: torch.Tensor, value: torch.Tensor,
-                       hidden: torch.Tensor):
-
+    def _add_to_buffer(
+        self,
+        input_tokens: torch.Tensor,
+        roi: torch.Tensor,
+        key: torch.Tensor,
+        value: torch.Tensor,
+        hidden: torch.Tensor,
+    ):
         if isinstance(input_tokens, torch.Tensor):
             input_tokens = input_tokens.clone()
         if isinstance(roi, torch.Tensor):
@@ -134,9 +136,7 @@ def _is_end_signal(self, signal):
         return signal is None
 
     def drop_select_handler(self):
-
         try:
-
             while True:
                 signal = self.signal_pipe.recv_tensor()
                 if self._is_end_signal(signal):
@@ -146,20 +146,21 @@ def drop_select_handler(self):
                 input_tokens = self.data_pipe.recv_tensor()
 
                 roi = self.data_pipe.recv_tensor()
-                assert roi is not None, "Please provide the roi when sending "\
-                    "drop-select request"
-                roi = (roi > 0.5)
+                assert roi is not None, (
+                    "Please provide the roi when sending drop-select request"
+                )
+                roi = roi > 0.5
                 tokens_roi_recver = [input_tokens, roi]
 
                 def is_buffer_available(
-                    tokens_roi_recver: list[torch.Tensor], ) -> bool:
+                    tokens_roi_recver: list[torch.Tensor],
+                ) -> bool:
                     # perform input tokens and roi matching
                     # FIXME: this matching is O(n), ideally it should be O(1)
                     # but this buffer size won't (and shouldn't) be too large so
                     # the fix is not urgent.
                     for _ in range(len(self.buffer)):
-                        if self._matches(self.buffer[0],
-                                         tokens_roi_recver) > 0:
+                        if self._matches(self.buffer[0], tokens_roi_recver) > 0:
                             return True
                         # rotate the element we just accessed to the end
                         self.buffer.rotate(-1)
@@ -167,8 +168,7 @@ def is_buffer_available(
 
                 with self.buffer_cv:
                     while not is_buffer_available(tokens_roi_recver):
-                        logger.debug(
-                            "KV transfer buffer is not available. Waiting...")
+                        logger.debug("KV transfer buffer is not available. Waiting...")
                         self.buffer_cv.wait()
                     # need to clone the tensor
                     # in case the tensor is freed before sending finishes
@@ -178,18 +178,18 @@ def is_buffer_available(
                     self.buffer_cv.notify()
 
         except RuntimeError as e:
-            if 'Connection closed by peer' not in str(e):
+            if "Connection closed by peer" not in str(e):
                 raise e
 
         logger.debug("Closing drop_select_handler")
 
     def drop_select(
-            self, input_tokens: Optional[torch.Tensor],
-            roi: Optional[torch.Tensor]) -> list[Optional[torch.Tensor]]:
-
-        assert self.request_handling_thread is None, \
-            "drop_select should be called by the KV cache consumer "\
+        self, input_tokens: Optional[torch.Tensor], roi: Optional[torch.Tensor]
+    ) -> list[Optional[torch.Tensor]]:
+        assert self.request_handling_thread is None, (
+            "drop_select should be called by the KV cache consumer "
             "(e.g. the decode vLLM instance)"
+        )
 
         if isinstance(input_tokens, torch.Tensor):
             input_tokens = input_tokens.clone()
@@ -205,30 +205,36 @@ def drop_select(
         if roi is not None:
             # convert from float tensor to bool tensor
             # as PyNccl does not support sending bool tensor
-            roi = (roi > 0.5)
+            roi = roi > 0.5
         key = self.data_pipe.recv_tensor()
         value = self.data_pipe.recv_tensor()
         hidden = self.data_pipe.recv_tensor()
 
         return [input_tokens, roi, key, value, hidden]
 
-    def insert(self, input_tokens: torch.Tensor, roi: torch.Tensor,
-               key: torch.Tensor, value: torch.Tensor,
-               hidden: torch.Tensor) -> None:
-
+    def insert(
+        self,
+        input_tokens: torch.Tensor,
+        roi: torch.Tensor,
+        key: torch.Tensor,
+        value: torch.Tensor,
+        hidden: torch.Tensor,
+    ) -> None:
         self._add_to_buffer(input_tokens, roi, key, value, hidden)
 
         # when calling the insert, the current process is a sender
         # need to launch the request handler and start listening to request.
         if self.request_handling_thread is None:
             self.request_handling_thread = threading.Thread(
-                target=self.drop_select_handler)
+                target=self.drop_select_handler
+            )
             self.request_handling_thread.start()
 
     def close(self):
-
-        if hasattr(self, "request_handling_thread"
-                   ) and self.request_handling_thread is not None:
+        if (
+            hasattr(self, "request_handling_thread")
+            and self.request_handling_thread is not None
+        ):
             self.request_handling_thread.join()
 
         else:
diff --git a/vllm/distributed/kv_transfer/kv_pipe/base.py b/vllm/distributed/kv_transfer/kv_pipe/base.py
index 1423fd032477..e27c6b2101b8 100644
--- a/vllm/distributed/kv_transfer/kv_pipe/base.py
+++ b/vllm/distributed/kv_transfer/kv_pipe/base.py
@@ -26,11 +26,11 @@ class KVPipeBase(ABC):
     @abstractmethod
     def send_tensor(self, tensor: Optional[torch.Tensor]) -> None:
         """Send a tensor, or None, via the pipe.
-        
+
         Need to support sending None -- important for error handling.
-        
-        TODO: add a `key` argument so that we can use traditional 
-        key-value database as the distributed communication mechanism behind 
+
+        TODO: add a `key` argument so that we can use traditional
+        key-value database as the distributed communication mechanism behind
         the pipe.
 
         Args:
@@ -46,7 +46,7 @@ def recv_tensor(self) -> Optional[torch.Tensor]:
         """Receive a tensor (can be None) from the pipeline.
 
         Returns:
-            Optional[torch.Tensor]: The tensor received from the pipeline. Can 
+            Optional[torch.Tensor]: The tensor received from the pipeline. Can
                                     be None.
 
         Raises:
@@ -58,7 +58,7 @@ def recv_tensor(self) -> Optional[torch.Tensor]:
     def close(self) -> None:
         """Close the pipeline and release resources.
 
-        This method is responsible for closing the communication pipeline 
+        This method is responsible for closing the communication pipeline
         and releasing any resources associated with it.
 
         Raises:
diff --git a/vllm/distributed/kv_transfer/kv_pipe/mooncake_pipe.py b/vllm/distributed/kv_transfer/kv_pipe/mooncake_pipe.py
index 2a434e280179..65858f86aa23 100644
--- a/vllm/distributed/kv_transfer/kv_pipe/mooncake_pipe.py
+++ b/vllm/distributed/kv_transfer/kv_pipe/mooncake_pipe.py
@@ -32,7 +32,7 @@ class MooncakeTransferEngineConfig:
     device_name: str
 
     @staticmethod
-    def from_file(file_path: str) -> 'MooncakeTransferEngineConfig':
+    def from_file(file_path: str) -> "MooncakeTransferEngineConfig":
         """Load the config from a JSON file."""
         with open(file_path) as fin:
             config = json.load(fin)
@@ -46,12 +46,13 @@ def from_file(file_path: str) -> 'MooncakeTransferEngineConfig':
         )
 
     @staticmethod
-    def load_from_env() -> 'MooncakeTransferEngineConfig':
+    def load_from_env() -> "MooncakeTransferEngineConfig":
         """Load config from a file specified in the environment variable."""
-        config_file_path = os.getenv('MOONCAKE_CONFIG_PATH')
+        config_file_path = os.getenv("MOONCAKE_CONFIG_PATH")
         if config_file_path is None:
             raise ValueError(
-                "The environment variable 'MOONCAKE_CONFIG_PATH' is not set.")
+                "The environment variable 'MOONCAKE_CONFIG_PATH' is not set."
+            )
         return MooncakeTransferEngineConfig.from_file(config_file_path)
 
 
@@ -65,7 +66,8 @@ def __init__(self, kv_rank: int, local_rank: int):
             raise ImportError(
                 "Please install mooncake by following the instructions at "
                 "https://github.com/kvcache-ai/Mooncake/blob/main/doc/en/build.md "  # noqa: E501
-                "to run vLLM with MooncakeConnector.") from e
+                "to run vLLM with MooncakeConnector."
+            ) from e
 
         self.engine = TransferEngine()
         self.local_rank = local_rank
@@ -77,16 +79,13 @@ def __init__(self, kv_rank: int, local_rank: int):
             logger.error(e)
             raise
         except Exception as exc:
-            logger.error(
-                "An error occurred while loading the configuration: %s", exc)
+            logger.error("An error occurred while loading the configuration: %s", exc)
             raise
-        prefill_host, base_prefill_port = split_host_port(
-            self.config.prefill_url)
+        prefill_host, base_prefill_port = split_host_port(self.config.prefill_url)
         decode_host, base_decode_port = split_host_port(self.config.decode_url)
 
         # Avoid ports conflict when running prefill and decode on the same node
-        if prefill_host == decode_host and \
-                base_prefill_port == base_decode_port:
+        if prefill_host == decode_host and base_prefill_port == base_decode_port:
             base_decode_port = base_decode_port + 100
 
         prefill_port = base_prefill_port + self.local_rank
@@ -94,12 +93,15 @@ def __init__(self, kv_rank: int, local_rank: int):
         self.prefill_url = join_host_port(prefill_host, prefill_port)
         self.decode_url = join_host_port(decode_host, decode_port)
 
-        self.initialize(self.prefill_url if kv_rank == 0 else self.decode_url,
-                        self.config.metadata_server, self.config.protocol,
-                        self.config.device_name, self.config.metadata_backend)
+        self.initialize(
+            self.prefill_url if kv_rank == 0 else self.decode_url,
+            self.config.metadata_server,
+            self.config.protocol,
+            self.config.device_name,
+            self.config.metadata_backend,
+        )
 
-        self.remote_url = (self.decode_url
-                           if kv_rank == 0 else self.prefill_url)
+        self.remote_url = self.decode_url if kv_rank == 0 else self.prefill_url
 
         # Initialize ZeroMQ context and sockets
         self.context = zmq.Context()  # type: ignore[attr-defined]
@@ -109,51 +111,57 @@ def __init__(self, kv_rank: int, local_rank: int):
         self.receiver_ack = self.context.socket(zmq.constants.PUSH)
 
         self.buffer_cleaner = ThreadPoolExecutor(max_workers=1)
-        self._setup_metadata_sockets(kv_rank, prefill_host, base_prefill_port,
-                                     decode_host, base_decode_port)
+        self._setup_metadata_sockets(
+            kv_rank, prefill_host, base_prefill_port, decode_host, base_decode_port
+        )
 
-    def _setup_metadata_sockets(self, kv_rank: int, p_host: str, p_port: int,
-                                d_host: str, d_port: int) -> None:
+    def _setup_metadata_sockets(
+        self, kv_rank: int, p_host: str, p_port: int, d_host: str, d_port: int
+    ) -> None:
         """Set up ZeroMQ sockets for sending and receiving data."""
         # Offsets < 8 are left for initialization in case tp and pp are enabled
         p_rank_offset = p_port + 8 + self.local_rank * 2
         d_rank_offset = d_port + 8 + self.local_rank * 2
         if kv_rank == 0:
-            self.sender_socket.bind(
-                make_zmq_path("tcp", p_host, p_rank_offset + 1))
+            self.sender_socket.bind(make_zmq_path("tcp", p_host, p_rank_offset + 1))
             self.receiver_socket.connect(
-                make_zmq_path("tcp", d_host, d_rank_offset + 1))
-            self.sender_ack.connect(
-                make_zmq_path("tcp", d_host, d_rank_offset + 2))
-            self.receiver_ack.bind(
-                make_zmq_path("tcp", p_host, p_rank_offset + 2))
+                make_zmq_path("tcp", d_host, d_rank_offset + 1)
+            )
+            self.sender_ack.connect(make_zmq_path("tcp", d_host, d_rank_offset + 2))
+            self.receiver_ack.bind(make_zmq_path("tcp", p_host, p_rank_offset + 2))
         else:
             self.receiver_socket.connect(
-                make_zmq_path("tcp", p_host, p_rank_offset + 1))
-            self.sender_socket.bind(
-                make_zmq_path("tcp", d_host, d_rank_offset + 1))
-            self.receiver_ack.bind(
-                make_zmq_path("tcp", d_host, d_rank_offset + 2))
-            self.sender_ack.connect(
-                make_zmq_path("tcp", p_host, p_rank_offset + 2))
-
-    def initialize(self, local_hostname: str, metadata_server: str,
-                   protocol: str, device_name: str,
-                   metadata_backend: Union[str, None]) -> None:
+                make_zmq_path("tcp", p_host, p_rank_offset + 1)
+            )
+            self.sender_socket.bind(make_zmq_path("tcp", d_host, d_rank_offset + 1))
+            self.receiver_ack.bind(make_zmq_path("tcp", d_host, d_rank_offset + 2))
+            self.sender_ack.connect(make_zmq_path("tcp", p_host, p_rank_offset + 2))
+
+    def initialize(
+        self,
+        local_hostname: str,
+        metadata_server: str,
+        protocol: str,
+        device_name: str,
+        metadata_backend: Union[str, None],
+    ) -> None:
         """Initialize the mooncake instance."""
         if metadata_backend is None:
-            self.engine.initialize(local_hostname, metadata_server, protocol,
-                                   device_name)
+            self.engine.initialize(
+                local_hostname, metadata_server, protocol, device_name
+            )
         else:
             supported_backend = ["etcd", "redis"]
             metadata_backend = metadata_backend.lower()
             if metadata_backend not in supported_backend:
                 raise ValueError(
                     "Mooncake Configuration error. `metadata_backend`"
-                    f" should be one of {supported_backend}.")
+                    f" should be one of {supported_backend}."
+                )
 
-            self.engine.initialize_ext(local_hostname, metadata_server,
-                                       protocol, device_name, metadata_backend)
+            self.engine.initialize_ext(
+                local_hostname, metadata_server, protocol, device_name, metadata_backend
+            )
 
     def allocate_managed_buffer(self, length: int) -> int:
         """Allocate a managed buffer of the specified length."""
@@ -167,18 +175,17 @@ def free_managed_buffer(self, buffer: int, length: int) -> int:
         """Free a previously allocated managed buffer."""
         return self.engine.free_managed_buffer(buffer, length)
 
-    def transfer_sync(self, buffer: int, peer_buffer_address: int,
-                      length: int) -> int:
+    def transfer_sync(self, buffer: int, peer_buffer_address: int, length: int) -> int:
         """Synchronously transfer data to the specified address."""
-        ret = self.engine.transfer_sync_read(self.remote_url, buffer,
-                                             peer_buffer_address, length)
+        ret = self.engine.transfer_sync_read(
+            self.remote_url, buffer, peer_buffer_address, length
+        )
         if ret < 0:
             logger.error("Transfer Return Error")
             raise Exception("Transfer Return Error")
         return ret
 
-    def write_bytes_to_buffer(self, buffer: int, user_data: bytes,
-                              length: int) -> int:
+    def write_bytes_to_buffer(self, buffer: int, user_data: bytes, length: int) -> int:
         """Write bytes to the allocated buffer."""
         return self.engine.write_bytes_to_buffer(buffer, user_data, length)
 
@@ -189,7 +196,7 @@ def read_bytes_from_buffer(self, buffer: int, length: int) -> bytes:
     def wait_for_ack(self, src_ptr: int, length: int) -> None:
         """Asynchronously wait for ACK from the receiver."""
         ack = self.sender_ack.recv()
-        if ack != b'ACK':
+        if ack != b"ACK":
             logger.error("Failed to receive ACK from the receiver")
 
         self.free_managed_buffer(src_ptr, length)
@@ -200,8 +207,8 @@ def send_bytes(self, user_data: bytes) -> None:
         src_ptr = self.allocate_managed_buffer(length)
         self.write_bytes_to_buffer(src_ptr, user_data, length)
         self.sender_socket.send_multipart(
-            [struct.pack("!Q", src_ptr),
-             struct.pack("!Q", length)])
+            [struct.pack("!Q", src_ptr), struct.pack("!Q", length)]
+        )
         self.buffer_cleaner.submit(self.wait_for_ack, src_ptr, length)
 
     def recv_bytes(self) -> bytes:
@@ -214,7 +221,7 @@ def recv_bytes(self) -> bytes:
         ret = self.read_bytes_from_buffer(dst_ptr, length)
 
         # Buffer cleanup
-        self.receiver_ack.send(b'ACK')
+        self.receiver_ack.send(b"ACK")
         self.free_managed_buffer(dst_ptr, length)
 
         return ret
@@ -223,10 +230,9 @@ def recv_bytes(self) -> bytes:
 class MooncakePipe(KVPipeBase):
     """MooncakeTransferEngine based Pipe implementation."""
 
-    def __init__(self,
-                 local_rank: int,
-                 config: KVTransferConfig,
-                 device: Optional[str] = None):
+    def __init__(
+        self, local_rank: int, config: KVTransferConfig, device: Optional[str] = None
+    ):
         """Initialize the mooncake pipe and set related parameters."""
         self.config = config
         self.local_rank = local_rank
@@ -236,8 +242,7 @@ def __init__(self,
         else:
             self.device = self._select_device(device)
 
-        self.transfer_engine = MooncakeTransferEngine(self.kv_rank,
-                                                      self.local_rank)
+        self.transfer_engine = MooncakeTransferEngine(self.kv_rank, self.local_rank)
         self.transport_thread: Optional[ThreadPoolExecutor] = None
         self.none_tensor = torch.tensor([NONE_INT], device=self.device)
 
@@ -267,7 +272,7 @@ def send_tensor(self, tensor: Optional[torch.Tensor]) -> None:
         if self.transport_thread is None:
             self.transport_thread = ThreadPoolExecutor(max_workers=1)
         tensor = tensor if tensor is not None else self.none_tensor
-        assert (len(tensor.shape) > 0)
+        assert len(tensor.shape) > 0
         self.transport_thread.submit(self._send_impl, tensor)
 
     def recv_tensor(self) -> Optional[torch.Tensor]:
diff --git a/vllm/distributed/kv_transfer/kv_pipe/pynccl_pipe.py b/vllm/distributed/kv_transfer/kv_pipe/pynccl_pipe.py
index 7a79a8cc0c93..c79b7e7e5030 100644
--- a/vllm/distributed/kv_transfer/kv_pipe/pynccl_pipe.py
+++ b/vllm/distributed/kv_transfer/kv_pipe/pynccl_pipe.py
@@ -1,16 +1,16 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """
-    This module implements a PyNccl pipe for sending and receiving
-    Optional[torch.Tensor] between distributed ranks with advanced
-    communication features.
-
-    Key Features:
-    - Supports sending and receiving tensors with metadata
-    - Handles both CUDA and CPU device communications
-    - Implements a non-blocking tensor transfer mechanism
-    - Manages buffer size and provides backpressure control
-    - Supports distributed process groups with configurable parameters
+This module implements a PyNccl pipe for sending and receiving
+Optional[torch.Tensor] between distributed ranks with advanced
+communication features.
+
+Key Features:
+- Supports sending and receiving tensors with metadata
+- Handles both CUDA and CPU device communications
+- Implements a non-blocking tensor transfer mechanism
+- Manages buffer size and provides backpressure control
+- Supports distributed process groups with configurable parameters
 """
 
 import threading
@@ -30,7 +30,6 @@
 
 
 class BrokenPipeException(Exception):
-
     def __init__(self, message):
         self.message = message
         super().__init__(self.message)
@@ -40,16 +39,17 @@ def __init__(self, message):
 
 
 class PyNcclPipe(KVPipeBase):
-
     METADATA_LENGTH = 16
     MAX_TENSOR_DIMENSIONS = 14
     METADATA_DTYPE = torch.int64
 
-    def __init__(self,
-                 local_rank: int,
-                 config: KVTransferConfig,
-                 device: Optional[str] = None,
-                 port_offset: int = 0):
+    def __init__(
+        self,
+        local_rank: int,
+        config: KVTransferConfig,
+        device: Optional[str] = None,
+        port_offset: int = 0,
+    ):
         self.config = config
         self.local_rank = local_rank
         self.kv_rank = self.config.kv_rank
@@ -84,9 +84,9 @@ def __init__(self,
 
     def _get_device_send_recv_impl(
         self, group: StatelessProcessGroup
-    ) -> tuple[Callable[[torch.Tensor, int], None], Callable[
-        [torch.Tensor, int], None]]:
-
+    ) -> tuple[
+        Callable[[torch.Tensor, int], None], Callable[[torch.Tensor, int], None]
+    ]:
         send: Callable[[torch.Tensor, int], None]
         recv: Callable[[torch.Tensor, int], None]
         if self.device.type == "cuda":
@@ -144,9 +144,9 @@ def _prepare_recv_buffer(self, metadata: Metadata) -> torch.Tensor:
             buffer: A tensor of the specified type and shape,
                 allocated on `self.device`.
         """
-        return torch.empty(metadata["shape"],
-                           dtype=metadata["dtype"],
-                           device=self.device)
+        return torch.empty(
+            metadata["shape"], dtype=metadata["dtype"], device=self.device
+        )
 
     def _send_metadata(self, metadata: Metadata):
         """
@@ -179,8 +179,7 @@ def _send_impl(self, tensor: Optional[torch.Tensor]) -> None:
         metadata = self._make_metadata(tensor)
         self._send_metadata(metadata)
         if tensor is not None:
-            self.device_send_func(tensor.to(self.device),
-                                  self.target_rank_for_send)
+            self.device_send_func(tensor.to(self.device), self.target_rank_for_send)
 
     def _recv_impl(self) -> Optional[torch.Tensor]:
         """
@@ -198,8 +197,9 @@ def _recv_impl(self) -> Optional[torch.Tensor]:
 
         return buffer
 
-    def send_tensor_wrapper(self, tensor: Optional[torch.Tensor],
-                            tensor_size: int) -> None:
+    def send_tensor_wrapper(
+        self, tensor: Optional[torch.Tensor], tensor_size: int
+    ) -> None:
         """
         Wrapper for _send_impl to handle exceptions and update buffer size.
         """
@@ -209,9 +209,14 @@ def send_tensor_wrapper(self, tensor: Optional[torch.Tensor],
             with self.buffer_size_lock:
                 self.buffer_size -= tensor_size
         except Exception as e:
-            logger.error("[rank%d]: Exception when trying to send %s, msg: %s",
-                         torch.distributed.get_rank(), str(tensor), str(e))
+            logger.error(
+                "[rank%d]: Exception when trying to send %s, msg: %s",
+                torch.distributed.get_rank(),
+                str(tensor),
+                str(e),
+            )
             import traceback
+
             traceback.print_exc()
 
     def block_if_full(self):
@@ -244,8 +249,7 @@ def send_tensor(self, tensor: Optional[torch.Tensor]) -> None:
         with self.buffer_size_lock:
             self.buffer_size += tensor_size
 
-        self.transport_thread.submit(self.send_tensor_wrapper, tensor,
-                                     tensor_size)
+        self.transport_thread.submit(self.send_tensor_wrapper, tensor, tensor_size)
 
     def recv_tensor(self) -> Optional[torch.Tensor]:
         """
@@ -266,6 +270,7 @@ def recv_tensor(self) -> Optional[torch.Tensor]:
             logger.error("%s", e)
             logger.error("My device: %s", self.device)
             import traceback
+
             traceback.print_exc()
             raise e
 
@@ -275,6 +280,5 @@ def close(self):
         """
         Close the pipe and release associated resources.
         """
-        if hasattr(self,
-                   "transport_thread") and self.transport_thread is not None:
+        if hasattr(self, "transport_thread") and self.transport_thread is not None:
             self.transport_thread.shutdown()
diff --git a/vllm/distributed/kv_transfer/kv_transfer_state.py b/vllm/distributed/kv_transfer/kv_transfer_state.py
index d5747bed9277..f8f65f28ff6d 100644
--- a/vllm/distributed/kv_transfer/kv_transfer_state.py
+++ b/vllm/distributed/kv_transfer/kv_transfer_state.py
@@ -4,10 +4,11 @@
 
 from vllm import envs
 from vllm.distributed.kv_transfer.kv_connector.base import KVConnectorBaseType
-from vllm.distributed.kv_transfer.kv_connector.factory import (
-    KVConnectorFactory)
-from vllm.distributed.kv_transfer.kv_connector.v1 import (KVConnectorBase_V1,
-                                                          KVConnectorRole)
+from vllm.distributed.kv_transfer.kv_connector.factory import KVConnectorFactory
+from vllm.distributed.kv_transfer.kv_connector.v1 import (
+    KVConnectorBase_V1,
+    KVConnectorRole,
+)
 
 if TYPE_CHECKING:
     from vllm.config import VllmConfig
@@ -17,7 +18,8 @@
 
 def get_kv_transfer_group() -> KVConnectorBaseType:
     assert _KV_CONNECTOR_AGENT is not None, (
-        "disaggregated KV cache transfer parallel group is not initialized")
+        "disaggregated KV cache transfer parallel group is not initialized"
+    )
     return _KV_CONNECTOR_AGENT
 
 
@@ -25,8 +27,7 @@ def has_kv_transfer_group() -> bool:
     return _KV_CONNECTOR_AGENT is not None
 
 
-def is_v1_kv_transfer_group(
-        connector: Optional[KVConnectorBaseType] = None) -> bool:
+def is_v1_kv_transfer_group(connector: Optional[KVConnectorBaseType] = None) -> bool:
     """Check if the KV connector is the v1 connector.
     If the argument is None, it will check the global KV connector
 
@@ -57,11 +58,14 @@ def ensure_kv_transfer_initialized(vllm_config: "VllmConfig") -> None:
     if vllm_config.kv_transfer_config is None:
         return
 
-    if (vllm_config.kv_transfer_config.is_kv_transfer_instance
-            and _KV_CONNECTOR_AGENT is None):
+    if (
+        vllm_config.kv_transfer_config.is_kv_transfer_instance
+        and _KV_CONNECTOR_AGENT is None
+    ):
         if envs.VLLM_USE_V1:
             _KV_CONNECTOR_AGENT = KVConnectorFactory.create_connector(
-                config=vllm_config, role=KVConnectorRole.WORKER)
+                config=vllm_config, role=KVConnectorRole.WORKER
+            )
         else:
             raise ValueError("V0 is no longer supported")
 
diff --git a/vllm/distributed/parallel_state.py b/vllm/distributed/parallel_state.py
index 638170963e2b..305fb91964c7 100644
--- a/vllm/distributed/parallel_state.py
+++ b/vllm/distributed/parallel_state.py
@@ -22,6 +22,7 @@
  parallelism, you can skip the model parallel initialization and destruction
  steps.
 """
+
 import contextlib
 import gc
 import pickle
@@ -41,11 +42,16 @@
 
 import vllm.envs as envs
 from vllm.distributed.device_communicators.base_device_communicator import (
-    DeviceCommunicatorBase)
+    DeviceCommunicatorBase,
+)
 from vllm.distributed.utils import StatelessProcessGroup
 from vllm.logger import init_logger
-from vllm.utils import (direct_register_custom_op, get_distributed_init_method,
-                        resolve_obj_by_qualname, supports_custom_op)
+from vllm.utils import (
+    direct_register_custom_op,
+    get_distributed_init_method,
+    resolve_obj_by_qualname,
+    supports_custom_op,
+)
 
 
 @dataclass
@@ -57,7 +63,7 @@ class GraphCaptureContext:
 
 
 def _split_tensor_dict(
-    tensor_dict: dict[str, Union[torch.Tensor, Any]]
+    tensor_dict: dict[str, Union[torch.Tensor, Any]],
 ) -> tuple[list[tuple[str, Any]], list[torch.Tensor]]:
     """Split the tensor dictionary into two parts:
     1. A list of (key, value) pairs. If the value is a tensor, it is replaced
@@ -74,7 +80,8 @@ def _split_tensor_dict(
             # receiving side will set the device index.
             device = value.device.type
             metadata_list.append(
-                (key, TensorMetadata(device, value.dtype, value.size())))
+                (key, TensorMetadata(device, value.dtype, value.size()))
+            )
             tensor_list.append(value)
         else:
             metadata_list.append((key, value))
@@ -116,8 +123,9 @@ def all_reduce_fake(tensor: torch.Tensor, group_name: str) -> torch.Tensor:
     return torch.empty_like(tensor)
 
 
-def reduce_scatter(tensor: torch.Tensor, dim: int, world_size: int,
-                   group_name: str) -> torch.Tensor:
+def reduce_scatter(
+    tensor: torch.Tensor, dim: int, world_size: int, group_name: str
+) -> torch.Tensor:
     assert group_name in _groups, f"Group {group_name} is not found."
     group = _groups[group_name]()
     if group is None:
@@ -125,15 +133,17 @@ def reduce_scatter(tensor: torch.Tensor, dim: int, world_size: int,
     return group._reduce_scatter_out_place(tensor, dim)
 
 
-def reduce_scatter_fake(tensor: torch.Tensor, dim: int, world_size: int,
-                        group_name: str) -> torch.Tensor:
+def reduce_scatter_fake(
+    tensor: torch.Tensor, dim: int, world_size: int, group_name: str
+) -> torch.Tensor:
     new_shape = list(tensor.shape)
     new_shape[dim] = tensor.shape[dim] // world_size
     return torch.empty(new_shape, dtype=tensor.dtype, device=tensor.device)
 
 
-def all_gather(tensor: torch.Tensor, dim: int, world_size: int,
-               group_name: str) -> torch.Tensor:
+def all_gather(
+    tensor: torch.Tensor, dim: int, world_size: int, group_name: str
+) -> torch.Tensor:
     assert group_name in _groups, f"Group {group_name} is not found."
     group = _groups[group_name]()
     if group is None:
@@ -141,8 +151,9 @@ def all_gather(tensor: torch.Tensor, dim: int, world_size: int,
     return group._all_gather_out_place(tensor, dim)
 
 
-def all_gather_fake(tensor: torch.Tensor, dim: int, world_size: int,
-                    group_name: str) -> torch.Tensor:
+def all_gather_fake(
+    tensor: torch.Tensor, dim: int, world_size: int, group_name: str
+) -> torch.Tensor:
     new_shape = list(tensor.shape)
     new_shape[dim] = tensor.shape[dim] * world_size
     return torch.empty(new_shape, dtype=tensor.dtype, device=tensor.device)
@@ -218,7 +229,8 @@ def __init__(
 
         for ranks in group_ranks:
             device_group = torch.distributed.new_group(
-                ranks, backend=torch_distributed_backend)
+                ranks, backend=torch_distributed_backend
+            )
             # a group with `gloo` backend, to allow direct coordination between
             # processes through the CPU.
             cpu_group = torch.distributed.new_group(ranks, backend="gloo")
@@ -242,8 +254,7 @@ def __init__(
         elif current_platform.is_xpu():
             self.device = torch.device(f"xpu:{local_rank}")
         elif current_platform.is_out_of_tree():
-            self.device = torch.device(
-                f"{current_platform.device_name}:{local_rank}")
+            self.device = torch.device(f"{current_platform.device_name}:{local_rank}")
         else:
             self.device = torch.device("cpu")
 
@@ -251,7 +262,8 @@ def __init__(
         self.device_communicator = None
         if use_device_communicator and self.world_size > 1:
             device_comm_cls = resolve_obj_by_qualname(
-                current_platform.get_device_communicator_cls())
+                current_platform.get_device_communicator_cls()
+            )
             self.device_communicator = device_comm_cls(
                 cpu_group=self.cpu_group,
                 device=self.device,
@@ -259,19 +271,23 @@ def __init__(
                 unique_name=self.unique_name,
             )
 
-        from vllm.distributed.device_communicators.shm_broadcast import (
-            MessageQueue)
+        from vllm.distributed.device_communicators.shm_broadcast import MessageQueue
+
         self.mq_broadcaster: Optional[MessageQueue] = None
         if use_message_queue_broadcaster and self.world_size > 1:
             self.mq_broadcaster = MessageQueue.create_from_process_group(
-                self.cpu_group, 1 << 22, 6)
+                self.cpu_group, 1 << 22, 6
+            )
 
         from vllm.platforms import current_platform
-        self.use_custom_op_call = (current_platform.is_cuda_alike()
-                                   or current_platform.is_tpu())
 
-        self.use_cpu_custom_send_recv = (current_platform.is_cpu() and hasattr(
-            torch.ops._C, "init_shm_manager"))
+        self.use_custom_op_call = (
+            current_platform.is_cuda_alike() or current_platform.is_tpu()
+        )
+
+        self.use_cpu_custom_send_recv = current_platform.is_cpu() and hasattr(
+            torch.ops._C, "init_shm_manager"
+        )
 
     @property
     def first_rank(self):
@@ -309,7 +325,8 @@ def prev_rank(self):
 
     @contextmanager
     def graph_capture(
-            self, graph_capture_context: Optional[GraphCaptureContext] = None):
+        self, graph_capture_context: Optional[GraphCaptureContext] = None
+    ):
         if graph_capture_context is None:
             stream = torch.cuda.Stream()
             graph_capture_context = GraphCaptureContext(stream)
@@ -320,7 +337,9 @@ def graph_capture(
         # so we don't abstract it into the base class
         maybe_ca_context = nullcontext()
         from vllm.distributed.device_communicators.cuda_communicator import (
-            CudaCommunicator)
+            CudaCommunicator,
+        )
+
         if self.device_communicator is not None:
             assert isinstance(self.device_communicator, CudaCommunicator)
             ca_comm = self.device_communicator.ca_comm
@@ -356,8 +375,7 @@ def all_reduce(self, input_: torch.Tensor) -> torch.Tensor:
             return input_
 
         if self.use_custom_op_call:
-            return torch.ops.vllm.all_reduce(input_,
-                                             group_name=self.unique_name)
+            return torch.ops.vllm.all_reduce(input_, group_name=self.unique_name)
         else:
             return self._all_reduce_out_place(input_)
 
@@ -372,66 +390,62 @@ def all_gather(self, input_: torch.Tensor, dim: int = -1) -> torch.Tensor:
         if world_size == 1:
             return input_
         assert -input_.dim() <= dim < input_.dim(), (
-            f"Invalid dim ({dim}) for input tensor with shape {input_.size()}")
+            f"Invalid dim ({dim}) for input tensor with shape {input_.size()}"
+        )
 
         if self.use_custom_op_call:
-            return torch.ops.vllm.all_gather(input_,
-                                             dim,
-                                             world_size,
-                                             group_name=self.unique_name)
+            return torch.ops.vllm.all_gather(
+                input_, dim, world_size, group_name=self.unique_name
+            )
         else:
             return self._all_gather_out_place(input_, dim)
 
-    def _all_gather_out_place(self, input_: torch.Tensor,
-                              dim: int) -> torch.Tensor:
+    def _all_gather_out_place(self, input_: torch.Tensor, dim: int) -> torch.Tensor:
         if self.device_communicator is None:
             raise ValueError("No device communicator found")
         return self.device_communicator.all_gather(input_, dim)
 
-    def all_gatherv(self,
-                    input_: Union[torch.Tensor, list[torch.Tensor]],
-                    dim: int = 0,
-                    sizes: Optional[list[int]] = None):
+    def all_gatherv(
+        self,
+        input_: Union[torch.Tensor, list[torch.Tensor]],
+        dim: int = 0,
+        sizes: Optional[list[int]] = None,
+    ):
         if self.device_communicator is None:
             raise ValueError("No device communicator found")
         return self.device_communicator.all_gatherv(input_, dim, sizes)
 
-    def reduce_scatter(self,
-                       input_: torch.Tensor,
-                       dim: int = -1) -> torch.Tensor:
+    def reduce_scatter(self, input_: torch.Tensor, dim: int = -1) -> torch.Tensor:
         world_size = self.world_size
         # Bypass the function if we are using only 1 GPU.
         if world_size == 1:
             return input_
         assert -input_.dim() <= dim < input_.dim(), (
-            f"Invalid dim ({dim}) for input tensor with shape {input_.size()}")
+            f"Invalid dim ({dim}) for input tensor with shape {input_.size()}"
+        )
 
         if self.use_custom_op_call:
-            return torch.ops.vllm.reduce_scatter(input_,
-                                                 dim,
-                                                 world_size,
-                                                 group_name=self.unique_name)
+            return torch.ops.vllm.reduce_scatter(
+                input_, dim, world_size, group_name=self.unique_name
+            )
         else:
             return self._reduce_scatter_out_place(input_, dim)
 
-    def reduce_scatterv(self,
-                        input_: torch.Tensor,
-                        dim: int = -1,
-                        sizes: Optional[list[int]] = None) -> torch.Tensor:
+    def reduce_scatterv(
+        self, input_: torch.Tensor, dim: int = -1, sizes: Optional[list[int]] = None
+    ) -> torch.Tensor:
         if self.device_communicator is None:
             raise ValueError("No device communicator found")
         return self.device_communicator.reduce_scatterv(input_, dim, sizes)
 
-    def _reduce_scatter_out_place(self, input_: torch.Tensor,
-                                  dim: int) -> torch.Tensor:
+    def _reduce_scatter_out_place(self, input_: torch.Tensor, dim: int) -> torch.Tensor:
         if self.device_communicator is None:
             raise ValueError("No device communicator found")
         return self.device_communicator.reduce_scatter(input_, dim)
 
-    def gather(self,
-               input_: torch.Tensor,
-               dst: int = 0,
-               dim: int = -1) -> Optional[torch.Tensor]:
+    def gather(
+        self, input_: torch.Tensor, dst: int = 0, dim: int = -1
+    ) -> Optional[torch.Tensor]:
         """
         NOTE: We assume that the input tensor is on the same device across
         all the ranks.
@@ -455,9 +469,9 @@ def broadcast(self, input_: torch.Tensor, src: int = 0):
         if self.world_size == 1:
             return input_
         # Broadcast.
-        torch.distributed.broadcast(input_,
-                                    src=self.ranks[src],
-                                    group=self.device_group)
+        torch.distributed.broadcast(
+            input_, src=self.ranks[src], group=self.device_group
+        )
         return input_
 
     def broadcast_object(self, obj: Optional[Any] = None, src: int = 0):
@@ -473,21 +487,20 @@ def broadcast_object(self, obj: Optional[Any] = None, src: int = 0):
             assert src == 0, "Message queue broadcaster only supports src=0"
             return self.mq_broadcaster.broadcast_object(obj)
         if self.rank_in_group == src:
-            torch.distributed.broadcast_object_list([obj],
-                                                    src=self.ranks[src],
-                                                    group=self.cpu_group)
+            torch.distributed.broadcast_object_list(
+                [obj], src=self.ranks[src], group=self.cpu_group
+            )
             return obj
         else:
             recv = [None]
-            torch.distributed.broadcast_object_list(recv,
-                                                    src=self.ranks[src],
-                                                    group=self.cpu_group)
+            torch.distributed.broadcast_object_list(
+                recv, src=self.ranks[src], group=self.cpu_group
+            )
             return recv[0]
 
-    def broadcast_object_list(self,
-                              obj_list: list[Any],
-                              src: int = 0,
-                              group: Optional[ProcessGroup] = None):
+    def broadcast_object_list(
+        self, obj_list: list[Any], src: int = 0, group: Optional[ProcessGroup] = None
+    ):
         """Broadcast the input object list.
         NOTE: `src` is the local rank of the source rank.
         """
@@ -497,9 +510,9 @@ def broadcast_object_list(self,
         if self.world_size == 1:
             return obj_list
         # Broadcast.
-        torch.distributed.broadcast_object_list(obj_list,
-                                                src=self.ranks[src],
-                                                group=self.device_group)
+        torch.distributed.broadcast_object_list(
+            obj_list, src=self.ranks[src], group=self.device_group
+        )
         return obj_list
 
     def send_object(self, obj: Any, dst: int) -> None:
@@ -510,25 +523,22 @@ def send_object(self, obj: Any, dst: int) -> None:
 
         assert dst != self.rank_in_group, (
             "Invalid destination rank. Destination rank is the same "
-            "as the current rank.")
+            "as the current rank."
+        )
 
         # Serialize object to tensor and get the size as well
         object_tensor = torch.frombuffer(pickle.dumps(obj), dtype=torch.uint8)
 
-        size_tensor = torch.tensor([object_tensor.numel()],
-                                   dtype=torch.long,
-                                   device="cpu")
+        size_tensor = torch.tensor(
+            [object_tensor.numel()], dtype=torch.long, device="cpu"
+        )
 
         # Send object size
 
-        torch.distributed.send(size_tensor,
-                               dst=self.ranks[dst],
-                               group=self.cpu_group)
+        torch.distributed.send(size_tensor, dst=self.ranks[dst], group=self.cpu_group)
 
         # Send object
-        torch.distributed.send(object_tensor,
-                               dst=self.ranks[dst],
-                               group=self.cpu_group)
+        torch.distributed.send(object_tensor, dst=self.ranks[dst], group=self.cpu_group)
 
         return None
 
@@ -545,22 +555,24 @@ def recv_object(self, src: int) -> Any:
         size_tensor = torch.empty(1, dtype=torch.long, device="cpu")
 
         # Receive object size
-        rank_size = torch.distributed.recv(size_tensor,
-                                           src=self.ranks[src],
-                                           group=self.cpu_group)
+        rank_size = torch.distributed.recv(
+            size_tensor, src=self.ranks[src], group=self.cpu_group
+        )
 
         # Tensor to receive serialized objects into.
         object_tensor = torch.empty(  # type: ignore[call-overload]
             size_tensor.item(),  # type: ignore[arg-type]
             dtype=torch.uint8,
-            device="cpu")
+            device="cpu",
+        )
 
-        rank_object = torch.distributed.recv(object_tensor,
-                                             src=self.ranks[src],
-                                             group=self.cpu_group)
+        rank_object = torch.distributed.recv(
+            object_tensor, src=self.ranks[src], group=self.cpu_group
+        )
 
         assert rank_object == rank_size, (
-            "Received object sender rank does not match the size sender rank.")
+            "Received object sender rank does not match the size sender rank."
+        )
 
         obj = pickle.loads(object_tensor.numpy().tobytes())
 
@@ -571,13 +583,13 @@ def broadcast_tensor_dict(
         tensor_dict: Optional[dict[str, Union[torch.Tensor, Any]]] = None,
         src: int = 0,
         group: Optional[ProcessGroup] = None,
-        metadata_group: Optional[ProcessGroup] = None
+        metadata_group: Optional[ProcessGroup] = None,
     ) -> Optional[dict[str, Union[torch.Tensor, Any]]]:
         """Broadcast the input tensor dictionary.
         NOTE: `src` is the local rank of the source rank.
         """
         # Bypass the function if we are using only 1 GPU.
-        if (not torch.distributed.is_initialized() or self.world_size == 1):
+        if not torch.distributed.is_initialized() or self.world_size == 1:
             return tensor_dict
 
         group = self.device_group
@@ -587,9 +599,9 @@ def broadcast_tensor_dict(
         rank_in_group = self.rank_in_group
         if rank_in_group == src:
             metadata_list: list[tuple[Any, Any]] = []
-            assert isinstance(
-                tensor_dict,
-                dict), (f"Expecting a dictionary, got {type(tensor_dict)}")
+            assert isinstance(tensor_dict, dict), (
+                f"Expecting a dictionary, got {type(tensor_dict)}"
+            )
             metadata_list, tensor_list = _split_tensor_dict(tensor_dict)
             # `metadata_list` lives in CPU memory.
             # `broadcast_object_list` has serialization & deserialization,
@@ -602,16 +614,14 @@ def broadcast_tensor_dict(
                     continue
                 if tensor.is_cpu:
                     # use metadata_group for CPU tensors
-                    handle = torch.distributed.broadcast(tensor,
-                                                         src=self.ranks[src],
-                                                         group=metadata_group,
-                                                         async_op=True)
+                    handle = torch.distributed.broadcast(
+                        tensor, src=self.ranks[src], group=metadata_group, async_op=True
+                    )
                 else:
                     # use group for GPU tensors
-                    handle = torch.distributed.broadcast(tensor,
-                                                         src=self.ranks[src],
-                                                         group=group,
-                                                         async_op=True)
+                    handle = torch.distributed.broadcast(
+                        tensor, src=self.ranks[src], group=group, async_op=True
+                    )
                 async_handles.append(handle)
             for async_handle in async_handles:
                 async_handle.wait()
@@ -622,9 +632,9 @@ def broadcast_tensor_dict(
             async_handles = []
             for key, value in metadata_list:
                 if isinstance(value, TensorMetadata):
-                    tensor = torch.empty(value.size,
-                                         dtype=value.dtype,
-                                         device=value.device)
+                    tensor = torch.empty(
+                        value.size, dtype=value.dtype, device=value.device
+                    )
                     if tensor.numel() == 0:
                         # Skip broadcasting empty tensors.
                         tensor_dict[key] = tensor
@@ -635,14 +645,13 @@ def broadcast_tensor_dict(
                             tensor,
                             src=self.ranks[src],
                             group=metadata_group,
-                            async_op=True)
+                            async_op=True,
+                        )
                     else:
                         # use group for GPU tensors
                         handle = torch.distributed.broadcast(
-                            tensor,
-                            src=self.ranks[src],
-                            group=group,
-                            async_op=True)
+                            tensor, src=self.ranks[src], group=group, async_op=True
+                        )
                     async_handles.append(handle)
                     tensor_dict[key] = tensor
                 else:
@@ -679,10 +688,10 @@ def send_tensor_dict(
         # Bypass the function if we are using only 1 GPU.
         if not torch.distributed.is_initialized() or self.world_size == 1:
             return tensor_dict
-        all_gather_size = (1 if all_gather_group is None else
-                           all_gather_group.world_size)
-        all_gather_rank = (0 if all_gather_group is None else
-                           all_gather_group.rank_in_group)
+        all_gather_size = 1 if all_gather_group is None else all_gather_group.world_size
+        all_gather_rank = (
+            0 if all_gather_group is None else all_gather_group.rank_in_group
+        )
 
         group = self.device_group
         metadata_group = self.cpu_group
@@ -695,22 +704,21 @@ def send_tensor_dict(
             if self.device_communicator is None:
                 raise ValueError("No device communicator found")
             self.device_communicator.send_tensor_dict(  # type: ignore
-                tensor_dict, dst)
+                tensor_dict, dst
+            )
             return None
 
         metadata_list: list[tuple[Any, Any]] = []
-        assert isinstance(
-            tensor_dict,
-            dict), f"Expecting a dictionary, got {type(tensor_dict)}"
+        assert isinstance(tensor_dict, dict), (
+            f"Expecting a dictionary, got {type(tensor_dict)}"
+        )
         metadata_list, tensor_list = _split_tensor_dict(tensor_dict)
         # `metadata_list` lives in CPU memory.
         # `send_object_list` has serialization & deserialization,
         # all happening on CPU. Therefore, we can use the CPU group.
         self.send_object(metadata_list, dst=dst)
 
-        tensor_keys = [
-            k for k, v in tensor_dict.items() if isinstance(v, torch.Tensor)
-        ]
+        tensor_keys = [k for k, v in tensor_dict.items() if isinstance(v, torch.Tensor)]
         assert len(tensor_keys) == len(tensor_list)
 
         for key, tensor in zip(tensor_keys, tensor_list):
@@ -719,23 +727,25 @@ def send_tensor_dict(
                 continue
 
             # send-allgather: send only a slice, then do allgather.
-            use_all_gather = (all_gather_group is not None
-                              and tensor.numel() % all_gather_size == 0)
-            use_all_gather = all_gather_tensors.get(key, use_all_gather) \
-                if all_gather_tensors else use_all_gather
+            use_all_gather = (
+                all_gather_group is not None and tensor.numel() % all_gather_size == 0
+            )
+            use_all_gather = (
+                all_gather_tensors.get(key, use_all_gather)
+                if all_gather_tensors
+                else use_all_gather
+            )
             if use_all_gather:
                 tensor = tensor.reshape(all_gather_size, -1)[all_gather_rank]
 
             if tensor.is_cpu:
                 # use metadata_group for CPU tensors
-                torch.distributed.send(tensor,
-                                       dst=self.ranks[dst],
-                                       group=metadata_group)
+                torch.distributed.send(
+                    tensor, dst=self.ranks[dst], group=metadata_group
+                )
             else:
                 # use group for GPU tensors
-                torch.distributed.send(tensor,
-                                       dst=self.ranks[dst],
-                                       group=group)
+                torch.distributed.send(tensor, dst=self.ranks[dst], group=group)
         return None
 
     def recv_tensor_dict(
@@ -765,10 +775,10 @@ def recv_tensor_dict(
         # Bypass the function if we are using only 1 GPU.
         if not torch.distributed.is_initialized() or self.world_size == 1:
             return None
-        all_gather_size = (1 if all_gather_group is None else
-                           all_gather_group.world_size)
-        all_gather_rank = (0 if all_gather_group is None else
-                           all_gather_group.rank_in_group)
+        all_gather_size = 1 if all_gather_group is None else all_gather_group.world_size
+        all_gather_rank = (
+            0 if all_gather_group is None else all_gather_group.rank_in_group
+        )
 
         group = self.device_group
         metadata_group = self.cpu_group
@@ -781,45 +791,47 @@ def recv_tensor_dict(
             if self.device_communicator is None:
                 raise ValueError("No device communicator found")
             return self.device_communicator.recv_tensor_dict(  # type: ignore
-                src)
+                src
+            )
 
         recv_metadata_list = self.recv_object(src=src)
         tensor_dict: dict[str, Any] = {}
         for key, value in recv_metadata_list:
             if isinstance(value, TensorMetadata):
-                tensor = torch.empty(value.size,
-                                     dtype=value.dtype,
-                                     device=value.device)
+                tensor = torch.empty(value.size, dtype=value.dtype, device=value.device)
                 if tensor.numel() == 0:
                     # Skip broadcasting empty tensors.
                     tensor_dict[key] = tensor
                     continue
 
                 # send-allgather: send only a slice, then do allgather.
-                use_all_gather = (all_gather_group is not None
-                                  and tensor.numel() % all_gather_size == 0)
-                use_all_gather = all_gather_tensors.get(key, use_all_gather) \
-                    if all_gather_tensors else use_all_gather
+                use_all_gather = (
+                    all_gather_group is not None
+                    and tensor.numel() % all_gather_size == 0
+                )
+                use_all_gather = (
+                    all_gather_tensors.get(key, use_all_gather)
+                    if all_gather_tensors
+                    else use_all_gather
+                )
 
                 if use_all_gather:
                     orig_shape = tensor.shape
-                    tensor = tensor.reshape(all_gather_size,
-                                            -1)[all_gather_rank]
+                    tensor = tensor.reshape(all_gather_size, -1)[all_gather_rank]
 
                 if tensor.is_cpu:
                     # use metadata_group for CPU tensors
-                    torch.distributed.recv(tensor,
-                                           src=self.ranks[src],
-                                           group=metadata_group)
+                    torch.distributed.recv(
+                        tensor, src=self.ranks[src], group=metadata_group
+                    )
                 else:
                     # use group for GPU tensors
-                    torch.distributed.recv(tensor,
-                                           src=self.ranks[src],
-                                           group=group)
+                    torch.distributed.recv(tensor, src=self.ranks[src], group=group)
                 if use_all_gather:
                     # do the allgather
                     tensor = all_gather_group.all_gather(  # type: ignore
-                        tensor, dim=0)
+                        tensor, dim=0
+                    )
                     tensor = tensor.reshape(orig_shape)
 
                 tensor_dict[key] = tensor
@@ -843,10 +855,9 @@ def send(self, tensor: torch.Tensor, dst: Optional[int] = None) -> None:
             raise ValueError("No device communicator found")
         self.device_communicator.send(tensor, dst)
 
-    def recv(self,
-             size: torch.Size,
-             dtype: torch.dtype,
-             src: Optional[int] = None) -> torch.Tensor:
+    def recv(
+        self, size: torch.Size, dtype: torch.dtype, src: Optional[int] = None
+    ) -> torch.Tensor:
         """Receives a tensor from the source rank."""
         """NOTE: `src` is the local rank of the source rank."""
         if self.device_communicator is None:
@@ -867,28 +878,26 @@ def destroy(self):
 
     def prepare_communication_buffer_for_model(self, model: torch.nn.Module):
         if self.device_communicator is not None:
-            self.device_communicator.prepare_communication_buffer_for_model(
-                model)
+            self.device_communicator.prepare_communication_buffer_for_model(model)
 
     def dispatch(
         self,
         hidden_states: torch.Tensor,
         router_logits: torch.Tensor,
-        is_sequence_parallel: bool = False
+        is_sequence_parallel: bool = False,
     ) -> tuple[torch.Tensor, torch.Tensor]:
         if self.device_communicator is not None:
-            return self.device_communicator.dispatch(hidden_states,
-                                                     router_logits,
-                                                     is_sequence_parallel)
+            return self.device_communicator.dispatch(
+                hidden_states, router_logits, is_sequence_parallel
+            )
         else:
             return hidden_states, router_logits
 
-    def combine(self,
-                hidden_states,
-                is_sequence_parallel: bool = False) -> torch.Tensor:
+    def combine(
+        self, hidden_states, is_sequence_parallel: bool = False
+    ) -> torch.Tensor:
         if self.device_communicator is not None:
-            return self.device_communicator.combine(hidden_states,
-                                                    is_sequence_parallel)
+            return self.device_communicator.combine(hidden_states, is_sequence_parallel)
         else:
             return hidden_states
 
@@ -898,12 +907,13 @@ def combine(self,
 
 
 def get_world_group() -> GroupCoordinator:
-    assert _WORLD is not None, ("world group is not initialized")
+    assert _WORLD is not None, "world group is not initialized"
     return _WORLD
 
 
-def init_world_group(ranks: list[int], local_rank: int,
-                     backend: str) -> GroupCoordinator:
+def init_world_group(
+    ranks: list[int], local_rank: int, backend: str
+) -> GroupCoordinator:
     return GroupCoordinator(
         group_ranks=[ranks],
         local_rank=local_rank,
@@ -920,7 +930,6 @@ def init_model_parallel_group(
     use_message_queue_broadcaster: bool = False,
     group_name: Optional[str] = None,
 ) -> GroupCoordinator:
-
     return GroupCoordinator(
         group_ranks=group_ranks,
         local_rank=local_rank,
@@ -935,13 +944,15 @@ def init_model_parallel_group(
 
 
 def get_tp_group() -> GroupCoordinator:
-    assert _TP is not None, ("tensor model parallel group is not initialized")
+    assert _TP is not None, "tensor model parallel group is not initialized"
     return _TP
 
 
-@deprecated("`get_tensor_model_parallel_group` has been replaced with "
-            "`get_tp_group` and may be removed after v0.12. Please use "
-            "`get_tp_group` instead.")
+@deprecated(
+    "`get_tensor_model_parallel_group` has been replaced with "
+    "`get_tp_group` and may be removed after v0.12. Please use "
+    "`get_tp_group` instead."
+)
 def get_tensor_model_parallel_group():
     return get_tp_group()
 
@@ -950,8 +961,7 @@ def get_tensor_model_parallel_group():
 
 
 def get_dcp_group() -> GroupCoordinator:
-    assert _DCP is not None, (
-        "decode context model parallel group is not initialized")
+    assert _DCP is not None, "decode context model parallel group is not initialized"
     return _DCP
 
 
@@ -964,7 +974,7 @@ def get_dcp_group() -> GroupCoordinator:
 
 
 def get_dp_group() -> GroupCoordinator:
-    assert _DP is not None, ("data parallel group is not initialized")
+    assert _DP is not None, "data parallel group is not initialized"
     return _DP
 
 
@@ -972,19 +982,20 @@ def get_dp_group() -> GroupCoordinator:
 
 
 def get_ep_group() -> GroupCoordinator:
-    assert _EP is not None, ("expert parallel group is not initialized")
+    assert _EP is not None, "expert parallel group is not initialized"
     return _EP
 
 
 def get_pp_group() -> GroupCoordinator:
-    assert _PP is not None, (
-        "pipeline model parallel group is not initialized")
+    assert _PP is not None, "pipeline model parallel group is not initialized"
     return _PP
 
 
-@deprecated("`get_pipeline_model_parallel_group` has been replaced with "
-            "`get_pp_group` and may be removed in v0.12. Please use "
-            "`get_pp_group` instead.")
+@deprecated(
+    "`get_pipeline_model_parallel_group` has been replaced with "
+    "`get_pp_group` and may be removed in v0.12. Please use "
+    "`get_pp_group` instead."
+)
 def get_pipeline_model_parallel_group():
     return get_pp_group()
 
@@ -1005,8 +1016,7 @@ def graph_capture(device: torch.device):
     from other kernels possibly launched on background in the default stream.
     """
     context = GraphCaptureContext(torch.cuda.Stream(device=device))
-    with get_tp_group().graph_capture(context), get_pp_group().graph_capture(
-            context):
+    with get_tp_group().graph_capture(context), get_pp_group().graph_capture(context):
         yield context
 
 
@@ -1020,21 +1030,30 @@ def set_custom_all_reduce(enable: bool):
     _ENABLE_CUSTOM_ALL_REDUCE = enable
 
 
-def init_distributed_environment(world_size: int = -1,
-                                 rank: int = -1,
-                                 distributed_init_method: str = "env://",
-                                 local_rank: int = -1,
-                                 backend: str = "nccl",
-                                 timeout: Optional[timedelta] = None):
+def init_distributed_environment(
+    world_size: int = -1,
+    rank: int = -1,
+    distributed_init_method: str = "env://",
+    local_rank: int = -1,
+    backend: str = "nccl",
+    timeout: Optional[timedelta] = None,
+):
     logger.debug(
-        "world_size=%d rank=%d local_rank=%d "
-        "distributed_init_method=%s backend=%s", world_size, rank, local_rank,
-        distributed_init_method, backend)
+        "world_size=%d rank=%d local_rank=%d distributed_init_method=%s backend=%s",
+        world_size,
+        rank,
+        local_rank,
+        distributed_init_method,
+        backend,
+    )
     from vllm.config import get_current_vllm_config
+
     config = get_current_vllm_config()
-    if config is not None and config.parallel_config.data_parallel_size > 1 \
-        and config.parallel_config.distributed_executor_backend \
-        != "external_launcher":
+    if (
+        config is not None
+        and config.parallel_config.data_parallel_size > 1
+        and config.parallel_config.distributed_executor_backend != "external_launcher"
+    ):
         parallel_config = config.parallel_config
         # adjust to take into account data parallelism
         # offset the rank by the data parallel rank
@@ -1046,17 +1065,23 @@ def init_distributed_environment(world_size: int = -1,
         distributed_init_method = get_distributed_init_method(ip, port)
         logger.info(
             "Adjusting world_size=%d rank=%d distributed_init_method=%s for DP",
-            world_size, rank, distributed_init_method)
+            world_size,
+            rank,
+            distributed_init_method,
+        )
     if not torch.distributed.is_initialized():
         assert distributed_init_method is not None, (
             "distributed_init_method must be provided when initializing "
-            "distributed environment")
+            "distributed environment"
+        )
         if not torch.distributed.is_backend_available(backend):
             logger.warning(
-                "Distributed backend %s is not available; "
-                "falling back to gloo.", backend)
+                "Distributed backend %s is not available; falling back to gloo.",
+                backend,
+            )
             assert torch.distributed.is_gloo_available(), (
-                "Fallback Gloo backend is not available.")
+                "Fallback Gloo backend is not available."
+            )
             backend = "gloo"
         # this backend is used for WORLD
         torch.distributed.init_process_group(
@@ -1064,7 +1089,8 @@ def init_distributed_environment(world_size: int = -1,
             init_method=distributed_init_method,
             world_size=world_size,
             rank=rank,
-            timeout=timeout)
+            timeout=timeout,
+        )
     # set the local rank
     # local_rank is not available in torch ProcessGroup,
     # see https://github.com/pytorch/pytorch/issues/122816
@@ -1080,11 +1106,11 @@ def init_distributed_environment(world_size: int = -1,
         ranks = list(range(torch.distributed.get_world_size()))
         _WORLD = init_world_group(ranks, local_rank, backend)
         _NODE_COUNT = _node_count(_WORLD.cpu_group)
-        logger.debug("Detected %d nodes in the distributed environment",
-                     _NODE_COUNT)
+        logger.debug("Detected %d nodes in the distributed environment", _NODE_COUNT)
     else:
         assert _WORLD.world_size == torch.distributed.get_world_size(), (
-            "world group already initialized with a different world size")
+            "world group already initialized with a different world size"
+        )
 
 
 def initialize_model_parallel(
@@ -1120,11 +1146,11 @@ def initialize_model_parallel(
     assert torch.distributed.is_initialized()
     world_size: int = torch.distributed.get_world_size()
     rank = torch.distributed.get_rank()
-    backend = backend or torch.distributed.get_backend(
-        get_world_group().device_group)
+    backend = backend or torch.distributed.get_backend(get_world_group().device_group)
 
     data_parallel_size = 1
     from vllm.config import get_current_vllm_config
+
     config = get_current_vllm_config()
     if config is not None:
         data_parallel_size = config.parallel_config.data_parallel_size
@@ -1139,77 +1165,82 @@ def initialize_model_parallel(
     # to get group_ranks for each dimension, transpose that dimension to the
     # last dimension, then reshape to 2D, then unbind the last dimension
     all_ranks = torch.arange(world_size).reshape(
-        -1, data_parallel_size, pipeline_model_parallel_size,
-        tensor_model_parallel_size)  # noqa
+        -1, data_parallel_size, pipeline_model_parallel_size, tensor_model_parallel_size
+    )  # noqa
 
     # Build the tensor model-parallel groups.
     global _TP
-    assert _TP is None, ("tensor model parallel group is already initialized")
+    assert _TP is None, "tensor model parallel group is already initialized"
     group_ranks = all_ranks.view(-1, tensor_model_parallel_size).unbind(0)
     group_ranks = [x.tolist() for x in group_ranks]
 
     # message queue broadcaster is only used in tensor model parallel group
-    _TP = init_model_parallel_group(group_ranks,
-                                    get_world_group().local_rank,
-                                    backend,
-                                    use_message_queue_broadcaster=True,
-                                    group_name="tp")
+    _TP = init_model_parallel_group(
+        group_ranks,
+        get_world_group().local_rank,
+        backend,
+        use_message_queue_broadcaster=True,
+        group_name="tp",
+    )
 
     # Build the DCP model-parallel groups.
     global _DCP
-    assert _DCP is None, (
-        "decode context model parallel group is already initialized")
+    assert _DCP is None, "decode context model parallel group is already initialized"
     # Note(hc): In the current implementation of decode context parallel,
     # dcp_size must not exceed tp_size, because the world size does not
     # change by DCP, it simply reuses the GPUs of TP group, and split one
     # TP group into tp_size//dcp_size DCP groups.
-    group_ranks = all_ranks.reshape(
-        -1, decode_context_model_parallel_size).unbind(0)
+    group_ranks = all_ranks.reshape(-1, decode_context_model_parallel_size).unbind(0)
     group_ranks = [x.tolist() for x in group_ranks]
-    _DCP = init_model_parallel_group(group_ranks,
-                                     get_world_group().local_rank,
-                                     backend,
-                                     use_message_queue_broadcaster=True,
-                                     group_name="dcp")
+    _DCP = init_model_parallel_group(
+        group_ranks,
+        get_world_group().local_rank,
+        backend,
+        use_message_queue_broadcaster=True,
+        group_name="dcp",
+    )
 
     # Build the pipeline model-parallel groups.
     global _PP
-    assert _PP is None, (
-        "pipeline model parallel group is already initialized")
-    group_ranks = all_ranks.transpose(2, 3).reshape(
-        -1, pipeline_model_parallel_size).unbind(0)
+    assert _PP is None, "pipeline model parallel group is already initialized"
+    group_ranks = (
+        all_ranks.transpose(2, 3).reshape(-1, pipeline_model_parallel_size).unbind(0)
+    )
     group_ranks = [x.tolist() for x in group_ranks]
-    _PP = init_model_parallel_group(group_ranks,
-                                    get_world_group().local_rank,
-                                    backend,
-                                    group_name="pp")
+    _PP = init_model_parallel_group(
+        group_ranks, get_world_group().local_rank, backend, group_name="pp"
+    )
 
     global _DP
-    assert _DP is None, ("data parallel group is already initialized")
-    group_ranks = all_ranks.transpose(1,
-                                      3).reshape(-1,
-                                                 data_parallel_size).unbind(0)
+    assert _DP is None, "data parallel group is already initialized"
+    group_ranks = all_ranks.transpose(1, 3).reshape(-1, data_parallel_size).unbind(0)
     group_ranks = [x.tolist() for x in group_ranks]
-    _DP = init_model_parallel_group(group_ranks,
-                                    get_world_group().local_rank,
-                                    backend,
-                                    group_name="dp")
+    _DP = init_model_parallel_group(
+        group_ranks, get_world_group().local_rank, backend, group_name="dp"
+    )
 
     global _EP
-    assert _EP is None, ("expert parallel group is already initialized")
-    group_ranks = all_ranks.transpose(1, 2).reshape(
-        -1, data_parallel_size * tensor_model_parallel_size).unbind(0)
+    assert _EP is None, "expert parallel group is already initialized"
+    group_ranks = (
+        all_ranks.transpose(1, 2)
+        .reshape(-1, data_parallel_size * tensor_model_parallel_size)
+        .unbind(0)
+    )
     group_ranks = [x.tolist() for x in group_ranks]
-    _EP = init_model_parallel_group(group_ranks,
-                                    get_world_group().local_rank,
-                                    backend,
-                                    group_name="ep")
+    _EP = init_model_parallel_group(
+        group_ranks, get_world_group().local_rank, backend, group_name="ep"
+    )
 
     logger.info(
         "rank %s in world size %s is assigned as "
-        "DP rank %s, PP rank %s, TP rank %s, EP rank %s", rank, world_size,
-        _DP.rank_in_group, _PP.rank_in_group, _TP.rank_in_group,
-        _EP.rank_in_group)
+        "DP rank %s, PP rank %s, TP rank %s, EP rank %s",
+        rank,
+        world_size,
+        _DP.rank_in_group,
+        _PP.rank_in_group,
+        _TP.rank_in_group,
+        _EP.rank_in_group,
+    )
 
 
 def ensure_model_parallel_initialized(
@@ -1222,24 +1253,27 @@ def ensure_model_parallel_initialized(
     or ensure tensor-parallel and pipeline-parallel sizes are equal to expected
     values if the model parallel groups are initialized.
     """
-    backend = backend or torch.distributed.get_backend(
-        get_world_group().device_group)
+    backend = backend or torch.distributed.get_backend(get_world_group().device_group)
     if not model_parallel_is_initialized():
-        initialize_model_parallel(tensor_model_parallel_size,
-                                  pipeline_model_parallel_size,
-                                  decode_context_model_parallel_size, backend)
+        initialize_model_parallel(
+            tensor_model_parallel_size,
+            pipeline_model_parallel_size,
+            decode_context_model_parallel_size,
+            backend,
+        )
         return
 
-    assert (
-        get_tensor_model_parallel_world_size() == tensor_model_parallel_size
-    ), ("tensor parallel group already initialized, but of unexpected size. "
+    assert get_tensor_model_parallel_world_size() == tensor_model_parallel_size, (
+        "tensor parallel group already initialized, but of unexpected size. "
         f"got: {get_tensor_model_parallel_world_size()=} vs. "
-        f"wanted: {tensor_model_parallel_size=}")
+        f"wanted: {tensor_model_parallel_size=}"
+    )
     pp_world_size = get_pp_group().world_size
-    assert (pp_world_size == pipeline_model_parallel_size), (
+    assert pp_world_size == pipeline_model_parallel_size, (
         "pipeline parallel group already initialized, but of unexpected size. "
         f"got: {pp_world_size=} vs. "
-        f"wanted: {pipeline_model_parallel_size=}")
+        f"wanted: {pipeline_model_parallel_size=}"
+    )
 
 
 def prepare_communication_buffer_for_model(model: torch.nn.Module):
@@ -1261,7 +1295,7 @@ def prepare_communication_buffer_for_model(model: torch.nn.Module):
 
 def model_parallel_is_initialized():
     """Check if tensor and pipeline parallel groups are initialized."""
-    return (_TP is not None and _PP is not None)
+    return _TP is not None and _PP is not None
 
 
 _TP_STATE_PATCHED = False
@@ -1313,9 +1347,8 @@ def get_decode_context_model_parallel_rank():
 
 
 def get_node_count() -> int:
-    """Return the total number of nodes in the distributed environment. """
-    assert _NODE_COUNT is not None, (
-        "distributed environment is not initialized")
+    """Return the total number of nodes in the distributed environment."""
+    assert _NODE_COUNT is not None, "distributed environment is not initialized"
     return _NODE_COUNT
 
 
@@ -1363,9 +1396,11 @@ def cleanup_dist_env_and_memory(shutdown_ray: bool = False):
     destroy_distributed_environment()
     if shutdown_ray:
         import ray  # Lazy import Ray
+
         ray.shutdown()
     gc.collect()
     from vllm.platforms import current_platform
+
     empty_cache = current_platform.empty_cache
     if empty_cache is not None:
         empty_cache()
@@ -1373,21 +1408,21 @@ def cleanup_dist_env_and_memory(shutdown_ray: bool = False):
         if not current_platform.is_cpu():
             torch._C._host_emptyCache()
     except AttributeError:
-        logger.warning(
-            "torch._C._host_emptyCache() only available in Pytorch >=2.5")
+        logger.warning("torch._C._host_emptyCache() only available in Pytorch >=2.5")
 
 
-def in_the_same_node_as(pg: Union[ProcessGroup, StatelessProcessGroup],
-                        source_rank: int = 0) -> list[bool]:
+def in_the_same_node_as(
+    pg: Union[ProcessGroup, StatelessProcessGroup], source_rank: int = 0
+) -> list[bool]:
     """
     This is a collective operation that returns if each rank is in the same node
     as the source rank. It tests if processes are attached to the same
     memory system (shared access to shared memory).
     """
     if isinstance(pg, ProcessGroup):
-        assert torch.distributed.get_backend(
-            pg) != torch.distributed.Backend.NCCL, (
-                "in_the_same_node_as should be tested with a non-NCCL group.")
+        assert torch.distributed.get_backend(pg) != torch.distributed.Backend.NCCL, (
+            "in_the_same_node_as should be tested with a non-NCCL group."
+        )
         # local rank inside the group
         rank = torch.distributed.get_rank(group=pg)
         world_size = torch.distributed.get_world_size(group=pg)
@@ -1410,10 +1445,11 @@ def in_the_same_node_as(pg: Union[ProcessGroup, StatelessProcessGroup],
             if rank == source_rank:
                 # create a shared memory segment
                 shm = shared_memory.SharedMemory(create=True, size=128)
-                shm.buf[:len(magic_message)] = magic_message
+                shm.buf[: len(magic_message)] = magic_message
                 if isinstance(pg, ProcessGroup):
                     torch.distributed.broadcast_object_list(
-                        [shm.name], src=ranks[source_rank], group=pg)
+                        [shm.name], src=ranks[source_rank], group=pg
+                    )
                 else:
                     pg.broadcast_obj(shm.name, src=source_rank)
                 is_in_the_same_node[rank] = 1
@@ -1422,17 +1458,20 @@ def in_the_same_node_as(pg: Union[ProcessGroup, StatelessProcessGroup],
                 if isinstance(pg, ProcessGroup):
                     recv = [None]
                     torch.distributed.broadcast_object_list(
-                        recv, src=ranks[source_rank], group=pg)
+                        recv, src=ranks[source_rank], group=pg
+                    )
                     name = recv[0]
                 else:
                     name = pg.broadcast_obj(None, src=source_rank)
                 # fix to https://stackoverflow.com/q/62748654/9191338
                 # Python incorrectly tracks shared memory even if it is not
                 # created by the process. The following patch is a workaround.
-                with patch("multiprocessing.resource_tracker.register",
-                           lambda *args, **kwargs: None):
+                with patch(
+                    "multiprocessing.resource_tracker.register",
+                    lambda *args, **kwargs: None,
+                ):
                     shm = shared_memory.SharedMemory(name=name)
-                if shm.buf[:len(magic_message)] == magic_message:
+                if shm.buf[: len(magic_message)] == magic_message:
                     is_in_the_same_node[rank] = 1
     except Exception as e:
         logger.error("Error ignored in is_in_the_same_node: %s", e)
diff --git a/vllm/distributed/tpu_distributed_utils.py b/vllm/distributed/tpu_distributed_utils.py
index 0a786b4a1708..3db25d1a1964 100644
--- a/vllm/distributed/tpu_distributed_utils.py
+++ b/vllm/distributed/tpu_distributed_utils.py
@@ -10,18 +10,17 @@
 from torch.nn.parameter import Parameter
 
 from vllm.logger import init_logger
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 
 logger = init_logger(__name__)
 
 
 class XlaQKVParallelLinear(nn.Module):
-
-    def __init__(self,
-                 qkv_linear: nn.Module,
-                 mesh: Optional["xs.Mesh"] = None):
+    def __init__(self, qkv_linear: nn.Module, mesh: Optional["xs.Mesh"] = None):
         super().__init__()
         assert isinstance(qkv_linear, QKVParallelLinear)
         self.skip_bias_add = qkv_linear.skip_bias_add
@@ -39,21 +38,22 @@ def __init__(self,
             self._shard_weight(mesh)
 
     def _shard_weight(self, mesh: "xs.Mesh"):
-        self.q_weight = Parameter(self.q_weight.to('xla'), requires_grad=False)
-        self.k_weight = Parameter(self.k_weight.to('xla'), requires_grad=False)
-        self.v_weight = Parameter(self.v_weight.to('xla'), requires_grad=False)
-        xs.mark_sharding(self.q_weight, mesh, ('x', None))
-        xs.mark_sharding(self.k_weight, mesh, ('x', None))
-        xs.mark_sharding(self.v_weight, mesh, ('x', None))
+        self.q_weight = Parameter(self.q_weight.to("xla"), requires_grad=False)
+        self.k_weight = Parameter(self.k_weight.to("xla"), requires_grad=False)
+        self.v_weight = Parameter(self.v_weight.to("xla"), requires_grad=False)
+        xs.mark_sharding(self.q_weight, mesh, ("x", None))
+        xs.mark_sharding(self.k_weight, mesh, ("x", None))
+        xs.mark_sharding(self.v_weight, mesh, ("x", None))
         if self.q_bias is not None:
-            assert self.k_bias is not None and self.v_bias is not None, \
+            assert self.k_bias is not None and self.v_bias is not None, (
                 "QKVParallelLinear should have q, k, and v biases together."
-            self.q_bias = Parameter(self.q_bias.to('xla'), requires_grad=False)
-            xs.mark_sharding(self.q_bias, mesh, ('x', ))
-            self.k_bias = Parameter(self.k_bias.to('xla'), requires_grad=False)
-            xs.mark_sharding(self.k_bias, mesh, ('x', ))
-            self.v_bias = Parameter(self.v_bias.to('xla'), requires_grad=False)
-            xs.mark_sharding(self.v_bias, mesh, ('x', ))
+            )
+            self.q_bias = Parameter(self.q_bias.to("xla"), requires_grad=False)
+            xs.mark_sharding(self.q_bias, mesh, ("x",))
+            self.k_bias = Parameter(self.k_bias.to("xla"), requires_grad=False)
+            xs.mark_sharding(self.k_bias, mesh, ("x",))
+            self.v_bias = Parameter(self.v_bias.to("xla"), requires_grad=False)
+            xs.mark_sharding(self.v_bias, mesh, ("x",))
 
     def _load_weights_from_qkv_linear(self, qkv_linear: nn.Module):
         q_proj_size, k_proj_size, _ = qkv_linear.output_sizes
@@ -61,22 +61,25 @@ def _load_weights_from_qkv_linear(self, qkv_linear: nn.Module):
         # along the output dimension.
         qkv_weight = qkv_linear.weight.data.cpu()
         q_weight = Parameter(qkv_weight[:q_proj_size], requires_grad=False)
-        k_weight = Parameter(qkv_weight[q_proj_size:q_proj_size + k_proj_size],
-                             requires_grad=False)
-        v_weight = Parameter(qkv_weight[q_proj_size + k_proj_size:],
-                             requires_grad=False)
+        k_weight = Parameter(
+            qkv_weight[q_proj_size : q_proj_size + k_proj_size], requires_grad=False
+        )
+        v_weight = Parameter(
+            qkv_weight[q_proj_size + k_proj_size :], requires_grad=False
+        )
         self.register_parameter("q_weight", q_weight)
         self.register_parameter("k_weight", k_weight)
         self.register_parameter("v_weight", v_weight)
 
         if qkv_linear.bias is not None:
-            q_bias = Parameter(qkv_linear.bias[:q_proj_size],
-                               requires_grad=False)
-            k_bias = Parameter(qkv_linear.bias[q_proj_size:q_proj_size +
-                                               k_proj_size],
-                               requires_grad=False)
-            v_bias = Parameter(qkv_linear.bias[q_proj_size + k_proj_size:],
-                               requires_grad=False)
+            q_bias = Parameter(qkv_linear.bias[:q_proj_size], requires_grad=False)
+            k_bias = Parameter(
+                qkv_linear.bias[q_proj_size : q_proj_size + k_proj_size],
+                requires_grad=False,
+            )
+            v_bias = Parameter(
+                qkv_linear.bias[q_proj_size + k_proj_size :], requires_grad=False
+            )
             self.register_parameter("q_bias", q_bias)
             self.register_parameter("k_bias", k_bias)
             self.register_parameter("v_bias", v_bias)
@@ -102,42 +105,48 @@ def forward(self, input):
         # The concat and the following split will be noop, and should be
         # optimized away by the compiler.
         qkv_proj = torch.cat([q_proj, k_proj, v_proj], dim=-1)
-        output_bias = torch.cat([q_bias, k_bias, v_bias], dim=-1) if \
-                            self.skip_bias_add else None
+        output_bias = (
+            torch.cat([q_bias, k_bias, v_bias], dim=-1) if self.skip_bias_add else None
+        )
         if not self.return_bias:
             return qkv_proj
         return qkv_proj, output_bias
 
 
-def partition_column_parallel_linear(layer: torch.nn.Module,
-                                     mesh: xs.Mesh) -> torch.nn.Module:
+def partition_column_parallel_linear(
+    layer: torch.nn.Module, mesh: xs.Mesh
+) -> torch.nn.Module:
     assert isinstance(layer, ColumnParallelLinear)
-    xs.mark_sharding(layer.weight, mesh, ('x', None))
+    xs.mark_sharding(layer.weight, mesh, ("x", None))
     logger.debug("Applied column-parallel sharding to %s", layer)
     return layer
 
 
-def partition_row_parallel_linear(layer: torch.nn.Module,
-                                  mesh: xs.Mesh) -> torch.nn.Module:
+def partition_row_parallel_linear(
+    layer: torch.nn.Module, mesh: xs.Mesh
+) -> torch.nn.Module:
     assert isinstance(layer, RowParallelLinear)
-    xs.mark_sharding(layer.weight, mesh, (None, 'x'))
+    xs.mark_sharding(layer.weight, mesh, (None, "x"))
     logger.debug("Applied row-parallel sharding to %s", layer)
     return layer
 
 
-def partition_qkv_parallel_linear(layer: torch.nn.Module,
-                                  mesh: xs.Mesh) -> torch.nn.Module:
+def partition_qkv_parallel_linear(
+    layer: torch.nn.Module, mesh: xs.Mesh
+) -> torch.nn.Module:
     assert isinstance(layer, QKVParallelLinear)
     xla_layer = XlaQKVParallelLinear(layer, mesh)
     logger.debug("Applied qkv parallel sharding to %s", layer)
     return xla_layer
 
 
-MODULE_TYPE_TO_WRAPPING_FUNC = OrderedDict([
-    ("QKVParallelLinear", partition_qkv_parallel_linear),
-    ("ColumnParallelLinear", partition_column_parallel_linear),
-    ("RowParallelLinear", partition_row_parallel_linear),
-])
+MODULE_TYPE_TO_WRAPPING_FUNC = OrderedDict(
+    [
+        ("QKVParallelLinear", partition_qkv_parallel_linear),
+        ("ColumnParallelLinear", partition_column_parallel_linear),
+        ("RowParallelLinear", partition_row_parallel_linear),
+    ]
+)
 
 
 def get_fqn(module):
@@ -147,9 +156,9 @@ def get_fqn(module):
 
 def shard_model(model: torch.nn.Module, mesh: "xs.Mesh") -> None:
     """
-    Recursively check a PyTorch model and apply appropriate sharding based on 
+    Recursively check a PyTorch model and apply appropriate sharding based on
     the MODULE_TYPE_TO_WRAPPING_FUNC mapping.
-    
+
     Args:
         model: torch.nn.Module to process
         mesh: An XLA SPMD mesh object used for sharding
@@ -161,7 +170,8 @@ def _process_module(module, name=None, parent=None):
                 wrapped_module = wrapping_func(module, mesh)
 
                 assert parent is not None and name is not None, (
-                    "Top Level module is not expected to be wrapped.")
+                    "Top Level module is not expected to be wrapped."
+                )
                 if wrapped_module is not module:
                     # Wrapped module and module are different py object.
                     # The original module should be replaced by the
diff --git a/vllm/distributed/utils.py b/vllm/distributed/utils.py
index 67f71643d039..a35f28c25385 100644
--- a/vllm/distributed/utils.py
+++ b/vllm/distributed/utils.py
@@ -19,9 +19,12 @@
 
 import torch
 from torch.distributed import ProcessGroup, TCPStore
-from torch.distributed.distributed_c10d import (Backend, PrefixStore,
-                                                _get_default_timeout,
-                                                _unregister_process_group)
+from torch.distributed.distributed_c10d import (
+    Backend,
+    PrefixStore,
+    _get_default_timeout,
+    _unregister_process_group,
+)
 from torch.distributed.rendezvous import rendezvous
 
 import vllm.envs as envs
@@ -33,9 +36,9 @@
 # We prefer to use os.sched_yield as it results in tighter polling loops,
 # measured to be around 3e-7 seconds. However on earlier versions of Python
 # os.sched_yield() does not release the GIL, so we fall back to time.sleep(0)
-USE_SCHED_YIELD = ((sys.version_info[:3] >= (3, 11, 1))
-                   or (sys.version_info[:2] == (3, 10)
-                       and sys.version_info[2] >= 8))
+USE_SCHED_YIELD = (sys.version_info[:3] >= (3, 11, 1)) or (
+    sys.version_info[:2] == (3, 10) and sys.version_info[2] >= 8
+)
 
 
 def sched_yield():
@@ -48,7 +51,8 @@ def sched_yield():
 def ensure_divisibility(numerator, denominator):
     """Ensure that numerator is divisible by the denominator."""
     assert numerator % denominator == 0, "{} is not divisible by {}".format(
-        numerator, denominator)
+        numerator, denominator
+    )
 
 
 def divide(numerator, denominator):
@@ -63,16 +67,16 @@ def split_tensor_along_last_dim(
     num_partitions: int,
     contiguous_split_chunks: bool = False,
 ) -> Sequence[torch.Tensor]:
-    """ Split a tensor along its last dimension.
+    """Split a tensor along its last dimension.
 
-        Arguments:
-            tensor: input tensor.
-            num_partitions: number of partitions to split the tensor
-            contiguous_split_chunks: If True, make each chunk contiguous
-                                     in memory.
+    Arguments:
+        tensor: input tensor.
+        num_partitions: number of partitions to split the tensor
+        contiguous_split_chunks: If True, make each chunk contiguous
+                                 in memory.
 
-        Returns:
-            A list of Tensors
+    Returns:
+        A list of Tensors
     """
     # Get the size and dimension.
     last_dim = tensor.dim() - 1
@@ -86,8 +90,9 @@ def split_tensor_along_last_dim(
     return tensor_list
 
 
-def get_pp_indices(num_hidden_layers: int, pp_rank: int,
-                   pp_size: int) -> tuple[int, int]:
+def get_pp_indices(
+    num_hidden_layers: int, pp_rank: int, pp_size: int
+) -> tuple[int, int]:
     """Try to evenly distribute layers across partitions.
 
     If the number of layers is not divisible by the number of partitions,
@@ -104,17 +109,15 @@ def get_pp_indices(num_hidden_layers: int, pp_rank: int,
     partition_list_str = envs.VLLM_PP_LAYER_PARTITION
     if partition_list_str is not None:
         try:
-            partitions = [
-                int(layer) for layer in partition_list_str.split(",")
-            ]
+            partitions = [int(layer) for layer in partition_list_str.split(",")]
         except ValueError as err:
-            raise ValueError("Invalid partition string: {}".format(
-                partition_list_str)) from err
+            raise ValueError(
+                "Invalid partition string: {}".format(partition_list_str)
+            ) from err
         if len(partitions) != pp_size:
             raise ValueError(f"{len(partitions)=} does not match {pp_size=}.")
         if sum(partitions) != num_hidden_layers:
-            raise ValueError(
-                f"{sum(partitions)=} does not match {num_hidden_layers=}.")
+            raise ValueError(f"{sum(partitions)=} does not match {num_hidden_layers=}.")
     else:
         layers_per_partition = num_hidden_layers // pp_size
         partitions = [layers_per_partition for _ in range(pp_size)]
@@ -126,7 +129,8 @@ def get_pp_indices(num_hidden_layers: int, pp_rank: int,
                 "Hidden layers were unevenly partitioned: [%s]. "
                 "This can be manually overridden using the "
                 "VLLM_PP_LAYER_PARTITION environment variable",
-                ",".join(str(p) for p in partitions))
+                ",".join(str(p) for p in partitions),
+            )
 
     start_layer = sum(partitions[:pp_rank])
     end_layer = start_layer + partitions[pp_rank]
@@ -140,6 +144,7 @@ class StatelessProcessGroup:
     group. Only use it to communicate metadata between processes.
     For data-plane communication, create NCCL-related objects.
     """
+
     rank: int
     world_size: int
     store: torch._C._distributed_c10d.Store
@@ -154,21 +159,16 @@ class StatelessProcessGroup:
     # src rank -> counter
     recv_src_counter: dict[int, int] = dataclasses.field(default_factory=dict)
     broadcast_send_counter: int = 0
-    broadcast_recv_src_counter: dict[int, int] = dataclasses.field(
-        default_factory=dict)
+    broadcast_recv_src_counter: dict[int, int] = dataclasses.field(default_factory=dict)
 
     # A deque to store the data entries, with key and timestamp.
-    entries: deque[tuple[str,
-                         float]] = dataclasses.field(default_factory=deque)
+    entries: deque[tuple[str, float]] = dataclasses.field(default_factory=deque)
 
     def __post_init__(self):
         assert self.rank < self.world_size
         self.send_dst_counter = {i: 0 for i in range(self.world_size)}
         self.recv_src_counter = {i: 0 for i in range(self.world_size)}
-        self.broadcast_recv_src_counter = {
-            i: 0
-            for i in range(self.world_size)
-        }
+        self.broadcast_recv_src_counter = {i: 0 for i in range(self.world_size)}
 
     def send_obj(self, obj: Any, dst: int):
         """Send an object to a destination rank."""
@@ -192,8 +192,8 @@ def expire_data(self):
     def recv_obj(self, src: int) -> Any:
         """Receive an object from a source rank."""
         obj = pickle.loads(
-            self.store.get(
-                f"send_to/{self.rank}/{self.recv_src_counter[src]}"))
+            self.store.get(f"send_to/{self.rank}/{self.recv_src_counter[src]}")
+        )
         self.recv_src_counter[src] += 1
         return obj
 
@@ -204,15 +204,13 @@ def broadcast_obj(self, obj: Optional[Any], src: int) -> Any:
         """
         if self.rank == src:
             self.expire_data()
-            key = (f"broadcast_from/{src}/"
-                   f"{self.broadcast_send_counter}")
+            key = f"broadcast_from/{src}/{self.broadcast_send_counter}"
             self.store.set(key, pickle.dumps(obj))
             self.broadcast_send_counter += 1
             self.entries.append((key, time.time()))
             return obj
         else:
-            key = (f"broadcast_from/{src}/"
-                   f"{self.broadcast_recv_src_counter[src]}")
+            key = f"broadcast_from/{src}/{self.broadcast_recv_src_counter[src]}"
             recv_obj = pickle.loads(self.store.get(key))
             self.broadcast_recv_src_counter[src] += 1
             return recv_obj
@@ -278,8 +276,7 @@ def barrier(self, timeout: float = 30.0):
             # Check for timeout
             cur_time = time.time()
             if cur_time - start_time > timeout:
-                raise RuntimeError("Barrier timed out after %f seconds",
-                                   timeout)
+                raise RuntimeError("Barrier timed out after %f seconds", timeout)
 
             # Check for each process
             for i in range(self.world_size):
@@ -326,8 +323,7 @@ def barrier(self, timeout: float = 30.0):
         while len(processes_departed) < self.world_size:
             # Check for timeout
             if time.time() - start_time > timeout:
-                raise RuntimeError("Barrier departure timed out after %f s",
-                                   timeout)
+                raise RuntimeError("Barrier departure timed out after %f s", timeout)
 
             # Check for each process
             for i in range(self.world_size):
@@ -356,14 +352,12 @@ def barrier(self, timeout: float = 30.0):
             try:
                 self.store.delete_key(f"arrival_{barrier_id}_{i}")
             except Exception:
-                logger.debug("Error deleting key: %s",
-                             f'arrival_{barrier_id}_{i}')
+                logger.debug("Error deleting key: %s", f"arrival_{barrier_id}_{i}")
 
             try:
                 self.store.delete_key(f"departure_{barrier_id}_{i}")
             except Exception:
-                logger.debug("Error deleting key: %s",
-                             f'departure_{barrier_id}_{i}')
+                logger.debug("Error deleting key: %s", f"departure_{barrier_id}_{i}")
 
     @staticmethod
     def create(
@@ -388,7 +382,7 @@ def create(
         used for exchanging metadata. With this function, process A and process B
         can call `StatelessProcessGroup.create` to form a group, and then process A, B,
         C, and D can call `StatelessProcessGroup.create` to form another group.
-        """ # noqa
+        """  # noqa
         launch_server = rank == 0
         if launch_server:
             # listen on the specified interface (instead of 0.0.0.0)
@@ -416,14 +410,19 @@ def create(
             world_size=world_size,
             store=store,
             socket=listen_socket,
-            data_expiration_seconds=data_expiration_seconds)
+            data_expiration_seconds=data_expiration_seconds,
+        )
 
 
-def init_gloo_process_group(backend: Backend, prefix_store: PrefixStore,
-                            group_rank: int, group_size: int,
-                            timeout: timedelta) -> ProcessGroup:
+def init_gloo_process_group(
+    backend: Backend,
+    prefix_store: PrefixStore,
+    group_rank: int,
+    group_size: int,
+    timeout: timedelta,
+) -> ProcessGroup:
     """
-    Stateless init ProcessGroup with gloo backend compatible with 
+    Stateless init ProcessGroup with gloo backend compatible with
     different torch versions.
     """
     if is_torch_equal_or_newer("2.6"):
@@ -441,10 +440,10 @@ def init_gloo_process_group(backend: Backend, prefix_store: PrefixStore,
             options,
         )
     from torch.distributed.distributed_c10d import ProcessGroupGloo
-    backend_class = ProcessGroupGloo(prefix_store,
-                                     group_rank,
-                                     group_size,
-                                     timeout=timeout)
+
+    backend_class = ProcessGroupGloo(
+        prefix_store, group_rank, group_size, timeout=timeout
+    )
     backend_type = ProcessGroup.BackendType.GLOO
     device = torch.device("cpu")
     if is_torch_equal_or_newer("2.6"):
@@ -457,8 +456,8 @@ def init_gloo_process_group(backend: Backend, prefix_store: PrefixStore,
 
 
 def stateless_init_torch_distributed_process_group(
-        host: str, port: int, rank: int, world_size: int,
-        backend: str) -> ProcessGroup:
+    host: str, port: int, rank: int, world_size: int, backend: str
+) -> ProcessGroup:
     """
     A replacement for `torch.distributed.init_process_group` that does not
     pollute the global state. The created ProcessGroup object can be used for
@@ -495,7 +494,8 @@ def stateless_init_torch_distributed_process_group(
     timeout = _get_default_timeout(backend)
 
     store, rank, world_size = next(
-        rendezvous(init_method, rank, world_size, timeout=timeout))
+        rendezvous(init_method, rank, world_size, timeout=timeout)
+    )
     store.set_timeout(timeout)
 
     group_rank = rank
@@ -506,22 +506,25 @@ def stateless_init_torch_distributed_process_group(
     prefix_store = PrefixStore(init_method, store)
 
     if backend == "gloo":
-        return init_gloo_process_group(backend=backend,
-                                       prefix_store=prefix_store,
-                                       group_rank=group_rank,
-                                       group_size=group_size,
-                                       timeout=timeout)
+        return init_gloo_process_group(
+            backend=backend,
+            prefix_store=prefix_store,
+            group_rank=group_rank,
+            group_size=group_size,
+            timeout=timeout,
+        )
     from vllm.platforms import current_platform
+
     return current_platform.stateless_init_device_torch_dist_pg(
         backend=backend,
         prefix_store=prefix_store,
         group_rank=group_rank,
         group_size=group_size,
-        timeout=timeout)
+        timeout=timeout,
+    )
 
 
-def stateless_destroy_torch_distributed_process_group(
-        pg: ProcessGroup) -> None:
+def stateless_destroy_torch_distributed_process_group(pg: ProcessGroup) -> None:
     """
     Destroy ProcessGroup returned by
         stateless_init_torch_distributed_process_group().
@@ -531,6 +534,7 @@ def stateless_destroy_torch_distributed_process_group(
     else:
         # Lazy import for non-CUDA backends.
         from torch.distributed.distributed_c10d import _shutdown_backend
+
         _shutdown_backend(pg)
 
     _unregister_process_group(pg.group_name)
diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index 89a881675ad6..e971ef273756 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -10,9 +10,22 @@
 import sys
 from dataclasses import MISSING, dataclass, fields, is_dataclass
 from itertools import permutations
-from typing import (TYPE_CHECKING, Annotated, Any, Callable, Dict, List,
-                    Literal, Optional, Type, TypeVar, Union, cast, get_args,
-                    get_origin)
+from typing import (
+    TYPE_CHECKING,
+    Annotated,
+    Any,
+    Callable,
+    Dict,
+    List,
+    Literal,
+    Optional,
+    Type,
+    TypeVar,
+    Union,
+    cast,
+    get_args,
+    get_origin,
+)
 
 import huggingface_hub
 import regex as re
@@ -21,17 +34,42 @@
 from typing_extensions import TypeIs, deprecated
 
 import vllm.envs as envs
-from vllm.config import (BlockSize, CacheConfig, CacheDType, CompilationConfig,
-                         ConfigType, ConvertOption, DetailedTraceModules,
-                         Device, DeviceConfig, DistributedExecutorBackend,
-                         EPLBConfig, HfOverrides, KVEventsConfig,
-                         KVTransferConfig, LoadConfig, LogprobsMode,
-                         LoRAConfig, MambaDType, MMEncoderTPMode, ModelConfig,
-                         ModelDType, ObservabilityConfig, ParallelConfig,
-                         PoolerConfig, PrefixCachingHashAlgo, RunnerOption,
-                         SchedulerConfig, SchedulerPolicy, SpeculativeConfig,
-                         StructuredOutputsConfig, TaskOption, TokenizerMode,
-                         VllmConfig, get_attr_docs)
+from vllm.config import (
+    BlockSize,
+    CacheConfig,
+    CacheDType,
+    CompilationConfig,
+    ConfigType,
+    ConvertOption,
+    DetailedTraceModules,
+    Device,
+    DeviceConfig,
+    DistributedExecutorBackend,
+    EPLBConfig,
+    HfOverrides,
+    KVEventsConfig,
+    KVTransferConfig,
+    LoadConfig,
+    LogprobsMode,
+    LoRAConfig,
+    MambaDType,
+    MMEncoderTPMode,
+    ModelConfig,
+    ModelDType,
+    ObservabilityConfig,
+    ParallelConfig,
+    PoolerConfig,
+    PrefixCachingHashAlgo,
+    RunnerOption,
+    SchedulerConfig,
+    SchedulerPolicy,
+    SpeculativeConfig,
+    StructuredOutputsConfig,
+    TaskOption,
+    TokenizerMode,
+    VllmConfig,
+    get_attr_docs,
+)
 from vllm.config.multimodal import MMCacheType, MultiModalConfig
 from vllm.config.parallel import ExpertPlacementStrategy
 from vllm.config.utils import get_field
@@ -41,11 +79,13 @@
 from vllm.ray.lazy_utils import is_ray_initialized
 from vllm.reasoning import ReasoningParserManager
 from vllm.test_utils import MODEL_WEIGHTS_S3_BUCKET, MODELS_ON_S3
-from vllm.transformers_utils.config import (get_model_path, is_interleaved,
-                                            maybe_override_with_speculators)
+from vllm.transformers_utils.config import (
+    get_model_path,
+    is_interleaved,
+    maybe_override_with_speculators,
+)
 from vllm.transformers_utils.utils import check_gguf_file
-from vllm.utils import (FlexibleArgumentParser, GiB_bytes, get_ip,
-                        is_in_ray_actor)
+from vllm.utils import FlexibleArgumentParser, GiB_bytes, get_ip, is_in_ray_actor
 from vllm.v1.sample.logits_processor import LogitsProcessor
 
 # yapf: enable
@@ -70,20 +110,18 @@
 
 
 def parse_type(return_type: Callable[[str], T]) -> Callable[[str], T]:
-
     def _parse_type(val: str) -> T:
         try:
             return return_type(val)
         except ValueError as e:
             raise argparse.ArgumentTypeError(
-                f"Value {val} cannot be converted to {return_type}.") from e
+                f"Value {val} cannot be converted to {return_type}."
+            ) from e
 
     return _parse_type
 
 
-def optional_type(
-        return_type: Callable[[str], T]) -> Callable[[str], Optional[T]]:
-
+def optional_type(return_type: Callable[[str], T]) -> Callable[[str], Optional[T]]:
     def _optional_type(val: str) -> Optional[T]:
         if val == "" or val == "None":
             return None
@@ -124,7 +162,8 @@ def literal_to_kwargs(type_hints: set[TypeHint]) -> dict[str, Any]:
     if not all(isinstance(option, option_type) for option in options):
         raise ValueError(
             "All options must be of the same type. "
-            f"Got {options} with types {[type(c) for c in options]}")
+            f"Got {options} with types {[type(c) for c in options]}"
+        )
     kwarg = "metavar" if contains_type(type_hints, str) else "choices"
     return {"type": option_type, kwarg: sorted(options)}
 
@@ -191,8 +230,9 @@ def _compute_kwargs(cls: ConfigType) -> dict[str, Any]:
         kwargs[name] = {"default": default, "help": help}
 
         # Set other kwargs based on the type hints
-        json_tip = ("Should either be a valid JSON string or JSON keys passed "
-                    "individually.")
+        json_tip = (
+            "Should either be a valid JSON string or JSON keys passed individually."
+        )
         if dataclass_cls is not None:
 
             def parse_dataclass(val: str, cls=dataclass_cls) -> Any:
@@ -214,7 +254,8 @@ def parse_dataclass(val: str, cls=dataclass_cls) -> Any:
             tuple_type = types[0]
             assert all(t is tuple_type for t in types if t is not Ellipsis), (
                 "All non-Ellipsis tuple elements must be of the same "
-                f"type. Got {types}.")
+                f"type. Got {types}."
+            )
             kwargs[name]["type"] = tuple_type
             kwargs[name]["nargs"] = "+" if Ellipsis in types else len(types)
         elif contains_type(type_hints, list):
@@ -240,19 +281,20 @@ def parse_dataclass(val: str, cls=dataclass_cls) -> Any:
                 kwargs[name]["help"] += f"\n\n{human_readable_int.__doc__}"
         elif contains_type(type_hints, float):
             kwargs[name]["type"] = float
-        elif (contains_type(type_hints, dict)
-              and (contains_type(type_hints, str)
-                   or any(is_not_builtin(th) for th in type_hints))):
+        elif contains_type(type_hints, dict) and (
+            contains_type(type_hints, str)
+            or any(is_not_builtin(th) for th in type_hints)
+        ):
             kwargs[name]["type"] = union_dict_and_str
         elif contains_type(type_hints, dict):
             kwargs[name]["type"] = parse_type(json.loads)
             kwargs[name]["help"] += f"\n\n{json_tip}"
-        elif (contains_type(type_hints, str)
-              or any(is_not_builtin(th) for th in type_hints)):
+        elif contains_type(type_hints, str) or any(
+            is_not_builtin(th) for th in type_hints
+        ):
             kwargs[name]["type"] = str
         else:
-            raise ValueError(
-                f"Unsupported type {type_hints} for argument {name}.")
+            raise ValueError(f"Unsupported type {type_hints} for argument {name}.")
 
         # If the type hint was a sequence of literals, use the helper function
         # to update the type and choices
@@ -284,9 +326,9 @@ def get_kwargs(cls: ConfigType) -> dict[str, Any]:
 @dataclass
 class EngineArgs:
     """Arguments for vLLM engine."""
+
     model: str = ModelConfig.model
-    served_model_name: Optional[Union[
-        str, List[str]]] = ModelConfig.served_model_name
+    served_model_name: Optional[Union[str, List[str]]] = ModelConfig.served_model_name
     tokenizer: Optional[str] = ModelConfig.tokenizer
     hf_config_path: Optional[str] = ModelConfig.hf_config_path
     runner: RunnerOption = ModelConfig.runner
@@ -297,8 +339,7 @@ class EngineArgs:
     tokenizer_mode: TokenizerMode = ModelConfig.tokenizer_mode
     trust_remote_code: bool = ModelConfig.trust_remote_code
     allowed_local_media_path: str = ModelConfig.allowed_local_media_path
-    allowed_media_domains: Optional[
-        list[str]] = ModelConfig.allowed_media_domains
+    allowed_media_domains: Optional[list[str]] = ModelConfig.allowed_media_domains
     download_dir: Optional[str] = LoadConfig.download_dir
     safetensors_load_strategy: str = LoadConfig.safetensors_load_strategy
     load_format: Union[str, LoadFormats] = LoadConfig.load_format
@@ -307,19 +348,17 @@ class EngineArgs:
     kv_cache_dtype: CacheDType = CacheConfig.cache_dtype
     seed: Optional[int] = ModelConfig.seed
     max_model_len: Optional[int] = ModelConfig.max_model_len
-    cuda_graph_sizes: list[int] = get_field(SchedulerConfig,
-                                            "cuda_graph_sizes")
+    cuda_graph_sizes: list[int] = get_field(SchedulerConfig, "cuda_graph_sizes")
     # Note: Specifying a custom executor backend by passing a class
     # is intended for expert use only. The API may change without
     # notice.
-    distributed_executor_backend: Optional[Union[
-        str, DistributedExecutorBackend,
-        Type[ExecutorBase]]] = ParallelConfig.distributed_executor_backend
+    distributed_executor_backend: Optional[
+        Union[str, DistributedExecutorBackend, Type[ExecutorBase]]
+    ] = ParallelConfig.distributed_executor_backend
     # number of P/D disaggregation (or other disaggregation) workers
     pipeline_parallel_size: int = ParallelConfig.pipeline_parallel_size
     tensor_parallel_size: int = ParallelConfig.tensor_parallel_size
-    decode_context_parallel_size: int = \
-        ParallelConfig.decode_context_parallel_size
+    decode_context_parallel_size: int = ParallelConfig.decode_context_parallel_size
     data_parallel_size: int = ParallelConfig.data_parallel_size
     data_parallel_rank: Optional[int] = None
     data_parallel_start_rank: Optional[int] = None
@@ -330,38 +369,37 @@ class EngineArgs:
     data_parallel_backend: str = ParallelConfig.data_parallel_backend
     enable_expert_parallel: bool = ParallelConfig.enable_expert_parallel
     enable_dbo: bool = ParallelConfig.enable_dbo
-    dbo_decode_token_threshold: int = \
-        ParallelConfig.dbo_decode_token_threshold
-    dbo_prefill_token_threshold: int = \
-        ParallelConfig.dbo_prefill_token_threshold
+    dbo_decode_token_threshold: int = ParallelConfig.dbo_decode_token_threshold
+    dbo_prefill_token_threshold: int = ParallelConfig.dbo_prefill_token_threshold
     eplb_config: EPLBConfig = get_field(ParallelConfig, "eplb_config")
     enable_eplb: bool = ParallelConfig.enable_eplb
-    expert_placement_strategy: ExpertPlacementStrategy = \
+    expert_placement_strategy: ExpertPlacementStrategy = (
         ParallelConfig.expert_placement_strategy
+    )
     _api_process_count: int = ParallelConfig._api_process_count
     _api_process_rank: int = ParallelConfig._api_process_rank
     num_redundant_experts: int = EPLBConfig.num_redundant_experts
     eplb_window_size: int = EPLBConfig.window_size
     eplb_step_interval: int = EPLBConfig.step_interval
     eplb_log_balancedness: bool = EPLBConfig.log_balancedness
-    max_parallel_loading_workers: Optional[
-        int] = ParallelConfig.max_parallel_loading_workers
+    max_parallel_loading_workers: Optional[int] = (
+        ParallelConfig.max_parallel_loading_workers
+    )
     block_size: Optional[BlockSize] = CacheConfig.block_size
     enable_prefix_caching: Optional[bool] = CacheConfig.enable_prefix_caching
-    prefix_caching_hash_algo: PrefixCachingHashAlgo = \
+    prefix_caching_hash_algo: PrefixCachingHashAlgo = (
         CacheConfig.prefix_caching_hash_algo
+    )
     disable_sliding_window: bool = ModelConfig.disable_sliding_window
     disable_cascade_attn: bool = ModelConfig.disable_cascade_attn
     swap_space: float = CacheConfig.swap_space
     cpu_offload_gb: float = CacheConfig.cpu_offload_gb
     gpu_memory_utilization: float = CacheConfig.gpu_memory_utilization
     kv_cache_memory_bytes: Optional[int] = CacheConfig.kv_cache_memory_bytes
-    max_num_batched_tokens: Optional[
-        int] = SchedulerConfig.max_num_batched_tokens
+    max_num_batched_tokens: Optional[int] = SchedulerConfig.max_num_batched_tokens
     max_num_partial_prefills: int = SchedulerConfig.max_num_partial_prefills
     max_long_partial_prefills: int = SchedulerConfig.max_long_partial_prefills
-    long_prefill_token_threshold: int = \
-        SchedulerConfig.long_prefill_token_threshold
+    long_prefill_token_threshold: int = SchedulerConfig.long_prefill_token_threshold
     max_num_seqs: Optional[int] = SchedulerConfig.max_num_seqs
     max_logprobs: int = ModelConfig.max_logprobs
     logprobs_mode: LogprobsMode = ModelConfig.logprobs_mode
@@ -376,20 +414,22 @@ class EngineArgs:
     quantization: Optional[QuantizationMethods] = ModelConfig.quantization
     enforce_eager: bool = ModelConfig.enforce_eager
     disable_custom_all_reduce: bool = ParallelConfig.disable_custom_all_reduce
-    limit_mm_per_prompt: dict[str, Union[int, dict[str, int]]] = \
-        get_field(MultiModalConfig, "limit_per_prompt")
+    limit_mm_per_prompt: dict[str, Union[int, dict[str, int]]] = get_field(
+        MultiModalConfig, "limit_per_prompt"
+    )
     interleave_mm_strings: bool = MultiModalConfig.interleave_mm_strings
-    media_io_kwargs: dict[str, dict[str,
-                                    Any]] = get_field(MultiModalConfig,
-                                                      "media_io_kwargs")
-    mm_processor_kwargs: Optional[Dict[str, Any]] = \
-        MultiModalConfig.mm_processor_kwargs
+    media_io_kwargs: dict[str, dict[str, Any]] = get_field(
+        MultiModalConfig, "media_io_kwargs"
+    )
+    mm_processor_kwargs: Optional[Dict[str, Any]] = MultiModalConfig.mm_processor_kwargs
     disable_mm_preprocessor_cache: bool = False  # DEPRECATED
     mm_processor_cache_gb: float = MultiModalConfig.mm_processor_cache_gb
-    mm_processor_cache_type: Optional[MMCacheType] = \
+    mm_processor_cache_type: Optional[MMCacheType] = (
         MultiModalConfig.mm_processor_cache_type
-    mm_shm_cache_max_object_size_mb: int = \
+    )
+    mm_shm_cache_max_object_size_mb: int = (
         MultiModalConfig.mm_shm_cache_max_object_size_mb
+    )
     mm_encoder_tp_mode: MMEncoderTPMode = MultiModalConfig.mm_encoder_tp_mode
     io_processor_plugin: Optional[str] = None
     skip_mm_profiling: bool = MultiModalConfig.skip_mm_profiling
@@ -399,31 +439,28 @@ class EngineArgs:
     enable_lora_bias: bool = LoRAConfig.bias_enabled
     max_loras: int = LoRAConfig.max_loras
     max_lora_rank: int = LoRAConfig.max_lora_rank
-    default_mm_loras: Optional[Dict[str, str]] = \
-        LoRAConfig.default_mm_loras
+    default_mm_loras: Optional[Dict[str, str]] = LoRAConfig.default_mm_loras
     fully_sharded_loras: bool = LoRAConfig.fully_sharded_loras
     max_cpu_loras: Optional[int] = LoRAConfig.max_cpu_loras
     lora_dtype: Optional[Union[str, torch.dtype]] = LoRAConfig.lora_dtype
     lora_extra_vocab_size: int = LoRAConfig.lora_extra_vocab_size
 
     ray_workers_use_nsight: bool = ParallelConfig.ray_workers_use_nsight
-    num_gpu_blocks_override: Optional[
-        int] = CacheConfig.num_gpu_blocks_override
+    num_gpu_blocks_override: Optional[int] = CacheConfig.num_gpu_blocks_override
     num_lookahead_slots: int = SchedulerConfig.num_lookahead_slots
-    model_loader_extra_config: dict = \
-        get_field(LoadConfig, "model_loader_extra_config")
-    ignore_patterns: Optional[Union[str,
-                                    List[str]]] = LoadConfig.ignore_patterns
+    model_loader_extra_config: dict = get_field(LoadConfig, "model_loader_extra_config")
+    ignore_patterns: Optional[Union[str, List[str]]] = LoadConfig.ignore_patterns
 
-    enable_chunked_prefill: Optional[
-        bool] = SchedulerConfig.enable_chunked_prefill
+    enable_chunked_prefill: Optional[bool] = SchedulerConfig.enable_chunked_prefill
     disable_chunked_mm_input: bool = SchedulerConfig.disable_chunked_mm_input
 
     disable_hybrid_kv_cache_manager: bool = (
-        SchedulerConfig.disable_hybrid_kv_cache_manager)
+        SchedulerConfig.disable_hybrid_kv_cache_manager
+    )
 
     structured_outputs_config: StructuredOutputsConfig = get_field(
-        VllmConfig, "structured_outputs_config")
+        VllmConfig, "structured_outputs_config"
+    )
     reasoning_parser: str = StructuredOutputsConfig.reasoning_parser
     # Deprecated guided decoding fields
     guided_decoding_backend: Optional[str] = None
@@ -431,25 +468,25 @@ class EngineArgs:
     guided_decoding_disable_any_whitespace: Optional[bool] = None
     guided_decoding_disable_additional_properties: Optional[bool] = None
 
-    logits_processor_pattern: Optional[
-        str] = ModelConfig.logits_processor_pattern
+    logits_processor_pattern: Optional[str] = ModelConfig.logits_processor_pattern
 
     speculative_config: Optional[Dict[str, Any]] = None
 
-    show_hidden_metrics_for_version: Optional[str] = \
+    show_hidden_metrics_for_version: Optional[str] = (
         ObservabilityConfig.show_hidden_metrics_for_version
-    otlp_traces_endpoint: Optional[str] = \
-        ObservabilityConfig.otlp_traces_endpoint
-    collect_detailed_traces: Optional[list[DetailedTraceModules]] = \
+    )
+    otlp_traces_endpoint: Optional[str] = ObservabilityConfig.otlp_traces_endpoint
+    collect_detailed_traces: Optional[list[DetailedTraceModules]] = (
         ObservabilityConfig.collect_detailed_traces
+    )
     scheduling_policy: SchedulerPolicy = SchedulerConfig.policy
     scheduler_cls: Union[str, Type[object]] = SchedulerConfig.scheduler_cls
 
     pooler_config: Optional[PoolerConfig] = ModelConfig.pooler_config
-    override_pooler_config: Optional[Union[dict, PoolerConfig]] = \
+    override_pooler_config: Optional[Union[dict, PoolerConfig]] = (
         ModelConfig.override_pooler_config
-    compilation_config: CompilationConfig = \
-        get_field(VllmConfig, "compilation_config")
+    )
+    compilation_config: CompilationConfig = get_field(VllmConfig, "compilation_config")
     worker_cls: str = ParallelConfig.worker_cls
     worker_extension_cls: str = ParallelConfig.worker_extension_cls
 
@@ -458,8 +495,9 @@ class EngineArgs:
 
     generation_config: str = ModelConfig.generation_config
     enable_sleep_mode: bool = ModelConfig.enable_sleep_mode
-    override_generation_config: dict[str, Any] = \
-        get_field(ModelConfig, "override_generation_config")
+    override_generation_config: dict[str, Any] = get_field(
+        ModelConfig, "override_generation_config"
+    )
     model_impl: str = ModelConfig.model_impl
     override_attention_dtype: str = ModelConfig.override_attention_dtype
 
@@ -467,8 +505,7 @@ class EngineArgs:
     mamba_cache_dtype: MambaDType = CacheConfig.mamba_cache_dtype
     mamba_ssm_cache_dtype: MambaDType = CacheConfig.mamba_ssm_cache_dtype
 
-    additional_config: dict[str, Any] = \
-        get_field(VllmConfig, "additional_config")
+    additional_config: dict[str, Any] = get_field(VllmConfig, "additional_config")
 
     use_tqdm_on_load: bool = LoadConfig.use_tqdm_on_load
     pt_load_map_location: str = LoadConfig.pt_load_map_location
@@ -476,34 +513,36 @@ class EngineArgs:
     # DEPRECATED
     enable_multimodal_encoder_data_parallel: bool = False
 
-    logits_processors: Optional[list[Union[
-        str, type[LogitsProcessor]]]] = ModelConfig.logits_processors
+    logits_processors: Optional[list[Union[str, type[LogitsProcessor]]]] = (
+        ModelConfig.logits_processors
+    )
     """Custom logitproc types"""
 
     async_scheduling: bool = SchedulerConfig.async_scheduling
 
-    kv_sharing_fast_prefill: bool = \
-        CacheConfig.kv_sharing_fast_prefill
+    kv_sharing_fast_prefill: bool = CacheConfig.kv_sharing_fast_prefill
 
     def __post_init__(self):
         # support `EngineArgs(compilation_config={...})`
         # without having to manually construct a
         # CompilationConfig object
         if isinstance(self.compilation_config, dict):
-            self.compilation_config = CompilationConfig(
-                **self.compilation_config)
+            self.compilation_config = CompilationConfig(**self.compilation_config)
         if isinstance(self.eplb_config, dict):
             self.eplb_config = EPLBConfig(**self.eplb_config)
         # Setup plugins
         from vllm.plugins import load_general_plugins
+
         load_general_plugins()
         # when use hf offline,replace model id to local model path
         if huggingface_hub.constants.HF_HUB_OFFLINE:
             model_id = self.model
             self.model = get_model_path(self.model, self.revision)
             logger.info(
-                "HF_HUB_OFFLINE is True, replace model_id [%s] " \
-                "to model_path [%s]",model_id, self.model)
+                "HF_HUB_OFFLINE is True, replace model_id [%s] to model_path [%s]",
+                model_id,
+                self.model,
+            )
 
     @staticmethod
     def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
@@ -515,86 +554,92 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
             title="ModelConfig",
             description=ModelConfig.__doc__,
         )
-        if not ('serve' in sys.argv[1:] and '--help' in sys.argv[1:]):
+        if not ("serve" in sys.argv[1:] and "--help" in sys.argv[1:]):
             model_group.add_argument("--model", **model_kwargs["model"])
         model_group.add_argument("--runner", **model_kwargs["runner"])
         model_group.add_argument("--convert", **model_kwargs["convert"])
-        model_group.add_argument("--task",
-                                 **model_kwargs["task"],
-                                 deprecated=True)
+        model_group.add_argument("--task", **model_kwargs["task"], deprecated=True)
         model_group.add_argument("--tokenizer", **model_kwargs["tokenizer"])
-        model_group.add_argument("--tokenizer-mode",
-                                 **model_kwargs["tokenizer_mode"])
-        model_group.add_argument("--trust-remote-code",
-                                 **model_kwargs["trust_remote_code"])
+        model_group.add_argument("--tokenizer-mode", **model_kwargs["tokenizer_mode"])
+        model_group.add_argument(
+            "--trust-remote-code", **model_kwargs["trust_remote_code"]
+        )
         model_group.add_argument("--dtype", **model_kwargs["dtype"])
         model_group.add_argument("--seed", **model_kwargs["seed"])
-        model_group.add_argument("--hf-config-path",
-                                 **model_kwargs["hf_config_path"])
-        model_group.add_argument("--allowed-local-media-path",
-                                 **model_kwargs["allowed_local_media_path"])
-        model_group.add_argument("--allowed-media-domains",
-                                 **model_kwargs["allowed_media_domains"])
+        model_group.add_argument("--hf-config-path", **model_kwargs["hf_config_path"])
+        model_group.add_argument(
+            "--allowed-local-media-path", **model_kwargs["allowed_local_media_path"]
+        )
+        model_group.add_argument(
+            "--allowed-media-domains", **model_kwargs["allowed_media_domains"]
+        )
         model_group.add_argument("--revision", **model_kwargs["revision"])
-        model_group.add_argument("--code-revision",
-                                 **model_kwargs["code_revision"])
-        model_group.add_argument("--rope-scaling",
-                                 **model_kwargs["rope_scaling"])
+        model_group.add_argument("--code-revision", **model_kwargs["code_revision"])
+        model_group.add_argument("--rope-scaling", **model_kwargs["rope_scaling"])
         model_group.add_argument("--rope-theta", **model_kwargs["rope_theta"])
-        model_group.add_argument("--tokenizer-revision",
-                                 **model_kwargs["tokenizer_revision"])
-        model_group.add_argument("--max-model-len",
-                                 **model_kwargs["max_model_len"])
-        model_group.add_argument("--quantization", "-q",
-                                 **model_kwargs["quantization"])
-        model_group.add_argument("--enforce-eager",
-                                 **model_kwargs["enforce_eager"])
-        model_group.add_argument("--max-logprobs",
-                                 **model_kwargs["max_logprobs"])
-        model_group.add_argument("--logprobs-mode",
-                                 **model_kwargs["logprobs_mode"])
-        model_group.add_argument("--disable-sliding-window",
-                                 **model_kwargs["disable_sliding_window"])
-        model_group.add_argument("--disable-cascade-attn",
-                                 **model_kwargs["disable_cascade_attn"])
-        model_group.add_argument("--skip-tokenizer-init",
-                                 **model_kwargs["skip_tokenizer_init"])
-        model_group.add_argument("--enable-prompt-embeds",
-                                 **model_kwargs["enable_prompt_embeds"])
-        model_group.add_argument("--served-model-name",
-                                 **model_kwargs["served_model_name"])
-        model_group.add_argument("--config-format",
-                                 **model_kwargs["config_format"])
+        model_group.add_argument(
+            "--tokenizer-revision", **model_kwargs["tokenizer_revision"]
+        )
+        model_group.add_argument("--max-model-len", **model_kwargs["max_model_len"])
+        model_group.add_argument("--quantization", "-q", **model_kwargs["quantization"])
+        model_group.add_argument("--enforce-eager", **model_kwargs["enforce_eager"])
+        model_group.add_argument("--max-logprobs", **model_kwargs["max_logprobs"])
+        model_group.add_argument("--logprobs-mode", **model_kwargs["logprobs_mode"])
+        model_group.add_argument(
+            "--disable-sliding-window", **model_kwargs["disable_sliding_window"]
+        )
+        model_group.add_argument(
+            "--disable-cascade-attn", **model_kwargs["disable_cascade_attn"]
+        )
+        model_group.add_argument(
+            "--skip-tokenizer-init", **model_kwargs["skip_tokenizer_init"]
+        )
+        model_group.add_argument(
+            "--enable-prompt-embeds", **model_kwargs["enable_prompt_embeds"]
+        )
+        model_group.add_argument(
+            "--served-model-name", **model_kwargs["served_model_name"]
+        )
+        model_group.add_argument("--config-format", **model_kwargs["config_format"])
         # This one is a special case because it can bool
         # or str. TODO: Handle this in get_kwargs
-        model_group.add_argument("--hf-token",
-                                 type=str,
-                                 nargs="?",
-                                 const=True,
-                                 default=model_kwargs["hf_token"]["default"],
-                                 help=model_kwargs["hf_token"]["help"])
-        model_group.add_argument("--hf-overrides",
-                                 **model_kwargs["hf_overrides"])
-        model_group.add_argument("--pooler-config",
-                                 **model_kwargs["pooler_config"])
-        model_group.add_argument("--override-pooler-config",
-                                 **model_kwargs["override_pooler_config"],
-                                 deprecated=True)
-        model_group.add_argument("--logits-processor-pattern",
-                                 **model_kwargs["logits_processor_pattern"])
-        model_group.add_argument("--generation-config",
-                                 **model_kwargs["generation_config"])
-        model_group.add_argument("--override-generation-config",
-                                 **model_kwargs["override_generation_config"])
-        model_group.add_argument("--enable-sleep-mode",
-                                 **model_kwargs["enable_sleep_mode"])
+        model_group.add_argument(
+            "--hf-token",
+            type=str,
+            nargs="?",
+            const=True,
+            default=model_kwargs["hf_token"]["default"],
+            help=model_kwargs["hf_token"]["help"],
+        )
+        model_group.add_argument("--hf-overrides", **model_kwargs["hf_overrides"])
+        model_group.add_argument("--pooler-config", **model_kwargs["pooler_config"])
+        model_group.add_argument(
+            "--override-pooler-config",
+            **model_kwargs["override_pooler_config"],
+            deprecated=True,
+        )
+        model_group.add_argument(
+            "--logits-processor-pattern", **model_kwargs["logits_processor_pattern"]
+        )
+        model_group.add_argument(
+            "--generation-config", **model_kwargs["generation_config"]
+        )
+        model_group.add_argument(
+            "--override-generation-config", **model_kwargs["override_generation_config"]
+        )
+        model_group.add_argument(
+            "--enable-sleep-mode", **model_kwargs["enable_sleep_mode"]
+        )
         model_group.add_argument("--model-impl", **model_kwargs["model_impl"])
-        model_group.add_argument("--override-attention-dtype",
-                                 **model_kwargs["override_attention_dtype"])
-        model_group.add_argument("--logits-processors",
-                                 **model_kwargs["logits_processors"])
-        model_group.add_argument("--io-processor-plugin",
-                                 **model_kwargs["io_processor_plugin"])
+        model_group.add_argument(
+            "--override-attention-dtype", **model_kwargs["override_attention_dtype"]
+        )
+        model_group.add_argument(
+            "--logits-processors", **model_kwargs["logits_processors"]
+        )
+        model_group.add_argument(
+            "--io-processor-plugin", **model_kwargs["io_processor_plugin"]
+        )
 
         # Model loading arguments
         load_kwargs = get_kwargs(LoadConfig)
@@ -603,18 +648,18 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
             description=LoadConfig.__doc__,
         )
         load_group.add_argument("--load-format", **load_kwargs["load_format"])
-        load_group.add_argument("--download-dir",
-                                **load_kwargs["download_dir"])
-        load_group.add_argument("--safetensors-load-strategy",
-                                **load_kwargs["safetensors_load_strategy"])
-        load_group.add_argument("--model-loader-extra-config",
-                                **load_kwargs["model_loader_extra_config"])
-        load_group.add_argument("--ignore-patterns",
-                                **load_kwargs["ignore_patterns"])
-        load_group.add_argument("--use-tqdm-on-load",
-                                **load_kwargs["use_tqdm_on_load"])
-        load_group.add_argument('--pt-load-map-location',
-                                **load_kwargs["pt_load_map_location"])
+        load_group.add_argument("--download-dir", **load_kwargs["download_dir"])
+        load_group.add_argument(
+            "--safetensors-load-strategy", **load_kwargs["safetensors_load_strategy"]
+        )
+        load_group.add_argument(
+            "--model-loader-extra-config", **load_kwargs["model_loader_extra_config"]
+        )
+        load_group.add_argument("--ignore-patterns", **load_kwargs["ignore_patterns"])
+        load_group.add_argument("--use-tqdm-on-load", **load_kwargs["use_tqdm_on_load"])
+        load_group.add_argument(
+            "--pt-load-map-location", **load_kwargs["pt_load_map_location"]
+        )
 
         # Structured outputs arguments
         structured_outputs_kwargs = get_kwargs(StructuredOutputsConfig)
@@ -626,7 +671,8 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
             "--reasoning-parser",
             # This choice is a special case because it's not static
             choices=list(ReasoningParserManager.reasoning_parsers),
-            **structured_outputs_kwargs["reasoning_parser"])
+            **structured_outputs_kwargs["reasoning_parser"],
+        )
         # Deprecated guided decoding arguments
         for arg, type in [
             ("--guided-decoding-backend", str),
@@ -638,7 +684,8 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
                 arg,
                 type=type,
                 help=(f"[DEPRECATED] {arg} will be removed in v0.12.0."),
-                deprecated=True)
+                deprecated=True,
+            )
 
         # Parallel arguments
         parallel_kwargs = get_kwargs(ParallelConfig)
@@ -648,111 +695,128 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
         )
         parallel_group.add_argument(
             "--distributed-executor-backend",
-            **parallel_kwargs["distributed_executor_backend"])
+            **parallel_kwargs["distributed_executor_backend"],
+        )
         parallel_group.add_argument(
-            "--pipeline-parallel-size", "-pp",
-            **parallel_kwargs["pipeline_parallel_size"])
-        parallel_group.add_argument("--tensor-parallel-size", "-tp",
-                                    **parallel_kwargs["tensor_parallel_size"])
+            "--pipeline-parallel-size",
+            "-pp",
+            **parallel_kwargs["pipeline_parallel_size"],
+        )
         parallel_group.add_argument(
-            "--decode-context-parallel-size", "-dcp",
-            **parallel_kwargs["decode_context_parallel_size"])
-        parallel_group.add_argument("--data-parallel-size", "-dp",
-                                    **parallel_kwargs["data_parallel_size"])
+            "--tensor-parallel-size", "-tp", **parallel_kwargs["tensor_parallel_size"]
+        )
         parallel_group.add_argument(
-            '--data-parallel-rank',
-            '-dpn',
+            "--decode-context-parallel-size",
+            "-dcp",
+            **parallel_kwargs["decode_context_parallel_size"],
+        )
+        parallel_group.add_argument(
+            "--data-parallel-size", "-dp", **parallel_kwargs["data_parallel_size"]
+        )
+        parallel_group.add_argument(
+            "--data-parallel-rank",
+            "-dpn",
             type=int,
-            help='Data parallel rank of this instance. '
-            'When set, enables external load balancer mode.')
-        parallel_group.add_argument('--data-parallel-start-rank',
-                                    '-dpr',
-                                    type=int,
-                                    help='Starting data parallel rank '
-                                    'for secondary nodes.')
-        parallel_group.add_argument('--data-parallel-size-local',
-                                    '-dpl',
-                                    type=int,
-                                    help='Number of data parallel replicas '
-                                    'to run on this node.')
-        parallel_group.add_argument('--data-parallel-address',
-                                    '-dpa',
-                                    type=str,
-                                    help='Address of data parallel cluster '
-                                    'head-node.')
-        parallel_group.add_argument('--data-parallel-rpc-port',
-                                    '-dpp',
-                                    type=int,
-                                    help='Port for data parallel RPC '
-                                    'communication.')
-        parallel_group.add_argument('--data-parallel-backend',
-                                    '-dpb',
-                                    type=str,
-                                    default='mp',
-                                    help='Backend for data parallel, either '
-                                    '"mp" or "ray".')
+            help="Data parallel rank of this instance. "
+            "When set, enables external load balancer mode.",
+        )
         parallel_group.add_argument(
-            "--data-parallel-hybrid-lb",
-            **parallel_kwargs["data_parallel_hybrid_lb"])
+            "--data-parallel-start-rank",
+            "-dpr",
+            type=int,
+            help="Starting data parallel rank for secondary nodes.",
+        )
+        parallel_group.add_argument(
+            "--data-parallel-size-local",
+            "-dpl",
+            type=int,
+            help="Number of data parallel replicas to run on this node.",
+        )
+        parallel_group.add_argument(
+            "--data-parallel-address",
+            "-dpa",
+            type=str,
+            help="Address of data parallel cluster head-node.",
+        )
+        parallel_group.add_argument(
+            "--data-parallel-rpc-port",
+            "-dpp",
+            type=int,
+            help="Port for data parallel RPC communication.",
+        )
+        parallel_group.add_argument(
+            "--data-parallel-backend",
+            "-dpb",
+            type=str,
+            default="mp",
+            help='Backend for data parallel, either "mp" or "ray".',
+        )
         parallel_group.add_argument(
-            "--enable-expert-parallel",
-            **parallel_kwargs["enable_expert_parallel"])
-        parallel_group.add_argument("--enable-dbo",
-                                    **parallel_kwargs["enable_dbo"])
+            "--data-parallel-hybrid-lb", **parallel_kwargs["data_parallel_hybrid_lb"]
+        )
+        parallel_group.add_argument(
+            "--enable-expert-parallel", **parallel_kwargs["enable_expert_parallel"]
+        )
+        parallel_group.add_argument("--enable-dbo", **parallel_kwargs["enable_dbo"])
         parallel_group.add_argument(
             "--dbo-decode-token-threshold",
-            **parallel_kwargs["dbo_decode_token_threshold"])
+            **parallel_kwargs["dbo_decode_token_threshold"],
+        )
         parallel_group.add_argument(
             "--dbo-prefill-token-threshold",
-            **parallel_kwargs["dbo_prefill_token_threshold"])
-        parallel_group.add_argument("--enable-eplb",
-                                    **parallel_kwargs["enable_eplb"])
-        parallel_group.add_argument("--eplb-config",
-                                    **parallel_kwargs["eplb_config"])
+            **parallel_kwargs["dbo_prefill_token_threshold"],
+        )
+        parallel_group.add_argument("--enable-eplb", **parallel_kwargs["enable_eplb"])
+        parallel_group.add_argument("--eplb-config", **parallel_kwargs["eplb_config"])
         parallel_group.add_argument(
             "--expert-placement-strategy",
-            **parallel_kwargs["expert_placement_strategy"])
+            **parallel_kwargs["expert_placement_strategy"],
+        )
         parallel_group.add_argument(
             "--num-redundant-experts",
             type=int,
-            help=
-            "[DEPRECATED] --num-redundant-experts will be removed in v0.12.0.",
-            deprecated=True)
+            help="[DEPRECATED] --num-redundant-experts will be removed in v0.12.0.",
+            deprecated=True,
+        )
         parallel_group.add_argument(
             "--eplb-window-size",
             type=int,
             help="[DEPRECATED] --eplb-window-size will be removed in v0.12.0.",
-            deprecated=True)
+            deprecated=True,
+        )
         parallel_group.add_argument(
             "--eplb-step-interval",
             type=int,
-            help=
-            "[DEPRECATED] --eplb-step-interval will be removed in v0.12.0.",
-            deprecated=True)
+            help="[DEPRECATED] --eplb-step-interval will be removed in v0.12.0.",
+            deprecated=True,
+        )
         parallel_group.add_argument(
             "--eplb-log-balancedness",
             action=argparse.BooleanOptionalAction,
-            help=
-            "[DEPRECATED] --eplb-log-balancedness will be removed in v0.12.0.",
-            deprecated=True)
+            help="[DEPRECATED] --eplb-log-balancedness will be removed in v0.12.0.",
+            deprecated=True,
+        )
 
         parallel_group.add_argument(
             "--max-parallel-loading-workers",
-            **parallel_kwargs["max_parallel_loading_workers"])
+            **parallel_kwargs["max_parallel_loading_workers"],
+        )
         parallel_group.add_argument(
-            "--ray-workers-use-nsight",
-            **parallel_kwargs["ray_workers_use_nsight"])
+            "--ray-workers-use-nsight", **parallel_kwargs["ray_workers_use_nsight"]
+        )
         parallel_group.add_argument(
             "--disable-custom-all-reduce",
-            **parallel_kwargs["disable_custom_all_reduce"])
-        parallel_group.add_argument("--worker-cls",
-                                    **parallel_kwargs["worker_cls"])
-        parallel_group.add_argument("--worker-extension-cls",
-                                    **parallel_kwargs["worker_extension_cls"])
+            **parallel_kwargs["disable_custom_all_reduce"],
+        )
+        parallel_group.add_argument("--worker-cls", **parallel_kwargs["worker_cls"])
+        parallel_group.add_argument(
+            "--worker-extension-cls", **parallel_kwargs["worker_extension_cls"]
+        )
         parallel_group.add_argument(
             "--enable-multimodal-encoder-data-parallel",
             action="store_true",
-            deprecated=True)
+            deprecated=True,
+        )
 
         # KV cache arguments
         cache_kwargs = get_kwargs(CacheConfig)
@@ -761,29 +825,36 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
             description=CacheConfig.__doc__,
         )
         cache_group.add_argument("--block-size", **cache_kwargs["block_size"])
-        cache_group.add_argument("--gpu-memory-utilization",
-                                 **cache_kwargs["gpu_memory_utilization"])
-        cache_group.add_argument("--kv-cache-memory-bytes",
-                                 **cache_kwargs["kv_cache_memory_bytes"])
+        cache_group.add_argument(
+            "--gpu-memory-utilization", **cache_kwargs["gpu_memory_utilization"]
+        )
+        cache_group.add_argument(
+            "--kv-cache-memory-bytes", **cache_kwargs["kv_cache_memory_bytes"]
+        )
         cache_group.add_argument("--swap-space", **cache_kwargs["swap_space"])
-        cache_group.add_argument("--kv-cache-dtype",
-                                 **cache_kwargs["cache_dtype"])
-        cache_group.add_argument("--num-gpu-blocks-override",
-                                 **cache_kwargs["num_gpu_blocks_override"])
-        cache_group.add_argument("--enable-prefix-caching",
-                                 **cache_kwargs["enable_prefix_caching"])
-        cache_group.add_argument("--prefix-caching-hash-algo",
-                                 **cache_kwargs["prefix_caching_hash_algo"])
-        cache_group.add_argument("--cpu-offload-gb",
-                                 **cache_kwargs["cpu_offload_gb"])
-        cache_group.add_argument("--calculate-kv-scales",
-                                 **cache_kwargs["calculate_kv_scales"])
-        cache_group.add_argument("--kv-sharing-fast-prefill",
-                                 **cache_kwargs["kv_sharing_fast_prefill"])
-        cache_group.add_argument("--mamba-cache-dtype",
-                                 **cache_kwargs["mamba_cache_dtype"])
-        cache_group.add_argument("--mamba-ssm-cache-dtype",
-                                 **cache_kwargs["mamba_ssm_cache_dtype"])
+        cache_group.add_argument("--kv-cache-dtype", **cache_kwargs["cache_dtype"])
+        cache_group.add_argument(
+            "--num-gpu-blocks-override", **cache_kwargs["num_gpu_blocks_override"]
+        )
+        cache_group.add_argument(
+            "--enable-prefix-caching", **cache_kwargs["enable_prefix_caching"]
+        )
+        cache_group.add_argument(
+            "--prefix-caching-hash-algo", **cache_kwargs["prefix_caching_hash_algo"]
+        )
+        cache_group.add_argument("--cpu-offload-gb", **cache_kwargs["cpu_offload_gb"])
+        cache_group.add_argument(
+            "--calculate-kv-scales", **cache_kwargs["calculate_kv_scales"]
+        )
+        cache_group.add_argument(
+            "--kv-sharing-fast-prefill", **cache_kwargs["kv_sharing_fast_prefill"]
+        )
+        cache_group.add_argument(
+            "--mamba-cache-dtype", **cache_kwargs["mamba_cache_dtype"]
+        )
+        cache_group.add_argument(
+            "--mamba-ssm-cache-dtype", **cache_kwargs["mamba_ssm_cache_dtype"]
+        )
 
         # Multimodal related configs
         multimodal_kwargs = get_kwargs(MultiModalConfig)
@@ -791,35 +862,41 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
             title="MultiModalConfig",
             description=MultiModalConfig.__doc__,
         )
-        multimodal_group.add_argument("--limit-mm-per-prompt",
-                                      **multimodal_kwargs["limit_per_prompt"])
-        multimodal_group.add_argument("--media-io-kwargs",
-                                      **multimodal_kwargs["media_io_kwargs"])
         multimodal_group.add_argument(
-            "--mm-processor-kwargs",
-            **multimodal_kwargs["mm_processor_kwargs"])
+            "--limit-mm-per-prompt", **multimodal_kwargs["limit_per_prompt"]
+        )
+        multimodal_group.add_argument(
+            "--media-io-kwargs", **multimodal_kwargs["media_io_kwargs"]
+        )
+        multimodal_group.add_argument(
+            "--mm-processor-kwargs", **multimodal_kwargs["mm_processor_kwargs"]
+        )
+        multimodal_group.add_argument(
+            "--mm-processor-cache-gb", **multimodal_kwargs["mm_processor_cache_gb"]
+        )
         multimodal_group.add_argument(
-            "--mm-processor-cache-gb",
-            **multimodal_kwargs["mm_processor_cache_gb"])
-        multimodal_group.add_argument("--disable-mm-preprocessor-cache",
-                                      action="store_true",
-                                      deprecated=True)
+            "--disable-mm-preprocessor-cache", action="store_true", deprecated=True
+        )
         multimodal_group.add_argument(
-            "--mm-processor-cache-type",
-            **multimodal_kwargs["mm_processor_cache_type"])
+            "--mm-processor-cache-type", **multimodal_kwargs["mm_processor_cache_type"]
+        )
         multimodal_group.add_argument(
             "--mm-shm-cache-max-object-size-mb",
-            **multimodal_kwargs["mm_shm_cache_max_object_size_mb"])
+            **multimodal_kwargs["mm_shm_cache_max_object_size_mb"],
+        )
         multimodal_group.add_argument(
-            "--mm-encoder-tp-mode", **multimodal_kwargs["mm_encoder_tp_mode"])
+            "--mm-encoder-tp-mode", **multimodal_kwargs["mm_encoder_tp_mode"]
+        )
+        multimodal_group.add_argument(
+            "--interleave-mm-strings", **multimodal_kwargs["interleave_mm_strings"]
+        )
         multimodal_group.add_argument(
-            "--interleave-mm-strings",
-            **multimodal_kwargs["interleave_mm_strings"])
-        multimodal_group.add_argument("--skip-mm-profiling",
-                                      **multimodal_kwargs["skip_mm_profiling"])
+            "--skip-mm-profiling", **multimodal_kwargs["skip_mm_profiling"]
+        )
 
         multimodal_group.add_argument(
-            "--video-pruning-rate", **multimodal_kwargs["video_pruning_rate"])
+            "--video-pruning-rate", **multimodal_kwargs["video_pruning_rate"]
+        )
 
         # LoRA related configs
         lora_kwargs = get_kwargs(LoRAConfig)
@@ -830,24 +907,23 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
         lora_group.add_argument(
             "--enable-lora",
             action=argparse.BooleanOptionalAction,
-            help="If True, enable handling of LoRA adapters.")
-        lora_group.add_argument("--enable-lora-bias",
-                                **lora_kwargs["bias_enabled"])
+            help="If True, enable handling of LoRA adapters.",
+        )
+        lora_group.add_argument("--enable-lora-bias", **lora_kwargs["bias_enabled"])
         lora_group.add_argument("--max-loras", **lora_kwargs["max_loras"])
-        lora_group.add_argument("--max-lora-rank",
-                                **lora_kwargs["max_lora_rank"])
-        lora_group.add_argument("--lora-extra-vocab-size",
-                                **lora_kwargs["lora_extra_vocab_size"])
+        lora_group.add_argument("--max-lora-rank", **lora_kwargs["max_lora_rank"])
+        lora_group.add_argument(
+            "--lora-extra-vocab-size", **lora_kwargs["lora_extra_vocab_size"]
+        )
         lora_group.add_argument(
             "--lora-dtype",
             **lora_kwargs["lora_dtype"],
         )
-        lora_group.add_argument("--max-cpu-loras",
-                                **lora_kwargs["max_cpu_loras"])
-        lora_group.add_argument("--fully-sharded-loras",
-                                **lora_kwargs["fully_sharded_loras"])
-        lora_group.add_argument("--default-mm-loras",
-                                **lora_kwargs["default_mm_loras"])
+        lora_group.add_argument("--max-cpu-loras", **lora_kwargs["max_cpu_loras"])
+        lora_group.add_argument(
+            "--fully-sharded-loras", **lora_kwargs["fully_sharded_loras"]
+        )
+        lora_group.add_argument("--default-mm-loras", **lora_kwargs["default_mm_loras"])
 
         # Observability arguments
         observability_kwargs = get_kwargs(ObservabilityConfig)
@@ -857,21 +933,22 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
         )
         observability_group.add_argument(
             "--show-hidden-metrics-for-version",
-            **observability_kwargs["show_hidden_metrics_for_version"])
+            **observability_kwargs["show_hidden_metrics_for_version"],
+        )
         observability_group.add_argument(
-            "--otlp-traces-endpoint",
-            **observability_kwargs["otlp_traces_endpoint"])
+            "--otlp-traces-endpoint", **observability_kwargs["otlp_traces_endpoint"]
+        )
         # TODO: generalise this special case
         choices = observability_kwargs["collect_detailed_traces"]["choices"]
         metavar = f"{{{','.join(choices)}}}"
         observability_kwargs["collect_detailed_traces"]["metavar"] = metavar
         observability_kwargs["collect_detailed_traces"]["choices"] += [
-            ",".join(p)
-            for p in permutations(get_args(DetailedTraceModules), r=2)
+            ",".join(p) for p in permutations(get_args(DetailedTraceModules), r=2)
         ]
         observability_group.add_argument(
             "--collect-detailed-traces",
-            **observability_kwargs["collect_detailed_traces"])
+            **observability_kwargs["collect_detailed_traces"],
+        )
 
         # Scheduler arguments
         scheduler_kwargs = get_kwargs(SchedulerConfig)
@@ -880,40 +957,49 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
             description=SchedulerConfig.__doc__,
         )
         scheduler_group.add_argument(
-            "--max-num-batched-tokens",
-            **scheduler_kwargs["max_num_batched_tokens"])
-        scheduler_group.add_argument("--max-num-seqs",
-                                     **scheduler_kwargs["max_num_seqs"])
+            "--max-num-batched-tokens", **scheduler_kwargs["max_num_batched_tokens"]
+        )
         scheduler_group.add_argument(
-            "--max-num-partial-prefills",
-            **scheduler_kwargs["max_num_partial_prefills"])
+            "--max-num-seqs", **scheduler_kwargs["max_num_seqs"]
+        )
+        scheduler_group.add_argument(
+            "--max-num-partial-prefills", **scheduler_kwargs["max_num_partial_prefills"]
+        )
         scheduler_group.add_argument(
             "--max-long-partial-prefills",
-            **scheduler_kwargs["max_long_partial_prefills"])
-        scheduler_group.add_argument('--cuda-graph-sizes',
-                                     **scheduler_kwargs["cuda_graph_sizes"])
+            **scheduler_kwargs["max_long_partial_prefills"],
+        )
+        scheduler_group.add_argument(
+            "--cuda-graph-sizes", **scheduler_kwargs["cuda_graph_sizes"]
+        )
         scheduler_group.add_argument(
             "--long-prefill-token-threshold",
-            **scheduler_kwargs["long_prefill_token_threshold"])
-        scheduler_group.add_argument("--num-lookahead-slots",
-                                     **scheduler_kwargs["num_lookahead_slots"])
+            **scheduler_kwargs["long_prefill_token_threshold"],
+        )
+        scheduler_group.add_argument(
+            "--num-lookahead-slots", **scheduler_kwargs["num_lookahead_slots"]
+        )
         # multi-step scheduling has been removed; corresponding arguments
         # are no longer supported.
-        scheduler_group.add_argument("--scheduling-policy",
-                                     **scheduler_kwargs["policy"])
         scheduler_group.add_argument(
-            "--enable-chunked-prefill",
-            **scheduler_kwargs["enable_chunked_prefill"])
+            "--scheduling-policy", **scheduler_kwargs["policy"]
+        )
         scheduler_group.add_argument(
-            "--disable-chunked-mm-input",
-            **scheduler_kwargs["disable_chunked_mm_input"])
-        scheduler_group.add_argument("--scheduler-cls",
-                                     **scheduler_kwargs["scheduler_cls"])
+            "--enable-chunked-prefill", **scheduler_kwargs["enable_chunked_prefill"]
+        )
+        scheduler_group.add_argument(
+            "--disable-chunked-mm-input", **scheduler_kwargs["disable_chunked_mm_input"]
+        )
+        scheduler_group.add_argument(
+            "--scheduler-cls", **scheduler_kwargs["scheduler_cls"]
+        )
         scheduler_group.add_argument(
             "--disable-hybrid-kv-cache-manager",
-            **scheduler_kwargs["disable_hybrid_kv_cache_manager"])
-        scheduler_group.add_argument("--async-scheduling",
-                                     **scheduler_kwargs["async_scheduling"])
+            **scheduler_kwargs["disable_hybrid_kv_cache_manager"],
+        )
+        scheduler_group.add_argument(
+            "--async-scheduling", **scheduler_kwargs["async_scheduling"]
+        )
 
         # vLLM arguments
         vllm_kwargs = get_kwargs(VllmConfig)
@@ -925,23 +1011,29 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
         # create_engine_config. So we set the type to a JSON string here to
         # delay the Pydantic validation that comes with SpeculativeConfig.
         vllm_kwargs["speculative_config"]["type"] = optional_type(json.loads)
-        vllm_group.add_argument("--speculative-config",
-                                **vllm_kwargs["speculative_config"])
-        vllm_group.add_argument("--kv-transfer-config",
-                                **vllm_kwargs["kv_transfer_config"])
-        vllm_group.add_argument('--kv-events-config',
-                                **vllm_kwargs["kv_events_config"])
-        vllm_group.add_argument("--compilation-config", "-O",
-                                **vllm_kwargs["compilation_config"])
-        vllm_group.add_argument("--additional-config",
-                                **vllm_kwargs["additional_config"])
-        vllm_group.add_argument('--structured-outputs-config',
-                                **vllm_kwargs["structured_outputs_config"])
+        vllm_group.add_argument(
+            "--speculative-config", **vllm_kwargs["speculative_config"]
+        )
+        vllm_group.add_argument(
+            "--kv-transfer-config", **vllm_kwargs["kv_transfer_config"]
+        )
+        vllm_group.add_argument("--kv-events-config", **vllm_kwargs["kv_events_config"])
+        vllm_group.add_argument(
+            "--compilation-config", "-O", **vllm_kwargs["compilation_config"]
+        )
+        vllm_group.add_argument(
+            "--additional-config", **vllm_kwargs["additional_config"]
+        )
+        vllm_group.add_argument(
+            "--structured-outputs-config", **vllm_kwargs["structured_outputs_config"]
+        )
 
         # Other arguments
-        parser.add_argument('--disable-log-stats',
-                            action='store_true',
-                            help='Disable logging statistics.')
+        parser.add_argument(
+            "--disable-log-stats",
+            action="store_true",
+            help="Disable logging statistics.",
+        )
 
         return parser
 
@@ -950,10 +1042,9 @@ def from_cli_args(cls, args: argparse.Namespace):
         # Get the list of attributes of this dataclass.
         attrs = [attr.name for attr in dataclasses.fields(cls)]
         # Set the attributes from the parsed arguments.
-        engine_args = cls(**{
-            attr: getattr(args, attr)
-            for attr in attrs if hasattr(args, attr)
-        })
+        engine_args = cls(
+            **{attr: getattr(args, attr) for attr in attrs if hasattr(args, attr)}
+        )
         return engine_args
 
     def create_model_config(self) -> ModelConfig:
@@ -962,15 +1053,20 @@ def create_model_config(self) -> ModelConfig:
             self.quantization = self.load_format = "gguf"
 
         # NOTE: This is to allow model loading from S3 in CI
-        if (not isinstance(self, AsyncEngineArgs) and envs.VLLM_CI_USE_S3
-                and self.model in MODELS_ON_S3 and self.load_format == "auto"):
+        if (
+            not isinstance(self, AsyncEngineArgs)
+            and envs.VLLM_CI_USE_S3
+            and self.model in MODELS_ON_S3
+            and self.load_format == "auto"
+        ):
             self.model = f"{MODEL_WEIGHTS_S3_BUCKET}/{self.model}"
 
         if self.disable_mm_preprocessor_cache:
             logger.warning(
                 "`--disable-mm-preprocessor-cache` is deprecated "
                 "and will be removed in v0.13. "
-                "Please use `--mm-processor-cache-gb 0` instead.", )
+                "Please use `--mm-processor-cache-gb 0` instead.",
+            )
 
             self.mm_processor_cache_gb = 0
         elif envs.VLLM_MM_INPUT_CACHE_GIB != 4:
@@ -987,7 +1083,8 @@ def create_model_config(self) -> ModelConfig:
             logger.warning(
                 "--enable-multimodal-encoder-data-parallel` is deprecated "
                 "and will be removed in v0.13. "
-                "Please use `--mm-encoder-tp-mode data` instead.")
+                "Please use `--mm-encoder-tp-mode data` instead."
+            )
 
             self.mm_encoder_tp_mode = "data"
 
@@ -1029,8 +1126,7 @@ def create_model_config(self) -> ModelConfig:
             mm_processor_kwargs=self.mm_processor_kwargs,
             mm_processor_cache_gb=self.mm_processor_cache_gb,
             mm_processor_cache_type=self.mm_processor_cache_type,
-            mm_shm_cache_max_object_size_mb=self.
-            mm_shm_cache_max_object_size_mb,
+            mm_shm_cache_max_object_size_mb=self.mm_shm_cache_max_object_size_mb,
             mm_encoder_tp_mode=self.mm_encoder_tp_mode,
             pooler_config=self.pooler_config,
             override_pooler_config=self.override_pooler_config,
@@ -1046,33 +1142,34 @@ def create_model_config(self) -> ModelConfig:
         )
 
     def validate_tensorizer_args(self):
-        from vllm.model_executor.model_loader.tensorizer import (
-            TensorizerConfig)
+        from vllm.model_executor.model_loader.tensorizer import TensorizerConfig
+
         for key in self.model_loader_extra_config:
             if key in TensorizerConfig._fields:
-                self.model_loader_extra_config["tensorizer_config"][
-                    key] = self.model_loader_extra_config[key]
+                self.model_loader_extra_config["tensorizer_config"][key] = (
+                    self.model_loader_extra_config[key]
+                )
 
     def create_load_config(self) -> LoadConfig:
-
         if self.quantization == "bitsandbytes":
             self.load_format = "bitsandbytes"
 
         if self.load_format == "tensorizer":
             if hasattr(self.model_loader_extra_config, "to_serializable"):
                 self.model_loader_extra_config = (
-                    self.model_loader_extra_config.to_serializable())
+                    self.model_loader_extra_config.to_serializable()
+                )
             self.model_loader_extra_config["tensorizer_config"] = {}
-            self.model_loader_extra_config["tensorizer_config"][
-                "tensorizer_dir"] = self.model
+            self.model_loader_extra_config["tensorizer_config"]["tensorizer_dir"] = (
+                self.model
+            )
             self.validate_tensorizer_args()
 
         return LoadConfig(
             load_format=self.load_format,
             download_dir=self.download_dir,
             safetensors_load_strategy=self.safetensors_load_strategy,
-            device="cpu"
-            if is_online_quantization(self.quantization) else None,
+            device="cpu" if is_online_quantization(self.quantization) else None,
             model_loader_extra_config=self.model_loader_extra_config,
             ignore_patterns=self.ignore_patterns,
             use_tqdm_on_load=self.use_tqdm_on_load,
@@ -1100,12 +1197,14 @@ def create_speculative_config(
         # Note(Shangming): These parameters are not obtained from the cli arg
         # '--speculative-config' and must be passed in when creating the engine
         # config.
-        self.speculative_config.update({
-            "target_model_config": target_model_config,
-            "target_parallel_config": target_parallel_config,
-            "enable_chunked_prefill": enable_chunked_prefill,
-            "disable_log_stats": disable_log_stats,
-        })
+        self.speculative_config.update(
+            {
+                "target_model_config": target_model_config,
+                "target_parallel_config": target_parallel_config,
+                "enable_chunked_prefill": enable_chunked_prefill,
+                "disable_log_stats": disable_log_stats,
+            }
+        )
         return SpeculativeConfig(**self.speculative_config)
 
     def create_engine_config(
@@ -1128,21 +1227,21 @@ def create_engine_config(
         """
         current_platform.pre_register_and_update()
 
-        device_config = DeviceConfig(
-            device=cast(Device, current_platform.device_type))
+        device_config = DeviceConfig(device=cast(Device, current_platform.device_type))
 
         model_config = self.create_model_config()
         self.model = model_config.model
         self.tokenizer = model_config.tokenizer
 
-        (self.model, self.tokenizer,
-         self.speculative_config) = maybe_override_with_speculators(
-             model=self.model,
-             tokenizer=self.tokenizer,
-             revision=self.revision,
-             trust_remote_code=self.trust_remote_code,
-             vllm_speculative_config=self.speculative_config,
-         )
+        (self.model, self.tokenizer, self.speculative_config) = (
+            maybe_override_with_speculators(
+                model=self.model,
+                tokenizer=self.tokenizer,
+                revision=self.revision,
+                trust_remote_code=self.trust_remote_code,
+                vllm_speculative_config=self.speculative_config,
+            )
+        )
 
         # * If VLLM_USE_V1 is unset, we enable V1 for "supported features"
         #   and fall back to V0 for experimental or unsupported features.
@@ -1164,12 +1263,17 @@ def create_engine_config(
         # Set default arguments for V1 Engine.
         self._set_default_args(usage_context, model_config)
         # Disable chunked prefill for POWER (ppc64le)/ARM/s390x/RISCV CPUs in V1
-        if current_platform.is_cpu() and current_platform.get_cpu_architecture(
-        ) in (CpuArchEnum.POWERPC, CpuArchEnum.S390X, CpuArchEnum.ARM,
-              CpuArchEnum.RISCV):
-            logger.info("Chunked prefill is not supported for ARM and POWER, "
-                        "S390X and RISC-V CPUs; "
-                        "disabling it for V1 backend.")
+        if current_platform.is_cpu() and current_platform.get_cpu_architecture() in (
+            CpuArchEnum.POWERPC,
+            CpuArchEnum.S390X,
+            CpuArchEnum.ARM,
+            CpuArchEnum.RISCV,
+        ):
+            logger.info(
+                "Chunked prefill is not supported for ARM and POWER, "
+                "S390X and RISC-V CPUs; "
+                "disabling it for V1 backend."
+            )
             self.enable_chunked_prefill = False
         assert self.enable_chunked_prefill is not None
 
@@ -1185,8 +1289,7 @@ def create_engine_config(
         # because the world size does not change by dcp, it simply
         # reuses the GPUs of TP group, and split one TP group into
         # tp_size//dcp_size DCP groups.
-        assert self.tensor_parallel_size % self.decode_context_parallel_size \
-            == 0, (
+        assert self.tensor_parallel_size % self.decode_context_parallel_size == 0, (
             f"tp_size={self.tensor_parallel_size} must be divisible by"
             f"dcp_size={self.decode_context_parallel_size}."
         )
@@ -1215,6 +1318,7 @@ def create_engine_config(
             # of a Ray task, therefore we check is_ray_initialized()
             # as opposed to is_in_ray_actor().
             import ray
+
             ray_runtime_env = ray.get_runtime_context().runtime_env
             logger.info("Using ray runtime env: %s", ray_runtime_env)
 
@@ -1230,15 +1334,15 @@ def create_engine_config(
             placement_group = ray.util.get_current_placement_group()
 
         assert not headless or not self.data_parallel_hybrid_lb, (
-            "data_parallel_hybrid_lb is not applicable in "
-            "headless mode")
+            "data_parallel_hybrid_lb is not applicable in headless mode"
+        )
 
         data_parallel_external_lb = self.data_parallel_rank is not None
         # Local DP rank = 1, use pure-external LB.
         if data_parallel_external_lb:
             assert self.data_parallel_size_local in (1, None), (
-                "data_parallel_size_local must be 1 when data_parallel_rank "
-                "is set")
+                "data_parallel_size_local must be 1 when data_parallel_rank is set"
+            )
             data_parallel_size_local = 1
             # Use full external lb if we have local_size of 1.
             self.data_parallel_hybrid_lb = False
@@ -1261,8 +1365,8 @@ def create_engine_config(
             self.data_parallel_rank = self.data_parallel_start_rank or 0
         else:
             assert not self.data_parallel_hybrid_lb, (
-                "data_parallel_size_local must be set to use "
-                "data_parallel_hybrid_lb.")
+                "data_parallel_size_local must be set to use data_parallel_hybrid_lb."
+            )
 
             # Local DP size defaults to global DP size if not set.
             data_parallel_size_local = self.data_parallel_size
@@ -1273,39 +1377,46 @@ def create_engine_config(
             if self.data_parallel_backend == "ray":
                 host_ip = get_ip()
                 logger.info(
-                    "Using host IP %s as ray-based data parallel address",
-                    host_ip)
+                    "Using host IP %s as ray-based data parallel address", host_ip
+                )
                 data_parallel_address = host_ip
             else:
                 assert self.data_parallel_backend == "mp", (
                     "data_parallel_backend can only be ray or mp, got %s",
-                    self.data_parallel_backend)
+                    self.data_parallel_backend,
+                )
                 data_parallel_address = ParallelConfig.data_parallel_master_ip
         else:
             data_parallel_address = self.data_parallel_address
 
         # This port is only used when there are remote data parallel engines,
         # otherwise the local IPC transport is used.
-        data_parallel_rpc_port = self.data_parallel_rpc_port if (
+        data_parallel_rpc_port = (
             self.data_parallel_rpc_port
-            is not None) else ParallelConfig.data_parallel_rpc_port
+            if (self.data_parallel_rpc_port is not None)
+            else ParallelConfig.data_parallel_rpc_port
+        )
 
         if self.async_scheduling:
             # Async scheduling does not work with the uniprocess backend.
             if self.distributed_executor_backend is None:
                 self.distributed_executor_backend = "mp"
-                logger.info("Defaulting to mp-based distributed executor "
-                            "backend for async scheduling.")
+                logger.info(
+                    "Defaulting to mp-based distributed executor "
+                    "backend for async scheduling."
+                )
             if self.pipeline_parallel_size > 1:
-                raise ValueError("Async scheduling is not supported with "
-                                 "pipeline-parallel-size > 1.")
+                raise ValueError(
+                    "Async scheduling is not supported with pipeline-parallel-size > 1."
+                )
 
             # Currently, async scheduling does not support speculative decoding.
             # TODO(woosuk): Support it.
             if self.speculative_config is not None:
                 raise ValueError(
                     "Currently, speculative decoding is not supported with "
-                    "async scheduling.")
+                    "async scheduling."
+                )
 
         # Forward the deprecated CLI args to the EPLB config.
         if self.num_redundant_experts is not None:
@@ -1372,33 +1483,38 @@ def create_engine_config(
             disable_chunked_mm_input=self.disable_chunked_mm_input,
             is_multimodal_model=model_config.is_multimodal_model,
             is_encoder_decoder=model_config.is_encoder_decoder,
-            send_delta_data=(envs.VLLM_USE_RAY_SPMD_WORKER
-                             and parallel_config.use_ray),
+            send_delta_data=(envs.VLLM_USE_RAY_SPMD_WORKER and parallel_config.use_ray),
             policy=self.scheduling_policy,
             scheduler_cls=self.scheduler_cls,
             max_num_partial_prefills=self.max_num_partial_prefills,
             max_long_partial_prefills=self.max_long_partial_prefills,
             long_prefill_token_threshold=self.long_prefill_token_threshold,
-            disable_hybrid_kv_cache_manager=self.
-            disable_hybrid_kv_cache_manager,
+            disable_hybrid_kv_cache_manager=self.disable_hybrid_kv_cache_manager,
             async_scheduling=self.async_scheduling,
         )
 
         if not model_config.is_multimodal_model and self.default_mm_loras:
             raise ValueError(
                 "Default modality-specific LoRA(s) were provided for a "
-                "non multimodal model")
-
-        lora_config = LoRAConfig(
-            bias_enabled=self.enable_lora_bias,
-            max_lora_rank=self.max_lora_rank,
-            max_loras=self.max_loras,
-            default_mm_loras=self.default_mm_loras,
-            fully_sharded_loras=self.fully_sharded_loras,
-            lora_extra_vocab_size=self.lora_extra_vocab_size,
-            lora_dtype=self.lora_dtype,
-            max_cpu_loras=self.max_cpu_loras if self.max_cpu_loras
-            and self.max_cpu_loras > 0 else None) if self.enable_lora else None
+                "non multimodal model"
+            )
+
+        lora_config = (
+            LoRAConfig(
+                bias_enabled=self.enable_lora_bias,
+                max_lora_rank=self.max_lora_rank,
+                max_loras=self.max_loras,
+                default_mm_loras=self.default_mm_loras,
+                fully_sharded_loras=self.fully_sharded_loras,
+                lora_extra_vocab_size=self.lora_extra_vocab_size,
+                lora_dtype=self.lora_dtype,
+                max_cpu_loras=self.max_cpu_loras
+                if self.max_cpu_loras and self.max_cpu_loras > 0
+                else None,
+            )
+            if self.enable_lora
+            else None
+        )
 
         # bitsandbytes pre-quantized model need a specific model loader
         if model_config.quantization == "bitsandbytes":
@@ -1408,27 +1524,27 @@ def create_engine_config(
 
         # Pass reasoning_parser into StructuredOutputsConfig
         if self.reasoning_parser:
-            self.structured_outputs_config.reasoning_parser = \
-                self.reasoning_parser
+            self.structured_outputs_config.reasoning_parser = self.reasoning_parser
 
         # Forward the deprecated CLI args to the StructuredOutputsConfig
         so_config = self.structured_outputs_config
         if self.guided_decoding_backend is not None:
-            so_config.guided_decoding_backend = \
-            self.guided_decoding_backend
+            so_config.guided_decoding_backend = self.guided_decoding_backend
         if self.guided_decoding_disable_fallback is not None:
-            so_config.guided_decoding_disable_fallback = \
-            self.guided_decoding_disable_fallback
+            so_config.guided_decoding_disable_fallback = (
+                self.guided_decoding_disable_fallback
+            )
         if self.guided_decoding_disable_any_whitespace is not None:
-            so_config.guided_decoding_disable_any_whitespace = \
-            self.guided_decoding_disable_any_whitespace
+            so_config.guided_decoding_disable_any_whitespace = (
+                self.guided_decoding_disable_any_whitespace
+            )
         if self.guided_decoding_disable_additional_properties is not None:
-            so_config.guided_decoding_disable_additional_properties = \
-            self.guided_decoding_disable_additional_properties
+            so_config.guided_decoding_disable_additional_properties = (
+                self.guided_decoding_disable_additional_properties
+            )
 
         observability_config = ObservabilityConfig(
-            show_hidden_metrics_for_version=(
-                self.show_hidden_metrics_for_version),
+            show_hidden_metrics_for_version=(self.show_hidden_metrics_for_version),
             otlp_traces_endpoint=self.otlp_traces_endpoint,
             collect_detailed_traces=self.collect_detailed_traces,
         )
@@ -1458,25 +1574,28 @@ def _is_v1_supported_oracle(self, model_config: ModelConfig) -> bool:
         #############################################################
         # Unsupported Feature Flags on V1.
 
-        if (self.logits_processor_pattern
-                != EngineArgs.logits_processor_pattern):
-            _raise_or_fallback(feature_name="--logits-processor-pattern",
-                               recommend_to_remove=False)
+        if self.logits_processor_pattern != EngineArgs.logits_processor_pattern:
+            _raise_or_fallback(
+                feature_name="--logits-processor-pattern", recommend_to_remove=False
+            )
             return False
 
         # No Mamba or Encoder-Decoder so far.
         if not model_config.is_v1_compatible:
-            _raise_or_fallback(feature_name=model_config.architectures,
-                               recommend_to_remove=False)
+            _raise_or_fallback(
+                feature_name=model_config.architectures, recommend_to_remove=False
+            )
             return False
 
         # No Concurrent Partial Prefills so far.
-        if (self.max_num_partial_prefills
-                != SchedulerConfig.max_num_partial_prefills
-                or self.max_long_partial_prefills
-                != SchedulerConfig.max_long_partial_prefills):
-            _raise_or_fallback(feature_name="Concurrent Partial Prefill",
-                               recommend_to_remove=False)
+        if (
+            self.max_num_partial_prefills != SchedulerConfig.max_num_partial_prefills
+            or self.max_long_partial_prefills
+            != SchedulerConfig.max_long_partial_prefills
+        ):
+            _raise_or_fallback(
+                feature_name="Concurrent Partial Prefill", recommend_to_remove=False
+            )
             return False
 
         # V1 supports N-gram, Medusa, and Eagle speculative decoding.
@@ -1491,7 +1610,8 @@ def _is_v1_supported_oracle(self, model_config: ModelConfig) -> bool:
                 raise NotImplementedError(
                     "Draft model speculative decoding is not supported yet. "
                     "Please consider using other speculative decoding methods "
-                    "such as ngram, medusa, eagle, or mtp.")
+                    "such as ngram, medusa, eagle, or mtp."
+                )
 
         V1_BACKENDS = [
             "FLASH_ATTN",
@@ -1510,8 +1630,10 @@ def _is_v1_supported_oracle(self, model_config: ModelConfig) -> bool:
             "XFORMERS",
             "ROCM_ATTN",
         ]
-        if (envs.is_set("VLLM_ATTENTION_BACKEND")
-                and envs.VLLM_ATTENTION_BACKEND not in V1_BACKENDS):
+        if (
+            envs.is_set("VLLM_ATTENTION_BACKEND")
+            and envs.VLLM_ATTENTION_BACKEND not in V1_BACKENDS
+        ):
             name = f"VLLM_ATTENTION_BACKEND={envs.VLLM_ATTENTION_BACKEND}"
             _raise_or_fallback(feature_name=name, recommend_to_remove=True)
             return False
@@ -1520,30 +1642,36 @@ def _is_v1_supported_oracle(self, model_config: ModelConfig) -> bool:
         # Experimental Features - allow users to opt in.
 
         if self.pipeline_parallel_size > 1:
-            supports_pp = getattr(self.distributed_executor_backend,
-                                  'supports_pp', False)
+            supports_pp = getattr(
+                self.distributed_executor_backend, "supports_pp", False
+            )
             if not supports_pp and self.distributed_executor_backend not in (
-                    ParallelConfig.distributed_executor_backend, "ray", "mp",
-                    "external_launcher"):
-                name = "Pipeline Parallelism without Ray distributed " \
-                        "executor or multiprocessing executor or external " \
-                        "launcher"
-                _raise_or_fallback(feature_name=name,
-                                   recommend_to_remove=False)
+                ParallelConfig.distributed_executor_backend,
+                "ray",
+                "mp",
+                "external_launcher",
+            ):
+                name = (
+                    "Pipeline Parallelism without Ray distributed "
+                    "executor or multiprocessing executor or external "
+                    "launcher"
+                )
+                _raise_or_fallback(feature_name=name, recommend_to_remove=False)
                 return False
 
-        if (current_platform.is_cpu()
-                and model_config.get_sliding_window() is not None):
-            _raise_or_fallback(feature_name="sliding window (CPU backend)",
-                               recommend_to_remove=False)
+        if current_platform.is_cpu() and model_config.get_sliding_window() is not None:
+            _raise_or_fallback(
+                feature_name="sliding window (CPU backend)", recommend_to_remove=False
+            )
             return False
 
         #############################################################
 
         return True
 
-    def _set_default_args(self, usage_context: UsageContext,
-                          model_config: ModelConfig) -> None:
+    def _set_default_args(
+        self, usage_context: UsageContext, model_config: ModelConfig
+    ) -> None:
         """Set Default Arguments for V1 Engine."""
 
         # V1 always uses chunked prefills and prefix caching
@@ -1554,12 +1682,12 @@ def _set_default_args(self, usage_context: UsageContext,
 
             # TODO: When prefix caching supports prompt embeds inputs, this
             # check can be removed.
-            if (self.enable_prompt_embeds
-                    and self.enable_prefix_caching is not False):
+            if self.enable_prompt_embeds and self.enable_prefix_caching is not False:
                 logger.warning(
                     "--enable-prompt-embeds and --enable-prefix-caching "
                     "are not supported together in V1. Prefix caching has "
-                    "been disabled.")
+                    "been disabled."
+                )
                 self.enable_prefix_caching = False
 
             if self.enable_prefix_caching is None:
@@ -1570,15 +1698,15 @@ def _set_default_args(self, usage_context: UsageContext,
                 else:
                     self.enable_prefix_caching = True
         else:
-
             pooling_type = model_config.pooler_config.pooling_type
             is_causal = getattr(model_config.hf_config, "is_causal", True)
-            incremental_prefill_supported = (pooling_type is not None
-                                             and pooling_type.lower() == "last"
-                                             and is_causal)
+            incremental_prefill_supported = (
+                pooling_type is not None
+                and pooling_type.lower() == "last"
+                and is_causal
+            )
 
-            action = "Enabling" if \
-                incremental_prefill_supported else "Disabling"
+            action = "Enabling" if incremental_prefill_supported else "Disabling"
 
             if self.enable_chunked_prefill is None:
                 self.enable_chunked_prefill = incremental_prefill_supported
@@ -1612,6 +1740,7 @@ def _set_default_args(self, usage_context: UsageContext,
         # throughput, see PR #17885 for more details.
         # So here we do an extra device name check to prevent such regression.
         from vllm.usage.usage_lib import UsageContext
+
         if device_memory >= 70 * GiB_bytes and "a100" not in device_name:
             # For GPUs like H100 and MI300x, use larger default values.
             default_max_num_batched_tokens = {
@@ -1637,15 +1766,15 @@ def _set_default_args(self, usage_context: UsageContext,
         if current_platform.is_tpu():
             default_max_num_batched_tokens_tpu = {
                 UsageContext.LLM_CLASS: {
-                    'V6E': 2048,
-                    'V5E': 1024,
-                    'V5P': 512,
+                    "V6E": 2048,
+                    "V5E": 1024,
+                    "V5P": 512,
                 },
                 UsageContext.OPENAI_API_SERVER: {
-                    'V6E': 1024,
-                    'V5E': 512,
-                    'V5P': 256,
-                }
+                    "V6E": 1024,
+                    "V5E": 512,
+                    "V5P": 256,
+                },
             }
 
         # cpu specific default values.
@@ -1661,47 +1790,58 @@ def _set_default_args(self, usage_context: UsageContext,
             }
 
         use_context_value = usage_context.value if usage_context else None
-        if (self.max_num_batched_tokens is None
-                and usage_context in default_max_num_batched_tokens):
+        if (
+            self.max_num_batched_tokens is None
+            and usage_context in default_max_num_batched_tokens
+        ):
             if current_platform.is_tpu():
                 chip_name = current_platform.get_device_name()
-                if chip_name in default_max_num_batched_tokens_tpu[
-                        usage_context]:
-                    self.max_num_batched_tokens = \
-                        default_max_num_batched_tokens_tpu[
-                            usage_context][chip_name]
+                if chip_name in default_max_num_batched_tokens_tpu[usage_context]:
+                    self.max_num_batched_tokens = default_max_num_batched_tokens_tpu[
+                        usage_context
+                    ][chip_name]
                 else:
-                    self.max_num_batched_tokens = \
-                        default_max_num_batched_tokens[usage_context]
+                    self.max_num_batched_tokens = default_max_num_batched_tokens[
+                        usage_context
+                    ]
             else:
                 if not self.enable_chunked_prefill:
                     self.max_num_batched_tokens = model_config.max_model_len
                 else:
-                    self.max_num_batched_tokens = \
-                        default_max_num_batched_tokens[usage_context]
+                    self.max_num_batched_tokens = default_max_num_batched_tokens[
+                        usage_context
+                    ]
             logger.debug(
                 "Setting max_num_batched_tokens to %d for %s usage context.",
-                self.max_num_batched_tokens, use_context_value)
+                self.max_num_batched_tokens,
+                use_context_value,
+            )
 
-        if (self.max_num_seqs is None
-                and usage_context in default_max_num_seqs):
-            self.max_num_seqs = min(default_max_num_seqs[usage_context],
-                                    self.max_num_batched_tokens or sys.maxsize)
+        if self.max_num_seqs is None and usage_context in default_max_num_seqs:
+            self.max_num_seqs = min(
+                default_max_num_seqs[usage_context],
+                self.max_num_batched_tokens or sys.maxsize,
+            )
 
-            logger.debug("Setting max_num_seqs to %d for %s usage context.",
-                         self.max_num_seqs, use_context_value)
+            logger.debug(
+                "Setting max_num_seqs to %d for %s usage context.",
+                self.max_num_seqs,
+                use_context_value,
+            )
 
 
 @dataclass
 class AsyncEngineArgs(EngineArgs):
     """Arguments for asynchronous vLLM engine."""
+
     enable_log_requests: bool = False
 
     @property
     @deprecated(
         "`disable_log_requests` is deprecated and has been replaced with "
         "`enable_log_requests`. This will be removed in v0.12.0. Please use "
-        "`enable_log_requests` instead.")
+        "`enable_log_requests` instead."
+    )
     def disable_log_requests(self) -> bool:
         return not self.enable_log_requests
 
@@ -1709,28 +1849,34 @@ def disable_log_requests(self) -> bool:
     @deprecated(
         "`disable_log_requests` is deprecated and has been replaced with "
         "`enable_log_requests`. This will be removed in v0.12.0. Please use "
-        "`enable_log_requests` instead.")
+        "`enable_log_requests` instead."
+    )
     def disable_log_requests(self, value: bool):
         self.enable_log_requests = not value
 
     @staticmethod
-    def add_cli_args(parser: FlexibleArgumentParser,
-                     async_args_only: bool = False) -> FlexibleArgumentParser:
+    def add_cli_args(
+        parser: FlexibleArgumentParser, async_args_only: bool = False
+    ) -> FlexibleArgumentParser:
         # Initialize plugin to update the parser, for example, The plugin may
         # add a new kind of quantization method to --quantization argument or
         # a new device to --device argument.
         load_general_plugins()
         if not async_args_only:
             parser = EngineArgs.add_cli_args(parser)
-        parser.add_argument('--enable-log-requests',
-                            action=argparse.BooleanOptionalAction,
-                            default=AsyncEngineArgs.enable_log_requests,
-                            help='Enable logging requests.')
-        parser.add_argument('--disable-log-requests',
-                            action=argparse.BooleanOptionalAction,
-                            default=not AsyncEngineArgs.enable_log_requests,
-                            help='[DEPRECATED] Disable logging requests.',
-                            deprecated=True)
+        parser.add_argument(
+            "--enable-log-requests",
+            action=argparse.BooleanOptionalAction,
+            default=AsyncEngineArgs.enable_log_requests,
+            help="Enable logging requests.",
+        )
+        parser.add_argument(
+            "--disable-log-requests",
+            action=argparse.BooleanOptionalAction,
+            default=not AsyncEngineArgs.enable_log_requests,
+            help="[DEPRECATED] Disable logging requests.",
+            deprecated=True,
+        )
         current_platform.pre_register_and_update(parser)
         return parser
 
@@ -1738,7 +1884,8 @@ def add_cli_args(parser: FlexibleArgumentParser,
 def _raise_or_fallback(feature_name: str, recommend_to_remove: bool):
     if envs.is_set("VLLM_USE_V1") and envs.VLLM_USE_V1:
         raise NotImplementedError(
-            f"VLLM_USE_V1=1 is not supported with {feature_name}.")
+            f"VLLM_USE_V1=1 is not supported with {feature_name}."
+        )
     msg = f"{feature_name} is not supported by the V1 Engine. "
     msg += "Falling back to V0. "
     if recommend_to_remove:
@@ -1757,17 +1904,17 @@ def human_readable_int(value):
     - '25.6k' -> 25,600
     """
     value = value.strip()
-    match = re.fullmatch(r'(\d+(?:\.\d+)?)([kKmMgGtT])', value)
+    match = re.fullmatch(r"(\d+(?:\.\d+)?)([kKmMgGtT])", value)
     if match:
         decimal_multiplier = {
-            'k': 10**3,
-            'm': 10**6,
-            'g': 10**9,
+            "k": 10**3,
+            "m": 10**6,
+            "g": 10**9,
         }
         binary_multiplier = {
-            'K': 2**10,
-            'M': 2**20,
-            'G': 2**30,
+            "K": 2**10,
+            "M": 2**20,
+            "G": 2**30,
         }
 
         number, suffix = match.groups()
@@ -1780,9 +1927,11 @@ def human_readable_int(value):
             try:
                 return int(number) * mult
             except ValueError as e:
-                raise argparse.ArgumentTypeError("Decimals are not allowed " \
-                f"with binary suffixes like {suffix}. Did you mean to use " \
-                f"{number}{suffix.lower()} instead?") from e
+                raise argparse.ArgumentTypeError(
+                    "Decimals are not allowed "
+                    f"with binary suffixes like {suffix}. Did you mean to use "
+                    f"{number}{suffix.lower()} instead?"
+                ) from e
 
     # Regular plain number.
     return int(value)
diff --git a/vllm/engine/metrics.py b/vllm/engine/metrics.py
index 2762175c430f..2f48a0d62218 100644
--- a/vllm/engine/metrics.py
+++ b/vllm/engine/metrics.py
@@ -2,7 +2,7 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 import time
-from typing import Counter as CollectionsCounter
+from collections import Counter as CollectionsCounter
 from typing import Dict, List, Optional, Type, Union, cast
 
 import numpy as np
@@ -51,8 +51,7 @@ def __init__(self, labelnames: List[str], vllm_config: VllmConfig):
 
         # Use this flag to hide metrics that were deprecated in
         # a previous release and which will be removed future
-        self.show_hidden_metrics = \
-            vllm_config.observability_config.show_hidden_metrics
+        self.show_hidden_metrics = vllm_config.observability_config.show_hidden_metrics
 
         # System stats
         #   Scheduler State
@@ -60,12 +59,14 @@ def __init__(self, labelnames: List[str], vllm_config: VllmConfig):
             name="vllm:num_requests_running",
             documentation="Number of requests currently running on GPU.",
             labelnames=labelnames,
-            multiprocess_mode="sum")
+            multiprocess_mode="sum",
+        )
         self.gauge_scheduler_waiting = self._gauge_cls(
             name="vllm:num_requests_waiting",
             documentation="Number of requests waiting to be processed.",
             labelnames=labelnames,
-            multiprocess_mode="sum")
+            multiprocess_mode="sum",
+        )
         self.gauge_lora_info = self._gauge_cls(
             name="vllm:lora_requests_info",
             documentation="Running stats on lora requests.",
@@ -82,93 +83,173 @@ def __init__(self, labelnames: List[str], vllm_config: VllmConfig):
             name="vllm:gpu_cache_usage_perc",
             documentation="GPU KV-cache usage. 1 means 100 percent usage.",
             labelnames=labelnames,
-            multiprocess_mode="sum")
+            multiprocess_mode="sum",
+        )
 
         # Iteration stats
         self.counter_num_preemption = self._counter_cls(
             name="vllm:num_preemptions_total",
             documentation="Cumulative number of preemption from the engine.",
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.counter_prompt_tokens = self._counter_cls(
             name="vllm:prompt_tokens_total",
             documentation="Number of prefill tokens processed.",
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.counter_generation_tokens = self._counter_cls(
             name="vllm:generation_tokens_total",
             documentation="Number of generation tokens processed.",
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.histogram_iteration_tokens = self._histogram_cls(
             name="vllm:iteration_tokens_total",
             documentation="Histogram of number of tokens per engine_step.",
             labelnames=labelnames,
-            buckets=[
-                1, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096, 8192, 16384
-            ])
+            buckets=[1, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096, 8192, 16384],
+        )
         self.histogram_time_to_first_token = self._histogram_cls(
             name="vllm:time_to_first_token_seconds",
             documentation="Histogram of time to first token in seconds.",
             labelnames=labelnames,
             buckets=[
-                0.001, 0.005, 0.01, 0.02, 0.04, 0.06, 0.08, 0.1, 0.25, 0.5,
-                0.75, 1.0, 2.5, 5.0, 7.5, 10.0, 20.0, 40.0, 80.0, 160.0, 640.0,
-                2560.0
-            ])
+                0.001,
+                0.005,
+                0.01,
+                0.02,
+                0.04,
+                0.06,
+                0.08,
+                0.1,
+                0.25,
+                0.5,
+                0.75,
+                1.0,
+                2.5,
+                5.0,
+                7.5,
+                10.0,
+                20.0,
+                40.0,
+                80.0,
+                160.0,
+                640.0,
+                2560.0,
+            ],
+        )
         # Deprecated in 0.11 - Renamed as vllm:inter_token_latency_seconds
         # TODO: in 0.12, only enable if show_hidden_metrics=True
         self.histogram_time_per_output_token = self._histogram_cls(
             name="vllm:time_per_output_token_seconds",
             documentation=(
                 "Histogram of time per output token in seconds."
-                "DEPRECATED: Use vllm:inter_token_latency_seconds instead."),
+                "DEPRECATED: Use vllm:inter_token_latency_seconds instead."
+            ),
             labelnames=labelnames,
             buckets=[
-                0.01, 0.025, 0.05, 0.075, 0.1, 0.15, 0.2, 0.3, 0.4, 0.5, 0.75,
-                1.0, 2.5, 5.0, 7.5, 10.0, 20.0, 40.0, 80.0
-            ])
+                0.01,
+                0.025,
+                0.05,
+                0.075,
+                0.1,
+                0.15,
+                0.2,
+                0.3,
+                0.4,
+                0.5,
+                0.75,
+                1.0,
+                2.5,
+                5.0,
+                7.5,
+                10.0,
+                20.0,
+                40.0,
+                80.0,
+            ],
+        )
         self.histogram_inter_token_latency = self._histogram_cls(
             name="vllm:inter_token_latency_seconds",
             documentation="Histogram of inter token latency in seconds.",
             labelnames=labelnames,
             buckets=[
-                0.01, 0.025, 0.05, 0.075, 0.1, 0.15, 0.2, 0.3, 0.4, 0.5, 0.75,
-                1.0, 2.5, 5.0, 7.5, 10.0, 20.0, 40.0, 80.0
-            ])
+                0.01,
+                0.025,
+                0.05,
+                0.075,
+                0.1,
+                0.15,
+                0.2,
+                0.3,
+                0.4,
+                0.5,
+                0.75,
+                1.0,
+                2.5,
+                5.0,
+                7.5,
+                10.0,
+                20.0,
+                40.0,
+                80.0,
+            ],
+        )
 
         # Request stats
         #   Latency
         request_latency_buckets = [
-            0.3, 0.5, 0.8, 1.0, 1.5, 2.0, 2.5, 5.0, 10.0, 15.0, 20.0, 30.0,
-            40.0, 50.0, 60.0, 120.0, 240.0, 480.0, 960.0, 1920.0, 7680.0
+            0.3,
+            0.5,
+            0.8,
+            1.0,
+            1.5,
+            2.0,
+            2.5,
+            5.0,
+            10.0,
+            15.0,
+            20.0,
+            30.0,
+            40.0,
+            50.0,
+            60.0,
+            120.0,
+            240.0,
+            480.0,
+            960.0,
+            1920.0,
+            7680.0,
         ]
         self.histogram_e2e_time_request = self._histogram_cls(
             name="vllm:e2e_request_latency_seconds",
             documentation="Histogram of end to end request latency in seconds.",
             labelnames=labelnames,
-            buckets=request_latency_buckets)
+            buckets=request_latency_buckets,
+        )
         self.histogram_queue_time_request = self._histogram_cls(
             name="vllm:request_queue_time_seconds",
-            documentation=
-            "Histogram of time spent in WAITING phase for request.",
+            documentation="Histogram of time spent in WAITING phase for request.",
             labelnames=labelnames,
-            buckets=request_latency_buckets)
+            buckets=request_latency_buckets,
+        )
         self.histogram_inference_time_request = self._histogram_cls(
             name="vllm:request_inference_time_seconds",
-            documentation=
-            "Histogram of time spent in RUNNING phase for request.",
+            documentation="Histogram of time spent in RUNNING phase for request.",
             labelnames=labelnames,
-            buckets=request_latency_buckets)
+            buckets=request_latency_buckets,
+        )
         self.histogram_prefill_time_request = self._histogram_cls(
             name="vllm:request_prefill_time_seconds",
-            documentation=
-            "Histogram of time spent in PREFILL phase for request.",
+            documentation="Histogram of time spent in PREFILL phase for request.",
             labelnames=labelnames,
-            buckets=request_latency_buckets)
+            buckets=request_latency_buckets,
+        )
         self.histogram_decode_time_request = self._histogram_cls(
             name="vllm:request_decode_time_seconds",
-            documentation=
-            "Histogram of time spent in DECODE phase for request.",
+            documentation="Histogram of time spent in DECODE phase for request.",
             labelnames=labelnames,
-            buckets=request_latency_buckets)
+            buckets=request_latency_buckets,
+        )
 
         #   Metadata
         self.histogram_num_prompt_tokens_request = self._histogram_cls(
@@ -177,19 +258,18 @@ def __init__(self, labelnames: List[str], vllm_config: VllmConfig):
             labelnames=labelnames,
             buckets=build_1_2_5_buckets(max_model_len),
         )
-        self.histogram_num_generation_tokens_request = \
-            self._histogram_cls(
-                name="vllm:request_generation_tokens",
-                documentation="Number of generation tokens processed.",
-                labelnames=labelnames,
-                buckets=build_1_2_5_buckets(max_model_len),
-            )
+        self.histogram_num_generation_tokens_request = self._histogram_cls(
+            name="vllm:request_generation_tokens",
+            documentation="Number of generation tokens processed.",
+            labelnames=labelnames,
+            buckets=build_1_2_5_buckets(max_model_len),
+        )
         self.histogram_max_num_generation_tokens_request = self._histogram_cls(
             name="vllm:request_max_num_generation_tokens",
-            documentation=
-            "Histogram of maximum number of requested generation tokens.",
+            documentation="Histogram of maximum number of requested generation tokens.",
             labelnames=labelnames,
-            buckets=build_1_2_5_buckets(max_model_len))
+            buckets=build_1_2_5_buckets(max_model_len),
+        )
         self.histogram_n_request = self._histogram_cls(
             name="vllm:request_params_n",
             documentation="Histogram of the n request parameter.",
@@ -205,10 +285,10 @@ def __init__(self, labelnames: List[str], vllm_config: VllmConfig):
         self.counter_request_success = self._counter_cls(
             name="vllm:request_success_total",
             documentation="Count of successfully processed requests.",
-            labelnames=labelnames + [Metrics.labelname_finish_reason])
-
+            labelnames=labelnames + [Metrics.labelname_finish_reason],
+        )
 
-# --8<-- [end:metrics-definitions]
+    # --8<-- [end:metrics-definitions]
 
     def _unregister_vllm_metrics(self) -> None:
         for collector in list(prometheus_client.REGISTRY._collector_to_names):
@@ -220,16 +300,18 @@ class _RayGaugeWrapper:
     """Wraps around ray.util.metrics.Gauge to provide same API as
     prometheus_client.Gauge"""
 
-    def __init__(self,
-                 name: str,
-                 documentation: str = "",
-                 labelnames: Optional[List[str]] = None,
-                 multiprocess_mode: str = ""):
+    def __init__(
+        self,
+        name: str,
+        documentation: str = "",
+        labelnames: Optional[List[str]] = None,
+        multiprocess_mode: str = "",
+    ):
         del multiprocess_mode
         labelnames_tuple = tuple(labelnames) if labelnames else None
-        self._gauge = ray_metrics.Gauge(name=name,
-                                        description=documentation,
-                                        tag_keys=labelnames_tuple)
+        self._gauge = ray_metrics.Gauge(
+            name=name, description=documentation, tag_keys=labelnames_tuple
+        )
 
     def labels(self, **labels):
         self._gauge.set_default_tags(labels)
@@ -247,14 +329,13 @@ class _RayCounterWrapper:
     """Wraps around ray.util.metrics.Counter to provide same API as
     prometheus_client.Counter"""
 
-    def __init__(self,
-                 name: str,
-                 documentation: str = "",
-                 labelnames: Optional[List[str]] = None):
+    def __init__(
+        self, name: str, documentation: str = "", labelnames: Optional[List[str]] = None
+    ):
         labelnames_tuple = tuple(labelnames) if labelnames else None
-        self._counter = ray_metrics.Counter(name=name,
-                                            description=documentation,
-                                            tag_keys=labelnames_tuple)
+        self._counter = ray_metrics.Counter(
+            name=name, description=documentation, tag_keys=labelnames_tuple
+        )
 
     def labels(self, **labels):
         self._counter.set_default_tags(labels)
@@ -270,17 +351,21 @@ class _RayHistogramWrapper:
     """Wraps around ray.util.metrics.Histogram to provide same API as
     prometheus_client.Histogram"""
 
-    def __init__(self,
-                 name: str,
-                 documentation: str = "",
-                 labelnames: Optional[List[str]] = None,
-                 buckets: Optional[List[float]] = None):
+    def __init__(
+        self,
+        name: str,
+        documentation: str = "",
+        labelnames: Optional[List[str]] = None,
+        buckets: Optional[List[float]] = None,
+    ):
         labelnames_tuple = tuple(labelnames) if labelnames else None
         boundaries = buckets if buckets else []
-        self._histogram = ray_metrics.Histogram(name=name,
-                                                description=documentation,
-                                                tag_keys=labelnames_tuple,
-                                                boundaries=boundaries)
+        self._histogram = ray_metrics.Histogram(
+            name=name,
+            description=documentation,
+            tag_keys=labelnames_tuple,
+            boundaries=boundaries,
+        )
 
     def labels(self, **labels):
         self._histogram.set_default_tags(labels)
@@ -295,12 +380,16 @@ class RayMetrics(Metrics):
     RayMetrics is used by RayPrometheusStatLogger to log to Ray metrics.
     Provides the same metrics as Metrics but uses Ray's util.metrics library.
     """
+
     _gauge_cls: Type[prometheus_client.Gauge] = cast(
-        Type[prometheus_client.Gauge], _RayGaugeWrapper)
+        Type[prometheus_client.Gauge], _RayGaugeWrapper
+    )
     _counter_cls: Type[prometheus_client.Counter] = cast(
-        Type[prometheus_client.Counter], _RayCounterWrapper)
+        Type[prometheus_client.Counter], _RayCounterWrapper
+    )
     _histogram_cls: Type[prometheus_client.Histogram] = cast(
-        Type[prometheus_client.Histogram], _RayHistogramWrapper)
+        Type[prometheus_client.Histogram], _RayHistogramWrapper
+    )
 
     def __init__(self, labelnames: List[str], vllm_config: VllmConfig):
         if ray_metrics is None:
@@ -348,14 +437,12 @@ def build_1_2_3_5_8_buckets(max_value: int) -> List[int]:
     return build_buckets([1, 2, 3, 5, 8], max_value)
 
 
-def local_interval_elapsed(now: float, last_log: float,
-                           local_interval: float) -> bool:
+def local_interval_elapsed(now: float, last_log: float, local_interval: float) -> bool:
     elapsed_time = now - last_log
     return elapsed_time > local_interval
 
 
-def get_throughput(tracked_stats: List[int], now: float,
-                   last_log: float) -> float:
+def get_throughput(tracked_stats: List[int], now: float, last_log: float) -> float:
     return float(np.sum(tracked_stats) / (now - last_log))
 
 
@@ -369,29 +456,32 @@ def __init__(self, local_interval: float, vllm_config: VllmConfig) -> None:
 
     def log(self, stats: Stats) -> None:
         """Called by LLMEngine.
-           Logs to Stdout every self.local_interval seconds."""
+        Logs to Stdout every self.local_interval seconds."""
 
         # Save tracked stats for token counters.
         self.num_prompt_tokens.append(stats.num_prompt_tokens_iter)
         self.num_generation_tokens.append(stats.num_generation_tokens_iter)
 
         # Log locally every local_interval seconds.
-        if local_interval_elapsed(stats.now, self.last_local_log,
-                                  self.local_interval):
+        if local_interval_elapsed(stats.now, self.last_local_log, self.local_interval):
             # Compute summary metrics for tracked stats (and log them
             # to prometheus if applicable).
-            prompt_throughput = get_throughput(self.num_prompt_tokens,
-                                               now=stats.now,
-                                               last_log=self.last_local_log)
+            prompt_throughput = get_throughput(
+                self.num_prompt_tokens, now=stats.now, last_log=self.last_local_log
+            )
             generation_throughput = get_throughput(
-                self.num_generation_tokens,
-                now=stats.now,
-                last_log=self.last_local_log)
+                self.num_generation_tokens, now=stats.now, last_log=self.last_local_log
+            )
 
             log_fn = logger.info
-            if not any((prompt_throughput, generation_throughput,
-                        self.last_prompt_throughput,
-                        self.last_generation_throughput)):
+            if not any(
+                (
+                    prompt_throughput,
+                    generation_throughput,
+                    self.last_prompt_throughput,
+                    self.last_generation_throughput,
+                )
+            ):
                 # Avoid log noise on an idle production system
                 log_fn = logger.debug
 
@@ -409,8 +499,10 @@ def log(self, stats: Stats) -> None:
                 stats.gpu_cache_usage_sys * 100,
                 stats.cpu_cache_usage_sys * 100,
             )
-            if (stats.cpu_prefix_cache_hit_rate >= 0
-                    or stats.gpu_prefix_cache_hit_rate >= 0):
+            if (
+                stats.cpu_prefix_cache_hit_rate >= 0
+                or stats.gpu_prefix_cache_hit_rate >= 0
+            ):
                 log_fn(
                     "Prefix cache hit rate: GPU: %.2f%%, CPU: %.2f%%",
                     stats.gpu_prefix_cache_hit_rate * 100,
@@ -433,16 +525,19 @@ def info(self, type: str, obj: SupportsMetricsInfo) -> None:
 
 class PrometheusStatLogger(StatLoggerBase):
     """PrometheusStatLogger is used LLMEngine to log to Prometheus."""
+
     _metrics_cls = Metrics
     _gauge_cls = prometheus_client.Gauge
 
-    def __init__(self, local_interval: float, labels: Dict[str, str],
-                 vllm_config: VllmConfig) -> None:
+    def __init__(
+        self, local_interval: float, labels: Dict[str, str], vllm_config: VllmConfig
+    ) -> None:
         super().__init__(local_interval, vllm_config)
         # Prometheus metrics
         self.labels = labels
-        self.metrics = self._metrics_cls(labelnames=list(labels.keys()),
-                                         vllm_config=vllm_config)
+        self.metrics = self._metrics_cls(
+            labelnames=list(labels.keys()), vllm_config=vllm_config
+        )
 
     def _log_gauge(self, gauge, data: Union[int, float]) -> None:
         # Convenience function for logging to gauge.
@@ -452,19 +547,18 @@ def _log_counter(self, counter, data: Union[int, float]) -> None:
         # Convenience function for logging to counter.
         # Prevent ValueError from negative increment
         if data < 0:
-            logger.warning("Skipping negative increment of %g to %s", data,
-                           counter)
+            logger.warning("Skipping negative increment of %g to %s", data, counter)
             return
         counter.labels(**self.labels).inc(data)
 
-    def _log_counter_labels(self, counter, data: CollectionsCounter,
-                            label_key: str) -> None:
+    def _log_counter_labels(
+        self, counter, data: CollectionsCounter, label_key: str
+    ) -> None:
         # Convenience function for collection counter of labels.
         for label, count in data.items():
             counter.labels(**{**self.labels, label_key: label}).inc(count)
 
-    def _log_histogram(self, histogram, data: Union[List[int],
-                                                    List[float]]) -> None:
+    def _log_histogram(self, histogram, data: Union[List[int], List[float]]) -> None:
         # Convenience function for logging list to histogram.
         for datum in data:
             histogram.labels(**self.labels).observe(datum)
@@ -474,68 +568,85 @@ def _log_gauge_string(self, gauge, data: Dict[str, str]) -> None:
 
     def _log_prometheus(self, stats: Stats) -> None:
         # System state data
-        self._log_gauge(self.metrics.gauge_scheduler_running,
-                        stats.num_running_sys)
-        self._log_gauge(self.metrics.gauge_scheduler_waiting,
-                        stats.num_waiting_sys)
-        self._log_gauge(self.metrics.gauge_gpu_cache_usage,
-                        stats.gpu_cache_usage_sys)
+        self._log_gauge(self.metrics.gauge_scheduler_running, stats.num_running_sys)
+        self._log_gauge(self.metrics.gauge_scheduler_waiting, stats.num_waiting_sys)
+        self._log_gauge(self.metrics.gauge_gpu_cache_usage, stats.gpu_cache_usage_sys)
         # Including max-lora in metric, in future this property of lora
         # config maybe extended to be dynamic.
         lora_info = {
-            self.metrics.labelname_running_lora_adapters:
-            ",".join(stats.running_lora_adapters),
-            self.metrics.labelname_waiting_lora_adapters:
-            ",".join(stats.waiting_lora_adapters),
-            self.metrics.labelname_max_lora:
-            stats.max_lora,
+            self.metrics.labelname_running_lora_adapters: ",".join(
+                stats.running_lora_adapters
+            ),
+            self.metrics.labelname_waiting_lora_adapters: ",".join(
+                stats.waiting_lora_adapters
+            ),
+            self.metrics.labelname_max_lora: stats.max_lora,
         }
         self._log_gauge_string(self.metrics.gauge_lora_info, lora_info)
         # Iteration level data
-        self._log_counter(self.metrics.counter_num_preemption,
-                          stats.num_preemption_iter)
-        self._log_counter(self.metrics.counter_prompt_tokens,
-                          stats.num_prompt_tokens_iter)
-        self._log_counter(self.metrics.counter_generation_tokens,
-                          stats.num_generation_tokens_iter)
-        self._log_histogram(self.metrics.histogram_iteration_tokens,
-                            [stats.num_tokens_iter])
-        self._log_histogram(self.metrics.histogram_time_to_first_token,
-                            stats.time_to_first_tokens_iter)
-        self._log_histogram(self.metrics.histogram_time_per_output_token,
-                            stats.inter_token_latencies_iter)
-        self._log_histogram(self.metrics.histogram_inter_token_latency,
-                            stats.inter_token_latencies_iter)
+        self._log_counter(
+            self.metrics.counter_num_preemption, stats.num_preemption_iter
+        )
+        self._log_counter(
+            self.metrics.counter_prompt_tokens, stats.num_prompt_tokens_iter
+        )
+        self._log_counter(
+            self.metrics.counter_generation_tokens, stats.num_generation_tokens_iter
+        )
+        self._log_histogram(
+            self.metrics.histogram_iteration_tokens, [stats.num_tokens_iter]
+        )
+        self._log_histogram(
+            self.metrics.histogram_time_to_first_token, stats.time_to_first_tokens_iter
+        )
+        self._log_histogram(
+            self.metrics.histogram_time_per_output_token,
+            stats.inter_token_latencies_iter,
+        )
+        self._log_histogram(
+            self.metrics.histogram_inter_token_latency, stats.inter_token_latencies_iter
+        )
 
         # Request level data
         # Latency
-        self._log_histogram(self.metrics.histogram_e2e_time_request,
-                            stats.time_e2e_requests)
-        self._log_histogram(self.metrics.histogram_queue_time_request,
-                            stats.time_queue_requests)
-        self._log_histogram(self.metrics.histogram_inference_time_request,
-                            stats.time_inference_requests)
-        self._log_histogram(self.metrics.histogram_prefill_time_request,
-                            stats.time_prefill_requests)
-        self._log_histogram(self.metrics.histogram_decode_time_request,
-                            stats.time_decode_requests)
+        self._log_histogram(
+            self.metrics.histogram_e2e_time_request, stats.time_e2e_requests
+        )
+        self._log_histogram(
+            self.metrics.histogram_queue_time_request, stats.time_queue_requests
+        )
+        self._log_histogram(
+            self.metrics.histogram_inference_time_request, stats.time_inference_requests
+        )
+        self._log_histogram(
+            self.metrics.histogram_prefill_time_request, stats.time_prefill_requests
+        )
+        self._log_histogram(
+            self.metrics.histogram_decode_time_request, stats.time_decode_requests
+        )
         # Metadata
-        finished_reason_counter = CollectionsCounter(
-            stats.finished_reason_requests)
-        self._log_counter_labels(self.metrics.counter_request_success,
-                                 finished_reason_counter,
-                                 Metrics.labelname_finish_reason)
-        self._log_histogram(self.metrics.histogram_num_prompt_tokens_request,
-                            stats.num_prompt_tokens_requests)
+        finished_reason_counter = CollectionsCounter(stats.finished_reason_requests)
+        self._log_counter_labels(
+            self.metrics.counter_request_success,
+            finished_reason_counter,
+            Metrics.labelname_finish_reason,
+        )
+        self._log_histogram(
+            self.metrics.histogram_num_prompt_tokens_request,
+            stats.num_prompt_tokens_requests,
+        )
         self._log_histogram(
             self.metrics.histogram_num_generation_tokens_request,
-            stats.num_generation_tokens_requests)
+            stats.num_generation_tokens_requests,
+        )
         self._log_histogram(self.metrics.histogram_n_request, stats.n_requests)
         self._log_histogram(
             self.metrics.histogram_max_num_generation_tokens_request,
-            stats.max_num_generation_tokens_requests)
-        self._log_histogram(self.metrics.histogram_max_tokens_request,
-                            stats.max_tokens_requests)
+            stats.max_num_generation_tokens_requests,
+        )
+        self._log_histogram(
+            self.metrics.histogram_max_tokens_request, stats.max_tokens_requests
+        )
 
     def log(self, stats: Stats):
         """Logs to prometheus and tracked stats every iteration."""
@@ -547,9 +658,7 @@ def log(self, stats: Stats):
         self.num_generation_tokens.append(stats.num_generation_tokens_iter)
 
         # Log locally every local_interval seconds.
-        if local_interval_elapsed(stats.now, self.last_local_log,
-                                  self.local_interval):
-
+        if local_interval_elapsed(stats.now, self.last_local_log, self.local_interval):
             # Reset tracked stats for next interval.
             self.num_prompt_tokens = []
             self.num_generation_tokens = []
@@ -565,12 +674,14 @@ def info(self, type: str, obj: SupportsMetricsInfo) -> None:
                 name="vllm:cache_config_info",
                 documentation="Information of the LLMEngine CacheConfig",
                 labelnames=metrics_info.keys(),
-                multiprocess_mode="mostrecent")
+                multiprocess_mode="mostrecent",
+            )
             info_gauge.labels(**metrics_info).set(1)
 
 
 class RayPrometheusStatLogger(PrometheusStatLogger):
     """RayPrometheusStatLogger uses Ray metrics instead."""
+
     _metrics_cls = RayMetrics
 
     def info(self, type: str, obj: SupportsMetricsInfo) -> None:
diff --git a/vllm/engine/metrics_types.py b/vllm/engine/metrics_types.py
index 9778ab5a8c99..d9a53fed7c41 100644
--- a/vllm/engine/metrics_types.py
+++ b/vllm/engine/metrics_types.py
@@ -4,7 +4,7 @@
 These types are defined in this file to avoid importing vllm.engine.metrics
 and therefore importing prometheus_client.
 
-This is required due to usage of Prometheus multiprocess mode to enable 
+This is required due to usage of Prometheus multiprocess mode to enable
 metrics after splitting out the uvicorn process from the engine process.
 
 Prometheus multiprocess mode requires setting PROMETHEUS_MULTIPROC_DIR
@@ -24,6 +24,7 @@
 @dataclass
 class Stats:
     """Created by LLMEngine for use by StatLogger."""
+
     now: float
 
     # System stats (should have _sys suffix)
diff --git a/vllm/engine/protocol.py b/vllm/engine/protocol.py
index bc917f2f57f0..feb2e841c83a 100644
--- a/vllm/engine/protocol.py
+++ b/vllm/engine/protocol.py
@@ -3,7 +3,8 @@
 
 import asyncio
 from abc import ABC, abstractmethod
-from typing import Any, AsyncGenerator, Iterable, Mapping, Optional, Union
+from collections.abc import AsyncGenerator, Iterable, Mapping
+from typing import Any, Optional, Union
 
 from vllm.beam_search import BeamSearchSequence, create_sort_beams_key_function
 from vllm.config import ModelConfig, VllmConfig
@@ -29,23 +30,19 @@ class EngineClient(ABC):
 
     @property
     @abstractmethod
-    def is_running(self) -> bool:
-        ...
+    def is_running(self) -> bool: ...
 
     @property
     @abstractmethod
-    def is_stopped(self) -> bool:
-        ...
+    def is_stopped(self) -> bool: ...
 
     @property
     @abstractmethod
-    def errored(self) -> bool:
-        ...
+    def errored(self) -> bool: ...
 
     @property
     @abstractmethod
-    def dead_error(self) -> BaseException:
-        ...
+    def dead_error(self) -> BaseException: ...
 
     @abstractmethod
     def generate(
@@ -71,7 +68,6 @@ async def beam_search(
         params: BeamSearchParams,
         lora_request: Optional[LoRARequest] = None,
     ) -> AsyncGenerator[RequestOutput, None]:
-
         beam_width = params.beam_width
         max_tokens = params.max_tokens
         ignore_eos = params.ignore_eos
@@ -112,8 +108,7 @@ async def beam_search(
 
         tokenized_length = len(prompt_token_ids)
 
-        sort_beams_key = create_sort_beams_key_function(
-            eos_token_id, length_penalty)
+        sort_beams_key = create_sort_beams_key_function(eos_token_id, length_penalty)
 
         beam_search_params = SamplingParams(
             logprobs=2 * beam_width,
@@ -121,35 +116,49 @@ async def beam_search(
             temperature=temperature,
         )
         all_beams = [
-            BeamSearchSequence(tokens=prompt_token_ids,
-                               cum_logprob=0,
-                               logprobs=[],
-                               multi_modal_data=multi_modal_data,
-                               mm_processor_kwargs=mm_processor_kwargs,
-                               lora_request=lora_request)
+            BeamSearchSequence(
+                tokens=prompt_token_ids,
+                cum_logprob=0,
+                logprobs=[],
+                multi_modal_data=multi_modal_data,
+                mm_processor_kwargs=mm_processor_kwargs,
+                lora_request=lora_request,
+            )
         ]
         completed = []
 
         for _ in range(max_tokens):
-            prompts_batch, lora_req_batch = zip(*[(
-                TokensPrompt(prompt_token_ids=beam.tokens,
-                             multi_modal_data=beam.multi_modal_data,
-                             mm_processor_kwargs=beam.mm_processor_kwargs),
-                beam.lora_request,
-            ) for beam in all_beams])
+            prompts_batch, lora_req_batch = zip(
+                *[
+                    (
+                        TokensPrompt(
+                            prompt_token_ids=beam.tokens,
+                            multi_modal_data=beam.multi_modal_data,
+                            mm_processor_kwargs=beam.mm_processor_kwargs,
+                        ),
+                        beam.lora_request,
+                    )
+                    for beam in all_beams
+                ]
+            )
 
             tasks = []
 
             request_id = f"beam_search-{random_uuid()}"
-            for i, (individual_prompt,
-                    lora_req) in enumerate(zip(prompts_batch, lora_req_batch)):
+            for i, (individual_prompt, lora_req) in enumerate(
+                zip(prompts_batch, lora_req_batch)
+            ):
                 request_id_item = f"{request_id}-{i}"
                 task = asyncio.create_task(
                     collect_from_async_generator(
-                        self.generate(individual_prompt,
-                                      beam_search_params,
-                                      request_id_item,
-                                      lora_request=lora_req)))
+                        self.generate(
+                            individual_prompt,
+                            beam_search_params,
+                            request_id_item,
+                            lora_request=lora_req,
+                        )
+                    )
+                )
                 tasks.append(task)
 
             output = await asyncio.gather(*tasks)
@@ -163,32 +172,31 @@ async def beam_search(
                 if result.outputs[0].logprobs is not None:
                     logprobs = result.outputs[0].logprobs[0]
                     for token_id, logprob_obj in logprobs.items():
-                        if token_id == eos_token_id and \
-                            not ignore_eos:
+                        if token_id == eos_token_id and not ignore_eos:
                             completed.append(
                                 BeamSearchSequence(
-                                    tokens=current_beam.tokens +
-                                    [token_id] if include_stop_str_in_output
+                                    tokens=current_beam.tokens + [token_id]
+                                    if include_stop_str_in_output
                                     else current_beam.tokens,
-                                    logprobs=current_beam.logprobs +
-                                    [logprobs],
-                                    cum_logprob=current_beam.cum_logprob +
-                                    logprob_obj.logprob,
+                                    logprobs=current_beam.logprobs + [logprobs],
+                                    cum_logprob=current_beam.cum_logprob
+                                    + logprob_obj.logprob,
                                     finish_reason="stop",
-                                    stop_reason=eos_token_id))
+                                    stop_reason=eos_token_id,
+                                )
+                            )
                         else:
                             new_beams.append(
                                 BeamSearchSequence(
                                     tokens=current_beam.tokens + [token_id],
-                                    logprobs=current_beam.logprobs +
-                                    [logprobs],
+                                    logprobs=current_beam.logprobs + [logprobs],
                                     lora_request=current_beam.lora_request,
-                                    cum_logprob=current_beam.cum_logprob +
-                                    logprob_obj.logprob,
-                                    multi_modal_data=current_beam.
-                                    multi_modal_data,
-                                    mm_processor_kwargs=current_beam.
-                                    mm_processor_kwargs))
+                                    cum_logprob=current_beam.cum_logprob
+                                    + logprob_obj.logprob,
+                                    multi_modal_data=current_beam.multi_modal_data,
+                                    mm_processor_kwargs=current_beam.mm_processor_kwargs,
+                                )
+                            )
 
             sorted_beams = sorted(new_beams, key=sort_beams_key, reverse=True)
             all_beams = sorted_beams[:beam_width]
@@ -198,7 +206,7 @@ async def beam_search(
         best_beams = sorted_completed[:beam_width]
 
         for beam in best_beams:
-            if (beam.tokens[-1] == eos_token_id and not ignore_eos):
+            if beam.tokens[-1] == eos_token_id and not ignore_eos:
                 # Skip the eos token in the text.
                 tokens = beam.tokens[tokenized_length:-1]
             else:
@@ -209,19 +217,23 @@ async def beam_search(
             request_id=request_id,
             prompt=prompt_text,
             outputs=[
-                CompletionOutput(text=beam.text,
-                                 cumulative_logprob=beam.cum_logprob,
-                                 token_ids=beam.tokens[tokenized_length:],
-                                 index=i,
-                                 logprobs=beam.logprobs,
-                                 finish_reason=beam.finish_reason if
-                                 beam.finish_reason is not None else "length",
-                                 stop_reason=beam.stop_reason)
+                CompletionOutput(
+                    text=beam.text,
+                    cumulative_logprob=beam.cum_logprob,
+                    token_ids=beam.tokens[tokenized_length:],
+                    index=i,
+                    logprobs=beam.logprobs,
+                    finish_reason=beam.finish_reason
+                    if beam.finish_reason is not None
+                    else "length",
+                    stop_reason=beam.stop_reason,
+                )
                 for (i, beam) in enumerate(best_beams)
             ],
             finished=True,
             prompt_token_ids=prompt_token_ids,
-            prompt_logprobs=None)
+            prompt_logprobs=None,
+        )
 
     @abstractmethod
     def encode(
@@ -271,12 +283,10 @@ async def get_io_processor(self) -> IOProcessor:
         raise NotImplementedError
 
     @abstractmethod
-    async def is_tracing_enabled(self) -> bool:
-        ...
+    async def is_tracing_enabled(self) -> bool: ...
 
     @abstractmethod
-    async def do_log_stats(self) -> None:
-        ...
+    async def do_log_stats(self) -> None: ...
 
     @abstractmethod
     async def check_health(self) -> None:
@@ -299,8 +309,7 @@ async def reset_mm_cache(self) -> None:
         ...
 
     @abstractmethod
-    async def reset_prefix_cache(self,
-                                 device: Optional[Device] = None) -> None:
+    async def reset_prefix_cache(self, device: Optional[Device] = None) -> None:
         """Reset the prefix cache"""
         ...
 
@@ -324,17 +333,19 @@ async def add_lora(self, lora_request: LoRARequest) -> bool:
         """Load a new LoRA adapter into the engine for future requests."""
         ...
 
-    async def scale_elastic_ep(self,
-                               new_data_parallel_size: int,
-                               drain_timeout: int = 300) -> None:
+    async def scale_elastic_ep(
+        self, new_data_parallel_size: int, drain_timeout: int = 300
+    ) -> None:
         """Scale the engine"""
         raise NotImplementedError
 
-    async def collective_rpc(self,
-                             method: str,
-                             timeout: Optional[float] = None,
-                             args: tuple = (),
-                             kwargs: Optional[dict] = None):
+    async def collective_rpc(
+        self,
+        method: str,
+        timeout: Optional[float] = None,
+        args: tuple = (),
+        kwargs: Optional[dict] = None,
+    ):
         """Perform a collective RPC call to the given path."""
         raise NotImplementedError
 
diff --git a/vllm/entrypoints/api_server.py b/vllm/entrypoints/api_server.py
index 3d1e5dc14d2f..c31d15ddac4f 100644
--- a/vllm/entrypoints/api_server.py
+++ b/vllm/entrypoints/api_server.py
@@ -7,6 +7,7 @@
 We are also not going to accept PRs modifying this file, please
 change `vllm/entrypoints/openai/api_server.py` instead.
 """
+
 import asyncio
 import json
 import ssl
@@ -68,9 +69,7 @@ async def stream_results() -> AsyncGenerator[bytes, None]:
         async for request_output in results_generator:
             prompt = request_output.prompt
             assert prompt is not None
-            text_outputs = [
-                prompt + output.text for output in request_output.outputs
-            ]
+            text_outputs = [prompt + output.text for output in request_output.outputs]
             ret = {"text": text_outputs}
             yield (json.dumps(ret) + "\n").encode("utf-8")
 
@@ -109,16 +108,20 @@ async def init_app(
     global engine
 
     engine_args = AsyncEngineArgs.from_cli_args(args)
-    engine = (llm_engine
-              if llm_engine is not None else AsyncLLMEngine.from_engine_args(
-                  engine_args, usage_context=UsageContext.API_SERVER))
+    engine = (
+        llm_engine
+        if llm_engine is not None
+        else AsyncLLMEngine.from_engine_args(
+            engine_args, usage_context=UsageContext.API_SERVER
+        )
+    )
     app.state.engine_client = engine
     return app
 
 
-async def run_server(args: Namespace,
-                     llm_engine: Optional[AsyncLLMEngine] = None,
-                     **uvicorn_kwargs: Any) -> None:
+async def run_server(
+    args: Namespace, llm_engine: Optional[AsyncLLMEngine] = None, **uvicorn_kwargs: Any
+) -> None:
     logger.info("vLLM API server version %s", VLLM_VERSION)
     logger.info("args: %s", args)
 
@@ -151,26 +154,27 @@ async def run_server(args: Namespace,
     parser.add_argument("--port", type=parser.check_port, default=8000)
     parser.add_argument("--ssl-keyfile", type=str, default=None)
     parser.add_argument("--ssl-certfile", type=str, default=None)
-    parser.add_argument("--ssl-ca-certs",
-                        type=str,
-                        default=None,
-                        help="The CA certificates file")
+    parser.add_argument(
+        "--ssl-ca-certs", type=str, default=None, help="The CA certificates file"
+    )
     parser.add_argument(
         "--enable-ssl-refresh",
         action="store_true",
         default=False,
-        help="Refresh SSL Context when SSL certificate files change")
+        help="Refresh SSL Context when SSL certificate files change",
+    )
     parser.add_argument(
         "--ssl-cert-reqs",
         type=int,
         default=int(ssl.CERT_NONE),
-        help="Whether client certificate is required (see stdlib ssl module's)"
+        help="Whether client certificate is required (see stdlib ssl module's)",
     )
     parser.add_argument(
         "--root-path",
         type=str,
         default=None,
-        help="FastAPI root_path when app is behind a path based routing proxy")
+        help="FastAPI root_path when app is behind a path based routing proxy",
+    )
     parser.add_argument("--log-level", type=str, default="debug")
     parser = AsyncEngineArgs.add_cli_args(parser)
     args = parser.parse_args()
diff --git a/vllm/entrypoints/chat_utils.py b/vllm/entrypoints/chat_utils.py
index f8119d89ac49..cfba1ae6e5c0 100644
--- a/vllm/entrypoints/chat_utils.py
+++ b/vllm/entrypoints/chat_utils.py
@@ -8,8 +8,7 @@
 from collections.abc import Awaitable, Iterable
 from functools import cached_property, lru_cache, partial
 from pathlib import Path
-from typing import (Any, Callable, Generic, Literal, Optional, TypeVar, Union,
-                    cast)
+from typing import Any, Callable, Generic, Literal, Optional, TypeVar, Union, cast
 
 import jinja2
 import jinja2.ext
@@ -18,40 +17,45 @@
 import jinja2.parser
 import jinja2.sandbox
 import transformers.utils.chat_template_utils as hf_chat_utils
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from openai.types.chat import (ChatCompletionAssistantMessageParam,
-                               ChatCompletionContentPartImageParam,
-                               ChatCompletionContentPartInputAudioParam)
 from openai.types.chat import (
-    ChatCompletionContentPartParam as OpenAIChatCompletionContentPartParam)
-from openai.types.chat import (ChatCompletionContentPartRefusalParam,
-                               ChatCompletionContentPartTextParam)
+    ChatCompletionAssistantMessageParam,
+    ChatCompletionContentPartImageParam,
+    ChatCompletionContentPartInputAudioParam,
+    ChatCompletionContentPartRefusalParam,
+    ChatCompletionContentPartTextParam,
+    ChatCompletionMessageToolCallParam,
+    ChatCompletionToolMessageParam,
+)
+from openai.types.chat import (
+    ChatCompletionContentPartParam as OpenAIChatCompletionContentPartParam,
+)
 from openai.types.chat import (
-    ChatCompletionMessageParam as OpenAIChatCompletionMessageParam)
-from openai.types.chat import (ChatCompletionMessageToolCallParam,
-                               ChatCompletionToolMessageParam)
-from openai.types.chat.chat_completion_content_part_input_audio_param import (
-    InputAudio)
+    ChatCompletionMessageParam as OpenAIChatCompletionMessageParam,
+)
+from openai.types.chat.chat_completion_content_part_input_audio_param import InputAudio
 from openai.types.responses import ResponseInputImageParam
 from openai_harmony import Message as OpenAIHarmonyMessage
 from PIL import Image
 from pydantic import BaseModel, ConfigDict, TypeAdapter
+
 # yapf: enable
-from transformers import (PreTrainedTokenizer, PreTrainedTokenizerFast,
-                          ProcessorMixin)
+from transformers import PreTrainedTokenizer, PreTrainedTokenizerFast, ProcessorMixin
+
 # pydantic needs the TypedDict from typing_extensions
 from typing_extensions import Required, TypeAlias, TypedDict
 
 from vllm.config import ModelConfig
 from vllm.logger import init_logger
 from vllm.model_executor.models import SupportsMultiModal
-from vllm.multimodal import (MULTIMODAL_REGISTRY, MultiModalDataDict,
-                             MultiModalUUIDDict)
+from vllm.multimodal import MULTIMODAL_REGISTRY, MultiModalDataDict, MultiModalUUIDDict
 from vllm.multimodal.utils import MediaConnector
+
 # yapf: disable
-from vllm.transformers_utils.chat_templates import (
-    get_chat_template_fallback_path)
+from vllm.transformers_utils.chat_templates import get_chat_template_fallback_path
+
 # yapf: enable
 from vllm.transformers_utils.processor import cached_get_processor
 from vllm.transformers_utils.tokenizer import AnyTokenizer, MistralTokenizer
@@ -284,9 +288,11 @@ def _is_var_access(node: jinja2.nodes.Node, varname: str) -> bool:
 
 def _is_attr_access(node: jinja2.nodes.Node, varname: str, key: str) -> bool:
     if isinstance(node, jinja2.nodes.Getitem):
-        return (_is_var_access(node.node, varname)
-                and isinstance(node.arg, jinja2.nodes.Const)
-                and node.arg.value == key)
+        return (
+            _is_var_access(node.node, varname)
+            and isinstance(node.arg, jinja2.nodes.Const)
+            and node.arg.value == key
+        )
 
     if isinstance(node, jinja2.nodes.Getattr):
         return _is_var_access(node.node, varname) and node.attr == key
@@ -301,12 +307,14 @@ def _is_var_or_elems_access(
 ) -> bool:
     if isinstance(node, jinja2.nodes.Filter):
         return node.node is not None and _is_var_or_elems_access(
-            node.node, varname, key)
+            node.node, varname, key
+        )
     if isinstance(node, jinja2.nodes.Test):
         return _is_var_or_elems_access(node.node, varname, key)
 
     if isinstance(node, jinja2.nodes.Getitem) and isinstance(
-            node.arg, jinja2.nodes.Slice):
+        node.arg, jinja2.nodes.Slice
+    ):
         return _is_var_or_elems_access(node.node, varname, key)
 
     # yapf: disable
@@ -342,8 +350,7 @@ def _iter_nodes_assign_var_or_elems(root: jinja2.nodes.Node, varname: str):
 # the scope in which each variable is defined, but that is too complicated
 def _iter_nodes_assign_messages_item(root: jinja2.nodes.Node):
     messages_varnames = [
-        varname
-        for _, varname in _iter_nodes_assign_var_or_elems(root, "messages")
+        varname for _, varname in _iter_nodes_assign_var_or_elems(root, "messages")
     ]
 
     # Search for {%- for message in messages -%} loops
@@ -484,8 +491,7 @@ def resolve_hf_chat_template(
 
     # 2nd priority: AutoProcessor chat template, unless tool calling is enabled
     if tools is None:
-        chat_template = _try_get_processor_chat_template(tokenizer,
-                                                         model_config)
+        chat_template = _try_get_processor_chat_template(tokenizer, model_config)
         if chat_template is not None:
             return chat_template
 
@@ -678,16 +684,12 @@ def all_mm_uuids(self) -> Optional[MultiModalUUIDDict]:
         mm_uuids = {}
         uuids_by_modality = dict(self._uuids_by_modality)
         if "image" in uuids_by_modality and "image_embeds" in uuids_by_modality:
-            raise ValueError(
-                "Mixing raw image and embedding inputs is not allowed"
-            )
+            raise ValueError("Mixing raw image and embedding inputs is not allowed")
 
         if "image_embeds" in uuids_by_modality:
             image_embeds_uuids = uuids_by_modality["image_embeds"]
             if len(image_embeds_uuids) > 1:
-                raise ValueError(
-                    "Only one message can have {'type': 'image_embeds'}"
-                )
+                raise ValueError("Only one message can have {'type': 'image_embeds'}")
             mm_uuids["image"] = uuids_by_modality["image_embeds"]
         if "image" in uuids_by_modality:
             mm_uuids["image"] = uuids_by_modality["image"]  # UUIDs of images
@@ -709,16 +711,12 @@ def all_mm_data(self) -> Optional[MultiModalDataDict]:
         mm_inputs = {}
         items_by_modality = dict(self._items_by_modality)
         if "image" in items_by_modality and "image_embeds" in items_by_modality:
-            raise ValueError(
-                "Mixing raw image and embedding inputs is not allowed"
-            )
+            raise ValueError("Mixing raw image and embedding inputs is not allowed")
 
         if "image_embeds" in items_by_modality:
             image_embeds_lst = items_by_modality["image_embeds"]
             if len(image_embeds_lst) > 1:
-                raise ValueError(
-                    "Only one message can have {'type': 'image_embeds'}"
-                )
+                raise ValueError("Only one message can have {'type': 'image_embeds'}")
             mm_inputs["image"] = image_embeds_lst[0]
         if "image" in items_by_modality:
             mm_inputs["image"] = items_by_modality["image"]  # A list of images
@@ -748,16 +746,12 @@ async def all_mm_data(self) -> Optional[MultiModalDataDict]:
             items_by_modality[modality] = await asyncio.gather(*coros)
 
         if "image" in items_by_modality and "image_embeds" in items_by_modality:
-            raise ValueError(
-                "Mixing raw image and embedding inputs is not allowed"
-            )
+            raise ValueError("Mixing raw image and embedding inputs is not allowed")
 
         if "image_embeds" in items_by_modality:
             image_embeds_lst = items_by_modality["image_embeds"]
             if len(image_embeds_lst) > 1:
-                raise ValueError(
-                    "Only one message can have {'type': 'image_embeds'}"
-                )
+                raise ValueError("Only one message can have {'type': 'image_embeds'}")
             mm_inputs["image"] = image_embeds_lst[0]
         if "image" in items_by_modality:
             mm_inputs["image"] = items_by_modality["image"]  # A list of images
@@ -783,9 +777,7 @@ def __init__(self) -> None:
         # }
         self._placeholder_storage: dict[str, list] = defaultdict(list)
 
-    def _add_placeholder(
-        self, modality: ModalityStr, placeholder: Optional[str]
-    ):
+    def _add_placeholder(self, modality: ModalityStr, placeholder: Optional[str]):
         mod_placeholder = MODALITY_PLACEHOLDERS_MAP[modality]
         if placeholder:
             self._placeholder_storage[mod_placeholder].append(placeholder)
@@ -794,8 +786,7 @@ def mm_placeholder_storage(self) -> dict[str, list]:
         return dict(self._placeholder_storage)
 
     @abstractmethod
-    def parse_image(
-        self, image_url: Optional[str], uuid: Optional[str] = None) -> None:
+    def parse_image(self, image_url: Optional[str], uuid: Optional[str] = None) -> None:
         raise NotImplementedError
 
     @abstractmethod
@@ -813,9 +804,7 @@ def parse_image_pil(
         raise NotImplementedError
 
     @abstractmethod
-    def parse_audio(
-        self, audio_url: Optional[str], uuid: Optional[str] = None
-    ) -> None:
+    def parse_audio(self, audio_url: Optional[str], uuid: Optional[str] = None) -> None:
         raise NotImplementedError
 
     @abstractmethod
@@ -825,9 +814,7 @@ def parse_input_audio(
         raise NotImplementedError
 
     @abstractmethod
-    def parse_video(
-        self, video_url: Optional[str], uuid: Optional[str] = None
-    ) -> None:
+    def parse_video(self, video_url: Optional[str], uuid: Optional[str] = None) -> None:
         raise NotImplementedError
 
 
@@ -844,9 +831,7 @@ def __init__(self, tracker: MultiModalItemTracker) -> None:
             allowed_media_domains=tracker.allowed_media_domains,
         )
 
-    def parse_image(
-        self, image_url: Optional[str], uuid: Optional[str] = None
-    ) -> None:
+    def parse_image(self, image_url: Optional[str], uuid: Optional[str] = None) -> None:
         image = self._connector.fetch_image(image_url) if image_url else None
 
         placeholder = self._tracker.add("image", image, uuid)
@@ -879,9 +864,7 @@ def parse_image_pil(
         placeholder = self._tracker.add("image", image_pil, uuid)
         self._add_placeholder("image", placeholder)
 
-    def parse_audio(
-        self, audio_url: Optional[str], uuid: Optional[str] = None
-    ) -> None:
+    def parse_audio(self, audio_url: Optional[str], uuid: Optional[str] = None) -> None:
         audio = self._connector.fetch_audio(audio_url) if audio_url else None
 
         placeholder = self._tracker.add("audio", audio, uuid)
@@ -903,14 +886,8 @@ def parse_input_audio(
 
         return self.parse_audio(audio_url, uuid)
 
-    def parse_video(
-        self, video_url: Optional[str], uuid: Optional[str] = None
-    ) -> None:
-        video = (
-            self._connector.fetch_video(video_url=video_url)
-            if video_url
-            else None
-        )
+    def parse_video(self, video_url: Optional[str], uuid: Optional[str] = None) -> None:
+        video = self._connector.fetch_video(video_url=video_url) if video_url else None
 
         placeholder = self._tracker.add("video", video, uuid)
         self._add_placeholder("video", placeholder)
@@ -929,12 +906,8 @@ def __init__(self, tracker: AsyncMultiModalItemTracker) -> None:
             allowed_media_domains=tracker.allowed_media_domains,
         )
 
-    def parse_image(
-        self, image_url: Optional[str], uuid: Optional[str] = None
-    ) -> None:
-        image_coro = (
-            self._connector.fetch_image_async(image_url) if image_url else None
-        )
+    def parse_image(self, image_url: Optional[str], uuid: Optional[str] = None) -> None:
+        image_coro = self._connector.fetch_image_async(image_url) if image_url else None
 
         placeholder = self._tracker.add("image", image_coro, uuid)
         self._add_placeholder("image", placeholder)
@@ -944,9 +917,7 @@ def parse_image_embeds(
         image_embeds: Union[str, dict[str, str], None],
         uuid: Optional[str] = None,
     ) -> None:
-        future: asyncio.Future[Union[str, dict[str, str], None]] = (
-            asyncio.Future()
-        )
+        future: asyncio.Future[Union[str, dict[str, str], None]] = asyncio.Future()
 
         if isinstance(image_embeds, dict):
             embeds = {
@@ -977,12 +948,8 @@ def parse_image_pil(
         placeholder = self._tracker.add("image", future, uuid)
         self._add_placeholder("image", placeholder)
 
-    def parse_audio(
-        self, audio_url: Optional[str], uuid: Optional[str] = None
-    ) -> None:
-        audio_coro = (
-            self._connector.fetch_audio_async(audio_url) if audio_url else None
-        )
+    def parse_audio(self, audio_url: Optional[str], uuid: Optional[str] = None) -> None:
+        audio_coro = self._connector.fetch_audio_async(audio_url) if audio_url else None
 
         placeholder = self._tracker.add("audio", audio_coro, uuid)
         self._add_placeholder("audio", placeholder)
@@ -1003,9 +970,7 @@ def parse_input_audio(
 
         return self.parse_audio(audio_url, uuid)
 
-    def parse_video(
-        self, video_url: Optional[str], uuid: Optional[str] = None
-    ) -> None:
+    def parse_video(self, video_url: Optional[str], uuid: Optional[str] = None) -> None:
         video = (
             self._connector.fetch_video_async(video_url=video_url)
             if video_url
@@ -1036,9 +1001,7 @@ def validate_chat_template(chat_template: Optional[Union[Path, str]]):
             )
 
     else:
-        raise TypeError(
-            f"{type(chat_template)} is not a valid chat template type"
-        )
+        raise TypeError(f"{type(chat_template)} is not a valid chat template type")
 
 
 def _load_chat_template(
@@ -1145,9 +1108,7 @@ def _get_full_multimodal_text_prompt(
                 "actual multimodal data items."
             )
 
-        missing_placeholders.extend(
-            [placeholder] * placeholder_counts[placeholder]
-        )
+        missing_placeholders.extend([placeholder] * placeholder_counts[placeholder])
 
     # NOTE: Default behaviour: we always add missing placeholders
     # at the front of the prompt, if interleave_strings=False
@@ -1166,9 +1127,7 @@ def _get_full_multimodal_text_prompt(
 _AudioParser = TypeAdapter(ChatCompletionContentPartAudioParam).validate_python
 _VideoParser = TypeAdapter(ChatCompletionContentPartVideoParam).validate_python
 
-_ResponsesInputImageParser = TypeAdapter(
-    ResponseInputImageParam
-).validate_python
+_ResponsesInputImageParser = TypeAdapter(ResponseInputImageParam).validate_python
 _ContentPart: TypeAlias = Union[str, dict[str, str], InputAudio, PILImage]
 
 # Define a mapping from part types to their corresponding parsing functions.
@@ -1179,26 +1138,14 @@ def _get_full_multimodal_text_prompt(
     "text": lambda part: _TextParser(part).get("text", None),
     "thinking": lambda part: _ThinkParser(part).get("thinking", None),
     "input_text": lambda part: _TextParser(part).get("text", None),
-    "input_image": lambda part: _ResponsesInputImageParser(part).get(
-        "image_url", None
-    ),
-    "image_url": lambda part: _ImageParser(part)
-    .get("image_url", {})
-    .get("url", None),
-    "image_embeds": lambda part: _ImageEmbedsParser(part).get(
-        "image_embeds", None
-    ),
+    "input_image": lambda part: _ResponsesInputImageParser(part).get("image_url", None),
+    "image_url": lambda part: _ImageParser(part).get("image_url", {}).get("url", None),
+    "image_embeds": lambda part: _ImageEmbedsParser(part).get("image_embeds", None),
     "image_pil": lambda part: _PILImageParser(part).get("image_pil", None),
-    "audio_url": lambda part: _AudioParser(part)
-    .get("audio_url", {})
-    .get("url", None),
-    "input_audio": lambda part: _InputAudioParser(part).get(
-        "input_audio", None
-    ),
+    "audio_url": lambda part: _AudioParser(part).get("audio_url", {}).get("url", None),
+    "input_audio": lambda part: _InputAudioParser(part).get("input_audio", None),
     "refusal": lambda part: _RefusalParser(part).get("refusal", None),
-    "video_url": lambda part: _VideoParser(part)
-    .get("video_url", {})
-    .get("url", None),
+    "video_url": lambda part: _VideoParser(part).get("video_url", {}).get("url", None),
 }
 
 
@@ -1225,15 +1172,14 @@ def _parse_chat_message_content_mm_part(
     part_type = part.get("type", None)
     uuid = part.get("uuid", None)
 
-    if isinstance(part_type, str) and part_type in MM_PARSER_MAP and uuid is None: # noqa: E501
+    if isinstance(part_type, str) and part_type in MM_PARSER_MAP and uuid is None:  # noqa: E501
         content = MM_PARSER_MAP[part_type](part)
 
         # Special case for 'image_url.detail'
         # We only support 'auto', which is the default
         if part_type == "image_url" and part.get("detail", "auto") != "auto":
             logger.warning(
-                "'image_url.detail' is currently not supported "
-                "and will be ignored."
+                "'image_url.detail' is currently not supported and will be ignored."
             )
 
         return part_type, content
@@ -1242,9 +1188,7 @@ def _parse_chat_message_content_mm_part(
     # 'type' is required field by pydantic
     if part_type is None or uuid is not None:
         if "image_url" in part:
-            image_params = cast(
-                CustomChatCompletionContentSimpleImageParam, part
-            )
+            image_params = cast(CustomChatCompletionContentSimpleImageParam, part)
             image_url = image_params.get("image_url", None)
             if isinstance(image_url, dict):
                 # Can potentially happen if user provides a uuid
@@ -1253,22 +1197,20 @@ def _parse_chat_message_content_mm_part(
             return "image_url", image_url
         if "image_pil" in part:
             # "image_pil" could be None if UUID is provided.
-            image_params = cast( # type: ignore 
+            image_params = cast(  # type: ignore
                 CustomChatCompletionContentPILImageParam, part
             )
             image_pil = image_params.get("image_pil", None)
             return "image_pil", image_pil
         if "image_embeds" in part:
             # "image_embeds" could be None if UUID is provided.
-            image_params = cast( # type: ignore 
+            image_params = cast(  # type: ignore
                 ChatCompletionContentPartImageEmbedsParam, part
             )
             image_embeds = image_params.get("image_embeds", None)
             return "image_embeds", image_embeds
         if "audio_url" in part:
-            audio_params = cast(
-                CustomChatCompletionContentSimpleAudioParam, part
-            )
+            audio_params = cast(CustomChatCompletionContentSimpleAudioParam, part)
             audio_url = audio_params.get("audio_url", None)
             if isinstance(audio_url, dict):
                 # Can potentially happen if user provides a uuid
@@ -1279,9 +1221,7 @@ def _parse_chat_message_content_mm_part(
             input_audio_params = cast(dict[str, str], part)
             return "input_audio", input_audio_params
         if "video_url" in part:
-            video_params = cast(
-                CustomChatCompletionContentSimpleVideoParam, part
-            )
+            video_params = cast(CustomChatCompletionContentSimpleVideoParam, part)
             video_url = video_params.get("video_url", None)
             if isinstance(video_url, dict):
                 # Can potentially happen if user provides a uuid
@@ -1418,9 +1358,7 @@ def _parse_chat_message_content_part(
     return (
         {"type": modality}
         if wrap_dicts
-        else (
-            MODALITY_PLACEHOLDERS_MAP[modality] if interleave_strings else None
-        )
+        else (MODALITY_PLACEHOLDERS_MAP[modality] if interleave_strings else None)
     )
 
 
@@ -1441,9 +1379,7 @@ def _parse_chat_message_content(
     if content is None:
         content = []
     elif isinstance(content, str):
-        content = [
-            ChatCompletionContentPartTextParam(type="text", text=content)
-        ]
+        content = [ChatCompletionContentPartTextParam(type="text", text=content)]
     result = _parse_chat_message_content_parts(
         role,
         content,  # type: ignore
@@ -1459,10 +1395,7 @@ def _parse_chat_message_content(
             # The 'tool_calls' is not None check ensures compatibility.
             # It's needed only if downstream code doesn't strictly
             # follow the OpenAI spec.
-            if (
-                "tool_calls" in parsed_msg
-                and parsed_msg["tool_calls"] is not None
-            ):
+            if "tool_calls" in parsed_msg and parsed_msg["tool_calls"] is not None:
                 result_msg["tool_calls"] = list(parsed_msg["tool_calls"])
         elif role == "tool":
             parsed_msg = _ToolParser(message)
@@ -1594,7 +1527,8 @@ def resolve_chat_template_kwargs(
     chat_template_kwargs: dict[str, Any],
 ) -> dict[str, Any]:
     fn_kw = {
-        k for k in chat_template_kwargs
+        k
+        for k in chat_template_kwargs
         if supports_kw(tokenizer.apply_chat_template, k, allow_var_kwargs=False)
     }
 
@@ -1604,9 +1538,7 @@ def resolve_chat_template_kwargs(
     # chat template has been already resolved at this stage
     unexpected_vars = {"chat_template"}
     accept_vars = (fn_kw | template_vars) - unexpected_vars
-    return {
-        k: v for k, v in chat_template_kwargs.items() if k in accept_vars
-    }
+    return {k: v for k, v in chat_template_kwargs.items() if k in accept_vars}
 
 
 def apply_hf_chat_template(
diff --git a/vllm/entrypoints/cli/__init__.py b/vllm/entrypoints/cli/__init__.py
index 41671b5b98ab..211e157fc7c8 100644
--- a/vllm/entrypoints/cli/__init__.py
+++ b/vllm/entrypoints/cli/__init__.py
@@ -2,11 +2,10 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from vllm.entrypoints.cli.benchmark.latency import BenchmarkLatencySubcommand
 from vllm.entrypoints.cli.benchmark.serve import BenchmarkServingSubcommand
-from vllm.entrypoints.cli.benchmark.throughput import (
-    BenchmarkThroughputSubcommand)
+from vllm.entrypoints.cli.benchmark.throughput import BenchmarkThroughputSubcommand
 
 __all__: list[str] = [
     "BenchmarkLatencySubcommand",
     "BenchmarkServingSubcommand",
     "BenchmarkThroughputSubcommand",
-]
\ No newline at end of file
+]
diff --git a/vllm/entrypoints/cli/benchmark/base.py b/vllm/entrypoints/cli/benchmark/base.py
index 0c22bc75105e..3263459fd681 100644
--- a/vllm/entrypoints/cli/benchmark/base.py
+++ b/vllm/entrypoints/cli/benchmark/base.py
@@ -6,7 +6,7 @@
 
 
 class BenchmarkSubcommandBase(CLISubcommand):
-    """ The base class of subcommands for vllm bench. """
+    """The base class of subcommands for vllm bench."""
 
     help: str
 
diff --git a/vllm/entrypoints/cli/benchmark/latency.py b/vllm/entrypoints/cli/benchmark/latency.py
index 3e68963cfd44..548ddf4d603e 100644
--- a/vllm/entrypoints/cli/benchmark/latency.py
+++ b/vllm/entrypoints/cli/benchmark/latency.py
@@ -7,7 +7,7 @@
 
 
 class BenchmarkLatencySubcommand(BenchmarkSubcommandBase):
-    """ The `latency` subcommand for vllm bench. """
+    """The `latency` subcommand for vllm bench."""
 
     name = "latency"
     help = "Benchmark the latency of a single batch of requests."
diff --git a/vllm/entrypoints/cli/benchmark/main.py b/vllm/entrypoints/cli/benchmark/main.py
index 0c65fd97fc04..d7455daa1a6b 100644
--- a/vllm/entrypoints/cli/benchmark/main.py
+++ b/vllm/entrypoints/cli/benchmark/main.py
@@ -15,7 +15,7 @@
 
 
 class BenchmarkSubcommand(CLISubcommand):
-    """ The `bench` subcommand for the vLLM CLI. """
+    """The `bench` subcommand for the vLLM CLI."""
 
     name = "bench"
     help = "vLLM bench subcommand."
@@ -28,14 +28,14 @@ def validate(self, args: argparse.Namespace) -> None:
         pass
 
     def subparser_init(
-            self,
-            subparsers: argparse._SubParsersAction) -> FlexibleArgumentParser:
+        self, subparsers: argparse._SubParsersAction
+    ) -> FlexibleArgumentParser:
         bench_parser = subparsers.add_parser(
             self.name,
             description=self.help,
-            usage=f"vllm {self.name} <bench_type> [options]")
-        bench_subparsers = bench_parser.add_subparsers(required=True,
-                                                       dest="bench_type")
+            usage=f"vllm {self.name} <bench_type> [options]",
+        )
+        bench_subparsers = bench_parser.add_subparsers(required=True, dest="bench_type")
 
         for cmd_cls in BenchmarkSubcommandBase.__subclasses__():
             cmd_subparser = bench_subparsers.add_parser(
@@ -47,7 +47,8 @@ def subparser_init(
             cmd_subparser.set_defaults(dispatch_function=cmd_cls.cmd)
             cmd_cls.add_cli_args(cmd_subparser)
             cmd_subparser.epilog = VLLM_SUBCMD_PARSER_EPILOG.format(
-                subcmd=f"{self.name} {cmd_cls.name}")
+                subcmd=f"{self.name} {cmd_cls.name}"
+            )
         return bench_parser
 
 
diff --git a/vllm/entrypoints/cli/benchmark/serve.py b/vllm/entrypoints/cli/benchmark/serve.py
index 3dd7a46d6284..b085f52afb3b 100644
--- a/vllm/entrypoints/cli/benchmark/serve.py
+++ b/vllm/entrypoints/cli/benchmark/serve.py
@@ -7,7 +7,7 @@
 
 
 class BenchmarkServingSubcommand(BenchmarkSubcommandBase):
-    """ The `serve` subcommand for vllm bench. """
+    """The `serve` subcommand for vllm bench."""
 
     name = "serve"
     help = "Benchmark the online serving throughput."
diff --git a/vllm/entrypoints/cli/benchmark/throughput.py b/vllm/entrypoints/cli/benchmark/throughput.py
index d5d43ad4a359..c25be75ec11e 100644
--- a/vllm/entrypoints/cli/benchmark/throughput.py
+++ b/vllm/entrypoints/cli/benchmark/throughput.py
@@ -7,7 +7,7 @@
 
 
 class BenchmarkThroughputSubcommand(BenchmarkSubcommandBase):
-    """ The `throughput` subcommand for vllm bench. """
+    """The `throughput` subcommand for vllm bench."""
 
     name = "throughput"
     help = "Benchmark offline inference throughput."
diff --git a/vllm/entrypoints/cli/collect_env.py b/vllm/entrypoints/cli/collect_env.py
index 785c18812adb..e79a7efec6ba 100644
--- a/vllm/entrypoints/cli/collect_env.py
+++ b/vllm/entrypoints/cli/collect_env.py
@@ -14,7 +14,8 @@
 
 
 class CollectEnvSubcommand(CLISubcommand):
-    """The `collect-env` subcommand for the vLLM CLI. """
+    """The `collect-env` subcommand for the vLLM CLI."""
+
     name = "collect-env"
 
     @staticmethod
@@ -23,13 +24,14 @@ def cmd(args: argparse.Namespace) -> None:
         collect_env_main()
 
     def subparser_init(
-            self,
-            subparsers: argparse._SubParsersAction) -> FlexibleArgumentParser:
+        self, subparsers: argparse._SubParsersAction
+    ) -> FlexibleArgumentParser:
         return subparsers.add_parser(
             "collect-env",
             help="Start collecting environment information.",
             description="Start collecting environment information.",
-            usage="vllm collect-env")
+            usage="vllm collect-env",
+        )
 
 
 def cmd_init() -> list[CLISubcommand]:
diff --git a/vllm/entrypoints/cli/main.py b/vllm/entrypoints/cli/main.py
index f1bcbc8262bd..0ebfe1c22269 100644
--- a/vllm/entrypoints/cli/main.py
+++ b/vllm/entrypoints/cli/main.py
@@ -1,9 +1,10 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-'''The CLI entrypoints of vLLM
+"""The CLI entrypoints of vLLM
 
 Note that all future modules must be lazily loaded within main
-to avoid certain eager import breakage.'''
+to avoid certain eager import breakage."""
+
 from __future__ import annotations
 
 import importlib.metadata
@@ -33,18 +34,17 @@ def main():
         epilog=VLLM_SUBCMD_PARSER_EPILOG.format(subcmd="[subcommand]"),
     )
     parser.add_argument(
-        '-v',
-        '--version',
-        action='version',
-        version=importlib.metadata.version('vllm'),
+        "-v",
+        "--version",
+        action="version",
+        version=importlib.metadata.version("vllm"),
     )
     subparsers = parser.add_subparsers(required=False, dest="subparser")
     cmds = {}
     for cmd_module in CMD_MODULES:
         new_cmds = cmd_module.cmd_init()
         for cmd in new_cmds:
-            cmd.subparser_init(subparsers).set_defaults(
-                dispatch_function=cmd.cmd)
+            cmd.subparser_init(subparsers).set_defaults(dispatch_function=cmd.cmd)
             cmds[cmd.name] = cmd
     args = parser.parse_args()
     if args.subparser in cmds:
diff --git a/vllm/entrypoints/cli/openai.py b/vllm/entrypoints/cli/openai.py
index 1929d6a7f77a..5372210bbf55 100644
--- a/vllm/entrypoints/cli/openai.py
+++ b/vllm/entrypoints/cli/openai.py
@@ -19,7 +19,6 @@
 
 
 def _register_signal_handlers():
-
     def signal_handler(sig, frame):
         sys.exit(0)
 
@@ -80,26 +79,29 @@ def chat(system_prompt: str | None, model_name: str, client: OpenAI) -> None:
             break
         conversation.append({"role": "user", "content": input_message})
 
-        stream = client.chat.completions.create(model=model_name,
-                                                messages=conversation,
-                                                stream=True)
+        stream = client.chat.completions.create(
+            model=model_name, messages=conversation, stream=True
+        )
         output = _print_chat_stream(stream)
         conversation.append({"role": "assistant", "content": output})
 
 
-def _add_query_options(
-        parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
+def _add_query_options(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
     parser.add_argument(
         "--url",
         type=str,
         default="http://localhost:8000/v1",
-        help="url of the running OpenAI-Compatible RESTful API server")
+        help="url of the running OpenAI-Compatible RESTful API server",
+    )
     parser.add_argument(
         "--model-name",
         type=str,
         default=None,
-        help=("The model name used in prompt completion, default to "
-              "the first model in list models API call."))
+        help=(
+            "The model name used in prompt completion, default to "
+            "the first model in list models API call."
+        ),
+    )
     parser.add_argument(
         "--api-key",
         type=str,
@@ -107,12 +109,14 @@ def _add_query_options(
         help=(
             "API key for OpenAI services. If provided, this api key "
             "will overwrite the api key obtained through environment variables."
-        ))
+        ),
+    )
     return parser
 
 
 class ChatCommand(CLISubcommand):
-    """The `chat` subcommand for the vLLM CLI. """
+    """The `chat` subcommand for the vLLM CLI."""
+
     name = "chat"
 
     @staticmethod
@@ -127,9 +131,9 @@ def cmd(args: argparse.Namespace) -> None:
         if args.quick:
             conversation.append({"role": "user", "content": args.quick})
 
-            stream = client.chat.completions.create(model=model_name,
-                                                    messages=conversation,
-                                                    stream=True)
+            stream = client.chat.completions.create(
+                model=model_name, messages=conversation, stream=True
+            )
             output = _print_chat_stream(stream)
             conversation.append({"role": "assistant", "content": output})
             return
@@ -142,9 +146,9 @@ def cmd(args: argparse.Namespace) -> None:
                 break
             conversation.append({"role": "user", "content": input_message})
 
-            stream = client.chat.completions.create(model=model_name,
-                                                    messages=conversation,
-                                                    stream=True)
+            stream = client.chat.completions.create(
+                model=model_name, messages=conversation, stream=True
+            )
             output = _print_chat_stream(stream)
             conversation.append({"role": "assistant", "content": output})
 
@@ -156,39 +160,45 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
             "--system-prompt",
             type=str,
             default=None,
-            help=("The system prompt to be added to the chat template, "
-                  "used for models that support system prompts."))
-        parser.add_argument("-q",
-                            "--quick",
-                            type=str,
-                            metavar="MESSAGE",
-                            help=("Send a single prompt as MESSAGE "
-                                  "and print the response, then exit."))
+            help=(
+                "The system prompt to be added to the chat template, "
+                "used for models that support system prompts."
+            ),
+        )
+        parser.add_argument(
+            "-q",
+            "--quick",
+            type=str,
+            metavar="MESSAGE",
+            help=("Send a single prompt as MESSAGE and print the response, then exit."),
+        )
         return parser
 
     def subparser_init(
-            self,
-            subparsers: argparse._SubParsersAction) -> FlexibleArgumentParser:
+        self, subparsers: argparse._SubParsersAction
+    ) -> FlexibleArgumentParser:
         parser = subparsers.add_parser(
             "chat",
             help="Generate chat completions via the running API server.",
             description="Generate chat completions via the running API server.",
-            usage="vllm chat [options]")
+            usage="vllm chat [options]",
+        )
         return ChatCommand.add_cli_args(parser)
 
 
 class CompleteCommand(CLISubcommand):
-    """The `complete` subcommand for the vLLM CLI. """
-    name = 'complete'
+    """The `complete` subcommand for the vLLM CLI."""
+
+    name = "complete"
 
     @staticmethod
     def cmd(args: argparse.Namespace) -> None:
         model_name, client = _interactive_cli(args)
 
         if args.quick:
-            stream = client.completions.create(model=model_name,
-                                               prompt=args.quick,
-                                               stream=True)
+            stream = client.completions.create(
+                model=model_name, prompt=args.quick, stream=True
+            )
             _print_completion_stream(stream)
             return
 
@@ -198,9 +208,9 @@ def cmd(args: argparse.Namespace) -> None:
                 input_prompt = input("> ")
             except EOFError:
                 break
-            stream = client.completions.create(model=model_name,
-                                               prompt=input_prompt,
-                                               stream=True)
+            stream = client.completions.create(
+                model=model_name, prompt=input_prompt, stream=True
+            )
             _print_completion_stream(stream)
 
     @staticmethod
@@ -212,20 +222,25 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
             "--quick",
             type=str,
             metavar="PROMPT",
-            help=
-            "Send a single prompt and print the completion output, then exit.")
+            help="Send a single prompt and print the completion output, then exit.",
+        )
         return parser
 
     def subparser_init(
-            self,
-            subparsers: argparse._SubParsersAction) -> FlexibleArgumentParser:
+        self, subparsers: argparse._SubParsersAction
+    ) -> FlexibleArgumentParser:
         parser = subparsers.add_parser(
             "complete",
-            help=("Generate text completions based on the given prompt "
-                  "via the running API server."),
-            description=("Generate text completions based on the given prompt "
-                         "via the running API server."),
-            usage="vllm complete [options]")
+            help=(
+                "Generate text completions based on the given prompt "
+                "via the running API server."
+            ),
+            description=(
+                "Generate text completions based on the given prompt "
+                "via the running API server."
+            ),
+            usage="vllm complete [options]",
+        )
         return CompleteCommand.add_cli_args(parser)
 
 
diff --git a/vllm/entrypoints/cli/run_batch.py b/vllm/entrypoints/cli/run_batch.py
index e669464bff83..6e7a15ada49c 100644
--- a/vllm/entrypoints/cli/run_batch.py
+++ b/vllm/entrypoints/cli/run_batch.py
@@ -20,14 +20,16 @@
 
 class RunBatchSubcommand(CLISubcommand):
     """The `run-batch` subcommand for vLLM CLI."""
+
     name = "run-batch"
 
     @staticmethod
     def cmd(args: argparse.Namespace) -> None:
         from vllm.entrypoints.openai.run_batch import main as run_batch_main
 
-        logger.info("vLLM batch processing API version %s",
-                    importlib.metadata.version("vllm"))
+        logger.info(
+            "vLLM batch processing API version %s", importlib.metadata.version("vllm")
+        )
         logger.info("args: %s", args)
 
         # Start the Prometheus metrics server.
@@ -44,8 +46,8 @@ def cmd(args: argparse.Namespace) -> None:
         asyncio.run(run_batch_main(args))
 
     def subparser_init(
-            self,
-            subparsers: argparse._SubParsersAction) -> FlexibleArgumentParser:
+        self, subparsers: argparse._SubParsersAction
+    ) -> FlexibleArgumentParser:
         from vllm.entrypoints.openai.run_batch import make_arg_parser
 
         run_batch_parser = subparsers.add_parser(
@@ -53,13 +55,12 @@ def subparser_init(
             help="Run batch prompts and write results to file.",
             description=(
                 "Run batch prompts using vLLM's OpenAI-compatible API.\n"
-                "Supports local or HTTP input/output files."),
-            usage=
-            "vllm run-batch -i INPUT.jsonl -o OUTPUT.jsonl --model <model>",
+                "Supports local or HTTP input/output files."
+            ),
+            usage="vllm run-batch -i INPUT.jsonl -o OUTPUT.jsonl --model <model>",
         )
         run_batch_parser = make_arg_parser(run_batch_parser)
-        run_batch_parser.epilog = VLLM_SUBCMD_PARSER_EPILOG.format(
-            subcmd=self.name)
+        run_batch_parser.epilog = VLLM_SUBCMD_PARSER_EPILOG.format(subcmd=self.name)
         return run_batch_parser
 
 
diff --git a/vllm/entrypoints/cli/serve.py b/vllm/entrypoints/cli/serve.py
index 0a5547144800..b3960b74cf01 100644
--- a/vllm/entrypoints/cli/serve.py
+++ b/vllm/entrypoints/cli/serve.py
@@ -10,21 +10,26 @@
 import vllm
 import vllm.envs as envs
 from vllm.entrypoints.cli.types import CLISubcommand
-from vllm.entrypoints.openai.api_server import (run_server, run_server_worker,
-                                                setup_server)
-from vllm.entrypoints.openai.cli_args import (make_arg_parser,
-                                              validate_parsed_serve_args)
+from vllm.entrypoints.openai.api_server import (
+    run_server,
+    run_server_worker,
+    setup_server,
+)
+from vllm.entrypoints.openai.cli_args import make_arg_parser, validate_parsed_serve_args
 from vllm.entrypoints.utils import VLLM_SUBCMD_PARSER_EPILOG
 from vllm.logger import init_logger
 from vllm.usage.usage_lib import UsageContext
-from vllm.utils import (FlexibleArgumentParser, decorate_logs, get_tcp_uri,
-                        set_process_title)
+from vllm.utils import (
+    FlexibleArgumentParser,
+    decorate_logs,
+    get_tcp_uri,
+    set_process_title,
+)
 from vllm.v1.engine.core import EngineCoreProc
 from vllm.v1.engine.utils import CoreEngineProcManager, launch_core_engines
 from vllm.v1.executor.abstract import Executor
 from vllm.v1.metrics.prometheus import setup_multiprocess_prometheus
-from vllm.v1.utils import (APIServerProcessManager,
-                           wait_for_completion_or_failure)
+from vllm.v1.utils import APIServerProcessManager, wait_for_completion_or_failure
 
 logger = init_logger(__name__)
 
@@ -38,13 +43,14 @@
 
 
 class ServeSubcommand(CLISubcommand):
-    """The `serve` subcommand for the vLLM CLI. """
+    """The `serve` subcommand for the vLLM CLI."""
+
     name = "serve"
 
     @staticmethod
     def cmd(args: argparse.Namespace) -> None:
         # If model is specified in CLI (as positional arg), it takes precedence
-        if hasattr(args, 'model_tag') and args.model_tag is not None:
+        if hasattr(args, "model_tag") and args.model_tag is not None:
             args.model = args.model_tag
 
         if args.headless or args.api_server_count < 1:
@@ -60,16 +66,14 @@ def validate(self, args: argparse.Namespace) -> None:
         validate_parsed_serve_args(args)
 
     def subparser_init(
-            self,
-            subparsers: argparse._SubParsersAction) -> FlexibleArgumentParser:
+        self, subparsers: argparse._SubParsersAction
+    ) -> FlexibleArgumentParser:
         serve_parser = subparsers.add_parser(
-            self.name,
-            description=DESCRIPTION,
-            usage="vllm serve [model_tag] [options]")
+            self.name, description=DESCRIPTION, usage="vllm serve [model_tag] [options]"
+        )
 
         serve_parser = make_arg_parser(serve_parser)
-        serve_parser.epilog = VLLM_SUBCMD_PARSER_EPILOG.format(
-            subcmd=self.name)
+        serve_parser.epilog = VLLM_SUBCMD_PARSER_EPILOG.format(subcmd=self.name)
         return serve_parser
 
 
@@ -78,29 +82,27 @@ def cmd_init() -> list[CLISubcommand]:
 
 
 def run_headless(args: argparse.Namespace):
-
     if args.api_server_count > 1:
         raise ValueError("api_server_count can't be set in headless mode")
 
     # Create the EngineConfig.
     engine_args = vllm.AsyncEngineArgs.from_cli_args(args)
     usage_context = UsageContext.OPENAI_API_SERVER
-    vllm_config = engine_args.create_engine_config(usage_context=usage_context,
-                                                   headless=True)
+    vllm_config = engine_args.create_engine_config(
+        usage_context=usage_context, headless=True
+    )
 
     if not envs.VLLM_USE_V1:
         raise ValueError("Headless mode is only supported for V1")
 
     if engine_args.data_parallel_hybrid_lb:
-        raise ValueError("data_parallel_hybrid_lb is not applicable in "
-                         "headless mode")
+        raise ValueError("data_parallel_hybrid_lb is not applicable in headless mode")
 
     parallel_config = vllm_config.parallel_config
     local_engine_count = parallel_config.data_parallel_size_local
 
     if local_engine_count <= 0:
-        raise ValueError("data_parallel_size_local must be > 0 in "
-                         "headless mode")
+        raise ValueError("data_parallel_size_local must be > 0 in headless mode")
 
     host = parallel_config.data_parallel_master_ip
     port = engine_args.data_parallel_rpc_port  # add to config too
@@ -116,7 +118,10 @@ def signal_handler(signum, frame):
 
     logger.info(
         "Launching %d data parallel engine(s) in headless mode, "
-        "with head node address %s.", local_engine_count, handshake_address)
+        "with head node address %s.",
+        local_engine_count,
+        handshake_address,
+    )
 
     # Create the engines.
     engine_manager = CoreEngineProcManager(
@@ -139,7 +144,6 @@ def signal_handler(signum, frame):
 
 
 def run_multi_api_server(args: argparse.Namespace):
-
     assert not args.headless
     num_api_servers: int = args.api_server_count
     assert num_api_servers > 0
@@ -161,8 +165,10 @@ def run_multi_api_server(args: argparse.Namespace):
             raise ValueError("api_server_count > 1 is only supported for V1")
 
         if envs.VLLM_ALLOW_RUNTIME_LORA_UPDATING:
-            raise ValueError("VLLM_ALLOW_RUNTIME_LORA_UPDATING cannot be used "
-                             "with api_server_count > 1")
+            raise ValueError(
+                "VLLM_ALLOW_RUNTIME_LORA_UPDATING cannot be used "
+                "with api_server_count > 1"
+            )
 
     executor_class = Executor.get_class(vllm_config)
     log_stats = not engine_args.disable_log_stats
@@ -175,10 +181,9 @@ def run_multi_api_server(args: argparse.Namespace):
 
     api_server_manager: Optional[APIServerProcessManager] = None
 
-    with launch_core_engines(vllm_config, executor_class, log_stats,
-                             num_api_servers) as (local_engine_manager,
-                                                  coordinator, addresses):
-
+    with launch_core_engines(
+        vllm_config, executor_class, log_stats, num_api_servers
+    ) as (local_engine_manager, coordinator, addresses):
         # Construct common args for the APIServerProcessManager up-front.
         api_server_manager_kwargs = dict(
             target_server_fn=run_api_server_worker_proc,
@@ -189,7 +194,9 @@ def run_multi_api_server(args: argparse.Namespace):
             input_addresses=addresses.inputs,
             output_addresses=addresses.outputs,
             stats_update_address=coordinator.get_stats_publish_address()
-            if coordinator else None)
+            if coordinator
+            else None,
+        )
 
         # For dp ranks > 0 in external/hybrid DP LB modes, we must delay the
         # start of the API servers until the local engine is started
@@ -198,27 +205,26 @@ def run_multi_api_server(args: argparse.Namespace):
         # via the handshake with the local engine.
         if dp_rank == 0 or not (external_dp_lb or hybrid_dp_lb):
             # Start API servers using the manager.
-            api_server_manager = APIServerProcessManager(
-                **api_server_manager_kwargs)
+            api_server_manager = APIServerProcessManager(**api_server_manager_kwargs)
 
     # Start API servers now if they weren't already started.
     if api_server_manager is None:
         api_server_manager_kwargs["stats_update_address"] = (
-            addresses.frontend_stats_publish_address)
-        api_server_manager = APIServerProcessManager(
-            **api_server_manager_kwargs)
+            addresses.frontend_stats_publish_address
+        )
+        api_server_manager = APIServerProcessManager(**api_server_manager_kwargs)
 
     # Wait for API servers
-    wait_for_completion_or_failure(api_server_manager=api_server_manager,
-                                   engine_manager=local_engine_manager,
-                                   coordinator=coordinator)
+    wait_for_completion_or_failure(
+        api_server_manager=api_server_manager,
+        engine_manager=local_engine_manager,
+        coordinator=coordinator,
+    )
 
 
-def run_api_server_worker_proc(listen_address,
-                               sock,
-                               args,
-                               client_config=None,
-                               **uvicorn_kwargs) -> None:
+def run_api_server_worker_proc(
+    listen_address, sock, args, client_config=None, **uvicorn_kwargs
+) -> None:
     """Entrypoint for individual API server worker processes."""
     client_config = client_config or {}
     server_index = client_config.get("client_index", 0)
@@ -228,5 +234,5 @@ def run_api_server_worker_proc(listen_address,
     decorate_logs()
 
     uvloop.run(
-        run_server_worker(listen_address, sock, args, client_config,
-                          **uvicorn_kwargs))
+        run_server_worker(listen_address, sock, args, client_config, **uvicorn_kwargs)
+    )
diff --git a/vllm/entrypoints/cli/types.py b/vllm/entrypoints/cli/types.py
index b88f094b302a..6194f421a1bb 100644
--- a/vllm/entrypoints/cli/types.py
+++ b/vllm/entrypoints/cli/types.py
@@ -24,6 +24,6 @@ def validate(self, args: argparse.Namespace) -> None:
         pass
 
     def subparser_init(
-            self,
-            subparsers: argparse._SubParsersAction) -> FlexibleArgumentParser:
+        self, subparsers: argparse._SubParsersAction
+    ) -> FlexibleArgumentParser:
         raise NotImplementedError("Subclasses should implement this method")
diff --git a/vllm/entrypoints/context.py b/vllm/entrypoints/context.py
index ea81fdbcd825..f410ee9c4045 100644
--- a/vllm/entrypoints/context.py
+++ b/vllm/entrypoints/context.py
@@ -12,7 +12,10 @@
 from openai_harmony import Author, Message, Role, StreamState, TextContent
 
 from vllm.entrypoints.harmony_utils import (
-    get_encoding, get_streamable_parser_for_assistant, render_for_completion)
+    get_encoding,
+    get_streamable_parser_for_assistant,
+    render_for_completion,
+)
 from vllm.entrypoints.tool import Tool
 from vllm.entrypoints.tool_server import ToolServer
 from vllm.outputs import RequestOutput
@@ -34,10 +37,11 @@
 
 def _map_tool_name_to_tool_type(tool_name: str) -> str:
     if tool_name not in _TOOL_NAME_TO_TYPE_MAP:
-        available_tools = ', '.join(_TOOL_NAME_TO_TYPE_MAP.keys())
+        available_tools = ", ".join(_TOOL_NAME_TO_TYPE_MAP.keys())
         raise ValueError(
             f"Built-in tool name '{tool_name}' not defined in mapping. "
-            f"Available tools: {available_tools}")
+            f"Available tools: {available_tools}"
+        )
     return _TOOL_NAME_TO_TYPE_MAP[tool_name]
 
 
@@ -59,7 +63,6 @@ def copy(self):
 
 
 class ConversationContext(ABC):
-
     @abstractmethod
     def append_output(self, output) -> None:
         pass
@@ -77,9 +80,13 @@ def render_for_completion(self) -> list[int]:
         pass
 
     @abstractmethod
-    async def init_tool_sessions(self, tool_server: Optional[ToolServer],
-                                 exit_stack: AsyncExitStack, request_id: str,
-                                 mcp_tools: dict[str, Mcp]) -> None:
+    async def init_tool_sessions(
+        self,
+        tool_server: Optional[ToolServer],
+        exit_stack: AsyncExitStack,
+        request_id: str,
+        mcp_tools: dict[str, Mcp],
+    ) -> None:
         pass
 
     @abstractmethod
@@ -88,7 +95,6 @@ async def cleanup_session(self) -> None:
 
 
 class SimpleContext(ConversationContext):
-
     def __init__(self):
         self.last_output = None
         self.num_prompt_tokens = 0
@@ -114,9 +120,13 @@ async def call_tool(self) -> list[Message]:
     def render_for_completion(self) -> list[int]:
         raise NotImplementedError("Should not be called.")
 
-    async def init_tool_sessions(self, tool_server: Optional[ToolServer],
-                                 exit_stack: AsyncExitStack, request_id: str,
-                                 mcp_tools: dict[str, Mcp]) -> None:
+    async def init_tool_sessions(
+        self,
+        tool_server: Optional[ToolServer],
+        exit_stack: AsyncExitStack,
+        request_id: str,
+        mcp_tools: dict[str, Mcp],
+    ) -> None:
         pass
 
     async def cleanup_session(self) -> None:
@@ -124,7 +134,6 @@ async def cleanup_session(self) -> None:
 
 
 class HarmonyContext(ConversationContext):
-
     def __init__(
         self,
         messages: list,
@@ -155,8 +164,7 @@ def _update_num_reasoning_tokens(self):
         if self.parser.current_channel in {"analysis", "commentary"}:
             self.num_reasoning_tokens += 1
 
-    def append_output(self, output: Union[RequestOutput,
-                                          list[Message]]) -> None:
+    def append_output(self, output: Union[RequestOutput, list[Message]]) -> None:
         if isinstance(output, RequestOutput):
             output_token_ids = output.outputs[0].token_ids
             self.parser = get_streamable_parser_for_assistant()
@@ -202,8 +210,7 @@ def _update_prefill_token_usage(self, output: RequestOutput) -> None:
             this_turn_input_tokens = len(output.prompt_token_ids)
         else:
             this_turn_input_tokens = 0
-            logger.error(
-                "RequestOutput appended contains no prompt_token_ids.")
+            logger.error("RequestOutput appended contains no prompt_token_ids.")
 
         # Update current turn input tokens
         self.current_turn.input_tokens = this_turn_input_tokens
@@ -216,9 +223,11 @@ def _update_prefill_token_usage(self, output: RequestOutput) -> None:
             # start counting tool after first turn
             # tool tokens = this turn prefill - last turn prefill -
             # last turn decode
-            this_turn_tool_tokens = (self.current_turn.input_tokens -
-                                     self.previous_turn.input_tokens -
-                                     self.previous_turn.output_tokens)
+            this_turn_tool_tokens = (
+                self.current_turn.input_tokens
+                - self.previous_turn.input_tokens
+                - self.previous_turn.output_tokens
+            )
 
             # Handle negative tool token counts (shouldn't happen in normal
             # cases)
@@ -227,9 +236,11 @@ def _update_prefill_token_usage(self, output: RequestOutput) -> None:
                     "Negative tool output tokens calculated: %d "
                     "(current_input=%d, previous_input=%d, "
                     "previous_output=%d). Setting to 0.",
-                    this_turn_tool_tokens, self.current_turn.input_tokens,
+                    this_turn_tool_tokens,
+                    self.current_turn.input_tokens,
                     self.previous_turn.input_tokens,
-                    self.previous_turn.output_tokens)
+                    self.previous_turn.output_tokens,
+                )
                 this_turn_tool_tokens = 0
 
             self.num_tool_output_tokens += this_turn_tool_tokens
@@ -271,9 +282,11 @@ def messages(self) -> list:
     def need_builtin_tool_call(self) -> bool:
         last_msg = self.messages[-1]
         recipient = last_msg.recipient
-        return recipient is not None and (recipient.startswith("browser.")
-                                          or recipient.startswith("python") or
-                                          recipient.startswith("container."))
+        return recipient is not None and (
+            recipient.startswith("browser.")
+            or recipient.startswith("python")
+            or recipient.startswith("container.")
+        )
 
     async def call_tool(self) -> list[Message]:
         if not self.messages:
@@ -283,21 +296,24 @@ async def call_tool(self) -> list[Message]:
         if recipient is not None:
             if recipient.startswith("browser."):
                 return await self.call_search_tool(
-                    self._tool_sessions["browser"], last_msg)
+                    self._tool_sessions["browser"], last_msg
+                )
             elif recipient.startswith("python"):
                 return await self.call_python_tool(
-                    self._tool_sessions["python"], last_msg)
+                    self._tool_sessions["python"], last_msg
+                )
             elif recipient.startswith("container."):
                 return await self.call_container_tool(
-                    self._tool_sessions["container"], last_msg)
+                    self._tool_sessions["container"], last_msg
+                )
         raise ValueError("No tool call found")
 
     def render_for_completion(self) -> list[int]:
         return render_for_completion(self.messages)
 
-    async def call_search_tool(self, tool_session: Union["ClientSession",
-                                                         Tool],
-                               last_msg: Message) -> list[Message]:
+    async def call_search_tool(
+        self, tool_session: Union["ClientSession", Tool], last_msg: Message
+    ) -> list[Message]:
         self.called_tools.add("browser")
         if isinstance(tool_session, Tool):
             return await tool_session.get_result(self)
@@ -308,15 +324,17 @@ async def call_search_tool(self, tool_session: Union["ClientSession",
         content = TextContent(text=result_str)
         author = Author(role=Role.TOOL, name=last_msg.recipient)
         return [
-            Message(author=author,
-                    content=[content],
-                    recipient=Role.ASSISTANT,
-                    channel=last_msg.channel)
+            Message(
+                author=author,
+                content=[content],
+                recipient=Role.ASSISTANT,
+                channel=last_msg.channel,
+            )
         ]
 
-    async def call_python_tool(self, tool_session: Union["ClientSession",
-                                                         Tool],
-                               last_msg: Message) -> list[Message]:
+    async def call_python_tool(
+        self, tool_session: Union["ClientSession", Tool], last_msg: Message
+    ) -> list[Message]:
         self.called_tools.add("python")
         if isinstance(tool_session, Tool):
             return await tool_session.get_result(self)
@@ -330,45 +348,52 @@ async def call_python_tool(self, tool_session: Union["ClientSession",
         author = Author(role=Role.TOOL, name="python")
 
         return [
-            Message(author=author,
-                    content=[content],
-                    channel=last_msg.channel,
-                    recipient=Role.ASSISTANT)
+            Message(
+                author=author,
+                content=[content],
+                channel=last_msg.channel,
+                recipient=Role.ASSISTANT,
+            )
         ]
 
-    async def init_tool_sessions(self, tool_server: Optional[ToolServer],
-                                 exit_stack: AsyncExitStack, request_id: str,
-                                 mcp_tools: dict[str, Mcp]):
+    async def init_tool_sessions(
+        self,
+        tool_server: Optional[ToolServer],
+        exit_stack: AsyncExitStack,
+        request_id: str,
+        mcp_tools: dict[str, Mcp],
+    ):
         if tool_server:
             for tool_name in self.available_tools:
                 if tool_name not in self._tool_sessions:
                     tool_type = _map_tool_name_to_tool_type(tool_name)
-                    headers = mcp_tools[
-                        tool_type].headers if tool_type in mcp_tools else None
+                    headers = (
+                        mcp_tools[tool_type].headers if tool_type in mcp_tools else None
+                    )
                     tool_session = await exit_stack.enter_async_context(
-                        tool_server.new_session(tool_name, request_id,
-                                                headers))
+                        tool_server.new_session(tool_name, request_id, headers)
+                    )
                     self._tool_sessions[tool_name] = tool_session
                     exit_stack.push_async_exit(self.cleanup_session)
 
-    async def call_container_tool(self, tool_session: Union["ClientSession",
-                                                            Tool],
-                                  last_msg: Message) -> list[Message]:
+    async def call_container_tool(
+        self, tool_session: Union["ClientSession", Tool], last_msg: Message
+    ) -> list[Message]:
         """
-            Call container tool. Expect this to be run in a stateful docker
-            with command line terminal.
-            The official container tool would at least
-            expect the following format:
-            - for tool name: exec
-                - args:
-                    {
-                        "cmd":List[str] "command to execute",
-                        "workdir":optional[str] "current working directory",
-                        "env":optional[object/dict] "environment variables",
-                        "session_name":optional[str] "session name",
-                        "timeout":optional[int] "timeout in seconds",
-                        "user":optional[str] "user name",
-                    }
+        Call container tool. Expect this to be run in a stateful docker
+        with command line terminal.
+        The official container tool would at least
+        expect the following format:
+        - for tool name: exec
+            - args:
+                {
+                    "cmd":List[str] "command to execute",
+                    "workdir":optional[str] "current working directory",
+                    "env":optional[object/dict] "environment variables",
+                    "session_name":optional[str] "session name",
+                    "timeout":optional[int] "timeout in seconds",
+                    "user":optional[str] "user name",
+                }
         """
         self.called_tools.add("container")
         if isinstance(tool_session, Tool):
@@ -380,10 +405,12 @@ async def call_container_tool(self, tool_session: Union["ClientSession",
         content = TextContent(text=result_str)
         author = Author(role=Role.TOOL, name=last_msg.recipient)
         return [
-            Message(author=author,
-                    content=[content],
-                    recipient=Role.ASSISTANT,
-                    channel=last_msg.channel)
+            Message(
+                author=author,
+                content=[content],
+                recipient=Role.ASSISTANT,
+                channel=last_msg.channel,
+            )
         ]
 
     async def cleanup_session(self, *args, **kwargs) -> None:
@@ -391,17 +418,21 @@ async def cleanup_session(self, *args, **kwargs) -> None:
 
         async def cleanup_tool_session(tool_session):
             if not isinstance(tool_session, Tool):
-                logger.info("Cleaning up tool session for %s",
-                            tool_session._client_info)
+                logger.info(
+                    "Cleaning up tool session for %s", tool_session._client_info
+                )
                 with contextlib.suppress(Exception):
                     await tool_session.call_tool("cleanup_session", {})
 
-        await asyncio.gather(*(cleanup_tool_session(self._tool_sessions[tool])
-                               for tool in self.called_tools))
+        await asyncio.gather(
+            *(
+                cleanup_tool_session(self._tool_sessions[tool])
+                for tool in self.called_tools
+            )
+        )
 
 
 class StreamingHarmonyContext(HarmonyContext):
-
     def __init__(self, *args, **kwargs):
         super().__init__(*args, **kwargs)
         self.last_output = None
@@ -415,8 +446,7 @@ def __init__(self, *args, **kwargs):
     def messages(self) -> list:
         return self._messages
 
-    def append_output(self, output: Union[RequestOutput,
-                                          list[Message]]) -> None:
+    def append_output(self, output: Union[RequestOutput, list[Message]]) -> None:
         if isinstance(output, RequestOutput):
             # append_output is called for each output token in streaming case,
             # so we only want to add the prompt tokens once for each message.
@@ -438,11 +468,10 @@ def append_output(self, output: Union[RequestOutput,
             # Check if the current token is part of reasoning content
             self._update_num_reasoning_tokens()
             self.last_tok = tok
-            if len(self._messages) - self.num_init_messages < len(
-                    self.parser.messages):
+            if len(self._messages) - self.num_init_messages < len(self.parser.messages):
                 self._messages.extend(
-                    self.parser.messages[len(self._messages) -
-                                         self.num_init_messages:])
+                    self.parser.messages[len(self._messages) - self.num_init_messages :]
+                )
         else:
             # Handle the case of tool output in direct message format
             assert len(output) == 1, "Tool output should be a single message"
@@ -461,8 +490,7 @@ def is_expecting_start(self) -> bool:
         return self.parser.state == StreamState.EXPECT_START
 
     def is_assistant_action_turn(self) -> bool:
-        return self.last_tok in self.encoding.stop_tokens_for_assistant_actions(
-        )
+        return self.last_tok in self.encoding.stop_tokens_for_assistant_actions()
 
     def render_for_completion(self) -> list[int]:
         # now this list of tokens as next turn's starting tokens
diff --git a/vllm/entrypoints/harmony_utils.py b/vllm/entrypoints/harmony_utils.py
index 0c1c9c3192fc..6a0bb152e412 100644
--- a/vllm/entrypoints/harmony_utils.py
+++ b/vllm/entrypoints/harmony_utils.py
@@ -8,23 +8,44 @@
 from collections.abc import Iterable, Sequence
 from typing import Literal, Optional, Union
 
-from openai.types.responses import (ResponseFunctionToolCall,
-                                    ResponseOutputItem, ResponseOutputMessage,
-                                    ResponseOutputText, ResponseReasoningItem)
+from openai.types.responses import (
+    ResponseFunctionToolCall,
+    ResponseOutputItem,
+    ResponseOutputMessage,
+    ResponseOutputText,
+    ResponseReasoningItem,
+)
 from openai.types.responses.response_function_web_search import (
-    ActionFind, ActionOpenPage, ActionSearch, ResponseFunctionWebSearch)
+    ActionFind,
+    ActionOpenPage,
+    ActionSearch,
+    ResponseFunctionWebSearch,
+)
 from openai.types.responses.response_reasoning_item import (
-    Content as ResponseReasoningTextContent)
+    Content as ResponseReasoningTextContent,
+)
 from openai.types.responses.tool import Tool
-from openai_harmony import (Author, ChannelConfig, Conversation,
-                            DeveloperContent, HarmonyEncodingName, Message,
-                            ReasoningEffort, Role, StreamableParser,
-                            SystemContent, TextContent, ToolDescription,
-                            load_harmony_encoding)
+from openai_harmony import (
+    Author,
+    ChannelConfig,
+    Conversation,
+    DeveloperContent,
+    HarmonyEncodingName,
+    Message,
+    ReasoningEffort,
+    Role,
+    StreamableParser,
+    SystemContent,
+    TextContent,
+    ToolDescription,
+    load_harmony_encoding,
+)
 
 from vllm import envs
-from vllm.entrypoints.openai.protocol import (ChatCompletionToolsParam,
-                                              ResponseInputOutputItem)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionToolsParam,
+    ResponseInputOutputItem,
+)
 from vllm.utils import random_uuid
 
 REASONING_EFFORT = {
@@ -53,8 +74,7 @@ def has_custom_tools(tool_types: list[str]) -> bool:
 def get_encoding():
     global _harmony_encoding
     if _harmony_encoding is None:
-        _harmony_encoding = load_harmony_encoding(
-            HarmonyEncodingName.HARMONY_GPT_OSS)
+        _harmony_encoding = load_harmony_encoding(HarmonyEncodingName.HARMONY_GPT_OSS)
     return _harmony_encoding
 
 
@@ -71,15 +91,16 @@ def get_system_message(
     sys_msg_content = SystemContent.new()
     if model_identity is not None:
         sys_msg_content = sys_msg_content.with_model_identity(model_identity)
-    if (instructions is not None
-            and envs.VLLM_GPT_OSS_HARMONY_SYSTEM_INSTRUCTIONS):
+    if instructions is not None and envs.VLLM_GPT_OSS_HARMONY_SYSTEM_INSTRUCTIONS:
         current_identity = sys_msg_content.model_identity
-        new_identity = (f'{current_identity}\n{instructions}'
-                        if current_identity else instructions)
+        new_identity = (
+            f"{current_identity}\n{instructions}" if current_identity else instructions
+        )
         sys_msg_content = sys_msg_content.with_model_identity(new_identity)
     if reasoning_effort is not None:
         sys_msg_content = sys_msg_content.with_reasoning_effort(
-            REASONING_EFFORT[reasoning_effort])
+            REASONING_EFFORT[reasoning_effort]
+        )
     if start_date is None:
         # NOTE(woosuk): This brings non-determinism in vLLM. Be careful.
         start_date = datetime.datetime.now().strftime("%Y-%m-%d")
@@ -94,7 +115,8 @@ def get_system_message(
         channel_config = sys_msg_content.channel_config
         invalid_channel = "commentary"
         new_config = ChannelConfig.require_channels(
-            [c for c in channel_config.valid_channels if c != invalid_channel])
+            [c for c in channel_config.valid_channels if c != invalid_channel]
+        )
         sys_msg_content = sys_msg_content.with_channel_config(new_config)
     sys_msg = Message.from_role_and_content(Role.SYSTEM, sys_msg_content)
     return sys_msg
@@ -119,14 +141,17 @@ def get_developer_message(
     tools: Optional[list[Union[Tool, ChatCompletionToolsParam]]] = None,
 ) -> Message:
     dev_msg_content = DeveloperContent.new()
-    if (instructions is not None
-            and not envs.VLLM_GPT_OSS_HARMONY_SYSTEM_INSTRUCTIONS):
+    if instructions is not None and not envs.VLLM_GPT_OSS_HARMONY_SYSTEM_INSTRUCTIONS:
         dev_msg_content = dev_msg_content.with_instructions(instructions)
     if tools is not None:
         function_tools: list[Union[Tool, ChatCompletionToolsParam]] = []
         for tool in tools:
-            if tool.type in ("web_search_preview", "code_interpreter",
-                             "container", "mcp"):
+            if tool.type in (
+                "web_search_preview",
+                "code_interpreter",
+                "container",
+                "mcp",
+            ):
                 # These are built-in tools that are added to the system message.
                 # Adding in MCP for now until we support MCP tools executed
                 # server side
@@ -141,7 +166,8 @@ def get_developer_message(
                 create_tool_definition(tool) for tool in function_tools
             ]
             dev_msg_content = dev_msg_content.with_function_tools(
-                function_tool_descriptions)
+                function_tool_descriptions
+            )
     dev_msg = Message.from_role_and_content(Role.DEVELOPER, dev_msg_content)
     return dev_msg
 
@@ -152,7 +178,7 @@ def get_user_message(content: str) -> Message:
 
 def parse_response_input(
     response_msg: ResponseInputOutputItem,
-    prev_responses: list[Union[ResponseOutputItem, ResponseReasoningItem]]
+    prev_responses: list[Union[ResponseOutputItem, ResponseReasoningItem]],
 ) -> Message:
     if not isinstance(response_msg, dict):
         response_msg = response_msg.model_dump()
@@ -170,9 +196,7 @@ def parse_response_input(
         if isinstance(content, str):
             msg = Message.from_role_and_content(role, text_prefix + content)
         else:
-            contents = [
-                TextContent(text=text_prefix + c["text"]) for c in content
-            ]
+            contents = [TextContent(text=text_prefix + c["text"]) for c in content]
             msg = Message.from_role_and_contents(role, contents)
         if role == "assistant":
             msg = msg.with_channel("final")
@@ -180,22 +204,24 @@ def parse_response_input(
         call_id = response_msg["call_id"]
         call_response: Optional[ResponseFunctionToolCall] = None
         for prev_response in reversed(prev_responses):
-            if isinstance(prev_response, ResponseFunctionToolCall
-                          ) and prev_response.call_id == call_id:
+            if (
+                isinstance(prev_response, ResponseFunctionToolCall)
+                and prev_response.call_id == call_id
+            ):
                 call_response = prev_response
                 break
         if call_response is None:
             raise ValueError(f"No call message found for {call_id}")
         msg = Message.from_author_and_content(
             Author.new(Role.TOOL, f"functions.{call_response.name}"),
-            response_msg["output"])
+            response_msg["output"],
+        )
     elif response_msg["type"] == "reasoning":
         content = response_msg["content"]
         assert len(content) == 1
         msg = Message.from_role_and_content(Role.ASSISTANT, content[0]["text"])
     elif response_msg["type"] == "function_call":
-        msg = Message.from_role_and_content(Role.ASSISTANT,
-                                            response_msg["arguments"])
+        msg = Message.from_role_and_content(Role.ASSISTANT, response_msg["arguments"])
         msg = msg.with_channel("commentary")
         msg = msg.with_recipient(f"functions.{response_msg['name']}")
         msg = msg.with_content_type("json")
@@ -231,8 +257,8 @@ def parse_chat_input(chat_msg) -> list[Message]:
         name = chat_msg.get("name", "")
         content = chat_msg.get("content", "") or ""
         msg = Message.from_author_and_content(
-            Author.new(Role.TOOL, f"functions.{name}"),
-            content).with_channel("commentary")
+            Author.new(Role.TOOL, f"functions.{name}"), content
+        ).with_channel("commentary")
         return [msg]
 
     # Default: user/assistant/system messages with content
@@ -249,7 +275,8 @@ def parse_chat_input(chat_msg) -> list[Message]:
 def render_for_completion(messages: list[Message]) -> list[int]:
     conversation = Conversation.from_messages(messages)
     token_ids = get_encoding().render_conversation_for_completion(
-        conversation, Role.ASSISTANT)
+        conversation, Role.ASSISTANT
+    )
     return token_ids
 
 
@@ -273,14 +300,18 @@ def parse_output_message(message: Message) -> list[ResponseOutputItem]:
         # TODO: translate to url properly!
         if recipient == "browser.search":
             action = ActionSearch(
-                query=f"cursor:{browser_call.get('query', '')}", type="search")
+                query=f"cursor:{browser_call.get('query', '')}", type="search"
+            )
         elif recipient == "browser.open":
             action = ActionOpenPage(
-                url=f"cursor:{browser_call.get('url', '')}", type="open_page")
+                url=f"cursor:{browser_call.get('url', '')}", type="open_page"
+            )
         elif recipient == "browser.find":
-            action = ActionFind(pattern=browser_call["pattern"],
-                                url=f"cursor:{browser_call.get('url', '')}",
-                                type="find")
+            action = ActionFind(
+                pattern=browser_call["pattern"],
+                url=f"cursor:{browser_call.get('url', '')}",
+                type="find",
+            )
         else:
             raise ValueError(f"Unknown browser action: {recipient}")
         web_search_item = ResponseFunctionWebSearch(
@@ -297,8 +328,9 @@ def parse_output_message(message: Message) -> list[ResponseOutputItem]:
                 summary=[],
                 type="reasoning",
                 content=[
-                    ResponseReasoningTextContent(text=content.text,
-                                                 type="reasoning_text")
+                    ResponseReasoningTextContent(
+                        text=content.text, type="reasoning_text"
+                    )
                 ],
                 status=None,
             )
@@ -316,17 +348,20 @@ def parse_output_message(message: Message) -> list[ResponseOutputItem]:
                     id=f"fc_{random_id}",
                 )
                 output_items.append(response_item)
-        elif recipient is not None and (recipient.startswith("python")
-                                        or recipient.startswith("browser")
-                                        or recipient.startswith("container")):
+        elif recipient is not None and (
+            recipient.startswith("python")
+            or recipient.startswith("browser")
+            or recipient.startswith("container")
+        ):
             for content in message.content:
                 reasoning_item = ResponseReasoningItem(
                     id=f"rs_{random_uuid()}",
                     summary=[],
                     type="reasoning",
                     content=[
-                        ResponseReasoningTextContent(text=content.text,
-                                                     type="reasoning_text")
+                        ResponseReasoningTextContent(
+                            text=content.text, type="reasoning_text"
+                        )
                     ],
                     status=None,
                 )
@@ -356,15 +391,13 @@ def parse_output_message(message: Message) -> list[ResponseOutputItem]:
     return output_items
 
 
-def parse_remaining_state(
-        parser: StreamableParser) -> list[ResponseOutputItem]:
+def parse_remaining_state(parser: StreamableParser) -> list[ResponseOutputItem]:
     if not parser.current_content:
         return []
     if parser.current_role != Role.ASSISTANT:
         return []
     current_recipient = parser.current_recipient
-    if (current_recipient is not None
-            and current_recipient.startswith("browser.")):
+    if current_recipient is not None and current_recipient.startswith("browser."):
         return []
 
     if parser.current_channel == "analysis":
@@ -373,8 +406,9 @@ def parse_remaining_state(
             summary=[],
             type="reasoning",
             content=[
-                ResponseReasoningTextContent(text=parser.current_content,
-                                             type="reasoning_text")
+                ResponseReasoningTextContent(
+                    text=parser.current_content, type="reasoning_text"
+                )
             ],
             status=None,
         )
@@ -415,7 +449,8 @@ def parse_output_into_messages(token_ids: Iterable[int]) -> StreamableParser:
 
 
 def parse_chat_output(
-        token_ids: Sequence[int]) -> tuple[Optional[str], Optional[str], bool]:
+    token_ids: Sequence[int],
+) -> tuple[Optional[str], Optional[str], bool]:
     parser = parse_output_into_messages(token_ids)
     output_msgs = parser.messages
     is_tool_call = False  # TODO: update this when tool call is supported
@@ -430,7 +465,6 @@ def parse_chat_output(
     else:
         reasoning_msg = output_msgs[:-1]
         final_msg = output_msgs[-1]
-        reasoning_content = "\n".join(
-            [msg.content[0].text for msg in reasoning_msg])
+        reasoning_content = "\n".join([msg.content[0].text for msg in reasoning_msg])
         final_content = final_msg.content[0].text
     return reasoning_content, final_content, is_tool_call
diff --git a/vllm/entrypoints/launcher.py b/vllm/entrypoints/launcher.py
index 8b2acedf805c..349437363c5b 100644
--- a/vllm/entrypoints/launcher.py
+++ b/vllm/entrypoints/launcher.py
@@ -12,8 +12,10 @@
 
 from vllm import envs
 from vllm.engine.protocol import EngineClient
-from vllm.entrypoints.constants import (H11_MAX_HEADER_COUNT_DEFAULT,
-                                        H11_MAX_INCOMPLETE_EVENT_SIZE_DEFAULT)
+from vllm.entrypoints.constants import (
+    H11_MAX_HEADER_COUNT_DEFAULT,
+    H11_MAX_INCOMPLETE_EVENT_SIZE_DEFAULT,
+)
 from vllm.entrypoints.ssl import SSLCertRefresher
 from vllm.logger import init_logger
 from vllm.utils import find_process_using_port
@@ -22,10 +24,12 @@
 logger = init_logger(__name__)
 
 
-async def serve_http(app: FastAPI,
-                     sock: Optional[socket.socket],
-                     enable_ssl_refresh: bool = False,
-                     **uvicorn_kwargs: Any):
+async def serve_http(
+    app: FastAPI,
+    sock: Optional[socket.socket],
+    enable_ssl_refresh: bool = False,
+    **uvicorn_kwargs: Any,
+):
     """
     Start a FastAPI app using Uvicorn, with support for custom Uvicorn config
     options.  Supports http header limits via h11_max_incomplete_event_size and
@@ -39,11 +43,12 @@ async def serve_http(app: FastAPI,
         if methods is None or path is None:
             continue
 
-        logger.info("Route: %s, Methods: %s", path, ', '.join(methods))
+        logger.info("Route: %s, Methods: %s", path, ", ".join(methods))
 
     # Extract header limit options if present
     h11_max_incomplete_event_size = uvicorn_kwargs.pop(
-        "h11_max_incomplete_event_size", None)
+        "h11_max_incomplete_event_size", None
+    )
     h11_max_header_count = uvicorn_kwargs.pop("h11_max_header_count", None)
 
     # Set safe defaults if not provided
@@ -62,16 +67,19 @@ async def serve_http(app: FastAPI,
 
     loop = asyncio.get_running_loop()
 
-    watchdog_task = loop.create_task(
-        watchdog_loop(server, app.state.engine_client))
-    server_task = loop.create_task(
-        server.serve(sockets=[sock] if sock else None))
-
-    ssl_cert_refresher = None if not enable_ssl_refresh else SSLCertRefresher(
-        ssl_context=config.ssl,
-        key_path=config.ssl_keyfile,
-        cert_path=config.ssl_certfile,
-        ca_path=config.ssl_ca_certs)
+    watchdog_task = loop.create_task(watchdog_loop(server, app.state.engine_client))
+    server_task = loop.create_task(server.serve(sockets=[sock] if sock else None))
+
+    ssl_cert_refresher = (
+        None
+        if not enable_ssl_refresh
+        else SSLCertRefresher(
+            ssl_context=config.ssl,
+            key_path=config.ssl_keyfile,
+            cert_path=config.ssl_certfile,
+            ca_path=config.ssl_ca_certs,
+        )
+    )
 
     def signal_handler() -> None:
         # prevents the uvicorn signal handler to exit early
@@ -95,7 +103,10 @@ async def dummy_shutdown() -> None:
         if process is not None:
             logger.warning(
                 "port %s is used by process %s launched with command:\n%s",
-                port, process, " ".join(process.cmdline()))
+                port,
+                process,
+                " ".join(process.cmdline()),
+            )
         logger.info("Shutting down FastAPI HTTP server.")
         return server.shutdown()
     finally:
@@ -131,14 +142,14 @@ def _add_shutdown_handlers(app: FastAPI, server: uvicorn.Server) -> None:
     """
     VLLM V1 AsyncLLM catches exceptions and returns
     only two types: EngineGenerateError and EngineDeadError.
-    
+
     EngineGenerateError is raised by the per request generate()
     method. This error could be request specific (and therefore
     recoverable - e.g. if there is an error in input processing).
-    
+
     EngineDeadError is raised by the background output_handler
     method. This error is global and therefore not recoverable.
-    
+
     We register these @app.exception_handlers to return nice
     responses to the end user if they occur and shut down if needed.
     See https://fastapi.tiangolo.com/tutorial/handling-errors/
diff --git a/vllm/entrypoints/llm.py b/vllm/entrypoints/llm.py
index 705a72f657a2..944de70c1d63 100644
--- a/vllm/entrypoints/llm.py
+++ b/vllm/entrypoints/llm.py
@@ -11,47 +11,76 @@
 from tqdm.auto import tqdm
 from typing_extensions import TypeVar
 
-from vllm.beam_search import (BeamSearchInstance, BeamSearchOutput,
-                              BeamSearchSequence,
-                              create_sort_beams_key_function)
-from vllm.config import (CompilationConfig, ModelDType,
-                         StructuredOutputsConfig, TokenizerMode, is_init_field)
-from vllm.engine.arg_utils import (ConvertOption, EngineArgs, HfOverrides,
-                                   PoolerConfig, RunnerOption)
-from vllm.entrypoints.chat_utils import (ChatCompletionMessageParam,
-                                         ChatTemplateContentFormatOption,
-                                         apply_hf_chat_template,
-                                         apply_mistral_chat_template,
-                                         parse_chat_messages,
-                                         resolve_chat_template_content_format)
+from vllm.beam_search import (
+    BeamSearchInstance,
+    BeamSearchOutput,
+    BeamSearchSequence,
+    create_sort_beams_key_function,
+)
+from vllm.config import (
+    CompilationConfig,
+    ModelDType,
+    StructuredOutputsConfig,
+    TokenizerMode,
+    is_init_field,
+)
+from vllm.engine.arg_utils import (
+    ConvertOption,
+    EngineArgs,
+    HfOverrides,
+    PoolerConfig,
+    RunnerOption,
+)
+from vllm.entrypoints.chat_utils import (
+    ChatCompletionMessageParam,
+    ChatTemplateContentFormatOption,
+    apply_hf_chat_template,
+    apply_mistral_chat_template,
+    parse_chat_messages,
+    resolve_chat_template_content_format,
+)
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.entrypoints.score_utils import (ScoreContentPartParam,
-                                          ScoreMultiModalParam,
-                                          _cosine_similarity,
-                                          _validate_score_input_lens,
-                                          compress_token_type_ids,
-                                          get_score_prompt)
+from vllm.entrypoints.score_utils import (
+    ScoreContentPartParam,
+    ScoreMultiModalParam,
+    _cosine_similarity,
+    _validate_score_input_lens,
+    compress_token_type_ids,
+    get_score_prompt,
+)
+
 # yapf: enable
-from vllm.entrypoints.utils import (_validate_truncation_size,
-                                    log_non_default_args)
-from vllm.inputs import (DataPrompt, PromptType, SingletonPrompt, TextPrompt,
-                         TokensPrompt)
+from vllm.entrypoints.utils import _validate_truncation_size, log_non_default_args
+from vllm.inputs import (
+    DataPrompt,
+    PromptType,
+    SingletonPrompt,
+    TextPrompt,
+    TokensPrompt,
+)
 from vllm.inputs.parse import get_prompt_components
 from vllm.logger import init_logger
 from vllm.lora.request import LoRARequest
 from vllm.model_executor.layers.quantization import QuantizationMethods
-from vllm.outputs import (ClassificationRequestOutput, EmbeddingRequestOutput,
-                          PoolingRequestOutput, RequestOutput,
-                          ScoringRequestOutput)
+from vllm.outputs import (
+    ClassificationRequestOutput,
+    EmbeddingRequestOutput,
+    PoolingRequestOutput,
+    RequestOutput,
+    ScoringRequestOutput,
+)
 from vllm.plugins.io_processors import get_io_processor
 from vllm.pooling_params import PoolingParams
-from vllm.sampling_params import (BeamSearchParams, RequestOutputKind,
-                                  SamplingParams)
+from vllm.sampling_params import BeamSearchParams, RequestOutputKind, SamplingParams
 from vllm.tasks import PoolingTask
-from vllm.transformers_utils.tokenizer import (AnyTokenizer, MistralTokenizer,
-                                               get_cached_tokenizer,
-                                               init_tokenizer_from_configs)
+from vllm.transformers_utils.tokenizer import (
+    AnyTokenizer,
+    MistralTokenizer,
+    get_cached_tokenizer,
+    init_tokenizer_from_configs,
+)
 from vllm.usage.usage_lib import UsageContext
 from vllm.utils import Counter, Device, as_iter, is_list_of
 from vllm.v1.engine import EngineCoreRequest
@@ -90,7 +119,7 @@ class LLM:
             or videos from directories specified by the server file system.
             This is a security risk. Should only be enabled in trusted
             environments.
-        allowed_media_domains: If set, only media URLs that belong to this 
+        allowed_media_domains: If set, only media URLs that belong to this
             domain can be used for multi-modal inputs.
         tensor_parallel_size: The number of GPUs to use for distributed
             execution with tensor parallelism.
@@ -192,13 +221,14 @@ def __init__(
         mm_processor_kwargs: Optional[dict[str, Any]] = None,
         pooler_config: Optional[PoolerConfig] = None,
         override_pooler_config: Optional[PoolerConfig] = None,
-        structured_outputs_config: Optional[Union[dict[
-            str, Any], StructuredOutputsConfig]] = None,
+        structured_outputs_config: Optional[
+            Union[dict[str, Any], StructuredOutputsConfig]
+        ] = None,
         kv_cache_memory_bytes: Optional[int] = None,
-        compilation_config: Optional[Union[int, dict[str, Any],
-                                           CompilationConfig]] = None,
-        logits_processors: Optional[list[Union[str,
-                                               type[LogitsProcessor]]]] = None,
+        compilation_config: Optional[
+            Union[int, dict[str, Any], CompilationConfig]
+        ] = None,
+        logits_processors: Optional[list[Union[str, type[LogitsProcessor]]]] = None,
         **kwargs: Any,
     ) -> None:
         """LLM constructor."""
@@ -214,21 +244,23 @@ def __init__(
                 kwargs["worker_cls"] = cloudpickle.dumps(worker_cls)
 
         if "kv_transfer_config" in kwargs and isinstance(
-                kwargs["kv_transfer_config"], dict):
+            kwargs["kv_transfer_config"], dict
+        ):
             from vllm.config.kv_transfer import KVTransferConfig
+
             raw_config_dict = kwargs["kv_transfer_config"]
             try:
-                kwargs["kv_transfer_config"] = KVTransferConfig(
-                    **raw_config_dict)
+                kwargs["kv_transfer_config"] = KVTransferConfig(**raw_config_dict)
             except ValidationError as e:
                 logger.error(
                     "Failed to convert 'kv_transfer_config' dict to "
                     "KVTransferConfig object. Dict: %s. Error: %s",
-                    raw_config_dict, e)
+                    raw_config_dict,
+                    e,
+                )
                 # Consider re-raising a more specific vLLM error or ValueError
                 # to provide better context to the user.
-                raise ValueError(
-                    f"Invalid 'kv_transfer_config' provided: {e}") from e
+                raise ValueError(f"Invalid 'kv_transfer_config' provided: {e}") from e
 
         if hf_overrides is None:
             hf_overrides = {}
@@ -236,14 +268,16 @@ def __init__(
         if compilation_config is not None:
             if isinstance(compilation_config, int):
                 compilation_config_instance = CompilationConfig(
-                    level=compilation_config)
+                    level=compilation_config
+                )
             elif isinstance(compilation_config, dict):
                 compilation_config_instance = CompilationConfig(
                     **{
                         k: v
                         for k, v in compilation_config.items()
                         if is_init_field(CompilationConfig, k)
-                    })
+                    }
+                )
             else:
                 compilation_config_instance = compilation_config
         else:
@@ -256,7 +290,8 @@ def __init__(
                         k: v
                         for k, v in structured_outputs_config.items()
                         if is_init_field(StructuredOutputsConfig, k)
-                    })
+                    }
+                )
             else:
                 structured_outputs_instance = structured_outputs_config
         else:
@@ -299,7 +334,8 @@ def __init__(
 
         # Create the Engine (autoselects V0 vs V1)
         self.llm_engine = LLMEngine.from_engine_args(
-            engine_args=engine_args, usage_context=UsageContext.LLM_CLASS)
+            engine_args=engine_args, usage_context=UsageContext.LLM_CLASS
+        )
         self.engine_class = type(self.llm_engine)
 
         self.request_counter = Counter()
@@ -313,8 +349,9 @@ def __init__(
 
         # Load the Input/Output processor plugin if any
         io_processor_plugin = self.llm_engine.model_config.io_processor_plugin
-        self.io_processor = get_io_processor(self.llm_engine.vllm_config,
-                                             io_processor_plugin)
+        self.io_processor = get_io_processor(
+            self.llm_engine.vllm_config, io_processor_plugin
+        )
 
     @property
     def model_config(self):
@@ -345,7 +382,8 @@ def _get_processor(self) -> Processor:
     def get_default_sampling_params(self) -> SamplingParams:
         if self.default_sampling_params is None:
             self.default_sampling_params = (
-                self.llm_engine.model_config.get_diff_sampling_param())
+                self.llm_engine.model_config.get_diff_sampling_param()
+            )
         if self.default_sampling_params:
             return SamplingParams.from_optional(**self.default_sampling_params)
         return SamplingParams()
@@ -353,8 +391,9 @@ def get_default_sampling_params(self) -> SamplingParams:
     def generate(
         self,
         prompts: Union[PromptType, Sequence[PromptType]],
-        sampling_params: Optional[Union[SamplingParams,
-                                        Sequence[SamplingParams]]] = None,
+        sampling_params: Optional[
+            Union[SamplingParams, Sequence[SamplingParams]]
+        ] = None,
         *,
         use_tqdm: Union[bool, Callable[..., tqdm]] = True,
         lora_request: Optional[Union[list[LoRARequest], LoRARequest]] = None,
@@ -398,15 +437,15 @@ def generate(
             raise ValueError(
                 "LLM.generate() is only supported for generative models. "
                 "Try passing `--runner generate` to use the model as a "
-                "generative model.")
+                "generative model."
+            )
 
         if sampling_params is None:
             # Use default sampling params.
             sampling_params = self.get_default_sampling_params()
 
         # Add any modality specific loras to the corresponding prompts
-        lora_request = self._get_modality_specific_lora_reqs(
-            prompts, lora_request)
+        lora_request = self._get_modality_specific_lora_reqs(prompts, lora_request)
 
         self._validate_and_add_requests(
             prompts=prompts,
@@ -420,46 +459,59 @@ def generate(
         return self.engine_class.validate_outputs(outputs, RequestOutput)
 
     def _get_modality_specific_lora_reqs(
-            self, prompts: Union[PromptType, Sequence[PromptType]],
-            lora_request: Optional[Union[list[LoRARequest], LoRARequest]]):
+        self,
+        prompts: Union[PromptType, Sequence[PromptType]],
+        lora_request: Optional[Union[list[LoRARequest], LoRARequest]],
+    ):
         # Grab the lora config off the vllm config on the engine,
         # since this is the same for both v0 & v1.
         lora_config = self.llm_engine.vllm_config.lora_config
 
         # If there's no lora config / default_mm_loras, or the model
         # isn't multimodal, leave the lora as is.
-        if (lora_config is None
-                or not self.llm_engine.model_config.is_multimodal_model
-                or (lora_config and lora_config.default_mm_loras is None)):
+        if (
+            lora_config is None
+            or not self.llm_engine.model_config.is_multimodal_model
+            or (lora_config and lora_config.default_mm_loras is None)
+        ):
             return lora_request
 
         if not isinstance(prompts, Sequence):
             prompts = [prompts]
 
-        optional_loras = ([lora_request] * len(prompts)
-                          if not isinstance(lora_request, Sequence) else
-                          lora_request)
+        optional_loras = (
+            [lora_request] * len(prompts)
+            if not isinstance(lora_request, Sequence)
+            else lora_request
+        )
 
         return [
             self._resolve_single_prompt_mm_lora(
                 prompt,
                 opt_lora_req,
                 lora_config.default_mm_loras,
-            ) for prompt, opt_lora_req in zip(prompts, optional_loras)
+            )
+            for prompt, opt_lora_req in zip(prompts, optional_loras)
         ]
 
-    def _resolve_single_prompt_mm_lora(self, prompt: PromptType,
-                                       lora_request: Optional[LoRARequest],
-                                       default_mm_loras: Optional[dict[str,
-                                                                       str]]):
-        if (not default_mm_loras or not isinstance(prompt, dict)
-                or "multi_modal_data" not in prompt):
+    def _resolve_single_prompt_mm_lora(
+        self,
+        prompt: PromptType,
+        lora_request: Optional[LoRARequest],
+        default_mm_loras: Optional[dict[str, str]],
+    ):
+        if (
+            not default_mm_loras
+            or not isinstance(prompt, dict)
+            or "multi_modal_data" not in prompt
+        ):
             return lora_request
 
         prompt = cast(Union[TextPrompt, TokensPrompt], prompt)
 
-        intersection = set(prompt["multi_modal_data"].keys()) \
-            .intersection(default_mm_loras.keys())
+        intersection = set(prompt["multi_modal_data"].keys()).intersection(
+            default_mm_loras.keys()
+        )
         if not intersection:
             return lora_request
         if len(intersection) > 1:
@@ -469,7 +521,9 @@ def _resolve_single_prompt_mm_lora(self, prompt: PromptType,
                 " used by a single prompt consuming several modalities; "
                 " currently we only support one lora per request; as such,"
                 " lora(s) registered with modalities: %s"
-                " will be skipped", intersection)
+                " will be skipped",
+                intersection,
+            )
             return lora_request
 
         # Build the LoRA request; the ID of the default mm lora is the
@@ -485,7 +539,8 @@ def _resolve_single_prompt_mm_lora(self, prompt: PromptType,
                 logger.warning(
                     "A modality with a registered lora and a lora_request "
                     "with a different ID were provided; falling back to the "
-                    "lora_request as we only apply one LoRARequest per prompt")
+                    "lora_request as we only apply one LoRARequest per prompt"
+                )
             return lora_request
 
         return LoRARequest(
@@ -494,11 +549,13 @@ def _resolve_single_prompt_mm_lora(self, prompt: PromptType,
             modality_lora_path,
         )
 
-    def collective_rpc(self,
-                       method: Union[str, Callable[..., _R]],
-                       timeout: Optional[float] = None,
-                       args: tuple = (),
-                       kwargs: Optional[dict[str, Any]] = None) -> list[_R]:
+    def collective_rpc(
+        self,
+        method: Union[str, Callable[..., _R]],
+        timeout: Optional[float] = None,
+        args: tuple = (),
+        kwargs: Optional[dict[str, Any]] = None,
+    ) -> list[_R]:
         """
         Execute an RPC call on all workers.
 
@@ -543,10 +600,10 @@ def _get_beam_search_lora_requests(
         prompts: list[Union[TokensPrompt, TextPrompt]],
     ) -> list[Optional[LoRARequest]]:
         """Get the optional lora request corresponding to each prompt."""
-        if isinstance(lora_request,
-                      Sequence) and len(lora_request) != len(prompts):
+        if isinstance(lora_request, Sequence) and len(lora_request) != len(prompts):
             raise ValueError(
-                "Lora request list should be the same length as the prompts")
+                "Lora request list should be the same length as the prompts"
+            )
 
         if lora_request is None or isinstance(lora_request, LoRARequest):
             return [lora_request] * len(prompts)
@@ -581,8 +638,7 @@ def beam_search(
         ignore_eos = params.ignore_eos
         length_penalty = params.length_penalty
 
-        lora_requests = self._get_beam_search_lora_requests(
-            lora_request, prompts)
+        lora_requests = self._get_beam_search_lora_requests(lora_request, prompts)
 
         tokenizer = self.get_tokenizer()
         sort_beams_key = create_sort_beams_key_function(
@@ -593,31 +649,28 @@ def beam_search(
         if use_tqdm and concurrency_limit is not None:
             logger.warning(
                 "Progress bar is not supported when using concurrency_limit. "
-                "Disabling progress bar.")
+                "Disabling progress bar."
+            )
             use_tqdm = False
 
         if concurrency_limit is None:
             concurrency_limit = len(prompts)
 
-        def create_tokens_prompt_from_beam(
-                beam: BeamSearchSequence) -> TokensPrompt:
-            token_prompt_kwargs: TokensPrompt = {
-                "prompt_token_ids": beam.tokens
-            }
+        def create_tokens_prompt_from_beam(beam: BeamSearchSequence) -> TokensPrompt:
+            token_prompt_kwargs: TokensPrompt = {"prompt_token_ids": beam.tokens}
             if beam.multi_modal_data is not None:
                 token_prompt_kwargs["multi_modal_data"] = beam.multi_modal_data
 
             if beam.mm_processor_kwargs is not None:
-                token_prompt_kwargs[
-                    "mm_processor_kwargs"] = beam.mm_processor_kwargs
+                token_prompt_kwargs["mm_processor_kwargs"] = beam.mm_processor_kwargs
             return TokensPrompt(**token_prompt_kwargs)
 
         # generate 2 * beam_width candidates at each step
         # following the huggingface transformers implementation
         # at https://github.com/huggingface/transformers/blob/e15687fffe5c9d20598a19aeab721ae0a7580f8a/src/transformers/generation/beam_search.py#L534 # noqa
-        beam_search_params = SamplingParams(logprobs=2 * beam_width,
-                                            max_tokens=1,
-                                            temperature=temperature)
+        beam_search_params = SamplingParams(
+            logprobs=2 * beam_width, max_tokens=1, temperature=temperature
+        )
         instances: list[BeamSearchInstance] = []
 
         for lora_req, prompt in zip(lora_requests, prompts):
@@ -626,8 +679,7 @@ def create_tokens_prompt_from_beam(
             if "multi_modal_data" in prompt:
                 mm_kwargs["multi_modal_data"] = prompt["multi_modal_data"]
             if "mm_processor_kwargs" in prompt:
-                mm_kwargs["mm_processor_kwargs"] = prompt[
-                    "mm_processor_kwargs"]
+                mm_kwargs["mm_processor_kwargs"] = prompt["mm_processor_kwargs"]
 
             if "prompt_token_ids" in prompt:
                 prompt = cast(TokensPrompt, prompt)  # Needed for mypy
@@ -641,48 +693,58 @@ def create_tokens_prompt_from_beam(
                     lora_request=lora_req,
                     logprobs=None,
                     **mm_kwargs,
-                ), )
+                ),
+            )
 
         for prompt_start in range(0, len(prompts), concurrency_limit):
-            instances_batch = instances[prompt_start:prompt_start +
-                                        concurrency_limit]
+            instances_batch = instances[prompt_start : prompt_start + concurrency_limit]
 
             token_iter = range(max_tokens)
             if use_tqdm:
-                token_iter = tqdm(token_iter,
-                                  desc="Beam search",
-                                  unit="token",
-                                  unit_scale=False)
+                token_iter = tqdm(
+                    token_iter, desc="Beam search", unit="token", unit_scale=False
+                )
                 logger.warning(
                     "The progress bar shows the upper bound on token steps and "
                     "may finish early due to stopping conditions. It does not "
-                    "reflect instance-level progress.")
+                    "reflect instance-level progress."
+                )
             for _ in token_iter:
                 all_beams: list[BeamSearchSequence] = list(
-                    sum((instance.beams for instance in instances_batch), []))
+                    sum((instance.beams for instance in instances_batch), [])
+                )
                 pos = [0] + list(
                     itertools.accumulate(
-                        len(instance.beams) for instance in instances_batch))
+                        len(instance.beams) for instance in instances_batch
+                    )
+                )
                 instance_start_and_end: list[tuple[int, int]] = list(
-                    zip(pos[:-1], pos[1:]))
+                    zip(pos[:-1], pos[1:])
+                )
 
                 if len(all_beams) == 0:
                     break
 
                 # create corresponding batch entries for prompt & optional lora
                 prompts_batch, lora_req_batch = zip(
-                    *[(create_tokens_prompt_from_beam(beam), beam.lora_request)
-                      for beam in all_beams])
+                    *[
+                        (create_tokens_prompt_from_beam(beam), beam.lora_request)
+                        for beam in all_beams
+                    ]
+                )
 
                 # only runs for one step
                 # we don't need to use tqdm here
-                output = self.generate(prompts_batch,
-                                       sampling_params=beam_search_params,
-                                       use_tqdm=False,
-                                       lora_request=lora_req_batch)
+                output = self.generate(
+                    prompts_batch,
+                    sampling_params=beam_search_params,
+                    use_tqdm=False,
+                    lora_request=lora_req_batch,
+                )
 
-                for (start, end), instance in zip(instance_start_and_end,
-                                                  instances_batch):
+                for (start, end), instance in zip(
+                    instance_start_and_end, instances_batch
+                ):
                     instance_new_beams = []
                     for i in range(start, end):
                         current_beam = all_beams[i]
@@ -697,32 +759,32 @@ def create_tokens_prompt_from_beam(
                             for token_id, logprob_obj in logprobs.items():
                                 new_beam = BeamSearchSequence(
                                     tokens=current_beam.tokens + [token_id],
-                                    logprobs=current_beam.logprobs +
-                                    [logprobs],
+                                    logprobs=current_beam.logprobs + [logprobs],
                                     lora_request=current_beam.lora_request,
-                                    cum_logprob=current_beam.cum_logprob +
-                                    logprob_obj.logprob,
-                                    multi_modal_data=current_beam.
-                                    multi_modal_data,
-                                    mm_processor_kwargs=current_beam.
-                                    mm_processor_kwargs)
-
-                                if token_id == tokenizer.eos_token_id and \
-                                    not ignore_eos:
+                                    cum_logprob=current_beam.cum_logprob
+                                    + logprob_obj.logprob,
+                                    multi_modal_data=current_beam.multi_modal_data,
+                                    mm_processor_kwargs=current_beam.mm_processor_kwargs,
+                                )
+
+                                if (
+                                    token_id == tokenizer.eos_token_id
+                                    and not ignore_eos
+                                ):
                                     instance.completed.append(new_beam)
                                 else:
                                     instance_new_beams.append(new_beam)
-                    sorted_beams = sorted(instance_new_beams,
-                                          key=sort_beams_key,
-                                          reverse=True)
+                    sorted_beams = sorted(
+                        instance_new_beams, key=sort_beams_key, reverse=True
+                    )
                     instance.beams = sorted_beams[:beam_width]
 
         outputs = []
         for instance in instances:
             instance.completed.extend(instance.beams)
-            sorted_completed = sorted(instance.completed,
-                                      key=sort_beams_key,
-                                      reverse=True)
+            sorted_completed = sorted(
+                instance.completed, key=sort_beams_key, reverse=True
+            )
             best_beams = sorted_completed[:beam_width]
 
             for beam in best_beams:
@@ -733,8 +795,9 @@ def create_tokens_prompt_from_beam(
 
     def preprocess_chat(
         self,
-        messages: Union[list[ChatCompletionMessageParam],
-                        list[list[ChatCompletionMessageParam]]],
+        messages: Union[
+            list[ChatCompletionMessageParam], list[list[ChatCompletionMessageParam]]
+        ],
         chat_template: Optional[str] = None,
         chat_template_content_format: ChatTemplateContentFormatOption = "auto",
         add_generation_prompt: bool = True,
@@ -758,13 +821,10 @@ def preprocess_chat(
         # Handle multi and single conversations
         if is_list_of(messages, list):
             # messages is list[list[...]]
-            list_of_messages = cast(list[list[ChatCompletionMessageParam]],
-                                    messages)
+            list_of_messages = cast(list[list[ChatCompletionMessageParam]], messages)
         else:
             # messages is list[...]
-            list_of_messages = [
-                cast(list[ChatCompletionMessageParam], messages)
-            ]
+            list_of_messages = [cast(list[ChatCompletionMessageParam], messages)]
 
         tokenizer = self.get_tokenizer()
         model_config = self.llm_engine.get_model_config()
@@ -812,8 +872,9 @@ def preprocess_chat(
                 )
                 # Special tokens are already included in chat templates so
                 # should not be added by the tokenizer in this case.
-                prompt_token_ids = tokenizer.encode(prompt_str,
-                                                    add_special_tokens=False)
+                prompt_token_ids = tokenizer.encode(
+                    prompt_str, add_special_tokens=False
+                )
 
             prompt = TokensPrompt(prompt_token_ids=prompt_token_ids)
 
@@ -832,10 +893,10 @@ def preprocess_chat(
 
     def chat(
         self,
-        messages: Union[list[ChatCompletionMessageParam],
-                        list[list[ChatCompletionMessageParam]]],
-        sampling_params: Optional[Union[SamplingParams,
-                                        list[SamplingParams]]] = None,
+        messages: Union[
+            list[ChatCompletionMessageParam], list[list[ChatCompletionMessageParam]]
+        ],
+        sampling_params: Optional[Union[SamplingParams, list[SamplingParams]]] = None,
         use_tqdm: Union[bool, Callable[..., tqdm]] = True,
         lora_request: Optional[LoRARequest] = None,
         chat_template: Optional[str] = None,
@@ -918,8 +979,7 @@ def chat(
     def encode(
         self,
         prompts: Union[PromptType, Sequence[PromptType], DataPrompt],
-        pooling_params: Optional[Union[PoolingParams,
-                                       Sequence[PoolingParams]]] = None,
+        pooling_params: Optional[Union[PoolingParams, Sequence[PoolingParams]]] = None,
         *,
         truncate_prompt_tokens: Optional[int] = None,
         use_tqdm: Union[bool, Callable[..., tqdm]] = True,
@@ -973,13 +1033,14 @@ def encode(
                 "Please use one of the more specific methods or set the "
                 "task directly when using `LLM.encode`:\n"
                 "  - For embeddings, use `LLM.embed(...)` "
-                "or `pooling_task=\"embed\"`.\n"
+                'or `pooling_task="embed"`.\n'
                 "  - For classification logits, use `LLM.classify(...)` "
-                "or `pooling_task=\"classify\"`.\n"
+                'or `pooling_task="classify"`.\n'
                 "  - For rewards, use `LLM.reward(...)` "
-                "or `pooling_task=\"reward\"`\n"
+                'or `pooling_task="reward"`\n'
                 "  - For similarity scores, use `LLM.score(...)`.",
-                pooling_task)
+                pooling_task,
+            )
 
         model_config = self.llm_engine.model_config
         runner_type = model_config.runner_type
@@ -987,11 +1048,11 @@ def encode(
             raise ValueError(
                 "LLM.encode() is only supported for pooling models. "
                 "Try passing `--runner pooling` to use the model as a "
-                "pooling model.")
+                "pooling model."
+            )
 
         if pooling_task not in self.supported_tasks:
-            raise ValueError(
-                f"pooling_task must be one of {self.supported_tasks}.")
+            raise ValueError(f"pooling_task must be one of {self.supported_tasks}.")
 
         if pooling_params is None:
             # Use default pooling params.
@@ -1011,7 +1072,8 @@ def encode(
                     "No IOProcessor plugin installed. Please refer "
                     "to the documentation and to the "
                     "'prithvi_geospatial_mae_io_processor' "
-                    "offline inference example for more details.")
+                    "offline inference example for more details."
+                )
 
             # Validate the request data is valid for the loaded plugin
             validated_prompt = self.io_processor.parse_request(prompts)
@@ -1029,19 +1091,23 @@ def encode(
         outputs = self._run_engine(use_tqdm=use_tqdm)
 
         model_outputs = self.engine_class.validate_outputs(
-            outputs, PoolingRequestOutput)
+            outputs, PoolingRequestOutput
+        )
 
         if io_processor_prompt:
             # get the post-processed model outputs
             assert self.io_processor is not None
             processed_outputs = self.io_processor.post_process(
-                model_output=model_outputs)
+                model_output=model_outputs
+            )
 
             return [
-                PoolingRequestOutput[Any](request_id="",
-                                          outputs=processed_outputs,
-                                          prompt_token_ids=[],
-                                          finished=True)
+                PoolingRequestOutput[Any](
+                    request_id="",
+                    outputs=processed_outputs,
+                    prompt_token_ids=[],
+                    finished=True,
+                )
             ]
         else:
             return model_outputs
@@ -1052,8 +1118,7 @@ def embed(
         *,
         truncate_prompt_tokens: Optional[int] = None,
         use_tqdm: Union[bool, Callable[..., tqdm]] = True,
-        pooling_params: Optional[Union[PoolingParams,
-                                       Sequence[PoolingParams]]] = None,
+        pooling_params: Optional[Union[PoolingParams, Sequence[PoolingParams]]] = None,
         lora_request: Optional[Union[list[LoRARequest], LoRARequest]] = None,
     ) -> list[EmbeddingRequestOutput]:
         """
@@ -1082,7 +1147,8 @@ def embed(
         if "embed" not in self.supported_tasks:
             raise ValueError(
                 "Embedding API is not supported by this model. "
-                "Try converting the model using `--convert embed`.")
+                "Try converting the model using `--convert embed`."
+            )
 
         items = self.encode(
             prompts,
@@ -1100,8 +1166,7 @@ def classify(
         prompts: Union[PromptType, Sequence[PromptType]],
         *,
         use_tqdm: Union[bool, Callable[..., tqdm]] = True,
-        pooling_params: Optional[Union[PoolingParams,
-                                       Sequence[PoolingParams]]] = None,
+        pooling_params: Optional[Union[PoolingParams, Sequence[PoolingParams]]] = None,
         lora_request: Optional[Union[list[LoRARequest], LoRARequest]] = None,
     ) -> list[ClassificationRequestOutput]:
         """
@@ -1129,7 +1194,8 @@ def classify(
         if "classify" not in self.supported_tasks:
             raise ValueError(
                 "Classification API is not supported by this model. "
-                "Try converting the model using `--convert classify`.")
+                "Try converting the model using `--convert classify`."
+            )
 
         items = self.encode(
             prompts,
@@ -1148,8 +1214,7 @@ def reward(
         *,
         truncate_prompt_tokens: Optional[int] = None,
         use_tqdm: Union[bool, Callable[..., tqdm]] = True,
-        pooling_params: Optional[Union[PoolingParams,
-                                       Sequence[PoolingParams]]] = None,
+        pooling_params: Optional[Union[PoolingParams, Sequence[PoolingParams]]] = None,
         lora_request: Optional[Union[list[LoRARequest], LoRARequest]] = None,
     ) -> list[PoolingRequestOutput]:
         """
@@ -1190,7 +1255,6 @@ def _embedding_score(
         pooling_params: Optional[PoolingParams] = None,
         lora_request: Optional[Union[list[LoRARequest], LoRARequest]] = None,
     ) -> list[ScoringRequestOutput]:
-
         encoded_output: list[PoolingRequestOutput] = self.encode(
             text_1 + text_2,
             truncate_prompt_tokens=truncate_prompt_tokens,
@@ -1200,20 +1264,17 @@ def _embedding_score(
             pooling_task="embed",
         )
 
-        encoded_output_1: list[PoolingRequestOutput] = encoded_output[
-            0:len(text_1)]
-        encoded_output_2: list[PoolingRequestOutput] = encoded_output[
-            len(text_1):]
+        encoded_output_1: list[PoolingRequestOutput] = encoded_output[0 : len(text_1)]
+        encoded_output_2: list[PoolingRequestOutput] = encoded_output[len(text_1) :]
 
         if len(encoded_output_1) == 1:
             encoded_output_1 = encoded_output_1 * len(encoded_output_2)
 
-        scores = _cosine_similarity(tokenizer=tokenizer,
-                                    embed_1=encoded_output_1,
-                                    embed_2=encoded_output_2)
+        scores = _cosine_similarity(
+            tokenizer=tokenizer, embed_1=encoded_output_1, embed_2=encoded_output_2
+        )
 
-        items = self.engine_class.validate_outputs(scores,
-                                                   PoolingRequestOutput)
+        items = self.engine_class.validate_outputs(scores, PoolingRequestOutput)
         return [ScoringRequestOutput.from_base(item) for item in items]
 
     def _cross_encoding_score(
@@ -1229,8 +1290,7 @@ def _cross_encoding_score(
         model_config = self.llm_engine.model_config
 
         if isinstance(tokenizer, MistralTokenizer):
-            raise ValueError(
-                "Score API is not supported for Mistral tokenizer")
+            raise ValueError("Score API is not supported for Mistral tokenizer")
 
         if len(data_1) == 1:
             data_1 = data_1 * len(data_2)
@@ -1244,8 +1304,9 @@ def _cross_encoding_score(
 
         tokenization_kwargs: dict[str, Any] = {}
 
-        _validate_truncation_size(model_config.max_model_len,
-                                  truncate_prompt_tokens, tokenization_kwargs)
+        _validate_truncation_size(
+            model_config.max_model_len, truncate_prompt_tokens, tokenization_kwargs
+        )
 
         prompts = list[PromptType]()
 
@@ -1262,7 +1323,7 @@ def _cross_encoding_score(
                 tokenization_kwargs=tokenization_kwargs,
             )
 
-            if (token_type_ids := engine_prompt.pop("token_type_ids", None)):
+            if token_type_ids := engine_prompt.pop("token_type_ids", None):
                 params = pooling_params.clone()
                 compressed = compress_token_type_ids(token_type_ids)
                 params.extra_kwargs = {"compressed_token_type_ids": compressed}
@@ -1280,17 +1341,14 @@ def _cross_encoding_score(
         )
 
         outputs = self._run_engine(use_tqdm=use_tqdm)
-        items = self.engine_class.validate_outputs(outputs,
-                                                   PoolingRequestOutput)
+        items = self.engine_class.validate_outputs(outputs, PoolingRequestOutput)
 
         return [ScoringRequestOutput.from_base(item) for item in items]
 
     def score(
         self,
-        data_1: Union[SingletonPrompt, Sequence[SingletonPrompt],
-                      ScoreMultiModalParam],
-        data_2: Union[SingletonPrompt, Sequence[SingletonPrompt],
-                      ScoreMultiModalParam],
+        data_1: Union[SingletonPrompt, Sequence[SingletonPrompt], ScoreMultiModalParam],
+        data_2: Union[SingletonPrompt, Sequence[SingletonPrompt], ScoreMultiModalParam],
         /,
         *,
         truncate_prompt_tokens: Optional[int] = None,
@@ -1339,16 +1397,21 @@ def score(
             raise ValueError(
                 "LLM.score() is only supported for pooling models. "
                 "Try passing `--runner pooling` to use the model as a "
-                "pooling model.")
+                "pooling model."
+            )
 
         supported_tasks = self.supported_tasks
         if all(t not in supported_tasks for t in ("embed", "classify")):
-            raise ValueError("Score API is not supported by this model. "
-                             "Try converting the model using "
-                             "`--convert embed` or `--convert classify`.")
+            raise ValueError(
+                "Score API is not supported by this model. "
+                "Try converting the model using "
+                "`--convert embed` or `--convert classify`."
+            )
 
-        if (model_config.is_cross_encoder
-                and getattr(model_config.hf_config, "num_labels", 0) != 1):
+        if (
+            model_config.is_cross_encoder
+            and getattr(model_config.hf_config, "num_labels", 0) != 1
+        ):
             raise ValueError("Score API is only enabled for num_labels == 1.")
 
         # the tokenizer for models such as
@@ -1358,12 +1421,16 @@ def score(
 
         if not model_config.is_multimodal_model:
 
-            def check_data_type(data: Union[SingletonPrompt,
-                                            Sequence[SingletonPrompt],
-                                            ScoreMultiModalParam]):
+            def check_data_type(
+                data: Union[
+                    SingletonPrompt, Sequence[SingletonPrompt], ScoreMultiModalParam
+                ],
+            ):
                 if isinstance(data, dict) and "content" in data:
-                    raise ValueError("ScoreMultiModalParam is not supported "
-                                     f"for {model_config.architecture}")
+                    raise ValueError(
+                        "ScoreMultiModalParam is not supported "
+                        f"for {model_config.architecture}"
+                    )
 
             check_data_type(data_1)
             check_data_type(data_2)
@@ -1371,11 +1438,13 @@ def check_data_type(data: Union[SingletonPrompt,
             def ensure_str(prompt: SingletonPrompt):
                 if isinstance(prompt, dict):
                     if "multi_modal_data" in prompt:
-                        raise ValueError("Multi-modal prompt is not "
-                                         "supported for scoring")
+                        raise ValueError(
+                            "Multi-modal prompt is not supported for scoring"
+                        )
                     elif "prompt_token_ids" in prompt:
                         prompt = tokenizer.decode(
-                            cast(TokensPrompt, prompt)["prompt_token_ids"])
+                            cast(TokensPrompt, prompt)["prompt_token_ids"]
+                        )
                     elif "prompt" in prompt:
                         prompt = cast(TextPrompt, prompt)["prompt"]
                 assert type(prompt) is str
@@ -1413,7 +1482,8 @@ def ensure_str(prompt: SingletonPrompt):
                 truncate_prompt_tokens,
                 use_tqdm,
                 pooling_params,
-                lora_request)
+                lora_request,
+            )
         else:
             return self._embedding_score(
                 tokenizer,
@@ -1422,7 +1492,8 @@ def ensure_str(prompt: SingletonPrompt):
                 truncate_prompt_tokens,
                 use_tqdm,
                 pooling_params,
-                lora_request)
+                lora_request,
+            )
 
     def start_profile(self) -> None:
         self.llm_engine.start_profile()
@@ -1484,8 +1555,12 @@ def get_metrics(self) -> list["Metric"]:
     def _validate_and_add_requests(
         self,
         prompts: Union[PromptType, Sequence[PromptType], DataPrompt],
-        params: Union[SamplingParams, Sequence[SamplingParams], PoolingParams,
-                      Sequence[PoolingParams]],
+        params: Union[
+            SamplingParams,
+            Sequence[SamplingParams],
+            PoolingParams,
+            Sequence[PoolingParams],
+        ],
         *,
         use_tqdm: Union[bool, Callable[..., tqdm]] = True,
         lora_request: Optional[Union[Sequence[LoRARequest], LoRARequest]],
@@ -1497,14 +1572,13 @@ def _validate_and_add_requests(
 
         num_requests = len(prompts)
         if isinstance(params, Sequence) and len(params) != num_requests:
-            raise ValueError("The lengths of prompts and params "
-                             "must be the same.")
-        if isinstance(lora_request,
-                      Sequence) and len(lora_request) != num_requests:
-            raise ValueError("The lengths of prompts and lora_request "
-                             "must be the same.")
-
-        for sp in params if isinstance(params, Sequence) else (params, ):
+            raise ValueError("The lengths of prompts and params must be the same.")
+        if isinstance(lora_request, Sequence) and len(lora_request) != num_requests:
+            raise ValueError(
+                "The lengths of prompts and lora_request must be the same."
+            )
+
+        for sp in params if isinstance(params, Sequence) else (params,):
             if isinstance(sp, SamplingParams):
                 # We only care about the final output
                 sp.output_kind = RequestOutputKind.FINAL_ONLY
@@ -1516,24 +1590,24 @@ def _validate_and_add_requests(
             it = tqdm_func(it, desc="Adding requests")
 
         for i, prompt in enumerate(it):
-
             if isinstance(prompt, dict):
                 self._validate_mm_data_and_uuids(
-                    prompt.get("multi_modal_data"),
-                    prompt.get("multi_modal_uuids"))
+                    prompt.get("multi_modal_data"), prompt.get("multi_modal_uuids")
+                )
 
             self._add_request(
                 prompt,
                 params[i] if isinstance(params, Sequence) else params,
-                lora_request=lora_request[i] if isinstance(
-                    lora_request, Sequence) else lora_request,
+                lora_request=lora_request[i]
+                if isinstance(lora_request, Sequence)
+                else lora_request,
                 priority=priority[i] if priority else 0,
             )
 
     def _validate_mm_data_and_uuids(
-            self,
-            multi_modal_data: Optional[Any],  # MultiModalDataDict
-            multi_modal_uuids: Optional[Any],  # MultiModalUUIDDict
+        self,
+        multi_modal_data: Optional[Any],  # MultiModalDataDict
+        multi_modal_uuids: Optional[Any],  # MultiModalUUIDDict
     ):
         """
         Validate that if any multi-modal data is skipped (i.e. None),
@@ -1546,24 +1620,37 @@ def _validate_mm_data_and_uuids(
             if isinstance(data, list):
                 for i, d in enumerate(data):
                     if d is None:
-                        if multi_modal_uuids is None or modality not in multi_modal_uuids or multi_modal_uuids[  # noqa: E501
-                                modality] is None:
+                        if (
+                            multi_modal_uuids is None
+                            or modality not in multi_modal_uuids
+                            or multi_modal_uuids[  # noqa: E501
+                                modality
+                            ]
+                            is None
+                        ):
                             raise ValueError(
                                 f"Multi-modal data for {modality} is None "
-                                f"but UUID is not provided")
+                                f"but UUID is not provided"
+                            )
                         else:
-                            if len(
-                                    multi_modal_uuids[modality]
-                            ) <= i or multi_modal_uuids[modality][i] is None:
+                            if (
+                                len(multi_modal_uuids[modality]) <= i
+                                or multi_modal_uuids[modality][i] is None
+                            ):
                                 raise ValueError(
                                     f"Multi-modal data for {modality} is None "
-                                    f"but UUID is not provided")
+                                    f"but UUID is not provided"
+                                )
             else:
-                if data is None and (multi_modal_uuids is None
-                                     or modality not in multi_modal_uuids
-                                     or multi_modal_uuids[modality] is None):
-                    raise ValueError(f"Multi-modal data for {modality} is None"
-                                     f" but UUID is not provided")
+                if data is None and (
+                    multi_modal_uuids is None
+                    or modality not in multi_modal_uuids
+                    or multi_modal_uuids[modality] is None
+                ):
+                    raise ValueError(
+                        f"Multi-modal data for {modality} is None"
+                        f" but UUID is not provided"
+                    )
 
     def _process_inputs(
         self,
@@ -1576,9 +1663,11 @@ def _process_inputs(
     ) -> tuple[EngineCoreRequest, dict[str, Any]]:
         """Use the Processor to process inputs for LLMEngine."""
         tokenization_kwargs: dict[str, Any] = {}
-        _validate_truncation_size(self.model_config.max_model_len,
-                                  params.truncate_prompt_tokens,
-                                  tokenization_kwargs)
+        _validate_truncation_size(
+            self.model_config.max_model_len,
+            params.truncate_prompt_tokens,
+            tokenization_kwargs,
+        )
 
         processor = self._get_processor()
         engine_request = processor.process_inputs(
@@ -1620,9 +1709,7 @@ def _add_request(
         )
 
     def _run_engine(
-        self,
-        *,
-        use_tqdm: Union[bool, Callable[..., tqdm]] = True
+        self, *, use_tqdm: Union[bool, Callable[..., tqdm]] = True
     ) -> list[Union[RequestOutput, PoolingRequestOutput]]:
         # Initialize tqdm.
         if use_tqdm:
@@ -1632,8 +1719,7 @@ def _run_engine(
                 total=num_requests,
                 desc="Processed prompts",
                 dynamic_ncols=True,
-                postfix=(f"est. speed input: {0:.2f} toks/s, "
-                         f"output: {0:.2f} toks/s"),
+                postfix=(f"est. speed input: {0:.2f} toks/s, output: {0:.2f} toks/s"),
             )
 
         # Run the engine.
@@ -1653,12 +1739,13 @@ def _run_engine(
                             total_in_toks += len(output.prompt_token_ids) * n
                             in_spd = total_in_toks / pbar.format_dict["elapsed"]
                             total_out_toks += sum(
-                                len(stp.token_ids) for stp in output.outputs)
-                            out_spd = (total_out_toks /
-                                       pbar.format_dict["elapsed"])
+                                len(stp.token_ids) for stp in output.outputs
+                            )
+                            out_spd = total_out_toks / pbar.format_dict["elapsed"]
                             pbar.postfix = (
                                 f"est. speed input: {in_spd:.2f} toks/s, "
-                                f"output: {out_spd:.2f} toks/s")
+                                f"output: {out_spd:.2f} toks/s"
+                            )
                             pbar.update(n)
                         else:
                             pbar.update(1)
diff --git a/vllm/entrypoints/logger.py b/vllm/entrypoints/logger.py
index 152d11c84ea0..96a84668e92b 100644
--- a/vllm/entrypoints/logger.py
+++ b/vllm/entrypoints/logger.py
@@ -15,7 +15,6 @@
 
 
 class RequestLogger:
-
     def __init__(self, *, max_log_len: Optional[int]) -> None:
         self.max_log_len = max_log_len
 
@@ -25,8 +24,7 @@ def log_inputs(
         prompt: Optional[str],
         prompt_token_ids: Optional[list[int]],
         prompt_embeds: Optional[torch.Tensor],
-        params: Optional[Union[SamplingParams, PoolingParams,
-                               BeamSearchParams]],
+        params: Optional[Union[SamplingParams, PoolingParams, BeamSearchParams]],
         lora_request: Optional[LoRARequest],
     ) -> None:
         max_log_len = self.max_log_len
@@ -41,9 +39,14 @@ def log_inputs(
             "Received request %s: prompt: %r, "
             "params: %s, prompt_token_ids: %s, "
             "prompt_embeds shape: %s, "
-            "lora_request: %s.", request_id, prompt, params, prompt_token_ids,
+            "lora_request: %s.",
+            request_id,
+            prompt,
+            params,
+            prompt_token_ids,
             prompt_embeds.shape if prompt_embeds is not None else None,
-            lora_request)
+            lora_request,
+        )
 
     def log_outputs(
         self,
@@ -65,8 +68,7 @@ def log_outputs(
 
         stream_info = ""
         if is_streaming:
-            stream_info = (" (streaming delta)"
-                           if delta else " (streaming complete)")
+            stream_info = " (streaming delta)" if delta else " (streaming complete)"
 
         logger.info(
             "Generated response %s%s: output: %r, "
diff --git a/vllm/entrypoints/openai/api_server.py b/vllm/entrypoints/openai/api_server.py
index 2f05e10639f5..70717b761d06 100644
--- a/vllm/entrypoints/openai/api_server.py
+++ b/vllm/entrypoints/openai/api_server.py
@@ -25,8 +25,7 @@
 import pydantic
 import regex as re
 import uvloop
-from fastapi import (APIRouter, Depends, FastAPI, Form, HTTPException, Query,
-                     Request)
+from fastapi import APIRouter, Depends, FastAPI, Form, HTTPException, Query, Request
 from fastapi.exceptions import RequestValidationError
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.responses import JSONResponse, Response, StreamingResponse
@@ -42,69 +41,88 @@
 from vllm.config import VllmConfig
 from vllm.engine.arg_utils import AsyncEngineArgs
 from vllm.engine.protocol import EngineClient
-from vllm.entrypoints.chat_utils import (load_chat_template,
-                                         resolve_hf_chat_template,
-                                         resolve_mistral_chat_template)
+from vllm.entrypoints.chat_utils import (
+    load_chat_template,
+    resolve_hf_chat_template,
+    resolve_mistral_chat_template,
+)
 from vllm.entrypoints.launcher import serve_http
 from vllm.entrypoints.logger import RequestLogger
-from vllm.entrypoints.openai.cli_args import (make_arg_parser,
-                                              validate_parsed_serve_args)
+from vllm.entrypoints.openai.cli_args import make_arg_parser, validate_parsed_serve_args
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              ChatCompletionResponse,
-                                              ClassificationRequest,
-                                              ClassificationResponse,
-                                              CompletionRequest,
-                                              CompletionResponse,
-                                              DetokenizeRequest,
-                                              DetokenizeResponse,
-                                              EmbeddingRequest,
-                                              EmbeddingResponse, ErrorInfo,
-                                              ErrorResponse,
-                                              IOProcessorResponse,
-                                              LoadLoRAAdapterRequest,
-                                              PoolingRequest, PoolingResponse,
-                                              RerankRequest, RerankResponse,
-                                              ResponsesRequest,
-                                              ResponsesResponse, ScoreRequest,
-                                              ScoreResponse,
-                                              StreamingResponsesResponse,
-                                              TokenizeRequest,
-                                              TokenizeResponse,
-                                              TranscriptionRequest,
-                                              TranscriptionResponse,
-                                              TranslationRequest,
-                                              TranslationResponse,
-                                              UnloadLoRAAdapterRequest)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    ChatCompletionResponse,
+    ClassificationRequest,
+    ClassificationResponse,
+    CompletionRequest,
+    CompletionResponse,
+    DetokenizeRequest,
+    DetokenizeResponse,
+    EmbeddingRequest,
+    EmbeddingResponse,
+    ErrorInfo,
+    ErrorResponse,
+    IOProcessorResponse,
+    LoadLoRAAdapterRequest,
+    PoolingRequest,
+    PoolingResponse,
+    RerankRequest,
+    RerankResponse,
+    ResponsesRequest,
+    ResponsesResponse,
+    ScoreRequest,
+    ScoreResponse,
+    StreamingResponsesResponse,
+    TokenizeRequest,
+    TokenizeResponse,
+    TranscriptionRequest,
+    TranscriptionResponse,
+    TranslationRequest,
+    TranslationResponse,
+    UnloadLoRAAdapterRequest,
+)
+
 # yapf: enable
 from vllm.entrypoints.openai.serving_chat import OpenAIServingChat
-from vllm.entrypoints.openai.serving_classification import (
-    ServingClassification)
+from vllm.entrypoints.openai.serving_classification import ServingClassification
 from vllm.entrypoints.openai.serving_completion import OpenAIServingCompletion
 from vllm.entrypoints.openai.serving_embedding import OpenAIServingEmbedding
 from vllm.entrypoints.openai.serving_engine import OpenAIServing
-from vllm.entrypoints.openai.serving_models import (BaseModelPath,
-                                                    LoRAModulePath,
-                                                    OpenAIServingModels)
+from vllm.entrypoints.openai.serving_models import (
+    BaseModelPath,
+    LoRAModulePath,
+    OpenAIServingModels,
+)
 from vllm.entrypoints.openai.serving_pooling import OpenAIServingPooling
 from vllm.entrypoints.openai.serving_responses import OpenAIServingResponses
 from vllm.entrypoints.openai.serving_score import ServingScores
-from vllm.entrypoints.openai.serving_tokenization import (
-    OpenAIServingTokenization)
+from vllm.entrypoints.openai.serving_tokenization import OpenAIServingTokenization
 from vllm.entrypoints.openai.serving_transcription import (
-    OpenAIServingTranscription, OpenAIServingTranslation)
+    OpenAIServingTranscription,
+    OpenAIServingTranslation,
+)
 from vllm.entrypoints.openai.tool_parsers import ToolParserManager
-from vllm.entrypoints.tool_server import (DemoToolServer, MCPToolServer,
-                                          ToolServer)
-from vllm.entrypoints.utils import (cli_env_setup, load_aware_call,
-                                    log_non_default_args, with_cancellation)
+from vllm.entrypoints.tool_server import DemoToolServer, MCPToolServer, ToolServer
+from vllm.entrypoints.utils import (
+    cli_env_setup,
+    load_aware_call,
+    log_non_default_args,
+    with_cancellation,
+)
 from vllm.logger import init_logger
 from vllm.reasoning import ReasoningParserManager
 from vllm.transformers_utils.tokenizer import MistralTokenizer
 from vllm.usage.usage_lib import UsageContext
-from vllm.utils import (Device, FlexibleArgumentParser, decorate_logs,
-                        is_valid_ipv6_address, set_ulimit)
+from vllm.utils import (
+    Device,
+    FlexibleArgumentParser,
+    decorate_logs,
+    is_valid_ipv6_address,
+    set_ulimit,
+)
 from vllm.v1.engine.exceptions import EngineDeadError
 from vllm.v1.metrics.prometheus import get_prometheus_registry
 from vllm.version import __version__ as VLLM_VERSION
@@ -112,7 +130,7 @@
 prometheus_multiproc_dir: tempfile.TemporaryDirectory
 
 # Cannot use __name__ (https://github.com/vllm-project/vllm/pull/4765)
-logger = init_logger('vllm.entrypoints.openai.api_server')
+logger = init_logger("vllm.entrypoints.openai.api_server")
 
 _running_tasks: set[asyncio.Task] = set()
 
@@ -156,12 +174,11 @@ async def build_async_engine_client(
     disable_frontend_multiprocessing: Optional[bool] = None,
     client_config: Optional[dict[str, Any]] = None,
 ) -> AsyncIterator[EngineClient]:
-
     if os.getenv("VLLM_WORKER_MULTIPROC_METHOD") == "forkserver":
         # The executor is expected to be mp.
         # Pre-import heavy modules in the forkserver process
         logger.debug("Setup forkserver with pre-imports")
-        multiprocessing.set_start_method('forkserver')
+        multiprocessing.set_start_method("forkserver")
         multiprocessing.set_forkserver_preload(["vllm.v1.engine.async_llm"])
         forkserver.ensure_running()
         logger.debug("Forkserver setup complete!")
@@ -174,14 +191,13 @@ async def build_async_engine_client(
         engine_args._api_process_rank = client_config.get("client_index", 0)
 
     if disable_frontend_multiprocessing is None:
-        disable_frontend_multiprocessing = bool(
-            args.disable_frontend_multiprocessing)
+        disable_frontend_multiprocessing = bool(args.disable_frontend_multiprocessing)
 
     async with build_async_engine_client_from_engine_args(
-            engine_args,
-            usage_context=usage_context,
-            disable_frontend_multiprocessing=disable_frontend_multiprocessing,
-            client_config=client_config,
+        engine_args,
+        usage_context=usage_context,
+        disable_frontend_multiprocessing=disable_frontend_multiprocessing,
+        client_config=client_config,
     ) as engine:
         yield engine
 
@@ -211,9 +227,11 @@ async def build_async_engine_client_from_engine_args(
     if disable_frontend_multiprocessing:
         logger.warning(
             "V1 is enabled, but got --disable-frontend-multiprocessing. "
-            "To disable frontend multiprocessing, set VLLM_USE_V1=0.")
+            "To disable frontend multiprocessing, set VLLM_USE_V1=0."
+        )
 
     from vllm.v1.engine.async_llm import AsyncLLM
+
     async_llm: Optional[AsyncLLM] = None
 
     # Don't mutate the input client_config
@@ -229,7 +247,8 @@ async def build_async_engine_client_from_engine_args(
             disable_log_stats=engine_args.disable_log_stats,
             client_addresses=client_config,
             client_count=client_count,
-            client_index=client_index)
+            client_index=client_index,
+        )
 
         # Don't keep the dummy data in memory
         await async_llm.reset_mm_cache()
@@ -244,9 +263,9 @@ async def validate_json_request(raw_request: Request):
     content_type = raw_request.headers.get("content-type", "").lower()
     media_type = content_type.split(";", maxsplit=1)[0]
     if media_type != "application/json":
-        raise RequestValidationError(errors=[
-            "Unsupported Media Type: Only 'application/json' is allowed"
-        ])
+        raise RequestValidationError(
+            errors=["Unsupported Media Type: Only 'application/json' is allowed"]
+        )
 
 
 router = APIRouter()
@@ -368,8 +387,7 @@ async def get_server_load_metrics(request: Request):
     # - /rerank
     # - /v1/rerank
     # - /v2/rerank
-    return JSONResponse(
-        content={'server_load': request.app.state.server_load_metrics})
+    return JSONResponse(content={"server_load": request.app.state.server_load_metrics})
 
 
 @router.get("/ping", response_class=Response)
@@ -379,22 +397,16 @@ async def ping(raw_request: Request) -> Response:
     return await health(raw_request)
 
 
-@router.post("/tokenize",
-             dependencies=[Depends(validate_json_request)],
-             responses={
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.NOT_FOUND.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.NOT_IMPLEMENTED.value: {
-                     "model": ErrorResponse
-                 },
-             })
+@router.post(
+    "/tokenize",
+    dependencies=[Depends(validate_json_request)],
+    responses={
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.NOT_FOUND.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+        HTTPStatus.NOT_IMPLEMENTED.value: {"model": ErrorResponse},
+    },
+)
 @with_cancellation
 async def tokenize(request: TokenizeRequest, raw_request: Request):
     handler = tokenization(raw_request)
@@ -402,34 +414,33 @@ async def tokenize(request: TokenizeRequest, raw_request: Request):
     try:
         generator = await handler.create_tokenize(request, raw_request)
     except NotImplementedError as e:
-        raise HTTPException(status_code=HTTPStatus.NOT_IMPLEMENTED.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.NOT_IMPLEMENTED.value, detail=str(e)
+        ) from e
     except Exception as e:
-        raise HTTPException(status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value, detail=str(e)
+        ) from e
 
     if isinstance(generator, ErrorResponse):
-        return JSONResponse(content=generator.model_dump(),
-                            status_code=generator.error.code)
+        return JSONResponse(
+            content=generator.model_dump(), status_code=generator.error.code
+        )
     elif isinstance(generator, TokenizeResponse):
         return JSONResponse(content=generator.model_dump())
 
     assert_never(generator)
 
 
-@router.post("/detokenize",
-             dependencies=[Depends(validate_json_request)],
-             responses={
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.NOT_FOUND.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 },
-             })
+@router.post(
+    "/detokenize",
+    dependencies=[Depends(validate_json_request)],
+    responses={
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.NOT_FOUND.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+    },
+)
 @with_cancellation
 async def detokenize(request: DetokenizeRequest, raw_request: Request):
     handler = tokenization(raw_request)
@@ -439,12 +450,14 @@ async def detokenize(request: DetokenizeRequest, raw_request: Request):
     except OverflowError as e:
         raise RequestValidationError(errors=[str(e)]) from e
     except Exception as e:
-        raise HTTPException(status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value, detail=str(e)
+        ) from e
 
     if isinstance(generator, ErrorResponse):
-        return JSONResponse(content=generator.model_dump(),
-                            status_code=generator.error.code)
+        return JSONResponse(
+            content=generator.model_dump(), status_code=generator.error.code
+        )
     elif isinstance(generator, DetokenizeResponse):
         return JSONResponse(content=generator.model_dump())
 
@@ -453,15 +466,18 @@ async def detokenize(request: DetokenizeRequest, raw_request: Request):
 
 def maybe_register_tokenizer_info_endpoint(args):
     """Conditionally register the tokenizer info endpoint if enabled."""
-    if getattr(args, 'enable_tokenizer_info_endpoint', False):
+    if getattr(args, "enable_tokenizer_info_endpoint", False):
 
         @router.get("/tokenizer_info")
         async def get_tokenizer_info(raw_request: Request):
             """Get comprehensive tokenizer information."""
             result = await tokenization(raw_request).get_tokenizer_info()
-            return JSONResponse(content=result.model_dump(),
-                                status_code=result.error.code if isinstance(
-                                    result, ErrorResponse) else 200)
+            return JSONResponse(
+                content=result.model_dump(),
+                status_code=result.error.code
+                if isinstance(result, ErrorResponse)
+                else 200,
+            )
 
 
 @router.get("/v1/models")
@@ -479,55 +495,52 @@ async def show_version():
 
 
 async def _convert_stream_to_sse_events(
-    generator: AsyncGenerator[StreamingResponsesResponse, None]
+    generator: AsyncGenerator[StreamingResponsesResponse, None],
 ) -> AsyncGenerator[str, None]:
     """Convert the generator to a stream of events in SSE format"""
     async for event in generator:
-        event_type = getattr(event, 'type', 'unknown')
+        event_type = getattr(event, "type", "unknown")
         # https://developer.mozilla.org/en-US/docs/Web/API/Server-sent_events/Using_server-sent_events#event_stream_format
-        event_data = (f"event: {event_type}\n"
-                      f"data: {event.model_dump_json(indent=None)}\n\n")
+        event_data = (
+            f"event: {event_type}\ndata: {event.model_dump_json(indent=None)}\n\n"
+        )
         yield event_data
 
 
-@router.post("/v1/responses",
-             dependencies=[Depends(validate_json_request)],
-             responses={
-                 HTTPStatus.OK.value: {
-                     "content": {
-                         "text/event-stream": {}
-                     }
-                 },
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.NOT_FOUND.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 },
-             })
+@router.post(
+    "/v1/responses",
+    dependencies=[Depends(validate_json_request)],
+    responses={
+        HTTPStatus.OK.value: {"content": {"text/event-stream": {}}},
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.NOT_FOUND.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+    },
+)
 @with_cancellation
 async def create_responses(request: ResponsesRequest, raw_request: Request):
     handler = responses(raw_request)
     if handler is None:
         return base(raw_request).create_error_response(
-            message="The model does not support Responses API")
+            message="The model does not support Responses API"
+        )
     try:
         generator = await handler.create_responses(request, raw_request)
     except Exception as e:
-        raise HTTPException(status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value, detail=str(e)
+        ) from e
 
     if isinstance(generator, ErrorResponse):
-        return JSONResponse(content=generator.model_dump(),
-                            status_code=generator.error.code)
+        return JSONResponse(
+            content=generator.model_dump(), status_code=generator.error.code
+        )
     elif isinstance(generator, ResponsesResponse):
         return JSONResponse(content=generator.model_dump())
 
-    return StreamingResponse(content=_convert_stream_to_sse_events(generator),
-                             media_type="text/event-stream")
+    return StreamingResponse(
+        content=_convert_stream_to_sse_events(generator), media_type="text/event-stream"
+    )
 
 
 @router.get("/v1/responses/{response_id}")
@@ -540,7 +553,8 @@ async def retrieve_responses(
     handler = responses(raw_request)
     if handler is None:
         return base(raw_request).create_error_response(
-            message="The model does not support Responses API")
+            message="The model does not support Responses API"
+        )
 
     try:
         response = await handler.retrieve_responses(
@@ -549,16 +563,19 @@ async def retrieve_responses(
             stream=stream,
         )
     except Exception as e:
-        raise HTTPException(status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value, detail=str(e)
+        ) from e
 
     if isinstance(response, ErrorResponse):
-        return JSONResponse(content=response.model_dump(),
-                            status_code=response.error.code)
+        return JSONResponse(
+            content=response.model_dump(), status_code=response.error.code
+        )
     elif isinstance(response, ResponsesResponse):
         return JSONResponse(content=response.model_dump())
-    return StreamingResponse(content=_convert_stream_to_sse_events(response),
-                             media_type="text/event-stream")
+    return StreamingResponse(
+        content=_convert_stream_to_sse_events(response), media_type="text/event-stream"
+    )
 
 
 @router.post("/v1/responses/{response_id}/cancel")
@@ -566,54 +583,51 @@ async def cancel_responses(response_id: str, raw_request: Request):
     handler = responses(raw_request)
     if handler is None:
         return base(raw_request).create_error_response(
-            message="The model does not support Responses API")
+            message="The model does not support Responses API"
+        )
 
     try:
         response = await handler.cancel_responses(response_id)
     except Exception as e:
-        raise HTTPException(status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value, detail=str(e)
+        ) from e
 
     if isinstance(response, ErrorResponse):
-        return JSONResponse(content=response.model_dump(),
-                            status_code=response.error.code)
+        return JSONResponse(
+            content=response.model_dump(), status_code=response.error.code
+        )
     return JSONResponse(content=response.model_dump())
 
 
-@router.post("/v1/chat/completions",
-             dependencies=[Depends(validate_json_request)],
-             responses={
-                 HTTPStatus.OK.value: {
-                     "content": {
-                         "text/event-stream": {}
-                     }
-                 },
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.NOT_FOUND.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 }
-             })
+@router.post(
+    "/v1/chat/completions",
+    dependencies=[Depends(validate_json_request)],
+    responses={
+        HTTPStatus.OK.value: {"content": {"text/event-stream": {}}},
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.NOT_FOUND.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+    },
+)
 @with_cancellation
 @load_aware_call
-async def create_chat_completion(request: ChatCompletionRequest,
-                                 raw_request: Request):
+async def create_chat_completion(request: ChatCompletionRequest, raw_request: Request):
     handler = chat(raw_request)
     if handler is None:
         return base(raw_request).create_error_response(
-            message="The model does not support Chat Completions API")
+            message="The model does not support Chat Completions API"
+        )
     try:
         generator = await handler.create_chat_completion(request, raw_request)
     except Exception as e:
-        raise HTTPException(status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value, detail=str(e)
+        ) from e
     if isinstance(generator, ErrorResponse):
-        return JSONResponse(content=generator.model_dump(),
-                            status_code=generator.error.code)
+        return JSONResponse(
+            content=generator.model_dump(), status_code=generator.error.code
+        )
 
     elif isinstance(generator, ChatCompletionResponse):
         return JSONResponse(content=generator.model_dump())
@@ -621,108 +635,106 @@ async def create_chat_completion(request: ChatCompletionRequest,
     return StreamingResponse(content=generator, media_type="text/event-stream")
 
 
-@router.post("/v1/completions",
-             dependencies=[Depends(validate_json_request)],
-             responses={
-                 HTTPStatus.OK.value: {
-                     "content": {
-                         "text/event-stream": {}
-                     }
-                 },
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.NOT_FOUND.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 },
-             })
+@router.post(
+    "/v1/completions",
+    dependencies=[Depends(validate_json_request)],
+    responses={
+        HTTPStatus.OK.value: {"content": {"text/event-stream": {}}},
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.NOT_FOUND.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+    },
+)
 @with_cancellation
 @load_aware_call
 async def create_completion(request: CompletionRequest, raw_request: Request):
     handler = completion(raw_request)
     if handler is None:
         return base(raw_request).create_error_response(
-            message="The model does not support Completions API")
+            message="The model does not support Completions API"
+        )
 
     try:
         generator = await handler.create_completion(request, raw_request)
     except OverflowError as e:
-        raise HTTPException(status_code=HTTPStatus.BAD_REQUEST.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.BAD_REQUEST.value, detail=str(e)
+        ) from e
     except Exception as e:
-        raise HTTPException(status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value, detail=str(e)
+        ) from e
 
     if isinstance(generator, ErrorResponse):
-        return JSONResponse(content=generator.model_dump(),
-                            status_code=generator.error.code)
+        return JSONResponse(
+            content=generator.model_dump(), status_code=generator.error.code
+        )
     elif isinstance(generator, CompletionResponse):
         return JSONResponse(content=generator.model_dump())
 
     return StreamingResponse(content=generator, media_type="text/event-stream")
 
 
-@router.post("/v1/embeddings",
-             dependencies=[Depends(validate_json_request)],
-             responses={
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 },
-             })
+@router.post(
+    "/v1/embeddings",
+    dependencies=[Depends(validate_json_request)],
+    responses={
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+    },
+)
 @with_cancellation
 @load_aware_call
 async def create_embedding(request: EmbeddingRequest, raw_request: Request):
     handler = embedding(raw_request)
     if handler is None:
         return base(raw_request).create_error_response(
-            message="The model does not support Embeddings API")
+            message="The model does not support Embeddings API"
+        )
 
     try:
         generator = await handler.create_embedding(request, raw_request)
     except Exception as e:
-        raise HTTPException(status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value, detail=str(e)
+        ) from e
 
     if isinstance(generator, ErrorResponse):
-        return JSONResponse(content=generator.model_dump(),
-                            status_code=generator.error.code)
+        return JSONResponse(
+            content=generator.model_dump(), status_code=generator.error.code
+        )
     elif isinstance(generator, EmbeddingResponse):
         return JSONResponse(content=generator.model_dump())
 
     assert_never(generator)
 
 
-@router.post("/pooling",
-             dependencies=[Depends(validate_json_request)],
-             responses={
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 },
-             })
+@router.post(
+    "/pooling",
+    dependencies=[Depends(validate_json_request)],
+    responses={
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+    },
+)
 @with_cancellation
 @load_aware_call
 async def create_pooling(request: PoolingRequest, raw_request: Request):
     handler = pooling(raw_request)
     if handler is None:
         return base(raw_request).create_error_response(
-            message="The model does not support Pooling API")
+            message="The model does not support Pooling API"
+        )
     try:
         generator = await handler.create_pooling(request, raw_request)
     except Exception as e:
-        raise HTTPException(status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value, detail=str(e)
+        ) from e
     if isinstance(generator, ErrorResponse):
-        return JSONResponse(content=generator.model_dump(),
-                            status_code=generator.error.code)
+        return JSONResponse(
+            content=generator.model_dump(), status_code=generator.error.code
+        )
     elif isinstance(generator, (PoolingResponse, IOProcessorResponse)):
         return JSONResponse(content=generator.model_dump())
 
@@ -732,21 +744,23 @@ async def create_pooling(request: PoolingRequest, raw_request: Request):
 @router.post("/classify", dependencies=[Depends(validate_json_request)])
 @with_cancellation
 @load_aware_call
-async def create_classify(request: ClassificationRequest,
-                          raw_request: Request):
+async def create_classify(request: ClassificationRequest, raw_request: Request):
     handler = classify(raw_request)
     if handler is None:
         return base(raw_request).create_error_response(
-            message="The model does not support Classification API")
+            message="The model does not support Classification API"
+        )
 
     try:
         generator = await handler.create_classify(request, raw_request)
     except Exception as e:
-        raise HTTPException(status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value, detail=str(e)
+        ) from e
     if isinstance(generator, ErrorResponse):
-        return JSONResponse(content=generator.model_dump(),
-                            status_code=generator.error.code)
+        return JSONResponse(
+            content=generator.model_dump(), status_code=generator.error.code
+        )
 
     elif isinstance(generator, ClassificationResponse):
         return JSONResponse(content=generator.model_dump())
@@ -754,96 +768,90 @@ async def create_classify(request: ClassificationRequest,
     assert_never(generator)
 
 
-@router.post("/score",
-             dependencies=[Depends(validate_json_request)],
-             responses={
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 },
-             })
+@router.post(
+    "/score",
+    dependencies=[Depends(validate_json_request)],
+    responses={
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+    },
+)
 @with_cancellation
 @load_aware_call
 async def create_score(request: ScoreRequest, raw_request: Request):
     handler = score(raw_request)
     if handler is None:
         return base(raw_request).create_error_response(
-            message="The model does not support Score API")
+            message="The model does not support Score API"
+        )
 
     try:
         generator = await handler.create_score(request, raw_request)
     except Exception as e:
-        raise HTTPException(status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value, detail=str(e)
+        ) from e
     if isinstance(generator, ErrorResponse):
-        return JSONResponse(content=generator.model_dump(),
-                            status_code=generator.error.code)
+        return JSONResponse(
+            content=generator.model_dump(), status_code=generator.error.code
+        )
     elif isinstance(generator, ScoreResponse):
         return JSONResponse(content=generator.model_dump())
 
     assert_never(generator)
 
 
-@router.post("/v1/score",
-             dependencies=[Depends(validate_json_request)],
-             responses={
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 },
-             })
+@router.post(
+    "/v1/score",
+    dependencies=[Depends(validate_json_request)],
+    responses={
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+    },
+)
 @with_cancellation
 @load_aware_call
 async def create_score_v1(request: ScoreRequest, raw_request: Request):
     logger.warning(
         "To indicate that Score API is not part of standard OpenAI API, we "
-        "have moved it to `/score`. Please update your client accordingly.")
+        "have moved it to `/score`. Please update your client accordingly."
+    )
 
     return await create_score(request, raw_request)
 
 
-@router.post("/v1/audio/transcriptions",
-             responses={
-                 HTTPStatus.OK.value: {
-                     "content": {
-                         "text/event-stream": {}
-                     }
-                 },
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.UNPROCESSABLE_ENTITY.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 },
-             })
+@router.post(
+    "/v1/audio/transcriptions",
+    responses={
+        HTTPStatus.OK.value: {"content": {"text/event-stream": {}}},
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.UNPROCESSABLE_ENTITY.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+    },
+)
 @with_cancellation
 @load_aware_call
-async def create_transcriptions(raw_request: Request,
-                                request: Annotated[TranscriptionRequest,
-                                                   Form()]):
+async def create_transcriptions(
+    raw_request: Request, request: Annotated[TranscriptionRequest, Form()]
+):
     handler = transcription(raw_request)
     if handler is None:
         return base(raw_request).create_error_response(
-            message="The model does not support Transcriptions API")
+            message="The model does not support Transcriptions API"
+        )
 
     audio_data = await request.file.read()
     try:
-        generator = await handler.create_transcription(audio_data, request,
-                                                       raw_request)
+        generator = await handler.create_transcription(audio_data, request, raw_request)
     except Exception as e:
-        raise HTTPException(status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value, detail=str(e)
+        ) from e
 
     if isinstance(generator, ErrorResponse):
-        return JSONResponse(content=generator.model_dump(),
-                            status_code=generator.error.code)
+        return JSONResponse(
+            content=generator.model_dump(), status_code=generator.error.code
+        )
 
     elif isinstance(generator, TranscriptionResponse):
         return JSONResponse(content=generator.model_dump())
@@ -851,44 +859,38 @@ async def create_transcriptions(raw_request: Request,
     return StreamingResponse(content=generator, media_type="text/event-stream")
 
 
-@router.post("/v1/audio/translations",
-             responses={
-                 HTTPStatus.OK.value: {
-                     "content": {
-                         "text/event-stream": {}
-                     }
-                 },
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.UNPROCESSABLE_ENTITY.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 },
-             })
+@router.post(
+    "/v1/audio/translations",
+    responses={
+        HTTPStatus.OK.value: {"content": {"text/event-stream": {}}},
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.UNPROCESSABLE_ENTITY.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+    },
+)
 @with_cancellation
 @load_aware_call
-async def create_translations(request: Annotated[TranslationRequest,
-                                                 Form()],
-                              raw_request: Request):
+async def create_translations(
+    request: Annotated[TranslationRequest, Form()], raw_request: Request
+):
     handler = translation(raw_request)
     if handler is None:
         return base(raw_request).create_error_response(
-            message="The model does not support Translations API")
+            message="The model does not support Translations API"
+        )
 
     audio_data = await request.file.read()
     try:
-        generator = await handler.create_translation(audio_data, request,
-                                                     raw_request)
+        generator = await handler.create_translation(audio_data, request, raw_request)
     except Exception as e:
-        raise HTTPException(status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value, detail=str(e)
+        ) from e
 
     if isinstance(generator, ErrorResponse):
-        return JSONResponse(content=generator.model_dump(),
-                            status_code=generator.error.code)
+        return JSONResponse(
+            content=generator.model_dump(), status_code=generator.error.code
+        )
 
     elif isinstance(generator, TranslationResponse):
         return JSONResponse(content=generator.model_dump())
@@ -896,90 +898,88 @@ async def create_translations(request: Annotated[TranslationRequest,
     return StreamingResponse(content=generator, media_type="text/event-stream")
 
 
-@router.post("/rerank",
-             dependencies=[Depends(validate_json_request)],
-             responses={
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 },
-             })
+@router.post(
+    "/rerank",
+    dependencies=[Depends(validate_json_request)],
+    responses={
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+    },
+)
 @with_cancellation
 @load_aware_call
 async def do_rerank(request: RerankRequest, raw_request: Request):
     handler = rerank(raw_request)
     if handler is None:
         return base(raw_request).create_error_response(
-            message="The model does not support Rerank (Score) API")
+            message="The model does not support Rerank (Score) API"
+        )
     try:
         generator = await handler.do_rerank(request, raw_request)
     except Exception as e:
-        raise HTTPException(status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value,
-                            detail=str(e)) from e
+        raise HTTPException(
+            status_code=HTTPStatus.INTERNAL_SERVER_ERROR.value, detail=str(e)
+        ) from e
     if isinstance(generator, ErrorResponse):
-        return JSONResponse(content=generator.model_dump(),
-                            status_code=generator.error.code)
+        return JSONResponse(
+            content=generator.model_dump(), status_code=generator.error.code
+        )
     elif isinstance(generator, RerankResponse):
         return JSONResponse(content=generator.model_dump())
 
     assert_never(generator)
 
 
-@router.post("/v1/rerank",
-             dependencies=[Depends(validate_json_request)],
-             responses={
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 },
-             })
+@router.post(
+    "/v1/rerank",
+    dependencies=[Depends(validate_json_request)],
+    responses={
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+    },
+)
 @with_cancellation
 async def do_rerank_v1(request: RerankRequest, raw_request: Request):
     logger.warning_once(
         "To indicate that the rerank API is not part of the standard OpenAI"
         " API, we have located it at `/rerank`. Please update your client "
-        "accordingly. (Note: Conforms to JinaAI rerank API)")
+        "accordingly. (Note: Conforms to JinaAI rerank API)"
+    )
 
     return await do_rerank(request, raw_request)
 
 
-@router.post("/v2/rerank",
-             dependencies=[Depends(validate_json_request)],
-             responses={
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 },
-             })
+@router.post(
+    "/v2/rerank",
+    dependencies=[Depends(validate_json_request)],
+    responses={
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+    },
+)
 @with_cancellation
 async def do_rerank_v2(request: RerankRequest, raw_request: Request):
     return await do_rerank(request, raw_request)
 
 
 if envs.VLLM_SERVER_DEV_MODE:
-    logger.warning("SECURITY WARNING: Development endpoints are enabled! "
-                   "This should NOT be used in production!")
+    logger.warning(
+        "SECURITY WARNING: Development endpoints are enabled! "
+        "This should NOT be used in production!"
+    )
 
     PydanticVllmConfig = pydantic.TypeAdapter(VllmConfig)
 
     @router.get("/server_info")
     async def show_server_info(
         raw_request: Request,
-        config_format: Annotated[Literal["text", "json"],
-                                 Query()] = "text",
+        config_format: Annotated[Literal["text", "json"], Query()] = "text",
     ):
         vllm_config: VllmConfig = raw_request.app.state.vllm_config
         server_info = {
-            "vllm_config":
-            str(vllm_config)
-            if config_format == "text" else PydanticVllmConfig.dump_python(
-                vllm_config, mode="json", fallback=str)
+            "vllm_config": str(vllm_config)
+            if config_format == "text"
+            else PydanticVllmConfig.dump_python(vllm_config, mode="json", fallback=str)
             # fallback=str is needed to handle e.g. torch.dtype
         }
         return JSONResponse(content=server_info)
@@ -1030,19 +1030,24 @@ async def collective_rpc(raw_request: Request):
         try:
             body = await raw_request.json()
         except json.JSONDecodeError as e:
-            raise HTTPException(status_code=HTTPStatus.BAD_REQUEST.value,
-                                detail=f"JSON decode error: {e}") from e
+            raise HTTPException(
+                status_code=HTTPStatus.BAD_REQUEST.value,
+                detail=f"JSON decode error: {e}",
+            ) from e
         method = body.get("method")
         if method is None:
-            raise HTTPException(status_code=HTTPStatus.BAD_REQUEST.value,
-                                detail="Missing 'method' in request body")
+            raise HTTPException(
+                status_code=HTTPStatus.BAD_REQUEST.value,
+                detail="Missing 'method' in request body",
+            )
         # For security reason, only serialized string args/kwargs are passed.
         # User-defined `method` is responsible for deserialization if needed.
         args: list[str] = body.get("args", [])
         kwargs: dict[str, str] = body.get("kwargs", {})
         timeout: Optional[float] = body.get("timeout")
         results = await engine_client(raw_request).collective_rpc(
-            method=method, timeout=timeout, args=tuple(args), kwargs=kwargs)
+            method=method, timeout=timeout, args=tuple(args), kwargs=kwargs
+        )
         if results is None:
             return Response(status_code=200)
         response: list[Any] = []
@@ -1054,45 +1059,39 @@ async def collective_rpc(raw_request: Request):
         return JSONResponse(content={"results": response})
 
 
-@router.post("/scale_elastic_ep",
-             dependencies=[Depends(validate_json_request)],
-             responses={
-                 HTTPStatus.OK.value: {
-                     "model": dict
-                 },
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.REQUEST_TIMEOUT.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 },
-             })
+@router.post(
+    "/scale_elastic_ep",
+    dependencies=[Depends(validate_json_request)],
+    responses={
+        HTTPStatus.OK.value: {"model": dict},
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.REQUEST_TIMEOUT.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+    },
+)
 async def scale_elastic_ep(raw_request: Request):
     try:
         body = await raw_request.json()
     except json.JSONDecodeError as e:
-        raise HTTPException(status_code=400,
-                            detail="Invalid JSON format") from e  # noqa: B904
+        raise HTTPException(status_code=400, detail="Invalid JSON format") from e  # noqa: B904
 
     new_data_parallel_size = body.get("new_data_parallel_size")
     drain_timeout = body.get("drain_timeout", 120)  # Default 2 minutes
 
     if new_data_parallel_size is None:
-        raise HTTPException(status_code=400,
-                            detail="new_data_parallel_size is required")
+        raise HTTPException(
+            status_code=400, detail="new_data_parallel_size is required"
+        )
 
-    if not isinstance(new_data_parallel_size,
-                      int) or new_data_parallel_size <= 0:
+    if not isinstance(new_data_parallel_size, int) or new_data_parallel_size <= 0:
         raise HTTPException(
-            status_code=400,
-            detail="new_data_parallel_size must be a positive integer")
+            status_code=400, detail="new_data_parallel_size must be a positive integer"
+        )
 
     if not isinstance(drain_timeout, int) or drain_timeout <= 0:
-        raise HTTPException(status_code=400,
-                            detail="drain_timeout must be a positive integer")
+        raise HTTPException(
+            status_code=400, detail="drain_timeout must be a positive integer"
+        )
 
     # Set scaling flag to prevent new requests
     global _scaling_elastic_ep
@@ -1100,15 +1099,17 @@ async def scale_elastic_ep(raw_request: Request):
     client = engine_client(raw_request)
     try:
         await client.scale_elastic_ep(new_data_parallel_size, drain_timeout)
-        return JSONResponse({
-            "message":
-            f"Scaled to {new_data_parallel_size} "
-            "data parallel engines",
-        })
+        return JSONResponse(
+            {
+                "message": f"Scaled to {new_data_parallel_size} data parallel engines",
+            }
+        )
     except TimeoutError as e:
-        raise HTTPException(status_code=408,
-                            detail="Scale failed due to request drain timeout "
-                            f"after {drain_timeout} seconds") from e
+        raise HTTPException(
+            status_code=408,
+            detail="Scale failed due to request drain timeout "
+            f"after {drain_timeout} seconds",
+        ) from e
     except Exception as e:
         logger.error("Scale failed: %s", e)
         raise HTTPException(status_code=500, detail="Scale failed") from e
@@ -1145,31 +1146,29 @@ async def is_scaling_elastic_ep(raw_request: Request):
 ]
 
 
-@router.post("/invocations",
-             dependencies=[Depends(validate_json_request)],
-             responses={
-                 HTTPStatus.BAD_REQUEST.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.UNSUPPORTED_MEDIA_TYPE.value: {
-                     "model": ErrorResponse
-                 },
-                 HTTPStatus.INTERNAL_SERVER_ERROR.value: {
-                     "model": ErrorResponse
-                 },
-             })
+@router.post(
+    "/invocations",
+    dependencies=[Depends(validate_json_request)],
+    responses={
+        HTTPStatus.BAD_REQUEST.value: {"model": ErrorResponse},
+        HTTPStatus.UNSUPPORTED_MEDIA_TYPE.value: {"model": ErrorResponse},
+        HTTPStatus.INTERNAL_SERVER_ERROR.value: {"model": ErrorResponse},
+    },
+)
 async def invocations(raw_request: Request):
     """For SageMaker, routes requests based on the request type."""
     try:
         body = await raw_request.json()
     except json.JSONDecodeError as e:
-        raise HTTPException(status_code=HTTPStatus.BAD_REQUEST.value,
-                            detail=f"JSON decode error: {e}") from e
+        raise HTTPException(
+            status_code=HTTPStatus.BAD_REQUEST.value, detail=f"JSON decode error: {e}"
+        ) from e
 
-    valid_endpoints = [(validator, endpoint)
-                       for validator, (get_handler,
-                                       endpoint) in INVOCATION_VALIDATORS
-                       if get_handler(raw_request) is not None]
+    valid_endpoints = [
+        (validator, endpoint)
+        for validator, (get_handler, endpoint) in INVOCATION_VALIDATORS
+        if get_handler(raw_request) is not None
+    ]
 
     for request_validator, endpoint in valid_endpoints:
         try:
@@ -1183,8 +1182,7 @@ async def invocations(raw_request: Request):
         t.__name__ if isinstance(t := validator._type, type) else str(t)
         for validator, _ in valid_endpoints
     ]
-    msg = ("Cannot find suitable handler for request. "
-           f"Expected one of: {type_names}")
+    msg = f"Cannot find suitable handler for request. Expected one of: {type_names}"
     res = base(raw_request).create_error_response(message=msg)
     return JSONResponse(content=res.model_dump(), status_code=res.error.code)
 
@@ -1192,7 +1190,8 @@ async def invocations(raw_request: Request):
 if envs.VLLM_TORCH_PROFILER_DIR:
     logger.warning(
         "Torch Profiler is enabled in the API server. This should ONLY be "
-        "used for local development!")
+        "used for local development!"
+    )
 
     @router.post("/start_profile")
     async def start_profile(raw_request: Request):
@@ -1212,29 +1211,32 @@ async def stop_profile(raw_request: Request):
 if envs.VLLM_ALLOW_RUNTIME_LORA_UPDATING:
     logger.warning(
         "LoRA dynamic loading & unloading is enabled in the API server. "
-        "This should ONLY be used for local development!")
+        "This should ONLY be used for local development!"
+    )
 
-    @router.post("/v1/load_lora_adapter",
-                 dependencies=[Depends(validate_json_request)])
-    async def load_lora_adapter(request: LoadLoRAAdapterRequest,
-                                raw_request: Request):
+    @router.post("/v1/load_lora_adapter", dependencies=[Depends(validate_json_request)])
+    async def load_lora_adapter(request: LoadLoRAAdapterRequest, raw_request: Request):
         handler = models(raw_request)
         response = await handler.load_lora_adapter(request)
         if isinstance(response, ErrorResponse):
-            return JSONResponse(content=response.model_dump(),
-                                status_code=response.error.code)
+            return JSONResponse(
+                content=response.model_dump(), status_code=response.error.code
+            )
 
         return Response(status_code=200, content=response)
 
-    @router.post("/v1/unload_lora_adapter",
-                 dependencies=[Depends(validate_json_request)])
-    async def unload_lora_adapter(request: UnloadLoRAAdapterRequest,
-                                  raw_request: Request):
+    @router.post(
+        "/v1/unload_lora_adapter", dependencies=[Depends(validate_json_request)]
+    )
+    async def unload_lora_adapter(
+        request: UnloadLoRAAdapterRequest, raw_request: Request
+    ):
         handler = models(raw_request)
         response = await handler.unload_lora_adapter(request)
         if isinstance(response, ErrorResponse):
-            return JSONResponse(content=response.model_dump(),
-                                status_code=response.error.code)
+            return JSONResponse(
+                content=response.model_dump(), status_code=response.error.code
+            )
 
         return Response(status_code=200, content=response)
 
@@ -1246,8 +1248,9 @@ def load_log_config(log_config_file: Optional[str]) -> Optional[dict]:
         with open(log_config_file) as f:
             return json.load(f)
     except Exception as e:
-        logger.warning("Failed to load log config from file %s: error %s",
-                       log_config_file, e)
+        logger.warning(
+            "Failed to load log config from file %s: error %s", log_config_file, e
+        )
         return None
 
 
@@ -1265,9 +1268,7 @@ class AuthenticationMiddleware:
 
     def __init__(self, app: ASGIApp, tokens: list[str]) -> None:
         self.app = app
-        self.api_tokens = [
-            hashlib.sha256(t.encode("utf-8")).digest() for t in tokens
-        ]
+        self.api_tokens = [hashlib.sha256(t.encode("utf-8")).digest() for t in tokens]
 
     def verify_token(self, headers: Headers) -> bool:
         authorization_header_value = headers.get("Authorization")
@@ -1286,10 +1287,8 @@ def verify_token(self, headers: Headers) -> bool:
 
         return token_match
 
-    def __call__(self, scope: Scope, receive: Receive,
-                 send: Send) -> Awaitable[None]:
-        if scope["type"] not in ("http",
-                                 "websocket") or scope["method"] == "OPTIONS":
+    def __call__(self, scope: Scope, receive: Receive, send: Send) -> Awaitable[None]:
+        if scope["type"] not in ("http", "websocket") or scope["method"] == "OPTIONS":
             # scope["type"] can be "lifespan" or "startup" for example,
             # in which case we don't need to do anything
             return self.app(scope, receive, send)
@@ -1298,8 +1297,7 @@ def __call__(self, scope: Scope, receive: Receive,
         headers = Headers(scope=scope)
         # Type narrow to satisfy mypy.
         if url_path.startswith("/v1") and not self.verify_token(headers):
-            response = JSONResponse(content={"error": "Unauthorized"},
-                                    status_code=401)
+            response = JSONResponse(content={"error": "Unauthorized"}, status_code=401)
             return response(scope, receive, send)
         return self.app(scope, receive, send)
 
@@ -1314,8 +1312,7 @@ class XRequestIdMiddleware:
     def __init__(self, app: ASGIApp) -> None:
         self.app = app
 
-    def __call__(self, scope: Scope, receive: Receive,
-                 send: Send) -> Awaitable[None]:
+    def __call__(self, scope: Scope, receive: Receive, send: Send) -> Awaitable[None]:
         if scope["type"] not in ("http", "websocket"):
             return self.app(scope, receive, send)
 
@@ -1329,8 +1326,7 @@ async def send_with_request_id(message: Message) -> None:
             """
             if message["type"] == "http.response.start":
                 response_headers = MutableHeaders(raw=message["headers"])
-                request_id = request_headers.get("X-Request-Id",
-                                                 uuid.uuid4().hex)
+                request_id = request_headers.get("X-Request-Id", uuid.uuid4().hex)
                 response_headers.append("X-Request-Id", request_id)
             await send(message)
 
@@ -1353,8 +1349,7 @@ class ScalingMiddleware:
     def __init__(self, app: ASGIApp) -> None:
         self.app = app
 
-    def __call__(self, scope: Scope, receive: Receive,
-                 send: Send) -> Awaitable[None]:
+    def __call__(self, scope: Scope, receive: Receive, send: Send) -> Awaitable[None]:
         if scope["type"] != "http":
             return self.app(scope, receive, send)
 
@@ -1362,11 +1357,12 @@ def __call__(self, scope: Scope, receive: Receive,
         global _scaling_elastic_ep
         if _scaling_elastic_ep:
             # Return 503 Service Unavailable response
-            response = JSONResponse(content={
-                "error":
-                "The model is currently scaling. Please try again later."
-            },
-                                    status_code=503)
+            response = JSONResponse(
+                content={
+                    "error": "The model is currently scaling. Please try again later."
+                },
+                status_code=503,
+            )
             return response(scope, receive, send)
 
         return self.app(scope, receive, send)
@@ -1376,28 +1372,27 @@ def _extract_content_from_chunk(chunk_data: dict) -> str:
     """Extract content from a streaming response chunk."""
     try:
         from vllm.entrypoints.openai.protocol import (
-            ChatCompletionStreamResponse, CompletionStreamResponse)
+            ChatCompletionStreamResponse,
+            CompletionStreamResponse,
+        )
 
         # Try using Completion types for type-safe parsing
-        if chunk_data.get('object') == 'chat.completion.chunk':
-            chat_response = ChatCompletionStreamResponse.model_validate(
-                chunk_data)
+        if chunk_data.get("object") == "chat.completion.chunk":
+            chat_response = ChatCompletionStreamResponse.model_validate(chunk_data)
             if chat_response.choices and chat_response.choices[0].delta.content:
                 return chat_response.choices[0].delta.content
-        elif chunk_data.get('object') == 'text_completion':
-            completion_response = CompletionStreamResponse.model_validate(
-                chunk_data)
-            if completion_response.choices and completion_response.choices[
-                    0].text:
+        elif chunk_data.get("object") == "text_completion":
+            completion_response = CompletionStreamResponse.model_validate(chunk_data)
+            if completion_response.choices and completion_response.choices[0].text:
                 return completion_response.choices[0].text
     except pydantic.ValidationError:
         # Fallback to manual parsing
-        if 'choices' in chunk_data and chunk_data['choices']:
-            choice = chunk_data['choices'][0]
-            if 'delta' in choice and choice['delta'].get('content'):
-                return choice['delta']['content']
-            elif choice.get('text'):
-                return choice['text']
+        if "choices" in chunk_data and chunk_data["choices"]:
+            choice = chunk_data["choices"][0]
+            if "delta" in choice and choice["delta"].get("content"):
+                return choice["delta"]["content"]
+            elif choice.get("text"):
+                return choice["text"]
     return ""
 
 
@@ -1413,7 +1408,7 @@ def decode_chunk(self, chunk: bytes) -> list[dict]:
         import json
 
         try:
-            chunk_str = chunk.decode('utf-8')
+            chunk_str = chunk.decode("utf-8")
         except UnicodeDecodeError:
             # Skip malformed chunks
             return []
@@ -1422,18 +1417,18 @@ def decode_chunk(self, chunk: bytes) -> list[dict]:
         events = []
 
         # Process complete lines
-        while '\n' in self.buffer:
-            line, self.buffer = self.buffer.split('\n', 1)
-            line = line.rstrip('\r')  # Handle CRLF
+        while "\n" in self.buffer:
+            line, self.buffer = self.buffer.split("\n", 1)
+            line = line.rstrip("\r")  # Handle CRLF
 
-            if line.startswith('data: '):
+            if line.startswith("data: "):
                 data_str = line[6:].strip()
-                if data_str == '[DONE]':
-                    events.append({'type': 'done'})
+                if data_str == "[DONE]":
+                    events.append({"type": "done"})
                 elif data_str:
                     try:
                         event_data = json.loads(data_str)
-                        events.append({'type': 'data', 'data': event_data})
+                        events.append({"type": "data", "data": event_data})
                     except json.JSONDecodeError:
                         # Skip malformed JSON
                         continue
@@ -1451,7 +1446,7 @@ def add_content(self, content: str) -> None:
 
     def get_complete_content(self) -> str:
         """Get the complete buffered content."""
-        return ''.join(self.content_buffer)
+        return "".join(self.content_buffer)
 
 
 def _log_streaming_response(response, response_body: list) -> None:
@@ -1472,10 +1467,10 @@ def buffered_iterator():
             events = sse_decoder.decode_chunk(chunk)
 
             for event in events:
-                if event['type'] == 'data':
-                    content = sse_decoder.extract_content(event['data'])
+                if event["type"] == "data":
+                    content = sse_decoder.extract_content(event["data"])
                     sse_decoder.add_content(content)
-                elif event['type'] == 'done':
+                elif event["type"] == "done":
                     # Log complete content when done
                     full_content = sse_decoder.get_complete_content()
                     if full_content:
@@ -1484,19 +1479,20 @@ def buffered_iterator():
                             full_content = full_content[:2048] + ""
                             "...[truncated]"
                         logger.info(
-                            "response_body={streaming_complete: " \
+                            "response_body={streaming_complete: "
                             "content='%s', chunks=%d}",
-                            full_content, chunk_count)
+                            full_content,
+                            chunk_count,
+                        )
                     else:
                         logger.info(
-                            "response_body={streaming_complete: " \
-                            "no_content, chunks=%d}",
-                            chunk_count)
+                            "response_body={streaming_complete: no_content, chunks=%d}",
+                            chunk_count,
+                        )
                     return
 
     response.body_iterator = iterate_in_threadpool(buffered_iterator())
-    logger.info("response_body={streaming_started: chunks=%d}",
-                len(response_body))
+    logger.info("response_body={streaming_started: chunks=%d}", len(response_body))
 
 
 def _log_non_streaming_response(response_body: list) -> None:
@@ -1510,10 +1506,9 @@ def _log_non_streaming_response(response_body: list) -> None:
 
 def build_app(args: Namespace) -> FastAPI:
     if args.disable_fastapi_docs:
-        app = FastAPI(openapi_url=None,
-                      docs_url=None,
-                      redoc_url=None,
-                      lifespan=lifespan)
+        app = FastAPI(
+            openapi_url=None, docs_url=None, redoc_url=None, lifespan=lifespan
+        )
     else:
         app = FastAPI(lifespan=lifespan)
     app.include_router(router)
@@ -1532,14 +1527,16 @@ def build_app(args: Namespace) -> FastAPI:
     @app.exception_handler(HTTPException)
     async def http_exception_handler(_: Request, exc: HTTPException):
         err = ErrorResponse(
-            error=ErrorInfo(message=exc.detail,
-                            type=HTTPStatus(exc.status_code).phrase,
-                            code=exc.status_code))
+            error=ErrorInfo(
+                message=exc.detail,
+                type=HTTPStatus(exc.status_code).phrase,
+                code=exc.status_code,
+            )
+        )
         return JSONResponse(err.model_dump(), status_code=exc.status_code)
 
     @app.exception_handler(RequestValidationError)
-    async def validation_exception_handler(_: Request,
-                                           exc: RequestValidationError):
+    async def validation_exception_handler(_: Request, exc: RequestValidationError):
         exc_str = str(exc)
         errors_str = str(exc.errors())
 
@@ -1548,11 +1545,14 @@ async def validation_exception_handler(_: Request,
         else:
             message = exc_str
 
-        err = ErrorResponse(error=ErrorInfo(message=message,
-                                            type=HTTPStatus.BAD_REQUEST.phrase,
-                                            code=HTTPStatus.BAD_REQUEST))
-        return JSONResponse(err.model_dump(),
-                            status_code=HTTPStatus.BAD_REQUEST)
+        err = ErrorResponse(
+            error=ErrorInfo(
+                message=message,
+                type=HTTPStatus.BAD_REQUEST.phrase,
+                code=HTTPStatus.BAD_REQUEST,
+            )
+        )
+        return JSONResponse(err.model_dump(), status_code=HTTPStatus.BAD_REQUEST)
 
     # Ensure --api-key option from CLI takes precedence over VLLM_API_KEY
     if tokens := [key for key in (args.api_key or [envs.VLLM_API_KEY]) if key]:
@@ -1565,16 +1565,16 @@ async def validation_exception_handler(_: Request,
     app.add_middleware(ScalingMiddleware)
 
     if envs.VLLM_DEBUG_LOG_API_SERVER_RESPONSE:
-        logger.warning("CAUTION: Enabling log response in the API Server. "
-                       "This can include sensitive information and should be "
-                       "avoided in production.")
+        logger.warning(
+            "CAUTION: Enabling log response in the API Server. "
+            "This can include sensitive information and should be "
+            "avoided in production."
+        )
 
         @app.middleware("http")
         async def log_response(request: Request, call_next):
             response = await call_next(request)
-            response_body = [
-                section async for section in response.body_iterator
-            ]
+            response_body = [section async for section in response.body_iterator]
             response.body_iterator = iterate_in_threadpool(iter(response_body))
             # Check if this is a streaming response by looking at content-type
             content_type = response.headers.get("content-type", "")
@@ -1597,8 +1597,9 @@ async def log_response(request: Request, call_next):
         elif inspect.iscoroutinefunction(imported):
             app.middleware("http")(imported)
         else:
-            raise ValueError(f"Invalid middleware {middleware}. "
-                             f"Must be a function or a class.")
+            raise ValueError(
+                f"Invalid middleware {middleware}. Must be a function or a class."
+            )
 
     return app
 
@@ -1620,8 +1621,7 @@ async def init_app_state(
         request_logger = None
 
     base_model_paths = [
-        BaseModelPath(name=name, model_path=args.model)
-        for name in served_model_names
+        BaseModelPath(name=name, model_path=args.model) for name in served_model_names
     ]
 
     state.engine_client = engine_client
@@ -1641,7 +1641,8 @@ async def init_app_state(
         if isinstance(tokenizer, MistralTokenizer):
             # The warning is logged in resolve_mistral_chat_template.
             resolved_chat_template = resolve_mistral_chat_template(
-                chat_template=resolved_chat_template)
+                chat_template=resolved_chat_template
+            )
         else:
             hf_chat_template = resolve_hf_chat_template(
                 tokenizer=tokenizer,
@@ -1655,7 +1656,9 @@ async def init_app_state(
                     "Using supplied chat template: %s\n"
                     "It is different from official chat template '%s'. "
                     "This discrepancy may lead to performance degradation.",
-                    resolved_chat_template, args.model)
+                    resolved_chat_template,
+                    args.model,
+                )
 
     if args.tool_server == "demo":
         tool_server: Optional[ToolServer] = DemoToolServer()
@@ -1668,8 +1671,11 @@ async def init_app_state(
         tool_server = None
 
     # Merge default_mm_loras into the static lora_modules
-    default_mm_loras = (vllm_config.lora_config.default_mm_loras
-                        if vllm_config.lora_config is not None else {})
+    default_mm_loras = (
+        vllm_config.lora_config.default_mm_loras
+        if vllm_config.lora_config is not None
+        else {}
+    )
 
     lora_modules = args.lora_modules
     if default_mm_loras:
@@ -1677,7 +1683,8 @@ async def init_app_state(
             LoRAModulePath(
                 name=modality,
                 path=lora_path,
-            ) for modality, lora_path in default_mm_loras.items()
+            )
+            for modality, lora_path in default_mm_loras.items()
         ]
         if args.lora_modules is None:
             lora_modules = default_mm_lora_paths
@@ -1691,87 +1698,114 @@ async def init_app_state(
         lora_modules=lora_modules,
     )
     await state.openai_serving_models.init_static_loras()
-    state.openai_serving_responses = OpenAIServingResponses(
-        engine_client,
-        model_config,
-        state.openai_serving_models,
-        request_logger=request_logger,
-        chat_template=resolved_chat_template,
-        chat_template_content_format=args.chat_template_content_format,
-        return_tokens_as_token_ids=args.return_tokens_as_token_ids,
-        enable_auto_tools=args.enable_auto_tool_choice,
-        tool_parser=args.tool_call_parser,
-        tool_server=tool_server,
-        reasoning_parser=args.structured_outputs_config.reasoning_parser,
-        enable_prompt_tokens_details=args.enable_prompt_tokens_details,
-        enable_force_include_usage=args.enable_force_include_usage,
-        enable_log_outputs=args.enable_log_outputs,
-        log_error_stack=args.log_error_stack,
-    ) if "generate" in supported_tasks else None
-    state.openai_serving_chat = OpenAIServingChat(
-        engine_client,
-        model_config,
-        state.openai_serving_models,
-        args.response_role,
-        request_logger=request_logger,
-        chat_template=resolved_chat_template,
-        chat_template_content_format=args.chat_template_content_format,
-        trust_request_chat_template=args.trust_request_chat_template,
-        return_tokens_as_token_ids=args.return_tokens_as_token_ids,
-        enable_auto_tools=args.enable_auto_tool_choice,
-        exclude_tools_when_tool_choice_none=args.
-        exclude_tools_when_tool_choice_none,
-        tool_parser=args.tool_call_parser,
-        reasoning_parser=args.structured_outputs_config.reasoning_parser,
-        enable_prompt_tokens_details=args.enable_prompt_tokens_details,
-        enable_force_include_usage=args.enable_force_include_usage,
-        enable_log_outputs=args.enable_log_outputs,
-        log_error_stack=args.log_error_stack,
-    ) if "generate" in supported_tasks else None
-    state.openai_serving_completion = OpenAIServingCompletion(
-        engine_client,
-        model_config,
-        state.openai_serving_models,
-        request_logger=request_logger,
-        return_tokens_as_token_ids=args.return_tokens_as_token_ids,
-        enable_prompt_tokens_details=args.enable_prompt_tokens_details,
-        enable_force_include_usage=args.enable_force_include_usage,
-        log_error_stack=args.log_error_stack,
-    ) if "generate" in supported_tasks else None
-    state.openai_serving_pooling = OpenAIServingPooling(
-        engine_client,
-        vllm_config,
-        state.openai_serving_models,
-        request_logger=request_logger,
-        chat_template=resolved_chat_template,
-        chat_template_content_format=args.chat_template_content_format,
-        trust_request_chat_template=args.trust_request_chat_template,
-        log_error_stack=args.log_error_stack,
-    ) if "encode" in supported_tasks else None
-    state.openai_serving_embedding = OpenAIServingEmbedding(
-        engine_client,
-        model_config,
-        state.openai_serving_models,
-        request_logger=request_logger,
-        chat_template=resolved_chat_template,
-        chat_template_content_format=args.chat_template_content_format,
-        trust_request_chat_template=args.trust_request_chat_template,
-        log_error_stack=args.log_error_stack,
-    ) if "embed" in supported_tasks else None
-    state.openai_serving_classification = ServingClassification(
-        engine_client,
-        model_config,
-        state.openai_serving_models,
-        request_logger=request_logger,
-        log_error_stack=args.log_error_stack,
-    ) if "classify" in supported_tasks else None
-    state.openai_serving_scores = ServingScores(
-        engine_client,
-        model_config,
-        state.openai_serving_models,
-        request_logger=request_logger,
-        log_error_stack=args.log_error_stack,
-    ) if ("embed" in supported_tasks or "score" in supported_tasks) else None
+    state.openai_serving_responses = (
+        OpenAIServingResponses(
+            engine_client,
+            model_config,
+            state.openai_serving_models,
+            request_logger=request_logger,
+            chat_template=resolved_chat_template,
+            chat_template_content_format=args.chat_template_content_format,
+            return_tokens_as_token_ids=args.return_tokens_as_token_ids,
+            enable_auto_tools=args.enable_auto_tool_choice,
+            tool_parser=args.tool_call_parser,
+            tool_server=tool_server,
+            reasoning_parser=args.structured_outputs_config.reasoning_parser,
+            enable_prompt_tokens_details=args.enable_prompt_tokens_details,
+            enable_force_include_usage=args.enable_force_include_usage,
+            enable_log_outputs=args.enable_log_outputs,
+            log_error_stack=args.log_error_stack,
+        )
+        if "generate" in supported_tasks
+        else None
+    )
+    state.openai_serving_chat = (
+        OpenAIServingChat(
+            engine_client,
+            model_config,
+            state.openai_serving_models,
+            args.response_role,
+            request_logger=request_logger,
+            chat_template=resolved_chat_template,
+            chat_template_content_format=args.chat_template_content_format,
+            trust_request_chat_template=args.trust_request_chat_template,
+            return_tokens_as_token_ids=args.return_tokens_as_token_ids,
+            enable_auto_tools=args.enable_auto_tool_choice,
+            exclude_tools_when_tool_choice_none=args.exclude_tools_when_tool_choice_none,
+            tool_parser=args.tool_call_parser,
+            reasoning_parser=args.structured_outputs_config.reasoning_parser,
+            enable_prompt_tokens_details=args.enable_prompt_tokens_details,
+            enable_force_include_usage=args.enable_force_include_usage,
+            enable_log_outputs=args.enable_log_outputs,
+            log_error_stack=args.log_error_stack,
+        )
+        if "generate" in supported_tasks
+        else None
+    )
+    state.openai_serving_completion = (
+        OpenAIServingCompletion(
+            engine_client,
+            model_config,
+            state.openai_serving_models,
+            request_logger=request_logger,
+            return_tokens_as_token_ids=args.return_tokens_as_token_ids,
+            enable_prompt_tokens_details=args.enable_prompt_tokens_details,
+            enable_force_include_usage=args.enable_force_include_usage,
+            log_error_stack=args.log_error_stack,
+        )
+        if "generate" in supported_tasks
+        else None
+    )
+    state.openai_serving_pooling = (
+        OpenAIServingPooling(
+            engine_client,
+            vllm_config,
+            state.openai_serving_models,
+            request_logger=request_logger,
+            chat_template=resolved_chat_template,
+            chat_template_content_format=args.chat_template_content_format,
+            trust_request_chat_template=args.trust_request_chat_template,
+            log_error_stack=args.log_error_stack,
+        )
+        if "encode" in supported_tasks
+        else None
+    )
+    state.openai_serving_embedding = (
+        OpenAIServingEmbedding(
+            engine_client,
+            model_config,
+            state.openai_serving_models,
+            request_logger=request_logger,
+            chat_template=resolved_chat_template,
+            chat_template_content_format=args.chat_template_content_format,
+            trust_request_chat_template=args.trust_request_chat_template,
+            log_error_stack=args.log_error_stack,
+        )
+        if "embed" in supported_tasks
+        else None
+    )
+    state.openai_serving_classification = (
+        ServingClassification(
+            engine_client,
+            model_config,
+            state.openai_serving_models,
+            request_logger=request_logger,
+            log_error_stack=args.log_error_stack,
+        )
+        if "classify" in supported_tasks
+        else None
+    )
+    state.openai_serving_scores = (
+        ServingScores(
+            engine_client,
+            model_config,
+            state.openai_serving_models,
+            request_logger=request_logger,
+            log_error_stack=args.log_error_stack,
+        )
+        if ("embed" in supported_tasks or "score" in supported_tasks)
+        else None
+    )
     state.openai_serving_tokenization = OpenAIServingTokenization(
         engine_client,
         model_config,
@@ -1782,20 +1816,28 @@ async def init_app_state(
         trust_request_chat_template=args.trust_request_chat_template,
         log_error_stack=args.log_error_stack,
     )
-    state.openai_serving_transcription = OpenAIServingTranscription(
-        engine_client,
-        model_config,
-        state.openai_serving_models,
-        request_logger=request_logger,
-        log_error_stack=args.log_error_stack,
-    ) if "transcription" in supported_tasks else None
-    state.openai_serving_translation = OpenAIServingTranslation(
-        engine_client,
-        model_config,
-        state.openai_serving_models,
-        request_logger=request_logger,
-        log_error_stack=args.log_error_stack,
-    ) if "transcription" in supported_tasks else None
+    state.openai_serving_transcription = (
+        OpenAIServingTranscription(
+            engine_client,
+            model_config,
+            state.openai_serving_models,
+            request_logger=request_logger,
+            log_error_stack=args.log_error_stack,
+        )
+        if "transcription" in supported_tasks
+        else None
+    )
+    state.openai_serving_translation = (
+        OpenAIServingTranslation(
+            engine_client,
+            model_config,
+            state.openai_serving_models,
+            request_logger=request_logger,
+            log_error_stack=args.log_error_stack,
+        )
+        if "transcription" in supported_tasks
+        else None
+    )
 
     state.enable_server_load_tracking = args.enable_server_load_tracking
     state.server_load_metrics = 0
@@ -1822,17 +1864,20 @@ def create_server_unix_socket(path: str) -> socket.socket:
 
 def validate_api_server_args(args):
     valid_tool_parses = ToolParserManager.tool_parsers.keys()
-    if args.enable_auto_tool_choice \
-            and args.tool_call_parser not in valid_tool_parses:
-        raise KeyError(f"invalid tool call parser: {args.tool_call_parser} "
-                       f"(chose from {{ {','.join(valid_tool_parses)} }})")
+    if args.enable_auto_tool_choice and args.tool_call_parser not in valid_tool_parses:
+        raise KeyError(
+            f"invalid tool call parser: {args.tool_call_parser} "
+            f"(chose from {{ {','.join(valid_tool_parses)} }})"
+        )
 
     valid_reasoning_parses = ReasoningParserManager.reasoning_parsers.keys()
-    if ((reasoning_parser := args.structured_outputs_config.reasoning_parser)
-            and reasoning_parser not in valid_reasoning_parses):
+    if (
+        reasoning_parser := args.structured_outputs_config.reasoning_parser
+    ) and reasoning_parser not in valid_reasoning_parses:
         raise KeyError(
             f"invalid reasoning parser: {reasoning_parser} "
-            f"(chose from {{ {','.join(valid_reasoning_parses)} }})")
+            f"(chose from {{ {','.join(valid_reasoning_parses)} }})"
+        )
 
 
 def setup_server(args):
@@ -1871,8 +1916,7 @@ def signal_handler(*_) -> None:
     else:
         addr, port = sock_addr
         is_ssl = args.ssl_keyfile and args.ssl_certfile
-        host_part = f"[{addr}]" if is_valid_ipv6_address(
-            addr) else addr or "0.0.0.0"
+        host_part = f"[{addr}]" if is_valid_ipv6_address(addr) else addr or "0.0.0.0"
         listen_address = f"http{'s' if is_ssl else ''}://{host_part}:{port}"
     return listen_address, sock
 
@@ -1887,11 +1931,9 @@ async def run_server(args, **uvicorn_kwargs) -> None:
     await run_server_worker(listen_address, sock, args, **uvicorn_kwargs)
 
 
-async def run_server_worker(listen_address,
-                            sock,
-                            args,
-                            client_config=None,
-                            **uvicorn_kwargs) -> None:
+async def run_server_worker(
+    listen_address, sock, args, client_config=None, **uvicorn_kwargs
+) -> None:
     """Run a single API server worker."""
 
     if args.tool_parser_plugin and len(args.tool_parser_plugin) > 3:
@@ -1900,11 +1942,11 @@ async def run_server_worker(listen_address,
     # Load logging config for uvicorn if specified
     log_config = load_log_config(args.log_config_file)
     if log_config is not None:
-        uvicorn_kwargs['log_config'] = log_config
+        uvicorn_kwargs["log_config"] = log_config
 
     async with build_async_engine_client(
-            args,
-            client_config=client_config,
+        args,
+        client_config=client_config,
     ) as engine_client:
         maybe_register_tokenizer_info_endpoint(args)
         app = build_app(args)
@@ -1912,9 +1954,11 @@ async def run_server_worker(listen_address,
         vllm_config = await engine_client.get_vllm_config()
         await init_app_state(engine_client, vllm_config, app.state, args)
 
-        logger.info("Starting vLLM API server %d on %s",
-                    vllm_config.parallel_config._api_process_rank,
-                    listen_address)
+        logger.info(
+            "Starting vLLM API server %d on %s",
+            vllm_config.parallel_config._api_process_rank,
+            listen_address,
+        )
         shutdown_task = await serve_http(
             app,
             sock=sock,
@@ -1948,7 +1992,8 @@ async def run_server_worker(listen_address,
     # entrypoints.
     cli_env_setup()
     parser = FlexibleArgumentParser(
-        description="vLLM OpenAI-Compatible RESTful API server.")
+        description="vLLM OpenAI-Compatible RESTful API server."
+    )
     parser = make_arg_parser(parser)
     args = parser.parse_args()
     validate_parsed_serve_args(args)
diff --git a/vllm/entrypoints/openai/cli_args.py b/vllm/entrypoints/openai/cli_args.py
index a306c2bb7cb5..1f16646db63b 100644
--- a/vllm/entrypoints/openai/cli_args.py
+++ b/vllm/entrypoints/openai/cli_args.py
@@ -18,10 +18,14 @@
 import vllm.envs as envs
 from vllm.config import config
 from vllm.engine.arg_utils import AsyncEngineArgs, optional_type
-from vllm.entrypoints.chat_utils import (ChatTemplateContentFormatOption,
-                                         validate_chat_template)
-from vllm.entrypoints.constants import (H11_MAX_HEADER_COUNT_DEFAULT,
-                                        H11_MAX_INCOMPLETE_EVENT_SIZE_DEFAULT)
+from vllm.entrypoints.chat_utils import (
+    ChatTemplateContentFormatOption,
+    validate_chat_template,
+)
+from vllm.entrypoints.constants import (
+    H11_MAX_HEADER_COUNT_DEFAULT,
+    H11_MAX_INCOMPLETE_EVENT_SIZE_DEFAULT,
+)
 from vllm.entrypoints.openai.serving_models import LoRAModulePath
 from vllm.entrypoints.openai.tool_parsers import ToolParserManager
 from vllm.logger import init_logger
@@ -31,7 +35,6 @@
 
 
 class LoRAParserAction(argparse.Action):
-
     def __call__(
         self,
         parser: argparse.ArgumentParser,
@@ -57,8 +60,7 @@ def __call__(
                     lora = LoRAModulePath(**lora_dict)
                     lora_list.append(lora)
                 except json.JSONDecodeError:
-                    parser.error(
-                        f"Invalid JSON format for --lora-modules: {item}")
+                    parser.error(f"Invalid JSON format for --lora-modules: {item}")
                 except TypeError as e:
                     parser.error(
                         f"Invalid fields for --lora-modules: {item} - {str(e)}"
@@ -70,14 +72,16 @@ def __call__(
 @dataclass
 class FrontendArgs:
     """Arguments for the OpenAI-compatible frontend server."""
+
     host: Optional[str] = None
     """Host name."""
     port: int = 8000
     """Port number."""
     uds: Optional[str] = None
     """Unix domain socket path. If set, host and port arguments are ignored."""
-    uvicorn_log_level: Literal["debug", "info", "warning", "error", "critical",
-                               "trace"] = "info"
+    uvicorn_log_level: Literal[
+        "debug", "info", "warning", "error", "critical", "trace"
+    ] = "info"
     """Log level for uvicorn."""
     disable_uvicorn_access_log: bool = False
     """Disable uvicorn access log."""
@@ -218,7 +222,8 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
         valid_tool_parsers = list(ToolParserManager.tool_parsers.keys())
         parsers_str = ",".join(valid_tool_parsers)
         frontend_kwargs["tool_call_parser"]["metavar"] = (
-            f"{{{parsers_str}}} or name registered in --tool-parser-plugin")
+            f"{{{parsers_str}}} or name registered in --tool-parser-plugin"
+        )
 
         frontend_group = parser.add_argument_group(
             title="Frontend",
@@ -238,27 +243,32 @@ def make_arg_parser(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
     register all arguments instead of manually enumerating them here. This
     avoids code duplication and keeps the argument definitions in one place.
     """
-    parser.add_argument("model_tag",
-                        type=str,
-                        nargs="?",
-                        help="The model tag to serve "
-                        "(optional if specified in config)")
+    parser.add_argument(
+        "model_tag",
+        type=str,
+        nargs="?",
+        help="The model tag to serve (optional if specified in config)",
+    )
     parser.add_argument(
         "--headless",
         action="store_true",
         default=False,
         help="Run in headless mode. See multi-node data parallel "
-        "documentation for more details.")
-    parser.add_argument("--api-server-count",
-                        "-asc",
-                        type=int,
-                        default=1,
-                        help="How many API server processes to run.")
+        "documentation for more details.",
+    )
+    parser.add_argument(
+        "--api-server-count",
+        "-asc",
+        type=int,
+        default=1,
+        help="How many API server processes to run.",
+    )
     parser.add_argument(
         "--config",
         help="Read CLI options from a config file. "
         "Must be a YAML with the following options: "
-        "https://docs.vllm.ai/en/latest/configuration/serve_args.html")
+        "https://docs.vllm.ai/en/latest/configuration/serve_args.html",
+    )
     parser = FrontendArgs.add_cli_args(parser)
     parser = AsyncEngineArgs.add_cli_args(parser)
 
@@ -275,14 +285,13 @@ def validate_parsed_serve_args(args: argparse.Namespace):
 
     # Enable auto tool needs a tool call parser to be valid
     if args.enable_auto_tool_choice and not args.tool_call_parser:
-        raise TypeError("Error: --enable-auto-tool-choice requires "
-                        "--tool-call-parser")
+        raise TypeError("Error: --enable-auto-tool-choice requires --tool-call-parser")
     if args.enable_log_outputs and not args.enable_log_requests:
-        raise TypeError("Error: --enable-log-outputs requires "
-                        "--enable-log-requests")
+        raise TypeError("Error: --enable-log-outputs requires --enable-log-requests")
 
 
 def create_parser_for_docs() -> FlexibleArgumentParser:
     parser_for_docs = FlexibleArgumentParser(
-        prog="-m vllm.entrypoints.openai.api_server")
+        prog="-m vllm.entrypoints.openai.api_server"
+    )
     return make_arg_parser(parser_for_docs)
diff --git a/vllm/entrypoints/openai/logits_processors.py b/vllm/entrypoints/openai/logits_processors.py
index 29d72256cf70..2ea9fbf386ba 100644
--- a/vllm/entrypoints/openai/logits_processors.py
+++ b/vllm/entrypoints/openai/logits_processors.py
@@ -19,12 +19,11 @@ def __init__(self, allowed_ids: Iterable[int]):
         self.allowed_ids: Optional[list[int]] = list(allowed_ids)
         self.mask: Optional[torch.Tensor] = None
 
-    def __call__(self, token_ids: list[int],
-                 logits: torch.Tensor) -> torch.Tensor:
+    def __call__(self, token_ids: list[int], logits: torch.Tensor) -> torch.Tensor:
         if self.mask is None:
-            self.mask = torch.ones((logits.shape[-1], ),
-                                   dtype=torch.bool,
-                                   device=logits.device)
+            self.mask = torch.ones(
+                (logits.shape[-1],), dtype=torch.bool, device=logits.device
+            )
             self.mask[self.allowed_ids] = False
             self.allowed_ids = None
         logits.masked_fill_(self.mask, float("-inf"))
@@ -39,8 +38,7 @@ def _get_allowed_token_ids_logits_processor(
     if not allowed_token_ids:
         raise ValueError("Empty allowed_token_ids provided")
     if not all(0 <= tid < vocab_size for tid in allowed_token_ids):
-        raise ValueError("allowed_token_ids contains "
-                         "out-of-vocab token id")
+        raise ValueError("allowed_token_ids contains out-of-vocab token id")
     return AllowedTokenIdsLogitsProcessor(allowed_token_ids)
 
 
@@ -71,20 +69,25 @@ def get_logits_processors(
         except ValueError as exc:
             raise ValueError(
                 "Found token_id in logit_bias that is not "
-                "an integer or string representing an integer") from exc
+                "an integer or string representing an integer"
+            ) from exc
 
         # Check if token_id is within the vocab size
         for token_id, bias in clamped_logit_bias.items():
             if token_id < 0 or token_id >= len(tokenizer):
-                raise ValueError(f"token_id {token_id} in logit_bias contains "
-                                 "out-of-vocab token id")
+                raise ValueError(
+                    f"token_id {token_id} in logit_bias contains out-of-vocab token id"
+                )
 
         logits_processors.append(
-            partial(logit_bias_logits_processor, clamped_logit_bias))
+            partial(logit_bias_logits_processor, clamped_logit_bias)
+        )
 
     if allowed_token_ids is not None:
         logits_processors.append(
             _get_allowed_token_ids_logits_processor(
-                frozenset(allowed_token_ids), len(tokenizer)))
+                frozenset(allowed_token_ids), len(tokenizer)
+            )
+        )
 
     return logits_processors
diff --git a/vllm/entrypoints/openai/protocol.py b/vllm/entrypoints/openai/protocol.py
index 9d51372887c2..a4c3f5378227 100644
--- a/vllm/entrypoints/openai/protocol.py
+++ b/vllm/entrypoints/openai/protocol.py
@@ -6,70 +6,84 @@
 import json
 import time
 from http import HTTPStatus
-from typing import (Annotated, Any, ClassVar, Generic, Literal, Optional,
-                    TypeVar, Union)
+from typing import Annotated, Any, ClassVar, Generic, Literal, Optional, TypeVar, Union
 
 import regex as re
 import torch
 from fastapi import HTTPException, UploadFile
+
 # yapf: disable
 from openai.types.chat.chat_completion_audio import (
-    ChatCompletionAudio as OpenAIChatCompletionAudio)
-from openai.types.chat.chat_completion_message import (
-    Annotation as OpenAIAnnotation)
+    ChatCompletionAudio as OpenAIChatCompletionAudio,
+)
+from openai.types.chat.chat_completion_message import Annotation as OpenAIAnnotation
 from openai.types.responses import (
     ResponseCodeInterpreterCallCodeDeltaEvent,
     ResponseCodeInterpreterCallCodeDoneEvent,
     ResponseCodeInterpreterCallCompletedEvent,
     ResponseCodeInterpreterCallInProgressEvent,
-    ResponseCodeInterpreterCallInterpretingEvent)
-from openai.types.responses import (
-    ResponseCompletedEvent as OpenAIResponseCompletedEvent)
-from openai.types.responses import (ResponseContentPartAddedEvent,
-                                    ResponseContentPartDoneEvent)
+    ResponseCodeInterpreterCallInterpretingEvent,
+    ResponseContentPartAddedEvent,
+    ResponseContentPartDoneEvent,
+    ResponseFunctionToolCall,
+    ResponseInputItemParam,
+    ResponseOutputItem,
+    ResponseOutputItemAddedEvent,
+    ResponseOutputItemDoneEvent,
+    ResponsePrompt,
+    ResponseReasoningItem,
+    ResponseReasoningTextDeltaEvent,
+    ResponseReasoningTextDoneEvent,
+    ResponseStatus,
+    ResponseWebSearchCallCompletedEvent,
+    ResponseWebSearchCallInProgressEvent,
+    ResponseWebSearchCallSearchingEvent,
+)
 from openai.types.responses import (
-    ResponseCreatedEvent as OpenAIResponseCreatedEvent)
-from openai.types.responses import ResponseFunctionToolCall
+    ResponseCompletedEvent as OpenAIResponseCompletedEvent,
+)
+from openai.types.responses import ResponseCreatedEvent as OpenAIResponseCreatedEvent
 from openai.types.responses import (
-    ResponseInProgressEvent as OpenAIResponseInProgressEvent)
-from openai.types.responses import (ResponseInputItemParam, ResponseOutputItem,
-                                    ResponseOutputItemAddedEvent,
-                                    ResponseOutputItemDoneEvent,
-                                    ResponsePrompt, ResponseReasoningItem,
-                                    ResponseReasoningTextDeltaEvent,
-                                    ResponseReasoningTextDoneEvent,
-                                    ResponseStatus,
-                                    ResponseWebSearchCallCompletedEvent,
-                                    ResponseWebSearchCallInProgressEvent,
-                                    ResponseWebSearchCallSearchingEvent)
+    ResponseInProgressEvent as OpenAIResponseInProgressEvent,
+)
+
 # yapf: enable
 from openai.types.responses.response_reasoning_item import (
-    Content as ResponseReasoningTextContent)
+    Content as ResponseReasoningTextContent,
+)
 
 # Backward compatibility for OpenAI client versions
 try:  # For older openai versions (< 1.100.0)
     from openai.types.responses import ResponseTextConfig
 except ImportError:  # For newer openai versions (>= 1.100.0)
-    from openai.types.responses import (ResponseFormatTextConfig as
-                                        ResponseTextConfig)
+    from openai.types.responses import ResponseFormatTextConfig as ResponseTextConfig
 
 from openai.types.responses.response import IncompleteDetails, ToolChoice
 from openai.types.responses.tool import Tool
 from openai.types.shared import Metadata, Reasoning
-from pydantic import (BaseModel, ConfigDict, Field, TypeAdapter,
-                      ValidationInfo, field_validator, model_validator)
+from pydantic import (
+    BaseModel,
+    ConfigDict,
+    Field,
+    TypeAdapter,
+    ValidationInfo,
+    field_validator,
+    model_validator,
+)
 from typing_extensions import TypeAlias
 
 from vllm import envs
-from vllm.entrypoints.chat_utils import (ChatCompletionMessageParam,
-                                         make_tool_call_id)
-from vllm.entrypoints.score_utils import (ScoreContentPartParam,
-                                          ScoreMultiModalParam)
+from vllm.entrypoints.chat_utils import ChatCompletionMessageParam, make_tool_call_id
+from vllm.entrypoints.score_utils import ScoreContentPartParam, ScoreMultiModalParam
 from vllm.logger import init_logger
 from vllm.logprobs import Logprob
 from vllm.pooling_params import PoolingParams
-from vllm.sampling_params import (BeamSearchParams, RequestOutputKind,
-                                  SamplingParams, StructuredOutputsParams)
+from vllm.sampling_params import (
+    BeamSearchParams,
+    RequestOutputKind,
+    SamplingParams,
+    StructuredOutputsParams,
+)
 from vllm.utils import random_uuid, resolve_obj_by_qualname
 
 logger = init_logger(__name__)
@@ -103,8 +117,7 @@ def __log_extra_fields__(cls, data, handler):
         # Compare against both field names and aliases
         if any(k not in field_names for k in data):
             logger.warning(
-                "The following fields were present in the request "
-                "but ignored: %s",
+                "The following fields were present in the request but ignored: %s",
                 data.keys() - field_names,
             )
         return result
@@ -173,7 +186,7 @@ class JsonSchemaResponseFormat(OpenAIBaseModel):
     description: Optional[str] = None
     # schema is the field in openai but that causes conflicts with pydantic so
     # instead use json_schema with an alias
-    json_schema: Optional[dict[str, Any]] = Field(default=None, alias='schema')
+    json_schema: Optional[dict[str, Any]] = Field(default=None, alias="schema")
     strict: Optional[bool] = None
 
 
@@ -181,8 +194,9 @@ class StructuralTag(OpenAIBaseModel):
     begin: str
     # schema is the field, but that causes conflicts with pydantic so
     # instead use structural_tag_schema with an alias
-    structural_tag_schema: Optional[dict[str, Any]] = Field(default=None,
-                                                            alias="schema")
+    structural_tag_schema: Optional[dict[str, Any]] = Field(
+        default=None, alias="schema"
+    )
     end: str
 
 
@@ -239,18 +253,19 @@ class LogitsProcessorConstructor(BaseModel):
 LogitsProcessors = list[Union[str, LogitsProcessorConstructor]]
 
 
-def get_logits_processors(processors: Optional[LogitsProcessors],
-                          pattern: Optional[str]) -> Optional[list[Any]]:
+def get_logits_processors(
+    processors: Optional[LogitsProcessors], pattern: Optional[str]
+) -> Optional[list[Any]]:
     if processors and pattern:
         logits_processors = []
         for processor in processors:
-            qualname = processor if isinstance(processor,
-                                               str) else processor.qualname
+            qualname = processor if isinstance(processor, str) else processor.qualname
             if not re.match(pattern, qualname):
                 raise ValueError(
                     f"Logits processor '{qualname}' is not allowed by this "
                     "server. See --logits-processor-pattern engine argument "
-                    "for more information.")
+                    "for more information."
+                )
             try:
                 logits_processor = resolve_obj_by_qualname(qualname)
             except Exception as e:
@@ -258,37 +273,41 @@ def get_logits_processors(processors: Optional[LogitsProcessors],
                     f"Logits processor '{qualname}' could not be resolved: {e}"
                 ) from e
             if isinstance(processor, LogitsProcessorConstructor):
-                logits_processor = logits_processor(*processor.args or [],
-                                                    **processor.kwargs or {})
+                logits_processor = logits_processor(
+                    *processor.args or [], **processor.kwargs or {}
+                )
             logits_processors.append(logits_processor)
         return logits_processors
     elif processors:
         raise ValueError(
             "The `logits_processors` argument is not supported by this "
             "server. See --logits-processor-pattern engine argument "
-            "for more information.")
+            "for more information."
+        )
     return None
 
 
-ResponseInputOutputItem: TypeAlias = Union[ResponseInputItemParam,
-                                           ResponseReasoningItem,
-                                           ResponseFunctionToolCall]
+ResponseInputOutputItem: TypeAlias = Union[
+    ResponseInputItemParam, ResponseReasoningItem, ResponseFunctionToolCall
+]
 
 
 class ResponsesRequest(OpenAIBaseModel):
     # Ordered by official OpenAI API documentation
     # https://platform.openai.com/docs/api-reference/responses/create
     background: Optional[bool] = False
-    include: Optional[list[
-        Literal[
-            "code_interpreter_call.outputs",
-            "computer_call_output.output.image_url",
-            "file_search_call.results",
-            "message.input_image.image_url",
-            "message.output_text.logprobs",
-            "reasoning.encrypted_content",
-        ],
-    ]] = None
+    include: Optional[
+        list[
+            Literal[
+                "code_interpreter_call.outputs",
+                "computer_call_output.output.image_url",
+                "file_search_call.results",
+                "message.input_image.image_url",
+                "message.output_text.logprobs",
+                "reasoning.encrypted_content",
+            ],
+        ]
+    ] = None
     input: Union[str, list[ResponseInputOutputItem]]
     instructions: Optional[str] = None
     max_output_tokens: Optional[int] = None
@@ -299,8 +318,7 @@ class ResponsesRequest(OpenAIBaseModel):
     previous_response_id: Optional[str] = None
     prompt: Optional[ResponsePrompt] = None
     reasoning: Optional[Reasoning] = None
-    service_tier: Literal["auto", "default", "flex", "scale",
-                          "priority"] = "auto"
+    service_tier: Literal["auto", "default", "flex", "scale", "priority"] = "auto"
     store: Optional[bool] = True
     stream: Optional[bool] = False
     temperature: Optional[float] = None
@@ -318,7 +336,8 @@ class ResponsesRequest(OpenAIBaseModel):
         description=(
             "The request_id related to this request. If the caller does "
             "not set it, a random_uuid will be generated. This id is used "
-            "through out the inference process and return in response."),
+            "through out the inference process and return in response."
+        ),
     )
     mm_processor_kwargs: Optional[dict[str, Any]] = Field(
         default=None,
@@ -329,7 +348,8 @@ class ResponsesRequest(OpenAIBaseModel):
         description=(
             "The priority of the request (lower means earlier handling; "
             "default: 0). Any priority other than 0 will raise an error "
-            "if the served model does not use priority scheduling."),
+            "if the served model does not use priority scheduling."
+        ),
     )
     cache_salt: Optional[str] = Field(
         default=None,
@@ -339,14 +359,18 @@ class ResponsesRequest(OpenAIBaseModel):
             "environments. The salt should be random, protected from "
             "access by 3rd parties, and long enough to be "
             "unpredictable (e.g., 43 characters base64-encoded, corresponding "
-            "to 256 bit). Not supported by vLLM engine V0."))
+            "to 256 bit). Not supported by vLLM engine V0."
+        ),
+    )
 
     enable_response_messages: bool = Field(
         default=False,
         description=(
             "Dictates whether or not to return messages as part of the "
             "response object. Currently only supported for non-streaming "
-            "non-background and gpt-oss only. "))
+            "non-background and gpt-oss only. "
+        ),
+    )
     # --8<-- [end:responses-extra-params]
 
     _DEFAULT_SAMPLING_PARAMS = {
@@ -367,20 +391,25 @@ def to_sampling_params(
         default_sampling_params = default_sampling_params or {}
         if (temperature := self.temperature) is None:
             temperature = default_sampling_params.get(
-                "temperature", self._DEFAULT_SAMPLING_PARAMS["temperature"])
+                "temperature", self._DEFAULT_SAMPLING_PARAMS["temperature"]
+            )
         if (top_p := self.top_p) is None:
             top_p = default_sampling_params.get(
-                "top_p", self._DEFAULT_SAMPLING_PARAMS["top_p"])
+                "top_p", self._DEFAULT_SAMPLING_PARAMS["top_p"]
+            )
         stop_token_ids = default_sampling_params.get("stop_token_ids")
 
         # Structured output
         structured_outputs = None
         if self.text is not None and self.text.format is not None:
             response_format = self.text.format
-            if (response_format.type == "json_schema"
-                    and response_format.schema_ is not None):
+            if (
+                response_format.type == "json_schema"
+                and response_format.schema_ is not None
+            ):
                 structured_outputs = StructuredOutputsParams(
-                    json=response_format.schema_)
+                    json=response_format.schema_
+                )
             elif response_format.type == "json_object":
                 raise NotImplementedError("json_object is not supported")
 
@@ -389,11 +418,11 @@ def to_sampling_params(
             temperature=temperature,
             top_p=top_p,
             max_tokens=max_tokens,
-            logprobs=self.top_logprobs
-            if self.is_include_output_logprobs() else None,
+            logprobs=self.top_logprobs if self.is_include_output_logprobs() else None,
             stop_token_ids=stop_token_ids,
-            output_kind=(RequestOutputKind.DELTA
-                         if self.stream else RequestOutputKind.FINAL_ONLY),
+            output_kind=(
+                RequestOutputKind.DELTA if self.stream else RequestOutputKind.FINAL_ONLY
+            ),
             structured_outputs=structured_outputs,
         )
 
@@ -401,17 +430,17 @@ def is_include_output_logprobs(self) -> bool:
         """Check if the request includes output logprobs."""
         if self.include is None:
             return False
-        return isinstance(
-            self.include,
-            list) and "message.output_text.logprobs" in self.include
+        return (
+            isinstance(self.include, list)
+            and "message.output_text.logprobs" in self.include
+        )
 
     @model_validator(mode="before")
     def validate_background(cls, data):
         if not data.get("background"):
             return data
         if not data.get("store", True):
-            raise ValueError(
-                "background can only be used when `store` is true")
+            raise ValueError("background can only be used when `store` is true")
         return data
 
     @model_validator(mode="before")
@@ -426,11 +455,12 @@ def check_cache_salt_support(cls, data):
             if not envs.VLLM_USE_V1:
                 raise ValueError(
                     "Parameter 'cache_salt' is not supported with "
-                    "this instance of vLLM, which uses engine V0.")
-            if not isinstance(data["cache_salt"],
-                              str) or not data["cache_salt"]:
-                raise ValueError("Parameter 'cache_salt' must be a "
-                                 "non-empty string if provided.")
+                    "this instance of vLLM, which uses engine V0."
+                )
+            if not isinstance(data["cache_salt"], str) or not data["cache_salt"]:
+                raise ValueError(
+                    "Parameter 'cache_salt' must be a non-empty string if provided."
+                )
         return data
 
 
@@ -445,8 +475,8 @@ class ChatCompletionRequest(OpenAIBaseModel):
     top_logprobs: Optional[int] = 0
     max_tokens: Optional[int] = Field(
         default=None,
-        deprecated=
-        'max_tokens is deprecated in favor of the max_completion_tokens field')
+        deprecated="max_tokens is deprecated in favor of the max_completion_tokens field",
+    )
     max_completion_tokens: Optional[int] = None
     n: Optional[int] = 1
     presence_penalty: Optional[float] = 0.0
@@ -458,12 +488,14 @@ class ChatCompletionRequest(OpenAIBaseModel):
     temperature: Optional[float] = None
     top_p: Optional[float] = None
     tools: Optional[list[ChatCompletionToolsParam]] = None
-    tool_choice: Optional[Union[
-        Literal["none"],
-        Literal["auto"],
-        Literal["required"],
-        ChatCompletionNamedToolChoiceParam,
-    ]] = "none"
+    tool_choice: Optional[
+        Union[
+            Literal["none"],
+            Literal["auto"],
+            Literal["required"],
+            ChatCompletionNamedToolChoiceParam,
+        ]
+    ] = "none"
     reasoning_effort: Optional[Literal["low", "medium", "high"]] = None
     include_reasoning: bool = True
 
@@ -495,23 +527,26 @@ class ChatCompletionRequest(OpenAIBaseModel):
         default=False,
         description=(
             "If true, the new message will be prepended with the last message "
-            "if they belong to the same role."),
+            "if they belong to the same role."
+        ),
     )
     add_generation_prompt: bool = Field(
         default=True,
-        description=
-        ("If true, the generation prompt will be added to the chat template. "
-         "This is a parameter used by chat template in tokenizer config of the "
-         "model."),
+        description=(
+            "If true, the generation prompt will be added to the chat template. "
+            "This is a parameter used by chat template in tokenizer config of the "
+            "model."
+        ),
     )
     continue_final_message: bool = Field(
         default=False,
-        description=
-        ("If this is set, the chat will be formatted so that the final "
-         "message in the chat is open-ended, without any EOS tokens. The "
-         "model will continue this message rather than starting a new one. "
-         "This allows you to \"prefill\" part of the model's response for it. "
-         "Cannot be used at the same time as `add_generation_prompt`."),
+        description=(
+            "If this is set, the chat will be formatted so that the final "
+            "message in the chat is open-ended, without any EOS tokens. The "
+            "model will continue this message rather than starting a new one. "
+            'This allows you to "prefill" part of the model\'s response for it. '
+            "Cannot be used at the same time as `add_generation_prompt`."
+        ),
     )
     add_special_tokens: bool = Field(
         default=False,
@@ -520,16 +555,18 @@ class ChatCompletionRequest(OpenAIBaseModel):
             "on top of what is added by the chat template. "
             "For most models, the chat template takes care of adding the "
             "special tokens so this should be set to false (as is the "
-            "default)."),
+            "default)."
+        ),
     )
     documents: Optional[list[dict[str, str]]] = Field(
         default=None,
-        description=
-        ("A list of dicts representing documents that will be accessible to "
-         "the model if it is performing RAG (retrieval-augmented generation)."
-         " If the template does not support RAG, this argument will have no "
-         "effect. We recommend that each document should be a dict containing "
-         "\"title\" and \"text\" keys."),
+        description=(
+            "A list of dicts representing documents that will be accessible to "
+            "the model if it is performing RAG (retrieval-augmented generation)."
+            " If the template does not support RAG, this argument will have no "
+            "effect. We recommend that each document should be a dict containing "
+            '"title" and "text" keys.'
+        ),
     )
     chat_template: Optional[str] = Field(
         default=None,
@@ -537,13 +574,15 @@ class ChatCompletionRequest(OpenAIBaseModel):
             "A Jinja template to use for this conversion. "
             "As of transformers v4.44, default chat template is no longer "
             "allowed, so you must provide a chat template if the tokenizer "
-            "does not define one."),
+            "does not define one."
+        ),
     )
     chat_template_kwargs: Optional[dict[str, Any]] = Field(
         default=None,
         description=(
             "Additional keyword args to pass to the template renderer. "
-            "Will be accessible by the chat template."),
+            "Will be accessible by the chat template."
+        ),
     )
     mm_processor_kwargs: Optional[dict[str, Any]] = Field(
         default=None,
@@ -558,42 +597,48 @@ class ChatCompletionRequest(OpenAIBaseModel):
         description=(
             "`guided_json` is deprecated. "
             "This will be removed in v0.12.0 or v1.0.0, whichever is soonest. "
-            "Please pass `json` to `structured_outputs` instead."),
+            "Please pass `json` to `structured_outputs` instead."
+        ),
     )
     guided_regex: Optional[str] = Field(
         default=None,
         description=(
             "`guided_regex` is deprecated. "
             "This will be removed in v0.12.0 or v1.0.0, whichever is soonest. "
-            "Please pass `regex` to `structured_outputs` instead."),
+            "Please pass `regex` to `structured_outputs` instead."
+        ),
     )
     guided_choice: Optional[list[str]] = Field(
         default=None,
         description=(
             "`guided_choice` is deprecated. "
             "This will be removed in v0.12.0 or v1.0.0, whichever is soonest. "
-            "Please pass `choice` to `structured_outputs` instead."),
+            "Please pass `choice` to `structured_outputs` instead."
+        ),
     )
     guided_grammar: Optional[str] = Field(
         default=None,
         description=(
             "`guided_grammar` is deprecated. "
             "This will be removed in v0.12.0 or v1.0.0, whichever is soonest. "
-            "Please pass `grammar` to `structured_outputs` instead."),
+            "Please pass `grammar` to `structured_outputs` instead."
+        ),
     )
     structural_tag: Optional[str] = Field(
         default=None,
         description=(
             "`structural_tag` is deprecated. "
             "This will be removed in v0.12.0 or v1.0.0, whichever is soonest. "
-            "Please pass `structural_tag` to `structured_outputs` instead."),
+            "Please pass `structural_tag` to `structured_outputs` instead."
+        ),
     )
     guided_decoding_backend: Optional[str] = Field(
         default=None,
         description=(
             "`guided_decoding_backend` is deprecated. "
             "This will be removed in v0.12.0 or v1.0.0, whichever is soonest. "
-            "Please remove it from your request."),
+            "Please remove it from your request."
+        ),
     )
     guided_whitespace_pattern: Optional[str] = Field(
         default=None,
@@ -608,14 +653,16 @@ class ChatCompletionRequest(OpenAIBaseModel):
         description=(
             "The priority of the request (lower means earlier handling; "
             "default: 0). Any priority other than 0 will raise an error "
-            "if the served model does not use priority scheduling."),
+            "if the served model does not use priority scheduling."
+        ),
     )
     request_id: str = Field(
         default_factory=lambda: f"{random_uuid()}",
         description=(
             "The request_id related to this request. If the caller does "
             "not set it, a random_uuid will be generated. This id is used "
-            "through out the inference process and return in response."),
+            "through out the inference process and return in response."
+        ),
     )
     logits_processors: Optional[LogitsProcessors] = Field(
         default=None,
@@ -627,13 +674,17 @@ class ChatCompletionRequest(OpenAIBaseModel):
             "'args' and 'kwargs' fields containing positional and keyword "
             "arguments. For example: {'qualname': "
             "'my_module.MyLogitsProcessor', 'args': [1, 2], 'kwargs': "
-            "{'param': 'value'}}."))
+            "{'param': 'value'}}."
+        ),
+    )
     return_tokens_as_token_ids: Optional[bool] = Field(
         default=None,
         description=(
             "If specified with 'logprobs', tokens are represented "
             " as strings of the form 'token_id:{token_id}' so that tokens "
-            "that are not JSON-encodable can be identified."))
+            "that are not JSON-encodable can be identified."
+        ),
+    )
     return_token_ids: Optional[bool] = Field(
         default=None,
         description=(
@@ -641,7 +692,9 @@ class ChatCompletionRequest(OpenAIBaseModel):
             "generated text. In streaming mode, prompt_token_ids is included "
             "only in the first chunk, and token_ids contains the delta tokens "
             "for each chunk. This is useful for debugging or when you "
-            "need to map generated text back to input tokens."))
+            "need to map generated text back to input tokens."
+        ),
+    )
     cache_salt: Optional[str] = Field(
         default=None,
         description=(
@@ -650,15 +703,20 @@ class ChatCompletionRequest(OpenAIBaseModel):
             "environments. The salt should be random, protected from "
             "access by 3rd parties, and long enough to be "
             "unpredictable (e.g., 43 characters base64-encoded, corresponding "
-            "to 256 bit). Not supported by vLLM engine V0."))
+            "to 256 bit). Not supported by vLLM engine V0."
+        ),
+    )
     kv_transfer_params: Optional[dict[str, Any]] = Field(
         default=None,
-        description="KVTransfer parameters used for disaggregated serving.")
+        description="KVTransfer parameters used for disaggregated serving.",
+    )
 
     vllm_xargs: Optional[dict[str, Union[str, int, float]]] = Field(
         default=None,
-        description=("Additional request parameters with string or "
-                     "numeric values, used by custom extensions."),
+        description=(
+            "Additional request parameters with string or "
+            "numeric values, used by custom extensions."
+        ),
     )
 
     # --8<-- [end:chat-completion-extra-params]
@@ -673,13 +731,13 @@ class ChatCompletionRequest(OpenAIBaseModel):
     }
 
     def to_beam_search_params(
-            self, max_tokens: int,
-            default_sampling_params: dict) -> BeamSearchParams:
-
+        self, max_tokens: int, default_sampling_params: dict
+    ) -> BeamSearchParams:
         n = self.n if self.n is not None else 1
         if (temperature := self.temperature) is None:
             temperature = default_sampling_params.get(
-                "temperature", self._DEFAULT_SAMPLING_PARAMS["temperature"])
+                "temperature", self._DEFAULT_SAMPLING_PARAMS["temperature"]
+            )
 
         return BeamSearchParams(
             beam_width=n,
@@ -696,7 +754,6 @@ def to_sampling_params(
         logits_processor_pattern: Optional[str],
         default_sampling_params: dict,
     ) -> SamplingParams:
-
         # Default parameters
         if (repetition_penalty := self.repetition_penalty) is None:
             repetition_penalty = default_sampling_params.get(
@@ -705,16 +762,20 @@ def to_sampling_params(
             )
         if (temperature := self.temperature) is None:
             temperature = default_sampling_params.get(
-                "temperature", self._DEFAULT_SAMPLING_PARAMS["temperature"])
+                "temperature", self._DEFAULT_SAMPLING_PARAMS["temperature"]
+            )
         if (top_p := self.top_p) is None:
             top_p = default_sampling_params.get(
-                "top_p", self._DEFAULT_SAMPLING_PARAMS["top_p"])
+                "top_p", self._DEFAULT_SAMPLING_PARAMS["top_p"]
+            )
         if (top_k := self.top_k) is None:
             top_k = default_sampling_params.get(
-                "top_k", self._DEFAULT_SAMPLING_PARAMS["top_k"])
+                "top_k", self._DEFAULT_SAMPLING_PARAMS["top_k"]
+            )
         if (min_p := self.min_p) is None:
             min_p = default_sampling_params.get(
-                "min_p", self._DEFAULT_SAMPLING_PARAMS["min_p"])
+                "min_p", self._DEFAULT_SAMPLING_PARAMS["min_p"]
+            )
 
         prompt_logprobs = self.prompt_logprobs
         if prompt_logprobs is None and self.echo:
@@ -753,10 +814,10 @@ def to_sampling_params(
                 elif response_format.type == "structural_tag":
                     structural_tag = response_format
                     assert structural_tag is not None and isinstance(
-                        structural_tag, StructuralTagResponseFormat)
+                        structural_tag, StructuralTagResponseFormat
+                    )
                     s_tag_obj = structural_tag.model_dump(by_alias=True)
-                    self.structured_outputs.structural_tag = json.dumps(
-                        s_tag_obj)
+                    self.structured_outputs.structural_tag = json.dumps(s_tag_obj)
 
             # Set structured output params for tool calling
             if json_schema_from_tool is not None:
@@ -786,12 +847,14 @@ def to_sampling_params(
             min_tokens=self.min_tokens,
             skip_special_tokens=self.skip_special_tokens,
             spaces_between_special_tokens=self.spaces_between_special_tokens,
-            logits_processors=get_logits_processors(self.logits_processors,
-                                                    logits_processor_pattern),
+            logits_processors=get_logits_processors(
+                self.logits_processors, logits_processor_pattern
+            ),
             include_stop_str_in_output=self.include_stop_str_in_output,
             truncate_prompt_tokens=self.truncate_prompt_tokens,
-            output_kind=RequestOutputKind.DELTA if self.stream \
-                else RequestOutputKind.FINAL_ONLY,
+            output_kind=RequestOutputKind.DELTA
+            if self.stream
+            else RequestOutputKind.FINAL_ONLY,
             structured_outputs=self.structured_outputs,
             logit_bias=self.logit_bias,
             bad_words=self.bad_words,
@@ -809,8 +872,7 @@ def _get_json_schema_from_tool(self) -> Optional[Union[str, dict]]:
             tool_name = self.tool_choice.function.name
             tools = {tool.function.name: tool.function for tool in self.tools}
             if tool_name not in tools:
-                raise ValueError(
-                    f"Tool '{tool_name}' has not been passed in `tools`.")
+                raise ValueError(f"Tool '{tool_name}' has not been passed in `tools`.")
             tool = tools[tool_name]
             return tool.parameters
 
@@ -822,37 +884,31 @@ def _get_json_schema_from_tool(self) -> Optional[Union[str, dict]]:
             def get_tool_schema(tool: ChatCompletionToolsParam) -> dict:
                 return {
                     "properties": {
-                        "name": {
-                            "type": "string",
-                            "enum": [tool.function.name]
-                        },
+                        "name": {"type": "string", "enum": [tool.function.name]},
                         # parameters are always generated as '{}' in the final
                         # output if they are missing from the request
                         # (i.e. are None or '{}') so the schema is
                         # updated to produce an empty object in that case
                         "parameters": tool.function.parameters
-                        if tool.function.parameters else {
-                            "type": "object",
-                            "properties": {}
-                        }
+                        if tool.function.parameters
+                        else {"type": "object", "properties": {}},
                     },
-                    "required": ["name", "parameters"]
+                    "required": ["name", "parameters"],
                 }
 
-            def get_tool_schema_defs(
-                    tools: list[ChatCompletionToolsParam]) -> dict:
+            def get_tool_schema_defs(tools: list[ChatCompletionToolsParam]) -> dict:
                 all_defs = dict[str, dict[str, Any]]()
                 for tool in tools:
                     if tool.function.parameters is None:
                         continue
                     defs = tool.function.parameters.pop("$defs", {})
                     for def_name, def_schema in defs.items():
-                        if def_name in all_defs and all_defs[
-                                def_name] != def_schema:
+                        if def_name in all_defs and all_defs[def_name] != def_schema:
                             raise ValueError(
                                 f"Tool definition '{def_name}' has "
                                 "multiple schemas, which is not "
-                                "supported.")
+                                "supported."
+                            )
                         else:
                             all_defs[def_name] = def_schema
                 return all_defs
@@ -862,8 +918,8 @@ def get_tool_schema_defs(
                 "minItems": 1,
                 "items": {
                     "type": "object",
-                    "anyOf": [get_tool_schema(tool) for tool in self.tools]
-                }
+                    "anyOf": [get_tool_schema(tool) for tool in self.tools],
+                },
             }
             json_schema_defs = get_tool_schema_defs(self.tools)
             if json_schema_defs:
@@ -876,8 +932,7 @@ def get_tool_schema_defs(
     @classmethod
     def validate_stream_options(cls, data):
         if data.get("stream_options") and not data.get("stream"):
-            raise ValueError(
-                "Stream options can only be defined when `stream=True`.")
+            raise ValueError("Stream options can only be defined when `stream=True`.")
 
         return data
 
@@ -885,24 +940,22 @@ def validate_stream_options(cls, data):
     @classmethod
     def check_logprobs(cls, data):
         if (prompt_logprobs := data.get("prompt_logprobs")) is not None:
-            if data.get("stream") and (prompt_logprobs > 0
-                                       or prompt_logprobs == -1):
+            if data.get("stream") and (prompt_logprobs > 0 or prompt_logprobs == -1):
                 raise ValueError(
-                    "`prompt_logprobs` are not available when `stream=True`.")
+                    "`prompt_logprobs` are not available when `stream=True`."
+                )
 
             if prompt_logprobs < 0 and prompt_logprobs != -1:
-                raise ValueError(
-                    "`prompt_logprobs` must be a positive value or -1.")
+                raise ValueError("`prompt_logprobs` must be a positive value or -1.")
             if prompt_logprobs == -1 and not envs.VLLM_USE_V1:
-                raise ValueError("`prompt_logprobs=-1` is only supported with "
-                                 "vLLM engine V1.")
+                raise ValueError(
+                    "`prompt_logprobs=-1` is only supported with vLLM engine V1."
+                )
         if (top_logprobs := data.get("top_logprobs")) is not None:
             if top_logprobs < 0 and top_logprobs != -1:
-                raise ValueError(
-                    "`top_logprobs` must be a positive value or -1.")
+                raise ValueError("`top_logprobs` must be a positive value or -1.")
 
-            if (top_logprobs == -1
-                    or top_logprobs > 0) and not data.get("logprobs"):
+            if (top_logprobs == -1 or top_logprobs > 0) and not data.get("logprobs"):
                 raise ValueError(
                     "when using `top_logprobs`, `logprobs` must be set to true."
                 )
@@ -918,30 +971,32 @@ def check_structured_outputs_count(cls, data):
         if data.get("structured_outputs", None) is None:
             return data
 
-        structured_outputs_kwargs = data['structured_outputs']
+        structured_outputs_kwargs = data["structured_outputs"]
         count = sum(
             structured_outputs_kwargs.get(k) is not None
-            for k in ("json", "regex", "choice"))
+            for k in ("json", "regex", "choice")
+        )
         # you can only use one kind of constraints for structured outputs
         if count > 1:
             raise ValueError(
                 "You can only use one kind of constraints for structured "
-                "outputs ('json', 'regex' or 'choice').")
+                "outputs ('json', 'regex' or 'choice')."
+            )
         # you can only either use structured outputs or tools, not both
         if count > 1 and data.get("tool_choice", "none") not in (
-                "none",
-                "auto",
-                "required",
+            "none",
+            "auto",
+            "required",
         ):
             raise ValueError(
                 "You can only either use constraints for structured outputs "
-                "or tools, not both.")
+                "or tools, not both."
+            )
         return data
 
     @model_validator(mode="before")
     @classmethod
     def check_tool_usage(cls, data):
-
         # if "tool_choice" is not specified but tools are provided,
         # default to "auto" tool_choice
         if "tool_choice" not in data and data.get("tools"):
@@ -953,52 +1008,58 @@ def check_tool_usage(cls, data):
 
         # if "tool_choice" is specified -- validation
         if "tool_choice" in data and data["tool_choice"] is not None:
-
             # ensure that if "tool choice" is specified, tools are present
             if "tools" not in data or data["tools"] is None:
-                raise ValueError(
-                    "When using `tool_choice`, `tools` must be set.")
+                raise ValueError("When using `tool_choice`, `tools` must be set.")
 
             # make sure that tool choice is either a named tool
             # OR that it's set to "auto" or "required"
-            if data["tool_choice"] not in [
-                    "auto", "required"
-            ] and not isinstance(data["tool_choice"], dict):
+            if data["tool_choice"] not in ["auto", "required"] and not isinstance(
+                data["tool_choice"], dict
+            ):
                 raise ValueError(
-                    f'Invalid value for `tool_choice`: {data["tool_choice"]}! '\
-                    'Only named tools, "none", "auto" or "required" '\
-                    'are supported.'
+                    f"Invalid value for `tool_choice`: {data['tool_choice']}! "
+                    'Only named tools, "none", "auto" or "required" '
+                    "are supported."
                 )
 
             # if tool_choice is "required" but the "tools" list is empty,
             # override the data to behave like "none" to align with
             # OpenAI’s behavior.
-            if data["tool_choice"] == "required" and isinstance(
-                    data["tools"], list) and len(data["tools"]) == 0:
+            if (
+                data["tool_choice"] == "required"
+                and isinstance(data["tools"], list)
+                and len(data["tools"]) == 0
+            ):
                 data["tool_choice"] = "none"
                 del data["tools"]
                 return data
 
             # ensure that if "tool_choice" is specified as an object,
             # it matches a valid tool
-            correct_usage_message = 'Correct usage: `{"type": "function",' \
+            correct_usage_message = (
+                'Correct usage: `{"type": "function",'
                 ' "function": {"name": "my_function"}}`'
+            )
             if isinstance(data["tool_choice"], dict):
                 valid_tool = False
                 function = data["tool_choice"].get("function")
                 if not isinstance(function, dict):
                     raise ValueError(
                         f"Invalid value for `function`: `{function}` in "
-                        f"`tool_choice`! {correct_usage_message}")
+                        f"`tool_choice`! {correct_usage_message}"
+                    )
                 if "name" not in function:
-                    raise ValueError(f"Expected field `name` in `function` in "
-                                     f"`tool_choice`! {correct_usage_message}")
+                    raise ValueError(
+                        f"Expected field `name` in `function` in "
+                        f"`tool_choice`! {correct_usage_message}"
+                    )
                 function_name = function["name"]
-                if not isinstance(function_name,
-                                  str) or len(function_name) == 0:
+                if not isinstance(function_name, str) or len(function_name) == 0:
                     raise ValueError(
                         f"Invalid `name` in `function`: `{function_name}`"
-                        f" in `tool_choice`! {correct_usage_message}")
+                        f" in `tool_choice`! {correct_usage_message}"
+                    )
                 for tool in data["tools"]:
                     if tool["function"]["name"] == function_name:
                         valid_tool = True
@@ -1006,16 +1067,18 @@ def check_tool_usage(cls, data):
                 if not valid_tool:
                     raise ValueError(
                         "The tool specified in `tool_choice` does not match any"
-                        " of the specified `tools`")
+                        " of the specified `tools`"
+                    )
         return data
 
     @model_validator(mode="before")
     @classmethod
     def check_generation_prompt(cls, data):
-        if data.get("continue_final_message") and data.get(
-                "add_generation_prompt"):
-            raise ValueError("Cannot set both `continue_final_message` and "
-                             "`add_generation_prompt` to True.")
+        if data.get("continue_final_message") and data.get("add_generation_prompt"):
+            raise ValueError(
+                "Cannot set both `continue_final_message` and "
+                "`add_generation_prompt` to True."
+            )
         return data
 
     @model_validator(mode="before")
@@ -1025,11 +1088,12 @@ def check_cache_salt_support(cls, data):
             if not envs.VLLM_USE_V1:
                 raise ValueError(
                     "Parameter 'cache_salt' is not supported with "
-                    "this instance of vLLM, which uses engine V0.")
-            if not isinstance(data["cache_salt"],
-                              str) or not data["cache_salt"]:
-                raise ValueError("Parameter 'cache_salt' must be a "
-                                 "non-empty string if provided.")
+                    "this instance of vLLM, which uses engine V0."
+                )
+            if not isinstance(data["cache_salt"], str) or not data["cache_salt"]:
+                raise ValueError(
+                    "Parameter 'cache_salt' must be a non-empty string if provided."
+                )
         return data
 
 
@@ -1078,7 +1142,8 @@ class CompletionRequest(OpenAIBaseModel):
         default=True,
         description=(
             "If true (the default), special tokens (e.g. BOS) will be added to "
-            "the prompt."),
+            "the prompt."
+        ),
     )
     response_format: Optional[AnyResponseFormat] = Field(
         default=None,
@@ -1097,35 +1162,40 @@ class CompletionRequest(OpenAIBaseModel):
         description=(
             "`guided_json` is deprecated. "
             "This will be removed in v0.12.0 or v1.0.0, whichever is soonest. "
-            "Please pass `json` to `structured_outputs` instead."),
+            "Please pass `json` to `structured_outputs` instead."
+        ),
     )
     guided_regex: Optional[str] = Field(
         default=None,
         description=(
             "`guided_regex` is deprecated. "
             "This will be removed in v0.12.0 or v1.0.0, whichever is soonest. "
-            "Please pass `regex` to `structured_outputs` instead."),
+            "Please pass `regex` to `structured_outputs` instead."
+        ),
     )
     guided_choice: Optional[list[str]] = Field(
         default=None,
         description=(
             "`guided_choice` is deprecated. "
             "This will be removed in v0.12.0 or v1.0.0, whichever is soonest. "
-            "Please pass `choice` to `structured_outputs` instead."),
+            "Please pass `choice` to `structured_outputs` instead."
+        ),
     )
     guided_grammar: Optional[str] = Field(
         default=None,
         description=(
             "`guided_grammar` is deprecated. "
             "This will be removed in v0.12.0 or v1.0.0, whichever is soonest. "
-            "Please pass `grammar` to `structured_outputs` instead."),
+            "Please pass `grammar` to `structured_outputs` instead."
+        ),
     )
     guided_decoding_backend: Optional[str] = Field(
         default=None,
         description=(
             "`guided_decoding_backend` is deprecated. "
             "This will be removed in v0.12.0 or v1.0.0, whichever is soonest. "
-            "Please remove it from your request."),
+            "Please remove it from your request."
+        ),
     )
     guided_whitespace_pattern: Optional[str] = Field(
         default=None,
@@ -1140,14 +1210,16 @@ class CompletionRequest(OpenAIBaseModel):
         description=(
             "The priority of the request (lower means earlier handling; "
             "default: 0). Any priority other than 0 will raise an error "
-            "if the served model does not use priority scheduling."),
+            "if the served model does not use priority scheduling."
+        ),
     )
     request_id: str = Field(
         default_factory=lambda: f"{random_uuid()}",
         description=(
             "The request_id related to this request. If the caller does "
             "not set it, a random_uuid will be generated. This id is used "
-            "through out the inference process and return in response."),
+            "through out the inference process and return in response."
+        ),
     )
     logits_processors: Optional[LogitsProcessors] = Field(
         default=None,
@@ -1159,14 +1231,18 @@ class CompletionRequest(OpenAIBaseModel):
             "'args' and 'kwargs' fields containing positional and keyword "
             "arguments. For example: {'qualname': "
             "'my_module.MyLogitsProcessor', 'args': [1, 2], 'kwargs': "
-            "{'param': 'value'}}."))
+            "{'param': 'value'}}."
+        ),
+    )
 
     return_tokens_as_token_ids: Optional[bool] = Field(
         default=None,
         description=(
             "If specified with 'logprobs', tokens are represented "
             " as strings of the form 'token_id:{token_id}' so that tokens "
-            "that are not JSON-encodable can be identified."))
+            "that are not JSON-encodable can be identified."
+        ),
+    )
     return_token_ids: Optional[bool] = Field(
         default=None,
         description=(
@@ -1174,7 +1250,9 @@ class CompletionRequest(OpenAIBaseModel):
             "generated text. In streaming mode, prompt_token_ids is included "
             "only in the first chunk, and token_ids contains the delta tokens "
             "for each chunk. This is useful for debugging or when you "
-            "need to map generated text back to input tokens."))
+            "need to map generated text back to input tokens."
+        ),
+    )
 
     cache_salt: Optional[str] = Field(
         default=None,
@@ -1184,16 +1262,21 @@ class CompletionRequest(OpenAIBaseModel):
             "environments. The salt should be random, protected from "
             "access by 3rd parties, and long enough to be "
             "unpredictable (e.g., 43 characters base64-encoded, corresponding "
-            "to 256 bit). Not supported by vLLM engine V0."))
+            "to 256 bit). Not supported by vLLM engine V0."
+        ),
+    )
 
     kv_transfer_params: Optional[dict[str, Any]] = Field(
         default=None,
-        description="KVTransfer parameters used for disaggregated serving.")
+        description="KVTransfer parameters used for disaggregated serving.",
+    )
 
     vllm_xargs: Optional[dict[str, Union[str, int, float]]] = Field(
         default=None,
-        description=("Additional request parameters with string or "
-                     "numeric values, used by custom extensions."),
+        description=(
+            "Additional request parameters with string or "
+            "numeric values, used by custom extensions."
+        ),
     )
 
     # --8<-- [end:completion-extra-params]
@@ -1212,7 +1295,6 @@ def to_beam_search_params(
         max_tokens: int,
         default_sampling_params: Optional[dict] = None,
     ) -> BeamSearchParams:
-
         if default_sampling_params is None:
             default_sampling_params = {}
         n = self.n if self.n is not None else 1
@@ -1235,7 +1317,6 @@ def to_sampling_params(
         logits_processor_pattern: Optional[str],
         default_sampling_params: Optional[dict] = None,
     ) -> SamplingParams:
-
         if default_sampling_params is None:
             default_sampling_params = {}
 
@@ -1247,16 +1328,20 @@ def to_sampling_params(
             )
         if (temperature := self.temperature) is None:
             temperature = default_sampling_params.get(
-                "temperature", self._DEFAULT_SAMPLING_PARAMS["temperature"])
+                "temperature", self._DEFAULT_SAMPLING_PARAMS["temperature"]
+            )
         if (top_p := self.top_p) is None:
             top_p = default_sampling_params.get(
-                "top_p", self._DEFAULT_SAMPLING_PARAMS["top_p"])
+                "top_p", self._DEFAULT_SAMPLING_PARAMS["top_p"]
+            )
         if (top_k := self.top_k) is None:
             top_k = default_sampling_params.get(
-                "top_k", self._DEFAULT_SAMPLING_PARAMS["top_k"])
+                "top_k", self._DEFAULT_SAMPLING_PARAMS["top_k"]
+            )
         if (min_p := self.min_p) is None:
             min_p = default_sampling_params.get(
-                "min_p", self._DEFAULT_SAMPLING_PARAMS["min_p"])
+                "min_p", self._DEFAULT_SAMPLING_PARAMS["min_p"]
+            )
 
         prompt_logprobs = self.prompt_logprobs
         if prompt_logprobs is None and self.echo:
@@ -1277,9 +1362,11 @@ def to_sampling_params(
             if len(kwargs) > 0:
                 self.structured_outputs = StructuredOutputsParams(**kwargs)
 
-        if (self.structured_outputs is not None
-                and self.response_format is not None
-                and self.response_format.type == "json_object"):
+        if (
+            self.structured_outputs is not None
+            and self.response_format is not None
+            and self.response_format.type == "json_object"
+        ):
             self.structured_outputs.json_object = True
 
         extra_args: dict[str, Any] = self.vllm_xargs if self.vllm_xargs else {}
@@ -1307,16 +1394,18 @@ def to_sampling_params(
             skip_special_tokens=self.skip_special_tokens,
             spaces_between_special_tokens=self.spaces_between_special_tokens,
             include_stop_str_in_output=self.include_stop_str_in_output,
-            logits_processors=get_logits_processors(self.logits_processors,
-                                                    logits_processor_pattern),
+            logits_processors=get_logits_processors(
+                self.logits_processors, logits_processor_pattern
+            ),
             truncate_prompt_tokens=self.truncate_prompt_tokens,
-            output_kind=RequestOutputKind.DELTA if self.stream \
-                else RequestOutputKind.FINAL_ONLY,
+            output_kind=RequestOutputKind.DELTA
+            if self.stream
+            else RequestOutputKind.FINAL_ONLY,
             structured_outputs=self.structured_outputs,
             logit_bias=self.logit_bias,
             allowed_token_ids=self.allowed_token_ids,
             extra_args=extra_args or None,
-            )
+        )
 
     @model_validator(mode="before")
     @classmethod
@@ -1324,31 +1413,33 @@ def check_structured_outputs_count(cls, data):
         if data.get("structured_outputs", None) is None:
             return data
 
-        structured_outputs_kwargs = data['structured_outputs']
+        structured_outputs_kwargs = data["structured_outputs"]
         count = sum(
             structured_outputs_kwargs.get(k) is not None
-            for k in ("json", "regex", "choice"))
+            for k in ("json", "regex", "choice")
+        )
         if count > 1:
             raise ValueError(
                 "You can only use one kind of constraints for structured "
-                "outputs ('json', 'regex' or 'choice').")
+                "outputs ('json', 'regex' or 'choice')."
+            )
         return data
 
     @model_validator(mode="before")
     @classmethod
     def check_logprobs(cls, data):
         if (prompt_logprobs := data.get("prompt_logprobs")) is not None:
-            if data.get("stream") and (prompt_logprobs > 0
-                                       or prompt_logprobs == -1):
+            if data.get("stream") and (prompt_logprobs > 0 or prompt_logprobs == -1):
                 raise ValueError(
-                    "`prompt_logprobs` are not available when `stream=True`.")
+                    "`prompt_logprobs` are not available when `stream=True`."
+                )
 
             if prompt_logprobs < 0 and prompt_logprobs != -1:
-                raise ValueError(
-                    "`prompt_logprobs` must be a positive value or -1.")
+                raise ValueError("`prompt_logprobs` must be a positive value or -1.")
             if prompt_logprobs == -1 and not envs.VLLM_USE_V1:
-                raise ValueError("`prompt_logprobs=-1` is only supported with "
-                                 "vLLM engine V1.")
+                raise ValueError(
+                    "`prompt_logprobs=-1` is only supported with vLLM engine V1."
+                )
         if (logprobs := data.get("logprobs")) is not None and logprobs < 0:
             raise ValueError("`logprobs` must be a positive value.")
 
@@ -1358,8 +1449,7 @@ def check_logprobs(cls, data):
     @classmethod
     def validate_stream_options(cls, data):
         if data.get("stream_options") and not data.get("stream"):
-            raise ValueError(
-                "Stream options can only be defined when `stream=True`.")
+            raise ValueError("Stream options can only be defined when `stream=True`.")
 
         return data
 
@@ -1369,11 +1459,10 @@ def validate_prompt_and_prompt_embeds(cls, data):
         prompt = data.get("prompt")
         prompt_embeds = data.get("prompt_embeds")
 
-        prompt_is_empty = (prompt is None
-                           or (isinstance(prompt, str) and prompt == ""))
-        embeds_is_empty = (prompt_embeds is None
-                           or (isinstance(prompt_embeds, list)
-                               and len(prompt_embeds) == 0))
+        prompt_is_empty = prompt is None or (isinstance(prompt, str) and prompt == "")
+        embeds_is_empty = prompt_embeds is None or (
+            isinstance(prompt_embeds, list) and len(prompt_embeds) == 0
+        )
 
         if prompt_is_empty and embeds_is_empty:
             raise ValueError(
@@ -1389,11 +1478,12 @@ def check_cache_salt_support(cls, data):
             if not envs.VLLM_USE_V1:
                 raise ValueError(
                     "Parameter 'cache_salt' is not supported with "
-                    "this instance of vLLM, which uses engine V0.")
-            if not isinstance(data["cache_salt"],
-                              str) or not data["cache_salt"]:
-                raise ValueError("Parameter 'cache_salt' must be a "
-                                 "non-empty string if provided.")
+                    "this instance of vLLM, which uses engine V0."
+                )
+            if not isinstance(data["cache_salt"], str) or not data["cache_salt"]:
+                raise ValueError(
+                    "Parameter 'cache_salt' must be a non-empty string if provided."
+                )
         return data
 
 
@@ -1412,21 +1502,24 @@ class EmbeddingCompletionRequest(OpenAIBaseModel):
         default=True,
         description=(
             "If true (the default), special tokens (e.g. BOS) will be added to "
-            "the prompt."),
+            "the prompt."
+        ),
     )
     priority: int = Field(
         default=0,
         description=(
             "The priority of the request (lower means earlier handling; "
             "default: 0). Any priority other than 0 will raise an error "
-            "if the served model does not use priority scheduling."),
+            "if the served model does not use priority scheduling."
+        ),
     )
     request_id: str = Field(
         default_factory=lambda: f"{random_uuid()}",
         description=(
             "The request_id related to this request. If the caller does "
             "not set it, a random_uuid will be generated. This id is used "
-            "through out the inference process and return in response."),
+            "through out the inference process and return in response."
+        ),
     )
     normalize: Optional[bool] = None
 
@@ -1436,7 +1529,8 @@ def to_pooling_params(self):
         return PoolingParams(
             truncate_prompt_tokens=self.truncate_prompt_tokens,
             dimensions=self.dimensions,
-            normalize=self.normalize)
+            normalize=self.normalize,
+        )
 
 
 class EmbeddingChatRequest(OpenAIBaseModel):
@@ -1451,10 +1545,11 @@ class EmbeddingChatRequest(OpenAIBaseModel):
     # --8<-- [start:chat-embedding-extra-params]
     add_generation_prompt: bool = Field(
         default=False,
-        description=
-        ("If true, the generation prompt will be added to the chat template. "
-         "This is a parameter used by chat template in tokenizer config of the "
-         "model."),
+        description=(
+            "If true, the generation prompt will be added to the chat template. "
+            "This is a parameter used by chat template in tokenizer config of the "
+            "model."
+        ),
     )
 
     add_special_tokens: bool = Field(
@@ -1464,7 +1559,8 @@ class EmbeddingChatRequest(OpenAIBaseModel):
             "on top of what is added by the chat template. "
             "For most models, the chat template takes care of adding the "
             "special tokens so this should be set to false (as is the "
-            "default)."),
+            "default)."
+        ),
     )
     chat_template: Optional[str] = Field(
         default=None,
@@ -1472,13 +1568,15 @@ class EmbeddingChatRequest(OpenAIBaseModel):
             "A Jinja template to use for this conversion. "
             "As of transformers v4.44, default chat template is no longer "
             "allowed, so you must provide a chat template if the tokenizer "
-            "does not define one."),
+            "does not define one."
+        ),
     )
     chat_template_kwargs: Optional[dict[str, Any]] = Field(
         default=None,
         description=(
             "Additional keyword args to pass to the template renderer. "
-            "Will be accessible by the chat template."),
+            "Will be accessible by the chat template."
+        ),
     )
     mm_processor_kwargs: Optional[dict[str, Any]] = Field(
         default=None,
@@ -1489,14 +1587,16 @@ class EmbeddingChatRequest(OpenAIBaseModel):
         description=(
             "The priority of the request (lower means earlier handling; "
             "default: 0). Any priority other than 0 will raise an error "
-            "if the served model does not use priority scheduling."),
+            "if the served model does not use priority scheduling."
+        ),
     )
     request_id: str = Field(
         default_factory=lambda: f"{random_uuid()}",
         description=(
             "The request_id related to this request. If the caller does "
             "not set it, a random_uuid will be generated. This id is used "
-            "through out the inference process and return in response."),
+            "through out the inference process and return in response."
+        ),
     )
     normalize: Optional[bool] = None
     # --8<-- [end:chat-embedding-extra-params]
@@ -1504,17 +1604,19 @@ class EmbeddingChatRequest(OpenAIBaseModel):
     @model_validator(mode="before")
     @classmethod
     def check_generation_prompt(cls, data):
-        if data.get("continue_final_message") and data.get(
-                "add_generation_prompt"):
-            raise ValueError("Cannot set both `continue_final_message` and "
-                             "`add_generation_prompt` to True.")
+        if data.get("continue_final_message") and data.get("add_generation_prompt"):
+            raise ValueError(
+                "Cannot set both `continue_final_message` and "
+                "`add_generation_prompt` to True."
+            )
         return data
 
     def to_pooling_params(self):
         return PoolingParams(
             truncate_prompt_tokens=self.truncate_prompt_tokens,
             dimensions=self.dimensions,
-            normalize=self.normalize)
+            normalize=self.normalize,
+        )
 
 
 EmbeddingRequest = Union[EmbeddingCompletionRequest, EmbeddingChatRequest]
@@ -1546,7 +1648,6 @@ def to_pooling_params(self):
 
 
 class IOProcessorResponse(OpenAIBaseModel, Generic[T]):
-
     request_id: Optional[str] = None
     """
     The request_id associated with this response
@@ -1560,8 +1661,7 @@ class IOProcessorResponse(OpenAIBaseModel, Generic[T]):
     """
 
 
-PoolingRequest = Union[PoolingCompletionRequest, PoolingChatRequest,
-                       IOProcessorRequest]
+PoolingRequest = Union[PoolingCompletionRequest, PoolingChatRequest, IOProcessorRequest]
 
 
 class ScoreRequest(OpenAIBaseModel):
@@ -1582,7 +1682,8 @@ class ScoreRequest(OpenAIBaseModel):
         description=(
             "The priority of the request (lower means earlier handling; "
             "default: 0). Any priority other than 0 will raise an error "
-            "if the served model does not use priority scheduling."),
+            "if the served model does not use priority scheduling."
+        ),
     )
 
     activation: Optional[bool] = None
@@ -1592,7 +1693,8 @@ class ScoreRequest(OpenAIBaseModel):
     def to_pooling_params(self):
         return PoolingParams(
             truncate_prompt_tokens=self.truncate_prompt_tokens,
-            activation=self.activation)
+            activation=self.activation,
+        )
 
 
 class RerankRequest(OpenAIBaseModel):
@@ -1614,7 +1716,8 @@ class RerankRequest(OpenAIBaseModel):
         description=(
             "The priority of the request (lower means earlier handling; "
             "default: 0). Any priority other than 0 will raise an error "
-            "if the served model does not use priority scheduling."),
+            "if the served model does not use priority scheduling."
+        ),
     )
 
     activation: Optional[bool] = None
@@ -1624,7 +1727,8 @@ class RerankRequest(OpenAIBaseModel):
     def to_pooling_params(self):
         return PoolingParams(
             truncate_prompt_tokens=self.truncate_prompt_tokens,
-            activation=self.activation)
+            activation=self.activation,
+        )
 
 
 class RerankDocument(BaseModel):
@@ -1653,8 +1757,7 @@ class CompletionLogProbs(OpenAIBaseModel):
     text_offset: list[int] = Field(default_factory=list)
     token_logprobs: list[Optional[float]] = Field(default_factory=list)
     tokens: list[str] = Field(default_factory=list)
-    top_logprobs: list[Optional[dict[str,
-                                     float]]] = Field(default_factory=list)
+    top_logprobs: list[Optional[dict[str, float]]] = Field(default_factory=list)
 
 
 class CompletionResponseChoice(OpenAIBaseModel):
@@ -1667,7 +1770,8 @@ class CompletionResponseChoice(OpenAIBaseModel):
         description=(
             "The stop string or token id that caused the completion "
             "to stop, None if the completion finished for some other reason "
-            "including encountering the EOS token"),
+            "including encountering the EOS token"
+        ),
     )
     token_ids: Optional[list[int]] = None  # For response
     prompt_logprobs: Optional[list[Optional[dict[int, Logprob]]]] = None
@@ -1680,14 +1784,16 @@ class CompletionResponse(OpenAIBaseModel):
     created: int = Field(default_factory=lambda: int(time.time()))
     model: str
     choices: list[CompletionResponseChoice]
-    service_tier: Optional[Literal["auto", "default", "flex", "scale",
-                                   "priority"]] = None
+    service_tier: Optional[Literal["auto", "default", "flex", "scale", "priority"]] = (
+        None
+    )
     system_fingerprint: Optional[str] = None
     usage: UsageInfo
 
     # vLLM-specific fields that are not in OpenAI spec
     kv_transfer_params: Optional[dict[str, Any]] = Field(
-        default=None, description="KVTransfer parameters.")
+        default=None, description="KVTransfer parameters."
+    )
 
 
 class CompletionResponseStreamChoice(OpenAIBaseModel):
@@ -1700,7 +1806,8 @@ class CompletionResponseStreamChoice(OpenAIBaseModel):
         description=(
             "The stop string or token id that caused the completion "
             "to stop, None if the completion finished for some other reason "
-            "including encountering the EOS token"),
+            "including encountering the EOS token"
+        ),
     )
     # not part of the OpenAI spec but for tracing the tokens
     # prompt tokens is put into choice to align with CompletionResponseChoice
@@ -1774,7 +1881,8 @@ class ClassificationRequest(OpenAIBaseModel):
         description=(
             "The priority of the request (lower means earlier handling; "
             "default: 0). Any priority other than 0 will raise an error "
-            "if the served model does not use priority scheduling."),
+            "if the served model does not use priority scheduling."
+        ),
     )
 
     activation: Optional[bool] = None
@@ -1784,7 +1892,8 @@ class ClassificationRequest(OpenAIBaseModel):
     def to_pooling_params(self):
         return PoolingParams(
             truncate_prompt_tokens=self.truncate_prompt_tokens,
-            activation=self.activation)
+            activation=self.activation,
+        )
 
 
 class ClassificationData(OpenAIBaseModel):
@@ -1888,8 +1997,9 @@ class ChatCompletionResponse(OpenAIBaseModel):
     created: int = Field(default_factory=lambda: int(time.time()))
     model: str
     choices: list[ChatCompletionResponseChoice]
-    service_tier: Optional[Literal["auto", "default", "flex", "scale",
-                                   "priority"]] = None
+    service_tier: Optional[Literal["auto", "default", "flex", "scale", "priority"]] = (
+        None
+    )
     system_fingerprint: Optional[str] = None
     usage: UsageInfo
 
@@ -1897,7 +2007,8 @@ class ChatCompletionResponse(OpenAIBaseModel):
     prompt_logprobs: Optional[list[Optional[dict[int, Logprob]]]] = None
     prompt_token_ids: Optional[list[int]] = None
     kv_transfer_params: Optional[dict[str, Any]] = Field(
-        default=None, description="KVTransfer parameters.")
+        default=None, description="KVTransfer parameters."
+    )
 
 
 class DeltaMessage(OpenAIBaseModel):
@@ -2007,10 +2118,9 @@ def from_request(
         input_messages: Optional[list[ChatCompletionMessageParam]] = None,
         output_messages: Optional[list[ChatCompletionMessageParam]] = None,
     ) -> "ResponsesResponse":
-
         incomplete_details: Optional[IncompleteDetails] = None
-        if status == 'incomplete':
-            incomplete_details = IncompleteDetails(reason='max_output_tokens')
+        if status == "incomplete":
+            incomplete_details = IncompleteDetails(reason="max_output_tokens")
         # TODO: implement the other reason for incomplete_details,
         # which is content_filter
         # incomplete_details = IncompleteDetails(reason='content_filter')
@@ -2125,8 +2235,9 @@ class ResponseInProgressEvent(OpenAIResponseInProgressEvent):
     ResponseCodeInterpreterCallCompletedEvent,
 ]
 
-BatchRequestInputBody = Union[ChatCompletionRequest, EmbeddingRequest,
-                              ScoreRequest, RerankRequest]
+BatchRequestInputBody = Union[
+    ChatCompletionRequest, EmbeddingRequest, ScoreRequest, RerankRequest
+]
 
 
 class BatchRequestInput(OpenAIBaseModel):
@@ -2151,7 +2262,7 @@ class BatchRequestInput(OpenAIBaseModel):
     # The parameters of the request.
     body: BatchRequestInputBody
 
-    @field_validator('body', mode='plain')
+    @field_validator("body", mode="plain")
     @classmethod
     def check_type_for_url(cls, value: Any, info: ValidationInfo):
         # Use url to disambiguate models
@@ -2175,8 +2286,9 @@ class BatchResponseData(OpenAIBaseModel):
     request_id: str
 
     # The body of the response.
-    body: Optional[Union[ChatCompletionResponse, EmbeddingResponse,
-                         ScoreResponse, RerankResponse]] = None
+    body: Optional[
+        Union[ChatCompletionResponse, EmbeddingResponse, ScoreResponse, RerankResponse]
+    ] = None
 
 
 class BatchRequestOutput(OpenAIBaseModel):
@@ -2205,12 +2317,14 @@ class TokenizeCompletionRequest(OpenAIBaseModel):
         default=True,
         description=(
             "If true (the default), special tokens (e.g. BOS) will be added to "
-            "the prompt."),
+            "the prompt."
+        ),
     )
     return_token_strs: Optional[bool] = Field(
         default=False,
-        description=("If true, also return the token strings "
-                     "corresponding to the token ids."),
+        description=(
+            "If true, also return the token strings corresponding to the token ids."
+        ),
     )
 
 
@@ -2220,24 +2334,27 @@ class TokenizeChatRequest(OpenAIBaseModel):
 
     add_generation_prompt: bool = Field(
         default=True,
-        description=
-        ("If true, the generation prompt will be added to the chat template. "
-         "This is a parameter used by chat template in tokenizer config of the "
-         "model."),
+        description=(
+            "If true, the generation prompt will be added to the chat template. "
+            "This is a parameter used by chat template in tokenizer config of the "
+            "model."
+        ),
     )
     return_token_strs: Optional[bool] = Field(
         default=False,
-        description=("If true, also return the token strings "
-                     "corresponding to the token ids."),
+        description=(
+            "If true, also return the token strings corresponding to the token ids."
+        ),
     )
     continue_final_message: bool = Field(
         default=False,
-        description=
-        ("If this is set, the chat will be formatted so that the final "
-         "message in the chat is open-ended, without any EOS tokens. The "
-         "model will continue this message rather than starting a new one. "
-         "This allows you to \"prefill\" part of the model's response for it. "
-         "Cannot be used at the same time as `add_generation_prompt`."),
+        description=(
+            "If this is set, the chat will be formatted so that the final "
+            "message in the chat is open-ended, without any EOS tokens. The "
+            "model will continue this message rather than starting a new one. "
+            'This allows you to "prefill" part of the model\'s response for it. '
+            "Cannot be used at the same time as `add_generation_prompt`."
+        ),
     )
     add_special_tokens: bool = Field(
         default=False,
@@ -2246,7 +2363,8 @@ class TokenizeChatRequest(OpenAIBaseModel):
             "on top of what is added by the chat template. "
             "For most models, the chat template takes care of adding the "
             "special tokens so this should be set to false (as is the "
-            "default)."),
+            "default)."
+        ),
     )
     chat_template: Optional[str] = Field(
         default=None,
@@ -2254,13 +2372,15 @@ class TokenizeChatRequest(OpenAIBaseModel):
             "A Jinja template to use for this conversion. "
             "As of transformers v4.44, default chat template is no longer "
             "allowed, so you must provide a chat template if the tokenizer "
-            "does not define one."),
+            "does not define one."
+        ),
     )
     chat_template_kwargs: Optional[dict[str, Any]] = Field(
         default=None,
         description=(
             "Additional keyword args to pass to the template renderer. "
-            "Will be accessible by the chat template."),
+            "Will be accessible by the chat template."
+        ),
     )
     mm_processor_kwargs: Optional[dict[str, Any]] = Field(
         default=None,
@@ -2274,10 +2394,11 @@ class TokenizeChatRequest(OpenAIBaseModel):
     @model_validator(mode="before")
     @classmethod
     def check_generation_prompt(cls, data):
-        if data.get("continue_final_message") and data.get(
-                "add_generation_prompt"):
-            raise ValueError("Cannot set both `continue_final_message` and "
-                             "`add_generation_prompt` to True.")
+        if data.get("continue_final_message") and data.get("add_generation_prompt"):
+            raise ValueError(
+                "Cannot set both `continue_final_message` and "
+                "`add_generation_prompt` to True."
+            )
         return data
 
 
@@ -2321,8 +2442,7 @@ class UnloadLoRAAdapterRequest(BaseModel):
 
 
 ## Protocols for Audio
-AudioResponseFormat: TypeAlias = Literal["json", "text", "srt", "verbose_json",
-                                         "vtt"]
+AudioResponseFormat: TypeAlias = Literal["json", "text", "srt", "verbose_json", "vtt"]
 
 
 class TranscriptionRequest(OpenAIBaseModel):
@@ -2364,7 +2484,8 @@ class TranscriptionRequest(OpenAIBaseModel):
     ## TODO (varun) : Support if set to 0, certain thresholds are met !!
 
     timestamp_granularities: list[Literal["word", "segment"]] = Field(
-        alias="timestamp_granularities[]", default=[])
+        alias="timestamp_granularities[]", default=[]
+    )
     """The timestamp granularities to populate for this transcription.
 
     `response_format` must be set `verbose_json` to use timestamp granularities.
@@ -2384,8 +2505,10 @@ class TranscriptionRequest(OpenAIBaseModel):
 
     vllm_xargs: Optional[dict[str, Union[str, int, float]]] = Field(
         default=None,
-        description=("Additional request parameters with string or "
-                     "numeric values, used by custom extensions."),
+        description=(
+            "Additional request parameters with string or "
+            "numeric values, used by custom extensions."
+        ),
     )
     # --8<-- [end:transcription-extra-params]
 
@@ -2442,10 +2565,8 @@ class TranscriptionRequest(OpenAIBaseModel):
     }
 
     def to_sampling_params(
-            self,
-            default_max_tokens: int,
-            default_sampling_params: Optional[dict] = None) -> SamplingParams:
-
+        self, default_max_tokens: int, default_sampling_params: Optional[dict] = None
+    ) -> SamplingParams:
         max_tokens = default_max_tokens
 
         if default_sampling_params is None:
@@ -2454,35 +2575,42 @@ def to_sampling_params(
         # Default parameters
         if (temperature := self.temperature) is None:
             temperature = default_sampling_params.get(
-                "temperature", self._DEFAULT_SAMPLING_PARAMS["temperature"])
+                "temperature", self._DEFAULT_SAMPLING_PARAMS["temperature"]
+            )
         if (top_p := self.top_p) is None:
             top_p = default_sampling_params.get(
-                "top_p", self._DEFAULT_SAMPLING_PARAMS["top_p"])
+                "top_p", self._DEFAULT_SAMPLING_PARAMS["top_p"]
+            )
         if (top_k := self.top_k) is None:
             top_k = default_sampling_params.get(
-                "top_k", self._DEFAULT_SAMPLING_PARAMS["top_k"])
+                "top_k", self._DEFAULT_SAMPLING_PARAMS["top_k"]
+            )
         if (min_p := self.min_p) is None:
             min_p = default_sampling_params.get(
-                "min_p", self._DEFAULT_SAMPLING_PARAMS["min_p"])
+                "min_p", self._DEFAULT_SAMPLING_PARAMS["min_p"]
+            )
 
         if (repetition_penalty := self.repetition_penalty) is None:
             repetition_penalty = default_sampling_params.get(
                 "repetition_penalty",
-                self._DEFAULT_SAMPLING_PARAMS["repetition_penalty"])
-
-        return SamplingParams.from_optional(temperature=temperature,
-                                            max_tokens=max_tokens,
-                                            seed=self.seed,
-                                            top_p=top_p,
-                                            top_k=top_k,
-                                            min_p=min_p,
-                                            frequency_penalty=self.frequency_penalty,
-                                            repetition_penalty=repetition_penalty,
-                                            presence_penalty=self.presence_penalty,
-                                            output_kind=RequestOutputKind.DELTA
-                                            if self.stream \
-                                            else RequestOutputKind.FINAL_ONLY,
-                                            extra_args=self.vllm_xargs)
+                self._DEFAULT_SAMPLING_PARAMS["repetition_penalty"],
+            )
+
+        return SamplingParams.from_optional(
+            temperature=temperature,
+            max_tokens=max_tokens,
+            seed=self.seed,
+            top_p=top_p,
+            top_k=top_k,
+            min_p=min_p,
+            frequency_penalty=self.frequency_penalty,
+            repetition_penalty=repetition_penalty,
+            presence_penalty=self.presence_penalty,
+            output_kind=RequestOutputKind.DELTA
+            if self.stream
+            else RequestOutputKind.FINAL_ONLY,
+            extra_args=self.vllm_xargs,
+        )
 
     @model_validator(mode="before")
     @classmethod
@@ -2496,8 +2624,7 @@ def validate_transcription_request(cls, data):
         stream_opts = ["stream_include_usage", "stream_continuous_usage_stats"]
         stream = data.get("stream", False)
         if any(bool(data.get(so, False)) for so in stream_opts) and not stream:
-            raise ValueError(
-                "Stream options can only be defined when `stream=True`.")
+            raise ValueError("Stream options can only be defined when `stream=True`.")
 
         return data
 
@@ -2675,10 +2802,8 @@ class TranslationRequest(OpenAIBaseModel):
     }
 
     def to_sampling_params(
-            self,
-            default_max_tokens: int,
-            default_sampling_params: Optional[dict] = None) -> SamplingParams:
-
+        self, default_max_tokens: int, default_sampling_params: Optional[dict] = None
+    ) -> SamplingParams:
         max_tokens = default_max_tokens
 
         if default_sampling_params is None:
@@ -2686,14 +2811,17 @@ def to_sampling_params(
         # Default parameters
         if (temperature := self.temperature) is None:
             temperature = default_sampling_params.get(
-                "temperature", self._DEFAULT_SAMPLING_PARAMS["temperature"])
+                "temperature", self._DEFAULT_SAMPLING_PARAMS["temperature"]
+            )
 
-        return SamplingParams.from_optional(temperature=temperature,
-                                            max_tokens=max_tokens,
-                                            seed=self.seed,
-                                            output_kind=RequestOutputKind.DELTA
-                                            if self.stream \
-                                            else RequestOutputKind.FINAL_ONLY)
+        return SamplingParams.from_optional(
+            temperature=temperature,
+            max_tokens=max_tokens,
+            seed=self.seed,
+            output_kind=RequestOutputKind.DELTA
+            if self.stream
+            else RequestOutputKind.FINAL_ONLY,
+        )
 
     @model_validator(mode="before")
     @classmethod
@@ -2701,8 +2829,7 @@ def validate_stream_options(cls, data):
         stream_opts = ["stream_include_usage", "stream_continuous_usage_stats"]
         stream = data.get("stream", False)
         if any(bool(data.get(so, False)) for so in stream_opts) and not stream:
-            raise ValueError(
-                "Stream options can only be defined when `stream=True`.")
+            raise ValueError("Stream options can only be defined when `stream=True`.")
 
         return data
 
diff --git a/vllm/entrypoints/openai/run_batch.py b/vllm/entrypoints/openai/run_batch.py
index 2568c21c4abe..466757468abd 100644
--- a/vllm/entrypoints/openai/run_batch.py
+++ b/vllm/entrypoints/openai/run_batch.py
@@ -18,18 +18,23 @@
 from vllm.engine.arg_utils import AsyncEngineArgs, optional_type
 from vllm.engine.protocol import EngineClient
 from vllm.entrypoints.logger import RequestLogger
+
 # yapf: disable
-from vllm.entrypoints.openai.protocol import (BatchRequestInput,
-                                              BatchRequestOutput,
-                                              BatchResponseData,
-                                              ChatCompletionResponse,
-                                              EmbeddingResponse, ErrorResponse,
-                                              RerankResponse, ScoreResponse)
+from vllm.entrypoints.openai.protocol import (
+    BatchRequestInput,
+    BatchRequestOutput,
+    BatchResponseData,
+    ChatCompletionResponse,
+    EmbeddingResponse,
+    ErrorResponse,
+    RerankResponse,
+    ScoreResponse,
+)
+
 # yapf: enable
 from vllm.entrypoints.openai.serving_chat import OpenAIServingChat
 from vllm.entrypoints.openai.serving_embedding import OpenAIServingEmbedding
-from vllm.entrypoints.openai.serving_models import (BaseModelPath,
-                                                    OpenAIServingModels)
+from vllm.entrypoints.openai.serving_models import BaseModelPath, OpenAIServingModels
 from vllm.entrypoints.openai.serving_score import ServingScores
 from vllm.logger import init_logger
 from vllm.utils import FlexibleArgumentParser, random_uuid
@@ -44,10 +49,10 @@ def make_arg_parser(parser: FlexibleArgumentParser):
         "--input-file",
         required=True,
         type=str,
-        help=
-        "The path or url to a single input file. Currently supports local file "
+        help="The path or url to a single input file. Currently supports local file "
         "paths, or the http protocol (http or https). If a URL is specified, "
-        "the file should be available via HTTP GET.")
+        "the file should be available via HTTP GET.",
+    )
     parser.add_argument(
         "-o",
         "--output-file",
@@ -55,7 +60,8 @@ def make_arg_parser(parser: FlexibleArgumentParser):
         type=str,
         help="The path or url to a single output file. Currently supports "
         "local file paths, or web (http or https) urls. If a URL is specified,"
-        " the file should be available via HTTP PUT.")
+        " the file should be available via HTTP PUT.",
+    )
     parser.add_argument(
         "--output-tmp-dir",
         type=str,
@@ -63,24 +69,27 @@ def make_arg_parser(parser: FlexibleArgumentParser):
         help="The directory to store the output file before uploading it "
         "to the output URL.",
     )
-    parser.add_argument("--response-role",
-                        type=optional_type(str),
-                        default="assistant",
-                        help="The role name to return if "
-                        "`request.add_generation_prompt=True`.")
+    parser.add_argument(
+        "--response-role",
+        type=optional_type(str),
+        default="assistant",
+        help="The role name to return if `request.add_generation_prompt=True`.",
+    )
 
     parser = AsyncEngineArgs.add_cli_args(parser)
 
-    parser.add_argument('--max-log-len',
-                        type=int,
-                        default=None,
-                        help='Max number of prompt characters or prompt '
-                        'ID numbers being printed in log.'
-                        '\n\nDefault: Unlimited')
+    parser.add_argument(
+        "--max-log-len",
+        type=int,
+        default=None,
+        help="Max number of prompt characters or prompt "
+        "ID numbers being printed in log."
+        "\n\nDefault: Unlimited",
+    )
 
-    parser.add_argument("--enable-metrics",
-                        action="store_true",
-                        help="Enable Prometheus metrics")
+    parser.add_argument(
+        "--enable-metrics", action="store_true", help="Enable Prometheus metrics"
+    )
     parser.add_argument(
         "--url",
         type=str,
@@ -97,16 +106,16 @@ def make_arg_parser(parser: FlexibleArgumentParser):
     )
     parser.add_argument(
         "--enable-prompt-tokens-details",
-        action='store_true',
+        action="store_true",
         default=False,
-        help="If set to True, enable prompt_tokens_details in usage.")
+        help="If set to True, enable prompt_tokens_details in usage.",
+    )
 
     return parser
 
 
 def parse_args():
-    parser = FlexibleArgumentParser(
-        description="vLLM OpenAI-Compatible batch runner.")
+    parser = FlexibleArgumentParser(description="vLLM OpenAI-Compatible batch runner.")
     return make_arg_parser(parser).parse_args()
 
 
@@ -118,7 +127,6 @@ def parse_args():
 
 
 class BatchProgressTracker:
-
     def __init__(self):
         self._total = 0
         self._pbar: Optional[tqdm] = None
@@ -131,29 +139,32 @@ def completed(self):
             self._pbar.update()
 
     def pbar(self) -> tqdm:
-        enable_tqdm = not torch.distributed.is_initialized(
-        ) or torch.distributed.get_rank() == 0
-        self._pbar = tqdm(total=self._total,
-                          unit="req",
-                          desc="Running batch",
-                          mininterval=5,
-                          disable=not enable_tqdm,
-                          bar_format=_BAR_FORMAT)
+        enable_tqdm = (
+            not torch.distributed.is_initialized() or torch.distributed.get_rank() == 0
+        )
+        self._pbar = tqdm(
+            total=self._total,
+            unit="req",
+            desc="Running batch",
+            mininterval=5,
+            disable=not enable_tqdm,
+            bar_format=_BAR_FORMAT,
+        )
         return self._pbar
 
 
 async def read_file(path_or_url: str) -> str:
     if path_or_url.startswith("http://") or path_or_url.startswith("https://"):
-        async with aiohttp.ClientSession() as session, \
-                   session.get(path_or_url) as resp:
+        async with aiohttp.ClientSession() as session, session.get(path_or_url) as resp:
             return await resp.text()
     else:
         with open(path_or_url, encoding="utf-8") as f:
             return f.read()
 
 
-async def write_local_file(output_path: str,
-                           batch_outputs: list[BatchRequestOutput]) -> None:
+async def write_local_file(
+    output_path: str, batch_outputs: list[BatchRequestOutput]
+) -> None:
     """
     Write the responses to a local file.
     output_path: The path to write the responses to.
@@ -166,8 +177,7 @@ async def write_local_file(output_path: str,
             print(o.model_dump_json(), file=f)
 
 
-async def upload_data(output_url: str, data_or_file: str,
-                      from_file: bool) -> None:
+async def upload_data(output_url: str, data_or_file: str, from_file: bool) -> None:
     """
     Upload a local file to a URL.
     output_url: The URL to upload the file to.
@@ -184,23 +194,26 @@ async def upload_data(output_url: str, data_or_file: str,
         try:
             # We increase the timeout to 1000 seconds to allow
             # for large files (default is 300).
-            async with aiohttp.ClientSession(timeout=aiohttp.ClientTimeout(
-                    total=1000)) as session:
+            async with aiohttp.ClientSession(
+                timeout=aiohttp.ClientTimeout(total=1000)
+            ) as session:
                 if from_file:
                     with open(data_or_file, "rb") as file:
-                        async with session.put(output_url,
-                                               data=file) as response:
+                        async with session.put(output_url, data=file) as response:
                             if response.status != 200:
-                                raise Exception(f"Failed to upload file.\n"
-                                                f"Status: {response.status}\n"
-                                                f"Response: {response.text()}")
+                                raise Exception(
+                                    f"Failed to upload file.\n"
+                                    f"Status: {response.status}\n"
+                                    f"Response: {response.text()}"
+                                )
                 else:
-                    async with session.put(output_url,
-                                           data=data_or_file) as response:
+                    async with session.put(output_url, data=data_or_file) as response:
                         if response.status != 200:
-                            raise Exception(f"Failed to upload data.\n"
-                                            f"Status: {response.status}\n"
-                                            f"Response: {response.text()}")
+                            raise Exception(
+                                f"Failed to upload data.\n"
+                                f"Status: {response.status}\n"
+                                f"Response: {response.text()}"
+                            )
 
         except Exception as e:
             if attempt < max_retries:
@@ -217,8 +230,9 @@ async def upload_data(output_url: str, data_or_file: str,
                 ) from e
 
 
-async def write_file(path_or_url: str, batch_outputs: list[BatchRequestOutput],
-                     output_tmp_dir: str) -> None:
+async def write_file(
+    path_or_url: str, batch_outputs: list[BatchRequestOutput], output_tmp_dir: str
+) -> None:
     """
     Write batch_outputs to a file or upload to a URL.
     path_or_url: The path or URL to write batch_outputs to.
@@ -242,14 +256,13 @@ async def write_file(path_or_url: str, batch_outputs: list[BatchRequestOutput],
         else:
             # Write responses to a temporary file and then upload it to the URL.
             with tempfile.NamedTemporaryFile(
-                    mode="w",
-                    encoding="utf-8",
-                    dir=output_tmp_dir,
-                    prefix="tmp_batch_output_",
-                    suffix=".jsonl",
+                mode="w",
+                encoding="utf-8",
+                dir=output_tmp_dir,
+                prefix="tmp_batch_output_",
+                suffix=".jsonl",
             ) as f:
-                logger.info("Writing outputs to temporary local file %s",
-                            f.name)
+                logger.info("Writing outputs to temporary local file %s", f.name)
                 await write_local_file(f.name, batch_outputs)
                 logger.info("Uploading outputs to %s", path_or_url)
                 await upload_data(path_or_url, f.name, from_file=True)
@@ -258,8 +271,9 @@ async def write_file(path_or_url: str, batch_outputs: list[BatchRequestOutput],
         await write_local_file(path_or_url, batch_outputs)
 
 
-def make_error_request_output(request: BatchRequestInput,
-                              error_msg: str) -> BatchRequestOutput:
+def make_error_request_output(
+    request: BatchRequestInput, error_msg: str
+) -> BatchRequestOutput:
     batch_output = BatchRequestOutput(
         id=f"vllm-{random_uuid()}",
         custom_id=request.custom_id,
@@ -273,25 +287,28 @@ def make_error_request_output(request: BatchRequestInput,
 
 
 async def make_async_error_request_output(
-        request: BatchRequestInput, error_msg: str) -> BatchRequestOutput:
+    request: BatchRequestInput, error_msg: str
+) -> BatchRequestOutput:
     return make_error_request_output(request, error_msg)
 
 
-async def run_request(serving_engine_func: Callable,
-                      request: BatchRequestInput,
-                      tracker: BatchProgressTracker) -> BatchRequestOutput:
+async def run_request(
+    serving_engine_func: Callable,
+    request: BatchRequestInput,
+    tracker: BatchProgressTracker,
+) -> BatchRequestOutput:
     response = await serving_engine_func(request.body)
 
     if isinstance(
-            response,
-        (ChatCompletionResponse, EmbeddingResponse, ScoreResponse,
-         RerankResponse),
+        response,
+        (ChatCompletionResponse, EmbeddingResponse, ScoreResponse, RerankResponse),
     ):
         batch_output = BatchRequestOutput(
             id=f"vllm-{random_uuid()}",
             custom_id=request.custom_id,
             response=BatchResponseData(
-                body=response, request_id=f"vllm-batch-{random_uuid()}"),
+                body=response, request_id=f"vllm-batch-{random_uuid()}"
+            ),
             error=None,
         )
     elif isinstance(response, ErrorResponse):
@@ -300,12 +317,14 @@ async def run_request(serving_engine_func: Callable,
             custom_id=request.custom_id,
             response=BatchResponseData(
                 status_code=response.error.code,
-                request_id=f"vllm-batch-{random_uuid()}"),
+                request_id=f"vllm-batch-{random_uuid()}",
+            ),
             error=response,
         )
     else:
         batch_output = make_error_request_output(
-            request, error_msg="Request must not be sent in stream mode")
+            request, error_msg="Request must not be sent in stream mode"
+        )
 
     tracker.completed()
     return batch_output
@@ -327,8 +346,7 @@ async def run_batch(
         request_logger = None
 
     base_model_paths = [
-        BaseModelPath(name=name, model_path=args.model)
-        for name in served_model_names
+        BaseModelPath(name=name, model_path=args.model) for name in served_model_names
     ]
 
     model_config = vllm_config.model_config
@@ -343,34 +361,48 @@ async def run_batch(
         base_model_paths=base_model_paths,
         lora_modules=None,
     )
-    openai_serving_chat = OpenAIServingChat(
-        engine_client,
-        model_config,
-        openai_serving_models,
-        args.response_role,
-        request_logger=request_logger,
-        chat_template=None,
-        chat_template_content_format="auto",
-        enable_prompt_tokens_details=args.enable_prompt_tokens_details,
-    ) if "generate" in supported_tasks else None
-    openai_serving_embedding = OpenAIServingEmbedding(
-        engine_client,
-        model_config,
-        openai_serving_models,
-        request_logger=request_logger,
-        chat_template=None,
-        chat_template_content_format="auto",
-    ) if "embed" in supported_tasks else None
-
-    enable_serving_reranking = ("classify" in supported_tasks and getattr(
-        model_config.hf_config, "num_labels", 0) == 1)
-
-    openai_serving_scores = ServingScores(
-        engine_client,
-        model_config,
-        openai_serving_models,
-        request_logger=request_logger,
-    ) if ("embed" in supported_tasks or enable_serving_reranking) else None
+    openai_serving_chat = (
+        OpenAIServingChat(
+            engine_client,
+            model_config,
+            openai_serving_models,
+            args.response_role,
+            request_logger=request_logger,
+            chat_template=None,
+            chat_template_content_format="auto",
+            enable_prompt_tokens_details=args.enable_prompt_tokens_details,
+        )
+        if "generate" in supported_tasks
+        else None
+    )
+    openai_serving_embedding = (
+        OpenAIServingEmbedding(
+            engine_client,
+            model_config,
+            openai_serving_models,
+            request_logger=request_logger,
+            chat_template=None,
+            chat_template_content_format="auto",
+        )
+        if "embed" in supported_tasks
+        else None
+    )
+
+    enable_serving_reranking = (
+        "classify" in supported_tasks
+        and getattr(model_config.hf_config, "num_labels", 0) == 1
+    )
+
+    openai_serving_scores = (
+        ServingScores(
+            engine_client,
+            model_config,
+            openai_serving_models,
+            request_logger=request_logger,
+        )
+        if ("embed" in supported_tasks or enable_serving_reranking)
+        else None
+    )
 
     tracker = BatchProgressTracker()
     logger.info("Reading batch from %s...", args.input_file)
@@ -387,61 +419,72 @@ async def run_batch(
 
         # Determine the type of request and run it.
         if request.url == "/v1/chat/completions":
-            chat_handler_fn = openai_serving_chat.create_chat_completion if \
-                openai_serving_chat is not None else None
+            chat_handler_fn = (
+                openai_serving_chat.create_chat_completion
+                if openai_serving_chat is not None
+                else None
+            )
             if chat_handler_fn is None:
                 response_futures.append(
                     make_async_error_request_output(
                         request,
-                        error_msg=
-                        "The model does not support Chat Completions API",
-                    ))
+                        error_msg="The model does not support Chat Completions API",
+                    )
+                )
                 continue
 
-            response_futures.append(
-                run_request(chat_handler_fn, request, tracker))
+            response_futures.append(run_request(chat_handler_fn, request, tracker))
             tracker.submitted()
         elif request.url == "/v1/embeddings":
-            embed_handler_fn = openai_serving_embedding.create_embedding if \
-                openai_serving_embedding is not None else None
+            embed_handler_fn = (
+                openai_serving_embedding.create_embedding
+                if openai_serving_embedding is not None
+                else None
+            )
             if embed_handler_fn is None:
                 response_futures.append(
                     make_async_error_request_output(
                         request,
                         error_msg="The model does not support Embeddings API",
-                    ))
+                    )
+                )
                 continue
 
-            response_futures.append(
-                run_request(embed_handler_fn, request, tracker))
+            response_futures.append(run_request(embed_handler_fn, request, tracker))
             tracker.submitted()
         elif request.url.endswith("/score"):
-            score_handler_fn = openai_serving_scores.create_score if \
-                openai_serving_scores is not None else None
+            score_handler_fn = (
+                openai_serving_scores.create_score
+                if openai_serving_scores is not None
+                else None
+            )
             if score_handler_fn is None:
                 response_futures.append(
                     make_async_error_request_output(
                         request,
                         error_msg="The model does not support Scores API",
-                    ))
+                    )
+                )
                 continue
 
-            response_futures.append(
-                run_request(score_handler_fn, request, tracker))
+            response_futures.append(run_request(score_handler_fn, request, tracker))
             tracker.submitted()
         elif request.url.endswith("/rerank"):
-            rerank_handler_fn = openai_serving_scores.do_rerank if \
-                openai_serving_scores is not None else None
+            rerank_handler_fn = (
+                openai_serving_scores.do_rerank
+                if openai_serving_scores is not None
+                else None
+            )
             if rerank_handler_fn is None:
                 response_futures.append(
                     make_async_error_request_output(
                         request,
                         error_msg="The model does not support Rerank API",
-                    ))
+                    )
+                )
                 continue
 
-            response_futures.append(
-                run_request(rerank_handler_fn, request, tracker))
+            response_futures.append(run_request(rerank_handler_fn, request, tracker))
             tracker.submitted()
         else:
             response_futures.append(
@@ -452,7 +495,8 @@ async def run_batch(
                     " /score, /rerank ."
                     "See vllm/entrypoints/openai/api_server.py for supported "
                     "score/rerank versions.",
-                ))
+                )
+            )
 
     with tracker.pbar():
         responses = await asyncio.gather(*response_futures)
@@ -465,9 +509,9 @@ async def main(args: Namespace):
     from vllm.usage.usage_lib import UsageContext
 
     async with build_async_engine_client(
-            args,
-            usage_context=UsageContext.OPENAI_BATCH_RUNNER,
-            disable_frontend_multiprocessing=False,
+        args,
+        usage_context=UsageContext.OPENAI_BATCH_RUNNER,
+        disable_frontend_multiprocessing=False,
     ) as engine_client:
         vllm_config = await engine_client.get_vllm_config()
 
diff --git a/vllm/entrypoints/openai/serving_chat.py b/vllm/entrypoints/openai/serving_chat.py
index 0a04d76b2d69..ec1787d38546 100644
--- a/vllm/entrypoints/openai/serving_chat.py
+++ b/vllm/entrypoints/openai/serving_chat.py
@@ -17,29 +17,48 @@
 
 from vllm.config import ModelConfig
 from vllm.engine.protocol import EngineClient
-from vllm.entrypoints.chat_utils import (ChatTemplateContentFormatOption,
-                                         ConversationMessage,
-                                         get_history_tool_calls_cnt,
-                                         make_tool_call_id)
+from vllm.entrypoints.chat_utils import (
+    ChatTemplateContentFormatOption,
+    ConversationMessage,
+    get_history_tool_calls_cnt,
+    make_tool_call_id,
+)
 from vllm.entrypoints.harmony_utils import (
-    get_developer_message, get_stop_tokens_for_assistant_actions,
-    get_streamable_parser_for_assistant, get_system_message, parse_chat_input,
-    parse_chat_output, render_for_completion)
+    get_developer_message,
+    get_stop_tokens_for_assistant_actions,
+    get_streamable_parser_for_assistant,
+    get_system_message,
+    parse_chat_input,
+    parse_chat_output,
+    render_for_completion,
+)
 from vllm.entrypoints.logger import RequestLogger
 from vllm.entrypoints.openai.protocol import (
-    ChatCompletionLogProb, ChatCompletionLogProbs,
-    ChatCompletionLogProbsContent, ChatCompletionNamedToolChoiceParam,
-    ChatCompletionRequest, ChatCompletionResponse,
-    ChatCompletionResponseChoice, ChatCompletionResponseStreamChoice,
-    ChatCompletionStreamResponse, ChatMessage, DeltaFunctionCall, DeltaMessage,
-    DeltaToolCall, ErrorResponse, FunctionCall, FunctionDefinition,
-    PromptTokenUsageInfo, RequestResponseMetadata, ToolCall, UsageInfo)
-from vllm.entrypoints.openai.serving_engine import (OpenAIServing,
-                                                    clamp_prompt_logprobs)
+    ChatCompletionLogProb,
+    ChatCompletionLogProbs,
+    ChatCompletionLogProbsContent,
+    ChatCompletionNamedToolChoiceParam,
+    ChatCompletionRequest,
+    ChatCompletionResponse,
+    ChatCompletionResponseChoice,
+    ChatCompletionResponseStreamChoice,
+    ChatCompletionStreamResponse,
+    ChatMessage,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ErrorResponse,
+    FunctionCall,
+    FunctionDefinition,
+    PromptTokenUsageInfo,
+    RequestResponseMetadata,
+    ToolCall,
+    UsageInfo,
+)
+from vllm.entrypoints.openai.serving_engine import OpenAIServing, clamp_prompt_logprobs
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
 from vllm.entrypoints.openai.tool_parsers import ToolParser, ToolParserManager
-from vllm.entrypoints.openai.tool_parsers.mistral_tool_parser import (
-    MistralToolCall)
+from vllm.entrypoints.openai.tool_parsers.mistral_tool_parser import MistralToolCall
 from vllm.entrypoints.utils import get_max_tokens
 from vllm.inputs.data import TokensPrompt as EngineTokensPrompt
 from vllm.logger import init_logger
@@ -48,16 +67,17 @@
 from vllm.reasoning import ReasoningParser, ReasoningParserManager
 from vllm.sampling_params import BeamSearchParams, SamplingParams
 from vllm.transformers_utils.tokenizer import AnyTokenizer, MistralTokenizer
-from vllm.transformers_utils.tokenizers import (maybe_serialize_tool_calls,
-                                                truncate_tool_call_ids,
-                                                validate_request_params)
+from vllm.transformers_utils.tokenizers import (
+    maybe_serialize_tool_calls,
+    truncate_tool_call_ids,
+    validate_request_params,
+)
 from vllm.utils import as_list
 
 logger = init_logger(__name__)
 
 
 class OpenAIServingChat(OpenAIServing):
-
     def __init__(
         self,
         engine_client: EngineClient,
@@ -79,13 +99,15 @@ def __init__(
         enable_log_outputs: bool = False,
         log_error_stack: bool = False,
     ) -> None:
-        super().__init__(engine_client=engine_client,
-                         model_config=model_config,
-                         models=models,
-                         request_logger=request_logger,
-                         return_tokens_as_token_ids=return_tokens_as_token_ids,
-                         enable_force_include_usage=enable_force_include_usage,
-                         log_error_stack=log_error_stack)
+        super().__init__(
+            engine_client=engine_client,
+            model_config=model_config,
+            models=models,
+            request_logger=request_logger,
+            return_tokens_as_token_ids=return_tokens_as_token_ids,
+            enable_force_include_usage=enable_force_include_usage,
+            log_error_stack=log_error_stack,
+        )
 
         self.response_role = response_role
         self.chat_template = chat_template
@@ -97,58 +119,63 @@ def __init__(
         self.enable_auto_tools: bool = enable_auto_tools
         if self.enable_auto_tools:
             logger.info(
-                "\"auto\" tool choice has been enabled please note that while"
+                '"auto" tool choice has been enabled please note that while'
                 " the parallel_tool_calls client option is preset for "
-                "compatibility reasons, it will be ignored.")
+                "compatibility reasons, it will be ignored."
+            )
 
-        self.reasoning_parser: Optional[Callable[[AnyTokenizer],
-                                                 ReasoningParser]] = None
+        self.reasoning_parser: Optional[Callable[[AnyTokenizer], ReasoningParser]] = (
+            None
+        )
         if reasoning_parser:
             try:
-                self.reasoning_parser = (
-                    ReasoningParserManager.get_reasoning_parser(
-                        reasoning_parser))
+                self.reasoning_parser = ReasoningParserManager.get_reasoning_parser(
+                    reasoning_parser
+                )
                 assert self.reasoning_parser is not None
             except Exception as e:
-                raise TypeError(
-                    f"{reasoning_parser=} has not been registered") from e
+                raise TypeError(f"{reasoning_parser=} has not been registered") from e
         self.tool_parser: Optional[Callable[[AnyTokenizer], ToolParser]] = None
         if self.enable_auto_tools:
             try:
-                if (tool_parser == "pythonic" and
-                        model_config.model.startswith("meta-llama/Llama-3.2")):
+                if tool_parser == "pythonic" and model_config.model.startswith(
+                    "meta-llama/Llama-3.2"
+                ):
                     logger.warning(
-                        "Llama3.2 models may struggle to emit valid pythonic"
-                        " tool calls")
-                self.tool_parser = ToolParserManager.get_tool_parser(
-                    tool_parser)
+                        "Llama3.2 models may struggle to emit valid pythonic tool calls"
+                    )
+                self.tool_parser = ToolParserManager.get_tool_parser(tool_parser)
             except Exception as e:
-                raise TypeError("Error: --enable-auto-tool-choice requires "
-                                f"tool_parser:'{tool_parser}' which has not "
-                                "been registered") from e
-        self.exclude_tools_when_tool_choice_none = (
-            exclude_tools_when_tool_choice_none)
+                raise TypeError(
+                    "Error: --enable-auto-tool-choice requires "
+                    f"tool_parser:'{tool_parser}' which has not "
+                    "been registered"
+                ) from e
+        self.exclude_tools_when_tool_choice_none = exclude_tools_when_tool_choice_none
 
         self.enable_prompt_tokens_details = enable_prompt_tokens_details
         self.enable_force_include_usage = enable_force_include_usage
-        self.default_sampling_params = (
-            self.model_config.get_diff_sampling_param())
+        self.default_sampling_params = self.model_config.get_diff_sampling_param()
         if self.default_sampling_params:
             source = self.model_config.generation_config
             source = "model" if source == "auto" else source
-            logger.info("Using default chat sampling params from %s: %s",
-                        source, self.default_sampling_params)
-        if self.model_config.hf_config.model_type == 'kimi_k2':
-            self.tool_call_id_type = 'kimi_k2'
+            logger.info(
+                "Using default chat sampling params from %s: %s",
+                source,
+                self.default_sampling_params,
+            )
+        if self.model_config.hf_config.model_type == "kimi_k2":
+            self.tool_call_id_type = "kimi_k2"
         else:
-            self.tool_call_id_type = 'random'
+            self.tool_call_id_type = "random"
 
         self.use_harmony = model_config.hf_config.model_type == "gpt_oss"
         if self.use_harmony:
             if "stop_token_ids" not in self.default_sampling_params:
                 self.default_sampling_params["stop_token_ids"] = []
             self.default_sampling_params["stop_token_ids"].extend(
-                get_stop_tokens_for_assistant_actions())
+                get_stop_tokens_for_assistant_actions()
+            )
 
         # NOTE(woosuk): While OpenAI's chat completion API supports browsing
         # for some models, currently vLLM doesn't support it. Please use the
@@ -164,8 +191,7 @@ async def create_chat_completion(
         self,
         request: ChatCompletionRequest,
         raw_request: Optional[Request] = None,
-    ) -> Union[AsyncGenerator[str, None], ChatCompletionResponse,
-               ErrorResponse]:
+    ) -> Union[AsyncGenerator[str, None], ChatCompletionResponse, ErrorResponse]:
         """
         Chat Completion API similar to OpenAI's API.
 
@@ -186,7 +212,8 @@ async def create_chat_completion(
 
         try:
             lora_request = self._maybe_get_adapters(
-                request, supports_default_mm_loras=True)
+                request, supports_default_mm_loras=True
+            )
 
             model_name = self.models.model_name(lora_request)
 
@@ -202,20 +229,23 @@ async def create_chat_completion(
                 truncate_tool_call_ids(request)
                 validate_request_params(request)
 
-            if (request.tool_choice == "auto" and
-                    not (self.enable_auto_tools and tool_parser is not None)
-                    and not isinstance(tokenizer, MistralTokenizer)
-                    and not self.use_harmony):
+            if (
+                request.tool_choice == "auto"
+                and not (self.enable_auto_tools and tool_parser is not None)
+                and not isinstance(tokenizer, MistralTokenizer)
+                and not self.use_harmony
+            ):
                 # for hf tokenizers, "auto" tools requires
                 # --enable-auto-tool-choice and --tool-call-parser
                 return self.create_error_response(
-                    "\"auto\" tool choice requires "
+                    '"auto" tool choice requires '
                     "--enable-auto-tool-choice and --tool-call-parser to be set"
                 )
 
-            if (request.tools is None
-                    or (request.tool_choice == "none"
-                        and self.exclude_tools_when_tool_choice_none)):
+            if request.tools is None or (
+                request.tool_choice == "none"
+                and self.exclude_tools_when_tool_choice_none
+            ):
                 tool_dicts = None
             else:
                 tool_dicts = [tool.model_dump() for tool in request.tools]
@@ -225,8 +255,7 @@ async def create_chat_completion(
                 error_check_ret = self._validate_chat_template(
                     request_chat_template=request.chat_template,
                     chat_template_kwargs=request.chat_template_kwargs,
-                    trust_request_chat_template=self.
-                    trust_request_chat_template,
+                    trust_request_chat_template=self.trust_request_chat_template,
                 )
                 if error_check_ret is not None:
                     return error_check_ret
@@ -239,8 +268,7 @@ async def create_chat_completion(
                     tokenizer,
                     request.messages,
                     chat_template=request.chat_template or self.chat_template,
-                    chat_template_content_format=self.
-                    chat_template_content_format,
+                    chat_template_content_format=self.chat_template_content_format,
                     add_generation_prompt=request.add_generation_prompt,
                     continue_final_message=request.continue_final_message,
                     tool_dicts=tool_dicts,
@@ -256,13 +284,13 @@ async def create_chat_completion(
                     request_prompts,
                     engine_prompts,
                 ) = self._make_request_with_harmony(request)
-        except (ValueError, TypeError, RuntimeError,
-                jinja2.TemplateError) as e:
+        except (ValueError, TypeError, RuntimeError, jinja2.TemplateError) as e:
             logger.exception("Error in preprocessing prompt inputs")
             return self.create_error_response(f"{e} {e.__cause__}")
 
-        request_id = "chatcmpl-" \
-                     f"{self._base_request_id(raw_request, request.request_id)}"
+        request_id = (
+            f"chatcmpl-{self._base_request_id(raw_request, request.request_id)}"
+        )
 
         request_metadata = RequestResponseMetadata(request_id=request_id)
         if raw_request:
@@ -272,8 +300,7 @@ async def create_chat_completion(
         generators: list[AsyncGenerator[RequestOutput, None]] = []
         try:
             for i, engine_prompt in enumerate(engine_prompts):
-                prompt_text, _, _ = (self._get_prompt_components(
-                    request_prompts[i]))
+                prompt_text, _, _ = self._get_prompt_components(request_prompts[i])
 
                 if self.default_sampling_params is None:
                     self.default_sampling_params = {}
@@ -282,24 +309,33 @@ async def create_chat_completion(
                     max_model_len=self.max_model_len,
                     request=request,
                     input_length=len(engine_prompt["prompt_token_ids"]),
-                    default_sampling_params=self.default_sampling_params)
+                    default_sampling_params=self.default_sampling_params,
+                )
 
                 sampling_params: Union[SamplingParams, BeamSearchParams]
                 if request.use_beam_search:
                     sampling_params = request.to_beam_search_params(
-                        max_tokens, self.default_sampling_params)
+                        max_tokens, self.default_sampling_params
+                    )
                 else:
                     sampling_params = request.to_sampling_params(
-                        max_tokens, self.model_config.logits_processor_pattern,
-                        self.default_sampling_params)
+                        max_tokens,
+                        self.model_config.logits_processor_pattern,
+                        self.default_sampling_params,
+                    )
 
-                self._log_inputs(request_id,
-                                 request_prompts[i],
-                                 params=sampling_params,
-                                 lora_request=lora_request)
+                self._log_inputs(
+                    request_id,
+                    request_prompts[i],
+                    params=sampling_params,
+                    lora_request=lora_request,
+                )
 
-                trace_headers = (None if raw_request is None else await
-                                 self._get_trace_headers(raw_request.headers))
+                trace_headers = (
+                    None
+                    if raw_request is None
+                    else await self._get_trace_headers(raw_request.headers)
+                )
 
                 if isinstance(sampling_params, BeamSearchParams):
                     generator = self.engine_client.beam_search(
@@ -309,15 +345,14 @@ async def create_chat_completion(
                         lora_request=lora_request,
                     )
                 else:
-                    engine_request, tokenization_kwargs = (
-                        await self._process_inputs(
-                            request_id,
-                            engine_prompt,
-                            sampling_params,
-                            lora_request=lora_request,
-                            trace_headers=trace_headers,
-                            priority=request.priority,
-                        ))
+                    engine_request, tokenization_kwargs = await self._process_inputs(
+                        request_id,
+                        engine_prompt,
+                        sampling_params,
+                        lora_request=lora_request,
+                        trace_headers=trace_headers,
+                        priority=request.priority,
+                    )
 
                     generator = self.engine_client.generate(
                         engine_request,
@@ -336,7 +371,7 @@ async def create_chat_completion(
             return self.create_error_response(str(e))
 
         assert len(generators) == 1
-        result_generator, = generators
+        (result_generator,) = generators
 
         # Streaming response
         if request.stream:
@@ -348,12 +383,19 @@ async def create_chat_completion(
                 conversation,
                 tokenizer,
                 request_metadata,
-                enable_force_include_usage=self.enable_force_include_usage)
+                enable_force_include_usage=self.enable_force_include_usage,
+            )
 
         try:
             return await self.chat_completion_full_generator(
-                request, result_generator, request_id, model_name,
-                conversation, tokenizer, request_metadata)
+                request,
+                result_generator,
+                request_id,
+                model_name,
+                conversation,
+                tokenizer,
+                request_metadata,
+            )
         except ValueError as e:
             # TODO: Use a vllm-specific Validation Error
             return self.create_error_response(str(e))
@@ -364,7 +406,7 @@ def get_chat_request_role(self, request: ChatCompletionRequest) -> str:
         return request.messages[-1]["role"]
 
     @staticmethod
-    def _bracket_level(s: str, opening='{', closing='}') -> int:
+    def _bracket_level(s: str, opening="{", closing="}") -> int:
         """
         Calculate the current level of nested brackets in a given string.
         """
@@ -377,8 +419,7 @@ def _bracket_level(s: str, opening='{', closing='}') -> int:
         return level
 
     @staticmethod
-    def _filter_delta_text(delta_text: str,
-                           previous_text: str) -> tuple[str, bool]:
+    def _filter_delta_text(delta_text: str, previous_text: str) -> tuple[str, bool]:
         # remove last '},' of the tool definition stemming from the
         # "name"/"parameters" outer object or closing ']' of the tool list
         # count occurrences of opening and closing curly braces and
@@ -388,10 +429,10 @@ def _filter_delta_text(delta_text: str,
         bracket_level = OpenAIServingChat._bracket_level(previous_text)
         updated_delta, passed_zero = "", False
         for c in delta_text:
-            if c == '{':
+            if c == "{":
                 bracket_level += 1
                 passed_zero = bracket_level == 0
-            elif c == '}':
+            elif c == "}":
                 bracket_level -= 1
                 passed_zero = bracket_level == 0
 
@@ -399,7 +440,7 @@ def _filter_delta_text(delta_text: str,
                 updated_delta += c
             else:
                 # if a comma is reached at level 0 we can stop
-                if c == ',':
+                if c == ",":
                     break
         return updated_delta, passed_zero
 
@@ -409,7 +450,7 @@ def extract_tool_call_required_streaming(
         current_text: Optional[str],
         delta_text: str,
         function_name_returned: bool,
-        tool_call_idx: Optional[int] = None
+        tool_call_idx: Optional[int] = None,
     ) -> tuple[Optional[DeltaMessage], bool]:
         if current_text is None or current_text == "":
             # if the current text is empty, we cannot parse it
@@ -417,7 +458,7 @@ def extract_tool_call_required_streaming(
         try:
             obj = partial_json_parser.loads(current_text)
         except partial_json_parser.core.exceptions.MalformedJSON:
-            logger.debug('not enough tokens to parse into JSON yet')
+            logger.debug("not enough tokens to parse into JSON yet")
             obj = None
 
         # check if the current text is a valid array
@@ -428,60 +469,72 @@ def extract_tool_call_required_streaming(
             delta_message = None
         else:
             _, finishes_previous_tool = OpenAIServingChat._filter_delta_text(
-                delta_text, previous_text)
+                delta_text, previous_text
+            )
             # take the last tool call from the generated list
             current_tool_call = obj[-1]
 
             # once parameters have been generated the name is complete as well
-            if not finishes_previous_tool and ("name" not in current_tool_call
-                                               or "parameters"
-                                               not in current_tool_call):
+            if not finishes_previous_tool and (
+                "name" not in current_tool_call or "parameters" not in current_tool_call
+            ):
                 function_name_returned = False
                 delta_message = None
             else:
                 if not function_name_returned:
                     # get partly generated arguments from the latest tool call
-                    param_match = re.search(r'.*"parameters":\s*(.*)',
-                                            current_text, re.DOTALL)
+                    param_match = re.search(
+                        r'.*"parameters":\s*(.*)', current_text, re.DOTALL
+                    )
                     arguments = param_match.group(1) if param_match else ""
                     arguments, _ = OpenAIServingChat._filter_delta_text(
-                        arguments, previous_text)
+                        arguments, previous_text
+                    )
 
                     # if this iteration finishes a previous tool call but a
                     # new incomplete tool is already generated, take the
                     # previous from the list
-                    if (finishes_previous_tool
-                            and "parameters" not in current_tool_call):
+                    if finishes_previous_tool and "parameters" not in current_tool_call:
                         current_tool_call = obj[-2]
 
                     function_name_returned = True
                     tool_call_id = make_tool_call_id(
                         id_type=self.tool_call_id_type,
                         func_name=current_tool_call["name"],
-                        idx=tool_call_idx)
-                    delta_message = DeltaMessage(tool_calls=[
-                        DeltaToolCall(id=tool_call_id,
-                                      function=DeltaFunctionCall(
-                                          name=current_tool_call["name"],
-                                          arguments=arguments),
-                                      index=len(obj) - 1,
-                                      type="function")
-                    ])
+                        idx=tool_call_idx,
+                    )
+                    delta_message = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                id=tool_call_id,
+                                function=DeltaFunctionCall(
+                                    name=current_tool_call["name"], arguments=arguments
+                                ),
+                                index=len(obj) - 1,
+                                type="function",
+                            )
+                        ]
+                    )
 
                 else:
                     delta_text, _ = OpenAIServingChat._filter_delta_text(
-                        delta_text, previous_text)
+                        delta_text, previous_text
+                    )
 
                     if delta_text != "":
-                        delta_message = DeltaMessage(tool_calls=[
-                            DeltaToolCall(
-                                function=DeltaFunctionCall(
-                                    # OpenAI API returns None
-                                    # instead of name every time
-                                    name=None,
-                                    arguments=delta_text),
-                                index=len(obj) - 1)
-                        ])
+                        delta_message = DeltaMessage(
+                            tool_calls=[
+                                DeltaToolCall(
+                                    function=DeltaFunctionCall(
+                                        # OpenAI API returns None
+                                        # instead of name every time
+                                        name=None,
+                                        arguments=delta_text,
+                                    ),
+                                    index=len(obj) - 1,
+                                )
+                            ]
+                        )
                     else:
                         delta_message = None
 
@@ -510,8 +563,7 @@ async def chat_completion_stream_generator(
         num_cached_tokens = None
         if self.use_harmony:
             harmony_parsers = [
-                get_streamable_parser_for_assistant()
-                for _ in range(num_choices)
+                get_streamable_parser_for_assistant() for _ in range(num_choices)
             ]
             harmony_tools_streamed = [False] * num_choices
         tools_streamed = [False] * num_choices
@@ -524,11 +576,12 @@ async def chat_completion_stream_generator(
         # Determine whether tools are in use with "auto" tool choice
         tool_choice_auto = (
             not tool_choice_function_name
-            and self._should_stream_with_auto_tool_parsing(request))
+            and self._should_stream_with_auto_tool_parsing(request)
+        )
 
         all_previous_token_ids: Optional[list[list[int]]]
         function_name_returned = [False] * num_choices
-        if self.tool_call_id_type == 'kimi_k2':
+        if self.tool_call_id_type == "kimi_k2":
             history_tool_call_cnt = get_history_tool_calls_cnt(conversation)
         else:
             history_tool_call_cnt = 0
@@ -575,10 +628,10 @@ async def chat_completion_stream_generator(
 
         stream_options = request.stream_options
         if stream_options:
-            include_usage = stream_options.include_usage \
-                            or enable_force_include_usage
-            include_continuous_usage = include_usage and \
-                                       stream_options.continuous_usage_stats
+            include_usage = stream_options.include_usage or enable_force_include_usage
+            include_continuous_usage = (
+                include_usage and stream_options.continuous_usage_stats
+            )
         else:
             include_usage, include_continuous_usage = False, False
 
@@ -608,7 +661,8 @@ async def chat_completion_stream_generator(
                                 content="",
                             ),
                             logprobs=None,
-                            finish_reason=None)
+                            finish_reason=None,
+                        )
 
                         # return prompt_token_ids at the first chunk ever
                         chunk = ChatCompletionStreamResponse(
@@ -617,16 +671,20 @@ async def chat_completion_stream_generator(
                             created=created_time,
                             choices=[choice_data],
                             model=model_name,
-                            prompt_token_ids=(res.prompt_token_ids
-                                              if request.return_token_ids else
-                                              None))
+                            prompt_token_ids=(
+                                res.prompt_token_ids
+                                if request.return_token_ids
+                                else None
+                            ),
+                        )
 
                         # if continuous usage stats are requested, add it
                         if include_continuous_usage:
                             chunk.usage = UsageInfo(
                                 prompt_tokens=num_prompt_tokens,
                                 completion_tokens=0,
-                                total_tokens=num_prompt_tokens)
+                                total_tokens=num_prompt_tokens,
+                            )
 
                         data = chunk.model_dump_json(exclude_unset=True)
                         yield f"data: {data}\n\n"
@@ -635,33 +693,36 @@ async def chat_completion_stream_generator(
                     # last message
                     if request.echo:
                         last_msg_content: Union[str, list[dict[str, str]]] = ""
-                        if conversation and "content" in conversation[
-                                -1] and conversation[-1].get("role") == role:
+                        if (
+                            conversation
+                            and "content" in conversation[-1]
+                            and conversation[-1].get("role") == role
+                        ):
                             last_msg_content = conversation[-1]["content"] or ""
 
                         if last_msg_content:
                             for i in range(num_choices):
-                                choice_data = (
-                                    ChatCompletionResponseStreamChoice(
-                                        index=i,
-                                        delta=DeltaMessage(
-                                            content=last_msg_content),
-                                        logprobs=None,
-                                        finish_reason=None))
+                                choice_data = ChatCompletionResponseStreamChoice(
+                                    index=i,
+                                    delta=DeltaMessage(content=last_msg_content),
+                                    logprobs=None,
+                                    finish_reason=None,
+                                )
                                 chunk = ChatCompletionStreamResponse(
                                     id=request_id,
                                     object=chunk_object_type,
                                     created=created_time,
                                     choices=[choice_data],
-                                    model=model_name)
+                                    model=model_name,
+                                )
                                 if include_continuous_usage:
                                     chunk.usage = UsageInfo(
                                         prompt_tokens=num_prompt_tokens,
                                         completion_tokens=0,
-                                        total_tokens=num_prompt_tokens)
+                                        total_tokens=num_prompt_tokens,
+                                    )
 
-                                data = chunk.model_dump_json(
-                                    exclude_unset=True)
+                                data = chunk.model_dump_json(exclude_unset=True)
                                 yield f"data: {data}\n\n"
                     first_iteration = False
 
@@ -673,15 +734,13 @@ async def chat_completion_stream_generator(
                         continue
 
                     if request.logprobs and request.top_logprobs is not None:
-                        assert output.logprobs is not None, (
-                            "Did not output logprobs")
+                        assert output.logprobs is not None, "Did not output logprobs"
                         logprobs = self._create_chat_logprobs(
                             token_ids=output.token_ids,
                             top_logprobs=output.logprobs,
                             tokenizer=tokenizer,
                             num_output_top_logprobs=request.top_logprobs,
-                            return_as_token_id=request.
-                            return_tokens_as_token_ids,
+                            return_as_token_id=request.return_tokens_as_token_ids,
                         )
                     else:
                         logprobs = None
@@ -692,15 +751,17 @@ async def chat_completion_stream_generator(
                         delta_text = ""
                         for token_id in output.token_ids:
                             harmony_parser.process(token_id)
-                            delta_text += (harmony_parser.last_content_delta
-                                           or "")
+                            delta_text += harmony_parser.last_content_delta or ""
                         cur_channel = harmony_parser.current_channel
                         cur_recipient = harmony_parser.current_recipient
                     else:
                         delta_text = output.text
 
-                    if not delta_text and not output.token_ids and \
-                        not previous_num_tokens[i]:
+                    if (
+                        not delta_text
+                        and not output.token_ids
+                        and not previous_num_tokens[i]
+                    ):
                         # Chunked prefill case, don't return empty chunks
                         continue
 
@@ -716,7 +777,8 @@ async def chat_completion_stream_generator(
                         # avoid the None + list error.
                         if previous_token_ids:
                             current_token_ids = previous_token_ids + as_list(
-                                output.token_ids)
+                                output.token_ids
+                            )
                         else:
                             current_token_ids = as_list(output.token_ids)
 
@@ -726,42 +788,51 @@ async def chat_completion_stream_generator(
                         elif cur_channel == "analysis":
                             if request.include_reasoning:
                                 delta_message = DeltaMessage(
-                                    reasoning_content=delta_text)
+                                    reasoning_content=delta_text
+                                )
                             else:
                                 delta_message = None
-                        elif (cur_channel == "commentary" and cur_recipient
-                              and cur_recipient.startswith("functions.")):
+                        elif (
+                            cur_channel == "commentary"
+                            and cur_recipient
+                            and cur_recipient.startswith("functions.")
+                        ):
                             # Count completed tool calls to determine index
                             base_index = 0
                             for msg in harmony_parser.messages:
-                                if (msg.channel == "commentary"
-                                        and msg.recipient
-                                        and msg.recipient.startswith(
-                                            "functions.")):
+                                if (
+                                    msg.channel == "commentary"
+                                    and msg.recipient
+                                    and msg.recipient.startswith("functions.")
+                                ):
                                     base_index += 1
 
                             if prev_recipient != cur_recipient:
-                                tool_name = cur_recipient.split(
-                                    "functions.", 1)[1]
-                                delta_message = DeltaMessage(tool_calls=[
-                                    DeltaToolCall(
-                                        id=make_tool_call_id(),
-                                        type="function",
-                                        function=DeltaFunctionCall(
-                                            name=tool_name,
-                                            arguments="",
-                                        ),
-                                        index=base_index,
-                                    )
-                                ])
+                                tool_name = cur_recipient.split("functions.", 1)[1]
+                                delta_message = DeltaMessage(
+                                    tool_calls=[
+                                        DeltaToolCall(
+                                            id=make_tool_call_id(),
+                                            type="function",
+                                            function=DeltaFunctionCall(
+                                                name=tool_name,
+                                                arguments="",
+                                            ),
+                                            index=base_index,
+                                        )
+                                    ]
+                                )
                             elif delta_text:
-                                delta_message = DeltaMessage(tool_calls=[
-                                    DeltaToolCall(
-                                        index=base_index,
-                                        function=DeltaFunctionCall(
-                                            arguments=delta_text),
-                                    )
-                                ])
+                                delta_message = DeltaMessage(
+                                    tool_calls=[
+                                        DeltaToolCall(
+                                            index=base_index,
+                                            function=DeltaFunctionCall(
+                                                arguments=delta_text
+                                            ),
+                                        )
+                                    ]
+                                )
                             else:
                                 delta_message = None
 
@@ -771,30 +842,37 @@ async def chat_completion_stream_generator(
                             delta_message = None
                     # handle streaming deltas for tools with named tool_choice
                     elif tool_choice_function_name:
-                        if (self.reasoning_parser and not reasoning_end_arr[i]
-                                and not reasoning_parser.is_reasoning_end(
-                                    previous_token_ids)):
+                        if (
+                            self.reasoning_parser
+                            and not reasoning_end_arr[i]
+                            and not reasoning_parser.is_reasoning_end(
+                                previous_token_ids
+                            )
+                        ):
                             assert reasoning_parser is not None
                             delta_message = (
-                                reasoning_parser.
-                                extract_reasoning_content_streaming(
+                                reasoning_parser.extract_reasoning_content_streaming(
                                     previous_text,
                                     current_text,
                                     delta_text,
                                     previous_token_ids,
                                     current_token_ids,
                                     output.token_ids,
-                                ))
+                                )
+                            )
                             # When encountering think end id in delta_token_ids
                             # or think end id in prompt_token_ids
                             # i.e {"enable_thinking": False},
                             # set reasoning status to end.
                             # Only keep 'content', remove 'reasoning_content'.
                             if reasoning_parser.is_reasoning_end(
-                                    as_list(output.token_ids)) or (
-                                        res.prompt_token_ids
-                                        and reasoning_parser.is_reasoning_end(
-                                            res.prompt_token_ids)):
+                                as_list(output.token_ids)
+                            ) or (
+                                res.prompt_token_ids
+                                and reasoning_parser.is_reasoning_end(
+                                    res.prompt_token_ids
+                                )
+                            ):
                                 reasoning_end_arr[i] = True
                                 if delta_message and delta_message.content:
                                     # This need to be added to next `delta_text`
@@ -810,22 +888,26 @@ async def chat_completion_stream_generator(
 
                             if function_name_returned[i]:
                                 delta_tool_call = DeltaToolCall(
-                                    function=DeltaFunctionCall(
-                                        arguments=delta_text),
-                                    index=i)
+                                    function=DeltaFunctionCall(arguments=delta_text),
+                                    index=i,
+                                )
                             else:
                                 delta_tool_call = DeltaToolCall(
                                     id=make_tool_call_id(),
                                     type="function",
                                     function=DeltaFunctionCall(
                                         name=tool_choice_function_name,
-                                        arguments=delta_text),
-                                    index=i)
+                                        arguments=delta_text,
+                                    ),
+                                    index=i,
+                                )
                                 function_name_returned[i] = True
 
-                            delta_message = DeltaMessage(tool_calls=[
-                                delta_tool_call,
-                            ])
+                            delta_message = DeltaMessage(
+                                tool_calls=[
+                                    delta_tool_call,
+                                ]
+                            )
                             tools_streamed[i] = True
 
                     elif request.tool_choice == "required":
@@ -835,11 +917,9 @@ async def chat_completion_stream_generator(
                         fn_name_returned = function_name_returned[i]
 
                         if self.reasoning_parser:
-                            _, content = \
-                                reasoning_parser.extract_reasoning_content(
-                                    current_text,
-                                    request
-                                )
+                            _, content = reasoning_parser.extract_reasoning_content(
+                                current_text, request
+                            )
                         else:
                             content = current_text
                         delta_message, function_name_returned[i] = (
@@ -848,9 +928,14 @@ async def chat_completion_stream_generator(
                                 current_text=content,
                                 delta_text=delta_text,
                                 function_name_returned=fn_name_returned,
-                                tool_call_idx=history_tool_call_cnt))
-                        if (delta_message and delta_message.tool_calls and
-                                delta_message.tool_calls[0].id is not None):
+                                tool_call_idx=history_tool_call_cnt,
+                            )
+                        )
+                        if (
+                            delta_message
+                            and delta_message.tool_calls
+                            and delta_message.tool_calls[0].id is not None
+                        ):
                             history_tool_call_cnt += 1
                             tools_streamed[i] = True
 
@@ -864,23 +949,26 @@ async def chat_completion_stream_generator(
                         output_token_ids = as_list(output.token_ids)
                         if not reasoning_end_arr[i]:
                             delta_message = (
-                                reasoning_parser.
-                                extract_reasoning_content_streaming(
+                                reasoning_parser.extract_reasoning_content_streaming(
                                     previous_text,
                                     current_text,
                                     delta_text,
                                     previous_token_ids,
                                     current_token_ids,
                                     output_token_ids,
-                                ))
+                                )
+                            )
                             # When encountering think end id in prompt_token_ids
                             # i.e {"enable_thinking": False},
                             # set reasoning status to end.
                             # Remove the text and token ids related
                             # to 'reasoning_content'.
-                            if res.prompt_token_ids and \
-                                reasoning_parser.is_reasoning_end(
-                                    res.prompt_token_ids):
+                            if (
+                                res.prompt_token_ids
+                                and reasoning_parser.is_reasoning_end(
+                                    res.prompt_token_ids
+                                )
+                            ):
                                 reasoning_end_arr[i] = True
                                 current_token_ids = output_token_ids
                                 if delta_message and delta_message.content:
@@ -892,12 +980,13 @@ async def chat_completion_stream_generator(
                             # set reasoning status to end.
                             # Remove the text and token ids related
                             # to 'reasoning_content'.
-                            if reasoning_parser.is_reasoning_end(
-                                    output_token_ids):
+                            if reasoning_parser.is_reasoning_end(output_token_ids):
                                 reasoning_end_arr[i] = True
-                                current_token_ids =  \
+                                current_token_ids = (
                                     reasoning_parser.extract_content_ids(
-                                        output_token_ids)
+                                        output_token_ids
+                                    )
+                                )
                                 if delta_message and delta_message.content:
                                     current_text = delta_message.content
                                     delta_message.content = None
@@ -917,50 +1006,52 @@ async def chat_completion_stream_generator(
                                 delta_text = current_text
                                 delta_token_ids = current_token_ids
 
-                            delta_message = (
-                                tool_parser.extract_tool_calls_streaming(
-                                    previous_text=previous_text,
-                                    current_text=current_text,
-                                    delta_text=delta_text,
-                                    previous_token_ids=previous_token_ids,
-                                    current_token_ids=current_token_ids,
-                                    delta_token_ids=delta_token_ids,
-                                    request=request))
-                            if delta_message and delta_message.tool_calls:
-                                tools_streamed[i] = True
-                    # when only tool calls
-                    elif tool_choice_auto:
-                        assert tool_parser is not None
-                        delta_message = (
-                            tool_parser.extract_tool_calls_streaming(
+                            delta_message = tool_parser.extract_tool_calls_streaming(
                                 previous_text=previous_text,
                                 current_text=current_text,
                                 delta_text=delta_text,
                                 previous_token_ids=previous_token_ids,
                                 current_token_ids=current_token_ids,
-                                delta_token_ids=output.token_ids,
-                                request=request))
+                                delta_token_ids=delta_token_ids,
+                                request=request,
+                            )
+                            if delta_message and delta_message.tool_calls:
+                                tools_streamed[i] = True
+                    # when only tool calls
+                    elif tool_choice_auto:
+                        assert tool_parser is not None
+                        delta_message = tool_parser.extract_tool_calls_streaming(
+                            previous_text=previous_text,
+                            current_text=current_text,
+                            delta_text=delta_text,
+                            previous_token_ids=previous_token_ids,
+                            current_token_ids=current_token_ids,
+                            delta_token_ids=output.token_ids,
+                            request=request,
+                        )
                         if delta_message and delta_message.tool_calls:
                             tools_streamed[i] = True
 
                     # when only reasoning
                     elif self.reasoning_parser:
-                        delta_message = (reasoning_parser.
-                                         extract_reasoning_content_streaming(
-                                             previous_text,
-                                             current_text,
-                                             delta_text,
-                                             previous_token_ids,
-                                             current_token_ids,
-                                             output.token_ids,
-                                         ))
+                        delta_message = (
+                            reasoning_parser.extract_reasoning_content_streaming(
+                                previous_text,
+                                current_text,
+                                delta_text,
+                                previous_token_ids,
+                                current_token_ids,
+                                output.token_ids,
+                            )
+                        )
                     # handle streaming just a content delta
                     else:
                         delta_message = DeltaMessage(content=delta_text)
 
                     # update the previous values for the next iteration
-                    if ((tool_choice_auto or self.reasoning_parser)
-                            and not self.use_harmony):
+                    if (
+                        tool_choice_auto or self.reasoning_parser
+                    ) and not self.use_harmony:
                         assert previous_texts is not None
                         assert all_previous_token_ids is not None
                         previous_texts[i] = current_text
@@ -992,7 +1083,8 @@ async def chat_completion_stream_generator(
                             delta_content = "".join(
                                 tc.function.arguments
                                 for tc in delta_message.tool_calls
-                                if tc.function and tc.function.arguments)
+                                if tc.function and tc.function.arguments
+                            )
 
                         if delta_content:
                             self.request_logger.log_outputs(
@@ -1011,8 +1103,12 @@ async def chat_completion_stream_generator(
                             delta=delta_message,
                             logprobs=logprobs,
                             finish_reason=None,
-                            token_ids=(as_list(output.token_ids)
-                                       if request.return_token_ids else None))
+                            token_ids=(
+                                as_list(output.token_ids)
+                                if request.return_token_ids
+                                else None
+                            ),
+                        )
 
                     # if the model is finished generating
                     else:
@@ -1022,66 +1118,86 @@ async def chat_completion_stream_generator(
                         # only happens if we are NOT using structured outputs
                         auto_tools_called = False
                         if tool_parser:
-                            auto_tools_called = len(
-                                tool_parser.prev_tool_call_arr) > 0
-                            index = len(tool_parser.prev_tool_call_arr
-                                        ) - 1 if auto_tools_called else 0
+                            auto_tools_called = len(tool_parser.prev_tool_call_arr) > 0
+                            index = (
+                                len(tool_parser.prev_tool_call_arr) - 1
+                                if auto_tools_called
+                                else 0
+                            )
                         else:
                             index = 0
 
-                        if self._should_check_for_unstreamed_tool_arg_tokens(
-                                delta_message, output) and tool_parser:
+                        if (
+                            self._should_check_for_unstreamed_tool_arg_tokens(
+                                delta_message, output
+                            )
+                            and tool_parser
+                        ):
                             latest_delta_len = 0
-                            if ((isinstance(
+                            if (
+                                isinstance(
                                     delta_message.tool_calls[0].function,
-                                    DeltaFunctionCall)) and isinstance(
-                                        delta_message.tool_calls[0].function.
-                                        arguments, str)):
+                                    DeltaFunctionCall,
+                                )
+                            ) and isinstance(
+                                delta_message.tool_calls[0].function.arguments, str
+                            ):
                                 latest_delta_len = len(
-                                    delta_message.tool_calls[0].function.
-                                    arguments)
+                                    delta_message.tool_calls[0].function.arguments
+                                )
 
                             # get the expected call based on partial JSON
                             # parsing which "autocompletes" the JSON
                             expected_call = json.dumps(
                                 tool_parser.prev_tool_call_arr[index].get(
-                                    "arguments", {}),
-                                ensure_ascii=False)
+                                    "arguments", {}
+                                ),
+                                ensure_ascii=False,
+                            )
 
                             # get what we've streamed so far for arguments
                             # for the current tool
-                            actual_call = tool_parser.streamed_args_for_tool[
-                                index]
-                            if (latest_delta_len > 0):
+                            actual_call = tool_parser.streamed_args_for_tool[index]
+                            if latest_delta_len > 0:
                                 actual_call = actual_call[:-latest_delta_len]
 
                             # check to see if there's anything left to stream
-                            remaining_call = expected_call.replace(
-                                actual_call, "", 1)
+                            remaining_call = expected_call.replace(actual_call, "", 1)
                             # set that as a delta message
-                            delta_message = DeltaMessage(tool_calls=[
-                                DeltaToolCall(index=index,
-                                              function=DeltaFunctionCall(
-                                                  arguments=remaining_call).
-                                              model_dump(exclude_none=True))
-                            ])
+                            delta_message = DeltaMessage(
+                                tool_calls=[
+                                    DeltaToolCall(
+                                        index=index,
+                                        function=DeltaFunctionCall(
+                                            arguments=remaining_call
+                                        ).model_dump(exclude_none=True),
+                                    )
+                                ]
+                            )
 
                         # Send the finish response for each request.n only once
-                        if auto_tools_called or tools_streamed[i] or (
-                                self.use_harmony
-                                and harmony_tools_streamed[i]):
+                        if (
+                            auto_tools_called
+                            or tools_streamed[i]
+                            or (self.use_harmony and harmony_tools_streamed[i])
+                        ):
                             finish_reason_ = "tool_calls"
                         else:
-                            finish_reason_ = output.finish_reason \
-                                if output.finish_reason else "stop"
+                            finish_reason_ = (
+                                output.finish_reason if output.finish_reason else "stop"
+                            )
                         choice_data = ChatCompletionResponseStreamChoice(
                             index=i,
                             delta=delta_message,
                             logprobs=logprobs,
                             finish_reason=finish_reason_,
                             stop_reason=output.stop_reason,
-                            token_ids=(as_list(output.token_ids)
-                                       if request.return_token_ids else None))
+                            token_ids=(
+                                as_list(output.token_ids)
+                                if request.return_token_ids
+                                else None
+                            ),
+                        )
 
                         finish_reason_sent[i] = True
 
@@ -1090,7 +1206,8 @@ async def chat_completion_stream_generator(
                         object=chunk_object_type,
                         created=created_time,
                         choices=[choice_data],
-                        model=model_name)
+                        model=model_name,
+                    )
 
                     # handle usage stats if requested & if continuous
                     if include_continuous_usage:
@@ -1108,13 +1225,15 @@ async def chat_completion_stream_generator(
             # is sent, send the usage
             if include_usage:
                 completion_tokens = sum(previous_num_tokens)
-                final_usage = UsageInfo(prompt_tokens=num_prompt_tokens,
-                                        completion_tokens=completion_tokens,
-                                        total_tokens=num_prompt_tokens +
-                                        completion_tokens)
+                final_usage = UsageInfo(
+                    prompt_tokens=num_prompt_tokens,
+                    completion_tokens=completion_tokens,
+                    total_tokens=num_prompt_tokens + completion_tokens,
+                )
                 if self.enable_prompt_tokens_details and num_cached_tokens:
                     final_usage.prompt_tokens_details = PromptTokenUsageInfo(
-                        cached_tokens=num_cached_tokens)
+                        cached_tokens=num_cached_tokens
+                    )
 
                 final_usage_chunk = ChatCompletionStreamResponse(
                     id=request_id,
@@ -1122,9 +1241,11 @@ async def chat_completion_stream_generator(
                     created=created_time,
                     choices=[],
                     model=model_name,
-                    usage=final_usage)
-                final_usage_data = (final_usage_chunk.model_dump_json(
-                    exclude_unset=True, exclude_none=True))
+                    usage=final_usage,
+                )
+                final_usage_data = final_usage_chunk.model_dump_json(
+                    exclude_unset=True, exclude_none=True
+                )
                 yield f"data: {final_usage_data}\n\n"
 
             # report to FastAPI middleware aggregate usage across all choices
@@ -1141,14 +1262,13 @@ async def chat_completion_stream_generator(
                 for i in range(num_choices):
                     full_text = (
                         previous_texts[i]
-                        if previous_texts and i < len(previous_texts) else
-                        f"<streaming_complete: {previous_num_tokens[i]} tokens>"
+                        if previous_texts and i < len(previous_texts)
+                        else f"<streaming_complete: {previous_num_tokens[i]} tokens>"
                     )
                     self.request_logger.log_outputs(
                         request_id=request_id,
                         outputs=full_text,
-                        output_token_ids=
-                        None,  # Consider also logging all token IDs
+                        output_token_ids=None,  # Consider also logging all token IDs
                         finish_reason="streaming_complete",
                         is_streaming=True,
                         delta=False,
@@ -1172,7 +1292,6 @@ async def chat_completion_full_generator(
         tokenizer: AnyTokenizer,
         request_metadata: RequestResponseMetadata,
     ) -> Union[ErrorResponse, ChatCompletionResponse]:
-
         created_time = int(time.time())
         final_res: Optional[RequestOutput] = None
 
@@ -1188,7 +1307,7 @@ async def chat_completion_full_generator(
         assert final_res is not None
 
         choices: list[ChatCompletionResponseChoice] = []
-        if self.tool_call_id_type == 'kimi_k2':
+        if self.tool_call_id_type == "kimi_k2":
             history_tool_call_cnt = get_history_tool_calls_cnt(conversation)
         else:
             history_tool_call_cnt = 0
@@ -1242,10 +1361,11 @@ async def chat_completion_full_generator(
                     index=output.index,
                     message=message,
                     logprobs=logprobs,
-                    finish_reason="tool_calls" if
-                    (tool_call_info is not None
-                     and tool_call_info.tools_called) else
-                    output.finish_reason if output.finish_reason else "stop",
+                    finish_reason="tool_calls"
+                    if (tool_call_info is not None and tool_call_info.tools_called)
+                    else output.finish_reason
+                    if output.finish_reason
+                    else "stop",
                     stop_reason=output.stop_reason,
                 )
                 choices.append(choice_data)
@@ -1259,9 +1379,9 @@ async def chat_completion_full_generator(
                     return self.create_error_response(str(e))
                 # If the reasoning parser is enabled,
                 # tool calls are extracted exclusively from the content.
-                reasoning_content, content = (
-                    reasoning_parser.extract_reasoning_content(
-                        output.text, request=request))
+                reasoning_content, content = reasoning_parser.extract_reasoning_content(
+                    output.text, request=request
+                )
                 if not request.include_reasoning:
                     reasoning_content = None
             else:
@@ -1271,76 +1391,93 @@ async def chat_completion_full_generator(
             auto_tools_called = False
             # if auto tools are not enabled, and a named tool choice using
             #   outlines is not being used
-            if (not self.enable_auto_tools or not self.tool_parser) and \
-                (not isinstance(request.tool_choice,
-                                ChatCompletionNamedToolChoiceParam
-                                ) and request.tool_choice != "required"):
-                message = ChatMessage(role=role,
-                                      reasoning_content=reasoning_content,
-                                      content=content)
+            if (not self.enable_auto_tools or not self.tool_parser) and (
+                not isinstance(request.tool_choice, ChatCompletionNamedToolChoiceParam)
+                and request.tool_choice != "required"
+            ):
+                message = ChatMessage(
+                    role=role, reasoning_content=reasoning_content, content=content
+                )
 
             # if the request uses tools and specified a tool choice
-            elif request.tool_choice and type(
-                    request.tool_choice) is ChatCompletionNamedToolChoiceParam:
-
-                tool_call_class = MistralToolCall if isinstance(
-                    tokenizer, MistralTokenizer) else ToolCall
+            elif (
+                request.tool_choice
+                and type(request.tool_choice) is ChatCompletionNamedToolChoiceParam
+            ):
+                tool_call_class = (
+                    MistralToolCall
+                    if isinstance(tokenizer, MistralTokenizer)
+                    else ToolCall
+                )
                 message = ChatMessage(
                     role=role,
                     reasoning_content=reasoning_content,
                     content="",
                     tool_calls=[
-                        tool_call_class(function=FunctionCall(
-                            name=request.tool_choice.function.name,
-                            arguments=content,
-                        ))
+                        tool_call_class(
+                            function=FunctionCall(
+                                name=request.tool_choice.function.name,
+                                arguments=content,
+                            )
+                        )
                     ],
                 )
 
             elif request.tool_choice and request.tool_choice == "required":
-                tool_call_class = MistralToolCall if isinstance(
-                    tokenizer, MistralTokenizer) else ToolCall
+                tool_call_class = (
+                    MistralToolCall
+                    if isinstance(tokenizer, MistralTokenizer)
+                    else ToolCall
+                )
 
                 # the fields of FunctionDefinition are a superset of the
                 # tool call outputs and can be used for parsing
                 assert content is not None
-                tool_calls = TypeAdapter(
-                    list[FunctionDefinition]).validate_json(content)
+                tool_calls = TypeAdapter(list[FunctionDefinition]).validate_json(
+                    content
+                )
                 tool_call_ids = []
                 for tool_call in tool_calls:
                     tool_call_ids.append(
-                        make_tool_call_id(id_type=self.tool_call_id_type,
-                                          func_name=tool_call.name,
-                                          idx=history_tool_call_cnt))
+                        make_tool_call_id(
+                            id_type=self.tool_call_id_type,
+                            func_name=tool_call.name,
+                            idx=history_tool_call_cnt,
+                        )
+                    )
                     history_tool_call_cnt += 1
                 message = ChatMessage(
                     role=role,
                     content="",
                     tool_calls=[
-                        tool_call_class(id=tool_call_ids[i],
-                                        function=FunctionCall(
-                                            name=tool_call.name,
-                                            arguments=json.dumps(
-                                                tool_call.parameters,
-                                                ensure_ascii=False)))
+                        tool_call_class(
+                            id=tool_call_ids[i],
+                            function=FunctionCall(
+                                name=tool_call.name,
+                                arguments=json.dumps(
+                                    tool_call.parameters, ensure_ascii=False
+                                ),
+                            ),
+                        )
                         for i, tool_call in enumerate(tool_calls)
                     ],
-                    reasoning_content=reasoning_content)
+                    reasoning_content=reasoning_content,
+                )
 
             # if the request doesn't use tool choice
             # OR specifies to not use a tool
             elif not request.tool_choice or request.tool_choice == "none":
-
-                message = ChatMessage(role=role,
-                                      reasoning_content=reasoning_content,
-                                      content=content)
+                message = ChatMessage(
+                    role=role, reasoning_content=reasoning_content, content=content
+                )
 
             # handle when there are tools and tool choice is auto
-            elif request.tools and (
-                    request.tool_choice == "auto"
-                    or request.tool_choice is None) and self.enable_auto_tools \
-                    and self.tool_parser:
-
+            elif (
+                request.tools
+                and (request.tool_choice == "auto" or request.tool_choice is None)
+                and self.enable_auto_tools
+                and self.tool_parser
+            ):
                 try:
                     tool_parser = self.tool_parser(tokenizer)
                 except RuntimeError as e:
@@ -1348,16 +1485,19 @@ async def chat_completion_full_generator(
                     return self.create_error_response(str(e))
 
                 tool_call_info = tool_parser.extract_tool_calls(
-                    content if content is not None else "", request=request)
+                    content if content is not None else "", request=request
+                )
                 # In the OpenAI API the finish_reason is "tools_called"
                 # if the tool choice is auto and the model produced a tool
                 # call. The same is not true for named function calls
                 auto_tools_called = tool_call_info.tools_called
                 if tool_call_info.tools_called:
-                    message = ChatMessage(role=role,
-                                          reasoning_content=reasoning_content,
-                                          content=tool_call_info.content,
-                                          tool_calls=tool_call_info.tool_calls)
+                    message = ChatMessage(
+                        role=role,
+                        reasoning_content=reasoning_content,
+                        content=tool_call_info.content,
+                        tool_calls=tool_call_info.tool_calls,
+                    )
 
                 else:
                     # FOR NOW make it a chat message; we will have to detect
@@ -1366,48 +1506,55 @@ async def chat_completion_full_generator(
 
                     # try to use content return from tool parser first,
                     # tool parser may do some modify for the content.
-                    if (tool_call_info.content
-                            and len(tool_call_info.content) > 0):
+                    if tool_call_info.content and len(tool_call_info.content) > 0:
                         ret_content = tool_call_info.content
-                    message = ChatMessage(role=role,
-                                          reasoning_content=reasoning_content,
-                                          content=ret_content)
+                    message = ChatMessage(
+                        role=role,
+                        reasoning_content=reasoning_content,
+                        content=ret_content,
+                    )
 
             # undetermined case that is still important to handle
             else:
                 logger.error(
                     "Error in chat_completion_full_generator - cannot determine"
                     " if tools should be extracted. Returning a standard chat "
-                    "completion.")
-                message = ChatMessage(role=role,
-                                      reasoning_content=reasoning_content,
-                                      content=content)
+                    "completion."
+                )
+                message = ChatMessage(
+                    role=role, reasoning_content=reasoning_content, content=content
+                )
 
             choice_data = ChatCompletionResponseChoice(
                 index=output.index,
                 message=message,
                 logprobs=logprobs,
-                finish_reason="tool_calls" if auto_tools_called else
-                output.finish_reason if output.finish_reason else "stop",
+                finish_reason="tool_calls"
+                if auto_tools_called
+                else output.finish_reason
+                if output.finish_reason
+                else "stop",
                 stop_reason=output.stop_reason,
-                token_ids=(as_list(output.token_ids)
-                           if request.return_token_ids else None),
+                token_ids=(
+                    as_list(output.token_ids) if request.return_token_ids else None
+                ),
             )
 
             choices.append(choice_data)
 
         if request.echo:
             last_msg_content: Union[str, list[dict[str, str]]] = ""
-            if (conversation and "content" in conversation[-1]
-                    and conversation[-1].get("role") == role):
+            if (
+                conversation
+                and "content" in conversation[-1]
+                and conversation[-1].get("role") == role
+            ):
                 last_msg_content = conversation[-1]["content"] or ""
             if isinstance(last_msg_content, list):
-                last_msg_content = "\n".join(msg['text']
-                                             for msg in last_msg_content)
+                last_msg_content = "\n".join(msg["text"] for msg in last_msg_content)
 
             for choice in choices:
-                full_message = last_msg_content + (choice.message.content
-                                                   or "")
+                full_message = last_msg_content + (choice.message.content or "")
                 choice.message.content = full_message
 
         assert final_res.prompt_token_ids is not None
@@ -1415,14 +1562,17 @@ async def chat_completion_full_generator(
         if final_res.encoder_prompt_token_ids is not None:
             num_prompt_tokens += len(final_res.encoder_prompt_token_ids)
         num_generated_tokens = sum(
-            len(output.token_ids) for output in final_res.outputs)
-        usage = UsageInfo(prompt_tokens=num_prompt_tokens,
-                          completion_tokens=num_generated_tokens,
-                          total_tokens=num_prompt_tokens +
-                          num_generated_tokens)
+            len(output.token_ids) for output in final_res.outputs
+        )
+        usage = UsageInfo(
+            prompt_tokens=num_prompt_tokens,
+            completion_tokens=num_generated_tokens,
+            total_tokens=num_prompt_tokens + num_generated_tokens,
+        )
         if self.enable_prompt_tokens_details and final_res.num_cached_tokens:
             usage.prompt_tokens_details = PromptTokenUsageInfo(
-                cached_tokens=final_res.num_cached_tokens)
+                cached_tokens=final_res.num_cached_tokens
+            )
 
         request_metadata.final_usage_info = usage
 
@@ -1433,8 +1583,9 @@ async def chat_completion_full_generator(
             choices=choices,
             usage=usage,
             prompt_logprobs=clamp_prompt_logprobs(final_res.prompt_logprobs),
-            prompt_token_ids=(final_res.prompt_token_ids
-                              if request.return_token_ids else None),
+            prompt_token_ids=(
+                final_res.prompt_token_ids if request.return_token_ids else None
+            ),
             kv_transfer_params=final_res.kv_transfer_params,
         )
 
@@ -1449,9 +1600,11 @@ async def chat_completion_full_generator(
                     tool_call_descriptions = []
                     for tc in choice.message.tool_calls:
                         if hasattr(tc.function, "name") and hasattr(
-                                tc.function, "arguments"):
+                            tc.function, "arguments"
+                        ):
                             tool_call_descriptions.append(
-                                f"{tc.function.name}({tc.function.arguments})")
+                                f"{tc.function.name}({tc.function.arguments})"
+                            )
                     tool_calls_str = ", ".join(tool_call_descriptions)
                     output_text = f"[tool_calls: {tool_calls_str}]"
 
@@ -1459,8 +1612,7 @@ async def chat_completion_full_generator(
                     # Get the corresponding output token IDs
                     output_token_ids = None
                     if choice.index < len(final_res.outputs):
-                        output_token_ids = final_res.outputs[
-                            choice.index].token_ids
+                        output_token_ids = final_res.outputs[choice.index].token_ids
 
                     self.request_logger.log_outputs(
                         request_id=request_id,
@@ -1474,20 +1626,26 @@ async def chat_completion_full_generator(
         return response
 
     def _get_top_logprobs(
-            self, logprobs: dict[int, Logprob], top_logprobs: Optional[int],
-            tokenizer: AnyTokenizer,
-            should_return_as_token_id: bool) -> list[ChatCompletionLogProb]:
+        self,
+        logprobs: dict[int, Logprob],
+        top_logprobs: Optional[int],
+        tokenizer: AnyTokenizer,
+        should_return_as_token_id: bool,
+    ) -> list[ChatCompletionLogProb]:
         return [
             ChatCompletionLogProb(
-                token=(token := self._get_decoded_token(
-                    p[1],
-                    p[0],
-                    tokenizer,
-                    return_as_token_id=should_return_as_token_id,
-                )),
+                token=(
+                    token := self._get_decoded_token(
+                        p[1],
+                        p[0],
+                        tokenizer,
+                        return_as_token_id=should_return_as_token_id,
+                    )
+                ),
                 logprob=max(p[1].logprob, -9999.0),
                 bytes=list(token.encode("utf-8", errors="replace")),
-            ) for i, p in enumerate(logprobs.items())
+            )
+            for i, p in enumerate(logprobs.items())
             if top_logprobs and i < top_logprobs
         ]
 
@@ -1502,12 +1660,14 @@ def _create_chat_logprobs(
         """Create OpenAI-style logprobs."""
         logprobs_content: list[ChatCompletionLogProbsContent] = []
 
-        should_return_as_token_id = return_as_token_id if \
-            return_as_token_id is not None else self.return_tokens_as_token_ids
+        should_return_as_token_id = (
+            return_as_token_id
+            if return_as_token_id is not None
+            else self.return_tokens_as_token_ids
+        )
         for i, token_id in enumerate(token_ids):
             step_top_logprobs = top_logprobs[i]
-            if step_top_logprobs is None or step_top_logprobs.get(
-                    token_id) is None:
+            if step_top_logprobs is None or step_top_logprobs.get(token_id) is None:
                 if should_return_as_token_id:
                     token = f"token_id:{token_id}"
                 else:
@@ -1517,7 +1677,8 @@ def _create_chat_logprobs(
                     ChatCompletionLogProbsContent(
                         token=token,
                         bytes=list(token.encode("utf-8", errors="replace")),
-                    ))
+                    )
+                )
             else:
                 step_token = step_top_logprobs[token_id]
                 step_decoded = step_token.decoded_token
@@ -1531,17 +1692,21 @@ def _create_chat_logprobs(
                             should_return_as_token_id,
                         ),
                         logprob=max(step_token.logprob, -9999.0),
-                        bytes=None if step_decoded is None else list(
-                            step_decoded.encode("utf-8", errors="replace")),
+                        bytes=None
+                        if step_decoded is None
+                        else list(step_decoded.encode("utf-8", errors="replace")),
                         top_logprobs=self._get_top_logprobs(
-                            step_top_logprobs, num_output_top_logprobs,
-                            tokenizer, should_return_as_token_id),
-                    ))
+                            step_top_logprobs,
+                            num_output_top_logprobs,
+                            tokenizer,
+                            should_return_as_token_id,
+                        ),
+                    )
+                )
 
         return ChatCompletionLogProbs(content=logprobs_content)
 
-    def _should_stream_with_auto_tool_parsing(self,
-                                              request: ChatCompletionRequest):
+    def _should_stream_with_auto_tool_parsing(self, request: ChatCompletionRequest):
         """
         Utility function to check if streamed tokens should go through the tool
         call parser that was configured.
@@ -1550,8 +1715,12 @@ def _should_stream_with_auto_tool_parsing(self,
         is configured, "auto" tool choice is enabled, and the request's tool
         choice field indicates that "auto" tool choice should be used.
         """
-        return (request.tools and self.tool_parser and self.enable_auto_tools
-                and request.tool_choice in ['auto', None])
+        return (
+            request.tools
+            and self.tool_parser
+            and self.enable_auto_tools
+            and request.tool_choice in ["auto", None]
+        )
 
     def _should_check_for_unstreamed_tool_arg_tokens(
         self,
@@ -1590,8 +1759,8 @@ def _make_request_with_harmony(
             reasoning_effort=request.reasoning_effort,
             browser_description=None,
             python_description=None,
-            with_custom_tools=request.tools is not None
-            )
+            with_custom_tools=request.tools is not None,
+        )
         messages.append(sys_msg)
 
         # Add developer message.
diff --git a/vllm/entrypoints/openai/serving_classification.py b/vllm/entrypoints/openai/serving_classification.py
index fc56668aeb1b..b37eb5c68a70 100644
--- a/vllm/entrypoints/openai/serving_classification.py
+++ b/vllm/entrypoints/openai/serving_classification.py
@@ -11,14 +11,20 @@
 from vllm.config import ModelConfig
 from vllm.engine.protocol import EngineClient
 from vllm.entrypoints.logger import RequestLogger
-from vllm.entrypoints.openai.protocol import (ClassificationData,
-                                              ClassificationRequest,
-                                              ClassificationResponse,
-                                              ErrorResponse, UsageInfo)
+from vllm.entrypoints.openai.protocol import (
+    ClassificationData,
+    ClassificationRequest,
+    ClassificationResponse,
+    ErrorResponse,
+    UsageInfo,
+)
+
 # yapf: enable
-from vllm.entrypoints.openai.serving_engine import (ClassificationServeContext,
-                                                    OpenAIServing,
-                                                    ServeContext)
+from vllm.entrypoints.openai.serving_engine import (
+    ClassificationServeContext,
+    OpenAIServing,
+    ServeContext,
+)
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
 from vllm.entrypoints.renderer import RenderConfig
 from vllm.logger import init_logger
@@ -29,7 +35,6 @@
 
 
 class ClassificationMixin(OpenAIServing):
-
     @override
     async def _preprocess(
         self,
@@ -55,7 +60,8 @@ async def _preprocess(
             renderer = self._get_renderer(ctx.tokenizer)
             ctx.engine_prompts = await renderer.render_prompt(
                 prompt_or_prompts=ctx.request.input,
-                config=self._build_render_config(ctx.request))
+                config=self._build_render_config(ctx.request),
+            )
 
             return None
 
@@ -76,16 +82,16 @@ def _build_response(
         items: list[ClassificationData] = []
         num_prompt_tokens = 0
 
-        final_res_batch_checked = cast(list[PoolingRequestOutput],
-                                       ctx.final_res_batch)
+        final_res_batch_checked = cast(list[PoolingRequestOutput], ctx.final_res_batch)
 
         for idx, final_res in enumerate(final_res_batch_checked):
             classify_res = ClassificationOutput.from_base(final_res.outputs)
 
             probs = classify_res.probs
             predicted_index = int(np.argmax(probs))
-            label = getattr(self.model_config.hf_config, "id2label",
-                            {}).get(predicted_index)
+            label = getattr(self.model_config.hf_config, "id2label", {}).get(
+                predicted_index
+            )
 
             item = ClassificationData(
                 index=idx,
@@ -111,11 +117,11 @@ def _build_response(
             usage=usage,
         )
 
-    def _build_render_config(self,
-                             request: ClassificationRequest) -> RenderConfig:
+    def _build_render_config(self, request: ClassificationRequest) -> RenderConfig:
         return RenderConfig(
             max_length=self.max_model_len,
-            truncate_prompt_tokens=request.truncate_prompt_tokens)
+            truncate_prompt_tokens=request.truncate_prompt_tokens,
+        )
 
 
 class ServingClassification(ClassificationMixin):
@@ -144,8 +150,7 @@ async def create_classify(
         raw_request: Request,
     ) -> Union[ClassificationResponse, ErrorResponse]:
         model_name = self.models.model_name()
-        request_id = (f"{self.request_id_prefix}-"
-                      f"{self._base_request_id(raw_request)}")
+        request_id = f"{self.request_id_prefix}-{self._base_request_id(raw_request)}"
 
         ctx = ClassificationServeContext(
             request=request,
diff --git a/vllm/entrypoints/openai/serving_completion.py b/vllm/entrypoints/openai/serving_completion.py
index d0756e42b796..8cd460657932 100644
--- a/vllm/entrypoints/openai/serving_completion.py
+++ b/vllm/entrypoints/openai/serving_completion.py
@@ -13,20 +13,23 @@
 from vllm.config import ModelConfig
 from vllm.engine.protocol import EngineClient
 from vllm.entrypoints.logger import RequestLogger
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.entrypoints.openai.protocol import (CompletionLogProbs,
-                                              CompletionRequest,
-                                              CompletionResponse,
-                                              CompletionResponseChoice,
-                                              CompletionResponseStreamChoice,
-                                              CompletionStreamResponse,
-                                              ErrorResponse,
-                                              PromptTokenUsageInfo,
-                                              RequestResponseMetadata,
-                                              UsageInfo)
-from vllm.entrypoints.openai.serving_engine import (OpenAIServing,
-                                                    clamp_prompt_logprobs)
+from vllm.entrypoints.openai.protocol import (
+    CompletionLogProbs,
+    CompletionRequest,
+    CompletionResponse,
+    CompletionResponseChoice,
+    CompletionResponseStreamChoice,
+    CompletionStreamResponse,
+    ErrorResponse,
+    PromptTokenUsageInfo,
+    RequestResponseMetadata,
+    UsageInfo,
+)
+from vllm.entrypoints.openai.serving_engine import OpenAIServing, clamp_prompt_logprobs
+
 # yapf: enable
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
 from vllm.entrypoints.renderer import RenderConfig
@@ -43,7 +46,6 @@
 
 
 class OpenAIServingCompletion(OpenAIServing):
-
     def __init__(
         self,
         engine_client: EngineClient,
@@ -66,8 +68,7 @@ def __init__(
             log_error_stack=log_error_stack,
         )
         self.enable_prompt_tokens_details = enable_prompt_tokens_details
-        self.default_sampling_params = (
-            self.model_config.get_diff_sampling_param())
+        self.default_sampling_params = self.model_config.get_diff_sampling_param()
         if self.default_sampling_params:
             source = self.model_config.generation_config
             source = "model" if source == "auto" else source
@@ -103,21 +104,17 @@ async def create_completion(
 
         # Return error for unsupported features.
         if request.suffix is not None:
-            return self.create_error_response(
-                "suffix is not currently supported")
+            return self.create_error_response("suffix is not currently supported")
 
         if request.echo and request.prompt_embeds is not None:
-            return self.create_error_response(
-                "Echo is unsupported with prompt embeds.")
+            return self.create_error_response("Echo is unsupported with prompt embeds.")
 
-        if (request.prompt_logprobs is not None
-                and request.prompt_embeds is not None):
+        if request.prompt_logprobs is not None and request.prompt_embeds is not None:
             return self.create_error_response(
-                "prompt_logprobs is not compatible with prompt embeds.")
+                "prompt_logprobs is not compatible with prompt embeds."
+            )
 
-        request_id = (
-            f"cmpl-"
-            f"{self._base_request_id(raw_request, request.request_id)}")
+        request_id = f"cmpl-{self._base_request_id(raw_request, request.request_id)}"
         created_time = int(time.time())
 
         request_metadata = RequestResponseMetadata(request_id=request_id)
@@ -156,7 +153,8 @@ async def create_completion(
         try:
             for i, engine_prompt in enumerate(engine_prompts):
                 prompt_text, prompt_token_ids, prompt_embeds = (
-                    self._get_prompt_components(engine_prompt))
+                    self._get_prompt_components(engine_prompt)
+                )
 
                 input_length = None
                 if prompt_token_ids is not None:
@@ -179,7 +177,8 @@ async def create_completion(
                 sampling_params: Union[SamplingParams, BeamSearchParams]
                 if request.use_beam_search:
                     sampling_params = request.to_beam_search_params(
-                        max_tokens, self.default_sampling_params)
+                        max_tokens, self.default_sampling_params
+                    )
                 else:
                     sampling_params = request.to_sampling_params(
                         max_tokens,
@@ -196,14 +195,16 @@ async def create_completion(
                     lora_request=lora_request,
                 )
 
-                trace_headers = (None if raw_request is None else await
-                                 self._get_trace_headers(raw_request.headers))
+                trace_headers = (
+                    None
+                    if raw_request is None
+                    else await self._get_trace_headers(raw_request.headers)
+                )
 
                 # Mypy inconsistently requires this second cast in different
                 # environments. It shouldn't be necessary (redundant from above)
                 # but pre-commit in CI fails without it.
-                engine_prompt = cast(Union[EmbedsPrompt, TokensPrompt],
-                                     engine_prompt)
+                engine_prompt = cast(Union[EmbedsPrompt, TokensPrompt], engine_prompt)
                 if isinstance(sampling_params, BeamSearchParams):
                     generator = self.engine_client.beam_search(
                         prompt=engine_prompt,
@@ -212,15 +213,14 @@ async def create_completion(
                         lora_request=lora_request,
                     )
                 else:
-                    engine_request, tokenization_kwargs = (
-                        await self._process_inputs(
-                            request_id_item,
-                            engine_prompt,
-                            sampling_params,
-                            lora_request=lora_request,
-                            trace_headers=trace_headers,
-                            priority=request.priority,
-                        ))
+                    engine_request, tokenization_kwargs = await self._process_inputs(
+                        request_id_item,
+                        engine_prompt,
+                        sampling_params,
+                        lora_request=lora_request,
+                        trace_headers=trace_headers,
+                        priority=request.priority,
+                    )
 
                     generator = self.engine_client.generate(
                         engine_request,
@@ -246,9 +246,11 @@ async def create_completion(
         # Similar to the OpenAI API, when n != best_of, we do not stream the
         # results. Noting that best_of is only supported in V0. In addition,
         # we do not stream the results when use beam search.
-        stream = (request.stream
-                  and (request.best_of is None or request.n == request.best_of)
-                  and not request.use_beam_search)
+        stream = (
+            request.stream
+            and (request.best_of is None or request.n == request.best_of)
+            and not request.use_beam_search
+        )
 
         # Streaming response
         if stream:
@@ -279,11 +281,13 @@ async def create_completion(
                 # with the inputs token IDs
                 if final_res.prompt is None:
                     engine_prompt = engine_prompts[i]
-                    final_res.prompt = None if is_embeds_prompt(
-                        engine_prompt) else engine_prompt.get("prompt")
+                    final_res.prompt = (
+                        None
+                        if is_embeds_prompt(engine_prompt)
+                        else engine_prompt.get("prompt")
+                    )
 
-            final_res_batch_checked = cast(list[RequestOutput],
-                                           final_res_batch)
+            final_res_batch_checked = cast(list[RequestOutput], final_res_batch)
 
             response = self.request_output_to_completion_response(
                 final_res_batch_checked,
@@ -336,10 +340,10 @@ async def completion_stream_generator(
 
         stream_options = request.stream_options
         if stream_options:
-            include_usage = (stream_options.include_usage
-                             or enable_force_include_usage)
-            include_continuous_usage = (include_usage and
-                                        stream_options.continuous_usage_stats)
+            include_usage = stream_options.include_usage or enable_force_include_usage
+            include_continuous_usage = (
+                include_usage and stream_options.continuous_usage_stats
+            )
         else:
             include_usage, include_continuous_usage = False, False
 
@@ -355,16 +359,18 @@ async def completion_stream_generator(
                 prompt_text = res.prompt
                 if prompt_text is None:
                     engine_prompt = engine_prompts[prompt_idx]
-                    prompt_text = None if is_embeds_prompt(
-                        engine_prompt) else engine_prompt.get("prompt")
+                    prompt_text = (
+                        None
+                        if is_embeds_prompt(engine_prompt)
+                        else engine_prompt.get("prompt")
+                    )
 
                 # Prompt details are excluded from later streamed outputs
                 if prompt_token_ids is not None:
                     num_prompt_tokens[prompt_idx] = len(prompt_token_ids)
 
                 delta_token_ids: GenericSequence[int]
-                out_logprobs: Optional[GenericSequence[Optional[dict[
-                    int, Logprob]]]]
+                out_logprobs: Optional[GenericSequence[Optional[dict[int, Logprob]]]]
 
                 for output in res.outputs:
                     i = output.index + prompt_idx * num_choices
@@ -410,22 +416,23 @@ async def completion_stream_generator(
                             prompt_token_ids_to_return = prompt_token_ids
                             has_echoed[i] = True
 
-                        if (not delta_text and not delta_token_ids
-                                and not previous_num_tokens[i]):
+                        if (
+                            not delta_text
+                            and not delta_token_ids
+                            and not previous_num_tokens[i]
+                        ):
                             # Chunked prefill case, don't return empty chunks
                             continue
 
                     if request.logprobs is not None:
-                        assert out_logprobs is not None, (
-                            "Did not output logprobs")
+                        assert out_logprobs is not None, "Did not output logprobs"
                         logprobs = self._create_completion_logprobs(
                             token_ids=delta_token_ids,
                             top_logprobs=out_logprobs,
                             num_output_top_logprobs=request.logprobs,
                             tokenizer=tokenizer,
                             initial_text_offset=previous_text_lens[i],
-                            return_as_token_id=request.
-                            return_tokens_as_token_ids,
+                            return_as_token_id=request.return_tokens_as_token_ids,
                         )
                     else:
                         logprobs = None
@@ -447,8 +454,11 @@ async def completion_stream_generator(
                                 finish_reason=finish_reason,
                                 stop_reason=stop_reason,
                                 prompt_token_ids=prompt_token_ids_to_return,
-                                token_ids=(as_list(output.token_ids) if
-                                           request.return_token_ids else None),
+                                token_ids=(
+                                    as_list(output.token_ids)
+                                    if request.return_token_ids
+                                    else None
+                                ),
                             )
                         ],
                     )
@@ -474,7 +484,8 @@ async def completion_stream_generator(
 
             if self.enable_prompt_tokens_details and num_cached_tokens:
                 final_usage_info.prompt_tokens_details = PromptTokenUsageInfo(
-                    cached_tokens=num_cached_tokens)
+                    cached_tokens=num_cached_tokens
+                )
 
             if include_usage:
                 final_usage_chunk = CompletionStreamResponse(
@@ -485,7 +496,8 @@ async def completion_stream_generator(
                     usage=final_usage_info,
                 )
                 final_usage_data = final_usage_chunk.model_dump_json(
-                    exclude_unset=False, exclude_none=True)
+                    exclude_unset=False, exclude_none=True
+                )
                 yield f"data: {final_usage_data}\n\n"
 
             # report to FastAPI middleware aggregate usage across all choices
@@ -520,8 +532,7 @@ def request_output_to_completion_response(
             prompt_text = final_res.prompt
 
             token_ids: GenericSequence[int]
-            out_logprobs: Optional[GenericSequence[Optional[dict[int,
-                                                                 Logprob]]]]
+            out_logprobs: Optional[GenericSequence[Optional[dict[int, Logprob]]]]
 
             for output in final_res.outputs:
                 assert request.max_tokens is not None
@@ -571,10 +582,12 @@ def request_output_to_completion_response(
                     finish_reason=output.finish_reason,
                     stop_reason=output.stop_reason,
                     prompt_logprobs=final_res.prompt_logprobs,
-                    prompt_token_ids=(prompt_token_ids
-                                      if request.return_token_ids else None),
-                    token_ids=(as_list(output.token_ids)
-                               if request.return_token_ids else None),
+                    prompt_token_ids=(
+                        prompt_token_ids if request.return_token_ids else None
+                    ),
+                    token_ids=(
+                        as_list(output.token_ids) if request.return_token_ids else None
+                    ),
                 )
                 choices.append(choice_data)
 
@@ -588,10 +601,14 @@ def request_output_to_completion_response(
             total_tokens=num_prompt_tokens + num_generated_tokens,
         )
 
-        if (self.enable_prompt_tokens_details and last_final_res
-                and last_final_res.num_cached_tokens):
+        if (
+            self.enable_prompt_tokens_details
+            and last_final_res
+            and last_final_res.num_cached_tokens
+        ):
             usage.prompt_tokens_details = PromptTokenUsageInfo(
-                cached_tokens=last_final_res.num_cached_tokens)
+                cached_tokens=last_final_res.num_cached_tokens
+            )
 
         request_metadata.final_usage_info = usage
         if final_res_batch:
@@ -622,9 +639,11 @@ def _create_completion_logprobs(
 
         last_token_len = 0
 
-        should_return_as_token_id = (return_as_token_id
-                                     if return_as_token_id is not None else
-                                     self.return_tokens_as_token_ids)
+        should_return_as_token_id = (
+            return_as_token_id
+            if return_as_token_id is not None
+            else self.return_tokens_as_token_ids
+        )
         for i, token_id in enumerate(token_ids):
             step_top_logprobs = top_logprobs[i]
             if step_top_logprobs is None:
@@ -653,19 +672,20 @@ def _create_completion_logprobs(
                 # logprobs, as defined in the openai API
                 # (cf. https://github.com/openai/openai-openapi/blob/
                 # 893ba52242dbd5387a97b96444ee1c742cfce9bd/openapi.yaml#L7153)
-                out_top_logprobs.append({
-                    # Convert float("-inf") to the
-                    # JSON-serializable float that OpenAI uses
-                    self._get_decoded_token(
-                        top_lp[1],
-                        top_lp[0],
-                        tokenizer,
-                        return_as_token_id=should_return_as_token_id,
-                    ):
-                    max(top_lp[1].logprob, -9999.0)
-                    for i, top_lp in enumerate(step_top_logprobs.items())
-                    if num_output_top_logprobs >= i
-                })
+                out_top_logprobs.append(
+                    {
+                        # Convert float("-inf") to the
+                        # JSON-serializable float that OpenAI uses
+                        self._get_decoded_token(
+                            top_lp[1],
+                            top_lp[0],
+                            tokenizer,
+                            return_as_token_id=should_return_as_token_id,
+                        ): max(top_lp[1].logprob, -9999.0)
+                        for i, top_lp in enumerate(step_top_logprobs.items())
+                        if num_output_top_logprobs >= i
+                    }
+                )
 
             if len(out_text_offset) == 0:
                 out_text_offset.append(initial_text_offset)
@@ -691,6 +711,5 @@ def _build_render_config(
             truncate_prompt_tokens=request.truncate_prompt_tokens,
             add_special_tokens=request.add_special_tokens,
             cache_salt=request.cache_salt,
-            needs_detokenization=bool(request.echo
-                                      and not request.return_token_ids),
+            needs_detokenization=bool(request.echo and not request.return_token_ids),
         )
diff --git a/vllm/entrypoints/openai/serving_embedding.py b/vllm/entrypoints/openai/serving_embedding.py
index 85493f121993..93c1f2548c31 100644
--- a/vllm/entrypoints/openai/serving_embedding.py
+++ b/vllm/entrypoints/openai/serving_embedding.py
@@ -14,25 +14,37 @@
 from vllm.engine.protocol import EngineClient
 from vllm.entrypoints.chat_utils import ChatTemplateContentFormatOption
 from vllm.entrypoints.logger import RequestLogger
+
 # yapf conflicts with isort for this docstring
 # yapf: disable
-from vllm.entrypoints.openai.protocol import (EmbeddingChatRequest,
-                                              EmbeddingCompletionRequest,
-                                              EmbeddingRequest,
-                                              EmbeddingResponse,
-                                              EmbeddingResponseData,
-                                              ErrorResponse, UsageInfo)
-from vllm.entrypoints.openai.serving_engine import (EmbeddingServeContext,
-                                                    OpenAIServing,
-                                                    ServeContext,
-                                                    TextTokensPrompt)
+from vllm.entrypoints.openai.protocol import (
+    EmbeddingChatRequest,
+    EmbeddingCompletionRequest,
+    EmbeddingRequest,
+    EmbeddingResponse,
+    EmbeddingResponseData,
+    ErrorResponse,
+    UsageInfo,
+)
+from vllm.entrypoints.openai.serving_engine import (
+    EmbeddingServeContext,
+    OpenAIServing,
+    ServeContext,
+    TextTokensPrompt,
+)
+
 # yapf: enable
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
 from vllm.entrypoints.renderer import RenderConfig
 from vllm.inputs.data import TokensPrompt as EngineTokensPrompt
 from vllm.logger import init_logger
-from vllm.outputs import (EmbeddingOutput, EmbeddingRequestOutput,
-                          PoolingOutput, PoolingRequestOutput, RequestOutput)
+from vllm.outputs import (
+    EmbeddingOutput,
+    EmbeddingRequestOutput,
+    PoolingOutput,
+    PoolingRequestOutput,
+    RequestOutput,
+)
 from vllm.pooling_params import PoolingParams
 from vllm.utils import chunk_list
 
@@ -55,7 +67,6 @@ def _get_embedding(
 
 
 class EmbeddingMixin(OpenAIServing):
-
     def __init__(self, *args, **kwargs):
         super().__init__(*args, **kwargs)
 
@@ -63,9 +74,13 @@ def __init__(self, *args, **kwargs):
 
         # Avoid repeated attribute lookups
         self.supports_chunked_processing = bool(
-            pooler_config and pooler_config.enable_chunked_processing)
-        self.max_embed_len = (pooler_config.max_embed_len if pooler_config
-                              and pooler_config.max_embed_len else None)
+            pooler_config and pooler_config.enable_chunked_processing
+        )
+        self.max_embed_len = (
+            pooler_config.max_embed_len
+            if pooler_config and pooler_config.max_embed_len
+            else None
+        )
 
     @override
     async def _preprocess(
@@ -88,10 +103,8 @@ async def _preprocess(
                     ctx.request,
                     tokenizer,
                     ctx.request.messages,
-                    chat_template=ctx.request.chat_template
-                    or ctx.chat_template,
-                    chat_template_content_format=ctx.
-                    chat_template_content_format,
+                    chat_template=ctx.request.chat_template or ctx.chat_template,
+                    chat_template_content_format=ctx.chat_template_content_format,
                     add_generation_prompt=ctx.request.add_generation_prompt,
                     continue_final_message=False,
                     add_special_tokens=ctx.request.add_special_tokens,
@@ -106,8 +119,7 @@ async def _preprocess(
             logger.exception("Error in preprocessing prompt inputs")
             return self.create_error_response(str(e))
 
-    def _build_render_config(
-            self, request: EmbeddingCompletionRequest) -> RenderConfig:
+    def _build_render_config(self, request: EmbeddingCompletionRequest) -> RenderConfig:
         # Set max_length based on chunked processing capability
         if self._should_use_chunked_processing(request):
             max_length = None
@@ -117,7 +129,8 @@ def _build_render_config(
         return RenderConfig(
             max_length=max_length,
             truncate_prompt_tokens=request.truncate_prompt_tokens,
-            add_special_tokens=request.add_special_tokens)
+            add_special_tokens=request.add_special_tokens,
+        )
 
     @override
     def _build_response(
@@ -127,16 +140,16 @@ def _build_response(
         items: list[EmbeddingResponseData] = []
         num_prompt_tokens = 0
 
-        final_res_batch_checked = cast(list[PoolingRequestOutput],
-                                       ctx.final_res_batch)
+        final_res_batch_checked = cast(list[PoolingRequestOutput], ctx.final_res_batch)
 
         for idx, final_res in enumerate(final_res_batch_checked):
             embedding_res = EmbeddingRequestOutput.from_base(final_res)
 
             item = EmbeddingResponseData(
                 index=idx,
-                embedding=_get_embedding(embedding_res.outputs,
-                                         ctx.request.encoding_format),
+                embedding=_get_embedding(
+                    embedding_res.outputs, ctx.request.encoding_format
+                ),
             )
             prompt_token_ids = final_res.prompt_token_ids
 
@@ -162,10 +175,10 @@ def _get_max_position_embeddings(self) -> int:
 
     def _should_use_chunked_processing(self, request) -> bool:
         """Check if chunked processing should be used for this request."""
-        return isinstance(
-            request,
-            (EmbeddingCompletionRequest,
-             EmbeddingChatRequest)) and self.supports_chunked_processing
+        return (
+            isinstance(request, (EmbeddingCompletionRequest, EmbeddingChatRequest))
+            and self.supports_chunked_processing
+        )
 
     async def _process_chunked_request(
         self,
@@ -183,25 +196,27 @@ async def _process_chunked_request(
         max_pos_embeddings = self._get_max_position_embeddings()
         # Process all chunks for MEAN aggregation
         for chunk_idx, chunk_tokens in enumerate(
-                chunk_list(token_ids, max_pos_embeddings)):
+            chunk_list(token_ids, max_pos_embeddings)
+        ):
             # Create a request ID for this chunk
-            chunk_request_id = (f"{ctx.request_id}-prompt-{prompt_idx}-"
-                                f"chunk-{chunk_idx}")
+            chunk_request_id = f"{ctx.request_id}-prompt-{prompt_idx}-chunk-{chunk_idx}"
 
             # Create engine prompt for this chunk
-            chunk_engine_prompt = EngineTokensPrompt(
-                prompt_token_ids=chunk_tokens)
+            chunk_engine_prompt = EngineTokensPrompt(prompt_token_ids=chunk_tokens)
 
             # Create chunk request prompt for logging
             chunk_text = ""
             chunk_request_prompt = TextTokensPrompt(
-                prompt=chunk_text, prompt_token_ids=chunk_tokens)
+                prompt=chunk_text, prompt_token_ids=chunk_tokens
+            )
 
             # Log the chunk
-            self._log_inputs(chunk_request_id,
-                             chunk_request_prompt,
-                             params=pooling_params,
-                             lora_request=ctx.lora_request)
+            self._log_inputs(
+                chunk_request_id,
+                chunk_request_prompt,
+                params=pooling_params,
+                lora_request=ctx.lora_request,
+            )
 
             # Create generator for this chunk and wrap it to return indices
             original_generator = self.engine_client.encode(
@@ -227,8 +242,7 @@ def _validate_input(
         token_num = len(input_ids)
 
         # Note: EmbeddingRequest doesn't have max_tokens
-        if isinstance(request,
-                      (EmbeddingCompletionRequest, EmbeddingChatRequest)):
+        if isinstance(request, (EmbeddingCompletionRequest, EmbeddingChatRequest)):
             # Check if chunked processing is enabled for pooling models
             enable_chunked = self._should_use_chunked_processing(request)
 
@@ -248,13 +262,15 @@ def _validate_input(
             validation_error_msg = (
                 "This model's {length_type} is {max_length_value} tokens. "
                 "However, you requested {token_num} tokens in the input for "
-                "embedding generation. Please reduce the length of the input.")
+                "embedding generation. Please reduce the length of the input."
+            )
 
             chunked_processing_error_msg = (
                 "This model's {length_type} is {max_length_value} tokens. "
                 "However, you requested {token_num} tokens in the input for "
                 "embedding generation. Please reduce the length of the input "
-                "or enable chunked processing.")
+                "or enable chunked processing."
+            )
 
             # Check if input exceeds max length
             if token_num > max_length_value:
@@ -262,7 +278,9 @@ def _validate_input(
                     validation_error_msg.format(
                         length_type=length_type,
                         max_length_value=max_length_value,
-                        token_num=token_num))
+                        token_num=token_num,
+                    )
+                )
 
             # Check for chunked processing
             # when exceeding max_position_embeddings
@@ -271,25 +289,31 @@ def _validate_input(
                     # Allow long inputs when chunked processing is enabled
                     logger.info(
                         "Input length %s exceeds max_position_embeddings "
-                        "%s, will use chunked processing", token_num,
-                        max_pos_embeddings)
+                        "%s, will use chunked processing",
+                        token_num,
+                        max_pos_embeddings,
+                    )
                 else:
                     raise ValueError(
                         chunked_processing_error_msg.format(
                             length_type="maximum position embeddings length",
                             max_length_value=max_pos_embeddings,
-                            token_num=token_num))
+                            token_num=token_num,
+                        )
+                    )
 
-            return TextTokensPrompt(prompt=input_text,
-                                    prompt_token_ids=input_ids)
+            return TextTokensPrompt(prompt=input_text, prompt_token_ids=input_ids)
 
         # For other request types, use the parent's implementation
         return super()._validate_input(request, input_ids, input_text)
 
     def _is_text_tokens_prompt(self, prompt) -> bool:
         """Check if a prompt is a TextTokensPrompt (has prompt_token_ids)."""
-        return (isinstance(prompt, dict) and "prompt_token_ids" in prompt
-                and "prompt_embeds" not in prompt)
+        return (
+            isinstance(prompt, dict)
+            and "prompt_token_ids" in prompt
+            and "prompt_embeds" not in prompt
+        )
 
     async def _create_single_prompt_generator(
         self,
@@ -302,10 +326,12 @@ async def _create_single_prompt_generator(
         """Create a generator for a single prompt using standard processing."""
         request_id_item = f"{ctx.request_id}-{prompt_index}"
 
-        self._log_inputs(request_id_item,
-                         engine_prompt,
-                         params=pooling_params,
-                         lora_request=ctx.lora_request)
+        self._log_inputs(
+            request_id_item,
+            engine_prompt,
+            params=pooling_params,
+            lora_request=ctx.lora_request,
+        )
 
         # Return the original generator without wrapping
         return self.engine_client.encode(
@@ -333,13 +359,16 @@ async def _prepare_generators(
             return await super()._prepare_generators(ctx)
 
         # Custom logic for chunked processing
-        generators: list[AsyncGenerator[Union[RequestOutput,
-                                              PoolingRequestOutput],
-                                        None]] = []
+        generators: list[
+            AsyncGenerator[Union[RequestOutput, PoolingRequestOutput], None]
+        ] = []
 
         try:
-            trace_headers = (None if ctx.raw_request is None else await
-                             self._get_trace_headers(ctx.raw_request.headers))
+            trace_headers = (
+                None
+                if ctx.raw_request is None
+                else await self._get_trace_headers(ctx.raw_request.headers)
+            )
 
             pooling_params = self._create_pooling_params(ctx)
             if isinstance(pooling_params, ErrorResponse):
@@ -352,8 +381,7 @@ async def _prepare_generators(
                 return self.create_error_response(str(e))
 
             if ctx.engine_prompts is None:
-                return self.create_error_response(
-                    "Engine prompts not available")
+                return self.create_error_response("Engine prompts not available")
 
             max_pos_embeddings = self._get_max_position_embeddings()
 
@@ -363,21 +391,22 @@ async def _prepare_generators(
                     # Cast to TextTokensPrompt since we've verified
                     # prompt_token_ids
                     text_tokens_prompt = cast(TextTokensPrompt, engine_prompt)
-                    if (len(text_tokens_prompt["prompt_token_ids"])
-                            > max_pos_embeddings):
+                    if len(text_tokens_prompt["prompt_token_ids"]) > max_pos_embeddings:
                         # Use chunked processing for this prompt
                         chunk_generators = await self._process_chunked_request(
-                            ctx, text_tokens_prompt, pooling_params,
-                            trace_headers, i)
+                            ctx, text_tokens_prompt, pooling_params, trace_headers, i
+                        )
                         generators.extend(chunk_generators)
                         continue
 
                 # Normal processing for short prompts or non-token prompts
                 generator = await self._create_single_prompt_generator(
-                    ctx, engine_prompt, pooling_params, trace_headers, i)
+                    ctx, engine_prompt, pooling_params, trace_headers, i
+                )
                 generators.append(generator)
 
             from vllm.utils import merge_async_iterators
+
             ctx.result_generator = merge_async_iterators(*generators)
 
             return None
@@ -401,8 +430,7 @@ async def _collect_batch(
         ctx = cast(EmbeddingServeContext, ctx)
         try:
             if ctx.engine_prompts is None:
-                return self.create_error_response(
-                    "Engine prompts not available")
+                return self.create_error_response("Engine prompts not available")
 
             # Check if we used chunked processing
             use_chunked = self._should_use_chunked_processing(ctx.request)
@@ -411,8 +439,7 @@ async def _collect_batch(
                 return await super()._collect_batch(ctx=ctx)
 
             if ctx.result_generator is None:
-                return self.create_error_response(
-                    "Result generator not available")
+                return self.create_error_response("Result generator not available")
 
             # Online aggregation for chunked requests to
             # minimize memory usage
@@ -433,10 +460,10 @@ async def _collect_batch(
                     # Initialize aggregator for this prompt if needed
                     if prompt_idx not in prompt_aggregators:
                         prompt_aggregators[prompt_idx] = {
-                            'weighted_sum': None,
-                            'total_weight': 0,
-                            'chunk_count': 0,
-                            'request_id': result.request_id.split("-chunk-")[0]
+                            "weighted_sum": None,
+                            "total_weight": 0,
+                            "chunk_count": 0,
+                            "request_id": result.request_id.split("-chunk-")[0],
                         }
 
                     aggregator = prompt_aggregators[prompt_idx]
@@ -448,44 +475,45 @@ async def _collect_batch(
                         return self.create_error_response(
                             f"Expected PoolingRequestOutput for "
                             f"chunked embedding, got "
-                            f"{type(result).__name__}")
+                            f"{type(result).__name__}"
+                        )
 
                     # Handle both PoolingOutput and
                     # EmbeddingOutput types
-                    if hasattr(result.outputs, 'data'):
+                    if hasattr(result.outputs, "data"):
                         # PoolingOutput case
                         embedding_data = result.outputs.data
-                    elif hasattr(result.outputs, 'embedding'):
+                    elif hasattr(result.outputs, "embedding"):
                         # EmbeddingOutput case -
                         # convert embedding list to tensor
                         embedding_data = result.outputs.embedding
                     else:
                         return self.create_error_response(
-                            f"Unsupported output type: "
-                            f"{type(result.outputs).__name__}")
+                            f"Unsupported output type: {type(result.outputs).__name__}"
+                        )
 
                     if not isinstance(embedding_data, torch.Tensor):
-                        embedding_data = torch.tensor(embedding_data,
-                                                      dtype=torch.float32)
+                        embedding_data = torch.tensor(
+                            embedding_data, dtype=torch.float32
+                        )
 
                     if result.prompt_token_ids is None:
                         return self.create_error_response(
-                            "prompt_token_ids cannot be None for "
-                            "chunked processing")
+                            "prompt_token_ids cannot be None for chunked processing"
+                        )
                     weight = len(result.prompt_token_ids)
 
-                    weighted_embedding = embedding_data.to(
-                        dtype=torch.float32) * weight
+                    weighted_embedding = embedding_data.to(dtype=torch.float32) * weight
 
-                    if aggregator['weighted_sum'] is None:
+                    if aggregator["weighted_sum"] is None:
                         # First chunk
-                        aggregator['weighted_sum'] = weighted_embedding
+                        aggregator["weighted_sum"] = weighted_embedding
                     else:
                         # Accumulate
-                        aggregator['weighted_sum'] += weighted_embedding
+                        aggregator["weighted_sum"] += weighted_embedding
 
-                    aggregator['total_weight'] += weight
-                    aggregator['chunk_count'] += 1
+                    aggregator["total_weight"] += weight
+                    aggregator["chunk_count"] += 1
                 else:
                     # Non-chunked result - extract prompt_idx from request_id
                     parts = result.request_id.split("-")
@@ -496,11 +524,13 @@ async def _collect_batch(
                         prompt_idx = result_idx  # Fallback to result_idx
 
                     short_prompts_results[prompt_idx] = cast(
-                        PoolingRequestOutput, result)
+                        PoolingRequestOutput, result
+                    )
 
             # Finalize aggregated results
-            final_res_batch: list[Union[PoolingRequestOutput,
-                                        EmbeddingRequestOutput]] = []
+            final_res_batch: list[
+                Union[PoolingRequestOutput, EmbeddingRequestOutput]
+            ] = []
             num_prompts = len(ctx.engine_prompts)
 
             for prompt_idx in range(num_prompts):
@@ -508,55 +538,57 @@ async def _collect_batch(
                     # Finalize MEAN aggregation for this chunked prompt
                     aggregator = prompt_aggregators[prompt_idx]
 
-                    weighted_sum = aggregator['weighted_sum']
-                    total_weight = aggregator['total_weight']
-
-                    if (weighted_sum is not None
-                            and isinstance(weighted_sum, torch.Tensor)
-                            and isinstance(total_weight,
-                                           (int, float)) and total_weight > 0):
+                    weighted_sum = aggregator["weighted_sum"]
+                    total_weight = aggregator["total_weight"]
 
+                    if (
+                        weighted_sum is not None
+                        and isinstance(weighted_sum, torch.Tensor)
+                        and isinstance(total_weight, (int, float))
+                        and total_weight > 0
+                    ):
                         # Compute final mean embedding
                         final_embedding = weighted_sum / total_weight
 
                         # Create a PoolingRequestOutput
                         # for the aggregated result
-                        pooling_output_data = PoolingOutput(
-                            data=final_embedding)
+                        pooling_output_data = PoolingOutput(data=final_embedding)
 
                         # Get original prompt token IDs for this prompt
                         original_prompt = ctx.engine_prompts[prompt_idx]
                         if not self._is_text_tokens_prompt(original_prompt):
                             return self.create_error_response(
-                                f"Chunked prompt {prompt_idx} is not a "
-                                f"TextTokensPrompt")
+                                f"Chunked prompt {prompt_idx} is not a TextTokensPrompt"
+                            )
 
-                        original_token_ids = cast(
-                            TextTokensPrompt,
-                            original_prompt)["prompt_token_ids"]
+                        original_token_ids = cast(TextTokensPrompt, original_prompt)[
+                            "prompt_token_ids"
+                        ]
 
                         pooling_request_output = PoolingRequestOutput(
-                            request_id=aggregator['request_id'],
+                            request_id=aggregator["request_id"],
                             prompt_token_ids=original_token_ids,
                             outputs=pooling_output_data,
-                            finished=True)
+                            finished=True,
+                        )
 
                         final_res_batch.append(pooling_request_output)
                     else:
                         return self.create_error_response(
-                            f"Failed to aggregate chunks "
-                            f"for prompt {prompt_idx}")
+                            f"Failed to aggregate chunks for prompt {prompt_idx}"
+                        )
                 elif prompt_idx in short_prompts_results:
                     final_res_batch.append(
-                        cast(PoolingRequestOutput,
-                             short_prompts_results[prompt_idx]))
+                        cast(PoolingRequestOutput, short_prompts_results[prompt_idx])
+                    )
                 else:
                     return self.create_error_response(
-                        f"Result not found for prompt {prompt_idx}")
+                        f"Result not found for prompt {prompt_idx}"
+                    )
 
             ctx.final_res_batch = cast(
-                list[Union[RequestOutput, PoolingRequestOutput]],
-                final_res_batch)
+                list[Union[RequestOutput, PoolingRequestOutput]], final_res_batch
+            )
 
             return None
 
@@ -579,11 +611,13 @@ def __init__(
         trust_request_chat_template: bool = False,
         log_error_stack: bool = False,
     ) -> None:
-        super().__init__(engine_client=engine_client,
-                         model_config=model_config,
-                         models=models,
-                         request_logger=request_logger,
-                         log_error_stack=log_error_stack)
+        super().__init__(
+            engine_client=engine_client,
+            model_config=model_config,
+            models=models,
+            request_logger=request_logger,
+            log_error_stack=log_error_stack,
+        )
 
         self.chat_template = chat_template
         self.chat_template_content_format: Final = chat_template_content_format
@@ -603,7 +637,8 @@ async def create_embedding(
         model_name = self.models.model_name()
         request_id = (
             f"{self.request_id_prefix}-"
-            f"{self._base_request_id(raw_request, request.request_id)}")
+            f"{self._base_request_id(raw_request, request.request_id)}"
+        )
 
         ctx = EmbeddingServeContext(
             request=request,
diff --git a/vllm/entrypoints/openai/serving_engine.py b/vllm/entrypoints/openai/serving_engine.py
index 151888afd8da..27b9cac970d1 100644
--- a/vllm/entrypoints/openai/serving_engine.py
+++ b/vllm/entrypoints/openai/serving_engine.py
@@ -28,43 +28,51 @@
 import vllm.envs as envs
 from vllm.config import ModelConfig
 from vllm.engine.protocol import EngineClient
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.entrypoints.chat_utils import (ChatCompletionMessageParam,
-                                         ChatTemplateContentFormatOption,
-                                         ConversationMessage,
-                                         apply_hf_chat_template,
-                                         apply_mistral_chat_template,
-                                         parse_chat_messages_futures,
-                                         resolve_chat_template_content_format)
+from vllm.entrypoints.chat_utils import (
+    ChatCompletionMessageParam,
+    ChatTemplateContentFormatOption,
+    ConversationMessage,
+    apply_hf_chat_template,
+    apply_mistral_chat_template,
+    parse_chat_messages_futures,
+    resolve_chat_template_content_format,
+)
 from vllm.entrypoints.context import ConversationContext
 from vllm.entrypoints.logger import RequestLogger
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              ChatCompletionResponse,
-                                              ClassificationRequest,
-                                              ClassificationResponse,
-                                              CompletionRequest,
-                                              CompletionResponse,
-                                              DetokenizeRequest,
-                                              EmbeddingChatRequest,
-                                              EmbeddingCompletionRequest,
-                                              EmbeddingRequest,
-                                              EmbeddingResponse, ErrorInfo,
-                                              ErrorResponse,
-                                              IOProcessorRequest,
-                                              PoolingResponse, RerankRequest,
-                                              ResponsesRequest, ScoreRequest,
-                                              ScoreResponse,
-                                              TokenizeChatRequest,
-                                              TokenizeCompletionRequest,
-                                              TokenizeResponse,
-                                              TranscriptionRequest,
-                                              TranscriptionResponse,
-                                              TranslationRequest)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    ChatCompletionResponse,
+    ClassificationRequest,
+    ClassificationResponse,
+    CompletionRequest,
+    CompletionResponse,
+    DetokenizeRequest,
+    EmbeddingChatRequest,
+    EmbeddingCompletionRequest,
+    EmbeddingRequest,
+    EmbeddingResponse,
+    ErrorInfo,
+    ErrorResponse,
+    IOProcessorRequest,
+    PoolingResponse,
+    RerankRequest,
+    ResponsesRequest,
+    ScoreRequest,
+    ScoreResponse,
+    TokenizeChatRequest,
+    TokenizeCompletionRequest,
+    TokenizeResponse,
+    TranscriptionRequest,
+    TranscriptionResponse,
+    TranslationRequest,
+)
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
 from vllm.entrypoints.openai.tool_parsers import ToolParser
-from vllm.entrypoints.renderer import (BaseRenderer, CompletionRenderer,
-                                       RenderConfig)
+from vllm.entrypoints.renderer import BaseRenderer, CompletionRenderer, RenderConfig
+
 # yapf: enable
 from vllm.inputs.data import PromptType
 from vllm.inputs.data import TokensPrompt as EngineTokensPrompt
@@ -73,15 +81,25 @@
 from vllm.logprobs import Logprob, PromptLogprobs
 from vllm.lora.request import LoRARequest
 from vllm.multimodal import (  # noqa: F401 - Required to resolve Pydantic error in RequestProcessingMixin
-    MultiModalDataDict, MultiModalUUIDDict)
+    MultiModalDataDict,
+    MultiModalUUIDDict,
+)
 from vllm.outputs import PoolingRequestOutput, RequestOutput
 from vllm.pooling_params import PoolingParams
 from vllm.sampling_params import BeamSearchParams, SamplingParams
-from vllm.tracing import (contains_trace_headers, extract_trace_headers,
-                          log_tracing_disabled_warning)
+from vllm.tracing import (
+    contains_trace_headers,
+    extract_trace_headers,
+    log_tracing_disabled_warning,
+)
 from vllm.transformers_utils.tokenizer import AnyTokenizer, MistralTokenizer
-from vllm.utils import (AsyncMicrobatchTokenizer, is_list_of, make_async,
-                        merge_async_iterators, random_uuid)
+from vllm.utils import (
+    AsyncMicrobatchTokenizer,
+    is_list_of,
+    make_async,
+    merge_async_iterators,
+    random_uuid,
+)
 
 logger = init_logger(__name__)
 
@@ -95,8 +113,9 @@
     TokenizeCompletionRequest,
 ]
 
-ChatLikeRequest = Union[ChatCompletionRequest, EmbeddingChatRequest,
-                        TokenizeChatRequest]
+ChatLikeRequest = Union[
+    ChatCompletionRequest, EmbeddingChatRequest, TokenizeChatRequest
+]
 SpeechToTextRequest = Union[TranscriptionRequest, TranslationRequest]
 AnyRequest = Union[
     CompletionLikeRequest,
@@ -131,13 +150,19 @@ class EmbedsPrompt(TypedDict):
 
 
 def is_text_tokens_prompt(prompt: RequestPrompt) -> TypeIs[TextTokensPrompt]:
-    return (isinstance(prompt, dict) and "prompt_token_ids" in prompt
-            and "prompt_embeds" not in prompt)
+    return (
+        isinstance(prompt, dict)
+        and "prompt_token_ids" in prompt
+        and "prompt_embeds" not in prompt
+    )
 
 
 def is_embeds_prompt(prompt: RequestPrompt) -> TypeIs[EmbedsPrompt]:
-    return (isinstance(prompt, dict) and "prompt_token_ids" not in prompt
-            and "prompt_embeds" in prompt)
+    return (
+        isinstance(prompt, dict)
+        and "prompt_token_ids" not in prompt
+        and "prompt_embeds" in prompt
+    )
 
 
 RequestT = TypeVar("RequestT", bound=AnyRequest)
@@ -161,19 +186,21 @@ class ResponseGenerationMixin(BaseModel):
     managing result generators and final batch results.
     """
 
-    result_generator: Optional[AsyncGenerator[tuple[int, Union[
-        RequestOutput, PoolingRequestOutput]], None]] = None
+    result_generator: Optional[
+        AsyncGenerator[tuple[int, Union[RequestOutput, PoolingRequestOutput]], None]
+    ] = None
     final_res_batch: list[Union[RequestOutput, PoolingRequestOutput]] = Field(
-        default_factory=list)
+        default_factory=list
+    )
 
     model_config = ConfigDict(arbitrary_types_allowed=True)
 
 
 class ServeContext(
-        RequestProcessingMixin,
-        ResponseGenerationMixin,
-        BaseModel,
-        Generic[RequestT],
+    RequestProcessingMixin,
+    ResponseGenerationMixin,
+    BaseModel,
+    Generic[RequestT],
 ):
     # Shared across all requests
     request: RequestT
@@ -241,10 +268,10 @@ def __init__(
 
         self._tokenizer_executor = ThreadPoolExecutor(max_workers=1)
         self._apply_mistral_chat_template_async = make_async(
-            apply_mistral_chat_template, executor=self._tokenizer_executor)
+            apply_mistral_chat_template, executor=self._tokenizer_executor
+        )
 
-        self._async_tokenizer_pool: dict[AnyTokenizer,
-                                         AsyncMicrobatchTokenizer] = {}
+        self._async_tokenizer_pool: dict[AnyTokenizer, AsyncMicrobatchTokenizer] = {}
         self.log_error_stack = log_error_stack
 
     async def _get_processor(self) -> Processor:
@@ -265,7 +292,8 @@ def _get_renderer(self, tokenizer: Optional[AnyTokenizer]) -> BaseRenderer:
         return CompletionRenderer(
             model_config=self.model_config,
             tokenizer=tokenizer,
-            async_tokenizer_pool=self._async_tokenizer_pool)
+            async_tokenizer_pool=self._async_tokenizer_pool,
+        )
 
     def _build_render_config(
         self,
@@ -348,15 +376,17 @@ async def _pipeline(
         yield self._build_response(ctx)
 
     def _validate_request(self, ctx: ServeContext) -> Optional[ErrorResponse]:
-        truncate_prompt_tokens = getattr(ctx.request, "truncate_prompt_tokens",
-                                         None)
+        truncate_prompt_tokens = getattr(ctx.request, "truncate_prompt_tokens", None)
 
-        if (truncate_prompt_tokens is not None
-                and truncate_prompt_tokens > self.max_model_len):
+        if (
+            truncate_prompt_tokens is not None
+            and truncate_prompt_tokens > self.max_model_len
+        ):
             return self.create_error_response(
                 "truncate_prompt_tokens value is "
                 "greater than max_model_len."
-                " Please, select a smaller truncation size.")
+                " Please, select a smaller truncation size."
+            )
         return None
 
     def _create_pooling_params(
@@ -365,7 +395,8 @@ def _create_pooling_params(
     ) -> Union[PoolingParams, ErrorResponse]:
         if not hasattr(ctx.request, "to_pooling_params"):
             return self.create_error_response(
-                "Request type does not support pooling parameters")
+                "Request type does not support pooling parameters"
+            )
 
         return ctx.request.to_pooling_params()
 
@@ -374,21 +405,23 @@ async def _prepare_generators(
         ctx: ServeContext,
     ) -> Optional[ErrorResponse]:
         """Schedule the request and get the result generator."""
-        generators: list[AsyncGenerator[Union[RequestOutput,
-                                              PoolingRequestOutput],
-                                        None]] = []
+        generators: list[
+            AsyncGenerator[Union[RequestOutput, PoolingRequestOutput], None]
+        ] = []
 
         try:
-            trace_headers = (None if ctx.raw_request is None else await
-                             self._get_trace_headers(ctx.raw_request.headers))
+            trace_headers = (
+                None
+                if ctx.raw_request is None
+                else await self._get_trace_headers(ctx.raw_request.headers)
+            )
 
             pooling_params = self._create_pooling_params(ctx)
             if isinstance(pooling_params, ErrorResponse):
                 return pooling_params
 
             if ctx.engine_prompts is None:
-                return self.create_error_response(
-                    "Engine prompts not available")
+                return self.create_error_response("Engine prompts not available")
 
             for i, engine_prompt in enumerate(ctx.engine_prompts):
                 request_id_item = f"{ctx.request_id}-{i}"
@@ -426,28 +459,24 @@ async def _collect_batch(
         """Collect batch results from the result generator."""
         try:
             if ctx.engine_prompts is None:
-                return self.create_error_response(
-                    "Engine prompts not available")
+                return self.create_error_response("Engine prompts not available")
 
             num_prompts = len(ctx.engine_prompts)
-            final_res_batch: list[Optional[Union[RequestOutput,
-                                                 PoolingRequestOutput]]]
+            final_res_batch: list[Optional[Union[RequestOutput, PoolingRequestOutput]]]
             final_res_batch = [None] * num_prompts
 
             if ctx.result_generator is None:
-                return self.create_error_response(
-                    "Result generator not available")
+                return self.create_error_response("Result generator not available")
 
             async for i, res in ctx.result_generator:
                 final_res_batch[i] = res
 
             if None in final_res_batch:
                 return self.create_error_response(
-                    "Failed to generate results for all prompts")
+                    "Failed to generate results for all prompts"
+                )
 
-            ctx.final_res_batch = [
-                res for res in final_res_batch if res is not None
-            ]
+            ctx.final_res_batch = [res for res in final_res_batch if res is not None]
 
             return None
 
@@ -466,8 +495,9 @@ def create_error_response(
                 traceback.print_exc()
             else:
                 traceback.print_stack()
-        return ErrorResponse(error=ErrorInfo(
-            message=message, type=err_type, code=status_code.value))
+        return ErrorResponse(
+            error=ErrorInfo(message=message, type=err_type, code=status_code.value)
+        )
 
     def create_streaming_error_response(
         self,
@@ -476,9 +506,10 @@ def create_streaming_error_response(
         status_code: HTTPStatus = HTTPStatus.BAD_REQUEST,
     ) -> str:
         json_str = json.dumps(
-            self.create_error_response(message=message,
-                                       err_type=err_type,
-                                       status_code=status_code).model_dump())
+            self.create_error_response(
+                message=message, err_type=err_type, status_code=status_code
+            ).model_dump()
+        )
         return json_str
 
     async def _check_model(
@@ -491,12 +522,17 @@ async def _check_model(
             return None
         if request.model in self.models.lora_requests:
             return None
-        if (envs.VLLM_ALLOW_RUNTIME_LORA_UPDATING and request.model and
-            (load_result := await self.models.resolve_lora(request.model))):
+        if (
+            envs.VLLM_ALLOW_RUNTIME_LORA_UPDATING
+            and request.model
+            and (load_result := await self.models.resolve_lora(request.model))
+        ):
             if isinstance(load_result, LoRARequest):
                 return None
-            if (isinstance(load_result, ErrorResponse) and
-                    load_result.error.code == HTTPStatus.BAD_REQUEST.value):
+            if (
+                isinstance(load_result, ErrorResponse)
+                and load_result.error.code == HTTPStatus.BAD_REQUEST.value
+            ):
                 error_response = load_result
 
         return error_response or self.create_error_response(
@@ -506,7 +542,8 @@ async def _check_model(
         )
 
     def _get_active_default_mm_loras(
-            self, request: AnyRequest) -> Optional[LoRARequest]:
+        self, request: AnyRequest
+    ) -> Optional[LoRARequest]:
         """Determine if there are any active default multimodal loras."""
         # TODO: Currently this is only enabled for chat completions
         # to be better aligned with only being enabled for .generate
@@ -561,8 +598,11 @@ def _get_message_types(self, request: AnyRequest) -> set[str]:
             return message_types
 
         for message in request.messages:
-            if (isinstance(message, dict) and "content" in message
-                    and isinstance(message["content"], list)):
+            if (
+                isinstance(message, dict)
+                and "content" in message
+                and isinstance(message["content"], list)
+            ):
                 for content_dict in message["content"]:
                     if "type" in content_dict:
                         message_types.add(content_dict["type"].split("_")[0])
@@ -577,17 +617,18 @@ async def _normalize_prompt_text_to_input(
     ) -> TextTokensPrompt:
         async_tokenizer = self._get_async_tokenizer(tokenizer)
 
-        if (self.model_config.encoder_config is not None
-                and self.model_config.encoder_config.get(
-                    "do_lower_case", False)):
+        if (
+            self.model_config.encoder_config is not None
+            and self.model_config.encoder_config.get("do_lower_case", False)
+        ):
             prompt = prompt.lower()
 
-        truncate_prompt_tokens = getattr(request, "truncate_prompt_tokens",
-                                         None)
+        truncate_prompt_tokens = getattr(request, "truncate_prompt_tokens", None)
 
         if truncate_prompt_tokens is None:
             encoded = await async_tokenizer(
-                prompt, add_special_tokens=add_special_tokens)
+                prompt, add_special_tokens=add_special_tokens
+            )
         elif truncate_prompt_tokens < 0:
             # Negative means we cap at the model's max length
             encoded = await async_tokenizer(
@@ -615,13 +656,12 @@ async def _normalize_prompt_tokens_to_input(
         prompt_ids: list[int],
         tokenizer: Optional[AnyTokenizer],
     ) -> TextTokensPrompt:
-        truncate_prompt_tokens = getattr(request, "truncate_prompt_tokens",
-                                         None)
+        truncate_prompt_tokens = getattr(request, "truncate_prompt_tokens", None)
 
         if truncate_prompt_tokens is None:
             input_ids = prompt_ids
         elif truncate_prompt_tokens < 0:
-            input_ids = prompt_ids[-self.max_model_len:]
+            input_ids = prompt_ids[-self.max_model_len :]
         else:
             input_ids = prompt_ids[-truncate_prompt_tokens:]
 
@@ -644,7 +684,7 @@ def _validate_input(
         # Note: EmbeddingRequest, ClassificationRequest,
         # and ScoreRequest doesn't have max_tokens
         if isinstance(
-                request,
+            request,
             (
                 EmbeddingChatRequest,
                 EmbeddingCompletionRequest,
@@ -660,25 +700,22 @@ def _validate_input(
                     ScoreRequest: "score",
                     ClassificationRequest: "classification",
                 }
-                operation = operations.get(type(request),
-                                           "embedding generation")
+                operation = operations.get(type(request), "embedding generation")
                 raise ValueError(
                     f"This model's maximum context length is "
                     f"{self.max_model_len} tokens. However, you requested "
                     f"{token_num} tokens in the input for {operation}. "
-                    f"Please reduce the length of the input.")
-            return TextTokensPrompt(prompt=input_text,
-                                    prompt_token_ids=input_ids)
+                    f"Please reduce the length of the input."
+                )
+            return TextTokensPrompt(prompt=input_text, prompt_token_ids=input_ids)
 
         # Note: TokenizeRequest and DetokenizeRequest doesn't have max_tokens
         # and does not require model context length validation
         if isinstance(
-                request,
-            (TokenizeCompletionRequest, TokenizeChatRequest,
-             DetokenizeRequest),
+            request,
+            (TokenizeCompletionRequest, TokenizeChatRequest, DetokenizeRequest),
         ):
-            return TextTokensPrompt(prompt=input_text,
-                                    prompt_token_ids=input_ids)
+            return TextTokensPrompt(prompt=input_text, prompt_token_ids=input_ids)
 
         # chat completion endpoint supports max_completion_tokens
         if isinstance(request, ChatCompletionRequest):
@@ -694,16 +731,17 @@ def _validate_input(
                 f"This model's maximum context length is "
                 f"{self.max_model_len} tokens. However, your request has "
                 f"{token_num} input tokens. Please reduce the length of "
-                "the input messages.")
+                "the input messages."
+            )
 
-        if (max_tokens is not None
-                and token_num + max_tokens > self.max_model_len):
+        if max_tokens is not None and token_num + max_tokens > self.max_model_len:
             raise ValueError(
                 "'max_tokens' or 'max_completion_tokens' is too large: "
                 f"{max_tokens}. This model's maximum context length is "
                 f"{self.max_model_len} tokens and your request has "
                 f"{token_num} input tokens ({max_tokens} > {self.max_model_len}"
-                f" - {token_num}).")
+                f" - {token_num})."
+            )
 
         return TextTokensPrompt(prompt=input_text, prompt_token_ids=input_ids)
 
@@ -718,10 +756,10 @@ async def _tokenize_prompt_input_async(
         A simpler implementation that tokenizes a single prompt input.
         """
         async for result in self._tokenize_prompt_inputs_async(
-                request,
-                tokenizer,
+            request,
+            tokenizer,
             [prompt_input],
-                add_special_tokens=add_special_tokens,
+            add_special_tokens=add_special_tokens,
         ):
             return result
         raise ValueError("No results yielded from tokenization")
@@ -758,13 +796,17 @@ def _validate_chat_template(
         trust_request_chat_template: bool,
     ) -> Optional[ErrorResponse]:
         if not trust_request_chat_template and (
-                request_chat_template is not None or
-            (chat_template_kwargs
-             and chat_template_kwargs.get("chat_template") is not None)):
+            request_chat_template is not None
+            or (
+                chat_template_kwargs
+                and chat_template_kwargs.get("chat_template") is not None
+            )
+        ):
             return self.create_error_response(
                 "Chat template is passed with request, but "
                 "--trust-request-chat-template is not set. "
-                "Refused request with untrusted chat template.")
+                "Refused request with untrusted chat template."
+            )
         return None
 
     async def _preprocess_chat(
@@ -782,9 +824,9 @@ async def _preprocess_chat(
         tool_parser: Optional[Callable[[AnyTokenizer], ToolParser]] = None,
         add_special_tokens: bool = False,
     ) -> tuple[
-            list[ConversationMessage],
-            Sequence[RequestPrompt],
-            list[EngineTokensPrompt],
+        list[ConversationMessage],
+        Sequence[RequestPrompt],
+        list[EngineTokensPrompt],
     ]:
         model_config = self.model_config
 
@@ -834,8 +876,9 @@ async def _preprocess_chat(
         # tool parsing is done only if a tool_parser has been set and if
         # tool_choice is not "none" (if tool_choice is "none" but a tool_parser
         # is set, we want to prevent parsing a tool_call hallucinated by the LLM
-        should_parse_tools = tool_parser is not None and (hasattr(
-            request, "tool_choice") and request.tool_choice != "none")
+        should_parse_tools = tool_parser is not None and (
+            hasattr(request, "tool_choice") and request.tool_choice != "none"
+        )
 
         if should_parse_tools:
             if not isinstance(request, ChatCompletionRequest):
@@ -843,15 +886,17 @@ async def _preprocess_chat(
                 raise NotImplementedError(msg)
 
             request = tool_parser(tokenizer).adjust_request(  # type: ignore
-                request=request)
+                request=request
+            )
 
         if tokenizer is None:
             assert isinstance(request_prompt, str), (
                 "Prompt has to be a string",
                 "when the tokenizer is not initialised",
             )
-            prompt_inputs = TextTokensPrompt(prompt=request_prompt,
-                                             prompt_token_ids=[1])
+            prompt_inputs = TextTokensPrompt(
+                prompt=request_prompt, prompt_token_ids=[1]
+            )
         elif isinstance(request_prompt, str):
             prompt_inputs = await self._tokenize_prompt_input_async(
                 request,
@@ -862,14 +907,16 @@ async def _preprocess_chat(
         else:
             # For MistralTokenizer
             assert is_list_of(request_prompt, int), (
-                "Prompt has to be either a string or a list of token ids")
+                "Prompt has to be either a string or a list of token ids"
+            )
             prompt_inputs = TextTokensPrompt(
                 prompt=tokenizer.decode(request_prompt),
                 prompt_token_ids=request_prompt,
             )
 
         engine_prompt = EngineTokensPrompt(
-            prompt_token_ids=prompt_inputs["prompt_token_ids"])
+            prompt_token_ids=prompt_inputs["prompt_token_ids"]
+        )
         if mm_data is not None:
             engine_prompt["multi_modal_data"] = mm_data
 
@@ -896,9 +943,9 @@ async def _process_inputs(
     ) -> tuple[EngineCoreRequest, dict[str, Any]]:
         """Use the Processor to process inputs for AsyncLLM."""
         tokenization_kwargs: dict[str, Any] = {}
-        _validate_truncation_size(self.max_model_len,
-                                  params.truncate_prompt_tokens,
-                                  tokenization_kwargs)
+        _validate_truncation_size(
+            self.max_model_len, params.truncate_prompt_tokens, tokenization_kwargs
+        )
 
         processor = await self._get_processor()
         engine_request = processor.process_inputs(
@@ -933,14 +980,14 @@ async def _generate_with_builtin_tools(
                 lora_request=lora_request,
             )
             trace_headers = kwargs.get("trace_headers")
-            engine_request, tokenization_kwargs = (await self._process_inputs(
+            engine_request, tokenization_kwargs = await self._process_inputs(
                 request_id,
                 engine_prompt,
                 sampling_params,
                 lora_request=lora_request,
                 trace_headers=trace_headers,
                 priority=priority,
-            ))
+            )
 
             generator = self.engine_client.generate(
                 engine_request,
@@ -972,12 +1019,10 @@ async def _generate_with_builtin_tools(
             # Create inputs for the next turn.
             # Render the next prompt token ids.
             prompt_token_ids = context.render_for_completion()
-            engine_prompt = EngineTokensPrompt(
-                prompt_token_ids=prompt_token_ids)
+            engine_prompt = EngineTokensPrompt(prompt_token_ids=prompt_token_ids)
             request_prompt = prompt_token_ids
             # Update the sampling params.
-            sampling_params.max_tokens = self.max_model_len - len(
-                prompt_token_ids)
+            sampling_params.max_tokens = self.max_model_len - len(prompt_token_ids)
             # OPTIMIZATION
             priority = orig_priority - 1
 
@@ -994,15 +1039,13 @@ def _log_inputs(
         self,
         request_id: str,
         inputs: Union[RequestPrompt, PromptType],
-        params: Optional[Union[SamplingParams, PoolingParams,
-                               BeamSearchParams]],
+        params: Optional[Union[SamplingParams, PoolingParams, BeamSearchParams]],
         lora_request: Optional[LoRARequest],
     ) -> None:
         if self.request_logger is None:
             return
 
-        prompt, prompt_token_ids, prompt_embeds = (
-            self._get_prompt_components(inputs))
+        prompt, prompt_token_ids, prompt_embeds = self._get_prompt_components(inputs)
 
         self.request_logger.log_inputs(
             request_id,
@@ -1028,8 +1071,9 @@ async def _get_trace_headers(
         return None
 
     @staticmethod
-    def _base_request_id(raw_request: Optional[Request],
-                         default: Optional[str] = None) -> Optional[str]:
+    def _base_request_id(
+        raw_request: Optional[Request], default: Optional[str] = None
+    ) -> Optional[str]:
         """Pulls the request id to use from a header, if provided"""
         default = default or random_uuid()
         if raw_request is None:
@@ -1058,8 +1102,8 @@ def _is_model_supported(self, model_name: Optional[str]) -> bool:
 
 
 def clamp_prompt_logprobs(
-    prompt_logprobs: Union[PromptLogprobs,
-                           None], ) -> Union[PromptLogprobs, None]:
+    prompt_logprobs: Union[PromptLogprobs, None],
+) -> Union[PromptLogprobs, None]:
     if prompt_logprobs is None:
         return prompt_logprobs
 
diff --git a/vllm/entrypoints/openai/serving_models.py b/vllm/entrypoints/openai/serving_models.py
index a4efa0815b4e..d2a58a487a76 100644
--- a/vllm/entrypoints/openai/serving_models.py
+++ b/vllm/entrypoints/openai/serving_models.py
@@ -9,11 +9,15 @@
 
 from vllm.config import ModelConfig
 from vllm.engine.protocol import EngineClient
-from vllm.entrypoints.openai.protocol import (ErrorInfo, ErrorResponse,
-                                              LoadLoRAAdapterRequest,
-                                              ModelCard, ModelList,
-                                              ModelPermission,
-                                              UnloadLoRAAdapterRequest)
+from vllm.entrypoints.openai.protocol import (
+    ErrorInfo,
+    ErrorResponse,
+    LoadLoRAAdapterRequest,
+    ModelCard,
+    ModelList,
+    ModelPermission,
+    UnloadLoRAAdapterRequest,
+)
 from vllm.logger import init_logger
 from vllm.lora.request import LoRARequest
 from vllm.lora.resolver import LoRAResolver, LoRAResolverRegistry
@@ -65,10 +69,10 @@ def __init__(
         self.lora_id_counter = AtomicCounter(0)
 
         self.lora_resolvers: list[LoRAResolver] = []
-        for lora_resolver_name in LoRAResolverRegistry.get_supported_resolvers(
-        ):
+        for lora_resolver_name in LoRAResolverRegistry.get_supported_resolvers():
             self.lora_resolvers.append(
-                LoRAResolverRegistry.get_resolver(lora_resolver_name))
+                LoRAResolverRegistry.get_resolver(lora_resolver_name)
+            )
         self.lora_resolver_lock: dict[str, Lock] = defaultdict(Lock)
 
     async def init_static_loras(self):
@@ -77,10 +81,12 @@ async def init_static_loras(self):
         if self.static_lora_modules is None:
             return
         for lora in self.static_lora_modules:
-            load_request = LoadLoRAAdapterRequest(lora_path=lora.path,
-                                                  lora_name=lora.name)
+            load_request = LoadLoRAAdapterRequest(
+                lora_path=lora.path, lora_name=lora.name
+            )
             load_result = await self.load_lora_adapter(
-                request=load_request, base_model_name=lora.base_model_name)
+                request=load_request, base_model_name=lora.base_model_name
+            )
             if isinstance(load_result, ErrorResponse):
                 raise ValueError(load_result.error.message)
 
@@ -100,47 +106,48 @@ def model_name(self, lora_request: Optional[LoRARequest] = None) -> str:
         return self.base_model_paths[0].name
 
     async def show_available_models(self) -> ModelList:
-        """Show available models. This includes the base model and all 
+        """Show available models. This includes the base model and all
         adapters"""
         model_cards = [
-            ModelCard(id=base_model.name,
-                      max_model_len=self.max_model_len,
-                      root=base_model.model_path,
-                      permission=[ModelPermission()])
+            ModelCard(
+                id=base_model.name,
+                max_model_len=self.max_model_len,
+                root=base_model.model_path,
+                permission=[ModelPermission()],
+            )
             for base_model in self.base_model_paths
         ]
         lora_cards = [
-            ModelCard(id=lora.lora_name,
-                      root=lora.local_path,
-                      parent=lora.base_model_name if lora.base_model_name else
-                      self.base_model_paths[0].name,
-                      permission=[ModelPermission()])
+            ModelCard(
+                id=lora.lora_name,
+                root=lora.local_path,
+                parent=lora.base_model_name
+                if lora.base_model_name
+                else self.base_model_paths[0].name,
+                permission=[ModelPermission()],
+            )
             for lora in self.lora_requests.values()
         ]
         model_cards.extend(lora_cards)
         return ModelList(data=model_cards)
 
     async def load_lora_adapter(
-            self,
-            request: LoadLoRAAdapterRequest,
-            base_model_name: Optional[str] = None
+        self, request: LoadLoRAAdapterRequest, base_model_name: Optional[str] = None
     ) -> Union[ErrorResponse, str]:
         lora_name = request.lora_name
 
         # Ensure atomicity based on the lora name
         async with self.lora_resolver_lock[lora_name]:
-            error_check_ret = await self._check_load_lora_adapter_request(
-                request)
+            error_check_ret = await self._check_load_lora_adapter_request(request)
             if error_check_ret is not None:
                 return error_check_ret
 
             lora_path = request.lora_path
             unique_id = self.lora_id_counter.inc(1)
-            lora_request = LoRARequest(lora_name=lora_name,
-                                       lora_int_id=unique_id,
-                                       lora_path=lora_path)
-            if base_model_name is not None and self.is_base_model(
-                    base_model_name):
+            lora_request = LoRARequest(
+                lora_name=lora_name, lora_int_id=unique_id, lora_path=lora_path
+            )
+            if base_model_name is not None and self.is_base_model(base_model_name):
                 lora_request.base_model_name = base_model_name
 
             # Validate that the adapter can be loaded into the engine
@@ -154,24 +161,24 @@ async def load_lora_adapter(
                     error_type = "NotFoundError"
                     status_code = HTTPStatus.NOT_FOUND
 
-                return create_error_response(message=str(e),
-                                             err_type=error_type,
-                                             status_code=status_code)
+                return create_error_response(
+                    message=str(e), err_type=error_type, status_code=status_code
+                )
 
             self.lora_requests[lora_name] = lora_request
-            logger.info("Loaded new LoRA adapter: name '%s', path '%s'",
-                        lora_name, lora_path)
+            logger.info(
+                "Loaded new LoRA adapter: name '%s', path '%s'", lora_name, lora_path
+            )
             return f"Success: LoRA adapter '{lora_name}' added successfully."
 
     async def unload_lora_adapter(
-            self,
-            request: UnloadLoRAAdapterRequest) -> Union[ErrorResponse, str]:
+        self, request: UnloadLoRAAdapterRequest
+    ) -> Union[ErrorResponse, str]:
         lora_name = request.lora_name
 
         # Ensure atomicity based on the lora name
         async with self.lora_resolver_lock[lora_name]:
-            error_check_ret = await self._check_unload_lora_adapter_request(
-                request)
+            error_check_ret = await self._check_unload_lora_adapter_request(request)
             if error_check_ret is not None:
                 return error_check_ret
 
@@ -181,48 +188,49 @@ async def unload_lora_adapter(
             return f"Success: LoRA adapter '{lora_name}' removed successfully."
 
     async def _check_load_lora_adapter_request(
-            self, request: LoadLoRAAdapterRequest) -> Optional[ErrorResponse]:
+        self, request: LoadLoRAAdapterRequest
+    ) -> Optional[ErrorResponse]:
         # Check if both 'lora_name' and 'lora_path' are provided
         if not request.lora_name or not request.lora_path:
             return create_error_response(
                 message="Both 'lora_name' and 'lora_path' must be provided.",
                 err_type="InvalidUserInput",
-                status_code=HTTPStatus.BAD_REQUEST)
+                status_code=HTTPStatus.BAD_REQUEST,
+            )
 
         # Check if the lora adapter with the given name already exists
         if request.lora_name in self.lora_requests:
             return create_error_response(
-                message=
-                f"The lora adapter '{request.lora_name}' has already been "
+                message=f"The lora adapter '{request.lora_name}' has already been "
                 "loaded.",
                 err_type="InvalidUserInput",
-                status_code=HTTPStatus.BAD_REQUEST)
+                status_code=HTTPStatus.BAD_REQUEST,
+            )
 
         return None
 
     async def _check_unload_lora_adapter_request(
-            self,
-            request: UnloadLoRAAdapterRequest) -> Optional[ErrorResponse]:
+        self, request: UnloadLoRAAdapterRequest
+    ) -> Optional[ErrorResponse]:
         # Check if 'lora_name' is not provided return an error
         if not request.lora_name:
             return create_error_response(
-                message=
-                "'lora_name' needs to be provided to unload a LoRA adapter.",
+                message="'lora_name' needs to be provided to unload a LoRA adapter.",
                 err_type="InvalidUserInput",
-                status_code=HTTPStatus.BAD_REQUEST)
+                status_code=HTTPStatus.BAD_REQUEST,
+            )
 
         # Check if the lora adapter with the given name exists
         if request.lora_name not in self.lora_requests:
             return create_error_response(
-                message=
-                f"The lora adapter '{request.lora_name}' cannot be found.",
+                message=f"The lora adapter '{request.lora_name}' cannot be found.",
                 err_type="NotFoundError",
-                status_code=HTTPStatus.NOT_FOUND)
+                status_code=HTTPStatus.NOT_FOUND,
+            )
 
         return None
 
-    async def resolve_lora(
-            self, lora_name: str) -> Union[LoRARequest, ErrorResponse]:
+    async def resolve_lora(self, lora_name: str) -> Union[LoRARequest, ErrorResponse]:
         """Attempt to resolve a LoRA adapter using available resolvers.
 
         Args:
@@ -244,8 +252,7 @@ async def resolve_lora(
 
             # Try to resolve using available resolvers
             for resolver in self.lora_resolvers:
-                lora_request = await resolver.resolve_lora(
-                    base_model_name, lora_name)
+                lora_request = await resolver.resolve_lora(base_model_name, lora_name)
 
                 if lora_request is not None:
                     found_adapter = True
@@ -256,33 +263,43 @@ async def resolve_lora(
                         self.lora_requests[lora_name] = lora_request
                         logger.info(
                             "Resolved and loaded LoRA adapter '%s' using %s",
-                            lora_name, resolver.__class__.__name__)
+                            lora_name,
+                            resolver.__class__.__name__,
+                        )
                         return lora_request
                     except BaseException as e:
                         logger.warning(
                             "Failed to load LoRA '%s' resolved by %s: %s. "
-                            "Trying next resolver.", lora_name,
-                            resolver.__class__.__name__, e)
+                            "Trying next resolver.",
+                            lora_name,
+                            resolver.__class__.__name__,
+                            e,
+                        )
                         continue
 
             if found_adapter:
                 # An adapter was found, but all attempts to load it failed.
                 return create_error_response(
-                    message=(f"LoRA adapter '{lora_name}' was found "
-                             "but could not be loaded."),
+                    message=(
+                        f"LoRA adapter '{lora_name}' was found but could not be loaded."
+                    ),
                     err_type="BadRequestError",
-                    status_code=HTTPStatus.BAD_REQUEST)
+                    status_code=HTTPStatus.BAD_REQUEST,
+                )
             else:
                 # No adapter was found
                 return create_error_response(
                     message=f"LoRA adapter {lora_name} does not exist",
                     err_type="NotFoundError",
-                    status_code=HTTPStatus.NOT_FOUND)
+                    status_code=HTTPStatus.NOT_FOUND,
+                )
 
 
 def create_error_response(
-        message: str,
-        err_type: str = "BadRequestError",
-        status_code: HTTPStatus = HTTPStatus.BAD_REQUEST) -> ErrorResponse:
-    return ErrorResponse(error=ErrorInfo(
-        message=message, type=err_type, code=status_code.value))
+    message: str,
+    err_type: str = "BadRequestError",
+    status_code: HTTPStatus = HTTPStatus.BAD_REQUEST,
+) -> ErrorResponse:
+    return ErrorResponse(
+        error=ErrorInfo(message=message, type=err_type, code=status_code.value)
+    )
diff --git a/vllm/entrypoints/openai/serving_pooling.py b/vllm/entrypoints/openai/serving_pooling.py
index 3a41c2613624..457d6064325b 100644
--- a/vllm/entrypoints/openai/serving_pooling.py
+++ b/vllm/entrypoints/openai/serving_pooling.py
@@ -17,14 +17,20 @@
 from vllm.engine.protocol import EngineClient
 from vllm.entrypoints.chat_utils import ChatTemplateContentFormatOption
 from vllm.entrypoints.logger import RequestLogger
+
 # yapf: disable
-from vllm.entrypoints.openai.protocol import (ErrorResponse,
-                                              IOProcessorRequest,
-                                              IOProcessorResponse,
-                                              PoolingChatRequest,
-                                              PoolingCompletionRequest,
-                                              PoolingRequest, PoolingResponse,
-                                              PoolingResponseData, UsageInfo)
+from vllm.entrypoints.openai.protocol import (
+    ErrorResponse,
+    IOProcessorRequest,
+    IOProcessorResponse,
+    PoolingChatRequest,
+    PoolingCompletionRequest,
+    PoolingRequest,
+    PoolingResponse,
+    PoolingResponseData,
+    UsageInfo,
+)
+
 # yapf: enable
 from vllm.entrypoints.openai.serving_engine import OpenAIServing
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
@@ -55,7 +61,6 @@ def _get_data(
 
 
 class OpenAIServingPooling(OpenAIServing):
-
     def __init__(
         self,
         engine_client: EngineClient,
@@ -68,11 +73,13 @@ def __init__(
         trust_request_chat_template: bool = False,
         log_error_stack: bool = False,
     ) -> None:
-        super().__init__(engine_client=engine_client,
-                         model_config=vllm_config.model_config,
-                         models=models,
-                         request_logger=request_logger,
-                         log_error_stack=log_error_stack)
+        super().__init__(
+            engine_client=engine_client,
+            model_config=vllm_config.model_config,
+            models=models,
+            request_logger=request_logger,
+            log_error_stack=log_error_stack,
+        )
 
         self.chat_template = chat_template
         self.chat_template_content_format: Final = chat_template_content_format
@@ -110,12 +117,13 @@ async def create_pooling(
 
             if getattr(request, "dimensions", None) is not None:
                 return self.create_error_response(
-                    "dimensions is currently not supported")
+                    "dimensions is currently not supported"
+                )
 
-            truncate_prompt_tokens = getattr(request, "truncate_prompt_tokens",
-                                             None)
+            truncate_prompt_tokens = getattr(request, "truncate_prompt_tokens", None)
             truncate_prompt_tokens = _validate_truncation_size(
-                self.max_model_len, truncate_prompt_tokens)
+                self.max_model_len, truncate_prompt_tokens
+            )
 
             if is_io_processor_request:
                 if self.io_processor is None:
@@ -123,19 +131,20 @@ async def create_pooling(
                         "No IOProcessor plugin installed. Please refer "
                         "to the documentation and to the "
                         "'prithvi_geospatial_mae_io_processor' "
-                        "offline inference example for more details.")
+                        "offline inference example for more details."
+                    )
 
                 validated_prompt = self.io_processor.parse_request(request)
 
                 engine_prompts = await self.io_processor.pre_process_async(
-                    prompt=validated_prompt, request_id=request_id)
+                    prompt=validated_prompt, request_id=request_id
+                )
 
             elif isinstance(request, PoolingChatRequest):
                 error_check_ret = self._validate_chat_template(
                     request_chat_template=request.chat_template,
                     chat_template_kwargs=request.chat_template_kwargs,
-                    trust_request_chat_template=self.
-                    trust_request_chat_template,
+                    trust_request_chat_template=self.trust_request_chat_template,
                 )
                 if error_check_ret is not None:
                     return error_check_ret
@@ -148,8 +157,7 @@ async def create_pooling(
                     tokenizer,
                     request.messages,
                     chat_template=request.chat_template or self.chat_template,
-                    chat_template_content_format=self.
-                    chat_template_content_format,
+                    chat_template_content_format=self.chat_template_content_format,
                     # In pooling requests, we are not generating tokens,
                     # so there is no need to append extra tokens to the input
                     add_generation_prompt=False,
@@ -162,8 +170,7 @@ async def create_pooling(
                     config=self._build_render_config(request),
                 )
             else:
-                raise ValueError(
-                    f"Unsupported request of type {type(request)}")
+                raise ValueError(f"Unsupported request of type {type(request)}")
         except (ValueError, TypeError, jinja2.TemplateError) as e:
             logger.exception("Error in preprocessing prompt inputs")
             return self.create_error_response(str(e))
@@ -181,13 +188,18 @@ async def create_pooling(
             for i, engine_prompt in enumerate(engine_prompts):
                 request_id_item = f"{request_id}-{i}"
 
-                self._log_inputs(request_id_item,
-                                 engine_prompt,
-                                 params=pooling_params,
-                                 lora_request=lora_request)
+                self._log_inputs(
+                    request_id_item,
+                    engine_prompt,
+                    params=pooling_params,
+                    lora_request=lora_request,
+                )
 
-                trace_headers = (None if raw_request is None else await
-                                 self._get_trace_headers(raw_request.headers))
+                trace_headers = (
+                    None
+                    if raw_request is None
+                    else await self._get_trace_headers(raw_request.headers)
+                )
 
                 generator = self.engine_client.encode(
                     engine_prompt,
@@ -213,8 +225,7 @@ async def create_pooling(
             )
             return self.io_processor.output_to_response(output)
 
-        assert isinstance(request,
-                          (PoolingCompletionRequest, PoolingChatRequest))
+        assert isinstance(request, (PoolingCompletionRequest, PoolingChatRequest))
         num_prompts = len(engine_prompts)
 
         # Non-streaming response
@@ -226,8 +237,7 @@ async def create_pooling(
 
             assert all(final_res is not None for final_res in final_res_batch)
 
-            final_res_batch_checked = cast(list[PoolingRequestOutput],
-                                           final_res_batch)
+            final_res_batch_checked = cast(list[PoolingRequestOutput], final_res_batch)
 
             response = self.request_output_to_pooling_response(
                 final_res_batch_checked,
@@ -278,9 +288,9 @@ def request_output_to_pooling_response(
             usage=usage,
         )
 
-    def _build_render_config(
-            self, request: PoolingCompletionRequest) -> RenderConfig:
+    def _build_render_config(self, request: PoolingCompletionRequest) -> RenderConfig:
         return RenderConfig(
             max_length=self.max_model_len,
             truncate_prompt_tokens=request.truncate_prompt_tokens,
-            add_special_tokens=request.add_special_tokens)
+            add_special_tokens=request.add_special_tokens,
+        )
diff --git a/vllm/entrypoints/openai/serving_responses.py b/vllm/entrypoints/openai/serving_responses.py
index faaed2fca392..385ef41411a3 100644
--- a/vllm/entrypoints/openai/serving_responses.py
+++ b/vllm/entrypoints/openai/serving_responses.py
@@ -14,6 +14,7 @@
 
 import jinja2
 from fastapi import Request
+
 # yapf conflicts with isort for this block
 # yapf: disable
 from openai.types.responses import (
@@ -22,50 +23,81 @@
     ResponseCodeInterpreterCallCompletedEvent,
     ResponseCodeInterpreterCallInProgressEvent,
     ResponseCodeInterpreterCallInterpretingEvent,
-    ResponseCodeInterpreterToolCallParam, ResponseContentPartAddedEvent,
-    ResponseContentPartDoneEvent, ResponseFunctionToolCall,
-    ResponseFunctionWebSearch, ResponseOutputItem,
-    ResponseOutputItemAddedEvent, ResponseOutputItemDoneEvent,
-    ResponseOutputMessage, ResponseOutputText, ResponseReasoningItem,
-    ResponseReasoningTextDeltaEvent, ResponseReasoningTextDoneEvent,
-    ResponseStatus, ResponseTextDeltaEvent, ResponseTextDoneEvent,
-    ResponseWebSearchCallCompletedEvent, ResponseWebSearchCallInProgressEvent,
-    ResponseWebSearchCallSearchingEvent, response_function_web_search,
-    response_text_delta_event)
-from openai.types.responses.response_output_text import (Logprob,
-                                                         LogprobTopLogprob)
+    ResponseCodeInterpreterToolCallParam,
+    ResponseContentPartAddedEvent,
+    ResponseContentPartDoneEvent,
+    ResponseFunctionToolCall,
+    ResponseFunctionWebSearch,
+    ResponseOutputItem,
+    ResponseOutputItemAddedEvent,
+    ResponseOutputItemDoneEvent,
+    ResponseOutputMessage,
+    ResponseOutputText,
+    ResponseReasoningItem,
+    ResponseReasoningTextDeltaEvent,
+    ResponseReasoningTextDoneEvent,
+    ResponseStatus,
+    ResponseTextDeltaEvent,
+    ResponseTextDoneEvent,
+    ResponseWebSearchCallCompletedEvent,
+    ResponseWebSearchCallInProgressEvent,
+    ResponseWebSearchCallSearchingEvent,
+    response_function_web_search,
+    response_text_delta_event,
+)
+from openai.types.responses.response_output_text import Logprob, LogprobTopLogprob
+
 # yapf: enable
 from openai.types.responses.response_reasoning_item import (
-    Content as ResponseReasoningTextContent)
+    Content as ResponseReasoningTextContent,
+)
 from openai_harmony import Message as OpenAIHarmonyMessage
 
 from vllm import envs
 from vllm.config import ModelConfig
 from vllm.engine.protocol import EngineClient
-from vllm.entrypoints.chat_utils import (ChatCompletionMessageParam,
-                                         ChatTemplateContentFormatOption)
-from vllm.entrypoints.context import (ConversationContext, HarmonyContext,
-                                      SimpleContext, StreamingHarmonyContext)
+from vllm.entrypoints.chat_utils import (
+    ChatCompletionMessageParam,
+    ChatTemplateContentFormatOption,
+)
+from vllm.entrypoints.context import (
+    ConversationContext,
+    HarmonyContext,
+    SimpleContext,
+    StreamingHarmonyContext,
+)
 from vllm.entrypoints.harmony_utils import (
-    get_developer_message, get_stop_tokens_for_assistant_actions,
-    get_system_message, get_user_message, has_custom_tools,
-    parse_output_message, parse_remaining_state, parse_response_input,
-    render_for_completion)
+    get_developer_message,
+    get_stop_tokens_for_assistant_actions,
+    get_system_message,
+    get_user_message,
+    has_custom_tools,
+    parse_output_message,
+    parse_remaining_state,
+    parse_response_input,
+    render_for_completion,
+)
 from vllm.entrypoints.logger import RequestLogger
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.entrypoints.openai.protocol import (DeltaMessage, ErrorResponse,
-                                              InputTokensDetails,
-                                              OutputTokensDetails,
-                                              RequestResponseMetadata,
-                                              ResponseCompletedEvent,
-                                              ResponseCreatedEvent,
-                                              ResponseInProgressEvent,
-                                              ResponseReasoningPartAddedEvent,
-                                              ResponseReasoningPartDoneEvent,
-                                              ResponsesRequest,
-                                              ResponsesResponse, ResponseUsage,
-                                              StreamingResponsesResponse)
+from vllm.entrypoints.openai.protocol import (
+    DeltaMessage,
+    ErrorResponse,
+    InputTokensDetails,
+    OutputTokensDetails,
+    RequestResponseMetadata,
+    ResponseCompletedEvent,
+    ResponseCreatedEvent,
+    ResponseInProgressEvent,
+    ResponseReasoningPartAddedEvent,
+    ResponseReasoningPartDoneEvent,
+    ResponsesRequest,
+    ResponsesResponse,
+    ResponseUsage,
+    StreamingResponsesResponse,
+)
+
 # yapf: enable
 from vllm.entrypoints.openai.serving_engine import OpenAIServing
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
@@ -84,7 +116,6 @@
 
 
 class OpenAIServingResponses(OpenAIServing):
-
     def __init__(
         self,
         engine_client: EngineClient,
@@ -118,27 +149,29 @@ def __init__(
         self.chat_template_content_format: Final = chat_template_content_format
         self.enable_log_outputs = enable_log_outputs
 
-        self.reasoning_parser: Optional[Callable[[AnyTokenizer],
-                                                 ReasoningParser]] = None
+        self.reasoning_parser: Optional[Callable[[AnyTokenizer], ReasoningParser]] = (
+            None
+        )
         if reasoning_parser:
             try:
-                self.reasoning_parser = (
-                    ReasoningParserManager.get_reasoning_parser(
-                        reasoning_parser))
+                self.reasoning_parser = ReasoningParserManager.get_reasoning_parser(
+                    reasoning_parser
+                )
                 assert self.reasoning_parser is not None
             except Exception as e:
-                raise TypeError(
-                    f"{reasoning_parser=} has not been registered") from e
+                raise TypeError(f"{reasoning_parser=} has not been registered") from e
 
         self.enable_prompt_tokens_details = enable_prompt_tokens_details
         self.enable_force_include_usage = enable_force_include_usage
-        self.default_sampling_params = (
-            self.model_config.get_diff_sampling_param())
+        self.default_sampling_params = self.model_config.get_diff_sampling_param()
         if self.default_sampling_params:
             source = self.model_config.generation_config
             source = "model" if source == "auto" else source
-            logger.info("Using default chat sampling params from %s: %s",
-                        source, self.default_sampling_params)
+            logger.info(
+                "Using default chat sampling params from %s: %s",
+                source,
+                self.default_sampling_params,
+            )
 
         # If False (default), the "store" option is (silently) ignored and the
         # response is not stored. If True, the response is stored in memory.
@@ -150,26 +183,31 @@ def __init__(
             logger.warning_once(
                 "`VLLM_ENABLE_RESPONSES_API_STORE` is enabled. This may "
                 "cause a memory leak since we never remove responses from "
-                "the store.")
+                "the store."
+            )
 
         self.use_harmony = model_config.hf_config.model_type == "gpt_oss"
         if self.use_harmony:
-            logger.warning("For gpt-oss, we ignore --enable-auto-tool-choice "
-                           "and always enable tool use.")
+            logger.warning(
+                "For gpt-oss, we ignore --enable-auto-tool-choice "
+                "and always enable tool use."
+            )
             # OpenAI models have two EOS-like tokens: <|return|> and <|call|>.
             # We need to add them to the stop token ids.
             if "stop_token_ids" not in self.default_sampling_params:
                 self.default_sampling_params["stop_token_ids"] = []
             self.default_sampling_params["stop_token_ids"].extend(
-                get_stop_tokens_for_assistant_actions())
+                get_stop_tokens_for_assistant_actions()
+            )
 
         # set up tool use
         self.enable_auto_tools: bool = enable_auto_tools
         if self.enable_auto_tools:
             logger.info(
-                "\"auto\" tool choice has been enabled please note that while"
+                '"auto" tool choice has been enabled please note that while'
                 " the parallel_tool_calls client option is preset for "
-                "compatibility reasons, it will be ignored.")
+                "compatibility reasons, it will be ignored."
+            )
 
         # HACK(woosuk): This is a hack. We should use a better store.
         # FIXME: If enable_store=True, this may cause a memory leak since we
@@ -185,23 +223,25 @@ def __init__(
         # HACK(wuhang): This is a hack. We should use a better store.
         # FIXME: If enable_store=True, this may cause a memory leak since we
         # never remove events from the store.
-        self.event_store: dict[str, tuple[deque[StreamingResponsesResponse],
-                                          asyncio.Event]] = {}
+        self.event_store: dict[
+            str, tuple[deque[StreamingResponsesResponse], asyncio.Event]
+        ] = {}
 
         self.background_tasks: dict[str, asyncio.Task] = {}
 
         self.tool_server = tool_server
 
     def _validate_generator_input(
-            self,
-            engine_prompt: EngineTokensPrompt) -> Optional[ErrorResponse]:
+        self, engine_prompt: EngineTokensPrompt
+    ) -> Optional[ErrorResponse]:
         """Add validations to the input to the generator here."""
         if self.max_model_len <= len(engine_prompt["prompt_token_ids"]):
             error_message = (
                 "The engine prompt length"
                 f" {len(engine_prompt['prompt_token_ids'])} "
                 f"exceeds the max_model_len {self.max_model_len}. "
-                "Please reduce prompt.")
+                "Please reduce prompt."
+            )
             return self.create_error_response(
                 err_type="invalid_request_error",
                 message=error_message,
@@ -213,8 +253,11 @@ async def create_responses(
         self,
         request: ResponsesRequest,
         raw_request: Optional[Request] = None,
-    ) -> Union[AsyncGenerator[StreamingResponsesResponse, None],
-               ResponsesResponse, ErrorResponse]:
+    ) -> Union[
+        AsyncGenerator[StreamingResponsesResponse, None],
+        ResponsesResponse,
+        ErrorResponse,
+    ]:
         error_check_ret = await self._check_model(request)
         if error_check_ret is not None:
             logger.error("Error with model %s", error_check_ret)
@@ -235,7 +278,8 @@ async def create_responses(
                         "therefore does not support the background mode. To "
                         "enable these features, set the environment variable "
                         "`VLLM_ENABLE_RESPONSES_API_STORE=1` when launching "
-                        "the vLLM server."),
+                        "the vLLM server."
+                    ),
                     status_code=HTTPStatus.BAD_REQUEST,
                 )
             # Disable the store option.
@@ -269,19 +313,24 @@ async def create_responses(
 
             if self.use_harmony:
                 messages, request_prompts, engine_prompts = (
-                    self._make_request_with_harmony(request, prev_response))
+                    self._make_request_with_harmony(request, prev_response)
+                )
             else:
-                messages, request_prompts, engine_prompts = (
-                    await self._make_request(request, prev_response,
-                                             tokenizer))
+                messages, request_prompts, engine_prompts = await self._make_request(
+                    request, prev_response, tokenizer
+                )
 
-        except (ValueError, TypeError, RuntimeError, jinja2.TemplateError,
-                NotImplementedError) as e:
+        except (
+            ValueError,
+            TypeError,
+            RuntimeError,
+            jinja2.TemplateError,
+            NotImplementedError,
+        ) as e:
             logger.exception("Error in preprocessing prompt inputs")
             return self.create_error_response(f"{e} {e.__cause__}")
 
-        request_metadata = RequestResponseMetadata(
-            request_id=request.request_id)
+        request_metadata = RequestResponseMetadata(request_id=request.request_id)
         if raw_request:
             raw_request.state.request_metadata = request_metadata
 
@@ -309,19 +358,23 @@ async def create_responses(
                     return maybe_error
 
                 default_max_tokens = self.max_model_len - len(
-                    engine_prompt["prompt_token_ids"])
+                    engine_prompt["prompt_token_ids"]
+                )
 
                 sampling_params = request.to_sampling_params(
-                    default_max_tokens, self.default_sampling_params)
+                    default_max_tokens, self.default_sampling_params
+                )
 
-                trace_headers = (None if raw_request is None else await
-                                 self._get_trace_headers(raw_request.headers))
+                trace_headers = (
+                    None
+                    if raw_request is None
+                    else await self._get_trace_headers(raw_request.headers)
+                )
 
                 context: ConversationContext
                 if self.use_harmony:
                     if request.stream:
-                        context = StreamingHarmonyContext(
-                            messages, available_tools)
+                        context = StreamingHarmonyContext(messages, available_tools)
                     else:
                         context = HarmonyContext(messages, available_tools)
                 else:
@@ -342,7 +395,7 @@ async def create_responses(
             return self.create_error_response(str(e))
 
         assert len(generators) == 1
-        result_generator, = generators
+        (result_generator,) = generators
 
         # Store the input messages.
         if request.store:
@@ -396,11 +449,11 @@ async def create_responses(
             response_id = response.id
             self.background_tasks[response_id] = task
             task.add_done_callback(
-                lambda _: self.background_tasks.pop(response_id, None))
+                lambda _: self.background_tasks.pop(response_id, None)
+            )
 
             if request.stream:
-                return self.responses_background_stream_generator(
-                    request.request_id)
+                return self.responses_background_stream_generator(request.request_id)
             return response
 
         if request.stream:
@@ -435,7 +488,8 @@ async def _make_request(
     ):
         if len(request.tools) > 0:
             raise NotImplementedError(
-                "Tool use is not supported in Responses API without Harmony")
+                "Tool use is not supported in Responses API without Harmony"
+            )
         # Construct the input messages.
         messages = self._construct_input_messages(request, prev_response)
         _, request_prompts, engine_prompts = await self._preprocess_chat(
@@ -454,10 +508,9 @@ def _make_request_with_harmony(
     ):
         if request.tool_choice != "auto":
             raise NotImplementedError(
-                "Only 'auto' tool_choice is supported in "
-                "response API with Harmony")
-        messages = self._construct_input_messages_with_harmony(
-            request, prev_response)
+                "Only 'auto' tool_choice is supported in response API with Harmony"
+            )
+        messages = self._construct_input_messages_with_harmony(request, prev_response)
         prompt_token_ids = render_for_completion(messages)
         engine_prompt = EngineTokensPrompt(prompt_token_ids=prompt_token_ids)
 
@@ -467,18 +520,21 @@ def _make_request_with_harmony(
 
         return messages, [prompt_token_ids], [engine_prompt]
 
-    async def _initialize_tool_sessions(self, request: ResponsesRequest,
-                                        context: ConversationContext,
-                                        exit_stack: AsyncExitStack):
+    async def _initialize_tool_sessions(
+        self,
+        request: ResponsesRequest,
+        context: ConversationContext,
+        exit_stack: AsyncExitStack,
+    ):
         # we should only initialize the tool session if the request needs tools
         if len(request.tools) == 0:
             return
         mcp_tools = {
-            tool.server_label: tool
-            for tool in request.tools if tool.type == "mcp"
+            tool.server_label: tool for tool in request.tools if tool.type == "mcp"
         }
-        await context.init_tool_sessions(self.tool_server, exit_stack,
-                                         request.request_id, mcp_tools)
+        await context.init_tool_sessions(
+            self.tool_server, exit_stack, request.request_id, mcp_tools
+        )
 
     async def responses_full_generator(
         self,
@@ -496,8 +552,7 @@ async def responses_full_generator(
 
         async with AsyncExitStack() as exit_stack:
             try:
-                await self._initialize_tool_sessions(request, context,
-                                                     exit_stack)
+                await self._initialize_tool_sessions(request, context, exit_stack)
                 async for _ in result_generator:
                     pass
             except asyncio.CancelledError:
@@ -517,8 +572,8 @@ async def responses_full_generator(
             assert isinstance(context, HarmonyContext)
             output = self._make_response_output_items_with_harmony(context)
             if request.enable_response_messages:
-                input_messages = context.messages[:context.num_init_messages]
-                output_messages = context.messages[context.num_init_messages:]
+                input_messages = context.messages[: context.num_init_messages]
+                output_messages = context.messages[context.num_init_messages :]
             num_tool_output_tokens = context.num_tool_output_tokens
             if len(output) > 0:
                 if context.finish_reason == "length":
@@ -534,15 +589,14 @@ async def responses_full_generator(
             assert len(final_res.outputs) == 1
             final_output = final_res.outputs[0]
 
-            output = self._make_response_output_items(request, final_output,
-                                                      tokenizer)
+            output = self._make_response_output_items(request, final_output, tokenizer)
 
             # TODO: context for non-gptoss models doesn't use messages
             # so we can't get them out yet
             if request.enable_response_messages:
                 raise NotImplementedError(
-                    "enable_response_messages is currently"
-                    " only supported for gpt-oss")
+                    "enable_response_messages is currently only supported for gpt-oss"
+                )
             # Calculate usage.
             assert final_res.prompt_token_ids is not None
             num_tool_output_tokens = 0
@@ -557,11 +611,11 @@ async def responses_full_generator(
             input_tokens=num_prompt_tokens,
             output_tokens=num_generated_tokens,
             total_tokens=num_prompt_tokens + num_generated_tokens,
-            input_tokens_details=InputTokensDetails(
-                cached_tokens=num_cached_tokens),
+            input_tokens_details=InputTokensDetails(cached_tokens=num_cached_tokens),
             output_tokens_details=OutputTokensDetails(
                 reasoning_tokens=num_reasoning_tokens,
-                tool_output_tokens=num_tool_output_tokens),
+                tool_output_tokens=num_tool_output_tokens,
+            ),
         )
         response = ResponsesResponse.from_request(
             request,
@@ -579,54 +633,67 @@ async def responses_full_generator(
             async with self.response_store_lock:
                 stored_response = self.response_store.get(response.id)
                 # If the response is already cancelled, don't update it.
-                if (stored_response is None
-                        or stored_response.status != "cancelled"):
+                if stored_response is None or stored_response.status != "cancelled":
                     self.response_store[response.id] = response
         return response
 
-    def _topk_logprobs(self, logprobs: dict[int,
-                                            SampleLogprob], top_logprobs: int,
-                       tokenizer: AnyTokenizer) -> list[LogprobTopLogprob]:
+    def _topk_logprobs(
+        self,
+        logprobs: dict[int, SampleLogprob],
+        top_logprobs: int,
+        tokenizer: AnyTokenizer,
+    ) -> list[LogprobTopLogprob]:
         """Returns the top-k logprobs from the logprobs dictionary."""
         out = []
         for i, (token_id, _logprob) in enumerate(logprobs.items()):
             if i >= top_logprobs:
                 break
-            text = _logprob.decoded_token if _logprob.decoded_token \
-                is not None else tokenizer.decode([token_id])
+            text = (
+                _logprob.decoded_token
+                if _logprob.decoded_token is not None
+                else tokenizer.decode([token_id])
+            )
             out.append(
                 LogprobTopLogprob(
                     token=text,
                     logprob=max(_logprob.logprob, -9999.0),
                     bytes=list(text.encode("utf-8", errors="replace")),
-                ))
+                )
+            )
         return out
 
     def _create_response_logprobs(
-            self,
-            token_ids: Sequence[int],
-            logprobs: Optional[SampleLogprobs],
-            tokenizer: AnyTokenizer,
-            top_logprobs: Optional[int] = None) -> list[Logprob]:
+        self,
+        token_ids: Sequence[int],
+        logprobs: Optional[SampleLogprobs],
+        tokenizer: AnyTokenizer,
+        top_logprobs: Optional[int] = None,
+    ) -> list[Logprob]:
         assert logprobs is not None, "logprobs must be provided"
         assert len(token_ids) == len(logprobs), (
-            "token_ids and logprobs.token_ids must have the same length")
+            "token_ids and logprobs.token_ids must have the same length"
+        )
         out = []
         for i, token_id in enumerate(token_ids):
             logprob = logprobs[i]
             token_logprob = logprob[token_id]
-            text = token_logprob.decoded_token if token_logprob.decoded_token \
-                is not None else tokenizer.decode([token_id])
+            text = (
+                token_logprob.decoded_token
+                if token_logprob.decoded_token is not None
+                else tokenizer.decode([token_id])
+            )
             out.append(
                 Logprob(
                     token=text,
                     logprob=max(token_logprob.logprob, -9999.0),
                     bytes=list(text.encode("utf-8", errors="replace")),
-                    top_logprobs=self._topk_logprobs(logprob,
-                                                     top_logprobs=top_logprobs,
-                                                     tokenizer=tokenizer)
-                    if top_logprobs else [],
-                ))
+                    top_logprobs=self._topk_logprobs(
+                        logprob, top_logprobs=top_logprobs, tokenizer=tokenizer
+                    )
+                    if top_logprobs
+                    else [],
+                )
+            )
         return out
 
     def _create_stream_response_logprobs(
@@ -634,21 +701,26 @@ def _create_stream_response_logprobs(
         token_ids: Sequence[int],
         logprobs: Optional[SampleLogprobs],
         tokenizer: AnyTokenizer,
-        top_logprobs: Optional[int] = None
+        top_logprobs: Optional[int] = None,
     ) -> list[response_text_delta_event.Logprob]:
-        lgs = self._create_response_logprobs(token_ids=token_ids,
-                                             logprobs=logprobs,
-                                             tokenizer=tokenizer,
-                                             top_logprobs=top_logprobs)
+        lgs = self._create_response_logprobs(
+            token_ids=token_ids,
+            logprobs=logprobs,
+            tokenizer=tokenizer,
+            top_logprobs=top_logprobs,
+        )
         return [
             response_text_delta_event.Logprob(
                 token=lg.token,
                 logprob=lg.logprob,
                 top_logprobs=[
                     response_text_delta_event.LogprobTopLogprob(
-                        token=tl.token, logprob=tl.logprob)
+                        token=tl.token, logprob=tl.logprob
+                    )
                     for tl in lg.top_logprobs
-                ]) for lg in lgs
+                ],
+            )
+            for lg in lgs
         ]
 
     def _make_response_output_items(
@@ -664,9 +736,9 @@ def _make_response_output_items(
                 logger.exception("Error in reasoning parser creation.")
                 raise e
 
-            reasoning_content, content = (
-                reasoning_parser.extract_reasoning_content(final_output.text,
-                                                           request=request))
+            reasoning_content, content = reasoning_parser.extract_reasoning_content(
+                final_output.text, request=request
+            )
         else:
             reasoning_content = None
             content = final_output.text
@@ -696,8 +768,9 @@ def _make_response_output_items(
                 summary=[],
                 type="reasoning",
                 content=[
-                    ResponseReasoningTextContent(text=reasoning_content,
-                                                 type="reasoning_text")
+                    ResponseReasoningTextContent(
+                        text=reasoning_content, type="reasoning_text"
+                    )
                 ],
                 status=None,  # NOTE: Only the last output item has status.
             )
@@ -712,7 +785,9 @@ def _make_response_output_items(
                     logprobs=final_output.logprobs,
                     tokenizer=tokenizer,
                     top_logprobs=request.top_logprobs,
-                ) if request.is_include_output_logprobs() else None,
+                )
+                if request.is_include_output_logprobs()
+                else None,
             )
             message = ResponseOutputMessage(
                 id=f"msg_{random_uuid()}",
@@ -745,10 +820,12 @@ def _construct_input_messages(
     ) -> list[ChatCompletionMessageParam]:
         messages: list[ChatCompletionMessageParam] = []
         if request.instructions:
-            messages.append({
-                "role": "system",
-                "content": request.instructions,
-            })
+            messages.append(
+                {
+                    "role": "system",
+                    "content": request.instructions,
+                }
+            )
 
         # Prepend the conversation history.
         if prev_response is not None:
@@ -761,10 +838,12 @@ def _construct_input_messages(
                 # NOTE: We skip the reasoning output.
                 if isinstance(output_item, ResponseOutputMessage):
                     for content in output_item.content:
-                        messages.append({
-                            "role": "assistant",
-                            "content": content.text,
-                        })
+                        messages.append(
+                            {
+                                "role": "assistant",
+                                "content": content.text,
+                            }
+                        )
 
         # Append the new input.
         # Responses API supports simple text inputs without chat format.
@@ -782,8 +861,7 @@ def _construct_input_messages_with_harmony(
         messages: list[OpenAIHarmonyMessage] = []
         if prev_response is None:
             # New conversation.
-            reasoning_effort = (request.reasoning.effort
-                                if request.reasoning else None)
+            reasoning_effort = request.reasoning.effort if request.reasoning else None
             tool_types = [tool.type for tool in request.tools]
 
             # Allow the MCP Tool type to enable built in tools if the
@@ -791,37 +869,46 @@ def _construct_input_messages_with_harmony(
             # envs.GPT_OSS_SYSTEM_TOOL_MCP_LABELS
             if envs.GPT_OSS_SYSTEM_TOOL_MCP_LABELS:
                 for tool in request.tools:
-                    if (tool.type == "mcp" and tool.server_label
-                            in envs.GPT_OSS_SYSTEM_TOOL_MCP_LABELS):
+                    if (
+                        tool.type == "mcp"
+                        and tool.server_label in envs.GPT_OSS_SYSTEM_TOOL_MCP_LABELS
+                    ):
                         tool_types.append(tool.server_label)
-            enable_browser = ("web_search_preview" in tool_types
-                              and self.tool_server is not None
-                              and self.tool_server.has_tool("browser"))
-            enable_code_interpreter = ("code_interpreter" in tool_types
-                                       and self.tool_server is not None
-                                       and self.tool_server.has_tool("python"))
-            enable_container = ("container" in tool_types
-                                and self.tool_server is not None
-                                and self.tool_server.has_tool("container"))
+            enable_browser = (
+                "web_search_preview" in tool_types
+                and self.tool_server is not None
+                and self.tool_server.has_tool("browser")
+            )
+            enable_code_interpreter = (
+                "code_interpreter" in tool_types
+                and self.tool_server is not None
+                and self.tool_server.has_tool("python")
+            )
+            enable_container = (
+                "container" in tool_types
+                and self.tool_server is not None
+                and self.tool_server.has_tool("container")
+            )
             with_custom_tools = has_custom_tools(tool_types)
             sys_msg = get_system_message(
                 reasoning_effort=reasoning_effort,
-                browser_description=self.tool_server.get_tool_description(
-                    "browser")
-                if enable_browser and self.tool_server is not None else None,
-                python_description=self.tool_server.get_tool_description(
-                    "python") if enable_code_interpreter
-                and self.tool_server is not None else None,
-                container_description=self.tool_server.get_tool_description(
-                    "container")
-                if enable_container and self.tool_server is not None else None,
+                browser_description=self.tool_server.get_tool_description("browser")
+                if enable_browser and self.tool_server is not None
+                else None,
+                python_description=self.tool_server.get_tool_description("python")
+                if enable_code_interpreter and self.tool_server is not None
+                else None,
+                container_description=self.tool_server.get_tool_description("container")
+                if enable_container and self.tool_server is not None
+                else None,
                 instructions=request.instructions,
                 with_custom_tools=with_custom_tools,
             )
             messages.append(sys_msg)
             if with_custom_tools:
                 dev_msg = get_developer_message(
-                    instructions=request.instructions, tools=request.tools)
+                    instructions=request.instructions, tools=request.tools
+                )
                 messages.append(dev_msg)
         else:
             # Continue the previous conversation.
@@ -842,8 +929,8 @@ def _construct_input_messages_with_harmony(
                         if prev_msg_i.channel == "final":
                             prev_final_msg_idx = i
                             break
-                    recent_turn_msgs = prev_msgs[prev_final_msg_idx + 1:]
-                    del prev_msgs[prev_final_msg_idx + 1:]
+                    recent_turn_msgs = prev_msgs[prev_final_msg_idx + 1 :]
+                    del prev_msgs[prev_final_msg_idx + 1 :]
                     for msg in recent_turn_msgs:
                         assert isinstance(msg, OpenAIHarmonyMessage)
                         if msg.channel != "analysis":
@@ -859,8 +946,7 @@ def _construct_input_messages_with_harmony(
             else:
                 prev_outputs = []
             for response_msg in request.input:
-                messages.append(
-                    parse_response_input(response_msg, prev_outputs))
+                messages.append(parse_response_input(response_msg, prev_outputs))
                 # User passes in a tool call request and its output. We need
                 # to add the tool call request to prev_outputs so that the
                 # parse_response_input can find the tool call request when
@@ -880,14 +966,12 @@ async def _run_background_request_stream(
         self.event_store[request.request_id] = (event_deque, new_event_signal)
         response = None
         try:
-            generator = self.responses_stream_generator(
-                request, *args, **kwargs)
+            generator = self.responses_stream_generator(request, *args, **kwargs)
             async for event in generator:
                 event_deque.append(event)
                 new_event_signal.set()  # Signal new event available
         except Exception as e:
-            logger.exception("Background request failed for %s",
-                             request.request_id)
+            logger.exception("Background request failed for %s", request.request_id)
             response = self.create_error_response(str(e))
         finally:
             new_event_signal.set()
@@ -908,11 +992,9 @@ async def _run_background_request(
         **kwargs,
     ):
         try:
-            response = await self.responses_full_generator(
-                request, *args, **kwargs)
+            response = await self.responses_full_generator(request, *args, **kwargs)
         except Exception as e:
-            logger.exception("Background request failed for %s",
-                             request.request_id)
+            logger.exception("Background request failed for %s", request.request_id)
             response = self.create_error_response(str(e))
 
         if isinstance(response, ErrorResponse):
@@ -943,7 +1025,7 @@ async def responses_background_stream_generator(
             while current_index < len(event_deque):
                 event = event_deque[current_index]
                 yield event
-                if getattr(event, 'type', 'unknown') == "response.completed":
+                if getattr(event, "type", "unknown") == "response.completed":
                     return
                 current_index += 1
 
@@ -954,8 +1036,11 @@ async def retrieve_responses(
         response_id: str,
         starting_after: Optional[int],
         stream: Optional[bool],
-    ) -> Union[ErrorResponse, ResponsesResponse, AsyncGenerator[
-            StreamingResponsesResponse, None]]:
+    ) -> Union[
+        ErrorResponse,
+        ResponsesResponse,
+        AsyncGenerator[StreamingResponsesResponse, None],
+    ]:
         async with self.response_store_lock:
             response = self.response_store.get(response_id)
 
@@ -989,13 +1074,12 @@ async def cancel_responses(
             response.status = "cancelled"
 
         # Abort the request.
-        if (task := self.background_tasks.get(response_id)):
+        if task := self.background_tasks.get(response_id):
             task.cancel()
             try:
                 await task
             except asyncio.CancelledError:
-                logger.exception("Background task for %s was cancelled",
-                                 response_id)
+                logger.exception("Background task for %s was cancelled", response_id)
         return response
 
     def _make_not_found_error(self, response_id: str) -> ErrorResponse:
@@ -1008,10 +1092,12 @@ def _make_not_found_error(self, response_id: str) -> ErrorResponse:
     def _make_store_not_supported_error(self) -> ErrorResponse:
         return self.create_error_response(
             err_type="invalid_request_error",
-            message=("`store=True` (default) is not supported. Please set "
-                     "`store=False` in Responses API or set "
-                     "`VLLM_ENABLE_RESPONSES_API_STORE=1` in the env var when "
-                     "starting the vLLM server."),
+            message=(
+                "`store=True` (default) is not supported. Please set "
+                "`store=False` in Responses API or set "
+                "`VLLM_ENABLE_RESPONSES_API_STORE=1` in the env var when "
+                "starting the vLLM server."
+            ),
             status_code=HTTPStatus.BAD_REQUEST,
         )
 
@@ -1026,7 +1112,8 @@ async def _process_simple_streaming_events(
         request_metadata: RequestResponseMetadata,
         created_time: int,
         _increment_sequence_number_and_return: Callable[
-            [StreamingResponsesResponse], StreamingResponsesResponse],
+            [StreamingResponsesResponse], StreamingResponsesResponse
+        ],
     ) -> AsyncGenerator[StreamingResponsesResponse, None]:
         current_content_index = 0
         current_output_index = 0
@@ -1045,18 +1132,20 @@ async def _process_simple_streaming_events(
             if ctx.last_output.outputs:
                 output = ctx.last_output.outputs[0]
                 if reasoning_parser:
-                    delta_message = \
+                    delta_message = (
                         reasoning_parser.extract_reasoning_content_streaming(
-                        previous_text=previous_text,
-                        current_text=previous_text + output.text,
-                        delta_text=output.text,
-                        previous_token_ids=previous_token_ids,
-                        current_token_ids=previous_token_ids +
-                        output.token_ids,
-                        delta_token_ids=output.token_ids,
+                            previous_text=previous_text,
+                            current_text=previous_text + output.text,
+                            delta_text=output.text,
+                            previous_token_ids=previous_token_ids,
+                            current_token_ids=previous_token_ids + output.token_ids,
+                            delta_token_ids=output.token_ids,
+                        )
                     )
                 else:
-                    delta_message = DeltaMessage(content=output.text, )
+                    delta_message = DeltaMessage(
+                        content=output.text,
+                    )
                 previous_text += output.text
                 previous_token_ids += output.token_ids
                 if not delta_message:
@@ -1075,7 +1164,8 @@ async def _process_simple_streaming_events(
                                     summary=[],
                                     status="in_progress",
                                 ),
-                            ))
+                            )
+                        )
                     else:
                         yield _increment_sequence_number_and_return(
                             ResponseOutputItemAddedEvent(
@@ -1089,7 +1179,8 @@ async def _process_simple_streaming_events(
                                     content=[],
                                     status="in_progress",
                                 ),
-                            ))
+                            )
+                        )
                     yield _increment_sequence_number_and_return(
                         ResponseContentPartAddedEvent(
                             type="response.content_part.added",
@@ -1103,21 +1194,26 @@ async def _process_simple_streaming_events(
                                 annotations=[],
                                 logprobs=[],
                             ),
-                        ))
+                        )
+                    )
                     current_content_index += 1
                     first_delta_sent = True
                 # todo(kebe7jun) tool call support
 
                 # check delta message and previous delta message are
                 # same as content or reasoning content
-                if (previous_delta_messages
-                        and previous_delta_messages[-1].reasoning_content
-                        is not None and delta_message.content is not None):
+                if (
+                    previous_delta_messages
+                    and previous_delta_messages[-1].reasoning_content is not None
+                    and delta_message.content is not None
+                ):
                     # from reasoning to normal content, send done
                     # event for reasoning
-                    reason_content = ''.join(
-                        pm.reasoning_content for pm in previous_delta_messages
-                        if pm.reasoning_content is not None)
+                    reason_content = "".join(
+                        pm.reasoning_content
+                        for pm in previous_delta_messages
+                        if pm.reasoning_content is not None
+                    )
                     yield _increment_sequence_number_and_return(
                         ResponseReasoningTextDoneEvent(
                             type="response.reasoning_text.done",
@@ -1126,7 +1222,8 @@ async def _process_simple_streaming_events(
                             output_index=current_output_index,
                             content_index=current_content_index,
                             text=reason_content,
-                        ))
+                        )
+                    )
                     current_content_index = 0
                     reasoning_item = ResponseReasoningItem(
                         type="reasoning",
@@ -1146,7 +1243,8 @@ async def _process_simple_streaming_events(
                             sequence_number=-1,
                             output_index=current_output_index,
                             item=reasoning_item,
-                        ))
+                        )
+                    )
                     yield _increment_sequence_number_and_return(
                         ResponseOutputItemAddedEvent(
                             type="response.output_item.added",
@@ -1159,7 +1257,8 @@ async def _process_simple_streaming_events(
                                 content=[],
                                 status="in_progress",
                             ),
-                        ))
+                        )
+                    )
                     current_output_index += 1
                     current_item_id = str(uuid.uuid4())
                     yield _increment_sequence_number_and_return(
@@ -1175,7 +1274,8 @@ async def _process_simple_streaming_events(
                                 annotations=[],
                                 logprobs=[],
                             ),
-                        ))
+                        )
+                    )
                     current_content_index += 1
                     # reset previous delta messages
                     previous_delta_messages = []
@@ -1189,7 +1289,8 @@ async def _process_simple_streaming_events(
                             output_index=current_output_index,
                             item_id=current_item_id,
                             delta=delta_message.reasoning_content,
-                        ))
+                        )
+                    )
                 elif delta_message.content is not None:
                     yield _increment_sequence_number_and_return(
                         ResponseTextDeltaEvent(
@@ -1204,16 +1305,21 @@ async def _process_simple_streaming_events(
                                 logprobs=output.logprobs,
                                 tokenizer=tokenizer,
                                 top_logprobs=request.top_logprobs,
-                            ) if request.is_include_output_logprobs() else [],
-                        ))
+                            )
+                            if request.is_include_output_logprobs()
+                            else [],
+                        )
+                    )
                 current_content_index += 1
 
                 previous_delta_messages.append(delta_message)
         if previous_delta_messages:
             if previous_delta_messages[-1].reasoning_content is not None:
-                reason_content = ''.join(pm.reasoning_content
-                                         for pm in previous_delta_messages
-                                         if pm.reasoning_content is not None)
+                reason_content = "".join(
+                    pm.reasoning_content
+                    for pm in previous_delta_messages
+                    if pm.reasoning_content is not None
+                )
                 yield _increment_sequence_number_and_return(
                     ResponseReasoningTextDoneEvent(
                         type="response.reasoning_text.done",
@@ -1222,7 +1328,8 @@ async def _process_simple_streaming_events(
                         output_index=current_output_index,
                         content_index=current_content_index,
                         text=reason_content,
-                    ))
+                    )
+                )
                 current_content_index += 1
                 reasoning_item = ResponseReasoningItem(
                     type="reasoning",
@@ -1242,11 +1349,14 @@ async def _process_simple_streaming_events(
                         sequence_number=-1,
                         output_index=current_output_index,
                         item=reasoning_item,
-                    ))
+                    )
+                )
             elif previous_delta_messages[-1].content is not None:
-                final_content = ''.join(pm.content
-                                        for pm in previous_delta_messages
-                                        if pm.content is not None)
+                final_content = "".join(
+                    pm.content
+                    for pm in previous_delta_messages
+                    if pm.content is not None
+                )
                 yield _increment_sequence_number_and_return(
                     ResponseTextDoneEvent(
                         type="response.output_text.done",
@@ -1256,7 +1366,8 @@ async def _process_simple_streaming_events(
                         text=final_content,
                         logprobs=[],
                         item_id=current_item_id,
-                    ))
+                    )
+                )
                 current_content_index += 1
                 part = ResponseOutputText(
                     text=final_content,
@@ -1271,7 +1382,8 @@ async def _process_simple_streaming_events(
                         output_index=current_output_index,
                         content_index=current_content_index,
                         part=part,
-                    ))
+                    )
+                )
                 current_content_index += 1
                 item = ResponseOutputMessage(
                     type="message",
@@ -1289,7 +1401,8 @@ async def _process_simple_streaming_events(
                         sequence_number=-1,
                         output_index=current_output_index,
                         item=item,
-                    ))
+                    )
+                )
 
     async def _process_harmony_streaming_events(
         self,
@@ -1302,7 +1415,8 @@ async def _process_harmony_streaming_events(
         request_metadata: RequestResponseMetadata,
         created_time: int,
         _increment_sequence_number_and_return: Callable[
-            [StreamingResponsesResponse], StreamingResponsesResponse],
+            [StreamingResponsesResponse], StreamingResponsesResponse
+        ],
     ) -> AsyncGenerator[StreamingResponsesResponse, None]:
         current_content_index = -1
         current_output_index = 0
@@ -1310,7 +1424,6 @@ async def _process_harmony_streaming_events(
         sent_output_item_added = False
 
         async for ctx in result_generator:
-
             assert isinstance(ctx, StreamingHarmonyContext)
 
             if ctx.is_expecting_start():
@@ -1342,7 +1455,8 @@ async def _process_harmony_streaming_events(
                                 output_index=current_output_index,
                                 content_index=current_content_index,
                                 text=previous_item.content[0].text,
-                            ))
+                            )
+                        )
                         yield _increment_sequence_number_and_return(
                             ResponseReasoningPartDoneEvent(
                                 type="response.reasoning_part.done",
@@ -1351,14 +1465,16 @@ async def _process_harmony_streaming_events(
                                 output_index=current_output_index,
                                 content_index=current_content_index,
                                 part=content,
-                            ))
+                            )
+                        )
                         yield _increment_sequence_number_and_return(
                             ResponseOutputItemDoneEvent(
                                 type="response.output_item.done",
                                 sequence_number=-1,
                                 output_index=current_output_index,
                                 item=reasoning_item,
-                            ))
+                            )
+                        )
                     elif previous_item.channel == "final":
                         text_content = ResponseOutputText(
                             type="output_text",
@@ -1374,7 +1490,8 @@ async def _process_harmony_streaming_events(
                                 text=previous_item.content[0].text,
                                 logprobs=[],
                                 item_id=current_item_id,
-                            ))
+                            )
+                        )
                         yield _increment_sequence_number_and_return(
                             ResponseContentPartDoneEvent(
                                 type="response.content_part.done",
@@ -1383,7 +1500,8 @@ async def _process_harmony_streaming_events(
                                 output_index=current_output_index,
                                 content_index=current_content_index,
                                 part=text_content,
-                            ))
+                            )
+                        )
                         yield _increment_sequence_number_and_return(
                             ResponseOutputItemDoneEvent(
                                 type="response.output_item.done",
@@ -1396,12 +1514,15 @@ async def _process_harmony_streaming_events(
                                     content=[text_content],
                                     status="completed",
                                 ),
-                            ))
+                            )
+                        )
 
             # stream the output of a harmony message
             if ctx.parser.last_content_delta:
-                if (ctx.parser.current_channel == "final"
-                        and ctx.parser.current_recipient is None):
+                if (
+                    ctx.parser.current_channel == "final"
+                    and ctx.parser.current_recipient is None
+                ):
                     if not sent_output_item_added:
                         sent_output_item_added = True
                         current_item_id = f"msg_{random_uuid()}"
@@ -1417,7 +1538,8 @@ async def _process_harmony_streaming_events(
                                     content=[],
                                     status="in_progress",
                                 ),
-                            ))
+                            )
+                        )
                         current_content_index += 1
                         yield _increment_sequence_number_and_return(
                             ResponseContentPartAddedEvent(
@@ -1432,7 +1554,8 @@ async def _process_harmony_streaming_events(
                                     annotations=[],
                                     logprobs=[],
                                 ),
-                            ))
+                            )
+                        )
                     yield _increment_sequence_number_and_return(
                         ResponseTextDeltaEvent(
                             type="response.output_text.delta",
@@ -1443,9 +1566,12 @@ async def _process_harmony_streaming_events(
                             delta=ctx.parser.last_content_delta,
                             # TODO, use logprobs from ctx.last_request_output
                             logprobs=[],
-                        ))
-                elif (ctx.parser.current_channel == "analysis"
-                      and ctx.parser.current_recipient is None):
+                        )
+                    )
+                elif (
+                    ctx.parser.current_channel == "analysis"
+                    and ctx.parser.current_recipient is None
+                ):
                     if not sent_output_item_added:
                         sent_output_item_added = True
                         current_item_id = f"msg_{random_uuid()}"
@@ -1460,7 +1586,8 @@ async def _process_harmony_streaming_events(
                                     summary=[],
                                     status="in_progress",
                                 ),
-                            ))
+                            )
+                        )
                         current_content_index += 1
                         yield _increment_sequence_number_and_return(
                             ResponseReasoningPartAddedEvent(
@@ -1473,7 +1600,8 @@ async def _process_harmony_streaming_events(
                                     text="",
                                     type="reasoning_text",
                                 ),
-                            ))
+                            )
+                        )
                     yield _increment_sequence_number_and_return(
                         ResponseReasoningTextDeltaEvent(
                             type="response.reasoning_text.delta",
@@ -1482,13 +1610,15 @@ async def _process_harmony_streaming_events(
                             content_index=current_content_index,
                             delta=ctx.parser.last_content_delta,
                             sequence_number=-1,
-                        ))
+                        )
+                    )
                 # built-in tools will be triggered on the analysis channel
                 # However, occasionally built-in tools will
                 # still be output to commentary.
-                elif (ctx.parser.current_channel == "commentary"
-                      or ctx.parser.current_channel == "analysis"
-                      ) and ctx.parser.current_recipient == "python":
+                elif (
+                    ctx.parser.current_channel == "commentary"
+                    or ctx.parser.current_channel == "analysis"
+                ) and ctx.parser.current_recipient == "python":
                     if not sent_output_item_added:
                         sent_output_item_added = True
                         current_item_id = f"tool_{random_uuid()}"
@@ -1505,15 +1635,16 @@ async def _process_harmony_streaming_events(
                                     outputs=None,
                                     status="in_progress",
                                 ),
-                            ))
+                            )
+                        )
                         yield _increment_sequence_number_and_return(
                             ResponseCodeInterpreterCallInProgressEvent(
-                                type=
-                                "response.code_interpreter_call.in_progress",
+                                type="response.code_interpreter_call.in_progress",
                                 sequence_number=-1,
                                 output_index=current_output_index,
                                 item_id=current_item_id,
-                            ))
+                            )
+                        )
                     yield _increment_sequence_number_and_return(
                         ResponseCodeInterpreterCallCodeDeltaEvent(
                             type="response.code_interpreter_call_code.delta",
@@ -1521,41 +1652,41 @@ async def _process_harmony_streaming_events(
                             output_index=current_output_index,
                             item_id=current_item_id,
                             delta=ctx.parser.last_content_delta,
-                        ))
+                        )
+                    )
 
             # stream tool call outputs
             if ctx.is_assistant_action_turn() and len(ctx.parser.messages) > 0:
                 previous_item = ctx.parser.messages[-1]
-                if (self.tool_server is not None
-                        and self.tool_server.has_tool("browser")
-                        and previous_item.recipient is not None
-                        and previous_item.recipient.startswith("browser.")):
-                    function_name = previous_item.recipient[len("browser."):]
+                if (
+                    self.tool_server is not None
+                    and self.tool_server.has_tool("browser")
+                    and previous_item.recipient is not None
+                    and previous_item.recipient.startswith("browser.")
+                ):
+                    function_name = previous_item.recipient[len("browser.") :]
                     action = None
                     parsed_args = json.loads(previous_item.content[0].text)
                     if function_name == "search":
-                        action = (response_function_web_search.ActionSearch(
+                        action = response_function_web_search.ActionSearch(
                             type="search",
                             query=parsed_args["query"],
-                        ))
+                        )
                     elif function_name == "open":
-                        action = (
-                            response_function_web_search.ActionOpenPage(
-                                type="open_page",
-                                # TODO: translate to url
-                                url=f"cursor:{parsed_args.get('cursor', '')}",
-                            ))
+                        action = response_function_web_search.ActionOpenPage(
+                            type="open_page",
+                            # TODO: translate to url
+                            url=f"cursor:{parsed_args.get('cursor', '')}",
+                        )
                     elif function_name == "find":
-                        action = (
-                            response_function_web_search.ActionFind(
-                                type="find",
-                                pattern=parsed_args["pattern"],
-                                # TODO: translate to url
-                                url=f"cursor:{parsed_args.get('cursor', '')}",
-                            ))
+                        action = response_function_web_search.ActionFind(
+                            type="find",
+                            pattern=parsed_args["pattern"],
+                            # TODO: translate to url
+                            url=f"cursor:{parsed_args.get('cursor', '')}",
+                        )
                     else:
-                        raise ValueError(
-                            f"Unknown function name: {function_name}")
+                        raise ValueError(f"Unknown function name: {function_name}")
 
                     current_item_id = f"tool_{random_uuid()}"
                     yield _increment_sequence_number_and_return(
@@ -1563,29 +1694,31 @@ async def _process_harmony_streaming_events(
                             type="response.output_item.added",
                             sequence_number=-1,
                             output_index=current_output_index,
-                            item=response_function_web_search.
-                            ResponseFunctionWebSearch(
+                            item=response_function_web_search.ResponseFunctionWebSearch(
                                 # TODO: generate a unique id for web search call
                                 type="web_search_call",
                                 id=current_item_id,
                                 action=action,
                                 status="in_progress",
                             ),
-                        ))
+                        )
+                    )
                     yield _increment_sequence_number_and_return(
                         ResponseWebSearchCallInProgressEvent(
                             type="response.web_search_call.in_progress",
                             sequence_number=-1,
                             output_index=current_output_index,
                             item_id=current_item_id,
-                        ))
+                        )
+                    )
                     yield _increment_sequence_number_and_return(
                         ResponseWebSearchCallSearchingEvent(
                             type="response.web_search_call.searching",
                             sequence_number=-1,
                             output_index=current_output_index,
                             item_id=current_item_id,
-                        ))
+                        )
+                    )
 
                     # enqueue
                     yield _increment_sequence_number_and_return(
@@ -1594,7 +1727,8 @@ async def _process_harmony_streaming_events(
                             sequence_number=-1,
                             output_index=current_output_index,
                             item_id=current_item_id,
-                        ))
+                        )
+                    )
                     yield _increment_sequence_number_and_return(
                         ResponseOutputItemDoneEvent(
                             type="response.output_item.done",
@@ -1606,12 +1740,15 @@ async def _process_harmony_streaming_events(
                                 action=action,
                                 status="completed",
                             ),
-                        ))
+                        )
+                    )
 
-                if (self.tool_server is not None
-                        and self.tool_server.has_tool("python")
-                        and previous_item.recipient is not None
-                        and previous_item.recipient.startswith("python")):
+                if (
+                    self.tool_server is not None
+                    and self.tool_server.has_tool("python")
+                    and previous_item.recipient is not None
+                    and previous_item.recipient.startswith("python")
+                ):
                     yield _increment_sequence_number_and_return(
                         ResponseCodeInterpreterCallCodeDoneEvent(
                             type="response.code_interpreter_call_code.done",
@@ -1619,21 +1756,24 @@ async def _process_harmony_streaming_events(
                             output_index=current_output_index,
                             item_id=current_item_id,
                             code=previous_item.content[0].text,
-                        ))
+                        )
+                    )
                     yield _increment_sequence_number_and_return(
                         ResponseCodeInterpreterCallInterpretingEvent(
                             type="response.code_interpreter_call.interpreting",
                             sequence_number=-1,
                             output_index=current_output_index,
                             item_id=current_item_id,
-                        ))
+                        )
+                    )
                     yield _increment_sequence_number_and_return(
                         ResponseCodeInterpreterCallCompletedEvent(
                             type="response.code_interpreter_call.completed",
                             sequence_number=-1,
                             output_index=current_output_index,
                             item_id=current_item_id,
-                        ))
+                        )
+                    )
                     yield _increment_sequence_number_and_return(
                         ResponseOutputItemDoneEvent(
                             type="response.output_item.done",
@@ -1648,7 +1788,8 @@ async def _process_harmony_streaming_events(
                                 outputs=[],
                                 status="completed",
                             ),
-                        ))
+                        )
+                    )
 
     async def responses_stream_generator(
         self,
@@ -1669,11 +1810,11 @@ async def responses_stream_generator(
         sequence_number = 0
 
         def _increment_sequence_number_and_return(
-                event: StreamingResponsesResponse
+            event: StreamingResponsesResponse,
         ) -> StreamingResponsesResponse:
             nonlocal sequence_number
             # Set sequence_number if the event has this attribute
-            if hasattr(event, 'sequence_number'):
+            if hasattr(event, "sequence_number"):
                 event.sequence_number = sequence_number
             sequence_number += 1
             return event
@@ -1683,8 +1824,7 @@ def _increment_sequence_number_and_return(
             if self.use_harmony:
                 # TODO: in streaming, we noticed this bug:
                 # https://github.com/vllm-project/vllm/issues/25697
-                await self._initialize_tool_sessions(request, context,
-                                                     exit_stack)
+                await self._initialize_tool_sessions(request, context, exit_stack)
                 processer = self._process_harmony_streaming_events
             else:
                 processer = self._process_simple_streaming_events
@@ -1703,18 +1843,27 @@ def _increment_sequence_number_and_return(
                     type="response.created",
                     sequence_number=-1,
                     response=initial_response,
-                ))
+                )
+            )
             yield _increment_sequence_number_and_return(
                 ResponseInProgressEvent(
                     type="response.in_progress",
                     sequence_number=-1,
                     response=initial_response,
-                ))
+                )
+            )
 
             async for event_data in processer(
-                    request, sampling_params, result_generator, context,
-                    model_name, tokenizer, request_metadata, created_time,
-                    _increment_sequence_number_and_return):
+                request,
+                sampling_params,
+                result_generator,
+                context,
+                model_name,
+                tokenizer,
+                request_metadata,
+                created_time,
+                _increment_sequence_number_and_return,
+            ):
                 yield event_data
 
             async def empty_async_generator():
@@ -1738,4 +1887,5 @@ async def empty_async_generator():
                     type="response.completed",
                     sequence_number=-1,
                     response=final_response.model_dump(),
-                ))
+                )
+            )
diff --git a/vllm/entrypoints/openai/serving_score.py b/vllm/entrypoints/openai/serving_score.py
index 623b1c863f77..393fd2c2e0b1 100644
--- a/vllm/entrypoints/openai/serving_score.py
+++ b/vllm/entrypoints/openai/serving_score.py
@@ -10,21 +10,32 @@
 from vllm.config import ModelConfig
 from vllm.engine.protocol import EngineClient
 from vllm.entrypoints.logger import RequestLogger
-from vllm.entrypoints.openai.protocol import (ErrorResponse, RerankDocument,
-                                              RerankRequest, RerankResponse,
-                                              RerankResult, RerankUsage,
-                                              ScoreRequest, ScoreResponse,
-                                              ScoreResponseData, UsageInfo)
+from vllm.entrypoints.openai.protocol import (
+    ErrorResponse,
+    RerankDocument,
+    RerankRequest,
+    RerankResponse,
+    RerankResult,
+    RerankUsage,
+    ScoreRequest,
+    ScoreResponse,
+    ScoreResponseData,
+    UsageInfo,
+)
 from vllm.entrypoints.openai.serving_engine import OpenAIServing
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.entrypoints.score_utils import (ScoreContentPartParam,
-                                          ScoreMultiModalParam,
-                                          _cosine_similarity,
-                                          _validate_score_input_lens,
-                                          compress_token_type_ids,
-                                          get_score_prompt)
+from vllm.entrypoints.score_utils import (
+    ScoreContentPartParam,
+    ScoreMultiModalParam,
+    _cosine_similarity,
+    _validate_score_input_lens,
+    compress_token_type_ids,
+    get_score_prompt,
+)
+
 # yapf: enable
 from vllm.entrypoints.utils import _validate_truncation_size
 from vllm.inputs.data import TokensPrompt
@@ -38,7 +49,6 @@
 
 
 class ServingScores(OpenAIServing):
-
     def __init__(
         self,
         engine_client: EngineClient,
@@ -48,11 +58,13 @@ def __init__(
         request_logger: Optional[RequestLogger],
         log_error_stack: bool = False,
     ) -> None:
-        super().__init__(engine_client=engine_client,
-                         model_config=model_config,
-                         models=models,
-                         request_logger=request_logger,
-                         log_error_stack=log_error_stack)
+        super().__init__(
+            engine_client=engine_client,
+            model_config=model_config,
+            models=models,
+            request_logger=request_logger,
+            log_error_stack=log_error_stack,
+        )
 
     async def _embedding_score(
         self,
@@ -68,24 +80,23 @@ async def _embedding_score(
         input_texts = texts_1 + texts_2
 
         engine_prompts: list[TokensPrompt] = []
-        tokenize_async = make_async(tokenizer.__call__,
-                                    executor=self._tokenizer_executor)
+        tokenize_async = make_async(
+            tokenizer.__call__, executor=self._tokenizer_executor
+        )
 
         tokenization_kwargs = tokenization_kwargs or {}
         tokenized_prompts = await asyncio.gather(
-            *(tokenize_async(t, **tokenization_kwargs) for t in input_texts))
+            *(tokenize_async(t, **tokenization_kwargs) for t in input_texts)
+        )
 
         for tok_result, input_text in zip(tokenized_prompts, input_texts):
-
-            text_token_prompt = \
-                self._validate_input(
-                    request,
-                    tok_result["input_ids"],
-                    input_text)
+            text_token_prompt = self._validate_input(
+                request, tok_result["input_ids"], input_text
+            )
 
             engine_prompts.append(
-                TokensPrompt(
-                    prompt_token_ids=text_token_prompt["prompt_token_ids"]))
+                TokensPrompt(prompt_token_ids=text_token_prompt["prompt_token_ids"])
+            )
 
         # Schedule the request and get the result generator.
         generators: list[AsyncGenerator[PoolingRequestOutput, None]] = []
@@ -97,13 +108,14 @@ async def _embedding_score(
             return self.create_error_response(str(e))
 
         for i, engine_prompt in enumerate(engine_prompts):
-
             request_id_item = f"{request_id}-{i}"
 
-            self._log_inputs(request_id_item,
-                             input_texts[i],
-                             params=pooling_params,
-                             lora_request=lora_request)
+            self._log_inputs(
+                request_id_item,
+                input_texts[i],
+                params=pooling_params,
+                lora_request=lora_request,
+            )
 
             generators.append(
                 self.engine_client.encode(
@@ -113,15 +125,15 @@ async def _embedding_score(
                     lora_request=lora_request,
                     trace_headers=trace_headers,
                     priority=request.priority,
-                ))
+                )
+            )
 
         result_generator = merge_async_iterators(*generators)
 
         # Non-streaming response
         final_res_batch: list[PoolingRequestOutput] = []
 
-        embeddings: list[Optional[PoolingRequestOutput]] =\
-              [None] * len(engine_prompts)
+        embeddings: list[Optional[PoolingRequestOutput]] = [None] * len(engine_prompts)
 
         async for i, res in result_generator:
             embeddings[i] = res
@@ -140,9 +152,9 @@ async def _embedding_score(
         if len(emb_texts_1) == 1:
             emb_texts_1 = emb_texts_1 * len(emb_texts_2)
 
-        final_res_batch = _cosine_similarity(tokenizer=tokenizer,
-                                             embed_1=emb_texts_1,
-                                             embed_2=emb_texts_2)
+        final_res_batch = _cosine_similarity(
+            tokenizer=tokenizer, embed_1=emb_texts_1, embed_2=emb_texts_2
+        )
 
         return final_res_batch
 
@@ -154,7 +166,6 @@ def _preprocess_score(
         data_1: Union[str, ScoreContentPartParam],
         data_2: Union[str, ScoreContentPartParam],
     ) -> tuple[str, TokensPrompt]:
-
         model_config = self.model_config
 
         full_prompt, engine_prompt = get_score_prompt(
@@ -164,8 +175,7 @@ def _preprocess_score(
             tokenizer=tokenizer,
             tokenization_kwargs=tokenization_kwargs,
         )
-        self._validate_input(request, engine_prompt["prompt_token_ids"],
-                             full_prompt)
+        self._validate_input(request, engine_prompt["prompt_token_ids"], full_prompt)
         if request.mm_processor_kwargs is not None:
             engine_prompt["mm_processor_kwargs"] = request.mm_processor_kwargs
 
@@ -189,22 +199,28 @@ async def _cross_encoding_score(
             data_1 = data_1 * len(data_2)
 
         if isinstance(tokenizer, MistralTokenizer):
-            raise ValueError(
-                "MistralTokenizer not supported for cross-encoding")
+            raise ValueError("MistralTokenizer not supported for cross-encoding")
 
         tokenization_kwargs = tokenization_kwargs or {}
 
         input_pairs = [(t1, t2) for t1, t2 in zip(data_1, data_2)]
 
-        preprocess_async = make_async(self._preprocess_score,
-                                      executor=self._tokenizer_executor)
+        preprocess_async = make_async(
+            self._preprocess_score, executor=self._tokenizer_executor
+        )
 
         preprocessed_prompts = await asyncio.gather(
-            *(preprocess_async(request=request,
-                               tokenizer=tokenizer,
-                               tokenization_kwargs=tokenization_kwargs,
-                               data_1=t1,
-                               data_2=t2) for t1, t2 in input_pairs))
+            *(
+                preprocess_async(
+                    request=request,
+                    tokenizer=tokenizer,
+                    tokenization_kwargs=tokenization_kwargs,
+                    data_1=t1,
+                    data_2=t2,
+                )
+                for t1, t2 in input_pairs
+            )
+        )
 
         for full_prompt, engine_prompt in preprocessed_prompts:
             request_prompts.append(full_prompt)
@@ -223,19 +239,19 @@ async def _cross_encoding_score(
         for i, engine_prompt in enumerate(engine_prompts):
             request_id_item = f"{request_id}-{i}"
 
-            self._log_inputs(request_id_item,
-                             request_prompts[i],
-                             params=default_pooling_params,
-                             lora_request=lora_request)
+            self._log_inputs(
+                request_id_item,
+                request_prompts[i],
+                params=default_pooling_params,
+                lora_request=lora_request,
+            )
 
-            if (token_type_ids := engine_prompt.pop("token_type_ids", None)):
+            if token_type_ids := engine_prompt.pop("token_type_ids", None):
                 pooling_params = default_pooling_params.clone()
                 compressed = compress_token_type_ids(token_type_ids)
-                pooling_params.extra_kwargs = {
-                    "compressed_token_type_ids": compressed
-                }
+                pooling_params.extra_kwargs = {"compressed_token_type_ids": compressed}
             else:
-                pooling_params = (default_pooling_params)
+                pooling_params = default_pooling_params
 
             generator = self.engine_client.encode(
                 engine_prompt,
@@ -251,8 +267,9 @@ async def _cross_encoding_score(
         result_generator = merge_async_iterators(*generators)
 
         # Non-streaming response
-        final_res_batch: list[
-            Optional[PoolingRequestOutput]] = [None] * len(engine_prompts)
+        final_res_batch: list[Optional[PoolingRequestOutput]] = [None] * len(
+            engine_prompts
+        )
 
         async for i, res in result_generator:
             final_res_batch[i] = res
@@ -271,18 +288,22 @@ async def _run_scoring(
 
         tokenizer = await self.engine_client.get_tokenizer()
 
-        truncate_prompt_tokens = getattr(request, "truncate_prompt_tokens",
-                                         None)
+        truncate_prompt_tokens = getattr(request, "truncate_prompt_tokens", None)
 
         tokenization_kwargs: dict[str, Any] = {}
-        _validate_truncation_size(self.max_model_len, truncate_prompt_tokens,
-                                  tokenization_kwargs)
+        _validate_truncation_size(
+            self.max_model_len, truncate_prompt_tokens, tokenization_kwargs
+        )
 
-        trace_headers = (None if raw_request is None else await
-                         self._get_trace_headers(raw_request.headers))
+        trace_headers = (
+            None
+            if raw_request is None
+            else await self._get_trace_headers(raw_request.headers)
+        )
 
-        if not self.model_config.is_multimodal_model and (isinstance(
-                data_1, dict) or isinstance(data_2, dict)):
+        if not self.model_config.is_multimodal_model and (
+            isinstance(data_1, dict) or isinstance(data_2, dict)
+        ):
             raise ValueError(
                 f"MultiModalParam is not supported for {self.model_config.architecture}"  # noqa: E501
             )
@@ -308,7 +329,8 @@ async def _run_scoring(
                 request_id=request_id,
                 tokenization_kwargs=tokenization_kwargs,
                 lora_request=lora_request,
-                trace_headers=trace_headers)
+                trace_headers=trace_headers,
+            )
 
         else:
             return await self._embedding_score(
@@ -319,7 +341,8 @@ async def _run_scoring(
                 request_id=request_id,
                 tokenization_kwargs=tokenization_kwargs,
                 lora_request=lora_request,
-                trace_headers=trace_headers)
+                trace_headers=trace_headers,
+            )
 
     async def create_score(
         self,
@@ -362,9 +385,7 @@ async def create_score(
             return self.create_error_response(str(e))
 
     async def do_rerank(
-        self,
-        request: RerankRequest,
-        raw_request: Optional[Request] = None
+        self, request: RerankRequest, raw_request: Optional[Request] = None
     ) -> Union[RerankResponse, ErrorResponse]:
         """
         Rerank API based on JinaAI's rerank API; implements the same
@@ -381,9 +402,15 @@ async def do_rerank(
 
         request_id = f"rerank-{self._base_request_id(raw_request)}"
         documents = request.documents
-        top_n = request.top_n if request.top_n > 0 else (
-            len(documents)
-            if isinstance(documents, list) else len(documents["content"]))
+        top_n = (
+            request.top_n
+            if request.top_n > 0
+            else (
+                len(documents)
+                if isinstance(documents, list)
+                else len(documents["content"])
+            )
+        )
 
         try:
             final_res_batch = await self._run_scoring(
@@ -445,9 +472,13 @@ def request_output_to_score_response(
         )
 
     def request_output_to_rerank_response(
-            self, final_res_batch: list[PoolingRequestOutput], request_id: str,
-            model_name: str, documents: Union[list[str], ScoreMultiModalParam],
-            top_n: int) -> RerankResponse:
+        self,
+        final_res_batch: list[PoolingRequestOutput],
+        request_id: str,
+        model_name: str,
+        documents: Union[list[str], ScoreMultiModalParam],
+        top_n: int,
+    ) -> RerankResponse:
         """
         Convert the output of do_rank to a RerankResponse
         """
@@ -458,9 +489,9 @@ def request_output_to_rerank_response(
 
             result = RerankResult(
                 index=idx,
-                document=RerankDocument(text=documents[idx]) if isinstance(
-                    documents, list) else RerankDocument(
-                        multi_modal=documents["content"][idx]),
+                document=RerankDocument(text=documents[idx])
+                if isinstance(documents, list)
+                else RerankDocument(multi_modal=documents["content"][idx]),
                 relevance_score=classify_res.outputs.score,
             )
             results.append(result)
@@ -476,4 +507,5 @@ def request_output_to_rerank_response(
             id=request_id,
             model=model_name,
             results=results,
-            usage=RerankUsage(total_tokens=num_prompt_tokens))
+            usage=RerankUsage(total_tokens=num_prompt_tokens),
+        )
diff --git a/vllm/entrypoints/openai/serving_tokenization.py b/vllm/entrypoints/openai/serving_tokenization.py
index 1a39fb123210..fd6c6be9ee2a 100644
--- a/vllm/entrypoints/openai/serving_tokenization.py
+++ b/vllm/entrypoints/openai/serving_tokenization.py
@@ -10,15 +10,19 @@
 from vllm.engine.protocol import EngineClient
 from vllm.entrypoints.chat_utils import ChatTemplateContentFormatOption
 from vllm.entrypoints.logger import RequestLogger
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.entrypoints.openai.protocol import (DetokenizeRequest,
-                                              DetokenizeResponse,
-                                              ErrorResponse,
-                                              TokenizeChatRequest,
-                                              TokenizeRequest,
-                                              TokenizeResponse,
-                                              TokenizerInfoResponse)
+from vllm.entrypoints.openai.protocol import (
+    DetokenizeRequest,
+    DetokenizeResponse,
+    ErrorResponse,
+    TokenizeChatRequest,
+    TokenizeRequest,
+    TokenizeResponse,
+    TokenizerInfoResponse,
+)
+
 # yapf: enable
 from vllm.entrypoints.openai.serving_engine import OpenAIServing
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
@@ -30,7 +34,6 @@
 
 
 class OpenAIServingTokenization(OpenAIServing):
-
     def __init__(
         self,
         engine_client: EngineClient,
@@ -43,11 +46,13 @@ def __init__(
         trust_request_chat_template: bool = False,
         log_error_stack: bool = False,
     ) -> None:
-        super().__init__(engine_client=engine_client,
-                         model_config=model_config,
-                         models=models,
-                         request_logger=request_logger,
-                         log_error_stack=log_error_stack)
+        super().__init__(
+            engine_client=engine_client,
+            model_config=model_config,
+            models=models,
+            request_logger=request_logger,
+            log_error_stack=log_error_stack,
+        )
 
         self.chat_template = chat_template
         self.chat_template_content_format: Final = chat_template_content_format
@@ -71,13 +76,15 @@ async def create_tokenize(
             renderer = self._get_renderer(tokenizer)
 
             if isinstance(request, TokenizeChatRequest):
-                tool_dicts = (None if request.tools is None else
-                              [tool.model_dump() for tool in request.tools])
+                tool_dicts = (
+                    None
+                    if request.tools is None
+                    else [tool.model_dump() for tool in request.tools]
+                )
                 error_check_ret = self._validate_chat_template(
                     request_chat_template=request.chat_template,
                     chat_template_kwargs=request.chat_template_kwargs,
-                    trust_request_chat_template=self.
-                    trust_request_chat_template,
+                    trust_request_chat_template=self.trust_request_chat_template,
                 )
                 if error_check_ret is not None:
                     return error_check_ret
@@ -91,8 +98,7 @@ async def create_tokenize(
                     request.messages,
                     tool_dicts=tool_dicts,
                     chat_template=request.chat_template or self.chat_template,
-                    chat_template_content_format=self.
-                    chat_template_content_format,
+                    chat_template_content_format=self.chat_template_content_format,
                     add_generation_prompt=request.add_generation_prompt,
                     continue_final_message=request.continue_final_message,
                     chat_template_kwargs=request.chat_template_kwargs,
@@ -109,23 +115,23 @@ async def create_tokenize(
 
         input_ids: list[int] = []
         for engine_prompt in engine_prompts:
-            self._log_inputs(request_id,
-                             engine_prompt,
-                             params=None,
-                             lora_request=lora_request)
+            self._log_inputs(
+                request_id, engine_prompt, params=None, lora_request=lora_request
+            )
 
-            if isinstance(engine_prompt,
-                          dict) and "prompt_token_ids" in engine_prompt:
+            if isinstance(engine_prompt, dict) and "prompt_token_ids" in engine_prompt:
                 input_ids.extend(engine_prompt["prompt_token_ids"])
 
         token_strs = None
         if request.return_token_strs:
             token_strs = tokenizer.convert_ids_to_tokens(input_ids)
 
-        return TokenizeResponse(tokens=input_ids,
-                                token_strs=token_strs,
-                                count=len(input_ids),
-                                max_model_len=self.max_model_len)
+        return TokenizeResponse(
+            tokens=input_ids,
+            token_strs=token_strs,
+            count=len(input_ids),
+            max_model_len=self.max_model_len,
+        )
 
     async def create_detokenize(
         self,
@@ -142,10 +148,9 @@ async def create_detokenize(
 
         tokenizer = await self.engine_client.get_tokenizer()
 
-        self._log_inputs(request_id,
-                         request.tokens,
-                         params=None,
-                         lora_request=lora_request)
+        self._log_inputs(
+            request_id, request.tokens, params=None, lora_request=lora_request
+        )
 
         prompt_input = await self._tokenize_prompt_input_async(
             request,
@@ -157,15 +162,15 @@ async def create_detokenize(
         return DetokenizeResponse(prompt=input_text)
 
     async def get_tokenizer_info(
-        self, ) -> Union[TokenizerInfoResponse, ErrorResponse]:
+        self,
+    ) -> Union[TokenizerInfoResponse, ErrorResponse]:
         """Get comprehensive tokenizer information."""
         try:
             tokenizer = await self.engine_client.get_tokenizer()
             info = TokenizerInfo(tokenizer, self.chat_template).to_dict()
             return TokenizerInfoResponse(**info)
         except Exception as e:
-            return self.create_error_response(
-                f"Failed to get tokenizer info: {str(e)}")
+            return self.create_error_response(f"Failed to get tokenizer info: {str(e)}")
 
     def _build_render_config(self, request: TokenizeRequest) -> RenderConfig:
         return RenderConfig(add_special_tokens=request.add_special_tokens)
diff --git a/vllm/entrypoints/openai/serving_transcription.py b/vllm/entrypoints/openai/serving_transcription.py
index 9ba58d442522..6cc31c1e08d3 100644
--- a/vllm/entrypoints/openai/serving_transcription.py
+++ b/vllm/entrypoints/openai/serving_transcription.py
@@ -9,10 +9,17 @@
 from vllm.engine.protocol import EngineClient
 from vllm.entrypoints.logger import RequestLogger
 from vllm.entrypoints.openai.protocol import (
-    ErrorResponse, RequestResponseMetadata, TranscriptionRequest,
-    TranscriptionResponse, TranscriptionResponseStreamChoice,
-    TranscriptionStreamResponse, TranslationRequest, TranslationResponse,
-    TranslationResponseStreamChoice, TranslationStreamResponse)
+    ErrorResponse,
+    RequestResponseMetadata,
+    TranscriptionRequest,
+    TranscriptionResponse,
+    TranscriptionResponseStreamChoice,
+    TranscriptionStreamResponse,
+    TranslationRequest,
+    TranslationResponse,
+    TranslationResponseStreamChoice,
+    TranslationStreamResponse,
+)
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
 from vllm.entrypoints.openai.speech_to_text import OpenAISpeechToText
 from vllm.logger import init_logger
@@ -34,19 +41,19 @@ def __init__(
         return_tokens_as_token_ids: bool = False,
         log_error_stack: bool = False,
     ):
-        super().__init__(engine_client=engine_client,
-                         model_config=model_config,
-                         models=models,
-                         request_logger=request_logger,
-                         return_tokens_as_token_ids=return_tokens_as_token_ids,
-                         task_type="transcribe",
-                         log_error_stack=log_error_stack)
+        super().__init__(
+            engine_client=engine_client,
+            model_config=model_config,
+            models=models,
+            request_logger=request_logger,
+            return_tokens_as_token_ids=return_tokens_as_token_ids,
+            task_type="transcribe",
+            log_error_stack=log_error_stack,
+        )
 
     async def create_transcription(
-        self, audio_data: bytes, request: TranscriptionRequest,
-        raw_request: Request
-    ) -> Union[TranscriptionResponse, AsyncGenerator[str, None],
-               ErrorResponse]:
+        self, audio_data: bytes, request: TranscriptionRequest, raw_request: Request
+    ) -> Union[TranscriptionResponse, AsyncGenerator[str, None], ErrorResponse]:
         """Transcription API similar to OpenAI's API.
 
         See https://platform.openai.com/docs/api-reference/audio/createTranscription
@@ -61,10 +68,13 @@ async def create_transcription(
         )
 
     async def transcription_stream_generator(
-            self, request: TranscriptionRequest,
-            result_generator: list[AsyncGenerator[RequestOutput, None]],
-            request_id: str, request_metadata: RequestResponseMetadata,
-            audio_duration_s: float) -> AsyncGenerator[str, None]:
+        self,
+        request: TranscriptionRequest,
+        result_generator: list[AsyncGenerator[RequestOutput, None]],
+        request_id: str,
+        request_metadata: RequestResponseMetadata,
+        audio_duration_s: float,
+    ) -> AsyncGenerator[str, None]:
         generator = self._speech_to_text_stream_generator(
             request=request,
             list_result_generator=result_generator,
@@ -92,17 +102,18 @@ def __init__(
         return_tokens_as_token_ids: bool = False,
         log_error_stack: bool = False,
     ):
-        super().__init__(engine_client=engine_client,
-                         model_config=model_config,
-                         models=models,
-                         request_logger=request_logger,
-                         return_tokens_as_token_ids=return_tokens_as_token_ids,
-                         task_type="translate",
-                         log_error_stack=log_error_stack)
+        super().__init__(
+            engine_client=engine_client,
+            model_config=model_config,
+            models=models,
+            request_logger=request_logger,
+            return_tokens_as_token_ids=return_tokens_as_token_ids,
+            task_type="translate",
+            log_error_stack=log_error_stack,
+        )
 
     async def create_translation(
-        self, audio_data: bytes, request: TranslationRequest,
-        raw_request: Request
+        self, audio_data: bytes, request: TranslationRequest, raw_request: Request
     ) -> Union[TranslationResponse, AsyncGenerator[str, None], ErrorResponse]:
         """Translation API similar to OpenAI's API.
 
@@ -118,10 +129,13 @@ async def create_translation(
         )
 
     async def translation_stream_generator(
-            self, request: TranslationRequest,
-            result_generator: list[AsyncGenerator[RequestOutput, None]],
-            request_id: str, request_metadata: RequestResponseMetadata,
-            audio_duration_s: float) -> AsyncGenerator[str, None]:
+        self,
+        request: TranslationRequest,
+        result_generator: list[AsyncGenerator[RequestOutput, None]],
+        request_id: str,
+        request_metadata: RequestResponseMetadata,
+        audio_duration_s: float,
+    ) -> AsyncGenerator[str, None]:
         generator = self._speech_to_text_stream_generator(
             request=request,
             list_result_generator=result_generator,
diff --git a/vllm/entrypoints/openai/speech_to_text.py b/vllm/entrypoints/openai/speech_to_text.py
index 965bdac3ac5a..779498b308e8 100644
--- a/vllm/entrypoints/openai/speech_to_text.py
+++ b/vllm/entrypoints/openai/speech_to_text.py
@@ -16,12 +16,18 @@
 from vllm.engine.protocol import EngineClient
 from vllm.entrypoints.logger import RequestLogger
 from vllm.entrypoints.openai.protocol import (
-    DeltaMessage, ErrorResponse, RequestResponseMetadata,
-    TranscriptionResponse, TranscriptionResponseStreamChoice,
-    TranscriptionStreamResponse, TranslationResponse,
-    TranslationResponseStreamChoice, TranslationStreamResponse, UsageInfo)
-from vllm.entrypoints.openai.serving_engine import (OpenAIServing,
-                                                    SpeechToTextRequest)
+    DeltaMessage,
+    ErrorResponse,
+    RequestResponseMetadata,
+    TranscriptionResponse,
+    TranscriptionResponseStreamChoice,
+    TranscriptionStreamResponse,
+    TranslationResponse,
+    TranslationResponseStreamChoice,
+    TranslationStreamResponse,
+    UsageInfo,
+)
+from vllm.entrypoints.openai.serving_engine import OpenAIServing, SpeechToTextRequest
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
 from vllm.inputs.data import PromptType
 from vllm.logger import init_logger
@@ -41,7 +47,7 @@
 
 
 class OpenAISpeechToText(OpenAIServing):
-    """Base class for speech-to-text operations like transcription and 
+    """Base class for speech-to-text operations like transcription and
     translation."""
 
     def __init__(
@@ -55,30 +61,34 @@ def __init__(
         task_type: Literal["transcribe", "translate"] = "transcribe",
         log_error_stack: bool = False,
     ):
-        super().__init__(engine_client=engine_client,
-                         model_config=model_config,
-                         models=models,
-                         request_logger=request_logger,
-                         return_tokens_as_token_ids=return_tokens_as_token_ids,
-                         log_error_stack=log_error_stack)
-
-        self.default_sampling_params = (
-            self.model_config.get_diff_sampling_param())
+        super().__init__(
+            engine_client=engine_client,
+            model_config=model_config,
+            models=models,
+            request_logger=request_logger,
+            return_tokens_as_token_ids=return_tokens_as_token_ids,
+            log_error_stack=log_error_stack,
+        )
+
+        self.default_sampling_params = self.model_config.get_diff_sampling_param()
         self.task_type = task_type
 
         self.asr_config = self.model_cls.get_speech_to_text_config(
-            model_config, task_type)
+            model_config, task_type
+        )
 
         self.max_audio_filesize_mb = envs.VLLM_MAX_AUDIO_CLIP_FILESIZE_MB
 
         if self.default_sampling_params:
             logger.info(
                 "Overwriting default completion sampling param with: %s",
-                self.default_sampling_params)
+                self.default_sampling_params,
+            )
 
     @cached_property
     def model_cls(self) -> type[SupportsTranscription]:
         from vllm.model_executor.model_loader import get_model_cls
+
         model_cls = get_model_cls(self.model_config)
         return cast(type[SupportsTranscription], model_cls)
 
@@ -90,8 +100,11 @@ async def _preprocess_speech_to_text(
         # Validate request
         language = self.model_cls.validate_language(request.language)
         # Skip to_language validation to avoid extra logging for Whisper.
-        to_language = self.model_cls.validate_language(request.to_language) \
-            if request.to_language else None
+        to_language = (
+            self.model_cls.validate_language(request.to_language)
+            if request.to_language
+            else None
+        )
 
         if len(audio_data) / 1024**2 > self.max_audio_filesize_mb:
             raise ValueError("Maximum file size exceeded.")
@@ -102,8 +115,10 @@ async def _preprocess_speech_to_text(
             y, sr = librosa.load(bytes_, sr=self.asr_config.sample_rate)
 
         duration = librosa.get_duration(y=y, sr=sr)
-        do_split_audio = (self.asr_config.allow_audio_chunking
-                          and duration > self.asr_config.max_audio_clip_s)
+        do_split_audio = (
+            self.asr_config.allow_audio_chunking
+            and duration > self.asr_config.max_audio_clip_s
+        )
         chunks = [y] if not do_split_audio else self._split_audio(y, int(sr))
         prompts = []
         for chunk in chunks:
@@ -129,7 +144,7 @@ async def _create_speech_to_text(
         response_class: type[T],
         stream_generator_method: Callable[..., AsyncGenerator[str, None]],
     ) -> Union[T, AsyncGenerator[str, None], ErrorResponse]:
-        """Base method for speech-to-text operations like transcription and 
+        """Base method for speech-to-text operations like transcription and
         translation."""
         error_check_ret = await self._check_model(request)
         if error_check_ret is not None:
@@ -141,9 +156,10 @@ async def _create_speech_to_text(
         if self.engine_client.errored:
             raise self.engine_client.dead_error
 
-        if request.response_format not in ['text', 'json']:
+        if request.response_format not in ["text", "json"]:
             return self.create_error_response(
-                "Currently only support response_format `text` or `json`")
+                "Currently only support response_format `text` or `json`"
+            )
 
         request_id = f"{self.task_type}-{self._base_request_id(raw_request)}"
 
@@ -156,8 +172,8 @@ async def _create_speech_to_text(
 
             if lora_request:
                 return self.create_error_response(
-                    "Currently do not support LoRA for "
-                    f"{self.task_type.title()}.")
+                    f"Currently do not support LoRA for {self.task_type.title()}."
+                )
 
             prompts, duration_s = await self._preprocess_speech_to_text(
                 request=request,
@@ -168,38 +184,42 @@ async def _create_speech_to_text(
             logger.exception("Error in preprocessing prompt inputs")
             return self.create_error_response(str(e))
 
-        list_result_generator: Optional[list[AsyncGenerator[RequestOutput,
-                                                            None]]] = None
+        list_result_generator: Optional[list[AsyncGenerator[RequestOutput, None]]] = (
+            None
+        )
         try:
             # Unlike most decoder-only models, whisper generation length is not
             # constrained by the size of the input audio, which is mapped to a
             # fixed-size log-mel-spectogram.
             default_max_tokens = self.model_config.max_model_len
             sampling_params = request.to_sampling_params(
-                default_max_tokens, self.default_sampling_params)
+                default_max_tokens, self.default_sampling_params
+            )
 
             self._log_inputs(
                 request_id,
                 # It will not display special tokens like <|startoftranscript|>
                 request.prompt,
                 params=sampling_params,
-                lora_request=None)
+                lora_request=None,
+            )
 
             list_result_generator = [
                 self.engine_client.generate(
                     prompt,
                     sampling_params,
                     request_id,
-                ) for prompt in prompts
+                )
+                for prompt in prompts
             ]
         except ValueError as e:
             # TODO: Use a vllm-specific Validation Error
             return self.create_error_response(str(e))
 
         if request.stream:
-            return stream_generator_method(request, list_result_generator,
-                                           request_id, request_metadata,
-                                           duration_s)
+            return stream_generator_method(
+                request, list_result_generator, request_id, request_metadata, duration_s
+            )
         # Non-streaming response.
         try:
             assert list_result_generator is not None
@@ -215,12 +235,10 @@ async def _create_speech_to_text(
                     # rounded up as per openAI specs
                     "seconds": int(math.ceil(duration_s)),
                 }
-                final_response = cast(T, response_class(text=text,
-                                                        usage=usage))
+                final_response = cast(T, response_class(text=text, usage=usage))
             else:
                 # no usage in response for translation task
-                final_response = cast(
-                    T, response_class(text=text))  # type: ignore[call-arg]
+                final_response = cast(T, response_class(text=text))  # type: ignore[call-arg]
 
             return final_response
         except asyncio.CancelledError:
@@ -239,9 +257,11 @@ async def _speech_to_text_stream_generator(
         chunk_object_type: Literal["translation.chunk", "transcription.chunk"],
         response_stream_choice_class: Union[
             type[TranscriptionResponseStreamChoice],
-            type[TranslationResponseStreamChoice]],
-        stream_response_class: Union[type[TranscriptionStreamResponse],
-                                     type[TranslationStreamResponse]],
+            type[TranslationResponseStreamChoice],
+        ],
+        stream_response_class: Union[
+            type[TranscriptionStreamResponse], type[TranslationStreamResponse]
+        ],
     ) -> AsyncGenerator[str, None]:
         created_time = int(time.time())
         model_name = request.model
@@ -249,11 +269,14 @@ async def _speech_to_text_stream_generator(
         completion_tokens = 0
         num_prompt_tokens = 0
 
-        include_usage = request.stream_include_usage \
-            if request.stream_include_usage else False
-        include_continuous_usage = request.stream_continuous_usage_stats\
-            if include_usage and request.stream_continuous_usage_stats\
+        include_usage = (
+            request.stream_include_usage if request.stream_include_usage else False
+        )
+        include_continuous_usage = (
+            request.stream_continuous_usage_stats
+            if include_usage and request.stream_continuous_usage_stats
             else False
+        )
 
         try:
             for result_generator in list_result_generator:
@@ -262,8 +285,8 @@ async def _speech_to_text_stream_generator(
                     if res.prompt_token_ids is not None:
                         num_prompt_tokens = len(res.prompt_token_ids)
                         if audio_tokens := self.model_cls.get_num_audio_tokens(
-                                audio_duration_s, self.asr_config,
-                                self.model_config):
+                            audio_duration_s, self.asr_config, self.model_config
+                        ):
                             num_prompt_tokens += audio_tokens
 
                     # We need to do it here, because if there are exceptions in
@@ -279,20 +302,22 @@ async def _speech_to_text_stream_generator(
 
                     if output.finish_reason is None:
                         # Still generating, send delta update.
-                        choice_data = response_stream_choice_class(
-                            delta=delta_message)
+                        choice_data = response_stream_choice_class(delta=delta_message)
                     else:
                         # Model is finished generating.
                         choice_data = response_stream_choice_class(
                             delta=delta_message,
                             finish_reason=output.finish_reason,
-                            stop_reason=output.stop_reason)
+                            stop_reason=output.stop_reason,
+                        )
 
-                    chunk = stream_response_class(id=request_id,
-                                                  object=chunk_object_type,
-                                                  created=created_time,
-                                                  choices=[choice_data],
-                                                  model=model_name)
+                    chunk = stream_response_class(
+                        id=request_id,
+                        object=chunk_object_type,
+                        created=created_time,
+                        choices=[choice_data],
+                        model=model_name,
+                    )
 
                     # handle usage stats if requested & if continuous
                     if include_continuous_usage:
@@ -308,10 +333,11 @@ async def _speech_to_text_stream_generator(
             # Once the final token is handled, if stream_options.include_usage
             # is sent, send the usage.
             if include_usage:
-                final_usage = UsageInfo(prompt_tokens=num_prompt_tokens,
-                                        completion_tokens=completion_tokens,
-                                        total_tokens=num_prompt_tokens +
-                                        completion_tokens)
+                final_usage = UsageInfo(
+                    prompt_tokens=num_prompt_tokens,
+                    completion_tokens=completion_tokens,
+                    total_tokens=num_prompt_tokens + completion_tokens,
+                )
 
                 final_usage_chunk = stream_response_class(
                     id=request_id,
@@ -319,16 +345,19 @@ async def _speech_to_text_stream_generator(
                     created=created_time,
                     choices=[],
                     model=model_name,
-                    usage=final_usage)
-                final_usage_data = (final_usage_chunk.model_dump_json(
-                    exclude_unset=True, exclude_none=True))
+                    usage=final_usage,
+                )
+                final_usage_data = final_usage_chunk.model_dump_json(
+                    exclude_unset=True, exclude_none=True
+                )
                 yield f"data: {final_usage_data}\n\n"
 
             # report to FastAPI middleware aggregate usage across all choices
             request_metadata.final_usage_info = UsageInfo(
                 prompt_tokens=num_prompt_tokens,
                 completion_tokens=completion_tokens,
-                total_tokens=num_prompt_tokens + completion_tokens)
+                total_tokens=num_prompt_tokens + completion_tokens,
+            )
 
         except Exception as e:
             # TODO: Use a vllm-specific Validation Error
@@ -338,8 +367,9 @@ async def _speech_to_text_stream_generator(
         # Send the final done message after all response.n are finished
         yield "data: [DONE]\n\n"
 
-    def _split_audio(self, audio_data: np.ndarray,
-                     sample_rate: int) -> list[np.ndarray]:
+    def _split_audio(
+        self, audio_data: np.ndarray, sample_rate: int
+    ) -> list[np.ndarray]:
         chunk_size = sample_rate * self.asr_config.max_audio_clip_s
         overlap_size = sample_rate * self.asr_config.overlap_chunk_second
         chunks = []
@@ -353,17 +383,15 @@ def _split_audio(self, audio_data: np.ndarray,
             # Find the best split point in the overlap region
             search_start = i + chunk_size - overlap_size
             search_end = min(i + chunk_size, audio_data.shape[-1])
-            split_point = self._find_split_point(audio_data, search_start,
-                                                 search_end)
+            split_point = self._find_split_point(audio_data, search_start, search_end)
 
             # Extract chunk up to the split point
             chunks.append(audio_data[..., i:split_point])
             i = split_point
         return chunks
 
-    def _find_split_point(self, wav: np.ndarray, start_idx: int,
-                          end_idx: int) -> int:
-        """Find the best point to split audio by 
+    def _find_split_point(self, wav: np.ndarray, start_idx: int, end_idx: int) -> int:
+        """Find the best point to split audio by
         looking for silence or low amplitude.
         Args:
             wav: Audio tensor [1, T]
@@ -380,8 +408,8 @@ def _find_split_point(self, wav: np.ndarray, start_idx: int,
         min_energy_window = self.asr_config.min_energy_split_window_size
         assert min_energy_window is not None
         for i in range(0, len(segment) - min_energy_window, min_energy_window):
-            window = segment[i:i + min_energy_window]
-            energy = (window**2).mean()**0.5
+            window = segment[i : i + min_energy_window]
+            energy = (window**2).mean() ** 0.5
             if energy < min_energy:
                 quietest_idx = i + start_idx
                 min_energy = energy
diff --git a/vllm/entrypoints/openai/tool_parsers/abstract_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/abstract_tool_parser.py
index 02aeab613631..e6ee2fa777f8 100644
--- a/vllm/entrypoints/openai/tool_parsers/abstract_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/abstract_tool_parser.py
@@ -6,9 +6,11 @@
 from functools import cached_property
 from typing import Callable, Optional, Union
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaMessage,
-                                              ExtractedToolCallInformation)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaMessage,
+    ExtractedToolCallInformation,
+)
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 from vllm.utils import import_from_path, is_list_of
@@ -38,16 +40,15 @@ def vocab(self) -> dict[str, int]:
         # whereas all tokenizers have .get_vocab()
         return self.model_tokenizer.get_vocab()
 
-    def adjust_request(
-            self, request: ChatCompletionRequest) -> ChatCompletionRequest:
+    def adjust_request(self, request: ChatCompletionRequest) -> ChatCompletionRequest:
         """
         Static method that used to adjust the request parameters.
         """
         return request
 
     def extract_tool_calls(
-            self, model_output: str,
-            request: ChatCompletionRequest) -> ExtractedToolCallInformation:
+        self, model_output: str, request: ChatCompletionRequest
+    ) -> ExtractedToolCallInformation:
         """
         Static method that should be implemented for extracting tool calls from
         a complete model-generated string.
@@ -56,7 +57,8 @@ def extract_tool_calls(
         Static because it's stateless.
         """
         raise NotImplementedError(
-            "AbstractToolParser.extract_tool_calls has not been implemented!")
+            "AbstractToolParser.extract_tool_calls has not been implemented!"
+        )
 
     def extract_tool_calls_streaming(
         self,
@@ -76,8 +78,8 @@ def extract_tool_calls_streaming(
         previously been parsed and extracted (see constructor)
         """
         raise NotImplementedError(
-            "AbstractToolParser.extract_tool_calls_streaming has not been "
-            "implemented!")
+            "AbstractToolParser.extract_tool_calls_streaming has not been implemented!"
+        )
 
 
 class ToolParserManager:
@@ -96,13 +98,15 @@ def get_tool_parser(cls, name) -> type:
         raise KeyError(f"tool helper: '{name}' not found in tool_parsers")
 
     @classmethod
-    def _register_module(cls,
-                         module: type,
-                         module_name: Optional[Union[str, list[str]]] = None,
-                         force: bool = True) -> None:
+    def _register_module(
+        cls,
+        module: type,
+        module_name: Optional[Union[str, list[str]]] = None,
+        force: bool = True,
+    ) -> None:
         if not issubclass(module, ToolParser):
             raise TypeError(
-                f'module must be subclass of ToolParser, but got {type(module)}'
+                f"module must be subclass of ToolParser, but got {type(module)}"
             )
         if module_name is None:
             module_name = module.__name__
@@ -111,30 +115,32 @@ def _register_module(cls,
         for name in module_name:
             if not force and name in cls.tool_parsers:
                 existed_module = cls.tool_parsers[name]
-                raise KeyError(f'{name} is already registered '
-                               f'at {existed_module.__module__}')
+                raise KeyError(
+                    f"{name} is already registered at {existed_module.__module__}"
+                )
             cls.tool_parsers[name] = module
 
     @classmethod
     def register_module(
-            cls,
-            name: Optional[Union[str, list[str]]] = None,
-            force: bool = True,
-            module: Union[type, None] = None) -> Union[type, Callable]:
+        cls,
+        name: Optional[Union[str, list[str]]] = None,
+        force: bool = True,
+        module: Union[type, None] = None,
+    ) -> Union[type, Callable]:
         """
         Register module with the given name or name list. it can be used as a
-        decoder(with module as None) or normal function(with module as not 
+        decoder(with module as None) or normal function(with module as not
         None).
         """
         if not isinstance(force, bool):
-            raise TypeError(f'force must be a boolean, but got {type(force)}')
+            raise TypeError(f"force must be a boolean, but got {type(force)}")
 
         # raise the error ahead of time
-        if not (name is None or isinstance(name, str)
-                or is_list_of(name, str)):
+        if not (name is None or isinstance(name, str) or is_list_of(name, str)):
             raise TypeError(
-                'name must be None, an instance of str, or a sequence of str, '
-                f'but got {type(name)}')
+                "name must be None, an instance of str, or a sequence of str, "
+                f"but got {type(name)}"
+            )
 
         # use it as a normal method: x.register_module(module=SomeClass)
         if module is not None:
@@ -159,6 +165,7 @@ def import_tool_parser(cls, plugin_path: str) -> None:
         try:
             import_from_path(module_name, plugin_path)
         except Exception:
-            logger.exception("Failed to load module '%s' from %s.",
-                             module_name, plugin_path)
+            logger.exception(
+                "Failed to load module '%s' from %s.", module_name, plugin_path
+            )
             return
diff --git a/vllm/entrypoints/openai/tool_parsers/deepseekv31_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/deepseekv31_tool_parser.py
index 09095f899177..c6e8f1686e24 100644
--- a/vllm/entrypoints/openai/tool_parsers/deepseekv31_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/deepseekv31_tool_parser.py
@@ -7,13 +7,19 @@
 import regex as re
 
 from vllm.entrypoints.chat_utils import make_tool_call_id
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
+    ToolParser,
+    ToolParserManager,
+)
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
@@ -22,15 +28,15 @@
 
 @ToolParserManager.register_module("deepseek_v31")
 class DeepSeekV31ToolParser(ToolParser):
-
     def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
 
         self.current_tool_name_sent: bool = False
         self.prev_tool_call_arr: list[dict] = []
         self.current_tool_id: int = -1
-        self.streamed_args_for_tool: list[str] = (
-            [])  # map what has been streamed for each tool so far to a list
+        self.streamed_args_for_tool: list[
+            str
+        ] = []  # map what has been streamed for each tool so far to a list
 
         self.tool_calls_start_token: str = "<｜tool▁calls▁begin｜>"
         self.tool_calls_end_token: str = "<｜tool▁calls▁end｜>"
@@ -43,41 +49,43 @@ def __init__(self, tokenizer: AnyTokenizer):
         )
 
         self.stream_tool_call_portion_regex = re.compile(
-            r"(?P<function_name>.*)<｜tool▁sep｜>(?P<function_arguments>.*)")
+            r"(?P<function_name>.*)<｜tool▁sep｜>(?P<function_arguments>.*)"
+        )
 
         self.stream_tool_call_name_regex = re.compile(
-            r"(?P<function_name>.*)<｜tool▁sep｜>")
+            r"(?P<function_name>.*)<｜tool▁sep｜>"
+        )
 
         if not self.model_tokenizer:
             raise ValueError(
                 "The model tokenizer must be passed to the ToolParser "
-                "constructor during construction.")
-        self.tool_calls_start_token_id = self.vocab.get(
-            self.tool_calls_start_token)
-        self.tool_calls_end_token_id = self.vocab.get(
-            self.tool_calls_end_token)
-
-        self.tool_call_start_token_id = self.vocab.get(
-            self.tool_call_start_token)
+                "constructor during construction."
+            )
+        self.tool_calls_start_token_id = self.vocab.get(self.tool_calls_start_token)
+        self.tool_calls_end_token_id = self.vocab.get(self.tool_calls_end_token)
+
+        self.tool_call_start_token_id = self.vocab.get(self.tool_call_start_token)
         self.tool_call_end_token_id = self.vocab.get(self.tool_call_end_token)
 
-        if (self.tool_calls_start_token_id is None
-                or self.tool_calls_end_token_id is None):
+        if (
+            self.tool_calls_start_token_id is None
+            or self.tool_calls_end_token_id is None
+        ):
             raise RuntimeError(
                 "DeepSeek-V3.1 Tool parser could not locate tool call "
-                "start/end tokens in the tokenizer!")
+                "start/end tokens in the tokenizer!"
+            )
 
     def extract_tool_calls(
         self,
         model_output: str,
         request: ChatCompletionRequest,
     ) -> ExtractedToolCallInformation:
-
         # sanity check; avoid unnecessary processing
         if self.tool_calls_start_token not in model_output:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         else:
             try:
@@ -85,8 +93,7 @@ def extract_tool_calls(
                 # tag and end-of-string so the result of
                 # findall is an array of tuples where one is a function call and
                 # the other is None
-                function_call_tuples = self.tool_call_regex.findall(
-                    model_output)
+                function_call_tuples = self.tool_call_regex.findall(model_output)
 
                 tool_calls = []
                 for match in function_call_tuples:
@@ -94,12 +101,13 @@ def extract_tool_calls(
                     tool_calls.append(
                         ToolCall(
                             type="function",
-                            function=FunctionCall(name=function_name,
-                                                  arguments=function_args),
-                        ))
+                            function=FunctionCall(
+                                name=function_name, arguments=function_args
+                            ),
+                        )
+                    )
 
-                content = model_output[:model_output.
-                                       find(self.tool_calls_start_token)]
+                content = model_output[: model_output.find(self.tool_calls_start_token)]
                 return ExtractedToolCallInformation(
                     tools_called=True,
                     tool_calls=tool_calls,
@@ -107,11 +115,10 @@ def extract_tool_calls(
                 )
 
             except Exception:
-                logger.exception(
-                    "Error in extracting tool call from response.")
-                return ExtractedToolCallInformation(tools_called=False,
-                                                    tool_calls=[],
-                                                    content=model_output)
+                logger.exception("Error in extracting tool call from response.")
+                return ExtractedToolCallInformation(
+                    tools_called=False, tool_calls=[], content=model_output
+                )
 
     def extract_tool_calls_streaming(
         self,
@@ -123,55 +130,58 @@ def extract_tool_calls_streaming(
         delta_token_ids: Sequence[int],
         request: ChatCompletionRequest,
     ) -> Union[DeltaMessage, None]:
-
         logger.debug("delta_text: %s", delta_text)
         logger.debug("delta_token_ids: %s", delta_token_ids)
         # check to see if we should be streaming a tool call - is there a
         if self.tool_calls_start_token_id not in current_token_ids:
             logger.debug("No tool call tokens found!")
             return DeltaMessage(content=delta_text)
-        delta_text = delta_text.replace(self.tool_calls_start_token,
-                                        "").replace(self.tool_calls_end_token,
-                                                    "")
+        delta_text = delta_text.replace(self.tool_calls_start_token, "").replace(
+            self.tool_calls_end_token, ""
+        )
         try:
-
             # figure out where we are in the parsing by counting tool call
             # start & end tags
             prev_tool_start_count = previous_token_ids.count(
-                self.tool_call_start_token_id)
-            prev_tool_end_count = previous_token_ids.count(
-                self.tool_call_end_token_id)
+                self.tool_call_start_token_id
+            )
+            prev_tool_end_count = previous_token_ids.count(self.tool_call_end_token_id)
             cur_tool_start_count = current_token_ids.count(
-                self.tool_call_start_token_id)
-            cur_tool_end_count = current_token_ids.count(
-                self.tool_call_end_token_id)
+                self.tool_call_start_token_id
+            )
+            cur_tool_end_count = current_token_ids.count(self.tool_call_end_token_id)
             tool_call_portion = None
             text_portion = None
 
             # case: if we're generating text, OR rounding out a tool call
-            if (cur_tool_start_count == cur_tool_end_count
-                    and prev_tool_end_count == cur_tool_end_count
-                    and self.tool_call_end_token not in delta_text):
+            if (
+                cur_tool_start_count == cur_tool_end_count
+                and prev_tool_end_count == cur_tool_end_count
+                and self.tool_call_end_token not in delta_text
+            ):
                 logger.debug("Generating text content! skipping tool parsing.")
                 return DeltaMessage(content=delta_text)
 
             if self.tool_call_end_token in delta_text:
                 logger.debug("tool_call_end_token in delta_text")
                 full_text = current_text + delta_text
-                tool_call_portion = full_text.split(
-                    self.tool_call_start_token)[-1].split(
-                        self.tool_call_end_token)[0].rstrip()
-                delta_text = delta_text.split(
-                    self.tool_call_end_token)[0].rstrip()
-                text_portion = delta_text.split(
-                    self.tool_call_end_token)[-1].lstrip()
+                tool_call_portion = (
+                    full_text.split(self.tool_call_start_token)[-1]
+                    .split(self.tool_call_end_token)[0]
+                    .rstrip()
+                )
+                delta_text = delta_text.split(self.tool_call_end_token)[0].rstrip()
+                text_portion = delta_text.split(self.tool_call_end_token)[-1].lstrip()
 
             # case -- we're starting a new tool call
-            if (cur_tool_start_count > cur_tool_end_count
-                    and cur_tool_start_count > prev_tool_start_count):
+            if (
+                cur_tool_start_count > cur_tool_end_count
+                and cur_tool_start_count > prev_tool_start_count
+            ):
                 if len(delta_token_ids) > 1:
-                    tool_call_portion = current_text.split(
-                        self.tool_call_start_token)[-1]
+                    tool_call_portion = current_text.split(self.tool_call_start_token)[
+                        -1
+                    ]
                 else:
                     tool_call_portion = None
                     delta = None
@@ -185,27 +195,29 @@ def extract_tool_calls_streaming(
                 logger.debug("Starting on a new tool %s", self.current_tool_id)
 
             # case -- we're updating an existing tool call
-            elif (cur_tool_start_count > cur_tool_end_count
-                  and cur_tool_start_count == prev_tool_start_count):
-
+            elif (
+                cur_tool_start_count > cur_tool_end_count
+                and cur_tool_start_count == prev_tool_start_count
+            ):
                 # get the portion of the text that's the tool call
-                tool_call_portion = current_text.split(
-                    self.tool_call_start_token)[-1]
+                tool_call_portion = current_text.split(self.tool_call_start_token)[-1]
                 text_portion = None
 
             # case -- the current tool call is being closed.
-            elif (cur_tool_start_count == cur_tool_end_count
-                  and cur_tool_end_count >= prev_tool_end_count):
-                if self.prev_tool_call_arr is None or len(
-                        self.prev_tool_call_arr) == 0:
-                    logger.debug(
-                        "attempting to close tool call, but no tool call")
+            elif (
+                cur_tool_start_count == cur_tool_end_count
+                and cur_tool_end_count >= prev_tool_end_count
+            ):
+                if self.prev_tool_call_arr is None or len(self.prev_tool_call_arr) == 0:
+                    logger.debug("attempting to close tool call, but no tool call")
                     return None
-                diff = self.prev_tool_call_arr[self.current_tool_id].get(
-                    "arguments")
+                diff = self.prev_tool_call_arr[self.current_tool_id].get("arguments")
                 if diff:
-                    diff = (diff.encode("utf-8").decode("unicode_escape")
-                            if diff is str else diff)
+                    diff = (
+                        diff.encode("utf-8").decode("unicode_escape")
+                        if diff is str
+                        else diff
+                    )
                     if '"}' not in delta_text:
                         return None
                     end_loc = delta_text.rindex('"}')
@@ -216,13 +228,16 @@ def extract_tool_calls_streaming(
                         diff,
                     )
                     self.streamed_args_for_tool[self.current_tool_id] += diff
-                    return DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=self.current_tool_id,
-                            function=DeltaFunctionCall(
-                                arguments=diff).model_dump(exclude_none=True),
-                        )
-                    ])
+                    return DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                function=DeltaFunctionCall(arguments=diff).model_dump(
+                                    exclude_none=True
+                                ),
+                            )
+                        ]
+                    )
 
             # case -- otherwise we're just generating text
             else:
@@ -233,17 +248,17 @@ def extract_tool_calls_streaming(
 
             current_tool_call = dict()
             if tool_call_portion:
-                current_tool_call_matches = (
-                    self.stream_tool_call_portion_regex.match(
-                        tool_call_portion))
+                current_tool_call_matches = self.stream_tool_call_portion_regex.match(
+                    tool_call_portion
+                )
                 if current_tool_call_matches:
                     tool_name, tool_args = current_tool_call_matches.groups()
                     current_tool_call["name"] = tool_name
                     current_tool_call["arguments"] = tool_args
                 else:
                     current_tool_call_name_matches = (
-                        self.stream_tool_call_name_regex.match(
-                            tool_call_portion))
+                        self.stream_tool_call_name_regex.match(tool_call_portion)
+                    )
                     if current_tool_call_name_matches:
                         tool_name = current_tool_call_name_matches.groups()
                         current_tool_call["name"] = tool_name
@@ -260,16 +275,18 @@ def extract_tool_calls_streaming(
                 function_name: Union[str, None] = current_tool_call.get("name")
                 if function_name:
                     self.current_tool_name_sent = True
-                    return DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=self.current_tool_id,
-                            type="function",
-                            id=make_tool_call_id(),
-                            function=DeltaFunctionCall(
-                                name=function_name).model_dump(
-                                    exclude_none=True),
-                        )
-                    ])
+                    return DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                type="function",
+                                id=make_tool_call_id(),
+                                function=DeltaFunctionCall(
+                                    name=function_name
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
                 else:
                     return None
 
@@ -279,15 +296,19 @@ def extract_tool_calls_streaming(
             if tool_call_portion is None:
                 # if there's text but not tool calls, send that -
                 # otherwise None to skip chunk
-                delta = (DeltaMessage(
-                    content=delta_text) if text_portion is not None else None)
+                delta = (
+                    DeltaMessage(content=delta_text)
+                    if text_portion is not None
+                    else None
+                )
                 return delta
 
             # now, the nitty-gritty of tool calls
             # now we have the portion to parse as tool call.
 
-            logger.debug("Trying to parse current tool call with ID %s",
-                         self.current_tool_id)
+            logger.debug(
+                "Trying to parse current tool call with ID %s", self.current_tool_id
+            )
 
             # if we're starting a new tool call, push an empty object in as
             #   a placeholder for the arguments
@@ -297,7 +318,8 @@ def extract_tool_calls_streaming(
             # main logic for tool parsing here - compare prev. partially-parsed
             #   JSON to the current partially-parsed JSON
             prev_arguments = self.prev_tool_call_arr[self.current_tool_id].get(
-                "arguments")
+                "arguments"
+            )
             cur_arguments = current_tool_call.get("arguments")
 
             logger.debug("diffing old arguments: %s", prev_arguments)
@@ -311,52 +333,56 @@ def extract_tool_calls_streaming(
             # case -- prev arguments are defined, but non are now.
             #   probably impossible, but not a fatal error - just keep going
             elif not cur_arguments and prev_arguments:
-                logger.error("should be impossible to have arguments reset "
-                             "mid-call. skipping streaming anything.")
+                logger.error(
+                    "should be impossible to have arguments reset "
+                    "mid-call. skipping streaming anything."
+                )
                 delta = None
 
             # case -- we now have the first info about arguments available from
             #   autocompleting the JSON
             elif cur_arguments and not prev_arguments:
-
-                delta = DeltaMessage(tool_calls=[
-                    DeltaToolCall(
-                        index=self.current_tool_id,
-                        function=DeltaFunctionCall(
-                            arguments=cur_arguments).model_dump(
-                                exclude_none=True),
-                    )
-                ])
-                self.streamed_args_for_tool[
-                    self.current_tool_id] = cur_arguments
+                delta = DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=self.current_tool_id,
+                            function=DeltaFunctionCall(
+                                arguments=cur_arguments
+                            ).model_dump(exclude_none=True),
+                        )
+                    ]
+                )
+                self.streamed_args_for_tool[self.current_tool_id] = cur_arguments
 
             # last case -- we have an update to existing arguments.
             elif cur_arguments and prev_arguments:
-                if (isinstance(delta_text, str)
-                        and cur_arguments != prev_arguments
-                        and len(cur_arguments) > len(prev_arguments)
-                        and cur_arguments.startswith(prev_arguments)):
-                    delta_arguments = cur_arguments[len(prev_arguments):]
+                if (
+                    isinstance(delta_text, str)
+                    and cur_arguments != prev_arguments
+                    and len(cur_arguments) > len(prev_arguments)
+                    and cur_arguments.startswith(prev_arguments)
+                ):
+                    delta_arguments = cur_arguments[len(prev_arguments) :]
                     logger.debug("got diff %s", delta_text)
 
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=self.current_tool_id,
-                            function=DeltaFunctionCall(
-                                arguments=delta_arguments).model_dump(
-                                    exclude_none=True),
-                        )
-                    ])
-                    self.streamed_args_for_tool[
-                        self.current_tool_id] = cur_arguments
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                function=DeltaFunctionCall(
+                                    arguments=delta_arguments
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
+                    self.streamed_args_for_tool[self.current_tool_id] = cur_arguments
                 else:
                     delta = None
 
             # handle saving the state for the current tool into
             # the "prev" list for use in diffing for the next iteration
             if self.current_tool_id == len(self.prev_tool_call_arr) - 1:
-                self.prev_tool_call_arr[
-                    self.current_tool_id] = current_tool_call
+                self.prev_tool_call_arr[self.current_tool_id] = current_tool_call
             else:
                 self.prev_tool_call_arr.append(current_tool_call)
 
diff --git a/vllm/entrypoints/openai/tool_parsers/deepseekv3_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/deepseekv3_tool_parser.py
index ac272b0c3b20..e8a5d2e6dc13 100644
--- a/vllm/entrypoints/openai/tool_parsers/deepseekv3_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/deepseekv3_tool_parser.py
@@ -7,13 +7,19 @@
 import regex as re
 
 from vllm.entrypoints.chat_utils import make_tool_call_id
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
+    ToolParser,
+    ToolParserManager,
+)
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
@@ -22,15 +28,15 @@
 
 @ToolParserManager.register_module("deepseek_v3")
 class DeepSeekV3ToolParser(ToolParser):
-
     def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
 
         self.current_tool_name_sent: bool = False
         self.prev_tool_call_arr: list[dict] = []
         self.current_tool_id: int = -1
-        self.streamed_args_for_tool: list[str] = (
-            [])  # map what has been streamed for each tool so far to a list
+        self.streamed_args_for_tool: list[
+            str
+        ] = []  # map what has been streamed for each tool so far to a list
 
         self.tool_calls_start_token: str = "<｜tool▁calls▁begin｜>"
         self.tool_calls_end_token: str = "<｜tool▁calls▁end｜>"
@@ -47,38 +53,39 @@ def __init__(self, tokenizer: AnyTokenizer):
         )
 
         self.stream_tool_call_name_regex = re.compile(
-            r"(?P<type>.*)<｜tool▁sep｜>(?P<function_name>.*)\n")
+            r"(?P<type>.*)<｜tool▁sep｜>(?P<function_name>.*)\n"
+        )
 
         if not self.model_tokenizer:
             raise ValueError(
                 "The model tokenizer must be passed to the ToolParser "
-                "constructor during construction.")
-        self.tool_calls_start_token_id = self.vocab.get(
-            self.tool_calls_start_token)
-        self.tool_calls_end_token_id = self.vocab.get(
-            self.tool_calls_end_token)
-
-        self.tool_call_start_token_id = self.vocab.get(
-            self.tool_call_start_token)
+                "constructor during construction."
+            )
+        self.tool_calls_start_token_id = self.vocab.get(self.tool_calls_start_token)
+        self.tool_calls_end_token_id = self.vocab.get(self.tool_calls_end_token)
+
+        self.tool_call_start_token_id = self.vocab.get(self.tool_call_start_token)
         self.tool_call_end_token_id = self.vocab.get(self.tool_call_end_token)
 
-        if (self.tool_calls_start_token_id is None
-                or self.tool_calls_end_token_id is None):
+        if (
+            self.tool_calls_start_token_id is None
+            or self.tool_calls_end_token_id is None
+        ):
             raise RuntimeError(
                 "DeepSeek-V3 Tool parser could not locate tool call start/end "
-                "tokens in the tokenizer!")
+                "tokens in the tokenizer!"
+            )
 
     def extract_tool_calls(
         self,
         model_output: str,
         request: ChatCompletionRequest,
     ) -> ExtractedToolCallInformation:
-
         # sanity check; avoid unnecessary processing
         if self.tool_calls_start_token not in model_output:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         else:
             try:
@@ -86,8 +93,7 @@ def extract_tool_calls(
                 # tag and end-of-string so the result of
                 # findall is an array of tuples where one is a function call and
                 # the other is None
-                function_call_tuples = self.tool_call_regex.findall(
-                    model_output)
+                function_call_tuples = self.tool_call_regex.findall(model_output)
 
                 tool_calls = []
                 for match in function_call_tuples:
@@ -95,12 +101,13 @@ def extract_tool_calls(
                     tool_calls.append(
                         ToolCall(
                             type=tool_type,
-                            function=FunctionCall(name=function_name,
-                                                  arguments=function_args),
-                        ))
+                            function=FunctionCall(
+                                name=function_name, arguments=function_args
+                            ),
+                        )
+                    )
 
-                content = model_output[:model_output.
-                                       find(self.tool_calls_start_token)]
+                content = model_output[: model_output.find(self.tool_calls_start_token)]
                 return ExtractedToolCallInformation(
                     tools_called=True,
                     tool_calls=tool_calls,
@@ -108,11 +115,10 @@ def extract_tool_calls(
                 )
 
             except Exception:
-                logger.exception(
-                    "Error in extracting tool call from response.")
-                return ExtractedToolCallInformation(tools_called=False,
-                                                    tool_calls=[],
-                                                    content=model_output)
+                logger.exception("Error in extracting tool call from response.")
+                return ExtractedToolCallInformation(
+                    tools_called=False, tool_calls=[], content=model_output
+                )
 
     def extract_tool_calls_streaming(
         self,
@@ -124,55 +130,58 @@ def extract_tool_calls_streaming(
         delta_token_ids: Sequence[int],
         request: ChatCompletionRequest,
     ) -> Union[DeltaMessage, None]:
-
         logger.debug("delta_text: %s", delta_text)
         logger.debug("delta_token_ids: %s", delta_token_ids)
         # check to see if we should be streaming a tool call - is there a
         if self.tool_calls_start_token_id not in current_token_ids:
             logger.debug("No tool call tokens found!")
             return DeltaMessage(content=delta_text)
-        delta_text = delta_text.replace(self.tool_calls_start_token,
-                                        "").replace(self.tool_calls_end_token,
-                                                    "")
+        delta_text = delta_text.replace(self.tool_calls_start_token, "").replace(
+            self.tool_calls_end_token, ""
+        )
         try:
-
             # figure out where we are in the parsing by counting tool call
             # start & end tags
             prev_tool_start_count = previous_token_ids.count(
-                self.tool_call_start_token_id)
-            prev_tool_end_count = previous_token_ids.count(
-                self.tool_call_end_token_id)
+                self.tool_call_start_token_id
+            )
+            prev_tool_end_count = previous_token_ids.count(self.tool_call_end_token_id)
             cur_tool_start_count = current_token_ids.count(
-                self.tool_call_start_token_id)
-            cur_tool_end_count = current_token_ids.count(
-                self.tool_call_end_token_id)
+                self.tool_call_start_token_id
+            )
+            cur_tool_end_count = current_token_ids.count(self.tool_call_end_token_id)
             tool_call_portion = None
             text_portion = None
 
             # case: if we're generating text, OR rounding out a tool call
-            if (cur_tool_start_count == cur_tool_end_count
-                    and prev_tool_end_count == cur_tool_end_count
-                    and self.tool_call_end_token not in delta_text):
+            if (
+                cur_tool_start_count == cur_tool_end_count
+                and prev_tool_end_count == cur_tool_end_count
+                and self.tool_call_end_token not in delta_text
+            ):
                 logger.debug("Generating text content! skipping tool parsing.")
                 return DeltaMessage(content=delta_text)
 
             if self.tool_call_end_token in delta_text:
                 logger.debug("tool_call_end_token in delta_text")
                 full_text = current_text + delta_text
-                tool_call_portion = full_text.split(
-                    self.tool_call_start_token)[-1].split(
-                        self.tool_call_end_token)[0].rstrip()
-                delta_text = delta_text.split(
-                    self.tool_call_end_token)[0].rstrip()
-                text_portion = delta_text.split(
-                    self.tool_call_end_token)[-1].lstrip()
+                tool_call_portion = (
+                    full_text.split(self.tool_call_start_token)[-1]
+                    .split(self.tool_call_end_token)[0]
+                    .rstrip()
+                )
+                delta_text = delta_text.split(self.tool_call_end_token)[0].rstrip()
+                text_portion = delta_text.split(self.tool_call_end_token)[-1].lstrip()
 
             # case -- we're starting a new tool call
-            if (cur_tool_start_count > cur_tool_end_count
-                    and cur_tool_start_count > prev_tool_start_count):
+            if (
+                cur_tool_start_count > cur_tool_end_count
+                and cur_tool_start_count > prev_tool_start_count
+            ):
                 if len(delta_token_ids) > 1:
-                    tool_call_portion = current_text.split(
-                        self.tool_call_start_token)[-1]
+                    tool_call_portion = current_text.split(self.tool_call_start_token)[
+                        -1
+                    ]
                 else:
                     tool_call_portion = None
                     delta = None
@@ -186,27 +195,29 @@ def extract_tool_calls_streaming(
                 logger.debug("Starting on a new tool %s", self.current_tool_id)
 
             # case -- we're updating an existing tool call
-            elif (cur_tool_start_count > cur_tool_end_count
-                  and cur_tool_start_count == prev_tool_start_count):
-
+            elif (
+                cur_tool_start_count > cur_tool_end_count
+                and cur_tool_start_count == prev_tool_start_count
+            ):
                 # get the portion of the text that's the tool call
-                tool_call_portion = current_text.split(
-                    self.tool_call_start_token)[-1]
+                tool_call_portion = current_text.split(self.tool_call_start_token)[-1]
                 text_portion = None
 
             # case -- the current tool call is being closed.
-            elif (cur_tool_start_count == cur_tool_end_count
-                  and cur_tool_end_count >= prev_tool_end_count):
-                if self.prev_tool_call_arr is None or len(
-                        self.prev_tool_call_arr) == 0:
-                    logger.debug(
-                        "attempting to close tool call, but no tool call")
+            elif (
+                cur_tool_start_count == cur_tool_end_count
+                and cur_tool_end_count >= prev_tool_end_count
+            ):
+                if self.prev_tool_call_arr is None or len(self.prev_tool_call_arr) == 0:
+                    logger.debug("attempting to close tool call, but no tool call")
                     return None
-                diff = self.prev_tool_call_arr[self.current_tool_id].get(
-                    "arguments")
+                diff = self.prev_tool_call_arr[self.current_tool_id].get("arguments")
                 if diff:
-                    diff = (diff.encode("utf-8").decode("unicode_escape")
-                            if diff is str else diff)
+                    diff = (
+                        diff.encode("utf-8").decode("unicode_escape")
+                        if diff is str
+                        else diff
+                    )
                     if '"}' not in delta_text:
                         return None
                     end_loc = delta_text.rindex('"}')
@@ -217,13 +228,16 @@ def extract_tool_calls_streaming(
                         diff,
                     )
                     self.streamed_args_for_tool[self.current_tool_id] += diff
-                    return DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=self.current_tool_id,
-                            function=DeltaFunctionCall(
-                                arguments=diff).model_dump(exclude_none=True),
-                        )
-                    ])
+                    return DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                function=DeltaFunctionCall(arguments=diff).model_dump(
+                                    exclude_none=True
+                                ),
+                            )
+                        ]
+                    )
 
             # case -- otherwise we're just generating text
             else:
@@ -234,21 +248,19 @@ def extract_tool_calls_streaming(
 
             current_tool_call = dict()
             if tool_call_portion:
-                current_tool_call_matches = (
-                    self.stream_tool_call_portion_regex.match(
-                        tool_call_portion))
+                current_tool_call_matches = self.stream_tool_call_portion_regex.match(
+                    tool_call_portion
+                )
                 if current_tool_call_matches:
-                    tool_type, tool_name, tool_args = (
-                        current_tool_call_matches.groups())
+                    tool_type, tool_name, tool_args = current_tool_call_matches.groups()
                     current_tool_call["name"] = tool_name
                     current_tool_call["arguments"] = tool_args
                 else:
                     current_tool_call_name_matches = (
-                        self.stream_tool_call_name_regex.match(
-                            tool_call_portion))
+                        self.stream_tool_call_name_regex.match(tool_call_portion)
+                    )
                     if current_tool_call_name_matches:
-                        tool_type, tool_name = (
-                            current_tool_call_name_matches.groups())
+                        tool_type, tool_name = current_tool_call_name_matches.groups()
                         current_tool_call["name"] = tool_name
                         current_tool_call["arguments"] = ""
                     else:
@@ -263,16 +275,18 @@ def extract_tool_calls_streaming(
                 function_name: Union[str, None] = current_tool_call.get("name")
                 if function_name:
                     self.current_tool_name_sent = True
-                    return DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=self.current_tool_id,
-                            type="function",
-                            id=make_tool_call_id(),
-                            function=DeltaFunctionCall(
-                                name=function_name).model_dump(
-                                    exclude_none=True),
-                        )
-                    ])
+                    return DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                type="function",
+                                id=make_tool_call_id(),
+                                function=DeltaFunctionCall(
+                                    name=function_name
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
                 else:
                     return None
 
@@ -282,15 +296,19 @@ def extract_tool_calls_streaming(
             if tool_call_portion is None:
                 # if there's text but not tool calls, send that -
                 # otherwise None to skip chunk
-                delta = (DeltaMessage(
-                    content=delta_text) if text_portion is not None else None)
+                delta = (
+                    DeltaMessage(content=delta_text)
+                    if text_portion is not None
+                    else None
+                )
                 return delta
 
             # now, the nitty-gritty of tool calls
             # now we have the portion to parse as tool call.
 
-            logger.debug("Trying to parse current tool call with ID %s",
-                         self.current_tool_id)
+            logger.debug(
+                "Trying to parse current tool call with ID %s", self.current_tool_id
+            )
 
             # if we're starting a new tool call, push an empty object in as
             #   a placeholder for the arguments
@@ -300,7 +318,8 @@ def extract_tool_calls_streaming(
             # main logic for tool parsing here - compare prev. partially-parsed
             #   JSON to the current partially-parsed JSON
             prev_arguments = self.prev_tool_call_arr[self.current_tool_id].get(
-                "arguments")
+                "arguments"
+            )
             cur_arguments = current_tool_call.get("arguments")
 
             logger.debug("diffing old arguments: %s", prev_arguments)
@@ -314,52 +333,56 @@ def extract_tool_calls_streaming(
             # case -- prev arguments are defined, but non are now.
             #   probably impossible, but not a fatal error - just keep going
             elif not cur_arguments and prev_arguments:
-                logger.error("should be impossible to have arguments reset "
-                             "mid-call. skipping streaming anything.")
+                logger.error(
+                    "should be impossible to have arguments reset "
+                    "mid-call. skipping streaming anything."
+                )
                 delta = None
 
             # case -- we now have the first info about arguments available from
             #   autocompleting the JSON
             elif cur_arguments and not prev_arguments:
-
-                delta = DeltaMessage(tool_calls=[
-                    DeltaToolCall(
-                        index=self.current_tool_id,
-                        function=DeltaFunctionCall(
-                            arguments=cur_arguments).model_dump(
-                                exclude_none=True),
-                    )
-                ])
-                self.streamed_args_for_tool[
-                    self.current_tool_id] = cur_arguments
+                delta = DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=self.current_tool_id,
+                            function=DeltaFunctionCall(
+                                arguments=cur_arguments
+                            ).model_dump(exclude_none=True),
+                        )
+                    ]
+                )
+                self.streamed_args_for_tool[self.current_tool_id] = cur_arguments
 
             # last case -- we have an update to existing arguments.
             elif cur_arguments and prev_arguments:
-                if (isinstance(delta_text, str)
-                        and cur_arguments != prev_arguments
-                        and len(cur_arguments) > len(prev_arguments)
-                        and cur_arguments.startswith(prev_arguments)):
-                    delta_arguments = cur_arguments[len(prev_arguments):]
+                if (
+                    isinstance(delta_text, str)
+                    and cur_arguments != prev_arguments
+                    and len(cur_arguments) > len(prev_arguments)
+                    and cur_arguments.startswith(prev_arguments)
+                ):
+                    delta_arguments = cur_arguments[len(prev_arguments) :]
                     logger.debug("got diff %s", delta_text)
 
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=self.current_tool_id,
-                            function=DeltaFunctionCall(
-                                arguments=delta_arguments).model_dump(
-                                    exclude_none=True),
-                        )
-                    ])
-                    self.streamed_args_for_tool[
-                        self.current_tool_id] = cur_arguments
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                function=DeltaFunctionCall(
+                                    arguments=delta_arguments
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
+                    self.streamed_args_for_tool[self.current_tool_id] = cur_arguments
                 else:
                     delta = None
 
             # handle saving the state for the current tool into
             # the "prev" list for use in diffing for the next iteration
             if self.current_tool_id == len(self.prev_tool_call_arr) - 1:
-                self.prev_tool_call_arr[
-                    self.current_tool_id] = current_tool_call
+                self.prev_tool_call_arr[self.current_tool_id] = current_tool_call
             else:
                 self.prev_tool_call_arr.append(current_tool_call)
 
diff --git a/vllm/entrypoints/openai/tool_parsers/glm4_moe_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/glm4_moe_tool_parser.py
index 8fd14f171d0a..1d7d7d3f8629 100644
--- a/vllm/entrypoints/openai/tool_parsers/glm4_moe_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/glm4_moe_tool_parser.py
@@ -8,14 +8,20 @@
 
 import regex as re
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              ChatCompletionToolsParam,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    ChatCompletionToolsParam,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
+    ToolParser,
+    ToolParserManager,
+)
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
@@ -24,7 +30,6 @@
 
 @ToolParserManager.register_module("glm45")
 class Glm4MoeModelToolParser(ToolParser):
-
     def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
         self.current_tool_name_sent = False
@@ -36,20 +41,20 @@ def __init__(self, tokenizer: AnyTokenizer):
 
         self.tool_calls_start_token = self.tool_call_start_token
 
-        self.func_call_regex = re.compile(r"<tool_call>.*?</tool_call>",
-                                          re.DOTALL)
+        self.func_call_regex = re.compile(r"<tool_call>.*?</tool_call>", re.DOTALL)
         self.func_detail_regex = re.compile(
-            r"<tool_call>([^\n]*)\n(.*)</tool_call>", re.DOTALL)
+            r"<tool_call>([^\n]*)\n(.*)</tool_call>", re.DOTALL
+        )
         self.func_arg_regex = re.compile(
-            r"<arg_key>(.*?)</arg_key>\s*<arg_value>(.*?)</arg_value>",
-            re.DOTALL)
+            r"<arg_key>(.*?)</arg_key>\s*<arg_value>(.*?)</arg_value>", re.DOTALL
+        )
         if not self.model_tokenizer:
             raise ValueError(
                 "The model tokenizer must be passed to the ToolParser "
-                "constructor during construction.")
+                "constructor during construction."
+            )
 
-        self.tool_call_start_token_id = self.vocab.get(
-            self.tool_call_start_token)
+        self.tool_call_start_token_id = self.vocab.get(self.tool_call_start_token)
         self.tool_call_end_token_id = self.vocab.get(self.tool_call_end_token)
         self._buffer = ""
 
@@ -58,18 +63,22 @@ def extract_tool_calls(
         model_output: str,
         request: ChatCompletionRequest,
     ) -> ExtractedToolCallInformation:
-
         def _is_string_type(
-                tool_name: str, arg_name: str,
-                tools: Optional[list[ChatCompletionToolsParam]]) -> bool:
+            tool_name: str,
+            arg_name: str,
+            tools: Optional[list[ChatCompletionToolsParam]],
+        ) -> bool:
             if tools is None:
                 return False
             for tool in tools:
                 if tool.function.name == tool_name:
                     if tool.function.parameters is None:
                         return False
-                    arg_type = tool.function.parameters.get(
-                        "properties", {}).get(arg_name, {}).get("type", None)
+                    arg_type = (
+                        tool.function.parameters.get("properties", {})
+                        .get(arg_name, {})
+                        .get("type", None)
+                    )
                     return arg_type == "string"
             logger.warning("No tool named '%s'.", tool_name)
             return False
@@ -101,28 +110,30 @@ def _deserialize(value: str) -> Any:
                     arg_val = value.strip()
                     if not _is_string_type(tc_name, arg_key, request.tools):
                         arg_val = _deserialize(arg_val)
-                    logger.debug("arg_key = %s, arg_val = %s", arg_key,
-                                 arg_val)
+                    logger.debug("arg_key = %s, arg_val = %s", arg_key, arg_val)
                     arg_dct[arg_key] = arg_val
                 tool_calls.append(
-                    ToolCall(type="function",
-                             function=FunctionCall(
-                                 name=tc_name, arguments=json.dumps(arg_dct))))
+                    ToolCall(
+                        type="function",
+                        function=FunctionCall(
+                            name=tc_name, arguments=json.dumps(arg_dct)
+                        ),
+                    )
+                )
         except Exception:
             logger.exception("Failed to extract tool call spec")
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
         else:
             if len(tool_calls) > 0:
-                content = model_output[:model_output.
-                                       find(self.tool_calls_start_token)]
-                return ExtractedToolCallInformation(tools_called=True,
-                                                    tool_calls=tool_calls,
-                                                    content=content)
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+                content = model_output[: model_output.find(self.tool_calls_start_token)]
+                return ExtractedToolCallInformation(
+                    tools_called=True, tool_calls=tool_calls, content=content
+                )
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
     def extract_tool_calls_streaming(
         self,
@@ -155,7 +166,8 @@ def extract_tool_calls_streaming(
                 self.streamed_args_for_tool.append("")
 
             extracted_tool_calls = self.extract_tool_calls(
-                cur_text[:end_idx + len(self.tool_call_end_token)], request)
+                cur_text[: end_idx + len(self.tool_call_end_token)], request
+            )
 
             if len(extracted_tool_calls.tool_calls) == 0:
                 logger.warning("Failed to extract any tool calls.")
@@ -163,22 +175,27 @@ def extract_tool_calls_streaming(
             tool_call = extracted_tool_calls.tool_calls[0]
             self.prev_tool_call_arr[self.current_tool_id] = {
                 "name": tool_call.function.name,
-                "arguments": json.loads(tool_call.function.arguments)
+                "arguments": json.loads(tool_call.function.arguments),
             }
-            self.streamed_args_for_tool[
-                self.current_tool_id] = tool_call.function.arguments
+            self.streamed_args_for_tool[self.current_tool_id] = (
+                tool_call.function.arguments
+            )
             delta = DeltaMessage(
                 content=extracted_tool_calls.content,
                 tool_calls=[
-                    DeltaToolCall(index=self.current_tool_id,
-                                  id=tool_call.id,
-                                  type=tool_call.type,
-                                  function=DeltaFunctionCall(
-                                      name=tool_call.function.name,
-                                      arguments=tool_call.function.arguments))
-                ])
+                    DeltaToolCall(
+                        index=self.current_tool_id,
+                        id=tool_call.id,
+                        type=tool_call.type,
+                        function=DeltaFunctionCall(
+                            name=tool_call.function.name,
+                            arguments=tool_call.function.arguments,
+                        ),
+                    )
+                ],
+            )
             self.current_tool_id += 1
-            self._buffer = cur_text[end_idx + len(self.tool_call_end_token):]
+            self._buffer = cur_text[end_idx + len(self.tool_call_end_token) :]
             return delta
 
         self._buffer = cur_text[start_idx:]
diff --git a/vllm/entrypoints/openai/tool_parsers/granite_20b_fc_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/granite_20b_fc_tool_parser.py
index 824b100f357b..c42b358b1e34 100644
--- a/vllm/entrypoints/openai/tool_parsers/granite_20b_fc_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/granite_20b_fc_tool_parser.py
@@ -11,17 +11,25 @@
 from partial_json_parser.core.options import Allow
 
 from vllm.entrypoints.chat_utils import make_tool_call_id
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
-from vllm.entrypoints.openai.tool_parsers.utils import (consume_space,
-                                                        find_common_prefix,
-                                                        is_complete_json,
-                                                        partial_json_loads)
+    ToolParser,
+    ToolParserManager,
+)
+from vllm.entrypoints.openai.tool_parsers.utils import (
+    consume_space,
+    find_common_prefix,
+    is_complete_json,
+    partial_json_loads,
+)
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
@@ -47,12 +55,12 @@ def __init__(self, tokenizer: AnyTokenizer):
         self.tool_call_regex = re.compile(r"<function_call>\s*")
 
     def extract_tool_calls(
-            self, model_output: str,
-            request: ChatCompletionRequest) -> ExtractedToolCallInformation:
+        self, model_output: str, request: ChatCompletionRequest
+    ) -> ExtractedToolCallInformation:
         if self.tool_start_token not in model_output:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         dec = JSONDecoder()
         try:
@@ -66,13 +74,15 @@ def extract_tool_calls(
                 start_of_json = match.end()
                 # end_index == the start of the next function call
                 # (if exists)
-                next_function_call_start = (matches[i + 1].start() if i +
-                                            1 < len(matches) else None)
+                next_function_call_start = (
+                    matches[i + 1].start() if i + 1 < len(matches) else None
+                )
 
                 raw_function_calls.append(
                     dec.raw_decode(
-                        model_output[start_of_json:next_function_call_start])
-                    [0])
+                        model_output[start_of_json:next_function_call_start]
+                    )[0]
+                )
 
             logger.debug("Extracted %d tool calls", len(raw_function_calls))
             tool_calls = [
@@ -81,13 +91,15 @@ def extract_tool_calls(
                     function=FunctionCall(
                         name=function_call["name"],
                         # function call args are JSON but as a string
-                        arguments=json.dumps(function_call["arguments"],
-                                             ensure_ascii=False),
+                        arguments=json.dumps(
+                            function_call["arguments"], ensure_ascii=False
+                        ),
                     ),
-                ) for function_call in raw_function_calls
+                )
+                for function_call in raw_function_calls
             ]
 
-            content = model_output[:model_output.find(self.bot_token)]
+            content = model_output[: model_output.find(self.bot_token)]
             return ExtractedToolCallInformation(
                 tools_called=True,
                 tool_calls=tool_calls,
@@ -96,9 +108,9 @@ def extract_tool_calls(
 
         except Exception as e:
             logger.error("Error in extracting tool call from response %s", e)
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
     def extract_tool_calls_streaming(
         self,
@@ -110,9 +122,9 @@ def extract_tool_calls_streaming(
         delta_token_ids: Sequence[int],
         request: ChatCompletionRequest,
     ) -> Union[DeltaMessage, None]:
-
-        if len(current_text) < len(
-                self.bot_token) and self.bot_token.startswith(current_text):
+        if len(current_text) < len(self.bot_token) and self.bot_token.startswith(
+            current_text
+        ):
             return None
 
         if not current_text.startswith(self.bot_token):
@@ -122,8 +134,7 @@ def extract_tool_calls_streaming(
         # sent yet, don't allow sending
         # an incomplete string since OpenAI only ever (as far as I have
         # seen) allows sending the entire tool/ function name at once.
-        flags = Allow.ALL if self.current_tool_name_sent \
-            else Allow.ALL & ~Allow.STR
+        flags = Allow.ALL if self.current_tool_name_sent else Allow.ALL & ~Allow.STR
         try:
             tool_call_arr = []
             is_complete = []
@@ -132,24 +143,23 @@ def extract_tool_calls_streaming(
                 start_idx = consume_space(start_idx, current_text)
 
                 while start_idx < len(current_text):
-                    (obj,
-                     end_idx) = partial_json_loads(current_text[start_idx:],
-                                                   flags)
+                    (obj, end_idx) = partial_json_loads(current_text[start_idx:], flags)
                     is_complete.append(
-                        is_complete_json(current_text[start_idx:start_idx +
-                                                      end_idx]))
+                        is_complete_json(current_text[start_idx : start_idx + end_idx])
+                    )
                     start_idx += end_idx
                     start_idx = consume_space(start_idx, current_text)
                     start_idx += len(self.bot_token)
                     start_idx = consume_space(start_idx, current_text)
                     tool_call_arr.append(obj)
             except partial_json_parser.core.exceptions.MalformedJSON:
-                logger.debug('not enough tokens to parse into JSON yet')
+                logger.debug("not enough tokens to parse into JSON yet")
                 return None
 
             # select as the current tool call the one we're on the state at
-            current_tool_call: dict = tool_call_arr[self.current_tool_id] \
-                if len(tool_call_arr) > 0 else {}
+            current_tool_call: dict = (
+                tool_call_arr[self.current_tool_id] if len(tool_call_arr) > 0 else {}
+            )
 
             # case -- if no tokens have been streamed for the tool, e.g.
             #   only the array brackets, stream nothing
@@ -158,9 +168,9 @@ def extract_tool_calls_streaming(
 
             # case: we are starting a new tool in the array
             #   -> array has > 0 length AND length has moved past cursor
-            elif (len(tool_call_arr) > 0
-                  and len(tool_call_arr) > self.current_tool_id + 1):
-
+            elif (
+                len(tool_call_arr) > 0 and len(tool_call_arr) > self.current_tool_id + 1
+            ):
                 # if we're moving on to a new call, first make sure we
                 # haven't missed anything in the previous one that was
                 # auto-generated due to JSON completions, but wasn't
@@ -168,21 +178,24 @@ def extract_tool_calls_streaming(
                 if self.current_tool_id >= 0:
                     cur_arguments = current_tool_call.get("arguments")
                     if cur_arguments:
-                        cur_args_json = json.dumps(cur_arguments,
-                                                   ensure_ascii=False)
-                        sent = len(
-                            self.streamed_args_for_tool[self.current_tool_id])
+                        cur_args_json = json.dumps(cur_arguments, ensure_ascii=False)
+                        sent = len(self.streamed_args_for_tool[self.current_tool_id])
                         argument_diff = cur_args_json[sent:]
 
                         logger.debug("got arguments diff: %s", argument_diff)
-                        delta = DeltaMessage(tool_calls=[
-                            DeltaToolCall(index=self.current_tool_id,
-                                          function=DeltaFunctionCall(
-                                              arguments=argument_diff).
-                                          model_dump(exclude_none=True))
-                        ])
-                        self.streamed_args_for_tool[
-                            self.current_tool_id] += argument_diff
+                        delta = DeltaMessage(
+                            tool_calls=[
+                                DeltaToolCall(
+                                    index=self.current_tool_id,
+                                    function=DeltaFunctionCall(
+                                        arguments=argument_diff
+                                    ).model_dump(exclude_none=True),
+                                )
+                            ]
+                        )
+                        self.streamed_args_for_tool[self.current_tool_id] += (
+                            argument_diff
+                        )
                     else:
                         delta = None
                 else:
@@ -199,15 +212,18 @@ def extract_tool_calls_streaming(
             elif not self.current_tool_name_sent:
                 function_name = current_tool_call.get("name")
                 if function_name:
-
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.current_tool_id,
-                                      type="function",
-                                      id=make_tool_call_id(),
-                                      function=DeltaFunctionCall(
-                                          name=function_name).model_dump(
-                                              exclude_none=True))
-                    ])
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                type="function",
+                                id=make_tool_call_id(),
+                                function=DeltaFunctionCall(
+                                    name=function_name
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
                     self.current_tool_name_sent = True
                 else:
                     delta = None
@@ -219,34 +235,35 @@ def extract_tool_calls_streaming(
                 delta = None
 
                 if cur_arguments:
-                    sent = len(
-                        self.streamed_args_for_tool[self.current_tool_id])
-                    cur_args_json = json.dumps(cur_arguments,
-                                               ensure_ascii=False)
-                    prev_arguments = self.prev_tool_call_arr[
-                        self.current_tool_id].get("arguments")
+                    sent = len(self.streamed_args_for_tool[self.current_tool_id])
+                    cur_args_json = json.dumps(cur_arguments, ensure_ascii=False)
+                    prev_arguments = self.prev_tool_call_arr[self.current_tool_id].get(
+                        "arguments"
+                    )
 
                     argument_diff = None
                     if is_complete[self.current_tool_id]:
                         argument_diff = cur_args_json[sent:]
                     elif prev_arguments:
-                        prev_args_json = json.dumps(prev_arguments,
-                                                    ensure_ascii=False)
+                        prev_args_json = json.dumps(prev_arguments, ensure_ascii=False)
                         if cur_args_json != prev_args_json:
-
-                            prefix = find_common_prefix(
-                                prev_args_json, cur_args_json)
+                            prefix = find_common_prefix(prev_args_json, cur_args_json)
                             argument_diff = prefix[sent:]
 
                     if argument_diff is not None:
-                        delta = DeltaMessage(tool_calls=[
-                            DeltaToolCall(index=self.current_tool_id,
-                                          function=DeltaFunctionCall(
-                                              arguments=argument_diff).
-                                          model_dump(exclude_none=True))
-                        ])
-                        self.streamed_args_for_tool[
-                            self.current_tool_id] += argument_diff
+                        delta = DeltaMessage(
+                            tool_calls=[
+                                DeltaToolCall(
+                                    index=self.current_tool_id,
+                                    function=DeltaFunctionCall(
+                                        arguments=argument_diff
+                                    ).model_dump(exclude_none=True),
+                                )
+                            ]
+                        )
+                        self.streamed_args_for_tool[self.current_tool_id] += (
+                            argument_diff
+                        )
 
             self.prev_tool_call_arr = tool_call_arr
             return delta
@@ -254,6 +271,6 @@ def extract_tool_calls_streaming(
         except Exception as e:
             logger.error("Error trying to handle streaming tool call: %s", e)
             logger.debug(
-                "Skipping chunk as a result of tool streaming extraction "
-                "error")
+                "Skipping chunk as a result of tool streaming extraction error"
+            )
             return None
diff --git a/vllm/entrypoints/openai/tool_parsers/granite_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/granite_tool_parser.py
index ac517616a95b..989973923ae5 100644
--- a/vllm/entrypoints/openai/tool_parsers/granite_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/granite_tool_parser.py
@@ -9,17 +9,25 @@
 from partial_json_parser.core.options import Allow
 
 from vllm.entrypoints.chat_utils import make_tool_call_id
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
-from vllm.entrypoints.openai.tool_parsers.utils import (consume_space,
-                                                        find_common_prefix,
-                                                        is_complete_json,
-                                                        partial_json_loads)
+    ToolParser,
+    ToolParserManager,
+)
+from vllm.entrypoints.openai.tool_parsers.utils import (
+    consume_space,
+    find_common_prefix,
+    is_complete_json,
+    partial_json_loads,
+)
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
@@ -45,21 +53,24 @@ def __init__(self, tokenizer: AnyTokenizer):
         self.bot_string = "<tool_call>"
 
     def extract_tool_calls(
-            self, model_output: str,
-            request: ChatCompletionRequest) -> ExtractedToolCallInformation:
-        stripped = model_output.strip()\
-                    .removeprefix(self.bot_token)\
-                    .removeprefix(self.bot_string)\
-                    .lstrip()
-        if not stripped or stripped[0] != '[':
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+        self, model_output: str, request: ChatCompletionRequest
+    ) -> ExtractedToolCallInformation:
+        stripped = (
+            model_output.strip()
+            .removeprefix(self.bot_token)
+            .removeprefix(self.bot_string)
+            .lstrip()
+        )
+        if not stripped or stripped[0] != "[":
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
         try:
             raw_function_calls = json.loads(stripped)
             if not isinstance(raw_function_calls, list):
                 raise Exception(
-                    f"Expected dict or list, got {type(raw_function_calls)}")
+                    f"Expected dict or list, got {type(raw_function_calls)}"
+                )
 
             logger.debug("Extracted %d tool calls", len(raw_function_calls))
             tool_calls = [
@@ -68,10 +79,12 @@ def extract_tool_calls(
                     function=FunctionCall(
                         name=function_call["name"],
                         # function call args are JSON but as a string
-                        arguments=json.dumps(function_call["arguments"],
-                                             ensure_ascii=False),
+                        arguments=json.dumps(
+                            function_call["arguments"], ensure_ascii=False
+                        ),
                     ),
-                ) for function_call in raw_function_calls
+                )
+                for function_call in raw_function_calls
             ]
 
             return ExtractedToolCallInformation(
@@ -82,9 +95,9 @@ def extract_tool_calls(
 
         except Exception as e:
             logger.error("Error in extracting tool call from response %s", e)
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
     def extract_tool_calls_streaming(
         self,
@@ -96,41 +109,40 @@ def extract_tool_calls_streaming(
         delta_token_ids: Sequence[int],
         request: ChatCompletionRequest,
     ) -> Union[DeltaMessage, None]:
-
         start_idx = consume_space(0, current_text)
         if current_text[start_idx:].startswith(self.bot_token):
-            start_idx = consume_space(start_idx + len(self.bot_token),
-                                      current_text)
+            start_idx = consume_space(start_idx + len(self.bot_token), current_text)
         if current_text[start_idx:].startswith(self.bot_string):
-            start_idx = consume_space(start_idx + len(self.bot_string),
-                                      current_text)
-        if not current_text or start_idx >= len(current_text)\
-            or current_text[start_idx] != '[':
+            start_idx = consume_space(start_idx + len(self.bot_string), current_text)
+        if (
+            not current_text
+            or start_idx >= len(current_text)
+            or current_text[start_idx] != "["
+        ):
             return DeltaMessage(content=delta_text)
 
         # bit mask flags for partial JSON parsing. If the name hasn't been
         # sent yet, don't allow sending
         # an incomplete string since OpenAI only ever (as far as I have
         # seen) allows sending the entire tool/ function name at once.
-        flags = Allow.ALL if self.current_tool_name_sent \
-            else Allow.ALL & ~Allow.STR
+        flags = Allow.ALL if self.current_tool_name_sent else Allow.ALL & ~Allow.STR
         try:
             tool_call_arr = None
             is_complete = None
             try:
                 tool_calls, end_idx = partial_json_loads(
-                    current_text[start_idx:], flags)
+                    current_text[start_idx:], flags
+                )
                 if type(tool_calls) is list:
                     tool_call_arr = tool_calls
                 else:
                     return DeltaMessage(content=delta_text)
 
                 is_complete = [True] * len(tool_calls)
-                if not is_complete_json(
-                        current_text[start_idx:start_idx + end_idx]):
+                if not is_complete_json(current_text[start_idx : start_idx + end_idx]):
                     is_complete[-1] = False
             except partial_json_parser.core.exceptions.MalformedJSON:
-                logger.debug('not enough tokens to parse into JSON yet')
+                logger.debug("not enough tokens to parse into JSON yet")
                 return None
 
             # case -- if no tokens have been streamed for the tool, e.g.
@@ -145,7 +157,6 @@ def extract_tool_calls_streaming(
             # case: we are starting a new tool in the array
             #   -> array has > 0 length AND length has moved past cursor
             if len(tool_call_arr) > self.current_tool_id + 1:
-
                 # if we're moving on to a new call, first make sure we
                 # haven't missed anything in the previous one that was
                 # auto-generated due to JSON completions, but wasn't
@@ -153,21 +164,24 @@ def extract_tool_calls_streaming(
                 if self.current_tool_id >= 0:
                     cur_arguments = current_tool_call.get("arguments")
                     if cur_arguments:
-                        cur_args_json = json.dumps(cur_arguments,
-                                                   ensure_ascii=False)
-                        sent = len(
-                            self.streamed_args_for_tool[self.current_tool_id])
+                        cur_args_json = json.dumps(cur_arguments, ensure_ascii=False)
+                        sent = len(self.streamed_args_for_tool[self.current_tool_id])
                         argument_diff = cur_args_json[sent:]
 
                         logger.debug("got arguments diff: %s", argument_diff)
-                        delta = DeltaMessage(tool_calls=[
-                            DeltaToolCall(index=self.current_tool_id,
-                                          function=DeltaFunctionCall(
-                                              arguments=argument_diff).
-                                          model_dump(exclude_none=True))
-                        ])
-                        self.streamed_args_for_tool[
-                            self.current_tool_id] += argument_diff
+                        delta = DeltaMessage(
+                            tool_calls=[
+                                DeltaToolCall(
+                                    index=self.current_tool_id,
+                                    function=DeltaFunctionCall(
+                                        arguments=argument_diff
+                                    ).model_dump(exclude_none=True),
+                                )
+                            ]
+                        )
+                        self.streamed_args_for_tool[self.current_tool_id] += (
+                            argument_diff
+                        )
 
                 # re-set stuff pertaining to progress in the current tool
                 self.current_tool_id = len(tool_call_arr) - 1
@@ -181,15 +195,18 @@ def extract_tool_calls_streaming(
             elif not self.current_tool_name_sent:
                 function_name = current_tool_call.get("name")
                 if function_name:
-
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.current_tool_id,
-                                      type="function",
-                                      id=make_tool_call_id(),
-                                      function=DeltaFunctionCall(
-                                          name=function_name).model_dump(
-                                              exclude_none=True))
-                    ])
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                type="function",
+                                id=make_tool_call_id(),
+                                function=DeltaFunctionCall(
+                                    name=function_name
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
                     self.current_tool_name_sent = True
 
             # now we know we're on the same tool call and we're streaming
@@ -198,33 +215,35 @@ def extract_tool_calls_streaming(
                 cur_arguments = current_tool_call.get("arguments")
 
                 if cur_arguments:
-                    sent = len(
-                        self.streamed_args_for_tool[self.current_tool_id])
-                    cur_args_json = json.dumps(cur_arguments,
-                                               ensure_ascii=False)
-                    prev_arguments = self.prev_tool_call_arr[
-                        self.current_tool_id].get("arguments")
+                    sent = len(self.streamed_args_for_tool[self.current_tool_id])
+                    cur_args_json = json.dumps(cur_arguments, ensure_ascii=False)
+                    prev_arguments = self.prev_tool_call_arr[self.current_tool_id].get(
+                        "arguments"
+                    )
 
                     argument_diff = None
                     if is_complete[self.current_tool_id]:
                         argument_diff = cur_args_json[sent:]
                     elif prev_arguments:
-                        prev_args_json = json.dumps(prev_arguments,
-                                                    ensure_ascii=False)
+                        prev_args_json = json.dumps(prev_arguments, ensure_ascii=False)
                         if cur_args_json != prev_args_json:
-                            prefix = find_common_prefix(
-                                prev_args_json, cur_args_json)
+                            prefix = find_common_prefix(prev_args_json, cur_args_json)
                             argument_diff = prefix[sent:]
 
                     if argument_diff is not None:
-                        delta = DeltaMessage(tool_calls=[
-                            DeltaToolCall(index=self.current_tool_id,
-                                          function=DeltaFunctionCall(
-                                              arguments=argument_diff).
-                                          model_dump(exclude_none=True))
-                        ])
-                        self.streamed_args_for_tool[
-                            self.current_tool_id] += argument_diff
+                        delta = DeltaMessage(
+                            tool_calls=[
+                                DeltaToolCall(
+                                    index=self.current_tool_id,
+                                    function=DeltaFunctionCall(
+                                        arguments=argument_diff
+                                    ).model_dump(exclude_none=True),
+                                )
+                            ]
+                        )
+                        self.streamed_args_for_tool[self.current_tool_id] += (
+                            argument_diff
+                        )
 
             self.prev_tool_call_arr = tool_call_arr
             return delta
@@ -232,6 +251,6 @@ def extract_tool_calls_streaming(
         except Exception as e:
             logger.error("Error trying to handle streaming tool call: %s", e)
             logger.debug(
-                "Skipping chunk as a result of tool streaming extraction "
-                "error")
+                "Skipping chunk as a result of tool streaming extraction error"
+            )
             return None
diff --git a/vllm/entrypoints/openai/tool_parsers/hermes_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/hermes_tool_parser.py
index 87595953da06..4529eb51796e 100644
--- a/vllm/entrypoints/openai/tool_parsers/hermes_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/hermes_tool_parser.py
@@ -10,13 +10,19 @@
 from partial_json_parser.core.options import Allow
 
 from vllm.entrypoints.chat_utils import make_tool_call_id
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
+    ToolParser,
+    ToolParserManager,
+)
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer, MistralTokenizer
 
@@ -25,37 +31,41 @@
 
 @ToolParserManager.register_module("hermes")
 class Hermes2ProToolParser(ToolParser):
-
     def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
 
         if isinstance(self.model_tokenizer, MistralTokenizer):
-            logger.error(
-                "Detected Mistral tokenizer when using a Hermes model")
+            logger.error("Detected Mistral tokenizer when using a Hermes model")
             self.model_tokenizer = self.model_tokenizer.tokenizer
 
         self.current_tool_name_sent: bool = False
         self.prev_tool_call_arr: list[dict] = []
         self.current_tool_id: int = -1
-        self.streamed_args_for_tool: list[str] = [
-        ]  # map what has been streamed for each tool so far to a list
+        self.streamed_args_for_tool: list[
+            str
+        ] = []  # map what has been streamed for each tool so far to a list
 
         self.tool_call_start_token: str = "<tool_call>"
         self.tool_call_end_token: str = "</tool_call>"
 
         self.tool_call_regex = re.compile(
-            r"<tool_call>(.*?)</tool_call>|<tool_call>(.*)", re.DOTALL)
+            r"<tool_call>(.*?)</tool_call>|<tool_call>(.*)", re.DOTALL
+        )
         self.scratch_pad_regex = re.compile(
-            r"<scratch_pad>(.*?)</scratch_pad>", re.DOTALL)
+            r"<scratch_pad>(.*?)</scratch_pad>", re.DOTALL
+        )
 
         if not self.model_tokenizer:
             raise ValueError(
                 "The model tokenizer must be passed to the ToolParser "
-                "constructor during construction.")
+                "constructor during construction."
+            )
         self.tool_call_start_token_ids = self.model_tokenizer.encode(
-            self.tool_call_start_token, add_special_tokens=False)
+            self.tool_call_start_token, add_special_tokens=False
+        )
         self.tool_call_end_token_ids = self.model_tokenizer.encode(
-            self.tool_call_end_token, add_special_tokens=False)
+            self.tool_call_end_token, add_special_tokens=False
+        )
 
         self.tool_call_start_token_array = [
             self.model_tokenizer.decode([token_id])
@@ -77,13 +87,17 @@ def __init__(self, tokenizer: AnyTokenizer):
     def tool_call_delta_buffer(self, delta_text: str):
         # If the sequence of tool_call_start or tool_call_end tokens is not yet
         # complete, fill the buffer with the token and return "".
-        if (delta_text in self.tool_call_start_token_array
-                or delta_text in self.tool_call_end_token_array):
+        if (
+            delta_text in self.tool_call_start_token_array
+            or delta_text in self.tool_call_end_token_array
+        ):
             # If delta_text is the last token of tool_call_start_token or
             # tool_call_end_token, empty the buffer and return
             # the buffered text + delta_text.
-            if (delta_text == self.tool_call_start_token_array[-1]
-                    or delta_text == self.tool_call_end_token_array[-1]):
+            if (
+                delta_text == self.tool_call_start_token_array[-1]
+                or delta_text == self.tool_call_end_token_array[-1]
+            ):
                 buffered_text = self.buffered_delta_text
                 self.buffered_delta_text = ""
                 return buffered_text + delta_text
@@ -98,9 +112,8 @@ def tool_call_delta_buffer(self, delta_text: str):
             else:
                 return delta_text
 
-    def adjust_request(
-            self, request: ChatCompletionRequest) -> ChatCompletionRequest:
-        if request.tools and request.tool_choice != 'none':
+    def adjust_request(self, request: ChatCompletionRequest) -> ChatCompletionRequest:
+        if request.tools and request.tool_choice != "none":
             # do not skip special tokens because the tool_call tokens are
             # marked "special" in some models. Since they are skipped
             # prior to the call to the tool parser, it breaks tool calling.
@@ -112,22 +125,19 @@ def extract_tool_calls(
         model_output: str,
         request: ChatCompletionRequest,
     ) -> ExtractedToolCallInformation:
-
         # sanity check; avoid unnecessary processing
         if self.tool_call_start_token not in model_output:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         else:
-
             try:
                 # there are two possible captures - between tags, or between a
                 # tag and end-of-string so the result of
                 # findall is an array of tuples where one is a function call and
                 # the other is None
-                function_call_tuples = (
-                    self.tool_call_regex.findall(model_output))
+                function_call_tuples = self.tool_call_regex.findall(model_output)
 
                 # load the JSON, and then use it to build the Function and
                 # Tool Call
@@ -141,24 +151,26 @@ def extract_tool_calls(
                         function=FunctionCall(
                             name=function_call["name"],
                             # function call args are JSON but as a string
-                            arguments=json.dumps(function_call["arguments"],
-                                                 ensure_ascii=False)))
+                            arguments=json.dumps(
+                                function_call["arguments"], ensure_ascii=False
+                            ),
+                        ),
+                    )
                     for function_call in raw_function_calls
                 ]
 
-                content = model_output[:model_output.
-                                       find(self.tool_call_start_token)]
+                content = model_output[: model_output.find(self.tool_call_start_token)]
                 return ExtractedToolCallInformation(
                     tools_called=True,
                     tool_calls=tool_calls,
-                    content=content if content else None)
+                    content=content if content else None,
+                )
 
             except Exception:
-                logger.exception(
-                    "Error in extracting tool call from response.")
-                return ExtractedToolCallInformation(tools_called=False,
-                                                    tool_calls=[],
-                                                    content=model_output)
+                logger.exception("Error in extracting tool call from response.")
+                return ExtractedToolCallInformation(
+                    tools_called=False, tool_calls=[], content=model_output
+                )
 
     def extract_tool_calls_streaming(
         self,
@@ -177,10 +189,12 @@ def extract_tool_calls_streaming(
         delta_text = self.tool_call_delta_buffer(delta_text)
         # If the last characters of previous_text
         # match self.buffered_delta_text, remove only the matching part.
-        if (len(previous_text) >= len(self.buffered_delta_text)
-                and previous_text[-len(self.buffered_delta_text):]
-                == self.buffered_delta_text):
-            previous_text = previous_text[:-len(self.buffered_delta_text)]
+        if (
+            len(previous_text) >= len(self.buffered_delta_text)
+            and previous_text[-len(self.buffered_delta_text) :]
+            == self.buffered_delta_text
+        ):
+            previous_text = previous_text[: -len(self.buffered_delta_text)]
             current_text = previous_text + delta_text
 
         logger.debug("delta_text: %s", delta_text)
@@ -191,50 +205,51 @@ def extract_tool_calls_streaming(
             return DeltaMessage(content=delta_text)
 
         try:
-
             # figure out where we are in the parsing by counting tool call
             # start & end tags
-            prev_tool_start_count = previous_text.count(
-                self.tool_call_start_token)
+            prev_tool_start_count = previous_text.count(self.tool_call_start_token)
             prev_tool_end_count = previous_text.count(self.tool_call_end_token)
-            cur_tool_start_count = current_text.count(
-                self.tool_call_start_token)
+            cur_tool_start_count = current_text.count(self.tool_call_start_token)
             cur_tool_end_count = current_text.count(self.tool_call_end_token)
             tool_call_portion = None
             text_portion = None
 
             # case: if we're generating text, OR rounding out a tool call
-            if (cur_tool_start_count == cur_tool_end_count
-                    and prev_tool_end_count == cur_tool_end_count
-                    and self.tool_call_end_token not in delta_text):
+            if (
+                cur_tool_start_count == cur_tool_end_count
+                and prev_tool_end_count == cur_tool_end_count
+                and self.tool_call_end_token not in delta_text
+            ):
                 logger.debug("Generating text content! skipping tool parsing.")
                 return DeltaMessage(content=delta_text)
 
             if self.tool_call_end_token in delta_text:
                 logger.debug("tool_call_end_token in delta_text")
                 full_text = current_text + delta_text
-                tool_call_portion = full_text.split(
-                    self.tool_call_start_token)[-1].split(
-                        self.tool_call_end_token)[0].rstrip()
-                delta_text = delta_text.split(
-                    self.tool_call_end_token)[0].rstrip()
-                text_portion = delta_text.split(
-                    self.tool_call_end_token)[-1].lstrip()
+                tool_call_portion = (
+                    full_text.split(self.tool_call_start_token)[-1]
+                    .split(self.tool_call_end_token)[0]
+                    .rstrip()
+                )
+                delta_text = delta_text.split(self.tool_call_end_token)[0].rstrip()
+                text_portion = delta_text.split(self.tool_call_end_token)[-1].lstrip()
 
             # case: if tool open & close tag counts don't match, we're doing
             # imaginary "else" block here
             # something with tools with this diff.
             # flags for partial JSON parting. exported constants from
             # "Allow" are handled via BIT MASK
-            flags = Allow.ALL if self.current_tool_name_sent \
-                else Allow.ALL & ~Allow.STR
+            flags = Allow.ALL if self.current_tool_name_sent else Allow.ALL & ~Allow.STR
 
             # case -- we're starting a new tool call
-            if (cur_tool_start_count > cur_tool_end_count
-                    and cur_tool_start_count > prev_tool_start_count):
+            if (
+                cur_tool_start_count > cur_tool_end_count
+                and cur_tool_start_count > prev_tool_start_count
+            ):
                 if len(delta_token_ids) > 1:
-                    tool_call_portion = current_text.split(
-                        self.tool_call_start_token)[-1]
+                    tool_call_portion = current_text.split(self.tool_call_start_token)[
+                        -1
+                    ]
                 else:
                     tool_call_portion = None
                     delta = None
@@ -248,42 +263,49 @@ def extract_tool_calls_streaming(
                 logger.debug("Starting on a new tool %s", self.current_tool_id)
 
             # case -- we're updating an existing tool call
-            elif (cur_tool_start_count > cur_tool_end_count
-                  and cur_tool_start_count == prev_tool_start_count):
-
+            elif (
+                cur_tool_start_count > cur_tool_end_count
+                and cur_tool_start_count == prev_tool_start_count
+            ):
                 # get the portion of the text that's the tool call
-                tool_call_portion = current_text.split(
-                    self.tool_call_start_token)[-1]
+                tool_call_portion = current_text.split(self.tool_call_start_token)[-1]
                 text_portion = None
 
             # case -- the current tool call is being closed.
-            elif (cur_tool_start_count == cur_tool_end_count
-                  and cur_tool_end_count >= prev_tool_end_count):
-                if (self.prev_tool_call_arr is None
-                        or len(self.prev_tool_call_arr) == 0):
-                    logger.debug(
-                        "attempting to close tool call, but no tool call")
+            elif (
+                cur_tool_start_count == cur_tool_end_count
+                and cur_tool_end_count >= prev_tool_end_count
+            ):
+                if self.prev_tool_call_arr is None or len(self.prev_tool_call_arr) == 0:
+                    logger.debug("attempting to close tool call, but no tool call")
                     return None
-                diff = self.prev_tool_call_arr[self.current_tool_id].get(
-                    "arguments")
+                diff = self.prev_tool_call_arr[self.current_tool_id].get("arguments")
                 if diff:
-                    diff = diff.encode('utf-8').decode(
-                        'unicode_escape') if diff is str else diff
-                    if ('"}' not in delta_text):
+                    diff = (
+                        diff.encode("utf-8").decode("unicode_escape")
+                        if diff is str
+                        else diff
+                    )
+                    if '"}' not in delta_text:
                         return None
                     end_loc = delta_text.rindex('"}')
                     diff = delta_text[:end_loc] + '"}'
                     logger.debug(
                         "Finishing tool and found diff that had not "
-                        "been streamed yet: %s", diff)
-                    self.streamed_args_for_tool[self.current_tool_id] \
-                        += diff
-                    return DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.current_tool_id,
-                                      function=DeltaFunctionCall(
-                                          arguments=diff).model_dump(
-                                              exclude_none=True))
-                    ])
+                        "been streamed yet: %s",
+                        diff,
+                    )
+                    self.streamed_args_for_tool[self.current_tool_id] += diff
+                    return DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                function=DeltaFunctionCall(arguments=diff).model_dump(
+                                    exclude_none=True
+                                ),
+                            )
+                        ]
+                    )
 
             # case -- otherwise we're just generating text
             else:
@@ -293,13 +315,14 @@ def extract_tool_calls_streaming(
                 return delta
 
             try:
-
-                current_tool_call = partial_json_parser.loads(
-                    tool_call_portion or "{}",
-                    flags) if tool_call_portion else None
+                current_tool_call = (
+                    partial_json_parser.loads(tool_call_portion or "{}", flags)
+                    if tool_call_portion
+                    else None
+                )
                 logger.debug("Parsed tool call %s", current_tool_call)
             except partial_json_parser.core.exceptions.MalformedJSON:
-                logger.debug('not enough tokens to parse into JSON yet')
+                logger.debug("not enough tokens to parse into JSON yet")
                 return None
             except json.decoder.JSONDecodeError:
                 logger.debug("unable to parse JSON")
@@ -308,19 +331,23 @@ def extract_tool_calls_streaming(
             # case - we haven't sent the tool name yet. If it's available, send
             #   it. otherwise, wait until it's available.
             if not self.current_tool_name_sent:
-                if (current_tool_call is None):
+                if current_tool_call is None:
                     return None
                 function_name: Union[str, None] = current_tool_call.get("name")
                 if function_name:
                     self.current_tool_name_sent = True
-                    return DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.current_tool_id,
-                                      type="function",
-                                      id=make_tool_call_id(),
-                                      function=DeltaFunctionCall(
-                                          name=function_name).model_dump(
-                                              exclude_none=True))
-                    ])
+                    return DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                type="function",
+                                id=make_tool_call_id(),
+                                function=DeltaFunctionCall(
+                                    name=function_name
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
                 else:
                     return None
             # case -- otherwise, send the tool call delta
@@ -329,15 +356,19 @@ def extract_tool_calls_streaming(
             if tool_call_portion is None:
                 # if there's text but not tool calls, send that -
                 # otherwise None to skip chunk
-                delta = DeltaMessage(content=delta_text) \
-                    if text_portion is not None else None
+                delta = (
+                    DeltaMessage(content=delta_text)
+                    if text_portion is not None
+                    else None
+                )
                 return delta
 
             # now, the nitty-gritty of tool calls
             # now we have the portion to parse as tool call.
 
-            logger.debug("Trying to parse current tool call with ID %s",
-                         self.current_tool_id)
+            logger.debug(
+                "Trying to parse current tool call with ID %s", self.current_tool_id
+            )
 
             # if we're starting a new tool call, push an empty object in as
             #   a placeholder for the arguments
@@ -346,8 +377,9 @@ def extract_tool_calls_streaming(
 
             # main logic for tool parsing here - compare prev. partially-parsed
             #   JSON to the current partially-parsed JSON
-            prev_arguments = (
-                self.prev_tool_call_arr[self.current_tool_id].get("arguments"))
+            prev_arguments = self.prev_tool_call_arr[self.current_tool_id].get(
+                "arguments"
+            )
             cur_arguments = current_tool_call.get("arguments")
 
             logger.debug("diffing old arguments: %s", prev_arguments)
@@ -361,8 +393,10 @@ def extract_tool_calls_streaming(
             # case -- prev arguments are defined, but non are now.
             #   probably impossible, but not a fatal error - just keep going
             elif not cur_arguments and prev_arguments:
-                logger.error("should be impossible to have arguments reset "
-                             "mid-call. skipping streaming anything.")
+                logger.error(
+                    "should be impossible to have arguments reset "
+                    "mid-call. skipping streaming anything."
+                )
                 delta = None
 
             # case -- we now have the first info about arguments available from
@@ -378,38 +412,41 @@ def extract_tool_calls_streaming(
                 #     {"search_request": {}}
                 function_name = current_tool_call.get("name")
                 match = re.search(
-                    r'\{"name":\s*"' +
-                    re.escape(function_name) + r'"\s*,\s*"arguments":\s*(.*)',
-                    tool_call_portion.strip(), re.DOTALL)
+                    r'\{"name":\s*"'
+                    + re.escape(function_name)
+                    + r'"\s*,\s*"arguments":\s*(.*)',
+                    tool_call_portion.strip(),
+                    re.DOTALL,
+                )
                 if match:
                     cur_arguments_json = match.group(1)
                 else:
-                    cur_arguments_json = json.dumps(cur_arguments,
-                                                    ensure_ascii=False)
+                    cur_arguments_json = json.dumps(cur_arguments, ensure_ascii=False)
 
-                logger.debug("finding %s in %s", delta_text,
-                             cur_arguments_json)
+                logger.debug("finding %s in %s", delta_text, cur_arguments_json)
 
                 # get the location where previous args differ from current.
-                if (delta_text not in cur_arguments_json):
+                if delta_text not in cur_arguments_json:
                     return None
-                args_delta_start_loc = cur_arguments_json. \
-                                           rindex(delta_text) + \
-                                           len(delta_text)
+                args_delta_start_loc = cur_arguments_json.rindex(delta_text) + len(
+                    delta_text
+                )
 
                 # use that to find the actual delta
                 arguments_delta = cur_arguments_json[:args_delta_start_loc]
-                logger.debug("First tokens in arguments received: %s",
-                             arguments_delta)
-
-                delta = DeltaMessage(tool_calls=[
-                    DeltaToolCall(index=self.current_tool_id,
-                                  function=DeltaFunctionCall(
-                                      arguments=arguments_delta).model_dump(
-                                          exclude_none=True))
-                ])
-                self.streamed_args_for_tool[self.current_tool_id] \
-                    += arguments_delta
+                logger.debug("First tokens in arguments received: %s", arguments_delta)
+
+                delta = DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=self.current_tool_id,
+                            function=DeltaFunctionCall(
+                                arguments=arguments_delta
+                            ).model_dump(exclude_none=True),
+                        )
+                    ]
+                )
+                self.streamed_args_for_tool[self.current_tool_id] += arguments_delta
 
             # last case -- we have an update to existing arguments.
             elif cur_arguments and prev_arguments:
@@ -423,28 +460,32 @@ def extract_tool_calls_streaming(
                 # if the delta_text ends with a '}' and tool_call_portion is a
                 #   complete JSON, then the last '}' does not belong to the
                 #   arguments, so we should trim it off
-                if isinstance(delta_text, str) \
-                    and len(delta_text.rstrip()) >= 1 \
-                    and delta_text.rstrip()[-1] == '}' \
-                    and is_complete_json:
+                if (
+                    isinstance(delta_text, str)
+                    and len(delta_text.rstrip()) >= 1
+                    and delta_text.rstrip()[-1] == "}"
+                    and is_complete_json
+                ):
                     delta_text = delta_text.rstrip()[:-1]
 
                 logger.debug("got diff %s", delta_text)
 
-                delta = DeltaMessage(tool_calls=[
-                    DeltaToolCall(index=self.current_tool_id,
-                                  function=DeltaFunctionCall(
-                                      arguments=delta_text).model_dump(
-                                          exclude_none=True))
-                ])
-                self.streamed_args_for_tool[self.current_tool_id] \
-                    += delta_text
+                delta = DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=self.current_tool_id,
+                            function=DeltaFunctionCall(arguments=delta_text).model_dump(
+                                exclude_none=True
+                            ),
+                        )
+                    ]
+                )
+                self.streamed_args_for_tool[self.current_tool_id] += delta_text
 
             # handle saving the state for the current tool into
             # the "prev" list for use in diffing for the next iteration
             if self.current_tool_id == len(self.prev_tool_call_arr) - 1:
-                self.prev_tool_call_arr[self.current_tool_id] = \
-                    current_tool_call
+                self.prev_tool_call_arr[self.current_tool_id] = current_tool_call
             else:
                 self.prev_tool_call_arr.append(current_tool_call)
 
diff --git a/vllm/entrypoints/openai/tool_parsers/hunyuan_a13b_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/hunyuan_a13b_tool_parser.py
index 2b65f2579fb4..1855d69adb21 100644
--- a/vllm/entrypoints/openai/tool_parsers/hunyuan_a13b_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/hunyuan_a13b_tool_parser.py
@@ -8,13 +8,19 @@
 
 import regex as re
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
+    ToolParser,
+    ToolParserManager,
+)
 from vllm.entrypoints.openai.tool_parsers.utils import consume_space
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
@@ -25,7 +31,6 @@
 
 @ToolParserManager.register_module("hunyuan_a13b")
 class HunyuanA13BToolParser(ToolParser):
-
     def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
 
@@ -33,8 +38,7 @@ def __init__(self, tokenizer: AnyTokenizer):
         self.prev_tool_calls: list[dict] = []
         self.current_tool_id = -1
         self.current_tool_name_sent = False
-        self.streamed_args: list[str] = [
-        ]  # Track arguments sent for each tool
+        self.streamed_args: list[str] = []  # Track arguments sent for each tool
 
         # For backward compatibility with tests
         self.current_tools_sent: list[bool] = []
@@ -44,12 +48,14 @@ def __init__(self, tokenizer: AnyTokenizer):
 
         # Regex patterns for preprocessing
         self.answer_tool_calls_pattern = re.compile(
-            r"<tool_calls>([\s\S]*?)</tool_calls>", re.DOTALL)
+            r"<tool_calls>([\s\S]*?)</tool_calls>", re.DOTALL
+        )
 
         self.tool_name_reg = re.compile(r'"name"\s*:\s*"([^"]+)"')
 
         self.tool_empty_arg_reg = re.compile(
-            r'"name"\s*:\s*"[^"]+"\s*,\s*"arguments"\s*:\s*\{\s*\}')
+            r'"name"\s*:\s*"[^"]+"\s*,\s*"arguments"\s*:\s*\{\s*\}'
+        )
 
         # TODO: not support nested json object in fc arguments.
         self.tool_non_empty_arg_reg = re.compile(
@@ -66,15 +72,21 @@ def __init__(self, tokenizer: AnyTokenizer):
         }
 
     def preprocess_model_output(
-            self, model_output: str) -> tuple[Optional[str], Optional[str]]:
+        self, model_output: str
+    ) -> tuple[Optional[str], Optional[str]]:
         # find the location tool call
         for match in self.answer_tool_calls_pattern.finditer(model_output):
             start, end = match.span()
             # check tool_calls whether in side of <think>
-            think_regions = [(m.start(), m.end()) for m in re.finditer(
-                r"<think>(.*?)</think>", model_output, flags=re.DOTALL)]
-            in_think = any(start > t_start and end < t_end
-                           for t_start, t_end in think_regions)
+            think_regions = [
+                (m.start(), m.end())
+                for m in re.finditer(
+                    r"<think>(.*?)</think>", model_output, flags=re.DOTALL
+                )
+            ]
+            in_think = any(
+                start > t_start and end < t_end for t_start, t_end in think_regions
+            )
             if not in_think:
                 content = model_output[:start]
                 tool_calls_content = match.group(1).strip()
@@ -86,24 +98,23 @@ def preprocess_model_output(
         return model_output, None
 
     def extract_tool_calls(
-            self, model_output: str,
-            request: ChatCompletionRequest) -> ExtractedToolCallInformation:
+        self, model_output: str, request: ChatCompletionRequest
+    ) -> ExtractedToolCallInformation:
         """
         Extract tool calls from a complete model output.
         """
         try:
             # Preprocess the model output
-            content, potential_tool_calls = self.preprocess_model_output(
-                model_output)
+            content, potential_tool_calls = self.preprocess_model_output(model_output)
 
             if not potential_tool_calls:
                 # some text should be filtered out for no function call
                 # this text is in a13b's chat template.
                 if content:
                     content = content.replace("助手：", "", 1)
-                return ExtractedToolCallInformation(tools_called=False,
-                                                    tool_calls=[],
-                                                    content=content)
+                return ExtractedToolCallInformation(
+                    tools_called=False, tool_calls=[], content=content
+                )
 
             # Parse the potential tool calls as JSON
             tool_calls_data = json.loads(potential_tool_calls)
@@ -120,8 +131,11 @@ def extract_tool_calls(
             tool_calls: list[ToolCall] = []
 
             for idx, call in enumerate(tool_calls_data):
-                if (not isinstance(call, dict) or "name" not in call
-                        or "arguments" not in call):
+                if (
+                    not isinstance(call, dict)
+                    or "name" not in call
+                    or "arguments" not in call
+                ):
                     continue
 
                 tool_call = ToolCall(
@@ -129,8 +143,11 @@ def extract_tool_calls(
                     type="function",
                     function=FunctionCall(
                         name=call["name"],
-                        arguments=(json.dumps(call["arguments"]) if isinstance(
-                            call["arguments"], dict) else call["arguments"]),
+                        arguments=(
+                            json.dumps(call["arguments"])
+                            if isinstance(call["arguments"], dict)
+                            else call["arguments"]
+                        ),
                     ),
                 )
                 tool_calls.append(tool_call)
@@ -146,9 +163,9 @@ def extract_tool_calls(
             )
 
         except Exception:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
     def extract_tool_calls_streaming(
         self,
@@ -166,10 +183,12 @@ def extract_tool_calls_streaming(
 
         start_idx = consume_space(0, current_text)
         if current_text[start_idx:].startswith(self.bot_string):
-            start_idx = consume_space(start_idx + len(self.bot_string),
-                                      current_text)
-        if not current_text or start_idx >= len(
-                current_text) or current_text[start_idx] != '[':
+            start_idx = consume_space(start_idx + len(self.bot_string), current_text)
+        if (
+            not current_text
+            or start_idx >= len(current_text)
+            or current_text[start_idx] != "["
+        ):
             return DeltaMessage(content=delta_text)
 
         self._try_parse_json_tools(current_text[start_idx:])
@@ -185,13 +204,15 @@ def extract_tool_calls_streaming(
         self._ensure_state_arrays(tool_count)
         current_idx = self.streaming_state["current_tool_index"]
 
-        name_delta = self._handle_tool_name_streaming(current_idx, tool_count,
-                                                      name_matches)
+        name_delta = self._handle_tool_name_streaming(
+            current_idx, tool_count, name_matches
+        )
         if name_delta:
             return name_delta
 
-        args_delta = self._handle_tool_args_streaming(current_text,
-                                                      current_idx, tool_count)
+        args_delta = self._handle_tool_args_streaming(
+            current_text, current_idx, tool_count
+        )
         if args_delta:
             return args_delta
 
@@ -207,166 +228,195 @@ def _try_parse_json_tools(self, current_text: str):
 
     def _handle_test_compatibility(self, current_text: str):
         if len(self.current_tools_sent) > 0:
-            if (len(self.current_tools_sent) == 1
-                    and self.current_tools_sent[0] is False):
+            if (
+                len(self.current_tools_sent) == 1
+                and self.current_tools_sent[0] is False
+            ):
                 name_match = self.tool_name_reg.search(current_text)
                 if name_match:
                     function_name = name_match.group(1)
                     tool_id = f"chatcmpl-tool-{random_uuid()}"
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=0,
-                            type="function",
-                            id=tool_id,
-                            function=DeltaFunctionCall(
-                                name=function_name).model_dump(
-                                    exclude_none=True),
-                        )
-                    ])
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=0,
+                                type="function",
+                                id=tool_id,
+                                function=DeltaFunctionCall(
+                                    name=function_name
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
                     self.current_tools_sent = [True]
                     self.current_tool_id = 0
                     self.streaming_state["current_tool_index"] = 0
                     if len(self.streaming_state["sent_tools"]) == 0:
-                        self.streaming_state["sent_tools"].append({
-                            "sent_name":
-                            True,
-                            "sent_arguments_prefix":
-                            False,
-                            "sent_arguments":
-                            "",
-                        })
+                        self.streaming_state["sent_tools"].append(
+                            {
+                                "sent_name": True,
+                                "sent_arguments_prefix": False,
+                                "sent_arguments": "",
+                            }
+                        )
                     else:
-                        self.streaming_state["sent_tools"][0][
-                            "sent_name"] = True
+                        self.streaming_state["sent_tools"][0]["sent_name"] = True
                     self.current_tool_name_sent = True
                     return delta
         return None
 
     def _ensure_state_arrays(self, tool_count: int):
         while len(self.streaming_state["sent_tools"]) < tool_count:
-            self.streaming_state["sent_tools"].append({
-                "sent_name": False,
-                "sent_arguments_prefix": False,
-                "sent_arguments": "",
-            })
+            self.streaming_state["sent_tools"].append(
+                {
+                    "sent_name": False,
+                    "sent_arguments_prefix": False,
+                    "sent_arguments": "",
+                }
+            )
         while len(self.streaming_state["tool_ids"]) < tool_count:
             self.streaming_state["tool_ids"].append(None)
 
-    def _handle_tool_name_streaming(self, current_idx: int, tool_count: int,
-                                    name_matches):
+    def _handle_tool_name_streaming(
+        self, current_idx: int, tool_count: int, name_matches
+    ):
         if current_idx == -1 or current_idx < tool_count - 1:
             next_idx = current_idx + 1
-            if (next_idx < tool_count
-                    and not self.streaming_state["sent_tools"][next_idx]
-                ["sent_name"]):
+            if (
+                next_idx < tool_count
+                and not self.streaming_state["sent_tools"][next_idx]["sent_name"]
+            ):
                 self.streaming_state["current_tool_index"] = next_idx
                 self.current_tool_id = next_idx
                 current_idx = next_idx
                 tool_name = name_matches[current_idx].group(1)
                 tool_id = f"call_{current_idx}_{random_uuid()}"
                 self.streaming_state["tool_ids"][current_idx] = tool_id
-                delta = DeltaMessage(tool_calls=[
-                    DeltaToolCall(
-                        index=current_idx,
-                        type="function",
-                        id=tool_id,
-                        function=DeltaFunctionCall(name=tool_name).model_dump(
-                            exclude_none=True),
-                    )
-                ])
-                self.streaming_state["sent_tools"][current_idx][
-                    "sent_name"] = True
+                delta = DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=current_idx,
+                            type="function",
+                            id=tool_id,
+                            function=DeltaFunctionCall(name=tool_name).model_dump(
+                                exclude_none=True
+                            ),
+                        )
+                    ]
+                )
+                self.streaming_state["sent_tools"][current_idx]["sent_name"] = True
                 self.current_tool_name_sent = True
                 while len(self.streamed_args) <= current_idx:
                     self.streamed_args.append("")
                 return delta
         return None
 
-    def _handle_tool_args_streaming(self, current_text: str, current_idx: int,
-                                    tool_count: int):
-
+    def _handle_tool_args_streaming(
+        self, current_text: str, current_idx: int, tool_count: int
+    ):
         if current_idx >= 0 and current_idx < tool_count:
             empty_args_match = self.tool_empty_arg_reg.search(current_text)
             if empty_args_match and empty_args_match.start() > 0:
                 for i in range(tool_count):
                     if i == current_idx:
                         if not self.streaming_state["sent_tools"][current_idx][
-                                "sent_arguments_prefix"]:
+                            "sent_arguments_prefix"
+                        ]:
                             self.streaming_state["sent_tools"][current_idx][
-                                "sent_arguments_prefix"] = True
+                                "sent_arguments_prefix"
+                            ] = True
                             self.streaming_state["sent_tools"][current_idx][
-                                "sent_arguments"] = "{}"
+                                "sent_arguments"
+                            ] = "{}"
                             while len(self.streamed_args) <= current_idx:
                                 self.streamed_args.append("")
                             self.streamed_args[current_idx] += "{}"
-                            delta = DeltaMessage(tool_calls=[
-                                DeltaToolCall(
-                                    index=current_idx,
-                                    function=DeltaFunctionCall(
-                                        arguments="{}").model_dump(
-                                            exclude_none=True),
-                                )
-                            ])
+                            delta = DeltaMessage(
+                                tool_calls=[
+                                    DeltaToolCall(
+                                        index=current_idx,
+                                        function=DeltaFunctionCall(
+                                            arguments="{}"
+                                        ).model_dump(exclude_none=True),
+                                    )
+                                ]
+                            )
                             if current_idx < tool_count - 1:
                                 self.streaming_state["current_tool_index"] += 1
                                 self.current_tool_id = self.streaming_state[
-                                    "current_tool_index"]
+                                    "current_tool_index"
+                                ]
                             return delta
 
-            args_matches = list(
-                self.tool_non_empty_arg_reg.finditer(current_text))
+            args_matches = list(self.tool_non_empty_arg_reg.finditer(current_text))
             if current_idx < len(args_matches):
                 args_text = args_matches[current_idx].group(1)
                 is_last_tool = current_idx == tool_count - 1
                 if not is_last_tool:
                     next_tool_pos = current_text.find(
-                        "},{", args_matches[current_idx].start())
+                        "},{", args_matches[current_idx].start()
+                    )
                     if next_tool_pos != -1:
-                        args_end_pos = (next_tool_pos + 1)
+                        args_end_pos = next_tool_pos + 1
                         args_text = (
-                            current_text[args_matches[current_idx].start(
-                            ):args_end_pos].split('"arguments":')[1].strip())
+                            current_text[
+                                args_matches[current_idx].start() : args_end_pos
+                            ]
+                            .split('"arguments":')[1]
+                            .strip()
+                        )
                 sent_args = self.streaming_state["sent_tools"][current_idx][
-                    "sent_arguments"]
+                    "sent_arguments"
+                ]
                 if not self.streaming_state["sent_tools"][current_idx][
-                        "sent_arguments_prefix"] and args_text.startswith("{"):
+                    "sent_arguments_prefix"
+                ] and args_text.startswith("{"):
                     self.streaming_state["sent_tools"][current_idx][
-                        "sent_arguments_prefix"] = True
+                        "sent_arguments_prefix"
+                    ] = True
                     self.streaming_state["sent_tools"][current_idx][
-                        "sent_arguments"] = "{"
+                        "sent_arguments"
+                    ] = "{"
                     while len(self.streamed_args) <= current_idx:
                         self.streamed_args.append("")
                     self.streamed_args[current_idx] += "{"
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=current_idx,
-                            function=DeltaFunctionCall(
-                                arguments="{").model_dump(exclude_none=True),
-                        )
-                    ])
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=current_idx,
+                                function=DeltaFunctionCall(arguments="{").model_dump(
+                                    exclude_none=True
+                                ),
+                            )
+                        ]
+                    )
                     return delta
 
                 if args_text.startswith(sent_args):
-                    args_diff = args_text[len(sent_args):]
+                    args_diff = args_text[len(sent_args) :]
                     if args_diff:
                         self.streaming_state["sent_tools"][current_idx][
-                            "sent_arguments"] = args_text
+                            "sent_arguments"
+                        ] = args_text
                         while len(self.streamed_args) <= current_idx:
                             self.streamed_args.append("")
                         self.streamed_args[current_idx] += args_diff
-                        delta = DeltaMessage(tool_calls=[
-                            DeltaToolCall(
-                                index=current_idx,
-                                function=DeltaFunctionCall(
-                                    arguments=args_diff).model_dump(
-                                        exclude_none=True),
-                            )
-                        ])
+                        delta = DeltaMessage(
+                            tool_calls=[
+                                DeltaToolCall(
+                                    index=current_idx,
+                                    function=DeltaFunctionCall(
+                                        arguments=args_diff
+                                    ).model_dump(exclude_none=True),
+                                )
+                            ]
+                        )
                         return delta
 
                 if args_text.endswith("}") and args_text == sent_args:
                     if current_idx < tool_count - 1:
                         self.streaming_state["current_tool_index"] += 1
                         self.current_tool_id = self.streaming_state[
-                            "current_tool_index"]
+                            "current_tool_index"
+                        ]
         return None
diff --git a/vllm/entrypoints/openai/tool_parsers/internlm2_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/internlm2_tool_parser.py
index 37c360145b04..9adaea297b05 100644
--- a/vllm/entrypoints/openai/tool_parsers/internlm2_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/internlm2_tool_parser.py
@@ -9,15 +9,20 @@
 from partial_json_parser.core.options import Allow
 
 from vllm.entrypoints.chat_utils import make_tool_call_id
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
-from vllm.entrypoints.openai.tool_parsers.utils import (
-    extract_intermediate_diff)
+    ToolParser,
+    ToolParserManager,
+)
+from vllm.entrypoints.openai.tool_parsers.utils import extract_intermediate_diff
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
@@ -26,14 +31,12 @@
 
 @ToolParserManager.register_module(["internlm"])
 class Internlm2ToolParser(ToolParser):
-
     def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
         self.position = 0
 
-    def adjust_request(
-            self, request: ChatCompletionRequest) -> ChatCompletionRequest:
-        if request.tools and request.tool_choice != 'none':
+    def adjust_request(self, request: ChatCompletionRequest) -> ChatCompletionRequest:
+        if request.tools and request.tool_choice != "none":
             # do not skip special tokens because internlm use the special
             # tokens to indicate the start and end of the tool calls
             # information.
@@ -57,34 +60,33 @@ def extract_tool_calls_streaming(
         delta_token_ids: Sequence[int],
         request: ChatCompletionRequest,
     ) -> Union[DeltaMessage, None]:
-        if '<|action_start|>' not in current_text:
+        if "<|action_start|>" not in current_text:
             self.position = len(current_text)
             return DeltaMessage(content=delta_text)
         # if the tool call is sent, return an empty delta message
         # to make sure the finish_reason will be sent correctly.
         if self.current_tool_id > 0:
-            return DeltaMessage(content='')
+            return DeltaMessage(content="")
 
         last_pos = self.position
-        if '<|action_start|><|plugin|>' not in current_text[last_pos:]:
+        if "<|action_start|><|plugin|>" not in current_text[last_pos:]:
             return None
 
         new_delta = current_text[last_pos:]
-        text, action = new_delta.split('<|action_start|><|plugin|>')
+        text, action = new_delta.split("<|action_start|><|plugin|>")
 
         if len(text) > 0:
             self.position = self.position + len(text)
             return DeltaMessage(content=text)
 
         action = action.strip()
-        action = action.split('<|action_end|>'.strip())[0]
+        action = action.split("<|action_end|>".strip())[0]
 
         # bit mask flags for partial JSON parsing. If the name hasn't been
         # sent yet, don't allow sending
         # an incomplete string since OpenAI only ever (as far as I have
         # seen) allows sending the entire tool/ function name at once.
-        flags = Allow.ALL if self.current_tool_name_sent \
-            else Allow.ALL & ~Allow.STR
+        flags = Allow.ALL if self.current_tool_name_sent else Allow.ALL & ~Allow.STR
 
         try:
             parsable_arr = action
@@ -92,10 +94,9 @@ def extract_tool_calls_streaming(
             # tool calls are generated in an object in internlm2
             # it's not support parallel tool calls
             try:
-                tool_call_arr: dict = partial_json_parser.loads(
-                    parsable_arr, flags)
+                tool_call_arr: dict = partial_json_parser.loads(parsable_arr, flags)
             except partial_json_parser.core.exceptions.MalformedJSON:
-                logger.debug('not enough tokens to parse into JSON yet')
+                logger.debug("not enough tokens to parse into JSON yet")
                 return None
 
             # if the current tool name hasn't been sent, send if available
@@ -104,14 +105,18 @@ def extract_tool_calls_streaming(
                 function_name = tool_call_arr.get("name")
                 if function_name:
                     self.current_tool_id = self.current_tool_id + 1
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.current_tool_id,
-                                      type="function",
-                                      id=make_tool_call_id(),
-                                      function=DeltaFunctionCall(
-                                          name=function_name).model_dump(
-                                              exclude_none=True))
-                    ])
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                type="function",
+                                id=make_tool_call_id(),
+                                function=DeltaFunctionCall(
+                                    name=function_name
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
                     self.current_tool_name_sent = True
                     self.streamed_args_for_tool.append("")
                 else:
@@ -120,7 +125,8 @@ def extract_tool_calls_streaming(
             # arguments
             else:
                 prev_arguments = self.get_arguments(
-                    self.prev_tool_call_arr[self.current_tool_id])
+                    self.prev_tool_call_arr[self.current_tool_id]
+                )
                 cur_arguments = self.get_arguments(tool_call_arr)
 
                 # not arguments generated
@@ -129,43 +135,47 @@ def extract_tool_calls_streaming(
                 # will never happen
                 elif not cur_arguments and prev_arguments:
                     logger.error(
-                        "INVARIANT - impossible to have arguments reset "
-                        "mid-arguments")
+                        "INVARIANT - impossible to have arguments reset mid-arguments"
+                    )
                     delta = None
                 # first time to get parameters
                 elif cur_arguments and not prev_arguments:
-                    cur_arguments_json = json.dumps(cur_arguments,
-                                                    ensure_ascii=False)
-
-                    arguments_delta = cur_arguments_json[:cur_arguments_json.
-                                                         index(delta_text) +
-                                                         len(delta_text)]
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.current_tool_id,
-                                      function=DeltaFunctionCall(
-                                          arguments=arguments_delta).
-                                      model_dump(exclude_none=True))
-                    ])
-                    self.streamed_args_for_tool[
-                        self.current_tool_id] += arguments_delta
+                    cur_arguments_json = json.dumps(cur_arguments, ensure_ascii=False)
+
+                    arguments_delta = cur_arguments_json[
+                        : cur_arguments_json.index(delta_text) + len(delta_text)
+                    ]
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                function=DeltaFunctionCall(
+                                    arguments=arguments_delta
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
+                    self.streamed_args_for_tool[self.current_tool_id] += arguments_delta
                 # both prev and cur parameters, send the increase parameters
                 elif cur_arguments and prev_arguments:
-                    cur_args_json = json.dumps(cur_arguments,
-                                               ensure_ascii=False)
-                    prev_args_json = json.dumps(prev_arguments,
-                                                ensure_ascii=False)
+                    cur_args_json = json.dumps(cur_arguments, ensure_ascii=False)
+                    prev_args_json = json.dumps(prev_arguments, ensure_ascii=False)
 
                     argument_diff = extract_intermediate_diff(
-                        cur_args_json, prev_args_json)
-
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.current_tool_id,
-                                      function=DeltaFunctionCall(
-                                          arguments=argument_diff).model_dump(
-                                              exclude_none=True))
-                    ])
-                    self.streamed_args_for_tool[
-                        self.current_tool_id] += argument_diff
+                        cur_args_json, prev_args_json
+                    )
+
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                function=DeltaFunctionCall(
+                                    arguments=argument_diff
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
+                    self.streamed_args_for_tool[self.current_tool_id] += argument_diff
 
             # check to see if the name is defined and has been sent. if so,
             # stream the name - otherwise keep waiting
@@ -176,8 +186,8 @@ def extract_tool_calls_streaming(
         except Exception:
             logger.exception("Error trying to handle streaming tool call.")
             logger.debug(
-                "Skipping chunk as a result of tool streaming extraction "
-                "error")
+                "Skipping chunk as a result of tool streaming extraction error"
+            )
             return None
 
     def extract_tool_calls(
@@ -187,30 +197,33 @@ def extract_tool_calls(
     ) -> ExtractedToolCallInformation:
         text = model_output
         tools = request.tools
-        if '<|action_start|><|plugin|>' in text:
-            text, action = text.split('<|action_start|><|plugin|>')
-            action = action.split('<|action_end|>'.strip())[0]
-            action = action[action.find('{'):]
+        if "<|action_start|><|plugin|>" in text:
+            text, action = text.split("<|action_start|><|plugin|>")
+            action = action.split("<|action_end|>".strip())[0]
+            action = action[action.find("{") :]
             action_dict = json.loads(action)
-            name, parameters = action_dict['name'], json.dumps(
-                action_dict.get('parameters', action_dict.get('arguments',
-                                                              {})),
-                ensure_ascii=False)
+            name, parameters = (
+                action_dict["name"],
+                json.dumps(
+                    action_dict.get("parameters", action_dict.get("arguments", {})),
+                    ensure_ascii=False,
+                ),
+            )
 
             if not tools or name not in [t.function.name for t in tools]:
-                ExtractedToolCallInformation(tools_called=False,
-                                             tool_calls=[],
-                                             content=text)
+                ExtractedToolCallInformation(
+                    tools_called=False, tool_calls=[], content=text
+                )
 
             tool_calls = [
-                ToolCall(
-                    function=FunctionCall(name=name, arguments=parameters))
+                ToolCall(function=FunctionCall(name=name, arguments=parameters))
             ]
             return ExtractedToolCallInformation(
                 tools_called=True,
                 tool_calls=tool_calls,
-                content=text if len(text) > 0 else None)
+                content=text if len(text) > 0 else None,
+            )
 
-        return ExtractedToolCallInformation(tools_called=False,
-                                            tool_calls=[],
-                                            content=text)
+        return ExtractedToolCallInformation(
+            tools_called=False, tool_calls=[], content=text
+        )
diff --git a/vllm/entrypoints/openai/tool_parsers/jamba_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/jamba_tool_parser.py
index 3b41f6034704..1ae3e0da3351 100644
--- a/vllm/entrypoints/openai/tool_parsers/jamba_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/jamba_tool_parser.py
@@ -10,14 +10,17 @@
 from partial_json_parser.core.options import Allow
 
 from vllm.entrypoints.chat_utils import make_tool_call_id
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers import ToolParser, ToolParserManager
-from vllm.entrypoints.openai.tool_parsers.utils import (
-    extract_intermediate_diff)
+from vllm.entrypoints.openai.tool_parsers.utils import extract_intermediate_diff
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 from vllm.transformers_utils.tokenizers import MistralTokenizer
@@ -27,7 +30,6 @@
 
 @ToolParserManager.register_module("jamba")
 class JambaToolParser(ToolParser):
-
     def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
 
@@ -39,33 +41,35 @@ def __init__(self, tokenizer: AnyTokenizer):
         self.current_tool_name_sent: bool = False
         self.prev_tool_call_arr: list[dict] = []
         self.current_tool_id: int = -1
-        self.streamed_args_for_tool: list[str] = [
-        ]  # map what has been streamed for each tool so far to a list
+        self.streamed_args_for_tool: list[
+            str
+        ] = []  # map what has been streamed for each tool so far to a list
 
         self.tool_calls_start_token: str = "<tool_calls>"
         self.tool_calls_end_token: str = "</tool_calls>"
 
         self.tool_calls_regex = re.compile(
-            rf"{self.tool_calls_start_token}(.*?){self.tool_calls_end_token}",
-            re.DOTALL)
+            rf"{self.tool_calls_start_token}(.*?){self.tool_calls_end_token}", re.DOTALL
+        )
 
         if not self.model_tokenizer:
             raise ValueError(
                 "The model tokenizer must be passed to the ToolParser "
-                "constructor during construction.")
-        self.tool_calls_start_token_id = self.vocab.get(
-            self.tool_calls_start_token)
-        self.tool_calls_end_token_id = self.vocab.get(
-            self.tool_calls_end_token)
-        if (self.tool_calls_start_token_id is None
-                or self.tool_calls_end_token_id is None):
+                "constructor during construction."
+            )
+        self.tool_calls_start_token_id = self.vocab.get(self.tool_calls_start_token)
+        self.tool_calls_end_token_id = self.vocab.get(self.tool_calls_end_token)
+        if (
+            self.tool_calls_start_token_id is None
+            or self.tool_calls_end_token_id is None
+        ):
             raise RuntimeError(
                 "Jamba Tool parser could not locate tool calls start/end "
-                "tokens in the tokenizer!")
+                "tokens in the tokenizer!"
+            )
 
-    def adjust_request(
-            self, request: ChatCompletionRequest) -> ChatCompletionRequest:
-        if request.tools and request.tool_choice != 'none':
+    def adjust_request(self, request: ChatCompletionRequest) -> ChatCompletionRequest:
+        if request.tools and request.tool_choice != "none":
             # do not skip special tokens because jamba use the special
             # tokens to indicate the start and end of the tool calls
             # information.
@@ -73,17 +77,15 @@ def adjust_request(
         return request
 
     def extract_tool_calls(
-            self, model_output: str,
-            request: ChatCompletionRequest) -> ExtractedToolCallInformation:
-
+        self, model_output: str, request: ChatCompletionRequest
+    ) -> ExtractedToolCallInformation:
         # sanity check; avoid unnecessary processing
         if self.tool_calls_start_token not in model_output:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         else:
-
             try:
                 # use a regex to find the tool call between the tags
                 function_calls = self.tool_calls_regex.findall(model_output)[0]
@@ -97,25 +99,26 @@ def extract_tool_calls(
                         function=FunctionCall(
                             name=function_call["name"],
                             # function call args are JSON but as a string
-                            arguments=json.dumps(function_call["arguments"],
-                                                 ensure_ascii=False),
-                        )) for function_call in raw_function_calls
+                            arguments=json.dumps(
+                                function_call["arguments"], ensure_ascii=False
+                            ),
+                        ),
+                    )
+                    for function_call in raw_function_calls
                 ]
 
-                content = model_output[:model_output.
-                                       find(self.tool_calls_start_token)]
+                content = model_output[: model_output.find(self.tool_calls_start_token)]
                 return ExtractedToolCallInformation(
                     tools_called=True,
                     tool_calls=tool_calls,
-                    content=content if
-                    (len(content) > 0 and content != " ") else None)
+                    content=content if (len(content) > 0 and content != " ") else None,
+                )
 
             except Exception:
-                logger.exception(
-                    "Error in extracting tool call from response.")
-                return ExtractedToolCallInformation(tools_called=False,
-                                                    tool_calls=[],
-                                                    content=model_output)
+                logger.exception("Error in extracting tool call from response.")
+                return ExtractedToolCallInformation(
+                    tools_called=False, tool_calls=[], content=model_output
+                )
 
     def extract_tool_calls_streaming(
         self,
@@ -127,7 +130,6 @@ def extract_tool_calls_streaming(
         delta_token_ids: Sequence[int],
         request: ChatCompletionRequest,
     ) -> Union[DeltaMessage, None]:
-
         # if the tool call token is not in the tokens generated so far, append
         # output to contents since it's not a tool
         if self.tool_calls_start_token not in current_text:
@@ -138,8 +140,10 @@ def extract_tool_calls_streaming(
 
         # handle if we detected the start of tool calls token which means
         # the start of tool calling
-        if (self.tool_calls_start_token_id in delta_token_ids
-                and len(delta_token_ids) == 1):
+        if (
+            self.tool_calls_start_token_id in delta_token_ids
+            and len(delta_token_ids) == 1
+        ):
             # if it's the only token, return None, so we don't send a chat
             # completion and don't send a control token
             return None
@@ -148,28 +152,28 @@ def extract_tool_calls_streaming(
         # sent yet, don't allow sending
         # an incomplete string since OpenAI only ever (as far as I have
         # seen) allows sending the entire tool/ function name at once.
-        flags = Allow.ALL if self.current_tool_name_sent \
-            else Allow.ALL & ~Allow.STR
+        flags = Allow.ALL if self.current_tool_name_sent else Allow.ALL & ~Allow.STR
         try:
-
             # Extract the tool calls between the special tool call tokens
-            parsable_arr = current_text.split(
-                self.tool_calls_start_token)[-1].split(
-                    self.tool_calls_end_token)[0]
+            parsable_arr = current_text.split(self.tool_calls_start_token)[-1].split(
+                self.tool_calls_end_token
+            )[0]
 
             # tool calls are generated in an array, so do partial JSON
             # parsing on the entire array
             try:
                 tool_call_arr: list[dict] = partial_json_parser.loads(
-                    parsable_arr, flags)
+                    parsable_arr, flags
+                )
             except partial_json_parser.core.exceptions.MalformedJSON:
-                logger.debug('not enough tokens to parse into JSON yet')
+                logger.debug("not enough tokens to parse into JSON yet")
                 return None
 
             # select as the current tool call the one we're on the state at
 
-            current_tool_call: dict = tool_call_arr[self.current_tool_id] \
-                if len(tool_call_arr) > 0 else {}
+            current_tool_call: dict = (
+                tool_call_arr[self.current_tool_id] if len(tool_call_arr) > 0 else {}
+            )
 
             # case -- if no tokens have been streamed for the tool, e.g.
             #   only the array brackets, stream nothing
@@ -178,9 +182,9 @@ def extract_tool_calls_streaming(
 
             # case: we are starting a new tool in the array
             #   -> array has > 0 length AND length has moved past cursor
-            elif (len(tool_call_arr) > 0
-                  and len(tool_call_arr) > self.current_tool_id + 1):
-
+            elif (
+                len(tool_call_arr) > 0 and len(tool_call_arr) > self.current_tool_id + 1
+            ):
                 # if we're moving on to a new call, first make sure we
                 # haven't missed anything in the previous one that was
                 # auto-generated due to JSON completions, but wasn't
@@ -190,16 +194,19 @@ def extract_tool_calls_streaming(
 
                     if diff:
                         diff = json.dumps(diff, ensure_ascii=False).replace(
-                            self.streamed_args_for_tool[self.current_tool_id],
-                            "")
-                        delta = DeltaMessage(tool_calls=[
-                            DeltaToolCall(index=self.current_tool_id,
-                                          function=DeltaFunctionCall(
-                                              arguments=diff).model_dump(
-                                                  exclude_none=True))
-                        ])
-                        self.streamed_args_for_tool[
-                            self.current_tool_id] += diff
+                            self.streamed_args_for_tool[self.current_tool_id], ""
+                        )
+                        delta = DeltaMessage(
+                            tool_calls=[
+                                DeltaToolCall(
+                                    index=self.current_tool_id,
+                                    function=DeltaFunctionCall(
+                                        arguments=diff
+                                    ).model_dump(exclude_none=True),
+                                )
+                            ]
+                        )
+                        self.streamed_args_for_tool[self.current_tool_id] += diff
                     else:
                         delta = None
                 else:
@@ -218,15 +225,18 @@ def extract_tool_calls_streaming(
             if not self.current_tool_name_sent:
                 function_name = current_tool_call.get("name")
                 if function_name:
-
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.current_tool_id,
-                                      type="function",
-                                      id=make_tool_call_id(),
-                                      function=DeltaFunctionCall(
-                                          name=function_name).model_dump(
-                                              exclude_none=True))
-                    ])
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                type="function",
+                                id=make_tool_call_id(),
+                                function=DeltaFunctionCall(
+                                    name=function_name
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
                     self.current_tool_name_sent = True
                 else:
                     delta = None
@@ -234,60 +244,66 @@ def extract_tool_calls_streaming(
             # now we know we're on the same tool call and we're streaming
             # arguments
             else:
-
-                prev_arguments = self.prev_tool_call_arr[
-                    self.current_tool_id].get("arguments")
+                prev_arguments = self.prev_tool_call_arr[self.current_tool_id].get(
+                    "arguments"
+                )
                 cur_arguments = current_tool_call.get("arguments")
 
-                new_text = delta_text.replace("\'", "\"")
+                new_text = delta_text.replace("'", '"')
 
                 if not cur_arguments and not prev_arguments:
-
                     delta = None
                 elif not cur_arguments and prev_arguments:
                     logger.error(
-                        "INVARIANT - impossible to have arguments reset "
-                        "mid-arguments")
+                        "INVARIANT - impossible to have arguments reset mid-arguments"
+                    )
                     delta = None
                 elif cur_arguments and not prev_arguments:
-                    cur_arguments_json = json.dumps(cur_arguments,
-                                                    ensure_ascii=False)
-                    logger.debug("finding %s in %s", new_text,
-                                 cur_arguments_json)
-
-                    arguments_delta = cur_arguments_json[:cur_arguments_json.
-                                                         index(new_text) +
-                                                         len(new_text)]
-                    logger.debug("First tokens in arguments received: %s",
-                                 arguments_delta)
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.current_tool_id,
-                                      function=DeltaFunctionCall(
-                                          arguments=arguments_delta).
-                                      model_dump(exclude_none=True))
-                    ])
-                    self.streamed_args_for_tool[
-                        self.current_tool_id] += arguments_delta
+                    cur_arguments_json = json.dumps(cur_arguments, ensure_ascii=False)
+                    logger.debug("finding %s in %s", new_text, cur_arguments_json)
+
+                    arguments_delta = cur_arguments_json[
+                        : cur_arguments_json.index(new_text) + len(new_text)
+                    ]
+                    logger.debug(
+                        "First tokens in arguments received: %s", arguments_delta
+                    )
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                function=DeltaFunctionCall(
+                                    arguments=arguments_delta
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
+                    self.streamed_args_for_tool[self.current_tool_id] += arguments_delta
 
                 elif cur_arguments and prev_arguments:
-                    cur_args_json = json.dumps(cur_arguments,
-                                               ensure_ascii=False)
-                    prev_args_json = json.dumps(prev_arguments,
-                                                ensure_ascii=False)
-                    logger.debug("Searching for diff between \n%s\n%s",
-                                 cur_args_json, prev_args_json)
+                    cur_args_json = json.dumps(cur_arguments, ensure_ascii=False)
+                    prev_args_json = json.dumps(prev_arguments, ensure_ascii=False)
+                    logger.debug(
+                        "Searching for diff between \n%s\n%s",
+                        cur_args_json,
+                        prev_args_json,
+                    )
 
                     argument_diff = extract_intermediate_diff(
-                        cur_args_json, prev_args_json)
+                        cur_args_json, prev_args_json
+                    )
                     logger.debug("got arguments diff: %s", argument_diff)
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.current_tool_id,
-                                      function=DeltaFunctionCall(
-                                          arguments=argument_diff).model_dump(
-                                              exclude_none=True))
-                    ])
-                    self.streamed_args_for_tool[
-                        self.current_tool_id] += argument_diff
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                function=DeltaFunctionCall(
+                                    arguments=argument_diff
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
+                    self.streamed_args_for_tool[self.current_tool_id] += argument_diff
                 else:
                     # try parsing it with regular JSON - if it works we're
                     # at the end, and we need to send the difference between
@@ -303,6 +319,6 @@ def extract_tool_calls_streaming(
         except Exception:
             logger.exception("Error trying to handle streaming tool call.")
             logger.debug(
-                "Skipping chunk as a result of tool streaming extraction "
-                "error")
+                "Skipping chunk as a result of tool streaming extraction error"
+            )
             return None
diff --git a/vllm/entrypoints/openai/tool_parsers/kimi_k2_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/kimi_k2_tool_parser.py
index 834b33052b45..a2eff21a4466 100644
--- a/vllm/entrypoints/openai/tool_parsers/kimi_k2_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/kimi_k2_tool_parser.py
@@ -7,13 +7,19 @@
 
 import regex as re
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
+    ToolParser,
+    ToolParserManager,
+)
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
@@ -22,14 +28,14 @@
 
 @ToolParserManager.register_module(["kimi_k2"])
 class KimiK2ToolParser(ToolParser):
-
     def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
         self.current_tool_name_sent: bool = False
         self.prev_tool_call_arr: list[dict] = []
         self.current_tool_id: int = -1
-        self.streamed_args_for_tool: list[str] = (
-            [])  # map what has been streamed for each tool so far to a list
+        self.streamed_args_for_tool: list[
+            str
+        ] = []  # map what has been streamed for each tool so far to a list
 
         self.tool_calls_start_token: str = "<|tool_calls_section_begin|>"
         self.tool_calls_end_token: str = "<|tool_calls_section_end|>"
@@ -45,39 +51,38 @@ def __init__(self, tokenizer: AnyTokenizer):
             r"(?P<tool_call_id>.+:\d+)\s*<\|tool_call_argument_begin\|>\s*(?P<function_arguments>.*)"
         )
 
-        self.stream_tool_call_name_regex = re.compile(
-            r"(?P<tool_call_id>.+:\d+)\s*")
+        self.stream_tool_call_name_regex = re.compile(r"(?P<tool_call_id>.+:\d+)\s*")
 
         if not self.model_tokenizer:
             raise ValueError(
                 "The model tokenizer must be passed to the ToolParser "
-                "constructor during construction.")
-        self.tool_calls_start_token_id = self.vocab.get(
-            self.tool_calls_start_token)
-        self.tool_calls_end_token_id = self.vocab.get(
-            self.tool_calls_end_token)
-
-        self.tool_call_start_token_id = self.vocab.get(
-            self.tool_call_start_token)
+                "constructor during construction."
+            )
+        self.tool_calls_start_token_id = self.vocab.get(self.tool_calls_start_token)
+        self.tool_calls_end_token_id = self.vocab.get(self.tool_calls_end_token)
+
+        self.tool_call_start_token_id = self.vocab.get(self.tool_call_start_token)
         self.tool_call_end_token_id = self.vocab.get(self.tool_call_end_token)
 
-        if (self.tool_calls_start_token_id is None
-                or self.tool_calls_end_token_id is None):
+        if (
+            self.tool_calls_start_token_id is None
+            or self.tool_calls_end_token_id is None
+        ):
             raise RuntimeError(
                 "Kimi-K2 Tool parser could not locate tool call start/end "
-                "tokens in the tokenizer!")
+                "tokens in the tokenizer!"
+            )
 
     def extract_tool_calls(
         self,
         model_output: str,
         request: ChatCompletionRequest,
     ) -> ExtractedToolCallInformation:
-
         # sanity check; avoid unnecessary processing
         if self.tool_calls_start_token not in model_output:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         else:
             try:
@@ -85,8 +90,7 @@ def extract_tool_calls(
                 # tag and end-of-string so the result of
                 # findall is an array of tuples where one is a function call and
                 # the other is None
-                function_call_tuples = self.tool_call_regex.findall(
-                    model_output)
+                function_call_tuples = self.tool_call_regex.findall(model_output)
 
                 logger.debug("function_call_tuples: %s", function_call_tuples)
 
@@ -94,17 +98,18 @@ def extract_tool_calls(
                 for match in function_call_tuples:
                     function_id, function_args = match
                     # function_id: functions.get_weather:0
-                    function_name = function_id.split('.')[1].split(':')[0]
+                    function_name = function_id.split(".")[1].split(":")[0]
                     tool_calls.append(
                         ToolCall(
                             id=function_id,
-                            type='function',
-                            function=FunctionCall(name=function_name,
-                                                  arguments=function_args),
-                        ))
+                            type="function",
+                            function=FunctionCall(
+                                name=function_name, arguments=function_args
+                            ),
+                        )
+                    )
 
-                content = model_output[:model_output.
-                                       find(self.tool_calls_start_token)]
+                content = model_output[: model_output.find(self.tool_calls_start_token)]
                 return ExtractedToolCallInformation(
                     tools_called=True,
                     tool_calls=tool_calls,
@@ -112,11 +117,10 @@ def extract_tool_calls(
                 )
 
             except Exception:
-                logger.exception(
-                    "Error in extracting tool call from response.")
-                return ExtractedToolCallInformation(tools_called=False,
-                                                    tool_calls=[],
-                                                    content=model_output)
+                logger.exception("Error in extracting tool call from response.")
+                return ExtractedToolCallInformation(
+                    tools_called=False, tool_calls=[], content=model_output
+                )
 
     def extract_tool_calls_streaming(
         self,
@@ -128,55 +132,58 @@ def extract_tool_calls_streaming(
         delta_token_ids: Sequence[int],
         request: ChatCompletionRequest,
     ) -> Union[DeltaMessage, None]:
-
         logger.debug("delta_text: %s", delta_text)
         logger.debug("delta_token_ids: %s", delta_token_ids)
         # check to see if we should be streaming a tool call - is there a
         if self.tool_calls_start_token_id not in current_token_ids:
             logger.debug("No tool call tokens found!")
             return DeltaMessage(content=delta_text)
-        delta_text = delta_text.replace(self.tool_calls_start_token,
-                                        "").replace(self.tool_calls_end_token,
-                                                    "")
+        delta_text = delta_text.replace(self.tool_calls_start_token, "").replace(
+            self.tool_calls_end_token, ""
+        )
         try:
-
             # figure out where we are in the parsing by counting tool call
             # start & end tags
             prev_tool_start_count = previous_token_ids.count(
-                self.tool_call_start_token_id)
-            prev_tool_end_count = previous_token_ids.count(
-                self.tool_call_end_token_id)
+                self.tool_call_start_token_id
+            )
+            prev_tool_end_count = previous_token_ids.count(self.tool_call_end_token_id)
             cur_tool_start_count = current_token_ids.count(
-                self.tool_call_start_token_id)
-            cur_tool_end_count = current_token_ids.count(
-                self.tool_call_end_token_id)
+                self.tool_call_start_token_id
+            )
+            cur_tool_end_count = current_token_ids.count(self.tool_call_end_token_id)
             tool_call_portion = None
             text_portion = None
 
             # case: if we're generating text, OR rounding out a tool call
-            if (cur_tool_start_count == cur_tool_end_count
-                    and prev_tool_end_count == cur_tool_end_count
-                    and self.tool_call_end_token not in delta_text):
+            if (
+                cur_tool_start_count == cur_tool_end_count
+                and prev_tool_end_count == cur_tool_end_count
+                and self.tool_call_end_token not in delta_text
+            ):
                 logger.debug("Generating text content! skipping tool parsing.")
                 return DeltaMessage(content=delta_text)
 
             if self.tool_call_end_token in delta_text:
                 logger.debug("tool_call_end_token in delta_text")
                 full_text = current_text + delta_text
-                tool_call_portion = full_text.split(
-                    self.tool_call_start_token)[-1].split(
-                        self.tool_call_end_token)[0].rstrip()
-                delta_text = delta_text.split(
-                    self.tool_call_end_token)[0].rstrip()
-                text_portion = delta_text.split(
-                    self.tool_call_end_token)[-1].lstrip()
+                tool_call_portion = (
+                    full_text.split(self.tool_call_start_token)[-1]
+                    .split(self.tool_call_end_token)[0]
+                    .rstrip()
+                )
+                delta_text = delta_text.split(self.tool_call_end_token)[0].rstrip()
+                text_portion = delta_text.split(self.tool_call_end_token)[-1].lstrip()
 
             # case -- we're starting a new tool call
-            if (cur_tool_start_count > cur_tool_end_count
-                    and cur_tool_start_count > prev_tool_start_count):
+            if (
+                cur_tool_start_count > cur_tool_end_count
+                and cur_tool_start_count > prev_tool_start_count
+            ):
                 if len(delta_token_ids) > 1:
-                    tool_call_portion = current_text.split(
-                        self.tool_call_start_token)[-1]
+                    tool_call_portion = current_text.split(self.tool_call_start_token)[
+                        -1
+                    ]
                 else:
                     tool_call_portion = None
                     delta = None
@@ -190,27 +197,29 @@ def extract_tool_calls_streaming(
                 logger.debug("Starting on a new tool %s", self.current_tool_id)
 
             # case -- we're updating an existing tool call
-            elif (cur_tool_start_count > cur_tool_end_count
-                  and cur_tool_start_count == prev_tool_start_count):
-
+            elif (
+                cur_tool_start_count > cur_tool_end_count
+                and cur_tool_start_count == prev_tool_start_count
+            ):
                 # get the portion of the text that's the tool call
-                tool_call_portion = current_text.split(
-                    self.tool_call_start_token)[-1]
+                tool_call_portion = current_text.split(self.tool_call_start_token)[-1]
                 text_portion = None
 
             # case -- the current tool call is being closed.
-            elif (cur_tool_start_count == cur_tool_end_count
-                  and cur_tool_end_count >= prev_tool_end_count):
-                if self.prev_tool_call_arr is None or len(
-                        self.prev_tool_call_arr) == 0:
-                    logger.debug(
-                        "attempting to close tool call, but no tool call")
+            elif (
+                cur_tool_start_count == cur_tool_end_count
+                and cur_tool_end_count >= prev_tool_end_count
+            ):
+                if self.prev_tool_call_arr is None or len(self.prev_tool_call_arr) == 0:
+                    logger.debug("attempting to close tool call, but no tool call")
                     return None
-                diff = self.prev_tool_call_arr[self.current_tool_id].get(
-                    "arguments")
+                diff = self.prev_tool_call_arr[self.current_tool_id].get("arguments")
                 if diff:
-                    diff = (diff.encode("utf-8").decode("unicode_escape")
-                            if diff is str else diff)
+                    diff = (
+                        diff.encode("utf-8").decode("unicode_escape")
+                        if diff is str
+                        else diff
+                    )
                     if '"}' not in delta_text:
                         return None
                     end_loc = delta_text.rindex('"}')
@@ -221,13 +230,16 @@ def extract_tool_calls_streaming(
                         diff,
                     )
                     self.streamed_args_for_tool[self.current_tool_id] += diff
-                    return DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=self.current_tool_id,
-                            function=DeltaFunctionCall(
-                                arguments=diff).model_dump(exclude_none=True),
-                        )
-                    ])
+                    return DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                function=DeltaFunctionCall(arguments=diff).model_dump(
+                                    exclude_none=True
+                                ),
+                            )
+                        ]
+                    )
 
             # case -- otherwise we're just generating text
             else:
@@ -238,23 +250,23 @@ def extract_tool_calls_streaming(
 
             current_tool_call = dict()
             if tool_call_portion:
-                current_tool_call_matches = (
-                    self.stream_tool_call_portion_regex.match(
-                        tool_call_portion))
+                current_tool_call_matches = self.stream_tool_call_portion_regex.match(
+                    tool_call_portion
+                )
                 if current_tool_call_matches:
-                    tool_id, tool_args = (current_tool_call_matches.groups())
-                    tool_name = tool_id.split('.')[1].split(':')[0]
-                    current_tool_call['id'] = tool_id
+                    tool_id, tool_args = current_tool_call_matches.groups()
+                    tool_name = tool_id.split(".")[1].split(":")[0]
+                    current_tool_call["id"] = tool_id
                     current_tool_call["name"] = tool_name
                     current_tool_call["arguments"] = tool_args
                 else:
                     current_tool_call_name_matches = (
-                        self.stream_tool_call_name_regex.match(
-                            tool_call_portion))
+                        self.stream_tool_call_name_regex.match(tool_call_portion)
+                    )
                     if current_tool_call_name_matches:
-                        tool_id_str, = current_tool_call_name_matches.groups()
-                        tool_name = tool_id_str.split('.')[1].split(':')[0]
-                        current_tool_call['id'] = tool_id_str
+                        (tool_id_str,) = current_tool_call_name_matches.groups()
+                        tool_name = tool_id_str.split(".")[1].split(":")[0]
+                        current_tool_call["id"] = tool_id_str
                         current_tool_call["name"] = tool_name
                         current_tool_call["arguments"] = ""
                     else:
@@ -270,16 +282,18 @@ def extract_tool_calls_streaming(
                 tool_id = current_tool_call.get("id")
                 if function_name:
                     self.current_tool_name_sent = True
-                    return DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=self.current_tool_id,
-                            type="function",
-                            id=tool_id,
-                            function=DeltaFunctionCall(
-                                name=function_name).model_dump(
-                                    exclude_none=True),
-                        )
-                    ])
+                    return DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                type="function",
+                                id=tool_id,
+                                function=DeltaFunctionCall(
+                                    name=function_name
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
                 else:
                     return None
 
@@ -289,15 +303,19 @@ def extract_tool_calls_streaming(
             if tool_call_portion is None:
                 # if there's text but not tool calls, send that -
                 # otherwise None to skip chunk
-                delta = (DeltaMessage(
-                    content=delta_text) if text_portion is not None else None)
+                delta = (
+                    DeltaMessage(content=delta_text)
+                    if text_portion is not None
+                    else None
+                )
                 return delta
 
             # now, the nitty-gritty of tool calls
             # now we have the portion to parse as tool call.
 
-            logger.debug("Trying to parse current tool call with ID %s",
-                         self.current_tool_id)
+            logger.debug(
+                "Trying to parse current tool call with ID %s", self.current_tool_id
+            )
 
             # if we're starting a new tool call, push an empty object in as
             #   a placeholder for the arguments
@@ -307,7 +325,8 @@ def extract_tool_calls_streaming(
             # main logic for tool parsing here - compare prev. partially-parsed
             #   JSON to the current partially-parsed JSON
             prev_arguments = self.prev_tool_call_arr[self.current_tool_id].get(
-                "arguments")
+                "arguments"
+            )
             cur_arguments = current_tool_call.get("arguments")
 
             logger.debug("diffing old arguments: %s", prev_arguments)
@@ -321,52 +340,56 @@ def extract_tool_calls_streaming(
             # case -- prev arguments are defined, but non are now.
             #   probably impossible, but not a fatal error - just keep going
             elif not cur_arguments and prev_arguments:
-                logger.error("should be impossible to have arguments reset "
-                             "mid-call. skipping streaming anything.")
+                logger.error(
+                    "should be impossible to have arguments reset "
+                    "mid-call. skipping streaming anything."
+                )
                 delta = None
 
             # case -- we now have the first info about arguments available from
             #   autocompleting the JSON
             elif cur_arguments and not prev_arguments:
-
-                delta = DeltaMessage(tool_calls=[
-                    DeltaToolCall(
-                        index=self.current_tool_id,
-                        function=DeltaFunctionCall(
-                            arguments=cur_arguments).model_dump(
-                                exclude_none=True),
-                    )
-                ])
-                self.streamed_args_for_tool[
-                    self.current_tool_id] = cur_arguments
+                delta = DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=self.current_tool_id,
+                            function=DeltaFunctionCall(
+                                arguments=cur_arguments
+                            ).model_dump(exclude_none=True),
+                        )
+                    ]
+                )
+                self.streamed_args_for_tool[self.current_tool_id] = cur_arguments
 
             # last case -- we have an update to existing arguments.
             elif cur_arguments and prev_arguments:
-                if (isinstance(delta_text, str)
-                        and cur_arguments != prev_arguments
-                        and len(cur_arguments) > len(prev_arguments)
-                        and cur_arguments.startswith(prev_arguments)):
-                    delta_arguments = cur_arguments[len(prev_arguments):]
+                if (
+                    isinstance(delta_text, str)
+                    and cur_arguments != prev_arguments
+                    and len(cur_arguments) > len(prev_arguments)
+                    and cur_arguments.startswith(prev_arguments)
+                ):
+                    delta_arguments = cur_arguments[len(prev_arguments) :]
                     logger.debug("got diff %s", delta_text)
 
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=self.current_tool_id,
-                            function=DeltaFunctionCall(
-                                arguments=delta_arguments).model_dump(
-                                    exclude_none=True),
-                        )
-                    ])
-                    self.streamed_args_for_tool[
-                        self.current_tool_id] = cur_arguments
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                function=DeltaFunctionCall(
+                                    arguments=delta_arguments
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
+                    self.streamed_args_for_tool[self.current_tool_id] = cur_arguments
                 else:
                     delta = None
 
             # handle saving the state for the current tool into
             # the "prev" list for use in diffing for the next iteration
             if self.current_tool_id == len(self.prev_tool_call_arr) - 1:
-                self.prev_tool_call_arr[
-                    self.current_tool_id] = current_tool_call
+                self.prev_tool_call_arr[self.current_tool_id] = current_tool_call
             else:
                 self.prev_tool_call_arr.append(current_tool_call)
 
diff --git a/vllm/entrypoints/openai/tool_parsers/llama4_pythonic_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/llama4_pythonic_tool_parser.py
index 9a9a19ce2188..162675efbc9a 100644
--- a/vllm/entrypoints/openai/tool_parsers/llama4_pythonic_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/llama4_pythonic_tool_parser.py
@@ -9,13 +9,19 @@
 from transformers import PreTrainedTokenizerBase
 
 import vllm.envs as envs
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
+    ToolParser,
+    ToolParserManager,
+)
 from vllm.logger import init_logger
 
 logger = init_logger(__name__)
@@ -31,6 +37,7 @@ class Llama4PythonicToolParser(ToolParser):
     Toolcall parser for Llama4 that produce tool calls in a pythonic style
     Use --enable-auto-tool-choice --tool-call-parser llama4_pythonic
     """
+
     # TODO(mdepinet): Possible future improvements:
     #   1. Support text + tools separated by either <|python_tag|> or \n\n
     #   2. Support tools outside of a list (or separated by a semicolon).
@@ -40,7 +47,8 @@ class Llama4PythonicToolParser(ToolParser):
 
     TOOL_CALL_REGEX = re.compile(
         r"\[([a-zA-Z]+\w*\(([a-zA-Z]+\w*=.*,\s*)*([a-zA-Z]+\w*=.*\s)?\),\s*)*([a-zA-Z]+\w*\(([a-zA-Z]+\w*=.*,\s*)*([a-zA-Z]+\w*=.*\s*)?\)\s*)+\]",
-        re.DOTALL)
+        re.DOTALL,
+    )
 
     def __init__(self, tokenizer: PreTrainedTokenizerBase):
         super().__init__(tokenizer)
@@ -55,8 +63,8 @@ def current_tool_index(self, value: int) -> None:
         self.current_tool_id = value
 
     def extract_tool_calls(
-            self, model_output: str,
-            request: ChatCompletionRequest) -> ExtractedToolCallInformation:
+        self, model_output: str, request: ChatCompletionRequest
+    ) -> ExtractedToolCallInformation:
         """
         Extract the tool calls from a complete model response.
         """
@@ -64,46 +72,52 @@ def extract_tool_calls(
         # remove <|python_start|> and <|python_end|>
         # as Llama 4 model sometime will output those tokens
         if model_output.startswith("<|python_start|>"):
-            model_output = model_output[len("<|python_start|>"):]
+            model_output = model_output[len("<|python_start|>") :]
             model_output = model_output.replace("<|python_end|>", "")
 
         is_tool_call_pattern = False
         try:
-            is_tool_call_pattern = self.TOOL_CALL_REGEX.match(
-                model_output,
-                timeout=envs.VLLM_TOOL_PARSE_REGEX_TIMEOUT_SECONDS) is not None
+            is_tool_call_pattern = (
+                self.TOOL_CALL_REGEX.match(
+                    model_output, timeout=envs.VLLM_TOOL_PARSE_REGEX_TIMEOUT_SECONDS
+                )
+                is not None
+            )
         except TimeoutError:
-            logger.warning(
-                "Regex timeout occurred when matching tool call pattern.")
-            logger.debug("Regex timeout occurred when matching user input: %s",
-                         model_output)
+            logger.warning("Regex timeout occurred when matching tool call pattern.")
+            logger.debug(
+                "Regex timeout occurred when matching user input: %s", model_output
+            )
 
         if not is_tool_call_pattern:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         try:
             module = ast.parse(model_output)
             parsed = getattr(module.body[0], "value", None)
             if isinstance(parsed, ast.List) and all(
-                    isinstance(e, ast.Call) for e in parsed.elts):
+                isinstance(e, ast.Call) for e in parsed.elts
+            ):
                 return ExtractedToolCallInformation(
                     tools_called=True,
                     tool_calls=[
                         _handle_single_tool(e)  # type: ignore
                         for e in parsed.elts
                     ],
-                    content=None)
+                    content=None,
+                )
             else:
                 raise _UnexpectedAstError(
-                    "Tool output must be a list of function calls")
+                    "Tool output must be a list of function calls"
+                )
         except Exception:
             logger.exception("Error in extracting tool call from response.")
             # Treat as regular text
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
     def extract_tool_calls_streaming(
         self,
@@ -115,18 +129,17 @@ def extract_tool_calls_streaming(
         delta_token_ids: Sequence[int],
         request: ChatCompletionRequest,
     ) -> Union[DeltaMessage, None]:
-
         if not current_text.startswith("[") and not current_text.startswith(
-                "<|python_start|>"):
+            "<|python_start|>"
+        ):
             return DeltaMessage(content=delta_text)
 
         try:
             # remove <|python_start|> and <|python_end|>
             if current_text.startswith("<|python_start|>"):
-                current_text = current_text[len("<|python_start|>"):]
+                current_text = current_text[len("<|python_start|>") :]
             if current_text.endswith("<|python_end|>"):
-                current_text = current_text[:current_text.
-                                            rfind("<|python_end|>")]
+                current_text = current_text[: current_text.rfind("<|python_end|>")]
             valid_and_added_text = _make_valid_python(current_text)
             if valid_and_added_text is None:
                 return None
@@ -135,9 +148,11 @@ def extract_tool_calls_streaming(
             module = ast.parse(valid_text)
             parsed = getattr(module.body[0], "value", None)
             if not isinstance(parsed, ast.List) or not all(
-                    isinstance(e, ast.Call) for e in parsed.elts):
+                isinstance(e, ast.Call) for e in parsed.elts
+            ):
                 raise _UnexpectedAstError(
-                    "Tool output must be a list of function calls")
+                    "Tool output must be a list of function calls"
+                )
             tool_calls = [
                 _handle_single_tool(e)  # type: ignore
                 for e in parsed.elts
@@ -152,34 +167,36 @@ def extract_tool_calls_streaming(
                 if len(self.streamed_args_for_tool) == index:
                     self.streamed_args_for_tool.append("")
 
-                new_call_complete = index < len(
-                    tool_calls) - 1 or ")]" not in added_text
+                new_call_complete = (
+                    index < len(tool_calls) - 1 or ")]" not in added_text
+                )
                 if new_call_complete:
                     self.current_tool_index += 1
 
-                withheld_suffix = (added_text[:-2]
-                                   if not new_call_complete else "")
+                withheld_suffix = added_text[:-2] if not new_call_complete else ""
                 if not new_call_complete and added_text[-2] == ")":
                     # Function call is incomplete. Withhold the closing bracket.
                     withheld_suffix = withheld_suffix + "}"
                 # Strings get single quotes in the model-produced string.
                 # JSON requires double quotes.
                 withheld_suffix = withheld_suffix.replace("'", '"')
-                delta = _compute_tool_delta(self.streamed_args_for_tool[index],
-                                            new_call, index, withheld_suffix)
+                delta = _compute_tool_delta(
+                    self.streamed_args_for_tool[index], new_call, index, withheld_suffix
+                )
 
                 if delta is not None:
                     tool_deltas.append(delta)
-                    if (delta.function is not None
-                            and delta.function.arguments is not None):
-                        self.streamed_args_for_tool[
-                            index] += delta.function.arguments
-
-        # HACK: serving_chat.py inspects the internal state of tool parsers
-        # when determining its final streaming delta, automatically
-        # adding autocompleted JSON.
-        # These two lines avoid that nonsense while ensuring finish_reason
-        # is set to tool_calls when at least one tool is called.
+                    if (
+                        delta.function is not None
+                        and delta.function.arguments is not None
+                    ):
+                        self.streamed_args_for_tool[index] += delta.function.arguments
+
+            # HACK: serving_chat.py inspects the internal state of tool parsers
+            # when determining its final streaming delta, automatically
+            # adding autocompleted JSON.
+            # These two lines avoid that nonsense while ensuring finish_reason
+            # is set to tool_calls when at least one tool is called.
             if tool_deltas and not self.prev_tool_call_arr:
                 self.prev_tool_call_arr = [{"arguments": {}}]
 
@@ -188,14 +205,14 @@ def extract_tool_calls_streaming(
             elif not added_text and self.current_tool_id > 0:
                 # Return an empty DeltaMessage once the tool calls are all done
                 # so that finish_reason gets set.
-                return DeltaMessage(content='')
+                return DeltaMessage(content="")
             else:
                 return None
         except Exception:
             logger.exception("Error trying to handle streaming tool call.")
             logger.debug(
-                "Skipping chunk as a result of tool streaming extraction "
-                "error")
+                "Skipping chunk as a result of tool streaming extraction error"
+            )
             return None
 
 
@@ -204,8 +221,7 @@ def _get_parameter_value(val: ast.expr) -> Any:
         return val.value
     elif isinstance(val, ast.Dict):
         if not all(isinstance(k, ast.Constant) for k in val.keys):
-            raise _UnexpectedAstError(
-                "Dict tool call arguments must have literal keys")
+            raise _UnexpectedAstError("Dict tool call arguments must have literal keys")
         return {
             k.value: _get_parameter_value(v)  # type: ignore
             for k, v in zip(val.keys, val.values)
@@ -223,9 +239,10 @@ def _handle_single_tool(call: ast.Call) -> ToolCall:
     arguments = {}
     for keyword in call.keywords:
         arguments[keyword.arg] = _get_parameter_value(keyword.value)
-    return ToolCall(type="function",
-                    function=FunctionCall(name=function_name,
-                                          arguments=json.dumps(arguments)))
+    return ToolCall(
+        type="function",
+        function=FunctionCall(name=function_name, arguments=json.dumps(arguments)),
+    )
 
 
 def _make_valid_python(text: str) -> Union[tuple[str, str], None]:
@@ -261,21 +278,25 @@ def _make_valid_python(text: str) -> Union[tuple[str, str], None]:
         # we can't fill in a valid value.
         return None
     if bracket_stack and bracket_stack[-1] == "{":
-        trailing_dict_text = text[:text.rfind("{")]
+        trailing_dict_text = text[: text.rfind("{")]
         num_keys = trailing_dict_text.count(":")
         num_values = trailing_dict_text.count(",")
         if num_keys <= num_values:
             return None  # Incomplete property name within parameter value
     if bracket_stack and bracket_stack[-1] == "(":
-        trailing_params_text = text[:text.rfind("(")]
+        trailing_params_text = text[: text.rfind("(")]
         num_full_param_names = trailing_params_text.count("=")
         num_full_param_values = trailing_params_text.count(",")
         if num_full_param_names <= num_full_param_values:
             return None  # Incomplete parameter name
     if text.endswith(","):
         text = text[:-1]
-    if bracket_stack and bracket_stack[-1] == "[" and not text.endswith(
-            "[") and not text.endswith(")"):
+    if (
+        bracket_stack
+        and bracket_stack[-1] == "["
+        and not text.endswith("[")
+        and not text.endswith(")")
+    ):
         return None  # Incomplete function name
 
     added_text = ""
@@ -294,23 +315,29 @@ def _make_valid_python(text: str) -> Union[tuple[str, str], None]:
     return text + added_text, added_text
 
 
-def _compute_tool_delta(previously_sent_args: str, new_call: ToolCall,
-                        index: int,
-                        withheld_suffix: str) -> Union[DeltaToolCall, None]:
+def _compute_tool_delta(
+    previously_sent_args: str, new_call: ToolCall, index: int, withheld_suffix: str
+) -> Union[DeltaToolCall, None]:
     new_call_args = new_call.function.arguments
     if withheld_suffix:
         assert new_call_args.endswith(withheld_suffix)
-        new_call_args = new_call_args[:-len(withheld_suffix)]
+        new_call_args = new_call_args[: -len(withheld_suffix)]
     if not previously_sent_args:
-        return DeltaToolCall(id=new_call.id,
-                             type="function",
-                             index=index,
-                             function=DeltaFunctionCall(
-                                 name=new_call.function.name,
-                                 arguments=new_call_args,
-                             ))
-
-    arg_diff = new_call_args[len(previously_sent_args):]
-    return DeltaToolCall(
-        id=None, index=index, function=DeltaFunctionCall(
-            arguments=arg_diff)) if arg_diff else None
+        return DeltaToolCall(
+            id=new_call.id,
+            type="function",
+            index=index,
+            function=DeltaFunctionCall(
+                name=new_call.function.name,
+                arguments=new_call_args,
+            ),
+        )
+
+    arg_diff = new_call_args[len(previously_sent_args) :]
+    return (
+        DeltaToolCall(
+            id=None, index=index, function=DeltaFunctionCall(arguments=arg_diff)
+        )
+        if arg_diff
+        else None
+    )
diff --git a/vllm/entrypoints/openai/tool_parsers/llama_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/llama_tool_parser.py
index 31b19c8db416..4d5ef5ed64aa 100644
--- a/vllm/entrypoints/openai/tool_parsers/llama_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/llama_tool_parser.py
@@ -11,16 +11,24 @@
 from transformers import PreTrainedTokenizerBase
 
 from vllm.entrypoints.chat_utils import make_tool_call_id
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
-from vllm.entrypoints.openai.tool_parsers.utils import (find_common_prefix,
-                                                        is_complete_json,
-                                                        partial_json_loads)
+    ToolParser,
+    ToolParserManager,
+)
+from vllm.entrypoints.openai.tool_parsers.utils import (
+    find_common_prefix,
+    is_complete_json,
+    partial_json_loads,
+)
 from vllm.logger import init_logger
 
 logger = init_logger(__name__)
@@ -33,7 +41,7 @@ class Llama3JsonToolParser(ToolParser):
     Tool call parser for Llama 3.x and 4 models intended for use with the
     examples/tool_chat_template_llama.jinja template.
 
-    Used when --enable-auto-tool-choice --tool-call-parser llama3_json or 
+    Used when --enable-auto-tool-choice --tool-call-parser llama3_json or
     llama4_json are set.
     """
 
@@ -45,42 +53,45 @@ def __init__(self, tokenizer: PreTrainedTokenizerBase):
         self.prev_tool_call_arr: list[dict] = []
         self.current_tool_id: int = -1
         self.current_tool_name_sent: bool = False
-        self.streamed_args_for_tool: list[str] = [
-        ]  # map what has been streamed for each tool so far to a list
+        self.streamed_args_for_tool: list[
+            str
+        ] = []  # map what has been streamed for each tool so far to a list
         self.bot_token = "<|python_tag|>"
-        self.bot_token_id = tokenizer.encode(self.bot_token,
-                                             add_special_tokens=False)[0]
+        self.bot_token_id = tokenizer.encode(self.bot_token, add_special_tokens=False)[
+            0
+        ]
         # Updated regex to match multiple JSONs separated by semicolons
         # This pattern is more robust and can handle nested JSON objects
         self.tool_call_regex = re.compile(
-            r'{[^{}]*(?:{[^{}]*}[^{}]*)*}(?:\s*;\s*{[^{}]*(?:{[^{}]*}[^{}]*)*})*',
-            re.DOTALL)
+            r"{[^{}]*(?:{[^{}]*}[^{}]*)*}(?:\s*;\s*{[^{}]*(?:{[^{}]*}[^{}]*)*})*",
+            re.DOTALL,
+        )
 
     def extract_tool_calls(
-            self, model_output: str,
-            request: ChatCompletionRequest) -> ExtractedToolCallInformation:
+        self, model_output: str, request: ChatCompletionRequest
+    ) -> ExtractedToolCallInformation:
         """
         Extract the tool calls from a complete model response.
         Only extracts JSON content and ignores any surrounding plain text.
         Supports both single JSON and multiple JSONs separated by semicolons.
         """
         # Quick check before running regex
-        if not (self.bot_token in model_output or '{' in model_output):
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+        if not (self.bot_token in model_output or "{" in model_output):
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         # Find JSON object(s) in the text using regex
         match = self.tool_call_regex.search(model_output)
         if not match:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         try:
             json_str = match.group(0)
             # Split by semicolon and strip whitespace
-            json_objects = [obj.strip() for obj in json_str.split(';')]
+            json_objects = [obj.strip() for obj in json_str.split(";")]
 
             tool_calls: list[ToolCall] = []
             for json_obj in json_objects:
@@ -95,19 +106,24 @@ def extract_tool_calls(
                             # function call args are JSON but as a string
                             arguments=json.dumps(
                                 obj["arguments"]
-                                if "arguments" in obj else obj["parameters"],
-                                ensure_ascii=False))))
-
-            return ExtractedToolCallInformation(tools_called=True,
-                                                tool_calls=tool_calls,
-                                                content=None)
+                                if "arguments" in obj
+                                else obj["parameters"],
+                                ensure_ascii=False,
+                            ),
+                        ),
+                    )
+                )
+
+            return ExtractedToolCallInformation(
+                tools_called=True, tool_calls=tool_calls, content=None
+            )
 
         except Exception:
             logger.exception("Error in extracting tool call from response.")
             # return information to just treat the tool call as regular JSON
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
     def extract_tool_calls_streaming(
         self,
@@ -119,47 +135,49 @@ def extract_tool_calls_streaming(
         delta_token_ids: Sequence[int],
         request: ChatCompletionRequest,
     ) -> Union[DeltaMessage, None]:
-
-        if not (current_text.startswith(self.bot_token)
-                or current_text.startswith('{')):
+        if not (
+            current_text.startswith(self.bot_token) or current_text.startswith("{")
+        ):
             return DeltaMessage(content=delta_text)
 
         # bit mask flags for partial JSON parsing. If the name hasn't been
         # sent yet, don't allow sending
         # an incomplete string since OpenAI only ever (as far as I have
         # seen) allows sending the entire tool/ function name at once.
-        flags = Allow.ALL if self.current_tool_name_sent \
-            else Allow.ALL & ~Allow.STR
+        flags = Allow.ALL if self.current_tool_name_sent else Allow.ALL & ~Allow.STR
         try:
             tool_call_arr = []
             is_complete = []
             try:
                 # depending on the prompt format the Llama model may or may not
                 # prefix the output with the <|python_tag|> token
-                start_idx = len(self.bot_token) if current_text.startswith(
-                    self.bot_token) else 0
+                start_idx = (
+                    len(self.bot_token)
+                    if current_text.startswith(self.bot_token)
+                    else 0
+                )
                 while start_idx < len(current_text):
-                    (obj,
-                     end_idx) = partial_json_loads(current_text[start_idx:],
-                                                   flags)
+                    (obj, end_idx) = partial_json_loads(current_text[start_idx:], flags)
                     is_complete.append(
-                        is_complete_json(current_text[start_idx:start_idx +
-                                                      end_idx]))
-                    start_idx += end_idx + len('; ')
+                        is_complete_json(current_text[start_idx : start_idx + end_idx])
+                    )
+                    start_idx += end_idx + len("; ")
                     # depending on the prompt Llama can use
                     # either arguments or parameters
                     if "parameters" in obj:
-                        assert "arguments" not in obj, \
+                        assert "arguments" not in obj, (
                             "model generated both parameters and arguments"
+                        )
                         obj["arguments"] = obj["parameters"]
                     tool_call_arr.append(obj)
             except partial_json_parser.core.exceptions.MalformedJSON:
-                logger.debug('not enough tokens to parse into JSON yet')
+                logger.debug("not enough tokens to parse into JSON yet")
                 return None
 
             # select as the current tool call the one we're on the state at
-            current_tool_call: dict = tool_call_arr[self.current_tool_id] \
-                if len(tool_call_arr) > 0 else {}
+            current_tool_call: dict = (
+                tool_call_arr[self.current_tool_id] if len(tool_call_arr) > 0 else {}
+            )
 
             # case -- if no tokens have been streamed for the tool, e.g.
             #   only the array brackets, stream nothing
@@ -168,9 +186,9 @@ def extract_tool_calls_streaming(
 
             # case: we are starting a new tool in the array
             #   -> array has > 0 length AND length has moved past cursor
-            elif (len(tool_call_arr) > 0
-                  and len(tool_call_arr) > self.current_tool_id + 1):
-
+            elif (
+                len(tool_call_arr) > 0 and len(tool_call_arr) > self.current_tool_id + 1
+            ):
                 # if we're moving on to a new call, first make sure we
                 # haven't missed anything in the previous one that was
                 # auto-generated due to JSON completions, but wasn't
@@ -178,21 +196,24 @@ def extract_tool_calls_streaming(
                 if self.current_tool_id >= 0:
                     cur_arguments = current_tool_call.get("arguments")
                     if cur_arguments:
-                        cur_args_json = json.dumps(cur_arguments,
-                                                   ensure_ascii=False)
-                        sent = len(
-                            self.streamed_args_for_tool[self.current_tool_id])
+                        cur_args_json = json.dumps(cur_arguments, ensure_ascii=False)
+                        sent = len(self.streamed_args_for_tool[self.current_tool_id])
                         argument_diff = cur_args_json[sent:]
 
                         logger.debug("got arguments diff: %s", argument_diff)
-                        delta = DeltaMessage(tool_calls=[
-                            DeltaToolCall(index=self.current_tool_id,
-                                          function=DeltaFunctionCall(
-                                              arguments=argument_diff).
-                                          model_dump(exclude_none=True))
-                        ])
-                        self.streamed_args_for_tool[
-                            self.current_tool_id] += argument_diff
+                        delta = DeltaMessage(
+                            tool_calls=[
+                                DeltaToolCall(
+                                    index=self.current_tool_id,
+                                    function=DeltaFunctionCall(
+                                        arguments=argument_diff
+                                    ).model_dump(exclude_none=True),
+                                )
+                            ]
+                        )
+                        self.streamed_args_for_tool[self.current_tool_id] += (
+                            argument_diff
+                        )
                     else:
                         delta = None
                 else:
@@ -209,15 +230,18 @@ def extract_tool_calls_streaming(
             elif not self.current_tool_name_sent:
                 function_name = current_tool_call.get("name")
                 if function_name:
-
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.current_tool_id,
-                                      type="function",
-                                      id=make_tool_call_id(),
-                                      function=DeltaFunctionCall(
-                                          name=function_name).model_dump(
-                                              exclude_none=True))
-                    ])
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                type="function",
+                                id=make_tool_call_id(),
+                                function=DeltaFunctionCall(
+                                    name=function_name
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
                     self.current_tool_name_sent = True
                 else:
                     delta = None
@@ -229,34 +253,35 @@ def extract_tool_calls_streaming(
                 delta = None
 
                 if cur_arguments:
-                    sent = len(
-                        self.streamed_args_for_tool[self.current_tool_id])
-                    cur_args_json = json.dumps(cur_arguments,
-                                               ensure_ascii=False)
-                    prev_arguments = self.prev_tool_call_arr[
-                        self.current_tool_id].get("arguments")
+                    sent = len(self.streamed_args_for_tool[self.current_tool_id])
+                    cur_args_json = json.dumps(cur_arguments, ensure_ascii=False)
+                    prev_arguments = self.prev_tool_call_arr[self.current_tool_id].get(
+                        "arguments"
+                    )
 
                     argument_diff = None
                     if is_complete[self.current_tool_id]:
                         argument_diff = cur_args_json[sent:]
                     elif prev_arguments:
-                        prev_args_json = json.dumps(prev_arguments,
-                                                    ensure_ascii=False)
+                        prev_args_json = json.dumps(prev_arguments, ensure_ascii=False)
                         if cur_args_json != prev_args_json:
-
-                            prefix = find_common_prefix(
-                                prev_args_json, cur_args_json)
+                            prefix = find_common_prefix(prev_args_json, cur_args_json)
                             argument_diff = prefix[sent:]
 
                     if argument_diff is not None:
-                        delta = DeltaMessage(tool_calls=[
-                            DeltaToolCall(index=self.current_tool_id,
-                                          function=DeltaFunctionCall(
-                                              arguments=argument_diff).
-                                          model_dump(exclude_none=True))
-                        ])
-                        self.streamed_args_for_tool[
-                            self.current_tool_id] += argument_diff
+                        delta = DeltaMessage(
+                            tool_calls=[
+                                DeltaToolCall(
+                                    index=self.current_tool_id,
+                                    function=DeltaFunctionCall(
+                                        arguments=argument_diff
+                                    ).model_dump(exclude_none=True),
+                                )
+                            ]
+                        )
+                        self.streamed_args_for_tool[self.current_tool_id] += (
+                            argument_diff
+                        )
 
             self.prev_tool_call_arr = tool_call_arr
             return delta
@@ -264,6 +289,6 @@ def extract_tool_calls_streaming(
         except Exception:
             logger.exception("Error trying to handle streaming tool call.")
             logger.debug(
-                "Skipping chunk as a result of tool streaming extraction "
-                "error")
+                "Skipping chunk as a result of tool streaming extraction error"
+            )
             return None
diff --git a/vllm/entrypoints/openai/tool_parsers/longcat_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/longcat_tool_parser.py
index 87a3fdc44397..1dc1a0290c8d 100644
--- a/vllm/entrypoints/openai/tool_parsers/longcat_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/longcat_tool_parser.py
@@ -3,16 +3,13 @@
 
 import regex as re
 
-from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParserManager)
-from vllm.entrypoints.openai.tool_parsers.hermes_tool_parser import (
-    Hermes2ProToolParser)
+from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import ToolParserManager
+from vllm.entrypoints.openai.tool_parsers.hermes_tool_parser import Hermes2ProToolParser
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
 
 @ToolParserManager.register_module("longcat")
 class LongcatFlashToolParser(Hermes2ProToolParser):
-
     def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
 
@@ -21,12 +18,15 @@ def __init__(self, tokenizer: AnyTokenizer):
 
         self.tool_call_regex = re.compile(
             r"<longcat_tool_call>(.*?)</longcat_tool_call>|<longcat_tool_call>(.*)",
-            re.DOTALL)
+            re.DOTALL,
+        )
 
         self.tool_call_start_token_ids = self.model_tokenizer.encode(
-            self.tool_call_start_token, add_special_tokens=False)
+            self.tool_call_start_token, add_special_tokens=False
+        )
         self.tool_call_end_token_ids = self.model_tokenizer.encode(
-            self.tool_call_end_token, add_special_tokens=False)
+            self.tool_call_end_token, add_special_tokens=False
+        )
 
         self.tool_call_start_token_array = [
             self.model_tokenizer.decode([token_id])
diff --git a/vllm/entrypoints/openai/tool_parsers/minimax_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/minimax_tool_parser.py
index 0fd62f0b6a7f..0b83fd237a6a 100644
--- a/vllm/entrypoints/openai/tool_parsers/minimax_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/minimax_tool_parser.py
@@ -8,15 +8,20 @@
 import regex as re
 
 from vllm.entrypoints.chat_utils import make_tool_call_id
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
-from vllm.entrypoints.openai.tool_parsers.utils import (
-    extract_intermediate_diff)
+    ToolParser,
+    ToolParserManager,
+)
+from vllm.entrypoints.openai.tool_parsers.utils import extract_intermediate_diff
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
@@ -25,7 +30,6 @@
 
 @ToolParserManager.register_module("minimax")
 class MinimaxToolParser(ToolParser):
-
     def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
 
@@ -40,7 +44,8 @@ def __init__(self, tokenizer: AnyTokenizer):
         self.tool_call_start_token = "<tool_calls>"
         self.tool_call_end_token = "</tool_calls>"
         self.tool_call_regex = re.compile(
-            r"<tool_calls>(.*?)</tool_calls>|<tool_calls>(.*)", re.DOTALL)
+            r"<tool_calls>(.*?)</tool_calls>|<tool_calls>(.*)", re.DOTALL
+        )
         self.thinking_tag_pattern = r"<think>(.*?)</think>"
         self.tool_name_pattern = re.compile(r'"name":\s*"([^"]+)"')
         self.tool_args_pattern = re.compile(r'"arguments":\s*')
@@ -52,50 +57,51 @@ def __init__(self, tokenizer: AnyTokenizer):
         if not self.model_tokenizer:
             raise ValueError(
                 "The model tokenizer must be passed to the ToolParser "
-                "constructor during construction.")
+                "constructor during construction."
+            )
 
         # Get token IDs for tool call start/end tokens
-        self.tool_call_start_token_id = self.vocab.get(
-            self.tool_call_start_token)
+        self.tool_call_start_token_id = self.vocab.get(self.tool_call_start_token)
         self.tool_call_end_token_id = self.vocab.get(self.tool_call_end_token)
 
-        if (self.tool_call_start_token_id is None
-                or self.tool_call_end_token_id is None):
+        if self.tool_call_start_token_id is None or self.tool_call_end_token_id is None:
             logger.warning(
                 "Minimax Tool parser could not locate tool call start/end "
-                "tokens in the tokenizer. Falling back to string matching.")
+                "tokens in the tokenizer. Falling back to string matching."
+            )
 
     def preprocess_model_output(self, model_output: str) -> str:
         """
         Preprocess model output by removing tool calls from thinking tags.
-        
+
         Args:
             model_output: Raw model output string
-            
+
         Returns:
             Preprocessed model output with tool calls removed from thinking tags
         """
 
         def remove_tool_calls_from_think(match):
             think_content = match.group(1)
-            cleaned_content = re.sub(r"<tool_calls>.*?</tool_calls>",
-                                     "",
-                                     think_content,
-                                     flags=re.DOTALL)
+            cleaned_content = re.sub(
+                r"<tool_calls>.*?</tool_calls>", "", think_content, flags=re.DOTALL
+            )
             return f"<think>{cleaned_content}</think>"
 
-        return re.sub(self.thinking_tag_pattern,
-                      remove_tool_calls_from_think,
-                      model_output,
-                      flags=re.DOTALL)
+        return re.sub(
+            self.thinking_tag_pattern,
+            remove_tool_calls_from_think,
+            model_output,
+            flags=re.DOTALL,
+        )
 
     def _clean_duplicate_braces(self, args_text: str) -> str:
         """
         Clean duplicate closing braces from arguments text.
-        
+
         Args:
             args_text: Raw arguments text
-            
+
         Returns:
             Cleaned arguments text with proper JSON formatting
         """
@@ -109,7 +115,7 @@ def _clean_duplicate_braces(self, args_text: str) -> str:
         except json.JSONDecodeError:
             pass
 
-        while args_text.endswith('}}'):
+        while args_text.endswith("}}"):
             candidate = args_text[:-1]
             try:
                 json.loads(candidate)
@@ -122,10 +128,10 @@ def _clean_duplicate_braces(self, args_text: str) -> str:
     def _clean_delta_braces(self, delta_text: str) -> str:
         """
         Clean delta text by removing excessive closing braces.
-        
+
         Args:
             delta_text: Delta text to clean
-            
+
         Returns:
             Cleaned delta text
         """
@@ -134,10 +140,10 @@ def _clean_delta_braces(self, delta_text: str) -> str:
 
         delta_stripped = delta_text.strip()
 
-        if delta_stripped and all(c in '}\n\r\t ' for c in delta_stripped):
-            brace_count = delta_stripped.count('}')
+        if delta_stripped and all(c in "}\n\r\t " for c in delta_stripped):
+            brace_count = delta_stripped.count("}")
             if brace_count > 1:
-                return '}\n' if delta_text.endswith('\n') else '}'
+                return "}\n" if delta_text.endswith("\n") else "}"
 
         return delta_text
 
@@ -148,34 +154,32 @@ def extract_tool_calls(
     ) -> ExtractedToolCallInformation:
         """
         Extract tool calls from model output for non-streaming mode.
-        
+
         Args:
             model_output: Complete model output
             request: Chat completion request
-            
+
         Returns:
             ExtractedToolCallInformation containing tool calls and content
         """
         processed_output = self.preprocess_model_output(model_output)
 
         if self.tool_call_start_token not in processed_output:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         try:
-            function_call_tuples = self.tool_call_regex.findall(
-                processed_output)
+            function_call_tuples = self.tool_call_regex.findall(processed_output)
 
             raw_function_calls = []
             for match in function_call_tuples:
                 tool_call_content = match[0] if match[0] else match[1]
                 if tool_call_content.strip():
-                    lines = tool_call_content.strip().split('\n')
+                    lines = tool_call_content.strip().split("\n")
                     for line in lines:
                         line = line.strip()
-                        if line and line.startswith('{') and line.endswith(
-                                '}'):
+                        if line and line.startswith("{") and line.endswith("}"):
                             try:
                                 parsed_call = json.loads(line)
                                 raw_function_calls.append(parsed_call)
@@ -186,25 +190,29 @@ def extract_tool_calls(
             for function_call in raw_function_calls:
                 if "name" in function_call and "arguments" in function_call:
                     tool_calls.append(
-                        ToolCall(type="function",
-                                 function=FunctionCall(
-                                     name=function_call["name"],
-                                     arguments=json.dumps(
-                                         function_call["arguments"],
-                                         ensure_ascii=False))))
+                        ToolCall(
+                            type="function",
+                            function=FunctionCall(
+                                name=function_call["name"],
+                                arguments=json.dumps(
+                                    function_call["arguments"], ensure_ascii=False
+                                ),
+                            ),
+                        )
+                    )
 
             processed_pos = processed_output.find(self.tool_call_start_token)
             if processed_pos != -1:
                 processed_content = processed_output[:processed_pos].strip()
 
                 if processed_content:
-                    lines = processed_content.split('\n')
+                    lines = processed_content.split("\n")
                     for line in reversed(lines):
                         line = line.strip()
                         if line:
                             pos = model_output.find(line)
                             if pos != -1:
-                                content = model_output[:pos + len(line)]
+                                content = model_output[: pos + len(line)]
                                 break
                     else:
                         content = ""
@@ -216,68 +224,74 @@ def extract_tool_calls(
             return ExtractedToolCallInformation(
                 tools_called=len(tool_calls) > 0,
                 tool_calls=tool_calls,
-                content=content.strip() if content.strip() else None)
+                content=content.strip() if content.strip() else None,
+            )
 
         except Exception:
             logger.exception(
-                "An unexpected error occurred during tool call extraction.")
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+                "An unexpected error occurred during tool call extraction."
+            )
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
     def _update_thinking_state(self, text: str) -> None:
         """
         Update the thinking tag state based on text content.
-        
+
         Args:
             text: Text to analyze for thinking tags
         """
         open_count = text.count("<think>")
         close_count = text.count("</think>")
         self.in_thinking_tag = open_count > close_count or (
-            open_count == close_count and text.endswith("</think>"))
+            open_count == close_count and text.endswith("</think>")
+        )
 
     def _is_potential_tag_start(self, text: str) -> bool:
         """
         Check if text might be the start of a tool call tag.
-        
+
         Args:
             text: Text to check
-            
+
         Returns:
             True if text could be the start of a tool call tag
         """
         for tag in [self.tool_call_start_token, self.tool_call_end_token]:
             if any(
-                    tag.startswith(text[-i:])
-                    for i in range(1, min(len(text) + 1, len(tag)))):
+                tag.startswith(text[-i:])
+                for i in range(1, min(len(text) + 1, len(tag)))
+            ):
                 return True
         return False
 
     def _should_buffer_content(self, delta_text: str) -> bool:
         """
         Determine if content should be buffered for later processing.
-        
+
         Args:
             delta_text: Delta text to check
-            
+
         Returns:
             True if content should be buffered
         """
         if self.in_thinking_tag:
             return False
-        return bool(self.pending_buffer
-                    or self.tool_call_start_token in delta_text
-                    or self.tool_call_end_token in delta_text
-                    or delta_text.startswith('<'))
+        return bool(
+            self.pending_buffer
+            or self.tool_call_start_token in delta_text
+            or self.tool_call_end_token in delta_text
+            or delta_text.startswith("<")
+        )
 
     def _split_content_for_buffering(self, delta_text: str) -> tuple[str, str]:
         """
         Split delta text into safe content and potential tag content.
-        
+
         Args:
             delta_text: Delta text to split
-            
+
         Returns:
             Tuple of (safe_content, potential_tag_content)
         """
@@ -295,10 +309,10 @@ def _split_content_for_buffering(self, delta_text: str) -> tuple[str, str]:
     def _process_buffer(self, new_content: str) -> str:
         """
         Process buffered content and return output content.
-        
+
         Args:
             new_content: New content to add to buffer
-            
+
         Returns:
             Processed output content
         """
@@ -326,7 +340,7 @@ def _process_buffer(self, new_content: str) -> str:
                 break
 
             output_content += self.pending_buffer[:tag_pos]
-            self.pending_buffer = self.pending_buffer[tag_pos + tag_len:]
+            self.pending_buffer = self.pending_buffer[tag_pos + tag_len :]
 
         return output_content
 
@@ -340,13 +354,14 @@ def _reset_streaming_state(self) -> None:
 
     def _advance_to_next_tool(self) -> None:
         """Advance to the next tool in the streaming sequence."""
-        self.streaming_state["current_tool_index"] = int(
-            self.streaming_state["current_tool_index"]) + 1
+        self.streaming_state["current_tool_index"] = (
+            int(self.streaming_state["current_tool_index"]) + 1
+        )
 
     def _set_current_tool_index(self, index: int) -> None:
         """
         Set the current tool index.
-        
+
         Args:
             index: Tool index to set
         """
@@ -355,7 +370,7 @@ def _set_current_tool_index(self, index: int) -> None:
     def _get_current_tool_index(self) -> int:
         """
         Get the current tool index.
-        
+
         Returns:
             Current tool index
         """
@@ -364,10 +379,10 @@ def _get_current_tool_index(self) -> int:
     def _get_next_unsent_tool_index(self, tool_count: int) -> int:
         """
         Get the index of the next unsent tool.
-        
+
         Args:
             tool_count: Total number of tools
-            
+
         Returns:
             Index of next unsent tool, or -1 if all tools sent
         """
@@ -383,7 +398,7 @@ def _get_next_unsent_tool_index(self, tool_count: int) -> int:
     def _ensure_state_arrays(self, tool_count: int) -> None:
         """
         Ensure state arrays have sufficient capacity for tool_count tools.
-        
+
         Args:
             tool_count: Number of tools to prepare for
         """
@@ -391,11 +406,13 @@ def _ensure_state_arrays(self, tool_count: int) -> None:
         tool_ids = list(self.streaming_state["tool_ids"])
 
         while len(sent_tools) < tool_count:
-            sent_tools.append({
-                "sent_name": False,
-                "sent_arguments": "",
-                "id": make_tool_call_id(),
-            })
+            sent_tools.append(
+                {
+                    "sent_name": False,
+                    "sent_arguments": "",
+                    "id": make_tool_call_id(),
+                }
+            )
 
         while len(tool_ids) < tool_count:
             tool_ids.append(None)
@@ -406,10 +423,10 @@ def _ensure_state_arrays(self, tool_count: int) -> None:
     def _detect_tools_in_text(self, text: str) -> int:
         """
         Detect the number of tools in text by counting name patterns.
-        
+
         Args:
             text: Text to analyze
-            
+
         Returns:
             Number of tools detected
         """
@@ -419,26 +436,26 @@ def _detect_tools_in_text(self, text: str) -> int:
     def _find_tool_boundaries(self, text: str) -> list[tuple[int, int]]:
         """
         Find the boundaries of tool calls in text.
-        
+
         Args:
             text: Text to analyze
-            
+
         Returns:
             List of (start, end) positions for tool calls
         """
         boundaries = []
         i = 0
         while i < len(text):
-            if text[i] == '{':
+            if text[i] == "{":
                 start = i
                 depth = 0
                 has_name = False
                 has_arguments = False
 
                 while i < len(text):
-                    if text[i] == '{':
+                    if text[i] == "{":
                         depth += 1
-                    elif text[i] == '}':
+                    elif text[i] == "}":
                         depth -= 1
                         if depth == 0:
                             end = i + 1
@@ -447,10 +464,9 @@ def _find_tool_boundaries(self, text: str) -> list[tuple[int, int]]:
                                 boundaries.append((start, end))
                             break
 
-                    if not has_name and '"name"' in text[start:i + 1]:
+                    if not has_name and '"name"' in text[start : i + 1]:
                         has_name = True
-                    if not has_arguments and '"arguments"' in text[start:i +
-                                                                   1]:
+                    if not has_arguments and '"arguments"' in text[start : i + 1]:
                         has_arguments = True
 
                     i += 1
@@ -461,47 +477,46 @@ def _find_tool_boundaries(self, text: str) -> list[tuple[int, int]]:
                 i += 1
         return boundaries
 
-    def _extract_tool_args(self, tool_content: str,
-                           args_match: re.Match[str]) -> str:
+    def _extract_tool_args(self, tool_content: str, args_match: re.Match[str]) -> str:
         """
         Extract tool arguments from tool content.
-        
+
         Args:
             tool_content: Tool call content
             args_match: Regex match for arguments pattern
-            
+
         Returns:
             Extracted arguments as string
         """
         args_start_pos = args_match.end()
         remaining_content = tool_content[args_start_pos:]
 
-        if remaining_content.strip().startswith('{'):
+        if remaining_content.strip().startswith("{"):
             depth = 0
             for i, char in enumerate(remaining_content):
-                if char == '{':
+                if char == "{":
                     depth += 1
-                elif char == '}':
+                elif char == "}":
                     depth -= 1
                     if depth == 0:
-                        return remaining_content[:i + 1]
+                        return remaining_content[: i + 1]
         else:
-            args_end = remaining_content.find('}')
+            args_end = remaining_content.find("}")
             if args_end > 0:
                 return remaining_content[:args_end].strip()
 
-        return remaining_content.rstrip('}').strip()
+        return remaining_content.rstrip("}").strip()
 
     def _get_current_tool_content(
-            self, text: str,
-            tool_index: int) -> tuple[Optional[str], Optional[str]]:
+        self, text: str, tool_index: int
+    ) -> tuple[Optional[str], Optional[str]]:
         """
         Get the content of a specific tool by index.
-        
+
         Args:
             text: Text containing tool calls
             tool_index: Index of tool to extract
-            
+
         Returns:
             Tuple of (tool_name, tool_arguments) or (None, None) if not found
         """
@@ -522,22 +537,22 @@ def _get_current_tool_content(
                 args_text = self._extract_tool_args(tool_content, args_match)
                 return name, args_text
             except Exception:
-                remaining_content = tool_content[args_match.end():]
-                args_text = remaining_content.rstrip('}').strip()
+                remaining_content = tool_content[args_match.end() :]
+                args_text = remaining_content.rstrip("}").strip()
                 return name, args_text
 
         return name, None
 
     def _handle_tool_name_streaming(
-            self, tool_content: str,
-            tool_count: int) -> Union[DeltaMessage, None]:
+        self, tool_content: str, tool_count: int
+    ) -> Union[DeltaMessage, None]:
         """
         Handle streaming of tool names.
-        
+
         Args:
             tool_content: Content containing tool calls
             tool_count: Total number of tools
-            
+
         Returns:
             DeltaMessage with tool name or None if no tool to stream
         """
@@ -565,24 +580,29 @@ def _handle_tool_name_streaming(
         self.streaming_state["sent_tools"] = sent_tools
         self.streaming_state["tool_ids"] = tool_ids
 
-        return DeltaMessage(tool_calls=[
-            DeltaToolCall(index=next_idx,
-                          type="function",
-                          id=tool_id,
-                          function=DeltaFunctionCall(
-                              name=tool_name).model_dump(exclude_none=True))
-        ])
+        return DeltaMessage(
+            tool_calls=[
+                DeltaToolCall(
+                    index=next_idx,
+                    type="function",
+                    id=tool_id,
+                    function=DeltaFunctionCall(name=tool_name).model_dump(
+                        exclude_none=True
+                    ),
+                )
+            ]
+        )
 
     def _handle_tool_args_streaming(
-            self, tool_content: str,
-            tool_count: int) -> Union[DeltaMessage, None]:
+        self, tool_content: str, tool_count: int
+    ) -> Union[DeltaMessage, None]:
         """
         Handle streaming of tool arguments.
-        
+
         Args:
             tool_content: Content containing tool calls
             tool_count: Total number of tools
-            
+
         Returns:
             DeltaMessage with tool arguments or None if no arguments to stream
         """
@@ -591,8 +611,7 @@ def _handle_tool_args_streaming(
         if current_idx < 0 or current_idx >= tool_count:
             return None
 
-        tool_name, tool_args = self._get_current_tool_content(
-            tool_content, current_idx)
+        tool_name, tool_args = self._get_current_tool_content(tool_content, current_idx)
         if not tool_name or tool_args is None:
             return None
 
@@ -612,29 +631,37 @@ def _handle_tool_args_streaming(
                     sent_tools[current_idx]["sent_arguments"] = clean_args
                     self.streaming_state["sent_tools"] = sent_tools
 
-                    if clean_args.endswith('}'):
+                    if clean_args.endswith("}"):
                         self._advance_to_next_tool()
 
-                    return DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=current_idx,
-                                      function=DeltaFunctionCall(
-                                          arguments=args_delta).model_dump(
-                                              exclude_none=True))
-                    ])
+                    return DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=current_idx,
+                                function=DeltaFunctionCall(
+                                    arguments=args_delta
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
             elif not sent_args and clean_args:
                 clean_args_delta = self._clean_delta_braces(clean_args)
                 sent_tools[current_idx]["sent_arguments"] = clean_args
                 self.streaming_state["sent_tools"] = sent_tools
 
-                if clean_args.endswith('}'):
+                if clean_args.endswith("}"):
                     self._advance_to_next_tool()
 
-                return DeltaMessage(tool_calls=[
-                    DeltaToolCall(index=current_idx,
-                                  function=DeltaFunctionCall(
-                                      arguments=clean_args_delta).model_dump(
-                                          exclude_none=True))
-                ])
+                return DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=current_idx,
+                            function=DeltaFunctionCall(
+                                arguments=clean_args_delta
+                            ).model_dump(exclude_none=True),
+                        )
+                    ]
+                )
 
         return None
 
@@ -652,14 +679,15 @@ def _is_end_tool_calls(self, current_text: str) -> bool:
             search_start = pos + 1
 
         think_regions = []
-        for match in re.finditer(self.thinking_tag_pattern,
-                                 current_text,
-                                 flags=re.DOTALL):
+        for match in re.finditer(
+            self.thinking_tag_pattern, current_text, flags=re.DOTALL
+        ):
             think_regions.append((match.start(), match.end()))
 
         for pos in end_token_positions:
-            in_think = any(pos >= t_start and pos < t_end
-                           for t_start, t_end in think_regions)
+            in_think = any(
+                pos >= t_start and pos < t_end for t_start, t_end in think_regions
+            )
             if not in_think:
                 return True
 
@@ -682,14 +710,12 @@ def extract_tool_calls_streaming(
 
         if self._should_buffer_content(delta_text):
             buffered_output = self._process_buffer(delta_text)
-            return DeltaMessage(
-                content=buffered_output) if buffered_output else None
+            return DeltaMessage(content=buffered_output) if buffered_output else None
 
         if self._is_end_tool_calls(current_text):
             return DeltaMessage(content=delta_text)
 
-        safe_content, potential_tag = self._split_content_for_buffering(
-            delta_text)
+        safe_content, potential_tag = self._split_content_for_buffering(delta_text)
         if potential_tag:
             self.pending_buffer += potential_tag
             return DeltaMessage(content=safe_content) if safe_content else None
@@ -697,35 +723,39 @@ def extract_tool_calls_streaming(
         processed_current_text = self.preprocess_model_output(current_text)
 
         if self.tool_call_start_token not in processed_current_text:
-            if (self.tool_call_end_token in delta_text
-                    and self.tool_call_start_token in current_text):
+            if (
+                self.tool_call_end_token in delta_text
+                and self.tool_call_start_token in current_text
+            ):
                 return None
-            if delta_text.strip(
-            ) == '' and self.tool_call_start_token in current_text:
+            if delta_text.strip() == "" and self.tool_call_start_token in current_text:
                 return None
-            if (self._get_current_tool_index() != -1
-                    and self.tool_call_end_token in current_text):
+            if (
+                self._get_current_tool_index() != -1
+                and self.tool_call_end_token in current_text
+            ):
                 self._reset_streaming_state()
             return DeltaMessage(content=delta_text)
 
-        if (self.tool_call_start_token_id is not None
-                and self.tool_call_start_token_id in delta_token_ids
-                and len(delta_token_ids) == 1):
+        if (
+            self.tool_call_start_token_id is not None
+            and self.tool_call_start_token_id in delta_token_ids
+            and len(delta_token_ids) == 1
+        ):
             return None
 
-        original_tool_start = self._find_tool_start_outside_thinking(
-            current_text)
+        original_tool_start = self._find_tool_start_outside_thinking(current_text)
         if original_tool_start is None:
             return None
 
         content_before_tools = self._extract_content_before_tools(
-            current_text, delta_text, original_tool_start)
+            current_text, delta_text, original_tool_start
+        )
         if content_before_tools:
             return DeltaMessage(content=content_before_tools)
 
         try:
-            tool_content = self._extract_tool_content(current_text,
-                                                      original_tool_start)
+            tool_content = self._extract_tool_content(current_text, original_tool_start)
             current_tools_count = self._detect_tools_in_text(tool_content)
 
             if current_tools_count == 0:
@@ -736,24 +766,23 @@ def extract_tool_calls_streaming(
 
             self._ensure_state_arrays(current_tools_count)
 
-            return (self._handle_tool_name_streaming(tool_content,
-                                                     current_tools_count)
-                    or self._handle_tool_args_streaming(
-                        tool_content, current_tools_count))
+            return self._handle_tool_name_streaming(
+                tool_content, current_tools_count
+            ) or self._handle_tool_args_streaming(tool_content, current_tools_count)
 
         except Exception:
-            logger.exception("An unexpected error occurred ",
-                             "during streaming tool call handling.")
+            logger.exception(
+                "An unexpected error occurred ", "during streaming tool call handling."
+            )
             return None
 
-    def _find_tool_start_outside_thinking(self,
-                                          current_text: str) -> Optional[int]:
+    def _find_tool_start_outside_thinking(self, current_text: str) -> Optional[int]:
         """
         Find the start position of tool calls outside of thinking tags.
-        
+
         Args:
             current_text: Current text to search
-            
+
         Returns:
             Position of tool call start or None if not found
         """
@@ -763,26 +792,32 @@ def _find_tool_start_outside_thinking(self,
             if pos == -1:
                 return None
 
-            think_regions = [(m.start(), m.end()) for m in re.finditer(
-                r"<think>(.*?)</think>", current_text, flags=re.DOTALL)]
-            in_think = any(pos >= t_start and pos < t_end
-                           for t_start, t_end in think_regions)
+            think_regions = [
+                (m.start(), m.end())
+                for m in re.finditer(
+                    r"<think>(.*?)</think>", current_text, flags=re.DOTALL
+                )
+            ]
+            in_think = any(
+                pos >= t_start and pos < t_end for t_start, t_end in think_regions
+            )
 
             if not in_think:
                 return pos
 
             search_start = pos + 1
 
-    def _extract_content_before_tools(self, current_text: str, delta_text: str,
-                                      tool_start: int) -> Optional[str]:
+    def _extract_content_before_tools(
+        self, current_text: str, delta_text: str, tool_start: int
+    ) -> Optional[str]:
         """
         Extract content that appears before tool calls.
-        
+
         Args:
             current_text: Current text
             delta_text: Delta text
             tool_start: Start position of tools
-            
+
         Returns:
             Content before tools or None
         """
@@ -791,18 +826,18 @@ def _extract_content_before_tools(self, current_text: str, delta_text: str,
             if delta_start_pos < tool_start:
                 content_part = delta_text
                 if delta_start_pos + len(delta_text) > tool_start:
-                    content_part = delta_text[:tool_start - delta_start_pos]
+                    content_part = delta_text[: tool_start - delta_start_pos]
                 return content_part if content_part else None
         return None
 
     def _extract_tool_content(self, current_text: str, tool_start: int) -> str:
         """
         Extract tool content from current text starting at tool_start.
-        
+
         Args:
             current_text: Current text
             tool_start: Start position of tool calls
-            
+
         Returns:
             Extracted tool content
         """
diff --git a/vllm/entrypoints/openai/tool_parsers/mistral_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/mistral_tool_parser.py
index e6b300fd84e9..b3b8960276bc 100644
--- a/vllm/entrypoints/openai/tool_parsers/mistral_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/mistral_tool_parser.py
@@ -12,15 +12,20 @@
 from partial_json_parser.core.options import Allow
 from pydantic import Field
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
-from vllm.entrypoints.openai.tool_parsers.utils import (
-    extract_intermediate_diff)
+    ToolParser,
+    ToolParserManager,
+)
+from vllm.entrypoints.openai.tool_parsers.utils import extract_intermediate_diff
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer, MistralTokenizer
 
@@ -30,8 +35,7 @@
 
 
 class MistralToolCall(ToolCall):
-    id: str = Field(
-        default_factory=lambda: MistralToolCall.generate_random_id())
+    id: str = Field(default_factory=lambda: MistralToolCall.generate_random_id())
 
     @staticmethod
     def generate_random_id():
@@ -45,8 +49,9 @@ def is_valid_id(id: str) -> bool:
 
 
 def _is_fn_name_regex_support(model_tokenizer: AnyTokenizer) -> bool:
-    return isinstance(model_tokenizer, MistralTokenizer) \
-        and model_tokenizer.version >= 11
+    return (
+        isinstance(model_tokenizer, MistralTokenizer) and model_tokenizer.version >= 11
+    )
 
 
 @ToolParserManager.register_module("mistral")
@@ -63,35 +68,38 @@ def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
 
         if not isinstance(self.model_tokenizer, MistralTokenizer):
-            logger.info("Non-Mistral tokenizer detected when using a Mistral "
-                        "model...")
+            logger.info("Non-Mistral tokenizer detected when using a Mistral model...")
 
         # initialize properties used for state when parsing tool calls in
         # streaming mode
         self.prev_tool_call_arr: list[dict] = []
         self.current_tool_id: int = -1
         self.current_tool_name_sent: bool = False
-        self.streamed_args_for_tool: list[str] = [
-        ]  # map what has been streamed for each tool so far to a list
+        self.streamed_args_for_tool: list[
+            str
+        ] = []  # map what has been streamed for each tool so far to a list
         self.bot_token = "[TOOL_CALLS]"
         self.bot_token_id = self.vocab.get(self.bot_token)
         self.tool_call_regex = re.compile(r"\[{.*}\]", re.DOTALL)
         if _is_fn_name_regex_support(self.model_tokenizer):
             self.fn_name_regex = re.compile(
-                r'([a-zA-Z0-9_-]+)(\{[\s\S]*?\})(?=\s*$|,|\s)', re.DOTALL)
+                r"([a-zA-Z0-9_-]+)(\{[\s\S]*?\})(?=\s*$|,|\s)", re.DOTALL
+            )
         else:
             self.fn_name_regex = None
 
         if self.bot_token_id is None:
             raise RuntimeError(
                 "Mistral Tool Parser could not locate the tool call token in "
-                "the tokenizer!")
-
-    def adjust_request(
-            self, request: ChatCompletionRequest) -> ChatCompletionRequest:
-        if not isinstance(
-                self.model_tokenizer, MistralTokenizer
-        ) and request.tools and request.tool_choice != 'none':
+                "the tokenizer!"
+            )
+
+    def adjust_request(self, request: ChatCompletionRequest) -> ChatCompletionRequest:
+        if (
+            not isinstance(self.model_tokenizer, MistralTokenizer)
+            and request.tools
+            and request.tool_choice != "none"
+        ):
             # Do not skip special tokens when using chat template
             # with Mistral parser as TOOL_CALL token is needed
             # for tool detection.
@@ -113,9 +121,9 @@ def extract_tool_calls(
 
         # case -- if a tool call token is not present, return a text response
         if self.bot_token not in model_output:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         # first remove the BOT token
         tool_content = model_output.replace(self.bot_token, "").strip()
@@ -134,10 +142,9 @@ def extract_tool_calls(
 
                         # fn_name is encoded outside serialized json dump
                         # only arguments are serialized
-                        function_call_arr.append({
-                            "name": fn_name,
-                            "arguments": json.loads(args)
-                        })
+                        function_call_arr.append(
+                            {"name": fn_name, "arguments": json.loads(args)}
+                        )
                 else:
                     function_call_arr = json.loads(tool_content)
             except json.JSONDecodeError:
@@ -155,8 +162,11 @@ def extract_tool_calls(
                     function=FunctionCall(
                         name=raw_function_call["name"],
                         # function call args are JSON but as a string
-                        arguments=json.dumps(raw_function_call["arguments"],
-                                             ensure_ascii=False)))
+                        arguments=json.dumps(
+                            raw_function_call["arguments"], ensure_ascii=False
+                        ),
+                    ),
+                )
                 for raw_function_call in function_call_arr
             ]
 
@@ -165,14 +175,15 @@ def extract_tool_calls(
             return ExtractedToolCallInformation(
                 tools_called=True,
                 tool_calls=tool_calls,
-                content=content if len(content) > 0 else None)
+                content=content if len(content) > 0 else None,
+            )
 
         except Exception:
             logger.exception("Error in extracting tool call from response.")
             # return information to just treat the tool call as regular JSON
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=tool_content)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=tool_content
+            )
 
     def extract_tool_calls_streaming(
         self,
@@ -184,7 +195,6 @@ def extract_tool_calls_streaming(
         delta_token_ids: Sequence[int],
         request: ChatCompletionRequest,
     ) -> Union[DeltaMessage, None]:
-
         # if the tool call token is not in the tokens generated so far, append
         # output to contents since it's not a tool
         if self.bot_token not in current_text:
@@ -195,8 +205,7 @@ def extract_tool_calls_streaming(
 
         # handle if we detected the BOT token which means the start of tool
         # calling
-        if (self.bot_token_id in delta_token_ids
-                and len(delta_token_ids) == 1):
+        if self.bot_token_id in delta_token_ids and len(delta_token_ids) == 1:
             # if it's the only token, return None, so we don't send a chat
             # completion any don't send a control token
             return None
@@ -205,10 +214,8 @@ def extract_tool_calls_streaming(
         # sent yet, don't allow sending
         # an incomplete string since OpenAI only ever (as far as I have
         # seen) allows sending the entire tool/ function name at once.
-        flags = Allow.ALL if self.current_tool_name_sent \
-            else Allow.ALL & ~Allow.STR
+        flags = Allow.ALL if self.current_tool_name_sent else Allow.ALL & ~Allow.STR
         try:
-
             # replace BOT token with empty string, and convert single quotes
             # to double to allow parsing as JSON since mistral uses single
             # quotes instead of double for tool calls
@@ -218,15 +225,17 @@ def extract_tool_calls_streaming(
             # parsing on the entire array
             try:
                 tool_call_arr: list[dict] = partial_json_parser.loads(
-                    parsable_arr, flags)
+                    parsable_arr, flags
+                )
             except partial_json_parser.core.exceptions.MalformedJSON:
-                logger.debug('not enough tokens to parse into JSON yet')
+                logger.debug("not enough tokens to parse into JSON yet")
                 return None
 
             # select as the current tool call the one we're on the state at
 
-            current_tool_call: dict = tool_call_arr[self.current_tool_id] \
-                if len(tool_call_arr) > 0 else {}
+            current_tool_call: dict = (
+                tool_call_arr[self.current_tool_id] if len(tool_call_arr) > 0 else {}
+            )
 
             # case -- if no tokens have been streamed for the tool, e.g.
             #   only the array brackets, stream nothing
@@ -235,9 +244,9 @@ def extract_tool_calls_streaming(
 
             # case: we are starting a new tool in the array
             #   -> array has > 0 length AND length has moved past cursor
-            elif (len(tool_call_arr) > 0
-                  and len(tool_call_arr) > self.current_tool_id + 1):
-
+            elif (
+                len(tool_call_arr) > 0 and len(tool_call_arr) > self.current_tool_id + 1
+            ):
                 # if we're moving on to a new call, first make sure we
                 # haven't missed anything in the previous one that was
                 # auto-generated due to JSON completions, but wasn't
@@ -247,16 +256,19 @@ def extract_tool_calls_streaming(
 
                     if diff:
                         diff = json.dumps(diff, ensure_ascii=False).replace(
-                            self.streamed_args_for_tool[self.current_tool_id],
-                            "")
-                        delta = DeltaMessage(tool_calls=[
-                            DeltaToolCall(index=self.current_tool_id,
-                                          function=DeltaFunctionCall(
-                                              arguments=diff).model_dump(
-                                                  exclude_none=True))
-                        ])
-                        self.streamed_args_for_tool[
-                            self.current_tool_id] += diff
+                            self.streamed_args_for_tool[self.current_tool_id], ""
+                        )
+                        delta = DeltaMessage(
+                            tool_calls=[
+                                DeltaToolCall(
+                                    index=self.current_tool_id,
+                                    function=DeltaFunctionCall(
+                                        arguments=diff
+                                    ).model_dump(exclude_none=True),
+                                )
+                            ]
+                        )
+                        self.streamed_args_for_tool[self.current_tool_id] += diff
                     else:
                         delta = None
                 else:
@@ -275,15 +287,18 @@ def extract_tool_calls_streaming(
             if not self.current_tool_name_sent:
                 function_name = current_tool_call.get("name")
                 if function_name:
-
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.current_tool_id,
-                                      type="function",
-                                      id=MistralToolCall.generate_random_id(),
-                                      function=DeltaFunctionCall(
-                                          name=function_name).model_dump(
-                                              exclude_none=True))
-                    ])
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                type="function",
+                                id=MistralToolCall.generate_random_id(),
+                                function=DeltaFunctionCall(
+                                    name=function_name
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
                     self.current_tool_name_sent = True
                 else:
                     delta = None
@@ -291,64 +306,72 @@ def extract_tool_calls_streaming(
             # now we know we're on the same tool call and we're streaming
             # arguments
             else:
-
-                prev_arguments = self.prev_tool_call_arr[
-                    self.current_tool_id].get("arguments")
+                prev_arguments = self.prev_tool_call_arr[self.current_tool_id].get(
+                    "arguments"
+                )
                 cur_arguments = current_tool_call.get("arguments")
 
-                new_text = delta_text.replace("\'", "\"")
-                if ('"}' in new_text):
-                    new_text = new_text[:new_text.rindex('"}')]
+                new_text = delta_text.replace("'", '"')
+                if '"}' in new_text:
+                    new_text = new_text[: new_text.rindex('"}')]
 
                 if not cur_arguments and not prev_arguments:
-
                     delta = None
                 elif not cur_arguments and prev_arguments:
                     logger.error(
-                        "INVARIANT - impossible to have arguments reset "
-                        "mid-arguments")
+                        "INVARIANT - impossible to have arguments reset mid-arguments"
+                    )
                     delta = None
                 elif cur_arguments and not prev_arguments:
-                    cur_arguments_json = json.dumps(cur_arguments,
-                                                    ensure_ascii=False)[:-2]
-                    logger.debug("finding %s in %s", new_text,
-                                 cur_arguments_json)
+                    cur_arguments_json = json.dumps(cur_arguments, ensure_ascii=False)[
+                        :-2
+                    ]
+                    logger.debug("finding %s in %s", new_text, cur_arguments_json)
 
-                    if (new_text not in cur_arguments_json):
+                    if new_text not in cur_arguments_json:
                         return None
-                    arguments_delta = cur_arguments_json[:cur_arguments_json.
-                                                         rindex(new_text) +
-                                                         len(new_text)]
-                    logger.debug("First tokens in arguments received: %s",
-                                 arguments_delta)
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.current_tool_id,
-                                      function=DeltaFunctionCall(
-                                          arguments=arguments_delta).
-                                      model_dump(exclude_none=True))
-                    ])
-                    self.streamed_args_for_tool[
-                        self.current_tool_id] += arguments_delta
+                    arguments_delta = cur_arguments_json[
+                        : cur_arguments_json.rindex(new_text) + len(new_text)
+                    ]
+                    logger.debug(
+                        "First tokens in arguments received: %s", arguments_delta
+                    )
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                function=DeltaFunctionCall(
+                                    arguments=arguments_delta
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
+                    self.streamed_args_for_tool[self.current_tool_id] += arguments_delta
 
                 elif cur_arguments and prev_arguments:
-                    cur_args_json = json.dumps(cur_arguments,
-                                               ensure_ascii=False)
-                    prev_args_json = json.dumps(prev_arguments,
-                                                ensure_ascii=False)
-                    logger.debug("Searching for diff between \n%s\n%s",
-                                 cur_args_json, prev_args_json)
+                    cur_args_json = json.dumps(cur_arguments, ensure_ascii=False)
+                    prev_args_json = json.dumps(prev_arguments, ensure_ascii=False)
+                    logger.debug(
+                        "Searching for diff between \n%s\n%s",
+                        cur_args_json,
+                        prev_args_json,
+                    )
 
                     argument_diff = extract_intermediate_diff(
-                        cur_args_json, prev_args_json)
+                        cur_args_json, prev_args_json
+                    )
                     logger.debug("got arguments diff: %s", argument_diff)
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.current_tool_id,
-                                      function=DeltaFunctionCall(
-                                          arguments=argument_diff).model_dump(
-                                              exclude_none=True))
-                    ])
-                    self.streamed_args_for_tool[
-                        self.current_tool_id] += argument_diff
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                function=DeltaFunctionCall(
+                                    arguments=argument_diff
+                                ).model_dump(exclude_none=True),
+                            )
+                        ]
+                    )
+                    self.streamed_args_for_tool[self.current_tool_id] += argument_diff
                 else:
                     # try parsing it with regular JSON - if it works we're
                     # at the end, and we need to send the difference between
@@ -364,6 +387,6 @@ def extract_tool_calls_streaming(
         except Exception:
             logger.exception("Error trying to handle streaming tool call.")
             logger.debug(
-                "Skipping chunk as a result of tool streaming extraction "
-                "error")
+                "Skipping chunk as a result of tool streaming extraction error"
+            )
             return None
diff --git a/vllm/entrypoints/openai/tool_parsers/openai_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/openai_tool_parser.py
index 1729fdbc9971..8d7cbbfba649 100644
--- a/vllm/entrypoints/openai/tool_parsers/openai_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/openai_tool_parser.py
@@ -7,12 +7,17 @@
 from typing import TYPE_CHECKING
 
 from vllm.entrypoints.harmony_utils import parse_output_into_messages
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaMessage,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaMessage,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
+    ToolParser,
+    ToolParserManager,
+)
 from vllm.logger import init_logger
 
 if TYPE_CHECKING:
@@ -23,7 +28,6 @@
 
 @ToolParserManager.register_module("openai")
 class OpenAIToolParser(ToolParser):
-
     def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
 
@@ -57,7 +61,8 @@ def extract_tool_calls(
                             tool_args = json.dumps(json.loads(msg_text))
                         except json.JSONDecodeError:
                             logger.exception(
-                                "Error decoding JSON tool call from response.")
+                                "Error decoding JSON tool call from response."
+                            )
                             tool_args = msg_text
                     else:
                         tool_args = msg_text
@@ -68,7 +73,8 @@ def extract_tool_calls(
                                 name=msg.recipient.split("functions.")[1],
                                 arguments=tool_args,
                             ),
-                        ))
+                        )
+                    )
                 elif msg.channel == "final":
                     final_content = msg_text
 
diff --git a/vllm/entrypoints/openai/tool_parsers/phi4mini_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/phi4mini_tool_parser.py
index 85dd56213c6a..114987e5600b 100644
--- a/vllm/entrypoints/openai/tool_parsers/phi4mini_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/phi4mini_tool_parser.py
@@ -9,12 +9,17 @@
 from transformers import PreTrainedTokenizerBase
 
 from vllm.entrypoints.chat_utils import make_tool_call_id
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaMessage,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaMessage,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
+    ToolParser,
+    ToolParserManager,
+)
 from vllm.logger import init_logger
 
 logger = init_logger(__name__)
@@ -26,7 +31,7 @@ class Phi4MiniJsonToolParser(ToolParser):
     Tool call parser for phi-4-mini models intended for use with the
     examples/tool_chat_template_llama.jinja template.
 
-    Used when --enable-auto-tool-choice --tool-call-parser phi4_mini_json  
+    Used when --enable-auto-tool-choice --tool-call-parser phi4_mini_json
     are all set
     """
 
@@ -38,39 +43,42 @@ def __init__(self, tokenizer: PreTrainedTokenizerBase) -> None:
         self.prev_tool_call_arr: list[dict[str, Any]] = []
         self.current_tool_id: int = -1
         self.current_tool_name_sent: bool = False
-        self.streamed_args_for_tool: list[str] = [
-        ]  # map what has been streamed for each tool so far to a list
+        self.streamed_args_for_tool: list[
+            str
+        ] = []  # map what has been streamed for each tool so far to a list
         self.bot_token: str = "functools"
 
     def extract_tool_calls(
-            self, model_output: str,
-            request: ChatCompletionRequest) -> ExtractedToolCallInformation:
+        self, model_output: str, request: ChatCompletionRequest
+    ) -> ExtractedToolCallInformation:
         """
         Extract the tool calls from a complete model response.
         """
         logger.debug("Model output: %s", model_output)
 
-        pattern = r'functools\[(.*?)\]'
+        pattern = r"functools\[(.*?)\]"
         matches = re.search(pattern, model_output, re.DOTALL)
 
         if not matches:
             logger.debug("No function calls found")
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         try:
             function_call_arr: list[dict[str, Any]] = []
             try:
-                json_content = '[' + matches.group(1) + ']'
+                json_content = "[" + matches.group(1) + "]"
 
                 function_call_arr = json.loads(json_content)
-                logger.debug("Successfully extracted %d function calls",
-                             len(function_call_arr))
+                logger.debug(
+                    "Successfully extracted %d function calls", len(function_call_arr)
+                )
             except json.JSONDecodeError as e:
                 logger.error(
-                    "Failed to parse function calls from model output. "
-                    "Error: %s", str(e))
+                    "Failed to parse function calls from model output. Error: %s",
+                    str(e),
+                )
 
             tool_calls: list[ToolCall] = [
                 ToolCall(
@@ -81,22 +89,25 @@ def extract_tool_calls(
                         # function call args are JSON but as a string
                         arguments=json.dumps(
                             raw_function_call["arguments"]
-                            if "arguments" in raw_function_call else
-                            raw_function_call["parameters"],
-                            ensure_ascii=False),
-                    )) for raw_function_call in function_call_arr
+                            if "arguments" in raw_function_call
+                            else raw_function_call["parameters"],
+                            ensure_ascii=False,
+                        ),
+                    ),
+                )
+                for raw_function_call in function_call_arr
             ]
 
             # get any content before the tool call
-            ret = ExtractedToolCallInformation(tools_called=True,
-                                               tool_calls=tool_calls,
-                                               content=None)
+            ret = ExtractedToolCallInformation(
+                tools_called=True, tool_calls=tool_calls, content=None
+            )
             return ret
 
         except Exception:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
     def extract_tool_calls_streaming(
         self,
@@ -108,5 +119,4 @@ def extract_tool_calls_streaming(
         delta_token_ids: Sequence[int],
         request: ChatCompletionRequest,
     ) -> Optional[DeltaMessage]:
-
         return None
diff --git a/vllm/entrypoints/openai/tool_parsers/pythonic_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/pythonic_tool_parser.py
index 992f141bef0f..272068a6f0ac 100644
--- a/vllm/entrypoints/openai/tool_parsers/pythonic_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/pythonic_tool_parser.py
@@ -10,13 +10,19 @@
 from transformers import PreTrainedTokenizerBase
 
 import vllm.envs as envs
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
+    ToolParser,
+    ToolParserManager,
+)
 from vllm.logger import init_logger
 
 logger = init_logger(__name__)
@@ -34,6 +40,7 @@ class PythonicToolParser(ToolParser):
 
     Used when --enable-auto-tool-choice --tool-call-parser pythonic are all set
     """
+
     # TODO(mdepinet): Possible future improvements:
     #   1. Support text + tools separated by either <|python_tag|> or \n\n
     #   2. Support tools outside of a list (or separated by a semicolon).
@@ -43,7 +50,8 @@ class PythonicToolParser(ToolParser):
 
     TOOL_CALL_REGEX = re.compile(
         r"\[([a-zA-Z]+\w*\(([a-zA-Z]+\w*=.*,\s*)*([a-zA-Z]+\w*=.*\s)?\),\s*)*([a-zA-Z]+\w*\(([a-zA-Z]+\w*=.*,\s*)*([a-zA-Z]+\w*=.*\s*)?\)\s*)+\]",
-        re.DOTALL)
+        re.DOTALL,
+    )
 
     def __init__(self, tokenizer: PreTrainedTokenizerBase):
         super().__init__(tokenizer)
@@ -58,48 +66,54 @@ def current_tool_index(self, value: int) -> None:
         self.current_tool_id = value
 
     def extract_tool_calls(
-            self, model_output: str,
-            request: ChatCompletionRequest) -> ExtractedToolCallInformation:
+        self, model_output: str, request: ChatCompletionRequest
+    ) -> ExtractedToolCallInformation:
         """
         Extract the tool calls from a complete model response.
         """
         is_tool_call_pattern = False
         try:
-            is_tool_call_pattern = self.TOOL_CALL_REGEX.match(
-                model_output,
-                timeout=envs.VLLM_TOOL_PARSE_REGEX_TIMEOUT_SECONDS) is not None
+            is_tool_call_pattern = (
+                self.TOOL_CALL_REGEX.match(
+                    model_output, timeout=envs.VLLM_TOOL_PARSE_REGEX_TIMEOUT_SECONDS
+                )
+                is not None
+            )
         except TimeoutError:
-            logger.warning(
-                "Regex timeout occurred when matching tool call pattern.")
-            logger.debug("Regex timeout occurred when matching user input: %s",
-                         model_output)
+            logger.warning("Regex timeout occurred when matching tool call pattern.")
+            logger.debug(
+                "Regex timeout occurred when matching user input: %s", model_output
+            )
 
         if not is_tool_call_pattern:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         try:
             module = ast.parse(model_output)
             parsed = getattr(module.body[0], "value", None)
             if isinstance(parsed, ast.List) and all(
-                    isinstance(e, ast.Call) for e in parsed.elts):
+                isinstance(e, ast.Call) for e in parsed.elts
+            ):
                 return ExtractedToolCallInformation(
                     tools_called=True,
                     tool_calls=[
                         _handle_single_tool(e)  # type: ignore
                         for e in parsed.elts
                     ],
-                    content=None)
+                    content=None,
+                )
             else:
                 raise _UnexpectedAstError(
-                    "Tool output must be a list of function calls")
+                    "Tool output must be a list of function calls"
+                )
         except Exception:
             logger.exception("Error in extracting tool call from response.")
             # Treat as regular text
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
     def extract_tool_calls_streaming(
         self,
@@ -111,7 +125,6 @@ def extract_tool_calls_streaming(
         delta_token_ids: Sequence[int],
         request: ChatCompletionRequest,
     ) -> Union[DeltaMessage, None]:
-
         if not current_text.startswith("["):
             return DeltaMessage(content=delta_text)
 
@@ -124,9 +137,11 @@ def extract_tool_calls_streaming(
             module = ast.parse(valid_text)
             parsed = getattr(module.body[0], "value", None)
             if not isinstance(parsed, ast.List) or not all(
-                    isinstance(e, ast.Call) for e in parsed.elts):
+                isinstance(e, ast.Call) for e in parsed.elts
+            ):
                 raise _UnexpectedAstError(
-                    "Tool output must be a list of function calls")
+                    "Tool output must be a list of function calls"
+                )
             tool_calls = [
                 _handle_single_tool(e)  # type: ignore
                 for e in parsed.elts
@@ -141,28 +156,30 @@ def extract_tool_calls_streaming(
                 if len(self.streamed_args_for_tool) == index:
                     self.streamed_args_for_tool.append("")
 
-                new_call_complete = index < len(
-                    tool_calls) - 1 or ")]" not in added_text
+                new_call_complete = (
+                    index < len(tool_calls) - 1 or ")]" not in added_text
+                )
                 if new_call_complete:
                     self.current_tool_index += 1
 
-                withheld_suffix = (added_text[:-2]
-                                   if not new_call_complete else "")
+                withheld_suffix = added_text[:-2] if not new_call_complete else ""
                 if not new_call_complete and added_text[-2] == ")":
                     # Function call is incomplete. Withhold the closing bracket.
                     withheld_suffix = withheld_suffix + "}"
                 # Strings get single quotes in the model-produced string.
                 # JSON requires double quotes.
                 withheld_suffix = withheld_suffix.replace("'", '"')
-                delta = _compute_tool_delta(self.streamed_args_for_tool[index],
-                                            new_call, index, withheld_suffix)
+                delta = _compute_tool_delta(
+                    self.streamed_args_for_tool[index], new_call, index, withheld_suffix
+                )
 
                 if delta is not None:
                     tool_deltas.append(delta)
-                    if (delta.function is not None
-                            and delta.function.arguments is not None):
-                        self.streamed_args_for_tool[
-                            index] += delta.function.arguments
+                    if (
+                        delta.function is not None
+                        and delta.function.arguments is not None
+                    ):
+                        self.streamed_args_for_tool[index] += delta.function.arguments
 
             # HACK: serving_chat.py inspects the internal state of tool parsers
             # when determining its final streaming delta, automatically
@@ -177,14 +194,14 @@ def extract_tool_calls_streaming(
             elif not added_text and self.current_tool_id > 0:
                 # Return an empty DeltaMessage once the tool calls are all done
                 # so that finish_reason gets set.
-                return DeltaMessage(content='')
+                return DeltaMessage(content="")
             else:
                 return None
         except Exception:
             logger.exception("Error trying to handle streaming tool call.")
             logger.debug(
-                "Skipping chunk as a result of tool streaming extraction "
-                "error")
+                "Skipping chunk as a result of tool streaming extraction error"
+            )
             return None
 
 
@@ -193,8 +210,7 @@ def _get_parameter_value(val: ast.expr) -> Any:
         return val.value
     elif isinstance(val, ast.Dict):
         if not all(isinstance(k, ast.Constant) for k in val.keys):
-            raise _UnexpectedAstError(
-                "Dict tool call arguments must have literal keys")
+            raise _UnexpectedAstError("Dict tool call arguments must have literal keys")
         return {
             k.value: _get_parameter_value(v)  # type: ignore
             for k, v in zip(val.keys, val.values)
@@ -214,9 +230,9 @@ def _handle_single_tool(call: ast.Call) -> ToolCall:
         arguments[keyword.arg] = _get_parameter_value(keyword.value)
     return ToolCall(
         type="function",
-        function=FunctionCall(name=function_name,
-                              arguments=json.dumps(arguments,
-                                                   ensure_ascii=False)),
+        function=FunctionCall(
+            name=function_name, arguments=json.dumps(arguments, ensure_ascii=False)
+        ),
     )
 
 
@@ -253,21 +269,25 @@ def _make_valid_python(text: str) -> Union[tuple[str, str], None]:
         # we can't fill in a valid value.
         return None
     if bracket_stack and bracket_stack[-1] == "{":
-        trailing_dict_text = text[:text.rfind("{")]
+        trailing_dict_text = text[: text.rfind("{")]
         num_keys = trailing_dict_text.count(":")
         num_values = trailing_dict_text.count(",")
         if num_keys <= num_values:
             return None  # Incomplete property name within parameter value
     if bracket_stack and bracket_stack[-1] == "(":
-        trailing_params_text = text[:text.rfind("(")]
+        trailing_params_text = text[: text.rfind("(")]
         num_full_param_names = trailing_params_text.count("=")
         num_full_param_values = trailing_params_text.count(",")
         if num_full_param_names <= num_full_param_values:
             return None  # Incomplete parameter name
     if text.endswith(","):
         text = text[:-1]
-    if bracket_stack and bracket_stack[-1] == "[" and not text.endswith(
-            "[") and not text.endswith(")"):
+    if (
+        bracket_stack
+        and bracket_stack[-1] == "["
+        and not text.endswith("[")
+        and not text.endswith(")")
+    ):
         return None  # Incomplete function name
 
     added_text = ""
@@ -286,23 +306,29 @@ def _make_valid_python(text: str) -> Union[tuple[str, str], None]:
     return text + added_text, added_text
 
 
-def _compute_tool_delta(previously_sent_args: str, new_call: ToolCall,
-                        index: int,
-                        withheld_suffix: str) -> Union[DeltaToolCall, None]:
+def _compute_tool_delta(
+    previously_sent_args: str, new_call: ToolCall, index: int, withheld_suffix: str
+) -> Union[DeltaToolCall, None]:
     new_call_args = new_call.function.arguments
     if withheld_suffix:
         assert new_call_args.endswith(withheld_suffix)
-        new_call_args = new_call_args[:-len(withheld_suffix)]
+        new_call_args = new_call_args[: -len(withheld_suffix)]
     if not previously_sent_args:
-        return DeltaToolCall(id=new_call.id,
-                             type="function",
-                             index=index,
-                             function=DeltaFunctionCall(
-                                 name=new_call.function.name,
-                                 arguments=new_call_args,
-                             ))
-
-    arg_diff = new_call_args[len(previously_sent_args):]
-    return DeltaToolCall(
-        id=None, index=index, function=DeltaFunctionCall(
-            arguments=arg_diff)) if arg_diff else None
+        return DeltaToolCall(
+            id=new_call.id,
+            type="function",
+            index=index,
+            function=DeltaFunctionCall(
+                name=new_call.function.name,
+                arguments=new_call_args,
+            ),
+        )
+
+    arg_diff = new_call_args[len(previously_sent_args) :]
+    return (
+        DeltaToolCall(
+            id=None, index=index, function=DeltaFunctionCall(arguments=arg_diff)
+        )
+        if arg_diff
+        else None
+    )
diff --git a/vllm/entrypoints/openai/tool_parsers/qwen3coder_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/qwen3coder_tool_parser.py
index 955813ddd340..a41ca30bf527 100644
--- a/vllm/entrypoints/openai/tool_parsers/qwen3coder_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/qwen3coder_tool_parser.py
@@ -8,14 +8,20 @@
 
 import regex as re
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              ChatCompletionToolsParam,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    ChatCompletionToolsParam,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
+    ToolParser,
+    ToolParserManager,
+)
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
@@ -24,7 +30,6 @@
 
 @ToolParserManager.register_module("qwen3_coder")
 class Qwen3CoderToolParser(ToolParser):
-
     def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
 
@@ -49,32 +54,37 @@ def __init__(self, tokenizer: AnyTokenizer):
 
         # Regex patterns
         self.tool_call_complete_regex = re.compile(
-            r"<tool_call>(.*?)</tool_call>", re.DOTALL)
+            r"<tool_call>(.*?)</tool_call>", re.DOTALL
+        )
         self.tool_call_regex = re.compile(
-            r"<tool_call>(.*?)</tool_call>|<tool_call>(.*?)$", re.DOTALL)
+            r"<tool_call>(.*?)</tool_call>|<tool_call>(.*?)$", re.DOTALL
+        )
         self.tool_call_function_regex = re.compile(
-            r"<function=(.*?)</function>|<function=(.*)$", re.DOTALL)
+            r"<function=(.*?)</function>|<function=(.*)$", re.DOTALL
+        )
         self.tool_call_parameter_regex = re.compile(
             r"<parameter=(.*?)(?:</parameter>|(?=<parameter=)|(?=</function>)|$)",
-            re.DOTALL)
+            re.DOTALL,
+        )
 
         if not self.model_tokenizer:
             raise ValueError(
                 "The model tokenizer must be passed to the ToolParser "
-                "constructor during construction.")
+                "constructor during construction."
+            )
 
-        self.tool_call_start_token_id = self.vocab.get(
-            self.tool_call_start_token)
+        self.tool_call_start_token_id = self.vocab.get(self.tool_call_start_token)
         self.tool_call_end_token_id = self.vocab.get(self.tool_call_end_token)
 
-        if (self.tool_call_start_token_id is None
-                or self.tool_call_end_token_id is None):
+        if self.tool_call_start_token_id is None or self.tool_call_end_token_id is None:
             raise RuntimeError(
                 "Qwen3 XML Tool parser could not locate tool call start/end "
-                "tokens in the tokenizer!")
+                "tokens in the tokenizer!"
+            )
 
-        logger.info("vLLM Successfully import tool parser %s !",
-                    self.__class__.__name__)
+        logger.info(
+            "vLLM Successfully import tool parser %s !", self.__class__.__name__
+        )
 
     def _generate_tool_call_id(self) -> str:
         """Generate a unique tool call ID."""
@@ -100,14 +110,15 @@ def _reset_streaming_state(self):
         self.streaming_request = None
 
     def _get_arguments_config(
-            self, func_name: str,
-            tools: Optional[list[ChatCompletionToolsParam]]) -> dict:
+        self, func_name: str, tools: Optional[list[ChatCompletionToolsParam]]
+    ) -> dict:
         """Extract argument configuration for a function."""
         if tools is None:
             return {}
         for config in tools:
-            if not hasattr(config, "type") or not (hasattr(
-                    config, "function") and hasattr(config.function, "name")):
+            if not hasattr(config, "type") or not (
+                hasattr(config, "function") and hasattr(config.function, "name")
+            ):
                 continue
             if config.type == "function" and config.function.name == func_name:
                 if not hasattr(config.function, "parameters"):
@@ -119,12 +130,12 @@ def _get_arguments_config(
                     return params
                 else:
                     return {}
-        logger.warning("Tool '%s' is not defined in the tools list.",
-                       func_name)
+        logger.warning("Tool '%s' is not defined in the tools list.", func_name)
         return {}
 
-    def _convert_param_value(self, param_value: str, param_name: str,
-                             param_config: dict, func_name: str) -> Any:
+    def _convert_param_value(
+        self, param_value: str, param_name: str, param_config: dict, func_name: str
+    ) -> Any:
         """Convert parameter value based on its type in the schema."""
         # Handle null value for any type
         if param_value.lower() == "null":
@@ -135,38 +146,55 @@ def _convert_param_value(self, param_value: str, param_name: str,
                 logger.warning(
                     "Parsed parameter '%s' is not defined in the tool "
                     "parameters for tool '%s', directly returning the "
-                    "string value.", param_name, func_name)
+                    "string value.",
+                    param_name,
+                    func_name,
+                )
             return param_value
 
-        if isinstance(param_config[param_name],
-                      dict) and "type" in param_config[param_name]:
+        if (
+            isinstance(param_config[param_name], dict)
+            and "type" in param_config[param_name]
+        ):
             param_type = str(param_config[param_name]["type"]).strip().lower()
         else:
             param_type = "string"
         if param_type in ["string", "str", "text", "varchar", "char", "enum"]:
             return param_value
-        elif param_type.startswith("int") or param_type.startswith(
-                "uint") or param_type.startswith(
-                    "long") or param_type.startswith(
-                        "short") or param_type.startswith("unsigned"):
+        elif (
+            param_type.startswith("int")
+            or param_type.startswith("uint")
+            or param_type.startswith("long")
+            or param_type.startswith("short")
+            or param_type.startswith("unsigned")
+        ):
             try:
                 return int(param_value)
             except (ValueError, TypeError):
                 logger.warning(
                     "Parsed value '%s' of parameter '%s' is not an "
                     "integer in tool '%s', degenerating to string.",
-                    param_value, param_name, func_name)
+                    param_value,
+                    param_name,
+                    func_name,
+                )
                 return param_value
         elif param_type.startswith("num") or param_type.startswith("float"):
             try:
                 float_param_value = float(param_value)
-                return float_param_value if float_param_value - int(
-                    float_param_value) != 0 else int(float_param_value)
+                return (
+                    float_param_value
+                    if float_param_value - int(float_param_value) != 0
+                    else int(float_param_value)
+                )
             except (ValueError, TypeError):
                 logger.warning(
                     "Parsed value '%s' of parameter '%s' is not a float "
-                    "in tool '%s', degenerating to string.", param_value,
-                    param_name, func_name)
+                    "in tool '%s', degenerating to string.",
+                    param_value,
+                    param_name,
+                    func_name,
+                )
                 return param_value
         elif param_type in ["boolean", "bool", "binary"]:
             param_value = param_value.lower()
@@ -174,12 +202,18 @@ def _convert_param_value(self, param_value: str, param_name: str,
                 logger.warning(
                     "Parsed value '%s' of parameter '%s' is not a boolean "
                     "(`true` or `false`) in tool '%s', degenerating to "
-                    "false.", param_value, param_name, func_name)
+                    "false.",
+                    param_value,
+                    param_name,
+                    func_name,
+                )
             return param_value == "true"
         else:
-            if param_type in ["object", "array", "arr"
-                              ] or param_type.startswith(
-                                  "dict") or param_type.startswith("list"):
+            if (
+                param_type in ["object", "array", "arr"]
+                or param_type.startswith("dict")
+                or param_type.startswith("list")
+            ):
                 try:
                     param_value = json.loads(param_value)
                     return param_value
@@ -187,33 +221,37 @@ def _convert_param_value(self, param_value: str, param_name: str,
                     logger.warning(
                         "Parsed value '%s' of parameter '%s' cannot be "
                         "parsed with json.loads in tool '%s', will try "
-                        "other methods to parse it.", param_value, param_name,
-                        func_name)
+                        "other methods to parse it.",
+                        param_value,
+                        param_name,
+                        func_name,
+                    )
             try:
                 param_value = ast.literal_eval(param_value)  # safer
             except (ValueError, SyntaxError, TypeError):
                 logger.warning(
                     "Parsed value '%s' of parameter '%s' cannot be "
                     "converted via Python `ast.literal_eval()` in tool "
-                    "'%s', degenerating to string.", param_value, param_name,
-                    func_name)
+                    "'%s', degenerating to string.",
+                    param_value,
+                    param_name,
+                    func_name,
+                )
             return param_value
 
     def _parse_xml_function_call(
-            self, function_call_str: str,
-            tools: Optional[list[ChatCompletionToolsParam]]
+        self, function_call_str: str, tools: Optional[list[ChatCompletionToolsParam]]
     ) -> Optional[ToolCall]:
-
         # Extract function name
         end_index = function_call_str.index(">")
         function_name = function_call_str[:end_index]
         param_config = self._get_arguments_config(function_name, tools)
-        parameters = function_call_str[end_index + 1:]
+        parameters = function_call_str[end_index + 1 :]
         param_dict = {}
         for match_text in self.tool_call_parameter_regex.findall(parameters):
             idx = match_text.index(">")
             param_name = match_text[:idx]
-            param_value = str(match_text[idx + 1:])
+            param_value = str(match_text[idx + 1 :])
             # Remove prefix and trailing \n
             if param_value.startswith("\n"):
                 param_value = param_value[1:]
@@ -221,12 +259,13 @@ def _parse_xml_function_call(
                 param_value = param_value[:-1]
 
             param_dict[param_name] = self._convert_param_value(
-                param_value, param_name, param_config, function_name)
+                param_value, param_name, param_config, function_name
+            )
         return ToolCall(
             type="function",
-            function=FunctionCall(name=function_name,
-                                  arguments=json.dumps(param_dict,
-                                                       ensure_ascii=False)),
+            function=FunctionCall(
+                name=function_name, arguments=json.dumps(param_dict, ensure_ascii=False)
+            ),
         )
 
     def _get_function_calls(self, model_output: str) -> list[str]:
@@ -242,8 +281,7 @@ def _get_function_calls(self, model_output: str) -> list[str]:
 
         raw_function_calls = []
         for tool_call in raw_tool_calls:
-            raw_function_calls.extend(
-                self.tool_call_function_regex.findall(tool_call))
+            raw_function_calls.extend(self.tool_call_function_regex.findall(tool_call))
 
         function_calls = [
             match[0] if match[0] else match[1] for match in raw_function_calls
@@ -257,16 +295,16 @@ def extract_tool_calls(
     ) -> ExtractedToolCallInformation:
         # Quick check to avoid unnecessary processing
         if self.tool_call_prefix not in model_output:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         try:
             function_calls = self._get_function_calls(model_output)
             if len(function_calls) == 0:
-                return ExtractedToolCallInformation(tools_called=False,
-                                                    tool_calls=[],
-                                                    content=model_output)
+                return ExtractedToolCallInformation(
+                    tools_called=False, tool_calls=[], content=model_output
+                )
 
             tool_calls = [
                 self._parse_xml_function_call(function_call_str, request.tools)
@@ -277,12 +315,12 @@ def extract_tool_calls(
             self.prev_tool_call_arr.clear()  # Clear previous calls
             for tool_call in tool_calls:
                 if tool_call:
-                    self.prev_tool_call_arr.append({
-                        "name":
-                        tool_call.function.name,
-                        "arguments":
-                        tool_call.function.arguments,
-                    })
+                    self.prev_tool_call_arr.append(
+                        {
+                            "name": tool_call.function.name,
+                            "arguments": tool_call.function.arguments,
+                        }
+                    )
 
             # Extract content before tool calls
             content_index = model_output.find(self.tool_call_start_token)
@@ -298,9 +336,9 @@ def extract_tool_calls(
 
         except Exception:
             logger.exception("Error in extracting tool call from response.")
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
     def extract_tool_calls_streaming(
         self,
@@ -322,19 +360,19 @@ def extract_tool_calls_streaming(
             # Check if this is an EOS token after all tool calls are complete
             # Check for tool calls in text even if is_tool_call_started
             # is False (might have been reset after processing all tools)
-            if (delta_token_ids
-                    and self.tool_call_end_token_id not in delta_token_ids):
+            if delta_token_ids and self.tool_call_end_token_id not in delta_token_ids:
                 # Count complete tool calls
                 complete_calls = len(
-                    self.tool_call_complete_regex.findall(current_text))
+                    self.tool_call_complete_regex.findall(current_text)
+                )
 
                 # If we have completed tool calls and populated
                 # prev_tool_call_arr
                 if complete_calls > 0 and len(self.prev_tool_call_arr) > 0:
                     # Check if all tool calls are closed
                     open_calls = current_text.count(
-                        self.tool_call_start_token) - current_text.count(
-                            self.tool_call_end_token)
+                        self.tool_call_start_token
+                    ) - current_text.count(self.tool_call_end_token)
                     if open_calls == 0:
                         # Return empty delta for finish_reason processing
                         return DeltaMessage(content="")
@@ -370,20 +408,25 @@ def extract_tool_calls_streaming(
         # Handle normal content before tool calls
         if not self.is_tool_call_started:
             # Check if tool call is starting
-            if (self.tool_call_start_token_id in delta_token_ids
-                    or self.tool_call_start_token in delta_text):
+            if (
+                self.tool_call_start_token_id in delta_token_ids
+                or self.tool_call_start_token in delta_text
+            ):
                 self.is_tool_call_started = True
                 # Return any content before the tool call
                 if self.tool_call_start_token in delta_text:
-                    content_before = delta_text[:delta_text.index(
-                        self.tool_call_start_token)]
+                    content_before = delta_text[
+                        : delta_text.index(self.tool_call_start_token)
+                    ]
                     if content_before:
                         return DeltaMessage(content=content_before)
                 return None
             else:
                 # Check if we're between tool calls - skip whitespace
-                if (current_text.rstrip().endswith(self.tool_call_end_token)
-                        and delta_text.strip() == ""):
+                if (
+                    current_text.rstrip().endswith(self.tool_call_end_token)
+                    and delta_text.strip() == ""
+                ):
                     # We just ended a tool call, skip whitespace
                     return None
                 # Normal content, no tool call
@@ -413,19 +456,20 @@ def extract_tool_calls_streaming(
 
         tool_start_idx = tool_start_positions[self.current_tool_index]
         # Find where this tool call ends (or current position if not ended yet)
-        tool_end_idx = current_text.find(self.tool_call_end_token,
-                                         tool_start_idx)
+        tool_end_idx = current_text.find(self.tool_call_end_token, tool_start_idx)
         if tool_end_idx == -1:
             tool_text = current_text[tool_start_idx:]
         else:
-            tool_text = current_text[tool_start_idx:tool_end_idx +
-                                     len(self.tool_call_end_token)]
+            tool_text = current_text[
+                tool_start_idx : tool_end_idx + len(self.tool_call_end_token)
+            ]
 
         # Looking for function header
         if not self.header_sent:
             if self.tool_call_prefix in tool_text:
                 func_start = tool_text.find(self.tool_call_prefix) + len(
-                    self.tool_call_prefix)
+                    self.tool_call_prefix
+                )
                 func_end = tool_text.find(">", func_start)
 
                 if func_end != -1:
@@ -440,38 +484,44 @@ def extract_tool_calls_streaming(
                     # finish_reason="tool_calls" even if parsing isn't complete
                     already_added = any(
                         tool.get("name") == self.current_function_name
-                        for tool in self.prev_tool_call_arr)
+                        for tool in self.prev_tool_call_arr
+                    )
                     if not already_added:
-                        self.prev_tool_call_arr.append({
-                            "name": self.current_function_name,
-                            "arguments":
-                            "{}",  # Placeholder, will be updated later
-                        })
+                        self.prev_tool_call_arr.append(
+                            {
+                                "name": self.current_function_name,
+                                "arguments": "{}",  # Placeholder, will be updated later
+                            }
+                        )
 
                     # Send header with function info
-                    return DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=self.current_tool_index,
-                            id=self.current_tool_id,
-                            function=DeltaFunctionCall(
-                                name=self.current_function_name, arguments=""),
-                            type="function",
-                        )
-                    ])
+                    return DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_index,
+                                id=self.current_tool_id,
+                                function=DeltaFunctionCall(
+                                    name=self.current_function_name, arguments=""
+                                ),
+                                type="function",
+                            )
+                        ]
+                    )
             return None
 
         # We've sent header, now handle function body
         if self.in_function:
             # Send opening brace if not sent yet
-            if (not self.json_started
-                    and self.parameter_prefix not in delta_text):
+            if not self.json_started and self.parameter_prefix not in delta_text:
                 self.json_started = True
-                return DeltaMessage(tool_calls=[
-                    DeltaToolCall(
-                        index=self.current_tool_index,
-                        function=DeltaFunctionCall(arguments="{"),
-                    )
-                ])
+                return DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=self.current_tool_index,
+                            function=DeltaFunctionCall(arguments="{"),
+                        )
+                    ]
+                )
 
             # Make sure json_started is set if we're processing parameters
             if not self.json_started:
@@ -486,35 +536,38 @@ def extract_tool_calls_streaming(
                 # prev_tool_call_arr with final arguments
                 # Find the function content
                 func_start = tool_text.find(self.tool_call_prefix) + len(
-                    self.tool_call_prefix)
-                func_content_end = tool_text.find(self.function_end_token,
-                                                  func_start)
+                    self.tool_call_prefix
+                )
+                func_content_end = tool_text.find(self.function_end_token, func_start)
                 if func_content_end != -1:
                     func_content = tool_text[func_start:func_content_end]
                     # Parse to get the complete arguments
                     try:
                         parsed_tool = self._parse_xml_function_call(
-                            func_content, self.streaming_request.tools
-                            if self.streaming_request else None)
+                            func_content,
+                            self.streaming_request.tools
+                            if self.streaming_request
+                            else None,
+                        )
                         if parsed_tool:
                             # Update existing entry in
                             # prev_tool_call_arr with complete args
                             for i, tool in enumerate(self.prev_tool_call_arr):
-                                if tool.get(
-                                        "name") == parsed_tool.function.name:
+                                if tool.get("name") == parsed_tool.function.name:
                                     args = parsed_tool.function.arguments
-                                    self.prev_tool_call_arr[i][
-                                        "arguments"] = args
+                                    self.prev_tool_call_arr[i]["arguments"] = args
                                     break
                     except Exception:
                         pass  # Ignore parsing errors during streaming
 
-                result = DeltaMessage(tool_calls=[
-                    DeltaToolCall(
-                        index=self.current_tool_index,
-                        function=DeltaFunctionCall(arguments="}"),
-                    )
-                ])
+                result = DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=self.current_tool_index,
+                            function=DeltaFunctionCall(arguments="}"),
+                        )
+                    ]
+                )
 
                 # Reset state for next tool
                 self.in_function = False
@@ -535,8 +588,11 @@ def extract_tool_calls_streaming(
                 idx += len(self.parameter_prefix)
 
             # Check if we should start a new parameter
-            if (not self.in_param and self.param_count < len(param_starts)
-                    and len(param_starts) > self.param_count):
+            if (
+                not self.in_param
+                and self.param_count < len(param_starts)
+                and len(param_starts) > self.param_count
+            ):
                 # Process the next parameter
                 param_idx = param_starts[self.param_count]
                 param_start = param_idx + len(self.parameter_prefix)
@@ -561,9 +617,9 @@ def extract_tool_calls_streaming(
                         next_param_idx = value_text.find(self.parameter_prefix)
                         func_end_idx = value_text.find(self.function_end_token)
 
-                        if next_param_idx != -1 and (func_end_idx == -1
-                                                     or next_param_idx
-                                                     < func_end_idx):
+                        if next_param_idx != -1 and (
+                            func_end_idx == -1 or next_param_idx < func_end_idx
+                        ):
                             param_end_idx = next_param_idx
                         elif func_end_idx != -1:
                             param_end_idx = func_end_idx
@@ -585,41 +641,49 @@ def extract_tool_calls_streaming(
                             param_value = param_value[:-1]
 
                         # Store raw value for later processing
-                        self.accumulated_params[
-                            self.current_param_name] = param_value
+                        self.accumulated_params[self.current_param_name] = param_value
 
                         # Get parameter configuration for type conversion
                         param_config = self._get_arguments_config(
                             self.current_function_name or "",
                             self.streaming_request.tools
-                            if self.streaming_request else None)
+                            if self.streaming_request
+                            else None,
+                        )
 
                         # Convert param value to appropriate type
                         converted_value = self._convert_param_value(
-                            param_value, self.current_param_name, param_config,
-                            self.current_function_name or "")
+                            param_value,
+                            self.current_param_name,
+                            param_config,
+                            self.current_function_name or "",
+                        )
 
                         # Build JSON fragment based on the converted type
                         # Use json.dumps to properly serialize the value
-                        serialized_value = json.dumps(converted_value,
-                                                      ensure_ascii=False)
+                        serialized_value = json.dumps(
+                            converted_value, ensure_ascii=False
+                        )
 
                         if self.param_count == 0:
-                            json_fragment = (f'"{self.current_param_name}": '
-                                             f'{serialized_value}')
+                            json_fragment = (
+                                f'"{self.current_param_name}": {serialized_value}'
+                            )
                         else:
-                            json_fragment = (f', "{self.current_param_name}": '
-                                             f'{serialized_value}')
+                            json_fragment = (
+                                f', "{self.current_param_name}": {serialized_value}'
+                            )
 
                         self.param_count += 1
 
-                        return DeltaMessage(tool_calls=[
-                            DeltaToolCall(
-                                index=self.current_tool_index,
-                                function=DeltaFunctionCall(
-                                    arguments=json_fragment),
-                            )
-                        ])
+                        return DeltaMessage(
+                            tool_calls=[
+                                DeltaToolCall(
+                                    index=self.current_tool_index,
+                                    function=DeltaFunctionCall(arguments=json_fragment),
+                                )
+                            ]
+                        )
 
             # Continue parameter value - Not used in the current implementation
             # since we process complete parameters above
@@ -632,31 +696,33 @@ def extract_tool_calls_streaming(
                     # Skip past > if at start
                     if not self.current_param_value and ">" in value_chunk:
                         gt_idx = value_chunk.find(">")
-                        value_chunk = value_chunk[gt_idx + 1:]
+                        value_chunk = value_chunk[gt_idx + 1 :]
 
-                    if not self.current_param_value and value_chunk.startswith(
-                            "\n"):
+                    if not self.current_param_value and value_chunk.startswith("\n"):
                         value_chunk = value_chunk[1:]
 
                     # Store complete value
                     full_value = self.current_param_value + value_chunk
-                    self.accumulated_params[
-                        self.current_param_name] = full_value
+                    self.accumulated_params[self.current_param_name] = full_value
 
                     # Get parameter configuration for type conversion
                     param_config = self._get_arguments_config(
                         self.current_function_name or "",
                         self.streaming_request.tools
-                        if self.streaming_request else None)
+                        if self.streaming_request
+                        else None,
+                    )
 
                     # Convert the parameter value to the appropriate type
                     converted_value = self._convert_param_value(
-                        full_value, self.current_param_name or "",
-                        param_config, self.current_function_name or "")
+                        full_value,
+                        self.current_param_name or "",
+                        param_config,
+                        self.current_function_name or "",
+                    )
 
                     # Serialize the converted value
-                    serialized_value = json.dumps(converted_value,
-                                                  ensure_ascii=False)
+                    serialized_value = json.dumps(converted_value, ensure_ascii=False)
 
                     # Since we've been streaming the quoted version,
                     # we need to close it properly
@@ -665,13 +731,16 @@ def extract_tool_calls_streaming(
                     self.current_param_value = ""
 
                     # Just close the current parameter string
-                    return DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=self.current_tool_index,
-                            function=DeltaFunctionCall(
-                                arguments='"'),  # Close the string quote
-                        )
-                    ])
+                    return DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_index,
+                                function=DeltaFunctionCall(
+                                    arguments='"'
+                                ),  # Close the string quote
+                            )
+                        ]
+                    )
                 else:
                     # Continue accumulating value
                     value_chunk = delta_text
@@ -679,29 +748,36 @@ def extract_tool_calls_streaming(
                     # Handle first chunk after param name
                     if not self.current_param_value and ">" in value_chunk:
                         gt_idx = value_chunk.find(">")
-                        value_chunk = value_chunk[gt_idx + 1:]
+                        value_chunk = value_chunk[gt_idx + 1 :]
 
-                    if not self.current_param_value and value_chunk.startswith(
-                            "\n"):
+                    if not self.current_param_value and value_chunk.startswith("\n"):
                         value_chunk = value_chunk[1:]
 
                     if value_chunk:
                         # Stream the escaped delta
-                        prev_escaped = json.dumps(
-                            self.current_param_value, ensure_ascii=False
-                        )[1:-1] if self.current_param_value else ""
+                        prev_escaped = (
+                            json.dumps(self.current_param_value, ensure_ascii=False)[
+                                1:-1
+                            ]
+                            if self.current_param_value
+                            else ""
+                        )
                         self.current_param_value += value_chunk
-                        full_escaped = json.dumps(self.current_param_value,
-                                                  ensure_ascii=False)[1:-1]
-                        delta_escaped = full_escaped[len(prev_escaped):]
+                        full_escaped = json.dumps(
+                            self.current_param_value, ensure_ascii=False
+                        )[1:-1]
+                        delta_escaped = full_escaped[len(prev_escaped) :]
 
                         if delta_escaped:
-                            return DeltaMessage(tool_calls=[
-                                DeltaToolCall(
-                                    index=self.current_tool_index,
-                                    function=DeltaFunctionCall(
-                                        arguments=delta_escaped),
-                                )
-                            ])
+                            return DeltaMessage(
+                                tool_calls=[
+                                    DeltaToolCall(
+                                        index=self.current_tool_index,
+                                        function=DeltaFunctionCall(
+                                            arguments=delta_escaped
+                                        ),
+                                    )
+                                ]
+                            )
 
-        return None
\ No newline at end of file
+        return None
diff --git a/vllm/entrypoints/openai/tool_parsers/qwen3xml_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/qwen3xml_tool_parser.py
index 4ab67dfea104..1b7e4fec316e 100644
--- a/vllm/entrypoints/openai/tool_parsers/qwen3xml_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/qwen3xml_tool_parser.py
@@ -9,14 +9,20 @@
 
 import regex as re
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              ChatCompletionToolsParam,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    ChatCompletionToolsParam,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
+    ToolParser,
+    ToolParserManager,
+)
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
@@ -34,12 +40,12 @@ def __init__(self):
 
         # Tool configuration information
         self.tools: Union[list[ChatCompletionToolsParam], None] = None
-        self.tool_call_start_token: str = '<tool_call>'
-        self.tool_call_end_token: str = '</tool_call>'
-        self.function_start_token: str = '<function='
-        self.function_end_token: str = '</function>'
-        self.parameter_start_token: str = '<parameter='
-        self.parameter_end_token: str = '</parameter>'
+        self.tool_call_start_token: str = "<tool_call>"
+        self.tool_call_end_token: str = "</tool_call>"
+        self.function_start_token: str = "<function="
+        self.function_end_token: str = "</function>"
+        self.parameter_start_token: str = "<parameter="
+        self.parameter_end_token: str = "</parameter>"
 
     def reset_streaming_state(self):
         """Reset streaming parsing state"""
@@ -53,16 +59,16 @@ def reset_streaming_state(self):
         self.current_function_open = False
         self.parameters = {}
         self.current_param_name = None
-        self.current_param_value = ''
-        self.current_param_value_converted = ''
+        self.current_param_value = ""
+        self.current_param_value_converted = ""
         self.current_param_is_first = False
         self.should_emit_end_newline = False
         self.start_quote_emitted = False
 
-        self.streaming_buffer = ''
+        self.streaming_buffer = ""
         self.last_processed_pos = 0
 
-        self.text_content_buffer = ''
+        self.text_content_buffer = ""
 
         # state for preprocessing and deferred parsing
         self._pre_inside_parameter = False
@@ -78,13 +84,13 @@ def reset_streaming_state(self):
     def parse_single_streaming_chunks(self, xml_chunk: str) -> DeltaMessage:
         """
         Parse single streaming XML chunk and return Delta response
-        This is the actual streaming interface that receives chunks 
+        This is the actual streaming interface that receives chunks
         one by one and maintains internal state
 
         Args:
             xml_chunk: Single XML chunk string
         Returns:
-            DeltaMessage: Contains delta information generated by this chunk, 
+            DeltaMessage: Contains delta information generated by this chunk,
             returns empty response if no complete elements
         """
         # Record delta count before processing
@@ -101,42 +107,67 @@ def parse_single_streaming_chunks(self, xml_chunk: str) -> DeltaMessage:
                 new_deltas = self.deltas[initial_delta_count:]
                 # If this chunk contains </function>
                 # but didn't generate '}', then complete it
-                if (self.current_call_id is not None
-                        and self.function_end_token in xml_chunk):
-
+                if (
+                    self.current_call_id is not None
+                    and self.function_end_token in xml_chunk
+                ):
                     # - Added '}' (non-empty parameter ending)
                     # - Added '{}' (empty parameter function)
-                    has_function_close = any((td.tool_calls and any(
-                        (tc.function and tc.id == self.current_call_id
-                         and isinstance(tc.function.arguments, str) and
-                         (tc.function.arguments in ('}', '{}')))
-                        for tc in td.tool_calls)) for td in new_deltas)
+                    has_function_close = any(
+                        (
+                            td.tool_calls
+                            and any(
+                                (
+                                    tc.function
+                                    and tc.id == self.current_call_id
+                                    and isinstance(tc.function.arguments, str)
+                                    and (tc.function.arguments in ("}", "{}"))
+                                )
+                                for tc in td.tool_calls
+                            )
+                        )
+                        for td in new_deltas
+                    )
                     if not has_function_close:
                         # Close potentially unclosed element
                         if self.current_param_name:
-                            self._end_element('parameter')
+                            self._end_element("parameter")
                         if self.current_function_name:
-                            self._end_element('function')
+                            self._end_element("function")
                 # If this chunk contains </tool_call>
                 # but didn't generate final empty delta, then complete it
-                if (self.current_call_id is not None
-                        and self.tool_call_end_token in xml_chunk):
-                    has_toolcall_close = any((td.tool_calls and any(
-                        (tc.type == 'function' and tc.function and tc.function.
-                         arguments == '' and tc.id == self.current_call_id)
-                        for tc in td.tool_calls)) for td in new_deltas)
+                if (
+                    self.current_call_id is not None
+                    and self.tool_call_end_token in xml_chunk
+                ):
+                    has_toolcall_close = any(
+                        (
+                            td.tool_calls
+                            and any(
+                                (
+                                    tc.type == "function"
+                                    and tc.function
+                                    and tc.function.arguments == ""
+                                    and tc.id == self.current_call_id
+                                )
+                                for tc in td.tool_calls
+                            )
+                        )
+                        for td in new_deltas
+                    )
                     if not has_toolcall_close:
                         # Close potentially unclosed element
                         if self.current_param_name:
-                            self._end_element('parameter')
+                            self._end_element("parameter")
                         if self.current_function_name:
-                            self._end_element('function')
-                        self._end_element('tool_call')
+                            self._end_element("function")
+                        self._end_element("tool_call")
             except Exception as e:
                 logger.warning("Error with fallback parsing: %s", e)
             # Merge newly generated deltas into single response
             result_delta = self._merge_new_deltas_to_single_response(
-                initial_delta_count)
+                initial_delta_count
+            )
             return result_delta
         else:
             # No complete elements, check if there's unoutput text content
@@ -145,7 +176,7 @@ def parse_single_streaming_chunks(self, xml_chunk: str) -> DeltaMessage:
                 text_delta = DeltaMessage(content=self.text_content_buffer)
                 self._emit_delta(text_delta)
                 # Clear buffer to avoid duplicate output
-                self.text_content_buffer = ''
+                self.text_content_buffer = ""
                 return text_delta
 
             # If this chunk contains end tags but wasn't triggered by parser,
@@ -153,20 +184,21 @@ def parse_single_streaming_chunks(self, xml_chunk: str) -> DeltaMessage:
             # Only execute when still on the same call as when entered,
             # to prevent accidentally closing new calls
             # in multi <tool_call> scenarios
-            if (self.current_call_id is not None
-                    and (self.function_end_token in xml_chunk
-                         or self.tool_call_end_token in xml_chunk)):
+            if self.current_call_id is not None and (
+                self.function_end_token in xml_chunk
+                or self.tool_call_end_token in xml_chunk
+            ):
                 # Close potentially unclosed element
                 if self.current_param_name:
-                    self._end_element('parameter')
-                if self.function_end_token in xml_chunk and \
-                    self.current_function_name:
-                    self._end_element('function')
+                    self._end_element("parameter")
+                if self.function_end_token in xml_chunk and self.current_function_name:
+                    self._end_element("function")
                 if self.tool_call_end_token in xml_chunk:
-                    self._end_element('tool_call')
+                    self._end_element("tool_call")
                 # Return the merged delta result generated by this fallback
                 result_delta = self._merge_new_deltas_to_single_response(
-                    initial_delta_count)
+                    initial_delta_count
+                )
                 return result_delta
 
             # No complete elements, return empty response
@@ -181,11 +213,11 @@ def _escape_xml_special_chars(self, text: str) -> str:
             Escaped text
         """
         xml_escapes = {
-            '&': '&amp;',
-            '<': '&lt;',
-            '>': '&gt;',
-            '"': '&quot;',
-            "'": '&apos;'
+            "&": "&amp;",
+            "<": "&lt;",
+            ">": "&gt;",
+            '"': "&quot;",
+            "'": "&apos;",
         }
 
         for char, escape in xml_escapes.items():
@@ -204,8 +236,7 @@ def _process_complete_xml_elements(self) -> bool:
 
         while self.last_processed_pos < len(self.streaming_buffer):
             # Find next complete xml element
-            element, end_pos = self._find_next_complete_element(
-                self.last_processed_pos)
+            element, end_pos = self._find_next_complete_element(self.last_processed_pos)
             if element is None:
                 # No complete element found, wait for more data
                 break
@@ -219,38 +250,46 @@ def _process_complete_xml_elements(self) -> bool:
             try:
                 preprocessed_element = self._preprocess_xml_chunk(element)
                 # Check if this is the first tool_call start
-                if ((preprocessed_element.strip().startswith('<tool_call>') or
-                     preprocessed_element.strip().startswith('<function name=')
-                     ) and self.tool_call_index
-                        == 0) and self.text_content_buffer:
+                if (
+                    (
+                        preprocessed_element.strip().startswith("<tool_call>")
+                        or preprocessed_element.strip().startswith("<function name=")
+                    )
+                    and self.tool_call_index == 0
+                ) and self.text_content_buffer:
                     # First tool_call starts,
                     # output previously collected text content first
                     text_delta = DeltaMessage(content=self.text_content_buffer)
                     self._emit_delta(text_delta)
                     # Clear buffer for potential subsequent text content
-                    self.text_content_buffer = ''
+                    self.text_content_buffer = ""
 
                 # If a new tool_call starts and
                 # there are already completed tool_calls
-                if (preprocessed_element.strip().startswith('<tool_call>')
-                        and self.tool_call_index > 0 and self.current_call_id):
+                if (
+                    preprocessed_element.strip().startswith("<tool_call>")
+                    and self.tool_call_index > 0
+                    and self.current_call_id
+                ):
                     # Reset parser state but preserve generated deltas
                     if self.current_param_name:
-                        self._end_element('parameter')
+                        self._end_element("parameter")
                     if self.current_function_open or self.current_function_name:
-                        self._end_element('function')
+                        self._end_element("function")
                     # Output final tool_call tail delta
                     final_delta = DeltaMessage(
                         role=None,
                         content=None,
                         reasoning_content=None,
                         tool_calls=[
-                            DeltaToolCall(index=self.tool_call_index - 1,
-                                          id=self.current_call_id,
-                                          type='function',
-                                          function=DeltaFunctionCall(
-                                              name=None, arguments=''))
-                        ])
+                            DeltaToolCall(
+                                index=self.tool_call_index - 1,
+                                id=self.current_call_id,
+                                type="function",
+                                function=DeltaFunctionCall(name=None, arguments=""),
+                            )
+                        ],
+                    )
                     self._emit_delta(final_delta)
                     # Reset XML parser and current call state
                     self._reset_xml_parser_after_tool_call()
@@ -278,10 +317,11 @@ def _should_skip_element(self, element: str) -> bool:
         """
 
         # If it's a tool_call XML tag, don't skip
-        if element.startswith(
-                self.tool_call_start_token) or element.startswith(
-                    self.function_start_token) or element.startswith(
-                        self.parameter_start_token):
+        if (
+            element.startswith(self.tool_call_start_token)
+            or element.startswith(self.function_start_token)
+            or element.startswith(self.parameter_start_token)
+        ):
             return False
 
         # If currently not parsing tool calls and not blank,
@@ -301,8 +341,7 @@ def _should_skip_element(self, element: str) -> bool:
         # Skip blank content
         return not element
 
-    def _find_next_complete_element(
-            self, start_pos: int) -> tuple[Optional[str], int]:
+    def _find_next_complete_element(self, start_pos: int) -> tuple[Optional[str], int]:
         """
         Find next complete XML element from specified position
 
@@ -310,7 +349,7 @@ def _find_next_complete_element(
             start_pos: Position to start searching
 
         Returns:
-            (Complete element string, element end position), 
+            (Complete element string, element end position),
             returns (None, start_pos) if no complete element found
         """
         buffer = self.streaming_buffer[start_pos:]
@@ -318,28 +357,28 @@ def _find_next_complete_element(
         if not buffer:
             return None, start_pos
 
-        if buffer.startswith('<'):
+        if buffer.startswith("<"):
             # Need to ensure no new < appears,
             # find the nearest one between < and >
-            tag_end = buffer.find('<', 1)
-            tag_end2 = buffer.find('>', 1)
+            tag_end = buffer.find("<", 1)
+            tag_end2 = buffer.find(">", 1)
             if tag_end != -1 and tag_end2 != -1:
                 # Next nearest is <
                 if tag_end < tag_end2:
                     return buffer[:tag_end], start_pos + tag_end
                 # Next nearest is >, means found XML element
                 else:
-                    return buffer[:tag_end2 + 1], start_pos + tag_end2 + 1
+                    return buffer[: tag_end2 + 1], start_pos + tag_end2 + 1
             elif tag_end != -1:
                 return buffer[:tag_end], start_pos + tag_end
             elif tag_end2 != -1:
-                return buffer[:tag_end2 + 1], start_pos + tag_end2 + 1
+                return buffer[: tag_end2 + 1], start_pos + tag_end2 + 1
             else:
                 # If currently not parsing tool calls (entering a tool_call),
                 # check if starts with <tool_call>
                 if self.current_call_id is None:
                     # Check if might be start of <tool_call>
-                    if buffer == '<tool_call>'[:len(buffer)]:
+                    if buffer == "<tool_call>"[: len(buffer)]:
                         # Might be start of <tool_call>, wait for more data
                         return None, start_pos
                     else:
@@ -351,7 +390,7 @@ def _find_next_complete_element(
                     return None, start_pos
         else:
             # Find text content (until next < or buffer end)
-            next_tag_pos = buffer.find('<')
+            next_tag_pos = buffer.find("<")
             if next_tag_pos != -1:
                 # Found text content
                 text_content = buffer[:next_tag_pos]
@@ -362,8 +401,7 @@ def _find_next_complete_element(
                 remaining = buffer
                 return remaining, start_pos + len(remaining)
 
-    def _merge_new_deltas_to_single_response(
-            self, initial_count: int) -> DeltaMessage:
+    def _merge_new_deltas_to_single_response(self, initial_count: int) -> DeltaMessage:
         """
         Merge newly generated deltas from this processing
         into a single DeltaMessage
@@ -386,7 +424,7 @@ def _merge_new_deltas_to_single_response(
 
         # Merge multiple new deltas
         merged_tool_calls: list[DeltaToolCall] = []
-        merged_content: str = ''
+        merged_content: str = ""
 
         for delta in new_deltas:
             if delta.content:
@@ -404,12 +442,13 @@ def _merge_new_deltas_to_single_response(
                     if existing_call and existing_call.function:
                         # Merge to existing tool_call
                         if tool_call.function and tool_call.function.name:
-                            existing_call.function.name = \
-                                tool_call.function.name
-                        if tool_call.function \
-                            and tool_call.function.arguments is not None:
+                            existing_call.function.name = tool_call.function.name
+                        if (
+                            tool_call.function
+                            and tool_call.function.arguments is not None
+                        ):
                             if existing_call.function.arguments is None:
-                                existing_call.function.arguments = ''
+                                existing_call.function.arguments = ""
 
                             # For streaming JSON parameters,
                             # simply concatenate in order
@@ -421,12 +460,14 @@ def _merge_new_deltas_to_single_response(
                         # Add new tool_call
                         merged_tool_calls.append(tool_call)
 
-        return DeltaMessage(content=merged_content if merged_content else None,
-                            tool_calls=merged_tool_calls)
+        return DeltaMessage(
+            content=merged_content if merged_content else None,
+            tool_calls=merged_tool_calls,
+        )
 
     def _preprocess_xml_chunk(self, chunk: str) -> str:
         """
-        Preprocess XML chunk, handle non-standard formats, 
+        Preprocess XML chunk, handle non-standard formats,
         and escape special characters
 
         Args:
@@ -439,27 +480,28 @@ def _preprocess_xml_chunk(self, chunk: str) -> str:
         # Check if this is a tool_call related element
         is_tool_call = False
         if chunk.startswith(self.tool_call_start_token) or chunk.startswith(
-                self.tool_call_end_token):
+            self.tool_call_end_token
+        ):
             is_tool_call = True
         if chunk.startswith(self.function_start_token) or chunk.startswith(
-                self.function_end_token):
+            self.function_end_token
+        ):
             is_tool_call = True
         if chunk.startswith(self.parameter_start_token) or chunk.startswith(
-                self.parameter_end_token):
+            self.parameter_end_token
+        ):
             is_tool_call = True
         # Handle <function=name> format -> <function name="name">
-        processed = re.sub(r'<function=([^>]+)>', r'<function name="\1">',
-                           chunk)
+        processed = re.sub(r"<function=([^>]+)>", r'<function name="\1">', chunk)
         # Handle <parameter=name> format -> <parameter name="name">
-        processed = re.sub(r'<parameter=([^>]+)>', r'<parameter name="\1">',
-                           processed)
+        processed = re.sub(r"<parameter=([^>]+)>", r'<parameter name="\1">', processed)
 
         original_chunk = chunk
         # If in parameter value accumulation mode
         if self._pre_inside_parameter:
             # Parameter end: output accumulated raw text
             # safely then return </parameter>
-            if processed.startswith('</parameter>'):
+            if processed.startswith("</parameter>"):
                 body_text = self._pre_param_buffer
                 # Trigger deferred parsing mode
                 # literal_eval+json output in end_element
@@ -478,29 +520,38 @@ def _preprocess_xml_chunk(self, chunk: str) -> str:
                 # and pass through directly
                 if self._pre_param_buffer == "":
                     # Get current parameter type
-                    param_type = self._get_param_type(
-                        self._pre_current_param_name
-                    ) if self._pre_current_param_name else 'string'
+                    param_type = (
+                        self._get_param_type(self._pre_current_param_name)
+                        if self._pre_current_param_name
+                        else "string"
+                    )
                     # Only these types need deferred parsing to
                     # handle Python literals containing single quotes
                     is_object_type = param_type in ["object"]
-                    is_complex_type = (param_type
-                                       in ["array", "arr", "sequence"]
-                                       or param_type.startswith("dict")
-                                       or param_type.startswith("list"))
+                    is_complex_type = (
+                        param_type in ["array", "arr", "sequence"]
+                        or param_type.startswith("dict")
+                        or param_type.startswith("list")
+                    )
 
                     # Only delay when contains container symbols
                     # and has single quotes and is complex type
-                    has_container_hint = ('[' in original_chunk) or (
-                        '{' in original_chunk) or ('(' in original_chunk)
+                    has_container_hint = (
+                        ("[" in original_chunk)
+                        or ("{" in original_chunk)
+                        or ("(" in original_chunk)
+                    )
 
                     # Determine if deferred parsing is needed
                     need_defer = False
                     if is_complex_type:
                         # Complex type, always need deferred parsing
                         need_defer = True
-                    elif is_object_type and has_container_hint and (
-                            "'" in original_chunk):
+                    elif (
+                        is_object_type
+                        and has_container_hint
+                        and ("'" in original_chunk)
+                    ):
                         # Object type with container symbols
                         # and single quotes, need deferred parsing
                         need_defer = True
@@ -514,7 +565,7 @@ def _preprocess_xml_chunk(self, chunk: str) -> str:
                 return ""
 
         # Parameter start: enable accumulation
-        if processed.startswith('<parameter name='):
+        if processed.startswith("<parameter name="):
             m = re.match(r'<parameter name="([^"]+)">', processed)
             if m:
                 self._pre_current_param_name = m.group(1)
@@ -533,76 +584,78 @@ def _emit_delta(self, delta: DeltaMessage):
         """Emit Delta response (streaming output)"""
         self.deltas.append(delta)
 
-    def _auto_close_open_parameter_if_needed(self,
-                                             incoming_tag: Optional[str] = None
-                                             ):
-        """Before starting to process new elements, 
-        if there are unclosed tags from before, 
+    def _auto_close_open_parameter_if_needed(self, incoming_tag: Optional[str] = None):
+        """Before starting to process new elements,
+        if there are unclosed tags from before,
         automatically complete their endings to the parser.
-        - If there are unclosed parameters, 
+        - If there are unclosed parameters,
         it's equivalent to feeding `</parameter>`
-        - When about to start a new function or tool_call, 
+        - When about to start a new function or tool_call,
         if there are unclosed functions, complete `</function>`.
-        - When about to start a new tool_call, 
+        - When about to start a new tool_call,
         if there are unclosed tool_calls, complete `</tool_call>`.
         """
         # First close unclosed parameters
         if self.current_param_name:
-            self._end_element('parameter')
+            self._end_element("parameter")
 
         # If about to start new function or tool_call,
         # and there are unclosed functions, close function first
-        if incoming_tag in ('function',
-                            'tool_call') and self.current_function_name:
-            self._end_element('function')
+        if incoming_tag in ("function", "tool_call") and self.current_function_name:
+            self._end_element("function")
 
         # If about to start new tool_call,
         # and there are unclosed tool_calls, close tool_call first
-        if incoming_tag == 'tool_call' and self.current_call_id:
-            self._end_element('tool_call')
+        if incoming_tag == "tool_call" and self.current_call_id:
+            self._end_element("tool_call")
 
     def _start_element(self, name: str, attrs: dict[str, str]):
         """Handle XML start element events"""
 
-        if name == 'root':
+        if name == "root":
             return
 
-        if name == 'tool_call':
+        if name == "tool_call":
             # Before opening new tool_call,
             # automatically complete previous unclosed tags
-            self._auto_close_open_parameter_if_needed('tool_call')
+            self._auto_close_open_parameter_if_needed("tool_call")
 
             self.parameters = {}
             self.current_call_id = self._get_next_call_id()
             self.current_param_is_first = True
             self.tool_call_index += 1
-        elif name.startswith('function') or (name == 'function'):
+        elif name.startswith("function") or (name == "function"):
             # If missing tool_call, manually complete
             if not self.current_call_id:
-                self._start_element('tool_call', {})
+                self._start_element("tool_call", {})
             # Before opening new function,
             # automatically complete previous unclosed tags (parameter/function)
-            self._auto_close_open_parameter_if_needed('function')
+            self._auto_close_open_parameter_if_needed("function")
             function_name = self._extract_function_name(name, attrs)
             self.current_function_name = function_name
             self.current_function_open = True
             if function_name:
-                delta = DeltaMessage(tool_calls=[
-                    DeltaToolCall(index=self.tool_call_index - 1,
-                                  id=self.current_call_id,
-                                  type='function',
-                                  function=DeltaFunctionCall(
-                                      name=function_name, arguments=''))
-                ])
+                delta = DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=self.tool_call_index - 1,
+                            id=self.current_call_id,
+                            type="function",
+                            function=DeltaFunctionCall(
+                                name=function_name, arguments=""
+                            ),
+                        )
+                    ]
+                )
                 self._emit_delta(delta)
-        elif name.startswith('parameter') or (name == 'parameter'):
+        elif name.startswith("parameter") or (name == "parameter"):
             # If previous parameter hasn't ended normally,
             # complete its end first, then start new parameter
-            self._auto_close_open_parameter_if_needed('parameter')
+            self._auto_close_open_parameter_if_needed("parameter")
             param_name = self._extract_parameter_name(name, attrs)
             self.current_param_name = param_name
-            self.current_param_value = ''
-            self.current_param_value_converted = ''
+            self.current_param_value = ""
+            self.current_param_value_converted = ""
             self.start_quote_emitted = False  # Reset start quote flag
 
             # Only output parameter name and colon,
@@ -613,26 +666,36 @@ def _start_element(self, name: str, attrs: dict[str, str]):
                     # First parameter
                     # start JSON, only output parameter name and colon
                     json_start = f'{{"{param_name}": '
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.tool_call_index - 1,
-                                      id=self.current_call_id,
-                                      type='function',
-                                      function=DeltaFunctionCall(
-                                          name=None, arguments=json_start))
-                    ])
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.tool_call_index - 1,
+                                id=self.current_call_id,
+                                type="function",
+                                function=DeltaFunctionCall(
+                                    name=None, arguments=json_start
+                                ),
+                            )
+                        ]
+                    )
                     self._emit_delta(delta)
                     self.current_param_is_first = True
                 else:
                     # Subsequent parameters
                     # add comma and parameter name, no quotes
                     json_continue = f', "{param_name}": '
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.tool_call_index - 1,
-                                      id=self.current_call_id,
-                                      type='function',
-                                      function=DeltaFunctionCall(
-                                          name=None, arguments=json_continue))
-                    ])
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.tool_call_index - 1,
+                                id=self.current_call_id,
+                                type="function",
+                                function=DeltaFunctionCall(
+                                    name=None, arguments=json_continue
+                                ),
+                            )
+                        ]
+                    )
                     self._emit_delta(delta)
                     self.current_param_is_first = False
 
@@ -644,9 +707,9 @@ def _char_data(self, data: str):
             if self.defer_current_parameter:
                 original_data = data
                 if self.should_emit_end_newline:
-                    original_data = '\n' + original_data
+                    original_data = "\n" + original_data
                     self.should_emit_end_newline = False
-                if original_data.endswith('\n'):
+                if original_data.endswith("\n"):
                     self.should_emit_end_newline = True
                     original_data = original_data[:-1]
                 self.current_param_value += original_data
@@ -656,20 +719,24 @@ def _char_data(self, data: str):
 
             # Check if this is the first time receiving data for this parameter
             # If this is the first packet of data and starts with \n, remove \n
-            if not self.current_param_value and data.startswith('\n'):
+            if not self.current_param_value and data.startswith("\n"):
                 data = data[1:]
 
             # Output start quote for string type (if not already output)
-            if (param_type
-                    in ['string', 'str', 'text', 'varchar', 'char', 'enum']
-                    and not self.start_quote_emitted):
-                quote_delta = DeltaMessage(tool_calls=[
-                    DeltaToolCall(index=self.tool_call_index - 1,
-                                  id=self.current_call_id,
-                                  type='function',
-                                  function=DeltaFunctionCall(name=None,
-                                                             arguments='"'))
-                ])
+            if (
+                param_type in ["string", "str", "text", "varchar", "char", "enum"]
+                and not self.start_quote_emitted
+            ):
+                quote_delta = DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=self.tool_call_index - 1,
+                            id=self.current_call_id,
+                            type="function",
+                            function=DeltaFunctionCall(name=None, arguments='"'),
+                        )
+                    ]
+                )
                 self._emit_delta(quote_delta)
                 self.start_quote_emitted = True
 
@@ -679,45 +746,50 @@ def _char_data(self, data: str):
             original_data = data
             # Delay output of trailing newline
             if self.should_emit_end_newline:
-                original_data = '\n' + original_data
+                original_data = "\n" + original_data
                 self.should_emit_end_newline = False
-            if original_data.endswith('\n'):
+            if original_data.endswith("\n"):
                 self.should_emit_end_newline = True
                 original_data = original_data[:-1]
             self.current_param_value += original_data
 
             # convert parameter value by param_type
             converted_value = self._convert_param_value(
-                self.current_param_value, param_type)
-            output_data = self._convert_for_json_streaming(
-                converted_value, param_type)
+                self.current_param_value, param_type
+            )
+            output_data = self._convert_for_json_streaming(converted_value, param_type)
 
-            delta_data = output_data[len(self.current_param_value_converted):]
+            delta_data = output_data[len(self.current_param_value_converted) :]
             self.current_param_value_converted = output_data
 
-            delta = DeltaMessage(tool_calls=[
-                DeltaToolCall(index=self.tool_call_index - 1,
-                              id=self.current_call_id,
-                              type='function',
-                              function=DeltaFunctionCall(name=None,
-                                                         arguments=delta_data))
-            ])
+            delta = DeltaMessage(
+                tool_calls=[
+                    DeltaToolCall(
+                        index=self.tool_call_index - 1,
+                        id=self.current_call_id,
+                        type="function",
+                        function=DeltaFunctionCall(name=None, arguments=delta_data),
+                    )
+                ]
+            )
             self._emit_delta(delta)
 
     def _end_element(self, name: str):
         """Handle XML end element events"""
 
-        if name == 'root':
+        if name == "root":
             return
 
         # If function or tool_call ends and there are still unclosed parameters,
         # complete parameter end first
-        if (name.startswith('function') or name == 'function'
-                or name == 'tool_call') and self.current_param_name:
+        if (
+            name.startswith("function") or name == "function" or name == "tool_call"
+        ) and self.current_param_name:
             self._auto_close_open_parameter_if_needed()
 
-        if (name.startswith('parameter')
-                or name == 'parameter') and self.current_param_name:
+        if (
+            name.startswith("parameter") or name == "parameter"
+        ) and self.current_param_name:
             # End current parameter
             param_name = self.current_param_name
             param_value = self.current_param_value
@@ -726,32 +798,39 @@ def _end_element(self, name: str):
             # perform overall parsing on raw content
             # accumulated in preprocessing stage and output once
             if self.defer_current_parameter:
-                raw_text = self.deferred_param_raw_value \
-                if self.deferred_param_raw_value else param_value
+                raw_text = (
+                    self.deferred_param_raw_value
+                    if self.deferred_param_raw_value
+                    else param_value
+                )
                 parsed_value = None
                 output_arguments = None
                 try:
                     # If previously delayed trailing newline,
                     # add it back before parsing
                     if self.should_emit_end_newline:
-                        raw_for_parse = raw_text + '\n'
+                        raw_for_parse = raw_text + "\n"
                     else:
                         raw_for_parse = raw_text
                     parsed_value = ast.literal_eval(raw_for_parse)
-                    output_arguments = json.dumps(parsed_value,
-                                                  ensure_ascii=False)
+                    output_arguments = json.dumps(parsed_value, ensure_ascii=False)
                 except Exception:
                     # Fallback: output as string as-is
                     output_arguments = json.dumps(raw_text, ensure_ascii=False)
                     parsed_value = raw_text
 
-                delta = DeltaMessage(tool_calls=[
-                    DeltaToolCall(index=self.tool_call_index - 1,
-                                  id=self.current_call_id,
-                                  type='function',
-                                  function=DeltaFunctionCall(
-                                      name=None, arguments=output_arguments))
-                ])
+                delta = DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=self.tool_call_index - 1,
+                            id=self.current_call_id,
+                            type="function",
+                            function=DeltaFunctionCall(
+                                name=None, arguments=output_arguments
+                            ),
+                        )
+                    ]
+                )
                 self._emit_delta(delta)
 
                 # Clean up and store
@@ -768,84 +847,96 @@ def _end_element(self, name: str):
             param_type = self._get_param_type(param_name)
 
             # convert complete parameter value by param_type
-            converted_value = self._convert_param_value(
-                param_value, param_type)
+            converted_value = self._convert_param_value(param_value, param_type)
 
             # Decide whether to add end quote based on parameter type
-            if param_type in [
-                    'string', 'str', 'text', 'varchar', 'char', 'enum'
-            ]:
+            if param_type in ["string", "str", "text", "varchar", "char", "enum"]:
                 # For empty string parameters, need special handling
                 if not param_value and not self.start_quote_emitted:
                     # No start quote output,
                     # directly output complete empty string
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.tool_call_index - 1,
-                                      id=self.current_call_id,
-                                      type='function',
-                                      function=DeltaFunctionCall(
-                                          name=None, arguments='""'))
-                    ])
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.tool_call_index - 1,
+                                id=self.current_call_id,
+                                type="function",
+                                function=DeltaFunctionCall(name=None, arguments='""'),
+                            )
+                        ]
+                    )
                     self._emit_delta(delta)
                 else:
                     # Non-empty parameter value, output end quote
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.tool_call_index - 1,
-                                      id=self.current_call_id,
-                                      type='function',
-                                      function=DeltaFunctionCall(
-                                          name=None, arguments='"'))
-                    ])
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.tool_call_index - 1,
+                                id=self.current_call_id,
+                                type="function",
+                                function=DeltaFunctionCall(name=None, arguments='"'),
+                            )
+                        ]
+                    )
                     self._emit_delta(delta)
 
             self.should_emit_end_newline = False
             # Store converted value
             self.parameters[param_name] = converted_value
             self.current_param_name = None
-            self.current_param_value = ''
-            self.current_param_value_converted = ''
+            self.current_param_value = ""
+            self.current_param_value_converted = ""
             self.start_quote_emitted = False
 
-        elif name.startswith('function') or name == 'function':
+        elif name.startswith("function") or name == "function":
             # if there are parameters, close JSON object
             if self.parameters:
-                delta = DeltaMessage(tool_calls=[
-                    DeltaToolCall(index=self.tool_call_index - 1,
-                                  id=self.current_call_id,
-                                  type='function',
-                                  function=DeltaFunctionCall(name=None,
-                                                             arguments='}'))
-                ])
+                delta = DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=self.tool_call_index - 1,
+                            id=self.current_call_id,
+                            type="function",
+                            function=DeltaFunctionCall(name=None, arguments="}"),
+                        )
+                    ]
+                )
                 self._emit_delta(delta)
             # return empty object
             else:
-                delta = DeltaMessage(tool_calls=[
-                    DeltaToolCall(index=self.tool_call_index - 1,
-                                  id=self.current_call_id,
-                                  type='function',
-                                  function=DeltaFunctionCall(name=None,
-                                                             arguments='{}'))
-                ])
+                delta = DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=self.tool_call_index - 1,
+                            id=self.current_call_id,
+                            type="function",
+                            function=DeltaFunctionCall(name=None, arguments="{}"),
+                        )
+                    ]
+                )
                 self._emit_delta(delta)
             self.current_function_open = False
 
-        elif name == 'tool_call':
+        elif name == "tool_call":
             # Before ending tool_call,
             # ensure function is closed to complete missing right brace
             if self.current_function_open:
                 # If there are still unclosed parameters, close them first
                 if self.current_param_name:
-                    self._end_element('parameter')
+                    self._end_element("parameter")
                 # Close function, ensure output '}' or '{}'
-                self._end_element('function')
+                self._end_element("function")
             # Final Delta
-            delta = DeltaMessage(tool_calls=[
-                DeltaToolCall(index=self.tool_call_index - 1,
-                              id=self.current_call_id,
-                              type='function',
-                              function=DeltaFunctionCall(name=None,
-                                                         arguments=''))
-            ])
+            delta = DeltaMessage(
+                tool_calls=[
+                    DeltaToolCall(
+                        index=self.tool_call_index - 1,
+                        id=self.current_call_id,
+                        type="function",
+                        function=DeltaFunctionCall(name=None, arguments=""),
+                    )
+                ]
+            )
             self._emit_delta(delta)
 
             # Check if there's text content to output (between tool_calls)
@@ -868,30 +959,30 @@ def set_tools(self, tools: Union[list[ChatCompletionToolsParam], None]):
 
     def _get_next_call_id(self):
         """Generate unique call ID"""
-        return f'call_{uuid.uuid4().hex[:24]}'
+        return f"call_{uuid.uuid4().hex[:24]}"
 
-    def _extract_function_name(self, name: str,
-                               attrs: dict[str, str]) -> Optional[str]:
+    def _extract_function_name(self, name: str, attrs: dict[str, str]) -> Optional[str]:
         """Extract function name from various formats"""
-        if attrs and 'name' in attrs:
-            return attrs['name']
+        if attrs and "name" in attrs:
+            return attrs["name"]
 
-        if '=' in name:
-            parts = name.split('=', 1)
-            if len(parts) == 2 and parts[0] == 'function':
+        if "=" in name:
+            parts = name.split("=", 1)
+            if len(parts) == 2 and parts[0] == "function":
                 return parts[1]
 
         return None
 
-    def _extract_parameter_name(self, name: str,
-                                attrs: dict[str, str]) -> Optional[str]:
+    def _extract_parameter_name(
+        self, name: str, attrs: dict[str, str]
+    ) -> Optional[str]:
         """Extract parameter name from various formats"""
-        if attrs and 'name' in attrs:
-            return attrs['name']
+        if attrs and "name" in attrs:
+            return attrs["name"]
 
-        if '=' in name:
-            parts = name.split('=', 1)
-            if len(parts) == 2 and parts[0] == 'parameter':
+        if "=" in name:
+            parts = name.split("=", 1)
+            if len(parts) == 2 and parts[0] == "parameter":
                 return parts[1]
 
         return None
@@ -905,30 +996,36 @@ def _get_param_type(self, param_name: str) -> str:
             Parameter type
         """
         if not self.tools or not self.current_function_name:
-            return 'string'
+            return "string"
 
         for tool in self.tools:
-            if not hasattr(tool, 'type') or not (hasattr(
-                    tool, 'function') and hasattr(tool.function, 'name')):
+            if not hasattr(tool, "type") or not (
+                hasattr(tool, "function") and hasattr(tool.function, "name")
+            ):
                 continue
-            if tool.type == 'function' and \
-                tool.function.name == self.current_function_name:
-                if not hasattr(tool.function, 'parameters'):
-                    return 'string'
+            if (
+                tool.type == "function"
+                and tool.function.name == self.current_function_name
+            ):
+                if not hasattr(tool.function, "parameters"):
+                    return "string"
                 params = tool.function.parameters
-                if isinstance(params, dict) and 'properties' in params:
-                    properties = params['properties']
+                if isinstance(params, dict) and "properties" in params:
+                    properties = params["properties"]
                     if param_name in properties and isinstance(
-                            properties[param_name], dict):
+                        properties[param_name], dict
+                    ):
                         return self.repair_param_type(
-                            str(properties[param_name].get('type', 'string')))
+                            str(properties[param_name].get("type", "string"))
+                        )
                 elif isinstance(params, dict) and param_name in params:
                     param_config = params[param_name]
                     if isinstance(param_config, dict):
                         return self.repair_param_type(
-                            str(param_config.get('type', 'string')))
+                            str(param_config.get("type", "string"))
+                        )
                 break
-        return 'string'
+        return "string"
 
     def repair_param_type(self, param_type: str) -> str:
         """Repair unknown parameter types by treating them as string
@@ -938,21 +1035,25 @@ def repair_param_type(self, param_type: str) -> str:
         Returns:
             Repaired parameter type
         """
-        if param_type in [
-                'string', 'str', 'text', 'varchar', 'char', 'enum'
-        ] or param_type.startswith('int') or param_type.startswith(
-                'uint'
-        ) or param_type.startswith('long') or param_type.startswith(
-                'short'
-        ) or param_type.startswith('unsigned') or param_type.startswith(
-                'num') or param_type.startswith('float') or param_type in [
-                    'boolean', 'bool', 'binary'
-                ] or (param_type in ["object", "array", "arr", "sequence"]
-                      or param_type.startswith("dict")
-                      or param_type.startswith("list")):
+        if (
+            param_type in ["string", "str", "text", "varchar", "char", "enum"]
+            or param_type.startswith("int")
+            or param_type.startswith("uint")
+            or param_type.startswith("long")
+            or param_type.startswith("short")
+            or param_type.startswith("unsigned")
+            or param_type.startswith("num")
+            or param_type.startswith("float")
+            or param_type in ["boolean", "bool", "binary"]
+            or (
+                param_type in ["object", "array", "arr", "sequence"]
+                or param_type.startswith("dict")
+                or param_type.startswith("list")
+            )
+        ):
             return param_type
         else:
-            return 'string'
+            return "string"
 
     def _convert_param_value(self, param_value: str, param_type: str) -> Any:
         """Convert value based on parameter type
@@ -963,42 +1064,51 @@ def _convert_param_value(self, param_value: str, param_type: str) -> Any:
         Returns:
             Converted value
         """
-        if param_value.lower() == 'null':
+        if param_value.lower() == "null":
             return None
 
         param_type = param_type.strip().lower()
-        if param_type in ['string', 'str', 'text', 'varchar', 'char', 'enum']:
+        if param_type in ["string", "str", "text", "varchar", "char", "enum"]:
             return param_value
-        elif (param_type.startswith('int') or param_type.startswith('uint')
-              or param_type.startswith('long')
-              or param_type.startswith('short')
-              or param_type.startswith('unsigned')):
+        elif (
+            param_type.startswith("int")
+            or param_type.startswith("uint")
+            or param_type.startswith("long")
+            or param_type.startswith("short")
+            or param_type.startswith("unsigned")
+        ):
             try:
                 return int(param_value)
             except (ValueError, TypeError):
                 logger.warning(
                     "Parsed value '%s' of parameter '%s' is not an integer "
-                    "in tool '%s', degenerating to string.", param_value)
+                    "in tool '%s', degenerating to string.",
+                    param_value,
+                )
             return param_value
-        elif param_type.startswith('num') or param_type.startswith('float'):
+        elif param_type.startswith("num") or param_type.startswith("float"):
             try:
                 float_param_value: float = float(param_value)
-                return float_param_value if float_param_value - int(
-                    float_param_value) != 0 else int(float_param_value)
+                return (
+                    float_param_value
+                    if float_param_value - int(float_param_value) != 0
+                    else int(float_param_value)
+                )
             except (ValueError, TypeError):
                 logger.warning(
                     "Parsed value '%s' of parameter '%s' is not a float "
-                    "in tool '%s', degenerating to string.", param_value)
+                    "in tool '%s', degenerating to string.",
+                    param_value,
+                )
             return param_value
-        elif param_type in ['boolean', 'bool', 'binary']:
+        elif param_type in ["boolean", "bool", "binary"]:
             param_value = param_value.lower()
-            return param_value == 'true'
+            return param_value == "true"
         else:
             return param_value
 
-    def _convert_for_json_streaming(self, converted_value: Any,
-                                    param_type: str) -> str:
-        """Convert converted_value based on 
+    def _convert_for_json_streaming(self, converted_value: Any, param_type: str) -> str:
+        """Convert converted_value based on
         whether it's empty and if type is string
         Args:
             converted_value: Converted value
@@ -1008,10 +1118,10 @@ def _convert_for_json_streaming(self, converted_value: Any,
             Converted string for streaming output
         """
         # Check if value is empty, but exclude numeric 0
-        if converted_value is None or converted_value == '':
-            return ''
+        if converted_value is None or converted_value == "":
+            return ""
 
-        if param_type in ['string', 'str', 'text', 'varchar', 'char', 'enum']:
+        if param_type in ["string", "str", "text", "varchar", "char", "enum"]:
             # String type, remove double quotes
             return json.dumps(converted_value, ensure_ascii=False)[1:-1]
         else:
@@ -1023,7 +1133,7 @@ def _convert_for_json_streaming(self, converted_value: Any,
 
     def _reset_xml_parser_after_tool_call(self):
         """
-        Each tool_call is treated as a separate XML document, 
+        Each tool_call is treated as a separate XML document,
         so we need to reset the parser after each tool_call.
         """
 
@@ -1039,12 +1149,12 @@ def _reset_xml_parser_after_tool_call(self):
         self.current_function_open = False
         self.parameters = {}
         self.current_param_name = None
-        self.current_param_value = ''
-        self.current_param_value_converted = ''
+        self.current_param_value = ""
+        self.current_param_value_converted = ""
         self.current_param_is_first = False
         self.should_emit_end_newline = False
         self.start_quote_emitted = False
-        self.text_content_buffer = ''
+        self.text_content_buffer = ""
 
         # Reset preprocessing and deferred parsing state
         self._pre_inside_parameter = False
@@ -1056,13 +1166,13 @@ def _reset_xml_parser_after_tool_call(self):
 
 @ToolParserManager.register_module("qwen3_xml")
 class Qwen3XMLToolParser(ToolParser):
-
     def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
         self.parser = StreamingXMLToolCallParser()
 
-        logger.info("vLLM Successfully import tool parser %s !",
-                    self.__class__.__name__)
+        logger.info(
+            "vLLM Successfully import tool parser %s !", self.__class__.__name__
+        )
 
     def extract_tool_calls(
         self,
@@ -1091,7 +1201,8 @@ def extract_tool_calls(
                                 name=tool_call.function.name,
                                 arguments=tool_call.function.arguments,
                             ),
-                        ))
+                        )
+                    )
             return ExtractedToolCallInformation(
                 tool_calls=tool_calls,
                 tools_called=len(tool_calls) > 0,
@@ -1119,19 +1230,22 @@ def extract_tool_calls_streaming(
         # to correctly output tool_call field
         if not delta_text and delta_token_ids:
             open_calls = current_text.count(
-                self.parser.tool_call_start_token) - current_text.count(
-                    self.parser.tool_call_end_token)
+                self.parser.tool_call_start_token
+            ) - current_text.count(self.parser.tool_call_end_token)
             if open_calls == 0 and self.parser.tool_call_index > 0:
                 # If current_call_id is None, use last_completed_call_id
-                call_id = self.parser.current_call_id or \
-                    self.parser.last_completed_call_id
-                return DeltaMessage(tool_calls=[
-                    DeltaToolCall(
-                        index=self.parser.tool_call_index - 1,
-                        id=call_id,
-                        function=DeltaFunctionCall(arguments=''),
-                        type='function',
-                    )
-                ])
+                call_id = (
+                    self.parser.current_call_id or self.parser.last_completed_call_id
+                )
+                return DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=self.parser.tool_call_index - 1,
+                            id=call_id,
+                            function=DeltaFunctionCall(arguments=""),
+                            type="function",
+                        )
+                    ]
+                )
 
         return self.parser.parse_single_streaming_chunks(delta_text)
diff --git a/vllm/entrypoints/openai/tool_parsers/seed_oss_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/seed_oss_tool_parser.py
index 95458f07ff2a..2e7bd0d1d344 100644
--- a/vllm/entrypoints/openai/tool_parsers/seed_oss_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/seed_oss_tool_parser.py
@@ -11,14 +11,20 @@
 
 import regex as re
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              ChatCompletionToolsParam,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    ChatCompletionToolsParam,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
+    ToolParser,
+    ToolParserManager,
+)
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
@@ -51,33 +57,36 @@ def __init__(self, tokenizer: AnyTokenizer):
         self.failed_count: int = 0
         self._reset_streaming_state()
 
-        self.tool_call_start_token_id = self.vocab.get(
-            self.tool_call_start_token)
+        self.tool_call_start_token_id = self.vocab.get(self.tool_call_start_token)
         self.tool_call_end_token_id = self.vocab.get(self.tool_call_end_token)
         self.think_end_token_id = self.vocab.get(self.think_end_token)
 
-        if (self.tool_call_start_token_id is None
-                or self.tool_call_end_token_id is None):
+        if self.tool_call_start_token_id is None or self.tool_call_end_token_id is None:
             raise RuntimeError(
                 "Seed_Oss XML parser: tokenizer did not include "
-                "<seed:tool_call> or its closing tag.")
+                "<seed:tool_call> or its closing tag."
+            )
 
         tool_start_re = re.escape(self.tool_call_start_token)
         tool_end_re = re.escape(self.tool_call_end_token)
 
         self.tool_call_complete_regex = re.compile(
-            rf"{tool_start_re}(.*?){tool_end_re}", re.DOTALL)
+            rf"{tool_start_re}(.*?){tool_end_re}", re.DOTALL
+        )
         self.tool_call_regex = re.compile(
-            rf"{tool_start_re}(.*?){tool_end_re}|{tool_start_re}(.*?)$",
-            re.DOTALL)
+            rf"{tool_start_re}(.*?){tool_end_re}|{tool_start_re}(.*?)$", re.DOTALL
+        )
 
         self.tool_call_function_regex = re.compile(
-            r"<function=(.*?)</function>|<function=(.*)$", re.DOTALL)
+            r"<function=(.*?)</function>|<function=(.*)$", re.DOTALL
+        )
         self.tool_call_parameter_regex = re.compile(
-            r"<parameter=(.*?)</parameter>|<parameter=(.*?)$", re.DOTALL)
+            r"<parameter=(.*?)</parameter>|<parameter=(.*?)$", re.DOTALL
+        )
 
-        logger.info("vLLM Seed-Oss XML tool parser loaded (%s).",
-                    self.__class__.__name__)
+        logger.info(
+            "vLLM Seed-Oss XML tool parser loaded (%s).", self.__class__.__name__
+        )
 
     def _generate_tool_call_id(self) -> str:
         """Generate a unique tool call ID."""
@@ -100,20 +109,17 @@ def _reset_streaming_state(self):
         self.json_closed = False
 
     def _parse_xml_function_call(
-            self, function_call_str: str,
-            tools: Optional[list[ChatCompletionToolsParam]]
+        self, function_call_str: str, tools: Optional[list[ChatCompletionToolsParam]]
     ) -> Optional[ToolCall]:
-
         def get_arguments_config(func_name: str) -> dict:
             if tools is None:
                 return {}
             for config in tools:
                 if not hasattr(config, "type") or not (
-                        hasattr(config, "function")
-                        and hasattr(config.function, "name")):
+                    hasattr(config, "function") and hasattr(config.function, "name")
+                ):
                     continue
-                if (config.type == "function"
-                        and config.function.name == func_name):
+                if config.type == "function" and config.function.name == func_name:
                     if not hasattr(config.function, "parameters"):
                         return {}
                     params = config.function.parameters
@@ -123,12 +129,12 @@ def get_arguments_config(func_name: str) -> dict:
                         return params
                     else:
                         return {}
-            logger.warning("Tool '%s' is not defined in the tools list.",
-                           func_name)
+            logger.warning("Tool '%s' is not defined in the tools list.", func_name)
             return {}
 
-        def convert_param_value(param_value: str, param_name: str,
-                                param_config: dict, func_name: str) -> Any:
+        def convert_param_value(
+            param_value: str, param_name: str, param_config: dict, func_name: str
+        ) -> Any:
             # Handle null value for any type
             if param_value.lower() == "null":
                 return None
@@ -138,44 +144,55 @@ def convert_param_value(param_value: str, param_name: str,
                     logger.warning(
                         "Parsed parameter '%s' is not defined in "
                         "the tool parameters for tool '%s', "
-                        "directly returning the string value.", param_name,
-                        func_name)
+                        "directly returning the string value.",
+                        param_name,
+                        func_name,
+                    )
                 return param_value
 
-            if (isinstance(param_config[param_name], dict)
-                    and "type" in param_config[param_name]):
-                param_type = str(
-                    param_config[param_name]["type"]).strip().lower()
+            if (
+                isinstance(param_config[param_name], dict)
+                and "type" in param_config[param_name]
+            ):
+                param_type = str(param_config[param_name]["type"]).strip().lower()
             else:
                 param_type = "string"
-            if param_type in [
-                    "string", "str", "text", "varchar", "char", "enum"
-            ]:
+            if param_type in ["string", "str", "text", "varchar", "char", "enum"]:
                 return param_value
-            elif (param_type.startswith("int") or param_type.startswith("uint")
-                  or param_type.startswith("long")
-                  or param_type.startswith("short")
-                  or param_type.startswith("unsigned")):
+            elif (
+                param_type.startswith("int")
+                or param_type.startswith("uint")
+                or param_type.startswith("long")
+                or param_type.startswith("short")
+                or param_type.startswith("unsigned")
+            ):
                 try:
                     param_value = int(param_value)  # type: ignore
                 except (ValueError, TypeError):
                     logger.warning(
                         "Parsed value '%s' of parameter '%s' is not an integer in tool "
-                        "'%s', degenerating to string.", param_value,
-                        param_name, func_name)
+                        "'%s', degenerating to string.",
+                        param_value,
+                        param_name,
+                        func_name,
+                    )
                 return param_value
-            elif param_type.startswith("num") or param_type.startswith(
-                    "float"):
+            elif param_type.startswith("num") or param_type.startswith("float"):
                 try:
                     float_param_value = float(param_value)
-                    param_value = float_param_value if float_param_value - int(
-                        float_param_value) != 0 else int(
-                            float_param_value)  # type: ignore
+                    param_value = (
+                        float_param_value  # type: ignore
+                        if float_param_value - int(float_param_value) != 0
+                        else int(float_param_value)  # type: ignore
+                    )
                 except (ValueError, TypeError):
                     logger.warning(
                         "Parsed value '%s' of parameter '%s' is not a float in tool "
-                        "'%s', degenerating to string.", param_value,
-                        param_name, func_name)
+                        "'%s', degenerating to string.",
+                        param_value,
+                        param_name,
+                        func_name,
+                    )
                 return param_value
             elif param_type in ["boolean", "bool", "binary"]:
                 param_value = param_value.lower()
@@ -183,7 +200,10 @@ def convert_param_value(param_value: str, param_name: str,
                     logger.warning(
                         "Parsed value '%s' of parameter '%s' is not a boolean "
                         "(`true` of `false`) in tool '%s', degenerating to false.",
-                        param_value, param_name, func_name)
+                        param_value,
+                        param_name,
+                        func_name,
+                    )
                 return param_value == "true"
             else:
                 if param_type == "object" or param_type.startswith("dict"):
@@ -194,27 +214,33 @@ def convert_param_value(param_value: str, param_name: str,
                         logger.warning(
                             "Parsed value '%s' of parameter '%s' is not a valid JSON "
                             "object in tool '%s', will try other methods to parse it.",
-                            param_value, param_name, func_name)
+                            param_value,
+                            param_name,
+                            func_name,
+                        )
                 try:
                     param_value = ast.literal_eval(param_value)
                 except (ValueError, SyntaxError):
                     logger.warning(
                         "Parsed value '%s' of parameter '%s' cannot be converted via "
                         "Python `ast.literal_eval()` in tool '%s', degenerating to string.",
-                        param_value, param_name, func_name)
+                        param_value,
+                        param_name,
+                        func_name,
+                    )
                 return param_value
 
         # Extract function name
         end_index = function_call_str.index(">")
         function_name = function_call_str[:end_index]
         param_config = get_arguments_config(function_name)
-        parameters = function_call_str[end_index + 1:]
+        parameters = function_call_str[end_index + 1 :]
         param_dict = {}
         for match in self.tool_call_parameter_regex.findall(parameters):
             match_text = match[0] if match[0] else match[1]
             idx = match_text.index(">")
             param_name = match_text[:idx]
-            param_value = str(match_text[idx + 1:])
+            param_value = str(match_text[idx + 1 :])
             # Remove prefix and trailing \n
             if param_value.startswith("\n"):
                 param_value = param_value[1:]
@@ -222,12 +248,13 @@ def convert_param_value(param_value: str, param_name: str,
                 param_value = param_value[:-1]
 
             param_dict[param_name] = convert_param_value(
-                param_value, param_name, param_config, function_name)
+                param_value, param_name, param_config, function_name
+            )
         return ToolCall(
             type="function",
-            function=FunctionCall(name=function_name,
-                                  arguments=json.dumps(param_dict,
-                                                       ensure_ascii=False)),
+            function=FunctionCall(
+                name=function_name, arguments=json.dumps(param_dict, ensure_ascii=False)
+            ),
         )
 
     def _get_function_calls(self, model_output: str) -> list[str]:
@@ -243,8 +270,7 @@ def _get_function_calls(self, model_output: str) -> list[str]:
 
         raw_function_calls = []
         for tool_call in raw_tool_calls:
-            raw_function_calls.extend(
-                self.tool_call_function_regex.findall(tool_call))
+            raw_function_calls.extend(self.tool_call_function_regex.findall(tool_call))
 
         function_calls = [
             match[0] if match[0] else match[1] for match in raw_function_calls
@@ -258,16 +284,19 @@ def extract_tool_calls(
     ) -> ExtractedToolCallInformation:
         # Quick check to avoid unnecessary processing
         if self.tool_call_prefix not in model_output:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         # Check if both think start and end tokens are present
-        if (self.think_start_token in model_output
-                and self.think_end_token in model_output):
+        if (
+            self.think_start_token in model_output
+            and self.think_end_token in model_output
+        ):
             # Find the position of think end token
             think_end_index = model_output.find(self.think_end_token) + len(
-                self.think_end_token)
+                self.think_end_token
+            )
             # Extract content after think end token
             result_content = model_output[think_end_index:]
             thinking_content = model_output[:think_end_index]
@@ -278,9 +307,9 @@ def extract_tool_calls(
         try:
             function_calls = self._get_function_calls(result_content)
             if len(function_calls) == 0:
-                return ExtractedToolCallInformation(tools_called=False,
-                                                    tool_calls=[],
-                                                    content=model_output)
+                return ExtractedToolCallInformation(
+                    tools_called=False, tool_calls=[], content=model_output
+                )
 
             tool_calls = [
                 self._parse_xml_function_call(function_call_str, request.tools)
@@ -291,19 +320,20 @@ def extract_tool_calls(
             self.prev_tool_call_arr.clear()  # Clear previous calls
             for tool_call in tool_calls:
                 if tool_call:
-                    self.prev_tool_call_arr.append({
-                        "name":
-                        tool_call.function.name,
-                        "arguments":
-                        tool_call.function.arguments,
-                    })
+                    self.prev_tool_call_arr.append(
+                        {
+                            "name": tool_call.function.name,
+                            "arguments": tool_call.function.arguments,
+                        }
+                    )
 
             # Extract content before tool calls
-            tool_call_start_index = result_content.find(
-                self.tool_call_start_token)
+            tool_call_start_index = result_content.find(self.tool_call_start_token)
             tool_call_start_index = (
-                tool_call_start_index if tool_call_start_index >= 0 else
-                result_content.find(self.tool_call_prefix))
+                tool_call_start_index
+                if tool_call_start_index >= 0
+                else result_content.find(self.tool_call_prefix)
+            )
             content = thinking_content + result_content[:tool_call_start_index]
 
             return ExtractedToolCallInformation(
@@ -314,9 +344,9 @@ def extract_tool_calls(
 
         except Exception:
             logger.exception("Error in extracting tool call from response.")
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
     def extract_tool_calls_streaming(
         self,
@@ -334,18 +364,18 @@ def extract_tool_calls_streaming(
             # Check if this is an EOS token after all tool calls are complete
             # We check for tool calls in the text even if is_tool_call_started
             # is False because it might have been reset after processing all tools
-            if (delta_token_ids
-                    and self.tool_call_end_token_id not in delta_token_ids):
+            if delta_token_ids and self.tool_call_end_token_id not in delta_token_ids:
                 # Count complete tool calls
                 complete_calls = len(
-                    self.tool_call_complete_regex.findall(current_text))
+                    self.tool_call_complete_regex.findall(current_text)
+                )
 
                 # If we have completed tool calls and populated prev_tool_call_arr
                 if complete_calls > 0 and len(self.prev_tool_call_arr) > 0:
                     # Check if all tool calls are closed
                     open_calls = current_text.count(
-                        self.tool_call_start_token) - current_text.count(
-                            self.tool_call_end_token)
+                        self.tool_call_start_token
+                    ) - current_text.count(self.tool_call_end_token)
                     if open_calls == 0:
                         # Return empty delta message to allow finish_reason processing
                         return DeltaMessage(content="")
@@ -375,16 +405,18 @@ def extract_tool_calls_streaming(
 
                 # Check if there are more tool calls
                 if self.current_tool_index >= current_text.count(
-                        self.tool_call_start_token):
+                    self.tool_call_start_token
+                ):
                     # No more tool calls
                     self.is_tool_call_started = False
                 # Continue processing next tool
                 return None
 
         # Check if end thinking
-        if (not self.is_thinking_end
-                and (self.think_end_token_id in delta_token_ids
-                     or self.think_end_token in delta_text)):
+        if not self.is_thinking_end and (
+            self.think_end_token_id in delta_token_ids
+            or self.think_end_token in delta_text
+        ):
             self.is_thinking_end = True
 
         # If thinking hasn't ended yet, don't process any tool calls
@@ -394,20 +426,25 @@ def extract_tool_calls_streaming(
         # Handle normal content before tool calls
         if not self.is_tool_call_started:
             # Check if tool call is starting
-            if (self.tool_call_start_token_id in delta_token_ids
-                    or self.tool_call_start_token in delta_text):
+            if (
+                self.tool_call_start_token_id in delta_token_ids
+                or self.tool_call_start_token in delta_text
+            ):
                 self.is_tool_call_started = True
                 # Return any content before the tool call
                 if self.tool_call_start_token in delta_text:
-                    content_before = delta_text[:delta_text.index(
-                        self.tool_call_start_token)]
+                    content_before = delta_text[
+                        : delta_text.index(self.tool_call_start_token)
+                    ]
                     if content_before:
                         return DeltaMessage(content=content_before)
                 return None
             else:
                 # Check if we're between tool calls - skip whitespace
-                if (current_text.rstrip().endswith(self.tool_call_end_token)
-                        and delta_text.strip() == ""):
+                if (
+                    current_text.rstrip().endswith(self.tool_call_end_token)
+                    and delta_text.strip() == ""
+                ):
                     # We just ended a tool call, skip whitespace
                     return None
                 # Normal content, no tool call
@@ -423,9 +460,11 @@ def extract_tool_calls_streaming(
         # We're in a tool call, find the current tool call portion
         # Need to find the correct tool call based on current_tool_index
         # Only process tool calls after think_end_token
-        think_end_index = current_text.find(self.think_end_token) + len(
-            self.think_end_token
-        ) if self.think_end_token in current_text else 0
+        think_end_index = (
+            current_text.find(self.think_end_token) + len(self.think_end_token)
+            if self.think_end_token in current_text
+            else 0
+        )
         tool_starts: list[int] = []
         idx = think_end_index
         while True:
@@ -441,26 +480,26 @@ def extract_tool_calls_streaming(
 
         tool_start_idx = tool_starts[self.current_tool_index]
         # Find where this tool call ends (or current position if not ended yet)
-        tool_end_idx = current_text.find(self.tool_call_end_token,
-                                         tool_start_idx)
+        tool_end_idx = current_text.find(self.tool_call_end_token, tool_start_idx)
         if tool_end_idx == -1:
             tool_text = current_text[tool_start_idx:]
         else:
-            tool_text = current_text[tool_start_idx:tool_end_idx +
-                                     len(self.tool_call_end_token)]
+            tool_text = current_text[
+                tool_start_idx : tool_end_idx + len(self.tool_call_end_token)
+            ]
 
         # Looking for function header
         if not self.header_sent:
             if self.tool_call_prefix in tool_text:
                 func_start = tool_text.find(self.tool_call_prefix) + len(
-                    self.tool_call_prefix)
+                    self.tool_call_prefix
+                )
                 func_end = tool_text.find(">", func_start)
 
                 if func_end != -1:
                     # Found complete function name
                     self.current_function_name = tool_text[func_start:func_end]
-                    self.current_tool_id = self._generate_tool_call_id(
-                    )  # type: ignore
+                    self.current_tool_id = self._generate_tool_call_id()  # type: ignore
                     self.header_sent = True
                     self.in_function = True
 
@@ -468,38 +507,44 @@ def extract_tool_calls_streaming(
                     # This ensures finish_reason="tool_calls" even if parsing isn't complete
                     already_added = any(
                         tool.get("name") == self.current_function_name
-                        for tool in self.prev_tool_call_arr)
+                        for tool in self.prev_tool_call_arr
+                    )
                     if not already_added:
-                        self.prev_tool_call_arr.append({
-                            "name": self.current_function_name,
-                            "arguments":
-                            "{}",  # Placeholder, will be updated later
-                        })
+                        self.prev_tool_call_arr.append(
+                            {
+                                "name": self.current_function_name,
+                                "arguments": "{}",  # Placeholder, will be updated later
+                            }
+                        )
 
                     # Send header with function info
-                    return DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=self.current_tool_index,
-                            id=self.current_tool_id,
-                            function=DeltaFunctionCall(
-                                name=self.current_function_name, arguments=""),
-                            type="function",
-                        )
-                    ])
+                    return DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_index,
+                                id=self.current_tool_id,
+                                function=DeltaFunctionCall(
+                                    name=self.current_function_name, arguments=""
+                                ),
+                                type="function",
+                            )
+                        ]
+                    )
             return None
 
         # We've sent header, now handle function body
         if self.in_function:
             # Send opening brace if not sent yet
-            if (not self.json_started
-                    and self.parameter_prefix not in delta_text):
+            if not self.json_started and self.parameter_prefix not in delta_text:
                 self.json_started = True
-                return DeltaMessage(tool_calls=[
-                    DeltaToolCall(
-                        index=self.current_tool_index,
-                        function=DeltaFunctionCall(arguments="{"),
-                    )
-                ])
+                return DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=self.current_tool_index,
+                            function=DeltaFunctionCall(arguments="{"),
+                        )
+                    ]
+                )
 
             # Make sure json_started is set if we're processing parameters
             if not self.json_started:
@@ -513,34 +558,38 @@ def extract_tool_calls_streaming(
                 # Extract the complete tool call to update prev_tool_call_arr with final arguments
                 # Find the function content
                 func_start = tool_text.find(self.tool_call_prefix) + len(
-                    self.tool_call_prefix)
-                func_content_end = tool_text.find(self.function_end_token,
-                                                  func_start)
+                    self.tool_call_prefix
+                )
+                func_content_end = tool_text.find(self.function_end_token, func_start)
                 if func_content_end != -1:
                     func_content = tool_text[func_start:func_content_end]
                     # Parse to get the complete arguments
                     try:
                         parsed_tool = self._parse_xml_function_call(
-                            func_content, request.tools if request else None)
+                            func_content, request.tools if request else None
+                        )
                         if parsed_tool:
                             # Update existing entry in prev_tool_call_arr with complete arguments
                             for i, tool in enumerate(self.prev_tool_call_arr):
-                                if tool.get(
-                                        "name") == parsed_tool.function.name:
+                                if tool.get("name") == parsed_tool.function.name:
                                     self.prev_tool_call_arr[i]["arguments"] = (
-                                        parsed_tool.function.arguments)
+                                        parsed_tool.function.arguments
+                                    )
                                     break
                     except Exception:
                         logger.warning(
                             "Failed to parse tool arguments during streaming.",
-                            exc_info=True)
+                            exc_info=True,
+                        )
 
-                result = DeltaMessage(tool_calls=[
-                    DeltaToolCall(
-                        index=self.current_tool_index,
-                        function=DeltaFunctionCall(arguments="}"),
-                    )
-                ])
+                result = DeltaMessage(
+                    tool_calls=[
+                        DeltaToolCall(
+                            index=self.current_tool_index,
+                            function=DeltaFunctionCall(arguments="}"),
+                        )
+                    ]
+                )
 
                 # Reset state for next tool
                 self.in_function = False
@@ -583,8 +632,7 @@ def extract_tool_calls_streaming(
                             value_text = value_text[1:]
 
                         # Find where this parameter ends
-                        param_end_idx = value_text.find(
-                            self.parameter_end_token)
+                        param_end_idx = value_text.find(self.parameter_end_token)
                         if param_end_idx != -1:
                             # Complete parameter found
                             param_value = value_text[:param_end_idx]
@@ -594,22 +642,33 @@ def extract_tool_calls_streaming(
                             # Build complete JSON fragment for this parameter
                             if self.param_count == 0:
                                 json_fragment = (
-                                    '"' + self.current_param_name + '": "' +
-                                    json.dumps(param_value)[1:-1] + '"')
+                                    '"'
+                                    + self.current_param_name
+                                    + '": "'
+                                    + json.dumps(param_value)[1:-1]
+                                    + '"'
+                                )
                             else:
                                 json_fragment = (
-                                    ', "' + self.current_param_name + '": "' +
-                                    json.dumps(param_value)[1:-1] + '"')
+                                    ', "'
+                                    + self.current_param_name
+                                    + '": "'
+                                    + json.dumps(param_value)[1:-1]
+                                    + '"'
+                                )
 
                             self.param_count += 1
 
-                            return DeltaMessage(tool_calls=[
-                                DeltaToolCall(
-                                    index=self.current_tool_index,
-                                    function=DeltaFunctionCall(
-                                        arguments=json_fragment),
-                                )
-                            ])
+                            return DeltaMessage(
+                                tool_calls=[
+                                    DeltaToolCall(
+                                        index=self.current_tool_index,
+                                        function=DeltaFunctionCall(
+                                            arguments=json_fragment
+                                        ),
+                                    )
+                                ]
+                            )
 
             # Continue parameter value
             if self.in_param:
@@ -621,29 +680,34 @@ def extract_tool_calls_streaming(
                     # Skip past > if at start
                     if not self.current_param_value and ">" in value_chunk:
                         gt_idx = value_chunk.find(">")
-                        value_chunk = value_chunk[gt_idx + 1:]
+                        value_chunk = value_chunk[gt_idx + 1 :]
 
-                    if not self.current_param_value and value_chunk.startswith(
-                            "\n"):
+                    if not self.current_param_value and value_chunk.startswith("\n"):
                         value_chunk = value_chunk[1:]
 
                     # Calculate incremental JSON
                     full_value = self.current_param_value + value_chunk
-                    prev_escaped = (json.dumps(self.current_param_value)[1:-1]
-                                    if self.current_param_value else "")
+                    prev_escaped = (
+                        json.dumps(self.current_param_value)[1:-1]
+                        if self.current_param_value
+                        else ""
+                    )
                     full_escaped = json.dumps(full_value)[1:-1]
-                    delta_escaped = full_escaped[len(prev_escaped):]
+                    delta_escaped = full_escaped[len(prev_escaped) :]
 
                     self.in_param = False
                     self.current_param_value = ""
 
-                    return DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=self.current_tool_index,
-                            function=DeltaFunctionCall(
-                                arguments=delta_escaped + '"'),
-                        )
-                    ])
+                    return DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_index,
+                                function=DeltaFunctionCall(
+                                    arguments=delta_escaped + '"'
+                                ),
+                            )
+                        ]
+                    )
                 else:
                     # Continue accumulating value
                     value_chunk = delta_text
@@ -651,29 +715,32 @@ def extract_tool_calls_streaming(
                     # Handle first chunk after param name
                     if not self.current_param_value and ">" in value_chunk:
                         gt_idx = value_chunk.find(">")
-                        value_chunk = value_chunk[gt_idx + 1:]
+                        value_chunk = value_chunk[gt_idx + 1 :]
 
-                    if not self.current_param_value and value_chunk.startswith(
-                            "\n"):
+                    if not self.current_param_value and value_chunk.startswith("\n"):
                         value_chunk = value_chunk[1:]
 
                     if value_chunk:
                         # Stream the escaped delta
-                        prev_escaped = (json.dumps(
-                            self.current_param_value)[1:-1]
-                                        if self.current_param_value else "")
+                        prev_escaped = (
+                            json.dumps(self.current_param_value)[1:-1]
+                            if self.current_param_value
+                            else ""
+                        )
                         self.current_param_value += value_chunk
-                        full_escaped = json.dumps(
-                            self.current_param_value)[1:-1]
-                        delta_escaped = full_escaped[len(prev_escaped):]
+                        full_escaped = json.dumps(self.current_param_value)[1:-1]
+                        delta_escaped = full_escaped[len(prev_escaped) :]
 
                         if delta_escaped:
-                            return DeltaMessage(tool_calls=[
-                                DeltaToolCall(
-                                    index=self.current_tool_index,
-                                    function=DeltaFunctionCall(
-                                        arguments=delta_escaped),
-                                )
-                            ])
+                            return DeltaMessage(
+                                tool_calls=[
+                                    DeltaToolCall(
+                                        index=self.current_tool_index,
+                                        function=DeltaFunctionCall(
+                                            arguments=delta_escaped
+                                        ),
+                                    )
+                                ]
+                            )
 
         return None
diff --git a/vllm/entrypoints/openai/tool_parsers/step3_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/step3_tool_parser.py
index a20d18eb5254..34bd372b2060 100644
--- a/vllm/entrypoints/openai/tool_parsers/step3_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/step3_tool_parser.py
@@ -8,13 +8,19 @@
 
 import regex as re
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
+    ToolParser,
+    ToolParserManager,
+)
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 from vllm.utils import random_uuid
@@ -35,9 +41,7 @@ class Step3ToolParser(ToolParser):
     TOOL_CALL_BEGIN = "<｜tool_call_begin｜>"
     TOOL_CALL_END = "<｜tool_call_end｜>"
     TOOL_SEP = "<｜tool_sep｜>"
-    SPECIAL_TOKENS = [
-        TOOL_CALLS_BEGIN, TOOL_CALLS_END, TOOL_CALL_BEGIN, TOOL_CALL_END
-    ]
+    SPECIAL_TOKENS = [TOOL_CALLS_BEGIN, TOOL_CALLS_END, TOOL_CALL_BEGIN, TOOL_CALL_END]
 
     def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
@@ -46,18 +50,16 @@ def __init__(self, tokenizer: AnyTokenizer):
         self.tool_block_started = False
         self.tool_block_finished = False
 
-    def adjust_request(
-            self, request: ChatCompletionRequest) -> ChatCompletionRequest:
-        if request.tools and request.tool_choice != 'none':
+    def adjust_request(self, request: ChatCompletionRequest) -> ChatCompletionRequest:
+        if request.tools and request.tool_choice != "none":
             request.skip_special_tokens = False
         return request
 
     @staticmethod
     def _parse_steptml_invoke(
-            action_text: str
+        action_text: str,
     ) -> tuple[Optional[str], Optional[dict[str, str]]]:
-        func_name_match = re.search(r'<steptml:invoke name="([^"]+)">',
-                                    action_text)
+        func_name_match = re.search(r'<steptml:invoke name="([^"]+)">', action_text)
         if not func_name_match:
             return None, None
         func_name = func_name_match.group(1)
@@ -65,7 +67,8 @@ def _parse_steptml_invoke(
         params: dict[str, str] = {}
         param_matches = re.findall(
             r'<steptml:parameter name="([^"]+)">([^<]*)</steptml:parameter>',
-            action_text)
+            action_text,
+        )
         for name, value in param_matches:
             params[name] = value.strip()
         return func_name, params
@@ -95,11 +98,13 @@ def _cast_arguments(
                             params[key] = float(value)
                     elif typ == "boolean":
                         lower_val = value.lower()
-                        params[key] = lower_val == "true" if lower_val in (
-                            "true", "false") else value
+                        params[key] = (
+                            lower_val == "true"
+                            if lower_val in ("true", "false")
+                            else value
+                        )
                     elif typ == "null":
-                        params[key] = None if value.lower(
-                        ) == "null" else value
+                        params[key] = None if value.lower() == "null" else value
                 break
         return params
 
@@ -113,13 +118,12 @@ def extract_tool_calls_streaming(
         delta_token_ids: Sequence[int],
         request: ChatCompletionRequest,
     ) -> Union[DeltaMessage, None]:
-
         # The main loop processes the stream from the last known position.
         while True:
             if self.position >= len(current_text):
                 return None  # We've processed the entire stream.
 
-            unprocessed_text = current_text[self.position:]
+            unprocessed_text = current_text[self.position :]
 
             # STATE: After all tools are done, all subsequent text is content.
             if self.tool_block_finished:
@@ -135,8 +139,10 @@ def extract_tool_calls_streaming(
 
                 start_pos = unprocessed_text.find(self.TOOL_CALLS_BEGIN)
                 if start_pos == -1:
-                    if self.TOOL_CALLS_BEGIN.startswith(
-                            unprocessed_text.strip()) and unprocessed_text:
+                    if (
+                        self.TOOL_CALLS_BEGIN.startswith(unprocessed_text.strip())
+                        and unprocessed_text
+                    ):
                         return None  # It's a prefix, wait.
                     self.position = len(current_text)
                     return DeltaMessage(content=unprocessed_text)
@@ -157,9 +163,9 @@ def extract_tool_calls_streaming(
                 continue
 
             # Check if we are between tool calls.
-            tool_finished = (
-                self.current_tool_id != -1 and
-                self.prev_tool_call_arr[self.current_tool_id].get("finished"))
+            tool_finished = self.current_tool_id != -1 and self.prev_tool_call_arr[
+                self.current_tool_id
+            ].get("finished")
             if self.current_tool_id == -1 or tool_finished:
                 if unprocessed_text.startswith(self.TOOL_CALL_BEGIN):
                     self.position += len(self.TOOL_CALL_BEGIN)
@@ -170,8 +176,7 @@ def extract_tool_calls_streaming(
                     self.current_tool_name_sent = False
                     while len(self.prev_tool_call_arr) <= self.current_tool_id:
                         self.prev_tool_call_arr.append({})
-                    self.prev_tool_call_arr[
-                        self.current_tool_id]["finished"] = False
+                    self.prev_tool_call_arr[self.current_tool_id]["finished"] = False
                     continue
 
                 if self.TOOL_CALL_BEGIN.startswith(unprocessed_text):
@@ -179,63 +184,65 @@ def extract_tool_calls_streaming(
 
             # STATE: Parsing an active tool call.
             if self.current_tool_id != -1 and not self.prev_tool_call_arr[
-                    self.current_tool_id].get("finished", False):
+                self.current_tool_id
+            ].get("finished", False):
                 end_tool_pos = unprocessed_text.find(self.TOOL_CALL_END)
                 if end_tool_pos == -1:
                     tool_body = unprocessed_text
                 else:
                     tool_body = unprocessed_text[:end_tool_pos]
 
-                if end_tool_pos == -1 and self.TOOL_CALL_END.startswith(
-                        tool_body):
+                if end_tool_pos == -1 and self.TOOL_CALL_END.startswith(tool_body):
                     return None
 
-                function_name, arguments = self._parse_steptml_invoke(
-                    tool_body)
+                function_name, arguments = self._parse_steptml_invoke(tool_body)
                 if not function_name:
                     return None
 
-                tool_call_arr = {
-                    "name": function_name,
-                    "parameters": arguments or {}
-                }
+                tool_call_arr = {"name": function_name, "parameters": arguments or {}}
 
                 # Send the function name as soon as it's parsed.
                 if not self.current_tool_name_sent:
                     self.current_tool_name_sent = True
-                    self.prev_tool_call_arr[self.current_tool_id].update(
-                        tool_call_arr)
-                    return DeltaMessage(tool_calls=[
-                        DeltaToolCall(index=self.current_tool_id,
-                                      type="function",
-                                      id=f"chatcmpl-tool-{random_uuid()}",
-                                      function=DeltaFunctionCall(
-                                          name=function_name))
-                    ])
+                    self.prev_tool_call_arr[self.current_tool_id].update(tool_call_arr)
+                    return DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=self.current_tool_id,
+                                type="function",
+                                id=f"chatcmpl-tool-{random_uuid()}",
+                                function=DeltaFunctionCall(name=function_name),
+                            )
+                        ]
+                    )
 
                 # Update our internal state with the latest parsed arguments.
-                self.prev_tool_call_arr[
-                    self.current_tool_id].update(  # noqa: E501
-                        tool_call_arr)
+                self.prev_tool_call_arr[self.current_tool_id].update(  # noqa: E501
+                    tool_call_arr
+                )
 
                 # Only send arguments when the tool call is complete.
                 if end_tool_pos != -1:
                     self.position += end_tool_pos + len(self.TOOL_CALL_END)
-                    self.prev_tool_call_arr[
-                        self.current_tool_id]["finished"] = True
+                    self.prev_tool_call_arr[self.current_tool_id]["finished"] = True
 
                     final_args = self._cast_arguments(
                         function_name,
                         tool_call_arr.get("parameters", {}),  # type: ignore
-                        request)
+                        request,
+                    )
                     if final_args:
-                        final_args_json = json.dumps(final_args,
-                                                     ensure_ascii=False)
-                        return DeltaMessage(tool_calls=[
-                            DeltaToolCall(index=self.current_tool_id,
-                                          function=DeltaFunctionCall(
-                                              arguments=final_args_json))
-                        ])
+                        final_args_json = json.dumps(final_args, ensure_ascii=False)
+                        return DeltaMessage(
+                            tool_calls=[
+                                DeltaToolCall(
+                                    index=self.current_tool_id,
+                                    function=DeltaFunctionCall(
+                                        arguments=final_args_json
+                                    ),
+                                )
+                            ]
+                        )
 
                 # If tool is not finished, return None to wait for more tokens.
                 return None
@@ -248,15 +255,15 @@ def extract_tool_calls(
         request: ChatCompletionRequest,
     ) -> ExtractedToolCallInformation:
         if self.TOOL_CALLS_BEGIN not in model_output:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         pre_text, rest = model_output.split(self.TOOL_CALLS_BEGIN, 1)
         if self.TOOL_CALLS_END not in rest:
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
         tool_block, post_text = rest.split(self.TOOL_CALLS_END, 1)
         content = (pre_text + post_text).strip()
@@ -276,21 +283,22 @@ def extract_tool_calls(
             if type_part.strip() != "function":
                 continue
 
-            function_name, params_dict = self._parse_steptml_invoke(
-                invoke_part)
+            function_name, params_dict = self._parse_steptml_invoke(invoke_part)
 
             if function_name and params_dict is not None:
-                params_dict = self._cast_arguments(function_name, params_dict,
-                                                   request)
+                params_dict = self._cast_arguments(function_name, params_dict, request)
                 params_str = json.dumps(params_dict, ensure_ascii=False)
                 tool_calls.append(
-                    ToolCall(function=FunctionCall(name=function_name,
-                                                   arguments=params_str)))
+                    ToolCall(
+                        function=FunctionCall(name=function_name, arguments=params_str)
+                    )
+                )
         if tool_calls:
             return ExtractedToolCallInformation(
                 tools_called=True,
                 tool_calls=tool_calls,
-                content=content if content else None)
-        return ExtractedToolCallInformation(tools_called=False,
-                                            tool_calls=[],
-                                            content=model_output)
+                content=content if content else None,
+            )
+        return ExtractedToolCallInformation(
+            tools_called=False, tool_calls=[], content=model_output
+        )
diff --git a/vllm/entrypoints/openai/tool_parsers/utils.py b/vllm/entrypoints/openai/tool_parsers/utils.py
index aa41cd6dc53e..e076ab38e336 100644
--- a/vllm/entrypoints/openai/tool_parsers/utils.py
+++ b/vllm/entrypoints/openai/tool_parsers/utils.py
@@ -22,7 +22,7 @@ def find_common_prefix(s1: str, s2: str) -> str:
     e.g. find_common_prefix('{"fruit": "ap"}', '{"fruit": "apple"}') ->
     '{"fruit": "ap'
     """
-    prefix = ''
+    prefix = ""
     min_length = min(len(s1), len(s2))
     for i in range(0, min_length):
         if s1[i] == s2[i]:
@@ -40,7 +40,7 @@ def find_common_suffix(s1: str, s2: str) -> str:
 
     e.g. find_common_suffix('{"fruit": "ap"}', '{"fruit": "apple"}') -> '"}'
     """
-    suffix = ''
+    suffix = ""
     min_length = min(len(s1), len(s2))
     for i in range(1, min_length + 1):
         if s1[-i] == s2[-i] and not s1[-i].isalnum():
@@ -70,15 +70,15 @@ def extract_intermediate_diff(curr: str, old: str) -> str:
     """
     suffix = find_common_suffix(curr, old)
 
-    old = old[::-1].replace(suffix[::-1], '', 1)[::-1]
+    old = old[::-1].replace(suffix[::-1], "", 1)[::-1]
     prefix = find_common_prefix(curr, old)
     diff = curr
     if len(suffix):
-        diff = diff[::-1].replace(suffix[::-1], '', 1)[::-1]
+        diff = diff[::-1].replace(suffix[::-1], "", 1)[::-1]
 
     if len(prefix):
         # replace the prefix only once in case it's mirrored
-        diff = diff.replace(prefix, '', 1)
+        diff = diff.replace(prefix, "", 1)
 
     return diff
 
diff --git a/vllm/entrypoints/openai/tool_parsers/xlam_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/xlam_tool_parser.py
index 484e904cd8c3..c1f0d29cc087 100644
--- a/vllm/entrypoints/openai/tool_parsers/xlam_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/xlam_tool_parser.py
@@ -8,13 +8,19 @@
 import regex as re
 
 from vllm.entrypoints.chat_utils import make_tool_call_id
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaFunctionCall, DeltaMessage,
-                                              DeltaToolCall,
-                                              ExtractedToolCallInformation,
-                                              FunctionCall, ToolCall)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaFunctionCall,
+    DeltaMessage,
+    DeltaToolCall,
+    ExtractedToolCallInformation,
+    FunctionCall,
+    ToolCall,
+)
 from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
-    ToolParser, ToolParserManager)
+    ToolParser,
+    ToolParserManager,
+)
 from vllm.logger import init_logger
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 from vllm.utils import random_uuid
@@ -24,7 +30,6 @@
 
 @ToolParserManager.register_module("xlam")
 class xLAMToolParser(ToolParser):
-
     def __init__(self, tokenizer: AnyTokenizer):
         super().__init__(tokenizer)
 
@@ -32,8 +37,7 @@ def __init__(self, tokenizer: AnyTokenizer):
         self.prev_tool_calls: list[dict] = []
         self.current_tool_id = -1
         self.current_tool_name_sent = False
-        self.streamed_args: list[str] = [
-        ]  # Track arguments sent for each tool
+        self.streamed_args: list[str] = []  # Track arguments sent for each tool
 
         # For backward compatibility with tests
         self.current_tools_sent: list[bool] = []
@@ -57,7 +61,8 @@ def __init__(self, tokenizer: AnyTokenizer):
         }
 
     def preprocess_model_output(
-            self, model_output: str) -> tuple[Optional[str], Optional[str]]:
+        self, model_output: str
+    ) -> tuple[Optional[str], Optional[str]]:
         """
         Preprocess the model output to extract content and potential tool calls.
         Returns:
@@ -66,8 +71,7 @@ def preprocess_model_output(
         # Check for thinking tag
         thinking_match = re.search(self.thinking_tag_pattern, model_output)
         if thinking_match:
-            content = model_output[:thinking_match.start() +
-                                   len("</think>")].strip()
+            content = model_output[: thinking_match.start() + len("</think>")].strip()
             thinking_content = thinking_match.group(1).strip()
 
             # Try to parse the thinking content as JSON
@@ -94,8 +98,7 @@ def preprocess_model_output(
                     try:
                         json.loads(json_str)
                         # Extract content by removing the JSON code block
-                        content = re.sub(json_pattern, "",
-                                         model_output).strip()
+                        content = re.sub(json_pattern, "", model_output).strip()
                         return content, json_str
                     except json.JSONDecodeError:
                         continue
@@ -107,28 +110,30 @@ def preprocess_model_output(
                 return None, model_output
             except json.JSONDecodeError:
                 # Even if it's not valid JSON yet, it might be a tool call in progress
-                if ("{" in model_output and "name" in model_output
-                        and "arguments" in model_output):
+                if (
+                    "{" in model_output
+                    and "name" in model_output
+                    and "arguments" in model_output
+                ):
                     return None, model_output
 
         # If no tool calls found, return the original output as content
         return model_output, None
 
     def extract_tool_calls(
-            self, model_output: str,
-            request: ChatCompletionRequest) -> ExtractedToolCallInformation:
+        self, model_output: str, request: ChatCompletionRequest
+    ) -> ExtractedToolCallInformation:
         """
         Extract tool calls from a complete model output.
         """
         try:
             # Preprocess the model output
-            content, potential_tool_calls = self.preprocess_model_output(
-                model_output)
+            content, potential_tool_calls = self.preprocess_model_output(model_output)
 
             if not potential_tool_calls:
-                return ExtractedToolCallInformation(tools_called=False,
-                                                    tool_calls=[],
-                                                    content=content)
+                return ExtractedToolCallInformation(
+                    tools_called=False, tool_calls=[], content=content
+                )
 
             # Parse the potential tool calls as JSON
             tool_calls_data = json.loads(potential_tool_calls)
@@ -145,8 +150,11 @@ def extract_tool_calls(
             tool_calls: list[ToolCall] = []
 
             for idx, call in enumerate(tool_calls_data):
-                if (not isinstance(call, dict) or "name" not in call
-                        or "arguments" not in call):
+                if (
+                    not isinstance(call, dict)
+                    or "name" not in call
+                    or "arguments" not in call
+                ):
                     logger.debug("Invalid tool call format at index %d", idx)
                     continue
 
@@ -155,8 +163,11 @@ def extract_tool_calls(
                     type="function",
                     function=FunctionCall(
                         name=call["name"],
-                        arguments=(json.dumps(call["arguments"]) if isinstance(
-                            call["arguments"], dict) else call["arguments"]),
+                        arguments=(
+                            json.dumps(call["arguments"])
+                            if isinstance(call["arguments"], dict)
+                            else call["arguments"]
+                        ),
                     ),
                 )
                 tool_calls.append(tool_call)
@@ -169,9 +180,9 @@ def extract_tool_calls(
 
         except Exception as e:
             logger.exception("Error extracting tool calls: %s", str(e))
-            return ExtractedToolCallInformation(tools_called=False,
-                                                tool_calls=[],
-                                                content=model_output)
+            return ExtractedToolCallInformation(
+                tools_called=False, tool_calls=[], content=model_output
+            )
 
     def extract_tool_calls_streaming(
         self,
@@ -189,26 +200,36 @@ def extract_tool_calls_streaming(
         # First, check for a definitive start of a tool call block.
         # This prevents premature parsing of incomplete output.
         stripped_text = current_text.strip()
-        preprocessed_content, preprocessed_tool_calls = (
-            self.preprocess_model_output(current_text))
+        preprocessed_content, preprocessed_tool_calls = self.preprocess_model_output(
+            current_text
+        )
 
         # For JSON code blocks, we need to detect them earlier, even if incomplete
-        has_potential_json_block = ("```json" in current_text
-                                    or "```\n[" in current_text
-                                    or "[TOOL_CALLS]" in current_text
-                                    or "<tool_call>" in current_text)
+        has_potential_json_block = (
+            "```json" in current_text
+            or "```\n[" in current_text
+            or "[TOOL_CALLS]" in current_text
+            or "<tool_call>" in current_text
+        )
 
         is_tool_call_block = (
             stripped_text.startswith("[")
             or stripped_text.startswith("<tool_call>")
-            or stripped_text.startswith("[TOOL_CALLS]") or
+            or stripped_text.startswith("[TOOL_CALLS]")
+            or
             # Check if we have thinking tags with JSON-like content following
-            ("</think>[" in current_text) or
+            ("</think>[" in current_text)
+            or
             # Check if the text contains a JSON array after preprocessing
-            preprocessed_tool_calls is not None or
+            preprocessed_tool_calls is not None
+            or
             # For JSON code blocks, detect early if we see enough structure
-            (has_potential_json_block and '"name"' in current_text
-             and '"arguments"' in current_text))
+            (
+                has_potential_json_block
+                and '"name"' in current_text
+                and '"arguments"' in current_text
+            )
+        )
 
         if not is_tool_call_block:
             return DeltaMessage(content=delta_text)
@@ -225,8 +246,9 @@ def extract_tool_calls_streaming(
             # Try parsing as JSON to check for complete tool calls
             try:
                 # Use preprocessed tool calls if available
-                tool_calls_text = (preprocessed_tool_calls if
-                                   preprocessed_tool_calls else current_text)
+                tool_calls_text = (
+                    preprocessed_tool_calls if preprocessed_tool_calls else current_text
+                )
                 parsed_tools = json.loads(tool_calls_text)
                 if isinstance(parsed_tools, list):
                     # Update our tool array for next time
@@ -237,11 +259,15 @@ def extract_tool_calls_streaming(
 
             # Check for test-specific state setup (current_tools_sent)
             # This handles the case where tests manually set current_tools_sent
-            if (hasattr(self, "current_tools_sent")  # type: ignore
-                    and len(self.current_tools_sent) > 0):
+            if (
+                hasattr(self, "current_tools_sent")  # type: ignore
+                and len(self.current_tools_sent) > 0
+            ):
                 # If current_tools_sent is set to [False], it means the test wants us to send the name
-                if (len(self.current_tools_sent) == 1
-                        and self.current_tools_sent[0] is False):
+                if (
+                    len(self.current_tools_sent) == 1
+                    and self.current_tools_sent[0] is False
+                ):
                     # Extract the function name using regex
                     name_pattern = r'"name"\s*:\s*"([^"]+)"'
                     name_match = re.search(name_pattern, current_text)
@@ -250,51 +276,53 @@ def extract_tool_calls_streaming(
 
                         # The test expects us to send just the name first
                         tool_id = make_tool_call_id()
-                        delta = DeltaMessage(tool_calls=[
-                            DeltaToolCall(
-                                index=0,
-                                type="function",
-                                id=tool_id,
-                                function=DeltaFunctionCall(
-                                    name=function_name).model_dump(
-                                        exclude_none=True),  # type: ignore
-                            )
-                        ])
+                        delta = DeltaMessage(
+                            tool_calls=[
+                                DeltaToolCall(
+                                    index=0,
+                                    type="function",
+                                    id=tool_id,
+                                    function=DeltaFunctionCall(
+                                        name=function_name
+                                    ).model_dump(exclude_none=True),  # type: ignore
+                                )
+                            ]
+                        )
                         # Update state to reflect that we've sent the name
                         self.current_tools_sent = [True]
                         self.current_tool_id = 0
                         self.streaming_state["current_tool_index"] = 0
                         if len(self.streaming_state["sent_tools"]) == 0:
-                            self.streaming_state["sent_tools"].append({
-                                "sent_name":
-                                True,
-                                "sent_arguments_prefix":
-                                False,
-                                "sent_arguments":
-                                "",
-                            })
+                            self.streaming_state["sent_tools"].append(
+                                {
+                                    "sent_name": True,
+                                    "sent_arguments_prefix": False,
+                                    "sent_arguments": "",
+                                }
+                            )
                         else:
-                            self.streaming_state["sent_tools"][0][
-                                "sent_name"] = True
+                            self.streaming_state["sent_tools"][0]["sent_name"] = True
                         self.current_tool_name_sent = True
                         return delta
 
             # Use regex to identify tool calls in the output
             # Use preprocessed tool calls text for better parsing, but also try to extract from incomplete JSON blocks
-            search_text = (preprocessed_tool_calls
-                           if preprocessed_tool_calls else current_text)
+            search_text = (
+                preprocessed_tool_calls if preprocessed_tool_calls else current_text
+            )
 
             # For JSON code blocks that aren't complete yet, try to extract the JSON content
             if not preprocessed_tool_calls and has_potential_json_block:
                 # Try to extract the JSON array from within the code block
-                json_match = re.search(r"```(?:json)?\s*([\s\S]*?)(?:```|$)",
-                                       current_text)
+                json_match = re.search(
+                    r"```(?:json)?\s*([\s\S]*?)(?:```|$)", current_text
+                )
                 if json_match:
                     potential_json = json_match.group(1).strip()
                     # Use this as search text even if it's incomplete
                     if potential_json.startswith("[") and (
-                            '"name"' in potential_json
-                            and '"arguments"' in potential_json):
+                        '"name"' in potential_json and '"arguments"' in potential_json
+                    ):
                         search_text = potential_json
 
             # Try to find complete tool names first
@@ -306,8 +334,7 @@ def extract_tool_calls_streaming(
             if tool_count == 0:
                 # Check if we're in the middle of parsing a tool name
                 partial_name_pattern = r'"name"\s*:\s*"([^"]*)'
-                partial_matches = list(
-                    re.finditer(partial_name_pattern, search_text))
+                partial_matches = list(re.finditer(partial_name_pattern, search_text))
                 if partial_matches:
                     # We have a partial tool name - not ready to emit yet
                     return None
@@ -317,14 +344,13 @@ def extract_tool_calls_streaming(
 
             # Ensure our state arrays are large enough
             while len(self.streaming_state["sent_tools"]) < tool_count:
-                self.streaming_state["sent_tools"].append({
-                    "sent_name":
-                    False,
-                    "sent_arguments_prefix":
-                    False,
-                    "sent_arguments":
-                    "",
-                })
+                self.streaming_state["sent_tools"].append(
+                    {
+                        "sent_name": False,
+                        "sent_arguments_prefix": False,
+                        "sent_arguments": "",
+                    }
+                )
 
             while len(self.streaming_state["tool_ids"]) < tool_count:
                 self.streaming_state["tool_ids"].append(None)
@@ -337,14 +363,13 @@ def extract_tool_calls_streaming(
                 next_idx = current_idx + 1
 
                 # If tool at next_idx has not been sent yet
-                if (next_idx < tool_count
-                        and not self.streaming_state["sent_tools"][next_idx]
-                    ["sent_name"]):
+                if (
+                    next_idx < tool_count
+                    and not self.streaming_state["sent_tools"][next_idx]["sent_name"]
+                ):
                     # Update indexes
                     self.streaming_state["current_tool_index"] = next_idx
-                    self.current_tool_id = (
-                        next_idx  # For backward compatibility
-                    )
+                    self.current_tool_id = next_idx  # For backward compatibility
                     current_idx = next_idx
 
                     # Extract the tool name
@@ -354,21 +379,20 @@ def extract_tool_calls_streaming(
                     tool_id = f"call_{current_idx}_{random_uuid()}"
                     self.streaming_state["tool_ids"][current_idx] = tool_id
 
-                    delta = DeltaMessage(tool_calls=[
-                        DeltaToolCall(
-                            index=current_idx,
-                            type="function",
-                            id=tool_id,
-                            function=DeltaFunctionCall(
-                                name=tool_name).model_dump(
-                                    exclude_none=True),  # type: ignore
-                        )
-                    ])
-                    self.streaming_state["sent_tools"][current_idx][
-                        "sent_name"] = True
-                    self.current_tool_name_sent = (
-                        True  # For backward compatibility
+                    delta = DeltaMessage(
+                        tool_calls=[
+                            DeltaToolCall(
+                                index=current_idx,
+                                type="function",
+                                id=tool_id,
+                                function=DeltaFunctionCall(name=tool_name).model_dump(
+                                    exclude_none=True
+                                ),  # type: ignore
+                            )
+                        ]
                     )
+                    self.streaming_state["sent_tools"][current_idx]["sent_name"] = True
+                    self.current_tool_name_sent = True  # For backward compatibility
 
                     # Keep track of streamed args for backward compatibility
                     while len(self.streamed_args) <= current_idx:
@@ -381,7 +405,8 @@ def extract_tool_calls_streaming(
                 # Support both regular and empty argument objects
                 # First, check for the empty arguments case: "arguments": {}
                 empty_args_pattern = (
-                    r'"name"\s*:\s*"[^"]+"\s*,\s*"arguments"\s*:\s*\{\s*\}')
+                    r'"name"\s*:\s*"[^"]+"\s*,\s*"arguments"\s*:\s*\{\s*\}'
+                )
                 empty_args_match = re.search(empty_args_pattern, search_text)
 
                 # Check if this tool has empty arguments
@@ -391,36 +416,39 @@ def extract_tool_calls_streaming(
                     for i in range(tool_count):
                         if i == current_idx:
                             # If this is our current tool and it has empty arguments
-                            if not self.streaming_state["sent_tools"][
-                                    current_idx]["sent_arguments_prefix"]:
+                            if not self.streaming_state["sent_tools"][current_idx][
+                                "sent_arguments_prefix"
+                            ]:
                                 # Send empty object
-                                self.streaming_state["sent_tools"][
-                                    current_idx][
-                                        "sent_arguments_prefix"] = True
-                                self.streaming_state["sent_tools"][
-                                    current_idx]["sent_arguments"] = "{}"
+                                self.streaming_state["sent_tools"][current_idx][
+                                    "sent_arguments_prefix"
+                                ] = True
+                                self.streaming_state["sent_tools"][current_idx][
+                                    "sent_arguments"
+                                ] = "{}"
 
                                 # Update streamed_args for backward compatibility
                                 while len(self.streamed_args) <= current_idx:
                                     self.streamed_args.append("")
                                 self.streamed_args[current_idx] += "{}"
 
-                                delta = DeltaMessage(tool_calls=[
-                                    DeltaToolCall(
-                                        index=current_idx,
-                                        function=DeltaFunctionCall(
-                                            arguments="{}").
-                                        model_dump(
-                                            exclude_none=True),  # type: ignore
-                                    )
-                                ])
+                                delta = DeltaMessage(
+                                    tool_calls=[
+                                        DeltaToolCall(
+                                            index=current_idx,
+                                            function=DeltaFunctionCall(
+                                                arguments="{}"
+                                            ).model_dump(exclude_none=True),  # type: ignore
+                                        )
+                                    ]
+                                )
 
                                 # Move to next tool if available
                                 if current_idx < tool_count - 1:
-                                    self.streaming_state[
-                                        "current_tool_index"] += 1
+                                    self.streaming_state["current_tool_index"] += 1
                                     self.current_tool_id = self.streaming_state[
-                                        "current_tool_index"]
+                                        "current_tool_index"
+                                    ]
 
                                 return delta
 
@@ -439,72 +467,77 @@ def extract_tool_calls_streaming(
                         # Parse the entire JSON structure to properly extract arguments for each tool
                         try:
                             parsed_tools = json.loads(search_text)
-                            if isinstance(
-                                    parsed_tools,
-                                    list) and current_idx < len(parsed_tools):
+                            if isinstance(parsed_tools, list) and current_idx < len(
+                                parsed_tools
+                            ):
                                 current_tool = parsed_tools[current_idx]
-                                if isinstance(current_tool.get("arguments"),
-                                              dict):
-                                    args_text = json.dumps(
-                                        current_tool["arguments"])
+                                if isinstance(current_tool.get("arguments"), dict):
+                                    args_text = json.dumps(current_tool["arguments"])
                                 else:
-                                    args_text = str(
-                                        current_tool.get("arguments", "{}"))
+                                    args_text = str(current_tool.get("arguments", "{}"))
                         except (json.JSONDecodeError, KeyError, IndexError):
                             # Fallback to regex-based extraction
                             pass
 
                     # If arguments haven't been sent yet
-                    sent_args = self.streaming_state["sent_tools"][
-                        current_idx]["sent_arguments"]
+                    sent_args = self.streaming_state["sent_tools"][current_idx][
+                        "sent_arguments"
+                    ]
 
                     # If we haven't sent the opening bracket yet
                     if not self.streaming_state["sent_tools"][current_idx][
-                            "sent_arguments_prefix"] and args_text.startswith(
-                                "{"):
+                        "sent_arguments_prefix"
+                    ] and args_text.startswith("{"):
                         self.streaming_state["sent_tools"][current_idx][
-                            "sent_arguments_prefix"] = True
+                            "sent_arguments_prefix"
+                        ] = True
                         self.streaming_state["sent_tools"][current_idx][
-                            "sent_arguments"] = "{"
+                            "sent_arguments"
+                        ] = "{"
 
                         # Update streamed_args for backward compatibility
                         while len(self.streamed_args) <= current_idx:
                             self.streamed_args.append("")
                         self.streamed_args[current_idx] += "{"
 
-                        delta = DeltaMessage(tool_calls=[
-                            DeltaToolCall(
-                                index=current_idx,
-                                function=DeltaFunctionCall(
-                                    arguments="{").model_dump(
-                                        exclude_none=True),  # type: ignore
-                            )
-                        ])
+                        delta = DeltaMessage(
+                            tool_calls=[
+                                DeltaToolCall(
+                                    index=current_idx,
+                                    function=DeltaFunctionCall(
+                                        arguments="{"
+                                    ).model_dump(exclude_none=True),  # type: ignore
+                                )
+                            ]
+                        )
                         return delta
 
                     # If we need to send more arguments
                     if args_text.startswith(sent_args):
                         # Calculate what part of arguments we need to send
-                        args_diff = args_text[len(sent_args):]
+                        args_diff = args_text[len(sent_args) :]
 
                         if args_diff:
                             # Update our state
                             self.streaming_state["sent_tools"][current_idx][
-                                "sent_arguments"] = args_text
+                                "sent_arguments"
+                            ] = args_text
 
                             # Update streamed_args for backward compatibility
                             while len(self.streamed_args) <= current_idx:
                                 self.streamed_args.append("")
                             self.streamed_args[current_idx] += args_diff
 
-                            delta = DeltaMessage(tool_calls=[
-                                DeltaToolCall(
-                                    index=current_idx,
-                                    function=DeltaFunctionCall(
-                                        arguments=args_diff).model_dump(
-                                            exclude_none=True),  # type: ignore
-                                )
-                            ])
+                            delta = DeltaMessage(
+                                tool_calls=[
+                                    DeltaToolCall(
+                                        index=current_idx,
+                                        function=DeltaFunctionCall(
+                                            arguments=args_diff
+                                        ).model_dump(exclude_none=True),  # type: ignore
+                                    )
+                                ]
+                            )
                             return delta
 
                     # If the tool's arguments are complete, check if we need to move to the next tool
@@ -513,7 +546,8 @@ def extract_tool_calls_streaming(
                         if current_idx < tool_count - 1:
                             self.streaming_state["current_tool_index"] += 1
                             self.current_tool_id = self.streaming_state[
-                                "current_tool_index"]  # For compatibility
+                                "current_tool_index"
+                            ]  # For compatibility
 
             # If we got here, we couldn't determine what to stream next
             return None
diff --git a/vllm/entrypoints/renderer.py b/vllm/entrypoints/renderer.py
index f6fc045a1877..98c9cbbbd376 100644
--- a/vllm/entrypoints/renderer.py
+++ b/vllm/entrypoints/renderer.py
@@ -42,8 +42,7 @@ class RenderConfig:
     needs_detokenization: Optional[bool] = False
     """If True, detokenize IDs back to text for inclusion in outputs."""
 
-    def verify_truncate_prompt_tokens(
-            self, model_config: ModelConfig) -> Optional[int]:
+    def verify_truncate_prompt_tokens(self, model_config: ModelConfig) -> Optional[int]:
         """Validate and normalize `truncate_prompt_tokens` parameter."""
         truncate_prompt_tokens = self.truncate_prompt_tokens
         if truncate_prompt_tokens is None:
@@ -59,7 +58,8 @@ def verify_truncate_prompt_tokens(
         if max_length is not None and truncate_prompt_tokens > max_length:  # type: ignore[operator]
             raise ValueError(
                 f"{truncate_prompt_tokens=} cannot be greater than "
-                f"{max_length=}. Please select a smaller truncation size.")
+                f"{max_length=}. Please select a smaller truncation size."
+            )
 
         return truncate_prompt_tokens
 
@@ -67,13 +67,13 @@ def verify_truncate_prompt_tokens(
 class BaseRenderer(ABC):
     """
     Base class for unified input processing and rendering.
-    
+
     The Renderer serves as a unified input processor that consolidates
     tokenization, chat template formatting, and multimodal input handling
     into a single component.
     It converts high-level API requests (OpenAI-style JSON) into token IDs and
     multimodal features ready for engine consumption.
-    
+
     Key responsibilities:
     - Convert text prompts to token sequences with proper special tokens
     - Apply chat templates and format conversations
@@ -112,7 +112,7 @@ async def render_prompt(
                 - ``list[int]``: Single pre-tokenized sequence.
                 - ``list[list[int]]``: Batch of pre-tokenized sequences.
             config: Render configuration controlling how prompts are prepared
-                (e.g., tokenization and length handling). 
+                (e.g., tokenization and length handling).
 
         Returns:
             list[EngineTokensPrompt]: Engine-ready token prompts.
@@ -126,8 +126,9 @@ async def render_prompt(
     async def render_prompt_and_embeds(
         self,
         *,
-        prompt_or_prompts: Optional[Union[str, list[str], list[int],
-                                          list[list[int]]]] = None,
+        prompt_or_prompts: Optional[
+            Union[str, list[str], list[int], list[list[int]]]
+        ] = None,
         prompt_embeds: Optional[Union[bytes, list[bytes]]] = None,
         config: RenderConfig,
     ) -> list[Union[EngineTokensPrompt, EngineEmbedsPrompt]]:
@@ -144,7 +145,7 @@ async def render_prompt_and_embeds(
             prompt_embeds: Base64-encoded bytes (or list thereof) containing a
                 torch-saved tensor to be used as prompt embeddings.
             config: Render configuration controlling how prompts are prepared
-                (e.g., tokenization and length handling). 
+                (e.g., tokenization and length handling).
 
         Returns:
             list[Union[EngineTokensPrompt, EngineEmbedsPrompt]]:
@@ -195,13 +196,13 @@ def _load_and_validate_embed(embed: bytes) -> EngineEmbedsPrompt:
 
 
 class CompletionRenderer(BaseRenderer):
-
     def __init__(
         self,
         model_config: ModelConfig,
         tokenizer: Optional[AnyTokenizer] = None,
-        async_tokenizer_pool: Optional[dict[AnyTokenizer,
-                                            AsyncMicrobatchTokenizer]] = None,
+        async_tokenizer_pool: Optional[
+            dict[AnyTokenizer, AsyncMicrobatchTokenizer]
+        ] = None,
     ):
         super().__init__(model_config, tokenizer)
         self.async_tokenizer_pool = async_tokenizer_pool
@@ -214,28 +215,31 @@ async def render_prompt(
         config: RenderConfig,
     ) -> list[EngineTokensPrompt]:
         """Implementation of prompt rendering for completion-style requests.
-        
+
         Uses async tokenizer pooling for improved performance. See base class
         for detailed parameter documentation.
         """
-        truncate_prompt_tokens = config.verify_truncate_prompt_tokens(
-            self.model_config)
+        truncate_prompt_tokens = config.verify_truncate_prompt_tokens(self.model_config)
         if truncate_prompt_tokens == 0:
             return []
 
-        tasks = (self._create_prompt(
-            prompt_input,
-            config=config,
-            truncate_prompt_tokens=truncate_prompt_tokens,
-        ) for prompt_input in parse_raw_prompts(prompt_or_prompts))
+        tasks = (
+            self._create_prompt(
+                prompt_input,
+                config=config,
+                truncate_prompt_tokens=truncate_prompt_tokens,
+            )
+            for prompt_input in parse_raw_prompts(prompt_or_prompts)
+        )
 
         return await asyncio.gather(*tasks)
 
     async def render_prompt_and_embeds(
         self,
         *,
-        prompt_or_prompts: Optional[Union[str, list[str], list[int],
-                                          list[list[int]]]] = None,
+        prompt_or_prompts: Optional[
+            Union[str, list[str], list[int], list[list[int]]]
+        ] = None,
         prompt_embeds: Optional[Union[bytes, list[bytes]]] = None,
         config: RenderConfig,
     ) -> list[Union[EngineTokensPrompt, EngineEmbedsPrompt]]:
@@ -243,8 +247,7 @@ async def render_prompt_and_embeds(
         Render text/token prompts and/or precomputed embedding prompts. At
         least one of `prompt_or_prompts` or `prompt_embeds` must be provided.
         """
-        truncate_prompt_tokens = config.verify_truncate_prompt_tokens(
-            self.model_config)
+        truncate_prompt_tokens = config.verify_truncate_prompt_tokens(self.model_config)
         if truncate_prompt_tokens == 0:
             return []
 
@@ -252,8 +255,10 @@ async def render_prompt_and_embeds(
 
         if prompt_embeds is not None:
             rendered.extend(
-                self.load_prompt_embeds(prompt_embeds, truncate_prompt_tokens,
-                                        config.cache_salt))
+                self.load_prompt_embeds(
+                    prompt_embeds, truncate_prompt_tokens, config.cache_salt
+                )
+            )
         if prompt_or_prompts is None or prompt_or_prompts == "":
             return rendered
 
@@ -266,8 +271,8 @@ async def render_prompt_and_embeds(
         return rendered
 
     def _maybe_apply_truncation(
-            self, token_ids: list[int],
-            truncate_prompt_tokens: Optional[int]) -> list[int]:
+        self, token_ids: list[int], truncate_prompt_tokens: Optional[int]
+    ) -> list[int]:
         """Apply truncation to token sequence."""
         if truncate_prompt_tokens is None:
             return token_ids
@@ -319,24 +324,26 @@ async def _create_prompt_from_text(
         async_tokenizer = self._get_async_tokenizer()
 
         # Handle encoder-specific preprocessing
-        if (self.model_config.encoder_config is not None
-                and self.model_config.encoder_config.get(
-                    "do_lower_case", False)):
+        if (
+            self.model_config.encoder_config is not None
+            and self.model_config.encoder_config.get("do_lower_case", False)
+        ):
             text = text.lower()
 
         # Tokenize texts
         if truncate_prompt_tokens is None:
-            encoded = await async_tokenizer(
-                text, add_special_tokens=add_special_tokens)
+            encoded = await async_tokenizer(text, add_special_tokens=add_special_tokens)
         else:
             encoded = await async_tokenizer(
                 text,
                 add_special_tokens=add_special_tokens,
                 truncation=True,
-                max_length=truncate_prompt_tokens)
+                max_length=truncate_prompt_tokens,
+            )
 
-        return self._create_tokens_prompt(encoded.input_ids, max_length,
-                                          cache_salt, text)
+        return self._create_tokens_prompt(
+            encoded.input_ids, max_length, cache_salt, text
+        )
 
     async def _create_prompt_from_token_ids(
         self,
@@ -347,18 +354,19 @@ async def _create_prompt_from_token_ids(
         needs_detokenization: Optional[bool] = False,
     ) -> EngineTokensPrompt:
         """Optionally detokenize token IDs and build a tokens prompt."""
-        token_ids = self._maybe_apply_truncation(token_ids,
-                                                 truncate_prompt_tokens)
+        token_ids = self._maybe_apply_truncation(token_ids, truncate_prompt_tokens)
 
         prompt = None
         if needs_detokenization:
             async_tokenizer = self._get_async_tokenizer()
             prompt = await async_tokenizer.decode(token_ids)
 
-        return self._create_tokens_prompt(token_ids=token_ids,
-                                          max_length=max_length,
-                                          cache_salt=cache_salt,
-                                          prompt=prompt)
+        return self._create_tokens_prompt(
+            token_ids=token_ids,
+            max_length=max_length,
+            cache_salt=cache_salt,
+            prompt=prompt,
+        )
 
     def _get_async_tokenizer(self) -> AsyncMicrobatchTokenizer:
         """Get or create async tokenizer using shared pool."""
@@ -368,8 +376,7 @@ def _get_async_tokenizer(self) -> AsyncMicrobatchTokenizer:
 
         tokenizer = self.tokenizer
         if self.tokenizer is None:
-            raise ValueError(
-                "No tokenizer available for text input processing")
+            raise ValueError("No tokenizer available for text input processing")
 
         if self.async_tokenizer_pool is None:
             async_tokenizer = AsyncMicrobatchTokenizer(tokenizer)
@@ -393,7 +400,8 @@ def _create_tokens_prompt(
             raise ValueError(
                 f"This model's maximum context length is {max_length} tokens. "
                 f"However, your request has {len(token_ids)} input tokens. "
-                "Please reduce the length of the input messages.")
+                "Please reduce the length of the input messages."
+            )
 
         tokens_prompt = EngineTokensPrompt(prompt_token_ids=token_ids)
         if cache_salt is not None:
diff --git a/vllm/entrypoints/score_utils.py b/vllm/entrypoints/score_utils.py
index 642d6389539b..1fb56d246deb 100644
--- a/vllm/entrypoints/score_utils.py
+++ b/vllm/entrypoints/score_utils.py
@@ -7,31 +7,39 @@
 
 from vllm.config import ModelConfig
 from vllm.entrypoints.chat_utils import (
-    BaseMultiModalItemTracker, ChatCompletionContentPartImageEmbedsParam,
-    ChatCompletionContentPartImageParam, ChatCompletionContentPartTextParam,
-    MultiModalItemTracker, _ContentPart, _parse_chat_message_content_part)
+    BaseMultiModalItemTracker,
+    ChatCompletionContentPartImageEmbedsParam,
+    ChatCompletionContentPartImageParam,
+    ChatCompletionContentPartTextParam,
+    MultiModalItemTracker,
+    _ContentPart,
+    _parse_chat_message_content_part,
+)
 from vllm.inputs import TokensPrompt
 from vllm.model_executor.models.interfaces import supports_score_template
 from vllm.multimodal.inputs import MultiModalDataDict
 from vllm.outputs import PoolingRequestOutput
-from vllm.transformers_utils.tokenizer import (AnyTokenizer,
-                                               PreTrainedTokenizer,
-                                               PreTrainedTokenizerFast)
+from vllm.transformers_utils.tokenizer import (
+    AnyTokenizer,
+    PreTrainedTokenizer,
+    PreTrainedTokenizerFast,
+)
 
 ScoreContentPartParam: TypeAlias = Union[
-    ChatCompletionContentPartImageParam,
-    ChatCompletionContentPartImageEmbedsParam]
+    ChatCompletionContentPartImageParam, ChatCompletionContentPartImageEmbedsParam
+]
 
 
 class ScoreMultiModalParam(TypedDict, total=False):
     """
     A specialized parameter type for scoring multimodal content
-    
+
     The reasons why don't reuse `CustomChatCompletionMessageParam` directly:
     1. Score tasks don't need the 'role' field (user/assistant/system) that's required in chat completions
     2. Including chat-specific fields would confuse users about their purpose in scoring
     3. This is a more focused interface that only exposes what's needed for scoring
-    """ # noqa: E501
+    """  # noqa: E501
+
     content: Required[list[ScoreContentPartParam]]
     """The multimodal contents"""
 
@@ -41,7 +49,6 @@ def _cosine_similarity(
     embed_1: list[PoolingRequestOutput],
     embed_2: list[PoolingRequestOutput],
 ) -> list[PoolingRequestOutput]:
-
     scorer = CosineSimilarity(0)
     scores: Union[list[PoolingRequestOutput]] = []
 
@@ -49,8 +56,7 @@ def _cosine_similarity(
         pair_score = scorer(emb_1.outputs.data, emb_2.outputs.data)
 
         padding = []
-        if (pad_token_id := getattr(tokenizer, "pad_token_id",
-                                    None)) is not None:
+        if (pad_token_id := getattr(tokenizer, "pad_token_id", None)) is not None:
             padding = [pad_token_id]
 
         tokens = emb_1.prompt_token_ids + padding + emb_2.prompt_token_ids
@@ -60,7 +66,9 @@ def _cosine_similarity(
                 request_id=f"{emb_1.request_id}_{emb_2.request_id}",
                 outputs=pair_score,
                 prompt_token_ids=tokens,
-                finished=True))
+                finished=True,
+            )
+        )
 
     return scores
 
@@ -96,8 +104,7 @@ def ensure_str(content: Optional[_ContentPart]) -> str:
         if content is not None and isinstance(content, str):
             return cast(str, content)
         else:
-            raise ValueError(
-                f"Only string content is supported, but got {content}.")
+            raise ValueError(f"Only string content is supported, but got {content}.")
 
     prompt_1 = ensure_str(content_1)
     prompt_2 = ensure_str(content_2)
@@ -109,7 +116,6 @@ def _parse_score_content(
     data: Union[str, ScoreContentPartParam],
     mm_tracker: BaseMultiModalItemTracker,
 ) -> Optional[_ContentPart]:
-
     if isinstance(data, str):
         data = ChatCompletionContentPartTextParam(type="text", text=data)
 
@@ -127,8 +133,10 @@ def _parse_score_content(
 
     mm_placeholder_storage = mm_parser.mm_placeholder_storage()
 
-    if len(mm_placeholder_storage) != 1 or len(
-            next(iter(mm_placeholder_storage.values()))) != 1:
+    if (
+        len(mm_placeholder_storage) != 1
+        or len(next(iter(mm_placeholder_storage.values()))) != 1
+    ):
         raise ValueError("Only one multi-modal item is supported")
 
     return next(iter(mm_placeholder_storage.values()))[0]
@@ -149,8 +157,7 @@ def apply_score_template(
             raise ValueError("Get empty score template from model")
         return full_prompt
 
-    raise ValueError(
-        f"Unsupported model architecture: {model_config.architecture}")
+    raise ValueError(f"Unsupported model architecture: {model_config.architecture}")
 
 
 def post_process_tokens(
@@ -159,7 +166,7 @@ def post_process_tokens(
 ) -> None:
     """
     Perform architecture-specific manipulations on the input tokens.
-    
+
     Note:
         This is an in-place operation.
     """
@@ -192,9 +199,9 @@ def get_score_prompt(
         prompt_inputs = tokenizer(full_prompt, **tokenization_kwargs)
     elif model_config.use_pad_token:
         # cross_encoder models defaults to using pad_token.
-        prompt_inputs = tokenizer(text=prompt_1,
-                                  text_pair=prompt_2,
-                                  **tokenization_kwargs)
+        prompt_inputs = tokenizer(
+            text=prompt_1, text_pair=prompt_2, **tokenization_kwargs
+        )
         full_prompt = tokenizer.decode(prompt_inputs["input_ids"])
     else:
         # `llm as reranker` models defaults to not using pad_token.
@@ -219,8 +226,10 @@ def compress_token_type_ids(token_type_ids: list[int]) -> int:
     if not found.
     """
     first_one = len(token_type_ids)
-    err_msg = "Token type ids are expected to be a sequence"\
-              " of zeros followed by a sequence of ones"
+    err_msg = (
+        "Token type ids are expected to be a sequence"
+        " of zeros followed by a sequence of ones"
+    )
     for i, type_id in enumerate(token_type_ids):
         if type_id == 0 and first_one < i:
             raise ValueError(err_msg)
diff --git a/vllm/entrypoints/ssl.py b/vllm/entrypoints/ssl.py
index e3646a60a7cc..ff0dd1bbfc6b 100644
--- a/vllm/entrypoints/ssl.py
+++ b/vllm/entrypoints/ssl.py
@@ -17,11 +17,13 @@ class SSLCertRefresher:
     reloads them when they change.
     """
 
-    def __init__(self,
-                 ssl_context: SSLContext,
-                 key_path: Optional[str] = None,
-                 cert_path: Optional[str] = None,
-                 ca_path: Optional[str] = None) -> None:
+    def __init__(
+        self,
+        ssl_context: SSLContext,
+        key_path: Optional[str] = None,
+        cert_path: Optional[str] = None,
+        ca_path: Optional[str] = None,
+    ) -> None:
         self.ssl = ssl_context
         self.key_path = key_path
         self.cert_path = cert_path
@@ -36,8 +38,10 @@ def update_ssl_cert_chain(change: Change, file_path: str) -> None:
         self.watch_ssl_cert_task = None
         if self.key_path and self.cert_path:
             self.watch_ssl_cert_task = asyncio.create_task(
-                self._watch_files([self.key_path, self.cert_path],
-                                  update_ssl_cert_chain))
+                self._watch_files(
+                    [self.key_path, self.cert_path], update_ssl_cert_chain
+                )
+            )
 
         # Setup CA files watcher
         def update_ssl_ca(change: Change, file_path: str) -> None:
@@ -48,22 +52,21 @@ def update_ssl_ca(change: Change, file_path: str) -> None:
         self.watch_ssl_ca_task = None
         if self.ca_path:
             self.watch_ssl_ca_task = asyncio.create_task(
-                self._watch_files([self.ca_path], update_ssl_ca))
+                self._watch_files([self.ca_path], update_ssl_ca)
+            )
 
-    async def _watch_files(self, paths, fun: Callable[[Change, str],
-                                                      None]) -> None:
+    async def _watch_files(self, paths, fun: Callable[[Change, str], None]) -> None:
         """Watch multiple file paths asynchronously."""
         logger.info("SSLCertRefresher monitors files: %s", paths)
         async for changes in awatch(*paths):
             try:
                 for change, file_path in changes:
-                    logger.info("File change detected: %s - %s", change.name,
-                                file_path)
+                    logger.info("File change detected: %s - %s", change.name, file_path)
                     fun(change, file_path)
             except Exception as e:
                 logger.error(
-                    "SSLCertRefresher failed taking action on file change. "
-                    "Error: %s", e)
+                    "SSLCertRefresher failed taking action on file change. Error: %s", e
+                )
 
     def stop(self) -> None:
         """Stop watching files."""
diff --git a/vllm/entrypoints/tool.py b/vllm/entrypoints/tool.py
index f5f4d7d3b556..1bc6a85a9a25 100644
--- a/vllm/entrypoints/tool.py
+++ b/vllm/entrypoints/tool.py
@@ -30,8 +30,7 @@ def validate_gpt_oss_install():
     except PackageNotFoundError:
         raise ImportError("Package 'gpt_oss' is not installed.") from None
     except InvalidVersion as e:
-        raise ImportError(
-            f"Invalid version string for 'gpt_oss': {e}") from None
+        raise ImportError(f"Invalid version string for 'gpt_oss': {e}") from None
 
     if pkg_version < Version("0.0.3"):
         raise ImportError(
@@ -40,14 +39,12 @@ def validate_gpt_oss_install():
 
 
 class Tool(ABC):
-
     @abstractmethod
     async def get_result(self, context: "ConversationContext") -> Any:
         pass
 
 
 class HarmonyBrowserTool(Tool):
-
     def __init__(self):
         self.enabled = True
         exa_api_key = os.getenv("EXA_API_KEY")
@@ -63,8 +60,8 @@ def __init__(self):
         except ImportError as e:
             self.enabled = False
             logger.warning_once(
-                "gpt_oss is not installed properly (%s), browsing is disabled",
-                e)
+                "gpt_oss is not installed properly (%s), browsing is disabled", e
+            )
             return
 
         browser_backend = ExaBackend(source="web", api_key=exa_api_key)
@@ -73,6 +70,7 @@ def __init__(self):
 
     async def get_result(self, context: "ConversationContext") -> Any:
         from vllm.entrypoints.context import HarmonyContext
+
         assert isinstance(context, HarmonyContext)
         last_msg = context.messages[-1]
         tool_output_msgs = []
@@ -86,7 +84,6 @@ def tool_config(self) -> Any:
 
 
 class HarmonyPythonTool(Tool):
-
     def __init__(self):
         self.enabled = True
 
@@ -96,8 +93,9 @@ def __init__(self):
         except ImportError as e:
             self.enabled = False
             logger.warning_once(
-                "gpt_oss is not installed properly (%s), code interpreter is "
-                "disabled", e)
+                "gpt_oss is not installed properly (%s), code interpreter is disabled",
+                e,
+            )
             return
 
         self.python_tool = PythonTool()
@@ -121,12 +119,15 @@ async def validate(self):
             self.enabled = False
             logger.warning_once(
                 "Code interpreter tool failed to initialize (%s), code "
-                "interpreter is disabled", e)
+                "interpreter is disabled",
+                e,
+            )
             return
         logger.info_once("Code interpreter tool initialized")
 
     async def get_result(self, context: "ConversationContext") -> Any:
         from vllm.entrypoints.context import HarmonyContext
+
         assert isinstance(context, HarmonyContext)
         last_msg = context.messages[-1]
         tool_output_msgs = []
diff --git a/vllm/entrypoints/tool_server.py b/vllm/entrypoints/tool_server.py
index 4c627b865ef9..b3dceecc1583 100644
--- a/vllm/entrypoints/tool_server.py
+++ b/vllm/entrypoints/tool_server.py
@@ -18,8 +18,11 @@
 async def list_server_and_tools(server_url: str):
     from mcp import ClientSession
     from mcp.client.sse import sse_client
-    async with sse_client(url=server_url) as streams, ClientSession(
-            *streams) as session:
+
+    async with (
+        sse_client(url=server_url) as streams,
+        ClientSession(*streams) as session,
+    ):
         initialize_response = await session.initialize()
         list_tools_response = await session.list_tools()
         return initialize_response, list_tools_response
@@ -37,21 +40,22 @@ def trim_schema(schema: dict) -> dict:
         # if there's more than 1 types, also remove "null" type as Harmony will
         # just ignore it
         types = [
-            type_dict["type"] for type_dict in schema["anyOf"]
-            if type_dict["type"] != 'null'
+            type_dict["type"]
+            for type_dict in schema["anyOf"]
+            if type_dict["type"] != "null"
         ]
         schema["type"] = types
         del schema["anyOf"]
     if "properties" in schema:
         schema["properties"] = {
-            k: trim_schema(v)
-            for k, v in schema["properties"].items()
+            k: trim_schema(v) for k, v in schema["properties"].items()
         }
     return schema
 
 
 def post_process_tools_description(
-        list_tools_result: "ListToolsResult") -> "ListToolsResult":
+    list_tools_result: "ListToolsResult",
+) -> "ListToolsResult":
     # Adapt the MCP tool result for Harmony
     for tool in list_tools_result.tools:
         tool.inputSchema = trim_schema(tool.inputSchema)
@@ -59,7 +63,8 @@ def post_process_tools_description(
     # Some tools schema don't need to be part of the prompt (e.g. simple text
     # in text out for Python)
     list_tools_result.tools = [
-        tool for tool in list_tools_result.tools
+        tool
+        for tool in list_tools_result.tools
         if getattr(tool.annotations, "include_in_prompt", True)
     ]
 
@@ -67,7 +72,6 @@ def post_process_tools_description(
 
 
 class ToolServer(ABC):
-
     @abstractmethod
     def has_tool(self, tool_name: str) -> bool:
         """
@@ -76,8 +80,7 @@ def has_tool(self, tool_name: str) -> bool:
         pass
 
     @abstractmethod
-    def get_tool_description(self,
-                             tool_name: str) -> Optional[ToolNamespaceConfig]:
+    def get_tool_description(self, tool_name: str) -> Optional[ToolNamespaceConfig]:
         """
         Return the tool description for the given tool name.
         If the tool is not supported, return None.
@@ -86,10 +89,7 @@ def get_tool_description(self,
 
     @abstractmethod
     def new_session(
-        self,
-        tool_name: str,
-        session_id: str,
-        headers: Optional[dict[str, str]] = None
+        self, tool_name: str, session_id: str, headers: Optional[dict[str, str]] = None
     ) -> AbstractAsyncContextManager[Any]:
         """
         Create a session for the tool.
@@ -98,14 +98,14 @@ def new_session(
 
 
 class MCPToolServer(ToolServer):
-
     def __init__(self):
         try:
             import mcp  # noqa: F401
         except ImportError:
             raise ImportError(
                 "mcp is not installed. Please run `pip install mcp` to use "
-                "MCPToolServer.") from None
+                "MCPToolServer."
+            ) from None
         self.harmony_tool_descriptions = {}
 
     async def add_tool_server(self, server_url: str):
@@ -114,19 +114,19 @@ async def add_tool_server(self, server_url: str):
         self.urls: dict[str, str] = {}
         for url in tool_urls:
             url = f"http://{url}/sse"
-            initialize_response, list_tools_response = (
-                await list_server_and_tools(url))
+            initialize_response, list_tools_response = await list_server_and_tools(url)
 
-            list_tools_response = post_process_tools_description(
-                list_tools_response)
+            list_tools_response = post_process_tools_description(list_tools_response)
 
             tool_from_mcp = ToolNamespaceConfig(
                 name=initialize_response.serverInfo.name,
                 description=initialize_response.instructions,
                 tools=[
-                    ToolDescription.new(name=tool.name,
-                                        description=tool.description,
-                                        parameters=tool.inputSchema)
+                    ToolDescription.new(
+                        name=tool.name,
+                        description=tool.description,
+                        parameters=tool.inputSchema,
+                    )
                     for tool in list_tools_response.tools
                 ],
             )
@@ -136,9 +136,13 @@ async def add_tool_server(self, server_url: str):
             else:
                 logger.warning(
                     "Tool %s already exists. Ignoring duplicate tool server %s",
-                    tool_from_mcp.name, url)
-        logger.info("MCPToolServer initialized with tools: %s",
-                    list(self.harmony_tool_descriptions.keys()))
+                    tool_from_mcp.name,
+                    url,
+                )
+        logger.info(
+            "MCPToolServer initialized with tools: %s",
+            list(self.harmony_tool_descriptions.keys()),
+        )
 
     def has_tool(self, tool_name: str):
         return tool_name in self.harmony_tool_descriptions
@@ -147,27 +151,27 @@ def get_tool_description(self, tool_name: str):
         return self.harmony_tool_descriptions.get(tool_name)
 
     @asynccontextmanager
-    async def new_session(self,
-                          tool_name: str,
-                          session_id: str,
-                          headers: Optional[dict[str, str]] = None):
+    async def new_session(
+        self, tool_name: str, session_id: str, headers: Optional[dict[str, str]] = None
+    ):
         from mcp import ClientSession
         from mcp.client.sse import sse_client
+
         url = self.urls.get(tool_name)
         request_headers = {"x-session-id": session_id}
         if headers is not None:
             request_headers.update(headers)
         if not url:
             raise KeyError(f"Tool '{tool_name}' is not supported")
-        async with sse_client(
-                url=url, headers=request_headers) as streams, ClientSession(
-                    *streams) as session:
+        async with (
+            sse_client(url=url, headers=request_headers) as streams,
+            ClientSession(*streams) as session,
+        ):
             await session.initialize()
             yield session
 
 
 class DemoToolServer(ToolServer):
-
     def __init__(self):
         self.tools: dict[str, Tool] = {}
 
@@ -179,14 +183,14 @@ async def init_and_validate(self):
             self.tools["browser"] = browser_tool
         if python_tool.enabled:
             self.tools["python"] = python_tool
-        logger.info("DemoToolServer initialized with tools: %s",
-                    list(self.tools.keys()))
+        logger.info(
+            "DemoToolServer initialized with tools: %s", list(self.tools.keys())
+        )
 
     def has_tool(self, tool_name: str) -> bool:
         return tool_name in self.tools
 
-    def get_tool_description(self,
-                             tool_name: str) -> Optional[ToolNamespaceConfig]:
+    def get_tool_description(self, tool_name: str) -> Optional[ToolNamespaceConfig]:
         if tool_name not in self.tools:
             return None
         if tool_name == "browser":
@@ -197,10 +201,9 @@ def get_tool_description(self,
             raise ValueError(f"Unknown tool {tool_name}")
 
     @asynccontextmanager
-    async def new_session(self,
-                          tool_name: str,
-                          session_id: str,
-                          headers: Optional[dict[str, str]] = None):
+    async def new_session(
+        self, tool_name: str, session_id: str, headers: Optional[dict[str, str]] = None
+    ):
         if tool_name not in self.tools:
             raise KeyError(f"Tool '{tool_name}' is not supported")
         yield self.tools[tool_name]
diff --git a/vllm/entrypoints/utils.py b/vllm/entrypoints/utils.py
index 4a90fe094ae2..c97ca6538814 100644
--- a/vllm/entrypoints/utils.py
+++ b/vllm/entrypoints/utils.py
@@ -14,8 +14,7 @@
 
 from vllm.engine.arg_utils import EngineArgs
 from vllm.entrypoints.openai.cli_args import make_arg_parser
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              CompletionRequest)
+from vllm.entrypoints.openai.protocol import ChatCompletionRequest, CompletionRequest
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 from vllm.utils import FlexibleArgumentParser
@@ -26,7 +25,8 @@
     "For full list:            vllm {subcmd} --help=all\n"
     "For a section:            vllm {subcmd} --help=ModelConfig    (case-insensitive)\n"  # noqa: E501
     "For a flag:               vllm {subcmd} --help=max-model-len  (_ or - accepted)\n"  # noqa: E501
-    "Documentation:            https://docs.vllm.ai\n")
+    "Documentation:            https://docs.vllm.ai\n"
+)
 
 
 async def listen_for_disconnect(request: Request) -> None:
@@ -37,9 +37,9 @@ async def listen_for_disconnect(request: Request) -> None:
             # If load tracking is enabled *and* the counter exists, decrement
             # it. Combines the previous nested checks into a single condition
             # to satisfy the linter rule.
-            if (getattr(request.app.state, "enable_server_load_tracking",
-                        False)
-                    and hasattr(request.app.state, "server_load_metrics")):
+            if getattr(
+                request.app.state, "enable_server_load_tracking", False
+            ) and hasattr(request.app.state, "server_load_metrics"):
                 request.app.state.server_load_metrics -= 1
             break
 
@@ -70,15 +70,15 @@ def with_cancellation(handler_func):
     # normal route handler, with the correct request type hinting.
     @functools.wraps(handler_func)
     async def wrapper(*args, **kwargs):
-
         # The request is either the second positional arg or `raw_request`
         request = args[1] if len(args) > 1 else kwargs["raw_request"]
 
         handler_task = asyncio.create_task(handler_func(*args, **kwargs))
         cancellation_task = asyncio.create_task(listen_for_disconnect(request))
 
-        done, pending = await asyncio.wait([handler_task, cancellation_task],
-                                           return_when=asyncio.FIRST_COMPLETED)
+        done, pending = await asyncio.wait(
+            [handler_task, cancellation_task], return_when=asyncio.FIRST_COMPLETED
+        )
         for task in pending:
             task.cancel()
 
@@ -94,18 +94,16 @@ def decrement_server_load(request: Request):
 
 
 def load_aware_call(func):
-
     @functools.wraps(func)
     async def wrapper(*args, **kwargs):
-        raw_request = kwargs.get("raw_request",
-                                 args[1] if len(args) > 1 else None)
+        raw_request = kwargs.get("raw_request", args[1] if len(args) > 1 else None)
 
         if raw_request is None:
             raise ValueError(
-                "raw_request required when server load tracking is enabled")
+                "raw_request required when server load tracking is enabled"
+            )
 
-        if not getattr(raw_request.app.state, "enable_server_load_tracking",
-                       False):
+        if not getattr(raw_request.app.state, "enable_server_load_tracking", False):
             return await func(*args, **kwargs)
 
         # ensure the counter exists
@@ -121,18 +119,18 @@ async def wrapper(*args, **kwargs):
 
         if isinstance(response, (JSONResponse, StreamingResponse)):
             if response.background is None:
-                response.background = BackgroundTask(decrement_server_load,
-                                                     raw_request)
+                response.background = BackgroundTask(decrement_server_load, raw_request)
             elif isinstance(response.background, BackgroundTasks):
-                response.background.add_task(decrement_server_load,
-                                             raw_request)
+                response.background.add_task(decrement_server_load, raw_request)
             elif isinstance(response.background, BackgroundTask):
                 # Convert the single BackgroundTask to BackgroundTasks
                 # and chain the decrement_server_load task to it
                 tasks = BackgroundTasks()
-                tasks.add_task(response.background.func,
-                               *response.background.args,
-                               **response.background.kwargs)
+                tasks.add_task(
+                    response.background.func,
+                    *response.background.args,
+                    **response.background.kwargs,
+                )
                 tasks.add_task(decrement_server_load, raw_request)
                 response.background = tasks
         else:
@@ -169,7 +167,6 @@ def _validate_truncation_size(
     truncate_prompt_tokens: Optional[int],
     tokenization_kwargs: Optional[dict[str, Any]] = None,
 ) -> Optional[int]:
-
     if truncate_prompt_tokens is not None:
         if truncate_prompt_tokens <= -1:
             truncate_prompt_tokens = max_model_len
@@ -178,7 +175,8 @@ def _validate_truncation_size(
             raise ValueError(
                 f"truncate_prompt_tokens value ({truncate_prompt_tokens}) "
                 f"is greater than max_model_len ({max_model_len})."
-                f" Please, select a smaller truncation size.")
+                f" Please, select a smaller truncation size."
+            )
 
         if tokenization_kwargs is not None:
             tokenization_kwargs["truncation"] = True
@@ -191,19 +189,26 @@ def _validate_truncation_size(
     return truncate_prompt_tokens
 
 
-def get_max_tokens(max_model_len: int, request: Union[ChatCompletionRequest,
-                                                      CompletionRequest],
-                   input_length: int, default_sampling_params: dict) -> int:
-
-    max_tokens = getattr(request, "max_completion_tokens",
-                         None) or request.max_tokens
+def get_max_tokens(
+    max_model_len: int,
+    request: Union[ChatCompletionRequest, CompletionRequest],
+    input_length: int,
+    default_sampling_params: dict,
+) -> int:
+    max_tokens = getattr(request, "max_completion_tokens", None) or request.max_tokens
     default_max_tokens = max_model_len - input_length
     max_output_tokens = current_platform.get_max_output_tokens(input_length)
 
-    return min(val
-               for val in (default_max_tokens, max_tokens, max_output_tokens,
-                           default_sampling_params.get("max_tokens"))
-               if val is not None)
+    return min(
+        val
+        for val in (
+            default_max_tokens,
+            max_tokens,
+            max_output_tokens,
+            default_sampling_params.get("max_tokens"),
+        )
+        if val is not None
+    )
 
 
 def log_non_default_args(args: Union[Namespace, EngineArgs]):
@@ -227,7 +232,8 @@ def log_non_default_args(args: Union[Namespace, EngineArgs]):
         if default_args.model != EngineArgs.model:
             non_default_args["model"] = default_args.model
     else:
-        raise TypeError("Unsupported argument type. " \
-        "Must be Namespace or EngineArgs instance.")
+        raise TypeError(
+            "Unsupported argument type. Must be Namespace or EngineArgs instance."
+        )
 
     logger.info("non-default args: %s", non_default_args)
diff --git a/vllm/env_override.py b/vllm/env_override.py
index b06703a2fbf9..7f9054e73846 100644
--- a/vllm/env_override.py
+++ b/vllm/env_override.py
@@ -15,9 +15,9 @@
 
 # see https://github.com/vllm-project/vllm/pull/15951
 # it avoids unintentional cuda initialization from torch.cuda.is_available()
-os.environ['PYTORCH_NVML_BASED_CUDA_CHECK'] = '1'
+os.environ["PYTORCH_NVML_BASED_CUDA_CHECK"] = "1"
 
 # see https://github.com/vllm-project/vllm/issues/10480
-os.environ['TORCHINDUCTOR_COMPILE_THREADS'] = '1'
+os.environ["TORCHINDUCTOR_COMPILE_THREADS"] = "1"
 # see https://github.com/vllm-project/vllm/issues/10619
 torch._inductor.config.compile_threads = 1
diff --git a/vllm/envs.py b/vllm/envs.py
index 6dce4bd0f94e..a4f53925626b 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -41,7 +41,7 @@
     VLLM_LOGGING_STREAM: str = "ext://sys.stdout"
     VLLM_LOGGING_CONFIG_PATH: Optional[str] = None
     VLLM_LOGITS_PROCESSOR_THREADS: Optional[int] = None
-    VLLM_LOG_STATS_INTERVAL: float = 10.
+    VLLM_LOG_STATS_INTERVAL: float = 10.0
     VLLM_TRACE_FUNCTION: int = 0
     VLLM_ATTENTION_BACKEND: Optional[str] = None
     VLLM_USE_FLASHINFER_SAMPLER: Optional[bool] = None
@@ -57,8 +57,7 @@
     VLLM_ENABLE_FUSED_MOE_ACTIVATION_CHUNKING: bool = True
     VLLM_USE_RAY_SPMD_WORKER: bool = False
     VLLM_USE_RAY_COMPILED_DAG: bool = False
-    VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE: Literal["auto", "nccl",
-                                                    "shm"] = "auto"
+    VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE: Literal["auto", "nccl", "shm"] = "auto"
     VLLM_USE_RAY_COMPILED_DAG_OVERLAP_COMM: bool = False
     VLLM_USE_RAY_WRAPPED_PP_COMM: bool = True
     VLLM_XLA_USE_SPMD: bool = False
@@ -81,8 +80,7 @@
     VLLM_DOCKER_BUILD_CONTEXT: bool = False
     VLLM_TEST_USE_PRECOMPILED_NIGHTLY_WHEEL: bool = False
     VLLM_KEEP_ALIVE_ON_ENGINE_DEATH: bool = False
-    CMAKE_BUILD_TYPE: Optional[Literal["Debug", "Release",
-                                       "RelWithDebInfo"]] = None
+    CMAKE_BUILD_TYPE: Optional[Literal["Debug", "Release", "RelWithDebInfo"]] = None
     VERBOSE: bool = False
     VLLM_ALLOW_LONG_MAX_MODEL_LEN: bool = False
     VLLM_RPC_TIMEOUT: int = 10000  # ms
@@ -151,19 +149,20 @@
     VLLM_USE_FLASHINFER_MOE_FP16: bool = False
     VLLM_USE_FLASHINFER_MOE_FP8: bool = False
     VLLM_USE_FLASHINFER_MOE_FP4: bool = False
-    VLLM_FLASHINFER_MOE_BACKEND: Literal["throughput",
-                                         "latency"] = "throughput"
+    VLLM_FLASHINFER_MOE_BACKEND: Literal["throughput", "latency"] = "throughput"
     VLLM_XGRAMMAR_CACHE_MB: int = 0
     VLLM_MSGPACK_ZERO_COPY_THRESHOLD: int = 256
     VLLM_ALLOW_INSECURE_SERIALIZATION: bool = False
     VLLM_NIXL_SIDE_CHANNEL_HOST: str = "localhost"
     VLLM_NIXL_SIDE_CHANNEL_PORT: int = 5600
-    VLLM_ALL2ALL_BACKEND: Literal["naive", "pplx",
-                                  "deepep_high_throughput",
-                                  "deepep_low_latency",
-                                  "allgather_reducescatter",
-                                  "flashinfer_all2allv"] = \
-                                  "allgather_reducescatter"
+    VLLM_ALL2ALL_BACKEND: Literal[
+        "naive",
+        "pplx",
+        "deepep_high_throughput",
+        "deepep_low_latency",
+        "allgather_reducescatter",
+        "flashinfer_all2allv",
+    ] = "allgather_reducescatter"
     VLLM_MAX_TOKENS_PER_EXPERT_FP4_MOE: int = 163840
     VLLM_TOOL_PARSE_REGEX_TIMEOUT_SECONDS: int = 1
     VLLM_SLEEP_WHEN_IDLE: bool = False
@@ -172,8 +171,9 @@
     VLLM_KV_CACHE_LAYOUT: Optional[Literal["NHD", "HND"]] = None
     VLLM_COMPUTE_NANS_IN_LOGITS: bool = False
     VLLM_USE_NVFP4_CT_EMULATIONS: bool = False
-    VLLM_ROCM_QUICK_REDUCE_QUANTIZATION: Literal["FP", "INT8", "INT6", "INT4",
-                                                 "NONE"] = "NONE"
+    VLLM_ROCM_QUICK_REDUCE_QUANTIZATION: Literal[
+        "FP", "INT8", "INT6", "INT4", "NONE"
+    ] = "NONE"
     VLLM_ROCM_QUICK_REDUCE_CAST_BF16_TO_FP16: bool = True
     VLLM_ROCM_QUICK_REDUCE_MAX_SIZE_BYTES_MB: Optional[int] = None
     VLLM_NIXL_ABORT_REQUEST_TIMEOUT: int = 480
@@ -237,19 +237,20 @@ def maybe_convert_bool(value: Optional[str]) -> Optional[bool]:
 
 
 def env_with_choices(
-        env_name: str,
-        default: Optional[str],
-        choices: Union[list[str], Callable[[], list[str]]],
-        case_sensitive: bool = True) -> Callable[[], Optional[str]]:
+    env_name: str,
+    default: Optional[str],
+    choices: Union[list[str], Callable[[], list[str]]],
+    case_sensitive: bool = True,
+) -> Callable[[], Optional[str]]:
     """
     Create a lambda that validates environment variable against allowed choices
-    
+
     Args:
         env_name: Name of the environment variable
         default: Default value if not set (can be None)
         choices: List of valid string options or callable that returns list
         case_sensitive: Whether validation should be case sensitive
-        
+
     Returns:
         Lambda function for environment_variables dict
     """
@@ -270,8 +271,10 @@ def _get_validated_env() -> Optional[str]:
             check_choices = actual_choices
 
         if check_value not in check_choices:
-            raise ValueError(f"Invalid value '{value}' for {env_name}. "
-                             f"Valid options: {actual_choices}.")
+            raise ValueError(
+                f"Invalid value '{value}' for {env_name}. "
+                f"Valid options: {actual_choices}."
+            )
 
         return value
 
@@ -279,20 +282,21 @@ def _get_validated_env() -> Optional[str]:
 
 
 def env_list_with_choices(
-        env_name: str,
-        default: list[str],
-        choices: Union[list[str], Callable[[], list[str]]],
-        case_sensitive: bool = True) -> Callable[[], list[str]]:
+    env_name: str,
+    default: list[str],
+    choices: Union[list[str], Callable[[], list[str]]],
+    case_sensitive: bool = True,
+) -> Callable[[], list[str]]:
     """
-    Create a lambda that validates environment variable 
+    Create a lambda that validates environment variable
     containing comma-separated values against allowed choices
-    
+
     Args:
         env_name: Name of the environment variable
         default: Default list of values if not set
         choices: List of valid string options or callable that returns list
         case_sensitive: Whether validation should be case sensitive
-        
+
     Returns:
         Lambda function for environment_variables
         dict that returns list of strings
@@ -322,8 +326,10 @@ def _get_validated_env_list() -> list[str]:
                 check_choices = actual_choices
 
             if check_value not in check_choices:
-                raise ValueError(f"Invalid value '{val}' in {env_name}. "
-                                 f"Valid options: {actual_choices}.")
+                raise ValueError(
+                    f"Invalid value '{val}' in {env_name}. "
+                    f"Valid options: {actual_choices}."
+                )
 
         return values
 
@@ -339,15 +345,16 @@ def get_vllm_port() -> Optional[int]:
     Raises:
         ValueError: If VLLM_PORT is a URI, suggest k8s service discovery issue.
     """
-    if 'VLLM_PORT' not in os.environ:
+    if "VLLM_PORT" not in os.environ:
         return None
 
-    port = os.getenv('VLLM_PORT', '0')
+    port = os.getenv("VLLM_PORT", "0")
 
     try:
         return int(port)
     except ValueError as err:
         from urllib.parse import urlparse
+
         parsed = urlparse(port)
         if parsed.scheme:
             raise ValueError(
@@ -355,8 +362,7 @@ def get_vllm_port() -> Optional[int]:
                 "This may be caused by a Kubernetes service discovery issue,"
                 "check the warning in: https://docs.vllm.ai/en/stable/serving/env_vars.html"
             ) from None
-        raise ValueError(
-            f"VLLM_PORT '{port}' must be a valid integer") from err
+        raise ValueError(f"VLLM_PORT '{port}' must be a valid integer") from err
 
 
 # The begin-* and end* here are used by the documentation generator
@@ -365,247 +371,200 @@ def get_vllm_port() -> Optional[int]:
 # --8<-- [start:env-vars-definition]
 
 environment_variables: dict[str, Callable[[], Any]] = {
-
     # ================== Installation Time Env Vars ==================
-
     # Target device of vLLM, supporting [cuda (by default),
     # rocm, cpu]
-    "VLLM_TARGET_DEVICE":
-    lambda: os.getenv("VLLM_TARGET_DEVICE", "cuda").lower(),
-
+    "VLLM_TARGET_DEVICE": lambda: os.getenv("VLLM_TARGET_DEVICE", "cuda").lower(),
     # Main CUDA version of vLLM, supporting [12.6, 12.8, 12.9],
     # 12.8 is the default. This follows PyTorch but can be overridden.
-    "VLLM_MAIN_CUDA_VERSION":
-    lambda: os.getenv("VLLM_MAIN_CUDA_VERSION", "").lower() or "12.8",
-
+    "VLLM_MAIN_CUDA_VERSION": lambda: os.getenv("VLLM_MAIN_CUDA_VERSION", "").lower()
+    or "12.8",
     # Maximum number of compilation jobs to run in parallel.
     # By default this is the number of CPUs
-    "MAX_JOBS":
-    lambda: os.getenv("MAX_JOBS", None),
-
+    "MAX_JOBS": lambda: os.getenv("MAX_JOBS", None),
     # Number of threads to use for nvcc
     # By default this is 1.
     # If set, `MAX_JOBS` will be reduced to avoid oversubscribing the CPU.
-    "NVCC_THREADS":
-    lambda: os.getenv("NVCC_THREADS", None),
-
+    "NVCC_THREADS": lambda: os.getenv("NVCC_THREADS", None),
     # If set, vllm will use precompiled binaries (*.so)
-    "VLLM_USE_PRECOMPILED":
-    lambda: os.environ.get("VLLM_USE_PRECOMPILED", "").strip().lower() in
-    ("1", "true") or bool(os.environ.get("VLLM_PRECOMPILED_WHEEL_LOCATION")),
-
+    "VLLM_USE_PRECOMPILED": lambda: os.environ.get("VLLM_USE_PRECOMPILED", "")
+    .strip()
+    .lower()
+    in ("1", "true")
+    or bool(os.environ.get("VLLM_PRECOMPILED_WHEEL_LOCATION")),
     # Used to mark that setup.py is running in a Docker build context,
     # in order to force the use of precompiled binaries.
-    "VLLM_DOCKER_BUILD_CONTEXT":
-    lambda: os.environ.get("VLLM_DOCKER_BUILD_CONTEXT", "").strip().lower() in
-    ("1", "true"),
-
+    "VLLM_DOCKER_BUILD_CONTEXT": lambda: os.environ.get("VLLM_DOCKER_BUILD_CONTEXT", "")
+    .strip()
+    .lower()
+    in ("1", "true"),
     # Whether to force using nightly wheel in python build.
     # This is used for testing the nightly wheel in python build.
-    "VLLM_TEST_USE_PRECOMPILED_NIGHTLY_WHEEL":
-    lambda: bool(int(os.getenv("VLLM_TEST_USE_PRECOMPILED_NIGHTLY_WHEEL", "0"))
-                 ),
-
+    "VLLM_TEST_USE_PRECOMPILED_NIGHTLY_WHEEL": lambda: bool(
+        int(os.getenv("VLLM_TEST_USE_PRECOMPILED_NIGHTLY_WHEEL", "0"))
+    ),
     # CMake build type
     # If not set, defaults to "Debug" or "RelWithDebInfo"
     # Available options: "Debug", "Release", "RelWithDebInfo"
-    "CMAKE_BUILD_TYPE":
-    env_with_choices("CMAKE_BUILD_TYPE", None,
-        ["Debug", "Release", "RelWithDebInfo"]),
-
+    "CMAKE_BUILD_TYPE": env_with_choices(
+        "CMAKE_BUILD_TYPE", None, ["Debug", "Release", "RelWithDebInfo"]
+    ),
     # If set, vllm will print verbose logs during installation
-    "VERBOSE":
-    lambda: bool(int(os.getenv('VERBOSE', '0'))),
-
+    "VERBOSE": lambda: bool(int(os.getenv("VERBOSE", "0"))),
     # Root directory for vLLM configuration files
     # Defaults to `~/.config/vllm` unless `XDG_CONFIG_HOME` is set
     # Note that this not only affects how vllm finds its configuration files
     # during runtime, but also affects how vllm installs its configuration
     # files during **installation**.
-    "VLLM_CONFIG_ROOT":
-    lambda: os.path.expanduser(
+    "VLLM_CONFIG_ROOT": lambda: os.path.expanduser(
         os.getenv(
             "VLLM_CONFIG_ROOT",
             os.path.join(get_default_config_root(), "vllm"),
-        )),
-
+        )
+    ),
     # ================== Runtime Env Vars ==================
-
     # Root directory for vLLM cache files
     # Defaults to `~/.cache/vllm` unless `XDG_CACHE_HOME` is set
-    "VLLM_CACHE_ROOT":
-    lambda: os.path.expanduser(
+    "VLLM_CACHE_ROOT": lambda: os.path.expanduser(
         os.getenv(
             "VLLM_CACHE_ROOT",
             os.path.join(get_default_cache_root(), "vllm"),
-        )),
-
+        )
+    ),
     # used in distributed environment to determine the ip address
     # of the current node, when the node has multiple network interfaces.
     # If you are using multi-node inference, you should set this differently
     # on each node.
-    'VLLM_HOST_IP':
-    lambda: os.getenv('VLLM_HOST_IP', ""),
-
+    "VLLM_HOST_IP": lambda: os.getenv("VLLM_HOST_IP", ""),
     # used in distributed environment to manually set the communication port
     # Note: if VLLM_PORT is set, and some code asks for multiple ports, the
     # VLLM_PORT will be used as the first port, and the rest will be generated
     # by incrementing the VLLM_PORT value.
-    'VLLM_PORT':
-    get_vllm_port,
-
+    "VLLM_PORT": get_vllm_port,
     # path used for ipc when the frontend api server is running in
     # multi-processing mode to communicate with the backend engine process.
-    'VLLM_RPC_BASE_PATH':
-    lambda: os.getenv('VLLM_RPC_BASE_PATH', tempfile.gettempdir()),
-
+    "VLLM_RPC_BASE_PATH": lambda: os.getenv(
+        "VLLM_RPC_BASE_PATH", tempfile.gettempdir()
+    ),
     # If true, will load models from ModelScope instead of Hugging Face Hub.
     # note that the value is true or false, not numbers
-    "VLLM_USE_MODELSCOPE":
-    lambda: os.environ.get("VLLM_USE_MODELSCOPE", "False").lower() == "true",
-
+    "VLLM_USE_MODELSCOPE": lambda: os.environ.get(
+        "VLLM_USE_MODELSCOPE", "False"
+    ).lower()
+    == "true",
     # Interval in seconds to log a warning message when the ring buffer is full
-    "VLLM_RINGBUFFER_WARNING_INTERVAL":
-    lambda: int(os.environ.get("VLLM_RINGBUFFER_WARNING_INTERVAL", "60")),
-
+    "VLLM_RINGBUFFER_WARNING_INTERVAL": lambda: int(
+        os.environ.get("VLLM_RINGBUFFER_WARNING_INTERVAL", "60")
+    ),
     # path to cudatoolkit home directory, under which should be bin, include,
     # and lib directories.
-    "CUDA_HOME":
-    lambda: os.environ.get("CUDA_HOME", None),
-
+    "CUDA_HOME": lambda: os.environ.get("CUDA_HOME", None),
     # Path to the NCCL library file. It is needed because nccl>=2.19 brought
     # by PyTorch contains a bug: https://github.com/NVIDIA/nccl/issues/1234
-    "VLLM_NCCL_SO_PATH":
-    lambda: os.environ.get("VLLM_NCCL_SO_PATH", None),
-
+    "VLLM_NCCL_SO_PATH": lambda: os.environ.get("VLLM_NCCL_SO_PATH", None),
     # when `VLLM_NCCL_SO_PATH` is not set, vllm will try to find the nccl
     # library file in the locations specified by `LD_LIBRARY_PATH`
-    "LD_LIBRARY_PATH":
-    lambda: os.environ.get("LD_LIBRARY_PATH", None),
-
+    "LD_LIBRARY_PATH": lambda: os.environ.get("LD_LIBRARY_PATH", None),
     # flag to control if vllm should use triton flash attention
-    "VLLM_USE_TRITON_FLASH_ATTN":
-    lambda: (os.environ.get("VLLM_USE_TRITON_FLASH_ATTN", "True").lower() in
-             ("true", "1")),
-
+    "VLLM_USE_TRITON_FLASH_ATTN": lambda: (
+        os.environ.get("VLLM_USE_TRITON_FLASH_ATTN", "True").lower() in ("true", "1")
+    ),
     # Use separate prefill and decode kernels for V1 attention instead of
     # the unified triton kernel.
-    "VLLM_V1_USE_PREFILL_DECODE_ATTENTION":
-    lambda:
-    (os.getenv("VLLM_V1_USE_PREFILL_DECODE_ATTENTION", "False").lower() in
-     ("true", "1")),
-
+    "VLLM_V1_USE_PREFILL_DECODE_ATTENTION": lambda: (
+        os.getenv("VLLM_V1_USE_PREFILL_DECODE_ATTENTION", "False").lower()
+        in ("true", "1")
+    ),
     # Use AITER triton unified attention for V1 attention
-    "VLLM_USE_AITER_UNIFIED_ATTENTION":
-    lambda:
-    (os.getenv("VLLM_USE_AITER_UNIFIED_ATTENTION", "False").lower() in
-     ("true", "1")),
-
+    "VLLM_USE_AITER_UNIFIED_ATTENTION": lambda: (
+        os.getenv("VLLM_USE_AITER_UNIFIED_ATTENTION", "False").lower() in ("true", "1")
+    ),
     # Force vllm to use a specific flash-attention version (2 or 3), only valid
     # when using the flash-attention backend.
-    "VLLM_FLASH_ATTN_VERSION":
-    lambda: maybe_convert_int(os.environ.get("VLLM_FLASH_ATTN_VERSION", None)),
-
+    "VLLM_FLASH_ATTN_VERSION": lambda: maybe_convert_int(
+        os.environ.get("VLLM_FLASH_ATTN_VERSION", None)
+    ),
     # Feature flag to enable/disable Inductor standalone compile.
     # In torch <= 2.7 we ignore this flag; in torch >= 2.8 this is
     # disabled by default.
-    "VLLM_USE_STANDALONE_COMPILE":
-    lambda: os.environ.get("VLLM_USE_STANDALONE_COMPILE", "0") == "1",
-
+    "VLLM_USE_STANDALONE_COMPILE": lambda: os.environ.get(
+        "VLLM_USE_STANDALONE_COMPILE", "0"
+    )
+    == "1",
     # Debug pattern matching inside custom passes.
     # Should be set to the fx.Node name (e.g. 'getitem_34' or 'scaled_mm_3').
-    "VLLM_PATTERN_MATCH_DEBUG":
-    lambda: os.environ.get("VLLM_PATTERN_MATCH_DEBUG", None),
-
+    "VLLM_PATTERN_MATCH_DEBUG": lambda: os.environ.get(
+        "VLLM_PATTERN_MATCH_DEBUG", None
+    ),
     # Dump fx graphs to the given directory.
     # It will override CompilationConfig.debug_dump_path if set.
-    "VLLM_DEBUG_DUMP_PATH":
-    lambda: os.environ.get("VLLM_DEBUG_DUMP_PATH", None),
-
+    "VLLM_DEBUG_DUMP_PATH": lambda: os.environ.get("VLLM_DEBUG_DUMP_PATH", None),
     # local rank of the process in the distributed setting, used to determine
     # the GPU device id
-    "LOCAL_RANK":
-    lambda: int(os.environ.get("LOCAL_RANK", "0")),
-
+    "LOCAL_RANK": lambda: int(os.environ.get("LOCAL_RANK", "0")),
     # used to control the visible devices in the distributed setting
-    "CUDA_VISIBLE_DEVICES":
-    lambda: os.environ.get("CUDA_VISIBLE_DEVICES", None),
-
+    "CUDA_VISIBLE_DEVICES": lambda: os.environ.get("CUDA_VISIBLE_DEVICES", None),
     # timeout for each iteration in the engine
-    "VLLM_ENGINE_ITERATION_TIMEOUT_S":
-    lambda: int(os.environ.get("VLLM_ENGINE_ITERATION_TIMEOUT_S", "60")),
-
+    "VLLM_ENGINE_ITERATION_TIMEOUT_S": lambda: int(
+        os.environ.get("VLLM_ENGINE_ITERATION_TIMEOUT_S", "60")
+    ),
     # API key for vLLM API server
-    "VLLM_API_KEY":
-    lambda: os.environ.get("VLLM_API_KEY", None),
-
+    "VLLM_API_KEY": lambda: os.environ.get("VLLM_API_KEY", None),
     # Whether to log responses from API Server for debugging
-    "VLLM_DEBUG_LOG_API_SERVER_RESPONSE":
-    lambda: os.environ.get("VLLM_DEBUG_LOG_API_SERVER_RESPONSE", "False"
-                           ).lower() == "true",
-
+    "VLLM_DEBUG_LOG_API_SERVER_RESPONSE": lambda: os.environ.get(
+        "VLLM_DEBUG_LOG_API_SERVER_RESPONSE", "False"
+    ).lower()
+    == "true",
     # S3 access information, used for tensorizer to load model from S3
-    "S3_ACCESS_KEY_ID":
-    lambda: os.environ.get("S3_ACCESS_KEY_ID", None),
-    "S3_SECRET_ACCESS_KEY":
-    lambda: os.environ.get("S3_SECRET_ACCESS_KEY", None),
-    "S3_ENDPOINT_URL":
-    lambda: os.environ.get("S3_ENDPOINT_URL", None),
-
+    "S3_ACCESS_KEY_ID": lambda: os.environ.get("S3_ACCESS_KEY_ID", None),
+    "S3_SECRET_ACCESS_KEY": lambda: os.environ.get("S3_SECRET_ACCESS_KEY", None),
+    "S3_ENDPOINT_URL": lambda: os.environ.get("S3_ENDPOINT_URL", None),
     # Usage stats collection
-    "VLLM_USAGE_STATS_SERVER":
-    lambda: os.environ.get("VLLM_USAGE_STATS_SERVER", "https://stats.vllm.ai"),
-    "VLLM_NO_USAGE_STATS":
-    lambda: os.environ.get("VLLM_NO_USAGE_STATS", "0") == "1",
-    "VLLM_DISABLE_FLASHINFER_PREFILL":
-    lambda: os.environ.get("VLLM_DISABLE_FLASHINFER_PREFILL", "0") == "1",
-    "VLLM_DO_NOT_TRACK":
-    lambda: (os.environ.get("VLLM_DO_NOT_TRACK", None) or os.environ.get(
-        "DO_NOT_TRACK", None) or "0") == "1",
-    "VLLM_USAGE_SOURCE":
-    lambda: os.environ.get("VLLM_USAGE_SOURCE", "production"),
-
+    "VLLM_USAGE_STATS_SERVER": lambda: os.environ.get(
+        "VLLM_USAGE_STATS_SERVER", "https://stats.vllm.ai"
+    ),
+    "VLLM_NO_USAGE_STATS": lambda: os.environ.get("VLLM_NO_USAGE_STATS", "0") == "1",
+    "VLLM_DISABLE_FLASHINFER_PREFILL": lambda: os.environ.get(
+        "VLLM_DISABLE_FLASHINFER_PREFILL", "0"
+    )
+    == "1",
+    "VLLM_DO_NOT_TRACK": lambda: (
+        os.environ.get("VLLM_DO_NOT_TRACK", None)
+        or os.environ.get("DO_NOT_TRACK", None)
+        or "0"
+    )
+    == "1",
+    "VLLM_USAGE_SOURCE": lambda: os.environ.get("VLLM_USAGE_SOURCE", "production"),
     # Logging configuration
     # If set to 0, vllm will not configure logging
     # If set to 1, vllm will configure logging using the default configuration
     #    or the configuration file specified by VLLM_LOGGING_CONFIG_PATH
-    "VLLM_CONFIGURE_LOGGING":
-    lambda: int(os.getenv("VLLM_CONFIGURE_LOGGING", "1")),
-    "VLLM_LOGGING_CONFIG_PATH":
-    lambda: os.getenv("VLLM_LOGGING_CONFIG_PATH"),
-
+    "VLLM_CONFIGURE_LOGGING": lambda: int(os.getenv("VLLM_CONFIGURE_LOGGING", "1")),
+    "VLLM_LOGGING_CONFIG_PATH": lambda: os.getenv("VLLM_LOGGING_CONFIG_PATH"),
     # this is used for configuring the default logging level
-    "VLLM_LOGGING_LEVEL":
-    lambda: os.getenv("VLLM_LOGGING_LEVEL", "INFO").upper(),
-
+    "VLLM_LOGGING_LEVEL": lambda: os.getenv("VLLM_LOGGING_LEVEL", "INFO").upper(),
     # this is used for configuring the default logging stream
-    "VLLM_LOGGING_STREAM":
-    lambda: os.getenv("VLLM_LOGGING_STREAM", "ext://sys.stdout"),
-
+    "VLLM_LOGGING_STREAM": lambda: os.getenv("VLLM_LOGGING_STREAM", "ext://sys.stdout"),
     # if set, VLLM_LOGGING_PREFIX will be prepended to all log messages
-    "VLLM_LOGGING_PREFIX":
-    lambda: os.getenv("VLLM_LOGGING_PREFIX", ""),
-
+    "VLLM_LOGGING_PREFIX": lambda: os.getenv("VLLM_LOGGING_PREFIX", ""),
     # if set, vllm will call logits processors in a thread pool with this many
     # threads. This is useful when using custom logits processors that either
     # (a) launch additional CUDA kernels or (b) do significant CPU-bound work
     # while not holding the python GIL, or both.
-    "VLLM_LOGITS_PROCESSOR_THREADS":
-    lambda: int(os.getenv("VLLM_LOGITS_PROCESSOR_THREADS", "0"))
-    if "VLLM_LOGITS_PROCESSOR_THREADS" in os.environ else None,
-
+    "VLLM_LOGITS_PROCESSOR_THREADS": lambda: int(
+        os.getenv("VLLM_LOGITS_PROCESSOR_THREADS", "0")
+    )
+    if "VLLM_LOGITS_PROCESSOR_THREADS" in os.environ
+    else None,
     # If set, vllm will log stats at this interval in seconds
     # If not set, vllm will log stats every 10 seconds.
-    "VLLM_LOG_STATS_INTERVAL":
-    lambda: val if (val := float(os.getenv("VLLM_LOG_STATS_INTERVAL", "10.")))
-        > 0. else 10.,
-
+    "VLLM_LOG_STATS_INTERVAL": lambda: val
+    if (val := float(os.getenv("VLLM_LOG_STATS_INTERVAL", "10."))) > 0.0
+    else 10.0,
     # Trace function calls
     # If set to 1, vllm will trace function calls
     # Useful for debugging
-    "VLLM_TRACE_FUNCTION":
-    lambda: int(os.getenv("VLLM_TRACE_FUNCTION", "0")),
-
+    "VLLM_TRACE_FUNCTION": lambda: int(os.getenv("VLLM_TRACE_FUNCTION", "0")),
     # Backend for attention computation
     # Example options:
     # - "TORCH_SDPA": use torch.nn.MultiheadAttention
@@ -617,64 +576,60 @@ def get_vllm_port() -> Optional[int]:
     # - "FLASHINFER_MLA": use FlashInfer for MLA
     # - "CUTLASS_MLA": use CUTLASS for MLA
     # All possible options loaded dynamically from _Backend enum
-    "VLLM_ATTENTION_BACKEND":
-    env_with_choices("VLLM_ATTENTION_BACKEND", None,
-                     lambda: list(__import__(
-                         'vllm.attention.backends.registry',
-                         fromlist=['_Backend'])._Backend.__members__.keys())),
-
+    "VLLM_ATTENTION_BACKEND": env_with_choices(
+        "VLLM_ATTENTION_BACKEND",
+        None,
+        lambda: list(
+            __import__(
+                "vllm.attention.backends.registry", fromlist=["_Backend"]
+            )._Backend.__members__.keys()
+        ),
+    ),
     # If set, vllm will use flashinfer sampler
-    "VLLM_USE_FLASHINFER_SAMPLER":
-    lambda: bool(int(os.environ["VLLM_USE_FLASHINFER_SAMPLER"]))
-    if "VLLM_USE_FLASHINFER_SAMPLER" in os.environ else None,
-
+    "VLLM_USE_FLASHINFER_SAMPLER": lambda: bool(
+        int(os.environ["VLLM_USE_FLASHINFER_SAMPLER"])
+    )
+    if "VLLM_USE_FLASHINFER_SAMPLER" in os.environ
+    else None,
     # Pipeline stage partition strategy
-    "VLLM_PP_LAYER_PARTITION":
-    lambda: os.getenv("VLLM_PP_LAYER_PARTITION", None),
-
+    "VLLM_PP_LAYER_PARTITION": lambda: os.getenv("VLLM_PP_LAYER_PARTITION", None),
     # (CPU backend only) CPU key-value cache space.
     # default is None and will be set as 4 GB
-    "VLLM_CPU_KVCACHE_SPACE":
-    lambda: int(os.getenv("VLLM_CPU_KVCACHE_SPACE", "0"))
-    if "VLLM_CPU_KVCACHE_SPACE" in os.environ else None,
-
+    "VLLM_CPU_KVCACHE_SPACE": lambda: int(os.getenv("VLLM_CPU_KVCACHE_SPACE", "0"))
+    if "VLLM_CPU_KVCACHE_SPACE" in os.environ
+    else None,
     # (CPU backend only) CPU core ids bound by OpenMP threads, e.g., "0-31",
     # "0,1,2", "0-31,33". CPU cores of different ranks are separated by '|'.
-    "VLLM_CPU_OMP_THREADS_BIND":
-    lambda: os.getenv("VLLM_CPU_OMP_THREADS_BIND", "auto"),
-
+    "VLLM_CPU_OMP_THREADS_BIND": lambda: os.getenv("VLLM_CPU_OMP_THREADS_BIND", "auto"),
     # (CPU backend only) CPU cores not used by OMP threads .
     # Those CPU cores will not be used by OMP threads of a rank.
-    "VLLM_CPU_NUM_OF_RESERVED_CPU":
-    lambda: int(os.getenv("VLLM_CPU_NUM_OF_RESERVED_CPU", "0"))
-    if "VLLM_CPU_NUM_OF_RESERVED_CPU" in os.environ else None,
-
+    "VLLM_CPU_NUM_OF_RESERVED_CPU": lambda: int(
+        os.getenv("VLLM_CPU_NUM_OF_RESERVED_CPU", "0")
+    )
+    if "VLLM_CPU_NUM_OF_RESERVED_CPU" in os.environ
+    else None,
     # (CPU backend only) whether to use prepack for MoE layer. This will be
     # passed to ipex.llm.modules.GatedMLPMOE. On unsupported CPUs, you might
     # need to set this to "0" (False).
-    "VLLM_CPU_MOE_PREPACK":
-    lambda: bool(int(os.getenv("VLLM_CPU_MOE_PREPACK", "1"))),
-
+    "VLLM_CPU_MOE_PREPACK": lambda: bool(int(os.getenv("VLLM_CPU_MOE_PREPACK", "1"))),
     # (CPU backend only) whether to use SGL kernels, optimized for small batch.
-    "VLLM_CPU_SGL_KERNEL":
-    lambda: bool(int(os.getenv("VLLM_CPU_SGL_KERNEL", "0"))),
-
+    "VLLM_CPU_SGL_KERNEL": lambda: bool(int(os.getenv("VLLM_CPU_SGL_KERNEL", "0"))),
     # If the env var is set, then all workers will execute as separate
     # processes from the engine, and we use the same mechanism to trigger
     # execution on all workers.
     # Run vLLM with VLLM_USE_RAY_SPMD_WORKER=1 to enable it.
-    "VLLM_USE_RAY_SPMD_WORKER":
-    lambda: bool(int(os.getenv("VLLM_USE_RAY_SPMD_WORKER", "0"))),
-
+    "VLLM_USE_RAY_SPMD_WORKER": lambda: bool(
+        int(os.getenv("VLLM_USE_RAY_SPMD_WORKER", "0"))
+    ),
     # If the env var is set, it uses the Ray's Compiled Graph
     # (previously known as ADAG) API which optimizes the
     # control plane overhead.
     # Run vLLM with VLLM_USE_RAY_COMPILED_DAG=1 to enable it.
     # Note that this variable is set to 1 in V1 by default
     # when ray distributed executor is used.
-    "VLLM_USE_RAY_COMPILED_DAG":
-    lambda: bool(int(os.getenv("VLLM_USE_RAY_COMPILED_DAG", "0"))),
-
+    "VLLM_USE_RAY_COMPILED_DAG": lambda: bool(
+        int(os.getenv("VLLM_USE_RAY_COMPILED_DAG", "0"))
+    ),
     # If the env var is set, Ray Compiled Graph uses the specified
     # channel type to communicate between workers belonging to
     # different pipeline-parallel stages.
@@ -683,75 +638,69 @@ def get_vllm_port() -> Optional[int]:
     # - "nccl": use NCCL for communication
     # - "shm": use shared memory and gRPC for communication
     # This flag is ignored if VLLM_USE_RAY_COMPILED_DAG is not set.
-    "VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE":
-    env_with_choices("VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE", "auto",
-        ["auto", "nccl", "shm"]),
-
+    "VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE": env_with_choices(
+        "VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE", "auto", ["auto", "nccl", "shm"]
+    ),
     # If the env var is set, it enables GPU communication overlap
     # (experimental feature) in Ray's Compiled Graph. This flag is ignored if
     # VLLM_USE_RAY_COMPILED_DAG is not set.
-    "VLLM_USE_RAY_COMPILED_DAG_OVERLAP_COMM":
-    lambda: bool(int(os.getenv("VLLM_USE_RAY_COMPILED_DAG_OVERLAP_COMM", "0"))
-                 ),
-
+    "VLLM_USE_RAY_COMPILED_DAG_OVERLAP_COMM": lambda: bool(
+        int(os.getenv("VLLM_USE_RAY_COMPILED_DAG_OVERLAP_COMM", "0"))
+    ),
     # If the env var is set, it uses a Ray Communicator wrapping
     # vLLM's pipeline parallelism communicator to interact with Ray's
     # Compiled Graph. Otherwise, it uses Ray's NCCL communicator.
     # This flag is ignored if VLLM_USE_RAY_COMPILED_DAG is not set.
-    "VLLM_USE_RAY_WRAPPED_PP_COMM":
-    lambda: bool(int(os.getenv("VLLM_USE_RAY_WRAPPED_PP_COMM", "1"))),
-
+    "VLLM_USE_RAY_WRAPPED_PP_COMM": lambda: bool(
+        int(os.getenv("VLLM_USE_RAY_WRAPPED_PP_COMM", "1"))
+    ),
     # Use dedicated multiprocess context for workers.
     # Both spawn and fork work
-    "VLLM_WORKER_MULTIPROC_METHOD":
-    env_with_choices("VLLM_WORKER_MULTIPROC_METHOD", "fork",
-       ["spawn", "fork"]),
-
+    "VLLM_WORKER_MULTIPROC_METHOD": env_with_choices(
+        "VLLM_WORKER_MULTIPROC_METHOD", "fork", ["spawn", "fork"]
+    ),
     # Path to the cache for storing downloaded assets
-    "VLLM_ASSETS_CACHE":
-    lambda: os.path.expanduser(
+    "VLLM_ASSETS_CACHE": lambda: os.path.expanduser(
         os.getenv(
             "VLLM_ASSETS_CACHE",
             os.path.join(get_default_cache_root(), "vllm", "assets"),
-        )),
-
+        )
+    ),
     # If the env var is set, we will clean model file in
     # this path $VLLM_ASSETS_CACHE/model_streamer/$model_name
-    "VLLM_ASSETS_CACHE_MODEL_CLEAN":
-    lambda: bool(int(os.getenv("VLLM_ASSETS_CACHE_MODEL_CLEAN", "0"))),
-
+    "VLLM_ASSETS_CACHE_MODEL_CLEAN": lambda: bool(
+        int(os.getenv("VLLM_ASSETS_CACHE_MODEL_CLEAN", "0"))
+    ),
     # Timeout for fetching images when serving multimodal models
     # Default is 5 seconds
-    "VLLM_IMAGE_FETCH_TIMEOUT":
-    lambda: int(os.getenv("VLLM_IMAGE_FETCH_TIMEOUT", "5")),
-
+    "VLLM_IMAGE_FETCH_TIMEOUT": lambda: int(os.getenv("VLLM_IMAGE_FETCH_TIMEOUT", "5")),
     # Timeout for fetching videos when serving multimodal models
     # Default is 30 seconds
-    "VLLM_VIDEO_FETCH_TIMEOUT":
-    lambda: int(os.getenv("VLLM_VIDEO_FETCH_TIMEOUT", "30")),
-
+    "VLLM_VIDEO_FETCH_TIMEOUT": lambda: int(
+        os.getenv("VLLM_VIDEO_FETCH_TIMEOUT", "30")
+    ),
     # Timeout for fetching audio when serving multimodal models
     # Default is 10 seconds
-    "VLLM_AUDIO_FETCH_TIMEOUT":
-    lambda: int(os.getenv("VLLM_AUDIO_FETCH_TIMEOUT", "10")),
-
+    "VLLM_AUDIO_FETCH_TIMEOUT": lambda: int(
+        os.getenv("VLLM_AUDIO_FETCH_TIMEOUT", "10")
+    ),
     # Whether to allow HTTP redirects when fetching from media URLs.
     # Default to True
-    "VLLM_MEDIA_URL_ALLOW_REDIRECTS":
-    lambda: bool(int(os.getenv("VLLM_MEDIA_URL_ALLOW_REDIRECTS", "1"))),
-
+    "VLLM_MEDIA_URL_ALLOW_REDIRECTS": lambda: bool(
+        int(os.getenv("VLLM_MEDIA_URL_ALLOW_REDIRECTS", "1"))
+    ),
     # Max number of workers for the thread pool handling
     # media bytes loading. Set to 1 to disable parallel processing.
     # Default is 8
-    "VLLM_MEDIA_LOADING_THREAD_COUNT":
-    lambda: int(os.getenv("VLLM_MEDIA_LOADING_THREAD_COUNT", "8")),
-
+    "VLLM_MEDIA_LOADING_THREAD_COUNT": lambda: int(
+        os.getenv("VLLM_MEDIA_LOADING_THREAD_COUNT", "8")
+    ),
     # Maximum filesize in MB for a single audio file when processing
     # speech-to-text requests. Files larger than this will be rejected.
     # Default is 25 MB
-    "VLLM_MAX_AUDIO_CLIP_FILESIZE_MB":
-    lambda: int(os.getenv("VLLM_MAX_AUDIO_CLIP_FILESIZE_MB", "25")),
-
+    "VLLM_MAX_AUDIO_CLIP_FILESIZE_MB": lambda: int(
+        os.getenv("VLLM_MAX_AUDIO_CLIP_FILESIZE_MB", "25")
+    ),
     # Backend for Video IO
     # - "opencv": Default backend that uses OpenCV stream buffered backend.
     #
@@ -759,289 +708,251 @@ def get_vllm_port() -> Optional[int]:
     # via `@VIDEO_LOADER_REGISTRY.register("my_custom_video_loader")` and
     # imported at runtime.
     # If a non-existing backend is used, an AssertionError will be thrown.
-    "VLLM_VIDEO_LOADER_BACKEND":
-    lambda: os.getenv("VLLM_VIDEO_LOADER_BACKEND", "opencv"),
-
+    "VLLM_VIDEO_LOADER_BACKEND": lambda: os.getenv(
+        "VLLM_VIDEO_LOADER_BACKEND", "opencv"
+    ),
     # [DEPRECATED] Cache size (in GiB per process) for multimodal input cache
     # Default is 4 GiB per API process + 4 GiB per engine core process
-    "VLLM_MM_INPUT_CACHE_GIB":
-    lambda: int(os.getenv("VLLM_MM_INPUT_CACHE_GIB", "4")),
-
+    "VLLM_MM_INPUT_CACHE_GIB": lambda: int(os.getenv("VLLM_MM_INPUT_CACHE_GIB", "4")),
     # Path to the XLA persistent cache directory.
     # Only used for XLA devices such as TPUs.
-    "VLLM_XLA_CACHE_PATH":
-    lambda: os.path.expanduser(
+    "VLLM_XLA_CACHE_PATH": lambda: os.path.expanduser(
         os.getenv(
             "VLLM_XLA_CACHE_PATH",
             os.path.join(get_default_cache_root(), "vllm", "xla_cache"),
-        )),
-
+        )
+    ),
     # If set, assert on XLA recompilation after each execution step.
-    "VLLM_XLA_CHECK_RECOMPILATION":
-    lambda: bool(int(os.getenv("VLLM_XLA_CHECK_RECOMPILATION", "0"))),
-
+    "VLLM_XLA_CHECK_RECOMPILATION": lambda: bool(
+        int(os.getenv("VLLM_XLA_CHECK_RECOMPILATION", "0"))
+    ),
     # Enable SPMD mode for TPU backend.
-    "VLLM_XLA_USE_SPMD":
-    lambda: bool(int(os.getenv("VLLM_XLA_USE_SPMD", "0"))),
-    "VLLM_FUSED_MOE_CHUNK_SIZE":
-    lambda: int(os.getenv("VLLM_FUSED_MOE_CHUNK_SIZE", "32768")),
+    "VLLM_XLA_USE_SPMD": lambda: bool(int(os.getenv("VLLM_XLA_USE_SPMD", "0"))),
+    "VLLM_FUSED_MOE_CHUNK_SIZE": lambda: int(
+        os.getenv("VLLM_FUSED_MOE_CHUNK_SIZE", "32768")
+    ),
     # Control whether to use fused MoE activation chunking. Current chunking
     # logic is incompatible with torch.compile and causes IMA. See issue
     # https://github.com/vllm-project/vllm/issues/19631.
-    "VLLM_ENABLE_FUSED_MOE_ACTIVATION_CHUNKING":
-    lambda: bool(
-        int(os.getenv("VLLM_ENABLE_FUSED_MOE_ACTIVATION_CHUNKING", "1"))),
-
+    "VLLM_ENABLE_FUSED_MOE_ACTIVATION_CHUNKING": lambda: bool(
+        int(os.getenv("VLLM_ENABLE_FUSED_MOE_ACTIVATION_CHUNKING", "1"))
+    ),
     # If set, the OpenAI API server will stay alive even after the underlying
     # AsyncLLMEngine errors and stops serving requests
-    "VLLM_KEEP_ALIVE_ON_ENGINE_DEATH":
-    lambda: bool(os.getenv("VLLM_KEEP_ALIVE_ON_ENGINE_DEATH", 0)),
-
+    "VLLM_KEEP_ALIVE_ON_ENGINE_DEATH": lambda: bool(
+        os.getenv("VLLM_KEEP_ALIVE_ON_ENGINE_DEATH", 0)
+    ),
     # If the env var VLLM_ALLOW_LONG_MAX_MODEL_LEN is set, it allows
     # the user to specify a max sequence length greater than
     # the max length derived from the model's config.json.
     # To enable this, set VLLM_ALLOW_LONG_MAX_MODEL_LEN=1.
-    "VLLM_ALLOW_LONG_MAX_MODEL_LEN":
-    lambda:
-    (os.environ.get("VLLM_ALLOW_LONG_MAX_MODEL_LEN", "0").strip().lower() in
-     ("1", "true")),
-
+    "VLLM_ALLOW_LONG_MAX_MODEL_LEN": lambda: (
+        os.environ.get("VLLM_ALLOW_LONG_MAX_MODEL_LEN", "0").strip().lower()
+        in ("1", "true")
+    ),
     # If set, forces FP8 Marlin to be used for FP8 quantization regardless
     # of the hardware support for FP8 compute.
-    "VLLM_TEST_FORCE_FP8_MARLIN":
-    lambda:
-    (os.environ.get("VLLM_TEST_FORCE_FP8_MARLIN", "0").strip().lower() in
-     ("1", "true")),
-    "VLLM_TEST_FORCE_LOAD_FORMAT":
-    lambda: os.getenv("VLLM_TEST_FORCE_LOAD_FORMAT", "dummy"),
-
+    "VLLM_TEST_FORCE_FP8_MARLIN": lambda: (
+        os.environ.get("VLLM_TEST_FORCE_FP8_MARLIN", "0").strip().lower()
+        in ("1", "true")
+    ),
+    "VLLM_TEST_FORCE_LOAD_FORMAT": lambda: os.getenv(
+        "VLLM_TEST_FORCE_LOAD_FORMAT", "dummy"
+    ),
     # Time in ms for the zmq client to wait for a response from the backend
     # server for simple data operations
-    "VLLM_RPC_TIMEOUT":
-    lambda: int(os.getenv("VLLM_RPC_TIMEOUT", "10000")),
-
+    "VLLM_RPC_TIMEOUT": lambda: int(os.getenv("VLLM_RPC_TIMEOUT", "10000")),
     # Timeout in seconds for keeping HTTP connections alive in API server
-    "VLLM_HTTP_TIMEOUT_KEEP_ALIVE":
-    lambda: int(os.environ.get("VLLM_HTTP_TIMEOUT_KEEP_ALIVE", "5")),
-
+    "VLLM_HTTP_TIMEOUT_KEEP_ALIVE": lambda: int(
+        os.environ.get("VLLM_HTTP_TIMEOUT_KEEP_ALIVE", "5")
+    ),
     # a list of plugin names to load, separated by commas.
     # if this is not set, it means all plugins will be loaded
     # if this is set to an empty string, no plugins will be loaded
-    "VLLM_PLUGINS":
-    lambda: None if "VLLM_PLUGINS" not in os.environ else os.environ[
-        "VLLM_PLUGINS"].split(","),
-
+    "VLLM_PLUGINS": lambda: None
+    if "VLLM_PLUGINS" not in os.environ
+    else os.environ["VLLM_PLUGINS"].split(","),
     # a local directory to look in for unrecognized LoRA adapters.
     # only works if plugins are enabled and
     # VLLM_ALLOW_RUNTIME_LORA_UPDATING is enabled.
-    "VLLM_LORA_RESOLVER_CACHE_DIR":
-    lambda: os.getenv("VLLM_LORA_RESOLVER_CACHE_DIR", None),
-
+    "VLLM_LORA_RESOLVER_CACHE_DIR": lambda: os.getenv(
+        "VLLM_LORA_RESOLVER_CACHE_DIR", None
+    ),
     # Enables torch profiler if set.
     # Both AsyncLLM's CPU traces as well as workers'
     # traces (CPU & GPU) will be saved under this directory.
     # Note that it must be an absolute path.
-    "VLLM_TORCH_PROFILER_DIR":
-    lambda: (None if os.getenv("VLLM_TORCH_PROFILER_DIR", None) is None else os
-             .path.abspath(os.path.expanduser(os.getenv(
-        "VLLM_TORCH_PROFILER_DIR", ".")))),
-
+    "VLLM_TORCH_PROFILER_DIR": lambda: (
+        None
+        if os.getenv("VLLM_TORCH_PROFILER_DIR", None) is None
+        else os.path.abspath(
+            os.path.expanduser(os.getenv("VLLM_TORCH_PROFILER_DIR", "."))
+        )
+    ),
     # Enable torch profiler to record shapes if set
     # VLLM_TORCH_PROFILER_RECORD_SHAPES=1. If not set, torch profiler will
     # not record shapes.
-    "VLLM_TORCH_PROFILER_RECORD_SHAPES":
-    lambda: bool(os.getenv("VLLM_TORCH_PROFILER_RECORD_SHAPES", "0") != "0"),
-
+    "VLLM_TORCH_PROFILER_RECORD_SHAPES": lambda: bool(
+        os.getenv("VLLM_TORCH_PROFILER_RECORD_SHAPES", "0") != "0"
+    ),
     # Enable torch profiler to profile memory if set
     # VLLM_TORCH_PROFILER_WITH_PROFILE_MEMORY=1. If not set, torch profiler
     # will not profile memory.
-    "VLLM_TORCH_PROFILER_WITH_PROFILE_MEMORY":
-    lambda: bool(
-        os.getenv("VLLM_TORCH_PROFILER_WITH_PROFILE_MEMORY", "0") != "0"),
-
+    "VLLM_TORCH_PROFILER_WITH_PROFILE_MEMORY": lambda: bool(
+        os.getenv("VLLM_TORCH_PROFILER_WITH_PROFILE_MEMORY", "0") != "0"
+    ),
     # Enable torch profiler to profile stack if set
     # VLLM_TORCH_PROFILER_WITH_STACK=1. If not set, torch profiler WILL
     # profile stack by default.
-    "VLLM_TORCH_PROFILER_WITH_STACK":
-    lambda: bool(os.getenv("VLLM_TORCH_PROFILER_WITH_STACK", "1") != "0"),
-
+    "VLLM_TORCH_PROFILER_WITH_STACK": lambda: bool(
+        os.getenv("VLLM_TORCH_PROFILER_WITH_STACK", "1") != "0"
+    ),
     # Enable torch profiler to profile flops if set
     # VLLM_TORCH_PROFILER_WITH_FLOPS=1. If not set, torch profiler will
     # not profile flops.
-    "VLLM_TORCH_PROFILER_WITH_FLOPS":
-    lambda: bool(os.getenv("VLLM_TORCH_PROFILER_WITH_FLOPS", "0") != "0"),
-
+    "VLLM_TORCH_PROFILER_WITH_FLOPS": lambda: bool(
+        os.getenv("VLLM_TORCH_PROFILER_WITH_FLOPS", "0") != "0"
+    ),
     # If set, vLLM will use Triton implementations of AWQ.
-    "VLLM_USE_TRITON_AWQ":
-    lambda: bool(int(os.getenv("VLLM_USE_TRITON_AWQ", "0"))),
-
+    "VLLM_USE_TRITON_AWQ": lambda: bool(int(os.getenv("VLLM_USE_TRITON_AWQ", "0"))),
     # If set, allow loading or unloading lora adapters in runtime,
-    "VLLM_ALLOW_RUNTIME_LORA_UPDATING":
-    lambda:
-    (os.environ.get("VLLM_ALLOW_RUNTIME_LORA_UPDATING", "0").strip().lower() in
-     ("1", "true")),
-
+    "VLLM_ALLOW_RUNTIME_LORA_UPDATING": lambda: (
+        os.environ.get("VLLM_ALLOW_RUNTIME_LORA_UPDATING", "0").strip().lower()
+        in ("1", "true")
+    ),
     # We assume drivers can report p2p status correctly.
     # If the program hangs when using custom allreduce,
     # potantially caused by a bug in the driver (535 series),
     # if might be helpful to set VLLM_SKIP_P2P_CHECK=0
     # so that vLLM can verify if p2p is actually working.
     # See https://github.com/vllm-project/vllm/blob/a9b15c606fea67a072416ea0ea115261a2756058/vllm/distributed/device_communicators/custom_all_reduce_utils.py#L101-L108 for details. # noqa
-    "VLLM_SKIP_P2P_CHECK":
-    lambda: os.getenv("VLLM_SKIP_P2P_CHECK", "1") == "1",
-
+    "VLLM_SKIP_P2P_CHECK": lambda: os.getenv("VLLM_SKIP_P2P_CHECK", "1") == "1",
     # List of quantization kernels that should be disabled, used for testing
     # and performance comparisons. Currently only affects MPLinearKernel
     # selection
     # (kernels: MacheteLinearKernel, MarlinLinearKernel, ExllamaLinearKernel)
-    "VLLM_DISABLED_KERNELS":
-    lambda: [] if "VLLM_DISABLED_KERNELS" not in os.environ else os.environ[
-        "VLLM_DISABLED_KERNELS"].split(","),
-
+    "VLLM_DISABLED_KERNELS": lambda: []
+    if "VLLM_DISABLED_KERNELS" not in os.environ
+    else os.environ["VLLM_DISABLED_KERNELS"].split(","),
     # Swaps the all reduce backend that we use to coordinate the DP padding
     # information from NCCL to gloo.
-    "VLLM_DISABLE_NCCL_FOR_DP_SYNCHRONIZATION":
-    lambda:
-    (os.getenv("VLLM_DISABLE_NCCL_FOR_DP_SYNCHRONIZATION", "False").lower() in
-             ("true", "1")),
-
+    "VLLM_DISABLE_NCCL_FOR_DP_SYNCHRONIZATION": lambda: (
+        os.getenv("VLLM_DISABLE_NCCL_FOR_DP_SYNCHRONIZATION", "False").lower()
+        in ("true", "1")
+    ),
     # Disable pynccl (using torch.distributed instead)
-    "VLLM_DISABLE_PYNCCL":
-    lambda:
-    (os.getenv("VLLM_DISABLE_PYNCCL", "False").lower() in ("true", "1")),
-
+    "VLLM_DISABLE_PYNCCL": lambda: (
+        os.getenv("VLLM_DISABLE_PYNCCL", "False").lower() in ("true", "1")
+    ),
     # If set, use the V1 code path.
-    "VLLM_USE_V1":
-    lambda: bool(int(os.getenv("VLLM_USE_V1", "1"))),
-
+    "VLLM_USE_V1": lambda: bool(int(os.getenv("VLLM_USE_V1", "1"))),
     # Disable aiter ops unless specifically enabled.
     # Acts as a parent switch to enable the rest of the other operations.
-    "VLLM_ROCM_USE_AITER":
-    lambda: (os.getenv("VLLM_ROCM_USE_AITER", "False").lower() in
-             ("true", "1")),
-
+    "VLLM_ROCM_USE_AITER": lambda: (
+        os.getenv("VLLM_ROCM_USE_AITER", "False").lower() in ("true", "1")
+    ),
     # Whether to use aiter paged attention.
     # By default is disabled.
-    "VLLM_ROCM_USE_AITER_PAGED_ATTN":
-    lambda: (os.getenv("VLLM_ROCM_USE_AITER_PAGED_ATTN", "False").lower() in
-             ("true", "1")),
-
+    "VLLM_ROCM_USE_AITER_PAGED_ATTN": lambda: (
+        os.getenv("VLLM_ROCM_USE_AITER_PAGED_ATTN", "False").lower() in ("true", "1")
+    ),
     # use aiter linear op if aiter ops are enabled
     # The following list of related ops
     # - scaled_mm (per-tensor / rowwise)
-    "VLLM_ROCM_USE_AITER_LINEAR":
-    lambda: (os.getenv("VLLM_ROCM_USE_AITER_LINEAR", "True").lower() in
-             ("true", "1")),
-
+    "VLLM_ROCM_USE_AITER_LINEAR": lambda: (
+        os.getenv("VLLM_ROCM_USE_AITER_LINEAR", "True").lower() in ("true", "1")
+    ),
     # Whether to use aiter moe ops.
     # By default is enabled.
-    "VLLM_ROCM_USE_AITER_MOE":
-    lambda: (os.getenv("VLLM_ROCM_USE_AITER_MOE", "True").lower() in
-             ("true", "1")),
-
+    "VLLM_ROCM_USE_AITER_MOE": lambda: (
+        os.getenv("VLLM_ROCM_USE_AITER_MOE", "True").lower() in ("true", "1")
+    ),
     # use aiter rms norm op if aiter ops are enabled.
-    "VLLM_ROCM_USE_AITER_RMSNORM":
-    lambda: (os.getenv("VLLM_ROCM_USE_AITER_RMSNORM", "True").lower() in
-             ("true", "1")),
-
+    "VLLM_ROCM_USE_AITER_RMSNORM": lambda: (
+        os.getenv("VLLM_ROCM_USE_AITER_RMSNORM", "True").lower() in ("true", "1")
+    ),
     # Whether to use aiter mla ops.
     # By default is enabled.
-    "VLLM_ROCM_USE_AITER_MLA":
-    lambda: (os.getenv("VLLM_ROCM_USE_AITER_MLA", "True").lower() in
-             ("true", "1")),
-
+    "VLLM_ROCM_USE_AITER_MLA": lambda: (
+        os.getenv("VLLM_ROCM_USE_AITER_MLA", "True").lower() in ("true", "1")
+    ),
     # Whether to use aiter mha ops.
     # By default is enabled.
-    "VLLM_ROCM_USE_AITER_MHA":
-    lambda: (os.getenv("VLLM_ROCM_USE_AITER_MHA", "True").lower() in
-             ("true", "1")),
-
+    "VLLM_ROCM_USE_AITER_MHA": lambda: (
+        os.getenv("VLLM_ROCM_USE_AITER_MHA", "True").lower() in ("true", "1")
+    ),
     # Whether to use aiter fp4 gemm asm.
     # By default is disabled.
-    "VLLM_ROCM_USE_AITER_FP4_ASM_GEMM":
-    lambda: (os.getenv("VLLM_ROCM_USE_AITER_FP4_ASM_GEMM", "False").lower() in
-             ("true", "1")),
-
+    "VLLM_ROCM_USE_AITER_FP4_ASM_GEMM": lambda: (
+        os.getenv("VLLM_ROCM_USE_AITER_FP4_ASM_GEMM", "False").lower() in ("true", "1")
+    ),
     # Whether to use aiter rope.
     # By default is disabled.
-    "VLLM_ROCM_USE_TRITON_ROPE":
-    lambda: (os.getenv("VLLM_ROCM_USE_TRITON_ROPE", "False").lower() in
-             ("true", "1")),
-
+    "VLLM_ROCM_USE_TRITON_ROPE": lambda: (
+        os.getenv("VLLM_ROCM_USE_TRITON_ROPE", "False").lower() in ("true", "1")
+    ),
     # Whether to use aiter triton fp8 bmm kernel
     # By default is enabled.
-    "VLLM_ROCM_USE_AITER_FP8BMM":
-    lambda: (os.getenv("VLLM_ROCM_USE_AITER_FP8BMM", "True").lower() in
-             ("true", "1")),
-
+    "VLLM_ROCM_USE_AITER_FP8BMM": lambda: (
+        os.getenv("VLLM_ROCM_USE_AITER_FP8BMM", "True").lower() in ("true", "1")
+    ),
     # use rocm skinny gemms
-    "VLLM_ROCM_USE_SKINNY_GEMM":
-    lambda: (os.getenv("VLLM_ROCM_USE_SKINNY_GEMM", "True").lower() in
-             ("true", "1")),
-
+    "VLLM_ROCM_USE_SKINNY_GEMM": lambda: (
+        os.getenv("VLLM_ROCM_USE_SKINNY_GEMM", "True").lower() in ("true", "1")
+    ),
     # Pad the fp8 weights to 256 bytes for ROCm
-    "VLLM_ROCM_FP8_PADDING":
-    lambda: bool(int(os.getenv("VLLM_ROCM_FP8_PADDING", "1"))),
-
+    "VLLM_ROCM_FP8_PADDING": lambda: bool(int(os.getenv("VLLM_ROCM_FP8_PADDING", "1"))),
     # Pad the weights for the moe kernel
-    "VLLM_ROCM_MOE_PADDING":
-    lambda: bool(int(os.getenv("VLLM_ROCM_MOE_PADDING", "1"))),
-
+    "VLLM_ROCM_MOE_PADDING": lambda: bool(int(os.getenv("VLLM_ROCM_MOE_PADDING", "1"))),
     # custom paged attention kernel for MI3* cards
-    "VLLM_ROCM_CUSTOM_PAGED_ATTN":
-    lambda: (os.getenv("VLLM_ROCM_CUSTOM_PAGED_ATTN", "True").lower() in
-             ("true", "1")),
-
+    "VLLM_ROCM_CUSTOM_PAGED_ATTN": lambda: (
+        os.getenv("VLLM_ROCM_CUSTOM_PAGED_ATTN", "True").lower() in ("true", "1")
+    ),
     # Custom quick allreduce kernel for MI3* cards
     # Choice of quantization level: FP, INT8, INT6, INT4 or NONE
     # Recommended for large models to get allreduce
-    "VLLM_ROCM_QUICK_REDUCE_QUANTIZATION":
-    env_with_choices("VLLM_ROCM_QUICK_REDUCE_QUANTIZATION", "NONE",
-                            ["FP", "INT8", "INT6", "INT4", "NONE"]),
-
+    "VLLM_ROCM_QUICK_REDUCE_QUANTIZATION": env_with_choices(
+        "VLLM_ROCM_QUICK_REDUCE_QUANTIZATION",
+        "NONE",
+        ["FP", "INT8", "INT6", "INT4", "NONE"],
+    ),
     # Custom quick allreduce kernel for MI3* cards
     # Due to the lack of the bfloat16 asm instruction, bfloat16
     # kernels are slower than fp16,
     # If environment variable is set to 1, the input is converted to fp16
-    "VLLM_ROCM_QUICK_REDUCE_CAST_BF16_TO_FP16":
-    lambda:
-    (os.getenv("VLLM_ROCM_QUICK_REDUCE_CAST_BF16_TO_FP16", "True").lower() in
-     ("true", "1")),
-
+    "VLLM_ROCM_QUICK_REDUCE_CAST_BF16_TO_FP16": lambda: (
+        os.getenv("VLLM_ROCM_QUICK_REDUCE_CAST_BF16_TO_FP16", "True").lower()
+        in ("true", "1")
+    ),
     # Custom quick allreduce kernel for MI3* cards.
     # Controls the maximum allowed number of data bytes(MB) for custom quick
     # allreduce communication.
     # Default: 2048 MB.
     # Data exceeding this size will use either custom allreduce or RCCL
     # communication.
-    "VLLM_ROCM_QUICK_REDUCE_MAX_SIZE_BYTES_MB":
-    lambda: maybe_convert_int(
-        os.environ.get("VLLM_ROCM_QUICK_REDUCE_MAX_SIZE_BYTES_MB", None)),
-
+    "VLLM_ROCM_QUICK_REDUCE_MAX_SIZE_BYTES_MB": lambda: maybe_convert_int(
+        os.environ.get("VLLM_ROCM_QUICK_REDUCE_MAX_SIZE_BYTES_MB", None)
+    ),
     # Divisor for dynamic query scale factor calculation for FP8 KV Cache
-    "Q_SCALE_CONSTANT":
-    lambda: int(os.getenv("Q_SCALE_CONSTANT", "200")),
+    "Q_SCALE_CONSTANT": lambda: int(os.getenv("Q_SCALE_CONSTANT", "200")),
     # Divisor for dynamic key scale factor calculation for FP8 KV Cache
-    "K_SCALE_CONSTANT":
-    lambda: int(os.getenv("K_SCALE_CONSTANT", "200")),
+    "K_SCALE_CONSTANT": lambda: int(os.getenv("K_SCALE_CONSTANT", "200")),
     # Divisor for dynamic value scale factor calculation for FP8 KV Cache
-    "V_SCALE_CONSTANT":
-    lambda: int(os.getenv("V_SCALE_CONSTANT", "100")),
-
+    "V_SCALE_CONSTANT": lambda: int(os.getenv("V_SCALE_CONSTANT", "100")),
     # If set, enable multiprocessing in LLM for the V1 code path.
-    "VLLM_ENABLE_V1_MULTIPROCESSING":
-    lambda: bool(int(os.getenv("VLLM_ENABLE_V1_MULTIPROCESSING", "1"))),
-    "VLLM_LOG_BATCHSIZE_INTERVAL":
-    lambda: float(os.getenv("VLLM_LOG_BATCHSIZE_INTERVAL", "-1")),
-    "VLLM_DISABLE_COMPILE_CACHE":
-    lambda: bool(int(os.getenv("VLLM_DISABLE_COMPILE_CACHE", "0"))),
-
+    "VLLM_ENABLE_V1_MULTIPROCESSING": lambda: bool(
+        int(os.getenv("VLLM_ENABLE_V1_MULTIPROCESSING", "1"))
+    ),
+    "VLLM_LOG_BATCHSIZE_INTERVAL": lambda: float(
+        os.getenv("VLLM_LOG_BATCHSIZE_INTERVAL", "-1")
+    ),
+    "VLLM_DISABLE_COMPILE_CACHE": lambda: bool(
+        int(os.getenv("VLLM_DISABLE_COMPILE_CACHE", "0"))
+    ),
     # If set, vllm will run in development mode, which will enable
     # some additional endpoints for developing and debugging,
     # e.g. `/reset_prefix_cache`
-    "VLLM_SERVER_DEV_MODE":
-    lambda: bool(int(os.getenv("VLLM_SERVER_DEV_MODE", "0"))),
-
+    "VLLM_SERVER_DEV_MODE": lambda: bool(int(os.getenv("VLLM_SERVER_DEV_MODE", "0"))),
     # Controls the maximum number of requests to handle in a
     # single asyncio task when processing per-token outputs in the
     # V1 AsyncLLM interface. It is applicable when handling a high
@@ -1049,175 +960,157 @@ def get_vllm_port() -> Optional[int]:
     # Setting this too high can result in a higher variance of
     # inter-message latencies. Setting it too low can negatively impact
     # TTFT and overall throughput.
-    "VLLM_V1_OUTPUT_PROC_CHUNK_SIZE":
-    lambda: int(os.getenv("VLLM_V1_OUTPUT_PROC_CHUNK_SIZE", "128")),
-
+    "VLLM_V1_OUTPUT_PROC_CHUNK_SIZE": lambda: int(
+        os.getenv("VLLM_V1_OUTPUT_PROC_CHUNK_SIZE", "128")
+    ),
     # If set, vLLM will disable the MLA attention optimizations.
-    "VLLM_MLA_DISABLE":
-    lambda: bool(int(os.getenv("VLLM_MLA_DISABLE", "0"))),
-
+    "VLLM_MLA_DISABLE": lambda: bool(int(os.getenv("VLLM_MLA_DISABLE", "0"))),
     # If set, vLLM will pick up the provided Flash Attention MLA
     # max number splits for cuda graph decode
-    "VLLM_FLASH_ATTN_MAX_NUM_SPLITS_FOR_CUDA_GRAPH":
-    lambda: int(os.getenv("VLLM_FLASH_ATTN_MAX_NUM_SPLITS_FOR_CUDA_GRAPH",
-                          "32")),
-
+    "VLLM_FLASH_ATTN_MAX_NUM_SPLITS_FOR_CUDA_GRAPH": lambda: int(
+        os.getenv("VLLM_FLASH_ATTN_MAX_NUM_SPLITS_FOR_CUDA_GRAPH", "32")
+    ),
     # Number of GPUs per worker in Ray, if it is set to be a fraction,
     # it allows ray to schedule multiple actors on a single GPU,
     # so that users can colocate other actors on the same GPUs as vLLM.
-    "VLLM_RAY_PER_WORKER_GPUS":
-    lambda: float(os.getenv("VLLM_RAY_PER_WORKER_GPUS", "1.0")),
-
+    "VLLM_RAY_PER_WORKER_GPUS": lambda: float(
+        os.getenv("VLLM_RAY_PER_WORKER_GPUS", "1.0")
+    ),
     # Bundle indices for Ray, if it is set, it can control precisely
     # which indices are used for the Ray bundle, for every worker.
     # Format: comma-separated list of integers, e.g. "0,1,2,3"
-    "VLLM_RAY_BUNDLE_INDICES":
-    lambda: os.getenv("VLLM_RAY_BUNDLE_INDICES", ""),
-
+    "VLLM_RAY_BUNDLE_INDICES": lambda: os.getenv("VLLM_RAY_BUNDLE_INDICES", ""),
     # In some system, find_loaded_library() may not work. So we allow users to
     # specify the path through environment variable VLLM_CUDART_SO_PATH.
-    "VLLM_CUDART_SO_PATH":
-    lambda: os.getenv("VLLM_CUDART_SO_PATH", None),
-
+    "VLLM_CUDART_SO_PATH": lambda: os.getenv("VLLM_CUDART_SO_PATH", None),
     # Rank of the process in the data parallel setting
-    "VLLM_DP_RANK":
-    lambda: int(os.getenv("VLLM_DP_RANK", "0")),
-
+    "VLLM_DP_RANK": lambda: int(os.getenv("VLLM_DP_RANK", "0")),
     # Rank of the process in the data parallel setting.
     # Defaults to VLLM_DP_RANK when not set.
-    "VLLM_DP_RANK_LOCAL":
-    lambda: int(
-        os.getenv("VLLM_DP_RANK_LOCAL", sys.modules[__name__].VLLM_DP_RANK)),
-
+    "VLLM_DP_RANK_LOCAL": lambda: int(
+        os.getenv("VLLM_DP_RANK_LOCAL", sys.modules[__name__].VLLM_DP_RANK)
+    ),
     # World size of the data parallel setting
-    "VLLM_DP_SIZE":
-    lambda: int(os.getenv("VLLM_DP_SIZE", "1")),
-
+    "VLLM_DP_SIZE": lambda: int(os.getenv("VLLM_DP_SIZE", "1")),
     # IP address of the master node in the data parallel setting
-    "VLLM_DP_MASTER_IP":
-    lambda: os.getenv("VLLM_DP_MASTER_IP", "127.0.0.1"),
-
+    "VLLM_DP_MASTER_IP": lambda: os.getenv("VLLM_DP_MASTER_IP", "127.0.0.1"),
     # Port of the master node in the data parallel setting
-    "VLLM_DP_MASTER_PORT":
-    lambda: int(os.getenv("VLLM_DP_MASTER_PORT", "0")),
-
+    "VLLM_DP_MASTER_PORT": lambda: int(os.getenv("VLLM_DP_MASTER_PORT", "0")),
     # In the context of executing MoE models with Data-Parallel, Expert-Parallel
     # and Batched All-to-All dispatch/combine kernels, VLLM_MOE_DP_CHUNK_SIZE
     # dictates the quantum of tokens that can be dispatched from a DP
     # rank. All DP ranks process the activations in VLLM_MOE_DP_CHUNK_SIZE
     # units.
-    "VLLM_MOE_DP_CHUNK_SIZE":
-    lambda: int(os.getenv("VLLM_MOE_DP_CHUNK_SIZE", "256")),
-
+    "VLLM_MOE_DP_CHUNK_SIZE": lambda: int(os.getenv("VLLM_MOE_DP_CHUNK_SIZE", "256")),
     # Randomize inputs during dummy runs when using Data Parallel
-    "VLLM_RANDOMIZE_DP_DUMMY_INPUTS":
-    lambda: os.environ.get("VLLM_RANDOMIZE_DP_DUMMY_INPUTS", "0") == "1",
-
+    "VLLM_RANDOMIZE_DP_DUMMY_INPUTS": lambda: os.environ.get(
+        "VLLM_RANDOMIZE_DP_DUMMY_INPUTS", "0"
+    )
+    == "1",
     # Whether to use S3 path for model loading in CI via RunAI Streamer
-    "VLLM_CI_USE_S3":
-    lambda: os.environ.get("VLLM_CI_USE_S3", "0") == "1",
-
+    "VLLM_CI_USE_S3": lambda: os.environ.get("VLLM_CI_USE_S3", "0") == "1",
     # Use model_redirect to redirect the model name to a local folder.
     # `model_redirect` can be a json file mapping the model between
     # repo_id and local folder:
     # {"meta-llama/Llama-3.2-1B": "/tmp/Llama-3.2-1B"}
     # or a space separated values table file:
     # meta-llama/Llama-3.2-1B   /tmp/Llama-3.2-1B
-    "VLLM_MODEL_REDIRECT_PATH":
-    lambda: os.environ.get("VLLM_MODEL_REDIRECT_PATH", None),
-
+    "VLLM_MODEL_REDIRECT_PATH": lambda: os.environ.get(
+        "VLLM_MODEL_REDIRECT_PATH", None
+    ),
     # Whether to use atomicAdd reduce in gptq/awq marlin kernel.
-    "VLLM_MARLIN_USE_ATOMIC_ADD":
-    lambda: os.environ.get("VLLM_MARLIN_USE_ATOMIC_ADD", "0") == "1",
-
+    "VLLM_MARLIN_USE_ATOMIC_ADD": lambda: os.environ.get(
+        "VLLM_MARLIN_USE_ATOMIC_ADD", "0"
+    )
+    == "1",
     # Whether to use marlin kernel in mxfp4 quantization method
-    "VLLM_MXFP4_USE_MARLIN":
-    lambda: maybe_convert_bool(os.environ.get("VLLM_MXFP4_USE_MARLIN", None)),
-
+    "VLLM_MXFP4_USE_MARLIN": lambda: maybe_convert_bool(
+        os.environ.get("VLLM_MXFP4_USE_MARLIN", None)
+    ),
     # Whether to turn on the outlines cache for V0
     # This cache is unbounded and on disk, so it's not safe to use in
     # an environment with potentially malicious users.
-    "VLLM_V0_USE_OUTLINES_CACHE":
-    lambda: os.environ.get("VLLM_V0_USE_OUTLINES_CACHE", "0") == "1",
-
+    "VLLM_V0_USE_OUTLINES_CACHE": lambda: os.environ.get(
+        "VLLM_V0_USE_OUTLINES_CACHE", "0"
+    )
+    == "1",
     # Whether to turn on the outlines cache for V1
     # This cache is unbounded and on disk, so it's not safe to use in
     # an environment with potentially malicious users.
-    "VLLM_V1_USE_OUTLINES_CACHE":
-    lambda: os.environ.get("VLLM_V1_USE_OUTLINES_CACHE", "0") == "1",
-
+    "VLLM_V1_USE_OUTLINES_CACHE": lambda: os.environ.get(
+        "VLLM_V1_USE_OUTLINES_CACHE", "0"
+    )
+    == "1",
     # Gap between padding buckets for the forward pass. So we have
     # 8, we will run forward pass with [16, 24, 32, ...].
-    "VLLM_TPU_BUCKET_PADDING_GAP":
-    lambda: int(os.environ["VLLM_TPU_BUCKET_PADDING_GAP"])
-    if "VLLM_TPU_BUCKET_PADDING_GAP" in os.environ else 0,
-    "VLLM_TPU_MOST_MODEL_LEN":
-    lambda: maybe_convert_int(os.environ.get("VLLM_TPU_MOST_MODEL_LEN", None)),
-
+    "VLLM_TPU_BUCKET_PADDING_GAP": lambda: int(
+        os.environ["VLLM_TPU_BUCKET_PADDING_GAP"]
+    )
+    if "VLLM_TPU_BUCKET_PADDING_GAP" in os.environ
+    else 0,
+    "VLLM_TPU_MOST_MODEL_LEN": lambda: maybe_convert_int(
+        os.environ.get("VLLM_TPU_MOST_MODEL_LEN", None)
+    ),
     # Whether using Pathways
-    "VLLM_TPU_USING_PATHWAYS":
-    lambda: bool("proxy" in os.getenv("JAX_PLATFORMS", "").lower()),
-
+    "VLLM_TPU_USING_PATHWAYS": lambda: bool(
+        "proxy" in os.getenv("JAX_PLATFORMS", "").lower()
+    ),
     # Allow use of DeepGemm kernels for fused moe ops.
-    "VLLM_USE_DEEP_GEMM":
-    lambda: bool(int(os.getenv("VLLM_USE_DEEP_GEMM", "1"))),
-
+    "VLLM_USE_DEEP_GEMM": lambda: bool(int(os.getenv("VLLM_USE_DEEP_GEMM", "1"))),
     # Whether to use E8M0 scaling when DeepGEMM is used on Blackwell GPUs.
-    "VLLM_USE_DEEP_GEMM_E8M0":
-    lambda: bool(int(os.getenv("VLLM_USE_DEEP_GEMM_E8M0", "1"))),
+    "VLLM_USE_DEEP_GEMM_E8M0": lambda: bool(
+        int(os.getenv("VLLM_USE_DEEP_GEMM_E8M0", "1"))
+    ),
     # TODO(wentao): unify the two E8M0 flags after verifying the correctness.
     # Whether to use E8M0 scaling when DeepGEMM is used on Hopper GPUs.
-    "VLLM_USE_DEEP_GEMM_E8M0_HOPPER":
-    lambda: bool(int(os.getenv("VLLM_USE_DEEP_GEMM_E8M0_HOPPER", "0"))),
+    "VLLM_USE_DEEP_GEMM_E8M0_HOPPER": lambda: bool(
+        int(os.getenv("VLLM_USE_DEEP_GEMM_E8M0_HOPPER", "0"))
+    ),
     # DeepGemm JITs the kernels on-demand. The warmup attempts to make DeepGemm
     # JIT all the required kernels before model execution so there is no
     # JIT'ing in the hot-path. However, this warmup increases the engine
     # startup time by a couple of minutes.
     # Set `VLLM_SKIP_DEEP_GEMM_WARMUP` to disable the warmup.
-    "VLLM_SKIP_DEEP_GEMM_WARMUP":
-    lambda: bool(int(os.getenv("VLLM_SKIP_DEEP_GEMM_WARMUP", "0"))),
-
+    "VLLM_SKIP_DEEP_GEMM_WARMUP": lambda: bool(
+        int(os.getenv("VLLM_SKIP_DEEP_GEMM_WARMUP", "0"))
+    ),
     # Whether to use fused grouped_topk used for MoE expert selection.
-    "VLLM_USE_FUSED_MOE_GROUPED_TOPK":
-    lambda: bool(int(os.getenv("VLLM_USE_FUSED_MOE_GROUPED_TOPK", "1"))),
-
+    "VLLM_USE_FUSED_MOE_GROUPED_TOPK": lambda: bool(
+        int(os.getenv("VLLM_USE_FUSED_MOE_GROUPED_TOPK", "1"))
+    ),
     # Allow use of FlashInfer MoE kernels for fused moe ops.
-    "VLLM_USE_FLASHINFER_MOE_FP16":
-    lambda: bool(int(os.getenv("VLLM_USE_FLASHINFER_MOE_FP16", "0"))),
-
+    "VLLM_USE_FLASHINFER_MOE_FP16": lambda: bool(
+        int(os.getenv("VLLM_USE_FLASHINFER_MOE_FP16", "0"))
+    ),
     # Allow use of FlashInfer MoE kernels for fused moe ops.
-    "VLLM_USE_FLASHINFER_MOE_FP8":
-    lambda: bool(int(os.getenv("VLLM_USE_FLASHINFER_MOE_FP8", "0"))),
-
+    "VLLM_USE_FLASHINFER_MOE_FP8": lambda: bool(
+        int(os.getenv("VLLM_USE_FLASHINFER_MOE_FP8", "0"))
+    ),
     # Allow use of FlashInfer CUTLASS kernels for fused moe ops.
-    "VLLM_USE_FLASHINFER_MOE_FP4":
-    lambda: bool(int(os.getenv("VLLM_USE_FLASHINFER_MOE_FP4", "0"))),
-
+    "VLLM_USE_FLASHINFER_MOE_FP4": lambda: bool(
+        int(os.getenv("VLLM_USE_FLASHINFER_MOE_FP4", "0"))
+    ),
     # If set to 1, use the FlashInfer
     # MXFP8 (activation) x MXFP4 (weight) MoE backend.
-    "VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8":
-    lambda: bool(int(os.getenv("VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8", "0"))),
-
+    "VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8": lambda: bool(
+        int(os.getenv("VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8", "0"))
+    ),
     # If set to 1, use the FlashInfer CUTLASS backend for
     # MXFP8 (activation) x MXFP4 (weight) MoE.
     # This is separate from the TRTLLMGEN path controlled by
     # VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8.
-    "VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8_CUTLASS":
-    lambda: bool(int(
-        os.getenv("VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8_CUTLASS", "0")
-        )),
-
+    "VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8_CUTLASS": lambda: bool(
+        int(os.getenv("VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8_CUTLASS", "0"))
+    ),
     # If set to 1, use the FlashInfer
     # BF16 (activation) x MXFP4 (weight) MoE backend.
-    "VLLM_USE_FLASHINFER_MOE_MXFP4_BF16":
-    lambda: bool(int(os.getenv("VLLM_USE_FLASHINFER_MOE_MXFP4_BF16", "0"))),
-
+    "VLLM_USE_FLASHINFER_MOE_MXFP4_BF16": lambda: bool(
+        int(os.getenv("VLLM_USE_FLASHINFER_MOE_MXFP4_BF16", "0"))
+    ),
     # Control the cache sized used by the xgrammar compiler. The default
     # of 512 MB should be enough for roughly 1000 JSON schemas.
     # It can be changed with this variable if needed for some reason.
-    "VLLM_XGRAMMAR_CACHE_MB":
-    lambda: int(os.getenv("VLLM_XGRAMMAR_CACHE_MB", "512")),
-
+    "VLLM_XGRAMMAR_CACHE_MB": lambda: int(os.getenv("VLLM_XGRAMMAR_CACHE_MB", "512")),
     # Control the threshold for msgspec to use 'zero copy' for
     # serialization/deserialization of tensors. Tensors below
     # this limit will be encoded into the msgpack buffer, and
@@ -1225,23 +1118,23 @@ def get_vllm_port() -> Optional[int]:
     # While the sending side still actually copies the tensor
     # in all cases, on the receiving side, tensors above this
     # limit will actually be zero-copy decoded.
-    "VLLM_MSGPACK_ZERO_COPY_THRESHOLD":
-    lambda: int(os.getenv("VLLM_MSGPACK_ZERO_COPY_THRESHOLD", "256")),
-
+    "VLLM_MSGPACK_ZERO_COPY_THRESHOLD": lambda: int(
+        os.getenv("VLLM_MSGPACK_ZERO_COPY_THRESHOLD", "256")
+    ),
     # If set, allow insecure serialization using pickle.
     # This is useful for environments where it is deemed safe to use the
     # insecure method and it is needed for some reason.
-    "VLLM_ALLOW_INSECURE_SERIALIZATION":
-    lambda: bool(int(os.getenv("VLLM_ALLOW_INSECURE_SERIALIZATION", "0"))),
-
+    "VLLM_ALLOW_INSECURE_SERIALIZATION": lambda: bool(
+        int(os.getenv("VLLM_ALLOW_INSECURE_SERIALIZATION", "0"))
+    ),
     # IP address used for NIXL handshake between remote agents.
-    "VLLM_NIXL_SIDE_CHANNEL_HOST":
-    lambda: os.getenv("VLLM_NIXL_SIDE_CHANNEL_HOST", "localhost"),
-
+    "VLLM_NIXL_SIDE_CHANNEL_HOST": lambda: os.getenv(
+        "VLLM_NIXL_SIDE_CHANNEL_HOST", "localhost"
+    ),
     # Port used for NIXL handshake between remote agents.
-    "VLLM_NIXL_SIDE_CHANNEL_PORT":
-    lambda: int(os.getenv("VLLM_NIXL_SIDE_CHANNEL_PORT", "5600")),
-
+    "VLLM_NIXL_SIDE_CHANNEL_PORT": lambda: int(
+        os.getenv("VLLM_NIXL_SIDE_CHANNEL_PORT", "5600")
+    ),
     # all2all backend for vllm's expert parallel communication
     # Available options:
     # - "naive": naive all2all implementation using broadcasts
@@ -1251,14 +1144,18 @@ def get_vllm_port() -> Optional[int]:
     # - "deepep_high_throughput", use deepep high-throughput kernels
     # - "deepep_low_latency", use deepep low-latency kernels
     # - "flashinfer_all2allv", use flashinfer alltoallv kernels for mnnvl
-    "VLLM_ALL2ALL_BACKEND":
-    env_with_choices("VLLM_ALL2ALL_BACKEND", "allgather_reducescatter",
-                     ["naive", "pplx",
-                     "deepep_high_throughput",
-                     "deepep_low_latency",
-                     "allgather_reducescatter",
-                     "flashinfer_all2allv"]),
-
+    "VLLM_ALL2ALL_BACKEND": env_with_choices(
+        "VLLM_ALL2ALL_BACKEND",
+        "allgather_reducescatter",
+        [
+            "naive",
+            "pplx",
+            "deepep_high_throughput",
+            "deepep_low_latency",
+            "allgather_reducescatter",
+            "flashinfer_all2allv",
+        ],
+    ),
     # Flashinfer MoE backend for vLLM's fused Mixture-of-Experts support.
     # Both require compute capability 10.0 or above.
     # Available options:
@@ -1266,56 +1163,52 @@ def get_vllm_port() -> Optional[int]:
     #     Uses CUTLASS kernels optimized for high-throughput batch inference.
     # - "latency":
     #     Uses TensorRT-LLM kernels optimized for low-latency inference.
-    "VLLM_FLASHINFER_MOE_BACKEND":
-    env_with_choices("VLLM_FLASHINFER_MOE_BACKEND", "throughput",
-    ["throughput", "latency"]),
-
+    "VLLM_FLASHINFER_MOE_BACKEND": env_with_choices(
+        "VLLM_FLASHINFER_MOE_BACKEND", "throughput", ["throughput", "latency"]
+    ),
     # Control the maximum number of tokens per expert supported by the
     # NVFP4 MoE CUTLASS Kernel. This value is used to create a buffer for
     # the blockscale tensor of activations NVFP4 Quantization.
     # This is used to prevent the kernel from running out of memory.
-    "VLLM_MAX_TOKENS_PER_EXPERT_FP4_MOE":
-    lambda: int(os.getenv("VLLM_MAX_TOKENS_PER_EXPERT_FP4_MOE", "163840")),
-
+    "VLLM_MAX_TOKENS_PER_EXPERT_FP4_MOE": lambda: int(
+        os.getenv("VLLM_MAX_TOKENS_PER_EXPERT_FP4_MOE", "163840")
+    ),
     # Specifies the thresholds of the communicated tensor sizes under which
     # vllm should use flashinfer fused allreduce. The variable should be a
     # JSON with the following format:
     #     { <world size>: <max size in mb> }
     # Unspecified world sizes will fall back to
     #     { 2: 64, 4: 1, <everything else>: 0.5 }
-    "VLLM_FLASHINFER_ALLREDUCE_FUSION_THRESHOLDS_MB":
-    lambda: json.loads(os.getenv(
-        "VLLM_FLASHINFER_ALLREDUCE_FUSION_THRESHOLDS_MB", "{}")),
-
+    "VLLM_FLASHINFER_ALLREDUCE_FUSION_THRESHOLDS_MB": lambda: json.loads(
+        os.getenv("VLLM_FLASHINFER_ALLREDUCE_FUSION_THRESHOLDS_MB", "{}")
+    ),
     # MoE routing strategy selector.
     # See `RoutingSimulator.get_available_strategies()` # for available
     # strategies.
     # Cutstom routing strategies can be registered by
     # RoutingSimulator.register_strategy()
     # Note: custom strategies may not produce correct model outputs
-    "VLLM_MOE_ROUTING_SIMULATION_STRATEGY":
-    lambda: os.environ.get("VLLM_MOE_ROUTING_SIMULATION_STRATEGY", "").lower(),
-
+    "VLLM_MOE_ROUTING_SIMULATION_STRATEGY": lambda: os.environ.get(
+        "VLLM_MOE_ROUTING_SIMULATION_STRATEGY", ""
+    ).lower(),
     # Regex timeout for use by the vLLM tool parsing plugins.
-    "VLLM_TOOL_PARSE_REGEX_TIMEOUT_SECONDS":
-    lambda: int(os.getenv("VLLM_TOOL_PARSE_REGEX_TIMEOUT_SECONDS", "1")),
-
+    "VLLM_TOOL_PARSE_REGEX_TIMEOUT_SECONDS": lambda: int(
+        os.getenv("VLLM_TOOL_PARSE_REGEX_TIMEOUT_SECONDS", "1")
+    ),
     # Reduce CPU usage when vLLM is idle. Enabling this will incur small
     # latency penalty when a request eventually comes.
-    "VLLM_SLEEP_WHEN_IDLE":
-    lambda: bool(int(os.getenv("VLLM_SLEEP_WHEN_IDLE", "0"))),
-
+    "VLLM_SLEEP_WHEN_IDLE": lambda: bool(int(os.getenv("VLLM_SLEEP_WHEN_IDLE", "0"))),
     # Control the max chunk bytes (in MB) for the rpc message queue.
     # Object larger than this threshold will be broadcast to worker
     # processes via zmq.
-    "VLLM_MQ_MAX_CHUNK_BYTES_MB":
-    lambda: int(os.getenv("VLLM_MQ_MAX_CHUNK_BYTES_MB", "16")),
-
+    "VLLM_MQ_MAX_CHUNK_BYTES_MB": lambda: int(
+        os.getenv("VLLM_MQ_MAX_CHUNK_BYTES_MB", "16")
+    ),
     # Timeout in seconds for execute_model RPC calls in multiprocessing
     # executor (only applies when TP > 1).
-    "VLLM_EXECUTE_MODEL_TIMEOUT_SECONDS":
-    lambda: int(os.getenv("VLLM_EXECUTE_MODEL_TIMEOUT_SECONDS", "300")),
-
+    "VLLM_EXECUTE_MODEL_TIMEOUT_SECONDS": lambda: int(
+        os.getenv("VLLM_EXECUTE_MODEL_TIMEOUT_SECONDS", "300")
+    ),
     # KV Cache layout used throughout vllm.
     # Some common values are:
     # - NHD
@@ -1323,76 +1216,71 @@ def get_vllm_port() -> Optional[int]:
     # Where N=num_blocks, H=num_heads and D=head_size. The default value will
     # leave the layout choice to the backend. Mind that backends may only
     # implement and support a subset of all possible layouts.
-    "VLLM_KV_CACHE_LAYOUT":
-    env_with_choices("VLLM_KV_CACHE_LAYOUT", None, ["NHD", "HND"]),
-
+    "VLLM_KV_CACHE_LAYOUT": env_with_choices(
+        "VLLM_KV_CACHE_LAYOUT", None, ["NHD", "HND"]
+    ),
     # Enable checking whether the generated logits contain NaNs,
     # indicating corrupted output. Useful for debugging low level bugs
     # or bad hardware but it may add compute overhead.
-    "VLLM_COMPUTE_NANS_IN_LOGITS":
-    lambda: bool(int(os.getenv("VLLM_COMPUTE_NANS_IN_LOGITS", "0"))),
-
+    "VLLM_COMPUTE_NANS_IN_LOGITS": lambda: bool(
+        int(os.getenv("VLLM_COMPUTE_NANS_IN_LOGITS", "0"))
+    ),
     # Controls whether or not emulations are used for NVFP4
     # generations on machines < 100 for compressed-tensors
     # models
-    "VLLM_USE_NVFP4_CT_EMULATIONS":
-    lambda: bool(int(os.getenv("VLLM_USE_NVFP4_CT_EMULATIONS", "0"))),
-
+    "VLLM_USE_NVFP4_CT_EMULATIONS": lambda: bool(
+        int(os.getenv("VLLM_USE_NVFP4_CT_EMULATIONS", "0"))
+    ),
     # Time (in seconds) after which the KV cache on the producer side is
     # automatically cleared if no READ notification is received from the
     # consumer. This is only applicable when using NixlConnector in a
     # disaggregated decode-prefill setup.
-    "VLLM_NIXL_ABORT_REQUEST_TIMEOUT":
-    lambda: int(os.getenv("VLLM_NIXL_ABORT_REQUEST_TIMEOUT", "480")),
-
+    "VLLM_NIXL_ABORT_REQUEST_TIMEOUT": lambda: int(
+        os.getenv("VLLM_NIXL_ABORT_REQUEST_TIMEOUT", "480")
+    ),
     # Controls whether or not to use cudnn prefill
-    "VLLM_USE_CUDNN_PREFILL":
-    lambda: bool(int(os.getenv("VLLM_USE_CUDNN_PREFILL", "0"))),
-
+    "VLLM_USE_CUDNN_PREFILL": lambda: bool(
+        int(os.getenv("VLLM_USE_CUDNN_PREFILL", "0"))
+    ),
     # If set to 1/True, use the TRTLLM attention backend in flashinfer.
     # If set to 0/False, use the default attention backend in flashinfer.
     # If not set, auto-detect the attention backend in flashinfer.
-    "VLLM_USE_TRTLLM_ATTENTION":
-    lambda: (None if "VLLM_USE_TRTLLM_ATTENTION" not in os.environ else
-             os.environ["VLLM_USE_TRTLLM_ATTENTION"].lower() in ("1", "true")),
-
+    "VLLM_USE_TRTLLM_ATTENTION": lambda: (
+        None
+        if "VLLM_USE_TRTLLM_ATTENTION" not in os.environ
+        else os.environ["VLLM_USE_TRTLLM_ATTENTION"].lower() in ("1", "true")
+    ),
     # If set to 1, when we use fp8 kv, we do not quantize Q to fp8
-    "VLLM_FLASHINFER_DISABLE_Q_QUANTIZATION":
-    lambda: bool(int(os.getenv("VLLM_FLASHINFER_DISABLE_Q_QUANTIZATION", "0"))),
-
+    "VLLM_FLASHINFER_DISABLE_Q_QUANTIZATION": lambda: bool(
+        int(os.getenv("VLLM_FLASHINFER_DISABLE_Q_QUANTIZATION", "0"))
+    ),
     # If set, it means we pre-downloaded cubin files and flashinfer will
     # read the cubin files directly.
-    "VLLM_HAS_FLASHINFER_CUBIN":
-    lambda: os.getenv("VLLM_HAS_FLASHINFER_CUBIN", False),
-
+    "VLLM_HAS_FLASHINFER_CUBIN": lambda: os.getenv("VLLM_HAS_FLASHINFER_CUBIN", False),
     # If set to 1, force the use of TRTLLM FP4 GEMM backend in flashinfer.
     # Otherwise, uses the first available of: flashinfer cutlass GEMM,
     # vllm cutlass GEMM, marlin GEMM.
-    "VLLM_USE_TRTLLM_FP4_GEMM":
-    lambda: bool(int(os.getenv("VLLM_USE_TRTLLM_FP4_GEMM", "0"))),
-
+    "VLLM_USE_TRTLLM_FP4_GEMM": lambda: bool(
+        int(os.getenv("VLLM_USE_TRTLLM_FP4_GEMM", "0"))
+    ),
     # Controls garbage collection during CUDA graph capture.
     # If set to 0 (default), enables GC freezing to speed up capture time.
     # If set to 1, allows GC to run during capture.
-    "VLLM_ENABLE_CUDAGRAPH_GC":
-    lambda: bool(int(os.getenv("VLLM_ENABLE_CUDAGRAPH_GC", "0"))),
-
+    "VLLM_ENABLE_CUDAGRAPH_GC": lambda: bool(
+        int(os.getenv("VLLM_ENABLE_CUDAGRAPH_GC", "0"))
+    ),
     # Disable padding to CUDA graph capture batch sizes.
     # TODO(wentao): https://github.com/vllm-project/vllm/issues/23378
     # After the issue is fixed, we can remove this flag.
-    "VLLM_DISABLE_PAD_FOR_CUDAGRAPH":
-    lambda: bool(int(os.getenv("VLLM_DISABLE_PAD_FOR_CUDAGRAPH", "0"))),
-
+    "VLLM_DISABLE_PAD_FOR_CUDAGRAPH": lambda: bool(
+        int(os.getenv("VLLM_DISABLE_PAD_FOR_CUDAGRAPH", "0"))
+    ),
     # Used to force set up loopback IP
-    "VLLM_LOOPBACK_IP":
-    lambda: os.getenv("VLLM_LOOPBACK_IP", ""),
-
+    "VLLM_LOOPBACK_IP": lambda: os.getenv("VLLM_LOOPBACK_IP", ""),
     # Used to set the process name prefix for vLLM processes.
     # This is useful for debugging and monitoring purposes.
     # The default value is "VLLM".
-    "VLLM_PROCESS_NAME_PREFIX":
-    lambda: os.getenv("VLLM_PROCESS_NAME_PREFIX", "VLLM"),
-
+    "VLLM_PROCESS_NAME_PREFIX": lambda: os.getenv("VLLM_PROCESS_NAME_PREFIX", "VLLM"),
     # Allow chunked local attention with hybrid kv cache manager.
     # Currently using the Hybrid KV cache manager with chunked local attention
     # in the Llama4 models (the only models currently using chunked local attn)
@@ -1400,10 +1288,9 @@ def get_vllm_port() -> Optional[int]:
     # This flag is used to allow users to enable it if they want to (to save on
     # kv-cache memory usage and enable longer contexts)
     # TODO(lucas): Remove this flag once latency regression is resolved.
-    "VLLM_ALLOW_CHUNKED_LOCAL_ATTN_WITH_HYBRID_KV_CACHE":
-    lambda: bool(int(os.getenv(\
-            "VLLM_ALLOW_CHUNKED_LOCAL_ATTN_WITH_HYBRID_KV_CACHE", "0"))),
-
+    "VLLM_ALLOW_CHUNKED_LOCAL_ATTN_WITH_HYBRID_KV_CACHE": lambda: bool(
+        int(os.getenv("VLLM_ALLOW_CHUNKED_LOCAL_ATTN_WITH_HYBRID_KV_CACHE", "0"))
+    ),
     # Enables support for the "store" option in the OpenAI Responses API.
     # When set to 1, vLLM's OpenAI server will retain the input and output
     # messages for those requests in memory. By default, this is disabled (0),
@@ -1413,83 +1300,74 @@ def get_vllm_port() -> Optional[int]:
     #    lost when the vLLM server shuts down.
     # 2. Enabling this option will cause a memory leak, as stored messages are
     #    never removed from memory until the server terminates.
-    "VLLM_ENABLE_RESPONSES_API_STORE":
-    lambda: bool(int(os.getenv("VLLM_ENABLE_RESPONSES_API_STORE", "0"))),
-
+    "VLLM_ENABLE_RESPONSES_API_STORE": lambda: bool(
+        int(os.getenv("VLLM_ENABLE_RESPONSES_API_STORE", "0"))
+    ),
     # If set, use the fp8 mfma in rocm paged attention.
-    "VLLM_ROCM_FP8_MFMA_PAGE_ATTN":
-    lambda: bool(int(os.getenv("VLLM_ROCM_FP8_MFMA_PAGE_ATTN", "0"))),
-
+    "VLLM_ROCM_FP8_MFMA_PAGE_ATTN": lambda: bool(
+        int(os.getenv("VLLM_ROCM_FP8_MFMA_PAGE_ATTN", "0"))
+    ),
     # Whether to use pytorch symmetric memory for allreduce
-    "VLLM_ALLREDUCE_USE_SYMM_MEM":
-    lambda: bool(int(os.getenv("VLLM_ALLREDUCE_USE_SYMM_MEM", "1"))),
-
+    "VLLM_ALLREDUCE_USE_SYMM_MEM": lambda: bool(
+        int(os.getenv("VLLM_ALLREDUCE_USE_SYMM_MEM", "1"))
+    ),
     # Allows vllm to find tuned config under customized folder
-    "VLLM_TUNED_CONFIG_FOLDER":
-    lambda: os.getenv("VLLM_TUNED_CONFIG_FOLDER", None),
-
+    "VLLM_TUNED_CONFIG_FOLDER": lambda: os.getenv("VLLM_TUNED_CONFIG_FOLDER", None),
     # Allows harmony instructions to be injected on system messages
-    "VLLM_GPT_OSS_HARMONY_SYSTEM_INSTRUCTIONS":
-    lambda: bool(
-        int(os.getenv("VLLM_GPT_OSS_HARMONY_SYSTEM_INSTRUCTIONS", "0"))),
-
+    "VLLM_GPT_OSS_HARMONY_SYSTEM_INSTRUCTIONS": lambda: bool(
+        int(os.getenv("VLLM_GPT_OSS_HARMONY_SYSTEM_INSTRUCTIONS", "0"))
+    ),
     # Add optional custom scopes for profiling, disable to avoid overheads
-    "VLLM_CUSTOM_SCOPES_FOR_PROFILING":
-    lambda: bool(int(os.getenv("VLLM_CUSTOM_SCOPES_FOR_PROFILING", "0"))),
-
+    "VLLM_CUSTOM_SCOPES_FOR_PROFILING": lambda: bool(
+        int(os.getenv("VLLM_CUSTOM_SCOPES_FOR_PROFILING", "0"))
+    ),
     # Add optional nvtx scopes for profiling, disable to avoid overheads
-    "VLLM_NVTX_SCOPES_FOR_PROFILING":
-    lambda: bool(int(os.getenv("VLLM_NVTX_SCOPES_FOR_PROFILING", "0"))),
-
+    "VLLM_NVTX_SCOPES_FOR_PROFILING": lambda: bool(
+        int(os.getenv("VLLM_NVTX_SCOPES_FOR_PROFILING", "0"))
+    ),
     # Represent block hashes in KV cache events as 64-bit integers instead of
     # raw bytes. Defaults to True for backward compatibility.
-    "VLLM_KV_EVENTS_USE_INT_BLOCK_HASHES":
-    lambda: bool(int(os.getenv("VLLM_KV_EVENTS_USE_INT_BLOCK_HASHES", "1"))),
-
+    "VLLM_KV_EVENTS_USE_INT_BLOCK_HASHES": lambda: bool(
+        int(os.getenv("VLLM_KV_EVENTS_USE_INT_BLOCK_HASHES", "1"))
+    ),
     # Name of the shared memory buffer used for object storage.
     # Only effective when mm_config.mm_processor_cache_type == "shm".
-    "VLLM_OBJECT_STORAGE_SHM_BUFFER_NAME":
-    lambda: os.getenv("VLLM_OBJECT_STORAGE_SHM_BUFFER_NAME",
-                      "VLLM_OBJECT_STORAGE_SHM_BUFFER"),
-
+    "VLLM_OBJECT_STORAGE_SHM_BUFFER_NAME": lambda: os.getenv(
+        "VLLM_OBJECT_STORAGE_SHM_BUFFER_NAME", "VLLM_OBJECT_STORAGE_SHM_BUFFER"
+    ),
     # The size in MB of the buffers (NVL and RDMA) used by DeepEP
-    "VLLM_DEEPEP_BUFFER_SIZE_MB":
-    lambda: int(os.getenv("VLLM_DEEPEP_BUFFER_SIZE_MB", "1024")),
-
+    "VLLM_DEEPEP_BUFFER_SIZE_MB": lambda: int(
+        os.getenv("VLLM_DEEPEP_BUFFER_SIZE_MB", "1024")
+    ),
     # The number of SMs to allocate for communication kernels when running DBO
     # the rest of the SMs on the device will be allocated to compute
-    "VLLM_DBO_COMM_SMS":
-    lambda: int(os.getenv("VLLM_DBO_COMM_SMS", "20")),
-
+    "VLLM_DBO_COMM_SMS": lambda: int(os.getenv("VLLM_DBO_COMM_SMS", "20")),
     # Valid values are container,code_interpreter,web_search_preview
     # ex GPT_OSS_SYSTEM_TOOL_MCP_LABELS=container,code_interpreter
-    "GPT_OSS_SYSTEM_TOOL_MCP_LABELS":
-    env_list_with_choices("GPT_OSS_SYSTEM_TOOL_MCP_LABELS", [],
-                            ["container",
-                            "code_interpreter",
-                            "web_search_preview"]),
-
+    "GPT_OSS_SYSTEM_TOOL_MCP_LABELS": env_list_with_choices(
+        "GPT_OSS_SYSTEM_TOOL_MCP_LABELS",
+        [],
+        ["container", "code_interpreter", "web_search_preview"],
+    ),
     # Enable max_autotune & coordinate_descent_tuning in inductor_config
     # to compile static shapes passed from compile_sizes in compilation_config
     # If set to 1, enable max_autotune; By default, this is enabled (1)
-    "VLLM_ENABLE_INDUCTOR_MAX_AUTOTUNE":
-    lambda: bool(int(os.getenv("VLLM_ENABLE_INDUCTOR_MAX_AUTOTUNE", "1"))),
+    "VLLM_ENABLE_INDUCTOR_MAX_AUTOTUNE": lambda: bool(
+        int(os.getenv("VLLM_ENABLE_INDUCTOR_MAX_AUTOTUNE", "1"))
+    ),
     # If set to 1, enable coordinate_descent_tuning;
     # By default, this is enabled (1)
-    "VLLM_ENABLE_INDUCTOR_COORDINATE_DESCENT_TUNING":
-    lambda: bool(int(os.getenv("VLLM_ENABLE_INDUCTOR_COORDINATE_DESCENT_TUNING",
-        "1"))),
-
+    "VLLM_ENABLE_INDUCTOR_COORDINATE_DESCENT_TUNING": lambda: bool(
+        int(os.getenv("VLLM_ENABLE_INDUCTOR_COORDINATE_DESCENT_TUNING", "1"))
+    ),
     # Flag to enable NCCL symmetric memory allocation and registration
-    "VLLM_USE_NCCL_SYMM_MEM":
-    lambda: bool(int(os.getenv("VLLM_USE_NCCL_SYMM_MEM", "0"))),
-
+    "VLLM_USE_NCCL_SYMM_MEM": lambda: bool(
+        int(os.getenv("VLLM_USE_NCCL_SYMM_MEM", "0"))
+    ),
     # NCCL header path
-    "VLLM_NCCL_INCLUDE_PATH":
-    lambda: os.environ.get("VLLM_NCCL_INCLUDE_PATH", None),
+    "VLLM_NCCL_INCLUDE_PATH": lambda: os.environ.get("VLLM_NCCL_INCLUDE_PATH", None),
     # Flag to enable FBGemm kernels on model execution
     "VLLM_USE_FBGEMM": lambda: bool(int(os.getenv("VLLM_USE_FBGEMM", "0"))),
-
     # GC debug config
     # - VLLM_GC_DEBUG=0: disable GC debugger
     # - VLLM_GC_DEBUG=1: enable GC debugger with gc.collect elpased times
@@ -1524,7 +1402,8 @@ def set_vllm_use_v1(use_v1: bool):
         raise ValueError(
             "Should not call set_vllm_use_v1() if VLLM_USE_V1 is set "
             "explicitly by the user. Please raise this as a Github "
-            "Issue and explicitly set VLLM_USE_V1=0 or 1.")
+            "Issue and explicitly set VLLM_USE_V1=0 or 1."
+        )
     os.environ["VLLM_USE_V1"] = "1" if use_v1 else "0"
 
 
@@ -1598,14 +1477,12 @@ def compute_hash() -> str:
     for key in environment_variables_to_hash:
         # if this goes out of sync with environment_variables,
         # it's not a user error, it's a bug
-        assert key in environment_variables, \
+        assert key in environment_variables, (
             "Please update environment_variables_to_hash in envs.py"
+        )
 
-    factors = [
-        environment_variables[key]() for key in environment_variables_to_hash
-    ]
+    factors = [environment_variables[key]() for key in environment_variables_to_hash]
 
-    hash_str = hashlib.md5(str(factors).encode(),
-                           usedforsecurity=False).hexdigest()
+    hash_str = hashlib.md5(str(factors).encode(), usedforsecurity=False).hexdigest()
 
     return hash_str
diff --git a/vllm/executor/executor_base.py b/vllm/executor/executor_base.py
index a4e25dcfe4d7..af26918598a2 100644
--- a/vllm/executor/executor_base.py
+++ b/vllm/executor/executor_base.py
@@ -4,8 +4,9 @@
 import asyncio
 import time
 from abc import ABC, abstractmethod
+from collections.abc import Awaitable
 from functools import cached_property
-from typing import Any, Awaitable, Callable, List, Optional, Set, Union
+from typing import Any, Callable, List, Optional, Set, Union
 
 from typing_extensions import TypeVar
 
@@ -60,11 +61,13 @@ def _init_executor(self) -> None:
         raise NotImplementedError
 
     @abstractmethod
-    def collective_rpc(self,
-                       method: Union[str, Callable[[WorkerBase], _R]],
-                       timeout: Optional[float] = None,
-                       args: tuple = (),
-                       kwargs: Optional[dict[str, Any]] = None) -> list[_R]:
+    def collective_rpc(
+        self,
+        method: Union[str, Callable[[WorkerBase], _R]],
+        timeout: Optional[float] = None,
+        args: tuple = (),
+        kwargs: Optional[dict[str, Any]] = None,
+    ) -> list[_R]:
         """
         Execute an RPC call on all workers.
 
@@ -109,22 +112,29 @@ def determine_num_available_blocks(self) -> tuple[int, int]:
         return a, b
 
     def initialize_cache(self, num_gpu_blocks: int, num_cpu_blocks) -> None:
-        """Initialize the KV cache by invoking the underlying worker.
-        """
+        """Initialize the KV cache by invoking the underlying worker."""
         # NOTE: This is logged in the executor because there can be >1 workers.
-        logger.info("# %s blocks: %d, # CPU blocks: %d",
-                    vllm.platforms.current_platform.device_name,
-                    num_gpu_blocks, num_cpu_blocks)
-        max_concurrency = (num_gpu_blocks * self.cache_config.block_size /
-                           self.model_config.max_model_len)
-        logger.info("Maximum concurrency for %s tokens per request: %.2fx",
-                    self.model_config.max_model_len, max_concurrency)
+        logger.info(
+            "# %s blocks: %d, # CPU blocks: %d",
+            vllm.platforms.current_platform.device_name,
+            num_gpu_blocks,
+            num_cpu_blocks,
+        )
+        max_concurrency = (
+            num_gpu_blocks
+            * self.cache_config.block_size
+            / self.model_config.max_model_len
+        )
+        logger.info(
+            "Maximum concurrency for %s tokens per request: %.2fx",
+            self.model_config.max_model_len,
+            max_concurrency,
+        )
 
         self.cache_config.num_gpu_blocks = num_gpu_blocks
         self.cache_config.num_cpu_blocks = num_cpu_blocks
 
-        self.collective_rpc("initialize_cache",
-                            args=(num_gpu_blocks, num_cpu_blocks))
+        self.collective_rpc("initialize_cache", args=(num_gpu_blocks, num_cpu_blocks))
 
     @cached_property  # Avoid unnecessary RPC calls
     def supported_tasks(self) -> tuple[SupportedTask, ...]:
@@ -134,8 +144,7 @@ def supported_tasks(self) -> tuple[SupportedTask, ...]:
     def execute_model(
         self, execute_model_req: ExecuteModelRequest
     ) -> Optional[List[Union[SamplerOutput, PoolerOutput]]]:
-        output = self.collective_rpc("execute_model",
-                                     args=(execute_model_req, ))
+        output = self.collective_rpc("execute_model", args=(execute_model_req,))
         return output[0]
 
     def stop_remote_worker_execution_loop(self) -> None:
@@ -144,15 +153,15 @@ def stop_remote_worker_execution_loop(self) -> None:
 
     def add_lora(self, lora_request: LoRARequest) -> bool:
         assert lora_request.lora_int_id > 0, "lora_id must be greater than 0."
-        return all(self.collective_rpc("add_lora", args=(lora_request, )))
+        return all(self.collective_rpc("add_lora", args=(lora_request,)))
 
     def remove_lora(self, lora_id: int) -> bool:
         assert lora_id > 0, "lora_id must be greater than 0."
-        return all(self.collective_rpc("remove_lora", args=(lora_id, )))
+        return all(self.collective_rpc("remove_lora", args=(lora_id,)))
 
     def pin_lora(self, lora_id: int) -> bool:
         assert lora_id > 0, "lora_id must be greater than 0."
-        return all(self.collective_rpc("pin_lora", args=(lora_id, )))
+        return all(self.collective_rpc("pin_lora", args=(lora_id,)))
 
     def list_loras(self) -> Set[int]:
         sets = self.collective_rpc("list_loras")
@@ -175,8 +184,9 @@ def sleep(self, level: int = 1):
         time_after_sleep = time.perf_counter()
         self.sleeping_tags = {"weights", "kv_cache"}
         self.is_sleeping = True
-        logger.info("It took %.6f seconds to fall asleep.",
-                    time_after_sleep - time_before_sleep)
+        logger.info(
+            "It took %.6f seconds to fall asleep.", time_after_sleep - time_before_sleep
+        )
 
     def wake_up(self, tags: Optional[list[str]] = None):
         if not self.is_sleeping:
@@ -185,15 +195,18 @@ def wake_up(self, tags: Optional[list[str]] = None):
         if tags:
             for tag in tags:
                 if tag not in self.sleeping_tags:
-                    logger.warning("Tag %s is not in sleeping tags %s", tag,
-                                   self.sleeping_tags)
+                    logger.warning(
+                        "Tag %s is not in sleeping tags %s", tag, self.sleeping_tags
+                    )
                     return
         time_before_wakeup = time.perf_counter()
         self.collective_rpc("wake_up", kwargs=dict(tags=tags))
         time_after_wakeup = time.perf_counter()
-        logger.info("It took %.6f seconds to wake up tags %s.",
-                    time_after_wakeup - time_before_wakeup,
-                    tags if tags is not None else self.sleeping_tags)
+        logger.info(
+            "It took %.6f seconds to wake up tags %s.",
+            time_after_wakeup - time_before_wakeup,
+            tags if tags is not None else self.sleeping_tags,
+        )
         if tags:
             for tag in tags:
                 self.sleeping_tags.remove(tag)
@@ -208,10 +221,10 @@ def save_sharded_state(
         pattern: Optional[str] = None,
         max_size: Optional[int] = None,
     ) -> None:
-        self.collective_rpc("save_sharded_state",
-                            kwargs=dict(path=path,
-                                        pattern=pattern,
-                                        max_size=max_size))
+        self.collective_rpc(
+            "save_sharded_state",
+            kwargs=dict(path=path, pattern=pattern, max_size=max_size),
+        )
 
     @abstractmethod
     def check_health(self) -> None:
@@ -224,8 +237,8 @@ def shutdown(self) -> None:
         self.collective_rpc("shutdown")
 
     async def execute_model_async(
-            self,
-            execute_model_req: ExecuteModelRequest) -> List[SamplerOutput]:
+        self, execute_model_req: ExecuteModelRequest
+    ) -> List[SamplerOutput]:
         """Executes one model step on the given sequences."""
         output = await make_async(self.execute_model)(execute_model_req)
         return output
@@ -242,7 +255,8 @@ async def check_health_async(self) -> None:
     def init_kv_output_aggregator(self, finished_count: Optional[int]) -> None:
         """Init KVOutputAggregator"""
         self.kv_output_aggregator = KVOutputAggregator(
-            finished_count or self.parallel_config.world_size)
+            finished_count or self.parallel_config.world_size
+        )
 
 
 class DistributedExecutorBase(ExecutorBase):
@@ -263,7 +277,8 @@ def execute_model(
         if self.parallel_worker_tasks is None:
             self.parallel_worker_tasks = self._run_workers(
                 "start_worker_execution_loop",
-                async_run_tensor_parallel_workers_only=True)
+                async_run_tensor_parallel_workers_only=True,
+            )
 
         # Only the driver worker returns the sampling results.
         driver_outputs = self._driver_execute_model(execute_model_req)
@@ -293,11 +308,13 @@ def _driver_execute_model(
         """
         raise NotImplementedError
 
-    def collective_rpc(self,
-                       method: Union[str, Callable],
-                       timeout: Optional[float] = None,
-                       args: tuple = (),
-                       kwargs: Optional[dict[str, Any]] = None) -> list[Any]:
+    def collective_rpc(
+        self,
+        method: Union[str, Callable],
+        timeout: Optional[float] = None,
+        args: tuple = (),
+        kwargs: Optional[dict[str, Any]] = None,
+    ) -> list[Any]:
         return self._run_workers(method, *args, **(kwargs or {}))
 
     @abstractmethod
@@ -328,12 +345,13 @@ def _wait_for_tasks_completion(self, parallel_worker_tasks: Any) -> None:
         raise NotImplementedError
 
     async def execute_model_async(
-            self,
-            execute_model_req: ExecuteModelRequest) -> List[SamplerOutput]:
+        self, execute_model_req: ExecuteModelRequest
+    ) -> List[SamplerOutput]:
         if self.parallel_worker_tasks is None:
             # Start model execution loop running in the parallel workers
             self.parallel_worker_tasks = asyncio.create_task(
-                self._start_worker_execution_loop())
+                self._start_worker_execution_loop()
+            )
 
         # Only the driver worker returns the sampling results.
         return await self._driver_execute_model_async(execute_model_req)
diff --git a/vllm/executor/msgspec_utils.py b/vllm/executor/msgspec_utils.py
index 4ce6d8dfad2c..9ca190cd3cdc 100644
--- a/vllm/executor/msgspec_utils.py
+++ b/vllm/executor/msgspec_utils.py
@@ -16,7 +16,8 @@ def encode_hook(obj: Any) -> Any:
     if isinstance(obj, array):
         assert obj.typecode == VLLM_TOKEN_ID_ARRAY_TYPE, (
             f"vLLM array type should use '{VLLM_TOKEN_ID_ARRAY_TYPE}' type. "
-            f"Given array has a type code of {obj.typecode}.")
+            f"Given array has a type code of {obj.typecode}."
+        )
         return obj.tobytes()
     if isinstance(obj, MultiModalKwargs):
         return dict(obj)
diff --git a/vllm/executor/ray_distributed_executor.py b/vllm/executor/ray_distributed_executor.py
index 84747575b496..c4783edda700 100644
--- a/vllm/executor/ray_distributed_executor.py
+++ b/vllm/executor/ray_distributed_executor.py
@@ -11,17 +11,20 @@
 import msgspec
 
 import vllm.envs as envs
-from vllm.executor.executor_base import (
-    DistributedExecutorBase)  # yapf: disable
+from vllm.executor.executor_base import DistributedExecutorBase  # yapf: disable
 from vllm.executor.msgspec_utils import encode_hook
-from vllm.executor.ray_utils import (RayWorkerWrapper, initialize_ray_cluster,
-                                     ray)
+from vllm.executor.ray_utils import RayWorkerWrapper, initialize_ray_cluster, ray
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 from vllm.ray.ray_env import get_env_vars_to_copy
 from vllm.sequence import ExecuteModelRequest
-from vllm.utils import (_run_task_with_lock, get_distributed_init_method,
-                        get_ip, get_open_port, make_async)
+from vllm.utils import (
+    _run_task_with_lock,
+    get_distributed_init_method,
+    get_ip,
+    get_open_port,
+    make_async,
+)
 from vllm.v1.outputs import SamplerOutput
 
 if ray is not None:
@@ -43,6 +46,7 @@ class RayWorkerMetaData:
     The order of ray worker creation can be random,
     and we need to reset the rank after creating all workers.
     """
+
     worker: ActorHandle
     created_rank: int
     adjusted_rank: int = -1
@@ -55,7 +59,10 @@ class RayDistributedExecutor(DistributedExecutorBase):
     # These env vars are worker-specific, therefore are NOT copied
     # from the driver to the workers
     WORKER_SPECIFIC_ENV_VARS = {
-        "VLLM_HOST_IP", "VLLM_HOST_PORT", "LOCAL_RANK", "CUDA_VISIBLE_DEVICES"
+        "VLLM_HOST_IP",
+        "VLLM_HOST_PORT",
+        "LOCAL_RANK",
+        "CUDA_VISIBLE_DEVICES",
     }
 
     # These non-vLLM env vars are copied from the driver to workers
@@ -86,13 +93,13 @@ def _init_executor(self) -> None:
         self.use_ray_spmd_worker = envs.VLLM_USE_RAY_SPMD_WORKER
         if self.use_ray_compiled_dag:
             assert self.use_ray_spmd_worker, (
-                "VLLM_USE_RAY_COMPILED_DAG=1 requires "
-                "VLLM_USE_RAY_SPMD_WORKER=1")
+                "VLLM_USE_RAY_COMPILED_DAG=1 requires VLLM_USE_RAY_SPMD_WORKER=1"
+            )
         if self.use_ray_spmd_worker:
             # TODO: Support SPMD worker for non-DAG Ray executor.
             assert self.use_ray_compiled_dag, (
-                "VLLM_USE_RAY_SPMD_WORKER=1 requires "
-                "VLLM_USE_RAY_COMPILED_DAG=1")
+                "VLLM_USE_RAY_SPMD_WORKER=1 requires VLLM_USE_RAY_COMPILED_DAG=1"
+            )
 
         assert self.uses_ray
         initialize_ray_cluster(self.parallel_config)
@@ -107,14 +114,12 @@ def _init_executor(self) -> None:
         self._init_workers_ray(placement_group)
 
         self.input_encoder = msgspec.msgpack.Encoder(enc_hook=encode_hook)
-        self.output_decoder = msgspec.msgpack.Decoder(
-            Optional[List[SamplerOutput]])
+        self.output_decoder = msgspec.msgpack.Decoder(Optional[List[SamplerOutput]])
         self.use_v1 = envs.VLLM_USE_V1
 
         self.pp_locks: Optional[List[asyncio.Lock]] = None
         if not self.use_ray_compiled_dag:
-            self.driver_exec_method = make_async(
-                self.driver_worker.execute_method)
+            self.driver_exec_method = make_async(self.driver_worker.execute_method)
 
     def shutdown(self) -> None:
         if logger:
@@ -122,26 +127,29 @@ def shutdown(self) -> None:
             logger.info(
                 "Shutting down Ray distributed executor. If you see error log "
                 "from logging.cc regarding SIGTERM received, please ignore "
-                "because this is the expected termination process in Ray.")
+                "because this is the expected termination process in Ray."
+            )
         if hasattr(self, "forward_dag") and self.forward_dag is not None:
             self.forward_dag.teardown()
             import ray
+
             for worker in self.workers:
                 ray.kill(worker)
             self.forward_dag = None
 
-    def _configure_ray_workers_use_nsight(self,
-                                          ray_remote_kwargs) -> Dict[str, Any]:
+    def _configure_ray_workers_use_nsight(self, ray_remote_kwargs) -> Dict[str, Any]:
         # If nsight profiling is enabled, we need to set the profiling
         # configuration for the ray workers as runtime env.
         runtime_env = ray_remote_kwargs.setdefault("runtime_env", {})
-        runtime_env.update({
-            "nsight": {
-                "t": "cuda,cudnn,cublas",
-                "o": "'worker_process_%p'",
-                "cuda-graph-trace": "node",
+        runtime_env.update(
+            {
+                "nsight": {
+                    "t": "cuda,cudnn,cublas",
+                    "o": "'worker_process_%p'",
+                    "cuda-graph-trace": "node",
+                }
             }
-        })
+        )
 
         return ray_remote_kwargs
 
@@ -149,8 +157,7 @@ def _configure_ray_workers_use_nsight(self,
     def _get_env_vars_to_be_updated(self):
         return self._env_vars_for_all_workers
 
-    def _init_workers_ray(self, placement_group: "PlacementGroup",
-                          **ray_remote_kwargs):
+    def _init_workers_ray(self, placement_group: "PlacementGroup", **ray_remote_kwargs):
         num_gpus = envs.VLLM_RAY_PER_WORKER_GPUS
 
         # The driver dummy worker does not actually use any resources.
@@ -166,7 +173,8 @@ def _init_workers_ray(self, placement_group: "PlacementGroup",
 
         if self.parallel_config.ray_workers_use_nsight:
             ray_remote_kwargs = self._configure_ray_workers_use_nsight(
-                ray_remote_kwargs)
+                ray_remote_kwargs
+            )
 
         logger.info("use_ray_spmd_worker: %s", self.use_ray_spmd_worker)
 
@@ -174,22 +182,23 @@ def _init_workers_ray(self, placement_group: "PlacementGroup",
         bundle_indices: List[int]
         if envs.VLLM_RAY_BUNDLE_INDICES:
             # Use the bundle indices specified by the user.
-            bundle_indices = list(
-                map(int, envs.VLLM_RAY_BUNDLE_INDICES.split(",")))
-            assert len(bundle_indices) == self.parallel_config.world_size, \
-            ("VLLM_RAY_BUNDLE_INDICES must have the same size"
-            f" as the world size, but got {bundle_indices=} "
-            f"and {self.parallel_config.world_size=}")
-            assert len(set(bundle_indices)) == len(bundle_indices), \
-            ("VLLM_RAY_BUNDLE_INDICES cannot have duplicate values,"
-            f" but got {bundle_indices=}")
+            bundle_indices = list(map(int, envs.VLLM_RAY_BUNDLE_INDICES.split(",")))
+            assert len(bundle_indices) == self.parallel_config.world_size, (
+                "VLLM_RAY_BUNDLE_INDICES must have the same size"
+                f" as the world size, but got {bundle_indices=} "
+                f"and {self.parallel_config.world_size=}"
+            )
+            assert len(set(bundle_indices)) == len(bundle_indices), (
+                "VLLM_RAY_BUNDLE_INDICES cannot have duplicate values,"
+                f" but got {bundle_indices=}"
+            )
         else:
             # use the first N bundles that have GPU resources.
             bundle_indices = []
             for bundle_id, bundle in enumerate(placement_group.bundle_specs):
                 if bundle.get(current_platform.ray_device_key, 0):
                     bundle_indices.append(bundle_id)
-            bundle_indices = bundle_indices[:self.parallel_config.world_size]
+            bundle_indices = bundle_indices[: self.parallel_config.world_size]
 
         worker_metadata: List[RayWorkerMetaData] = []
         driver_ip = get_ip()
@@ -207,8 +216,7 @@ def _init_workers_ray(self, placement_group: "PlacementGroup",
                     num_gpus=num_gpus,
                     scheduling_strategy=scheduling_strategy,
                     **ray_remote_kwargs,
-                )(RayWorkerWrapper).remote(vllm_config=self.vllm_config,
-                                           rpc_rank=rank)
+                )(RayWorkerWrapper).remote(vllm_config=self.vllm_config, rpc_rank=rank)
             else:
                 worker = ray.remote(
                     num_cpus=0,
@@ -216,15 +224,15 @@ def _init_workers_ray(self, placement_group: "PlacementGroup",
                     resources={current_platform.ray_device_key: num_gpus},
                     scheduling_strategy=scheduling_strategy,
                     **ray_remote_kwargs,
-                )(RayWorkerWrapper).remote(vllm_config=self.vllm_config,
-                                           rpc_rank=rank)
-            worker_metadata.append(
-                RayWorkerMetaData(worker=worker, created_rank=rank))
+                )(RayWorkerWrapper).remote(vllm_config=self.vllm_config, rpc_rank=rank)
+            worker_metadata.append(RayWorkerMetaData(worker=worker, created_rank=rank))
 
-        worker_ips = ray.get([
-            each.worker.get_node_ip.remote()  # type: ignore[attr-defined]
-            for each in worker_metadata
-        ])
+        worker_ips = ray.get(
+            [
+                each.worker.get_node_ip.remote()  # type: ignore[attr-defined]
+                for each in worker_metadata
+            ]
+        )
 
         for each, ip in zip(worker_metadata, worker_ips):
             each.ip = ip
@@ -239,7 +247,8 @@ def _init_workers_ray(self, placement_group: "PlacementGroup",
                     # as the resource holder for the driver process.
                     self.driver_dummy_worker = worker
                     self.driver_worker = RayWorkerWrapper(
-                        vllm_config=self.vllm_config, rpc_rank=0)
+                        vllm_config=self.vllm_config, rpc_rank=0
+                    )
                     worker_metadata.pop(i)
                     break
 
@@ -250,7 +259,8 @@ def _init_workers_ray(self, placement_group: "PlacementGroup",
                 "Ray does not allocate any GPUs on the driver node."
                 f"Driver IP: {driver_ip}, worker IPs: {worker_ips}."
                 "Consider adjusting the Ray placement group or running "
-                "the driver on a GPU node.")
+                "the driver on a GPU node."
+            )
 
         ip_counts: Dict[str, int] = {}
         for ip in worker_ips:
@@ -272,15 +282,15 @@ def sort_by_driver_then_worker_ip(item: RayWorkerMetaData):
         # After sorting, the workers on the same node will be
         # close to each other, and the workers on the driver
         # node will be placed first.
-        sorted_worker_metadata = sorted(worker_metadata,
-                                        key=sort_by_driver_then_worker_ip)
+        sorted_worker_metadata = sorted(
+            worker_metadata, key=sort_by_driver_then_worker_ip
+        )
         start_rank = 0 if self.use_ray_spmd_worker else 1
         for i, item in enumerate(sorted_worker_metadata):
             item.adjusted_rank = i + start_rank
         self.workers = [item.worker for item in sorted_worker_metadata]
         rerank_mapping = {
-            item.created_rank: item.adjusted_rank
-            for item in sorted_worker_metadata
+            item.created_rank: item.adjusted_rank for item in sorted_worker_metadata
         }
         self._run_workers("adjust_rank", rerank_mapping)
 
@@ -291,8 +301,8 @@ def sort_by_driver_then_worker_ip(item: RayWorkerMetaData):
                 # driver_dummy_worker can be None when using ray spmd worker.
                 continue
             worker_node_and_gpu_ids.append(
-                ray.get(worker.get_node_and_gpu_ids.remote()) \
-            ) # type: ignore
+                ray.get(worker.get_node_and_gpu_ids.remote())
+            )  # type: ignore
 
         node_workers = defaultdict(list)  # node id -> list of worker ranks
         node_gpus = defaultdict(list)  # node id -> list of gpu ids
@@ -320,20 +330,27 @@ def sort_by_driver_then_worker_ip(item: RayWorkerMetaData):
                 f"{n_ips} unique IP addresses {all_ips}. Please check your"
                 " network configuration. If you set `VLLM_HOST_IP`"
                 " environment variable, make sure it is unique for"
-                " each node.")
+                " each node."
+            )
 
         # Set environment variables for the driver and workers.
-        all_args_to_update_environment_variables = [{
-            current_platform.device_control_env_var:
-            ",".join(map(str, node_gpus[node_id])),
-        } for (node_id, _) in worker_node_and_gpu_ids]
+        all_args_to_update_environment_variables = [
+            {
+                current_platform.device_control_env_var: ",".join(
+                    map(str, node_gpus[node_id])
+                ),
+            }
+            for (node_id, _) in worker_node_and_gpu_ids
+        ]
 
         # Environment variables to copy from driver to workers
         env_vars_to_copy = get_env_vars_to_copy(
             exclude_vars=self.WORKER_SPECIFIC_ENV_VARS,
             additional_vars=set(current_platform.additional_env_vars).union(
-                self.ADDITIONAL_ENV_VARS),
-            destination="workers")
+                self.ADDITIONAL_ENV_VARS
+            ),
+            destination="workers",
+        )
 
         # Copy existing env vars to each worker's args
         for args in all_args_to_update_environment_variables:
@@ -342,11 +359,11 @@ def sort_by_driver_then_worker_ip(item: RayWorkerMetaData):
                 if name in os.environ:
                     args[name] = os.environ[name]
 
-        self._env_vars_for_all_workers = (
-            all_args_to_update_environment_variables)
+        self._env_vars_for_all_workers = all_args_to_update_environment_variables
 
-        self._run_workers("update_environment_variables",
-                          self._get_env_vars_to_be_updated())
+        self._run_workers(
+            "update_environment_variables", self._get_env_vars_to_be_updated()
+        )
 
         if len(node_gpus) == 1:
             # in single node case, we don't need to get the IP address.
@@ -359,7 +376,8 @@ def sort_by_driver_then_worker_ip(item: RayWorkerMetaData):
             # the node.
             driver_ip = "127.0.0.1"
         distributed_init_method = get_distributed_init_method(
-            driver_ip, get_open_port())
+            driver_ip, get_open_port()
+        )
 
         # Initialize the actual workers inside worker wrapper.
         all_kwargs = []
@@ -377,19 +395,20 @@ def sort_by_driver_then_worker_ip(item: RayWorkerMetaData):
         self._run_workers("init_worker", all_kwargs)
 
         self._run_workers("init_device")
-        self._run_workers("load_model",
-                          max_concurrent_workers=self.parallel_config.
-                          max_parallel_loading_workers)
+        self._run_workers(
+            "load_model",
+            max_concurrent_workers=self.parallel_config.max_parallel_loading_workers,
+        )
 
         if self.use_ray_spmd_worker:
             for pp_rank in range(self.parallel_config.pipeline_parallel_size):
                 self.pp_tp_workers.append([])
-                for tp_rank in range(
-                        self.parallel_config.tensor_parallel_size):
+                for tp_rank in range(self.parallel_config.tensor_parallel_size):
                     # PP=2, TP=4
                     # pp_tp_workers = [[0, 1, 2, 3], [4, 5, 6, 7]]
-                    rank = (pp_rank * self.parallel_config.tensor_parallel_size
-                            ) + tp_rank
+                    rank = (
+                        pp_rank * self.parallel_config.tensor_parallel_size
+                    ) + tp_rank
                     assert len(self.pp_tp_workers[pp_rank]) == tp_rank
                     assert pp_rank < len(self.pp_tp_workers)
                     self.pp_tp_workers[pp_rank].append(self.workers[rank])
@@ -421,13 +440,13 @@ def _driver_execute_model(
         loop running in each of the remote workers.
         """
         assert not self.use_ray_spmd_worker, (
-            "driver_worker does not exist for VLLM_USE_RAY_SPMD_WORKER=1")
-        return self.driver_worker.execute_method("execute_model",
-                                                 execute_model_req)
+            "driver_worker does not exist for VLLM_USE_RAY_SPMD_WORKER=1"
+        )
+        return self.driver_worker.execute_method("execute_model", execute_model_req)
 
     def execute_model(
-            self,
-            execute_model_req: ExecuteModelRequest) -> List[SamplerOutput]:
+        self, execute_model_req: ExecuteModelRequest
+    ) -> List[SamplerOutput]:
         if not self.use_ray_spmd_worker:
             return super().execute_model(execute_model_req)
 
@@ -470,12 +489,11 @@ def _run_workers(
         del method
         if self.use_ray_spmd_worker:
             assert not async_run_tensor_parallel_workers_only, (
-                "async_run_tensor_parallel_workers_only is not supported for "
-                "spmd mode.")
+                "async_run_tensor_parallel_workers_only is not supported for spmd mode."
+            )
 
         if max_concurrent_workers:
-            raise NotImplementedError(
-                "max_concurrent_workers is not supported yet.")
+            raise NotImplementedError("max_concurrent_workers is not supported yet.")
 
         # Start the ray workers first.
         ray_workers = self.workers
@@ -519,23 +537,27 @@ def _check_ray_cgraph_installation(self):
         required_version = version.parse("2.43.0")
         current_version = version.parse(importlib.metadata.version("ray"))
         if current_version < required_version:
-            raise ValueError(f"Ray version {required_version} is "
-                             f"required, but found {current_version}")
+            raise ValueError(
+                f"Ray version {required_version} is "
+                f"required, but found {current_version}"
+            )
 
         import importlib.util
-        cgraph_spec = importlib.util.find_spec(
-            "ray.experimental.compiled_dag_ref")
+
+        cgraph_spec = importlib.util.find_spec("ray.experimental.compiled_dag_ref")
         if cgraph_spec is None:
-            raise ValueError("Ray Compiled Graph is not installed. "
-                             "Run `pip install ray[cgraph]` to install it.")
+            raise ValueError(
+                "Ray Compiled Graph is not installed. "
+                "Run `pip install ray[cgraph]` to install it."
+            )
 
         cupy_spec = importlib.util.find_spec("cupy")
-        if (cupy_spec is None
-                and envs.VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE == "nccl"):
+        if cupy_spec is None and envs.VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE == "nccl":
             raise ValueError(
                 "cupy is not installed but required since "
                 "VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE is set to 'nccl'. "
-                "Run `pip install ray[cgraph]` and check cupy installation.")
+                "Run `pip install ray[cgraph]` and check cupy installation."
+            )
 
     def _compiled_ray_dag(self, enable_asyncio: bool):
         assert self.parallel_config.use_ray
@@ -549,18 +571,25 @@ def _compiled_ray_dag(self, enable_asyncio: bool):
         # ray.dag, otherwise it will not take effect.
         os.environ.setdefault("RAY_CGRAPH_get_timeout", "300")  # noqa: SIM112
         from ray.dag import InputNode, MultiOutputNode
-        logger.info("RAY_CGRAPH_get_timeout is set to %s",
-                    os.environ["RAY_CGRAPH_get_timeout"])  # noqa: SIM112
-        logger.info("VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE = %s",
-                    envs.VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE)
-        logger.info("VLLM_USE_RAY_COMPILED_DAG_OVERLAP_COMM = %s",
-                    envs.VLLM_USE_RAY_COMPILED_DAG_OVERLAP_COMM)
+
+        logger.info(
+            "RAY_CGRAPH_get_timeout is set to %s", os.environ["RAY_CGRAPH_get_timeout"]
+        )  # noqa: SIM112
+        logger.info(
+            "VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE = %s",
+            envs.VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE,
+        )
+        logger.info(
+            "VLLM_USE_RAY_COMPILED_DAG_OVERLAP_COMM = %s",
+            envs.VLLM_USE_RAY_COMPILED_DAG_OVERLAP_COMM,
+        )
 
         channel_type = envs.VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE
         if channel_type not in ("auto", "nccl", "shm"):
             raise ValueError(
                 "Invalid value for VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE: "
-                f"{channel_type}. Valid values are: 'auto', 'nccl', or 'shm'.")
+                f"{channel_type}. Valid values are: 'auto', 'nccl', or 'shm'."
+            )
 
         with InputNode() as input_data:
             # Example DAG: PP=2, TP=4
@@ -585,20 +614,24 @@ def _compiled_ray_dag(self, enable_asyncio: bool):
                 # and the TP group executes in SPMD fashion.
                 if self.use_v1:
                     outputs = [
-                        worker.execute_model_ray.
-                        bind(  # type: ignore[attr-defined]
-                            outputs[i]) for i, worker in enumerate(tp_group)
+                        worker.execute_model_ray.bind(  # type: ignore[attr-defined]
+                            outputs[i]
+                        )
+                        for i, worker in enumerate(tp_group)
                     ]
                 else:
                     outputs = [
-                        worker.execute_model_spmd.
-                        bind(  # type: ignore[attr-defined]
-                            outputs[i]) for i, worker in enumerate(tp_group)
+                        worker.execute_model_spmd.bind(  # type: ignore[attr-defined]
+                            outputs[i]
+                        )
+                        for i, worker in enumerate(tp_group)
                     ]
 
                 last_pp_rank = len(self.pp_tp_workers) - 1
-                if (pp_rank < last_pp_rank and
-                        envs.VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE != "shm"):
+                if (
+                    pp_rank < last_pp_rank
+                    and envs.VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE != "shm"
+                ):
                     # Specify how intermediate tensors should be passed
                     # between pp stages, no need to specify for the last
                     # pp stage or when using shared memory (the default).
@@ -612,30 +645,37 @@ def _compiled_ray_dag(self, enable_asyncio: bool):
 
         if envs.VLLM_USE_RAY_WRAPPED_PP_COMM:
             from ray.experimental.channel.accelerator_context import (
-                register_accelerator_context)
+                register_accelerator_context,
+            )
 
             from vllm.distributed.device_communicators.ray_communicator import (
-                RayPPCommunicator)
-            register_accelerator_context(torch_module_name="cuda",
-                                         communicator_cls=RayPPCommunicator)
-            logger.info("Using RayPPCommunicator "
-                        "(which wraps vLLM _PP GroupCoordinator) "
-                        "for Ray Compiled Graph communication.")
+                RayPPCommunicator,
+            )
+
+            register_accelerator_context(
+                torch_module_name="cuda", communicator_cls=RayPPCommunicator
+            )
+            logger.info(
+                "Using RayPPCommunicator "
+                "(which wraps vLLM _PP GroupCoordinator) "
+                "for Ray Compiled Graph communication."
+            )
         else:
-            logger.info("Using Ray's NCCL communicator for "
-                        "Ray Compiled Graph communication.")
+            logger.info(
+                "Using Ray's NCCL communicator for Ray Compiled Graph communication."
+            )
 
         return forward_dag.experimental_compile(
             enable_asyncio=enable_asyncio,
-            _overlap_gpu_communication=envs.
-            VLLM_USE_RAY_COMPILED_DAG_OVERLAP_COMM)
+            _overlap_gpu_communication=envs.VLLM_USE_RAY_COMPILED_DAG_OVERLAP_COMM,
+        )
 
     def __del__(self):
         self.shutdown()
 
     async def execute_model_async(
-            self,
-            execute_model_req: ExecuteModelRequest) -> List[SamplerOutput]:
+        self, execute_model_req: ExecuteModelRequest
+    ) -> List[SamplerOutput]:
         if not self.use_ray_spmd_worker:
             return await super().execute_model_async(execute_model_req)
 
@@ -648,14 +688,13 @@ async def execute_model_async(
         return self.output_decoder.decode(output)
 
     async def _driver_execute_model_async(
-        self,
-        execute_model_req: Optional[ExecuteModelRequest] = None
+        self, execute_model_req: Optional[ExecuteModelRequest] = None
     ) -> List[SamplerOutput]:
         assert not self.use_ray_spmd_worker, (
-            "driver_worker does not exist for VLLM_USE_RAY_SPMD_WORKER=1")
+            "driver_worker does not exist for VLLM_USE_RAY_SPMD_WORKER=1"
+        )
         if not self.tp_driver_workers:
-            return await self.driver_exec_method("execute_model",
-                                                 execute_model_req)
+            return await self.driver_exec_method("execute_model", execute_model_req)
         if self.pp_locks is None:
             # This locks each pipeline parallel stage so multiple virtual
             # engines can't execute on the same stage at the same time
@@ -668,16 +707,25 @@ async def _driver_execute_model_async(
 
         tasks = [
             asyncio.create_task(
-                _run_task_with_lock(self.driver_exec_method, self.pp_locks[0],
-                                    "execute_model", execute_model_req))
+                _run_task_with_lock(
+                    self.driver_exec_method,
+                    self.pp_locks[0],
+                    "execute_model",
+                    execute_model_req,
+                )
+            )
         ]
-        for pp_rank, driver_worker in enumerate(self.tp_driver_workers,
-                                                start=1):
+        for pp_rank, driver_worker in enumerate(self.tp_driver_workers, start=1):
             tasks.append(
                 asyncio.create_task(
-                    _run_task_with_lock(driver_worker.execute_method.remote,
-                                        self.pp_locks[pp_rank],
-                                        "execute_model", execute_model_req)))
+                    _run_task_with_lock(
+                        driver_worker.execute_method.remote,
+                        self.pp_locks[pp_rank],
+                        "execute_model",
+                        execute_model_req,
+                    )
+                )
+            )
 
         results = await asyncio.gather(*tasks)
 
@@ -686,7 +734,8 @@ async def _driver_execute_model_async(
 
     async def _start_worker_execution_loop(self):
         assert not self.use_ray_spmd_worker, (
-            "worker loop is disabled for VLLM_USE_RAY_SPMD_WORKER=1")
+            "worker loop is disabled for VLLM_USE_RAY_SPMD_WORKER=1"
+        )
         coros = [
             worker.execute_method.remote("start_worker_execution_loop")
             for worker in self.non_driver_workers
diff --git a/vllm/executor/ray_utils.py b/vllm/executor/ray_utils.py
index 5b76334722e9..abe3d2be9f6d 100644
--- a/vllm/executor/ray_utils.py
+++ b/vllm/executor/ray_utils.py
@@ -30,11 +30,13 @@
     import ray
     from ray.util import placement_group_table
     from ray.util.placement_group import PlacementGroup
+
     try:
         from ray._private.state import available_resources_per_node
     except ImportError:
         # Ray 2.9.x doesn't expose `available_resources_per_node`
         from ray._private.state import state as _state
+
         available_resources_per_node = _state._available_resources_per_node
 
     class RayWorkerWrapper(WorkerWrapperBase):
@@ -49,8 +51,9 @@ def __init__(self, *args, **kwargs) -> None:
             # that thread.
             self.compiled_dag_cuda_device_set = False
 
-            self.input_decoder = msgspec.msgpack.Decoder(ExecuteModelRequest,
-                                                         dec_hook=decode_hook)
+            self.input_decoder = msgspec.msgpack.Decoder(
+                ExecuteModelRequest, dec_hook=decode_hook
+            )
             self.output_encoder = msgspec.msgpack.Encoder(enc_hook=encode_hook)
 
         def get_node_ip(self) -> str:
@@ -60,16 +63,16 @@ def get_node_and_gpu_ids(self) -> Tuple[str, List[int]]:
             node_id = ray.get_runtime_context().get_node_id()
             device_key = vllm.platforms.current_platform.ray_device_key
             if not device_key:
-                raise RuntimeError("current platform %s does not support ray.",
-                                   vllm.platforms.current_platform.device_name)
-            gpu_ids = ray.get_runtime_context().get_accelerator_ids(
-            )[device_key]
+                raise RuntimeError(
+                    "current platform %s does not support ray.",
+                    vllm.platforms.current_platform.device_name,
+                )
+            gpu_ids = ray.get_runtime_context().get_accelerator_ids()[device_key]
             return node_id, gpu_ids
 
         def execute_model_spmd(
-            self, req_or_tuple: Union[bytes,
-                                      Tuple[bytes,
-                                            Optional[IntermediateTensors]]]
+            self,
+            req_or_tuple: Union[bytes, Tuple[bytes, Optional[IntermediateTensors]]],
         ) -> bytes:
             """Execute model in SPMD fashion: used only when SPMD worker and
             compiled DAG are both enabled.
@@ -94,8 +97,9 @@ def execute_model_spmd(
                 current_platform.set_device(self.worker.device)
                 self.compiled_dag_cuda_device_set = True
 
-            output = self.worker._execute_model_spmd(execute_model_req,
-                                                     intermediate_tensors)
+            output = self.worker._execute_model_spmd(
+                execute_model_req, intermediate_tensors
+            )
             # Pipeline model request and output to the next pipeline stage.
             if isinstance(output, IntermediateTensors):
                 output = serialized_req, output
@@ -121,11 +125,12 @@ def setup_device_if_necessary(self):
 
         def execute_model_ray(
             self,
-            scheduler_output: Union["SchedulerOutput",
-                                    Tuple["SchedulerOutput",
-                                          "IntermediateTensors"]],
-        ) -> Union["ModelRunnerOutput", Tuple["SchedulerOutput",
-                                              "IntermediateTensors"]]:
+            scheduler_output: Union[
+                "SchedulerOutput", Tuple["SchedulerOutput", "IntermediateTensors"]
+            ],
+        ) -> Union[
+            "ModelRunnerOutput", Tuple["SchedulerOutput", "IntermediateTensors"]
+        ]:
             # This method is used by Ray Compiled Graph to execute the model,
             # and it needs a special logic of self.setup_device_if_necessary()
             self.setup_device_if_necessary()
@@ -135,7 +140,8 @@ def execute_model_ray(
             else:
                 scheduler_output, intermediate_tensors = scheduler_output, None
             output = self.worker.model_runner.execute_model(
-                scheduler_output, intermediate_tensors)
+                scheduler_output, intermediate_tensors
+            )
             if isinstance(output, IntermediateTensors):
                 output = scheduler_output, output
             elif not get_pp_group().is_last_rank:
@@ -171,12 +177,15 @@ def ray_is_available() -> bool:
 def assert_ray_available():
     """Raise an exception if Ray is not available."""
     if ray is None:
-        raise ValueError(f"Failed to import Ray: {ray_import_err}."
-                         "Please install Ray with `pip install ray`.")
+        raise ValueError(
+            f"Failed to import Ray: {ray_import_err}."
+            "Please install Ray with `pip install ray`."
+        )
 
 
-def _verify_bundles(placement_group: "PlacementGroup",
-                    parallel_config: ParallelConfig, device_str: str):
+def _verify_bundles(
+    placement_group: "PlacementGroup", parallel_config: ParallelConfig, device_str: str
+):
     """Verify a given placement group has bundles located in the right place.
 
     There are 2 rules.
@@ -184,7 +193,8 @@ def _verify_bundles(placement_group: "PlacementGroup",
     - Fail if driver node is not included in a placement group.
     """
     assert ray.is_initialized(), (
-        "Ray is not initialized although distributed-executor-backend is ray.")
+        "Ray is not initialized although distributed-executor-backend is ray."
+    )
     pg_data = placement_group_table(placement_group)
     # bundle_idx -> node_id
     bundle_to_node_ids = pg_data["bundles_to_node_id"]
@@ -217,8 +227,13 @@ def _verify_bundles(placement_group: "PlacementGroup",
                 "unless you have fast interconnect across nodes, like "
                 "Infiniband. To resolve this issue, make sure you have more "
                 "than %d GPUs available at each node.",
-                parallel_config.tensor_parallel_size, device_str, len(bundles),
-                device_str, node_id, parallel_config.tensor_parallel_size)
+                parallel_config.tensor_parallel_size,
+                device_str,
+                len(bundles),
+                device_str,
+                node_id,
+                parallel_config.tensor_parallel_size,
+            )
 
 
 def _wait_until_pg_ready(current_placement_group: "PlacementGroup"):
@@ -250,7 +265,9 @@ def _wait_until_pg_ready(current_placement_group: "PlacementGroup"):
             " and make sure the IP addresses used by ray cluster"
             " are the same as VLLM_HOST_IP environment variable"
             " specified in each node if you are running on a multi-node.",
-            int(time.time() - s), placement_group_specs)
+            int(time.time() - s),
+            placement_group_specs,
+        )
 
     try:
         ray.get(pg_ready_ref, timeout=0)
@@ -259,7 +276,8 @@ def _wait_until_pg_ready(current_placement_group: "PlacementGroup"):
             "Cannot provide a placement group of "
             f"{placement_group_specs=} within {PG_WAIT_TIMEOUT} seconds. See "
             "`ray status` and `ray list nodes` to make sure the cluster has "
-            "enough resources.") from None
+            "enough resources."
+        ) from None
 
 
 def _wait_until_pg_removed(current_placement_group: "PlacementGroup"):
@@ -274,8 +292,9 @@ def _wait_until_pg_removed(current_placement_group: "PlacementGroup"):
         # Exponential backoff for warning print.
         wait_interval *= 2
         logger.info(
-            "Waiting for removing a placement group of specs for "
-            "%d seconds.", int(time.time() - s))
+            "Waiting for removing a placement group of specs for %d seconds.",
+            int(time.time() - s),
+        )
         time.sleep(wait_interval)
 
 
@@ -306,19 +325,21 @@ def initialize_ray_cluster(
         except ConnectionError:
             logger.warning(
                 "No existing RAY instance detected. "
-                "A new instance will be launched with current node resources.")
-            ray.init(address=ray_address,
-                     num_gpus=parallel_config.world_size,
-                     runtime_env=parallel_config.ray_runtime_env)
+                "A new instance will be launched with current node resources."
+            )
+            ray.init(
+                address=ray_address,
+                num_gpus=parallel_config.world_size,
+                runtime_env=parallel_config.ray_runtime_env,
+            )
     else:
-        ray.init(address=ray_address,
-                 runtime_env=parallel_config.ray_runtime_env)
+        ray.init(address=ray_address, runtime_env=parallel_config.ray_runtime_env)
 
     device_str = current_platform.ray_device_key
     if not device_str:
         raise ValueError(
-            f"current platform {current_platform.device_name} does not "
-            "support ray.")
+            f"current platform {current_platform.device_name} does not support ray."
+        )
 
     # Create or get the placement group for worker processes
     if parallel_config.placement_group:
@@ -337,8 +358,8 @@ def initialize_ray_cluster(
             bundle_devices = bundle.get(device_str, 0)
             if bundle_devices > 1:
                 raise ValueError(
-                    "Placement group bundle cannot have more than 1 "
-                    f"{device_str}.")
+                    f"Placement group bundle cannot have more than 1 {device_str}."
+                )
             if bundle_devices:
                 device_bundles += 1
         if parallel_config.world_size > device_bundles:
@@ -346,10 +367,10 @@ def initialize_ray_cluster(
                 f"The number of required {device_str}s exceeds the total "
                 f"number of available {device_str}s in the placement group. "
                 f"Required number of devices: {parallel_config.world_size}. "
-                f"Total number of devices: {device_bundles}.")
+                f"Total number of devices: {device_bundles}."
+            )
     else:
-        logger.info("No current placement group found. "
-                    "Creating a new placement group.")
+        logger.info("No current placement group found. Creating a new placement group.")
         num_devices_in_cluster = ray.cluster_resources().get(device_str, 0)
         # Log a warning message and delay resource allocation failure response.
         # Avoid immediate rejection to allow user-initiated placement group
@@ -357,12 +378,14 @@ def initialize_ray_cluster(
         if parallel_config.world_size > num_devices_in_cluster:
             logger.warning(
                 "The number of required %ss exceeds the total "
-                "number of available %ss in the placement group.", device_str,
-                device_str)
+                "number of available %ss in the placement group.",
+                device_str,
+                device_str,
+            )
         # Create a new placement group
-        placement_group_specs: List[Dict[str, float]] = ([{
-            device_str: 1.0
-        } for _ in range(parallel_config.world_size)])
+        placement_group_specs: List[Dict[str, float]] = [
+            {device_str: 1.0} for _ in range(parallel_config.world_size)
+        ]
 
         # vLLM engine is also a worker to execute model with an accelerator,
         # so it requires to have the device in a current node. Check if
@@ -375,14 +398,16 @@ def initialize_ray_cluster(
                 f"Current node has no {device_str} available. "
                 f"{current_node_resource=}. vLLM engine cannot start without "
                 f"{device_str}. Make sure you have at least 1 {device_str} "
-                f"available in a node {current_node_id=} {current_ip=}.")
+                f"available in a node {current_node_id=} {current_ip=}."
+            )
         # This way, at least bundle is required to be created in a current
         # node.
         placement_group_specs[0][f"node:{current_ip}"] = 0.001
 
         # By default, Ray packs resources as much as possible.
         current_placement_group = ray.util.placement_group(
-            placement_group_specs, strategy="PACK")
+            placement_group_specs, strategy="PACK"
+        )
         _wait_until_pg_ready(current_placement_group)
 
     assert current_placement_group is not None
@@ -393,6 +418,7 @@ def initialize_ray_cluster(
 
 def get_num_tpu_nodes() -> int:
     from ray._private.accelerators import TPUAcceleratorManager
+
     cluster_resources = ray.cluster_resources()
     total_tpus = int(cluster_resources["TPU"])
     tpus_per_node = TPUAcceleratorManager.get_current_node_num_accelerators()
diff --git a/vllm/executor/uniproc_executor.py b/vllm/executor/uniproc_executor.py
index d669592e75f1..ced054143c0c 100644
--- a/vllm/executor/uniproc_executor.py
+++ b/vllm/executor/uniproc_executor.py
@@ -14,8 +14,7 @@
 from vllm.logger import init_logger
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.cache import worker_receiver_cache_from_config
-from vllm.utils import (get_distributed_init_method, get_ip, get_open_port,
-                        run_method)
+from vllm.utils import get_distributed_init_method, get_ip, get_open_port, run_method
 from vllm.v1.engine import ReconfigureDistributedRequest, ReconfigureRankType
 from vllm.v1.executor.utils import get_and_update_mm_cache
 from vllm.v1.outputs import AsyncModelRunnerOutput
@@ -25,14 +24,11 @@
 
 
 class UniProcExecutor(ExecutorBase):
-
     uses_ray: bool = False
 
     def _init_executor(self) -> None:
-        """Initialize the worker and load the model.
-        """
-        self.driver_worker = WorkerWrapperBase(vllm_config=self.vllm_config,
-                                               rpc_rank=0)
+        """Initialize the worker and load the model."""
+        self.driver_worker = WorkerWrapperBase(vllm_config=self.vllm_config, rpc_rank=0)
         distributed_init_method, rank, local_rank = self._distributed_args()
         is_driver_worker = True
         kwargs = dict(
@@ -43,24 +39,24 @@ def _init_executor(self) -> None:
             is_driver_worker=is_driver_worker,
         )
         self.mm_receiver_cache = worker_receiver_cache_from_config(
-            self.vllm_config, MULTIMODAL_REGISTRY, Lock())
+            self.vllm_config, MULTIMODAL_REGISTRY, Lock()
+        )
 
         self.async_output_thread: Optional[ThreadPoolExecutor] = None
         if self.max_concurrent_batches > 1:
             self.async_output_thread = ThreadPoolExecutor(
-                max_workers=1, thread_name_prefix="WorkerAsyncOutput")
+                max_workers=1, thread_name_prefix="WorkerAsyncOutput"
+            )
 
-        self.collective_rpc("init_worker", args=([kwargs], ))
+        self.collective_rpc("init_worker", args=([kwargs],))
         self.collective_rpc("init_device")
         self.collective_rpc("load_model")
 
     def _distributed_args(self) -> tuple[str, int, int]:
         """Return (distributed_init_method, rank, local_rank)."""
-        distributed_init_method = get_distributed_init_method(
-            get_ip(), get_open_port())
+        distributed_init_method = get_distributed_init_method(get_ip(), get_open_port())
         # set local rank as the device index if specified
-        device_info = self.vllm_config.device_config.device.__str__().split(
-            ":")
+        device_info = self.vllm_config.device_config.device.__str__().split(":")
         local_rank = int(device_info[1]) if len(device_info) > 1 else 0
         return distributed_init_method, 0, local_rank
 
@@ -68,12 +64,14 @@ def _distributed_args(self) -> tuple[str, int, int]:
     def max_concurrent_batches(self) -> int:
         return 2 if self.scheduler_config.async_scheduling else 1
 
-    def collective_rpc(self,
-                       method: Union[str, Callable],
-                       timeout: Optional[float] = None,
-                       args: Tuple = (),
-                       kwargs: Optional[Dict] = None,
-                       non_block: bool = False) -> List[Any]:
+    def collective_rpc(
+        self,
+        method: Union[str, Callable],
+        timeout: Optional[float] = None,
+        args: Tuple = (),
+        kwargs: Optional[Dict] = None,
+        non_block: bool = False,
+    ) -> List[Any]:
         if kwargs is None:
             kwargs = {}
         if self.mm_receiver_cache is not None and method == "execute_model":
@@ -101,10 +99,13 @@ def check_health(self) -> None:
         return
 
     def reinitialize_distributed(
-            self, reconfig_request: ReconfigureDistributedRequest) -> None:
+        self, reconfig_request: ReconfigureDistributedRequest
+    ) -> None:
         self.driver_worker.reinitialize_distributed(reconfig_request)
-        if reconfig_request.new_data_parallel_rank == \
-        ReconfigureRankType.SHUTDOWN_CURRENT_RANK:
+        if (
+            reconfig_request.new_data_parallel_rank
+            == ReconfigureRankType.SHUTDOWN_CURRENT_RANK
+        ):
             self.shutdown()
         return
 
@@ -132,15 +133,16 @@ class ExecutorWithExternalLauncher(UniProcExecutor):
     deterministic, all the engines will generate the same outputs,
     and they don't need to synchronize the states with each other.
     """
+
     uses_ray: bool = False
 
     def _init_executor(self) -> None:
-        """Initialize the worker and load the model.
-        """
+        """Initialize the worker and load the model."""
         if envs.VLLM_USE_V1:
-            assert not envs.VLLM_ENABLE_V1_MULTIPROCESSING, \
-            ("To get deterministic execution in V1, "
-            "please set VLLM_ENABLE_V1_MULTIPROCESSING=0")
+            assert not envs.VLLM_ENABLE_V1_MULTIPROCESSING, (
+                "To get deterministic execution in V1, "
+                "please set VLLM_ENABLE_V1_MULTIPROCESSING=0"
+            )
         super()._init_executor()
 
     def _distributed_args(self) -> tuple[str, int, int]:
@@ -168,6 +170,7 @@ def determine_num_available_blocks(self) -> Tuple[int, int]:
         """
         a, b = super().determine_num_available_blocks()
         from vllm.distributed.parallel_state import get_world_group
+
         cpu_group = get_world_group().cpu_group
         a_tensor = torch.tensor([a], device="cpu", dtype=torch.int64)
         b_tensor = torch.tensor([b], device="cpu", dtype=torch.int64)
diff --git a/vllm/forward_context.py b/vllm/forward_context.py
index 09defade00dc..26ad37dda776 100644
--- a/vllm/forward_context.py
+++ b/vllm/forward_context.py
@@ -34,6 +34,7 @@ class BatchDescriptor(NamedTuple):
     items as minimal as possible to properly and uniquely describe the padded
     batch for cudagraph.
     """
+
     num_tokens: int
     uniform_decode: bool = False
     """
@@ -49,29 +50,30 @@ def non_uniform(self) -> "BatchDescriptor":
         return BatchDescriptor(self.num_tokens, uniform_decode=False)
 
 
-def _compute_sp_num_tokens(num_tokens_across_dp_cpu: torch.Tensor,
-                           sequence_parallel_size: int) -> list[int]:
-    sp_tokens = ((num_tokens_across_dp_cpu + sequence_parallel_size - 1) //
-                 sequence_parallel_size)
+def _compute_sp_num_tokens(
+    num_tokens_across_dp_cpu: torch.Tensor, sequence_parallel_size: int
+) -> list[int]:
+    sp_tokens = (
+        num_tokens_across_dp_cpu + sequence_parallel_size - 1
+    ) // sequence_parallel_size
 
     sp_tokens = sp_tokens.repeat_interleave(sequence_parallel_size)
     return sp_tokens.tolist()
 
 
-def _compute_chunked_local_num_tokens(num_tokens_across_dp_cpu: torch.Tensor,
-                                      sequence_parallel_size: int,
-                                      max_num_tokens: int,
-                                      chunk_idx: int) -> list[int]:
-
-    sp_tokens = _compute_sp_num_tokens(num_tokens_across_dp_cpu,
-                                       sequence_parallel_size)
+def _compute_chunked_local_num_tokens(
+    num_tokens_across_dp_cpu: torch.Tensor,
+    sequence_parallel_size: int,
+    max_num_tokens: int,
+    chunk_idx: int,
+) -> list[int]:
+    sp_tokens = _compute_sp_num_tokens(num_tokens_across_dp_cpu, sequence_parallel_size)
     sp_size = len(sp_tokens)
 
     local_size = [-1] * sp_size
     for i in range(sp_size):
         # Take into account sharding if MoE activation is sequence parallel.
-        local_size[i] = min(max_num_tokens,
-                            sp_tokens[i] - (max_num_tokens * chunk_idx))
+        local_size[i] = min(max_num_tokens, sp_tokens[i] - (max_num_tokens * chunk_idx))
         if local_size[i] <= 0:
             local_size[i] = 1  # ensure lockstep even if done
     return local_size
@@ -86,13 +88,15 @@ class DPMetadata:
     local_sizes: Optional[list[int]] = None
 
     @staticmethod
-    def num_tokens_across_dp(num_tokens: int, dp_size: int,
-                             dp_rank: int) -> torch.Tensor:
+    def num_tokens_across_dp(
+        num_tokens: int, dp_size: int, dp_rank: int
+    ) -> torch.Tensor:
         """
         Gather the num_tokens across all DP ranks and return results in a
         CPU tensor of size dp_size.
         """
         from vllm.distributed.parallel_state import get_dp_group
+
         device = current_platform.device_type
         group = get_dp_group().device_group
 
@@ -102,14 +106,15 @@ def num_tokens_across_dp(num_tokens: int, dp_size: int,
         # this optimization if we run into this case.
         if envs.VLLM_DISABLE_NCCL_FOR_DP_SYNCHRONIZATION:
             logger.info_once(
-                "Using CPU all reduce to syncronize DP padding between ranks.")
+                "Using CPU all reduce to syncronize DP padding between ranks."
+            )
             device = "cpu"
             group = get_dp_group().cpu_group
         num_tokens_across_dp = [0] * dp_size
         num_tokens_across_dp[dp_rank] = num_tokens
-        num_tokens_tensor = torch.tensor(num_tokens_across_dp,
-                                         device=device,
-                                         dtype=torch.int32)
+        num_tokens_tensor = torch.tensor(
+            num_tokens_across_dp, device=device, dtype=torch.int32
+        )
         dist.all_reduce(num_tokens_tensor, group=group)
         return num_tokens_tensor.cpu()
 
@@ -119,16 +124,19 @@ def num_tokens_across_dp(num_tokens: int, dp_size: int,
     # When sp_size==1, this is just the cummulative num tokens across DP.
     def cu_tokens_across_sp(self, sp_size: int) -> torch.Tensor:
         num_tokens_across_sp_cpu = (
-            (self.num_tokens_across_dp_cpu - 1 + sp_size) // sp_size)
-        num_tokens_across_sp_cpu = (
-            num_tokens_across_sp_cpu.repeat_interleave(sp_size))
+            self.num_tokens_across_dp_cpu - 1 + sp_size
+        ) // sp_size
+        num_tokens_across_sp_cpu = num_tokens_across_sp_cpu.repeat_interleave(sp_size)
         return torch.cumsum(num_tokens_across_sp_cpu, dim=0)
 
     @staticmethod
     def should_ubatch_across_dp(
-            should_ubatch: bool, orig_num_tokens_per_ubatch: int,
-            padded_num_tokens_per_ubatch: int, dp_size: int,
-            dp_rank: int) -> tuple[bool, Optional[torch.Tensor]]:
+        should_ubatch: bool,
+        orig_num_tokens_per_ubatch: int,
+        padded_num_tokens_per_ubatch: int,
+        dp_size: int,
+        dp_rank: int,
+    ) -> tuple[bool, Optional[torch.Tensor]]:
         """
         1. Decides if each DP rank is going to microbatch. Either all ranks
         run with microbatching or none of them do. If this function decides
@@ -154,6 +162,7 @@ def should_ubatch_across_dp(
         tensor[2][dp_rank] = 1 if should_ubatch else 0
 
         from vllm.distributed.parallel_state import get_dp_group
+
         dist.all_reduce(tensor, group=get_dp_group().device_group)
 
         result: bool = bool(torch.all(tensor[2] == 1).item())
@@ -166,8 +175,9 @@ def should_ubatch_across_dp(
         orig_min_num_tokens = int(orig_num_tokens_tensor.min().item())
         padded_max_num_tokens = int(padded_num_tokens_tensor.max().item())
         if is_second_ubatch_empty(orig_min_num_tokens, padded_max_num_tokens):
-            logger.debug("Aborting ubatching %s %s", orig_min_num_tokens,
-                         padded_max_num_tokens)
+            logger.debug(
+                "Aborting ubatching %s %s", orig_min_num_tokens, padded_max_num_tokens
+            )
             return False, None
         return result, padded_num_tokens_tensor.cpu()
 
@@ -176,35 +186,37 @@ def make(
         parallel_config: ParallelConfig,
         attn_metadata: Any,
         num_tokens: int,
-        num_tokens_across_dp_cpu: Optional[torch.Tensor] = None
+        num_tokens_across_dp_cpu: Optional[torch.Tensor] = None,
     ) -> "DPMetadata":
-
         assert parallel_config.data_parallel_size > 1
         dp_size = parallel_config.data_parallel_size
         dp_rank = parallel_config.data_parallel_rank
-        if attn_metadata is not None and hasattr(attn_metadata,
-                                                 "num_prefill_tokens"):
+        if attn_metadata is not None and hasattr(attn_metadata, "num_prefill_tokens"):
             # for v0 attention backends
-            batchsize = attn_metadata.num_prefill_tokens + \
-                attn_metadata.num_decode_tokens
+            batchsize = (
+                attn_metadata.num_prefill_tokens + attn_metadata.num_decode_tokens
+            )
         else:
             # for v1 attention backends or no attn_metadata
             batchsize = num_tokens
 
         # If num_tokens_across_dp is None, it will be computed by all_reduce
         # Otherwise, num_tokens_across_dp[dp_rank] should be equal to batchsize
-        assert (num_tokens_across_dp_cpu is None
-                or num_tokens_across_dp_cpu[dp_rank] == batchsize
-                ), f"{num_tokens_across_dp_cpu[dp_rank]} {batchsize}"
+        assert (
+            num_tokens_across_dp_cpu is None
+            or num_tokens_across_dp_cpu[dp_rank] == batchsize
+        ), f"{num_tokens_across_dp_cpu[dp_rank]} {batchsize}"
         if num_tokens_across_dp_cpu is None:
             num_tokens_across_dp_cpu = DPMetadata.num_tokens_across_dp(
-                batchsize, dp_size, dp_rank)
+                batchsize, dp_size, dp_rank
+            )
         max_tokens_across_dp_cpu = torch.max(num_tokens_across_dp_cpu)
         return DPMetadata(max_tokens_across_dp_cpu, num_tokens_across_dp_cpu)
 
     @contextmanager
-    def chunked_sizes(self, sequence_parallel_size: int,
-                      max_chunk_size_per_rank: int, chunk_idx: int):
+    def chunked_sizes(
+        self, sequence_parallel_size: int, max_chunk_size_per_rank: int, chunk_idx: int
+    ):
         """
         Context manager to compute and temporarily set the per-rank local token
         sizes for a specific chunk during chunked forward execution.
@@ -225,13 +237,16 @@ def chunked_sizes(self, sequence_parallel_size: int,
                                     we use SP between the layers to avoid
                                     redundant ops. We need this value to
                                     compute the chunked sizes.
-            max_chunk_size_per_rank: The max number of tokens each rank is 
+            max_chunk_size_per_rank: The max number of tokens each rank is
                                      allowed to process in this chunk.
             chunk_idx: The index of the chunk to compute sizes for.
         """
         self.local_sizes = _compute_chunked_local_num_tokens(
-            self.num_tokens_across_dp_cpu, sequence_parallel_size,
-            max_chunk_size_per_rank, chunk_idx)
+            self.num_tokens_across_dp_cpu,
+            sequence_parallel_size,
+            max_chunk_size_per_rank,
+            chunk_idx,
+        )
         try:
             yield self.local_sizes
         finally:
@@ -244,7 +259,8 @@ def sp_local_sizes(self, sequence_parallel_size: int):
         but without any chunking.
         """
         self.local_sizes = _compute_sp_num_tokens(
-            self.num_tokens_across_dp_cpu, sequence_parallel_size)
+            self.num_tokens_across_dp_cpu, sequence_parallel_size
+        )
         try:
             yield self.local_sizes
         finally:
@@ -267,8 +283,11 @@ class ForwardContext:
     for each microbatch.
     Set dynamically for each forward pass
     """
-    attn_metadata: Union["AttentionMetadata", dict[str, "AttentionMetadata"],
-                         list[dict[str, "AttentionMetadata"]]]
+    attn_metadata: Union[
+        "AttentionMetadata",
+        dict[str, "AttentionMetadata"],
+        list[dict[str, "AttentionMetadata"]],
+    ]
     # TODO: remove after making all virtual_engines share the same kv cache
     virtual_engine: int  # set dynamically for each forward pass
     # set dynamically for each forward pass
@@ -281,8 +300,9 @@ class ForwardContext:
     ubatch_slices: Optional[UBatchSlices] = None
 
     def __post_init__(self):
-        assert self.cudagraph_runtime_mode.valid_runtime_modes(), \
+        assert self.cudagraph_runtime_mode.valid_runtime_modes(), (
             f"Invalid cudagraph runtime mode: {self.cudagraph_runtime_mode}"
+        )
 
 
 _forward_context: Optional[ForwardContext] = None
@@ -292,26 +312,29 @@ def get_forward_context() -> ForwardContext:
     """Get the current forward context."""
     assert _forward_context is not None, (
         "Forward context is not set. "
-        "Please use `set_forward_context` to set the forward context.")
+        "Please use `set_forward_context` to set the forward context."
+    )
     return _forward_context
 
 
 def create_forward_context(
-        attn_metadata: Any,
-        vllm_config: VllmConfig,
-        virtual_engine: int = 0,
-        dp_metadata: Optional[DPMetadata] = None,
-        cudagraph_runtime_mode: CUDAGraphMode = CUDAGraphMode.NONE,
-        batch_descriptor: Optional[BatchDescriptor] = None,
-        ubatch_slices: Optional[UBatchSlices] = None):
-    return ForwardContext(no_compile_layers=vllm_config.compilation_config.
-                          static_forward_context,
-                          virtual_engine=virtual_engine,
-                          attn_metadata=attn_metadata,
-                          dp_metadata=dp_metadata,
-                          cudagraph_runtime_mode=cudagraph_runtime_mode,
-                          batch_descriptor=batch_descriptor,
-                          ubatch_slices=ubatch_slices)
+    attn_metadata: Any,
+    vllm_config: VllmConfig,
+    virtual_engine: int = 0,
+    dp_metadata: Optional[DPMetadata] = None,
+    cudagraph_runtime_mode: CUDAGraphMode = CUDAGraphMode.NONE,
+    batch_descriptor: Optional[BatchDescriptor] = None,
+    ubatch_slices: Optional[UBatchSlices] = None,
+):
+    return ForwardContext(
+        no_compile_layers=vllm_config.compilation_config.static_forward_context,
+        virtual_engine=virtual_engine,
+        attn_metadata=attn_metadata,
+        dp_metadata=dp_metadata,
+        cudagraph_runtime_mode=cudagraph_runtime_mode,
+        batch_descriptor=batch_descriptor,
+        ubatch_slices=ubatch_slices,
+    )
 
 
 @contextmanager
@@ -331,14 +354,15 @@ def override_forward_context(forward_context: Optional[ForwardContext]):
 
 @contextmanager
 def set_forward_context(
-        attn_metadata: Any,
-        vllm_config: VllmConfig,
-        virtual_engine: int = 0,
-        num_tokens: Optional[int] = None,
-        num_tokens_across_dp: Optional[torch.Tensor] = None,
-        cudagraph_runtime_mode: CUDAGraphMode = CUDAGraphMode.NONE,
-        batch_descriptor: Optional[BatchDescriptor] = None,
-        ubatch_slices: Optional[UBatchSlices] = None):
+    attn_metadata: Any,
+    vllm_config: VllmConfig,
+    virtual_engine: int = 0,
+    num_tokens: Optional[int] = None,
+    num_tokens_across_dp: Optional[torch.Tensor] = None,
+    cudagraph_runtime_mode: CUDAGraphMode = CUDAGraphMode.NONE,
+    batch_descriptor: Optional[BatchDescriptor] = None,
+    ubatch_slices: Optional[UBatchSlices] = None,
+):
     """A context manager that stores the current forward context,
     can be attention metadata, etc.
     Here we can inject common logic for every model forward pass.
@@ -350,15 +374,24 @@ def set_forward_context(
 
     dp_metadata: Optional[DPMetadata] = None
     if vllm_config.parallel_config.data_parallel_size > 1 and (
-            attn_metadata is not None or num_tokens is not None):
-        dp_metadata = DPMetadata.make(vllm_config.parallel_config,
-                                      attn_metadata, num_tokens or 0,
-                                      num_tokens_across_dp)
-
-    forward_context = create_forward_context(attn_metadata, vllm_config,
-                                             virtual_engine, dp_metadata,
-                                             cudagraph_runtime_mode,
-                                             batch_descriptor, ubatch_slices)
+        attn_metadata is not None or num_tokens is not None
+    ):
+        dp_metadata = DPMetadata.make(
+            vllm_config.parallel_config,
+            attn_metadata,
+            num_tokens or 0,
+            num_tokens_across_dp,
+        )
+
+    forward_context = create_forward_context(
+        attn_metadata,
+        vllm_config,
+        virtual_engine,
+        dp_metadata,
+        cudagraph_runtime_mode,
+        batch_descriptor,
+        ubatch_slices,
+    )
 
     try:
         with override_forward_context(forward_context):
@@ -368,8 +401,9 @@ def set_forward_context(
         if need_to_track_batchsize:
             if hasattr(attn_metadata, "num_prefill_tokens"):
                 # for v0 attention backends
-                batchsize = attn_metadata.num_prefill_tokens + \
-                    attn_metadata.num_decode_tokens
+                batchsize = (
+                    attn_metadata.num_prefill_tokens + attn_metadata.num_decode_tokens
+                )
             else:
                 # for v1 attention backends
                 batchsize = num_tokens
@@ -377,13 +411,13 @@ def set_forward_context(
             # adding a sync point here should not affect
             # scheduling of the next batch
             from vllm.platforms import current_platform
+
             synchronize = current_platform.synchronize
             if synchronize is not None:
                 synchronize()
             now = time.perf_counter()
             # time measurement is in milliseconds
-            batchsize_forward_time[batchsize].append(
-                (now - forward_start_time) * 1000)
+            batchsize_forward_time[batchsize].append((now - forward_start_time) * 1000)
             if now - last_logging_time > batchsize_logging_interval:
                 last_logging_time = now
                 forward_stats = []
@@ -396,6 +430,10 @@ def set_forward_context(
                     forward_stats.append((bs, len(times), medium))
                 forward_stats.sort(key=lambda x: x[1], reverse=True)
                 if forward_stats:
-                    logger.info(("Batchsize forward time stats "
-                                 "(batchsize, count, median_time(ms)): %s"),
-                                forward_stats)
+                    logger.info(
+                        (
+                            "Batchsize forward time stats "
+                            "(batchsize, count, median_time(ms)): %s"
+                        ),
+                        forward_stats,
+                    )
diff --git a/vllm/inputs/__init__.py b/vllm/inputs/__init__.py
index 3f1cac531f45..d9aed70c9b97 100644
--- a/vllm/inputs/__init__.py
+++ b/vllm/inputs/__init__.py
@@ -1,12 +1,26 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from .data import (DataPrompt, DecoderOnlyInputs, EmbedsInputs, EmbedsPrompt,
-                   EncoderDecoderInputs, ExplicitEncoderDecoderPrompt,
-                   ProcessorInputs, PromptType, SingletonInputs,
-                   SingletonPrompt, TextPrompt, TokenInputs, TokensPrompt,
-                   build_explicit_enc_dec_prompt, embeds_inputs,
-                   to_enc_dec_tuple_list, token_inputs, zip_enc_dec_prompts)
+from .data import (
+    DataPrompt,
+    DecoderOnlyInputs,
+    EmbedsInputs,
+    EmbedsPrompt,
+    EncoderDecoderInputs,
+    ExplicitEncoderDecoderPrompt,
+    ProcessorInputs,
+    PromptType,
+    SingletonInputs,
+    SingletonPrompt,
+    TextPrompt,
+    TokenInputs,
+    TokensPrompt,
+    build_explicit_enc_dec_prompt,
+    embeds_inputs,
+    to_enc_dec_tuple_list,
+    token_inputs,
+    zip_enc_dec_prompts,
+)
 
 __all__ = [
     "DataPrompt",
diff --git a/vllm/inputs/data.py b/vllm/inputs/data.py
index 562e73eead66..c463723e5d0e 100644
--- a/vllm/inputs/data.py
+++ b/vllm/inputs/data.py
@@ -7,8 +7,11 @@
 from typing_extensions import NotRequired, TypedDict, TypeIs, TypeVar
 
 if TYPE_CHECKING:
-    from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalInputs,
-                                        MultiModalUUIDDict)
+    from vllm.multimodal.inputs import (
+        MultiModalDataDict,
+        MultiModalInputs,
+        MultiModalUUIDDict,
+    )
 
 
 class TextPrompt(TypedDict):
@@ -134,23 +137,27 @@ class DataPrompt(TypedDict):
 
 
 def is_tokens_prompt(prompt: SingletonPrompt) -> TypeIs[TokensPrompt]:
-    return (isinstance(prompt, dict) and "prompt_token_ids" in prompt
-            and "prompt_embeds" not in prompt)
+    return (
+        isinstance(prompt, dict)
+        and "prompt_token_ids" in prompt
+        and "prompt_embeds" not in prompt
+    )
 
 
 def is_embeds_prompt(prompt: SingletonPrompt) -> TypeIs[EmbedsPrompt]:
-    return (isinstance(prompt, dict) and "prompt_token_ids" not in prompt
-            and "prompt_embeds" in prompt)
+    return (
+        isinstance(prompt, dict)
+        and "prompt_token_ids" not in prompt
+        and "prompt_embeds" in prompt
+    )
 
 
-_T1_co = TypeVar("_T1_co",
-                 bound=SingletonPrompt,
-                 default=SingletonPrompt,
-                 covariant=True)
-_T2_co = TypeVar("_T2_co",
-                 bound=SingletonPrompt,
-                 default=SingletonPrompt,
-                 covariant=True)
+_T1_co = TypeVar(
+    "_T1_co", bound=SingletonPrompt, default=SingletonPrompt, covariant=True
+)
+_T2_co = TypeVar(
+    "_T2_co", bound=SingletonPrompt, default=SingletonPrompt, covariant=True
+)
 
 
 # TODO: Make fields ReadOnly once mypy supports it
@@ -309,8 +316,9 @@ def build_explicit_enc_dec_prompt(
 def zip_enc_dec_prompts(
     enc_prompts: Iterable[_T1],
     dec_prompts: Iterable[Optional[_T2]],
-    mm_processor_kwargs: Optional[Union[Iterable[dict[str, Any]],
-                                        dict[str, Any]]] = None,
+    mm_processor_kwargs: Optional[
+        Union[Iterable[dict[str, Any]], dict[str, Any]]
+    ] = None,
 ) -> list[ExplicitEncoderDecoderPrompt[_T1, _T2]]:
     """
     Zip encoder and decoder prompts together into a list of
@@ -329,20 +337,21 @@ def zip_enc_dec_prompts(
                 encoder_prompt,
                 decoder_prompt,
                 cast(dict[str, Any], mm_processor_kwargs),
-            ) for (encoder_prompt,
-                   decoder_prompt) in zip(enc_prompts, dec_prompts)
+            )
+            for (encoder_prompt, decoder_prompt) in zip(enc_prompts, dec_prompts)
         ]
     return [
-        build_explicit_enc_dec_prompt(encoder_prompt, decoder_prompt,
-                                      mm_proc_kwargs)
-        for (encoder_prompt, decoder_prompt, mm_proc_kwargs
-             ) in zip(enc_prompts, dec_prompts, mm_processor_kwargs)
+        build_explicit_enc_dec_prompt(encoder_prompt, decoder_prompt, mm_proc_kwargs)
+        for (encoder_prompt, decoder_prompt, mm_proc_kwargs) in zip(
+            enc_prompts, dec_prompts, mm_processor_kwargs
+        )
     ]
 
 
 def to_enc_dec_tuple_list(
     enc_dec_prompts: Iterable[ExplicitEncoderDecoderPrompt[_T1, _T2]],
 ) -> list[tuple[_T1, Optional[_T2]]]:
-    return [(enc_dec_prompt["encoder_prompt"],
-             enc_dec_prompt["decoder_prompt"])
-            for enc_dec_prompt in enc_dec_prompts]
+    return [
+        (enc_dec_prompt["encoder_prompt"], enc_dec_prompt["decoder_prompt"])
+        for enc_dec_prompt in enc_dec_prompts
+    ]
diff --git a/vllm/inputs/parse.py b/vllm/inputs/parse.py
index f93817bd463d..2f7bd50df022 100644
--- a/vllm/inputs/parse.py
+++ b/vllm/inputs/parse.py
@@ -1,16 +1,22 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from collections.abc import Sequence
-from typing import (TYPE_CHECKING, Literal, NamedTuple, Optional, TypedDict,
-                    Union, cast)
+from typing import TYPE_CHECKING, Literal, NamedTuple, Optional, TypedDict, Union, cast
 
 from typing_extensions import TypeIs
 
 from vllm.utils import is_list_of
 
-from .data import (EmbedsPrompt, ExplicitEncoderDecoderPrompt, ProcessorInputs,
-                   PromptType, SingletonInputs, SingletonPrompt, TextPrompt,
-                   TokensPrompt)
+from .data import (
+    EmbedsPrompt,
+    ExplicitEncoderDecoderPrompt,
+    ProcessorInputs,
+    PromptType,
+    SingletonInputs,
+    SingletonPrompt,
+    TextPrompt,
+    TokensPrompt,
+)
 
 if TYPE_CHECKING:
     import torch
@@ -44,8 +50,10 @@ def parse_raw_prompts(
                 # case 4: array of token arrays
                 return [TokensPrompt(prompt_token_ids=elem) for elem in prompt]
 
-    raise TypeError("prompt must be a string, array of strings, "
-                    "array of tokens, or array of token arrays")
+    raise TypeError(
+        "prompt must be a string, array of strings, "
+        "array of tokens, or array of token arrays"
+    )
 
 
 class ParsedStrPrompt(TypedDict):
@@ -68,8 +76,9 @@ class ParsedEmbedsPrompt(TypedDict):
     content: EmbedsPrompt
 
 
-ParsedSingletonPrompt = Union[ParsedStrPrompt, ParsedTextPrompt,
-                              ParsedTokensPrompt, ParsedEmbedsPrompt]
+ParsedSingletonPrompt = Union[
+    ParsedStrPrompt, ParsedTextPrompt, ParsedTokensPrompt, ParsedEmbedsPrompt
+]
 
 
 def parse_singleton_prompt(prompt: SingletonPrompt) -> ParsedSingletonPrompt:
@@ -79,19 +88,19 @@ def parse_singleton_prompt(prompt: SingletonPrompt) -> ParsedSingletonPrompt:
         # Type ignores are because mypy does not correctly infer the TypedDicts
         # Pyright does succeed.
         if "prompt_embeds" in prompt:
-            return ParsedEmbedsPrompt(
-                type="embeds", content=prompt)  # type: ignore[typeddict-item]
+            return ParsedEmbedsPrompt(type="embeds", content=prompt)  # type: ignore[typeddict-item]
         elif "prompt_token_ids" in prompt:
-            return ParsedTokensPrompt(
-                type="tokens", content=prompt)  # type: ignore[typeddict-item]
+            return ParsedTokensPrompt(type="tokens", content=prompt)  # type: ignore[typeddict-item]
         elif "prompt" in prompt:
             return ParsedTextPrompt(type="text", content=prompt)
     raise TypeError(
-        "inputs must be a string, TextPrompt, TokensPrompt, or EmbedsPrompt")
+        "inputs must be a string, TextPrompt, TokensPrompt, or EmbedsPrompt"
+    )
 
 
 def is_explicit_encoder_decoder_prompt(
-    prompt: PromptType, ) -> TypeIs[ExplicitEncoderDecoderPrompt]:
+    prompt: PromptType,
+) -> TypeIs[ExplicitEncoderDecoderPrompt]:
     return isinstance(prompt, dict) and "encoder_prompt" in prompt
 
 
@@ -118,7 +127,7 @@ def get_prompt_components(prompt: PromptType) -> PromptComponents:
     if isinstance(prompt, str):
         return PromptComponents(text=prompt)
 
-    if (encoder_prompt := prompt.get("encoder_prompt")):
+    if encoder_prompt := prompt.get("encoder_prompt"):
         return get_prompt_components(encoder_prompt)  # type: ignore[arg-type]
 
     return PromptComponents(
diff --git a/vllm/inputs/preprocess.py b/vllm/inputs/preprocess.py
index c82daf39be7a..d1f55740149a 100644
--- a/vllm/inputs/preprocess.py
+++ b/vllm/inputs/preprocess.py
@@ -10,23 +10,37 @@
 from vllm.logger import init_logger
 from vllm.multimodal import MULTIMODAL_REGISTRY, MultiModalRegistry
 from vllm.multimodal.cache import BaseMultiModalProcessorCache
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalEncDecInputs,
-                                    MultiModalInputs, MultiModalUUIDDict)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalEncDecInputs,
+    MultiModalInputs,
+    MultiModalUUIDDict,
+)
 from vllm.multimodal.processing import BaseMultiModalProcessor
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
-from .data import (DecoderOnlyInputs, EmbedsInputs, EmbedsPrompt,
-                   EncoderDecoderInputs, ExplicitEncoderDecoderPrompt,
-                   ProcessorInputs, PromptType, SingletonInputs,
-                   SingletonPrompt, TextPrompt, TokenInputs, TokensPrompt,
-                   embeds_inputs, token_inputs)
+from .data import (
+    DecoderOnlyInputs,
+    EmbedsInputs,
+    EmbedsPrompt,
+    EncoderDecoderInputs,
+    ExplicitEncoderDecoderPrompt,
+    ProcessorInputs,
+    PromptType,
+    SingletonInputs,
+    SingletonPrompt,
+    TextPrompt,
+    TokenInputs,
+    TokensPrompt,
+    embeds_inputs,
+    token_inputs,
+)
 from .parse import is_explicit_encoder_decoder_prompt, parse_singleton_prompt
 
 logger = init_logger(__name__)
 
 
 class InputPreprocessor:
-
     def __init__(
         self,
         model_config: ModelConfig,
@@ -43,23 +57,26 @@ def __init__(
 
     def get_tokenizer(self) -> AnyTokenizer:
         if self.tokenizer is None:
-            raise ValueError("You cannot pass text prompts when "
-                             "`skip_tokenizer_init` is True")
+            raise ValueError(
+                "You cannot pass text prompts when `skip_tokenizer_init` is True"
+            )
 
         return self.tokenizer
 
     def get_bos_token_id(self) -> Optional[int]:
         if self.tokenizer is None:
-            logger.warning("Using None for BOS token id because tokenizer "
-                           "is not initialized")
+            logger.warning(
+                "Using None for BOS token id because tokenizer is not initialized"
+            )
             return None
 
         return self.tokenizer.bos_token_id
 
     def get_eos_token_id(self) -> Optional[int]:
         if self.tokenizer is None:
-            logger.warning("Using None for EOS token id because tokenizer "
-                           "is not initialized")
+            logger.warning(
+                "Using None for EOS token id because tokenizer is not initialized"
+            )
             return None
 
         return self.tokenizer.eos_token_id
@@ -74,22 +91,26 @@ def get_decoder_start_token_id(self) -> Optional[int]:
         if not self.model_config.is_encoder_decoder:
             logger.warning_once(
                 "Using None for decoder start token id because "
-                "this is not an encoder/decoder model.")
+                "this is not an encoder/decoder model."
+            )
             return None
 
         if self.model_config is None or self.model_config.hf_config is None:
             logger.warning_once(
                 "Using None for decoder start token id because "
-                "model config is not available.")
+                "model config is not available."
+            )
             return None
 
-        dec_start_token_id = getattr(self.model_config.hf_config,
-                                     "decoder_start_token_id", None)
+        dec_start_token_id = getattr(
+            self.model_config.hf_config, "decoder_start_token_id", None
+        )
         if dec_start_token_id is None:
             logger.warning_once(
                 "Falling back on <BOS> for decoder start token "
                 "id because decoder start token id is not "
-                "available.")
+                "available."
+            )
             dec_start_token_id = self.get_bos_token_id()
 
         return dec_start_token_id
@@ -159,8 +180,10 @@ def _prepare_decoder_input_ids_for_generation(
             # use decoder_start_token_id as decoder_input_ids
             decoder_input_ids = self._get_default_enc_dec_decoder_prompt()
 
-        if (len(decoder_input_ids) == 0
-                or decoder_input_ids[0] != decoder_start_token_id):
+        if (
+            len(decoder_input_ids) == 0
+            or decoder_input_ids[0] != decoder_start_token_id
+        ):
             decoder_input_ids = [decoder_start_token_id] + decoder_input_ids
 
         return decoder_input_ids
@@ -254,7 +277,8 @@ def _process_multimodal(
             raise ValueError(
                 f"mm_hashes must contain only strings, got: {mm_hashes}. "
                 "This is likely due to an incorrect custom implementation of "
-                "MultiModalProcessor.apply method.")
+                "MultiModalProcessor.apply method."
+            )
 
         return mm_input
 
@@ -263,8 +287,9 @@ def _process_embeds(
         parsed_content: EmbedsPrompt,
     ) -> EmbedsInputs:
         if not self.model_config.enable_prompt_embeds:
-            raise ValueError("You must set `--enable-prompt-embeds` to input "
-                             "`prompt_embeds`.")
+            raise ValueError(
+                "You must set `--enable-prompt-embeds` to input `prompt_embeds`."
+            )
 
         prompt_embeds = parsed_content["prompt_embeds"]
 
@@ -276,24 +301,25 @@ def _process_embeds(
             prompt_embeds = prompt_embeds.squeeze(dim=0)
 
         if prompt_embeds.ndim != 2:
-            raise ValueError(
-                "prompt_embeds must be of shape (seq_len, hidden_size).")
+            raise ValueError("prompt_embeds must be of shape (seq_len, hidden_size).")
 
         # Tensors must be on CPU for serialization between processes
         # in the MsgpackEncoder. Casting to CPU here ensures that there is no
         # hidden device transfer in the critical path of generation.
         prompt_embeds = prompt_embeds.cpu()
 
-        return embeds_inputs(prompt_embeds=prompt_embeds,
-                             cache_salt=parsed_content.get("cache_salt"))
+        return embeds_inputs(
+            prompt_embeds=prompt_embeds, cache_salt=parsed_content.get("cache_salt")
+        )
 
     def _truncate_inputs(
-            self,
-            inputs: list[int],
-            tokenization_kwargs: Optional[dict[str, Any]] = None) -> list[int]:
-
-        if not tokenization_kwargs or "truncation" not in \
-                tokenization_kwargs or self.tokenizer is None:
+        self, inputs: list[int], tokenization_kwargs: Optional[dict[str, Any]] = None
+    ) -> list[int]:
+        if (
+            not tokenization_kwargs
+            or "truncation" not in tokenization_kwargs
+            or self.tokenizer is None
+        ):
             return inputs
 
         max_length = tokenization_kwargs["max_length"]
@@ -311,7 +337,8 @@ def _process_tokens(
         mm_uuids: Optional[MultiModalUUIDDict] = None,
     ) -> Union[TokenInputs, MultiModalInputs]:
         prompt_token_ids = self._truncate_inputs(
-            parsed_content["prompt_token_ids"], tokenization_kwargs)
+            parsed_content["prompt_token_ids"], tokenization_kwargs
+        )
 
         inputs: Union[TokenInputs, MultiModalInputs]
         if self.model_config.is_multimodal_model:
@@ -324,8 +351,7 @@ def _process_tokens(
             )
         else:
             if parsed_content.get("multi_modal_data"):
-                raise ValueError(
-                    "This model does not support multimodal inputs")
+                raise ValueError("This model does not support multimodal inputs")
 
             inputs = token_inputs(prompt_token_ids)
 
@@ -354,8 +380,7 @@ def _process_text(
             )
         else:
             if parsed_content.get("multi_modal_data"):
-                raise ValueError(
-                    "This model does not support multimodal inputs")
+                raise ValueError("This model does not support multimodal inputs")
 
             prompt_token_ids = self._tokenize_prompt(
                 prompt_text,
@@ -415,16 +440,20 @@ def _build_enc_dec_llm_inputs(
         encoder_inputs: SingletonInputs,
         decoder_inputs: Optional[SingletonInputs],
     ) -> EncoderDecoderInputs:
-        if (encoder_inputs["type"] == "embeds"
-                or decoder_inputs and decoder_inputs["type"] == "embeds"):
-            raise ValueError("Embedding inputs are not supported for encoder-"
-                             "decoder models")
+        if (
+            encoder_inputs["type"] == "embeds"
+            or decoder_inputs
+            and decoder_inputs["type"] == "embeds"
+        ):
+            raise ValueError(
+                "Embedding inputs are not supported for encoder-decoder models"
+            )
 
         # Needed for mypy
-        encoder_inputs = cast(Union[TokenInputs, MultiModalInputs],
-                              encoder_inputs)
-        decoder_inputs = cast(Optional[Union[TokenInputs, MultiModalInputs]],
-                              decoder_inputs)
+        encoder_inputs = cast(Union[TokenInputs, MultiModalInputs], encoder_inputs)
+        decoder_inputs = cast(
+            Optional[Union[TokenInputs, MultiModalInputs]], decoder_inputs
+        )
 
         if decoder_inputs is None:
             if self.model_config.hf_config.model_type == "whisper":
@@ -434,16 +463,18 @@ def _build_enc_dec_llm_inputs(
                 # overridden by the audio features.
                 dec_token_ids = encoder_inputs["prompt_token_ids"].copy()
             else:
-                dec_token_ids = self._prepare_decoder_input_ids_for_generation(
-                    None)
+                dec_token_ids = self._prepare_decoder_input_ids_for_generation(None)
             decoder_inputs = token_inputs(dec_token_ids)
         else:
             if "multi_modal_data" in decoder_inputs:
-                raise ValueError("Multi-modal decoder inputs of encoder-"
-                                 "decoder models are not supported yet")
+                raise ValueError(
+                    "Multi-modal decoder inputs of encoder-"
+                    "decoder models are not supported yet"
+                )
 
             dec_token_ids = self._prepare_decoder_input_ids_for_generation(
-                decoder_inputs["prompt_token_ids"])
+                decoder_inputs["prompt_token_ids"]
+            )
             decoder_inputs["prompt_token_ids"] = dec_token_ids
 
         return EncoderDecoderInputs(
@@ -460,10 +491,14 @@ def _split_enc_dec_mm_inputs(
         For encoder/decoder models only:
         Separate Encoder/Decoder inputs from a MultiModalEncDecInputs
         """
-        if (inputs["type"] == "embeds" or decoder_inputs_to_override
-                and decoder_inputs_to_override["type"] == "embeds"):
-            raise ValueError("Embedding inputs are not supported for encoder-"
-                             "decoder models")
+        if (
+            inputs["type"] == "embeds"
+            or decoder_inputs_to_override
+            and decoder_inputs_to_override["type"] == "embeds"
+        ):
+            raise ValueError(
+                "Embedding inputs are not supported for encoder-decoder models"
+            )
 
         # Needed for mypy
         inputs = cast(
@@ -480,9 +515,11 @@ def _split_enc_dec_mm_inputs(
 
         if inputs["type"] == "multimodal":  # Multimodal data inputs
             if "encoder_prompt_token_ids" not in inputs:
-                raise RuntimeError("You should register an encoder-decoder "
-                                   "multi-modal processor for encoder-decoder "
-                                   "models.")
+                raise RuntimeError(
+                    "You should register an encoder-decoder "
+                    "multi-modal processor for encoder-decoder "
+                    "models."
+                )
             inputs = cast(MultiModalEncDecInputs, inputs)
 
             encoder_inputs = token_inputs(inputs["encoder_prompt_token_ids"])
@@ -564,9 +601,9 @@ def _process_encoder_decoder_prompt(
             # For multimodal model, override decoder prompt from processor
             # with explicit decoder prompt.
             if self.model_config.is_multimodal_model:
-                encoder_inputs, decoder_inputs = (
-                    self._split_enc_dec_mm_inputs(encoder_inputs,
-                                                  decoder_inputs))
+                encoder_inputs, decoder_inputs = self._split_enc_dec_mm_inputs(
+                    encoder_inputs, decoder_inputs
+                )
         else:
             # `cast` is needed for mypy, but not pyright
             inputs = self._prompt_to_llm_inputs(
@@ -576,8 +613,7 @@ def _process_encoder_decoder_prompt(
             )
             if self.model_config.is_multimodal_model:
                 # Encoder-Decoder Multimodal model
-                encoder_inputs, decoder_inputs = (
-                    self._split_enc_dec_mm_inputs(inputs))
+                encoder_inputs, decoder_inputs = self._split_enc_dec_mm_inputs(inputs)
             else:
                 encoder_inputs = inputs
                 decoder_inputs = None
@@ -589,8 +625,9 @@ def _build_decoder_only_llm_inputs(
         prompt_inputs: DecoderOnlyInputs,
     ) -> DecoderOnlyInputs:
         if "prompt_token_ids" in prompt_inputs:
-            prompt_inputs = cast(Union[TokenInputs, MultiModalInputs],
-                                 prompt_inputs)  # Needed for mypy
+            prompt_inputs = cast(
+                Union[TokenInputs, MultiModalInputs], prompt_inputs
+            )  # Needed for mypy
 
         return prompt_inputs
 
@@ -641,8 +678,9 @@ def preprocess(
             )
 
         if is_explicit_encoder_decoder_prompt(prompt):
-            raise ValueError("Cannot pass encoder-decoder prompt "
-                             "to decoder-only models")
+            raise ValueError(
+                "Cannot pass encoder-decoder prompt to decoder-only models"
+            )
 
         # Decoder-only operation
         # `cast` is needed for mypy, but not pyright
diff --git a/vllm/logger.py b/vllm/logger.py
index 2861e0f1686c..37e8495768c0 100644
--- a/vllm/logger.py
+++ b/vllm/logger.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Logging configuration for vLLM."""
+
 import datetime
 import json
 import logging
@@ -22,8 +23,10 @@
 VLLM_LOGGING_PREFIX = envs.VLLM_LOGGING_PREFIX
 VLLM_LOGGING_STREAM = envs.VLLM_LOGGING_STREAM
 
-_FORMAT = (f"{VLLM_LOGGING_PREFIX}%(levelname)s %(asctime)s "
-           "[%(fileinfo)s:%(lineno)d] %(message)s")
+_FORMAT = (
+    f"{VLLM_LOGGING_PREFIX}%(levelname)s %(asctime)s "
+    "[%(fileinfo)s:%(lineno)d] %(message)s"
+)
 _DATE_FORMAT = "%m-%d %H:%M:%S"
 
 DEFAULT_LOGGING_CONFIG = {
@@ -50,7 +53,7 @@
         },
     },
     "version": 1,
-    "disable_existing_loggers": False
+    "disable_existing_loggers": False,
 }
 
 
@@ -119,7 +122,8 @@ def _configure_vllm_root_logger() -> None:
             "VLLM_CONFIGURE_LOGGING evaluated to false, but "
             "VLLM_LOGGING_CONFIG_PATH was given. VLLM_LOGGING_CONFIG_PATH "
             "implies VLLM_CONFIGURE_LOGGING. Please enable "
-            "VLLM_CONFIGURE_LOGGING or unset VLLM_LOGGING_CONFIG_PATH.")
+            "VLLM_CONFIGURE_LOGGING or unset VLLM_LOGGING_CONFIG_PATH."
+        )
 
     if VLLM_CONFIGURE_LOGGING:
         logging_config = DEFAULT_LOGGING_CONFIG
@@ -128,13 +132,16 @@ def _configure_vllm_root_logger() -> None:
         if not path.exists(VLLM_LOGGING_CONFIG_PATH):
             raise RuntimeError(
                 "Could not load logging config. File does not exist: %s",
-                VLLM_LOGGING_CONFIG_PATH)
+                VLLM_LOGGING_CONFIG_PATH,
+            )
         with open(VLLM_LOGGING_CONFIG_PATH, encoding="utf-8") as file:
             custom_config = json.loads(file.read())
 
         if not isinstance(custom_config, dict):
-            raise ValueError("Invalid logging config. Expected dict, got %s.",
-                             type(custom_config).__name__)
+            raise ValueError(
+                "Invalid logging config. Expected dict, got %s.",
+                type(custom_config).__name__,
+            )
         logging_config = custom_config
 
     for formatter in logging_config.get("formatters", {}).values():
@@ -168,7 +175,7 @@ def init_logger(name: str) -> _VllmLogger:
 
 
 def _trace_calls(log_path, root_dir, frame, event, arg=None):
-    if event in ['call', 'return']:
+    if event in ["call", "return"]:
         # Extract the filename, line number, function name, and the code object
         filename = frame.f_code.co_filename
         lineno = frame.f_lineno
@@ -188,26 +195,29 @@ def _trace_calls(log_path, root_dir, frame, event, arg=None):
                 last_filename = ""
                 last_lineno = 0
                 last_func_name = ""
-            with open(log_path, 'a') as f:
+            with open(log_path, "a") as f:
                 ts = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S.%f")
-                if event == 'call':
-                    f.write(f"{ts} Call to"
-                            f" {func_name} in {filename}:{lineno}"
-                            f" from {last_func_name} in {last_filename}:"
-                            f"{last_lineno}\n")
+                if event == "call":
+                    f.write(
+                        f"{ts} Call to"
+                        f" {func_name} in {filename}:{lineno}"
+                        f" from {last_func_name} in {last_filename}:"
+                        f"{last_lineno}\n"
+                    )
                 else:
-                    f.write(f"{ts} Return from"
-                            f" {func_name} in {filename}:{lineno}"
-                            f" to {last_func_name} in {last_filename}:"
-                            f"{last_lineno}\n")
+                    f.write(
+                        f"{ts} Return from"
+                        f" {func_name} in {filename}:{lineno}"
+                        f" to {last_func_name} in {last_filename}:"
+                        f"{last_lineno}\n"
+                    )
         except NameError:
             # modules are deleted during shutdown
             pass
     return partial(_trace_calls, log_path, root_dir)
 
 
-def enable_trace_function_call(log_file_path: str,
-                               root_dir: Optional[str] = None):
+def enable_trace_function_call(log_file_path: str, root_dir: Optional[str] = None):
     """
     Enable tracing of every function call in code under `root_dir`.
     This is useful for debugging hangs or crashes.
@@ -221,7 +231,8 @@ def enable_trace_function_call(log_file_path: str,
     logger.warning(
         "VLLM_TRACE_FUNCTION is enabled. It will record every"
         " function executed by Python. This will slow down the code. It "
-        "is suggested to be used for debugging hang or crashes only.")
+        "is suggested to be used for debugging hang or crashes only."
+    )
     logger.info("Trace frame log is saved to %s", log_file_path)
     if root_dir is None:
         # by default, this is the vllm root directory
diff --git a/vllm/logging_utils/dump_input.py b/vllm/logging_utils/dump_input.py
index ad89638e1061..3a97000647d6 100644
--- a/vllm/logging_utils/dump_input.py
+++ b/vllm/logging_utils/dump_input.py
@@ -21,9 +21,10 @@ def prepare_object_to_dump(obj) -> str:
     if isinstance(obj, str):
         return f"'{obj}'"  # Double quotes
     elif isinstance(obj, dict):
-        dict_str = ', '.join({f'{str(k)}: {prepare_object_to_dump(v)}' \
-            for k, v in obj.items()})
-        return f'{{{dict_str}}}'
+        dict_str = ", ".join(
+            {f"{str(k)}: {prepare_object_to_dump(v)}" for k, v in obj.items()}
+        )
+        return f"{{{dict_str}}}"
     elif isinstance(obj, list):
         return f"[{', '.join([prepare_object_to_dump(v) for v in obj])}]"
     elif isinstance(obj, set):
@@ -36,15 +37,14 @@ def prepare_object_to_dump(obj) -> str:
     elif isinstance(obj, torch.Tensor):
         # We only print the 'draft' of the tensor to not expose sensitive data
         # and to get some metadata in case of CUDA runtime crashed
-        return (f"Tensor(shape={obj.shape}, "
-                f"device={obj.device},"
-                f"dtype={obj.dtype})")
-    elif hasattr(obj, 'anon_repr'):
+        return f"Tensor(shape={obj.shape}, device={obj.device},dtype={obj.dtype})"
+    elif hasattr(obj, "anon_repr"):
         return obj.anon_repr()
-    elif hasattr(obj, '__dict__'):
+    elif hasattr(obj, "__dict__"):
         items = obj.__dict__.items()
-        dict_str = ', '.join([f'{str(k)}={prepare_object_to_dump(v)}' \
-            for k, v in items])
+        dict_str = ", ".join(
+            [f"{str(k)}={prepare_object_to_dump(v)}" for k, v in items]
+        )
         return f"{type(obj).__name__}({dict_str})"
     else:
         # Hacky way to make sure we can serialize the object in JSON format
@@ -54,18 +54,22 @@ def prepare_object_to_dump(obj) -> str:
             return repr(obj)
 
 
-def dump_engine_exception(config: VllmConfig,
-                          scheduler_output: SchedulerOutput,
-                          scheduler_stats: Optional[SchedulerStats]):
+def dump_engine_exception(
+    config: VllmConfig,
+    scheduler_output: SchedulerOutput,
+    scheduler_stats: Optional[SchedulerStats],
+):
     # NOTE: ensure we can log extra info without risking raises
     # unexpected errors during logging
     with contextlib.suppress(Exception):
         _dump_engine_exception(config, scheduler_output, scheduler_stats)
 
 
-def _dump_engine_exception(config: VllmConfig,
-                           scheduler_output: SchedulerOutput,
-                           scheduler_stats: Optional[SchedulerStats]):
+def _dump_engine_exception(
+    config: VllmConfig,
+    scheduler_output: SchedulerOutput,
+    scheduler_stats: Optional[SchedulerStats],
+):
     logger.error(
         "Dumping input data for V1 LLM engine (v%s) with config: %s, ",
         VLLM_VERSION,
@@ -73,8 +77,7 @@ def _dump_engine_exception(config: VllmConfig,
     )
     try:
         dump_obj = prepare_object_to_dump(scheduler_output)
-        logger.error("Dumping scheduler output for model execution: %s",
-                     dump_obj)
+        logger.error("Dumping scheduler output for model execution: %s", dump_obj)
         if scheduler_stats:
             logger.error("Dumping scheduler stats: %s", scheduler_stats)
     except Exception:
diff --git a/vllm/logging_utils/formatter.py b/vllm/logging_utils/formatter.py
index 004b79f3ea6e..02ba308e1879 100644
--- a/vllm/logging_utils/formatter.py
+++ b/vllm/logging_utils/formatter.py
@@ -18,7 +18,6 @@ def __init__(self, fmt, datefmt=None, style="%"):
             self.root_dir = Path(__file__).resolve().parent.parent.parent
 
     def format(self, record):
-
         def shrink_path(relpath: Path) -> str:
             """
             Shortens a file path for logging display:
@@ -62,8 +61,7 @@ def shrink_path(relpath: Path) -> str:
             abs_path = getattr(record, "pathname", None)
             if abs_path:
                 try:
-                    relpath = Path(abs_path).resolve().relative_to(
-                        self.root_dir)
+                    relpath = Path(abs_path).resolve().relative_to(self.root_dir)
                 except Exception:
                     relpath = Path(record.filename)
             else:
diff --git a/vllm/logging_utils/log_time.py b/vllm/logging_utils/log_time.py
index 013dd144beaf..9e94f463711d 100644
--- a/vllm/logging_utils/log_time.py
+++ b/vllm/logging_utils/log_time.py
@@ -15,15 +15,17 @@ def logtime(logger, msg=None):
     """
 
     def _inner(func):
-
         @functools.wraps(func)
         def _wrapper(*args, **kwargs):
             start = time.perf_counter()
             result = func(*args, **kwargs)
             elapsed = time.perf_counter() - start
 
-            prefix = f"Function '{func.__module__}.{func.__qualname__}'" \
-                if msg is None else msg
+            prefix = (
+                f"Function '{func.__module__}.{func.__qualname__}'"
+                if msg is None
+                else msg
+            )
             logger.debug("%s: Elapsed time %.7f secs", prefix, elapsed)
             return result
 
diff --git a/vllm/logits_process.py b/vllm/logits_process.py
index 48f7e7495b17..6ac30ae0028e 100644
--- a/vllm/logits_process.py
+++ b/vllm/logits_process.py
@@ -19,8 +19,8 @@
 
 
 def get_bad_words_logits_processors(
-        bad_words: list[str],
-        tokenizer: AnyTokenizer) -> list[LogitsProcessor]:
+    bad_words: list[str], tokenizer: AnyTokenizer
+) -> list[LogitsProcessor]:
     bad_words_ids: list[list[int]] = list()
 
     for bad_word in bad_words:
@@ -31,15 +31,15 @@ def get_bad_words_logits_processors(
             prefix = " " if add_prefix_space else ""
             prompt = prefix + bad_word.lstrip()
 
-            prompt_token_ids = tokenizer.encode(text=prompt,
-                                                add_special_tokens=False)
+            prompt_token_ids = tokenizer.encode(text=prompt, add_special_tokens=False)
 
             # If no space at the beginning
             # or if prefix space produces a new word token
             if (not add_prefix_space) or (
-                    add_prefix_space
-                    and prompt_token_ids[0] != bad_words_ids[-1][0]
-                    and len(prompt_token_ids) == len(bad_words_ids[-1])):
+                add_prefix_space
+                and prompt_token_ids[0] != bad_words_ids[-1][0]
+                and len(prompt_token_ids) == len(bad_words_ids[-1])
+            ):
                 bad_words_ids.append(prompt_token_ids)
 
     return [NoBadWordsLogitsProcessor(bad_words_ids=bad_words_ids)]
@@ -78,8 +78,9 @@ def __call__(
             assert len(actual_prefix) == len(expected_prefix)
 
             is_match = tuple(actual_prefix) == tuple(expected_prefix)
-            last_token_bias[last_token_id] += (self._SMALLEST_LOGIT if is_match
-                                               else self._NEUTRAL_LOGIT)
+            last_token_bias[last_token_id] += (
+                self._SMALLEST_LOGIT if is_match else self._NEUTRAL_LOGIT
+            )
 
         logits = logits + self.word_bias + last_token_bias
 
@@ -93,9 +94,9 @@ def _init_word_bias(self, logits: torch.FloatTensor) -> None:
 
         self._check_token_ids_bounds(vocab_size=vocab_size)
 
-        self.word_bias = torch.zeros((vocab_size, ),
-                                     dtype=torch.float,
-                                     device=logits.device)
+        self.word_bias = torch.zeros(
+            (vocab_size,), dtype=torch.float, device=logits.device
+        )
 
         for bad_word_ids in self.bad_words_ids:
             if len(bad_word_ids) == 1:
@@ -116,4 +117,5 @@ def _check_token_ids_bounds(self, vocab_size: int) -> None:
                 f" but the following tokens"
                 f" were specified as bad: {invalid_token_ids}."
                 f" All token id values should be integers satisfying:"
-                f" 0 <= token_id < {vocab_size}.")
+                f" 0 <= token_id < {vocab_size}."
+            )
diff --git a/vllm/logprobs.py b/vllm/logprobs.py
index e58ca142c00a..2458e43c690f 100644
--- a/vllm/logprobs.py
+++ b/vllm/logprobs.py
@@ -16,6 +16,7 @@ class Logprob:
         rank: The vocab rank of chosen token (>=1)
         decoded_token: The decoded chosen token index
     """
+
     logprob: float
     rank: Optional[int] = None
     decoded_token: Optional[str] = None
diff --git a/vllm/lora/layers/__init__.py b/vllm/lora/layers/__init__.py
index d3bb145dc7bf..4915ef85f4f7 100644
--- a/vllm/lora/layers/__init__.py
+++ b/vllm/lora/layers/__init__.py
@@ -2,18 +2,23 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from vllm.lora.layers.base import BaseLayerWithLoRA
 from vllm.lora.layers.column_parallel_linear import (
-    ColumnParallelLinearWithLoRA, ColumnParallelLinearWithShardedLoRA,
+    ColumnParallelLinearWithLoRA,
+    ColumnParallelLinearWithShardedLoRA,
     MergedColumnParallelLinearWithLoRA,
-    MergedColumnParallelLinearWithShardedLoRA, MergedQKVParallelLinearWithLoRA,
-    MergedQKVParallelLinearWithShardedLoRA, QKVParallelLinearWithLoRA,
-    QKVParallelLinearWithShardedLoRA)
+    MergedColumnParallelLinearWithShardedLoRA,
+    MergedQKVParallelLinearWithLoRA,
+    MergedQKVParallelLinearWithShardedLoRA,
+    QKVParallelLinearWithLoRA,
+    QKVParallelLinearWithShardedLoRA,
+)
 from vllm.lora.layers.logits_processor import LogitsProcessorWithLoRA
 from vllm.lora.layers.replicated_linear import ReplicatedLinearWithLoRA
 from vllm.lora.layers.row_parallel_linear import (
-    RowParallelLinearWithLoRA, RowParallelLinearWithShardedLoRA)
+    RowParallelLinearWithLoRA,
+    RowParallelLinearWithShardedLoRA,
+)
 from vllm.lora.layers.utils import LoRAMapping
-from vllm.lora.layers.vocal_parallel_embedding import (
-    VocabParallelEmbeddingWithLoRA)
+from vllm.lora.layers.vocal_parallel_embedding import VocabParallelEmbeddingWithLoRA
 
 __all__ = [
     "BaseLayerWithLoRA",
diff --git a/vllm/lora/layers/base.py b/vllm/lora/layers/base.py
index a80a033e39b4..753dc268a2ff 100644
--- a/vllm/lora/layers/base.py
+++ b/vllm/lora/layers/base.py
@@ -14,7 +14,6 @@
 
 
 class BaseLayerWithLoRA(nn.Module):
-
     def slice_lora_a(
         self, lora_a: Union[torch.Tensor, list[Union[torch.Tensor, None]]]
     ) -> Union[torch.Tensor, list[Union[torch.Tensor, None]]]:
diff --git a/vllm/lora/layers/base_linear.py b/vllm/lora/layers/base_linear.py
index ed294b0aedaf..0b5a4a73a94a 100644
--- a/vllm/lora/layers/base_linear.py
+++ b/vllm/lora/layers/base_linear.py
@@ -8,10 +8,14 @@
 
 from vllm.config.lora import LoRAConfig
 from vllm.distributed.utils import divide
+
 # yapf: disable
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               LinearBase, ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    LinearBase,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.platforms import current_platform
 
 from .base import BaseLayerWithLoRA
diff --git a/vllm/lora/layers/column_parallel_linear.py b/vllm/lora/layers/column_parallel_linear.py
index 6284576446c8..011d38157456 100644
--- a/vllm/lora/layers/column_parallel_linear.py
+++ b/vllm/lora/layers/column_parallel_linear.py
@@ -10,9 +10,11 @@
 from vllm.config.lora import LoRAConfig
 from vllm.distributed import tensor_model_parallel_all_gather
 from vllm.distributed.utils import divide
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               QKVParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+)
 from vllm.platforms import current_platform
 
 from .base_linear import BaseLinearLayerWithLoRA
@@ -20,12 +22,16 @@
 
 
 def _mcp_apply(x, bias, layer: "ColumnParallelLinearWithLoRA"):
-    """ 
-    For `ColumnParallelLinearWithLoRA` or classes that inherit from 
+    """
+    For `ColumnParallelLinearWithLoRA` or classes that inherit from
     `ColumnParallelLinearWithLoRA`, they share the same `apply` logic.
     """
-    assert (layer.n_slices == len(layer.lora_a_stacked) == len(
-        layer.lora_b_stacked) == len(layer.output_slices))
+    assert (
+        layer.n_slices
+        == len(layer.lora_a_stacked)
+        == len(layer.lora_b_stacked)
+        == len(layer.output_slices)
+    )
     if layer.lora_bias_stacked is not None:
         assert layer.n_slices == len(layer.lora_bias_stacked)
 
@@ -43,7 +49,8 @@ def _mcp_apply(x, bias, layer: "ColumnParallelLinearWithLoRA"):
     )
 
     shrunk_buffers: Optional[torch.Tensor] = layer.punica_wrapper.add_shrink(
-        buffers, x, layer.lora_a_stacked, 1.0)
+        buffers, x, layer.lora_a_stacked, 1.0
+    )
 
     if not current_platform.can_update_inplace():
         buffers = shrunk_buffers
@@ -57,7 +64,8 @@ def _mcp_apply(x, bias, layer: "ColumnParallelLinearWithLoRA"):
         layer.lora_bias_stacked,
         layer.output_slices,
         offset_start=0,
-        add_input=True)
+        add_input=True,
+    )
 
     if not current_platform.can_update_inplace():
         output = lora_output
@@ -81,8 +89,7 @@ def __init__(self, base_layer: ColumnParallelLinear) -> None:
         # The base_layer type is ColumnParallelLinear or
         # MergedColumnParallelLinear, their weight sharding logic is
         # inconsistent when TP is greater than 1.
-        self.is_merged_col_linear = type(
-            base_layer) is MergedColumnParallelLinear
+        self.is_merged_col_linear = type(base_layer) is MergedColumnParallelLinear
         self.output_size = self.base_layer.output_size_per_partition
         # There is only one LoRA layer
         self.n_slices = 1
@@ -97,10 +104,14 @@ def slice_lora_b(self, lora_b: torch.Tensor) -> torch.Tensor:
             shard_size = self.output_size // 2
             offset = lora_b.shape[0] // 2
 
-            left_weight = lora_b[self.tp_rank * shard_size:(self.tp_rank + 1) *
-                                 shard_size, :]
-            right_weight = lora_b[offset + self.tp_rank * shard_size:offset +
-                                  (self.tp_rank + 1) * shard_size, :]
+            left_weight = lora_b[
+                self.tp_rank * shard_size : (self.tp_rank + 1) * shard_size, :
+            ]
+            right_weight = lora_b[
+                offset + self.tp_rank * shard_size : offset
+                + (self.tp_rank + 1) * shard_size,
+                :,
+            ]
             lora_b = torch.cat([left_weight, right_weight], dim=0)
         # Applicable to cases where the base_layer is
         # ColumnParallelLinear.
@@ -133,8 +144,7 @@ def forward(
             - output
             - bias
         """
-        bias = (self.base_layer.bias
-                if not self.base_layer.skip_bias_add else None)
+        bias = self.base_layer.bias if not self.base_layer.skip_bias_add else None
 
         # Matrix multiply.
         output_parallel = self.apply(input_, bias)
@@ -147,8 +157,7 @@ def forward(
         if not self.base_layer.return_bias:
             return output
 
-        output_bias = (self.base_layer.bias
-                       if self.base_layer.skip_bias_add else None)
+        output_bias = self.base_layer.bias if self.base_layer.skip_bias_add else None
         return output, output_bias
 
     @classmethod
@@ -162,7 +171,8 @@ def can_replace_layer(
     ) -> bool:
         return type(source_layer) is ColumnParallelLinear or (
             type(source_layer) is MergedColumnParallelLinear
-            and len(packed_modules_list) == 1)
+            and len(packed_modules_list) == 1
+        )
 
 
 class MergedColumnParallelLinearWithLoRA(ColumnParallelLinearWithLoRA):
@@ -175,17 +185,18 @@ class MergedColumnParallelLinearWithLoRA(ColumnParallelLinearWithLoRA):
     """
 
     def __init__(
-        self, base_layer: Union[MergedColumnParallelLinear,
-                                QKVParallelLinear]) -> None:
+        self, base_layer: Union[MergedColumnParallelLinear, QKVParallelLinear]
+    ) -> None:
         super().__init__(base_layer)
         # There are two LoRA layers
         # the output_sizes in MergedColumnParallelLinear is not sharded by tp
         # we need to divide it by the tp_size to get correct slices size
         output_sizes = self.base_layer.output_sizes
         self.output_slices = tuple(
-            divide(output_size, self.tp_size) for output_size in output_sizes)
+            divide(output_size, self.tp_size) for output_size in output_sizes
+        )
         self.n_slices = len(self.output_slices)
-        self.output_ids = (self.tp_rank, ) * self.n_slices
+        self.output_ids = (self.tp_rank,) * self.n_slices
 
     def create_lora_weights(
         self,
@@ -194,14 +205,16 @@ def create_lora_weights(
         model_config: Optional[PretrainedConfig] = None,
     ) -> None:
         """
-        The main reason for overriding this function is to enhance  code 
+        The main reason for overriding this function is to enhance  code
         maintainability.
         """
         self.lora_config = lora_config
 
         lora_a_output_size_per_partition = (
-            lora_config.max_lora_rank if not lora_config.fully_sharded_loras
-            else divide(lora_config.max_lora_rank, self.tp_size))
+            lora_config.max_lora_rank
+            if not lora_config.fully_sharded_loras
+            else divide(lora_config.max_lora_rank, self.tp_size)
+        )
 
         self.lora_a_stacked = tuple(
             torch.zeros(
@@ -211,7 +224,9 @@ def create_lora_weights(
                 self.input_size,
                 dtype=lora_config.lora_dtype,
                 device=self.device,
-            ) for _ in range(self.n_slices))
+            )
+            for _ in range(self.n_slices)
+        )
         self.lora_b_stacked = tuple(
             torch.zeros(
                 max_loras,
@@ -220,7 +235,9 @@ def create_lora_weights(
                 lora_config.max_lora_rank,
                 dtype=lora_config.lora_dtype,
                 device=self.device,
-            ) for output_size in self.output_slices)
+            )
+            for output_size in self.output_slices
+        )
         if lora_config.bias_enabled:
             self.lora_bias_stacked = tuple(
                 torch.zeros(
@@ -229,7 +246,9 @@ def create_lora_weights(
                     output_size,
                     dtype=lora_config.lora_dtype,
                     device=self.device,
-                ) for output_size in self.output_slices)
+                )
+                for output_size in self.output_slices
+            )
 
     def slice_lora_a(
         self, lora_a: list[Union[torch.Tensor, None]]
@@ -241,20 +260,22 @@ def slice_lora_b(
     ) -> list[Union[torch.Tensor, None]]:
         sliced_lora_b = [None] * self.n_slices
         for i, (shard_id, shard_size) in enumerate(
-                zip(self.output_ids, self.output_slices)):
+            zip(self.output_ids, self.output_slices)
+        ):
             if (lora_b_i := lora_b[i]) is not None:
-                sliced_lora_b[i] = lora_b_i[shard_size * shard_id:shard_size *
-                                            (shard_id + 1), :]
+                sliced_lora_b[i] = lora_b_i[
+                    shard_size * shard_id : shard_size * (shard_id + 1), :
+                ]
         return sliced_lora_b
 
     def slice_bias(
-        self, bias: list[Union[torch.Tensor,
-                               None]]) -> list[Union[torch.Tensor, None]]:
+        self, bias: list[Union[torch.Tensor, None]]
+    ) -> list[Union[torch.Tensor, None]]:
         for i, (shard_id, shard_size) in enumerate(
-                zip(self.output_ids, self.output_slices)):
+            zip(self.output_ids, self.output_slices)
+        ):
             if (bias_i := bias[i]) is not None:
-                bias[i] = bias_i[shard_size * shard_id:shard_size *
-                                 (shard_id + 1)]
+                bias[i] = bias_i[shard_size * shard_id : shard_size * (shard_id + 1)]
         return bias
 
     def set_lora(
@@ -276,22 +297,22 @@ def set_lora(
         for i in range(self.n_slices):
             if (lora_a_i := lora_a[i]) is not None:
                 self.lora_a_stacked[i][
-                    index, 0, :lora_a_i.shape[0], :lora_a_i.shape[1]].copy_(
-                        lora_a_i, non_blocking=True)
+                    index, 0, : lora_a_i.shape[0], : lora_a_i.shape[1]
+                ].copy_(lora_a_i, non_blocking=True)
             if (lora_b_i := lora_b[i]) is not None:
                 self.lora_b_stacked[i][
-                    index, 0, :lora_b_i.shape[0], :lora_b_i.shape[1]].copy_(
-                        lora_b_i, non_blocking=True)
+                    index, 0, : lora_b_i.shape[0], : lora_b_i.shape[1]
+                ].copy_(lora_b_i, non_blocking=True)
 
         if lora_bias is not None:
-            self.lora_bias_stacked = cast(tuple[torch.Tensor, ...],
-                                          self.lora_bias_stacked)
+            self.lora_bias_stacked = cast(
+                tuple[torch.Tensor, ...], self.lora_bias_stacked
+            )
             for i in range(self.n_slices):
                 if (lora_bias_i := lora_bias[i]) is not None:
-                    self.lora_bias_stacked[i][index,
-                                              0, :lora_bias_i.shape[0]].copy_(
-                                                  lora_bias_i,
-                                                  non_blocking=True)
+                    self.lora_bias_stacked[i][index, 0, : lora_bias_i.shape[0]].copy_(
+                        lora_bias_i, non_blocking=True
+                    )
 
     @classmethod
     @_not_fully_sharded_can_replace
@@ -302,8 +323,10 @@ def can_replace_layer(
         packed_modules_list: list,
         model_config: Optional[PretrainedConfig],
     ) -> bool:
-        return (type(source_layer) is MergedColumnParallelLinear
-                and len(packed_modules_list) == 2)
+        return (
+            type(source_layer) is MergedColumnParallelLinear
+            and len(packed_modules_list) == 2
+        )
 
 
 class QKVParallelLinearWithLoRA(ColumnParallelLinearWithLoRA):
@@ -321,57 +344,70 @@ class QKVParallelLinearWithLoRA(ColumnParallelLinearWithLoRA):
 
     def __init__(self, base_layer: QKVParallelLinear) -> None:
         super().__init__(base_layer)
-        self.q_proj_total_size = (self.base_layer.total_num_heads *
-                                  self.base_layer.head_size)
-        self.q_proj_shard_size = (self.base_layer.num_heads *
-                                  self.base_layer.head_size)
-        self.kv_proj_shard_size = (self.base_layer.num_kv_heads *
-                                   self.base_layer.head_size)
-        self.kv_proj_total_size = (self.base_layer.total_num_kv_heads *
-                                   self.base_layer.head_size)
+        self.q_proj_total_size = (
+            self.base_layer.total_num_heads * self.base_layer.head_size
+        )
+        self.q_proj_shard_size = self.base_layer.num_heads * self.base_layer.head_size
+        self.kv_proj_shard_size = (
+            self.base_layer.num_kv_heads * self.base_layer.head_size
+        )
+        self.kv_proj_total_size = (
+            self.base_layer.total_num_kv_heads * self.base_layer.head_size
+        )
         # There is only one LoRA layer
         self.n_slices = 1
 
     def slice_lora_b(self, lora_b: torch.Tensor) -> torch.Tensor:
-
         self.q_shard_id = self.tp_rank
         self.kv_shard_id = self.tp_rank // self.base_layer.num_kv_head_replicas
-        lora_b_q = lora_b[self.q_proj_shard_size *
-                          self.q_shard_id:self.q_proj_shard_size *
-                          (self.q_shard_id + 1), :]
+        lora_b_q = lora_b[
+            self.q_proj_shard_size * self.q_shard_id : self.q_proj_shard_size
+            * (self.q_shard_id + 1),
+            :,
+        ]
         k_offset = self.q_proj_total_size
-        lora_b_k = lora_b[k_offset +
-                          self.kv_proj_shard_size * self.kv_shard_id:k_offset +
-                          self.kv_proj_shard_size * (self.kv_shard_id + 1), :]
+        lora_b_k = lora_b[
+            k_offset + self.kv_proj_shard_size * self.kv_shard_id : k_offset
+            + self.kv_proj_shard_size * (self.kv_shard_id + 1),
+            :,
+        ]
         v_offset = k_offset + self.kv_proj_total_size
-        lora_b_v = lora_b[v_offset +
-                          self.kv_proj_shard_size * self.kv_shard_id:v_offset +
-                          self.kv_proj_shard_size * (self.kv_shard_id + 1), :]
+        lora_b_v = lora_b[
+            v_offset + self.kv_proj_shard_size * self.kv_shard_id : v_offset
+            + self.kv_proj_shard_size * (self.kv_shard_id + 1),
+            :,
+        ]
         lora_b = torch.cat([lora_b_q, lora_b_k, lora_b_v], dim=0)
         return lora_b
 
     def slice_bias(self, bias: torch.Tensor) -> torch.Tensor:
-        bias_q = bias[self.q_proj_shard_size *
-                      self.q_shard_id:self.q_proj_shard_size *
-                      (self.q_shard_id + 1)]
+        bias_q = bias[
+            self.q_proj_shard_size * self.q_shard_id : self.q_proj_shard_size
+            * (self.q_shard_id + 1)
+        ]
         k_offset = self.q_proj_total_size
-        bias_k = bias[k_offset +
-                      self.kv_proj_shard_size * self.kv_shard_id:k_offset +
-                      self.kv_proj_shard_size * (self.kv_shard_id + 1)]
+        bias_k = bias[
+            k_offset + self.kv_proj_shard_size * self.kv_shard_id : k_offset
+            + self.kv_proj_shard_size * (self.kv_shard_id + 1)
+        ]
         v_offset = k_offset + self.kv_proj_total_size
-        bias_v = bias[v_offset +
-                      self.kv_proj_shard_size * self.kv_shard_id:v_offset +
-                      self.kv_proj_shard_size * (self.kv_shard_id + 1)]
+        bias_v = bias[
+            v_offset + self.kv_proj_shard_size * self.kv_shard_id : v_offset
+            + self.kv_proj_shard_size * (self.kv_shard_id + 1)
+        ]
         bias = torch.cat([bias_q, bias_k, bias_v], dim=1)
         return bias
 
     @classmethod
     @_not_fully_sharded_can_replace
-    def can_replace_layer(cls, source_layer: nn.Module,
-                          lora_config: LoRAConfig, packed_modules_list: list,
-                          model_config: Optional[PretrainedConfig]) -> bool:
-        return type(source_layer) is QKVParallelLinear and len(
-            packed_modules_list) == 1
+    def can_replace_layer(
+        cls,
+        source_layer: nn.Module,
+        lora_config: LoRAConfig,
+        packed_modules_list: list,
+        model_config: Optional[PretrainedConfig],
+    ) -> bool:
+        return type(source_layer) is QKVParallelLinear and len(packed_modules_list) == 1
 
 
 class MergedQKVParallelLinearWithLoRA(MergedColumnParallelLinearWithLoRA):
@@ -390,10 +426,10 @@ def __init__(self, base_layer: QKVParallelLinear) -> None:
         # There are three LoRA layer.
         self.n_slices = len(self.base_layer.output_sizes)
 
-        self.q_proj_shard_size = (self.base_layer.num_heads *
-                                  self.base_layer.head_size)
-        self.kv_proj_shard_size = (self.base_layer.num_kv_heads *
-                                   self.base_layer.head_size)
+        self.q_proj_shard_size = self.base_layer.num_heads * self.base_layer.head_size
+        self.kv_proj_shard_size = (
+            self.base_layer.num_kv_heads * self.base_layer.head_size
+        )
         self.q_shard_id = self.tp_rank
         self.kv_shard_id = self.tp_rank // self.base_layer.num_kv_head_replicas
 
@@ -415,7 +451,7 @@ def create_lora_weights(
         model_config: Optional[PretrainedConfig] = None,
     ) -> None:
         """
-        The main reason for overloading this function is to handle inconsistent 
+        The main reason for overloading this function is to handle inconsistent
         weight dimensions in qkv lora.
         """
         super().create_lora_weights(max_loras, lora_config, model_config)
@@ -429,8 +465,7 @@ def can_replace_layer(
         packed_modules_list: list,
         model_config: Optional[PretrainedConfig],
     ) -> bool:
-        return (type(source_layer) is QKVParallelLinear
-                and len(packed_modules_list) == 3)
+        return type(source_layer) is QKVParallelLinear and len(packed_modules_list) == 3
 
 
 # These following layers are based on the tensor parallelism strategy given in
@@ -453,12 +488,12 @@ class ColumnParallelLinearWithShardedLoRA(ColumnParallelLinearWithLoRA):
     def slice_lora_a(self, lora_a: torch.Tensor) -> torch.Tensor:
         shard_size = self.lora_a_stacked[0].shape[2]
         start_idx = self.tp_rank * shard_size
-        lora_a = lora_a[start_idx:start_idx + shard_size, :]
+        lora_a = lora_a[start_idx : start_idx + shard_size, :]
         return lora_a
 
-    def apply(self,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self, x: torch.Tensor, bias: Optional[torch.Tensor] = None
+    ) -> torch.Tensor:
         return _mcp_apply(x, bias, self)
 
     @classmethod
@@ -480,8 +515,7 @@ def can_replace_layer(
         )
 
 
-class MergedColumnParallelLinearWithShardedLoRA(
-        MergedColumnParallelLinearWithLoRA):
+class MergedColumnParallelLinearWithShardedLoRA(MergedColumnParallelLinearWithLoRA):
     """
     Differs from MergedColumnParallelLinearWithLoRA by slicing the
     LoRA A's also.
@@ -492,20 +526,22 @@ class MergedColumnParallelLinearWithShardedLoRA(
     def slice_lora_a(
         self, lora_a: list[Union[torch.Tensor, None]]
     ) -> list[Union[torch.Tensor, None]]:
-        #NOTE: lora_a contains 2 subloras, and each sublora could be None.
+        # NOTE: lora_a contains 2 subloras, and each sublora could be None.
         output_shard_size = self.lora_a_stacked[0].shape[2]
         output_start_idx = self.tp_rank * output_shard_size
         lora_a = [
-            lora_a[0][output_start_idx:output_start_idx +
-                      output_shard_size, :] if lora_a[0] is not None else None,
-            lora_a[1][output_start_idx:output_start_idx +
-                      output_shard_size, :] if lora_a[1] is not None else None,
+            lora_a[0][output_start_idx : output_start_idx + output_shard_size, :]
+            if lora_a[0] is not None
+            else None,
+            lora_a[1][output_start_idx : output_start_idx + output_shard_size, :]
+            if lora_a[1] is not None
+            else None,
         ]
         return lora_a
 
-    def apply(self,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self, x: torch.Tensor, bias: Optional[torch.Tensor] = None
+    ) -> torch.Tensor:
         return _mcp_apply(x, bias, self)
 
     @classmethod
@@ -538,19 +574,23 @@ class QKVParallelLinearWithShardedLoRA(QKVParallelLinearWithLoRA):
     def slice_lora_a(self, lora_a: torch.Tensor) -> torch.Tensor:
         shard_size = self.lora_a_stacked[0].shape[2]
         start_idx = self.tp_rank * shard_size
-        lora_a = lora_a[start_idx:start_idx + shard_size, :]
+        lora_a = lora_a[start_idx : start_idx + shard_size, :]
         return lora_a
 
-    def apply(self,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self, x: torch.Tensor, bias: Optional[torch.Tensor] = None
+    ) -> torch.Tensor:
         return _mcp_apply(x, bias, self)
 
     @classmethod
     @_fully_sharded_can_replace
-    def can_replace_layer(cls, source_layer: nn.Module,
-                          lora_config: LoRAConfig, packed_modules_list: list,
-                          model_config: Optional[PretrainedConfig]) -> bool:
+    def can_replace_layer(
+        cls,
+        source_layer: nn.Module,
+        lora_config: LoRAConfig,
+        packed_modules_list: list,
+        model_config: Optional[PretrainedConfig],
+    ) -> bool:
         # specifying kwargs so they can be easily accessed in decorator
         return super().can_replace_layer(
             source_layer=source_layer,
@@ -563,7 +603,7 @@ def can_replace_layer(cls, source_layer: nn.Module,
 
 class MergedQKVParallelLinearWithShardedLoRA(MergedQKVParallelLinearWithLoRA):
     """
-    Differs from MergedQKVParallelLinearWithLoRA by slicing the 
+    Differs from MergedQKVParallelLinearWithLoRA by slicing the
     LoRA A's also.
 
     Based on S-LoRA, slicing happens along the rank dim.
@@ -576,18 +616,21 @@ def slice_lora_a(
         shard_size = [self.lora_a_stacked[i].shape[2] for i in range(3)]
         start_idx = [self.tp_rank * shard_size[i] for i in range(3)]
         lora_a = [
-            lora_a[0][start_idx[0]:start_idx[0] +
-                      shard_size[0], :] if lora_a[0] is not None else None,
-            lora_a[1][start_idx[1]:start_idx[1] +
-                      shard_size[1], :] if lora_a[1] is not None else None,
-            lora_a[2][start_idx[2]:start_idx[2] +
-                      shard_size[2], :] if lora_a[2] is not None else None,
+            lora_a[0][start_idx[0] : start_idx[0] + shard_size[0], :]
+            if lora_a[0] is not None
+            else None,
+            lora_a[1][start_idx[1] : start_idx[1] + shard_size[1], :]
+            if lora_a[1] is not None
+            else None,
+            lora_a[2][start_idx[2] : start_idx[2] + shard_size[2], :]
+            if lora_a[2] is not None
+            else None,
         ]
         return lora_a
 
-    def apply(self,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self, x: torch.Tensor, bias: Optional[torch.Tensor] = None
+    ) -> torch.Tensor:
         return _mcp_apply(x, bias, self)
 
     @classmethod
diff --git a/vllm/lora/layers/logits_processor.py b/vllm/lora/layers/logits_processor.py
index b8fbad3a4af0..4f30c9db4c67 100644
--- a/vllm/lora/layers/logits_processor.py
+++ b/vllm/lora/layers/logits_processor.py
@@ -9,11 +9,12 @@
 from transformers import PretrainedConfig
 
 from vllm.config.lora import LoRAConfig
-from vllm.distributed import (get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size)
+from vllm.distributed import (
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.platforms import current_platform
 
 from .base import BaseLayerWithLoRA
@@ -34,9 +35,14 @@ class LogitsProcessorWithLoRA(BaseLayerWithLoRA):
             no reindexing will be done.
     """
 
-    def __init__(self, base_layer: LogitsProcessor, hidden_size: int,
-                 dtype: torch.dtype, device: torch.device,
-                 sharded_to_full_mapping: Optional[list[int]]) -> None:
+    def __init__(
+        self,
+        base_layer: LogitsProcessor,
+        hidden_size: int,
+        dtype: torch.dtype,
+        device: torch.device,
+        sharded_to_full_mapping: Optional[list[int]],
+    ) -> None:
         super().__init__()
         self.base_layer = base_layer
         self.hidden_size = hidden_size
@@ -86,8 +92,9 @@ def create_lora_weights(
     ) -> None:
         # TODO: Verify if this condition can be further relaxed
         if 32000 < self.base_layer.vocab_size > 257024:
-            raise ValueError("When using LoRA, vocab size must be "
-                             "32000 >= vocab_size <= 257024")
+            raise ValueError(
+                "When using LoRA, vocab size must be 32000 >= vocab_size <= 257024"
+            )
         self.lora_a_stacked = torch.zeros(
             (
                 max_loras,
@@ -103,9 +110,10 @@ def create_lora_weights(
                 max_loras,
                 1,
                 # Pad for kernel compatibility
-                math.ceil(self.base_layer.vocab_size /
-                          lora_config.lora_vocab_padding_size) *
-                lora_config.lora_vocab_padding_size,
+                math.ceil(
+                    self.base_layer.vocab_size / lora_config.lora_vocab_padding_size
+                )
+                * lora_config.lora_vocab_padding_size,
                 lora_config.max_lora_rank,
             ),
             dtype=lora_config.lora_dtype,
@@ -119,9 +127,8 @@ def create_lora_weights(
         )
         if self.sharded_to_full_mapping is not None:
             self.sharded_to_full_mapping_gpu = torch.tensor(
-                self.sharded_to_full_mapping,
-                device=self.device,
-                dtype=torch.long)
+                self.sharded_to_full_mapping, device=self.device, dtype=torch.long
+            )
         else:
             self.sharded_to_full_mapping_gpu = None
 
@@ -139,17 +146,17 @@ def set_lora(
         bias: Optional[torch.Tensor] = None,
     ):
         self.reset_lora(index)
-        self.lora_a_stacked[index,
-                            0, :lora_a.shape[0], :lora_a.shape[1]].copy_(
-                                lora_a, non_blocking=True)
-        self.lora_b_stacked[index,
-                            0, :lora_b.shape[0], :lora_b.shape[1]].copy_(
-                                lora_b, non_blocking=True)
+        self.lora_a_stacked[index, 0, : lora_a.shape[0], : lora_a.shape[1]].copy_(
+            lora_a, non_blocking=True
+        )
+        self.lora_b_stacked[index, 0, : lora_b.shape[0], : lora_b.shape[1]].copy_(
+            lora_b, non_blocking=True
+        )
         if embeddings_tensor is not None:
             self.embeddings_tensors[
                 index,
-                :embeddings_tensor.shape[0],
-                :embeddings_tensor.shape[1],
+                : embeddings_tensor.shape[0],
+                : embeddings_tensor.shape[1],
             ] = embeddings_tensor
 
     def _get_logits(
@@ -195,41 +202,41 @@ def _get_logits(
             dtype=self.embeddings_tensors.dtype,
             device=self.embeddings_tensors.device,
         )
-        torch.matmul(self.embeddings_tensors,
-                     hidden_states.T,
-                     out=lora_logits[:-1])
+        torch.matmul(self.embeddings_tensors, hidden_states.T, out=lora_logits[:-1])
 
-        neg_inf, pos_inf = current_platform.get_infinity_values(
-            lora_logits.dtype)
+        neg_inf, pos_inf = current_platform.get_infinity_values(lora_logits.dtype)
 
         lora_logits[-1] = neg_inf
         lora_logits = lora_logits.mT
         indices_padded = self.punica_wrapper.sampler_indices_padded
 
         if current_platform.is_tpu() or current_platform.is_xpu():
-            indices_padded = indices_padded[:logits.size(0)]
-
-        lora_logits = (lora_logits.reshape(
-            lora_logits.shape[0] * lora_logits.shape[1],
-            lora_logits.shape[2],
-        ).index_select(0, indices_padded).nan_to_num_(nan=neg_inf,
-                                                      posinf=pos_inf,
-                                                      neginf=neg_inf))
+            indices_padded = indices_padded[: logits.size(0)]
+
+        lora_logits = (
+            lora_logits.reshape(
+                lora_logits.shape[0] * lora_logits.shape[1],
+                lora_logits.shape[2],
+            )
+            .index_select(0, indices_padded)
+            .nan_to_num_(nan=neg_inf, posinf=pos_inf, neginf=neg_inf)
+        )
 
-        logits[:,
-               self.base_layer.org_vocab_size:self.base_layer.org_vocab_size +
-               lora_logits.shape[1]] = lora_logits
+        logits[
+            :,
+            self.base_layer.org_vocab_size : self.base_layer.org_vocab_size
+            + lora_logits.shape[1],
+        ] = lora_logits
 
-        lora_output: Optional[
-            torch.Tensor] = self.punica_wrapper.add_lora_logits(
-                logits, hidden_states, self.lora_a_stacked,
-                self.lora_b_stacked, 1.0)
+        lora_output: Optional[torch.Tensor] = self.punica_wrapper.add_lora_logits(
+            logits, hidden_states, self.lora_a_stacked, self.lora_b_stacked, 1.0
+        )
 
         if not current_platform.can_update_inplace():
             logits = lora_output
 
         # Remove paddings in vocab (if any).
-        logits = logits[:, :self.base_layer.vocab_size]
+        logits = logits[:, : self.base_layer.vocab_size]
         return logits
 
     def forward(self, *args, **kwargs):
diff --git a/vllm/lora/layers/qkv_x_parallel_linear.py b/vllm/lora/layers/qkv_x_parallel_linear.py
index 367482d0ee07..785cdf38e360 100644
--- a/vllm/lora/layers/qkv_x_parallel_linear.py
+++ b/vllm/lora/layers/qkv_x_parallel_linear.py
@@ -3,6 +3,6 @@
 from .base import BaseLayerWithLoRA
 
 
-#TODO: Implement this
+# TODO: Implement this
 class QKVCrossParallelLinearWithLoRA(BaseLayerWithLoRA):
     pass
diff --git a/vllm/lora/layers/replicated_linear.py b/vllm/lora/layers/replicated_linear.py
index 18a8f13ed942..18a35cd1e0f2 100644
--- a/vllm/lora/layers/replicated_linear.py
+++ b/vllm/lora/layers/replicated_linear.py
@@ -14,9 +14,10 @@
 
 
 class ReplicatedLinearWithLoRA(BaseLinearLayerWithLoRA):
-
     def __init__(self, base_layer: ReplicatedLinear) -> None:
-        super().__init__(base_layer, )
+        super().__init__(
+            base_layer,
+        )
         # To ensure interface compatibility, set to 1 always.
         self.output_size = self.base_layer.output_size
         self.n_slices = 1
@@ -33,14 +34,12 @@ def forward(
             - output
             - bias
         """
-        bias = (self.base_layer.bias
-                if not self.base_layer.skip_bias_add else None)
+        bias = self.base_layer.bias if not self.base_layer.skip_bias_add else None
 
         # Matrix multiply.
         output = self.apply(input_, bias)
 
-        output_bias = (self.base_layer.bias
-                       if self.base_layer.skip_bias_add else None)
+        output_bias = self.base_layer.bias if self.base_layer.skip_bias_add else None
 
         if not self.base_layer.return_bias:
             return output
diff --git a/vllm/lora/layers/row_parallel_linear.py b/vllm/lora/layers/row_parallel_linear.py
index d468655e629a..4e6b65ca97e4 100644
--- a/vllm/lora/layers/row_parallel_linear.py
+++ b/vllm/lora/layers/row_parallel_linear.py
@@ -8,8 +8,11 @@
 from transformers import PretrainedConfig
 
 from vllm.config.lora import LoRAConfig
-from vllm.distributed import (split_tensor_along_last_dim,
-                              tensor_model_parallel_all_reduce)
+from vllm.distributed import (
+    split_tensor_along_last_dim,
+    tensor_model_parallel_all_reduce,
+)
+
 # yapf: disable
 from vllm.model_executor.layers.linear import RowParallelLinear
 from vllm.platforms import current_platform
diff --git a/vllm/lora/layers/utils.py b/vllm/lora/layers/utils.py
index 772d32a44c22..2da90f180ee7 100644
--- a/vllm/lora/layers/utils.py
+++ b/vllm/lora/layers/utils.py
@@ -45,8 +45,7 @@ def _not_fully_sharded_can_replace(can_replace):
 
     def dec(*args, **kwargs):
         decorate = kwargs.pop("decorate") if "decorate" in kwargs else True
-        condition = (not kwargs["lora_config"].fully_sharded_loras
-                     if decorate else True)
+        condition = not kwargs["lora_config"].fully_sharded_loras if decorate else True
         return can_replace(*args, **kwargs) and condition
 
     return dec
@@ -59,7 +58,8 @@ def _fully_sharded_can_replace(can_replace):
     """
 
     def dec(*args, **kwargs):
-        return (can_replace(*args, **kwargs)
-                and kwargs["lora_config"].fully_sharded_loras)
+        return (
+            can_replace(*args, **kwargs) and kwargs["lora_config"].fully_sharded_loras
+        )
 
     return dec
diff --git a/vllm/lora/layers/vocal_parallel_embedding.py b/vllm/lora/layers/vocal_parallel_embedding.py
index ca01c7e17fff..026089994d99 100644
--- a/vllm/lora/layers/vocal_parallel_embedding.py
+++ b/vllm/lora/layers/vocal_parallel_embedding.py
@@ -9,15 +9,13 @@
 from transformers import PretrainedConfig
 
 from vllm.config.lora import LoRAConfig
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.platforms import current_platform
 
 from .base import BaseLayerWithLoRA
 
 
 class VocabParallelEmbeddingWithLoRA(BaseLayerWithLoRA):
-
     def __init__(self, base_layer: VocabParallelEmbedding) -> None:
         super().__init__()
         self.base_layer = base_layer
@@ -25,24 +23,26 @@ def __init__(self, base_layer: VocabParallelEmbedding) -> None:
         self.embeddings_weights: Optional[torch.Tensor]
 
     def create_lora_weights(
-            self,
-            max_loras: int,
-            lora_config: LoRAConfig,
-            model_config: Optional[PretrainedConfig] = None) -> None:
-
+        self,
+        max_loras: int,
+        lora_config: LoRAConfig,
+        model_config: Optional[PretrainedConfig] = None,
+    ) -> None:
         if self.base_layer.num_added_embeddings_per_partition > 0:
             # We can start adding lora weights
             self.embeddings_weights = self.base_layer.weight.data[
-                self.base_layer.num_org_embeddings_per_partition:self.
-                base_layer.num_org_embeddings_per_partition +
-                self.base_layer.num_added_embeddings_per_partition]
+                self.base_layer.num_org_embeddings_per_partition : self.base_layer.num_org_embeddings_per_partition
+                + self.base_layer.num_added_embeddings_per_partition
+            ]
             self.embeddings_slice = (
-                self.base_layer.shard_indices.added_vocab_start_index -
-                self.base_layer.org_vocab_size,
-                self.base_layer.shard_indices.added_vocab_end_index -
-                self.base_layer.org_vocab_size)
+                self.base_layer.shard_indices.added_vocab_start_index
+                - self.base_layer.org_vocab_size,
+                self.base_layer.shard_indices.added_vocab_end_index
+                - self.base_layer.org_vocab_size,
+            )
             self.base_layer.weight.data[
-                self.base_layer.num_org_embeddings_per_partition:].fill_(0)
+                self.base_layer.num_org_embeddings_per_partition :
+            ].fill_(0)
         else:
             self.embeddings_slice = None
             self.embeddings_weights = None
@@ -59,8 +59,7 @@ def create_lora_weights(
         self.lora_a_stacked = torch.zeros(
             (
                 max_loras,
-                self.base_layer.org_vocab_size +
-                lora_config.lora_extra_vocab_size,
+                self.base_layer.org_vocab_size + lora_config.lora_extra_vocab_size,
                 lora_config.max_lora_rank,
             ),
             dtype=lora_config.lora_dtype,
@@ -97,31 +96,30 @@ def set_lora(
         self.reset_lora(index)
         # NOTE self.lora_a_stacked is row-major, and lora_a is col-major,
         # so we need transpose here
-        self.lora_a_stacked[index, :lora_a.shape[1], :lora_a.shape[0]].copy_(
-            lora_a.T, non_blocking=True)
-        self.lora_b_stacked[index,
-                            0, :lora_b.shape[0], :lora_b.shape[1]].copy_(
-                                lora_b, non_blocking=True)
+        self.lora_a_stacked[index, : lora_a.shape[1], : lora_a.shape[0]].copy_(
+            lora_a.T, non_blocking=True
+        )
+        self.lora_b_stacked[index, 0, : lora_b.shape[0], : lora_b.shape[1]].copy_(
+            lora_b, non_blocking=True
+        )
         if embeddings_tensor is not None:
             self.embeddings_tensors[
                 index,
-                :embeddings_tensor.shape[0],
-                :embeddings_tensor.shape[1],
+                : embeddings_tensor.shape[0],
+                : embeddings_tensor.shape[1],
             ].copy_(embeddings_tensor, non_blocking=True)
             if self.embeddings_slice is not None:
                 # TODO(yard1): Optimize this copy, we don't need to copy
                 # everything, just the modified part
                 embeddings = self.embeddings_tensors.view(
-                    self.embeddings_tensors.shape[0] *
-                    self.embeddings_tensors.shape[1],
+                    self.embeddings_tensors.shape[0] * self.embeddings_tensors.shape[1],
                     self.embeddings_tensors.shape[2],
-                )[self.embeddings_slice[0]:self.embeddings_slice[1]]
+                )[self.embeddings_slice[0] : self.embeddings_slice[1]]
                 assert self.embeddings_weights is not None
-                self.embeddings_weights[:embeddings.shape[0]].copy_(embeddings)
+                self.embeddings_weights[: embeddings.shape[0]].copy_(embeddings)
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
-        added_tokens_mask = torch.where(x > self.base_layer.org_vocab_size - 1,
-                                        1, 0)
+        added_tokens_mask = torch.where(x > self.base_layer.org_vocab_size - 1, 1, 0)
 
         # NB: Don't use torch.narrow here. torch.narrow triggers some
         # Dynamic Shape specialization in torch.compile
@@ -133,26 +131,22 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
             x + indices_1,
             self.lora_a_stacked_2d,
         )
-        full_output = self.base_layer.forward(x +
-                                              (indices_0 * added_tokens_mask))
+        full_output = self.base_layer.forward(x + (indices_0 * added_tokens_mask))
 
         full_output_org = full_output
         if full_output.ndim == 3:
             full_output = full_output.view(
-                full_output.shape[0] * full_output.shape[1], -1)
+                full_output.shape[0] * full_output.shape[1], -1
+            )
         if full_lora_a_embeddings.ndim == 3:
             full_lora_a_embeddings = full_lora_a_embeddings.view(
-                full_lora_a_embeddings.shape[0] *
-                full_lora_a_embeddings.shape[1],
+                full_lora_a_embeddings.shape[0] * full_lora_a_embeddings.shape[1],
                 -1,
             )
 
-        lora_output: Optional[
-            torch.Tensor] = self.punica_wrapper.add_lora_embedding(
-                full_output,
-                full_lora_a_embeddings,
-                self.lora_b_stacked,
-                add_input=True)
+        lora_output: Optional[torch.Tensor] = self.punica_wrapper.add_lora_embedding(
+            full_output, full_lora_a_embeddings, self.lora_b_stacked, add_input=True
+        )
 
         if not current_platform.can_update_inplace():
             full_output = lora_output
diff --git a/vllm/lora/lora_weights.py b/vllm/lora/lora_weights.py
index 90e18217d28b..d502c8eb543f 100644
--- a/vllm/lora/lora_weights.py
+++ b/vllm/lora/lora_weights.py
@@ -60,8 +60,9 @@ def is_packed(self) -> bool:
 
     @property
     def extra_vocab_size(self) -> int:
-        return self.embeddings_tensor.shape[
-            0] if self.embeddings_tensor is not None else 0
+        return (
+            self.embeddings_tensor.shape[0] if self.embeddings_tensor is not None else 0
+        )
 
     @classmethod
     def from_config(
@@ -70,44 +71,54 @@ def from_config(
         peft_helper: PEFTHelper,
         embeddings_tensor: Optional[torch.Tensor] = None,
     ) -> "LoRALayerWeights":
-        return cls(module_name, peft_helper.r, peft_helper.lora_alpha, None,
-                   None, None, embeddings_tensor,
-                   peft_helper.vllm_lora_scaling_factor)
+        return cls(
+            module_name,
+            peft_helper.r,
+            peft_helper.lora_alpha,
+            None,
+            None,
+            None,
+            embeddings_tensor,
+            peft_helper.vllm_lora_scaling_factor,
+        )
 
     @classmethod
     def create_dummy_lora_weights(
-            cls,
-            module_name: str,
-            input_dim: int,
-            output_dim: int,
-            rank: int,
-            dtype: torch.dtype,
-            device: torch.types.Device,
-            embeddings_tensor_dim: Optional[int] = None,
-            bias_enabled: Optional[bool] = False) -> "LoRALayerWeights":
+        cls,
+        module_name: str,
+        input_dim: int,
+        output_dim: int,
+        rank: int,
+        dtype: torch.dtype,
+        device: torch.types.Device,
+        embeddings_tensor_dim: Optional[int] = None,
+        bias_enabled: Optional[bool] = False,
+    ) -> "LoRALayerWeights":
         pin_memory = str(device) == "cpu" and is_pin_memory_available()
-        lora_a = torch.zeros([rank, input_dim],
-                             dtype=dtype,
-                             device=device,
-                             pin_memory=pin_memory)
-        lora_b = torch.zeros([output_dim, rank],
-                             dtype=dtype,
-                             device=device,
-                             pin_memory=pin_memory)
+        lora_a = torch.zeros(
+            [rank, input_dim], dtype=dtype, device=device, pin_memory=pin_memory
+        )
+        lora_b = torch.zeros(
+            [output_dim, rank], dtype=dtype, device=device, pin_memory=pin_memory
+        )
         if bias_enabled:
-            bias = torch.zeros([output_dim],
-                               dtype=dtype,
-                               device=device,
-                               pin_memory=pin_memory)
+            bias = torch.zeros(
+                [output_dim], dtype=dtype, device=device, pin_memory=pin_memory
+            )
         else:
             bias = None
 
-        embeddings_tensor = torch.rand(
-            10,
-            embeddings_tensor_dim,
-            dtype=dtype,
-            device=device,
-            pin_memory=pin_memory) if embeddings_tensor_dim else None
+        embeddings_tensor = (
+            torch.rand(
+                10,
+                embeddings_tensor_dim,
+                dtype=dtype,
+                device=device,
+                pin_memory=pin_memory,
+            )
+            if embeddings_tensor_dim
+            else None
+        )
         return cls(
             module_name,
             rank=rank,
@@ -174,7 +185,8 @@ def pack(
             scaling=[
                 1 if lora is not None else None  # type: ignore
                 for lora in loras
-            ])
+            ],
+        )
         return obj
 
     def optimize(self) -> "PackedLoRALayerWeights":
diff --git a/vllm/lora/models.py b/vllm/lora/models.py
index cc64cc78affa..edf34b483e9a 100644
--- a/vllm/lora/models.py
+++ b/vllm/lora/models.py
@@ -17,10 +17,14 @@
 from vllm.lora.lora_weights import LoRALayerWeights, PackedLoRALayerWeights
 from vllm.lora.peft_helper import PEFTHelper
 from vllm.lora.punica_wrapper import get_punica_wrapper
-from vllm.lora.utils import (from_layer, from_layer_logits_processor,
-                             get_supported_lora_modules,
-                             is_regex_target_modules,
-                             parse_fine_tuned_lora_name, replace_submodule)
+from vllm.lora.utils import (
+    from_layer,
+    from_layer_logits_processor,
+    get_supported_lora_modules,
+    is_regex_target_modules,
+    parse_fine_tuned_lora_name,
+    replace_submodule,
+)
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.model_loader.tensorizer import TensorizerConfig
 from vllm.model_executor.models import SupportsLoRA, supports_multimodal
@@ -36,7 +40,6 @@
 
 
 class AdapterLRUCache(LRUCache[int, T]):
-
     def __init__(self, capacity: int, deactivate_fn: Callable[[int], object]):
         super().__init__(capacity)
         self.deactivate_fn = deactivate_fn
@@ -62,7 +65,8 @@ def is_moe_model(model: nn.Module) -> bool:
         logger.warning_once(
             "For MoE models, vLLM currently does not support fused MoE LoRA "
             "inference. Please ensure that the loaded LoRA model does not "
-            "contain expert weights.")
+            "contain expert weights."
+        )
         return True
     return False
 
@@ -85,9 +89,9 @@ def __init__(
         """
         self.id = lora_model_id
 
-        assert (
-            lora_model_id
-            > 0), f"a valid lora id should be greater than 0, got {self.id}"
+        assert lora_model_id > 0, (
+            f"a valid lora id should be greater than 0, got {self.id}"
+        )
         self.rank = rank
         self.loras: dict[str, LoRALayerWeights] = loras
 
@@ -103,8 +107,11 @@ def clone(self, lora_model_id: int) -> "LoRAModel":
 
     @property
     def extra_vocab_size(self) -> int:
-        return max(lora.extra_vocab_size
-                   for lora in self.loras.values()) if self.loras else 0
+        return (
+            max(lora.extra_vocab_size for lora in self.loras.values())
+            if self.loras
+            else 0
+        )
 
     def get_lora(self, module_name: str) -> Optional[LoRALayerWeights]:
         """Get LoRA for a given module by name"""
@@ -133,23 +140,24 @@ def from_lora_tensors(
         loras: dict[str, LoRALayerWeights] = {}
         for tensor_name, tensor in tensors.items():
             module_name, is_lora_a, is_bias = parse_fine_tuned_lora_name(
-                tensor_name, weights_mapper)
+                tensor_name, weights_mapper
+            )
             if module_name not in loras:
                 lora_embeddings_tensor = None
                 if embeddings:
                     assert embedding_modules is not None
                     embeddings_module = next(
-                        (k for k in embedding_modules if k in module_name),
-                        None)
+                        (k for k in embedding_modules if k in module_name), None
+                    )
                     if embeddings_module:
                         lora_embeddings_tensor = embeddings[
-                            embedding_modules[embeddings_module]].to(
-                                device=device, dtype=dtype)
+                            embedding_modules[embeddings_module]
+                        ].to(device=device, dtype=dtype)
                         if pin_memory:
-                            lora_embeddings_tensor = (
-                                lora_embeddings_tensor.pin_memory())
+                            lora_embeddings_tensor = lora_embeddings_tensor.pin_memory()
                 loras[module_name] = LoRALayerWeights.from_config(
-                    module_name, peft_helper, lora_embeddings_tensor)
+                    module_name, peft_helper, lora_embeddings_tensor
+                )
 
             if is_bias:
                 loras[module_name].bias = tensor.to(device=device, dtype=dtype)
@@ -158,26 +166,24 @@ def from_lora_tensors(
                     bias = bias.pin_memory()
                 loras[module_name].bias = bias
             elif is_lora_a:
-                loras[module_name].lora_a = tensor.to(device=device,
-                                                      dtype=dtype)
+                loras[module_name].lora_a = tensor.to(device=device, dtype=dtype)
                 if pin_memory:
-                    loras[module_name].lora_a = loras[
-                        module_name].lora_a.pin_memory()
+                    loras[module_name].lora_a = loras[module_name].lora_a.pin_memory()
             else:
-                loras[module_name].lora_b = tensor.to(device=device,
-                                                      dtype=dtype)
+                loras[module_name].lora_b = tensor.to(device=device, dtype=dtype)
                 assert embedding_padding_modules is not None
-                if any(name in module_name
-                       for name in embedding_padding_modules
-                       ) and target_embedding_padding is not None:
+                if (
+                    any(name in module_name for name in embedding_padding_modules)
+                    and target_embedding_padding is not None
+                ):
                     lora_b = loras[module_name].lora_b
                     assert target_embedding_padding >= lora_b.shape[0]
                     addition = target_embedding_padding - lora_b.shape[0]
                     loras[module_name].lora_b = torch.nn.functional.pad(
-                        lora_b, (0, 0, 0, addition))
+                        lora_b, (0, 0, 0, addition)
+                    )
                 if pin_memory:
-                    loras[module_name].lora_b = loras[
-                        module_name].lora_b.pin_memory()
+                    loras[module_name].lora_b = loras[module_name].lora_b.pin_memory()
 
         for lora in loras.values():
             lora.optimize()
@@ -186,19 +192,20 @@ def from_lora_tensors(
 
     @classmethod
     def from_local_checkpoint(
-            cls,
-            lora_dir: str,
-            expected_lora_modules: list[str],
-            peft_helper: PEFTHelper,
-            *,
-            lora_model_id: Optional[int] = None,
-            device: str = "cuda",
-            dtype: Optional[torch.dtype] = None,
-            target_embedding_padding: Optional[int] = None,
-            embedding_modules: Optional[dict[str, str]] = None,
-            embedding_padding_modules: Optional[list[str]] = None,
-            weights_mapper: Optional[WeightsMapper] = None,
-            tensorizer_config_dict: Optional[dict] = None) -> "LoRAModel":
+        cls,
+        lora_dir: str,
+        expected_lora_modules: list[str],
+        peft_helper: PEFTHelper,
+        *,
+        lora_model_id: Optional[int] = None,
+        device: str = "cuda",
+        dtype: Optional[torch.dtype] = None,
+        target_embedding_padding: Optional[int] = None,
+        embedding_modules: Optional[dict[str, str]] = None,
+        embedding_padding_modules: Optional[list[str]] = None,
+        weights_mapper: Optional[WeightsMapper] = None,
+        tensorizer_config_dict: Optional[dict] = None,
+    ) -> "LoRAModel":
         """Create a LoRAModel from a local checkpoint.
 
         Args:
@@ -218,16 +225,17 @@ def from_local_checkpoint(
         lora_bin_file_path = os.path.join(lora_dir, "adapter_model.bin")
         lora_pt_file_path = os.path.join(lora_dir, "adapter_model.pt")
         new_embeddings_tensor_path = os.path.join(
-            lora_dir, "new_embeddings.safetensors")
-        new_embeddings_bin_file_path = os.path.join(lora_dir,
-                                                    "new_embeddings.bin")
+            lora_dir, "new_embeddings.safetensors"
+        )
+        new_embeddings_bin_file_path = os.path.join(lora_dir, "new_embeddings.bin")
         tensors: dict[str, torch.Tensor] = {}
         unexpected_modules: list[Union[list[str], str]] = []
 
         def check_unexpected_modules(modules: dict):
             for lora_module in modules.keys():  # noqa
                 module_name, _, _ = parse_fine_tuned_lora_name(
-                    lora_module, weights_mapper)
+                    lora_module, weights_mapper
+                )
                 part_name = module_name.split(".")[-1]
                 if part_name not in expected_lora_modules:
                     unexpected_modules.append(module_name)
@@ -236,19 +244,22 @@ def check_unexpected_modules(modules: dict):
                     f"While loading {lora_dir}, expected"
                     f" target modules in {expected_lora_modules}"
                     f" but received {unexpected_modules}."
-                    f" Please verify that the loaded LoRA module is correct")
+                    f" Please verify that the loaded LoRA module is correct"
+                )
 
         if tensorizer_config_dict:
             from tensorizer import TensorDeserializer
 
             tensorizer_config = TensorizerConfig(**tensorizer_config_dict)
-            lora_tensor_path = os.path.join(tensorizer_config.tensorizer_dir,
-                                            "adapter_model.tensors")
+            lora_tensor_path = os.path.join(
+                tensorizer_config.tensorizer_dir, "adapter_model.tensors"
+            )
             tensorizer_args = tensorizer_config._construct_tensorizer_args()
             tensors = TensorDeserializer(
                 lora_tensor_path,
                 dtype=tensorizer_config.dtype,
-                **tensorizer_args.deserialization_kwargs)
+                **tensorizer_args.deserialization_kwargs,
+            )
             check_unexpected_modules(tensors)
 
         elif os.path.isfile(lora_tensor_path):
@@ -259,14 +270,12 @@ def check_unexpected_modules(modules: dict):
             # loraified. C won’t exist in the safetensor but it will exist in
             # the target_modules of the adapter_config.json.
             unexpected_modules = []
-            with safetensors.safe_open(lora_tensor_path,
-                                       framework="pt") as f:  # type: ignore
+            with safetensors.safe_open(lora_tensor_path, framework="pt") as f:  # type: ignore
                 # Load tensors if there are only expected modules.
                 check_unexpected_modules(f)
                 for module in f.keys():  # noqa
                     tensors[module] = f.get_tensor(module)
-        elif os.path.isfile(lora_bin_file_path) or os.path.isfile(
-                lora_pt_file_path):
+        elif os.path.isfile(lora_bin_file_path) or os.path.isfile(lora_pt_file_path):
             # When a bin/pt file is provided, we rely on config to find
             # unexpected modules.
             unexpected_modules = []
@@ -284,33 +293,33 @@ def check_unexpected_modules(modules: dict):
             # https://github.com/vllm-project/vllm/pull/5909. But there's no
             # other better mechanism.
             if unexpected_modules and not is_regex_target_modules(
-                    peft_helper.target_modules, expected_lora_modules):
+                peft_helper.target_modules, expected_lora_modules
+            ):
                 raise ValueError(
                     f"While loading {lora_dir}, expected"
                     f" target modules in {expected_lora_modules}"
                     f" but received {unexpected_modules}."
-                    f" Please verify that the loaded LoRA module is correct")
-            lora_file_path = (lora_bin_file_path
-                              if os.path.isfile(lora_bin_file_path) else
-                              lora_pt_file_path)
-            tensors = torch.load(lora_file_path,
-                                 map_location=device,
-                                 weights_only=True)
+                    f" Please verify that the loaded LoRA module is correct"
+                )
+            lora_file_path = (
+                lora_bin_file_path
+                if os.path.isfile(lora_bin_file_path)
+                else lora_pt_file_path
+            )
+            tensors = torch.load(lora_file_path, map_location=device, weights_only=True)
         else:
             raise ValueError(f"{lora_dir} doesn't contain tensors")
 
         embeddings = None
         if os.path.isfile(new_embeddings_tensor_path):
-            embeddings = safetensors.torch.load_file(
-                new_embeddings_tensor_path)
+            embeddings = safetensors.torch.load_file(new_embeddings_tensor_path)
         elif os.path.isfile(new_embeddings_bin_file_path):
-            embeddings = torch.load(new_embeddings_bin_file_path,
-                                    map_location=device,
-                                    weights_only=True)
+            embeddings = torch.load(
+                new_embeddings_bin_file_path, map_location=device, weights_only=True
+            )
 
         return cls.from_lora_tensors(
-            lora_model_id=get_lora_id()
-            if lora_model_id is None else lora_model_id,
+            lora_model_id=get_lora_id() if lora_model_id is None else lora_model_id,
             tensors=tensors,
             peft_helper=peft_helper,
             device=device,
@@ -319,7 +328,8 @@ def check_unexpected_modules(modules: dict):
             target_embedding_padding=target_embedding_padding,
             embedding_modules=embedding_modules,
             embedding_padding_modules=embedding_padding_modules,
-            weights_mapper=weights_mapper)
+            weights_mapper=weights_mapper,
+        )
 
 
 class LoRAModelManager:
@@ -374,7 +384,8 @@ def __init__(
             supports_multimodal(self.model)
             # In case the model only supports LoRA for
             # text modules (e.g. ChatGLM)
-            and hasattr(self.model, "get_mm_mapping"))
+            and hasattr(self.model, "get_mm_mapping")
+        )
         self.is_pooling_model = is_pooling_model(self.model)
         self.is_moe_model = is_moe_model(self.model)
         self.packed_modules: dict[str, list[str]] = {}
@@ -407,15 +418,21 @@ def activate_adapter(
         if lora_id in self._active_adapters:
             return False
         first_free_slot = next(
-            ((i, lora_id) for i, lora_id in enumerate(self.lora_index_to_id)
-             if lora_id is None), None)
+            (
+                (i, lora_id)
+                for i, lora_id in enumerate(self.lora_index_to_id)
+                if lora_id is None
+            ),
+            None,
+        )
         if first_free_slot is None:
             raise ValueError("No free lora slots")
         index, _ = first_free_slot
         self._active_adapters[lora_id] = None
         lora_model = self._registered_adapters[lora_id]
-        logger.debug("Activating LoRA. int id: %d, slot index: %d",
-                     lora_model.id, index)
+        logger.debug(
+            "Activating LoRA. int id: %d, slot index: %d", lora_model.id, index
+        )
         self.lora_index_to_id[index] = lora_model.id
         for module_name, module in self.modules.items():
             module_lora = self._get_lora_layer_weights(lora_model, module_name)
@@ -423,17 +440,22 @@ def activate_adapter(
                 module_lora.optimize()
                 # Bias is not explicitly enabled with the flag enable_lora_bias.
                 bias = module_lora.bias
-                if ((torch.is_tensor(bias) or
-                     (isinstance(bias, Sequence) and any(b is not None
-                                                         for b in bias)))
-                        and not self.lora_config.bias_enabled):
+                if (
+                    torch.is_tensor(bias)
+                    or (isinstance(bias, Sequence) and any(b is not None for b in bias))
+                ) and not self.lora_config.bias_enabled:
                     module_lora.bias = None
                     raise ValueError(
                         f"Adapter bias cannot be used for {module_name}"
-                        " without --enable-lora-bias.")
-                module.set_lora(index, module_lora.lora_a, module_lora.lora_b,
-                                module_lora.embeddings_tensor,
-                                module_lora.bias)
+                        " without --enable-lora-bias."
+                    )
+                module.set_lora(
+                    index,
+                    module_lora.lora_a,
+                    module_lora.lora_b,
+                    module_lora.embeddings_tensor,
+                    module_lora.bias,
+                )
             else:
                 module.reset_lora(index)
         return True
@@ -453,7 +475,8 @@ def pin_adapter(self, lora_id: int) -> bool:
         """Pin a LoRAModel in the manager cache."""
         raise NotImplementedError(
             "Pinning is not supported in LoRAModelManager. "
-            "Use LRUCacheLoRAModelManager for pinning")  # type: ignore
+            "Use LRUCacheLoRAModelManager for pinning"
+        )  # type: ignore
 
     def _set_adapter_mapping(self, mapping: LoRAMapping) -> None:
         # update lora states
@@ -472,16 +495,14 @@ def remove_all_adapters(self):
         self._active_adapters.clear()
 
     def _create_lora_modules(self):
-
         def _parent_module(module_name: str) -> str:
             # module name is a dot separated name.
             # for example:
             #  - given an input 'x.y.z' return 'x.y'
             #  - given an input 'x' return ''
-            return module_name.rpartition('.')[0]
+            return module_name.rpartition(".")[0]
 
-        for module_name, module in self.model.named_modules(
-                remove_duplicate=False):
+        for module_name, module in self.model.named_modules(remove_duplicate=False):
             if isinstance(module, PPMissingLayer):
                 continue
             if not self._match_target_modules(module_name):
@@ -498,35 +519,48 @@ def _parent_module(module_name: str) -> str:
             parts = module_name.split(".")[-1]
             packed_moduled_lst = self.packed_modules_mapping.get(parts, [])
             new_module = replace_submodule(
-                self.model, module_name,
-                from_layer(module, self.lora_slots, self.lora_config,
-                           packed_moduled_lst, self.model.config))
+                self.model,
+                module_name,
+                from_layer(
+                    module,
+                    self.lora_slots,
+                    self.lora_config,
+                    packed_moduled_lst,
+                    self.model.config,
+                ),
+            )
 
             # (yard1): TODO make this more robust
             if "lm_head" in module_name:
-                logits_processor_module_name = 'logits_processor'
+                logits_processor_module_name = "logits_processor"
                 parent_module = _parent_module(module_name)
                 if parent_module:
                     logits_processor_module_name = (
-                        f"{parent_module}.{logits_processor_module_name}")
+                        f"{parent_module}.{logits_processor_module_name}"
+                    )
 
                 logits_processor_module = self.model.get_submodule(
-                    logits_processor_module_name)
+                    logits_processor_module_name
+                )
 
                 new_module = replace_submodule(
-                    self.model, logits_processor_module_name,
-                    from_layer_logits_processor(logits_processor_module,
-                                                module, self.lora_slots,
-                                                self.lora_config,
-                                                self.model.config))
+                    self.model,
+                    logits_processor_module_name,
+                    from_layer_logits_processor(
+                        logits_processor_module,
+                        module,
+                        self.lora_slots,
+                        self.lora_config,
+                        self.model.config,
+                    ),
+                )
 
             # In some models, especially multimodal ones, layers with the same
             # name may have different types, such as nn.Linear and
             # ReplicatedLinear. The nn.Linear layers cannot be replaced with
             # LoRA layers, leading to assertion error. The following check
             # aims to prevent this error
-            if self.supports_mm and not isinstance(new_module,
-                                                   BaseLayerWithLoRA):
+            if self.supports_mm and not isinstance(new_module, BaseLayerWithLoRA):
                 continue
             self.register_module(module_name, new_module)
             self._register_packed_modules(module_name)
@@ -538,33 +572,41 @@ def register_module(self, module_name: str, module: "BaseLayerWithLoRA"):
         self.modules[module_name] = module
 
     def create_dummy_lora(
-            self,
-            lora_id: int,
-            rank: int,
-            embedding_modules: Optional[dict[str, str]] = None) -> LoRAModel:
+        self,
+        lora_id: int,
+        rank: int,
+        embedding_modules: Optional[dict[str, str]] = None,
+    ) -> LoRAModel:
         """Create zero-initialized LoRAModel for warmup."""
         model = LoRAModel(lora_id, rank, {})
         for module_name, module in self.model.named_modules():
             bias_enabled = self.lora_config.bias_enabled
-            if (not self._match_target_modules(module_name)
-                    or not isinstance(module, BaseLayerWithLoRA)
-                    or self._filter_unsupported_mm_module(module_name)):
+            if (
+                not self._match_target_modules(module_name)
+                or not isinstance(module, BaseLayerWithLoRA)
+                or self._filter_unsupported_mm_module(module_name)
+            ):
                 continue
             parts = module_name.split(".")
             if module_name not in self.packed_modules:
                 assert embedding_modules is not None
                 if parts[-1] in embedding_modules:
-                    input_dim = (module.base_layer.org_vocab_size +
-                                 self.lora_config.lora_extra_vocab_size if
-                                 hasattr(module.base_layer, "org_vocab_size")
-                                 else module.base_layer.weight.shape[1])
-                    output_dim = module.base_layer.embedding_dim if hasattr(
-                        module.base_layer,
-                        "embedding_dim") else module.base_layer.weight.shape[0]
-                    embeddings_tensor_dim = (module.base_layer.embedding_dim if
-                                             hasattr(module.base_layer,
-                                                     "embedding_dim") else
-                                             module.base_layer.weight.shape[1])
+                    input_dim = (
+                        module.base_layer.org_vocab_size
+                        + self.lora_config.lora_extra_vocab_size
+                        if hasattr(module.base_layer, "org_vocab_size")
+                        else module.base_layer.weight.shape[1]
+                    )
+                    output_dim = (
+                        module.base_layer.embedding_dim
+                        if hasattr(module.base_layer, "embedding_dim")
+                        else module.base_layer.weight.shape[0]
+                    )
+                    embeddings_tensor_dim = (
+                        module.base_layer.embedding_dim
+                        if hasattr(module.base_layer, "embedding_dim")
+                        else module.base_layer.weight.shape[1]
+                    )
                     lora = LoRALayerWeights.create_dummy_lora_weights(
                         module_name,
                         input_dim,
@@ -573,7 +615,8 @@ def create_dummy_lora(
                         module.lora_a_stacked[0].dtype,
                         "cpu",
                         embeddings_tensor_dim=embeddings_tensor_dim,
-                        bias_enabled=bias_enabled)
+                        bias_enabled=bias_enabled,
+                    )
                 else:
                     lora = LoRALayerWeights.create_dummy_lora_weights(
                         module_name,
@@ -606,9 +649,11 @@ def create_dummy_lora(
     def _match_target_modules(self, module_name: str):
         return any(
             re.match(
-                r".*\.{target_module}$".format(target_module=target_module),
-                module_name) or target_module == module_name
-            for target_module in self.supported_lora_modules)
+                r".*\.{target_module}$".format(target_module=target_module), module_name
+            )
+            or target_module == module_name
+            for target_module in self.supported_lora_modules
+        )
 
     def _filter_unsupported_mm_module(self, module_name: str) -> bool:
         """
@@ -619,8 +664,7 @@ def _filter_unsupported_mm_module(self, module_name: str) -> bool:
         if self.supports_mm:
             module_mapping: MultiModelKeys = self.model.get_mm_mapping()
             prefix_lst = module_mapping.connector + module_mapping.tower_model
-            return any(
-                [module_name.startswith(prefix) for prefix in prefix_lst])
+            return any([module_name.startswith(prefix) for prefix in prefix_lst])
         return False
 
     def _register_packed_modules(self, module_full_name: str) -> None:
@@ -654,23 +698,22 @@ def _create_merged_loras_inplace(self, lora_model: LoRAModel) -> None:
                     continue
                 replacement_loras[i] = None
             # HACK Temporary solution for the pool model.
-            if self.is_pooling_model and not lora_model.check_lora_name(
-                    module_name):
+            if self.is_pooling_model and not lora_model.check_lora_name(module_name):
                 replaced_module_name = module_name.replace("model.", "")
                 if lora_model.check_lora_name(module_name):
                     module_name = replaced_module_name
             lora_model.loras[module_name] = PackedLoRALayerWeights.pack(
-                replacement_loras)
+                replacement_loras
+            )
             # Remove the modules that have been replaced.
             for module in replaced_module:
                 lora_model.loras.pop(module, None)
 
     def _get_lora_layer_weights(
-            self, lora_model: LoRAModel,
-            module_name: str) -> Optional[LoRALayerWeights]:
+        self, lora_model: LoRAModel, module_name: str
+    ) -> Optional[LoRALayerWeights]:
         org_module_name = module_name
-        if self.is_pooling_model and not lora_model.check_lora_name(
-                module_name):
+        if self.is_pooling_model and not lora_model.check_lora_name(module_name):
             # If it's a pool model, and the layer name is not found,
             # remove the prefix 'model.' and search again.
             module_name = module_name.replace("model.", "")
@@ -678,7 +721,8 @@ def _get_lora_layer_weights(
                 org_module_name = module_name
                 logger.info_once(
                     "For the pool model, successfully loaded the LoRA weights "
-                    "after removing the prefix 'model.'.")
+                    "after removing the prefix 'model.'."
+                )
         return lora_model.get_lora(org_module_name)
 
     def deactivate_adapter(self, adapter_id: int) -> bool:
@@ -689,8 +733,7 @@ def deactivate_adapter(self, adapter_id: int) -> bool:
         return True
 
     def add_adapter(self, adapter: LoRAModel) -> bool:
-        logger.debug("Adding lora. Model id: %d, "
-                     "int id: %d", adapter.id, adapter.id)
+        logger.debug("Adding lora. Model id: %d, int id: %d", adapter.id, adapter.id)
         if adapter.id in self._registered_adapters:
             return False
         if len(self._registered_adapters) >= self.capacity:
@@ -718,24 +761,31 @@ def get_adapter(self, adapter_id: int) -> Optional[LoRAModel]:
 
 
 class LoRALRUCache(AdapterLRUCache[LoRAModel]):
-
-    def __init__(self, capacity: int, deactivate_lora_fn: Callable[[int],
-                                                                   bool]):
+    def __init__(self, capacity: int, deactivate_lora_fn: Callable[[int], bool]):
         super().__init__(capacity, deactivate_lora_fn)
 
 
 class LRUCacheLoRAModelManager(LoRAModelManager):
     """A model manager that manages multiple LoRAs with LRU cache."""
 
-    def __init__(self, model: nn.Module, max_num_seqs: int,
-                 max_num_batched_tokens: int, vocab_size: int,
-                 lora_config: LoRAConfig, device: torch.device):
-        super().__init__(model, max_num_seqs, max_num_batched_tokens,
-                         vocab_size, lora_config, device)
+    def __init__(
+        self,
+        model: nn.Module,
+        max_num_seqs: int,
+        max_num_batched_tokens: int,
+        vocab_size: int,
+        lora_config: LoRAConfig,
+        device: torch.device,
+    ):
+        super().__init__(
+            model, max_num_seqs, max_num_batched_tokens, vocab_size, lora_config, device
+        )
         self._registered_adapters: LoRALRUCache = LoRALRUCache(
-            self.capacity, self.deactivate_adapter)
+            self.capacity, self.deactivate_adapter
+        )
         self._active_adapters: LoRALRUCache = LoRALRUCache(
-            self.lora_slots, self._deactivate_adapter)
+            self.lora_slots, self._deactivate_adapter
+        )
 
     def list_adapters(self) -> dict[int, LoRAModel]:
         """List all registered LoRAModels."""
@@ -743,8 +793,7 @@ def list_adapters(self) -> dict[int, LoRAModel]:
 
     def add_adapter(self, lora: LoRAModel) -> bool:
         """Add a LoRAModel to the manager."""
-        logger.debug("Adding lora. Model id: %d, "
-                     "int id: %d", lora.id, lora.id)
+        logger.debug("Adding lora. Model id: %d, int id: %d", lora.id, lora.id)
         if lora.id not in self._registered_adapters:
             self._add_adapter(lora)
             was_added = True
@@ -758,8 +807,10 @@ def activate_adapter(
         self,
         lora_id: int,
     ) -> bool:
-        if lora_id not in self._active_adapters and len(
-                self._active_adapters) >= self.lora_slots:
+        if (
+            lora_id not in self._active_adapters
+            and len(self._active_adapters) >= self.lora_slots
+        ):
             self._active_adapters.remove_oldest()
         result = super().activate_adapter(lora_id)
         # We always touch to update the LRU cache order
@@ -782,8 +833,9 @@ def _pin_lora_in_cpu_cache(self, lora_id: int):
         try:
             self._registered_adapters.pin(lora_id)
         except ValueError as err:
-            raise ValueError("Pinning failed. "
-                             f"LoRA {lora_id} is not registered.") from err
+            raise ValueError(
+                f"Pinning failed. LoRA {lora_id} is not registered."
+            ) from err
 
     def _pin_lora_in_gpu_cache(self, lora_id: int):
         if lora_id not in self._active_adapters:
@@ -794,14 +846,15 @@ def _pin_lora_in_gpu_cache(self, lora_id: int):
 
 
 def create_lora_manager(
-        model: nn.Module,
-        max_num_seqs: int,
-        max_num_batched_tokens: int,
-        vocab_size: int,
-        lora_config: LoRAConfig,
-        device: torch.device,
-        lora_manager_cls: type[LoRAModelManager] = LoRAModelManager,
-        **kwargs) -> LoRAModelManager:
+    model: nn.Module,
+    max_num_seqs: int,
+    max_num_batched_tokens: int,
+    vocab_size: int,
+    lora_config: LoRAConfig,
+    device: torch.device,
+    lora_manager_cls: type[LoRAModelManager] = LoRAModelManager,
+    **kwargs,
+) -> LoRAModelManager:
     """Create a LoRA adapter for a given model."""
     if not isinstance(model, SupportsLoRA):
         raise ValueError(f"Model {type(model)} is not supported for LoRA.")
@@ -812,5 +865,6 @@ def create_lora_manager(
         vocab_size=vocab_size,
         lora_config=lora_config,
         device=device,
-        **kwargs)
+        **kwargs,
+    )
     return lora_manager
diff --git a/vllm/lora/ops/ipex_ops/__init__.py b/vllm/lora/ops/ipex_ops/__init__.py
index 5daa432493b1..f5a5e0e6f951 100644
--- a/vllm/lora/ops/ipex_ops/__init__.py
+++ b/vllm/lora/ops/ipex_ops/__init__.py
@@ -1,7 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from vllm.lora.ops.ipex_ops.lora_ops import (bgmv_expand, bgmv_expand_slice,
-                                             bgmv_shrink)
+from vllm.lora.ops.ipex_ops.lora_ops import bgmv_expand, bgmv_expand_slice, bgmv_shrink
 
 __all__ = ["bgmv_expand", "bgmv_expand_slice", "bgmv_shrink"]
diff --git a/vllm/lora/ops/ipex_ops/lora_ops.py b/vllm/lora/ops/ipex_ops/lora_ops.py
index 7590c868ecb6..0767f90b2f9e 100644
--- a/vllm/lora/ops/ipex_ops/lora_ops.py
+++ b/vllm/lora/ops/ipex_ops/lora_ops.py
@@ -13,32 +13,45 @@
     raise e
 
 
-def bgmv_shrink(inputs: torch.Tensor,
-                lora_a_weights: torch.Tensor,
-                output_tensor: torch.Tensor,
-                lora_indices_tensor: torch.Tensor,
-                scaling: float = 1.0) -> None:
-
-    ipex.llm.functional.bgmv_shrink(inputs, lora_a_weights, output_tensor,
-                                    lora_indices_tensor, scaling)
-
-
-def bgmv_expand(inputs: torch.Tensor,
-                lora_b_weights: torch.Tensor,
-                output_tensor: torch.Tensor,
-                lora_indices_tensor: torch.Tensor,
-                add_inputs: bool = True) -> None:
-    ipex.llm.functional.bgmv_expand(inputs, lora_b_weights, output_tensor,
-                                    lora_indices_tensor, add_inputs)
-
-
-def bgmv_expand_slice(inputs: torch.Tensor,
-                      lora_b_weights: torch.Tensor,
-                      output_tensor: torch.Tensor,
-                      lora_indices_tensor: torch.Tensor,
-                      slice_offset: int,
-                      slice_size: int,
-                      add_inputs: bool = True) -> None:
-    ipex.llm.functional.bgmv_expand_slice(inputs, lora_b_weights,
-                                          output_tensor, lora_indices_tensor,
-                                          slice_offset, slice_size, add_inputs)
+def bgmv_shrink(
+    inputs: torch.Tensor,
+    lora_a_weights: torch.Tensor,
+    output_tensor: torch.Tensor,
+    lora_indices_tensor: torch.Tensor,
+    scaling: float = 1.0,
+) -> None:
+    ipex.llm.functional.bgmv_shrink(
+        inputs, lora_a_weights, output_tensor, lora_indices_tensor, scaling
+    )
+
+
+def bgmv_expand(
+    inputs: torch.Tensor,
+    lora_b_weights: torch.Tensor,
+    output_tensor: torch.Tensor,
+    lora_indices_tensor: torch.Tensor,
+    add_inputs: bool = True,
+) -> None:
+    ipex.llm.functional.bgmv_expand(
+        inputs, lora_b_weights, output_tensor, lora_indices_tensor, add_inputs
+    )
+
+
+def bgmv_expand_slice(
+    inputs: torch.Tensor,
+    lora_b_weights: torch.Tensor,
+    output_tensor: torch.Tensor,
+    lora_indices_tensor: torch.Tensor,
+    slice_offset: int,
+    slice_size: int,
+    add_inputs: bool = True,
+) -> None:
+    ipex.llm.functional.bgmv_expand_slice(
+        inputs,
+        lora_b_weights,
+        output_tensor,
+        lora_indices_tensor,
+        slice_offset,
+        slice_size,
+        add_inputs,
+    )
diff --git a/vllm/lora/ops/torch_ops/__init__.py b/vllm/lora/ops/torch_ops/__init__.py
index 22aa3c63dce1..89865af4e9b8 100644
--- a/vllm/lora/ops/torch_ops/__init__.py
+++ b/vllm/lora/ops/torch_ops/__init__.py
@@ -1,10 +1,14 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from vllm.lora.ops.torch_ops.lora_ops import bgmv_expand  # noqa: F401
-from vllm.lora.ops.torch_ops.lora_ops import (bgmv_expand_slice, bgmv_shrink,
-                                              sgmv_expand, sgmv_expand_slice,
-                                              sgmv_shrink)
+from vllm.lora.ops.torch_ops.lora_ops import (
+    bgmv_expand,  # noqa: F401
+    bgmv_expand_slice,
+    bgmv_shrink,
+    sgmv_expand,
+    sgmv_expand_slice,
+    sgmv_shrink,
+)
 
 __all__ = [
     "bgmv_expand",
diff --git a/vllm/lora/ops/torch_ops/lora_ops.py b/vllm/lora/ops/torch_ops/lora_ops.py
index cba5baad8668..4fc6248d5448 100644
--- a/vllm/lora/ops/torch_ops/lora_ops.py
+++ b/vllm/lora/ops/torch_ops/lora_ops.py
@@ -4,30 +4,31 @@
 import torch
 
 
-def sgmv_expand(inputs: torch.Tensor,
-                lora_b_weights: torch.Tensor,
-                output_tensor: torch.Tensor,
-                b_seq_start_loc: torch.Tensor,
-                seq_len_tensor: torch.Tensor,
-                lora_indices_tensor: torch.Tensor,
-                batches: int,
-                max_seq_length: int,
-                token_nums: int,
-                add_inputs: bool = False):
-    exploded_indices = torch.repeat_interleave(lora_indices_tensor,
-                                               seq_len_tensor)
-
-    bgmv_expand(inputs, lora_b_weights, output_tensor, exploded_indices,
-                add_inputs)
-
-
-def bgmv_expand(inputs: torch.Tensor,
-                lora_b_weights: torch.Tensor,
-                output_tensor: torch.Tensor,
-                lora_indices_tensor: torch.Tensor,
-                add_inputs: bool = True):
-    selected_loras = lora_b_weights[lora_indices_tensor].to(
-        dtype=output_tensor.dtype)
+def sgmv_expand(
+    inputs: torch.Tensor,
+    lora_b_weights: torch.Tensor,
+    output_tensor: torch.Tensor,
+    b_seq_start_loc: torch.Tensor,
+    seq_len_tensor: torch.Tensor,
+    lora_indices_tensor: torch.Tensor,
+    batches: int,
+    max_seq_length: int,
+    token_nums: int,
+    add_inputs: bool = False,
+):
+    exploded_indices = torch.repeat_interleave(lora_indices_tensor, seq_len_tensor)
+
+    bgmv_expand(inputs, lora_b_weights, output_tensor, exploded_indices, add_inputs)
+
+
+def bgmv_expand(
+    inputs: torch.Tensor,
+    lora_b_weights: torch.Tensor,
+    output_tensor: torch.Tensor,
+    lora_indices_tensor: torch.Tensor,
+    add_inputs: bool = True,
+):
+    selected_loras = lora_b_weights[lora_indices_tensor].to(dtype=output_tensor.dtype)
     if len(selected_loras.shape) == 4:
         selected_loras = selected_loras.squeeze(dim=1)
     inputs = inputs.to(dtype=output_tensor.dtype)
@@ -58,62 +59,70 @@ def sgmv_shrink(
     token_nums: int,
     scaling: float,
 ):
-    exploded_indices = torch.repeat_interleave(lora_indices_tensor,
-                                               seq_len_tensor)
+    exploded_indices = torch.repeat_interleave(lora_indices_tensor, seq_len_tensor)
 
-    bgmv_shrink(inputs, lora_a_weights, output_tensor, exploded_indices,
-                scaling)
+    bgmv_shrink(inputs, lora_a_weights, output_tensor, exploded_indices, scaling)
 
 
-def bgmv_shrink(inputs: torch.Tensor,
-                lora_b_weights: torch.Tensor,
-                output_tensor: torch.Tensor,
-                lora_indices_tensor: torch.Tensor,
-                scaling: float = 1.0):
-    selected_loras = lora_b_weights[lora_indices_tensor].to(
-        dtype=output_tensor.dtype)
+def bgmv_shrink(
+    inputs: torch.Tensor,
+    lora_b_weights: torch.Tensor,
+    output_tensor: torch.Tensor,
+    lora_indices_tensor: torch.Tensor,
+    scaling: float = 1.0,
+):
+    selected_loras = lora_b_weights[lora_indices_tensor].to(dtype=output_tensor.dtype)
     if len(selected_loras.shape) == 4:
         selected_loras = selected_loras.squeeze(dim=1)
     inputs = inputs.to(dtype=output_tensor.dtype)
     outputs = torch.einsum("bi, boi -> bo", inputs, selected_loras)
 
-    output_tensor[:, :outputs.shape[1]] = scaling * outputs[:]
-
-
-def sgmv_expand_slice(inputs: torch.Tensor,
-                      lora_b_weights: torch.Tensor,
-                      output_tensor: torch.Tensor,
-                      b_seq_start_loc: torch.Tensor,
-                      seq_len_tensor: torch.Tensor,
-                      lora_indices_tensor: torch.Tensor,
-                      batches: int,
-                      max_seq_length: int,
-                      token_nums: int,
-                      slice_offset: int,
-                      slice_size: int,
-                      add_inputs: bool = False):
-    exploded_indices = torch.repeat_interleave(lora_indices_tensor,
-                                               seq_len_tensor)
-
-    bgmv_expand_slice(inputs, lora_b_weights, output_tensor, exploded_indices,
-                      slice_offset, slice_size, add_inputs)
-
-
-def bgmv_expand_slice(inputs: torch.Tensor,
-                      lora_b_weights: torch.Tensor,
-                      output_tensor: torch.Tensor,
-                      lora_indices_tensor: torch.Tensor,
-                      slice_offset: int,
-                      slice_size: int,
-                      add_inputs: bool = True):
-    selected_loras = lora_b_weights[lora_indices_tensor].to(
-        dtype=output_tensor.dtype)
+    output_tensor[:, : outputs.shape[1]] = scaling * outputs[:]
+
+
+def sgmv_expand_slice(
+    inputs: torch.Tensor,
+    lora_b_weights: torch.Tensor,
+    output_tensor: torch.Tensor,
+    b_seq_start_loc: torch.Tensor,
+    seq_len_tensor: torch.Tensor,
+    lora_indices_tensor: torch.Tensor,
+    batches: int,
+    max_seq_length: int,
+    token_nums: int,
+    slice_offset: int,
+    slice_size: int,
+    add_inputs: bool = False,
+):
+    exploded_indices = torch.repeat_interleave(lora_indices_tensor, seq_len_tensor)
+
+    bgmv_expand_slice(
+        inputs,
+        lora_b_weights,
+        output_tensor,
+        exploded_indices,
+        slice_offset,
+        slice_size,
+        add_inputs,
+    )
+
+
+def bgmv_expand_slice(
+    inputs: torch.Tensor,
+    lora_b_weights: torch.Tensor,
+    output_tensor: torch.Tensor,
+    lora_indices_tensor: torch.Tensor,
+    slice_offset: int,
+    slice_size: int,
+    add_inputs: bool = True,
+):
+    selected_loras = lora_b_weights[lora_indices_tensor].to(dtype=output_tensor.dtype)
     inputs = inputs.to(dtype=output_tensor.dtype)
     if len(selected_loras.shape) == 4:
         selected_loras = selected_loras.squeeze(dim=1)
     outputs = torch.einsum("bi, boi -> bo", inputs, selected_loras)
 
     if add_inputs:
-        output_tensor[:, slice_offset:slice_offset + slice_size] += outputs[:]
+        output_tensor[:, slice_offset : slice_offset + slice_size] += outputs[:]
     else:
-        output_tensor[:, slice_offset:slice_offset + slice_size] = outputs[:]
+        output_tensor[:, slice_offset : slice_offset + slice_size] = outputs[:]
diff --git a/vllm/lora/ops/triton_ops/kernel_utils.py b/vllm/lora/ops/triton_ops/kernel_utils.py
index e93064d0c83a..f6397a68ddb8 100644
--- a/vllm/lora/ops/triton_ops/kernel_utils.py
+++ b/vllm/lora/ops/triton_ops/kernel_utils.py
@@ -3,23 +3,35 @@
 """
 Utilities for Punica kernel construction.
 """
+
 from vllm.triton_utils import tl, triton
 
 
 @triton.jit
-def mm_k(a_ptr, b_ptr, ak_stride, bk_stride, offset_k, K: tl.constexpr,
-         BLOCK_M: tl.constexpr, BLOCK_N: tl.constexpr, BLOCK_K: tl.constexpr,
-         EVEN_K: tl.constexpr, SPLIT_K: tl.constexpr, CAST_TYPE: tl.constexpr,
-         b_dtype: tl.constexpr):
+def mm_k(
+    a_ptr,
+    b_ptr,
+    ak_stride,
+    bk_stride,
+    offset_k,
+    K: tl.constexpr,
+    BLOCK_M: tl.constexpr,
+    BLOCK_N: tl.constexpr,
+    BLOCK_K: tl.constexpr,
+    EVEN_K: tl.constexpr,
+    SPLIT_K: tl.constexpr,
+    CAST_TYPE: tl.constexpr,
+    b_dtype: tl.constexpr,
+):
     """
     Given a_ptr and b_ptr, that identify the rows of A (m x k) and columns of
     B (k x n), iterate, through the K dimension to compute the partial/complete
     matrix block product.
     If SPLIT_K == 1, the output m x n product is complete.
     If SPLIT_K > 1, the thread block computes partial outputs. The partial
-    outputs are then atomically summed in the caller code. 
+    outputs are then atomically summed in the caller code.
     Args:
-        a_ptr: Array of pointers, identifying rows of A 
+        a_ptr: Array of pointers, identifying rows of A
         b_ptr: Array of pointers, identifying columns of B
         ak_stride: K dimension stride of the A matrix
         bk_stride: K dimension stride of the B matrix
@@ -29,7 +41,7 @@ def mm_k(a_ptr, b_ptr, ak_stride, bk_stride, offset_k, K: tl.constexpr,
         BLOCK_K: K dimension atom
         EVEN_K: True if the blocks of A and B can be loaded without any
           masking.
-        SPLIT_K: Parameter signifying parallelism in the K dimension. 
+        SPLIT_K: Parameter signifying parallelism in the K dimension.
         CAST_TYPE: if True, cast the values from the A matrix to the B
           matrix dtype.
         b_dtype: datatype of the B matrix
@@ -40,14 +52,12 @@ def mm_k(a_ptr, b_ptr, ak_stride, bk_stride, offset_k, K: tl.constexpr,
             tiled_a = tl.load(a_ptr)
             tiled_b = tl.load(b_ptr)
         else:
-            tiled_a = tl.load(a_ptr,
-                              mask=offset_k[None, :]
-                              < K - k * (BLOCK_K * SPLIT_K),
-                              other=0)
-            tiled_b = tl.load(b_ptr,
-                              mask=offset_k[:, None]
-                              < K - k * (BLOCK_K * SPLIT_K),
-                              other=0)
+            tiled_a = tl.load(
+                a_ptr, mask=offset_k[None, :] < K - k * (BLOCK_K * SPLIT_K), other=0
+            )
+            tiled_b = tl.load(
+                b_ptr, mask=offset_k[:, None] < K - k * (BLOCK_K * SPLIT_K), other=0
+            )
         if CAST_TYPE:
             tiled_a = tiled_a.to(b_dtype)
         accumulator += tl.dot(
@@ -121,7 +131,8 @@ def do_expand_kernel(
     else:
         cur_input_ptr = input_ptr + slice_id * input_d0_stride
         cur_lora_ptr = tl.load(lora_ptr + slice_id).to(
-            tl.pointer_type(out_ptr.dtype.element_ty))
+            tl.pointer_type(out_ptr.dtype.element_ty)
+        )
 
     # Identify the column indices of B to process.
     offset_n = tl.arange(0, BLOCK_N) + pid_n * BLOCK_N
@@ -129,17 +140,35 @@ def do_expand_kernel(
 
     # Identify A and B block pointers
     offset_k = tl.arange(0, BLOCK_K)
-    a_ptr = (cur_input_ptr + ram[:, None] * input_d1_stride +
-             offset_k[None, :] * input_d2_stride)
-    b_ptr = (cur_lora_ptr + cur_lora_d0_stride * lora_index +
-             offset_k[:, None] * cur_lora_d2_stride +
-             rbn[None, :] * cur_lora_d1_stride)
+    a_ptr = (
+        cur_input_ptr
+        + ram[:, None] * input_d1_stride
+        + offset_k[None, :] * input_d2_stride
+    )
+    b_ptr = (
+        cur_lora_ptr
+        + cur_lora_d0_stride * lora_index
+        + offset_k[:, None] * cur_lora_d2_stride
+        + rbn[None, :] * cur_lora_d1_stride
+    )
 
     # Compute the block matrix product.
     SPLIT_K = 1
-    accumulator = mm_k(a_ptr, b_ptr, input_d2_stride, cur_lora_d2_stride,
-                       offset_k, K, BLOCK_M, BLOCK_N, BLOCK_K, EVEN_K, SPLIT_K,
-                       CAST_TYPE, cur_lora_ptr.dtype.element_ty)
+    accumulator = mm_k(
+        a_ptr,
+        b_ptr,
+        input_d2_stride,
+        cur_lora_d2_stride,
+        offset_k,
+        K,
+        BLOCK_M,
+        BLOCK_N,
+        BLOCK_K,
+        EVEN_K,
+        SPLIT_K,
+        CAST_TYPE,
+        cur_lora_ptr.dtype.element_ty,
+    )
 
     tiled_c = accumulator.to(cur_lora_ptr.dtype.element_ty)
     if SLICE_NUM == 1:
@@ -150,10 +179,12 @@ def do_expand_kernel(
     # Identify the C output pointers to store the results of the accumulator.
     offset_cn = tl.arange(0, BLOCK_N) + pid_n * BLOCK_N + cur_slice_start
     offset_cm = tl.arange(0, BLOCK_M)
-    c_ptr = (out_ptr + ram[:, None] * output_d0_stride +
-             offset_cn[None, :] * output_d1_stride)
-    c_mask = (offset_cm[:, None] < M_LEN) & (offset_cn[None, :]
-                                             < (cur_slice_start + N))
+    c_ptr = (
+        out_ptr
+        + ram[:, None] * output_d0_stride
+        + offset_cn[None, :] * output_d1_stride
+    )
+    c_mask = (offset_cm[:, None] < M_LEN) & (offset_cn[None, :] < (cur_slice_start + N))
 
     if ADD_INPUTS:
         tiled_out = tl.load(c_ptr, mask=c_mask)
@@ -207,7 +238,8 @@ def do_shrink_kernel(
     else:
         # current lora ptr
         cur_lora_ptr = tl.load(lora_ptr + slice_id).to(
-            tl.pointer_type(input_ptr.dtype.element_ty))
+            tl.pointer_type(input_ptr.dtype.element_ty)
+        )
 
     # Identify the column indices of B to process.
     offset_n = tl.arange(0, BLOCK_N) + pid_n * BLOCK_N
@@ -215,24 +247,42 @@ def do_shrink_kernel(
 
     # Identify A and B block pointers
     offset_k = pid_sk * BLOCK_K + tl.arange(0, BLOCK_K)
-    a_ptr = (input_ptr + ram[:, None] * input_d0_stride +
-             offset_k[None, :] * input_d1_stride)
-    b_ptr = (cur_lora_ptr + lora_d0_stride * lora_index +
-             rbn[None, :] * lora_d1_stride +
-             offset_k[:, None] * lora_d2_stride)
+    a_ptr = (
+        input_ptr + ram[:, None] * input_d0_stride + offset_k[None, :] * input_d1_stride
+    )
+    b_ptr = (
+        cur_lora_ptr
+        + lora_d0_stride * lora_index
+        + rbn[None, :] * lora_d1_stride
+        + offset_k[:, None] * lora_d2_stride
+    )
 
     # Compute partial/complete block matrix product.
-    accumulator = mm_k(a_ptr, b_ptr, input_d1_stride, lora_d2_stride, offset_k,
-                       K, BLOCK_M, BLOCK_N, BLOCK_K, EVEN_K, SPLIT_K, False,
-                       cur_lora_ptr.dtype.element_ty)
+    accumulator = mm_k(
+        a_ptr,
+        b_ptr,
+        input_d1_stride,
+        lora_d2_stride,
+        offset_k,
+        K,
+        BLOCK_M,
+        BLOCK_N,
+        BLOCK_K,
+        EVEN_K,
+        SPLIT_K,
+        False,
+        cur_lora_ptr.dtype.element_ty,
+    )
 
     # Identify the C output pointers to store the results of the accumulator.
     offset_cn = tl.arange(0, BLOCK_N) + pid_n * BLOCK_N
     offset_cm = tl.arange(0, BLOCK_M)
-    cur_out_ptr = (out_ptr if SLICE_NUM == 1 else out_ptr +
-                   slice_id * output_d0_stride)
-    c_ptr = cur_out_ptr + ram[:, None] * output_d1_stride + offset_cn[
-        None, :] * output_d2_stride
+    cur_out_ptr = out_ptr if SLICE_NUM == 1 else out_ptr + slice_id * output_d0_stride
+    c_ptr = (
+        cur_out_ptr
+        + ram[:, None] * output_d1_stride
+        + offset_cn[None, :] * output_d2_stride
+    )
     c_mask = (offset_cm[:, None] < M_LEN) & (offset_cn[None, :] < N)
 
     accumulator *= scaling
diff --git a/vllm/lora/ops/triton_ops/lora_expand_op.py b/vllm/lora/ops/triton_ops/lora_expand_op.py
index 467cbaa8af48..a7a552b9903d 100644
--- a/vllm/lora/ops/triton_ops/lora_expand_op.py
+++ b/vllm/lora/ops/triton_ops/lora_expand_op.py
@@ -17,35 +17,35 @@
 
 @triton.jit
 def _lora_expand_kernel(
-        input_ptr,
-        lora_ptr,
-        out_ptr,
-        M,
-        N,
-        K,
-        token_indices_sorted_by_lora_ids,
-        num_tokens_per_lora,
-        lora_token_start_loc,
-        lora_ids,
-        slice_start_loc,
-        input_d0_stride,
-        input_d1_stride,
-        input_d2_stride,  # 1
-        ls_d0_ptr,
-        ls_d1_ptr,
-        ls_d2_ptr,  # 1
-        output_d0_stride,
-        output_d1_stride,  # 1
-        output_hs_ptr,
-        BLOCK_M: tl.constexpr,
-        BLOCK_N: tl.constexpr,
-        BLOCK_K: tl.constexpr,
-        EVEN_K: tl.constexpr,
-        ADD_INPUTS: tl.constexpr,
-        CAST_TYPE: tl.constexpr,
-        SLICE_NUM: tl.constexpr,
-        SAME_STRIDE: tl.constexpr):
-
+    input_ptr,
+    lora_ptr,
+    out_ptr,
+    M,
+    N,
+    K,
+    token_indices_sorted_by_lora_ids,
+    num_tokens_per_lora,
+    lora_token_start_loc,
+    lora_ids,
+    slice_start_loc,
+    input_d0_stride,
+    input_d1_stride,
+    input_d2_stride,  # 1
+    ls_d0_ptr,
+    ls_d1_ptr,
+    ls_d2_ptr,  # 1
+    output_d0_stride,
+    output_d1_stride,  # 1
+    output_hs_ptr,
+    BLOCK_M: tl.constexpr,
+    BLOCK_N: tl.constexpr,
+    BLOCK_K: tl.constexpr,
+    EVEN_K: tl.constexpr,
+    ADD_INPUTS: tl.constexpr,
+    CAST_TYPE: tl.constexpr,
+    SLICE_NUM: tl.constexpr,
+    SAME_STRIDE: tl.constexpr,
+):
     cta_n_num = tl.cdiv(N, BLOCK_N)
     cta_m_num = tl.cdiv(M, BLOCK_M)
 
@@ -81,8 +81,9 @@ def _lora_expand_kernel(
 
     # Identify all rows that this CTA should process.
     lora_m_indices_start = tl.load(lora_token_start_loc + lora_idx)
-    cta_lora_seq_indices = (token_indices_sorted_by_lora_ids +
-                            lora_m_indices_start + cta_m_offset)
+    cta_lora_seq_indices = (
+        token_indices_sorted_by_lora_ids + lora_m_indices_start + cta_m_offset
+    )
 
     # Load all relevant row indices.
     offset_m = tl.arange(0, BLOCK_M) % cta_m_len
@@ -119,22 +120,21 @@ def _lora_expand_kernel(
         SLICE_NUM,
         EVEN_K,
         CAST_TYPE,
-        ADD_INPUTS)
+        ADD_INPUTS,
+    )
 
 
 @torch.inference_mode()
 def _lora_expand(
     inputs: torch.Tensor,  # shape [num_slices, num_tokens, lora_rank]
-    lora_b_weights: list[
-        torch.Tensor],  # shape [num_lora, hidden_size, lora_rank]
-    output_tensor: torch.
-    Tensor,  # shape [num_tokens, hidden_size * num_slices]
+    lora_b_weights: list[torch.Tensor],  # shape [num_lora, hidden_size, lora_rank]
+    output_tensor: torch.Tensor,  # shape [num_tokens, hidden_size * num_slices]
     token_lora_mapping: torch.Tensor,  # shape [num_tokens]
     token_indices_sorted_by_lora_ids: torch.Tensor,  # shape [num_tokens]
     num_tokens_per_lora: torch.Tensor,  # shape [max-loras + 1]
     lora_token_start_loc: torch.Tensor,  # shape [max-loras + 2]
     lora_ids: torch.Tensor,  # shape [max-loras + 1]
-    no_lora_flag_cpu: torch.Tensor,  # shape [1] 
+    no_lora_flag_cpu: torch.Tensor,  # shape [1]
     offset_start: int = 0,
     add_inputs: bool = False,
 ) -> None:
@@ -149,7 +149,7 @@ def _lora_expand(
         token_indices_sorted_by_lora_ids (torch.Tensor): Row/Token indices from
             the A matrix grouped by LoRA IDs.
         num_tokens_per_lora (torch.Tensor): num_tokens_per_lora[i] is the number
-            of tokens that are to be processed by LoRA ID lora_ids[i] 
+            of tokens that are to be processed by LoRA ID lora_ids[i]
         lora_token_start_loc (torch.Tensor): A cumulative sum of
             num_tokens_per_lora. lora_token_start_loc[0] is always 0 so that
             lora_token_start_loc[i], along with num_tokens_per_lora[i]
@@ -158,9 +158,9 @@ def _lora_expand(
         lora_ids (torch.Tensor): LoRA ids to process.
         no_lora_flag_cpu (torch.Tensor): A CPU tensor of size 1, that indicates
             if there are any requests that require LoRA.
-        offset_start (int, optional): Offset start for output_tensor. 
+        offset_start (int, optional): Offset start for output_tensor.
             Defaults to 0.
-        add_inputs (bool, optional): Whether to add the input tensor to the 
+        add_inputs (bool, optional): Whether to add the input tensor to the
             output tensor. Defaults to False.
     """
 
@@ -179,15 +179,20 @@ def _lora_expand(
     # metadata sanity check.
     M = inputs.size(1)
     assert token_lora_mapping.size(0) == M
-    assert token_lora_mapping.size(0) == token_indices_sorted_by_lora_ids.size(
-        0)
+    assert token_lora_mapping.size(0) == token_indices_sorted_by_lora_ids.size(0)
     assert lora_ids.size(0) == num_tokens_per_lora.size(0)
     assert lora_token_start_loc.size(0) == lora_ids.size(0) + 1
 
-    (slice_start_tensor, lora_ptr_tensor, lora_strides_d0_tensor,
-     lora_strides_d1_tensor, lora_strides_d2_tensor, hidden_sizes_tensor,
-     same_stride, MAX_N) = _get_lora_b_ptr(lora_b_weights, offset_start,
-                                           inputs.device)
+    (
+        slice_start_tensor,
+        lora_ptr_tensor,
+        lora_strides_d0_tensor,
+        lora_strides_d1_tensor,
+        lora_strides_d2_tensor,
+        hidden_sizes_tensor,
+        same_stride,
+        MAX_N,
+    ) = _get_lora_b_ptr(lora_b_weights, offset_start, inputs.device)
 
     K = lora_b_weights[0].shape[-1]  # K= rank
     ADD_INPUTS = add_inputs
@@ -206,8 +211,8 @@ def _lora_expand(
     EVEN_K = K % BLOCK_K == 0  # type: ignore
 
     if inputs.dtype == torch.float32 and lora_b_weights[0].dtype in [
-            torch.float16,
-            torch.bfloat16,
+        torch.float16,
+        torch.bfloat16,
     ]:
         CAST_TYPE = True
 
diff --git a/vllm/lora/ops/triton_ops/lora_kernel_metadata.py b/vllm/lora/ops/triton_ops/lora_kernel_metadata.py
index e27604728ed0..df343305d710 100644
--- a/vllm/lora/ops/triton_ops/lora_kernel_metadata.py
+++ b/vllm/lora/ops/triton_ops/lora_kernel_metadata.py
@@ -30,39 +30,35 @@ class LoRAKernelMeta:
     no_lora_flag_cpu: torch.Tensor
 
     @staticmethod
-    def make(max_loras: int, max_num_tokens: int,
-             device: Union[torch.device, str]) -> "LoRAKernelMeta":
-
-        token_lora_mapping = torch.empty(max_num_tokens,
-                                         dtype=torch.int32,
-                                         device=device)
+    def make(
+        max_loras: int, max_num_tokens: int, device: Union[torch.device, str]
+    ) -> "LoRAKernelMeta":
+        token_lora_mapping = torch.empty(
+            max_num_tokens, dtype=torch.int32, device=device
+        )
 
-        token_indices_sorted_by_lora_ids = torch.empty(max_num_tokens,
-                                                       dtype=torch.int32,
-                                                       device=device)
+        token_indices_sorted_by_lora_ids = torch.empty(
+            max_num_tokens, dtype=torch.int32, device=device
+        )
 
         # +1 because "no-lora" is also a possibility
         # example: let max_loras be 3, active_lora_ids of [-1, 0, 2, 1]
         # is a possibility.
-        active_lora_ids = torch.empty(max_loras + 1,
-                                      dtype=torch.int32,
-                                      device=device)
+        active_lora_ids = torch.empty(max_loras + 1, dtype=torch.int32, device=device)
 
         # using running example, [3, 10, 5, 2] is a possibility.
-        num_tokens_per_lora = torch.zeros(max_loras + 1,
-                                          dtype=torch.int32,
-                                          device=device)
+        num_tokens_per_lora = torch.zeros(
+            max_loras + 1, dtype=torch.int32, device=device
+        )
 
         # +2 for this because, the first index is always 0.
         # using running example, lora_token_start_loc
         # is [0, 3, 13, 18, 20].
-        lora_token_start_loc = torch.zeros(max_loras + 2,
-                                           dtype=torch.int32,
-                                           device=device)
+        lora_token_start_loc = torch.zeros(
+            max_loras + 2, dtype=torch.int32, device=device
+        )
 
-        no_lora_flag_cpu = torch.tensor([False],
-                                        dtype=torch.bool,
-                                        device='cpu')
+        no_lora_flag_cpu = torch.tensor([False], dtype=torch.bool, device="cpu")
 
         return LoRAKernelMeta(
             token_lora_mapping=token_lora_mapping,
@@ -70,7 +66,8 @@ def make(max_loras: int, max_num_tokens: int,
             active_lora_ids=active_lora_ids,
             num_tokens_per_lora=num_tokens_per_lora,
             lora_token_start_loc=lora_token_start_loc,
-            no_lora_flag_cpu=no_lora_flag_cpu)
+            no_lora_flag_cpu=no_lora_flag_cpu,
+        )
 
     def _reset(self):
         self.active_lora_ids.fill_(-1)
@@ -100,34 +97,44 @@ def prepare_tensors(self, token_lora_mapping: torch.Tensor) -> None:
         num_tokens = token_lora_mapping.size(0)
 
         # copy token lora mapping
-        self.token_lora_mapping[:num_tokens].copy_(token_lora_mapping,
-                                                   non_blocking=True)
+        self.token_lora_mapping[:num_tokens].copy_(
+            token_lora_mapping, non_blocking=True
+        )
 
         # token_indices_sorted_by_lora_ids
-        _, token_indices_sorted_by_lora_ids = torch.sort(token_lora_mapping,
-                                                         stable=True)
+        _, token_indices_sorted_by_lora_ids = torch.sort(
+            token_lora_mapping, stable=True
+        )
         # start gpu transfer
         self.token_indices_sorted_by_lora_ids[:num_tokens].copy_(
-            token_indices_sorted_by_lora_ids, non_blocking=True)
+            token_indices_sorted_by_lora_ids, non_blocking=True
+        )
 
         # active_lora_ids, num_tokens_per_lora
-        lora_ids, num_tokens_per_lora = torch.unique(token_lora_mapping,
-                                                     sorted=True,
-                                                     return_counts=True)
-        self.active_lora_ids[:lora_ids.size(0)].copy_(lora_ids,
-                                                      non_blocking=True)
-        self.num_tokens_per_lora[:num_tokens_per_lora.size(0)].copy_(
-            num_tokens_per_lora, non_blocking=True)
+        lora_ids, num_tokens_per_lora = torch.unique(
+            token_lora_mapping, sorted=True, return_counts=True
+        )
+        self.active_lora_ids[: lora_ids.size(0)].copy_(lora_ids, non_blocking=True)
+        self.num_tokens_per_lora[: num_tokens_per_lora.size(0)].copy_(
+            num_tokens_per_lora, non_blocking=True
+        )
 
         # lora_token_start_loc
         lora_token_start_loc = torch.cumsum(num_tokens_per_lora, dim=0)
-        self.lora_token_start_loc[1:1 + lora_token_start_loc.size(0)].copy_(
-            lora_token_start_loc, non_blocking=True)
+        self.lora_token_start_loc[1 : 1 + lora_token_start_loc.size(0)].copy_(
+            lora_token_start_loc, non_blocking=True
+        )
 
     def meta_args(
         self, token_nums: int
-    ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor, torch.Tensor,
-               torch.Tensor, torch.Tensor]:
+    ) -> tuple[
+        torch.Tensor,
+        torch.Tensor,
+        torch.Tensor,
+        torch.Tensor,
+        torch.Tensor,
+        torch.Tensor,
+    ]:
         """
         This function returns the kernel metadata required for the current
         forward pass execution of the kernel. The function returns all the
diff --git a/vllm/lora/ops/triton_ops/lora_shrink_op.py b/vllm/lora/ops/triton_ops/lora_shrink_op.py
index 57da93c226d2..1e7e43e30de7 100644
--- a/vllm/lora/ops/triton_ops/lora_shrink_op.py
+++ b/vllm/lora/ops/triton_ops/lora_shrink_op.py
@@ -2,8 +2,8 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """
 Based on:
-Chen, L., Ye, Z., Wu, Y., Zhuo, D., Ceze, L., & Krishnamurthy, A. (2023). 
-Punica: Multi-Tenant LoRA Serving. 
+Chen, L., Ye, Z., Wu, Y., Zhuo, D., Ceze, L., & Krishnamurthy, A. (2023).
+Punica: Multi-Tenant LoRA Serving.
 https://arxiv.org/abs/2310.18547
 """
 
@@ -16,16 +16,33 @@
 
 
 @triton.jit
-def _lora_shrink_kernel(input_ptr, lora_ptr, out_ptr, M, N, K,
-                        token_indices_sorted_by_lora_ids, num_tokens_per_lora,
-                        lora_token_start_loc, lora_ids, scaling,
-                        input_d0_stride, input_d1_stride, lora_d0_stride,
-                        lora_d1_stride, lora_d2_stride, output_d0_stride,
-                        output_d1_stride, output_d2_stride,
-                        BLOCK_M: tl.constexpr, BLOCK_N: tl.constexpr,
-                        BLOCK_K: tl.constexpr, EVEN_K: tl.constexpr,
-                        SPLIT_K: tl.constexpr, SLICE_NUM: tl.constexpr):
-
+def _lora_shrink_kernel(
+    input_ptr,
+    lora_ptr,
+    out_ptr,
+    M,
+    N,
+    K,
+    token_indices_sorted_by_lora_ids,
+    num_tokens_per_lora,
+    lora_token_start_loc,
+    lora_ids,
+    scaling,
+    input_d0_stride,
+    input_d1_stride,
+    lora_d0_stride,
+    lora_d1_stride,
+    lora_d2_stride,
+    output_d0_stride,
+    output_d1_stride,
+    output_d2_stride,
+    BLOCK_M: tl.constexpr,
+    BLOCK_N: tl.constexpr,
+    BLOCK_K: tl.constexpr,
+    EVEN_K: tl.constexpr,
+    SPLIT_K: tl.constexpr,
+    SLICE_NUM: tl.constexpr,
+):
     cta_n_num = tl.cdiv(N, BLOCK_N)
     cta_m_num = tl.cdiv(M, BLOCK_M)
 
@@ -54,8 +71,9 @@ def _lora_shrink_kernel(input_ptr, lora_ptr, out_ptr, M, N, K,
 
     # Identify all rows that this CTA should process.
     lora_m_indices_start = tl.load(lora_token_start_loc + lora_idx)
-    cta_lora_seq_indices = (token_indices_sorted_by_lora_ids +
-                            lora_m_indices_start + cta_m_offset)
+    cta_lora_seq_indices = (
+        token_indices_sorted_by_lora_ids + lora_m_indices_start + cta_m_offset
+    )
 
     # Load all relevant row indices.
     offset_m = tl.arange(0, BLOCK_M) % cta_m_len
@@ -90,17 +108,17 @@ def _lora_shrink_kernel(input_ptr, lora_ptr, out_ptr, M, N, K,
         BLOCK_K,
         EVEN_K,
         SPLIT_K,
-        SLICE_NUM)
+        SLICE_NUM,
+    )
 
 
 @torch.inference_mode()
 def _lora_shrink(
     inputs: torch.Tensor,  #  shape [num_tokens, hidden_size]
-    lora_a_weights: list[
-        torch.Tensor],  # shape [num_loras, lora_rank, hidden_size]
+    lora_a_weights: list[torch.Tensor],  # shape [num_loras, lora_rank, hidden_size]
     output_tensor: torch.Tensor,  # shape [num_slices, num_tokens, lora_rank]
     token_lora_mapping: torch.Tensor,  # shape [num_tokens]
-    token_indices_sorted_by_lora_ids: torch.Tensor,  # shape [num_tokens] 
+    token_indices_sorted_by_lora_ids: torch.Tensor,  # shape [num_tokens]
     num_tokens_per_lora: torch.Tensor,  # shape [max-loras + 1]
     lora_token_start_loc: torch.Tensor,  # shape [max-loras + 2]
     lora_ids: torch.Tensor,  # shape [max-loras + 1]
@@ -118,7 +136,7 @@ def _lora_shrink(
         token_indices_sorted_by_lora_ids (torch.Tensor): Row/Token indices from
             the A matrix grouped by LoRA IDs.
         num_tokens_per_lora (torch.Tensor): num_tokens_per_lora[i] is the number
-            of tokens that are to be processed by LoRA ID lora_ids[i] 
+            of tokens that are to be processed by LoRA ID lora_ids[i]
         lora_token_start_loc (torch.Tensor): A cumulative sum of
             num_tokens_per_lora. lora_token_start_loc[0] is always 0 so that
             lora_token_start_loc[i], along with num_tokens_per_lora[i]
@@ -147,13 +165,13 @@ def _lora_shrink(
     # metadata sanity check
     M = inputs.size(0)
     assert token_lora_mapping.size(0) == M
-    assert token_lora_mapping.size(0) == token_indices_sorted_by_lora_ids.size(
-        0)
+    assert token_lora_mapping.size(0) == token_indices_sorted_by_lora_ids.size(0)
     assert lora_ids.size(0) == num_tokens_per_lora.size(0)
     assert lora_token_start_loc.size(0) == lora_ids.size(0) + 1
 
-    (lora_ptr_tensor, lora_strides_d0, lora_strides_d1,
-     lora_strides_d2) = _get_lora_a_ptr(lora_a_weights, inputs.device)
+    (lora_ptr_tensor, lora_strides_d0, lora_strides_d1, lora_strides_d2) = (
+        _get_lora_a_ptr(lora_a_weights, inputs.device)
+    )
     N, K = lora_a_weights[0].shape[-2:]  # K=hidden_size,N=rank
     NUM_SLICES = len(lora_a_weights)
     MAX_LORAS = lora_ids.size(0)
diff --git a/vllm/lora/ops/triton_ops/utils.py b/vllm/lora/ops/triton_ops/utils.py
index 4c50fbd27051..3a3e8fc8931e 100644
--- a/vllm/lora/ops/triton_ops/utils.py
+++ b/vllm/lora/ops/triton_ops/utils.py
@@ -9,9 +9,9 @@
 
 def _get_lora_a_ptr(lora_a_weights: list[torch.Tensor], device: torch.device):
     """
-    `_LORA_A_PTR_DICT` collects the required information during `profile_run`, 
+    `_LORA_A_PTR_DICT` collects the required information during `profile_run`,
     After this, it remains constant and subsequent usage is through LUT.
-    Refer to: 
+    Refer to:
     https://github.com/triton-lang/triton/blob/release/3.1.x/python/tutorials/08-grouped-gemm.py
     """
     key = tuple(lora_weight.data_ptr() for lora_weight in lora_a_weights)
@@ -35,14 +35,15 @@ def _get_lora_a_ptr(lora_a_weights: list[torch.Tensor], device: torch.device):
         lora_strides_d1.append(lora_a_weight.stride(1))
         lora_strides_d2.append(lora_a_weight.stride(2))
     if len(lora_a_weights) > 1:
-        lora_ptr_tensor = torch.tensor(tensor_ptrs,
-                                       device=device,
-                                       dtype=torch.uint64)
+        lora_ptr_tensor = torch.tensor(tensor_ptrs, device=device, dtype=torch.uint64)
     else:
         lora_ptr_tensor = lora_a_weights[0]
 
-    if (len(set(lora_strides_d0)) > 1 or len(set(lora_strides_d1)) > 1
-            or len(set(lora_strides_d2)) > 1):
+    if (
+        len(set(lora_strides_d0)) > 1
+        or len(set(lora_strides_d1)) > 1
+        or len(set(lora_strides_d2)) > 1
+    ):
         raise ValueError("All LoRA weights must have the same stride.")
 
     _LORA_A_PTR_DICT[key] = (
@@ -54,12 +55,13 @@ def _get_lora_a_ptr(lora_a_weights: list[torch.Tensor], device: torch.device):
     return _LORA_A_PTR_DICT.get(key)
 
 
-def _get_lora_b_ptr(lora_weights: list[torch.Tensor], offset_start: int,
-                    device: torch.device):
-    """ 
-     `_LORA_B_PTR_DICT` collects the required information during `profile_run`, 
+def _get_lora_b_ptr(
+    lora_weights: list[torch.Tensor], offset_start: int, device: torch.device
+):
+    """
+     `_LORA_B_PTR_DICT` collects the required information during `profile_run`,
     After this, it remains constant and subsequent usage is through LUT.
-    Refer to: 
+    Refer to:
     https://github.com/triton-lang/triton/blob/release/3.1.x/python/tutorials/08-grouped-gemm.py
 
     """
@@ -91,20 +93,21 @@ def _get_lora_b_ptr(lora_weights: list[torch.Tensor], offset_start: int,
 
     if len(lora_weights) > 1:
         # note these are device tensors
-        lora_ptr_tensor = torch.tensor(tensor_ptrs,
-                                       device=device,
-                                       dtype=torch.uint64)
-        slice_start_tensor = torch.tensor(slice_offset_lst,
-                                          device=device,
-                                          dtype=torch.uint64)
+        lora_ptr_tensor = torch.tensor(tensor_ptrs, device=device, dtype=torch.uint64)
+        slice_start_tensor = torch.tensor(
+            slice_offset_lst, device=device, dtype=torch.uint64
+        )
     else:
         slice_start_tensor = slice_offset_lst[0]
         lora_ptr_tensor = lora_b_weight[0]
 
     # If each lora has the same stride, there's no need to use a
     # tensor for storage.
-    if (len(set(lora_strides_d0)) == 1 and len(set(lora_strides_d1)) == 1 and
-            len(set(lora_strides_d2)) == 1) and len(set(hidden_sizes)) == 1:
+    if (
+        len(set(lora_strides_d0)) == 1
+        and len(set(lora_strides_d1)) == 1
+        and len(set(lora_strides_d2)) == 1
+    ) and len(set(hidden_sizes)) == 1:
         lora_strides_d0_tensor = lora_strides_d0[0]
         lora_strides_d1_tensor = lora_strides_d1[0]
         lora_strides_d2_tensor = lora_strides_d2[0]
@@ -119,8 +122,14 @@ def _get_lora_b_ptr(lora_weights: list[torch.Tensor], offset_start: int,
         same_stride = False
     # MAX_N is the maximum hidden size among all the lora_b weights
     MAX_N = max(hidden_sizes)
-    _LORA_B_PTR_DICT[key] = (slice_start_tensor, lora_ptr_tensor,
-                             lora_strides_d0_tensor, lora_strides_d1_tensor,
-                             lora_strides_d2_tensor, hidden_sizes_tensor,
-                             same_stride, MAX_N)
+    _LORA_B_PTR_DICT[key] = (
+        slice_start_tensor,
+        lora_ptr_tensor,
+        lora_strides_d0_tensor,
+        lora_strides_d1_tensor,
+        lora_strides_d2_tensor,
+        hidden_sizes_tensor,
+        same_stride,
+        MAX_N,
+    )
     return _LORA_B_PTR_DICT.get(key)
diff --git a/vllm/lora/ops/xla_ops/__init__.py b/vllm/lora/ops/xla_ops/__init__.py
index 7e7c3c892457..b5570ceca68c 100644
--- a/vllm/lora/ops/xla_ops/__init__.py
+++ b/vllm/lora/ops/xla_ops/__init__.py
@@ -1,7 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from vllm.lora.ops.xla_ops.lora_ops import (bgmv_expand, bgmv_expand_slice,
-                                            bgmv_shrink)
+from vllm.lora.ops.xla_ops.lora_ops import bgmv_expand, bgmv_expand_slice, bgmv_shrink
 
 __all__ = ["bgmv_expand", "bgmv_expand_slice", "bgmv_shrink"]
diff --git a/vllm/lora/ops/xla_ops/lora_ops.py b/vllm/lora/ops/xla_ops/lora_ops.py
index 29bfd5753a58..4924890b388c 100644
--- a/vllm/lora/ops/xla_ops/lora_ops.py
+++ b/vllm/lora/ops/xla_ops/lora_ops.py
@@ -33,8 +33,7 @@ def bgmv_xla(inputs: torch.Tensor, loras: torch.Tensor, idxs: torch.IntTensor):
 
 
 @impl(XLA_LIB, "bgmv", "CompositeExplicitAutograd")
-def bgmv_non_xla(inputs: torch.Tensor, loras: torch.Tensor,
-                 idxs: torch.IntTensor):
+def bgmv_non_xla(inputs: torch.Tensor, loras: torch.Tensor, idxs: torch.IntTensor):
     T, _ = inputs.shape
     if len(loras.shape) == 4:
         loras = loras.squeeze(axis=1)
@@ -73,13 +72,12 @@ def bgmv_expand(
         limit = 1
 
     if output_tensor.shape[1] > outputs.shape[1]:
-        outputs = F.pad(outputs,
-                        (0, output_tensor.shape[1] - outputs.shape[1], 0, 0))
+        outputs = F.pad(outputs, (0, output_tensor.shape[1] - outputs.shape[1], 0, 0))
 
     if add_inputs:
-        return output_tensor + outputs[:limit, :output_tensor.shape[1]]
+        return output_tensor + outputs[:limit, : output_tensor.shape[1]]
     else:
-        return outputs[:limit, :output_tensor.shape[1]]
+        return outputs[:limit, : output_tensor.shape[1]]
 
 
 def bgmv_shrink(
@@ -98,8 +96,7 @@ def bgmv_shrink(
         scaling (float, optional): Scalar multiplier applied to the output.
     """
 
-    return scaling * torch.ops.xla.bgmv(inputs, lora_b_weights,
-                                        lora_indices_tensor)
+    return scaling * torch.ops.xla.bgmv(inputs, lora_b_weights, lora_indices_tensor)
 
 
 def bgmv_expand_slice(
diff --git a/vllm/lora/peft_helper.py b/vllm/lora/peft_helper.py
index dc7249c38602..48412eab92d8 100644
--- a/vllm/lora/peft_helper.py
+++ b/vllm/lora/peft_helper.py
@@ -18,9 +18,9 @@
 
 @dataclass
 class PEFTHelper:
-    """ 
+    """
     A helper class for PEFT configurations, specifically designed for LoRA.
-    This class handles configuration validation, compatibility checks for 
+    This class handles configuration validation, compatibility checks for
     various LoRA implementations.
     """
 
@@ -71,37 +71,38 @@ def from_dict(cls, config_dict: dict) -> "PEFTHelper":
         # Identify any missing required fields
         missing_fields = required_fields - set(config_dict.keys())
         if missing_fields:
-            raise ValueError(
-                f"Missing required configuration fields: {missing_fields}")
+            raise ValueError(f"Missing required configuration fields: {missing_fields}")
 
         # Filter out fields that aren't defined in the class
-        filtered_dict = {
-            k: v
-            for k, v in config_dict.items() if k in class_fields
-        }
+        filtered_dict = {k: v for k, v in config_dict.items() if k in class_fields}
         return cls(**filtered_dict)
 
     @classmethod
     def from_local_dir(
-            cls,
-            lora_path: str,
-            max_position_embeddings: Optional[int],
-            tensorizer_config_dict: Optional[dict] = None) -> "PEFTHelper":
+        cls,
+        lora_path: str,
+        max_position_embeddings: Optional[int],
+        tensorizer_config_dict: Optional[dict] = None,
+    ) -> "PEFTHelper":
         lora_config_path = os.path.join(lora_path, "adapter_config.json")
 
         if tensorizer_config_dict:
             tensorizer_config = TensorizerConfig(**tensorizer_config_dict)
             tensorizer_args = tensorizer_config._construct_tensorizer_args()
             from tensorizer.stream_io import open_stream
-            lora_config_path = os.path.join(tensorizer_config.tensorizer_dir,
-                                            "adapter_config.json")
-            with open_stream(lora_config_path,
-                             mode="rb",
-                             **tensorizer_args.stream_kwargs) as f:
+
+            lora_config_path = os.path.join(
+                tensorizer_config.tensorizer_dir, "adapter_config.json"
+            )
+            with open_stream(
+                lora_config_path, mode="rb", **tensorizer_args.stream_kwargs
+            ) as f:
                 config = json.load(f)
 
-            logger.info("Successfully deserialized LoRA config from %s",
-                        tensorizer_config.tensorizer_dir)
+            logger.info(
+                "Successfully deserialized LoRA config from %s",
+                tensorizer_config.tensorizer_dir,
+            )
 
         else:
             with open(lora_config_path) as f:
@@ -112,16 +113,16 @@ def from_local_dir(
 
     def validate_legal(self, lora_config: LoRAConfig) -> None:
         """
-        Validates the LoRA configuration settings against application 
+        Validates the LoRA configuration settings against application
         constraints and requirements.
         """
         error_msg = self._validate_features()
         if self.r > lora_config.max_lora_rank:
             error_msg.append(
                 f"LoRA rank {self.r} is greater than max_lora_rank"
-                f" {lora_config.max_lora_rank}.")
+                f" {lora_config.max_lora_rank}."
+            )
         if self.bias != "none" and not lora_config.bias_enabled:
-            error_msg.append(
-                "Adapter bias cannot be used without bias_enabled.")
+            error_msg.append("Adapter bias cannot be used without bias_enabled.")
         if error_msg:
             raise ValueError(f"{' '.join(error_msg)}")
diff --git a/vllm/lora/punica_wrapper/punica_base.py b/vllm/lora/punica_wrapper/punica_base.py
index b3413de1c816..770c3cf7b073 100644
--- a/vllm/lora/punica_wrapper/punica_base.py
+++ b/vllm/lora/punica_wrapper/punica_base.py
@@ -2,8 +2,8 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """
 Based on:
-Chen, L., Ye, Z., Wu, Y., Zhuo, D., Ceze, L., & Krishnamurthy, A. (2023). 
-Punica: Multi-Tenant LoRA Serving. 
+Chen, L., Ye, Z., Wu, Y., Zhuo, D., Ceze, L., & Krishnamurthy, A. (2023).
+Punica: Multi-Tenant LoRA Serving.
 https://arxiv.org/abs/2310.18547
 """
 
@@ -81,39 +81,43 @@ def add_lora_embedding(
         **kwargs,
     ) -> Optional[torch.Tensor]:
         """
-        Applies lora  specifically for VocabParallelEmbeddingWithLoRA, 
+        Applies lora  specifically for VocabParallelEmbeddingWithLoRA,
         and this layer only requires the expand operation.
         """
         raise NotImplementedError
 
     @abstractmethod
-    def add_lora_linear(self,
-                        y: torch.Tensor,
-                        x: torch.Tensor,
-                        lora_a_stacked: tuple[torch.Tensor, ...],
-                        lora_b_stacked: tuple[torch.Tensor, ...],
-                        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
-                        scale: float,
-                        output_slices: tuple[int, ...],
-                        *,
-                        buffer: Optional[tuple[torch.Tensor, ...]] = None,
-                        **kwargs) -> Optional[torch.Tensor]:
+    def add_lora_linear(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_a_stacked: tuple[torch.Tensor, ...],
+        lora_b_stacked: tuple[torch.Tensor, ...],
+        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
+        scale: float,
+        output_slices: tuple[int, ...],
+        *,
+        buffer: Optional[tuple[torch.Tensor, ...]] = None,
+        **kwargs,
+    ) -> Optional[torch.Tensor]:
         """
-        Applicable to linear-related lora. 
+        Applicable to linear-related lora.
         """
 
         raise NotImplementedError
 
     @abstractmethod
-    def add_lora_logits(self,
-                        y: torch.Tensor,
-                        x: torch.Tensor,
-                        lora_a_stacked: torch.Tensor,
-                        lora_b_stacked: torch.Tensor,
-                        scale,
-                        *,
-                        buffer: Optional[torch.Tensor] = None,
-                        **kwargs) -> Optional[torch.Tensor]:
+    def add_lora_logits(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_a_stacked: torch.Tensor,
+        lora_b_stacked: torch.Tensor,
+        scale,
+        *,
+        buffer: Optional[torch.Tensor] = None,
+        **kwargs,
+    ) -> Optional[torch.Tensor]:
         """
         Applies lora  specifically for LogitsProcessorWithLoRA.
         """
@@ -122,41 +126,41 @@ def add_lora_logits(self,
 
 class PunicaWrapperBase(PunicaWrapperABC):
     """
-    PunicaWrapperBase is designed to manage and provide metadata for the punica 
-    kernel. The main function is to maintain the state information for 
+    PunicaWrapperBase is designed to manage and provide metadata for the punica
+    kernel. The main function is to maintain the state information for
     Multi-LoRA, and to provide the interface for the punica.
     """
 
-    def __init__(self, max_num_batched_tokens: int, max_batches: int,
-                 device: Union[torch.device, str], **kwargs):
-        self._token_lora_indices = torch.empty(max_num_batched_tokens,
-                                               dtype=torch.long,
-                                               device=device)
-        self._sampler_indices = torch.empty(max_num_batched_tokens,
-                                            dtype=torch.long,
-                                            device=device)
-        self._sampler_indices_padded = torch.empty(max_num_batched_tokens,
-                                                   dtype=torch.long,
-                                                   device=device)
-        self._embeddings_indices = torch.empty(2,
-                                               max_num_batched_tokens,
-                                               dtype=torch.long,
-                                               device=device)
+    def __init__(
+        self,
+        max_num_batched_tokens: int,
+        max_batches: int,
+        device: Union[torch.device, str],
+        **kwargs,
+    ):
+        self._token_lora_indices = torch.empty(
+            max_num_batched_tokens, dtype=torch.long, device=device
+        )
+        self._sampler_indices = torch.empty(
+            max_num_batched_tokens, dtype=torch.long, device=device
+        )
+        self._sampler_indices_padded = torch.empty(
+            max_num_batched_tokens, dtype=torch.long, device=device
+        )
+        self._embeddings_indices = torch.empty(
+            2, max_num_batched_tokens, dtype=torch.long, device=device
+        )
 
         # 4 is the number of indices tensors.
         # base_indices, sampler_indices, sampler_indices_padded,
         # embeddings_indices
         self.indices_len: list[Optional[int]] = [None] * 4
         # these attributes are the information required for sgmv kernel
-        self._seq_start_locs = torch.empty(max_batches,
-                                           dtype=torch.long,
-                                           device=device)
-        self._seq_lengths = torch.empty(max_batches,
-                                        dtype=torch.long,
-                                        device=device)
-        self._lora_indices_per_batch = torch.empty(max_batches,
-                                                   dtype=torch.long,
-                                                   device=device)
+        self._seq_start_locs = torch.empty(max_batches, dtype=torch.long, device=device)
+        self._seq_lengths = torch.empty(max_batches, dtype=torch.long, device=device)
+        self._lora_indices_per_batch = torch.empty(
+            max_batches, dtype=torch.long, device=device
+        )
         self.device: torch.device = device
         self.max_length: int = 0
         self.token_nums: int = 0
@@ -186,28 +190,33 @@ def _update_base_metadata(
             extra_vocab_size,
             self.device,
         )
-        self._token_lora_indices[:base_indices.shape[0]].copy_(base_indices)
-        self._sampler_indices[:sampler_indices.shape[0]].copy_(sampler_indices)
-        self._sampler_indices_padded[:sampler_indices_padded.shape[0]].copy_(
-            sampler_indices_padded)
-        self._embeddings_indices[:embeddings_indices.
-                                 shape[0], :embeddings_indices.shape[1]].copy_(
-                                     embeddings_indices)
+        self._token_lora_indices[: base_indices.shape[0]].copy_(base_indices)
+        self._sampler_indices[: sampler_indices.shape[0]].copy_(sampler_indices)
+        self._sampler_indices_padded[: sampler_indices_padded.shape[0]].copy_(
+            sampler_indices_padded
+        )
+        self._embeddings_indices[
+            : embeddings_indices.shape[0], : embeddings_indices.shape[1]
+        ].copy_(embeddings_indices)
 
         self.indices_len[:] = indices_len
 
-    def _update_prefill_metadata(self,
-                                 token_lora_tensor: torch.Tensor) -> None:
-
-        (b_seq_start_tensor, seq_length_tensor, lora_indices_tensor,
-         batch_size, max_length, token_nums,
-         no_lora) = compute_meta(token_lora_tensor)
-
-        self._seq_start_locs[:b_seq_start_tensor.shape[0]].copy_(
-            b_seq_start_tensor)
-        self._seq_lengths[:seq_length_tensor.shape[0]].copy_(seq_length_tensor)
-        self._lora_indices_per_batch[:lora_indices_tensor.shape[0]].copy_(
-            lora_indices_tensor)
+    def _update_prefill_metadata(self, token_lora_tensor: torch.Tensor) -> None:
+        (
+            b_seq_start_tensor,
+            seq_length_tensor,
+            lora_indices_tensor,
+            batch_size,
+            max_length,
+            token_nums,
+            no_lora,
+        ) = compute_meta(token_lora_tensor)
+
+        self._seq_start_locs[: b_seq_start_tensor.shape[0]].copy_(b_seq_start_tensor)
+        self._seq_lengths[: seq_length_tensor.shape[0]].copy_(seq_length_tensor)
+        self._lora_indices_per_batch[: lora_indices_tensor.shape[0]].copy_(
+            lora_indices_tensor
+        )
         self.batch_size = batch_size
         self.max_length = max_length
         self.token_nums = token_nums
@@ -240,35 +249,39 @@ def _apply_bias(
                 bias = bias.view(-1, bias.shape[-1])
                 bias = bias[indices]
                 bias[indices == -1] = 0
-                output[:, offset_left:offset_left + slice] += bias
+                output[:, offset_left : offset_left + slice] += bias
             offset_left += slice
 
         return output.view_as(org_output)
 
     @property
     def prefill_metadata(
-        self
+        self,
     ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor, int, int, int]:
         """
-        This property provides a convenient way to access the necessary 
+        This property provides a convenient way to access the necessary
         metadata for prefill-related  kernel computations.
             1. seq_start_locs: Tensor of sequence start positions.
             2. seq_lengths: Tensor of sequence lengths.
-            3. lora_indices_per_batch: Tensor of lora indices, and an index of 
+            3. lora_indices_per_batch: Tensor of lora indices, and an index of
                 -1 means no lora should be applied.
             4. batch_size: Batch size after clustering identical lora indices.
             5. max_length: The maximum sequence length in the batch.
             6. token_nums: The token numbers in the batch.
         """
-        return (self._seq_start_locs[:self.batch_size],
-                self._seq_lengths[:self.batch_size],
-                self._lora_indices_per_batch[:self.batch_size],
-                self.batch_size, self.max_length, self.token_nums)
+        return (
+            self._seq_start_locs[: self.batch_size],
+            self._seq_lengths[: self.batch_size],
+            self._lora_indices_per_batch[: self.batch_size],
+            self.batch_size,
+            self.max_length,
+            self.token_nums,
+        )
 
     @property
     def token_lora_indices(self) -> torch.Tensor:
         """
-        This property provides the lora indices corresponding to each token 
+        This property provides the lora indices corresponding to each token
         in the batch. An index of -1 means no lora should be applied.
         """
         token_lora_len = self.indices_len[0]
@@ -276,8 +289,8 @@ def token_lora_indices(self) -> torch.Tensor:
 
     @property
     def sampler_indices(self) -> torch.Tensor:
-        """ 
-        This property is used to access the lora indices specifically for 
+        """
+        This property is used to access the lora indices specifically for
         LogitsProcessorWithLoRA.
         """
         sampler_indices_len = self.indices_len[1]
@@ -294,18 +307,24 @@ def sampler_indices_padded(self) -> torch.Tensor:
     @property
     def embeddings_indices(self) -> torch.Tensor:
         """
-        This property provides access to the indices used for lora embeddings, 
+        This property provides access to the indices used for lora embeddings,
         specifically for VocabParallelEmbeddingWithLoRA.
         """
         embeddings_indices_len = self.indices_len[3]
         return self._embeddings_indices[:, :embeddings_indices_len]
 
-    def update_metadata(self, mapping: "LoRAMapping",
-                        lora_index_to_id: list[Optional[int]], max_loras: int,
-                        vocab_size: int, extra_vocab_size: int, **kwargs):
-
-        self._update_base_metadata(mapping, lora_index_to_id, max_loras,
-                                   vocab_size, extra_vocab_size)
+    def update_metadata(
+        self,
+        mapping: "LoRAMapping",
+        lora_index_to_id: list[Optional[int]],
+        max_loras: int,
+        vocab_size: int,
+        extra_vocab_size: int,
+        **kwargs,
+    ):
+        self._update_base_metadata(
+            mapping, lora_index_to_id, max_loras, vocab_size, extra_vocab_size
+        )
 
         if mapping.is_prefill:
             # Update metadata required for prefill-related operators.
@@ -315,16 +334,21 @@ def update_metadata(self, mapping: "LoRAMapping",
             self.is_prefill = False
 
     @abstractmethod
-    def add_shrink(self, y: Union[tuple[torch.Tensor, ...], torch.Tensor],
-                   x: torch.Tensor, lora_a_stacked: tuple[torch.Tensor, ...],
-                   scale: float, **kwargs) -> Optional[torch.Tensor]:
+    def add_shrink(
+        self,
+        y: Union[tuple[torch.Tensor, ...], torch.Tensor],
+        x: torch.Tensor,
+        lora_a_stacked: tuple[torch.Tensor, ...],
+        scale: float,
+        **kwargs,
+    ) -> Optional[torch.Tensor]:
         """
         Performs GEMM  for multiple slices of lora_a.
 
         Semantics:
         for i in range(len(lora_a_stacked)):
             y[i] += (x @ lora_a_stacked[i]) * scale
-        
+
         Args:
             y (Union[tuple[torch.Tensor, ...], torch.Tensor]): Output tensors
             x (torch.Tensor): Input tensor
@@ -336,31 +360,33 @@ def add_shrink(self, y: Union[tuple[torch.Tensor, ...], torch.Tensor],
         raise NotImplementedError
 
     @abstractmethod
-    def add_expand(self,
-                   y: torch.Tensor,
-                   x: Union[tuple[torch.Tensor, ...], torch.Tensor],
-                   lora_b_stacked: tuple[torch.Tensor, ...],
-                   lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
-                   output_slices: tuple[int, ...],
-                   offset_start: int = 0,
-                   add_inputs=True,
-                   **kwargs) -> Optional[torch.Tensor]:
+    def add_expand(
+        self,
+        y: torch.Tensor,
+        x: Union[tuple[torch.Tensor, ...], torch.Tensor],
+        lora_b_stacked: tuple[torch.Tensor, ...],
+        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
+        output_slices: tuple[int, ...],
+        offset_start: int = 0,
+        add_inputs=True,
+        **kwargs,
+    ) -> Optional[torch.Tensor]:
         """
         Performs GEMM and bias addition for multiple slices of lora_b.
-      
+
         Semantics:
             offset = offset_start
             for i in range(len(lora_b_stacked)):
                 slice = output_slices[i]
-                y[:, offset:offset+slice] += x[i] @ lora_b_stacked[i] + 
-                    lora_bias_stacked[i] 
+                y[:, offset:offset+slice] += x[i] @ lora_b_stacked[i] +
+                    lora_bias_stacked[i]
                 offset += slice
-            
+
         Args:
             y (torch.Tensor): Output tensor.
             x (Union[tuple[torch.Tensor, ...], torch.Tensor]): Input tensors
             lora_b_stacked (tuple[torch.Tensor, ...]): lora_b's weight
-            lora_bias_stacked (Optional[tuple[torch.Tensor, ...]]): 
+            lora_bias_stacked (Optional[tuple[torch.Tensor, ...]]):
                 bias's weight
             output_slices (tuple[int, ...]): Every slice's size
             offset_start (int): The starting position of y, defaults to 0
@@ -371,12 +397,14 @@ def add_expand(self,
         raise NotImplementedError
 
     @abstractmethod
-    def add_lora_embedding(self,
-                           y: torch.Tensor,
-                           x: torch.Tensor,
-                           lora_b_stacked: torch.Tensor,
-                           add_inputs: bool = True,
-                           **kwargs) -> Optional[torch.Tensor]:
+    def add_lora_embedding(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_b_stacked: torch.Tensor,
+        add_inputs: bool = True,
+        **kwargs,
+    ) -> Optional[torch.Tensor]:
         """
         Applies lora  specifically for VocabParallelEmbeddingWithLoRA.
         and this layer only requires the expand operation.
@@ -393,19 +421,21 @@ def add_lora_embedding(self,
         raise NotImplementedError
 
     @abstractmethod
-    def add_lora_linear(self,
-                        y: torch.Tensor,
-                        x: torch.Tensor,
-                        lora_a_stacked: tuple[torch.Tensor, ...],
-                        lora_b_stacked: tuple[torch.Tensor, ...],
-                        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
-                        scale: float,
-                        output_slices: tuple[int, ...],
-                        *,
-                        buffer: Optional[tuple[torch.Tensor, ...]] = None,
-                        **kwargs) -> Optional[torch.Tensor]:
-        """
-        Applicable to linear-related lora. 
+    def add_lora_linear(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_a_stacked: tuple[torch.Tensor, ...],
+        lora_b_stacked: tuple[torch.Tensor, ...],
+        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
+        scale: float,
+        output_slices: tuple[int, ...],
+        *,
+        buffer: Optional[tuple[torch.Tensor, ...]] = None,
+        **kwargs,
+    ) -> Optional[torch.Tensor]:
+        """
+        Applicable to linear-related lora.
 
         Semantics:
             for i in range(len(lora_a_stacked)):
@@ -430,18 +460,20 @@ def add_lora_linear(self,
         raise NotImplementedError
 
     @abstractmethod
-    def add_lora_logits(self,
-                        y: torch.Tensor,
-                        x: torch.Tensor,
-                        lora_a_stacked: torch.Tensor,
-                        lora_b_stacked: torch.Tensor,
-                        scale,
-                        *,
-                        buffer: Optional[torch.Tensor] = None,
-                        **kwargs) -> Optional[torch.Tensor]:
+    def add_lora_logits(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_a_stacked: torch.Tensor,
+        lora_b_stacked: torch.Tensor,
+        scale,
+        *,
+        buffer: Optional[torch.Tensor] = None,
+        **kwargs,
+    ) -> Optional[torch.Tensor]:
         """
         Applies lora  specifically for LogitsProcessorWithLoRA.
-        
+
         Semantics:
             buffer = (x @ lora_a_stacked) * scale
             y += buffer @ lora_b_stacked
diff --git a/vllm/lora/punica_wrapper/punica_cpu.py b/vllm/lora/punica_wrapper/punica_cpu.py
index 59049cccc8cb..c51a13db873c 100644
--- a/vllm/lora/punica_wrapper/punica_cpu.py
+++ b/vllm/lora/punica_wrapper/punica_cpu.py
@@ -5,9 +5,14 @@
 
 import torch
 
-from vllm.lora.ops.torch_ops import (bgmv_expand, bgmv_expand_slice,
-                                     bgmv_shrink, sgmv_expand,
-                                     sgmv_expand_slice, sgmv_shrink)
+from vllm.lora.ops.torch_ops import (
+    bgmv_expand,
+    bgmv_expand_slice,
+    bgmv_shrink,
+    sgmv_expand,
+    sgmv_expand_slice,
+    sgmv_shrink,
+)
 
 from .punica_base import PunicaWrapperBase
 
@@ -16,15 +21,19 @@
 # inherit this class
 class PunicaWrapperCPU(PunicaWrapperBase):
     """
-    PunicaWrapperCPU is designed to manage and provide metadata for the punica 
-    kernel. The main function is to maintain the state information for 
+    PunicaWrapperCPU is designed to manage and provide metadata for the punica
+    kernel. The main function is to maintain the state information for
     Multi-LoRA, and to provide the interface for the pytorch punica ops.
     """
 
-    def __init__(self, max_num_batched_tokens: int, max_batches: int,
-                 device: Union[torch.device, str], **kwargs):
-        PunicaWrapperBase.__init__(self, max_num_batched_tokens, max_batches,
-                                   device)
+    def __init__(
+        self,
+        max_num_batched_tokens: int,
+        max_batches: int,
+        device: Union[torch.device, str],
+        **kwargs,
+    ):
+        PunicaWrapperBase.__init__(self, max_num_batched_tokens, max_batches, device)
 
     def _shrink_prefill(
         self,
@@ -33,7 +42,7 @@ def _shrink_prefill(
         w_t_all: torch.Tensor,
         scale: float,
     ):
-        #No LoRA request, so return directly
+        # No LoRA request, so return directly
         if self.no_lora:
             return
         sgmv_shrink(
@@ -60,7 +69,7 @@ def _expand_prefill(
         w_t_all: torch.Tensor,
         add_inputs: bool,
     ):
-        #No LoRA request, so return directly
+        # No LoRA request, so return directly
         if self.no_lora:
             return
         sgmv_expand(
@@ -89,7 +98,7 @@ def _expand_slice_prefill(
         y_slice_size: int,
         add_inputs: bool,
     ):
-        #No LoRA request, so return directly
+        # No LoRA request, so return directly
         if self.no_lora:
             return
         sgmv_expand_slice(
@@ -111,8 +120,9 @@ def _expand_slice_decode(
         y_slice_size: int,
         add_inputs: bool,
     ):
-        bgmv_expand_slice(x, w_t_all, y, self.token_lora_indices, y_offset,
-                          y_slice_size, add_inputs)
+        bgmv_expand_slice(
+            x, w_t_all, y, self.token_lora_indices, y_offset, y_slice_size, add_inputs
+        )
 
     def _apply_expand(
         self,
@@ -124,18 +134,19 @@ def _apply_expand(
         add_inputs: bool = True,
     ):
         """
-        Perform the ` y[:,y_offset:y_offset+y_slice_size]+=x@w_t_all` 
+        Perform the ` y[:,y_offset:y_offset+y_slice_size]+=x@w_t_all`
         computation, which is suitable for the
         GEMM of lora'b.
         """
 
-        expand_slice_fun: Callable = (self._expand_slice_prefill
-                                      if self.is_prefill else
-                                      self._expand_slice_decode)
+        expand_slice_fun: Callable = (
+            self._expand_slice_prefill if self.is_prefill else self._expand_slice_decode
+        )
         expand_slice_fun(y, x, w_t_all, y_offset, y_slice_size, add_inputs)
 
-    def _apply_shrink(self, y: torch.Tensor, x: torch.Tensor,
-                      w_t_all: torch.Tensor, scale: float):
+    def _apply_shrink(
+        self, y: torch.Tensor, x: torch.Tensor, w_t_all: torch.Tensor, scale: float
+    ):
         """
         Perform the ` y+=x@w_t_all` computation, which is suitable for the
         GEMM of lora'a.
@@ -146,25 +157,31 @@ def _apply_shrink(self, y: torch.Tensor, x: torch.Tensor,
         """
         y_org = y
         y = y.view(-1, y.shape[-1])
-        shrink_fun: Callable = (self._shrink_prefill
-                                if self.is_prefill else self._shrink_decode)
+        shrink_fun: Callable = (
+            self._shrink_prefill if self.is_prefill else self._shrink_decode
+        )
         shrink_fun(y, x, w_t_all, scale)
         y = y.view_as(y_org)
 
-    def add_shrink(self, y: Union[tuple[torch.Tensor, ...], torch.Tensor],
-                   x: torch.Tensor, lora_a_stacked: tuple[torch.Tensor, ...],
-                   scale: float, **kwargs):
+    def add_shrink(
+        self,
+        y: Union[tuple[torch.Tensor, ...], torch.Tensor],
+        x: torch.Tensor,
+        lora_a_stacked: tuple[torch.Tensor, ...],
+        scale: float,
+        **kwargs,
+    ):
         """
         Performs GEMM  for multiple slices of lora_a.
         When `is_prefill is` true, it indicates that it is currently the
         prefill stage, and the `_shrink_prefill` function should be called.
         Otherwise, it is the decode stage, and the _shrink_decode function
         should be called.
-            
+
         Semantics:
         for i in range(len(lora_a_stacked)):
             y[i] += (x @ lora_a_stacked[i]) * scale
-        
+
         Args:
             y (Union[tuple[torch.Tensor, ...], torch.Tensor]): Output tensors
             x (torch.Tensor): Input tensor
@@ -175,33 +192,34 @@ def add_shrink(self, y: Union[tuple[torch.Tensor, ...], torch.Tensor],
         x = x.view(-1, x.shape[-1])
         # TODO fuse these kernels
         for slice_idx in range(len(lora_a_stacked)):
-            self._apply_shrink(y[slice_idx], x, lora_a_stacked[slice_idx],
-                               scale)
-
-    def add_expand(self,
-                   y: torch.Tensor,
-                   x: Union[tuple[torch.Tensor, ...], torch.Tensor],
-                   lora_b_stacked: tuple[torch.Tensor, ...],
-                   lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
-                   output_slices: tuple[int, ...],
-                   offset_start: int = 0,
-                   add_inputs=True,
-                   **kwargs) -> None:
+            self._apply_shrink(y[slice_idx], x, lora_a_stacked[slice_idx], scale)
+
+    def add_expand(
+        self,
+        y: torch.Tensor,
+        x: Union[tuple[torch.Tensor, ...], torch.Tensor],
+        lora_b_stacked: tuple[torch.Tensor, ...],
+        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
+        output_slices: tuple[int, ...],
+        offset_start: int = 0,
+        add_inputs=True,
+        **kwargs,
+    ) -> None:
         """
         Performs GEMM and bias addition for multiple slices of lora_b.
-      
+
         Semantics:
             for i in range(len(lora_b_stacked)):
                 slice = output_slices[i]
-                y[:, offset:offset+slice] += x[i] @ lora_b_stacked[i] + 
-                    lora_bias_stacked[i] 
+                y[:, offset:offset+slice] += x[i] @ lora_b_stacked[i] +
+                    lora_bias_stacked[i]
                 offset += slice
-            
+
         Args:
             y (torch.Tensor): Output tensor.
             x (Union[tuple[torch.Tensor, ...], torch.Tensor]): Input tensors
             lora_b_stacked (tuple[torch.Tensor, ...]): lora_b's weight
-            lora_bias_stacked (Optional[tuple[torch.Tensor, ...]]): 
+            lora_bias_stacked (Optional[tuple[torch.Tensor, ...]]):
                 bias's weight
             output_slices (tuple[int, ...]): Every slice's size
             add_inputs (bool):  Defaults to True.
@@ -210,8 +228,9 @@ def add_expand(self,
         y = y.view(-1, y.shape[-1])
         offset_left = offset_start
         if lora_bias_stacked is not None:
-            self._apply_bias(self.token_lora_indices, y, output_slices,
-                             lora_bias_stacked)
+            self._apply_bias(
+                self.token_lora_indices, y, output_slices, lora_bias_stacked
+            )
         for slice_idx in range(len(lora_b_stacked)):
             self._apply_expand(
                 y,
@@ -224,12 +243,14 @@ def add_expand(self,
             offset_left += output_slices[slice_idx]
         y = y.view_as(y_org)
 
-    def add_lora_embedding(self,
-                           y: torch.Tensor,
-                           x: torch.Tensor,
-                           lora_b_stacked: torch.Tensor,
-                           add_inputs: bool = True,
-                           **kwargs) -> None:
+    def add_lora_embedding(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_b_stacked: torch.Tensor,
+        add_inputs: bool = True,
+        **kwargs,
+    ) -> None:
         """
         Applies lora  specifically for VocabParallelEmbeddingWithLoRA.
 
@@ -244,23 +265,26 @@ def add_lora_embedding(self,
         """
 
         # Embedding layer only need expand op
-        expand_fun: Callable = (self._expand_prefill
-                                if self.is_prefill else self._expand_decode)
+        expand_fun: Callable = (
+            self._expand_prefill if self.is_prefill else self._expand_decode
+        )
         expand_fun(y, x, lora_b_stacked, add_inputs)
 
-    def add_lora_linear(self,
-                        y: torch.Tensor,
-                        x: torch.Tensor,
-                        lora_a_stacked: tuple[torch.Tensor, ...],
-                        lora_b_stacked: tuple[torch.Tensor, ...],
-                        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
-                        scale: float,
-                        output_slices: tuple[int, ...],
-                        *,
-                        buffer: Optional[tuple[torch.Tensor, ...]] = None,
-                        **kwargs) -> None:
+    def add_lora_linear(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_a_stacked: tuple[torch.Tensor, ...],
+        lora_b_stacked: tuple[torch.Tensor, ...],
+        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
+        scale: float,
+        output_slices: tuple[int, ...],
+        *,
+        buffer: Optional[tuple[torch.Tensor, ...]] = None,
+        **kwargs,
+    ) -> None:
         """
-        Applicable to linear-related lora. 
+        Applicable to linear-related lora.
 
         Semantics:
             for i in range(len(lora_a_stacked)):
@@ -285,38 +309,37 @@ def add_lora_linear(self,
         assert len(lora_a_stacked) == len(lora_b_stacked) == len(output_slices)
         if lora_bias_stacked is not None:
             assert len(lora_bias_stacked) == len(output_slices)
-            y = self._apply_bias(self.token_lora_indices, y, output_slices,
-                                 lora_bias_stacked)
+            y = self._apply_bias(
+                self.token_lora_indices, y, output_slices, lora_bias_stacked
+            )
 
         if buffer is None:
             r = lora_b_stacked[0].size(-1)
             # We set the buffer to be float32 by default, consistent with the
             # triton op
             buffer = tuple(
-                torch.zeros(
-                    (x.size(0), r), dtype=torch.float32, device=x.device)
-                for _ in range(len(output_slices)))
+                torch.zeros((x.size(0), r), dtype=torch.float32, device=x.device)
+                for _ in range(len(output_slices))
+            )
         self.add_shrink(buffer, x, lora_a_stacked, scale, **kwargs)
-        self.add_expand(y,
-                        buffer,
-                        lora_b_stacked,
-                        None,
-                        output_slices,
-                        add_inputs=True,
-                        **kwargs)
-
-    def add_lora_logits(self,
-                        y: torch.Tensor,
-                        x: torch.Tensor,
-                        lora_a_stacked: torch.Tensor,
-                        lora_b_stacked: torch.Tensor,
-                        scale,
-                        *,
-                        buffer: Optional[torch.Tensor] = None,
-                        **kwargs) -> None:
+        self.add_expand(
+            y, buffer, lora_b_stacked, None, output_slices, add_inputs=True, **kwargs
+        )
+
+    def add_lora_logits(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_a_stacked: torch.Tensor,
+        lora_b_stacked: torch.Tensor,
+        scale,
+        *,
+        buffer: Optional[torch.Tensor] = None,
+        **kwargs,
+    ) -> None:
         """
         Applies lora  specifically for LogitsProcessorWithLoRA.
-        
+
         Semantics:
             buffer = (x @ lora_a_stacked) * scale
             y += buffer @ lora_b_stacked
@@ -336,14 +359,8 @@ def add_lora_logits(self,
         if buffer is None:
             # We set the buffer to be float32 by default, consistent with the
             # triton op
-            buffer = torch.zeros((x.size(0), r),
-                                 dtype=torch.float32,
-                                 device=x.device)
+            buffer = torch.zeros((x.size(0), r), dtype=torch.float32, device=x.device)
         # LogitsProcessorWithLoRA always using bgmv.
         bgmv_shrink(x, lora_a_stacked, buffer, self.sampler_indices, scale)
-        bgmv_expand(buffer,
-                    lora_b_stacked,
-                    y,
-                    self.sampler_indices,
-                    add_inputs=True)
+        bgmv_expand(buffer, lora_b_stacked, y, self.sampler_indices, add_inputs=True)
         y = y.view_as(y_org)
diff --git a/vllm/lora/punica_wrapper/punica_gpu.py b/vllm/lora/punica_wrapper/punica_gpu.py
index 467f50050eb2..431e97102faf 100644
--- a/vllm/lora/punica_wrapper/punica_gpu.py
+++ b/vllm/lora/punica_wrapper/punica_gpu.py
@@ -2,8 +2,8 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """
 Based on:
-Chen, L., Ye, Z., Wu, Y., Zhuo, D., Ceze, L., & Krishnamurthy, A. (2023). 
-Punica: Multi-Tenant LoRA Serving. 
+Chen, L., Ye, Z., Wu, Y., Zhuo, D., Ceze, L., & Krishnamurthy, A. (2023).
+Punica: Multi-Tenant LoRA Serving.
 https://arxiv.org/abs/2310.18547
 """
 
@@ -15,8 +15,7 @@
 from vllm.triton_utils import HAS_TRITON
 
 if HAS_TRITON:
-    from vllm.lora.ops.triton_ops import (LoRAKernelMeta, lora_expand,
-                                          lora_shrink)
+    from vllm.lora.ops.triton_ops import LoRAKernelMeta, lora_expand, lora_shrink
 
 from .punica_base import PunicaWrapperBase
 
@@ -24,48 +23,63 @@
 @final
 class PunicaWrapperGPU(PunicaWrapperBase):
     """
-    PunicaWrapperGPU is designed to manage and provide metadata for the punica 
-    kernel. The main function is to maintain the state information for 
+    PunicaWrapperGPU is designed to manage and provide metadata for the punica
+    kernel. The main function is to maintain the state information for
     Multi-LoRA, and to provide the interface for the punica triton kernel.
     """
 
-    def __init__(self, max_num_batched_tokens: int, max_batches: int,
-                 device: Union[torch.device, str], **kwargs):
-        PunicaWrapperBase.__init__(self, max_num_batched_tokens, max_batches,
-                                   device)
+    def __init__(
+        self,
+        max_num_batched_tokens: int,
+        max_batches: int,
+        device: Union[torch.device, str],
+        **kwargs,
+    ):
+        PunicaWrapperBase.__init__(self, max_num_batched_tokens, max_batches, device)
 
-        self.max_loras = kwargs['max_loras']
+        self.max_loras = kwargs["max_loras"]
 
-        self.token_mapping_meta = LoRAKernelMeta.make(self.max_loras,
-                                                      max_num_batched_tokens,
-                                                      device=device)
-
-        self.prompt_mapping_meta = LoRAKernelMeta.make(self.max_loras,
-                                                       max_batches,
-                                                       device=device)
+        self.token_mapping_meta = LoRAKernelMeta.make(
+            self.max_loras, max_num_batched_tokens, device=device
+        )
 
-    def update_metadata(self, mapping: LoRAMapping,
-                        lora_index_to_id: list[Optional[int]], max_loras: int,
-                        vocab_size: int, extra_vocab_size: int, **kwargs):
+        self.prompt_mapping_meta = LoRAKernelMeta.make(
+            self.max_loras, max_batches, device=device
+        )
 
+    def update_metadata(
+        self,
+        mapping: LoRAMapping,
+        lora_index_to_id: list[Optional[int]],
+        max_loras: int,
+        vocab_size: int,
+        extra_vocab_size: int,
+        **kwargs,
+    ):
         self.is_prefill = mapping.is_prefill
-        self._update_base_metadata(mapping, lora_index_to_id, max_loras,
-                                   vocab_size, extra_vocab_size)
+        self._update_base_metadata(
+            mapping, lora_index_to_id, max_loras, vocab_size, extra_vocab_size
+        )
 
         # Prepare cuda kernel metadata tensors
         self.token_mapping_meta.prepare_tensors(self.token_lora_indices)
         self.prompt_mapping_meta.prepare_tensors(self.sampler_indices)
 
-    def add_shrink(self, y: torch.Tensor, x: torch.Tensor,
-                   lora_a_stacked: tuple[torch.Tensor,
-                                         ...], scale: float, **kwargs):
+    def add_shrink(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_a_stacked: tuple[torch.Tensor, ...],
+        scale: float,
+        **kwargs,
+    ):
         """
         Performs GEMM  for multiple slices of lora_a.
-            
+
         Semantics:
         for i in range(len(lora_a_stacked)):
             y[i] += (x @ lora_a_stacked[i]) * scale
-        
+
         Args:
             y (torch.Tensor): Output tensors
             x (torch.Tensor): Input tensor
@@ -82,30 +96,32 @@ def add_shrink(self, y: torch.Tensor, x: torch.Tensor,
             scale,
         )
 
-    def add_expand(self,
-                   y: torch.Tensor,
-                   x: torch.Tensor,
-                   lora_b_stacked: tuple[torch.Tensor, ...],
-                   lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
-                   output_slices: tuple[int, ...],
-                   offset_start: int = 0,
-                   add_inputs=True,
-                   **kwargs) -> None:
+    def add_expand(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_b_stacked: tuple[torch.Tensor, ...],
+        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
+        output_slices: tuple[int, ...],
+        offset_start: int = 0,
+        add_inputs=True,
+        **kwargs,
+    ) -> None:
         """
         Performs GEMM and bias addition for multiple slices of lora_b.
-      
+
         Semantics:
             for i in range(len(lora_b_stacked)):
                 slice = output_slices[i]
-                y[:, offset:offset+slice] += x[i] @ lora_b_stacked[i] + 
-                    lora_bias_stacked[i] 
+                y[:, offset:offset+slice] += x[i] @ lora_b_stacked[i] +
+                    lora_bias_stacked[i]
                 offset += slice
-            
+
         Args:
             y (torch.Tensor): Output tensor.
             x (torch.Tensor): Input tensors
             lora_b_stacked (tuple[torch.Tensor, ...]): lora_b's weight
-            lora_bias_stacked (Optional[tuple[torch.Tensor, ...]]): 
+            lora_bias_stacked (Optional[tuple[torch.Tensor, ...]]):
                 bias's weight
             output_slices (tuple[int, ...]): Every slice's size
             add_inputs (bool): Defaults to True.
@@ -113,10 +129,8 @@ def add_expand(self,
         y_org = y
         y = y.view(-1, y.shape[-1])
         if lora_bias_stacked is not None:
-            token_lora_indices = torch.narrow(self._token_lora_indices, 0, 0,
-                                              y.size(0))
-            self._apply_bias(token_lora_indices, y, output_slices,
-                             lora_bias_stacked)
+            token_lora_indices = torch.narrow(self._token_lora_indices, 0, 0, y.size(0))
+            self._apply_bias(token_lora_indices, y, output_slices, lora_bias_stacked)
 
         assert x.ndim == 3
         assert x.size(0) == len(output_slices)
@@ -133,12 +147,14 @@ def add_expand(self,
 
         y = y.view_as(y_org)
 
-    def add_lora_embedding(self,
-                           y: torch.Tensor,
-                           x: torch.Tensor,
-                           lora_b_stacked: torch.Tensor,
-                           add_inputs: bool = True,
-                           **kwargs) -> None:
+    def add_lora_embedding(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_b_stacked: torch.Tensor,
+        add_inputs: bool = True,
+        **kwargs,
+    ) -> None:
         """
         Applies lora  specifically for VocabParallelEmbeddingWithLoRA.
 
@@ -154,26 +170,28 @@ def add_lora_embedding(self,
 
         lora_expand(
             x.unsqueeze(dim=0),
-            (lora_b_stacked, ),
+            (lora_b_stacked,),
             y,
             *self.token_mapping_meta.meta_args(x.size(0)),
             offset_start=0,
             add_inputs=add_inputs,
         )
 
-    def add_lora_linear(self,
-                        y: torch.Tensor,
-                        x: torch.Tensor,
-                        lora_a_stacked: tuple[torch.Tensor, ...],
-                        lora_b_stacked: tuple[torch.Tensor, ...],
-                        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
-                        scale: float,
-                        output_slices: tuple[int, ...],
-                        *,
-                        buffer: Optional[torch.Tensor] = None,
-                        **kwargs) -> None:
+    def add_lora_linear(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_a_stacked: tuple[torch.Tensor, ...],
+        lora_b_stacked: tuple[torch.Tensor, ...],
+        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
+        scale: float,
+        output_slices: tuple[int, ...],
+        *,
+        buffer: Optional[torch.Tensor] = None,
+        **kwargs,
+    ) -> None:
         """
-        Applicable to linear-related lora. 
+        Applicable to linear-related lora.
 
         Semantics:
             for i in range(len(lora_a_stacked)):
@@ -198,10 +216,10 @@ def add_lora_linear(self,
         assert len(lora_a_stacked) == len(lora_b_stacked) == len(output_slices)
         if lora_bias_stacked is not None:
             assert len(lora_bias_stacked) == len(output_slices)
-            token_lora_indices = torch.narrow(self._token_lora_indices, 0, 0,
-                                              y.size(0))
-            y = self._apply_bias(token_lora_indices, y, output_slices,
-                                 lora_bias_stacked)
+            token_lora_indices = torch.narrow(self._token_lora_indices, 0, 0, y.size(0))
+            y = self._apply_bias(
+                token_lora_indices, y, output_slices, lora_bias_stacked
+            )
 
         if buffer is None:
             r = lora_b_stacked[0].size(-1)
@@ -217,7 +235,8 @@ def add_lora_linear(self,
             x,
             lora_a_stacked,
             scale,
-            **kwargs)
+            **kwargs,
+        )
         self.add_expand(
             y,
             buffer,  # type: ignore
@@ -225,20 +244,23 @@ def add_lora_linear(self,
             None,
             output_slices,
             add_inputs=True,
-            **kwargs)
-
-    def add_lora_logits(self,
-                        y: torch.Tensor,
-                        x: torch.Tensor,
-                        lora_a_stacked: torch.Tensor,
-                        lora_b_stacked: torch.Tensor,
-                        scale,
-                        *,
-                        buffer: Optional[torch.Tensor] = None,
-                        **kwargs) -> None:
+            **kwargs,
+        )
+
+    def add_lora_logits(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_a_stacked: torch.Tensor,
+        lora_b_stacked: torch.Tensor,
+        scale,
+        *,
+        buffer: Optional[torch.Tensor] = None,
+        **kwargs,
+    ) -> None:
         """
         Applies lora  specifically for LogitsProcessorWithLoRA.
-        
+
         Semantics:
             buffer = (x @ lora_a_stacked) * scale
             y += buffer @ lora_b_stacked
@@ -258,15 +280,21 @@ def add_lora_logits(self,
         if buffer is None:
             # We set the buffer to be float32 by default, refer to:
             # https://github.com/triton-lang/triton/issues/1387
-            buffer = torch.zeros((x.size(0), r),
-                                 dtype=torch.float32,
-                                 device=x.device)
+            buffer = torch.zeros((x.size(0), r), dtype=torch.float32, device=x.device)
 
-        lora_shrink(x, [lora_a_stacked], buffer.unsqueeze(dim=0),
-                    *self.prompt_mapping_meta.meta_args(x.size(0)), scale)
+        lora_shrink(
+            x,
+            [lora_a_stacked],
+            buffer.unsqueeze(dim=0),
+            *self.prompt_mapping_meta.meta_args(x.size(0)),
+            scale,
+        )
 
-        lora_expand(buffer.unsqueeze(dim=0), [lora_b_stacked],
-                    y,
-                    *self.prompt_mapping_meta.meta_args(buffer.size(0)),
-                    add_inputs=True)
+        lora_expand(
+            buffer.unsqueeze(dim=0),
+            [lora_b_stacked],
+            y,
+            *self.prompt_mapping_meta.meta_args(buffer.size(0)),
+            add_inputs=True,
+        )
         y = y.view_as(y_org)
diff --git a/vllm/lora/punica_wrapper/punica_selector.py b/vllm/lora/punica_wrapper/punica_selector.py
index c684ac77cc9c..c017721803fe 100644
--- a/vllm/lora/punica_wrapper/punica_selector.py
+++ b/vllm/lora/punica_wrapper/punica_selector.py
@@ -14,7 +14,8 @@ def get_punica_wrapper(*args, **kwargs) -> PunicaWrapperBase:
     punica_wrapper_qualname = current_platform.get_punica_wrapper()
     punica_wrapper_cls = resolve_obj_by_qualname(punica_wrapper_qualname)
     punica_wrapper = punica_wrapper_cls(*args, **kwargs)
-    assert punica_wrapper is not None, \
+    assert punica_wrapper is not None, (
         "the punica_wrapper_qualname(" + punica_wrapper_qualname + ") is wrong."
+    )
     logger.info_once("Using %s.", punica_wrapper_qualname.rsplit(".", 1)[1])
     return punica_wrapper
diff --git a/vllm/lora/punica_wrapper/punica_tpu.py b/vllm/lora/punica_wrapper/punica_tpu.py
index 5896da516540..5d2f05b815be 100644
--- a/vllm/lora/punica_wrapper/punica_tpu.py
+++ b/vllm/lora/punica_wrapper/punica_tpu.py
@@ -25,27 +25,29 @@ class PunicaWrapperTPU(PunicaWrapperBase):
     Multi-LoRA, and to provide the interface for the pytorch punica ops.
     """
 
-    def __init__(self, max_num_batched_tokens: int, max_batches: int,
-                 device: Union[torch.device, str], **kwargs):
-        PunicaWrapperBase.__init__(self, max_num_batched_tokens, max_batches,
-                                   device)
+    def __init__(
+        self,
+        max_num_batched_tokens: int,
+        max_batches: int,
+        device: Union[torch.device, str],
+        **kwargs,
+    ):
+        PunicaWrapperBase.__init__(self, max_num_batched_tokens, max_batches, device)
 
         # PunicaWrapperBase defines some tensors with dtype=torch.int64, which
         # isn't supported by the TPU. So convert those tensors to int32.
         # Not all of them are used by the TPU so only convert the useful ones.
-        self._token_lora_indices = self._token_lora_indices.to(
-            dtype=torch.int32)
+        self._token_lora_indices = self._token_lora_indices.to(dtype=torch.int32)
         self._sampler_indices = self._sampler_indices.to(dtype=torch.int32)
         self._sampler_indices_padded = self._sampler_indices_padded.to(
-            dtype=torch.int32)
+            dtype=torch.int32
+        )
 
         torch.ops.xla.dynamo_set_buffer_donor_(self._token_lora_indices, True)
         torch.ops.xla.dynamo_set_buffer_donor_(self._sampler_indices, True)
-        torch.ops.xla.dynamo_set_buffer_donor_(self._sampler_indices_padded,
-                                               True)
+        torch.ops.xla.dynamo_set_buffer_donor_(self._sampler_indices_padded, True)
         torch.ops.xla.dynamo_set_buffer_donor_(self._embeddings_indices, True)
-        torch.ops.xla.dynamo_set_buffer_donor_(self._lora_indices_per_batch,
-                                               True)
+        torch.ops.xla.dynamo_set_buffer_donor_(self._lora_indices_per_batch, True)
 
         torch._dynamo.mark_dynamic(self._token_lora_indices, 0)
         torch._dynamo.mark_dynamic(self._embeddings_indices, 1)
@@ -77,21 +79,38 @@ def shrink(
     ):
         return bgmv_shrink(x, w_t_all, self._get_token_lora_indices(x), scale)
 
-    def expand(self, y: torch.Tensor, x: torch.Tensor, w_t_all: torch.Tensor,
-               add_inputs: bool):
-        return bgmv_expand(x, w_t_all, y, self._get_token_lora_indices(x),
-                           add_inputs)
-
-    def expand_slice(self, y: torch.Tensor, x: torch.Tensor,
-                     w_t_all: torch.Tensor, y_offset: int, y_slice_size: int,
-                     add_inputs: bool) -> torch.Tensor:
-        return bgmv_expand_slice(x, w_t_all, y,
-                                 self._get_token_lora_indices(x), y_offset,
-                                 y_slice_size, add_inputs)
-
-    def add_shrink(self, y: Union[tuple[torch.Tensor, ...], torch.Tensor],
-                   x: torch.Tensor, lora_a_stacked: tuple[torch.Tensor, ...],
-                   scale: float, **kwargs) -> Optional[torch.Tensor]:
+    def expand(
+        self, y: torch.Tensor, x: torch.Tensor, w_t_all: torch.Tensor, add_inputs: bool
+    ):
+        return bgmv_expand(x, w_t_all, y, self._get_token_lora_indices(x), add_inputs)
+
+    def expand_slice(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        w_t_all: torch.Tensor,
+        y_offset: int,
+        y_slice_size: int,
+        add_inputs: bool,
+    ) -> torch.Tensor:
+        return bgmv_expand_slice(
+            x,
+            w_t_all,
+            y,
+            self._get_token_lora_indices(x),
+            y_offset,
+            y_slice_size,
+            add_inputs,
+        )
+
+    def add_shrink(
+        self,
+        y: Union[tuple[torch.Tensor, ...], torch.Tensor],
+        x: torch.Tensor,
+        lora_a_stacked: tuple[torch.Tensor, ...],
+        scale: float,
+        **kwargs,
+    ) -> Optional[torch.Tensor]:
         """
         Performs GEMM for multiple slices of lora_a.
 
@@ -115,15 +134,17 @@ def add_shrink(self, y: Union[tuple[torch.Tensor, ...], torch.Tensor],
             y[slice_idx, :, :] = y_s  # type: ignore[index]
         return y
 
-    def add_expand(self,
-                   y: torch.Tensor,
-                   x: Union[tuple[torch.Tensor, ...], torch.Tensor],
-                   lora_b_stacked: tuple[torch.Tensor, ...],
-                   lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
-                   output_slices: tuple[int, ...],
-                   offset_start: int = 0,
-                   add_inputs=True,
-                   **kwargs) -> torch.Tensor:
+    def add_expand(
+        self,
+        y: torch.Tensor,
+        x: Union[tuple[torch.Tensor, ...], torch.Tensor],
+        lora_b_stacked: tuple[torch.Tensor, ...],
+        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
+        output_slices: tuple[int, ...],
+        offset_start: int = 0,
+        add_inputs=True,
+        **kwargs,
+    ) -> torch.Tensor:
         """
         Performs GEMM and bias addition for multiple slices of lora_b.
 
@@ -148,24 +169,29 @@ def add_expand(self,
         offset_left = 0
 
         if lora_bias_stacked is not None:
-            y = self._apply_bias(self._get_token_lora_indices(y), y,
-                                 output_slices, lora_bias_stacked)
+            y = self._apply_bias(
+                self._get_token_lora_indices(y), y, output_slices, lora_bias_stacked
+            )
         for slice_idx in range(len(lora_b_stacked)):
-            y = self.expand_slice(y,
-                                  x[slice_idx],
-                                  lora_b_stacked[slice_idx],
-                                  offset_left,
-                                  output_slices[slice_idx],
-                                  add_inputs=add_inputs)
+            y = self.expand_slice(
+                y,
+                x[slice_idx],
+                lora_b_stacked[slice_idx],
+                offset_left,
+                output_slices[slice_idx],
+                add_inputs=add_inputs,
+            )
             offset_left += output_slices[slice_idx]
         return y.view_as(y_org)
 
-    def add_lora_embedding(self,
-                           y: torch.Tensor,
-                           x: torch.Tensor,
-                           lora_b_stacked: torch.Tensor,
-                           add_inputs: bool = True,
-                           **kwargs) -> torch.Tensor:
+    def add_lora_embedding(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_b_stacked: torch.Tensor,
+        add_inputs: bool = True,
+        **kwargs,
+    ) -> torch.Tensor:
         """
         Applies lora  specifically for VocabParallelEmbeddingWithLoRA.
 
@@ -182,17 +208,19 @@ def add_lora_embedding(self,
         # Embedding layer only needs the expand op
         return self.expand(y, x, lora_b_stacked, add_inputs)
 
-    def add_lora_linear(self,
-                        y: torch.Tensor,
-                        x: torch.Tensor,
-                        lora_a_stacked: tuple[torch.Tensor, ...],
-                        lora_b_stacked: tuple[torch.Tensor, ...],
-                        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
-                        scale: float,
-                        output_slices: tuple[int, ...],
-                        *,
-                        buffer: Optional[tuple[torch.Tensor, ...]] = None,
-                        **kwargs) -> torch.Tensor:
+    def add_lora_linear(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_a_stacked: tuple[torch.Tensor, ...],
+        lora_b_stacked: tuple[torch.Tensor, ...],
+        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
+        scale: float,
+        output_slices: tuple[int, ...],
+        *,
+        buffer: Optional[tuple[torch.Tensor, ...]] = None,
+        **kwargs,
+    ) -> torch.Tensor:
         """
         Applicable to linear-related lora.
 
@@ -219,8 +247,9 @@ def add_lora_linear(self,
         assert len(lora_a_stacked) == len(lora_b_stacked) == len(output_slices)
         if lora_bias_stacked is not None:
             assert len(lora_bias_stacked) == len(output_slices)
-            y = self._apply_bias(self._get_token_lora_indices(y), y,
-                                 output_slices, lora_bias_stacked)
+            y = self._apply_bias(
+                self._get_token_lora_indices(y), y, output_slices, lora_bias_stacked
+            )
 
         if buffer is None:
             r = lora_b_stacked[0].size(-1)
@@ -231,23 +260,21 @@ def add_lora_linear(self,
                 device=x.device,
             )
         buffer = self.add_shrink(buffer, x, lora_a_stacked, scale, **kwargs)
-        return self.add_expand(y,
-                               buffer,
-                               lora_b_stacked,
-                               None,
-                               output_slices,
-                               add_inputs=True,
-                               **kwargs)
-
-    def add_lora_logits(self,
-                        y: torch.Tensor,
-                        x: torch.Tensor,
-                        lora_a_stacked: torch.Tensor,
-                        lora_b_stacked: torch.Tensor,
-                        scale,
-                        *,
-                        buffer: Optional[torch.Tensor] = None,
-                        **kwargs) -> torch.Tensor:
+        return self.add_expand(
+            y, buffer, lora_b_stacked, None, output_slices, add_inputs=True, **kwargs
+        )
+
+    def add_lora_logits(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_a_stacked: torch.Tensor,
+        lora_b_stacked: torch.Tensor,
+        scale,
+        *,
+        buffer: Optional[torch.Tensor] = None,
+        **kwargs,
+    ) -> torch.Tensor:
         """
         Applies lora specifically for LogitsProcessorWithLoRA.
 
@@ -269,11 +296,7 @@ def add_lora_logits(self,
 
         sampler_indices = torch.narrow(self._sampler_indices, 0, 0, x.size(0))
         buffer = bgmv_shrink(x, lora_a_stacked, sampler_indices, scale)
-        y = bgmv_expand(buffer,
-                        lora_b_stacked,
-                        y,
-                        sampler_indices,
-                        add_inputs=True)
+        y = bgmv_expand(buffer, lora_b_stacked, y, sampler_indices, add_inputs=True)
         return y.view_as(y_org)
 
     def _apply_bias(
@@ -304,8 +327,9 @@ def _apply_bias(
                 bias = bias[indices]
                 bias = torch.where(indices[:, None] == -1, 0, bias)
 
-                bias = F.pad(bias, (offset_left, output.shape[1] -
-                                    (offset_left + slice), 0, 0))
+                bias = F.pad(
+                    bias, (offset_left, output.shape[1] - (offset_left + slice), 0, 0)
+                )
 
                 output += bias
             offset_left += slice
@@ -328,8 +352,7 @@ def _update_base_metadata(
         # Pad the prompt mapping to avoid running into recompiles on the TPU
         # TODO: Should this happen inside mapping internally? If so how can we
         # avoid having backend specific LoRAMapping classes?
-        mapping.prompt_mapping = self._pad_prompt_mapping(
-            mapping.prompt_mapping)
+        mapping.prompt_mapping = self._pad_prompt_mapping(mapping.prompt_mapping)
 
         (
             base_indices,
@@ -346,35 +369,33 @@ def _update_base_metadata(
             "cpu",
         )
         self._token_lora_indices = self._pad_to_shape(
-            base_indices, self._token_lora_indices.shape,
-            dims=1).to(self.device)
-        self._sampler_indices = self._pad_to_shape(sampler_indices,
-                                                   self._sampler_indices.shape,
-                                                   dims=1).to(self.device)
+            base_indices, self._token_lora_indices.shape, dims=1
+        ).to(self.device)
+        self._sampler_indices = self._pad_to_shape(
+            sampler_indices, self._sampler_indices.shape, dims=1
+        ).to(self.device)
         self._sampler_indices_padded = self._pad_to_shape(
-            sampler_indices_padded, self._sampler_indices_padded.shape,
-            dims=1).to(self.device)
+            sampler_indices_padded, self._sampler_indices_padded.shape, dims=1
+        ).to(self.device)
         self._embeddings_indices = self._pad_to_shape(
-            embeddings_indices, self._embeddings_indices.shape,
-            dims=2).to(self.device)
+            embeddings_indices, self._embeddings_indices.shape, dims=2
+        ).to(self.device)
         self.indices_len[:] = indices_len
 
-    def _update_prefill_metadata(self,
-                                 token_lora_tensor: torch.Tensor) -> None:
+    def _update_prefill_metadata(self, token_lora_tensor: torch.Tensor) -> None:
         self.batch_size = 1
-        self._lora_indices_per_batch[:self.
-                                     batch_size] = token_lora_tensor[:self.
-                                                                     batch_size]
+        self._lora_indices_per_batch[: self.batch_size] = token_lora_tensor[
+            : self.batch_size
+        ]
 
-    def _pad_prompt_mapping(
-            self, prompt_mapping: tuple[int, ...]) -> tuple[int, ...]:
+    def _pad_prompt_mapping(self, prompt_mapping: tuple[int, ...]) -> tuple[int, ...]:
         num_reqs = len(prompt_mapping)
 
         # From vllm/v1/worker/tpu_model_runner:51, but need to avoid a circular
         # import
         MIN_NUM_SEQS = 8
 
-        padded_num_reqs = max(2**math.ceil(math.log2(num_reqs)), MIN_NUM_SEQS)
+        padded_num_reqs = max(2 ** math.ceil(math.log2(num_reqs)), MIN_NUM_SEQS)
         pad_len = padded_num_reqs - num_reqs
 
         padding = [-1] * pad_len
@@ -387,5 +408,4 @@ def _pad_to_shape(self, src, target_shape, dims=1):
         else:
             pad_rows = target_shape[0] - src.shape[0]
             pad_cols = target_shape[1] - src.shape[1]
-            return F.pad(src, (0, pad_cols, 0, pad_rows),
-                         value=0).to(torch.int32)
+            return F.pad(src, (0, pad_cols, 0, pad_rows), value=0).to(torch.int32)
diff --git a/vllm/lora/punica_wrapper/punica_xpu.py b/vllm/lora/punica_wrapper/punica_xpu.py
index 163bb412235c..5196199b2ac3 100644
--- a/vllm/lora/punica_wrapper/punica_xpu.py
+++ b/vllm/lora/punica_wrapper/punica_xpu.py
@@ -2,8 +2,8 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """
 Based on:
-Chen, L., Ye, Z., Wu, Y., Zhuo, D., Ceze, L., & Krishnamurthy, A. (2023). 
-Punica: Multi-Tenant LoRA Serving. 
+Chen, L., Ye, Z., Wu, Y., Zhuo, D., Ceze, L., & Krishnamurthy, A. (2023).
+Punica: Multi-Tenant LoRA Serving.
 https://arxiv.org/abs/2310.18547
 """
 
@@ -21,25 +21,35 @@
 class PunicaWrapperXPU(PunicaWrapperBase):
     """
     PunicaWrapperXPU is designed to manage and provide metadata for the punica
-    kernel. The main function is to maintain the state information for 
+    kernel. The main function is to maintain the state information for
     Multi-LoRA, and to provide the interface for the punica ipex kernel.
     """
 
-    def __init__(self, max_num_batched_tokens: int, max_batches: int,
-                 device: Union[torch.device, str], **kwargs):
-        PunicaWrapperBase.__init__(self, max_num_batched_tokens, max_batches,
-                                   device)
+    def __init__(
+        self,
+        max_num_batched_tokens: int,
+        max_batches: int,
+        device: Union[torch.device, str],
+        **kwargs,
+    ):
+        PunicaWrapperBase.__init__(self, max_num_batched_tokens, max_batches, device)
         torch._dynamo.mark_dynamic(self._token_lora_indices, 0)
         torch._dynamo.mark_dynamic(self._embeddings_indices, 1)
         torch._dynamo.mark_dynamic(self._sampler_indices_padded, 0)
 
-    def update_metadata(self, mapping: LoRAMapping,
-                        lora_index_to_id: list[Optional[int]], max_loras: int,
-                        vocab_size: int, extra_vocab_size: int, **kwargs):
-
+    def update_metadata(
+        self,
+        mapping: LoRAMapping,
+        lora_index_to_id: list[Optional[int]],
+        max_loras: int,
+        vocab_size: int,
+        extra_vocab_size: int,
+        **kwargs,
+    ):
         self.is_prefill = mapping.is_prefill
-        self._update_base_metadata(mapping, lora_index_to_id, max_loras,
-                                   vocab_size, extra_vocab_size)
+        self._update_base_metadata(
+            mapping, lora_index_to_id, max_loras, vocab_size, extra_vocab_size
+        )
 
     def _get_token_lora_indices(self, x: torch.Tensor) -> torch.IntTensor:
         return torch.narrow(self._token_lora_indices, 0, 0, x.size(0))
@@ -63,19 +73,25 @@ def _apply_expand(
         add_inputs: bool,
     ):
         token_lora_indices = self._get_token_lora_indices(x)
-        bgmv_expand_slice(x, w_t_all, y, token_lora_indices, y_offset,
-                          y_slice_size, add_inputs)
+        bgmv_expand_slice(
+            x, w_t_all, y, token_lora_indices, y_offset, y_slice_size, add_inputs
+        )
 
-    def add_shrink(self, y: torch.Tensor, x: torch.Tensor,
-                   lora_a_stacked: tuple[torch.Tensor,
-                                         ...], scale: float, **kwargs):
+    def add_shrink(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_a_stacked: tuple[torch.Tensor, ...],
+        scale: float,
+        **kwargs,
+    ):
         """
         Performs GEMM  for multiple slices of lora_a.
-            
+
         Semantics:
         for i in range(len(lora_a_stacked)):
             y[i] += (x @ lora_a_stacked[i]) * scale
-        
+
         Args:
             y (torch.Tensor): Output tensors
             x (torch.Tensor): Input tensor
@@ -85,33 +101,34 @@ def add_shrink(self, y: torch.Tensor, x: torch.Tensor,
 
         x = x.view(-1, x.shape[-1])
         for slice_idx in range(len(lora_a_stacked)):
-            self._apply_shrink(y[slice_idx], x, lora_a_stacked[slice_idx],
-                               scale)
-
-    def add_expand(self,
-                   y: torch.Tensor,
-                   x: torch.Tensor,
-                   lora_b_stacked: tuple[torch.Tensor, ...],
-                   lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
-                   output_slices: tuple[int, ...],
-                   offset_start: int = 0,
-                   add_inputs=True,
-                   **kwargs) -> None:
+            self._apply_shrink(y[slice_idx], x, lora_a_stacked[slice_idx], scale)
+
+    def add_expand(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_b_stacked: tuple[torch.Tensor, ...],
+        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
+        output_slices: tuple[int, ...],
+        offset_start: int = 0,
+        add_inputs=True,
+        **kwargs,
+    ) -> None:
         """
         Performs GEMM and bias addition for multiple slices of lora_b.
-      
+
         Semantics:
             for i in range(len(lora_b_stacked)):
                 slice = output_slices[i]
-                y[:, offset:offset+slice] += x[i] @ lora_b_stacked[i] + 
-                    lora_bias_stacked[i] 
+                y[:, offset:offset+slice] += x[i] @ lora_b_stacked[i] +
+                    lora_bias_stacked[i]
                 offset += slice
-            
+
         Args:
             y (torch.Tensor): Output tensor.
             x (torch.Tensor): Input tensors
             lora_b_stacked (tuple[torch.Tensor, ...]): lora_b's weight
-            lora_bias_stacked (Optional[tuple[torch.Tensor, ...]]): 
+            lora_bias_stacked (Optional[tuple[torch.Tensor, ...]]):
                 bias's weight
             output_slices (tuple[int, ...]): Every slice's size
             add_inputs (bool): Defaults to True.
@@ -120,8 +137,7 @@ def add_expand(self,
         y = y.view(-1, y.shape[-1])
         if lora_bias_stacked is not None:
             token_lora_indices = self._get_token_lora_indices(y)
-            self._apply_bias(token_lora_indices, y, output_slices,
-                             lora_bias_stacked)
+            self._apply_bias(token_lora_indices, y, output_slices, lora_bias_stacked)
 
         assert x.ndim == 3
         assert x.size(0) == len(output_slices)
@@ -139,12 +155,14 @@ def add_expand(self,
             offset_start += output_slices[slice_idx]
         y.view_as(y_org)
 
-    def add_lora_embedding(self,
-                           y: torch.Tensor,
-                           x: torch.Tensor,
-                           lora_b_stacked: torch.Tensor,
-                           add_inputs: bool = True,
-                           **kwargs) -> None:
+    def add_lora_embedding(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_b_stacked: torch.Tensor,
+        add_inputs: bool = True,
+        **kwargs,
+    ) -> None:
         """
         Applies lora  specifically for VocabParallelEmbeddingWithLoRA.
 
@@ -160,17 +178,19 @@ def add_lora_embedding(self,
         token_lora_indices = self._get_token_lora_indices(x)
         bgmv_expand(x, lora_b_stacked, y, token_lora_indices, add_inputs)
 
-    def add_lora_linear(self,
-                        y: torch.Tensor,
-                        x: torch.Tensor,
-                        lora_a_stacked: tuple[torch.Tensor, ...],
-                        lora_b_stacked: tuple[torch.Tensor, ...],
-                        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
-                        scale: float,
-                        output_slices: tuple[int, ...],
-                        *,
-                        buffer: Optional[torch.Tensor] = None,
-                        **kwargs) -> None:
+    def add_lora_linear(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_a_stacked: tuple[torch.Tensor, ...],
+        lora_b_stacked: tuple[torch.Tensor, ...],
+        lora_bias_stacked: Optional[tuple[torch.Tensor, ...]],
+        scale: float,
+        output_slices: tuple[int, ...],
+        *,
+        buffer: Optional[torch.Tensor] = None,
+        **kwargs,
+    ) -> None:
         """
         Applicable to linear-related lora.
 
@@ -198,8 +218,9 @@ def add_lora_linear(self,
         if lora_bias_stacked is not None:
             assert len(lora_bias_stacked) == len(output_slices)
             token_lora_indices = self._get_token_lora_indices(y)
-            y = self._apply_bias(token_lora_indices, y, output_slices,
-                                 lora_bias_stacked)
+            y = self._apply_bias(
+                token_lora_indices, y, output_slices, lora_bias_stacked
+            )
 
         if buffer is None:
             r = lora_b_stacked[0].size(-1)
@@ -215,7 +236,8 @@ def add_lora_linear(self,
             x,
             lora_a_stacked,
             scale,
-            **kwargs)
+            **kwargs,
+        )
         self.add_expand(
             y,
             buffer,  # type: ignore
@@ -223,7 +245,8 @@ def add_lora_linear(self,
             None,
             output_slices,
             add_inputs=True,
-            **kwargs)
+            **kwargs,
+        )
 
     @property
     def sampler_indices_padded(self) -> torch.Tensor:
@@ -232,18 +255,20 @@ def sampler_indices_padded(self) -> torch.Tensor:
         """
         return self._sampler_indices_padded[:]
 
-    def add_lora_logits(self,
-                        y: torch.Tensor,
-                        x: torch.Tensor,
-                        lora_a_stacked: torch.Tensor,
-                        lora_b_stacked: torch.Tensor,
-                        scale,
-                        *,
-                        buffer: Optional[torch.Tensor] = None,
-                        **kwargs) -> None:
+    def add_lora_logits(
+        self,
+        y: torch.Tensor,
+        x: torch.Tensor,
+        lora_a_stacked: torch.Tensor,
+        lora_b_stacked: torch.Tensor,
+        scale,
+        *,
+        buffer: Optional[torch.Tensor] = None,
+        **kwargs,
+    ) -> None:
         """
         Applies lora  specifically for LogitsProcessorWithLoRA.
-        
+
         Semantics:
             buffer = (x @ lora_a_stacked) * scale
             y += buffer @ lora_b_stacked
@@ -263,14 +288,8 @@ def add_lora_logits(self,
         if buffer is None:
             # We set the buffer to be float32 by default, refer to:
             # https://github.com/triton-lang/triton/issues/1387
-            buffer = torch.zeros((x.size(0), r),
-                                 dtype=torch.float32,
-                                 device=x.device)
+            buffer = torch.zeros((x.size(0), r), dtype=torch.float32, device=x.device)
         sampler_indices = torch.narrow(self._sampler_indices, 0, 0, x.size(0))
         bgmv_shrink(x, lora_a_stacked, buffer, sampler_indices, scale)
-        bgmv_expand(buffer,
-                    lora_b_stacked,
-                    y,
-                    sampler_indices,
-                    add_inputs=True)
+        bgmv_expand(buffer, lora_b_stacked, y, sampler_indices, add_inputs=True)
         return y.view_as(y_org)
diff --git a/vllm/lora/punica_wrapper/utils.py b/vllm/lora/punica_wrapper/utils.py
index d22c29da1c61..90d1614e674d 100644
--- a/vllm/lora/punica_wrapper/utils.py
+++ b/vllm/lora/punica_wrapper/utils.py
@@ -11,7 +11,7 @@
 
 
 def compute_meta(
-    token_lora_tensor: torch.Tensor
+    token_lora_tensor: torch.Tensor,
 ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor, int, int, int, bool]:
     """
     Get the information required for the sgmv kernel. With the  features:
@@ -23,7 +23,8 @@ def compute_meta(
     """
 
     lora_indices_tensor, seq_length_tensor = torch.unique_consecutive(
-        token_lora_tensor, return_counts=True)
+        token_lora_tensor, return_counts=True
+    )
     cum_result = torch.cumsum(seq_length_tensor, dim=0)
     b_seq_start_tensor = torch.zeros_like(seq_length_tensor)
     b_seq_start_tensor[1:].copy_(cum_result[:-1])
@@ -36,8 +37,15 @@ def compute_meta(
     # does not need to launch the triton kernel, which can improve performance
     if batch_size == 1 and lora_indices_tensor == -1:
         no_lora = True
-    return (b_seq_start_tensor, seq_length_tensor, lora_indices_tensor,
-            batch_size, max_length, token_nums, no_lora)
+    return (
+        b_seq_start_tensor,
+        seq_length_tensor,
+        lora_indices_tensor,
+        batch_size,
+        max_length,
+        token_nums,
+        no_lora,
+    )
 
 
 # TODO see if this can be vectorized
@@ -83,14 +91,16 @@ def convert_mapping(
     lora_indices = index_mapping_indices.copy()
 
     prompt_mapping: list[int] = [
-        lora_index_to_id.index(x) if x > 0 else -1
-        for x in mapping.prompt_mapping
+        lora_index_to_id.index(x) if x > 0 else -1 for x in mapping.prompt_mapping
     ]
     lora_idx = None
     for i in range(len(index_mapping_indices)):
         # TODO index can be slow. optimize
-        lora_idx = (lora_index_to_id.index(index_mapping_indices[i])
-                    if index_mapping_indices[i] > 0 else -1)
+        lora_idx = (
+            lora_index_to_id.index(index_mapping_indices[i])
+            if index_mapping_indices[i] > 0
+            else -1
+        )
         embedding_indices[i] = lora_idx if index_mapping_indices[i] > 0 else 0
         lora_indices[i] = lora_idx
 
@@ -101,23 +111,27 @@ def convert_mapping(
     ]
 
     indices = torch.tensor(indices_list, dtype=torch.long, device=device)
-    prompt_mapping_tensor = torch.tensor(prompt_mapping,
-                                         dtype=torch.long,
-                                         device=device)
-    embeddings_indices = torch.stack([
-        indices[2] * extra_vocab_size,
-        indices[2] * (vocab_size + extra_vocab_size),
-    ])
-    embeddings_indices = torch.where(embeddings_indices == -1, max_loras - 1,
-                                     embeddings_indices)
+    prompt_mapping_tensor = torch.tensor(
+        prompt_mapping, dtype=torch.long, device=device
+    )
+    embeddings_indices = torch.stack(
+        [
+            indices[2] * extra_vocab_size,
+            indices[2] * (vocab_size + extra_vocab_size),
+        ]
+    )
+    embeddings_indices = torch.where(
+        embeddings_indices == -1, max_loras - 1, embeddings_indices
+    )
     base_indices = indices[1]
     sampler_indices = prompt_mapping_tensor
     sampler_indices_padded = sampler_indices.clone()
-    sampler_indices_padded = torch.where(sampler_indices_padded == -1,
-                                         max_loras - 1, sampler_indices_padded)
+    sampler_indices_padded = torch.where(
+        sampler_indices_padded == -1, max_loras - 1, sampler_indices_padded
+    )
     sampler_indices_padded = torch.arange(
-        0, len(sampler_indices_padded), device=device, dtype=torch.long) + (
-            sampler_indices_padded * len(sampler_indices_padded))
+        0, len(sampler_indices_padded), device=device, dtype=torch.long
+    ) + (sampler_indices_padded * len(sampler_indices_padded))
 
     # Contain length of indices tensors. Used to index into each tensor.
     indices_len = [
diff --git a/vllm/lora/request.py b/vllm/lora/request.py
index 523525d46f0b..650e060a5804 100644
--- a/vllm/lora/request.py
+++ b/vllm/lora/request.py
@@ -8,9 +8,10 @@
 
 
 class LoRARequest(
-        msgspec.Struct,
-        omit_defaults=True,  # type: ignore[call-arg]
-        array_like=True):  # type: ignore[call-arg]
+    msgspec.Struct,
+    omit_defaults=True,  # type: ignore[call-arg]
+    array_like=True,
+):  # type: ignore[call-arg]
     """
     Request for a LoRA adapter.
 
@@ -22,6 +23,7 @@ class LoRARequest(
     lora_int_id must be globally unique for a given adapter.
     This is currently not enforced in vLLM.
     """
+
     lora_name: str
     lora_int_id: int
     lora_path: str = ""
@@ -39,7 +41,8 @@ def __post_init__(self):
                 "and will be removed in a future version. "
                 "Please use 'lora_path' instead.",
                 DeprecationWarning,
-                stacklevel=2)
+                stacklevel=2,
+            )
             if not self.lora_path:
                 self.lora_path = self.lora_local_path or ""
 
@@ -65,7 +68,8 @@ def local_path(self):
             "and will be removed in a future version. "
             "Please use 'path' instead.",
             DeprecationWarning,
-            stacklevel=2)
+            stacklevel=2,
+        )
         return self.lora_path
 
     @local_path.setter
@@ -75,7 +79,8 @@ def local_path(self, value):
             "and will be removed in a future version. "
             "Please use 'path' instead.",
             DeprecationWarning,
-            stacklevel=2)
+            stacklevel=2,
+        )
         self.lora_path = value
 
     def __eq__(self, value: object) -> bool:
@@ -84,8 +89,7 @@ def __eq__(self, value: object) -> bool:
         instances based on lora_name. This allows for identification
         and comparison lora adapter across engines.
         """
-        return isinstance(value,
-                          self.__class__) and self.lora_name == value.lora_name
+        return isinstance(value, self.__class__) and self.lora_name == value.lora_name
 
     def __hash__(self) -> int:
         """
diff --git a/vllm/lora/resolver.py b/vllm/lora/resolver.py
index 5808ae105e86..d366b94521cd 100644
--- a/vllm/lora/resolver.py
+++ b/vllm/lora/resolver.py
@@ -22,8 +22,9 @@ class LoRAResolver(ABC):
     """
 
     @abstractmethod
-    async def resolve_lora(self, base_model_name: str,
-                           lora_name: str) -> Optional[LoRARequest]:
+    async def resolve_lora(
+        self, base_model_name: str, lora_name: str
+    ) -> Optional[LoRARequest]:
         """Abstract method to resolve and fetch a LoRA model adapter.
 
         Implements logic to locate and download LoRA adapter based on the name.
@@ -61,8 +62,10 @@ def register_resolver(
         if resolver_name in self.resolvers:
             logger.warning(
                 "LoRA resolver %s is already registered, and will be "
-                "overwritten by the new resolver instance %s.", resolver_name,
-                resolver)
+                "overwritten by the new resolver instance %s.",
+                resolver_name,
+                resolver,
+            )
 
         self.resolvers[resolver_name] = resolver
 
@@ -78,7 +81,8 @@ def get_resolver(self, resolver_name: str) -> LoRAResolver:
         if resolver_name not in self.resolvers:
             raise KeyError(
                 f"LoRA resolver '{resolver_name}' not found. "
-                f"Available resolvers: {list(self.resolvers.keys())}")
+                f"Available resolvers: {list(self.resolvers.keys())}"
+            )
         return self.resolvers[resolver_name]
 
 
diff --git a/vllm/lora/utils.py b/vllm/lora/utils.py
index 10ba390bffd9..eeff72ef1aaa 100644
--- a/vllm/lora/utils.py
+++ b/vllm/lora/utils.py
@@ -6,37 +6,44 @@
 
 import huggingface_hub
 import regex as re
-from huggingface_hub.utils import (EntryNotFoundError, HfHubHTTPError,
-                                   HFValidationError, RepositoryNotFoundError)
+from huggingface_hub.utils import (
+    EntryNotFoundError,
+    HfHubHTTPError,
+    HFValidationError,
+    RepositoryNotFoundError,
+)
 from torch import nn
 from transformers import PretrainedConfig
 
 from vllm.config.lora import LoRAConfig
 from vllm.logger import init_logger
+
 # being imported for _all_lora_classes below
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.lora.layers import (BaseLayerWithLoRA, ColumnParallelLinearWithLoRA,
-                              ColumnParallelLinearWithShardedLoRA,
-                              LogitsProcessorWithLoRA,
-                              MergedColumnParallelLinearWithLoRA,
-                              MergedColumnParallelLinearWithShardedLoRA,
-                              MergedQKVParallelLinearWithLoRA,
-                              MergedQKVParallelLinearWithShardedLoRA,
-                              QKVParallelLinearWithLoRA,
-                              QKVParallelLinearWithShardedLoRA,
-                              ReplicatedLinearWithLoRA,
-                              RowParallelLinearWithLoRA,
-                              RowParallelLinearWithShardedLoRA,
-                              VocabParallelEmbeddingWithLoRA)
+from vllm.lora.layers import (
+    BaseLayerWithLoRA,
+    ColumnParallelLinearWithLoRA,
+    ColumnParallelLinearWithShardedLoRA,
+    LogitsProcessorWithLoRA,
+    MergedColumnParallelLinearWithLoRA,
+    MergedColumnParallelLinearWithShardedLoRA,
+    MergedQKVParallelLinearWithLoRA,
+    MergedQKVParallelLinearWithShardedLoRA,
+    QKVParallelLinearWithLoRA,
+    QKVParallelLinearWithShardedLoRA,
+    ReplicatedLinearWithLoRA,
+    RowParallelLinearWithLoRA,
+    RowParallelLinearWithShardedLoRA,
+    VocabParallelEmbeddingWithLoRA,
+)
 from vllm.model_executor.layers.linear import LinearBase
 
 # yapf: enable
 
 if TYPE_CHECKING:
     from vllm.model_executor.layers.logits_processor import LogitsProcessor
-    from vllm.model_executor.layers.vocab_parallel_embedding import (
-        ParallelLMHead)
+    from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
     from vllm.model_executor.models.utils import WeightsMapper
 
 logger = init_logger(__name__)
@@ -58,20 +65,23 @@
 }
 
 
-def from_layer(layer: nn.Module,
-               max_loras: int,
-               lora_config: LoRAConfig,
-               packed_modules_list: list,
-               model_config: Optional[PretrainedConfig] = None) -> nn.Module:
+def from_layer(
+    layer: nn.Module,
+    max_loras: int,
+    lora_config: LoRAConfig,
+    packed_modules_list: list,
+    model_config: Optional[PretrainedConfig] = None,
+) -> nn.Module:
     for lora_cls in _all_lora_classes:
         # specifying kwargs so they can be easily accessed in decorator
-        if lora_cls.can_replace_layer(source_layer=layer,
-                                      lora_config=lora_config,
-                                      packed_modules_list=packed_modules_list,
-                                      model_config=model_config):
+        if lora_cls.can_replace_layer(
+            source_layer=layer,
+            lora_config=lora_config,
+            packed_modules_list=packed_modules_list,
+            model_config=model_config,
+        ):
             instance_layer = lora_cls(layer)
-            instance_layer.create_lora_weights(max_loras, lora_config,
-                                               model_config)
+            instance_layer.create_lora_weights(max_loras, lora_config, model_config)
             return instance_layer
     return layer
 
@@ -83,15 +93,20 @@ def from_layer_logits_processor(
     lora_config: LoRAConfig,
     model_config: Optional[PretrainedConfig] = None,
 ) -> LogitsProcessorWithLoRA:
-    ret = LogitsProcessorWithLoRA(layer, lm_head.embedding_dim,
-                                  lm_head.weight.dtype, lm_head.weight.device,
-                                  lm_head.get_sharded_to_full_mapping())
+    ret = LogitsProcessorWithLoRA(
+        layer,
+        lm_head.embedding_dim,
+        lm_head.weight.dtype,
+        lm_head.weight.device,
+        lm_head.get_sharded_to_full_mapping(),
+    )
     ret.create_lora_weights(max_loras, lora_config, model_config)
     return ret
 
 
-def replace_submodule(model: nn.Module, module_name: str,
-                      new_module: nn.Module) -> nn.Module:
+def replace_submodule(
+    model: nn.Module, module_name: str, new_module: nn.Module
+) -> nn.Module:
     """Replace a submodule in a model with a new module."""
     parent = model.get_submodule(".".join(module_name.split(".")[:-1]))
     target_name = module_name.split(".")[-1]
@@ -100,8 +115,7 @@ def replace_submodule(model: nn.Module, module_name: str,
 
 
 def parse_fine_tuned_lora_name(
-    name: str,
-    weights_mapper: Optional["WeightsMapper"] = None
+    name: str, weights_mapper: Optional["WeightsMapper"] = None
 ) -> tuple[str, bool, bool]:
     """Parse the name of lora weights.
 
@@ -134,8 +148,7 @@ def parse_fine_tuned_lora_name(
     start_index = 2 if name.startswith("base_model.model.") else 0
 
     parts = name.split(".")
-    if parts[-1] == "weight" and (parts[-2] == "lora_A"
-                                  or parts[-2] == "lora_B"):
+    if parts[-1] == "weight" and (parts[-2] == "lora_A" or parts[-2] == "lora_B"):
         new_name = ".".join(parts[start_index:-2])
         return new_name, parts[-2] == "lora_A", False
 
@@ -150,12 +163,13 @@ def parse_fine_tuned_lora_name(
     raise ValueError(f"{name} is unsupported LoRA weight")
 
 
-def is_regex_target_modules(load_modules: Union[str, list[str]],
-                            expected_lora_modules: list[str]) -> bool:
+def is_regex_target_modules(
+    load_modules: Union[str, list[str]], expected_lora_modules: list[str]
+) -> bool:
     """
-    PEFT supports passing `target_modules` in the form of regular expressions, 
-    such as `model.*(q_proj|k_proj|v_proj)$`. This function is mainly used to 
-    determine whether the suffix in the regular expression is present in the 
+    PEFT supports passing `target_modules` in the form of regular expressions,
+    such as `model.*(q_proj|k_proj|v_proj)$`. This function is mainly used to
+    determine whether the suffix in the regular expression is present in the
     `expected_lora_modules`.
     """
 
@@ -197,7 +211,7 @@ def get_supported_lora_modules(model: nn.Module) -> list[str]:
                 supported_lora_modules.add(name)
 
         # get all the linear subfixes.
-        if isinstance(module, (LinearBase, )):
+        if isinstance(module, (LinearBase,)):
             supported_lora_modules.add(name.split(".")[-1])
 
     return list(supported_lora_modules)
@@ -225,7 +239,7 @@ def get_adapter_absolute_path(lora_path: str) -> str:
         return lora_path
 
     # If the path starts with ~, expand the user home directory.
-    if lora_path.startswith('~'):
+    if lora_path.startswith("~"):
         return os.path.expanduser(lora_path)
 
     # Check if the expanded relative path exists locally.
@@ -234,10 +248,13 @@ def get_adapter_absolute_path(lora_path: str) -> str:
 
     # If the path does not exist locally, assume it's a Hugging Face repo.
     try:
-        local_snapshot_path = huggingface_hub.snapshot_download(
-            repo_id=lora_path)
-    except (HfHubHTTPError, RepositoryNotFoundError, EntryNotFoundError,
-            HFValidationError):
+        local_snapshot_path = huggingface_hub.snapshot_download(repo_id=lora_path)
+    except (
+        HfHubHTTPError,
+        RepositoryNotFoundError,
+        EntryNotFoundError,
+        HFValidationError,
+    ):
         # Handle errors that may occur during the download
         # Return original path instead of throwing error here
         logger.exception("Error downloading the HuggingFace model")
diff --git a/vllm/lora/worker_manager.py b/vllm/lora/worker_manager.py
index cdb2f86611d8..3ca819fb732c 100644
--- a/vllm/lora/worker_manager.py
+++ b/vllm/lora/worker_manager.py
@@ -8,8 +8,12 @@
 
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
-from vllm.lora.models import (LoRAModel, LoRAModelManager,
-                              LRUCacheLoRAModelManager, create_lora_manager)
+from vllm.lora.models import (
+    LoRAModel,
+    LoRAModelManager,
+    LRUCacheLoRAModelManager,
+    create_lora_manager,
+)
 from vllm.lora.peft_helper import PEFTHelper
 from vllm.lora.request import LoRARequest
 from vllm.lora.utils import get_adapter_absolute_path
@@ -39,7 +43,8 @@ def __init__(
         self._cached_dummy_lora: Union[None, Literal[False], LoRAModel] = False
         self.max_num_seqs = vllm_config.scheduler_config.max_num_seqs
         self.max_num_batched_tokens = (
-            vllm_config.scheduler_config.max_num_batched_tokens)
+            vllm_config.scheduler_config.max_num_batched_tokens
+        )
         self.vocab_size = vllm_config.model_config.get_vocab_size()
         self.lora_config = vllm_config.lora_config
 
@@ -81,15 +86,12 @@ def create_lora_manager(
 
     def _load_adapter(self, lora_request: LoRARequest) -> LoRAModel:
         try:
-            supported_lora_modules = (
-                self._adapter_manager.supported_lora_modules)
-            packed_modules_mapping = (
-                self._adapter_manager.packed_modules_mapping)
+            supported_lora_modules = self._adapter_manager.supported_lora_modules
+            packed_modules_mapping = self._adapter_manager.packed_modules_mapping
             expected_lora_modules: list[str] = []
             for module in supported_lora_modules:
                 if module in packed_modules_mapping:
-                    expected_lora_modules.extend(
-                        packed_modules_mapping[module])
+                    expected_lora_modules.extend(packed_modules_mapping[module])
                 else:
                     expected_lora_modules.append(module)
 
@@ -97,8 +99,10 @@ def _load_adapter(self, lora_request: LoRARequest) -> LoRAModel:
             lora_path = get_adapter_absolute_path(lora_request.lora_path)
 
             peft_helper = PEFTHelper.from_local_dir(
-                lora_path, self.max_position_embeddings,
-                lora_request.tensorizer_config_dict)
+                lora_path,
+                self.max_position_embeddings,
+                lora_request.tensorizer_config_dict,
+            )
 
             # Validates the LoRA configuration against requirements before
             # loading weights, throwing an exception if validation fails.
@@ -116,12 +120,13 @@ def _load_adapter(self, lora_request: LoRARequest) -> LoRAModel:
                 lora_model_id=lora_request.lora_int_id,
                 device="cpu",
                 dtype=self.lora_config.lora_dtype,
-                target_embedding_padding=self.vocab_size +
-                self.lora_config.lora_extra_vocab_size,
+                target_embedding_padding=self.vocab_size
+                + self.lora_config.lora_extra_vocab_size,
                 embedding_modules=self.embedding_modules,
                 embedding_padding_modules=self.embedding_padding_modules,
                 tensorizer_config_dict=lora_request.tensorizer_config_dict,
-                weights_mapper=hf_to_vllm_mapper)
+                weights_mapper=hf_to_vllm_mapper,
+            )
 
         except FileNotFoundError as e:
             # FileNotFoundError should be raised if both
@@ -131,26 +136,29 @@ def _load_adapter(self, lora_request: LoRARequest) -> LoRAModel:
             # For NotFoundError
             raise ValueError(
                 f"Loading lora {lora_request.lora_name} failed: No adapter "
-                f"found for {lora_request.lora_path}") from e
+                f"found for {lora_request.lora_path}"
+            ) from e
         except Exception as e:
             # For BadRequestError
             raise e
 
         if lora.extra_vocab_size > self.lora_config.lora_extra_vocab_size:
-            raise ValueError(f"LoRA added vocab size {lora.extra_vocab_size} "
-                             f"is greater than lora_extra_vocab_size "
-                             f"{self.lora_config.lora_extra_vocab_size}.")
+            raise ValueError(
+                f"LoRA added vocab size {lora.extra_vocab_size} "
+                f"is greater than lora_extra_vocab_size "
+                f"{self.lora_config.lora_extra_vocab_size}."
+            )
         return lora
 
     def add_dummy_lora(self, lora_request: LoRARequest, rank: int) -> bool:
         if lora_request.lora_int_id in self.list_adapters():
             return False
         if isinstance(self._cached_dummy_lora, LoRAModel):
-            dummy_lora = self._cached_dummy_lora.clone(
-                lora_request.lora_int_id)
+            dummy_lora = self._cached_dummy_lora.clone(lora_request.lora_int_id)
         else:
             dummy_lora = self._adapter_manager.create_dummy_lora(
-                lora_request.lora_int_id, rank, self.embedding_modules)
+                lora_request.lora_int_id, rank, self.embedding_modules
+            )
             if self._cached_dummy_lora is None:
                 self._cached_dummy_lora = dummy_lora
         return self._adapter_manager.add_adapter(dummy_lora)
@@ -158,8 +166,7 @@ def add_dummy_lora(self, lora_request: LoRARequest, rank: int) -> bool:
     def pin_adapter(self, adapter_id: int) -> bool:
         return self._adapter_manager.pin_adapter(adapter_id)
 
-    def set_active_adapters(self, requests: set[Any],
-                            mapping: Optional[Any]) -> None:
+    def set_active_adapters(self, requests: set[Any], mapping: Optional[Any]) -> None:
         self._apply_adapters(requests)
         if mapping is not None:
             self._adapter_manager.set_adapter_mapping(mapping)
@@ -168,13 +175,15 @@ def _apply_adapters(self, adapter_requests: set[Any]) -> None:
         existing_adapters = self.list_adapters()
         models_map = {
             adapter_request.adapter_id: adapter_request
-            for adapter_request in adapter_requests if adapter_request
+            for adapter_request in adapter_requests
+            if adapter_request
         }
         if len(models_map) > self._adapter_manager.adapter_slots:
             raise RuntimeError(
                 f"Number of requested models ({len(models_map)}) is greater "
                 "than the number of GPU model slots "
-                f"({self._adapter_manager.adapter_slots}).")
+                f"({self._adapter_manager.adapter_slots})."
+            )
         requested_ids = set(models_map)
         for adapter_id in existing_adapters - requested_ids:
             self.remove_adapter(adapter_id)
@@ -227,13 +236,15 @@ def create_lora_manager(
     def _apply_adapters(self, lora_requests: set[LoRARequest]) -> None:
         loras_map = {
             lora_request.lora_int_id: lora_request
-            for lora_request in lora_requests if lora_request
+            for lora_request in lora_requests
+            if lora_request
         }
         if len(loras_map) > self._adapter_manager.lora_slots:
             raise RuntimeError(
                 f"Number of requested LoRAs ({len(loras_map)}) is greater "
                 "than the number of GPU LoRA slots "
-                f"({self._adapter_manager.lora_slots}).")
+                f"({self._adapter_manager.lora_slots})."
+            )
         for lora in loras_map.values():
             self.add_adapter(lora)
 
@@ -253,15 +264,15 @@ def add_adapter(self, lora_request: LoRARequest) -> bool:
             # Loading succeeded, now check if we will exceed cache capacity and
             # evict if the oldest adapter if so
             if len(self._adapter_manager) + 1 > self._adapter_manager.capacity:
-                assert isinstance(self._adapter_manager,
-                                  LRUCacheLoRAModelManager)
+                assert isinstance(self._adapter_manager, LRUCacheLoRAModelManager)
                 self._adapter_manager.remove_oldest_adapter()
             # Then add the new adapter to the cache
             loaded = self._adapter_manager.add_adapter(lora)
         else:
             # If the lora is already loaded, just touch it to
             # update its position in the caches
-            loaded = self._adapter_manager.get_adapter(
-                lora_request.lora_int_id) is not None
+            loaded = (
+                self._adapter_manager.get_adapter(lora_request.lora_int_id) is not None
+            )
         self._adapter_manager.activate_adapter(lora_request.lora_int_id)
         return loaded
diff --git a/vllm/model_executor/__init__.py b/vllm/model_executor/__init__.py
index 3c094cfdb553..b50f0cb3a61a 100644
--- a/vllm/model_executor/__init__.py
+++ b/vllm/model_executor/__init__.py
@@ -1,8 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           PackedvLLMParameter)
+from vllm.model_executor.parameter import BasevLLMParameter, PackedvLLMParameter
 from vllm.model_executor.utils import set_random_seed
 
 __all__ = [
diff --git a/vllm/model_executor/custom_op.py b/vllm/model_executor/custom_op.py
index e7eb8247d5ef..ad5a09ca970d 100644
--- a/vllm/model_executor/custom_op.py
+++ b/vllm/model_executor/custom_op.py
@@ -32,8 +32,11 @@ def __new__(cls, *args, **kwargs):
             op_cls_to_instantiate = cls
         else:
             op_cls_to_instantiate = cls.op_registry_oot[op_name]
-            logger.debug("Instantiating custom op: %s using %s", op_name,
-                         str(op_cls_to_instantiate))
+            logger.debug(
+                "Instantiating custom op: %s using %s",
+                op_name,
+                str(op_cls_to_instantiate),
+            )
         return super().__new__(op_cls_to_instantiate)
 
     def __init__(self):
@@ -86,8 +89,7 @@ def dispatch_forward(self):
         if enabled:
             compilation_config.enabled_custom_ops.update([self.__class__.name])
         else:
-            compilation_config.disabled_custom_ops.update(
-                [self.__class__.name])
+            compilation_config.disabled_custom_ops.update([self.__class__.name])
 
         if not enabled:
             return self.forward_native
@@ -119,8 +121,7 @@ def enabled(cls) -> bool:
 
         enabled = f"+{cls.name}" in custom_ops
         disabled = f"-{cls.name}" in custom_ops
-        assert not (enabled
-                    and disabled), f"Cannot enable and disable {cls.name}"
+        assert not (enabled and disabled), f"Cannot enable and disable {cls.name}"
 
         return (CustomOp.default_on() or enabled) and not disabled
 
@@ -131,9 +132,12 @@ def default_on() -> bool:
         Specifying 'all' or 'none' in custom_op takes precedence.
         """
         from vllm.config import CompilationLevel
+
         compilation_config = get_cached_compilation_config()
-        default_on = (compilation_config.level < CompilationLevel.PIECEWISE
-                      or not compilation_config.use_inductor)
+        default_on = (
+            compilation_config.level < CompilationLevel.PIECEWISE
+            or not compilation_config.use_inductor
+        )
         count_none = compilation_config.custom_ops.count("none")
         count_all = compilation_config.custom_ops.count("all")
         return default_on and not count_none > 0 or count_all > 0
@@ -143,13 +147,12 @@ def default_on() -> bool:
     # Examples:
     # - MyOp.enabled()
     # - op_registry["my_op"].enabled()
-    op_registry: dict[str, type['CustomOp']] = {}
-    op_registry_oot: dict[str, type['CustomOp']] = {}
+    op_registry: dict[str, type["CustomOp"]] = {}
+    op_registry_oot: dict[str, type["CustomOp"]] = {}
 
     # Decorator to register custom ops.
     @classmethod
     def register(cls, name: str):
-
         def decorator(op_cls):
             assert name not in cls.op_registry, f"Duplicate op name: {name}"
             op_cls.name = name
@@ -169,11 +172,9 @@ def decorator(op_cls):
     # - @CustomOP.register_oot(name="UnquantizedFusedMoEMethod")
     @classmethod
     def register_oot(cls, _decorated_op_cls=None, name: Optional[str] = None):
-
         def decorator(op_cls):
             reg_name = name if name is not None else cls.__name__
-            assert reg_name not in cls.op_registry_oot, \
-                f"Duplicate op name: {reg_name}"
+            assert reg_name not in cls.op_registry_oot, f"Duplicate op name: {reg_name}"
             op_cls.name = reg_name
             cls.op_registry_oot[reg_name] = op_cls
             return op_cls
diff --git a/vllm/model_executor/layers/activation.py b/vllm/model_executor/layers/activation.py
index 235df1a77c5c..96745b99f7a7 100644
--- a/vllm/model_executor/layers/activation.py
+++ b/vllm/model_executor/layers/activation.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Custom activation functions."""
+
 import math
 from typing import Optional
 
@@ -8,8 +9,11 @@
 import torch.nn as nn
 import torch.nn.functional as F
 
-from vllm.distributed import (divide, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size)
+from vllm.distributed import (
+    divide,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.logger import init_logger
 from vllm.model_executor.custom_op import CustomOp
 from vllm.model_executor.utils import set_weight_attrs
@@ -32,7 +36,7 @@ class FatreluAndMul(CustomOp):
         return: (num_tokens, d) or (batch_size, seq_len, d)
     """
 
-    def __init__(self, threshold: float = 0.):
+    def __init__(self, threshold: float = 0.0):
         super().__init__()
         self.threshold = threshold
         if current_platform.is_cuda_alike():
@@ -49,7 +53,7 @@ def forward_native(self, x: torch.Tensor) -> torch.Tensor:
 
     def forward_cuda(self, x: torch.Tensor) -> torch.Tensor:
         d = x.shape[-1] // 2
-        output_shape = (x.shape[:-1] + (d, ))
+        output_shape = x.shape[:-1] + (d,)
         out = torch.empty(output_shape, dtype=x.dtype, device=x.device)
         self.op(out, x, self.threshold)
         return out
@@ -72,6 +76,7 @@ def __init__(self):
             self.op = torch.ops._C.silu_and_mul
         elif current_platform.is_xpu():
             from vllm._ipex_ops import ipex_ops
+
             self.op = ipex_ops.silu_and_mul
         elif current_platform.is_cpu():
             self._forward_method = self.forward_native
@@ -83,14 +88,14 @@ def forward_native(self, x: torch.Tensor) -> torch.Tensor:
 
     def forward_cuda(self, x: torch.Tensor) -> torch.Tensor:
         d = x.shape[-1] // 2
-        output_shape = (x.shape[:-1] + (d, ))
+        output_shape = x.shape[:-1] + (d,)
         out = torch.empty(output_shape, dtype=x.dtype, device=x.device)
         self.op(out, x)
         return out
 
     def forward_xpu(self, x: torch.Tensor) -> torch.Tensor:
         d = x.shape[-1] // 2
-        output_shape = (x.shape[:-1] + (d, ))
+        output_shape = x.shape[:-1] + (d,)
         out = torch.empty(output_shape, dtype=x.dtype, device=x.device)
         self.op(out, x)
         return out
@@ -113,6 +118,7 @@ def __init__(self):
             self.op = torch.ops._C.mul_and_silu
         elif current_platform.is_xpu():
             from vllm._ipex_ops import ipex_ops
+
             self.op = ipex_ops.silu_and_mul
         elif current_platform.is_cpu():
             self._forward_method = self.forward_native
@@ -124,7 +130,7 @@ def forward_native(self, x: torch.Tensor) -> torch.Tensor:
 
     def forward_cuda(self, x: torch.Tensor) -> torch.Tensor:
         d = x.shape[-1] // 2
-        output_shape = (x.shape[:-1] + (d, ))
+        output_shape = x.shape[:-1] + (d,)
         out = torch.empty(output_shape, dtype=x.dtype, device=x.device)
         self.op(out, x)
         return out
@@ -156,10 +162,8 @@ def __init__(self, activation_sparsity: float, approximate: str = "none"):
 
         # Sparsity.
         if activation_sparsity == 0.0:
-            raise ValueError(
-                "activation_sparsity is 0.0. Please use GeluAndMul.")
-        target_sparsity_tensor = torch.tensor(activation_sparsity,
-                                              dtype=torch.float32)
+            raise ValueError("activation_sparsity is 0.0. Please use GeluAndMul.")
+        target_sparsity_tensor = torch.tensor(activation_sparsity, dtype=torch.float32)
         normal_dist = torch.distributions.normal.Normal(0, 1)
         self.std_multiplier = normal_dist.icdf(target_sparsity_tensor)
 
@@ -207,6 +211,7 @@ def __init__(self, approximate: str = "none"):
                 self.op = torch.ops._C.gelu_tanh_and_mul
         elif current_platform.is_xpu():
             from vllm._ipex_ops import ipex_ops
+
             if approximate == "none":
                 self.op = ipex_ops.gelu_and_mul
             else:
@@ -219,20 +224,20 @@ def forward_native(self, x: torch.Tensor) -> torch.Tensor:
 
     def forward_cuda(self, x: torch.Tensor) -> torch.Tensor:
         d = x.shape[-1] // 2
-        output_shape = (x.shape[:-1] + (d, ))
+        output_shape = x.shape[:-1] + (d,)
         out = torch.empty(output_shape, dtype=x.dtype, device=x.device)
         self.op(out, x)
         return out
 
     def forward_xpu(self, x: torch.Tensor) -> torch.Tensor:
         d = x.shape[-1] // 2
-        output_shape = (x.shape[:-1] + (d, ))
+        output_shape = x.shape[:-1] + (d,)
         out = torch.empty(output_shape, dtype=x.dtype, device=x.device)
         self.op(out, x)
         return out
 
     def extra_repr(self) -> str:
-        return f'approximate={repr(self.approximate)}'
+        return f"approximate={repr(self.approximate)}"
 
 
 @CustomOp.register("swigluoai_and_mul")
@@ -255,7 +260,7 @@ def forward_native(self, x: torch.Tensor) -> torch.Tensor:
 
     def forward_cuda(self, x: torch.Tensor) -> torch.Tensor:
         d = x.shape[-1] // 2
-        output_shape = (x.shape[:-1] + (d, ))
+        output_shape = x.shape[:-1] + (d,)
         out = torch.empty(output_shape, dtype=x.dtype, device=x.device)
         torch.ops._C.swigluoai_and_mul(out, x, self.alpha, self.limit)
         return out
@@ -266,20 +271,19 @@ def extra_repr(self) -> str:
 
 @CustomOp.register("gelu_new")
 class NewGELU(CustomOp):
-
     def __init__(self):
         super().__init__()
         if current_platform.is_cuda_alike() or current_platform.is_cpu():
             self.op = torch.ops._C.gelu_new
         elif current_platform.is_xpu():
             from vllm._ipex_ops import ipex_ops
+
             self.op = ipex_ops.gelu_new
 
     def forward_native(self, x: torch.Tensor) -> torch.Tensor:
         """PyTorch-native implementation equivalent to forward()."""
         c = math.sqrt(2.0 / math.pi)
-        return 0.5 * x * (1.0 + torch.tanh(c *
-                                           (x + 0.044715 * torch.pow(x, 3.0))))
+        return 0.5 * x * (1.0 + torch.tanh(c * (x + 0.044715 * torch.pow(x, 3.0))))
 
     def forward_cuda(self, x: torch.Tensor) -> torch.Tensor:
         out = torch.empty_like(x)
@@ -292,19 +296,18 @@ def forward_xpu(self, x: torch.Tensor) -> torch.Tensor:
 
 @CustomOp.register("gelu_fast")
 class FastGELU(CustomOp):
-
     def __init__(self):
         super().__init__()
         if current_platform.is_cuda_alike() or current_platform.is_cpu():
             self.op = torch.ops._C.gelu_fast
         elif current_platform.is_xpu():
             from vllm._ipex_ops import ipex_ops
+
             self.op = ipex_ops.gelu_fast
 
     def forward_native(self, x: torch.Tensor) -> torch.Tensor:
         """PyTorch-native implementation equivalent to forward()."""
-        return 0.5 * x * (1.0 + torch.tanh(x * 0.7978845608 *
-                                           (1.0 + 0.044715 * x * x)))
+        return 0.5 * x * (1.0 + torch.tanh(x * 0.7978845608 * (1.0 + 0.044715 * x * x)))
 
     def forward_cuda(self, x: torch.Tensor) -> torch.Tensor:
         out = torch.empty_like(x)
@@ -324,6 +327,7 @@ def __init__(self):
             self.op = torch.ops._C.gelu_quick
         elif current_platform.is_xpu():
             from vllm._ipex_ops import ipex_ops
+
             self.op = ipex_ops.gelu_quick
 
     def forward_native(self, x: torch.Tensor) -> torch.Tensor:
@@ -355,7 +359,7 @@ def forward_native(self, x: torch.Tensor) -> torch.Tensor:
         return torch.square(F.relu(x))
 
     def forward_cuda(self, x: torch.Tensor) -> torch.Tensor:
-        #TODO : implement cuda kernels
+        # TODO : implement cuda kernels
         return self.forward_native(x)
 
 
@@ -378,12 +382,15 @@ def __init__(
     ):
         super().__init__()
         self.alpha_p = nn.Parameter(
-            torch.log(torch.exp(torch.tensor(alpha_p_init, dtype=dtype)) -
-                      1).unsqueeze(0))
+            torch.log(torch.exp(torch.tensor(alpha_p_init, dtype=dtype)) - 1).unsqueeze(
+                0
+            )
+        )
         self.alpha_n = nn.Parameter(
             torch.log(
-                torch.exp(torch.tensor(alpha_n_init - beta, dtype=dtype)) -
-                1).unsqueeze(0))
+                torch.exp(torch.tensor(alpha_n_init - beta, dtype=dtype)) - 1
+            ).unsqueeze(0)
+        )
         self.register_buffer("beta", torch.tensor(beta, dtype=dtype))
         self.register_buffer("eps", torch.tensor(eps, dtype=dtype))
         self.with_vector_loads = with_vector_loads
@@ -403,8 +410,10 @@ def __init__(
                 self._xielu_cuda_fn = allow_in_graph(self._xielu_cuda)
                 msg += " Enabled torch._dynamo for xIELU CUDA."
             except Exception as err:
-                msg += (f" Could not enable torch._dynamo for xIELU ({err}) - "
-                        "this may result in slower performance.")
+                msg += (
+                    f" Could not enable torch._dynamo for xIELU ({err}) - "
+                    "this may result in slower performance."
+                )
                 self._xielu_cuda_fn = self._xielu_cuda
             logger.warning_once(msg)
         except Exception as err:
@@ -421,14 +430,12 @@ def _xielu_python(self, x: torch.Tensor) -> torch.Tensor:
         return torch.where(
             x > 0,
             alpha_p * x * x + self.beta * x,
-            (torch.expm1(torch.min(x, self.eps)) - x) * alpha_n +
-            self.beta * x,
+            (torch.expm1(torch.min(x, self.eps)) - x) * alpha_n + self.beta * x,
         )
 
     def _xielu_cuda(self, x: torch.Tensor) -> torch.Tensor:
         """Firewall function to prevent torch.compile from seeing .item()"""
-        assert self._xielu_cuda_obj is not None, (
-            "XIELU CUDA object must not be None")
+        assert self._xielu_cuda_obj is not None, "XIELU CUDA object must not be None"
         original_shape = x.shape
         # CUDA kernel expects 3D tensors, reshape if needed
         while x.dim() < 3:
@@ -486,14 +493,14 @@ def __init__(
         self.input_is_parallel = input_is_parallel
         if input_is_parallel:
             tp_size = get_tensor_model_parallel_world_size()
-            intermediate_size_per_partition = divide(intermediate_size,
-                                                     tp_size)
+            intermediate_size_per_partition = divide(intermediate_size, tp_size)
         else:
             intermediate_size_per_partition = intermediate_size
         if params_dtype is None:
             params_dtype = torch.get_default_dtype()
         self.scales = nn.Parameter(
-            torch.empty(intermediate_size_per_partition, dtype=params_dtype))
+            torch.empty(intermediate_size_per_partition, dtype=params_dtype)
+        )
         set_weight_attrs(self.scales, {"weight_loader": self.weight_loader})
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -510,30 +517,21 @@ def weight_loader(self, param: nn.Parameter, loaded_weight: torch.Tensor):
         param_data.copy_(loaded_weight)
 
 
-_ACTIVATION_REGISTRY = LazyDict({
-    "gelu":
-    lambda: nn.GELU(),
-    "gelu_fast":
-    lambda: FastGELU(),
-    "gelu_new":
-    lambda: NewGELU(),
-    "gelu_pytorch_tanh":
-    lambda: nn.GELU(approximate="tanh"),
-    "relu":
-    lambda: nn.ReLU(),
-    "relu2":
-    lambda: ReLUSquaredActivation(),
-    "silu":
-    lambda: nn.SiLU(),
-    "quick_gelu":
-    lambda: QuickGELU(),
-    "tanh":
-    lambda: nn.Tanh(),
-    "sigmoid":
-    lambda: nn.Sigmoid(),
-    "xielu":
-    lambda: XIELU(),
-})
+_ACTIVATION_REGISTRY = LazyDict(
+    {
+        "gelu": lambda: nn.GELU(),
+        "gelu_fast": lambda: FastGELU(),
+        "gelu_new": lambda: NewGELU(),
+        "gelu_pytorch_tanh": lambda: nn.GELU(approximate="tanh"),
+        "relu": lambda: nn.ReLU(),
+        "relu2": lambda: ReLUSquaredActivation(),
+        "silu": lambda: nn.SiLU(),
+        "quick_gelu": lambda: QuickGELU(),
+        "tanh": lambda: nn.Tanh(),
+        "sigmoid": lambda: nn.Sigmoid(),
+        "xielu": lambda: XIELU(),
+    }
+)
 
 
 def get_act_fn(act_fn_name: str) -> nn.Module:
@@ -547,29 +545,25 @@ def get_act_fn(act_fn_name: str) -> nn.Module:
         act_fn_name = activation_name
 
     if act_fn_name not in _ACTIVATION_REGISTRY:
-        raise ValueError(
-            f"Activation function {act_fn_name!r} is not supported.")
+        raise ValueError(f"Activation function {act_fn_name!r} is not supported.")
 
     return _ACTIVATION_REGISTRY[act_fn_name]
 
 
-_ACTIVATION_AND_MUL_REGISTRY = LazyDict({
-    "gelu":
-    lambda: GeluAndMul(),
-    "silu":
-    lambda: SiluAndMul(),
-    "geglu":
-    lambda: GeluAndMul(),
-    "swigluoai":
-    lambda *args, **kwargs: SwigluOAIAndMul(*args, **kwargs),
-})
+_ACTIVATION_AND_MUL_REGISTRY = LazyDict(
+    {
+        "gelu": lambda: GeluAndMul(),
+        "silu": lambda: SiluAndMul(),
+        "geglu": lambda: GeluAndMul(),
+        "swigluoai": lambda *args, **kwargs: SwigluOAIAndMul(*args, **kwargs),
+    }
+)
 
 
 def get_act_and_mul_fn(act_fn_name: str) -> nn.Module:
     """Get an activation-and-mul (i.e. SiluAndMul) function by name."""
     act_fn_name = act_fn_name.lower()
     if act_fn_name not in _ACTIVATION_AND_MUL_REGISTRY:
-        raise ValueError(
-            f"Activation function {act_fn_name!r} is not supported.")
+        raise ValueError(f"Activation function {act_fn_name!r} is not supported.")
 
     return _ACTIVATION_AND_MUL_REGISTRY[act_fn_name]
diff --git a/vllm/model_executor/layers/attention_layer_base.py b/vllm/model_executor/layers/attention_layer_base.py
index 782818f55fbc..fa74c20840da 100644
--- a/vllm/model_executor/layers/attention_layer_base.py
+++ b/vllm/model_executor/layers/attention_layer_base.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Base class for attention-like layers."""
+
 from abc import ABC, abstractmethod
 from typing import TYPE_CHECKING
 
@@ -10,10 +11,10 @@
 
 class AttentionLayerBase(ABC):
     """
-    Base class for attention-like layers (Attention, Mamba, etc.) 
+    Base class for attention-like layers (Attention, Mamba, etc.)
     that support the v1 engine.
-    
-    This provides a common interface for getting attention backends 
+
+    This provides a common interface for getting attention backends
     from different layer types.
     """
 
diff --git a/vllm/model_executor/layers/batch_invariant.py b/vllm/model_executor/layers/batch_invariant.py
index c025d509d862..09bc71cb18b6 100644
--- a/vllm/model_executor/layers/batch_invariant.py
+++ b/vllm/model_executor/layers/batch_invariant.py
@@ -11,14 +11,17 @@
 from vllm.triton_utils import tl, triton
 
 
-def _matmul_launch_metadata(grid: Callable[..., Any], kernel: Any,
-                            args: dict[str, Any]) -> dict[str, Any]:
+def _matmul_launch_metadata(
+    grid: Callable[..., Any], kernel: Any, args: dict[str, Any]
+) -> dict[str, Any]:
     ret = {}
     m, n, k = args["M"], args["N"], args["K"]
     ret["name"] = f"{kernel.name} [M={m}, N={n}, K={k}]"
     if "tiles_per_update" in args:
-        ret["name"] = (f"{kernel.name} [M={m}, N={n}, K={k}, "
-                       f"tiles_per_update={args['tiles_per_update']:02}]")
+        ret["name"] = (
+            f"{kernel.name} [M={m}, N={n}, K={k}, "
+            f"tiles_per_update={args['tiles_per_update']:02}]"
+        )
     if "c_ptr" in args:
         bytes_per_elem = args["c_ptr"].element_size()
     else:
@@ -75,8 +78,9 @@ def matmul_kernel_persistent(
     num_pid_in_group = GROUP_SIZE_M * num_pid_n
 
     for tile_id in tl.range(start_pid, num_tiles, NUM_SMS, flatten=True):
-        pid_m, pid_n = _compute_pid(tile_id, num_pid_in_group, num_pid_m,
-                                    GROUP_SIZE_M, NUM_SMS)
+        pid_m, pid_n = _compute_pid(
+            tile_id, num_pid_in_group, num_pid_m, GROUP_SIZE_M, NUM_SMS
+        )
         start_m = pid_m * BLOCK_SIZE_M
         start_n = pid_n * BLOCK_SIZE_N
         offs_am = start_m + tl.arange(0, BLOCK_SIZE_M)
@@ -87,46 +91,44 @@ def matmul_kernel_persistent(
             offs_bn = offs_bn.to(tl.int64)
         offs_am = tl.where(offs_am < M, offs_am, 0)
         offs_bn = tl.where(offs_bn < N, offs_bn, 0)
-        offs_am = tl.max_contiguous(tl.multiple_of(offs_am, BLOCK_SIZE_M),
-                                    BLOCK_SIZE_M)
-        offs_bn = tl.max_contiguous(tl.multiple_of(offs_bn, BLOCK_SIZE_N),
-                                    BLOCK_SIZE_N)
+        offs_am = tl.max_contiguous(tl.multiple_of(offs_am, BLOCK_SIZE_M), BLOCK_SIZE_M)
+        offs_bn = tl.max_contiguous(tl.multiple_of(offs_bn, BLOCK_SIZE_N), BLOCK_SIZE_N)
 
         accumulator = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N), dtype=tl.float32)
         for ki in range(k_tiles):
             if A_LARGE or B_LARGE:
-                offs_k = ki * BLOCK_SIZE_K + tl.arange(0, BLOCK_SIZE_K).to(
-                    tl.int64)
+                offs_k = ki * BLOCK_SIZE_K + tl.arange(0, BLOCK_SIZE_K).to(tl.int64)
             else:
                 offs_k = ki * BLOCK_SIZE_K + tl.arange(0, BLOCK_SIZE_K)
-            a_ptrs = a_ptr + (offs_am[:, None] * stride_am +
-                              offs_k[None, :] * stride_ak)
-            b_ptrs = b_ptr + (offs_k[:, None] * stride_bk +
-                              offs_bn[None, :] * stride_bn)
-
-            a = tl.load(a_ptrs,
-                        mask=offs_k_for_mask[None, :] < K - ki * BLOCK_SIZE_K,
-                        other=0.0)
-            b = tl.load(b_ptrs,
-                        mask=offs_k_for_mask[:, None] < K - ki * BLOCK_SIZE_K,
-                        other=0.0)
+            a_ptrs = a_ptr + (
+                offs_am[:, None] * stride_am + offs_k[None, :] * stride_ak
+            )
+            b_ptrs = b_ptr + (
+                offs_k[:, None] * stride_bk + offs_bn[None, :] * stride_bn
+            )
+
+            a = tl.load(
+                a_ptrs, mask=offs_k_for_mask[None, :] < K - ki * BLOCK_SIZE_K, other=0.0
+            )
+            b = tl.load(
+                b_ptrs, mask=offs_k_for_mask[:, None] < K - ki * BLOCK_SIZE_K, other=0.0
+            )
             accumulator = tl.dot(a, b, accumulator)
 
         tile_id_c += NUM_SMS
-        pid_m, pid_n = _compute_pid(tile_id_c, num_pid_in_group, num_pid_m,
-                                    GROUP_SIZE_M, NUM_SMS)
+        pid_m, pid_n = _compute_pid(
+            tile_id_c, num_pid_in_group, num_pid_m, GROUP_SIZE_M, NUM_SMS
+        )
         offs_cm = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M)
         offs_cn = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
         if C_LARGE:
             offs_cm = offs_cm.to(tl.int64)
             offs_cn = offs_cn.to(tl.int64)
-        c_ptrs = c_ptr + stride_cm * offs_cm[:, None] + stride_cn * offs_cn[
-            None, :]
+        c_ptrs = c_ptr + stride_cm * offs_cm[:, None] + stride_cn * offs_cn[None, :]
         c_mask = (offs_cm[:, None] < M) & (offs_cn[None, :] < N)
         if HAS_BIAS:
             bias_ptrs = bias_ptr + offs_cn
-            bias = tl.load(bias_ptrs, mask=offs_cn < N,
-                           other=0.0).to(tl.float32)
+            bias = tl.load(bias_ptrs, mask=offs_cn < N, other=0.0).to(tl.float32)
             accumulator += bias
         if c_ptr.dtype.element_ty == tl.float8e4nv:
             c = accumulator.to(tl.float8e4nv)
@@ -135,14 +137,15 @@ def matmul_kernel_persistent(
         tl.store(c_ptrs, c, mask=c_mask)
 
 
-def matmul_persistent(a: torch.Tensor,
-                      b: torch.Tensor,
-                      bias: Union[torch.Tensor, None] = None):
+def matmul_persistent(
+    a: torch.Tensor, b: torch.Tensor, bias: Union[torch.Tensor, None] = None
+):
     # Check constraints.
     assert a.shape[1] == b.shape[0], "Incompatible dimensions"
     assert a.dtype == b.dtype, "Incompatible dtypes"
     assert bias is None or bias.dim() == 1, (
-        "Currently assuming bias is 1D, let Horace know if you run into this")
+        "Currently assuming bias is 1D, let Horace know if you run into this"
+    )
     NUM_SMS = torch.cuda.get_device_properties("cuda").multi_processor_count
     M, K = a.shape
     K, N = b.shape
@@ -152,10 +155,13 @@ def matmul_persistent(a: torch.Tensor,
 
     # 1D launch kernel where each block gets its own program.
     def grid(META):
-        return (min(
-            NUM_SMS,
-            triton.cdiv(M, META["BLOCK_SIZE_M"]) *
-            triton.cdiv(N, META["BLOCK_SIZE_N"])), )
+        return (
+            min(
+                NUM_SMS,
+                triton.cdiv(M, META["BLOCK_SIZE_M"])
+                * triton.cdiv(N, META["BLOCK_SIZE_N"]),
+            ),
+        )
 
     configs = {
         torch.bfloat16: {
@@ -284,8 +290,9 @@ def log_softmax(input: torch.Tensor, dim: int = -1) -> torch.Tensor:
         Tensor with log_softmax applied along the specified dimension
     """
     if dim != -1 and dim != input.ndim - 1:
-        raise ValueError("This implementation only supports log_softmax along "
-                         "the last dimension")
+        raise ValueError(
+            "This implementation only supports log_softmax along the last dimension"
+        )
 
     # Flatten all dimensions except the last one
     original_shape = input.shape
@@ -301,7 +308,7 @@ def log_softmax(input: torch.Tensor, dim: int = -1) -> torch.Tensor:
     BLOCK_SIZE = 1024
 
     # Launch kernel with one block per row
-    grid = (n_rows, )
+    grid = (n_rows,)
     _log_softmax_kernel[grid](
         input_2d,
         output,
@@ -350,8 +357,9 @@ def mean_kernel(
         mask = n_offsets < N
 
         # Calculate input indices
-        input_idx = m_idx * input_stride0 + n_offsets * input_stride1 \
-            + k_idx * input_stride2
+        input_idx = (
+            m_idx * input_stride0 + n_offsets * input_stride1 + k_idx * input_stride2
+        )
 
         # Load and accumulate
         vals = tl.load(input_ptr + input_idx, mask=mask, other=0.0)
@@ -363,10 +371,12 @@ def mean_kernel(
     tl.store(output_ptr + output_idx, mean_val)
 
 
-def mean_dim(input: torch.Tensor,
-             dim: int,
-             keepdim: bool = False,
-             dtype: Union[torch.dtype, None] = None) -> torch.Tensor:
+def mean_dim(
+    input: torch.Tensor,
+    dim: int,
+    keepdim: bool = False,
+    dtype: Union[torch.dtype, None] = None,
+) -> torch.Tensor:
     """
     Triton implementation of torch.mean with single dimension reduction.
 
@@ -383,7 +393,8 @@ def mean_dim(input: torch.Tensor,
     # Validate inputs
     assert input.is_cuda, "Input must be a CUDA tensor"
     assert -input.ndim <= dim < input.ndim, (
-        f"Invalid dimension {dim} for tensor with {input.ndim} dimensions")
+        f"Invalid dimension {dim} for tensor with {input.ndim} dimensions"
+    )
 
     # Handle negative dim
     if dim < 0:
@@ -422,7 +433,7 @@ def mean_dim(input: torch.Tensor,
         output_shape = shape.copy()
         output_shape[dim] = 1
     else:
-        output_shape = shape[:dim] + shape[dim + 1:]
+        output_shape = shape[:dim] + shape[dim + 1 :]
 
     # Create output tensor
     output = torch.empty(output_shape, dtype=dtype, device=input.device)
@@ -434,7 +445,7 @@ def mean_dim(input: torch.Tensor,
         output_2d = output.reshape(M, K)
 
     # Launch kernel
-    grid = (M * K, )
+    grid = (M * K,)
     BLOCK_SIZE = 1024
 
     mean_kernel[grid](
@@ -467,12 +478,10 @@ def _log_softmax_batch_invariant(input, dim, _half_to_float):
     return log_softmax(input, dim=dim)
 
 
-def mean_batch_invariant(input,
-                         dim,
-                         keepdim=False,
-                         dtype: Union[torch.dtype, None] = None):
-    assert dtype is None or dtype == torch.float32, \
-        f"unsupported dtype: {dtype}"
+def mean_batch_invariant(
+    input, dim, keepdim=False, dtype: Union[torch.dtype, None] = None
+):
+    assert dtype is None or dtype == torch.float32, f"unsupported dtype: {dtype}"
 
     result = input.to(torch.float32)
 
@@ -509,8 +518,9 @@ def enable_batch_invariant_mode():
     _batch_invariant_LIB = torch.library.Library("aten", "IMPL")
     _batch_invariant_LIB.impl("aten::mm", mm_batch_invariant, "CUDA")
     _batch_invariant_LIB.impl("aten::addmm", addmm_batch_invariant, "CUDA")
-    _batch_invariant_LIB.impl("aten::_log_softmax",
-                              _log_softmax_batch_invariant, "CUDA")
+    _batch_invariant_LIB.impl(
+        "aten::_log_softmax", _log_softmax_batch_invariant, "CUDA"
+    )
     _batch_invariant_LIB.impl("aten::mean.dim", mean_batch_invariant, "CUDA")
 
 
diff --git a/vllm/model_executor/layers/fla/ops/chunk.py b/vllm/model_executor/layers/fla/ops/chunk.py
index e7d295aff239..d65c87aba11c 100644
--- a/vllm/model_executor/layers/fla/ops/chunk.py
+++ b/vllm/model_executor/layers/fla/ops/chunk.py
@@ -23,22 +23,22 @@
 from .wy_fast import recompute_w_u_fwd
 
 
-def chunk_gated_delta_rule_fwd(q: torch.Tensor,
-                               k: torch.Tensor,
-                               v: torch.Tensor,
-                               g: torch.Tensor,
-                               beta: torch.Tensor,
-                               scale: float,
-                               initial_state: torch.Tensor,
-                               output_final_state: bool,
-                               cu_seqlens: Optional[torch.LongTensor] = None):
+def chunk_gated_delta_rule_fwd(
+    q: torch.Tensor,
+    k: torch.Tensor,
+    v: torch.Tensor,
+    g: torch.Tensor,
+    beta: torch.Tensor,
+    scale: float,
+    initial_state: torch.Tensor,
+    output_final_state: bool,
+    cu_seqlens: Optional[torch.LongTensor] = None,
+):
     g = chunk_local_cumsum(g, chunk_size=64, cu_seqlens=cu_seqlens)
     # obtain WY representation. u is actually the new v.
-    A = chunk_scaled_dot_kkt_fwd(k=k,
-                                 beta=beta,
-                                 g_cumsum=g,
-                                 cu_seqlens=cu_seqlens,
-                                 output_dtype=torch.float32)
+    A = chunk_scaled_dot_kkt_fwd(
+        k=k, beta=beta, g_cumsum=g, cu_seqlens=cu_seqlens, output_dtype=torch.float32
+    )
     A = solve_tril(A=A, cu_seqlens=cu_seqlens, output_dtype=k.dtype)
     w, u = recompute_w_u_fwd(
         k=k,
@@ -73,21 +73,22 @@ def chunk_gated_delta_rule_fwd(q: torch.Tensor,
 
 
 class ChunkGatedDeltaRuleFunction(torch.autograd.Function):
-
     @staticmethod
     @input_guard
-    @torch.amp.custom_fwd(device_type='cuda')
-    def forward(ctx,
-                q: torch.Tensor,
-                k: torch.Tensor,
-                v: torch.Tensor,
-                g: torch.Tensor,
-                beta: torch.Tensor,
-                scale: float,
-                initial_state: torch.Tensor,
-                output_final_state: bool,
-                cu_seqlens: Optional[torch.LongTensor] = None,
-                use_qk_l2norm_in_kernel: bool = False):
+    @torch.amp.custom_fwd(device_type="cuda")
+    def forward(
+        ctx,
+        q: torch.Tensor,
+        k: torch.Tensor,
+        v: torch.Tensor,
+        g: torch.Tensor,
+        beta: torch.Tensor,
+        scale: float,
+        initial_state: torch.Tensor,
+        output_final_state: bool,
+        cu_seqlens: Optional[torch.LongTensor] = None,
+        use_qk_l2norm_in_kernel: bool = False,
+    ):
         if use_qk_l2norm_in_kernel:
             q = l2norm_fwd(q)
             k = l2norm_fwd(k)
@@ -109,17 +110,19 @@ def forward(ctx,
 
 
 @torch.compiler.disable
-def chunk_gated_delta_rule(q: torch.Tensor,
-                           k: torch.Tensor,
-                           v: torch.Tensor,
-                           g: torch.Tensor,
-                           beta: torch.Tensor,
-                           scale: float = None,
-                           initial_state: torch.Tensor = None,
-                           output_final_state: bool = False,
-                           cu_seqlens: Optional[torch.LongTensor] = None,
-                           head_first: bool = False,
-                           use_qk_l2norm_in_kernel: bool = False):
+def chunk_gated_delta_rule(
+    q: torch.Tensor,
+    k: torch.Tensor,
+    v: torch.Tensor,
+    g: torch.Tensor,
+    beta: torch.Tensor,
+    scale: float = None,
+    initial_state: torch.Tensor = None,
+    output_final_state: bool = False,
+    cu_seqlens: Optional[torch.LongTensor] = None,
+    head_first: bool = False,
+    use_qk_l2norm_in_kernel: bool = False,
+):
     r"""
     Args:
         q (torch.Tensor):
@@ -184,42 +187,55 @@ def chunk_gated_delta_rule(q: torch.Tensor,
         )
     """
     assert q.dtype == k.dtype == v.dtype
-    assert q.dtype != torch.float32, "ChunkGatedDeltaRuleFunction does not support float32. Please use bfloat16."
-    assert len(
-        beta.shape
-    ) == 3, "beta must be of shape [B, T, H] if head_first=False, or [B, H, T] otherwise."
+    assert q.dtype != torch.float32, (
+        "ChunkGatedDeltaRuleFunction does not support float32. Please use bfloat16."
+    )
+    assert len(beta.shape) == 3, (
+        "beta must be of shape [B, T, H] if head_first=False, or [B, H, T] otherwise."
+    )
 
     if head_first:
         raise DeprecationWarning(
             "head_first is deprecated and will be removed in a future version. "
             "Please use head_first=False for now instead.",
-            stacklevel=2)
+            stacklevel=2,
+        )
         q, k, v, beta, g = map(
-            lambda x: rearrange(x, 'b h t ... -> b t h ...'),
-            (q, k, v, beta, g))
+            lambda x: rearrange(x, "b h t ... -> b t h ..."), (q, k, v, beta, g)
+        )
     if not head_first and q.shape[1] < q.shape[2]:
         warnings.warn(
             f"Input tensor shape suggests potential format mismatch: seq_len ({q.shape[1]}) < num_heads ({q.shape[2]}). "
             "This may indicate the inputs were passed in head-first format [B, H, T, ...] "
             "when head_first=False was specified. "
             "Please verify your input tensor format matches the expected shape [B, T, H, ...].",
-            stacklevel=2)
+            stacklevel=2,
+        )
     if cu_seqlens is not None:
         if q.shape[0] != 1:
             raise ValueError(
                 f"The batch size is expected to be 1 rather than {q.shape[0]} when using `cu_seqlens`."
-                f"Please flatten variable-length inputs before processing.")
-        if initial_state is not None and initial_state.shape[0] != len(
-                cu_seqlens) - 1:
+                f"Please flatten variable-length inputs before processing."
+            )
+        if initial_state is not None and initial_state.shape[0] != len(cu_seqlens) - 1:
             raise ValueError(
                 f"The number of initial states is expected to be equal to the number of input sequences, "
                 f"i.e., {len(cu_seqlens) - 1} rather than {initial_state.shape[0]}."
             )
     if scale is None:
-        scale = k.shape[-1]**-0.5
+        scale = k.shape[-1] ** -0.5
     o, final_state = ChunkGatedDeltaRuleFunction.apply(
-        q, k, v, g, beta, scale, initial_state, output_final_state, cu_seqlens,
-        use_qk_l2norm_in_kernel)
+        q,
+        k,
+        v,
+        g,
+        beta,
+        scale,
+        initial_state,
+        output_final_state,
+        cu_seqlens,
+        use_qk_l2norm_in_kernel,
+    )
     if head_first:
-        o = rearrange(o, 'b t h ... -> b h t ...')
+        o = rearrange(o, "b t h ... -> b h t ...")
     return o, final_state
diff --git a/vllm/model_executor/layers/fla/ops/chunk_delta_h.py b/vllm/model_executor/layers/fla/ops/chunk_delta_h.py
index 34006f87f457..817962d9c946 100644
--- a/vllm/model_executor/layers/fla/ops/chunk_delta_h.py
+++ b/vllm/model_executor/layers/fla/ops/chunk_delta_h.py
@@ -20,22 +20,26 @@
 NUM_WARPS = [2, 4] if is_nvidia_hopper else [2, 4, 8, 16]
 
 
-@triton.heuristics({
-    'USE_G': lambda args: args['g'] is not None,
-    'USE_INITIAL_STATE': lambda args: args['h0'] is not None,
-    'STORE_FINAL_STATE': lambda args: args['ht'] is not None,
-    'SAVE_NEW_VALUE': lambda args: args['v_new'] is not None,
-    'IS_VARLEN': lambda args: args['cu_seqlens'] is not None,
-})
+@triton.heuristics(
+    {
+        "USE_G": lambda args: args["g"] is not None,
+        "USE_INITIAL_STATE": lambda args: args["h0"] is not None,
+        "STORE_FINAL_STATE": lambda args: args["ht"] is not None,
+        "SAVE_NEW_VALUE": lambda args: args["v_new"] is not None,
+        "IS_VARLEN": lambda args: args["cu_seqlens"] is not None,
+    }
+)
 @triton.autotune(
     configs=[
-        triton.Config({'BV': BV}, num_warps=num_warps, num_stages=num_stages)
-        for num_warps in [2, 4] for num_stages in [2, 3, 4] for BV in [32, 64]
+        triton.Config({"BV": BV}, num_warps=num_warps, num_stages=num_stages)
+        for num_warps in [2, 4]
+        for num_stages in [2, 3, 4]
+        for BV in [32, 64]
     ],
-    key=['H', 'K', 'V', 'BT', 'USE_G'],
+    key=["H", "K", "V", "BT", "USE_G"],
     use_cuda_graph=use_cuda_graph,
 )
-@triton.jit(do_not_specialize=['T'])
+@triton.jit(do_not_specialize=["T"])
 def chunk_gated_delta_rule_fwd_kernel_h_blockdim64(
     k,
     v,
@@ -63,8 +67,10 @@ def chunk_gated_delta_rule_fwd_kernel_h_blockdim64(
     i_v, i_nh = tl.program_id(0), tl.program_id(1)
     i_n, i_h = i_nh // H, i_nh % H
     if IS_VARLEN:
-        bos, eos = tl.load(cu_seqlens + i_n).to(
-            tl.int32), tl.load(cu_seqlens + i_n + 1).to(tl.int32)
+        bos, eos = (
+            tl.load(cu_seqlens + i_n).to(tl.int32),
+            tl.load(cu_seqlens + i_n + 1).to(tl.int32),
+        )
         T = eos - bos
         NT = tl.cdiv(T, BT)
         boh = tl.load(chunk_offsets + i_n).to(tl.int32)
@@ -100,87 +106,98 @@ def chunk_gated_delta_rule_fwd_kernel_h_blockdim64(
 
     # load initial state
     if USE_INITIAL_STATE:
-        p_h0_1 = tl.make_block_ptr(h0, (K, V), (V, 1), (0, i_v * BV), (64, BV),
-                                   (1, 0))
+        p_h0_1 = tl.make_block_ptr(h0, (K, V), (V, 1), (0, i_v * BV), (64, BV), (1, 0))
         b_h1 += tl.load(p_h0_1, boundary_check=(0, 1)).to(tl.float32)
         if K > 64:
-            p_h0_2 = tl.make_block_ptr(h0, (K, V), (V, 1), (64, i_v * BV),
-                                       (64, BV), (1, 0))
+            p_h0_2 = tl.make_block_ptr(
+                h0, (K, V), (V, 1), (64, i_v * BV), (64, BV), (1, 0)
+            )
             b_h2 += tl.load(p_h0_2, boundary_check=(0, 1)).to(tl.float32)
         if K > 128:
-            p_h0_3 = tl.make_block_ptr(h0, (K, V), (V, 1), (128, i_v * BV),
-                                       (64, BV), (1, 0))
+            p_h0_3 = tl.make_block_ptr(
+                h0, (K, V), (V, 1), (128, i_v * BV), (64, BV), (1, 0)
+            )
             b_h3 += tl.load(p_h0_3, boundary_check=(0, 1)).to(tl.float32)
         if K > 192:
-            p_h0_4 = tl.make_block_ptr(h0, (K, V), (V, 1), (192, i_v * BV),
-                                       (64, BV), (1, 0))
+            p_h0_4 = tl.make_block_ptr(
+                h0, (K, V), (V, 1), (192, i_v * BV), (64, BV), (1, 0)
+            )
             b_h4 += tl.load(p_h0_4, boundary_check=(0, 1)).to(tl.float32)
 
     # main recurrence
     for i_t in range(NT):
-        p_h1 = tl.make_block_ptr(h + i_t * stride_h, (K, V), (V, 1),
-                                 (0, i_v * BV), (64, BV), (1, 0))
+        p_h1 = tl.make_block_ptr(
+            h + i_t * stride_h, (K, V), (V, 1), (0, i_v * BV), (64, BV), (1, 0)
+        )
         tl.store(p_h1, b_h1.to(p_h1.dtype.element_ty), boundary_check=(0, 1))
         if K > 64:
-            p_h2 = tl.make_block_ptr(h + i_t * stride_h, (K, V), (V, 1),
-                                     (64, i_v * BV), (64, BV), (1, 0))
-            tl.store(p_h2,
-                     b_h2.to(p_h2.dtype.element_ty),
-                     boundary_check=(0, 1))
+            p_h2 = tl.make_block_ptr(
+                h + i_t * stride_h, (K, V), (V, 1), (64, i_v * BV), (64, BV), (1, 0)
+            )
+            tl.store(p_h2, b_h2.to(p_h2.dtype.element_ty), boundary_check=(0, 1))
         if K > 128:
-            p_h3 = tl.make_block_ptr(h + i_t * stride_h, (K, V), (V, 1),
-                                     (128, i_v * BV), (64, BV), (1, 0))
-            tl.store(p_h3,
-                     b_h3.to(p_h3.dtype.element_ty),
-                     boundary_check=(0, 1))
+            p_h3 = tl.make_block_ptr(
+                h + i_t * stride_h, (K, V), (V, 1), (128, i_v * BV), (64, BV), (1, 0)
+            )
+            tl.store(p_h3, b_h3.to(p_h3.dtype.element_ty), boundary_check=(0, 1))
         if K > 192:
-            p_h4 = tl.make_block_ptr(h + i_t * stride_h, (K, V), (V, 1),
-                                     (192, i_v * BV), (64, BV), (1, 0))
-            tl.store(p_h4,
-                     b_h4.to(p_h4.dtype.element_ty),
-                     boundary_check=(0, 1))
+            p_h4 = tl.make_block_ptr(
+                h + i_t * stride_h, (K, V), (V, 1), (192, i_v * BV), (64, BV), (1, 0)
+            )
+            tl.store(p_h4, b_h4.to(p_h4.dtype.element_ty), boundary_check=(0, 1))
 
-        p_v = tl.make_block_ptr(v, (T, V), (stride_v, 1), (i_t * BT, i_v * BV),
-                                (BT, BV), (1, 0))
-        p_v_new = tl.make_block_ptr(v_new, (T, V), (stride_v, 1),
-                                    (i_t * BT, i_v * BV), (BT, BV),
-                                    (1, 0)) if SAVE_NEW_VALUE else None
+        p_v = tl.make_block_ptr(
+            v, (T, V), (stride_v, 1), (i_t * BT, i_v * BV), (BT, BV), (1, 0)
+        )
+        p_v_new = (
+            tl.make_block_ptr(
+                v_new, (T, V), (stride_v, 1), (i_t * BT, i_v * BV), (BT, BV), (1, 0)
+            )
+            if SAVE_NEW_VALUE
+            else None
+        )
         b_v_new = tl.zeros([BT, BV], dtype=tl.float32)
-        p_w = tl.make_block_ptr(w, (T, K), (stride_w, 1), (i_t * BT, 0),
-                                (BT, 64), (1, 0))
+        p_w = tl.make_block_ptr(
+            w, (T, K), (stride_w, 1), (i_t * BT, 0), (BT, 64), (1, 0)
+        )
         b_w = tl.load(p_w, boundary_check=(0, 1))
         b_v_new += tl.dot(b_w, b_h1.to(b_w.dtype))
         if K > 64:
-            p_w = tl.make_block_ptr(w, (T, K), (stride_w, 1), (i_t * BT, 64),
-                                    (BT, 64), (1, 0))
+            p_w = tl.make_block_ptr(
+                w, (T, K), (stride_w, 1), (i_t * BT, 64), (BT, 64), (1, 0)
+            )
             b_w = tl.load(p_w, boundary_check=(0, 1))
             b_v_new += tl.dot(b_w, b_h2.to(b_w.dtype))
         if K > 128:
-            p_w = tl.make_block_ptr(w, (T, K), (stride_w, 1), (i_t * BT, 128),
-                                    (BT, 64), (1, 0))
+            p_w = tl.make_block_ptr(
+                w, (T, K), (stride_w, 1), (i_t * BT, 128), (BT, 64), (1, 0)
+            )
             b_w = tl.load(p_w, boundary_check=(0, 1))
             b_v_new += tl.dot(b_w, b_h3.to(b_w.dtype))
         if K > 192:
-            p_w = tl.make_block_ptr(w, (T, K), (stride_w, 1), (i_t * BT, 192),
-                                    (BT, 64), (1, 0))
+            p_w = tl.make_block_ptr(
+                w, (T, K), (stride_w, 1), (i_t * BT, 192), (BT, 64), (1, 0)
+            )
             b_w = tl.load(p_w, boundary_check=(0, 1))
             b_v_new += tl.dot(b_w, b_h4.to(b_w.dtype))
         b_v_new = -b_v_new + tl.load(p_v, boundary_check=(0, 1))
 
         if SAVE_NEW_VALUE:
-            p_v_new = tl.make_block_ptr(v_new, (T, V), (stride_v, 1),
-                                        (i_t * BT, i_v * BV), (BT, BV), (1, 0))
-            tl.store(p_v_new,
-                     b_v_new.to(p_v_new.dtype.element_ty),
-                     boundary_check=(0, 1))
+            p_v_new = tl.make_block_ptr(
+                v_new, (T, V), (stride_v, 1), (i_t * BT, i_v * BV), (BT, BV), (1, 0)
+            )
+            tl.store(
+                p_v_new, b_v_new.to(p_v_new.dtype.element_ty), boundary_check=(0, 1)
+            )
 
         if USE_G:
             m_t = (i_t * BT + tl.arange(0, BT)) < T
             last_idx = min((i_t + 1) * BT, T) - 1
             b_g_last = tl.load(g + bos * H + last_idx * H + i_h)
-            p_g = tl.make_block_ptr(g + bos * H + i_h, (T, ), (H, ),
-                                    (i_t * BT, ), (BT, ), (0, ))
-            b_g = tl.load(p_g, boundary_check=(0, ))
+            p_g = tl.make_block_ptr(
+                g + bos * H + i_h, (T,), (H,), (i_t * BT,), (BT,), (0,)
+            )
+            b_g = tl.load(p_g, boundary_check=(0,))
             b_v_new = b_v_new * tl.where(m_t, exp(b_g_last - b_g), 0)[:, None]
             b_g_last = exp(b_g_last)
             b_h1 = b_h1 * b_g_last
@@ -191,49 +208,49 @@ def chunk_gated_delta_rule_fwd_kernel_h_blockdim64(
             if K > 192:
                 b_h4 = b_h4 * b_g_last
         b_v_new = b_v_new.to(k.dtype.element_ty)
-        p_k = tl.make_block_ptr(k, (K, T), (1, stride_k), (0, i_t * BT),
-                                (64, BT), (0, 1))
+        p_k = tl.make_block_ptr(
+            k, (K, T), (1, stride_k), (0, i_t * BT), (64, BT), (0, 1)
+        )
         b_k = tl.load(p_k, boundary_check=(0, 1))
         b_h1 += tl.dot(b_k, b_v_new)
         if K > 64:
-            p_k = tl.make_block_ptr(k, (K, T), (1, stride_k), (64, i_t * BT),
-                                    (64, BT), (0, 1))
+            p_k = tl.make_block_ptr(
+                k, (K, T), (1, stride_k), (64, i_t * BT), (64, BT), (0, 1)
+            )
             b_k = tl.load(p_k, boundary_check=(0, 1))
             b_h2 += tl.dot(b_k, b_v_new)
         if K > 128:
-            p_k = tl.make_block_ptr(k, (K, T), (1, stride_k), (128, i_t * BT),
-                                    (64, BT), (0, 1))
+            p_k = tl.make_block_ptr(
+                k, (K, T), (1, stride_k), (128, i_t * BT), (64, BT), (0, 1)
+            )
             b_k = tl.load(p_k, boundary_check=(0, 1))
             b_h3 += tl.dot(b_k, b_v_new)
         if K > 192:
-            p_k = tl.make_block_ptr(k, (K, T), (1, stride_k), (192, i_t * BT),
-                                    (64, BT), (0, 1))
+            p_k = tl.make_block_ptr(
+                k, (K, T), (1, stride_k), (192, i_t * BT), (64, BT), (0, 1)
+            )
             b_k = tl.load(p_k, boundary_check=(0, 1))
             b_h4 += tl.dot(b_k, b_v_new)
 
     # epilogue
     if STORE_FINAL_STATE:
-        p_ht = tl.make_block_ptr(ht, (K, V), (V, 1), (0, i_v * BV), (64, BV),
-                                 (1, 0))
+        p_ht = tl.make_block_ptr(ht, (K, V), (V, 1), (0, i_v * BV), (64, BV), (1, 0))
         tl.store(p_ht, b_h1.to(p_ht.dtype.element_ty), boundary_check=(0, 1))
         if K > 64:
-            p_ht = tl.make_block_ptr(ht, (K, V), (V, 1), (64, i_v * BV),
-                                     (64, BV), (1, 0))
-            tl.store(p_ht,
-                     b_h2.to(p_ht.dtype.element_ty),
-                     boundary_check=(0, 1))
+            p_ht = tl.make_block_ptr(
+                ht, (K, V), (V, 1), (64, i_v * BV), (64, BV), (1, 0)
+            )
+            tl.store(p_ht, b_h2.to(p_ht.dtype.element_ty), boundary_check=(0, 1))
         if K > 128:
-            p_ht = tl.make_block_ptr(ht, (K, V), (V, 1), (128, i_v * BV),
-                                     (64, BV), (1, 0))
-            tl.store(p_ht,
-                     b_h3.to(p_ht.dtype.element_ty),
-                     boundary_check=(0, 1))
+            p_ht = tl.make_block_ptr(
+                ht, (K, V), (V, 1), (128, i_v * BV), (64, BV), (1, 0)
+            )
+            tl.store(p_ht, b_h3.to(p_ht.dtype.element_ty), boundary_check=(0, 1))
         if K > 192:
-            p_ht = tl.make_block_ptr(ht, (K, V), (V, 1), (192, i_v * BV),
-                                     (64, BV), (1, 0))
-            tl.store(p_ht,
-                     b_h4.to(p_ht.dtype.element_ty),
-                     boundary_check=(0, 1))
+            p_ht = tl.make_block_ptr(
+                ht, (K, V), (V, 1), (192, i_v * BV), (64, BV), (1, 0)
+            )
+            tl.store(p_ht, b_h4.to(p_ht.dtype.element_ty), boundary_check=(0, 1))
 
 
 def chunk_gated_delta_rule_fwd_h(
@@ -251,24 +268,31 @@ def chunk_gated_delta_rule_fwd_h(
     H = u.shape[-2]
     BT = chunk_size
 
-    chunk_indices = prepare_chunk_indices(
-        cu_seqlens, chunk_size) if cu_seqlens is not None else None
+    chunk_indices = (
+        prepare_chunk_indices(cu_seqlens, chunk_size)
+        if cu_seqlens is not None
+        else None
+    )
     # N: the actual number of sequences in the batch with either equal or variable lengths
     if cu_seqlens is None:
         N, NT, chunk_offsets = B, triton.cdiv(T, BT), None
     else:
-        N, NT, chunk_offsets = len(cu_seqlens) - 1, len(
-            chunk_indices), prepare_chunk_offsets(cu_seqlens, BT)
+        N, NT, chunk_offsets = (
+            len(cu_seqlens) - 1,
+            len(chunk_indices),
+            prepare_chunk_offsets(cu_seqlens, BT),
+        )
     assert K <= 256, "current kernel does not support head dimension larger than 256."
 
     h = k.new_empty(B, NT, H, K, V)
-    final_state = k.new_empty(
-        N, H, K, V, dtype=torch.float32) if output_final_state else None
+    final_state = (
+        k.new_empty(N, H, K, V, dtype=torch.float32) if output_final_state else None
+    )
 
     v_new = torch.empty_like(u) if save_new_value else None
 
     def grid(meta):
-        return (triton.cdiv(V, meta['BV']), N * H)
+        return (triton.cdiv(V, meta["BV"]), N * H)
 
     chunk_gated_delta_rule_fwd_kernel_h_blockdim64[grid](
         k=k,
@@ -286,5 +310,6 @@ def grid(meta):
         Hg=Hg,
         K=K,
         V=V,
-        BT=BT)
+        BT=BT,
+    )
     return h, v_new, final_state
diff --git a/vllm/model_executor/layers/fla/ops/chunk_o.py b/vllm/model_executor/layers/fla/ops/chunk_o.py
index 332751a1860a..3b082d494834 100644
--- a/vllm/model_executor/layers/fla/ops/chunk_o.py
+++ b/vllm/model_executor/layers/fla/ops/chunk_o.py
@@ -23,24 +23,23 @@
 NUM_WARPS = [2, 4] if is_nvidia_hopper else [2, 4, 8]
 
 
-@triton.heuristics({
-    'USE_G': lambda args: args['g'] is not None,
-    'IS_VARLEN': lambda args: args['cu_seqlens'] is not None
-})
+@triton.heuristics(
+    {
+        "USE_G": lambda args: args["g"] is not None,
+        "IS_VARLEN": lambda args: args["cu_seqlens"] is not None,
+    }
+)
 @triton.autotune(
     configs=[
-        triton.Config({
-            'BK': BK,
-            'BV': BV
-        },
-                      num_warps=num_warps,
-                      num_stages=num_stages) for BK in BKV_LIST
-        for BV in BKV_LIST for num_warps in NUM_WARPS
+        triton.Config({"BK": BK, "BV": BV}, num_warps=num_warps, num_stages=num_stages)
+        for BK in BKV_LIST
+        for BV in BKV_LIST
+        for num_warps in NUM_WARPS
         for num_stages in [2, 3, 4]
     ],
-    key=['H', 'K', 'V', 'BT'],
+    key=["H", "K", "V", "BT"],
 )
-@triton.jit(do_not_specialize=['T'])
+@triton.jit(do_not_specialize=["T"])
 def chunk_fwd_kernel_o(
     q,
     k,
@@ -67,10 +66,14 @@ def chunk_fwd_kernel_o(
 
     if IS_VARLEN:
         i_tg = i_t
-        i_n, i_t = tl.load(chunk_indices + i_t * 2).to(
-            tl.int32), tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32)
-        bos, eos = tl.load(cu_seqlens + i_n).to(
-            tl.int32), tl.load(cu_seqlens + i_n + 1).to(tl.int32)
+        i_n, i_t = (
+            tl.load(chunk_indices + i_t * 2).to(tl.int32),
+            tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32),
+        )
+        bos, eos = (
+            tl.load(cu_seqlens + i_n).to(tl.int32),
+            tl.load(cu_seqlens + i_n + 1).to(tl.int32),
+        )
         T = eos - bos
         NT = tl.cdiv(T, BT)
     else:
@@ -89,12 +92,15 @@ def chunk_fwd_kernel_o(
     b_A = tl.zeros([BT, BT], dtype=tl.float32)
 
     for i_k in range(tl.cdiv(K, BK)):
-        p_q = tl.make_block_ptr(q, (T, K), (Hg * K, 1), (i_t * BT, i_k * BK),
-                                (BT, BK), (1, 0))
-        p_k = tl.make_block_ptr(k, (K, T), (1, Hg * K), (i_k * BK, i_t * BT),
-                                (BK, BT), (0, 1))
-        p_h = tl.make_block_ptr(h, (K, V), (V, 1), (i_k * BK, i_v * BV),
-                                (BK, BV), (1, 0))
+        p_q = tl.make_block_ptr(
+            q, (T, K), (Hg * K, 1), (i_t * BT, i_k * BK), (BT, BK), (1, 0)
+        )
+        p_k = tl.make_block_ptr(
+            k, (K, T), (1, Hg * K), (i_k * BK, i_t * BT), (BK, BT), (0, 1)
+        )
+        p_h = tl.make_block_ptr(
+            h, (K, V), (V, 1), (i_k * BK, i_v * BV), (BK, BV), (1, 0)
+        )
         # [BT, BK]
         b_q = tl.load(p_q, boundary_check=(0, 1))
         # [BK, BT]
@@ -109,8 +115,8 @@ def chunk_fwd_kernel_o(
 
     if USE_G:
         g += bos * H + i_h
-        p_g = tl.make_block_ptr(g, (T, ), (H, ), (i_t * BT, ), (BT, ), (0, ))
-        b_g = tl.load(p_g, boundary_check=(0, ))
+        p_g = tl.make_block_ptr(g, (T,), (H,), (i_t * BT,), (BT,), (0,))
+        b_g = tl.load(p_g, boundary_check=(0,))
         b_o = b_o * exp(b_g)[:, None]
         b_A = b_A * exp(b_g[:, None] - b_g[None, :])
 
@@ -119,10 +125,12 @@ def chunk_fwd_kernel_o(
     m_A = (o_t[:, None] >= o_t[None, :]) & (m_t[:, None] & m_t)
     b_A = tl.where(m_A, b_A, 0)
 
-    p_v = tl.make_block_ptr(v, (T, V), (H * V, 1), (i_t * BT, i_v * BV),
-                            (BT, BV), (1, 0))
-    p_o = tl.make_block_ptr(o, (T, V), (H * V, 1), (i_t * BT, i_v * BV),
-                            (BT, BV), (1, 0))
+    p_v = tl.make_block_ptr(
+        v, (T, V), (H * V, 1), (i_t * BT, i_v * BV), (BT, BV), (1, 0)
+    )
+    p_o = tl.make_block_ptr(
+        o, (T, V), (H * V, 1), (i_t * BT, i_v * BV), (BT, BV), (1, 0)
+    )
     b_v = tl.load(p_v, boundary_check=(0, 1))
 
     # to fix mma -> mma layout conversion
@@ -132,30 +140,32 @@ def chunk_fwd_kernel_o(
 
 
 def chunk_fwd_o(
-        q: torch.Tensor,
-        k: torch.Tensor,
-        v: torch.Tensor,
-        h: torch.Tensor,
-        g: Optional[torch.Tensor] = None,  # cumsum of log decay
-        scale: Optional[float] = None,
-        cu_seqlens: Optional[torch.LongTensor] = None,
-        chunk_size: int = 64) -> torch.Tensor:
+    q: torch.Tensor,
+    k: torch.Tensor,
+    v: torch.Tensor,
+    h: torch.Tensor,
+    g: Optional[torch.Tensor] = None,  # cumsum of log decay
+    scale: Optional[float] = None,
+    cu_seqlens: Optional[torch.LongTensor] = None,
+    chunk_size: int = 64,
+) -> torch.Tensor:
     B, T, Hg, K, V = *q.shape, v.shape[-1]
     H = v.shape[-2]
     if FLA_GDN_FIX_BT:
         BT = 64
     else:
         BT = min(chunk_size, max(16, triton.next_power_of_2(T)))
-    chunk_indices = prepare_chunk_indices(
-        cu_seqlens, BT) if cu_seqlens is not None else None
+    chunk_indices = (
+        prepare_chunk_indices(cu_seqlens, BT) if cu_seqlens is not None else None
+    )
     NT = triton.cdiv(T, BT) if cu_seqlens is None else len(chunk_indices)
     if scale is None:
-        scale = k.shape[-1]**-0.5
+        scale = k.shape[-1] ** -0.5
 
     o = torch.empty_like(v)
 
     def grid(meta):
-        return (triton.cdiv(V, meta['BV']), NT, B * H)
+        return (triton.cdiv(V, meta["BV"]), NT, B * H)
 
     chunk_fwd_kernel_o[grid](
         q,
diff --git a/vllm/model_executor/layers/fla/ops/chunk_scaled_dot_kkt.py b/vllm/model_executor/layers/fla/ops/chunk_scaled_dot_kkt.py
index d1adc6978f24..0da3f243901f 100644
--- a/vllm/model_executor/layers/fla/ops/chunk_scaled_dot_kkt.py
+++ b/vllm/model_executor/layers/fla/ops/chunk_scaled_dot_kkt.py
@@ -17,19 +17,22 @@
 from .op import exp
 
 
-@triton.heuristics({
-    'IS_VARLEN': lambda args: args['cu_seqlens'] is not None,
-    'USE_G': lambda args: args['g_cumsum'] is not None
-})
+@triton.heuristics(
+    {
+        "IS_VARLEN": lambda args: args["cu_seqlens"] is not None,
+        "USE_G": lambda args: args["g_cumsum"] is not None,
+    }
+)
 @triton.autotune(
     configs=[
-        triton.Config({'BK': BK}, num_warps=num_warps, num_stages=num_stages)
-        for BK in [32, 64, 128] for num_warps in [2, 4, 8]
+        triton.Config({"BK": BK}, num_warps=num_warps, num_stages=num_stages)
+        for BK in [32, 64, 128]
+        for num_warps in [2, 4, 8]
         for num_stages in [2, 3, 4]
     ],
-    key=['H', 'K', 'BT', 'IS_VARLEN'],
+    key=["H", "K", "BT", "IS_VARLEN"],
 )
-@triton.jit(do_not_specialize=['T'])
+@triton.jit(do_not_specialize=["T"])
 def chunk_scaled_dot_kkt_fwd_kernel(
     k,
     beta,
@@ -49,50 +52,63 @@ def chunk_scaled_dot_kkt_fwd_kernel(
     i_t, i_bh = tl.program_id(0), tl.program_id(1)
     i_b, i_h = i_bh // H, i_bh % H
     if IS_VARLEN:
-        i_n, i_t = tl.load(chunk_indices + i_t * 2).to(
-            tl.int32), tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32)
-        bos, eos = tl.load(cu_seqlens + i_n).to(
-            tl.int32), tl.load(cu_seqlens + i_n + 1).to(tl.int32)
+        i_n, i_t = (
+            tl.load(chunk_indices + i_t * 2).to(tl.int32),
+            tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32),
+        )
+        bos, eos = (
+            tl.load(cu_seqlens + i_n).to(tl.int32),
+            tl.load(cu_seqlens + i_n + 1).to(tl.int32),
+        )
         T = eos - bos
     else:
         bos, eos = i_b * T, i_b * T + T
     o_t = i_t * BT + tl.arange(0, BT)
     m_t = o_t < T
 
-    p_beta = tl.make_block_ptr(beta + bos * H + i_h, (T, ), (H, ),
-                               (i_t * BT, ), (BT, ), (0, ))
-    b_beta = tl.load(p_beta, boundary_check=(0, ))
+    p_beta = tl.make_block_ptr(
+        beta + bos * H + i_h, (T,), (H,), (i_t * BT,), (BT,), (0,)
+    )
+    b_beta = tl.load(p_beta, boundary_check=(0,))
 
     b_A = tl.zeros([BT, BT], dtype=tl.float32)
     for i_k in range(tl.cdiv(K, BK)):
-        p_k = tl.make_block_ptr(k + (bos * Hg + i_h // (H // Hg)) * K, (T, K),
-                                (Hg * K, 1), (i_t * BT, i_k * BK), (BT, BK),
-                                (1, 0))
+        p_k = tl.make_block_ptr(
+            k + (bos * Hg + i_h // (H // Hg)) * K,
+            (T, K),
+            (Hg * K, 1),
+            (i_t * BT, i_k * BK),
+            (BT, BK),
+            (1, 0),
+        )
         b_k = tl.load(p_k, boundary_check=(0, 1))
         b_kb = b_k * b_beta[:, None]
         b_A += tl.dot(b_kb.to(b_k.dtype), tl.trans(b_k))
 
     if USE_G:
-        p_g = tl.make_block_ptr(g_cumsum + bos * H + i_h, (T, ), (H, ),
-                                (i_t * BT, ), (BT, ), (0, ))
-        b_g = tl.load(p_g, boundary_check=(0, ))
+        p_g = tl.make_block_ptr(
+            g_cumsum + bos * H + i_h, (T,), (H,), (i_t * BT,), (BT,), (0,)
+        )
+        b_g = tl.load(p_g, boundary_check=(0,))
         b_g_diff = b_g[:, None] - b_g[None, :]
         b_A = b_A * exp(b_g_diff)
 
     m_A = (o_t[:, None] > o_t[None, :]) & (m_t[:, None] & m_t)
     b_A = tl.where(m_A, b_A, 0)
-    p_A = tl.make_block_ptr(A + (bos * H + i_h) * BT, (T, BT), (BT * H, 1),
-                            (i_t * BT, 0), (BT, BT), (1, 0))
+    p_A = tl.make_block_ptr(
+        A + (bos * H + i_h) * BT, (T, BT), (BT * H, 1), (i_t * BT, 0), (BT, BT), (1, 0)
+    )
     tl.store(p_A, b_A.to(p_A.dtype.element_ty), boundary_check=(0, 1))
 
 
 def chunk_scaled_dot_kkt_fwd(
-        k: torch.Tensor,
-        beta: torch.Tensor,
-        g_cumsum: Optional[torch.Tensor] = None,
-        cu_seqlens: Optional[torch.LongTensor] = None,
-        chunk_size: int = 64,
-        output_dtype: torch.dtype = torch.float32) -> torch.Tensor:
+    k: torch.Tensor,
+    beta: torch.Tensor,
+    g_cumsum: Optional[torch.Tensor] = None,
+    cu_seqlens: Optional[torch.LongTensor] = None,
+    chunk_size: int = 64,
+    output_dtype: torch.dtype = torch.float32,
+) -> torch.Tensor:
     r"""
     Compute beta * K * K^T.
 
@@ -120,8 +136,9 @@ def chunk_scaled_dot_kkt_fwd(
 
     H = beta.shape[-1]
     BT = chunk_size
-    chunk_indices = prepare_chunk_indices(
-        cu_seqlens, BT) if cu_seqlens is not None else None
+    chunk_indices = (
+        prepare_chunk_indices(cu_seqlens, BT) if cu_seqlens is not None else None
+    )
     NT = triton.cdiv(T, BT) if cu_seqlens is None else len(chunk_indices)
     A = torch.empty(B, T, H, BT, device=k.device, dtype=output_dtype)
     chunk_scaled_dot_kkt_fwd_kernel[(NT, B * H)](
diff --git a/vllm/model_executor/layers/fla/ops/cumsum.py b/vllm/model_executor/layers/fla/ops/cumsum.py
index 370a45fe1635..cfa2b3b48e70 100644
--- a/vllm/model_executor/layers/fla/ops/cumsum.py
+++ b/vllm/model_executor/layers/fla/ops/cumsum.py
@@ -20,12 +20,12 @@
 BS_LIST = [32, 64] if check_shared_mem() else [16, 32]
 
 
-@triton.heuristics({'IS_VARLEN': lambda args: args['cu_seqlens'] is not None})
-@triton.autotune(configs=[
-    triton.Config({}, num_warps=num_warps) for num_warps in [1, 2, 4, 8]
-],
-                 key=['B', 'H', 'BT', 'IS_VARLEN', 'REVERSE'])
-@triton.jit(do_not_specialize=['T'])
+@triton.heuristics({"IS_VARLEN": lambda args: args["cu_seqlens"] is not None})
+@triton.autotune(
+    configs=[triton.Config({}, num_warps=num_warps) for num_warps in [1, 2, 4, 8]],
+    key=["B", "H", "BT", "IS_VARLEN", "REVERSE"],
+)
+@triton.jit(do_not_specialize=["T"])
 def chunk_local_cumsum_scalar_kernel(
     s,
     o,
@@ -42,40 +42,47 @@ def chunk_local_cumsum_scalar_kernel(
     i_t, i_bh = tl.program_id(0), tl.program_id(1)
     i_b, i_h = i_bh // H, i_bh % H
     if IS_VARLEN:
-        i_n, i_t = tl.load(chunk_indices + i_t * 2).to(
-            tl.int32), tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32)
-        bos, eos = tl.load(cu_seqlens + i_n).to(
-            tl.int32), tl.load(cu_seqlens + i_n + 1).to(tl.int32)
+        i_n, i_t = (
+            tl.load(chunk_indices + i_t * 2).to(tl.int32),
+            tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32),
+        )
+        bos, eos = (
+            tl.load(cu_seqlens + i_n).to(tl.int32),
+            tl.load(cu_seqlens + i_n + 1).to(tl.int32),
+        )
         T = eos - bos
     else:
         bos, eos = i_b * T, i_b * T + T
 
     if HEAD_FIRST:
-        p_s = tl.make_block_ptr(s + bos * H + i_h * T, (T, ), (1, ),
-                                (i_t * BT, ), (BT, ), (0, ))
-        p_o = tl.make_block_ptr(o + bos * H + i_h * T, (T, ), (1, ),
-                                (i_t * BT, ), (BT, ), (0, ))
+        p_s = tl.make_block_ptr(
+            s + bos * H + i_h * T, (T,), (1,), (i_t * BT,), (BT,), (0,)
+        )
+        p_o = tl.make_block_ptr(
+            o + bos * H + i_h * T, (T,), (1,), (i_t * BT,), (BT,), (0,)
+        )
     else:
-        p_s = tl.make_block_ptr(s + bos * H + i_h, (T, ), (H, ), (i_t * BT, ),
-                                (BT, ), (0, ))
-        p_o = tl.make_block_ptr(o + bos * H + i_h, (T, ), (H, ), (i_t * BT, ),
-                                (BT, ), (0, ))
+        p_s = tl.make_block_ptr(s + bos * H + i_h, (T,), (H,), (i_t * BT,), (BT,), (0,))
+        p_o = tl.make_block_ptr(o + bos * H + i_h, (T,), (H,), (i_t * BT,), (BT,), (0,))
     # [BT]
-    b_s = tl.load(p_s, boundary_check=(0, )).to(tl.float32)
+    b_s = tl.load(p_s, boundary_check=(0,)).to(tl.float32)
     b_o = tl.cumsum(b_s, axis=0)
     if REVERSE:
         b_z = tl.sum(b_s, axis=0)
         b_o = -b_o + b_z[None] + b_s
-    tl.store(p_o, b_o.to(p_o.dtype.element_ty), boundary_check=(0, ))
+    tl.store(p_o, b_o.to(p_o.dtype.element_ty), boundary_check=(0,))
 
 
-@triton.heuristics({'IS_VARLEN': lambda args: args['cu_seqlens'] is not None})
-@triton.autotune(configs=[
-    triton.Config({'BS': BS}, num_warps=num_warps) for BS in BS_LIST
-    for num_warps in [2, 4, 8]
-],
-                 key=['B', 'H', 'S', 'BT', 'IS_VARLEN', 'REVERSE'])
-@triton.jit(do_not_specialize=['T'])
+@triton.heuristics({"IS_VARLEN": lambda args: args["cu_seqlens"] is not None})
+@triton.autotune(
+    configs=[
+        triton.Config({"BS": BS}, num_warps=num_warps)
+        for BS in BS_LIST
+        for num_warps in [2, 4, 8]
+    ],
+    key=["B", "H", "S", "BT", "IS_VARLEN", "REVERSE"],
+)
+@triton.jit(do_not_specialize=["T"])
 def chunk_local_cumsum_vector_kernel(
     s,
     o,
@@ -94,30 +101,58 @@ def chunk_local_cumsum_vector_kernel(
     i_s, i_t, i_bh = tl.program_id(0), tl.program_id(1), tl.program_id(2)
     i_b, i_h = i_bh // H, i_bh % H
     if IS_VARLEN:
-        i_n, i_t = tl.load(chunk_indices + i_t * 2).to(
-            tl.int32), tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32)
-        bos, eos = tl.load(cu_seqlens + i_n).to(
-            tl.int32), tl.load(cu_seqlens + i_n + 1).to(tl.int32)
+        i_n, i_t = (
+            tl.load(chunk_indices + i_t * 2).to(tl.int32),
+            tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32),
+        )
+        bos, eos = (
+            tl.load(cu_seqlens + i_n).to(tl.int32),
+            tl.load(cu_seqlens + i_n + 1).to(tl.int32),
+        )
         T = eos - bos
     else:
         bos, eos = i_b * T, i_b * T + T
 
     o_i = tl.arange(0, BT)
     if REVERSE:
-        m_s = tl.where(o_i[:, None] <= o_i[None, :], 1., 0.)
+        m_s = tl.where(o_i[:, None] <= o_i[None, :], 1.0, 0.0)
     else:
-        m_s = tl.where(o_i[:, None] >= o_i[None, :], 1., 0.)
+        m_s = tl.where(o_i[:, None] >= o_i[None, :], 1.0, 0.0)
 
     if HEAD_FIRST:
-        p_s = tl.make_block_ptr(s + (bos * H + i_h * T) * S, (T, S), (S, 1),
-                                (i_t * BT, i_s * BS), (BT, BS), (1, 0))
-        p_o = tl.make_block_ptr(o + (bos * H + i_h * T) * S, (T, S), (S, 1),
-                                (i_t * BT, i_s * BS), (BT, BS), (1, 0))
+        p_s = tl.make_block_ptr(
+            s + (bos * H + i_h * T) * S,
+            (T, S),
+            (S, 1),
+            (i_t * BT, i_s * BS),
+            (BT, BS),
+            (1, 0),
+        )
+        p_o = tl.make_block_ptr(
+            o + (bos * H + i_h * T) * S,
+            (T, S),
+            (S, 1),
+            (i_t * BT, i_s * BS),
+            (BT, BS),
+            (1, 0),
+        )
     else:
-        p_s = tl.make_block_ptr(s + (bos * H + i_h) * S, (T, S), (H * S, 1),
-                                (i_t * BT, i_s * BS), (BT, BS), (1, 0))
-        p_o = tl.make_block_ptr(o + (bos * H + i_h) * S, (T, S), (H * S, 1),
-                                (i_t * BT, i_s * BS), (BT, BS), (1, 0))
+        p_s = tl.make_block_ptr(
+            s + (bos * H + i_h) * S,
+            (T, S),
+            (H * S, 1),
+            (i_t * BT, i_s * BS),
+            (BT, BS),
+            (1, 0),
+        )
+        p_o = tl.make_block_ptr(
+            o + (bos * H + i_h) * S,
+            (T, S),
+            (H * S, 1),
+            (i_t * BT, i_s * BS),
+            (BT, BS),
+            (1, 0),
+        )
     # [BT, BS]
     b_s = tl.load(p_s, boundary_check=(0, 1)).to(tl.float32)
     b_o = tl.dot(m_s, b_s, allow_tf32=False)
@@ -125,102 +160,122 @@ def chunk_local_cumsum_vector_kernel(
 
 
 def chunk_local_cumsum_scalar(
-        g: torch.Tensor,
-        chunk_size: int,
-        reverse: bool = False,
-        cu_seqlens: Optional[torch.Tensor] = None,
-        head_first: bool = False,
-        output_dtype: Optional[torch.dtype] = torch.float) -> torch.Tensor:
+    g: torch.Tensor,
+    chunk_size: int,
+    reverse: bool = False,
+    cu_seqlens: Optional[torch.Tensor] = None,
+    head_first: bool = False,
+    output_dtype: Optional[torch.dtype] = torch.float,
+) -> torch.Tensor:
     if head_first:
         B, H, T = g.shape
     else:
         B, T, H = g.shape
-    assert chunk_size == 2**(chunk_size.bit_length() -
-                             1), "chunk_size must be a power of 2"
+    assert chunk_size == 2 ** (chunk_size.bit_length() - 1), (
+        "chunk_size must be a power of 2"
+    )
     BT = chunk_size
-    chunk_indices = prepare_chunk_indices(
-        cu_seqlens, BT) if cu_seqlens is not None else None
+    chunk_indices = (
+        prepare_chunk_indices(cu_seqlens, BT) if cu_seqlens is not None else None
+    )
     NT = triton.cdiv(T, BT) if cu_seqlens is None else len(chunk_indices)
     g_org, g = g, torch.empty_like(g, dtype=output_dtype or g.dtype)
     grid = (NT, B * H)
-    chunk_local_cumsum_scalar_kernel[grid](g_org,
-                                           g,
-                                           cu_seqlens,
-                                           chunk_indices,
-                                           T=T,
-                                           B=B,
-                                           H=H,
-                                           BT=BT,
-                                           HEAD_FIRST=head_first,
-                                           REVERSE=reverse)
+    chunk_local_cumsum_scalar_kernel[grid](
+        g_org,
+        g,
+        cu_seqlens,
+        chunk_indices,
+        T=T,
+        B=B,
+        H=H,
+        BT=BT,
+        HEAD_FIRST=head_first,
+        REVERSE=reverse,
+    )
     return g
 
 
 def chunk_local_cumsum_vector(
-        g: torch.Tensor,
-        chunk_size: int,
-        reverse: bool = False,
-        cu_seqlens: Optional[torch.Tensor] = None,
-        head_first: bool = False,
-        output_dtype: Optional[torch.dtype] = torch.float) -> torch.Tensor:
+    g: torch.Tensor,
+    chunk_size: int,
+    reverse: bool = False,
+    cu_seqlens: Optional[torch.Tensor] = None,
+    head_first: bool = False,
+    output_dtype: Optional[torch.dtype] = torch.float,
+) -> torch.Tensor:
     if head_first:
         B, H, T, S = g.shape
     else:
         B, T, H, S = g.shape
     BT = chunk_size
-    chunk_indices = prepare_chunk_indices(
-        cu_seqlens, chunk_size) if cu_seqlens is not None else None
+    chunk_indices = (
+        prepare_chunk_indices(cu_seqlens, chunk_size)
+        if cu_seqlens is not None
+        else None
+    )
     NT = triton.cdiv(T, BT) if cu_seqlens is None else len(chunk_indices)
-    assert chunk_size == 2**(chunk_size.bit_length() -
-                             1), "chunk_size must be a power of 2"
+    assert chunk_size == 2 ** (chunk_size.bit_length() - 1), (
+        "chunk_size must be a power of 2"
+    )
 
     g_org, g = g, torch.empty_like(g, dtype=output_dtype or g.dtype)
 
     def grid(meta):
-        return (triton.cdiv(meta['S'], meta['BS']), NT, B * H)
+        return (triton.cdiv(meta["S"], meta["BS"]), NT, B * H)
 
     # keep cumulative normalizer in fp32
     # this kernel is equivalent to
     # g = g.view(B, H, NT, BT, -1).cumsum(-2).view(B, H, T, -1)
-    chunk_local_cumsum_vector_kernel[grid](g_org,
-                                           g,
-                                           cu_seqlens,
-                                           chunk_indices,
-                                           T=T,
-                                           B=B,
-                                           H=H,
-                                           S=S,
-                                           BT=BT,
-                                           HEAD_FIRST=head_first,
-                                           REVERSE=reverse)
+    chunk_local_cumsum_vector_kernel[grid](
+        g_org,
+        g,
+        cu_seqlens,
+        chunk_indices,
+        T=T,
+        B=B,
+        H=H,
+        S=S,
+        BT=BT,
+        HEAD_FIRST=head_first,
+        REVERSE=reverse,
+    )
     return g
 
 
 @input_guard
-def chunk_local_cumsum(g: torch.Tensor,
-                       chunk_size: int,
-                       reverse: bool = False,
-                       cu_seqlens: Optional[torch.Tensor] = None,
-                       head_first: bool = False,
-                       output_dtype: Optional[torch.dtype] = torch.float,
-                       **kwargs) -> torch.Tensor:
+def chunk_local_cumsum(
+    g: torch.Tensor,
+    chunk_size: int,
+    reverse: bool = False,
+    cu_seqlens: Optional[torch.Tensor] = None,
+    head_first: bool = False,
+    output_dtype: Optional[torch.dtype] = torch.float,
+    **kwargs,
+) -> torch.Tensor:
     if not head_first and g.shape[1] < g.shape[2]:
         warnings.warn(
             f"Input tensor shape suggests potential format mismatch: seq_len ({g.shape[1]}) < num_heads ({g.shape[2]}). "
             "This may indicate the inputs were passed in head-first format [B, H, T, ...] "
             "when head_first=False was specified. "
             "Please verify your input tensor format matches the expected shape [B, T, H, ...].",
-            stacklevel=2)
+            stacklevel=2,
+        )
     if cu_seqlens is not None:
-        assert g.shape[
-            0] == 1, "Only batch size 1 is supported when cu_seqlens are provided"
+        assert g.shape[0] == 1, (
+            "Only batch size 1 is supported when cu_seqlens are provided"
+        )
     if len(g.shape) == 3:
-        return chunk_local_cumsum_scalar(g, chunk_size, reverse, cu_seqlens,
-                                         head_first, output_dtype)
+        return chunk_local_cumsum_scalar(
+            g, chunk_size, reverse, cu_seqlens, head_first, output_dtype
+        )
     elif len(g.shape) == 4:
-        return chunk_local_cumsum_vector(g, chunk_size, reverse, cu_seqlens,
-                                         head_first, output_dtype)
+        return chunk_local_cumsum_vector(
+            g, chunk_size, reverse, cu_seqlens, head_first, output_dtype
+        )
     else:
-        raise ValueError(f"Unsupported input shape {g.shape}. "
-                         f"which should be (B, T, H, D) if `head_first=False` "
-                         f"or (B, H, T, D) otherwise")
+        raise ValueError(
+            f"Unsupported input shape {g.shape}. "
+            f"which should be (B, T, H, D) if `head_first=False` "
+            f"or (B, H, T, D) otherwise"
+        )
diff --git a/vllm/model_executor/layers/fla/ops/fused_recurrent.py b/vllm/model_executor/layers/fla/ops/fused_recurrent.py
index 98437340fd24..fa10bdb36caa 100644
--- a/vllm/model_executor/layers/fla/ops/fused_recurrent.py
+++ b/vllm/model_executor/layers/fla/ops/fused_recurrent.py
@@ -16,17 +16,15 @@
 from .op import exp
 
 
-@triton.heuristics({
-    'USE_INITIAL_STATE':
-    lambda args: args['h0'] is not None,
-    'IS_VARLEN':
-    lambda args: args['cu_seqlens'] is not None,
-    "IS_CONTINUOUS_BATCHING":
-    lambda args: args['ssm_state_indices'] is not None,
-    "IS_SPEC_DECODING":
-    lambda args: args['num_accepted_tokens'] is not None,
-})
-@triton.jit(do_not_specialize=['N', 'T'])
+@triton.heuristics(
+    {
+        "USE_INITIAL_STATE": lambda args: args["h0"] is not None,
+        "IS_VARLEN": lambda args: args["cu_seqlens"] is not None,
+        "IS_CONTINUOUS_BATCHING": lambda args: args["ssm_state_indices"] is not None,
+        "IS_SPEC_DECODING": lambda args: args["num_accepted_tokens"] is not None,
+    }
+)
+@triton.jit(do_not_specialize=["N", "T"])
 def fused_recurrent_gated_delta_rule_fwd_kernel(
     q,
     k,
@@ -55,8 +53,7 @@ def fused_recurrent_gated_delta_rule_fwd_kernel(
     stride_indices_tok: tl.constexpr,
     USE_INITIAL_STATE: tl.constexpr,  # whether to use initial state
     INPLACE_FINAL_STATE: tl.constexpr,  # whether to store final state inplace
-    IS_BETA_HEADWISE: tl.
-    constexpr,  # whether beta is headwise vector or scalar,
+    IS_BETA_HEADWISE: tl.constexpr,  # whether beta is headwise vector or scalar,
     USE_QK_L2NORM_IN_KERNEL: tl.constexpr,
     IS_VARLEN: tl.constexpr,
     IS_CONTINUOUS_BATCHING: tl.constexpr,
@@ -66,8 +63,10 @@ def fused_recurrent_gated_delta_rule_fwd_kernel(
     i_n, i_hv = i_nh // HV, i_nh % HV
     i_h = i_hv // (HV // H)
     if IS_VARLEN:
-        bos, eos = tl.load(cu_seqlens + i_n).to(
-            tl.int64), tl.load(cu_seqlens + i_n + 1).to(tl.int64)
+        bos, eos = (
+            tl.load(cu_seqlens + i_n).to(tl.int64),
+            tl.load(cu_seqlens + i_n + 1).to(tl.int64),
+        )
         all = T
         T = eos - bos
     else:
@@ -102,8 +101,13 @@ def fused_recurrent_gated_delta_rule_fwd_kernel(
                 i_t = tl.load(num_accepted_tokens + i_n).to(tl.int64) - 1
             else:
                 i_t = 0
-            p_h0 = h0 + tl.load(ssm_state_indices + i_n * stride_indices_seq +
-                                i_t).to(tl.int64) * stride_init_state_token
+            p_h0 = (
+                h0
+                + tl.load(ssm_state_indices + i_n * stride_indices_seq + i_t).to(
+                    tl.int64
+                )
+                * stride_init_state_token
+            )
         else:
             p_h0 = h0 + bos * HV * K * V
         p_h0 = p_h0 + i_hv * K * V + o_k[:, None] * V + o_v[None, :]
@@ -136,8 +140,13 @@ def fused_recurrent_gated_delta_rule_fwd_kernel(
 
         # keep the states for multi-query tokens
         if INPLACE_FINAL_STATE:
-            p_ht = ht + tl.load(ssm_state_indices + i_n * stride_indices_seq +
-                                i_t).to(tl.int64) * stride_final_state_token
+            p_ht = (
+                ht
+                + tl.load(ssm_state_indices + i_n * stride_indices_seq + i_t).to(
+                    tl.int64
+                )
+                * stride_final_state_token
+            )
         else:
             p_ht = ht + (bos + i_t) * stride_final_state_token
         p_ht = p_ht + i_hv * K * V + o_k[:, None] * V + o_v[None, :]
@@ -228,21 +237,22 @@ def fused_recurrent_gated_delta_rule_fwd(
 
 
 class FusedRecurrentFunction(torch.autograd.Function):
-
     @staticmethod
-    def forward(ctx,
-                q: torch.Tensor,
-                k: torch.Tensor,
-                v: torch.Tensor,
-                g: torch.Tensor,
-                beta: torch.Tensor,
-                scale: float,
-                initial_state: torch.Tensor,
-                inplace_final_state: bool = True,
-                cu_seqlens: Optional[torch.LongTensor] = None,
-                ssm_state_indices: Optional[torch.Tensor] = None,
-                num_accepted_tokens: Optional[torch.Tensor] = None,
-                use_qk_l2norm_in_kernel: bool = False):
+    def forward(
+        ctx,
+        q: torch.Tensor,
+        k: torch.Tensor,
+        v: torch.Tensor,
+        g: torch.Tensor,
+        beta: torch.Tensor,
+        scale: float,
+        initial_state: torch.Tensor,
+        inplace_final_state: bool = True,
+        cu_seqlens: Optional[torch.LongTensor] = None,
+        ssm_state_indices: Optional[torch.Tensor] = None,
+        num_accepted_tokens: Optional[torch.Tensor] = None,
+        use_qk_l2norm_in_kernel: bool = False,
+    ):
         o, final_state = fused_recurrent_gated_delta_rule_fwd(
             q=q.contiguous(),
             k=k.contiguous(),
@@ -342,9 +352,10 @@ def fused_recurrent_gated_delta_rule(
     if cu_seqlens is not None and q.shape[0] != 1:
         raise ValueError(
             f"The batch size is expected to be 1 rather than {q.shape[0]} when using `cu_seqlens`."
-            f"Please flatten variable-length inputs before processing.")
+            f"Please flatten variable-length inputs before processing."
+        )
     if scale is None:
-        scale = k.shape[-1]**-0.5
+        scale = k.shape[-1] ** -0.5
     else:
         assert scale > 0, "scale must be positive"
     if beta is None:
diff --git a/vllm/model_executor/layers/fla/ops/index.py b/vllm/model_executor/layers/fla/ops/index.py
index 9eca32bc31a0..f023e1378bb8 100644
--- a/vllm/model_executor/layers/fla/ops/index.py
+++ b/vllm/model_executor/layers/fla/ops/index.py
@@ -20,20 +20,22 @@ def prepare_lens(cu_seqlens: torch.LongTensor) -> torch.LongTensor:
 
 
 @tensor_cache
-def prepare_chunk_indices(cu_seqlens: torch.LongTensor,
-                          chunk_size: int) -> torch.LongTensor:
-    indices = torch.cat([
-        torch.arange(n)
-        for n in triton.cdiv(prepare_lens(cu_seqlens), chunk_size).tolist()
-    ])
-    return torch.stack([indices.eq(0).cumsum(0) - 1, indices],
-                       1).to(cu_seqlens)
+def prepare_chunk_indices(
+    cu_seqlens: torch.LongTensor, chunk_size: int
+) -> torch.LongTensor:
+    indices = torch.cat(
+        [
+            torch.arange(n)
+            for n in triton.cdiv(prepare_lens(cu_seqlens), chunk_size).tolist()
+        ]
+    )
+    return torch.stack([indices.eq(0).cumsum(0) - 1, indices], 1).to(cu_seqlens)
 
 
 @tensor_cache
-def prepare_chunk_offsets(cu_seqlens: torch.LongTensor,
-                          chunk_size: int) -> torch.LongTensor:
-    return torch.cat([
-        cu_seqlens.new_tensor([0]),
-        triton.cdiv(prepare_lens(cu_seqlens), chunk_size)
-    ]).cumsum(-1)
+def prepare_chunk_offsets(
+    cu_seqlens: torch.LongTensor, chunk_size: int
+) -> torch.LongTensor:
+    return torch.cat(
+        [cu_seqlens.new_tensor([0]), triton.cdiv(prepare_lens(cu_seqlens), chunk_size)]
+    ).cumsum(-1)
diff --git a/vllm/model_executor/layers/fla/ops/l2norm.py b/vllm/model_executor/layers/fla/ops/l2norm.py
index ef9788ceaf20..315dd904523b 100644
--- a/vllm/model_executor/layers/fla/ops/l2norm.py
+++ b/vllm/model_executor/layers/fla/ops/l2norm.py
@@ -19,11 +19,12 @@
 USE_DEFAULT_FLA_NORM = int(os.getenv("USE_DEFAULT_FLA_NORM", "0"))
 
 
-@triton.autotune(configs=[
-    triton.Config({}, num_warps=num_warps)
-    for num_warps in [1, 2, 4, 8, 16, 32]
-],
-                 key=['D'])
+@triton.autotune(
+    configs=[
+        triton.Config({}, num_warps=num_warps) for num_warps in [1, 2, 4, 8, 16, 32]
+    ],
+    key=["D"],
+)
 @triton.jit
 def l2norm_fwd_kernel1(
     x,
@@ -47,11 +48,14 @@ def l2norm_fwd_kernel1(
     tl.store(y + cols, b_y, mask=mask)
 
 
-@triton.autotune(configs=[
-    triton.Config({'BT': BT}, num_warps=num_warps)
-    for num_warps in [1, 2, 4, 8, 16] for BT in BT_LIST
-],
-                 key=['D'])
+@triton.autotune(
+    configs=[
+        triton.Config({"BT": BT}, num_warps=num_warps)
+        for num_warps in [1, 2, 4, 8, 16]
+        for BT in BT_LIST
+    ],
+    key=["D"],
+)
 @triton.jit(do_not_specialize=["NB"])
 def l2norm_fwd_kernel(
     x,
@@ -85,9 +89,9 @@ def l2norm_fwd_kernel2(X, Y, eps, M, N: tl.constexpr, MBLOCK: tl.constexpr):
     tl.store(Y + (rindex + N * row_idx), xs * rsqrt, xmask)
 
 
-def l2norm_fwd(x: torch.Tensor,
-               eps: float = 1e-6,
-               output_dtype: Optional[torch.dtype] = None):
+def l2norm_fwd(
+    x: torch.Tensor, eps: float = 1e-6, output_dtype: Optional[torch.dtype] = None
+):
     x_shape_og = x.shape
     x = x.view(-1, x.shape[-1])
     # allocate output
@@ -107,7 +111,7 @@ def l2norm_fwd(x: torch.Tensor,
     if not USE_DEFAULT_FLA_NORM:
         MBLOCK = 32
         # M, N = x.shape
-        l2norm_fwd_kernel2[(triton.cdiv(T, MBLOCK), )](
+        l2norm_fwd_kernel2[(triton.cdiv(T, MBLOCK),)](
             x,
             y,
             eps,
@@ -120,7 +124,7 @@ def l2norm_fwd(x: torch.Tensor,
             NB = triton.cdiv(T, 2048)
 
             def grid(meta):
-                return (triton.cdiv(T, meta['BT']), )
+                return (triton.cdiv(T, meta["BT"]),)
 
             l2norm_fwd_kernel[grid](
                 x,
@@ -132,7 +136,7 @@ def grid(meta):
                 BD=BD,
             )
         else:
-            l2norm_fwd_kernel1[(T, )](
+            l2norm_fwd_kernel1[(T,)](
                 x,
                 y,
                 eps=eps,
diff --git a/vllm/model_executor/layers/fla/ops/layernorm_guard.py b/vllm/model_executor/layers/fla/ops/layernorm_guard.py
index a733c6c81e36..655cdb3f30eb 100644
--- a/vllm/model_executor/layers/fla/ops/layernorm_guard.py
+++ b/vllm/model_executor/layers/fla/ops/layernorm_guard.py
@@ -25,14 +25,16 @@
 from .utils import input_guard
 
 
-def rms_norm_ref(x,
-                 weight,
-                 bias,
-                 z=None,
-                 eps=1e-6,
-                 group_size=None,
-                 norm_before_gate=True,
-                 upcast=True):
+def rms_norm_ref(
+    x,
+    weight,
+    bias,
+    z=None,
+    eps=1e-6,
+    group_size=None,
+    norm_before_gate=True,
+    upcast=True,
+):
     dtype = x.dtype
     weight = weight.float()
     bias = bias.float() if bias is not None else None
@@ -43,12 +45,10 @@ def rms_norm_ref(x,
         x = x * F.silu(z)
     if group_size is None:
         rstd = 1 / torch.sqrt((x.square()).mean(dim=-1, keepdim=True) + eps)
-        out = (x * rstd * weight) + bias if bias is not None else (x * rstd *
-                                                                   weight)
+        out = (x * rstd * weight) + bias if bias is not None else (x * rstd * weight)
     else:
         x_group = rearrange(x, "... (g d) -> ... g d", d=group_size)
-        rstd = 1 / torch.sqrt((x_group.square()).mean(dim=-1, keepdim=True) +
-                              eps)
+        rstd = 1 / torch.sqrt((x_group.square()).mean(dim=-1, keepdim=True) + eps)
         out = rearrange(x_group * rstd, "... g d -> ... (g d)") * weight
         if bias is not None:
             out = out + bias
@@ -57,10 +57,12 @@ def rms_norm_ref(x,
     return out.to(dtype)
 
 
-@triton.heuristics({
-    "HAS_BIAS": lambda args: args["B"] is not None,
-    "HAS_Z": lambda args: args["Z"] is not None,
-})
+@triton.heuristics(
+    {
+        "HAS_BIAS": lambda args: args["B"] is not None,
+        "HAS_Z": lambda args: args["Z"] is not None,
+    }
+)
 @triton.jit
 def layer_norm_fwd_kernel(
     X,  # pointer to the input
@@ -97,17 +99,17 @@ def layer_norm_fwd_kernel(
         B += group * N
     # Compute mean and variance
     cols = tl.arange(0, BLOCK_N)
-    x = tl.load(X + cols, mask=cols < N, other=0.).to(tl.float32)
+    x = tl.load(X + cols, mask=cols < N, other=0.0).to(tl.float32)
     if HAS_Z and not NORM_BEFORE_GATE:
         z = tl.load(Z + cols, mask=cols < N).to(tl.float32)
         x *= z * tl.sigmoid(z)
     if not IS_RMS_NORM:
         mean = tl.sum(x, axis=0) / N
         tl.store(Mean + row, mean)
-        xbar = tl.where(cols < N, x - mean, 0.)
+        xbar = tl.where(cols < N, x - mean, 0.0)
         var = tl.sum(xbar * xbar, axis=0) / N
     else:
-        xbar = tl.where(cols < N, x, 0.)
+        xbar = tl.where(cols < N, x, 0.0)
         var = tl.sum(xbar * xbar, axis=0) / N
     rstd = 1 / tl.sqrt(var + eps)
     tl.store(Rstd + row, rstd)
@@ -145,64 +147,68 @@ def layer_norm_fwd(
     if z is not None:
         assert z.stride(-1) == 1
         assert z.shape == (M, N)
-    assert weight.shape == (N, )
+    assert weight.shape == (N,)
     assert weight.stride(-1) == 1
     if bias is not None:
         assert bias.stride(-1) == 1
-        assert bias.shape == (N, )
+        assert bias.shape == (N,)
     # allocate output
     if out is not None:
         assert out.shape == x.shape
     else:
         out = torch.empty_like(x)
     assert out.stride(-1) == 1
-    mean = torch.empty((ngroups * M, ), dtype=torch.float32,
-                       device=x.device) if not is_rms_norm else None
-    rstd = torch.empty((ngroups * M, ), dtype=torch.float32, device=x.device)
+    mean = (
+        torch.empty((ngroups * M,), dtype=torch.float32, device=x.device)
+        if not is_rms_norm
+        else None
+    )
+    rstd = torch.empty((ngroups * M,), dtype=torch.float32, device=x.device)
     # Less than 64KB per feature: enqueue fused kernel
     MAX_FUSED_SIZE = 65536 // x.element_size()
     BLOCK_N = min(MAX_FUSED_SIZE, triton.next_power_of_2(group_size))
     if group_size > BLOCK_N:
-        raise RuntimeError(
-            "This layer norm doesn't support feature dim >= 64KB.")
+        raise RuntimeError("This layer norm doesn't support feature dim >= 64KB.")
     # heuristics for number of warps
     num_warps = min(max(BLOCK_N // 256, 1), 8)
     grid = (M, ngroups)
-    layer_norm_fwd_kernel[grid](x,
-                                out,
-                                weight,
-                                bias,
-                                z,
-                                mean,
-                                rstd,
-                                x.stride(0),
-                                out.stride(0),
-                                z.stride(0) if z is not None else 0,
-                                M,
-                                group_size,
-                                eps,
-                                BLOCK_N=BLOCK_N,
-                                NORM_BEFORE_GATE=norm_before_gate,
-                                IS_RMS_NORM=is_rms_norm,
-                                num_warps=num_warps)
+    layer_norm_fwd_kernel[grid](
+        x,
+        out,
+        weight,
+        bias,
+        z,
+        mean,
+        rstd,
+        x.stride(0),
+        out.stride(0),
+        z.stride(0) if z is not None else 0,
+        M,
+        group_size,
+        eps,
+        BLOCK_N=BLOCK_N,
+        NORM_BEFORE_GATE=norm_before_gate,
+        IS_RMS_NORM=is_rms_norm,
+        num_warps=num_warps,
+    )
     return out, mean, rstd
 
 
 class LayerNormFn(torch.autograd.Function):
-
     @input_guard
     @staticmethod
-    def forward(ctx,
-                x,
-                weight,
-                bias,
-                z=None,
-                eps=1e-6,
-                group_size=None,
-                norm_before_gate=True,
-                is_rms_norm=False):
-        """If z is not None, we do norm(x) * silu(z) if norm_before_gate, else norm(x * silu(z))
-        """
+    def forward(
+        ctx,
+        x,
+        weight,
+        bias,
+        z=None,
+        eps=1e-6,
+        group_size=None,
+        norm_before_gate=True,
+        is_rms_norm=False,
+    ):
+        """If z is not None, we do norm(x) * silu(z) if norm_before_gate, else norm(x * silu(z))"""
 
         x_shape_og = x.shape
         # reshape input data into 2D tensor
@@ -236,31 +242,30 @@ def forward(ctx,
         return y.reshape(x_shape_og)
 
 
-def layernorm_fn(x,
-                 weight,
-                 bias,
-                 z=None,
-                 eps=1e-6,
-                 group_size=None,
-                 norm_before_gate=True,
-                 is_rms_norm=False):
-    return LayerNormFn.apply(x, weight, bias, z, eps, group_size,
-                             norm_before_gate, is_rms_norm)
+def layernorm_fn(
+    x,
+    weight,
+    bias,
+    z=None,
+    eps=1e-6,
+    group_size=None,
+    norm_before_gate=True,
+    is_rms_norm=False,
+):
+    return LayerNormFn.apply(
+        x, weight, bias, z, eps, group_size, norm_before_gate, is_rms_norm
+    )
 
 
-def rmsnorm_fn(x,
-               weight,
-               bias,
-               z=None,
-               eps=1e-6,
-               group_size=None,
-               norm_before_gate=True):
-    return LayerNormFn.apply(x, weight, bias, z, eps, group_size,
-                             norm_before_gate, True)
+def rmsnorm_fn(
+    x, weight, bias, z=None, eps=1e-6, group_size=None, norm_before_gate=True
+):
+    return LayerNormFn.apply(
+        x, weight, bias, z, eps, group_size, norm_before_gate, True
+    )
 
 
 class LayerNormGated(nn.Module):
-
     def __init__(
         self,
         hidden_size,
@@ -288,19 +293,19 @@ def reset_parameters(self):
         torch.nn.init.zeros_(self.bias)
 
     def forward(self, x, z=None):
-        """If z is not None, we do norm(x) * silu(z) if norm_before_gate, else norm(x * silu(z))
-        """
-        return layernorm_fn(x,
-                            self.weight,
-                            self.bias,
-                            z=z,
-                            group_size=self.group_size,
-                            eps=self.eps,
-                            norm_before_gate=self.norm_before_gate)
+        """If z is not None, we do norm(x) * silu(z) if norm_before_gate, else norm(x * silu(z))"""
+        return layernorm_fn(
+            x,
+            self.weight,
+            self.bias,
+            z=z,
+            group_size=self.group_size,
+            eps=self.eps,
+            norm_before_gate=self.norm_before_gate,
+        )
 
 
 class RMSNormGated(nn.Module):
-
     def __init__(
         self,
         hidden_size,
@@ -326,12 +331,13 @@ def reset_parameters(self):
         torch.nn.init.ones_(self.weight)
 
     def forward(self, x, z=None):
-        """If z is not None, we do norm(x) * silu(z) if norm_before_gate, else norm(x * silu(z))
-        """
-        return rmsnorm_fn(x,
-                          self.weight,
-                          self.bias,
-                          z=z,
-                          eps=self.eps,
-                          group_size=self.group_size,
-                          norm_before_gate=self.norm_before_gate)
+        """If z is not None, we do norm(x) * silu(z) if norm_before_gate, else norm(x * silu(z))"""
+        return rmsnorm_fn(
+            x,
+            self.weight,
+            self.bias,
+            z=z,
+            eps=self.eps,
+            group_size=self.group_size,
+            norm_before_gate=self.norm_before_gate,
+        )
diff --git a/vllm/model_executor/layers/fla/ops/op.py b/vllm/model_executor/layers/fla/ops/op.py
index 8c29434ca106..ee2f4185a5df 100644
--- a/vllm/model_executor/layers/fla/ops/op.py
+++ b/vllm/model_executor/layers/fla/ops/op.py
@@ -11,7 +11,7 @@
 
 from vllm.triton_utils import tl, tldevice, triton
 
-if os.environ.get('FLA_USE_FAST_OPS', '0') == '1':
+if os.environ.get("FLA_USE_FAST_OPS", "0") == "1":
     div = tldevice.fast_dividef
     exp = tldevice.fast_expf
     log = tldevice.fast_logf
@@ -28,7 +28,7 @@ def div_normal(x, y):
     log2 = tl.log2
 
 
-if not hasattr(tl, 'gather'):
+if not hasattr(tl, "gather"):
 
     @triton.jit
     def gather(src, index, axis, _builder=None):
diff --git a/vllm/model_executor/layers/fla/ops/solve_tril.py b/vllm/model_executor/layers/fla/ops/solve_tril.py
index 97cb0d800d41..d30fea90aec3 100644
--- a/vllm/model_executor/layers/fla/ops/solve_tril.py
+++ b/vllm/model_executor/layers/fla/ops/solve_tril.py
@@ -17,15 +17,16 @@
 from .utils import input_guard
 
 
-@triton.heuristics({'IS_VARLEN': lambda args: args['cu_seqlens'] is not None})
+@triton.heuristics({"IS_VARLEN": lambda args: args["cu_seqlens"] is not None})
 @triton.autotune(
     configs=[
         triton.Config({}, num_warps=num_warps, num_stages=num_stages)
-        for num_warps in [1, 2, 4, 8] for num_stages in [2, 3, 4, 5]
+        for num_warps in [1, 2, 4, 8]
+        for num_stages in [2, 3, 4, 5]
     ],
-    key=['BT'],
+    key=["BT"],
 )
-@triton.jit(do_not_specialize=['T'])
+@triton.jit(do_not_specialize=["T"])
 def solve_tril_16x16_kernel(
     A,
     Ad,
@@ -39,10 +40,14 @@ def solve_tril_16x16_kernel(
     i_t, i_bh = tl.program_id(0), tl.program_id(1)
     i_b, i_h = i_bh // H, i_bh % H
     if IS_VARLEN:
-        i_n, i_t = tl.load(chunk_indices + i_t * 2).to(
-            tl.int32), tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32)
-        bos, eos = tl.load(cu_seqlens + i_n).to(
-            tl.int32), tl.load(cu_seqlens + i_n + 1).to(tl.int32)
+        i_n, i_t = (
+            tl.load(chunk_indices + i_t * 2).to(tl.int32),
+            tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32),
+        )
+        bos, eos = (
+            tl.load(cu_seqlens + i_n).to(tl.int32),
+            tl.load(cu_seqlens + i_n + 1).to(tl.int32),
+        )
         T = eos - bos
     else:
         bos, eos = i_b * T, i_b * T + T
@@ -51,13 +56,12 @@ def solve_tril_16x16_kernel(
     Ad = Ad + (bos * H + i_h) * 16
 
     offset = (i_t * 16) % BT
-    p_A = tl.make_block_ptr(A, (T, BT), (H * BT, 1), (i_t * 16, offset),
-                            (16, 16), (1, 0))
-    p_Ai = tl.make_block_ptr(Ad, (T, 16), (H * 16, 1), (i_t * 16, 0), (16, 16),
-                             (1, 0))
+    p_A = tl.make_block_ptr(
+        A, (T, BT), (H * BT, 1), (i_t * 16, offset), (16, 16), (1, 0)
+    )
+    p_Ai = tl.make_block_ptr(Ad, (T, 16), (H * 16, 1), (i_t * 16, 0), (16, 16), (1, 0))
     b_A = tl.load(p_A, boundary_check=(0, 1)).to(tl.float32)
-    b_A = -tl.where(
-        tl.arange(0, 16)[:, None] > tl.arange(0, 16)[None, :], b_A, 0)
+    b_A = -tl.where(tl.arange(0, 16)[:, None] > tl.arange(0, 16)[None, :], b_A, 0)
 
     o_i = tl.arange(0, 16)
     for i in range(1, min(16, T - i_t * 16)):
@@ -66,30 +70,45 @@ def solve_tril_16x16_kernel(
         mask = o_i == i
         b_A = tl.where(mask[:, None], b_a, b_A)
     b_A += o_i[:, None] == o_i[None, :]
-    tl.store(p_Ai,
-             b_A.to(p_Ai.dtype.element_ty, fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
+    tl.store(
+        p_Ai,
+        b_A.to(p_Ai.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
 
 
-@triton.heuristics({'IS_VARLEN': lambda args: args['cu_seqlens'] is not None})
+@triton.heuristics({"IS_VARLEN": lambda args: args["cu_seqlens"] is not None})
 @triton.autotune(
     configs=[
         triton.Config({}, num_warps=num_warps, num_stages=num_stages)
-        for num_warps in [1, 2, 4, 8] for num_stages in [2, 3, 4, 5]
+        for num_warps in [1, 2, 4, 8]
+        for num_stages in [2, 3, 4, 5]
     ],
-    key=['H', 'BT', 'IS_VARLEN'],
+    key=["H", "BT", "IS_VARLEN"],
 )
-@triton.jit(do_not_specialize=['T'])
-def merge_16x16_to_32x32_inverse_kernel(A, Ad, Ai, cu_seqlens, chunk_indices,
-                                        T, H: tl.constexpr, BT: tl.constexpr,
-                                        IS_VARLEN: tl.constexpr):
+@triton.jit(do_not_specialize=["T"])
+def merge_16x16_to_32x32_inverse_kernel(
+    A,
+    Ad,
+    Ai,
+    cu_seqlens,
+    chunk_indices,
+    T,
+    H: tl.constexpr,
+    BT: tl.constexpr,
+    IS_VARLEN: tl.constexpr,
+):
     i_t, i_bh = tl.program_id(0), tl.program_id(1)
     i_b, i_h = i_bh // H, i_bh % H
     if IS_VARLEN:
-        i_n, i_t = tl.load(chunk_indices + i_t * 2).to(
-            tl.int32), tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32)
-        bos, eos = tl.load(cu_seqlens + i_n).to(
-            tl.int32), tl.load(cu_seqlens + i_n + 1).to(tl.int32)
+        i_n, i_t = (
+            tl.load(chunk_indices + i_t * 2).to(tl.int32),
+            tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32),
+        )
+        bos, eos = (
+            tl.load(cu_seqlens + i_n).to(tl.int32),
+            tl.load(cu_seqlens + i_n + 1).to(tl.int32),
+        )
         T = eos - bos
     else:
         bos, eos = i_b * T, i_b * T + T
@@ -98,55 +117,80 @@ def merge_16x16_to_32x32_inverse_kernel(A, Ad, Ai, cu_seqlens, chunk_indices,
     Ad += (bos * H + i_h) * 16
     Ai += (bos * H + i_h) * 32
 
-    p_A_21 = tl.make_block_ptr(A, (T, 32), (H * 32, 1), (i_t * 32 + 16, 0),
-                               (16, 16), (1, 0))
-    p_Ad_11 = tl.make_block_ptr(Ad, (T, 16), (H * 16, 1), (i_t * 32, 0),
-                                (16, 16), (1, 0))
-    p_Ad_22 = tl.make_block_ptr(Ad, (T, 16), (H * 16, 1), (i_t * 32 + 16, 0),
-                                (16, 16), (1, 0))
-    p_Ai_11 = tl.make_block_ptr(Ai, (T, 32), (H * 32, 1), (i_t * 32, 0),
-                                (16, 16), (1, 0))
-    p_Ai_22 = tl.make_block_ptr(Ai, (T, 32), (H * 32, 1), (i_t * 32 + 16, 16),
-                                (16, 16), (1, 0))
-    p_Ai_21 = tl.make_block_ptr(Ai, (T, 32), (H * 32, 1), (i_t * 32 + 16, 0),
-                                (16, 16), (1, 0))
+    p_A_21 = tl.make_block_ptr(
+        A, (T, 32), (H * 32, 1), (i_t * 32 + 16, 0), (16, 16), (1, 0)
+    )
+    p_Ad_11 = tl.make_block_ptr(
+        Ad, (T, 16), (H * 16, 1), (i_t * 32, 0), (16, 16), (1, 0)
+    )
+    p_Ad_22 = tl.make_block_ptr(
+        Ad, (T, 16), (H * 16, 1), (i_t * 32 + 16, 0), (16, 16), (1, 0)
+    )
+    p_Ai_11 = tl.make_block_ptr(
+        Ai, (T, 32), (H * 32, 1), (i_t * 32, 0), (16, 16), (1, 0)
+    )
+    p_Ai_22 = tl.make_block_ptr(
+        Ai, (T, 32), (H * 32, 1), (i_t * 32 + 16, 16), (16, 16), (1, 0)
+    )
+    p_Ai_21 = tl.make_block_ptr(
+        Ai, (T, 32), (H * 32, 1), (i_t * 32 + 16, 0), (16, 16), (1, 0)
+    )
 
     A_21 = tl.load(p_A_21, boundary_check=(0, 1)).to(tl.float32)
     Ai_11 = tl.load(p_Ad_11, boundary_check=(0, 1)).to(tl.float32)
     Ai_22 = tl.load(p_Ad_22, boundary_check=(0, 1)).to(tl.float32)
-    Ai_21 = -tl.dot(tl.dot(Ai_22, A_21, input_precision='ieee'),
-                    Ai_11,
-                    input_precision='ieee')
-    tl.store(p_Ai_11,
-             Ai_11.to(p_Ai_11.dtype.element_ty, fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_22,
-             Ai_22.to(p_Ai_22.dtype.element_ty, fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_21,
-             Ai_21.to(p_Ai_21.dtype.element_ty, fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
+    Ai_21 = -tl.dot(
+        tl.dot(Ai_22, A_21, input_precision="ieee"), Ai_11, input_precision="ieee"
+    )
+    tl.store(
+        p_Ai_11,
+        Ai_11.to(p_Ai_11.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_22,
+        Ai_22.to(p_Ai_22.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_21,
+        Ai_21.to(p_Ai_21.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
 
 
-@triton.heuristics({'IS_VARLEN': lambda args: args['cu_seqlens'] is not None})
+@triton.heuristics({"IS_VARLEN": lambda args: args["cu_seqlens"] is not None})
 @triton.autotune(
     configs=[
         triton.Config({}, num_warps=num_warps, num_stages=num_stages)
-        for num_warps in [2, 4, 8] for num_stages in [2, 3, 4, 5]
+        for num_warps in [2, 4, 8]
+        for num_stages in [2, 3, 4, 5]
     ],
-    key=['H', 'BT', 'IS_VARLEN'],
+    key=["H", "BT", "IS_VARLEN"],
 )
-@triton.jit(do_not_specialize=['T'])
-def merge_16x16_to_64x64_inverse_kernel(A, Ad, Ai, cu_seqlens, chunk_indices,
-                                        T, H: tl.constexpr, BT: tl.constexpr,
-                                        IS_VARLEN: tl.constexpr):
+@triton.jit(do_not_specialize=["T"])
+def merge_16x16_to_64x64_inverse_kernel(
+    A,
+    Ad,
+    Ai,
+    cu_seqlens,
+    chunk_indices,
+    T,
+    H: tl.constexpr,
+    BT: tl.constexpr,
+    IS_VARLEN: tl.constexpr,
+):
     i_t, i_bh = tl.program_id(0), tl.program_id(1)
     i_b, i_h = i_bh // H, i_bh % H
     if IS_VARLEN:
-        i_n, i_t = tl.load(chunk_indices + i_t * 2).to(
-            tl.int32), tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32)
-        bos, eos = tl.load(cu_seqlens + i_n).to(
-            tl.int32), tl.load(cu_seqlens + i_n + 1).to(tl.int32)
+        i_n, i_t = (
+            tl.load(chunk_indices + i_t * 2).to(tl.int32),
+            tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32),
+        )
+        bos, eos = (
+            tl.load(cu_seqlens + i_n).to(tl.int32),
+            tl.load(cu_seqlens + i_n + 1).to(tl.int32),
+        )
         T = eos - bos
     else:
         bos, eos = i_b * T, i_b * T + T
@@ -155,26 +199,36 @@ def merge_16x16_to_64x64_inverse_kernel(A, Ad, Ai, cu_seqlens, chunk_indices,
     Ad += (bos * H + i_h) * 16
     Ai += (bos * H + i_h) * 64
 
-    p_A_21 = tl.make_block_ptr(A, (T, 64), (H * 64, 1), (i_t * 64 + 16, 0),
-                               (16, 16), (1, 0))
-    p_A_32 = tl.make_block_ptr(A, (T, 64), (H * 64, 1), (i_t * 64 + 32, 16),
-                               (16, 16), (1, 0))
-    p_A_31 = tl.make_block_ptr(A, (T, 64), (H * 64, 1), (i_t * 64 + 32, 0),
-                               (16, 16), (1, 0))
-    p_A_43 = tl.make_block_ptr(A, (T, 64), (H * 64, 1), (i_t * 64 + 48, 32),
-                               (16, 16), (1, 0))
-    p_A_42 = tl.make_block_ptr(A, (T, 64), (H * 64, 1), (i_t * 64 + 48, 16),
-                               (16, 16), (1, 0))
-    p_A_41 = tl.make_block_ptr(A, (T, 64), (H * 64, 1), (i_t * 64 + 48, 0),
-                               (16, 16), (1, 0))
-    p_Ad_11 = tl.make_block_ptr(Ad, (T, 16), (H * 16, 1), (i_t * 64, 0),
-                                (16, 16), (1, 0))
-    p_Ad_22 = tl.make_block_ptr(Ad, (T, 16), (H * 16, 1), (i_t * 64 + 16, 0),
-                                (16, 16), (1, 0))
-    p_Ad_33 = tl.make_block_ptr(Ad, (T, 16), (H * 16, 1), (i_t * 64 + 32, 0),
-                                (16, 16), (1, 0))
-    p_Ad_44 = tl.make_block_ptr(Ad, (T, 16), (H * 16, 1), (i_t * 64 + 48, 0),
-                                (16, 16), (1, 0))
+    p_A_21 = tl.make_block_ptr(
+        A, (T, 64), (H * 64, 1), (i_t * 64 + 16, 0), (16, 16), (1, 0)
+    )
+    p_A_32 = tl.make_block_ptr(
+        A, (T, 64), (H * 64, 1), (i_t * 64 + 32, 16), (16, 16), (1, 0)
+    )
+    p_A_31 = tl.make_block_ptr(
+        A, (T, 64), (H * 64, 1), (i_t * 64 + 32, 0), (16, 16), (1, 0)
+    )
+    p_A_43 = tl.make_block_ptr(
+        A, (T, 64), (H * 64, 1), (i_t * 64 + 48, 32), (16, 16), (1, 0)
+    )
+    p_A_42 = tl.make_block_ptr(
+        A, (T, 64), (H * 64, 1), (i_t * 64 + 48, 16), (16, 16), (1, 0)
+    )
+    p_A_41 = tl.make_block_ptr(
+        A, (T, 64), (H * 64, 1), (i_t * 64 + 48, 0), (16, 16), (1, 0)
+    )
+    p_Ad_11 = tl.make_block_ptr(
+        Ad, (T, 16), (H * 16, 1), (i_t * 64, 0), (16, 16), (1, 0)
+    )
+    p_Ad_22 = tl.make_block_ptr(
+        Ad, (T, 16), (H * 16, 1), (i_t * 64 + 16, 0), (16, 16), (1, 0)
+    )
+    p_Ad_33 = tl.make_block_ptr(
+        Ad, (T, 16), (H * 16, 1), (i_t * 64 + 32, 0), (16, 16), (1, 0)
+    )
+    p_Ad_44 = tl.make_block_ptr(
+        Ad, (T, 16), (H * 16, 1), (i_t * 64 + 48, 0), (16, 16), (1, 0)
+    )
 
     A_21 = tl.load(p_A_21, boundary_check=(0, 1)).to(tl.float32)
     A_32 = tl.load(p_A_32, boundary_check=(0, 1)).to(tl.float32)
@@ -188,124 +242,174 @@ def merge_16x16_to_64x64_inverse_kernel(A, Ad, Ai, cu_seqlens, chunk_indices,
     Ai_33 = tl.load(p_Ad_33, boundary_check=(0, 1)).to(tl.float32)
     Ai_44 = tl.load(p_Ad_44, boundary_check=(0, 1)).to(tl.float32)
 
-    Ai_21 = -tl.dot(tl.dot(Ai_22, A_21, input_precision='ieee'),
-                    Ai_11,
-                    input_precision='ieee')
-    Ai_32 = -tl.dot(tl.dot(Ai_33, A_32, input_precision='ieee'),
-                    Ai_22,
-                    input_precision='ieee')
-    Ai_43 = -tl.dot(tl.dot(Ai_44, A_43, input_precision='ieee'),
-                    Ai_33,
-                    input_precision='ieee')
+    Ai_21 = -tl.dot(
+        tl.dot(Ai_22, A_21, input_precision="ieee"), Ai_11, input_precision="ieee"
+    )
+    Ai_32 = -tl.dot(
+        tl.dot(Ai_33, A_32, input_precision="ieee"), Ai_22, input_precision="ieee"
+    )
+    Ai_43 = -tl.dot(
+        tl.dot(Ai_44, A_43, input_precision="ieee"), Ai_33, input_precision="ieee"
+    )
 
-    Ai_31 = -tl.dot(Ai_33,
-                    tl.dot(A_31, Ai_11, input_precision='ieee') +
-                    tl.dot(A_32, Ai_21, input_precision='ieee'),
-                    input_precision='ieee')
-    Ai_42 = -tl.dot(Ai_44,
-                    tl.dot(A_42, Ai_22, input_precision='ieee') +
-                    tl.dot(A_43, Ai_32, input_precision='ieee'),
-                    input_precision='ieee')
-    Ai_41 = -tl.dot(Ai_44,
-                    tl.dot(A_41, Ai_11, input_precision='ieee') +
-                    tl.dot(A_42, Ai_21, input_precision='ieee') +
-                    tl.dot(A_43, Ai_31, input_precision='ieee'),
-                    input_precision='ieee')
+    Ai_31 = -tl.dot(
+        Ai_33,
+        tl.dot(A_31, Ai_11, input_precision="ieee")
+        + tl.dot(A_32, Ai_21, input_precision="ieee"),
+        input_precision="ieee",
+    )
+    Ai_42 = -tl.dot(
+        Ai_44,
+        tl.dot(A_42, Ai_22, input_precision="ieee")
+        + tl.dot(A_43, Ai_32, input_precision="ieee"),
+        input_precision="ieee",
+    )
+    Ai_41 = -tl.dot(
+        Ai_44,
+        tl.dot(A_41, Ai_11, input_precision="ieee")
+        + tl.dot(A_42, Ai_21, input_precision="ieee")
+        + tl.dot(A_43, Ai_31, input_precision="ieee"),
+        input_precision="ieee",
+    )
 
-    p_Ai_11 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64, 0),
-                                (16, 16), (1, 0))
-    p_Ai_22 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64 + 16, 16),
-                                (16, 16), (1, 0))
-    p_Ai_33 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64 + 32, 32),
-                                (16, 16), (1, 0))
-    p_Ai_44 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64 + 48, 48),
-                                (16, 16), (1, 0))
-    p_Ai_21 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64 + 16, 0),
-                                (16, 16), (1, 0))
-    p_Ai_31 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64 + 32, 0),
-                                (16, 16), (1, 0))
-    p_Ai_32 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64 + 32, 16),
-                                (16, 16), (1, 0))
-    p_Ai_41 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64 + 48, 0),
-                                (16, 16), (1, 0))
-    p_Ai_42 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64 + 48, 16),
-                                (16, 16), (1, 0))
-    p_Ai_43 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64 + 48, 32),
-                                (16, 16), (1, 0))
-    tl.store(p_Ai_11,
-             Ai_11.to(p_Ai_11.dtype.element_ty, fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_22,
-             Ai_22.to(p_Ai_22.dtype.element_ty, fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_33,
-             Ai_33.to(p_Ai_33.dtype.element_ty, fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_44,
-             Ai_44.to(p_Ai_44.dtype.element_ty, fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_21,
-             Ai_21.to(p_Ai_21.dtype.element_ty, fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_31,
-             Ai_31.to(p_Ai_31.dtype.element_ty, fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_32,
-             Ai_32.to(p_Ai_32.dtype.element_ty, fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_41,
-             Ai_41.to(p_Ai_41.dtype.element_ty, fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_42,
-             Ai_42.to(p_Ai_42.dtype.element_ty, fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_43,
-             Ai_43.to(p_Ai_43.dtype.element_ty, fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
+    p_Ai_11 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64, 0), (16, 16), (1, 0)
+    )
+    p_Ai_22 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64 + 16, 16), (16, 16), (1, 0)
+    )
+    p_Ai_33 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64 + 32, 32), (16, 16), (1, 0)
+    )
+    p_Ai_44 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64 + 48, 48), (16, 16), (1, 0)
+    )
+    p_Ai_21 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64 + 16, 0), (16, 16), (1, 0)
+    )
+    p_Ai_31 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64 + 32, 0), (16, 16), (1, 0)
+    )
+    p_Ai_32 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64 + 32, 16), (16, 16), (1, 0)
+    )
+    p_Ai_41 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64 + 48, 0), (16, 16), (1, 0)
+    )
+    p_Ai_42 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64 + 48, 16), (16, 16), (1, 0)
+    )
+    p_Ai_43 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64 + 48, 32), (16, 16), (1, 0)
+    )
+    tl.store(
+        p_Ai_11,
+        Ai_11.to(p_Ai_11.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_22,
+        Ai_22.to(p_Ai_22.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_33,
+        Ai_33.to(p_Ai_33.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_44,
+        Ai_44.to(p_Ai_44.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_21,
+        Ai_21.to(p_Ai_21.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_31,
+        Ai_31.to(p_Ai_31.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_32,
+        Ai_32.to(p_Ai_32.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_41,
+        Ai_41.to(p_Ai_41.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_42,
+        Ai_42.to(p_Ai_42.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_43,
+        Ai_43.to(p_Ai_43.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
 
     fill_zeros = tl.zeros((16, 16), dtype=tl.float32)
-    p_Ai_12 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64, 16),
-                                (16, 16), (1, 0))
-    p_Ai_13 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64, 32),
-                                (16, 16), (1, 0))
-    p_Ai_14 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64, 48),
-                                (16, 16), (1, 0))
-    p_Ai_23 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64 + 16, 32),
-                                (16, 16), (1, 0))
-    p_Ai_24 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64 + 16, 48),
-                                (16, 16), (1, 0))
-    p_Ai_34 = tl.make_block_ptr(Ai, (T, 64), (H * 64, 1), (i_t * 64 + 32, 48),
-                                (16, 16), (1, 0))
-    tl.store(p_Ai_12,
-             fill_zeros.to(p_Ai_12.dtype.element_ty,
-                           fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_13,
-             fill_zeros.to(p_Ai_13.dtype.element_ty,
-                           fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_14,
-             fill_zeros.to(p_Ai_14.dtype.element_ty,
-                           fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_23,
-             fill_zeros.to(p_Ai_23.dtype.element_ty,
-                           fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_24,
-             fill_zeros.to(p_Ai_24.dtype.element_ty,
-                           fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
-    tl.store(p_Ai_34,
-             fill_zeros.to(p_Ai_34.dtype.element_ty,
-                           fp_downcast_rounding="rtne"),
-             boundary_check=(0, 1))
+    p_Ai_12 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64, 16), (16, 16), (1, 0)
+    )
+    p_Ai_13 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64, 32), (16, 16), (1, 0)
+    )
+    p_Ai_14 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64, 48), (16, 16), (1, 0)
+    )
+    p_Ai_23 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64 + 16, 32), (16, 16), (1, 0)
+    )
+    p_Ai_24 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64 + 16, 48), (16, 16), (1, 0)
+    )
+    p_Ai_34 = tl.make_block_ptr(
+        Ai, (T, 64), (H * 64, 1), (i_t * 64 + 32, 48), (16, 16), (1, 0)
+    )
+    tl.store(
+        p_Ai_12,
+        fill_zeros.to(p_Ai_12.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_13,
+        fill_zeros.to(p_Ai_13.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_14,
+        fill_zeros.to(p_Ai_14.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_23,
+        fill_zeros.to(p_Ai_23.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_24,
+        fill_zeros.to(p_Ai_24.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
+    tl.store(
+        p_Ai_34,
+        fill_zeros.to(p_Ai_34.dtype.element_ty, fp_downcast_rounding="rtne"),
+        boundary_check=(0, 1),
+    )
 
 
 @input_guard
-def solve_tril(A: torch.Tensor,
-               cu_seqlens: Optional[torch.Tensor] = None,
-               output_dtype: torch.dtype = torch.float) -> torch.Tensor:
+def solve_tril(
+    A: torch.Tensor,
+    cu_seqlens: Optional[torch.Tensor] = None,
+    output_dtype: torch.dtype = torch.float,
+) -> torch.Tensor:
     """
     Compute the inverse of the lower triangular matrix
     A should be strictly lower triangular, i.e., A.triu() == 0.
@@ -325,15 +429,13 @@ def solve_tril(A: torch.Tensor,
     assert A.shape[-1] in [16, 32, 64]
 
     B, T, H, BT = A.shape
-    Ad = torch.empty(B,
-                     T,
-                     H,
-                     16,
-                     device=A.device,
-                     dtype=torch.float if BT != 16 else output_dtype)
+    Ad = torch.empty(
+        B, T, H, 16, device=A.device, dtype=torch.float if BT != 16 else output_dtype
+    )
 
-    chunk_indices = prepare_chunk_indices(
-        cu_seqlens, 16) if cu_seqlens is not None else None
+    chunk_indices = (
+        prepare_chunk_indices(cu_seqlens, 16) if cu_seqlens is not None else None
+    )
     NT = len(chunk_indices) if cu_seqlens is not None else triton.cdiv(T, 16)
     solve_tril_16x16_kernel[NT, B * H](
         A=A,
@@ -348,9 +450,14 @@ def solve_tril(A: torch.Tensor,
         return Ad
 
     Ai = torch.empty(B, T, H, BT, device=A.device, dtype=output_dtype)
-    merge_fn = merge_16x16_to_32x32_inverse_kernel if BT == 32 else merge_16x16_to_64x64_inverse_kernel
-    chunk_indices = prepare_chunk_indices(
-        cu_seqlens, BT) if cu_seqlens is not None else None
+    merge_fn = (
+        merge_16x16_to_32x32_inverse_kernel
+        if BT == 32
+        else merge_16x16_to_64x64_inverse_kernel
+    )
+    chunk_indices = (
+        prepare_chunk_indices(cu_seqlens, BT) if cu_seqlens is not None else None
+    )
     NT = len(chunk_indices) if cu_seqlens is not None else triton.cdiv(T, BT)
     merge_fn[NT, B * H](
         A=A,
diff --git a/vllm/model_executor/layers/fla/ops/utils.py b/vllm/model_executor/layers/fla/ops/utils.py
index 7fd90cee45d0..07124f33f1e6 100644
--- a/vllm/model_executor/layers/fla/ops/utils.py
+++ b/vllm/model_executor/layers/fla/ops/utils.py
@@ -27,8 +27,7 @@
 SUPPRESS_LEVEL = int(os.getenv("GDN_RECOMPUTE_SUPPRESS_LEVEL", "0"))
 
 
-def tensor_cache(
-        fn: Callable[..., torch.Tensor]) -> Callable[..., torch.Tensor]:
+def tensor_cache(fn: Callable[..., torch.Tensor]) -> Callable[..., torch.Tensor]:
     """
     A decorator that caches the most recent results of a function with tensor inputs.
 
@@ -52,12 +51,19 @@ def wrapper(*args: Any, **kwargs: Any) -> Any:
         nonlocal cache_entries, cache_size
         for i, entry in enumerate(cache_entries):
             last_args, last_kwargs, last_result = entry
-            if len(args) == len(last_args) and len(kwargs) == len(last_kwargs) \
-                and all(a is b for a, b in zip(args, last_args)) \
-                and all(k in last_kwargs and v is last_kwargs[k] for k, v in kwargs.items()):
-                cache_entries = cache_entries[:i] + cache_entries[i + 1:] + [
-                    (args, kwargs, last_result)
-                ]
+            if (
+                len(args) == len(last_args)
+                and len(kwargs) == len(last_kwargs)
+                and all(a is b for a, b in zip(args, last_args))
+                and all(
+                    k in last_kwargs and v is last_kwargs[k] for k, v in kwargs.items()
+                )
+            ):
+                cache_entries = (
+                    cache_entries[:i]
+                    + cache_entries[i + 1 :]
+                    + [(args, kwargs, last_result)]
+                )
                 return last_result
 
         result = fn(*args, **kwargs)
@@ -70,16 +76,16 @@ def wrapper(*args: Any, **kwargs: Any) -> Any:
     return wrapper
 
 
-def input_guard(
-        fn: Callable[..., torch.Tensor]) -> Callable[..., torch.Tensor]:
+def input_guard(fn: Callable[..., torch.Tensor]) -> Callable[..., torch.Tensor]:
     """
     A decorator to make sure all input tensors are contiguous and set the device based on input tensors.
     """
 
     @functools.wraps(fn)
     def wrapper(*args, **kwargs):
-        contiguous_args = (i if not isinstance(i, torch.Tensor) else
-                           i.contiguous() for i in args)
+        contiguous_args = (
+            i if not isinstance(i, torch.Tensor) else i.contiguous() for i in args
+        )
         contiguous_kwargs = {
             k: (v if not isinstance(v, torch.Tensor) else v.contiguous())
             for k, v in kwargs.items()
@@ -112,11 +118,11 @@ def get_available_device() -> str:
     try:
         return triton.runtime.driver.active.get_current_target().backend
     except BaseException:
-        return 'cpu'
+        return "cpu"
 
 
 @functools.cache
-def _check_platform() -> Literal['nvidia', 'amd', 'intel', 'musa']:
+def _check_platform() -> Literal["nvidia", "amd", "intel", "musa"]:
     device = get_available_device()
     mapping = {
         "cuda": "nvidia",
@@ -130,27 +136,28 @@ def _check_platform() -> Literal['nvidia', 'amd', 'intel', 'musa']:
 # For AMD GPUs, the triton backend is 'hip', while for Nvidia GPUs, the triton backend is 'cuda'.
 # However, the torch backend is 'cuda' for both Nvidia and AMD GPUs.
 # Therefore, we need to check the triton backend to determine the actual GPU vendor.
-device = get_available_device() if get_available_device() != 'hip' else 'cuda'
+device = get_available_device() if get_available_device() != "hip" else "cuda"
 device_torch_lib = getattr(torch, device)
 device_platform = _check_platform()
 
-is_amd = (device_platform == 'amd')
-is_intel = (device_platform == 'intel')
-is_nvidia = (device_platform == 'nvidia')
-is_intel_alchemist = (is_intel
-                      and 'Intel(R) Arc(TM) A' in torch.xpu.get_device_name(0))
-is_nvidia_hopper = (is_nvidia
-                    and ('NVIDIA H' in torch.cuda.get_device_name(0)
-                         or torch.cuda.get_device_capability()[0] >= 9))
-use_cuda_graph = (is_nvidia
-                  and os.environ.get('FLA_USE_CUDA_GRAPH', '0') == '1')
+is_amd = device_platform == "amd"
+is_intel = device_platform == "intel"
+is_nvidia = device_platform == "nvidia"
+is_intel_alchemist = is_intel and "Intel(R) Arc(TM) A" in torch.xpu.get_device_name(0)
+is_nvidia_hopper = is_nvidia and (
+    "NVIDIA H" in torch.cuda.get_device_name(0)
+    or torch.cuda.get_device_capability()[0] >= 9
+)
+use_cuda_graph = is_nvidia and os.environ.get("FLA_USE_CUDA_GRAPH", "0") == "1"
 
 
 def get_all_max_shared_mem():
     try:
         return [
-            triton.runtime.driver.active.utils.get_device_properties(i)
-            ['max_shared_mem'] for i in range(device_torch_lib.device_count())
+            triton.runtime.driver.active.utils.get_device_properties(i)[
+                "max_shared_mem"
+            ]
+            for i in range(device_torch_lib.device_count())
         ]
     except BaseException:
         return [-1]
diff --git a/vllm/model_executor/layers/fla/ops/wy_fast.py b/vllm/model_executor/layers/fla/ops/wy_fast.py
index 70374eb65064..b628a90e843f 100644
--- a/vllm/model_executor/layers/fla/ops/wy_fast.py
+++ b/vllm/model_executor/layers/fla/ops/wy_fast.py
@@ -17,56 +17,100 @@
 from .index import prepare_chunk_indices
 
 
-@triton.heuristics({'IS_VARLEN': lambda args: args['cu_seqlens'] is not None})
+@triton.heuristics({"IS_VARLEN": lambda args: args["cu_seqlens"] is not None})
 @triton.autotune(
     configs=[
         triton.Config({}, num_warps=num_warps, num_stages=num_stages)
-        for num_warps in [2, 4, 8] for num_stages in [2, 3, 4]
+        for num_warps in [2, 4, 8]
+        for num_stages in [2, 3, 4]
     ],
-    key=['H', 'K', 'V', 'BT', 'BK', 'BV', 'IS_VARLEN'],
+    key=["H", "K", "V", "BT", "BK", "BV", "IS_VARLEN"],
 )
-@triton.jit(do_not_specialize=['T'])
-def recompute_w_u_fwd_kernel(k, v, beta, w, u, A, g, cu_seqlens, chunk_indices,
-                             T, H: tl.constexpr, Hg: tl.constexpr,
-                             K: tl.constexpr, V: tl.constexpr,
-                             BT: tl.constexpr, BK: tl.constexpr,
-                             BV: tl.constexpr, IS_VARLEN: tl.constexpr):
+@triton.jit(do_not_specialize=["T"])
+def recompute_w_u_fwd_kernel(
+    k,
+    v,
+    beta,
+    w,
+    u,
+    A,
+    g,
+    cu_seqlens,
+    chunk_indices,
+    T,
+    H: tl.constexpr,
+    Hg: tl.constexpr,
+    K: tl.constexpr,
+    V: tl.constexpr,
+    BT: tl.constexpr,
+    BK: tl.constexpr,
+    BV: tl.constexpr,
+    IS_VARLEN: tl.constexpr,
+):
     i_t, i_bh = tl.program_id(0), tl.program_id(1)
     i_b, i_h = i_bh // H, i_bh % H
     if IS_VARLEN:
-        i_n, i_t = tl.load(chunk_indices + i_t * 2).to(
-            tl.int32), tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32)
-        bos, eos = tl.load(cu_seqlens + i_n).to(
-            tl.int32), tl.load(cu_seqlens + i_n + 1).to(tl.int32)
+        i_n, i_t = (
+            tl.load(chunk_indices + i_t * 2).to(tl.int32),
+            tl.load(chunk_indices + i_t * 2 + 1).to(tl.int32),
+        )
+        bos, eos = (
+            tl.load(cu_seqlens + i_n).to(tl.int32),
+            tl.load(cu_seqlens + i_n + 1).to(tl.int32),
+        )
         T = eos - bos
     else:
         bos, eos = i_b * T, i_b * T + T
-    p_beta = tl.make_block_ptr(beta + bos * H + i_h, (T, ), (H, ),
-                               (i_t * BT, ), (BT, ), (0, ))
-    p_g = tl.make_block_ptr(g + (bos * H + i_h), (T, ), (H, ), (i_t * BT, ),
-                            (BT, ), (0, ))
-    p_A = tl.make_block_ptr(A + (bos * H + i_h) * BT, (T, BT), (H * BT, 1),
-                            (i_t * BT, 0), (BT, BT), (1, 0))
-    b_beta = tl.load(p_beta, boundary_check=(0, ))
+    p_beta = tl.make_block_ptr(
+        beta + bos * H + i_h, (T,), (H,), (i_t * BT,), (BT,), (0,)
+    )
+    p_g = tl.make_block_ptr(g + (bos * H + i_h), (T,), (H,), (i_t * BT,), (BT,), (0,))
+    p_A = tl.make_block_ptr(
+        A + (bos * H + i_h) * BT, (T, BT), (H * BT, 1), (i_t * BT, 0), (BT, BT), (1, 0)
+    )
+    b_beta = tl.load(p_beta, boundary_check=(0,))
     b_A = tl.load(p_A, boundary_check=(0, 1))
-    b_g = tl.exp(tl.load(p_g, boundary_check=(0, )))
+    b_g = tl.exp(tl.load(p_g, boundary_check=(0,)))
 
     for i_v in range(tl.cdiv(V, BV)):
-        p_v = tl.make_block_ptr(v + (bos * H + i_h) * V, (T, V), (H * V, 1),
-                                (i_t * BT, i_v * BV), (BT, BV), (1, 0))
-        p_u = tl.make_block_ptr(u + (bos * H + i_h) * V, (T, V), (H * V, 1),
-                                (i_t * BT, i_v * BV), (BT, BV), (1, 0))
+        p_v = tl.make_block_ptr(
+            v + (bos * H + i_h) * V,
+            (T, V),
+            (H * V, 1),
+            (i_t * BT, i_v * BV),
+            (BT, BV),
+            (1, 0),
+        )
+        p_u = tl.make_block_ptr(
+            u + (bos * H + i_h) * V,
+            (T, V),
+            (H * V, 1),
+            (i_t * BT, i_v * BV),
+            (BT, BV),
+            (1, 0),
+        )
         b_v = tl.load(p_v, boundary_check=(0, 1))
         b_vb = (b_v * b_beta[:, None]).to(b_v.dtype)
         b_u = tl.dot(b_A, b_vb, allow_tf32=False)
         tl.store(p_u, b_u.to(p_u.dtype.element_ty), boundary_check=(0, 1))
 
     for i_k in range(tl.cdiv(K, BK)):
-        p_k = tl.make_block_ptr(k + (bos * Hg + i_h // (H // Hg)) * K, (T, K),
-                                (Hg * K, 1), (i_t * BT, i_k * BK), (BT, BK),
-                                (1, 0))
-        p_w = tl.make_block_ptr(w + (bos * H + i_h) * K, (T, K), (H * K, 1),
-                                (i_t * BT, i_k * BK), (BT, BK), (1, 0))
+        p_k = tl.make_block_ptr(
+            k + (bos * Hg + i_h // (H // Hg)) * K,
+            (T, K),
+            (Hg * K, 1),
+            (i_t * BT, i_k * BK),
+            (BT, BK),
+            (1, 0),
+        )
+        p_w = tl.make_block_ptr(
+            w + (bos * H + i_h) * K,
+            (T, K),
+            (H * K, 1),
+            (i_t * BT, i_k * BK),
+            (BT, BK),
+            (1, 0),
+        )
         b_k = tl.load(p_k, boundary_check=(0, 1))
         b_kb = (b_k * b_beta[:, None] * b_g[:, None]).to(b_k.dtype)
         b_w = tl.dot(b_A, b_kb)
@@ -85,8 +129,9 @@ def recompute_w_u_fwd(
     H = v.shape[-2]
     BT = A.shape[-1]
 
-    chunk_indices = prepare_chunk_indices(
-        cu_seqlens, BT) if cu_seqlens is not None else None
+    chunk_indices = (
+        prepare_chunk_indices(cu_seqlens, BT) if cu_seqlens is not None else None
+    )
     NT = triton.cdiv(T, BT) if cu_seqlens is None else len(chunk_indices)
     BK = 64
     BV = 64
diff --git a/vllm/model_executor/layers/fused_moe/__init__.py b/vllm/model_executor/layers/fused_moe/__init__.py
index 75f56cd01a4e..56ffaf861ac7 100644
--- a/vllm/model_executor/layers/fused_moe/__init__.py
+++ b/vllm/model_executor/layers/fused_moe/__init__.py
@@ -6,10 +6,15 @@
 
 from vllm.model_executor.layers.fused_moe.config import FusedMoEConfig
 from vllm.model_executor.layers.fused_moe.layer import (
-    FusedMoE, FusedMoEMethodBase, FusedMoeWeightScaleSupported)
+    FusedMoE,
+    FusedMoEMethodBase,
+    FusedMoeWeightScaleSupported,
+)
 from vllm.model_executor.layers.fused_moe.modular_kernel import (
-    FusedMoEActivationFormat, FusedMoEPermuteExpertsUnpermute,
-    FusedMoEPrepareAndFinalize)
+    FusedMoEActivationFormat,
+    FusedMoEPermuteExpertsUnpermute,
+    FusedMoEPrepareAndFinalize,
+)
 from vllm.model_executor.layers.fused_moe.utils import activation_without_mul
 from vllm.triton_utils import HAS_TRITON
 
@@ -46,21 +51,31 @@ def get_config() -> Optional[dict[str, Any]]:
     # import to register the custom ops
     import vllm.model_executor.layers.fused_moe.fused_marlin_moe  # noqa
     from vllm.model_executor.layers.fused_moe.batched_deep_gemm_moe import (
-        BatchedDeepGemmExperts)
+        BatchedDeepGemmExperts,
+    )
     from vllm.model_executor.layers.fused_moe.batched_triton_or_deep_gemm_moe import (  # noqa: E501
-        BatchedTritonOrDeepGemmExperts)
+        BatchedTritonOrDeepGemmExperts,
+    )
     from vllm.model_executor.layers.fused_moe.cutlass_moe import (
-        CutlassBatchedExpertsFp8, CutlassExpertsFp8, cutlass_moe_fp4,
-        cutlass_moe_fp8)
-    from vllm.model_executor.layers.fused_moe.deep_gemm_moe import (
-        DeepGemmExperts)
+        CutlassBatchedExpertsFp8,
+        CutlassExpertsFp8,
+        cutlass_moe_fp4,
+        cutlass_moe_fp8,
+    )
+    from vllm.model_executor.layers.fused_moe.deep_gemm_moe import DeepGemmExperts
     from vllm.model_executor.layers.fused_moe.fused_batched_moe import (
-        BatchedTritonExperts)
+        BatchedTritonExperts,
+    )
     from vllm.model_executor.layers.fused_moe.fused_moe import (
-        TritonExperts, fused_experts, fused_topk, get_config_file_name,
-        grouped_topk)
+        TritonExperts,
+        fused_experts,
+        fused_topk,
+        get_config_file_name,
+        grouped_topk,
+    )
     from vllm.model_executor.layers.fused_moe.triton_deep_gemm_moe import (
-        TritonOrDeepGemmExperts)
+        TritonOrDeepGemmExperts,
+    )
 
     __all__ += [
         "fused_topk",
@@ -82,8 +97,7 @@ def get_config() -> Optional[dict[str, Any]]:
     # Some model classes directly use the custom ops. Add placeholders
     # to avoid import errors.
     def _raise_exception(method: str):
-        raise NotImplementedError(
-            f"{method} is not implemented as lack of triton.")
+        raise NotImplementedError(f"{method} is not implemented as lack of triton.")
 
     fused_topk = lambda *args, **kwargs: _raise_exception("fused_topk")
     fused_experts = lambda *args, **kwargs: _raise_exception("fused_experts")
diff --git a/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py b/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py
index 2017a01475b2..f30ebec76c67 100644
--- a/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py
+++ b/vllm/model_executor/layers/fused_moe/batched_deep_gemm_moe.py
@@ -8,15 +8,14 @@
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
-from vllm.model_executor.layers.fused_moe.deep_gemm_utils import (
-    deep_gemm_block_shape)
+from vllm.model_executor.layers.fused_moe.deep_gemm_utils import deep_gemm_block_shape
 from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
-    TopKWeightAndReduceDelegate)
+    TopKWeightAndReduceDelegate,
+)
 from vllm.model_executor.layers.fused_moe.utils import _resize_cache
 from vllm.platforms import current_platform
 from vllm.triton_utils import tl, triton
-from vllm.utils.deep_gemm import (fp8_m_grouped_gemm_nt_masked,
-                                  is_deep_gemm_e8m0_used)
+from vllm.utils.deep_gemm import fp8_m_grouped_gemm_nt_masked, is_deep_gemm_e8m0_used
 
 logger = init_logger(__name__)
 
@@ -73,17 +72,14 @@ def _silu_mul_fp8_quant_deep_gemm(
     base_input_offset = e * stride_i_e + g * GROUP_SIZE * stride_i_h
     base_gate_offset = base_input_offset + cols * stride_i_h
     base_up_offset = base_input_offset + H * stride_i_h + cols * stride_i_h
-    base_yq_offset = (e * stride_yq_e + g * GROUP_SIZE * stride_yq_h +
-                      cols * stride_yq_h)
+    base_yq_offset = e * stride_yq_e + g * GROUP_SIZE * stride_yq_h + cols * stride_yq_h
     base_ys_offset = e * stride_ys_e + g * stride_ys_g
 
     for t in tl.range(0, n_tokens, num_stages=NUM_STAGES):
-        gate = tl.load(input_ptr + base_gate_offset + t * stride_i_t,
-                       mask=mask,
-                       other=0.0).to(tl.float32)
-        up = tl.load(input_ptr + base_up_offset + t * stride_i_t,
-                     mask=mask,
-                     other=0.0)
+        gate = tl.load(
+            input_ptr + base_gate_offset + t * stride_i_t, mask=mask, other=0.0
+        ).to(tl.float32)
+        up = tl.load(input_ptr + base_up_offset + t * stride_i_t, mask=mask, other=0.0)
 
         gate = gate * (1.0 / (1.0 + tl.exp(-gate)))
         y = gate * up
@@ -120,8 +116,7 @@ def silu_mul_fp8_quant_deep_gemm_cuda(
     assert group_size == 128, "H must be divisible by 8"
     assert tokens_per_expert.ndim == 1 and tokens_per_expert.shape[0] == E
 
-    tokens_per_expert = tokens_per_expert.to(device=y.device,
-                                             dtype=torch.int32)
+    tokens_per_expert = tokens_per_expert.to(device=y.device, dtype=torch.int32)
 
     fp8_dtype = torch.float8_e4m3fn
     y_q = torch.empty((E, T, H), dtype=fp8_dtype, device=y.device)
@@ -129,10 +124,12 @@ def silu_mul_fp8_quant_deep_gemm_cuda(
     stride_ys_e = T * G
     stride_ys_t = 1
     stride_ys_g = T
-    y_s = torch.empty_strided((E, T, G),
-                              (stride_ys_e, stride_ys_t, stride_ys_g),
-                              dtype=torch.float32,
-                              device=y.device)
+    y_s = torch.empty_strided(
+        (E, T, G),
+        (stride_ys_e, stride_ys_t, stride_ys_g),
+        dtype=torch.float32,
+        device=y.device,
+    )
 
     use_ue8m0 = is_deep_gemm_e8m0_used()
 
@@ -146,17 +143,16 @@ def silu_mul_fp8_quant_deep_gemm_cuda(
     # We never want to launch more than Tx number of threads
     # This computes the clip.
     num_parallel_tokens = max(
-        1,
-        min(max_empirical_parallelism, 2**int(log2(min(num_parallel_tokens,
-                                                       T)))))
+        1, min(max_empirical_parallelism, 2 ** int(log2(min(num_parallel_tokens, T))))
+    )
     cuda_arch = current_platform.get_device_capability(
-        device_id=y.device.index).to_int()
+        device_id=y.device.index
+    ).to_int()
 
     if cuda_arch >= 80:
-        torch.ops._C.silu_mul_fp8_quant_deep_gemm_cuda(y, tokens_per_expert,
-                                                       y_q, y_s, group_size,
-                                                       use_ue8m0,
-                                                       num_parallel_tokens)
+        torch.ops._C.silu_mul_fp8_quant_deep_gemm_cuda(
+            y, tokens_per_expert, y_q, y_s, group_size, use_ue8m0, num_parallel_tokens
+        )
     else:
         # Default to triton if not on cuda or if arch is too old
         y_q = torch.empty((E, T, H), dtype=fp8_dtype, device=y.device)
@@ -165,7 +161,7 @@ def silu_mul_fp8_quant_deep_gemm_cuda(
 
         # Static grid over experts and H-groups.
         # A loop inside the kernel handles the token dim
-        grid = (E * G, )
+        grid = (E * G,)
         # strides (elements)
         stride_i_e, stride_i_t, stride_i_h = y.stride()
         stride_yq_e, stride_yq_t, stride_yq_h = y_q.stride()
@@ -214,7 +210,6 @@ def silu_mul_fp8_quant_deep_gemm_cuda(
 
 
 class BatchedDeepGemmExperts(mk.FusedMoEPermuteExpertsUnpermute):
-
     def __init__(
         self,
         max_num_tokens: int,
@@ -233,10 +228,12 @@ def __init__(
 
     @property
     def activation_formats(
-        self
+        self,
     ) -> tuple[mk.FusedMoEActivationFormat, mk.FusedMoEActivationFormat]:
-        return (mk.FusedMoEActivationFormat.BatchedExperts,
-                mk.FusedMoEActivationFormat.BatchedExperts)
+        return (
+            mk.FusedMoEActivationFormat.BatchedExperts,
+            mk.FusedMoEActivationFormat.BatchedExperts,
+        )
 
     def supports_chunking(self) -> bool:
         return False
@@ -266,10 +263,10 @@ def workspace_shapes(
         # end up sending their tokens. This needs to be fixed.
         num_dispatchers = self.num_dispatchers
         num_experts = local_num_experts
-        max_num_tokens = a.size(
-            0) if self.max_num_tokens is None else self.max_num_tokens
-        workspace13 = (num_experts, max_num_tokens * num_dispatchers,
-                       max(K, N))
+        max_num_tokens = (
+            a.size(0) if self.max_num_tokens is None else self.max_num_tokens
+        )
+        workspace13 = (num_experts, max_num_tokens * num_dispatchers, max(K, N))
         workspace2 = (num_experts, max_num_tokens * num_dispatchers, (N // 2))
         output = (num_experts, max_num_tokens * num_dispatchers, K)
         return (workspace13, workspace2, output, a.dtype)
@@ -304,7 +301,8 @@ def apply(
         assert w2.size(1) == K
 
         E, max_num_tokens, N, K, top_k_num = self.moe_problem_size(
-            hidden_states, w1, w2, topk_ids)
+            hidden_states, w1, w2, topk_ids
+        )
 
         workspace1 = _resize_cache(workspace13, (E, max_num_tokens, N))
 
@@ -312,11 +310,18 @@ def apply(
         # for the M expectation of each batch, correctly setting this value
         # may lead to better performance.
         expected_m = max_num_tokens
-        fp8_m_grouped_gemm_nt_masked((a1q, a1q_scale), (w1, self.w1_scale),
-                                     workspace1, expert_num_tokens, expected_m)
+        fp8_m_grouped_gemm_nt_masked(
+            (a1q, a1q_scale),
+            (w1, self.w1_scale),
+            workspace1,
+            expert_num_tokens,
+            expected_m,
+        )
 
         a2q, a2q_scale = silu_mul_fp8_quant_deep_gemm_cuda(
-            workspace1, expert_num_tokens)
+            workspace1, expert_num_tokens
+        )
 
-        fp8_m_grouped_gemm_nt_masked((a2q, a2q_scale), (w2, self.w2_scale),
-                                     output, expert_num_tokens, expected_m)
+        fp8_m_grouped_gemm_nt_masked(
+            (a2q, a2q_scale), (w2, self.w2_scale), output, expert_num_tokens, expected_m
+        )
diff --git a/vllm/model_executor/layers/fused_moe/batched_triton_or_deep_gemm_moe.py b/vllm/model_executor/layers/fused_moe/batched_triton_or_deep_gemm_moe.py
index c3c4f4a5d190..d268f70477f4 100644
--- a/vllm/model_executor/layers/fused_moe/batched_triton_or_deep_gemm_moe.py
+++ b/vllm/model_executor/layers/fused_moe/batched_triton_or_deep_gemm_moe.py
@@ -6,16 +6,14 @@
 
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm.model_executor.layers.fused_moe.batched_deep_gemm_moe import (
-    BatchedDeepGemmExperts)
+    BatchedDeepGemmExperts,
+)
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
-from vllm.model_executor.layers.fused_moe.deep_gemm_utils import (
-    deep_gemm_block_shape)
-from vllm.model_executor.layers.fused_moe.fused_batched_moe import (
-    BatchedTritonExperts)
+from vllm.model_executor.layers.fused_moe.deep_gemm_utils import deep_gemm_block_shape
+from vllm.model_executor.layers.fused_moe.fused_batched_moe import BatchedTritonExperts
 
 
 class BatchedTritonOrDeepGemmExperts(mk.FusedMoEPermuteExpertsUnpermute):
-
     def __init__(
         self,
         max_num_tokens: int,
@@ -31,27 +29,37 @@ def __init__(
             quant_config=self.quant_config,
         )
 
-        self.allow_deep_gemm = (allow_deep_gemm
-                                and self.quant_config.use_fp8_w8a8 and
-                                self.block_shape == deep_gemm_block_shape())
+        self.allow_deep_gemm = (
+            allow_deep_gemm
+            and self.quant_config.use_fp8_w8a8
+            and self.block_shape == deep_gemm_block_shape()
+        )
 
-        self.batched_deep_gemm_experts = BatchedDeepGemmExperts(
-            max_num_tokens=max_num_tokens,
-            num_dispatchers=num_dispatchers,
-            quant_config=self.quant_config,
-        ) if self.allow_deep_gemm else None
+        self.batched_deep_gemm_experts = (
+            BatchedDeepGemmExperts(
+                max_num_tokens=max_num_tokens,
+                num_dispatchers=num_dispatchers,
+                quant_config=self.quant_config,
+            )
+            if self.allow_deep_gemm
+            else None
+        )
 
-        assert (self.batched_deep_gemm_experts is not None
-                or self.batched_triton_experts is not None)
+        assert (
+            self.batched_deep_gemm_experts is not None
+            or self.batched_triton_experts is not None
+        )
 
     @property
     def activation_formats(
-        self
+        self,
     ) -> tuple[mk.FusedMoEActivationFormat, mk.FusedMoEActivationFormat]:
         if self.batched_triton_experts is not None:
-            assert (self.batched_deep_gemm_experts is None
-                    or self.batched_deep_gemm_experts.activation_formats
-                    == self.batched_triton_experts.activation_formats)
+            assert (
+                self.batched_deep_gemm_experts is None
+                or self.batched_deep_gemm_experts.activation_formats
+                == self.batched_triton_experts.activation_formats
+            )
             return self.batched_triton_experts.activation_formats
         else:
             assert self.batched_deep_gemm_experts is not None
@@ -60,14 +68,16 @@ def activation_formats(
     def supports_chunking(self) -> bool:
         bdge = self.batched_deep_gemm_experts
         bte = self.batched_triton_experts
-        return ((bdge is None or bdge.supports_chunking())
-                and (bte is None or bte.supports_chunking()))
+        return (bdge is None or bdge.supports_chunking()) and (
+            bte is None or bte.supports_chunking()
+        )
 
     def supports_expert_map(self) -> bool:
         bdge = self.batched_deep_gemm_experts
         bte = self.batched_triton_experts
-        return ((bdge is None or bdge.supports_expert_map())
-                and (bte is None or bte.supports_expert_map()))
+        return (bdge is None or bdge.supports_expert_map()) and (
+            bte is None or bte.supports_expert_map()
+        )
 
     def finalize_weight_and_reduce_impl(self) -> mk.TopKWeightAndReduce:
         bdge = self.batched_deep_gemm_experts
@@ -80,7 +90,8 @@ def finalize_weight_and_reduce_impl(self) -> mk.TopKWeightAndReduce:
         if is_bdge_war and is_bte_war:
             assert bdge_war == bte_war, (
                 "Both implementations should agree on WeightAndReduce impls. "
-                f"Got bdge_war: {bdge_war}, and bte_war: {bte_war}")
+                f"Got bdge_war: {bdge_war}, and bte_war: {bte_war}"
+            )
 
         if bdge_war is not None:
             return bdge_war
@@ -106,13 +117,29 @@ def workspace_shapes(
         if self.allow_deep_gemm:
             assert self.batched_deep_gemm_experts is not None
             return self.batched_deep_gemm_experts.workspace_shapes(
-                a, aq, M, N, K, topk, global_num_experts, local_num_experts,
-                expert_tokens_metadata)
+                a,
+                aq,
+                M,
+                N,
+                K,
+                topk,
+                global_num_experts,
+                local_num_experts,
+                expert_tokens_metadata,
+            )
         else:
             assert self.batched_triton_experts is not None
             return self.batched_triton_experts.workspace_shapes(
-                a, aq, M, N, K, topk, global_num_experts, local_num_experts,
-                expert_tokens_metadata)
+                a,
+                aq,
+                M,
+                N,
+                K,
+                topk,
+                global_num_experts,
+                local_num_experts,
+                expert_tokens_metadata,
+            )
 
     def apply(
         self,
@@ -132,10 +159,26 @@ def apply(
         expert_tokens_meta: Optional[mk.ExpertTokensMetadata],
         apply_router_weight_on_input: bool,
     ):
-        experts = (self.batched_deep_gemm_experts
-                   if self.allow_deep_gemm else self.batched_triton_experts)
+        experts = (
+            self.batched_deep_gemm_experts
+            if self.allow_deep_gemm
+            else self.batched_triton_experts
+        )
         assert experts is not None
-        experts.apply(output, hidden_states, w1, w2, topk_weights, topk_ids,
-                      activation, global_num_experts, expert_map, a1q_scale,
-                      a2_scale, workspace13, workspace2, expert_tokens_meta,
-                      apply_router_weight_on_input)
+        experts.apply(
+            output,
+            hidden_states,
+            w1,
+            w2,
+            topk_weights,
+            topk_ids,
+            activation,
+            global_num_experts,
+            expert_map,
+            a1q_scale,
+            a2_scale,
+            workspace13,
+            workspace2,
+            expert_tokens_meta,
+            apply_router_weight_on_input,
+        )
diff --git a/vllm/model_executor/layers/fused_moe/config.py b/vllm/model_executor/layers/fused_moe/config.py
index 34bfe1c16aac..ae2fad1cd0d7 100644
--- a/vllm/model_executor/layers/fused_moe/config.py
+++ b/vllm/model_executor/layers/fused_moe/config.py
@@ -9,8 +9,7 @@
 from vllm.config import ParallelConfig
 from vllm.distributed import get_dp_group, get_tensor_model_parallel_rank
 from vllm.logger import init_logger
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape)
+from vllm.model_executor.layers.quantization.utils.quant_utils import GroupShape
 from vllm.utils import cdiv, has_triton_kernels
 from vllm.utils.flashinfer import has_flashinfer_cutlass_fused_moe
 
@@ -22,7 +21,8 @@
     except ImportError:
         logger.error(
             "Failed to import Triton kernels. Please make sure your triton "
-            "version is compatible.")
+            "version is compatible."
+        )
 
 
 def _get_config_dtype_str(
@@ -163,8 +163,9 @@ class FusedMoEQuantConfig:
     _w2: FusedMoEQuantDesc
 
     def __post_init__(self):
-        assert (not self.per_act_token_quant
-                or self.block_shape is None), "illegal quantization"
+        assert not self.per_act_token_quant or self.block_shape is None, (
+            "illegal quantization"
+        )
 
     #
     # Convenience accessors for various properties.
@@ -196,9 +197,11 @@ def is_per_tensor(self) -> bool:
 
     @property
     def block_shape(self) -> Optional[list[int]]:
-        if (self._a1.shape is not None
-                and self._a1.shape != GroupShape.PER_TENSOR
-                and self._a1.shape != GroupShape.PER_TOKEN):
+        if (
+            self._a1.shape is not None
+            and self._a1.shape != GroupShape.PER_TENSOR
+            and self._a1.shape != GroupShape.PER_TOKEN
+        ):
             return [self._a1.shape.row, self._a1.shape.col]
         else:
             return None
@@ -209,8 +212,7 @@ def is_block_quantized(self) -> bool:
 
     @property
     def a1_scale(self) -> Optional[torch.Tensor]:
-        assert self._a1.scale is None or isinstance(self._a1.scale,
-                                                    torch.Tensor)
+        assert self._a1.scale is None or isinstance(self._a1.scale, torch.Tensor)
         return self._a1.scale
 
     @property
@@ -219,8 +221,7 @@ def a1_gscale(self) -> Optional[torch.Tensor]:
 
     @property
     def a2_scale(self) -> Optional[torch.Tensor]:
-        assert self._a2.scale is None or isinstance(self._a2.scale,
-                                                    torch.Tensor)
+        assert self._a2.scale is None or isinstance(self._a2.scale, torch.Tensor)
         return self._a2.scale
 
     @property
@@ -229,8 +230,7 @@ def a2_gscale(self) -> Optional[torch.Tensor]:
 
     @property
     def w1_scale(self) -> Optional[torch.Tensor]:
-        assert self._w1.scale is None or isinstance(self._w1.scale,
-                                                    torch.Tensor)
+        assert self._w1.scale is None or isinstance(self._w1.scale, torch.Tensor)
         return self._w1.scale
 
     @property
@@ -243,8 +243,7 @@ def w1_bias(self) -> Optional[torch.Tensor]:
 
     @property
     def w1_precision(self) -> Optional["PrecisionConfig"]:
-        assert self._w1.scale is None or isinstance(self._w1.scale,
-                                                    PrecisionConfig)
+        assert self._w1.scale is None or isinstance(self._w1.scale, PrecisionConfig)
         return self._w1.scale
 
     @property
@@ -253,8 +252,7 @@ def g1_alphas(self) -> Optional[torch.Tensor]:
 
     @property
     def w2_scale(self) -> Optional[torch.Tensor]:
-        assert self._w2.scale is None or isinstance(self._w2.scale,
-                                                    torch.Tensor)
+        assert self._w2.scale is None or isinstance(self._w2.scale, torch.Tensor)
         return self._w2.scale
 
     @property
@@ -267,8 +265,7 @@ def w2_bias(self) -> Optional[torch.Tensor]:
 
     @property
     def w2_precision(self) -> Optional["PrecisionConfig"]:
-        assert self._w2.scale is None or isinstance(self._w2.scale,
-                                                    PrecisionConfig)
+        assert self._w2.scale is None or isinstance(self._w2.scale, PrecisionConfig)
         return self._w2.scale
 
     @property
@@ -285,19 +282,19 @@ def use_int8_w8a8(self) -> bool:
 
     @property
     def use_int8_w8a16(self) -> bool:
-        return (self._a1.dtype is None and self._w1.dtype == torch.int8)
+        return self._a1.dtype is None and self._w1.dtype == torch.int8
 
     @property
     def use_int4_w4a16(self) -> bool:
-        return (self._a1.dtype is None and self._w1.dtype == "int4")
+        return self._a1.dtype is None and self._w1.dtype == "int4"
 
     @property
     def use_mxfp4_w4a4(self) -> bool:
-        return (self._a1.dtype == "mxfp4" and self._w1.dtype == "mxfp4")
+        return self._a1.dtype == "mxfp4" and self._w1.dtype == "mxfp4"
 
     @property
     def use_mxfp4_w4a16(self) -> bool:
-        return (self._a1.dtype is None and self._w1.dtype == "mxfp4")
+        return self._a1.dtype is None and self._w1.dtype == "mxfp4"
 
     @property
     def use_nvfp4_w4a4(self) -> bool:
@@ -398,19 +395,23 @@ def make(
         - w1_zp: Optional w1 zero points for int4/int8 quantization.
         - w2_zp: Optional w2 zero points for int4/int8 quantization.
         """
-        assert (not isinstance(quant_dtype, str) or quant_dtype == "nvfp4"
-                or quant_dtype == "mxfp4")
-        a_shape, w_shape = _quant_flags_to_group_shape(quant_dtype,
-                                                       per_act_token_quant,
-                                                       per_out_ch_quant,
-                                                       block_shape)
+        assert (
+            not isinstance(quant_dtype, str)
+            or quant_dtype == "nvfp4"
+            or quant_dtype == "mxfp4"
+        )
+        a_shape, w_shape = _quant_flags_to_group_shape(
+            quant_dtype, per_act_token_quant, per_out_ch_quant, block_shape
+        )
         quant_config = FusedMoEQuantConfig(
             _a1=FusedMoEQuantDesc(quant_dtype, a_shape, a1_scale, a1_gscale),
             _a2=FusedMoEQuantDesc(quant_dtype, a_shape, a2_scale, a2_gscale),
-            _w1=FusedMoEQuantDesc(quant_dtype, w_shape, w1_scale, g1_alphas,
-                                  w1_zp, w1_bias),
-            _w2=FusedMoEQuantDesc(quant_dtype, w_shape, w2_scale, g2_alphas,
-                                  w2_zp, w2_bias),
+            _w1=FusedMoEQuantDesc(
+                quant_dtype, w_shape, w1_scale, g1_alphas, w1_zp, w1_bias
+            ),
+            _w2=FusedMoEQuantDesc(
+                quant_dtype, w_shape, w2_scale, g2_alphas, w2_zp, w2_bias
+            ),
         )
         assert quant_config.per_act_token_quant == per_act_token_quant
         assert quant_config.per_out_ch_quant == per_out_ch_quant
@@ -430,14 +431,16 @@ def fp8_w8a8_moe_quant_config(
     """
     Construct a quant config for fp8 activations and fp8 weights.
     """
-    return FusedMoEQuantConfig.make(torch.float8_e4m3fn,
-                                    w1_scale=w1_scale,
-                                    w2_scale=w2_scale,
-                                    a1_scale=a1_scale,
-                                    a2_scale=a2_scale,
-                                    per_act_token_quant=per_act_token_quant,
-                                    per_out_ch_quant=per_out_ch_quant,
-                                    block_shape=block_shape)
+    return FusedMoEQuantConfig.make(
+        torch.float8_e4m3fn,
+        w1_scale=w1_scale,
+        w2_scale=w2_scale,
+        a1_scale=a1_scale,
+        a2_scale=a2_scale,
+        per_act_token_quant=per_act_token_quant,
+        per_out_ch_quant=per_out_ch_quant,
+        block_shape=block_shape,
+    )
 
 
 def int8_w8a8_moe_quant_config(
@@ -463,10 +466,11 @@ def int8_w8a8_moe_quant_config(
 
 
 def mxfp4_w4a16_moe_quant_config(
-        w1_scale: Union[torch.Tensor, "PrecisionConfig"],
-        w2_scale: Union[torch.Tensor, "PrecisionConfig"],
-        w1_bias: Optional[torch.Tensor] = None,
-        w2_bias: Optional[torch.Tensor] = None) -> FusedMoEQuantConfig:
+    w1_scale: Union[torch.Tensor, "PrecisionConfig"],
+    w2_scale: Union[torch.Tensor, "PrecisionConfig"],
+    w1_bias: Optional[torch.Tensor] = None,
+    w2_bias: Optional[torch.Tensor] = None,
+) -> FusedMoEQuantConfig:
     """
     Construct a quant config for unquantized activations and mxfp4 weights.
     """
@@ -605,22 +609,26 @@ def use_all2all_kernels(self):
 
     @property
     def use_pplx_kernels(self):
-        return (self.use_all2all_kernels
-                and envs.VLLM_ALL2ALL_BACKEND == "pplx")
+        return self.use_all2all_kernels and envs.VLLM_ALL2ALL_BACKEND == "pplx"
 
     @property
     def use_deepep_ht_kernels(self):
-        return (self.use_all2all_kernels
-                and envs.VLLM_ALL2ALL_BACKEND == "deepep_high_throughput")
+        return (
+            self.use_all2all_kernels
+            and envs.VLLM_ALL2ALL_BACKEND == "deepep_high_throughput"
+        )
 
     @property
     def use_deepep_ll_kernels(self):
-        return (self.use_all2all_kernels
-                and envs.VLLM_ALL2ALL_BACKEND == "deepep_low_latency")
+        return (
+            self.use_all2all_kernels
+            and envs.VLLM_ALL2ALL_BACKEND == "deepep_low_latency"
+        )
 
     @staticmethod
-    def make(tp_size_: int, dp_size_: int,
-             vllm_parallel_config: ParallelConfig) -> "FusedMoEParallelConfig":
+    def make(
+        tp_size_: int, dp_size_: int, vllm_parallel_config: ParallelConfig
+    ) -> "FusedMoEParallelConfig":
         """
         Determine MoE parallel configuration. Based on the input `tp_size_`,
         `dp_size_` and vllm's parallel config, determine what
@@ -700,34 +708,37 @@ def flatten_tp_across_dp(dp_rank: int):
             tp_rank = dp_rank * tp_size_ + tp_rank
             return tp_size, tp_rank
 
-        use_ep = (dp_size_ * tp_size_ > 1
-                  and vllm_parallel_config.enable_expert_parallel)
+        use_ep = dp_size_ * tp_size_ > 1 and vllm_parallel_config.enable_expert_parallel
 
         dp_size = dp_size_
         dp_rank = get_dp_group().rank_in_group if dp_size > 1 else 0
         tp_size, tp_rank = flatten_tp_across_dp(dp_rank)
 
         if not use_ep:
-            return FusedMoEParallelConfig(tp_size=tp_size,
-                                          tp_rank=tp_rank,
-                                          dp_size=dp_size,
-                                          dp_rank=dp_rank,
-                                          ep_size=1,
-                                          ep_rank=0,
-                                          use_ep=False)
+            return FusedMoEParallelConfig(
+                tp_size=tp_size,
+                tp_rank=tp_rank,
+                dp_size=dp_size,
+                dp_rank=dp_rank,
+                ep_size=1,
+                ep_rank=0,
+                use_ep=False,
+            )
         # DP + EP / TP + EP / DP + TP + EP
         assert use_ep
         # In EP, each device owns a set of experts fully. There is no tensor
         # parallel update tp_size, tp_rank, ep_size and ep_rank to reflect that.
         ep_size = tp_size
         ep_rank = tp_rank
-        return FusedMoEParallelConfig(tp_size=1,
-                                      tp_rank=0,
-                                      dp_size=dp_size,
-                                      dp_rank=dp_rank,
-                                      ep_size=ep_size,
-                                      ep_rank=ep_rank,
-                                      use_ep=True)
+        return FusedMoEParallelConfig(
+            tp_size=1,
+            tp_rank=0,
+            dp_size=dp_size,
+            dp_rank=dp_rank,
+            ep_size=ep_size,
+            ep_rank=ep_rank,
+            use_ep=True,
+        )
 
 
 # Adapted from pplx-kernels tests/all_to_all_utils.py
@@ -749,8 +760,9 @@ class FusedMoEConfig:
 
     def __post_init__(self):
         if self.dp_size > 1:
-            logger.debug_once("Using FusedMoEConfig::max_num_tokens=%d",
-                              self.max_num_tokens)
+            logger.debug_once(
+                "Using FusedMoEConfig::max_num_tokens=%d", self.max_num_tokens
+            )
 
         assert self.max_num_tokens > 0
 
@@ -799,6 +811,8 @@ def use_flashinfer_cutlass_kernels(self):
         """
         Whether to use FlashInfer cutlass kernels for NVFP4 MoE.
         """
-        return (envs.VLLM_USE_FLASHINFER_MOE_FP4
-                and has_flashinfer_cutlass_fused_moe()
-                and envs.VLLM_FLASHINFER_MOE_BACKEND == "throughput")
+        return (
+            envs.VLLM_USE_FLASHINFER_MOE_FP4
+            and has_flashinfer_cutlass_fused_moe()
+            and envs.VLLM_FLASHINFER_MOE_BACKEND == "throughput"
+        )
diff --git a/vllm/model_executor/layers/fused_moe/cpu_fused_moe.py b/vllm/model_executor/layers/fused_moe/cpu_fused_moe.py
index 114f349538fb..b62817d0115f 100644
--- a/vllm/model_executor/layers/fused_moe/cpu_fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/cpu_fused_moe.py
@@ -22,10 +22,9 @@ def grouped_topk(
     topk_group: int = 0,
     scoring_func: str = "softmax",
     routed_scaling_factor: float = 1.0,
-    e_score_correction_bias: Optional[torch.Tensor] = None
+    e_score_correction_bias: Optional[torch.Tensor] = None,
 ) -> tuple[torch.Tensor, torch.Tensor]:
-    assert hidden_states.shape[0] == gating_output.shape[0], (
-        "Number of tokens mismatch")
+    assert hidden_states.shape[0] == gating_output.shape[0], "Number of tokens mismatch"
 
     gating_output = gating_output.float()
     if scoring_func == "softmax":
@@ -39,29 +38,30 @@ def grouped_topk(
     if e_score_correction_bias is not None:
         original_scores = scores
         scores = scores + e_score_correction_bias.unsqueeze(0)
-        group_scores = (scores.view(num_token, num_expert_group,
-                                    -1).topk(2, dim=-1)[0].sum(dim=-1))
+        group_scores = (
+            scores.view(num_token, num_expert_group, -1).topk(2, dim=-1)[0].sum(dim=-1)
+        )
     else:
-        group_scores = scores.view(num_token, num_expert_group,
-                                   -1).max(dim=-1).values  # [n, n_group]
-    group_idx = torch.topk(group_scores, k=topk_group, dim=-1,
-                           sorted=False)[1]  # [n, top_k_group]
+        group_scores = (
+            scores.view(num_token, num_expert_group, -1).max(dim=-1).values
+        )  # [n, n_group]
+    group_idx = torch.topk(group_scores, k=topk_group, dim=-1, sorted=False)[
+        1
+    ]  # [n, top_k_group]
     group_mask = torch.zeros_like(group_scores)  # [n, n_group]
     group_mask.scatter_(1, group_idx, 1)  # [n, n_group]
-    score_mask = group_mask.unsqueeze(-1).expand(
-        num_token, num_expert_group,
-        scores.shape[-1] // num_expert_group).reshape(num_token, -1)  # [n, e]
-    tmp_scores = scores.masked_fill(~score_mask.bool(),
-                                    float("-inf"))  # [n, e]
+    score_mask = (
+        group_mask.unsqueeze(-1)
+        .expand(num_token, num_expert_group, scores.shape[-1] // num_expert_group)
+        .reshape(num_token, -1)
+    )  # [n, e]
+    tmp_scores = scores.masked_fill(~score_mask.bool(), float("-inf"))  # [n, e]
 
     if e_score_correction_bias is not None:
         topk_ids = torch.topk(tmp_scores, k=topk, dim=-1, sorted=False)[1]
         topk_weights = original_scores.gather(1, topk_ids)
     else:
-        topk_weights, topk_ids = torch.topk(tmp_scores,
-                                            k=topk,
-                                            dim=-1,
-                                            sorted=False)
+        topk_weights, topk_ids = torch.topk(tmp_scores, k=topk, dim=-1, sorted=False)
 
     if renormalize:
         topk_weights = topk_weights / topk_weights.sum(dim=-1, keepdim=True)
@@ -87,21 +87,22 @@ def select_experts(
     if use_grouped_topk:
         assert topk_group is not None
         assert num_expert_group is not None
-        return grouped_topk(hidden_states=hidden_states,
-                            gating_output=router_logits,
-                            topk=top_k,
-                            renormalize=renormalize,
-                            num_expert_group=num_expert_group,
-                            topk_group=topk_group,
-                            scoring_func=scoring_func,
-                            routed_scaling_factor=routed_scaling_factor,
-                            e_score_correction_bias=e_score_correction_bias)
+        return grouped_topk(
+            hidden_states=hidden_states,
+            gating_output=router_logits,
+            topk=top_k,
+            renormalize=renormalize,
+            num_expert_group=num_expert_group,
+            topk_group=topk_group,
+            scoring_func=scoring_func,
+            routed_scaling_factor=routed_scaling_factor,
+            e_score_correction_bias=e_score_correction_bias,
+        )
     elif custom_routing_function is None:
         assert scoring_func == "softmax"
-        topk_logit_vals, topk_idx = torch.topk(router_logits,
-                                               k=top_k,
-                                               dim=-1,
-                                               sorted=False)
+        topk_logit_vals, topk_idx = torch.topk(
+            router_logits, k=top_k, dim=-1, sorted=False
+        )
         if renormalize:
             topk_vals = torch.softmax(topk_logit_vals, dim=-1)
         else:
@@ -109,16 +110,18 @@ def select_experts(
             topk_vals = (topk_logit_vals - logZ).exp()
         return topk_vals.to(torch.float32), topk_idx.to(torch.int32)
     else:
-        return custom_routing_function(hidden_states=hidden_states,
-                                       gating_output=router_logits,
-                                       topk=top_k,
-                                       renormalize=renormalize)
+        return custom_routing_function(
+            hidden_states=hidden_states,
+            gating_output=router_logits,
+            topk=top_k,
+            renormalize=renormalize,
+        )
 
 
 class IPEXFusedMOE:
-
     def __init__(self, layer: torch.nn.Module) -> None:
         import intel_extension_for_pytorch as ipex
+
         layer.ipex_fusion = ipex.llm.modules.GatedMLPMOE(
             layer.w13_weight,
             layer.w2_weight,
@@ -146,8 +149,9 @@ def __call__(
     ) -> torch.Tensor:
         assert activation == "silu", f"{activation} is not supported."
         assert not apply_router_weight_on_input
-        assert routed_scaling_factor == 1.0, \
+        assert routed_scaling_factor == 1.0, (
             f"routed_scaling_factor {routed_scaling_factor} is not supported."
+        )
         return layer.ipex_fusion(
             x,
             use_grouped_topk,
@@ -163,7 +167,6 @@ def __call__(
 
 
 class SGLFusedMOE:
-
     def __init__(self, layer: torch.nn.Module) -> None:
         pass
 
@@ -222,7 +225,6 @@ def __call__(
 
 
 class CPUFusedMOE:
-
     def __init__(self, layer: torch.nn.Module) -> None:
         pass
 
@@ -289,12 +291,15 @@ def __call__(
             outputs.append(expert_out)
             start_idx = end_idx
 
-        outs = torch.cat(outputs,
-                         dim=0) if len(outputs) else sorted_tokens.new_empty(0)
+        outs = torch.cat(outputs, dim=0) if len(outputs) else sorted_tokens.new_empty(0)
         new_x = torch.empty_like(outs)
 
         new_x[idxs] = outs
-        final_out = (new_x.view(
-            *topk_ids.shape, -1).type(topk_weights.dtype).mul_(
-                topk_weights.unsqueeze(dim=-1)).sum(dim=1).type(new_x.dtype))
+        final_out = (
+            new_x.view(*topk_ids.shape, -1)
+            .type(topk_weights.dtype)
+            .mul_(topk_weights.unsqueeze(dim=-1))
+            .sum(dim=1)
+            .type(new_x.dtype)
+        )
         return final_out
diff --git a/vllm/model_executor/layers/fused_moe/cutlass_moe.py b/vllm/model_executor/layers/fused_moe/cutlass_moe.py
index 1578e4822765..d3fed9332958 100644
--- a/vllm/model_executor/layers/fused_moe/cutlass_moe.py
+++ b/vllm/model_executor/layers/fused_moe/cutlass_moe.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-""" CUTLASS based Fused MoE kernels."""
+"""CUTLASS based Fused MoE kernels."""
+
 from typing import Callable, Optional
 
 import torch
@@ -10,13 +11,17 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.fused_moe.moe_permute_unpermute import (
-    moe_permute, moe_unpermute)
+    moe_permute,
+    moe_unpermute,
+)
 from vllm.model_executor.layers.fused_moe.prepare_finalize import (
-    MoEPrepareAndFinalizeNoEP)
+    MoEPrepareAndFinalizeNoEP,
+)
 from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
-    TopKWeightAndReduceDelegate, TopKWeightAndReduceNoOP)
-from vllm.model_executor.layers.fused_moe.utils import (_fp8_quantize,
-                                                        _resize_cache)
+    TopKWeightAndReduceDelegate,
+    TopKWeightAndReduceNoOP,
+)
+from vllm.model_executor.layers.fused_moe.utils import _fp8_quantize, _resize_cache
 from vllm.scalar_type import scalar_types
 
 logger = init_logger(__name__)
@@ -56,20 +61,28 @@ def run_cutlass_moe_fp8(
     assert w2.dtype == torch.float8_e4m3fn
     assert a1q.size(-1) == w1.size(2), "Hidden size mismatch w1"
     assert w1.size(1) == w2.size(2) * 2, "Hidden size mismatch w2"
-    assert w1_scale.dim() == 1 or w1_scale.size(
-        1) == 1 or w1_scale.shape[1] == w1.size(1), "W1 scale shape mismatch"
-    assert w2_scale.dim() == 1 or w2_scale.size(
-        1) == 1 or w2_scale.shape[1] == w2.size(1), "W2 scale shape mismatch"
+    assert (
+        w1_scale.dim() == 1 or w1_scale.size(1) == 1 or w1_scale.shape[1] == w1.size(1)
+    ), "W1 scale shape mismatch"
+    assert (
+        w2_scale.dim() == 1 or w2_scale.size(1) == 1 or w2_scale.shape[1] == w2.size(1)
+    ), "W2 scale shape mismatch"
     assert w1.size(0) == w2.size(0), "Expert number mismatch"
-    assert a1q_scale is None or a1q_scale.dim() == 0 or a1q_scale.size(
-        0) == 1 or a1q_scale.size(
-            0) == a1q.shape[0], "Input scale shape mismatch"
+    assert (
+        a1q_scale is None
+        or a1q_scale.dim() == 0
+        or a1q_scale.size(0) == 1
+        or a1q_scale.size(0) == a1q.shape[0]
+    ), "Input scale shape mismatch"
     assert w1.size(0) == w2.size(0), "Weights expert number mismatch"
     assert w1.size(0) == w1_scale.size(0), "w1 scales expert number mismatch"
     assert w1.size(0) == w2_scale.size(0), "w2 scales expert number mismatch"
-    assert a2_scale is None or a2_scale.dim() == 0 or a2_scale.size(
-        0) == 1 or a2_scale.size(
-            0) == a1q.shape[0], "Intermediate scale shape mismatch"
+    assert (
+        a2_scale is None
+        or a2_scale.dim() == 0
+        or a2_scale.size(0) == 1
+        or a2_scale.size(0) == a1q.shape[0]
+    ), "Intermediate scale shape mismatch"
     assert out_dtype in [torch.half, torch.bfloat16], "Invalid output dtype"
     if expert_map is not None:
         assert expert_num_tokens is None
@@ -97,8 +110,9 @@ def run_cutlass_moe_fp8(
 
     if expert_map is not None:
         "Translate info from expert_map to topk_ids"
-        local_topk_ids = torch.where(expert_map[topk_ids] != -1,
-                                     expert_map[topk_ids], -1)
+        local_topk_ids = torch.where(
+            expert_map[topk_ids] != -1, expert_map[topk_ids], -1
+        )
     else:
         local_topk_ids = topk_ids
 
@@ -108,35 +122,39 @@ def run_cutlass_moe_fp8(
     if use_batched_format:
         mm1_out = _resize_cache(workspace13, (local_E * padded_M, N * 2))
         act_out = _resize_cache(workspace2, (local_E * padded_M, N))
-        quant_out = _resize_cache(workspace13.view(dtype=torch.float8_e4m3fn),
-                                  (local_E * padded_M, N))
+        quant_out = _resize_cache(
+            workspace13.view(dtype=torch.float8_e4m3fn), (local_E * padded_M, N)
+        )
         mm2_out = _resize_cache(workspace2, (local_E * padded_M, K))
     else:
-        a1q_perm = _resize_cache(workspace2.view(dtype=torch.float8_e4m3fn),
-                                 (M * topk, K))
+        a1q_perm = _resize_cache(
+            workspace2.view(dtype=torch.float8_e4m3fn), (M * topk, K)
+        )
         mm1_out = _resize_cache(workspace13, (M * topk, N * 2))
         act_out = _resize_cache(workspace2, (M * topk, N))
         # original workspace are based on input hidden_states dtype (bf16)
-        quant_out = _resize_cache(workspace13.view(dtype=torch.float8_e4m3fn),
-                                  (M * topk, N))
+        quant_out = _resize_cache(
+            workspace13.view(dtype=torch.float8_e4m3fn), (M * topk, N)
+        )
         mm2_out = _resize_cache(workspace2, (M * topk, K))
 
     if use_batched_format:
         assert expert_num_tokens is not None
 
-        expert_offsets = torch.empty((local_E),
-                                     dtype=torch.int32,
-                                     device=device)
-        problem_sizes1 = torch.empty((local_E, 3),
-                                     dtype=torch.int32,
-                                     device=device)
-        problem_sizes2 = torch.empty((local_E, 3),
-                                     dtype=torch.int32,
-                                     device=device)
+        expert_offsets = torch.empty((local_E), dtype=torch.int32, device=device)
+        problem_sizes1 = torch.empty((local_E, 3), dtype=torch.int32, device=device)
+        problem_sizes2 = torch.empty((local_E, 3), dtype=torch.int32, device=device)
 
-        ops.get_cutlass_pplx_moe_mm_data(expert_offsets, problem_sizes1,
-                                         problem_sizes2, expert_num_tokens,
-                                         local_E, padded_M, N, K)
+        ops.get_cutlass_pplx_moe_mm_data(
+            expert_offsets,
+            problem_sizes1,
+            problem_sizes2,
+            expert_num_tokens,
+            local_E,
+            padded_M,
+            N,
+            K,
+        )
 
         w1_scale = w1_scale.reshape(w1_scale.size(0), -1)
         w2_scale = w2_scale.reshape(w2_scale.size(0), -1)
@@ -146,15 +164,14 @@ def run_cutlass_moe_fp8(
         # during offset calculations
         expert_offsets = expert_offsets.to(torch.int64)
     else:
-        problem_sizes1 = torch.empty((global_num_experts, 3),
-                                     dtype=torch.int32,
-                                     device=device)
-        problem_sizes2 = torch.empty((global_num_experts, 3),
-                                     dtype=torch.int32,
-                                     device=device)
-
-        num_expert = global_num_experts if expert_map is None \
-                     else expert_map.size(0)
+        problem_sizes1 = torch.empty(
+            (global_num_experts, 3), dtype=torch.int32, device=device
+        )
+        problem_sizes2 = torch.empty(
+            (global_num_experts, 3), dtype=torch.int32, device=device
+        )
+
+        num_expert = global_num_experts if expert_map is None else expert_map.size(0)
         # permuted a1q reuses workspace2
         a1q, a1q_scale, expert_offsets, inv_perm, _ = moe_permute(
             a1q,
@@ -163,12 +180,13 @@ def run_cutlass_moe_fp8(
             num_expert,
             local_E,
             expert_map,
-            permuted_hidden_states=a1q_perm)
+            permuted_hidden_states=a1q_perm,
+        )
         expert_offsets = expert_offsets[:-1]
 
-        ops.get_cutlass_moe_mm_problem_sizes(local_topk_ids, problem_sizes1,
-                                             problem_sizes2,
-                                             global_num_experts, N, K)
+        ops.get_cutlass_moe_mm_problem_sizes(
+            local_topk_ids, problem_sizes1, problem_sizes2, global_num_experts, N, K
+        )
 
     if not per_act_token and (expert_map is not None or use_batched_format):
         # this is necessary to avoid imprecise scale calculation caused by
@@ -176,38 +194,59 @@ def run_cutlass_moe_fp8(
         # this rank handles only partial tokens, or when it is batched .
         mm1_out.fill_(0)
 
-    ops.cutlass_moe_mm(mm1_out, a1q, w1, a1q_scale, w1_scale, expert_offsets,
-                       problem_sizes1, ab_strides1, ab_strides1, c_strides1,
-                       per_act_token, per_out_ch)
+    ops.cutlass_moe_mm(
+        mm1_out,
+        a1q,
+        w1,
+        a1q_scale,
+        w1_scale,
+        expert_offsets,
+        problem_sizes1,
+        ab_strides1,
+        ab_strides1,
+        c_strides1,
+        per_act_token,
+        per_out_ch,
+    )
 
     activation_callable(act_out, mm1_out)
 
     a2q, a2q_scale = ops.scaled_fp8_quant(
-        act_out,
-        a2_scale,
-        use_per_token_if_dynamic=per_act_token,
-        output=quant_out)
+        act_out, a2_scale, use_per_token_if_dynamic=per_act_token, output=quant_out
+    )
 
     if expert_map is not None:
         mm2_out.fill_(0)
 
-    ops.cutlass_moe_mm(mm2_out, a2q, w2, a2q_scale, w2_scale, expert_offsets,
-                       problem_sizes2, ab_strides2, ab_strides2, c_strides2,
-                       per_act_token, per_out_ch)
+    ops.cutlass_moe_mm(
+        mm2_out,
+        a2q,
+        w2,
+        a2q_scale,
+        w2_scale,
+        expert_offsets,
+        problem_sizes2,
+        ab_strides2,
+        ab_strides2,
+        c_strides2,
+        per_act_token,
+        per_out_ch,
+    )
 
     if use_batched_format:
         output.copy_(mm2_out.reshape(local_E, padded_M, K), non_blocking=True)
     else:
         # for non-chunking mode the output is resized from workspace13
         # so we need to make sure mm2_out uses workspace2.
-        moe_unpermute(out=output,
-                      permuted_hidden_states=mm2_out,
-                      topk_weights=topk_weights,
-                      inv_permuted_idx=inv_perm)
+        moe_unpermute(
+            out=output,
+            permuted_hidden_states=mm2_out,
+            topk_weights=topk_weights,
+            inv_permuted_idx=inv_perm,
+        )
 
 
 class CutlassExpertsFp8Base(mk.FusedMoEPermuteExpertsUnpermute):
-
     def __init__(
         self,
         out_dtype: Optional[torch.dtype],
@@ -256,23 +295,40 @@ def apply(
 
         activation_callable = lambda o, i: self.activation(activation, o, i)
 
-        use_batched_format = self.activation_formats[
-            0] == mk.FusedMoEActivationFormat.BatchedExperts
+        use_batched_format = (
+            self.activation_formats[0] == mk.FusedMoEActivationFormat.BatchedExperts
+        )
 
         in_dtype = hidden_states.dtype
         run_cutlass_moe_fp8(
-            output, hidden_states, w1, w2, topk_ids, activation_callable,
-            global_num_experts, expert_map, self.w1_scale, self.w2_scale,
-            a1q_scale, a2_scale, self.ab_strides1, self.ab_strides2,
-            self.c_strides1, self.c_strides2, workspace13, workspace2,
+            output,
+            hidden_states,
+            w1,
+            w2,
+            topk_ids,
+            activation_callable,
+            global_num_experts,
+            expert_map,
+            self.w1_scale,
+            self.w2_scale,
+            a1q_scale,
+            a2_scale,
+            self.ab_strides1,
+            self.ab_strides2,
+            self.c_strides1,
+            self.c_strides2,
+            workspace13,
+            workspace2,
             expert_num_tokens,
             self.out_dtype if self.out_dtype is not None else in_dtype,
-            self.per_act_token_quant, self.per_out_ch_quant,
-            use_batched_format, topk_weights)
+            self.per_act_token_quant,
+            self.per_out_ch_quant,
+            use_batched_format,
+            topk_weights,
+        )
 
 
 class CutlassExpertsFp8(CutlassExpertsFp8Base):
-
     def __init__(
         self,
         out_dtype: Optional[torch.dtype],
@@ -293,10 +349,12 @@ def __init__(
 
     @property
     def activation_formats(
-        self
+        self,
     ) -> tuple[mk.FusedMoEActivationFormat, mk.FusedMoEActivationFormat]:
-        return (mk.FusedMoEActivationFormat.Standard,
-                mk.FusedMoEActivationFormat.Standard)
+        return (
+            mk.FusedMoEActivationFormat.Standard,
+            mk.FusedMoEActivationFormat.Standard,
+        )
 
     def supports_chunking(self) -> bool:
         return True
@@ -323,12 +381,15 @@ def workspace_shapes(
         workspace1 = (M * topk, max(N, K))
         workspace2 = (M * topk, max(N // 2, K))
         output = (M, K)
-        return (workspace1, workspace2, output,
-                self.out_dtype if self.out_dtype is not None else a.dtype)
+        return (
+            workspace1,
+            workspace2,
+            output,
+            self.out_dtype if self.out_dtype is not None else a.dtype,
+        )
 
 
 class CutlassBatchedExpertsFp8(CutlassExpertsFp8Base):
-
     def __init__(
         self,
         max_experts_per_worker: int,
@@ -354,10 +415,12 @@ def __init__(
 
     @property
     def activation_formats(
-        self
+        self,
     ) -> tuple[mk.FusedMoEActivationFormat, mk.FusedMoEActivationFormat]:
-        return (mk.FusedMoEActivationFormat.BatchedExperts,
-                mk.FusedMoEActivationFormat.BatchedExperts)
+        return (
+            mk.FusedMoEActivationFormat.BatchedExperts,
+            mk.FusedMoEActivationFormat.BatchedExperts,
+        )
 
     def supports_chunking(self) -> bool:
         return False
@@ -381,13 +444,15 @@ def workspace_shapes(
         padded_M = aq.size(1)
         num_dp = self.num_dispatchers
         assert num_dp is not None
-        workspace1 = (self.max_experts_per_worker, padded_M * num_dp,
-                      max(N, K))
-        workspace2 = (self.max_experts_per_worker, padded_M * num_dp,
-                      max(N // 2, K))
+        workspace1 = (self.max_experts_per_worker, padded_M * num_dp, max(N, K))
+        workspace2 = (self.max_experts_per_worker, padded_M * num_dp, max(N // 2, K))
         output = (self.max_experts_per_worker, padded_M, K)
-        return (workspace1, workspace2, output,
-                self.out_dtype if self.out_dtype is not None else a.dtype)
+        return (
+            workspace1,
+            workspace2,
+            output,
+            self.out_dtype if self.out_dtype is not None else a.dtype,
+        )
 
 
 def cutlass_moe_fp8(
@@ -456,18 +521,15 @@ def cutlass_moe_fp8(
     assert quant_config is not None
 
     if quant_config.a1_scale is not None:
-        assert (quant_config.per_act_token_quant ==
-                quant_config.a1_scale.numel() != 1)
+        assert quant_config.per_act_token_quant == quant_config.a1_scale.numel() != 1
     if quant_config.a2_scale is not None:
-        assert (quant_config.per_act_token_quant ==
-                quant_config.a2_scale.numel() != 1)
+        assert quant_config.per_act_token_quant == quant_config.a2_scale.numel() != 1
 
-    assert (quant_config.w1_scale is None
-            or (quant_config.per_out_ch_quant == (quant_config.w1_scale.size(1)
-                                                  == w1_q.size(1))))
+    assert quant_config.w1_scale is None or (
+        quant_config.per_out_ch_quant == (quant_config.w1_scale.size(1) == w1_q.size(1))
+    )
 
-    num_experts = global_num_experts if global_num_experts != -1 else w1_q.size(
-        0)
+    num_experts = global_num_experts if global_num_experts != -1 else w1_q.size(0)
 
     fn = mk.FusedMoEModularKernel(
         MoEPrepareAndFinalizeNoEP(),
@@ -550,25 +612,30 @@ def run_cutlass_moe_fp4(
     assert topk_weights.shape == topk_ids.shape, "topk shape mismatch"
     assert w1_fp4.dtype == torch.uint8, "weight 1 must be uint8"
     assert w2_fp4.dtype == torch.uint8, "weight 2 must be uint8"
-    assert (w1_fp4.ndim == 3 and w2_fp4.ndim == 3 and w1_blockscale.ndim == 3
-            and w2_blockscale.ndim
-            == 3), ("All Weights must be of rank 3 for cutlass_moe_fp4")
+    assert (
+        w1_fp4.ndim == 3
+        and w2_fp4.ndim == 3
+        and w1_blockscale.ndim == 3
+        and w2_blockscale.ndim == 3
+    ), "All Weights must be of rank 3 for cutlass_moe_fp4"
     m_a, k_a = a.shape
     e_w1, nx2_w1, half_k_w1 = w1_fp4.shape
     e_w2, k_w2, half_n_w2 = w2_fp4.shape
 
-    assert (e_w1 == e_w2
-            and e_w1 == e), ("Number of experts must match",
-                             f" between weights. {e_w1}, {e_w2}, {e}")
-    assert (k_a == half_k_w1 * 2
-            and k == k_w2), ("Hidden size mismatch between a, w1 and w2")
-    assert (nx2_w1 == n * 2 and half_n_w2 * 2 == n), ("mismatch in "
-                                                      "expected `n`")
-    assert (m == m_a), "input shape mismatch"
+    assert e_w1 == e_w2 and e_w1 == e, (
+        "Number of experts must match",
+        f" between weights. {e_w1}, {e_w2}, {e}",
+    )
+    assert k_a == half_k_w1 * 2 and k == k_w2, (
+        "Hidden size mismatch between a, w1 and w2"
+    )
+    assert nx2_w1 == n * 2 and half_n_w2 * 2 == n, "mismatch in expected `n`"
+    assert m == m_a, "input shape mismatch"
     assert 2 * half_k_w1 == k_w2, "Hidden size mismatch w2 and w1"
     assert a.dtype in [torch.half, torch.bfloat16], "Invalid input dtype"
-    assert (topk_weights.size(0) == m and topk_ids.size(0)
-            == m), ("topk must be provided for each row of a")
+    assert topk_weights.size(0) == m and topk_ids.size(0) == m, (
+        "topk must be provided for each row of a"
+    )
     topk = topk_ids.size(1)
     out_dtype = a.dtype
     num_topk = topk_ids.size(1)
@@ -585,15 +652,25 @@ def run_cutlass_moe_fp4(
 
     if apply_router_weight_on_input:
         # TODO: this only works for topK=1, will need to update for topK>1
-        assert num_topk == 1, \
+        assert num_topk == 1, (
             "apply_router_weight_on_input is only implemented for topk=1"
+        )
         a.mul_(topk_weights.to(out_dtype))
 
     # problem shapes should have [m, n, k]
     # Note that problem sizes are based on logical number of elements.
-    ops.get_cutlass_moe_mm_data(topk_ids, expert_offsets, problem_sizes1,
-                                problem_sizes2, a_map, c_map, e, n, k,
-                                blockscale_offsets)
+    ops.get_cutlass_moe_mm_data(
+        topk_ids,
+        expert_offsets,
+        problem_sizes1,
+        problem_sizes2,
+        a_map,
+        c_map,
+        e,
+        n,
+        k,
+        blockscale_offsets,
+    )
 
     a = ops.shuffle_rows(a, a_map)
     rep_a_fp4, rep_a_blockscale = ops.scaled_fp4_experts_quant(
@@ -606,17 +683,34 @@ def run_cutlass_moe_fp4(
     c1 = _resize_cache(workspace13, (m * topk, n * 2))
     c2 = _resize_cache(workspace2, (m * topk, n))
     c3 = _resize_cache(workspace13, (m * topk, k))
-    ops.cutlass_fp4_moe_mm(c1, rep_a_fp4, w1_fp4, rep_a_blockscale,
-                           w1_blockscale, w1_alphas, problem_sizes1,
-                           expert_offsets[:-1], blockscale_offsets[:-1])
+    ops.cutlass_fp4_moe_mm(
+        c1,
+        rep_a_fp4,
+        w1_fp4,
+        rep_a_blockscale,
+        w1_blockscale,
+        w1_alphas,
+        problem_sizes1,
+        expert_offsets[:-1],
+        blockscale_offsets[:-1],
+    )
     del rep_a_fp4, rep_a_blockscale
     torch.ops._C.silu_and_mul(c2, c1)
     int_fp4, int_blockscale = ops.scaled_fp4_experts_quant(
-        c2, a2_gscale, expert_offsets, blockscale_offsets, num_topk)
+        c2, a2_gscale, expert_offsets, blockscale_offsets, num_topk
+    )
 
-    ops.cutlass_fp4_moe_mm(c3, int_fp4, w2_fp4, int_blockscale, w2_blockscale,
-                           w2_alphas, problem_sizes2, expert_offsets[:-1],
-                           blockscale_offsets[:-1])
+    ops.cutlass_fp4_moe_mm(
+        c3,
+        int_fp4,
+        w2_fp4,
+        int_blockscale,
+        w2_blockscale,
+        w2_alphas,
+        problem_sizes2,
+        expert_offsets[:-1],
+        blockscale_offsets[:-1],
+    )
     del int_fp4, int_blockscale
 
     c3 = ops.shuffle_rows(c3, c_map)
@@ -624,9 +718,12 @@ def run_cutlass_moe_fp4(
     assert output.dtype == out_dtype
     if not apply_router_weight_on_input:
         output.copy_(
-            (c3.view(m, num_topk, k) *
-             topk_weights.view(m, num_topk, 1).to(out_dtype)).sum(dim=1),
-            non_blocking=True)
+            (
+                c3.view(m, num_topk, k)
+                * topk_weights.view(m, num_topk, 1).to(out_dtype)
+            ).sum(dim=1),
+            non_blocking=True,
+        )
     else:
         output.copy_(c3.view(m, num_topk, k).sum(dim=1), non_blocking=True)
     return
@@ -634,7 +731,6 @@ def run_cutlass_moe_fp4(
 
 # Split into batched and non-batched
 class CutlassExpertsFp4(mk.FusedMoEPermuteExpertsUnpermute):
-
     def __init__(
         self,
         max_experts_per_worker: int,
@@ -649,14 +745,18 @@ def __init__(
 
     @property
     def activation_formats(
-        self
+        self,
     ) -> tuple[mk.FusedMoEActivationFormat, mk.FusedMoEActivationFormat]:
         if self.use_batched_format:
-            return (mk.FusedMoEActivationFormat.BatchedExperts,
-                    mk.FusedMoEActivationFormat.BatchedExperts)
+            return (
+                mk.FusedMoEActivationFormat.BatchedExperts,
+                mk.FusedMoEActivationFormat.BatchedExperts,
+            )
         else:
-            return (mk.FusedMoEActivationFormat.Standard,
-                    mk.FusedMoEActivationFormat.Standard)
+            return (
+                mk.FusedMoEActivationFormat.Standard,
+                mk.FusedMoEActivationFormat.Standard,
+            )
 
     def supports_expert_map(self) -> bool:
         return False
@@ -691,8 +791,12 @@ def workspace_shapes(
             workspace1 = (M * topk, max(2 * N, K))
             workspace2 = (M * topk, N)
             output = (M, K)
-        return (workspace1, workspace2, output,
-                self.out_dtype if self.out_dtype is not None else a.dtype)
+        return (
+            workspace1,
+            workspace2,
+            output,
+            self.out_dtype if self.out_dtype is not None else a.dtype,
+        )
 
     def apply(
         self,
@@ -740,21 +844,24 @@ def apply(
 
 
 def cutlass_moe_fp4(
-        a: torch.Tensor,
-        w1_fp4: torch.Tensor,
-        w2_fp4: torch.Tensor,
-        topk_weights: torch.Tensor,
-        topk_ids: torch.Tensor,
-        quant_config: FusedMoEQuantConfig,
-        m: int,
-        n: int,
-        k: int,
-        e: int,
-        expert_map: Optional[torch.Tensor] = None,
-        apply_router_weight_on_input: bool = False) -> torch.Tensor:
-    assert expert_map is None, ("Expert Parallelism / expert_map "
-                                "is currently not supported for "
-                                "ModelOptNvFp4FusedMoE's cutlass_moe_fp4.")
+    a: torch.Tensor,
+    w1_fp4: torch.Tensor,
+    w2_fp4: torch.Tensor,
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    quant_config: FusedMoEQuantConfig,
+    m: int,
+    n: int,
+    k: int,
+    e: int,
+    expert_map: Optional[torch.Tensor] = None,
+    apply_router_weight_on_input: bool = False,
+) -> torch.Tensor:
+    assert expert_map is None, (
+        "Expert Parallelism / expert_map "
+        "is currently not supported for "
+        "ModelOptNvFp4FusedMoE's cutlass_moe_fp4."
+    )
 
     # TODO(bnell): this feels a bit hacky
     # NVFP4 requires two levels of quantization, which involves
@@ -799,10 +906,13 @@ def cutlass_moe_fp4(
 
 
 def _valid_cutlass_block_scaled_grouped_gemm(
-        w1: torch.Tensor, w2: torch.Tensor, inplace: bool, activation: str,
-        apply_router_weight_on_input: bool,
-        expert_map: Optional[torch.Tensor]) -> bool:
-
+    w1: torch.Tensor,
+    w2: torch.Tensor,
+    inplace: bool,
+    activation: str,
+    apply_router_weight_on_input: bool,
+    expert_map: Optional[torch.Tensor],
+) -> bool:
     def _valid_cutlass_block_scaled_grouped_gemm_shape(N: int, K: int):
         return N % 128 == 0 and K % 128 == 0
 
@@ -816,7 +926,7 @@ def _valid_cutlass_block_scaled_grouped_gemm_shape(N: int, K: int):
         )
         return False
 
-    if (w1.dtype != torch.float8_e4m3fn or w2.dtype != torch.float8_e4m3fn):
+    if w1.dtype != torch.float8_e4m3fn or w2.dtype != torch.float8_e4m3fn:
         logger.debug_once(
             "CutlassBlockScaledGroupedGemm disabled: invalid weight dtype(s). "
             "w1.dtype: %s, w2.dtype: %s",
@@ -827,19 +937,21 @@ def _valid_cutlass_block_scaled_grouped_gemm_shape(N: int, K: int):
 
     if expert_map is not None:
         logger.debug_once(
-            "CutlassBlockScaledGroupedGemm disabled: expert_parallel is"
-            " not supported.")
+            "CutlassBlockScaledGroupedGemm disabled: expert_parallel is not supported."
+        )
         return False
 
     if activation != "silu":
         logger.debug_once(
-            "CutlassBlockScaledGroupedGemm disabled: only activation silu is"
-            " supported.")
+            "CutlassBlockScaledGroupedGemm disabled: only activation silu is supported."
+        )
         return False
 
     if apply_router_weight_on_input:
-        logger.debug_once("CutlassBlockScaledGroupedGemm disabled:"
-                          " apply_router_weight_on_input is not supported.")
+        logger.debug_once(
+            "CutlassBlockScaledGroupedGemm disabled:"
+            " apply_router_weight_on_input is not supported."
+        )
         return False
 
     if inplace:
@@ -867,17 +979,16 @@ def run_cutlass_block_scaled_fused_experts(
     w2_scale = w2_scale.transpose(1, 2)
 
     assert topk_weights.shape == topk_ids.shape, "topk shape mismatch"
-    assert a.shape[0] == topk_ids.shape[
-        0], "a and topk_ids must have the same batch size"
+    assert a.shape[0] == topk_ids.shape[0], (
+        "a and topk_ids must have the same batch size"
+    )
     assert w1_q.dtype == torch.float8_e4m3fn, "w1_q must be float8_e4m3fn"
     assert w2_q.dtype == torch.float8_e4m3fn, "w2_q must be float8_e4m3fn"
     assert a.shape[1] == w1_q.shape[1], "Hidden size mismatch w1"
     assert w1_q.shape[2] == w2_q.shape[1] * 2, "Hidden size mismatch w2"
     assert w1_q.shape[0] == w2_q.shape[0], "Expert number mismatch"
-    assert w1_q.shape[0] == w1_scale.shape[
-        0], "w1_scale expert number mismatch"
-    assert w1_q.shape[0] == w2_scale.shape[
-        0], "w2_scale expert number mismatch"
+    assert w1_q.shape[0] == w1_scale.shape[0], "w1_scale expert number mismatch"
+    assert w1_q.shape[0] == w2_scale.shape[0], "w2_scale expert number mismatch"
     assert a.dtype in [torch.half, torch.bfloat16], "Invalid output dtype"
 
     out_dtype = a.dtype
@@ -888,21 +999,14 @@ def run_cutlass_block_scaled_fused_experts(
 
     topk = topk_ids.size(1)
 
-    a_q, a1_scale = _fp8_quantize(a,
-                                  A_scale=None,
-                                  per_act_token=False,
-                                  block_shape=[128, 128])
+    a_q, a1_scale = _fp8_quantize(
+        a, A_scale=None, per_act_token=False, block_shape=[128, 128]
+    )
     device = a_q.device
 
-    expert_offsets = torch.empty((num_experts + 1, ),
-                                 dtype=torch.int32,
-                                 device=device)
-    problem_sizes1 = torch.empty((num_experts, 3),
-                                 dtype=torch.int32,
-                                 device=device)
-    problem_sizes2 = torch.empty((num_experts, 3),
-                                 dtype=torch.int32,
-                                 device=device)
+    expert_offsets = torch.empty((num_experts + 1,), dtype=torch.int32, device=device)
+    problem_sizes1 = torch.empty((num_experts, 3), dtype=torch.int32, device=device)
+    problem_sizes2 = torch.empty((num_experts, 3), dtype=torch.int32, device=device)
 
     a_map = torch.empty((topk_ids.numel()), dtype=torch.int32, device=device)
     c_map = torch.empty((topk_ids.numel()), dtype=torch.int32, device=device)
@@ -938,10 +1042,9 @@ def run_cutlass_block_scaled_fused_experts(
     intermediate = torch.empty((m * topk, n), dtype=out_dtype, device=device)
     torch.ops._C.silu_and_mul(intermediate, c1)
 
-    intermediate_q, a2_scale = _fp8_quantize(intermediate,
-                                             A_scale=None,
-                                             per_act_token=False,
-                                             block_shape=[128, 128])
+    intermediate_q, a2_scale = _fp8_quantize(
+        intermediate, A_scale=None, per_act_token=False, block_shape=[128, 128]
+    )
 
     ops.cutlass_blockwise_scaled_grouped_mm(
         c2,
@@ -953,5 +1056,6 @@ def run_cutlass_block_scaled_fused_experts(
         expert_offsets[:-1],
     )
 
-    return (c2[c_map].view(m, topk, k) *
-            topk_weights.view(m, topk, 1).to(out_dtype)).sum(dim=1)
+    return (
+        c2[c_map].view(m, topk, k) * topk_weights.view(m, topk, 1).to(out_dtype)
+    ).sum(dim=1)
diff --git a/vllm/model_executor/layers/fused_moe/deep_gemm_moe.py b/vllm/model_executor/layers/fused_moe/deep_gemm_moe.py
index 51a4f275e98c..fec3a7c5d0a9 100644
--- a/vllm/model_executor/layers/fused_moe/deep_gemm_moe.py
+++ b/vllm/model_executor/layers/fused_moe/deep_gemm_moe.py
@@ -9,17 +9,25 @@
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe.config import (
-    FusedMoEQuantConfig, fp8_w8a8_moe_quant_config)
+    FusedMoEQuantConfig,
+    fp8_w8a8_moe_quant_config,
+)
 from vllm.model_executor.layers.fused_moe.deep_gemm_utils import (
-    compute_aligned_M, deep_gemm_block_shape, deepgemm_moe_permute,
-    deepgemm_unpermute_and_reduce)
+    compute_aligned_M,
+    deep_gemm_block_shape,
+    deepgemm_moe_permute,
+    deepgemm_unpermute_and_reduce,
+)
 from vllm.model_executor.layers.fused_moe.prepare_finalize import (
-    MoEPrepareAndFinalizeNoEP)
+    MoEPrepareAndFinalizeNoEP,
+)
 from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
-    TopKWeightAndReduceNoOP)
+    TopKWeightAndReduceNoOP,
+)
 from vllm.model_executor.layers.fused_moe.utils import _resize_cache
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    per_token_group_quant_fp8)
+    per_token_group_quant_fp8,
+)
 from vllm.utils import has_deep_gemm, run_once
 from vllm.utils.deep_gemm import m_grouped_fp8_gemm_nt_contiguous
 
@@ -31,8 +39,9 @@ def _valid_deep_gemm_shape(M: int, N: int, K: int) -> bool:
     return align <= M and N % align == 0 and K % align == 0
 
 
-def _valid_deep_gemm(hidden_states: torch.Tensor, w1: torch.Tensor,
-                     w2: torch.Tensor) -> bool:
+def _valid_deep_gemm(
+    hidden_states: torch.Tensor, w1: torch.Tensor, w2: torch.Tensor
+) -> bool:
     """
     Check if the given problem size is supported by the DeepGemm grouped
     gemm kernel.  All of M, N, K and the quantization block_shape must be
@@ -71,17 +80,19 @@ def _valid_deep_gemm(hidden_states: torch.Tensor, w1: torch.Tensor,
         )
         return False
 
-    if (w1.dtype != torch.float8_e4m3fn or w2.dtype != torch.float8_e4m3fn):
+    if w1.dtype != torch.float8_e4m3fn or w2.dtype != torch.float8_e4m3fn:
         logger.debug_once(
-            "DeepGemm disabled: invalid weight dtype(s). "
-            "w1.dtype: %s, w2.dtype: %s",
+            "DeepGemm disabled: invalid weight dtype(s). w1.dtype: %s, w2.dtype: %s",
             w1.dtype,
             w2.dtype,
         )
         return False
 
-    if (not hidden_states.is_contiguous() or not w1.is_contiguous()
-            or not w2.is_contiguous()):
+    if (
+        not hidden_states.is_contiguous()
+        or not w1.is_contiguous()
+        or not w2.is_contiguous()
+    ):
         logger.debug_once(
             "DeepGemm disabled: weights or activations not contiguous. "
             "hidden_states.is_contiguous(): %s, w1.is_contiguous(): %s, "
@@ -96,10 +107,13 @@ def _valid_deep_gemm(hidden_states: torch.Tensor, w1: torch.Tensor,
 
 
 @run_once
-def warmup_deepgemm_gg_contiguous_kernels(w1: torch.Tensor, w2: torch.Tensor,
-                                          w1_scale: torch.Tensor,
-                                          w2_scale: torch.Tensor,
-                                          num_topk: int):
+def warmup_deepgemm_gg_contiguous_kernels(
+    w1: torch.Tensor,
+    w2: torch.Tensor,
+    w1_scale: torch.Tensor,
+    w2_scale: torch.Tensor,
+    num_topk: int,
+):
     """
     DeepGemm JITs the grouped-gemm kernels. The JIT'ing happens based on the
     input tensor shapes. In this function, we construct all possible input
@@ -108,8 +122,7 @@ def warmup_deepgemm_gg_contiguous_kernels(w1: torch.Tensor, w2: torch.Tensor,
     call and not during actual model inference.
     """
 
-    assert w1.size(0) == w2.size(0), (
-        "w1 and w2 must have the same number of experts")
+    assert w1.size(0) == w2.size(0), "w1 and w2 must have the same number of experts"
 
     block_m = deep_gemm_block_shape()[0]
     num_experts = w1.size(0)
@@ -117,36 +130,39 @@ def warmup_deepgemm_gg_contiguous_kernels(w1: torch.Tensor, w2: torch.Tensor,
 
     # This is the maximum GroupedGemm M size that we expect to run
     # the grouped_gemm with.
-    MAX_M = compute_aligned_M(env.VLLM_FUSED_MOE_CHUNK_SIZE,
-                              num_topk,
-                              num_experts,
-                              block_m,
-                              expert_tokens_meta=None)
+    MAX_M = compute_aligned_M(
+        env.VLLM_FUSED_MOE_CHUNK_SIZE,
+        num_topk,
+        num_experts,
+        block_m,
+        expert_tokens_meta=None,
+    )
     # Distribute expert-ids evenly.
     MAX_BLOCKS = MAX_M // block_m
-    expert_ids_block = torch.randint(low=0,
-                                     high=num_experts,
-                                     size=(MAX_BLOCKS, ),
-                                     device=device,
-                                     dtype=torch.int32)
+    expert_ids_block = torch.randint(
+        low=0, high=num_experts, size=(MAX_BLOCKS,), device=device, dtype=torch.int32
+    )
     expert_ids = torch.repeat_interleave(expert_ids_block, block_m, dim=0)
 
     def _warmup(w: torch.Tensor, w_scale: torch.Tensor):
-
         _, n, k = w.size()
         a1q = torch.empty((MAX_M, k), device=device).to(torch.float8_e4m3fn)
-        a1q_scales = torch.empty((MAX_M, k // block_m),
-                                 device=device,
-                                 dtype=torch.float32)
+        a1q_scales = torch.empty(
+            (MAX_M, k // block_m), device=device, dtype=torch.float32
+        )
         out = torch.empty((MAX_M, n), device=device, dtype=torch.bfloat16)
 
-        pbar = tqdm(total=MAX_BLOCKS,
-                    desc=f"DeepGemmExperts GEMM warmup (MAX_M={MAX_M})")
+        pbar = tqdm(
+            total=MAX_BLOCKS, desc=f"DeepGemmExperts GEMM warmup (MAX_M={MAX_M})"
+        )
         num_tokens = MAX_M
         while num_tokens > 0:
             m_grouped_fp8_gemm_nt_contiguous(
-                (a1q[:num_tokens], a1q_scales[:num_tokens]), (w, w_scale),
-                out[:num_tokens], expert_ids[:num_tokens])
+                (a1q[:num_tokens], a1q_scales[:num_tokens]),
+                (w, w_scale),
+                out[:num_tokens],
+                expert_ids[:num_tokens],
+            )
             pbar.update(1)
             num_tokens = num_tokens - block_m
 
@@ -155,7 +171,6 @@ def _warmup(w: torch.Tensor, w_scale: torch.Tensor):
 
 
 class DeepGemmExperts(mk.FusedMoEPermuteExpertsUnpermute):
-
     def __init__(self, quant_config: FusedMoEQuantConfig):
         super().__init__(quant_config)
         assert quant_config.block_shape == deep_gemm_block_shape()
@@ -165,10 +180,12 @@ def __init__(self, quant_config: FusedMoEQuantConfig):
 
     @property
     def activation_formats(
-        self
+        self,
     ) -> tuple[mk.FusedMoEActivationFormat, mk.FusedMoEActivationFormat]:
-        return (mk.FusedMoEActivationFormat.Standard,
-                mk.FusedMoEActivationFormat.Standard)
+        return (
+            mk.FusedMoEActivationFormat.Standard,
+            mk.FusedMoEActivationFormat.Standard,
+        )
 
     def supports_chunking(self) -> bool:
         return True
@@ -193,8 +210,9 @@ def workspace_shapes(
     ) -> tuple[tuple[int, ...], tuple[int, ...], tuple[int, ...], torch.dtype]:
         assert self.block_shape is not None
         block_m = self.block_shape[0]
-        M_sum = compute_aligned_M(M, topk, local_num_experts, block_m,
-                                  expert_tokens_meta)
+        M_sum = compute_aligned_M(
+            M, topk, local_num_experts, block_m, expert_tokens_meta
+        )
         assert M_sum % block_m == 0
 
         workspace1 = (M_sum, max(N, K))
@@ -235,18 +253,20 @@ def apply(
 
         assert w2.size(1) == K
 
-        M_sum = compute_aligned_M(M=topk_ids.size(0),
-                                  num_topk=topk_ids.size(1),
-                                  local_num_experts=local_num_experts,
-                                  alignment=deep_gemm_block_shape()[0],
-                                  expert_tokens_meta=expert_tokens_meta)
+        M_sum = compute_aligned_M(
+            M=topk_ids.size(0),
+            num_topk=topk_ids.size(1),
+            local_num_experts=local_num_experts,
+            alignment=deep_gemm_block_shape()[0],
+            expert_tokens_meta=expert_tokens_meta,
+        )
 
-        a1q_perm = _resize_cache(workspace2.view(dtype=torch.float8_e4m3fn),
-                                 (M_sum, K))
+        a1q_perm = _resize_cache(workspace2.view(dtype=torch.float8_e4m3fn), (M_sum, K))
         mm1_out = _resize_cache(workspace13, (M_sum, N))
         act_out = _resize_cache(workspace2, (M_sum, N // 2))
-        quant_out = _resize_cache(workspace13.view(dtype=torch.float8_e4m3fn),
-                                  (M_sum, N // 2))
+        quant_out = _resize_cache(
+            workspace13.view(dtype=torch.float8_e4m3fn), (M_sum, N // 2)
+        )
         mm2_out = _resize_cache(workspace2, (M_sum, K))
 
         a1q, a1q_scale, expert_ids, inv_perm = deepgemm_moe_permute(
@@ -256,32 +276,36 @@ def apply(
             local_num_experts=local_num_experts,
             expert_map=expert_map,
             expert_tokens_meta=expert_tokens_meta,
-            aq_out=a1q_perm)
+            aq_out=a1q_perm,
+        )
         assert a1q.size(0) == M_sum
 
-        m_grouped_fp8_gemm_nt_contiguous((a1q, a1q_scale), (w1, self.w1_scale),
-                                         mm1_out, expert_ids)
+        m_grouped_fp8_gemm_nt_contiguous(
+            (a1q, a1q_scale), (w1, self.w1_scale), mm1_out, expert_ids
+        )
 
         self.activation(activation, act_out, mm1_out.view(-1, N))
 
         a2q_scale: Optional[torch.Tensor] = None
-        a2q, a2q_scale = per_token_group_quant_fp8(act_out,
-                                                   self.block_shape[1],
-                                                   column_major_scales=True,
-                                                   out_q=quant_out)
+        a2q, a2q_scale = per_token_group_quant_fp8(
+            act_out, self.block_shape[1], column_major_scales=True, out_q=quant_out
+        )
 
-        m_grouped_fp8_gemm_nt_contiguous((a2q, a2q_scale), (w2, self.w2_scale),
-                                         mm2_out, expert_ids)
+        m_grouped_fp8_gemm_nt_contiguous(
+            (a2q, a2q_scale), (w2, self.w2_scale), mm2_out, expert_ids
+        )
 
         if apply_router_weight_on_input:
             topk_weights = torch.ones_like(topk_weights)
 
-        deepgemm_unpermute_and_reduce(a=mm2_out,
-                                      topk_ids=topk_ids,
-                                      topk_weights=topk_weights,
-                                      inv_perm=inv_perm,
-                                      expert_map=expert_map,
-                                      output=output)
+        deepgemm_unpermute_and_reduce(
+            a=mm2_out,
+            topk_ids=topk_ids,
+            topk_weights=topk_weights,
+            inv_perm=inv_perm,
+            expert_map=expert_map,
+            output=output,
+        )
 
 
 def deep_gemm_moe_fp8(
@@ -342,7 +366,8 @@ def deep_gemm_moe_fp8(
         w2_scale=w2_scale,
         a1_scale=a1_scale,
         a2_scale=a2_scale,
-        block_shape=deep_gemm_block_shape())
+        block_shape=deep_gemm_block_shape(),
+    )
 
     fn = mk.FusedMoEModularKernel(
         MoEPrepareAndFinalizeNoEP(),
diff --git a/vllm/model_executor/layers/fused_moe/deep_gemm_utils.py b/vllm/model_executor/layers/fused_moe/deep_gemm_utils.py
index c8469501af5d..2ac968a9b4ab 100644
--- a/vllm/model_executor/layers/fused_moe/deep_gemm_utils.py
+++ b/vllm/model_executor/layers/fused_moe/deep_gemm_utils.py
@@ -20,27 +20,33 @@
 def deep_gemm_block_shape() -> list[int]:
     # Lazy import to avoid CUDA initialization problems.
     import deep_gemm as dg
+
     block = dg.get_m_alignment_for_contiguous_layout()
     return [block, block]
 
 
-def expert_num_tokens_round_up_and_sum(expert_num_tokens: torch.Tensor,
-                                       alignment: int) -> int:
+def expert_num_tokens_round_up_and_sum(
+    expert_num_tokens: torch.Tensor, alignment: int
+) -> int:
     # Round up each element in expert_num_tokens to the nearest multiple of
     # alignment.
-    ent = (expert_num_tokens.to(torch.int64) +
-           (alignment - 1)) // alignment * alignment
+    ent = (expert_num_tokens.to(torch.int64) + (alignment - 1)) // alignment * alignment
     return torch.sum(ent).item()
 
 
-def compute_aligned_M(M: int, num_topk: int, local_num_experts: int,
-                      alignment: int,
-                      expert_tokens_meta: Optional[mk.ExpertTokensMetadata]):
-
-    if ((expert_tokens_meta is not None)
-            and (expert_tokens_meta.expert_num_tokens_cpu is not None)):
+def compute_aligned_M(
+    M: int,
+    num_topk: int,
+    local_num_experts: int,
+    alignment: int,
+    expert_tokens_meta: Optional[mk.ExpertTokensMetadata],
+):
+    if (expert_tokens_meta is not None) and (
+        expert_tokens_meta.expert_num_tokens_cpu is not None
+    ):
         return expert_num_tokens_round_up_and_sum(
-            expert_tokens_meta.expert_num_tokens_cpu, alignment=alignment)
+            expert_tokens_meta.expert_num_tokens_cpu, alignment=alignment
+        )
 
     # expert_num_tokens information is not available on the cpu.
     # compute the max required size.
@@ -74,14 +80,14 @@ def _fwd_kernel_ep_scatter_1(
     cur_expert = tl.program_id(0)
 
     offset_cumsum = tl.arange(0, BLOCK_EXPERT_NUM)
-    tokens_per_expert = tl.load(num_recv_tokens_per_expert + offset_cumsum,
-                                mask=offset_cumsum < num_experts,
-                                other=0)
+    tokens_per_expert = tl.load(
+        num_recv_tokens_per_expert + offset_cumsum,
+        mask=offset_cumsum < num_experts,
+        other=0,
+    )
     tokens_per_expert = round_up_128(tokens_per_expert)
     cumsum = tl.cumsum(tokens_per_expert) - tokens_per_expert
-    tl.store(expert_start_loc + offset_cumsum,
-             cumsum,
-             mask=offset_cumsum < num_experts)
+    tl.store(expert_start_loc + offset_cumsum, cumsum, mask=offset_cumsum < num_experts)
 
     cur_expert_start = tl.load(expert_start_loc + cur_expert)
     cur_expert_token_num = tl.load(num_recv_tokens_per_expert + cur_expert)
@@ -136,34 +142,31 @@ def _fwd_kernel_ep_scatter_2(
     mask_s = offset_in_s < SCALE_HIDDEN_SIZE
 
     for token_id in range(start_token_id, total_token_num, grid_num):
-        to_copy = tl.load(recv_x + token_id * recv_x_stride0 + offset_in,
-                          mask=mask)
-        to_copy_s = tl.load(recv_x_scale + token_id * recv_x_scale_stride0 +
-                            offset_in_s,
-                            mask=mask_s)
+        to_copy = tl.load(recv_x + token_id * recv_x_stride0 + offset_in, mask=mask)
+        to_copy_s = tl.load(
+            recv_x_scale + token_id * recv_x_scale_stride0 + offset_in_s, mask=mask_s
+        )
 
         for topk_index in tl.range(0, topk_num, 1, num_stages=4):
-            expert_id = tl.load(recv_topk + token_id * recv_topk_stride0 +
-                                topk_index)
+            expert_id = tl.load(recv_topk + token_id * recv_topk_stride0 + topk_index)
 
             if HAS_EXPERT_MAP:
                 expert_id = apply_expert_map(expert_id, expert_map)
 
             if expert_id >= 0:
-                dest_token_index = tl.atomic_add(expert_start_loc + expert_id,
-                                                 1)
+                dest_token_index = tl.atomic_add(expert_start_loc + expert_id, 1)
                 tl.store(
-                    output_index + token_id * output_index_stride0 +
-                    topk_index, dest_token_index)
-                output_tensor_ptr = (output_tensor +
-                                     dest_token_index * output_tensor_stride0)
+                    output_index + token_id * output_index_stride0 + topk_index,
+                    dest_token_index,
+                )
+                output_tensor_ptr = (
+                    output_tensor + dest_token_index * output_tensor_stride0
+                )
                 output_tensor_scale_ptr = (
-                    output_tensor_scale +
-                    dest_token_index * output_tensor_scale_stride0)
+                    output_tensor_scale + dest_token_index * output_tensor_scale_stride0
+                )
                 tl.store(output_tensor_ptr + offset_in, to_copy, mask=mask)
-                tl.store(output_tensor_scale_ptr + offset_in_s,
-                         to_copy_s,
-                         mask=mask_s)
+                tl.store(output_tensor_scale_ptr + offset_in_s, to_copy_s, mask=mask_s)
 
 
 @torch.no_grad()
@@ -189,7 +192,7 @@ def ep_scatter(
 
     assert m_indices.shape[0] % BLOCK_E == 0
 
-    _fwd_kernel_ep_scatter_1[(grid, )](
+    _fwd_kernel_ep_scatter_1[(grid,)](
         num_recv_tokens_per_expert,
         expert_start_loc,
         m_indices,
@@ -201,7 +204,7 @@ def ep_scatter(
 
     grid = min(recv_topk.shape[0], 1024 * 8)
 
-    _fwd_kernel_ep_scatter_2[(grid, )](
+    _fwd_kernel_ep_scatter_2[(grid,)](
         recv_topk.shape[0],
         expert_start_loc,
         recv_x,
@@ -265,27 +268,33 @@ def _fwd_kernel_ep_gather(
         off_d = tl.arange(0, BLOCK_D)
         accumulator = tl.zeros([BLOCK_D], dtype=tl.float32)
         for topk_index in range(0, topk_num):
-            expert_id = tl.load(recv_topk_ids +
-                                cur_token * recv_topk_ids_stride0 + topk_index)
+            expert_id = tl.load(
+                recv_topk_ids + cur_token * recv_topk_ids_stride0 + topk_index
+            )
 
             if HAS_EXPERT_MAP:
                 expert_id = apply_expert_map(expert_id, expert_map)
 
             if expert_id >= 0:
-                source_token_index = tl.load(input_index +
-                                             cur_token * input_index_stride0 +
-                                             topk_index)
-                acc_weight = tl.load(recv_topk_weight +
-                                     cur_token * recv_topk_weight_stride0 +
-                                     topk_index)
-                tmp = tl.load(input_tensor +
-                              source_token_index * input_tensor_stride0 +
-                              cur_block * BLOCK_D + off_d)
+                source_token_index = tl.load(
+                    input_index + cur_token * input_index_stride0 + topk_index
+                )
+                acc_weight = tl.load(
+                    recv_topk_weight + cur_token * recv_topk_weight_stride0 + topk_index
+                )
+                tmp = tl.load(
+                    input_tensor
+                    + source_token_index * input_tensor_stride0
+                    + cur_block * BLOCK_D
+                    + off_d
+                )
                 accumulator += tmp.to(tl.float32) * acc_weight
 
         tl.store(
-            output_tensor + cur_token * output_tensor_stride0 +
-            cur_block * BLOCK_D + off_d,
+            output_tensor
+            + cur_token * output_tensor_stride0
+            + cur_block * BLOCK_D
+            + off_d,
             accumulator.to(output_tensor.dtype.element_ty),
         )
 
@@ -332,44 +341,46 @@ def ep_gather(
     return
 
 
-def deepgemm_moe_permute(aq: torch.Tensor,
-                         aq_scale: torch.Tensor,
-                         topk_ids: torch.Tensor,
-                         local_num_experts: int,
-                         expert_map: Optional[torch.Tensor],
-                         expert_tokens_meta: Optional[mk.ExpertTokensMetadata],
-                         aq_out: Optional[torch.Tensor] = None):
-
+def deepgemm_moe_permute(
+    aq: torch.Tensor,
+    aq_scale: torch.Tensor,
+    topk_ids: torch.Tensor,
+    local_num_experts: int,
+    expert_map: Optional[torch.Tensor],
+    expert_tokens_meta: Optional[mk.ExpertTokensMetadata],
+    aq_out: Optional[torch.Tensor] = None,
+):
     assert aq.ndim == 2
-    assert topk_ids.dtype.is_signed, (
-        "The kernel uses -1 to represent invalid topk_ids")
+    assert topk_ids.dtype.is_signed, "The kernel uses -1 to represent invalid topk_ids"
     H = aq.size(1)
     device = aq.device
 
     block_m = deep_gemm_block_shape()[0]
     block_k = deep_gemm_block_shape()[1]
 
-    M_sum = compute_aligned_M(M=topk_ids.size(0),
-                              num_topk=topk_ids.size(1),
-                              local_num_experts=local_num_experts,
-                              alignment=block_m,
-                              expert_tokens_meta=expert_tokens_meta)
+    M_sum = compute_aligned_M(
+        M=topk_ids.size(0),
+        num_topk=topk_ids.size(1),
+        local_num_experts=local_num_experts,
+        alignment=block_m,
+        expert_tokens_meta=expert_tokens_meta,
+    )
 
-    expert_start_loc = torch.empty((local_num_experts),
-                                   device=device,
-                                   dtype=torch.int32)
+    expert_start_loc = torch.empty(
+        (local_num_experts), device=device, dtype=torch.int32
+    )
 
     assert aq_out is None or aq_out.shape == (M_sum, H)
     if aq_out is None:
         aq_out = torch.empty((M_sum, H), device=device, dtype=aq.dtype)
 
-    aq_scale_out = torch.empty((M_sum, H // block_k),
-                               device=device,
-                               dtype=torch.float32)
+    aq_scale_out = torch.empty(
+        (M_sum, H // block_k), device=device, dtype=torch.float32
+    )
 
-    maybe_has_empty_blocks = ((expert_tokens_meta is None)
-                              or (expert_tokens_meta.expert_num_tokens_cpu
-                                  is None))
+    maybe_has_empty_blocks = (expert_tokens_meta is None) or (
+        expert_tokens_meta.expert_num_tokens_cpu is None
+    )
     expert_ids_init = torch.zeros if maybe_has_empty_blocks else torch.empty
 
     expert_ids = expert_ids_init((M_sum), device=device, dtype=torch.int32)
@@ -379,35 +390,39 @@ def deepgemm_moe_permute(aq: torch.Tensor,
     if expert_tokens_meta is not None:
         expert_num_tokens = expert_tokens_meta.expert_num_tokens
     else:
-        expert_num_tokens = count_expert_num_tokens(topk_ids,
-                                                    local_num_experts,
-                                                    expert_map)
-
-    ep_scatter(recv_x=aq,
-               recv_x_scale=aq_scale,
-               recv_topk=topk_ids,
-               num_recv_tokens_per_expert=expert_num_tokens,
-               expert_start_loc=expert_start_loc,
-               expert_map=expert_map,
-               output_tensor=aq_out,
-               output_tensor_scale=aq_scale_out,
-               m_indices=expert_ids,
-               output_index=inv_perm)
+        expert_num_tokens = count_expert_num_tokens(
+            topk_ids, local_num_experts, expert_map
+        )
+
+    ep_scatter(
+        recv_x=aq,
+        recv_x_scale=aq_scale,
+        recv_topk=topk_ids,
+        num_recv_tokens_per_expert=expert_num_tokens,
+        expert_start_loc=expert_start_loc,
+        expert_map=expert_map,
+        output_tensor=aq_out,
+        output_tensor_scale=aq_scale_out,
+        m_indices=expert_ids,
+        output_index=inv_perm,
+    )
 
     return aq_out, aq_scale_out, expert_ids, inv_perm
 
 
 def deepgemm_unpermute_and_reduce(
-        a: torch.Tensor,  # Grouped gemm output
-        topk_ids: torch.Tensor,
-        topk_weights: torch.Tensor,
-        inv_perm: torch.Tensor,
-        expert_map: Optional[torch.Tensor],
-        output: torch.Tensor):
-
-    return ep_gather(input_tensor=a,
-                     recv_topk_ids=topk_ids,
-                     recv_topk_weight=topk_weights,
-                     input_index=inv_perm,
-                     expert_map=expert_map,
-                     output_tensor=output)
+    a: torch.Tensor,  # Grouped gemm output
+    topk_ids: torch.Tensor,
+    topk_weights: torch.Tensor,
+    inv_perm: torch.Tensor,
+    expert_map: Optional[torch.Tensor],
+    output: torch.Tensor,
+):
+    return ep_gather(
+        input_tensor=a,
+        recv_topk_ids=topk_ids,
+        recv_topk_weight=topk_weights,
+        input_index=inv_perm,
+        expert_map=expert_map,
+        output_tensor=output,
+    )
diff --git a/vllm/model_executor/layers/fused_moe/deepep_ht_prepare_finalize.py b/vllm/model_executor/layers/fused_moe/deepep_ht_prepare_finalize.py
index 9e9a9afc18a0..9a2844b7d998 100644
--- a/vllm/model_executor/layers/fused_moe/deepep_ht_prepare_finalize.py
+++ b/vllm/model_executor/layers/fused_moe/deepep_ht_prepare_finalize.py
@@ -8,15 +8,20 @@
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
-    TopKWeightAndReduceContiguous, TopKWeightAndReduceDelegate)
-from vllm.model_executor.layers.fused_moe.utils import (
-    moe_kernel_quantize_input)
+    TopKWeightAndReduceContiguous,
+    TopKWeightAndReduceDelegate,
+)
+from vllm.model_executor.layers.fused_moe.utils import moe_kernel_quantize_input
 from vllm.utils import round_up
 from vllm.v1.worker.ubatching import (
-    dbo_current_ubatch_id, dbo_enabled, dbo_switch_to_comm,
-    dbo_switch_to_compute, dbo_switch_to_compute_sync,
+    dbo_current_ubatch_id,
+    dbo_enabled,
+    dbo_switch_to_comm,
+    dbo_switch_to_compute,
+    dbo_switch_to_compute_sync,
     dbo_yield_and_switch_from_comm_to_compute,
-    dbo_yield_and_switch_from_compute_to_comm)
+    dbo_yield_and_switch_from_compute_to_comm,
+)
 
 
 class DeepEPHTPrepareAndFinalize(mk.FusedMoEPrepareAndFinalize):
@@ -25,8 +30,7 @@ class DeepEPHTPrepareAndFinalize(mk.FusedMoEPrepareAndFinalize):
     """
 
     @staticmethod
-    def maybe_roundup_layer_hidden_size(hidden_size: int,
-                                        dtype: torch.dtype) -> int:
+    def maybe_roundup_layer_hidden_size(hidden_size: int, dtype: torch.dtype) -> int:
         # Round up hidden size so it is compatible with DeepEP High Throughput
         # kernels.
         # DeepEP intranode kernels make copies in units of,
@@ -41,8 +45,13 @@ def maybe_roundup_layer_hidden_size(hidden_size: int,
         hidden_size_bytes = round_up(hidden_size_bytes, xfer_atom_size)
         return hidden_size_bytes // dtype.itemsize
 
-    def __init__(self, buffer: deep_ep.Buffer, num_dispatchers: int,
-                 dp_size: int, rank_expert_offset: int):
+    def __init__(
+        self,
+        buffer: deep_ep.Buffer,
+        num_dispatchers: int,
+        dp_size: int,
+        rank_expert_offset: int,
+    ):
         super().__init__()
         self.buffer = buffer
         self.num_dispatchers_ = num_dispatchers
@@ -91,7 +100,6 @@ def _do_dispatch(
         a1_scale: Optional[torch.Tensor],
         quant_config: FusedMoEQuantConfig,
     ) -> Callable:
-
         has_scales = token_scales is not None
 
         # We yield before launching the dispatch kernel since the dispatch
@@ -99,22 +107,31 @@ def _do_dispatch(
         # for the other ubatch before the dispatch kernel starts.
         dbo_yield_and_switch_from_compute_to_comm()
 
-        (num_tokens_per_rank, num_tokens_per_rdma_rank,
-         dispatch_expert_num_tokens, is_token_in_rank,
-         event) = self.buffer.get_dispatch_layout(
-             topk_idx=rank_topk_ids,
-             num_experts=num_experts,
-             previous_event=None,
-             async_finish=False,
-             allocate_on_comm_stream=False)
+        (
+            num_tokens_per_rank,
+            num_tokens_per_rdma_rank,
+            dispatch_expert_num_tokens,
+            is_token_in_rank,
+            event,
+        ) = self.buffer.get_dispatch_layout(
+            topk_idx=rank_topk_ids,
+            num_experts=num_experts,
+            previous_event=None,
+            async_finish=False,
+            allocate_on_comm_stream=False,
+        )
 
         token_data = tokens
         if has_scales:
             token_data = (tokens, token_scales)
 
         (
-            token_data, expert_topk_ids, expert_topk_weights,
-            expert_num_tokens_per_expert_list, handle, event
+            token_data,
+            expert_topk_ids,
+            expert_topk_weights,
+            expert_num_tokens_per_expert_list,
+            handle,
+            event,
         ) = self.buffer.dispatch(
             x=token_data,
             handle=None,
@@ -130,7 +147,8 @@ def _do_dispatch(
             config=self._get_dispatch_config(),
             previous_event=None,
             async_finish=self.async_prepare and not dbo_enabled(),
-            allocate_on_comm_stream=False)
+            allocate_on_comm_stream=False,
+        )
 
         # record the handle for this ubatch
         a2a_idx = dbo_current_ubatch_id()
@@ -185,13 +203,15 @@ def _receiver(
         expert_topk_ids = torch.where(
             expert_topk_ids == -1,
             num_experts - 1 if self.rank_expert_offset == 0 else 0,
-            expert_topk_ids + self.rank_expert_offset)
+            expert_topk_ids + self.rank_expert_offset,
+        )
 
         # Makes a GPU-CPU copy.
         # TODO (varun): Maybe it is better to re-compute the expert_num_tokens
         # on GPU.
         expert_tokens_meta = mk.ExpertTokensMetadata.make_from_list(
-            expert_num_tokens_per_expert_list, device=expert_x.device)
+            expert_num_tokens_per_expert_list, device=expert_x.device
+        )
 
         # Dispatch and Quant
         # DeepEP kernels only support dispatching block-quantized
@@ -206,10 +226,16 @@ def _receiver(
                     a1_scale,
                     quant_dtype=quant_config.quant_dtype,
                     per_act_token_quant=False,
-                    block_shape=quant_config.block_shape)
+                    block_shape=quant_config.block_shape,
+                )
 
-        return (expert_x, expert_x_scale, expert_tokens_meta, expert_topk_ids,
-                expert_topk_weights)
+        return (
+            expert_x,
+            expert_x_scale,
+            expert_tokens_meta,
+            expert_topk_ids,
+            expert_topk_weights,
+        )
 
     def supports_async(self) -> bool:
         return True
@@ -224,12 +250,12 @@ def prepare_async(
         apply_router_weight_on_input: bool,
         quant_config: FusedMoEQuantConfig,
     ) -> mk.ReceiverType:
-
         if apply_router_weight_on_input:
             topk = topk_ids.size(1)
             # TODO: this only works for topK=1, will need to update for topK>1
             assert topk == 1, (
-                "apply_router_weight_on_input is only implemented for topk=1")
+                "apply_router_weight_on_input is only implemented for topk=1"
+            )
             a1 = a1 * topk_weights.to(a1.dtype)
 
         if quant_config.is_block_quantized:
@@ -249,13 +275,15 @@ def prepare_async(
             a1q_scale = None
             a1_post_scale = quant_config.a1_scale
 
-        return self._do_dispatch(tokens=a1q,
-                                 token_scales=a1q_scale,
-                                 rank_topk_ids=topk_ids,
-                                 rank_topk_weights=topk_weights,
-                                 num_experts=num_experts,
-                                 a1_scale=a1_post_scale,
-                                 quant_config=quant_config)
+        return self._do_dispatch(
+            tokens=a1q,
+            token_scales=a1q_scale,
+            rank_topk_ids=topk_ids,
+            rank_topk_weights=topk_weights,
+            num_experts=num_experts,
+            a1_scale=a1_post_scale,
+            quant_config=quant_config,
+        )
 
     def prepare(
         self,
@@ -267,9 +295,15 @@ def prepare(
         apply_router_weight_on_input: bool,
         quant_config: FusedMoEQuantConfig,
     ) -> mk.PrepareResultType:
-        receiver = self.prepare_async(a1, topk_weights, topk_ids, num_experts,
-                                      expert_map, apply_router_weight_on_input,
-                                      quant_config)
+        receiver = self.prepare_async(
+            a1,
+            topk_weights,
+            topk_ids,
+            num_experts,
+            expert_map,
+            apply_router_weight_on_input,
+            quant_config,
+        )
         return receiver()
 
     def _finalize(
@@ -282,7 +316,6 @@ def _finalize(
         weight_and_reduce_impl: mk.TopKWeightAndReduce,
         do_async: bool,
     ) -> Optional[Callable]:
-
         a2a_idx = dbo_current_ubatch_id()
         handle = self.handles[a2a_idx]
         assert handle is not None
@@ -307,7 +340,8 @@ def _finalize(
             config=self._get_combine_config(),
             previous_event=None,
             async_finish=do_async and not dbo_enabled(),
-            allocate_on_comm_stream=False)
+            allocate_on_comm_stream=False,
+        )
 
         dbo_switch_to_compute()
 
@@ -341,9 +375,15 @@ def finalize_async(
         apply_router_weight_on_input: bool,
         weight_and_reduce_impl: mk.TopKWeightAndReduce,
     ) -> Callable:
-        receiver = self._finalize(output, fused_expert_output, topk_weights,
-                                  topk_ids, apply_router_weight_on_input,
-                                  weight_and_reduce_impl, True)
+        receiver = self._finalize(
+            output,
+            fused_expert_output,
+            topk_weights,
+            topk_ids,
+            apply_router_weight_on_input,
+            weight_and_reduce_impl,
+            True,
+        )
         assert receiver is not None
         return receiver
 
@@ -356,6 +396,12 @@ def finalize(
         apply_router_weight_on_input: bool,
         weight_and_reduce_impl: mk.TopKWeightAndReduce,
     ) -> None:
-        self._finalize(output, fused_expert_output, topk_weights, topk_ids,
-                       apply_router_weight_on_input, weight_and_reduce_impl,
-                       False)
+        self._finalize(
+            output,
+            fused_expert_output,
+            topk_weights,
+            topk_ids,
+            apply_router_weight_on_input,
+            weight_and_reduce_impl,
+            False,
+        )
diff --git a/vllm/model_executor/layers/fused_moe/deepep_ll_prepare_finalize.py b/vllm/model_executor/layers/fused_moe/deepep_ll_prepare_finalize.py
index a9554291db69..6712995b52af 100644
--- a/vllm/model_executor/layers/fused_moe/deepep_ll_prepare_finalize.py
+++ b/vllm/model_executor/layers/fused_moe/deepep_ll_prepare_finalize.py
@@ -8,19 +8,26 @@
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
-    TopKWeightAndReduceDelegate)
+    TopKWeightAndReduceDelegate,
+)
 from vllm.model_executor.layers.fused_moe.utils import (
-    moe_kernel_quantize_input, normalize_batched_scales_shape)
-from vllm.v1.worker.ubatching import (dbo_current_ubatch_id, dbo_enabled,
-                                      dbo_maybe_run_recv_hook)
+    moe_kernel_quantize_input,
+    normalize_batched_scales_shape,
+)
+from vllm.v1.worker.ubatching import (
+    dbo_current_ubatch_id,
+    dbo_enabled,
+    dbo_maybe_run_recv_hook,
+)
 
 # DeepEP kernels quantize dispatch inputs in 128 element chunks.
 DEEPEP_QUANT_BLOCK_SIZE = 128
 DEEPEP_QUANT_BLOCK_SHAPE = [DEEPEP_QUANT_BLOCK_SIZE, DEEPEP_QUANT_BLOCK_SIZE]
 
 
-def dequant_fp8(expert_x_fp8: torch.Tensor,
-                expert_x_scales: torch.Tensor) -> torch.Tensor:
+def dequant_fp8(
+    expert_x_fp8: torch.Tensor, expert_x_scales: torch.Tensor
+) -> torch.Tensor:
     """
     Return dequantized tensor in fp32
     """
@@ -30,7 +37,8 @@ def dequant_fp8(expert_x_fp8: torch.Tensor,
     num_experts = expert_x_fp8.size(0)
 
     expert_x_fp32 = expert_x_fp8.to(torch.float32).view(
-        num_experts, -1, DEEPEP_QUANT_BLOCK_SIZE)
+        num_experts, -1, DEEPEP_QUANT_BLOCK_SIZE
+    )
     expert_x_scales = expert_x_scales.view(num_experts, -1, 1)
     return (expert_x_fp32 * expert_x_scales).view(expert_x_fp8.size())
 
@@ -44,11 +52,13 @@ class DeepEPLLPrepareAndFinalize(mk.FusedMoEPrepareAndFinalize):
     # specific hidden sizes.
     SUPPORTED_HIDDEN_SIZES = [2048, 2560, 4096, 5120, 6144, 7168]
 
-    def __init__(self,
-                 buffer: deep_ep.Buffer,
-                 max_tokens_per_rank: int,
-                 num_dispatchers: int,
-                 use_fp8_dispatch: bool = False):
+    def __init__(
+        self,
+        buffer: deep_ep.Buffer,
+        max_tokens_per_rank: int,
+        num_dispatchers: int,
+        use_fp8_dispatch: bool = False,
+    ):
         super().__init__()
 
         self.buffer = buffer
@@ -79,10 +89,12 @@ def _do_quant(
         a1_dtype: torch.dtype,
         quant_config: FusedMoEQuantConfig,
     ) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
-
         if self.use_fp8_dispatch:
-            block_k = quant_config.block_shape[
-                1] if quant_config.block_shape is not None else None
+            block_k = (
+                quant_config.block_shape[1]
+                if quant_config.block_shape is not None
+                else None
+            )
             if block_k == DEEPEP_QUANT_BLOCK_SIZE:
                 # DeepEP kernels did the quantization for us.
                 x, x_scales = x
@@ -99,8 +111,12 @@ def _do_quant(
         # TODO (varun): Optimization - Use a batched version of quant
         x = x.view((-1, hidden_dim))
         x, x_scales = moe_kernel_quantize_input(
-            x, quant_config.a1_scale, quant_config.quant_dtype,
-            quant_config.per_act_token_quant, quant_config.block_shape)
+            x,
+            quant_config.a1_scale,
+            quant_config.quant_dtype,
+            quant_config.per_act_token_quant,
+            quant_config.block_shape,
+        )
         x = x.view((num_experts, -1, hidden_dim))
 
         if quant_config.quant_dtype is not None:
@@ -122,47 +138,62 @@ def prepare_async(
         apply_router_weight_on_input: bool,
         quant_config: FusedMoEQuantConfig,
     ) -> tuple[Callable, mk.ReceiverType]:
-
         hidden_size = a1.size(1)
-        assert hidden_size in self.SUPPORTED_HIDDEN_SIZES, \
-            (f"Hidden Size {hidden_size} not in supported list of hidden sizes"
-            f"{self.SUPPORTED_HIDDEN_SIZES}")
+        assert hidden_size in self.SUPPORTED_HIDDEN_SIZES, (
+            f"Hidden Size {hidden_size} not in supported list of hidden sizes"
+            f"{self.SUPPORTED_HIDDEN_SIZES}"
+        )
 
         a2a_idx = dbo_current_ubatch_id()
 
         if self.use_fp8_dispatch:
-            assert hidden_size % 128 == 0, \
-            "DeepEP kernels quantize the inputs in blocks of shape 128"
-
-        has_per_token_scales = quant_config.a1_scale.numel(
-        ) != 1 if quant_config.a1_scale is not None else (
-            quant_config.a2_scale.numel() != 1
-            if quant_config.a2_scale is not None else False)
+            assert hidden_size % 128 == 0, (
+                "DeepEP kernels quantize the inputs in blocks of shape 128"
+            )
+
+        has_per_token_scales = (
+            quant_config.a1_scale.numel() != 1
+            if quant_config.a1_scale is not None
+            else (
+                quant_config.a2_scale.numel() != 1
+                if quant_config.a2_scale is not None
+                else False
+            )
+        )
         assert not has_per_token_scales, (
-            "low_latency kernels doesn't support dispatching per-token scales")
+            "low_latency kernels doesn't support dispatching per-token scales"
+        )
 
         if apply_router_weight_on_input:
             topk = topk_ids.size(1)
             # TODO: this only works for topK=1, will need to update for topK>1
             assert topk == 1, (
-                "apply_router_weight_on_input is only implemented for topk=1")
+                "apply_router_weight_on_input is only implemented for topk=1"
+            )
             a1 = a1 * topk_weights.to(a1.dtype)
 
         # Dispatch
-        expert_x, expert_num_tokens, handle, _, hook= \
-                self.buffer.low_latency_dispatch(a1,
-                                                topk_ids,
-                                                self.max_tokens_per_rank,
-                                                num_experts,
-                                                use_fp8=self.use_fp8_dispatch,
-                                                async_finish=False,
-                                                return_recv_hook=True)
+        expert_x, expert_num_tokens, handle, _, hook = self.buffer.low_latency_dispatch(
+            a1,
+            topk_ids,
+            self.max_tokens_per_rank,
+            num_experts,
+            use_fp8=self.use_fp8_dispatch,
+            async_finish=False,
+            return_recv_hook=True,
+        )
         self.handles[a2a_idx] = handle
 
         return (
             hook,
-            lambda: self._receiver(expert_x, expert_num_tokens, quant_config.
-                                   a1_scale, a1.dtype, quant_config))
+            lambda: self._receiver(
+                expert_x,
+                expert_num_tokens,
+                quant_config.a1_scale,
+                a1.dtype,
+                quant_config,
+            ),
+        )
 
     def _receiver(
         self,
@@ -172,11 +203,11 @@ def _receiver(
         a1_dtype: torch.dtype,
         quant_config: FusedMoEQuantConfig,
     ) -> mk.PrepareResultType:
-        expert_x, expert_x_scale = self._do_quant(expert_x, a1_dtype,
-                                                  quant_config)
+        expert_x, expert_x_scale = self._do_quant(expert_x, a1_dtype, quant_config)
 
         expert_tokens_meta = mk.ExpertTokensMetadata(
-            expert_num_tokens=expert_num_tokens, expert_num_tokens_cpu=None)
+            expert_num_tokens=expert_num_tokens, expert_num_tokens_cpu=None
+        )
 
         return expert_x, expert_x_scale, expert_tokens_meta, None, None
 
@@ -190,10 +221,15 @@ def prepare(
         apply_router_weight_on_input: bool,
         quant_config: FusedMoEQuantConfig,
     ) -> mk.PrepareResultType:
-        hook, receiver = self.prepare_async(a1, topk_weights, topk_ids,
-                                            num_experts, expert_map,
-                                            apply_router_weight_on_input,
-                                            quant_config)
+        hook, receiver = self.prepare_async(
+            a1,
+            topk_weights,
+            topk_ids,
+            num_experts,
+            expert_map,
+            apply_router_weight_on_input,
+            quant_config,
+        )
         hook()
         return receiver()
 
@@ -207,9 +243,9 @@ def _finalize(
         weight_and_reduce_impl: mk.TopKWeightAndReduce,
         do_async: bool,
     ) -> tuple[Callable, Callable]:
-        assert isinstance(
-            weight_and_reduce_impl, TopKWeightAndReduceDelegate
-        ), ("Weight application and reduction happens in the combine kernel.")
+        assert isinstance(weight_and_reduce_impl, TopKWeightAndReduceDelegate), (
+            "Weight application and reduction happens in the combine kernel."
+        )
 
         a2a_idx = dbo_current_ubatch_id()
         do_recv_hook = dbo_enabled() or do_async
@@ -231,7 +267,8 @@ def _finalize(
             async_finish=False,
             zero_copy=False,
             return_recv_hook=do_recv_hook,
-            out=output)
+            out=output,
+        )
 
         return recv_hook, lambda: None
 
diff --git a/vllm/model_executor/layers/fused_moe/flashinfer_cutlass_moe.py b/vllm/model_executor/layers/fused_moe/flashinfer_cutlass_moe.py
index 3ea4ed39e956..a2d8fe0da154 100644
--- a/vllm/model_executor/layers/fused_moe/flashinfer_cutlass_moe.py
+++ b/vllm/model_executor/layers/fused_moe/flashinfer_cutlass_moe.py
@@ -8,40 +8,47 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.fused_moe.flashinfer_cutlass_prepare_finalize import (  # noqa: E501
-    create_flashinfer_prepare_finalize)
+    create_flashinfer_prepare_finalize,
+)
 from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
-    TopKWeightAndReduceNoOP)
-from vllm.utils.flashinfer import (flashinfer_cutlass_fused_moe,
-                                   has_flashinfer_cutlass_fused_moe)
+    TopKWeightAndReduceNoOP,
+)
+from vllm.utils.flashinfer import (
+    flashinfer_cutlass_fused_moe,
+    has_flashinfer_cutlass_fused_moe,
+)
 
 logger = init_logger(__name__)
 
 
-def is_valid_flashinfer_cutlass_fused_moe(hidden_states: torch.Tensor,
-                                          w1: torch.Tensor,
-                                          w2: torch.Tensor) -> bool:
+def is_valid_flashinfer_cutlass_fused_moe(
+    hidden_states: torch.Tensor, w1: torch.Tensor, w2: torch.Tensor
+) -> bool:
     """
     Check if the given problem size is supported by the FlashInfer CUTLASS MoE
     kernel.
     """
     if not has_flashinfer_cutlass_fused_moe():
-        logger.debug_once("FlashInferExperts disabled: "
-                          "flashinfer_cutlass_fused_moe not available.")
+        logger.debug_once(
+            "FlashInferExperts disabled: flashinfer_cutlass_fused_moe not available."
+        )
         return False
     # Data type checks
-    if (w1.dtype != torch.uint8 or w2.dtype != torch.uint8
-            or hidden_states.dtype
-            not in [torch.float32, torch.float16, torch.bfloat16]):
+    if (
+        w1.dtype != torch.uint8
+        or w2.dtype != torch.uint8
+        or hidden_states.dtype not in [torch.float32, torch.float16, torch.bfloat16]
+    ):
         logger.debug_once(
             "FlashInferExperts disabled: w1/w2 must be torch.uint8 "
             f"(got w1={w1.dtype}, w2={w2.dtype}), hidden_states must be "
-            f"float32, float16, or bfloat16 (got {hidden_states.dtype}).")
+            f"float32, float16, or bfloat16 (got {hidden_states.dtype})."
+        )
         return False
     return True
 
 
 class FlashInferExperts(mk.FusedMoEPermuteExpertsUnpermute):
-
     def __init__(
         self,
         out_dtype: torch.dtype,
@@ -52,10 +59,10 @@ def __init__(
         tp_size: int = 1,
     ):
         super().__init__(quant_config)
-        assert quant_config.quant_dtype in (
-            "nvfp4", torch.float8_e4m3fn,
-            None), ("Only nvfp4, fp8, bfloat16 and"
-                    " float16 quantization are currently supported.")
+        assert quant_config.quant_dtype in ("nvfp4", torch.float8_e4m3fn, None), (
+            "Only nvfp4, fp8, bfloat16 and"
+            " float16 quantization are currently supported."
+        )
         self.ep_rank = ep_rank
         self.ep_size = ep_size
         self.tp_rank = tp_rank
@@ -64,10 +71,12 @@ def __init__(
 
     @property
     def activation_formats(
-        self
+        self,
     ) -> tuple[mk.FusedMoEActivationFormat, mk.FusedMoEActivationFormat]:
-        return (mk.FusedMoEActivationFormat.Standard,
-                mk.FusedMoEActivationFormat.Standard)
+        return (
+            mk.FusedMoEActivationFormat.Standard,
+            mk.FusedMoEActivationFormat.Standard,
+        )
 
     def supports_expert_map(self) -> bool:
         return False
@@ -110,10 +119,8 @@ def workspace_shapes(
           of each tuple must be the number of tokens.
         """
         aq_m, aq_n = aq.shape
-        workspace2 = (0, )
-        output_shape = (aq_m,
-                        aq_n * 2) if self.quant_dtype == "nvfp4" else (aq_m,
-                                                                       aq_n)
+        workspace2 = (0,)
+        output_shape = (aq_m, aq_n * 2) if self.quant_dtype == "nvfp4" else (aq_m, aq_n)
         workspace_dtype = a.dtype
         workspace1 = output_shape
         # The workspace is determined by `aq`, since it comes after any
@@ -138,13 +145,16 @@ def apply(
         expert_tokens_meta: Optional[mk.ExpertTokensMetadata],
         apply_router_weight_on_input: Optional[bool],
     ):
-
-        assert activation == "silu", ("Only activation silu is supported in "
-                                      "FlashInferExperts")
+        assert activation == "silu", (
+            "Only activation silu is supported in FlashInferExperts"
+        )
 
         if self.quant_dtype == torch.float8_e4m3fn:
             quant_scales = [
-                self.g1_alphas, self.a2_gscale, self.g2_alphas, self.a1_gscale
+                self.g1_alphas,
+                self.a2_gscale,
+                self.g2_alphas,
+                self.a1_gscale,
             ]
 
             a1q_scale = None  # not passing input_sf in fp8
@@ -153,8 +163,8 @@ def apply(
         elif self.quant_dtype == "nvfp4":
             # Ensure w1_scale and w2_scale are not None before calling view
             assert self.w1_scale is not None and self.w2_scale is not None, (
-                "w1_scale and w2_scale must not "
-                "be None for FlashInferExperts")
+                "w1_scale and w2_scale must not be None for FlashInferExperts"
+            )
             # Flashinfer CUTLASS kernel takes scalar global scales,
             # min because inv_scale.
             quant_scales = [
@@ -209,7 +219,8 @@ def flashinfer_cutlass_moe_fp4(
         FlashInferExperts(
             out_dtype=hidden_states.dtype,
             quant_config=quant_config,
-        ))
+        ),
+    )
 
     return fused_experts(
         hidden_states=hidden_states,
@@ -252,7 +263,8 @@ def flashinfer_cutlass_moe(
             tp_size=tp_size,
             ep_rank=ep_rank,
             ep_size=ep_size,
-        ))
+        ),
+    )
 
     return fused_experts(
         hidden_states=hidden_states,
diff --git a/vllm/model_executor/layers/fused_moe/flashinfer_cutlass_prepare_finalize.py b/vllm/model_executor/layers/fused_moe/flashinfer_cutlass_prepare_finalize.py
index ed364ac77b28..04bc987d0885 100644
--- a/vllm/model_executor/layers/fused_moe/flashinfer_cutlass_prepare_finalize.py
+++ b/vllm/model_executor/layers/fused_moe/flashinfer_cutlass_prepare_finalize.py
@@ -7,11 +7,11 @@
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm.distributed import get_dp_group, get_ep_group
 from vllm.distributed.device_communicators.base_device_communicator import (
-    All2AllManagerBase)
+    All2AllManagerBase,
+)
 from vllm.forward_context import get_forward_context
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
-from vllm.model_executor.layers.fused_moe.utils import (
-    moe_kernel_quantize_input)
+from vllm.model_executor.layers.fused_moe.utils import moe_kernel_quantize_input
 from vllm.utils.flashinfer import nvfp4_block_scale_interleave
 
 
@@ -55,13 +55,13 @@ def _apply_router_weight_on_input(
         """Apply router weight on input if needed."""
         if apply_router_weight_on_input:
             topk = topk_ids.size(1)
-            assert topk == 1, \
+            assert topk == 1, (
                 "apply_router_weight_on_input is only implemented for topk=1"
+            )
             a1.mul_(topk_weights.to(a1.dtype))
 
 
-class FlashInferAllToAllMoEPrepareAndFinalize(
-        FlashInferCutlassMoEPrepareAndFinalize):
+class FlashInferAllToAllMoEPrepareAndFinalize(FlashInferCutlassMoEPrepareAndFinalize):
     """FlashInfer implementation using AllToAll communication."""
 
     def __init__(
@@ -75,8 +75,7 @@ def __init__(
         # Initialize all2all_manager only for DP case
         self.all2all_manager = None
         if self.use_dp:
-            self.all2all_manager = get_ep_group(
-            ).device_communicator.all2all_manager
+            self.all2all_manager = get_ep_group().device_communicator.all2all_manager
 
     def prepare(
         self,
@@ -88,9 +87,9 @@ def prepare(
         apply_router_weight_on_input: bool,
         quant_config: FusedMoEQuantConfig,
     ) -> mk.PrepareResultType:
-
-        self._apply_router_weight_on_input(a1, topk_weights, topk_ids,
-                                           apply_router_weight_on_input)
+        self._apply_router_weight_on_input(
+            a1, topk_weights, topk_ids, apply_router_weight_on_input
+        )
 
         if not self.use_dp:
             # Non-DP case: standard quantization
@@ -107,18 +106,19 @@ def prepare(
             global_num_tokens_cpu = get_local_sizes()
             top_k = topk_ids.size(1)
 
-            (self.alltoall_info, topk_ids, topk_weights, a1q,
-             a1q_scale) = flashinfer_alltoall_dispatch(
-                 self.all2all_manager,
-                 global_num_tokens_cpu,
-                 a1,
-                 quant_config.a1_gscale,
-                 topk_ids,
-                 topk_weights,
-                 top_k,
-                 num_experts,
-                 quant_config,
-             )
+            (self.alltoall_info, topk_ids, topk_weights, a1q, a1q_scale) = (
+                flashinfer_alltoall_dispatch(
+                    self.all2all_manager,
+                    global_num_tokens_cpu,
+                    a1,
+                    quant_config.a1_gscale,
+                    topk_ids,
+                    topk_weights,
+                    top_k,
+                    num_experts,
+                    quant_config,
+                )
+            )
 
         return a1q, a1q_scale, None, topk_ids, topk_weights
 
@@ -144,9 +144,7 @@ def finalize(
         output.copy_(fused_expert_output)
 
 
-class FlashInferAllGatherMoEPrepareAndFinalize(
-        FlashInferCutlassMoEPrepareAndFinalize):
-
+class FlashInferAllGatherMoEPrepareAndFinalize(FlashInferCutlassMoEPrepareAndFinalize):
     def __init__(
         self,
         use_dp: bool,
@@ -164,9 +162,9 @@ def prepare(
         apply_router_weight_on_input: bool,
         quant_config: FusedMoEQuantConfig,
     ) -> mk.PrepareResultType:
-
-        self._apply_router_weight_on_input(a1, topk_weights, topk_ids,
-                                           apply_router_weight_on_input)
+        self._apply_router_weight_on_input(
+            a1, topk_weights, topk_ids, apply_router_weight_on_input
+        )
 
         a1q, a1q_scale = moe_kernel_quantize_input(
             a1,
@@ -177,12 +175,11 @@ def prepare(
             is_fp4_scale_swizzled=not self.use_dp,
         )
         if self.use_dp:
-            topk_weights, topk_ids, a1q, a1q_scale = \
-                get_dp_group().all_gatherv(
-                    [topk_weights, topk_ids, a1q, a1q_scale],
-                    dim=0,
-                    sizes=get_local_sizes(),
-                )
+            topk_weights, topk_ids, a1q, a1q_scale = get_dp_group().all_gatherv(
+                [topk_weights, topk_ids, a1q, a1q_scale],
+                dim=0,
+                sizes=get_local_sizes(),
+            )
             if quant_config.quant_dtype == "nvfp4":
                 a1q_scale = nvfp4_block_scale_interleave(a1q_scale)
 
@@ -197,10 +194,10 @@ def finalize(
         apply_router_weight_on_input: bool,
         weight_and_reduce_impl: mk.TopKWeightAndReduce,
     ) -> None:
-
         if self.use_dp:
             fused_expert_output = get_dp_group().reduce_scatterv(
-                fused_expert_output, dim=0, sizes=get_local_sizes())
+                fused_expert_output, dim=0, sizes=get_local_sizes()
+            )
         output.copy_(fused_expert_output)
 
 
@@ -216,13 +213,16 @@ def flashinfer_alltoall_dispatch(
     quant_config: FusedMoEQuantConfig,
 ):
     from flashinfer.comm.trtllm_alltoall import MnnvlMoe
-    assert (all2all_manager.ensure_alltoall_workspace_initialized()
-            ), "FlashInfer AllToAll workspace not available"
+
+    assert all2all_manager.ensure_alltoall_workspace_initialized(), (
+        "FlashInfer AllToAll workspace not available"
+    )
 
     ep_rank = all2all_manager.rank
     ep_size = all2all_manager.world_size
-    max_num_token = max(global_num_tokens_cpu
-                        ) if global_num_tokens_cpu is not None else x.shape[0]
+    max_num_token = (
+        max(global_num_tokens_cpu) if global_num_tokens_cpu is not None else x.shape[0]
+    )
     alltoall_info, topk_ids, topk_weights, _ = (
         MnnvlMoe.mnnvl_moe_alltoallv_prepare_without_allgather(
             topk_ids,
@@ -235,7 +235,8 @@ def flashinfer_alltoall_dispatch(
             num_experts,
             num_experts,
             top_k,
-        ))
+        )
+    )
 
     x, x_sf = moe_kernel_quantize_input(
         x,
@@ -272,8 +273,10 @@ def flashinfer_alltoall_combine(
     alltoall_info,
 ):
     from flashinfer.comm.trtllm_alltoall import MnnvlMoe
-    assert (all2all_manager.ensure_alltoall_workspace_initialized()
-            ), "FlashInfer AllToAll workspace not available"
+
+    assert all2all_manager.ensure_alltoall_workspace_initialized(), (
+        "FlashInfer AllToAll workspace not available"
+    )
     return MnnvlMoe.mnnvl_moe_alltoallv_combine(
         output,
         alltoall_info,
diff --git a/vllm/model_executor/layers/fused_moe/flashinfer_trtllm_moe.py b/vllm/model_executor/layers/fused_moe/flashinfer_trtllm_moe.py
index 74bcffd8ca03..88fc460d90f9 100644
--- a/vllm/model_executor/layers/fused_moe/flashinfer_trtllm_moe.py
+++ b/vllm/model_executor/layers/fused_moe/flashinfer_trtllm_moe.py
@@ -1,37 +1,42 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-from typing import List  # noqa: UP035
-from typing import Optional
+from typing import (
+    List,  # noqa: UP035
+    Optional,
+)
 
 import torch
 
-from vllm.model_executor.layers.fused_moe.utils import (
-    moe_kernel_quantize_input)
+from vllm.model_executor.layers.fused_moe.utils import moe_kernel_quantize_input
 from vllm.model_executor.layers.quantization.utils.flashinfer_utils import (
-    calculate_tile_tokens_dim)
+    calculate_tile_tokens_dim,
+)
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    per_token_group_quant_fp8)
+    per_token_group_quant_fp8,
+)
 from vllm.utils import direct_register_custom_op
 
 
 def flashinfer_fused_moe_blockscale_fp8(
-        routing_logits: torch.Tensor,
-        routing_bias: torch.Tensor,
-        x: torch.Tensor,
-        w13_weight: torch.Tensor,
-        w13_weight_scale_inv: torch.Tensor,
-        w2_weight: torch.Tensor,
-        w2_weight_scale_inv: torch.Tensor,
-        global_num_experts: int,
-        top_k: int,
-        num_expert_group: int,
-        topk_group: int,
-        intermediate_size: int,
-        expert_offset: int,
-        local_num_experts: int,
-        block_shape: List[int],  #noqa: UP006
-        routed_scaling: float = 1.0) -> torch.Tensor:
+    routing_logits: torch.Tensor,
+    routing_bias: torch.Tensor,
+    x: torch.Tensor,
+    w13_weight: torch.Tensor,
+    w13_weight_scale_inv: torch.Tensor,
+    w2_weight: torch.Tensor,
+    w2_weight_scale_inv: torch.Tensor,
+    global_num_experts: int,
+    top_k: int,
+    num_expert_group: int,
+    topk_group: int,
+    intermediate_size: int,
+    expert_offset: int,
+    local_num_experts: int,
+    block_shape: List[int],  # noqa: UP006
+    routed_scaling: float = 1.0,
+) -> torch.Tensor:
     from vllm.utils.flashinfer import flashinfer_trtllm_fp8_block_scale_moe
+
     assert top_k <= global_num_experts
     assert top_k <= 8
     assert topk_group <= 4
@@ -63,30 +68,32 @@ def flashinfer_fused_moe_blockscale_fp8(
         local_expert_offset=expert_offset,
         local_num_experts=local_num_experts,
         routed_scaling_factor=routed_scaling,
-        tile_tokens_dim=calculate_tile_tokens_dim(x.shape[0], top_k,
-                                                  global_num_experts),
+        tile_tokens_dim=calculate_tile_tokens_dim(
+            x.shape[0], top_k, global_num_experts
+        ),
         routing_method_type=2,  # DeepSeek-styled routing method
         use_shuffled_weight=False,
     )
 
 
 def flashinfer_fused_moe_blockscale_fp8_fake(
-        routing_logits: torch.Tensor,
-        routing_bias: torch.Tensor,
-        x: torch.Tensor,
-        w13_weight: torch.Tensor,
-        w13_weight_scale_inv: torch.Tensor,
-        w2_weight: torch.Tensor,
-        w2_weight_scale_inv: torch.Tensor,
-        global_num_experts: int,
-        top_k: int,
-        num_expert_group: int,
-        topk_group: int,
-        intermediate_size: int,
-        expert_offset: int,
-        local_num_experts: int,
-        block_shape: list[int],
-        routed_scaling: float = 1.0) -> torch.Tensor:
+    routing_logits: torch.Tensor,
+    routing_bias: torch.Tensor,
+    x: torch.Tensor,
+    w13_weight: torch.Tensor,
+    w13_weight_scale_inv: torch.Tensor,
+    w2_weight: torch.Tensor,
+    w2_weight_scale_inv: torch.Tensor,
+    global_num_experts: int,
+    top_k: int,
+    num_expert_group: int,
+    topk_group: int,
+    intermediate_size: int,
+    expert_offset: int,
+    local_num_experts: int,
+    block_shape: list[int],
+    routed_scaling: float = 1.0,
+) -> torch.Tensor:
     return torch.empty_like(x)
 
 
@@ -95,30 +102,31 @@ def flashinfer_fused_moe_blockscale_fp8_fake(
     op_name="flashinfer_fused_moe_blockscale_fp8",
     op_func=flashinfer_fused_moe_blockscale_fp8,
     fake_impl=flashinfer_fused_moe_blockscale_fp8_fake,
-    tags=(torch.Tag.needs_fixed_stride_order, ),
+    tags=(torch.Tag.needs_fixed_stride_order,),
 )
 
 
 def flashinfer_fused_moe_per_tensor_scale_fp8(
-        routing_logits: torch.Tensor,
-        routing_bias: Optional[torch.Tensor],
-        hidden_states: torch.Tensor,
-        input_scale: torch.Tensor,
-        gemm1_weights: torch.Tensor,
-        gemm2_weights: torch.Tensor,
-        output1_scales_scalar: torch.Tensor,
-        output1_scales_gate_scalar: torch.Tensor,
-        output2_scales_scalar: torch.Tensor,
-        num_experts: int,
-        top_k: int,
-        num_expert_group: Optional[int],
-        topk_group: Optional[int],
-        intermediate_size: int,
-        local_expert_offset: int,
-        local_num_experts: int,
-        use_routing_scales_on_input: bool,
-        routing_method_type: int,
-        routed_scaling_factor: float = 1.0) -> torch.Tensor:
+    routing_logits: torch.Tensor,
+    routing_bias: Optional[torch.Tensor],
+    hidden_states: torch.Tensor,
+    input_scale: torch.Tensor,
+    gemm1_weights: torch.Tensor,
+    gemm2_weights: torch.Tensor,
+    output1_scales_scalar: torch.Tensor,
+    output1_scales_gate_scalar: torch.Tensor,
+    output2_scales_scalar: torch.Tensor,
+    num_experts: int,
+    top_k: int,
+    num_expert_group: Optional[int],
+    topk_group: Optional[int],
+    intermediate_size: int,
+    local_expert_offset: int,
+    local_num_experts: int,
+    use_routing_scales_on_input: bool,
+    routing_method_type: int,
+    routed_scaling_factor: float = 1.0,
+) -> torch.Tensor:
     num_expert_group = num_expert_group if num_expert_group is not None else 0
     topk_group = topk_group if topk_group is not None else 0
 
@@ -126,10 +134,11 @@ def flashinfer_fused_moe_per_tensor_scale_fp8(
         hidden_states,
         input_scale,
         quant_dtype=torch.float8_e4m3fn,
-        per_act_token_quant=False)
+        per_act_token_quant=False,
+    )
+
+    from vllm.utils.flashinfer import flashinfer_trtllm_fp8_per_tensor_scale_moe
 
-    from vllm.utils.flashinfer import (
-        flashinfer_trtllm_fp8_per_tensor_scale_moe)
     return flashinfer_trtllm_fp8_per_tensor_scale_moe(
         routing_logits=routing_logits,
         routing_bias=routing_bias,
@@ -148,31 +157,34 @@ def flashinfer_fused_moe_per_tensor_scale_fp8(
         local_num_experts=local_num_experts,
         routed_scaling_factor=routed_scaling_factor,
         use_routing_scales_on_input=use_routing_scales_on_input,
-        tile_tokens_dim=calculate_tile_tokens_dim(hidden_states.shape[0],
-                                                  top_k, num_experts),
-        routing_method_type=routing_method_type)
+        tile_tokens_dim=calculate_tile_tokens_dim(
+            hidden_states.shape[0], top_k, num_experts
+        ),
+        routing_method_type=routing_method_type,
+    )
 
 
 def flashinfer_fused_moe_per_tensor_scale_fp8_fake(
-        routing_logits: torch.Tensor,
-        routing_bias: Optional[torch.Tensor],
-        hidden_states: torch.Tensor,
-        input_scale: torch.Tensor,
-        gemm1_weights: torch.Tensor,
-        gemm2_weights: torch.Tensor,
-        output1_scales_scalar: torch.Tensor,
-        output1_scales_gate_scalar: torch.Tensor,
-        output2_scales_scalar: torch.Tensor,
-        num_experts: int,
-        top_k: int,
-        num_expert_group: Optional[int],
-        topk_group: Optional[int],
-        intermediate_size: int,
-        local_expert_offset: int,
-        local_num_experts: int,
-        use_routing_scales_on_input: bool,
-        routing_method_type: int,
-        routed_scaling_factor: float = 1.0) -> torch.Tensor:
+    routing_logits: torch.Tensor,
+    routing_bias: Optional[torch.Tensor],
+    hidden_states: torch.Tensor,
+    input_scale: torch.Tensor,
+    gemm1_weights: torch.Tensor,
+    gemm2_weights: torch.Tensor,
+    output1_scales_scalar: torch.Tensor,
+    output1_scales_gate_scalar: torch.Tensor,
+    output2_scales_scalar: torch.Tensor,
+    num_experts: int,
+    top_k: int,
+    num_expert_group: Optional[int],
+    topk_group: Optional[int],
+    intermediate_size: int,
+    local_expert_offset: int,
+    local_num_experts: int,
+    use_routing_scales_on_input: bool,
+    routing_method_type: int,
+    routed_scaling_factor: float = 1.0,
+) -> torch.Tensor:
     return torch.empty_like(hidden_states)
 
 
@@ -182,5 +194,5 @@ def flashinfer_fused_moe_per_tensor_scale_fp8_fake(
     op_func=flashinfer_fused_moe_per_tensor_scale_fp8,
     mutates_args=["hidden_states"],
     fake_impl=flashinfer_fused_moe_per_tensor_scale_fp8_fake,
-    tags=(torch.Tag.needs_fixed_stride_order, ),
+    tags=(torch.Tag.needs_fixed_stride_order,),
 )
diff --git a/vllm/model_executor/layers/fused_moe/fused_batched_moe.py b/vllm/model_executor/layers/fused_moe/fused_batched_moe.py
index fee628eae4d8..2a768c75b0bc 100644
--- a/vllm/model_executor/layers/fused_moe/fused_batched_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_batched_moe.py
@@ -1,21 +1,25 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Fused batched MoE kernel."""
+
 from typing import Optional
 
 import torch
 
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
-from vllm.model_executor.layers.fused_moe.fused_moe import (
-    try_get_optimal_moe_config)
+from vllm.model_executor.layers.fused_moe.fused_moe import try_get_optimal_moe_config
 from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
-    TopKWeightAndReduceDelegate, TopKWeightAndReduceNaiveBatched)
+    TopKWeightAndReduceDelegate,
+    TopKWeightAndReduceNaiveBatched,
+)
 from vllm.model_executor.layers.fused_moe.utils import (
-    _resize_cache, moe_kernel_quantize_input, normalize_batched_scales_shape,
-    normalize_scales_shape)
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    group_broadcast)
+    _resize_cache,
+    moe_kernel_quantize_input,
+    normalize_batched_scales_shape,
+    normalize_scales_shape,
+)
+from vllm.model_executor.layers.quantization.utils.quant_utils import group_broadcast
 from vllm.triton_utils import tl, triton
 
 
@@ -56,12 +60,12 @@ def moe_mmk(
     use_w8a16: tl.constexpr,
     per_act_token_quant: tl.constexpr,
 ):
-
     offs_k = tl.arange(0, BLOCK_K)
 
     if use_w8a16:
-        b_scale_ptrs = b_scale_ptr + expert_id * stride_bse + offs_n[
-            None, :] * stride_bsn
+        b_scale_ptrs = (
+            b_scale_ptr + expert_id * stride_bse + offs_n[None, :] * stride_bsn
+        )
         b_scale = tl.load(b_scale_ptrs)
 
     if use_w8a8:
@@ -94,9 +98,11 @@ def moe_mmk(
     for k in range(0, tl.cdiv(K, BLOCK_K)):
         # Load the next block of A and B, generate a mask by checking the
         # K dimension.
-        a = tl.load(a_ptrs,
-                    mask=mask_m[:, None] & (offs_k[None, :] < K - k * BLOCK_K),
-                    other=0.0)
+        a = tl.load(
+            a_ptrs,
+            mask=mask_m[:, None] & (offs_k[None, :] < K - k * BLOCK_K),
+            other=0.0,
+        )
         b = tl.load(b_ptrs, mask=offs_k[:, None] < K - k * BLOCK_K, other=0.0)
         # We accumulate along the K dimension.
         if use_w8a16:
@@ -105,13 +111,12 @@ def moe_mmk(
             if group_k > 0 and group_n > 0:
                 k_start = k * BLOCK_K
                 offs_ks = k_start // group_k
-                a_scale = tl.load(a_scale_ptrs + offs_ks * stride_ask,
-                                  mask=mask_m,
-                                  other=0.0)
+                a_scale = tl.load(
+                    a_scale_ptrs + offs_ks * stride_ask, mask=mask_m, other=0.0
+                )
                 b_scale = tl.load(b_scale_ptrs + offs_ks * stride_bsk)
 
-                accumulator += tl.dot(a, b) * a_scale[:,
-                                                      None] * b_scale[None, :]
+                accumulator += tl.dot(a, b) * a_scale[:, None] * b_scale[None, :]
             else:
                 # acc used to enable fp8_fast_accum
                 accumulator = tl.dot(a, b, acc=accumulator)
@@ -137,9 +142,9 @@ def moe_mmk(
 
 @triton.jit
 def expert_triton_kernel(
-    a_ptr,  #[max_tokens, K]
-    b_ptr,  #[K, N]
-    c_ptr,  #[max_tokens, N]
+    a_ptr,  # [max_tokens, K]
+    b_ptr,  # [K, N]
+    c_ptr,  # [max_tokens, N]
     expert_id,
     compute_type: tl.constexpr,
     # Dimensions
@@ -177,7 +182,6 @@ def expert_triton_kernel(
     BLOCK_N: tl.constexpr,
     BLOCK_K: tl.constexpr,
 ):
-
     offs_m = tl.arange(0, BLOCK_M)
     offs_n = tl.arange(0, BLOCK_N) % N
     offs_k = tl.arange(0, BLOCK_K)
@@ -221,7 +225,8 @@ def expert_triton_kernel(
         compute_type,
         use_fp8_w8a8,
         use_int8_w8a16,
-        per_act_token_quant)
+        per_act_token_quant,
+    )
 
     # store in C
     offs_cn = tl.arange(0, BLOCK_N)
@@ -284,7 +289,7 @@ def batched_triton_kernel(
 
     # axis 1 is M_blocks * N_blocks
     pid_mn = tl.program_id(axis=1)
-    #num_pid_m = tl.cdiv(max_num_tokens, BLOCK_M)
+    # num_pid_m = tl.cdiv(max_num_tokens, BLOCK_M)
     num_pid_n = tl.cdiv(N, BLOCK_N)
     pid_m = pid_mn // num_pid_n
     pid_n = pid_mn % num_pid_n
@@ -300,8 +305,12 @@ def batched_triton_kernel(
 
     a_ptr = a_ptr + expert_id * stride_ae + cta_m_start * stride_am
     b_ptr = b_ptr + expert_id * stride_be + cta_n_start * stride_bn
-    c_ptr = (c_ptr + expert_id * stride_ce + cta_m_start * stride_cm +
-             cta_n_start * stride_cn)
+    c_ptr = (
+        c_ptr
+        + expert_id * stride_ce
+        + cta_m_start * stride_cm
+        + cta_n_start * stride_cn
+    )
 
     offs_bn = (pid_n * BLOCK_N + tl.arange(0, BLOCK_N).to(tl.int64)) % N
 
@@ -350,50 +359,54 @@ def batched_triton_kernel(
         # Kernel config
         BLOCK_M,
         BLOCK_N,
-        BLOCK_K)
+        BLOCK_K,
+    )
 
 
 def invoke_moe_batched_triton_kernel(
-        A: torch.Tensor,  # [E, max_tokens, K]
-        B: torch.Tensor,  # [E, N, K]
-        C: torch.Tensor,  # [E, max_tokens, N]
-        expert_num_tokens: torch.Tensor,  # [E]
-        compute_type: tl.dtype,
-        # Quantization data
-        A_scale: Optional[torch.Tensor],
-        B_scale: Optional[torch.Tensor],
-        B_zp: torch.Tensor,
-        # Quantization schemes
-        use_fp8_w8a8: bool,
-        use_int8_w8a16: bool,
-        use_int4_w4a16: bool,
-        config: dict[str, int],
-        per_act_token_quant: bool,
-        block_shape: Optional[list[int]] = None):
-
+    A: torch.Tensor,  # [E, max_tokens, K]
+    B: torch.Tensor,  # [E, N, K]
+    C: torch.Tensor,  # [E, max_tokens, N]
+    expert_num_tokens: torch.Tensor,  # [E]
+    compute_type: tl.dtype,
+    # Quantization data
+    A_scale: Optional[torch.Tensor],
+    B_scale: Optional[torch.Tensor],
+    B_zp: torch.Tensor,
+    # Quantization schemes
+    use_fp8_w8a8: bool,
+    use_int8_w8a16: bool,
+    use_int4_w4a16: bool,
+    config: dict[str, int],
+    per_act_token_quant: bool,
+    block_shape: Optional[list[int]] = None,
+):
     assert not use_int4_w4a16
     max_num_tokens = A.size(1)
     K = A.size(2)
     N = C.size(2)
 
-    BLOCK_M = config['BLOCK_SIZE_M']
-    BLOCK_N = config['BLOCK_SIZE_N']
-    BLOCK_K = config['BLOCK_SIZE_K']
+    BLOCK_M = config["BLOCK_SIZE_M"]
+    BLOCK_N = config["BLOCK_SIZE_N"]
+    BLOCK_K = config["BLOCK_SIZE_K"]
 
-    grid = (expert_num_tokens.size(0), triton.cdiv(max_num_tokens, BLOCK_M) *
-            triton.cdiv(B.size(1), BLOCK_N))
+    grid = (
+        expert_num_tokens.size(0),
+        triton.cdiv(max_num_tokens, BLOCK_M) * triton.cdiv(B.size(1), BLOCK_N),
+    )
 
-    A_scale = normalize_batched_scales_shape(A_scale,
-                                             expert_num_tokens.shape[0])
+    A_scale = normalize_batched_scales_shape(A_scale, expert_num_tokens.shape[0])
 
     if B_scale is not None and B_scale.ndim == 1:
         assert B_scale.numel() == expert_num_tokens.shape[0]
         B_scale = B_scale.view(-1, 1, 1)
 
     assert A_scale is None or A_scale.ndim == 3, (
-        f"{0 if A_scale is None else A_scale.shape}")
+        f"{0 if A_scale is None else A_scale.shape}"
+    )
     assert B_scale is None or B_scale.ndim == 1 or B_scale.ndim == 3, (
-        f"{0 if B_scale is None else B_scale.shape}")
+        f"{0 if B_scale is None else B_scale.shape}"
+    )
 
     if B_scale is not None:
         if B_scale.ndim == 1:
@@ -459,7 +472,8 @@ def invoke_moe_batched_triton_kernel(
         # Kernel config
         BLOCK_M=BLOCK_M,
         BLOCK_N=BLOCK_N,
-        BLOCK_K=BLOCK_K)
+        BLOCK_K=BLOCK_K,
+    )
 
 
 class BatchedPrepareAndFinalize(mk.FusedMoEPrepareAndFinalize):
@@ -512,16 +526,15 @@ def prepare(
         if apply_router_weight_on_input:
             topk = topk_ids.size(1)
             # TODO: this only works for topK=1, will need to update for topK>1
-            assert topk == 1, \
+            assert topk == 1, (
                 "apply_router_weight_on_input is only implemented for topk=1"
+            )
             a1.mul_(topk_weights.to(a1.dtype))
 
         num_tokens, hidden_dim = a1.size()
         topk = topk_ids.size(1)
 
-        tokens_per_expert = torch.zeros(num_experts,
-                                        dtype=torch.int,
-                                        device=a1.device)
+        tokens_per_expert = torch.zeros(num_experts, dtype=torch.int, device=a1.device)
 
         num_local_experts = self.num_local_experts
 
@@ -533,15 +546,15 @@ def prepare(
         b_a1 = torch.zeros(
             (num_local_experts, self.max_num_tokens, hidden_dim),
             dtype=b_type,
-            device=a1.device)
+            device=a1.device,
+        )
 
         if quant_config.is_quantized:
             scale_shape = quant_config.batched_scale_shape(
-                num_local_experts, self.max_num_tokens, hidden_dim)
+                num_local_experts, self.max_num_tokens, hidden_dim
+            )
 
-            b_a1_scale = torch.empty(scale_shape,
-                                     dtype=torch.float32,
-                                     device=a1.device)
+            b_a1_scale = torch.empty(scale_shape, dtype=torch.float32, device=a1.device)
         else:
             assert quant_config.a1_scale is None
             b_a1_scale = None
@@ -558,11 +571,11 @@ def prepare(
                 continue
             idx = expert_id - first_expert
             tokens_per_expert[idx] = rows
-            rhs = a1[:topks.numel()][topks]
+            rhs = a1[: topks.numel()][topks]
             if quant_config.quant_dtype is not None:
                 if a1_scale is not None:
                     if quant_config.is_per_act_token:
-                        rhs_a1_scale = a1_scale[:topks.numel()][topks]
+                        rhs_a1_scale = a1_scale[: topks.numel()][topks]
                     else:
                         rhs_a1_scale = a1_scale
                 else:
@@ -578,14 +591,15 @@ def prepare(
                 if quant_config.is_per_act_token:
                     b_a1_scale[idx, :rows] = b_s[:rows]
                 else:
-                    b_a1_scale[idx, :b_s.shape[0]] = b_s
+                    b_a1_scale[idx, : b_s.shape[0]] = b_s
             else:
                 b_a1[idx, :rows, :] = rhs
 
         assert b_a1_scale is None or b_a1_scale.ndim == 3
 
         expert_tokens_meta = mk.ExpertTokensMetadata(
-            expert_num_tokens=tokens_per_expert, expert_num_tokens_cpu=None)
+            expert_num_tokens=tokens_per_expert, expert_num_tokens_cpu=None
+        )
 
         return b_a1, b_a1_scale, expert_tokens_meta, None, None
 
@@ -632,10 +646,12 @@ def __init__(
 
     @property
     def activation_formats(
-        self
+        self,
     ) -> tuple[mk.FusedMoEActivationFormat, mk.FusedMoEActivationFormat]:
-        return (mk.FusedMoEActivationFormat.BatchedExperts,
-                mk.FusedMoEActivationFormat.BatchedExperts)
+        return (
+            mk.FusedMoEActivationFormat.BatchedExperts,
+            mk.FusedMoEActivationFormat.BatchedExperts,
+        )
 
     def supports_chunking(self) -> bool:
         return False
@@ -670,8 +686,7 @@ def workspace_shapes(
     def dequant(self, t: torch.Tensor, scale: torch.Tensor) -> torch.Tensor:
         assert self.quant_config.is_quantized
         f32 = torch.float32
-        if (self.quant_config.is_per_act_token
-                or self.quant_config.is_per_tensor):
+        if self.quant_config.is_per_act_token or self.quant_config.is_per_tensor:
             return t.to(f32) * scale
         else:
             return t.to(f32) * group_broadcast(scale, t.shape)
@@ -699,15 +714,16 @@ def apply(
         expert_num_tokens = expert_tokens_meta.expert_num_tokens
 
         num_local_experts = w1.size(0)
-        assert num_local_experts == w1.size(0), (
-            f"{num_local_experts} == {w1.size(0)}")
+        assert num_local_experts == w1.size(0), f"{num_local_experts} == {w1.size(0)}"
 
         N = w1.size(1) // 2
 
         for expert in range(num_local_experts):
             # Indexing expert_num_tokens doesn't work w/cudagraphs or inductor
-            if (torch.compiler.is_compiling()
-                    or torch.cuda.is_current_stream_capturing()):
+            if (
+                torch.compiler.is_compiling()
+                or torch.cuda.is_current_stream_capturing()
+            ):
                 num = hidden_states.shape[1]
             else:
                 num = int(expert_num_tokens[expert].item())
@@ -719,13 +735,11 @@ def apply(
 
             if self.quant_config.is_quantized:
                 assert a1q_scale is not None and self.w1_scale is not None
-                input = self.dequant(hidden_states[expert, :, :],
-                                     a1q_scale[expert])
+                input = self.dequant(hidden_states[expert, :, :], a1q_scale[expert])
                 w1_dq = self.dequant(w1[expert], self.w1_scale[expert])
                 input = input[:num] @ w1_dq.transpose(0, 1)
             else:
-                input = hidden_states[expert, :num, :] @ w1[expert].transpose(
-                    0, 1)
+                input = hidden_states[expert, :num, :] @ w1[expert].transpose(0, 1)
 
             self.activation(activation, tmp, input.to(tmp.dtype))
 
@@ -749,17 +763,16 @@ def batched_moe_kernel_quantize_input(
     per_act_token_quant: bool,
     block_shape: Optional[list[int]] = None,
 ) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
-    if (torch.compiler.is_compiling()
-            or torch.cuda.is_current_stream_capturing()):
+    if torch.compiler.is_compiling() or torch.cuda.is_current_stream_capturing():
         # Note: this does a bunch of extra work because expert_num_tokens is
         # ignored but it does support torch.compile + cudagraphs.
         hidden_dim = A.size(-1)
         assert A_scale is None or A_scale.ndim <= 2, (
-            f"{A_scale.shape if A_scale is not None else None}")
-        A_q, A_q_scale = moe_kernel_quantize_input(A.view(-1,
-                                                          hidden_dim), A_scale,
-                                                   qtype, per_act_token_quant,
-                                                   block_shape)
+            f"{A_scale.shape if A_scale is not None else None}"
+        )
+        A_q, A_q_scale = moe_kernel_quantize_input(
+            A.view(-1, hidden_dim), A_scale, qtype, per_act_token_quant, block_shape
+        )
         A_q = A_q.view(E, -1, hidden_dim)
         A_q_scale = normalize_batched_scales_shape(A_q_scale, E)
 
@@ -779,9 +792,7 @@ def batched_moe_kernel_quantize_input(
         else:
             scale_shape = (E, 1, 1)
 
-        A_q_scale = torch.zeros(scale_shape,
-                                dtype=torch.float32,
-                                device=A.device)
+        A_q_scale = torch.zeros(scale_shape, dtype=torch.float32, device=A.device)
 
         num_experts = expert_num_tokens.numel()
 
@@ -791,7 +802,7 @@ def batched_moe_kernel_quantize_input(
             num_tokens = int(expert_num_tokens[e].item())
             if num_tokens > 0:
                 if A_scale is not None:
-                    scales = A_scale[e, :min(num_tokens, A_scale.shape[1])]
+                    scales = A_scale[e, : min(num_tokens, A_scale.shape[1])]
                 else:
                     scales = None
                 A_q[e, :num_tokens], tmp_scale = moe_kernel_quantize_input(
@@ -802,7 +813,7 @@ def batched_moe_kernel_quantize_input(
                     block_shape,
                 )
                 assert tmp_scale is not None
-                A_q_scale[e, :tmp_scale.shape[0]] = tmp_scale
+                A_q_scale[e, : tmp_scale.shape[0]] = tmp_scale
 
         return A_q, A_q_scale
 
@@ -832,10 +843,12 @@ def __init__(
 
     @property
     def activation_formats(
-        self
+        self,
     ) -> tuple[mk.FusedMoEActivationFormat, mk.FusedMoEActivationFormat]:
-        return (mk.FusedMoEActivationFormat.BatchedExperts,
-                mk.FusedMoEActivationFormat.BatchedExperts)
+        return (
+            mk.FusedMoEActivationFormat.BatchedExperts,
+            mk.FusedMoEActivationFormat.BatchedExperts,
+        )
 
     def supports_chunking(self) -> bool:
         return False
@@ -888,26 +901,28 @@ def apply(
     ):
         # Check constraints.
         if self.quant_config.use_int4_w4a16:
-            assert hidden_states.size(-1) // 2 == w1.size(2), (
-                "Hidden size mismatch")
+            assert hidden_states.size(-1) // 2 == w1.size(2), "Hidden size mismatch"
         else:
             assert hidden_states.size(-1) == w1.size(2), (
-                f"Hidden size mismatch {hidden_states.size(-1)} "
-                f"!= {w1.size(2)}")
+                f"Hidden size mismatch {hidden_states.size(-1)} != {w1.size(2)}"
+            )
 
-        assert hidden_states.is_contiguous(
-        ), "Hidden_states must be contiguous"
+        assert hidden_states.is_contiguous(), "Hidden_states must be contiguous"
         assert w1.stride(-1) == 1, "Stride of last dimension must be 1"
         assert w2.stride(-1) == 1, "Stride of last dimension must be 1"
         assert hidden_states.dtype in [
-            torch.float32, torch.float16, torch.bfloat16, torch.float8_e4m3fn
+            torch.float32,
+            torch.float16,
+            torch.bfloat16,
+            torch.float8_e4m3fn,
         ]
         assert expert_tokens_meta is not None
 
         expert_num_tokens = expert_tokens_meta.expert_num_tokens
 
         E, max_num_tokens, N, K, top_k_num = self.moe_problem_size(
-            hidden_states, w1, w2, topk_ids)
+            hidden_states, w1, w2, topk_ids
+        )
 
         assert w1.size(0) == E
         assert w2.size(0) == E
@@ -932,15 +947,12 @@ def apply(
         elif hidden_states.dtype == torch.float8_e4m3fn:
             compute_type = tl.bfloat16
         else:
-            raise ValueError(
-                f"Unsupported compute_type: {hidden_states.dtype}")
+            raise ValueError(f"Unsupported compute_type: {hidden_states.dtype}")
 
         # We can reuse the memory between these because by the time we need
         # cache3, we're done with cache1
-        intermediate_cache1 = _resize_cache(workspace13,
-                                            (E, max_num_tokens, N))
-        intermediate_cache2 = _resize_cache(workspace2,
-                                            (E, max_num_tokens, N // 2))
+        intermediate_cache1 = _resize_cache(workspace13, (E, max_num_tokens, N))
+        intermediate_cache2 = _resize_cache(workspace2, (E, max_num_tokens, N // 2))
 
         # TODO(bnell): should this be done for any quantized type?
         if self.quant_config.use_fp8_w8a8:
@@ -963,18 +975,29 @@ def apply(
             use_int4_w4a16=self.quant_config.use_int4_w4a16,
             config=config,
             per_act_token_quant=self.per_act_token_quant,
-            block_shape=self.block_shape)
+            block_shape=self.block_shape,
+        )
 
         intermediate_cache2.fill_(0)
 
         # TODO (bnell): use triton utility from batched deep gemm.
-        self.activation(activation, intermediate_cache2.view(-1, N // 2),
-                        intermediate_cache1.view(-1, N))
+        self.activation(
+            activation,
+            intermediate_cache2.view(-1, N // 2),
+            intermediate_cache1.view(-1, N),
+        )
 
         qintermediate_cache2, a2q_scale = batched_moe_kernel_quantize_input(
-            intermediate_cache2, a2_scale, max_num_tokens, E, N,
-            expert_num_tokens, self.quant_dtype, self.per_act_token_quant,
-            self.block_shape)
+            intermediate_cache2,
+            a2_scale,
+            max_num_tokens,
+            E,
+            N,
+            expert_num_tokens,
+            self.quant_dtype,
+            self.per_act_token_quant,
+            self.block_shape,
+        )
 
         invoke_moe_batched_triton_kernel(
             A=qintermediate_cache2,
@@ -990,4 +1013,5 @@ def apply(
             use_int4_w4a16=self.quant_config.use_int4_w4a16,
             config=config,
             per_act_token_quant=self.per_act_token_quant,
-            block_shape=self.block_shape)
+            block_shape=self.block_shape,
+        )
diff --git a/vllm/model_executor/layers/fused_moe/fused_marlin_moe.py b/vllm/model_executor/layers/fused_moe/fused_marlin_moe.py
index 617d871a5b3d..c46cc016214f 100644
--- a/vllm/model_executor/layers/fused_moe/fused_marlin_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_marlin_moe.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Fused MoE utilities for GPTQ."""
+
 from typing import Optional
 
 import torch
@@ -11,44 +12,49 @@
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.fused_moe.fused_moe import moe_align_block_size
 from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
-    TopKWeightAndReduceNoOP)
+    TopKWeightAndReduceNoOP,
+)
 from vllm.model_executor.layers.fused_moe.utils import _resize_cache
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-    marlin_make_workspace_new, marlin_moe_intermediate_size,
-    maybe_warn_marlin_atomic_add)
+    marlin_make_workspace_new,
+    marlin_moe_intermediate_size,
+    maybe_warn_marlin_atomic_add,
+)
 from vllm.scalar_type import ScalarType, scalar_types
 from vllm.utils import direct_register_custom_op
 
 
-def fused_marlin_moe(hidden_states: torch.Tensor,
-                     w1: torch.Tensor,
-                     w2: torch.Tensor,
-                     bias1: Optional[torch.Tensor],
-                     bias2: Optional[torch.Tensor],
-                     w1_scale: torch.Tensor,
-                     w2_scale: torch.Tensor,
-                     gating_output: Optional[torch.Tensor],
-                     topk_weights: torch.Tensor,
-                     topk_ids: torch.Tensor,
-                     quant_type_id: int,
-                     apply_router_weight_on_input: bool = False,
-                     global_num_experts: int = -1,
-                     activation: Optional[str] = "silu",
-                     expert_map: Optional[torch.Tensor] = None,
-                     global_scale1: Optional[torch.Tensor] = None,
-                     global_scale2: Optional[torch.Tensor] = None,
-                     g_idx1: Optional[torch.Tensor] = None,
-                     g_idx2: Optional[torch.Tensor] = None,
-                     sort_indices1: Optional[torch.Tensor] = None,
-                     sort_indices2: Optional[torch.Tensor] = None,
-                     w1_zeros: Optional[torch.Tensor] = None,
-                     w2_zeros: Optional[torch.Tensor] = None,
-                     workspace: Optional[torch.Tensor] = None,
-                     intermediate_cache13: Optional[torch.Tensor] = None,
-                     intermediate_cache2: Optional[torch.Tensor] = None,
-                     is_k_full: bool = True,
-                     output: Optional[torch.Tensor] = None,
-                     inplace: bool = False) -> torch.Tensor:
+def fused_marlin_moe(
+    hidden_states: torch.Tensor,
+    w1: torch.Tensor,
+    w2: torch.Tensor,
+    bias1: Optional[torch.Tensor],
+    bias2: Optional[torch.Tensor],
+    w1_scale: torch.Tensor,
+    w2_scale: torch.Tensor,
+    gating_output: Optional[torch.Tensor],
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    quant_type_id: int,
+    apply_router_weight_on_input: bool = False,
+    global_num_experts: int = -1,
+    activation: Optional[str] = "silu",
+    expert_map: Optional[torch.Tensor] = None,
+    global_scale1: Optional[torch.Tensor] = None,
+    global_scale2: Optional[torch.Tensor] = None,
+    g_idx1: Optional[torch.Tensor] = None,
+    g_idx2: Optional[torch.Tensor] = None,
+    sort_indices1: Optional[torch.Tensor] = None,
+    sort_indices2: Optional[torch.Tensor] = None,
+    w1_zeros: Optional[torch.Tensor] = None,
+    w2_zeros: Optional[torch.Tensor] = None,
+    workspace: Optional[torch.Tensor] = None,
+    intermediate_cache13: Optional[torch.Tensor] = None,
+    intermediate_cache2: Optional[torch.Tensor] = None,
+    is_k_full: bool = True,
+    output: Optional[torch.Tensor] = None,
+    inplace: bool = False,
+) -> torch.Tensor:
     """
     This function computes a Mixture of Experts (MoE) layer using two sets of
     weights, w1 and w2, and top-k gating mechanism.
@@ -78,23 +84,29 @@ def fused_marlin_moe(hidden_states: torch.Tensor,
     """
     quant_type = ScalarType.from_id(quant_type_id)
     assert quant_type in [
-        scalar_types.uint4, scalar_types.uint8b128, scalar_types.uint4b8,
-        scalar_types.float8_e4m3fn, scalar_types.float4_e2m1f
+        scalar_types.uint4,
+        scalar_types.uint8b128,
+        scalar_types.uint4b8,
+        scalar_types.float8_e4m3fn,
+        scalar_types.float4_e2m1f,
     ]
 
     bit4_scalar_types = [
-        scalar_types.uint4, scalar_types.uint4b8, scalar_types.float4_e2m1f
+        scalar_types.uint4,
+        scalar_types.uint4b8,
+        scalar_types.float4_e2m1f,
     ]
     num_bits = 4 if quant_type in bit4_scalar_types else 8
 
     # Check constraints.
     if gating_output is not None:
-        assert hidden_states.shape[0] == gating_output.shape[
-            0], "Number of tokens mismatch"
-    assert hidden_states.shape[
-        1] == w1.shape[1] * 16, "Hidden size mismatch w1"
-    assert hidden_states.shape[1] == w2.shape[2] // (
-        num_bits // 2), "Hidden size mismatch w2"
+        assert hidden_states.shape[0] == gating_output.shape[0], (
+            "Number of tokens mismatch"
+        )
+    assert hidden_states.shape[1] == w1.shape[1] * 16, "Hidden size mismatch w1"
+    assert hidden_states.shape[1] == w2.shape[2] // (num_bits // 2), (
+        "Hidden size mismatch w2"
+    )
     assert hidden_states.is_contiguous(), "Hidden_states must be contiguous"
     assert w1.is_contiguous(), "Expert weights1 must be contiguous"
     assert w2.is_contiguous(), "Expert weights2 must be contiguous"
@@ -115,9 +127,9 @@ def fused_marlin_moe(hidden_states: torch.Tensor,
 
     if global_num_experts == -1:
         global_num_experts = E
-    sorted_token_ids, expert_ids, num_tokens_post_padded = \
-        moe_align_block_size(topk_ids, block_size_m, global_num_experts,
-                             expert_map)
+    sorted_token_ids, expert_ids, num_tokens_post_padded = moe_align_block_size(
+        topk_ids, block_size_m, global_num_experts, expert_map
+    )
 
     if workspace is None:
         workspace = marlin_make_workspace_new(hidden_states.device, 4)
@@ -131,19 +143,20 @@ def fused_marlin_moe(hidden_states: torch.Tensor,
 
     if intermediate_cache13 is None:
         intermediate_cache13 = torch.empty(
-            (M * topk * max(2 * N, K), ),
+            (M * topk * max(2 * N, K),),
             device=hidden_states.device,
             dtype=hidden_states.dtype,
         )
 
-    intermediate_cache1 = _resize_cache(intermediate_cache13,
-                                        (M * topk, 2 * N))
+    intermediate_cache1 = _resize_cache(intermediate_cache13, (M * topk, 2 * N))
     intermediate_cache3 = _resize_cache(intermediate_cache13, (M * topk, K))
     intermediate_cache2 = _resize_cache(intermediate_cache2, (M * topk, N))
 
     maybe_warn_marlin_atomic_add(hidden_states.device, hidden_states.dtype)
-    use_atomic_add = hidden_states.dtype == torch.half or \
-        torch.cuda.get_device_capability(hidden_states.device)[0] >= 9
+    use_atomic_add = (
+        hidden_states.dtype == torch.half
+        or torch.cuda.get_device_capability(hidden_states.device)[0] >= 9
+    )
 
     intermediate_cache1 = ops.moe_wna16_marlin_gemm(
         hidden_states,
@@ -171,18 +184,23 @@ def fused_marlin_moe(hidden_states: torch.Tensor,
         is_k_full=is_k_full,
         use_atomic_add=use_atomic_add,
         use_fp32_reduce=True,
-        is_zp_float=False)
+        is_zp_float=False,
+    )
 
     if activation == "silu":
-        torch.ops._C.silu_and_mul(intermediate_cache2,
-                                  intermediate_cache1.view(-1, 2 * N))
+        torch.ops._C.silu_and_mul(
+            intermediate_cache2, intermediate_cache1.view(-1, 2 * N)
+        )
     elif activation == "swigluoai":
         # alpha = 1.702, limit = 7.0
-        torch.ops._C.swigluoai_and_mul(intermediate_cache2,
-                                       intermediate_cache1.view(-1, 2 * N))
+        torch.ops._C.swigluoai_and_mul(
+            intermediate_cache2, intermediate_cache1.view(-1, 2 * N)
+        )
     else:
-        raise ValueError(f"Unsupported activation: {activation}. "
-                         "Only silu and swigluoai activations are supported.")
+        raise ValueError(
+            f"Unsupported activation: {activation}. "
+            "Only silu and swigluoai activations are supported."
+        )
 
     if expert_map is not None:
         intermediate_cache3.zero_()
@@ -213,39 +231,42 @@ def fused_marlin_moe(hidden_states: torch.Tensor,
         is_k_full=is_k_full,
         use_atomic_add=use_atomic_add,
         use_fp32_reduce=True,
-        is_zp_float=False).view(-1, topk, K)
+        is_zp_float=False,
+    ).view(-1, topk, K)
 
     if output is None:
         output = hidden_states if inplace else torch.empty_like(hidden_states)
     return torch.sum(intermediate_cache3.view(-1, topk, K), dim=1, out=output)
 
 
-def fused_marlin_moe_fake(hidden_states: torch.Tensor,
-                          w1: torch.Tensor,
-                          w2: torch.Tensor,
-                          w1_scale: torch.Tensor,
-                          w2_scale: torch.Tensor,
-                          gating_output: Optional[torch.Tensor],
-                          topk_weights: torch.Tensor,
-                          topk_ids: torch.Tensor,
-                          quant_type_id: int,
-                          apply_router_weight_on_input: bool = False,
-                          global_num_experts: int = -1,
-                          global_scale1: Optional[torch.Tensor] = None,
-                          global_scale2: Optional[torch.Tensor] = None,
-                          expert_map: Optional[torch.Tensor] = None,
-                          g_idx1: Optional[torch.Tensor] = None,
-                          g_idx2: Optional[torch.Tensor] = None,
-                          sort_indices1: Optional[torch.Tensor] = None,
-                          sort_indices2: Optional[torch.Tensor] = None,
-                          w1_zeros: Optional[torch.Tensor] = None,
-                          w2_zeros: Optional[torch.Tensor] = None,
-                          workspace: Optional[torch.Tensor] = None,
-                          intermediate_cache13: Optional[torch.Tensor] = None,
-                          intermediate_cache2: Optional[torch.Tensor] = None,
-                          is_k_full: bool = True,
-                          output: Optional[torch.Tensor] = None,
-                          inplace: bool = False) -> torch.Tensor:
+def fused_marlin_moe_fake(
+    hidden_states: torch.Tensor,
+    w1: torch.Tensor,
+    w2: torch.Tensor,
+    w1_scale: torch.Tensor,
+    w2_scale: torch.Tensor,
+    gating_output: Optional[torch.Tensor],
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    quant_type_id: int,
+    apply_router_weight_on_input: bool = False,
+    global_num_experts: int = -1,
+    global_scale1: Optional[torch.Tensor] = None,
+    global_scale2: Optional[torch.Tensor] = None,
+    expert_map: Optional[torch.Tensor] = None,
+    g_idx1: Optional[torch.Tensor] = None,
+    g_idx2: Optional[torch.Tensor] = None,
+    sort_indices1: Optional[torch.Tensor] = None,
+    sort_indices2: Optional[torch.Tensor] = None,
+    w1_zeros: Optional[torch.Tensor] = None,
+    w2_zeros: Optional[torch.Tensor] = None,
+    workspace: Optional[torch.Tensor] = None,
+    intermediate_cache13: Optional[torch.Tensor] = None,
+    intermediate_cache2: Optional[torch.Tensor] = None,
+    is_k_full: bool = True,
+    output: Optional[torch.Tensor] = None,
+    inplace: bool = False,
+) -> torch.Tensor:
     return torch.empty_like(hidden_states)
 
 
@@ -257,7 +278,6 @@ def fused_marlin_moe_fake(hidden_states: torch.Tensor,
 
 
 class MarlinExperts(mk.FusedMoEPermuteExpertsUnpermute):
-
     def __init__(self, quant_config: FusedMoEQuantConfig):
         # TODO (varun) : Enable activation quantization
         assert quant_config.use_mxfp4_w4a16, "Supports only mxfp4_w4a16"
@@ -279,8 +299,7 @@ def moe_problem_size(
 
         if a1.dim() == 2:
             # Make sure we are using the correct a1 (pre-permute).
-            assert topk_ids.size(0) == a1.size(0), \
-                f"{topk_ids.size(0)} != {a1.size(0)}"
+            assert topk_ids.size(0) == a1.size(0), f"{topk_ids.size(0)} != {a1.size(0)}"
             M = a1.size(0)
         else:
             assert a1.dim() == 3
@@ -300,18 +319,27 @@ def finalize_weight_and_reduce_impl(self) -> mk.TopKWeightAndReduce:
 
     @property
     def activation_formats(
-        self
+        self,
     ) -> tuple[mk.FusedMoEActivationFormat, mk.FusedMoEActivationFormat]:
-        return (mk.FusedMoEActivationFormat.Standard,
-                mk.FusedMoEActivationFormat.Standard)
+        return (
+            mk.FusedMoEActivationFormat.Standard,
+            mk.FusedMoEActivationFormat.Standard,
+        )
 
     def supports_chunking(self) -> bool:
         return True
 
     def workspace_shapes(
-        self, a: torch.Tensor, aq: torch.Tensor, M: int, N: int, K: int,
-        topk: int, global_num_experts: int, local_num_experts: int,
-        expert_tokens_meta: Optional[mk.ExpertTokensMetadata]
+        self,
+        a: torch.Tensor,
+        aq: torch.Tensor,
+        M: int,
+        N: int,
+        K: int,
+        topk: int,
+        global_num_experts: int,
+        local_num_experts: int,
+        expert_tokens_meta: Optional[mk.ExpertTokensMetadata],
     ) -> tuple[tuple[int, ...], tuple[int, ...], tuple[int, ...], torch.dtype]:
         # Modular Kernel provisions output buffer from workspace1. However in
         # the fused_marlin_moe() function, the final torch.sum(), is defined
@@ -323,13 +351,13 @@ def workspace_shapes(
         # workspace2.
 
         # Workspace/IntermediateCache allocation matching fused_marlin_moe()
-        #workspace1 = (M * topk * max(2 * N, K),)
-        #workspace2 = (M * topk, N)
+        # workspace1 = (M * topk * max(2 * N, K),)
+        # workspace2 = (M * topk, N)
 
         # Workspace/IntermediateCache allocation accounting for output buffer
         # provisioning
         workspace1 = (M * topk, max(N, K))
-        workspace2 = (M * topk * max(2 * N, K), )
+        workspace2 = (M * topk * max(2 * N, K),)
         output = (M, K)
 
         return (workspace1, workspace2, output, a.dtype)
@@ -374,4 +402,5 @@ def apply(
             # Workspaces are swapped in workspace_shapes() to account for proper
             # output buffer allocation. Please refer to workspace_shapes().
             intermediate_cache13=workspace2,
-            intermediate_cache2=workspace13)
+            intermediate_cache2=workspace13,
+        )
diff --git a/vllm/model_executor/layers/fused_moe/fused_moe.py b/vllm/model_executor/layers/fused_moe/fused_moe.py
index f96525734fd9..d2bc339d2b44 100644
--- a/vllm/model_executor/layers/fused_moe/fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_moe.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Fused MoE Triton kernels."""
+
 import functools
 import json
 import os
@@ -13,25 +14,38 @@
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm import _custom_ops as ops
 from vllm.logger import init_logger
+
 # yapf: disable
 from vllm.model_executor.layers.fused_moe.config import (
-    FUSED_MOE_UNQUANTIZED_CONFIG, FusedMoEQuantConfig, _get_config_dtype_str)
+    FUSED_MOE_UNQUANTIZED_CONFIG,
+    FusedMoEQuantConfig,
+    _get_config_dtype_str,
+)
 from vllm.model_executor.layers.fused_moe.cutlass_moe import (
     _valid_cutlass_block_scaled_grouped_gemm,
-    run_cutlass_block_scaled_fused_experts)
+    run_cutlass_block_scaled_fused_experts,
+)
+
 # yapf: enable
 from vllm.model_executor.layers.fused_moe.deep_gemm_moe import (
-    _valid_deep_gemm, deep_gemm_moe_fp8)
+    _valid_deep_gemm,
+    deep_gemm_moe_fp8,
+)
 from vllm.model_executor.layers.fused_moe.moe_align_block_size import (
-    moe_align_block_size)
+    moe_align_block_size,
+)
 from vllm.model_executor.layers.fused_moe.prepare_finalize import (
-    MoEPrepareAndFinalizeNoEP)
+    MoEPrepareAndFinalizeNoEP,
+)
 from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
-    TopKWeightAndReduceNoOP)
+    TopKWeightAndReduceNoOP,
+)
 from vllm.model_executor.layers.fused_moe.utils import (
-    _resize_cache, activation_without_mul, moe_kernel_quantize_input)
-from vllm.model_executor.layers.quantization.utils.mxfp4_utils import (
-    dequant_mxfp4)
+    _resize_cache,
+    activation_without_mul,
+    moe_kernel_quantize_input,
+)
+from vllm.model_executor.layers.quantization.utils.mxfp4_utils import dequant_mxfp4
 from vllm.platforms import current_platform
 from vllm.triton_utils import tl, triton
 from vllm.utils import direct_register_custom_op, is_torch_equal_or_newer
@@ -43,64 +57,73 @@
 
 
 @triton.jit
-def write_zeros_to_output(c_ptr, stride_cm, stride_cn, pid_n, N, offs_token,
-                          token_mask, BLOCK_SIZE_M, BLOCK_SIZE_N,
-                          compute_type):
+def write_zeros_to_output(
+    c_ptr,
+    stride_cm,
+    stride_cn,
+    pid_n,
+    N,
+    offs_token,
+    token_mask,
+    BLOCK_SIZE_M,
+    BLOCK_SIZE_N,
+    compute_type,
+):
     accumulator = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N), dtype=compute_type)
     offs_cn = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
-    c_ptrs = c_ptr + stride_cm * offs_token[:, None] + stride_cn * offs_cn[
-        None, :]
+    c_ptrs = c_ptr + stride_cm * offs_token[:, None] + stride_cn * offs_cn[None, :]
     c_mask = token_mask[:, None] & (offs_cn[None, :] < N)
     tl.store(c_ptrs, accumulator, mask=c_mask)
 
 
 @triton.jit
 def fused_moe_kernel_gptq_awq(
-        # Pointers to matrices
-        a_ptr,
-        b_ptr,
-        c_ptr,
-        b_scale_ptr,
-        b_zp_ptr,
-        topk_weights_ptr,
-        sorted_token_ids_ptr,
-        expert_ids_ptr,
-        num_tokens_post_padded_ptr,
-        # Matrix dimensions
-        N: tl.constexpr,
-        K: tl.constexpr,
-        EM,
-        num_valid_tokens,
-        # The stride variables represent how much to increase the ptr by when
-        # moving by 1 element in a particular dimension. E.g. `stride_am` is
-        # how much to increase `a_ptr` by to get the element one row down
-        # (A has M rows).
-        stride_am,
-        stride_ak,
-        stride_be,
-        stride_bk,
-        stride_bn,
-        stride_cm,
-        stride_cn,
-        stride_bse,
-        stride_bsk,
-        stride_bsn,
-        stride_bze,
-        stride_bzk,
-        stride_bzn,
-        block_k_diviable: tl.constexpr,
-        group_size: tl.constexpr,
-        # Meta-parameters
-        BLOCK_SIZE_M: tl.constexpr,
-        BLOCK_SIZE_N: tl.constexpr,
-        BLOCK_SIZE_K: tl.constexpr,
-        GROUP_SIZE_M: tl.constexpr,
-        MUL_ROUTED_WEIGHT: tl.constexpr,
-        top_k: tl.constexpr,
-        compute_type: tl.constexpr,
-        has_zp: tl.constexpr,
-        use_int4_w4a16: tl.constexpr,
-        use_int8_w8a16: tl.constexpr):
+    # Pointers to matrices
+    a_ptr,
+    b_ptr,
+    c_ptr,
+    b_scale_ptr,
+    b_zp_ptr,
+    topk_weights_ptr,
+    sorted_token_ids_ptr,
+    expert_ids_ptr,
+    num_tokens_post_padded_ptr,
+    # Matrix dimensions
+    N: tl.constexpr,
+    K: tl.constexpr,
+    EM,
+    num_valid_tokens,
+    # The stride variables represent how much to increase the ptr by when
+    # moving by 1 element in a particular dimension. E.g. `stride_am` is
+    # how much to increase `a_ptr` by to get the element one row down
+    # (A has M rows).
+    stride_am,
+    stride_ak,
+    stride_be,
+    stride_bk,
+    stride_bn,
+    stride_cm,
+    stride_cn,
+    stride_bse,
+    stride_bsk,
+    stride_bsn,
+    stride_bze,
+    stride_bzk,
+    stride_bzn,
+    block_k_diviable: tl.constexpr,
+    group_size: tl.constexpr,
+    # Meta-parameters
+    BLOCK_SIZE_M: tl.constexpr,
+    BLOCK_SIZE_N: tl.constexpr,
+    BLOCK_SIZE_K: tl.constexpr,
+    GROUP_SIZE_M: tl.constexpr,
+    MUL_ROUTED_WEIGHT: tl.constexpr,
+    top_k: tl.constexpr,
+    compute_type: tl.constexpr,
+    has_zp: tl.constexpr,
+    use_int4_w4a16: tl.constexpr,
+    use_int8_w8a16: tl.constexpr,
+):
     """
     Implements the fused computation for a Mixture of Experts (MOE) using
     token and expert matrices.
@@ -149,8 +172,7 @@ def fused_moe_kernel_gptq_awq(
     num_tokens_post_padded = tl.load(num_tokens_post_padded_ptr)
     if pid_m * BLOCK_SIZE_M >= num_tokens_post_padded:
         return
-    offs_token_id = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M).to(
-        tl.int64)
+    offs_token_id = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M).to(tl.int64)
     offs_token = tl.load(sorted_token_ids_ptr + offs_token_id)
     token_mask = offs_token < num_valid_tokens
 
@@ -159,25 +181,41 @@ def fused_moe_kernel_gptq_awq(
         # -----------------------------------------------------------
         # Write back zeros to the output when the expert is not
         # in the current expert parallel rank.
-        write_zeros_to_output(c_ptr, stride_cm, stride_cn, pid_n, N,
-                              offs_token, token_mask, BLOCK_SIZE_M,
-                              BLOCK_SIZE_N, compute_type)
+        write_zeros_to_output(
+            c_ptr,
+            stride_cm,
+            stride_cn,
+            pid_n,
+            N,
+            offs_token,
+            token_mask,
+            BLOCK_SIZE_M,
+            BLOCK_SIZE_N,
+            compute_type,
+        )
         return
 
-    offs_bn = (pid_n * BLOCK_SIZE_N +
-               tl.arange(0, BLOCK_SIZE_N).to(tl.int64)) % N
+    offs_bn = (pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N).to(tl.int64)) % N
     offs_k = tl.arange(0, BLOCK_SIZE_K)
-    a_ptrs = a_ptr + (offs_token[:, None] // top_k * stride_am +
-                      offs_k[None, :] * stride_ak)
+    a_ptrs = a_ptr + (
+        offs_token[:, None] // top_k * stride_am + offs_k[None, :] * stride_ak
+    )
 
     if use_int4_w4a16:
-        b_ptrs = b_ptr + off_experts * stride_be + \
-            (offs_k[:, None] // 2) * stride_bk + offs_bn[None, :] * \
-                stride_bn
+        b_ptrs = (
+            b_ptr
+            + off_experts * stride_be
+            + (offs_k[:, None] // 2) * stride_bk
+            + offs_bn[None, :] * stride_bn
+        )
         b_shifter = (offs_k[:, None] % 2) * 4
     elif use_int8_w8a16:
-        b_ptrs = b_ptr + off_experts * stride_be + \
-            offs_k[:, None] * stride_bk + offs_bn[None, :] * stride_bn
+        b_ptrs = (
+            b_ptr
+            + off_experts * stride_be
+            + offs_k[:, None] * stride_bk
+            + offs_bn[None, :] * stride_bn
+        )
 
     if not has_zp and use_int4_w4a16:
         b_zp_num = 8
@@ -203,34 +241,43 @@ def fused_moe_kernel_gptq_awq(
             k_mask = None
             k_other = None
 
-        a = tl.load(a_ptrs,
-                    mask=token_mask[:, None] &
-                    (offs_k[None, :] < K - k * BLOCK_SIZE_K),
-                    other=0.0)
+        a = tl.load(
+            a_ptrs,
+            mask=token_mask[:, None] & (offs_k[None, :] < K - k * BLOCK_SIZE_K),
+            other=0.0,
+        )
         b = tl.load(b_ptrs)
         if use_int4_w4a16:
             b = (b >> b_shifter) & 0xF
 
-        b_scale_ptrs = b_scale_ptr + off_experts * stride_bse + \
-            offs_bn[None, :] * stride_bsn + \
-            ((offs_k[:, None] + BLOCK_SIZE_K * k) // group_size) * \
-                stride_bsk
+        b_scale_ptrs = (
+            b_scale_ptr
+            + off_experts * stride_bse
+            + offs_bn[None, :] * stride_bsn
+            + ((offs_k[:, None] + BLOCK_SIZE_K * k) // group_size) * stride_bsk
+        )
         b_scale = tl.load(b_scale_ptrs, mask=k_mask, other=k_other)
         b_scale = b_scale.to(tl.float32)
 
         if has_zp and use_int4_w4a16:
             offs_k_true = (offs_k[:, None] + BLOCK_SIZE_K * k) // group_size
-            b_zp_ptrs = b_zp_ptr + off_experts * stride_bze + \
-                (offs_bn[None, :] // 2) * stride_bzn + \
-                offs_k_true * stride_bzk
+            b_zp_ptrs = (
+                b_zp_ptr
+                + off_experts * stride_bze
+                + (offs_bn[None, :] // 2) * stride_bzn
+                + offs_k_true * stride_bzk
+            )
             b_zp = tl.load(b_zp_ptrs, mask=k_mask, other=k_other)
-            b_zp = ((b_zp >> b_zp_shifter) & 0xF)
+            b_zp = (b_zp >> b_zp_shifter) & 0xF
             b_zp = b_zp.to(tl.float32)
         elif has_zp and use_int8_w8a16:
             offs_k_true = (offs_k[:, None] + BLOCK_SIZE_K * k) // group_size
-            b_zp_ptrs = b_zp_ptr + off_experts * stride_bze + \
-                offs_bn[None, :] * stride_bzn + \
-                offs_k_true * stride_bzk
+            b_zp_ptrs = (
+                b_zp_ptr
+                + off_experts * stride_bze
+                + offs_bn[None, :] * stride_bzn
+                + offs_k_true * stride_bzk
+            )
             b_zp = tl.load(b_zp_ptrs, mask=k_mask, other=k_other)
             b_zp = b_zp.to(tl.float32)
 
@@ -249,17 +296,14 @@ def fused_moe_kernel_gptq_awq(
             b_ptrs += BLOCK_SIZE_K * stride_bk
 
     if MUL_ROUTED_WEIGHT:
-        moe_weight = tl.load(topk_weights_ptr + offs_token,
-                             mask=token_mask,
-                             other=0)
+        moe_weight = tl.load(topk_weights_ptr + offs_token, mask=token_mask, other=0)
         accumulator = accumulator * moe_weight[:, None]
 
     accumulator = accumulator.to(compute_type)
     # -----------------------------------------------------------
     # Write back the block of the output
     offs_cn = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
-    c_ptrs = c_ptr + stride_cm * offs_token[:, None] + stride_cn * offs_cn[
-        None, :]
+    c_ptrs = c_ptr + stride_cm * offs_token[:, None] + stride_cn * offs_cn[None, :]
     c_mask = token_mask[:, None] & (offs_cn[None, :] < N)
     tl.store(c_ptrs, accumulator, mask=c_mask)
 
@@ -365,8 +409,7 @@ def fused_moe_kernel(
     num_tokens_post_padded = tl.load(num_tokens_post_padded_ptr)
     if pid_m * BLOCK_SIZE_M >= num_tokens_post_padded:
         return
-    offs_token_id = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M).to(
-        tl.int64)
+    offs_token_id = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M).to(tl.int64)
     offs_token = tl.load(sorted_token_ids_ptr + offs_token_id)
     token_mask = offs_token < num_valid_tokens
 
@@ -375,22 +418,35 @@ def fused_moe_kernel(
         # -----------------------------------------------------------
         # Write back zeros to the output when the expert is not
         # in the current expert parallel rank.
-        write_zeros_to_output(c_ptr, stride_cm, stride_cn, pid_n, N,
-                              offs_token, token_mask, BLOCK_SIZE_M,
-                              BLOCK_SIZE_N, compute_type)
+        write_zeros_to_output(
+            c_ptr,
+            stride_cm,
+            stride_cn,
+            pid_n,
+            N,
+            offs_token,
+            token_mask,
+            BLOCK_SIZE_M,
+            BLOCK_SIZE_N,
+            compute_type,
+        )
         return
 
-    offs_bn = (pid_n * BLOCK_SIZE_N +
-               tl.arange(0, BLOCK_SIZE_N).to(tl.int64)) % N
+    offs_bn = (pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N).to(tl.int64)) % N
     offs_k = tl.arange(0, BLOCK_SIZE_K)
-    a_ptrs = a_ptr + (offs_token[:, None] // top_k * stride_am +
-                      offs_k[None, :] * stride_ak)
+    a_ptrs = a_ptr + (
+        offs_token[:, None] // top_k * stride_am + offs_k[None, :] * stride_ak
+    )
 
-    b_ptrs = b_ptr + off_experts * stride_be + (offs_k[:, None] * stride_bk +
-                                                offs_bn[None, :] * stride_bn)
+    b_ptrs = (
+        b_ptr
+        + off_experts * stride_be
+        + (offs_k[:, None] * stride_bk + offs_bn[None, :] * stride_bn)
+    )
     if use_int8_w8a16:
-        b_scale_ptrs = b_scale_ptr + off_experts * stride_bse + offs_bn[
-            None, :] * stride_bsn
+        b_scale_ptrs = (
+            b_scale_ptr + off_experts * stride_bse + offs_bn[None, :] * stride_bsn
+        )
         b_scale = tl.load(b_scale_ptrs)
 
     if use_fp8_w8a8 or use_int8_w8a8:
@@ -398,17 +454,18 @@ def fused_moe_kernel(
         if group_k > 0 and group_n > 0:
             a_scale_ptrs = a_scale_ptr + (offs_token // top_k) * stride_asm
             offs_bsn = offs_bn // group_n
-            b_scale_ptrs = (b_scale_ptr + off_experts * stride_bse +
-                            offs_bsn * stride_bsn)
+            b_scale_ptrs = (
+                b_scale_ptr + off_experts * stride_bse + offs_bsn * stride_bsn
+            )
         # channel-wise
         elif per_channel_quant:
-            b_scale_ptrs = b_scale_ptr + off_experts * stride_bse + offs_bn[
-                None, :] * stride_bsn
+            b_scale_ptrs = (
+                b_scale_ptr + off_experts * stride_bse + offs_bn[None, :] * stride_bsn
+            )
             b_scale = tl.load(b_scale_ptrs)
             # Load per-token scale for activations
             a_scale_ptrs = a_scale_ptr + (offs_token // top_k) * stride_asm
-            a_scale = tl.load(a_scale_ptrs, mask=token_mask, other=0.0)[:,
-                                                                        None]
+            a_scale = tl.load(a_scale_ptrs, mask=token_mask, other=0.0)[:, None]
         # tensor-wise
         else:
             a_scale = tl.load(a_scale_ptr)
@@ -426,13 +483,12 @@ def fused_moe_kernel(
     for k in range(0, tl.cdiv(K, BLOCK_SIZE_K)):
         # Load the next block of A and B, generate a mask by checking the
         # K dimension.
-        a = tl.load(a_ptrs,
-                    mask=token_mask[:, None] &
-                    (offs_k[None, :] < K - k * BLOCK_SIZE_K),
-                    other=0.0)
-        b = tl.load(b_ptrs,
-                    mask=offs_k[:, None] < K - k * BLOCK_SIZE_K,
-                    other=0.0)
+        a = tl.load(
+            a_ptrs,
+            mask=token_mask[:, None] & (offs_k[None, :] < K - k * BLOCK_SIZE_K),
+            other=0.0,
+        )
+        b = tl.load(b_ptrs, mask=offs_k[:, None] < K - k * BLOCK_SIZE_K, other=0.0)
         # We accumulate along the K dimension.
         if use_int8_w8a16:
             accumulator = tl.dot(a, b.to(compute_type), acc=accumulator)
@@ -440,13 +496,12 @@ def fused_moe_kernel(
             if group_k > 0 and group_n > 0:
                 k_start = k * BLOCK_SIZE_K
                 offs_ks = k_start // group_k
-                a_scale = tl.load(a_scale_ptrs + offs_ks * stride_ask,
-                                  mask=token_mask,
-                                  other=0.0)
+                a_scale = tl.load(
+                    a_scale_ptrs + offs_ks * stride_ask, mask=token_mask, other=0.0
+                )
                 b_scale = tl.load(b_scale_ptrs + offs_ks * stride_bsk)
 
-                accumulator += tl.dot(a, b) * a_scale[:,
-                                                      None] * b_scale[None, :]
+                accumulator += tl.dot(a, b) * a_scale[:, None] * b_scale[None, :]
             else:
                 if use_fp8_w8a8:
                     # acc used to enable fp8_fast_accum
@@ -461,9 +516,7 @@ def fused_moe_kernel(
     if HAS_BIAS:
         accumulator = accumulator + bias[None, :]
     if MUL_ROUTED_WEIGHT:
-        moe_weight = tl.load(topk_weights_ptr + offs_token,
-                             mask=token_mask,
-                             other=0)
+        moe_weight = tl.load(topk_weights_ptr + offs_token, mask=token_mask, other=0)
         accumulator = accumulator * moe_weight[:, None]
     if use_int8_w8a16:
         accumulator = (accumulator * b_scale).to(compute_type)
@@ -478,43 +531,46 @@ def fused_moe_kernel(
     # -----------------------------------------------------------
     # Write back the block of the output
     offs_cn = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
-    c_ptrs = c_ptr + stride_cm * offs_token[:, None] + stride_cn * offs_cn[
-        None, :]
+    c_ptrs = c_ptr + stride_cm * offs_token[:, None] + stride_cn * offs_cn[None, :]
     c_mask = token_mask[:, None] & (offs_cn[None, :] < N)
     tl.store(c_ptrs, accumulator, mask=c_mask)
 
 
-def invoke_fused_moe_kernel(A: torch.Tensor,
-                            B: torch.Tensor,
-                            C: torch.Tensor,
-                            A_scale: Optional[torch.Tensor],
-                            B_scale: Optional[torch.Tensor],
-                            B_zp: Optional[torch.Tensor],
-                            topk_weights: Optional[torch.Tensor],
-                            sorted_token_ids: torch.Tensor,
-                            expert_ids: torch.Tensor,
-                            num_tokens_post_padded: torch.Tensor,
-                            mul_routed_weight: bool,
-                            top_k: int,
-                            config: dict[str, Any],
-                            compute_type: tl.dtype,
-                            use_fp8_w8a8: bool,
-                            use_int8_w8a8: bool,
-                            use_int8_w8a16: bool,
-                            use_int4_w4a16: bool,
-                            per_channel_quant: bool,
-                            block_shape: Optional[list[int]] = None,
-                            B_bias: Optional[torch.Tensor] = None) -> None:
+def invoke_fused_moe_kernel(
+    A: torch.Tensor,
+    B: torch.Tensor,
+    C: torch.Tensor,
+    A_scale: Optional[torch.Tensor],
+    B_scale: Optional[torch.Tensor],
+    B_zp: Optional[torch.Tensor],
+    topk_weights: Optional[torch.Tensor],
+    sorted_token_ids: torch.Tensor,
+    expert_ids: torch.Tensor,
+    num_tokens_post_padded: torch.Tensor,
+    mul_routed_weight: bool,
+    top_k: int,
+    config: dict[str, Any],
+    compute_type: tl.dtype,
+    use_fp8_w8a8: bool,
+    use_int8_w8a8: bool,
+    use_int8_w8a16: bool,
+    use_int4_w4a16: bool,
+    per_channel_quant: bool,
+    block_shape: Optional[list[int]] = None,
+    B_bias: Optional[torch.Tensor] = None,
+) -> None:
     assert topk_weights is not None or not mul_routed_weight
     assert topk_weights is None or topk_weights.stride(1) == 1
     assert sorted_token_ids.stride(0) == 1
 
     if use_fp8_w8a8 or use_int8_w8a8:
         assert B_scale is not None
-        assert (block_shape is None
-                or triton.cdiv(B.size(-2), block_shape[0]) == B_scale.size(-2))
-        assert (block_shape is None
-                or triton.cdiv(B.size(-1), block_shape[1]) == B_scale.size(-1))
+        assert block_shape is None or triton.cdiv(
+            B.size(-2), block_shape[0]
+        ) == B_scale.size(-2)
+        assert block_shape is None or triton.cdiv(
+            B.size(-1), block_shape[1]
+        ) == B_scale.size(-1)
 
     elif use_int8_w8a16 or use_int4_w4a16:
         assert B_scale is not None
@@ -532,13 +588,17 @@ def invoke_fused_moe_kernel(A: torch.Tensor,
         # We assume that top_ids of each token is unique,
         # so num_valid_experts <= batch_size <= BLOCK_SIZE_M,
         # and we can skip some invalid blocks.
-        EM = min(sorted_token_ids.size(0),
-                 A.size(0) * top_k * config['BLOCK_SIZE_M'])
-    grid = lambda META: (triton.cdiv(EM, META['BLOCK_SIZE_M']) * triton.cdiv(
-        B.size(1), META['BLOCK_SIZE_N']), )
+        EM = min(sorted_token_ids.size(0), A.size(0) * top_k * config["BLOCK_SIZE_M"])
+    grid = lambda META: (
+        triton.cdiv(EM, META["BLOCK_SIZE_M"])
+        * triton.cdiv(B.size(1), META["BLOCK_SIZE_N"]),
+    )
     HAS_BIAS = B_bias is not None
-    if (use_int8_w8a16 or use_int4_w4a16) and \
-            block_shape is not None and block_shape[1] > 0:
+    if (
+        (use_int8_w8a16 or use_int4_w4a16)
+        and block_shape is not None
+        and block_shape[1] > 0
+    ):
         assert B_scale is not None and B_scale.ndim == 3
         assert B_zp is None or B_zp.ndim == 3
 
@@ -546,27 +606,41 @@ def invoke_fused_moe_kernel(A: torch.Tensor,
             num_valid_tokens=num_tokens,
             group_size=block_shape[1],
             num_experts=B.size(0),
-            bit=4 if use_int4_w4a16 else 8)
+            bit=4 if use_int4_w4a16 else 8,
+        )
         config = config.copy()
         config.update(
-            get_moe_wna16_block_config(config=config,
-                                       use_moe_wna16_cuda=use_moe_wna16_cuda,
-                                       num_valid_tokens=num_tokens,
-                                       size_k=A.size(1),
-                                       size_n=B.size(1),
-                                       num_experts=B.size(1),
-                                       group_size=block_shape[1],
-                                       real_top_k=top_k,
-                                       block_size_m=config["BLOCK_SIZE_M"]))
+            get_moe_wna16_block_config(
+                config=config,
+                use_moe_wna16_cuda=use_moe_wna16_cuda,
+                num_valid_tokens=num_tokens,
+                size_k=A.size(1),
+                size_n=B.size(1),
+                num_experts=B.size(1),
+                group_size=block_shape[1],
+                real_top_k=top_k,
+                block_size_m=config["BLOCK_SIZE_M"],
+            )
+        )
 
         if use_moe_wna16_cuda:
             bit = 4 if use_int4_w4a16 else 8
-            ops.moe_wna16_gemm(A, C, B, B_scale, B_zp,
-                               topk_weights if mul_routed_weight else None,
-                               sorted_token_ids, expert_ids,
-                               num_tokens_post_padded, top_k,
-                               config["BLOCK_SIZE_M"], config["BLOCK_SIZE_N"],
-                               config["BLOCK_SIZE_K"], bit)
+            ops.moe_wna16_gemm(
+                A,
+                C,
+                B,
+                B_scale,
+                B_zp,
+                topk_weights if mul_routed_weight else None,
+                sorted_token_ids,
+                expert_ids,
+                num_tokens_post_padded,
+                top_k,
+                config["BLOCK_SIZE_M"],
+                config["BLOCK_SIZE_N"],
+                config["BLOCK_SIZE_K"],
+                bit,
+            )
             return
 
         fused_moe_kernel_gptq_awq[grid](
@@ -610,8 +684,7 @@ def invoke_fused_moe_kernel(A: torch.Tensor,
         config = config.copy()
         BLOCK_SIZE_K = config.pop("BLOCK_SIZE_K")
         if block_shape is not None:
-            BLOCK_SIZE_K = min(BLOCK_SIZE_K, min(block_shape[0],
-                                                 block_shape[1]))
+            BLOCK_SIZE_K = min(BLOCK_SIZE_K, min(block_shape[0], block_shape[1]))
         fused_moe_kernel[grid](
             A,
             B,
@@ -634,16 +707,11 @@ def invoke_fused_moe_kernel(A: torch.Tensor,
             B.stride(1),
             C.stride(1),
             C.stride(2),
-            A_scale.stride(0)
-            if A_scale is not None and A_scale.ndim == 2 else 0,
-            A_scale.stride(1)
-            if A_scale is not None and A_scale.ndim == 2 else 0,
-            B_scale.stride(0)
-            if B_scale is not None and B_scale.ndim >= 2 else 0,
-            B_scale.stride(2)
-            if B_scale is not None and B_scale.ndim == 3 else 0,
-            B_scale.stride(1)
-            if B_scale is not None and B_scale.ndim >= 2 else 0,
+            A_scale.stride(0) if A_scale is not None and A_scale.ndim == 2 else 0,
+            A_scale.stride(1) if A_scale is not None and A_scale.ndim == 2 else 0,
+            B_scale.stride(0) if B_scale is not None and B_scale.ndim >= 2 else 0,
+            B_scale.stride(2) if B_scale is not None and B_scale.ndim == 3 else 0,
+            B_scale.stride(1) if B_scale is not None and B_scale.ndim >= 2 else 0,
             B_bias.stride(0) if B_bias is not None else 0,
             B_bias.stride(1) if B_bias is not None else 0,
             0 if block_shape is None else block_shape[0],
@@ -680,28 +748,36 @@ def compute_identity_kernel(
     if batch_id >= num_tokens or dim_offset >= hidden_dim:
         return
 
-    h = tl.load(hidden_states_ptr + batch_id * hidden_dim + dim_offset +
-                tl.arange(0, BLOCK_SIZE),
-                mask=(dim_offset + tl.arange(0, BLOCK_SIZE)) < hidden_dim)
+    h = tl.load(
+        hidden_states_ptr
+        + batch_id * hidden_dim
+        + dim_offset
+        + tl.arange(0, BLOCK_SIZE),
+        mask=(dim_offset + tl.arange(0, BLOCK_SIZE)) < hidden_dim,
+    )
 
     result = tl.zeros([BLOCK_SIZE], dtype=tl.float32)
     for i in range(top_k):
         scale = tl.load(expert_scales_ptr + batch_id * scales_stride + i)
         result += h * scale
 
-    tl.store(output_ptr + batch_id * hidden_dim + dim_offset +
-             tl.arange(0, BLOCK_SIZE),
-             result,
-             mask=(dim_offset + tl.arange(0, BLOCK_SIZE)) < hidden_dim)
+    tl.store(
+        output_ptr + batch_id * hidden_dim + dim_offset + tl.arange(0, BLOCK_SIZE),
+        result,
+        mask=(dim_offset + tl.arange(0, BLOCK_SIZE)) < hidden_dim,
+    )
 
 
-def zero_experts_compute_triton(expert_indices: torch.Tensor,
-                                expert_scales: torch.Tensor, num_experts: int,
-                                zero_expert_type: str,
-                                hidden_states: torch.Tensor) -> torch.Tensor:
+def zero_experts_compute_triton(
+    expert_indices: torch.Tensor,
+    expert_scales: torch.Tensor,
+    num_experts: int,
+    zero_expert_type: str,
+    hidden_states: torch.Tensor,
+) -> torch.Tensor:
     N = expert_indices.numel()
     top_k = expert_indices.size(-1)
-    grid = lambda meta: (triton.cdiv(N, meta['BLOCK_SIZE']), )
+    grid = lambda meta: (triton.cdiv(N, meta["BLOCK_SIZE"]),)
 
     if zero_expert_type == "identity":
         zero_expert_mask = expert_indices < num_experts
@@ -716,7 +792,7 @@ def zero_experts_compute_triton(expert_indices: torch.Tensor,
     hidden_dim = hidden_states.size(-1)
     num_tokens = hidden_states.size(0)
 
-    grid = lambda meta: (num_tokens * (hidden_dim // meta['BLOCK_SIZE']), )
+    grid = lambda meta: (num_tokens * (hidden_dim // meta["BLOCK_SIZE"]),)
     compute_identity_kernel[grid](
         top_k,
         hidden_states,
@@ -732,14 +808,14 @@ def zero_experts_compute_triton(expert_indices: torch.Tensor,
 
 
 # Adapted from: https://github.com/sgl-project/sglang/pull/2628
-def get_config_file_name(E: int,
-                         N: int,
-                         dtype: Optional[str],
-                         block_shape: Optional[list[int]] = None) -> str:
+def get_config_file_name(
+    E: int, N: int, dtype: Optional[str], block_shape: Optional[list[int]] = None
+) -> str:
     device_name = current_platform.get_device_name().replace(" ", "_")
     dtype_selector = "" if not dtype else f",dtype={dtype}"
-    block_shape_selector = ("" if not block_shape or not all(block_shape) else
-                            f",block_shape={block_shape}").replace(" ", "")
+    block_shape_selector = (
+        "" if not block_shape or not all(block_shape) else f",block_shape={block_shape}"
+    ).replace(" ", "")
     return f"E={E},N={N},device_name={device_name}{dtype_selector}{block_shape_selector}.json"  # noqa: E501
 
 
@@ -772,18 +848,21 @@ def get_moe_configs(
     user_defined_config_folder = envs.VLLM_TUNED_CONFIG_FOLDER
     if user_defined_config_folder is not None:
         user_defined_config_file_path = os.path.join(
-            user_defined_config_folder, json_file_name)
+            user_defined_config_folder, json_file_name
+        )
         config_file_paths.append(user_defined_config_file_path)
 
     default_config_file_path = os.path.join(
-        os.path.dirname(os.path.realpath(__file__)), "configs", json_file_name)
+        os.path.dirname(os.path.realpath(__file__)), "configs", json_file_name
+    )
     config_file_paths.append(default_config_file_path)
 
     for config_file_path in config_file_paths:
         if os.path.exists(config_file_path):
             with open(config_file_path) as f:
-                logger.info("Using configuration from %s for MoE layer.",
-                            config_file_path)
+                logger.info(
+                    "Using configuration from %s for MoE layer.", config_file_path
+                )
                 # If a configuration has been found, return it
                 tuned_config = json.load(f)
                 # Delete triton_version from tuned_config
@@ -793,16 +872,26 @@ def get_moe_configs(
     # If no optimized configuration is available, we will use the default
     # configuration
     logger.warning(
-        ("Using default MoE config. Performance might be sub-optimal! "
-         "Config file not found at %s"), config_file_paths)
+        (
+            "Using default MoE config. Performance might be sub-optimal! "
+            "Config file not found at %s"
+        ),
+        config_file_paths,
+    )
     return None
 
 
-def get_moe_wna16_block_config(config: dict[str,
-                                            int], use_moe_wna16_cuda: bool,
-                               num_valid_tokens: int, size_k: int, size_n: int,
-                               num_experts: int, group_size: int,
-                               real_top_k: int, block_size_m: int):
+def get_moe_wna16_block_config(
+    config: dict[str, int],
+    use_moe_wna16_cuda: bool,
+    num_valid_tokens: int,
+    size_k: int,
+    size_n: int,
+    num_experts: int,
+    group_size: int,
+    real_top_k: int,
+    block_size_m: int,
+):
     if "BLOCK_SIZE_N" in config and "BLOCK_SIZE_K" in config:
         # optimal block config is set
         return {}
@@ -824,20 +913,24 @@ def get_moe_wna16_block_config(config: dict[str,
 
         num_n_blocks = size_k // block_size_k
         num_k_blocks = size_n // block_size_k
-        num_m_blocks = (num_valid_tokens + block_size_m - 1) / block_size_m + \
-            num_experts
+        num_m_blocks = (
+            num_valid_tokens + block_size_m - 1
+        ) / block_size_m + num_experts
         if num_valid_tokens // real_top_k <= block_size_m:
             num_m_blocks = min(num_m_blocks, num_valid_tokens)
         num_blocks = num_m_blocks * num_n_blocks * num_k_blocks
 
-        if size_k % 256 == 0 and num_blocks >= 256 and \
-                block_size_k < 256:
+        if size_k % 256 == 0 and num_blocks >= 256 and block_size_k < 256:
             block_size_k = 256
             num_blocks = num_blocks // (256 // block_size_k)
 
-        if num_m_blocks <= 16 and size_k % (block_size_k * 2) == 0 and \
-                size_k % (block_size_k * 2) == 0 and block_size_k <= 512 and \
-                num_blocks >= 512:
+        if (
+            num_m_blocks <= 16
+            and size_k % (block_size_k * 2) == 0
+            and size_k % (block_size_k * 2) == 0
+            and block_size_k <= 512
+            and num_blocks >= 512
+        ):
             block_size_k = block_size_k * 2
             num_blocks = num_blocks // 2
 
@@ -856,10 +949,15 @@ def get_moe_wna16_block_config(config: dict[str,
         return {"BLOCK_SIZE_N": block_size_n, "BLOCK_SIZE_K": block_size_k}
 
 
-def should_moe_wna16_use_cuda(num_valid_tokens: int, group_size: int,
-                              num_experts: int, bit: int):
-    return current_platform.is_cuda() and bit == 4 and \
-        group_size in [32, 64, 128] and num_valid_tokens / num_experts <= 6
+def should_moe_wna16_use_cuda(
+    num_valid_tokens: int, group_size: int, num_experts: int, bit: int
+):
+    return (
+        current_platform.is_cuda()
+        and bit == 4
+        and group_size in [32, 64, 128]
+        and num_valid_tokens / num_experts <= 6
+    )
 
 
 def get_default_config(
@@ -889,8 +987,7 @@ def get_default_config(
         # only set BLOCK_SIZE_M
         # BLOCK_SIZE_N and BLOCK_SIZE_K would be set later
         bit = 4 if dtype == "int4_w4a16" else 8
-        use_moe_wna16_cuda = should_moe_wna16_use_cuda(M * topk,
-                                                       block_shape[1], E, bit)
+        use_moe_wna16_cuda = should_moe_wna16_use_cuda(M * topk, block_shape[1], E, bit)
         if use_moe_wna16_cuda:
             config = {"BLOCK_SIZE_M": min(16, M)}
         elif M <= 20:
@@ -925,6 +1022,7 @@ def try_get_optimal_moe_config(
     block_shape: Optional[list[int]] = None,
 ) -> dict[str, int]:
     from vllm.model_executor.layers.fused_moe import get_config
+
     override_config = get_config()
     if override_config:
         config = override_config
@@ -943,15 +1041,17 @@ def try_get_optimal_moe_config(
             config = configs[min(configs.keys(), key=lambda x: abs(x - M))]
         else:
             # Else use the default config
-            config = get_default_config(M, E, N, w1_shape[2], top_k, dtype,
-                                        block_shape)
+            config = get_default_config(M, E, N, w1_shape[2], top_k, dtype, block_shape)
     return config
 
 
-def vllm_topk_softmax(topk_weights: torch.Tensor, topk_indices: torch.Tensor,
-                      token_expert_indices: torch.Tensor,
-                      gating_output: torch.Tensor,
-                      renormalize: bool) -> tuple[torch.Tensor, ...]:
+def vllm_topk_softmax(
+    topk_weights: torch.Tensor,
+    topk_indices: torch.Tensor,
+    token_expert_indices: torch.Tensor,
+    gating_output: torch.Tensor,
+    renormalize: bool,
+) -> tuple[torch.Tensor, ...]:
     ops.topk_softmax(
         topk_weights,
         topk_indices,
@@ -967,6 +1067,7 @@ def vllm_topk_softmax(topk_weights: torch.Tensor, topk_indices: torch.Tensor,
 def dispatch_topk_func() -> Callable[..., tuple[torch.Tensor, ...]]:
     if is_rocm_aiter_moe_enabled():
         from .rocm_aiter_fused_moe import rocm_aiter_topk_softmax
+
         return rocm_aiter_topk_softmax
     return vllm_topk_softmax
 
@@ -978,31 +1079,29 @@ def fused_topk(
     renormalize: bool,
     indices_type: Optional[torch.dtype] = None,
 ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
-    assert hidden_states.size(0) == gating_output.size(0), (
-        "Number of tokens mismatch")
+    assert hidden_states.size(0) == gating_output.size(0), "Number of tokens mismatch"
 
     M, _ = hidden_states.size()
 
-    topk_weights = torch.empty(M,
-                               topk,
-                               dtype=torch.float32,
-                               device=hidden_states.device)
+    topk_weights = torch.empty(
+        M, topk, dtype=torch.float32, device=hidden_states.device
+    )
     topk_ids = torch.empty(
         M,
         topk,
         dtype=torch.int32 if indices_type is None else indices_type,
-        device=hidden_states.device)
-    token_expert_indices = torch.empty(M,
-                                       topk,
-                                       dtype=torch.int32,
-                                       device=hidden_states.device)
+        device=hidden_states.device,
+    )
+    token_expert_indices = torch.empty(
+        M, topk, dtype=torch.int32, device=hidden_states.device
+    )
 
     gating_output_float = gating_output.float()  # TODO(woosuk): Optimize this.
 
     topk_func = dispatch_topk_func()
-    topk_weights, topk_ids = topk_func(topk_weights, topk_ids,
-                                       token_expert_indices,
-                                       gating_output_float, renormalize)
+    topk_weights, topk_ids = topk_func(
+        topk_weights, topk_ids, token_expert_indices, gating_output_float, renormalize
+    )
 
     return topk_weights, topk_ids, token_expert_indices
 
@@ -1017,9 +1116,9 @@ def fused_topk_bias(
     n_routed_experts = gating_output.shape[-1]
     scores = gating_output.softmax(dim=-1)
     scores_for_choice = scores.view(
-        -1, n_routed_experts) + e_score_correction_bias.unsqueeze(0)
-    topk_indices = torch.topk(scores_for_choice, k=topk, dim=-1,
-                              sorted=False)[1]
+        -1, n_routed_experts
+    ) + e_score_correction_bias.unsqueeze(0)
+    topk_indices = torch.topk(scores_for_choice, k=topk, dim=-1, sorted=False)[1]
     topk_weights = scores.gather(1, topk_indices)
     if renormalize:
         topk_weights = topk_weights / topk_weights.sum(dim=-1, keepdim=True)
@@ -1039,10 +1138,13 @@ def grouped_topk(
     routed_scaling_factor: float = 1.0,
     e_score_correction_bias: Optional[torch.Tensor] = None,
 ) -> tuple[torch.Tensor, torch.Tensor]:
-    if envs.VLLM_USE_FUSED_MOE_GROUPED_TOPK and \
-            current_platform.is_cuda() and \
-            num_expert_group <= 32 and topk <= 32 and \
-            e_score_correction_bias is not None:
+    if (
+        envs.VLLM_USE_FUSED_MOE_GROUPED_TOPK
+        and current_platform.is_cuda()
+        and num_expert_group <= 32
+        and topk <= 32
+        and e_score_correction_bias is not None
+    ):
         return fused_grouped_topk(
             hidden_states=hidden_states,
             gating_output=gating_output,
@@ -1052,10 +1154,10 @@ def grouped_topk(
             num_expert_group=num_expert_group,
             topk_group=topk_group,
             scoring_func=scoring_func,
-            routed_scaling_factor=routed_scaling_factor)
+            routed_scaling_factor=routed_scaling_factor,
+        )
 
-    assert hidden_states.size(0) == gating_output.size(0), (
-        "Number of tokens mismatch")
+    assert hidden_states.size(0) == gating_output.size(0), "Number of tokens mismatch"
 
     if scoring_func == "softmax":
         scores = torch.softmax(gating_output, dim=-1)
@@ -1070,30 +1172,31 @@ def grouped_topk(
         # scores for expert selection but original scores for routing weights
         original_scores = scores
         scores = scores + e_score_correction_bias.unsqueeze(0)
-        group_scores = (scores.view(num_token, num_expert_group,
-                                    -1).topk(2, dim=-1)[0].sum(dim=-1))
+        group_scores = (
+            scores.view(num_token, num_expert_group, -1).topk(2, dim=-1)[0].sum(dim=-1)
+        )
     else:
-        group_scores = scores.view(num_token, num_expert_group,
-                                   -1).max(dim=-1).values  # [n, n_group]
-    group_idx = torch.topk(group_scores, k=topk_group, dim=-1,
-                           sorted=False)[1]  # [n, top_k_group]
+        group_scores = (
+            scores.view(num_token, num_expert_group, -1).max(dim=-1).values
+        )  # [n, n_group]
+    group_idx = torch.topk(group_scores, k=topk_group, dim=-1, sorted=False)[
+        1
+    ]  # [n, top_k_group]
     group_mask = torch.zeros_like(group_scores)  # [n, n_group]
     group_mask.scatter_(1, group_idx, 1)  # [n, n_group]
-    score_mask = group_mask.unsqueeze(-1).expand(
-        num_token, num_expert_group,
-        scores.size(-1) // num_expert_group).reshape(num_token, -1)  # [n, e]
-    tmp_scores = scores.masked_fill(~score_mask.bool(),
-                                    float("-inf"))  # [n, e]
+    score_mask = (
+        group_mask.unsqueeze(-1)
+        .expand(num_token, num_expert_group, scores.size(-1) // num_expert_group)
+        .reshape(num_token, -1)
+    )  # [n, e]
+    tmp_scores = scores.masked_fill(~score_mask.bool(), float("-inf"))  # [n, e]
 
     if e_score_correction_bias is not None:
         topk_ids = torch.topk(tmp_scores, k=topk, dim=-1, sorted=False)[1]
         # Use original unbiased scores for the routing weights
         topk_weights = original_scores.gather(1, topk_ids)
     else:
-        topk_weights, topk_ids = torch.topk(tmp_scores,
-                                            k=topk,
-                                            dim=-1,
-                                            sorted=False)
+        topk_weights, topk_ids = torch.topk(tmp_scores, k=topk, dim=-1, sorted=False)
 
     if renormalize:
         topk_weights = topk_weights / topk_weights.sum(dim=-1, keepdim=True)
@@ -1105,12 +1208,13 @@ def grouped_topk(
 
 @torch.compile(dynamic=True, backend=current_platform.simple_compile_backend)
 def eplb_map_to_physical_and_record(
-        topk_ids: torch.Tensor,
-        expert_load_view: torch.Tensor,
-        logical_to_physical_map: torch.Tensor,
-        logical_replica_count: torch.Tensor,
-        indices_type: Optional[torch.dtype] = None) -> torch.Tensor:
-    '''
+    topk_ids: torch.Tensor,
+    expert_load_view: torch.Tensor,
+    logical_to_physical_map: torch.Tensor,
+    logical_replica_count: torch.Tensor,
+    indices_type: Optional[torch.dtype] = None,
+) -> torch.Tensor:
+    """
     Map the logical expert ids to physical expert ids
     and record the expert load metrics.
 
@@ -1126,7 +1230,7 @@ def eplb_map_to_physical_and_record(
 
     Returns:
         The physical expert ids.
-    '''
+    """
 
     # 1. Convert the logical expert ids to physical expert ids
     # Directly select a random replica for each logical expert
@@ -1138,13 +1242,14 @@ def eplb_map_to_physical_and_record(
     # to deterministically choose a replica
     replica_count = logical_replica_count[topk_ids_long]
     # Flatten-position based index, reshaped back to `topk_ids` shape
-    pos_indices = torch.arange(topk_ids.numel(),
-                               device=topk_ids.device,
-                               dtype=torch.long).reshape_as(topk_ids)
+    pos_indices = torch.arange(
+        topk_ids.numel(), device=topk_ids.device, dtype=torch.long
+    ).reshape_as(topk_ids)
     # Compute pseudo-random indices by modulo
     replica_indices = (pos_indices % replica_count).unsqueeze(-1)
-    physical_ids = logical_to_physical_map[topk_ids_long].gather(
-        -1, replica_indices).squeeze(-1)
+    physical_ids = (
+        logical_to_physical_map[topk_ids_long].gather(-1, replica_indices).squeeze(-1)
+    )
 
     topk_ids = physical_ids
 
@@ -1169,7 +1274,8 @@ def eplb_map_to_physical_and_record(
     expert_load_view.scatter_add_(
         dim=0,
         index=topk_ids_flatten.long(),
-        src=torch.ones_like(topk_ids_flatten).to(expert_load_view))
+        src=torch.ones_like(topk_ids_flatten).to(expert_load_view),
+    )
 
     if indices_type is not None:
         topk_ids = topk_ids.to(dtype=indices_type)
@@ -1187,8 +1293,7 @@ def fused_grouped_topk(
     scoring_func: str = "softmax",
     routed_scaling_factor: float = 1.0,
 ) -> tuple[torch.Tensor, torch.Tensor]:
-    assert hidden_states.size(0) == gating_output.size(0), (
-        "Number of tokens mismatch")
+    assert hidden_states.size(0) == gating_output.size(0), "Number of tokens mismatch"
 
     if scoring_func == "softmax":
         scores = torch.softmax(gating_output, dim=-1)
@@ -1199,8 +1304,14 @@ def fused_grouped_topk(
 
     scores_with_bias = scores + e_score_correction_bias.unsqueeze(0)
     topk_values, topk_indices = ops.grouped_topk(
-        scores, scores_with_bias.to(scores.dtype), num_expert_group,
-        topk_group, topk, renormalize, routed_scaling_factor)
+        scores,
+        scores_with_bias.to(scores.dtype),
+        num_expert_group,
+        topk_group,
+        topk,
+        renormalize,
+        routed_scaling_factor,
+    )
     return topk_values.to(torch.float32), topk_indices.to(torch.int32)
 
 
@@ -1230,12 +1341,33 @@ def inplace_fused_experts(
     w1_bias: Optional[torch.Tensor] = None,
     w2_bias: Optional[torch.Tensor] = None,
 ) -> None:
-    fused_experts_impl(hidden_states, w1, w2, topk_weights, topk_ids, True,
-                       activation, apply_router_weight_on_input, use_fp8_w8a8,
-                       use_int8_w8a8, use_int8_w8a16, use_int4_w4a16,
-                       use_mxfp4_w4a4, per_channel_quant, global_num_experts,
-                       expert_map, w1_scale, w2_scale, w1_zp, w2_zp, a1_scale,
-                       a2_scale, block_shape, w1_bias, w2_bias)
+    fused_experts_impl(
+        hidden_states,
+        w1,
+        w2,
+        topk_weights,
+        topk_ids,
+        True,
+        activation,
+        apply_router_weight_on_input,
+        use_fp8_w8a8,
+        use_int8_w8a8,
+        use_int8_w8a16,
+        use_int4_w4a16,
+        use_mxfp4_w4a4,
+        per_channel_quant,
+        global_num_experts,
+        expert_map,
+        w1_scale,
+        w2_scale,
+        w1_zp,
+        w2_zp,
+        a1_scale,
+        a2_scale,
+        block_shape,
+        w1_bias,
+        w2_bias,
+    )
 
 
 def inplace_fused_experts_fake(
@@ -1272,8 +1404,11 @@ def inplace_fused_experts_fake(
     op_func=inplace_fused_experts,
     mutates_args=["hidden_states"],
     fake_impl=inplace_fused_experts_fake,
-    tags=(() if is_torch_equal_or_newer("2.7.0") else
-          (torch.Tag.needs_fixed_stride_order, )),
+    tags=(
+        ()
+        if is_torch_equal_or_newer("2.7.0")
+        else (torch.Tag.needs_fixed_stride_order,)
+    ),
 )
 
 
@@ -1304,11 +1439,32 @@ def outplace_fused_experts(
     w2_bias: Optional[torch.Tensor] = None,
 ) -> torch.Tensor:
     return fused_experts_impl(
-        hidden_states, w1, w2, topk_weights, topk_ids, False, activation,
-        apply_router_weight_on_input, use_fp8_w8a8, use_int8_w8a8,
-        use_int8_w8a16, use_int4_w4a16, use_mxfp4_w4a4, per_channel_quant,
-        global_num_experts, expert_map, w1_scale, w2_scale, w1_zp, w2_zp,
-        a1_scale, a2_scale, block_shape, w1_bias, w2_bias)
+        hidden_states,
+        w1,
+        w2,
+        topk_weights,
+        topk_ids,
+        False,
+        activation,
+        apply_router_weight_on_input,
+        use_fp8_w8a8,
+        use_int8_w8a8,
+        use_int8_w8a16,
+        use_int4_w4a16,
+        use_mxfp4_w4a4,
+        per_channel_quant,
+        global_num_experts,
+        expert_map,
+        w1_scale,
+        w2_scale,
+        w1_zp,
+        w2_zp,
+        a1_scale,
+        a2_scale,
+        block_shape,
+        w1_bias,
+        w2_bias,
+    )
 
 
 def outplace_fused_experts_fake(
@@ -1343,14 +1499,17 @@ def outplace_fused_experts_fake(
     op_name="outplace_fused_experts",
     op_func=outplace_fused_experts,
     fake_impl=outplace_fused_experts_fake,
-    tags=(() if is_torch_equal_or_newer("2.7.0") else
-          (torch.Tag.needs_fixed_stride_order, )),
+    tags=(
+        ()
+        if is_torch_equal_or_newer("2.7.0")
+        else (torch.Tag.needs_fixed_stride_order,)
+    ),
 )
 
 
 def torch_vllm_inplace_fused_experts(**kwargs) -> torch.Tensor:
     torch.ops.vllm.inplace_fused_experts(**kwargs)
-    hidden_states = kwargs['hidden_states']
+    hidden_states = kwargs["hidden_states"]
     return hidden_states
 
 
@@ -1381,7 +1540,6 @@ def fused_experts(
     allow_deep_gemm: bool = False,
     allow_cutlass_block_scaled_grouped_gemm: bool = False,
 ) -> torch.Tensor:
-
     if quant_config is None:
         quant_config = FUSED_MOE_UNQUANTIZED_CONFIG
     use_fp8_w8a8 = quant_config.use_fp8_w8a8
@@ -1392,8 +1550,11 @@ def fused_experts(
     # E8M0 scale, which means we requantize the weight and input to the specific
     # scale. Fallen back to cutlass or triton for some cases would cause
     # accuracy issue.
-    if (allow_deep_gemm and quant_config.use_fp8_w8a8 and
-        (is_deep_gemm_e8m0_used() or _valid_deep_gemm(hidden_states, w1, w2))):
+    if (
+        allow_deep_gemm
+        and quant_config.use_fp8_w8a8
+        and (is_deep_gemm_e8m0_used() or _valid_deep_gemm(hidden_states, w1, w2))
+    ):
         assert quant_config is not None
         assert apply_router_weight_on_input is False
         return deep_gemm_moe_fp8(
@@ -1412,10 +1573,13 @@ def fused_experts(
             a2_scale=quant_config.a2_scale,
             apply_router_weight_on_input=apply_router_weight_on_input,
         )
-    elif (allow_cutlass_block_scaled_grouped_gemm and use_fp8_w8a8
-          and _valid_cutlass_block_scaled_grouped_gemm(
-              w1, w2, inplace, activation, apply_router_weight_on_input,
-              expert_map)):
+    elif (
+        allow_cutlass_block_scaled_grouped_gemm
+        and use_fp8_w8a8
+        and _valid_cutlass_block_scaled_grouped_gemm(
+            w1, w2, inplace, activation, apply_router_weight_on_input, expert_map
+        )
+    ):
         assert quant_config is not None
         return run_cutlass_block_scaled_fused_experts(
             a=hidden_states,
@@ -1424,7 +1588,8 @@ def fused_experts(
             w1_scale=quant_config.w1_scale,
             w2_scale=quant_config.w2_scale,
             topk_weights=topk_weights,
-            topk_ids=topk_ids)
+            topk_ids=topk_ids,
+        )
     else:
         return dispatch_fused_experts_func(inplace)(
             hidden_states=hidden_states,
@@ -1450,7 +1615,8 @@ def fused_experts(
             a2_scale=quant_config.a2_scale,
             block_shape=quant_config.block_shape,
             w1_bias=quant_config.w1_bias,
-            w2_bias=quant_config.w2_bias)
+            w2_bias=quant_config.w2_bias,
+        )
 
 
 SILU_NO_MUL: str = activation_without_mul("silu")
@@ -1507,22 +1673,20 @@ def fused_experts_impl(
 ) -> torch.Tensor:
     # Check constraints.
     if use_int4_w4a16:
-        assert hidden_states.size(1) // 2 == w1.size(2), (
-            "Hidden size mismatch")
+        assert hidden_states.size(1) // 2 == w1.size(2), "Hidden size mismatch"
     elif use_mxfp4_w4a4:
         # 16bit activation and fp4x2 packed weight
         assert hidden_states.size(1) // 2 == w1.size(2), "hidden size mismatch"
     else:
         assert hidden_states.size(1) == w1.size(2), (
-            f"Hidden size mismatch {hidden_states.size(1)} != {w1.size(2)}")
+            f"Hidden size mismatch {hidden_states.size(1)} != {w1.size(2)}"
+        )
 
     assert topk_weights.size() == topk_ids.size(), "topk shape mismatch"
     assert hidden_states.is_contiguous(), "Hidden_states must be contiguous"
     assert w1.stride(-1) == 1, "Stride of last dimension must be 1"
     assert w2.stride(-1) == 1, "Stride of last dimension must be 1"
-    assert hidden_states.dtype in [
-        torch.float32, torch.float16, torch.bfloat16
-    ]
+    assert hidden_states.dtype in [torch.float32, torch.float16, torch.bfloat16]
 
     num_tokens = hidden_states.size(0)
     E, N, _ = w1.size()
@@ -1535,17 +1699,21 @@ def fused_experts_impl(
     CHUNK_SIZE = envs.VLLM_FUSED_MOE_CHUNK_SIZE
     M = min(num_tokens, CHUNK_SIZE)
 
-    config_dtype = _get_config_dtype_str(use_fp8_w8a8=use_fp8_w8a8,
-                                         use_int8_w8a16=use_int8_w8a16,
-                                         use_int4_w4a16=use_int4_w4a16,
-                                         use_mxfp4_w4a4=use_mxfp4_w4a4,
-                                         dtype=hidden_states.dtype)
+    config_dtype = _get_config_dtype_str(
+        use_fp8_w8a8=use_fp8_w8a8,
+        use_int8_w8a16=use_int8_w8a16,
+        use_int4_w4a16=use_int4_w4a16,
+        use_mxfp4_w4a4=use_mxfp4_w4a4,
+        dtype=hidden_states.dtype,
+    )
 
     # Note: for use_int8_w8a16 or use_int4_w4a16, the activations are
     # quantized prior to calling fused_experts.
-    quant_dtype = _get_config_quant_dtype(use_fp8_w8a8=use_fp8_w8a8,
-                                          use_int8_w8a8=use_int8_w8a8,
-                                          use_mxfp4_w4a4=use_mxfp4_w4a4)
+    quant_dtype = _get_config_quant_dtype(
+        use_fp8_w8a8=use_fp8_w8a8,
+        use_int8_w8a8=use_int8_w8a8,
+        use_mxfp4_w4a4=use_mxfp4_w4a4,
+    )
 
     get_config_func = functools.partial(
         try_get_optimal_moe_config,
@@ -1560,16 +1728,18 @@ def fused_experts_impl(
 
     # We can reuse the memory between these because by the time we need
     # cache3, we're done with cache1
-    cache13 = torch.empty(M * top_k_num * max(N, K),
-                          device=hidden_states.device,
-                          dtype=hidden_states.dtype)
-    intermediate_cache1 = cache13[:M * top_k_num * N].view(M, top_k_num, N)
-    intermediate_cache3 = cache13[:M * top_k_num * K].view(M, top_k_num, K)
+    cache13 = torch.empty(
+        M * top_k_num * max(N, K),
+        device=hidden_states.device,
+        dtype=hidden_states.dtype,
+    )
+    intermediate_cache1 = cache13[: M * top_k_num * N].view(M, top_k_num, N)
+    intermediate_cache3 = cache13[: M * top_k_num * K].view(M, top_k_num, K)
 
     # This needs separate memory since it's used concurrently with cache1
-    intermediate_cache2 = torch.empty((M * top_k_num, N // 2),
-                                      device=hidden_states.device,
-                                      dtype=hidden_states.dtype)
+    intermediate_cache2 = torch.empty(
+        (M * top_k_num, N // 2), device=hidden_states.device, dtype=hidden_states.dtype
+    )
 
     if hidden_states.dtype == torch.bfloat16:
         compute_type = tl.bfloat16
@@ -1593,9 +1763,10 @@ def fused_experts_impl(
         w2_scale = None
 
     for chunk in range((num_tokens // CHUNK_SIZE) + 1):
-        begin_chunk_idx, end_chunk_idx = (chunk * CHUNK_SIZE,
-                                          min((chunk + 1) * CHUNK_SIZE,
-                                              num_tokens))
+        begin_chunk_idx, end_chunk_idx = (
+            chunk * CHUNK_SIZE,
+            min((chunk + 1) * CHUNK_SIZE, num_tokens),
+        )
         curr_hidden_states = hidden_states[begin_chunk_idx:end_chunk_idx]
         tokens_in_chunk, _ = curr_hidden_states.size()
 
@@ -1608,8 +1779,9 @@ def fused_experts_impl(
             # so the cache size and config are already set correctly and
             # do not need to be adjusted.
             intermediate_cache1 = intermediate_cache1[:tokens_in_chunk]
-            intermediate_cache2 = intermediate_cache2[:tokens_in_chunk *
-                                                      topk_ids.size(1)]
+            intermediate_cache2 = intermediate_cache2[
+                : tokens_in_chunk * topk_ids.size(1)
+            ]
             intermediate_cache3 = intermediate_cache3[:tokens_in_chunk]
             config = get_config_func(tokens_in_chunk)
 
@@ -1620,45 +1792,51 @@ def fused_experts_impl(
             A_scale=a1_scale,
             quant_dtype=quant_dtype,
             per_act_token_quant=per_channel_quant,
-            block_shape=block_shape)
-
-        sorted_token_ids, expert_ids, num_tokens_post_padded = (
-            moe_align_block_size(curr_topk_ids, config['BLOCK_SIZE_M'],
-                                 global_num_experts, expert_map))
-
-        invoke_fused_moe_kernel(qcurr_hidden_states,
-                                w1,
-                                intermediate_cache1,
-                                a1q_scale,
-                                w1_scale,
-                                w1_zp,
-                                curr_topk_weights,
-                                sorted_token_ids,
-                                expert_ids,
-                                num_tokens_post_padded,
-                                apply_router_weight_on_input,
-                                top_k_num,
-                                config,
-                                compute_type=compute_type,
-                                use_fp8_w8a8=use_fp8_w8a8,
-                                use_int8_w8a8=use_int8_w8a8,
-                                use_int8_w8a16=use_int8_w8a16,
-                                use_int4_w4a16=use_int4_w4a16,
-                                per_channel_quant=per_channel_quant,
-                                block_shape=block_shape,
-                                B_bias=w1_bias)
+            block_shape=block_shape,
+        )
+
+        sorted_token_ids, expert_ids, num_tokens_post_padded = moe_align_block_size(
+            curr_topk_ids, config["BLOCK_SIZE_M"], global_num_experts, expert_map
+        )
+
+        invoke_fused_moe_kernel(
+            qcurr_hidden_states,
+            w1,
+            intermediate_cache1,
+            a1q_scale,
+            w1_scale,
+            w1_zp,
+            curr_topk_weights,
+            sorted_token_ids,
+            expert_ids,
+            num_tokens_post_padded,
+            apply_router_weight_on_input,
+            top_k_num,
+            config,
+            compute_type=compute_type,
+            use_fp8_w8a8=use_fp8_w8a8,
+            use_int8_w8a8=use_int8_w8a8,
+            use_int8_w8a16=use_int8_w8a16,
+            use_int4_w4a16=use_int4_w4a16,
+            per_channel_quant=per_channel_quant,
+            block_shape=block_shape,
+            B_bias=w1_bias,
+        )
 
         # Activation function with multiplication
         if activation == "silu":
-            torch.ops._C.silu_and_mul(intermediate_cache2,
-                                      intermediate_cache1.view(-1, N))
+            torch.ops._C.silu_and_mul(
+                intermediate_cache2, intermediate_cache1.view(-1, N)
+            )
         elif activation == "gelu":
-            torch.ops._C.gelu_and_mul(intermediate_cache2,
-                                      intermediate_cache1.view(-1, N))
+            torch.ops._C.gelu_and_mul(
+                intermediate_cache2, intermediate_cache1.view(-1, N)
+            )
         elif activation == "swigluoai":
             # alpha = 1.702, limit = 7.0
-            torch.ops._C.swigluoai_and_mul(intermediate_cache2,
-                                           intermediate_cache1.view(-1, N))
+            torch.ops._C.swigluoai_and_mul(
+                intermediate_cache2, intermediate_cache1.view(-1, N)
+            )
         # Activation function without multiplication
         elif activation == SILU_NO_MUL:
             intermediate_cache2 = F.silu(intermediate_cache1.view(-1, N))
@@ -1673,38 +1851,42 @@ def fused_experts_impl(
             A_scale=a2_scale,
             quant_dtype=quant_dtype,
             per_act_token_quant=per_channel_quant,
-            block_shape=block_shape)
-
-        invoke_fused_moe_kernel(qintermediate_cache2,
-                                w2,
-                                intermediate_cache3,
-                                a2q_scale,
-                                w2_scale,
-                                w2_zp,
-                                curr_topk_weights,
-                                sorted_token_ids,
-                                expert_ids,
-                                num_tokens_post_padded,
-                                not apply_router_weight_on_input,
-                                1,
-                                config,
-                                compute_type=compute_type,
-                                use_fp8_w8a8=use_fp8_w8a8,
-                                use_int8_w8a8=use_int8_w8a8,
-                                use_int8_w8a16=use_int8_w8a16,
-                                use_int4_w4a16=use_int4_w4a16,
-                                per_channel_quant=per_channel_quant,
-                                block_shape=block_shape,
-                                B_bias=w2_bias)
-
-        ops.moe_sum(intermediate_cache3.view(*intermediate_cache3.size()),
-                    out_hidden_states[begin_chunk_idx:end_chunk_idx])
+            block_shape=block_shape,
+        )
+
+        invoke_fused_moe_kernel(
+            qintermediate_cache2,
+            w2,
+            intermediate_cache3,
+            a2q_scale,
+            w2_scale,
+            w2_zp,
+            curr_topk_weights,
+            sorted_token_ids,
+            expert_ids,
+            num_tokens_post_padded,
+            not apply_router_weight_on_input,
+            1,
+            config,
+            compute_type=compute_type,
+            use_fp8_w8a8=use_fp8_w8a8,
+            use_int8_w8a8=use_int8_w8a8,
+            use_int8_w8a16=use_int8_w8a16,
+            use_int4_w4a16=use_int4_w4a16,
+            per_channel_quant=per_channel_quant,
+            block_shape=block_shape,
+            B_bias=w2_bias,
+        )
+
+        ops.moe_sum(
+            intermediate_cache3.view(*intermediate_cache3.size()),
+            out_hidden_states[begin_chunk_idx:end_chunk_idx],
+        )
 
     return out_hidden_states
 
 
 class TritonExperts(mk.FusedMoEPermuteExpertsUnpermute):
-
     def __init__(
         self,
         quant_config: FusedMoEQuantConfig,
@@ -1713,10 +1895,12 @@ def __init__(
 
     @property
     def activation_formats(
-        self
+        self,
     ) -> tuple[mk.FusedMoEActivationFormat, mk.FusedMoEActivationFormat]:
-        return (mk.FusedMoEActivationFormat.Standard,
-                mk.FusedMoEActivationFormat.Standard)
+        return (
+            mk.FusedMoEActivationFormat.Standard,
+            mk.FusedMoEActivationFormat.Standard,
+        )
 
     def supports_chunking(self) -> bool:
         return True
@@ -1764,24 +1948,26 @@ def apply(
     ):
         # Check constraints.
         if self.quant_config.use_int4_w4a16:
-            assert hidden_states.size(-1) // 2 == w1.size(2), (
-                "Hidden size mismatch")
+            assert hidden_states.size(-1) // 2 == w1.size(2), "Hidden size mismatch"
         else:
-            assert hidden_states.size(-1) == w1.size(2), \
-                (f"Hidden size mismatch {hidden_states.size(-1)} "
-                 f"!= {w1.size(2)}")
+            assert hidden_states.size(-1) == w1.size(2), (
+                f"Hidden size mismatch {hidden_states.size(-1)} != {w1.size(2)}"
+            )
 
-        assert hidden_states.is_contiguous(
-        ), "Hidden_states must be contiguous"
+        assert hidden_states.is_contiguous(), "Hidden_states must be contiguous"
         assert hidden_states.dim() == 2
         assert w1.stride(-1) == 1, "Stride of last dimension must be 1"
         assert w2.stride(-1) == 1, "Stride of last dimension must be 1"
         assert hidden_states.dtype in [
-            torch.float32, torch.float16, torch.bfloat16, torch.float8_e4m3fn
+            torch.float32,
+            torch.float16,
+            torch.bfloat16,
+            torch.float8_e4m3fn,
         ]
 
         E, num_tokens, N, K, top_k_num = self.moe_problem_size(
-            hidden_states, w1, w2, topk_ids)
+            hidden_states, w1, w2, topk_ids
+        )
 
         if global_num_experts == -1:
             global_num_experts = E
@@ -1804,20 +1990,18 @@ def apply(
         elif hidden_states.dtype == torch.float8_e4m3fn:
             compute_type = tl.bfloat16
         else:
-            raise ValueError(
-                f"Unsupported compute_type: {hidden_states.dtype}")
+            raise ValueError(f"Unsupported compute_type: {hidden_states.dtype}")
 
         # Note that the output tensor might be in workspace1
-        intermediate_cache1 = _resize_cache(workspace2,
-                                            (num_tokens, top_k_num, N))
-        intermediate_cache2 = _resize_cache(workspace13,
-                                            (num_tokens * top_k_num, N // 2))
-        intermediate_cache3 = _resize_cache(workspace2,
-                                            (num_tokens, top_k_num, K))
+        intermediate_cache1 = _resize_cache(workspace2, (num_tokens, top_k_num, N))
+        intermediate_cache2 = _resize_cache(
+            workspace13, (num_tokens * top_k_num, N // 2)
+        )
+        intermediate_cache3 = _resize_cache(workspace2, (num_tokens, top_k_num, K))
 
-        sorted_token_ids, expert_ids, num_tokens_post_padded = (
-            moe_align_block_size(topk_ids, config['BLOCK_SIZE_M'],
-                                 global_num_experts, expert_map))
+        sorted_token_ids, expert_ids, num_tokens_post_padded = moe_align_block_size(
+            topk_ids, config["BLOCK_SIZE_M"], global_num_experts, expert_map
+        )
 
         invoke_fused_moe_kernel(
             hidden_states,
@@ -1843,14 +2027,19 @@ def apply(
             B_bias=self.w1_bias,
         )
 
-        self.activation(activation, intermediate_cache2,
-                        intermediate_cache1.view(-1, N))
+        self.activation(
+            activation, intermediate_cache2, intermediate_cache1.view(-1, N)
+        )
 
         a2q_scale: Optional[torch.Tensor] = None
 
         qintermediate_cache2, a2q_scale = moe_kernel_quantize_input(
-            intermediate_cache2, a2_scale, self.quant_dtype,
-            self.per_act_token_quant, self.block_shape)
+            intermediate_cache2,
+            a2_scale,
+            self.quant_dtype,
+            self.per_act_token_quant,
+            self.block_shape,
+        )
 
         invoke_fused_moe_kernel(
             qintermediate_cache2,
@@ -1880,7 +2069,8 @@ def apply(
 
 
 def modular_triton_fused_moe(
-        quant_config: FusedMoEQuantConfig) -> mk.FusedMoEModularKernel:
+    quant_config: FusedMoEQuantConfig,
+) -> mk.FusedMoEModularKernel:
     return mk.FusedMoEModularKernel(
         MoEPrepareAndFinalizeNoEP(),
         TritonExperts(quant_config),
diff --git a/vllm/model_executor/layers/fused_moe/gpt_oss_triton_kernels_moe.py b/vllm/model_executor/layers/fused_moe/gpt_oss_triton_kernels_moe.py
index 18de75851934..39faeed5d10f 100644
--- a/vllm/model_executor/layers/fused_moe/gpt_oss_triton_kernels_moe.py
+++ b/vllm/model_executor/layers/fused_moe/gpt_oss_triton_kernels_moe.py
@@ -7,9 +7,12 @@
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe.config import (
-    FUSED_MOE_UNQUANTIZED_CONFIG, FusedMoEQuantConfig)
+    FUSED_MOE_UNQUANTIZED_CONFIG,
+    FusedMoEQuantConfig,
+)
 from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
-    TopKWeightAndReduceNoOP)
+    TopKWeightAndReduceNoOP,
+)
 from vllm.triton_utils import tl, triton
 from vllm.utils import has_triton_kernels
 
@@ -18,24 +21,24 @@
 if has_triton_kernels():
     try:
         import triton_kernels.swiglu
-        from triton_kernels.matmul_ogs import (FnSpecs, FusedActivation,
-                                               matmul_ogs)
-        from triton_kernels.routing import (RoutingData, routing,
-                                            routing_from_bitmatrix)
+        from triton_kernels.matmul_ogs import FnSpecs, FusedActivation, matmul_ogs
+        from triton_kernels.routing import RoutingData, routing, routing_from_bitmatrix
         from triton_kernels.tensor import Bitmatrix
     except (AttributeError, ImportError) as e:
         logger.error(
             "Failed to import Triton kernels. Please make sure your triton "
-            "version is compatible. Error: %s", e)
+            "version is compatible. Error: %s",
+            e,
+        )
 
 
 @triton.jit
 def pack_bitmatrix(
     bitmatrix,
     topk_ids,
-    n_rows,  # n_rows in bitmatrix / topk_ids 
+    n_rows,  # n_rows in bitmatrix / topk_ids
     bm_cols: tl.constexpr,  # n int32_t bitpacks in bitmatrix
-    n_expts_act,  # num_topk 
+    n_expts_act,  # num_topk
     BLOCK_SIZE_M: tl.constexpr,
     BLOCK_SIZE_K: tl.constexpr,
 ):
@@ -60,12 +63,12 @@ def pack_bitmatrix(
         offs = tl.arange(0, BLOCK_SIZE_K // 32) + i * (BLOCK_SIZE_K // 32)
         # All topks that need to go into this column has the correct bit set.
         # Other bits are 0. x is a 2D tensor.
-        x = tl.where(div[:, :, None] == offs[None, None, :],
-                     (one << rem)[:, :, None], 0)
+        x = tl.where(
+            div[:, :, None] == offs[None, None, :], (one << rem)[:, :, None], 0
+        )
         # Reduce x to get a single int32_t bitpack.
         y = tl.reduce_or(x, axis=1)
-        bitmatrix_ptrs = bitmatrix + offsets_m[:,
-                                               None] * bm_cols + offs[None, :]
+        bitmatrix_ptrs = bitmatrix + offsets_m[:, None] * bm_cols + offs[None, :]
         tl.store(bitmatrix_ptrs, y, mask=offsets_m[:, None] < n_rows)
 
 
@@ -82,10 +85,9 @@ def triton_kernel_moe_forward(
     global_num_experts: int = -1,
     expert_map: Optional[torch.Tensor] = None,
 ) -> torch.Tensor:
-
-    routing_data, gather_idx, scatter_idx = routing(gating_output,
-                                                    topk,
-                                                    sm_first=not renormalize)
+    routing_data, gather_idx, scatter_idx = routing(
+        gating_output, topk, sm_first=not renormalize
+    )
 
     return triton_kernel_fused_experts(
         None,
@@ -99,7 +101,8 @@ def triton_kernel_moe_forward(
         quant_config=quant_config,
         apply_router_weight_on_input=apply_router_weight_on_input,
         global_num_experts=global_num_experts,
-        expert_map=expert_map)
+        expert_map=expert_map,
+    )
 
 
 # This is a triton implementation of the fused_experts function
@@ -125,10 +128,8 @@ def triton_kernel_fused_experts(
 
     # type check, uint8 means mxfp4
     assert hidden_states.dtype == torch.bfloat16
-    assert (quant_config.w1_bias is None
-            or quant_config.w1_bias.dtype == torch.float32)
-    assert (quant_config.w2_bias is None
-            or quant_config.w2_bias.dtype == torch.float32)
+    assert quant_config.w1_bias is None or quant_config.w1_bias.dtype == torch.float32
+    assert quant_config.w2_bias is None or quant_config.w2_bias.dtype == torch.float32
 
     # Shape check, only check non-mxfp4
     assert hidden_states.shape[-1] == w1.shape[-2]
@@ -141,7 +142,9 @@ def triton_kernel_fused_experts(
 
     act = FusedActivation(
         FnSpecs("swiglu", triton_kernels.swiglu.swiglu_fn, ("alpha", "limit")),
-        (swiglu_alpha, swiglu_limit), 2)
+        (swiglu_alpha, swiglu_limit),
+        2,
+    )
     gammas = routing_data.gate_scal if routing_data else None
 
     intermediate_cache1 = matmul_ogs(
@@ -152,7 +155,8 @@ def triton_kernel_fused_experts(
         gather_indx=gather_indx,
         precision_config=quant_config.w1_precision,
         gammas=gammas if apply_router_weight_on_input else None,
-        fused_activation=act)
+        fused_activation=act,
+    )
 
     intermediate_cache3 = matmul_ogs(
         intermediate_cache1,
@@ -172,7 +176,6 @@ def make_routing_data(
     topk_weights: torch.Tensor,
     num_local_experts: int,
 ) -> tuple["RoutingData", torch.Tensor, torch.Tensor]:
-
     topk_ids = topk_ids.to(torch.int16)
     topk_weights = topk_weights.to(torch.bfloat16)
 
@@ -182,11 +185,11 @@ def make_routing_data(
     BLOCK_SIZE_K = 32
 
     bm_cols = triton.cdiv(num_local_experts, BLOCK_SIZE_K)  # n_bitpacks
-    bitmatrix = torch.zeros((n_rows, bm_cols),
-                            dtype=torch.uint32,
-                            device=topk_ids.device)
+    bitmatrix = torch.zeros(
+        (n_rows, bm_cols), dtype=torch.uint32, device=topk_ids.device
+    )
 
-    grid = (triton.cdiv(n_rows, BLOCK_SIZE_M), )
+    grid = (triton.cdiv(n_rows, BLOCK_SIZE_M),)
     pack_bitmatrix[grid](
         bitmatrix,
         topk_ids,
@@ -199,21 +202,20 @@ def make_routing_data(
 
     bitmatrix_shape = [n_rows, bm_cols * 32]
     bitmatrix_shape_max = [n_rows, None]
-    bitmatrix = Bitmatrix(bitmatrix,
-                          shape=bitmatrix_shape,
-                          shape_max=bitmatrix_shape_max,
-                          scratchpad=None)
+    bitmatrix = Bitmatrix(
+        bitmatrix, shape=bitmatrix_shape, shape_max=bitmatrix_shape_max, scratchpad=None
+    )
 
     # matmul_ogs expects invalid topk_weights to be -1s
     topk_weights = torch.where(topk_ids == -1, -1.0, topk_weights)
     routing_data, gather_indx, scatter_indx = routing_from_bitmatrix(
-        bitmatrix, topk_weights, topk_ids, num_local_experts, num_topk)
+        bitmatrix, topk_weights, topk_ids, num_local_experts, num_topk
+    )
 
     return routing_data, gather_indx, scatter_indx
 
 
 class BaseOAITritonExperts(mk.FusedMoEPermuteExpertsUnpermute):
-
     def __init__(self, quant_config: FusedMoEQuantConfig):
         super().__init__(quant_config)
 
@@ -234,7 +236,6 @@ def _make_routing_data(
 
 
 class OAITritonExperts(BaseOAITritonExperts):
-
     def __init__(self, quant_config: FusedMoEQuantConfig):
         # TODO (varun) : Enable activation quantization
         assert quant_config.use_mxfp4_w4a16, "Supports only mxfp4_w4a16"
@@ -242,18 +243,27 @@ def __init__(self, quant_config: FusedMoEQuantConfig):
 
     @property
     def activation_formats(
-        self
+        self,
     ) -> tuple[mk.FusedMoEActivationFormat, mk.FusedMoEActivationFormat]:
-        return (mk.FusedMoEActivationFormat.Standard,
-                mk.FusedMoEActivationFormat.Standard)
+        return (
+            mk.FusedMoEActivationFormat.Standard,
+            mk.FusedMoEActivationFormat.Standard,
+        )
 
     def supports_chunking(self) -> bool:
         return True
 
     def workspace_shapes(
-        self, a: torch.Tensor, aq: torch.Tensor, M: int, N: int, K: int,
-        topk: int, global_num_experts: int, local_num_experts: int,
-        expert_tokens_meta: Optional[mk.ExpertTokensMetadata]
+        self,
+        a: torch.Tensor,
+        aq: torch.Tensor,
+        M: int,
+        N: int,
+        K: int,
+        topk: int,
+        global_num_experts: int,
+        local_num_experts: int,
+        expert_tokens_meta: Optional[mk.ExpertTokensMetadata],
     ) -> tuple[tuple[int, ...], tuple[int, ...], tuple[int, ...], torch.dtype]:
         # workspace are allocated inside the kernel
         workspace1 = (M, K)
@@ -287,7 +297,8 @@ def apply(
             global_num_experts = local_num_experts
 
         routing_data, gather_indx, scatter_indx = self._make_routing_data(
-            topk_ids, topk_weights, local_num_experts)
+            topk_ids, topk_weights, local_num_experts
+        )
 
         experts_output = triton_kernel_fused_experts(
             None,
@@ -302,6 +313,7 @@ def apply(
             apply_router_weight_on_input=False,
             global_num_experts=local_num_experts,
             expert_map=None,  # applied already
-            a1q_scale=a1q_scale)
+            a1q_scale=a1q_scale,
+        )
 
         output.copy_(experts_output, non_blocking=True)
diff --git a/vllm/model_executor/layers/fused_moe/layer.py b/vllm/model_executor/layers/fused_moe/layer.py
index 3b5ef78b37b0..ec517b63d529 100644
--- a/vllm/model_executor/layers/fused_moe/layer.py
+++ b/vllm/model_executor/layers/fused_moe/layer.py
@@ -14,58 +14,76 @@
 import vllm.envs as envs
 from vllm.config import get_current_vllm_config
 from vllm.config.parallel import ExpertPlacementStrategy
-from vllm.distributed import (get_dp_group, get_ep_group,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_reduce)
+from vllm.distributed import (
+    get_dp_group,
+    get_ep_group,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_reduce,
+)
 from vllm.distributed.eplb.eplb_state import EplbState
 from vllm.forward_context import ForwardContext, get_forward_context
 from vllm.logger import init_logger
 from vllm.model_executor.custom_op import CustomOp
+
 # yapf: disable
 from vllm.model_executor.layers.fused_moe.config import (
-    FUSED_MOE_UNQUANTIZED_CONFIG, FusedMoEConfig, FusedMoEParallelConfig,
-    FusedMoEQuantConfig, biased_moe_quant_config)
-from vllm.model_executor.layers.fused_moe.fused_moe import (
-    zero_experts_compute_triton)
+    FUSED_MOE_UNQUANTIZED_CONFIG,
+    FusedMoEConfig,
+    FusedMoEParallelConfig,
+    FusedMoEQuantConfig,
+    biased_moe_quant_config,
+)
+from vllm.model_executor.layers.fused_moe.fused_moe import zero_experts_compute_triton
+
 # yapf: enable
 from vllm.model_executor.layers.fused_moe.modular_kernel import (
-    FusedMoEActivationFormat, FusedMoEModularKernel,
-    FusedMoEPermuteExpertsUnpermute, FusedMoEPrepareAndFinalize)
+    FusedMoEActivationFormat,
+    FusedMoEModularKernel,
+    FusedMoEPermuteExpertsUnpermute,
+    FusedMoEPrepareAndFinalize,
+)
 from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-    is_rocm_aiter_moe_enabled)
-from vllm.model_executor.layers.fused_moe.routing_simulator import (
-    RoutingSimulator)
+    is_rocm_aiter_moe_enabled,
+)
+from vllm.model_executor.layers.fused_moe.routing_simulator import RoutingSimulator
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.platforms import current_platform
 from vllm.platforms.interface import CpuArchEnum
-from vllm.utils import (cdiv, direct_register_custom_op, has_deep_ep, has_pplx,
-                        round_up)
+from vllm.utils import cdiv, direct_register_custom_op, has_deep_ep, has_pplx, round_up
 from vllm.utils.flashinfer import has_flashinfer_cutlass_fused_moe
 from vllm.v1.worker.ubatching import dbo_current_ubatch_id
 
 if current_platform.is_cuda_alike():
     from .fused_batched_moe import BatchedTritonExperts
-    from .fused_moe import (TritonExperts, eplb_map_to_physical_and_record,
-                            fused_experts)
+    from .fused_moe import TritonExperts, eplb_map_to_physical_and_record, fused_experts
+
     if has_pplx():
-        from .pplx_prepare_finalize import (PplxPrepareAndFinalize,
-                                            pplx_hidden_dim_scale_bytes)
+        from .pplx_prepare_finalize import (
+            PplxPrepareAndFinalize,
+            pplx_hidden_dim_scale_bytes,
+        )
     if has_deep_ep():
         from .deepep_ht_prepare_finalize import DeepEPHTPrepareAndFinalize
-        from .deepep_ll_prepare_finalize import (DEEPEP_QUANT_BLOCK_SHAPE,
-                                                 DeepEPLLPrepareAndFinalize)
+        from .deepep_ll_prepare_finalize import (
+            DEEPEP_QUANT_BLOCK_SHAPE,
+            DeepEPLLPrepareAndFinalize,
+        )
 else:
     fused_experts = None  # type: ignore
     FusedMoEPermuteExpertsUnpermute = None  # type: ignore
     FusedMoEPrepareAndFinalize = None  # type: ignore
 
     def _eplb_map_to_physical_and_record(
-            topk_ids: torch.Tensor, expert_load_view: torch.Tensor,
-            logical_to_physical_map: torch.Tensor,
-            logical_replica_count: torch.Tensor,
-            indices_type: Optional[torch.dtype]) -> torch.Tensor:
+        topk_ids: torch.Tensor,
+        expert_load_view: torch.Tensor,
+        logical_to_physical_map: torch.Tensor,
+        logical_replica_count: torch.Tensor,
+        indices_type: Optional[torch.dtype],
+    ) -> torch.Tensor:
         # CPU fallback: no EPLB so just return as is
         return topk_ids
 
@@ -73,7 +91,8 @@ def _eplb_map_to_physical_and_record(
 
 if is_rocm_aiter_moe_enabled():
     from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (  # noqa: E501
-        rocm_aiter_grouped_topk as grouped_topk)
+        rocm_aiter_grouped_topk as grouped_topk,
+    )
 else:
     from vllm.model_executor.layers.fused_moe.fused_moe import grouped_topk
 if current_platform.is_tpu():
@@ -92,7 +111,6 @@ class FusedMoeWeightScaleSupported(Enum):
 
 
 class FusedMoEMethodBase(QuantizeMethodBase):
-
     def __init__(self, moe: FusedMoEConfig):
         super().__init__()
         self.moe = moe
@@ -101,9 +119,15 @@ def __init__(self, moe: FusedMoEConfig):
         self.topk_indices_dtype = None
 
     @abstractmethod
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         raise NotImplementedError
 
     def uses_weight_scale_2_pattern(self) -> bool:
@@ -127,8 +151,7 @@ def _maybe_make_prepare_finalize(
         prepare_finalize: Optional[FusedMoEPrepareAndFinalize] = None
 
         # TODO: could allow this now
-        assert not moe.use_flashinfer_cutlass_kernels, \
-            "Must be created in modelopt.py"
+        assert not moe.use_flashinfer_cutlass_kernels, "Must be created in modelopt.py"
 
         if moe.use_pplx_kernels:
             assert quant_config is not None
@@ -155,13 +178,13 @@ def _maybe_make_prepare_finalize(
                 hidden_dim_scale_bytes=hidden_scale_bytes,
             )
 
-            num_dispatchers = (all2all_manager.world_size //
-                               all2all_manager.tp_group.world_size)
+            num_dispatchers = (
+                all2all_manager.world_size // all2all_manager.tp_group.world_size
+            )
 
             # Intranode pplx a2a takes a group name while internode does not.
             if not all2all_manager.internode:
-                all_to_all_args[
-                    "group_name"] = all2all_manager.cpu_group.group_name
+                all_to_all_args["group_name"] = all2all_manager.cpu_group.group_name
 
             handle = all2all_manager.get_handle(all_to_all_args)
 
@@ -180,8 +203,7 @@ def _maybe_make_prepare_finalize(
                 handle,
                 num_dispatchers=all2all_manager.world_size,
                 dp_size=all2all_manager.dp_world_size,
-                rank_expert_offset=all2all_manager.rank *
-                moe.num_local_experts,
+                rank_expert_offset=all2all_manager.rank * moe.num_local_experts,
             )
 
         elif moe.use_deepep_ll_kernels:
@@ -191,15 +213,16 @@ def _maybe_make_prepare_finalize(
                 token_hidden_size=moe.hidden_dim,
                 num_ep_ranks=all2all_manager.world_size,
                 num_global_experts=moe.num_experts,
-                num_local_experts=moe.num_experts //
-                all2all_manager.world_size)
+                num_local_experts=moe.num_experts // all2all_manager.world_size,
+            )
             handle = all2all_manager.get_handle(all_to_all_args)
 
             # Note: We may want to use FP8 dispatch just to reduce
             # data movement.
             use_fp8_dispatch = (
                 quant_config.quant_dtype == current_platform.fp8_dtype()
-                and quant_config.block_shape == DEEPEP_QUANT_BLOCK_SHAPE)
+                and quant_config.block_shape == DEEPEP_QUANT_BLOCK_SHAPE
+            )
 
             prepare_finalize = DeepEPLLPrepareAndFinalize(
                 handle,
@@ -210,11 +233,11 @@ def _maybe_make_prepare_finalize(
 
         return prepare_finalize
 
-    def maybe_make_prepare_finalize(
-            self) -> Optional[FusedMoEPrepareAndFinalize]:
+    def maybe_make_prepare_finalize(self) -> Optional[FusedMoEPrepareAndFinalize]:
         if self.moe.moe_parallel_config.use_all2all_kernels:
             return FusedMoEMethodBase._maybe_make_prepare_finalize(
-                self.moe, self.moe_quant_config)
+                self.moe, self.moe_quant_config
+            )
         else:
             return None
 
@@ -231,11 +254,13 @@ def init_prepare_finalize(self, layer: torch.nn.Module):
         prepare_finalize = self.maybe_make_prepare_finalize()
 
         if prepare_finalize is not None:
-            logger.debug("%s for %s(%s)", prepare_finalize.__class__.__name__,
-                         self, id(self))
+            logger.debug(
+                "%s for %s(%s)", prepare_finalize.__class__.__name__, self, id(self)
+            )
             assert self.topk_indices_dtype is None
-            assert self.fused_experts is None, \
+            assert self.fused_experts is None, (
                 f"Attempt to override experts for {id(self)}!"
+            )
             self.topk_indices_dtype = prepare_finalize.topk_indices_dtype()
             experts = self.select_gemm_impl(prepare_finalize, layer)
             self.fused_experts = FusedMoEModularKernel(
@@ -253,11 +278,13 @@ def select_gemm_impl(
         # gemm implementation
         raise NotImplementedError(
             f"{self.__class__.__name__} must select appropriate gemm "
-            "implementation based on the prepare_finalize")
+            "implementation based on the prepare_finalize"
+        )
 
     @abstractmethod
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         raise NotImplementedError
 
     @abstractmethod
@@ -296,6 +323,7 @@ def __init__(self, moe: FusedMoEConfig):
         self.rocm_aiter_moe_enabled = is_rocm_aiter_moe_enabled()
         if self.rocm_aiter_moe_enabled:
             from .rocm_aiter_fused_moe import rocm_aiter_fused_experts
+
             self.rocm_aiter_fused_experts = rocm_aiter_fused_experts
         else:
             self.rocm_aiter_fused_experts = None  # type: ignore
@@ -306,7 +334,8 @@ def __init__(self, moe: FusedMoEConfig):
             and envs.VLLM_USE_FLASHINFER_MOE_FP16
             and self.moe.moe_parallel_config.use_ep
             and self.moe.moe_parallel_config.dp_size == 1
-            and current_platform.get_device_capability()[0] >= 9)
+            and current_platform.get_device_capability()[0] >= 9
+        )
         if self.flashinfer_cutlass_moe_enabled:
             logger.info_once(
                 "Enabling FlashInfer CUTLASS MoE for UnquantizedFusedMoEMethod"
@@ -314,28 +343,32 @@ def __init__(self, moe: FusedMoEConfig):
             from functools import partial
 
             from .flashinfer_cutlass_moe import flashinfer_cutlass_moe
+
             self.flashinfer_cutlass_moe = partial(
                 flashinfer_cutlass_moe,
                 quant_config=FUSED_MOE_UNQUANTIZED_CONFIG,
                 tp_rank=self.moe.moe_parallel_config.tp_rank,
                 tp_size=self.moe.moe_parallel_config.tp_size,
                 ep_rank=self.moe.moe_parallel_config.ep_rank,
-                ep_size=self.moe.moe_parallel_config.ep_size)
+                ep_size=self.moe.moe_parallel_config.ep_size,
+            )
         else:
-            if (self.moe.moe_parallel_config.use_ep
-                    and self.moe.moe_parallel_config.dp_size == 1):
+            if (
+                self.moe.moe_parallel_config.use_ep
+                and self.moe.moe_parallel_config.dp_size == 1
+            ):
                 logger.info_once(
                     "FlashInfer CUTLASS MoE is available for EP"
                     " but not enabled, consider setting"
-                    " VLLM_USE_FLASHINFER_MOE_FP16=1 to enable it.")
+                    " VLLM_USE_FLASHINFER_MOE_FP16=1 to enable it."
+                )
             elif self.moe.moe_parallel_config.dp_size > 1:
                 logger.info_once(
                     "FlashInfer CUTLASS MoE is currently not available for DP."
                 )
             self.flashinfer_cutlass_moe = None  # type: ignore
 
-    def maybe_make_prepare_finalize(
-            self) -> Optional[FusedMoEPrepareAndFinalize]:
+    def maybe_make_prepare_finalize(self) -> Optional[FusedMoEPrepareAndFinalize]:
         if self.rocm_aiter_moe_enabled:
             return None
         else:
@@ -347,8 +380,10 @@ def select_gemm_impl(
         layer: torch.nn.Module,
     ) -> FusedMoEPermuteExpertsUnpermute:
         assert self.moe_quant_config is not None
-        if (prepare_finalize.activation_format ==
-                FusedMoEActivationFormat.BatchedExperts):
+        if (
+            prepare_finalize.activation_format
+            == FusedMoEActivationFormat.BatchedExperts
+        ):
             logger.debug("BatchedTritonExperts %s", self.moe)
             return BatchedTritonExperts(
                 max_num_tokens=self.moe.max_num_tokens,
@@ -359,49 +394,65 @@ def select_gemm_impl(
             logger.debug("TritonExperts %s", self.moe)
             return TritonExperts(self.moe_quant_config)
 
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         # Fused gate_up_proj (column parallel)
-        w13_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            2 * intermediate_size_per_partition,
-            hidden_size,
-            dtype=params_dtype),
-                                        requires_grad=False)
+        w13_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                2 * intermediate_size_per_partition,
+                hidden_size,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_weight", w13_weight)
         set_weight_attrs(w13_weight, extra_weight_attrs)
         if self.moe.has_bias:
-            w13_bias = torch.nn.Parameter(torch.zeros(
-                num_experts,
-                2 * intermediate_size_per_partition,
-                dtype=params_dtype),
-                                          requires_grad=False)
+            w13_bias = torch.nn.Parameter(
+                torch.zeros(
+                    num_experts, 2 * intermediate_size_per_partition, dtype=params_dtype
+                ),
+                requires_grad=False,
+            )
             layer.register_parameter("w13_bias", w13_bias)
             set_weight_attrs(w13_bias, extra_weight_attrs)
         # down_proj (row parallel)
-        w2_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            hidden_size,
-            intermediate_size_per_partition,
-            dtype=params_dtype),
-                                       requires_grad=False)
+        w2_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                hidden_size,
+                intermediate_size_per_partition,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_weight", w2_weight)
         set_weight_attrs(w2_weight, extra_weight_attrs)
         if self.moe.has_bias:
-            w2_bias = torch.nn.Parameter(torch.zeros(num_experts,
-                                                     hidden_size,
-                                                     dtype=params_dtype),
-                                         requires_grad=False)
+            w2_bias = torch.nn.Parameter(
+                torch.zeros(num_experts, hidden_size, dtype=params_dtype),
+                requires_grad=False,
+            )
             layer.register_parameter("w2_bias", w2_bias)
             set_weight_attrs(w2_bias, extra_weight_attrs)
 
     def _maybe_pad_weight(self, weight: torch.Tensor) -> torch.Tensor:
         # Pad the weight tensor. This is an optimization on ROCm platform, which
         # can benefit from tensors located far enough from one another in memory
-        if (envs.VLLM_ROCM_MOE_PADDING and current_platform.is_rocm()
-                and weight.stride(-1) == 1
-                and (weight.stride(-2) * weight.element_size()) % 512 == 0):
+        if (
+            envs.VLLM_ROCM_MOE_PADDING
+            and current_platform.is_rocm()
+            and weight.stride(-1) == 1
+            and (weight.stride(-2) * weight.element_size()) % 512 == 0
+        ):
             num_pad = 256 // weight.element_size()
             weight = F.pad(weight, (0, num_pad), "constant", 0)[..., :-num_pad]
             torch.cuda.empty_cache()
@@ -416,11 +467,13 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         layer.w2_weight.data = self._maybe_pad_weight(layer.w2_weight.data)
         # Lazy import to avoid importing triton.
         from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-            shuffle_weights)
+            shuffle_weights,
+        )
 
         if self.rocm_aiter_moe_enabled:
             shuffled_w13, shuffled_w2 = shuffle_weights(
-                layer.w13_weight.data, layer.w2_weight.data)
+                layer.w13_weight.data, layer.w2_weight.data
+            )
 
             layer.w13_weight.data = shuffled_w13
             layer.w2_weight.data = shuffled_w2
@@ -433,6 +486,7 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
 
         if current_platform.is_xpu():
             import intel_extension_for_pytorch as ipex
+
             layer.ipex_fusion = ipex.llm.modules.GatedMLPMOE(
                 layer.w13_weight,
                 layer.w2_weight,
@@ -440,23 +494,28 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             )
         elif current_platform.is_cpu():
             from vllm.model_executor.layers.fused_moe import cpu_fused_moe
+
             if current_platform.get_cpu_architecture() == CpuArchEnum.X86:
-                from vllm.model_executor.layers.utils import (
-                    check_cpu_sgl_kernel)
+                from vllm.model_executor.layers.utils import check_cpu_sgl_kernel
+
                 dtype_w13 = layer.w13_weight.dtype
                 _, n_w13, k_w13 = layer.w13_weight.size()
                 dtype_w2 = layer.w2_weight.dtype
                 _, n_w2, k_w2 = layer.w2_weight.size()
-                if (envs.VLLM_CPU_SGL_KERNEL
-                        and check_cpu_sgl_kernel(n_w13, k_w13, dtype_w13)
-                        and check_cpu_sgl_kernel(n_w2, k_w2, dtype_w2)):
+                if (
+                    envs.VLLM_CPU_SGL_KERNEL
+                    and check_cpu_sgl_kernel(n_w13, k_w13, dtype_w13)
+                    and check_cpu_sgl_kernel(n_w2, k_w2, dtype_w2)
+                ):
                     packed_w13_weight = torch.ops._C.convert_weight_packed(
-                        layer.w13_weight)
+                        layer.w13_weight
+                    )
                     assert packed_w13_weight.size() == layer.w13_weight.size()
                     layer.w13_weight.copy_(packed_w13_weight)
                     del packed_w13_weight
                     packed_w2_weight = torch.ops._C.convert_weight_packed(
-                        layer.w2_weight)
+                        layer.w2_weight
+                    )
                     assert packed_w2_weight.size() == layer.w2_weight.size()
                     layer.w2_weight.copy_(packed_w2_weight)
                     layer.cpu_fused_moe = cpu_fused_moe.SGLFusedMOE(layer)
@@ -518,7 +577,8 @@ def apply(
         )
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         if self.moe.has_bias:
             return biased_moe_quant_config(
                 layer.w13_bias,
@@ -550,9 +610,8 @@ def forward_cuda(
         logical_to_physical_map: Optional[torch.Tensor] = None,
         logical_replica_count: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, tuple[torch.Tensor, torch.Tensor]]:
-
-        zero_expert_num = getattr(layer, 'zero_expert_num', 0)
-        zero_expert_type = getattr(layer, 'zero_expert_type', None)
+        zero_expert_num = getattr(layer, "zero_expert_num", 0)
+        zero_expert_type = getattr(layer, "zero_expert_type", None)
 
         topk_weights, topk_ids, zero_expert_result = FusedMoE.select_experts(
             hidden_states=x,
@@ -574,7 +633,8 @@ def forward_cuda(
             logical_replica_count=logical_replica_count,
             global_num_experts=global_num_experts,
             zero_expert_num=zero_expert_num,
-            zero_expert_type=zero_expert_type)
+            zero_expert_type=zero_expert_type,
+        )
 
         if self.rocm_aiter_moe_enabled:
             assert self.fused_experts is None
@@ -586,7 +646,8 @@ def forward_cuda(
                 topk_ids=topk_ids,
                 expert_map=expert_map,
                 activation=activation,
-                apply_router_weight_on_input=apply_router_weight_on_input)
+                apply_router_weight_on_input=apply_router_weight_on_input,
+            )
         elif self.flashinfer_cutlass_moe_enabled:
             return self.flashinfer_cutlass_moe(
                 hidden_states=x,
@@ -595,11 +656,11 @@ def forward_cuda(
                 topk_weights=topk_weights,
                 topk_ids=topk_ids,
                 activation=activation,
-                apply_router_weight_on_input=apply_router_weight_on_input)
+                apply_router_weight_on_input=apply_router_weight_on_input,
+            )
         elif self.fused_experts is not None:
             if self.moe.has_bias:
-                raise ValueError(
-                    "FusedMoEModularKernel does not support bias.")
+                raise ValueError("FusedMoEModularKernel does not support bias.")
             result = self.fused_experts(
                 hidden_states=x,
                 w1=layer.w13_weight,
@@ -629,8 +690,9 @@ def forward_cuda(
             )
 
         if zero_expert_num != 0 and zero_expert_type is not None:
-            assert not isinstance(result, tuple), \
+            assert not isinstance(result, tuple), (
                 "Shared + zero experts are mutually exclusive not yet supported"
+            )
             return result, zero_expert_result
         else:
             return result
@@ -658,11 +720,13 @@ def forward_cpu(
         logical_to_physical_map: Optional[torch.Tensor] = None,
         logical_replica_count: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, tuple[torch.Tensor, torch.Tensor]]:
-        if enable_eplb is not False or expert_load_view is not None or \
-                logical_to_physical_map is not None or \
-                logical_replica_count is not None:
-            raise NotImplementedError("Expert load balancing is not supported "
-                                      "for CPU.")
+        if (
+            enable_eplb is not False
+            or expert_load_view is not None
+            or logical_to_physical_map is not None
+            or logical_replica_count is not None
+        ):
+            raise NotImplementedError("Expert load balancing is not supported for CPU.")
         return layer.cpu_fused_moe(
             layer,
             x,
@@ -705,11 +769,13 @@ def forward_xpu(
         logical_to_physical_map: Optional[torch.Tensor] = None,
         logical_replica_count: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, tuple[torch.Tensor, torch.Tensor]]:
-        if enable_eplb is not False or expert_load_view is not None or \
-                logical_to_physical_map is not None or \
-                logical_replica_count is not None:
-            raise NotImplementedError("Expert load balancing is not supported "
-                                      "for XPU.")
+        if (
+            enable_eplb is not False
+            or expert_load_view is not None
+            or logical_to_physical_map is not None
+            or logical_replica_count is not None
+        ):
+            raise NotImplementedError("Expert load balancing is not supported for XPU.")
         assert custom_routing_function is None
         return layer.ipex_fusion(
             x,
@@ -751,27 +817,33 @@ def forward_tpu(
         assert apply_router_weight_on_input is False
         if scoring_func != "softmax":
             raise NotImplementedError(
-                "Only softmax scoring function is supported for TPU.")
+                "Only softmax scoring function is supported for TPU."
+            )
         if e_score_correction_bias is not None:
             raise NotImplementedError(
-                "Expert score correction bias is not supported for TPU.")
+                "Expert score correction bias is not supported for TPU."
+            )
         assert activation == "silu", f"{activation} is not supported for TPU."
-        assert routed_scaling_factor == 1.0, \
-            f"routed_scaling_factor {routed_scaling_factor} is not supported " \
-            f"for TPU."
-        if enable_eplb is not False or expert_load_view is not None or \
-                logical_to_physical_map is not None or \
-                logical_replica_count is not None:
-            raise NotImplementedError("Expert load balancing is not supported "
-                                      "for TPU.")
-        return fused_moe_pallas(hidden_states=x,
-                                w1=layer.w13_weight,
-                                w2=layer.w2_weight,
-                                topk=top_k,
-                                gating_output=router_logits,
-                                global_num_experts=global_num_experts,
-                                expert_map=expert_map,
-                                renormalize=renormalize)
+        assert routed_scaling_factor == 1.0, (
+            f"routed_scaling_factor {routed_scaling_factor} is not supported for TPU."
+        )
+        if (
+            enable_eplb is not False
+            or expert_load_view is not None
+            or logical_to_physical_map is not None
+            or logical_replica_count is not None
+        ):
+            raise NotImplementedError("Expert load balancing is not supported for TPU.")
+        return fused_moe_pallas(
+            hidden_states=x,
+            w1=layer.w13_weight,
+            w2=layer.w2_weight,
+            topk=top_k,
+            gating_output=router_logits,
+            global_num_experts=global_num_experts,
+            expert_map=expert_map,
+            renormalize=renormalize,
+        )
 
     if current_platform.is_tpu():
         forward_native = forward_tpu
@@ -790,27 +862,27 @@ def determine_expert_map(
     expert_placement_strategy: ExpertPlacementStrategy = "linear",
 ) -> tuple[int, Optional[torch.Tensor]]:
     """
-        Calculates how many experts should be assigned to each rank for EP and
-        creates a mapping from global to local expert index. Experts are
-        distributed evenly across ranks. Any remaining are assigned to the
-        last rank.
-
-        Args:
-            ep_size: The size of the expert parallel group
-            ep_rank: The rank of the current process in the expert parallel
-                group
-            global_num_experts: The total number of experts in the model.
-            expert_placement_strategy: The expert placement strategy.
+    Calculates how many experts should be assigned to each rank for EP and
+    creates a mapping from global to local expert index. Experts are
+    distributed evenly across ranks. Any remaining are assigned to the
+    last rank.
 
-        Returns:
-            tuple[int, Optional[torch.Tensor]]: A tuple containing:
-                - local_num_experts (int): The number of experts assigned
-                    to the current rank.
-                - expert_map (Optional[torch.Tensor]): A tensor of shape
-                    (global_num_experts,) mapping from global to local index.
-                    Contains -1 for experts not assigned to the current rank.
-                    Returns None if ep_size is 1.
-        """
+    Args:
+        ep_size: The size of the expert parallel group
+        ep_rank: The rank of the current process in the expert parallel
+            group
+        global_num_experts: The total number of experts in the model.
+        expert_placement_strategy: The expert placement strategy.
+
+    Returns:
+        tuple[int, Optional[torch.Tensor]]: A tuple containing:
+            - local_num_experts (int): The number of experts assigned
+                to the current rank.
+            - expert_map (Optional[torch.Tensor]): A tensor of shape
+                (global_num_experts,) mapping from global to local index.
+                Contains -1 for experts not assigned to the current rank.
+                Returns None if ep_size is 1.
+    """
     assert ep_size > 0
     if ep_size == 1:
         return (global_num_experts, None)
@@ -824,56 +896,61 @@ def determine_expert_map(
         local_num_experts = base_experts
 
     # Create a tensor of size num_experts filled with -1
-    expert_map = torch.full((global_num_experts, ), -1, dtype=torch.int32)
+    expert_map = torch.full((global_num_experts,), -1, dtype=torch.int32)
     # Create an expert map for the local experts
     if expert_placement_strategy == "linear":
         start_idx = ep_rank * base_experts + min(ep_rank, remainder)
-        expert_map[start_idx:start_idx + local_num_experts] = torch.arange(
-            0, local_num_experts, dtype=torch.int32)
+        expert_map[start_idx : start_idx + local_num_experts] = torch.arange(
+            0, local_num_experts, dtype=torch.int32
+        )
     elif expert_placement_strategy == "round_robin":
-        local_log_experts = torch.arange(ep_rank,
-                                         global_num_experts,
-                                         ep_size,
-                                         dtype=torch.int32)
-
-        expert_map[local_log_experts] = torch.arange(0,
-                                                     local_num_experts,
-                                                     dtype=torch.int32)
+        local_log_experts = torch.arange(
+            ep_rank, global_num_experts, ep_size, dtype=torch.int32
+        )
+
+        expert_map[local_log_experts] = torch.arange(
+            0, local_num_experts, dtype=torch.int32
+        )
     else:
-        raise ValueError("Unsupported expert placement strategy "
-                         f"'{expert_placement_strategy}', expected one of "
-                         f"{get_args(ExpertPlacementStrategy)}")
+        raise ValueError(
+            "Unsupported expert placement strategy "
+            f"'{expert_placement_strategy}', expected one of "
+            f"{get_args(ExpertPlacementStrategy)}"
+        )
     return (local_num_experts, expert_map)
 
 
 def get_compressed_expert_map(expert_map: torch.Tensor) -> str:
     """
-        Compresses the expert map by removing any -1 entries.
+    Compresses the expert map by removing any -1 entries.
 
-        Args:
-            expert_map (torch.Tensor): A tensor of shape (global_num_experts,)
-                mapping from global to local index. Contains -1 for experts not
-                assigned to the current rank.
+    Args:
+        expert_map (torch.Tensor): A tensor of shape (global_num_experts,)
+            mapping from global to local index. Contains -1 for experts not
+            assigned to the current rank.
 
-        Returns:
-            str: A string mapping from local to global index.
-                Using str to support hashing for logging once only.
-        """
+    Returns:
+        str: A string mapping from local to global index.
+            Using str to support hashing for logging once only.
+    """
     global_indices = torch.where(expert_map != -1)[0]
     local_indices = expert_map[global_indices]
     return ", ".join(
         f"{local_index.item()}->{global_index.item()}"
-        for local_index, global_index in zip(local_indices, global_indices))
+        for local_index, global_index in zip(local_indices, global_indices)
+    )
 
 
 def maybe_roundup_hidden_size(
-        hidden_size: int, act_dtype: torch.dtype,
-        quant_config: Optional[QuantizationConfig],
-        moe_parallel_config: FusedMoEParallelConfig) -> int:
+    hidden_size: int,
+    act_dtype: torch.dtype,
+    quant_config: Optional[QuantizationConfig],
+    moe_parallel_config: FusedMoEParallelConfig,
+) -> int:
     """
     Given layer hidden size and MoE configurations, round up hidden_size
     if necessary.
-    
+
     Args:
         hidden_size: Layer hidden-size
         act_dtype: Data type of the layer activations.
@@ -885,24 +962,29 @@ def maybe_roundup_hidden_size(
         Original hidden size otherwise.
     """
 
-    if (moe_parallel_config.use_deepep_ht_kernels):
-        hidden_size = (
-            DeepEPHTPrepareAndFinalize.maybe_roundup_layer_hidden_size(
-                hidden_size, act_dtype))
+    if moe_parallel_config.use_deepep_ht_kernels:
+        hidden_size = DeepEPHTPrepareAndFinalize.maybe_roundup_layer_hidden_size(
+            hidden_size, act_dtype
+        )
 
     # we are padding globally so EP buffer allocation works
     if quant_config and quant_config.get_name() == "mxfp4":
-
         from vllm.model_executor.layers.quantization.mxfp4 import (
-            Mxfp4Backend, get_mxfp4_backend)
+            Mxfp4Backend,
+            get_mxfp4_backend,
+        )
+
         current_mxfp4_backend = get_mxfp4_backend()
-        if (current_mxfp4_backend == Mxfp4Backend.SM90_FI_MXFP4_BF16
-                or current_mxfp4_backend
-                == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_CUTLASS):
+        if (
+            current_mxfp4_backend == Mxfp4Backend.SM90_FI_MXFP4_BF16
+            or current_mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_CUTLASS
+        ):
             hidden_size = round_up(hidden_size, 128)
-        elif (current_platform.is_rocm() or current_mxfp4_backend
-              == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_TRTLLM
-              or current_mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_BF16):
+        elif (
+            current_platform.is_rocm()
+            or current_mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_TRTLLM
+            or current_mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_BF16
+        ):
             hidden_size = round_up(hidden_size, 256)
 
     return hidden_size
@@ -979,19 +1061,19 @@ def __init__(
             # since model_config is not set in the pytest test.
             moe_in_dtype = params_dtype
 
-        tp_size_ = (tp_size if tp_size is not None else
-                    get_tensor_model_parallel_world_size())
-        dp_size_ = (dp_size
-                    if dp_size is not None else get_dp_group().world_size)
+        tp_size_ = (
+            tp_size if tp_size is not None else get_tensor_model_parallel_world_size()
+        )
+        dp_size_ = dp_size if dp_size is not None else get_dp_group().world_size
 
         self.is_sequence_parallel = is_sequence_parallel
         self.sp_size = tp_size_ if is_sequence_parallel else 1
 
-        self.moe_parallel_config: FusedMoEParallelConfig = (
-            FusedMoEParallelConfig.make(
-                tp_size_=tp_size_,
-                dp_size_=dp_size_,
-                vllm_parallel_config=vllm_config.parallel_config))
+        self.moe_parallel_config: FusedMoEParallelConfig = FusedMoEParallelConfig.make(
+            tp_size_=tp_size_,
+            dp_size_=dp_size_,
+            vllm_parallel_config=vllm_config.parallel_config,
+        )
 
         self.global_num_experts = num_experts + num_redundant_experts
         self.zero_expert_num = zero_expert_num
@@ -1001,9 +1083,9 @@ def __init__(
         self.expert_mapping = expert_mapping
 
         # Round up hidden size if needed.
-        hidden_size = maybe_roundup_hidden_size(hidden_size, moe_in_dtype,
-                                                quant_config,
-                                                self.moe_parallel_config)
+        hidden_size = maybe_roundup_hidden_size(
+            hidden_size, moe_in_dtype, quant_config, self.moe_parallel_config
+        )
 
         # For smuggling this layer into the fused moe custom op
         compilation_config = vllm_config.compilation_config
@@ -1020,28 +1102,33 @@ def __init__(
         # Determine expert maps
         if self.use_ep:
             if self.enable_eplb:
-                assert self.global_num_experts % self.ep_size == 0, \
-                    "EPLB currently only supports even distribution of " \
+                assert self.global_num_experts % self.ep_size == 0, (
+                    "EPLB currently only supports even distribution of "
                     "experts across ranks."
+                )
             else:
-                assert num_redundant_experts == 0, \
+                assert num_redundant_experts == 0, (
                     "Redundant experts are only supported with EPLB."
+                )
 
             expert_placement_strategy = (
-                vllm_config.parallel_config.expert_placement_strategy)
+                vllm_config.parallel_config.expert_placement_strategy
+            )
             if expert_placement_strategy == "round_robin":
                 # TODO(Bruce): will support round robin expert placement with
                 # EPLB enabled in the future.
-                round_robin_supported = ((num_expert_group is not None
-                                          and num_expert_group > 1)
-                                         and num_redundant_experts == 0
-                                         and not self.enable_eplb)
+                round_robin_supported = (
+                    (num_expert_group is not None and num_expert_group > 1)
+                    and num_redundant_experts == 0
+                    and not self.enable_eplb
+                )
 
                 if not round_robin_supported:
                     logger.warning(
                         "Round-robin expert placement is only supported for "
                         "models with multiple expert groups and no redundant "
-                        "experts. Falling back to linear expert placement.")
+                        "experts. Falling back to linear expert placement."
+                    )
                     expert_placement_strategy = "linear"
 
             self.expert_map: Optional[torch.Tensor]
@@ -1057,12 +1144,16 @@ def __init__(
                 "[EP Rank %s/%s] Expert parallelism is enabled. Expert "
                 "placement strategy: %s. Local/global"
                 " number of experts: %s/%s. Experts local to global index map:"
-                " %s.", self.ep_rank, self.ep_size, expert_placement_strategy,
-                self.local_num_experts, self.global_num_experts,
-                get_compressed_expert_map(self.expert_map))
+                " %s.",
+                self.ep_rank,
+                self.ep_size,
+                expert_placement_strategy,
+                self.local_num_experts,
+                self.global_num_experts,
+                get_compressed_expert_map(self.expert_map),
+            )
         else:
-            self.local_num_experts, self.expert_map = (self.global_num_experts,
-                                                       None)
+            self.local_num_experts, self.expert_map = (self.global_num_experts, None)
 
         self.top_k = top_k
 
@@ -1084,8 +1175,9 @@ def __init__(
         self.activation = activation
 
         if self.scoring_func != "softmax" and not self.use_grouped_topk:
-            raise ValueError("Only softmax scoring function is supported for "
-                             "non-grouped topk.")
+            raise ValueError(
+                "Only softmax scoring function is supported for non-grouped topk."
+            )
 
         moe = FusedMoEConfig(
             num_experts=self.global_num_experts,
@@ -1104,18 +1196,20 @@ def __init__(
         # Note: get_quant_method will look at the layer's local_num_experts
         # for heuristic purposes, so it must be initialized first.
         quant_method: Optional[QuantizeMethodBase] = None
-        quant_method = (UnquantizedFusedMoEMethod(moe) if quant_config is None
-                        else quant_config.get_quant_method(self, prefix))
+        quant_method = (
+            UnquantizedFusedMoEMethod(moe)
+            if quant_config is None
+            else quant_config.get_quant_method(self, prefix)
+        )
 
         assert quant_method is not None
         assert isinstance(quant_method, FusedMoEMethodBase)
         self.quant_method = quant_method
 
         if self.enable_eplb:
-            from vllm.model_executor.layers.quantization.fp8 import (
-                Fp8MoEMethod)
-            if not isinstance(quant_method,
-                              (Fp8MoEMethod, UnquantizedFusedMoEMethod)):
+            from vllm.model_executor.layers.quantization.fp8 import Fp8MoEMethod
+
+            if not isinstance(quant_method, (Fp8MoEMethod, UnquantizedFusedMoEMethod)):
                 # TODO: Add support for additional quantization methods.
                 # The implementation for other quantization methods does not
                 # contain essential differences, but the current quant API
@@ -1123,22 +1217,23 @@ def __init__(
                 # quantization methods, so I'm leaving it for now.
                 # If you plan to add support for more quantization methods,
                 # please refer to the implementation in `Fp8MoEMethod`.
-                raise NotImplementedError("EPLB is only supported for FP8 "
-                                          "quantization for now.")
+                raise NotImplementedError(
+                    "EPLB is only supported for FP8 quantization for now."
+                )
 
         moe_quant_params = {
             "num_experts": self.local_num_experts,
             "hidden_size": hidden_size,
-            "intermediate_size_per_partition":
-            self.intermediate_size_per_partition,
+            "intermediate_size_per_partition": self.intermediate_size_per_partition,
             "params_dtype": params_dtype,
             "weight_loader": self.weight_loader,
         }
         # need full intermediate size pre-sharding for WNA16 act order
-        if (self.quant_method.__class__.__name__
-                in ("GPTQMarlinMoEMethod",
-                    "CompressedTensorsWNA16MarlinMoEMethod",
-                    "CompressedTensorsWNA16MoEMethod")):
+        if self.quant_method.__class__.__name__ in (
+            "GPTQMarlinMoEMethod",
+            "CompressedTensorsWNA16MarlinMoEMethod",
+            "CompressedTensorsWNA16MoEMethod",
+        ):
             moe_quant_params["intermediate_size_full"] = intermediate_size
 
         self.quant_method.create_weights(layer=self, **moe_quant_params)
@@ -1149,31 +1244,37 @@ def __init__(
 
         # TODO(bnell): flashinfer uses non-batched format.
         # Does it really need a batched buffer?
-        if (self.moe_parallel_config.use_pplx_kernels
-                or self.moe_parallel_config.use_deepep_ll_kernels
-                or self.moe_config.use_flashinfer_cutlass_kernels):
+        if (
+            self.moe_parallel_config.use_pplx_kernels
+            or self.moe_parallel_config.use_deepep_ll_kernels
+            or self.moe_config.use_flashinfer_cutlass_kernels
+        ):
             if vllm_config.parallel_config.enable_dbo:
                 self.batched_hidden_states = torch.zeros(
                     (2, moe.max_num_tokens, self.hidden_size),
                     dtype=moe.in_dtype,
-                    device=torch.cuda.current_device())
+                    device=torch.cuda.current_device(),
+                )
 
                 # Note here we use `num_experts` which is logical expert count
                 self.batched_router_logits = torch.zeros(
                     (2, moe.max_num_tokens, num_experts),
                     dtype=moe.in_dtype,
-                    device=torch.cuda.current_device())
+                    device=torch.cuda.current_device(),
+                )
             else:
                 self.batched_hidden_states = torch.zeros(
                     (moe.max_num_tokens, self.hidden_size),
                     dtype=moe.in_dtype,
-                    device=torch.cuda.current_device())
+                    device=torch.cuda.current_device(),
+                )
 
                 # Note here we use `num_experts` which is logical expert count
                 self.batched_router_logits = torch.zeros(
                     (moe.max_num_tokens, num_experts),
                     dtype=moe.in_dtype,
-                    device=torch.cuda.current_device())
+                    device=torch.cuda.current_device(),
+                )
 
     @property
     def shared_experts(self) -> Optional[torch.nn.Module]:
@@ -1221,9 +1322,11 @@ def use_deepep_ll_kernels(self):
 
     @property
     def use_flashinfer_cutlass_kernels(self):
-        return (self.moe_quant_config is not None
-                and self.moe_quant_config.quant_dtype == "nvfp4"
-                and self.moe_config.use_flashinfer_cutlass_kernels)
+        return (
+            self.moe_quant_config is not None
+            and self.moe_quant_config.quant_dtype == "nvfp4"
+            and self.moe_config.use_flashinfer_cutlass_kernels
+        )
 
     def update_expert_map(self):
         # ep_size and ep_rank should already be updated
@@ -1232,14 +1335,18 @@ def update_expert_map(self):
             local_num_experts, expert_map = determine_expert_map(
                 ep_size=self.ep_size,
                 ep_rank=self.ep_rank,
-                global_num_experts=self.global_num_experts)
+                global_num_experts=self.global_num_experts,
+            )
             self.local_num_experts = local_num_experts
             self.register_buffer("expert_map", expert_map)
 
-    def _load_per_tensor_weight_scale(self, shard_id: str,
-                                      param: torch.nn.Parameter,
-                                      loaded_weight: torch.Tensor,
-                                      expert_id: int):
+    def _load_per_tensor_weight_scale(
+        self,
+        shard_id: str,
+        param: torch.nn.Parameter,
+        loaded_weight: torch.Tensor,
+        expert_id: int,
+    ):
         param_data = param.data
         # for per tensor weight quantization
         if shard_id in ("w1", "w3"):
@@ -1251,25 +1358,32 @@ def _load_per_tensor_weight_scale(self, shard_id: str,
         elif shard_id == "w2":
             param_data[expert_id] = loaded_weight
 
-    def _load_combined_w13_weight_scale(self, shard_dim: int,
-                                        loaded_weight: torch.Tensor,
-                                        param: torch.Tensor, tp_rank: int):
+    def _load_combined_w13_weight_scale(
+        self,
+        shard_dim: int,
+        loaded_weight: torch.Tensor,
+        param: torch.Tensor,
+        tp_rank: int,
+    ):
         """
         Load w13 weight scales assuming that w1 weight scales and w3 weight
         scales are stored in the same loaded_weight tensor.
         """
         shard_size = param.shape[shard_dim]
-        loaded_weight = loaded_weight.narrow(shard_dim, shard_size * tp_rank,
-                                             shard_size)
+        loaded_weight = loaded_weight.narrow(
+            shard_dim, shard_size * tp_rank, shard_size
+        )
         param.copy_(loaded_weight)
 
-    def _load_model_weight_or_group_weight_scale(self,
-                                                 shard_dim: int,
-                                                 expert_data: torch.Tensor,
-                                                 shard_id: str,
-                                                 loaded_weight: torch.Tensor,
-                                                 tp_rank: int,
-                                                 load_full_w2: bool = False):
+    def _load_model_weight_or_group_weight_scale(
+        self,
+        shard_dim: int,
+        expert_data: torch.Tensor,
+        shard_id: str,
+        loaded_weight: torch.Tensor,
+        tp_rank: int,
+        load_full_w2: bool = False,
+    ):
         """
         Load grouped weight scales for group quantization or model weights
             :param shard_dim: dimension to shard
@@ -1282,47 +1396,58 @@ def _load_model_weight_or_group_weight_scale(self,
         if shard_id == "w2":
             # In the case where we have actorder/g_idx, we do not partition the
             # w2 scales, as indicated by `load_full` argument, for all tp cases
-            self._load_w2(shard_dim=shard_dim,
-                          loaded_weight=loaded_weight,
-                          expert_data=expert_data,
-                          tp_rank=tp_rank,
-                          load_full=load_full_w2)
+            self._load_w2(
+                shard_dim=shard_dim,
+                loaded_weight=loaded_weight,
+                expert_data=expert_data,
+                tp_rank=tp_rank,
+                load_full=load_full_w2,
+            )
         elif shard_id in ("w1", "w3"):
-            self._load_w13(shard_id=shard_id,
-                           shard_dim=shard_dim,
-                           loaded_weight=loaded_weight,
-                           expert_data=expert_data,
-                           tp_rank=tp_rank)
-
-    def _load_per_channel_weight_scale(self, expert_data: torch.Tensor,
-                                       shard_dim: int, shard_id: str,
-                                       loaded_weight: torch.Tensor,
-                                       tp_rank: int):
+            self._load_w13(
+                shard_id=shard_id,
+                shard_dim=shard_dim,
+                loaded_weight=loaded_weight,
+                expert_data=expert_data,
+                tp_rank=tp_rank,
+            )
+
+    def _load_per_channel_weight_scale(
+        self,
+        expert_data: torch.Tensor,
+        shard_dim: int,
+        shard_id: str,
+        loaded_weight: torch.Tensor,
+        tp_rank: int,
+    ):
         # for per channel weight quantization
         if shard_id == "w2":
             expert_data.copy_(loaded_weight)
         elif shard_id in ("w1", "w3"):
-            self._load_w13(shard_id=shard_id,
-                           shard_dim=shard_dim,
-                           loaded_weight=loaded_weight,
-                           expert_data=expert_data,
-                           tp_rank=tp_rank)
-
-    def _load_w13(self,
-                  expert_data: torch.Tensor,
-                  shard_dim: int,
-                  shard_id: str,
-                  loaded_weight: torch.Tensor,
-                  tp_rank: int,
-                  load_full: bool = False):
+            self._load_w13(
+                shard_id=shard_id,
+                shard_dim=shard_dim,
+                loaded_weight=loaded_weight,
+                expert_data=expert_data,
+                tp_rank=tp_rank,
+            )
 
+    def _load_w13(
+        self,
+        expert_data: torch.Tensor,
+        shard_dim: int,
+        shard_id: str,
+        loaded_weight: torch.Tensor,
+        tp_rank: int,
+        load_full: bool = False,
+    ):
         # Index the loaded weight for tp sharding.
         # gate_up_proj: "MergedColumnParallel", so tp sharding on output_dim
         shard_size = expert_data.shape[shard_dim] // 2
         if not load_full:
-            loaded_weight = loaded_weight.narrow(shard_dim,
-                                                 shard_size * tp_rank,
-                                                 shard_size)
+            loaded_weight = loaded_weight.narrow(
+                shard_dim, shard_size * tp_rank, shard_size
+            )
         # Narrow parameter and load.
         # w1, gate_proj: Load into first logical weight of w13.
         if shard_id == "w1":
@@ -1333,39 +1458,48 @@ def _load_w13(self,
             expert_data = expert_data.narrow(shard_dim, shard_size, shard_size)
         expert_data.copy_(loaded_weight)
 
-    def _load_w2(self,
-                 expert_data: torch.Tensor,
-                 shard_dim: int,
-                 loaded_weight: torch.Tensor,
-                 tp_rank: int,
-                 load_full: bool = False):
-
+    def _load_w2(
+        self,
+        expert_data: torch.Tensor,
+        shard_dim: int,
+        loaded_weight: torch.Tensor,
+        tp_rank: int,
+        load_full: bool = False,
+    ):
         # Index the loaded weight for tp sharding.
         # down_proj: "RowParallel" so tp sharding on input_dim
         # Narrow parameter and load.
         shard_size = expert_data.shape[shard_dim]
         if not load_full:
-            loaded_weight = loaded_weight.narrow(shard_dim,
-                                                 shard_size * tp_rank,
-                                                 shard_size)
+            loaded_weight = loaded_weight.narrow(
+                shard_dim, shard_size * tp_rank, shard_size
+            )
         # w2, down_proj: Load into only logical weight of w2.
         expert_data.copy_(loaded_weight)
 
-    def _load_single_value(self, param: torch.nn.Parameter,
-                           loaded_weight: torch.Tensor, expert_id: int):
+    def _load_single_value(
+        self, param: torch.nn.Parameter, loaded_weight: torch.Tensor, expert_id: int
+    ):
         param_data = param.data
 
         # Input scales can be loaded directly and should be equal.
         param_data[expert_id] = loaded_weight
 
-    def _load_g_idx(self, shard_id: str, expert_data: torch.Tensor,
-                    shard_dim: int, loaded_weight: torch.Tensor, tp_rank: int):
-
+    def _load_g_idx(
+        self,
+        shard_id: str,
+        expert_data: torch.Tensor,
+        shard_dim: int,
+        loaded_weight: torch.Tensor,
+        tp_rank: int,
+    ):
         if shard_id == "w2":
-            self._load_w2(shard_dim=shard_dim,
-                          loaded_weight=loaded_weight,
-                          expert_data=expert_data,
-                          tp_rank=tp_rank)
+            self._load_w2(
+                shard_dim=shard_dim,
+                loaded_weight=loaded_weight,
+                expert_data=expert_data,
+                tp_rank=tp_rank,
+            )
         else:
             assert shard_id in ("w1", "w3")
             expert_data.copy_(loaded_weight)
@@ -1376,27 +1510,36 @@ def _map_global_expert_id_to_local_expert_id(self, expert_id: int) -> int:
         return self.expert_map[expert_id].item()
 
     @overload
-    def weight_loader(self, param: torch.nn.Parameter,
-                      loaded_weight: torch.Tensor, weight_name: str,
-                      shard_id: str, expert_id: int,
-                      return_success: Literal[False]) -> None:
-        ...
+    def weight_loader(
+        self,
+        param: torch.nn.Parameter,
+        loaded_weight: torch.Tensor,
+        weight_name: str,
+        shard_id: str,
+        expert_id: int,
+        return_success: Literal[False],
+    ) -> None: ...
 
     @overload
-    def weight_loader(self, param: torch.nn.Parameter,
-                      loaded_weight: torch.Tensor, weight_name: str,
-                      shard_id: str, expert_id: int,
-                      return_success: Literal[True]) -> bool:
-        ...
-
-    def weight_loader(self,
-                      param: torch.nn.Parameter,
-                      loaded_weight: torch.Tensor,
-                      weight_name: str,
-                      shard_id: str,
-                      expert_id: int,
-                      return_success: bool = False) -> Optional[bool]:
-
+    def weight_loader(
+        self,
+        param: torch.nn.Parameter,
+        loaded_weight: torch.Tensor,
+        weight_name: str,
+        shard_id: str,
+        expert_id: int,
+        return_success: Literal[True],
+    ) -> bool: ...
+
+    def weight_loader(
+        self,
+        param: torch.nn.Parameter,
+        loaded_weight: torch.Tensor,
+        weight_name: str,
+        shard_id: str,
+        expert_id: int,
+        return_success: bool = False,
+    ) -> Optional[bool]:
         if self.quant_config and self.quant_config.get_name() == "mxfp4":
             # (FIXME) for gpt-oss all experts are combined
             if "bias" in weight_name:
@@ -1419,13 +1562,13 @@ def weight_loader(self,
         # TODO (mgoin): check self.quant_method.quant_config.quant_format
         # against known CompressionFormat enum values that have this quality
         if self.quant_method.__class__.__name__ in (
-                "CompressedTensorsWNA16MarlinMoEMethod",
-                "CompressedTensorsWNA16MoEMethod"):
+            "CompressedTensorsWNA16MarlinMoEMethod",
+            "CompressedTensorsWNA16MoEMethod",
+        ):
             loaded_weight = loaded_weight.t().contiguous()
 
         if shard_id not in ("w1", "w2", "w3"):
-            raise ValueError(f"shard_id must be ['w1','w2','w3'] but "
-                             f"got {shard_id}.")
+            raise ValueError(f"shard_id must be ['w1','w2','w3'] but got {shard_id}.")
 
         # Fetch the dim to shard the parameter/loaded weight
         # based on the shard id. This will be whatever
@@ -1487,43 +1630,49 @@ def weight_loader(self,
             # this is needed for compressed-tensors only
             loaded_weight = loaded_weight.to(param.data.device)
 
-            if ("compressed" in quant_method_name.lower()
-                    and param.data[expert_id] != 1
-                    and (param.data[expert_id] - loaded_weight).abs() > 1e-5):
+            if (
+                "compressed" in quant_method_name.lower()
+                and param.data[expert_id] != 1
+                and (param.data[expert_id] - loaded_weight).abs() > 1e-5
+            ):
                 raise ValueError(
                     "input_scales of w1 and w3 of a layer "
                     f"must be equal. But got {param.data[expert_id]} "
-                    f"vs. {loaded_weight}")
+                    f"vs. {loaded_weight}"
+                )
 
-            self._load_single_value(param=param,
-                                    loaded_weight=loaded_weight,
-                                    expert_id=expert_id)
+            self._load_single_value(
+                param=param, loaded_weight=loaded_weight, expert_id=expert_id
+            )
             return True if return_success else None
 
         # Case g_idx
         if "g_idx" in weight_name:
-            self._load_g_idx(shard_dim=0,
-                             shard_id=shard_id,
-                             loaded_weight=loaded_weight,
-                             expert_data=expert_data,
-                             tp_rank=self.tp_rank)
+            self._load_g_idx(
+                shard_dim=0,
+                shard_id=shard_id,
+                loaded_weight=loaded_weight,
+                expert_data=expert_data,
+                tp_rank=self.tp_rank,
+            )
             return True if return_success else None
 
         # TODO @dsikka: ModelOpt should follow the proper MoE loading pattern
         if "ModelOpt" in quant_method_name:
             # Determine per-tensor weight scale patterns based on variant
             # Use the dedicated method instead of brittle string matching
-            uses_weight_scale_2 = self.quant_method.uses_weight_scale_2_pattern(
-            )
+            uses_weight_scale_2 = self.quant_method.uses_weight_scale_2_pattern()
 
             # Call _load_per_tensor_weight_scale() to load per-tensor (scalar)
             # weights scales.
             # Input scales are always per-tensor.
             # Weight scales: FP4 uses "weight_scale_2" and FP8 uses
             # "weight_scale" for per-tensor scales.
-            is_per_tensor = ("weight_scale_2" in weight_name
-                             if uses_weight_scale_2 else "weight_scale"
-                             in weight_name) or "input_scale" in weight_name
+            is_per_tensor = (
+                "weight_scale_2" in weight_name
+                if uses_weight_scale_2
+                else "weight_scale" in weight_name
+            ) or "input_scale" in weight_name
             if is_per_tensor:
                 self._load_per_tensor_weight_scale(
                     shard_id=shard_id,
@@ -1558,12 +1707,12 @@ def weight_loader(self,
                     shard_dim=shard_dim,
                     loaded_weight=loaded_weight,
                     expert_data=expert_data,
-                    tp_rank=self.tp_rank)
+                    tp_rank=self.tp_rank,
+                )
             return True if return_success else None
 
         # Case weight scales, zero_points and offset, weight/input global scales
-        if ("scale" in weight_name or "zero" in weight_name
-                or "offset" in weight_name):
+        if "scale" in weight_name or "zero" in weight_name or "offset" in weight_name:
             # load the weight scales and zp based on the quantization scheme
             # supported weight scales/zp can be found in
             # FusedMoeWeightScaleSupported
@@ -1576,10 +1725,11 @@ def weight_loader(self,
                     shard_dim=shard_dim,
                     loaded_weight=loaded_weight,
                     expert_data=expert_data,
-                    tp_rank=self.tp_rank)
+                    tp_rank=self.tp_rank,
+                )
             elif quant_method in [
-                    FusedMoeWeightScaleSupported.GROUP.value,
-                    FusedMoeWeightScaleSupported.BLOCK.value,
+                FusedMoeWeightScaleSupported.GROUP.value,
+                FusedMoeWeightScaleSupported.BLOCK.value,
             ]:
                 self._load_model_weight_or_group_weight_scale(
                     shard_id=shard_id,
@@ -1587,26 +1737,28 @@ def weight_loader(self,
                     loaded_weight=loaded_weight,
                     expert_data=expert_data,
                     tp_rank=self.tp_rank,
-                    load_full_w2=getattr(param, "load_full_w2", False))
+                    load_full_w2=getattr(param, "load_full_w2", False),
+                )
             elif quant_method == FusedMoeWeightScaleSupported.TENSOR.value:
-                self._load_per_tensor_weight_scale(shard_id=shard_id,
-                                                   param=param,
-                                                   loaded_weight=loaded_weight,
-                                                   expert_id=expert_id)
+                self._load_per_tensor_weight_scale(
+                    shard_id=shard_id,
+                    param=param,
+                    loaded_weight=loaded_weight,
+                    expert_id=expert_id,
+                )
             else:
-                WEIGHT_SCALE_SUPPORTED = [
-                    e.value for e in FusedMoeWeightScaleSupported
-                ]
+                WEIGHT_SCALE_SUPPORTED = [e.value for e in FusedMoeWeightScaleSupported]
                 raise ValueError(
-                    f"quant method must be one of {WEIGHT_SCALE_SUPPORTED}")
+                    f"quant method must be one of {WEIGHT_SCALE_SUPPORTED}"
+                )
             return True if return_success else None
 
         # Case weight_shape
         if "weight_shape" in weight_name:
             # only required by compressed-tensors
-            self._load_single_value(param=param,
-                                    loaded_weight=loaded_weight,
-                                    expert_id=expert_id)
+            self._load_single_value(
+                param=param, loaded_weight=loaded_weight, expert_id=expert_id
+            )
             return True if return_success else None
 
         # Case model weights
@@ -1616,17 +1768,20 @@ def weight_loader(self,
                 shard_dim=shard_dim,
                 loaded_weight=loaded_weight,
                 expert_data=expert_data,
-                tp_rank=self.tp_rank)
+                tp_rank=self.tp_rank,
+            )
             return True if return_success else None
 
         return False if return_success else None
 
     def load_weights(
-            self, weights: Iterable[tuple[str,
-                                          torch.Tensor]]) -> Iterable[str]:
+        self, weights: Iterable[tuple[str, torch.Tensor]]
+    ) -> Iterable[str]:
         if (expert_mapping := self.expert_mapping) is None:
-            raise ValueError("`self.expert_mapping` must be provided to "
-                             "load weights using `self.load_weights`.")
+            raise ValueError(
+                "`self.expert_mapping` must be provided to "
+                "load weights using `self.load_weights`."
+            )
         for expert_name, loaded_weight in weights:
             qual_name = f"{self.layer_name}.{expert_name}"
             for param_name, weight_name, expert_id, shard_id in expert_mapping:
@@ -1644,8 +1799,12 @@ def load_weights(
                     return_success=True,
                 )
                 if success:
-                    logger.debug("Loaded %s for expert %d into %s", param_name,
-                                 expert_id, self.layer_name)
+                    logger.debug(
+                        "Loaded %s for expert %d into %s",
+                        param_name,
+                        expert_id,
+                        self.layer_name,
+                    )
                     yield param_name
 
     def get_expert_weights(self) -> Iterable[torch.Tensor]:
@@ -1660,9 +1819,11 @@ def get_expert_weights(self) -> Iterable[torch.Tensor]:
         }
 
         return [
-            weight.view(self.local_num_experts, -1) for name, weight in weights
-            if name not in NON_EXPERT_WEIGHTS and weight.shape != torch.Size(
-                []) and not name.startswith("_shared_experts.")
+            weight.view(self.local_num_experts, -1)
+            for name, weight in weights
+            if name not in NON_EXPERT_WEIGHTS
+            and weight.shape != torch.Size([])
+            and not name.startswith("_shared_experts.")
         ]
 
     def set_eplb_state(
@@ -1685,7 +1846,8 @@ def set_eplb_state(
     def ensure_moe_quant_config(self):
         if self.quant_method.moe_quant_config is None:
             self.quant_method.moe_quant_config = (
-                self.quant_method.get_fused_moe_quant_config(self))
+                self.quant_method.get_fused_moe_quant_config(self)
+            )
 
     @staticmethod
     def select_experts(
@@ -1715,7 +1877,7 @@ def select_experts(
         router logits.
 
         Returns:
-                (topk_weights, topk_ids, zero_expert_result) 
+                (topk_weights, topk_ids, zero_expert_result)
                 (tuple[torch.Tensor, torch.Tensor, torch.Tensor]):
                 The weights, expert ids, and zero expert computation result.
 
@@ -1724,7 +1886,9 @@ def select_experts(
             plain MoE implementations without redundant experts.
         """
         from vllm.model_executor.layers.fused_moe.fused_moe import (
-            fused_topk, fused_topk_bias)
+            fused_topk,
+            fused_topk_bias,
+        )
 
         # Check if we should use a routing simulation strategy
         routing_strategy = envs.VLLM_MOE_ROUTING_SIMULATION_STRATEGY
@@ -1734,7 +1898,8 @@ def select_experts(
                 router_logits=router_logits,
                 strategy_name=routing_strategy,
                 top_k=top_k,
-                indices_type=indices_type)
+                indices_type=indices_type,
+            )
 
         # DeepSeekv2 uses grouped_top_k
         if use_grouped_topk:
@@ -1749,7 +1914,8 @@ def select_experts(
                 topk_group=topk_group,
                 scoring_func=scoring_func,
                 routed_scaling_factor=routed_scaling_factor,
-                e_score_correction_bias=e_score_correction_bias)
+                e_score_correction_bias=e_score_correction_bias,
+            )
             if indices_type is not None:
                 topk_ids = topk_ids.to(dtype=indices_type)
         elif e_score_correction_bias is not None:
@@ -1775,7 +1941,8 @@ def select_experts(
                 hidden_states=hidden_states,
                 gating_output=router_logits,
                 topk=top_k,
-                renormalize=renormalize)
+                renormalize=renormalize,
+            )
             if indices_type is not None:
                 topk_ids = topk_ids.to(dtype=indices_type)
 
@@ -1795,9 +1962,12 @@ def select_experts(
         assert topk_ids.dtype == indices_type or indices_type is None
 
         # Compute zero expert result if needed
-        if (zero_expert_num is not None and zero_expert_num > 0
-                and zero_expert_type is not None
-                and global_num_experts is not None):
+        if (
+            zero_expert_num is not None
+            and zero_expert_num > 0
+            and zero_expert_type is not None
+            and global_num_experts is not None
+        ):
             zero_expert_result = zero_experts_compute_triton(
                 expert_indices=topk_ids,
                 expert_scales=topk_weights,
@@ -1822,16 +1992,21 @@ def must_reduce_shared_expert_outputs(self) -> bool:
         Therefore it is required that we reduce the shared_experts output
         early.
         """
-        return (self.use_pplx_kernels or self.use_deepep_ht_kernels
-                or self.use_deepep_ll_kernels)
+        return (
+            self.use_pplx_kernels
+            or self.use_deepep_ht_kernels
+            or self.use_deepep_ll_kernels
+        )
 
-    def maybe_all_reduce_tensor_model_parallel(
-            self, final_hidden_states: torch.Tensor):
+    def maybe_all_reduce_tensor_model_parallel(self, final_hidden_states: torch.Tensor):
         """
         The pplx combine kernel reduces across GPU ranks by default.
         """
-        if (self.use_pplx_kernels or self.use_deepep_ht_kernels
-                or self.use_deepep_ll_kernels):
+        if (
+            self.use_pplx_kernels
+            or self.use_deepep_ht_kernels
+            or self.use_deepep_ll_kernels
+        ):
             return final_hidden_states
         else:
             return tensor_model_parallel_all_reduce(final_hidden_states)
@@ -1843,10 +2018,12 @@ def forward_native(
     ) -> Union[torch.Tensor, tuple[torch.Tensor, torch.Tensor]]:
         og_hidden_states = hidden_states.shape[-1]
         if self.hidden_size != og_hidden_states:
-            hidden_states = F.pad(hidden_states,
-                                  (0, self.hidden_size - og_hidden_states),
-                                  mode='constant',
-                                  value=0.0)
+            hidden_states = F.pad(
+                hidden_states,
+                (0, self.hidden_size - og_hidden_states),
+                mode="constant",
+                value=0.0,
+            )
 
         if self.shared_experts is None:
             if current_platform.is_tpu():
@@ -1856,19 +2033,24 @@ def forward_native(
                 assert not isinstance(fused_output, tuple)
             else:
                 fused_output = torch.ops.vllm.moe_forward(
-                    hidden_states, router_logits, self.layer_name)
+                    hidden_states, router_logits, self.layer_name
+                )
             return fused_output[..., :og_hidden_states]
         else:
             if current_platform.is_tpu():
                 # TODO: Once the OOM issue for the TPU backend is resolved, we
                 # will switch to using the moe_forward custom op.
                 shared_output, fused_output = self.forward_impl(
-                    hidden_states, router_logits)
+                    hidden_states, router_logits
+                )
             else:
                 shared_output, fused_output = torch.ops.vllm.moe_forward_shared(
-                    hidden_states, router_logits, self.layer_name)
-            return (shared_output[..., :og_hidden_states],
-                    fused_output[..., :og_hidden_states])
+                    hidden_states, router_logits, self.layer_name
+                )
+            return (
+                shared_output[..., :og_hidden_states],
+                fused_output[..., :og_hidden_states],
+            )
 
     def forward_cuda(
         self,
@@ -1887,17 +2069,14 @@ def forward_impl_chunked(
         assert self.batched_hidden_states.dtype == full_hidden_states.dtype
         assert self.batched_router_logits.dtype == full_router_logits.dtype
         # Check size compatibility.
-        assert (
-            self.batched_hidden_states.size(-1) == full_hidden_states.size(-1))
-        assert (
-            self.batched_router_logits.size(-1) == full_router_logits.size(-1))
+        assert self.batched_hidden_states.size(-1) == full_hidden_states.size(-1)
+        assert self.batched_router_logits.size(-1) == full_router_logits.size(-1)
 
         self.ensure_moe_quant_config()
 
         full_fused_final_hidden_states = torch.empty_like(full_hidden_states)
         if self.shared_experts is not None:
-            full_shared_final_hidden_states = torch.empty_like(
-                full_hidden_states)
+            full_shared_final_hidden_states = torch.empty_like(full_hidden_states)
 
         def process_chunk(chunk_start, chunk_end, skip_result_store=False):
             chunk_size = chunk_end - chunk_start
@@ -1911,30 +2090,31 @@ def process_chunk(chunk_start, chunk_end, skip_result_store=False):
             if self.batched_hidden_states.dim() == 3:
                 assert self.batched_router_logits.dim() == 3
                 batch_buffer_idx = dbo_current_ubatch_id()
-                batched_hidden_states = self.batched_hidden_states[
-                    batch_buffer_idx, :]
-                batched_router_logits = self.batched_router_logits[
-                    batch_buffer_idx, :]
+                batched_hidden_states = self.batched_hidden_states[batch_buffer_idx, :]
+                batched_router_logits = self.batched_router_logits[batch_buffer_idx, :]
             else:
                 batched_hidden_states = self.batched_hidden_states
                 batched_router_logits = self.batched_router_logits
 
-            assert (batched_hidden_states.size(0)  # type: ignore
-                    >= chunk_size)
-            assert (batched_router_logits.size(0)  # type: ignore 
-                    >= chunk_size)
-            staged_hidden_states = batched_hidden_states[:
-                                                         chunk_size, :]  # type: ignore
-            staged_router_logits = batched_router_logits[:
-                                                         chunk_size, :]  # type: ignore
+            assert (
+                batched_hidden_states.size(0)  # type: ignore
+                >= chunk_size
+            )
+            assert (
+                batched_router_logits.size(0)  # type: ignore
+                >= chunk_size
+            )
+            staged_hidden_states = batched_hidden_states[:chunk_size, :]  # type: ignore
+            staged_router_logits = batched_router_logits[:chunk_size, :]  # type: ignore
             staged_hidden_states.copy_(hidden_states, non_blocking=True)
             staged_router_logits.copy_(router_logits, non_blocking=True)
 
             # If there are shared experts but we are not using a modular kernel,
             # the shared experts must be called here
-            if (not isinstance(self.quant_method.fused_experts,
-                               FusedMoEModularKernel)
-                    and self.shared_experts is not None):
+            if (
+                not isinstance(self.quant_method.fused_experts, FusedMoEModularKernel)
+                and self.shared_experts is not None
+            ):
                 shared_output = self.shared_experts(staged_hidden_states)
             else:
                 shared_output = None
@@ -1979,16 +2159,16 @@ def process_chunk(chunk_start, chunk_end, skip_result_store=False):
 
             if not skip_result_store:
                 if self.shared_experts is None:
-                    full_fused_final_hidden_states[
-                        chunk_start:chunk_end, :].copy_(final_hidden_states,
-                                                        non_blocking=True)
+                    full_fused_final_hidden_states[chunk_start:chunk_end, :].copy_(
+                        final_hidden_states, non_blocking=True
+                    )
                 else:
-                    full_shared_final_hidden_states[
-                        chunk_start:chunk_end, :].copy_(final_hidden_states[0],
-                                                        non_blocking=True)
-                    full_fused_final_hidden_states[
-                        chunk_start:chunk_end, :].copy_(final_hidden_states[1],
-                                                        non_blocking=True)
+                    full_shared_final_hidden_states[chunk_start:chunk_end, :].copy_(
+                        final_hidden_states[0], non_blocking=True
+                    )
+                    full_fused_final_hidden_states[chunk_start:chunk_end, :].copy_(
+                        final_hidden_states[1], non_blocking=True
+                    )
 
         ctx = get_forward_context()
         # flashinfer_cutlass_kernels can handle: optional DP + TP/EP
@@ -1998,31 +2178,32 @@ def process_chunk(chunk_start, chunk_end, skip_result_store=False):
         # If the input to the MoE is sequence parallel then divide by sp_size
         # to find the maximum number of tokens for any individual dispatcher.
         if self.is_sequence_parallel:
-            max_tokens_across_dispatchers = cdiv(max_tokens_across_dispatchers,
-                                                 self.sp_size)
+            max_tokens_across_dispatchers = cdiv(
+                max_tokens_across_dispatchers, self.sp_size
+            )
 
         num_tokens = full_hidden_states.size(0)
         for chunk_idx, chunk_start_ in enumerate(
-                range(0, max_tokens_across_dispatchers,
-                      moe_dp_chunk_size_per_rank)):
+            range(0, max_tokens_across_dispatchers, moe_dp_chunk_size_per_rank)
+        ):
             chunk_start = chunk_start_
-            chunk_end = min(chunk_start + moe_dp_chunk_size_per_rank,
-                            max_tokens_across_dispatchers)
+            chunk_end = min(
+                chunk_start + moe_dp_chunk_size_per_rank, max_tokens_across_dispatchers
+            )
             # clamp start and end
             chunk_start = min(chunk_start, num_tokens - 1)
             chunk_end = min(chunk_end, num_tokens)
-            with ctx.dp_metadata.chunked_sizes(self.sp_size,
-                                               moe_dp_chunk_size_per_rank,
-                                               chunk_idx):
-                process_chunk(chunk_start,
-                              chunk_end,
-                              skip_result_store=chunk_start_ >= num_tokens)
+            with ctx.dp_metadata.chunked_sizes(
+                self.sp_size, moe_dp_chunk_size_per_rank, chunk_idx
+            ):
+                process_chunk(
+                    chunk_start, chunk_end, skip_result_store=chunk_start_ >= num_tokens
+                )
 
         if self.shared_experts is None:
             return full_fused_final_hidden_states
         else:
-            return (full_shared_final_hidden_states,
-                    full_fused_final_hidden_states)
+            return (full_shared_final_hidden_states, full_fused_final_hidden_states)
 
     def forward_impl(
         self,
@@ -2035,36 +2216,45 @@ def forward_impl(
 
         # Route to the chunked forward path using the FlashInfer Cutlass kernel
         # only when data parallelism (DP) is enabled.
-        _use_flashinfer_cutlass_kernels = (self.dp_size > 1 and
-                                           self.use_flashinfer_cutlass_kernels)
+        _use_flashinfer_cutlass_kernels = (
+            self.dp_size > 1 and self.use_flashinfer_cutlass_kernels
+        )
 
-        if (self.moe_parallel_config.use_pplx_kernels
-                or self.moe_parallel_config.use_deepep_ll_kernels
-                or _use_flashinfer_cutlass_kernels):
+        if (
+            self.moe_parallel_config.use_pplx_kernels
+            or self.moe_parallel_config.use_deepep_ll_kernels
+            or _use_flashinfer_cutlass_kernels
+        ):
             return self.forward_impl_chunked(hidden_states, router_logits)
 
         do_naive_dispatch_combine: bool = (
             self.dp_size > 1
             and not self.moe_parallel_config.use_deepep_ht_kernels
-            and not self.moe_config.use_flashinfer_cutlass_kernels)
+            and not self.moe_config.use_flashinfer_cutlass_kernels
+        )
 
         # If there are shared experts but we are not using a modular kernel, the
         # shared experts must be called here
-        if (not isinstance(self.quant_method.fused_experts,
-                           FusedMoEModularKernel)
-                and self.shared_experts is not None):
+        if (
+            not isinstance(self.quant_method.fused_experts, FusedMoEModularKernel)
+            and self.shared_experts is not None
+        ):
             shared_output = self.shared_experts(hidden_states)
         else:
             shared_output = None
 
         ctx = get_forward_context()
-        sp_ctx = ctx.dp_metadata.sp_local_sizes(
-            self.sp_size) if ctx.dp_metadata else nullcontext()
+        sp_ctx = (
+            ctx.dp_metadata.sp_local_sizes(self.sp_size)
+            if ctx.dp_metadata
+            else nullcontext()
+        )
 
         with sp_ctx:
             if do_naive_dispatch_combine:
                 hidden_states, router_logits = get_ep_group().dispatch(
-                    hidden_states, router_logits, self.is_sequence_parallel)
+                    hidden_states, router_logits, self.is_sequence_parallel
+                )
 
             # Matrix multiply.
             final_hidden_states = self.quant_method.apply(
@@ -2101,16 +2291,18 @@ def forward_impl(
                 assert isinstance(final_hidden_states, tuple)
                 final_hidden_states, zero_expert_result = final_hidden_states
 
-            def reduce_output(states: torch.Tensor,
-                              do_combine: bool = True) -> torch.Tensor:
+            def reduce_output(
+                states: torch.Tensor, do_combine: bool = True
+            ) -> torch.Tensor:
                 if do_naive_dispatch_combine and do_combine:
-                    states = get_ep_group().combine(states,
-                                                    self.is_sequence_parallel)
+                    states = get_ep_group().combine(states, self.is_sequence_parallel)
 
-                if (not self.is_sequence_parallel and self.reduce_results
-                        and (self.tp_size > 1 or self.ep_size > 1)):
-                    states = self.maybe_all_reduce_tensor_model_parallel(
-                        states)
+                if (
+                    not self.is_sequence_parallel
+                    and self.reduce_results
+                    and (self.tp_size > 1 or self.ep_size > 1)
+                ):
+                    states = self.maybe_all_reduce_tensor_model_parallel(states)
 
                 return states
 
@@ -2127,29 +2319,36 @@ def reduce_output(states: torch.Tensor,
 
     @classmethod
     def make_expert_params_mapping(
-            cls,
-            ckpt_gate_proj_name: str,
-            ckpt_down_proj_name: str,
-            ckpt_up_proj_name: str,
-            num_experts: int,
-            num_redundant_experts: int = 0) -> list[tuple[str, str, int, str]]:
-
+        cls,
+        ckpt_gate_proj_name: str,
+        ckpt_down_proj_name: str,
+        ckpt_up_proj_name: str,
+        num_experts: int,
+        num_redundant_experts: int = 0,
+    ) -> list[tuple[str, str, int, str]]:
         num_physical_experts = num_experts + num_redundant_experts
 
         # In the returned mapping:
         # - `expert_id` is the physical expert id
         # - `weight_name` contains the weight name of the logical expert
         # So that we should map the expert id to logical in `weight_name`
-        physical_to_logical_map = \
+        physical_to_logical_map = (
             EplbState.build_initial_global_physical_to_logical_map(
-            num_experts, num_redundant_experts)
+                num_experts, num_redundant_experts
+            )
+        )
 
         return [
             # (param_name, weight_name, expert_id, shard_id)
-            ("experts.w13_" if weight_name
-             in [ckpt_gate_proj_name, ckpt_up_proj_name] else "experts.w2_",
-             f"experts.{physical_to_logical_map[expert_id]}.{weight_name}.",
-             expert_id, shard_id) for expert_id in range(num_physical_experts)
+            (
+                "experts.w13_"
+                if weight_name in [ckpt_gate_proj_name, ckpt_up_proj_name]
+                else "experts.w2_",
+                f"experts.{physical_to_logical_map[expert_id]}.{weight_name}.",
+                expert_id,
+                shard_id,
+            )
+            for expert_id in range(num_physical_experts)
             for shard_id, weight_name in [
                 ("w1", ckpt_gate_proj_name),
                 ("w2", ckpt_down_proj_name),
@@ -2158,7 +2357,6 @@ def make_expert_params_mapping(
         ]
 
     def extra_repr(self) -> str:
-
         s = (
             f"global_num_experts={self.global_num_experts}, "
             f"local_num_experts={self.local_num_experts}, "
@@ -2168,7 +2366,8 @@ def extra_repr(self) -> str:
             f"ep_size={self.ep_size}, "
             f"reduce_results={self.reduce_results}, "
             f"renormalize={self.renormalize}, "
-            f"use_grouped_topk={self.use_grouped_topk}")
+            f"use_grouped_topk={self.use_grouped_topk}"
+        )
 
         if self.use_grouped_topk:
             s += f", num_expert_group={self.num_expert_group}, topk_group={self.topk_group}"  # noqa: E501
@@ -2202,7 +2401,7 @@ def moe_forward_fake(
     op_func=moe_forward,
     mutates_args=["hidden_states"],
     fake_impl=moe_forward_fake,
-    tags=(torch.Tag.needs_fixed_stride_order, ),
+    tags=(torch.Tag.needs_fixed_stride_order,),
 )
 
 
@@ -2232,7 +2431,7 @@ def moe_forward_shared_fake(
     op_func=moe_forward_shared,
     mutates_args=["hidden_states"],
     fake_impl=moe_forward_shared_fake,
-    tags=(torch.Tag.needs_fixed_stride_order, ),
+    tags=(torch.Tag.needs_fixed_stride_order,),
 )
 
 # Mark the FusedMoE weight_loader as supporting MoE-specific parameters
diff --git a/vllm/model_executor/layers/fused_moe/modular_kernel.py b/vllm/model_executor/layers/fused_moe/modular_kernel.py
index a7617f8b7297..e5c65309ec0b 100644
--- a/vllm/model_executor/layers/fused_moe/modular_kernel.py
+++ b/vllm/model_executor/layers/fused_moe/modular_kernel.py
@@ -11,11 +11,17 @@
 import vllm.envs as envs
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.fused_moe.utils import (  # yapf: disable
-    _resize_cache, count_expert_num_tokens)
+    _resize_cache,
+    count_expert_num_tokens,
+)
 from vllm.utils import cdiv
-from vllm.v1.worker.ubatching import (dbo_current_ubatch_id, dbo_enabled,
-                                      dbo_maybe_run_recv_hook,
-                                      dbo_register_recv_hook, dbo_yield)
+from vllm.v1.worker.ubatching import (
+    dbo_current_ubatch_id,
+    dbo_enabled,
+    dbo_maybe_run_recv_hook,
+    dbo_register_recv_hook,
+    dbo_yield,
+)
 
 #
 # This file defines a set of base classes used to make MoE kernels more modular.
@@ -59,31 +65,34 @@ class FusedMoEActivationFormat(Enum):
     """
     The standard activation format (num_tokens, hidden dim).
     """
-    Standard = "standard",
+
+    Standard = ("standard",)
     """
     The batched experts format (num experts, max tokens per expert, hidden dim)
     """
-    BatchedExperts = "batched_experts",
+    BatchedExperts = ("batched_experts",)
 
 
 @dataclass
 class ExpertTokensMetadata:
     """
-  Metadata regarding expert-token routing.
-  """
+    Metadata regarding expert-token routing.
+    """
+
     expert_num_tokens: torch.Tensor
     expert_num_tokens_cpu: Optional[torch.Tensor]
 
     @staticmethod
-    def make_from_list(expert_num_tokens_list: list[int],
-                       device: str) -> "ExpertTokensMetadata":
-        expert_num_tokens_cpu = torch.tensor(expert_num_tokens_list,
-                                             device="cpu",
-                                             dtype=torch.int32)
+    def make_from_list(
+        expert_num_tokens_list: list[int], device: str
+    ) -> "ExpertTokensMetadata":
+        expert_num_tokens_cpu = torch.tensor(
+            expert_num_tokens_list, device="cpu", dtype=torch.int32
+        )
         return ExpertTokensMetadata(
-            expert_num_tokens=expert_num_tokens_cpu.to(device,
-                                                       non_blocking=True),
-            expert_num_tokens_cpu=expert_num_tokens_cpu)
+            expert_num_tokens=expert_num_tokens_cpu.to(device, non_blocking=True),
+            expert_num_tokens_cpu=expert_num_tokens_cpu,
+        )
 
 
 class TopKWeightAndReduce(ABC):
@@ -92,10 +101,14 @@ class TopKWeightAndReduce(ABC):
     """
 
     @abstractmethod
-    def apply(self, output: Optional[torch.Tensor],
-              fused_expert_output: torch.Tensor, topk_weights: torch.Tensor,
-              topk_ids: torch.Tensor,
-              apply_router_weight_on_input: bool) -> torch.Tensor:
+    def apply(
+        self,
+        output: Optional[torch.Tensor],
+        fused_expert_output: torch.Tensor,
+        topk_weights: torch.Tensor,
+        topk_ids: torch.Tensor,
+        apply_router_weight_on_input: bool,
+    ) -> torch.Tensor:
         """
         Apply topk_weights to the fused_experts_outputs and/or reduce.
         If an output tensor is not passed, it will be created in the
@@ -200,16 +213,16 @@ def prepare_async(
         - apply_router_weight_on_input: When True, apply the weights to the
           activations, before quantization + dispatching.
 
-        Returns a callback or a hook callback pair that when invoked waits for 
-        results from other workers and has the same return signature as 
+        Returns a callback or a hook callback pair that when invoked waits for
+        results from other workers and has the same return signature as
         `prepare`, if a hook is returned this is more lightweight check that
-        the recv is complete without doing extra work (used by DBO, will be 
+        the recv is complete without doing extra work (used by DBO, will be
         refactored in the very near future)
-        
+
         e.g.
 
         ret = obj.prepare_async(...)
-        
+
         if isinstance(ret, tuple):
             hook, receiver = ret
             hook()
@@ -270,10 +283,10 @@ def finalize_async(
         - weight_and_reduce_impl: An optional TopKWeightAndReduce
           implementation.
 
-        Returns a callback or a hook callback pair that when invoked waits for 
-        results from other workers and has the same return signature as 
+        Returns a callback or a hook callback pair that when invoked waits for
+        results from other workers and has the same return signature as
         `finalize`, if a hook is returned this is more lightweight check that
-        the recv is complete without doing extra work (used by DBO, will be 
+        the recv is complete without doing extra work (used by DBO, will be
         refactored in the very near future)
 
         ret = obj.finalize_async(output, ...)
@@ -344,7 +357,8 @@ def __init__(
     @property
     @abstractmethod
     def activation_formats(
-            self) -> tuple[FusedMoEActivationFormat, FusedMoEActivationFormat]:
+        self,
+    ) -> tuple[FusedMoEActivationFormat, FusedMoEActivationFormat]:
         """
         A property which is a tuple of the input and output activation formats
         for the 'apply' method.
@@ -382,8 +396,7 @@ def moe_problem_size(
 
         if a1.dim() == 2:
             # Make sure we are using the correct a1 (pre-permute).
-            assert topk_ids.size(0) == a1.size(0), \
-                f"{topk_ids.size(0)} != {a1.size(0)}"
+            assert topk_ids.size(0) == a1.size(0), f"{topk_ids.size(0)} != {a1.size(0)}"
             M = a1.size(0)
         else:
             assert a1.dim() == 3
@@ -511,8 +524,9 @@ def workspace_shapes(
         """
         raise NotImplementedError
 
-    def activation(self, activation: str, output: torch.Tensor,
-                   input: torch.Tensor) -> None:
+    def activation(
+        self, activation: str, output: torch.Tensor, input: torch.Tensor
+    ) -> None:
         assert output.size(-1) * 2 == input.size(-1)
         if activation == "silu":
             torch.ops._C.silu_and_mul(output, input)
@@ -522,8 +536,9 @@ def activation(self, activation: str, output: torch.Tensor,
             raise ValueError(f"Unsupported FusedMoe activation: {activation}")
 
     def enable_chunking(self):
-        return envs.VLLM_ENABLE_FUSED_MOE_ACTIVATION_CHUNKING and \
-          self.supports_chunking()
+        return (
+            envs.VLLM_ENABLE_FUSED_MOE_ACTIVATION_CHUNKING and self.supports_chunking()
+        )
 
     def finalize_weight_and_reduce_impl(self) -> TopKWeightAndReduce:
         raise NotImplementedError
@@ -585,8 +600,9 @@ def apply(
         raise NotImplementedError
 
 
-def _chunk_scales(scales: Optional[torch.Tensor], start: int,
-                  end: int) -> Optional[torch.Tensor]:
+def _chunk_scales(
+    scales: Optional[torch.Tensor], start: int, end: int
+) -> Optional[torch.Tensor]:
     if scales is not None:
         if scales.numel() == 1:
             return scales
@@ -596,17 +612,19 @@ def _chunk_scales(scales: Optional[torch.Tensor], start: int,
 
 
 class SharedResizableBuffer:
-
     def __init__(self):
         self.buffer = None
 
-    def get(self, shape: tuple[int, ...], device: torch.device,
-            dtype: torch.dtype):
+    def get(self, shape: tuple[int, ...], device: torch.device, dtype: torch.dtype):
         if shape == () or shape is None:
             return None
         shape_numel = prod(shape)
-        if (self.buffer is None or self.buffer.numel() < shape_numel
-                or self.buffer.device != device or self.buffer.dtype != dtype):
+        if (
+            self.buffer is None
+            or self.buffer.numel() < shape_numel
+            or self.buffer.device != device
+            or self.buffer.dtype != dtype
+        ):
             self.buffer = torch.empty(shape_numel, device=device, dtype=dtype)
         return self.buffer[:shape_numel].view(*shape)
 
@@ -626,7 +644,6 @@ class FusedMoEModularKernel(torch.nn.Module):
     """
 
     class SharedBuffers:
-
         def __init__(self) -> None:
             self.fused_out = SharedResizableBuffer()
             self.workspace13 = SharedResizableBuffer()
@@ -652,12 +669,14 @@ def __init__(
         self.prepare_finalize = prepare_finalize
         self.fused_experts = fused_experts
         self.shared_experts = shared_experts
-        assert prepare_finalize.activation_format == \
-            fused_experts.activation_formats[0], (
-                f"{prepare_finalize.__class__.__name__}."
-                f"{prepare_finalize.activation_format} == "
-                f"{fused_experts.__class__.__name__}."
-                f"{fused_experts.activation_formats[0]}")
+        assert (
+            prepare_finalize.activation_format == fused_experts.activation_formats[0]
+        ), (
+            f"{prepare_finalize.__class__.__name__}."
+            f"{prepare_finalize.activation_format} == "
+            f"{fused_experts.__class__.__name__}."
+            f"{fused_experts.activation_formats[0]}"
+        )
 
     def _do_fused_experts(
         self,
@@ -677,14 +696,21 @@ def _do_fused_experts(
         expert_tokens_meta: Optional[ExpertTokensMetadata],
         apply_router_weight_on_input: bool,
     ) -> torch.Tensor:
+        _, M, N, K, top_k = self.fused_experts.moe_problem_size(a1q, w1, w2, topk_ids)
 
-        _, M, N, K, top_k = self.fused_experts.moe_problem_size(
-            a1q, w1, w2, topk_ids)
-
-        (workspace13_shape, workspace2_shape, fused_out_shape,
-         workspace_dtype) = self.fused_experts.workspace_shapes(
-             a1, a1q, M, N, K, top_k, global_num_experts, local_num_experts,
-             expert_tokens_meta)
+        (workspace13_shape, workspace2_shape, fused_out_shape, workspace_dtype) = (
+            self.fused_experts.workspace_shapes(
+                a1,
+                a1q,
+                M,
+                N,
+                K,
+                top_k,
+                global_num_experts,
+                local_num_experts,
+                expert_tokens_meta,
+            )
+        )
 
         # select per-ubatch buffers to avoid cross-ubatch reuse under DBO
         ubatch_idx = dbo_current_ubatch_id()
@@ -692,15 +718,16 @@ def _do_fused_experts(
 
         # We can reuse the memory between cache1 and cache3 because by the
         # time we need cache3, we're done with cache1.
-        workspace13 = buffers.workspace13.get(workspace13_shape,
-                                              device=a1.device,
-                                              dtype=workspace_dtype)
-        workspace2 = buffers.workspace2.get(workspace2_shape,
-                                            device=a1.device,
-                                            dtype=workspace_dtype)
+        workspace13 = buffers.workspace13.get(
+            workspace13_shape, device=a1.device, dtype=workspace_dtype
+        )
+        workspace2 = buffers.workspace2.get(
+            workspace2_shape, device=a1.device, dtype=workspace_dtype
+        )
 
         assert fused_out is None or fused_out.shape == fused_out_shape, (
-            f"fused_out {fused_out.shape} but expected {fused_out_shape}")
+            f"fused_out {fused_out.shape} but expected {fused_out_shape}"
+        )
         if fused_out is None:
             # reuse workspace13 for the output
             fused_out = _resize_cache(workspace13, fused_out_shape)
@@ -741,9 +768,7 @@ def _maybe_chunk_fused_experts(
         expert_tokens_meta: Optional[ExpertTokensMetadata],
         apply_router_weight_on_input: bool,
     ) -> torch.Tensor:
-
-        _, M, N, K, top_k = self.fused_experts.moe_problem_size(
-            a1q, w1, w2, topk_ids)
+        _, M, N, K, top_k = self.fused_experts.moe_problem_size(a1q, w1, w2, topk_ids)
 
         CHUNK_SIZE = envs.VLLM_FUSED_MOE_CHUNK_SIZE
         num_chunks = cdiv(M, CHUNK_SIZE)
@@ -775,18 +800,31 @@ def _maybe_chunk_fused_experts(
 
         # Construct the entire output that can then be processed in chunks.
         (_, _, fused_out_shape, _) = self.fused_experts.workspace_shapes(
-            a1, a1q, M, N, K, top_k, global_num_experts, local_num_experts,
-            expert_tokens_meta)
+            a1,
+            a1q,
+            M,
+            N,
+            K,
+            top_k,
+            global_num_experts,
+            local_num_experts,
+            expert_tokens_meta,
+        )
         ubatch_idx = dbo_current_ubatch_id()
         buffers = self.shared_buffers[ubatch_idx]
-        fused_out = buffers.fused_out.get(fused_out_shape,
-                                          device=a1q.device,
-                                          dtype=a1.dtype)
+        fused_out = buffers.fused_out.get(
+            fused_out_shape, device=a1q.device, dtype=a1.dtype
+        )
 
         def slice_input_tensors(
-            chunk_idx: int
-        ) -> tuple[torch.Tensor, Optional[torch.Tensor],
-                   Optional[torch.Tensor], torch.Tensor, torch.Tensor]:
+            chunk_idx: int,
+        ) -> tuple[
+            torch.Tensor,
+            Optional[torch.Tensor],
+            Optional[torch.Tensor],
+            torch.Tensor,
+            torch.Tensor,
+        ]:
             s = chunk_idx * CHUNK_SIZE
             e = min(s + CHUNK_SIZE, M)
             return (
@@ -799,7 +837,8 @@ def slice_input_tensors(
 
         def slice_output_tensor(chunk_idx: int) -> torch.Tensor:
             assert fused_out.size(0) % M == 0, (
-                f"fused_out shape {fused_out.shape} vs M {M}")
+                f"fused_out shape {fused_out.shape} vs M {M}"
+            )
             factor = fused_out.size(0) // M
             out_chunk_size = CHUNK_SIZE * factor
             s = chunk_idx * out_chunk_size
@@ -807,38 +846,45 @@ def slice_output_tensor(chunk_idx: int) -> torch.Tensor:
             return fused_out[s:e]
 
         def slice_expert_tokens_metadata(
-                full_expert_tokens_meta: ExpertTokensMetadata,
-                chunk_topk_ids: torch.Tensor, local_num_experts: int,
-                expert_map: Optional[torch.Tensor]) -> ExpertTokensMetadata:
+            full_expert_tokens_meta: ExpertTokensMetadata,
+            chunk_topk_ids: torch.Tensor,
+            local_num_experts: int,
+            expert_map: Optional[torch.Tensor],
+        ) -> ExpertTokensMetadata:
             # The existing expert_num_tokens is for the entire a1q
             # input. Chunking forces recomputation of the number
             # of tokens assigned to each expert.
             c_expert_num_tokens = count_expert_num_tokens(
-                chunk_topk_ids, local_num_experts, expert_map)
+                chunk_topk_ids, local_num_experts, expert_map
+            )
 
             c_expert_num_tokens_cpu = None
             need_expert_num_tokens_cpu = (
-                full_expert_tokens_meta.expert_num_tokens_cpu is not None)
+                full_expert_tokens_meta.expert_num_tokens_cpu is not None
+            )
             if need_expert_num_tokens_cpu:
                 # This is blocking as some implementations need the count
                 # on the CPU to determine appropriate input/out fused-moe
                 # buffers
                 c_expert_num_tokens_cpu = c_expert_num_tokens.to(
-                    "cpu", non_blocking=False)
+                    "cpu", non_blocking=False
+                )
 
             return ExpertTokensMetadata(
                 expert_num_tokens=c_expert_num_tokens,
-                expert_num_tokens_cpu=c_expert_num_tokens_cpu)
+                expert_num_tokens_cpu=c_expert_num_tokens_cpu,
+            )
 
         for chunk_idx in range(num_chunks):
             c_a1q, c_a1q_scale, c_a2_scale, c_topk_ids, c_topk_weights = (
-                slice_input_tensors(chunk_idx))
+                slice_input_tensors(chunk_idx)
+            )
 
             c_expert_tokens_meta = None
             if expert_tokens_meta is not None:
                 c_expert_tokens_meta = slice_expert_tokens_metadata(
-                    expert_tokens_meta, c_topk_ids, local_num_experts,
-                    expert_map)
+                    expert_tokens_meta, c_topk_ids, local_num_experts, expert_map
+                )
 
             self._do_fused_experts(
                 fused_out=slice_output_tensor(chunk_idx),
@@ -917,16 +963,21 @@ def forward(
             # TODO(lucas): enable in follow-up
             assert not dbo_enabled()
 
-            (a1q, a1q_scale, expert_tokens_meta, _expert_topk_ids,
-             _expert_topk_weights) = self.prepare_finalize.prepare(
-                 a1,
-                 topk_weights,
-                 topk_ids,
-                 global_num_experts,
-                 expert_map,
-                 apply_router_weight_on_input,
-                 self.fused_experts.quant_config,
-             )
+            (
+                a1q,
+                a1q_scale,
+                expert_tokens_meta,
+                _expert_topk_ids,
+                _expert_topk_weights,
+            ) = self.prepare_finalize.prepare(
+                a1,
+                topk_weights,
+                topk_ids,
+                global_num_experts,
+                expert_map,
+                apply_router_weight_on_input,
+                self.fused_experts.quant_config,
+            )
         else:
             # Overlap shared expert compute with all2all dispatch.
             dbo_maybe_run_recv_hook()
@@ -943,8 +994,9 @@ def forward(
             # TODO(lucas): refactor this in the alternative schedules followup
             # currently unpack if we have hook + receiver pair or just
             # receiver (see finalize_async docstring)
-            hook, receiver = prepare_ret \
-                if isinstance(prepare_ret, tuple) else (None, prepare_ret)
+            hook, receiver = (
+                prepare_ret if isinstance(prepare_ret, tuple) else (None, prepare_ret)
+            )
 
             if hook is not None:
                 if dbo_enabled():
@@ -956,13 +1008,19 @@ def forward(
                 else:
                     hook()
 
-            (a1q, a1q_scale, expert_tokens_meta, _expert_topk_ids,
-             _expert_topk_weights) = receiver()
+            (
+                a1q,
+                a1q_scale,
+                expert_tokens_meta,
+                _expert_topk_ids,
+                _expert_topk_weights,
+            ) = receiver()
 
         # Maybe prepare gathered topk_ids and topk_weights from other EP ranks.
         topk_ids = topk_ids if _expert_topk_ids is None else _expert_topk_ids
-        topk_weights = (topk_weights if _expert_topk_weights is None else
-                        _expert_topk_weights)
+        topk_weights = (
+            topk_weights if _expert_topk_weights is None else _expert_topk_weights
+        )
 
         fused_out = None
 
@@ -1022,8 +1080,11 @@ def forward(
             # TODO(lucas): refactor this in the alternative schedules followup
             # currently unpack if we have hook + receiver pair or just
             # receiver (see finalize_async docstring)
-            hook, receiver = finalize_ret \
-                if isinstance(finalize_ret, tuple) else (None, finalize_ret)
+            hook, receiver = (
+                finalize_ret
+                if isinstance(finalize_ret, tuple)
+                else (None, finalize_ret)
+            )
 
             if hook is not None:
                 if dbo_enabled():
diff --git a/vllm/model_executor/layers/fused_moe/moe_align_block_size.py b/vllm/model_executor/layers/fused_moe/moe_align_block_size.py
index c7d7126bab3a..9994088ca5d9 100644
--- a/vllm/model_executor/layers/fused_moe/moe_align_block_size.py
+++ b/vllm/model_executor/layers/fused_moe/moe_align_block_size.py
@@ -14,7 +14,7 @@ def moe_align_block_size(
     block_size: int,
     num_experts: int,
     expert_map: Optional[torch.Tensor] = None,
-    pad_sorted_ids: bool = False
+    pad_sorted_ids: bool = False,
 ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
     """
     Aligns the token distribution across experts to be compatible with block
@@ -68,19 +68,18 @@ def moe_align_block_size(
     max_num_tokens_padded = topk_ids.numel() + num_experts * (block_size - 1)
     if pad_sorted_ids:
         max_num_tokens_padded = round_up(max_num_tokens_padded, block_size)
-    sorted_ids = torch.empty((max_num_tokens_padded, ),
-                             dtype=torch.int32,
-                             device=topk_ids.device)
+    sorted_ids = torch.empty(
+        (max_num_tokens_padded,), dtype=torch.int32, device=topk_ids.device
+    )
     max_num_m_blocks = triton.cdiv(max_num_tokens_padded, block_size)
-    expert_ids = torch.empty((max_num_m_blocks, ),
-                             dtype=torch.int32,
-                             device=topk_ids.device)
-    num_tokens_post_pad = torch.empty((1),
-                                      dtype=torch.int32,
-                                      device=topk_ids.device)
+    expert_ids = torch.empty(
+        (max_num_m_blocks,), dtype=torch.int32, device=topk_ids.device
+    )
+    num_tokens_post_pad = torch.empty((1), dtype=torch.int32, device=topk_ids.device)
 
-    ops.moe_align_block_size(topk_ids, num_experts, block_size, sorted_ids,
-                             expert_ids, num_tokens_post_pad)
+    ops.moe_align_block_size(
+        topk_ids, num_experts, block_size, sorted_ids, expert_ids, num_tokens_post_pad
+    )
     if expert_map is not None:
         expert_ids = expert_map[expert_ids]
 
diff --git a/vllm/model_executor/layers/fused_moe/moe_pallas.py b/vllm/model_executor/layers/fused_moe/moe_pallas.py
index 23f618b1a5fd..66c00cf89873 100644
--- a/vllm/model_executor/layers/fused_moe/moe_pallas.py
+++ b/vllm/model_executor/layers/fused_moe/moe_pallas.py
@@ -7,18 +7,20 @@
 
 def _histogram(input: torch.Tensor, min: int, max: int) -> torch.Tensor:
     """
-  Compute the histogram of an int32 tensor. The bin edges are defined by the
-  min and max values, with step = 1.
-  """
+    Compute the histogram of an int32 tensor. The bin edges are defined by the
+    min and max values, with step = 1.
+    """
     assert input.dtype == torch.int32, "input must be of torch.int32 dtype."
     assert min <= max, "min must be less than or equal to max."
 
-    def searchsorted(sorted_sequence: torch.Tensor,
-                     values_to_search: torch.Tensor) -> torch.Tensor:
+    def searchsorted(
+        sorted_sequence: torch.Tensor, values_to_search: torch.Tensor
+    ) -> torch.Tensor:
         return (sorted_sequence.unsqueeze(1) == values_to_search).sum(dim=1)
 
-    bin_edges = torch.linspace(min, max, max - min + 1,
-                               dtype=input.dtype).to(input.device)
+    bin_edges = torch.linspace(min, max, max - min + 1, dtype=input.dtype).to(
+        input.device
+    )
     return searchsorted(bin_edges, input).to(torch.int32)
 
 
@@ -41,6 +43,7 @@ def fused_moe(
     """
     assert expert_map is None, "expert_map is not supported for pallas MoE."
     import torch_xla.experimental.custom_kernel  # noqa: F401
+
     orig_shape = hidden_states.shape
     hidden_size = hidden_states.shape[-1]
     num_tokens = hidden_states.shape[:-1].numel()
@@ -50,7 +53,8 @@ def fused_moe(
     dtype = hidden_states.dtype
     assert (num_tokens * topk) % 16 == 0, (
         "The Pallas GMM kernel requires num_tokens * topk to be a multiple of "
-        f"16 but got {num_tokens * topk}")
+        f"16 but got {num_tokens * topk}"
+    )
 
     hidden_states = hidden_states.view(num_tokens, hidden_size)
     gating_output = gating_output.view(num_tokens, num_experts)
@@ -63,8 +67,7 @@ def fused_moe(
     topk_indices = topk_indices.flatten()
     topk_argsort_indices = topk_indices.argsort()
     topk_argsort_revert_indices = topk_argsort_indices.argsort()
-    token_indices = torch.arange(num_tokens,
-                                 device=device).repeat_interleave(topk)
+    token_indices = torch.arange(num_tokens, device=device).repeat_interleave(topk)
     token_indices = token_indices[topk_argsort_indices]
     group_sizes = _histogram(topk_indices.to(torch.int32), 0, num_experts - 1)
 
diff --git a/vllm/model_executor/layers/fused_moe/moe_permute_unpermute.py b/vllm/model_executor/layers/fused_moe/moe_permute_unpermute.py
index 16a155e71847..698080f8aec6 100644
--- a/vllm/model_executor/layers/fused_moe/moe_permute_unpermute.py
+++ b/vllm/model_executor/layers/fused_moe/moe_permute_unpermute.py
@@ -6,7 +6,8 @@
 
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.fused_moe.moe_align_block_size import (
-    moe_align_block_size)
+    moe_align_block_size,
+)
 from vllm.model_executor.layers.fused_moe.utils import _fp8_perm
 
 
@@ -17,8 +18,9 @@ def _moe_permute(
     global_num_experts: int,
     expert_map: Optional[torch.Tensor],
     block_m: int,
-) -> tuple[torch.Tensor, Optional[torch.Tensor], torch.Tensor, torch.Tensor,
-           torch.Tensor]:
+) -> tuple[
+    torch.Tensor, Optional[torch.Tensor], torch.Tensor, torch.Tensor, torch.Tensor
+]:
     """
     Determine the sorted_token_ids, expert_ids for the given problem size.
     Permute the hidden states and scales according to `sorted_token_ids`.
@@ -27,12 +29,9 @@ def _moe_permute(
 
     tokens_in_chunk = curr_hidden_states.size(0)
 
-    sorted_token_ids, expert_ids, num_tokens_post_padded = (
-        moe_align_block_size(curr_topk_ids,
-                             block_m,
-                             global_num_experts,
-                             expert_map,
-                             pad_sorted_ids=True))
+    sorted_token_ids, expert_ids, num_tokens_post_padded = moe_align_block_size(
+        curr_topk_ids, block_m, global_num_experts, expert_map, pad_sorted_ids=True
+    )
 
     inv_perm: Optional[torch.Tensor] = None
 
@@ -43,14 +42,12 @@ def _moe_permute(
     # Permute according to sorted token ids.
     sorted_token_ids = sorted_token_ids.clamp(max=num_tokens - 1)
 
-    curr_hidden_states = _fp8_perm(curr_hidden_states,
-                                   sorted_token_ids // top_k_num)
+    curr_hidden_states = _fp8_perm(curr_hidden_states, sorted_token_ids // top_k_num)
 
     if a1q_scale is not None:
         a1q_scale = a1q_scale[sorted_token_ids // top_k_num]
 
-    return (curr_hidden_states, a1q_scale, sorted_token_ids, expert_ids,
-            inv_perm)
+    return (curr_hidden_states, a1q_scale, sorted_token_ids, expert_ids, inv_perm)
 
 
 def _moe_unpermute_and_reduce(
@@ -84,8 +81,9 @@ def moe_permute(
     align_block_size: Optional[int] = None,
     fill_invalid_expert: int = -1,
     permuted_hidden_states: Optional[torch.Tensor] = None,
-) -> tuple[torch.Tensor, Optional[torch.Tensor], torch.Tensor, torch.Tensor,
-           torch.Tensor]:
+) -> tuple[
+    torch.Tensor, Optional[torch.Tensor], torch.Tensor, torch.Tensor, torch.Tensor
+]:
     """
     This function expands and permutes activation to gather uncontinuous tokens
       for each expert.
@@ -117,13 +115,21 @@ def moe_permute(
     """
     n_token, n_hidden = hidden_states.size()
     topk = topk_ids.size(1)
-    assert (n_hidden * hidden_states.element_size()
-            ) % 16 == 0, "permue kernel need hidden dim align to 16B"
+    assert (n_hidden * hidden_states.element_size()) % 16 == 0, (
+        "permue kernel need hidden dim align to 16B"
+    )
     permuted_row_size = n_token * topk
     if align_block_size is not None:
-        permuted_row_size = (permuted_row_size + n_expert *
-                             (align_block_size - 1) + align_block_size -
-                             1) // align_block_size * align_block_size
+        permuted_row_size = (
+            (
+                permuted_row_size
+                + n_expert * (align_block_size - 1)
+                + align_block_size
+                - 1
+            )
+            // align_block_size
+            * align_block_size
+        )
     if n_local_expert == -1:
         n_local_expert = n_expert
     if permuted_hidden_states is None:
@@ -134,40 +140,57 @@ def moe_permute(
         )
     assert permuted_hidden_states.size() == (permuted_row_size, n_hidden), (
         f"Expected permuted hidden states to be {(permuted_row_size, n_hidden)}"
-        f" but got {permuted_hidden_states.size()}")
-
-    token_expert_indices = torch.arange(0,
-                                        n_token * topk,
-                                        dtype=torch.int32,
-                                        device=hidden_states.device).reshape(
-                                            (n_token, topk))
-
-    m_indices = torch.full((permuted_row_size, ),
-                           fill_invalid_expert,
-                           dtype=torch.int32,
-                           device=hidden_states.device)
-    expert_first_token_offset = torch.empty(n_local_expert + 1,
-                                            dtype=torch.int64,
-                                            device=hidden_states.device)
-    permuted_idx = torch.full((permuted_row_size, ),
-                              n_token * topk,
-                              dtype=torch.int32,
-                              device=hidden_states.device)
-    inv_permuted_idx = torch.empty((n_token, topk),
-                                   dtype=torch.int32,
-                                   device=hidden_states.device)
+        f" but got {permuted_hidden_states.size()}"
+    )
+
+    token_expert_indices = torch.arange(
+        0, n_token * topk, dtype=torch.int32, device=hidden_states.device
+    ).reshape((n_token, topk))
+
+    m_indices = torch.full(
+        (permuted_row_size,),
+        fill_invalid_expert,
+        dtype=torch.int32,
+        device=hidden_states.device,
+    )
+    expert_first_token_offset = torch.empty(
+        n_local_expert + 1, dtype=torch.int64, device=hidden_states.device
+    )
+    permuted_idx = torch.full(
+        (permuted_row_size,),
+        n_token * topk,
+        dtype=torch.int32,
+        device=hidden_states.device,
+    )
+    inv_permuted_idx = torch.empty(
+        (n_token, topk), dtype=torch.int32, device=hidden_states.device
+    )
     topk_ids = topk_ids.to(torch.int32)
-    torch.ops._moe_C.moe_permute(hidden_states, topk_ids, token_expert_indices,
-                                 expert_map, n_expert, n_local_expert, topk,
-                                 align_block_size, permuted_hidden_states,
-                                 expert_first_token_offset, inv_permuted_idx,
-                                 permuted_idx, m_indices)
+    torch.ops._moe_C.moe_permute(
+        hidden_states,
+        topk_ids,
+        token_expert_indices,
+        expert_map,
+        n_expert,
+        n_local_expert,
+        topk,
+        align_block_size,
+        permuted_hidden_states,
+        expert_first_token_offset,
+        inv_permuted_idx,
+        permuted_idx,
+        m_indices,
+    )
 
     if a1q_scale is not None and a1q_scale.dim() > 1:
-        a1q_scale = a1q_scale[permuted_idx.clamp(max=n_token * topk - 1) //
-                              topk]
-    return (permuted_hidden_states, a1q_scale, expert_first_token_offset,
-            inv_permuted_idx.flatten(), m_indices)
+        a1q_scale = a1q_scale[permuted_idx.clamp(max=n_token * topk - 1) // topk]
+    return (
+        permuted_hidden_states,
+        a1q_scale,
+        expert_first_token_offset,
+        inv_permuted_idx.flatten(),
+        m_indices,
+    )
 
 
 def moe_unpermute(
@@ -185,7 +208,7 @@ def moe_unpermute(
     - permuted_hidden_states (torch.Tensor): permuted activation.
     - topk_weights (torch.Tensor): topk expert route weight for each token.
     - inv_permuted_idx (torch.Tensor): row idx map for moe_unpermute.
-    - expert_first_token_offset (Optional[torch.Tensor]): offset of the first 
+    - expert_first_token_offset (Optional[torch.Tensor]): offset of the first
       token of each expert for grouped gemm.
     Returns:
     - hidden_states (torch.Tensor): The reduced and unpermuted activation
@@ -193,12 +216,18 @@ def moe_unpermute(
     """
     topk = topk_weights.size(1)
     n_hidden = permuted_hidden_states.size(-1)
-    assert (n_hidden * permuted_hidden_states.element_size()
-            ) % 16 == 0, "unpermue kernel need hidden dim align to 16B"
-
-    torch.ops._moe_C.moe_unpermute(permuted_hidden_states, topk_weights,
-                                   inv_permuted_idx, expert_first_token_offset,
-                                   topk, out)
+    assert (n_hidden * permuted_hidden_states.element_size()) % 16 == 0, (
+        "unpermue kernel need hidden dim align to 16B"
+    )
+
+    torch.ops._moe_C.moe_unpermute(
+        permuted_hidden_states,
+        topk_weights,
+        inv_permuted_idx,
+        expert_first_token_offset,
+        topk,
+        out,
+    )
 
 
 def moe_permute_unpermute_supported():
diff --git a/vllm/model_executor/layers/fused_moe/moe_torch_iterative.py b/vllm/model_executor/layers/fused_moe/moe_torch_iterative.py
index 6160da732951..f721d00d75ea 100644
--- a/vllm/model_executor/layers/fused_moe/moe_torch_iterative.py
+++ b/vllm/model_executor/layers/fused_moe/moe_torch_iterative.py
@@ -45,7 +45,7 @@ def fused_moe(
     for expert_idx in range(num_experts):
         expert_w1 = w1[expert_idx]
         expert_w2 = w2[expert_idx]
-        expert_mask = (selected_experts == expert_idx)
+        expert_mask = selected_experts == expert_idx
         expert_weights = (topk_weights * expert_mask).sum(dim=-1, keepdim=True)
         x = F.linear(hidden_states, expert_w1)
         gate = F.silu(x[:, :intermediate_size])
diff --git a/vllm/model_executor/layers/fused_moe/pplx_prepare_finalize.py b/vllm/model_executor/layers/fused_moe/pplx_prepare_finalize.py
index ddddd2a3b7a2..79212c2b689d 100644
--- a/vllm/model_executor/layers/fused_moe/pplx_prepare_finalize.py
+++ b/vllm/model_executor/layers/fused_moe/pplx_prepare_finalize.py
@@ -9,9 +9,12 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
-    TopKWeightAndReduceDelegate)
+    TopKWeightAndReduceDelegate,
+)
 from vllm.model_executor.layers.fused_moe.utils import (
-    _validate_scale_shape, moe_kernel_quantize_input)
+    _validate_scale_shape,
+    moe_kernel_quantize_input,
+)
 from vllm.utils import cdiv, round_up
 
 logger = init_logger(__name__)
@@ -60,7 +63,6 @@ def pplx_hidden_dim_scale_bytes(
 
 
 class PplxPrepareAndFinalize(mk.FusedMoEPrepareAndFinalize):
-
     def __init__(
         self,
         a2a: pplx.AllToAll,
@@ -113,8 +115,9 @@ def prepare_async(
         if expert_map is not None:
             logger.warning_once(
                 "The PPLX backend does not support expert mapping. "
-                "The provided `expert_map` will be ignored.")
-        expert_map = None  #noqa: F841
+                "The provided `expert_map` will be ignored."
+            )
+        expert_map = None  # noqa: F841
 
         # Is this always going to be a1.device?
         device = a1.device
@@ -123,21 +126,24 @@ def prepare_async(
             topk = topk_ids.size(1)
             # TODO: this only works for topK=1, will need to update for topK>1
             assert topk == 1, (
-                "apply_router_weight_on_input is only implemented for topk=1")
+                "apply_router_weight_on_input is only implemented for topk=1"
+            )
             a1 = a1 * topk_weights.to(a1.dtype)
 
         repeat_cols = 4
         repeat_rows = 1 if quant_config.per_act_token_quant else a1.size(0)
         # TODO(bnell): always pass quant_config.a1_scale?
         a1q, a1q_scale = moe_kernel_quantize_input(
-            a1, (None if quant_config.per_act_token_quant else
-                 quant_config.a1_scale),
+            a1,
+            (None if quant_config.per_act_token_quant else quant_config.a1_scale),
             quant_dtype=quant_config.quant_dtype,
             per_act_token_quant=quant_config.per_act_token_quant,
-            block_shape=quant_config.block_shape)
+            block_shape=quant_config.block_shape,
+        )
 
-        _validate_scale_shape(a1q, a1q_scale, quant_config.per_act_token_quant,
-                              quant_config.block_shape)
+        _validate_scale_shape(
+            a1q, a1q_scale, quant_config.per_act_token_quant, quant_config.block_shape
+        )
 
         orig_a_scale_block_shape: Optional[int] = None
 
@@ -155,8 +161,9 @@ def prepare_async(
                 # TODO (bnell): use group_broadcast instead?
                 a1q_scale = a1q_scale.repeat(repeat_rows, repeat_cols)
 
-        assert a1q_scale is None or a1q_scale.ndim == 2, \
+        assert a1q_scale is None or a1q_scale.ndim == 2, (
             f"{0 if a1q_scale is None else (a1q_scale.ndim, a1q_scale.shape)}"
+        )
 
         expert_num_tokens = torch.empty(
             self.num_local_experts,
@@ -165,8 +172,11 @@ def prepare_async(
         )
 
         expert_x = torch.empty(
-            (self.num_local_experts,
-             self.max_num_tokens * self.num_dispatchers(), hidden_dim),
+            (
+                self.num_local_experts,
+                self.max_num_tokens * self.num_dispatchers(),
+                hidden_dim,
+            ),
             dtype=a1q.dtype,
             device=device,
         )
@@ -182,14 +192,13 @@ def prepare_async(
             else:
                 # (M x K_tiles) -> (E x M x K_tiles)
                 assert quant_config.block_shape is not None
-                num_blocks = cdiv(expert_x.size(2),
-                                  quant_config.block_shape[1])
+                num_blocks = cdiv(expert_x.size(2), quant_config.block_shape[1])
                 final_dim = num_blocks
 
             expert_x_scale_shape = (
                 self.num_local_experts,
                 expert_x.size(1),
-                round_up(final_dim, 4)  # round up for alignment
+                round_up(final_dim, 4),  # round up for alignment
             )
 
             expert_x_scale = torch.empty(
@@ -226,12 +235,15 @@ def prepare_async(
             do_recv=True,
         )
 
-        return (hook, lambda: self._receiver(
-            expert_num_tokens,
-            expert_x,
-            expert_x_scale,
-            orig_a_scale_block_shape,
-        ))
+        return (
+            hook,
+            lambda: self._receiver(
+                expert_num_tokens,
+                expert_x,
+                expert_x_scale,
+                orig_a_scale_block_shape,
+            ),
+        )
 
     def _receiver(
         self,
@@ -240,13 +252,13 @@ def _receiver(
         expert_x_scale: Optional[torch.Tensor],
         orig_a_scale_block_shape: Optional[int],
     ) -> mk.PrepareResultType:
-
         if expert_x_scale is not None:
             expert_x_scale = expert_x_scale[:, :, :orig_a_scale_block_shape]
             assert expert_x_scale.ndim == 3
 
         expert_tokens_meta = mk.ExpertTokensMetadata(
-            expert_num_tokens=expert_num_tokens, expert_num_tokens_cpu=None)
+            expert_num_tokens=expert_num_tokens, expert_num_tokens_cpu=None
+        )
 
         return expert_x, expert_x_scale, expert_tokens_meta, None, None
 
@@ -281,22 +293,24 @@ def finalize_async(
         apply_router_weight_on_input: bool,
         weight_and_reduce_impl: mk.TopKWeightAndReduce,
     ) -> Callable:
-        assert isinstance(
-            weight_and_reduce_impl, TopKWeightAndReduceDelegate
-        ), ("Weight application and reduction happens in the combine kernel.")
+        assert isinstance(weight_and_reduce_impl, TopKWeightAndReduceDelegate), (
+            "Weight application and reduction happens in the combine kernel."
+        )
 
         # This argument is optional
         # There's not much point setting this unless it is != topk_ids.size(0)
         bound_m: Optional[torch.Tensor] = None
 
         # TODO (bnell): fails in test_pplx_moe.py, figure out what's going on
-        #num_tokens = output.size(0)  # M
-        #assert topk_ids.size(0) == num_tokens, (
+        # num_tokens = output.size(0)  # M
+        # assert topk_ids.size(0) == num_tokens, (
         #    f"{topk_ids.size(0)} == {num_tokens}")
         assert topk_ids.size() == topk_weights.size(), (
-            f"{topk_ids.size()} == {topk_weights.size()}")
+            f"{topk_ids.size()} == {topk_weights.size()}"
+        )
         assert output.size(0) <= self.max_num_tokens, (
-            f"{output.size(0)} <= {self.max_num_tokens}")
+            f"{output.size(0)} <= {self.max_num_tokens}"
+        )
         assert output.size(1) == fused_expert_output.size(-1)
 
         # Set weights to 1 if we did them in dispatch. This is hacky.
@@ -305,21 +319,25 @@ def finalize_async(
 
         topk_ids_u32 = topk_ids.view(dtype=torch.uint32)
 
-        self.a2a.combine(out_tokens=output,
-                         indices=topk_ids_u32,
-                         weights=topk_weights,
-                         expert_y=fused_expert_output,
-                         bound_m=bound_m,
-                         do_send=True,
-                         do_recv=False)
-
-        return lambda: self.a2a.combine(out_tokens=output,
-                                        indices=topk_ids_u32,
-                                        weights=topk_weights,
-                                        expert_y=fused_expert_output,
-                                        bound_m=bound_m,
-                                        do_send=False,
-                                        do_recv=True)
+        self.a2a.combine(
+            out_tokens=output,
+            indices=topk_ids_u32,
+            weights=topk_weights,
+            expert_y=fused_expert_output,
+            bound_m=bound_m,
+            do_send=True,
+            do_recv=False,
+        )
+
+        return lambda: self.a2a.combine(
+            out_tokens=output,
+            indices=topk_ids_u32,
+            weights=topk_weights,
+            expert_y=fused_expert_output,
+            bound_m=bound_m,
+            do_send=False,
+            do_recv=True,
+        )
 
     def finalize(
         self,
diff --git a/vllm/model_executor/layers/fused_moe/prepare_finalize.py b/vllm/model_executor/layers/fused_moe/prepare_finalize.py
index 588e5de865dd..be6939a3f62f 100644
--- a/vllm/model_executor/layers/fused_moe/prepare_finalize.py
+++ b/vllm/model_executor/layers/fused_moe/prepare_finalize.py
@@ -7,13 +7,13 @@
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
-    TopKWeightAndReduceContiguous, TopKWeightAndReduceDelegate)
-from vllm.model_executor.layers.fused_moe.utils import (
-    moe_kernel_quantize_input)
+    TopKWeightAndReduceContiguous,
+    TopKWeightAndReduceDelegate,
+)
+from vllm.model_executor.layers.fused_moe.utils import moe_kernel_quantize_input
 
 
 class MoEPrepareAndFinalizeNoEP(mk.FusedMoEPrepareAndFinalize):
-
     @property
     def activation_format(self) -> mk.FusedMoEActivationFormat:
         return mk.FusedMoEActivationFormat.Standard
@@ -37,17 +37,21 @@ def prepare(
         apply_router_weight_on_input: bool,
         quant_config: FusedMoEQuantConfig,
     ) -> mk.PrepareResultType:
-
         if apply_router_weight_on_input:
             topk = topk_ids.size(1)
             # TODO: this only works for topK=1, will need to update for topK>1
-            assert topk == 1, \
+            assert topk == 1, (
                 "apply_router_weight_on_input is only implemented for topk=1"
+            )
             a1.mul_(topk_weights.to(a1.dtype))
 
         a1q, a1q_scale = moe_kernel_quantize_input(
-            a1, quant_config.a1_scale, quant_config.quant_dtype,
-            quant_config.per_act_token_quant, quant_config.block_shape)
+            a1,
+            quant_config.a1_scale,
+            quant_config.quant_dtype,
+            quant_config.per_act_token_quant,
+            quant_config.block_shape,
+        )
 
         return a1q, a1q_scale, None, None, None
 
@@ -67,4 +71,5 @@ def finalize(
             fused_expert_output=fused_expert_output,
             topk_weights=topk_weights,
             topk_ids=topk_ids,
-            apply_router_weight_on_input=apply_router_weight_on_input)
+            apply_router_weight_on_input=apply_router_weight_on_input,
+        )
diff --git a/vllm/model_executor/layers/fused_moe/rocm_aiter_fused_moe.py b/vllm/model_executor/layers/fused_moe/rocm_aiter_fused_moe.py
index 2764af5fc532..f53db5f67166 100644
--- a/vllm/model_executor/layers/fused_moe/rocm_aiter_fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/rocm_aiter_fused_moe.py
@@ -8,7 +8,9 @@
 
 from vllm import envs
 from vllm.model_executor.layers.fused_moe.config import (
-    FUSED_MOE_UNQUANTIZED_CONFIG, FusedMoEQuantConfig)
+    FUSED_MOE_UNQUANTIZED_CONFIG,
+    FusedMoEQuantConfig,
+)
 from vllm.platforms import current_platform
 from vllm.utils import direct_register_custom_op
 
@@ -38,138 +40,162 @@ class ActivationMethod(IntEnum):
 
 @cache
 def is_rocm_aiter_moe_enabled() -> bool:
-    return current_platform.is_rocm() \
-        and envs.VLLM_ROCM_USE_AITER_MOE \
+    return (
+        current_platform.is_rocm()
+        and envs.VLLM_ROCM_USE_AITER_MOE
         and envs.VLLM_ROCM_USE_AITER
+    )
 
 
 def rocm_aiter_asm_moe_tkw1_impl(
-        hidden_states: torch.Tensor,
-        w1: torch.Tensor,
-        w2: torch.Tensor,
-        topk_weights: torch.Tensor,
-        topk_ids: torch.Tensor,
-        fc1_scale: Optional[torch.Tensor] = None,
-        fc2_scale: Optional[torch.Tensor] = None,
-        fc1_smooth_scale: Optional[torch.Tensor] = None,
-        fc2_smooth_scale: Optional[torch.Tensor] = None,
-        a16: bool = False,
-        per_tensor_quant_scale: Optional[torch.Tensor] = None,
-        expert_mask: Optional[torch.Tensor] = None,
-        activation_method: int = ActivationMethod.SILU.value) -> torch.Tensor:
-
+    hidden_states: torch.Tensor,
+    w1: torch.Tensor,
+    w2: torch.Tensor,
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    fc1_scale: Optional[torch.Tensor] = None,
+    fc2_scale: Optional[torch.Tensor] = None,
+    fc1_smooth_scale: Optional[torch.Tensor] = None,
+    fc2_smooth_scale: Optional[torch.Tensor] = None,
+    a16: bool = False,
+    per_tensor_quant_scale: Optional[torch.Tensor] = None,
+    expert_mask: Optional[torch.Tensor] = None,
+    activation_method: int = ActivationMethod.SILU.value,
+) -> torch.Tensor:
     from aiter import ActivationType
     from aiter.fused_moe_bf16_asm import asm_moe_tkw1
 
     activation = ActivationType(activation_method)
 
-    return asm_moe_tkw1(hidden_states,
-                        w1,
-                        w2,
-                        topk_weights,
-                        topk_ids,
-                        fc1_scale=fc1_scale,
-                        fc2_scale=fc2_scale,
-                        fc1_smooth_scale=fc1_smooth_scale,
-                        fc2_smooth_scale=fc2_smooth_scale,
-                        a16=a16,
-                        per_tensor_quant_scale=per_tensor_quant_scale,
-                        expert_mask=expert_mask,
-                        activation=activation)
+    return asm_moe_tkw1(
+        hidden_states,
+        w1,
+        w2,
+        topk_weights,
+        topk_ids,
+        fc1_scale=fc1_scale,
+        fc2_scale=fc2_scale,
+        fc1_smooth_scale=fc1_smooth_scale,
+        fc2_smooth_scale=fc2_smooth_scale,
+        a16=a16,
+        per_tensor_quant_scale=per_tensor_quant_scale,
+        expert_mask=expert_mask,
+        activation=activation,
+    )
 
 
 def rocm_aiter_asm_moe_tkw1_fake(
-        hidden_states: torch.Tensor,
-        w1: torch.Tensor,
-        w2: torch.Tensor,
-        topk_weights: torch.Tensor,
-        topk_ids: torch.Tensor,
-        fc1_scale: Optional[torch.Tensor] = None,
-        fc2_scale: Optional[torch.Tensor] = None,
-        fc1_smooth_scale: Optional[torch.Tensor] = None,
-        fc2_smooth_scale: Optional[torch.Tensor] = None,
-        a16: bool = False,
-        per_tensor_quant_scale: Optional[torch.Tensor] = None,
-        expert_mask: Optional[torch.Tensor] = None,
-        activation_method: int = ActivationMethod.SILU.value) -> torch.Tensor:
+    hidden_states: torch.Tensor,
+    w1: torch.Tensor,
+    w2: torch.Tensor,
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    fc1_scale: Optional[torch.Tensor] = None,
+    fc2_scale: Optional[torch.Tensor] = None,
+    fc1_smooth_scale: Optional[torch.Tensor] = None,
+    fc2_smooth_scale: Optional[torch.Tensor] = None,
+    a16: bool = False,
+    per_tensor_quant_scale: Optional[torch.Tensor] = None,
+    expert_mask: Optional[torch.Tensor] = None,
+    activation_method: int = ActivationMethod.SILU.value,
+) -> torch.Tensor:
     return torch.empty_like(hidden_states)
 
 
-def rocm_aiter_topk_softmax_impl(topk_weights: torch.Tensor,
-                                 topk_indices: torch.Tensor,
-                                 token_expert_indices: torch.Tensor,
-                                 gating_output: torch.Tensor,
-                                 renormalize: bool) -> None:
+def rocm_aiter_topk_softmax_impl(
+    topk_weights: torch.Tensor,
+    topk_indices: torch.Tensor,
+    token_expert_indices: torch.Tensor,
+    gating_output: torch.Tensor,
+    renormalize: bool,
+) -> None:
     from aiter import topk_softmax
-    topk_softmax(topk_weights, topk_indices, token_expert_indices,
-                 gating_output, renormalize)
+
+    topk_softmax(
+        topk_weights, topk_indices, token_expert_indices, gating_output, renormalize
+    )
 
 
-def rocm_aiter_topk_softmax_fake(topk_weights: torch.Tensor,
-                                 topk_indices: torch.Tensor,
-                                 token_expert_indices: torch.Tensor,
-                                 gating_output: torch.Tensor,
-                                 renormalize: bool) -> None:
+def rocm_aiter_topk_softmax_fake(
+    topk_weights: torch.Tensor,
+    topk_indices: torch.Tensor,
+    token_expert_indices: torch.Tensor,
+    gating_output: torch.Tensor,
+    renormalize: bool,
+) -> None:
     pass
 
 
 def rocm_aiter_biased_grouped_topk_impl(
-        gating_output: torch.Tensor,
-        correction_bias: torch.Tensor,
-        topk_weights: torch.Tensor,
-        topk_ids: torch.Tensor,
-        num_expert_group: int,
-        topk_group: int,
-        need_renorm: bool,
-        routed_scaling_factor: float = 1.0  # mul to topk_weights
+    gating_output: torch.Tensor,
+    correction_bias: torch.Tensor,
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    num_expert_group: int,
+    topk_group: int,
+    need_renorm: bool,
+    routed_scaling_factor: float = 1.0,  # mul to topk_weights
 ) -> None:
-
     from aiter import biased_grouped_topk
 
-    biased_grouped_topk(gating_output, correction_bias, topk_weights, topk_ids,
-                        num_expert_group, topk_group, need_renorm,
-                        routed_scaling_factor)
+    biased_grouped_topk(
+        gating_output,
+        correction_bias,
+        topk_weights,
+        topk_ids,
+        num_expert_group,
+        topk_group,
+        need_renorm,
+        routed_scaling_factor,
+    )
 
 
 def rocm_aiter_biased_grouped_topk_fake(
-        gating_output: torch.Tensor,
-        correction_bias: torch.Tensor,
-        topk_weights: torch.Tensor,
-        topk_ids: torch.Tensor,
-        num_expert_group: int,
-        topk_group: int,
-        need_renorm: bool,
-        routed_scaling_factor: float = 1.0  # mul to topk_weights
+    gating_output: torch.Tensor,
+    correction_bias: torch.Tensor,
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    num_expert_group: int,
+    topk_group: int,
+    need_renorm: bool,
+    routed_scaling_factor: float = 1.0,  # mul to topk_weights
 ) -> None:
     pass
 
 
 def rocm_aiter_grouped_topk_impl(
-        gating_output: torch.Tensor,
-        topk_weights: torch.Tensor,
-        topk_ids: torch.Tensor,
-        num_expert_group: int,
-        topk_group: int,
-        need_renorm: bool,
-        scoring_func: str = "softmax",
-        routed_scaling_factor: float = 1.0  # mul to topk_weights
+    gating_output: torch.Tensor,
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    num_expert_group: int,
+    topk_group: int,
+    need_renorm: bool,
+    scoring_func: str = "softmax",
+    routed_scaling_factor: float = 1.0,  # mul to topk_weights
 ) -> None:
-
     from aiter import grouped_topk
 
-    grouped_topk(gating_output, topk_weights, topk_ids, num_expert_group,
-                 topk_group, need_renorm, scoring_func, routed_scaling_factor)
+    grouped_topk(
+        gating_output,
+        topk_weights,
+        topk_ids,
+        num_expert_group,
+        topk_group,
+        need_renorm,
+        scoring_func,
+        routed_scaling_factor,
+    )
 
 
 def rocm_aiter_grouped_topk_fake(
-        gating_output: torch.Tensor,
-        topk_weights: torch.Tensor,
-        topk_ids: torch.Tensor,
-        num_expert_group: int,
-        topk_group: int,
-        need_renorm: bool,
-        scoring_func: str = "softmax",
-        routed_scaling_factor: float = 1.0  # mul to topk_weights
+    gating_output: torch.Tensor,
+    topk_weights: torch.Tensor,
+    topk_ids: torch.Tensor,
+    num_expert_group: int,
+    topk_group: int,
+    need_renorm: bool,
+    scoring_func: str = "softmax",
+    routed_scaling_factor: float = 1.0,  # mul to topk_weights
 ) -> None:
     pass
 
@@ -195,9 +221,21 @@ def rocm_aiter_fused_moe_impl(
     activation = ActivationType(activation_method)
     quant_type = QuantType(quant_method)
 
-    return fused_moe(hidden_states, w1, w2, topk_weight, topk_ids, expert_mask,
-                     activation, quant_type, doweight_stage1, w1_scale,
-                     w2_scale, a1_scale, a2_scale)
+    return fused_moe(
+        hidden_states,
+        w1,
+        w2,
+        topk_weight,
+        topk_ids,
+        expert_mask,
+        activation,
+        quant_type,
+        doweight_stage1,
+        w1_scale,
+        w2_scale,
+        a1_scale,
+        a2_scale,
+    )
 
 
 def rocm_aiter_fused_moe_fake(
@@ -219,7 +257,6 @@ def rocm_aiter_fused_moe_fake(
 
 
 if current_platform.is_rocm():
-
     direct_register_custom_op(
         op_name="rocm_aiter_asm_moe_tkw1",
         op_func=rocm_aiter_asm_moe_tkw1_impl,
@@ -263,14 +300,12 @@ def rocm_aiter_grouped_topk(
     topk_group: int = 0,
     scoring_func: str = "softmax",
     routed_scaling_factor: float = 1.0,
-    e_score_correction_bias: Optional[torch.Tensor] = None
+    e_score_correction_bias: Optional[torch.Tensor] = None,
 ) -> tuple[torch.Tensor, torch.Tensor]:
     token = hidden_states.shape[0]
     device = hidden_states.device
     topk_ids = torch.empty((token, topk), dtype=torch.int32, device=device)
-    topk_weights = torch.empty((token, topk),
-                               dtype=torch.float32,
-                               device=device)
+    topk_weights = torch.empty((token, topk), dtype=torch.float32, device=device)
 
     if e_score_correction_bias is not None:
         torch.ops.vllm.rocm_aiter_biased_grouped_topk(
@@ -283,7 +318,7 @@ def rocm_aiter_grouped_topk(
             renormalize,
         )
     else:
-        assert (scoring_func == "softmax" or scoring_func == "sigmoid")
+        assert scoring_func == "softmax" or scoring_func == "sigmoid"
         torch.ops.vllm.rocm_aiter_grouped_topk(
             gating_output,
             topk_weights,
@@ -313,8 +348,9 @@ def rocm_aiter_fused_experts(
     if quant_config is None:
         quant_config = FUSED_MOE_UNQUANTIZED_CONFIG
 
-    activation_method = (ActivationMethod.SILU
-                         if activation == "silu" else ActivationMethod.GELU)
+    activation_method = (
+        ActivationMethod.SILU if activation == "silu" else ActivationMethod.GELU
+    )
     # All AITER Fused MoE kernels are expecting the following datatypes
     topk_weights = topk_weights.to(torch.float32)
     topk_ids = topk_ids.to(torch.int32)
@@ -325,16 +361,20 @@ def rocm_aiter_fused_experts(
         expert_mask = None
 
     # w8a8 per-channel quantization
-    if (quant_config.per_act_token_quant and apply_router_weight_on_input
-            and quant_config.use_fp8_w8a8):
+    if (
+        quant_config.per_act_token_quant
+        and apply_router_weight_on_input
+        and quant_config.use_fp8_w8a8
+    ):
         # AITER tkw1 kernel for FP8 models with `apply_router_weight_on_input`
         # This applies topk_weights on the GEMM output of the first FC layer
         #  rather than the second FC.
-        assert (topk_weights.dim() == 2
-                ), "`topk_weights` should be in shape (num_tokens, topk)"
+        assert topk_weights.dim() == 2, (
+            "`topk_weights` should be in shape (num_tokens, topk)"
+        )
         assert topk_weights.shape[-1] == 1, (
-            "Only support topk=1 when"
-            " `apply_router_weight_on_input` is True")
+            "Only support topk=1 when `apply_router_weight_on_input` is True"
+        )
 
         return torch.ops.vllm.rocm_aiter_asm_moe_tkw1(
             hidden_states,
@@ -349,7 +389,8 @@ def rocm_aiter_fused_experts(
             a16=False,
             per_tensor_quant_scale=None,
             expert_mask=expert_mask,
-            activation_method=activation_method)
+            activation_method=activation_method,
+        )
 
     else:
         quant_method = QuantMethod.NO.value
@@ -358,7 +399,8 @@ def rocm_aiter_fused_experts(
         if quant_config.block_shape is not None and quant_config.use_fp8_w8a8:
             assert not apply_router_weight_on_input, (
                 "apply_router_weight_on_input is\
-                not supported for block scaled moe")
+                not supported for block scaled moe"
+            )
             assert quant_config.w1_scale is not None
             assert quant_config.w2_scale is not None
             quant_method = QuantMethod.BLOCK_128x128.value
@@ -367,12 +409,13 @@ def rocm_aiter_fused_experts(
             quant_method = QuantMethod.PER_TENSOR.value
 
         if apply_router_weight_on_input:
-            assert (topk_weights.dim() == 2
-                    ), "`topk_weights` should be in shape (num_tokens, topk)"
+            assert topk_weights.dim() == 2, (
+                "`topk_weights` should be in shape (num_tokens, topk)"
+            )
             _, topk = topk_weights.shape
-            assert (
-                topk == 1
-            ), "Only support topk=1 when `apply_router_weight_on_input` is True"
+            assert topk == 1, (
+                "Only support topk=1 when `apply_router_weight_on_input` is True"
+            )
 
         return torch.ops.vllm.rocm_aiter_fused_moe(
             hidden_states,
@@ -387,17 +430,20 @@ def rocm_aiter_fused_experts(
             w2_scale=quant_config.w2_scale,
             a1_scale=quant_config.a1_scale,
             a2_scale=quant_config.a2_scale,
-            doweight_stage1=apply_router_weight_on_input)
+            doweight_stage1=apply_router_weight_on_input,
+        )
 
 
-def rocm_aiter_topk_softmax(topk_weights: torch.Tensor,
-                            topk_indices: torch.Tensor,
-                            token_expert_indices: torch.Tensor,
-                            gating_output: torch.Tensor,
-                            renormalize: bool) -> tuple[torch.Tensor, ...]:
-    torch.ops.vllm.rocm_aiter_topk_softmax(topk_weights, topk_indices,
-                                           token_expert_indices, gating_output,
-                                           renormalize)
+def rocm_aiter_topk_softmax(
+    topk_weights: torch.Tensor,
+    topk_indices: torch.Tensor,
+    token_expert_indices: torch.Tensor,
+    gating_output: torch.Tensor,
+    renormalize: bool,
+) -> tuple[torch.Tensor, ...]:
+    torch.ops.vllm.rocm_aiter_topk_softmax(
+        topk_weights, topk_indices, token_expert_indices, gating_output, renormalize
+    )
     return topk_weights, topk_indices
 
 
@@ -413,7 +459,7 @@ def shuffle_weights(
 
     Args:
         *tensors: Variable number of torch.Tensor objects.
-        layout: A pair of integers specifying the block sizes used to divide 
+        layout: A pair of integers specifying the block sizes used to divide
             the tensors during shuffling. Default is (16, 16).
 
     Returns:
diff --git a/vllm/model_executor/layers/fused_moe/routing_simulator.py b/vllm/model_executor/layers/fused_moe/routing_simulator.py
index 8758a570b3c6..af20f4b7c1d2 100644
--- a/vllm/model_executor/layers/fused_moe/routing_simulator.py
+++ b/vllm/model_executor/layers/fused_moe/routing_simulator.py
@@ -50,9 +50,7 @@ class DistributionBasedRouting(RoutingStrategy):
     distributions for testing different routing patterns.
     """
 
-    def __init__(self,
-                 distribution: str = "uniform",
-                 **distribution_params: Any):
+    def __init__(self, distribution: str = "uniform", **distribution_params: Any):
         """
         Initialize distribution-based routing.
 
@@ -76,8 +74,10 @@ def _validate_distribution_params(self):
         valid_distributions = ["uniform", "normal"]
 
         if self.distribution not in valid_distributions:
-            raise ValueError(f"Unsupported distribution: {self.distribution}. "
-                             f"Supported distributions: {valid_distributions}")
+            raise ValueError(
+                f"Unsupported distribution: {self.distribution}. "
+                f"Supported distributions: {valid_distributions}"
+            )
 
         # Set default parameters if not provided
         if self.distribution == "normal":
@@ -112,12 +112,12 @@ def route_tokens(
             indices_type = torch.long
 
         # Generate expert IDs based on the specified distribution
-        topk_ids = self._sample_expert_ids(num_tokens, num_experts, top_k,
-                                           hidden_states.device, indices_type)
+        topk_ids = self._sample_expert_ids(
+            num_tokens, num_experts, top_k, hidden_states.device, indices_type
+        )
 
         # Generate weights based on the distribution
-        topk_weights = self._generate_weights(num_tokens, top_k,
-                                              hidden_states.device)
+        topk_weights = self._generate_weights(num_tokens, top_k, hidden_states.device)
 
         return topk_weights, topk_ids
 
@@ -145,7 +145,8 @@ def _sample_expert_ids(
             # For normal distribution, sample continuous values and map to
             # expert IDs
             continuous_samples = self._sample_continuous_distribution(
-                num_tokens, top_k, device)
+                num_tokens, top_k, device
+            )
 
             # Map continuous samples to expert indices
             # Normalize to [0, 1] range and scale to [0, num_experts)
@@ -158,8 +159,9 @@ def _sample_expert_ids(
         else:
             raise ValueError(f"Unsupported distribution: {self.distribution}")
 
-    def _sample_continuous_distribution(self, num_tokens: int, top_k: int,
-                                        device: torch.device) -> torch.Tensor:
+    def _sample_continuous_distribution(
+        self, num_tokens: int, top_k: int, device: torch.device
+    ) -> torch.Tensor:
         """Sample from continuous distributions."""
         shape = (num_tokens, top_k)
 
@@ -170,7 +172,8 @@ def _sample_continuous_distribution(self, num_tokens: int, top_k: int,
 
         else:
             raise ValueError(
-                f"Unsupported continuous distribution: {self.distribution}")
+                f"Unsupported continuous distribution: {self.distribution}"
+            )
 
     def _normalize_samples(self, samples: torch.Tensor) -> torch.Tensor:
         """Normalize samples to [0, 1] range."""
@@ -179,11 +182,13 @@ def _normalize_samples(self, samples: torch.Tensor) -> torch.Tensor:
             return torch.sigmoid(samples)
 
         else:
-            raise ValueError(f"Unsupported distribution for normalization: "
-                             f"{self.distribution}")
+            raise ValueError(
+                f"Unsupported distribution for normalization: {self.distribution}"
+            )
 
-    def _generate_weights(self, num_tokens: int, top_k: int,
-                          device: torch.device) -> torch.Tensor:
+    def _generate_weights(
+        self, num_tokens: int, top_k: int, device: torch.device
+    ) -> torch.Tensor:
         """Generate weights based on the distribution."""
         if self.distribution == "uniform":
             # All-ones weights for uniform distribution
@@ -197,7 +202,8 @@ def _generate_weights(self, num_tokens: int, top_k: int,
             # For normal distribution, generate weights from the same
             # distribution
             continuous_weights = self._sample_continuous_distribution(
-                num_tokens, top_k, device)
+                num_tokens, top_k, device
+            )
             # Normalize to positive values and sum to 1
             weights = torch.abs(continuous_weights)
             weights = weights / weights.sum(dim=-1, keepdim=True)
@@ -205,14 +211,14 @@ def _generate_weights(self, num_tokens: int, top_k: int,
 
         else:
             raise ValueError(
-                f"Unsupported distribution for weight generation: "
-                f"{self.distribution}")
+                f"Unsupported distribution for weight generation: {self.distribution}"
+            )
 
     def get_distribution_info(self) -> dict:
         """Get information about the current distribution configuration."""
         return {
             "distribution": self.distribution,
-            "parameters": self.distribution_params.copy()
+            "parameters": self.distribution_params.copy(),
         }
 
 
@@ -228,10 +234,12 @@ class RoutingSimulator:
     # Class-level registry of routing strategies
     _routing_strategies: dict[str, RoutingStrategy] = {
         # Basic routing strategies
-        "uniform_random":
-        DistributionBasedRouting(distribution="uniform", mean=0.0, std=1.0),
-        "normal_routing":
-        DistributionBasedRouting(distribution="normal", mean=0.0, std=1.0),
+        "uniform_random": DistributionBasedRouting(
+            distribution="uniform", mean=0.0, std=1.0
+        ),
+        "normal_routing": DistributionBasedRouting(
+            distribution="normal", mean=0.0, std=1.0
+        ),
     }
 
     @classmethod
@@ -280,7 +288,8 @@ def simulate_routing(
             raise ValueError(
                 f"Unknown routing strategy: {strategy_name}. "
                 f"Available strategies: "
-                f"{list(RoutingSimulator._routing_strategies.keys())}")
+                f"{list(RoutingSimulator._routing_strategies.keys())}"
+            )
 
         strategy = RoutingSimulator._routing_strategies[strategy_name]
         return strategy.route_tokens(
diff --git a/vllm/model_executor/layers/fused_moe/topk_weight_and_reduce.py b/vllm/model_executor/layers/fused_moe/topk_weight_and_reduce.py
index fb398eec119f..e725a0f00363 100644
--- a/vllm/model_executor/layers/fused_moe/topk_weight_and_reduce.py
+++ b/vllm/model_executor/layers/fused_moe/topk_weight_and_reduce.py
@@ -19,7 +19,7 @@ class TopKWeightAndReduceDelegate(mk.TopKWeightAndReduce):
     PplxPrepareAndFinalize and BatchedPrepareAndFinalize. PplxPrepareAndFinalize
     does the weight-application + reduction as part of the pplx combine kernel.
     But the BatchedPrepareAndFinalize needs an implementation. To facilitate
-    this case, the BatchedTritonExperts could use TopKWeightAndReduceDelegate 
+    this case, the BatchedTritonExperts could use TopKWeightAndReduceDelegate
     so the PrepareAndFinalize implementations could choose how to
     weight + reduce.
     """
@@ -27,12 +27,18 @@ class TopKWeightAndReduceDelegate(mk.TopKWeightAndReduce):
     def __eq__(self, other):
         return isinstance(other, TopKWeightAndReduceDelegate)
 
-    def apply(self, output: Optional[torch.Tensor],
-              fused_expert_output: torch.Tensor, topk_weights: torch.Tensor,
-              topk_ids: torch.Tensor,
-              apply_router_weight_on_input: bool) -> torch.Tensor:
-        raise RuntimeError("The caller is expected to choose an appropriate "
-                           "TopKWeightAndReduce implementation.")
+    def apply(
+        self,
+        output: Optional[torch.Tensor],
+        fused_expert_output: torch.Tensor,
+        topk_weights: torch.Tensor,
+        topk_ids: torch.Tensor,
+        apply_router_weight_on_input: bool,
+    ) -> torch.Tensor:
+        raise RuntimeError(
+            "The caller is expected to choose an appropriate "
+            "TopKWeightAndReduce implementation."
+        )
 
 
 class TopKWeightAndReduceNoOP(mk.TopKWeightAndReduce):
@@ -44,10 +50,14 @@ class TopKWeightAndReduceNoOP(mk.TopKWeightAndReduce):
     def __eq__(self, other):
         return isinstance(other, TopKWeightAndReduceNoOP)
 
-    def apply(self, output: Optional[torch.Tensor],
-              fused_expert_output: torch.Tensor, topk_weights: torch.Tensor,
-              topk_ids: torch.Tensor,
-              apply_router_weight_on_input: bool) -> torch.Tensor:
+    def apply(
+        self,
+        output: Optional[torch.Tensor],
+        fused_expert_output: torch.Tensor,
+        topk_weights: torch.Tensor,
+        topk_ids: torch.Tensor,
+        apply_router_weight_on_input: bool,
+    ) -> torch.Tensor:
         # Weight application and reduction operations are already done.
         if output is None:
             return fused_expert_output
@@ -57,7 +67,8 @@ def apply(self, output: Optional[torch.Tensor],
         assert output.size() == fused_expert_output.size(), (
             "output shape is expected to match the fused_expert_output shape. "
             f"But got output={output.size()}, "
-            f"used_expert_output={fused_expert_output.size()}")
+            f"used_expert_output={fused_expert_output.size()}"
+        )
         output.copy_(fused_expert_output, non_blocking=True)
         return output
 
@@ -71,11 +82,14 @@ class TopKWeightAndReduceContiguous(mk.TopKWeightAndReduce):
     def __eq__(self, other):
         return isinstance(other, TopKWeightAndReduceContiguous)
 
-    def apply(self, output: Optional[torch.Tensor],
-              fused_expert_output: torch.Tensor, topk_weights: torch.Tensor,
-              topk_ids: torch.Tensor,
-              apply_router_weight_on_input: bool) -> torch.Tensor:
-
+    def apply(
+        self,
+        output: Optional[torch.Tensor],
+        fused_expert_output: torch.Tensor,
+        topk_weights: torch.Tensor,
+        topk_ids: torch.Tensor,
+        apply_router_weight_on_input: bool,
+    ) -> torch.Tensor:
         m, num_topk = topk_ids.size()
         k = fused_expert_output.size(-1)
         if fused_expert_output.ndim == 2:
@@ -83,17 +97,21 @@ def apply(self, output: Optional[torch.Tensor],
 
         assert fused_expert_output.size() == (m, num_topk, k), (
             f"Expected fused_expert_output size {(m, num_topk, k)}. But got "
-            f"{fused_expert_output.size()}")
+            f"{fused_expert_output.size()}"
+        )
 
         if not apply_router_weight_on_input:
             fused_expert_output.mul_(topk_weights.view(m, -1, 1))
 
         if output is None:
-            output = torch.empty((m, k),
-                                 device=fused_expert_output.device,
-                                 dtype=fused_expert_output.dtype)
+            output = torch.empty(
+                (m, k),
+                device=fused_expert_output.device,
+                dtype=fused_expert_output.dtype,
+            )
         assert output.size() == (m, k), (
-            f"Expected output size {(m, k)}. But got {output.size()}")
+            f"Expected output size {(m, k)}. But got {output.size()}"
+        )
 
         ops.moe_sum(fused_expert_output, output)
         return output
@@ -109,27 +127,35 @@ def __init__(self, rank: int):
         self.rank = rank
 
     def __eq__(self, other):
-        return (isinstance(other, TopKWeightAndReduceNaiveBatched)
-                and (other.rank == self.rank))
-
-    def apply(self, output: Optional[torch.Tensor],
-              fused_expert_output: torch.Tensor, topk_weights: torch.Tensor,
-              topk_ids: torch.Tensor,
-              apply_router_weight_on_input: bool) -> torch.Tensor:
+        return isinstance(other, TopKWeightAndReduceNaiveBatched) and (
+            other.rank == self.rank
+        )
+
+    def apply(
+        self,
+        output: Optional[torch.Tensor],
+        fused_expert_output: torch.Tensor,
+        topk_weights: torch.Tensor,
+        topk_ids: torch.Tensor,
+        apply_router_weight_on_input: bool,
+    ) -> torch.Tensor:
         assert fused_expert_output.ndim == 3
         num_tokens = topk_ids.size(0)
         num_local_experts = fused_expert_output.size(0)
         K = fused_expert_output.size(-1)
 
         if output is None:
-            output = torch.zeros((num_tokens, K),
-                                 device=fused_expert_output.device,
-                                 dtype=fused_expert_output.dtype)
+            output = torch.zeros(
+                (num_tokens, K),
+                device=fused_expert_output.device,
+                dtype=fused_expert_output.dtype,
+            )
         else:
             output.fill_(0)
 
         assert output.size() == (num_tokens, K), (
-            f"Expected output size {(num_tokens, K)}, but got {output.size()}")
+            f"Expected output size {(num_tokens, K)}, but got {output.size()}"
+        )
 
         first_expert = num_local_experts * self.rank
         last_expert = first_expert + num_local_experts
diff --git a/vllm/model_executor/layers/fused_moe/triton_deep_gemm_moe.py b/vllm/model_executor/layers/fused_moe/triton_deep_gemm_moe.py
index 3de80ff85747..bb1c70dc3895 100644
--- a/vllm/model_executor/layers/fused_moe/triton_deep_gemm_moe.py
+++ b/vllm/model_executor/layers/fused_moe/triton_deep_gemm_moe.py
@@ -7,15 +7,16 @@
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.fused_moe.deep_gemm_moe import (
-    DeepGemmExperts, _valid_deep_gemm, _valid_deep_gemm_shape)
-from vllm.model_executor.layers.fused_moe.deep_gemm_utils import (
-    deep_gemm_block_shape)
+    DeepGemmExperts,
+    _valid_deep_gemm,
+    _valid_deep_gemm_shape,
+)
+from vllm.model_executor.layers.fused_moe.deep_gemm_utils import deep_gemm_block_shape
 from vllm.model_executor.layers.fused_moe.fused_moe import TritonExperts
 from vllm.utils.deep_gemm import is_deep_gemm_e8m0_used
 
 
 class TritonOrDeepGemmExperts(mk.FusedMoEPermuteExpertsUnpermute):
-
     def __init__(
         self,
         quant_config: FusedMoEQuantConfig,
@@ -25,33 +26,40 @@ def __init__(
 
         self.triton_expert = TritonExperts(quant_config)
 
-        self.allow_deep_gemm = (allow_deep_gemm
-                                and self.quant_config.use_fp8_w8a8 and
-                                self.block_shape == deep_gemm_block_shape())
+        self.allow_deep_gemm = (
+            allow_deep_gemm
+            and self.quant_config.use_fp8_w8a8
+            and self.block_shape == deep_gemm_block_shape()
+        )
 
-        self.deep_gemm_expert = DeepGemmExperts(
-            self.quant_config) if self.allow_deep_gemm else None
+        self.deep_gemm_expert = (
+            DeepGemmExperts(self.quant_config) if self.allow_deep_gemm else None
+        )
 
     @property
     def activation_formats(
-        self
+        self,
     ) -> tuple[mk.FusedMoEActivationFormat, mk.FusedMoEActivationFormat]:
-        assert (self.deep_gemm_expert is None
-                or self.triton_expert.activation_formats
-                == self.deep_gemm_expert.activation_formats)
+        assert (
+            self.deep_gemm_expert is None
+            or self.triton_expert.activation_formats
+            == self.deep_gemm_expert.activation_formats
+        )
         return self.triton_expert.activation_formats
 
     def supports_chunking(self) -> bool:
         dge = self.deep_gemm_expert
         te = self.triton_expert
-        return ((dge is None or dge.supports_chunking())
-                and (te is None or te.supports_chunking()))
+        return (dge is None or dge.supports_chunking()) and (
+            te is None or te.supports_chunking()
+        )
 
     def supports_expert_map(self) -> bool:
         dge = self.deep_gemm_expert
         te = self.triton_expert
-        return ((dge is None or dge.supports_expert_map())
-                and (te is None or te.supports_expert_map()))
+        return (dge is None or dge.supports_expert_map()) and (
+            te is None or te.supports_expert_map()
+        )
 
     def finalize_weight_and_reduce_impl(self) -> mk.TopKWeightAndReduce:
         dge = self.deep_gemm_expert
@@ -64,7 +72,8 @@ def finalize_weight_and_reduce_impl(self) -> mk.TopKWeightAndReduce:
         if is_dge_war and is_te_war:
             assert dge_war == te_war, (
                 "Both implementations should agree on WeightAndReduce impls. "
-                f"Got dge_war: {dge_war}, and te_war: {te_war}")
+                f"Got dge_war: {dge_war}, and te_war: {te_war}"
+            )
 
         if dge_war is not None:
             return dge_war
@@ -87,17 +96,33 @@ def workspace_shapes(
         # Note: the deep gemm workspaces are strictly larger than the triton
         # workspaces so we can be pessimistic here and allocate for DeepGemm
         # even if we fall back to triton later, e.g. if expert maps are set.
-        if self.allow_deep_gemm and (is_deep_gemm_e8m0_used()
-                                     or _valid_deep_gemm_shape(M, N, K)):
+        if self.allow_deep_gemm and (
+            is_deep_gemm_e8m0_used() or _valid_deep_gemm_shape(M, N, K)
+        ):
             assert self.deep_gemm_expert is not None
             return self.deep_gemm_expert.workspace_shapes(
-                a, aq, M, N, K, topk, global_num_experts, local_num_experts,
-                expert_tokens_meta)
+                a,
+                aq,
+                M,
+                N,
+                K,
+                topk,
+                global_num_experts,
+                local_num_experts,
+                expert_tokens_meta,
+            )
         else:
-            return self.triton_expert.workspace_shapes(a, aq, M, N, K, topk,
-                                                       global_num_experts,
-                                                       local_num_experts,
-                                                       expert_tokens_meta)
+            return self.triton_expert.workspace_shapes(
+                a,
+                aq,
+                M,
+                N,
+                K,
+                topk,
+                global_num_experts,
+                local_num_experts,
+                expert_tokens_meta,
+            )
 
     def apply(
         self,
@@ -117,9 +142,9 @@ def apply(
         expert_tokens_meta: Optional[mk.ExpertTokensMetadata],
         apply_router_weight_on_input: bool,
     ):
-        use_deep_gemm = (self.allow_deep_gemm
-                         and (_valid_deep_gemm(hidden_states, w1, w2)
-                              or is_deep_gemm_e8m0_used()))
+        use_deep_gemm = self.allow_deep_gemm and (
+            _valid_deep_gemm(hidden_states, w1, w2) or is_deep_gemm_e8m0_used()
+        )
 
         experts = self.deep_gemm_expert if use_deep_gemm else self.triton_expert
         assert experts is not None
diff --git a/vllm/model_executor/layers/fused_moe/trtllm_moe.py b/vllm/model_executor/layers/fused_moe/trtllm_moe.py
index 05ed93c942c8..8eb724a7435f 100644
--- a/vllm/model_executor/layers/fused_moe/trtllm_moe.py
+++ b/vllm/model_executor/layers/fused_moe/trtllm_moe.py
@@ -5,15 +5,17 @@
 import torch
 
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
-from vllm.model_executor.layers.fused_moe.config import (FusedMoEConfig,
-                                                         FusedMoEQuantConfig)
+from vllm.model_executor.layers.fused_moe.config import (
+    FusedMoEConfig,
+    FusedMoEQuantConfig,
+)
 from vllm.model_executor.layers.fused_moe.topk_weight_and_reduce import (
-    TopKWeightAndReduceNoOP)
+    TopKWeightAndReduceNoOP,
+)
 from vllm.utils import next_power_of_2
 
 
 class TrtLlmGenExperts(mk.FusedMoEPermuteExpertsUnpermute):
-
     def __init__(
         self,
         moe: FusedMoEConfig,
@@ -32,10 +34,12 @@ def __init__(
 
     @property
     def activation_formats(
-        self
+        self,
     ) -> tuple[mk.FusedMoEActivationFormat, mk.FusedMoEActivationFormat]:
-        return (mk.FusedMoEActivationFormat.Standard,
-                mk.FusedMoEActivationFormat.Standard)
+        return (
+            mk.FusedMoEActivationFormat.Standard,
+            mk.FusedMoEActivationFormat.Standard,
+        )
 
     def supports_chunking(self) -> bool:
         return True
@@ -66,8 +70,7 @@ def workspace_shapes(
         output = (M, K)
         return (workspace1, workspace2, output, a.dtype)
 
-    def _get_tile_tokens_dim(self, x: torch.Tensor, top_k: int,
-                             local_num_experts: int):
+    def _get_tile_tokens_dim(self, x: torch.Tensor, top_k: int, local_num_experts: int):
         # Number of tokens in the input tensor.
         num_tokens = x.shape[0]
         # Factor to account for the imbalance of the experts.
@@ -117,75 +120,49 @@ def apply(
         x_quant = hidden_states
         x_scale = a1q_scale
         if x_scale is not None:
-            x_scale = x_scale.view(torch.float8_e4m3fn).reshape(
-                *x_quant.shape[:-1], -1)
+            x_scale = x_scale.view(torch.float8_e4m3fn).reshape(*x_quant.shape[:-1], -1)
 
         packed_tensor = (topk_ids.to(torch.int32) << 16) | topk_weights.to(
-            torch.bfloat16).view(torch.int16)
+            torch.bfloat16
+        ).view(torch.int16)
 
         assert self.w1_scale is not None
         assert self.w2_scale is not None
         kwargs = {
-            "topk_ids":
-            packed_tensor,
-            "routing_bias":
-            None,
-            "hidden_states":
-            x_quant,
-            "hidden_states_scale":
-            x_scale,
-            "gemm1_weights":
-            w1,
-            "gemm1_weights_scale":
-            self.w1_scale,
-            "gemm1_bias":
-            self.w1_bias,
-            "gemm1_alpha":
-            self.gemm1_alpha,
-            "gemm1_beta":
-            self.gemm1_beta,
-            "gemm1_clamp_limit":
-            self.gemm1_clamp_limit,
-            "gemm2_weights":
-            w2,
-            "gemm2_weights_scale":
-            self.w2_scale,
-            "gemm2_bias":
-            self.w2_bias,
-            "output1_scale_scalar":
-            None,
-            "output1_scale_gate_scalar":
-            None,
-            "output2_scale_scalar":
-            None,
-            "num_experts":
-            global_num_experts,
-            "top_k":
-            topk,
-            "n_group":
-            None,
-            "topk_group":
-            None,
-            "intermediate_size":
-            intermediate_size,
-            "local_expert_offset":
-            local_expert_offset,
-            "local_num_experts":
-            local_num_experts,
-            "routed_scaling_factor":
-            None,
-            "tile_tokens_dim":
-            self._get_tile_tokens_dim(x_quant, topk, local_num_experts),
-            "routing_method_type":
-            1,
-            "do_finalize":
-            True,
-            "output":
-            output,
-            "tune_max_num_tokens":
-            self.max_capture_size,
+            "topk_ids": packed_tensor,
+            "routing_bias": None,
+            "hidden_states": x_quant,
+            "hidden_states_scale": x_scale,
+            "gemm1_weights": w1,
+            "gemm1_weights_scale": self.w1_scale,
+            "gemm1_bias": self.w1_bias,
+            "gemm1_alpha": self.gemm1_alpha,
+            "gemm1_beta": self.gemm1_beta,
+            "gemm1_clamp_limit": self.gemm1_clamp_limit,
+            "gemm2_weights": w2,
+            "gemm2_weights_scale": self.w2_scale,
+            "gemm2_bias": self.w2_bias,
+            "output1_scale_scalar": None,
+            "output1_scale_gate_scalar": None,
+            "output2_scale_scalar": None,
+            "num_experts": global_num_experts,
+            "top_k": topk,
+            "n_group": None,
+            "topk_group": None,
+            "intermediate_size": intermediate_size,
+            "local_expert_offset": local_expert_offset,
+            "local_num_experts": local_num_experts,
+            "routed_scaling_factor": None,
+            "tile_tokens_dim": self._get_tile_tokens_dim(
+                x_quant, topk, local_num_experts
+            ),
+            "routing_method_type": 1,
+            "do_finalize": True,
+            "output": output,
+            "tune_max_num_tokens": self.max_capture_size,
         }
 
         from flashinfer import trtllm_fp4_block_scale_routed_moe
+
         trtllm_fp4_block_scale_routed_moe(**kwargs)
         return output
diff --git a/vllm/model_executor/layers/fused_moe/utils.py b/vllm/model_executor/layers/fused_moe/utils.py
index 678942e568d8..8dc57e5d0ee4 100644
--- a/vllm/model_executor/layers/fused_moe/utils.py
+++ b/vllm/model_executor/layers/fused_moe/utils.py
@@ -7,13 +7,16 @@
 
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    per_token_group_quant_fp8)
+    per_token_group_quant_fp8,
+)
 from vllm.model_executor.layers.quantization.utils.int8_utils import (
-    per_token_group_quant_int8, per_token_quant_int8)
+    per_token_group_quant_int8,
+    per_token_quant_int8,
+)
 from vllm.model_executor.layers.quantization.utils.mxfp4_utils import (
-    quant_dequant_mxfp4)
-from vllm.model_executor.layers.quantization.utils.mxfp8_utils import (
-    mxfp8_quantize)
+    quant_dequant_mxfp4,
+)
+from vllm.model_executor.layers.quantization.utils.mxfp8_utils import mxfp8_quantize
 from vllm.platforms import current_platform
 from vllm.triton_utils import tl, triton
 from vllm.utils import cdiv
@@ -21,26 +24,28 @@
 
 
 @triton.jit
-def _count_expert_num_tokens(topk_ids_ptr, expert_num_tokens_ptr, num_experts,
-                             topk_numel, expert_map,
-                             HAS_EXPERT_MAP: tl.constexpr,
-                             BLOCK_SIZE: tl.constexpr):
-
+def _count_expert_num_tokens(
+    topk_ids_ptr,
+    expert_num_tokens_ptr,
+    num_experts,
+    topk_numel,
+    expert_map,
+    HAS_EXPERT_MAP: tl.constexpr,
+    BLOCK_SIZE: tl.constexpr,
+):
     curr_expert = tl.program_id(0)
 
     offsets = tl.arange(0, BLOCK_SIZE)
     topk_ids_ptrs = topk_ids_ptr + offsets
 
-    acc = tl.zeros((BLOCK_SIZE, ), dtype=tl.int32)
+    acc = tl.zeros((BLOCK_SIZE,), dtype=tl.int32)
     for x in range(tl.cdiv(topk_numel, BLOCK_SIZE)):
         mask = offsets < (topk_numel - x * BLOCK_SIZE)
         expert_ids = tl.load(topk_ids_ptrs, mask=mask, other=-1)
         if HAS_EXPERT_MAP:
             expert_map_ptrs = expert_map + expert_ids
             expert_map_mask = expert_ids >= 0
-            expert_ids = tl.load(expert_map_ptrs,
-                                 mask=expert_map_mask,
-                                 other=-1)
+            expert_ids = tl.load(expert_map_ptrs, mask=expert_map_mask, other=-1)
 
         has_curr_expert = tl.where(expert_ids == curr_expert, 1, 0)
         acc = acc + has_curr_expert
@@ -51,8 +56,8 @@ def _count_expert_num_tokens(topk_ids_ptr, expert_num_tokens_ptr, num_experts,
 
 
 def count_expert_num_tokens(
-        topk_ids: torch.Tensor, num_local_experts: int,
-        expert_map: Optional[torch.Tensor]) -> torch.Tensor:
+    topk_ids: torch.Tensor, num_local_experts: int, expert_map: Optional[torch.Tensor]
+) -> torch.Tensor:
     """
     Count the number to tokens assigned to each expert.
 
@@ -68,17 +73,16 @@ def count_expert_num_tokens(
     A tensor of size num_local_experts, where tensor[i] holds the number
     of tokens assigned to the ith expert.
     """
-    assert topk_ids.dtype.is_signed, (
-        "The kernel uses -1 to represent invalid topk_ids")
-    expert_num_tokens = torch.empty((num_local_experts),
-                                    device=topk_ids.device,
-                                    dtype=torch.int32)
+    assert topk_ids.dtype.is_signed, "The kernel uses -1 to represent invalid topk_ids"
+    expert_num_tokens = torch.empty(
+        (num_local_experts), device=topk_ids.device, dtype=torch.int32
+    )
 
     grid = num_local_experts
     BLOCK_SIZE = min(topk_ids.numel(), 1024)
     BLOCK_SIZE = triton.next_power_of_2(BLOCK_SIZE)
 
-    _count_expert_num_tokens[(grid, )](
+    _count_expert_num_tokens[(grid,)](
         topk_ids,
         expert_num_tokens,
         num_local_experts,
@@ -96,9 +100,10 @@ def _resize_cache(x: torch.Tensor, v: tuple[int, ...]) -> torch.Tensor:
     Shrink the given tensor and apply the given view to it.  This is
     used to resize the intermediate fused_moe caches.
     """
-    assert prod(v) <= x.numel(
-    ), f"{v} ({prod(v)}) <= {x.shape} ({x.numel()})"  # CUDAGRAPH unfriendly?
-    return x.flatten()[:prod(v)].view(*v)
+    assert prod(v) <= x.numel(), (
+        f"{v} ({prod(v)}) <= {x.shape} ({x.numel()})"
+    )  # CUDAGRAPH unfriendly?
+    return x.flatten()[: prod(v)].view(*v)
 
 
 def _fp4_quantize(
@@ -106,9 +111,7 @@ def _fp4_quantize(
     A_scale: Optional[torch.Tensor],
     is_sf_swizzled_layout: bool,
 ) -> tuple[torch.Tensor, torch.Tensor]:
-    return fp4_quantize(A,
-                        A_scale,
-                        is_sf_swizzled_layout=is_sf_swizzled_layout)
+    return fp4_quantize(A, A_scale, is_sf_swizzled_layout=is_sf_swizzled_layout)
 
 
 def _fp8_quantize(
@@ -125,7 +128,8 @@ def _fp8_quantize(
         # TODO(luka): use QuantFP8 custom op
         #  https://github.com/vllm-project/vllm/issues/20711
         A, A_scale = ops.scaled_fp8_quant(
-            A, A_scale, use_per_token_if_dynamic=per_act_token)
+            A, A_scale, use_per_token_if_dynamic=per_act_token
+        )
     else:
         assert not per_act_token
         assert len(block_shape) == 2
@@ -151,8 +155,7 @@ def _int8_quantize(
     # activations apply per-token quantization. Otherwise, assume
     # activation tensor-wise fp8/int8 quantization, dynamic or static
     if block_shape is None:
-        assert per_act_token, \
-            "int8 quantization only supports block or channel-wise"
+        assert per_act_token, "int8 quantization only supports block or channel-wise"
         A, A_scale = per_token_quant_int8(A)
     else:
         assert not per_act_token
@@ -204,9 +207,7 @@ def moe_kernel_quantize_input(
     elif quant_dtype == torch.int8:
         return _int8_quantize(A, A_scale, per_act_token_quant, block_shape)
     elif quant_dtype == "nvfp4":
-        return _fp4_quantize(A,
-                             A_scale,
-                             is_sf_swizzled_layout=is_fp4_scale_swizzled)
+        return _fp4_quantize(A, A_scale, is_sf_swizzled_layout=is_fp4_scale_swizzled)
     elif quant_dtype == "mxfp4":
         return _mxfp4_quantize(A, A_scale, per_act_token_quant, block_shape)
     elif quant_dtype == "mxfp8":
@@ -225,8 +226,7 @@ def _fp8_perm(m: torch.Tensor, idx: torch.Tensor) -> torch.Tensor:
         return m[idx, ...]
 
 
-def normalize_scales_shape(
-        scales: Optional[torch.Tensor]) -> Optional[torch.Tensor]:
+def normalize_scales_shape(scales: Optional[torch.Tensor]) -> Optional[torch.Tensor]:
     if scales is not None:
         if scales.numel() == 1:
             scales = scales.view(1, 1)
@@ -242,8 +242,9 @@ def normalize_batched_scales_shape(
     if scales is not None and scales.ndim < 3:
         if scales.numel() == 1:
             scales = scales.view(1)
-            scales = torch.repeat_interleave(scales, num_experts,
-                                             dim=0).view(num_experts, 1, 1)
+            scales = torch.repeat_interleave(scales, num_experts, dim=0).view(
+                num_experts, 1, 1
+            )
         else:
             scales = scales.view(num_experts, -1, scales.size(-1))
 
@@ -263,7 +264,8 @@ def _validate_scale_shape(
         assert a_scale.numel() == 1, f"{a_scale.shape}"
     elif per_act_token_quant:
         assert a_scale.shape[0] == a.shape[0] and a_scale.shape[1] == 1, (
-            f"{a_scale.shape[0]} == {a.shape[0]} and {a_scale.shape[1]} == 1")
+            f"{a_scale.shape[0]} == {a.shape[0]} and {a_scale.shape[1]} == 1"
+        )
     else:
         assert block_shape is not None
         expected = (a.shape[0], cdiv(a.shape[1], block_shape[1]))
diff --git a/vllm/model_executor/layers/layernorm.py b/vllm/model_executor/layers/layernorm.py
index 363245daa89d..0797e940ac0a 100644
--- a/vllm/model_executor/layers/layernorm.py
+++ b/vllm/model_executor/layers/layernorm.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Custom normalization layers."""
+
 from typing import Optional, Union
 
 import torch
@@ -14,13 +15,14 @@
 
 
 def is_rocm_aiter_rmsnorm_enabled() -> bool:
-    return envs.VLLM_ROCM_USE_AITER_RMSNORM \
-        and envs.VLLM_ROCM_USE_AITER
+    return envs.VLLM_ROCM_USE_AITER_RMSNORM and envs.VLLM_ROCM_USE_AITER
 
 
-def rms_norm(x: torch.Tensor, weight: torch.Tensor,
-             variance_epsilon: float) -> torch.Tensor:
+def rms_norm(
+    x: torch.Tensor, weight: torch.Tensor, variance_epsilon: float
+) -> torch.Tensor:
     from vllm import _custom_ops as ops
+
     out = torch.empty_like(x)
     ops.rms_norm(
         out,
@@ -32,9 +34,13 @@ def rms_norm(x: torch.Tensor, weight: torch.Tensor,
 
 
 def fused_add_rms_norm(
-        x: torch.Tensor, residual: torch.Tensor, weight: torch.Tensor,
-        variance_epsilon: float) -> tuple[torch.Tensor, torch.Tensor]:
+    x: torch.Tensor,
+    residual: torch.Tensor,
+    weight: torch.Tensor,
+    variance_epsilon: float,
+) -> tuple[torch.Tensor, torch.Tensor]:
     from vllm import _custom_ops as ops
+
     ops.fused_add_rms_norm(
         x,
         residual,
@@ -44,9 +50,11 @@ def fused_add_rms_norm(
     return x, residual
 
 
-def poly_norm(x: torch.Tensor, weight: torch.Tensor, bias: torch.Tensor,
-              variance_epsilon: float) -> torch.Tensor:
+def poly_norm(
+    x: torch.Tensor, weight: torch.Tensor, bias: torch.Tensor, variance_epsilon: float
+) -> torch.Tensor:
     from vllm import _custom_ops as ops
+
     out = torch.empty_like(x)
     ops.poly_norm(
         out,
@@ -58,9 +66,11 @@ def poly_norm(x: torch.Tensor, weight: torch.Tensor, bias: torch.Tensor,
     return out
 
 
-def rocm_aiter_rms_norm_impl(x: torch.Tensor, weight: torch.Tensor,
-                             variance_epsilon: float) -> torch.Tensor:
+def rocm_aiter_rms_norm_impl(
+    x: torch.Tensor, weight: torch.Tensor, variance_epsilon: float
+) -> torch.Tensor:
     import aiter as rocm_aiter
+
     if x.dim() > 2:
         x_original_shape = x.shape
         x = x.reshape(-1, x_original_shape[-1])
@@ -71,9 +81,11 @@ def rocm_aiter_rms_norm_impl(x: torch.Tensor, weight: torch.Tensor,
 
 
 def rocm_aiter_rmsnorm2d_fwd_with_add_impl(
-        x: torch.Tensor, residual: torch.Tensor, weight: torch.Tensor,
-        variance_epsilon: float) -> tuple[torch.Tensor, torch.Tensor]:
-
+    x: torch.Tensor,
+    residual: torch.Tensor,
+    weight: torch.Tensor,
+    variance_epsilon: float,
+) -> tuple[torch.Tensor, torch.Tensor]:
     import aiter as rocm_aiter
 
     residual_out = torch.empty_like(residual)
@@ -89,14 +101,18 @@ def rocm_aiter_rmsnorm2d_fwd_with_add_impl(
     return output, residual_out
 
 
-def rocm_aiter_rms_norm_fake(x: torch.Tensor, weight: torch.Tensor,
-                             variance_epsilon: float) -> torch.Tensor:
+def rocm_aiter_rms_norm_fake(
+    x: torch.Tensor, weight: torch.Tensor, variance_epsilon: float
+) -> torch.Tensor:
     return torch.empty_like(x)
 
 
 def rocm_aiter_rmsnorm2d_fwd_with_add_fake(
-        x: torch.Tensor, residual: torch.Tensor, weight: torch.Tensor,
-        variance_epsilon: float) -> tuple[torch.Tensor, torch.Tensor]:
+    x: torch.Tensor,
+    residual: torch.Tensor,
+    weight: torch.Tensor,
+    variance_epsilon: float,
+) -> tuple[torch.Tensor, torch.Tensor]:
     return torch.empty_like(x), torch.empty_like(residual)
 
 
@@ -116,7 +132,8 @@ def rocm_aiter_rmsnorm2d_fwd_with_add_fake(
 
 def dispatch_rocm_rmsnorm_func(with_fused_add: bool, dtype: torch.dtype):
     use_aiter = is_rocm_aiter_rmsnorm_enabled() and dtype in [
-        torch.float16, torch.bfloat16
+        torch.float16,
+        torch.bfloat16,
     ]
 
     if use_aiter and with_fused_add:
@@ -150,8 +167,9 @@ def __init__(
 
         self.hidden_size = hidden_size
         self.variance_epsilon = eps
-        self.variance_size_override = (None if var_hidden_size == hidden_size
-                                       else var_hidden_size)
+        self.variance_size_override = (
+            None if var_hidden_size == hidden_size else var_hidden_size
+        )
         self.has_weight = has_weight
         if dtype is not None:
             self.weight = torch.ones(hidden_size, dtype=dtype)
@@ -163,9 +181,11 @@ def __init__(
 
         if current_platform.is_rocm():
             self.rocm_norm_func = dispatch_rocm_rmsnorm_func(
-                with_fused_add=False, dtype=weight_dtype)
+                with_fused_add=False, dtype=weight_dtype
+            )
             self.rocm_norm_func_with_add = dispatch_rocm_rmsnorm_func(
-                with_fused_add=True, dtype=weight_dtype)
+                with_fused_add=True, dtype=weight_dtype
+            )
 
     def forward_native(
         self,
@@ -181,8 +201,10 @@ def forward_native(
 
         hidden_size = x.shape[-1]
         if hidden_size != self.hidden_size:
-            raise ValueError("Expected hidden_size to be "
-                             f"{self.hidden_size}, but found: {hidden_size}")
+            raise ValueError(
+                "Expected hidden_size to be "
+                f"{self.hidden_size}, but found: {hidden_size}"
+            )
 
         if self.variance_size_override is None:
             x_var = x
@@ -190,9 +212,10 @@ def forward_native(
             if hidden_size < self.variance_size_override:
                 raise ValueError(
                     "Expected hidden_size to be at least "
-                    f"{self.variance_size_override}, but found: {hidden_size}")
+                    f"{self.variance_size_override}, but found: {hidden_size}"
+                )
 
-            x_var = x[:, :, :self.variance_size_override]
+            x_var = x[:, :, : self.variance_size_override]
 
         variance = x_var.pow(2).mean(dim=-1, keepdim=True)
 
@@ -215,8 +238,9 @@ def forward_cuda(
 
         add_residual = residual is not None
         if add_residual:
-            return fused_add_rms_norm(x, residual, self.weight.data,
-                                      self.variance_epsilon)
+            return fused_add_rms_norm(
+                x, residual, self.weight.data, self.variance_epsilon
+            )
         else:
             return rms_norm(x, self.weight.data, self.variance_epsilon)
 
@@ -230,11 +254,11 @@ def forward_hip(
 
         add_residual = residual is not None
         if add_residual:
-            return self.rocm_norm_func_with_add(x, residual, self.weight.data,
-                                                self.variance_epsilon)
+            return self.rocm_norm_func_with_add(
+                x, residual, self.weight.data, self.variance_epsilon
+            )
         else:
-            return self.rocm_norm_func(x, self.weight.data,
-                                       self.variance_epsilon)
+            return self.rocm_norm_func(x, self.weight.data, self.variance_epsilon)
 
     def forward_xpu(
         self,
@@ -315,8 +339,7 @@ def forward_native(
         residual: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, tuple[torch.Tensor, torch.Tensor]]:
         """PyTorch-native implementation equivalent to forward()."""
-        return self.forward_static(self.weight.data, self.variance_epsilon, x,
-                                   residual)
+        return self.forward_static(self.weight.data, self.variance_epsilon, x, residual)
 
     def forward_cuda(
         self,
@@ -328,7 +351,8 @@ def forward_cuda(
 
         if not getattr(self, "_is_compiled", False):
             self.forward_static = torch.compile(  # type: ignore
-                self.forward_static)
+                self.forward_static
+            )
             self._is_compiled = True
         return self.forward_native(x, residual)
 
@@ -352,8 +376,7 @@ def __init__(
         self.variance_epsilon = eps
 
     def _norm(self, x):
-        return x / torch.sqrt(
-            x.pow(2).mean(-1, keepdim=True) + self.variance_epsilon)
+        return x / torch.sqrt(x.pow(2).mean(-1, keepdim=True) + self.variance_epsilon)
 
     def forward_native(
         self,
@@ -366,9 +389,12 @@ def forward_native(
 
         orig_dtype = x.dtype
         x_float = x.to(torch.float32)
-        output = (self.weight[0] * self._norm(x_float**3) +
-                  self.weight[1] * self._norm(x_float**2) +
-                  self.weight[2] * self._norm(x_float) + self.bias)
+        output = (
+            self.weight[0] * self._norm(x_float**3)
+            + self.weight[1] * self._norm(x_float**2)
+            + self.weight[2] * self._norm(x_float)
+            + self.bias
+        )
         return output.to(orig_dtype)
 
     def forward_cuda(
@@ -391,5 +417,6 @@ def __init__(self, dim: int, eps: float = 1e-6):
         self.bias = nn.Parameter(torch.zeros(dim, dtype=torch.float32))
 
     def forward(self, x: torch.Tensor):
-        return F.layer_norm(x.float(), (self.dim, ), self.weight, self.bias,
-                            self.eps).type_as(x)
+        return F.layer_norm(
+            x.float(), (self.dim,), self.weight, self.bias, self.eps
+        ).type_as(x)
diff --git a/vllm/model_executor/layers/lightning_attn.py b/vllm/model_executor/layers/lightning_attn.py
index 0b87acc85120..1fcf9a7c5c5b 100644
--- a/vllm/model_executor/layers/lightning_attn.py
+++ b/vllm/model_executor/layers/lightning_attn.py
@@ -9,9 +9,21 @@
 
 
 @triton.jit
-def _fwd_diag_kernel(Q, K, V, Out, S, b: tl.constexpr, h: tl.constexpr, n,
-                     d: tl.constexpr, e: tl.constexpr, BLOCK: tl.constexpr,
-                     NUM_BLOCK, CBLOCK: tl.constexpr):
+def _fwd_diag_kernel(
+    Q,
+    K,
+    V,
+    Out,
+    S,
+    b: tl.constexpr,
+    h: tl.constexpr,
+    n,
+    d: tl.constexpr,
+    e: tl.constexpr,
+    BLOCK: tl.constexpr,
+    NUM_BLOCK,
+    CBLOCK: tl.constexpr,
+):
     # This kernel computes the diagonal blocks of the attention matrix
     # Each diagonal block represents attention
     # where queries attend to keys in the same block
@@ -39,18 +51,36 @@ def _fwd_diag_kernel(Q, K, V, Out, S, b: tl.constexpr, h: tl.constexpr, n,
     o_cblock_offset = cblock_offset * e
 
     # Calculate pointers to the query, key, value, and output tensors
-    Q_block_ptr = (Q + qk_offset + qk_block_offset + q_cblock_offset +
-                   tl.arange(0, CBLOCK)[:, None] * d +
-                   tl.arange(0, d)[None, :])
-    K_trans_block_ptr = (K + qk_offset + qk_block_offset +
-                         tl.arange(0, CBLOCK)[None, :] * d +
-                         tl.arange(0, d)[:, None])
-    V_block_ptr = (V + v_offset + v_block_offset +
-                   tl.arange(0, CBLOCK)[:, None] * e +
-                   tl.arange(0, e)[None, :])
-    O_block_ptr = (Out + o_offset + o_block_offset + o_cblock_offset +
-                   tl.arange(0, CBLOCK)[:, None] * e +
-                   tl.arange(0, e)[None, :])
+    Q_block_ptr = (
+        Q
+        + qk_offset
+        + qk_block_offset
+        + q_cblock_offset
+        + tl.arange(0, CBLOCK)[:, None] * d
+        + tl.arange(0, d)[None, :]
+    )
+    K_trans_block_ptr = (
+        K
+        + qk_offset
+        + qk_block_offset
+        + tl.arange(0, CBLOCK)[None, :] * d
+        + tl.arange(0, d)[:, None]
+    )
+    V_block_ptr = (
+        V
+        + v_offset
+        + v_block_offset
+        + tl.arange(0, CBLOCK)[:, None] * e
+        + tl.arange(0, e)[None, :]
+    )
+    O_block_ptr = (
+        Out
+        + o_offset
+        + o_block_offset
+        + o_cblock_offset
+        + tl.arange(0, CBLOCK)[:, None] * e
+        + tl.arange(0, e)[None, :]
+    )
 
     # Load the decay rate for the current head
     S_block_ptr = S + off_h
@@ -60,9 +90,9 @@ def _fwd_diag_kernel(Q, K, V, Out, S, b: tl.constexpr, h: tl.constexpr, n,
     q_index = tl.arange(0, CBLOCK) + i * CBLOCK
 
     # Load query values
-    q = tl.load(Q_block_ptr,
-                mask=block_offset + q_index[:, None] < n,
-                other=0.0).to(tl.float32)
+    q = tl.load(Q_block_ptr, mask=block_offset + q_index[:, None] < n, other=0.0).to(
+        tl.float32
+    )
 
     # Initialize output accumulator
     qkv = tl.zeros([CBLOCK, e], dtype=tl.float32)
@@ -146,18 +176,30 @@ def _fwd_kv_parallel(
     kv_offset = off_bh * NUM_BLOCK * d * e
 
     # Calculate pointers to the key, value, and key-value tensors
-    K_trans_block_ptr = (K + k_offset + k_block_offset +
-                         tl.arange(0, CBLOCK)[None, :] * d +
-                         tl.arange(0, D_FBLOCK)[:, None])
-    V_block_ptr = (V + v_offset + v_block_offset +
-                   tl.arange(0, CBLOCK)[:, None] * e +
-                   tl.arange(0, E_FBLOCK)[None, :])
-    KV_block_ptr = (KV + kv_offset + kv_block_offset +
-                    tl.arange(0, D_FBLOCK)[:, None] * e +
-                    tl.arange(0, E_FBLOCK)[None, :])
+    K_trans_block_ptr = (
+        K
+        + k_offset
+        + k_block_offset
+        + tl.arange(0, CBLOCK)[None, :] * d
+        + tl.arange(0, D_FBLOCK)[:, None]
+    )
+    V_block_ptr = (
+        V
+        + v_offset
+        + v_block_offset
+        + tl.arange(0, CBLOCK)[:, None] * e
+        + tl.arange(0, E_FBLOCK)[None, :]
+    )
+    KV_block_ptr = (
+        KV
+        + kv_offset
+        + kv_block_offset
+        + tl.arange(0, D_FBLOCK)[:, None] * e
+        + tl.arange(0, E_FBLOCK)[None, :]
+    )
 
     # Load the decay factors for the current head and block
-    k_decay_ptr = (K_decay + off_h * BLOCK + tl.arange(0, CBLOCK)[None, :])
+    k_decay_ptr = K_decay + off_h * BLOCK + tl.arange(0, CBLOCK)[None, :]
 
     kv_index = tl.arange(0, CBLOCK)
 
@@ -177,12 +219,16 @@ def _fwd_kv_parallel(
     for j in range(num_blocks):
         left_bound = (1 - j) * left_shift
         # Load key and value, handling boundary conditions
-        k_trans = tl.load(K_trans_block_ptr - left_shift * d,
-                          mask=kv_index[None, :] >= left_bound,
-                          other=0.0)
-        v = tl.load(V_block_ptr - left_shift * e,
-                    mask=kv_index[:, None] >= left_bound,
-                    other=0.0)
+        k_trans = tl.load(
+            K_trans_block_ptr - left_shift * d,
+            mask=kv_index[None, :] >= left_bound,
+            other=0.0,
+        )
+        v = tl.load(
+            V_block_ptr - left_shift * e,
+            mask=kv_index[:, None] >= left_bound,
+            other=0.0,
+        )
 
         # Load decay factor and compute weighted key-value outer product
         k_decay = tl.load(k_decay_ptr)
@@ -198,9 +244,20 @@ def _fwd_kv_parallel(
 
 
 @triton.jit
-def _fwd_kv_reduce(S, KV, KV_HISTORY, b: tl.constexpr, h: tl.constexpr, n,
-                   d: tl.constexpr, e: tl.constexpr, BLOCK: tl.constexpr,
-                   NUM_BLOCK, D_FBLOCK: tl.constexpr, E_FBLOCK: tl.constexpr):
+def _fwd_kv_reduce(
+    S,
+    KV,
+    KV_HISTORY,
+    b: tl.constexpr,
+    h: tl.constexpr,
+    n,
+    d: tl.constexpr,
+    e: tl.constexpr,
+    BLOCK: tl.constexpr,
+    NUM_BLOCK,
+    D_FBLOCK: tl.constexpr,
+    E_FBLOCK: tl.constexpr,
+):
     # This kernel reduces the key-value outer products
     # across blocks and updates the KV history
     off_bh = tl.program_id(0)  # batch-head index
@@ -209,8 +266,12 @@ def _fwd_kv_reduce(S, KV, KV_HISTORY, b: tl.constexpr, h: tl.constexpr, n,
     kv_offset = off_bh * NUM_BLOCK * d * e
 
     # Calculate pointer to the key-value tensor
-    KV_block_ptr = (KV + kv_offset + tl.arange(0, D_FBLOCK)[:, None] * e +
-                    tl.arange(0, E_FBLOCK)[None, :])
+    KV_block_ptr = (
+        KV
+        + kv_offset
+        + tl.arange(0, D_FBLOCK)[:, None] * e
+        + tl.arange(0, E_FBLOCK)[None, :]
+    )
 
     # Load the decay rate for the current head
     s_ptrs = S + off_h
@@ -218,9 +279,12 @@ def _fwd_kv_reduce(S, KV, KV_HISTORY, b: tl.constexpr, h: tl.constexpr, n,
 
     # Calculate pointer to the key-value history tensor
     kv_history_offset = off_bh * d * e
-    KV_HISTORY_block_ptr = (KV_HISTORY + kv_history_offset +
-                            tl.arange(0, D_FBLOCK)[:, None] * e +
-                            tl.arange(0, E_FBLOCK)[None, :])
+    KV_HISTORY_block_ptr = (
+        KV_HISTORY
+        + kv_history_offset
+        + tl.arange(0, D_FBLOCK)[:, None] * e
+        + tl.arange(0, E_FBLOCK)[None, :]
+    )
 
     # Load the previous key-value history
     kv_pre = tl.load(KV_HISTORY_block_ptr).to(tl.float32)
@@ -283,12 +347,18 @@ def _fwd_none_diag_kernel(
     kv_offset = off_bh * NUM_BLOCK * d * e + off_n * d * e + e_offset
 
     # Calculate pointers to the query, output, and key-value tensors
-    Q_block_ptr = (Q + q_offset + tl.arange(0, CBLOCK)[:, None] * d +
-                   tl.arange(0, d)[None, :])
-    O_block_ptr = (Out + o_offset + tl.arange(0, CBLOCK)[:, None] * e +
-                   tl.arange(0, E_FBLOCK)[None, :])
-    KV_block_ptr = (KV + kv_offset + tl.arange(0, d)[:, None] * e +
-                    tl.arange(0, E_FBLOCK)[None, :])
+    Q_block_ptr = (
+        Q + q_offset + tl.arange(0, CBLOCK)[:, None] * d + tl.arange(0, d)[None, :]
+    )
+    O_block_ptr = (
+        Out
+        + o_offset
+        + tl.arange(0, CBLOCK)[:, None] * e
+        + tl.arange(0, E_FBLOCK)[None, :]
+    )
+    KV_block_ptr = (
+        KV + kv_offset + tl.arange(0, d)[:, None] * e + tl.arange(0, E_FBLOCK)[None, :]
+    )
 
     # Load the decay rate for the current head
     S_block_ptr = S + off_h
@@ -301,8 +371,7 @@ def _fwd_none_diag_kernel(
     q_index = block_offset + tl.arange(0, CBLOCK)
 
     # Load query values
-    q = tl.load(Q_block_ptr, mask=q_index[:, None] < n,
-                other=0.).to(tl.float32)
+    q = tl.load(Q_block_ptr, mask=q_index[:, None] < n, other=0.0).to(tl.float32)
 
     # Compute decay factors for the current sub-block
     q_decay = tl.exp(-s.to(tl.float32) * (off_c * CBLOCK + c_array[:, None]))
@@ -311,20 +380,18 @@ def _fwd_none_diag_kernel(
     qkv_none_diag = tl.dot(q, kv) * q_decay
 
     # Load diagonal attention output (computed by _fwd_diag_kernel)
-    qkv_diag = tl.load(O_block_ptr, mask=q_index[:, None] < n,
-                       other=0.).to(tl.float32)
+    qkv_diag = tl.load(O_block_ptr, mask=q_index[:, None] < n, other=0.0).to(tl.float32)
 
     # Combine diagonal and non-diagonal attention outputs
     qkv = qkv_diag + qkv_none_diag
 
     # Store the result
-    tl.store(O_block_ptr,
-             qkv.to(O_block_ptr.dtype.element_ty),
-             mask=q_index[:, None] < n)
+    tl.store(
+        O_block_ptr, qkv.to(O_block_ptr.dtype.element_ty), mask=q_index[:, None] < n
+    )
 
 
 class _attention(torch.autograd.Function):
-
     @staticmethod
     def forward(ctx, q, k, v, s, kv_history):
         # Forward pass of the lightning attention algorithm
@@ -336,8 +403,10 @@ def forward(ctx, q, k, v, s, kv_history):
         # Check CUDA compute capability
         capability = torch.cuda.get_device_capability()
         if capability[0] < 8:
-            raise RuntimeError("Flash attention currently only supported",
-                               "for compute capability >= 80")
+            raise RuntimeError(
+                "Flash attention currently only supported",
+                "for compute capability >= 80",
+            )
 
         # Get input dimensions
         b, h, n, d = q.shape
@@ -360,19 +429,21 @@ def forward(ctx, q, k, v, s, kv_history):
 
         # Step 1: Compute diagonal blocks of attention
         grid = (b * h * NUM_BLOCK, NUM_CBLOCK)
-        _fwd_diag_kernel[grid](q,
-                               k,
-                               v,
-                               o,
-                               s,
-                               b,
-                               h,
-                               n,
-                               d,
-                               e,
-                               BLOCK=BLOCK,
-                               NUM_BLOCK=NUM_BLOCK,
-                               CBLOCK=CBLOCK)
+        _fwd_diag_kernel[grid](
+            q,
+            k,
+            v,
+            o,
+            s,
+            b,
+            h,
+            n,
+            d,
+            e,
+            BLOCK=BLOCK,
+            NUM_BLOCK=NUM_BLOCK,
+            CBLOCK=CBLOCK,
+        )
 
         # Set feature block sizes
         NUM_FBLOCK = 1
@@ -386,9 +457,7 @@ def forward(ctx, q, k, v, s, kv_history):
         assert BLOCK % CBLOCK == 0, "BLOCK must be a multiple of CBLOCK"
 
         # Step 2: Compute key-value outer products for each block in parallel
-        kv = torch.empty((b, h, NUM_BLOCK, d, e),
-                         dtype=torch.float32,
-                         device=q.device)
+        kv = torch.empty((b, h, NUM_BLOCK, d, e), dtype=torch.float32, device=q.device)
         grid = (b * h, NUM_BLOCK)
         _fwd_kv_parallel[grid](
             k,
@@ -412,18 +481,20 @@ def forward(ctx, q, k, v, s, kv_history):
         # Step 3: Reduce key-value outer products
         # across blocks and update KV history
         grid = (b * h, NUM_FBLOCK)
-        _fwd_kv_reduce[grid](s,
-                             kv,
-                             kv_history,
-                             b,
-                             h,
-                             n,
-                             d,
-                             e,
-                             BLOCK=BLOCK,
-                             NUM_BLOCK=NUM_BLOCK,
-                             D_FBLOCK=D_FBLOCK,
-                             E_FBLOCK=E_FBLOCK)
+        _fwd_kv_reduce[grid](
+            s,
+            kv,
+            kv_history,
+            b,
+            h,
+            n,
+            d,
+            e,
+            BLOCK=BLOCK,
+            NUM_BLOCK=NUM_BLOCK,
+            D_FBLOCK=D_FBLOCK,
+            E_FBLOCK=E_FBLOCK,
+        )
 
         # Step 4: Compute non-diagonal blocks of attention
         grid = (b * h, NUM_BLOCK * NUM_CBLOCK)
@@ -461,12 +532,12 @@ def lightning_attention(
     v: torch.Tensor,
     ed: torch.Tensor,
     block_size: int = 256,
-    kv_history: Optional[torch.Tensor] = None
+    kv_history: Optional[torch.Tensor] = None,
 ) -> tuple[torch.Tensor, torch.Tensor]:
     """
-    Apply lightning attention algorithm 
+    Apply lightning attention algorithm
     to compute attention efficiently.
-    
+
     Args:
         q: Query tensor of shape [batch, heads, seq_len, dim]
         k: Key tensor of shape [batch, heads, seq_len, dim]
@@ -474,7 +545,7 @@ def lightning_attention(
         ed: Decay rate tensor of shape [heads]
         block_size: Size of blocks for block-sparse attention
         kv_history: Optional key-value history from previous computations
-        
+
     Returns:
         output: Attention output
         kv: Updated key-value history
@@ -496,9 +567,9 @@ def lightning_attention(
 
     # Initialize or clone key-value history
     if kv_history is None:
-        kv_history = torch.zeros((q.shape[0], q.shape[1], d, e),
-                                 dtype=torch.float32,
-                                 device=q.device)
+        kv_history = torch.zeros(
+            (q.shape[0], q.shape[1], d, e), dtype=torch.float32, device=q.device
+        )
     else:
         kv_history = kv_history.clone().contiguous()
 
@@ -533,7 +604,7 @@ def _linear_attn_decode_kernel(
 ):
     """
     Kernel for linear attention decoding with KV cache.
-    
+
     This kernel computes attention for a single token using the KV cache.
     """
     pid_b = tl.program_id(0)  # batch index
@@ -556,8 +627,9 @@ def _linear_attn_decode_kernel(
     # Calculate offsets for dimensions
     qk_d_offsets = tl.arange(0, D)
     v_d_offsets = tl.arange(0, BLOCK_SIZE) + pid_d * BLOCK_SIZE
-    cache_d_offsets = qk_d_offsets[:, None] * cache_d0_stride + v_d_offsets[
-        None, :] * cache_d1_stride
+    cache_d_offsets = (
+        qk_d_offsets[:, None] * cache_d0_stride + v_d_offsets[None, :] * cache_d1_stride
+    )
 
     # Calculate offsets for the current batch and head
     q_offset = batch_id * qkv_b_stride + head_id * qkv_h_stride
@@ -605,7 +677,7 @@ def linear_decode_forward_triton(
 ) -> torch.Tensor:
     """
     Perform linear attention decoding using Triton kernels.
-    
+
     Args:
         q: Query tensor of shape [B, H, 1, D]
         k: Key tensor of shape [B, H, 1, D]
@@ -614,7 +686,7 @@ def linear_decode_forward_triton(
         slope_rate: Decay rate tensor
         slot_idx: Slot indices for batches
         BLOCK_SIZE: Size of blocks for processing
-        
+
     Returns:
         output: Attention output tensor
     """
diff --git a/vllm/model_executor/layers/linear.py b/vllm/model_executor/layers/linear.py
index 04a5db07e95c..e9c4afba1396 100644
--- a/vllm/model_executor/layers/linear.py
+++ b/vllm/model_executor/layers/linear.py
@@ -9,24 +9,33 @@
 import torch.nn as nn
 from torch.nn.parameter import Parameter, UninitializedParameter
 
-from vllm.distributed import (divide, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              split_tensor_along_last_dim,
-                              tensor_model_parallel_all_gather,
-                              tensor_model_parallel_all_reduce)
+from vllm.distributed import (
+    divide,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    split_tensor_along_last_dim,
+    tensor_model_parallel_all_gather,
+    tensor_model_parallel_all_reduce,
+)
 from vllm.logger import init_logger
 from vllm.model_executor.custom_op import CustomOp
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.layers.utils import dispatch_unquantized_gemm
+
 # yapf: disable
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           BlockQuantScaleParameter,
-                                           ModelWeightParameter,
-                                           PackedColumnParameter,
-                                           PackedvLLMParameter,
-                                           PerTensorScaleParameter,
-                                           RowvLLMParameter)
+from vllm.model_executor.parameter import (
+    BasevLLMParameter,
+    BlockQuantScaleParameter,
+    ModelWeightParameter,
+    PackedColumnParameter,
+    PackedvLLMParameter,
+    PerTensorScaleParameter,
+    RowvLLMParameter,
+)
+
 # yapf: enable
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.platforms import current_platform
@@ -62,8 +71,7 @@
 def adjust_bitblas_shard(param, shard_size, shard_offset):
     bitblas_tile_size = getattr(param, "bitblas_tile_size", None)
     if bitblas_tile_size is not None:
-        return (shard_size // bitblas_tile_size,
-                shard_offset // bitblas_tile_size)
+        return (shard_size // bitblas_tile_size, shard_offset // bitblas_tile_size)
 
     return shard_size, shard_offset
 
@@ -76,9 +84,9 @@ def adjust_marlin_shard(param, shard_size, shard_offset):
     return shard_size * marlin_tile_size, shard_offset * marlin_tile_size
 
 
-def adjust_bitsandbytes_4bit_shard(param: Parameter,
-                                   shard_offsets: dict[str, tuple[int, int]],
-                                   loaded_shard_id: str) -> tuple[int, int]:
+def adjust_bitsandbytes_4bit_shard(
+    param: Parameter, shard_offsets: dict[str, tuple[int, int]], loaded_shard_id: str
+) -> tuple[int, int]:
     """Adjust the quantization offsets and sizes for BitsAndBytes sharding."""
 
     total, _ = shard_offsets["total"]
@@ -94,8 +102,8 @@ def adjust_bitsandbytes_4bit_shard(param: Parameter,
 def adjust_scalar_to_fused_array(param, loaded_weight, shard_id):
     """For fused modules (QKV and MLP) we have an array of length
     N that holds 1 scale for each "logical" matrix. So the param
-    is an array of length N. The loaded_weight corresponds to 
-    one of the shards on disk. Here, we slice the param based on 
+    is an array of length N. The loaded_weight corresponds to
+    one of the shards on disk. Here, we slice the param based on
     the shard_id for loading.
     """
     qkv_idxs = {"q": 0, "k": 1, "v": 2}
@@ -122,13 +130,13 @@ def left_shift_bitsandbytes_4bit_shard(bnb_weight_attrs: dict[str, Any]):
 
     For example, given bnb weight attributes as below:
     {
-        'bnb_shard_offsets': array([0, 4, 8, 16]), 
+        'bnb_shard_offsets': array([0, 4, 8, 16]),
         'bnb_quant_state': {0: ..., 1: ..., 2: ...},
     }
 
     The function will return:
     {
-        'bnb_shard_offsets': array([0, 4]), 
+        'bnb_shard_offsets': array([0, 4]),
         'bnb_quant_state': {0: ...},
     }
     and
@@ -143,8 +151,7 @@ def left_shift_bitsandbytes_4bit_shard(bnb_weight_attrs: dict[str, Any]):
     quant_state_l = {0: bnb_weight_attrs["bnb_quant_state"][0]}
     quant_state_r = {
         i - 1: bnb_weight_attrs["bnb_quant_state"][i]
-        for i in range(1,
-                       len(shard_offsets) - 1)
+        for i in range(1, len(shard_offsets) - 1)
     }
     left = dict(bnb_shard_offsets=offset_l, bnb_quant_state=quant_state_l)
     right = dict(bnb_shard_offsets=offset_r, bnb_quant_state=quant_state_r)
@@ -155,18 +162,23 @@ class LinearMethodBase(QuantizeMethodBase):
     """Base class for different (maybe quantized) linear methods."""
 
     @abstractmethod
-    def create_weights(self, layer: torch.nn.Module,
-                       input_size_per_partition: int,
-                       output_partition_sizes: list[int], input_size: int,
-                       output_size: int, params_dtype: torch.dtype,
-                       **extra_weight_attrs):
-        """Create weights for a linear layer. 
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        input_size_per_partition: int,
+        output_partition_sizes: list[int],
+        input_size: int,
+        output_size: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
+        """Create weights for a linear layer.
            The weights will be set as attributes of the layer.
 
         Args:
             layer: The layer that is using the LinearMethodBase factory.
             input_size_per_partition: Size of the weight input dim on rank X.
-            output_partition_sizes: Sizes of the output dim of each logical 
+            output_partition_sizes: Sizes of the output dim of each logical
                 weight on rank X. E.g., output_partition_sizes for QKVLinear
                 is a list contains the width of Wq, Wk, Wv on rank X.
             input_size: Size of the input dim of the weight across all ranks.
@@ -176,10 +188,12 @@ def create_weights(self, layer: torch.nn.Module,
         raise NotImplementedError
 
     @abstractmethod
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         """Apply the weights in layer to the input tensor.
         Expects create_weights to have been called before on the layer."""
         raise NotImplementedError
@@ -188,51 +202,63 @@ def apply(self,
 class UnquantizedLinearMethod(LinearMethodBase):
     """Linear method without quantization."""
 
-    def create_weights(self, layer: torch.nn.Module,
-                       input_size_per_partition: int,
-                       output_partition_sizes: list[int], input_size: int,
-                       output_size: int, params_dtype: torch.dtype,
-                       **extra_weight_attrs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        input_size_per_partition: int,
+        output_partition_sizes: list[int],
+        input_size: int,
+        output_size: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         # This method creates unquantized linear weights.
         # The weights are not quantized, and they are not sharded.
         # The amount of memory allocated for the weights is
         # sum(output_partition_sizes) * input_size_per_partition.
         try:
             weight_loader = extra_weight_attrs.pop("weight_loader")
-            weight = ModelWeightParameter(data=torch.empty(
-                sum(output_partition_sizes),
-                input_size_per_partition,
-                dtype=params_dtype),
-                                          input_dim=1,
-                                          output_dim=0,
-                                          weight_loader=weight_loader)
+            weight = ModelWeightParameter(
+                data=torch.empty(
+                    sum(output_partition_sizes),
+                    input_size_per_partition,
+                    dtype=params_dtype,
+                ),
+                input_dim=1,
+                output_dim=0,
+                weight_loader=weight_loader,
+            )
         except torch.cuda.OutOfMemoryError as e:
             logger.error("Failed to create unquantized linear weights: %s", e)
             if torch.cuda.is_available():
                 logger.debug("CUDA device: %s", torch.cuda.current_device())
-                logger.debug("Allocated: %.2f GiB",
-                             torch.cuda.memory_allocated() / GiB_bytes)
-                logger.debug("Reserved: %.2f GiB",
-                             torch.cuda.memory_reserved() / GiB_bytes)
+                logger.debug(
+                    "Allocated: %.2f GiB", torch.cuda.memory_allocated() / GiB_bytes
+                )
+                logger.debug(
+                    "Reserved: %.2f GiB", torch.cuda.memory_reserved() / GiB_bytes
+                )
             raise RuntimeError(
                 "Failed to create unquantized linear weights. "
                 "This may be caused by insufficient memory to allocate "
-                "the weight.") from e
+                "the weight."
+            ) from e
 
         layer.register_parameter("weight", weight)
         set_weight_attrs(weight, extra_weight_attrs)
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         if current_platform.is_cpu():
-            from vllm.model_executor.layers.utils import (
-                dispatch_cpu_unquantized_gemm)
-            dispatch_cpu_unquantized_gemm(layer, remove_weight=True)
+            from vllm.model_executor.layers.utils import dispatch_cpu_unquantized_gemm
 
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+            dispatch_cpu_unquantized_gemm(layer, remove_weight=True)
 
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         return dispatch_unquantized_gemm()(layer, x, layer.weight, bias)
 
 
@@ -274,17 +300,13 @@ def __init__(
         self.quant_config = quant_config
         self.prefix = prefix
         if quant_config is None:
-            self.quant_method: Optional[
-                QuantizeMethodBase] = UnquantizedLinearMethod()
+            self.quant_method: Optional[QuantizeMethodBase] = UnquantizedLinearMethod()
         else:
-            self.quant_method = quant_config.get_quant_method(self,
-                                                              prefix=prefix)
+            self.quant_method = quant_config.get_quant_method(self, prefix=prefix)
         self.return_bias = return_bias
         self.disable_tp = disable_tp
-        self.tp_rank = (get_tensor_model_parallel_rank()
-                        if not disable_tp else 0)
-        self.tp_size = (get_tensor_model_parallel_world_size()
-                        if not disable_tp else 1)
+        self.tp_rank = get_tensor_model_parallel_rank() if not disable_tp else 0
+        self.tp_size = get_tensor_model_parallel_world_size() if not disable_tp else 1
 
     def update_param_tp_status(self):
         for param in self.parameters():
@@ -329,32 +351,40 @@ def __init__(
         else:
             self.output_partition_sizes = [output_size]
 
-        super().__init__(input_size,
-                         output_size,
-                         skip_bias_add,
-                         params_dtype,
-                         quant_config,
-                         prefix=prefix,
-                         return_bias=return_bias,
-                         disable_tp=disable_tp)
+        super().__init__(
+            input_size,
+            output_size,
+            skip_bias_add,
+            params_dtype,
+            quant_config,
+            prefix=prefix,
+            return_bias=return_bias,
+            disable_tp=disable_tp,
+        )
 
         # All the linear layer supports quant method.
         assert self.quant_method is not None
-        self.quant_method.create_weights(self,
-                                         self.input_size,
-                                         self.output_partition_sizes,
-                                         self.input_size,
-                                         self.output_size,
-                                         self.params_dtype,
-                                         weight_loader=self.weight_loader)
+        self.quant_method.create_weights(
+            self,
+            self.input_size,
+            self.output_partition_sizes,
+            self.input_size,
+            self.output_size,
+            self.params_dtype,
+            weight_loader=self.weight_loader,
+        )
 
         if bias:
             self.bias = Parameter(
-                torch.empty(self.output_size, dtype=self.params_dtype))
-            set_weight_attrs(self.bias, {
-                "output_dim": 0,
-                "weight_loader": self.weight_loader,
-            })
+                torch.empty(self.output_size, dtype=self.params_dtype)
+            )
+            set_weight_attrs(
+                self.bias,
+                {
+                    "output_dim": 0,
+                    "weight_loader": self.weight_loader,
+                },
+            )
         else:
             self.register_parameter("bias", None)
 
@@ -377,7 +407,8 @@ def weight_loader(self, param: Parameter, loaded_weight: torch.Tensor):
 
         assert param.size() == loaded_weight.size(), (
             f"Tried to load weights of size {loaded_weight.size()}"
-            f"to a parameter of size {param.size()}")
+            f"to a parameter of size {param.size()}"
+        )
         param.data.copy_(loaded_weight)
 
     def forward(
@@ -423,7 +454,7 @@ class ColumnParallelLinear(LinearBase):
         output_sizes: list of output sizes packed into one output, like for QKV
                        the list would be size 3.
         prefix: The name of the layer in the state dict, including all parents
-                        (e.g. model.layers.0.qkv_proj) 
+                        (e.g. model.layers.0.qkv_proj)
         return_bias: If true, return bias together with outputs in forward pass.
         disable_tp: If true, weights matrix won't be sharded through tp rank.
     """
@@ -444,28 +475,27 @@ def __init__(
         disable_tp: bool = False,
     ):
         # Divide the weight matrix along the last dimension.
-        self.tp_rank = (get_tensor_model_parallel_rank()
-                        if not disable_tp else 0)
-        self.tp_size = (get_tensor_model_parallel_world_size()
-                        if not disable_tp else 1)
+        self.tp_rank = get_tensor_model_parallel_rank() if not disable_tp else 0
+        self.tp_size = get_tensor_model_parallel_world_size() if not disable_tp else 1
         self.input_size_per_partition = input_size
         self.output_size_per_partition = divide(output_size, self.tp_size)
         self.output_partition_sizes = [self.output_size_per_partition]
         # If QKV or MergedColumn, use output size of each partition.
         if hasattr(self, "output_sizes"):
             self.output_partition_sizes = [
-                divide(output_size, self.tp_size)
-                for output_size in self.output_sizes
+                divide(output_size, self.tp_size) for output_size in self.output_sizes
             ]
 
-        super().__init__(input_size,
-                         output_size,
-                         skip_bias_add,
-                         params_dtype,
-                         quant_config,
-                         prefix,
-                         return_bias=return_bias,
-                         disable_tp=disable_tp)
+        super().__init__(
+            input_size,
+            output_size,
+            skip_bias_add,
+            params_dtype,
+            quant_config,
+            prefix,
+            return_bias=return_bias,
+            disable_tp=disable_tp,
+        )
 
         self.gather_output = gather_output
 
@@ -481,22 +511,27 @@ def __init__(
             output_size=self.output_size,
             params_dtype=self.params_dtype,
             weight_loader=(
-                self.weight_loader_v2 if self.quant_method.__class__.__name__
-                in WEIGHT_LOADER_V2_SUPPORTED else self.weight_loader))
+                self.weight_loader_v2
+                if self.quant_method.__class__.__name__ in WEIGHT_LOADER_V2_SUPPORTED
+                else self.weight_loader
+            ),
+        )
         if bias:
             self.bias = Parameter(
-                torch.empty(self.output_size_per_partition,
-                            dtype=params_dtype))
-            set_weight_attrs(self.bias, {
-                "output_dim": 0,
-                "weight_loader": self.weight_loader,
-            })
+                torch.empty(self.output_size_per_partition, dtype=params_dtype)
+            )
+            set_weight_attrs(
+                self.bias,
+                {
+                    "output_dim": 0,
+                    "weight_loader": self.weight_loader,
+                },
+            )
         else:
             self.register_parameter("bias", None)
         self.update_param_tp_status()
 
     def weight_loader(self, param: Parameter, loaded_weight: torch.Tensor):
-
         output_dim = getattr(param, "output_dim", None)
 
         is_sharded_weight = getattr(param, "is_sharded_weight", False)
@@ -516,16 +551,14 @@ def weight_loader(self, param: Parameter, loaded_weight: torch.Tensor):
             final_shape = list(loaded_weight.shape)
             if output_dim is not None:
                 assert final_shape[output_dim] % self.tp_size == 0
-                final_shape[output_dim] = (final_shape[output_dim] //
-                                           self.tp_size)
+                final_shape[output_dim] = final_shape[output_dim] // self.tp_size
             param.materialize(final_shape, dtype=loaded_weight.dtype)
 
         param_data = param.data
         if output_dim is not None and not is_sharded_weight:
             shard_size = param_data.shape[output_dim]
             start_idx = self.tp_rank * shard_size
-            loaded_weight = loaded_weight.narrow(output_dim, start_idx,
-                                                 shard_size)
+            loaded_weight = loaded_weight.narrow(output_dim, start_idx, shard_size)
 
         # Special case for loading scales off disk, which often do not
         # have a shape (such as in the case of AutoFP8).
@@ -535,8 +568,7 @@ def weight_loader(self, param: Parameter, loaded_weight: torch.Tensor):
         assert param_data.shape == loaded_weight.shape
         param_data.copy_(loaded_weight)
 
-    def weight_loader_v2(self, param: BasevLLMParameter,
-                         loaded_weight: torch.Tensor):
+    def weight_loader_v2(self, param: BasevLLMParameter, loaded_weight: torch.Tensor):
         # Special case for loading scales off disk, which often do not
         # have a shape (such as in the case of AutoFP8).
         if len(loaded_weight.shape) == 0:
@@ -614,29 +646,29 @@ def __init__(
         disable_tp: bool = False,
     ):
         self.output_sizes = output_sizes
-        self.tp_size = (get_tensor_model_parallel_world_size()
-                        if not disable_tp else 1)
-        self.tp_rank = (get_tensor_model_parallel_rank()
-                        if not disable_tp else 0)
-
-        assert all(output_size % self.tp_size == 0
-                   for output_size in output_sizes)
-        super().__init__(input_size=input_size,
-                         output_size=sum(output_sizes),
-                         bias=bias,
-                         gather_output=gather_output,
-                         skip_bias_add=skip_bias_add,
-                         params_dtype=params_dtype,
-                         quant_config=quant_config,
-                         prefix=prefix,
-                         return_bias=return_bias,
-                         disable_tp=disable_tp)
-
-    def weight_loader(self,
-                      param: Parameter,
-                      loaded_weight: torch.Tensor,
-                      loaded_shard_id: Optional[int] = None):
+        self.tp_size = get_tensor_model_parallel_world_size() if not disable_tp else 1
+        self.tp_rank = get_tensor_model_parallel_rank() if not disable_tp else 0
+
+        assert all(output_size % self.tp_size == 0 for output_size in output_sizes)
+        super().__init__(
+            input_size=input_size,
+            output_size=sum(output_sizes),
+            bias=bias,
+            gather_output=gather_output,
+            skip_bias_add=skip_bias_add,
+            params_dtype=params_dtype,
+            quant_config=quant_config,
+            prefix=prefix,
+            return_bias=return_bias,
+            disable_tp=disable_tp,
+        )
 
+    def weight_loader(
+        self,
+        param: Parameter,
+        loaded_weight: torch.Tensor,
+        loaded_shard_id: Optional[int] = None,
+    ):
         # Special case for GGUF
         # initialize GGUF param after we know the quantize type
         is_gguf_weight = getattr(param, "is_gguf_weight", False)
@@ -647,20 +679,17 @@ def weight_loader(self,
                 param.shard_weight_type[loaded_shard_id] = loaded_weight.item()
             else:
                 param.shard_weight_type = {
-                    i: loaded_weight.item()
-                    for i, _ in enumerate(self.output_sizes)
+                    i: loaded_weight.item() for i, _ in enumerate(self.output_sizes)
                 }
             return
 
         if is_gguf_weight:
-
             output_dim = getattr(param, "output_dim", None)
             shard_size = loaded_weight.size(output_dim) // self.tp_size
             start_idx = self.tp_rank * shard_size
 
             if loaded_shard_id is not None:
-                loaded_weight = loaded_weight.narrow(output_dim, start_idx,
-                                                     shard_size)
+                loaded_weight = loaded_weight.narrow(output_dim, start_idx, shard_size)
                 param.shard_id.append(loaded_shard_id)
                 param.shard_id_map[loaded_shard_id] = len(param.data_container)
                 param.data_container.append(loaded_weight)
@@ -677,14 +706,14 @@ def weight_loader(self,
             if output_dim is None:
                 if needs_scalar_to_array:
                     param_data, loaded_weight = adjust_scalar_to_fused_array(
-                        param_data, loaded_weight, 0)
+                        param_data, loaded_weight, 0
+                    )
 
                 assert param_data.shape == loaded_weight.shape
                 param_data.copy_(loaded_weight)
                 return
             current_shard_offset = 0
-            use_bitsandbytes_4bit = getattr(param, "use_bitsandbytes_4bit",
-                                            False)
+            use_bitsandbytes_4bit = getattr(param, "use_bitsandbytes_4bit", False)
             shard_offsets: list[tuple[int, int, int]] = []
             for i, output_size in enumerate(self.output_sizes):
                 shard_offsets.append((i, current_shard_offset, output_size))
@@ -699,10 +728,12 @@ def weight_loader(self,
                     shard_offset = shard_offset // param.packed_factor
                     # Special case for Marlin.
                     shard_size, shard_offset = adjust_marlin_shard(
-                        param, shard_size, shard_offset)
+                        param, shard_size, shard_offset
+                    )
 
                 shard_size, shard_offset = adjust_bitblas_shard(
-                    param, shard_size, shard_offset)
+                    param, shard_size, shard_offset
+                )
 
                 if use_bitsandbytes_4bit:
                     index = list(itertools.accumulate([0] + self.output_sizes))
@@ -712,17 +743,18 @@ def weight_loader(self,
                     }
                     orig_offsets["total"] = (self.output_size, 0)
                     shard_size, shard_offset = adjust_bitsandbytes_4bit_shard(
-                        param, orig_offsets, str(shard_id))
+                        param, orig_offsets, str(shard_id)
+                    )
 
                 loaded_weight_shard = loaded_weight.narrow(
-                    output_dim, shard_offset, shard_size)
+                    output_dim, shard_offset, shard_size
+                )
                 self.weight_loader(param, loaded_weight_shard, shard_id)
             return
 
         assert loaded_shard_id < len(self.output_sizes)
         if output_dim is not None:
-            shard_offset = (sum(self.output_sizes[:loaded_shard_id]) //
-                            self.tp_size)
+            shard_offset = sum(self.output_sizes[:loaded_shard_id]) // self.tp_size
             shard_size = self.output_sizes[loaded_shard_id] // self.tp_size
             # Special case for quantization.
             # If quantized, we need to adjust the offset and size to account
@@ -733,12 +765,13 @@ def weight_loader(self,
                 shard_offset = shard_offset // param.packed_factor
                 # Special case for Marlin.
                 shard_size, shard_offset = adjust_marlin_shard(
-                    param, shard_size, shard_offset)
+                    param, shard_size, shard_offset
+                )
             shard_size, shard_offset = adjust_bitblas_shard(
-                param, shard_size, shard_offset)
+                param, shard_size, shard_offset
+            )
 
-            use_bitsandbytes_4bit = getattr(param, "use_bitsandbytes_4bit",
-                                            False)
+            use_bitsandbytes_4bit = getattr(param, "use_bitsandbytes_4bit", False)
             is_sharded_weight = getattr(param, "is_sharded_weight", False)
             # bitsandbytes loads the weights of the specific portion
             # no need to narrow
@@ -746,19 +779,17 @@ def weight_loader(self,
 
             if use_bitsandbytes_4bit:
                 shard_size = loaded_weight.shape[output_dim]
-                shard_offset = loaded_weight.shape[output_dim] * \
-                    loaded_shard_id
+                shard_offset = loaded_weight.shape[output_dim] * loaded_shard_id
 
-            param_data = param_data.narrow(output_dim, shard_offset,
-                                           shard_size)
+            param_data = param_data.narrow(output_dim, shard_offset, shard_size)
             start_idx = self.tp_rank * shard_size
             if not is_sharded_weight:
-                loaded_weight = loaded_weight.narrow(output_dim, start_idx,
-                                                     shard_size)
+                loaded_weight = loaded_weight.narrow(output_dim, start_idx, shard_size)
         # Special case for per-tensor scales in fused case.
         elif needs_scalar_to_array:
             param_data, loaded_weight = adjust_scalar_to_fused_array(
-                param_data, loaded_weight, loaded_shard_id)
+                param_data, loaded_weight, loaded_shard_id
+            )
 
         else:
             ignore_warning = getattr(param, "ignore_warning", False)
@@ -766,13 +797,15 @@ def weight_loader(self,
                 logger.warning(
                     "Loading a weight without `output_dim` attribute in "
                     "MergedColumnParallelLinear, assume the weight is "
-                    "the same for all partitions.")
+                    "the same for all partitions."
+                )
 
         assert param_data.shape == loaded_weight.shape
         param_data.copy_(loaded_weight)
 
-    def _load_fused_module_from_checkpoint(self, param: BasevLLMParameter,
-                                           loaded_weight: torch.Tensor):
+    def _load_fused_module_from_checkpoint(
+        self, param: BasevLLMParameter, loaded_weight: torch.Tensor
+    ):
         """
         Handle special case for models where MLP layers are already
         fused on disk. In this case, we have no shard id. This function
@@ -793,25 +826,28 @@ def _load_fused_module_from_checkpoint(self, param: BasevLLMParameter,
             # Special case for Quantization.
             # If quantized, we need to adjust the offset and size to account
             # for the packing.
-            if isinstance(param, (PackedColumnParameter, PackedvLLMParameter
-                                  )) and param.packed_dim == param.output_dim:
-                shard_size, shard_offset = \
-                    param.adjust_shard_indexes_for_packing(
-                    shard_size=shard_size, shard_offset=shard_offset)
-
-            loaded_weight_shard = loaded_weight.narrow(param.output_dim,
-                                                       shard_offset,
-                                                       shard_size)
+            if (
+                isinstance(param, (PackedColumnParameter, PackedvLLMParameter))
+                and param.packed_dim == param.output_dim
+            ):
+                shard_size, shard_offset = param.adjust_shard_indexes_for_packing(
+                    shard_size=shard_size, shard_offset=shard_offset
+                )
+
+            loaded_weight_shard = loaded_weight.narrow(
+                param.output_dim, shard_offset, shard_size
+            )
             self.weight_loader_v2(param, loaded_weight_shard, shard_id)
 
-    def weight_loader_v2(self,
-                         param: BasevLLMParameter,
-                         loaded_weight: torch.Tensor,
-                         loaded_shard_id: Optional[int] = None):
+    def weight_loader_v2(
+        self,
+        param: BasevLLMParameter,
+        loaded_weight: torch.Tensor,
+        loaded_shard_id: Optional[int] = None,
+    ):
         if loaded_shard_id is None:
             if isinstance(param, PerTensorScaleParameter):
-                param.load_merged_column_weight(loaded_weight=loaded_weight,
-                                                shard_id=0)
+                param.load_merged_column_weight(loaded_weight=loaded_weight, shard_id=0)
                 return
             elif type(param) in (RowvLLMParameter, BasevLLMParameter):
                 param.load_merged_column_weight(loaded_weight=loaded_weight)
@@ -830,20 +866,24 @@ def weight_loader_v2(self,
             assert weight_block_size is not None
             block_n, _ = weight_block_size[0], weight_block_size[1]
             shard_offset = (
-                (sum(self.output_sizes[:loaded_shard_id]) + block_n - 1) //
-                block_n) // self.tp_size
-            shard_size = ((self.output_sizes[loaded_shard_id] + block_n - 1) //
-                          block_n // self.tp_size)
+                (sum(self.output_sizes[:loaded_shard_id]) + block_n - 1) // block_n
+            ) // self.tp_size
+            shard_size = (
+                (self.output_sizes[loaded_shard_id] + block_n - 1)
+                // block_n
+                // self.tp_size
+            )
         else:
-            shard_offset = sum(
-                self.output_sizes[:loaded_shard_id]) // self.tp_size
+            shard_offset = sum(self.output_sizes[:loaded_shard_id]) // self.tp_size
             shard_size = self.output_sizes[loaded_shard_id] // self.tp_size
 
-        param.load_merged_column_weight(loaded_weight=loaded_weight,
-                                        shard_id=loaded_shard_id,
-                                        shard_offset=shard_offset,
-                                        shard_size=shard_size,
-                                        tp_rank=self.tp_rank)
+        param.load_merged_column_weight(
+            loaded_weight=loaded_weight,
+            shard_id=loaded_shard_id,
+            shard_offset=shard_offset,
+            shard_size=shard_size,
+            tp_rank=self.tp_rank,
+        )
 
 
 class QKVParallelLinear(ColumnParallelLinear):
@@ -896,42 +936,43 @@ def __init__(
             total_num_kv_heads = total_num_heads
         self.total_num_kv_heads = total_num_kv_heads
         # Divide the weight matrix along the last dimension.
-        tp_size = (get_tensor_model_parallel_world_size()
-                   if not disable_tp else 1)
+        tp_size = get_tensor_model_parallel_world_size() if not disable_tp else 1
         self.num_heads = divide(self.total_num_heads, tp_size)
         if tp_size >= self.total_num_kv_heads:
             self.num_kv_heads = 1
-            self.num_kv_head_replicas = divide(tp_size,
-                                               self.total_num_kv_heads)
+            self.num_kv_head_replicas = divide(tp_size, self.total_num_kv_heads)
         else:
             self.num_kv_heads = divide(self.total_num_kv_heads, tp_size)
             self.num_kv_head_replicas = 1
         input_size = self.hidden_size
-        output_size = (self.num_heads +
-                       2 * self.num_kv_heads) * tp_size * self.head_size
+        output_size = (
+            (self.num_heads + 2 * self.num_kv_heads) * tp_size * self.head_size
+        )
         self.output_sizes = [
             self.num_heads * self.head_size * tp_size,  # q_proj
             self.num_kv_heads * self.head_size * tp_size,  # k_proj
-            self.num_kv_heads * self.head_size * tp_size,  # v_proj 
+            self.num_kv_heads * self.head_size * tp_size,  # v_proj
         ]
 
-        super().__init__(input_size=input_size,
-                         output_size=output_size,
-                         bias=bias,
-                         gather_output=False,
-                         skip_bias_add=skip_bias_add,
-                         params_dtype=params_dtype,
-                         quant_config=quant_config,
-                         prefix=prefix,
-                         return_bias=return_bias,
-                         disable_tp=disable_tp)
+        super().__init__(
+            input_size=input_size,
+            output_size=output_size,
+            bias=bias,
+            gather_output=False,
+            skip_bias_add=skip_bias_add,
+            params_dtype=params_dtype,
+            quant_config=quant_config,
+            prefix=prefix,
+            return_bias=return_bias,
+            disable_tp=disable_tp,
+        )
 
     def _get_shard_offset_mapping(self, loaded_shard_id: str):
         shard_offset_mapping = {
             "q": 0,
             "k": self.num_heads * self.head_size,
             "v": (self.num_heads + self.num_kv_heads) * self.head_size,
-            "total": (self.num_heads + 2 * self.num_kv_heads) * self.head_size
+            "total": (self.num_heads + 2 * self.num_kv_heads) * self.head_size,
         }
         return shard_offset_mapping.get(loaded_shard_id)
 
@@ -943,10 +984,11 @@ def _get_shard_size_mapping(self, loaded_shard_id: str):
         }
         return shard_size_mapping.get(loaded_shard_id)
 
-    def _load_fused_module_from_checkpoint(self, param: BasevLLMParameter,
-                                           loaded_weight: torch.Tensor):
+    def _load_fused_module_from_checkpoint(
+        self, param: BasevLLMParameter, loaded_weight: torch.Tensor
+    ):
         """
-        Handle special case for models where QKV layers are already 
+        Handle special case for models where QKV layers are already
         fused on disk. In this case, we have no shard id. This function
         determines the shard id by splitting these layers and then calls
         the weight loader using the shard id.
@@ -957,41 +999,49 @@ def _load_fused_module_from_checkpoint(self, param: BasevLLMParameter,
         shard_offsets = [
             # (shard_id, shard_offset, shard_size)
             ("q", 0, self.total_num_heads * self.head_size),
-            ("k", self.total_num_heads * self.head_size,
-             self.total_num_kv_heads * self.head_size),
-            ("v",
-             (self.total_num_heads + self.total_num_kv_heads) * self.head_size,
-             self.total_num_kv_heads * self.head_size),
+            (
+                "k",
+                self.total_num_heads * self.head_size,
+                self.total_num_kv_heads * self.head_size,
+            ),
+            (
+                "v",
+                (self.total_num_heads + self.total_num_kv_heads) * self.head_size,
+                self.total_num_kv_heads * self.head_size,
+            ),
         ]
 
         for shard_id, shard_offset, shard_size in shard_offsets:
             # Special case for Quantization.
             # If quantized, we need to adjust the offset and size to account
             # for the packing.
-            if isinstance(param, (PackedColumnParameter, PackedvLLMParameter
-                                  )) and param.packed_dim == param.output_dim:
-                shard_size, shard_offset = \
-                    param.adjust_shard_indexes_for_packing(
-                    shard_size=shard_size, shard_offset=shard_offset)
-
-            loaded_weight_shard = loaded_weight.narrow(param.output_dim,
-                                                       shard_offset,
-                                                       shard_size)
+            if (
+                isinstance(param, (PackedColumnParameter, PackedvLLMParameter))
+                and param.packed_dim == param.output_dim
+            ):
+                shard_size, shard_offset = param.adjust_shard_indexes_for_packing(
+                    shard_size=shard_size, shard_offset=shard_offset
+                )
+
+            loaded_weight_shard = loaded_weight.narrow(
+                param.output_dim, shard_offset, shard_size
+            )
             self.weight_loader_v2(param, loaded_weight_shard, shard_id)
 
-    def weight_loader_v2(self,
-                         param: BasevLLMParameter,
-                         loaded_weight: torch.Tensor,
-                         loaded_shard_id: Optional[str] = None):
+    def weight_loader_v2(
+        self,
+        param: BasevLLMParameter,
+        loaded_weight: torch.Tensor,
+        loaded_shard_id: Optional[str] = None,
+    ):
         if loaded_shard_id is None:  # special case for certain models
             if isinstance(param, PerTensorScaleParameter):
-                param.load_qkv_weight(loaded_weight=loaded_weight,
-                                      shard_id=0,
-                                      tp_rank=self.tp_rank)
+                param.load_qkv_weight(
+                    loaded_weight=loaded_weight, shard_id=0, tp_rank=self.tp_rank
+                )
                 return
             elif type(param) in (RowvLLMParameter, BasevLLMParameter):
-                param.load_qkv_weight(loaded_weight=loaded_weight,
-                                      tp_rank=self.tp_rank)
+                param.load_qkv_weight(loaded_weight=loaded_weight, tp_rank=self.tp_rank)
                 return
             # TODO: @dsikka - move to parameter.py
             self._load_fused_module_from_checkpoint(param, loaded_weight)
@@ -1013,18 +1063,21 @@ def weight_loader_v2(self,
             shard_offset = (shard_offset + block_n - 1) // block_n
             shard_size = (shard_size + block_n - 1) // block_n
 
-        param.load_qkv_weight(loaded_weight=loaded_weight,
-                              num_heads=self.num_kv_head_replicas,
-                              shard_id=loaded_shard_id,
-                              shard_offset=shard_offset,
-                              shard_size=shard_size,
-                              tp_rank=self.tp_rank)
-
-    def weight_loader(self,
-                      param: Parameter,
-                      loaded_weight: torch.Tensor,
-                      loaded_shard_id: Optional[str] = None):
+        param.load_qkv_weight(
+            loaded_weight=loaded_weight,
+            num_heads=self.num_kv_head_replicas,
+            shard_id=loaded_shard_id,
+            shard_offset=shard_offset,
+            shard_size=shard_size,
+            tp_rank=self.tp_rank,
+        )
 
+    def weight_loader(
+        self,
+        param: Parameter,
+        loaded_weight: torch.Tensor,
+        loaded_shard_id: Optional[str] = None,
+    ):
         # Special case for GGUF
         # initialize GGUF param after we know the quantize type
         is_gguf_weight = getattr(param, "is_gguf_weight", False)
@@ -1035,10 +1088,7 @@ def weight_loader(self,
                 param.data[idx_map[loaded_shard_id]].copy_(loaded_weight)
                 param.shard_weight_type[loaded_shard_id] = loaded_weight.item()
             else:
-                param.shard_weight_type = {
-                    k: loaded_weight.item()
-                    for k in idx_map
-                }
+                param.shard_weight_type = {k: loaded_weight.item() for k in idx_map}
             return
 
         if is_gguf_weight:
@@ -1047,8 +1097,7 @@ def weight_loader(self,
             start_idx = self.tp_rank * shard_size
 
             if loaded_shard_id is not None:
-                loaded_weight = loaded_weight.narrow(output_dim, start_idx,
-                                                     shard_size)
+                loaded_weight = loaded_weight.narrow(output_dim, start_idx, shard_size)
                 param.shard_id.append(loaded_shard_id)
                 param.shard_id_map[loaded_shard_id] = len(param.data_container)
                 param.data_container.append(loaded_weight)
@@ -1066,7 +1115,8 @@ def weight_loader(self,
             if output_dim is None:
                 if needs_scalar_to_array:
                     param_data, loaded_weight = adjust_scalar_to_fused_array(
-                        param_data, loaded_weight, 0)
+                        param_data, loaded_weight, 0
+                    )
 
                 assert param_data.shape == loaded_weight.shape
                 param_data.copy_(loaded_weight)
@@ -1074,13 +1124,18 @@ def weight_loader(self,
             shard_offsets = [
                 # (shard_id, shard_offset, shard_size)
                 ("q", 0, self.total_num_heads * self.head_size),
-                ("k", self.total_num_heads * self.head_size,
-                 self.total_num_kv_heads * self.head_size),
-                ("v", (self.total_num_heads + self.total_num_kv_heads) *
-                 self.head_size, self.total_num_kv_heads * self.head_size),
+                (
+                    "k",
+                    self.total_num_heads * self.head_size,
+                    self.total_num_kv_heads * self.head_size,
+                ),
+                (
+                    "v",
+                    (self.total_num_heads + self.total_num_kv_heads) * self.head_size,
+                    self.total_num_kv_heads * self.head_size,
+                ),
             ]
-            use_bitsandbytes_4bit = getattr(param, "use_bitsandbytes_4bit",
-                                            False)
+            use_bitsandbytes_4bit = getattr(param, "use_bitsandbytes_4bit", False)
 
             packed_dim = getattr(param, "packed_dim", None)
             for shard_id, shard_offset, shard_size in shard_offsets:
@@ -1093,27 +1148,35 @@ def weight_loader(self,
 
                     # Special case for Marlin.
                     shard_size, shard_offset = adjust_marlin_shard(
-                        param, shard_size, shard_offset)
+                        param, shard_size, shard_offset
+                    )
 
                 if use_bitsandbytes_4bit:
                     orig_qkv_offsets = {
                         "q": (0, self.total_num_heads * self.head_size),
-                        "k": (self.total_num_heads * self.head_size,
-                              self.total_num_kv_heads * self.head_size),
-                        "v":
-                        ((self.total_num_heads + self.total_num_kv_heads) *
-                         self.head_size,
-                         self.total_num_kv_heads * self.head_size),
-                        "total":
-                        ((self.total_num_heads + 2 * self.total_num_kv_heads) *
-                         self.head_size, 0)
+                        "k": (
+                            self.total_num_heads * self.head_size,
+                            self.total_num_kv_heads * self.head_size,
+                        ),
+                        "v": (
+                            (self.total_num_heads + self.total_num_kv_heads)
+                            * self.head_size,
+                            self.total_num_kv_heads * self.head_size,
+                        ),
+                        "total": (
+                            (self.total_num_heads + 2 * self.total_num_kv_heads)
+                            * self.head_size,
+                            0,
+                        ),
                     }
 
                     shard_size, shard_offset = adjust_bitsandbytes_4bit_shard(
-                        param, orig_qkv_offsets, shard_id)
+                        param, orig_qkv_offsets, shard_id
+                    )
 
                 loaded_weight_shard = loaded_weight.narrow(
-                    output_dim, shard_offset, shard_size)
+                    output_dim, shard_offset, shard_size
+                )
                 self.weight_loader(param, loaded_weight_shard, shard_id)
             return
 
@@ -1128,8 +1191,7 @@ def weight_loader(self,
                 shard_offset = self.num_heads * self.head_size
                 shard_size = self.num_kv_heads * self.head_size
             elif loaded_shard_id == "v":
-                shard_offset = (self.num_heads +
-                                self.num_kv_heads) * self.head_size
+                shard_offset = (self.num_heads + self.num_kv_heads) * self.head_size
                 shard_size = self.num_kv_heads * self.head_size
             # Special case for Quantized Weights.
             # If quantized, we need to adjust the offset and size to account
@@ -1141,10 +1203,10 @@ def weight_loader(self,
 
                 # Special case for Marlin.
                 shard_size, shard_offset = adjust_marlin_shard(
-                    param, shard_size, shard_offset)
+                    param, shard_size, shard_offset
+                )
 
-            use_bitsandbytes_4bit = getattr(param, "use_bitsandbytes_4bit",
-                                            False)
+            use_bitsandbytes_4bit = getattr(param, "use_bitsandbytes_4bit", False)
             is_sharded_weight = getattr(param, "is_sharded_weight", False)
             # bitsandbytes loads the weights of the specific portion
             # no need to narrow
@@ -1153,20 +1215,24 @@ def weight_loader(self,
             if use_bitsandbytes_4bit:
                 orig_qkv_offsets = {
                     "q": (0, self.num_heads * self.head_size),
-                    "k": (self.num_heads * self.head_size,
-                          self.num_kv_heads * self.head_size),
-                    "v":
-                    ((self.num_heads + self.num_kv_heads) * self.head_size,
-                     self.num_kv_heads * self.head_size),
-                    "total":
-                    ((self.num_heads + 2 * self.num_kv_heads) * self.head_size,
-                     0)
+                    "k": (
+                        self.num_heads * self.head_size,
+                        self.num_kv_heads * self.head_size,
+                    ),
+                    "v": (
+                        (self.num_heads + self.num_kv_heads) * self.head_size,
+                        self.num_kv_heads * self.head_size,
+                    ),
+                    "total": (
+                        (self.num_heads + 2 * self.num_kv_heads) * self.head_size,
+                        0,
+                    ),
                 }
                 shard_size, shard_offset = adjust_bitsandbytes_4bit_shard(
-                    param, orig_qkv_offsets, loaded_shard_id)
+                    param, orig_qkv_offsets, loaded_shard_id
+                )
 
-            param_data = param_data.narrow(output_dim, shard_offset,
-                                           shard_size)
+            param_data = param_data.narrow(output_dim, shard_offset, shard_size)
             if loaded_shard_id == "q":
                 shard_id = self.tp_rank
             else:
@@ -1174,20 +1240,21 @@ def weight_loader(self,
             start_idx = shard_id * shard_size
 
             if not is_sharded_weight:
-                loaded_weight = loaded_weight.narrow(output_dim, start_idx,
-                                                     shard_size)
+                loaded_weight = loaded_weight.narrow(output_dim, start_idx, shard_size)
 
         # Special case for per-tensor scales in fused case.
         elif needs_scalar_to_array:
             param_data, loaded_weight = adjust_scalar_to_fused_array(
-                param_data, loaded_weight, loaded_shard_id)
+                param_data, loaded_weight, loaded_shard_id
+            )
         else:
             ignore_warning = getattr(param, "ignore_warning", False)
             if not ignore_warning:
                 logger.warning(
                     "Loading a weight without `output_dim` attribute in "
                     "QKVParallelLinear, assume the weight is the same "
-                    "for all partitions.")
+                    "for all partitions."
+                )
 
         assert param_data.shape == loaded_weight.shape
         param_data.copy_(loaded_weight)
@@ -1243,22 +1310,22 @@ def __init__(
         disable_tp: bool = False,
     ):
         # Divide the weight matrix along the first dimension.
-        self.tp_rank = (get_tensor_model_parallel_rank()
-                        if not disable_tp else 0)
-        self.tp_size = (get_tensor_model_parallel_world_size()
-                        if not disable_tp else 1)
+        self.tp_rank = get_tensor_model_parallel_rank() if not disable_tp else 0
+        self.tp_size = get_tensor_model_parallel_world_size() if not disable_tp else 1
         self.input_size_per_partition = divide(input_size, self.tp_size)
         self.output_size_per_partition = output_size
         self.output_partition_sizes = [output_size]
 
-        super().__init__(input_size,
-                         output_size,
-                         skip_bias_add,
-                         params_dtype,
-                         quant_config,
-                         prefix,
-                         return_bias=return_bias,
-                         disable_tp=disable_tp)
+        super().__init__(
+            input_size,
+            output_size,
+            skip_bias_add,
+            params_dtype,
+            quant_config,
+            prefix,
+            return_bias=return_bias,
+            disable_tp=disable_tp,
+        )
 
         self.input_is_parallel = input_is_parallel
         self.reduce_results = reduce_results
@@ -1272,19 +1339,26 @@ def __init__(
             output_size=self.output_size,
             params_dtype=self.params_dtype,
             weight_loader=(
-                self.weight_loader_v2 if self.quant_method.__class__.__name__
-                in WEIGHT_LOADER_V2_SUPPORTED else self.weight_loader))
+                self.weight_loader_v2
+                if self.quant_method.__class__.__name__ in WEIGHT_LOADER_V2_SUPPORTED
+                else self.weight_loader
+            ),
+        )
         if not reduce_results and (bias and not skip_bias_add):
-            raise ValueError("When not reduce the results, adding bias to the "
-                             "results can lead to incorrect results")
+            raise ValueError(
+                "When not reduce the results, adding bias to the "
+                "results can lead to incorrect results"
+            )
 
         if bias:
-            self.bias = Parameter(
-                torch.empty(self.output_size, dtype=params_dtype))
-            set_weight_attrs(self.bias, {
-                "output_dim": 0,
-                "weight_loader": self.weight_loader,
-            })
+            self.bias = Parameter(torch.empty(self.output_size, dtype=params_dtype))
+            set_weight_attrs(
+                self.bias,
+                {
+                    "output_dim": 0,
+                    "weight_loader": self.weight_loader,
+                },
+            )
         else:
             self.register_parameter("bias", None)
         self.update_param_tp_status()
@@ -1307,16 +1381,14 @@ def weight_loader(self, param: Parameter, loaded_weight: torch.Tensor):
         if is_gguf_weight and isinstance(param, UninitializedParameter):
             weight_shape = list(loaded_weight.shape)
             if input_dim:
-                weight_shape[input_dim] = (weight_shape[input_dim] //
-                                           self.tp_size)
+                weight_shape[input_dim] = weight_shape[input_dim] // self.tp_size
             param.materialize(tuple(weight_shape), dtype=loaded_weight.dtype)
 
         param_data = param.data
         if input_dim is not None and not is_sharded_weight:
             shard_size = param_data.shape[input_dim]
             start_idx = self.tp_rank * shard_size
-            loaded_weight = loaded_weight.narrow(input_dim, start_idx,
-                                                 shard_size)
+            loaded_weight = loaded_weight.narrow(input_dim, start_idx, shard_size)
 
         # Special case for loading scales off disk, which often do not
         # have a shape (such as in the case of AutoFP8).
@@ -1326,9 +1398,7 @@ def weight_loader(self, param: Parameter, loaded_weight: torch.Tensor):
         assert param_data.shape == loaded_weight.shape
         param_data.copy_(loaded_weight)
 
-    def weight_loader_v2(self, param: BasevLLMParameter,
-                         loaded_weight: torch.Tensor):
-
+    def weight_loader_v2(self, param: BasevLLMParameter, loaded_weight: torch.Tensor):
         # Special case for loading scales off disk, which often do not
         # have a shape (such as in the case of AutoFP8).
         if len(loaded_weight.shape) == 0:
@@ -1345,7 +1415,8 @@ def forward(
             input_parallel = input_
         else:
             splitted_input = split_tensor_along_last_dim(
-                input_, num_partitions=self.tp_size)
+                input_, num_partitions=self.tp_size
+            )
             input_parallel = splitted_input[self.tp_rank].contiguous()
 
         # Matrix multiply.
@@ -1395,37 +1466,44 @@ class QKVCrossParallelLinear(LinearBase):
                         (e.g. model.layers.0.qkv_proj)
     """
 
-    def __init__(self,
-                 hidden_size: int,
-                 head_size: int,
-                 total_num_heads: int,
-                 total_num_kv_heads: Optional[int] = None,
-                 bias: bool = True,
-                 skip_bias_add: bool = False,
-                 params_dtype: Optional[torch.dtype] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        hidden_size: int,
+        head_size: int,
+        total_num_heads: int,
+        total_num_kv_heads: Optional[int] = None,
+        bias: bool = True,
+        skip_bias_add: bool = False,
+        params_dtype: Optional[torch.dtype] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         # input_size and output_size are not used, just for alignment
         input_size = hidden_size
         output_size = (total_num_heads + (total_num_kv_heads or 0)) * head_size
-        super().__init__(input_size=input_size,
-                         output_size=output_size,
-                         skip_bias_add=skip_bias_add,
-                         params_dtype=params_dtype,
-                         quant_config=quant_config,
-                         prefix=prefix)
+        super().__init__(
+            input_size=input_size,
+            output_size=output_size,
+            skip_bias_add=skip_bias_add,
+            params_dtype=params_dtype,
+            quant_config=quant_config,
+            prefix=prefix,
+        )
 
         self.quant_config = quant_config
 
         # Empty placeholders for loading as a single module.
         placeholder_size = 0
         assert self.quant_method is not None
-        self.quant_method.create_weights(self,
-                                         placeholder_size, [placeholder_size],
-                                         placeholder_size,
-                                         placeholder_size,
-                                         self.params_dtype,
-                                         weight_loader=self.weight_loader)
+        self.quant_method.create_weights(
+            self,
+            placeholder_size,
+            [placeholder_size],
+            placeholder_size,
+            placeholder_size,
+            self.params_dtype,
+            weight_loader=self.weight_loader,
+        )
 
         # Use a dictionary to avoid submodules parameters auto-registration:
         # drop-in replacement for a `QKVParallelLinear` module.
@@ -1437,7 +1515,8 @@ def __init__(self,
             quant_config=quant_config,
             skip_bias_add=skip_bias_add,
             params_dtype=params_dtype,
-            prefix=f"{prefix}.q_proj_decoder")
+            prefix=f"{prefix}.q_proj_decoder",
+        )
 
         self.proj["kv_proj_encoder"] = QKVParallelLinear(
             hidden_size=hidden_size,
@@ -1448,7 +1527,8 @@ def __init__(self,
             quant_config=quant_config,
             skip_bias_add=skip_bias_add,
             params_dtype=params_dtype,
-            prefix=f"{prefix}.kv_proj_encoder")
+            prefix=f"{prefix}.kv_proj_encoder",
+        )
 
         # `kv_proj_encoder.num_kv_heads` accounts for sharding with tp>1.
         self.q_size = self.q_proj_decoder.output_size_per_partition
@@ -1456,10 +1536,13 @@ def __init__(self,
 
         if bias:
             self.bias = torch.nn.Parameter()
-            set_weight_attrs(self.bias, {
-                "output_dim": 0,
-                "weight_loader": self.weight_loader_v1,
-            })
+            set_weight_attrs(
+                self.bias,
+                {
+                    "output_dim": 0,
+                    "weight_loader": self.weight_loader_v1,
+                },
+            )
         else:
             self.bias = None
 
@@ -1474,9 +1557,7 @@ def q_proj_decoder(self) -> ColumnParallelLinear:
         for name, param in self.named_parameters():
             target_param = getattr(layer, name, None)
             if target_param is not None:
-                self.sync_weight_attrs(param,
-                                       target_param,
-                                       mode="q_proj_decoder")
+                self.sync_weight_attrs(param, target_param, mode="q_proj_decoder")
         return layer
 
     @property
@@ -1485,9 +1566,7 @@ def kv_proj_encoder(self) -> QKVParallelLinear:
         for name, param in self.named_parameters():
             target_param = getattr(layer, name, None)
             if target_param is not None:
-                self.sync_weight_attrs(param,
-                                       target_param,
-                                       mode="kv_proj_encoder")
+                self.sync_weight_attrs(param, target_param, mode="kv_proj_encoder")
         return layer
 
     def sync_weight_attrs(
@@ -1498,15 +1577,14 @@ def sync_weight_attrs(
     ):
         missing_attrs_dict = {
             k: getattr(src_param, k)
-            for k in (set(vars(src_param).keys()) -
-                      set(vars(tgt_param).keys()))
+            for k in (set(vars(src_param).keys()) - set(vars(tgt_param).keys()))
         }
         # TODO(Isotr0py): handle bitsandbytes 8bit
-        use_bitsandbytes_4bit = getattr(src_param, "use_bitsandbytes_4bit",
-                                        False)
-        if (missing_attrs_dict and use_bitsandbytes_4bit):
+        use_bitsandbytes_4bit = getattr(src_param, "use_bitsandbytes_4bit", False)
+        if missing_attrs_dict and use_bitsandbytes_4bit:
             q_proj_attrs, kv_proj_attrs = left_shift_bitsandbytes_4bit_shard(
-                missing_attrs_dict)
+                missing_attrs_dict
+            )
             if mode == "q_proj_decoder":
                 set_weight_attrs(tgt_param, q_proj_attrs)
             elif mode == "kv_proj_encoder":
@@ -1524,12 +1602,10 @@ def _is_same_param(
         key_to_ignore = ["weight_loader", "_weight_loader"]
         has_same_type_name = type(src_param) is type(map_param)
         src_param_attrs = {
-            k: v
-            for k, v in src_param.__dict__.items() if k not in key_to_ignore
+            k: v for k, v in src_param.__dict__.items() if k not in key_to_ignore
         }
         map_param_attrs = {
-            k: v
-            for k, v in map_param.__dict__.items() if k not in key_to_ignore
+            k: v for k, v in map_param.__dict__.items() if k not in key_to_ignore
         }
         has_same_attrs = src_param_attrs == map_param_attrs
         return has_same_type_name and has_same_attrs
@@ -1540,12 +1616,11 @@ def select_proj_params(
         param: nn.Parameter,
     ) -> nn.Parameter:
         """
-        Given the placeholder param, 
+        Given the placeholder param,
         return the corresponding param in the proj layers.
         """
         target_param_list = [
-            v for _, v in layer.named_parameters()
-            if self._is_same_param(param, v)
+            v for _, v in layer.named_parameters() if self._is_same_param(param, v)
         ]
         assert len(target_param_list) == 1
         target_param = target_param_list[0]
@@ -1568,26 +1643,28 @@ def forward(  # type: ignore[override]
             k, v = kv_enc.split(self.kv_size, dim=-1)
         return q, k, v
 
-    def weight_loader_v1(self,
-                         param: torch.nn.Parameter,
-                         loaded_weight: torch.Tensor,
-                         loaded_shard_id: Optional[str] = None):
+    def weight_loader_v1(
+        self,
+        param: torch.nn.Parameter,
+        loaded_weight: torch.Tensor,
+        loaded_shard_id: Optional[str] = None,
+    ):
         # just like all other parameters, does not yet
         # support loading bias with weight_loader_v2
-        layer = (self.q_proj_decoder
-                 if loaded_shard_id == "q" else self.kv_proj_encoder)
+        layer = self.q_proj_decoder if loaded_shard_id == "q" else self.kv_proj_encoder
         target_param = self.select_proj_params(layer, param)
-        shard_id_args = (loaded_shard_id, ) if loaded_shard_id != "q" else ()
+        shard_id_args = (loaded_shard_id,) if loaded_shard_id != "q" else ()
         layer.weight_loader(target_param, loaded_weight, *shard_id_args)
 
-    def weight_loader(self,
-                      param: torch.nn.Parameter,
-                      loaded_weight: torch.Tensor,
-                      loaded_shard_id: Optional[str] = None):
-        layer = (self.q_proj_decoder
-                 if loaded_shard_id == "q" else self.kv_proj_encoder)
+    def weight_loader(
+        self,
+        param: torch.nn.Parameter,
+        loaded_weight: torch.Tensor,
+        loaded_shard_id: Optional[str] = None,
+    ):
+        layer = self.q_proj_decoder if loaded_shard_id == "q" else self.kv_proj_encoder
         target_param = self.select_proj_params(layer, param)
-        shard_id_args = (loaded_shard_id, ) if loaded_shard_id != "q" else ()
+        shard_id_args = (loaded_shard_id,) if loaded_shard_id != "q" else ()
         if self.quant_method.__class__.__name__ in WEIGHT_LOADER_V2_SUPPORTED:
             layer.weight_loader_v2(target_param, loaded_weight, *shard_id_args)
         else:
diff --git a/vllm/model_executor/layers/logits_processor.py b/vllm/model_executor/layers/logits_processor.py
index 2110aa2769b9..3db5e0b32553 100644
--- a/vllm/model_executor/layers/logits_processor.py
+++ b/vllm/model_executor/layers/logits_processor.py
@@ -1,15 +1,17 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """A layer that compute logits from hidden_stats."""
+
 from typing import Optional
 
 import torch
 
-from vllm.distributed import (tensor_model_parallel_all_gather,
-                              tensor_model_parallel_gather)
+from vllm.distributed import (
+    tensor_model_parallel_all_gather,
+    tensor_model_parallel_gather,
+)
 from vllm.model_executor.custom_op import CustomOp
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.platforms import current_platform
 
 
@@ -23,12 +25,14 @@ class LogitsProcessor(CustomOp):
     3. Apply logits processors (if any).
     """
 
-    def __init__(self,
-                 vocab_size: int,
-                 org_vocab_size: Optional[int] = None,
-                 scale: float = 1.0,
-                 logits_as_input: bool = False,
-                 soft_cap: Optional[float] = None) -> None:
+    def __init__(
+        self,
+        vocab_size: int,
+        org_vocab_size: Optional[int] = None,
+        scale: float = 1.0,
+        logits_as_input: bool = False,
+        soft_cap: Optional[float] = None,
+    ) -> None:
         """
         Args:
             scale: A scaling factor to apply to the logits.
@@ -87,16 +91,14 @@ def _get_logits(
         embedding_bias: Optional[torch.Tensor],
     ) -> Optional[torch.Tensor]:
         # Get the logits for the next tokens.
-        logits = lm_head.quant_method.apply(lm_head,
-                                            hidden_states,
-                                            bias=embedding_bias)
+        logits = lm_head.quant_method.apply(lm_head, hidden_states, bias=embedding_bias)
 
         # Gather logits for TP
         logits = self._gather_logits(logits)
 
         # Remove paddings in vocab (if any).
         if logits is not None:
-            logits = logits[..., :self.org_vocab_size]
+            logits = logits[..., : self.org_vocab_size]
         return logits
 
     def extra_repr(self) -> str:
diff --git a/vllm/model_executor/layers/mamba/linear_attn.py b/vllm/model_executor/layers/mamba/linear_attn.py
index 319133777992..99f05e2eca0e 100644
--- a/vllm/model_executor/layers/mamba/linear_attn.py
+++ b/vllm/model_executor/layers/mamba/linear_attn.py
@@ -19,16 +19,21 @@
 from vllm.config import CacheConfig, ModelConfig, get_current_vllm_config
 from vllm.distributed.communication_op import tensor_model_parallel_all_reduce
 from vllm.distributed.parallel_state import (
-    get_tensor_model_parallel_rank, get_tensor_model_parallel_world_size)
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.forward_context import ForwardContext, get_forward_context
 from vllm.model_executor.custom_op import CustomOp
 from vllm.model_executor.layers.lightning_attn import (
-    lightning_attention, linear_decode_forward_triton)
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               RowParallelLinear)
+    lightning_attention,
+    linear_decode_forward_triton,
+)
+from vllm.model_executor.layers.linear import ColumnParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.mamba.abstract import MambaBase
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.utils import direct_register_custom_op
 from vllm.v1.attention.backends.linear_attn import LinearAttentionMetadata
@@ -47,8 +52,7 @@ def __init__(self, hidden_size: int, eps: float = 1e-6) -> None:
         super().__init__()
         self.tp_world = get_tensor_model_parallel_world_size()
         self.tp_rank = get_tensor_model_parallel_rank()
-        self.weight = nn.Parameter(torch.ones(int(hidden_size /
-                                                  self.tp_world)))
+        self.weight = nn.Parameter(torch.ones(int(hidden_size / self.tp_world)))
 
         self.weight.weight_loader = self.weight_loader
         self.variance_epsilon = eps
@@ -75,8 +79,7 @@ def _forward(
         x = x.to(torch.float32)
         variance = x.pow(2).mean(dim=-1, keepdim=True, dtype=torch.float32)
         if self.tp_world > 1:
-            variance = tensor_model_parallel_all_reduce(
-                variance) / self.tp_world
+            variance = tensor_model_parallel_all_reduce(variance) / self.tp_world
         x = x * torch.rsqrt(variance + self.variance_epsilon)
         x = x.to(orig_dtype) * self.weight
         return x
@@ -91,17 +94,17 @@ def forward(
 
 
 class MiniMaxText01LinearKernel:
-
     @staticmethod
-    def jit_linear_forward_prefix(q: torch.Tensor,
-                                  k: torch.Tensor,
-                                  v: torch.Tensor,
-                                  kv_caches: torch.Tensor,
-                                  slope_rate: torch.Tensor,
-                                  block_size: int,
-                                  layer_idx: Optional[int] = None,
-                                  **kwargs) -> torch.Tensor:
-
+    def jit_linear_forward_prefix(
+        q: torch.Tensor,
+        k: torch.Tensor,
+        v: torch.Tensor,
+        kv_caches: torch.Tensor,
+        slope_rate: torch.Tensor,
+        block_size: int,
+        layer_idx: Optional[int] = None,
+        **kwargs,
+    ) -> torch.Tensor:
         slope_rate = slope_rate.to(torch.float32)
         should_pad_dim = q.dim() == 3
         if should_pad_dim:
@@ -111,26 +114,22 @@ def jit_linear_forward_prefix(q: torch.Tensor,
         b, h, n, d = q.shape
         e = d
         kv_history = kv_caches.reshape(1, h, d, e).contiguous()
-        output, kv_history = lightning_attention(q,
-                                                 k,
-                                                 v,
-                                                 slope_rate,
-                                                 block_size=block_size,
-                                                 kv_history=kv_history)
+        output, kv_history = lightning_attention(
+            q, k, v, slope_rate, block_size=block_size, kv_history=kv_history
+        )
         kv_caches.copy_(kv_history[:, :, -1, :, :].reshape(h, d, e))
         assert output.shape[0] == 1, "batch size must be 1"
         return rearrange(output.squeeze(0), "h n d -> n (h d)")
 
 
 class MiniMaxText01LinearAttention(nn.Module, MambaBase):
-
     @property
     def mamba_type(self) -> str:
         return "linear_attention"
 
     def get_attn_backend(self) -> type["AttentionBackend"]:
-        from vllm.v1.attention.backends.linear_attn import (
-            LinearAttentionBackend)
+        from vllm.v1.attention.backends.linear_attn import LinearAttentionBackend
+
         return LinearAttentionBackend
 
     def get_state_dtype(self) -> tuple[torch.dtype]:
@@ -143,9 +142,8 @@ def get_state_dtype(self) -> tuple[torch.dtype]:
 
     def get_state_shape(self) -> tuple[tuple[int, int, int], ...]:
         return MambaStateShapeCalculator.linear_attention_state_shape(
-            num_heads=self.num_heads,
-            tp_size=self.tp_size,
-            head_dim=self.head_dim)
+            num_heads=self.num_heads, tp_size=self.tp_size, head_dim=self.head_dim
+        )
 
     def __init__(
         self,
@@ -209,16 +207,16 @@ def __init__(
             eps=1e-5,
         )
 
-        slope_rate = MiniMaxText01LinearAttention._build_slope_tensor(
-            self.num_heads)
+        slope_rate = MiniMaxText01LinearAttention._build_slope_tensor(self.num_heads)
         if num_hidden_layer <= 1:
             self.slope_rate = slope_rate * (1 + 1e-5)
         else:
-            self.slope_rate = slope_rate * (1 - layer_idx /
-                                            (num_hidden_layer - 1) + 1e-5)
-        self.tp_slope = self.slope_rate[self.tp_rank *
-                                        self.tp_heads:(self.tp_rank + 1) *
-                                        self.tp_heads].contiguous()
+            self.slope_rate = slope_rate * (
+                1 - layer_idx / (num_hidden_layer - 1) + 1e-5
+            )
+        self.tp_slope = self.slope_rate[
+            self.tp_rank * self.tp_heads : (self.tp_rank + 1) * self.tp_heads
+        ].contiguous()
 
         compilation_config = get_current_vllm_config().compilation_config
         if prefix in compilation_config.static_forward_context:
@@ -226,36 +224,36 @@ def __init__(
         compilation_config.static_forward_context[prefix] = self
 
     @staticmethod
-    def weight_direct_load(param: torch.Tensor,
-                           loaded_weight: torch.Tensor) -> None:
+    def weight_direct_load(param: torch.Tensor, loaded_weight: torch.Tensor) -> None:
         assert param.size() == loaded_weight.size()
         param.data.copy_(loaded_weight)
         return
 
     @staticmethod
     def _build_slope_tensor(n_attention_heads: int):
-
         def get_slopes(n):
-
             def get_slopes_power_of_2(n):
-                start = 2**(-(2**-(math.log2(n) - 3)))
+                start = 2 ** (-(2 ** -(math.log2(n) - 3)))
                 ratio = start
                 return [start * ratio**i for i in range(n)]
 
             if math.log2(n).is_integer():
                 return get_slopes_power_of_2(n)
             else:
-                closest_power_of_2 = 2**math.floor(math.log2(n))
-                return (get_slopes_power_of_2(closest_power_of_2) + get_slopes(
-                    2 * closest_power_of_2)[0::2][:n - closest_power_of_2])
-
-        slopes = torch.tensor(get_slopes(n_attention_heads),
-                              dtype=torch.float32).reshape(
-                                  n_attention_heads, 1, 1)
+                closest_power_of_2 = 2 ** math.floor(math.log2(n))
+                return (
+                    get_slopes_power_of_2(closest_power_of_2)
+                    + get_slopes(2 * closest_power_of_2)[0::2][: n - closest_power_of_2]
+                )
+
+        slopes = torch.tensor(
+            get_slopes(n_attention_heads), dtype=torch.float32
+        ).reshape(n_attention_heads, 1, 1)
         return slopes
 
-    def _prefill_and_mix_infer(self, q, k, v, kv_cache, state_indices_tensor,
-                               attn_metadata):
+    def _prefill_and_mix_infer(
+        self, q, k, v, kv_cache, state_indices_tensor, attn_metadata
+    ):
         hidden = []
         for _prefill_idx in range(getattr(attn_metadata, "num_prefills", 0)):
             if _prefill_idx >= len(attn_metadata.query_start_loc):
@@ -278,12 +276,13 @@ def _prefill_and_mix_infer(self, q, k, v, kv_cache, state_indices_tensor,
                 slice_layer_cache,
                 self.tp_slope,
                 self.BLOCK,
-                layer_idx=self.layer_idx)
+                layer_idx=self.layer_idx,
+            )
             hidden.append(out_slice.contiguous())
         if attn_metadata.num_decode_tokens > 0:
-            hidden_decode = self._decode_infer(q, k, v, kv_cache,
-                                               state_indices_tensor,
-                                               attn_metadata)
+            hidden_decode = self._decode_infer(
+                q, k, v, kv_cache, state_indices_tensor, attn_metadata
+            )
             hidden.insert(0, hidden_decode)
 
         if not hidden:
@@ -292,18 +291,19 @@ def _prefill_and_mix_infer(self, q, k, v, kv_cache, state_indices_tensor,
         hidden = torch.concat(hidden, dim=0).contiguous()
         return hidden
 
-    def _decode_infer(self, q, k, v, kv_cache, state_indices_tensor,
-                      attn_metadata):
-        q = q[:attn_metadata.num_decode_tokens].unsqueeze(2).contiguous()
-        k = k[:attn_metadata.num_decode_tokens].unsqueeze(2).contiguous()
-        v = v[:attn_metadata.num_decode_tokens].unsqueeze(2).contiguous()
-        slot_id = state_indices_tensor[:attn_metadata.num_decodes]
-        hidden = linear_decode_forward_triton(q, k, v, kv_cache, self.tp_slope,
-                                              slot_id, 32)
+    def _decode_infer(self, q, k, v, kv_cache, state_indices_tensor, attn_metadata):
+        q = q[: attn_metadata.num_decode_tokens].unsqueeze(2).contiguous()
+        k = k[: attn_metadata.num_decode_tokens].unsqueeze(2).contiguous()
+        v = v[: attn_metadata.num_decode_tokens].unsqueeze(2).contiguous()
+        slot_id = state_indices_tensor[: attn_metadata.num_decodes]
+        hidden = linear_decode_forward_triton(
+            q, k, v, kv_cache, self.tp_slope, slot_id, 32
+        )
         return hidden
 
-    def forward(self, hidden_states: torch.Tensor, output: torch.Tensor,
-                positions: torch.Tensor) -> None:
+    def forward(
+        self, hidden_states: torch.Tensor, output: torch.Tensor, positions: torch.Tensor
+    ) -> None:
         torch.ops.vllm.linear_attention(
             hidden_states,
             output,
@@ -311,16 +311,18 @@ def forward(self, hidden_states: torch.Tensor, output: torch.Tensor,
             self.prefix,
         )
 
-    def _forward(self, hidden_states: torch.Tensor, output: torch.Tensor,
-                 positions: torch.Tensor) -> None:
+    def _forward(
+        self, hidden_states: torch.Tensor, output: torch.Tensor, positions: torch.Tensor
+    ) -> None:
         forward_context = get_forward_context()
         attn_metadata: AttentionMetadata = forward_context.attn_metadata
         if attn_metadata is not None:
             assert isinstance(attn_metadata, dict)
             attn_metadata = attn_metadata[self.prefix]
             assert isinstance(attn_metadata, LinearAttentionMetadata)
-            num_actual_tokens = attn_metadata.num_prefill_tokens + \
-                attn_metadata.num_decode_tokens
+            num_actual_tokens = (
+                attn_metadata.num_prefill_tokens + attn_metadata.num_decode_tokens
+            )
         else:
             num_actual_tokens = hidden_states.shape[0]
 
@@ -335,35 +337,39 @@ def _forward(self, hidden_states: torch.Tensor, output: torch.Tensor,
 
             num_prefills = getattr(attn_metadata, "num_prefills", 0)
             if num_prefills > 0:
-                num_decode_tokens = getattr(attn_metadata, "num_decode_tokens",
-                                            0)
+                num_decode_tokens = getattr(attn_metadata, "num_decode_tokens", 0)
                 for prefill_idx in range(num_prefills):
-                    q_start = attn_metadata.query_start_loc[num_decode_tokens +
-                                                            prefill_idx]
-                    q_end = attn_metadata.query_start_loc[num_decode_tokens +
-                                                          prefill_idx + 1]
+                    q_start = attn_metadata.query_start_loc[
+                        num_decode_tokens + prefill_idx
+                    ]
+                    q_end = attn_metadata.query_start_loc[
+                        num_decode_tokens + prefill_idx + 1
+                    ]
                     query_len = q_end - q_start
-                    context_len = attn_metadata.seq_lens[
-                        num_decode_tokens + prefill_idx] - query_len
+                    context_len = (
+                        attn_metadata.seq_lens[num_decode_tokens + prefill_idx]
+                        - query_len
+                    )
                     if context_len == 0:
-                        block_to_clear = state_indices_tensor[num_decode_tokens
-                                                              + prefill_idx]
+                        block_to_clear = state_indices_tensor[
+                            num_decode_tokens + prefill_idx
+                        ]
                         kv_cache[block_to_clear, ...] = 0
 
         decode_only = getattr(attn_metadata, "num_prefills", 0) == 0
         if attn_metadata is None:
-            hidden = torch.empty((q.shape[0], q.shape[1] * q.shape[2]),
-                                 device=q.device,
-                                 dtype=q.dtype)
+            hidden = torch.empty(
+                (q.shape[0], q.shape[1] * q.shape[2]), device=q.device, dtype=q.dtype
+            )
         else:
             if not decode_only:
-                hidden = self._prefill_and_mix_infer(q, k, v, kv_cache,
-                                                     state_indices_tensor,
-                                                     attn_metadata)
+                hidden = self._prefill_and_mix_infer(
+                    q, k, v, kv_cache, state_indices_tensor, attn_metadata
+                )
             else:
-                hidden = self._decode_infer(q, k, v, kv_cache,
-                                            state_indices_tensor,
-                                            attn_metadata)
+                hidden = self._decode_infer(
+                    q, k, v, kv_cache, state_indices_tensor, attn_metadata
+                )
         hidden = self.norm._forward(hidden)
         gate, _ = self.output_gate(hidden_states[:num_actual_tokens])
         hidden = F.sigmoid(gate) * hidden
@@ -380,9 +386,7 @@ def linear_attention(
 ) -> None:
     forward_context: ForwardContext = get_forward_context()
     self = forward_context.no_compile_layers[layer_name]
-    self._forward(hidden_states=hidden_states,
-                  output=output,
-                  positions=positions)
+    self._forward(hidden_states=hidden_states, output=output, positions=positions)
 
 
 def linear_attention_fake(
diff --git a/vllm/model_executor/layers/mamba/mamba_mixer.py b/vllm/model_executor/layers/mamba/mamba_mixer.py
index d64854cdb381..8ab77965ae80 100644
--- a/vllm/model_executor/layers/mamba/mamba_mixer.py
+++ b/vllm/model_executor/layers/mamba/mamba_mixer.py
@@ -12,20 +12,30 @@
 
 from vllm.config import CacheConfig, ModelConfig, get_current_vllm_config
 from vllm.distributed.parallel_state import (
-    get_tensor_model_parallel_rank, get_tensor_model_parallel_world_size)
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.forward_context import ForwardContext, get_forward_context
 from vllm.model_executor.custom_op import CustomOp
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.mamba.abstract import MambaBase
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.mamba.ops.causal_conv1d import (
-    causal_conv1d_fn, causal_conv1d_update)
+    causal_conv1d_fn,
+    causal_conv1d_update,
+)
 from vllm.model_executor.layers.mamba.ops.mamba_ssm import (
-    selective_scan_fn, selective_state_update)
+    selective_scan_fn,
+    selective_state_update,
+)
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.utils import direct_register_custom_op
 from vllm.v1.attention.backends.mamba1_attn import Mamba1AttentionMetadata
@@ -44,22 +54,24 @@ class MambaMixer(MambaBase, CustomOp):
     **selective** state spaces)
     """
 
-    def __init__(self,
-                 hidden_size: int,
-                 ssm_state_size: int,
-                 conv_kernel_size: int,
-                 intermediate_size: int,
-                 time_step_rank: int,
-                 use_conv_bias: bool,
-                 use_bias: bool,
-                 use_rms_norm: bool,
-                 rms_norm_has_weight: bool = True,
-                 rms_norm_eps: float = 1e-5,
-                 activation="silu",
-                 is_lora_enabled: bool = False,
-                 model_config: Optional[ModelConfig] = None,
-                 cache_config: Optional[CacheConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        hidden_size: int,
+        ssm_state_size: int,
+        conv_kernel_size: int,
+        intermediate_size: int,
+        time_step_rank: int,
+        use_conv_bias: bool,
+        use_bias: bool,
+        use_rms_norm: bool,
+        rms_norm_has_weight: bool = True,
+        rms_norm_eps: float = 1e-5,
+        activation="silu",
+        is_lora_enabled: bool = False,
+        model_config: Optional[ModelConfig] = None,
+        cache_config: Optional[CacheConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.time_step_rank = time_step_rank
         self.ssm_state_size = ssm_state_size
@@ -80,9 +92,9 @@ def __init__(self,
         # doesn't allow to override it
         self.conv1d.weight.data = self.conv1d.weight.data.unsqueeze(1)
 
-        self.in_proj = MergedColumnParallelLinear(hidden_size,
-                                                  [intermediate_size] * 2,
-                                                  bias=use_bias)
+        self.in_proj = MergedColumnParallelLinear(
+            hidden_size, [intermediate_size] * 2, bias=use_bias
+        )
 
         # selective projection used to make dt, B and C input dependent
         self.x_proj = RowParallelLinear(
@@ -93,17 +105,18 @@ def __init__(self,
         # time step projection (discretization) -
         # In the forward we need to apply dt_proj without the bias,
         # as the bias is added in the selective scan kernel.
-        self.dt_proj = ColumnParallelLinear(time_step_rank,
-                                            intermediate_size,
-                                            bias=True,
-                                            skip_bias_add=True)
+        self.dt_proj = ColumnParallelLinear(
+            time_step_rank, intermediate_size, bias=True, skip_bias_add=True
+        )
 
         def weight_loader(param: Parameter, loaded_weight: torch.Tensor):
             tp_rank = get_tensor_model_parallel_rank()
             tp_size = get_tensor_model_parallel_world_size()
             param.data.copy_(
-                loaded_weight.data.split(loaded_weight.shape[0] // tp_size,
-                                         dim=0)[tp_rank])
+                loaded_weight.data.split(loaded_weight.shape[0] // tp_size, dim=0)[
+                    tp_rank
+                ]
+            )
 
         def A_weight_loader(param: Parameter, loaded_weight: torch.Tensor):
             weight_loader(param, -torch.exp(loaded_weight.float()))
@@ -114,7 +127,8 @@ def A_weight_loader(param: Parameter, loaded_weight: torch.Tensor):
                 intermediate_size // tp_size,
                 ssm_state_size,
                 dtype=torch.float32,
-            ))
+            )
+        )
         self.D = nn.Parameter(torch.ones(intermediate_size // tp_size))
 
         set_weight_attrs(self.D, {"weight_loader": weight_loader})
@@ -127,23 +141,35 @@ def A_weight_loader(param: Parameter, loaded_weight: torch.Tensor):
             input_is_parallel=True,
         )
 
-        self.dt_layernorm = RMSNorm(
-            time_step_rank,
-            eps=rms_norm_eps,
-            has_weight=rms_norm_has_weight,
-        ) if use_rms_norm else None
+        self.dt_layernorm = (
+            RMSNorm(
+                time_step_rank,
+                eps=rms_norm_eps,
+                has_weight=rms_norm_has_weight,
+            )
+            if use_rms_norm
+            else None
+        )
 
-        self.b_layernorm = RMSNorm(
-            ssm_state_size,
-            eps=rms_norm_eps,
-            has_weight=rms_norm_has_weight,
-        ) if use_rms_norm else None
+        self.b_layernorm = (
+            RMSNorm(
+                ssm_state_size,
+                eps=rms_norm_eps,
+                has_weight=rms_norm_has_weight,
+            )
+            if use_rms_norm
+            else None
+        )
 
-        self.c_layernorm = RMSNorm(
-            ssm_state_size,
-            eps=rms_norm_eps,
-            has_weight=rms_norm_has_weight,
-        ) if use_rms_norm else None
+        self.c_layernorm = (
+            RMSNorm(
+                ssm_state_size,
+                eps=rms_norm_eps,
+                has_weight=rms_norm_has_weight,
+            )
+            if use_rms_norm
+            else None
+        )
 
         compilation_config = get_current_vllm_config().compilation_config
         if prefix in compilation_config.static_forward_context:
@@ -157,7 +183,7 @@ def A_weight_loader(param: Parameter, loaded_weight: torch.Tensor):
         self.prefix = prefix
 
     def _ssm_transform(
-            self, x: torch.Tensor
+        self, x: torch.Tensor
     ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
         if self.is_lora_enabled:
             #  Lora kernel requires contiguous tensor.
@@ -167,7 +193,8 @@ def _ssm_transform(
         time_step, B, C = torch.split(
             ssm_params,
             [self.time_step_rank, self.ssm_state_size, self.ssm_state_size],
-            dim=-1)
+            dim=-1,
+        )
         if self.use_rms_norm:
             assert self.dt_layernorm is not None
             assert self.b_layernorm is not None
@@ -185,8 +212,7 @@ def forward(self, hidden_states: torch.Tensor, output: torch.Tensor):
             self.prefix,
         )
 
-    def forward_native(self, hidden_states: torch.Tensor,
-                       output: torch.Tensor):
+    def forward_native(self, hidden_states: torch.Tensor, output: torch.Tensor):
         pass
 
     def forward_cuda(self, hidden_states: torch.Tensor, output: torch.Tensor):
@@ -232,8 +258,9 @@ def forward_cuda(self, hidden_states: torch.Tensor, output: torch.Tensor):
         projected_states = self.in_proj(hidden_states)[0].transpose(-2, -1)
         hidden_states_BC, gate = projected_states.chunk(2, dim=-2)
 
-        conv_weights = self.conv1d.weight.view(self.conv1d.weight.size(0),
-                                               self.conv1d.weight.size(2))
+        conv_weights = self.conv1d.weight.view(
+            self.conv1d.weight.size(0), self.conv1d.weight.size(2)
+        )
 
         if attn_metadata is None:
             # V1 profile run
@@ -281,10 +308,12 @@ def forward_cuda(self, hidden_states: torch.Tensor, output: torch.Tensor):
                 conv_states=conv_state,
                 has_initial_state=has_initial_states_p,
                 cache_indices=state_indices_tensor_p,
-                query_start_loc=query_start_loc_p)
+                query_start_loc=query_start_loc_p,
+            )
             # 3. State Space Model sequence transformations.
             discrete_time_step_p, B_p, C_p = self._ssm_transform(
-                conv_out_p.transpose(-2, -1))
+                conv_out_p.transpose(-2, -1)
+            )
             time_proj_bias = self._time_proj_bias()
 
             # 4. Perform the recurrence y ← SSM(A, B, C, Δ)(x)
@@ -301,7 +330,8 @@ def forward_cuda(self, hidden_states: torch.Tensor, output: torch.Tensor):
                 delta_softplus=True,
                 cache_indices=state_indices_tensor_p,
                 has_initial_state=has_initial_states_p,
-                query_start_loc=query_start_loc_p)
+                query_start_loc=query_start_loc_p,
+            )
             ssm_outputs.append(scan_out_p)
 
         if has_decode:
@@ -312,39 +342,42 @@ def forward_cuda(self, hidden_states: torch.Tensor, output: torch.Tensor):
                 conv_weights,
                 self.conv1d.bias,
                 self.activation,
-                conv_state_indices=state_indices_tensor_d).transpose(0, 1)
+                conv_state_indices=state_indices_tensor_d,
+            ).transpose(0, 1)
 
             # 3. State Space Model sequence transformation.
             discrete_time_step_d, B_d, C_d = self._ssm_transform(
-                conv_out_d.transpose(-2, -1))
+                conv_out_d.transpose(-2, -1)
+            )
             time_proj_bias = self._time_proj_bias()
 
             # 4. Perform the recurrence y ← SSM(A, B, C, Δ)(x)
-            scan_outputs_d = torch.empty_like(
-                hidden_states_BC_d.transpose(0, 1))
-            selective_state_update(ssm_state,
-                                   conv_out_d.transpose(0, 1),
-                                   discrete_time_step_d.transpose(0, 1),
-                                   self.A,
-                                   B_d,
-                                   C_d,
-                                   self.D,
-                                   gate_d.transpose(0, 1),
-                                   time_proj_bias,
-                                   dt_softplus=True,
-                                   state_batch_indices=state_indices_tensor_d,
-                                   out=scan_outputs_d)
+            scan_outputs_d = torch.empty_like(hidden_states_BC_d.transpose(0, 1))
+            selective_state_update(
+                ssm_state,
+                conv_out_d.transpose(0, 1),
+                discrete_time_step_d.transpose(0, 1),
+                self.A,
+                B_d,
+                C_d,
+                self.D,
+                gate_d.transpose(0, 1),
+                time_proj_bias,
+                dt_softplus=True,
+                state_batch_indices=state_indices_tensor_d,
+                out=scan_outputs_d,
+            )
             scan_outputs_d = scan_outputs_d.transpose(0, 1)
 
             ssm_outputs.insert(0, scan_outputs_d)
 
-        scan_outputs_combined = ssm_outputs[0] if len(
-            ssm_outputs) == 1 else torch.cat(ssm_outputs, dim=-1)
+        scan_outputs_combined = (
+            ssm_outputs[0] if len(ssm_outputs) == 1 else torch.cat(ssm_outputs, dim=-1)
+        )
 
         # 5. Final output projection
         if self.is_lora_enabled:  # Lora kernel requires contiguous tensor.
-            scan_outputs_combined = scan_outputs_combined.transpose(
-                -2, -1).contiguous()
+            scan_outputs_combined = scan_outputs_combined.transpose(-2, -1).contiguous()
             out = self.out_proj(scan_outputs_combined)[0]
         else:
             out = self.out_proj(scan_outputs_combined.transpose(-2, -1))[0]
@@ -373,8 +406,8 @@ def mamba_type(self) -> str:
         return "mamba1"
 
     def get_attn_backend(self) -> type["AttentionBackend"]:
-        from vllm.v1.attention.backends.mamba1_attn import (
-            Mamba1AttentionBackend)
+        from vllm.v1.attention.backends.mamba1_attn import Mamba1AttentionBackend
+
         return Mamba1AttentionBackend
 
     def _time_proj_bias(self) -> Optional[torch.Tensor]:
@@ -406,27 +439,34 @@ def split_batch_to_prefill_and_decode(
     num_decodes: int,
     num_padded_decodes: int,
 ) -> PrefillDecodeSplit:
-
     num_actual_tokens = num_prefill_tokens + num_padded_decodes
 
     # In v1, decode tokens come first, then prefill tokens.
     hidden_states_BC_d, hidden_states_BC_p = torch.split(
         hidden_states_BC[..., :num_actual_tokens],
         [num_padded_decodes, num_prefill_tokens],
-        dim=-1)
-    gate_d, gate_p = torch.split(gate[..., :num_actual_tokens],
-                                 [num_padded_decodes, num_prefill_tokens],
-                                 dim=-1)
+        dim=-1,
+    )
+    gate_d, gate_p = torch.split(
+        gate[..., :num_actual_tokens], [num_padded_decodes, num_prefill_tokens], dim=-1
+    )
 
     # num_padded_decodes accounts for CUDA graph padding when applicable
     state_indices_tensor_d, state_indices_tensor_p = torch.split(
-        state_indices_tensor[:num_padded_decodes + num_prefills],
+        state_indices_tensor[: num_padded_decodes + num_prefills],
         [num_padded_decodes, num_prefills],
-        dim=0)
-    query_start_loc_p = (query_start_loc[-num_prefills - 1:] -
-                         num_padded_decodes if num_prefills > 0 else None)
-    has_initial_states_p = has_initial_states[-num_prefills:] if (
-        has_initial_states is not None and num_prefills > 0) else None
+        dim=0,
+    )
+    query_start_loc_p = (
+        query_start_loc[-num_prefills - 1 :] - num_padded_decodes
+        if num_prefills > 0
+        else None
+    )
+    has_initial_states_p = (
+        has_initial_states[-num_prefills:]
+        if (has_initial_states is not None and num_prefills > 0)
+        else None
+    )
 
     return PrefillDecodeSplit(
         hidden_states_BC_p=hidden_states_BC_p,
diff --git a/vllm/model_executor/layers/mamba/mamba_mixer2.py b/vllm/model_executor/layers/mamba/mamba_mixer2.py
index 56df9cf511e6..12b2c78f1a74 100644
--- a/vllm/model_executor/layers/mamba/mamba_mixer2.py
+++ b/vllm/model_executor/layers/mamba/mamba_mixer2.py
@@ -11,28 +11,40 @@
 
 from vllm.attention.backends.abstract import AttentionMetadata
 from vllm.config import CacheConfig, ModelConfig, get_current_vllm_config
-from vllm.distributed import (divide, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_gather,
-                              tensor_model_parallel_all_reduce)
+from vllm.distributed import (
+    divide,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_gather,
+    tensor_model_parallel_all_reduce,
+)
 from vllm.forward_context import ForwardContext, get_forward_context
 from vllm.model_executor.custom_op import CustomOp
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.mamba.abstract import MambaBase
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.mamba.ops.causal_conv1d import (
-    causal_conv1d_fn, causal_conv1d_update)
+    causal_conv1d_fn,
+    causal_conv1d_update,
+)
 from vllm.model_executor.layers.mamba.ops.layernorm_gated import rms_norm_gated
-from vllm.model_executor.layers.mamba.ops.mamba_ssm import (
-    selective_state_update)
+from vllm.model_executor.layers.mamba.ops.mamba_ssm import selective_state_update
 from vllm.model_executor.layers.mamba.ops.ssd_combined import (
-    mamba_chunk_scan_combined_varlen)
+    mamba_chunk_scan_combined_varlen,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import (
-    LoaderFunction, composed_weight_loader, sharded_weight_loader)
+    LoaderFunction,
+    composed_weight_loader,
+    sharded_weight_loader,
+)
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.utils import direct_register_custom_op
 from vllm.v1.attention.backends.mamba2_attn import Mamba2AttentionMetadata
@@ -43,12 +55,13 @@
 # Adapted from transformers.models.mamba2.modeling_mamba2.MambaRMSNormGated
 @CustomOp.register("mixer2_gated_rms_norm")
 class Mixer2RMSNormGated(CustomOp):
-
-    def __init__(self,
-                 full_hidden_size: int,
-                 full_n_groups: int,
-                 use_rms_norm: bool = True,
-                 eps: float = 1e-6):
+    def __init__(
+        self,
+        full_hidden_size: int,
+        full_n_groups: int,
+        use_rms_norm: bool = True,
+        eps: float = 1e-6,
+    ):
         super().__init__()
         self.tp_size = get_tensor_model_parallel_world_size()
         self.tp_rank = get_tensor_model_parallel_rank()
@@ -62,13 +75,13 @@ def __init__(self,
         if self.use_rms_norm:
             # Register norm weight only if we're actually applying RMSNorm
             self.weight = nn.Parameter(torch.ones(self.per_rank_hidden_size))
-            set_weight_attrs(self.weight,
-                             {"weight_loader": sharded_weight_loader(0)})
+            set_weight_attrs(self.weight, {"weight_loader": sharded_weight_loader(0)})
         else:
             # Avoid checkpoint mismatch by skipping unused parameter
             self.register_parameter("weight", None)
-        assert (self.full_hidden_size % self.tp_size == 0
-                ), "Tensor parallel world size must divide hidden size."
+        assert self.full_hidden_size % self.tp_size == 0, (
+            "Tensor parallel world size must divide hidden size."
+        )
 
     def forward_native(
         self,
@@ -111,8 +124,7 @@ def forward_native(
             group_count = hidden_dim // self.group_size
             x_grouped = x.view(*prefix_dims, group_count, self.group_size)
             variance = x_grouped.pow(2).mean(-1, keepdim=True)
-            x_grouped = x_grouped * torch.rsqrt(variance +
-                                                self.variance_epsilon)
+            x_grouped = x_grouped * torch.rsqrt(variance + self.variance_epsilon)
             x = x_grouped.view(*prefix_dims, hidden_dim)
 
             if redundant_tp:
@@ -130,18 +142,19 @@ def forward_cuda(
         input_dtype = x.dtype
         if not self.use_rms_norm:
             # Keep gate in float32 for numerical stability during silu
-            return x * nn.functional.silu(gate.to(
-                torch.float32)).to(input_dtype)
+            return x * nn.functional.silu(gate.to(torch.float32)).to(input_dtype)
 
-        if (((self.n_groups % self.tp_size) != 0) or self.n_groups != 1):
+        if ((self.n_groups % self.tp_size) != 0) or self.n_groups != 1:
             return self.forward_native(x, gate)
 
-        return rms_norm_gated(x,
-                              self.weight.data,
-                              bias=None,
-                              z=gate,
-                              eps=self.variance_epsilon,
-                              norm_before_gate=False)
+        return rms_norm_gated(
+            x,
+            self.weight.data,
+            bias=None,
+            z=gate,
+            eps=self.variance_epsilon,
+            norm_before_gate=False,
+        )
 
 
 def mamba_v2_sharded_weight_loader(
@@ -156,7 +169,6 @@ def mamba_v2_sharded_weight_loader(
     """
 
     def loader(param: torch.Tensor, loaded_weight: torch.Tensor) -> None:
-
         # - track boundary of (sharded) param, and loaded_weight, respectively
         boundary, loaded_boundary = 0, 0
 
@@ -191,11 +203,12 @@ def loader(param: torch.Tensor, loaded_weight: torch.Tensor) -> None:
             #   seem to handle slices well.
             # https://github.com/python/mypy/issues/2410
             param.data[
-                boundary:(boundary + take),
-                ...  # type: ignore[misc]
-            ] = loaded_weight[loaded_start_idx:(loaded_start_idx +
-                                                take)  # type: ignore[misc]
-                              ]  # type: ignore[misc]
+                boundary : (boundary + take), ...  # type: ignore[misc]
+            ] = loaded_weight[
+                loaded_start_idx : (
+                    loaded_start_idx + take
+                )  # type: ignore[misc]
+            ]  # type: ignore[misc]
 
             # move indexing boundaries
             boundary += shard_size
@@ -217,23 +230,25 @@ class MambaMixer2(MambaBase, CustomOp):
     **selective** state spaces)
     """
 
-    def __init__(self,
-                 hidden_size: int,
-                 ssm_state_size: int,
-                 conv_kernel_size: int,
-                 intermediate_size: int,
-                 use_conv_bias: bool,
-                 use_bias: bool,
-                 n_groups: int = 1,
-                 num_heads: int = 128,
-                 head_dim: int = 64,
-                 rms_norm_eps: float = 1e-5,
-                 activation: str = "silu",
-                 use_rms_norm: bool = True,
-                 model_config: Optional[ModelConfig] = None,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        hidden_size: int,
+        ssm_state_size: int,
+        conv_kernel_size: int,
+        intermediate_size: int,
+        use_conv_bias: bool,
+        use_bias: bool,
+        n_groups: int = 1,
+        num_heads: int = 128,
+        head_dim: int = 64,
+        rms_norm_eps: float = 1e-5,
+        activation: str = "silu",
+        use_rms_norm: bool = True,
+        model_config: Optional[ModelConfig] = None,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
 
         # For TP, the sharding plan is as follows:
@@ -253,15 +268,18 @@ def __init__(self,
         self.tp_size = get_tensor_model_parallel_world_size()
         tp_rank = get_tensor_model_parallel_rank()
 
-        assert (num_heads % self.tp_size == 0
-                ), "Tensor parallel world size must divide num heads."
+        assert num_heads % self.tp_size == 0, (
+            "Tensor parallel world size must divide num heads."
+        )
 
         assert (n_groups % self.tp_size) == 0 or n_groups == 1, (
             "If tensor parallel world size does not divide num_groups, "
-            "then num_groups must equal 1.")
+            "then num_groups must equal 1."
+        )
 
-        assert (n_groups % self.tp_size == 0) or self.tp_size == 1 or \
-            quant_config is None, (
+        assert (
+            (n_groups % self.tp_size == 0) or self.tp_size == 1 or quant_config is None
+        ), (
             "Tensor parallel currently supported for quantized models only "
             "if tensor parallel world size divides num groups."
         )
@@ -280,7 +298,8 @@ def __init__(self,
             # - but if n_groups cannot divide tp_size, we need to
             #   extend some extra groups
             groups = MambaStateShapeCalculator.extra_groups_for_head_shards(
-                n_groups, self.tp_size)
+                n_groups, self.tp_size
+            )
             self.n_groups = n_groups + groups
 
         self.groups_ssm_state_size = self.n_groups * self.ssm_state_size
@@ -340,8 +359,7 @@ def __init__(self,
             #   to the head shards
             group_shard_settings = (
                 self.groups_ssm_state_size,  # expected model size
-                (self.n_groups - n_groups) *
-                self.ssm_state_size,  # extra dims assigned
+                (self.n_groups - n_groups) * self.ssm_state_size,  # extra dims assigned
                 n_groups == 1,  # if there was only one group
             )
             intermediate_settings = (intermediate_size, 0, False)
@@ -355,8 +373,7 @@ def __init__(self,
             set_weight_attrs(
                 self.conv1d.bias,
                 {
-                    "weight_loader":
-                    mamba_v2_sharded_weight_loader(
+                    "weight_loader": mamba_v2_sharded_weight_loader(
                         [
                             intermediate_settings,
                             group_shard_settings,
@@ -372,8 +389,7 @@ def __init__(self,
             set_weight_attrs(
                 self.conv1d.weight,
                 {
-                    "weight_loader":
-                    mamba_v2_sharded_weight_loader(
+                    "weight_loader": mamba_v2_sharded_weight_loader(
                         [
                             intermediate_settings,
                             group_shard_settings,
@@ -391,8 +407,7 @@ def __init__(self,
                 set_weight_attrs(
                     self.in_proj.weight,
                     {
-                        "weight_loader":
-                        mamba_v2_sharded_weight_loader(
+                        "weight_loader": mamba_v2_sharded_weight_loader(
                             [
                                 intermediate_settings,  # for gate
                                 intermediate_settings,
@@ -418,17 +433,18 @@ def __init__(self,
             torch.empty(
                 divide(num_heads, self.tp_size),
                 dtype=torch.float32,
-            ))
+            )
+        )
         self.D = nn.Parameter(torch.ones(num_heads // self.tp_size))
         self.dt_bias = nn.Parameter(torch.ones(num_heads // self.tp_size))
         self.use_rms_norm = use_rms_norm
 
         set_weight_attrs(self.D, {"weight_loader": sharded_weight_loader(0)})
         a_weight_loader = composed_weight_loader(
-            sharded_weight_loader(0), lambda x: -torch.exp(x.float()))
+            sharded_weight_loader(0), lambda x: -torch.exp(x.float())
+        )
         set_weight_attrs(self.A, {"weight_loader": a_weight_loader})
-        set_weight_attrs(self.dt_bias,
-                         {"weight_loader": sharded_weight_loader(0)})
+        set_weight_attrs(self.dt_bias, {"weight_loader": sharded_weight_loader(0)})
 
         self.out_proj = RowParallelLinear(
             intermediate_size,
@@ -439,10 +455,9 @@ def __init__(self,
             prefix=f"{prefix}.out_proj",
         )
 
-        self.norm = Mixer2RMSNormGated(intermediate_size,
-                                       n_groups,
-                                       self.use_rms_norm,
-                                       eps=rms_norm_eps)
+        self.norm = Mixer2RMSNormGated(
+            intermediate_size, n_groups, self.use_rms_norm, eps=rms_norm_eps
+        )
 
         compilation_config = get_current_vllm_config().compilation_config
         if prefix in compilation_config.static_forward_context:
@@ -525,8 +540,9 @@ def forward_cuda(
             dim=-1,
         )
 
-        conv_weights = self.conv1d.weight.view(self.conv1d.weight.size(0),
-                                               self.conv1d.weight.size(2))
+        conv_weights = self.conv1d.weight.view(
+            self.conv1d.weight.size(0), self.conv1d.weight.size(2)
+        )
 
         # - get hidden_states, B and C after depthwise convolution.
         split_hidden_states_B_C_fn = lambda hidden_states_B_C: torch.split(
@@ -541,10 +557,10 @@ def forward_cuda(
 
         if attn_metadata is None:
             # profile run
-            hidden_states_B_C = (hidden_states_B_C.transpose(
-                0, 1).clone().transpose(0, 1)).contiguous()
-            hidden_states, _B, _C = split_hidden_states_B_C_fn(
-                hidden_states_B_C)
+            hidden_states_B_C = (
+                hidden_states_B_C.transpose(0, 1).clone().transpose(0, 1)
+            ).contiguous()
+            hidden_states, _B, _C = split_hidden_states_B_C_fn(hidden_states_B_C)
             hidden_states = self.norm(hidden_states, gate)
             out, _ = self.out_proj(hidden_states)
             return out
@@ -580,11 +596,11 @@ def forward_cuda(
             # If prefix caching is enabled, retrieve the relevant variables
             # for prefill and decode
             last_state_idx_d, last_state_idx_p = torch.split(
-                attn_metadata.last_state_idx, [num_decodes, num_prefills],
-                dim=0)
+                attn_metadata.last_state_idx, [num_decodes, num_prefills], dim=0
+            )
             current_last_idx_d, current_last_idx_p = torch.split(
-                attn_metadata.current_last_idx, [num_decodes, num_prefills],
-                dim=0)
+                attn_metadata.current_last_idx, [num_decodes, num_prefills], dim=0
+            )
             # Prefill-only variables:
             current_first_idx_p = attn_metadata.current_first_idx_p
             context_lens_p = attn_metadata.context_lens_p
@@ -600,7 +616,7 @@ def forward_cuda(
         preallocated_ssm_out = torch.empty(
             [
                 num_prefill_tokens + num_decodes,
-                (self.num_heads // self.tp_size) * self.head_dim
+                (self.num_heads // self.tp_size) * self.head_dim,
             ],
             dtype=hidden_states.dtype,
             device=hidden_states.device,
@@ -626,7 +642,8 @@ def forward_cuda(
             #   "state_indices_tensor_p"), it will write additional cache
             #   states aligned at "block_size_to_align".
             x = hidden_states_B_C_p.transpose(
-                0, 1)  # this is the form that causal-conv see
+                0, 1
+            )  # this is the form that causal-conv see
             hidden_states_B_C_p = causal_conv1d_fn(
                 x,
                 conv_weights,
@@ -641,34 +658,34 @@ def forward_cuda(
                 context_lens=context_lens_p,
                 block_size_to_align=mamba_block_size,
                 metadata=attn_metadata,
-                query_start_loc=query_start_loc_p).transpose(
-                    0, 1)[:num_prefill_tokens]
+                query_start_loc=query_start_loc_p,
+            ).transpose(0, 1)[:num_prefill_tokens]
 
-            hidden_states_p, B_p, C_p = split_hidden_states_B_C_fn(
-                hidden_states_B_C_p)
+            hidden_states_p, B_p, C_p = split_hidden_states_B_C_fn(hidden_states_B_C_p)
 
             # 3. State Space Model sequence transformation
             initial_states = None
-            if (has_initial_states_p is not None and prep_initial_states):
+            if has_initial_states_p is not None and prep_initial_states:
                 kernel_ssm_indices = state_indices_tensor_p
                 if prefix_caching_enabled:
                     kernel_ssm_indices = state_indices_tensor_p.gather(
-                        1, last_state_idx_p.unsqueeze(1)).squeeze(1)
+                        1, last_state_idx_p.unsqueeze(1)
+                    ).squeeze(1)
                 initial_states = torch.where(
                     has_initial_states_p[:, None, None, None],
-                    ssm_state[kernel_ssm_indices], 0)
+                    ssm_state[kernel_ssm_indices],
+                    0,
+                )
 
             # NOTE: final output is an in-place update of out tensor
             varlen_states = mamba_chunk_scan_combined_varlen(
-                hidden_states_p.view(num_prefill_tokens,
-                                     self.num_heads // self.tp_size,
-                                     self.head_dim),
+                hidden_states_p.view(
+                    num_prefill_tokens, self.num_heads // self.tp_size, self.head_dim
+                ),
                 dt_p,
                 self.A,
-                B_p.view(num_prefill_tokens, self.n_groups // self.tp_size,
-                         -1),
-                C_p.view(num_prefill_tokens, self.n_groups // self.tp_size,
-                         -1),
+                B_p.view(num_prefill_tokens, self.n_groups // self.tp_size, -1),
+                C_p.view(num_prefill_tokens, self.n_groups // self.tp_size, -1),
                 chunk_size=chunk_size,
                 D=self.D,
                 z=None,
@@ -681,18 +698,19 @@ def forward_cuda(
                 return_intermediate_states=prefix_caching_enabled,
                 dt_softplus=True,
                 dt_limit=(0.0, float("inf")),
-                out=preallocated_ssm_out_p.view(num_prefill_tokens, -1,
-                                                self.head_dim),
-                state_dtype=ssm_state.dtype)
+                out=preallocated_ssm_out_p.view(num_prefill_tokens, -1, self.head_dim),
+                state_dtype=ssm_state.dtype,
+            )
 
             if prefix_caching_enabled:
                 # Save states for sequences with more than just the final state:
                 n_blocks_to_fill = current_last_idx_p - current_first_idx_p
                 for seq_idx in (n_blocks_to_fill > 0).nonzero().squeeze(1):
                     cache_blocks_to_fill = state_indices_tensor_p[
-                        seq_idx, current_first_idx_p[seq_idx]:
-                        current_first_idx_p[seq_idx] +
-                        n_blocks_to_fill[seq_idx]]
+                        seq_idx,
+                        current_first_idx_p[seq_idx] : current_first_idx_p[seq_idx]
+                        + n_blocks_to_fill[seq_idx],
+                    ]
                     # chunks = [0 1 2 3 4 5 6 ...]
                     # First aligned chunk would typically be:
                     #  mamba_block_size = 1024, chunk_size = 256
@@ -704,22 +722,33 @@ def forward_cuda(
                     # e.g. 256 // 256 -> 1 completed --> store chunk[2] (skip 2)
                     # e.g. 10 // 256 -> 0 completed --> store chunk[3] (skip 3)
                     chunk_stride = mamba_block_size // chunk_size
-                    first_aligned_chunk = \
-                      torch.concat([torch.zeros(1, \
-                                    dtype=last_chunk_indices_p.dtype, \
-                                    device=last_chunk_indices_p.device), \
-                                    last_chunk_indices_p + 1])[seq_idx] \
-                       + chunk_stride - 1 \
-                       - last_computed_offset_p[seq_idx] // chunk_size
+                    first_aligned_chunk = (
+                        torch.concat(
+                            [
+                                torch.zeros(
+                                    1,
+                                    dtype=last_chunk_indices_p.dtype,
+                                    device=last_chunk_indices_p.device,
+                                ),
+                                last_chunk_indices_p + 1,
+                            ]
+                        )[seq_idx]
+                        + chunk_stride
+                        - 1
+                        - last_computed_offset_p[seq_idx] // chunk_size
+                    )
                     from_where = varlen_states[
-                        first_aligned_chunk:first_aligned_chunk +
-                        n_blocks_to_fill[seq_idx] * chunk_stride:chunk_stride]
+                        first_aligned_chunk : first_aligned_chunk
+                        + n_blocks_to_fill[seq_idx] * chunk_stride : chunk_stride
+                    ]
                     ssm_state[cache_blocks_to_fill] = from_where
 
-                #For all seqs, store the last state (Note: might be partial):
-                ssm_state[state_indices_tensor_p.gather(1,
-                        current_last_idx_p.unsqueeze(1)).squeeze(1)] = \
-                    varlen_states[last_chunk_indices_p]
+                # For all seqs, store the last state (Note: might be partial):
+                ssm_state[
+                    state_indices_tensor_p.gather(
+                        1, current_last_idx_p.unsqueeze(1)
+                    ).squeeze(1)
+                ] = varlen_states[last_chunk_indices_p]
             else:
                 # update ssm states
                 # - varlen state is a (num_prefills, nheads, headdim, dstate)
@@ -729,13 +758,13 @@ def forward_cuda(
         # Process decode requests
         if has_decode:
             if prefix_caching_enabled:
-                state_indices_tensor_d_input = \
-                    state_indices_tensor_d.gather(1,
-                        last_state_idx_d.unsqueeze(1)).squeeze(1)
-                state_indices_tensor_d_output = \
-                    state_indices_tensor_d.gather(1,
-                        current_last_idx_d.unsqueeze(1)).squeeze(1)
-                #Note:
+                state_indices_tensor_d_input = state_indices_tensor_d.gather(
+                    1, last_state_idx_d.unsqueeze(1)
+                ).squeeze(1)
+                state_indices_tensor_d_output = state_indices_tensor_d.gather(
+                    1, current_last_idx_d.unsqueeze(1)
+                ).squeeze(1)
+                # Note:
                 # for decode always: current_first_idx_d == current_last_idx_d
                 # at block boundaries: current_first_idx_d > last_state_idx_d
             else:
@@ -755,20 +784,23 @@ def forward_cuda(
                 initial_state_idx=last_state_idx_d,
             )
 
-            hidden_states_d, B_d, C_d = split_hidden_states_B_C_fn(
-                hidden_states_B_C_d)
+            hidden_states_d, B_d, C_d = split_hidden_states_B_C_fn(hidden_states_B_C_d)
 
             # 3. State Space Model sequence transformation
             n_groups = self.n_groups // self.tp_size
-            A_d = self.A[:, None, ...][:, :, None].expand(
-                -1, self.head_dim, self.ssm_state_size).to(dtype=torch.float32)
+            A_d = (
+                self.A[:, None, ...][:, :, None]
+                .expand(-1, self.head_dim, self.ssm_state_size)
+                .to(dtype=torch.float32)
+            )
             dt_d = dt_d[:, :, None].expand(-1, -1, self.head_dim)
             dt_bias = self.dt_bias[:, None, ...].expand(-1, self.head_dim)
             D_d = self.D[:, None, ...].expand(-1, self.head_dim)
             B_d = B_d.view(-1, n_groups, B_d.shape[1] // n_groups)
             C_d = C_d.view(-1, n_groups, C_d.shape[1] // n_groups)
             hidden_states_d = hidden_states_d.view(
-                -1, self.num_heads // self.tp_size, self.head_dim)
+                -1, self.num_heads // self.tp_size, self.head_dim
+            )
 
             # - the hidden is reshaped into (bs, num_heads, head_dim)
             # - mamba_cache_params.ssm_state's slots will be selected
@@ -787,16 +819,14 @@ def forward_cuda(
                 dt_softplus=True,
                 state_batch_indices=state_indices_tensor_d_input,
                 dst_state_batch_indices=state_indices_tensor_d_output,
-                out=preallocated_ssm_out_d.view(num_decodes, -1,
-                                                self.head_dim),
+                out=preallocated_ssm_out_d.view(num_decodes, -1, self.head_dim),
             )
 
         # 4. gated MLP
         # GatedRMSNorm internally applying SiLU to the gate
         # SiLU is applied internally before normalization, unlike standard
         # norm usage
-        hidden_states = self.norm(preallocated_ssm_out,
-                                  gate[:num_actual_tokens])
+        hidden_states = self.norm(preallocated_ssm_out, gate[:num_actual_tokens])
 
         # 5. Final linear projection
         output[:num_actual_tokens], _ = self.out_proj(hidden_states)
@@ -826,8 +856,8 @@ def mamba_type(self) -> str:
         return "mamba2"
 
     def get_attn_backend(self) -> type["AttentionBackend"]:
-        from vllm.v1.attention.backends.mamba2_attn import (
-            Mamba2AttentionBackend)
+        from vllm.v1.attention.backends.mamba2_attn import Mamba2AttentionBackend
+
         return Mamba2AttentionBackend
 
 
@@ -839,9 +869,7 @@ def mamba_mixer2(
 ) -> None:
     forward_context: ForwardContext = get_forward_context()
     self = forward_context.no_compile_layers[layer_name]
-    self.forward_cuda(hidden_states=hidden_states,
-                      output=output,
-                      mup_vector=mup_vector)
+    self.forward_cuda(hidden_states=hidden_states, output=output, mup_vector=mup_vector)
 
 
 def mamba_mixer2_fake(
diff --git a/vllm/model_executor/layers/mamba/mamba_utils.py b/vllm/model_executor/layers/mamba/mamba_utils.py
index 677a4b9d87fc..21c36617a872 100644
--- a/vllm/model_executor/layers/mamba/mamba_utils.py
+++ b/vllm/model_executor/layers/mamba/mamba_utils.py
@@ -10,7 +10,6 @@
 
 
 class MambaStateDtypeCalculator:
-
     @classmethod
     def linear_attention_state_dtype(
         cls,
@@ -21,7 +20,7 @@ def linear_attention_state_dtype(
         if mamba_cache_dtype == "float32":
             raise ValueError("fp32 state for minimax is not yet supported")
         state_dtype = get_kv_cache_torch_dtype(mamba_cache_dtype, model_dtype)
-        return (state_dtype, )
+        return (state_dtype,)
 
     @classmethod
     def mamba1_state_dtype(
@@ -30,8 +29,9 @@ def mamba1_state_dtype(
         mamba_cache_dtype: MambaDType,
         mamba_ssm_cache_dtype: MambaDType,
     ) -> tuple[torch.dtype, ...]:
-        return cls._mamba_state_dtype(model_dtype, mamba_cache_dtype,
-                                      mamba_ssm_cache_dtype)
+        return cls._mamba_state_dtype(
+            model_dtype, mamba_cache_dtype, mamba_ssm_cache_dtype
+        )
 
     @classmethod
     def mamba2_state_dtype(
@@ -40,8 +40,9 @@ def mamba2_state_dtype(
         mamba_cache_dtype: MambaDType,
         mamba_ssm_cache_dtype: MambaDType,
     ) -> tuple[torch.dtype, ...]:
-        return cls._mamba_state_dtype(model_dtype, mamba_cache_dtype,
-                                      mamba_ssm_cache_dtype)
+        return cls._mamba_state_dtype(
+            model_dtype, mamba_cache_dtype, mamba_ssm_cache_dtype
+        )
 
     @classmethod
     def _mamba_state_dtype(
@@ -50,13 +51,11 @@ def _mamba_state_dtype(
         mamba_cache_dtype: MambaDType,
         mamba_ssm_cache_dtype: MambaDType,
     ) -> tuple[torch.dtype, ...]:
-        conv_state_dtype = get_kv_cache_torch_dtype(mamba_cache_dtype,
-                                                    model_dtype)
+        conv_state_dtype = get_kv_cache_torch_dtype(mamba_cache_dtype, model_dtype)
         if mamba_ssm_cache_dtype == "auto":
             temporal_state_dtype = conv_state_dtype
         else:
-            temporal_state_dtype = (
-                STR_DTYPE_TO_TORCH_DTYPE[mamba_ssm_cache_dtype])
+            temporal_state_dtype = STR_DTYPE_TO_TORCH_DTYPE[mamba_ssm_cache_dtype]
 
         return (conv_state_dtype, temporal_state_dtype)
 
@@ -66,9 +65,8 @@ def short_conv_state_dtype(
         model_dtype: Union[ModelDType, torch.dtype],
         mamba_cache_dtype: MambaDType,
     ) -> tuple[torch.dtype, ...]:
-        conv_state_dtype = get_kv_cache_torch_dtype(mamba_cache_dtype,
-                                                    model_dtype)
-        return (conv_state_dtype, )
+        conv_state_dtype = get_kv_cache_torch_dtype(mamba_cache_dtype, model_dtype)
+        return (conv_state_dtype,)
 
     @classmethod
     def gated_delta_net_state_dtype(
@@ -81,7 +79,6 @@ def gated_delta_net_state_dtype(
 
 
 class MambaStateShapeCalculator:
-
     @classmethod
     def linear_attention_state_shape(
         cls,
@@ -89,9 +86,8 @@ def linear_attention_state_shape(
         tp_size: int,
         head_dim: int,
     ) -> tuple[tuple[int, int, int], ...]:
-
         state_shape = (num_heads // tp_size, head_dim, head_dim)
-        return (state_shape, )
+        return (state_shape,)
 
     @classmethod
     def mamba1_state_shape(
@@ -101,11 +97,9 @@ def mamba1_state_shape(
         state_size: int,
         conv_kernel: int,
     ) -> tuple[tuple[int, int], tuple[int, int]]:
-        conv_state_shape = (divide(intermediate_size,
-                                   tp_world_size), conv_kernel - 1)
+        conv_state_shape = (divide(intermediate_size, tp_world_size), conv_kernel - 1)
 
-        temporal_state_shape = (divide(intermediate_size,
-                                       tp_world_size), state_size)
+        temporal_state_shape = (divide(intermediate_size, tp_world_size), state_size)
 
         conv_state_shape = conv_state_shape[1], conv_state_shape[0]
 
@@ -124,8 +118,7 @@ def mamba2_state_shape(
     ) -> tuple[tuple[int, int], tuple[int, int, int]]:
         # if n_groups is not divisible by world_size, need to extend the shards
         # to ensure all groups needed by a head is sharded along with it
-        n_groups = n_groups + cls.extra_groups_for_head_shards(
-            n_groups, tp_world_size)
+        n_groups = n_groups + cls.extra_groups_for_head_shards(n_groups, tp_world_size)
         # heads and n_groups are TP-ed
         conv_dim = intermediate_size + 2 * n_groups * state_size
 
@@ -135,8 +128,7 @@ def mamba2_state_shape(
         # These are not TP-ed as they depend on A, dt_bias, D
         # - they are typically small
         #   e.g., (h_heads, head_dim, state_size) = (128, 64, 128)
-        temporal_state_shape = (divide(num_heads,
-                                       tp_world_size), head_dim, state_size)
+        temporal_state_shape = (divide(num_heads, tp_world_size), head_dim, state_size)
         return conv_state_shape, temporal_state_shape
 
     @classmethod
@@ -148,7 +140,7 @@ def short_conv_state_shape(
     ) -> tuple[tuple[int, int]]:
         conv_dim = divide(intermediate_size, tp_world_size)
         conv_state_shape = (conv_kernel - 1, conv_dim)
-        return (conv_state_shape, )
+        return (conv_state_shape,)
 
     @classmethod
     def extra_groups_for_head_shards(cls, ngroups: int, tp_size: int):
@@ -173,7 +165,7 @@ def gated_delta_net_state_shape(
         conv_kernel_size: int,
         num_spec: int = 0,
     ):
-        conv_dim = (head_k_dim * num_k_heads * 2 + head_v_dim * num_v_heads)
+        conv_dim = head_k_dim * num_k_heads * 2 + head_v_dim * num_v_heads
         conv_state_shape = (
             divide(conv_dim, tp_world_size),
             conv_kernel_size - 1 + num_spec,
@@ -181,6 +173,9 @@ def gated_delta_net_state_shape(
 
         conv_state_shape = conv_state_shape[1], conv_state_shape[0]
 
-        temporal_state_shape = (divide(num_v_heads,
-                                       tp_world_size), head_k_dim, head_v_dim)
+        temporal_state_shape = (
+            divide(num_v_heads, tp_world_size),
+            head_k_dim,
+            head_v_dim,
+        )
         return conv_state_shape, temporal_state_shape
diff --git a/vllm/model_executor/layers/mamba/ops/causal_conv1d.py b/vllm/model_executor/layers/mamba/ops/causal_conv1d.py
index a02bba5d4ddd..a6d5d4d17970 100644
--- a/vllm/model_executor/layers/mamba/ops/causal_conv1d.py
+++ b/vllm/model_executor/layers/mamba/ops/causal_conv1d.py
@@ -38,8 +38,7 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
     num_cache_lines: tl.constexpr,  # added to support vLLM larger cache lines
     # Strides
     stride_x_dim: tl.constexpr,  # stride to get to next feature-value,
-    stride_x_token: tl.
-    constexpr,  # stride to get to next token (same feature-index, same sequence-index)
+    stride_x_token: tl.constexpr,  # stride to get to next token (same feature-index, same sequence-index)
     stride_w_dim: tl.constexpr,  # stride to get to next dim-axis value
     stride_w_width: tl.constexpr,  # stride to get to next width-axis value
     stride_istate_seq: tl.constexpr,
@@ -66,7 +65,9 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
     stride_conv_state_seq = stride_istate_seq
     stride_conv_state_dim = stride_istate_dim
     stride_conv_state_tok = stride_istate_token
-    state_len = KERNEL_WIDTH - 1  # can be passed via argument if it's not the same as this value
+    state_len = (
+        KERNEL_WIDTH - 1
+    )  # can be passed via argument if it's not the same as this value
 
     # one program handles one chunk in a single sequence
     # rather than mixing sequences - to make updating initial_states across sequences efficiently
@@ -86,7 +87,7 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
     # find the actual sequence length
     seqlen = sequence_end_index - sequence_start_index
 
-    B_size: tl.constexpr = (stride_block_m * BLOCK_M)
+    B_size: tl.constexpr = stride_block_m * BLOCK_M
 
     if IS_APC_ENABLED:
         # Handle the case if prefix caching is enabled.
@@ -124,20 +125,24 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
     segment_len = min(BLOCK_M, seqlen - token_offset)
 
     # base of the sequence
-    x_base = x_ptr + sequence_start_index * stride_x_token + idx_feats * stride_x_dim  # [BLOCK_N,]
+    x_base = (
+        x_ptr + sequence_start_index * stride_x_token + idx_feats * stride_x_dim
+    )  # [BLOCK_N,]
 
     # cache_idx
-    conv_states_input_coord = tl.load(conv_state_indices_ptr +
-                                      idx_seq * stride_cache_indices +
-                                      conv_state_init_index).to(tl.int64)
+    conv_states_input_coord = tl.load(
+        conv_state_indices_ptr + idx_seq * stride_cache_indices + conv_state_init_index
+    ).to(tl.int64)
 
     if USE_PAD_SLOT:  # noqa
         if conv_states_input_coord == pad_slot_id:
             # not processing as this is not the actual sequence
             return
-    conv_states_base = (conv_states_ptr +
-                        (conv_states_input_coord * stride_conv_state_seq) +
-                        (idx_feats * stride_conv_state_dim))  # [BLOCK_N,]
+    conv_states_base = (
+        conv_states_ptr
+        + (conv_states_input_coord * stride_conv_state_seq)
+        + (idx_feats * stride_conv_state_dim)
+    )  # [BLOCK_N,]
 
     w_base = w_ptr + (idx_feats * stride_w_dim)  # [BLOCK_N,]
 
@@ -149,8 +154,7 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
         load_init_state = tl.load(has_initial_states_ptr + idx_seq).to(tl.int1)
         if load_init_state:
             # load from conv_states
-            prior_tokens = conv_states_base + (state_len -
-                                               1) * stride_conv_state_tok
+            prior_tokens = conv_states_base + (state_len - 1) * stride_conv_state_tok
             mask_w = idx_feats < dim
             if KERNEL_WIDTH == 2:
                 conv_states_ptrs = prior_tokens  # [BLOCK_N]
@@ -180,46 +184,54 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
             # prior-tokens are zeros
             if KERNEL_WIDTH >= 2:  # STRATEGY1
                 # first chunk and does not have prior-token, so just set to 0
-                col0 = tl.zeros((BLOCK_N, ), dtype=x_ptr.dtype.element_ty)
+                col0 = tl.zeros((BLOCK_N,), dtype=x_ptr.dtype.element_ty)
             if KERNEL_WIDTH >= 3:  # STRATEGY1
-                col1 = tl.zeros((BLOCK_N, ), dtype=x_ptr.dtype.element_ty)
+                col1 = tl.zeros((BLOCK_N,), dtype=x_ptr.dtype.element_ty)
             if KERNEL_WIDTH >= 4:  # STRATEGY1
-                col2 = tl.zeros((BLOCK_N, ), dtype=x_ptr.dtype.element_ty)
+                col2 = tl.zeros((BLOCK_N,), dtype=x_ptr.dtype.element_ty)
             if KERNEL_WIDTH >= 5:  # STRATEGY1
-                col3 = tl.zeros((BLOCK_N, ), dtype=x_ptr.dtype.element_ty)
+                col3 = tl.zeros((BLOCK_N,), dtype=x_ptr.dtype.element_ty)
 
         # STEP 2:
         # here prepare data for updating conv_state
-        if state_len <= seqlen:  # SMALL_CACHE=True (only move part of 'x' into conv_state cache)
+        if (
+            state_len <= seqlen
+        ):  # SMALL_CACHE=True (only move part of 'x' into conv_state cache)
             # just read from 'x'
             # copy 'x' data to conv_state
             # load only 'x' data (and set 0 before 'x' if seqlen < state_len)
             idx_tokens_last = (seqlen - state_len) + tl.arange(
-                0, NP2_STATELEN)  # [BLOCK_M]
-            x_ptrs = x_ptr + (
-                (sequence_start_index + idx_tokens_last) *
-                stride_x_token)[:, None] + (
-                    idx_feats * stride_x_dim)[None, :]  # [BLOCK_M,BLOCK_N,]
-            mask_x = ((idx_tokens_last >= 0)[:, None] &
-                      (idx_tokens_last < seqlen)[:, None] &
-                      (idx_feats < dim)[None, :]
-                      )  # token-index  # token-index  # feature-index
+                0, NP2_STATELEN
+            )  # [BLOCK_M]
+            x_ptrs = (
+                x_ptr
+                + ((sequence_start_index + idx_tokens_last) * stride_x_token)[:, None]
+                + (idx_feats * stride_x_dim)[None, :]
+            )  # [BLOCK_M,BLOCK_N,]
+            mask_x = (
+                (idx_tokens_last >= 0)[:, None]
+                & (idx_tokens_last < seqlen)[:, None]
+                & (idx_feats < dim)[None, :]
+            )  # token-index  # token-index  # feature-index
             loaded_x = tl.load(x_ptrs, mask_x, 0.0)
             idx_tokens_conv = tl.arange(0, NP2_STATELEN)  # [BLOCK_M]
 
             # Compute the offset where the last block should be written in the conv_states
-            conv_states_output_coord = tl.load(conv_state_indices_ptr +
-                                               idx_seq * stride_cache_indices +
-                                               current_last_index).to(tl.int64)
+            conv_states_output_coord = tl.load(
+                conv_state_indices_ptr
+                + idx_seq * stride_cache_indices
+                + current_last_index
+            ).to(tl.int64)
 
             conv_states_ptrs_target = (
-                conv_states_ptr + (conv_states_output_coord *
-                                   stride_conv_state_seq) +  # Offset from seq
-                (idx_feats * stride_conv_state_dim))[None, :] + (  # [BLOCK_N,]
-                    idx_tokens_conv * stride_conv_state_tok)[:, None]
-
-            mask = (idx_tokens_conv < state_len)[:, None] & (idx_feats
-                                                             < dim)[None, :]
+                conv_states_ptr
+                + (conv_states_output_coord * stride_conv_state_seq)  # Offset from seq
+                + (idx_feats * stride_conv_state_dim)
+            )[None, :] + (  # [BLOCK_N,]
+                idx_tokens_conv * stride_conv_state_tok
+            )[:, None]
+
+            mask = (idx_tokens_conv < state_len)[:, None] & (idx_feats < dim)[None, :]
             tl.debug_barrier()  #  NOTE: use this due to bug in Triton compiler
             tl.store(conv_states_ptrs_target, loaded_x, mask)
 
@@ -229,39 +241,43 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
                 idx_tokens_conv = tl.arange(0, NP2_STATELEN)  # [BLOCK_M]
 
                 conv_states_ptrs_source = (
-                    conv_states_ptr +
-                    (conv_states_input_coord * stride_conv_state_seq) +
-                    (idx_feats * stride_conv_state_dim)[None, :] +
-                    ((idx_tokens_conv + seqlen) * stride_conv_state_tok)[:,
-                                                                         None]
+                    conv_states_ptr
+                    + (conv_states_input_coord * stride_conv_state_seq)
+                    + (idx_feats * stride_conv_state_dim)[None, :]
+                    + ((idx_tokens_conv + seqlen) * stride_conv_state_tok)[:, None]
                 )  # [BLOCK_M, BLOCK_N]
-                mask = ((conv_states_input_coord < num_cache_lines)
-                        & ((idx_tokens_conv + seqlen) < state_len)[:, None]
-                        & (idx_feats < dim)[None, :])
+                mask = (
+                    (conv_states_input_coord < num_cache_lines)
+                    & ((idx_tokens_conv + seqlen) < state_len)[:, None]
+                    & (idx_feats < dim)[None, :]
+                )
                 conv_state = tl.load(conv_states_ptrs_source, mask, other=0.0)
 
                 VAL = state_len - seqlen
 
-                x_ptrs = x_base[None, :] + (
-                    (idx_tokens_conv - VAL) *
-                    stride_x_token)[:, None]  # [BLOCK_M, BLOCK_N]
+                x_ptrs = (
+                    x_base[None, :]
+                    + ((idx_tokens_conv - VAL) * stride_x_token)[:, None]
+                )  # [BLOCK_M, BLOCK_N]
 
-                mask_x = ((idx_tokens_conv - VAL >= 0)[:, None] &
-                          (idx_tokens_conv - VAL < seqlen)[:, None] &
-                          (idx_feats < dim)[None, :]
-                          )  # token-index  # token-index  # feature-index
+                mask_x = (
+                    (idx_tokens_conv - VAL >= 0)[:, None]
+                    & (idx_tokens_conv - VAL < seqlen)[:, None]
+                    & (idx_feats < dim)[None, :]
+                )  # token-index  # token-index  # feature-index
                 loaded_x = tl.load(x_ptrs, mask_x, 0.0)
 
-                tl.debug_barrier(
-                )  # need this due to the bug in tl.where not enforcing this when data is the result of another tl.load
+                tl.debug_barrier()  # need this due to the bug in tl.where not enforcing this when data is the result of another tl.load
                 new_conv_state = tl.where(
                     mask, conv_state, loaded_x
                 )  # BUG in 'tl.where'  which requires a barrier before this
-                conv_states_ptrs_target = conv_states_base + (
-                    idx_tokens_conv *
-                    stride_conv_state_tok)[:, None]  # [BLOCK_M, BLOCK_N]
-                mask = (idx_tokens_conv
-                        < state_len)[:, None] & (idx_feats < dim)[None, :]
+                conv_states_ptrs_target = (
+                    conv_states_base
+                    + (idx_tokens_conv * stride_conv_state_tok)[:, None]
+                )  # [BLOCK_M, BLOCK_N]
+                mask = (idx_tokens_conv < state_len)[:, None] & (idx_feats < dim)[
+                    None, :
+                ]
                 tl.store(conv_states_ptrs_target, new_conv_state, mask)
             else:  # load_init_state == False
                 # update conv_state by shifting left, BUT
@@ -270,21 +286,25 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
 
                 VAL = state_len - seqlen
 
-                x_ptrs = x_base[None, :] + (
-                    (idx_tokens_conv - VAL) *
-                    stride_x_token)[:, None]  # [BLOCK_M, BLOCK_N]
+                x_ptrs = (
+                    x_base[None, :]
+                    + ((idx_tokens_conv - VAL) * stride_x_token)[:, None]
+                )  # [BLOCK_M, BLOCK_N]
 
-                mask_x = ((idx_tokens_conv - VAL >= 0)[:, None] &
-                          (idx_tokens_conv - VAL < seqlen)[:, None] &
-                          (idx_feats < dim)[None, :]
-                          )  # token-index  # token-index  # feature-index
+                mask_x = (
+                    (idx_tokens_conv - VAL >= 0)[:, None]
+                    & (idx_tokens_conv - VAL < seqlen)[:, None]
+                    & (idx_feats < dim)[None, :]
+                )  # token-index  # token-index  # feature-index
                 new_conv_state = tl.load(x_ptrs, mask_x, 0.0)
 
-                conv_states_ptrs_target = conv_states_base + (
-                    idx_tokens_conv *
-                    stride_conv_state_tok)[:, None]  # [BLOCK_M, BLOCK_N]
-                mask = (idx_tokens_conv
-                        < state_len)[:, None] & (idx_feats < dim)[None, :]
+                conv_states_ptrs_target = (
+                    conv_states_base
+                    + (idx_tokens_conv * stride_conv_state_tok)[:, None]
+                )  # [BLOCK_M, BLOCK_N]
+                mask = (idx_tokens_conv < state_len)[:, None] & (idx_feats < dim)[
+                    None, :
+                ]
                 tl.store(conv_states_ptrs_target, new_conv_state, mask)
 
     else:  # chunk_offset > 0
@@ -294,29 +314,29 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
         mask_w = idx_feats < dim
         if KERNEL_WIDTH == 2:
             conv_states_ptrs = prior_tokens  # [BLOCK_N]
-            col0 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier='.ca')
+            col0 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier=".ca")
         if KERNEL_WIDTH == 3:
             conv_states_ptrs = prior_tokens  # [BLOCK_N]
-            col1 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier='.ca')
+            col1 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier=".ca")
             conv_states_ptrs = prior_tokens - 1 * stride_x_token  # [BLOCK_N]
-            col0 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier='.ca')
+            col0 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier=".ca")
         if KERNEL_WIDTH == 4:
             conv_states_ptrs = prior_tokens  # [BLOCK_N]
-            col2 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier='.ca')
+            col2 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier=".ca")
             conv_states_ptrs = prior_tokens - 1 * stride_x_token  # [BLOCK_N]
-            col1 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier='.ca')
+            col1 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier=".ca")
             conv_states_ptrs = prior_tokens - 2 * stride_x_token  # [BLOCK_N]
-            col0 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier='.ca')
+            col0 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier=".ca")
         if KERNEL_WIDTH == 5:
             # ruff: noqa: F841
             conv_states_ptrs = prior_tokens  # [BLOCK_N]
-            col3 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier='.ca')
+            col3 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier=".ca")
             conv_states_ptrs = prior_tokens - 1 * stride_x_token  # [BLOCK_N]
-            col2 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier='.ca')
+            col2 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier=".ca")
             conv_states_ptrs = prior_tokens - 2 * stride_x_token  # [BLOCK_N]
-            col1 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier='.ca')
+            col1 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier=".ca")
             conv_states_ptrs = prior_tokens - 3 * stride_x_token  # [BLOCK_N]
-            col0 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier='.ca')
+            col0 = tl.load(conv_states_ptrs, mask_w, 0.0, cache_modifier=".ca")
 
         # Store intermediate states aligned with stride_block_m
         # The additional states are cached starting from the last stride_block_m.
@@ -327,43 +347,51 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
         # For example chunk_offset = n_block_to_fill stores the state at last_full_block
         if (chunk_offset - 1) < n_block_to_fill:
             # Store the states at the chunk boundaries from the start of the sequence
-            idx_tokens_last = (last_full_block_token_index -
-                               (n_block_to_fill - chunk_offset) * B_size -
-                               state_len) + tl.arange(
-                                   0, NP2_STATELEN)  # [BLOCK_M]
-            x_ptrs = x_ptr + (idx_tokens_last * stride_x_token)[:, None] + (
-                idx_feats * stride_x_dim)[None, :]  # [BLOCK_M,BLOCK_N,]
-
-            mask_x = (
-                (idx_tokens_last >= 0)[:, None] & (idx_feats < dim)[None, :]
-            )  # token-index  # token-index  # feature-index
+            idx_tokens_last = (
+                last_full_block_token_index
+                - (n_block_to_fill - chunk_offset) * B_size
+                - state_len
+            ) + tl.arange(0, NP2_STATELEN)  # [BLOCK_M]
+            x_ptrs = (
+                x_ptr
+                + (idx_tokens_last * stride_x_token)[:, None]
+                + (idx_feats * stride_x_dim)[None, :]
+            )  # [BLOCK_M,BLOCK_N,]
+
+            mask_x = (idx_tokens_last >= 0)[:, None] & (idx_feats < dim)[
+                None, :
+            ]  # token-index  # token-index  # feature-index
             loaded_x = tl.load(x_ptrs, mask_x, 0.0)
             idx_tokens_conv = tl.arange(0, NP2_STATELEN)  # [BLOCK_M]
 
             # cache_idx
-            conv_states_output_coord = tl.load(conv_state_indices_ptr +
-                                               idx_seq * stride_cache_indices +
-                                               current_first_index +
-                                               (chunk_offset - 1)).to(tl.int64)
+            conv_states_output_coord = tl.load(
+                conv_state_indices_ptr
+                + idx_seq * stride_cache_indices
+                + current_first_index
+                + (chunk_offset - 1)
+            ).to(tl.int64)
 
             conv_states_ptrs_target = (
-                conv_states_ptr + (conv_states_output_coord *
-                                   stride_conv_state_seq) +  # Offset from seq
-                (idx_feats * stride_conv_state_dim))[None, :] + (  # [BLOCK_N,]
-                    idx_tokens_conv * stride_conv_state_tok)[:, None]
-
-            mask = (idx_tokens_conv < state_len)[:, None] & \
-                   (idx_feats < dim)[None, :]
+                conv_states_ptr
+                + (conv_states_output_coord * stride_conv_state_seq)  # Offset from seq
+                + (idx_feats * stride_conv_state_dim)
+            )[None, :] + (  # [BLOCK_N,]
+                idx_tokens_conv * stride_conv_state_tok
+            )[:, None]
+
+            mask = (idx_tokens_conv < state_len)[:, None] & (idx_feats < dim)[None, :]
             tl.debug_barrier()  #  NOTE: use this due to bug in Triton compiler
             tl.store(conv_states_ptrs_target, loaded_x, mask)
 
     if HAS_BIAS:
         bias = bias_ptr + idx_feats
         mask_bias = idx_feats < dim
-        acc_preload = tl.load(bias, mask=mask_bias,
-                              other=0.0).to(tl.float32)  # [BLOCK_N]
+        acc_preload = tl.load(bias, mask=mask_bias, other=0.0).to(
+            tl.float32
+        )  # [BLOCK_N]
     else:
-        acc_preload = tl.zeros((BLOCK_N, ), dtype=tl.float32)
+        acc_preload = tl.zeros((BLOCK_N,), dtype=tl.float32)
 
     x_base_1d = x_base + token_offset * stride_x_token  # starting of chunk
 
@@ -387,7 +415,6 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
         matrix_w = w_col0
         matrix_x = col0
         for j in tl.static_range(KERNEL_WIDTH):
-
             if KERNEL_WIDTH == 2:
                 if j == 1:  # KERNEL_WIDTH-1:
                     matrix_w = w_col1
@@ -428,9 +455,13 @@ def _causal_conv1d_fwd_kernel(  # continuous batching
         if SILU_ACTIVATION:
             acc = acc / (1 + tl.exp(-acc))
         mask_1d = (idx_token < segment_len) & (
-            idx_feats < dim)  # token-index  # feature-index
-        o_ptrs = o_ptr + (sequence_start_index + token_offset + idx_token
-                          ) * stride_o_token + (idx_feats * stride_o_dim)
+            idx_feats < dim
+        )  # token-index  # feature-index
+        o_ptrs = (
+            o_ptr
+            + (sequence_start_index + token_offset + idx_token) * stride_o_token
+            + (idx_feats * stride_o_dim)
+        )
 
         tl.store(o_ptrs, acc, mask=mask_1d)
 
@@ -518,21 +549,15 @@ def causal_conv1d_fn(
         batch_ptr = metadata.batch_ptr
         token_chunk_offset_ptr = metadata.token_chunk_offset_ptr
     else:
-        seqlens = query_start_loc.diff().to('cpu')
+        seqlens = query_start_loc.diff().to("cpu")
         args = seqlens
         MAX_NUM_PROGRAMS = 1024
 
         batch_ptr = torch.full(
-            (MAX_NUM_PROGRAMS, ),
-            PAD_SLOT_ID,
-            dtype=torch.int32,
-            device=x.device
+            (MAX_NUM_PROGRAMS,), PAD_SLOT_ID, dtype=torch.int32, device=x.device
         )  # tracking which seq-idx the Triton program is handling
         token_chunk_offset_ptr = torch.full(
-            (MAX_NUM_PROGRAMS, ),
-            PAD_SLOT_ID,
-            dtype=torch.int32,
-            device=x.device
+            (MAX_NUM_PROGRAMS,), PAD_SLOT_ID, dtype=torch.int32, device=x.device
         )  # tracking BLOCK_M-based index in the sequence the Triton program is handling
 
     is_channel_last = (x.stride(0) == 1) & (x.stride(1) > 1)
@@ -558,9 +583,11 @@ def causal_conv1d_fn(
         # 3. mapping from sequence x[idx] to a cache line at index as specified via cache_indices[idx]
         # 4. computation can be skipped if cache_indices[idx] == pad_slot_id
         num_cache_lines = conv_states.size(0)
-        assert (num_cache_lines == conv_states.shape[0]
-                and dim == conv_states.shape[1]
-                and width - 1 <= conv_states.shape[2])
+        assert (
+            num_cache_lines == conv_states.shape[0]
+            and dim == conv_states.shape[1]
+            and width - 1 <= conv_states.shape[2]
+        )
         stride_istate_seq = conv_states.stride(0)
         stride_istate_dim = conv_states.stride(1)
         stride_istate_token = conv_states.stride(2)
@@ -571,8 +598,7 @@ def causal_conv1d_fn(
     else:
         stride_o_dim = out.stride(1)
         stride_o_token = out.stride(2)
-    stride_cache_indices = cache_indices.stride(
-        0) if cache_indices is not None else 0
+    stride_cache_indices = cache_indices.stride(0) if cache_indices is not None else 0
 
     if validate_data:
         assert x.dim() == 2
@@ -586,15 +612,17 @@ def causal_conv1d_fn(
             assert cache_indices.dim() == 1
             assert padded_batch == cache_indices.size(0)
         if has_initial_state is not None:
-            assert has_initial_state.size() == (padded_batch, )
-            assert conv_states is not None, "ERROR: `has_initial_state` is used, which needs also `conv_states`"
+            assert has_initial_state.size() == (padded_batch,)
+            assert conv_states is not None, (
+                "ERROR: `has_initial_state` is used, which needs also `conv_states`"
+            )
         assert weight.stride(1) == 1
         assert (dim, width) == weight.shape
         assert is_channel_last, "Need to run in channel-last layout"
         if block_size_to_align is not None and block_size_to_align > 0:
-            assert (
-                block_size_to_align % BLOCK_M
-            ) == 0, "The mamba block size needs to be divisible by the BLOCK_M"
+            assert (block_size_to_align % BLOCK_M) == 0, (
+                "The mamba block size needs to be divisible by the BLOCK_M"
+            )
         else:
             block_size_to_align = BLOCK_M
 
@@ -618,44 +646,45 @@ def num_program(META, seqlens):
             if META["batch_ptr"].nelement() < len(mlist):
                 newlen = len(mlist) + 1
                 META["batch_ptr"].resize_(newlen).fill_(PAD_SLOT_ID)
-                META["token_chunk_offset_ptr"].resize_(newlen).fill_(
-                    PAD_SLOT_ID)
+                META["token_chunk_offset_ptr"].resize_(newlen).fill_(PAD_SLOT_ID)
 
             if META["batch_ptr"].nelement() >= len(mlist):
-                META["batch_ptr"][0:len(mlist)].copy_(
-                    torch.from_numpy(np.array(mlist)))
-                META["token_chunk_offset_ptr"][0:len(mlist)].copy_(
-                    torch.from_numpy(np.array(offsetlist)))
+                META["batch_ptr"][0 : len(mlist)].copy_(
+                    torch.from_numpy(np.array(mlist))
+                )
+                META["token_chunk_offset_ptr"][0 : len(mlist)].copy_(
+                    torch.from_numpy(np.array(offsetlist))
+                )
 
             META["batch_ptr"] = META["batch_ptr"].to(META["x_ptr"].device)
             META["token_chunk_offset_ptr"] = META["token_chunk_offset_ptr"].to(
-                META["x_ptr"].device)
+                META["x_ptr"].device
+            )
             return tot
     else:
 
         def num_program(META, nums_dict):
-            tot = nums_dict[META["BLOCK_M"]]['tot']
+            tot = nums_dict[META["BLOCK_M"]]["tot"]
 
-            mlist = nums_dict[META["BLOCK_M"]]['mlist']
-            mlist_len = nums_dict[META["BLOCK_M"]]['mlist_len']
+            mlist = nums_dict[META["BLOCK_M"]]["mlist"]
+            mlist_len = nums_dict[META["BLOCK_M"]]["mlist_len"]
 
-            offsetlist = nums_dict[META["BLOCK_M"]]['offsetlist']
+            offsetlist = nums_dict[META["BLOCK_M"]]["offsetlist"]
 
             if nums_dict[META["BLOCK_M"]]["batch_ptr"] is not None:
                 META["batch_ptr"] = nums_dict[META["BLOCK_M"]]["batch_ptr"]
-                META["token_chunk_offset_ptr"] = nums_dict[
-                    META["BLOCK_M"]]["token_chunk_offset_ptr"]
+                META["token_chunk_offset_ptr"] = nums_dict[META["BLOCK_M"]][
+                    "token_chunk_offset_ptr"
+                ]
             else:
                 if META["batch_ptr"].nelement() < mlist_len:
                     newlen = mlist_len + 1
                     META["batch_ptr"].resize_(newlen).fill_(PAD_SLOT_ID)
-                    META["token_chunk_offset_ptr"].resize_(newlen).fill_(
-                        PAD_SLOT_ID)
+                    META["token_chunk_offset_ptr"].resize_(newlen).fill_(PAD_SLOT_ID)
 
                 if META["batch_ptr"].nelement() >= mlist_len:
                     META["batch_ptr"][0:mlist_len].copy_(mlist)
-                    META["token_chunk_offset_ptr"][0:mlist_len].copy_(
-                        offsetlist)
+                    META["token_chunk_offset_ptr"][0:mlist_len].copy_(offsetlist)
             return tot
 
     def grid(META):
@@ -709,7 +738,7 @@ def grid(META):
         IS_APC_ENABLED=current_last_idx is not None,
         USE_PAD_SLOT=pad_slot_id is not None,
         NP2_STATELEN=np2_statelen,
-        #launch_cooperative_grid=True
+        # launch_cooperative_grid=True
         BLOCK_M=BLOCK_M,
         BLOCK_N=256,
         num_stages=2,
@@ -728,7 +757,7 @@ def _causal_conv1d_update_kernel(
     num_accepted_tokens_ptr,
     query_start_loc_ptr,  # (batch + 1)
     current_last_idx,  # (batch,)
-    initial_state_idx,  #(batch,)
+    initial_state_idx,  # (batch,)
     o_ptr,  # (batch, dim, seqlen)
     # Matrix dimensions
     batch: int,
@@ -779,9 +808,9 @@ def _causal_conv1d_update_kernel(
         current_last_index = 0
 
     # cache_idx
-    conv_states_input_coord = tl.load(conv_state_indices_ptr +
-                                      idx_seq * stride_state_indices +
-                                      conv_state_init).to(tl.int64)
+    conv_states_input_coord = tl.load(
+        conv_state_indices_ptr + idx_seq * stride_state_indices + conv_state_init
+    ).to(tl.int64)
 
     if USE_PAD_SLOT:  # noqa
         if conv_states_input_coord == pad_slot_id:
@@ -790,11 +819,9 @@ def _causal_conv1d_update_kernel(
 
     if IS_VARLEN:
         query_start_index = tl.load(query_start_loc_ptr + idx_seq).to(tl.int64)
-        query_end_index = tl.load(query_start_loc_ptr + (idx_seq + 1)).to(
-            tl.int64)
+        query_end_index = tl.load(query_start_loc_ptr + (idx_seq + 1)).to(tl.int64)
         # revise state_len and seqlen
-        state_len = state_len - (seqlen -
-                                 (query_end_index - query_start_index))
+        state_len = state_len - (seqlen - (query_end_index - query_start_index))
         seqlen = query_end_index - query_start_index
         x_offset = query_start_index * stride_x_token
         o_offset = query_start_index * stride_o_token
@@ -822,14 +849,17 @@ def _causal_conv1d_update_kernel(
         # - accept 2 tokens: [history3, ..., historyM, draft1, draft2]
         # - and so on.
         conv_state_token_offset = (
-            tl.load(num_accepted_tokens_ptr + idx_seq).to(tl.int64) - 1)
+            tl.load(num_accepted_tokens_ptr + idx_seq).to(tl.int64) - 1
+        )
     else:
         conv_state_token_offset = 0
 
     # STEP 1: READ init_state data
-    conv_states_base = (conv_state_ptr +
-                        (conv_states_input_coord * stride_conv_state_seq) +
-                        (idx_feats * stride_conv_state_dim))
+    conv_states_base = (
+        conv_state_ptr
+        + (conv_states_input_coord * stride_conv_state_seq)
+        + (idx_feats * stride_conv_state_dim)
+    )
     mask_w = idx_feats < dim
 
     prior_tokens = conv_states_base + conv_state_token_offset * stride_conv_state_tok
@@ -856,25 +886,33 @@ def _causal_conv1d_update_kernel(
     # window manner, at each forward pass, the tokens are shift by 1, so we
     # load since idx_tokens + 1.
     conv_state_ptrs_source = (
-        conv_state_ptr + (conv_states_input_coord * stride_conv_state_seq) +
-        conv_state_token_offset * stride_conv_state_tok +
-        (idx_feats * stride_conv_state_dim)[None, :] +
-        ((idx_tokens + (1 if IS_SPEC_DECODING else seqlen)) *
-         stride_conv_state_tok)[:, None])  # [BLOCK_M, BLOCK_N]
-    mask = ((conv_states_input_coord < num_cache_lines)
-            & ((idx_tokens + seqlen) < state_len)[:, None]
-            & (idx_feats < dim)[None, :])
+        conv_state_ptr
+        + (conv_states_input_coord * stride_conv_state_seq)
+        + conv_state_token_offset * stride_conv_state_tok
+        + (idx_feats * stride_conv_state_dim)[None, :]
+        + ((idx_tokens + (1 if IS_SPEC_DECODING else seqlen)) * stride_conv_state_tok)[
+            :, None
+        ]
+    )  # [BLOCK_M, BLOCK_N]
+    mask = (
+        (conv_states_input_coord < num_cache_lines)
+        & ((idx_tokens + seqlen) < state_len)[:, None]
+        & (idx_feats < dim)[None, :]
+    )
     conv_state = tl.load(conv_state_ptrs_source, mask, other=0.0)
 
     VAL = state_len - seqlen
     x_base = x_ptr + x_offset + (idx_feats * stride_x_dim)  # [BLOCK_N]
 
-    x_ptrs = x_base[None, :] + (
-        (idx_tokens - VAL) * stride_x_token)[:, None]  # [BLOCK_M, BLOCK_N]
+    x_ptrs = (
+        x_base[None, :] + ((idx_tokens - VAL) * stride_x_token)[:, None]
+    )  # [BLOCK_M, BLOCK_N]
 
-    mask_x = ((idx_tokens - VAL >= 0)[:, None] &
-              (idx_tokens - VAL < seqlen)[:, None] & (idx_feats < dim)[None, :]
-              )  # token-index  # token-index  # feature-index
+    mask_x = (
+        (idx_tokens - VAL >= 0)[:, None]
+        & (idx_tokens - VAL < seqlen)[:, None]
+        & (idx_feats < dim)[None, :]
+    )  # token-index  # token-index  # feature-index
     loaded_x = tl.load(x_ptrs, mask_x, 0.0)
     tl.debug_barrier()
 
@@ -882,14 +920,16 @@ def _causal_conv1d_update_kernel(
 
     # Get the state from the initial_state_idx
     # cache_idx
-    conv_states_offset = tl.load(conv_state_indices_ptr +
-                                 idx_seq * stride_state_indices +
-                                 current_last_index).to(tl.int64)
+    conv_states_offset = tl.load(
+        conv_state_indices_ptr + idx_seq * stride_state_indices + current_last_index
+    ).to(tl.int64)
     conv_state_ptrs_target = (
-        conv_state_ptr +
-        (conv_states_offset * stride_conv_state_seq) +  # Offset from seq
-        (idx_feats * stride_conv_state_dim))[None, :] + (  # [BLOCK_N,]
-            idx_tokens * stride_conv_state_tok)[:, None]
+        conv_state_ptr
+        + (conv_states_offset * stride_conv_state_seq)  # Offset from seq
+        + (idx_feats * stride_conv_state_dim)
+    )[None, :] + (  # [BLOCK_N,]
+        idx_tokens * stride_conv_state_tok
+    )[:, None]
     mask = (idx_tokens < state_len)[:, None] & (idx_feats < dim)[None, :]
     tl.store(conv_state_ptrs_target, new_conv_state, mask)
 
@@ -897,10 +937,11 @@ def _causal_conv1d_update_kernel(
     if HAS_BIAS:
         bias = bias_ptr + idx_feats
         mask_bias = idx_feats < dim
-        acc_preload = tl.load(bias, mask=mask_bias,
-                              other=0.0).to(tl.float32)  # [BLOCK_N]
+        acc_preload = tl.load(bias, mask=mask_bias, other=0.0).to(
+            tl.float32
+        )  # [BLOCK_N]
     else:
-        acc_preload = tl.zeros((BLOCK_N, ), dtype=tl.float32)
+        acc_preload = tl.zeros((BLOCK_N,), dtype=tl.float32)
 
     # STEP 4:
     # PRE-LOAD WEIGHTS
@@ -1016,10 +1057,12 @@ def _causal_conv1d_update_kernel(
 
         if SILU_ACTIVATION:
             acc = acc / (1 + tl.exp(-acc))
-        mask_1d = (idx_token < seqlen) & (idx_feats < dim
-                                          )  # token-index  # feature-index
-        o_ptrs = o_ptr + o_offset + idx_token * stride_o_token + (idx_feats *
-                                                                  stride_o_dim)
+        mask_1d = (idx_token < seqlen) & (
+            idx_feats < dim
+        )  # token-index  # feature-index
+        o_ptrs = (
+            o_ptr + o_offset + idx_token * stride_o_token + (idx_feats * stride_o_dim)
+        )
 
         tl.store(o_ptrs, acc, mask=mask_1d)
 
@@ -1104,16 +1147,16 @@ def causal_conv1d_update(
 
     if validate_data:
         assert dim == weight.size(0)
-        assert conv_state.stride(
-            -2
-        ) == 1, f"ERROR: expect contiguous along feat-dim of conv_state (currently stride={conv_state.stride()})"
+        assert conv_state.stride(-2) == 1, (
+            f"ERROR: expect contiguous along feat-dim of conv_state (currently stride={conv_state.stride()})"
+        )
         assert state_len >= width - 1
         # when above happens, we don't shift-left to keep any records in conv_state
         assert dim == conv_state.size(1)
         if conv_state_indices is None:
             assert conv_state.size(0) >= batch
         else:
-            assert (batch, ) == conv_state_indices.shape
+            assert (batch,) == conv_state_indices.shape
 
         assert num_cache_lines >= batch
         assert weight.stride(1) == 1  # Need this
@@ -1133,10 +1176,10 @@ def causal_conv1d_update(
         stride_o_token, stride_o_dim = out.stride()
         stride_o_seq = 0
 
-    stride_istate_seq, stride_istate_dim, stride_istate_token = conv_state.stride(
+    stride_istate_seq, stride_istate_dim, stride_istate_token = conv_state.stride()
+    stride_state_indices = (
+        conv_state_indices.stride(0) if conv_state_indices is not None else 0
     )
-    stride_state_indices = conv_state_indices.stride(
-        0) if conv_state_indices is not None else 0
     if num_accepted_tokens is not None:
         state_len = width - 1 + (seqlen - 1)  # effective state_len needed
     else:
diff --git a/vllm/model_executor/layers/mamba/ops/layernorm_gated.py b/vllm/model_executor/layers/mamba/ops/layernorm_gated.py
index f3a45ab097c3..b592906c6f13 100644
--- a/vllm/model_executor/layers/mamba/ops/layernorm_gated.py
+++ b/vllm/model_executor/layers/mamba/ops/layernorm_gated.py
@@ -46,17 +46,17 @@ def _layer_norm_fwd_1pass_kernel(
         B += group * N
     # Compute mean and variance
     cols = tl.arange(0, BLOCK_N)
-    x = tl.load(X + cols, mask=cols < N, other=0.).to(tl.float32)
+    x = tl.load(X + cols, mask=cols < N, other=0.0).to(tl.float32)
     if HAS_Z and not NORM_BEFORE_GATE:
         z = tl.load(Z + cols, mask=cols < N).to(tl.float32)
         x *= z * tl.sigmoid(z)
     if not IS_RMS_NORM:
         mean = tl.sum(x, axis=0) / N
         tl.store(Mean + row, mean)
-        xbar = tl.where(cols < N, x - mean, 0.)
+        xbar = tl.where(cols < N, x - mean, 0.0)
         var = tl.sum(xbar * xbar, axis=0) / N
     else:
-        xbar = tl.where(cols < N, x, 0.)
+        xbar = tl.where(cols < N, x, 0.0)
         var = tl.sum(xbar * xbar, axis=0) / N
     rstd = 1 / tl.sqrt(var + eps)
     tl.store(Rstd + row, rstd)
@@ -74,15 +74,17 @@ def _layer_norm_fwd_1pass_kernel(
     tl.store(Y + cols, y, mask=mask)
 
 
-def _layer_norm_fwd(x,
-                    weight,
-                    bias,
-                    eps,
-                    z=None,
-                    out=None,
-                    group_size=None,
-                    norm_before_gate=True,
-                    is_rms_norm=False):
+def _layer_norm_fwd(
+    x,
+    weight,
+    bias,
+    eps,
+    z=None,
+    out=None,
+    group_size=None,
+    norm_before_gate=True,
+    is_rms_norm=False,
+):
     M, N = x.shape
     if group_size is None:
         group_size = N
@@ -92,57 +94,57 @@ def _layer_norm_fwd(x,
     if z is not None:
         assert z.stride(-1) == 1
         assert z.shape == (M, N)
-    assert weight.shape == (N, )
+    assert weight.shape == (N,)
     assert weight.stride(-1) == 1
     if bias is not None:
         assert bias.stride(-1) == 1
-        assert bias.shape == (N, )
+        assert bias.shape == (N,)
     # allocate output
     if out is not None:
         assert out.shape == x.shape
     else:
         out = torch.empty_like(x)
     assert out.stride(-1) == 1
-    mean = torch.empty((ngroups * M, ), dtype=torch.float32,
-                       device=x.device) if not is_rms_norm else None
-    rstd = torch.empty((ngroups * M, ), dtype=torch.float32, device=x.device)
+    mean = (
+        torch.empty((ngroups * M,), dtype=torch.float32, device=x.device)
+        if not is_rms_norm
+        else None
+    )
+    rstd = torch.empty((ngroups * M,), dtype=torch.float32, device=x.device)
     # Less than 64KB per feature: enqueue fused kernel
     MAX_FUSED_SIZE = 65536 // x.element_size()
     BLOCK_N = min(MAX_FUSED_SIZE, triton.next_power_of_2(group_size))
     if group_size > BLOCK_N:
-        raise RuntimeError(
-            "This layer norm doesn't support feature dim >= 64KB.")
+        raise RuntimeError("This layer norm doesn't support feature dim >= 64KB.")
     # heuristics for number of warps
     num_warps = min(max(BLOCK_N // 256, 1), 8)
     grid = (M, ngroups)
     with torch.cuda.device(x.device.index):
-        _layer_norm_fwd_1pass_kernel[grid](x,
-                                           out,
-                                           weight,
-                                           bias,
-                                           z,
-                                           mean,
-                                           rstd,
-                                           x.stride(0),
-                                           out.stride(0),
-                                           z.stride(0) if z is not None else 0,
-                                           M,
-                                           group_size,
-                                           eps,
-                                           BLOCK_N=BLOCK_N,
-                                           NORM_BEFORE_GATE=norm_before_gate,
-                                           IS_RMS_NORM=is_rms_norm,
-                                           num_warps=num_warps)
+        _layer_norm_fwd_1pass_kernel[grid](
+            x,
+            out,
+            weight,
+            bias,
+            z,
+            mean,
+            rstd,
+            x.stride(0),
+            out.stride(0),
+            z.stride(0) if z is not None else 0,
+            M,
+            group_size,
+            eps,
+            BLOCK_N=BLOCK_N,
+            NORM_BEFORE_GATE=norm_before_gate,
+            IS_RMS_NORM=is_rms_norm,
+            num_warps=num_warps,
+        )
     return out, mean, rstd
 
 
-def rms_norm_gated(x,
-                   weight,
-                   bias,
-                   z=None,
-                   eps=1e-6,
-                   group_size=None,
-                   norm_before_gate=True):
+def rms_norm_gated(
+    x, weight, bias, z=None, eps=1e-6, group_size=None, norm_before_gate=True
+):
     x_shape_og = x.shape
     # reshape input data into 2D tensor
     x = x.reshape(-1, x.shape[-1])
@@ -156,13 +158,15 @@ def rms_norm_gated(x,
     weight = weight.contiguous()
     if bias is not None:
         bias = bias.contiguous()
-    y, _, _ = _layer_norm_fwd(x,
-                              weight,
-                              bias,
-                              eps,
-                              z=z,
-                              group_size=group_size,
-                              norm_before_gate=norm_before_gate,
-                              is_rms_norm=True)
+    y, _, _ = _layer_norm_fwd(
+        x,
+        weight,
+        bias,
+        eps,
+        z=z,
+        group_size=group_size,
+        norm_before_gate=norm_before_gate,
+        is_rms_norm=True,
+    )
 
     return y.reshape(x_shape_og)
diff --git a/vllm/model_executor/layers/mamba/ops/mamba_ssm.py b/vllm/model_executor/layers/mamba/ops/mamba_ssm.py
index 21bc32ddecd4..8722eb9a7b22 100644
--- a/vllm/model_executor/layers/mamba/ops/mamba_ssm.py
+++ b/vllm/model_executor/layers/mamba/ops/mamba_ssm.py
@@ -11,8 +11,7 @@
 from vllm.attention.backends.utils import PAD_SLOT_ID
 from vllm.triton_utils import HAS_TRITON, tl, triton
 
-TRITON3 = HAS_TRITON and (version.parse(triton.__version__)
-                          >= version.parse("3.0.0"))
+TRITON3 = HAS_TRITON and (version.parse(triton.__version__) >= version.parse("3.0.0"))
 
 if TRITON3:
 
@@ -28,16 +27,18 @@ def softplus(dt):
         return dt
 
 
-@triton.heuristics(
-    {"HAS_DT_BIAS": lambda args: args["dt_bias_ptr"] is not None})
+@triton.heuristics({"HAS_DT_BIAS": lambda args: args["dt_bias_ptr"] is not None})
 @triton.heuristics({"HAS_D": lambda args: args["D_ptr"] is not None})
 @triton.heuristics({"HAS_Z": lambda args: args["z_ptr"] is not None})
-@triton.heuristics({
-    "HAS_STATE_BATCH_INDICES":
-    lambda args: args["state_batch_indices_ptr"] is not None
-})
 @triton.heuristics(
-    {"BLOCK_SIZE_DSTATE": lambda args: triton.next_power_of_2(args["dstate"])})
+    {
+        "HAS_STATE_BATCH_INDICES": lambda args: args["state_batch_indices_ptr"]
+        is not None
+    }
+)
+@triton.heuristics(
+    {"BLOCK_SIZE_DSTATE": lambda args: triton.next_power_of_2(args["dstate"])}
+)
 @triton.jit
 def _selective_scan_update_kernel(
     # Pointers to matrices
@@ -110,15 +111,16 @@ def _selective_scan_update_kernel(
     if HAS_STATE_BATCH_INDICES:
         dst_state_batch_indices_ptr += pid_b
         dst_state_batch_idx = tl.load(dst_state_batch_indices_ptr).to(tl.int64)
-        dst_state_ptr = state_ptr + (dst_state_batch_idx * stride_state_batch +
-                                     pid_h * stride_state_head)
+        dst_state_ptr = state_ptr + (
+            dst_state_batch_idx * stride_state_batch + pid_h * stride_state_head
+        )
         state_batch_indices_ptr += pid_b
         state_batch_idx = tl.load(state_batch_indices_ptr).to(tl.int64)
-        state_ptr += (state_batch_idx * stride_state_batch +
-                      pid_h * stride_state_head)
+        state_ptr += state_batch_idx * stride_state_batch + pid_h * stride_state_head
     else:
-        dst_state_ptr = state_ptr + pid_b * stride_state_batch + \
-            pid_h * stride_state_head
+        dst_state_ptr = (
+            state_ptr + pid_b * stride_state_batch + pid_h * stride_state_head
+        )
         state_ptr += pid_b * stride_state_batch + pid_h * stride_state_head
 
     x_ptr += pid_b * stride_x_batch + pid_h * stride_x_head
@@ -126,28 +128,29 @@ def _selective_scan_update_kernel(
     if HAS_DT_BIAS:
         dt_bias_ptr += pid_h * stride_dt_bias_head
     A_ptr += pid_h * stride_A_head
-    B_ptr += pid_b * stride_B_batch + (pid_h //
-                                       nheads_ngroups_ratio) * stride_B_group
-    C_ptr += pid_b * stride_C_batch + (pid_h //
-                                       nheads_ngroups_ratio) * stride_C_group
+    B_ptr += pid_b * stride_B_batch + (pid_h // nheads_ngroups_ratio) * stride_B_group
+    C_ptr += pid_b * stride_C_batch + (pid_h // nheads_ngroups_ratio) * stride_C_group
     if HAS_Z:
         z_ptr += pid_b * stride_z_batch + pid_h * stride_z_head
     out_ptr += pid_b * stride_out_batch + pid_h * stride_out_head
 
     offs_m = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M)
     offs_n = tl.arange(0, BLOCK_SIZE_DSTATE)
-    state_ptrs = state_ptr + (offs_m[:, None] * stride_state_dim +
-                              offs_n[None, :] * stride_state_dstate)
-    dst_state_ptrs = dst_state_ptr + (offs_m[:, None] * stride_state_dim +
-                                      offs_n[None, :] * stride_state_dstate)
+    state_ptrs = state_ptr + (
+        offs_m[:, None] * stride_state_dim + offs_n[None, :] * stride_state_dstate
+    )
+    dst_state_ptrs = dst_state_ptr + (
+        offs_m[:, None] * stride_state_dim + offs_n[None, :] * stride_state_dstate
+    )
     x_ptrs = x_ptr + offs_m * stride_x_dim
     dt_ptrs = dt_ptr + offs_m * stride_dt_dim
     if HAS_DT_BIAS:
         dt_bias_ptrs = dt_bias_ptr + offs_m * stride_dt_bias_dim
     if HAS_D:
         D_ptr += pid_h * stride_D_head
-    A_ptrs = A_ptr + (offs_m[:, None] * stride_A_dim +
-                      offs_n[None, :] * stride_A_dstate)
+    A_ptrs = A_ptr + (
+        offs_m[:, None] * stride_A_dim + offs_n[None, :] * stride_A_dstate
+    )
     B_ptrs = B_ptr + offs_n * stride_B_dstate
     C_ptrs = C_ptr + offs_n * stride_C_dstate
     if HAS_D:
@@ -157,20 +160,19 @@ def _selective_scan_update_kernel(
     out_ptrs = out_ptr + offs_m * stride_out_dim
     mask = (offs_m[:, None] < dim) & (offs_n[None, :] < dstate)
     if HAS_STATE_BATCH_INDICES:
-        mask &= (state_batch_idx != pad_slot_id)
+        mask &= state_batch_idx != pad_slot_id
     state = tl.load(state_ptrs, mask=mask, other=0.0)
 
     x = tl.load(x_ptrs, mask=offs_m < dim, other=0.0).to(tl.float32)
     if not TIE_HDIM:
         dt = tl.load(dt_ptrs, mask=offs_m < dim, other=0.0).to(tl.float32)
         if HAS_DT_BIAS:
-            dt += tl.load(dt_bias_ptrs, mask=offs_m < dim,
-                          other=0.0).to(tl.float32)
+            dt += tl.load(dt_bias_ptrs, mask=offs_m < dim, other=0.0).to(tl.float32)
         if DT_SOFTPLUS:
             dt = softplus(dt)
-        A = tl.load(A_ptrs,
-                    mask=(offs_m[:, None] < dim) & (offs_n[None, :] < dstate),
-                    other=0.0).to(tl.float32)
+        A = tl.load(
+            A_ptrs, mask=(offs_m[:, None] < dim) & (offs_n[None, :] < dstate), other=0.0
+        ).to(tl.float32)
         dA = tl.exp(A * dt[:, None])
     else:
         dt = tl.load(dt_ptr).to(tl.float32)
@@ -193,7 +195,7 @@ def _selective_scan_update_kernel(
 
     mask = (offs_m[:, None] < dim) & (offs_n[None, :] < dstate)
     if HAS_STATE_BATCH_INDICES:
-        mask &= (state_batch_idx != pad_slot_id)
+        mask &= state_batch_idx != pad_slot_id
     tl.store(dst_state_ptrs, state, mask=mask)
     out = tl.sum(state * C[None, :], axis=1)
     if HAS_D:
@@ -203,20 +205,22 @@ def _selective_scan_update_kernel(
     tl.store(out_ptrs, out, mask=offs_m < dim)
 
 
-def selective_state_update(state,
-                           x,
-                           dt,
-                           A,
-                           B,
-                           C,
-                           D=None,
-                           z=None,
-                           dt_bias=None,
-                           dt_softplus=False,
-                           state_batch_indices=None,
-                           dst_state_batch_indices=None,
-                           pad_slot_id=PAD_SLOT_ID,
-                           out=None):
+def selective_state_update(
+    state,
+    x,
+    dt,
+    A,
+    B,
+    C,
+    D=None,
+    z=None,
+    dt_bias=None,
+    dt_softplus=False,
+    state_batch_indices=None,
+    dst_state_batch_indices=None,
+    pad_slot_id=PAD_SLOT_ID,
+    out=None,
+):
     """
     Argument:
         state: (batch, dim, dstate) or (batch, nheads, dim, dstate)
@@ -229,12 +233,12 @@ def selective_state_update(state,
         z: (batch, dim) or (batch, nheads, dim)
         dt_bias: (dim,) or (nheads, dim)
         pad_slot_id: int
-            if cache_indices is passed, lets the kernel identify padded 
-            entries that will not be processed, 
-            for example: cache_indices = [pad_slot_id, 1, 20, pad_slot_id] 
-            in this case, the kernel will not process entries at 
+            if cache_indices is passed, lets the kernel identify padded
+            entries that will not be processed,
+            for example: cache_indices = [pad_slot_id, 1, 20, pad_slot_id]
+            in this case, the kernel will not process entries at
             indices 0 and 3
-        out: Preallocated ssm output tensor. Assume same shape as x. 
+        out: Preallocated ssm output tensor. Assume same shape as x.
              In-place updated.
     """
     if state.dim() == 3:
@@ -275,25 +279,33 @@ def selective_state_update(state,
     if dt_bias is not None:
         assert dt_bias.shape == (nheads, dim)
     if state_batch_indices is not None:
-        assert state_batch_indices.shape == (batch, )
+        assert state_batch_indices.shape == (batch,)
     if dst_state_batch_indices is not None:
-        assert dst_state_batch_indices.shape == (batch, )
+        assert dst_state_batch_indices.shape == (batch,)
     else:
         # revert to the default behavior of in-place state updates
         dst_state_batch_indices = state_batch_indices
     assert out.shape == x.shape
 
-    grid = lambda META: (triton.cdiv(dim, META['BLOCK_SIZE_M']), batch, nheads)
-    z_strides = ((z.stride(0), z.stride(1), z.stride(2)) if z is not None else
-                 (0, 0, 0))
+    grid = lambda META: (triton.cdiv(dim, META["BLOCK_SIZE_M"]), batch, nheads)
+    z_strides = (z.stride(0), z.stride(1), z.stride(2)) if z is not None else (0, 0, 0)
     # We don't want autotune since it will overwrite the state
     # We instead tune by hand.
-    BLOCK_SIZE_M, num_warps = ((32, 4) if dstate <= 16 else
-                               ((16, 4) if dstate <= 32 else
-                                ((8, 4) if dstate <= 64 else
-                                 ((4, 4) if dstate <= 128 else ((4, 8))))))
-    tie_hdim = A.stride(-1) == 0 and A.stride(-2) == 0 and dt.stride(
-        -1) == 0 and dt_bias.stride(-1) == 0
+    BLOCK_SIZE_M, num_warps = (
+        (32, 4)
+        if dstate <= 16
+        else (
+            (16, 4)
+            if dstate <= 32
+            else ((8, 4) if dstate <= 64 else ((4, 4) if dstate <= 128 else ((4, 8))))
+        )
+    )
+    tie_hdim = (
+        A.stride(-1) == 0
+        and A.stride(-2) == 0
+        and dt.stride(-1) == 0
+        and dt_bias.stride(-1) == 0
+    )
     with torch.cuda.device(x.device.index):
         _selective_scan_update_kernel[grid](
             state,
@@ -324,8 +336,7 @@ def selective_state_update(state,
             dt.stride(0),
             dt.stride(1),
             dt.stride(2),
-            *(dt_bias.stride(0),
-              dt_bias.stride(1)) if dt_bias is not None else 0,
+            *(dt_bias.stride(0), dt_bias.stride(1)) if dt_bias is not None else 0,
             A.stride(0),
             A.stride(1),
             A.stride(2),
@@ -349,54 +360,56 @@ def selective_state_update(state,
         )
 
 
-def selective_scan_fn(u,
-                      ssm_states,
-                      delta,
-                      A,
-                      B,
-                      C,
-                      D=None,
-                      z=None,
-                      delta_bias=None,
-                      delta_softplus=False,
-                      query_start_loc=None,
-                      cache_indices=None,
-                      has_initial_state=None,
-                      pad_slot_id=PAD_SLOT_ID) -> torch.Tensor:
+def selective_scan_fn(
+    u,
+    ssm_states,
+    delta,
+    A,
+    B,
+    C,
+    D=None,
+    z=None,
+    delta_bias=None,
+    delta_softplus=False,
+    query_start_loc=None,
+    cache_indices=None,
+    has_initial_state=None,
+    pad_slot_id=PAD_SLOT_ID,
+) -> torch.Tensor:
     """
-    u: (dim, total_length) for varlen or (batch, dim, seqlen) 
+    u: (dim, total_length) for varlen or (batch, dim, seqlen)
         applies changes in place.
     ssm_states: (batch, dim, dstate) or (batch, nheads, dim, dstate)
         applies changes in place.
     delta: (dim, total_length) for varlen or (batch, dim, seqlen)
-    A: (dim, dstate) 
-    B: (ngroups, dstate, total_length) for varlen or 
+    A: (dim, dstate)
+    B: (ngroups, dstate, total_length) for varlen or
                                         (batch,ngroups,dstate,seqlen)
-    C: (ngroups, dstate, total_length) for varlen or 
+    C: (ngroups, dstate, total_length) for varlen or
                                         (batch,ngroups,dstate,seqlen)
-    D: (dim,) 
-    z: (dim, total_length) for varlen or (batch, dim, seqlen) 
+    D: (dim,)
+    z: (dim, total_length) for varlen or (batch, dim, seqlen)
     dt_bias: (dim,) or (dim)
     query_start_loc: (batch + 1) int32
         The cumulative sequence lengths of the sequences in
         the batch, used to index into sequence. prepended with 0.
-        for example: query_start_loc = torch.Tensor([0,10,16,17]), 
+        for example: query_start_loc = torch.Tensor([0,10,16,17]),
         x.shape=(dim,17)
     cache_indices: (batch) int32
-        A tensor with each cell is a correspondent 
+        A tensor with each cell is a correspondent
         input and output ssm_state index
     has_initial_state: (batch) bool
-        A tensor populated with ones and zeros, 
-        indicate if the ssm_state at the corresponding index should be 
-        used as initial state. Not providing argument assumes 
+        A tensor populated with ones and zeros,
+        indicate if the ssm_state at the corresponding index should be
+        used as initial state. Not providing argument assumes
         there's no initial state
     pad_slot_id: int
-        if cache_indices is passed, lets the kernel identify padding entries 
-        that will not be processed, 
-        for example: cache_indices = [pad_slot_id, 1 ,20 ,pad_slot_id] 
+        if cache_indices is passed, lets the kernel identify padding entries
+        that will not be processed,
+        for example: cache_indices = [pad_slot_id, 1 ,20 ,pad_slot_id]
         in this case, the kernel will not process entries at indices 0 and 3
     returns
-        output: (dim, total_length) for varlen or (batch, dim, seqlen) 
+        output: (dim, total_length) for varlen or (batch, dim, seqlen)
                 supports inplace replacement
     """
     if u.stride(-1) != 1:
@@ -420,9 +433,22 @@ def selective_scan_fn(u,
     if C.dim() == 2 and query_start_loc is not None:
         C = C.unsqueeze(0)
 
-    ops.selective_scan_fwd(u, delta, A, B, C, D, z, delta_bias, delta_softplus,
-                           query_start_loc, cache_indices, has_initial_state,
-                           ssm_states, pad_slot_id)
+    ops.selective_scan_fwd(
+        u,
+        delta,
+        A,
+        B,
+        C,
+        D,
+        z,
+        delta_bias,
+        delta_softplus,
+        query_start_loc,
+        cache_indices,
+        has_initial_state,
+        ssm_states,
+        pad_slot_id,
+    )
 
     if z is None:
         return delta  # output written inplace to delta
diff --git a/vllm/model_executor/layers/mamba/ops/ssd_bmm.py b/vllm/model_executor/layers/mamba/ops/ssd_bmm.py
index 15a72fc61261..ac5ffc10f295 100644
--- a/vllm/model_executor/layers/mamba/ops/ssd_bmm.py
+++ b/vllm/model_executor/layers/mamba/ops/ssd_bmm.py
@@ -14,79 +14,52 @@
 @triton.autotune(
     configs=[
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 256,
-                'BLOCK_SIZE_K': 64
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 256, "BLOCK_SIZE_K": 64},
             num_stages=3,
-            num_warps=8),
+            num_warps=8,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 256,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 256, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 128,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 128, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 64,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 64, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 128,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 128, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 32,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 32, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 32,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 32, "BLOCK_SIZE_K": 32},
             num_stages=5,
-            num_warps=2),
+            num_warps=2,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 32,
-                'BLOCK_SIZE_N': 64,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 32, "BLOCK_SIZE_N": 64, "BLOCK_SIZE_K": 32},
             num_stages=5,
-            num_warps=2),
+            num_warps=2,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 64,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 64, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=2),
+            num_warps=2,
+        ),
     ],
-    key=['chunk_size', 'K', 'IS_CAUSAL'],
+    key=["chunk_size", "K", "IS_CAUSAL"],
 )
 @triton.jit
 def _bmm_chunk_fwd_kernel(
@@ -136,24 +109,26 @@ def _bmm_chunk_fwd_kernel(
     offs_m = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M)
     offs_n = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
     offs_k = tl.arange(0, BLOCK_SIZE_K)
-    a_ptrs = a_ptr + (offs_m[:, None] * stride_a_seqlen +
-                      offs_k[None, :] * stride_ak)
-    b_ptrs = b_ptr + (offs_k[:, None] * stride_bk +
-                      offs_n[None, :] * stride_b_seqlen)
+    a_ptrs = a_ptr + (offs_m[:, None] * stride_a_seqlen + offs_k[None, :] * stride_ak)
+    b_ptrs = b_ptr + (offs_k[:, None] * stride_bk + offs_n[None, :] * stride_b_seqlen)
     chunk_size_limit = chunk_seqlen_end - chunk_seqlen_start
 
     acc = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N), dtype=tl.float32)
 
     # compute a * b.T
     for k in range(0, tl.cdiv(K, BLOCK_SIZE_K)):
-        a = tl.load(a_ptrs,
-                    mask=(offs_m[:, None] < chunk_size_limit) &
-                    (offs_k[None, :] < K - k * BLOCK_SIZE_K),
-                    other=0.0).to(dot_dtype)
-        b = tl.load(b_ptrs,
-                    mask=(offs_k[:, None] < K - k * BLOCK_SIZE_K) &
-                    (offs_n[None, :] < chunk_size_limit),
-                    other=0.0).to(dot_dtype)
+        a = tl.load(
+            a_ptrs,
+            mask=(offs_m[:, None] < chunk_size_limit)
+            & (offs_k[None, :] < K - k * BLOCK_SIZE_K),
+            other=0.0,
+        ).to(dot_dtype)
+        b = tl.load(
+            b_ptrs,
+            mask=(offs_k[:, None] < K - k * BLOCK_SIZE_K)
+            & (offs_n[None, :] < chunk_size_limit),
+            other=0.0,
+        ).to(dot_dtype)
         acc += tl.dot(a, b)
         a_ptrs += BLOCK_SIZE_K * stride_ak
         b_ptrs += BLOCK_SIZE_K * stride_bk
@@ -163,20 +138,15 @@ def _bmm_chunk_fwd_kernel(
 
     out = acc.to(out_ptr.dtype.element_ty)
     out_ptr += pid_c * stride_out_chunk + pid_h * stride_out_head
-    out_ptrs = out_ptr + (stride_outm * offs_m[:, None] +
-                          offs_n[None, :] * stride_outn)
-    tl.store(out_ptrs,
-             out,
-             mask=(offs_m[:, None] < chunk_size) &
-             (offs_n[None, :] < chunk_size))
-
-
-def _bmm_chunk_fwd(a,
-                   b,
-                   chunk_size,
-                   cu_chunk_seqlens,
-                   causal=False,
-                   output_dtype=None):
+    out_ptrs = out_ptr + (stride_outm * offs_m[:, None] + offs_n[None, :] * stride_outn)
+    tl.store(
+        out_ptrs,
+        out,
+        mask=(offs_m[:, None] < chunk_size) & (offs_n[None, :] < chunk_size),
+    )
+
+
+def _bmm_chunk_fwd(a, b, chunk_size, cu_chunk_seqlens, causal=False, output_dtype=None):
     """
     Argument:
         a: (seqlen, ngroups, k)
@@ -198,16 +168,23 @@ def _bmm_chunk_fwd(a,
     nchunks = len(cu_chunk_seqlens) - 1
     # Allocates output.
     out_dtype = a.dtype if output_dtype is None else output_dtype
-    out = torch.empty((nchunks, ngroups, chunk_size, chunk_size),
-                      device=a.device,
-                      dtype=out_dtype)
-    dot_dtype = (tl.bfloat16
-                 if a.dtype == torch.bfloat16 or b.dtype == torch.bfloat16 else
-                 (tl.float16 if a.dtype == torch.float16
-                  or b.dtype == torch.float16 else tl.float32))
-    grid = lambda META: (triton.cdiv(
-        chunk_size, META['BLOCK_SIZE_M']) * triton.cdiv(
-            chunk_size, META['BLOCK_SIZE_N']), nchunks * ngroups)
+    out = torch.empty(
+        (nchunks, ngroups, chunk_size, chunk_size), device=a.device, dtype=out_dtype
+    )
+    dot_dtype = (
+        tl.bfloat16
+        if a.dtype == torch.bfloat16 or b.dtype == torch.bfloat16
+        else (
+            tl.float16
+            if a.dtype == torch.float16 or b.dtype == torch.float16
+            else tl.float32
+        )
+    )
+    grid = lambda META: (
+        triton.cdiv(chunk_size, META["BLOCK_SIZE_M"])
+        * triton.cdiv(chunk_size, META["BLOCK_SIZE_N"]),
+        nchunks * ngroups,
+    )
     with torch.cuda.device(a.device.index):
         _bmm_chunk_fwd_kernel[grid](
             a_ptr=a,
diff --git a/vllm/model_executor/layers/mamba/ops/ssd_chunk_scan.py b/vllm/model_executor/layers/mamba/ops/ssd_chunk_scan.py
index e1e77e14f69d..e5a5c9dd6f71 100644
--- a/vllm/model_executor/layers/mamba/ops/ssd_chunk_scan.py
+++ b/vllm/model_executor/layers/mamba/ops/ssd_chunk_scan.py
@@ -10,101 +10,68 @@
 
 from vllm.triton_utils import tl, triton
 
-TRITON_22 = version.parse(triton.__version__) >= version.parse('2.2.0')
+TRITON_22 = version.parse(triton.__version__) >= version.parse("2.2.0")
 
 
 @triton.autotune(
     configs=[
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 256,
-                'BLOCK_SIZE_K': 64
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 256, "BLOCK_SIZE_K": 64},
             num_stages=3,
-            num_warps=8),
+            num_warps=8,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 256,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 256, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 128,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 128, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 64,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 64, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 128,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 128, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 64,
-                'BLOCK_SIZE_K': 64
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 64, "BLOCK_SIZE_K": 64},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 128,
-                'BLOCK_SIZE_K': 64
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 128, "BLOCK_SIZE_K": 64},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 32,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 32, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 32,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 32, "BLOCK_SIZE_K": 32},
             num_stages=5,
-            num_warps=2),
+            num_warps=2,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 32,
-                'BLOCK_SIZE_N': 64,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 32, "BLOCK_SIZE_N": 64, "BLOCK_SIZE_K": 32},
             num_stages=5,
-            num_warps=2),
+            num_warps=2,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 64,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 64, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=2),
+            num_warps=2,
+        ),
     ],
-    key=['chunk_size', 'hdim', 'dstate', 'IS_CAUSAL'],
+    key=["chunk_size", "hdim", "dstate", "IS_CAUSAL"],
 )
 @triton.jit
 def _chunk_scan_fwd_kernel(
@@ -177,15 +144,16 @@ def _chunk_scan_fwd_kernel(
     num_pid_n = tl.cdiv(hdim, BLOCK_SIZE_N)
     pid_m = tl.program_id(axis=0) // num_pid_n
     pid_n = tl.program_id(axis=0) % num_pid_n
-    cb_ptr += pid_c * stride_cb_chunk + (pid_h //
-                                         nheads_ngroups_ratio) * stride_cb_head
+    cb_ptr += pid_c * stride_cb_chunk + (pid_h // nheads_ngroups_ratio) * stride_cb_head
     chunk_seqlen_start = tl.load(cu_chunk_seqlens_ptr + pid_c)
     chunk_seqlen_end = tl.load(cu_chunk_seqlens_ptr + pid_c + 1)
     x_ptr += chunk_seqlen_start * stride_x_seqlen + pid_h * stride_x_head
     dt_ptr += pid_c * stride_dt_chunk + pid_h * stride_dt_head
     dA_cumsum_ptr += pid_c * stride_dA_cs_chunk + pid_h * stride_dA_cs_head
-    C_ptr += chunk_seqlen_start * stride_C_seqlen + (
-        pid_h // nheads_ngroups_ratio) * stride_C_head
+    C_ptr += (
+        chunk_seqlen_start * stride_C_seqlen
+        + (pid_h // nheads_ngroups_ratio) * stride_C_head
+    )
 
     # M-block offsets and prev states
     #  - logic in next block may override these if there is an active offset
@@ -193,26 +161,31 @@ def _chunk_scan_fwd_kernel(
 
     seq_idx_ptr += pid_c * stride_seq_idx_chunk
     seq_idx = tl.load(seq_idx_ptr)
-    seq_idx_prev = tl.load(seq_idx_ptr - stride_seq_idx_chunk,
-                           mask=pid_c >= 1,
-                           other=-1)
+    seq_idx_prev = tl.load(
+        seq_idx_ptr - stride_seq_idx_chunk, mask=pid_c >= 1, other=-1
+    )
 
     if HAS_INITSTATES and (seq_idx != seq_idx_prev):
-        prev_states_ptr = initstates_ptr + seq_idx * stride_init_states_batch + pid_h * stride_init_states_head
+        prev_states_ptr = (
+            initstates_ptr
+            + seq_idx * stride_init_states_batch
+            + pid_h * stride_init_states_head
+        )
         prev_states_hdim = stride_init_states_hdim
         prev_states_dstate = stride_init_states_dstate
     else:
-        prev_states_ptr = states_ptr + (
-            pid_c - 1) * stride_states_chunk + pid_h * stride_states_head
+        prev_states_ptr = (
+            states_ptr + (pid_c - 1) * stride_states_chunk + pid_h * stride_states_head
+        )
         prev_states_hdim = stride_states_hdim
         prev_states_dstate = stride_states_dstate
 
     chunk_size_limit = chunk_seqlen_end - chunk_seqlen_start
 
     offs_n = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
-    dA_cs_m = tl.load(dA_cumsum_ptr + offs_m * stride_dA_cs_csize,
-                      mask=offs_m < chunk_size,
-                      other=0.0).to(tl.float32)
+    dA_cs_m = tl.load(
+        dA_cumsum_ptr + offs_m * stride_dA_cs_csize, mask=offs_m < chunk_size, other=0.0
+    ).to(tl.float32)
 
     acc = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N), dtype=tl.float32)
 
@@ -221,52 +194,66 @@ def _chunk_scan_fwd_kernel(
 
     # Faster to just do 1 iteration with larger BLOCK_SIZE_K, up to block size 128
     offs_k_dstate = tl.arange(
-        0, BLOCK_SIZE_DSTATE if BLOCK_SIZE_DSTATE <= 128 else BLOCK_SIZE_K)
-    C_ptrs = C_ptr + (offs_m[:, None] * stride_C_seqlen +
-                      offs_k_dstate[None, :] * stride_C_dstate)
+        0, BLOCK_SIZE_DSTATE if BLOCK_SIZE_DSTATE <= 128 else BLOCK_SIZE_K
+    )
+    C_ptrs = C_ptr + (
+        offs_m[:, None] * stride_C_seqlen + offs_k_dstate[None, :] * stride_C_dstate
+    )
 
     scale_m = tl.exp(dA_cs_m)
     if BLOCK_SIZE_DSTATE <= 128:
-        C = tl.load(C_ptrs,
-                    mask=(offs_m[:, None] < chunk_size_limit) &
-                    (offs_k_dstate[None, :] < dstate),
-                    other=0.0)
+        C = tl.load(
+            C_ptrs,
+            mask=(offs_m[:, None] < chunk_size_limit)
+            & (offs_k_dstate[None, :] < dstate),
+            other=0.0,
+        )
 
         if not HAS_INITSTATES and (seq_idx != seq_idx_prev):
             # if no init states AND starting a new sequence, we need zeros
-            prev_states = tl.zeros((BLOCK_SIZE_DSTATE, BLOCK_SIZE_N),
-                                   dtype=C_ptr.dtype.element_ty)
+            prev_states = tl.zeros(
+                (BLOCK_SIZE_DSTATE, BLOCK_SIZE_N), dtype=C_ptr.dtype.element_ty
+            )
         else:
             # otherwise read the previous state
-            prev_states_ptrs = prev_states_ptr \
-                    + offs_n[None, :] * prev_states_hdim \
-                    + offs_k_dstate[:, None] * prev_states_dstate
-            prev_states = tl.load(prev_states_ptrs,
-                                  mask=(offs_k_dstate[:, None] < dstate) &
-                                  (offs_n[None, :] < hdim),
-                                  other=0.0)
+            prev_states_ptrs = (
+                prev_states_ptr
+                + offs_n[None, :] * prev_states_hdim
+                + offs_k_dstate[:, None] * prev_states_dstate
+            )
+            prev_states = tl.load(
+                prev_states_ptrs,
+                mask=(offs_k_dstate[:, None] < dstate) & (offs_n[None, :] < hdim),
+                other=0.0,
+            )
             prev_states = prev_states.to(C_ptr.dtype.element_ty)
 
         acc = tl.dot(C, prev_states) * scale_m[:, None]
 
     else:
-        prev_states_ptrs = prev_states_ptr \
-                        + offs_n[None, :] * prev_states_hdim \
-                        + offs_k_dstate[:, None] * prev_states_dstate
+        prev_states_ptrs = (
+            prev_states_ptr
+            + offs_n[None, :] * prev_states_hdim
+            + offs_k_dstate[:, None] * prev_states_dstate
+        )
         for k in range(0, dstate, BLOCK_SIZE_K):
-            C = tl.load(C_ptrs,
-                        mask=(offs_m[:, None] < chunk_size_limit) &
-                        (offs_k_dstate[None, :] < dstate - k),
-                        other=0.0)
+            C = tl.load(
+                C_ptrs,
+                mask=(offs_m[:, None] < chunk_size_limit)
+                & (offs_k_dstate[None, :] < dstate - k),
+                other=0.0,
+            )
             if not HAS_INITSTATES and (seq_idx != seq_idx_prev):
-                prev_states = tl.zeros((BLOCK_SIZE_DSTATE, BLOCK_SIZE_K),
-                                       dtype=C_ptr.dtype.element_ty)
+                prev_states = tl.zeros(
+                    (BLOCK_SIZE_DSTATE, BLOCK_SIZE_K), dtype=C_ptr.dtype.element_ty
+                )
             else:
                 prev_states = tl.load(
                     prev_states_ptrs,
-                    mask=(offs_k_dstate[:, None] < dstate - k) &
-                    (offs_n[None, :] < hdim),
-                    other=0.0)
+                    mask=(offs_k_dstate[:, None] < dstate - k)
+                    & (offs_n[None, :] < hdim),
+                    other=0.0,
+                )
                 prev_states = prev_states.to(C_ptr.dtype.element_ty)
             acc += tl.dot(C, prev_states)
             C_ptrs += BLOCK_SIZE_K
@@ -274,36 +261,42 @@ def _chunk_scan_fwd_kernel(
         acc *= scale_m[:, None]
 
     offs_k = tl.arange(0, BLOCK_SIZE_K)
-    cb_ptrs = cb_ptr + (offs_m[:, None] * stride_cb_csize_m +
-                        offs_k[None, :] * stride_cb_csize_k)
-    x_ptrs = x_ptr + (offs_k[:, None] * stride_x_seqlen +
-                      offs_n[None, :] * stride_x_hdim)
+    cb_ptrs = cb_ptr + (
+        offs_m[:, None] * stride_cb_csize_m + offs_k[None, :] * stride_cb_csize_k
+    )
+    x_ptrs = x_ptr + (
+        offs_k[:, None] * stride_x_seqlen + offs_n[None, :] * stride_x_hdim
+    )
     dt_ptrs = dt_ptr + offs_k * stride_dt_csize
     dA_cumsum_ptrs = dA_cumsum_ptr + offs_k * stride_dA_cs_csize
-    K_MAX = chunk_size_limit if not IS_CAUSAL else min(
-        (pid_m + 1) * BLOCK_SIZE_M, chunk_size_limit)
+    K_MAX = (
+        chunk_size_limit
+        if not IS_CAUSAL
+        else min((pid_m + 1) * BLOCK_SIZE_M, chunk_size_limit)
+    )
     for k in range(0, K_MAX, BLOCK_SIZE_K):
-        cb = tl.load(cb_ptrs,
-                     mask=(offs_m[:, None] < chunk_size) &
-                     (offs_k[None, :] < chunk_size - k),
-                     other=0.0).to(tl.float32)
-        dA_cs_k = tl.load(dA_cumsum_ptrs,
-                          mask=offs_k < chunk_size - k,
-                          other=0.0).to(tl.float32)
+        cb = tl.load(
+            cb_ptrs,
+            mask=(offs_m[:, None] < chunk_size) & (offs_k[None, :] < chunk_size - k),
+            other=0.0,
+        ).to(tl.float32)
+        dA_cs_k = tl.load(dA_cumsum_ptrs, mask=offs_k < chunk_size - k, other=0.0).to(
+            tl.float32
+        )
         # If there's seq_idx, we already set cb[i, j] = 0 for seq_idx[i] != seq_idx[j].
         # So we don't need masking wrt seq_idx here.
         cb *= tl.exp(dA_cs_m[:, None] - dA_cs_k[None, :])
-        dt_k = tl.load(dt_ptrs, mask=offs_k < chunk_size - k,
-                       other=0.0).to(tl.float32)
+        dt_k = tl.load(dt_ptrs, mask=offs_k < chunk_size - k, other=0.0).to(tl.float32)
         cb *= dt_k
         if IS_CAUSAL:
             mask = offs_m[:, None] >= k + offs_k[None, :]
             cb = tl.where(mask, cb, 0.0)
         cb = cb.to(x_ptr.dtype.element_ty)
-        x = tl.load(x_ptrs,
-                    mask=(offs_k[:, None] < chunk_size_limit - k) &
-                    (offs_n[None, :] < hdim),
-                    other=0.0)
+        x = tl.load(
+            x_ptrs,
+            mask=(offs_k[:, None] < chunk_size_limit - k) & (offs_n[None, :] < hdim),
+            other=0.0,
+        )
         acc += tl.dot(cb, x)
         cb_ptrs += BLOCK_SIZE_K * stride_cb_csize_k
         x_ptrs += BLOCK_SIZE_K * stride_x_seqlen
@@ -315,35 +308,41 @@ def _chunk_scan_fwd_kernel(
 
     if HAS_D:
         if D_HAS_HDIM:
-            D = tl.load(D_ptr + pid_h * stride_D_head + offs_n,
-                        mask=offs_n < hdim,
-                        other=0.0).to(tl.float32)
+            D = tl.load(
+                D_ptr + pid_h * stride_D_head + offs_n, mask=offs_n < hdim, other=0.0
+            ).to(tl.float32)
         else:
             D = tl.load(D_ptr + pid_h * stride_D_head).to(tl.float32)
-        x_residual = tl.load(x_ptr + (offs_m[:, None] * stride_x_seqlen +
-                                      offs_n[None, :] * stride_x_hdim),
-                             mask=(offs_m[:, None] < chunk_size_limit) &
-                             (offs_n[None, :] < hdim),
-                             other=0.0).to(tl.float32)
+        x_residual = tl.load(
+            x_ptr
+            + (offs_m[:, None] * stride_x_seqlen + offs_n[None, :] * stride_x_hdim),
+            mask=(offs_m[:, None] < chunk_size_limit) & (offs_n[None, :] < hdim),
+            other=0.0,
+        ).to(tl.float32)
         acc += x_residual * D
 
     if HAS_Z:
         z_ptr += chunk_seqlen_start * stride_z_seqlen + pid_h * stride_z_head
-        z_ptrs = z_ptr + (stride_z_seqlen * offs_out_m[:, None] +
-                          stride_z_hdim * offs_out_n[None, :])
-        z = tl.load(z_ptrs,
-                    mask=(offs_out_m[:, None] < chunk_size_limit) &
-                    (offs_out_n[None, :] < hdim),
-                    other=0.0).to(tl.float32)
+        z_ptrs = z_ptr + (
+            stride_z_seqlen * offs_out_m[:, None] + stride_z_hdim * offs_out_n[None, :]
+        )
+        z = tl.load(
+            z_ptrs,
+            mask=(offs_out_m[:, None] < chunk_size_limit)
+            & (offs_out_n[None, :] < hdim),
+            other=0.0,
+        ).to(tl.float32)
         acc *= z * tl.sigmoid(z)
 
     out_ptr += chunk_seqlen_start * stride_out_seqlen + pid_h * stride_out_head
-    out_ptrs = out_ptr + (stride_out_seqlen * offs_out_m[:, None] +
-                          offs_out_n[None, :] * stride_out_hdim)
-    tl.store(out_ptrs,
-             acc,
-             mask=(offs_out_m[:, None] < chunk_size_limit) &
-             (offs_out_n[None, :] < hdim))
+    out_ptrs = out_ptr + (
+        stride_out_seqlen * offs_out_m[:, None] + offs_out_n[None, :] * stride_out_hdim
+    )
+    tl.store(
+        out_ptrs,
+        acc,
+        mask=(offs_out_m[:, None] < chunk_size_limit) & (offs_out_n[None, :] < hdim),
+    )
 
 
 def _chunk_scan_fwd(
@@ -369,24 +368,32 @@ def _chunk_scan_fwd(
     assert C.shape == (seqlen, ngroups, dstate)
     assert cb.shape == (nchunks, ngroups, chunk_size, chunk_size)
     if D is not None:
-        assert D.shape == (nheads, headdim) or D.shape == (nheads, )
+        assert D.shape == (nheads, headdim) or D.shape == (nheads,)
     if z is not None:
         assert z.shape == x.shape
     assert dt.shape == (nheads, nchunks, chunk_size)
     assert dA_cumsum.shape == (nheads, nchunks, chunk_size)
     assert states.shape == (nchunks, nheads, headdim, dstate)
-    assert seq_idx.shape == (nchunks, )
+    assert seq_idx.shape == (nchunks,)
 
-    grid = lambda META: (triton.cdiv(chunk_size, META['BLOCK_SIZE_M']) * triton
-                         .cdiv(headdim, META['BLOCK_SIZE_N']), nchunks, nheads)
+    grid = lambda META: (
+        triton.cdiv(chunk_size, META["BLOCK_SIZE_M"])
+        * triton.cdiv(headdim, META["BLOCK_SIZE_N"]),
+        nchunks,
+        nheads,
+    )
 
-    z_strides = ((z.stride(0), z.stride(1), z.stride(2)) if z is not None else
-                 (0, 0, 0))
-    initial_states_strides = ((initial_states.stride(0),
-                               initial_states.stride(1),
-                               initial_states.stride(2),
-                               initial_states.stride(3))
-                              if initial_states is not None else (0, 0, 0, 0))
+    z_strides = (z.stride(0), z.stride(1), z.stride(2)) if z is not None else (0, 0, 0)
+    initial_states_strides = (
+        (
+            initial_states.stride(0),
+            initial_states.stride(1),
+            initial_states.stride(2),
+            initial_states.stride(3),
+        )
+        if initial_states is not None
+        else (0, 0, 0, 0)
+    )
 
     _chunk_scan_fwd_kernel[grid](
         cb_ptr=cb,
diff --git a/vllm/model_executor/layers/mamba/ops/ssd_chunk_state.py b/vllm/model_executor/layers/mamba/ops/ssd_chunk_state.py
index 3a3e0f293459..11cc125bf219 100644
--- a/vllm/model_executor/layers/mamba/ops/ssd_chunk_state.py
+++ b/vllm/model_executor/layers/mamba/ops/ssd_chunk_state.py
@@ -15,14 +15,14 @@
 
 @triton.autotune(
     configs=[
-        triton.Config({'BLOCK_SIZE_H': 2}),
-        triton.Config({'BLOCK_SIZE_H': 4}),
-        triton.Config({'BLOCK_SIZE_H': 8}),
-        triton.Config({'BLOCK_SIZE_H': 16}),
-        triton.Config({'BLOCK_SIZE_H': 32}),
-        triton.Config({'BLOCK_SIZE_H': 64}),
+        triton.Config({"BLOCK_SIZE_H": 2}),
+        triton.Config({"BLOCK_SIZE_H": 4}),
+        triton.Config({"BLOCK_SIZE_H": 8}),
+        triton.Config({"BLOCK_SIZE_H": 16}),
+        triton.Config({"BLOCK_SIZE_H": 32}),
+        triton.Config({"BLOCK_SIZE_H": 64}),
     ],
-    key=['chunk_size', 'nheads'],
+    key=["chunk_size", "nheads"],
 )
 @triton.jit
 def _chunk_cumsum_fwd_kernel(
@@ -70,118 +70,99 @@ def _chunk_cumsum_fwd_kernel(
 
     offs_h = pid_h * BLOCK_SIZE_H + tl.arange(0, BLOCK_SIZE_H)
     offs_c = tl.arange(0, BLOCK_SIZE_CHUNK)
-    dt_ptrs = dt_ptr + (offs_h[:, None] * stride_dt_head +
-                        offs_c[None, :] * stride_dt_seqlen)
+    dt_ptrs = dt_ptr + (
+        offs_h[:, None] * stride_dt_head + offs_c[None, :] * stride_dt_seqlen
+    )
     A_ptrs = A_ptr + offs_h * stride_A_head
-    dt_out_ptrs = dt_out_ptr + (offs_h[:, None] * stride_dt_out_head +
-                                offs_c[None, :] * stride_dt_out_csize)
-    dA_cs_ptrs = dA_cumsum_ptr + (offs_h[:, None] * stride_dA_cs_head +
-                                  offs_c[None, :] * stride_dA_cs_csize)
+    dt_out_ptrs = dt_out_ptr + (
+        offs_h[:, None] * stride_dt_out_head + offs_c[None, :] * stride_dt_out_csize
+    )
+    dA_cs_ptrs = dA_cumsum_ptr + (
+        offs_h[:, None] * stride_dA_cs_head + offs_c[None, :] * stride_dA_cs_csize
+    )
     chunk_size_limit = chunk_seqlen_end - chunk_seqlen_start
 
-    dt = tl.load(dt_ptrs,
-                 mask=(offs_h[:, None] < nheads) &
-                 (offs_c[None, :] < chunk_size_limit),
-                 other=0.0).to(tl.float32)
+    dt = tl.load(
+        dt_ptrs,
+        mask=(offs_h[:, None] < nheads) & (offs_c[None, :] < chunk_size_limit),
+        other=0.0,
+    ).to(tl.float32)
     if HAS_DT_BIAS:
-        dt_bias = tl.load(dt_bias_ptr + offs_h * stride_dt_bias_head,
-                          mask=offs_h < nheads,
-                          other=0.0).to(tl.float32)
+        dt_bias = tl.load(
+            dt_bias_ptr + offs_h * stride_dt_bias_head, mask=offs_h < nheads, other=0.0
+        ).to(tl.float32)
         dt += dt_bias[:, None]
     if DT_SOFTPLUS:
         dt = tl.where(dt <= 20.0, softplus(dt), dt)
 
     dt = tl.clamp(dt, dt_min, dt_max)
     dt = tl.where(
-        (offs_h[:, None] < nheads) & (offs_c[None, :] < chunk_size_limit), dt,
-        0.0)
-    tl.store(dt_out_ptrs,
-             dt,
-             mask=(offs_h[:, None] < nheads) & (offs_c[None, :] < chunk_size))
+        (offs_h[:, None] < nheads) & (offs_c[None, :] < chunk_size_limit), dt, 0.0
+    )
+    tl.store(
+        dt_out_ptrs,
+        dt,
+        mask=(offs_h[:, None] < nheads) & (offs_c[None, :] < chunk_size),
+    )
     A = tl.load(A_ptrs, mask=offs_h < nheads, other=0.0).to(tl.float32)
     dA = dt * A[:, None]
     dA_cs = tl.cumsum(dA, axis=1)
-    tl.store(dA_cs_ptrs,
-             dA_cs,
-             mask=(offs_h[:, None] < nheads) & (offs_c[None, :] < chunk_size))
+    tl.store(
+        dA_cs_ptrs,
+        dA_cs,
+        mask=(offs_h[:, None] < nheads) & (offs_c[None, :] < chunk_size),
+    )
 
 
 @triton.autotune(
     configs=[
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 256,
-                'BLOCK_SIZE_K': 64
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 256, "BLOCK_SIZE_K": 64},
             num_stages=3,
-            num_warps=8),
+            num_warps=8,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 256,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 256, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 128,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 128, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 64,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 64, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 128,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 128, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 32,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 32, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 32,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 32, "BLOCK_SIZE_K": 32},
             num_stages=5,
-            num_warps=2),
+            num_warps=2,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 32,
-                'BLOCK_SIZE_N': 64,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 32, "BLOCK_SIZE_N": 64, "BLOCK_SIZE_K": 32},
             num_stages=5,
-            num_warps=2),
+            num_warps=2,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 64,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 64, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=2),
+            num_warps=2,
+        ),
     ],
-    key=['hdim', 'dstate', 'chunk_size'],
+    key=["hdim", "dstate", "chunk_size"],
 )
 @triton.jit
 def _chunk_state_fwd_kernel(
@@ -227,8 +208,10 @@ def _chunk_state_fwd_kernel(
     pid_n = tl.program_id(axis=0) % num_pid_n
     chunk_seqlen_start = tl.load(cu_chunk_seqlens_ptr + pid_c)
     chunk_seqlen_end = tl.load(cu_chunk_seqlens_ptr + pid_c + 1)
-    b_ptr += chunk_seqlen_start * stride_b_seqlen + (
-        pid_h // nheads_ngroups_ratio) * stride_b_head
+    b_ptr += (
+        chunk_seqlen_start * stride_b_seqlen
+        + (pid_h // nheads_ngroups_ratio) * stride_b_head
+    )
     x_ptr += chunk_seqlen_start * stride_x_seqlen + pid_h * stride_x_head
     dt_ptr += pid_c * stride_dt_chunk + pid_h * stride_dt_head
     dA_cumsum_ptr += pid_c * stride_dA_cs_chunk + pid_h * stride_dA_cs_head
@@ -236,32 +219,38 @@ def _chunk_state_fwd_kernel(
     offs_m = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M)
     offs_n = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
     offs_k = tl.arange(0, BLOCK_SIZE_K)
-    x_ptrs = x_ptr + (offs_m[:, None] * stride_x_hdim +
-                      offs_k[None, :] * stride_x_seqlen)
-    b_ptrs = b_ptr + (offs_n[None, :] * stride_b_dstate +
-                      offs_k[:, None] * stride_b_seqlen)
+    x_ptrs = x_ptr + (
+        offs_m[:, None] * stride_x_hdim + offs_k[None, :] * stride_x_seqlen
+    )
+    b_ptrs = b_ptr + (
+        offs_n[None, :] * stride_b_dstate + offs_k[:, None] * stride_b_seqlen
+    )
     dt_ptrs = dt_ptr + offs_k * stride_dt_csize
-    dA_cs_last = tl.load(dA_cumsum_ptr +
-                         (chunk_size - 1) * stride_dA_cs_csize).to(tl.float32)
+    dA_cs_last = tl.load(dA_cumsum_ptr + (chunk_size - 1) * stride_dA_cs_csize).to(
+        tl.float32
+    )
     dA_cumsum_ptrs = dA_cumsum_ptr + offs_k * stride_dA_cs_csize
 
     chunk_size_limit = chunk_seqlen_end - chunk_seqlen_start
 
     acc = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N), dtype=tl.float32)
     for k in range(0, chunk_size_limit, BLOCK_SIZE_K):
-        x = tl.load(x_ptrs,
-                    mask=(offs_m[:, None] < hdim) &
-                    (offs_k[None, :] < chunk_size_limit - k),
-                    other=0.0)
-        b = tl.load(b_ptrs,
-                    mask=(offs_k[:, None] < chunk_size_limit - k) &
-                    (offs_n[None, :] < dstate),
-                    other=0.0).to(tl.float32)
-        dA_cs_k = tl.load(dA_cumsum_ptrs,
-                          mask=offs_k < chunk_size_limit - k,
-                          other=0.0).to(tl.float32)
-        dt_k = tl.load(dt_ptrs, mask=offs_k < chunk_size_limit - k,
-                       other=0.0).to(tl.float32)
+        x = tl.load(
+            x_ptrs,
+            mask=(offs_m[:, None] < hdim) & (offs_k[None, :] < chunk_size_limit - k),
+            other=0.0,
+        )
+        b = tl.load(
+            b_ptrs,
+            mask=(offs_k[:, None] < chunk_size_limit - k) & (offs_n[None, :] < dstate),
+            other=0.0,
+        ).to(tl.float32)
+        dA_cs_k = tl.load(
+            dA_cumsum_ptrs, mask=offs_k < chunk_size_limit - k, other=0.0
+        ).to(tl.float32)
+        dt_k = tl.load(dt_ptrs, mask=offs_k < chunk_size_limit - k, other=0.0).to(
+            tl.float32
+        )
         scale = tl.exp(dA_cs_last - dA_cs_k) * dt_k
         b *= scale[:, None]
         b = b.to(x_ptr.dtype.element_ty)
@@ -277,8 +266,9 @@ def _chunk_state_fwd_kernel(
     states_ptr += pid_c * stride_states_chunk + pid_h * stride_states_head
     offs_m = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M)
     offs_n = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
-    states_ptrs = states_ptr + (offs_m[:, None] * stride_states_hdim +
-                                offs_n[None, :] * stride_states_dstate)
+    states_ptrs = states_ptr + (
+        offs_m[:, None] * stride_states_hdim + offs_n[None, :] * stride_states_dstate
+    )
     c_mask = (offs_m[:, None] < hdim) & (offs_n[None, :] < dstate)
     tl.store(states_ptrs, states, mask=c_mask)
 
@@ -286,79 +276,52 @@ def _chunk_state_fwd_kernel(
 @triton.autotune(
     configs=[
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 256,
-                'BLOCK_SIZE_K': 64
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 256, "BLOCK_SIZE_K": 64},
             num_stages=3,
-            num_warps=8),
+            num_warps=8,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 256,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 256, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 128,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 128, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 64,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 64, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 128,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 128, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 128,
-                'BLOCK_SIZE_N': 32,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 128, "BLOCK_SIZE_N": 32, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=4),
+            num_warps=4,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 32,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 32, "BLOCK_SIZE_K": 32},
             num_stages=5,
-            num_warps=2),
+            num_warps=2,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 32,
-                'BLOCK_SIZE_N': 64,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 32, "BLOCK_SIZE_N": 64, "BLOCK_SIZE_K": 32},
             num_stages=5,
-            num_warps=2),
+            num_warps=2,
+        ),
         triton.Config(
-            {
-                'BLOCK_SIZE_M': 64,
-                'BLOCK_SIZE_N': 64,
-                'BLOCK_SIZE_K': 32
-            },
+            {"BLOCK_SIZE_M": 64, "BLOCK_SIZE_N": 64, "BLOCK_SIZE_K": 32},
             num_stages=4,
-            num_warps=2),
+            num_warps=2,
+        ),
     ],
-    key=['hdim', 'dstate', 'chunk_size'],
+    key=["hdim", "dstate", "chunk_size"],
 )
 @triton.jit
 def _chunk_state_varlen_kernel(
@@ -414,12 +377,16 @@ def _chunk_state_varlen_kernel(
     pid_n = tl.program_id(axis=0) % num_pid_n
     end_idx = tl.load(cu_seqlens_ptr + pid_b + 1)
     pid_c = (end_idx - 1) // chunk_size
-    b_ptr += pid_c * chunk_size * stride_b_seqlen + (
-        pid_h // nheads_ngroups_ratio) * stride_b_head
+    b_ptr += (
+        pid_c * chunk_size * stride_b_seqlen
+        + (pid_h // nheads_ngroups_ratio) * stride_b_head
+    )
     x_ptr += pid_c * chunk_size * stride_x_seqlen + pid_h * stride_x_head
     dt_ptr += pid_c * stride_dt_chunk + pid_h * stride_dt_head
     dA_cumsum_ptr += pid_c * stride_dA_cs_chunk + pid_h * stride_dA_cs_head
-    chunk_states_ptr += pid_c * stride_chunk_states_chunk + pid_h * stride_chunk_states_head
+    chunk_states_ptr += (
+        pid_c * stride_chunk_states_chunk + pid_h * stride_chunk_states_head
+    )
 
     if HAS_INITSTATES:
         # if there are init states provided, we differentiate between states (which
@@ -430,13 +397,16 @@ def _chunk_state_varlen_kernel(
     offs_m = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M)
     offs_n = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
     offs_k = tl.arange(0, BLOCK_SIZE_K)
-    x_ptrs = x_ptr + (offs_m[:, None] * stride_x_hdim +
-                      offs_k[None, :] * stride_x_seqlen)
-    b_ptrs = b_ptr + (offs_n[None, :] * stride_b_dstate +
-                      offs_k[:, None] * stride_b_seqlen)
+    x_ptrs = x_ptr + (
+        offs_m[:, None] * stride_x_hdim + offs_k[None, :] * stride_x_seqlen
+    )
+    b_ptrs = b_ptr + (
+        offs_n[None, :] * stride_b_dstate + offs_k[:, None] * stride_b_seqlen
+    )
     dt_ptrs = dt_ptr + offs_k * stride_dt_csize
-    dA_cs_last = tl.load(dA_cumsum_ptr + (end_idx - pid_c * chunk_size - 1) *
-                         stride_dA_cs_csize).to(tl.float32)
+    dA_cs_last = tl.load(
+        dA_cumsum_ptr + (end_idx - pid_c * chunk_size - 1) * stride_dA_cs_csize
+    ).to(tl.float32)
     dA_cumsum_ptrs = dA_cumsum_ptr + offs_k * stride_dA_cs_csize
 
     chunk_size_limit = end_idx - pid_c * chunk_size
@@ -445,24 +415,31 @@ def _chunk_state_varlen_kernel(
 
     acc = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N), dtype=tl.float32)
     for k in range(0, chunk_size_limit, BLOCK_SIZE_K):
-        x = tl.load(x_ptrs,
-                    mask=(offs_m[:, None] < hdim) &
-                    (offs_k[None, :] < chunk_size_limit - k) &
-                    (offs_k[None, :] >= start_idx_cur - k),
-                    other=0.0)
-        b = tl.load(b_ptrs,
-                    mask=(offs_k[:, None] < chunk_size_limit - k) &
-                    (offs_n[None, :] < dstate) &
-                    (offs_k[:, None] >= start_idx_cur - k),
-                    other=0.0).to(tl.float32)
-        dA_cs_k = tl.load(dA_cumsum_ptrs,
-                          mask=offs_k < chunk_size_limit - k,
-                          other=0.0).to(tl.float32)
-        dt_k = tl.load(dt_ptrs, mask=offs_k < chunk_size_limit - k,
-                       other=0.0).to(tl.float32)
+        x = tl.load(
+            x_ptrs,
+            mask=(offs_m[:, None] < hdim)
+            & (offs_k[None, :] < chunk_size_limit - k)
+            & (offs_k[None, :] >= start_idx_cur - k),
+            other=0.0,
+        )
+        b = tl.load(
+            b_ptrs,
+            mask=(offs_k[:, None] < chunk_size_limit - k)
+            & (offs_n[None, :] < dstate)
+            & (offs_k[:, None] >= start_idx_cur - k),
+            other=0.0,
+        ).to(tl.float32)
+        dA_cs_k = tl.load(
+            dA_cumsum_ptrs, mask=offs_k < chunk_size_limit - k, other=0.0
+        ).to(tl.float32)
+        dt_k = tl.load(dt_ptrs, mask=offs_k < chunk_size_limit - k, other=0.0).to(
+            tl.float32
+        )
         scale = tl.where(
             (offs_k >= start_idx_cur - k) & (offs_k < chunk_size_limit - k),
-            tl.exp(dA_cs_last - dA_cs_k) * dt_k, 0.0)
+            tl.exp(dA_cs_last - dA_cs_k) * dt_k,
+            0.0,
+        )
         b *= scale[:, None]
         b = b.to(x_ptr.dtype.element_ty)
         acc += tl.dot(x, b)
@@ -475,39 +452,43 @@ def _chunk_state_varlen_kernel(
     # If HAS_INITSTATES==True need to consider two possibilities
     # - if start_idx < pid_c * chunk_size, then we need to take the past_states_ptrs
     # - if state_idx >= pid * chunk_size, then we need to insert initstates
-    if ((start_idx < pid_c * chunk_size)  # first chunk
-            or (HAS_INITSTATES)):
-
+    if (
+        (start_idx < pid_c * chunk_size)  # first chunk
+        or (HAS_INITSTATES)
+    ):
         dA_cs_boundary = 0.0  # default
 
         if not HAS_INITSTATES:
             past_states_ptrs = chunk_states_ptr + (
-                offs_m[:, None] * stride_chunk_states_hdim +
-                offs_n[None, :] * stride_chunk_states_dstate)
+                offs_m[:, None] * stride_chunk_states_hdim
+                + offs_n[None, :] * stride_chunk_states_dstate
+            )
         else:
-
             # - this seems repetitive, buts its to help the compiler
             if start_idx < pid_c * chunk_size:
                 past_states_ptrs = chunk_states_ptr + (
-                    offs_m[:, None] * stride_chunk_states_hdim +
-                    offs_n[None, :] * stride_chunk_states_dstate)
+                    offs_m[:, None] * stride_chunk_states_hdim
+                    + offs_n[None, :] * stride_chunk_states_dstate
+                )
             else:
                 past_states_ptrs = initstates_ptr + (
-                    pid_b * stride_init_states_batch +
-                    offs_m[:, None] * stride_init_states_hdim +
-                    offs_n[None, :] * stride_init_states_dstate)
+                    pid_b * stride_init_states_batch
+                    + offs_m[:, None] * stride_init_states_hdim
+                    + offs_n[None, :] * stride_init_states_dstate
+                )
 
                 # need to adjust the boundary
                 if start_idx > pid_c * chunk_size:
-                    dA_cs_boundary = tl.load(dA_cumsum_ptr +
-                                             (start_idx - pid_c * chunk_size -
-                                              1) * stride_dA_cs_csize).to(
-                                                  tl.float32)
+                    dA_cs_boundary = tl.load(
+                        dA_cumsum_ptr
+                        + (start_idx - pid_c * chunk_size - 1) * stride_dA_cs_csize
+                    ).to(tl.float32)
 
-        past_states = tl.load(past_states_ptrs,
-                              mask=(offs_m[:, None] < hdim) &
-                              (offs_n[None, :] < dstate),
-                              other=0.0).to(tl.float32)
+        past_states = tl.load(
+            past_states_ptrs,
+            mask=(offs_m[:, None] < hdim) & (offs_n[None, :] < dstate),
+            other=0.0,
+        ).to(tl.float32)
 
         scale = tl.exp(dA_cs_last - dA_cs_boundary)
         acc += past_states * scale
@@ -517,36 +498,34 @@ def _chunk_state_varlen_kernel(
     states_ptr += pid_b * stride_states_batch + pid_h * stride_states_head
     offs_m = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M)
     offs_n = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
-    states_ptrs = states_ptr + (offs_m[:, None] * stride_states_hdim +
-                                offs_n[None, :] * stride_states_dstate)
+    states_ptrs = states_ptr + (
+        offs_m[:, None] * stride_states_hdim + offs_n[None, :] * stride_states_dstate
+    )
     c_mask = (offs_m[:, None] < hdim) & (offs_n[None, :] < dstate)
     tl.store(states_ptrs, states, mask=c_mask)
 
 
-def _chunk_cumsum_fwd(dt,
-                      A,
-                      chunk_size,
-                      cu_chunk_seqlens,
-                      dt_bias=None,
-                      dt_softplus=False,
-                      dt_limit=(0.0, float("inf"))):
+def _chunk_cumsum_fwd(
+    dt,
+    A,
+    chunk_size,
+    cu_chunk_seqlens,
+    dt_bias=None,
+    dt_softplus=False,
+    dt_limit=(0.0, float("inf")),
+):
     seqlen, nheads = dt.shape
-    assert A.shape == (nheads, )
+    assert A.shape == (nheads,)
     if dt_bias is not None:
-        assert dt_bias.shape == (nheads, )
+        assert dt_bias.shape == (nheads,)
     nchunks = cu_chunk_seqlens.shape[0] - 1
-    dt_out = torch.empty(nheads,
-                         nchunks,
-                         chunk_size,
-                         device=dt.device,
-                         dtype=torch.float32)
-    dA_cumsum = torch.empty(nheads,
-                            nchunks,
-                            chunk_size,
-                            device=dt.device,
-                            dtype=torch.float32)
-    grid_chunk_cs = lambda META: (nchunks,
-                                  triton.cdiv(nheads, META['BLOCK_SIZE_H']))
+    dt_out = torch.empty(
+        nheads, nchunks, chunk_size, device=dt.device, dtype=torch.float32
+    )
+    dA_cumsum = torch.empty(
+        nheads, nchunks, chunk_size, device=dt.device, dtype=torch.float32
+    )
+    grid_chunk_cs = lambda META: (nchunks, triton.cdiv(nheads, META["BLOCK_SIZE_H"]))
     with torch.cuda.device(dt.device.index):
         _chunk_cumsum_fwd_kernel[grid_chunk_cs](
             dt_ptr=dt,
@@ -563,8 +542,7 @@ def _chunk_cumsum_fwd(dt,
             stride_dt_seqlen=dt.stride(0),
             stride_dt_head=dt.stride(1),
             stride_A_head=A.stride(0),
-            stride_dt_bias_head=dt_bias.stride(0)
-            if dt_bias is not None else 0,
+            stride_dt_bias_head=dt_bias.stride(0) if dt_bias is not None else 0,
             stride_dt_out_head=dt_out.stride(0),
             stride_dt_out_chunk=dt_out.stride(1),
             stride_dt_out_csize=dt_out.stride(2),
@@ -578,13 +556,9 @@ def _chunk_cumsum_fwd(dt,
     return dA_cumsum, dt_out
 
 
-def _chunk_state_fwd(B,
-                     x,
-                     dt,
-                     dA_cumsum,
-                     cu_chunk_seqlens,
-                     states=None,
-                     states_in_fp32=True):
+def _chunk_state_fwd(
+    B, x, dt, dA_cumsum, cu_chunk_seqlens, states=None, states_in_fp32=True
+):
     seqlen, nheads, headdim = x.shape
     _, nchunks, chunk_size = dt.shape
     _, ngroups, dstate = B.shape
@@ -597,12 +571,16 @@ def _chunk_state_fwd(B,
         assert states.shape == (nchunks, nheads, headdim, dstate)
     else:
         states_dtype = torch.float32 if states_in_fp32 else B.dtype
-        states = torch.empty((nchunks, nheads, headdim, dstate),
-                             device=x.device,
-                             dtype=states_dtype)
+        states = torch.empty(
+            (nchunks, nheads, headdim, dstate), device=x.device, dtype=states_dtype
+        )
 
-    grid = lambda META: (triton.cdiv(headdim, META['BLOCK_SIZE_M']) * triton.
-                         cdiv(dstate, META['BLOCK_SIZE_N']), nchunks, nheads)
+    grid = lambda META: (
+        triton.cdiv(headdim, META["BLOCK_SIZE_M"])
+        * triton.cdiv(dstate, META["BLOCK_SIZE_N"]),
+        nchunks,
+        nheads,
+    )
     with torch.cuda.device(x.device.index):
         _chunk_state_fwd_kernel[grid](
             x_ptr=x,
@@ -636,13 +614,9 @@ def _chunk_state_fwd(B,
     return states
 
 
-def chunk_state_varlen(B,
-                       x,
-                       dt,
-                       dA_cumsum,
-                       cu_seqlens,
-                       chunk_states,
-                       initial_states=None):
+def chunk_state_varlen(
+    B, x, dt, dA_cumsum, cu_seqlens, chunk_states, initial_states=None
+):
     total_seqlen, nheads, headdim = x.shape
     _, nchunks, chunk_size = dt.shape
     _, ngroups, dstate = B.shape
@@ -657,21 +631,32 @@ def chunk_state_varlen(B,
     if initial_states is not None:
         assert initial_states.shape == (batch, nheads, headdim, dstate)
 
-    states = torch.empty(batch,
-                         nheads,
-                         headdim,
-                         dstate,
-                         dtype=chunk_states.dtype,
-                         device=chunk_states.device)
-
-    initial_states_strides = ((initial_states.stride(0),
-                               initial_states.stride(1),
-                               initial_states.stride(2),
-                               initial_states.stride(3))
-                              if initial_states is not None else (0, 0, 0, 0))
-
-    grid = lambda META: (triton.cdiv(headdim, META['BLOCK_SIZE_M']) * triton.
-                         cdiv(dstate, META['BLOCK_SIZE_N']), batch, nheads)
+    states = torch.empty(
+        batch,
+        nheads,
+        headdim,
+        dstate,
+        dtype=chunk_states.dtype,
+        device=chunk_states.device,
+    )
+
+    initial_states_strides = (
+        (
+            initial_states.stride(0),
+            initial_states.stride(1),
+            initial_states.stride(2),
+            initial_states.stride(3),
+        )
+        if initial_states is not None
+        else (0, 0, 0, 0)
+    )
+
+    grid = lambda META: (
+        triton.cdiv(headdim, META["BLOCK_SIZE_M"])
+        * triton.cdiv(dstate, META["BLOCK_SIZE_N"]),
+        batch,
+        nheads,
+    )
     with torch.cuda.device(x.device.index):
         _chunk_state_varlen_kernel[grid](
             x_ptr=x,
@@ -710,5 +695,6 @@ def chunk_state_varlen(B,
             stride_init_states_head=initial_states_strides[1],
             stride_init_states_hdim=initial_states_strides[2],
             stride_init_states_dstate=initial_states_strides[3],
-            HAS_INITSTATES=initial_states is not None)
+            HAS_INITSTATES=initial_states is not None,
+        )
     return states
diff --git a/vllm/model_executor/layers/mamba/ops/ssd_combined.py b/vllm/model_executor/layers/mamba/ops/ssd_combined.py
index e9e589115b8a..ac905ada7229 100644
--- a/vllm/model_executor/layers/mamba/ops/ssd_combined.py
+++ b/vllm/model_executor/layers/mamba/ops/ssd_combined.py
@@ -17,63 +17,66 @@
 from .ssd_chunk_state import _chunk_cumsum_fwd, _chunk_state_fwd
 from .ssd_state_passing import _state_passing_fwd
 
-TRITON_22 = version.parse(triton.__version__) >= version.parse('2.2.0')
+TRITON_22 = version.parse(triton.__version__) >= version.parse("2.2.0")
 
 
 def is_int_pow_2(n):
     return isinstance(n, int) and n > 0 and (n & (n - 1)) == 0
 
 
-def _mamba_chunk_scan_combined_fwd(x,
-                                   dt,
-                                   A,
-                                   B,
-                                   C,
-                                   chunk_size,
-                                   out,
-                                   D=None,
-                                   z=None,
-                                   dt_bias=None,
-                                   initial_states=None,
-                                   return_intermediate_states=False,
-                                   seq_idx=None,
-                                   cu_seqlens=None,
-                                   cu_chunk_seqlens=None,
-                                   last_chunk_indices=None,
-                                   dt_softplus=False,
-                                   dt_limit=(0.0, float("inf")),
-                                   state_dtype=None):
+def _mamba_chunk_scan_combined_fwd(
+    x,
+    dt,
+    A,
+    B,
+    C,
+    chunk_size,
+    out,
+    D=None,
+    z=None,
+    dt_bias=None,
+    initial_states=None,
+    return_intermediate_states=False,
+    seq_idx=None,
+    cu_seqlens=None,
+    cu_chunk_seqlens=None,
+    last_chunk_indices=None,
+    dt_softplus=False,
+    dt_limit=(0.0, float("inf")),
+    state_dtype=None,
+):
     assert is_int_pow_2(chunk_size), "chunk_size must be integer power of 2"
     seqlen, nheads, headdim = x.shape
     _, ngroups, dstate = B.shape
     assert nheads % ngroups == 0
     assert B.shape == (seqlen, ngroups, dstate)
     assert dt.shape == (seqlen, nheads)
-    assert A.shape == (nheads, )
+    assert A.shape == (nheads,)
     assert C.shape == B.shape
     if z is not None:
         assert z.shape == x.shape
     if D is not None:
-        assert D.shape == (nheads, headdim) or D.shape == (nheads, )
+        assert D.shape == (nheads, headdim) or D.shape == (nheads,)
     if seq_idx is not None:
-        assert seq_idx.shape == (cu_chunk_seqlens.shape[0] - 1, )
+        assert seq_idx.shape == (cu_chunk_seqlens.shape[0] - 1,)
     if B.stride(-1) != 1:
         B = B.contiguous()
     if C.stride(-1) != 1:
         C = C.contiguous()
-    if x.stride(-1) != 1 and x.stride(
-            0) != 1:  # Either M or K dimension should be contiguous
+    if (
+        x.stride(-1) != 1 and x.stride(0) != 1
+    ):  # Either M or K dimension should be contiguous
         x = x.contiguous()
-    if z is not None and z.stride(-1) != 1 and z.stride(
-            0) != 1:  # Either M or K dimension should be contiguous
+    if (
+        z is not None and z.stride(-1) != 1 and z.stride(0) != 1
+    ):  # Either M or K dimension should be contiguous
         z = z.contiguous()
     if D is not None and D.stride(-1) != 1:
         D = D.contiguous()
     assert cu_seqlens is not None, "Assuming varlen input - must supply cu_seqlens"
 
     if initial_states is not None:
-        assert initial_states.shape == (len(cu_seqlens) - 1, nheads, headdim,
-                                        dstate)
+        assert initial_states.shape == (len(cu_seqlens) - 1, nheads, headdim, dstate)
 
     # This function executes 5 sub-functions for computing mamba
     # - a good resource is the blog https://goombalab.github.io/blog/2024/mamba2-part3-algorithm/
@@ -86,22 +89,21 @@ def _mamba_chunk_scan_combined_fwd(x,
 
     # 1. Compute chunked cumsum of A * dt
     # - here dt may go through a softplus activation
-    dA_cumsum, dt = _chunk_cumsum_fwd(dt,
-                                      A,
-                                      chunk_size,
-                                      cu_chunk_seqlens,
-                                      dt_bias=dt_bias,
-                                      dt_softplus=dt_softplus,
-                                      dt_limit=dt_limit)
+    dA_cumsum, dt = _chunk_cumsum_fwd(
+        dt,
+        A,
+        chunk_size,
+        cu_chunk_seqlens,
+        dt_bias=dt_bias,
+        dt_softplus=dt_softplus,
+        dt_limit=dt_limit,
+    )
 
     # 2. Compute the state for each intra-chunk
     # (right term of low-rank factorization of off-diagonal blocks; B terms)
-    states = _chunk_state_fwd(B,
-                              x,
-                              dt,
-                              dA_cumsum,
-                              cu_chunk_seqlens,
-                              states_in_fp32=True)
+    states = _chunk_state_fwd(
+        B, x, dt, dA_cumsum, cu_chunk_seqlens, states_in_fp32=True
+    )
 
     # 3. Compute the inter-chunk SSM recurrence; produces correct SSM states at chunk boundaries
     # (middle term of factorization of off-diag blocks; A terms)
@@ -114,18 +116,15 @@ def _mamba_chunk_scan_combined_fwd(x,
         dA_cumsum,  # (nheads, nchunks, chunk_size)
         cu_chunk_seqlens,
         initial_states=rearrange(initial_states, "... p n -> ... (p n)")
-        if initial_states is not None else
-        None,  # (batch, nheads, headdim*dstate)
+        if initial_states is not None
+        else None,  # (batch, nheads, headdim*dstate)
         seq_idx=seq_idx,
-        out_dtype=state_dtype if state_dtype is not None else C.dtype)
+        out_dtype=state_dtype if state_dtype is not None else C.dtype,
+    )
     states = rearrange(states, "... (p n) -> ... p n", n=dstate)
 
     # 4. Compute batched matrix multiply for C_j^T B_i terms
-    CB = _bmm_chunk_fwd(C,
-                        B,
-                        chunk_size,
-                        cu_chunk_seqlens,
-                        output_dtype=torch.float32)
+    CB = _bmm_chunk_fwd(C, B, chunk_size, cu_chunk_seqlens, output_dtype=torch.float32)
 
     # 5. Scan and compute the diagonal blocks, taking into
     #    account past causal states.
@@ -225,6 +224,7 @@ def mamba_chunk_scan_combined_varlen(
         last_chunk_indices=last_chunk_indices,
         dt_softplus=dt_softplus,
         dt_limit=dt_limit,
-        state_dtype=state_dtype)
+        state_dtype=state_dtype,
+    )
 
     return varlen_states
diff --git a/vllm/model_executor/layers/mamba/ops/ssd_state_passing.py b/vllm/model_executor/layers/mamba/ops/ssd_state_passing.py
index f09af262cfc2..5481bab17e5a 100644
--- a/vllm/model_executor/layers/mamba/ops/ssd_state_passing.py
+++ b/vllm/model_executor/layers/mamba/ops/ssd_state_passing.py
@@ -13,14 +13,14 @@
 
 @triton.autotune(
     configs=[
-        triton.Config({'BLOCK_SIZE': 64}),
-        triton.Config({'BLOCK_SIZE': 128}),
-        triton.Config({'BLOCK_SIZE': 256}),
-        triton.Config({'BLOCK_SIZE': 512}),
-        triton.Config({'BLOCK_SIZE': 1024}),
-        triton.Config({'BLOCK_SIZE': 2048}),
+        triton.Config({"BLOCK_SIZE": 64}),
+        triton.Config({"BLOCK_SIZE": 128}),
+        triton.Config({"BLOCK_SIZE": 256}),
+        triton.Config({"BLOCK_SIZE": 512}),
+        triton.Config({"BLOCK_SIZE": 1024}),
+        triton.Config({"BLOCK_SIZE": 2048}),
     ],
-    key=['dim'],
+    key=["dim"],
 )
 @triton.jit
 def _state_passing_fwd_kernel(
@@ -58,8 +58,7 @@ def _state_passing_fwd_kernel(
     pid_m = tl.program_id(axis=0)
 
     states_ptr += pid_h * stride_states_head
-    dA_cs_ptr += pid_h * stride_dA_cs_head + (chunk_size -
-                                              1) * stride_dA_cs_csize
+    dA_cs_ptr += pid_h * stride_dA_cs_head + (chunk_size - 1) * stride_dA_cs_csize
     out_ptr += pid_h * stride_out_head
 
     offs_m = pid_m * BLOCK_SIZE + tl.arange(0, BLOCK_SIZE)
@@ -67,31 +66,35 @@ def _state_passing_fwd_kernel(
     out_ptrs = out_ptr + offs_m * stride_out_dim
 
     if HAS_INITSTATES:
-        initstates_ptrs = initstates_ptr \
-            + pid_h * stride_initstates_head \
+        initstates_ptrs = (
+            initstates_ptr
+            + pid_h * stride_initstates_head
             + offs_m * stride_initstates_dim
+        )
 
-        states = tl.load(initstates_ptrs, mask=offs_m < dim,
-                         other=0.0).to(tl.float32)
+        states = tl.load(initstates_ptrs, mask=offs_m < dim, other=0.0).to(tl.float32)
     else:
-        states = tl.zeros((BLOCK_SIZE, ), dtype=tl.float32)
+        states = tl.zeros((BLOCK_SIZE,), dtype=tl.float32)
 
     prev_seq_idx = 0
     for c in range(nchunks):
-        new_states = tl.load(states_ptrs, mask=offs_m < dim,
-                             other=0.0).to(tl.float32)
+        new_states = tl.load(states_ptrs, mask=offs_m < dim, other=0.0).to(tl.float32)
         dA_cs = tl.load(dA_cs_ptr).to(tl.float32)
         seq_idx = tl.load(seq_idx_ptr + c * stride_seq_idx_chunk)
         # we have started a new sequence
         if prev_seq_idx != seq_idx:
             if HAS_INITSTATES:
-                initstates_ptrs = initstates_ptr + seq_idx * stride_initstates_batch \
-                    + pid_h * stride_initstates_head \
+                initstates_ptrs = (
+                    initstates_ptr
+                    + seq_idx * stride_initstates_batch
+                    + pid_h * stride_initstates_head
                     + offs_m * stride_initstates_dim
-                states = tl.load(initstates_ptrs, mask=offs_m < dim,
-                                 other=0.0).to(tl.float32)
+                )
+                states = tl.load(initstates_ptrs, mask=offs_m < dim, other=0.0).to(
+                    tl.float32
+                )
             else:
-                states = tl.zeros((BLOCK_SIZE, ), dtype=tl.float32)
+                states = tl.zeros((BLOCK_SIZE,), dtype=tl.float32)
 
         prev_seq_idx = seq_idx
         states = tl.exp(dA_cs) * states + new_states
@@ -115,16 +118,15 @@ def _state_passing_fwd(
     assert dA_cumsum.shape == (nheads, nchunks, chunk_size)
     seqlen = seq_idx.shape[-1]
     out_dtype = states.dtype if out_dtype is None else out_dtype
-    out = torch.empty((nchunks, nheads, dim),
-                      device=states.device,
-                      dtype=out_dtype)
+    out = torch.empty((nchunks, nheads, dim), device=states.device, dtype=out_dtype)
 
-    initial_states_strides = ((initial_states.stride(0),
-                               initial_states.stride(1),
-                               initial_states.stride(2))
-                              if initial_states is not None else (0, 0, 0))
+    initial_states_strides = (
+        (initial_states.stride(0), initial_states.stride(1), initial_states.stride(2))
+        if initial_states is not None
+        else (0, 0, 0)
+    )
 
-    grid = lambda META: (triton.cdiv(dim, META['BLOCK_SIZE']), nheads)
+    grid = lambda META: (triton.cdiv(dim, META["BLOCK_SIZE"]), nheads)
     with torch.cuda.device(states.device.index):
         _state_passing_fwd_kernel[grid](
             states_ptr=states,
diff --git a/vllm/model_executor/layers/mamba/short_conv.py b/vllm/model_executor/layers/mamba/short_conv.py
index eb4223ade5f0..32273d137eca 100644
--- a/vllm/model_executor/layers/mamba/short_conv.py
+++ b/vllm/model_executor/layers/mamba/short_conv.py
@@ -13,29 +13,35 @@
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.forward_context import ForwardContext, get_forward_context
 from vllm.model_executor.custom_op import CustomOp
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.mamba.abstract import MambaBase
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.mamba.ops.causal_conv1d import (
-    causal_conv1d_fn, causal_conv1d_update)
+    causal_conv1d_fn,
+    causal_conv1d_update,
+)
 from vllm.utils import direct_register_custom_op
-from vllm.v1.attention.backends.short_conv_attn import (
-    ShortConvAttentionMetadata)
+from vllm.v1.attention.backends.short_conv_attn import ShortConvAttentionMetadata
 
 
 @CustomOp.register("short_conv")
 class ShortConv(MambaBase, CustomOp):
-
-    def __init__(self,
-                 config,
-                 dim: int,
-                 layer_idx: int,
-                 model_config: Optional[ModelConfig] = None,
-                 cache_config: Optional[CacheConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config,
+        dim: int,
+        layer_idx: int,
+        model_config: Optional[ModelConfig] = None,
+        cache_config: Optional[CacheConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.config = config
         self.layer_idx = layer_idx
@@ -72,7 +78,7 @@ def __init__(self,
         if prefix in compilation_config.static_forward_context:
             raise ValueError(f"Duplicate layer name: {prefix}")
         compilation_config.static_forward_context[prefix] = self
-        self.kv_cache = (torch.tensor([]), )
+        self.kv_cache = (torch.tensor([]),)
 
         self.model_config = model_config
         self.cache_config = cache_config
@@ -121,8 +127,9 @@ def forward_cuda(
 
         B, C, x = BCx.chunk(3, dim=-1)
 
-        conv_weights = self.conv.weight.view(self.conv.weight.size(0),
-                                             self.conv.weight.size(2))
+        conv_weights = self.conv.weight.view(
+            self.conv.weight.size(0), self.conv.weight.size(2)
+        )
 
         if attn_metadata is None:
             # V1 profile run
@@ -163,23 +170,26 @@ def forward_cuda(
             dim=0,
         )
         query_start_loc_p = (
-            attn_metadata.query_start_loc[-num_prefills - 1:] -
-            num_decodes if has_prefill else None)
+            attn_metadata.query_start_loc[-num_prefills - 1 :] - num_decodes
+            if has_prefill
+            else None
+        )
 
         conv_output_list = []
 
         if has_prefill:
             Bx_p = (B_p * x_p).transpose(0, 1)
-            Bx = causal_conv1d_fn(Bx_p,
-                                  conv_weights,
-                                  self.conv.bias,
-                                  activation=None,
-                                  conv_states=conv_state,
-                                  has_initial_state=has_initial_states_p,
-                                  cache_indices=state_indices_tensor_p,
-                                  metadata=attn_metadata,
-                                  query_start_loc=query_start_loc_p).transpose(
-                                      0, 1)[:num_prefill_tokens]
+            Bx = causal_conv1d_fn(
+                Bx_p,
+                conv_weights,
+                self.conv.bias,
+                activation=None,
+                conv_states=conv_state,
+                has_initial_state=has_initial_states_p,
+                cache_indices=state_indices_tensor_p,
+                metadata=attn_metadata,
+                query_start_loc=query_start_loc_p,
+            ).transpose(0, 1)[:num_prefill_tokens]
 
             y = C_p * Bx
             conv_output_list.append(y)
@@ -192,7 +202,8 @@ def forward_cuda(
                 conv_weights,
                 self.conv.bias,
                 activation=None,
-                conv_state_indices=state_indices_tensor_d)
+                conv_state_indices=state_indices_tensor_d,
+            )
             y = C_d * Bx
             conv_output_list.insert(0, y)
 
@@ -222,8 +233,8 @@ def mamba_type(self) -> str:
         return "short_conv"
 
     def get_attn_backend(self) -> type["AttentionBackend"]:
-        from vllm.v1.attention.backends.short_conv_attn import (
-            ShortConvAttentionBackend)
+        from vllm.v1.attention.backends.short_conv_attn import ShortConvAttentionBackend
+
         return ShortConvAttentionBackend
 
 
diff --git a/vllm/model_executor/layers/mla.py b/vllm/model_executor/layers/mla.py
index 66bf3823e191..b8e99226d13e 100644
--- a/vllm/model_executor/layers/mla.py
+++ b/vllm/model_executor/layers/mla.py
@@ -13,8 +13,8 @@
 
 @dataclass
 class MLAModules:
-    """Modules used in MLA.
-    """
+    """Modules used in MLA."""
+
     kv_a_layernorm: torch.nn.Module
     kv_b_proj: torch.nn.Module
     rotary_emb: torch.nn.Module
@@ -36,7 +36,7 @@ class MultiHeadLatentAttention(CustomOp):
     because there is only one in-tree implementation in forward_native.
     TODO: implement this with a new PluggableLayer mechanism.
 
-    This class takes positions and hidden_states as input. 
+    This class takes positions and hidden_states as input.
     The input tensors can either contain prefill tokens or decode tokens.
     The class does the following:
 
@@ -125,12 +125,15 @@ def forward_native(
         kv_lora = None
 
         if self.q_lora_rank is not None:
-            assert self.fused_qkv_a_proj is not None, \
+            assert self.fused_qkv_a_proj is not None, (
                 "fused_qkv_a_proj is required when q_lora_rank is not None"
-            assert self.q_a_layernorm is not None, \
+            )
+            assert self.q_a_layernorm is not None, (
                 "q_a_layernorm is required when q_lora_rank is not None"
-            assert self.q_b_proj is not None, \
+            )
+            assert self.q_b_proj is not None, (
                 "q_b_proj is required when q_lora_rank is not None"
+            )
             qkv_lora = self.fused_qkv_a_proj(hidden_states)[0]
             q_c, kv_lora = qkv_lora.split(
                 [self.q_lora_rank, self.kv_lora_rank + self.qk_rope_head_dim],
@@ -139,34 +142,35 @@ def forward_native(
             q_c = self.q_a_layernorm(q_c)
             q = self.q_b_proj(q_c)[0]
         else:
-            assert self.kv_a_proj_with_mqa is not None, \
+            assert self.kv_a_proj_with_mqa is not None, (
                 "kv_a_proj_with_mqa is required when q_lora_rank is None"
-            assert self.q_proj is not None, \
+            )
+            assert self.q_proj is not None, (
                 "q_proj is required when q_lora_rank is None"
+            )
             kv_lora = self.kv_a_proj_with_mqa(hidden_states)[0]
             q = self.q_proj(hidden_states)[0]
 
-        kv_c, k_pe = kv_lora.split([self.kv_lora_rank, self.qk_rope_head_dim],
-                                   dim=-1)
+        kv_c, k_pe = kv_lora.split([self.kv_lora_rank, self.qk_rope_head_dim], dim=-1)
         kv_c_normed = self.kv_a_layernorm(kv_c)
 
         q = q.view(-1, self.num_heads, self.qk_head_dim)
         # Add head dim of 1 to k_pe
         k_pe = k_pe.unsqueeze(1)
 
-        q[..., self.qk_nope_head_dim:], k_pe = self.rotary_emb(
-            positions, q[..., self.qk_nope_head_dim:], k_pe)
+        q[..., self.qk_nope_head_dim :], k_pe = self.rotary_emb(
+            positions, q[..., self.qk_nope_head_dim :], k_pe
+        )
 
         if self.indexer and self.is_sparse:
-            _topk_indices = self.indexer(hidden_states, q_c, positions,
-                                         self.rotary_emb)
+            _topk_indices = self.indexer(hidden_states, q_c, positions, self.rotary_emb)
 
         attn_out = self.mla_attn(
             q,
             kv_c_normed,
             k_pe,
-            output_shape=(hidden_states.shape[0],
-                          self.num_heads * self.v_head_dim))
+            output_shape=(hidden_states.shape[0], self.num_heads * self.v_head_dim),
+        )
         return self.o_proj(attn_out)[0]
 
     def forward_cuda(self, *args, **kwargs):
diff --git a/vllm/model_executor/layers/pooler.py b/vllm/model_executor/layers/pooler.py
index 139011ce10be..979939ebc468 100644
--- a/vllm/model_executor/layers/pooler.py
+++ b/vllm/model_executor/layers/pooler.py
@@ -25,12 +25,14 @@
 
 PoolingFn = Callable[
     [Union[torch.Tensor, list[torch.Tensor]], PoolingMetadata],
-    Union[torch.Tensor, list[torch.Tensor]]]
+    Union[torch.Tensor, list[torch.Tensor]],
+]
 ClassifierFn = Callable[[torch.Tensor], torch.Tensor]
 
 
 class PoolingType(IntEnum):
     """Enumeration for different types of pooling methods."""
+
     LAST = 0
     ALL = 1
     CLS = 2
@@ -50,8 +52,7 @@ def from_config(
         pooler_config: PoolerConfig,
     ) -> "ResolvedPoolingConfig":
         assert pooler_config.pooling_type is not None
-        return cls(task=task,
-                   pooling_type=PoolingType[pooler_config.pooling_type])
+        return cls(task=task, pooling_type=PoolingType[pooler_config.pooling_type])
 
 
 @dataclass(frozen=True)
@@ -71,8 +72,9 @@ def for_encode(pooler_config: PoolerConfig):
         if pooler_config.pooling_type == "STEP":
             return StepPooler()
 
-        resolved_config = ResolvedPoolingConfig(task="encode",
-                                                pooling_type=PoolingType.ALL)
+        resolved_config = ResolvedPoolingConfig(
+            task="encode", pooling_type=PoolingType.ALL
+        )
 
         return SimplePooler.from_config(resolved_config)
 
@@ -129,10 +131,10 @@ def get_prompt_lens(
     return pooling_metadata.prompt_lens
 
 
-def get_prompt_token_ids(
-        pooling_metadata: PoolingMetadata) -> list[torch.Tensor]:
+def get_prompt_token_ids(pooling_metadata: PoolingMetadata) -> list[torch.Tensor]:
     assert pooling_metadata.prompt_token_ids is not None, (
-        "Please set `requires_token_ids=True` in `get_pooling_updates`")
+        "Please set `requires_token_ids=True` in `get_pooling_updates`"
+    )
 
     return [
         pooling_metadata.prompt_token_ids[i, :num]
@@ -140,8 +142,7 @@ def get_prompt_token_ids(
     ]
 
 
-def get_pooling_params(
-        pooling_metadata: PoolingMetadata) -> list[PoolingParams]:
+def get_pooling_params(pooling_metadata: PoolingMetadata) -> list[PoolingParams]:
     pooling_params = pooling_metadata.pooling_params
     return pooling_params
 
@@ -150,7 +151,8 @@ def get_tasks(pooling_metadata: PoolingMetadata) -> list[PoolingTask]:
     pooling_params = get_pooling_params(pooling_metadata)
 
     tasks: list[PoolingTask] = [
-        task for pooling_param in pooling_params
+        task
+        for pooling_param in pooling_params
         if (task := pooling_param.task) is not None
     ]
     assert len(pooling_params) == len(tasks)
@@ -173,17 +175,22 @@ def get_classification_activation_function(config: PretrainedConfig):
 
 def get_cross_encoder_activation_function(config: PretrainedConfig):
     function_name: Optional[str] = None
-    if (hasattr(config, "sentence_transformers")
-            and "activation_fn" in config.sentence_transformers):
+    if (
+        hasattr(config, "sentence_transformers")
+        and "activation_fn" in config.sentence_transformers
+    ):
         function_name = config.sentence_transformers["activation_fn"]
-    elif (hasattr(config, "sbert_ce_default_activation_function")
-          and config.sbert_ce_default_activation_function is not None):
+    elif (
+        hasattr(config, "sbert_ce_default_activation_function")
+        and config.sbert_ce_default_activation_function is not None
+    ):
         function_name = config.sbert_ce_default_activation_function
 
     if function_name is not None:
         assert function_name.startswith("torch.nn.modules."), (
             "Loading of activation functions is restricted to "
-            "torch.nn.modules for security reasons")
+            "torch.nn.modules for security reasons"
+        )
         fn = resolve_obj_by_qualname(function_name)()
         return PoolerActivation.wraps(fn)
 
@@ -191,7 +198,6 @@ def get_cross_encoder_activation_function(config: PretrainedConfig):
 
 
 class PoolingMethod(nn.Module, ABC):
-
     @staticmethod
     def from_pooling_type(pooling_type: PoolingType) -> "PoolingMethod":
         if pooling_type == PoolingType.LAST:
@@ -230,7 +236,6 @@ def forward(
 
 
 class CLSPool(PoolingMethod):
-
     def get_supported_tasks(self) -> Set[PoolingTask]:
         return {"encode", "embed", "classify", "score"}
 
@@ -239,14 +244,14 @@ def forward_all(
         hidden_states: torch.Tensor,
         pooling_cursor: PoolingCursor,
     ) -> Union[list[torch.Tensor], torch.Tensor]:
-        assert not pooling_cursor.is_partial_prefill(), \
+        assert not pooling_cursor.is_partial_prefill(), (
             "partial prefill not supported with CLS pooling"
+        )
 
         return hidden_states[pooling_cursor.first_token_indices_gpu]
 
 
 class LastPool(PoolingMethod):
-
     def get_supported_tasks(self) -> Set[PoolingTask]:
         return {"encode", "embed", "classify", "score"}
 
@@ -259,7 +264,6 @@ def forward_all(
 
 
 class AllPool(PoolingMethod):
-
     def get_supported_tasks(self) -> Set[PoolingTask]:
         return {"encode"}
 
@@ -268,18 +272,17 @@ def forward_all(
         hidden_states: torch.Tensor,
         pooling_cursor: PoolingCursor,
     ) -> Union[list[torch.Tensor], torch.Tensor]:
-
-        assert not pooling_cursor.is_partial_prefill(), \
+        assert not pooling_cursor.is_partial_prefill(), (
             "partial prefill not supported with ALL pooling"
+        )
 
         hidden_states_lst = list(
-            hidden_states.split(
-                pooling_cursor.num_scheduled_tokens_cpu.tolist()))
+            hidden_states.split(pooling_cursor.num_scheduled_tokens_cpu.tolist())
+        )
         return [hidden_states_lst[i] for i in pooling_cursor.index]
 
 
 class MeanPool(PoolingMethod):
-
     def get_supported_tasks(self) -> Set[PoolingTask]:
         return {"encode", "embed", "classify", "score"}
 
@@ -288,12 +291,13 @@ def forward_all(
         hidden_states: torch.Tensor,
         pooling_cursor: PoolingCursor,
     ) -> Union[list[torch.Tensor], torch.Tensor]:
-
-        assert not pooling_cursor.is_partial_prefill(), \
+        assert not pooling_cursor.is_partial_prefill(), (
             "partial prefill not supported with MEAN pooling"
+        )
 
-        prompt_lens = pooling_cursor.prompt_lens_cpu.to(hidden_states.device,
-                                                        non_blocking=True)
+        prompt_lens = pooling_cursor.prompt_lens_cpu.to(
+            hidden_states.device, non_blocking=True
+        )
 
         # Use float32 for torch.cumsum in MeanPool,
         # otherwise precision will be lost significantly.
@@ -301,15 +305,15 @@ def forward_all(
 
         start_indices = pooling_cursor.first_token_indices_gpu
         end_indices = pooling_cursor.last_token_indices_gpu
-        return (cumsum[end_indices] - cumsum[start_indices] +
-                hidden_states[start_indices]) / prompt_lens.unsqueeze(1)
+        return (
+            cumsum[end_indices] - cumsum[start_indices] + hidden_states[start_indices]
+        ) / prompt_lens.unsqueeze(1)
 
 
 _T = TypeVar("_T", torch.Tensor, list[torch.Tensor])
 
 
 class BasePoolerActivation(nn.Module, ABC):
-
     @abstractmethod
     def forward(self, pooled_data: _T) -> _T:
         # shape:
@@ -320,7 +324,6 @@ def forward(self, pooled_data: _T) -> _T:
 
 
 class PoolerActivation(BasePoolerActivation):
-
     @staticmethod
     def wraps(module: nn.Module):
         if isinstance(module, nn.Identity):
@@ -342,42 +345,42 @@ def forward(self, pooled_data: _T) -> _T:
 
 
 class PoolerIdentity(PoolerActivation):
-
     def forward_chunk(self, pooled_data: torch.Tensor) -> torch.Tensor:
         return pooled_data
 
 
 class PoolerNormalize(PoolerActivation):
-
     def forward_chunk(self, pooled_data: torch.Tensor) -> torch.Tensor:
         return F.normalize(pooled_data, p=2, dim=-1)
 
 
 class PoolerMultiLabelClassify(PoolerActivation):
-
     def forward_chunk(self, pooled_data: torch.Tensor) -> torch.Tensor:
         return F.sigmoid(pooled_data)
 
 
 class PoolerClassify(PoolerActivation):
-
     def __init__(self, *, static_num_labels: bool = True) -> None:
         super().__init__()
 
         if static_num_labels:
             vllm_config = get_current_vllm_config()
-            self.num_labels = getattr(vllm_config.model_config.hf_config,
-                                      "num_labels", 0)
+            self.num_labels = getattr(
+                vllm_config.model_config.hf_config, "num_labels", 0
+            )
             if self.num_labels == 0:
-                logger.warning("num_labels should be > 0 for classification"
-                               "models, falling back to softmax. "
-                               "Please check if the configuration is correct.")
+                logger.warning(
+                    "num_labels should be > 0 for classification"
+                    "models, falling back to softmax. "
+                    "Please check if the configuration is correct."
+                )
         else:
             self.num_labels = None
 
     def forward_chunk(self, pooled_data: torch.Tensor) -> torch.Tensor:
-        num_labels = (self.num_labels if self.num_labels is not None else
-                      pooled_data.shape[-1])
+        num_labels = (
+            self.num_labels if self.num_labels is not None else pooled_data.shape[-1]
+        )
 
         if num_labels < 2:
             return F.sigmoid(pooled_data)
@@ -386,7 +389,6 @@ def forward_chunk(self, pooled_data: torch.Tensor) -> torch.Tensor:
 
 
 class LambdaPoolerActivation(PoolerActivation):
-
     def __init__(self, fn: Callable[[torch.Tensor], torch.Tensor]):
         super().__init__()
 
@@ -397,32 +399,35 @@ def forward_chunk(self, pooled_data: torch.Tensor) -> torch.Tensor:
 
 
 class PoolerHead(nn.Module):
-
     def __init__(self, activation: PoolerActivation) -> None:
         super().__init__()
         self.activation = activation
 
-    def forward(self, pooled_data: Union[list[torch.Tensor], torch.Tensor],
-                pooling_metadata: PoolingMetadata):
-
+    def forward(
+        self,
+        pooled_data: Union[list[torch.Tensor], torch.Tensor],
+        pooling_metadata: PoolingMetadata,
+    ):
         return self.activation(pooled_data)
 
 
 class EmbeddingPoolerHead(PoolerHead):
-
     def __init__(self) -> None:
         super().__init__(activation=PoolerNormalize())
 
         # Load ST projector if available
 
         vllm_config = get_current_vllm_config()
-        self.projector: Optional[nn.Module] = _load_st_projector(
-            vllm_config.model_config) if vllm_config else None
+        self.projector: Optional[nn.Module] = (
+            _load_st_projector(vllm_config.model_config) if vllm_config else None
+        )
         self.head_dtype = vllm_config.model_config.head_dtype
 
-    def forward(self, pooled_data: Union[list[torch.Tensor], torch.Tensor],
-                pooling_metadata: PoolingMetadata):
-
+    def forward(
+        self,
+        pooled_data: Union[list[torch.Tensor], torch.Tensor],
+        pooling_metadata: PoolingMetadata,
+    ):
         if isinstance(pooled_data, list):
             pooled_data = torch.stack(pooled_data)
         # pooled_data shape: [batchsize, hidden_dimension]
@@ -437,14 +442,11 @@ def forward(self, pooled_data: Union[list[torch.Tensor], torch.Tensor],
         pooling_params = get_pooling_params(pooling_metadata)
 
         # for matryoshka representation
-        dimensions_list = [
-            pooling_param.dimensions for pooling_param in pooling_params
-        ]
+        dimensions_list = [pooling_param.dimensions for pooling_param in pooling_params]
         if any(d is not None for d in dimensions_list):
             # change the output dimension
             assert len(pooled_data) == len(dimensions_list)
-            if len(set(dimensions_list)) == 1 and not isinstance(
-                    pooled_data, list):
+            if len(set(dimensions_list)) == 1 and not isinstance(pooled_data, list):
                 # if all dimensions are the same
                 d = dimensions_list[0]
                 pooled_data = pooled_data[..., :d]
@@ -470,16 +472,17 @@ def forward(self, pooled_data: Union[list[torch.Tensor], torch.Tensor],
 
 
 class RewardPoolerHead(PoolerHead):
-
     def __init__(self) -> None:
         super().__init__(activation=PoolerClassify(static_num_labels=False))
 
         vllm_config = get_current_vllm_config()
         self.head_dtype = vllm_config.model_config.head_dtype
 
-    def forward(self, pooled_data: Union[list[torch.Tensor], torch.Tensor],
-                pooling_metadata: PoolingMetadata):
-
+    def forward(
+        self,
+        pooled_data: Union[list[torch.Tensor], torch.Tensor],
+        pooling_metadata: PoolingMetadata,
+    ):
         if isinstance(pooled_data, list):
             pooled_data = [p.to(self.head_dtype) for p in pooled_data]
         else:
@@ -547,8 +550,9 @@ def forward(
 
 
 class StepPooler(Pooler):
-
-    def __init__(self, ) -> None:
+    def __init__(
+        self,
+    ) -> None:
         super().__init__()
 
         self.pooling = AllPool()
@@ -566,9 +570,9 @@ def extract_states(
 
         pooling_params = get_pooling_params(pooling_metadata)
 
-        for data, token_id, pooling_param in zip(pooled_data_lst,
-                                                 prompt_token_ids,
-                                                 pooling_params):
+        for data, token_id, pooling_param in zip(
+            pooled_data_lst, prompt_token_ids, pooling_params
+        ):
             step_tag_id = pooling_param.step_tag_id
             returned_token_ids = pooling_param.returned_token_ids
 
@@ -627,8 +631,9 @@ def __init__(
         self.pooling = pooling
         self.classifier = classifier
         self.act_fn = act_fn or PoolerClassify()
-        self.logit_bias: Optional[
-            float] = vllm_config.model_config.pooler_config.logit_bias
+        self.logit_bias: Optional[float] = (
+            vllm_config.model_config.pooler_config.logit_bias
+        )
         self.head_dtype = vllm_config.model_config.head_dtype
 
     def get_supported_tasks(self) -> Set[PoolingTask]:
@@ -660,8 +665,7 @@ def forward(
             scores = self.act_fn(pooled_data) if flags[0] else pooled_data
         else:
             scores = [
-                self.act_fn(vecs) if f else vecs
-                for vecs, f in zip(pooled_data, flags)
+                self.act_fn(vecs) if f else vecs for vecs, f in zip(pooled_data, flags)
             ]
 
         # scores shape: [batchsize, num_labels]
@@ -678,7 +682,8 @@ def __init__(self, poolers_by_task: Mapping[PoolingTask, Pooler]) -> None:
             if task not in pooler.get_supported_tasks():
                 raise ValueError(
                     f"{pooler=} does not support {task=}. "
-                    f"Supported tasks: {pooler.get_supported_tasks()}")
+                    f"Supported tasks: {pooler.get_supported_tasks()}"
+                )
 
         self.poolers_by_task = poolers_by_task
 
@@ -701,12 +706,13 @@ def forward(
             if not (pooler := poolers_by_task.get(task)):
                 raise ValueError(
                     f"Unsupported task: {task} "
-                    f"Supported tasks: {self.get_supported_tasks()}")
+                    f"Supported tasks: {self.get_supported_tasks()}"
+                )
 
             num_items = len(list(group))
             group_output: PoolerOutput = pooler(
                 hidden_states,
-                pooling_metadata[offset:offset + num_items],
+                pooling_metadata[offset : offset + num_items],
             )
 
             outputs.extend(group_output)
diff --git a/vllm/model_executor/layers/quantization/__init__.py b/vllm/model_executor/layers/quantization/__init__.py
index 8cac47b5a39a..f43d38cba878 100644
--- a/vllm/model_executor/layers/quantization/__init__.py
+++ b/vllm/model_executor/layers/quantization/__init__.py
@@ -3,8 +3,7 @@
 
 from typing import Literal, get_args
 
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization.base_config import QuantizationConfig
 
 QuantizationMethods = Literal[
     "awq",
@@ -52,9 +51,13 @@ def register_quantization_config(quantization: str):
         quantization (str): The quantization method name.
 
     Examples:
-        >>> from vllm.model_executor.layers.quantization import register_quantization_config
+        >>> from vllm.model_executor.layers.quantization import (
+        ...     register_quantization_config,
+        ... )
         >>> from vllm.model_executor.layers.quantization import get_quantization_config
-        >>> from vllm.model_executor.layers.quantization.base_config import QuantizationConfig
+        >>> from vllm.model_executor.layers.quantization.base_config import (
+        ...     QuantizationConfig,
+        ... )
         >>>
         >>> @register_quantization_config("my_quant")
         ... class MyQuantConfig(QuantizationConfig):
@@ -67,10 +70,12 @@ def register_quantization_config(quantization: str):
     def _wrapper(quant_config_cls):
         if quantization in QUANTIZATION_METHODS:
             raise ValueError(
-                f"The quantization method `{quantization}` is already exists.")
+                f"The quantization method `{quantization}` is already exists."
+            )
         if not issubclass(quant_config_cls, QuantizationConfig):
-            raise ValueError("The quantization config must be a subclass of "
-                             "`QuantizationConfig`.")
+            raise ValueError(
+                "The quantization config must be a subclass of `QuantizationConfig`."
+            )
         _CUSTOMIZED_METHOD_TO_QUANT_CONFIG[quantization] = quant_config_cls
         QUANTIZATION_METHODS.append(quantization)
         return quant_config_cls
@@ -91,7 +96,8 @@ def get_quantization_config(quantization: str) -> type[QuantizationConfig]:
     from .bitblas import BitBLASConfig
     from .bitsandbytes import BitsAndBytesConfig
     from .compressed_tensors.compressed_tensors import (  # noqa: E501
-        CompressedTensorsConfig)
+        CompressedTensorsConfig,
+    )
     from .deepspeedfp import DeepSpeedFPConfig
     from .experts_int8 import ExpertsInt8Config
     from .fbgemm_fp8 import FBGEMMFp8Config
diff --git a/vllm/model_executor/layers/quantization/auto_round.py b/vllm/model_executor/layers/quantization/auto_round.py
index eb7600af3371..b7ebc6f272db 100644
--- a/vllm/model_executor/layers/quantization/auto_round.py
+++ b/vllm/model_executor/layers/quantization/auto_round.py
@@ -7,10 +7,11 @@
 import torch
 
 from vllm.logger import init_logger
-from vllm.model_executor.layers.linear import (LinearBase,
-                                               UnquantizedLinearMethod)
-from vllm.model_executor.layers.quantization import (QuantizationConfig,
-                                                     QuantizationMethods)
+from vllm.model_executor.layers.linear import LinearBase, UnquantizedLinearMethod
+from vllm.model_executor.layers.quantization import (
+    QuantizationConfig,
+    QuantizationMethods,
+)
 from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
 from vllm.platforms import current_platform
 from vllm.scalar_type import scalar_types
@@ -52,36 +53,45 @@ def __init__(
     ) -> None:
         super().__init__()
         if weight_bits not in self.SUPPORTED_BITS:
-            raise ValueError(f"Unsupported weight_bits: {weight_bits}, "
-                             f"currently only support  {self.SUPPORTED_BITS}")
+            raise ValueError(
+                f"Unsupported weight_bits: {weight_bits}, "
+                f"currently only support  {self.SUPPORTED_BITS}"
+            )
         if data_type not in self.SUPPORTED_DTYPES:
             raise ValueError(
                 f"Unsupported data_type: {data_type},"
-                f" currently only support  {self.SUPPORTED_DTYPES}")
+                f" currently only support  {self.SUPPORTED_DTYPES}"
+            )
         if packing_format not in self.SUPPORTED_FORMATS:
             raise ValueError(
                 f"Unsupported packing_format: {packing_format}, "
-                f"currently only support  {self.SUPPORTED_FORMATS}")
+                f"currently only support  {self.SUPPORTED_FORMATS}"
+            )
         if backend not in self.SUPPORTED_BACKENDS:
             raise ValueError(
                 f"Unsupported backend: {backend},  "
-                f"currently only support  {self.SUPPORTED_BACKENDS}")
+                f"currently only support  {self.SUPPORTED_BACKENDS}"
+            )
 
         self.weight_bits = weight_bits
         self.group_size = group_size
         self.sym = sym
         self.packing_format = packing_format
-        self.block_name_to_quantize = (block_name_to_quantize.split(",") if
-                                       isinstance(block_name_to_quantize, str)
-                                       else block_name_to_quantize)
+        self.block_name_to_quantize = (
+            block_name_to_quantize.split(",")
+            if isinstance(block_name_to_quantize, str)
+            else block_name_to_quantize
+        )
         self.extra_config = extra_config
         self.data_type = data_type
         self.backend = backend
         self.pack_factor = Fraction(32, weight_bits)
 
     def __repr__(self) -> str:
-        return (f"AutoRoundConfig(weight_bits={self.weight_bits}, "
-                f"group_size={self.group_size}, sym={self.sym})")
+        return (
+            f"AutoRoundConfig(weight_bits={self.weight_bits}, "
+            f"group_size={self.group_size}, sym={self.sym})"
+        )
 
     @classmethod
     def get_name(cls) -> QuantizationMethods:
@@ -105,19 +115,18 @@ def from_config(cls, config: dict[str, Any]) -> "AutoRoundConfig":
             weight_bits=cls.get_from_keys(config, ["bits"]),
             group_size=cls.get_from_keys(config, ["group_size"]),
             sym=cls.get_from_keys(config, ["sym"]),
-            packing_format=cls.get_from_keys_or(config, ["packing_format"],
-                                                "auto_round:auto_gptq"),
+            packing_format=cls.get_from_keys_or(
+                config, ["packing_format"], "auto_round:auto_gptq"
+            ),
             block_name_to_quantize=cls.get_from_keys_or(
-                config, ["block_name_to_quantize", "to_quant_block_names"],
-                None),
+                config, ["block_name_to_quantize", "to_quant_block_names"], None
+            ),
             extra_config=cls.get_from_keys_or(config, ["extra_config"], None),
             data_type=cls.get_from_keys_or(config, ["data_type"], "int"),
-            backend=cls.get_from_keys_or(config, ["backend", "vllm_backend"],
-                                         "auto"),
+            backend=cls.get_from_keys_or(config, ["backend", "vllm_backend"], "auto"),
         )
 
     def get_layer_config(self, layer, layer_name: str):
-
         def get_config(name: str, quantized: bool = True):
             cfg = self.extra_config.get(name, {}) if self.extra_config else {}
             return (
@@ -134,39 +143,38 @@ def get_config(name: str, quantized: bool = True):
         quantized = not isinstance(layer, ParallelLMHead)
         if self.block_name_to_quantize:
             quantized = any(
-                layer_name.startswith(name)
-                for name in self.block_name_to_quantize)
+                layer_name.startswith(name) for name in self.block_name_to_quantize
+            )
 
         # 3. Handle fused MoE
-        if self.extra_config and "fusedmoe" in layer.__class__.__name__.lower(
-        ):
+        if self.extra_config and "fusedmoe" in layer.__class__.__name__.lower():
             moe_configs = [
-                get_config(name, quantized) for name in self.extra_config
+                get_config(name, quantized)
+                for name in self.extra_config
                 if name.startswith(layer_name)
             ]
             if moe_configs:
                 if len(set(moe_configs)) == 1:
                     return moe_configs[0]
-                raise ValueError(f"Fused MoE layer '{layer_name}' requires "
-                                 f"consistent quant config for all sub-layers")
+                raise ValueError(
+                    f"Fused MoE layer '{layer_name}' requires "
+                    f"consistent quant config for all sub-layers"
+                )
 
         # 4. Handle fused QKV or other patterns
         if self.extra_config:
             for fusion_key, sub_keys in self.packed_modules_mapping.items():
-                if fusion_key in layer_name and layer_name.count(
-                        fusion_key) == 1:
+                if fusion_key in layer_name and layer_name.count(fusion_key) == 1:
                     sub_names = [
-                        layer_name.replace(fusion_key, sub_key)
-                        for sub_key in sub_keys
-                    ]
-                    sub_configs = [
-                        get_config(name, quantized) for name in sub_names
+                        layer_name.replace(fusion_key, sub_key) for sub_key in sub_keys
                     ]
+                    sub_configs = [get_config(name, quantized) for name in sub_names]
                     if len(set(sub_configs)) == 1:
                         return sub_configs[0]
                     raise ValueError(
                         f"Fused module '{layer_name}' requires "
-                        f"consistent quant config for {sub_names}")
+                        f"consistent quant config for {sub_names}"
+                    )
 
         # 5. Fallback
         return get_config(layer_name, quantized)
@@ -177,14 +185,17 @@ def check_quantized(self, weight_bits: int) -> bool:
     def apply_vllm_mapper(self, hf_to_vllm_mapper: "WeightsMapper"):
         if self.block_name_to_quantize is not None:
             self.block_name_to_quantize = hf_to_vllm_mapper.apply_list(
-                self.block_name_to_quantize)
+                self.block_name_to_quantize
+            )
         if self.extra_config is not None:
             self.extra_config = hf_to_vllm_mapper.apply_dict(self.extra_config)
 
     def apply_awq_quant_layer(self, layer, prefix: str, backend: str = "auto"):
         from vllm.model_executor.layers.fused_moe import FusedMoE
         from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-            check_marlin_supported, check_moe_marlin_supports_layer)
+            check_marlin_supported,
+            check_moe_marlin_supports_layer,
+        )
 
         weight_bits, group_size, sym = self.get_layer_config(layer, prefix)
         if not self.check_quantized(weight_bits):
@@ -206,19 +217,23 @@ def apply_awq_quant_layer(self, layer, prefix: str, backend: str = "auto"):
                 4: scalar_types.uint4,
                 8: scalar_types.uint8,
             }
-            use_marlin = (weight_bits
-                          in AWQ_TYPE_MAP) and check_marlin_supported(
-                              AWQ_TYPE_MAP[weight_bits], group_size, not sym)
+            use_marlin = (weight_bits in AWQ_TYPE_MAP) and check_marlin_supported(
+                AWQ_TYPE_MAP[weight_bits], group_size, not sym
+            )
 
             if isinstance(layer, FusedMoE):
                 use_marlin = use_marlin and check_moe_marlin_supports_layer(
-                    layer, group_size)
+                    layer, group_size
+                )
 
         else:
             use_marlin = False
         if use_marlin:
             from vllm.model_executor.layers.quantization.awq_marlin import (
-                AWQMarlinConfig, AWQMarlinLinearMethod, AWQMoEMethod)
+                AWQMarlinConfig,
+                AWQMarlinLinearMethod,
+                AWQMoEMethod,
+            )
 
             quant_args_marlin = AWQMarlinConfig(
                 weight_bits=weight_bits,
@@ -230,7 +245,9 @@ def apply_awq_quant_layer(self, layer, prefix: str, backend: str = "auto"):
             )
         else:
             from vllm.model_executor.layers.quantization.awq import (
-                AWQConfig, AWQLinearMethod)
+                AWQConfig,
+                AWQLinearMethod,
+            )
 
             quant_args = AWQConfig(
                 weight_bits=weight_bits,
@@ -241,8 +258,7 @@ def apply_awq_quant_layer(self, layer, prefix: str, backend: str = "auto"):
         if isinstance(layer, FusedMoE):
             if use_marlin:
                 return AWQMoEMethod(quant_args_marlin, layer.moe_config)
-            from vllm.model_executor.layers.quantization.moe_wna16 import (
-                MoeWNA16Config)
+            from vllm.model_executor.layers.quantization.moe_wna16 import MoeWNA16Config
 
             config = {
                 "quant_method": "awq",
@@ -251,8 +267,7 @@ def apply_awq_quant_layer(self, layer, prefix: str, backend: str = "auto"):
                 "zero_point": not sym,
                 "lm_head": False,
             }
-            return MoeWNA16Config.from_config(config).get_quant_method(
-                layer, prefix)
+            return MoeWNA16Config.from_config(config).get_quant_method(layer, prefix)
 
         if isinstance(layer, (LinearBase, ParallelLMHead)):
             if use_marlin:
@@ -261,13 +276,12 @@ def apply_awq_quant_layer(self, layer, prefix: str, backend: str = "auto"):
                 return AWQLinearMethod(quant_args)
         return None
 
-    def apply_gptq_quant_layer(self,
-                               layer,
-                               prefix: str,
-                               backend: str = "auto"):
+    def apply_gptq_quant_layer(self, layer, prefix: str, backend: str = "auto"):
         from vllm.model_executor.layers.fused_moe import FusedMoE
         from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-            check_marlin_supported, check_moe_marlin_supports_layer)
+            check_marlin_supported,
+            check_moe_marlin_supports_layer,
+        )
 
         weight_bits, group_size, sym = self.get_layer_config(layer, prefix)
         if not self.check_quantized(weight_bits):
@@ -289,19 +303,21 @@ def apply_gptq_quant_layer(self,
                 (4, True): scalar_types.uint4b8,
                 (8, True): scalar_types.uint8b128,
             }
-            use_marlin = (weight_bits,
-                          sym) in GPTQ_TYPE_MAP and check_marlin_supported(
-                              GPTQ_TYPE_MAP[(weight_bits, sym)],
-                              group_size,
-                              has_zp=not sym)
+            use_marlin = (weight_bits, sym) in GPTQ_TYPE_MAP and check_marlin_supported(
+                GPTQ_TYPE_MAP[(weight_bits, sym)], group_size, has_zp=not sym
+            )
             if isinstance(layer, FusedMoE):
                 use_marlin = use_marlin and check_moe_marlin_supports_layer(
-                    layer, group_size)
+                    layer, group_size
+                )
         else:
             use_marlin = False
         if use_marlin:
             from vllm.model_executor.layers.quantization.gptq_marlin import (
-                GPTQMarlinConfig, GPTQMarlinLinearMethod, GPTQMarlinMoEMethod)
+                GPTQMarlinConfig,
+                GPTQMarlinLinearMethod,
+                GPTQMarlinMoEMethod,
+            )
 
             quant_args_marlin = GPTQMarlinConfig(
                 weight_bits=weight_bits,
@@ -314,7 +330,9 @@ def apply_gptq_quant_layer(self,
             )
         else:
             from vllm.model_executor.layers.quantization.gptq import (
-                GPTQConfig, GPTQLinearMethod)
+                GPTQConfig,
+                GPTQLinearMethod,
+            )
 
             quant_args = GPTQConfig(
                 weight_bits=weight_bits,
@@ -329,7 +347,8 @@ def apply_gptq_quant_layer(self,
                 return GPTQMarlinMoEMethod(quant_args_marlin, layer.moe_config)
             else:
                 from vllm.model_executor.layers.quantization.moe_wna16 import (
-                    MoeWNA16Config)
+                    MoeWNA16Config,
+                )
 
                 config = {
                     "quant_method": "gptq",
@@ -339,7 +358,8 @@ def apply_gptq_quant_layer(self,
                     "lm_head": False,
                 }
                 return MoeWNA16Config.from_config(config).get_quant_method(
-                    layer, prefix)
+                    layer, prefix
+                )
 
         if isinstance(layer, (LinearBase, ParallelLMHead)):
             if use_marlin:
@@ -357,29 +377,36 @@ def apply_ipex_quant_layer(self, layer, prefix: str):
             else:
                 return None
         from vllm.model_executor.layers.quantization.ipex_quant import (
-            IPEXAWQLinearMethod, IPEXConfig, IPEXGPTQLinearMethod)
+            IPEXAWQLinearMethod,
+            IPEXConfig,
+            IPEXGPTQLinearMethod,
+        )
 
         if isinstance(layer, (LinearBase, ParallelLMHead)):
             if "awq" in self.packing_format:
-                config = IPEXConfig(method="awq",
-                                    weight_bits=weight_bits,
-                                    group_size=group_size)
+                config = IPEXConfig(
+                    method="awq", weight_bits=weight_bits, group_size=group_size
+                )
                 return IPEXAWQLinearMethod(config)
             elif "gptq" in self.packing_format:
-                config = IPEXConfig(method="gptq",
-                                    weight_bits=weight_bits,
-                                    group_size=group_size)
+                config = IPEXConfig(
+                    method="gptq", weight_bits=weight_bits, group_size=group_size
+                )
                 return IPEXGPTQLinearMethod(config)
             else:
                 raise ValueError(
                     f"ipex backend only supports awq "
-                    f"and gtpq format,but got {self.packing_format}")
+                    f"and gtpq format,but got {self.packing_format}"
+                )
         else:
             return None
 
     def get_quant_method(self, layer: torch.nn.Module, prefix: str):
-        if (current_platform.is_cpu() or current_platform.is_xpu()
-                or self.backend == "ipex"):
+        if (
+            current_platform.is_cpu()
+            or current_platform.is_xpu()
+            or self.backend == "ipex"
+        ):
             return self.apply_ipex_quant_layer(layer, prefix)
         if "gptq" in self.packing_format or "gptq" in self.backend:
             return self.apply_gptq_quant_layer(layer, prefix)
diff --git a/vllm/model_executor/layers/quantization/awq.py b/vllm/model_executor/layers/quantization/awq.py
index af602eb9aca3..d4f667564848 100644
--- a/vllm/model_executor/layers/quantization/awq.py
+++ b/vllm/model_executor/layers/quantization/awq.py
@@ -8,13 +8,17 @@
 from vllm import _custom_ops as ops
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe.layer import FusedMoE
-from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
-                                               UnquantizedLinearMethod)
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    LinearMethodBase,
+    UnquantizedLinearMethod,
+)
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
-from vllm.model_executor.parameter import (GroupQuantScaleParameter,
-                                           PackedvLLMParameter)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
+from vllm.model_executor.parameter import GroupQuantScaleParameter, PackedvLLMParameter
 
 logger = init_logger(__name__)
 
@@ -41,14 +45,17 @@ def __init__(
         if self.weight_bits != 4:
             raise ValueError(
                 "Currently, only 4-bit weight quantization is supported for "
-                f"AWQ, but got {self.weight_bits} bits.")
+                f"AWQ, but got {self.weight_bits} bits."
+            )
         self.pack_factor = 32 // self.weight_bits
 
     def __repr__(self) -> str:
-        return (f"AWQConfig(weight_bits={self.weight_bits}, "
-                f"group_size={self.group_size}, "
-                f"zero_point={self.zero_point}, "
-                f"modules_to_not_convert={self.modules_to_not_convert})")
+        return (
+            f"AWQConfig(weight_bits={self.weight_bits}, "
+            f"group_size={self.group_size}, "
+            f"zero_point={self.zero_point}, "
+            f"modules_to_not_convert={self.modules_to_not_convert})"
+        )
 
     def get_name(self) -> QuantizationMethods:
         return "awq"
@@ -75,7 +82,8 @@ def from_config(cls, config: dict[str, Any]) -> "AWQConfig":
         group_size = cls.get_from_keys(config, ["q_group_size", "group_size"])
         zero_point = cls.get_from_keys(config, ["zero_point"])
         modules_to_not_convert = cls.get_from_keys_or(
-            config, ["modules_to_not_convert"], None)
+            config, ["modules_to_not_convert"], None
+        )
         return cls(weight_bits, group_size, zero_point, modules_to_not_convert)
 
     def get_quant_method(
@@ -90,10 +98,12 @@ def get_quant_method(
             from .awq_marlin import AWQMarlinConfig, AWQMoEMethod
             from .moe_wna16 import MoeWNA16Config
             from .utils.marlin_utils import check_moe_marlin_supports_layer
+
             if not check_moe_marlin_supports_layer(layer, self.group_size):
                 logger.warning_once(
                     f"Layer '{prefix}' is not supported by AWQMoeMarlin. "
-                    "Falling back to Moe WNA16 kernels.")
+                    "Falling back to Moe WNA16 kernels."
+                )
                 config = {
                     "quant_method": "awq",
                     "bits": self.weight_bits,
@@ -102,7 +112,8 @@ def get_quant_method(
                     "lm_head": False,
                 }
                 return MoeWNA16Config.from_config(config).get_quant_method(
-                    layer, prefix)
+                    layer, prefix
+                )
             marlin_compatible_config_dict = {
                 "quant_method": "awq",
                 "bits": self.weight_bits,
@@ -112,7 +123,8 @@ def get_quant_method(
                 "modules_to_not_convert": self.modules_to_not_convert,
             }
             awq_marlin_config = AWQMarlinConfig.from_config(
-                marlin_compatible_config_dict)
+                marlin_compatible_config_dict
+            )
             return AWQMoEMethod(awq_marlin_config, layer.moe_config)
         return None
 
@@ -131,11 +143,16 @@ class AWQLinearMethod(LinearMethodBase):
     def __init__(self, quant_config: AWQConfig):
         self.quant_config = quant_config
 
-    def create_weights(self, layer: torch.nn.Module,
-                       input_size_per_partition: int,
-                       output_partition_sizes: list[int], input_size: int,
-                       output_size: int, params_dtype: torch.dtype,
-                       **extra_weight_attrs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        input_size_per_partition: int,
+        output_partition_sizes: list[int],
+        input_size: int,
+        output_size: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         # Normalize group_size
         if self.quant_config.group_size != -1:
             group_size = self.quant_config.group_size
@@ -146,14 +163,16 @@ def create_weights(self, layer: torch.nn.Module,
             raise ValueError(
                 "The input size is not aligned with the quantized "
                 "weight shape. This can be caused by too large "
-                "tensor parallel size.")
+                "tensor parallel size."
+            )
 
         output_size_per_partition = sum(output_partition_sizes)
         if output_size_per_partition % self.quant_config.pack_factor != 0:
             raise ValueError(
                 "The output size is not aligned with the quantized "
                 "weight shape. This can be caused by too large "
-                "tensor parallel size.")
+                "tensor parallel size."
+            )
 
         weight_loader = extra_weight_attrs.get("weight_loader")
         qweight = PackedvLLMParameter(
@@ -166,7 +185,8 @@ def create_weights(self, layer: torch.nn.Module,
             output_dim=1,
             packed_dim=1,
             packed_factor=self.quant_config.pack_factor,
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
 
         num_groups = input_size_per_partition // group_size
 
@@ -180,38 +200,40 @@ def create_weights(self, layer: torch.nn.Module,
             output_dim=1,
             packed_dim=1,
             packed_factor=self.quant_config.pack_factor,
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
 
-        scales = GroupQuantScaleParameter(data=torch.empty(
-            num_groups,
-            output_size_per_partition,
-            dtype=params_dtype,
-        ),
-                                          input_dim=0,
-                                          output_dim=1,
-                                          weight_loader=weight_loader)
+        scales = GroupQuantScaleParameter(
+            data=torch.empty(
+                num_groups,
+                output_size_per_partition,
+                dtype=params_dtype,
+            ),
+            input_dim=0,
+            output_dim=1,
+            weight_loader=weight_loader,
+        )
 
         layer.register_parameter("qweight", qweight)
         layer.register_parameter("qzeros", qzeros)
         layer.register_parameter("scales", scales)
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
-        layer.qweight = torch.nn.Parameter(layer.qweight.data,
-                                           requires_grad=False)
-        layer.qzeros = torch.nn.Parameter(layer.qzeros.data,
-                                          requires_grad=False)
-        layer.scales = torch.nn.Parameter(layer.scales.data,
-                                          requires_grad=False)
-
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+        layer.qweight = torch.nn.Parameter(layer.qweight.data, requires_grad=False)
+        layer.qzeros = torch.nn.Parameter(layer.qzeros.data, requires_grad=False)
+        layer.scales = torch.nn.Parameter(layer.scales.data, requires_grad=False)
+
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         qweight = layer.qweight
         scales = layer.scales
         qzeros = layer.qzeros
         pack_factor = self.quant_config.pack_factor
-        out_shape = (x.shape[:-1] + (qweight.shape[-1] * pack_factor, ))
+        out_shape = x.shape[:-1] + (qweight.shape[-1] * pack_factor,)
         reshaped_x = x.reshape(-1, x.shape[-1])
 
         # num_tokens >= threshold
@@ -221,8 +243,7 @@ def apply(self,
             out = ops.awq_dequantize(qweight, scales, qzeros, 0, 0, 0)
             out = torch.matmul(reshaped_x, out)
         else:
-            out = ops.awq_gemm(reshaped_x, qweight, scales, qzeros,
-                               pack_factor)
+            out = ops.awq_gemm(reshaped_x, qweight, scales, qzeros, pack_factor)
         if bias is not None:
             out.add_(bias)
         return out.reshape(out_shape)
diff --git a/vllm/model_executor/layers/quantization/awq_marlin.py b/vllm/model_executor/layers/quantization/awq_marlin.py
index 6bf6ea914651..5d142387d4d9 100644
--- a/vllm/model_executor/layers/quantization/awq_marlin.py
+++ b/vllm/model_executor/layers/quantization/awq_marlin.py
@@ -9,30 +9,46 @@
 import vllm.model_executor.layers.fused_moe  # noqa
 from vllm import _custom_ops as ops
 from vllm.logger import init_logger
-from vllm.model_executor.layers.fused_moe.config import (FusedMoEConfig,
-                                                         FusedMoEQuantConfig)
+from vllm.model_executor.layers.fused_moe.config import (
+    FusedMoEConfig,
+    FusedMoEQuantConfig,
+)
 from vllm.model_executor.layers.fused_moe.layer import (
-    FusedMoE, FusedMoEMethodBase, FusedMoeWeightScaleSupported,
-    UnquantizedFusedMoEMethod)
-from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
-                                               UnquantizedLinearMethod,
-                                               set_weight_attrs)
+    FusedMoE,
+    FusedMoEMethodBase,
+    FusedMoeWeightScaleSupported,
+    UnquantizedFusedMoEMethod,
+)
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    LinearMethodBase,
+    UnquantizedLinearMethod,
+    set_weight_attrs,
+)
 from vllm.model_executor.layers.quantization import QuantizationMethods
-from vllm.model_executor.layers.quantization.awq import (AWQConfig,
-                                                         is_layer_skipped_awq)
+from vllm.model_executor.layers.quantization.awq import AWQConfig, is_layer_skipped_awq
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.layers.quantization.utils import replace_parameter
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-    apply_awq_marlin_linear, awq_to_marlin_zero_points, check_marlin_supported,
-    check_marlin_supports_layer, check_moe_marlin_supports_layer,
-    marlin_make_empty_g_idx, marlin_make_workspace_new,
-    marlin_moe_permute_scales, marlin_permute_bias, marlin_permute_scales,
-    moe_awq_to_marlin_zero_points, verify_marlin_supported,
-    verify_marlin_supports_shape)
+    apply_awq_marlin_linear,
+    awq_to_marlin_zero_points,
+    check_marlin_supported,
+    check_marlin_supports_layer,
+    check_moe_marlin_supports_layer,
+    marlin_make_empty_g_idx,
+    marlin_make_workspace_new,
+    marlin_moe_permute_scales,
+    marlin_permute_bias,
+    marlin_permute_scales,
+    moe_awq_to_marlin_zero_points,
+    verify_marlin_supported,
+    verify_marlin_supports_shape,
+)
 from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
-from vllm.model_executor.parameter import (GroupQuantScaleParameter,
-                                           PackedvLLMParameter)
+from vllm.model_executor.parameter import GroupQuantScaleParameter, PackedvLLMParameter
 from vllm.platforms import current_platform
 from vllm.scalar_type import scalar_types
 
@@ -48,10 +64,15 @@ class AWQMarlinConfig(QuantizationConfig):
         8: scalar_types.uint8,
     }
 
-    def __init__(self, weight_bits: int, group_size: int, zero_point: bool,
-                 lm_head_quantized: bool,
-                 modules_to_not_convert: Optional[list[str]],
-                 full_config: dict[str, Any]) -> None:
+    def __init__(
+        self,
+        weight_bits: int,
+        group_size: int,
+        zero_point: bool,
+        lm_head_quantized: bool,
+        modules_to_not_convert: Optional[list[str]],
+        full_config: dict[str, Any],
+    ) -> None:
         super().__init__()
         self.pack_factor = 32 // weight_bits  # packed into int32
         self.group_size = group_size
@@ -62,21 +83,25 @@ def __init__(self, weight_bits: int, group_size: int, zero_point: bool,
         self.full_config = full_config
 
         if self.weight_bits not in self.TYPE_MAP:
-            raise ValueError(f"Unsupported num_bits = {self.weight_bits}. "
-                             f"Supported num_bits = {self.TYPE_MAP.keys()}")
+            raise ValueError(
+                f"Unsupported num_bits = {self.weight_bits}. "
+                f"Supported num_bits = {self.TYPE_MAP.keys()}"
+            )
 
         self.quant_type = self.TYPE_MAP[self.weight_bits]
 
-        verify_marlin_supported(self.quant_type,
-                                group_size=self.group_size,
-                                has_zp=self.zero_point)
+        verify_marlin_supported(
+            self.quant_type, group_size=self.group_size, has_zp=self.zero_point
+        )
 
     def __repr__(self) -> str:
-        return (f"AWQMarlinConfig(quant_type={self.quant_type}, "
-                f"group_size={self.group_size}, "
-                f"zero_point={self.zero_point}, "
-                f"lm_head_quantized={self.lm_head_quantized}, "
-                f"modules_to_not_convert={self.modules_to_not_convert})")
+        return (
+            f"AWQMarlinConfig(quant_type={self.quant_type}, "
+            f"group_size={self.group_size}, "
+            f"zero_point={self.zero_point}, "
+            f"lm_head_quantized={self.lm_head_quantized}, "
+            f"modules_to_not_convert={self.modules_to_not_convert})"
+        )
 
     @classmethod
     def get_name(cls) -> QuantizationMethods:
@@ -99,37 +124,51 @@ def from_config(cls, config: dict[str, Any]) -> "AWQMarlinConfig":
         weight_bits = cls.get_from_keys(config, ["bits"])
         group_size = cls.get_from_keys(config, ["group_size"])
         zero_point = cls.get_from_keys(config, ["zero_point"])
-        lm_head_quantized = cls.get_from_keys_or(config, ["lm_head"],
-                                                 default=False)
+        lm_head_quantized = cls.get_from_keys_or(config, ["lm_head"], default=False)
         modules_to_not_convert = cls.get_from_keys_or(
-            config, ["modules_to_not_convert"], None)
-        return cls(weight_bits, group_size, zero_point, lm_head_quantized,
-                   modules_to_not_convert, config)
+            config, ["modules_to_not_convert"], None
+        )
+        return cls(
+            weight_bits,
+            group_size,
+            zero_point,
+            lm_head_quantized,
+            modules_to_not_convert,
+            config,
+        )
 
     @classmethod
     def override_quantization_method(
-            cls, hf_quant_cfg, user_quant) -> Optional[QuantizationMethods]:
+        cls, hf_quant_cfg, user_quant
+    ) -> Optional[QuantizationMethods]:
         can_convert = cls.is_awq_marlin_compatible(hf_quant_cfg)
-        is_valid_user_quant = (user_quant is None or user_quant == "marlin"
-                               or user_quant == "awq_marlin")
+        is_valid_user_quant = (
+            user_quant is None or user_quant == "marlin" or user_quant == "awq_marlin"
+        )
 
         if can_convert and is_valid_user_quant:
-            msg = ("The model is convertible to {} during runtime."
-                   " Using {} kernel.".format(cls.get_name(), cls.get_name()))
+            msg = (
+                "The model is convertible to {} during runtime."
+                " Using {} kernel.".format(cls.get_name(), cls.get_name())
+            )
             logger.info(msg)
             return cls.get_name()
 
         if can_convert and user_quant == "awq":
-            logger.info("Detected that the model can run with awq_marlin"
-                        ", however you specified quantization=awq explicitly,"
-                        " so forcing awq. Use quantization=awq_marlin for"
-                        " faster inference")
+            logger.info(
+                "Detected that the model can run with awq_marlin"
+                ", however you specified quantization=awq explicitly,"
+                " so forcing awq. Use quantization=awq_marlin for"
+                " faster inference"
+            )
         return None
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
-        if (isinstance(layer, LinearBase) or
-            (isinstance(layer, ParallelLMHead) and self.lm_head_quantized)):
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
+        if isinstance(layer, LinearBase) or (
+            isinstance(layer, ParallelLMHead) and self.lm_head_quantized
+        ):
             if is_layer_skipped_awq(prefix, self.modules_to_not_convert):
                 return UnquantizedLinearMethod()
             # Check if the layer is supported by AWQMarlin.
@@ -138,21 +177,25 @@ def get_quant_method(self, layer: torch.nn.Module,
                     "Layer '%s' is not supported by AWQMarlin. Falling back to unoptimized AWQ kernels.",  # noqa: E501
                     prefix,
                 )
-                return AWQConfig.from_config(
-                    self.full_config).get_quant_method(layer, prefix)
+                return AWQConfig.from_config(self.full_config).get_quant_method(
+                    layer, prefix
+                )
             return AWQMarlinLinearMethod(self)
         elif isinstance(layer, FusedMoE):
-            from vllm.model_executor.layers.quantization.moe_wna16 import (
-                MoeWNA16Config)
+            from vllm.model_executor.layers.quantization.moe_wna16 import MoeWNA16Config
+
             if is_layer_skipped_awq(
-                    prefix, getattr(self, "modules_to_not_convert", [])):
+                prefix, getattr(self, "modules_to_not_convert", [])
+            ):
                 return UnquantizedFusedMoEMethod(layer.moe_config)
             if not check_moe_marlin_supports_layer(layer, self.group_size):
                 logger.warning_once(
                     f"Layer '{prefix}' is not supported by AWQMoeMarlin. "
-                    "Falling back to Moe WNA16 kernels.")
-                return MoeWNA16Config.from_config(
-                    self.full_config).get_quant_method(layer, prefix)
+                    "Falling back to Moe WNA16 kernels."
+                )
+                return MoeWNA16Config.from_config(self.full_config).get_quant_method(
+                    layer, prefix
+                )
             return AWQMoEMethod(self, layer.moe_config)
         return None
 
@@ -171,15 +214,15 @@ def is_awq_marlin_compatible(cls, quant_config: dict[str, Any]):
             return False
 
         # If we cannot find the info needed in the config, cannot convert.
-        if (num_bits is None or group_size is None or zero_point is None):
+        if num_bits is None or group_size is None or zero_point is None:
             return False
 
         if num_bits not in cls.TYPE_MAP:
             return False
 
-        return check_marlin_supported(quant_type=cls.TYPE_MAP[num_bits],
-                                      group_size=group_size,
-                                      has_zp=zero_point)
+        return check_marlin_supported(
+            quant_type=cls.TYPE_MAP[num_bits], group_size=group_size, has_zp=zero_point
+        )
 
 
 class AWQMarlinLinearMethod(LinearMethodBase):
@@ -216,7 +259,8 @@ def create_weights(
             output_size_per_partition=output_size_per_partition,
             input_size_per_partition=input_size_per_partition,
             input_size=input_size,
-            group_size=group_size)
+            group_size=group_size,
+        )
 
         qweight = PackedvLLMParameter(
             data=torch.empty(
@@ -228,7 +272,8 @@ def create_weights(
             output_dim=1,
             packed_dim=1,
             packed_factor=self.quant_config.pack_factor,
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
 
         num_groups = input_size_per_partition // group_size
 
@@ -242,16 +287,19 @@ def create_weights(
             output_dim=1,
             packed_dim=1,
             packed_factor=self.quant_config.pack_factor,
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
 
-        scales = GroupQuantScaleParameter(data=torch.empty(
-            num_groups,
-            output_size_per_partition,
-            dtype=params_dtype,
-        ),
-                                          input_dim=0,
-                                          output_dim=1,
-                                          weight_loader=weight_loader)
+        scales = GroupQuantScaleParameter(
+            data=torch.empty(
+                num_groups,
+                output_size_per_partition,
+                dtype=params_dtype,
+            ),
+            input_dim=0,
+            output_dim=1,
+            weight_loader=weight_loader,
+        )
 
         layer.register_parameter("qweight", qweight)
         layer.register_parameter("qzeros", qzeros)
@@ -267,12 +315,9 @@ def create_weights(
     # Here, we handle the repacking
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         device = layer.qweight.device
-        layer.qweight = torch.nn.Parameter(layer.qweight.data,
-                                           requires_grad=False)
-        layer.qzeros = torch.nn.Parameter(layer.qzeros.data,
-                                          requires_grad=False)
-        layer.scales = torch.nn.Parameter(layer.scales.data,
-                                          requires_grad=False)
+        layer.qweight = torch.nn.Parameter(layer.qweight.data, requires_grad=False)
+        layer.qzeros = torch.nn.Parameter(layer.qzeros.data, requires_grad=False)
+        layer.scales = torch.nn.Parameter(layer.scales.data, requires_grad=False)
 
         # Allocate marlin workspace
         layer.workspace = marlin_make_workspace_new(device)
@@ -282,7 +327,8 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             layer.qweight,
             size_k=layer.input_size_per_partition,
             size_n=layer.output_size_per_partition,
-            num_bits=self.quant_config.quant_type.size_bits)
+            num_bits=self.quant_config.quant_type.size_bits,
+        )
         replace_parameter(layer, "qweight", marlin_qweight)
 
         # Permute scales from AWQ format to marlin format.
@@ -290,7 +336,8 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             layer.scales,
             size_k=layer.input_size_per_partition,
             size_n=layer.output_size_per_partition,
-            group_size=self.quant_config.group_size)
+            group_size=self.quant_config.group_size,
+        )
         replace_parameter(layer, "scales", marlin_scales)
 
         # Permute zero-points from AWQ format to marlin format.
@@ -298,7 +345,8 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             layer.qzeros,
             size_k=layer.num_groups,
             size_n=layer.output_size_per_partition,
-            num_bits=self.quant_config.quant_type.size_bits)
+            num_bits=self.quant_config.quant_type.size_bits,
+        )
         replace_parameter(layer, "qzeros", marlin_zp)
 
         # Not-used
@@ -325,11 +373,11 @@ def apply(
             quant_type=self.quant_config.quant_type,
             output_size_per_partition=layer.output_size_per_partition,
             input_size_per_partition=layer.input_size_per_partition,
-            bias=bias)
+            bias=bias,
+        )
 
 
 class AWQMoEMethod(FusedMoEMethodBase):
-
     def __init__(
         self,
         quant_config: AWQMarlinConfig,
@@ -341,75 +389,93 @@ def __init__(
             raise ValueError("AWQMoEMethod only supports 4bit now.")
         self.quant_type = scalar_types.uint4
 
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
-        extra_weight_attrs.update({
-            "is_transposed":
-            True,
-            "quant_method":
-            FusedMoeWeightScaleSupported.GROUP.value,
-        })
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
+        extra_weight_attrs.update(
+            {
+                "is_transposed": True,
+                "quant_method": FusedMoeWeightScaleSupported.GROUP.value,
+            }
+        )
 
         w13_qweight = Parameter(
-            torch.empty(num_experts,
-                        hidden_size,
-                        2 * intermediate_size_per_partition //
-                        self.quant_config.pack_factor,
-                        dtype=torch.int32),
-            requires_grad=False)
+            torch.empty(
+                num_experts,
+                hidden_size,
+                2 * intermediate_size_per_partition // self.quant_config.pack_factor,
+                dtype=torch.int32,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_qweight", w13_qweight)
         set_weight_attrs(w13_qweight, extra_weight_attrs)
 
-        w2_qweight = Parameter(torch.empty(num_experts,
-                                           intermediate_size_per_partition,
-                                           hidden_size //
-                                           self.quant_config.pack_factor,
-                                           dtype=torch.int32),
-                               requires_grad=False)
+        w2_qweight = Parameter(
+            torch.empty(
+                num_experts,
+                intermediate_size_per_partition,
+                hidden_size // self.quant_config.pack_factor,
+                dtype=torch.int32,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_qweight", w2_qweight)
         set_weight_attrs(w2_qweight, extra_weight_attrs)
 
         num_groups_w13 = hidden_size // self.quant_config.group_size
-        num_groups_w2 = (intermediate_size_per_partition //
-                         self.quant_config.group_size)
+        num_groups_w2 = intermediate_size_per_partition // self.quant_config.group_size
 
         # WEIGHT_SCALES
         # Allocate 2 scales for w1 and w3 respectively.
-        w13_scales = Parameter(torch.empty(num_experts,
-                                           num_groups_w13,
-                                           intermediate_size_per_partition * 2,
-                                           dtype=params_dtype),
-                               requires_grad=False)
+        w13_scales = Parameter(
+            torch.empty(
+                num_experts,
+                num_groups_w13,
+                intermediate_size_per_partition * 2,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_scales", w13_scales)
         set_weight_attrs(w13_scales, extra_weight_attrs)
 
-        w2_scales = Parameter(torch.empty(num_experts,
-                                          num_groups_w2,
-                                          hidden_size,
-                                          dtype=params_dtype),
-                              requires_grad=False)
+        w2_scales = Parameter(
+            torch.empty(num_experts, num_groups_w2, hidden_size, dtype=params_dtype),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_scales", w2_scales)
         set_weight_attrs(w2_scales, extra_weight_attrs)
 
         # WEIGHT_ZERO_POINT
         # Allocate 2 zero points for w1 and w3 respectively.
         w13_qzeros = Parameter(
-            torch.empty(num_experts,
-                        num_groups_w13,
-                        2 * intermediate_size_per_partition //
-                        self.quant_config.pack_factor,
-                        dtype=torch.int32),
-            requires_grad=False)
+            torch.empty(
+                num_experts,
+                num_groups_w13,
+                2 * intermediate_size_per_partition // self.quant_config.pack_factor,
+                dtype=torch.int32,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_qzeros", w13_qzeros)
         set_weight_attrs(w13_qzeros, extra_weight_attrs)
 
-        w2_qzeros = Parameter(torch.empty(num_experts,
-                                          num_groups_w2,
-                                          hidden_size //
-                                          self.quant_config.pack_factor,
-                                          dtype=torch.int32),
-                              requires_grad=False)
+        w2_qzeros = Parameter(
+            torch.empty(
+                num_experts,
+                num_groups_w2,
+                hidden_size // self.quant_config.pack_factor,
+                dtype=torch.int32,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_qzeros", w2_qzeros)
         set_weight_attrs(w2_qzeros, extra_weight_attrs)
 
@@ -469,14 +535,16 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             layer.w13_qzeros,
             size_k=layer.w13_qzeros.shape[1],
             size_n=layer.w13_qzeros.shape[2] * self.quant_config.pack_factor,
-            num_bits=self.quant_config.weight_bits)
+            num_bits=self.quant_config.weight_bits,
+        )
         replace_parameter(layer, "w13_qzeros", marlin_w13_zp)
 
         marlin_w2_zp = moe_awq_to_marlin_zero_points(
             layer.w2_qzeros,
             size_k=layer.w2_qzeros.shape[1],
             size_n=layer.w2_qzeros.shape[2] * self.quant_config.pack_factor,
-            num_bits=self.quant_config.weight_bits)
+            num_bits=self.quant_config.weight_bits,
+        )
         replace_parameter(layer, "w2_qzeros", marlin_w2_zp)
 
         if hasattr(layer, "w13_bias") and layer.w13_bias is not None:
@@ -486,7 +554,8 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             layer.w2_bias.data = marlin_permute_bias(layer.w2_bias)
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         return None
 
     def apply(
@@ -515,8 +584,7 @@ def apply(
         assert self.fused_experts is None
 
         if enable_eplb:
-            raise NotImplementedError(
-                "EPLB not supported for `AWQMoEMethod` yet.")
+            raise NotImplementedError("EPLB not supported for `AWQMoEMethod` yet.")
 
         assert activation == "silu", "Only SiLU activation is supported."
 
@@ -532,7 +600,8 @@ def apply(
             scoring_func=scoring_func,
             routed_scaling_factor=routed_scaling_factor,
             e_score_correction_bias=e_score_correction_bias,
-            indices_type=self.topk_indices_dtype)
+            indices_type=self.topk_indices_dtype,
+        )
 
         return torch.ops.vllm.fused_marlin_moe(
             x,
@@ -551,4 +620,5 @@ def apply(
             expert_map=expert_map,
             w1_zeros=layer.w13_qzeros,
             w2_zeros=layer.w2_qzeros,
-            workspace=layer.workspace)
+            workspace=layer.workspace,
+        )
diff --git a/vllm/model_executor/layers/quantization/awq_triton.py b/vllm/model_executor/layers/quantization/awq_triton.py
index 2e8894436a98..67b4dbbfd4d8 100644
--- a/vllm/model_executor/layers/quantization/awq_triton.py
+++ b/vllm/model_executor/layers/quantization/awq_triton.py
@@ -10,15 +10,16 @@
 
 @triton.jit
 def awq_dequantize_kernel(
-        qweight_ptr,  # quantized matrix
-        scales_ptr,  # scales, per group
-        zeros_ptr,  # zeros, per group
-        group_size,  # Should always be one of the supported group sizes
-        result_ptr,  # Output matrix
-        num_cols,  # input num cols in qweight
-        num_rows,  # input num rows in qweight
-        BLOCK_SIZE_X: tl.constexpr,
-        BLOCK_SIZE_Y: tl.constexpr):
+    qweight_ptr,  # quantized matrix
+    scales_ptr,  # scales, per group
+    zeros_ptr,  # zeros, per group
+    group_size,  # Should always be one of the supported group sizes
+    result_ptr,  # Output matrix
+    num_cols,  # input num cols in qweight
+    num_rows,  # input num rows in qweight
+    BLOCK_SIZE_X: tl.constexpr,
+    BLOCK_SIZE_Y: tl.constexpr,
+):
     # Set up the pids.
     pid_x = tl.program_id(axis=0)
     pid_y = tl.program_id(axis=1)
@@ -35,10 +36,10 @@ def awq_dequantize_kernel(
 
     # Compute offsets and masks for result output ptr.
     result_offsets_y = pid_y * BLOCK_SIZE_Y + tl.arange(0, BLOCK_SIZE_Y)
-    result_offsets_x = pid_x * BLOCK_SIZE_X * 8 + tl.arange(
-        0, BLOCK_SIZE_X * 8)
-    result_offsets = (8 * num_cols * result_offsets_y[:, None] +
-                      result_offsets_x[None, :])
+    result_offsets_x = pid_x * BLOCK_SIZE_X * 8 + tl.arange(0, BLOCK_SIZE_X * 8)
+    result_offsets = (
+        8 * num_cols * result_offsets_y[:, None] + result_offsets_x[None, :]
+    )
 
     result_masks_y = result_offsets_y < num_rows
     result_masks_x = result_offsets_x < num_cols * 8
@@ -52,8 +53,9 @@ def awq_dequantize_kernel(
 
     # Create reverse AWQ order as tensor: [0, 4, 1, 5, 2, 6, 3, 7]
     # that will map given indices to the correct order.
-    reverse_awq_order_tensor = ((tl.arange(0, 2) * 4)[None, :] +
-                                tl.arange(0, 4)[:, None]).reshape(8)
+    reverse_awq_order_tensor = (
+        (tl.arange(0, 2) * 4)[None, :] + tl.arange(0, 4)[:, None]
+    ).reshape(8)
 
     # Use this to compute a set of shifts that can be used to unpack and
     # reorder the values in iweights and zeros.
@@ -85,10 +87,8 @@ def awq_dequantize_kernel(
 
     # Compute scale offsets and masks.
     scale_offsets_y = pid_y * BLOCK_SIZE_Y // group_size + tl.arange(0, 1)
-    scale_offsets_x = (pid_x * BLOCK_SIZE_X * 8 +
-                       tl.arange(0, BLOCK_SIZE_X * 8))
-    scale_offsets = (num_cols * 8 * scale_offsets_y[:, None] +
-                     scale_offsets_x[None, :])
+    scale_offsets_x = pid_x * BLOCK_SIZE_X * 8 + tl.arange(0, BLOCK_SIZE_X * 8)
+    scale_offsets = num_cols * 8 * scale_offsets_y[:, None] + scale_offsets_x[None, :]
     scale_masks_y = scale_offsets_y < num_rows // group_size
     scale_masks_x = scale_offsets_x < num_cols * 8
     scale_masks = scale_masks_y[:, None] & scale_masks_x[None, :]
@@ -106,10 +106,21 @@ def awq_dequantize_kernel(
 
 
 @triton.jit
-def awq_gemm_kernel(a_ptr, b_ptr, c_ptr, zeros_ptr, scales_ptr, M, N, K,
-                    group_size, BLOCK_SIZE_M: tl.constexpr,
-                    BLOCK_SIZE_N: tl.constexpr, BLOCK_SIZE_K: tl.constexpr,
-                    SPLIT_K: tl.constexpr):
+def awq_gemm_kernel(
+    a_ptr,
+    b_ptr,
+    c_ptr,
+    zeros_ptr,
+    scales_ptr,
+    M,
+    N,
+    K,
+    group_size,
+    BLOCK_SIZE_M: tl.constexpr,
+    BLOCK_SIZE_N: tl.constexpr,
+    BLOCK_SIZE_K: tl.constexpr,
+    SPLIT_K: tl.constexpr,
+):
     pid = tl.program_id(axis=0)
     pid_z = tl.program_id(1)
 
@@ -128,18 +139,17 @@ def awq_gemm_kernel(a_ptr, b_ptr, c_ptr, zeros_ptr, scales_ptr, M, N, K,
     # (BLOCK_SIZE_M, BLOCK_SIZE_N))
     # accumulator = accumulator & 0x0
     # accumulator = accumulator.to(accumulator_dtype)
-    accumulator = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N),
-                           dtype=accumulator_dtype)
+    accumulator = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N), dtype=accumulator_dtype)
 
     # Create reverse AWQ order as tensor: [0, 4, 1, 5, 2, 6, 3, 7]
     # that will map given indices to the correct order.
-    reverse_awq_order_tensor = ((tl.arange(0, 2) * 4)[None, :] +
-                                tl.arange(0, 4)[:, None]).reshape(8)
+    reverse_awq_order_tensor = (
+        (tl.arange(0, 2) * 4)[None, :] + tl.arange(0, 4)[:, None]
+    ).reshape(8)
 
     # Create the necessary shifts to use to unpack.
     shifts = reverse_awq_order_tensor * 4
-    shifts = tl.broadcast_to(shifts[None, :],
-                             (BLOCK_SIZE_K * (BLOCK_SIZE_N // 8), 8))
+    shifts = tl.broadcast_to(shifts[None, :], (BLOCK_SIZE_K * (BLOCK_SIZE_N // 8), 8))
     shifts = tl.reshape(shifts, (BLOCK_SIZE_K, BLOCK_SIZE_N))
 
     # Offsets and masks.
@@ -178,8 +188,8 @@ def awq_gemm_kernel(a_ptr, b_ptr, c_ptr, zeros_ptr, scales_ptr, M, N, K,
 
         # Dequantize b.
         offsets_szk = (
-            (BLOCK_SIZE_K * SPLIT_K * k + pid_z * BLOCK_SIZE_K) // group_size +
-            tl.arange(0, 1))
+            BLOCK_SIZE_K * SPLIT_K * k + pid_z * BLOCK_SIZE_K
+        ) // group_size + tl.arange(0, 1)
         offsets_z = (N // 8) * offsets_szk[:, None] + offsets_zn[None, :]
         masks_zk = offsets_szk < K // group_size
         masks_z = masks_zk[:, None] & masks_zn[None, :]
@@ -220,11 +230,13 @@ def awq_gemm_kernel(a_ptr, b_ptr, c_ptr, zeros_ptr, scales_ptr, M, N, K,
 # qweights - [K     , M // 8], int32
 # scales   - [K // G, M     ], float16
 # zeros    - [K // G, M // 8], int32
-def awq_dequantize_triton(qweight: torch.Tensor,
-                          scales: torch.Tensor,
-                          zeros: torch.Tensor,
-                          block_size_x: int = 32,
-                          block_size_y: int = 32) -> torch.Tensor:
+def awq_dequantize_triton(
+    qweight: torch.Tensor,
+    scales: torch.Tensor,
+    zeros: torch.Tensor,
+    block_size_x: int = 32,
+    block_size_y: int = 32,
+) -> torch.Tensor:
     K = qweight.shape[0]
     M = scales.shape[1]
     group_size = qweight.shape[0] // scales.shape[0]
@@ -238,27 +250,31 @@ def awq_dequantize_triton(qweight: torch.Tensor,
     # Result tensor:
     # number of rows = same as input tensor
     # number of cols = 8 x input tensor num cols
-    result = torch.empty(qweight.shape[0],
-                         qweight.shape[1] * 8,
-                         device=qweight.device,
-                         dtype=scales.dtype)
+    result = torch.empty(
+        qweight.shape[0],
+        qweight.shape[1] * 8,
+        device=qweight.device,
+        dtype=scales.dtype,
+    )
 
     Y = qweight.shape[0]  # num rows
     X = qweight.shape[1]  # num cols
 
     grid = lambda META: (
-        triton.cdiv(X, META['BLOCK_SIZE_X']),
-        triton.cdiv(Y, META['BLOCK_SIZE_Y']),
+        triton.cdiv(X, META["BLOCK_SIZE_X"]),
+        triton.cdiv(Y, META["BLOCK_SIZE_Y"]),
+    )
+    awq_dequantize_kernel[grid](
+        qweight,
+        scales,
+        zeros,
+        group_size,
+        result,
+        X,
+        Y,
+        BLOCK_SIZE_X=block_size_x,
+        BLOCK_SIZE_Y=block_size_y,
     )
-    awq_dequantize_kernel[grid](qweight,
-                                scales,
-                                zeros,
-                                group_size,
-                                result,
-                                X,
-                                Y,
-                                BLOCK_SIZE_X=block_size_x,
-                                BLOCK_SIZE_Y=block_size_y)
 
     return result
 
@@ -268,14 +284,16 @@ def awq_dequantize_triton(qweight: torch.Tensor,
 # qzeros  - [K // G, N // 8]
 # scales  - [K // G, N]
 # split_k_iters - parallelism along K-dimension, int, power of 2.
-def awq_gemm_triton(input: torch.Tensor,
-                    qweight: torch.Tensor,
-                    scales: torch.Tensor,
-                    qzeros: torch.Tensor,
-                    split_k_iters: int,
-                    block_size_m: int = 32,
-                    block_size_n: int = 32,
-                    block_size_k: int = 32) -> torch.Tensor:
+def awq_gemm_triton(
+    input: torch.Tensor,
+    qweight: torch.Tensor,
+    scales: torch.Tensor,
+    qzeros: torch.Tensor,
+    split_k_iters: int,
+    block_size_m: int = 32,
+    block_size_n: int = 32,
+    block_size_k: int = 32,
+) -> torch.Tensor:
     M, K = input.shape
     N = qweight.shape[1] * 8
     group_size = qweight.shape[0] // qzeros.shape[0]
@@ -290,30 +308,29 @@ def awq_gemm_triton(input: torch.Tensor,
     assert group_size in AWQ_TRITON_SUPPORTED_GROUP_SIZES or group_size == K
 
     grid = lambda META: (
-        triton.cdiv(M, META['BLOCK_SIZE_M']) * triton.cdiv(
-            N, META['BLOCK_SIZE_N']),
+        triton.cdiv(M, META["BLOCK_SIZE_M"]) * triton.cdiv(N, META["BLOCK_SIZE_N"]),
         split_k_iters,
     )
 
-    result = torch.zeros((split_k_iters, M, N),
-                         dtype=scales.dtype,
-                         device=input.device)
+    result = torch.zeros((split_k_iters, M, N), dtype=scales.dtype, device=input.device)
 
     # A = input, B = qweight, C = result
     # A = M x K, B = K x N, C = M x N
-    awq_gemm_kernel[grid](input,
-                          qweight,
-                          result,
-                          qzeros,
-                          scales,
-                          M,
-                          N,
-                          K,
-                          group_size,
-                          BLOCK_SIZE_M=block_size_m,
-                          BLOCK_SIZE_N=block_size_n,
-                          BLOCK_SIZE_K=block_size_k,
-                          SPLIT_K=split_k_iters)
+    awq_gemm_kernel[grid](
+        input,
+        qweight,
+        result,
+        qzeros,
+        scales,
+        M,
+        N,
+        K,
+        group_size,
+        BLOCK_SIZE_M=block_size_m,
+        BLOCK_SIZE_N=block_size_n,
+        BLOCK_SIZE_K=block_size_k,
+        SPLIT_K=split_k_iters,
+    )
 
     result = result.sum(0)
 
diff --git a/vllm/model_executor/layers/quantization/base_config.py b/vllm/model_executor/layers/quantization/base_config.py
index 807a9866a18b..26f5e8bb6c7d 100644
--- a/vllm/model_executor/layers/quantization/base_config.py
+++ b/vllm/model_executor/layers/quantization/base_config.py
@@ -19,8 +19,9 @@ class QuantizeMethodBase(ABC):
     """Base class for different quantized methods."""
 
     @abstractmethod
-    def create_weights(self, layer: torch.nn.Module, *weight_args,
-                       **extra_weight_attrs):
+    def create_weights(
+        self, layer: torch.nn.Module, *weight_args, **extra_weight_attrs
+    ):
         """Create weights for a layer.
 
         The weights will be set as attributes of the layer."""
@@ -34,8 +35,7 @@ def apply(self, layer: torch.nn.Module, *args, **kwargs) -> torch.Tensor:
         raise NotImplementedError
 
     # Not required functions
-    def embedding(self, layer: torch.nn.Module, *args,
-                  **kwargs) -> torch.Tensor:
+    def embedding(self, layer: torch.nn.Module, *args, **kwargs) -> torch.Tensor:
         """Gather embeddings in the layer based on indices in the input tensor.
 
         Expects create_weights to have been called before on the layer."""
@@ -49,19 +49,16 @@ def process_weights_after_loading(self, layer: nn.Module) -> None:
         return
 
 
-def method_has_implemented_embedding(
-        method_class: type[QuantizeMethodBase]) -> bool:
+def method_has_implemented_embedding(method_class: type[QuantizeMethodBase]) -> bool:
     """
     Not all quant methods have embedding implemented, so we need to check that
     it exists for our given method. We check this by making sure the function
     has been changed from the base implementation.
     """
-    base_embedding = inspect.getattr_static(QuantizeMethodBase, "embedding",
-                                            None)
+    base_embedding = inspect.getattr_static(QuantizeMethodBase, "embedding", None)
     class_embedding = inspect.getattr_static(method_class, "embedding", None)
 
-    return (class_embedding is not None
-            and class_embedding is not base_embedding)
+    return class_embedding is not None and class_embedding is not base_embedding
 
 
 class QuantizationConfig(ABC):
@@ -107,12 +104,13 @@ def from_config(cls, config: dict[str, Any]) -> "QuantizationConfig":
 
     @classmethod
     def override_quantization_method(
-            cls, hf_quant_cfg, user_quant) -> Optional[QuantizationMethods]:
+        cls, hf_quant_cfg, user_quant
+    ) -> Optional[QuantizationMethods]:
         """
-           Detects if this quantization method can support a given checkpoint
-           format by overriding the user specified quantization method -- 
-           this method should only be overwritten by subclasses in exceptional 
-           circumstances
+        Detects if this quantization method can support a given checkpoint
+        format by overriding the user specified quantization method --
+        this method should only be overwritten by subclasses in exceptional
+        circumstances
         """
         return None
 
@@ -122,12 +120,12 @@ def get_from_keys(config: dict[str, Any], keys: list[str]) -> Any:
         for key in keys:
             if key in config:
                 return config[key]
-        raise ValueError(f"Cannot find any of {keys} in the model's "
-                         "quantization config.")
+        raise ValueError(
+            f"Cannot find any of {keys} in the model's quantization config."
+        )
 
     @staticmethod
-    def get_from_keys_or(config: dict[str, Any], keys: list[str],
-                         default: Any) -> Any:
+    def get_from_keys_or(config: dict[str, Any], keys: list[str], default: Any) -> Any:
         """Get an optional value from the model's quantization config."""
         try:
             return QuantizationConfig.get_from_keys(config, keys)
@@ -135,10 +133,11 @@ def get_from_keys_or(config: dict[str, Any], keys: list[str],
             return default
 
     @abstractmethod
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional[QuantizeMethodBase]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional[QuantizeMethodBase]:
         """Get the quantize method to use for the quantized layer.
-        
+
         Args:
             layer: The layer for the quant method.
             prefix: The full name of the layer in the state dict
@@ -152,7 +151,8 @@ def get_cache_scale(self, name: str) -> Optional[str]:
         return None
 
     def apply_vllm_mapper(  # noqa: B027
-            self, hf_to_vllm_mapper: "WeightsMapper"):
+        self, hf_to_vllm_mapper: "WeightsMapper"
+    ):
         """
         Interface for models to update module names referenced in
         quantization configs in order to reflect the vllm model structure
diff --git a/vllm/model_executor/layers/quantization/bitblas.py b/vllm/model_executor/layers/quantization/bitblas.py
index 81e51f4a4358..d2e0582be197 100644
--- a/vllm/model_executor/layers/quantization/bitblas.py
+++ b/vllm/model_executor/layers/quantization/bitblas.py
@@ -7,16 +7,23 @@
 
 from vllm.logger import init_logger
 from vllm.model_executor.layers.linear import LinearBase, LinearMethodBase
-from vllm.model_executor.layers.quantization import (QuantizationConfig,
-                                                     QuantizationMethods)
+from vllm.model_executor.layers.quantization import (
+    QuantizationConfig,
+    QuantizationMethods,
+)
 from vllm.model_executor.layers.quantization.utils.bitblas_utils import (
-    BITBLAS_OPTIMIZE_FEATURES, BITBLAS_SUPPORTED_NUM_BITS,
-    BITBLAS_SUPPORTED_SYM, MINIMUM_BITBLAS_VERSION)
+    BITBLAS_OPTIMIZE_FEATURES,
+    BITBLAS_SUPPORTED_NUM_BITS,
+    BITBLAS_SUPPORTED_SYM,
+    MINIMUM_BITBLAS_VERSION,
+)
 from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           ChannelQuantScaleParameter,
-                                           GroupQuantScaleParameter,
-                                           PackedvLLMParameter)
+from vllm.model_executor.parameter import (
+    BasevLLMParameter,
+    ChannelQuantScaleParameter,
+    GroupQuantScaleParameter,
+    PackedvLLMParameter,
+)
 from vllm.model_executor.utils import set_weight_attrs
 
 logger = init_logger(__name__)
@@ -27,6 +34,7 @@ class BitBLASConfig(QuantizationConfig):
 
     Reference: https://github.com/Microsoft/BitBLAS
     """
+
     TORCH_DTYPE = torch.float16
     STORAGE_DTYPE = "int8"  # assume int8 storage
     TORCH_STORAGE_DTYPE = getattr(torch, STORAGE_DTYPE)
@@ -45,11 +53,14 @@ def __init__(
     ) -> None:
         try:
             import bitblas
+
             if version.parse(bitblas.__version__) < version.parse(
-                    MINIMUM_BITBLAS_VERSION):
+                MINIMUM_BITBLAS_VERSION
+            ):
                 raise ImportError(
                     "bitblas version is wrong. Please "
-                    f"install bitblas>={MINIMUM_BITBLAS_VERSION}")
+                    f"install bitblas>={MINIMUM_BITBLAS_VERSION}"
+                )
         except ImportError as e:
             bitblas_import_exception = e
             raise ValueError(
@@ -77,12 +88,14 @@ def __init__(
             raise ValueError(
                 f"BitBLAS does not support weight_bits = {self.weight_bits}. "
                 f"Only weight_bits = {BITBLAS_SUPPORTED_NUM_BITS} "
-                "are supported.")
+                "are supported."
+            )
 
         if self.is_sym not in BITBLAS_SUPPORTED_SYM:
             raise ValueError(
                 f"BitBLAS does not support is_sym = {self.is_sym}. "
-                f"Only sym = {BITBLAS_SUPPORTED_SYM} are supported.")
+                f"Only sym = {BITBLAS_SUPPORTED_SYM} are supported."
+            )
 
         storage_dtype = self.STORAGE_DTYPE
         storage_nbit = int("".join(c for c in storage_dtype if c.isdigit()))
@@ -97,11 +110,13 @@ def __init__(
         self.zeros_mode = self.ZEROS_MODE
 
     def __repr__(self) -> str:
-        return (f"BitBLASConfig(weight_bits={self.weight_bits}, "
-                f"group_size={self.group_size}, "
-                f"desc_act={self.desc_act}, "
-                f"is_sym={self.is_sym}, "
-                f"quant_method={self.quant_method})")
+        return (
+            f"BitBLASConfig(weight_bits={self.weight_bits}, "
+            f"group_size={self.group_size}, "
+            f"desc_act={self.desc_act}, "
+            f"is_sym={self.is_sym}, "
+            f"quant_method={self.quant_method})"
+        )
 
     @classmethod
     def get_name(cls) -> QuantizationMethods:
@@ -121,9 +136,9 @@ def get_config_filenames(cls) -> list[str]:
         return ["quantize_config.json"]
 
     @staticmethod
-    def get_from_keys(config: dict[str, Any],
-                      keys: list[str],
-                      default: Any = None) -> Any:
+    def get_from_keys(
+        config: dict[str, Any], keys: list[str], default: Any = None
+    ) -> Any:
         """Get a value from the model's quantization config."""
         for key in keys:
             if key in config:
@@ -137,34 +152,40 @@ def from_config(cls, config: dict[str, Any]) -> "BitBLASConfig":
         desc_act = cls.get_from_keys(config, ["desc_act"], False)
         is_sym = cls.get_from_keys(config, ["sym"], False)
         quant_method = cls.get_from_keys(config, ["quant_method"])
-        lm_head_quantized = cls.get_from_keys_or(config, ["lm_head"],
-                                                 default=False)
-        return cls(weight_bits, group_size, desc_act, is_sym, quant_method,
-                   lm_head_quantized)
+        lm_head_quantized = cls.get_from_keys_or(config, ["lm_head"], default=False)
+        return cls(
+            weight_bits, group_size, desc_act, is_sym, quant_method, lm_head_quantized
+        )
 
     @classmethod
     def override_quantization_method(
-            cls, hf_quant_cfg, user_quant) -> Optional[QuantizationMethods]:
+        cls, hf_quant_cfg, user_quant
+    ) -> Optional[QuantizationMethods]:
         # compat: autogptq >=0.8.0 use checkpoint_format: str
         # compat: autogptq <=0.7.1 is_bitblas_format: bool
-        is_bitblas_format = (hf_quant_cfg.get("checkpoint_format") == "bitblas"
-                             or hf_quant_cfg.get("is_bitblas_format", False))
+        is_bitblas_format = hf_quant_cfg.get(
+            "checkpoint_format"
+        ) == "bitblas" or hf_quant_cfg.get("is_bitblas_format", False)
 
-        is_valid_user_quant = (user_quant is None or user_quant == "gptq"
-                               or user_quant == "bitblas")
+        is_valid_user_quant = (
+            user_quant is None or user_quant == "gptq" or user_quant == "bitblas"
+        )
 
         if is_bitblas_format and is_valid_user_quant:
-            msg = ("The model is serialized in {} format. Using {} kernel.".
-                   format(cls.get_name(), cls.get_name()))
+            msg = "The model is serialized in {} format. Using {} kernel.".format(
+                cls.get_name(), cls.get_name()
+            )
             logger.info(msg)
             return cls.get_name()
 
         return None
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["BitBLASLinearMethod"]:
-        if isinstance(layer, LinearBase) or (isinstance(layer, ParallelLMHead)
-                                             and self.lm_head_quantized):
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["BitBLASLinearMethod"]:
+        if isinstance(layer, LinearBase) or (
+            isinstance(layer, ParallelLMHead) and self.lm_head_quantized
+        ):
             return BitBLASLinearMethod(self)
         return None
 
@@ -175,6 +196,7 @@ class BitBLASLinearMethod(LinearMethodBase):
     Args:
         quant_config: The BitBLAS quantization config.
     """
+
     # USE BITBLAS_OPTIMIZE_FEATURES_CONTIGUOUS
     # Instead of BITBLAS_OPTIMIZE_FEATURES
     # If you want to high contiguous batching
@@ -204,7 +226,7 @@ def create_weights_gptq(
     ) -> None:
         """Creates quantized weights for use in linear operations.
 
-        The function initializes and returns a dictionary containing quantized 
+        The function initializes and returns a dictionary containing quantized
         weights, scales, and zeros
         for performing quantized matrix multiplication operations.
 
@@ -213,11 +235,11 @@ def create_weights_gptq(
             output_partition_sizes: List of output partition sizes.
             input_size: The total size of the input (unused).
             output_size: The total size of the output (unused).
-            params_dtype: 
+            params_dtype:
                 The data type of the parameters (expected to be torch.float16).
 
         Returns:
-            A dictionary containing the quantized weights ('qweight'), 
+            A dictionary containing the quantized weights ('qweight'),
             scales ('scales'), and zeros ('zeros').
 
         Raises:
@@ -229,17 +251,19 @@ def create_weights_gptq(
         weight_loader = extra_weight_attrs["weight_loader"]
 
         if params_dtype not in self.quant_config.get_supported_act_dtypes():
-            raise ValueError("Parameter data type must be torch.float16, "
-                             f"but got {params_dtype}")
+            raise ValueError(
+                f"Parameter data type must be torch.float16, but got {params_dtype}"
+            )
         group_size = self.quant_config.group_size
         if group_size is None:
             group_size = -1
         # Validate output_size_per_partition
         output_size_per_partition = sum(output_partition_sizes)
-        if (group_size != -1 and input_size_per_partition % group_size != 0):
+        if group_size != -1 and input_size_per_partition % group_size != 0:
             raise ValueError(
                 f"Input size per partition ({input_size_per_partition}) must "
-                f"be divisible by group size ({group_size}).")
+                f"be divisible by group size ({group_size})."
+            )
 
         # Initialize or retrieve the BitBLAS matrix multiplication operator.
         self._configure_bitblas_matmul(
@@ -265,34 +289,33 @@ def create_weights_gptq(
             output_dim=0,
             packed_dim=1,
             packed_factor=self.quant_config.pack_factor,
-            bitblas_tile_size=(self.bitblas_matmul.retrieve_weight_shape()[-2]
-                               if self.bitblas_matmul.propagate_b else None),
+            bitblas_tile_size=(
+                self.bitblas_matmul.retrieve_weight_shape()[-2]
+                if self.bitblas_matmul.propagate_b
+                else None
+            ),
             weight_loader=weight_loader,
         )
 
         # Compute the number of input groups for channel-wise quantization.
-        input_groups = (1 if group_size == -1 else input_size_per_partition //
-                        group_size)
+        input_groups = 1 if group_size == -1 else input_size_per_partition // group_size
 
         # Initialize scales and zeros for the quantized weights.
         weight_scale_args = {
-            "data":
-            torch.empty(
+            "data": torch.empty(
                 output_size_per_partition,
                 input_groups,
                 device="cuda",
                 dtype=params_dtype,
             ),
-            "weight_loader":
-            weight_loader
+            "weight_loader": weight_loader,
         }
         if input_groups == 1:
-            scales = ChannelQuantScaleParameter(output_dim=0,
-                                                **weight_scale_args)
+            scales = ChannelQuantScaleParameter(output_dim=0, **weight_scale_args)
         else:
-            scales = GroupQuantScaleParameter(output_dim=0,
-                                              input_dim=1,
-                                              **weight_scale_args)
+            scales = GroupQuantScaleParameter(
+                output_dim=0, input_dim=1, **weight_scale_args
+            )
 
         if self.quant_config.zeros_mode == "quantized":
             zeros = PackedvLLMParameter(
@@ -312,17 +335,22 @@ def create_weights_gptq(
 
         else:
             zeros = BasevLLMParameter(
-                torch.empty(output_size_per_partition,
-                            input_groups,
-                            device="cuda",
-                            dtype=params_dtype),
+                torch.empty(
+                    output_size_per_partition,
+                    input_groups,
+                    device="cuda",
+                    dtype=params_dtype,
+                ),
                 weight_loader=weight_loader,
             )
             # Set attributes to indicate how scales and zeros are applied.
-            set_weight_attrs(zeros, {
-                "input_dim": None if input_groups == 1 else 1,
-                "output_dim": 0,
-            })
+            set_weight_attrs(
+                zeros,
+                {
+                    "input_dim": None if input_groups == 1 else 1,
+                    "output_dim": 0,
+                },
+            )
 
         layer.register_parameter("qweight", qweight)
         layer.register_parameter("scales", scales)
@@ -339,13 +367,19 @@ def create_weights(
         **extra_weight_attrs,
     ):
         if self.quant_config.quant_method == "gptq":
-            return self.create_weights_gptq(layer, input_size_per_partition,
-                                            output_partition_sizes, input_size,
-                                            output_size, params_dtype,
-                                            **extra_weight_attrs)
+            return self.create_weights_gptq(
+                layer,
+                input_size_per_partition,
+                output_partition_sizes,
+                input_size,
+                output_size,
+                params_dtype,
+                **extra_weight_attrs,
+            )
         else:
             raise ValueError(
-                f"Unsupported quant_method {self.quant_config.quant_method}")
+                f"Unsupported quant_method {self.quant_config.quant_method}"
+            )
 
     def _configure_bitblas_matmul(
         self,
@@ -359,6 +393,7 @@ def _configure_bitblas_matmul(
         out_dtype="float16",
     ):
         from bitblas import MatmulConfig
+
         bitblas_dtype = self.BITBLAS_DTYPES[params_dtype]
 
         with_scaling = False
@@ -374,7 +409,8 @@ def _configure_bitblas_matmul(
                 W_dtype = f"int{bits}"
         else:
             raise ValueError(
-                f"Unsupported quant_method {self.quant_config.quant_method}")
+                f"Unsupported quant_method {self.quant_config.quant_method}"
+            )
 
         matmul_config = MatmulConfig(
             N=outfeatures,
@@ -392,38 +428,40 @@ def _configure_bitblas_matmul(
             zeros_mode=zeros_mode,
         )
         self.bitblas_matmul = self._get_or_create_bitblas_operator(
-            matmul_config, enable_tuning)
+            matmul_config, enable_tuning
+        )
 
     def _get_or_create_bitblas_operator(self, config, enable_tuning):
         from bitblas import Matmul, auto_detect_nvidia_target
         from bitblas.cache import get_database_path, global_operator_cache
+
         BITBLAS_DATABASE_PATH = get_database_path()
         BITBLAS_TARGET = auto_detect_nvidia_target()
         if global_operator_cache.size() == 0:
-            global_operator_cache.load_from_database(BITBLAS_DATABASE_PATH,
-                                                     BITBLAS_TARGET)
+            global_operator_cache.load_from_database(
+                BITBLAS_DATABASE_PATH, BITBLAS_TARGET
+            )
 
         bitblas_matmul = global_operator_cache.get(config)
         if bitblas_matmul is None:
-            bitblas_matmul = Matmul(config,
-                                    target=BITBLAS_TARGET,
-                                    enable_tuning=False)
+            bitblas_matmul = Matmul(config, target=BITBLAS_TARGET, enable_tuning=False)
             if enable_tuning:
-                TUNING_MESSAGE = (f"BitBLAS Operator {config} is tuning ...")
+                TUNING_MESSAGE = f"BitBLAS Operator {config} is tuning ..."
                 logger.info(TUNING_MESSAGE)
                 bitblas_matmul.hardware_aware_finetune(topk=20)
                 global_operator_cache.add(config, bitblas_matmul)
                 global_operator_cache.save_into_database(
-                    BITBLAS_DATABASE_PATH, BITBLAS_TARGET)
+                    BITBLAS_DATABASE_PATH, BITBLAS_TARGET
+                )
                 TUNED_MESSAGE = (
-                    f"BitBLAS Operator {config} tuned and saved to database.")
+                    f"BitBLAS Operator {config} tuned and saved to database."
+                )
                 logger.info(TUNED_MESSAGE)
             else:
                 _message = f"BitBLAS Operator {config} created."
                 logger.info(_message)
         else:
-            _message = (
-                f"BitBLAS Operator {config} found in global_operator_cache.")
+            _message = f"BitBLAS Operator {config} found in global_operator_cache."
             logger.info(_message)
         return bitblas_matmul
 
@@ -444,7 +482,7 @@ def apply_gptq(
         else:
             output_2d = self.bitblas_matmul(x_2d, qweight, scales, qzeros)
 
-        output = output_2d.view(x.shape[:-1] + (output_2d.shape[1], ))
+        output = output_2d.view(x.shape[:-1] + (output_2d.shape[1],))
 
         if bias is not None:
             output.add_(bias)  # In-place add
@@ -460,4 +498,5 @@ def apply(
             return self.apply_gptq(*args, **kwargs)
         else:
             raise ValueError(
-                f"Unsupported quant_method {self.quant_config.quant_method}")
+                f"Unsupported quant_method {self.quant_config.quant_method}"
+            )
diff --git a/vllm/model_executor/layers/quantization/bitsandbytes.py b/vllm/model_executor/layers/quantization/bitsandbytes.py
index 7b7011cb06d3..80ed121bd85b 100644
--- a/vllm/model_executor/layers/quantization/bitsandbytes.py
+++ b/vllm/model_executor/layers/quantization/bitsandbytes.py
@@ -6,15 +6,21 @@
 import torch
 from packaging import version
 
-from vllm.model_executor.layers.fused_moe.config import (FusedMoEConfig,
-                                                         FusedMoEQuantConfig)
-from vllm.model_executor.layers.fused_moe.layer import (FusedMoE,
-                                                        FusedMoEMethodBase)
-from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
-                                               UnquantizedLinearMethod,
-                                               set_weight_attrs)
-from vllm.model_executor.layers.quantization import (QuantizationConfig,
-                                                     QuantizationMethods)
+from vllm.model_executor.layers.fused_moe.config import (
+    FusedMoEConfig,
+    FusedMoEQuantConfig,
+)
+from vllm.model_executor.layers.fused_moe.layer import FusedMoE, FusedMoEMethodBase
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    LinearMethodBase,
+    UnquantizedLinearMethod,
+    set_weight_attrs,
+)
+from vllm.model_executor.layers.quantization import (
+    QuantizationConfig,
+    QuantizationMethods,
+)
 from vllm.platforms import current_platform
 from vllm.utils import direct_register_custom_op
 
@@ -51,16 +57,19 @@ def __init__(
         self.llm_int8_threshold = llm_int8_threshold
 
         if self.bnb_4bit_quant_storage not in ["uint8"]:
-            raise ValueError("Unsupported bnb_4bit_quant_storage: "
-                             f"{self.bnb_4bit_quant_storage}")
+            raise ValueError(
+                f"Unsupported bnb_4bit_quant_storage: {self.bnb_4bit_quant_storage}"
+            )
 
     def __repr__(self) -> str:
-        return (f"BitsAndBytesConfig(load_in_8bit={self.load_in_8bit}, "
-                f"load_in_4bit={self.load_in_4bit}, "
-                f"bnb_4bit_compute_dtype={self.bnb_4bit_compute_dtype}, "
-                f"bnb_4bit_quant_storage={self.bnb_4bit_quant_storage}, "
-                f"bnb_4bit_quant_type={self.bnb_4bit_quant_type}, "
-                f"llm_int8_skip_modules={self.llm_int8_skip_modules})")
+        return (
+            f"BitsAndBytesConfig(load_in_8bit={self.load_in_8bit}, "
+            f"load_in_4bit={self.load_in_4bit}, "
+            f"bnb_4bit_compute_dtype={self.bnb_4bit_compute_dtype}, "
+            f"bnb_4bit_quant_storage={self.bnb_4bit_quant_storage}, "
+            f"bnb_4bit_quant_type={self.bnb_4bit_quant_type}, "
+            f"llm_int8_skip_modules={self.llm_int8_skip_modules})"
+        )
 
     @classmethod
     def get_name(self) -> QuantizationMethods:
@@ -80,7 +89,6 @@ def get_config_filenames() -> list[str]:
 
     @classmethod
     def from_config(cls, config: dict[str, Any]) -> "BitsAndBytesConfig":
-
         def get_safe_value(config, keys, default_value=None):
             try:
                 value = cls.get_from_keys(config, keys)
@@ -88,30 +96,32 @@ def get_safe_value(config, keys, default_value=None):
             except ValueError:
                 return default_value
 
-        load_in_8bit = get_safe_value(config, ["load_in_8bit"],
-                                      default_value=False)
-        load_in_4bit = get_safe_value(config, ["load_in_4bit"],
-                                      default_value=True)
-        bnb_4bit_compute_dtype = get_safe_value(config,
-                                                ["bnb_4bit_compute_dtype"],
-                                                default_value="float32")
-        bnb_4bit_quant_storage = get_safe_value(config,
-                                                ["bnb_4bit_quant_storage"],
-                                                default_value="uint8")
-        bnb_4bit_quant_type = get_safe_value(config, ["bnb_4bit_quant_type"],
-                                             default_value="fp4")
+        load_in_8bit = get_safe_value(config, ["load_in_8bit"], default_value=False)
+        load_in_4bit = get_safe_value(config, ["load_in_4bit"], default_value=True)
+        bnb_4bit_compute_dtype = get_safe_value(
+            config, ["bnb_4bit_compute_dtype"], default_value="float32"
+        )
+        bnb_4bit_quant_storage = get_safe_value(
+            config, ["bnb_4bit_quant_storage"], default_value="uint8"
+        )
+        bnb_4bit_quant_type = get_safe_value(
+            config, ["bnb_4bit_quant_type"], default_value="fp4"
+        )
         bnb_4bit_use_double_quant = get_safe_value(
-            config, ["bnb_4bit_use_double_quant"], default_value=False)
+            config, ["bnb_4bit_use_double_quant"], default_value=False
+        )
         llm_int8_enable_fp32_cpu_offload = get_safe_value(
-            config, ["llm_int8_enable_fp32_cpu_offload"], default_value=False)
-        llm_int8_has_fp16_weight = get_safe_value(config,
-                                                  ["llm_int8_has_fp16_weight"],
-                                                  default_value=False)
-        llm_int8_skip_modules = get_safe_value(config,
-                                               ["llm_int8_skip_modules"],
-                                               default_value=[])
-        llm_int8_threshold = get_safe_value(config, ["llm_int8_threshold"],
-                                            default_value=6.0)
+            config, ["llm_int8_enable_fp32_cpu_offload"], default_value=False
+        )
+        llm_int8_has_fp16_weight = get_safe_value(
+            config, ["llm_int8_has_fp16_weight"], default_value=False
+        )
+        llm_int8_skip_modules = get_safe_value(
+            config, ["llm_int8_skip_modules"], default_value=[]
+        )
+        llm_int8_threshold = get_safe_value(
+            config, ["llm_int8_threshold"], default_value=6.0
+        )
 
         return cls(
             load_in_8bit=load_in_8bit,
@@ -123,7 +133,8 @@ def get_safe_value(config, keys, default_value=None):
             llm_int8_enable_fp32_cpu_offload=llm_int8_enable_fp32_cpu_offload,
             llm_int8_has_fp16_weight=llm_int8_has_fp16_weight,
             llm_int8_skip_modules=llm_int8_skip_modules,
-            llm_int8_threshold=llm_int8_threshold)
+            llm_int8_threshold=llm_int8_threshold,
+        )
 
     def get_quant_method(
         self, layer: torch.nn.Module, prefix: str
@@ -139,15 +150,15 @@ def get_quant_method(
 
 def is_layer_skipped_bnb(prefix: str, llm_int8_skip_modules: list[str]):
     # Split the prefix into its dot-separated components
-    components = prefix.split('.')
+    components = prefix.split(".")
 
     # Check if any of the skip modules exactly matches any component
-    substr_check = any(module_name in components
-                       for module_name in llm_int8_skip_modules)
+    substr_check = any(
+        module_name in components for module_name in llm_int8_skip_modules
+    )
 
     # Allow certain layers to not be quantized
-    set_components = set(".".join(components[:i + 1])
-                         for i in range(len(components)))
+    set_components = set(".".join(components[: i + 1]) for i in range(len(components)))
     set_llm_int8_skip_modules = set(llm_int8_skip_modules)
     prefix_check = len(set_llm_int8_skip_modules & set_components) != 0
 
@@ -171,39 +182,53 @@ class BitsAndBytesLinearMethod(LinearMethodBase):
     def __init__(self, quant_config: BitsAndBytesConfig):
         try:
             import bitsandbytes
-            if version.parse(
-                    bitsandbytes.__version__) < version.parse("0.46.1"):
-                raise ImportError("bitsandbytes version is wrong. Please "
-                                  "install bitsandbytes>=0.46.1.")
+
+            if version.parse(bitsandbytes.__version__) < version.parse("0.46.1"):
+                raise ImportError(
+                    "bitsandbytes version is wrong. Please "
+                    "install bitsandbytes>=0.46.1."
+                )
         except ImportError as err:
-            raise ImportError("Please install bitsandbytes>=0.46.1 via "
-                              "`pip install bitsandbytes>=0.46.1` to use "
-                              "bitsandbytes quantizer.") from err
+            raise ImportError(
+                "Please install bitsandbytes>=0.46.1 via "
+                "`pip install bitsandbytes>=0.46.1` to use "
+                "bitsandbytes quantizer."
+            ) from err
 
         self.quant_config = quant_config
 
-    def create_weights(self, layer: torch.nn.Module,
-                       input_size_per_partition: int,
-                       output_partition_sizes: list[int], input_size: int,
-                       output_size: int, params_dtype: torch.dtype,
-                       **extra_weight_attrs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        input_size_per_partition: int,
+        output_partition_sizes: list[int],
+        input_size: int,
+        output_size: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         from bitsandbytes.nn import Int8Params
 
         def create_qweight_for_8bit():
             qweight = Int8Params(
-                data=torch.empty(sum(output_partition_sizes),
-                                 input_size_per_partition,
-                                 dtype=torch.int8),
+                data=torch.empty(
+                    sum(output_partition_sizes),
+                    input_size_per_partition,
+                    dtype=torch.int8,
+                ),
                 has_fp16_weights=self.quant_config.llm_int8_has_fp16_weight,
-                requires_grad=False)
+                requires_grad=False,
+            )
             set_weight_attrs(
-                qweight, {
+                qweight,
+                {
                     "input_dim": 0,
                     "output_dim": 0,
                     "pack_factor": 1,
                     "use_bitsandbytes_8bit": True,
-                    "generation": 0
-                })
+                    "generation": 0,
+                },
+            )
             return qweight
 
         def create_qweight_for_4bit():
@@ -212,20 +237,22 @@ def create_qweight_for_4bit():
             total_size = input_size_per_partition * sum(output_partition_sizes)
             if total_size % quant_ratio != 0:
                 raise ValueError(
-                    "The input size is not aligned with the quantized "
-                    "weight shape.")
+                    "The input size is not aligned with the quantized weight shape."
+                )
 
-            qweight = torch.nn.Parameter(torch.empty(total_size // quant_ratio,
-                                                     1,
-                                                     dtype=torch.uint8),
-                                         requires_grad=False)
+            qweight = torch.nn.Parameter(
+                torch.empty(total_size // quant_ratio, 1, dtype=torch.uint8),
+                requires_grad=False,
+            )
             set_weight_attrs(
-                qweight, {
+                qweight,
+                {
                     "input_dim": 0,
                     "output_dim": 0,
                     "pack_factor": quant_ratio,
-                    "use_bitsandbytes_4bit": True
-                })
+                    "use_bitsandbytes_4bit": True,
+                },
+            )
             return qweight
 
         if self.quant_config.load_in_8bit:
@@ -237,22 +264,23 @@ def create_qweight_for_4bit():
         layer.register_parameter("weight", qweight)
         set_weight_attrs(qweight, extra_weight_attrs)
 
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
-
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         if self.quant_config.load_in_8bit:
             return self._apply_8bit_weight(layer, x, bias)
         else:
             return self._apply_4bit_weight(layer, x, bias)
 
     def _apply_8bit_weight(
-            self,
-            layer: torch.nn.Module,
-            x: torch.Tensor,
-            bias: Optional[torch.Tensor] = None) -> torch.Tensor:
-
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         # only load the bitsandbytes module when needed
         from bitsandbytes import MatmulLtState, matmul
 
@@ -272,11 +300,9 @@ def _apply_8bit_weight(
 
         out_dim_0 = x.shape[0]
         out_dim_1 = sum(
-            [quant_state[1].shape[0] for quant_state in quant_states.items()])
-        out = torch.empty(out_dim_0,
-                          out_dim_1,
-                          dtype=torch.float16,
-                          device=x.device)
+            [quant_state[1].shape[0] for quant_state in quant_states.items()]
+        )
+        out = torch.empty(out_dim_0, out_dim_1, dtype=torch.float16, device=x.device)
 
         current_index = 0
         for i in range(len(quant_states)):
@@ -286,33 +312,36 @@ def _apply_8bit_weight(
             # create new matmul_states
             if generation == 0 or generation == 1:
                 matmul_states[i] = MatmulLtState()
-                matmul_states[i].CB = qweight[offsets[i]:offsets[i + 1]]
+                matmul_states[i].CB = qweight[offsets[i] : offsets[i + 1]]
                 matmul_states[i].SCB = quant_states[i].to(x.device)
-                matmul_states[i].threshold = (
-                    self.quant_config.llm_int8_threshold)
-                matmul_states[i].has_fp16_weights = (
-                    self.quant_config.llm_int8_has_fp16_weight)
+                matmul_states[i].threshold = self.quant_config.llm_int8_threshold
+                matmul_states[
+                    i
+                ].has_fp16_weights = self.quant_config.llm_int8_has_fp16_weight
                 matmul_states[i].is_training = False
-                if matmul_states[i].threshold > 0.0 and not matmul_states[
-                        i].has_fp16_weights:
+                if (
+                    matmul_states[i].threshold > 0.0
+                    and not matmul_states[i].has_fp16_weights
+                ):
                     matmul_states[i].use_pool = True
 
             new_x = bf_x.unsqueeze(0)
 
-            out[:, current_index:current_index + output_size] = matmul(
-                new_x,
-                qweight[offsets[i]:offsets[i + 1]],
-                state=matmul_states[i])
+            out[:, current_index : current_index + output_size] = matmul(
+                new_x, qweight[offsets[i] : offsets[i + 1]], state=matmul_states[i]
+            )
 
             current_index += output_size
 
             # only update the matmul_states if it is not profile_run
-            if (generation > 0
-                    and not self.quant_config.llm_int8_has_fp16_weight
-                    and matmul_states[i].CB is not None
-                    and matmul_states[i].CxB is not None):
+            if (
+                generation > 0
+                and not self.quant_config.llm_int8_has_fp16_weight
+                and matmul_states[i].CB is not None
+                and matmul_states[i].CxB is not None
+            ):
                 del matmul_states[i].CB
-                qweight[offsets[i]:offsets[i + 1]] = matmul_states[i].CxB
+                qweight[offsets[i] : offsets[i + 1]] = matmul_states[i].CxB
 
         out = out.to(original_type)
 
@@ -327,11 +356,11 @@ def _apply_8bit_weight(
         return out
 
     def _apply_4bit_weight(
-            self,
-            layer: torch.nn.Module,
-            x: torch.Tensor,
-            bias: Optional[torch.Tensor] = None) -> torch.Tensor:
-
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         original_type = x.dtype
         original_shape = x.shape
         reshape_after_matmul = False
@@ -346,11 +375,9 @@ def _apply_4bit_weight(
 
         out_dim_0 = x.shape[0]
         out_dim_1 = sum(
-            [quant_state[1].shape[0] for quant_state in quant_states.items()])
-        out = torch.empty(out_dim_0,
-                          out_dim_1,
-                          dtype=torch.bfloat16,
-                          device=x.device)
+            [quant_state[1].shape[0] for quant_state in quant_states.items()]
+        )
+        out = torch.empty(out_dim_0, out_dim_1, dtype=torch.bfloat16, device=x.device)
         apply_bnb_4bit(bf_x, qweight, offsets, out)
         out = out.to(original_type)
 
@@ -371,6 +398,7 @@ def _apply_bnb_4bit(
 ) -> None:
     # only load the bitsandbytes module when needed
     from bitsandbytes import matmul_4bit
+
     quant_states = weight.bnb_quant_state
     current_index = 0
     for i in range(len(quant_states)):
@@ -379,8 +407,9 @@ def _apply_bnb_4bit(
         # matmul_4bit(..., out = ...).  Infeasible now due to the bug
         # https://github.com/TimDettmers/bitsandbytes/issues/1235.
         # Need to change  after the bug is fixed.
-        out[:, current_index:current_index + output_size] = matmul_4bit(
-            x, weight[offsets[i]:offsets[i + 1]].t(), quant_states[i])
+        out[:, current_index : current_index + output_size] = matmul_4bit(
+            x, weight[offsets[i] : offsets[i + 1]].t(), quant_states[i]
+        )
         current_index += output_size
 
 
@@ -394,11 +423,13 @@ def _apply_bnb_4bit_fake(
 
 
 try:
-    direct_register_custom_op(op_name="apply_bnb_4bit",
-                              op_func=_apply_bnb_4bit,
-                              mutates_args=["out"],
-                              fake_impl=_apply_bnb_4bit_fake,
-                              dispatch_key=current_platform.dispatch_key)
+    direct_register_custom_op(
+        op_name="apply_bnb_4bit",
+        op_func=_apply_bnb_4bit,
+        mutates_args=["out"],
+        fake_impl=_apply_bnb_4bit_fake,
+        dispatch_key=current_platform.dispatch_key,
+    )
     apply_bnb_4bit = torch.ops.vllm.apply_bnb_4bit
 
 except AttributeError as error:
@@ -420,14 +451,18 @@ def __init__(
         super().__init__(moe)
         try:
             import bitsandbytes
-            if version.parse(
-                    bitsandbytes.__version__) < version.parse("0.46.1"):
-                raise ImportError("bitsandbytes version is wrong. Please "
-                                  "install bitsandbytes>=0.46.1.")
+
+            if version.parse(bitsandbytes.__version__) < version.parse("0.46.1"):
+                raise ImportError(
+                    "bitsandbytes version is wrong. Please "
+                    "install bitsandbytes>=0.46.1."
+                )
         except ImportError as err:
-            raise ImportError("Please install bitsandbytes>=0.46.1 via "
-                              "`pip install bitsandbytes>=0.46.1` to use "
-                              "bitsandbytes quantizer.") from err
+            raise ImportError(
+                "Please install bitsandbytes>=0.46.1 via "
+                "`pip install bitsandbytes>=0.46.1` to use "
+                "bitsandbytes quantizer."
+            ) from err
         self.quant_config = quant_config
 
     def create_weights(
@@ -453,7 +488,8 @@ def create_weights(
         )
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         return None
 
     def apply(
@@ -480,11 +516,13 @@ def apply(
         logical_replica_count: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, tuple[torch.Tensor, torch.Tensor]]:
         from vllm.model_executor.layers.fused_moe import fused_experts
+
         assert self.fused_experts is None
 
         if enable_eplb:
             raise NotImplementedError(
-                "EPLB not supported for `BitsAndBytesMoEMethod` yet.")
+                "EPLB not supported for `BitsAndBytesMoEMethod` yet."
+            )
         topk_weights, topk_ids, _ = FusedMoE.select_experts(
             hidden_states=x,
             router_logits=router_logits,
@@ -497,7 +535,8 @@ def apply(
             scoring_func=scoring_func,
             routed_scaling_factor=routed_scaling_factor,
             e_score_correction_bias=e_score_correction_bias,
-            indices_type=self.topk_indices_dtype)
+            indices_type=self.topk_indices_dtype,
+        )
         if self.quant_config.load_in_8bit:
             w13, w2 = self._apply_8bit_dequant(layer)
         else:
@@ -527,8 +566,9 @@ def _create_weights_4bit(
     ):
         quant_ratio = calculate_quant_ratio(params_dtype)
         # Fused gate_up_proj (column parallel)
-        w13_total_size = (hidden_size * 2 *
-                          intermediate_size_per_partition) // quant_ratio
+        w13_total_size = (
+            hidden_size * 2 * intermediate_size_per_partition
+        ) // quant_ratio
         w13_qweight = torch.nn.Parameter(
             torch.empty(
                 num_experts,
@@ -543,26 +583,20 @@ def _create_weights_4bit(
         set_weight_attrs(
             w13_qweight,
             {
-                "num_experts":
-                num_experts,
-                "input_dim":
-                hidden_size,
-                "output_dim":
-                2 * intermediate_size_per_partition,
+                "num_experts": num_experts,
+                "input_dim": hidden_size,
+                "output_dim": 2 * intermediate_size_per_partition,
                 "experts_shape": (
                     num_experts,
                     intermediate_size_per_partition * 2,
                     hidden_size,
                 ),
-                "pack_factor":
-                quant_ratio,
-                "use_bitsandbytes_4bit":
-                True,
+                "pack_factor": quant_ratio,
+                "use_bitsandbytes_4bit": True,
             },
         )
         # down_proj (row parallel)
-        w2_total_size = (hidden_size *
-                         intermediate_size_per_partition) // quant_ratio
+        w2_total_size = (hidden_size * intermediate_size_per_partition) // quant_ratio
         w2_qweight = torch.nn.Parameter(
             torch.empty(
                 num_experts,
@@ -575,21 +609,16 @@ def _create_weights_4bit(
         set_weight_attrs(
             w2_qweight,
             {
-                "num_experts":
-                num_experts,
-                "input_dim":
-                intermediate_size_per_partition,
-                "output_dim":
-                hidden_size,
+                "num_experts": num_experts,
+                "input_dim": intermediate_size_per_partition,
+                "output_dim": hidden_size,
                 "experts_shape": (
                     num_experts,
                     hidden_size,
                     intermediate_size_per_partition,
                 ),
-                "pack_factor":
-                quant_ratio,
-                "use_bitsandbytes_4bit":
-                True,
+                "pack_factor": quant_ratio,
+                "use_bitsandbytes_4bit": True,
             },
         )
         layer.register_parameter("w2_weight", w2_qweight)
@@ -607,8 +636,10 @@ def _create_weights_8bit(
         raise NotImplementedError
 
     def _apply_4bit_dequnt(
-            self, layer: torch.nn.Module) -> tuple[torch.Tensor, torch.Tensor]:
+        self, layer: torch.nn.Module
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         from bitsandbytes.functional import dequantize_4bit
+
         w13 = dequantize_4bit(
             layer.w13_weight.reshape(-1, 1),
             layer.w13_weight.bnb_quant_state,
@@ -622,5 +653,6 @@ def _apply_4bit_dequnt(
         return w13, w2
 
     def _apply_8bit_dequant(
-            self, layer: torch.nn.Module) -> tuple[torch.Tensor, torch.Tensor]:
+        self, layer: torch.nn.Module
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         raise NotImplementedError
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors.py b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors.py
index 3f771ea2abd1..59862a381c27 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors.py
@@ -5,39 +5,62 @@
 from typing import TYPE_CHECKING, Any, Literal, Optional, cast
 
 import torch
-from compressed_tensors.config import (CompressionFormat,
-                                       SparsityCompressionConfig,
-                                       SparsityStructure)
-from compressed_tensors.quantization import (QuantizationArgs,
-                                             QuantizationStrategy,
-                                             QuantizationType)
+from compressed_tensors.config import (
+    CompressionFormat,
+    SparsityCompressionConfig,
+    SparsityStructure,
+)
+from compressed_tensors.quantization import (
+    QuantizationArgs,
+    QuantizationStrategy,
+    QuantizationType,
+)
 from compressed_tensors.transform import TransformConfig
 
 import vllm.envs as envs
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe import FusedMoE
-from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
-                                               UnquantizedLinearMethod)
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    LinearMethodBase,
+    UnquantizedLinearMethod,
+)
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (  # noqa: E501
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.layers.quantization.compressed_tensors.compressed_tensors_moe import (  # noqa: E501
-    CompressedTensorsMoEMethod)
+    CompressedTensorsMoEMethod,
+)
 from vllm.model_executor.layers.quantization.compressed_tensors.schemes import (
-    W4A16SPARSE24_SUPPORTED_BITS, WNA16_SUPPORTED_BITS, CompressedTensors24,
-    CompressedTensorsScheme, CompressedTensorsW4A4Fp4,
-    CompressedTensorsW4A8Fp8, CompressedTensorsW4A8Int,
-    CompressedTensorsW4A16Fp4, CompressedTensorsW4A16Sparse24,
-    CompressedTensorsW8A8Fp8, CompressedTensorsW8A8Int8,
-    CompressedTensorsW8A16Fp8, CompressedTensorsWNA16)
+    W4A16SPARSE24_SUPPORTED_BITS,
+    WNA16_SUPPORTED_BITS,
+    CompressedTensors24,
+    CompressedTensorsScheme,
+    CompressedTensorsW4A4Fp4,
+    CompressedTensorsW4A8Fp8,
+    CompressedTensorsW4A8Int,
+    CompressedTensorsW4A16Fp4,
+    CompressedTensorsW4A16Sparse24,
+    CompressedTensorsW8A8Fp8,
+    CompressedTensorsW8A8Int8,
+    CompressedTensorsW8A16Fp8,
+    CompressedTensorsWNA16,
+)
 from vllm.model_executor.layers.quantization.compressed_tensors.transform.linear import (  # noqa: E501
-    CompressedTensorsLinearTransformMethod, get_linear_transform_schemes)
+    CompressedTensorsLinearTransformMethod,
+    get_linear_transform_schemes,
+)
 from vllm.model_executor.layers.quantization.compressed_tensors.utils import (
-    find_matched_target, is_activation_quantization_format,
-    should_ignore_layer)
+    find_matched_target,
+    is_activation_quantization_format,
+    should_ignore_layer,
+)
 from vllm.model_executor.layers.quantization.kv_cache import BaseKVCacheMethod
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    cutlass_fp4_supported)
+    cutlass_fp4_supported,
+)
 from vllm.platforms import current_platform
 
 if TYPE_CHECKING:
@@ -52,7 +75,6 @@
 
 
 class CompressedTensorsConfig(QuantizationConfig):
-
     def __init__(
         self,
         target_scheme_map: dict[str, Any],
@@ -75,8 +97,7 @@ def __init__(
         self.config = config
 
         if transform_config:
-            self.transform_config = TransformConfig.model_validate(
-                transform_config)
+            self.transform_config = TransformConfig.model_validate(transform_config)
         else:
             self.transform_config = None
 
@@ -94,16 +115,16 @@ def get_name(self) -> QuantizationMethods:
         return "compressed-tensors"
 
     def apply_vllm_mapper(self, hf_to_vllm_mapper: "WeightsMapper"):
-        self.target_scheme_map = hf_to_vllm_mapper.apply_dict(
-            self.target_scheme_map)
+        self.target_scheme_map = hf_to_vllm_mapper.apply_dict(self.target_scheme_map)
         self.ignore = hf_to_vllm_mapper.apply_list(self.ignore)
         self.sparsity_scheme_map = hf_to_vllm_mapper.apply_dict(
-            self.sparsity_scheme_map)
+            self.sparsity_scheme_map
+        )
         self.sparsity_ignore_list = hf_to_vllm_mapper.apply_list(
-            self.sparsity_ignore_list)
+            self.sparsity_ignore_list
+        )
         if self.kv_cache_scheme is not None:
-            self.kv_cache_scheme = hf_to_vllm_mapper.apply_dict(
-                self.kv_cache_scheme)
+            self.kv_cache_scheme = hf_to_vllm_mapper.apply_dict(self.kv_cache_scheme)
 
     def get_quant_method(
         self,
@@ -116,8 +137,8 @@ def get_quant_method(
             # collect schemes
             quant_scheme = self.get_scheme(layer=layer, layer_name=prefix)
             input_tfms, output_tfms = get_linear_transform_schemes(
-                layer, prefix, self.transform_config,
-                self.packed_modules_mapping)
+                layer, prefix, self.transform_config, self.packed_modules_mapping
+            )
 
             # choose quantization method
             quant_method: LinearMethodBase = UnquantizedLinearMethod()
@@ -128,7 +149,8 @@ def get_quant_method(
             # choose transform method
             if any((input_tfms, output_tfms)):
                 return CompressedTensorsLinearTransformMethod.from_schemes(
-                    quant_method, quant_scheme, input_tfms, output_tfms)
+                    quant_method, quant_scheme, input_tfms, output_tfms
+                )
 
             else:
                 return quant_method
@@ -143,10 +165,10 @@ def get_quant_method(
     def from_config(cls, config: dict[str, Any]) -> "CompressedTensorsConfig":
         ignore: list[str] = cast(list[str], config.get("ignore", []))
         quant_format = cast(str, config.get("format"))
-        target_scheme_map = cls._quantization_scheme_map_from_config(
-            config=config)
+        target_scheme_map = cls._quantization_scheme_map_from_config(config=config)
         sparsity_scheme_map, sparsity_ignore_list = cls._parse_sparsity_config(
-            config=config)
+            config=config
+        )
         transform_config = config.get("transform_config")
 
         return cls(
@@ -173,18 +195,17 @@ def _parse_sparsity_config(
         if not (sparsity_config := config.get(SPARSITY_CONFIG_NAME)):
             return dict(), []
 
-        sparsity_config = SparsityCompressionConfig.model_validate(
-            sparsity_config)
+        sparsity_config = SparsityCompressionConfig.model_validate(sparsity_config)
         sparse_scheme_map: dict[str, SparsityCompressionConfig] = {
-            target: sparsity_config
-            for target in sparsity_config.targets or list()
+            target: sparsity_config for target in sparsity_config.targets or list()
         }
         sparsity_ignore_list = sparsity_config.ignore or list()
         return sparse_scheme_map, sparsity_ignore_list
 
     @classmethod
     def _quantization_scheme_map_from_config(
-            cls, config: dict[str, Any]) -> QUANTIZATION_SCHEME_MAP_TYPE:
+        cls, config: dict[str, Any]
+    ) -> QUANTIZATION_SCHEME_MAP_TYPE:
         """
         :param config: The `quantization_config` dictionary from config.json
         :return: A dictionary mapping target layer names to their corresponding
@@ -207,19 +228,19 @@ def _quantization_scheme_map_from_config(
             targets = quant_config.get("targets")
             for target in targets:
                 target_scheme_map[target] = {}
-                target_scheme_map[target][
-                    "weights"] = QuantizationArgs.model_validate(
-                        quant_config.get("weights"))
+                target_scheme_map[target]["weights"] = QuantizationArgs.model_validate(
+                    quant_config.get("weights")
+                )
 
                 target_scheme_map[target]["input_activations"] = None
-                target_scheme_map[target]["format"] = quant_config.get(
-                    "format")
+                target_scheme_map[target]["format"] = quant_config.get("format")
                 format = target_scheme_map[target].get("format")
                 # If no per-config format defined, use global format in config
-                act_quant_format = is_activation_quantization_format(
-                    format
-                ) if format is not None else is_activation_quantization_format(
-                    quant_format)
+                act_quant_format = (
+                    is_activation_quantization_format(format)
+                    if format is not None
+                    else is_activation_quantization_format(quant_format)
+                )
                 # TODO(czhu): w4a8fp8 is in packed-quantized format
                 # but needs input activation quantization
                 input_activations = quant_config.get("input_activations")
@@ -229,22 +250,25 @@ def _quantization_scheme_map_from_config(
                     # should be w8a16fp8 w8a16fp8 can also run for cases where
                     # there is an input_quant but it is ignored
                     if not input_activations:
-                        assert target_scheme_map[target][
-                            "weights"].type == QuantizationType.FLOAT
+                        assert (
+                            target_scheme_map[target]["weights"].type
+                            == QuantizationType.FLOAT
+                        )
                     else:
-                        target_scheme_map[target][
-                            "input_activations"] = QuantizationArgs.model_validate(  # noqa: E501
-                                quant_config.get("input_activations"))
+                        target_scheme_map[target]["input_activations"] = (
+                            QuantizationArgs.model_validate(  # noqa: E501
+                                quant_config.get("input_activations")
+                            )
+                        )
         return target_scheme_map
 
     @classmethod
     def get_config_filenames(cls) -> list[str]:
         return []
 
-    def _check_scheme_supported(self,
-                                min_capability: int,
-                                error: bool = True,
-                                match_exact: bool = False) -> bool:
+    def _check_scheme_supported(
+        self, min_capability: int, error: bool = True, match_exact: bool = False
+    ) -> bool:
         capability_tuple = current_platform.get_device_capability()
 
         if capability_tuple is not None:
@@ -255,115 +279,155 @@ def _check_scheme_supported(self,
                     raise RuntimeError(
                         "Quantization scheme is not supported for ",
                         "the current GPU. Required capability: ",
-                        f"{min_capability}. Current capability: {capability}.")
+                        f"{min_capability}. Current capability: {capability}.",
+                    )
             else:
                 supported = capability >= min_capability
                 if error and not supported:
                     raise RuntimeError(
                         "Quantization scheme is not supported for ",
                         f"the current GPU. Min capability: {min_capability}. ",
-                        f"Current capability: {capability}.")
+                        f"Current capability: {capability}.",
+                    )
             return supported
         else:
             return False
 
-    def _is_fp4a4_nvfp4(self, weight_quant: QuantizationArgs,
-                        input_quant: QuantizationArgs):
-
+    def _is_fp4a4_nvfp4(
+        self, weight_quant: QuantizationArgs, input_quant: QuantizationArgs
+    ):
         if weight_quant is None or input_quant is None:
             return False
 
-        is_tensor_group_quant = (weight_quant.strategy
-                                 == QuantizationStrategy.TENSOR_GROUP.value
-                                 and input_quant.strategy
-                                 == QuantizationStrategy.TENSOR_GROUP.value)
+        is_tensor_group_quant = (
+            weight_quant.strategy == QuantizationStrategy.TENSOR_GROUP.value
+            and input_quant.strategy == QuantizationStrategy.TENSOR_GROUP.value
+        )
         is_symmetric = weight_quant.symmetric and input_quant.symmetric
 
-        is_group_size_16 = (weight_quant.group_size == 16
-                            and input_quant.group_size == 16)
-        is_float_type = (weight_quant.type == QuantizationType.FLOAT
-                         and input_quant.type == QuantizationType.FLOAT.value)
+        is_group_size_16 = (
+            weight_quant.group_size == 16 and input_quant.group_size == 16
+        )
+        is_float_type = (
+            weight_quant.type == QuantizationType.FLOAT
+            and input_quant.type == QuantizationType.FLOAT.value
+        )
         is_4_bits = weight_quant.num_bits == 4 and input_quant.num_bits == 4
 
-        return (is_tensor_group_quant and is_float_type and is_4_bits
-                and is_group_size_16 and is_symmetric)
-
-    def _is_fp4a16_nvfp4(self, weight_quant: QuantizationArgs,
-                         input_quant: QuantizationArgs):
+        return (
+            is_tensor_group_quant
+            and is_float_type
+            and is_4_bits
+            and is_group_size_16
+            and is_symmetric
+        )
 
+    def _is_fp4a16_nvfp4(
+        self, weight_quant: QuantizationArgs, input_quant: QuantizationArgs
+    ):
         is_weight_only = weight_quant is not None and input_quant is None
         is_tensor_group_quant = (
-            weight_quant.strategy == QuantizationStrategy.TENSOR_GROUP.value)
+            weight_quant.strategy == QuantizationStrategy.TENSOR_GROUP.value
+        )
         is_symmetric = weight_quant.symmetric
 
         is_group_size_16 = weight_quant.group_size == 16
         is_float_type = weight_quant.type == QuantizationType.FLOAT
         is_4_bits = weight_quant.num_bits == 4
 
-        return (is_weight_only and is_tensor_group_quant and is_float_type
-                and is_4_bits and is_group_size_16 and is_symmetric)
+        return (
+            is_weight_only
+            and is_tensor_group_quant
+            and is_float_type
+            and is_4_bits
+            and is_group_size_16
+            and is_symmetric
+        )
 
-    def _is_static_tensor_w8a8(self, weight_quant: QuantizationArgs,
-                               input_quant: QuantizationArgs) -> bool:
+    def _is_static_tensor_w8a8(
+        self, weight_quant: QuantizationArgs, input_quant: QuantizationArgs
+    ) -> bool:
         is_8_bits = weight_quant.num_bits == input_quant.num_bits == 8
         weight_strategy = (
             weight_quant.strategy == QuantizationStrategy.TENSOR.value
-            or weight_quant.strategy == QuantizationStrategy.CHANNEL.value)
-        is_tensor = (weight_strategy and input_quant.strategy
-                     == QuantizationStrategy.TENSOR.value)
+            or weight_quant.strategy == QuantizationStrategy.CHANNEL.value
+        )
+        is_tensor = (
+            weight_strategy
+            and input_quant.strategy == QuantizationStrategy.TENSOR.value
+        )
         is_static = not weight_quant.dynamic and not input_quant.dynamic
 
         # Both symmetric and asymmetric input quantization supported.
         # Only symmetric weight quantization supported.
         return is_8_bits and is_tensor and weight_quant.symmetric and is_static
 
-    def _is_dynamic_token_w8a8(self, weight_quant: QuantizationArgs,
-                               input_quant: QuantizationArgs) -> bool:
+    def _is_dynamic_token_w8a8(
+        self, weight_quant: QuantizationArgs, input_quant: QuantizationArgs
+    ) -> bool:
         is_8_bits = weight_quant.num_bits == input_quant.num_bits == 8
         weight_strategy = (
             weight_quant.strategy == QuantizationStrategy.TENSOR.value
-            or weight_quant.strategy == QuantizationStrategy.CHANNEL.value)
-        is_token = (weight_strategy and input_quant.strategy
-                    == QuantizationStrategy.TOKEN.value)
+            or weight_quant.strategy == QuantizationStrategy.CHANNEL.value
+        )
+        is_token = (
+            weight_strategy and input_quant.strategy == QuantizationStrategy.TOKEN.value
+        )
         is_dynamic = not weight_quant.dynamic and input_quant.dynamic
 
         # Both symmetric and asymmetric input quantization supported.
         # Only symmetric weight quantization supported.
         return is_8_bits and is_token and weight_quant.symmetric and is_dynamic
 
-    def _is_dynamic_token_w4a8_int(self, weight_quant: QuantizationArgs,
-                                   input_quant: QuantizationArgs) -> bool:
+    def _is_dynamic_token_w4a8_int(
+        self, weight_quant: QuantizationArgs, input_quant: QuantizationArgs
+    ) -> bool:
         is_weight_4_bits = weight_quant.num_bits == 4
         is_activation_8_bits = input_quant.num_bits == 8
         weight_strategy = (
             weight_quant.strategy == QuantizationStrategy.GROUP.value
-            or weight_quant.strategy == QuantizationStrategy.CHANNEL.value)
-        is_token = (weight_strategy and input_quant.strategy
-                    == QuantizationStrategy.TOKEN.value)
+            or weight_quant.strategy == QuantizationStrategy.CHANNEL.value
+        )
+        is_token = (
+            weight_strategy and input_quant.strategy == QuantizationStrategy.TOKEN.value
+        )
         is_dynamic = not weight_quant.dynamic and input_quant.dynamic
 
         # Both symmetric and asymmetric input quantization supported.
         # Only symmetric weight quantization supported.
-        return (is_weight_4_bits and is_activation_8_bits and is_token
-                and weight_quant.symmetric and is_dynamic)
+        return (
+            is_weight_4_bits
+            and is_activation_8_bits
+            and is_token
+            and weight_quant.symmetric
+            and is_dynamic
+        )
 
-    def _is_fp8_w8a8(self, weight_quant: QuantizationArgs,
-                     input_quant: QuantizationArgs) -> bool:
+    def _is_fp8_w8a8(
+        self, weight_quant: QuantizationArgs, input_quant: QuantizationArgs
+    ) -> bool:
         # Confirm weights and activations quantized.
         if weight_quant is None or input_quant is None:
             return False
 
         # Confirm weight scheme is supported.
-        is_floating_point = (weight_quant.type == QuantizationType.FLOAT
-                             and input_quant.type == QuantizationType.FLOAT)
+        is_floating_point = (
+            weight_quant.type == QuantizationType.FLOAT
+            and input_quant.type == QuantizationType.FLOAT
+        )
         is_symmetric_weight = weight_quant.symmetric
         is_static_weight = not weight_quant.dynamic
-        is_tensor_or_channel_or_block_weight = (weight_quant.strategy in [
-            QuantizationStrategy.TENSOR, QuantizationStrategy.CHANNEL,
-            QuantizationStrategy.BLOCK
-        ])
-        if not (is_floating_point and is_symmetric_weight and is_static_weight
-                and is_tensor_or_channel_or_block_weight):
+        is_tensor_or_channel_or_block_weight = weight_quant.strategy in [
+            QuantizationStrategy.TENSOR,
+            QuantizationStrategy.CHANNEL,
+            QuantizationStrategy.BLOCK,
+        ]
+        if not (
+            is_floating_point
+            and is_symmetric_weight
+            and is_static_weight
+            and is_tensor_or_channel_or_block_weight
+        ):
             return False
 
         # Dynamic quantization is always supported if weights supported.
@@ -372,45 +436,56 @@ def _is_fp8_w8a8(self, weight_quant: QuantizationArgs,
 
         # Confirm activation scheme is supported.
         is_symmetric_activation = input_quant.symmetric
-        is_per_tensor_activation = (
-            input_quant.strategy == QuantizationStrategy.TENSOR)
+        is_per_tensor_activation = input_quant.strategy == QuantizationStrategy.TENSOR
         return is_symmetric_activation and is_per_tensor_activation
 
-    def _is_fp8_w4a8(self, weight_quant: QuantizationArgs,
-                     input_quant: QuantizationArgs) -> bool:
+    def _is_fp8_w4a8(
+        self, weight_quant: QuantizationArgs, input_quant: QuantizationArgs
+    ) -> bool:
         if not weight_quant or not input_quant:
             return False
         is_weight_4_bits = weight_quant.num_bits == 4
         is_activation_8_bits = input_quant.num_bits == 8
-        weight_strategy = (
-            weight_quant.strategy == QuantizationStrategy.GROUP.value)
-        is_token = (weight_strategy and input_quant.strategy
-                    == QuantizationStrategy.TOKEN.value)
+        weight_strategy = weight_quant.strategy == QuantizationStrategy.GROUP.value
+        is_token = (
+            weight_strategy and input_quant.strategy == QuantizationStrategy.TOKEN.value
+        )
         is_dynamic = not weight_quant.dynamic and input_quant.dynamic
         is_symmetric = weight_quant.symmetric and input_quant.symmetric
         # Only per-group symmetric weight (4bit)
         # + per-tok symmetric activation (8bit) quantization supported.
-        return (is_weight_4_bits and is_activation_8_bits and is_token
-                and is_symmetric and is_dynamic)
-
-    def _is_fp8_w4a8_sm90(self, weight_quant: QuantizationArgs,
-                          input_quant: QuantizationArgs) -> bool:
-        return (self._check_scheme_supported(90, error=False, match_exact=True)
-                and self._is_fp8_w4a8(weight_quant, input_quant))
-
-    def _is_fp8_w8a8_sm90(self, weight_quant: QuantizationArgs,
-                          input_quant: QuantizationArgs) -> bool:
-        return (self._check_scheme_supported(90, error=False, match_exact=True)
-                and self._is_fp8_w8a8(weight_quant, input_quant))
-
-    def _is_fp8_w8a8_sm100(self, weight_quant: QuantizationArgs,
-                           input_quant: QuantizationArgs) -> bool:
-        return (self._check_scheme_supported(
-            100, error=False, match_exact=True)
-                and self._is_fp8_w8a8(weight_quant, input_quant))
-
-    def _is_fp8_w8a16(self, weight_quant: QuantizationArgs,
-                      input_quant: QuantizationArgs) -> bool:
+        return (
+            is_weight_4_bits
+            and is_activation_8_bits
+            and is_token
+            and is_symmetric
+            and is_dynamic
+        )
+
+    def _is_fp8_w4a8_sm90(
+        self, weight_quant: QuantizationArgs, input_quant: QuantizationArgs
+    ) -> bool:
+        return self._check_scheme_supported(
+            90, error=False, match_exact=True
+        ) and self._is_fp8_w4a8(weight_quant, input_quant)
+
+    def _is_fp8_w8a8_sm90(
+        self, weight_quant: QuantizationArgs, input_quant: QuantizationArgs
+    ) -> bool:
+        return self._check_scheme_supported(
+            90, error=False, match_exact=True
+        ) and self._is_fp8_w8a8(weight_quant, input_quant)
+
+    def _is_fp8_w8a8_sm100(
+        self, weight_quant: QuantizationArgs, input_quant: QuantizationArgs
+    ) -> bool:
+        return self._check_scheme_supported(
+            100, error=False, match_exact=True
+        ) and self._is_fp8_w8a8(weight_quant, input_quant)
+
+    def _is_fp8_w8a16(
+        self, weight_quant: QuantizationArgs, input_quant: QuantizationArgs
+    ) -> bool:
         # Confirm weights quantized.
         if weight_quant is None:
             return False
@@ -422,33 +497,39 @@ def _is_fp8_w8a16(self, weight_quant: QuantizationArgs,
         # Confirm weight scheme is supported.
         is_symmetric_weight = weight_quant.symmetric
         is_static_weight = not weight_quant.dynamic
-        is_tensor_or_channel_or_block_weight = (weight_quant.strategy in [
-            QuantizationStrategy.TENSOR, QuantizationStrategy.CHANNEL,
-            QuantizationStrategy.BLOCK
-        ])
-        if not (is_symmetric_weight and is_static_weight  # noqa: SIM103
-                and is_tensor_or_channel_or_block_weight):
+        is_tensor_or_channel_or_block_weight = weight_quant.strategy in [
+            QuantizationStrategy.TENSOR,
+            QuantizationStrategy.CHANNEL,
+            QuantizationStrategy.BLOCK,
+        ]
+        if not (
+            is_symmetric_weight
+            and is_static_weight  # noqa: SIM103
+            and is_tensor_or_channel_or_block_weight
+        ):
             return False
 
         # All conditions satisfied.
         return True
 
-    def _is_wNa16_group_channel(self, weight_quant: QuantizationArgs,
-                                input_quant: QuantizationArgs) -> bool:
+    def _is_wNa16_group_channel(
+        self, weight_quant: QuantizationArgs, input_quant: QuantizationArgs
+    ) -> bool:
         input_quant_none = input_quant is None
         is_channel_group = (
             weight_quant.strategy == QuantizationStrategy.CHANNEL.value
-            or weight_quant.strategy == QuantizationStrategy.GROUP.value)
+            or weight_quant.strategy == QuantizationStrategy.GROUP.value
+        )
         is_static = not weight_quant.dynamic
 
-        return (is_channel_group and input_quant_none and is_static)
+        return is_channel_group and input_quant_none and is_static
 
     def _get_scheme_from_parts(
-            self,
-            weight_quant: QuantizationArgs,
-            input_quant: QuantizationArgs,
-            format: Optional[str] = None) -> "CompressedTensorsScheme":
-
+        self,
+        weight_quant: QuantizationArgs,
+        input_quant: QuantizationArgs,
+        format: Optional[str] = None,
+    ) -> "CompressedTensorsScheme":
         # use the per-layer format if defined, otherwise, use global format
         format = format if format is not None else self.quant_format
 
@@ -457,94 +538,105 @@ def _get_scheme_from_parts(
             return CompressedTensorsW4A16Fp4()
 
         if self._is_fp8_w4a8_sm90(weight_quant, input_quant):
-            return CompressedTensorsW4A8Fp8(num_bits=weight_quant.num_bits,
-                                            strategy=weight_quant.strategy,
-                                            symmetric=weight_quant.symmetric,
-                                            group_size=weight_quant.group_size,
-                                            actorder=weight_quant.actorder)
+            return CompressedTensorsW4A8Fp8(
+                num_bits=weight_quant.num_bits,
+                strategy=weight_quant.strategy,
+                symmetric=weight_quant.symmetric,
+                group_size=weight_quant.group_size,
+                actorder=weight_quant.actorder,
+            )
 
         if self._is_wNa16_group_channel(weight_quant, input_quant):
-            if (format == CompressionFormat.marlin_24.value
-                    and weight_quant.num_bits in W4A16SPARSE24_SUPPORTED_BITS):
+            if (
+                format == CompressionFormat.marlin_24.value
+                and weight_quant.num_bits in W4A16SPARSE24_SUPPORTED_BITS
+            ):
                 assert weight_quant.symmetric
                 return CompressedTensorsW4A16Sparse24(
                     strategy=weight_quant.strategy,
                     num_bits=weight_quant.num_bits,
-                    group_size=weight_quant.group_size)
-            if (format == CompressionFormat.pack_quantized.value
-                    and weight_quant.num_bits in WNA16_SUPPORTED_BITS):
+                    group_size=weight_quant.group_size,
+                )
+            if (
+                format == CompressionFormat.pack_quantized.value
+                and weight_quant.num_bits in WNA16_SUPPORTED_BITS
+            ):
                 return CompressedTensorsWNA16(
                     num_bits=weight_quant.num_bits,
                     strategy=weight_quant.strategy,
                     symmetric=weight_quant.symmetric,
                     group_size=weight_quant.group_size,
-                    actorder=weight_quant.actorder)
+                    actorder=weight_quant.actorder,
+                )
 
         act_quant_format = is_activation_quantization_format(format)
         if act_quant_format:
             if self._is_fp4a4_nvfp4(weight_quant, input_quant):
-                if cutlass_fp4_supported(
-                ) or envs.VLLM_USE_NVFP4_CT_EMULATIONS:
+                if cutlass_fp4_supported() or envs.VLLM_USE_NVFP4_CT_EMULATIONS:
                     return CompressedTensorsW4A4Fp4()
                 else:
                     logger.warning_once(
                         "Current platform does not support cutlass NVFP4."
-                        " Running CompressedTensorsW4A16Fp4.")
-                    return CompressedTensorsW4A16Fp4(
-                        has_input_global_scale=True)
+                        " Running CompressedTensorsW4A16Fp4."
+                    )
+                    return CompressedTensorsW4A16Fp4(has_input_global_scale=True)
 
             if self._is_fp8_w8a8(weight_quant, input_quant):
                 is_fp8_w8a8_supported = self._check_scheme_supported(
-                    CompressedTensorsW8A8Fp8.get_min_capability(), error=False)
+                    CompressedTensorsW8A8Fp8.get_min_capability(), error=False
+                )
                 if is_fp8_w8a8_supported:
                     return CompressedTensorsW8A8Fp8(
                         weight_quant=weight_quant,
-                        is_static_input_scheme=(input_quant
-                                                and not input_quant.dynamic))
+                        is_static_input_scheme=(
+                            input_quant and not input_quant.dynamic
+                        ),
+                    )
                 else:
                     # note: input_quant will be present for converted models;
                     # will be ignored during inference post loading
                     return CompressedTensorsW8A16Fp8(
                         strategy=weight_quant.strategy,
-                        is_static_input_scheme=not input_quant.dynamic)
+                        is_static_input_scheme=not input_quant.dynamic,
+                    )
 
             # note: input_quant can be None
             if self._is_fp8_w8a16(weight_quant, input_quant):
-                is_static_input_scheme = (input_quant
-                                          and not input_quant.dynamic)
+                is_static_input_scheme = input_quant and not input_quant.dynamic
                 return CompressedTensorsW8A16Fp8(
                     strategy=weight_quant.strategy,
-                    is_static_input_scheme=is_static_input_scheme)
+                    is_static_input_scheme=is_static_input_scheme,
+                )
 
             if self._is_static_tensor_w8a8(weight_quant, input_quant):
                 return CompressedTensorsW8A8Int8(
                     strategy=weight_quant.strategy,
                     is_static_input_scheme=True,
-                    input_symmetric=input_quant.symmetric)
+                    input_symmetric=input_quant.symmetric,
+                )
 
             if self._is_dynamic_token_w8a8(weight_quant, input_quant):
                 return CompressedTensorsW8A8Int8(
                     strategy=weight_quant.strategy,
                     is_static_input_scheme=False,
-                    input_symmetric=input_quant.symmetric)
+                    input_symmetric=input_quant.symmetric,
+                )
 
             if self._is_dynamic_token_w4a8_int(weight_quant, input_quant):
-                is_static_input_scheme = (input_quant
-                                          and not input_quant.dynamic)
+                is_static_input_scheme = input_quant and not input_quant.dynamic
                 return CompressedTensorsW4A8Int(
                     num_bits=weight_quant.num_bits,
                     strategy=weight_quant.strategy,
                     group_size=weight_quant.group_size,
                     is_static_input_scheme=is_static_input_scheme,
-                    input_symmetric=input_quant.symmetric)
+                    input_symmetric=input_quant.symmetric,
+                )
 
-        raise NotImplementedError(
-            "No compressed-tensors compatible scheme was found.")
+        raise NotImplementedError("No compressed-tensors compatible scheme was found.")
 
-    def get_scheme(self,
-                   layer: torch.nn.Module,
-                   layer_name: Optional[str] = None
-                   ) -> Optional["CompressedTensorsScheme"]:
+    def get_scheme(
+        self, layer: torch.nn.Module, layer_name: Optional[str] = None
+    ) -> Optional["CompressedTensorsScheme"]:
         """
         compressed-tensors supports non uniform in the following way:
 
@@ -561,9 +653,9 @@ def get_scheme(self,
         # Find the "target" in the compressed-tensors config
         # that our layer conforms to.
         # TODO (@kylesayrs): support ignore module names with ct matching utils
-        if should_ignore_layer(layer_name,
-                               ignore=self.ignore,
-                               fused_mapping=self.packed_modules_mapping):
+        if should_ignore_layer(
+            layer_name, ignore=self.ignore, fused_mapping=self.packed_modules_mapping
+        ):
             return None
 
         # Will be empty for models with only sparsity
@@ -573,7 +665,8 @@ def get_scheme(self,
                 layer_name=layer_name,
                 module=layer,
                 targets=self.target_scheme_map.keys(),
-                fused_mapping=self.packed_modules_mapping)
+                fused_mapping=self.packed_modules_mapping,
+            )
 
             scheme_dict = self.target_scheme_map[matched_target]
             weight_quant = scheme_dict.get("weights")
@@ -582,25 +675,31 @@ def get_scheme(self,
 
         # Find the sparsity scheme of the layer
         # assume that fused layers inherit first component's sparsity scheme
-        sparsity_targets = (self.sparsity_scheme_map.keys() -
-                            set(self.sparsity_ignore_list))
+        sparsity_targets = self.sparsity_scheme_map.keys() - set(
+            self.sparsity_ignore_list
+        )
         sparsity_scheme: Optional[SparsityCompressionConfig] = None
         with suppress(ValueError):
             matched_target = find_matched_target(
                 layer_name=layer_name,
                 module=layer,
                 targets=sparsity_targets,
-                fused_mapping=self.packed_modules_mapping)
+                fused_mapping=self.packed_modules_mapping,
+            )
             sparsity_scheme = self.sparsity_scheme_map[matched_target]
 
-        if self.supports_cutlass_24(weight_quant=weight_quant,
-                                    input_quant=input_quant,
-                                    sparsity_scheme=sparsity_scheme):
+        if self.supports_cutlass_24(
+            weight_quant=weight_quant,
+            input_quant=input_quant,
+            sparsity_scheme=sparsity_scheme,
+        ):
             # Have a valid sparsity scheme
             # Validate layer is supported by Cutlass 2:4 Kernel
-            model_compression_config = (None if sparsity_scheme is None
-                                        or sparsity_scheme.format == "dense"
-                                        else self.config)
+            model_compression_config = (
+                None
+                if sparsity_scheme is None or sparsity_scheme.format == "dense"
+                else self.config
+            )
 
             scheme = CompressedTensors24(
                 quantized=weight_quant is not None or input_quant is not None,
@@ -609,23 +708,23 @@ def get_scheme(self,
                 model_compression_config=model_compression_config,
             )
         elif weight_quant is None:
-            logger.warning_once("Acceleration for non-quantized schemes is "
-                                "not supported by Compressed Tensors. "
-                                "Falling back to UnquantizedLinearMethod")
+            logger.warning_once(
+                "Acceleration for non-quantized schemes is "
+                "not supported by Compressed Tensors. "
+                "Falling back to UnquantizedLinearMethod"
+            )
             return None
 
         else:
             # Find the quant_scheme
             scheme = self._get_scheme_from_parts(  # type: ignore
-                weight_quant=weight_quant,
-                input_quant=input_quant,
-                format=format)
+                weight_quant=weight_quant, input_quant=input_quant, format=format
+            )
 
         # Raise error if device does not support the scheme
         # (e.g. fp8 needs ada lovelace)
         self._check_scheme_supported(scheme.get_min_capability())
-        logger.debug("Using scheme: %s for %s", scheme.__class__.__name__,
-                     layer_name)
+        logger.debug("Using scheme: %s for %s", scheme.__class__.__name__, layer_name)
         return scheme
 
     def get_cache_scale(self, name: str) -> Optional[str]:
@@ -647,16 +746,18 @@ def get_cache_scale(self, name: str) -> Optional[str]:
     def has_blocked_weights(self) -> bool:
         for scheme in self.target_scheme_map.values():
             weight_quant = scheme.get("weights")
-            if (weight_quant is not None
-                    and weight_quant.strategy == QuantizationStrategy.BLOCK):
+            if (
+                weight_quant is not None
+                and weight_quant.strategy == QuantizationStrategy.BLOCK
+            ):
                 return True
         return False
 
     @staticmethod
     def supports_cutlass_24(
-            weight_quant: Optional[QuantizationArgs],
-            input_quant: Optional[QuantizationArgs],
-            sparsity_scheme: Optional[SparsityCompressionConfig] = None
+        weight_quant: Optional[QuantizationArgs],
+        input_quant: Optional[QuantizationArgs],
+        sparsity_scheme: Optional[SparsityCompressionConfig] = None,
     ) -> bool:
         """
         Check if the layer is supported by the Cutlass 2:4 Kernel
@@ -666,7 +767,7 @@ def supports_cutlass_24(
             - Weight only quantization is not-supported
             - Supported weight quantization strategies are TENSOR and CHANNEL
             - Supported input quantization strategies are TENSOR and TOKEN
-            - Only 8 bit quantization is supported 
+            - Only 8 bit quantization is supported
 
         :return: True if the layer is supported by the Cutlass 2:4 Kernel
             False otherwise
@@ -675,16 +776,17 @@ def supports_cutlass_24(
             return False
 
         is_valid_sparsity_structure: bool = (
-            sparsity_scheme.sparsity_structure ==
-            SparsityStructure.TWO_FOUR.value)
+            sparsity_scheme.sparsity_structure == SparsityStructure.TWO_FOUR.value
+        )
 
         valid_compressors = {
             CompressionFormat.dense.value,
-            CompressionFormat.sparse_24_bitmask.value
+            CompressionFormat.sparse_24_bitmask.value,
         }
 
-        is_valid_sparsity = (is_valid_sparsity_structure
-                             and sparsity_scheme.format in valid_compressors)
+        is_valid_sparsity = (
+            is_valid_sparsity_structure and sparsity_scheme.format in valid_compressors
+        )
 
         if not is_valid_sparsity:
             return False
@@ -699,7 +801,7 @@ def supports_cutlass_24(
 
         supported_weight_quant_strategies = [
             QuantizationStrategy.TENSOR.value,
-            QuantizationStrategy.CHANNEL.value
+            QuantizationStrategy.CHANNEL.value,
         ]
 
         assert weight_quant is not None
@@ -708,7 +810,8 @@ def supports_cutlass_24(
             return False
 
         supported_input_quant_strategies = [
-            QuantizationStrategy.TENSOR.value, QuantizationStrategy.TOKEN.value
+            QuantizationStrategy.TENSOR.value,
+            QuantizationStrategy.TOKEN.value,
         ]
 
         if input_quant.strategy not in supported_input_quant_strategies:
@@ -718,18 +821,22 @@ def supports_cutlass_24(
 
 
 class CompressedTensorsLinearMethod(LinearMethodBase):
-
     def __init__(self, quantization_config: CompressedTensorsConfig):
         self.quantization_config = quantization_config
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         layer.scheme.process_weights_after_loading(layer)
 
-    def create_weights(self, layer: torch.nn.Module,
-                       input_size_per_partition: int,
-                       output_partition_sizes: list[int], input_size: int,
-                       output_size: int, params_dtype: torch.dtype,
-                       **extra_weight_attrs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        input_size_per_partition: int,
+        output_partition_sizes: list[int],
+        input_size: int,
+        output_size: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         """
         Use the CompressedTensorsScheme associated with each layer to create
         the necessary parameters for the layer. See LinearMethodBase for param
@@ -743,12 +850,15 @@ def create_weights(self, layer: torch.nn.Module,
             output_partition_sizes=output_partition_sizes,
             output_size=output_size,
             params_dtype=params_dtype,
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
 
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None):
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ):
         """
         Use the output of create_weights and the CompressedTensorsScheme
         associated with the layer to apply the forward pass with the
@@ -788,18 +898,21 @@ def validate_kv_cache_scheme(kv_cache_scheme: Optional[dict[str, Any]]):
             raise NotImplementedError(
                 "Currently supported kv cache quantization is "
                 "num_bits=8, type=float, however "
-                f"received num_bits={num_bits}, type={type_}")
+                f"received num_bits={num_bits}, type={type_}"
+            )
 
         strategy = kv_cache_scheme.get("strategy")
         if strategy != "tensor":
             raise NotImplementedError(
                 "Only support per-tensor scaling factor "
                 "for compressed-tensors KV cache. "
-                f"Expected strategy: tensor, found strategy: {strategy}")
+                f"Expected strategy: tensor, found strategy: {strategy}"
+            )
 
         is_symmetric = kv_cache_scheme.get("symmetric")
         if not is_symmetric:
             raise NotImplementedError(
                 "Only support symmetric scaling factor "
                 "for compressed-tensors KV cache. "
-                f"However found symmetric: {is_symmetric}")
+                f"However found symmetric: {is_symmetric}"
+            )
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
index 8504ba73defb..41e7f1c7a499 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
@@ -7,8 +7,7 @@
 
 import torch
 from compressed_tensors import CompressionFormat
-from compressed_tensors.quantization import (ActivationOrdering,
-                                             QuantizationStrategy)
+from compressed_tensors.quantization import ActivationOrdering, QuantizationStrategy
 
 import vllm.envs as envs
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
@@ -16,41 +15,66 @@
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe import (
-    FusedMoE, FusedMoEActivationFormat, FusedMoEConfig, FusedMoEMethodBase,
-    FusedMoEPermuteExpertsUnpermute, FusedMoeWeightScaleSupported)
+    FusedMoE,
+    FusedMoEActivationFormat,
+    FusedMoEConfig,
+    FusedMoEMethodBase,
+    FusedMoEPermuteExpertsUnpermute,
+    FusedMoeWeightScaleSupported,
+)
 from vllm.model_executor.layers.fused_moe.config import (
-    FusedMoEQuantConfig, fp8_w8a8_moe_quant_config,
-    int4_w4a16_moe_quant_config, int8_w8a8_moe_quant_config,
-    int8_w8a16_moe_quant_config, nvfp4_moe_quant_config)
+    FusedMoEQuantConfig,
+    fp8_w8a8_moe_quant_config,
+    int4_w4a16_moe_quant_config,
+    int8_w8a8_moe_quant_config,
+    int8_w8a16_moe_quant_config,
+    nvfp4_moe_quant_config,
+)
 from vllm.model_executor.layers.fused_moe.cpu_fused_moe import select_experts
 from vllm.model_executor.layers.fused_moe.flashinfer_cutlass_moe import (
-    is_valid_flashinfer_cutlass_fused_moe)
+    is_valid_flashinfer_cutlass_fused_moe,
+)
 from vllm.model_executor.layers.quantization.compressed_tensors.schemes.compressed_tensors_wNa16 import (  # noqa
-    WNA16_SUPPORTED_BITS, WNA16_SUPPORTED_TYPES_MAP)
+    WNA16_SUPPORTED_BITS,
+    WNA16_SUPPORTED_TYPES_MAP,
+)
 from vllm.model_executor.layers.quantization.compressed_tensors.utils import (
-    find_matched_target)
+    find_matched_target,
+)
 from vllm.model_executor.layers.quantization.utils import replace_parameter
 from vllm.model_executor.layers.quantization.utils.flashinfer_fp4_moe import (
-    build_flashinfer_fp4_cutlass_moe_prepare_finalize, reorder_w1w3_to_w3w1,
-    select_nvfp4_gemm_impl)
+    build_flashinfer_fp4_cutlass_moe_prepare_finalize,
+    reorder_w1w3_to_w3w1,
+    select_nvfp4_gemm_impl,
+)
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    expert_weight_is_col_major, requant_weight_ue8m0_inplace)
+    expert_weight_is_col_major,
+    requant_weight_ue8m0_inplace,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-    check_moe_marlin_supports_layer, marlin_make_workspace_new,
-    marlin_moe_permute_scales)
+    check_moe_marlin_supports_layer,
+    marlin_make_workspace_new,
+    marlin_moe_permute_scales,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp4 import (
-    prepare_moe_fp4_layer_for_marlin)
+    prepare_moe_fp4_layer_for_marlin,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp8 import (
-    prepare_moe_fp8_layer_for_marlin)
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    swizzle_blockscale)
+    prepare_moe_fp8_layer_for_marlin,
+)
+from vllm.model_executor.layers.quantization.utils.quant_utils import swizzle_blockscale
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    all_close_1d, normalize_e4m3fn_to_e4m3fnuz, per_tensor_dequantize)
+    all_close_1d,
+    normalize_e4m3fn_to_e4m3fnuz,
+    per_tensor_dequantize,
+)
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.platforms import CpuArchEnum, current_platform
 from vllm.scalar_type import scalar_types
-from vllm.utils.deep_gemm import (get_col_major_tma_aligned_tensor,
-                                  is_deep_gemm_e8m0_used)
+from vllm.utils.deep_gemm import (
+    get_col_major_tma_aligned_tensor,
+    is_deep_gemm_e8m0_used,
+)
 
 logger = init_logger(__name__)
 
@@ -61,22 +85,24 @@ class GPTQMarlinState(Enum):
 
 
 __all__ = [
-    "CompressedTensorsMoEMethod", "CompressedTensorsW8A8Fp8MoEMethod",
+    "CompressedTensorsMoEMethod",
+    "CompressedTensorsW8A8Fp8MoEMethod",
     "CompressedTensorsW8A8Int8MoEMethod",
-    "CompressedTensorsWNA16MarlinMoEMethod", "CompressedTensorsWNA16MoEMethod",
-    "CompressedTensorsW4A4MoeMethod", "CompressedTensorsW4A8Int8MoEMethod"
+    "CompressedTensorsWNA16MarlinMoEMethod",
+    "CompressedTensorsWNA16MoEMethod",
+    "CompressedTensorsW4A4MoeMethod",
+    "CompressedTensorsW4A8Int8MoEMethod",
 ]
 
 
 class CompressedTensorsMoEMethod(FusedMoEMethodBase):
-
     def __init_(self, moe: FusedMoEConfig):
         super().__init__(moe)
 
     @staticmethod
     def get_moe_method(
         quant_config: "CompressedTensorsConfig",  # type: ignore # noqa E501
-        layer: torch.nn.Module
+        layer: torch.nn.Module,
     ) -> "CompressedTensorsMoEMethod":
         # TODO: @dsikka: refactor this to use schemes as other kernels
         # are supported + check if the layer is being ignored.
@@ -86,9 +112,7 @@ def get_moe_method(
         else:
             # May have instead defined the linear layers in the fused model
 
-            fused_layers = [
-                "re:.*down_proj.*", "re:.*gate_proj.*", "re:.*up_proj.*"
-            ]
+            fused_layers = ["re:.*down_proj.*", "re:.*gate_proj.*", "re:.*up_proj.*"]
             current_scheme = None
             for fused_layer in fused_layers:
                 # Check if one of the fused layers are defined in quant_config
@@ -96,64 +120,67 @@ def get_moe_method(
                     layer_name=fused_layer,
                     module=layer,
                     targets=quant_config.target_scheme_map.keys(),
-                    fused_mapping=quant_config.packed_modules_mapping)
+                    fused_mapping=quant_config.packed_modules_mapping,
+                )
 
                 # Only valid if down_proj, gate_proj, and up_proj
                 # are mapped to the same quant scheme in the quant_config
                 if current_scheme is None:
-                    current_scheme = quant_config.target_scheme_map.get(
-                        matched_target)
+                    current_scheme = quant_config.target_scheme_map.get(matched_target)
                 else:
                     assert current_scheme == quant_config.target_scheme_map.get(
-                        matched_target)
+                        matched_target
+                    )
 
-        weight_quant = quant_config.target_scheme_map[matched_target].get(
-            "weights")
+        weight_quant = quant_config.target_scheme_map[matched_target].get("weights")
         input_quant = quant_config.target_scheme_map[matched_target].get(
-            "input_activations")
+            "input_activations"
+        )
 
         if quant_config._is_wNa16_group_channel(weight_quant, input_quant):
             # group_size=None means channelwise
             group_size = weight_quant.group_size or -1
             # Prefer to use the MarlinMoE kernel when it is supported.
             if not check_moe_marlin_supports_layer(layer, group_size):
-                if (weight_quant.strategy in QuantizationStrategy.GROUP and
-                        weight_quant.actorder in (ActivationOrdering.GROUP,
-                                                  ActivationOrdering.DYNAMIC)):
+                if (
+                    weight_quant.strategy in QuantizationStrategy.GROUP
+                    and weight_quant.actorder
+                    in (ActivationOrdering.GROUP, ActivationOrdering.DYNAMIC)
+                ):
                     raise ValueError(
                         "WNA16MoE is not supported with actorder=group/dynamic."
                     )
                 logger.info_once("Using CompressedTensorsWNA16MoEMethod")
-                return CompressedTensorsWNA16MoEMethod(quant_config,
-                                                       layer.moe_config)
+                return CompressedTensorsWNA16MoEMethod(quant_config, layer.moe_config)
             else:
                 logger.info_once("Using CompressedTensorsWNA16MarlinMoEMethod")
                 return CompressedTensorsWNA16MarlinMoEMethod(
-                    quant_config, layer.moe_config)
+                    quant_config, layer.moe_config
+                )
         elif quant_config._is_fp4a4_nvfp4(weight_quant, input_quant):
             return CompressedTensorsW4A4MoeMethod(layer.moe_config)
-        elif (quant_config._is_fp8_w8a8_sm90(weight_quant, input_quant)
-              or quant_config._is_fp8_w8a8_sm100(weight_quant, input_quant)
-              or quant_config._is_fp8_w8a8(weight_quant, input_quant)):
-            return CompressedTensorsW8A8Fp8MoEMethod(quant_config,
-                                                     layer.moe_config)
+        elif (
+            quant_config._is_fp8_w8a8_sm90(weight_quant, input_quant)
+            or quant_config._is_fp8_w8a8_sm100(weight_quant, input_quant)
+            or quant_config._is_fp8_w8a8(weight_quant, input_quant)
+        ):
+            return CompressedTensorsW8A8Fp8MoEMethod(quant_config, layer.moe_config)
         elif quant_config._is_dynamic_token_w8a8(weight_quant, input_quant):
-            return CompressedTensorsW8A8Int8MoEMethod(quant_config,
-                                                      layer.moe_config)
-        elif quant_config._is_dynamic_token_w4a8_int(weight_quant,
-                                                     input_quant):
-            return CompressedTensorsW4A8Int8MoEMethod(quant_config,
-                                                      layer.moe_config)
+            return CompressedTensorsW8A8Int8MoEMethod(quant_config, layer.moe_config)
+        elif quant_config._is_dynamic_token_w4a8_int(weight_quant, input_quant):
+            return CompressedTensorsW4A8Int8MoEMethod(quant_config, layer.moe_config)
         else:
             raise RuntimeError(
-                f"Unsupported FusedMoe scheme: {weight_quant}, {input_quant}")
+                f"Unsupported FusedMoe scheme: {weight_quant}, {input_quant}"
+            )
 
 
 class CompressedTensorsW4A4MoeMethod(CompressedTensorsMoEMethod):
-
     def __init__(self, moe: FusedMoEConfig):
         from vllm.model_executor.layers.quantization.utils.nvfp4_moe_support import (  # noqa: E501
-            detect_nvfp4_moe_support)
+            detect_nvfp4_moe_support,
+        )
+
         super().__init__(moe)
         _nvfp4 = detect_nvfp4_moe_support(self.__class__.__name__)
         self.cutlass_nvfp4_supported = _nvfp4.cutlass_supported
@@ -161,10 +188,15 @@ def __init__(self, moe: FusedMoEConfig):
         self.use_marlin = _nvfp4.use_marlin
         self.group_size = 16
 
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
-
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         layer.num_experts = num_experts
         layer.params_dtype = params_dtype
 
@@ -175,8 +207,10 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
                 # 2 fp4 items are packed in the input dimension
                 hidden_size // 2,
                 requires_grad=False,
-                dtype=torch.uint8),
-            requires_grad=False)
+                dtype=torch.uint8,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_weight_packed", w13_weight)
         set_weight_attrs(w13_weight, extra_weight_attrs)
 
@@ -186,8 +220,10 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
                 hidden_size,
                 # 2 fp4 items are packed in the input dimension
                 intermediate_size_per_partition // 2,
-                dtype=torch.uint8),
-            requires_grad=False)
+                dtype=torch.uint8,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_weight_packed", w2_weight)
         set_weight_attrs(w2_weight, extra_weight_attrs)
 
@@ -198,11 +234,14 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
                 2 * intermediate_size_per_partition,
                 # 2 fp4 items are packed in the input dimension
                 hidden_size // self.group_size,
-                dtype=torch.float8_e4m3fn),
-            requires_grad=False)
+                dtype=torch.float8_e4m3fn,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_weight_scale", w13_weight_scale)
         extra_weight_attrs.update(
-            {"quant_method": FusedMoeWeightScaleSupported.GROUP.value})
+            {"quant_method": FusedMoeWeightScaleSupported.GROUP.value}
+        )
         set_weight_attrs(w13_weight_scale, extra_weight_attrs)
 
         w2_weight_scale = torch.nn.Parameter(
@@ -211,120 +250,135 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
                 hidden_size,
                 # 2 fp4 items are packed in the input dimension
                 intermediate_size_per_partition // self.group_size,
-                dtype=torch.float8_e4m3fn),
-            requires_grad=False)
+                dtype=torch.float8_e4m3fn,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_weight_scale", w2_weight_scale)
         extra_weight_attrs.update(
-            {"quant_method": FusedMoeWeightScaleSupported.GROUP.value})
+            {"quant_method": FusedMoeWeightScaleSupported.GROUP.value}
+        )
         set_weight_attrs(w2_weight_scale, extra_weight_attrs)
 
         # Weight Global Scales
-        w13_weight_scale_2 = torch.nn.Parameter(torch.empty(
-            num_experts, 2, dtype=torch.float32),
-                                                requires_grad=False)
+        w13_weight_scale_2 = torch.nn.Parameter(
+            torch.empty(num_experts, 2, dtype=torch.float32), requires_grad=False
+        )
         layer.register_parameter("w13_weight_global_scale", w13_weight_scale_2)
         extra_weight_attrs.update(
-            {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value})
+            {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value}
+        )
         set_weight_attrs(w13_weight_scale_2, extra_weight_attrs)
 
-        w2_weight_scale_2 = torch.nn.Parameter(torch.empty(
-            num_experts, dtype=torch.float32),
-                                               requires_grad=False)
+        w2_weight_scale_2 = torch.nn.Parameter(
+            torch.empty(num_experts, dtype=torch.float32), requires_grad=False
+        )
         layer.register_parameter("w2_weight_global_scale", w2_weight_scale_2)
         extra_weight_attrs.update(
-            {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value})
+            {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value}
+        )
         set_weight_attrs(w2_weight_scale_2, extra_weight_attrs)
 
         # Input Global Scales
-        w13_input_scale = torch.nn.Parameter(torch.empty(num_experts,
-                                                         2,
-                                                         dtype=torch.float32),
-                                             requires_grad=False)
+        w13_input_scale = torch.nn.Parameter(
+            torch.empty(num_experts, 2, dtype=torch.float32), requires_grad=False
+        )
         layer.register_parameter("w13_input_global_scale", w13_input_scale)
         extra_weight_attrs.update(
-            {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value})
+            {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value}
+        )
         set_weight_attrs(w13_input_scale, extra_weight_attrs)
 
-        w2_input_scale = torch.nn.Parameter(torch.empty(num_experts,
-                                                        dtype=torch.float32),
-                                            requires_grad=False)
+        w2_input_scale = torch.nn.Parameter(
+            torch.empty(num_experts, dtype=torch.float32), requires_grad=False
+        )
         layer.register_parameter("w2_input_global_scale", w2_input_scale)
         extra_weight_attrs.update(
-            {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value})
+            {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value}
+        )
         set_weight_attrs(w2_input_scale, extra_weight_attrs)
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
-
         # From packed to weight
-        layer.w13_weight = torch.nn.Parameter(layer.w13_weight_packed.data,
-                                              requires_grad=False)
+        layer.w13_weight = torch.nn.Parameter(
+            layer.w13_weight_packed.data, requires_grad=False
+        )
 
-        layer.w2_weight = torch.nn.Parameter(layer.w2_weight_packed.data,
-                                             requires_grad=False)
+        layer.w2_weight = torch.nn.Parameter(
+            layer.w2_weight_packed.data, requires_grad=False
+        )
 
         # reorder GEMM1 weights and block scales for FlashInfer CUTLASS kernel.
         if self.allow_flashinfer:
-            w, s = reorder_w1w3_to_w3w1(layer.w13_weight.data,
-                                        layer.w13_weight_scale.data,
-                                        dim=-2)
+            w, s = reorder_w1w3_to_w3w1(
+                layer.w13_weight.data, layer.w13_weight_scale.data, dim=-2
+            )
             layer.w13_weight = torch.nn.Parameter(w, requires_grad=False)
             layer.w13_weight_scale = torch.nn.Parameter(s, requires_grad=False)
 
-        if not torch.allclose(layer.w13_weight_global_scale[:, 0],
-                              layer.w13_weight_global_scale[:, 1]):
+        if not torch.allclose(
+            layer.w13_weight_global_scale[:, 0], layer.w13_weight_global_scale[:, 1]
+        ):
             logger.warning_once(
                 "w1_weight_global_scale must match w3_weight_global_scale. "
-                "Accuracy may be affected.")
+                "Accuracy may be affected."
+            )
 
         # Take inverse of global scale saved to disk
         layer.w13_weight_scale_2 = torch.nn.Parameter(
-            1 / layer.w13_weight_global_scale[:, 0], requires_grad=False)
+            1 / layer.w13_weight_global_scale[:, 0], requires_grad=False
+        )
 
         layer.w2_weight_scale_2 = torch.nn.Parameter(
-            1 / layer.w2_weight_global_scale.data, requires_grad=False)
+            1 / layer.w2_weight_global_scale.data, requires_grad=False
+        )
 
         if self.use_marlin:
             prepare_moe_fp4_layer_for_marlin(layer)
             return
 
         # swizzle weight scales
-        layer.w13_weight_scale = torch.nn.Parameter(swizzle_blockscale(
-            layer.w13_weight_scale),
-                                                    requires_grad=False)
+        layer.w13_weight_scale = torch.nn.Parameter(
+            swizzle_blockscale(layer.w13_weight_scale), requires_grad=False
+        )
 
-        layer.w2_weight_scale = torch.nn.Parameter(swizzle_blockscale(
-            layer.w2_weight_scale),
-                                                   requires_grad=False)
+        layer.w2_weight_scale = torch.nn.Parameter(
+            swizzle_blockscale(layer.w2_weight_scale), requires_grad=False
+        )
 
         # w13
-        w13_input_global_scale = layer.w13_input_global_scale.max(
-            dim=1).values.to(torch.float32)
+        w13_input_global_scale = layer.w13_input_global_scale.max(dim=1).values.to(
+            torch.float32
+        )
 
         layer.g1_alphas = torch.nn.Parameter(
             ((1 / w13_input_global_scale) * layer.w13_weight_scale_2),
-            requires_grad=False)
+            requires_grad=False,
+        )
 
         layer.w13_input_scale_quant = torch.nn.Parameter(
-            (w13_input_global_scale), requires_grad=False)
+            (w13_input_global_scale), requires_grad=False
+        )
 
         # w2
         layer.g2_alphas = torch.nn.Parameter(
             ((1 / layer.w2_input_global_scale) * layer.w2_weight_scale_2).to(
-                torch.float32),
-            requires_grad=False)
+                torch.float32
+            ),
+            requires_grad=False,
+        )
 
         layer.w2_input_scale_quant = torch.nn.Parameter(
-            (layer.w2_input_global_scale), requires_grad=False)
+            (layer.w2_input_global_scale), requires_grad=False
+        )
 
-    def maybe_make_prepare_finalize(
-            self) -> Optional[mk.FusedMoEPrepareAndFinalize]:
+    def maybe_make_prepare_finalize(self) -> Optional[mk.FusedMoEPrepareAndFinalize]:
         if self.use_marlin:
             return None
         elif not self.allow_flashinfer:
             return super().maybe_make_prepare_finalize()
 
-        prepare_finalize = build_flashinfer_fp4_cutlass_moe_prepare_finalize(
-            self.moe)
+        prepare_finalize = build_flashinfer_fp4_cutlass_moe_prepare_finalize(self.moe)
         logger.debug_once("%s", prepare_finalize.__class__.__name__)
         return prepare_finalize
 
@@ -344,7 +398,8 @@ def select_gemm_impl(
         return experts
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         if self.use_marlin:
             return None
 
@@ -381,8 +436,9 @@ def apply(
         logical_replica_count: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, tuple[torch.Tensor, torch.Tensor]]:
         if enable_eplb:
-            raise NotImplementedError("EPLB not supported for "
-                                      "`CompressedTensorsW4A4MoeMethod` yet.")
+            raise NotImplementedError(
+                "EPLB not supported for `CompressedTensorsW4A4MoeMethod` yet."
+            )
         assert activation == "silu", "Only SiLU activation is supported."
 
         topk_weights, topk_ids, _ = FusedMoE.select_experts(
@@ -423,12 +479,13 @@ def apply(
                 apply_router_weight_on_input=apply_router_weight_on_input,
                 global_num_experts=global_num_experts,
                 expert_map=expert_map,
-                workspace=layer.workspace)
+                workspace=layer.workspace,
+            )
 
         elif self.fused_experts is not None:
             assert is_valid_flashinfer_cutlass_fused_moe(
-                x, layer.w13_weight, layer.w2_weight), (
-                    "Flashinfer CUTLASS Fused MoE not applicable!")
+                x, layer.w13_weight, layer.w2_weight
+            ), "Flashinfer CUTLASS Fused MoE not applicable!"
 
             return self.fused_experts(
                 hidden_states=x,
@@ -446,11 +503,12 @@ def apply(
         # FlashInfer fused experts path
         elif self.allow_flashinfer:
             from vllm.model_executor.layers.fused_moe.flashinfer_cutlass_moe import (  # noqa: E501
-                flashinfer_cutlass_moe_fp4)
+                flashinfer_cutlass_moe_fp4,
+            )
 
             assert is_valid_flashinfer_cutlass_fused_moe(
-                x, layer.w13_weight, layer.w2_weight), (
-                    "Flashinfer CUTLASS Fused MoE not applicable!")
+                x, layer.w13_weight, layer.w2_weight
+            ), "Flashinfer CUTLASS Fused MoE not applicable!"
 
             assert self.moe_quant_config is not None
 
@@ -468,12 +526,13 @@ def apply(
                 apply_router_weight_on_input=apply_router_weight_on_input,
             )
         else:
-            from vllm.model_executor.layers.fused_moe.cutlass_moe import (
-                cutlass_moe_fp4)
+            from vllm.model_executor.layers.fused_moe.cutlass_moe import cutlass_moe_fp4
 
-            assert expert_map is None, ("Expert Parallelism / expert_map "
-                                        "is currently not supported for "
-                                        "CompressedTensorsW4A4MoeMethod.")
+            assert expert_map is None, (
+                "Expert Parallelism / expert_map "
+                "is currently not supported for "
+                "CompressedTensorsW4A4MoeMethod."
+            )
             assert self.moe_quant_config is not None
 
             # Cutlass moe takes in activations in BF16/Half precision
@@ -495,7 +554,6 @@ def apply(
 
 
 class CompressedTensorsW8A8Fp8MoEMethod(CompressedTensorsMoEMethod):
-
     def __init__(
         self,
         quant_config: "CompressedTensorsConfig",  # type: ignore # noqa E501
@@ -503,17 +561,19 @@ def __init__(
     ):
         super().__init__(moe)
         self.quant_config = quant_config
-        self.weight_quant = self.quant_config.target_scheme_map["Linear"].get(
-            "weights")
+        self.weight_quant = self.quant_config.target_scheme_map["Linear"].get("weights")
         self.input_quant = self.quant_config.target_scheme_map["Linear"].get(
-            "input_activations")
+            "input_activations"
+        )
 
-        per_tensor = (self.weight_quant.strategy == QuantizationStrategy.TENSOR
-                      and self.input_quant.strategy
-                      == QuantizationStrategy.TENSOR)
+        per_tensor = (
+            self.weight_quant.strategy == QuantizationStrategy.TENSOR
+            and self.input_quant.strategy == QuantizationStrategy.TENSOR
+        )
         per_channel = (
             self.weight_quant.strategy == QuantizationStrategy.CHANNEL
-            and self.input_quant.strategy == QuantizationStrategy.TOKEN)
+            and self.input_quant.strategy == QuantizationStrategy.TOKEN
+        )
         if not (per_tensor or per_channel):
             assert self.weight_quant.strategy == QuantizationStrategy.BLOCK
             self.weight_block_size = self.weight_quant.block_structure
@@ -526,33 +586,44 @@ def __init__(
         if self.static_input_scales and per_channel:
             raise ValueError(
                 "For FP8 Fused MoE layer, we require either per tensor or "
-                "channelwise, dynamic per token quantization.")
+                "channelwise, dynamic per token quantization."
+            )
 
         # For GPUs that lack FP8 hardware support, we can leverage the Marlin
         # kernel for fast weight-only FP8 quantization
-        self.use_marlin = (not current_platform.has_device_capability(89)
-                           or envs.VLLM_TEST_FORCE_FP8_MARLIN
-                           and not self.block_quant)
+        self.use_marlin = (
+            not current_platform.has_device_capability(89)
+            or envs.VLLM_TEST_FORCE_FP8_MARLIN
+            and not self.block_quant
+        )
         # Disable marlin for rocm
         if current_platform.is_rocm():
             self.use_marlin = False
         from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-            is_rocm_aiter_moe_enabled)
+            is_rocm_aiter_moe_enabled,
+        )
 
         self.rocm_aiter_moe_enabled = is_rocm_aiter_moe_enabled()
 
         # cutlass path
         self.is_fp8_w8a8_sm100 = quant_config._is_fp8_w8a8_sm100(
-            self.weight_quant, self.input_quant)
+            self.weight_quant, self.input_quant
+        )
         self.use_cutlass = not self.block_quant and (
             quant_config._is_fp8_w8a8_sm90(self.weight_quant, self.input_quant)
-            or self.is_fp8_w8a8_sm100)
+            or self.is_fp8_w8a8_sm100
+        )
         self.disable_expert_map = False
 
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
-
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         layer.intermediate_size_per_partition = intermediate_size_per_partition
         layer.hidden_size = hidden_size
         layer.num_experts = num_experts
@@ -577,31 +648,38 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
                 raise ValueError(
                     f"The output_size of gate's and up's weight = "
                     f"{intermediate_size_per_partition} is not divisible by "
-                    f"weight quantization block_n = {block_n}.")
-            if (tp_size > 1
-                    and intermediate_size_per_partition % block_k != 0):
+                    f"weight quantization block_n = {block_n}."
+                )
+            if tp_size > 1 and intermediate_size_per_partition % block_k != 0:
                 # Required by row parallel
                 raise ValueError(
                     f"The input_size of down's weight = "
                     f"{intermediate_size_per_partition} is not divisible by "
-                    f"weight quantization block_k = {block_k}.")
+                    f"weight quantization block_k = {block_k}."
+                )
 
         # WEIGHTS
-        w13_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            2 * intermediate_size_per_partition,
-            hidden_size,
-            dtype=params_dtype),
-                                        requires_grad=False)
+        w13_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                2 * intermediate_size_per_partition,
+                hidden_size,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_weight", w13_weight)
         set_weight_attrs(w13_weight, extra_weight_attrs)
 
-        w2_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            hidden_size,
-            intermediate_size_per_partition,
-            dtype=params_dtype),
-                                       requires_grad=False)
+        w2_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                hidden_size,
+                intermediate_size_per_partition,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_weight", w2_weight)
         set_weight_attrs(w2_weight, extra_weight_attrs)
 
@@ -609,70 +687,83 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
         if self.weight_quant.strategy == QuantizationStrategy.TENSOR:
             # Allocate 2 scales for w1 and w3 respectively.
             # They are combined to a single scale after weight loading.
-            w13_weight_scale = torch.nn.Parameter(torch.ones(
-                num_experts, 2, dtype=torch.float32),
-                                                  requires_grad=False)
+            w13_weight_scale = torch.nn.Parameter(
+                torch.ones(num_experts, 2, dtype=torch.float32), requires_grad=False
+            )
             layer.register_parameter("w13_weight_scale", w13_weight_scale)
-            w2_weight_scale = torch.nn.Parameter(torch.ones(
-                num_experts, dtype=torch.float32),
-                                                 requires_grad=False)
+            w2_weight_scale = torch.nn.Parameter(
+                torch.ones(num_experts, dtype=torch.float32), requires_grad=False
+            )
             layer.register_parameter("w2_weight_scale", w2_weight_scale)
             # Add PER-TENSOR quantization for FusedMoE.weight_loader.
             extra_weight_attrs.update(
-                {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value})
+                {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value}
+            )
             set_weight_attrs(w13_weight_scale, extra_weight_attrs)
             set_weight_attrs(w2_weight_scale, extra_weight_attrs)
 
         elif self.weight_quant.strategy == QuantizationStrategy.CHANNEL:
-            w13_weight_scale = torch.nn.Parameter(torch.ones(
-                num_experts,
-                2 * intermediate_size_per_partition,
-                1,
-                dtype=torch.float32),
-                                                  requires_grad=False)
+            w13_weight_scale = torch.nn.Parameter(
+                torch.ones(
+                    num_experts,
+                    2 * intermediate_size_per_partition,
+                    1,
+                    dtype=torch.float32,
+                ),
+                requires_grad=False,
+            )
             layer.register_parameter("w13_weight_scale", w13_weight_scale)
-            w2_weight_scale = torch.nn.Parameter(torch.ones(
-                num_experts, hidden_size, 1, dtype=torch.float32),
-                                                 requires_grad=False)
+            w2_weight_scale = torch.nn.Parameter(
+                torch.ones(num_experts, hidden_size, 1, dtype=torch.float32),
+                requires_grad=False,
+            )
             layer.register_parameter("w2_weight_scale", w2_weight_scale)
             # Add PER-CHANNEL quantization for FusedMoE.weight_loader.
             extra_weight_attrs.update(
-                {"quant_method": FusedMoeWeightScaleSupported.CHANNEL.value})
+                {"quant_method": FusedMoeWeightScaleSupported.CHANNEL.value}
+            )
             set_weight_attrs(w13_weight_scale, extra_weight_attrs)
             set_weight_attrs(w2_weight_scale, extra_weight_attrs)
 
         elif self.weight_quant.strategy == QuantizationStrategy.BLOCK:
-            w13_weight_scale = torch.nn.Parameter(torch.ones(
-                num_experts,
-                2 *
-                ((intermediate_size_per_partition + block_n - 1) // block_n),
-                (hidden_size + block_k - 1) // block_k,
-                dtype=torch.float32),
-                                                  requires_grad=False)
+            w13_weight_scale = torch.nn.Parameter(
+                torch.ones(
+                    num_experts,
+                    2 * ((intermediate_size_per_partition + block_n - 1) // block_n),
+                    (hidden_size + block_k - 1) // block_k,
+                    dtype=torch.float32,
+                ),
+                requires_grad=False,
+            )
             layer.register_parameter("w13_weight_scale", w13_weight_scale)
-            w2_weight_scale = torch.nn.Parameter(torch.ones(
-                num_experts, (hidden_size + block_n - 1) // block_n,
-                (intermediate_size_per_partition + block_k - 1) // block_k,
-                dtype=torch.float32),
-                                                 requires_grad=False)
+            w2_weight_scale = torch.nn.Parameter(
+                torch.ones(
+                    num_experts,
+                    (hidden_size + block_n - 1) // block_n,
+                    (intermediate_size_per_partition + block_k - 1) // block_k,
+                    dtype=torch.float32,
+                ),
+                requires_grad=False,
+            )
             layer.register_parameter("w2_weight_scale", w2_weight_scale)
             # Add PER-CHANNEL quantization for FusedMoE.weight_loader.
             extra_weight_attrs.update(
-                {"quant_method": FusedMoeWeightScaleSupported.BLOCK.value})
+                {"quant_method": FusedMoeWeightScaleSupported.BLOCK.value}
+            )
             set_weight_attrs(w13_weight_scale, extra_weight_attrs)
             set_weight_attrs(w2_weight_scale, extra_weight_attrs)
 
         # INPUT_SCALES
         if self.static_input_scales:
-            w13_input_scale = torch.nn.Parameter(torch.ones(
-                num_experts, dtype=torch.float32),
-                                                 requires_grad=False)
+            w13_input_scale = torch.nn.Parameter(
+                torch.ones(num_experts, dtype=torch.float32), requires_grad=False
+            )
             layer.register_parameter("w13_input_scale", w13_input_scale)
             set_weight_attrs(w13_input_scale, extra_weight_attrs)
 
-            w2_input_scale = torch.nn.Parameter(torch.ones(
-                num_experts, dtype=torch.float32),
-                                                requires_grad=False)
+            w2_input_scale = torch.nn.Parameter(
+                torch.ones(num_experts, dtype=torch.float32), requires_grad=False
+            )
             layer.register_parameter("w2_input_scale", w2_input_scale)
             set_weight_attrs(w2_input_scale, extra_weight_attrs)
         else:
@@ -684,46 +775,53 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         # We take the max of all the scales in case they differ.
         if self.static_input_scales:
             assert self.input_quant.strategy == QuantizationStrategy.TENSOR
-            if (layer.w13_input_scale is None or layer.w2_input_scale is None):
+            if layer.w13_input_scale is None or layer.w2_input_scale is None:
                 raise ValueError(
                     "QuantConfig has static quantization, but found "
-                    "activation scales are None.")
-            if (not all_close_1d(layer.w13_input_scale)
-                    or not all_close_1d(layer.w2_input_scale)):
+                    "activation scales are None."
+                )
+            if not all_close_1d(layer.w13_input_scale) or not all_close_1d(
+                layer.w2_input_scale
+            ):
                 logger.warning_once(
                     "Found input_scales that are not equal for "
                     "fp8 MoE layer. Using the maximum across experts "
-                    "for each layer.")
+                    "for each layer."
+                )
             layer.w13_input_scale = torch.nn.Parameter(
-                layer.w13_input_scale.max(), requires_grad=False)
+                layer.w13_input_scale.max(), requires_grad=False
+            )
             layer.w2_input_scale = torch.nn.Parameter(
-                layer.w2_input_scale.max(), requires_grad=False)
+                layer.w2_input_scale.max(), requires_grad=False
+            )
 
         if current_platform.is_fp8_fnuz():
             # Normalize the weights and scales
-            w13_weight, w13_weight_scale, w13_input_scale = \
-                normalize_e4m3fn_to_e4m3fnuz(
-                    layer.w13_weight, layer.w13_weight_scale,
-                    layer.w13_input_scale)
-            w2_weight, w2_weight_scale, w2_input_scale = \
+            w13_weight, w13_weight_scale, w13_input_scale = (
                 normalize_e4m3fn_to_e4m3fnuz(
-                    layer.w2_weight, layer.w2_weight_scale,
-                    layer.w2_input_scale)
+                    layer.w13_weight, layer.w13_weight_scale, layer.w13_input_scale
+                )
+            )
+            w2_weight, w2_weight_scale, w2_input_scale = normalize_e4m3fn_to_e4m3fnuz(
+                layer.w2_weight, layer.w2_weight_scale, layer.w2_input_scale
+            )
             # Reset the parameter
-            layer.w13_weight = torch.nn.Parameter(w13_weight,
-                                                  requires_grad=False)
-            layer.w13_weight_scale = torch.nn.Parameter(w13_weight_scale,
-                                                        requires_grad=False)
+            layer.w13_weight = torch.nn.Parameter(w13_weight, requires_grad=False)
+            layer.w13_weight_scale = torch.nn.Parameter(
+                w13_weight_scale, requires_grad=False
+            )
             if w13_input_scale is not None:
-                layer.w13_input_scale = torch.nn.Parameter(w13_input_scale,
-                                                           requires_grad=False)
-            layer.w2_weight = torch.nn.Parameter(w2_weight,
-                                                 requires_grad=False)
-            layer.w2_weight_scale = torch.nn.Parameter(w2_weight_scale,
-                                                       requires_grad=False)
+                layer.w13_input_scale = torch.nn.Parameter(
+                    w13_input_scale, requires_grad=False
+                )
+            layer.w2_weight = torch.nn.Parameter(w2_weight, requires_grad=False)
+            layer.w2_weight_scale = torch.nn.Parameter(
+                w2_weight_scale, requires_grad=False
+            )
             if w2_input_scale is not None:
-                layer.w2_input_scale = torch.nn.Parameter(w2_input_scale,
-                                                          requires_grad=False)
+                layer.w2_input_scale = torch.nn.Parameter(
+                    w2_input_scale, requires_grad=False
+                )
 
         # For Per-TENSOR case, Fp8 moe kernel needs single weight scale
         # for w13 per expert. Use max then dequant and requant each expert.
@@ -735,29 +833,31 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
                 start = 0
                 for shard_id in range(2):
                     dq_weight = per_tensor_dequantize(
-                        layer.w13_weight[expert_id][start:start +
-                                                    shard_size, :],
-                        layer.w13_weight_scale[expert_id][shard_id])
-                    layer.w13_weight[expert_id][
-                        start:start + shard_size, :], _ = ops.scaled_fp8_quant(
-                            dq_weight, max_w13_scales[expert_id])
+                        layer.w13_weight[expert_id][start : start + shard_size, :],
+                        layer.w13_weight_scale[expert_id][shard_id],
+                    )
+                    layer.w13_weight[expert_id][start : start + shard_size, :], _ = (
+                        ops.scaled_fp8_quant(dq_weight, max_w13_scales[expert_id])
+                    )
                     start += shard_size
-            layer.w13_weight_scale = torch.nn.Parameter(max_w13_scales,
-                                                        requires_grad=False)
+            layer.w13_weight_scale = torch.nn.Parameter(
+                max_w13_scales, requires_grad=False
+            )
 
         # Property to determine if AITER is used
         if self.rocm_aiter_moe_enabled:
             from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (  # noqa E501
-                rocm_aiter_fused_experts, shuffle_weights)
+                rocm_aiter_fused_experts,
+                shuffle_weights,
+            )
 
             # reshaping weights is required for aiter moe kernel.
             shuffled_w13, shuffled_w2 = shuffle_weights(
-                layer.w13_weight.data, layer.w2_weight.data)
+                layer.w13_weight.data, layer.w2_weight.data
+            )
 
-            layer.w13_weight = torch.nn.Parameter(shuffled_w13,
-                                                  requires_grad=False)
-            layer.w2_weight = torch.nn.Parameter(shuffled_w2,
-                                                 requires_grad=False)
+            layer.w13_weight = torch.nn.Parameter(shuffled_w13, requires_grad=False)
+            layer.w2_weight = torch.nn.Parameter(shuffled_w2, requires_grad=False)
 
         elif self.use_marlin:
             prepare_moe_fp8_layer_for_marlin(layer, False)
@@ -770,20 +870,23 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             device = layer.w13_weight.device
             # ab_strides1 and c_strides2 are the same
             self.ab_strides1_c_strides2 = torch.full(
-                (layer.local_num_experts, ),
+                (layer.local_num_experts,),
                 layer.hidden_size,
                 device=device,
-                dtype=torch.int64)
+                dtype=torch.int64,
+            )
             self.ab_strides2 = torch.full(
-                (layer.local_num_experts, ),
+                (layer.local_num_experts,),
                 layer.intermediate_size_per_partition,
                 device=device,
-                dtype=torch.int64)
+                dtype=torch.int64,
+            )
             self.c_strides1 = torch.full(
-                (layer.local_num_experts, ),
+                (layer.local_num_experts,),
                 2 * layer.intermediate_size_per_partition,
                 device=device,
-                dtype=torch.int64)
+                dtype=torch.int64,
+            )
 
         if is_deep_gemm_e8m0_used() and self.block_quant:
             assert layer.weight_block_size is not None
@@ -803,13 +906,14 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             # Ensure column-major TMA alignment expected by DeepGEMM.
             if expert_weight_is_col_major(layer.w13_weight_scale):
                 layer.w13_weight_scale = get_col_major_tma_aligned_tensor(
-                    layer.w13_weight_scale)
+                    layer.w13_weight_scale
+                )
             if expert_weight_is_col_major(layer.w2_weight_scale):
                 layer.w2_weight_scale = get_col_major_tma_aligned_tensor(
-                    layer.w2_weight_scale)
+                    layer.w2_weight_scale
+                )
 
-    def maybe_make_prepare_finalize(
-            self) -> Optional[mk.FusedMoEPrepareAndFinalize]:
+    def maybe_make_prepare_finalize(self) -> Optional[mk.FusedMoEPrepareAndFinalize]:
         if self.use_marlin or self.rocm_aiter_moe_enabled:
             return None
         else:
@@ -824,16 +928,19 @@ def select_gemm_impl(
         assert self.moe_quant_config is not None
         if self.use_cutlass:
             from vllm.model_executor.layers.fused_moe import (
-                CutlassBatchedExpertsFp8, CutlassExpertsFp8)
+                CutlassBatchedExpertsFp8,
+                CutlassExpertsFp8,
+            )
 
             experts: FusedMoEPermuteExpertsUnpermute
 
             num_dispatchers = prepare_finalize.num_dispatchers()
 
-            if (prepare_finalize.activation_format ==
-                    FusedMoEActivationFormat.BatchedExperts):
-                logger.debug("CutlassBatchedExpertsFp8(%s)",
-                             self.__class__.__name__)
+            if (
+                prepare_finalize.activation_format
+                == FusedMoEActivationFormat.BatchedExperts
+            ):
+                logger.debug("CutlassBatchedExpertsFp8(%s)", self.__class__.__name__)
                 experts = CutlassBatchedExpertsFp8(
                     self.moe.num_local_experts,
                     num_dispatchers,
@@ -855,23 +962,27 @@ def select_gemm_impl(
                     quant_config=self.moe_quant_config,
                 )
 
-            self.disable_expert_map = (num_dispatchers > 1
-                                       or not experts.supports_expert_map())
+            self.disable_expert_map = (
+                num_dispatchers > 1 or not experts.supports_expert_map()
+            )
 
             return experts
 
         # triton path
         from vllm.model_executor.layers.fused_moe.batched_triton_or_deep_gemm_moe import (  # noqa: E501
-            BatchedTritonOrDeepGemmExperts)
+            BatchedTritonOrDeepGemmExperts,
+        )
         from vllm.model_executor.layers.fused_moe.triton_deep_gemm_moe import (
-            TritonOrDeepGemmExperts)
+            TritonOrDeepGemmExperts,
+        )
 
         assert not self.rocm_aiter_moe_enabled and not self.use_marlin
 
-        if (prepare_finalize.activation_format ==
-                FusedMoEActivationFormat.BatchedExperts):
-            max_num_tokens_per_rank = prepare_finalize.max_num_tokens_per_rank(
-            )
+        if (
+            prepare_finalize.activation_format
+            == FusedMoEActivationFormat.BatchedExperts
+        ):
+            max_num_tokens_per_rank = prepare_finalize.max_num_tokens_per_rank()
             assert max_num_tokens_per_rank is not None
 
             logger.debug("BatchedTritonExperts(%s)", self.__class__.__name__)
@@ -881,20 +992,17 @@ def select_gemm_impl(
                 quant_config=self.moe_quant_config,
             )
         else:
-            logger.debug("TritonOrDeepGemmExperts(%s)",
-                         self.__class__.__name__)
-            return TritonOrDeepGemmExperts(self.moe_quant_config,
-                                           allow_deep_gemm=True)
+            logger.debug("TritonOrDeepGemmExperts(%s)", self.__class__.__name__)
+            return TritonOrDeepGemmExperts(self.moe_quant_config, allow_deep_gemm=True)
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         if self.use_marlin:
             return None
 
-        per_act_token = (
-            self.input_quant.strategy == QuantizationStrategy.TOKEN)
-        per_channel_quant = (
-            self.weight_quant.strategy == QuantizationStrategy.CHANNEL)
+        per_act_token = self.input_quant.strategy == QuantizationStrategy.TOKEN
+        per_channel_quant = self.weight_quant.strategy == QuantizationStrategy.CHANNEL
 
         return fp8_w8a8_moe_quant_config(
             w1_scale=layer.w13_weight_scale,
@@ -931,8 +1039,8 @@ def apply(
     ) -> Union[torch.Tensor, tuple[torch.Tensor, torch.Tensor]]:
         if enable_eplb:
             raise NotImplementedError(
-                "EPLB not supported for "
-                "`CompressedTensorsW8A8Fp8MoEMethod` yet.")
+                "EPLB not supported for `CompressedTensorsW8A8Fp8MoEMethod` yet."
+            )
 
         topk_weights, topk_ids, _ = FusedMoE.select_experts(
             hidden_states=x,
@@ -949,18 +1057,15 @@ def apply(
             indices_type=self.topk_indices_dtype,
         )
 
-        per_act_token = (
-            self.input_quant.strategy == QuantizationStrategy.TOKEN)
-        per_channel_quant = (
-            self.weight_quant.strategy == QuantizationStrategy.CHANNEL)
+        per_act_token = self.input_quant.strategy == QuantizationStrategy.TOKEN
+        per_channel_quant = self.weight_quant.strategy == QuantizationStrategy.CHANNEL
 
         #
         # Note: the order here is important. self.fused_experts can override
         # cutlass fp8 or fused_experts but not marlin or rocm.
         #
         if self.use_marlin:
-            assert activation == "silu", (
-                f"{activation} not supported for Marlin MoE.")
+            assert activation == "silu", f"{activation} not supported for Marlin MoE."
             assert self.fused_experts is None
             return torch.ops.vllm.fused_marlin_moe(
                 x,
@@ -977,11 +1082,14 @@ def apply(
                 apply_router_weight_on_input=apply_router_weight_on_input,
                 global_num_experts=global_num_experts,
                 expert_map=expert_map,
-                workspace=layer.workspace)
+                workspace=layer.workspace,
+            )
 
         elif self.rocm_aiter_moe_enabled:
             from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (  # noqa E501
-                rocm_aiter_fused_experts)
+                rocm_aiter_fused_experts,
+            )
+
             assert per_act_token == per_channel_quant
             assert self.moe_quant_config is not None
             assert self.fused_experts is None
@@ -1016,6 +1124,7 @@ def apply(
             # small-batch fallback on SM100
             if self.is_fp8_w8a8_sm100 and topk_ids.shape[0] <= 8:
                 from vllm.model_executor.layers.fused_moe import fused_experts
+
                 assert per_act_token == per_channel_quant
                 return fused_experts(
                     hidden_states=x,
@@ -1032,7 +1141,9 @@ def apply(
                 )
             else:
                 from vllm.model_executor.layers.fused_moe.cutlass_moe import (
-                    cutlass_moe_fp8)
+                    cutlass_moe_fp8,
+                )
+
                 assert per_act_token == per_channel_quant
                 assert self.moe_quant_config is not None
                 return cutlass_moe_fp8(
@@ -1053,6 +1164,7 @@ def apply(
 
         else:
             from vllm.model_executor.layers.fused_moe import fused_experts
+
             assert per_act_token == per_channel_quant
             assert self.moe_quant_config is not None
             return fused_experts(
@@ -1071,7 +1183,6 @@ def apply(
 
 
 class CompressedTensorsW8A8Int8MoEMethod(CompressedTensorsMoEMethod):
-
     def __init__(
         self,
         quant_config: "CompressedTensorsConfig",  # type: ignore # noqa E501
@@ -1079,69 +1190,83 @@ def __init__(
     ):
         super().__init__(moe)
         self.quant_config = quant_config
-        self.weight_quant = self.quant_config.target_scheme_map["Linear"].get(
-            "weights")
+        self.weight_quant = self.quant_config.target_scheme_map["Linear"].get("weights")
         self.input_quant = self.quant_config.target_scheme_map["Linear"].get(
-            "input_activations")
+            "input_activations"
+        )
 
         per_channel = (
             self.weight_quant.strategy == QuantizationStrategy.CHANNEL
-            and self.input_quant.strategy == QuantizationStrategy.TOKEN)
+            and self.input_quant.strategy == QuantizationStrategy.TOKEN
+        )
         if not per_channel:
             raise ValueError(
                 "For INT8 Fused MoE layers, we require channelwise, "
                 "dynamic per token quantization. Found "
-                f"{self.weight_quant}, {self.input_quant}")
+                f"{self.weight_quant}, {self.input_quant}"
+            )
 
         self.static_input_scales = not self.input_quant.dynamic
         if self.static_input_scales:
             raise ValueError(
                 "For INT8 Fused MoE layers, we require channelwise, "
-                "dynamic per token quantization. Found static input scales.")
-
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
+                "dynamic per token quantization. Found static input scales."
+            )
 
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         params_dtype = torch.int8
 
         # WEIGHTS
-        w13_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            2 * intermediate_size_per_partition,
-            hidden_size,
-            dtype=params_dtype),
-                                        requires_grad=False)
+        w13_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                2 * intermediate_size_per_partition,
+                hidden_size,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_weight", w13_weight)
         set_weight_attrs(w13_weight, extra_weight_attrs)
 
-        w2_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            hidden_size,
-            intermediate_size_per_partition,
-            dtype=params_dtype),
-                                       requires_grad=False)
+        w2_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                hidden_size,
+                intermediate_size_per_partition,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_weight", w2_weight)
         set_weight_attrs(w2_weight, extra_weight_attrs)
 
         # WEIGHT_SCALES
         assert self.weight_quant.strategy == QuantizationStrategy.CHANNEL
-        w13_weight_scale = torch.nn.Parameter(torch.ones(
-            num_experts,
-            2 * intermediate_size_per_partition,
-            1,
-            dtype=torch.float32),
-                                              requires_grad=False)
+        w13_weight_scale = torch.nn.Parameter(
+            torch.ones(
+                num_experts, 2 * intermediate_size_per_partition, 1, dtype=torch.float32
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_weight_scale", w13_weight_scale)
-        w2_weight_scale = torch.nn.Parameter(torch.ones(num_experts,
-                                                        hidden_size,
-                                                        1,
-                                                        dtype=torch.float32),
-                                             requires_grad=False)
+        w2_weight_scale = torch.nn.Parameter(
+            torch.ones(num_experts, hidden_size, 1, dtype=torch.float32),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_weight_scale", w2_weight_scale)
         # Add PER-CHANNEL quantization for FusedMoE.weight_loader.
         extra_weight_attrs.update(
-            {"quant_method": FusedMoeWeightScaleSupported.CHANNEL.value})
+            {"quant_method": FusedMoeWeightScaleSupported.CHANNEL.value}
+        )
         set_weight_attrs(w13_weight_scale, extra_weight_attrs)
         set_weight_attrs(w2_weight_scale, extra_weight_attrs)
 
@@ -1154,7 +1279,8 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         pass
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         return int8_w8a8_moe_quant_config(
             w1_scale=layer.w13_weight_scale,
             w2_scale=layer.w2_weight_scale,
@@ -1190,8 +1316,8 @@ def apply(
 
         if enable_eplb:
             raise NotImplementedError(
-                "EPLB not supported for "
-                "`CompressedTensorsW8A8Int8MoEMethod` yet.")
+                "EPLB not supported for `CompressedTensorsW8A8Int8MoEMethod` yet."
+            )
 
         from vllm.model_executor.layers.fused_moe import fused_experts
 
@@ -1207,7 +1333,8 @@ def apply(
             scoring_func=scoring_func,
             routed_scaling_factor=routed_scaling_factor,
             e_score_correction_bias=e_score_correction_bias,
-            indices_type=self.topk_indices_dtype)
+            indices_type=self.topk_indices_dtype,
+        )
 
         return fused_experts(
             hidden_states=x,
@@ -1225,7 +1352,6 @@ def apply(
 
 
 class CompressedTensorsWNA16MarlinMoEMethod(CompressedTensorsMoEMethod):
-
     def __init__(
         self,
         quant_config: "CompressedTensorsConfig",  # type: ignore # noqa E501
@@ -1241,58 +1367,71 @@ def __init__(
         self.strategy = config.strategy
         self.group_size = config.group_size
         self.actorder = config.actorder
-        assert config.symmetric, (
-            "Only symmetric quantization is supported for MoE")
-
-        if not (self.quant_config.quant_format
-                == CompressionFormat.pack_quantized.value
-                and self.num_bits in WNA16_SUPPORTED_BITS):
-            raise ValueError("For Fused MoE layers, only ",
-                             f"{CompressionFormat.pack_quantized.value} ",
-                             "is supported for the following bits: ",
-                             f"{WNA16_SUPPORTED_BITS}")
-        self.quant_type = WNA16_SUPPORTED_TYPES_MAP[self.num_bits]
+        assert config.symmetric, "Only symmetric quantization is supported for MoE"
 
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
+        if not (
+            self.quant_config.quant_format == CompressionFormat.pack_quantized.value
+            and self.num_bits in WNA16_SUPPORTED_BITS
+        ):
+            raise ValueError(
+                "For Fused MoE layers, only ",
+                f"{CompressionFormat.pack_quantized.value} ",
+                "is supported for the following bits: ",
+                f"{WNA16_SUPPORTED_BITS}",
+            )
+        self.quant_type = WNA16_SUPPORTED_TYPES_MAP[self.num_bits]
 
-        intermediate_size_full = extra_weight_attrs.pop(
-            "intermediate_size_full")
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
+        intermediate_size_full = extra_weight_attrs.pop("intermediate_size_full")
 
         # Will transpose the loaded weight along the
         # intermediate and hidden dim sizes. Will
         # shard for TP along the transposed dims
-        extra_weight_attrs.update({
-            "is_transposed": True,
-            "quant_method": self.strategy
-        })
-        w13_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            hidden_size // self.packed_factor,
-            2 * intermediate_size_per_partition,
-            dtype=torch.int32),
-                                        requires_grad=False)
+        extra_weight_attrs.update(
+            {"is_transposed": True, "quant_method": self.strategy}
+        )
+        w13_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                hidden_size // self.packed_factor,
+                2 * intermediate_size_per_partition,
+                dtype=torch.int32,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_weight_packed", w13_weight)
         set_weight_attrs(w13_weight, extra_weight_attrs)
 
-        w2_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            intermediate_size_per_partition // self.packed_factor,
-            hidden_size,
-            dtype=torch.int32),
-                                       requires_grad=False)
+        w2_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                intermediate_size_per_partition // self.packed_factor,
+                hidden_size,
+                dtype=torch.int32,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_weight_packed", w2_weight)
         set_weight_attrs(w2_weight, extra_weight_attrs)
 
         # In the case where we have actorder/g_idx,
         # we do not partition the w2 scales
         load_full_w2 = self.actorder and self.group_size != -1
-        w2_scales_size = (intermediate_size_full
-                          if load_full_w2 else intermediate_size_per_partition)
+        w2_scales_size = (
+            intermediate_size_full if load_full_w2 else intermediate_size_per_partition
+        )
 
         self.is_k_full = (not self.actorder) or (
-            intermediate_size_per_partition == intermediate_size_full)
+            intermediate_size_per_partition == intermediate_size_full
+        )
 
         if self.strategy == "channel":
             num_groups_w2 = num_groups_w13 = 1
@@ -1301,30 +1440,34 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
             num_groups_w2 = w2_scales_size // self.group_size
             num_groups_w13 = hidden_size // self.group_size
 
-        w13_scale = torch.nn.Parameter(torch.ones(
-            num_experts,
-            num_groups_w13,
-            2 * intermediate_size_per_partition,
-            dtype=params_dtype),
-                                       requires_grad=False)
+        w13_scale = torch.nn.Parameter(
+            torch.ones(
+                num_experts,
+                num_groups_w13,
+                2 * intermediate_size_per_partition,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_weight_scale", w13_scale)
         set_weight_attrs(w13_scale, extra_weight_attrs)
 
-        w2_scale = torch.nn.Parameter(torch.ones(num_experts,
-                                                 num_groups_w2,
-                                                 hidden_size,
-                                                 dtype=params_dtype),
-                                      requires_grad=False)
+        w2_scale = torch.nn.Parameter(
+            torch.ones(num_experts, num_groups_w2, hidden_size, dtype=params_dtype),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_weight_scale", w2_scale)
         set_weight_attrs(w2_scale, extra_weight_attrs)
         set_weight_attrs(w2_scale, {"load_full_w2": load_full_w2})
 
-        w2_weight_shape = torch.nn.Parameter(torch.empty(num_experts, 2),
-                                             requires_grad=False)
+        w2_weight_shape = torch.nn.Parameter(
+            torch.empty(num_experts, 2), requires_grad=False
+        )
         layer.register_parameter("w2_weight_shape", w2_weight_shape)
         set_weight_attrs(w2_weight_shape, extra_weight_attrs)
-        w13_weight_shape = torch.nn.Parameter(torch.empty(num_experts, 2),
-                                              requires_grad=False)
+        w13_weight_shape = torch.nn.Parameter(
+            torch.empty(num_experts, 2), requires_grad=False
+        )
 
         layer.register_parameter("w13_weight_shape", w13_weight_shape)
         set_weight_attrs(w13_weight_shape, extra_weight_attrs)
@@ -1359,8 +1502,7 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
             ),
             requires_grad=False,
         )
-        layer.register_parameter("w13_g_idx_sort_indices",
-                                 w13_g_idx_sort_indices)
+        layer.register_parameter("w13_g_idx_sort_indices", w13_g_idx_sort_indices)
         set_weight_attrs(w13_g_idx_sort_indices, extra_weight_attrs)
 
         w2_g_idx_sort_indices = torch.nn.Parameter(
@@ -1371,8 +1513,7 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
             ),
             requires_grad=False,
         )
-        layer.register_parameter("w2_g_idx_sort_indices",
-                                 w2_g_idx_sort_indices)
+        layer.register_parameter("w2_g_idx_sort_indices", w2_g_idx_sort_indices)
         set_weight_attrs(w2_g_idx_sort_indices, extra_weight_attrs)
 
         layer.a13_scale = None
@@ -1392,41 +1533,37 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             w2_sorted_g_idx = torch.empty_like(layer.w2_weight_g_idx)
 
             for e in range(num_experts):
-                w13_g_idx_sort_indices[e] = torch.argsort(
-                    layer.w13_weight_g_idx[e]).to(torch.int32)
-                w2_g_idx_sort_indices[e] = torch.argsort(
-                    layer.w2_weight_g_idx[e]).to(torch.int32)
+                w13_g_idx_sort_indices[e] = torch.argsort(layer.w13_weight_g_idx[e]).to(
+                    torch.int32
+                )
+                w2_g_idx_sort_indices[e] = torch.argsort(layer.w2_weight_g_idx[e]).to(
+                    torch.int32
+                )
                 w13_sorted_g_idx[e] = layer.w13_weight_g_idx[e][
-                    w13_g_idx_sort_indices[e]]
-                w2_sorted_g_idx[e] = layer.w2_weight_g_idx[e][
-                    w2_g_idx_sort_indices[e]]
+                    w13_g_idx_sort_indices[e]
+                ]
+                w2_sorted_g_idx[e] = layer.w2_weight_g_idx[e][w2_g_idx_sort_indices[e]]
 
             replace_parameter(layer, "w13_weight_g_idx", w13_sorted_g_idx)
             replace_parameter(layer, "w2_weight_g_idx", w2_sorted_g_idx)
-            replace_parameter(layer, "w13_g_idx_sort_indices",
-                              w13_g_idx_sort_indices)
-            replace_parameter(layer, "w2_g_idx_sort_indices",
-                              w2_g_idx_sort_indices)
+            replace_parameter(layer, "w13_g_idx_sort_indices", w13_g_idx_sort_indices)
+            replace_parameter(layer, "w2_g_idx_sort_indices", w2_g_idx_sort_indices)
 
         else:
             layer.w13_weight_g_idx = torch.nn.Parameter(
-                torch.empty((num_experts, 0), dtype=torch.int32,
-                            device=device),
+                torch.empty((num_experts, 0), dtype=torch.int32, device=device),
                 requires_grad=False,
             )
             layer.w2_weight_g_idx = torch.nn.Parameter(
-                torch.empty((num_experts, 0), dtype=torch.int32,
-                            device=device),
+                torch.empty((num_experts, 0), dtype=torch.int32, device=device),
                 requires_grad=False,
             )
             layer.w13_g_idx_sort_indices = torch.nn.Parameter(
-                torch.empty((num_experts, 0), dtype=torch.int32,
-                            device=device),
+                torch.empty((num_experts, 0), dtype=torch.int32, device=device),
                 requires_grad=False,
             )
             layer.w2_g_idx_sort_indices = torch.nn.Parameter(
-                torch.empty((num_experts, 0), dtype=torch.int32,
-                            device=device),
+                torch.empty((num_experts, 0), dtype=torch.int32, device=device),
                 requires_grad=False,
             )
 
@@ -1456,8 +1593,8 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         replace_parameter(layer, "w13_weight_scale", marlin_w13_scales)
         marlin_w2_scales = marlin_moe_permute_scales(
             s=layer.w2_weight_scale,
-            size_k=layer.w2_weight_scale.shape[1] *
-            (self.group_size if self.group_size != -1 else self.packed_factor),
+            size_k=layer.w2_weight_scale.shape[1]
+            * (self.group_size if self.group_size != -1 else self.packed_factor),
             size_n=layer.w2_weight_scale.shape[2],
             group_size=self.group_size,
         )
@@ -1466,7 +1603,8 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         layer.workspace = marlin_make_workspace_new(device, 4)
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         return None
 
     def apply(
@@ -1496,11 +1634,10 @@ def apply(
 
         if enable_eplb:
             raise NotImplementedError(
-                "EPLB not supported for "
-                "`CompressedTensorsWNA16MarlinMoEMethod` yet.")
+                "EPLB not supported for `CompressedTensorsWNA16MarlinMoEMethod` yet."
+            )
 
-        assert activation == "silu", (
-            f"{activation} not supported for Marlin MoE.")
+        assert activation == "silu", f"{activation} not supported for Marlin MoE."
 
         topk_weights, topk_ids, _ = FusedMoE.select_experts(
             hidden_states=x,
@@ -1514,7 +1651,8 @@ def apply(
             scoring_func=scoring_func,
             routed_scaling_factor=routed_scaling_factor,
             e_score_correction_bias=e_score_correction_bias,
-            indices_type=self.topk_indices_dtype)
+            indices_type=self.topk_indices_dtype,
+        )
 
         return torch.ops.vllm.fused_marlin_moe(
             x,
@@ -1536,11 +1674,11 @@ def apply(
             sort_indices1=layer.w13_g_idx_sort_indices,
             sort_indices2=layer.w2_g_idx_sort_indices,
             workspace=layer.workspace,
-            is_k_full=self.is_k_full)
+            is_k_full=self.is_k_full,
+        )
 
 
 class CompressedTensorsWNA16MoEMethod(CompressedTensorsMoEMethod):
-
     def __init__(
         self,
         quant_config: "CompressedTensorsConfig",  # type: ignore # noqa E501
@@ -1559,43 +1697,55 @@ def __init__(
         self.group_size = config.group_size
         # grouped actorder isn't supported by this kernel
         assert config.actorder != "group"
-        assert config.symmetric, (
-            "Only symmetric quantization is supported for MoE")
-
-        if not (self.quant_config.quant_format
-                == CompressionFormat.pack_quantized.value
-                and self.num_bits in WNA16_SUPPORTED_BITS):
-            raise ValueError("For Fused MoE layers, only ",
-                             f"{CompressionFormat.pack_quantized.value} ",
-                             "is supported for the following bits: ",
-                             f"{WNA16_SUPPORTED_BITS}")
+        assert config.symmetric, "Only symmetric quantization is supported for MoE"
 
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
+        if not (
+            self.quant_config.quant_format == CompressionFormat.pack_quantized.value
+            and self.num_bits in WNA16_SUPPORTED_BITS
+        ):
+            raise ValueError(
+                "For Fused MoE layers, only ",
+                f"{CompressionFormat.pack_quantized.value} ",
+                "is supported for the following bits: ",
+                f"{WNA16_SUPPORTED_BITS}",
+            )
 
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         # Will transpose the loaded weight along the
         # intermediate and hidden dim sizes. Will
         # shard for TP along the transposed dims
-        extra_weight_attrs.update({
-            "is_transposed": True,
-            "quant_method": self.strategy
-        })
-        w13_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            hidden_size // self.packed_factor,
-            2 * intermediate_size_per_partition,
-            dtype=torch.int32),
-                                        requires_grad=False)
+        extra_weight_attrs.update(
+            {"is_transposed": True, "quant_method": self.strategy}
+        )
+        w13_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                hidden_size // self.packed_factor,
+                2 * intermediate_size_per_partition,
+                dtype=torch.int32,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_weight_packed", w13_weight)
         set_weight_attrs(w13_weight, extra_weight_attrs)
 
-        w2_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            intermediate_size_per_partition // self.packed_factor,
-            hidden_size,
-            dtype=torch.int32),
-                                       requires_grad=False)
+        w2_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                intermediate_size_per_partition // self.packed_factor,
+                hidden_size,
+                dtype=torch.int32,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_weight_packed", w2_weight)
         set_weight_attrs(w2_weight, extra_weight_attrs)
 
@@ -1608,30 +1758,34 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
             num_groups_w2 = w2_scales_size // self.group_size
             num_groups_w13 = hidden_size // self.group_size
 
-        w13_scale = torch.nn.Parameter(torch.ones(
-            num_experts,
-            num_groups_w13,
-            2 * intermediate_size_per_partition,
-            dtype=params_dtype),
-                                       requires_grad=False)
+        w13_scale = torch.nn.Parameter(
+            torch.ones(
+                num_experts,
+                num_groups_w13,
+                2 * intermediate_size_per_partition,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_weight_scale", w13_scale)
         set_weight_attrs(w13_scale, extra_weight_attrs)
 
-        w2_scale = torch.nn.Parameter(torch.ones(num_experts,
-                                                 num_groups_w2,
-                                                 hidden_size,
-                                                 dtype=params_dtype),
-                                      requires_grad=False)
+        w2_scale = torch.nn.Parameter(
+            torch.ones(num_experts, num_groups_w2, hidden_size, dtype=params_dtype),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_weight_scale", w2_scale)
         set_weight_attrs(w2_scale, extra_weight_attrs)
         set_weight_attrs(w2_scale, {"load_full_w2": False})
 
-        w2_weight_shape = torch.nn.Parameter(torch.empty(num_experts, 2),
-                                             requires_grad=False)
+        w2_weight_shape = torch.nn.Parameter(
+            torch.empty(num_experts, 2), requires_grad=False
+        )
         layer.register_parameter("w2_weight_shape", w2_weight_shape)
         set_weight_attrs(w2_weight_shape, extra_weight_attrs)
-        w13_weight_shape = torch.nn.Parameter(torch.empty(num_experts, 2),
-                                              requires_grad=False)
+        w13_weight_shape = torch.nn.Parameter(
+            torch.empty(num_experts, 2), requires_grad=False
+        )
 
         layer.register_parameter("w13_weight_shape", w13_weight_shape)
         set_weight_attrs(w13_weight_shape, extra_weight_attrs)
@@ -1666,8 +1820,7 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
             ),
             requires_grad=False,
         )
-        layer.register_parameter("w13_g_idx_sort_indices",
-                                 w13_g_idx_sort_indices)
+        layer.register_parameter("w13_g_idx_sort_indices", w13_g_idx_sort_indices)
         set_weight_attrs(w13_g_idx_sort_indices, extra_weight_attrs)
 
         w2_g_idx_sort_indices = torch.nn.Parameter(
@@ -1678,8 +1831,7 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
             ),
             requires_grad=False,
         )
-        layer.register_parameter("w2_g_idx_sort_indices",
-                                 w2_g_idx_sort_indices)
+        layer.register_parameter("w2_g_idx_sort_indices", w2_g_idx_sort_indices)
         set_weight_attrs(w2_g_idx_sort_indices, extra_weight_attrs)
 
         layer.a13_scale = None
@@ -1688,25 +1840,29 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         # Reconfigure packed weights and scales to match moe_wna16 format
         layer.w13_weight_packed = torch.nn.Parameter(
-            layer.w13_weight_packed.transpose(1, 2).contiguous().view(
-                torch.uint8),
-            requires_grad=False)
+            layer.w13_weight_packed.transpose(1, 2).contiguous().view(torch.uint8),
+            requires_grad=False,
+        )
         layer.w2_weight_packed = torch.nn.Parameter(
-            layer.w2_weight_packed.transpose(1,
-                                             2).contiguous().view(torch.uint8),
-            requires_grad=False)
+            layer.w2_weight_packed.transpose(1, 2).contiguous().view(torch.uint8),
+            requires_grad=False,
+        )
         layer.w13_weight_scale = torch.nn.Parameter(
-            layer.w13_weight_scale.transpose(1, 2).contiguous(),
-            requires_grad=False)
+            layer.w13_weight_scale.transpose(1, 2).contiguous(), requires_grad=False
+        )
         layer.w2_weight_scale = torch.nn.Parameter(
-            layer.w2_weight_scale.transpose(1, 2).contiguous(),
-            requires_grad=False)
+            layer.w2_weight_scale.transpose(1, 2).contiguous(), requires_grad=False
+        )
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         assert self.num_bits == 4 or self.num_bits == 8
-        config_builder = (int4_w4a16_moe_quant_config if self.num_bits == 4
-                          else int8_w8a16_moe_quant_config)
+        config_builder = (
+            int4_w4a16_moe_quant_config
+            if self.num_bits == 4
+            else int8_w8a16_moe_quant_config
+        )
 
         return config_builder(
             w1_scale=layer.w13_weight_scale,
@@ -1742,8 +1898,9 @@ def apply(
         assert self.fused_experts is None
 
         if enable_eplb:
-            raise NotImplementedError("EPLB not supported for "
-                                      "`CompressedTensorsWNA16MoEMethod` yet.")
+            raise NotImplementedError(
+                "EPLB not supported for `CompressedTensorsWNA16MoEMethod` yet."
+            )
 
         from vllm.model_executor.layers.fused_moe import fused_experts
 
@@ -1759,7 +1916,8 @@ def apply(
             scoring_func=scoring_func,
             routed_scaling_factor=routed_scaling_factor,
             e_score_correction_bias=e_score_correction_bias,
-            indices_type=self.topk_indices_dtype)
+            indices_type=self.topk_indices_dtype,
+        )
 
         return fused_experts(
             x,
@@ -1787,9 +1945,10 @@ class CompressedTensorsW4A8Int8MoEMethod(CompressedTensorsMoEMethod):
     """
 
     def __init__(
-            self,
-            quant_config: "CompressedTensorsConfig",  # type: ignore # noqa E501
-            moe: FusedMoEConfig):
+        self,
+        quant_config: "CompressedTensorsConfig",  # type: ignore # noqa E501
+        moe: FusedMoEConfig,
+    ):
         super().__init__(moe)
         self.has_bias = self.moe.has_bias
         self.quant_config = quant_config
@@ -1797,8 +1956,7 @@ def __init__(
         # Validate scheme: weights=W4 (channel or group),
         # activations=dynamic TOKEN (A8)
         wq = self.quant_config.target_scheme_map["Linear"].get("weights")
-        aq = self.quant_config.target_scheme_map["Linear"].get(
-            "input_activations")
+        aq = self.quant_config.target_scheme_map["Linear"].get("input_activations")
 
         # Must be dynamic per-token activations
         if aq.strategy != QuantizationStrategy.TOKEN or not aq.dynamic:
@@ -1809,8 +1967,7 @@ def __init__(
         # Weight can be channel-wise (group_size=None) or group-wise
         self.group_size = wq.group_size if (wq.group_size is not None) else -1
         if wq.num_bits != 4:
-            raise ValueError(
-                "This method only supports 4-bit weights (num_bits=4).")
+            raise ValueError("This method only supports 4-bit weights (num_bits=4).")
 
         # CPU only
         if not current_platform.is_cpu():
@@ -1824,14 +1981,20 @@ def __init__(
             except AttributeError as err:
                 raise RuntimeError(
                     f"""PyTorch {torch.__version__} lacks _dyn_quant_* 4bit ops;
-                    install a newer build.""") from err
+                    install a newer build."""
+                ) from err
         self.static_input_scales = False  # always dynamic per token
 
     # ---- parameter creation ----
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
-
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         # Shapes per local rank (TP/EP):
         #   w13: [E, 2*I_local, H]  int8  (int4 values in [-8,7])
         #   w2 : [E, H, I_local]    int8
@@ -1850,13 +2013,15 @@ def _n_scale_cols(in_features: int) -> int:
             return 1 if g == -1 else (in_features // g)
 
         # Register unpacked int4-as-int8 weights the loader will fill.
-        w13 = torch.nn.Parameter(torch.empty(E, 2 * IN, H, dtype=torch.int8),
-                                 requires_grad=False)
+        w13 = torch.nn.Parameter(
+            torch.empty(E, 2 * IN, H, dtype=torch.int8), requires_grad=False
+        )
         set_weight_attrs(w13, extra_weight_attrs)
         layer.register_parameter("w13_weight", w13)
 
-        w2 = torch.nn.Parameter(torch.empty(E, H, IN, dtype=torch.int8),
-                                requires_grad=False)
+        w2 = torch.nn.Parameter(
+            torch.empty(E, H, IN, dtype=torch.int8), requires_grad=False
+        )
         set_weight_attrs(w2, extra_weight_attrs)
         layer.register_parameter("w2_weight", w2)
 
@@ -1865,54 +2030,48 @@ def _n_scale_cols(in_features: int) -> int:
         # KleidiAI groupwise kernels accepts bfloat16 scales
         scale_dtype = torch.float32 if g == -1 else torch.bfloat16
 
-        w13_s = torch.nn.Parameter(torch.ones(E,
-                                              2 * IN,
-                                              _n_scale_cols(H),
-                                              dtype=scale_dtype),
-                                   requires_grad=False)
+        w13_s = torch.nn.Parameter(
+            torch.ones(E, 2 * IN, _n_scale_cols(H), dtype=scale_dtype),
+            requires_grad=False,
+        )
         set_weight_attrs(
-            w13_s, {
-                "quant_method": "channel" if g == -1 else "group",
-                **extra_weight_attrs
-            })
+            w13_s,
+            {"quant_method": "channel" if g == -1 else "group", **extra_weight_attrs},
+        )
         layer.register_parameter("w13_weight_scale", w13_s)
 
-        w2_s = torch.nn.Parameter(torch.ones(E,
-                                             H,
-                                             _n_scale_cols(IN),
-                                             dtype=scale_dtype),
-                                  requires_grad=False)
+        w2_s = torch.nn.Parameter(
+            torch.ones(E, H, _n_scale_cols(IN), dtype=scale_dtype), requires_grad=False
+        )
         set_weight_attrs(
-            w2_s, {
-                "quant_method": "channel" if g == -1 else "group",
-                **extra_weight_attrs
-            })
+            w2_s,
+            {"quant_method": "channel" if g == -1 else "group", **extra_weight_attrs},
+        )
         layer.register_parameter("w2_weight_scale", w2_s)
 
         if self.has_bias:
-            w13_bias = torch.nn.Parameter(torch.zeros(E,
-                                                      2 * IN,
-                                                      dtype=params_dtype),
-                                          requires_grad=False)
+            w13_bias = torch.nn.Parameter(
+                torch.zeros(E, 2 * IN, dtype=params_dtype), requires_grad=False
+            )
             layer.register_parameter("w13_bias", w13_bias)
             set_weight_attrs(w13_bias, extra_weight_attrs)
 
-            w2_bias = torch.nn.Parameter(torch.zeros(num_experts,
-                                                     hidden_size,
-                                                     dtype=params_dtype),
-                                         requires_grad=False)
+            w2_bias = torch.nn.Parameter(
+                torch.zeros(num_experts, hidden_size, dtype=params_dtype),
+                requires_grad=False,
+            )
             layer.register_parameter("w2_bias", w2_bias)
             set_weight_attrs(w2_bias, extra_weight_attrs)
 
         # Placeholders for packed weights (will be replaced after packing)
         layer.register_parameter(
-            "w13_weight_packed",
-            torch.nn.Parameter(torch.empty(0), requires_grad=False))
+            "w13_weight_packed", torch.nn.Parameter(torch.empty(0), requires_grad=False)
+        )
         set_weight_attrs(layer.w13_weight_packed, extra_weight_attrs)
 
         layer.register_parameter(
-            "w2_weight_packed",
-            torch.nn.Parameter(torch.empty(0), requires_grad=False))
+            "w2_weight_packed", torch.nn.Parameter(torch.empty(0), requires_grad=False)
+        )
         set_weight_attrs(layer.w2_weight_packed, extra_weight_attrs)
 
         # dims for 4 bit fused matmuls
@@ -1930,15 +2089,19 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         IN = layer.w2_in_features
         g = layer.group_size
 
-        def _pack_matrix(int4_as_int8_2d: torch.Tensor,
-                         scales_2d: torch.Tensor,
-                         bias_1d: Optional[torch.Tensor], in_features: int,
-                         out_features: int) -> torch.Tensor:
+        def _pack_matrix(
+            int4_as_int8_2d: torch.Tensor,
+            scales_2d: torch.Tensor,
+            bias_1d: Optional[torch.Tensor],
+            in_features: int,
+            out_features: int,
+        ) -> torch.Tensor:
             # int4 values are stored as int8 in [-8,7].
             # Shift to unsigned nibble and pack pairs along input-dim.
             tmp = int4_as_int8_2d.add(8)  # [out, in]
             uint8_nibbles = ((tmp[:, 1::2] << 4) | tmp[:, ::2]).to(
-                torch.uint8)  # [out, in//2]
+                torch.uint8
+            )  # [out, in//2]
 
             # KleidiAI groupwise kernels accepts float32 scales
             # KleidiAI groupwise kernels accepts bfloat16 scales
@@ -1946,15 +2109,19 @@ def _pack_matrix(int4_as_int8_2d: torch.Tensor,
             scales = scales_2d.to(scale_dtype)
             bias = None if bias_1d is None else bias_1d.to(torch.float32)
             return torch.ops.aten._dyn_quant_pack_4bit_weight(
-                uint8_nibbles, scales, bias, g if g != -1 else in_features,
-                in_features, out_features)
+                uint8_nibbles,
+                scales,
+                bias,
+                g if g != -1 else in_features,
+                in_features,
+                out_features,
+            )
 
         # Pack per expert
         w13_packed_list = []
         w2_packed_list = []
 
-        has_w13_bias = hasattr(layer,
-                               "w13_bias") and layer.w13_bias is not None
+        has_w13_bias = hasattr(layer, "w13_bias") and layer.w13_bias is not None
         has_w2_bias = hasattr(layer, "w2_bias") and layer.w2_bias is not None
 
         for e in range(E):
@@ -1964,7 +2131,9 @@ def _pack_matrix(int4_as_int8_2d: torch.Tensor,
                     layer.w13_weight_scale[e],  # [2I, H/g or 1]
                     layer.w13_bias[e] if has_w13_bias else None,  # [2I]
                     H,
-                    I2))
+                    I2,
+                )
+            )
             w2_packed_list.append(
                 _pack_matrix(
                     # w2 shape is [H, IN]; we need [out, in] == [H, IN].
@@ -1972,42 +2141,58 @@ def _pack_matrix(int4_as_int8_2d: torch.Tensor,
                     layer.w2_weight_scale[e],  # [H, IN/g or 1]
                     layer.w2_bias[e] if has_w2_bias else None,  # [H]
                     IN,
-                    layer.w2_out_features  # in_features=IN, out_features=H
-                ))
+                    layer.w2_out_features,  # in_features=IN, out_features=H
+                )
+            )
 
         # each packed tensor has identical shape per expert; stack on dim 0
         w13_packed = torch.stack(w13_packed_list, dim=0)
         w2_packed = torch.stack(w2_packed_list, dim=0)
 
-        replace_parameter(layer, "w13_weight_packed",
-                          torch.nn.Parameter(w13_packed, requires_grad=False))
-        replace_parameter(layer, "w2_weight_packed",
-                          torch.nn.Parameter(w2_packed, requires_grad=False))
+        replace_parameter(
+            layer,
+            "w13_weight_packed",
+            torch.nn.Parameter(w13_packed, requires_grad=False),
+        )
+        replace_parameter(
+            layer,
+            "w2_weight_packed",
+            torch.nn.Parameter(w2_packed, requires_grad=False),
+        )
 
         # free raw tensors/scales/bias now that they're packed into the payload.
         replace_parameter(
-            layer, "w13_weight",
-            torch.nn.Parameter(torch.empty(0), requires_grad=False))
+            layer, "w13_weight", torch.nn.Parameter(torch.empty(0), requires_grad=False)
+        )
         replace_parameter(
-            layer, "w2_weight",
-            torch.nn.Parameter(torch.empty(0), requires_grad=False))
+            layer, "w2_weight", torch.nn.Parameter(torch.empty(0), requires_grad=False)
+        )
         replace_parameter(
-            layer, "w13_weight_scale",
-            torch.nn.Parameter(torch.empty(0), requires_grad=False))
+            layer,
+            "w13_weight_scale",
+            torch.nn.Parameter(torch.empty(0), requires_grad=False),
+        )
         replace_parameter(
-            layer, "w2_weight_scale",
-            torch.nn.Parameter(torch.empty(0), requires_grad=False))
+            layer,
+            "w2_weight_scale",
+            torch.nn.Parameter(torch.empty(0), requires_grad=False),
+        )
         if has_w13_bias:
             replace_parameter(
-                layer, "w13_bias",
-                torch.nn.Parameter(torch.empty(0), requires_grad=False))
+                layer,
+                "w13_bias",
+                torch.nn.Parameter(torch.empty(0), requires_grad=False),
+            )
         if has_w2_bias:
             replace_parameter(
-                layer, "w2_bias",
-                torch.nn.Parameter(torch.empty(0), requires_grad=False))
+                layer,
+                "w2_bias",
+                torch.nn.Parameter(torch.empty(0), requires_grad=False),
+            )
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         # CPU dynamic 4-bit MoE path does not use modular kernels or
         # fused_experts; quant config is not needed.
         return None
@@ -2036,9 +2221,9 @@ def apply(
         logical_replica_count: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
         assert not enable_eplb, "EPLB not supported for W4A8-int MoE yet."
-        assert activation in (
-            "silu", "swigluoai",
-            "swiglu"), "Only SiLU/SwiGLUGU/SwiGLUUG are supported."
+        assert activation in ("silu", "swigluoai", "swiglu"), (
+            "Only SiLU/SwiGLUGU/SwiGLUUG are supported."
+        )
         assert expert_map is None, """expert_map/EP not implemented
         for CPU dyn-4bit MoE."""
 
@@ -2068,7 +2253,15 @@ def _act_kind(s: str) -> int:
         )
 
         return torch.ops._C.dynamic_4bit_int_moe(
-            x, topk_ids.to(torch.long), topk_weights, layer.w13_weight_packed,
-            layer.w2_weight_packed, layer.w2_out_features,
-            layer.w2_in_features, layer.w13_out_features, layer.group_size,
-            apply_router_weight_on_input, int(_act_kind(activation)))
\ No newline at end of file
+            x,
+            topk_ids.to(torch.long),
+            topk_weights,
+            layer.w13_weight_packed,
+            layer.w2_weight_packed,
+            layer.w2_out_features,
+            layer.w2_in_features,
+            layer.w13_out_features,
+            layer.group_size,
+            apply_router_weight_on_input,
+            int(_act_kind(activation)),
+        )
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/__init__.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/__init__.py
index cac65cca5093..fc0634394ece 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/__init__.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/__init__.py
@@ -5,23 +5,30 @@
 from .compressed_tensors_w4a4_nvfp4 import CompressedTensorsW4A4Fp4
 from .compressed_tensors_w4a8_fp8 import CompressedTensorsW4A8Fp8
 from .compressed_tensors_w4a8_int import CompressedTensorsW4A8Int
-from .compressed_tensors_w4a16_24 import (W4A16SPARSE24_SUPPORTED_BITS,
-                                          CompressedTensorsW4A16Sparse24)
+from .compressed_tensors_w4a16_24 import (
+    W4A16SPARSE24_SUPPORTED_BITS,
+    CompressedTensorsW4A16Sparse24,
+)
 from .compressed_tensors_w4a16_nvfp4 import CompressedTensorsW4A16Fp4
 from .compressed_tensors_w8a8_fp8 import CompressedTensorsW8A8Fp8
 from .compressed_tensors_w8a8_int8 import CompressedTensorsW8A8Int8
 from .compressed_tensors_w8a16_fp8 import CompressedTensorsW8A16Fp8
-from .compressed_tensors_wNa16 import (WNA16_SUPPORTED_BITS,
-                                       CompressedTensorsWNA16)
+from .compressed_tensors_wNa16 import WNA16_SUPPORTED_BITS, CompressedTensorsWNA16
 
 from .compressed_tensors_24 import CompressedTensors24  # isort: skip
 
 __all__ = [
-    "CompressedTensorsScheme", "CompressedTensorsWNA16",
-    "CompressedTensorsW8A16Fp8", "CompressedTensorsW4A16Sparse24",
-    "CompressedTensorsW8A8Int8", "CompressedTensorsW8A8Fp8",
-    "WNA16_SUPPORTED_BITS", "W4A16SPARSE24_SUPPORTED_BITS",
-    "CompressedTensors24", "CompressedTensorsW4A16Fp4",
-    "CompressedTensorsW4A4Fp4", "CompressedTensorsW4A8Int",
-    "CompressedTensorsW4A8Fp8"
+    "CompressedTensorsScheme",
+    "CompressedTensorsWNA16",
+    "CompressedTensorsW8A16Fp8",
+    "CompressedTensorsW4A16Sparse24",
+    "CompressedTensorsW8A8Int8",
+    "CompressedTensorsW8A8Fp8",
+    "WNA16_SUPPORTED_BITS",
+    "W4A16SPARSE24_SUPPORTED_BITS",
+    "CompressedTensors24",
+    "CompressedTensorsW4A16Fp4",
+    "CompressedTensorsW4A4Fp4",
+    "CompressedTensorsW4A8Int",
+    "CompressedTensorsW4A8Fp8",
 ]
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_24.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_24.py
index 168b221a9cfe..068eecf5e026 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_24.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_24.py
@@ -5,25 +5,33 @@
 
 import torch
 from compressed_tensors import CompressionFormat, ModelCompressor
-from compressed_tensors.quantization import (QuantizationArgs,
-                                             QuantizationStrategy,
-                                             QuantizationType)
+from compressed_tensors.quantization import (
+    QuantizationArgs,
+    QuantizationStrategy,
+    QuantizationType,
+)
 from compressed_tensors.utils import combine_shards
 
 from vllm import _custom_ops as ops
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+)
 from vllm.model_executor.layers.quantization.compressed_tensors.schemes import (
-    CompressedTensorsScheme)
+    CompressedTensorsScheme,
+)
 from vllm.model_executor.layers.quantization.input_quant_fp8 import QuantFP8
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape)
+from vllm.model_executor.layers.quantization.utils.quant_utils import GroupShape
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    convert_to_channelwise, sparse_cutlass_supported)
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           ChannelQuantScaleParameter,
-                                           ModelWeightParameter,
-                                           PerTensorScaleParameter)
+    convert_to_channelwise,
+    sparse_cutlass_supported,
+)
+from vllm.model_executor.parameter import (
+    BasevLLMParameter,
+    ChannelQuantScaleParameter,
+    ModelWeightParameter,
+    PerTensorScaleParameter,
+)
 
 __all__ = ["CompressedTensors24"]
 
@@ -31,7 +39,6 @@
 
 
 class CompressedTensors24(CompressedTensorsScheme):
-
     def __init__(
         self,
         quantized: bool = False,
@@ -44,14 +51,20 @@ def __init__(
         self.input_quant = input_quant
         self.model_compressor = (
             ModelCompressor.from_compression_config(model_compression_config)
-            if model_compression_config is not None else None)
+            if model_compression_config is not None
+            else None
+        )
         self.do_sparse_decompress = (
             self.model_compressor is not None
             and self.model_compressor.sparsity_config.format
-            == CompressionFormat.sparse_24_bitmask.value)
+            == CompressionFormat.sparse_24_bitmask.value
+        )
 
-        if quantized and input_quant is not None and \
-                self._get_quant_dtype() == current_platform.fp8_dtype():
+        if (
+            quantized
+            and input_quant is not None
+            and self._get_quant_dtype() == current_platform.fp8_dtype()
+        ):
             static = not input_quant.dynamic
             g_shape = GroupShape.PER_TENSOR if static else GroupShape.PER_TOKEN
             self.quant_fp8 = QuantFP8(static, g_shape)
@@ -74,7 +87,8 @@ def create_weights(
         if not sparse_cutlass_supported():
             raise ValueError(
                 "Sparse CUTLASS not supported. vLLM must be built with "
-                "CUDA 12.2 or later to use this feature")
+                "CUDA 12.2 or later to use this feature"
+            )
 
         layer.logical_widths = output_partition_sizes
         layer.input_size = input_size
@@ -93,9 +107,9 @@ def create_weights(
             weight_loader=weight_loader,
         )
         if self.do_sparse_decompress:
-            assert all(partition_size % 8 == 0
-                       for partition_size in output_partition_sizes
-                       ), "All partitions must be divisible by 8 for "
+            assert all(
+                partition_size % 8 == 0 for partition_size in output_partition_sizes
+            ), "All partitions must be divisible by 8 for "
             "2:4 sparse compressed models"
 
             shape = BasevLLMParameter(
@@ -130,20 +144,24 @@ def create_weights(
 
         # Check if quantized, not just 2:4 Sparse
         if self.quantized:
-            if (self.weight_quant and self.weight_quant.strategy
-                    == QuantizationStrategy.CHANNEL.value):
+            if (
+                self.weight_quant
+                and self.weight_quant.strategy == QuantizationStrategy.CHANNEL.value
+            ):
                 weight_scale = ChannelQuantScaleParameter(
-                    data=torch.empty((sum(output_partition_sizes), 1),
-                                     dtype=torch.float32),
+                    data=torch.empty(
+                        (sum(output_partition_sizes), 1), dtype=torch.float32
+                    ),
                     output_dim=0,
                     weight_loader=weight_loader,
                 )
             else:
-                assert (self.weight_quant and self.weight_quant.strategy
-                        == QuantizationStrategy.TENSOR.value)
+                assert (
+                    self.weight_quant
+                    and self.weight_quant.strategy == QuantizationStrategy.TENSOR.value
+                )
                 weight_scale = PerTensorScaleParameter(
-                    data=torch.empty(len(output_partition_sizes),
-                                     dtype=torch.float32),
+                    data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
                     weight_loader=weight_loader,
                 )
 
@@ -152,8 +170,7 @@ def create_weights(
             # input quant will be non-none
             if self.input_quant and not self.input_quant.dynamic:
                 # register input quant scale
-                assert (self.input_quant.strategy ==
-                        QuantizationStrategy.TENSOR.value)
+                assert self.input_quant.strategy == QuantizationStrategy.TENSOR.value
                 input_scale = BasevLLMParameter(
                     data=torch.empty(1, dtype=torch.float32),
                     weight_loader=weight_loader,
@@ -163,12 +180,12 @@ def create_weights(
 
         else:
             # for sparse-only, pass in 1 for weight/input scales
-            weight_scale = torch.nn.Parameter(data=torch.ones(
-                1, dtype=torch.float32),
-                                              requires_grad=False)
-            input_scale = torch.nn.Parameter(data=torch.ones(
-                1, dtype=torch.float32),
-                                             requires_grad=False)
+            weight_scale = torch.nn.Parameter(
+                data=torch.ones(1, dtype=torch.float32), requires_grad=False
+            )
+            input_scale = torch.nn.Parameter(
+                data=torch.ones(1, dtype=torch.float32), requires_grad=False
+            )
             layer.register_parameter("input_scale", input_scale)
             layer.register_parameter("weight_scale", weight_scale)
 
@@ -199,8 +216,9 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
 
         # torch.compile workaround
         if hasattr(layer, "input_scale"):
-            layer.input_scale = torch.nn.Parameter(layer.input_scale.data,
-                                                   requires_grad=False)
+            layer.input_scale = torch.nn.Parameter(
+                layer.input_scale.data, requires_grad=False
+            )
 
         if self.weight_quant:
             if self.weight_quant.strategy == QuantizationStrategy.TENSOR.value:
@@ -214,11 +232,11 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             else:
                 # torch.compile workaround
                 layer.weight_scale = torch.nn.Parameter(
-                    layer.weight_scale.data, requires_grad=False)
+                    layer.weight_scale.data, requires_grad=False
+                )
 
         # Set all negative zero values to 0 prior to compression
-        if (layer.weight.dtype.is_floating_point
-                and layer.weight.dtype.itemsize >= 2):
+        if layer.weight.dtype.is_floating_point and layer.weight.dtype.itemsize >= 2:
             layer.weight.data[layer.weight.data == -0.0] = 0.0
 
         w_compressed, meta = ops.cutlass_sparse_compress(layer.weight.data)
@@ -243,7 +261,7 @@ def apply_weights(
         :return: The output tensor of the layer
         """
         if self.quantized:
-            scale = getattr(layer, 'input_scale', None)
+            scale = getattr(layer, "input_scale", None)
 
             if self.weights_dtype == torch.int8:
                 ops_output = ops.scaled_int8_quant(x, scale=scale)
@@ -286,12 +304,16 @@ def _get_quant_dtype(self) -> torch.dtype:
         if not is_8_bits:
             raise ValueError("Cutlass only supports 8-bit quantization")
 
-        if (self.weight_quant.type == QuantizationType.FLOAT
-                and self.input_quant.type == QuantizationType.FLOAT):
+        if (
+            self.weight_quant.type == QuantizationType.FLOAT
+            and self.input_quant.type == QuantizationType.FLOAT
+        ):
             return torch.float8_e4m3fn
 
-        if (self.weight_quant.type == QuantizationType.INT
-                and self.input_quant.type == QuantizationType.INT):
+        if (
+            self.weight_quant.type == QuantizationType.INT
+            and self.input_quant.type == QuantizationType.INT
+        ):
             return torch.int8
 
         raise ValueError("Quantization type not supported by Cutlass")
@@ -317,7 +339,7 @@ def _decompress_bitmask_compressed_weight(
         :param bitmask: The 2:4 bitmask associated with the compressed weights,
             representing the positions of non-zero elements in the compressed
             tensor.
-        :param layer: The layer whose weights need to be processed after 
+        :param layer: The layer whose weights need to be processed after
             loading.
         :return: The decompressed 2:4 sparse weight tensor.
         """
@@ -343,14 +365,16 @@ def _process_split(
         if isinstance(layer, (QKVParallelLinear, MergedColumnParallelLinear)):
             split_weights = torch.split(compressed, layer.logical_widths)
             split_bitmask = torch.split(bitmask, layer.logical_widths)
-            split_shape = [(out, layer.input_size_per_partition)
-                           for out in layer.logical_widths]
+            split_shape = [
+                (out, layer.input_size_per_partition) for out in layer.logical_widths
+            ]
 
         if split_weights:
             decompressed_shards = [
                 _process_split(compressed_weight, shape, bitmask)
                 for compressed_weight, shape, bitmask in zip(
-                    split_weights, split_shape, split_bitmask)
+                    split_weights, split_shape, split_bitmask
+                )
             ]
             decompressed = combine_shards(decompressed_shards)
         else:
@@ -362,5 +386,6 @@ def _process_split(
                         layer.input_size_per_partition,
                     ),
                     bitmask=bitmask,
-                ))
+                )
+            )
         return decompressed
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_scheme.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_scheme.py
index a5d48f235674..688621cbf79a 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_scheme.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_scheme.py
@@ -11,7 +11,7 @@
 
 class CompressedTensorsScheme(ABC):
     """
-    Abstract class used to describe the weight creation and forward pass 
+    Abstract class used to describe the weight creation and forward pass
     of different quantization schemes supported by CompressedTensors.
     """
 
@@ -26,20 +26,21 @@ def get_min_capability(cls) -> int:
     @abstractmethod
     def create_weights(self, *args, **kwargs):
         """
-        Weight creation for the particular scheme. Inputs to this function 
+        Weight creation for the particular scheme. Inputs to this function
 
         """
         raise NotImplementedError
 
     @abstractmethod
-    def apply_weights(self, layer: torch.nn.Module, x: torch.Tensor,
-                      bias: Optional[torch.Tensor]):
+    def apply_weights(
+        self, layer: torch.nn.Module, x: torch.Tensor, bias: Optional[torch.Tensor]
+    ):
         """
-        Run the forward pass for the particular scheme. This is where 
+        Run the forward pass for the particular scheme. This is where
         scheme-specific dequant/quant steps/kernels should be applied.
 
-        :param layer: torch.nn.Module with the registered weights and 
-            other parameters relevant to the particular scheme. 
+        :param layer: torch.nn.Module with the registered weights and
+            other parameters relevant to the particular scheme.
         :param x: input to the layer
         :param bias: bias parameter
 
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a16_24.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a16_24.py
index 3f3e7668fcf7..af06418c959d 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a16_24.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a16_24.py
@@ -8,13 +8,18 @@
 
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.compressed_tensors.schemes import (
-    CompressedTensorsScheme)
+    CompressedTensorsScheme,
+)
 from vllm.model_executor.layers.quantization.gptq_marlin_24 import (
-    GPTQ_MARLIN_24_MAX_PARALLEL, GPTQ_MARLIN_24_MIN_THREAD_N)
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           ChannelQuantScaleParameter,
-                                           GroupQuantScaleParameter,
-                                           PackedvLLMParameter)
+    GPTQ_MARLIN_24_MAX_PARALLEL,
+    GPTQ_MARLIN_24_MIN_THREAD_N,
+)
+from vllm.model_executor.parameter import (
+    BasevLLMParameter,
+    ChannelQuantScaleParameter,
+    GroupQuantScaleParameter,
+    PackedvLLMParameter,
+)
 from vllm.scalar_type import scalar_types
 
 __all__ = ["CompressedTensorsW4A16Sparse24"]
@@ -25,11 +30,7 @@
 
 
 class CompressedTensorsW4A16Sparse24(CompressedTensorsScheme):
-
-    def __init__(self,
-                 strategy: str,
-                 num_bits: int,
-                 group_size: Optional[int] = None):
+    def __init__(self, strategy: str, num_bits: int, group_size: Optional[int] = None):
         self.strategy = strategy
         self.group_size = group_size
         self.tile_size = 16
@@ -37,13 +38,13 @@ def __init__(self,
         if num_bits not in W4A16SPARSE24_SUPPORTED_TYPES_MAP:
             raise ValueError(
                 f"Unsupported num_bits = {num_bits}. "
-                f"Supported num_bits = {W4A16SPARSE24_SUPPORTED_BITS}")
+                f"Supported num_bits = {W4A16SPARSE24_SUPPORTED_BITS}"
+            )
 
         self.quant_type = W4A16SPARSE24_SUPPORTED_TYPES_MAP[num_bits]
 
         if self.strategy == "group" and self.group_size is None:
-            raise ValueError(
-                "group_size must be given when using strategy group")
+            raise ValueError("group_size must be given when using strategy group")
 
     @classmethod
     def get_min_capability(cls) -> int:
@@ -52,18 +53,20 @@ def get_min_capability(cls) -> int:
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         # required by torch.compile to be torch.nn.Parameter
-        layer.weight_packed = Parameter(layer.weight_packed.data,
-                                        requires_grad=False)
-        layer.scale_packed = Parameter(layer.scale_packed.data,
-                                       requires_grad=False)
+        layer.weight_packed = Parameter(layer.weight_packed.data, requires_grad=False)
+        layer.scale_packed = Parameter(layer.scale_packed.data, requires_grad=False)
         layer.meta = Parameter(layer.meta.data, requires_grad=False)
 
-    def create_weights(self, layer: torch.nn.Module, input_size: int,
-                       output_partition_sizes: list[int],
-                       input_size_per_partition: int,
-                       params_dtype: torch.dtype, weight_loader: Callable,
-                       **kwargs):
-
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        input_size: int,
+        output_partition_sizes: list[int],
+        input_size_per_partition: int,
+        params_dtype: torch.dtype,
+        weight_loader: Callable,
+        **kwargs,
+    ):
         assert params_dtype == torch.float16, (
             "float16 is required for marlin24 compressed models. Set dtype=torch.float16"  # noqa: E501
         )
@@ -71,55 +74,59 @@ def create_weights(self, layer: torch.nn.Module, input_size: int,
         pack_factor = 32 // self.quant_type.size_bits
         output_size_per_partition = sum(output_partition_sizes)
 
-        qweight = PackedvLLMParameter(data=torch.empty(
-            input_size_per_partition // self.tile_size // 2,
-            output_size_per_partition * self.tile_size // pack_factor,
-            dtype=torch.int32,
-        ),
-                                      input_dim=0,
-                                      output_dim=1,
-                                      packed_dim=1,
-                                      packed_factor=pack_factor,
-                                      marlin_tile_size=self.tile_size,
-                                      weight_loader=weight_loader)
-
-        input_groups = (1 if self.group_size is None else
-                        input_size_per_partition // self.group_size)
+        qweight = PackedvLLMParameter(
+            data=torch.empty(
+                input_size_per_partition // self.tile_size // 2,
+                output_size_per_partition * self.tile_size // pack_factor,
+                dtype=torch.int32,
+            ),
+            input_dim=0,
+            output_dim=1,
+            packed_dim=1,
+            packed_factor=pack_factor,
+            marlin_tile_size=self.tile_size,
+            weight_loader=weight_loader,
+        )
+
+        input_groups = (
+            1
+            if self.group_size is None
+            else input_size_per_partition // self.group_size
+        )
 
         weight_scale_args = {
-            "data":
-            torch.empty(
+            "data": torch.empty(
                 input_groups,
                 output_size_per_partition,
                 dtype=params_dtype,
             ),
-            "weight_loader":
-            weight_loader
+            "weight_loader": weight_loader,
         }
 
         if self.group_size is not None:
-            scales = GroupQuantScaleParameter(output_dim=1,
-                                              input_dim=0,
-                                              **weight_scale_args)
+            scales = GroupQuantScaleParameter(
+                output_dim=1, input_dim=0, **weight_scale_args
+            )
         else:
-            scales = ChannelQuantScaleParameter(output_dim=1,
-                                                **weight_scale_args)
-
-        weight_shape = BasevLLMParameter(data=torch.empty(2,
-                                                          dtype=torch.int64),
-                                         weight_loader=weight_loader)
-
-        meta = PackedvLLMParameter(data=torch.empty(
-            input_size_per_partition // 8 // 2 // 2,
-            output_size_per_partition * 2,
-            dtype=torch.int16,
-        ),
-                                   input_dim=0,
-                                   output_dim=1,
-                                   packed_dim=1,
-                                   packed_factor=1,
-                                   marlin_tile_size=2,
-                                   weight_loader=weight_loader)
+            scales = ChannelQuantScaleParameter(output_dim=1, **weight_scale_args)
+
+        weight_shape = BasevLLMParameter(
+            data=torch.empty(2, dtype=torch.int64), weight_loader=weight_loader
+        )
+
+        meta = PackedvLLMParameter(
+            data=torch.empty(
+                input_size_per_partition // 8 // 2 // 2,
+                output_size_per_partition * 2,
+                dtype=torch.int16,
+            ),
+            input_dim=0,
+            output_dim=1,
+            packed_dim=1,
+            packed_factor=1,
+            marlin_tile_size=2,
+            weight_loader=weight_loader,
+        )
 
         layer.register_parameter("weight_packed", qweight)
         layer.register_parameter("weight_shape", weight_shape)
@@ -127,16 +134,17 @@ def create_weights(self, layer: torch.nn.Module, input_size: int,
         layer.register_parameter("meta", meta)
 
         max_workspace_size = (
-            output_size_per_partition //
-            GPTQ_MARLIN_24_MIN_THREAD_N) * GPTQ_MARLIN_24_MAX_PARALLEL
+            output_size_per_partition // GPTQ_MARLIN_24_MIN_THREAD_N
+        ) * GPTQ_MARLIN_24_MAX_PARALLEL
 
-        workspace = Parameter(torch.zeros(max_workspace_size, dtype=torch.int),
-                              requires_grad=False)
+        workspace = Parameter(
+            torch.zeros(max_workspace_size, dtype=torch.int), requires_grad=False
+        )
         layer.workspace = workspace
 
-    def apply_weights(self, layer: torch.nn.Module, x: torch.Tensor,
-                      bias: Optional[torch.Tensor]) -> torch.Tensor:
-
+    def apply_weights(
+        self, layer: torch.nn.Module, x: torch.Tensor, bias: Optional[torch.Tensor]
+    ) -> torch.Tensor:
         qweight = layer.weight_packed
         meta = layer.meta
         scales = layer.scale_packed
@@ -148,11 +156,19 @@ def apply_weights(self, layer: torch.nn.Module, x: torch.Tensor,
         size_k = x_2d.shape[1]
         size_n = scales.shape[1]
 
-        output_2d = ops.gptq_marlin_24_gemm(x_2d, qweight, meta, scales,
-                                            workspace, self.quant_type, size_m,
-                                            size_n, size_k)
+        output_2d = ops.gptq_marlin_24_gemm(
+            x_2d,
+            qweight,
+            meta,
+            scales,
+            workspace,
+            self.quant_type,
+            size_m,
+            size_n,
+            size_k,
+        )
 
-        output = output_2d.view(x.shape[:-1] + (output_2d.shape[1], ))
+        output = output_2d.view(x.shape[:-1] + (output_2d.shape[1],))
 
         if bias is not None:
             output.add_(bias)  # In-place add
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a16_nvfp4.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a16_nvfp4.py
index 96dccf04d490..a96f51538b38 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a16_nvfp4.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a16_nvfp4.py
@@ -6,18 +6,22 @@
 from torch.nn.parameter import Parameter
 
 from vllm.model_executor.layers.quantization.compressed_tensors.schemes import (
-    CompressedTensorsScheme)
+    CompressedTensorsScheme,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp4 import (
-    apply_fp4_marlin_linear, prepare_fp4_layer_for_marlin)
-from vllm.model_executor.parameter import (GroupQuantScaleParameter,
-                                           ModelWeightParameter,
-                                           PerTensorScaleParameter)
+    apply_fp4_marlin_linear,
+    prepare_fp4_layer_for_marlin,
+)
+from vllm.model_executor.parameter import (
+    GroupQuantScaleParameter,
+    ModelWeightParameter,
+    PerTensorScaleParameter,
+)
 
 __all__ = ["CompressedTensorsW4A16Fp4"]
 
 
 class CompressedTensorsW4A16Fp4(CompressedTensorsScheme):
-
     def __init__(self, has_input_global_scale: bool = False):
         self.has_input_global_scale = has_input_global_scale
         self.group_size = 16
@@ -27,49 +31,59 @@ def get_min_capability(cls) -> int:
         # dont restrict as emulations
         return 80
 
-    def create_weights(self, layer: torch.nn.Module,
-                       output_partition_sizes: list[int],
-                       input_size_per_partition: int,
-                       params_dtype: torch.dtype, weight_loader: Callable,
-                       **kwargs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        output_partition_sizes: list[int],
+        input_size_per_partition: int,
+        params_dtype: torch.dtype,
+        weight_loader: Callable,
+        **kwargs,
+    ):
         output_size_per_partition = sum(output_partition_sizes)
         layer.logical_widths = output_partition_sizes
         layer.input_size_per_partition = input_size_per_partition
         layer.output_size_per_partition = output_size_per_partition
 
         # Weight
-        weight = ModelWeightParameter(data=torch.empty(
-            sum(output_partition_sizes),
-            input_size_per_partition // 2,
-            dtype=torch.uint8),
-                                      input_dim=1,
-                                      output_dim=0,
-                                      weight_loader=weight_loader)
+        weight = ModelWeightParameter(
+            data=torch.empty(
+                sum(output_partition_sizes),
+                input_size_per_partition // 2,
+                dtype=torch.uint8,
+            ),
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("weight_packed", weight)
 
         # Global Weight Scale
         weight_global_scale = PerTensorScaleParameter(
             data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("weight_global_scale", weight_global_scale)
 
         # Per Group Weight Scale
-        weight_scale = GroupQuantScaleParameter(data=torch.empty(
-            sum(output_partition_sizes),
-            input_size_per_partition // self.group_size,
-            dtype=torch.float8_e4m3fn,
-        ),
-                                                input_dim=1,
-                                                output_dim=0,
-                                                weight_loader=weight_loader)
+        weight_scale = GroupQuantScaleParameter(
+            data=torch.empty(
+                sum(output_partition_sizes),
+                input_size_per_partition // self.group_size,
+                dtype=torch.float8_e4m3fn,
+            ),
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
 
         layer.register_parameter("weight_scale", weight_scale)
 
         if self.has_input_global_scale:
             input_global_scale = PerTensorScaleParameter(
-                data=torch.empty(len(output_partition_sizes),
-                                 dtype=torch.float32),
-                weight_loader=weight_loader)
+                data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
+                weight_loader=weight_loader,
+            )
             layer.register_parameter("input_global_scale", input_global_scale)
 
     def process_weights_after_loading(self, layer) -> None:
@@ -81,25 +95,30 @@ def process_weights_after_loading(self, layer) -> None:
         # Rename weight_global_scale to weight_scale_2 that marlin expects
         # Note: ct stores the inverse of what is expected by the marlin kernel
         layer.weight_scale_2 = Parameter(
-            1 / layer.weight_global_scale.max().to(torch.float32),
-            requires_grad=False)
+            1 / layer.weight_global_scale.max().to(torch.float32), requires_grad=False
+        )
         del layer.weight_global_scale
 
         if self.has_input_global_scale:
             layer.input_global_scale = torch.nn.Parameter(
-                layer.input_global_scale.data, requires_grad=False)
+                layer.input_global_scale.data, requires_grad=False
+            )
 
         prepare_fp4_layer_for_marlin(layer)
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
-        return apply_fp4_marlin_linear(input=x,
-                                       weight=layer.weight,
-                                       weight_scale=layer.weight_scale,
-                                       weight_scale_2=layer.weight_scale_2,
-                                       workspace=layer.workspace,
-                                       size_n=layer.output_size_per_partition,
-                                       size_k=layer.input_size_per_partition,
-                                       bias=bias)
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
+        return apply_fp4_marlin_linear(
+            input=x,
+            weight=layer.weight,
+            weight_scale=layer.weight_scale,
+            weight_scale_2=layer.weight_scale_2,
+            workspace=layer.workspace,
+            size_n=layer.output_size_per_partition,
+            size_k=layer.input_size_per_partition,
+            bias=bias,
+        )
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a4_nvfp4.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a4_nvfp4.py
index d472427756d4..676f4de6ee7b 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a4_nvfp4.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a4_nvfp4.py
@@ -9,14 +9,17 @@
 from vllm._custom_ops import cutlass_scaled_fp4_mm, scaled_fp4_quant
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.compressed_tensors.schemes import (
-    CompressedTensorsScheme)
+    CompressedTensorsScheme,
+)
 from vllm.model_executor.layers.quantization.utils.nvfp4_emulation_utils import (  # noqa: E501
-    run_nvfp4_emulations)
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    swizzle_blockscale)
-from vllm.model_executor.parameter import (GroupQuantScaleParameter,
-                                           ModelWeightParameter,
-                                           PerTensorScaleParameter)
+    run_nvfp4_emulations,
+)
+from vllm.model_executor.layers.quantization.utils.quant_utils import swizzle_blockscale
+from vllm.model_executor.parameter import (
+    GroupQuantScaleParameter,
+    ModelWeightParameter,
+    PerTensorScaleParameter,
+)
 from vllm.utils.flashinfer import flashinfer_scaled_fp4_mm, has_flashinfer
 
 logger = init_logger(__name__)
@@ -25,7 +28,6 @@
 
 
 class CompressedTensorsW4A4Fp4(CompressedTensorsScheme):
-
     def __init__(self):
         if envs.VLLM_USE_TRTLLM_FP4_GEMM:
             assert has_flashinfer(), "TRTLLM FP4 GEMM requires FlashInfer"
@@ -54,58 +56,67 @@ def get_min_capability(cls) -> int:
             return 80
         return 100
 
-    def create_weights(self, layer: torch.nn.Module,
-                       output_partition_sizes: list[int],
-                       input_size_per_partition: int,
-                       params_dtype: torch.dtype, weight_loader: Callable,
-                       **kwargs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        output_partition_sizes: list[int],
+        input_size_per_partition: int,
+        params_dtype: torch.dtype,
+        weight_loader: Callable,
+        **kwargs,
+    ):
         output_size_per_partition = sum(output_partition_sizes)
         layer.logical_widths = output_partition_sizes
         layer.input_size_per_partition = input_size_per_partition
         layer.output_size_per_partition = output_size_per_partition
 
         # Weight
-        weight = ModelWeightParameter(data=torch.empty(
-            sum(output_partition_sizes),
-            input_size_per_partition // 2,
-            dtype=torch.uint8),
-                                      input_dim=1,
-                                      output_dim=0,
-                                      weight_loader=weight_loader)
+        weight = ModelWeightParameter(
+            data=torch.empty(
+                sum(output_partition_sizes),
+                input_size_per_partition // 2,
+                dtype=torch.uint8,
+            ),
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("weight_packed", weight)
 
         # Global Weight Scale
         weight_global_scale = PerTensorScaleParameter(
             data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("weight_global_scale", weight_global_scale)
 
         # Per Group Weight Scale
-        weight_scale = GroupQuantScaleParameter(data=torch.empty(
-            sum(output_partition_sizes),
-            input_size_per_partition // self.group_size,
-            dtype=torch.float8_e4m3fn,
-        ),
-                                                input_dim=1,
-                                                output_dim=0,
-                                                weight_loader=weight_loader)
+        weight_scale = GroupQuantScaleParameter(
+            data=torch.empty(
+                sum(output_partition_sizes),
+                input_size_per_partition // self.group_size,
+                dtype=torch.float8_e4m3fn,
+            ),
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
 
         layer.register_parameter("weight_scale", weight_scale)
 
         input_global_scale = PerTensorScaleParameter(
             data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("input_global_scale", input_global_scale)
 
     def process_weights_after_loading(self, layer) -> None:
-
         global_input_scale = layer.input_global_scale.max().to(torch.float32)
-        layer.input_global_scale = Parameter(global_input_scale,
-                                             requires_grad=False)
+        layer.input_global_scale = Parameter(global_input_scale, requires_grad=False)
 
         layer.weight_global_scale = Parameter(
-            layer.weight_global_scale.max().to(torch.float32),
-            requires_grad=False)
+            layer.weight_global_scale.max().to(torch.float32), requires_grad=False
+        )
 
         if self.backend == "flashinfer-trtllm":
             # FlashInfer TRTLLM FP4 GEMM requires a different weight layout.
@@ -118,40 +129,43 @@ def process_weights_after_loading(self, layer) -> None:
             weight_scale = layer.weight_scale.data
 
             epilogue_tile_m = 128
-            weight = shuffle_matrix_a(weight.view(torch.uint8),
-                                      epilogue_tile_m)
-            weight_scale = (shuffle_matrix_sf_a(weight_scale.view(
-                torch.uint8), epilogue_tile_m).reshape(
-                    weight_scale.shape).view(torch.float8_e4m3fn))
+            weight = shuffle_matrix_a(weight.view(torch.uint8), epilogue_tile_m)
+            weight_scale = (
+                shuffle_matrix_sf_a(weight_scale.view(torch.uint8), epilogue_tile_m)
+                .reshape(weight_scale.shape)
+                .view(torch.float8_e4m3fn)
+            )
 
             layer.weight_scale = Parameter(weight_scale, requires_grad=False)
             layer.weight_packed = Parameter(weight, requires_grad=False)
         else:
             swizzled_weight_scale = swizzle_blockscale(layer.weight_scale)
             if self.backend == "fbgemm":
-                swizzled_weight_scale = swizzled_weight_scale.view(-1).view(
-                    torch.uint8)
-            layer.weight_scale = Parameter(swizzled_weight_scale,
-                                           requires_grad=False)
-            layer.weight_packed = Parameter(layer.weight_packed.data,
-                                            requires_grad=False)
+                swizzled_weight_scale = swizzled_weight_scale.view(-1).view(torch.uint8)
+            layer.weight_scale = Parameter(swizzled_weight_scale, requires_grad=False)
+            layer.weight_packed = Parameter(
+                layer.weight_packed.data, requires_grad=False
+            )
 
         layer.alpha = Parameter(
             1 / (layer.input_global_scale * layer.weight_global_scale),
-            requires_grad=False)
-
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
-
+            requires_grad=False,
+        )
+
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         if envs.VLLM_USE_NVFP4_CT_EMULATIONS:
             out = run_nvfp4_emulations(
                 x=x,
                 input_global_scale=layer.input_global_scale,
                 weight=layer.weight_packed,
                 weight_scale_swizzled=layer.weight_scale,
-                weight_global_scale=layer.weight_global_scale)
+                weight_global_scale=layer.weight_global_scale,
+            )
             if bias is not None:
                 out = out + bias
             return out
@@ -162,8 +176,14 @@ def apply_weights(self,
         # quantize BF16 or FP16 to (FP4 and interleaved block scale)
         x_fp4, x_blockscale = scaled_fp4_quant(x, layer.input_global_scale)
 
-        mm_args = (x_fp4, layer.weight_packed, x_blockscale,
-                   layer.weight_scale, layer.alpha, output_dtype)
+        mm_args = (
+            x_fp4,
+            layer.weight_packed,
+            x_blockscale,
+            layer.weight_scale,
+            layer.alpha,
+            output_dtype,
+        )
         if self.backend == "flashinfer-trtllm":
             out = flashinfer_scaled_fp4_mm(*mm_args, backend="trtllm")
         elif self.backend == "flashinfer-cutlass":
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a8_fp8.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a8_fp8.py
index 3d9827058803..92469657409f 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a8_fp8.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a8_fp8.py
@@ -8,17 +8,25 @@
 
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.compressed_tensors.schemes import (
-    CompressedTensorsScheme)
+    CompressedTensorsScheme,
+)
 from vllm.model_executor.layers.quantization.kernels.mixed_precision import (
-    MPLinearLayerConfig, choose_mp_linear_kernel)
+    MPLinearLayerConfig,
+    choose_mp_linear_kernel,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-    marlin_repeat_scales_on_all_ranks)
+    marlin_repeat_scales_on_all_ranks,
+)
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           ChannelQuantScaleParameter,
-                                           GroupQuantScaleParameter,
-                                           PackedvLLMParameter)
+from vllm.model_executor.parameter import (
+    BasevLLMParameter,
+    ChannelQuantScaleParameter,
+    GroupQuantScaleParameter,
+    PackedvLLMParameter,
+)
+
 # yapf: enable
 from vllm.scalar_type import scalar_types
 
@@ -34,13 +42,14 @@
 class CompressedTensorsW4A8Fp8(CompressedTensorsScheme):
     _kernel_backends_being_used: set[str] = set()
 
-    def __init__(self,
-                 strategy: str,
-                 num_bits: int,
-                 group_size: Optional[int] = None,
-                 symmetric: Optional[bool] = True,
-                 actorder: Optional[ActivationOrdering] = None):
-
+    def __init__(
+        self,
+        strategy: str,
+        num_bits: int,
+        group_size: Optional[int] = None,
+        symmetric: Optional[bool] = True,
+        actorder: Optional[ActivationOrdering] = None,
+    ):
         self.pack_factor = 32 // num_bits
         self.strategy = strategy
         self.symmetric = symmetric
@@ -48,13 +57,15 @@ def __init__(self,
         self.has_g_idx = actorder == ActivationOrdering.GROUP
 
         if self.group_size != 128 or self.strategy != "group":
-            raise ValueError("W4A8 kernels require group quantization " \
-            "with group size 128")
+            raise ValueError(
+                "W4A8 kernels require group quantization with group size 128"
+            )
 
         if num_bits not in W4A8_SUPPORTED_TYPES_MAP:
             raise ValueError(
                 f"Unsupported num_bits = {num_bits}. "
-                f"Supported num_bits = {W4A8_SUPPORTED_TYPES_MAP.keys()}")
+                f"Supported num_bits = {W4A8_SUPPORTED_TYPES_MAP.keys()}"
+            )
 
         self.quant_type = W4A8_SUPPORTED_TYPES_MAP[num_bits]
 
@@ -63,38 +74,45 @@ def get_min_capability(cls) -> int:
         # hopper
         return 90
 
-    def create_weights(self, layer: torch.nn.Module, output_size: int,
-                       input_size: int, output_partition_sizes: list[int],
-                       input_size_per_partition: int,
-                       params_dtype: torch.dtype, weight_loader: Callable,
-                       **kwargs):
-
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        output_size: int,
+        input_size: int,
+        output_partition_sizes: list[int],
+        input_size_per_partition: int,
+        params_dtype: torch.dtype,
+        weight_loader: Callable,
+        **kwargs,
+    ):
         output_size_per_partition = sum(output_partition_sizes)
 
         mp_linear_kernel_config = MPLinearLayerConfig(
             full_weight_shape=(input_size, output_size),
-            partition_weight_shape=\
-                (input_size_per_partition, output_size_per_partition),
+            partition_weight_shape=(
+                input_size_per_partition,
+                output_size_per_partition,
+            ),
             weight_type=self.quant_type,
             act_type=torch.float8_e4m3fn,  # always use fp8(e4m3)
             group_size=self.group_size,
             zero_points=not self.symmetric,
             has_g_idx=self.has_g_idx,
-            out_type=params_dtype
+            out_type=params_dtype,
         )
 
         kernel_type = choose_mp_linear_kernel(mp_linear_kernel_config)
 
         if kernel_type.__name__ not in self._kernel_backends_being_used:
-            logger.info("Using %s for CompressedTensorsW4A8Fp8",
-                        kernel_type.__name__)
+            logger.info("Using %s for CompressedTensorsW4A8Fp8", kernel_type.__name__)
             self._kernel_backends_being_used.add(kernel_type.__name__)
 
         # If group_size is -1, we are in channelwise case.
         group_size = self.group_size if self.group_size != -1 else input_size
-        row_parallel = (input_size != input_size_per_partition)
+        row_parallel = input_size != input_size_per_partition
         partition_scales = not marlin_repeat_scales_on_all_ranks(
-            self.has_g_idx, self.group_size, row_parallel)
+            self.has_g_idx, self.group_size, row_parallel
+        )
 
         scales_and_zp_size = input_size // group_size
 
@@ -102,68 +120,69 @@ def create_weights(self, layer: torch.nn.Module, output_size: int,
             assert input_size_per_partition % group_size == 0
             scales_and_zp_size = input_size_per_partition // group_size
 
-        weight = PackedvLLMParameter(input_dim=1,
-                                     output_dim=0,
-                                     weight_loader=weight_loader,
-                                     packed_factor=self.pack_factor,
-                                     packed_dim=1,
-                                     data=torch.empty(
-                                         output_size_per_partition,
-                                         input_size_per_partition //
-                                         self.pack_factor,
-                                         dtype=torch.int32,
-                                     ))
+        weight = PackedvLLMParameter(
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+            packed_factor=self.pack_factor,
+            packed_dim=1,
+            data=torch.empty(
+                output_size_per_partition,
+                input_size_per_partition // self.pack_factor,
+                dtype=torch.int32,
+            ),
+        )
 
         # TODO(czhu): allocate the packed fp8 scales memory here?
         # the scales will be expanded by 8x via `cutlass_pack_scale_fp8`
         weight_scale_args = {
-            "weight_loader":
-            weight_loader,
-            "data":
-            torch.empty(
+            "weight_loader": weight_loader,
+            "data": torch.empty(
                 output_size_per_partition,
                 scales_and_zp_size,
                 dtype=torch.float8_e4m3fn,
-            )
+            ),
         }
 
         if not partition_scales:
-            weight_scale = ChannelQuantScaleParameter(output_dim=0,
-                                                      **weight_scale_args)
+            weight_scale = ChannelQuantScaleParameter(output_dim=0, **weight_scale_args)
         else:
-            weight_scale = GroupQuantScaleParameter(output_dim=0,
-                                                    input_dim=1,
-                                                    **weight_scale_args)
+            weight_scale = GroupQuantScaleParameter(
+                output_dim=0, input_dim=1, **weight_scale_args
+            )
 
         # A 2D array defining the original shape of the weights
         # before packing
-        weight_shape = BasevLLMParameter(data=torch.empty(2,
-                                                          dtype=torch.int64),
-                                         weight_loader=weight_loader)
+        weight_shape = BasevLLMParameter(
+            data=torch.empty(2, dtype=torch.int64), weight_loader=weight_loader
+        )
 
         # per-channel scales
         weight_chan_scale = ChannelQuantScaleParameter(
-            data=torch.empty((output_size_per_partition, 1),
-                             dtype=torch.float32),
+            data=torch.empty((output_size_per_partition, 1), dtype=torch.float32),
             output_dim=0,
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
 
         layer.register_parameter("weight_packed", weight)
         layer.register_parameter("weight_scale", weight_scale)
         layer.register_parameter("weight_shape", weight_shape)
         layer.register_parameter("weight_chan_scale", weight_chan_scale)
 
-        self.kernel = kernel_type(mp_linear_kernel_config,
-                                  w_q_param_name="weight_packed",
-                                  w_s_param_name="weight_scale",
-                                  w_zp_param_name="weight_zero_point",
-                                  w_gidx_param_name="weight_g_idx")
+        self.kernel = kernel_type(
+            mp_linear_kernel_config,
+            w_q_param_name="weight_packed",
+            w_s_param_name="weight_scale",
+            w_zp_param_name="weight_zero_point",
+            w_gidx_param_name="weight_g_idx",
+        )
 
     # Checkpoints are serialized in compressed-tensors format, which is
     # different from the format the kernel may want. Handle repacking here.
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         self.kernel.process_weights_after_loading(layer)
 
-    def apply_weights(self, layer: torch.nn.Module, x: torch.Tensor,
-                      bias: Optional[torch.Tensor]) -> torch.Tensor:
+    def apply_weights(
+        self, layer: torch.nn.Module, x: torch.Tensor, bias: Optional[torch.Tensor]
+    ) -> torch.Tensor:
         return self.kernel.apply_weights(layer, x, bias)
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a8_int.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a8_int.py
index f1fca85508a6..61a9f6b75cb1 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a8_int.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a8_int.py
@@ -7,12 +7,17 @@
 
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.compressed_tensors.schemes import (
-    CompressedTensorsScheme)
+    CompressedTensorsScheme,
+)
 from vllm.model_executor.layers.quantization.kernels.mixed_precision import (
-    MPLinearLayerConfig, choose_mp_linear_kernel)
-from vllm.model_executor.parameter import (ChannelQuantScaleParameter,
-                                           GroupQuantScaleParameter,
-                                           ModelWeightParameter)
+    MPLinearLayerConfig,
+    choose_mp_linear_kernel,
+)
+from vllm.model_executor.parameter import (
+    ChannelQuantScaleParameter,
+    GroupQuantScaleParameter,
+    ModelWeightParameter,
+)
 from vllm.scalar_type import scalar_types
 
 logger = init_logger(__name__)
@@ -27,12 +32,14 @@
 class CompressedTensorsW4A8Int(CompressedTensorsScheme):
     _kernel_backends_being_used: set[str] = set()
 
-    def __init__(self,
-                 strategy: str,
-                 num_bits: int,
-                 group_size: Optional[int] = None,
-                 is_static_input_scheme: bool = False,
-                 input_symmetric: bool = True):
+    def __init__(
+        self,
+        strategy: str,
+        num_bits: int,
+        group_size: Optional[int] = None,
+        is_static_input_scheme: bool = False,
+        input_symmetric: bool = True,
+    ):
         self.strategy = strategy
         self.group_size = -1 if group_size is None else group_size
         self.is_static_input_scheme = is_static_input_scheme
@@ -41,42 +48,53 @@ def __init__(self,
         if num_bits not in W4A8_SUPPORTED_TYPES_MAP:
             raise ValueError(
                 f"Unsupported num_bits = {num_bits}."
-                f"Supported num_bits = {W4A8_SUPPORTED_TYPES_MAP.keys()}")
+                f"Supported num_bits = {W4A8_SUPPORTED_TYPES_MAP.keys()}"
+            )
         self.quant_type = W4A8_SUPPORTED_TYPES_MAP[num_bits]
 
     @classmethod
     def get_min_capability(cls) -> int:
         return 1
 
-    def create_weights(self, layer: torch.nn.Module, output_size: int,
-                       input_size: int, output_partition_sizes: list[int],
-                       input_size_per_partition: int,
-                       params_dtype: torch.dtype, weight_loader: Callable,
-                       **kwargs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        output_size: int,
+        input_size: int,
+        output_partition_sizes: list[int],
+        input_size_per_partition: int,
+        params_dtype: torch.dtype,
+        weight_loader: Callable,
+        **kwargs,
+    ):
         output_size_per_partition = sum(output_partition_sizes)
-        row_parallel = (input_size != input_size_per_partition)
+        row_parallel = input_size != input_size_per_partition
 
         # Compute effective group_size
         if self.group_size == -1:
-            effective_group_size = (input_size_per_partition
-                                    if row_parallel else input_size)
+            effective_group_size = (
+                input_size_per_partition if row_parallel else input_size
+            )
         else:
             effective_group_size = self.group_size
 
         # Ensure group_size divides input_size_per_partition
         assert input_size_per_partition % effective_group_size == 0, (
             f"input_size_per_partition {input_size_per_partition}"
-            f" not divisible by group_size {effective_group_size}")
+            f" not divisible by group_size {effective_group_size}"
+        )
 
         # Determine scale partitioning
-        is_channelwise = (self.group_size == -1)
-        repeat_scales = (is_channelwise and row_parallel)
+        is_channelwise = self.group_size == -1
+        repeat_scales = is_channelwise and row_parallel
         partition_scales = not repeat_scales
 
         mp_linear_kernel_config = MPLinearLayerConfig(
             full_weight_shape=(input_size, output_size),
-            partition_weight_shape=(input_size_per_partition,
-                                    output_size_per_partition),
+            partition_weight_shape=(
+                input_size_per_partition,
+                output_size_per_partition,
+            ),
             weight_type=self.quant_type,
             act_type=params_dtype,
             group_size=effective_group_size,
@@ -86,50 +104,50 @@ def create_weights(self, layer: torch.nn.Module, output_size: int,
 
         kernel_type = choose_mp_linear_kernel(mp_linear_kernel_config)
         if kernel_type.__name__ not in self._kernel_backends_being_used:
-            logger.info("Using %s for CompressedTensorsW4A8Int",
-                        kernel_type.__name__)
+            logger.info("Using %s for CompressedTensorsW4A8Int", kernel_type.__name__)
             self._kernel_backends_being_used.add(kernel_type.__name__)
 
         scales_and_zp_size = input_size_per_partition // effective_group_size
 
-        weight = ModelWeightParameter(data=torch.empty(
-            output_size_per_partition,
-            input_size_per_partition,
-            dtype=torch.int8),
-                                      input_dim=1,
-                                      output_dim=0,
-                                      weight_loader=weight_loader)
+        weight = ModelWeightParameter(
+            data=torch.empty(
+                output_size_per_partition, input_size_per_partition, dtype=torch.int8
+            ),
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("weight", weight)
 
         weight_scale_args = {
-            "weight_loader":
-            weight_loader,
-            "data":
-            torch.empty(output_size_per_partition,
-                        scales_and_zp_size,
-                        dtype=params_dtype)
+            "weight_loader": weight_loader,
+            "data": torch.empty(
+                output_size_per_partition, scales_and_zp_size, dtype=params_dtype
+            ),
         }
 
         if partition_scales:
-            weight_scale = GroupQuantScaleParameter(output_dim=0,
-                                                    input_dim=1,
-                                                    **weight_scale_args)
+            weight_scale = GroupQuantScaleParameter(
+                output_dim=0, input_dim=1, **weight_scale_args
+            )
         else:
-            weight_scale = ChannelQuantScaleParameter(output_dim=0,
-                                                      **weight_scale_args)
+            weight_scale = ChannelQuantScaleParameter(output_dim=0, **weight_scale_args)
 
         layer.register_parameter("weight_packed", weight)
         layer.register_parameter("weight_scale", weight_scale)
 
-        self.kernel = kernel_type(mp_linear_kernel_config,
-                                  w_q_param_name="weight_packed",
-                                  w_s_param_name="weight_scale",
-                                  w_zp_param_name=None,
-                                  w_gidx_param_name=None)
+        self.kernel = kernel_type(
+            mp_linear_kernel_config,
+            w_q_param_name="weight_packed",
+            w_s_param_name="weight_scale",
+            w_zp_param_name=None,
+            w_gidx_param_name=None,
+        )
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         self.kernel.process_weights_after_loading(layer)
 
-    def apply_weights(self, layer: torch.nn.Module, x: torch.Tensor,
-                      bias: Optional[torch.Tensor]) -> torch.Tensor:
+    def apply_weights(
+        self, layer: torch.nn.Module, x: torch.Tensor, bias: Optional[torch.Tensor]
+    ) -> torch.Tensor:
         return self.kernel.apply_weights(layer, x, bias)
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a16_fp8.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a16_fp8.py
index 01a87a088899..709d2538e6ad 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a16_fp8.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a16_fp8.py
@@ -7,24 +7,27 @@
 from compressed_tensors.quantization import QuantizationStrategy
 
 from vllm.model_executor.layers.quantization.compressed_tensors.schemes import (
-    CompressedTensorsScheme)
+    CompressedTensorsScheme,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp8 import (
-    apply_fp8_marlin_linear, prepare_fp8_layer_for_marlin)
+    apply_fp8_marlin_linear,
+    prepare_fp8_layer_for_marlin,
+)
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    convert_to_channelwise)
-from vllm.model_executor.parameter import (ChannelQuantScaleParameter,
-                                           ModelWeightParameter,
-                                           PerTensorScaleParameter)
+    convert_to_channelwise,
+)
+from vllm.model_executor.parameter import (
+    ChannelQuantScaleParameter,
+    ModelWeightParameter,
+    PerTensorScaleParameter,
+)
 
 __all__ = ["CompressedTensorsW8A16Fp8"]
 
-SUPPORTED_STRATEGIES = [
-    QuantizationStrategy.CHANNEL, QuantizationStrategy.TENSOR
-]
+SUPPORTED_STRATEGIES = [QuantizationStrategy.CHANNEL, QuantizationStrategy.TENSOR]
 
 
 class CompressedTensorsW8A16Fp8(CompressedTensorsScheme):
-
     def __init__(self, strategy: str, is_static_input_scheme: bool):
         self.strategy = strategy
         self.is_static_input_scheme = is_static_input_scheme
@@ -39,31 +42,36 @@ def get_min_capability(cls) -> int:
     # we expand each scale to its shard's channels.
     def process_weights_after_loading(self, layer) -> None:
         if self.strategy == QuantizationStrategy.TENSOR:
-            ws_channelwise = convert_to_channelwise(layer.weight_scale,
-                                                    layer.logical_widths)
-            layer.weight_scale = torch.nn.Parameter(ws_channelwise,
-                                                    requires_grad=False)
+            ws_channelwise = convert_to_channelwise(
+                layer.weight_scale, layer.logical_widths
+            )
+            layer.weight_scale = torch.nn.Parameter(ws_channelwise, requires_grad=False)
         else:
             # required by torch.compile to be torch.nn.Parameter
-            layer.weight_scale = torch.nn.Parameter(layer.weight_scale.data,
-                                                    requires_grad=False)
+            layer.weight_scale = torch.nn.Parameter(
+                layer.weight_scale.data, requires_grad=False
+            )
 
         # Weights must be transposed for marlin
-        layer.weight = torch.nn.Parameter(layer.weight.t(),
-                                          requires_grad=False)
+        layer.weight = torch.nn.Parameter(layer.weight.t(), requires_grad=False)
 
         if self.is_static_input_scheme:
             # required by torch.compile to be torch.nn.Parameter
-            layer.input_scale = torch.nn.Parameter(layer.input_scale.data,
-                                                   requires_grad=False)
+            layer.input_scale = torch.nn.Parameter(
+                layer.input_scale.data, requires_grad=False
+            )
         prepare_fp8_layer_for_marlin(layer)
 
-    def create_weights(self, layer: torch.nn.Module, input_size: int,
-                       output_partition_sizes: list[int],
-                       input_size_per_partition: int,
-                       params_dtype: torch.dtype, weight_loader: Callable,
-                       **kwargs):
-
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        input_size: int,
+        output_partition_sizes: list[int],
+        input_size_per_partition: int,
+        params_dtype: torch.dtype,
+        weight_loader: Callable,
+        **kwargs,
+    ):
         output_size_per_partition = sum(output_partition_sizes)
         layer.logical_widths = output_partition_sizes
         layer.input_size_per_partition = input_size_per_partition
@@ -72,50 +80,59 @@ def create_weights(self, layer: torch.nn.Module, input_size: int,
         layer.weight_block_size = None
 
         # WEIGHT
-        weight = ModelWeightParameter(data=torch.empty(
-            output_size_per_partition,
-            input_size_per_partition,
-            dtype=torch.float8_e4m3fn),
-                                      input_dim=1,
-                                      output_dim=0,
-                                      weight_loader=weight_loader)
+        weight = ModelWeightParameter(
+            data=torch.empty(
+                output_size_per_partition,
+                input_size_per_partition,
+                dtype=torch.float8_e4m3fn,
+            ),
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("weight", weight)
 
         # WEIGHT SCALE
         if self.strategy == QuantizationStrategy.CHANNEL:
             weight_scale = ChannelQuantScaleParameter(
-                data=torch.empty((sum(output_partition_sizes), 1),
-                                 dtype=torch.float32),
+                data=torch.empty((sum(output_partition_sizes), 1), dtype=torch.float32),
                 output_dim=0,
-                weight_loader=weight_loader)
+                weight_loader=weight_loader,
+            )
         elif self.strategy == QuantizationStrategy.TENSOR:
-            weight_scale = PerTensorScaleParameter(data=torch.empty(
-                len(output_partition_sizes), dtype=torch.float32),
-                                                   weight_loader=weight_loader)
+            weight_scale = PerTensorScaleParameter(
+                data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
+                weight_loader=weight_loader,
+            )
         else:
             raise ValueError(
                 f"Unsupported weight strategy={self.strategy}, "
-                f"supported strategies are {SUPPORTED_STRATEGIES}")
+                f"supported strategies are {SUPPORTED_STRATEGIES}"
+            )
 
         weight_scale[:] = torch.finfo(torch.float32).min
         layer.register_parameter("weight_scale", weight_scale)
 
         # INPUT SCALE (to deal with converted checkpoints)
         if self.is_static_input_scheme:
-            input_scale = PerTensorScaleParameter(data=torch.empty(
-                len(output_partition_sizes), dtype=torch.float32),
-                                                  weight_loader=weight_loader)
+            input_scale = PerTensorScaleParameter(
+                data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
+                weight_loader=weight_loader,
+            )
             layer.register_parameter("input_scale", input_scale)
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
-
-        return apply_fp8_marlin_linear(input=x,
-                                       weight=layer.weight,
-                                       weight_scale=layer.weight_scale,
-                                       workspace=layer.workspace,
-                                       size_n=layer.output_size_per_partition,
-                                       size_k=layer.input_size_per_partition,
-                                       bias=bias)
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
+        return apply_fp8_marlin_linear(
+            input=x,
+            weight=layer.weight,
+            weight_scale=layer.weight_scale,
+            workspace=layer.workspace,
+            size_n=layer.output_size_per_partition,
+            size_k=layer.input_size_per_partition,
+            bias=bias,
+        )
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py
index 4755c17c5967..902c9c7bde97 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py
@@ -4,25 +4,35 @@
 from typing import Callable, Optional
 
 import torch
-from compressed_tensors.quantization import (QuantizationArgs,
-                                             QuantizationStrategy)
+from compressed_tensors.quantization import QuantizationArgs, QuantizationStrategy
 from torch.nn import Parameter
 
 from vllm.model_executor.layers.quantization.compressed_tensors.schemes import (
-    CompressedTensorsScheme)
+    CompressedTensorsScheme,
+)
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    W8A8BlockFp8LinearOp, check_aiter_fp8_linear_support,
-    create_fp8_input_scale, create_fp8_scale_parameter,
-    create_fp8_weight_parameter, maybe_post_process_fp8_weight_block,
-    process_fp8_weight_block_strategy, process_fp8_weight_channel_strategy,
-    process_fp8_weight_tensor_strategy, validate_fp8_block_shape)
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape)
+    W8A8BlockFp8LinearOp,
+    check_aiter_fp8_linear_support,
+    create_fp8_input_scale,
+    create_fp8_scale_parameter,
+    create_fp8_weight_parameter,
+    maybe_post_process_fp8_weight_block,
+    process_fp8_weight_block_strategy,
+    process_fp8_weight_channel_strategy,
+    process_fp8_weight_tensor_strategy,
+    validate_fp8_block_shape,
+)
+from vllm.model_executor.layers.quantization.utils.quant_utils import GroupShape
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    Fp8LinearOp, cutlass_block_fp8_supported, maybe_create_device_identity)
-from vllm.model_executor.parameter import (BlockQuantScaleParameter,
-                                           ChannelQuantScaleParameter,
-                                           PerTensorScaleParameter)
+    Fp8LinearOp,
+    cutlass_block_fp8_supported,
+    maybe_create_device_identity,
+)
+from vllm.model_executor.parameter import (
+    BlockQuantScaleParameter,
+    ChannelQuantScaleParameter,
+    PerTensorScaleParameter,
+)
 
 __all__ = ["CompressedTensorsW8A8Fp8"]
 
@@ -34,9 +44,7 @@
 
 
 class CompressedTensorsW8A8Fp8(CompressedTensorsScheme):
-
-    def __init__(self, weight_quant: QuantizationArgs,
-                 is_static_input_scheme: bool):
+    def __init__(self, weight_quant: QuantizationArgs, is_static_input_scheme: bool):
         self.weight_quant = weight_quant
         self.strategy = weight_quant.strategy
         self.out_dtype = torch.get_default_dtype()
@@ -46,8 +54,11 @@ def __init__(self, weight_quant: QuantizationArgs,
         if self.weight_block_size is not None:
             self.act_q_group_shape = GroupShape(1, self.weight_block_size[0])
         else:
-            self.act_q_group_shape = GroupShape.PER_TENSOR \
-                if is_static_input_scheme else GroupShape.PER_TOKEN
+            self.act_q_group_shape = (
+                GroupShape.PER_TENSOR
+                if is_static_input_scheme
+                else GroupShape.PER_TOKEN
+            )
 
         self.cutlass_block_fp8_supported = cutlass_block_fp8_supported()
         self.use_aiter_and_is_supported = check_aiter_fp8_linear_support()
@@ -63,18 +74,25 @@ def __init__(self, weight_quant: QuantizationArgs,
         else:
             self.fp8_linear = Fp8LinearOp(
                 act_quant_static=self.is_static_input_scheme,
-                act_quant_group_shape=self.act_q_group_shape)
+                act_quant_group_shape=self.act_q_group_shape,
+            )
 
     @classmethod
     def get_min_capability(cls) -> int:
         # lovelace and up
         return 89
 
-    def create_weights(self, layer: torch.nn.Module,
-                       input_size_per_partition: int,
-                       output_partition_sizes: list[int], input_size: int,
-                       output_size: int, params_dtype: torch.dtype,
-                       weight_loader: Callable, **kwargs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        input_size_per_partition: int,
+        output_partition_sizes: list[int],
+        input_size: int,
+        output_size: int,
+        params_dtype: torch.dtype,
+        weight_loader: Callable,
+        **kwargs,
+    ):
         maybe_create_device_identity()
 
         output_size_per_partition = sum(output_partition_sizes)
@@ -86,48 +104,57 @@ def create_weights(self, layer: torch.nn.Module,
             assert self.weight_block_size is not None
             layer.weight_block_size = self.weight_block_size
             # Validate block quantization shapes
-            validate_fp8_block_shape(layer, input_size, output_size,
-                                     input_size_per_partition,
-                                     output_partition_sizes,
-                                     self.weight_block_size)
+            validate_fp8_block_shape(
+                layer,
+                input_size,
+                output_size,
+                input_size_per_partition,
+                output_partition_sizes,
+                self.weight_block_size,
+            )
 
         # WEIGHT
-        weight = create_fp8_weight_parameter(output_size_per_partition,
-                                             input_size_per_partition,
-                                             weight_loader)
+        weight = create_fp8_weight_parameter(
+            output_size_per_partition, input_size_per_partition, weight_loader
+        )
         layer.register_parameter("weight", weight)
 
         # WEIGHT SCALE
         weight_scale = create_fp8_scale_parameter(
-            strategy_to_parameter_type[self.strategy], output_partition_sizes,
-            input_size_per_partition, layer.weight_block_size, weight_loader)
+            strategy_to_parameter_type[self.strategy],
+            output_partition_sizes,
+            input_size_per_partition,
+            layer.weight_block_size,
+            weight_loader,
+        )
         layer.register_parameter("weight_scale", weight_scale)
 
         # INPUT SCALE
         if self.is_static_input_scheme:
-            input_scale = create_fp8_input_scale(output_partition_sizes,
-                                                 weight_loader)
+            input_scale = create_fp8_input_scale(output_partition_sizes, weight_loader)
             layer.register_parameter("input_scale", input_scale)
 
     def process_weights_after_loading(self, layer) -> None:
         if self.strategy == QuantizationStrategy.TENSOR:
-            weight, weight_scale, input_scale = (
-                process_fp8_weight_tensor_strategy(
-                    layer.weight, layer.weight_scale, layer.logical_widths,
-                    getattr(layer, 'input_scale', None)))
+            weight, weight_scale, input_scale = process_fp8_weight_tensor_strategy(
+                layer.weight,
+                layer.weight_scale,
+                layer.logical_widths,
+                getattr(layer, "input_scale", None),
+            )
             weight = weight.t()
 
         elif self.strategy == QuantizationStrategy.CHANNEL:
-            weight, weight_scale, input_scale = (
-                process_fp8_weight_channel_strategy(
-                    layer.weight, layer.weight_scale,
-                    getattr(layer, 'input_scale', None)))
+            weight, weight_scale, input_scale = process_fp8_weight_channel_strategy(
+                layer.weight, layer.weight_scale, getattr(layer, "input_scale", None)
+            )
             weight = weight.t()
 
         elif self.strategy == QuantizationStrategy.BLOCK:
             assert self.is_static_input_scheme is False
             weight, weight_scale = process_fp8_weight_block_strategy(
-                layer.weight, layer.weight_scale)
+                layer.weight, layer.weight_scale
+            )
             input_scale = None
 
         else:
@@ -137,25 +164,23 @@ def process_weights_after_loading(self, layer) -> None:
         layer.weight = Parameter(weight.data, requires_grad=False)
         layer.weight_scale = Parameter(weight_scale.data, requires_grad=False)
         if input_scale is not None:
-            layer.input_scale = Parameter(input_scale.data,
-                                          requires_grad=False)
+            layer.input_scale = Parameter(input_scale.data, requires_grad=False)
 
         # INPUT SCALE
-        if self.is_static_input_scheme and hasattr(layer, 'input_scale'):
-            layer.input_scale = Parameter(layer.input_scale.max(),
-                                          requires_grad=False)
+        if self.is_static_input_scheme and hasattr(layer, "input_scale"):
+            layer.input_scale = Parameter(layer.input_scale.max(), requires_grad=False)
         else:
             layer.input_scale = None
 
         if self.strategy == QuantizationStrategy.BLOCK:
-            maybe_post_process_fp8_weight_block(
-                layer, self.cutlass_block_fp8_supported)
-
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
-
+            maybe_post_process_fp8_weight_block(layer, self.cutlass_block_fp8_supported)
+
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         if self.weight_block_size is not None:
             return self.w8a8_block_fp8_linear.apply(
                 input=x,
@@ -165,9 +190,11 @@ def apply_weights(self,
                 bias=bias,
             )
 
-        return self.fp8_linear.apply(input=x,
-                                     weight=layer.weight,
-                                     weight_scale=layer.weight_scale,
-                                     out_dtype=self.out_dtype,
-                                     input_scale=layer.input_scale,
-                                     bias=bias)
+        return self.fp8_linear.apply(
+            input=x,
+            weight=layer.weight,
+            weight_scale=layer.weight_scale,
+            out_dtype=self.out_dtype,
+            input_scale=layer.input_scale,
+            bias=bias,
+        )
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_int8.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_int8.py
index 6189f0609d85..70316a7553ca 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_int8.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_int8.py
@@ -8,13 +8,18 @@
 
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.compressed_tensors.schemes import (
-    CompressedTensorsScheme)
+    CompressedTensorsScheme,
+)
 from vllm.model_executor.layers.quantization.kernels.scaled_mm import (
-    ScaledMMLinearLayerConfig, choose_scaled_mm_linear_kernel)
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           ChannelQuantScaleParameter,
-                                           ModelWeightParameter,
-                                           PerTensorScaleParameter)
+    ScaledMMLinearLayerConfig,
+    choose_scaled_mm_linear_kernel,
+)
+from vllm.model_executor.parameter import (
+    BasevLLMParameter,
+    ChannelQuantScaleParameter,
+    ModelWeightParameter,
+    PerTensorScaleParameter,
+)
 
 logger = init_logger(__name__)
 
@@ -22,8 +27,9 @@
 class CompressedTensorsW8A8Int8(CompressedTensorsScheme):
     _kernel_backends_being_used: set[str] = set()
 
-    def __init__(self, strategy: str, is_static_input_scheme: bool,
-                 input_symmetric: bool):
+    def __init__(
+        self, strategy: str, is_static_input_scheme: bool, input_symmetric: bool
+    ):
         self.strategy = strategy
         self.is_static_input_scheme = is_static_input_scheme
         self.input_symmetric = input_symmetric
@@ -33,56 +39,61 @@ def get_min_capability(cls) -> int:
         # turing and up
         return 75
 
-    def create_weights(self, layer: torch.nn.Module,
-                       output_partition_sizes: list[int],
-                       input_size_per_partition: int,
-                       params_dtype: torch.dtype, weight_loader: Callable,
-                       **kwargs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        output_partition_sizes: list[int],
+        input_size_per_partition: int,
+        params_dtype: torch.dtype,
+        weight_loader: Callable,
+        **kwargs,
+    ):
         layer.logical_widths = output_partition_sizes
 
         scaled_mm_linear_kernel_config = ScaledMMLinearLayerConfig(
             is_channelwise=(self.strategy == QuantizationStrategy.CHANNEL),
             is_static_input_scheme=self.is_static_input_scheme,
-            input_symmetric=self.input_symmetric)
+            input_symmetric=self.input_symmetric,
+        )
 
-        kernel_type = choose_scaled_mm_linear_kernel(
-            scaled_mm_linear_kernel_config)
+        kernel_type = choose_scaled_mm_linear_kernel(scaled_mm_linear_kernel_config)
 
         if kernel_type.__name__ not in self._kernel_backends_being_used:
-            logger.info("Using %s for CompressedTensorsW8A8Int8",
-                        kernel_type.__name__)
+            logger.info("Using %s for CompressedTensorsW8A8Int8", kernel_type.__name__)
             self._kernel_backends_being_used.add(kernel_type.__name__)
 
         # WEIGHT
-        weight = ModelWeightParameter(data=torch.empty(
-            sum(output_partition_sizes),
-            input_size_per_partition,
-            dtype=torch.int8),
-                                      input_dim=1,
-                                      output_dim=0,
-                                      weight_loader=weight_loader)
+        weight = ModelWeightParameter(
+            data=torch.empty(
+                sum(output_partition_sizes), input_size_per_partition, dtype=torch.int8
+            ),
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
 
         layer.register_parameter("weight", weight)
 
         # WEIGHT SCALE
         if self.strategy == QuantizationStrategy.CHANNEL:
             weight_scale = ChannelQuantScaleParameter(
-                data=torch.empty((sum(output_partition_sizes), 1),
-                                 dtype=torch.float32),
+                data=torch.empty((sum(output_partition_sizes), 1), dtype=torch.float32),
                 output_dim=0,
-                weight_loader=weight_loader)
+                weight_loader=weight_loader,
+            )
         else:
             assert self.strategy == QuantizationStrategy.TENSOR
-            weight_scale = PerTensorScaleParameter(data=torch.empty(
-                len(output_partition_sizes), dtype=torch.float32),
-                                                   weight_loader=weight_loader)
+            weight_scale = PerTensorScaleParameter(
+                data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
+                weight_loader=weight_loader,
+            )
         layer.register_parameter("weight_scale", weight_scale)
 
         # INPUT SCALE
         if self.is_static_input_scheme:
-            input_scale = BasevLLMParameter(data=torch.empty(
-                1, dtype=torch.float32),
-                                            weight_loader=weight_loader)
+            input_scale = BasevLLMParameter(
+                data=torch.empty(1, dtype=torch.float32), weight_loader=weight_loader
+            )
             layer.register_parameter("input_scale", input_scale)
 
             if not self.input_symmetric:
@@ -90,22 +101,25 @@ def create_weights(self, layer: torch.nn.Module,
                 # as the weights
                 # AZP loaded as int8 but used as int32
                 input_zero_point = BasevLLMParameter(
-                    data=torch.empty(1, dtype=torch.int8),
-                    weight_loader=weight_loader)
+                    data=torch.empty(1, dtype=torch.int8), weight_loader=weight_loader
+                )
                 layer.register_parameter("input_zero_point", input_zero_point)
 
-        self.kernel = kernel_type(c=scaled_mm_linear_kernel_config,
-                                  w_q_param_name="weight",
-                                  w_s_param_name="weight_scale",
-                                  i_s_param_name="input_scale",
-                                  i_zp_param_name="input_zero_point",
-                                  azp_adj_param_name="azp_adj")
+        self.kernel = kernel_type(
+            c=scaled_mm_linear_kernel_config,
+            w_q_param_name="weight",
+            w_s_param_name="weight_scale",
+            i_s_param_name="input_scale",
+            i_zp_param_name="input_zero_point",
+            azp_adj_param_name="azp_adj",
+        )
 
     # Checkpoints are serialized in compressed-tensors format, which is
     # different from the format the kernel may want. Handle repacking here.
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         self.kernel.process_weights_after_loading(layer)
 
-    def apply_weights(self, layer: torch.nn.Module, x: torch.Tensor,
-                      bias: Optional[torch.Tensor]) -> torch.Tensor:
+    def apply_weights(
+        self, layer: torch.nn.Module, x: torch.Tensor, bias: Optional[torch.Tensor]
+    ) -> torch.Tensor:
         return self.kernel.apply_weights(layer, x, bias)
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_wNa16.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_wNa16.py
index 74787603e002..7ca5760df858 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_wNa16.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_wNa16.py
@@ -8,29 +8,34 @@
 
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.compressed_tensors.schemes import (
-    CompressedTensorsScheme)
+    CompressedTensorsScheme,
+)
 from vllm.model_executor.layers.quantization.kernels.mixed_precision import (
-    MPLinearLayerConfig, choose_mp_linear_kernel)
+    MPLinearLayerConfig,
+    choose_mp_linear_kernel,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-    marlin_repeat_scales_on_all_ranks)
+    marlin_repeat_scales_on_all_ranks,
+)
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           ChannelQuantScaleParameter,
-                                           GroupQuantScaleParameter,
-                                           PackedColumnParameter,
-                                           PackedvLLMParameter,
-                                           RowvLLMParameter)
+from vllm.model_executor.parameter import (
+    BasevLLMParameter,
+    ChannelQuantScaleParameter,
+    GroupQuantScaleParameter,
+    PackedColumnParameter,
+    PackedvLLMParameter,
+    RowvLLMParameter,
+)
+
 # yapf: enable
 from vllm.scalar_type import scalar_types
 
 logger = init_logger(__name__)
 
 __all__ = ["CompressedTensorsWNA16"]
-WNA16_SUPPORTED_TYPES_MAP = {
-    4: scalar_types.uint4b8,
-    8: scalar_types.uint8b128
-}
+WNA16_SUPPORTED_TYPES_MAP = {4: scalar_types.uint4b8, 8: scalar_types.uint8b128}
 WNA16_ZP_SUPPORTED_TYPES_MAP = {4: scalar_types.uint4, 8: scalar_types.uint8}
 WNA16_SUPPORTED_BITS = list(WNA16_SUPPORTED_TYPES_MAP.keys())
 
@@ -38,13 +43,14 @@
 class CompressedTensorsWNA16(CompressedTensorsScheme):
     _kernel_backends_being_used: set[str] = set()
 
-    def __init__(self,
-                 strategy: str,
-                 num_bits: int,
-                 group_size: Optional[int] = None,
-                 symmetric: Optional[bool] = True,
-                 actorder: Optional[ActivationOrdering] = None):
-
+    def __init__(
+        self,
+        strategy: str,
+        num_bits: int,
+        group_size: Optional[int] = None,
+        symmetric: Optional[bool] = True,
+        actorder: Optional[ActivationOrdering] = None,
+    ):
         self.pack_factor = 32 // num_bits
         self.strategy = strategy
         self.symmetric = symmetric
@@ -52,55 +58,67 @@ def __init__(self,
         self.has_g_idx = actorder == ActivationOrdering.GROUP
 
         if self.group_size == -1 and self.strategy != "channel":
-            raise ValueError("Marlin kernels require group quantization or "
-                             "channelwise quantization, but found no group "
-                             "size and strategy is not channelwise.")
+            raise ValueError(
+                "Marlin kernels require group quantization or "
+                "channelwise quantization, but found no group "
+                "size and strategy is not channelwise."
+            )
 
         if num_bits not in WNA16_SUPPORTED_TYPES_MAP:
             raise ValueError(
                 f"Unsupported num_bits = {num_bits}. "
-                f"Supported num_bits = {WNA16_SUPPORTED_TYPES_MAP.keys()}")
+                f"Supported num_bits = {WNA16_SUPPORTED_TYPES_MAP.keys()}"
+            )
 
-        self.quant_type = (WNA16_ZP_SUPPORTED_TYPES_MAP[num_bits]
-                           if not self.symmetric else
-                           WNA16_SUPPORTED_TYPES_MAP[num_bits])
+        self.quant_type = (
+            WNA16_ZP_SUPPORTED_TYPES_MAP[num_bits]
+            if not self.symmetric
+            else WNA16_SUPPORTED_TYPES_MAP[num_bits]
+        )
 
     @classmethod
     def get_min_capability(cls) -> int:
         # ampere and up
         return 80
 
-    def create_weights(self, layer: torch.nn.Module, output_size: int,
-                       input_size: int, output_partition_sizes: list[int],
-                       input_size_per_partition: int,
-                       params_dtype: torch.dtype, weight_loader: Callable,
-                       **kwargs):
-
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        output_size: int,
+        input_size: int,
+        output_partition_sizes: list[int],
+        input_size_per_partition: int,
+        params_dtype: torch.dtype,
+        weight_loader: Callable,
+        **kwargs,
+    ):
         output_size_per_partition = sum(output_partition_sizes)
 
         mp_linear_kernel_config = MPLinearLayerConfig(
             full_weight_shape=(input_size, output_size),
-            partition_weight_shape=\
-                (input_size_per_partition, output_size_per_partition),
+            partition_weight_shape=(
+                input_size_per_partition,
+                output_size_per_partition,
+            ),
             weight_type=self.quant_type,
             act_type=params_dtype,
             group_size=self.group_size,
             zero_points=not self.symmetric,
-            has_g_idx=self.has_g_idx
+            has_g_idx=self.has_g_idx,
         )
 
         kernel_type = choose_mp_linear_kernel(mp_linear_kernel_config)
 
         if kernel_type.__name__ not in self._kernel_backends_being_used:
-            logger.info("Using %s for CompressedTensorsWNA16",
-                        kernel_type.__name__)
+            logger.info("Using %s for CompressedTensorsWNA16", kernel_type.__name__)
             self._kernel_backends_being_used.add(kernel_type.__name__)
 
         # If group_size is -1, we are in channelwise case.
         group_size = self.group_size if self.group_size != -1 else input_size
-        row_parallel = (input_size != input_size_per_partition)
+        row_parallel = input_size != input_size_per_partition
         partition_scales = not marlin_repeat_scales_on_all_ranks(
-            self.has_g_idx, self.group_size, row_parallel)
+            self.has_g_idx, self.group_size, row_parallel
+        )
 
         scales_and_zp_size = input_size // group_size
 
@@ -108,65 +126,65 @@ def create_weights(self, layer: torch.nn.Module, output_size: int,
             assert input_size_per_partition % group_size == 0
             scales_and_zp_size = input_size_per_partition // group_size
 
-        weight = PackedvLLMParameter(input_dim=1,
-                                     output_dim=0,
-                                     weight_loader=weight_loader,
-                                     packed_factor=self.pack_factor,
-                                     packed_dim=1,
-                                     data=torch.empty(
-                                         output_size_per_partition,
-                                         input_size_per_partition //
-                                         self.pack_factor,
-                                         dtype=torch.int32,
-                                     ))
+        weight = PackedvLLMParameter(
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+            packed_factor=self.pack_factor,
+            packed_dim=1,
+            data=torch.empty(
+                output_size_per_partition,
+                input_size_per_partition // self.pack_factor,
+                dtype=torch.int32,
+            ),
+        )
 
         weight_scale_args = {
-            "weight_loader":
-            weight_loader,
-            "data":
-            torch.empty(
+            "weight_loader": weight_loader,
+            "data": torch.empty(
                 output_size_per_partition,
                 scales_and_zp_size,
                 dtype=params_dtype,
-            )
+            ),
         }
 
         zeros_args = {
-            "weight_loader":
-            weight_loader,
-            "data":
-            torch.zeros(
+            "weight_loader": weight_loader,
+            "data": torch.zeros(
                 output_size_per_partition // self.pack_factor,
                 scales_and_zp_size,
                 dtype=torch.int32,
-            )
+            ),
         }
 
         if not partition_scales:
-            weight_scale = ChannelQuantScaleParameter(output_dim=0,
-                                                      **weight_scale_args)
+            weight_scale = ChannelQuantScaleParameter(output_dim=0, **weight_scale_args)
 
             if not self.symmetric:
-                qzeros = PackedColumnParameter(output_dim=0,
-                                               packed_dim=0,
-                                               packed_factor=self.pack_factor,
-                                               **zeros_args)
+                qzeros = PackedColumnParameter(
+                    output_dim=0,
+                    packed_dim=0,
+                    packed_factor=self.pack_factor,
+                    **zeros_args,
+                )
         else:
-            weight_scale = GroupQuantScaleParameter(output_dim=0,
-                                                    input_dim=1,
-                                                    **weight_scale_args)
+            weight_scale = GroupQuantScaleParameter(
+                output_dim=0, input_dim=1, **weight_scale_args
+            )
             if not self.symmetric:
-                qzeros = PackedvLLMParameter(input_dim=1,
-                                             output_dim=0,
-                                             packed_dim=0,
-                                             packed_factor=self.pack_factor,
-                                             **zeros_args)
+                qzeros = PackedvLLMParameter(
+                    input_dim=1,
+                    output_dim=0,
+                    packed_dim=0,
+                    packed_factor=self.pack_factor,
+                    **zeros_args,
+                )
 
         # A 2D array defining the original shape of the weights
         # before packing
-        weight_shape = BasevLLMParameter(data=torch.empty(2,
-                                                          dtype=torch.int64),
-                                         weight_loader=weight_loader)
+        weight_shape = BasevLLMParameter(
+            data=torch.empty(2, dtype=torch.int64), weight_loader=weight_loader
+        )
 
         layer.register_parameter("weight_packed", weight)
         layer.register_parameter("weight_scale", weight_scale)
@@ -177,25 +195,30 @@ def create_weights(self, layer: torch.nn.Module, output_size: int,
 
         # group index (for activation reordering)
         if self.has_g_idx:
-            weight_g_idx = RowvLLMParameter(data=torch.empty(
-                input_size_per_partition,
-                dtype=torch.int32,
-            ),
-                                            input_dim=0,
-                                            weight_loader=weight_loader)
+            weight_g_idx = RowvLLMParameter(
+                data=torch.empty(
+                    input_size_per_partition,
+                    dtype=torch.int32,
+                ),
+                input_dim=0,
+                weight_loader=weight_loader,
+            )
             layer.register_parameter("weight_g_idx", weight_g_idx)
 
-        self.kernel = kernel_type(mp_linear_kernel_config,
-                                  w_q_param_name="weight_packed",
-                                  w_s_param_name="weight_scale",
-                                  w_zp_param_name="weight_zero_point",
-                                  w_gidx_param_name="weight_g_idx")
+        self.kernel = kernel_type(
+            mp_linear_kernel_config,
+            w_q_param_name="weight_packed",
+            w_s_param_name="weight_scale",
+            w_zp_param_name="weight_zero_point",
+            w_gidx_param_name="weight_g_idx",
+        )
 
     # Checkpoints are serialized in compressed-tensors format, which is
     # different from the format the kernel may want. Handle repacking here.
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         self.kernel.process_weights_after_loading(layer)
 
-    def apply_weights(self, layer: torch.nn.Module, x: torch.Tensor,
-                      bias: Optional[torch.Tensor]) -> torch.Tensor:
+    def apply_weights(
+        self, layer: torch.nn.Module, x: torch.Tensor, bias: Optional[torch.Tensor]
+    ) -> torch.Tensor:
         return self.kernel.apply_weights(layer, x, bias)
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/transform/linear.py b/vllm/model_executor/layers/quantization/compressed_tensors/transform/linear.py
index d098185146e4..a51fe28b975e 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/transform/linear.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/transform/linear.py
@@ -5,19 +5,28 @@
 from typing import Callable, Optional
 
 import torch
-from compressed_tensors.transform import (TransformArgs, TransformConfig,
-                                          TransformLocation, TransformScheme)
+from compressed_tensors.transform import (
+    TransformArgs,
+    TransformConfig,
+    TransformLocation,
+    TransformScheme,
+)
 from compressed_tensors.utils import is_match
 
-from vllm.model_executor.layers.linear import (WEIGHT_LOADER_V2_SUPPORTED,
-                                               LinearMethodBase,
-                                               QKVCrossParallelLinear)
+from vllm.model_executor.layers.linear import (
+    WEIGHT_LOADER_V2_SUPPORTED,
+    LinearMethodBase,
+    QKVCrossParallelLinear,
+)
 from vllm.model_executor.layers.quantization.compressed_tensors.compressed_tensors import (  # noqa: E501
-    CompressedTensorsScheme)
+    CompressedTensorsScheme,
+)
 from vllm.model_executor.layers.quantization.compressed_tensors.transform.module import (  # noqa: E501
-    HadamardTransform)
+    HadamardTransform,
+)
 from vllm.model_executor.layers.quantization.compressed_tensors.transform.utils import (  # noqa: E501
-    TransformTuple)
+    TransformTuple,
+)
 
 
 class CompressedTensorsLinearTransformMethod(LinearMethodBase):
@@ -35,21 +44,25 @@ def from_schemes(
         output_tfms: dict[int, TransformTuple],
     ) -> "CompressedTensorsLinearTransformMethod":
         from vllm.model_executor.layers.quantization.compressed_tensors.transform.schemes.linear_qutlass_nvfp4 import (  # noqa: E501
-            QutlassNvFP4LinearMethod, is_qutlass_fp4_scheme)
+            QutlassNvFP4LinearMethod,
+            is_qutlass_fp4_scheme,
+        )
 
         assert input_tfms or output_tfms
 
         if is_qutlass_fp4_scheme(quant_scheme, input_tfms):
-            return QutlassNvFP4LinearMethod(quant_method, input_tfms,
-                                            output_tfms)
+            return QutlassNvFP4LinearMethod(quant_method, input_tfms, output_tfms)
 
         # hadacore or dense gemm is selected by Transform module
 
         return cls(quant_method, input_tfms, output_tfms)
 
-    def __init__(self, quant_method: LinearMethodBase,
-                 input_tfms: dict[int, TransformTuple],
-                 output_tfms: dict[int, TransformTuple]):
+    def __init__(
+        self,
+        quant_method: LinearMethodBase,
+        input_tfms: dict[int, TransformTuple],
+        output_tfms: dict[int, TransformTuple],
+    ):
         self.quant_method = quant_method
         self.input_tfms = input_tfms
         self.output_tfms = output_tfms
@@ -57,15 +70,18 @@ def __init__(self, quant_method: LinearMethodBase,
         self.input_transform: Optional[HadamardTransform] = None
         self.output_transform: Optional[HadamardTransform] = None
 
-    def create_weights(self, layer: torch.nn.Module,
-                       input_size_per_partition: int,
-                       output_partition_sizes: list[int], input_size: int,
-                       output_size: int, params_dtype: torch.dtype,
-                       **extra_weight_attrs):
-
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        input_size_per_partition: int,
+        output_partition_sizes: list[int],
+        input_size: int,
+        output_size: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         # get weight loader for transforms
-        weight_loader: Callable = extra_weight_attrs.get(
-            "weight_loader")  # type: ignore[assignment]
+        weight_loader: Callable = extra_weight_attrs.get("weight_loader")  # type: ignore[assignment]
 
         # HACK: UnquantizedLinearMethod does not support weight loader v2, but
         # transforms (specifically SharedWeightParameter) requires
@@ -86,7 +102,8 @@ def create_weights(self, layer: torch.nn.Module,
             input_size=input_size,
             output_size=output_size,
             params_dtype=params_dtype,
-            **extra_weight_attrs)
+            **extra_weight_attrs,
+        )
 
         # validate schemes
         num_partitions = len(output_partition_sizes)
@@ -98,10 +115,13 @@ def create_weights(self, layer: torch.nn.Module,
             location = list(self.input_tfms.values())[0].args.location
             transform_name = f"{scheme_name}_{location}"
 
-            transform = HadamardTransform(self.input_tfms, layer,
-                                          weight_loader,
-                                          input_size_per_partition,
-                                          output_partition_sizes)
+            transform = HadamardTransform(
+                self.input_tfms,
+                layer,
+                weight_loader,
+                input_size_per_partition,
+                output_partition_sizes,
+            )
             layer.register_module(transform_name, transform)
             self.input_transform = transform
 
@@ -110,10 +130,13 @@ def create_weights(self, layer: torch.nn.Module,
             location = list(self.output_tfms.values())[0].args.location
             transform_name = f"{scheme_name}_{location}"
 
-            transform = HadamardTransform(self.output_tfms, layer,
-                                          weight_loader,
-                                          input_size_per_partition,
-                                          output_partition_sizes)
+            transform = HadamardTransform(
+                self.output_tfms,
+                layer,
+                weight_loader,
+                input_size_per_partition,
+                output_partition_sizes,
+            )
             layer.register_module(transform_name, transform)
             self.output_transform = transform
 
@@ -128,11 +151,12 @@ def process_weights_after_loading(self, layer):
             if isinstance(submodule, HadamardTransform):
                 submodule.process_weights_after_loading()
 
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
-
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         if self.input_transform is not None:
             x = self.input_transform(x)
 
@@ -143,8 +167,9 @@ def apply(self,
         # (@ksayers): confirm that this is done concurrently
         if self.output_transform is not None:
             for part_id, (start, length) in enumerate(self.partition_ranges):
-                x[:, start:start + length] = self.output_transform(
-                    x[:, start:start + length].contiguous(), part_id=part_id)
+                x[:, start : start + length] = self.output_transform(
+                    x[:, start : start + length].contiguous(), part_id=part_id
+                )
 
         return x
 
@@ -171,39 +196,41 @@ def _validate_tfm_schemes(self, num_partitions: int):
 
 
 def get_linear_transform_schemes(
-    layer: torch.nn.Module, layer_name: str,
+    layer: torch.nn.Module,
+    layer_name: str,
     transform_config: Optional[TransformConfig],
-    packed_modules_mapping: dict[str, list[str]]
-) -> tuple[dict[int, TransformTuple], dict[
-        int, TransformTuple]]:  # [input_transform, [output_transform, ...]]
+    packed_modules_mapping: dict[str, list[str]],
+) -> tuple[
+    dict[int, TransformTuple], dict[int, TransformTuple]
+]:  # [input_transform, [output_transform, ...]]
     # there can only be one transform input scheme per (fused) module
     input_tfms = {}
     output_tfms = {}
 
-    partition_names = get_layer_partition_names(layer_name,
-                                                packed_modules_mapping)
+    partition_names = get_layer_partition_names(layer_name, packed_modules_mapping)
 
     for scheme_name, scheme, args in get_schemes_args(transform_config):
         for part_index, part_name in enumerate(partition_names):
-            if is_match(part_name, layer, args.targets,
-                        args.ignore) and args.is_online():
+            if (
+                is_match(part_name, layer, args.targets, args.ignore)
+                and args.is_online()
+            ):
                 if args.location == TransformLocation.INPUT:
-                    input_tfms[part_index] = TransformTuple(
-                        scheme_name, scheme, args)
+                    input_tfms[part_index] = TransformTuple(scheme_name, scheme, args)
 
                 elif args.location == TransformLocation.OUTPUT:
-                    output_tfms[part_index] = TransformTuple(
-                        scheme_name, scheme, args)
+                    output_tfms[part_index] = TransformTuple(scheme_name, scheme, args)
 
                 else:
-                    raise ValueError(f"Cannot apply `{args.location}` "
-                                     f"transform to `{layer_name}`")
+                    raise ValueError(
+                        f"Cannot apply `{args.location}` transform to `{layer_name}`"
+                    )
 
     return (input_tfms, output_tfms)
 
 
 def get_schemes_args(
-    transform_config: Optional[TransformConfig]
+    transform_config: Optional[TransformConfig],
 ) -> Generator[tuple[str, TransformScheme, TransformArgs]]:
     if transform_config is None:
         return
@@ -214,20 +241,20 @@ def get_schemes_args(
 
 
 def get_layer_partition_names(
-        layer_name: str, packed_modules_mapping: dict[str,
-                                                      list[str]]) -> list[str]:
+    layer_name: str, packed_modules_mapping: dict[str, list[str]]
+) -> list[str]:
     """
     Get all partition names associated with this layer.
     Names are returned in order of their partition indices.
-    
+
     ```python
     mapping = {"gate_up_proj", "gate_proj", "up_proj"}
 
-    assert get_layer_partition_names(
-        "mlp.gate_up_proj", mapping) == ["gate_proj", "up_proj"]
-    assert get_layer_partition_names(
-        "mlp.down_proj", mapping) == ["down_proj"]
-    """
+    assert get_layer_partition_names("mlp.gate_up_proj", mapping) == [
+        "gate_proj",
+        "up_proj",
+    ]
+    assert get_layer_partition_names("mlp.down_proj", mapping) == ["down_proj"]"""
     for fused_suffix, part_suffixes in packed_modules_mapping.items():
         if layer_name.endswith(fused_suffix):
             return [
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/transform/module.py b/vllm/model_executor/layers/quantization/compressed_tensors/transform/module.py
index 5e863354715e..ecd798257fce 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/transform/module.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/transform/module.py
@@ -5,19 +5,21 @@
 from typing import Callable
 
 import torch
-from compressed_tensors.transform import (TransformArgs, TransformLocation,
-                                          TransformScheme)
+from compressed_tensors.transform import (
+    TransformArgs,
+    TransformLocation,
+    TransformScheme,
+)
 from torch import Tensor
 
 import vllm._custom_ops as ops
-from vllm.distributed.parallel_state import (
-    get_tensor_model_parallel_world_size)
+from vllm.distributed.parallel_state import get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.linear import LinearBase
 from vllm.model_executor.layers.quantization.compressed_tensors.transform.utils import (  # noqa: E501
-    TransformTuple)
+    TransformTuple,
+)
 from vllm.model_executor.layers.utils import dispatch_unquantized_gemm
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.model_executor.parameter import SharedWeightParameter
 
 
@@ -27,22 +29,28 @@ class HadamardTransform(torch.nn.Module):
     transforms. Meant to be used with `CompressedTensorsLinearTransformMethod`
     and attention transforms method (not implemented yet)
     """
+
     transforms: dict[int, TransformTuple]  # info parsed from transforms config
     weight: SharedWeightParameter  # container for shared tensors
 
     scales: dict[int, float]  # hadamard scale, usually sqrt(matrix.size(0))
 
-    def __init__(self, transforms: dict[int, TransformTuple],
-                 layer: torch.nn.Module, weight_loader: Callable,
-                 input_size_per_partition: int,
-                 output_partition_sizes: list[int]):
+    def __init__(
+        self,
+        transforms: dict[int, TransformTuple],
+        layer: torch.nn.Module,
+        weight_loader: Callable,
+        input_size_per_partition: int,
+        output_partition_sizes: list[int],
+    ):
         super().__init__()
         self.transforms = transforms
         self.scales = {}
 
         if get_tensor_model_parallel_world_size() > 1:
-            raise NotImplementedError("Online transforms with tensor "
-                                      "parallelism is not supported")
+            raise NotImplementedError(
+                "Online transforms with tensor parallelism is not supported"
+            )
 
         # Similar to row/col parallel params, but tensors are separate
         # to allow for loading with shared memory
@@ -50,11 +58,11 @@ def __init__(self, transforms: dict[int, TransformTuple],
 
         # create shared partition data for each partition of the original weight
         input_size = input_size_per_partition
-        for part_index, (_scheme_name, scheme,
-                         args) in self.transforms.items():
+        for part_index, (_scheme_name, scheme, args) in self.transforms.items():
             output_size = output_partition_sizes[part_index]
-            weight_size = self._get_weight_size(layer, scheme, args,
-                                                input_size, output_size)
+            weight_size = self._get_weight_size(
+                layer, scheme, args, input_size, output_size
+            )
 
             data_key = self._get_data_key(scheme, weight_size)
             self.weight.add_partition(
@@ -101,28 +109,41 @@ def forward(self, value: Tensor, part_id: int = 0) -> Tensor:
         # fall back to dense
         else:
             weight = self.weight.partitions[part_id]
-            weight = weight if self.transforms[
-                part_id].args.inverse else weight.T  # linear := x(W.T)
+            weight = (
+                weight if self.transforms[part_id].args.inverse else weight.T
+            )  # linear := x(W.T)
             scale = self.scales[part_id]
 
             if self.transforms[part_id].scheme.head_dim is not None:
                 value = value.unflatten(-1, (-1, weight.size(0)))
-                value = dispatch_unquantized_gemm()(self, value.to(
-                    weight.dtype), weight, None).to(value.dtype) * scale
+                value = (
+                    dispatch_unquantized_gemm()(
+                        self, value.to(weight.dtype), weight, None
+                    ).to(value.dtype)
+                    * scale
+                )
                 value = value.flatten(-2, -1)
 
                 return value
 
-            return dispatch_unquantized_gemm()(self, value.to(
-                weight.dtype), weight, None).to(value.dtype) * scale
+            return (
+                dispatch_unquantized_gemm()(
+                    self, value.to(weight.dtype), weight, None
+                ).to(value.dtype)
+                * scale
+            )
 
-    def _get_data_key(self, scheme: TransformScheme,
-                      weight_size: int) -> Hashable:
+    def _get_data_key(self, scheme: TransformScheme, weight_size: int) -> Hashable:
         return (id(scheme), weight_size)
 
-    def _get_weight_size(self, layer: torch.nn.Module, scheme: TransformScheme,
-                         args: TransformArgs, input_size: int,
-                         output_size: int) -> int:
+    def _get_weight_size(
+        self,
+        layer: torch.nn.Module,
+        scheme: TransformScheme,
+        args: TransformArgs,
+        input_size: int,
+        output_size: int,
+    ) -> int:
         if scheme.head_dim is not None:
             return scheme.head_dim
 
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/transform/schemes/linear_qutlass_nvfp4.py b/vllm/model_executor/layers/quantization/compressed_tensors/transform/schemes/linear_qutlass_nvfp4.py
index 69b39f31eec1..b800c5f5d436 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/transform/schemes/linear_qutlass_nvfp4.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/transform/schemes/linear_qutlass_nvfp4.py
@@ -5,42 +5,61 @@
 import torch
 
 from vllm.model_executor.layers.quantization.compressed_tensors.compressed_tensors import (  # noqa: E501
-    CompressedTensorsScheme, CompressedTensorsW4A4Fp4)
+    CompressedTensorsScheme,
+    CompressedTensorsW4A4Fp4,
+)
 from vllm.model_executor.layers.quantization.compressed_tensors.transform.linear import (  # noqa: E501
-    CompressedTensorsLinearTransformMethod, TransformTuple)
+    CompressedTensorsLinearTransformMethod,
+    TransformTuple,
+)
 
 __all__ = ["is_qutlass_fp4_scheme", "QutlassNvFP4LinearMethod"]
 
 
-def is_qutlass_fp4_scheme(quant_scheme: Optional[CompressedTensorsScheme],
-                          input_tfms: dict[int, TransformTuple]) -> bool:
-    return isinstance(
-        quant_scheme,
-        (CompressedTensorsW4A4Fp4, )) and len(input_tfms) == 1 and input_tfms[
-            0].scheme.head_dim == quant_scheme.group_size
+def is_qutlass_fp4_scheme(
+    quant_scheme: Optional[CompressedTensorsScheme],
+    input_tfms: dict[int, TransformTuple],
+) -> bool:
+    return (
+        isinstance(quant_scheme, (CompressedTensorsW4A4Fp4,))
+        and len(input_tfms) == 1
+        and input_tfms[0].scheme.head_dim == quant_scheme.group_size
+    )
 
 
 class QutlassNvFP4LinearMethod(CompressedTensorsLinearTransformMethod):
-
-    def create_weights(self, layer, input_size_per_partition,
-                       output_partition_sizes, input_size, output_size,
-                       params_dtype, **extra_weight_attrs):
+    def create_weights(
+        self,
+        layer,
+        input_size_per_partition,
+        output_partition_sizes,
+        input_size,
+        output_size,
+        params_dtype,
+        **extra_weight_attrs,
+    ):
         # initializes fp4 qparams
-        assert isinstance(layer.scheme, (CompressedTensorsW4A4Fp4, ))
-        ret = super().create_weights(layer, input_size_per_partition,
-                                     output_partition_sizes, input_size,
-                                     output_size, params_dtype,
-                                     **extra_weight_attrs)
+        assert isinstance(layer.scheme, (CompressedTensorsW4A4Fp4,))
+        ret = super().create_weights(
+            layer,
+            input_size_per_partition,
+            output_partition_sizes,
+            input_size,
+            output_size,
+            params_dtype,
+            **extra_weight_attrs,
+        )
 
         assert self.input_transform is not None
         assert len(self.input_transform.weight) == 1
-        assert self.input_transform.weight[0].size(
-            0) == layer.scheme.group_size
+        assert self.input_transform.weight[0].size(0) == layer.scheme.group_size
 
         return ret
 
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         raise NotImplementedError()
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/triton_scaled_mm.py b/vllm/model_executor/layers/quantization/compressed_tensors/triton_scaled_mm.py
index d926b4c12db1..ed326197295d 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/triton_scaled_mm.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/triton_scaled_mm.py
@@ -17,13 +17,29 @@ def is_weak_contiguous(x: torch.Tensor):
 
 
 @triton.jit
-def scaled_mm_kernel(a_ptr, b_ptr, scale_a_ptr, scale_b_ptr, c_ptr, bias_ptr,
-                     M, N, K, stride_am, stride_ak, stride_bk, stride_bn,
-                     stride_cm, stride_cn, ACCUMULATOR_DTYPE: tl.constexpr,
-                     BLOCK_SIZE_M: tl.constexpr, BLOCK_SIZE_N: tl.constexpr,
-                     BLOCK_SIZE_K: tl.constexpr,
-                     BLOCK_SIZE_SCALE_A: tl.constexpr,
-                     BLOCK_SIZE_SCALE_B: tl.constexpr):
+def scaled_mm_kernel(
+    a_ptr,
+    b_ptr,
+    scale_a_ptr,
+    scale_b_ptr,
+    c_ptr,
+    bias_ptr,
+    M,
+    N,
+    K,
+    stride_am,
+    stride_ak,
+    stride_bk,
+    stride_bn,
+    stride_cm,
+    stride_cn,
+    ACCUMULATOR_DTYPE: tl.constexpr,
+    BLOCK_SIZE_M: tl.constexpr,
+    BLOCK_SIZE_N: tl.constexpr,
+    BLOCK_SIZE_K: tl.constexpr,
+    BLOCK_SIZE_SCALE_A: tl.constexpr,
+    BLOCK_SIZE_SCALE_B: tl.constexpr,
+):
     pid = tl.program_id(axis=0)
 
     num_pid_n = tl.cdiv(N, BLOCK_SIZE_N)
@@ -32,8 +48,7 @@ def scaled_mm_kernel(a_ptr, b_ptr, scale_a_ptr, scale_b_ptr, c_ptr, bias_ptr,
     pid_n = pid % num_pid_n
 
     accumulator_dtype = ACCUMULATOR_DTYPE
-    accumulator = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N),
-                           dtype=accumulator_dtype)
+    accumulator = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N), dtype=accumulator_dtype)
 
     # NOTE: Some tensor inputs are so large, they will cause int32 overflow
     # so it is necessary to use tl.int64 for all the offsets, else SEGV will
@@ -47,20 +62,22 @@ def scaled_mm_kernel(a_ptr, b_ptr, scale_a_ptr, scale_b_ptr, c_ptr, bias_ptr,
     masks_bn = offsets_bn < N
 
     offsets_k = tl.arange(0, BLOCK_SIZE_K).to(tl.int64)
-    offsets_a = (stride_am * offsets_am[:, None] +
-                 stride_ak * offsets_k[None, :])
-    offsets_b = (stride_bk * offsets_k[:, None] +
-                 stride_bn * offsets_bn[None, :])
+    offsets_a = stride_am * offsets_am[:, None] + stride_ak * offsets_k[None, :]
+    offsets_b = stride_bk * offsets_k[:, None] + stride_bn * offsets_bn[None, :]
 
     # NOTE: BLOCK_SIZE_SCALE_A could be 1 or BLOCK_SIZE_M, so need to create
     # appropriate offsets and masks for each case. Same goes for
     # BLOCK_SIZE_SCALE_B.
-    offsets_scale_am = (tl.arange(0, BLOCK_SIZE_SCALE_A) +
-                        (BLOCK_SIZE_SCALE_A > 1) * pid_m * BLOCK_SIZE_M)
+    offsets_scale_am = (
+        tl.arange(0, BLOCK_SIZE_SCALE_A)
+        + (BLOCK_SIZE_SCALE_A > 1) * pid_m * BLOCK_SIZE_M
+    )
     masks_scale_am = offsets_scale_am < M
 
-    offsets_scale_bn = (tl.arange(0, BLOCK_SIZE_SCALE_B) +
-                        (BLOCK_SIZE_SCALE_B > 1) * pid_n * BLOCK_SIZE_N)
+    offsets_scale_bn = (
+        tl.arange(0, BLOCK_SIZE_SCALE_B)
+        + (BLOCK_SIZE_SCALE_B > 1) * pid_n * BLOCK_SIZE_N
+    )
     masks_scale_bn = offsets_scale_bn < N
 
     a_ptrs = a_ptr + offsets_a
@@ -114,8 +131,7 @@ def scaled_mm_kernel(a_ptr, b_ptr, scale_a_ptr, scale_b_ptr, c_ptr, bias_ptr,
     offs_cn = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N).to(tl.int64)
     offs_cm = offs_cm.to(tl.int64)
     offs_cn = offs_cn.to(tl.int64)
-    c_ptrs = (c_ptr + stride_cm * offs_cm[:, None] +
-              stride_cn * offs_cn[None, :])
+    c_ptrs = c_ptr + stride_cm * offs_cm[:, None] + stride_cn * offs_cn[None, :]
     c_mask = (offs_cm[:, None] < M) & (offs_cn[None, :] < N)
 
     tl.store(c_ptrs, c, mask=c_mask)
@@ -123,16 +139,18 @@ def scaled_mm_kernel(a_ptr, b_ptr, scale_a_ptr, scale_b_ptr, c_ptr, bias_ptr,
 
 # input   - [M, K]
 # weight - [K, N]
-def triton_scaled_mm(input: torch.Tensor,
-                     weight: torch.Tensor,
-                     scale_a: torch.Tensor,
-                     scale_b: torch.Tensor,
-                     out_dtype: type[torch.dtype],
-                     bias: Optional[torch.Tensor] = None,
-                     block_size_m: int = 32,
-                     block_size_n: int = 32,
-                     block_size_k: int = 32,
-                     use_heuristic=True) -> torch.Tensor:
+def triton_scaled_mm(
+    input: torch.Tensor,
+    weight: torch.Tensor,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    out_dtype: type[torch.dtype],
+    bias: Optional[torch.Tensor] = None,
+    block_size_m: int = 32,
+    block_size_n: int = 32,
+    block_size_k: int = 32,
+    use_heuristic=True,
+) -> torch.Tensor:
     M, K = input.shape
     N = weight.shape[1]
 
@@ -144,17 +162,16 @@ def triton_scaled_mm(input: torch.Tensor,
     scale_b = scale_b.reshape(-1, 1) if scale_b.dim() <= 1 else scale_b
 
     assert scale_a.dtype == scale_b.dtype and scale_a.is_floating_point()
-    assert scale_a.shape[1] == 1 and (scale_a.shape[0] == 1
-                                      or scale_a.shape[0] == M)
-    assert scale_b.shape[1] == 1 and (scale_b.shape[0] == 1
-                                      or scale_b.shape[0] == N)
+    assert scale_a.shape[1] == 1 and (scale_a.shape[0] == 1 or scale_a.shape[0] == M)
+    assert scale_b.shape[1] == 1 and (scale_b.shape[0] == 1 or scale_b.shape[0] == N)
     assert out_dtype.is_floating_point
     assert bias is None or bias.is_floating_point()
     assert is_weak_contiguous(input)
     assert is_weak_contiguous(weight)
 
-    grid = lambda META: (triton.cdiv(M, META['BLOCK_SIZE_M']) * triton.cdiv(
-        N, META['BLOCK_SIZE_N']), )
+    grid = lambda META: (
+        triton.cdiv(M, META["BLOCK_SIZE_M"]) * triton.cdiv(N, META["BLOCK_SIZE_N"]),
+    )
 
     result = torch.empty((M, N), dtype=out_dtype, device=input.device)
 
@@ -181,26 +198,28 @@ def triton_scaled_mm(input: torch.Tensor,
 
     # A = input, B = weight, C = result
     # A = M x K, B = K x N, C = M x N
-    scaled_mm_kernel[grid](input,
-                           weight,
-                           scale_a,
-                           scale_b,
-                           result,
-                           bias,
-                           M,
-                           N,
-                           K,
-                           input.stride(0),
-                           input.stride(1),
-                           weight.stride(0),
-                           weight.stride(1),
-                           result.stride(0),
-                           result.stride(1),
-                           accumulator_dtype,
-                           BLOCK_SIZE_M=block_size_m,
-                           BLOCK_SIZE_N=block_size_n,
-                           BLOCK_SIZE_K=block_size_k,
-                           BLOCK_SIZE_SCALE_A=block_size_sa,
-                           BLOCK_SIZE_SCALE_B=block_size_sb)
+    scaled_mm_kernel[grid](
+        input,
+        weight,
+        scale_a,
+        scale_b,
+        result,
+        bias,
+        M,
+        N,
+        K,
+        input.stride(0),
+        input.stride(1),
+        weight.stride(0),
+        weight.stride(1),
+        result.stride(0),
+        result.stride(1),
+        accumulator_dtype,
+        BLOCK_SIZE_M=block_size_m,
+        BLOCK_SIZE_N=block_size_n,
+        BLOCK_SIZE_K=block_size_k,
+        BLOCK_SIZE_SCALE_A=block_size_sa,
+        BLOCK_SIZE_SCALE_B=block_size_sb,
+    )
 
     return result.to(out_dtype)
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/utils.py b/vllm/model_executor/layers/quantization/compressed_tensors/utils.py
index b2dd2501095f..5fb055de5803 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/utils.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/utils.py
@@ -15,7 +15,7 @@ def is_activation_quantization_format(format: str) -> bool:
         CompressionFormat.naive_quantized.value,
         CompressionFormat.int_quantized.value,
         CompressionFormat.float_quantized.value,
-        CompressionFormat.nvfp4_pack_quantized.value
+        CompressionFormat.nvfp4_pack_quantized.value,
     ]
     return format in _ACTIVATION_QUANTIZATION_FORMATS
 
@@ -23,7 +23,7 @@ def is_activation_quantization_format(format: str) -> bool:
 def should_ignore_layer(
     layer_name: Optional[str],
     ignore: Iterable[str] = tuple(),
-    fused_mapping: Mapping[str, list[str]] = MappingProxyType({})
+    fused_mapping: Mapping[str, list[str]] = MappingProxyType({}),
 ) -> bool:
     if layer_name is None:
         return False
@@ -49,7 +49,8 @@ def should_ignore_layer(
         should_ignore_layer = None
         for shard_name in shard_names:
             should_ignore_shard = check_equal_or_regex_match(
-                layer_name=shard_name, targets=ignore)
+                layer_name=shard_name, targets=ignore
+            )
 
             # If shard_idx=0, set layer ignore to match shard.
             if should_ignore_layer is None:
@@ -57,22 +58,24 @@ def should_ignore_layer(
 
             # If shard_idx=1+ confirm scheme matches prior shards.
             elif should_ignore_shard != should_ignore_layer:
-                raise ValueError(f"Found a different quantization schemes for "
-                                 f"{shard_proj_names} in {layer_name}. vLLM "
-                                 "requires all to use the same scheme.")
+                raise ValueError(
+                    f"Found a different quantization schemes for "
+                    f"{shard_proj_names} in {layer_name}. vLLM "
+                    "requires all to use the same scheme."
+                )
 
     # Unfused layers like down_proj and o_proj will match
     # the safetensors checkpoint already.
     else:
-        should_ignore_layer = check_equal_or_regex_match(layer_name=layer_name,
-                                                         targets=ignore)
+        should_ignore_layer = check_equal_or_regex_match(
+            layer_name=layer_name, targets=ignore
+        )
 
     assert should_ignore_layer is not None
     return should_ignore_layer
 
 
-def check_equal_or_regex_match(layer_name: str,
-                               targets: Iterable[str]) -> bool:
+def check_equal_or_regex_match(layer_name: str, targets: Iterable[str]) -> bool:
     """
     Checks whether a layer_name is exactly equal or a regex match for
     if target starts with 're:' to any target in list.
@@ -87,7 +90,7 @@ def find_matched_target(
     layer_name: Optional[str],
     module: Module,
     targets: Iterable[str],
-    fused_mapping: Mapping[str, list[str]] = MappingProxyType({})
+    fused_mapping: Mapping[str, list[str]] = MappingProxyType({}),
 ) -> str:
     """
     Helper function to look up which "target" in the compressed-tensors
@@ -120,19 +123,21 @@ def find_matched_target(
     matched_target = (
         _find_first_match(layer_name, targets)
         or _find_first_match(module.__class__.__name__, targets, True)
-        or _match_fused_layer(layer_name, targets, fused_mapping))
+        or _match_fused_layer(layer_name, targets, fused_mapping)
+    )
 
     if matched_target is None:
         raise ValueError(
             f"Unable to find matching target for {layer_name} in the "
-            "compressed-tensors config.")
+            "compressed-tensors config."
+        )
 
     return matched_target
 
 
-def _find_first_match(value: str,
-                      targets: Iterable[str],
-                      check_contains: bool = False) -> Optional[str]:
+def _find_first_match(
+    value: str, targets: Iterable[str], check_contains: bool = False
+) -> Optional[str]:
     """
     Returns first element of target that matches value either
     exactly or as a regex after 're:'. If check_contains is set to True,
@@ -144,16 +149,14 @@ def _find_first_match(value: str,
     """
 
     for target in targets:
-        if _is_equal_or_regex_match(value,
-                                    target,
-                                    check_contains=check_contains):
+        if _is_equal_or_regex_match(value, target, check_contains=check_contains):
             return target
     return None
 
 
-def _is_equal_or_regex_match(value: str,
-                             target: str,
-                             check_contains: bool = False) -> bool:
+def _is_equal_or_regex_match(
+    value: str, target: str, check_contains: bool = False
+) -> bool:
     """
     Checks whether a value is exactly equal or a regex match for target
     if target starts with 're:'. If check_contains is set to True,
@@ -173,10 +176,12 @@ def _is_equal_or_regex_match(value: str,
 
 
 def _match_fused_layer(
-        layer_name: str, target_layers: Iterable[str],
-        fused_mapping: Mapping[str, list[str]]) -> Optional[str]:
+    layer_name: str,
+    target_layers: Iterable[str],
+    fused_mapping: Mapping[str, list[str]],
+) -> Optional[str]:
     """
-    Match a fused layer name to its corresponding individual layer in 
+    Match a fused layer name to its corresponding individual layer in
     target_layers. Returns first value in fused_mapping which matches targets
 
     Implements an "all" matching strategy where a fused layer matches iff
@@ -193,8 +198,7 @@ def _match_fused_layer(
                         "model.layers.0.self_attn.v_proj"]
     """
     # find layer_name in mapping
-    fused = next((key for key in fused_mapping if layer_name.endswith(key)),
-                 None)
+    fused = next((key for key in fused_mapping if layer_name.endswith(key)), None)
     if fused is None:
         return None
 
diff --git a/vllm/model_executor/layers/quantization/deepspeedfp.py b/vllm/model_executor/layers/quantization/deepspeedfp.py
index 4a189ab4a171..82a2103a19f3 100644
--- a/vllm/model_executor/layers/quantization/deepspeedfp.py
+++ b/vllm/model_executor/layers/quantization/deepspeedfp.py
@@ -9,15 +9,17 @@
 from packaging import version
 
 from vllm.model_executor.layers.linear import LinearBase, LinearMethodBase
-from vllm.model_executor.layers.quantization import (QuantizationConfig,
-                                                     QuantizationMethods)
+from vllm.model_executor.layers.quantization import (
+    QuantizationConfig,
+    QuantizationMethods,
+)
 from vllm.model_executor.utils import set_weight_attrs
 
 
 class DeepSpeedFPConfig(QuantizationConfig):
     """Config for DeepSpeed FP quantizer. It supports fp6 and fp8.
-    
-    Args: 
+
+    Args:
         weight_bits: the target quantization bits, 6 or 8.
         group_size: group size for quantizaiton, default to 128.
     """
@@ -36,11 +38,14 @@ def __init__(
             raise ValueError(
                 "Currently, only 6-bit or 8-bit weight quantization are "
                 f"supported for DeepSpeed FP quantizaiton, but got "
-                f"{self.weight_bits} bits.")
+                f"{self.weight_bits} bits."
+            )
 
     def __repr__(self) -> str:
-        return (f"DeepSpeedFPConfig(weight_bits={self.weight_bits}), "
-                f"group_size={self.group_size}")
+        return (
+            f"DeepSpeedFPConfig(weight_bits={self.weight_bits}), "
+            f"group_size={self.group_size}"
+        )
 
     @classmethod
     def get_name(cls) -> QuantizationMethods:
@@ -71,8 +76,9 @@ def get_config_filenames() -> list[str]:
             "quantize_config.json",
         ]
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["DeepSpeedFPLinearMethod"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["DeepSpeedFPLinearMethod"]:
         if isinstance(layer, LinearBase):
             return DeepSpeedFPLinearMethod(self)
         return None
@@ -89,15 +95,17 @@ def __init__(self, quant_config: DeepSpeedFPConfig):
         self.quant_config = quant_config
         self.weight = None
 
-    def create_weights(self,
-                       layer: torch.nn.Module,
-                       input_size_per_partition: int,
-                       output_partition_sizes: list[int],
-                       input_size: int,
-                       output_size: int,
-                       params_dtype: torch.dtype,
-                       weight_loader=None,
-                       **extra_weight_attrs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        input_size_per_partition: int,
+        output_partition_sizes: list[int],
+        input_size: int,
+        output_size: int,
+        params_dtype: torch.dtype,
+        weight_loader=None,
+        **extra_weight_attrs,
+    ):
         del output_size
         del input_size
         output_size_per_partition = sum(output_partition_sizes)
@@ -106,10 +114,13 @@ def create_weights(self,
             params_dtype=params_dtype,
             quant_config=self.quant_config,
         )
-        set_weight_attrs(weight, {
-            "input_dim": 1,
-            "output_dim": 0,
-        })
+        set_weight_attrs(
+            weight,
+            {
+                "input_dim": 1,
+                "output_dim": 0,
+            },
+        )
         layer.register_parameter("weight", weight)
 
         def quant_weight_loader(param, loaded_weight, *args, **kwargs):
@@ -125,10 +136,12 @@ def quant_weight_loader(param, loaded_weight, *args, **kwargs):
         extra_weight_attrs["weight_loader"] = quant_weight_loader
         set_weight_attrs(weight, extra_weight_attrs)
 
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         weight = layer.weight
         y = weight.ds_dequantize()
         return F.linear(x, y, bias)
@@ -141,23 +154,33 @@ class DeepSpeedFPParameter(nn.Parameter):
     GPUs, and can be dequantized on-the-fly when needed by the model.
     """
 
-    def __new__(cls, orig_shape: torch.Size, params_dtype: torch.dtype,
-                quant_config: DeepSpeedFPConfig):
+    def __new__(
+        cls,
+        orig_shape: torch.Size,
+        params_dtype: torch.dtype,
+        quant_config: DeepSpeedFPConfig,
+    ):
         try:
             import deepspeed
+
             if version.parse(deepspeed.__version__) < version.parse("0.14.2"):
-                raise ImportError("deepspeed version is wrong. Please "
-                                  "install deepspeed>=0.14.2.")
+                raise ImportError(
+                    "deepspeed version is wrong. Please install deepspeed>=0.14.2."
+                )
             from deepspeed.ops.fp_quantizer import FP_Quantize
         except ImportError as err:
-            raise ImportError("Please install deepspeed>=0.14.2 via "
-                              "`pip install deepspeed>=0.14.2` to use "
-                              "deepspeedfp quantizer.") from err
-        data = torch.empty((
-            orig_shape.numel() // quant_config.group_size,
-            quant_config.group_size * quant_config.weight_bits // 8 + 4,
-        ),
-                           dtype=torch.int8)
+            raise ImportError(
+                "Please install deepspeed>=0.14.2 via "
+                "`pip install deepspeed>=0.14.2` to use "
+                "deepspeedfp quantizer."
+            ) from err
+        data = torch.empty(
+            (
+                orig_shape.numel() // quant_config.group_size,
+                quant_config.group_size * quant_config.weight_bits // 8 + 4,
+            ),
+            dtype=torch.int8,
+        )
         self = torch.Tensor._make_subclass(cls, data, data.requires_grad)
         self.orig_shape = orig_shape
         self.quant_config = quant_config
@@ -172,7 +195,8 @@ def ds_quantize_(self, tensor: torch.Tensor):
             self.fp_quantizer.quantize(
                 tensor.data,
                 q_bits=self.quant_config.weight_bits,
-            ))
+            )
+        )
 
     def ds_dequantize(self, fp_out=None) -> torch.Tensor:
         """
@@ -180,7 +204,8 @@ def ds_dequantize(self, fp_out=None) -> torch.Tensor:
         """
         assert self.data.device.type == "cuda" and self.data.dtype == torch.int8
         return self.fp_quantizer.dequantize(
-            self.data, fp_out=fp_out, q_bits=self.quant_config.weight_bits)
+            self.data, fp_out=fp_out, q_bits=self.quant_config.weight_bits
+        )
 
     def ds_selective_dequantize(self, indices, fp_out=None) -> torch.Tensor:
         """
@@ -189,7 +214,5 @@ def ds_selective_dequantize(self, indices, fp_out=None) -> torch.Tensor:
         """
         assert self.data.device.type == "cuda" and self.data.dtype == torch.int8
         return self.fp_quantizer.selective_dequantize(
-            self.data,
-            indices,
-            fp_out=fp_out,
-            q_bits=self.quant_config.weight_bits)
+            self.data, indices, fp_out=fp_out, q_bits=self.quant_config.weight_bits
+        )
diff --git a/vllm/model_executor/layers/quantization/experts_int8.py b/vllm/model_executor/layers/quantization/experts_int8.py
index 38d7e200b303..909b04c79f23 100644
--- a/vllm/model_executor/layers/quantization/experts_int8.py
+++ b/vllm/model_executor/layers/quantization/experts_int8.py
@@ -6,15 +6,21 @@
 import torch
 
 from vllm.distributed import get_tensor_model_parallel_rank, get_tp_group
-from vllm.model_executor.layers.fused_moe import (FusedMoE, FusedMoEConfig,
-                                                  FusedMoEMethodBase)
+from vllm.model_executor.layers.fused_moe import (
+    FusedMoE,
+    FusedMoEConfig,
+    FusedMoEMethodBase,
+)
 from vllm.model_executor.layers.fused_moe.config import (
-    FusedMoEQuantConfig, int8_w8a16_moe_quant_config)
-from vllm.model_executor.layers.linear import (LinearBase,
-                                               UnquantizedLinearMethod)
+    FusedMoEQuantConfig,
+    int8_w8a16_moe_quant_config,
+)
+from vllm.model_executor.layers.linear import LinearBase, UnquantizedLinearMethod
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.utils import set_weight_attrs
 
 
@@ -44,8 +50,9 @@ def get_config_filenames(cls) -> list[str]:
     def from_config(cls, config: dict[str, Any]) -> "ExpertsInt8Config":
         return cls()
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         if isinstance(layer, LinearBase):
             return UnquantizedLinearMethod()
         elif isinstance(layer, FusedMoE):
@@ -54,7 +61,6 @@ def get_quant_method(self, layer: torch.nn.Module,
 
 
 class ExpertsInt8MoEMethod(FusedMoEMethodBase):
-
     def __init__(
         self,
         quant_config: ExpertsInt8Config,
@@ -63,57 +69,70 @@ def __init__(
         super().__init__(moe)
         self.quant_config = quant_config
 
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
-
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         int8_dtype = torch.int8
 
-        assert 'weight_loader' in extra_weight_attrs
-        weight_loader = extra_weight_attrs['weight_loader']
+        assert "weight_loader" in extra_weight_attrs
+        weight_loader = extra_weight_attrs["weight_loader"]
         wrapped_weight_loader = ExpertsInt8MoEMethod.quantizing_weight_loader(
-            layer, weight_loader)
-        extra_weight_attrs['weight_loader'] = wrapped_weight_loader
+            layer, weight_loader
+        )
+        extra_weight_attrs["weight_loader"] = wrapped_weight_loader
 
         # Fused gate_up_proj (column parallel)
-        w13_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            2 * intermediate_size_per_partition,
-            hidden_size,
-            dtype=int8_dtype),
-                                        requires_grad=False)
+        w13_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                2 * intermediate_size_per_partition,
+                hidden_size,
+                dtype=int8_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_weight", w13_weight)
         set_weight_attrs(w13_weight, extra_weight_attrs)
 
         # down_proj (row parallel)
-        w2_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            hidden_size,
-            intermediate_size_per_partition,
-            dtype=int8_dtype),
-                                       requires_grad=False)
+        w2_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                hidden_size,
+                intermediate_size_per_partition,
+                dtype=int8_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_weight", w2_weight)
         set_weight_attrs(w2_weight, extra_weight_attrs)
 
-        w13_scale = torch.nn.Parameter(torch.zeros(
-            num_experts,
-            2 * intermediate_size_per_partition,
-            dtype=torch.float32),
-                                       requires_grad=False)
+        w13_scale = torch.nn.Parameter(
+            torch.zeros(
+                num_experts, 2 * intermediate_size_per_partition, dtype=torch.float32
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_scale", w13_scale)
 
-        w2_scale = torch.nn.Parameter(torch.zeros(num_experts,
-                                                  hidden_size,
-                                                  dtype=torch.float32),
-                                      requires_grad=False)
+        w2_scale = torch.nn.Parameter(
+            torch.zeros(num_experts, hidden_size, dtype=torch.float32),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_scale", w2_scale)
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
-        return int8_w8a16_moe_quant_config(w1_scale=layer.w13_scale,
-                                           w2_scale=layer.w2_scale,
-                                           w1_zp=None,
-                                           w2_zp=None)
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
+        return int8_w8a16_moe_quant_config(
+            w1_scale=layer.w13_scale, w2_scale=layer.w2_scale, w1_zp=None, w2_zp=None
+        )
 
     def apply(
         self,
@@ -142,7 +161,8 @@ def apply(
 
         if enable_eplb:
             raise NotImplementedError(
-                "EPLB not supported for `ExpertsInt8MoEMethod` yet.")
+                "EPLB not supported for `ExpertsInt8MoEMethod` yet."
+            )
 
         from vllm.model_executor.layers.fused_moe import fused_experts
 
@@ -158,7 +178,8 @@ def apply(
             scoring_func=scoring_func,
             routed_scaling_factor=routed_scaling_factor,
             e_score_correction_bias=e_score_correction_bias,
-            indices_type=self.topk_indices_dtype)
+            indices_type=self.topk_indices_dtype,
+        )
 
         return fused_experts(
             x,
@@ -176,11 +197,13 @@ def apply(
 
     @staticmethod
     def quantizing_weight_loader(layer, weight_loader):
-
-        def quantize_and_call_weight_loader(param: torch.nn.Parameter,
-                                            loaded_weight: torch.Tensor,
-                                            weight_name: str, shard_id: int,
-                                            expert_id: int):
+        def quantize_and_call_weight_loader(
+            param: torch.nn.Parameter,
+            loaded_weight: torch.Tensor,
+            weight_name: str,
+            shard_id: int,
+            expert_id: int,
+        ):
             tp_rank = get_tensor_model_parallel_rank()
             shard_size = layer.intermediate_size_per_partition
             shard = slice(tp_rank * shard_size, (tp_rank + 1) * shard_size)
@@ -188,33 +211,28 @@ def quantize_and_call_weight_loader(param: torch.nn.Parameter,
             loaded_weight = loaded_weight.to(device)
             # w1, gate_proj case: Load into first shard of w13.
             if shard_id == "w1":
-                scales = quantize_in_place_and_get_scales(
-                    loaded_weight[shard, :])
-                layer.w13_scale.data[expert_id, 0:shard_size].copy_(scales[:,
-                                                                           0])
+                scales = quantize_in_place_and_get_scales(loaded_weight[shard, :])
+                layer.w13_scale.data[expert_id, 0:shard_size].copy_(scales[:, 0])
             # w3, up_proj case: Load into second shard of w13.
             elif shard_id == "w3":
-                scales = quantize_in_place_and_get_scales(
-                    loaded_weight[shard, :])
-                layer.w13_scale.data[expert_id, shard_size:2 *
-                                     shard_size].copy_(scales[:, 0])
+                scales = quantize_in_place_and_get_scales(loaded_weight[shard, :])
+                layer.w13_scale.data[expert_id, shard_size : 2 * shard_size].copy_(
+                    scales[:, 0]
+                )
             # w2, down_proj case: Load into only shard of w2.
             elif shard_id == "w2":
-                scales = quantize_in_place_and_get_scales(loaded_weight[:,
-                                                                        shard])
+                scales = quantize_in_place_and_get_scales(loaded_weight[:, shard])
                 layer.w2_scale.data[expert_id, :].copy_(scales[:, 0])
             else:
-                raise ValueError(
-                    f"Shard id must be in [0,1,2] but got {shard_id}")
-            weight_loader(param, loaded_weight, weight_name, shard_id,
-                          expert_id)
+                raise ValueError(f"Shard id must be in [0,1,2] but got {shard_id}")
+            weight_loader(param, loaded_weight, weight_name, shard_id, expert_id)
 
         return quantize_and_call_weight_loader
 
 
 def quantize_in_place_and_get_scales(weight: torch.Tensor) -> torch.Tensor:
     vmax = torch.iinfo(torch.int8).max
-    scales = (torch.max(torch.abs(weight), dim=1, keepdim=True)[0] / vmax)
+    scales = torch.max(torch.abs(weight), dim=1, keepdim=True)[0] / vmax
 
     weight.div_(scales)
     weight.round_()
diff --git a/vllm/model_executor/layers/quantization/fbgemm_fp8.py b/vllm/model_executor/layers/quantization/fbgemm_fp8.py
index b2cab7d4614a..5d390cbd7b1e 100644
--- a/vllm/model_executor/layers/quantization/fbgemm_fp8.py
+++ b/vllm/model_executor/layers/quantization/fbgemm_fp8.py
@@ -8,19 +8,33 @@
 from torch.nn.parameter import Parameter
 
 from vllm.logger import init_logger
-from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
-                                               UnquantizedLinearMethod)
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    LinearMethodBase,
+    UnquantizedLinearMethod,
+)
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp8 import (
-    apply_fp8_marlin_linear, prepare_fp8_layer_for_marlin)
+    apply_fp8_marlin_linear,
+    prepare_fp8_layer_for_marlin,
+)
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape, is_layer_skipped)
+    GroupShape,
+    is_layer_skipped,
+)
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    Fp8LinearOp, maybe_create_device_identity, normalize_e4m3fn_to_e4m3fnuz)
-from vllm.model_executor.parameter import (ChannelQuantScaleParameter,
-                                           ModelWeightParameter)
+    Fp8LinearOp,
+    maybe_create_device_identity,
+    normalize_e4m3fn_to_e4m3fnuz,
+)
+from vllm.model_executor.parameter import (
+    ChannelQuantScaleParameter,
+    ModelWeightParameter,
+)
 from vllm.platforms import current_platform
 
 logger = init_logger(__name__)
@@ -60,23 +74,26 @@ def from_config(cls, config: dict[str, Any]) -> "FBGEMMFp8Config":
         input_scale_ub = cls.get_from_keys(config, ["activation_scale_ub"])
         return cls(ignore_list=ignore_list, input_scale_ub=input_scale_ub)
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         if isinstance(layer, LinearBase):
-            if is_layer_skipped(prefix=prefix,
-                                ignored_layers=self.ignore_list,
-                                fused_mapping=self.packed_modules_mapping):
+            if is_layer_skipped(
+                prefix=prefix,
+                ignored_layers=self.ignore_list,
+                fused_mapping=self.packed_modules_mapping,
+            ):
                 return UnquantizedLinearMethod()
             return FBGEMMFp8LinearMethod(self)
         return None
 
 
 class FBGEMMFp8LinearMethod(LinearMethodBase):
-
     def __init__(self, quant_config: FBGEMMFp8Config):
         self.quant_config = quant_config
         self.fp8_linear = Fp8LinearOp(
-            act_quant_static=False, act_quant_group_shape=GroupShape.PER_TOKEN)
+            act_quant_static=False, act_quant_group_shape=GroupShape.PER_TOKEN
+        )
         self.out_dtype = torch.get_default_dtype()
 
     def create_weights(
@@ -101,43 +118,45 @@ def create_weights(
         layer.orig_dtype = params_dtype
 
         # WEIGHT
-        weight = ModelWeightParameter(data=torch.empty(
-            output_size_per_partition,
-            input_size_per_partition,
-            dtype=torch.float8_e4m3fn),
-                                      input_dim=1,
-                                      output_dim=0,
-                                      weight_loader=weight_loader)
+        weight = ModelWeightParameter(
+            data=torch.empty(
+                output_size_per_partition,
+                input_size_per_partition,
+                dtype=torch.float8_e4m3fn,
+            ),
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("weight", weight)
 
         # WEIGHT SCALE
-        weight_scale = ChannelQuantScaleParameter(data=torch.empty(
-            (sum(output_partition_sizes), 1), dtype=torch.float32),
-                                                  output_dim=0,
-                                                  weight_loader=weight_loader)
+        weight_scale = ChannelQuantScaleParameter(
+            data=torch.empty((sum(output_partition_sizes), 1), dtype=torch.float32),
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
         weight_scale[:] = torch.finfo(torch.float32).min
         layer.register_parameter("weight_scale", weight_scale)
 
         # INPUT SCALE UPPER BOUND
-        input_scale_ub = torch.nn.Parameter(torch.tensor(
-            (self.quant_config.input_scale_ub), dtype=torch.float32),
-                                            requires_grad=False)
+        input_scale_ub = torch.nn.Parameter(
+            torch.tensor((self.quant_config.input_scale_ub), dtype=torch.float32),
+            requires_grad=False,
+        )
         layer.input_scale_ub = input_scale_ub
 
     def process_weights_after_loading(self, layer: Module) -> None:
         # required by torch.compile
-        layer.weight_scale = Parameter(layer.weight_scale.data,
-                                       requires_grad=False)
+        layer.weight_scale = Parameter(layer.weight_scale.data, requires_grad=False)
         layer.weight = Parameter(layer.weight.data, requires_grad=False)
 
         weight = layer.weight
 
         if current_platform.is_fp8_fnuz():
-            weight, weight_scale, input_scale = \
-                normalize_e4m3fn_to_e4m3fnuz(
-                    weight=weight,
-                    weight_scale=layer.weight_scale,
-                    input_scale=None)
+            weight, weight_scale, input_scale = normalize_e4m3fn_to_e4m3fnuz(
+                weight=weight, weight_scale=layer.weight_scale, input_scale=None
+            )
             if input_scale is not None:
                 layer.input_scale = Parameter(input_scale, requires_grad=False)
             layer.weight_scale = Parameter(weight_scale, requires_grad=False)
@@ -148,11 +167,12 @@ def process_weights_after_loading(self, layer: Module) -> None:
             # Activations not quantized for marlin.
             del layer.input_scale_ub
 
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
-
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         if self.quant_config.use_marlin:
             return apply_fp8_marlin_linear(
                 input=x,
@@ -161,12 +181,15 @@ def apply(self,
                 workspace=layer.workspace,
                 size_n=layer.output_size_per_partition,
                 size_k=layer.input_size_per_partition,
-                bias=bias)
-
-        return self.fp8_linear.apply(input=x,
-                                     weight=layer.weight,
-                                     weight_scale=layer.weight_scale,
-                                     out_dtype=self.out_dtype,
-                                     input_scale=None,
-                                     input_scale_ub=layer.input_scale_ub,
-                                     bias=bias)
+                bias=bias,
+            )
+
+        return self.fp8_linear.apply(
+            input=x,
+            weight=layer.weight,
+            weight_scale=layer.weight_scale,
+            out_dtype=self.out_dtype,
+            input_scale=None,
+            input_scale_ub=layer.input_scale_ub,
+            bias=bias,
+        )
diff --git a/vllm/model_executor/layers/quantization/fp8.py b/vllm/model_executor/layers/quantization/fp8.py
index 4c4f3a8b0f47..2123fd9eba15 100644
--- a/vllm/model_executor/layers/quantization/fp8.py
+++ b/vllm/model_executor/layers/quantization/fp8.py
@@ -14,51 +14,85 @@
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe import (
-    FusedMoE, FusedMoEActivationFormat, FusedMoEMethodBase,
-    FusedMoEPermuteExpertsUnpermute, FusedMoEPrepareAndFinalize,
-    FusedMoeWeightScaleSupported)
+    FusedMoE,
+    FusedMoEActivationFormat,
+    FusedMoEMethodBase,
+    FusedMoEPermuteExpertsUnpermute,
+    FusedMoEPrepareAndFinalize,
+    FusedMoeWeightScaleSupported,
+)
 from vllm.model_executor.layers.fused_moe.config import (
-    FusedMoEQuantConfig, fp8_w8a8_moe_quant_config)
-from vllm.model_executor.layers.fused_moe.layer import (
-    UnquantizedFusedMoEMethod)
-from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
-                                               UnquantizedLinearMethod)
+    FusedMoEQuantConfig,
+    fp8_w8a8_moe_quant_config,
+)
+from vllm.model_executor.layers.fused_moe.layer import UnquantizedFusedMoEMethod
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    LinearMethodBase,
+    UnquantizedLinearMethod,
+)
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.layers.quantization.kv_cache import BaseKVCacheMethod
 from vllm.model_executor.layers.quantization.utils.flashinfer_utils import (
-    FlashinferMoeBackend, apply_flashinfer_per_tensor_scale_fp8,
+    FlashinferMoeBackend,
+    apply_flashinfer_per_tensor_scale_fp8,
     build_flashinfer_fp8_cutlass_moe_prepare_finalize,
-    flashinfer_cutlass_moe_fp8, get_flashinfer_moe_backend,
-    register_moe_scaling_factors, rotate_flashinfer_fp8_moe_weights,
-    select_cutlass_fp8_gemm_impl, swap_w13_to_w31)
+    flashinfer_cutlass_moe_fp8,
+    get_flashinfer_moe_backend,
+    register_moe_scaling_factors,
+    rotate_flashinfer_fp8_moe_weights,
+    select_cutlass_fp8_gemm_impl,
+    swap_w13_to_w31,
+)
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    W8A8BlockFp8LinearOp, check_aiter_fp8_linear_support,
-    create_fp8_input_scale, create_fp8_scale_parameter,
-    create_fp8_weight_parameter, expert_weight_is_col_major,
-    maybe_post_process_fp8_weight_block, process_fp8_weight_block_strategy,
-    process_fp8_weight_tensor_strategy, requant_weight_ue8m0_inplace,
-    validate_fp8_block_shape)
+    W8A8BlockFp8LinearOp,
+    check_aiter_fp8_linear_support,
+    create_fp8_input_scale,
+    create_fp8_scale_parameter,
+    create_fp8_weight_parameter,
+    expert_weight_is_col_major,
+    maybe_post_process_fp8_weight_block,
+    process_fp8_weight_block_strategy,
+    process_fp8_weight_tensor_strategy,
+    requant_weight_ue8m0_inplace,
+    validate_fp8_block_shape,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp8 import (
-    apply_fp8_marlin_linear, prepare_fp8_layer_for_marlin,
-    prepare_moe_fp8_layer_for_marlin)
+    apply_fp8_marlin_linear,
+    prepare_fp8_layer_for_marlin,
+    prepare_moe_fp8_layer_for_marlin,
+)
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape, is_layer_skipped)
+    GroupShape,
+    is_layer_skipped,
+)
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    Fp8LinearOp, all_close_1d, cutlass_block_fp8_supported,
-    cutlass_fp8_supported, maybe_create_device_identity,
-    normalize_e4m3fn_to_e4m3fnuz, per_tensor_dequantize)
-from vllm.model_executor.parameter import (BlockQuantScaleParameter,
-                                           ModelWeightParameter,
-                                           PerTensorScaleParameter)
+    Fp8LinearOp,
+    all_close_1d,
+    cutlass_block_fp8_supported,
+    cutlass_fp8_supported,
+    maybe_create_device_identity,
+    normalize_e4m3fn_to_e4m3fnuz,
+    per_tensor_dequantize,
+)
+from vllm.model_executor.parameter import (
+    BlockQuantScaleParameter,
+    ModelWeightParameter,
+    PerTensorScaleParameter,
+)
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.platforms import current_platform
 from vllm.scalar_type import scalar_types
 from vllm.utils import has_deep_gemm
-from vllm.utils.deep_gemm import (get_col_major_tma_aligned_tensor,
-                                  is_deep_gemm_e8m0_used,
-                                  is_deep_gemm_supported)
+from vllm.utils.deep_gemm import (
+    get_col_major_tma_aligned_tensor,
+    is_deep_gemm_e8m0_used,
+    is_deep_gemm_supported,
+)
 from vllm.utils.flashinfer import has_flashinfer_moe
 
 if TYPE_CHECKING:
@@ -85,22 +119,25 @@ def get_fp8_moe_backend(block_quant: bool) -> Fp8MoeBackend:
     Note: Shape-specific fallbacks may still occur at runtime.
     """
     # prefer FlashInfer backends when available and enabled on supported GPUs
-    if (current_platform.is_cuda()
-            and current_platform.is_device_capability(100)
-            and envs.VLLM_USE_FLASHINFER_MOE_FP8 and has_flashinfer_moe()):
+    if (
+        current_platform.is_cuda()
+        and current_platform.is_device_capability(100)
+        and envs.VLLM_USE_FLASHINFER_MOE_FP8
+        and has_flashinfer_moe()
+    ):
         backend = get_flashinfer_moe_backend()
         if backend == FlashinferMoeBackend.TENSORRT_LLM:
-            logger.info_once(
-                "Using FlashInfer FP8 MoE TRTLLM backend for SM100")
+            logger.info_once("Using FlashInfer FP8 MoE TRTLLM backend for SM100")
             return Fp8MoeBackend.FLASHINFER_TRTLLM
         else:
-            logger.info_once(
-                "Using FlashInfer FP8 MoE CUTLASS backend for SM100")
+            logger.info_once("Using FlashInfer FP8 MoE CUTLASS backend for SM100")
             return Fp8MoeBackend.FLASHINFER_CUTLASS
 
     # weight-only path for older GPUs without native FP8
-    use_marlin = (not current_platform.has_device_capability(89)
-                  or envs.VLLM_TEST_FORCE_FP8_MARLIN)
+    use_marlin = (
+        not current_platform.has_device_capability(89)
+        or envs.VLLM_TEST_FORCE_FP8_MARLIN
+    )
     if current_platform.is_rocm():
         use_marlin = False
     if use_marlin:
@@ -110,17 +147,18 @@ def get_fp8_moe_backend(block_quant: bool) -> Fp8MoeBackend:
     # deepGEMM on supported platforms with block-quantized weights
     if envs.VLLM_USE_DEEP_GEMM and block_quant:
         if not has_deep_gemm():
-            logger.warning_once(
-                "DeepGEMM backend requested but not available.")
+            logger.warning_once("DeepGEMM backend requested but not available.")
         elif is_deep_gemm_supported():
             logger.info_once("Using DeepGEMM backend for FP8 MoE")
             return Fp8MoeBackend.DEEPGEMM
 
     # CUTLASS BlockScaled GroupedGemm on SM100 with block-quantized weights
-    if (current_platform.is_cuda()
-            and current_platform.is_device_capability(100) and block_quant):
-        logger.info_once(
-            "Using Cutlass BlockScaled GroupedGemm backend for FP8 MoE")
+    if (
+        current_platform.is_cuda()
+        and current_platform.is_device_capability(100)
+        and block_quant
+    ):
+        logger.info_once("Using Cutlass BlockScaled GroupedGemm backend for FP8 MoE")
         return Fp8MoeBackend.CUTLASS_BLOCK_SCALED_GROUPED_GEMM
 
     # default to Triton
@@ -143,23 +181,26 @@ def __init__(
         self.is_checkpoint_fp8_serialized = is_checkpoint_fp8_serialized
 
         if activation_scheme not in ACTIVATION_SCHEMES:
-            raise ValueError(
-                f"Unsupported activation scheme {activation_scheme}")
+            raise ValueError(f"Unsupported activation scheme {activation_scheme}")
         self.activation_scheme = activation_scheme
         self.ignored_layers = ignored_layers or []
         if weight_block_size is not None:
             if not is_checkpoint_fp8_serialized:
                 raise ValueError(
                     "The block-wise quantization only supports fp8-serialized "
-                    "checkpoint for now.")
+                    "checkpoint for now."
+                )
             if len(weight_block_size) != 2:
                 raise ValueError(
                     "The quantization block size of weight must have 2 "
-                    f"dimensions, but got {len(weight_block_size)} dimensions")
+                    f"dimensions, but got {len(weight_block_size)} dimensions"
+                )
             if activation_scheme != "dynamic":
-                raise ValueError("The block-wise quantization only supports "
-                                 "dynamic activation scheme for now, but got "
-                                 f"{activation_scheme} activation scheme.")
+                raise ValueError(
+                    "The block-wise quantization only supports "
+                    "dynamic activation scheme for now, but got "
+                    f"{activation_scheme} activation scheme."
+                )
         self.weight_block_size = weight_block_size
 
     @classmethod
@@ -180,41 +221,48 @@ def get_config_filenames(cls) -> list[str]:
 
     def apply_vllm_mapper(self, hf_to_vllm_mapper: "WeightsMapper"):
         if self.ignored_layers is not None:
-            self.ignored_layers = hf_to_vllm_mapper.apply_list(
-                self.ignored_layers)
+            self.ignored_layers = hf_to_vllm_mapper.apply_list(self.ignored_layers)
 
     @classmethod
     def from_config(cls, config: dict[str, Any]) -> "Fp8Config":
         quant_method = cls.get_from_keys(config, ["quant_method"])
-        is_checkpoint_fp8_serialized = ("fp8" in quant_method)
+        is_checkpoint_fp8_serialized = "fp8" in quant_method
         activation_scheme = cls.get_from_keys(config, ["activation_scheme"])
         ignored_layers = cls.get_from_keys_or(config, ["ignored_layers"], None)
-        weight_block_size = cls.get_from_keys_or(config, ["weight_block_size"],
-                                                 None)
+        weight_block_size = cls.get_from_keys_or(config, ["weight_block_size"], None)
         if not ignored_layers:
-            ignored_layers = cls.get_from_keys_or(config,
-                                                  ["modules_to_not_convert"],
-                                                  None)
-        return cls(is_checkpoint_fp8_serialized=is_checkpoint_fp8_serialized,
-                   activation_scheme=activation_scheme,
-                   ignored_layers=ignored_layers,
-                   weight_block_size=weight_block_size)
-
-    def get_xpu_quant_method(self, layer: torch.nn.Module,
-                             prefix: str) -> Optional["QuantizeMethodBase"]:
+            ignored_layers = cls.get_from_keys_or(
+                config, ["modules_to_not_convert"], None
+            )
+        return cls(
+            is_checkpoint_fp8_serialized=is_checkpoint_fp8_serialized,
+            activation_scheme=activation_scheme,
+            ignored_layers=ignored_layers,
+            weight_block_size=weight_block_size,
+        )
+
+    def get_xpu_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         from vllm.attention.layer import Attention
         from vllm.model_executor.layers.quantization.ipex_quant import (
-            XPUFp8LinearMethod, XPUFp8MoEMethod)
+            XPUFp8LinearMethod,
+            XPUFp8MoEMethod,
+        )
+
         fp8_config = Fp8Config(
             is_checkpoint_fp8_serialized=self.is_checkpoint_fp8_serialized,
             activation_scheme=self.activation_scheme,
             ignored_layers=self.ignored_layers,
-            weight_block_size=self.weight_block_size)
+            weight_block_size=self.weight_block_size,
+        )
 
         if isinstance(layer, LinearBase):
-            if is_layer_skipped(prefix=prefix,
-                                ignored_layers=self.ignored_layers,
-                                fused_mapping=self.packed_modules_mapping):
+            if is_layer_skipped(
+                prefix=prefix,
+                ignored_layers=self.ignored_layers,
+                fused_mapping=self.packed_modules_mapping,
+            ):
                 return UnquantizedLinearMethod()
             return XPUFp8LinearMethod(fp8_config)
         elif isinstance(layer, FusedMoE):
@@ -223,22 +271,27 @@ def get_xpu_quant_method(self, layer: torch.nn.Module,
             return Fp8KVCacheMethod(self)
         return None
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         from vllm.attention.layer import Attention  # Avoid circular import
 
         if current_platform.is_xpu():
             return self.get_xpu_quant_method(layer, prefix)
         if isinstance(layer, LinearBase):
-            if is_layer_skipped(prefix=prefix,
-                                ignored_layers=self.ignored_layers,
-                                fused_mapping=self.packed_modules_mapping):
+            if is_layer_skipped(
+                prefix=prefix,
+                ignored_layers=self.ignored_layers,
+                fused_mapping=self.packed_modules_mapping,
+            ):
                 return UnquantizedLinearMethod()
             return Fp8LinearMethod(self)
         elif isinstance(layer, FusedMoE):
-            if is_layer_skipped(prefix=prefix,
-                                ignored_layers=self.ignored_layers,
-                                fused_mapping=self.packed_modules_mapping):
+            if is_layer_skipped(
+                prefix=prefix,
+                ignored_layers=self.ignored_layers,
+                fused_mapping=self.packed_modules_mapping,
+            ):
                 return UnquantizedFusedMoEMethod(layer.moe_config)
             return Fp8MoEMethod(self, layer)
         elif isinstance(layer, Attention):
@@ -291,8 +344,10 @@ def __init__(self, quant_config: Fp8Config):
 
         # For GPUs that lack FP8 hardware support, we can leverage the Marlin
         # kernel for fast weight-only FP8 quantization
-        self.use_marlin = (not current_platform.has_device_capability(89)
-                           or envs.VLLM_TEST_FORCE_FP8_MARLIN)
+        self.use_marlin = (
+            not current_platform.has_device_capability(89)
+            or envs.VLLM_TEST_FORCE_FP8_MARLIN
+        )
         # Disable marlin for rocm
         if current_platform.is_rocm():
             self.use_marlin = False
@@ -323,7 +378,8 @@ def __init__(self, quant_config: Fp8Config):
         else:
             self.fp8_linear = Fp8LinearOp(
                 act_quant_static=self.act_q_static,
-                act_quant_group_shape=self.act_q_group_shape)
+                act_quant_group_shape=self.act_q_group_shape,
+            )
 
     def create_weights(
         self,
@@ -348,25 +404,32 @@ def create_weights(
         if self.block_quant:
             assert self.weight_block_size is not None
             layer.weight_block_size = self.weight_block_size
-            validate_fp8_block_shape(layer, input_size, output_size,
-                                     input_size_per_partition,
-                                     output_partition_sizes,
-                                     self.weight_block_size)
+            validate_fp8_block_shape(
+                layer,
+                input_size,
+                output_size,
+                input_size_per_partition,
+                output_partition_sizes,
+                self.weight_block_size,
+            )
 
         # WEIGHT
         if self.quant_config.is_checkpoint_fp8_serialized:
-            weight = create_fp8_weight_parameter(output_size_per_partition,
-                                                 input_size_per_partition,
-                                                 weight_loader)
+            weight = create_fp8_weight_parameter(
+                output_size_per_partition, input_size_per_partition, weight_loader
+            )
         else:
             # For non-serialized checkpoints, use original dtype
-            weight = ModelWeightParameter(data=torch.empty(
-                output_size_per_partition,
-                input_size_per_partition,
-                dtype=params_dtype),
-                                          input_dim=1,
-                                          output_dim=0,
-                                          weight_loader=weight_loader)
+            weight = ModelWeightParameter(
+                data=torch.empty(
+                    output_size_per_partition,
+                    input_size_per_partition,
+                    dtype=params_dtype,
+                ),
+                input_dim=1,
+                output_dim=0,
+                weight_loader=weight_loader,
+            )
         layer.register_parameter("weight", weight)
 
         # If checkpoint is serialized fp8, load them.
@@ -374,28 +437,32 @@ def create_weights(
         if self.quant_config.is_checkpoint_fp8_serialized:
             # WEIGHT SCALE
             if not self.block_quant:
-                scale = create_fp8_scale_parameter(PerTensorScaleParameter,
-                                                   output_partition_sizes,
-                                                   input_size_per_partition,
-                                                   None, weight_loader)
+                scale = create_fp8_scale_parameter(
+                    PerTensorScaleParameter,
+                    output_partition_sizes,
+                    input_size_per_partition,
+                    None,
+                    weight_loader,
+                )
                 set_weight_attrs(scale, {"scale_type": "weight_scale"})
                 layer.register_parameter("weight_scale", scale)
             else:
                 assert not self.act_q_static
                 assert self.weight_block_size is not None
-                scale = create_fp8_scale_parameter(BlockQuantScaleParameter,
-                                                   output_partition_sizes,
-                                                   input_size_per_partition,
-                                                   self.weight_block_size,
-                                                   weight_loader)
+                scale = create_fp8_scale_parameter(
+                    BlockQuantScaleParameter,
+                    output_partition_sizes,
+                    input_size_per_partition,
+                    self.weight_block_size,
+                    weight_loader,
+                )
                 set_weight_attrs(scale, {"scale_type": "weight_scale"})
                 # The weight_scale_inv name is intentional for deepseekv3
                 layer.register_parameter("weight_scale_inv", scale)
 
             # INPUT ACTIVATION SCALE
             if self.act_q_static:
-                scale = create_fp8_input_scale(output_partition_sizes,
-                                               weight_loader)
+                scale = create_fp8_input_scale(output_partition_sizes, weight_loader)
                 set_weight_attrs(scale, {"scale_type": "input_scale"})
                 layer.register_parameter("input_scale", scale)
             else:
@@ -410,15 +477,15 @@ def process_weights_after_loading(self, layer: Module) -> None:
             size_k_first = False
 
             weight, weight_scale = process_fp8_weight_block_strategy(
-                layer.weight, layer.weight_scale_inv)
+                layer.weight, layer.weight_scale_inv
+            )
             # Delete the weight_scale_inv parameter to avoid confusion
             # with the weight_scale parameter
             del layer.weight_scale_inv
 
         # If checkpoint not serialized fp8, quantize the weights.
         elif not self.quant_config.is_checkpoint_fp8_serialized:
-            qweight, weight_scale = ops.scaled_fp8_quant(layer.weight,
-                                                         scale=None)
+            qweight, weight_scale = ops.scaled_fp8_quant(layer.weight, scale=None)
             weight = qweight.t()
 
         # If checkpoint is fp8 per-tensor, handle that there are N scales for N
@@ -430,10 +497,12 @@ def process_weights_after_loading(self, layer: Module) -> None:
             # If using w8a8, torch._scaled_mm needs per tensor, so
             # requantize the logical shards as a single weight.
             if not self.use_marlin:
-                weight, weight_scale, input_scale = (
-                    process_fp8_weight_tensor_strategy(
-                        weight, weight_scale, layer.logical_widths,
-                        getattr(layer, 'input_scale', None)))
+                weight, weight_scale, input_scale = process_fp8_weight_tensor_strategy(
+                    weight,
+                    weight_scale,
+                    layer.logical_widths,
+                    getattr(layer, "input_scale", None),
+                )
                 if self.act_q_static:
                     assert input_scale is not None
                     input_scale = input_scale.max()
@@ -442,9 +511,11 @@ def process_weights_after_loading(self, layer: Module) -> None:
         # Update layer with new values.
         layer.weight = Parameter(weight.data, requires_grad=False)
         layer.weight_scale = Parameter(weight_scale.data, requires_grad=False)
-        layer.input_scale = Parameter(
-            input_scale,
-            requires_grad=False) if input_scale is not None else None
+        layer.input_scale = (
+            Parameter(input_scale, requires_grad=False)
+            if input_scale is not None
+            else None
+        )
 
         if self.use_marlin:
             prepare_fp8_layer_for_marlin(layer, size_k_first)
@@ -453,14 +524,14 @@ def process_weights_after_loading(self, layer: Module) -> None:
             return
 
         if self.block_quant:
-            maybe_post_process_fp8_weight_block(
-                layer, self.cutlass_block_fp8_supported)
-
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+            maybe_post_process_fp8_weight_block(layer, self.cutlass_block_fp8_supported)
 
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         if self.use_marlin:
             return apply_fp8_marlin_linear(
                 input=x,
@@ -469,7 +540,8 @@ def apply(self,
                 workspace=layer.workspace,
                 size_n=layer.output_size_per_partition,
                 size_k=layer.input_size_per_partition,
-                bias=bias)
+                bias=bias,
+            )
 
         if self.block_quant:
             assert self.weight_block_size is not None
@@ -482,12 +554,14 @@ def apply(self,
                 bias=bias,
             )
 
-        return self.fp8_linear.apply(input=x,
-                                     weight=layer.weight,
-                                     weight_scale=layer.weight_scale,
-                                     out_dtype=self.out_dtype,
-                                     input_scale=layer.input_scale,
-                                     bias=bias)
+        return self.fp8_linear.apply(
+            input=x,
+            weight=layer.weight,
+            weight_scale=layer.weight_scale,
+            out_dtype=self.out_dtype,
+            input_scale=layer.input_scale,
+            bias=bias,
+        )
 
 
 class Fp8MoEMethod(FusedMoEMethodBase):
@@ -510,27 +584,31 @@ def __init__(self, quant_config: Fp8Config, layer: torch.nn.Module):
         self.weight_block_size = self.quant_config.weight_block_size
         self.block_quant: bool = self.weight_block_size is not None
 
-        self.fused_experts: Optional[
-            mk.FusedMoEModularKernel] = None  # type: ignore
+        self.fused_experts: Optional[mk.FusedMoEModularKernel] = None  # type: ignore
 
         self.fp8_backend = get_fp8_moe_backend(self.block_quant)
 
-        self.use_marlin = (self.fp8_backend == Fp8MoeBackend.MARLIN)
+        self.use_marlin = self.fp8_backend == Fp8MoeBackend.MARLIN
         self.flashinfer_moe_backend: Optional[FlashinferMoeBackend] = None
         if self.fp8_backend == Fp8MoeBackend.FLASHINFER_TRTLLM:
             self.flashinfer_moe_backend = FlashinferMoeBackend.TENSORRT_LLM
         elif self.fp8_backend == Fp8MoeBackend.FLASHINFER_CUTLASS:
             self.flashinfer_moe_backend = FlashinferMoeBackend.CUTLASS
 
-        self.allow_deep_gemm = (self.fp8_backend == Fp8MoeBackend.DEEPGEMM)
+        self.allow_deep_gemm = self.fp8_backend == Fp8MoeBackend.DEEPGEMM
         self.allow_cutlass_block_scaled_grouped_gemm = (
             self.fp8_backend == Fp8MoeBackend.CUTLASS_BLOCK_SCALED_GROUPED_GEMM
         )
 
-    def create_weights(self, layer: Module, num_experts: int, hidden_size: int,
-                       intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
-
+    def create_weights(
+        self,
+        layer: Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         layer.intermediate_size_per_partition = intermediate_size_per_partition
         layer.hidden_size = hidden_size
         layer.num_experts = num_experts
@@ -555,31 +633,38 @@ def create_weights(self, layer: Module, num_experts: int, hidden_size: int,
                 raise ValueError(
                     f"The output_size of gate's and up's weight = "
                     f"{intermediate_size_per_partition} is not divisible by "
-                    f"weight quantization block_n = {block_n}.")
-            if (tp_size > 1
-                    and intermediate_size_per_partition % block_k != 0):
+                    f"weight quantization block_n = {block_n}."
+                )
+            if tp_size > 1 and intermediate_size_per_partition % block_k != 0:
                 # Required by row parallel
                 raise ValueError(
                     f"The input_size of down's weight = "
                     f"{intermediate_size_per_partition} is not divisible by "
-                    f"weight quantization block_k = {block_k}.")
+                    f"weight quantization block_k = {block_k}."
+                )
 
         # WEIGHTS
-        w13_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            2 * intermediate_size_per_partition,
-            hidden_size,
-            dtype=params_dtype),
-                                        requires_grad=False)
+        w13_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                2 * intermediate_size_per_partition,
+                hidden_size,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_weight", w13_weight)
         set_weight_attrs(w13_weight, extra_weight_attrs)
 
-        w2_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            hidden_size,
-            intermediate_size_per_partition,
-            dtype=params_dtype),
-                                       requires_grad=False)
+        w2_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                hidden_size,
+                intermediate_size_per_partition,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_weight", w2_weight)
         set_weight_attrs(w2_weight, extra_weight_attrs)
 
@@ -587,20 +672,19 @@ def create_weights(self, layer: Module, num_experts: int, hidden_size: int,
         if not self.block_quant:
             # Allocate 2 scales for w1 and w3 respectively.
             # They will be combined to a single scale after weight loading.
-            w13_weight_scale = torch.nn.Parameter(torch.ones(
-                num_experts, 2, dtype=torch.float32),
-                                                  requires_grad=False)
-            w2_weight_scale = torch.nn.Parameter(torch.ones(
-                num_experts, dtype=torch.float32),
-                                                 requires_grad=False)
+            w13_weight_scale = torch.nn.Parameter(
+                torch.ones(num_experts, 2, dtype=torch.float32), requires_grad=False
+            )
+            w2_weight_scale = torch.nn.Parameter(
+                torch.ones(num_experts, dtype=torch.float32), requires_grad=False
+            )
             layer.register_parameter("w13_weight_scale", w13_weight_scale)
             layer.register_parameter("w2_weight_scale", w2_weight_scale)
         else:
             w13_weight_scale = torch.nn.Parameter(
                 torch.ones(
                     num_experts,
-                    2 * ((intermediate_size_per_partition + block_n - 1) //
-                         block_n),
+                    2 * ((intermediate_size_per_partition + block_n - 1) // block_n),
                     (hidden_size + block_k - 1) // block_k,
                     dtype=torch.float32,
                 ),
@@ -622,9 +706,10 @@ def create_weights(self, layer: Module, num_experts: int, hidden_size: int,
         # Add the quantization method used (per tensor/grouped/channel)
         # to ensure the weight scales are loaded in properly
         extra_weight_attrs.update(
-            {"quant_method": FusedMoeWeightScaleSupported.BLOCK.
-             value} if self.block_quant else
-            {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value})
+            {"quant_method": FusedMoeWeightScaleSupported.BLOCK.value}
+            if self.block_quant
+            else {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value}
+        )
         # If loading fp8 checkpoint, pass the weight loaders.
         # If loading an fp16 checkpoint, do not (we will quantize in
         #   process_weights_after_loading()
@@ -637,17 +722,18 @@ def create_weights(self, layer: Module, num_experts: int, hidden_size: int,
             if not self.quant_config.is_checkpoint_fp8_serialized:
                 raise ValueError(
                     "Found static activation scheme for checkpoint that "
-                    "was not serialized fp8.")
+                    "was not serialized fp8."
+                )
 
-            w13_input_scale = torch.nn.Parameter(torch.ones(
-                num_experts, dtype=torch.float32),
-                                                 requires_grad=False)
+            w13_input_scale = torch.nn.Parameter(
+                torch.ones(num_experts, dtype=torch.float32), requires_grad=False
+            )
             layer.register_parameter("w13_input_scale", w13_input_scale)
             set_weight_attrs(w13_input_scale, extra_weight_attrs)
 
-            w2_input_scale = torch.nn.Parameter(torch.ones(
-                num_experts, dtype=torch.float32),
-                                                requires_grad=False)
+            w2_input_scale = torch.nn.Parameter(
+                torch.ones(num_experts, dtype=torch.float32), requires_grad=False
+            )
             layer.register_parameter("w2_input_scale", w2_input_scale)
             set_weight_attrs(w2_input_scale, extra_weight_attrs)
 
@@ -658,7 +744,9 @@ def create_weights(self, layer: Module, num_experts: int, hidden_size: int,
     def process_weights_after_loading(self, layer: Module) -> None:
         # Lazy import to avoid importing triton too early.
         from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-            is_rocm_aiter_moe_enabled, shuffle_weights)
+            is_rocm_aiter_moe_enabled,
+            shuffle_weights,
+        )
 
         self.rocm_aiter_moe_enabled = is_rocm_aiter_moe_enabled()
 
@@ -666,20 +754,23 @@ def process_weights_after_loading(self, layer: Module) -> None:
         if self.block_quant:
             assert self.quant_config.activation_scheme == "dynamic"
             if current_platform.is_fp8_fnuz():
-                w13_weight, w13_weight_scale_inv, w13_input_scale = \
+                w13_weight, w13_weight_scale_inv, w13_input_scale = (
                     normalize_e4m3fn_to_e4m3fnuz(
-                        layer.w13_weight, layer.w13_weight_scale_inv,
-                        layer.w13_input_scale)
-                w2_weight, w2_weight_scale_inv, w2_input_scale = \
+                        layer.w13_weight,
+                        layer.w13_weight_scale_inv,
+                        layer.w13_input_scale,
+                    )
+                )
+                w2_weight, w2_weight_scale_inv, w2_input_scale = (
                     normalize_e4m3fn_to_e4m3fnuz(
-                        layer.w2_weight, layer.w2_weight_scale_inv,
-                        layer.w2_input_scale)
+                        layer.w2_weight, layer.w2_weight_scale_inv, layer.w2_input_scale
+                    )
+                )
             elif self.flashinfer_moe_backend is not None:
                 # NOTE: weights have to be swapped since the activation is
                 # applied on different half for flashinfer vs vllm
                 w13_weight = swap_w13_to_w31(layer.w13_weight.data)
-                w13_weight_scale_inv = swap_w13_to_w31(
-                    layer.w13_weight_scale_inv.data)
+                w13_weight_scale_inv = swap_w13_to_w31(layer.w13_weight_scale_inv.data)
                 w2_weight = layer.w2_weight.data
                 w2_weight_scale_inv = layer.w2_weight_scale_inv.data
             else:
@@ -690,65 +781,67 @@ def process_weights_after_loading(self, layer: Module) -> None:
 
             # torch.compile() cannot use Parameter subclasses.
             layer.w13_weight = Parameter(w13_weight, requires_grad=False)
-            layer.w13_weight_scale_inv = Parameter(w13_weight_scale_inv,
-                                                   requires_grad=False)
+            layer.w13_weight_scale_inv = Parameter(
+                w13_weight_scale_inv, requires_grad=False
+            )
             layer.w2_weight = Parameter(w2_weight, requires_grad=False)
-            layer.w2_weight_scale_inv = Parameter(w2_weight_scale_inv,
-                                                  requires_grad=False)
+            layer.w2_weight_scale_inv = Parameter(
+                w2_weight_scale_inv, requires_grad=False
+            )
             if self.rocm_aiter_moe_enabled:
                 # reshaping weights is required for aiter moe kernel.
                 shuffled_w13, shuffled_w2 = shuffle_weights(
-                    layer.w13_weight.data, layer.w2_weight.data)
+                    layer.w13_weight.data, layer.w2_weight.data
+                )
 
-                layer.w13_weight = torch.nn.Parameter(shuffled_w13,
-                                                      requires_grad=False)
-                layer.w2_weight = torch.nn.Parameter(shuffled_w2,
-                                                     requires_grad=False)
+                layer.w13_weight = torch.nn.Parameter(shuffled_w13, requires_grad=False)
+                layer.w2_weight = torch.nn.Parameter(shuffled_w2, requires_grad=False)
 
             # DeepGemm scales need to be transposed and aligned. We try to do
             # it ahead of time for performance reasons.
             if self.allow_deep_gemm and not is_deep_gemm_e8m0_used():
                 if expert_weight_is_col_major(layer.w13_weight_scale_inv):
-                    layer.w13_weight_scale_inv = \
-                        get_col_major_tma_aligned_tensor(layer.w13_weight_scale_inv)
+                    layer.w13_weight_scale_inv = get_col_major_tma_aligned_tensor(
+                        layer.w13_weight_scale_inv
+                    )
                 if expert_weight_is_col_major(layer.w2_weight_scale_inv):
-                    layer.w2_weight_scale_inv = \
-                        get_col_major_tma_aligned_tensor(layer.w2_weight_scale_inv)
+                    layer.w2_weight_scale_inv = get_col_major_tma_aligned_tensor(
+                        layer.w2_weight_scale_inv
+                    )
 
         # If checkpoint is fp16, quantize in place.
         elif not self.quant_config.is_checkpoint_fp8_serialized:
             fp8_dtype = current_platform.fp8_dtype()
-            w13_weight = torch.empty_like(layer.w13_weight.data,
-                                          dtype=fp8_dtype)
+            w13_weight = torch.empty_like(layer.w13_weight.data, dtype=fp8_dtype)
             w2_weight = torch.empty_like(layer.w2_weight.data, dtype=fp8_dtype)
 
             # Re-initialize w13_scale because we directly quantize
             # merged w13 weights and generate a single scaling factor.
-            layer.w13_weight_scale = torch.nn.Parameter(torch.ones(
-                layer.local_num_experts,
-                dtype=torch.float32,
-                device=w13_weight.device),
-                                                        requires_grad=False)
+            layer.w13_weight_scale = torch.nn.Parameter(
+                torch.ones(
+                    layer.local_num_experts,
+                    dtype=torch.float32,
+                    device=w13_weight.device,
+                ),
+                requires_grad=False,
+            )
             for expert in range(layer.local_num_experts):
-                w13_weight[expert, :, :], layer.w13_weight_scale[
-                    expert] = ops.scaled_fp8_quant(
-                        layer.w13_weight.data[expert, :, :])
-                w2_weight[expert, :, :], layer.w2_weight_scale[
-                    expert] = ops.scaled_fp8_quant(
-                        layer.w2_weight.data[expert, :, :])
-            layer.w13_weight = torch.nn.Parameter(w13_weight,
-                                                  requires_grad=False)
-            layer.w2_weight = torch.nn.Parameter(w2_weight,
-                                                 requires_grad=False)
+                w13_weight[expert, :, :], layer.w13_weight_scale[expert] = (
+                    ops.scaled_fp8_quant(layer.w13_weight.data[expert, :, :])
+                )
+                w2_weight[expert, :, :], layer.w2_weight_scale[expert] = (
+                    ops.scaled_fp8_quant(layer.w2_weight.data[expert, :, :])
+                )
+            layer.w13_weight = torch.nn.Parameter(w13_weight, requires_grad=False)
+            layer.w2_weight = torch.nn.Parameter(w2_weight, requires_grad=False)
             if self.rocm_aiter_moe_enabled:
                 # reshaping weights is required for aiter moe kernel.
                 shuffled_w13, shuffled_w2 = shuffle_weights(
-                    layer.w13_weight, layer.w2_weight)
+                    layer.w13_weight, layer.w2_weight
+                )
 
-                layer.w13_weight = torch.nn.Parameter(shuffled_w13,
-                                                      requires_grad=False)
-                layer.w2_weight = torch.nn.Parameter(shuffled_w2,
-                                                     requires_grad=False)
+                layer.w13_weight = torch.nn.Parameter(shuffled_w13, requires_grad=False)
+                layer.w2_weight = torch.nn.Parameter(shuffled_w2, requires_grad=False)
         # If checkpoint is fp8, we need to handle that the
         # MoE kernels require single activation scale and single weight
         # scale for w13 per expert.
@@ -756,46 +849,54 @@ def process_weights_after_loading(self, layer: Module) -> None:
             # Fp8 moe kernels require a single activation scale.
             # We take the max of all the scales in case they differ.
             if self.quant_config.activation_scheme == "static":
-                if (layer.w13_input_scale is None
-                        or layer.w2_input_scale is None):
+                if layer.w13_input_scale is None or layer.w2_input_scale is None:
                     raise ValueError(
                         "QuantConfig has static quantization, but found "
-                        "activation scales are None.")
-                if (not all_close_1d(layer.w13_input_scale)
-                        or not all_close_1d(layer.w2_input_scale)):
+                        "activation scales are None."
+                    )
+                if not all_close_1d(layer.w13_input_scale) or not all_close_1d(
+                    layer.w2_input_scale
+                ):
                     logger.warning_once(
                         "Found input_scales that are not equal for "
                         "fp8 MoE layer. Using the maximum across experts "
-                        "for each layer.")
+                        "for each layer."
+                    )
                 layer.w13_input_scale = torch.nn.Parameter(
-                    layer.w13_input_scale.max(), requires_grad=False)
+                    layer.w13_input_scale.max(), requires_grad=False
+                )
                 layer.w2_input_scale = torch.nn.Parameter(
-                    layer.w2_input_scale.max(), requires_grad=False)
+                    layer.w2_input_scale.max(), requires_grad=False
+                )
             if current_platform.is_fp8_fnuz():
                 # Normalize the weights and scales
-                w13_weight, w13_weight_scale, w13_input_scale = \
+                w13_weight, w13_weight_scale, w13_input_scale = (
                     normalize_e4m3fn_to_e4m3fnuz(
-                        layer.w13_weight, layer.w13_weight_scale,
-                        layer.w13_input_scale)
-                w2_weight, w2_weight_scale, w2_input_scale = \
+                        layer.w13_weight, layer.w13_weight_scale, layer.w13_input_scale
+                    )
+                )
+                w2_weight, w2_weight_scale, w2_input_scale = (
                     normalize_e4m3fn_to_e4m3fnuz(
-                        layer.w2_weight, layer.w2_weight_scale,
-                        layer.w2_input_scale)
+                        layer.w2_weight, layer.w2_weight_scale, layer.w2_input_scale
+                    )
+                )
                 # Reset the parameter
-                layer.w13_weight = torch.nn.Parameter(w13_weight,
-                                                      requires_grad=False)
+                layer.w13_weight = torch.nn.Parameter(w13_weight, requires_grad=False)
                 layer.w13_weight_scale = torch.nn.Parameter(
-                    w13_weight_scale, requires_grad=False)
+                    w13_weight_scale, requires_grad=False
+                )
                 if w13_input_scale is not None:
                     layer.w13_input_scale = torch.nn.Parameter(
-                        w13_input_scale, requires_grad=False)
-                layer.w2_weight = torch.nn.Parameter(w2_weight,
-                                                     requires_grad=False)
-                layer.w2_weight_scale = torch.nn.Parameter(w2_weight_scale,
-                                                           requires_grad=False)
+                        w13_input_scale, requires_grad=False
+                    )
+                layer.w2_weight = torch.nn.Parameter(w2_weight, requires_grad=False)
+                layer.w2_weight_scale = torch.nn.Parameter(
+                    w2_weight_scale, requires_grad=False
+                )
                 if w2_input_scale is not None:
                     layer.w2_input_scale = torch.nn.Parameter(
-                        w2_input_scale, requires_grad=False)
+                        w2_input_scale, requires_grad=False
+                    )
 
             # Fp8 moe kernel needs single weight scale for w13 per expert.
             # We take the max then dequant and requant each expert.
@@ -806,25 +907,25 @@ def process_weights_after_loading(self, layer: Module) -> None:
                 start = 0
                 for shard_id in range(2):
                     dq_weight = per_tensor_dequantize(
-                        layer.w13_weight[expert_id][start:start +
-                                                    shard_size, :],
-                        layer.w13_weight_scale[expert_id][shard_id])
-                    layer.w13_weight[expert_id][
-                        start:start + shard_size, :], _ = ops.scaled_fp8_quant(
-                            dq_weight, max_w13_scales[expert_id])
+                        layer.w13_weight[expert_id][start : start + shard_size, :],
+                        layer.w13_weight_scale[expert_id][shard_id],
+                    )
+                    layer.w13_weight[expert_id][start : start + shard_size, :], _ = (
+                        ops.scaled_fp8_quant(dq_weight, max_w13_scales[expert_id])
+                    )
                     start += shard_size
 
             if self.rocm_aiter_moe_enabled:
                 shuffled_w13, shuffled_w2 = shuffle_weights(
-                    layer.w13_weight, layer.w2_weight)
+                    layer.w13_weight, layer.w2_weight
+                )
 
-                layer.w13_weight = torch.nn.Parameter(shuffled_w13,
-                                                      requires_grad=False)
-                layer.w2_weight = torch.nn.Parameter(shuffled_w2,
-                                                     requires_grad=False)
+                layer.w13_weight = torch.nn.Parameter(shuffled_w13, requires_grad=False)
+                layer.w2_weight = torch.nn.Parameter(shuffled_w2, requires_grad=False)
 
-            layer.w13_weight_scale = torch.nn.Parameter(max_w13_scales,
-                                                        requires_grad=False)
+            layer.w13_weight_scale = torch.nn.Parameter(
+                max_w13_scales, requires_grad=False
+            )
 
             if self.flashinfer_moe_backend is not None:
                 # NOTE: weights have to be swapped since the activation is
@@ -832,8 +933,7 @@ def process_weights_after_loading(self, layer: Module) -> None:
                 assert not self.block_quant
                 register_moe_scaling_factors(layer)
                 w13_weight = swap_w13_to_w31(layer.w13_weight.data)
-                if self.flashinfer_moe_backend == \
-                    FlashinferMoeBackend.TENSORRT_LLM:
+                if self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM:
                     rotate_flashinfer_fp8_moe_weights(w13_weight, w2_weight)
                 layer.w13_weight.data = w13_weight.data
 
@@ -861,20 +961,24 @@ def process_weights_after_loading(self, layer: Module) -> None:
             # Ensure column-major TMA alignment expected by DeepGEMM.
             if expert_weight_is_col_major(layer.w13_weight_scale_inv):
                 layer.w13_weight_scale_inv = get_col_major_tma_aligned_tensor(
-                    layer.w13_weight_scale_inv)
+                    layer.w13_weight_scale_inv
+                )
             if expert_weight_is_col_major(layer.w2_weight_scale_inv):
                 layer.w2_weight_scale_inv = get_col_major_tma_aligned_tensor(
-                    layer.w2_weight_scale_inv)
+                    layer.w2_weight_scale_inv
+                )
 
-    def maybe_make_prepare_finalize(
-            self) -> Optional[mk.FusedMoEPrepareAndFinalize]:
-        if (self.rocm_aiter_moe_enabled or self.use_marlin
-                or self.flashinfer_moe_backend
-                == FlashinferMoeBackend.TENSORRT_LLM):
+    def maybe_make_prepare_finalize(self) -> Optional[mk.FusedMoEPrepareAndFinalize]:
+        if (
+            self.rocm_aiter_moe_enabled
+            or self.use_marlin
+            or self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM
+        ):
             return None
         elif self.flashinfer_moe_backend == FlashinferMoeBackend.CUTLASS:
-            prepare_finalize = (
-                build_flashinfer_fp8_cutlass_moe_prepare_finalize(self.moe))
+            prepare_finalize = build_flashinfer_fp8_cutlass_moe_prepare_finalize(
+                self.moe
+            )
             logger.debug_once("%s", prepare_finalize.__class__.__name__)
             return prepare_finalize
         else:
@@ -886,23 +990,30 @@ def select_gemm_impl(
         layer: torch.nn.Module,
     ) -> FusedMoEPermuteExpertsUnpermute:
         from vllm.model_executor.layers.fused_moe import (
-            BatchedTritonOrDeepGemmExperts, TritonOrDeepGemmExperts)
+            BatchedTritonOrDeepGemmExperts,
+            TritonOrDeepGemmExperts,
+        )
 
         assert not self.use_marlin and not self.rocm_aiter_moe_enabled, (
-            "Marlin and ROCm AITER are not supported with all2all yet.")
+            "Marlin and ROCm AITER are not supported with all2all yet."
+        )
 
         assert self.moe_quant_config is not None
 
-        if (prepare_finalize.activation_format ==
-                FusedMoEActivationFormat.BatchedExperts):
-            max_num_tokens_per_rank = (
-                prepare_finalize.max_num_tokens_per_rank())
+        if (
+            prepare_finalize.activation_format
+            == FusedMoEActivationFormat.BatchedExperts
+        ):
+            max_num_tokens_per_rank = prepare_finalize.max_num_tokens_per_rank()
             assert max_num_tokens_per_rank is not None
             logger.debug(
                 "BatchedTritonOrDeepGemmExperts(%s): "
                 "max_tokens_per_rank=%s, block_size=%s, per_act_token=%s",
-                self.__class__.__name__, max_num_tokens_per_rank,
-                self.weight_block_size, False)
+                self.__class__.__name__,
+                max_num_tokens_per_rank,
+                self.weight_block_size,
+                False,
+            )
             return BatchedTritonOrDeepGemmExperts(
                 max_num_tokens=max_num_tokens_per_rank,
                 num_dispatchers=prepare_finalize.num_dispatchers(),
@@ -919,22 +1030,30 @@ def select_gemm_impl(
         else:
             logger.debug(
                 "TritonOrDeepGemmExperts(%s): block_size=%s, per_act_token=%s",
-                self.__class__.__name__, self.weight_block_size, False)
+                self.__class__.__name__,
+                self.weight_block_size,
+                False,
+            )
             return TritonOrDeepGemmExperts(
                 quant_config=self.moe_quant_config,
                 allow_deep_gemm=self.allow_deep_gemm,
             )
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         if self.use_marlin:
             return None
 
         return fp8_w8a8_moe_quant_config(
-            w1_scale=(layer.w13_weight_scale_inv
-                      if self.block_quant else layer.w13_weight_scale),
-            w2_scale=(layer.w2_weight_scale_inv
-                      if self.block_quant else layer.w2_weight_scale),
+            w1_scale=(
+                layer.w13_weight_scale_inv
+                if self.block_quant
+                else layer.w13_weight_scale
+            ),
+            w2_scale=(
+                layer.w2_weight_scale_inv if self.block_quant else layer.w2_weight_scale
+            ),
             a1_scale=layer.w13_input_scale,
             a2_scale=layer.w2_input_scale,
             block_shape=self.weight_block_size,
@@ -963,25 +1082,33 @@ def apply(
         logical_to_physical_map: Optional[torch.Tensor] = None,
         logical_replica_count: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, tuple[torch.Tensor, torch.Tensor]]:
-
         if enable_eplb:
             assert expert_load_view is not None
             assert logical_to_physical_map is not None
             assert logical_replica_count is not None
             assert isinstance(layer, FusedMoE)
 
-        if (self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM
-                and self.fused_experts is None):
-            assert activation == 'silu', (
-                f"Expected 'silu' activation but got {activation}")
-            assert scoring_func == 'sigmoid', (
-                f"Expected 'sigmoid' scoring func but got {scoring_func}")
+        if (
+            self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM
+            and self.fused_experts is None
+        ):
+            assert activation == "silu", (
+                f"Expected 'silu' activation but got {activation}"
+            )
+            assert scoring_func == "sigmoid", (
+                f"Expected 'sigmoid' scoring func but got {scoring_func}"
+            )
             if self.block_quant:
                 import vllm.model_executor.layers.fused_moe.flashinfer_trtllm_moe  # noqa: E501, F401
-                assert (renormalize and use_grouped_topk
-                        and custom_routing_function is None)
-                e_score_correction_bias = (e_score_correction_bias.to(
-                    x.dtype) if e_score_correction_bias is not None else None)
+
+                assert (
+                    renormalize and use_grouped_topk and custom_routing_function is None
+                )
+                e_score_correction_bias = (
+                    e_score_correction_bias.to(x.dtype)
+                    if e_score_correction_bias is not None
+                    else None
+                )
                 return torch.ops.vllm.flashinfer_fused_moe_blockscale_fp8(
                     routing_logits=router_logits.to(torch.float32),
                     routing_bias=e_score_correction_bias,
@@ -1001,8 +1128,7 @@ def apply(
                     routed_scaling=routed_scaling_factor,
                 )
             else:
-                assert (not renormalize
-                        and custom_routing_function is not None)
+                assert not renormalize and custom_routing_function is not None
                 result = apply_flashinfer_per_tensor_scale_fp8(
                     layer=layer,
                     hidden_states=x,
@@ -1012,10 +1138,11 @@ def apply(
                     top_k=top_k,
                     num_expert_group=num_expert_group,
                     topk_group=topk_group,
-                    apply_router_weight_on_input=apply_router_weight_on_input)
+                    apply_router_weight_on_input=apply_router_weight_on_input,
+                )
 
-        zero_expert_num = getattr(layer, 'zero_expert_num', 0)
-        zero_expert_type = getattr(layer, 'zero_expert_type', None)
+        zero_expert_num = getattr(layer, "zero_expert_num", 0)
+        zero_expert_type = getattr(layer, "zero_expert_type", None)
 
         select_result = FusedMoE.select_experts(
             hidden_states=x,
@@ -1048,7 +1175,9 @@ def apply(
 
         if self.rocm_aiter_moe_enabled:
             from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (  # noqa: E501
-                rocm_aiter_fused_experts)
+                rocm_aiter_fused_experts,
+            )
+
             assert self.fused_experts is None
             result = rocm_aiter_fused_experts(
                 x,
@@ -1059,10 +1188,10 @@ def apply(
                 activation=activation,
                 apply_router_weight_on_input=apply_router_weight_on_input,
                 expert_map=expert_map,
-                quant_config=self.moe_quant_config)
+                quant_config=self.moe_quant_config,
+            )
         elif self.use_marlin:
-            assert activation == "silu", (
-                f"{activation} not supported for Marlin MoE.")
+            assert activation == "silu", f"{activation} not supported for Marlin MoE."
             assert self.fused_experts is None
             result = torch.ops.vllm.fused_marlin_moe(
                 x,
@@ -1079,7 +1208,8 @@ def apply(
                 apply_router_weight_on_input=apply_router_weight_on_input,
                 global_num_experts=global_num_experts,
                 expert_map=expert_map,
-                workspace=layer.workspace)
+                workspace=layer.workspace,
+            )
         elif self.fused_experts:
             result = self.fused_experts(
                 hidden_states=x,
@@ -1095,11 +1225,13 @@ def apply(
             )
         elif self.flashinfer_moe_backend == FlashinferMoeBackend.CUTLASS:
             assert not self.block_quant
-            assert (not renormalize and custom_routing_function is not None)
-            assert activation == 'silu', (
-                f"Expected 'silu' activation but got {activation}")
-            assert scoring_func == 'sigmoid', (
-                f"Expected 'sigmoid' scoring func but got {scoring_func}")
+            assert not renormalize and custom_routing_function is not None
+            assert activation == "silu", (
+                f"Expected 'silu' activation but got {activation}"
+            )
+            assert scoring_func == "sigmoid", (
+                f"Expected 'sigmoid' scoring func but got {scoring_func}"
+            )
 
             result = flashinfer_cutlass_moe_fp8(
                 x,
@@ -1114,6 +1246,7 @@ def apply(
             )
         else:
             from vllm.model_executor.layers.fused_moe import fused_experts
+
             result = fused_experts(
                 hidden_states=x,
                 w1=layer.w13_weight,
@@ -1128,10 +1261,13 @@ def apply(
                 quant_config=self.moe_quant_config,
                 allow_deep_gemm=self.allow_deep_gemm,
                 allow_cutlass_block_scaled_grouped_gemm=(
-                    self.allow_cutlass_block_scaled_grouped_gemm))
+                    self.allow_cutlass_block_scaled_grouped_gemm
+                ),
+            )
         if zero_expert_num != 0 and zero_expert_type is not None:
-            assert not isinstance(result, tuple), \
+            assert not isinstance(result, tuple), (
                 "Shared + zero experts are mutually exclusive not yet supported"
+            )
             return result, zero_expert_result
         else:
             return result
diff --git a/vllm/model_executor/layers/quantization/gguf.py b/vllm/model_executor/layers/quantization/gguf.py
index da1688808bb5..8296bc2ea3b4 100644
--- a/vllm/model_executor/layers/quantization/gguf.py
+++ b/vllm/model_executor/layers/quantization/gguf.py
@@ -10,17 +10,22 @@
 
 from vllm import _custom_ops as ops
 from vllm.logger import init_logger
-from vllm.model_executor.layers.fused_moe.config import (FusedMoEConfig,
-                                                         FusedMoEQuantConfig)
-from vllm.model_executor.layers.fused_moe.layer import (FusedMoE,
-                                                        FusedMoEMethodBase)
-from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
-                                               UnquantizedLinearMethod)
+from vllm.model_executor.layers.fused_moe.config import (
+    FusedMoEConfig,
+    FusedMoEQuantConfig,
+)
+from vllm.model_executor.layers.fused_moe.layer import FusedMoE, FusedMoEMethodBase
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    LinearMethodBase,
+    UnquantizedLinearMethod,
+)
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.utils import direct_register_custom_op
 
@@ -30,13 +35,12 @@
 class GGUFConfig(QuantizationConfig):
     """Config class for GGUF."""
 
-    def __init__(self,
-                 unquantized_modules: Optional[list[str]] = None) -> None:
+    def __init__(self, unquantized_modules: Optional[list[str]] = None) -> None:
         super().__init__()
         self.unquantized_modules = unquantized_modules or []
 
     def __repr__(self) -> str:
-        return ("GGUFConfig()")
+        return "GGUFConfig()"
 
     def get_name(self) -> QuantizationMethods:
         return "gguf"
@@ -56,8 +60,9 @@ def get_config_filenames(cls) -> list[str]:
     def from_config(cls, config: dict[str, Any]) -> "GGUFConfig":
         return cls()
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         if isinstance(layer, LinearBase):
             if is_layer_skipped_gguf(prefix, self.unquantized_modules):
                 return UnquantizedLinearMethod()
@@ -108,8 +113,9 @@ def is_layer_skipped_gguf(prefix: str, unquantized_modules: list[str]):
 MMQ_QUANT_TYPES = STANDARD_QUANT_TYPES | KQUANT_TYPES
 
 
-def _fused_mul_mat_gguf(x: torch.Tensor, qweight: torch.Tensor,
-                        qweight_type: int) -> torch.Tensor:
+def _fused_mul_mat_gguf(
+    x: torch.Tensor, qweight: torch.Tensor, qweight_type: int
+) -> torch.Tensor:
     if qweight_type in IMATRIX_QUANT_TYPES:
         mmvq_safe = 8 if qweight.shape[0] > 5120 else 16
     else:
@@ -117,10 +123,7 @@ def _fused_mul_mat_gguf(x: torch.Tensor, qweight: torch.Tensor,
     # HACK: when doing chunked prefill we don't generate output tokens
     # so input to logits generator is empty which causes invalid parameter
     if x.shape[0] == 0:
-        return torch.empty(x.shape[0],
-                           qweight.shape[0],
-                           dtype=x.dtype,
-                           device=x.device)
+        return torch.empty(x.shape[0], qweight.shape[0], dtype=x.dtype, device=x.device)
     # there is no need to call any kernel for fp16/bf16
     if qweight_type in UNQUANTIZED_TYPES:
         return x @ qweight.T
@@ -141,8 +144,7 @@ def _fused_mul_mat_gguf(x: torch.Tensor, qweight: torch.Tensor,
         # Might be useful if llama.cpp adds a new quantization type.
         # Wrap to GGMLQuantizationType IntEnum to make sure it's a valid type.
         qweight_type = WeightType(qweight_type)
-        raise NotImplementedError(
-            f"Unsupported GGUF quantization type: {qweight_type}")
+        raise NotImplementedError(f"Unsupported GGUF quantization type: {qweight_type}")
     return y
 
 
@@ -151,10 +153,7 @@ def _fused_mul_mat_gguf_fake(
     qweight: torch.Tensor,
     qweight_type: int,
 ) -> torch.Tensor:
-    return torch.empty(x.shape[0],
-                       qweight.shape[0],
-                       dtype=x.dtype,
-                       device=x.device)
+    return torch.empty(x.shape[0], qweight.shape[0], dtype=x.dtype, device=x.device)
 
 
 try:
@@ -179,10 +178,9 @@ def _fused_moe_gguf(
     qweight_type2: int,
     activation: str,
 ) -> torch.Tensor:
-
     def act(x: torch.Tensor):
         d = x.shape[-1] // 2
-        output_shape = (x.shape[:-1] + (d, ))
+        output_shape = x.shape[:-1] + (d,)
         out = torch.empty(output_shape, dtype=x.dtype, device=x.device)
         if activation == "silu":
             torch.ops._C.silu_and_mul(out, x)
@@ -193,50 +191,73 @@ def act(x: torch.Tensor):
         return out
 
     # lazy import to avoid triggering triton import in CPU backend
-    from vllm.model_executor.layers.fused_moe.fused_moe import (
-        moe_align_block_size)
+    from vllm.model_executor.layers.fused_moe.fused_moe import moe_align_block_size
 
     out_hidden_states = torch.empty_like(x)
     # unless we decent expert reuse we are better off running moe_vec kernel
-    if (qweight_type2 in MMQ_QUANT_TYPES and qweight_type in MMQ_QUANT_TYPES
-            and x.shape[0] > 64):
+    if (
+        qweight_type2 in MMQ_QUANT_TYPES
+        and qweight_type in MMQ_QUANT_TYPES
+        and x.shape[0] > 64
+    ):
         num_tokens, _ = x.shape
         E, N, _ = w1.shape
         top_k = topk_ids.shape[1]
         BLOCK_SIZE = ops.ggml_moe_get_block_size(qweight_type)
 
-        sorted_token_ids, expert_ids, num_tokens_post_padded = \
-                moe_align_block_size(topk_ids, BLOCK_SIZE, E)
-        out = ops.ggml_moe_a8(x, w1, sorted_token_ids, expert_ids,
-                              num_tokens_post_padded, qweight_type, N, top_k,
-                              num_tokens)
+        sorted_token_ids, expert_ids, num_tokens_post_padded = moe_align_block_size(
+            topk_ids, BLOCK_SIZE, E
+        )
+        out = ops.ggml_moe_a8(
+            x,
+            w1,
+            sorted_token_ids,
+            expert_ids,
+            num_tokens_post_padded,
+            qweight_type,
+            N,
+            top_k,
+            num_tokens,
+        )
         out = act(out)
-        out = ops.ggml_moe_a8(out, w2, sorted_token_ids, expert_ids,
-                              num_tokens_post_padded, qweight_type2,
-                              w2.shape[1], 1, num_tokens * top_k)
+        out = ops.ggml_moe_a8(
+            out,
+            w2,
+            sorted_token_ids,
+            expert_ids,
+            num_tokens_post_padded,
+            qweight_type2,
+            w2.shape[1],
+            1,
+            num_tokens * top_k,
+        )
         out = out.reshape(num_tokens, top_k, w2.shape[1]).mul_(
-            topk_weights.view(num_tokens, top_k, 1))
+            topk_weights.view(num_tokens, top_k, 1)
+        )
         ops.moe_sum(out, out_hidden_states)
     elif qweight_type2 in MMVQ_QUANT_TYPES and qweight_type in MMVQ_QUANT_TYPES:
         num_tokens, _ = x.shape
         E, N, _ = w1.shape
         top_k = topk_ids.shape[1]
 
-        out = ops.ggml_moe_a8_vec(x, w1, topk_ids, top_k, qweight_type, N,
-                                  num_tokens)
+        out = ops.ggml_moe_a8_vec(x, w1, topk_ids, top_k, qweight_type, N, num_tokens)
         out = act(out)
 
-        out = ops.ggml_moe_a8_vec(out, w2, topk_ids, 1, qweight_type2,
-                                  w2.shape[1], num_tokens * top_k)
+        out = ops.ggml_moe_a8_vec(
+            out, w2, topk_ids, 1, qweight_type2, w2.shape[1], num_tokens * top_k
+        )
         out = out.reshape(num_tokens, top_k, w2.shape[1]).mul_(
-            topk_weights.view(num_tokens, top_k, 1))
+            topk_weights.view(num_tokens, top_k, 1)
+        )
         ops.moe_sum(out, out_hidden_states)
     else:
-        logger.warning_once("There is no support for fast MoE kernel "
-                            "for current quantization method. "
-                            "Falling back to slow implementation. ")
+        logger.warning_once(
+            "There is no support for fast MoE kernel "
+            "for current quantization method. "
+            "Falling back to slow implementation. "
+        )
         for tok, (w, idx) in enumerate(zip(topk_weights, topk_ids)):
-            inp = x[tok].reshape((1, ) + x.shape[1:])
+            inp = x[tok].reshape((1,) + x.shape[1:])
             current_hidden_state = None
             for ww, ii in zip(w, idx):
                 expert_up = w1[ii]
@@ -245,8 +266,9 @@ def act(x: torch.Tensor):
                 out = act(out)
 
                 expert_down = w2[ii]
-                current_state = fused_mul_mat_gguf(out, expert_down,
-                                                   qweight_type2).mul_(ww)
+                current_state = fused_mul_mat_gguf(
+                    out, expert_down, qweight_type2
+                ).mul_(ww)
                 if current_hidden_state is None:
                     current_hidden_state = current_state
                 else:
@@ -292,15 +314,15 @@ def _apply_gguf_embedding(
     elif qweight_type in DEQUANT_TYPES:
         block_size, type_size = gguf.GGML_QUANT_SIZES[qweight_type]
         x_flat = x.flatten()
-        assert (hidden_size == qweight.shape[1] // type_size * block_size)
+        assert hidden_size == qweight.shape[1] // type_size * block_size
         quant = torch.index_select(qweight, dim=0, index=x_flat)
-        dequant = ops.ggml_dequantize(quant, qweight_type, hidden_size,
-                                      x_flat.shape[0], dtype)
+        dequant = ops.ggml_dequantize(
+            quant, qweight_type, hidden_size, x_flat.shape[0], dtype
+        )
         return dequant.view(*x.shape, hidden_size)
     else:
         qweight_type = WeightType(qweight_type)
-        raise NotImplementedError(
-            f"Unsupported GGUF quantization type: {qweight_type}")
+        raise NotImplementedError(f"Unsupported GGUF quantization type: {qweight_type}")
 
 
 def _apply_gguf_embedding_fake(
@@ -335,18 +357,24 @@ class GGUFLinearMethod(LinearMethodBase):
     def __init__(self, quant_config: GGUFConfig):
         self.quant_config = quant_config
 
-    def create_weights(self, layer: torch.nn.Module,
-                       input_size_per_partition: int,
-                       output_partition_sizes: list[int], input_size: int,
-                       output_size: int, params_dtype: torch.dtype,
-                       **extra_weight_attrs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        input_size_per_partition: int,
+        output_partition_sizes: list[int],
+        input_size: int,
+        output_size: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         self.params_dtype = params_dtype
         output_size_per_partition = sum(output_partition_sizes)
 
         tensor_shape = (output_size_per_partition, input_size_per_partition)
         qweight = GGUFUninitializedParameter(requires_grad=False)
         set_weight_attrs(
-            qweight, {
+            qweight,
+            {
                 "input_dim": 1,
                 "output_dim": 0,
                 "tensor_shape": tensor_shape,
@@ -354,31 +382,34 @@ def create_weights(self, layer: torch.nn.Module,
                 "data_container": [],
                 "shard_id": [],
                 "shard_id_map": {},
-            })
+            },
+        )
         set_weight_attrs(qweight, extra_weight_attrs)
         layer.register_parameter("qweight", qweight)
 
-        qweight_type = Parameter(torch.empty(len(output_partition_sizes),
-                                             dtype=torch.uint8),
-                                 requires_grad=False)
+        qweight_type = Parameter(
+            torch.empty(len(output_partition_sizes), dtype=torch.uint8),
+            requires_grad=False,
+        )
         set_weight_attrs(
-            qweight_type, {
+            qweight_type,
+            {
                 "is_gguf_weight_type": True,
                 "weight_type": 0,
                 "shard_weight_type": {},
-                "ignore_warning": True
-            })
+                "ignore_warning": True,
+            },
+        )
         set_weight_attrs(qweight_type, extra_weight_attrs)
         layer.register_parameter("qweight_type", qweight_type)
 
     def process_weights_after_loading(self, layer: torch.nn.Module):
         qweight_type = layer.qweight_type.weight_type
-        if not (qweight_type in UNQUANTIZED_TYPES
-                or qweight_type in DEQUANT_TYPES):
+        if not (qweight_type in UNQUANTIZED_TYPES or qweight_type in DEQUANT_TYPES):
             qweight_type = WeightType(qweight_type)
             raise ValueError(
-                f"Unsupported GGUF quantization type {qweight_type} in "
-                f"layer {layer}.")
+                f"Unsupported GGUF quantization type {qweight_type} in layer {layer}."
+            )
         # For MergedColumnParallelLinear and QKVParallelLinear, we need to
         # materialize the padded weight parameter for CUDA Graph compatibility.
         self._create_padded_weight_param(layer)
@@ -391,22 +422,22 @@ def _create_padded_weight_param(self, layer: torch.nn.Module):
         if len(data_container := qweight.data_container) > 1:
             dtype = {data.dtype for data in data_container}
             assert len(dtype) == 1, ValueError(
-                f"Data container has mixed dtypes: {dtype}")
+                f"Data container has mixed dtypes: {dtype}"
+            )
             dtype = next(iter(dtype))
             # concat dim0 and pad dim1
             padded_side = max(x.size(1) for x in data_container)
             concat_side = sum(x.size(0) for x in data_container)
             # Pad the quantized weights to dense tensor, and create a map
             # with the location of each shard in the padded tensor.
-            padded_data = torch.zeros((concat_side, padded_side),
-                                      dtype=dtype,
-                                      device=qweight.device)
+            padded_data = torch.zeros(
+                (concat_side, padded_side), dtype=dtype, device=qweight.device
+            )
             # (dim0_start, dim0_end, dim1_size)
             shard_offset_map = dict[str, tuple[int, int, int]]()
             for idx in shard_id:
                 id_in_container = shard_id_map[idx]
-                start = sum(
-                    x.size(0) for x in data_container[:id_in_container])
+                start = sum(x.size(0) for x in data_container[:id_in_container])
                 end = start + data_container[id_in_container].size(0)
                 size = data_container[id_in_container].size(1)
                 padded_data[start:end, :size] = data_container[id_in_container]
@@ -414,14 +445,15 @@ def _create_padded_weight_param(self, layer: torch.nn.Module):
             qweight.data_container.clear()
             padded_param = Parameter(padded_data, requires_grad=False)
             set_weight_attrs(padded_param, vars(qweight))
-            set_weight_attrs(padded_param,
-                             {"shard_offset_map": shard_offset_map})
+            set_weight_attrs(padded_param, {"shard_offset_map": shard_offset_map})
             layer.register_parameter("qweight", padded_param)
 
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         shard_id = layer.qweight.shard_id
 
         if shard_id:
@@ -434,8 +466,9 @@ def apply(self,
                 qweight_type = layer.qweight_type.shard_weight_type[idx]
                 result.append(
                     fused_mul_mat_gguf(
-                        x, qweight[start:end, :offset].contiguous(),
-                        qweight_type))
+                        x, qweight[start:end, :offset].contiguous(), qweight_type
+                    )
+                )
             out = torch.cat(result, axis=1)
         else:
             qweight = layer.qweight
@@ -461,63 +494,71 @@ def __init__(
         super().__init__(moe)
         self.quant_config = quant_config
 
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
-
-        tensor_shape = (num_experts, 2 * intermediate_size_per_partition,
-                        hidden_size)
-        #gate up proj
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
+        tensor_shape = (num_experts, 2 * intermediate_size_per_partition, hidden_size)
+        # gate up proj
         w13_qweight = GGUFUninitializedParameter(requires_grad=False)
         set_weight_attrs(
-            w13_qweight, {
+            w13_qweight,
+            {
                 "input_dim": 1,
                 "output_dim": 0,
                 "tensor_shape": tensor_shape,
                 "is_gguf_weight": True,
                 "data_container": [],
-            })
+            },
+        )
         set_weight_attrs(w13_qweight, extra_weight_attrs)
         layer.register_parameter("w13_qweight", w13_qweight)
 
-        w13_qweight_type = Parameter(torch.empty(1, dtype=torch.uint8),
-                                     requires_grad=False)
-        set_weight_attrs(w13_qweight_type, {
-            "is_gguf_weight_type": True,
-            "weight_type": 0,
-            "ignore_warning": True
-        })
+        w13_qweight_type = Parameter(
+            torch.empty(1, dtype=torch.uint8), requires_grad=False
+        )
+        set_weight_attrs(
+            w13_qweight_type,
+            {"is_gguf_weight_type": True, "weight_type": 0, "ignore_warning": True},
+        )
         set_weight_attrs(w13_qweight_type, extra_weight_attrs)
         layer.register_parameter("w13_qweight_type", w13_qweight_type)
 
-        tensor_shape = (num_experts, intermediate_size_per_partition,
-                        hidden_size)
-        #gate down proj
+        tensor_shape = (num_experts, intermediate_size_per_partition, hidden_size)
+        # gate down proj
         w2_qweight = GGUFUninitializedParameter(requires_grad=False)
         set_weight_attrs(
-            w2_qweight, {
+            w2_qweight,
+            {
                 "input_dim": 1,
                 "output_dim": 0,
                 "tensor_shape": tensor_shape,
                 "is_gguf_weight": True,
                 "data_container": [],
-            })
+            },
+        )
         set_weight_attrs(w2_qweight, extra_weight_attrs)
         layer.register_parameter("w2_qweight", w2_qweight)
 
-        w2_qweight_type = Parameter(torch.empty(1, dtype=torch.uint8),
-                                    requires_grad=False)
-        set_weight_attrs(w2_qweight_type, {
-            "is_gguf_weight_type": True,
-            "weight_type": 0,
-            "ignore_warning": True
-        })
+        w2_qweight_type = Parameter(
+            torch.empty(1, dtype=torch.uint8), requires_grad=False
+        )
+        set_weight_attrs(
+            w2_qweight_type,
+            {"is_gguf_weight_type": True, "weight_type": 0, "ignore_warning": True},
+        )
 
         set_weight_attrs(w2_qweight_type, extra_weight_attrs)
         layer.register_parameter("w2_qweight_type", w2_qweight_type)
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         return None
 
     def apply(
@@ -546,14 +587,14 @@ def apply(
         assert self.fused_experts is None
 
         if enable_eplb:
-            raise NotImplementedError(
-                "EPLB not supported for `GGUFMoEMethod` yet.")
+            raise NotImplementedError("EPLB not supported for `GGUFMoEMethod` yet.")
 
         assert activation == "silu", "Only SiLU activation is supported."
         if apply_router_weight_on_input:
             raise NotImplementedError(
                 "Apply router weight on input is not supported for"
-                "fused GGUF MoE method.")
+                "fused GGUF MoE method."
+            )
 
         topk_weights, topk_ids, _ = FusedMoE.select_experts(
             hidden_states=x,
@@ -567,11 +608,18 @@ def apply(
             scoring_func=scoring_func,
             routed_scaling_factor=routed_scaling_factor,
             e_score_correction_bias=e_score_correction_bias,
-            indices_type=self.topk_indices_dtype)
-        return fused_moe_gguf(x, layer.w13_qweight, layer.w2_qweight,
-                              topk_weights, topk_ids,
-                              layer.w13_qweight_type.weight_type,
-                              layer.w2_qweight_type.weight_type, activation)
+            indices_type=self.topk_indices_dtype,
+        )
+        return fused_moe_gguf(
+            x,
+            layer.w13_qweight,
+            layer.w2_qweight,
+            topk_weights,
+            topk_ids,
+            layer.w13_qweight_type.weight_type,
+            layer.w2_qweight_type.weight_type,
+            activation,
+        )
 
 
 class GGUFEmbeddingMethod(GGUFLinearMethod):
@@ -581,17 +629,14 @@ class GGUFEmbeddingMethod(GGUFLinearMethod):
         quant_config: The GGUF quantization config.
     """
 
-    def embedding(self, layer: torch.nn.Module,
-                  x: torch.Tensor) -> torch.Tensor:
+    def embedding(self, layer: torch.nn.Module, x: torch.Tensor) -> torch.Tensor:
         qweight = layer.qweight
         qweight_type = layer.qweight_type.weight_type
         hidden_size = qweight.tensor_shape[1]
 
-        return apply_gguf_embedding(x,
-                                    qweight,
-                                    qweight_type,
-                                    hidden_size,
-                                    dtype=self.params_dtype)
+        return apply_gguf_embedding(
+            x, qweight, qweight_type, hidden_size, dtype=self.params_dtype
+        )
 
 
 class GGUFUninitializedParameter(UninitializedParameter):
diff --git a/vllm/model_executor/layers/quantization/gptq.py b/vllm/model_executor/layers/quantization/gptq.py
index 842ce92333c9..8f36fc70c444 100644
--- a/vllm/model_executor/layers/quantization/gptq.py
+++ b/vllm/model_executor/layers/quantization/gptq.py
@@ -14,14 +14,19 @@
 from vllm.model_executor.layers.fused_moe.layer import FusedMoE
 from vllm.model_executor.layers.linear import LinearMethodBase
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.layers.quantization.utils.gptq_utils import (
-    get_linear_quant_method)
-from vllm.model_executor.parameter import (ChannelQuantScaleParameter,
-                                           GroupQuantScaleParameter,
-                                           PackedColumnParameter,
-                                           PackedvLLMParameter,
-                                           RowvLLMParameter)
+    get_linear_quant_method,
+)
+from vllm.model_executor.parameter import (
+    ChannelQuantScaleParameter,
+    GroupQuantScaleParameter,
+    PackedColumnParameter,
+    PackedvLLMParameter,
+    RowvLLMParameter,
+)
 from vllm.transformers_utils.config import get_safetensors_params_metadata
 from vllm.utils import is_list_of
 
@@ -81,7 +86,8 @@ def __init__(
         if self.weight_bits not in [2, 3, 4, 8]:
             raise ValueError(
                 "Currently, only 2/3/4/8-bit weight quantization is "
-                f"supported for GPTQ, but got {self.weight_bits} bits.")
+                f"supported for GPTQ, but got {self.weight_bits} bits."
+            )
 
         self.modules_in_block_to_quantize = modules_in_block_to_quantize or []
 
@@ -123,14 +129,22 @@ def from_config(cls, config: dict[str, Any]) -> "GPTQConfig":
         weight_bits = cls.get_from_keys(config, ["bits"])
         group_size = cls.get_from_keys(config, ["group_size"])
         desc_act = cls.get_from_keys(config, ["desc_act"])
-        lm_head_quantized = cls.get_from_keys_or(config, ["lm_head"],
-                                                 default=False)
-        autoround_version = cls.get_from_keys_or(config, ["autoround_version"],
-                                                 default="")
+        lm_head_quantized = cls.get_from_keys_or(config, ["lm_head"], default=False)
+        autoround_version = cls.get_from_keys_or(
+            config, ["autoround_version"], default=""
+        )
         modules_in_block_to_quantize = cls.get_from_keys_or(
-            config, ["modules_in_block_to_quantize"], default=None)
-        return cls(weight_bits, group_size, desc_act, lm_head_quantized,
-                   dynamic, autoround_version, modules_in_block_to_quantize)
+            config, ["modules_in_block_to_quantize"], default=None
+        )
+        return cls(
+            weight_bits,
+            group_size,
+            desc_act,
+            lm_head_quantized,
+            dynamic,
+            autoround_version,
+            modules_in_block_to_quantize,
+        )
 
     def get_quant_method(
         self, layer: torch.nn.Module, prefix: str
@@ -146,43 +160,40 @@ def get_quant_method(
                 "sym": True,  # GPTQ typically uses symmetric quantization
                 "lm_head": False,
             }
-            return MoeWNA16Config.from_config(config).get_quant_method(
-                layer, prefix)
+            return MoeWNA16Config.from_config(config).get_quant_method(layer, prefix)
 
         return get_linear_quant_method(self, layer, prefix, GPTQLinearMethod)
 
     def apply_vllm_mapper(self, hf_to_vllm_mapper):
         if self.modules_in_block_to_quantize is not None:
             self.modules_in_block_to_quantize = hf_to_vllm_mapper.apply_list(
-                self.modules_in_block_to_quantize)
+                self.modules_in_block_to_quantize
+            )
 
-    def maybe_update_config(self,
-                            model_name: str,
-                            revision: Optional[str] = None):
+    def maybe_update_config(self, model_name: str, revision: Optional[str] = None):
         if self.modules_in_block_to_quantize:
             if is_list_of(self.modules_in_block_to_quantize, list):
                 # original modules_in_block_to_quantize: list[list[str]]
                 # flatten original modules_in_block_to_quantize
                 self.modules_in_block_to_quantize = [
-                    item for sublist in self.modules_in_block_to_quantize
+                    item
+                    for sublist in self.modules_in_block_to_quantize
                     for item in sublist
                 ]
             return
 
         unquant_dtypes = [torch.float16, torch.bfloat16, torch.float32]
-        metadata = get_safetensors_params_metadata(model_name,
-                                                   revision=revision)
+        metadata = get_safetensors_params_metadata(model_name, revision=revision)
         quant_layers: set[str] = {
             param_name.rsplit(".", 1)[0]
             for param_name, info in metadata.items()
-            if (dtype := info.get('dtype', None))
+            if (dtype := info.get("dtype", None))
             and _SAFETENSORS_TO_TORCH_DTYPE[dtype] not in unquant_dtypes
         }
         self.modules_in_block_to_quantize = list(quant_layers)
 
 
 class ExllamaState(Enum):
-
     UNUSED = enum.auto()
     UNINITIALIZED = enum.auto()
     READY = enum.auto()
@@ -214,14 +225,15 @@ def create_weights(
             raise ValueError(
                 "The input size is not aligned with the quantized "
                 "weight shape. This can be caused by too large "
-                "tensor parallel size.")
+                "tensor parallel size."
+            )
         output_size_per_partition = sum(output_partition_sizes)
-        if (output_size_per_partition % self.quant_config.pack_factor.numerator
-                != 0):
+        if output_size_per_partition % self.quant_config.pack_factor.numerator != 0:
             raise ValueError(
                 "The output size is not aligned with the quantized "
                 "weight shape. This can be caused by too large "
-                "tensor parallel size.")
+                "tensor parallel size."
+            )
 
         if self.quant_config.group_size != -1:
             group_size = self.quant_config.group_size
@@ -230,8 +242,10 @@ def create_weights(
         exllama_state = ExllamaState.UNINITIALIZED
         scale_and_zero_size = input_size // group_size
         scale_and_zero_input_dim = None
-        if (input_size != input_size_per_partition
-                and self.quant_config.group_size != -1):
+        if (
+            input_size != input_size_per_partition
+            and self.quant_config.group_size != -1
+        ):
             # For act-order models, we cannot use Exllama for row parallel layer
             if self.quant_config.desc_act:
                 exllama_state = ExllamaState.UNUSED
@@ -250,56 +264,56 @@ def create_weights(
             output_dim=1,
             packed_dim=0,
             packed_factor=self.quant_config.pack_factor,
-            weight_loader=weight_loader)
-
-        g_idx = RowvLLMParameter(data=torch.tensor(
-            [
-                i // self.quant_config.group_size
-                for i in range(input_size_per_partition)
-            ],
-            dtype=torch.int32,
-        ),
-                                 input_dim=0,
-                                 weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
+
+        g_idx = RowvLLMParameter(
+            data=torch.tensor(
+                [
+                    i // self.quant_config.group_size
+                    for i in range(input_size_per_partition)
+                ],
+                dtype=torch.int32,
+            ),
+            input_dim=0,
+            weight_loader=weight_loader,
+        )
         qzeros_args = {
-            "data":
-            torch.empty(
+            "data": torch.empty(
                 scale_and_zero_size,
                 output_size_per_partition // self.quant_config.pack_factor,
                 dtype=torch.int32,
             ),
-            "weight_loader":
-            weight_loader
+            "weight_loader": weight_loader,
         }
         weight_scale_args = {
-            "data":
-            torch.empty(
+            "data": torch.empty(
                 scale_and_zero_size,
                 output_size_per_partition,
                 dtype=params_dtype,
             ),
-            "weight_loader":
-            weight_loader
+            "weight_loader": weight_loader,
         }
         if scale_and_zero_input_dim is None:
-            scales = ChannelQuantScaleParameter(output_dim=1,
-                                                **weight_scale_args)
+            scales = ChannelQuantScaleParameter(output_dim=1, **weight_scale_args)
             qzeros = PackedColumnParameter(
                 output_dim=1,
                 packed_dim=1,
                 packed_factor=self.quant_config.pack_factor,
-                **qzeros_args)
+                **qzeros_args,
+            )
 
         else:
-            scales = GroupQuantScaleParameter(output_dim=1,
-                                              input_dim=0,
-                                              **weight_scale_args)
+            scales = GroupQuantScaleParameter(
+                output_dim=1, input_dim=0, **weight_scale_args
+            )
             qzeros = PackedvLLMParameter(
                 input_dim=0,
                 output_dim=1,
                 packed_dim=1,
                 packed_factor=self.quant_config.pack_factor,
-                **qzeros_args)
+                **qzeros_args,
+            )
 
         layer.register_parameter("qweight", qweight)
         layer.register_parameter("g_idx", g_idx)
@@ -321,24 +335,30 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             if self.quant_config.desc_act:
                 layer.g_idx.data = torch.argsort(layer.g_idx).to(torch.int)
             else:
-                layer.g_idx.data = torch.empty((0, ),
-                                               dtype=torch.int,
-                                               device=layer.g_idx.device)
+                layer.g_idx.data = torch.empty(
+                    (0,), dtype=torch.int, device=layer.g_idx.device
+                )
             layer.exllama_state = ExllamaState.READY
-            ops.gptq_shuffle(layer.qweight, layer.g_idx,
-                             self.quant_config.weight_bits)
-
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
-        out_shape = x.shape[:-1] + (layer.qweight.shape[-1], )
+            ops.gptq_shuffle(layer.qweight, layer.g_idx, self.quant_config.weight_bits)
+
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
+        out_shape = x.shape[:-1] + (layer.qweight.shape[-1],)
         reshaped_x = x.reshape(-1, x.shape[-1])
 
-        output = ops.gptq_gemm(reshaped_x, layer.qweight, layer.qzeros,
-                               layer.scales, layer.g_idx,
-                               layer.exllama_state == ExllamaState.READY,
-                               self.quant_config.weight_bits)
+        output = ops.gptq_gemm(
+            reshaped_x,
+            layer.qweight,
+            layer.qzeros,
+            layer.scales,
+            layer.g_idx,
+            layer.exllama_state == ExllamaState.READY,
+            self.quant_config.weight_bits,
+        )
         if bias is not None:
             output.add_(bias)
         return output.reshape(out_shape)
diff --git a/vllm/model_executor/layers/quantization/gptq_bitblas.py b/vllm/model_executor/layers/quantization/gptq_bitblas.py
index c193dd85e32f..85cf4ed4ac58 100644
--- a/vllm/model_executor/layers/quantization/gptq_bitblas.py
+++ b/vllm/model_executor/layers/quantization/gptq_bitblas.py
@@ -7,25 +7,39 @@
 from torch.nn.parameter import Parameter
 
 from vllm.logger import init_logger
-from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
-                                               set_weight_attrs)
-from vllm.model_executor.layers.quantization import (QuantizationConfig,
-                                                     QuantizationMethods)
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    LinearMethodBase,
+    set_weight_attrs,
+)
+from vllm.model_executor.layers.quantization import (
+    QuantizationConfig,
+    QuantizationMethods,
+)
 from vllm.model_executor.layers.quantization.kernels.mixed_precision import (
-    BitBLASLinearKernel, MPLinearLayerConfig)
+    BitBLASLinearKernel,
+    MPLinearLayerConfig,
+)
 from vllm.model_executor.layers.quantization.utils.bitblas_utils import (
-    BITBLAS_SUPPORTED_NUM_BITS as GPTQ_BITBLAS_SUPPORTED_NUM_BITS)
+    BITBLAS_SUPPORTED_NUM_BITS as GPTQ_BITBLAS_SUPPORTED_NUM_BITS,
+)
 from vllm.model_executor.layers.quantization.utils.bitblas_utils import (
-    BITBLAS_SUPPORTED_SYM as GPTQ_BITBLAS_SUPPORTED_SYM)
+    BITBLAS_SUPPORTED_SYM as GPTQ_BITBLAS_SUPPORTED_SYM,
+)
 from vllm.model_executor.layers.quantization.utils.bitblas_utils import (
-    MINIMUM_BITBLAS_VERSION, bitblas_repeat_scales_on_all_ranks,
-    check_bitblas_supported, verify_bitblas_supported)
+    MINIMUM_BITBLAS_VERSION,
+    bitblas_repeat_scales_on_all_ranks,
+    check_bitblas_supported,
+    verify_bitblas_supported,
+)
 from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
-from vllm.model_executor.parameter import (ChannelQuantScaleParameter,
-                                           GroupQuantScaleParameter,
-                                           PackedColumnParameter,
-                                           PackedvLLMParameter,
-                                           RowvLLMParameter)
+from vllm.model_executor.parameter import (
+    ChannelQuantScaleParameter,
+    GroupQuantScaleParameter,
+    PackedColumnParameter,
+    PackedvLLMParameter,
+    RowvLLMParameter,
+)
 from vllm.platforms import current_platform
 from vllm.scalar_type import scalar_types
 
@@ -60,14 +74,16 @@ def __init__(
         quant_method: Optional[str],
         lm_head_quantized: bool,
     ) -> None:
-
         try:
             import bitblas
+
             if version.parse(bitblas.__version__) < version.parse(
-                    MINIMUM_BITBLAS_VERSION):
+                MINIMUM_BITBLAS_VERSION
+            ):
                 raise ImportError(
                     "bitblas version is wrong. Please "
-                    f"install bitblas>={MINIMUM_BITBLAS_VERSION}")
+                    f"install bitblas>={MINIMUM_BITBLAS_VERSION}"
+                )
         except ImportError as e:
             bitblas_import_exception = e
             raise ValueError(
@@ -95,17 +111,20 @@ def __init__(
             raise ValueError(
                 f"BitBLAS does not support weight_bits = {self.weight_bits}. "
                 f"Only weight_bits = {GPTQ_BITBLAS_SUPPORTED_NUM_BITS} "
-                "are supported.")
+                "are supported."
+            )
 
         if self.is_sym not in GPTQ_BITBLAS_SUPPORTED_SYM:
             raise ValueError(
                 f"BitBLAS does not support is_sym = {self.is_sym}. "
-                f"Only sym = {GPTQ_BITBLAS_SUPPORTED_SYM} are supported.")
+                f"Only sym = {GPTQ_BITBLAS_SUPPORTED_SYM} are supported."
+            )
 
         self.storage_dtype = self.GPTQ_BITBLAS_STORAGE_DTYPE
 
-        storage_nbit = int("".join(c for c in self.GPTQ_CKPT_STORAGE_DTYPE
-                                   if c.isdigit()))
+        storage_nbit = int(
+            "".join(c for c in self.GPTQ_CKPT_STORAGE_DTYPE if c.isdigit())
+        )
 
         # 4 Bits packed into 32 bit datatype.
         self.pack_factor = storage_nbit // weight_bits
@@ -115,17 +134,20 @@ def __init__(
         self.zeros_mode = self.ZEROS_MODE
 
         if (weight_bits, is_sym) not in self.TYPE_MAP:
-            raise ValueError("Unsupported quantization config: "
-                             f"bits={weight_bits}, sym={is_sym}")
+            raise ValueError(
+                f"Unsupported quantization config: bits={weight_bits}, sym={is_sym}"
+            )
 
         self.quant_type = self.TYPE_MAP[(weight_bits, is_sym)]
 
     def __repr__(self) -> str:
-        return (f"GPTQBitBLASConfig(weight_bits={self.weight_bits}, "
-                f"group_size={self.group_size}, "
-                f"desc_act={self.desc_act})"
-                f"is_sym={self.is_sym}, "
-                f"quant_method={self.quant_method})")
+        return (
+            f"GPTQBitBLASConfig(weight_bits={self.weight_bits}, "
+            f"group_size={self.group_size}, "
+            f"desc_act={self.desc_act})"
+            f"is_sym={self.is_sym}, "
+            f"quant_method={self.quant_method})"
+        )
 
     @classmethod
     def get_name(cls) -> QuantizationMethods:
@@ -150,36 +172,46 @@ def from_config(cls, config: dict[str, Any]) -> "GPTQBitBLASConfig":
         desc_act = cls.get_from_keys(config, ["desc_act"])
         is_sym = cls.get_from_keys(config, ["sym"])
         quant_method = cls.get_from_keys(config, ["quant_method"])
-        lm_head_quantized = cls.get_from_keys_or(config, ["lm_head"],
-                                                 default=False)
-        return cls(weight_bits, group_size, desc_act, is_sym, quant_method,
-                   lm_head_quantized)
+        lm_head_quantized = cls.get_from_keys_or(config, ["lm_head"], default=False)
+        return cls(
+            weight_bits, group_size, desc_act, is_sym, quant_method, lm_head_quantized
+        )
 
     @classmethod
     def override_quantization_method(
-            cls, hf_quant_cfg, user_quant) -> Optional[QuantizationMethods]:
+        cls, hf_quant_cfg, user_quant
+    ) -> Optional[QuantizationMethods]:
         can_convert = cls.is_gptq_bitblas_compatible(hf_quant_cfg)
 
-        is_valid_user_quant = (user_quant is None or user_quant == "bitblas"
-                               or user_quant == "gptq_bitblas")
+        is_valid_user_quant = (
+            user_quant is None
+            or user_quant == "bitblas"
+            or user_quant == "gptq_bitblas"
+        )
 
         if can_convert and is_valid_user_quant:
-            msg = ("The model is convertible to {} during runtime."
-                   " Using {} kernel.".format(cls.get_name(), cls.get_name()))
+            msg = (
+                "The model is convertible to {} during runtime."
+                " Using {} kernel.".format(cls.get_name(), cls.get_name())
+            )
             logger.info(msg)
             return cls.get_name()
 
         if can_convert and user_quant == "gptq":
-            logger.info("Detected that the model can run with gptq_bitblas"
-                        ", however you specified quantization=gptq explicitly,"
-                        " so forcing gptq. Use quantization=gptq_bitblas for"
-                        " faster inference")
+            logger.info(
+                "Detected that the model can run with gptq_bitblas"
+                ", however you specified quantization=gptq explicitly,"
+                " so forcing gptq. Use quantization=gptq_bitblas for"
+                " faster inference"
+            )
         return None
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["GPTQBitBLASLinearMethod"]:
-        if isinstance(layer, LinearBase) or (isinstance(layer, ParallelLMHead)
-                                             and self.lm_head_quantized):
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["GPTQBitBLASLinearMethod"]:
+        if isinstance(layer, LinearBase) or (
+            isinstance(layer, ParallelLMHead) and self.lm_head_quantized
+        ):
             return GPTQBitBLASLinearMethod(self)
         return None
 
@@ -200,8 +232,7 @@ def is_gptq_bitblas_compatible(cls, quant_config: dict[str, Any]):
             return False
 
         # If we cannot find the info needed in the config, cannot convert.
-        if (num_bits is None or group_size is None or sym is None
-                or desc_act is None):
+        if num_bits is None or group_size is None or sym is None or desc_act is None:
             return False
 
         if (num_bits, sym) not in cls.TYPE_MAP:
@@ -214,9 +245,9 @@ def is_gptq_bitblas_compatible(cls, quant_config: dict[str, Any]):
             return False
 
         # Otherwise, can convert if model satisfies bitblas constraints.
-        return check_bitblas_supported(quant_type=cls.TYPE_MAP[(num_bits,
-                                                                sym)],
-                                       group_size=group_size)
+        return check_bitblas_supported(
+            quant_type=cls.TYPE_MAP[(num_bits, sym)], group_size=group_size
+        )
 
 
 class GPTQBitBLASLinearMethod(LinearMethodBase):
@@ -232,8 +263,10 @@ class GPTQBitBLASLinearMethod(LinearMethodBase):
     def __init__(self, quant_config: GPTQBitBLASConfig) -> None:
         self.quant_config = quant_config
         # Verify supported on platform.
-        verify_bitblas_supported(quant_type=self.quant_config.quant_type,
-                                 group_size=self.quant_config.group_size)
+        verify_bitblas_supported(
+            quant_type=self.quant_config.quant_type,
+            group_size=self.quant_config.group_size,
+        )
 
     def create_weights(
         self,
@@ -247,7 +280,7 @@ def create_weights(
     ) -> None:
         """Creates quantized weights for use in linear operations.
 
-        The function initializes and returns a dictionary containing 
+        The function initializes and returns a dictionary containing
         quantized weights, scales, and zeros
         for performing quantized matrix multiplication operations.
 
@@ -256,11 +289,11 @@ def create_weights(
             output_partition_sizes: The size of the output partition.
             input_size: The total size of the input (unused).
             output_size: The total size of the output (unused).
-            params_dtype: 
+            params_dtype:
                 The data type of the parameters (expected to be torch.float16).
 
         Returns:
-            A dictionary containing the quantized weights ('qweight'), 
+            A dictionary containing the quantized weights ('qweight'),
             scales ('scales'), and zeros ('zeros').
 
         Raises:
@@ -269,8 +302,9 @@ def create_weights(
                 in `quant_config`.
         """
         if params_dtype != torch.float16:
-            raise ValueError("Parameter data type must be torch.float16, "
-                             f"but got {params_dtype}")
+            raise ValueError(
+                f"Parameter data type must be torch.float16, but got {params_dtype}"
+            )
 
         # Normalize group_size
         if self.quant_config.group_size != -1:
@@ -293,18 +327,19 @@ def create_weights(
 
         mp_linear_kernel_config = MPLinearLayerConfig(
             full_weight_shape=(input_size, output_size),
-            partition_weight_shape=\
-                (input_size_per_partition, output_size_per_partition),
+            partition_weight_shape=(
+                input_size_per_partition,
+                output_size_per_partition,
+            ),
             weight_type=self.quant_config.quant_type,
             act_type=params_dtype,
             group_size=self.quant_config.group_size,
             zero_points=False,
-            has_g_idx=self.quant_config.desc_act
+            has_g_idx=self.quant_config.desc_act,
         )
 
         if kernel_type.__name__ not in self._kernel_backends_being_used:
-            logger.info("Using %s for GPTQBitBLASLinearMethod",
-                        kernel_type.__name__)
+            logger.info("Using %s for GPTQBitBLASLinearMethod", kernel_type.__name__)
             self._kernel_backends_being_used.add(kernel_type.__name__)
 
         # Normalize group_size
@@ -314,9 +349,9 @@ def create_weights(
             group_size = input_size
 
         # Determine sharding
-        if bitblas_repeat_scales_on_all_ranks(self.quant_config.desc_act,
-                                              self.quant_config.group_size,
-                                              is_row_parallel):
+        if bitblas_repeat_scales_on_all_ranks(
+            self.quant_config.desc_act, self.quant_config.group_size, is_row_parallel
+        ):
             # By setting scale_dim == None, weight_loader will
             # repeat the scales on each GPU in TP>1 case.
             scales_and_zp_input_dim = None
@@ -339,16 +374,19 @@ def create_weights(
             output_dim=1,
             packed_dim=0,
             packed_factor=self.quant_config.pack_factor,
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
 
         # Activation order
         # Ignore warning from fused linear layers such as QKVParallelLinear.
-        g_idx = RowvLLMParameter(data=torch.empty(
-            input_size_per_partition,
-            dtype=torch.int32,
-        ),
-                                 input_dim=0,
-                                 weight_loader=weight_loader)
+        g_idx = RowvLLMParameter(
+            data=torch.empty(
+                input_size_per_partition,
+                dtype=torch.int32,
+            ),
+            input_dim=0,
+            weight_loader=weight_loader,
+        )
 
         # Scales
         scales = Parameter(
@@ -370,45 +408,42 @@ def create_weights(
 
         # Quantized zero-points
         qzeros_args = {
-            "data":
-            torch.empty(
+            "data": torch.empty(
                 scales_and_zp_size,
                 output_size_per_partition // self.quant_config.pack_factor,
                 dtype=torch.int32,
             ),
-            "weight_loader":
-            weight_loader
+            "weight_loader": weight_loader,
         }
         weight_scale_args = {
-            "data":
-            torch.empty(
+            "data": torch.empty(
                 scales_and_zp_size,
                 output_size_per_partition,
                 dtype=params_dtype,
             ),
-            "weight_loader":
-            weight_loader
+            "weight_loader": weight_loader,
         }
 
         if scales_and_zp_input_dim is None:
-            scales = ChannelQuantScaleParameter(output_dim=1,
-                                                **weight_scale_args)
+            scales = ChannelQuantScaleParameter(output_dim=1, **weight_scale_args)
             qzeros = PackedColumnParameter(
                 output_dim=1,
                 packed_dim=1,
                 packed_factor=self.quant_config.pack_factor,
-                **qzeros_args)
+                **qzeros_args,
+            )
 
         else:
-            scales = GroupQuantScaleParameter(output_dim=1,
-                                              input_dim=0,
-                                              **weight_scale_args)
+            scales = GroupQuantScaleParameter(
+                output_dim=1, input_dim=0, **weight_scale_args
+            )
             qzeros = PackedvLLMParameter(
                 input_dim=0,
                 output_dim=1,
                 packed_dim=1,
                 packed_factor=self.quant_config.pack_factor,
-                **qzeros_args)
+                **qzeros_args,
+            )
 
         layer.register_parameter("qweight", qweight)
         layer.register_parameter("g_idx", g_idx)
diff --git a/vllm/model_executor/layers/quantization/gptq_marlin.py b/vllm/model_executor/layers/quantization/gptq_marlin.py
index 253675e25f34..8fa70a240f9f 100644
--- a/vllm/model_executor/layers/quantization/gptq_marlin.py
+++ b/vllm/model_executor/layers/quantization/gptq_marlin.py
@@ -10,30 +10,48 @@
 import vllm.model_executor.layers.fused_moe  # noqa
 from vllm import _custom_ops as ops
 from vllm.logger import init_logger
-from vllm.model_executor.layers.fused_moe.config import (FusedMoEConfig,
-                                                         FusedMoEQuantConfig)
+from vllm.model_executor.layers.fused_moe.config import (
+    FusedMoEConfig,
+    FusedMoEQuantConfig,
+)
 from vllm.model_executor.layers.fused_moe.layer import (
-    FusedMoE, FusedMoEMethodBase, FusedMoeWeightScaleSupported,
-    UnquantizedFusedMoEMethod)
-from vllm.model_executor.layers.linear import (LinearMethodBase,
-                                               set_weight_attrs)
+    FusedMoE,
+    FusedMoEMethodBase,
+    FusedMoeWeightScaleSupported,
+    UnquantizedFusedMoEMethod,
+)
+from vllm.model_executor.layers.linear import LinearMethodBase, set_weight_attrs
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.layers.quantization.kernels.mixed_precision import (
-    MPLinearLayerConfig, choose_mp_linear_kernel)
+    MPLinearLayerConfig,
+    choose_mp_linear_kernel,
+)
 from vllm.model_executor.layers.quantization.utils import replace_parameter
 from vllm.model_executor.layers.quantization.utils.gptq_utils import (
-    get_dynamic_override, get_linear_quant_method, override_config)
+    get_dynamic_override,
+    get_linear_quant_method,
+    override_config,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-    check_marlin_supported, check_moe_marlin_supports_layer,
-    marlin_make_workspace_new, marlin_moe_permute_scales, marlin_permute_bias,
-    marlin_repeat_scales_on_all_ranks, verify_marlin_supported)
-from vllm.model_executor.parameter import (ChannelQuantScaleParameter,
-                                           GroupQuantScaleParameter,
-                                           PackedColumnParameter,
-                                           PackedvLLMParameter,
-                                           RowvLLMParameter)
+    check_marlin_supported,
+    check_moe_marlin_supports_layer,
+    marlin_make_workspace_new,
+    marlin_moe_permute_scales,
+    marlin_permute_bias,
+    marlin_repeat_scales_on_all_ranks,
+    verify_marlin_supported,
+)
+from vllm.model_executor.parameter import (
+    ChannelQuantScaleParameter,
+    GroupQuantScaleParameter,
+    PackedColumnParameter,
+    PackedvLLMParameter,
+    RowvLLMParameter,
+)
 from vllm.platforms import current_platform
 from vllm.scalar_type import scalar_types
 from vllm.transformers_utils.config import get_safetensors_params_metadata
@@ -52,9 +70,13 @@ def get_moe_quant_method(
 
     if isinstance(layer, FusedMoE):
         # False = skip module, None = no override, else = Positive match
-        if get_dynamic_override(  # noqa: E712
+        if (
+            get_dynamic_override(  # noqa: E712
                 cloned_config,  # noqa: E712
-                layer_name=prefix) == False:  # noqa: E712
+                layer_name=prefix,
+            )
+            == False
+        ):  # noqa: E712
             return UnquantizedFusedMoEMethod(layer.moe_config)
 
         if prefix:
@@ -75,15 +97,16 @@ class GPTQMarlinConfig(QuantizationConfig):
     }
 
     def __init__(
-            self,
-            weight_bits: int,
-            group_size: int,
-            desc_act: bool,
-            is_sym: bool,
-            lm_head_quantized: bool,
-            dynamic: dict[str, dict[str, Union[int, bool]]],
-            full_config: dict[str, Any],
-            modules_in_block_to_quantize: Optional[list[str]] = None) -> None:
+        self,
+        weight_bits: int,
+        group_size: int,
+        desc_act: bool,
+        is_sym: bool,
+        lm_head_quantized: bool,
+        dynamic: dict[str, dict[str, Union[int, bool]]],
+        full_config: dict[str, Any],
+        modules_in_block_to_quantize: Optional[list[str]] = None,
+    ) -> None:
         super().__init__()
         if desc_act and group_size == -1:
             # In this case, act_order == True is the same as act_order == False
@@ -125,8 +148,9 @@ def __init__(
         self.full_config = full_config
 
         if (weight_bits, is_sym) not in self.TYPE_MAP:
-            raise ValueError("Unsupported quantization config: "
-                             f"bits={weight_bits}, sym={is_sym}")
+            raise ValueError(
+                f"Unsupported quantization config: bits={weight_bits}, sym={is_sym}"
+            )
 
         self.quant_type = self.TYPE_MAP[(weight_bits, is_sym)]
 
@@ -169,50 +193,64 @@ def from_config(cls, config: dict[str, Any]) -> "GPTQMarlinConfig":
         group_size = cls.get_from_keys(config, ["group_size"])
         desc_act = cls.get_from_keys(config, ["desc_act"])
         is_sym = cls.get_from_keys(config, ["sym"])
-        lm_head_quantized = cls.get_from_keys_or(config, ["lm_head"],
-                                                 default=False)
+        lm_head_quantized = cls.get_from_keys_or(config, ["lm_head"], default=False)
         modules_in_block_to_quantize = cls.get_from_keys_or(
-            config, ["modules_in_block_to_quantize"], default=None)
-        return cls(weight_bits, group_size, desc_act, is_sym,
-                   lm_head_quantized, dynamic, config,
-                   modules_in_block_to_quantize)
+            config, ["modules_in_block_to_quantize"], default=None
+        )
+        return cls(
+            weight_bits,
+            group_size,
+            desc_act,
+            is_sym,
+            lm_head_quantized,
+            dynamic,
+            config,
+            modules_in_block_to_quantize,
+        )
 
     @classmethod
     def override_quantization_method(
-            cls, hf_quant_cfg, user_quant) -> Optional[QuantizationMethods]:
+        cls, hf_quant_cfg, user_quant
+    ) -> Optional[QuantizationMethods]:
         can_convert = cls.is_gptq_marlin_compatible(hf_quant_cfg)
 
-        is_valid_user_quant = (user_quant is None or user_quant == "marlin"
-                               or user_quant == "gptq_marlin")
+        is_valid_user_quant = (
+            user_quant is None or user_quant == "marlin" or user_quant == "gptq_marlin"
+        )
 
         if can_convert and is_valid_user_quant:
-            msg = ("The model is convertible to {} during runtime."
-                   " Using {} kernel.".format(cls.get_name(), cls.get_name()))
+            msg = (
+                "The model is convertible to {} during runtime."
+                " Using {} kernel.".format(cls.get_name(), cls.get_name())
+            )
             logger.info(msg)
             return cls.get_name()
 
         if can_convert and user_quant == "gptq":
-            logger.info("Detected that the model can run with gptq_marlin"
-                        ", however you specified quantization=gptq explicitly,"
-                        " so forcing gptq. Use quantization=gptq_marlin for"
-                        " faster inference")
+            logger.info(
+                "Detected that the model can run with gptq_marlin"
+                ", however you specified quantization=gptq explicitly,"
+                " so forcing gptq. Use quantization=gptq_marlin for"
+                " faster inference"
+            )
         return None
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         if isinstance(layer, FusedMoE):
-            from vllm.model_executor.layers.quantization.moe_wna16 import (
-                MoeWNA16Config)
+            from vllm.model_executor.layers.quantization.moe_wna16 import MoeWNA16Config
+
             if not check_moe_marlin_supports_layer(layer, self.group_size):
                 logger.warning_once(
                     f"Layer '{prefix}' is not supported by GPTQMoeMarlin. "
-                    "Falling back to Moe WNA16 kernels.")
-                return MoeWNA16Config.from_config(
-                    self.full_config).get_quant_method(layer, prefix)
-            return get_moe_quant_method(self, layer, prefix,
-                                        GPTQMarlinMoEMethod)
-        return get_linear_quant_method(self, layer, prefix,
-                                       GPTQMarlinLinearMethod)
+                    "Falling back to Moe WNA16 kernels."
+                )
+                return MoeWNA16Config.from_config(self.full_config).get_quant_method(
+                    layer, prefix
+                )
+            return get_moe_quant_method(self, layer, prefix, GPTQMarlinMoEMethod)
+        return get_linear_quant_method(self, layer, prefix, GPTQMarlinLinearMethod)
 
     @classmethod
     def is_gptq_marlin_compatible(cls, quant_config: dict[str, Any]):
@@ -229,41 +267,40 @@ def is_gptq_marlin_compatible(cls, quant_config: dict[str, Any]):
             return False
 
         # Marlin conversion is only valid if required properties are found
-        if (num_bits is None or group_size is None or sym is None
-                or desc_act is None):
+        if num_bits is None or group_size is None or sym is None or desc_act is None:
             return False
 
         if (num_bits, sym) not in cls.TYPE_MAP:
             return False
 
-        return check_marlin_supported(quant_type=cls.TYPE_MAP[(num_bits, sym)],
-                                      group_size=group_size)
+        return check_marlin_supported(
+            quant_type=cls.TYPE_MAP[(num_bits, sym)], group_size=group_size
+        )
 
     def apply_vllm_mapper(self, hf_to_vllm_mapper):
         if self.modules_in_block_to_quantize is not None:
             self.modules_in_block_to_quantize = hf_to_vllm_mapper.apply_list(
-                self.modules_in_block_to_quantize)
+                self.modules_in_block_to_quantize
+            )
 
-    def maybe_update_config(self,
-                            model_name: str,
-                            revision: Optional[str] = None):
+    def maybe_update_config(self, model_name: str, revision: Optional[str] = None):
         if self.modules_in_block_to_quantize:
             if is_list_of(self.modules_in_block_to_quantize, list):
                 # original modules_in_block_to_quantize: list[list[str]]
                 # flatten original modules_in_block_to_quantize
                 self.modules_in_block_to_quantize = [
-                    item for sublist in self.modules_in_block_to_quantize
+                    item
+                    for sublist in self.modules_in_block_to_quantize
                     for item in sublist
                 ]
             return
 
         unquant_dtypes = [torch.float16, torch.bfloat16, torch.float32]
-        metadata = get_safetensors_params_metadata(model_name,
-                                                   revision=revision)
+        metadata = get_safetensors_params_metadata(model_name, revision=revision)
         quant_layers: set[str] = {
             param_name.rsplit(".", 1)[0]
             for param_name, info in metadata.items()
-            if (dtype := info.get('dtype', None))
+            if (dtype := info.get("dtype", None))
             and _SAFETENSORS_TO_TORCH_DTYPE[dtype] not in unquant_dtypes
         }
         self.modules_in_block_to_quantize = list(quant_layers)
@@ -282,8 +319,10 @@ def __init__(self, quant_config: GPTQMarlinConfig) -> None:
         self.quant_config = quant_config
 
         # Verify supported on platform.
-        verify_marlin_supported(quant_type=self.quant_config.quant_type,
-                                group_size=self.quant_config.group_size)
+        verify_marlin_supported(
+            quant_type=self.quant_config.quant_type,
+            group_size=self.quant_config.group_size,
+        )
 
     def create_weights(
         self,
@@ -301,20 +340,21 @@ def create_weights(
 
         mp_linear_kernel_config = MPLinearLayerConfig(
             full_weight_shape=(input_size, output_size),
-            partition_weight_shape=\
-                (input_size_per_partition, output_size_per_partition),
+            partition_weight_shape=(
+                input_size_per_partition,
+                output_size_per_partition,
+            ),
             weight_type=self.quant_config.quant_type,
             act_type=params_dtype,
             group_size=self.quant_config.group_size,
             zero_points=False,
-            has_g_idx=self.quant_config.desc_act
+            has_g_idx=self.quant_config.desc_act,
         )
 
         kernel_type = choose_mp_linear_kernel(mp_linear_kernel_config)
 
         if kernel_type.__name__ not in self._kernel_backends_being_used:
-            logger.info("Using %s for GPTQMarlinLinearMethod",
-                        kernel_type.__name__)
+            logger.info("Using %s for GPTQMarlinLinearMethod", kernel_type.__name__)
             self._kernel_backends_being_used.add(kernel_type.__name__)
 
         # Normalize group_size
@@ -324,9 +364,9 @@ def create_weights(
             group_size = input_size
 
         # Determine sharding
-        if marlin_repeat_scales_on_all_ranks(self.quant_config.desc_act,
-                                             self.quant_config.group_size,
-                                             is_row_parallel):
+        if marlin_repeat_scales_on_all_ranks(
+            self.quant_config.desc_act, self.quant_config.group_size, is_row_parallel
+        ):
             # By setting scale_dim == None, weight_loader will
             # repeat the scales on each GPU in TP>1 case.
             scales_and_zp_input_dim = None
@@ -348,67 +388,69 @@ def create_weights(
             output_dim=1,
             packed_dim=0,
             packed_factor=self.quant_config.pack_factor,
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
 
         # Activation order
-        g_idx = RowvLLMParameter(data=torch.empty(
-            input_size_per_partition,
-            dtype=torch.int32,
-        ),
-                                 input_dim=0,
-                                 weight_loader=weight_loader)
+        g_idx = RowvLLMParameter(
+            data=torch.empty(
+                input_size_per_partition,
+                dtype=torch.int32,
+            ),
+            input_dim=0,
+            weight_loader=weight_loader,
+        )
 
         qzeros_args = {
-            "data":
-            torch.empty(
+            "data": torch.empty(
                 scales_and_zp_size,
                 output_size_per_partition // self.quant_config.pack_factor,
                 dtype=torch.int32,
             ),
-            "weight_loader":
-            weight_loader
+            "weight_loader": weight_loader,
         }
         weight_scale_args = {
-            "data":
-            torch.empty(
+            "data": torch.empty(
                 scales_and_zp_size,
                 output_size_per_partition,
                 dtype=params_dtype,
             ),
-            "weight_loader":
-            weight_loader
+            "weight_loader": weight_loader,
         }
 
         if scales_and_zp_input_dim is None:
-            scales = ChannelQuantScaleParameter(output_dim=1,
-                                                **weight_scale_args)
+            scales = ChannelQuantScaleParameter(output_dim=1, **weight_scale_args)
             qzeros = PackedColumnParameter(
                 output_dim=1,
                 packed_dim=1,
                 packed_factor=self.quant_config.pack_factor,
-                **qzeros_args)
+                **qzeros_args,
+            )
 
         else:
-            scales = GroupQuantScaleParameter(output_dim=1,
-                                              input_dim=0,
-                                              **weight_scale_args)
+            scales = GroupQuantScaleParameter(
+                output_dim=1, input_dim=0, **weight_scale_args
+            )
             qzeros = PackedvLLMParameter(
                 input_dim=0,
                 output_dim=1,
                 packed_dim=1,
                 packed_factor=self.quant_config.pack_factor,
-                **qzeros_args)
+                **qzeros_args,
+            )
 
         layer.register_parameter("qweight", qweight)
         layer.register_parameter("g_idx", g_idx)
         layer.register_parameter("scales", scales)
         layer.register_parameter("qzeros", qzeros)
 
-        self.kernel = kernel_type(mp_linear_kernel_config,
-                                  w_q_param_name="qweight",
-                                  w_s_param_name="scales",
-                                  w_zp_param_name="qzeros",
-                                  w_gidx_param_name="g_idx")
+        self.kernel = kernel_type(
+            mp_linear_kernel_config,
+            w_q_param_name="qweight",
+            w_s_param_name="scales",
+            w_zp_param_name="qzeros",
+            w_gidx_param_name="g_idx",
+        )
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         self.kernel.process_weights_after_loading(layer)
@@ -437,8 +479,7 @@ def __init__(
         elif self.quant_config.quant_type.size_bits == 8:
             self.quant_type = scalar_types.uint8b128
         else:
-            raise ValueError(
-                "GPTQMarlinMoEMethod only supports int4 and int8 now.")
+            raise ValueError("GPTQMarlinMoEMethod only supports int4 and int8 now.")
 
     def create_weights(
         self,
@@ -449,28 +490,27 @@ def create_weights(
         params_dtype: torch.dtype,
         **extra_weight_attrs,
     ):
-        intermediate_size_full = extra_weight_attrs.pop(
-            "intermediate_size_full")
+        intermediate_size_full = extra_weight_attrs.pop("intermediate_size_full")
 
         self.is_k_full = (not self.quant_config.desc_act) or (
-            intermediate_size_per_partition == intermediate_size_full)
+            intermediate_size_per_partition == intermediate_size_full
+        )
 
         if self.quant_config.group_size != -1:
             scales_size13 = hidden_size // self.quant_config.group_size
-            w2_scales_size = (intermediate_size_full
-                              if self.quant_config.desc_act else
-                              intermediate_size_per_partition)
-            scales_size2 = (w2_scales_size // self.quant_config.group_size)
+            w2_scales_size = (
+                intermediate_size_full
+                if self.quant_config.desc_act
+                else intermediate_size_per_partition
+            )
+            scales_size2 = w2_scales_size // self.quant_config.group_size
             strategy = FusedMoeWeightScaleSupported.GROUP.value
         else:
             scales_size13 = 1
             scales_size2 = 1
             strategy = FusedMoeWeightScaleSupported.CHANNEL.value
 
-        extra_weight_attrs.update({
-            "quant_method": strategy,
-            "is_transposed": True
-        })
+        extra_weight_attrs.update({"quant_method": strategy, "is_transposed": True})
         # Fused gate_up_proj (column parallel)
         w13_qweight = torch.nn.Parameter(
             torch.empty(
@@ -487,8 +527,7 @@ def create_weights(
         w2_qweight = torch.nn.Parameter(
             torch.empty(
                 num_experts,
-                intermediate_size_per_partition //
-                self.quant_config.pack_factor,
+                intermediate_size_per_partition // self.quant_config.pack_factor,
                 hidden_size,
                 dtype=torch.int32,
             ),
@@ -498,51 +537,51 @@ def create_weights(
         set_weight_attrs(w2_qweight, extra_weight_attrs)
         # up_proj scales
         w13_scales = torch.nn.Parameter(
-            torch.empty(num_experts,
-                        scales_size13,
-                        2 * intermediate_size_per_partition,
-                        dtype=params_dtype),
+            torch.empty(
+                num_experts,
+                scales_size13,
+                2 * intermediate_size_per_partition,
+                dtype=params_dtype,
+            ),
             requires_grad=False,
         )
         layer.register_parameter("w13_scales", w13_scales)
         set_weight_attrs(w13_scales, extra_weight_attrs)
         # down_proj scales
         w2_scales = torch.nn.Parameter(
-            torch.empty(num_experts,
-                        scales_size2,
-                        hidden_size,
-                        dtype=params_dtype),
+            torch.empty(num_experts, scales_size2, hidden_size, dtype=params_dtype),
             requires_grad=False,
         )
         layer.register_parameter("w2_scales", w2_scales)
         set_weight_attrs(w2_scales, extra_weight_attrs)
         # don't shard the w2 scales when running act order
-        set_weight_attrs(w2_scales,
-                         {"load_full_w2": self.quant_config.desc_act})
+        set_weight_attrs(w2_scales, {"load_full_w2": self.quant_config.desc_act})
         # up_proj scales
         w13_qzeros = torch.nn.Parameter(
-            torch.empty(num_experts,
-                        scales_size13,
-                        2 * intermediate_size_per_partition //
-                        self.quant_config.pack_factor,
-                        dtype=params_dtype),
+            torch.empty(
+                num_experts,
+                scales_size13,
+                2 * intermediate_size_per_partition // self.quant_config.pack_factor,
+                dtype=params_dtype,
+            ),
             requires_grad=False,
         )
         layer.register_parameter("w13_qzeros", w13_qzeros)
         set_weight_attrs(w13_qzeros, extra_weight_attrs)
         # down_proj scales
         w2_qzeros = torch.nn.Parameter(
-            torch.empty(num_experts,
-                        scales_size2,
-                        hidden_size // self.quant_config.pack_factor,
-                        dtype=params_dtype),
+            torch.empty(
+                num_experts,
+                scales_size2,
+                hidden_size // self.quant_config.pack_factor,
+                dtype=params_dtype,
+            ),
             requires_grad=False,
         )
         layer.register_parameter("w2_qzeros", w2_qzeros)
         set_weight_attrs(w2_qzeros, extra_weight_attrs)
         # don't shard the w2 scales when running act order
-        set_weight_attrs(w2_qzeros,
-                         {"load_full_w2": self.quant_config.desc_act})
+        set_weight_attrs(w2_qzeros, {"load_full_w2": self.quant_config.desc_act})
         w13_g_idx = torch.nn.Parameter(
             torch.empty(
                 num_experts,
@@ -571,8 +610,7 @@ def create_weights(
             ),
             requires_grad=False,
         )
-        layer.register_parameter("w13_g_idx_sort_indices",
-                                 w13_g_idx_sort_indices)
+        layer.register_parameter("w13_g_idx_sort_indices", w13_g_idx_sort_indices)
         set_weight_attrs(w13_g_idx_sort_indices, extra_weight_attrs)
         w2_g_idx_sort_indices = torch.nn.Parameter(
             torch.empty(
@@ -582,15 +620,13 @@ def create_weights(
             ),
             requires_grad=False,
         )
-        layer.register_parameter("w2_g_idx_sort_indices",
-                                 w2_g_idx_sort_indices)
+        layer.register_parameter("w2_g_idx_sort_indices", w2_g_idx_sort_indices)
         set_weight_attrs(w2_g_idx_sort_indices, extra_weight_attrs)
 
         device = layer.w13_qweight.device
         layer.workspace = marlin_make_workspace_new(device, 4)
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
-
         # Process act_order
         if self.quant_config.desc_act:
             # Get sorting based on g_idx
@@ -600,42 +636,36 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             w13_sorted_g_idx = torch.empty_like(layer.w13_g_idx)
             w2_sorted_g_idx = torch.empty_like(layer.w2_g_idx)
             for e in range(num_experts):
-                w13_g_idx_sort_indices[e] = torch.argsort(
-                    layer.w13_g_idx[e]).to(torch.int32)
+                w13_g_idx_sort_indices[e] = torch.argsort(layer.w13_g_idx[e]).to(
+                    torch.int32
+                )
                 w2_g_idx_sort_indices[e] = torch.argsort(layer.w2_g_idx[e]).to(
-                    torch.int32)
-                w13_sorted_g_idx[e] = layer.w13_g_idx[e][
-                    w13_g_idx_sort_indices[e]]
-                w2_sorted_g_idx[e] = layer.w2_g_idx[e][
-                    w2_g_idx_sort_indices[e]]
+                    torch.int32
+                )
+                w13_sorted_g_idx[e] = layer.w13_g_idx[e][w13_g_idx_sort_indices[e]]
+                w2_sorted_g_idx[e] = layer.w2_g_idx[e][w2_g_idx_sort_indices[e]]
             replace_parameter(layer, "w13_g_idx", w13_sorted_g_idx)
             replace_parameter(layer, "w2_g_idx", w2_sorted_g_idx)
-            replace_parameter(layer, "w13_g_idx_sort_indices",
-                              w13_g_idx_sort_indices)
-            replace_parameter(layer, "w2_g_idx_sort_indices",
-                              w2_g_idx_sort_indices)
+            replace_parameter(layer, "w13_g_idx_sort_indices", w13_g_idx_sort_indices)
+            replace_parameter(layer, "w2_g_idx_sort_indices", w2_g_idx_sort_indices)
         else:
             # Reset g_idx related tensors
             num_experts = layer.w13_g_idx.shape[0]
             device = layer.w13_g_idx.device
             layer.w13_g_idx = torch.nn.Parameter(
-                torch.empty((num_experts, 0), dtype=torch.int32,
-                            device=device),
+                torch.empty((num_experts, 0), dtype=torch.int32, device=device),
                 requires_grad=False,
             )
             layer.w2_g_idx = torch.nn.Parameter(
-                torch.empty((num_experts, 0), dtype=torch.int32,
-                            device=device),
+                torch.empty((num_experts, 0), dtype=torch.int32, device=device),
                 requires_grad=False,
             )
             layer.w13_g_idx_sort_indices = torch.nn.Parameter(
-                torch.empty((num_experts, 0), dtype=torch.int32,
-                            device=device),
+                torch.empty((num_experts, 0), dtype=torch.int32, device=device),
                 requires_grad=False,
             )
             layer.w2_g_idx_sort_indices = torch.nn.Parameter(
-                torch.empty((num_experts, 0), dtype=torch.int32,
-                            device=device),
+                torch.empty((num_experts, 0), dtype=torch.int32, device=device),
                 requires_grad=False,
             )
         # Repack weights
@@ -665,9 +695,12 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         replace_parameter(layer, "w13_scales", marlin_w13_scales)
         marlin_w2_scales = marlin_moe_permute_scales(
             s=layer.w2_scales,
-            size_k=layer.w2_scales.shape[1] *
-            (self.quant_config.group_size if self.quant_config.group_size != -1
-             else self.quant_config.pack_factor),
+            size_k=layer.w2_scales.shape[1]
+            * (
+                self.quant_config.group_size
+                if self.quant_config.group_size != -1
+                else self.quant_config.pack_factor
+            ),
             size_n=layer.w2_scales.shape[2],
             group_size=self.quant_config.group_size,
         )
@@ -680,7 +713,8 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             layer.w2_bias.data = marlin_permute_bias(layer.w2_bias)
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         return None
 
     def apply(
@@ -710,7 +744,8 @@ def apply(
 
         if enable_eplb:
             raise NotImplementedError(
-                "EPLB not supported for `GPTQMarlinMoEMethod` yet.")
+                "EPLB not supported for `GPTQMarlinMoEMethod` yet."
+            )
 
         assert activation == "silu", "Only SiLU activation is supported."
 
@@ -726,7 +761,8 @@ def apply(
             scoring_func=scoring_func,
             routed_scaling_factor=routed_scaling_factor,
             e_score_correction_bias=e_score_correction_bias,
-            indices_type=self.topk_indices_dtype)
+            indices_type=self.topk_indices_dtype,
+        )
 
         return torch.ops.vllm.fused_marlin_moe(
             x,
@@ -748,4 +784,5 @@ def apply(
             sort_indices1=layer.w13_g_idx_sort_indices,
             sort_indices2=layer.w2_g_idx_sort_indices,
             workspace=layer.workspace,
-            is_k_full=self.is_k_full)
+            is_k_full=self.is_k_full,
+        )
diff --git a/vllm/model_executor/layers/quantization/gptq_marlin_24.py b/vllm/model_executor/layers/quantization/gptq_marlin_24.py
index 6b9e3effc29d..8f0df55b0a5c 100644
--- a/vllm/model_executor/layers/quantization/gptq_marlin_24.py
+++ b/vllm/model_executor/layers/quantization/gptq_marlin_24.py
@@ -9,12 +9,16 @@
 from vllm import _custom_ops as ops
 from vllm.logger import init_logger
 from vllm.model_executor.layers.linear import LinearBase, LinearMethodBase
-from vllm.model_executor.layers.quantization import (QuantizationConfig,
-                                                     QuantizationMethods)
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           ChannelQuantScaleParameter,
-                                           GroupQuantScaleParameter,
-                                           PackedvLLMParameter)
+from vllm.model_executor.layers.quantization import (
+    QuantizationConfig,
+    QuantizationMethods,
+)
+from vllm.model_executor.parameter import (
+    BasevLLMParameter,
+    ChannelQuantScaleParameter,
+    GroupQuantScaleParameter,
+    PackedvLLMParameter,
+)
 from vllm.scalar_type import scalar_types
 
 logger = init_logger(__name__)
@@ -24,15 +28,12 @@
 GPTQ_MARLIN_24_MIN_THREAD_K = 128
 GPTQ_MARLIN_24_MAX_PARALLEL = 64
 
-GPTQ_MARLIN_24_SUPPORTED_QUANT_TYPES = [
-    scalar_types.uint4b8, scalar_types.uint8b128
-]
+GPTQ_MARLIN_24_SUPPORTED_QUANT_TYPES = [scalar_types.uint4b8, scalar_types.uint8b128]
 GPTQ_MARLIN_24_SUPPORTED_GROUP_SIZES = [-1, 128]
 
 
 class GPTQMarlin24Config(QuantizationConfig):
-    """Config class for Marlin24.
-    """
+    """Config class for Marlin24."""
 
     def __init__(
         self,
@@ -48,17 +49,18 @@ def __init__(
         self.group_size = group_size
 
         # Verify
-        if quant_type is None or \
-            quant_type not in GPTQ_MARLIN_24_SUPPORTED_QUANT_TYPES:
+        if quant_type is None or quant_type not in GPTQ_MARLIN_24_SUPPORTED_QUANT_TYPES:
             raise ValueError(
                 f"Marlin_24 does not support quant_type = {quant_type}. "
                 f"Only weight_bits = {GPTQ_MARLIN_24_SUPPORTED_QUANT_TYPES} "
-                "are supported.")
+                "are supported."
+            )
         if self.group_size not in GPTQ_MARLIN_24_SUPPORTED_GROUP_SIZES:
             raise ValueError(
                 f"Marlin_24 does not support group_size = {self.group_size}. "
                 f"Only group_sizes = {GPTQ_MARLIN_24_SUPPORTED_GROUP_SIZES} "
-                "are supported.")
+                "are supported."
+            )
 
         self.quant_type = quant_type
 
@@ -83,7 +85,8 @@ def __init__(
 
     def __repr__(self) -> str:
         return "Marlin24Config(quant_type={}, group_size={})".format(
-            self.quant_type, self.group_size)
+            self.quant_type, self.group_size
+        )
 
     @classmethod
     def get_name(cls) -> QuantizationMethods:
@@ -110,23 +113,26 @@ def from_config(cls, config: dict[str, Any]) -> "GPTQMarlin24Config":
 
     @classmethod
     def override_quantization_method(
-            cls, hf_quant_cfg, user_quant) -> Optional[QuantizationMethods]:
-        is_marlin_24_format = (
-            hf_quant_cfg.get("checkpoint_format") == "marlin_24")
+        cls, hf_quant_cfg, user_quant
+    ) -> Optional[QuantizationMethods]:
+        is_marlin_24_format = hf_quant_cfg.get("checkpoint_format") == "marlin_24"
 
-        is_valid_user_quant = (user_quant is None or user_quant == "gptq"
-                               or user_quant == "gptq_marlin_24")
+        is_valid_user_quant = (
+            user_quant is None or user_quant == "gptq" or user_quant == "gptq_marlin_24"
+        )
 
         if is_marlin_24_format and is_valid_user_quant:
-            msg = ("The model is serialized in {} format. "
-                   "Using {} kernel.".format(cls.get_name(), cls.get_name()))
+            msg = "The model is serialized in {} format. Using {} kernel.".format(
+                cls.get_name(), cls.get_name()
+            )
             logger.info(msg)
             return cls.get_name()
 
         return None
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["GPTQMarlin24LinearMethod"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["GPTQMarlin24LinearMethod"]:
         if isinstance(layer, LinearBase):
             return GPTQMarlin24LinearMethod(self)
         return None
@@ -156,7 +162,8 @@ def create_weights(
         weight_loader = extra_weight_attrs["weight_loader"]
         if params_dtype != torch.float16:
             raise ValueError(
-                f"The params dtype must be float16, but got {params_dtype}")
+                f"The params dtype must be float16, but got {params_dtype}"
+            )
 
         # Validate output_size_per_partition
         output_size_per_partition = sum(output_partition_sizes)
@@ -164,38 +171,46 @@ def create_weights(
             raise ValueError(
                 f"Weight output_size_per_partition = "
                 f"{output_size_per_partition} is not divisible by "
-                f"min_n_threads = {self.quant_config.min_n_threads}.")
+                f"min_n_threads = {self.quant_config.min_n_threads}."
+            )
         if output_size_per_partition % self.quant_config.pack_factor != 0:
             raise ValueError(
                 f"Weight output_size_per_partition = "
                 f"{output_size_per_partition} is not divisible by "
-                f"pack_factor = {self.quant_config.pack_factor}.")
+                f"pack_factor = {self.quant_config.pack_factor}."
+            )
 
         # Validate input_size_per_partition
         if input_size_per_partition % self.quant_config.min_k_threads != 0:
             raise ValueError(
                 f"Weight input_size_per_partition = "
                 f"{input_size_per_partition} is not divisible by "
-                f"min_k_threads = {self.quant_config.min_k_threads}.")
-        if (self.quant_config.group_size != -1 and
-                input_size_per_partition % self.quant_config.group_size != 0):
-            raise ValueError(f"Weight input_size_per_partition = "
-                             f"{input_size_per_partition} is not divisible by "
-                             f"group_size = {self.quant_config.group_size}.")
+                f"min_k_threads = {self.quant_config.min_k_threads}."
+            )
+        if (
+            self.quant_config.group_size != -1
+            and input_size_per_partition % self.quant_config.group_size != 0
+        ):
+            raise ValueError(
+                f"Weight input_size_per_partition = "
+                f"{input_size_per_partition} is not divisible by "
+                f"group_size = {self.quant_config.group_size}."
+            )
 
         # Check that we have at least 4 tiles horizontally in the shard
         num_tiles_per_perm = self.quant_config.perm_len // (
-            self.quant_config.tile_size**2)
+            self.quant_config.tile_size**2
+        )
         if output_size_per_partition % num_tiles_per_perm != 0:
-            raise ValueError(
-                "Each permutation group must reside on the same gpu")
+            raise ValueError("Each permutation group must reside on the same gpu")
 
         # Quantized 4Bit weights packed into Int32.
         qweight = PackedvLLMParameter(
             data=torch.empty(
                 input_size_per_partition // self.quant_config.tile_size // 2,
-                output_size_per_partition * self.quant_config.tile_size //
-                self.quant_config.pack_factor,
+                output_size_per_partition
+                * self.quant_config.tile_size
+                // self.quant_config.pack_factor,
                 device="cuda",
                 dtype=torch.int32,
             ),
@@ -204,55 +219,57 @@ def create_weights(
             packed_dim=1,
             packed_factor=self.quant_config.pack_factor,
             marlin_tile_size=self.quant_config.tile_size,
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
 
         # Meta
-        meta = PackedvLLMParameter(data=torch.empty(
-            input_size_per_partition // 8 // 2 // 2,
-            output_size_per_partition * 2,
-            device="cuda",
-            dtype=torch.int16,
-        ),
-                                   input_dim=0,
-                                   output_dim=1,
-                                   packed_dim=1,
-                                   packed_factor=1,
-                                   marlin_tile_size=2,
-                                   weight_loader=weight_loader)
+        meta = PackedvLLMParameter(
+            data=torch.empty(
+                input_size_per_partition // 8 // 2 // 2,
+                output_size_per_partition * 2,
+                device="cuda",
+                dtype=torch.int16,
+            ),
+            input_dim=0,
+            output_dim=1,
+            packed_dim=1,
+            packed_factor=1,
+            marlin_tile_size=2,
+            weight_loader=weight_loader,
+        )
 
         # Determine if channelwise or not
-        input_groups = (1 if self.quant_config.group_size == -1 else
-                        input_size_per_partition //
-                        self.quant_config.group_size)
+        input_groups = (
+            1
+            if self.quant_config.group_size == -1
+            else input_size_per_partition // self.quant_config.group_size
+        )
 
         weight_scale_args = {
-            "data":
-            torch.empty(
+            "data": torch.empty(
                 input_groups,
                 output_size_per_partition,
                 device="cuda",
                 dtype=params_dtype,
             ),
-            "weight_loader":
-            weight_loader
+            "weight_loader": weight_loader,
         }
         if input_groups == 1:
-            scales = ChannelQuantScaleParameter(output_dim=1,
-                                                **weight_scale_args)
+            scales = ChannelQuantScaleParameter(output_dim=1, **weight_scale_args)
         else:
-            scales = GroupQuantScaleParameter(output_dim=1,
-                                              input_dim=0,
-                                              **weight_scale_args)
+            scales = GroupQuantScaleParameter(
+                output_dim=1, input_dim=0, **weight_scale_args
+            )
 
         # Allocate workspace (Used for internal locking mechanism)
         max_workspace_size = (
-            output_size_per_partition //
-            self.quant_config.min_n_threads) * self.quant_config.max_parallel
+            output_size_per_partition // self.quant_config.min_n_threads
+        ) * self.quant_config.max_parallel
 
-        workspace = BasevLLMParameter(data=torch.zeros(max_workspace_size,
-                                                       device="cuda",
-                                                       dtype=torch.int),
-                                      weight_loader=weight_loader)
+        workspace = BasevLLMParameter(
+            data=torch.zeros(max_workspace_size, device="cuda", dtype=torch.int),
+            weight_loader=weight_loader,
+        )
 
         layer.register_parameter("B_24", qweight)
         layer.register_parameter("B_meta", meta)
@@ -283,12 +300,19 @@ def apply(
         size_k = x_2d.shape[1]
         size_n = scales.shape[1]
 
-        output_2d = ops.gptq_marlin_24_gemm(x_2d, qweight, meta, scales,
-                                            workspace,
-                                            self.quant_config.quant_type,
-                                            size_m, size_n, size_k)
-
-        output = output_2d.view(x.shape[:-1] + (output_2d.shape[1], ))
+        output_2d = ops.gptq_marlin_24_gemm(
+            x_2d,
+            qweight,
+            meta,
+            scales,
+            workspace,
+            self.quant_config.quant_type,
+            size_m,
+            size_n,
+            size_k,
+        )
+
+        output = output_2d.view(x.shape[:-1] + (output_2d.shape[1],))
 
         if bias is not None:
             output.add_(bias)  # In-place add
diff --git a/vllm/model_executor/layers/quantization/hqq_marlin.py b/vllm/model_executor/layers/quantization/hqq_marlin.py
index 8385ccac32a2..e61caf6b459b 100644
--- a/vllm/model_executor/layers/quantization/hqq_marlin.py
+++ b/vllm/model_executor/layers/quantization/hqq_marlin.py
@@ -7,20 +7,32 @@
 
 from vllm import _custom_ops as ops
 from vllm.logger import init_logger
-from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
-                                               UnquantizedLinearMethod)
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    LinearMethodBase,
+    UnquantizedLinearMethod,
+)
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-    GPTQ_MARLIN_MAX_PARALLEL, GPTQ_MARLIN_MIN_THREAD_N,
-    marlin_make_empty_g_idx, marlin_permute_bias, marlin_permute_scales)
+    GPTQ_MARLIN_MAX_PARALLEL,
+    GPTQ_MARLIN_MIN_THREAD_N,
+    marlin_make_empty_g_idx,
+    marlin_permute_bias,
+    marlin_permute_scales,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_test import (
-    MarlinWorkspace)
+    MarlinWorkspace,
+)
 from vllm.model_executor.layers.quantization.utils.quant_utils import gptq_pack
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           GroupQuantScaleParameter,
-                                           PackedvLLMParameter)
+from vllm.model_executor.parameter import (
+    BasevLLMParameter,
+    GroupQuantScaleParameter,
+    PackedvLLMParameter,
+)
 from vllm.scalar_type import scalar_types
 
 logger = init_logger(__name__)
@@ -36,10 +48,10 @@ def __init__(
         skip_modules: Optional[list[str]] = None,
     ) -> None:
         super().__init__()
-        assert group_size == 64, ("The only supported HQQ group size is "
-                                  "currently 64.")
-        assert weight_bits == 4, ("The only supported HQQ quantization "
-                                  "bitsize is currently 4.")
+        assert group_size == 64, "The only supported HQQ group size is currently 64."
+        assert weight_bits == 4, (
+            "The only supported HQQ quantization bitsize is currently 4."
+        )
 
         self.weight_bits = weight_bits
         self.group_size = group_size
@@ -48,8 +60,10 @@ def __init__(
         self.skip_modules = skip_modules
 
     def __repr__(self) -> str:
-        return (f"HQQMarlinConfig(quant_type={self.quant_type}, "
-                f"group_size={self.group_size})")
+        return (
+            f"HQQMarlinConfig(quant_type={self.quant_type}, "
+            f"group_size={self.group_size})"
+        )
 
     @classmethod
     def get_name(cls) -> QuantizationMethods:
@@ -69,7 +83,7 @@ def get_config_filenames(cls) -> list[str]:
 
     @classmethod
     def from_config(cls, config: dict[str, Any]) -> "HQQMarlinConfig":
-        wq_params = (config["quant_config"]["weight_quant_params"])
+        wq_params = config["quant_config"]["weight_quant_params"]
         weight_bits = cls.get_from_keys(wq_params, ["nbits"])
         group_size = cls.get_from_keys(wq_params, ["group_size"])
         skip_modules = config["skip_modules"]
@@ -77,14 +91,16 @@ def from_config(cls, config: dict[str, Any]) -> "HQQMarlinConfig":
 
     def is_layer_skipped(self, prefix: str) -> bool:
         # Split the prefix into its dot-separated components
-        components = prefix.split('.')
+        components = prefix.split(".")
 
         # Check if any of the skip modules exactly matches any component
         return self.skip_modules is not None and any(
-            module_name in components for module_name in self.skip_modules)
+            module_name in components for module_name in self.skip_modules
+        )
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         if isinstance(layer, LinearBase):
             if self.is_layer_skipped(prefix):
                 return UnquantizedLinearMethod()
@@ -94,7 +110,6 @@ def get_quant_method(self, layer: torch.nn.Module,
 
 # Empty HQQ parameter, will be ignored during loading
 class HQQEmptyParameter(BasevLLMParameter):
-
     def load_merged_column_weight(self, loaded_weight: torch.Tensor, **kwargs):
         pass
 
@@ -112,23 +127,18 @@ def error_loader(param: torch.Tensor, loaded_weight: torch.Tensor) -> None:
 # HQQ packing creates issues with sharding - therefore, prior to loading, we
 # repack to GPTQ. We also reshape the weights to their proper GPTQ shape.
 class HQQweightParameter(PackedvLLMParameter):
-
     # unpack function from https://github.com/mobiusml/hqq
-    def unpack_4bit_u8(self,
-                       W_q: torch.Tensor) -> torch.Tensor:  # uint8/2 > uint8
+    def unpack_4bit_u8(self, W_q: torch.Tensor) -> torch.Tensor:  # uint8/2 > uint8
         assert self.weight_bits == 4, "Unsupported quant bitsize (must be 4)"
 
         dtype = torch.uint8
         step = W_q.shape[0]
-        tmp = torch.empty([2 * step, W_q.shape[1]],
-                          dtype=dtype,
-                          device=W_q.device)
+        tmp = torch.empty([2 * step, W_q.shape[1]], dtype=dtype, device=W_q.device)
         tmp[:step] = (W_q & 0b11110000) >> 4
         tmp[step:] = W_q & 0b00001111
         return tmp
 
-    def __init__(self, packed_factor: int, packed_dim: int, weight_bits: int,
-                 **kwargs):
+    def __init__(self, packed_factor: int, packed_dim: int, weight_bits: int, **kwargs):
         super().__init__(packed_factor, packed_dim, None, **kwargs)
         self.weight_bits = weight_bits
         self.input_shape = self.shape[self.input_dim] * self.packed_factor
@@ -136,36 +146,41 @@ def __init__(self, packed_factor: int, packed_dim: int, weight_bits: int,
 
     def load_merged_column_weight(self, loaded_weight: torch.Tensor, **kwargs):
         loaded_weight = self.unpack_4bit_u8(loaded_weight)
-        loaded_weight = loaded_weight.reshape(-1, self.input_shape).transpose(
-            1, 0)
-        loaded_weight = gptq_pack(loaded_weight, self.weight_bits,
-                                  loaded_weight.shape[0],
-                                  loaded_weight.shape[1])
+        loaded_weight = loaded_weight.reshape(-1, self.input_shape).transpose(1, 0)
+        loaded_weight = gptq_pack(
+            loaded_weight,
+            self.weight_bits,
+            loaded_weight.shape[0],
+            loaded_weight.shape[1],
+        )
         super().load_merged_column_weight(loaded_weight, **kwargs)
 
     def load_row_parallel_weight(self, loaded_weight: torch.Tensor):
         loaded_weight = self.unpack_4bit_u8(loaded_weight)
-        loaded_weight = loaded_weight.reshape(self.output_shape,
-                                              -1).transpose(1, 0)
-        loaded_weight = gptq_pack(loaded_weight, self.weight_bits,
-                                  loaded_weight.shape[0],
-                                  loaded_weight.shape[1])
+        loaded_weight = loaded_weight.reshape(self.output_shape, -1).transpose(1, 0)
+        loaded_weight = gptq_pack(
+            loaded_weight,
+            self.weight_bits,
+            loaded_weight.shape[0],
+            loaded_weight.shape[1],
+        )
         super().load_row_parallel_weight(loaded_weight)
 
     def load_qkv_weight(self, loaded_weight: torch.Tensor, **kwargs):
         loaded_weight = self.unpack_4bit_u8(loaded_weight)
-        loaded_weight = loaded_weight.reshape(-1, self.input_shape).transpose(
-            1, 0)
-        loaded_weight = gptq_pack(loaded_weight, self.weight_bits,
-                                  loaded_weight.shape[0],
-                                  loaded_weight.shape[1])
+        loaded_weight = loaded_weight.reshape(-1, self.input_shape).transpose(1, 0)
+        loaded_weight = gptq_pack(
+            loaded_weight,
+            self.weight_bits,
+            loaded_weight.shape[0],
+            loaded_weight.shape[1],
+        )
         super().load_qkv_weight(loaded_weight, **kwargs)
 
 
 # Zero points and scales in HQQ must also be reshaped to correspond to W_q's
 # GPTQ shape (transposed - we transpose them too when processing weights).
 class HQQZeroScaleParameter(GroupQuantScaleParameter):
-
     def load_merged_column_weight(self, loaded_weight: torch.Tensor, **kwargs):
         loaded_weight = loaded_weight.reshape(-1, self.shape[1])
         super().load_merged_column_weight(loaded_weight, **kwargs)
@@ -180,8 +195,7 @@ def load_qkv_weight(self, loaded_weight: torch.Tensor, **kwargs):
 
 
 class HQQMarlinMethod(LinearMethodBase):
-    """Linear method for HQQ Marlin.
-    """
+    """Linear method for HQQ Marlin."""
 
     def __init__(
         self,
@@ -204,8 +218,9 @@ def create_weights(
 
         weight_loader = extra_weight_attrs.get("weight_loader", error_loader)
 
-        self.scales_and_zp_size = (input_size_per_partition //
-                                   self.quant_config.group_size)
+        self.scales_and_zp_size = (
+            input_size_per_partition // self.quant_config.group_size
+        )
 
         qweight = HQQweightParameter(
             data=torch.empty(
@@ -218,25 +233,30 @@ def create_weights(
             packed_dim=0,
             packed_factor=self.quant_config.pack_factor,
             weight_bits=self.quant_config.weight_bits,
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
 
-        zeros = HQQZeroScaleParameter(data=torch.empty(
-            self.output_size_per_partition,
-            self.scales_and_zp_size,
-            dtype=params_dtype,
-        ),
-                                      input_dim=1,
-                                      output_dim=0,
-                                      weight_loader=weight_loader)
-
-        scales = HQQZeroScaleParameter(data=torch.empty(
-            self.output_size_per_partition,
-            self.scales_and_zp_size,
-            dtype=params_dtype,
-        ),
-                                       input_dim=1,
-                                       output_dim=0,
-                                       weight_loader=weight_loader)
+        zeros = HQQZeroScaleParameter(
+            data=torch.empty(
+                self.output_size_per_partition,
+                self.scales_and_zp_size,
+                dtype=params_dtype,
+            ),
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
+
+        scales = HQQZeroScaleParameter(
+            data=torch.empty(
+                self.output_size_per_partition,
+                self.scales_and_zp_size,
+                dtype=params_dtype,
+            ),
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
 
         layer.register_parameter("W_q", qweight)
         layer.register_parameter("zero", zeros)
@@ -244,17 +264,29 @@ def create_weights(
 
         # Ignore extra parameters in the HQQ model.
         # To be added as needed.
-        ignore_parameters = ("axis", "channel_wise", "compute_dtype",
-                             "encoded_state_dict", "group_size", "nbits",
-                             "offload_meta", "optimize", "packing",
-                             "quant_scale", "quant_zero", "round_zero",
-                             "shape", "stores_quant_config",
-                             "unpack_view_dtype", "view_as_float")
+        ignore_parameters = (
+            "axis",
+            "channel_wise",
+            "compute_dtype",
+            "encoded_state_dict",
+            "group_size",
+            "nbits",
+            "offload_meta",
+            "optimize",
+            "packing",
+            "quant_scale",
+            "quant_zero",
+            "round_zero",
+            "shape",
+            "stores_quant_config",
+            "unpack_view_dtype",
+            "view_as_float",
+        )
         for name in ignore_parameters:
             layer.register_parameter(
                 name,
-                HQQEmptyParameter(data=torch.empty(0),
-                                  weight_loader=weight_loader))
+                HQQEmptyParameter(data=torch.empty(0), weight_loader=weight_loader),
+            )
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         dev = layer.W_q.device
@@ -268,14 +300,18 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             self.output_size_per_partition,
             self.quant_config.weight_bits,
         ).to(dev)
-        marlin_s = marlin_permute_scales(layer.scale.transpose(1, 0),
-                                         self.input_size_per_partition,
-                                         self.output_size_per_partition,
-                                         self.quant_config.group_size).to(dev)
-        marlin_zp = marlin_permute_scales(layer.zero.transpose(1, 0),
-                                          self.input_size_per_partition,
-                                          self.output_size_per_partition,
-                                          self.quant_config.group_size).to(dev)
+        marlin_s = marlin_permute_scales(
+            layer.scale.transpose(1, 0),
+            self.input_size_per_partition,
+            self.output_size_per_partition,
+            self.quant_config.group_size,
+        ).to(dev)
+        marlin_zp = marlin_permute_scales(
+            layer.zero.transpose(1, 0),
+            self.input_size_per_partition,
+            self.output_size_per_partition,
+            self.quant_config.group_size,
+        ).to(dev)
 
         layer.g_idx = marlin_make_empty_g_idx(dev)
         layer.g_idx_sort_indices = marlin_make_empty_g_idx(dev)
@@ -293,9 +329,11 @@ def apply(
         x: torch.Tensor,
         bias: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-        workspace = MarlinWorkspace(self.output_size_per_partition,
-                                    GPTQ_MARLIN_MIN_THREAD_N,
-                                    GPTQ_MARLIN_MAX_PARALLEL)
+        workspace = MarlinWorkspace(
+            self.output_size_per_partition,
+            GPTQ_MARLIN_MIN_THREAD_N,
+            GPTQ_MARLIN_MAX_PARALLEL,
+        )
 
         scales = layer.marlin_scales
         zeros = layer.marlin_zeros
diff --git a/vllm/model_executor/layers/quantization/inc.py b/vllm/model_executor/layers/quantization/inc.py
index 8aa1f1a14bfc..4e736378e9da 100644
--- a/vllm/model_executor/layers/quantization/inc.py
+++ b/vllm/model_executor/layers/quantization/inc.py
@@ -21,12 +21,15 @@
 import torch
 
 from vllm.model_executor.layers.fused_moe.layer import (
-    FusedMoE, UnquantizedFusedMoEMethod)
-from vllm.model_executor.layers.linear import (LinearBase,
-                                               UnquantizedLinearMethod)
+    FusedMoE,
+    UnquantizedFusedMoEMethod,
+)
+from vllm.model_executor.layers.linear import LinearBase, UnquantizedLinearMethod
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 
 
 class INCConfig(QuantizationConfig):
@@ -44,8 +47,9 @@ def get_supported_act_dtypes(cls) -> list[torch.dtype]:
     def from_config(cls, config: dict[str, Any]) -> "INCConfig":
         raise AssertionError
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         if isinstance(layer, LinearBase):
             return UnquantizedLinearMethod()
         elif isinstance(layer, FusedMoE):
diff --git a/vllm/model_executor/layers/quantization/input_quant_fp8.py b/vllm/model_executor/layers/quantization/input_quant_fp8.py
index ece3e5817116..8786638869a4 100644
--- a/vllm/model_executor/layers/quantization/input_quant_fp8.py
+++ b/vllm/model_executor/layers/quantization/input_quant_fp8.py
@@ -7,8 +7,7 @@
 
 from vllm import _custom_ops as ops
 from vllm.model_executor.custom_op import CustomOp
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape)
+from vllm.model_executor.layers.quantization.utils.quant_utils import GroupShape
 from vllm.platforms import current_platform
 
 # Using the default value (240.0) from pytorch will cause accuracy
@@ -28,12 +27,12 @@ class QuantFP8(CustomOp):
     """
 
     def __init__(
-            self,
-            static: bool,
-            group_shape: GroupShape,
-            num_token_padding: Optional[int] = None,
-            column_major_scales: bool = False,
-            use_ue8m0: Optional[bool] = None,  # for Torch compile
+        self,
+        static: bool,
+        group_shape: GroupShape,
+        num_token_padding: Optional[int] = None,
+        column_major_scales: bool = False,
+        use_ue8m0: Optional[bool] = None,  # for Torch compile
     ):
         """
         :param static: static or dynamic quantization
@@ -57,8 +56,9 @@ def __init__(
             self.group_size = group_shape.col
         else:
             assert group_shape in {GroupShape.PER_TOKEN, GroupShape.PER_TENSOR}
-            assert not static or group_shape == GroupShape.PER_TENSOR, \
+            assert not static or group_shape == GroupShape.PER_TENSOR, (
                 "Only per-tensor scales supported for static quantization."
+            )
             self.use_per_token_if_dynamic = group_shape == GroupShape.PER_TOKEN
 
     def forward_cuda(
@@ -70,23 +70,28 @@ def forward_cuda(
         if self.is_group_quant:
             assert scale is None, "Group quantization is always dynamic"
             from vllm.model_executor.layers.quantization.utils import fp8_utils
+
             return fp8_utils.per_token_group_quant_fp8(
                 x,
                 group_size=self.group_size,
                 column_major_scales=self.column_major_scales,
                 dtype=_FP8_DTYPE,
-                use_ue8m0=self.use_ue8m0)
+                use_ue8m0=self.use_ue8m0,
+            )
 
         assert (scale is not None) == self.static
-        assert scale_ub is None or (not self.static and self.group_shape
-                                    == GroupShape.PER_TOKEN
-                                    and scale_ub.numel() == 1)
+        assert scale_ub is None or (
+            not self.static
+            and self.group_shape == GroupShape.PER_TOKEN
+            and scale_ub.numel() == 1
+        )
         return ops.scaled_fp8_quant(
             x,
             scale,
             num_token_padding=self.num_token_padding,
             scale_ub=scale_ub,
-            use_per_token_if_dynamic=self.use_per_token_if_dynamic)
+            use_per_token_if_dynamic=self.use_per_token_if_dynamic,
+        )
 
     def forward_native(
         self,
@@ -99,9 +104,11 @@ def forward_native(
             return self._quantize_group_native(x)
 
         assert (scale is not None) == self.static
-        assert scale_ub is None or (not self.static and self.group_shape
-                                    == GroupShape.PER_TOKEN
-                                    and scale_ub.numel() == 1)
+        assert scale_ub is None or (
+            not self.static
+            and self.group_shape == GroupShape.PER_TOKEN
+            and scale_ub.numel() == 1
+        )
 
         if scale is None:
             if self.group_shape == GroupShape.PER_TOKEN:
@@ -130,7 +137,8 @@ def forward_native(
         return out, scale
 
     def _quantize_group_native(
-            self, x: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+        self, x: torch.Tensor
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         orig_shape = x.shape
         hidden_dim = x.shape[-1]
         num_groups = (hidden_dim + self.group_size - 1) // self.group_size
@@ -138,7 +146,7 @@ def _quantize_group_native(
 
         if padded_dim != hidden_dim:
             padding = padded_dim - hidden_dim
-            x = F.pad(x, (0, padding), mode='constant', value=0.0)
+            x = F.pad(x, (0, padding), mode="constant", value=0.0)
 
         x_grouped = x.view(-1, num_groups, self.group_size)
         absmax = x_grouped.abs().max(dim=-1, keepdim=True)[0].float()
@@ -156,7 +164,7 @@ def _quantize_group_native(
         x_quant = x_quant.view(orig_shape)
 
         scales = scales.squeeze(-1)
-        scales = scales.reshape(orig_shape[:-1] + (num_groups, ))
+        scales = scales.reshape(orig_shape[:-1] + (num_groups,))
 
         if self.column_major_scales:
             scales = scales.transpose(-2, -1).contiguous().transpose(-1, -2)
diff --git a/vllm/model_executor/layers/quantization/ipex_quant.py b/vllm/model_executor/layers/quantization/ipex_quant.py
index 353942cdd591..4aa0e464e0f5 100644
--- a/vllm/model_executor/layers/quantization/ipex_quant.py
+++ b/vllm/model_executor/layers/quantization/ipex_quant.py
@@ -9,17 +9,25 @@
 from torch.nn.parameter import Parameter
 
 from vllm._ipex_ops import ipex_ops as ops
-from vllm.model_executor.layers.fused_moe import (FusedMoEMethodBase,
-                                                  FusedMoeWeightScaleSupported)
+from vllm.model_executor.layers.fused_moe import (
+    FusedMoEMethodBase,
+    FusedMoeWeightScaleSupported,
+)
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
-from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
-                                               UnquantizedLinearMethod)
-from vllm.model_executor.layers.quantization import (QuantizationConfig,
-                                                     QuantizationMethods)
-from vllm.model_executor.layers.quantization.awq import (AWQLinearMethod,
-                                                         is_layer_skipped_awq)
-from vllm.model_executor.layers.quantization.fp8 import (Fp8Config,
-                                                         Fp8LinearMethod)
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    LinearMethodBase,
+    UnquantizedLinearMethod,
+)
+from vllm.model_executor.layers.quantization import (
+    QuantizationConfig,
+    QuantizationMethods,
+)
+from vllm.model_executor.layers.quantization.awq import (
+    AWQLinearMethod,
+    is_layer_skipped_awq,
+)
+from vllm.model_executor.layers.quantization.fp8 import Fp8Config, Fp8LinearMethod
 from vllm.model_executor.layers.quantization.gptq import GPTQLinearMethod
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.platforms import current_platform
@@ -56,17 +64,22 @@ def __init__(
         self.pack_factor = 32 // self.weight_bits
 
         if self.weight_bits not in [4]:
-            raise ValueError(f"IPEX quantization supports weight bits [4], "
-                             f"but got {self.weight_bits}.")
+            raise ValueError(
+                f"IPEX quantization supports weight bits [4], "
+                f"but got {self.weight_bits}."
+            )
 
         if self.method not in ["awq", "gptq"]:
-            raise ValueError(f"IPEX quantization supports [awq, gptq], "
-                             f"but got {self.method}.")
+            raise ValueError(
+                f"IPEX quantization supports [awq, gptq], but got {self.method}."
+            )
 
     def __repr__(self) -> str:
-        return (f"IPEXConfig(method={self.method},"
-                f"weight_bits={self.weight_bits}, "
-                f"group_size={self.group_size})")
+        return (
+            f"IPEXConfig(method={self.method},"
+            f"weight_bits={self.weight_bits}, "
+            f"group_size={self.group_size})"
+        )
 
     @classmethod
     def get_name(cls) -> QuantizationMethods:
@@ -92,24 +105,24 @@ def from_config(cls, config: dict[str, Any]) -> "IPEXConfig":
         method = cls.get_from_keys(config, ["quant_method"]).lower()
         if method == "awq":
             weight_bits = cls.get_from_keys(config, ["w_bit", "bits"])
-            group_size = cls.get_from_keys(config,
-                                           ["q_group_size", "group_size"])
+            group_size = cls.get_from_keys(config, ["q_group_size", "group_size"])
             modules_to_not_convert = cls.get_from_keys_or(
-                config, ["modules_to_not_convert"], None)
-            return cls(method, weight_bits, group_size, modules_to_not_convert,
-                       False, False)
+                config, ["modules_to_not_convert"], None
+            )
+            return cls(
+                method, weight_bits, group_size, modules_to_not_convert, False, False
+            )
         # otherwise for gptq
         weight_bits = cls.get_from_keys(config, ["bits"])
         group_size = cls.get_from_keys(config, ["group_size"])
-        lm_head_quantized = cls.get_from_keys_or(config, ["lm_head"],
-                                                 default=False)
+        lm_head_quantized = cls.get_from_keys_or(config, ["lm_head"], default=False)
         desc_act = cls.get_from_keys_or(config, ["desc_act"], default=False)
-        return cls(method, weight_bits, group_size, [], desc_act,
-                   lm_head_quantized)
+        return cls(method, weight_bits, group_size, [], desc_act, lm_head_quantized)
 
     @classmethod
     def override_quantization_method(
-            cls, hf_quant_cfg, user_quant) -> Optional[QuantizationMethods]:
+        cls, hf_quant_cfg, user_quant
+    ) -> Optional[QuantizationMethods]:
         if not current_platform.is_cpu() and not current_platform.is_xpu():
             return None
 
@@ -120,8 +133,9 @@ def override_quantization_method(
 
         return None
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["LinearMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["LinearMethodBase"]:
         if isinstance(layer, LinearBase):
             if self.method == "awq":
                 if is_layer_skipped_awq(prefix, self.modules_to_not_convert):
@@ -133,8 +147,7 @@ def get_quant_method(self, layer: torch.nn.Module,
 
 
 class IPEXGPTQLinearMethod(GPTQLinearMethod):
-    """GPTQ linear method using IPEX for the CPU/XPU backend.
-    """
+    """GPTQ linear method using IPEX for the CPU/XPU backend."""
 
     def __init__(self, quant_config: IPEXConfig):
         self.quant_config = quant_config  # type: ignore
@@ -144,18 +157,20 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
 
         try:
             import intel_extension_for_pytorch as ipex
-            if version.parse(
-                    ipex.__version__) < version.parse(MIN_IPEX_VERSION):
+
+            if version.parse(ipex.__version__) < version.parse(MIN_IPEX_VERSION):
                 raise ImportError(
                     "intel_extension_for_pytorch version is "
                     "wrong. Please install "
-                    f"intel_extension_for_pytorch>={MIN_IPEX_VERSION}.")
+                    f"intel_extension_for_pytorch>={MIN_IPEX_VERSION}."
+                )
         except ImportError as err:
             raise ImportError(
                 "Please install "
                 f"intel_extension_for_pytorch>={MIN_IPEX_VERSION} via "
                 f"`pip install intel_extension_for_pytorch>={MIN_IPEX_VERSION}`"
-                " to use IPEX-AWQ linear method.") from err
+                " to use IPEX-AWQ linear method."
+            ) from err
         # Using the compute dtype (lowp_mode) as INT8 to leverage instructions
         # with better performance.
         lowp_mode = ipex.quantization.WoqLowpMode.INT8
@@ -172,32 +187,34 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         )
         layer.ipex_output_size = layer.qweight.shape[-1]
         g_idx = layer.g_idx if self.quant_config.desc_act else None
-        layer.ipex_qlinear = ipex.llm.quantization.woq_linear. \
-            IPEXWeightOnlyQuantizedLinear.from_weight(
-            layer.qweight,
-            layer.scales,
-            layer.qzeros,
-            layer.qweight.size(0),
-            layer.ipex_output_size,
-            qconfig=qconfig,
-            g_idx=g_idx,
-            bias=bias,
-            group_size=self.quant_config.group_size,
-            quant_method=IPEXConfig.IPEX_QUANT_METHOD_MAP["gptq"]
+        layer.ipex_qlinear = (
+            ipex.llm.quantization.woq_linear.IPEXWeightOnlyQuantizedLinear.from_weight(
+                layer.qweight,
+                layer.scales,
+                layer.qzeros,
+                layer.qweight.size(0),
+                layer.ipex_output_size,
+                qconfig=qconfig,
+                g_idx=g_idx,
+                bias=bias,
+                group_size=self.quant_config.group_size,
+                quant_method=IPEXConfig.IPEX_QUANT_METHOD_MAP["gptq"],
+            )
         )
 
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         reshaped_x = x.reshape(-1, x.shape[-1])
         out = layer.ipex_qlinear(reshaped_x)
-        return out.reshape(x.shape[:-1] + (layer.ipex_output_size, ))
+        return out.reshape(x.shape[:-1] + (layer.ipex_output_size,))
 
 
 class IPEXAWQLinearMethod(AWQLinearMethod):
-    """AWQ linear method using IPEX for the CPU/XPU backend.
-    """
+    """AWQ linear method using IPEX for the CPU/XPU backend."""
 
     def __init__(self, quant_config: IPEXConfig):
         self.quant_config = quant_config  # type: ignore
@@ -209,18 +226,20 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
 
         try:
             import intel_extension_for_pytorch as ipex
-            if version.parse(
-                    ipex.__version__) < version.parse(MIN_IPEX_VERSION):
+
+            if version.parse(ipex.__version__) < version.parse(MIN_IPEX_VERSION):
                 raise ImportError(
                     "intel_extension_for_pytorch version is "
                     "wrong. Please install "
-                    f"intel_extension_for_pytorch>={MIN_IPEX_VERSION}.")
+                    f"intel_extension_for_pytorch>={MIN_IPEX_VERSION}."
+                )
         except ImportError as err:
             raise ImportError(
                 "Please install "
                 f"intel_extension_for_pytorch>={MIN_IPEX_VERSION} via "
                 f"`pip install intel_extension_for_pytorch>={MIN_IPEX_VERSION}`"
-                " to use IPEX-AWQ linear method.") from err
+                " to use IPEX-AWQ linear method."
+            ) from err
 
         # Using the compute dtype (lowp_mode) as INT8 to leverage instructions
         # with better performance.
@@ -237,104 +256,117 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             group_size=self.quant_config.group_size,
         )
 
-        layer.ipex_output_size = layer.qweight.size(
-            1) * self.quant_config.pack_factor
-        layer.ipex_qlinear = ipex.llm.quantization.woq_linear. \
-            IPEXWeightOnlyQuantizedLinear.from_weight(
-            layer.qweight,
-            layer.scales,
-            layer.qzeros,
-            layer.qweight.size(0),
-            layer.ipex_output_size,
-            qconfig=qconfig,
-            bias=bias,
-            group_size=self.quant_config.group_size,
-            quant_method=IPEXConfig.IPEX_QUANT_METHOD_MAP["awq"]  # type: ignore
+        layer.ipex_output_size = layer.qweight.size(1) * self.quant_config.pack_factor
+        layer.ipex_qlinear = (
+            ipex.llm.quantization.woq_linear.IPEXWeightOnlyQuantizedLinear.from_weight(
+                layer.qweight,
+                layer.scales,
+                layer.qzeros,
+                layer.qweight.size(0),
+                layer.ipex_output_size,
+                qconfig=qconfig,
+                bias=bias,
+                group_size=self.quant_config.group_size,
+                quant_method=IPEXConfig.IPEX_QUANT_METHOD_MAP["awq"],  # type: ignore
+            )
         )
 
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         reshaped_x = x.reshape(-1, x.shape[-1])
         out = layer.ipex_qlinear(reshaped_x)
-        return out.reshape(x.shape[:-1] + (layer.ipex_output_size, ))
+        return out.reshape(x.shape[:-1] + (layer.ipex_output_size,))
 
 
 class XPUFp8LinearMethod(Fp8LinearMethod):
-
     def __init__(self, quant_config: Fp8Config):
         super().__init__(quant_config)
 
     def process_weights_after_loading(self, layer: Module) -> None:
         # If checkpoint not serialized fp8, quantize the weights.
         if not self.quant_config.is_checkpoint_fp8_serialized:
-            qweight, weight_scale = ops.scaled_fp8_quant(layer.weight,
-                                                         scale=None)
+            qweight, weight_scale = ops.scaled_fp8_quant(layer.weight, scale=None)
             # Update the layer with the new values.
             layer.weight = Parameter(qweight, requires_grad=False)
             layer.weight_scale = Parameter(weight_scale, requires_grad=False)
             layer.input_scale = None
 
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         weight = layer.weight.data
         weight_scale = layer.weight_scale.data
-        output = torch.ops.torch_ipex.fp8_gemm_w8a16(x, weight, True,
-                                                     weight_scale, bias)
+        output = torch.ops.torch_ipex.fp8_gemm_w8a16(
+            x, weight, True, weight_scale, bias
+        )
         return output
 
 
 class XPUFp8MoEMethod(FusedMoEMethodBase):
-
     def __init__(self, quant_config: Fp8Config, layer: torch.nn.Module):
         super().__init__(layer.moe_config)
         self.quant_config = quant_config
 
-    def create_weights(self, layer: Module, num_experts: int, hidden_size: int,
-                       intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
-
+    def create_weights(
+        self,
+        layer: Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         layer.intermediate_size_per_partition = intermediate_size_per_partition
         layer.hidden_size = hidden_size
         layer.num_experts = num_experts
         layer.orig_dtype = params_dtype
         layer.weight_block_size = None
         # WEIGHTS
-        w13_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            2 * intermediate_size_per_partition,
-            hidden_size,
-            dtype=params_dtype),
-                                        requires_grad=False)
+        w13_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                2 * intermediate_size_per_partition,
+                hidden_size,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_weight", w13_weight)
         set_weight_attrs(w13_weight, extra_weight_attrs)
 
-        w2_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            hidden_size,
-            intermediate_size_per_partition,
-            dtype=params_dtype),
-                                       requires_grad=False)
+        w2_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                hidden_size,
+                intermediate_size_per_partition,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_weight", w2_weight)
         set_weight_attrs(w2_weight, extra_weight_attrs)
 
         # Allocate 2 scales for w1 and w3 respectively.
         # They will be combined to a single scale after weight loading.
-        w13_weight_scale = torch.nn.Parameter(torch.ones(num_experts,
-                                                         2,
-                                                         dtype=torch.float32),
-                                              requires_grad=False)
-        w2_weight_scale = torch.nn.Parameter(torch.ones(num_experts,
-                                                        dtype=torch.float32),
-                                             requires_grad=False)
+        w13_weight_scale = torch.nn.Parameter(
+            torch.ones(num_experts, 2, dtype=torch.float32), requires_grad=False
+        )
+        w2_weight_scale = torch.nn.Parameter(
+            torch.ones(num_experts, dtype=torch.float32), requires_grad=False
+        )
         layer.register_parameter("w13_weight_scale", w13_weight_scale)
         layer.register_parameter("w2_weight_scale", w2_weight_scale)
 
         extra_weight_attrs.update(
-            {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value})
+            {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value}
+        )
         # INPUT_SCALES
         layer.w13_input_scale = None
         layer.w2_input_scale = None
@@ -342,29 +374,30 @@ def create_weights(self, layer: Module, num_experts: int, hidden_size: int,
     def process_weights_after_loading(self, layer: Module) -> None:
         if not self.quant_config.is_checkpoint_fp8_serialized:
             fp8_dtype = current_platform.fp8_dtype()
-            w13_weight = torch.empty_like(layer.w13_weight.data,
-                                          dtype=fp8_dtype)
+            w13_weight = torch.empty_like(layer.w13_weight.data, dtype=fp8_dtype)
             w2_weight = torch.empty_like(layer.w2_weight.data, dtype=fp8_dtype)
 
             # Re-initialize w13_scale because we directly quantize
             # merged w13 weights and generate a single scaling factor.
-            layer.w13_weight_scale = torch.nn.Parameter(torch.ones(
-                layer.local_num_experts,
-                dtype=torch.float32,
-                device=w13_weight.device),
-                                                        requires_grad=False)
+            layer.w13_weight_scale = torch.nn.Parameter(
+                torch.ones(
+                    layer.local_num_experts,
+                    dtype=torch.float32,
+                    device=w13_weight.device,
+                ),
+                requires_grad=False,
+            )
             for expert in range(layer.local_num_experts):
-                w13_weight[expert, :, :], layer.w13_weight_scale[
-                    expert] = ops.scaled_fp8_quant(
-                        layer.w13_weight.data[expert, :, :])
-                w2_weight[expert, :, :], layer.w2_weight_scale[
-                    expert] = ops.scaled_fp8_quant(
-                        layer.w2_weight.data[expert, :, :])
-            layer.w13_weight = torch.nn.Parameter(w13_weight,
-                                                  requires_grad=False)
-            layer.w2_weight = torch.nn.Parameter(w2_weight,
-                                                 requires_grad=False)
+                w13_weight[expert, :, :], layer.w13_weight_scale[expert] = (
+                    ops.scaled_fp8_quant(layer.w13_weight.data[expert, :, :])
+                )
+                w2_weight[expert, :, :], layer.w2_weight_scale[expert] = (
+                    ops.scaled_fp8_quant(layer.w2_weight.data[expert, :, :])
+                )
+            layer.w13_weight = torch.nn.Parameter(w13_weight, requires_grad=False)
+            layer.w2_weight = torch.nn.Parameter(w2_weight, requires_grad=False)
         import intel_extension_for_pytorch as ipex
+
         layer.ipex_fusion = ipex.llm.modules.GatedMLPMOE(
             layer.w13_weight,
             layer.w2_weight,
@@ -376,7 +409,8 @@ def process_weights_after_loading(self, layer: Module) -> None:
         )
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         return None
 
     def apply(
diff --git a/vllm/model_executor/layers/quantization/kernels/mixed_precision/MPLinearKernel.py b/vllm/model_executor/layers/quantization/kernels/mixed_precision/MPLinearKernel.py
index 1280f5f1eadf..055a3ebbced6 100644
--- a/vllm/model_executor/layers/quantization/kernels/mixed_precision/MPLinearKernel.py
+++ b/vllm/model_executor/layers/quantization/kernels/mixed_precision/MPLinearKernel.py
@@ -24,7 +24,6 @@ class MPLinearLayerConfig:
 
 
 class MPLinearKernel(ABC):
-
     @classmethod
     @abstractmethod
     def get_min_capability(cls) -> int:
@@ -32,16 +31,17 @@ def get_min_capability(cls) -> int:
 
     @classmethod
     @abstractmethod
-    def can_implement(cls,
-                      c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
+    def can_implement(cls, c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
         raise NotImplementedError
 
-    def __init__(self,
-                 c: MPLinearLayerConfig,
-                 w_q_param_name: str,
-                 w_s_param_name: str,
-                 w_zp_param_name: Optional[str] = None,
-                 w_gidx_param_name: Optional[str] = None) -> None:
+    def __init__(
+        self,
+        c: MPLinearLayerConfig,
+        w_q_param_name: str,
+        w_s_param_name: str,
+        w_zp_param_name: Optional[str] = None,
+        w_gidx_param_name: Optional[str] = None,
+    ) -> None:
         assert self.can_implement(c)
         self.config = c
         self.w_q_name = w_q_param_name
@@ -58,31 +58,34 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         raise NotImplementedError
 
     @abstractmethod
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         raise NotImplementedError
 
-    def _transform_param(self, layer: torch.nn.Module, name: Optional[str],
-                         fn: Callable) -> None:
+    def _transform_param(
+        self, layer: torch.nn.Module, name: Optional[str], fn: Callable
+    ) -> None:
         if name is not None and getattr(layer, name, None) is not None:
-
             old_param = getattr(layer, name)
             new_param = fn(old_param)
             # replace the parameter with torch.nn.Parameter for TorchDynamo
             # compatibility
             replace_parameter(
-                layer, name,
-                torch.nn.Parameter(new_param.data, requires_grad=False))
+                layer, name, torch.nn.Parameter(new_param.data, requires_grad=False)
+            )
 
     def _get_weight_params(
-            self, layer: torch.nn.Module) -> tuple[
-                torch.Tensor,  # w_q
-                torch.Tensor,  # w_s
-                Optional[torch.Tensor],  # w_zp, 
-                Optional[torch.Tensor]  # w_gidx
-            ]:
+        self, layer: torch.nn.Module
+    ) -> tuple[
+        torch.Tensor,  # w_q
+        torch.Tensor,  # w_s
+        Optional[torch.Tensor],  # w_zp,
+        Optional[torch.Tensor],  # w_gidx
+    ]:
         return (
             getattr(layer, self.w_q_name),
             getattr(layer, self.w_s_name),
diff --git a/vllm/model_executor/layers/quantization/kernels/mixed_precision/__init__.py b/vllm/model_executor/layers/quantization/kernels/mixed_precision/__init__.py
index f10d20999bee..1759d142e6cc 100644
--- a/vllm/model_executor/layers/quantization/kernels/mixed_precision/__init__.py
+++ b/vllm/model_executor/layers/quantization/kernels/mixed_precision/__init__.py
@@ -5,23 +5,33 @@
 
 import vllm.envs as envs
 from vllm.model_executor.layers.quantization.kernels.mixed_precision.allspark import (  # noqa: E501
-    AllSparkLinearKernel)
+    AllSparkLinearKernel,
+)
 from vllm.model_executor.layers.quantization.kernels.mixed_precision.bitblas import (  # noqa: E501
-    BitBLASLinearKernel)
+    BitBLASLinearKernel,
+)
 from vllm.model_executor.layers.quantization.kernels.mixed_precision.conch import (  # noqa: E501
-    ConchLinearKernel)
+    ConchLinearKernel,
+)
 from vllm.model_executor.layers.quantization.kernels.mixed_precision.cutlass import (  # noqa: E501
-    CutlassW4A8LinearKernel)
+    CutlassW4A8LinearKernel,
+)
 from vllm.model_executor.layers.quantization.kernels.mixed_precision.dynamic_4bit import (  # noqa: E501
-    Dynamic4bitLinearKernel)
+    Dynamic4bitLinearKernel,
+)
 from vllm.model_executor.layers.quantization.kernels.mixed_precision.exllama import (  # noqa: E501
-    ExllamaLinearKernel)
+    ExllamaLinearKernel,
+)
 from vllm.model_executor.layers.quantization.kernels.mixed_precision.machete import (  # noqa: E501
-    MacheteLinearKernel)
+    MacheteLinearKernel,
+)
 from vllm.model_executor.layers.quantization.kernels.mixed_precision.marlin import (  # noqa: E501
-    MarlinLinearKernel)
+    MarlinLinearKernel,
+)
 from vllm.model_executor.layers.quantization.kernels.mixed_precision.MPLinearKernel import (  # noqa: E501
-    MPLinearKernel, MPLinearLayerConfig)
+    MPLinearKernel,
+    MPLinearLayerConfig,
+)
 from vllm.platforms import current_platform
 
 # in priority/performance order (when available)
@@ -38,11 +48,11 @@
 
 
 def choose_mp_linear_kernel(
-        config: MPLinearLayerConfig,
-        compute_capability: Optional[int] = None) -> type[MPLinearKernel]:
+    config: MPLinearLayerConfig, compute_capability: Optional[int] = None
+) -> type[MPLinearKernel]:
     """
     Choose an MPLinearKernel that can implement the given config for the given
-     compute capability. Attempts to choose the best kernel in terms of 
+     compute capability. Attempts to choose the best kernel in terms of
      performance.
 
     Args:
@@ -69,14 +79,18 @@ def choose_mp_linear_kernel(
     for kernel in _POSSIBLE_KERNELS:
         if kernel.__name__ in envs.VLLM_DISABLED_KERNELS:
             failure_reasons.append(
-                f' {kernel.__name__} disabled by environment variable')
+                f" {kernel.__name__} disabled by environment variable"
+            )
             continue
-        if (compute_capability is not None
-                and kernel.get_min_capability() > compute_capability):
+        if (
+            compute_capability is not None
+            and kernel.get_min_capability() > compute_capability
+        ):
             failure_reasons.append(
                 f"{kernel.__name__} requires capability "
                 f"{kernel.get_min_capability()}, current compute "
-                f" capability is {compute_capability}")
+                f" capability is {compute_capability}"
+            )
             continue
 
         can_implement, failure_reason = kernel.can_implement(config)
@@ -84,10 +98,10 @@ def choose_mp_linear_kernel(
             return kernel
         else:
             failure_reasons.append(
-                f' {kernel.__name__} cannot implement due to: {failure_reason}'
+                f" {kernel.__name__} cannot implement due to: {failure_reason}"
             )
 
     raise ValueError(
-        "Failed to find a kernel that can implement the "\
-        "WNA16 linear layer. Reasons: \n"
-        + '\n'.join(failure_reasons))
+        "Failed to find a kernel that can implement the "
+        "WNA16 linear layer. Reasons: \n" + "\n".join(failure_reasons)
+    )
diff --git a/vllm/model_executor/layers/quantization/kernels/mixed_precision/allspark.py b/vllm/model_executor/layers/quantization/kernels/mixed_precision/allspark.py
index 785e559df8f7..c353372b05ec 100644
--- a/vllm/model_executor/layers/quantization/kernels/mixed_precision/allspark.py
+++ b/vllm/model_executor/layers/quantization/kernels/mixed_precision/allspark.py
@@ -8,22 +8,21 @@
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.utils import replace_parameter
 from vllm.model_executor.layers.quantization.utils.allspark_utils import (
-    ALLSPARK_AMPERE_M_CUBLAS_THRESHOLD, check_allspark_supported_dtype_shape)
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           permute_param_layout_)
+    ALLSPARK_AMPERE_M_CUBLAS_THRESHOLD,
+    check_allspark_supported_dtype_shape,
+)
+from vllm.model_executor.parameter import BasevLLMParameter, permute_param_layout_
 
 from .MPLinearKernel import MPLinearKernel, MPLinearLayerConfig
 
 
 class AllSparkLinearKernel(MPLinearKernel):
-
     @classmethod
     def get_min_capability(cls) -> int:
         return 80
 
     @classmethod
-    def can_implement(cls,
-                      c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
+    def can_implement(cls, c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
         if c.has_g_idx:
             return False, "Act reordering currently not supported by AllSpark"
 
@@ -35,7 +34,8 @@ def can_implement(cls,
             c.partition_weight_shape[1],  # out_features
             c.group_size,
             c.weight_type,
-            c.act_type)
+            c.act_type,
+        )
 
     # note assumes that
     #  `weight_packed` is: {input_dim = 0, output_dim = 1, packed_dim = 0}
@@ -49,8 +49,8 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         sm_count = properties.multi_processor_count
         sm_version = properties.major * 10 + properties.minor
         gemm_args = {}
-        gemm_args['sm_count'] = sm_count
-        gemm_args['sm_version'] = sm_version
+        gemm_args["sm_count"] = sm_count
+        gemm_args["sm_version"] = sm_version
 
         self.gemm_args = gemm_args
 
@@ -59,43 +59,42 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         old_scale_param = getattr(layer, self.w_s_name)
 
         assert isinstance(old_weight_param, BasevLLMParameter)
-        permute_param_layout_(old_weight_param,
-                              input_dim=0,
-                              output_dim=1,
-                              packed_dim=0)
+        permute_param_layout_(old_weight_param, input_dim=0, output_dim=1, packed_dim=0)
 
         assert isinstance(old_scale_param, BasevLLMParameter)
         permute_param_layout_(old_scale_param, input_dim=0, output_dim=1)
 
         # unpack weight from K / 4 x N int32 to K x N uint8
-        new_weight_param = torch.nn.Parameter(old_weight_param.data,
-                                              requires_grad=False)
-        new_weight_param.data = new_weight_param.data.t().contiguous().view(
-            dtype=torch.uint8)
+        new_weight_param = torch.nn.Parameter(
+            old_weight_param.data, requires_grad=False
+        )
+        new_weight_param.data = (
+            new_weight_param.data.t().contiguous().view(dtype=torch.uint8)
+        )
         new_weight_param.data = new_weight_param.data.t().contiguous()
 
-        new_scale_param = torch.nn.Parameter(old_scale_param.data,
-                                             requires_grad=False)
+        new_scale_param = torch.nn.Parameter(old_scale_param.data, requires_grad=False)
 
         # reorder K x N weight as N32K16 format for Ampere W8A16
-        new_weight_param.data, new_scale_param.data, _ = \
-            ops.allspark_repack_weight(
-                new_weight_param.data, new_scale_param.data, None,
-                c.zero_points)
+        new_weight_param.data, new_scale_param.data, _ = ops.allspark_repack_weight(
+            new_weight_param.data, new_scale_param.data, None, c.zero_points
+        )
 
         replace_parameter(layer, self.w_q_name, new_weight_param.data)
         replace_parameter(layer, self.w_s_name, new_scale_param.data)
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         c = self.config
         gemm_args = self.gemm_args
         w_q, w_s, _, _ = self._get_weight_params(layer)
 
         reshaped_x = x.reshape(-1, x.shape[-1])
-        out_shape = x.shape[:-1] + (c.partition_weight_shape[1], )
+        out_shape = x.shape[:-1] + (c.partition_weight_shape[1],)
 
         output = ops.allspark_w8a16_gemm(
             a=reshaped_x,
@@ -104,11 +103,12 @@ def apply_weights(self,
             b_qzeros=None,
             n=c.partition_weight_shape[1],
             group_size=c.group_size,
-            sm_count=gemm_args['sm_count'],
-            sm_version=gemm_args['sm_version'],
+            sm_count=gemm_args["sm_count"],
+            sm_version=gemm_args["sm_version"],
             CUBLAS_M_THRESHOLD=ALLSPARK_AMPERE_M_CUBLAS_THRESHOLD,
             has_zp=c.zero_points,
-            n32k16_reorder=True)
+            n32k16_reorder=True,
+        )
 
         if bias is not None:
             output.add_(bias)  # In-place add
diff --git a/vllm/model_executor/layers/quantization/kernels/mixed_precision/bitblas.py b/vllm/model_executor/layers/quantization/kernels/mixed_precision/bitblas.py
index fe72910659e2..d1ff582c4e21 100644
--- a/vllm/model_executor/layers/quantization/kernels/mixed_precision/bitblas.py
+++ b/vllm/model_executor/layers/quantization/kernels/mixed_precision/bitblas.py
@@ -10,10 +10,16 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.utils import replace_parameter
 from vllm.model_executor.layers.quantization.utils.bitblas_utils import (
-    BITBLAS_OPTIMIZE_FEATURES, BITBLAS_SUPPORTED_GROUP_SIZES,
-    MINIMUM_BITBLAS_VERSION, bitblas_make_empty_g_idx, bitblas_sort_g_idx,
-    check_bitblas_supports_shape, query_bitblas_supported_quant_types,
-    unpack_gptq_qweight, unpack_gptq_qzeros)
+    BITBLAS_OPTIMIZE_FEATURES,
+    BITBLAS_SUPPORTED_GROUP_SIZES,
+    MINIMUM_BITBLAS_VERSION,
+    bitblas_make_empty_g_idx,
+    bitblas_sort_g_idx,
+    check_bitblas_supports_shape,
+    query_bitblas_supported_quant_types,
+    unpack_gptq_qweight,
+    unpack_gptq_qzeros,
+)
 
 from .MPLinearKernel import MPLinearKernel, MPLinearLayerConfig
 
@@ -21,7 +27,6 @@
 
 
 class BitBLASLinearKernel(MPLinearKernel):
-
     OPT_FEATURES: list[int] = BITBLAS_OPTIMIZE_FEATURES
     ENABLE_TUNING: bool = True
     MATMUL_LAYOUT: str = "nt"
@@ -44,8 +49,9 @@ def __init__(
         bitblas_quant_config: Optional[QuantizationConfig] = None,
     ):
         self.quant_config = bitblas_quant_config
-        super().__init__(c, w_q_param_name, w_s_param_name, w_zp_param_name,
-                         w_gidx_param_name)
+        super().__init__(
+            c, w_q_param_name, w_s_param_name, w_zp_param_name, w_gidx_param_name
+        )
 
     def repack_bitblas_from_gptq(
         self,
@@ -54,19 +60,18 @@ def repack_bitblas_from_gptq(
         qzeros: Optional[torch.Tensor] = None,
     ):
         from bitblas.quantization.utils import general_compress
+
         assert self.bitblas_matmul is not None, "bitblas_matmul is None"
 
         quant_config = self.quant_config
         # qweight in gptq old quant linear stored with
         # (outfeatures, infeatures), should be transposed.
-        qweight = b_q_weight.T.contiguous().view(
-            quant_config.torch_storage_dtype)  # type: ignore[union-attr]
-        intweight = unpack_gptq_qweight(
-            qweight,
-            quant_config.weight_bits).contiguous()  # type: ignore[union-attr]
+        qweight = b_q_weight.T.contiguous().view(quant_config.torch_storage_dtype)  # type: ignore[union-attr]
+        intweight = unpack_gptq_qweight(qweight, quant_config.weight_bits).contiguous()  # type: ignore[union-attr]
         if self.bitblas_matmul.weight_transform is not None:  # type: ignore[attr-defined]
             qweight = self.bitblas_matmul.weight_transform(  # type: ignore[attr-defined]
-                intweight.cpu()).cuda()
+                intweight.cpu()
+            ).cuda()
         # scales in gptq old quant linear stored with
         # (infeatures // group_size, outfeatures), should be transposed.
         scales = scales.T.contiguous()
@@ -90,9 +95,14 @@ def repack_bitblas_from_gptq(
                     general_compress(
                         intzeros.T.contiguous().cpu().numpy(),
                         weight_bits,
-                    )).to(qweight.device).
-                to(quant_config.torch_storage_dtype  # type: ignore[union-attr]
-                   ).contiguous())
+                    )
+                )
+                .to(qweight.device)
+                .to(
+                    quant_config.torch_storage_dtype  # type: ignore[union-attr]
+                )
+                .contiguous()
+            )
         else:
             raise ValueError("Unsupported zeros type: {}".format(zeros_mode))
 
@@ -103,41 +113,50 @@ def get_min_capability(cls) -> int:
         return 70
 
     @classmethod
-    def can_implement(cls,
-                      c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
-
+    def can_implement(cls, c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
         is_bitblas_installed = True
 
         try:
             import bitblas
+
             if version.parse(bitblas.__version__) < version.parse(
-                    MINIMUM_BITBLAS_VERSION):
+                MINIMUM_BITBLAS_VERSION
+            ):
                 raise ImportError(
                     "bitblas version is wrong. Please "
-                    f"install bitblas>={MINIMUM_BITBLAS_VERSION}")
+                    f"install bitblas>={MINIMUM_BITBLAS_VERSION}"
+                )
         except ImportError:
             is_bitblas_installed = False
 
         if not is_bitblas_installed:
-            return False, "bitblas is not installed. Please install bitblas "\
-                          "by running `pip install bitblas>="\
-                           f"{MINIMUM_BITBLAS_VERSION}`"
+            return (
+                False,
+                "bitblas is not installed. Please install bitblas "
+                "by running `pip install bitblas>="
+                f"{MINIMUM_BITBLAS_VERSION}`",
+            )
 
         quant_types = query_bitblas_supported_quant_types(c.zero_points)
         if c.weight_type not in quant_types:
-            return False, (f"Quant type ({c.weight_type}) not supported by"
-                           f"  BitBLAS, supported types are: {quant_types}")
+            return False, (
+                f"Quant type ({c.weight_type}) not supported by"
+                f"  BitBLAS, supported types are: {quant_types}"
+            )
 
         if c.group_size not in BITBLAS_SUPPORTED_GROUP_SIZES:
-            return False, (f"Group size ({c.group_size}) not supported by "
-                           "BitBLAS, supported group sizes are: "
-                           f"{BITBLAS_SUPPORTED_GROUP_SIZES}")
+            return False, (
+                f"Group size ({c.group_size}) not supported by "
+                "BitBLAS, supported group sizes are: "
+                f"{BITBLAS_SUPPORTED_GROUP_SIZES}"
+            )
 
         return check_bitblas_supports_shape(
             c.partition_weight_shape[1],  # out_features
             c.partition_weight_shape[0],  # in_features
             c.full_weight_shape[0],  # in_features
-            c.group_size)
+            c.group_size,
+        )
 
     # note assumes that
     #  `weight_packed` is: {input_dim = 0, output_dim = 1, packed_dim = 0}
@@ -149,14 +168,15 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
 
         # Default names since bitblas requires empty parameters for these,
         # TODO: remove this requirement from bitblas (allow optional tensors)
-        if self.w_gidx_name is None:
-            self.w_gidx_name = "g_idx"
-        if self.w_zp_name is None:
-            self.w_zp_name = "qzeros"
+        if getattr(self, "w_gidx_name", None) is None:
+            self.w_gidx_name: str = "g_idx"
+        if getattr(self, "w_zp_name", None) is None:
+            self.w_zp_name: str = "qzeros"
 
         if c.has_g_idx:
             g_idx, g_idx_sort_indices = bitblas_sort_g_idx(
-                getattr(layer, self.w_gidx_name))
+                getattr(layer, self.w_gidx_name)
+            )
             self._transform_param(layer, self.w_gidx_name, lambda _: g_idx)
             layer.g_idx_sort_indices = g_idx_sort_indices
         else:
@@ -169,13 +189,11 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             setattr(layer, self.w_zp_name, bitblas_make_empty_g_idx(device))
 
         # Repack weights
-        bitblas_qweight, bitblas_scales, bitblas_qzeros = (
-            self.repack_bitblas_from_gptq(
-                layer.qweight,
-                layer.scales,
-                None if quant_config.is_sym else  # type: ignore[union-attr]
-                layer.qzeros,  # type: ignore[union-attr]
-            ))
+        bitblas_qweight, bitblas_scales, bitblas_qzeros = self.repack_bitblas_from_gptq(
+            layer.qweight,
+            layer.scales,
+            None if quant_config.is_sym else layer.qzeros,  # type: ignore[union-attr]
+        )
         replace_parameter(layer, self.w_q_name, bitblas_qweight)
         replace_parameter(layer, self.w_s_name, bitblas_scales)
         if bitblas_qzeros is not None:
@@ -212,6 +230,7 @@ def _configure_bitblas_matmul(
         bits,
     ):
         from bitblas import MatmulConfig
+
         bitblas_dtype = self.BITBLAS_DTYPES[params_dtype]
         quant_config = self.quant_config
         with_scaling = False
@@ -248,30 +267,33 @@ def _configure_bitblas_matmul(
             zeros_mode=zeros_mode,
         )
         self.bitblas_matmul = self._get_or_create_bitblas_operator(
-            matmul_config, enable_tuning)
+            matmul_config, enable_tuning
+        )
 
     def _get_or_create_bitblas_operator(self, config, enable_tuning):
         from bitblas import Matmul, auto_detect_nvidia_target
         from bitblas.cache import get_database_path, global_operator_cache
+
         BITBLAS_DATABASE_PATH = get_database_path()
         BITBLAS_TARGET = auto_detect_nvidia_target()
 
         if global_operator_cache.size() == 0:
-            global_operator_cache.load_from_database(BITBLAS_DATABASE_PATH,
-                                                     BITBLAS_TARGET)
+            global_operator_cache.load_from_database(
+                BITBLAS_DATABASE_PATH, BITBLAS_TARGET
+            )
 
         bitblas_matmul = global_operator_cache.get(config)
         if bitblas_matmul is None:
-            bitblas_matmul = Matmul(config,
-                                    target=BITBLAS_TARGET,
-                                    enable_tuning=False)
+            bitblas_matmul = Matmul(config, target=BITBLAS_TARGET, enable_tuning=False)
             if enable_tuning:
                 bitblas_matmul.hardware_aware_finetune(topk=20)
                 global_operator_cache.add(config, bitblas_matmul)
                 global_operator_cache.save_into_database(
-                    BITBLAS_DATABASE_PATH, BITBLAS_TARGET)
+                    BITBLAS_DATABASE_PATH, BITBLAS_TARGET
+                )
                 TUNING_MESSAGE = (
-                    f"BitBLAS Operator {config} tuned and saved to database.")
+                    f"BitBLAS Operator {config} tuned and saved to database."
+                )
                 logger.info(TUNING_MESSAGE)
             else:
                 _message = f"BitBLAS Operator {config} created without tuning. "
@@ -287,7 +309,7 @@ def apply_gptq_bitblas_linear(
         x: torch.Tensor,
     ) -> torch.Tensor:
         output_size_per_partition = self.config.partition_weight_shape[1]
-        out_shape = x.shape[:-1] + (output_size_per_partition, )
+        out_shape = x.shape[:-1] + (output_size_per_partition,)
         args = [x, layer.qweight, layer.scales]
         if self.bitblas_matmul.config.with_zeros:  # type: ignore[attr-defined]
             args.append(layer.qzeros)
@@ -297,5 +319,6 @@ def apply_gptq_bitblas_linear(
     def apply_weights(self, layer, x, bias=None):
         NOT_IMPLEMENT_MESSAGE = (
             f"{self.__class__.__name__}.apply_weights is not implemented. "
-            "Please use BitBLASLinearKernel.apply_gptq_bitblas_linear instead")
+            "Please use BitBLASLinearKernel.apply_gptq_bitblas_linear instead"
+        )
         raise NotImplementedError(NOT_IMPLEMENT_MESSAGE)
diff --git a/vllm/model_executor/layers/quantization/kernels/mixed_precision/conch.py b/vllm/model_executor/layers/quantization/kernels/mixed_precision/conch.py
index f80af548f019..281fca7888ab 100644
--- a/vllm/model_executor/layers/quantization/kernels/mixed_precision/conch.py
+++ b/vllm/model_executor/layers/quantization/kernels/mixed_precision/conch.py
@@ -6,44 +6,49 @@
 
 import torch
 
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           permute_param_layout_)
+from vllm.model_executor.parameter import BasevLLMParameter, permute_param_layout_
 from vllm.scalar_type import scalar_types
 
 from .MPLinearKernel import MPLinearKernel, MPLinearLayerConfig
 
 _CONCH_SUPPORTED_WEIGHT_TYPES: Final = [
-    scalar_types.uint4, scalar_types.uint8, scalar_types.uint4b8,
-    scalar_types.uint8b128
+    scalar_types.uint4,
+    scalar_types.uint8,
+    scalar_types.uint4b8,
+    scalar_types.uint8b128,
 ]
 _CONCH_SUPPORTED_GROUP_SIZES: Final = [-1, 128]
 
 
 class ConchLinearKernel(MPLinearKernel):
-
     @classmethod
     def get_min_capability(cls) -> int:
         return 80
 
     @classmethod
-    def can_implement(cls,
-                      c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
+    def can_implement(cls, c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
         if c.weight_type not in _CONCH_SUPPORTED_WEIGHT_TYPES:
-            error_msg = f"Weight type ({c.weight_type}) not supported by "\
-                        "ConchLinearKernel, supported types are: " \
-                        f"{_CONCH_SUPPORTED_WEIGHT_TYPES}"
+            error_msg = (
+                f"Weight type ({c.weight_type}) not supported by "
+                "ConchLinearKernel, supported types are: "
+                f"{_CONCH_SUPPORTED_WEIGHT_TYPES}"
+            )
             return False, error_msg
 
         if c.group_size not in _CONCH_SUPPORTED_GROUP_SIZES:
-            error_msg = f"Group size ({c.group_size}) not supported by "\
-                        "ConchLinearKernel, supported group sizes are: " \
-                        f"{_CONCH_SUPPORTED_GROUP_SIZES}"
+            error_msg = (
+                f"Group size ({c.group_size}) not supported by "
+                "ConchLinearKernel, supported group sizes are: "
+                f"{_CONCH_SUPPORTED_GROUP_SIZES}"
+            )
             return False, error_msg
 
         if find_spec("conch") is None:
-            error_msg = "conch-triton-kernels is not installed, please "\
-                        "install it via `pip install conch-triton-kernels` "\
-                        "and try again!"
+            error_msg = (
+                "conch-triton-kernels is not installed, please "
+                "install it via `pip install conch-triton-kernels` "
+                "and try again!"
+            )
             return False, error_msg
 
         return True, None
@@ -52,7 +57,6 @@ def can_implement(cls,
     #  `weight_packed` is: {input_dim = 0, output_dim = 1, packed_dim = 0}
     #  `weight_scale` is: {input_dim = 0, output_dim = 1}
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
-
         def transform_w_q(x):
             assert isinstance(x, BasevLLMParameter)
             permute_param_layout_(x, input_dim=0, output_dim=1, packed_dim=0)
@@ -68,10 +72,12 @@ def transform_w_s(x):
         self._transform_param(layer, self.w_q_name, transform_w_q)
         self._transform_param(layer, self.w_s_name, transform_w_s)
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         from conch.ops.quantization.gemm import mixed_precision_gemm
 
         w_q, w_s, w_zp, _ = self._get_weight_params(layer)
diff --git a/vllm/model_executor/layers/quantization/kernels/mixed_precision/cutlass.py b/vllm/model_executor/layers/quantization/kernels/mixed_precision/cutlass.py
index 9e23c0dd3595..f5df7a244b42 100644
--- a/vllm/model_executor/layers/quantization/kernels/mixed_precision/cutlass.py
+++ b/vllm/model_executor/layers/quantization/kernels/mixed_precision/cutlass.py
@@ -7,10 +7,8 @@
 
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.input_quant_fp8 import QuantFP8
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape)
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           permute_param_layout_)
+from vllm.model_executor.layers.quantization.utils.quant_utils import GroupShape
+from vllm.model_executor.parameter import BasevLLMParameter, permute_param_layout_
 from vllm.platforms import current_platform
 from vllm.scalar_type import scalar_types
 
@@ -18,26 +16,22 @@
 
 
 class CutlassW4A8LinearKernel(MPLinearKernel):
-
     def __init__(self, *args, **kwargs):
         super().__init__(*args, **kwargs)
         # dynamic per-tok fp8 activation quantization
-        self.quant_fp8 = QuantFP8(static=False,
-                                  group_shape=GroupShape.PER_TOKEN)
+        self.quant_fp8 = QuantFP8(static=False, group_shape=GroupShape.PER_TOKEN)
 
     @classmethod
     def get_min_capability(cls) -> int:
         return 90
 
     @classmethod
-    def can_implement(cls,
-                      c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
+    def can_implement(cls, c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
         if not current_platform.is_cuda():
             return False, "CUTLASS only supported on CUDA"
 
         if not current_platform.is_device_capability(90):
-            return False, "CUTLASS W4A8 requires compute capability of 90 "\
-                "(Hopper)"
+            return False, "CUTLASS W4A8 requires compute capability of 90 (Hopper)"
 
         if c.act_type != torch.float8_e4m3fn:
             return False, "CUTLASS W4A8 only supports FP8 (e4m3) activations"
@@ -49,8 +43,11 @@ def can_implement(cls,
             return False, "Zero points not supported by CUTLASS W4A8"
 
         if c.weight_type != scalar_types.int4:
-            return False, f"Quant type ({c.weight_type}) not supported by "\
-                           "CUTLASS W4A8, only supported int4"
+            return (
+                False,
+                f"Quant type ({c.weight_type}) not supported by "
+                "CUTLASS W4A8, only supported int4",
+            )
 
         # TODO(czhu): support -1 (column-wise)
         if c.group_size != 128:
@@ -58,12 +55,16 @@ def can_implement(cls,
 
         in_features, out_features = c.partition_weight_shape
         if in_features % 128 or out_features % 128:
-            return False, "K and N must be divisible by 128, got "\
-                           f"{c.partition_weight_shape}"
+            return (
+                False,
+                f"K and N must be divisible by 128, got {c.partition_weight_shape}",
+            )
 
         if c.out_type != torch.bfloat16:
-            return False, "Only bfloat16 output type currently supported"\
-                           f"got {c.out_type=}"
+            return (
+                False,
+                f"Only bfloat16 output type currently supportedgot {c.out_type=}",
+            )
 
         return True, None
 
@@ -71,13 +72,11 @@ def can_implement(cls,
     #  `weight_packed` is: {input_dim = 0, output_dim = 1, packed_dim = 0}
     #  `weight_scale`  is: {input_dim = 0, output_dim = 1}
     def process_weights_after_loading(self, layer: torch.nn.Module):
-
         # TODO(czhu): optimize speed/mem usage
         def transform_w_q(x):
             assert isinstance(x, BasevLLMParameter)
             permute_param_layout_(x, input_dim=0, output_dim=1, packed_dim=0)
-            x.data = ops.cutlass_encode_and_reorder_int4b(
-                x.data.t().contiguous().t())
+            x.data = ops.cutlass_encode_and_reorder_int4b(x.data.t().contiguous().t())
             return x
 
         def transform_w_s(x):
@@ -92,24 +91,28 @@ def transform_w_s(x):
         self._transform_param(layer, self.w_s_name, transform_w_s)
         self._transform_param(layer, "weight_chan_scale", lambda x: x)
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         c = self.config
         w_q, w_s, _, _ = self._get_weight_params(layer)
         w_ch_s = layer.weight_chan_scale
 
         x_2d = x.reshape(-1, x.shape[-1])
-        out_shape = x.shape[:-1] + (c.partition_weight_shape[1], )
+        out_shape = x.shape[:-1] + (c.partition_weight_shape[1],)
 
         x_2d, act_scales = self.quant_fp8(x_2d)
-        output = ops.cutlass_w4a8_mm(a=x_2d,
-                                     b_q=w_q,
-                                     b_group_scales=w_s,
-                                     b_group_size=c.group_size,
-                                     a_token_scales=act_scales,
-                                     b_channel_scales=w_ch_s)
+        output = ops.cutlass_w4a8_mm(
+            a=x_2d,
+            b_q=w_q,
+            b_group_scales=w_s,
+            b_group_size=c.group_size,
+            a_token_scales=act_scales,
+            b_channel_scales=w_ch_s,
+        )
 
         if bias is not None:
             output.add_(bias)  # In-place add
diff --git a/vllm/model_executor/layers/quantization/kernels/mixed_precision/dynamic_4bit.py b/vllm/model_executor/layers/quantization/kernels/mixed_precision/dynamic_4bit.py
index 7bd326f47f9e..7631236e6f64 100644
--- a/vllm/model_executor/layers/quantization/kernels/mixed_precision/dynamic_4bit.py
+++ b/vllm/model_executor/layers/quantization/kernels/mixed_precision/dynamic_4bit.py
@@ -20,37 +20,45 @@ def get_min_capability(cls) -> int:
         return 1
 
     @classmethod
-    def can_implement(cls,
-                      c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
+    def can_implement(cls, c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
         if not current_platform.is_cpu():
             return False, "Only CPU is supported"
         if c.weight_type not in cls.SUPPORTED_QUANT_TYPES:
             return False, f"Unsupported quant type {c.weight_type}"
-        if current_platform.get_cpu_architecture(
-        ) == CpuArchEnum.ARM and c.act_type not in [
+        if (
+            current_platform.get_cpu_architecture() == CpuArchEnum.ARM
+            and c.act_type
+            not in [
                 torch.float32,
-        ]:
-            return False, "Dynamic4bitLinearKernel on Arm requires"\
-                " Float32 activations"
+            ]
+        ):
+            return False, "Dynamic4bitLinearKernel on Arm requires Float32 activations"
         if c.full_weight_shape[0] % c.group_size != 0:
-            return False, f"Group size ({c.group_size}) does not evenly divide"\
-                " the number of input features "\
-                f"({c.full_weight_shape[0]})"
+            return (
+                False,
+                f"Group size ({c.group_size}) does not evenly divide"
+                " the number of input features "
+                f"({c.full_weight_shape[0]})",
+            )
         if current_platform.get_cpu_architecture() == CpuArchEnum.ARM:
             try:
                 # Attempt to retrieve the operation
                 _ = torch.ops.aten._dyn_quant_matmul_4bit
             except AttributeError:
-                return False, f"PyTorch {torch.__version__} does not support"\
-                    " _dyn_quant_matmul_4bit. Install a newer version"
+                return (
+                    False,
+                    f"PyTorch {torch.__version__} does not support"
+                    " _dyn_quant_matmul_4bit. Install a newer version",
+                )
         return True, None
 
     def process_weights_after_loading(self, layer: torch.nn.Module):
         c = self.config
         packed_weight = getattr(layer, self.w_q_name)
         packed_weight = packed_weight.add(8)
-        uint8_packed = (packed_weight[::, 1::2] << 4
-                        | packed_weight[::, ::2]).to(torch.uint8)
+        uint8_packed = (packed_weight[::, 1::2] << 4 | packed_weight[::, ::2]).to(
+            torch.uint8
+        )
 
         scales = getattr(layer, self.w_s_name)
         block_size = c.group_size
@@ -71,22 +79,34 @@ def process_weights_after_loading(self, layer: torch.nn.Module):
 
         # Repack weights as per kernel requirement
         w = torch.ops.aten._dyn_quant_pack_4bit_weight(
-            uint8_packed, scales, layer.bias, block_size,
-            c.partition_weight_shape[0], c.partition_weight_shape[1])
-        replace_parameter(layer, self.w_q_name,
-                          torch.nn.Parameter(w, requires_grad=False))
+            uint8_packed,
+            scales,
+            layer.bias,
+            block_size,
+            c.partition_weight_shape[0],
+            c.partition_weight_shape[1],
+        )
+        replace_parameter(
+            layer, self.w_q_name, torch.nn.Parameter(w, requires_grad=False)
+        )
         setattr(layer, self.w_s_name, None)
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         c = self.config
         x_2d = x.reshape(-1, x.shape[-1])
-        out_shape = x.shape[:-1] + (c.partition_weight_shape[1], )
+        out_shape = x.shape[:-1] + (c.partition_weight_shape[1],)
 
         w_q = getattr(layer, self.w_q_name)
         output = torch.ops.aten._dyn_quant_matmul_4bit(
-            x_2d, w_q, c.group_size, c.partition_weight_shape[0],
-            c.partition_weight_shape[1])
+            x_2d,
+            w_q,
+            c.group_size,
+            c.partition_weight_shape[0],
+            c.partition_weight_shape[1],
+        )
         return output.reshape(out_shape)
diff --git a/vllm/model_executor/layers/quantization/kernels/mixed_precision/exllama.py b/vllm/model_executor/layers/quantization/kernels/mixed_precision/exllama.py
index fef333e862d5..a57d3f65267e 100644
--- a/vllm/model_executor/layers/quantization/kernels/mixed_precision/exllama.py
+++ b/vllm/model_executor/layers/quantization/kernels/mixed_precision/exllama.py
@@ -7,9 +7,9 @@
 
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    pack_quantized_values_into_int32)
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           permute_param_layout_)
+    pack_quantized_values_into_int32,
+)
+from vllm.model_executor.parameter import BasevLLMParameter, permute_param_layout_
 from vllm.scalar_type import scalar_types
 
 from .MPLinearKernel import MPLinearKernel, MPLinearLayerConfig
@@ -25,31 +25,41 @@ def get_min_capability(cls) -> int:
         return 60
 
     @classmethod
-    def can_implement(cls,
-                      c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
-        if c.has_g_idx and\
-            c.partition_weight_shape[0] != c.full_weight_shape[0]:
-            return False, "Act reordering currently not supported by Exllama, "\
-                          "when the input features are partitioned across "\
-                          "devices"
+    def can_implement(cls, c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
+        if c.has_g_idx and c.partition_weight_shape[0] != c.full_weight_shape[0]:
+            return (
+                False,
+                "Act reordering currently not supported by Exllama, "
+                "when the input features are partitioned across "
+                "devices",
+            )
 
         if c.partition_weight_shape[1] % (32 // c.weight_type.size_bits) != 0:
-            return False, "Output features must be a multiple of the pack " \
-                            "factor (32 / num_bits) so that we can correctly " \
-                            "pack the zero points"
+            return (
+                False,
+                "Output features must be a multiple of the pack "
+                "factor (32 / num_bits) so that we can correctly "
+                "pack the zero points",
+            )
 
         if c.act_type != torch.float16:
             return False, "Exllama only supports float16 activations"
 
         if c.weight_type not in cls.SUPPORTED_QUANT_TYPES:
-            return False, f"Quant type ({c.weight_type}) not supported by "\
-                           "Exllama, supported types are: "\
-                           f"{cls.SUPPORTED_QUANT_TYPES}"
+            return (
+                False,
+                f"Quant type ({c.weight_type}) not supported by "
+                "Exllama, supported types are: "
+                f"{cls.SUPPORTED_QUANT_TYPES}",
+            )
 
         if c.full_weight_shape[0] % c.group_size != 0:
-            return False, f"Group size ({c.group_size}) does not evenly divide"\
-                           " the number of input features "\
-                           f"({c.full_weight_shape[0]})"
+            return (
+                False,
+                f"Group size ({c.group_size}) does not evenly divide"
+                " the number of input features "
+                f"({c.full_weight_shape[0]})",
+            )
 
         return True, None
 
@@ -70,21 +80,23 @@ def process_weights_after_loading(self, layer: torch.nn.Module):
                 # exllama kernel adding 1 to the zero points during inference)
                 # Documentation of the bug can be found here:
                 #  https://garden.danieldk.eu/GPTQ-Checkpoint-Format
-                zeros = torch.full((groups, out_features),
-                                   c.weight_type.bias - 1,
-                                   dtype=torch.int32,
-                                   device=device)
+                zeros = torch.full(
+                    (groups, out_features),
+                    c.weight_type.bias - 1,
+                    dtype=torch.int32,
+                    device=device,
+                )
             else:
                 raise NotImplementedError(
                     "A 0 zero-point is not supported by Exllama due to "
                     "a bug in the original GPTQ checkpoint format leading to "
                     "exllama kernel adding 1 to the zero points during "
-                    "inference")
-            zeros = pack_quantized_values_into_int32(zeros,
-                                                     c.weight_type,
-                                                     packed_dim=1)
-            setattr(layer, self.w_zp_name,
-                    torch.nn.Parameter(zeros, requires_grad=False))
+                    "inference"
+                )
+            zeros = pack_quantized_values_into_int32(zeros, c.weight_type, packed_dim=1)
+            setattr(
+                layer, self.w_zp_name, torch.nn.Parameter(zeros, requires_grad=False)
+            )
 
         if c.has_g_idx:
 
@@ -96,10 +108,9 @@ def transform_w_g_idx(x):
             self._transform_param(layer, self.w_gidx_name, transform_w_g_idx)
         else:
             self.w_gidx_name = "g_idx"
-            empty_g_idx = torch.nn.Parameter(torch.empty((0, ),
-                                                         dtype=torch.int,
-                                                         device=device),
-                                             requires_grad=False)
+            empty_g_idx = torch.nn.Parameter(
+                torch.empty((0,), dtype=torch.int, device=device), requires_grad=False
+            )
             setattr(layer, self.w_gidx_name, empty_g_idx)
 
         def transform_w_q(x):
@@ -122,21 +133,24 @@ def transform_w_s(x):
         self._transform_param(layer, self.w_q_name, transform_w_q)
         self._transform_param(layer, self.w_s_name, transform_w_s)
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         c = self.config
 
         x_2d = x.reshape(-1, x.shape[-1])
-        out_shape = x.shape[:-1] + (c.partition_weight_shape[1], )
+        out_shape = x.shape[:-1] + (c.partition_weight_shape[1],)
 
         w_q, w_s, w_zp, w_g_idx = self._get_weight_params(layer)
 
         assert w_zp is not None, "Zero points are required by Exllama"
         assert w_g_idx is not None, "Group index is required by Exllama"
-        output = ops.gptq_gemm(x_2d, w_q, w_zp, w_s, w_g_idx, True,
-                               c.weight_type.size_bits)
+        output = ops.gptq_gemm(
+            x_2d, w_q, w_zp, w_s, w_g_idx, True, c.weight_type.size_bits
+        )
 
         if bias is not None:
             output.add_(bias)
diff --git a/vllm/model_executor/layers/quantization/kernels/mixed_precision/machete.py b/vllm/model_executor/layers/quantization/kernels/mixed_precision/machete.py
index da951ddab2e4..df2f8fedce7e 100644
--- a/vllm/model_executor/layers/quantization/kernels/mixed_precision/machete.py
+++ b/vllm/model_executor/layers/quantization/kernels/mixed_precision/machete.py
@@ -8,26 +8,27 @@
 
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.utils.machete_utils import (
-    check_machete_supports_shape, query_machete_supported_group_sizes,
-    query_machete_supported_quant_types)
+    check_machete_supports_shape,
+    query_machete_supported_group_sizes,
+    query_machete_supported_quant_types,
+)
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    pack_quantized_values_into_int32, unpack_quantized_values_into_int32)
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           permute_param_layout_)
+    pack_quantized_values_into_int32,
+    unpack_quantized_values_into_int32,
+)
+from vllm.model_executor.parameter import BasevLLMParameter, permute_param_layout_
 from vllm.platforms import current_platform
 
 from .MPLinearKernel import MPLinearKernel, MPLinearLayerConfig
 
 
 class MacheteLinearKernel(MPLinearKernel):
-
     @classmethod
     def get_min_capability(cls) -> int:
         return 90
 
     @classmethod
-    def can_implement(cls,
-                      c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
+    def can_implement(cls, c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
         # Machete uses CUTLASS, so it can only be compatible with Nvidia
         if not current_platform.is_cuda():
             return False, "Machete only supported on CUDA"
@@ -35,25 +36,33 @@ def can_implement(cls,
         if not current_platform.is_device_capability(90):
             return False, "Machete requires compute capability of 90 (Hopper)"
 
-        if c.has_g_idx and\
-            c.partition_weight_shape[0] != c.full_weight_shape[0]:
-            return False, "Act reordering currently not supported by Machete, "\
-                          "when the input features are partitioned across "\
-                          "devices"
-
-        if c.weight_type not in query_machete_supported_quant_types(
-                c.zero_points):
-            return False, f"Quant type ({c.weight_type}) not supported by "\
-                           "Machete, supported types are: "\
-                           f"{query_machete_supported_quant_types(c.zero_points)}"
+        if c.has_g_idx and c.partition_weight_shape[0] != c.full_weight_shape[0]:
+            return (
+                False,
+                "Act reordering currently not supported by Machete, "
+                "when the input features are partitioned across "
+                "devices",
+            )
+
+        if c.weight_type not in query_machete_supported_quant_types(c.zero_points):
+            return (
+                False,
+                f"Quant type ({c.weight_type}) not supported by "
+                "Machete, supported types are: "
+                f"{query_machete_supported_quant_types(c.zero_points)}",
+            )
 
         if c.group_size not in query_machete_supported_group_sizes(c.act_type):
-            return False, f"Group size ({c.group_size}) not supported by "\
-                            "Machete, supported group sizes are: "\
-                            f"{query_machete_supported_group_sizes(c.act_type)}"
+            return (
+                False,
+                f"Group size ({c.group_size}) not supported by "
+                "Machete, supported group sizes are: "
+                f"{query_machete_supported_group_sizes(c.act_type)}",
+            )
 
-        return check_machete_supports_shape(c.partition_weight_shape[0],
-                                            c.partition_weight_shape[1])
+        return check_machete_supports_shape(
+            c.partition_weight_shape[0], c.partition_weight_shape[1]
+        )
 
     # note assumes that
     #  `weight_packed` is: {input_dim = 0, output_dim = 1, packed_dim = 0}
@@ -64,30 +73,33 @@ def process_weights_after_loading(self, layer: torch.nn.Module):
 
         if c.has_g_idx:
             assert self.w_gidx_name is not None
-            perm = torch.argsort(getattr(layer, self.w_gidx_name))\
-                .to(torch.int)
+            perm = torch.argsort(getattr(layer, self.w_gidx_name)).to(torch.int)
 
             self.act_perm = lambda x: x[:, perm]
             # use `ops.permute_cols` if possible
-            if c.act_type in [torch.float16, torch.bfloat16] \
-                and c.partition_weight_shape[0] % 8 == 0:
+            if (
+                c.act_type in [torch.float16, torch.bfloat16]
+                and c.partition_weight_shape[0] % 8 == 0
+            ):
                 self.act_perm = partial(ops.permute_cols, perm=perm)
 
         def transform_w_q(x):
             assert isinstance(x, BasevLLMParameter)
             permute_param_layout_(x, input_dim=0, output_dim=1, packed_dim=0)
             if c.has_g_idx:
-                x_unpacked = unpack_quantized_values_into_int32(x.data,
-                                                                c.weight_type,
-                                                                packed_dim=0)
+                x_unpacked = unpack_quantized_values_into_int32(
+                    x.data, c.weight_type, packed_dim=0
+                )
                 x_perm = x_unpacked[perm, :]
-                x.data = pack_quantized_values_into_int32(x_perm,
-                                                          c.weight_type,
-                                                          packed_dim=0)
-            x.data = ops.machete_prepack_B(x.data.t().contiguous().t(),
-                                           a_type=c.act_type,
-                                           b_type=c.weight_type,
-                                           group_scales_type=c.act_type)
+                x.data = pack_quantized_values_into_int32(
+                    x_perm, c.weight_type, packed_dim=0
+                )
+            x.data = ops.machete_prepack_B(
+                x.data.t().contiguous().t(),
+                a_type=c.act_type,
+                b_type=c.weight_type,
+                group_scales_type=c.act_type,
+            )
             return x
 
         def transform_w_s(x):
@@ -99,9 +111,9 @@ def transform_w_s(x):
         def transform_w_zp(x):
             assert isinstance(x, BasevLLMParameter)
             permute_param_layout_(x, input_dim=0, output_dim=1, packed_dim=1)
-            x_unpacked = unpack_quantized_values_into_int32(x.data,
-                                                            c.weight_type,
-                                                            packed_dim=1)
+            x_unpacked = unpack_quantized_values_into_int32(
+                x.data, c.weight_type, packed_dim=1
+            )
             w_s = getattr(layer, self.w_s_name).data
             # pre-apply scales to zero-points
             x.data = (-1.0 * w_s * (x_unpacked.to(w_s.dtype))).contiguous()
@@ -113,15 +125,17 @@ def transform_w_zp(x):
         if c.zero_points:
             self._transform_param(layer, self.w_zp_name, transform_w_zp)
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         c = self.config
         w_q, w_s, w_zp, _ = self._get_weight_params(layer)
 
         x_2d = x.reshape(-1, x.shape[-1])
-        out_shape = x.shape[:-1] + (c.partition_weight_shape[1], )
+        out_shape = x.shape[:-1] + (c.partition_weight_shape[1],)
 
         if c.has_g_idx:
             x_2d = self.act_perm(x_2d)
@@ -131,12 +145,14 @@ def apply_weights(self,
         else:
             w_zp = None
 
-        output = ops.machete_mm(a=x_2d,
-                                b_q=w_q,
-                                b_type=c.weight_type,
-                                b_group_zeros=w_zp,
-                                b_group_scales=w_s,
-                                b_group_size=c.group_size)
+        output = ops.machete_mm(
+            a=x_2d,
+            b_q=w_q,
+            b_type=c.weight_type,
+            b_group_zeros=w_zp,
+            b_group_scales=w_s,
+            b_group_size=c.group_size,
+        )
 
         if bias is not None:
             output.add_(bias)  # In-place add
diff --git a/vllm/model_executor/layers/quantization/kernels/mixed_precision/marlin.py b/vllm/model_executor/layers/quantization/kernels/mixed_precision/marlin.py
index 5eb99383097b..0be448e4e3d8 100644
--- a/vllm/model_executor/layers/quantization/kernels/mixed_precision/marlin.py
+++ b/vllm/model_executor/layers/quantization/kernels/mixed_precision/marlin.py
@@ -7,46 +7,58 @@
 
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-    MARLIN_SUPPORTED_GROUP_SIZES, apply_gptq_marlin_linear,
-    check_marlin_supports_shape, marlin_is_k_full, marlin_make_empty_g_idx,
-    marlin_make_workspace_new, marlin_permute_bias, marlin_permute_scales,
-    marlin_sort_g_idx, marlin_zero_points, query_marlin_supported_quant_types,
-    unpack_cols)
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           permute_param_layout_)
+    MARLIN_SUPPORTED_GROUP_SIZES,
+    apply_gptq_marlin_linear,
+    check_marlin_supports_shape,
+    marlin_is_k_full,
+    marlin_make_empty_g_idx,
+    marlin_make_workspace_new,
+    marlin_permute_bias,
+    marlin_permute_scales,
+    marlin_sort_g_idx,
+    marlin_zero_points,
+    query_marlin_supported_quant_types,
+    unpack_cols,
+)
+from vllm.model_executor.parameter import BasevLLMParameter, permute_param_layout_
 from vllm.platforms import current_platform
 
 from .MPLinearKernel import MPLinearKernel, MPLinearLayerConfig
 
 
 class MarlinLinearKernel(MPLinearKernel):
-
     @classmethod
     def get_min_capability(cls) -> int:
         return 80
 
     @classmethod
-    def can_implement(cls,
-                      c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
+    def can_implement(cls, c: MPLinearLayerConfig) -> tuple[bool, Optional[str]]:
         # Marlin uses inline PTX, so it can only be compatible with Nvidia
         if not current_platform.is_cuda():
             return False, "Marlin only supported on CUDA"
 
         quant_types = query_marlin_supported_quant_types(c.zero_points)
         if c.weight_type not in quant_types:
-            return False, f"Quant type ({c.weight_type}) not supported by"\
-                          f"  Marlin, supported types are: {quant_types}"
+            return (
+                False,
+                f"Quant type ({c.weight_type}) not supported by"
+                f"  Marlin, supported types are: {quant_types}",
+            )
 
         if c.group_size not in MARLIN_SUPPORTED_GROUP_SIZES:
-            return False, f"Group size ({c.group_size}) not supported by "\
-                            "Marlin, supported group sizes are: "\
-                            f"{MARLIN_SUPPORTED_GROUP_SIZES}"
+            return (
+                False,
+                f"Group size ({c.group_size}) not supported by "
+                "Marlin, supported group sizes are: "
+                f"{MARLIN_SUPPORTED_GROUP_SIZES}",
+            )
 
         return check_marlin_supports_shape(
             c.partition_weight_shape[1],  # out_features
             c.partition_weight_shape[0],  # in_features
             c.full_weight_shape[0],  # in_features
-            c.group_size)
+            c.group_size,
+        )
 
     # note assumes that
     #  `weight_packed` is: {input_dim = 0, output_dim = 1, packed_dim = 0}
@@ -55,7 +67,7 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         device = getattr(layer, self.w_q_name).device
         c = self.config
 
-        row_parallel = (c.partition_weight_shape[0] != c.full_weight_shape[0])
+        row_parallel = c.partition_weight_shape[0] != c.full_weight_shape[0]
         self.is_k_full = marlin_is_k_full(c.has_g_idx, row_parallel)
 
         # Allocate marlin workspace.
@@ -71,25 +83,30 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         def transform_w_q(x):
             assert isinstance(x, BasevLLMParameter)
             permute_param_layout_(x, input_dim=0, output_dim=1, packed_dim=0)
-            x.data = ops.gptq_marlin_repack(x.data.contiguous(),
-                                            perm=layer.g_idx_sort_indices,
-                                            size_k=c.partition_weight_shape[0],
-                                            size_n=c.partition_weight_shape[1],
-                                            num_bits=c.weight_type.size_bits)
+            x.data = ops.gptq_marlin_repack(
+                x.data.contiguous(),
+                perm=layer.g_idx_sort_indices,
+                size_k=c.partition_weight_shape[0],
+                size_n=c.partition_weight_shape[1],
+                num_bits=c.weight_type.size_bits,
+            )
             return x
 
         def transform_w_s(x):
             assert isinstance(x, BasevLLMParameter)
             permute_param_layout_(x, input_dim=0, output_dim=1)
-            x.data = marlin_permute_scales(x.data.contiguous(),
-                                           size_k=c.partition_weight_shape[0],
-                                           size_n=c.partition_weight_shape[1],
-                                           group_size=c.group_size)
+            x.data = marlin_permute_scales(
+                x.data.contiguous(),
+                size_k=c.partition_weight_shape[0],
+                size_n=c.partition_weight_shape[1],
+                group_size=c.group_size,
+            )
             return x
 
         if c.has_g_idx:
             g_idx, g_idx_sort_indices = marlin_sort_g_idx(
-                getattr(layer, self.w_gidx_name))
+                getattr(layer, self.w_gidx_name)
+            )
             self._transform_param(layer, self.w_gidx_name, lambda _: g_idx)
             layer.g_idx_sort_indices = g_idx_sort_indices
         else:
@@ -97,16 +114,24 @@ def transform_w_s(x):
             layer.g_idx_sort_indices = marlin_make_empty_g_idx(device)
 
         if c.zero_points:
-            grouped_k = (c.partition_weight_shape[0] //
-                         c.group_size if c.group_size != -1 else 1)
-            self._transform_param(layer, self.w_zp_name, lambda x: \
-                marlin_zero_points(
-                    unpack_cols(x.t(), c.weight_type.size_bits,
-                                grouped_k,
-                                c.partition_weight_shape[1]),
+            grouped_k = (
+                c.partition_weight_shape[0] // c.group_size if c.group_size != -1 else 1
+            )
+            self._transform_param(
+                layer,
+                self.w_zp_name,
+                lambda x: marlin_zero_points(
+                    unpack_cols(
+                        x.t(),
+                        c.weight_type.size_bits,
+                        grouped_k,
+                        c.partition_weight_shape[1],
+                    ),
                     size_k=grouped_k,
                     size_n=c.partition_weight_shape[1],
-                    num_bits=c.weight_type.size_bits))
+                    num_bits=c.weight_type.size_bits,
+                ),
+            )
         else:
             setattr(layer, self.w_zp_name, marlin_make_empty_g_idx(device))
         self._transform_param(layer, self.w_q_name, transform_w_q)
@@ -115,10 +140,12 @@ def transform_w_s(x):
         if hasattr(layer, "bias") and layer.bias is not None:
             layer.bias.data = marlin_permute_bias(layer.bias)
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         c = self.config
         w_q, w_s, w_zp, w_gidx = self._get_weight_params(layer)
 
@@ -136,4 +163,5 @@ def apply_weights(self,
             input_size_per_partition=c.partition_weight_shape[0],
             output_size_per_partition=c.partition_weight_shape[1],
             is_k_full=self.is_k_full,
-            bias=bias)
+            bias=bias,
+        )
diff --git a/vllm/model_executor/layers/quantization/kernels/scaled_mm/ScaledMMLinearKernel.py b/vllm/model_executor/layers/quantization/kernels/scaled_mm/ScaledMMLinearKernel.py
index 9ebf5f303792..d9b999e3d5dd 100644
--- a/vllm/model_executor/layers/quantization/kernels/scaled_mm/ScaledMMLinearKernel.py
+++ b/vllm/model_executor/layers/quantization/kernels/scaled_mm/ScaledMMLinearKernel.py
@@ -16,7 +16,6 @@ class ScaledMMLinearLayerConfig:
 
 
 class ScaledMMLinearKernel(ABC):
-
     @classmethod
     @abstractmethod
     def get_min_capability(cls) -> int:
@@ -24,13 +23,18 @@ def get_min_capability(cls) -> int:
 
     @classmethod
     @abstractmethod
-    def can_implement(
-            cls, c: ScaledMMLinearLayerConfig) -> tuple[bool, Optional[str]]:
+    def can_implement(cls, c: ScaledMMLinearLayerConfig) -> tuple[bool, Optional[str]]:
         raise NotImplementedError
 
-    def __init__(self, c: ScaledMMLinearLayerConfig, w_q_param_name: str,
-                 w_s_param_name: str, i_s_param_name: str,
-                 i_zp_param_name: str, azp_adj_param_name: str) -> None:
+    def __init__(
+        self,
+        c: ScaledMMLinearLayerConfig,
+        w_q_param_name: str,
+        w_s_param_name: str,
+        i_s_param_name: str,
+        i_zp_param_name: str,
+        azp_adj_param_name: str,
+    ) -> None:
         assert self.can_implement(c)
         self.config = c
         self.w_q_name = w_q_param_name
@@ -44,20 +48,23 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         raise NotImplementedError
 
     @abstractmethod
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         raise NotImplementedError
 
     def _get_weight_params(
-            self, layer: torch.nn.Module) -> tuple[
-                torch.Tensor,  # weight
-                torch.Tensor,  # weight_scale
-                Optional[torch.Tensor],  # input_scale, 
-                Optional[torch.Tensor],  # input_zp
-                Optional[torch.Tensor],  # azp_adj
-            ]:
+        self, layer: torch.nn.Module
+    ) -> tuple[
+        torch.Tensor,  # weight
+        torch.Tensor,  # weight_scale
+        Optional[torch.Tensor],  # input_scale,
+        Optional[torch.Tensor],  # input_zp
+        Optional[torch.Tensor],  # azp_adj
+    ]:
         return (
             getattr(layer, self.w_q_name),
             getattr(layer, self.w_s_name),
diff --git a/vllm/model_executor/layers/quantization/kernels/scaled_mm/__init__.py b/vllm/model_executor/layers/quantization/kernels/scaled_mm/__init__.py
index 2bc68ab3ebd1..ee5416bae01c 100644
--- a/vllm/model_executor/layers/quantization/kernels/scaled_mm/__init__.py
+++ b/vllm/model_executor/layers/quantization/kernels/scaled_mm/__init__.py
@@ -5,17 +5,24 @@
 from typing import Optional
 
 from vllm.model_executor.layers.quantization.kernels.scaled_mm.aiter import (
-    AiterScaledMMLinearKernel)
+    AiterScaledMMLinearKernel,
+)
 from vllm.model_executor.layers.quantization.kernels.scaled_mm.cpu import (
-    CPUScaledMMLinearKernel)
+    CPUScaledMMLinearKernel,
+)
 from vllm.model_executor.layers.quantization.kernels.scaled_mm.cutlass import (
-    CutlassScaledMMLinearKernel)
+    CutlassScaledMMLinearKernel,
+)
 from vllm.model_executor.layers.quantization.kernels.scaled_mm.ScaledMMLinearKernel import (  # noqa: E501
-    ScaledMMLinearKernel, ScaledMMLinearLayerConfig)
+    ScaledMMLinearKernel,
+    ScaledMMLinearLayerConfig,
+)
 from vllm.model_executor.layers.quantization.kernels.scaled_mm.triton import (
-    TritonScaledMMLinearKernel)
+    TritonScaledMMLinearKernel,
+)
 from vllm.model_executor.layers.quantization.kernels.scaled_mm.xla import (
-    XLAScaledMMLinearKernel)
+    XLAScaledMMLinearKernel,
+)
 from vllm.platforms import PlatformEnum, current_platform
 
 # in priority/performance order (when available)
@@ -28,19 +35,18 @@
 
 
 def choose_scaled_mm_linear_kernel(
-        config: ScaledMMLinearLayerConfig,
-        compute_capability: Optional[int] = None
+    config: ScaledMMLinearLayerConfig, compute_capability: Optional[int] = None
 ) -> type[ScaledMMLinearKernel]:
     """
-    Choose an ScaledMMLinearKernel that can implement the given config for the 
-    given compute capability. Attempts to choose the best kernel in terms of 
+    Choose an ScaledMMLinearKernel that can implement the given config for the
+    given compute capability. Attempts to choose the best kernel in terms of
     performance.
 
     Args:
-        config (ScaledMMLinearLayerConfig): Description of the linear layer 
+        config (ScaledMMLinearLayerConfig): Description of the linear layer
             to be implemented.
         compute_capability (Optional[int], optional): The compute capability of
-            the target device, if None uses `current_platform` to get the 
+            the target device, if None uses `current_platform` to get the
             compute capability. Defaults to None.
 
     Raises:
@@ -57,22 +63,25 @@ def choose_scaled_mm_linear_kernel(
 
     failure_reasons = []
     for kernel in _POSSIBLE_KERNELS[current_platform._enum]:
-        if kernel.__name__ in os.environ.get("VLLM_DISABLED_KERNELS", "")\
-            .split(","):
+        if kernel.__name__ in os.environ.get("VLLM_DISABLED_KERNELS", "").split(","):
             failure_reasons.append(
-                f' {kernel.__name__} disabled by environment variable')
+                f" {kernel.__name__} disabled by environment variable"
+            )
             continue
 
         # If the current platform uses compute_capability,
         # make sure the kernel supports the compute cability.
         if compute_capability is not None:
             kernel_min_capability = kernel.get_min_capability()
-            if (kernel_min_capability is not None
-                    and kernel_min_capability > compute_capability):
+            if (
+                kernel_min_capability is not None
+                and kernel_min_capability > compute_capability
+            ):
                 failure_reasons.append(
                     f"{kernel.__name__} requires capability "
                     f"{kernel_min_capability}, current compute capability "
-                    f"is {compute_capability}")
+                    f"is {compute_capability}"
+                )
                 continue
 
         can_implement, failure_reason = kernel.can_implement(config)
@@ -80,10 +89,10 @@ def choose_scaled_mm_linear_kernel(
             return kernel
         else:
             failure_reasons.append(
-                f' {kernel.__name__} cannot implement due to: {failure_reason}'
+                f" {kernel.__name__} cannot implement due to: {failure_reason}"
             )
 
     raise ValueError(
-        "Failed to find a kernel that can implement the "\
-        "ScaledMM linear layer. Reasons: \n"
-        + '\n'.join(failure_reasons))
+        "Failed to find a kernel that can implement the "
+        "ScaledMM linear layer. Reasons: \n" + "\n".join(failure_reasons)
+    )
diff --git a/vllm/model_executor/layers/quantization/kernels/scaled_mm/aiter.py b/vllm/model_executor/layers/quantization/kernels/scaled_mm/aiter.py
index e8e950a4bb7b..e97beefdd9c2 100644
--- a/vllm/model_executor/layers/quantization/kernels/scaled_mm/aiter.py
+++ b/vllm/model_executor/layers/quantization/kernels/scaled_mm/aiter.py
@@ -22,7 +22,6 @@ def rocm_aiter_gemm_w8a8_impl(
     bias: Optional[torch.Tensor] = None,
     output_dtype: torch.dtype = torch.float16,
 ) -> torch.Tensor:
-
     from aiter import gemm_a8w8_CK
 
     # gemm_a8w8_CK(a, b, scale_a, scale_b, bias) expects
@@ -40,7 +39,6 @@ def rocm_aiter_gemm_w8a8_fake(
     bias: Optional[torch.Tensor] = None,
     output_dtype: torch.dtype = torch.float16,
 ) -> torch.Tensor:
-
     m = A.shape[0]
     n = B.shape[0]
     Y = torch.empty(m, n, dtype=output_dtype, device=A.device)
@@ -56,50 +54,53 @@ def rocm_aiter_gemm_w8a8_fake(
 
 
 class AiterScaledMMLinearKernel(CutlassScaledMMLinearKernel):
-
     @classmethod
     def get_min_capability(cls) -> int:
         return 90
 
     @classmethod
-    def can_implement(
-            cls, c: ScaledMMLinearLayerConfig) -> tuple[bool, Optional[str]]:
+    def can_implement(cls, c: ScaledMMLinearLayerConfig) -> tuple[bool, Optional[str]]:
         if not current_platform.is_rocm():
             return (
                 False,
-                "AiterScaledMMLinearKernel requires `aiter` which is not " +
-                "currently supported on non-ROCm platform.")
+                "AiterScaledMMLinearKernel requires `aiter` which is not "
+                + "currently supported on non-ROCm platform.",
+            )
 
         try:
             import aiter  # noqa: F401 # deliberately attempt to import aiter
         except Exception:
             return (
                 False,
-                "AiterScaledMMLinearKernel requires `aiter` which is not " +
-                "installed on ROCm.")
+                "AiterScaledMMLinearKernel requires `aiter` which is not "
+                + "installed on ROCm.",
+            )
         # Check if rocm_aiter_gemm_w8a8_scaled_mm is enabled
-        if not (
-            envs.VLLM_ROCM_USE_AITER_LINEAR \
-            and envs.VLLM_ROCM_USE_AITER
-        ):
-            return (False, "AiterScaledMMLinearKernel is disabled. " +
-                    "Enable by setting `VLLM_ROCM_USE_AITER=1` " +
-                    "and `VLLM_ROCM_USE_AITER_LINEAR=1`. " +
-                    "`VLLM_ROCM_USE_AITER_LINEAR` default is True.")
+        if not (envs.VLLM_ROCM_USE_AITER_LINEAR and envs.VLLM_ROCM_USE_AITER):
+            return (
+                False,
+                "AiterScaledMMLinearKernel is disabled. "
+                + "Enable by setting `VLLM_ROCM_USE_AITER=1` "
+                + "and `VLLM_ROCM_USE_AITER_LINEAR=1`. "
+                + "`VLLM_ROCM_USE_AITER_LINEAR` default is True.",
+            )
 
         if not c.input_symmetric:
-            return (False,
-                    "AiterScaledMMLinearKernel only supports symmetric " +
-                    "quantization.")
+            return (
+                False,
+                "AiterScaledMMLinearKernel only supports symmetric " + "quantization.",
+            )
         return True, None
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         super().process_weights_after_loading(layer)
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         """
         `AiterScaledMMLinearKernel` implements a fused version of
             `output = torch.mm((scale_a * a), (scale_b * b)).to(out_dtype)`
@@ -116,29 +117,27 @@ def apply_weights(self,
         # * dynamic, i_s is None and x_s computed from x.
         # * static, i_s is scalar and x_s is i_s.
         symmetric = azp_adj is None
-        assert symmetric, ("AiterScaledMMLinearKernel only supports"
-                           " symmetric quantization.")
-        x_q, x_s, x_zp = ops.scaled_int8_quant(x,
-                                               i_s,
-                                               i_zp,
-                                               symmetric=symmetric)
-
-        assert x_zp is None, ("AiterScaledMMLinearKernel only supports"
-                              " symmetric quantization.")
+        assert symmetric, (
+            "AiterScaledMMLinearKernel only supports symmetric quantization."
+        )
+        x_q, x_s, x_zp = ops.scaled_int8_quant(x, i_s, i_zp, symmetric=symmetric)
+
+        assert x_zp is None, (
+            "AiterScaledMMLinearKernel only supports symmetric quantization."
+        )
         out_dtype = x.dtype
 
-        assert (w_q.shape[0] % 16 == 0 and w_q.shape[1] % 16 == 0)
-        assert (out_dtype is torch.bfloat16 or out_dtype is torch.float16)
-        assert bias is None or bias.shape[0] == w_q.shape[
-            1] and bias.dtype == out_dtype
+        assert w_q.shape[0] % 16 == 0 and w_q.shape[1] % 16 == 0
+        assert out_dtype is torch.bfloat16 or out_dtype is torch.float16
+        assert bias is None or bias.shape[0] == w_q.shape[1] and bias.dtype == out_dtype
 
         m = x_q.shape[0]  # a
         n = w_q.shape[1]  # b
 
-        per_tensor_scale_a = (x_s.numel() == 1)
-        per_tensor_scale_b = (w_s.numel() == 1)
-        per_token_scale_a = (x_s.numel() == m)
-        per_channel_scale_b = (w_s.numel() == n)
+        per_tensor_scale_a = x_s.numel() == 1
+        per_tensor_scale_b = w_s.numel() == 1
+        per_token_scale_a = x_s.numel() == m
+        per_channel_scale_b = w_s.numel() == n
 
         # @TODO:
         # Maybe broadcast the per-tensor-scale into per-channel-scale
@@ -146,16 +145,19 @@ def apply_weights(self,
         # For now, it only supports:
         # - per-tensor-per-tensor a8w8 scaled GEMM, and
         # - per-token-per-channel a8w8 scaled GEMM
-        assert ((per_tensor_scale_a and per_tensor_scale_b)
-                or (per_token_scale_a and per_channel_scale_b)), (
-                    "Currently only support per-tensor-per-tensor GEMM " +
-                    " and per-token-per-channel GEMM through AITER"
-                    " w8a8 scaled gemm. `AiterScaledMMLinearKernel` " +
-                    "does not support AITER block scaled GEMM.")
+        assert (per_tensor_scale_a and per_tensor_scale_b) or (
+            per_token_scale_a and per_channel_scale_b
+        ), (
+            "Currently only support per-tensor-per-tensor GEMM "
+            + " and per-token-per-channel GEMM through AITER"
+            " w8a8 scaled gemm. `AiterScaledMMLinearKernel` "
+            + "does not support AITER block scaled GEMM."
+        )
 
         # gemm_a8w8_CK(a, b, scale_a, scale_b, bias) expects
         # a to be [M, K]
         # b to be [N, K]
         # CutlassScaledMMLinearKernel prepare weight `w_q` in [K, N] format
-        return torch.ops.vllm.rocm_aiter_gemm_w8a8(x_q, w_q.t(), x_s, w_s,
-                                                   bias, out_dtype)
+        return torch.ops.vllm.rocm_aiter_gemm_w8a8(
+            x_q, w_q.t(), x_s, w_s, bias, out_dtype
+        )
diff --git a/vllm/model_executor/layers/quantization/kernels/scaled_mm/cpu.py b/vllm/model_executor/layers/quantization/kernels/scaled_mm/cpu.py
index 59d2b5bce962..cb00b0c8af21 100644
--- a/vllm/model_executor/layers/quantization/kernels/scaled_mm/cpu.py
+++ b/vllm/model_executor/layers/quantization/kernels/scaled_mm/cpu.py
@@ -9,24 +9,22 @@
 from vllm import envs
 from vllm.model_executor.layers.quantization.utils import replace_parameter
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    convert_to_channelwise)
+    convert_to_channelwise,
+)
 from vllm.model_executor.layers.utils import check_cpu_sgl_kernel
 from vllm.platforms import current_platform
 from vllm.platforms.interface import CpuArchEnum
 
-from .ScaledMMLinearKernel import (ScaledMMLinearKernel,
-                                   ScaledMMLinearLayerConfig)
+from .ScaledMMLinearKernel import ScaledMMLinearKernel, ScaledMMLinearLayerConfig
 
 
 class CPUScaledMMLinearKernel(ScaledMMLinearKernel):
-
     @classmethod
     def get_min_capability(cls) -> int:
         return 75
 
     @classmethod
-    def can_implement(
-            cls, c: ScaledMMLinearLayerConfig) -> tuple[bool, Optional[str]]:
+    def can_implement(cls, c: ScaledMMLinearLayerConfig) -> tuple[bool, Optional[str]]:
         if not current_platform.is_cpu():
             return False, "CPUScaledMM requires running on CPU."
 
@@ -36,9 +34,12 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         weight = getattr(layer, self.w_q_name)
         dtype = weight.dtype
         N, K = weight.size()
-        if (current_platform.get_cpu_architecture() == CpuArchEnum.X86
-                and envs.VLLM_CPU_SGL_KERNEL and self.config.input_symmetric
-                and check_cpu_sgl_kernel(N, K, dtype)):
+        if (
+            current_platform.get_cpu_architecture() == CpuArchEnum.X86
+            and envs.VLLM_CPU_SGL_KERNEL
+            and self.config.input_symmetric
+            and check_cpu_sgl_kernel(N, K, dtype)
+        ):
             self.linear_method = self._apply_weights_sgl
             self.process_weights_for_sgl(layer)
         else:
@@ -50,8 +51,10 @@ def process_weights_for_onednn(self, layer: torch.nn.Module) -> None:
         # Transpose to [K, N] for convenience
         weight = getattr(layer, self.w_q_name)
         replace_parameter(
-            layer, self.w_q_name,
-            torch.nn.Parameter(weight.t().data, requires_grad=False))
+            layer,
+            self.w_q_name,
+            torch.nn.Parameter(weight.t().data, requires_grad=False),
+        )
 
         # WEIGHT SCALE
         # oneDNN kernels support only per-tensor and per-channel.
@@ -60,11 +63,12 @@ def process_weights_for_onednn(self, layer: torch.nn.Module) -> None:
         is_fused_module = len(layer.logical_widths) > 1
         weight_scale = getattr(layer, self.w_s_name)
         if is_fused_module and not self.config.is_channelwise:
-            weight_scale = convert_to_channelwise(weight_scale,
-                                                  layer.logical_widths)
+            weight_scale = convert_to_channelwise(weight_scale, layer.logical_widths)
         replace_parameter(
-            layer, self.w_s_name,
-            torch.nn.Parameter(weight_scale.data, requires_grad=False))
+            layer,
+            self.w_s_name,
+            torch.nn.Parameter(weight_scale.data, requires_grad=False),
+        )
 
         # INPUT SCALE
         if self.config.is_static_input_scheme:
@@ -72,8 +76,10 @@ def process_weights_for_onednn(self, layer: torch.nn.Module) -> None:
 
             if self.config.input_symmetric:
                 replace_parameter(
-                    layer, self.i_s_name,
-                    torch.nn.Parameter(input_scale.max(), requires_grad=False))
+                    layer,
+                    self.i_s_name,
+                    torch.nn.Parameter(input_scale.max(), requires_grad=False),
+                )
                 setattr(layer, self.i_zp_name, None)
             else:
                 input_zero_point = getattr(layer, self.i_zp_name)
@@ -84,16 +90,17 @@ def process_weights_for_onednn(self, layer: torch.nn.Module) -> None:
                 range_max = (input_scale * (int8_traits.max - azps)).max()
                 range_min = (input_scale * (int8_traits.min - azps)).min()
 
-                scale = (range_max - range_min) / (int8_traits.max -
-                                                   int8_traits.min)
+                scale = (range_max - range_min) / (int8_traits.max - int8_traits.min)
                 replace_parameter(
-                    layer, self.i_s_name,
-                    torch.nn.Parameter(scale, requires_grad=False))
+                    layer, self.i_s_name, torch.nn.Parameter(scale, requires_grad=False)
+                )
 
-                azp = (int8_traits.min -
-                       range_min / scale).round().to(dtype=torch.int32)
-                replace_parameter(layer, self.i_zp_name,
-                                  torch.nn.Parameter(azp, requires_grad=False))
+                azp = (
+                    (int8_traits.min - range_min / scale).round().to(dtype=torch.int32)
+                )
+                replace_parameter(
+                    layer, self.i_zp_name, torch.nn.Parameter(azp, requires_grad=False)
+                )
 
         else:
             setattr(layer, self.i_s_name, None)
@@ -105,14 +112,16 @@ def process_weights_for_onednn(self, layer: torch.nn.Module) -> None:
         # s_a * s_b * [(A - zp_a)B] + bias =
         # s_a * (s_b * AB) - s_a * s_b * zp_a * B + bias =
         # s_a * GEMM_output - s_a * zp_a * adj + bias
-        if not (self.config.input_symmetric
-                and self.config.is_static_input_scheme):
+        if not (self.config.input_symmetric and self.config.is_static_input_scheme):
             weight = getattr(layer, self.w_q_name)
             weight_scale = getattr(layer, self.w_s_name)
             azp_adj = weight.sum(dim=0, keepdim=True, dtype=torch.float32)
             azp_adj = azp_adj * weight_scale.squeeze()
-            setattr(layer, self.azp_adj_name,
-                    torch.nn.Parameter(azp_adj, requires_grad=False))
+            setattr(
+                layer,
+                self.azp_adj_name,
+                torch.nn.Parameter(azp_adj, requires_grad=False),
+            )
         else:
             setattr(layer, self.azp_adj_name, None)
 
@@ -135,34 +144,37 @@ def process_weights_for_sgl(self, layer: torch.nn.Module) -> None:
         weight = getattr(layer, self.w_q_name)
         packed_weight = torch.ops._C.convert_weight_packed(weight)
         replace_parameter(
-            layer, self.w_q_name,
-            torch.nn.Parameter(packed_weight, requires_grad=False))
+            layer, self.w_q_name, torch.nn.Parameter(packed_weight, requires_grad=False)
+        )
 
         if layer.bias is not None:
             bias = layer.bias
             layer.register_parameter(
-                "bias_fp32",
-                torch.nn.Parameter(bias.float().data, requires_grad=False))
+                "bias_fp32", torch.nn.Parameter(bias.float().data, requires_grad=False)
+            )
 
         # WEIGHT SCALE
         # CPU SGL kernels only support per-channel.
         # For per-tensor quant, convert to the per-channel case.
         weight_scale = getattr(layer, self.w_s_name)
         if not self.config.is_channelwise:
-            weight_scale = convert_to_channelwise(weight_scale,
-                                                  layer.logical_widths)
+            weight_scale = convert_to_channelwise(weight_scale, layer.logical_widths)
         replace_parameter(
-            layer, self.w_s_name,
-            torch.nn.Parameter(weight_scale.data, requires_grad=False))
+            layer,
+            self.w_s_name,
+            torch.nn.Parameter(weight_scale.data, requires_grad=False),
+        )
 
         setattr(layer, self.i_s_name, None)
         setattr(layer, self.i_zp_name, None)
         setattr(layer, self.azp_adj_name, None)
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         return self.linear_method(
             layer,
             x,
@@ -170,31 +182,33 @@ def apply_weights(self,
         )
 
     def _apply_weights_onednn(
-            self,
-            layer: torch.nn.Module,
-            x: torch.Tensor,
-            bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         w_q, w_s, i_s, i_zp, azp_adj = self._get_weight_params(layer)
 
         # ops.scaled_int8_quant supports both dynamic and static quant:
         # * dynamic, i_s is None and x_s computed from x.
         # * static, i_s is scalar and x_s is i_s.
         x_q, x_s, x_zp = ops.onednn_scaled_int8_quant(
-            x, i_s, i_zp, self.config.input_symmetric)
+            x, i_s, i_zp, self.config.input_symmetric
+        )
 
         m = x.size(0)
         n = self.dnnl_handler.n
         out = torch.empty((m, n), dtype=x.dtype)
-        ops.onednn_scaled_mm(self.dnnl_handler, x_q, out, x_s, x_zp, azp_adj,
-                             bias)
+        ops.onednn_scaled_mm(self.dnnl_handler, x_q, out, x_s, x_zp, azp_adj, bias)
 
         return out
 
     def _apply_weights_sgl(
-            self,
-            layer: torch.nn.Module,
-            x: torch.Tensor,
-            bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         w_q, w_s, _, _, _ = self._get_weight_params(layer)
         return torch.ops._C.int8_scaled_mm_with_quant(
             x,
diff --git a/vllm/model_executor/layers/quantization/kernels/scaled_mm/cutlass.py b/vllm/model_executor/layers/quantization/kernels/scaled_mm/cutlass.py
index 2f982f96b0d0..f1dafdf14c7a 100644
--- a/vllm/model_executor/layers/quantization/kernels/scaled_mm/cutlass.py
+++ b/vllm/model_executor/layers/quantization/kernels/scaled_mm/cutlass.py
@@ -8,23 +8,20 @@
 from vllm import _custom_ops as ops
 from vllm.model_executor.layers.quantization.utils import replace_parameter
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    convert_to_channelwise)
+    convert_to_channelwise,
+)
 from vllm.platforms import current_platform
 
-from .ScaledMMLinearKernel import (ScaledMMLinearKernel,
-                                   ScaledMMLinearLayerConfig)
+from .ScaledMMLinearKernel import ScaledMMLinearKernel, ScaledMMLinearLayerConfig
 
 
 class CutlassScaledMMLinearKernel(ScaledMMLinearKernel):
-
     @classmethod
     def get_min_capability(cls) -> int:
         return 75
 
     @classmethod
-    def can_implement(
-            cls, c: ScaledMMLinearLayerConfig) -> tuple[bool, Optional[str]]:
-
+    def can_implement(cls, c: ScaledMMLinearLayerConfig) -> tuple[bool, Optional[str]]:
         if not current_platform.is_cuda():
             return False, "CutlassScaledMM requires running on CUDA."
 
@@ -35,8 +32,10 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         # Cutlass kernels need transposed weight.
         weight = getattr(layer, self.w_q_name)
         replace_parameter(
-            layer, self.w_q_name,
-            torch.nn.Parameter(weight.t().data, requires_grad=False))
+            layer,
+            self.w_q_name,
+            torch.nn.Parameter(weight.t().data, requires_grad=False),
+        )
 
         # WEIGHT SCALE
         # Cutlass kernels support only per-tensor and per-channel.
@@ -45,11 +44,12 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         is_fused_module = len(layer.logical_widths) > 1
         weight_scale = getattr(layer, self.w_s_name)
         if is_fused_module and not self.config.is_channelwise:
-            weight_scale = convert_to_channelwise(weight_scale,
-                                                  layer.logical_widths)
+            weight_scale = convert_to_channelwise(weight_scale, layer.logical_widths)
         replace_parameter(
-            layer, self.w_s_name,
-            torch.nn.Parameter(weight_scale.data, requires_grad=False))
+            layer,
+            self.w_s_name,
+            torch.nn.Parameter(weight_scale.data, requires_grad=False),
+        )
 
         # INPUT SCALE
         if self.config.is_static_input_scheme:
@@ -57,8 +57,10 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
 
             if self.config.input_symmetric:
                 replace_parameter(
-                    layer, self.i_s_name,
-                    torch.nn.Parameter(input_scale.max(), requires_grad=False))
+                    layer,
+                    self.i_s_name,
+                    torch.nn.Parameter(input_scale.max(), requires_grad=False),
+                )
                 setattr(layer, self.i_zp_name, None)
             else:
                 input_zero_point = getattr(layer, self.i_zp_name)
@@ -69,17 +71,16 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
                 range_max = (input_scale * (int8_traits.max - azps)).max()
                 range_min = (input_scale * (int8_traits.min - azps)).min()
 
-                scale = (range_max - range_min) / (int8_traits.max -
-                                                   int8_traits.min)
+                scale = (range_max - range_min) / (int8_traits.max - int8_traits.min)
                 replace_parameter(
-                    layer, self.i_s_name,
-                    torch.nn.Parameter(scale, requires_grad=False))
+                    layer, self.i_s_name, torch.nn.Parameter(scale, requires_grad=False)
+                )
 
                 # AZP loaded as int8 but used as int32
-                azp = (int8_traits.min -
-                       range_min / scale).to(dtype=torch.int32)
-                replace_parameter(layer, self.i_zp_name,
-                                  torch.nn.Parameter(azp, requires_grad=False))
+                azp = (int8_traits.min - range_min / scale).to(dtype=torch.int32)
+                replace_parameter(
+                    layer, self.i_zp_name, torch.nn.Parameter(azp, requires_grad=False)
+                )
 
         else:
             setattr(layer, self.i_s_name, None)
@@ -97,41 +98,44 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
                 # cutlass_w8a8 requires azp to be folded into azp_adj
                 # in the per-tensor case
                 azp_adj = getattr(layer, self.i_zp_name) * azp_adj
-            setattr(layer, self.azp_adj_name,
-                    torch.nn.Parameter(azp_adj, requires_grad=False))
+            setattr(
+                layer,
+                self.azp_adj_name,
+                torch.nn.Parameter(azp_adj, requires_grad=False),
+            )
         else:
             setattr(layer, self.azp_adj_name, None)
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         w_q, w_s, i_s, i_zp, azp_adj = self._get_weight_params(layer)
 
         # ops.scaled_int8_quant supports both dynamic and static quant:
         # * dynamic, i_s is None and x_s computed from x.
         # * static, i_s is scalar and x_s is i_s.
         symmetric = azp_adj is None
-        x_q, x_s, x_zp = ops.scaled_int8_quant(x.contiguous(),
-                                               i_s,
-                                               i_zp,
-                                               symmetric=symmetric)
+        x_q, x_s, x_zp = ops.scaled_int8_quant(
+            x.contiguous(), i_s, i_zp, symmetric=symmetric
+        )
 
         if x_zp is not None:
             # Currently, static is always per-tensor and dynamic is per-token
             static = i_zp is not None
             azp = None if static else x_zp
-            return ops.cutlass_scaled_mm_azp(x_q,
-                                             w_q,
-                                             scale_a=x_s,
-                                             scale_b=w_s,
-                                             out_dtype=x.dtype,
-                                             azp_adj=azp_adj,
-                                             azp=azp,
-                                             bias=bias)
-        return ops.cutlass_scaled_mm(x_q,
-                                     w_q,
-                                     scale_a=x_s,
-                                     scale_b=w_s,
-                                     out_dtype=x.dtype,
-                                     bias=bias)
+            return ops.cutlass_scaled_mm_azp(
+                x_q,
+                w_q,
+                scale_a=x_s,
+                scale_b=w_s,
+                out_dtype=x.dtype,
+                azp_adj=azp_adj,
+                azp=azp,
+                bias=bias,
+            )
+        return ops.cutlass_scaled_mm(
+            x_q, w_q, scale_a=x_s, scale_b=w_s, out_dtype=x.dtype, bias=bias
+        )
diff --git a/vllm/model_executor/layers/quantization/kernels/scaled_mm/triton.py b/vllm/model_executor/layers/quantization/kernels/scaled_mm/triton.py
index 817565cf2827..7e21afca5750 100644
--- a/vllm/model_executor/layers/quantization/kernels/scaled_mm/triton.py
+++ b/vllm/model_executor/layers/quantization/kernels/scaled_mm/triton.py
@@ -12,30 +12,32 @@
 
 
 class TritonScaledMMLinearKernel(CutlassScaledMMLinearKernel):
-
     @classmethod
     def get_min_capability(cls) -> int:
         return 75
 
     @classmethod
-    def can_implement(
-            cls, c: ScaledMMLinearLayerConfig) -> tuple[bool, Optional[str]]:
+    def can_implement(cls, c: ScaledMMLinearLayerConfig) -> tuple[bool, Optional[str]]:
         if current_platform.is_cpu():
             return (
                 False,
-                "TritonScaledMMLinearKernel requires Triton which is not " +
-                "currently supported on CPU.")
+                "TritonScaledMMLinearKernel requires Triton which is not "
+                + "currently supported on CPU.",
+            )
         if not c.input_symmetric:
-            return (False,
-                    "TritonScaledMMLinearKernel only supports symmetric " +
-                    "quantization.")
+            return (
+                False,
+                "TritonScaledMMLinearKernel only supports symmetric " + "quantization.",
+            )
         return True, None
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         super().process_weights_after_loading(layer)
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         return super().apply_weights(layer, x, bias)
diff --git a/vllm/model_executor/layers/quantization/kernels/scaled_mm/xla.py b/vllm/model_executor/layers/quantization/kernels/scaled_mm/xla.py
index 0b931b2d8b81..63eee1e28861 100644
--- a/vllm/model_executor/layers/quantization/kernels/scaled_mm/xla.py
+++ b/vllm/model_executor/layers/quantization/kernels/scaled_mm/xla.py
@@ -9,25 +9,23 @@
 
 from vllm.model_executor.layers.quantization.utils import replace_parameter
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    convert_to_channelwise)
+    convert_to_channelwise,
+)
 from vllm.platforms import current_platform
 
-from .ScaledMMLinearKernel import (ScaledMMLinearKernel,
-                                   ScaledMMLinearLayerConfig)
+from .ScaledMMLinearKernel import ScaledMMLinearKernel, ScaledMMLinearLayerConfig
 
 
 class XLAScaledMMLinearKernel(ScaledMMLinearKernel):
-
     @classmethod
     def get_min_capability(cls) -> int:
         raise NotImplementedError(
             "TPU platform does have a concept of compute capability, "
-            "this method should not be called.")
+            "this method should not be called."
+        )
 
     @classmethod
-    def can_implement(
-            cls, c: ScaledMMLinearLayerConfig) -> tuple[bool, Optional[str]]:
-
+    def can_implement(cls, c: ScaledMMLinearLayerConfig) -> tuple[bool, Optional[str]]:
         if not current_platform.is_tpu():
             return False, "ScaledMMXLA requires running on TPU."
 
@@ -46,8 +44,9 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         # WEIGHT
         # [out, in] (different than cutlass_scaled_mm)
         weight = getattr(layer, self.w_q_name)
-        replace_parameter(layer, self.w_q_name,
-                          torch.nn.Parameter(weight.data, requires_grad=False))
+        replace_parameter(
+            layer, self.w_q_name, torch.nn.Parameter(weight.data, requires_grad=False)
+        )
 
         # WEIGHT SCALE
         # XLA kernels support only per-tensor and per-channel.
@@ -56,14 +55,15 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         is_fused_module = len(layer.logical_widths) > 1
         weight_scale = getattr(layer, self.w_s_name)
         if is_fused_module and not self.config.is_channelwise:
-            weight_scale = convert_to_channelwise(weight_scale,
-                                                  layer.logical_widths)
+            weight_scale = convert_to_channelwise(weight_scale, layer.logical_widths)
 
         # [out_channel,] (different than cutlass_scaled_mm)
         weight_scale = weight_scale.squeeze(-1)
         replace_parameter(
-            layer, self.w_s_name,
-            torch.nn.Parameter(weight_scale.data, requires_grad=False))
+            layer,
+            self.w_s_name,
+            torch.nn.Parameter(weight_scale.data, requires_grad=False),
+        )
 
         # Only support symmetric dynamic activation quantization.
         setattr(layer, self.i_s_name, None)
@@ -74,8 +74,7 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         # to specialize the graph since bias is not dynamic.
         warnings.filterwarnings(
             "ignore",
-            message=
-            "Pred is a Python constant. When used with torch.cond, it specializes on one of the branches."  # noqa: E501
+            message="Pred is a Python constant. When used with torch.cond, it specializes on one of the branches.",  # noqa: E501
         )
 
     def no_add_bias(self, x: torch.Tensor, bias: Optional[torch.Tensor]):
@@ -84,14 +83,17 @@ def no_add_bias(self, x: torch.Tensor, bias: Optional[torch.Tensor]):
     def add_bias(self, x: torch.Tensor, bias: Optional[torch.Tensor]):
         return x + bias
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         w_q, w_s, _, _, _ = self._get_weight_params(layer)
 
         # Required to register custom ops.
         import torch_xla.experimental.custom_kernel  # noqa: F401
+
         out = torch.ops.xla.quantized_matmul_int8(
             x,
             w_q,
diff --git a/vllm/model_executor/layers/quantization/kv_cache.py b/vllm/model_executor/layers/quantization/kv_cache.py
index 27e2b7846d38..78456dcf1ca5 100644
--- a/vllm/model_executor/layers/quantization/kv_cache.py
+++ b/vllm/model_executor/layers/quantization/kv_cache.py
@@ -5,7 +5,9 @@
 
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.platforms import current_platform
 
 logger = init_logger(__name__)
@@ -14,12 +16,12 @@
 class BaseKVCacheMethod(QuantizeMethodBase):
     """
     Quant method that adds `_k_scale` and `_v_scale` attributes to the
-    Attention layer to support loading those scaling factors from checkpoints. 
+    Attention layer to support loading those scaling factors from checkpoints.
     The k/v_scale will be used to:
         - quantize k/v_cache entries before saving them to the cache
         - dequantize k/v_cache entries before fetching them from the cache
 
-    :param quant_config: the appropriate QuantizationConfig 
+    :param quant_config: the appropriate QuantizationConfig
     """
 
     def __init__(self, quant_config: QuantizationConfig):
@@ -33,19 +35,14 @@ def create_weights(self, layer: torch.nn.Module):
         # Initialize the Q and KV cache scales to -1.0, an invalid value.
         # If the q and k/v_scales appear in the checkpoint, it will be
         # overwritten when loading weights.
-        layer.q_scale = torch.nn.Parameter(torch.tensor(-1.0),
-                                           requires_grad=False)
-        layer.k_scale = torch.nn.Parameter(torch.tensor(-1.0),
-                                           requires_grad=False)
-        layer.v_scale = torch.nn.Parameter(torch.tensor(-1.0),
-                                           requires_grad=False)
+        layer.q_scale = torch.nn.Parameter(torch.tensor(-1.0), requires_grad=False)
+        layer.k_scale = torch.nn.Parameter(torch.tensor(-1.0), requires_grad=False)
+        layer.v_scale = torch.nn.Parameter(torch.tensor(-1.0), requires_grad=False)
         # Initialize P = softmax(QK^T) scales
-        layer.prob_scale = torch.nn.Parameter(torch.tensor(-1.0),
-                                              requires_grad=False)
+        layer.prob_scale = torch.nn.Parameter(torch.tensor(-1.0), requires_grad=False)
 
     def apply(self, layer: torch.nn.Module) -> torch.Tensor:
-        raise RuntimeError(
-            f"{self.__class__.__name__}.apply should not be called.")
+        raise RuntimeError(f"{self.__class__.__name__}.apply should not be called.")
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         # If the kv-cache dtype is auto, we enforce the k/v_scale to be 1.0
@@ -77,16 +74,17 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
                     k_scale *= 2
                     v_scale *= 2
 
-            if not isinstance(k_scale, float) or not isinstance(
-                    v_scale, float):
-                raise ValueError("Only support per-tensor scaling factor "
-                                 "for fp8 KV cache")
+            if not isinstance(k_scale, float) or not isinstance(v_scale, float):
+                raise ValueError(
+                    "Only support per-tensor scaling factor for fp8 KV cache"
+                )
 
             if layer.q_scale < 0.0:
                 logger.warning_once(
                     "Checkpoint does not provide a q scaling factor. "
                     "Setting it to k_scale. This only matters for "
-                    "FP8 Attention backends (flash-attn or flashinfer).")
+                    "FP8 Attention backends (flash-attn or flashinfer)."
+                )
                 layer._q_scale.copy_(k_scale)
                 layer._q_scale_float = k_scale
 
@@ -95,12 +93,12 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             layer._v_scale.copy_(v_scale)
             layer._k_scale_float = k_scale
             layer._v_scale_float = v_scale
-            if (k_scale == 1.0 and v_scale == 1.0
-                    and "e5m2" not in layer.kv_cache_dtype):
+            if k_scale == 1.0 and v_scale == 1.0 and "e5m2" not in layer.kv_cache_dtype:
                 logger.warning_once(
                     "Using KV cache scaling factor 1.0 for fp8_e4m3. "
                     "If this is unintended, verify that k/v_scale "
-                    "scaling factors are properly set in the checkpoint.")
+                    "scaling factors are properly set in the checkpoint."
+                )
 
         if layer.q_scale > 0.0:
             q_scale = layer.q_scale
@@ -116,26 +114,31 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         else:
             prob_scale = 1.0
 
-        is_singleton_float = lambda x: isinstance(x, float) or isinstance(
-            x, torch.Tensor) and x.numel() == 1 and x.is_floating_point()
-        if not is_singleton_float(q_scale) or not is_singleton_float(
-                prob_scale):
-            raise ValueError("Only support per-tensor scaling factor"
-                             "for fp8-quantized Q/prob")
+        is_singleton_float = (
+            lambda x: isinstance(x, float)
+            or isinstance(x, torch.Tensor)
+            and x.numel() == 1
+            and x.is_floating_point()
+        )
+        if not is_singleton_float(q_scale) or not is_singleton_float(prob_scale):
+            raise ValueError(
+                "Only support per-tensor scaling factorfor fp8-quantized Q/prob"
+            )
 
         # These are used in the final Attention.forward()
         layer._q_scale.copy_(q_scale)
-        layer._q_scale_float = q_scale.item() if isinstance(
-            q_scale, torch.Tensor) else q_scale
+        layer._q_scale_float = (
+            q_scale.item() if isinstance(q_scale, torch.Tensor) else q_scale
+        )
 
         layer._prob_scale.copy_(prob_scale)
-        if layer.kv_cache_dtype == "fp8" and (q_scale == 1.0
-                                              or prob_scale == 1.0):
+        if layer.kv_cache_dtype == "fp8" and (q_scale == 1.0 or prob_scale == 1.0):
             logger.warning_once(
                 f"Using uncalibrated q_scale {q_scale} and/or prob_scale "
                 f"{prob_scale} with fp8 attention. This may cause accuracy "
                 "issues. Please make sure q/prob scaling factors are "
-                "available in the fp8 checkpoint.")
+                "available in the fp8 checkpoint."
+            )
 
         del layer.k_scale
         del layer.v_scale
diff --git a/vllm/model_executor/layers/quantization/modelopt.py b/vllm/model_executor/layers/quantization/modelopt.py
index 1ca82cdcbc78..8c074ebdc8db 100644
--- a/vllm/model_executor/layers/quantization/modelopt.py
+++ b/vllm/model_executor/layers/quantization/modelopt.py
@@ -12,40 +12,70 @@
 from vllm._custom_ops import cutlass_scaled_fp4_mm, scaled_fp4_quant
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe.config import (
-    FusedMoEConfig, FusedMoEQuantConfig, fp8_w8a8_moe_quant_config,
-    nvfp4_moe_quant_config)
+    FusedMoEConfig,
+    FusedMoEQuantConfig,
+    fp8_w8a8_moe_quant_config,
+    nvfp4_moe_quant_config,
+)
 from vllm.model_executor.layers.fused_moe.flashinfer_cutlass_moe import (
-    is_valid_flashinfer_cutlass_fused_moe)
+    is_valid_flashinfer_cutlass_fused_moe,
+)
 from vllm.model_executor.layers.fused_moe.layer import (
-    FusedMoE, FusedMoEMethodBase, FusedMoeWeightScaleSupported)
-from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
-                                               UnquantizedLinearMethod)
+    FusedMoE,
+    FusedMoEMethodBase,
+    FusedMoeWeightScaleSupported,
+)
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    LinearMethodBase,
+    UnquantizedLinearMethod,
+)
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.layers.quantization.kv_cache import BaseKVCacheMethod
 from vllm.model_executor.layers.quantization.utils.flashinfer_fp4_moe import (
-    build_flashinfer_fp4_cutlass_moe_prepare_finalize, reorder_w1w3_to_w3w1,
-    select_nvfp4_gemm_impl)
+    build_flashinfer_fp4_cutlass_moe_prepare_finalize,
+    reorder_w1w3_to_w3w1,
+    select_nvfp4_gemm_impl,
+)
 from vllm.model_executor.layers.quantization.utils.flashinfer_utils import (
-    FlashinferMoeBackend, apply_flashinfer_per_tensor_scale_fp8,
+    FlashinferMoeBackend,
+    apply_flashinfer_per_tensor_scale_fp8,
     build_flashinfer_fp8_cutlass_moe_prepare_finalize,
-    flashinfer_cutlass_moe_fp8, get_flashinfer_moe_backend,
-    register_moe_scaling_factors, rotate_flashinfer_fp8_moe_weights,
-    select_cutlass_fp8_gemm_impl, swap_w13_to_w31)
+    flashinfer_cutlass_moe_fp8,
+    get_flashinfer_moe_backend,
+    register_moe_scaling_factors,
+    rotate_flashinfer_fp8_moe_weights,
+    select_cutlass_fp8_gemm_impl,
+    swap_w13_to_w31,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp4 import (
-    apply_fp4_marlin_linear, is_fp4_marlin_supported,
-    prepare_fp4_layer_for_marlin, prepare_moe_fp4_layer_for_marlin)
+    apply_fp4_marlin_linear,
+    is_fp4_marlin_supported,
+    prepare_fp4_layer_for_marlin,
+    prepare_moe_fp4_layer_for_marlin,
+)
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape, cutlass_fp4_supported, is_layer_skipped, swizzle_blockscale)
+    GroupShape,
+    cutlass_fp4_supported,
+    is_layer_skipped,
+    swizzle_blockscale,
+)
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    Fp8LinearOp, requantize_with_max_scale)
-from vllm.model_executor.parameter import (ModelWeightParameter,
-                                           PerTensorScaleParameter)
+    Fp8LinearOp,
+    requantize_with_max_scale,
+)
+from vllm.model_executor.parameter import ModelWeightParameter, PerTensorScaleParameter
 from vllm.scalar_type import scalar_types
 from vllm.utils import next_power_of_2
-from vllm.utils.flashinfer import (flashinfer_scaled_fp4_mm, has_flashinfer,
-                                   has_flashinfer_moe)
+from vllm.utils.flashinfer import (
+    flashinfer_scaled_fp4_mm,
+    has_flashinfer,
+    has_flashinfer_moe,
+)
 
 if TYPE_CHECKING:
     from vllm.model_executor.models.utils import WeightsMapper
@@ -70,8 +100,10 @@ def __init__(
         self.kv_cache_quant_method = kv_cache_quant_method
         self.exclude_modules = exclude_modules or []
         if is_checkpoint_fp8_serialized:
-            logger.warning("Detected ModelOpt fp8 checkpoint. Please note that"
-                           " the format is experimental and could change.")
+            logger.warning(
+                "Detected ModelOpt fp8 checkpoint. Please note that"
+                " the format is experimental and could change."
+            )
 
     @classmethod
     def get_name(cls) -> QuantizationMethods:
@@ -91,12 +123,12 @@ def get_config_filenames(cls) -> list[str]:
 
     def apply_vllm_mapper(self, hf_to_vllm_mapper: "WeightsMapper"):
         if self.exclude_modules is not None:
-            self.exclude_modules = hf_to_vllm_mapper.apply_list(
-                self.exclude_modules)
+            self.exclude_modules = hf_to_vllm_mapper.apply_list(self.exclude_modules)
 
     @classmethod
     def override_quantization_method(
-            cls, hf_quant_cfg, user_quant) -> Optional[QuantizationMethods]:
+        cls, hf_quant_cfg, user_quant
+    ) -> Optional[QuantizationMethods]:
         """Detect if this ModelOpt config should be used based on
         quantization config."""
 
@@ -132,8 +164,7 @@ def from_config(cls, config: dict[str, Any]) -> "ModelOptFp8Config":
             # ModelOpt format: {"quantization": {"quant_algo": "..."}}
             quant_config = cls.get_from_keys(config, ["quantization"])
             if not isinstance(quant_config, dict):
-                raise ValueError(
-                    "Expected 'quantization' to be a dictionary in config")
+                raise ValueError("Expected 'quantization' to be a dictionary in config")
             quant_method = quant_config.get("quant_algo", "")
             if not quant_method:
                 raise ValueError("Missing 'quant_algo' in quantization config")
@@ -153,11 +184,11 @@ def from_config(cls, config: dict[str, Any]) -> "ModelOptFp8Config":
                 f"ModelOpt currently only supports: {QUANT_ALGOS} "
                 "quantizations in vLLM. Please check the "
                 "`hf_quant_config.json` file for your model's "
-                "quant configuration.")
-        is_checkpoint_fp8_serialized = ("FP8" in quant_method)
+                "quant configuration."
+            )
+        is_checkpoint_fp8_serialized = "FP8" in quant_method
 
-        return cls(is_checkpoint_fp8_serialized, kv_cache_quant_method,
-                   exclude_modules)
+        return cls(is_checkpoint_fp8_serialized, kv_cache_quant_method, exclude_modules)
 
     def is_layer_excluded(self, prefix: str) -> bool:
         """
@@ -172,28 +203,32 @@ def is_layer_excluded(self, prefix: str) -> bool:
             return False
 
         # First check exact matching with fused layer support
-        if is_layer_skipped(prefix, self.exclude_modules,
-                            self.packed_modules_mapping):
+        if is_layer_skipped(prefix, self.exclude_modules, self.packed_modules_mapping):
             return True
 
         # Then check substring matching for patterns not caught by exact match
         for module in self.exclude_modules:
             # Skip exact matches already handled above
-            if (module != prefix and
-                (module in prefix or
-                 (prefix.startswith("language_model.")
-                  and module in prefix.removeprefix("language_model.")))):
+            if module != prefix and (
+                module in prefix
+                or (
+                    prefix.startswith("language_model.")
+                    and module in prefix.removeprefix("language_model.")
+                )
+            ):
                 return True
         return False
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         from vllm.attention.layer import Attention  # Avoid circular import
+
         if isinstance(layer, LinearBase):
             if self.is_layer_excluded(prefix):
                 return UnquantizedLinearMethod()
             # Check if this is a vision model layer that should not be quantized
-            if ("vision_tower" in prefix or "vision_model" in prefix):
+            if "vision_tower" in prefix or "vision_model" in prefix:
                 return UnquantizedLinearMethod()
             return ModelOptFp8LinearMethod(self)
         elif isinstance(layer, Attention):
@@ -218,7 +253,8 @@ class ModelOptFp8LinearMethod(LinearMethodBase):
     def __init__(self, quant_config: ModelOptFp8Config) -> None:
         self.quant_config = quant_config
         self.fp8_linear = Fp8LinearOp(
-            act_quant_static=True, act_quant_group_shape=GroupShape.PER_TENSOR)
+            act_quant_static=True, act_quant_group_shape=GroupShape.PER_TENSOR
+        )
 
     def create_weights(
         self,
@@ -236,29 +272,34 @@ def create_weights(
         layer.logical_widths = output_partition_sizes
         layer.input_size_per_partition = input_size_per_partition
         layer.output_size_per_partition = output_size_per_partition
-        weight_dtype = (torch.float8_e4m3fn
-                        if self.quant_config.is_checkpoint_fp8_serialized else
-                        params_dtype)
-        weight = ModelWeightParameter(data=torch.empty(
-            output_size_per_partition,
-            input_size_per_partition,
-            dtype=weight_dtype),
-                                      input_dim=1,
-                                      output_dim=0,
-                                      weight_loader=weight_loader)
+        weight_dtype = (
+            torch.float8_e4m3fn
+            if self.quant_config.is_checkpoint_fp8_serialized
+            else params_dtype
+        )
+        weight = ModelWeightParameter(
+            data=torch.empty(
+                output_size_per_partition, input_size_per_partition, dtype=weight_dtype
+            ),
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("weight", weight)
 
         if self.quant_config.is_checkpoint_fp8_serialized:
             # WEIGHT SCALE
-            weight_scale = PerTensorScaleParameter(data=torch.empty(
-                len(output_partition_sizes), dtype=torch.float32),
-                                                   weight_loader=weight_loader)
+            weight_scale = PerTensorScaleParameter(
+                data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
+                weight_loader=weight_loader,
+            )
             weight_scale[:] = torch.finfo(torch.float32).min
             layer.register_parameter("weight_scale", weight_scale)
             # INPUT SCALE
-            scale = PerTensorScaleParameter(data=torch.empty(
-                len(output_partition_sizes), dtype=torch.float32),
-                                            weight_loader=weight_loader)
+            scale = PerTensorScaleParameter(
+                data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
+                weight_loader=weight_loader,
+            )
 
             scale[:] = torch.finfo(torch.float32).min
             layer.register_parameter("input_scale", scale)
@@ -268,11 +309,11 @@ def process_weights_after_loading(self, layer: Module) -> None:
         max_w_scale = layer.weight_scale.max()
         if not (layer.weight_scale == layer.weight_scale[0]).all():
             max_w_scale, weight = requantize_with_max_scale(
-                layer.weight, layer.weight_scale, layer.logical_widths)
+                layer.weight, layer.weight_scale, layer.logical_widths
+            )
         layer.weight = Parameter(weight.t(), requires_grad=False)
         layer.weight_scale = Parameter(max_w_scale, requires_grad=False)
-        layer.input_scale = Parameter(layer.input_scale.max(),
-                                      requires_grad=False)
+        layer.input_scale = Parameter(layer.input_scale.max(), requires_grad=False)
 
     def apply(
         self,
@@ -280,11 +321,13 @@ def apply(
         x: torch.Tensor,
         bias: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-        return self.fp8_linear.apply(input=x,
-                                     weight=layer.weight,
-                                     weight_scale=layer.weight_scale,
-                                     input_scale=layer.input_scale,
-                                     bias=bias)
+        return self.fp8_linear.apply(
+            input=x,
+            weight=layer.weight,
+            weight_scale=layer.weight_scale,
+            input_scale=layer.input_scale,
+            bias=bias,
+        )
 
 
 class ModelOptFp8MoEMethod(FusedMoEMethodBase):
@@ -304,7 +347,9 @@ def __init__(
         self.layer = layer
         self.quant_config = quant_config
         from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-            cutlass_fp8_supported)
+            cutlass_fp8_supported,
+        )
+
         self.cutlass_fp8_supported = cutlass_fp8_supported()
         self.flashinfer_moe_backend: Optional[FlashinferMoeBackend] = None
         if envs.VLLM_USE_FLASHINFER_MOE_FP8 and has_flashinfer_moe():
@@ -314,13 +359,15 @@ def __init__(
             )
 
     def maybe_make_prepare_finalize(
-        self, ) -> Optional[mk.FusedMoEPrepareAndFinalize]:
+        self,
+    ) -> Optional[mk.FusedMoEPrepareAndFinalize]:
         # TRT LLM not supported with all2all yet.
         if self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM:
             return None
         elif self.flashinfer_moe_backend == FlashinferMoeBackend.CUTLASS:
-            prepare_finalize = (
-                build_flashinfer_fp8_cutlass_moe_prepare_finalize(self.moe))
+            prepare_finalize = build_flashinfer_fp8_cutlass_moe_prepare_finalize(
+                self.moe
+            )
             logger.debug_once("%s", prepare_finalize.__class__.__name__)
             return prepare_finalize
         else:
@@ -348,18 +395,21 @@ def create_weights(
         params_dtype: torch.dtype,
         **extra_weight_attrs,
     ):
-
         # Use FP8 dtype if checkpoint is serialized
-        weight_dtype = (torch.float8_e4m3fn
-                        if self.quant_config.is_checkpoint_fp8_serialized else
-                        params_dtype)
+        weight_dtype = (
+            torch.float8_e4m3fn
+            if self.quant_config.is_checkpoint_fp8_serialized
+            else params_dtype
+        )
         weight_loader = extra_weight_attrs.get("weight_loader")
 
         w13_weight = ModelWeightParameter(
-            data=torch.empty(num_experts,
-                             2 * intermediate_size_per_partition,
-                             hidden_size,
-                             dtype=weight_dtype),
+            data=torch.empty(
+                num_experts,
+                2 * intermediate_size_per_partition,
+                hidden_size,
+                dtype=weight_dtype,
+            ),
             input_dim=2,
             output_dim=1,
             weight_loader=weight_loader,
@@ -367,10 +417,12 @@ def create_weights(
         layer.register_parameter("w13_weight", w13_weight)
 
         w2_weight = ModelWeightParameter(
-            data=torch.empty(num_experts,
-                             hidden_size,
-                             intermediate_size_per_partition,
-                             dtype=weight_dtype),
+            data=torch.empty(
+                num_experts,
+                hidden_size,
+                intermediate_size_per_partition,
+                dtype=weight_dtype,
+            ),
             input_dim=2,
             output_dim=1,
             weight_loader=weight_loader,
@@ -390,7 +442,7 @@ def create_weights(
                 weight_loader=weight_loader,
             )
             w2_weight_scale = PerTensorScaleParameter(
-                data=torch.full((num_experts, ), 1.0, dtype=torch.float32),
+                data=torch.full((num_experts,), 1.0, dtype=torch.float32),
                 weight_loader=weight_loader,
             )
             layer.register_parameter("w13_weight_scale", w13_weight_scale)
@@ -398,15 +450,16 @@ def create_weights(
 
             # Set weight loader attributes for scales
             extra_weight_attrs.update(
-                {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value})
+                {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value}
+            )
 
             # INPUT SCALES - Per-tensor scaling for ModelOpt
             w13_input_scale = PerTensorScaleParameter(
-                data=torch.full((num_experts, ), 1.0, dtype=torch.float32),
+                data=torch.full((num_experts,), 1.0, dtype=torch.float32),
                 weight_loader=weight_loader,
             )
             w2_input_scale = PerTensorScaleParameter(
-                data=torch.full((num_experts, ), 1.0, dtype=torch.float32),
+                data=torch.full((num_experts,), 1.0, dtype=torch.float32),
                 weight_loader=weight_loader,
             )
             layer.register_parameter("w13_input_scale", w13_input_scale)
@@ -417,22 +470,20 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         Only supports pre-quantized checkpoints with FP8 weights and scales.
         """
 
-        layer.w13_weight = Parameter(layer.w13_weight.data,
-                                     requires_grad=False)
+        layer.w13_weight = Parameter(layer.w13_weight.data, requires_grad=False)
         layer.w2_weight = Parameter(layer.w2_weight.data, requires_grad=False)
 
         from vllm._custom_ops import scaled_fp8_quant
         from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-            per_tensor_dequantize)
+            per_tensor_dequantize,
+        )
 
         # Handle scale parameters
-        if hasattr(layer,
-                   "w13_weight_scale") and layer.w13_weight_scale is not None:
+        if hasattr(layer, "w13_weight_scale") and layer.w13_weight_scale is not None:
             # Fp8 moe kernel needs single weight scale for w13 per expert.
             # We take the max of the w1 and w3 scales
             # then dequant and requant each expert.
             if layer.w13_weight_scale.dim() == 2:
-
                 # Get the maximum scale across w1 and w3 for each expert
                 max_w13_scales = layer.w13_weight_scale.max(dim=1).values
 
@@ -445,51 +496,52 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
                     for shard_id in range(2):  # w1 and w3
                         # Dequantize using the original scale for this shard
                         dq_weight = per_tensor_dequantize(
-                            layer.w13_weight[expert_id][start:start +
-                                                        intermediate_size, :],
+                            layer.w13_weight[expert_id][
+                                start : start + intermediate_size, :
+                            ],
                             layer.w13_weight_scale[expert_id][shard_id],
                         )
                         # Requantize using the combined max scale
 
                         (
-                            layer.w13_weight[expert_id][start:start +
-                                                        intermediate_size, :],
+                            layer.w13_weight[expert_id][
+                                start : start + intermediate_size, :
+                            ],
                             _,
-                        ) = scaled_fp8_quant(dq_weight,
-                                             max_w13_scales[expert_id])
+                        ) = scaled_fp8_quant(dq_weight, max_w13_scales[expert_id])
 
                         start += intermediate_size
 
                 # Update the scale parameter to be per-expert
-                layer.w13_weight_scale = Parameter(max_w13_scales,
-                                                   requires_grad=False)
+                layer.w13_weight_scale = Parameter(max_w13_scales, requires_grad=False)
             else:
-                layer.w13_weight_scale = Parameter(layer.w13_weight_scale.data,
-                                                   requires_grad=False)
+                layer.w13_weight_scale = Parameter(
+                    layer.w13_weight_scale.data, requires_grad=False
+                )
 
-        if hasattr(layer,
-                   "w2_weight_scale") and layer.w2_weight_scale is not None:
-            layer.w2_weight_scale = Parameter(layer.w2_weight_scale.data,
-                                              requires_grad=False)
+        if hasattr(layer, "w2_weight_scale") and layer.w2_weight_scale is not None:
+            layer.w2_weight_scale = Parameter(
+                layer.w2_weight_scale.data, requires_grad=False
+            )
         # Input scales must be equal for each expert in fp8 MoE layers.
-        if hasattr(layer,
-                   "w13_input_scale") and layer.w13_input_scale is not None:
-            layer.w13_input_scale = Parameter(layer.w13_input_scale.max(),
-                                              requires_grad=False)
-        if hasattr(layer,
-                   "w2_input_scale") and layer.w2_input_scale is not None:
-            layer.w2_input_scale = Parameter(layer.w2_input_scale.max(),
-                                             requires_grad=False)
+        if hasattr(layer, "w13_input_scale") and layer.w13_input_scale is not None:
+            layer.w13_input_scale = Parameter(
+                layer.w13_input_scale.max(), requires_grad=False
+            )
+        if hasattr(layer, "w2_input_scale") and layer.w2_input_scale is not None:
+            layer.w2_input_scale = Parameter(
+                layer.w2_input_scale.max(), requires_grad=False
+            )
 
         if self.flashinfer_moe_backend is not None:
             layer.w13_weight.data = swap_w13_to_w31(layer.w13_weight.data)
             register_moe_scaling_factors(layer)
             if self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM:
-                rotate_flashinfer_fp8_moe_weights(layer.w13_weight,
-                                                  layer.w2_weight)
+                rotate_flashinfer_fp8_moe_weights(layer.w13_weight, layer.w2_weight)
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         if self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM:
             return None
 
@@ -526,12 +578,14 @@ def apply(
     ) -> Union[torch.Tensor, tuple[torch.Tensor, torch.Tensor]]:
         if enable_eplb:
             raise NotImplementedError(
-                "EPLB not supported for `ModelOptFp8MoEMethod` yet.")
+                "EPLB not supported for `ModelOptFp8MoEMethod` yet."
+            )
 
         if self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM:
             assert self.fused_experts is None
-            assert activation == 'silu', (
-                f"Expected 'silu' activation but got {activation}")
+            assert activation == "silu", (
+                f"Expected 'silu' activation but got {activation}"
+            )
             assert not renormalize
             return apply_flashinfer_per_tensor_scale_fp8(
                 layer=layer,
@@ -542,7 +596,8 @@ def apply(
                 top_k=top_k,
                 num_expert_group=num_expert_group,
                 topk_group=topk_group,
-                apply_router_weight_on_input=apply_router_weight_on_input)
+                apply_router_weight_on_input=apply_router_weight_on_input,
+            )
 
         # Expert selection
         topk_weights, topk_ids, _ = FusedMoE.select_experts(
@@ -579,8 +634,9 @@ def apply(
             )
         elif self.flashinfer_moe_backend == FlashinferMoeBackend.CUTLASS:
             assert not renormalize
-            assert activation == 'silu', (
-                f"Expected 'silu' activation but got {activation}")
+            assert activation == "silu", (
+                f"Expected 'silu' activation but got {activation}"
+            )
             return flashinfer_cutlass_moe_fp8(
                 x,
                 layer,
@@ -593,8 +649,8 @@ def apply(
                 apply_router_weight_on_input=apply_router_weight_on_input,
             )
         else:
-            from vllm.model_executor.layers.fused_moe.fused_moe import (
-                fused_experts)
+            from vllm.model_executor.layers.fused_moe.fused_moe import fused_experts
+
             assert self.moe_quant_config is not None
 
             return fused_experts(
@@ -627,7 +683,8 @@ def __init__(
         if is_checkpoint_nvfp4_serialized:
             logger.warning(
                 "Detected ModelOpt NVFP4 checkpoint. Please note that"
-                " the format is experimental and could change in future.")
+                " the format is experimental and could change in future."
+            )
 
             self.group_size = group_size
             self.kv_cache_quant_algo = kv_cache_quant_algo
@@ -651,12 +708,12 @@ def get_config_filenames(cls) -> list[str]:
 
     def apply_vllm_mapper(self, hf_to_vllm_mapper: "WeightsMapper"):
         if self.exclude_modules is not None:
-            self.exclude_modules = hf_to_vllm_mapper.apply_list(
-                self.exclude_modules)
+            self.exclude_modules = hf_to_vllm_mapper.apply_list(self.exclude_modules)
 
     @classmethod
     def override_quantization_method(
-            cls, hf_quant_cfg, user_quant) -> Optional[QuantizationMethods]:
+        cls, hf_quant_cfg, user_quant
+    ) -> Optional[QuantizationMethods]:
         """Detect if this ModelOpt FP4 config should be used based on
         quantization config."""
         if hf_quant_cfg is None:
@@ -694,8 +751,7 @@ def from_config(cls, config: dict[str, Any]) -> "ModelOptNvFp4Config":
             # {"quantization": {"quant_algo": "..."}}
             quant_config = cls.get_from_keys(config, ["quantization"])
             if not isinstance(quant_config, dict):
-                raise ValueError(
-                    "Expected 'quantization' to be a dictionary in config")
+                raise ValueError("Expected 'quantization' to be a dictionary in config")
 
             quant_method = quant_config.get("quant_algo", "")
             if not quant_method:
@@ -709,8 +765,10 @@ def from_config(cls, config: dict[str, Any]) -> "ModelOptNvFp4Config":
             elif isinstance(kv_cache_quant_algo_raw, str):
                 kv_cache_quant_algo = kv_cache_quant_algo_raw
             else:
-                raise ValueError(f"kv_cache_quant_algo must be a string, got "
-                                 f"{type(kv_cache_quant_algo_raw)}")
+                raise ValueError(
+                    f"kv_cache_quant_algo must be a string, got "
+                    f"{type(kv_cache_quant_algo_raw)}"
+                )
 
             # Handle group_size with proper type validation
             group_size_raw = quant_config.get("group_size")
@@ -722,14 +780,16 @@ def from_config(cls, config: dict[str, Any]) -> "ModelOptNvFp4Config":
                 try:
                     group_size = int(group_size_raw)
                 except (ValueError, TypeError):
-                    raise ValueError(f"group_size must be an integer, got "
-                                     f"{type(group_size_raw)}") from None
+                    raise ValueError(
+                        f"group_size must be an integer, got {type(group_size_raw)}"
+                    ) from None
 
             # "exclude_modules" is the key in the legacy hf_quant_config.json
             exclude_modules = quant_config.get("exclude_modules", [])
             if not isinstance(exclude_modules, list):
-                raise ValueError(f"exclude_modules must be a list, got "
-                                 f"{type(exclude_modules)}")
+                raise ValueError(
+                    f"exclude_modules must be a list, got {type(exclude_modules)}"
+                )
         else:
             # Compressed-tensors style format:
             # {"quant_algo": "...", "quant_method": "modelopt"}
@@ -743,8 +803,10 @@ def from_config(cls, config: dict[str, Any]) -> "ModelOptNvFp4Config":
             elif isinstance(kv_cache_quant_algo_raw, str):
                 kv_cache_quant_algo = kv_cache_quant_algo_raw
             else:
-                raise ValueError(f"kv_cache_quant_algo must be a string, got "
-                                 f"{type(kv_cache_quant_algo_raw)}")
+                raise ValueError(
+                    f"kv_cache_quant_algo must be a string, got "
+                    f"{type(kv_cache_quant_algo_raw)}"
+                )
 
             # Handle group_size with proper type validation
             group_size_raw = config.get("group_size")
@@ -756,40 +818,46 @@ def from_config(cls, config: dict[str, Any]) -> "ModelOptNvFp4Config":
                 try:
                     group_size = int(group_size_raw)
                 except (ValueError, TypeError):
-                    raise ValueError(f"group_size must be an integer, got "
-                                     f"{type(group_size_raw)}") from None
+                    raise ValueError(
+                        f"group_size must be an integer, got {type(group_size_raw)}"
+                    ) from None
 
             # "ignore" is the key in config.json
             exclude_modules = config.get("ignore", [])
             if not isinstance(exclude_modules, list):
-                raise ValueError(f"exclude_modules must be a list, got "
-                                 f"{type(exclude_modules)}")
+                raise ValueError(
+                    f"exclude_modules must be a list, got {type(exclude_modules)}"
+                )
 
         if quant_method not in QUANT_ALGOS:
             raise ValueError(
                 f"ModelOpt currently only supports: {QUANT_ALGOS} "
                 "quantizations in vLLM. Please check the "
                 "`hf_quant_config.json` file for your model's "
-                "quant configuration.")
-        is_checkpoint_nvfp4_serialized = ("NVFP4" in quant_method)
+                "quant configuration."
+            )
+        is_checkpoint_nvfp4_serialized = "NVFP4" in quant_method
 
         # For FP4, these fields are required
         if is_checkpoint_nvfp4_serialized and "quantization" in config:
             # Check if required fields are present in the quantization config
             quant_config = config["quantization"]
-            required_fields = [
-                "group_size", "kv_cache_quant_algo", "exclude_modules"
-            ]
+            required_fields = ["group_size", "kv_cache_quant_algo", "exclude_modules"]
             missing_fields = [
                 field for field in required_fields if field not in quant_config
             ]
             if missing_fields:
                 raise ValueError(
                     f"NVFP4 quantization requires the following fields in "
-                    f"hf_quant_config.json: {missing_fields}")
-
-        return cls(is_checkpoint_nvfp4_serialized, kv_cache_quant_algo,
-                   exclude_modules, group_size)
+                    f"hf_quant_config.json: {missing_fields}"
+                )
+
+        return cls(
+            is_checkpoint_nvfp4_serialized,
+            kv_cache_quant_algo,
+            exclude_modules,
+            group_size,
+        )
 
     def is_layer_excluded(self, prefix: str) -> bool:
         """
@@ -797,28 +865,30 @@ def is_layer_excluded(self, prefix: str) -> bool:
         Handles both exact matching (for fused layers) and pattern matching.
         """
         # First check exact matching with fused layer support
-        if is_layer_skipped(prefix, self.exclude_modules,
-                            self.packed_modules_mapping):
+        if is_layer_skipped(prefix, self.exclude_modules, self.packed_modules_mapping):
             return True
 
         # Check regex pattern matching for patterns not caught by exact match
         import regex as re
+
         for pattern in self.exclude_modules:
             # Skip patterns that would be caught by exact matching
-            if '*' in pattern or '.' in pattern:
-                regex_str = pattern.replace('.', r'\.').replace('*', r'.*')
+            if "*" in pattern or "." in pattern:
+                regex_str = pattern.replace(".", r"\.").replace("*", r".*")
                 if re.fullmatch(regex_str, prefix):
                     return True
         return False
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         from vllm.attention.layer import Attention  # Avoid circular import
+
         if isinstance(layer, LinearBase):
             if self.is_layer_excluded(prefix):
                 return UnquantizedLinearMethod()
             # Check if this is a vision model layer that should not be quantized
-            if ("vision_tower" in prefix or "vision_model" in prefix):
+            if "vision_tower" in prefix or "vision_model" in prefix:
                 return UnquantizedLinearMethod()
             return ModelOptNvFp4LinearMethod(self)
         elif isinstance(layer, Attention):
@@ -833,8 +903,7 @@ class ModelOptFp8KVCacheMethod(BaseKVCacheMethod):
     Supports loading kv-cache scaling factors from FP8 checkpoints.
     """
 
-    def __init__(self, quant_config: Union[ModelOptFp8Config,
-                                           ModelOptNvFp4Config]):
+    def __init__(self, quant_config: Union[ModelOptFp8Config, ModelOptNvFp4Config]):
         super().__init__(quant_config)
 
 
@@ -862,9 +931,11 @@ def __init__(self, quant_config: ModelOptNvFp4Config) -> None:
         elif is_fp4_marlin_supported():
             self.backend = "marlin"
         else:
-            raise ValueError("Current platform does not support NVFP4"
-                             " quantization. Please use Blackwell and"
-                             " above.")
+            raise ValueError(
+                "Current platform does not support NVFP4"
+                " quantization. Please use Blackwell and"
+                " above."
+            )
 
     def create_weights(
         self,
@@ -878,59 +949,69 @@ def create_weights(
     ):
         del input_size, output_size
         if not self.quant_config.is_checkpoint_nvfp4_serialized:
-            raise ValueError("NVFP4 quantization was selected, "
-                             " dynamic quantization is not supported.")
+            raise ValueError(
+                "NVFP4 quantization was selected, "
+                " dynamic quantization is not supported."
+            )
         output_size_per_partition = sum(output_partition_sizes)
         weight_loader = extra_weight_attrs.get("weight_loader")
         layer.logical_widths = output_partition_sizes
         layer.input_size_per_partition = input_size_per_partition
         layer.output_size_per_partition = output_size_per_partition
 
-        if (input_size_per_partition % 16 != 0):
-            raise ValueError("Unsupported model when in features size is "
-                             "not multiple of 16")
+        if input_size_per_partition % 16 != 0:
+            raise ValueError(
+                "Unsupported model when in features size is not multiple of 16"
+            )
         # The nvfp4 weight is still represented as
-        weight_dtype = (torch.float8_e4m3fn
-                        if self.quant_config.is_checkpoint_nvfp4_serialized
-                        else params_dtype)
+        weight_dtype = (
+            torch.float8_e4m3fn
+            if self.quant_config.is_checkpoint_nvfp4_serialized
+            else params_dtype
+        )
         # Weight
         weight = ModelWeightParameter(
             data=torch.empty(
                 # 2 fp4 items are packed in the input dimension
                 layer.output_size_per_partition,
                 layer.input_size_per_partition // 2,
-                dtype=torch.uint8),
+                dtype=torch.uint8,
+            ),
             input_dim=1,
             output_dim=0,
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("weight", weight)
 
         # Input Weight Scale
-        input_scale = PerTensorScaleParameter(data=torch.empty(
-            len(output_partition_sizes), dtype=torch.float32),
-                                              weight_loader=weight_loader)
+        input_scale = PerTensorScaleParameter(
+            data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("input_scale", input_scale)
 
         # Global Weight Scale
-        weight_scale_2 = PerTensorScaleParameter(data=torch.empty(
-            len(output_partition_sizes), dtype=torch.float32),
-                                                 weight_loader=weight_loader)
+        weight_scale_2 = PerTensorScaleParameter(
+            data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("weight_scale_2", weight_scale_2)
 
         # Per Block Weight Scale
-        weight_scale = ModelWeightParameter(data=torch.empty(
-            output_size_per_partition,
-            input_size_per_partition // self.quant_config.group_size,
-            dtype=weight_dtype,
-        ),
-                                            input_dim=1,
-                                            output_dim=0,
-                                            weight_loader=weight_loader)
+        weight_scale = ModelWeightParameter(
+            data=torch.empty(
+                output_size_per_partition,
+                input_size_per_partition // self.quant_config.group_size,
+                dtype=weight_dtype,
+            ),
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
 
         layer.register_parameter("weight_scale", weight_scale)
 
     def process_weights_after_loading(self, layer: Module) -> None:
-
         # global scales:
         input_scale_2 = layer.input_scale.max().to(torch.float32)
         layer.input_scale = Parameter(input_scale_2, requires_grad=False)
@@ -938,18 +1019,21 @@ def process_weights_after_loading(self, layer: Module) -> None:
         weight_scale_2 = layer.weight_scale_2.max().to(torch.float32)
         layer.weight_scale_2 = Parameter(weight_scale_2, requires_grad=False)
 
-        layer.alpha = Parameter(layer.input_scale * layer.weight_scale_2,
-                                requires_grad=False)
+        layer.alpha = Parameter(
+            layer.input_scale * layer.weight_scale_2, requires_grad=False
+        )
 
         # Calculate `1 / input_scale` so that we don't need to do so at runtime
         layer.input_scale_inv = Parameter(
-            (1 / layer.input_scale).to(torch.float32), requires_grad=False)
+            (1 / layer.input_scale).to(torch.float32), requires_grad=False
+        )
 
         # Swizzle the weight blockscale.
         # contracting dimension is input dimension
         # block_size = 16;
-        assert (layer.weight_scale.dtype == torch.float8_e4m3fn), (
-            "Weight Block scale must be represented as FP8-E4M3")
+        assert layer.weight_scale.dtype == torch.float8_e4m3fn, (
+            "Weight Block scale must be represented as FP8-E4M3"
+        )
 
         if self.backend == "marlin":
             prepare_fp4_layer_for_marlin(layer)
@@ -966,18 +1050,18 @@ def process_weights_after_loading(self, layer: Module) -> None:
             weight_scale = layer.weight_scale.data
 
             epilogue_tile_m = 128
-            weight = shuffle_matrix_a(weight.view(torch.uint8),
-                                      epilogue_tile_m)
-            weight_scale = (shuffle_matrix_sf_a(weight_scale.view(
-                torch.uint8), epilogue_tile_m).reshape(
-                    weight_scale.shape).view(torch.float8_e4m3fn))
+            weight = shuffle_matrix_a(weight.view(torch.uint8), epilogue_tile_m)
+            weight_scale = (
+                shuffle_matrix_sf_a(weight_scale.view(torch.uint8), epilogue_tile_m)
+                .reshape(weight_scale.shape)
+                .view(torch.float8_e4m3fn)
+            )
 
             layer.weight_scale = Parameter(weight_scale, requires_grad=False)
             layer.weight = Parameter(weight, requires_grad=False)
         else:
             swizzled_weight_scale = swizzle_blockscale(layer.weight_scale)
-            layer.weight_scale = Parameter(swizzled_weight_scale,
-                                           requires_grad=False)
+            layer.weight_scale = Parameter(swizzled_weight_scale, requires_grad=False)
             layer.weight = Parameter(layer.weight.data, requires_grad=False)
 
     def apply(
@@ -995,7 +1079,8 @@ def apply(
                 workspace=layer.workspace,
                 size_n=layer.output_size_per_partition,
                 size_k=layer.input_size_per_partition,
-                bias=bias)
+                bias=bias,
+            )
 
         output_dtype = x.dtype
         output_shape = [x.shape[0], layer.weight.shape[0]]
@@ -1005,11 +1090,11 @@ def apply(
 
         # validate dtypes of quantized input, input block scale,
         # weight and weight_blockscale
-        assert (x_fp4.dtype == torch.uint8)
-        assert (layer.weight.dtype == torch.uint8)
-        assert (x_blockscale.dtype == torch.float8_e4m3fn)
-        assert (layer.weight_scale.dtype == torch.float8_e4m3fn)
-        assert (layer.alpha.dtype == torch.float32)
+        assert x_fp4.dtype == torch.uint8
+        assert layer.weight.dtype == torch.uint8
+        assert x_blockscale.dtype == torch.float8_e4m3fn
+        assert layer.weight_scale.dtype == torch.float8_e4m3fn
+        assert layer.alpha.dtype == torch.float32
 
         mm_args = (
             x_fp4,
@@ -1055,7 +1140,9 @@ def __init__(
         layer: torch.nn.Module,
     ) -> None:
         from vllm.model_executor.layers.quantization.utils.nvfp4_moe_support import (  # noqa: E501
-            detect_nvfp4_moe_support)
+            detect_nvfp4_moe_support,
+        )
+
         super().__init__(moe)
         self.quant_config = quant_config
         self.layer = layer
@@ -1069,19 +1156,23 @@ def __init__(
             self.flashinfer_moe_backend = get_flashinfer_moe_backend()
             logger.info_once(
                 f"Using FlashInfer {self.flashinfer_moe_backend.value} kernels"
-                " for ModelOptNvFp4FusedMoE.")
+                " for ModelOptNvFp4FusedMoE."
+            )
 
-    def maybe_make_prepare_finalize(
-            self) -> Optional[mk.FusedMoEPrepareAndFinalize]:
-        if (self.use_marlin
-                or (self.allow_flashinfer and self.flashinfer_moe_backend
-                    == FlashinferMoeBackend.TENSORRT_LLM)):
+    def maybe_make_prepare_finalize(self) -> Optional[mk.FusedMoEPrepareAndFinalize]:
+        if self.use_marlin or (
+            self.allow_flashinfer
+            and self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM
+        ):
             return None
-        elif (self.allow_flashinfer
-              and self.flashinfer_moe_backend == FlashinferMoeBackend.CUTLASS):
+        elif (
+            self.allow_flashinfer
+            and self.flashinfer_moe_backend == FlashinferMoeBackend.CUTLASS
+        ):
             # For now, fp4 moe only works with the flashinfer dispatcher.
-            prepare_finalize = (
-                build_flashinfer_fp4_cutlass_moe_prepare_finalize(self.moe))
+            prepare_finalize = build_flashinfer_fp4_cutlass_moe_prepare_finalize(
+                self.moe
+            )
             logger.debug_once("%s", prepare_finalize.__class__.__name__)
             return prepare_finalize
         else:
@@ -1107,12 +1198,20 @@ def uses_weight_scale_2_pattern(self) -> bool:
         """
         return True
 
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         if not self.quant_config.is_checkpoint_nvfp4_serialized:
-            raise ValueError("NVFP4 quantization was selected, "
-                             " dynamic quantization is not supported.")
+            raise ValueError(
+                "NVFP4 quantization was selected, "
+                " dynamic quantization is not supported."
+            )
 
         layer.num_experts = num_experts
         layer.params_dtype = params_dtype
@@ -1127,10 +1226,12 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
                 2 * intermediate_size_per_partition,
                 # 2 fp4 items are packed in the input dimension
                 hidden_size // 2,
-                dtype=weight_dtype),
+                dtype=weight_dtype,
+            ),
             input_dim=1,
             output_dim=2,
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("w13_weight", w13_weight)
 
         # GEMM 2
@@ -1140,10 +1241,12 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
                 hidden_size,
                 # 2 fp4 items are packed in the input dimension
                 intermediate_size_per_partition // 2,
-                dtype=weight_dtype),
+                dtype=weight_dtype,
+            ),
             input_dim=1,
             output_dim=2,
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("w2_weight", w2_weight)
 
         w13_weight_scale = ModelWeightParameter(
@@ -1152,10 +1255,12 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
                 2 * intermediate_size_per_partition,
                 # 2 fp4 items are packed in the input dimension
                 hidden_size // self.quant_config.group_size,
-                dtype=weight_scale_dtype),
+                dtype=weight_scale_dtype,
+            ),
             input_dim=1,
             output_dim=2,
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("w13_weight_scale", w13_weight_scale)
 
         w2_weight_scale = ModelWeightParameter(
@@ -1163,38 +1268,45 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
                 num_experts,
                 hidden_size,
                 # 2 fp4 items are packed in the input dimension
-                intermediate_size_per_partition //
-                self.quant_config.group_size,
-                dtype=weight_scale_dtype),
+                intermediate_size_per_partition // self.quant_config.group_size,
+                dtype=weight_scale_dtype,
+            ),
             input_dim=1,
             output_dim=2,
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("w2_weight_scale", w2_weight_scale)
 
         extra_weight_attrs.update(
-            {"quant_method": FusedMoeWeightScaleSupported.BLOCK.value})
+            {"quant_method": FusedMoeWeightScaleSupported.BLOCK.value}
+        )
 
         w13_weight_scale_2 = PerTensorScaleParameter(
             data=torch.empty(num_experts, 2, dtype=torch.float32),
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("w13_weight_scale_2", w13_weight_scale_2)
 
         w2_weight_scale_2 = PerTensorScaleParameter(
             data=torch.empty(num_experts, dtype=torch.float32),
-            weight_loader=weight_loader)
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("w2_weight_scale_2", w2_weight_scale_2)
 
         extra_weight_attrs.update(
-            {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value})
+            {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value}
+        )
 
-        w13_input_scale = PerTensorScaleParameter(data=torch.empty(
-            num_experts, 2, dtype=torch.float32),
-                                                  weight_loader=weight_loader)
+        w13_input_scale = PerTensorScaleParameter(
+            data=torch.empty(num_experts, 2, dtype=torch.float32),
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("w13_input_scale", w13_input_scale)
 
-        w2_input_scale = PerTensorScaleParameter(data=torch.empty(
-            num_experts, dtype=torch.float32),
-                                                 weight_loader=weight_loader)
+        w2_input_scale = PerTensorScaleParameter(
+            data=torch.empty(num_experts, dtype=torch.float32),
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("w2_input_scale", w2_input_scale)
 
     def prepare_static_weights_for_trtllm_fp4_moe(
@@ -1212,24 +1324,30 @@ def prepare_static_weights_for_trtllm_fp4_moe(
         from flashinfer import nvfp4_block_scale_interleave
         from flashinfer.fused_moe.core import (
             _maybe_get_cached_w2_permute_indices,
-            _maybe_get_cached_w3_w1_permute_indices)
+            _maybe_get_cached_w3_w1_permute_indices,
+        )
+
         """Prepare quantized weights for kernel (done offline with weights)."""
         epilogue_tile_m = 128  # FIXME: this depends on the kernel internals
 
         # Convert quantized weights to proper formats
         gemm1_weights_fp4 = gemm1_weights.view(torch.float8_e4m3fn).reshape(
-            num_experts, 2 * intermediate_size, hidden_size // 2)  # packed fp4
+            num_experts, 2 * intermediate_size, hidden_size // 2
+        )  # packed fp4
         gemm1_scales_linear_fp4 = gemm1_scales_linear_fp4_bytes.view(
-            torch.float8_e4m3fn).reshape(num_experts, 2 * intermediate_size,
-                                         hidden_size //
-                                         16)  # fp8 scaling factors
+            torch.float8_e4m3fn
+        ).reshape(
+            num_experts, 2 * intermediate_size, hidden_size // 16
+        )  # fp8 scaling factors
 
         gemm2_weights_fp4 = gemm2_weights.view(torch.float8_e4m3fn).reshape(
-            num_experts, hidden_size, intermediate_size // 2)  # packed fp4
+            num_experts, hidden_size, intermediate_size // 2
+        )  # packed fp4
         gemm2_scales_linear_fp4 = gemm2_scales_linear_fp4_bytes.view(
-            torch.float8_e4m3fn).reshape(num_experts, hidden_size,
-                                         intermediate_size //
-                                         16)  # fp8 scaling factors
+            torch.float8_e4m3fn
+        ).reshape(
+            num_experts, hidden_size, intermediate_size // 16
+        )  # fp8 scaling factors
 
         gemm1_weights_fp4_shuffled = []
         gemm1_scales_fp4_shuffled = []
@@ -1245,9 +1363,11 @@ def prepare_static_weights_for_trtllm_fp4_moe(
                 gemm1_weights_fp4[i].view(torch.uint8),
                 epilogue_tile_m,
             )
-            gemm1_weights_fp4_shuffled.append(gemm1_weights_fp4[i].view(
-                torch.uint8)[permute_indices.to(
-                    gemm1_weights_fp4.device)].contiguous())
+            gemm1_weights_fp4_shuffled.append(
+                gemm1_weights_fp4[i]
+                .view(torch.uint8)[permute_indices.to(gemm1_weights_fp4.device)]
+                .contiguous()
+            )
 
             permute_sf_indices = _maybe_get_cached_w3_w1_permute_indices(
                 self._cache_permute_indices,
@@ -1256,18 +1376,25 @@ def prepare_static_weights_for_trtllm_fp4_moe(
                 num_elts_per_sf=16,
             )
             gemm1_scales_fp4_shuffled.append(
-                nvfp4_block_scale_interleave(gemm1_scales_linear_fp4[i].view(
-                    torch.uint8)[permute_sf_indices.to(
-                        gemm1_scales_linear_fp4.device)].contiguous()))
+                nvfp4_block_scale_interleave(
+                    gemm1_scales_linear_fp4[i]
+                    .view(torch.uint8)[
+                        permute_sf_indices.to(gemm1_scales_linear_fp4.device)
+                    ]
+                    .contiguous()
+                )
+            )
 
             permute_indices = _maybe_get_cached_w2_permute_indices(
                 self._cache_permute_indices,
                 gemm2_weights_fp4[i].view(torch.uint8),
                 epilogue_tile_m,
             )
-            gemm2_weights_fp4_shuffled.append(gemm2_weights_fp4[i].view(
-                torch.uint8)[permute_indices.to(
-                    gemm2_weights_fp4.device)].contiguous())
+            gemm2_weights_fp4_shuffled.append(
+                gemm2_weights_fp4[i]
+                .view(torch.uint8)[permute_indices.to(gemm2_weights_fp4.device)]
+                .contiguous()
+            )
 
             permute_sf_indices = _maybe_get_cached_w2_permute_indices(
                 self._cache_permute_indices,
@@ -1276,23 +1403,29 @@ def prepare_static_weights_for_trtllm_fp4_moe(
                 num_elts_per_sf=16,
             )
             gemm2_scales_fp4_shuffled.append(
-                nvfp4_block_scale_interleave(gemm2_scales_linear_fp4[i].view(
-                    torch.uint8)[permute_sf_indices.to(
-                        gemm2_scales_linear_fp4.device)].contiguous()))
+                nvfp4_block_scale_interleave(
+                    gemm2_scales_linear_fp4[i]
+                    .view(torch.uint8)[
+                        permute_sf_indices.to(gemm2_scales_linear_fp4.device)
+                    ]
+                    .contiguous()
+                )
+            )
 
         # Stack weights for all experts
         gemm1_weights_fp4_shuffled = torch.stack(gemm1_weights_fp4_shuffled)
         gemm1_scales_fp4_shuffled = (
-            torch.stack(gemm1_scales_fp4_shuffled).view(
-                torch.float8_e4m3fn).reshape(num_experts,
-                                             2 * intermediate_size,
-                                             hidden_size // 16))
+            torch.stack(gemm1_scales_fp4_shuffled)
+            .view(torch.float8_e4m3fn)
+            .reshape(num_experts, 2 * intermediate_size, hidden_size // 16)
+        )
 
         gemm2_weights_fp4_shuffled = torch.stack(gemm2_weights_fp4_shuffled)
         gemm2_scales_fp4_shuffled = (
-            torch.stack(gemm2_scales_fp4_shuffled).view(
-                torch.float8_e4m3fn).reshape(num_experts, hidden_size,
-                                             intermediate_size // 16))
+            torch.stack(gemm2_scales_fp4_shuffled)
+            .view(torch.float8_e4m3fn)
+            .reshape(num_experts, hidden_size, intermediate_size // 16)
+        )
         return (
             gemm1_weights_fp4_shuffled,
             gemm1_scales_fp4_shuffled,
@@ -1307,74 +1440,86 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
 
         if self.allow_flashinfer:
             gemm1_weight, gemm1_weight_scale = reorder_w1w3_to_w3w1(
-                gemm1_weight, gemm1_weight_scale, dim=-2)
+                gemm1_weight, gemm1_weight_scale, dim=-2
+            )
 
         layer.w13_weight = Parameter(gemm1_weight, requires_grad=False)
-        layer.w13_weight_scale = Parameter(gemm1_weight_scale,
-                                           requires_grad=False)
+        layer.w13_weight_scale = Parameter(gemm1_weight_scale, requires_grad=False)
 
         # Common processing for w13_weight_scale_2
-        if not torch.allclose(layer.w13_weight_scale_2[:, 0],
-                              layer.w13_weight_scale_2[:, 1]):
+        if not torch.allclose(
+            layer.w13_weight_scale_2[:, 0], layer.w13_weight_scale_2[:, 1]
+        ):
             logger.warning_once(
                 "w1_weight_scale_2 must match w3_weight_scale_2. "
-                "Accuracy may be affected.")
+                "Accuracy may be affected."
+            )
 
         w13_weight_scale_2 = layer.w13_weight_scale_2[:, 0]
-        layer.w13_weight_scale_2 = Parameter(w13_weight_scale_2,
-                                             requires_grad=False)
+        layer.w13_weight_scale_2 = Parameter(w13_weight_scale_2, requires_grad=False)
 
         # Common processing for input scales and alphas
-        w13_input_scale = layer.w13_input_scale.max(dim=1).values.to(
-            torch.float32)
+        w13_input_scale = layer.w13_input_scale.max(dim=1).values.to(torch.float32)
         layer.g1_alphas = Parameter(
             (w13_input_scale * w13_weight_scale_2).to(torch.float32),
-            requires_grad=False)
+            requires_grad=False,
+        )
 
         # This is for quantization, so we need to invert it.
         layer.w13_input_scale_quant = Parameter(
-            (1 / w13_input_scale).to(torch.float32), requires_grad=False)
+            (1 / w13_input_scale).to(torch.float32), requires_grad=False
+        )
 
         # GEMM 2 processing
         layer.g2_alphas = Parameter(
             (layer.w2_input_scale * layer.w2_weight_scale_2).to(torch.float32),
-            requires_grad=False)
+            requires_grad=False,
+        )
 
         # This is for quantization, so we need to invert it.
         layer.w2_input_scale_quant = Parameter(
-            (1 / layer.w2_input_scale).to(torch.float32), requires_grad=False)
+            (1 / layer.w2_input_scale).to(torch.float32), requires_grad=False
+        )
 
         # TensorRT-LLM specific processing
-        if self.allow_flashinfer and \
-            self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM:
+        if (
+            self.allow_flashinfer
+            and self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM
+        ):
             # Prepare static weights for TRT-LLM kernel
             # alternate: prepare_static_weight_layouts_for_trtllm_moe
-            (gemm1_weights_fp4_shuffled, gemm1_scales_fp4_shuffled,
-             gemm2_weights_fp4_shuffled, gemm2_scales_fp4_shuffled
-             ) = self.prepare_static_weights_for_trtllm_fp4_moe(
-                 layer.w13_weight,
-                 layer.w2_weight,
-                 layer.w13_weight_scale,
-                 layer.w2_weight_scale,
-                 layer.w2_weight.size(-2),  # hidden_size
-                 layer.w13_weight.size(-2) // 2,  # intermediate_size
-                 layer.w13_weight.size(0),  # num_experts
-             )
+            (
+                gemm1_weights_fp4_shuffled,
+                gemm1_scales_fp4_shuffled,
+                gemm2_weights_fp4_shuffled,
+                gemm2_scales_fp4_shuffled,
+            ) = self.prepare_static_weights_for_trtllm_fp4_moe(
+                layer.w13_weight,
+                layer.w2_weight,
+                layer.w13_weight_scale,
+                layer.w2_weight_scale,
+                layer.w2_weight.size(-2),  # hidden_size
+                layer.w13_weight.size(-2) // 2,  # intermediate_size
+                layer.w13_weight.size(0),  # num_experts
+            )
             logger.debug_once("Finished shuffling weights for TRT-LLM MOE")
 
             layer.gemm1_weights_fp4_shuffled = Parameter(
-                gemm1_weights_fp4_shuffled, requires_grad=False)
+                gemm1_weights_fp4_shuffled, requires_grad=False
+            )
             layer.gemm2_weights_fp4_shuffled = Parameter(
-                gemm2_weights_fp4_shuffled, requires_grad=False)
+                gemm2_weights_fp4_shuffled, requires_grad=False
+            )
             layer.gemm1_scales_fp4_shuffled = Parameter(
-                gemm1_scales_fp4_shuffled, requires_grad=False)
+                gemm1_scales_fp4_shuffled, requires_grad=False
+            )
             layer.gemm2_scales_fp4_shuffled = Parameter(
-                gemm2_scales_fp4_shuffled, requires_grad=False)
+                gemm2_scales_fp4_shuffled, requires_grad=False
+            )
 
             # Additional parameter needed for TRT-LLM
             layer.g1_scale_c = Parameter(
-                (layer.w2_input_scale_quant * layer.g1_alphas).to(
-                    torch.float32),
+                (layer.w2_input_scale_quant * layer.g1_alphas).to(torch.float32),
                 requires_grad=False,
             )
 
@@ -1392,29 +1537,36 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             del layer.w2_input_scale_quant
         else:
             # Non-TRT-LLM processing (Cutlass or non-flashinfer)
-            assert (layer.w13_weight_scale.shape[2] % 16 == 0), (
-                "Expected weight_scale.dim(1) to be divisible by 16")
-            assert (layer.w13_weight_scale.dtype == torch.float8_e4m3fn), (
-                "Weight Blockscale must be represented as FP8-E4M3")
-            w13_blockscale_swizzled = swizzle_blockscale(
-                layer.w13_weight_scale)
-            layer.w13_weight_scale = Parameter(w13_blockscale_swizzled,
-                                               requires_grad=False)
-
-            assert (layer.w2_weight_scale.shape[2] % 16 == 0), (
-                "Expected weight_scale.dim(1) to be divisible by 16")
-            assert (layer.w2_weight_scale.dtype == torch.float8_e4m3fn), (
-                "Weight Blockscale must be represented as FP8-E4M3")
+            assert layer.w13_weight_scale.shape[2] % 16 == 0, (
+                "Expected weight_scale.dim(1) to be divisible by 16"
+            )
+            assert layer.w13_weight_scale.dtype == torch.float8_e4m3fn, (
+                "Weight Blockscale must be represented as FP8-E4M3"
+            )
+            w13_blockscale_swizzled = swizzle_blockscale(layer.w13_weight_scale)
+            layer.w13_weight_scale = Parameter(
+                w13_blockscale_swizzled, requires_grad=False
+            )
+
+            assert layer.w2_weight_scale.shape[2] % 16 == 0, (
+                "Expected weight_scale.dim(1) to be divisible by 16"
+            )
+            assert layer.w2_weight_scale.dtype == torch.float8_e4m3fn, (
+                "Weight Blockscale must be represented as FP8-E4M3"
+            )
             w2_blockscale_swizzled = swizzle_blockscale(layer.w2_weight_scale)
-            layer.w2_weight_scale = Parameter(w2_blockscale_swizzled,
-                                              requires_grad=False)
-            layer.w2_weight = Parameter(layer.w2_weight.data,
-                                        requires_grad=False)
+            layer.w2_weight_scale = Parameter(
+                w2_blockscale_swizzled, requires_grad=False
+            )
+            layer.w2_weight = Parameter(layer.w2_weight.data, requires_grad=False)
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
-        if (self.use_marlin or self.flashinfer_moe_backend
-                == FlashinferMoeBackend.TENSORRT_LLM):
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
+        if (
+            self.use_marlin
+            or self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM
+        ):
             return None
 
         return nvfp4_moe_quant_config(
@@ -1451,11 +1603,14 @@ def apply(
     ) -> Union[torch.Tensor, tuple[torch.Tensor, torch.Tensor]]:
         if enable_eplb:
             raise NotImplementedError(
-                "EPLB not supported for `ModelOptNvFp4FusedMoE` yet.")
+                "EPLB not supported for `ModelOptNvFp4FusedMoE` yet."
+            )
         assert activation == "silu", "Only SiLU activation is supported."
 
-        if (self.allow_flashinfer and self.flashinfer_moe_backend
-                == FlashinferMoeBackend.TENSORRT_LLM):
+        if (
+            self.allow_flashinfer
+            and self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM
+        ):
             import flashinfer
 
             from vllm.model_executor.models.llama4 import Llama4MoE
@@ -1463,14 +1618,16 @@ def apply(
             assert self.fused_experts is None
 
             a1_gscale = layer.w13_input_scale_quant
-            (hidden_states_fp4,
-             hidden_states_scale_linear_fp4) = flashinfer.fp4_quantize(
-                 x,
-                 a1_gscale,
-                 is_sf_swizzled_layout=False,
-             )
-            use_llama4_routing = \
+            (hidden_states_fp4, hidden_states_scale_linear_fp4) = (
+                flashinfer.fp4_quantize(
+                    x,
+                    a1_gscale,
+                    is_sf_swizzled_layout=False,
+                )
+            )
+            use_llama4_routing = (
                 custom_routing_function is Llama4MoE.custom_routing_function
+            )
             routing_method_type = flashinfer.RoutingMethodType.DeepSeekV3
             if use_llama4_routing:
                 routing_method_type = flashinfer.RoutingMethodType.Llama4
@@ -1479,36 +1636,40 @@ def apply(
                 routing_bias = routing_bias.to(torch.bfloat16)
             out = flashinfer.fused_moe.trtllm_fp4_block_scale_moe(
                 routing_logits=router_logits
-                if use_llama4_routing else router_logits.to(torch.float32),
+                if use_llama4_routing
+                else router_logits.to(torch.float32),
                 routing_bias=routing_bias,
                 hidden_states=hidden_states_fp4,
                 hidden_states_scale=hidden_states_scale_linear_fp4.view(
-                    torch.float8_e4m3fn).flatten(),
+                    torch.float8_e4m3fn
+                ).flatten(),
                 gemm1_weights=layer.gemm1_weights_fp4_shuffled.data,
                 gemm1_weights_scale=layer.gemm1_scales_fp4_shuffled.data.view(
-                    torch.float8_e4m3fn),
+                    torch.float8_e4m3fn
+                ),
                 gemm1_bias=None,
                 gemm1_alpha=None,
                 gemm1_beta=None,
                 gemm1_clamp_limit=None,
                 gemm2_weights=layer.gemm2_weights_fp4_shuffled.data,
                 gemm2_weights_scale=layer.gemm2_scales_fp4_shuffled.data.view(
-                    torch.float8_e4m3fn),
+                    torch.float8_e4m3fn
+                ),
                 gemm2_bias=None,
                 output1_scale_scalar=layer.g1_scale_c.data,
                 output1_scale_gate_scalar=layer.g1_alphas.data,
                 output2_scale_scalar=layer.g2_alphas.data,
                 num_experts=global_num_experts,
                 top_k=top_k,
-                n_group=num_expert_group
-                if num_expert_group is not None else 0,
+                n_group=num_expert_group if num_expert_group is not None else 0,
                 topk_group=topk_group if topk_group is not None else 0,
                 intermediate_size=layer.intermediate_size_per_partition,
                 local_expert_offset=layer.ep_rank * layer.local_num_experts,
                 local_num_experts=layer.local_num_experts,
                 routed_scaling_factor=None,
-                tile_tokens_dim=_get_tile_tokens_dim(x.shape[0], top_k,
-                                                     layer.local_num_experts),
+                tile_tokens_dim=_get_tile_tokens_dim(
+                    x.shape[0], top_k, layer.local_num_experts
+                ),
                 routing_method_type=routing_method_type,
                 do_finalize=True,
             )[0]
@@ -1526,7 +1687,8 @@ def apply(
             scoring_func=scoring_func,
             routed_scaling_factor=routed_scaling_factor,
             e_score_correction_bias=e_score_correction_bias,
-            indices_type=self.topk_indices_dtype)
+            indices_type=self.topk_indices_dtype,
+        )
 
         #
         # Note: the order here is important. self.fused_experts can override
@@ -1552,15 +1714,18 @@ def apply(
                 apply_router_weight_on_input=apply_router_weight_on_input,
                 global_num_experts=global_num_experts,
                 expert_map=expert_map,
-                workspace=layer.workspace)
+                workspace=layer.workspace,
+            )
 
         elif self.fused_experts is not None:
-            assert self.allow_flashinfer and \
-               self.flashinfer_moe_backend == FlashinferMoeBackend.CUTLASS
+            assert (
+                self.allow_flashinfer
+                and self.flashinfer_moe_backend == FlashinferMoeBackend.CUTLASS
+            )
 
             assert is_valid_flashinfer_cutlass_fused_moe(
-                x, layer.w13_weight, layer.w2_weight), (
-                    "Flashinfer CUTLASS Fused MoE not applicable!")
+                x, layer.w13_weight, layer.w2_weight
+            ), "Flashinfer CUTLASS Fused MoE not applicable!"
 
             return self.fused_experts(
                 hidden_states=x,
@@ -1574,10 +1739,14 @@ def apply(
                 expert_map=expert_map,
                 apply_router_weight_on_input=apply_router_weight_on_input,
             )
-        elif (self.allow_flashinfer
-              and self.flashinfer_moe_backend == FlashinferMoeBackend.CUTLASS):
+        elif (
+            self.allow_flashinfer
+            and self.flashinfer_moe_backend == FlashinferMoeBackend.CUTLASS
+        ):
             from vllm.model_executor.layers.fused_moe.flashinfer_cutlass_moe import (  # noqa: E501
-                flashinfer_cutlass_moe_fp4)
+                flashinfer_cutlass_moe_fp4,
+            )
+
             assert self.moe_quant_config is not None
 
             return flashinfer_cutlass_moe_fp4(
@@ -1596,8 +1765,8 @@ def apply(
         else:
             # If no modular kernel is provided, use cutlass_moe_fp4 for TP case
             # only (no EP).
-            from vllm.model_executor.layers.fused_moe.cutlass_moe import (
-                cutlass_moe_fp4)
+            from vllm.model_executor.layers.fused_moe.cutlass_moe import cutlass_moe_fp4
+
             assert self.moe_quant_config is not None
             return cutlass_moe_fp4(
                 a=x,
diff --git a/vllm/model_executor/layers/quantization/moe_wna16.py b/vllm/model_executor/layers/quantization/moe_wna16.py
index ee8d33e636f9..3719672f6e52 100644
--- a/vllm/model_executor/layers/quantization/moe_wna16.py
+++ b/vllm/model_executor/layers/quantization/moe_wna16.py
@@ -7,17 +7,25 @@
 
 from vllm.distributed import get_tensor_model_parallel_rank, get_tp_group
 from vllm.model_executor.layers.fused_moe.config import (
-    FusedMoEQuantConfig, int4_w4a16_moe_quant_config,
-    int8_w8a16_moe_quant_config)
+    FusedMoEQuantConfig,
+    int4_w4a16_moe_quant_config,
+    int8_w8a16_moe_quant_config,
+)
 from vllm.model_executor.layers.fused_moe.layer import (
-    FusedMoE, FusedMoEConfig, FusedMoEMethodBase, FusedMoeWeightScaleSupported)
-from vllm.model_executor.layers.linear import (LinearBase,
-                                               UnquantizedLinearMethod)
+    FusedMoE,
+    FusedMoEConfig,
+    FusedMoEMethodBase,
+    FusedMoeWeightScaleSupported,
+)
+from vllm.model_executor.layers.linear import LinearBase, UnquantizedLinearMethod
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-    check_marlin_supports_layer)
+    check_marlin_supports_layer,
+)
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.platforms import current_platform
 
@@ -25,10 +33,16 @@
 class MoeWNA16Config(QuantizationConfig):
     """Config class for MOE WNA16 (W8A16/W4A16) quantization."""
 
-    def __init__(self, linear_quant_method: str, weight_bits: int,
-                 group_size: int, has_zp: bool, lm_head_quantized: bool,
-                 modules_to_not_convert: Optional[list[str]],
-                 full_config: dict[str, Any]) -> None:
+    def __init__(
+        self,
+        linear_quant_method: str,
+        weight_bits: int,
+        group_size: int,
+        has_zp: bool,
+        lm_head_quantized: bool,
+        modules_to_not_convert: Optional[list[str]],
+        full_config: dict[str, Any],
+    ) -> None:
         super().__init__()
         self.weight_bits = weight_bits
         self.group_size = group_size
@@ -40,26 +54,25 @@ def __init__(self, linear_quant_method: str, weight_bits: int,
         self.use_marlin = False
         # Avoid circular import
         from vllm.model_executor.layers.quantization.awq import AWQConfig
-        from vllm.model_executor.layers.quantization.awq_marlin import (
-            AWQMarlinConfig)
-        from vllm.model_executor.layers.quantization.gptq_marlin import (
-            GPTQMarlinConfig)
+        from vllm.model_executor.layers.quantization.awq_marlin import AWQMarlinConfig
+        from vllm.model_executor.layers.quantization.gptq_marlin import GPTQMarlinConfig
+
         if self.linear_quant_method == "gptq":
-            self.use_marlin = GPTQMarlinConfig.is_gptq_marlin_compatible(
-                full_config)
+            self.use_marlin = GPTQMarlinConfig.is_gptq_marlin_compatible(full_config)
         elif self.linear_quant_method == "awq":
             capability_tuple = current_platform.get_device_capability()
-            device_capability = (-1 if capability_tuple is None else
-                                 capability_tuple.to_int())
+            device_capability = (
+                -1 if capability_tuple is None else capability_tuple.to_int()
+            )
             awq_min_capability = AWQConfig.get_min_capability()
             if device_capability < awq_min_capability:
                 raise ValueError(
                     "The quantization method moe_wna16 + awq is not supported "
                     "for the current GPU. "
                     f"Minimum capability: {awq_min_capability}. "
-                    f"Current capability: {device_capability}.")
-            self.use_marlin = AWQMarlinConfig.is_awq_marlin_compatible(
-                full_config)
+                    f"Current capability: {device_capability}."
+                )
+            self.use_marlin = AWQMarlinConfig.is_awq_marlin_compatible(full_config)
         else:
             raise ValueError("moe_wna16 only support gptq and awq.")
 
@@ -89,24 +102,32 @@ def from_config(cls, config: dict[str, Any]) -> "MoeWNA16Config":
         linear_quant_method = cls.get_from_keys(config, ["quant_method"])
         weight_bits = cls.get_from_keys(config, ["bits"])
         group_size = cls.get_from_keys(config, ["group_size"])
-        lm_head_quantized = cls.get_from_keys_or(config, ["lm_head"],
-                                                 default=False)
+        lm_head_quantized = cls.get_from_keys_or(config, ["lm_head"], default=False)
         if linear_quant_method == "gptq":
             has_zp = not cls.get_from_keys(config, ["sym"])
             modules_to_not_convert = []
         elif linear_quant_method == "awq":
             has_zp = cls.get_from_keys(config, ["zero_point"])
             modules_to_not_convert = cls.get_from_keys_or(
-                config, ["modules_to_not_convert"], None)
+                config, ["modules_to_not_convert"], None
+            )
         else:
             raise ValueError("moe_wna16 only support gptq and awq.")
 
-        return cls(linear_quant_method, weight_bits, group_size, has_zp,
-                   lm_head_quantized, modules_to_not_convert, config)
+        return cls(
+            linear_quant_method,
+            weight_bits,
+            group_size,
+            has_zp,
+            lm_head_quantized,
+            modules_to_not_convert,
+            config,
+        )
 
     @classmethod
     def override_quantization_method(
-            cls, hf_quant_cfg, user_quant) -> Optional[QuantizationMethods]:
+        cls, hf_quant_cfg, user_quant
+    ) -> Optional[QuantizationMethods]:
         can_convert = cls.is_moe_wna16_compatible(hf_quant_cfg)
         if can_convert and user_quant == "moe_wna16":
             return cls.get_name()
@@ -120,46 +141,59 @@ def is_moe_wna16_compatible(cls, quant_config: dict[str, Any]):
         desc_act = quant_config.get("desc_act")
 
         capability_tuple = current_platform.get_device_capability()
-        device_capability = (-1 if capability_tuple is None else
-                             capability_tuple.to_int())
+        device_capability = (
+            -1 if capability_tuple is None else capability_tuple.to_int()
+        )
         # Avoid circular import
         from vllm.model_executor.layers.quantization.awq import AWQConfig
+
         awq_min_capability = AWQConfig.get_min_capability()
 
-        gptq_compatible = quant_method == "gptq" and \
-            not desc_act and num_bits in [4, 8]
-        awq_compatible = quant_method == "awq" and num_bits == 4 and \
-            device_capability >= awq_min_capability
+        gptq_compatible = quant_method == "gptq" and not desc_act and num_bits in [4, 8]
+        awq_compatible = (
+            quant_method == "awq"
+            and num_bits == 4
+            and device_capability >= awq_min_capability
+        )
 
         return gptq_compatible or awq_compatible
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         if is_layer_skipped_quant(prefix, self.modules_to_not_convert):
             return UnquantizedLinearMethod()
         elif isinstance(layer, LinearBase):
             # Avoid circular import
             from vllm.model_executor.layers.quantization.awq import AWQConfig
             from vllm.model_executor.layers.quantization.awq_marlin import (
-                AWQMarlinConfig)
+                AWQMarlinConfig,
+            )
             from vllm.model_executor.layers.quantization.gptq import GPTQConfig
             from vllm.model_executor.layers.quantization.gptq_marlin import (
-                GPTQMarlinConfig)
+                GPTQMarlinConfig,
+            )
+
             if self.linear_quant_method == "gptq":
                 if self.use_marlin:
                     return GPTQMarlinConfig.from_config(
-                        self.full_config).get_quant_method(layer, prefix)
+                        self.full_config
+                    ).get_quant_method(layer, prefix)
                 else:
-                    return GPTQConfig.from_config(
-                        self.full_config).get_quant_method(layer, prefix)
+                    return GPTQConfig.from_config(self.full_config).get_quant_method(
+                        layer, prefix
+                    )
             elif self.linear_quant_method == "awq":
                 if self.use_marlin and check_marlin_supports_layer(
-                        layer, self.group_size):
+                    layer, self.group_size
+                ):
                     return AWQMarlinConfig.from_config(
-                        self.full_config).get_quant_method(layer, prefix)
+                        self.full_config
+                    ).get_quant_method(layer, prefix)
                 else:
-                    return AWQConfig.from_config(
-                        self.full_config).get_quant_method(layer, prefix)
+                    return AWQConfig.from_config(self.full_config).get_quant_method(
+                        layer, prefix
+                    )
             else:
                 raise ValueError("moe_wna16 only support gptq and awq.")
         elif isinstance(layer, FusedMoE):
@@ -178,15 +212,19 @@ class MoeWNA16Method(FusedMoEMethodBase):
         quant_config: The MOE WNA16 (W8A16/W4A16) quantization config.
     """
 
-    def __init__(self, quant_config: MoeWNA16Config,
-                 moe: "FusedMoEConfig") -> None:
+    def __init__(self, quant_config: MoeWNA16Config, moe: "FusedMoEConfig") -> None:
         super().__init__(moe)
         self.quant_config = quant_config
 
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
-
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         self.moe = layer
         layer.quant_config = self.quant_config
         bit8_pack_factor = self.quant_config.bit8_pack_factor
@@ -196,8 +234,7 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
         # make intermediate_size and hidden_size divisible by group_size
         # we reduce the group size to ensure that
         # and we would repeat the loaded_weight later
-        while intermediate_size_per_partition % group_size or \
-                hidden_size % group_size:
+        while intermediate_size_per_partition % group_size or hidden_size % group_size:
             group_size = group_size // 2
             group_size_div_factor *= 2
             assert group_size >= 32
@@ -205,71 +242,85 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
         layer.group_size_div_factor = group_size_div_factor
 
         strategy = FusedMoeWeightScaleSupported.GROUP.value
-        extra_weight_attrs.update({
-            "quant_method": strategy,
-            "is_transposed": False
-        })
+        extra_weight_attrs.update({"quant_method": strategy, "is_transposed": False})
 
-        assert 'weight_loader' in extra_weight_attrs
-        weight_loader = extra_weight_attrs['weight_loader']
-        wrapped_weight_loader = MoeWNA16Method.get_weight_loader(
-            layer, weight_loader)
-        extra_weight_attrs['weight_loader'] = wrapped_weight_loader
+        assert "weight_loader" in extra_weight_attrs
+        weight_loader = extra_weight_attrs["weight_loader"]
+        wrapped_weight_loader = MoeWNA16Method.get_weight_loader(layer, weight_loader)
+        extra_weight_attrs["weight_loader"] = wrapped_weight_loader
 
         # Fused gate_up_proj (column parallel)
-        w13_qweight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            2 * intermediate_size_per_partition,
-            hidden_size // bit8_pack_factor,
-            dtype=torch.uint8),
-                                         requires_grad=False)
+        w13_qweight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                2 * intermediate_size_per_partition,
+                hidden_size // bit8_pack_factor,
+                dtype=torch.uint8,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_qweight", w13_qweight)
         set_weight_attrs(w13_qweight, extra_weight_attrs)
 
         # down_proj (row parallel)
-        w2_qweight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            hidden_size,
-            intermediate_size_per_partition // bit8_pack_factor,
-            dtype=torch.uint8),
-                                        requires_grad=False)
+        w2_qweight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                hidden_size,
+                intermediate_size_per_partition // bit8_pack_factor,
+                dtype=torch.uint8,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_qweight", w2_qweight)
         set_weight_attrs(w2_qweight, extra_weight_attrs)
 
-        w13_scales = torch.nn.Parameter(torch.zeros(
-            num_experts,
-            2 * intermediate_size_per_partition,
-            hidden_size // group_size,
-            dtype=params_dtype),
-                                        requires_grad=False)
+        w13_scales = torch.nn.Parameter(
+            torch.zeros(
+                num_experts,
+                2 * intermediate_size_per_partition,
+                hidden_size // group_size,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_scales", w13_scales)
         set_weight_attrs(w13_scales, extra_weight_attrs)
 
-        w2_scales = torch.nn.Parameter(torch.zeros(
-            num_experts,
-            hidden_size,
-            intermediate_size_per_partition // group_size,
-            dtype=params_dtype),
-                                       requires_grad=False)
+        w2_scales = torch.nn.Parameter(
+            torch.zeros(
+                num_experts,
+                hidden_size,
+                intermediate_size_per_partition // group_size,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_scales", w2_scales)
         set_weight_attrs(w2_scales, extra_weight_attrs)
 
         if self.quant_config.has_zp:
-            w13_qzeros = torch.nn.Parameter(torch.zeros(
-                num_experts,
-                2 * intermediate_size_per_partition // bit8_pack_factor,
-                hidden_size // group_size,
-                dtype=torch.uint8),
-                                            requires_grad=False)
+            w13_qzeros = torch.nn.Parameter(
+                torch.zeros(
+                    num_experts,
+                    2 * intermediate_size_per_partition // bit8_pack_factor,
+                    hidden_size // group_size,
+                    dtype=torch.uint8,
+                ),
+                requires_grad=False,
+            )
             layer.register_parameter("w13_qzeros", w13_qzeros)
             set_weight_attrs(w13_qzeros, extra_weight_attrs)
 
-            w2_qzeros = torch.nn.Parameter(torch.zeros(
-                num_experts,
-                hidden_size // bit8_pack_factor,
-                intermediate_size_per_partition // group_size,
-                dtype=torch.uint8),
-                                           requires_grad=False)
+            w2_qzeros = torch.nn.Parameter(
+                torch.zeros(
+                    num_experts,
+                    hidden_size // bit8_pack_factor,
+                    intermediate_size_per_partition // group_size,
+                    dtype=torch.uint8,
+                ),
+                requires_grad=False,
+            )
             layer.register_parameter("w2_qzeros", w2_qzeros)
             set_weight_attrs(w2_qzeros, extra_weight_attrs)
 
@@ -280,19 +331,23 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
             if not self.quant_config.has_zp:
                 invalid_param_keys += ["w13_qzeros", "w2_qzeros"]
             for key in invalid_param_keys:
-                param = torch.nn.Parameter(torch.empty((0, ),
-                                                       dtype=torch.int32),
-                                           requires_grad=False)
+                param = torch.nn.Parameter(
+                    torch.empty((0,), dtype=torch.int32), requires_grad=False
+                )
                 layer.register_parameter(key, param)
                 set_weight_attrs(param, extra_weight_attrs)
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         weight_bits = self.quant_config.weight_bits
         has_zp = self.quant_config.has_zp
         assert weight_bits == 4 or weight_bits == 8
-        config_builder = (int4_w4a16_moe_quant_config
-                          if weight_bits == 4 else int8_w8a16_moe_quant_config)
+        config_builder = (
+            int4_w4a16_moe_quant_config
+            if weight_bits == 4
+            else int8_w8a16_moe_quant_config
+        )
 
         return config_builder(
             w1_scale=layer.w13_scales,
@@ -327,10 +382,10 @@ def apply(
     ) -> Union[torch.Tensor, tuple[torch.Tensor, torch.Tensor]]:
         assert self.fused_experts is None
         if enable_eplb:
-            raise NotImplementedError(
-                "EPLB not supported for `MoeWNA16Method` yet.")
+            raise NotImplementedError("EPLB not supported for `MoeWNA16Method` yet.")
 
         from vllm.model_executor.layers.fused_moe import fused_experts
+
         assert activation == "silu", "Only SiLU activation is supported."
         topk_weights, topk_ids, _ = FusedMoE.select_experts(
             hidden_states=x,
@@ -344,7 +399,8 @@ def apply(
             scoring_func=scoring_func,
             routed_scaling_factor=routed_scaling_factor,
             e_score_correction_bias=e_score_correction_bias,
-            indices_type=self.topk_indices_dtype)
+            indices_type=self.topk_indices_dtype,
+        )
 
         return fused_experts(
             x,
@@ -361,7 +417,6 @@ def apply(
 
     @staticmethod
     def get_weight_loader(layer, weight_loader):
-
         def convert_awq_tensor(tensor, tensor_type):
             # convert awq qweight/qzeros to a standard format (assume int4)
             # qweight: (k, n // pack_factor_bit32) -> (n, k // pack_factor_bit8)
@@ -377,9 +432,7 @@ def convert_awq_tensor(tensor, tensor_type):
 
             # 2. unpack to uint4 (only when weight_bits == 4)
             #    shape (a, 4 * b) -> (a, 4 * b, 2)
-            shifter = torch.tensor([0, 4],
-                                   dtype=torch.uint8,
-                                   device=tensor.device)
+            shifter = torch.tensor([0, 4], dtype=torch.uint8, device=tensor.device)
             tensor = (tensor[:, :, None] >> shifter) & 0xF
 
             # 3. change order, see
@@ -404,20 +457,20 @@ def convert_awq_tensor(tensor, tensor_type):
 
         def convert_gptq_int4_qzeros(tensor):
             tensor = tensor.view(torch.uint8)
-            shifter = torch.tensor([0, 4],
-                                   dtype=torch.uint8,
-                                   device=tensor.device)
+            shifter = torch.tensor([0, 4], dtype=torch.uint8, device=tensor.device)
             tensor = (tensor[:, :, None] >> shifter) & 0xF
             tensor = tensor + 1
             tensor = tensor[:, :, 0] + tensor[:, :, 1] * 16
             return tensor
 
-        def moe_wna16_weight_loader(param: torch.nn.Parameter,
-                                    loaded_weight: torch.Tensor,
-                                    weight_name: str,
-                                    shard_id: str,
-                                    expert_id: int,
-                                    return_success: bool = False):
+        def moe_wna16_weight_loader(
+            param: torch.nn.Parameter,
+            loaded_weight: torch.Tensor,
+            weight_name: str,
+            shard_id: str,
+            expert_id: int,
+            return_success: bool = False,
+        ):
             if "g_idx" in weight_name:
                 return False if return_success else None
             if not layer.quant_config.has_zp and "qzeros" in weight_name:
@@ -432,8 +485,7 @@ def moe_wna16_weight_loader(param: torch.nn.Parameter,
             if layer.quant_config.linear_quant_method == "awq":
                 assert layer.quant_config.weight_bits == 4
                 if "weight" in weight_name:
-                    loaded_weight = convert_awq_tensor(loaded_weight,
-                                                       "qweight")
+                    loaded_weight = convert_awq_tensor(loaded_weight, "qweight")
                 elif "zeros" in weight_name:
                     loaded_weight = convert_awq_tensor(loaded_weight, "qzeros")
                 else:
@@ -441,44 +493,50 @@ def moe_wna16_weight_loader(param: torch.nn.Parameter,
             elif layer.quant_config.linear_quant_method == "gptq":
                 assert layer.quant_config.weight_bits in [4, 8]
                 if "weight" in weight_name:
-                    loaded_weight = loaded_weight.T.contiguous().view(
-                        torch.uint8)
+                    loaded_weight = loaded_weight.T.contiguous().view(torch.uint8)
                 elif "zeros" in weight_name:
                     # add 1 to gptq qzeros to align with awq
                     loaded_weight = loaded_weight.view(torch.uint8)
                     if layer.quant_config.weight_bits == 4:
-                        loaded_weight = convert_gptq_int4_qzeros(
-                            loaded_weight).T
+                        loaded_weight = convert_gptq_int4_qzeros(loaded_weight).T
                     else:
                         loaded_weight = loaded_weight.T + 1
                 else:
                     loaded_weight = loaded_weight.T
 
             # repeat the qzeros/scales to fit new group size
-            if layer.group_size_div_factor > 1 and \
-                    "qzeros" in weight_name or "scales" in weight_name:
+            if (
+                layer.group_size_div_factor > 1
+                and "qzeros" in weight_name
+                or "scales" in weight_name
+            ):
                 loaded_weight = loaded_weight.repeat_interleave(
-                    layer.group_size_div_factor, 1)
+                    layer.group_size_div_factor, 1
+                )
 
             if "w13_qzeros" in weight_name:
-                tensor = loaded_weight.view(layer.tp_size, -1,
-                                            loaded_weight.size(1))[tp_rank]
+                tensor = loaded_weight.view(layer.tp_size, -1, loaded_weight.size(1))[
+                    tp_rank
+                ]
                 if shard_id == "w1":
-                    param.data[expert_id, :shard_size // 2] = tensor
+                    param.data[expert_id, : shard_size // 2] = tensor
                 else:
-                    param.data[expert_id, shard_size // 2:] = tensor
+                    param.data[expert_id, shard_size // 2 :] = tensor
                 return True if return_success else None
             elif "w2_qzeros" in weight_name:
                 param.data[expert_id] = loaded_weight.view(
-                    loaded_weight.size(0), layer.tp_size, -1)[:, tp_rank]
+                    loaded_weight.size(0), layer.tp_size, -1
+                )[:, tp_rank]
                 return True if return_success else None
             else:
                 # Delegate to the original loader, passing return_success
-                return weight_loader(param,
-                                     loaded_weight,
-                                     weight_name,
-                                     shard_id,
-                                     expert_id,
-                                     return_success=return_success)
+                return weight_loader(
+                    param,
+                    loaded_weight,
+                    weight_name,
+                    shard_id,
+                    expert_id,
+                    return_success=return_success,
+                )
 
         return moe_wna16_weight_loader
diff --git a/vllm/model_executor/layers/quantization/mxfp4.py b/vllm/model_executor/layers/quantization/mxfp4.py
index 950bf33dbf01..b379d4bf3ae1 100644
--- a/vllm/model_executor/layers/quantization/mxfp4.py
+++ b/vllm/model_executor/layers/quantization/mxfp4.py
@@ -9,32 +9,45 @@
 from vllm import envs
 from vllm.config import get_current_vllm_config
 from vllm.logger import init_logger
-from vllm.model_executor.layers.fused_moe import (FusedMoE, FusedMoEConfig,
-                                                  FusedMoEMethodBase)
+from vllm.model_executor.layers.fused_moe import (
+    FusedMoE,
+    FusedMoEConfig,
+    FusedMoEMethodBase,
+)
 from vllm.model_executor.layers.fused_moe import modular_kernel as mk
 from vllm.model_executor.layers.fused_moe.config import (
-    FusedMoEQuantConfig, mxfp4_w4a4_moe_quant_config,
-    mxfp4_w4a16_moe_quant_config)
+    FusedMoEQuantConfig,
+    mxfp4_w4a4_moe_quant_config,
+    mxfp4_w4a16_moe_quant_config,
+)
 from vllm.model_executor.layers.fused_moe.fused_marlin_moe import MarlinExperts
 from vllm.model_executor.layers.fused_moe.gpt_oss_triton_kernels_moe import (
-    OAITritonExperts)
+    OAITritonExperts,
+)
 from vllm.model_executor.layers.fused_moe.trtllm_moe import TrtLlmGenExperts
-from vllm.model_executor.layers.linear import (LinearBase,
-                                               UnquantizedLinearMethod)
+from vllm.model_executor.layers.linear import LinearBase, UnquantizedLinearMethod
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp4 import (
-    prepare_moe_fp4_layer_for_marlin)
+    prepare_moe_fp4_layer_for_marlin,
+)
 from vllm.model_executor.layers.quantization.utils.mxfp4_utils import (
-    _can_support_mxfp4, _swizzle_mxfp4)
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    is_layer_skipped)
+    _can_support_mxfp4,
+    _swizzle_mxfp4,
+)
+from vllm.model_executor.layers.quantization.utils.quant_utils import is_layer_skipped
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.platforms import current_platform
 from vllm.scalar_type import scalar_types
-from vllm.utils import (has_triton_kernels, is_torch_equal_or_newer,
-                        next_power_of_2, round_up)
+from vllm.utils import (
+    has_triton_kernels,
+    is_torch_equal_or_newer,
+    next_power_of_2,
+    round_up,
+)
 from vllm.utils.flashinfer import has_flashinfer
 
 logger = init_logger(__name__)
@@ -60,42 +73,57 @@ class Mxfp4Backend(Enum):
 def get_mxfp4_backend():
     # Backend Selection
     if current_platform.is_cuda():
-        if (current_platform.is_device_capability(90) and has_flashinfer()
-                and envs.VLLM_USE_FLASHINFER_MOE_MXFP4_BF16):
+        if (
+            current_platform.is_device_capability(90)
+            and has_flashinfer()
+            and envs.VLLM_USE_FLASHINFER_MOE_MXFP4_BF16
+        ):
             logger.info_once("Using FlashInfer MXFP4 BF16 backend for SM90")
             return Mxfp4Backend.SM90_FI_MXFP4_BF16
-        elif (current_platform.is_device_capability(100) and has_flashinfer()
-              and envs.VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8_CUTLASS):
-            logger.info_once(
-                "Using FlashInfer MXFP4 MXFP8 CUTLASS backend for SM100")
+        elif (
+            current_platform.is_device_capability(100)
+            and has_flashinfer()
+            and envs.VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8_CUTLASS
+        ):
+            logger.info_once("Using FlashInfer MXFP4 MXFP8 CUTLASS backend for SM100")
             return Mxfp4Backend.SM100_FI_MXFP4_MXFP8_CUTLASS
-        elif (current_platform.is_device_capability(100) and has_flashinfer()
-              and envs.VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8):
+        elif (
+            current_platform.is_device_capability(100)
+            and has_flashinfer()
+            and envs.VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8
+        ):
             logger.info_once(
                 "Using FlashInfer MXFP4 MXFP8 TRTLLM backend for SM100, "
                 "for high concurrency throughput workloads consider setting "
                 "VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8_CUTLASS=1 for better "
-                "performance")
+                "performance"
+            )
             return Mxfp4Backend.SM100_FI_MXFP4_MXFP8_TRTLLM
         elif current_platform.is_device_capability(100) and has_flashinfer():
             logger.info_once(
                 "Using FlashInfer MXFP4 BF16 backend for SM100, "
                 "For faster performance on SM100, consider setting "
                 "VLLM_USE_FLASHINFER_MOE_MXFP4_MXFP8=1, though this may impact "
-                "accuracy.")
+                "accuracy."
+            )
             return Mxfp4Backend.SM100_FI_MXFP4_BF16
-        elif ((current_platform.is_device_capability(100)
-               or current_platform.is_device_capability(90))
-              and not has_flashinfer()):
+        elif (
+            current_platform.is_device_capability(100)
+            or current_platform.is_device_capability(90)
+        ) and not has_flashinfer():
             logger.warning_once(
                 "MXFP4 MoE is enabled on Hopper/Blackwell but FlashInfer "
                 "is not available. This may result in degraded performance. "
-                "Please `pip install vllm[flashinfer]` for best results.")
+                "Please `pip install vllm[flashinfer]` for best results."
+            )
 
         # If FlashInfer is not available, try either Marlin or Triton
-        if envs.VLLM_MXFP4_USE_MARLIN or current_platform.get_device_capability(
-        )[0] < 9 or not has_triton_kernels() or not is_torch_equal_or_newer(
-                "2.8.0"):
+        if (
+            envs.VLLM_MXFP4_USE_MARLIN
+            or current_platform.get_device_capability()[0] < 9
+            or not has_triton_kernels()
+            or not is_torch_equal_or_newer("2.8.0")
+        ):
             logger.info_once("Using Marlin backend")
             return Mxfp4Backend.MARLIN
         else:
@@ -109,7 +137,6 @@ def get_mxfp4_backend():
 
 
 class Mxfp4Config(QuantizationConfig):
-
     def __init__(self, ignored_layers: Optional[list[str]] = None):
         super().__init__()
         self.ignored_layers = ignored_layers
@@ -134,43 +161,51 @@ def get_supported_act_dtypes(cls) -> list[torch.dtype]:
     def get_config_filenames(cls) -> list[str]:
         return []
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         from vllm.attention.layer import Attention  # Avoid circular import
 
         if isinstance(layer, LinearBase):
             if self.ignored_layers and is_layer_skipped(
-                    prefix=prefix,
-                    ignored_layers=self.ignored_layers,
-                    fused_mapping=self.packed_modules_mapping):
+                prefix=prefix,
+                ignored_layers=self.ignored_layers,
+                fused_mapping=self.packed_modules_mapping,
+            ):
                 return UnquantizedLinearMethod()
             raise NotImplementedError("Mxfp4 linear layer is not implemented")
         elif isinstance(layer, FusedMoE):
             return Mxfp4MoEMethod(layer.moe_config)
         elif isinstance(layer, Attention):
-            raise NotImplementedError(
-                "Mxfp4 attention layer is not implemented")
+            raise NotImplementedError("Mxfp4 attention layer is not implemented")
         return None
 
 
 class Mxfp4MoEMethod(FusedMoEMethodBase):
-
     def __init__(self, moe: FusedMoEConfig):
         super().__init__(moe)
         self.topk_indices_dtype = None
         self.moe = moe
         self.mxfp4_backend = get_mxfp4_backend()
-        self.max_capture_size = get_current_vllm_config(
-        ).compilation_config.max_capture_size
+        self.max_capture_size = (
+            get_current_vllm_config().compilation_config.max_capture_size
+        )
 
         assert self.mxfp4_backend != Mxfp4Backend.NONE, (
             "No MXFP4 MoE backend (FlashInfer/Marlin/Triton) available."
-            "Please check your environment and try again.")
+            "Please check your environment and try again."
+        )
         self._cache_permute_indices: dict[torch.Size, torch.Tensor] = {}
 
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         self.num_experts = num_experts
         weight_dtype = torch.uint8
         scale_dtype = torch.uint8
@@ -185,8 +220,7 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
 
         mxfp4_block = 32
 
-        intermediate_size_per_partition_after_pad = \
-            intermediate_size_per_partition
+        intermediate_size_per_partition_after_pad = intermediate_size_per_partition
         if self.mxfp4_backend == Mxfp4Backend.MARLIN:
             # The moe marlin kernel requires that for each linear
             # n % 256 == 0 and k % 128 == 0.
@@ -197,34 +231,44 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
             #    n = hidden_size
             #    k = intermediate_size_per_partition_after_pad
             intermediate_size_per_partition_after_pad = round_up(
-                intermediate_size_per_partition, 128)
+                intermediate_size_per_partition, 128
+            )
             hidden_size = round_up(hidden_size, 256)
 
             layer.params_dtype = params_dtype
             layer.num_experts = num_experts
             layer.hidden_size = hidden_size
-            layer.intermediate_size_per_partition = \
+            layer.intermediate_size_per_partition = (
                 intermediate_size_per_partition_after_pad
-        elif (self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_TRTLLM
-              or self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_BF16):
+            )
+        elif (
+            self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_TRTLLM
+            or self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_BF16
+        ):
             # pad the intermediate size to be a multiple of 2 * mxfp4_block
             # for to hold non-uniform sharded tensor as well as swizzling
             # other padding to increase performance
             intermediate_size_per_partition_after_pad = round_up(
-                intermediate_size_per_partition, 256)
+                intermediate_size_per_partition, 256
+            )
             hidden_size = round_up(hidden_size, 256)
-        elif (self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_CUTLASS
-              or self.mxfp4_backend == Mxfp4Backend.SM90_FI_MXFP4_BF16):
+        elif (
+            self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_CUTLASS
+            or self.mxfp4_backend == Mxfp4Backend.SM90_FI_MXFP4_BF16
+        ):
             intermediate_size_per_partition_after_pad = round_up(
-                intermediate_size_per_partition, 128)
+                intermediate_size_per_partition, 128
+            )
             hidden_size = round_up(hidden_size, 128)
         elif current_platform.is_rocm():
             intermediate_size_per_partition_after_pad = round_up(
-                intermediate_size_per_partition, 256)
+                intermediate_size_per_partition, 256
+            )
             hidden_size = round_up(hidden_size, 256)
         else:
             intermediate_size_per_partition_after_pad = round_up(
-                intermediate_size_per_partition, 64)
+                intermediate_size_per_partition, 64
+            )
 
         self.intermediate_size = intermediate_size_per_partition_after_pad
         self.hidden_size = hidden_size
@@ -303,47 +347,61 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
     def process_weights_after_loading(self, layer):
         if self.mxfp4_backend == Mxfp4Backend.MARLIN:
             prepare_moe_fp4_layer_for_marlin(layer)
-        elif (self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_TRTLLM
-              or self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_BF16):
-            from flashinfer.fp4_quantization import (
-                nvfp4_block_scale_interleave)
-            from flashinfer.fused_moe.core import (
-                _maybe_get_cached_w2_permute_indices)
-            layer.gemm1_alpha = Parameter(torch.tensor(
-                [1.702] * self.num_experts, dtype=torch.float32).cuda(),
-                                          requires_grad=False)
-            layer.gemm1_beta = Parameter(torch.tensor(
-                [1.0] * self.num_experts, dtype=torch.float32).cuda(),
-                                         requires_grad=False)
-            layer.gemm1_clamp_limit = Parameter(torch.tensor(
-                [7.0] * self.num_experts, dtype=torch.float32).cuda(),
-                                                requires_grad=False)
+        elif (
+            self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_TRTLLM
+            or self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_BF16
+        ):
+            from flashinfer.fp4_quantization import nvfp4_block_scale_interleave
+            from flashinfer.fused_moe.core import _maybe_get_cached_w2_permute_indices
+
+            layer.gemm1_alpha = Parameter(
+                torch.tensor([1.702] * self.num_experts, dtype=torch.float32).cuda(),
+                requires_grad=False,
+            )
+            layer.gemm1_beta = Parameter(
+                torch.tensor([1.0] * self.num_experts, dtype=torch.float32).cuda(),
+                requires_grad=False,
+            )
+            layer.gemm1_clamp_limit = Parameter(
+                torch.tensor([7.0] * self.num_experts, dtype=torch.float32).cuda(),
+                requires_grad=False,
+            )
             sf_block_size = 32  # mxfp4 block size
 
-            assert (layer.w13_weight.dim() == 3
-                    and layer.w13_weight.shape[0] == self.num_experts
-                    and layer.w13_weight.shape[1] == self.intermediate_size * 2
-                    and layer.w13_weight.shape[2] == self.hidden_size // 2)
-            assert (layer.w13_weight_scale.dim() == 3
-                    and layer.w13_weight_scale.shape[0] == self.num_experts
-                    and layer.w13_weight_scale.shape[1]
-                    == self.intermediate_size * 2
-                    and layer.w13_weight_scale.shape[2]
-                    == self.hidden_size // sf_block_size)
-            assert (layer.w2_weight.dim() == 3
-                    and layer.w2_weight.shape[0] == self.num_experts
-                    and layer.w2_weight.shape[1] == self.hidden_size and
-                    layer.w2_weight.shape[2] == self.intermediate_size // 2)
-            assert (layer.w2_weight_scale.dim() == 3
-                    and layer.w2_weight_scale.shape[1] == self.hidden_size
-                    and layer.w2_weight_scale.shape[2]
-                    == self.intermediate_size // sf_block_size)
-            assert (layer.w13_bias.dim() == 2
-                    and layer.w13_bias.shape[0] == self.num_experts
-                    and layer.w13_bias.shape[1] == self.intermediate_size * 2)
-            assert (layer.w2_bias.dim() == 2
-                    and layer.w2_bias.shape[0] == self.num_experts
-                    and layer.w2_bias.shape[1] == self.hidden_size)
+            assert (
+                layer.w13_weight.dim() == 3
+                and layer.w13_weight.shape[0] == self.num_experts
+                and layer.w13_weight.shape[1] == self.intermediate_size * 2
+                and layer.w13_weight.shape[2] == self.hidden_size // 2
+            )
+            assert (
+                layer.w13_weight_scale.dim() == 3
+                and layer.w13_weight_scale.shape[0] == self.num_experts
+                and layer.w13_weight_scale.shape[1] == self.intermediate_size * 2
+                and layer.w13_weight_scale.shape[2] == self.hidden_size // sf_block_size
+            )
+            assert (
+                layer.w2_weight.dim() == 3
+                and layer.w2_weight.shape[0] == self.num_experts
+                and layer.w2_weight.shape[1] == self.hidden_size
+                and layer.w2_weight.shape[2] == self.intermediate_size // 2
+            )
+            assert (
+                layer.w2_weight_scale.dim() == 3
+                and layer.w2_weight_scale.shape[1] == self.hidden_size
+                and layer.w2_weight_scale.shape[2]
+                == self.intermediate_size // sf_block_size
+            )
+            assert (
+                layer.w13_bias.dim() == 2
+                and layer.w13_bias.shape[0] == self.num_experts
+                and layer.w13_bias.shape[1] == self.intermediate_size * 2
+            )
+            assert (
+                layer.w2_bias.dim() == 2
+                and layer.w2_bias.shape[0] == self.num_experts
+                and layer.w2_bias.shape[1] == self.hidden_size
+            )
 
             w13_weight_scale = layer.w13_weight_scale.data
             w2_weight_scale = layer.w2_weight_scale.data
@@ -391,9 +449,11 @@ def swap_every_two_rows(x, axis=-1):
                     w13_weight[i].view(torch.uint8),
                     epilogue_tile_m,
                 )
-                gemm1_weights_mxfp4_shuffled.append(w13_weight[i].view(
-                    torch.uint8)[permute_indices.to(
-                        w13_weight.device)].contiguous())
+                gemm1_weights_mxfp4_shuffled.append(
+                    w13_weight[i]
+                    .view(torch.uint8)[permute_indices.to(w13_weight.device)]
+                    .contiguous()
+                )
                 # w13 scale shuffling
                 permute_sf_indices = _maybe_get_cached_w2_permute_indices(
                     self._cache_permute_indices,
@@ -402,27 +462,37 @@ def swap_every_two_rows(x, axis=-1):
                     num_elts_per_sf=16,
                 )
                 gemm1_scales_mxfp4_shuffled.append(
-                    nvfp4_block_scale_interleave(w13_weight_scale[i].view(
-                        torch.uint8)[permute_sf_indices.to(
-                            w13_weight_scale.device)].contiguous()))
+                    nvfp4_block_scale_interleave(
+                        w13_weight_scale[i]
+                        .view(torch.uint8)[
+                            permute_sf_indices.to(w13_weight_scale.device)
+                        ]
+                        .contiguous()
+                    )
+                )
                 # w13 bias shuffling
                 permute_bias_indices = _maybe_get_cached_w2_permute_indices(
                     self._cache_permute_indices,
                     w13_bias[i].clone().reshape(-1, 1),
                     epilogue_tile_m,
                 )
-                gemm1_bias_shuffled.append(w13_bias[i].clone().reshape(
-                    -1,
-                    1)[permute_bias_indices.to(w13_bias.device)].contiguous())
+                gemm1_bias_shuffled.append(
+                    w13_bias[i]
+                    .clone()
+                    .reshape(-1, 1)[permute_bias_indices.to(w13_bias.device)]
+                    .contiguous()
+                )
                 # w2 weight shuffling
                 permute_indices = _maybe_get_cached_w2_permute_indices(
                     self._cache_permute_indices,
                     w2_weight[i].view(torch.uint8),
                     epilogue_tile_m,
                 )
-                gemm2_weights_mxfp4_shuffled.append(w2_weight[i].view(
-                    torch.uint8)[permute_indices.to(
-                        w2_weight.device)].contiguous())
+                gemm2_weights_mxfp4_shuffled.append(
+                    w2_weight[i]
+                    .view(torch.uint8)[permute_indices.to(w2_weight.device)]
+                    .contiguous()
+                )
                 # w2 scale shuffling
                 permute_sf_indices = _maybe_get_cached_w2_permute_indices(
                     self._cache_permute_indices,
@@ -431,81 +501,115 @@ def swap_every_two_rows(x, axis=-1):
                     num_elts_per_sf=16,
                 )
                 gemm2_scales_mxfp4_shuffled.append(
-                    nvfp4_block_scale_interleave(w2_weight_scale[i].view(
-                        torch.uint8)[permute_sf_indices.to(
-                            w2_weight_scale.device)].contiguous()))
+                    nvfp4_block_scale_interleave(
+                        w2_weight_scale[i]
+                        .view(torch.uint8)[
+                            permute_sf_indices.to(w2_weight_scale.device)
+                        ]
+                        .contiguous()
+                    )
+                )
                 # w2 bias shuffling
                 permute_indices = _maybe_get_cached_w2_permute_indices(
                     self._cache_permute_indices,
                     w2_bias[i].clone().reshape(-1, 1),
                     epilogue_tile_m,
                 )
-                gemm2_bias_shuffled.append(w2_bias[i].clone().reshape(
-                    -1, 1)[permute_indices.to(w2_bias.device)].contiguous())
+                gemm2_bias_shuffled.append(
+                    w2_bias[i]
+                    .clone()
+                    .reshape(-1, 1)[permute_indices.to(w2_bias.device)]
+                    .contiguous()
+                )
 
             w13_weight = torch.stack(gemm1_weights_mxfp4_shuffled)
-            w13_weight_scale = torch.stack(
-                gemm1_scales_mxfp4_shuffled).reshape(
-                    self.num_experts, 2 * self.intermediate_size,
-                    self.hidden_size // sf_block_size).view(
-                        torch.float8_e4m3fn)
+            w13_weight_scale = (
+                torch.stack(gemm1_scales_mxfp4_shuffled)
+                .reshape(
+                    self.num_experts,
+                    2 * self.intermediate_size,
+                    self.hidden_size // sf_block_size,
+                )
+                .view(torch.float8_e4m3fn)
+            )
 
             w2_weight = torch.stack(gemm2_weights_mxfp4_shuffled)
-            w2_weight_scale = torch.stack(gemm2_scales_mxfp4_shuffled).reshape(
-                self.num_experts, self.hidden_size, self.intermediate_size //
-                sf_block_size).view(torch.float8_e4m3fn)
+            w2_weight_scale = (
+                torch.stack(gemm2_scales_mxfp4_shuffled)
+                .reshape(
+                    self.num_experts,
+                    self.hidden_size,
+                    self.intermediate_size // sf_block_size,
+                )
+                .view(torch.float8_e4m3fn)
+            )
 
             layer.w13_weight = Parameter(w13_weight, requires_grad=False)
-            layer.w13_weight_scale = Parameter(w13_weight_scale,
-                                               requires_grad=False)
+            layer.w13_weight_scale = Parameter(w13_weight_scale, requires_grad=False)
             layer.w2_weight = Parameter(w2_weight, requires_grad=False)
-            layer.w2_weight_scale = Parameter(w2_weight_scale,
-                                              requires_grad=False)
+            layer.w2_weight_scale = Parameter(w2_weight_scale, requires_grad=False)
             layer.w13_bias = Parameter(
                 torch.stack(gemm1_bias_shuffled).reshape(self.num_experts, -1),
-                requires_grad=False)
-            layer.w2_bias = Parameter(torch.stack(gemm2_bias_shuffled).reshape(
-                self.num_experts, -1),
-                                      requires_grad=False)
-        elif (self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_CUTLASS
-              or self.mxfp4_backend == Mxfp4Backend.SM90_FI_MXFP4_BF16):
-            layer.gemm1_alpha = Parameter(torch.tensor(
-                [1.702] * self.num_experts, dtype=torch.float32).cuda(),
-                                          requires_grad=False)
-            layer.gemm1_beta = Parameter(torch.tensor(
-                [1.0] * self.num_experts, dtype=torch.float32).cuda(),
-                                         requires_grad=False)
-            layer.gemm1_clamp_limit = Parameter(torch.tensor(
-                [7.0] * self.num_experts, dtype=torch.float32).cuda(),
-                                                requires_grad=False)
+                requires_grad=False,
+            )
+            layer.w2_bias = Parameter(
+                torch.stack(gemm2_bias_shuffled).reshape(self.num_experts, -1),
+                requires_grad=False,
+            )
+        elif (
+            self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_CUTLASS
+            or self.mxfp4_backend == Mxfp4Backend.SM90_FI_MXFP4_BF16
+        ):
+            layer.gemm1_alpha = Parameter(
+                torch.tensor([1.702] * self.num_experts, dtype=torch.float32).cuda(),
+                requires_grad=False,
+            )
+            layer.gemm1_beta = Parameter(
+                torch.tensor([1.0] * self.num_experts, dtype=torch.float32).cuda(),
+                requires_grad=False,
+            )
+            layer.gemm1_clamp_limit = Parameter(
+                torch.tensor([7.0] * self.num_experts, dtype=torch.float32).cuda(),
+                requires_grad=False,
+            )
 
             sf_block_size = 32  # mxfp4 block size
 
             # Common shape assertions
-            assert (layer.w13_weight.dim() == 3
-                    and layer.w13_weight.shape[0] == self.num_experts
-                    and layer.w13_weight.shape[1] == self.intermediate_size * 2
-                    and layer.w13_weight.shape[2] == self.hidden_size // 2)
-            assert (layer.w13_weight_scale.dim() == 3
-                    and layer.w13_weight_scale.shape[0] == self.num_experts
-                    and layer.w13_weight_scale.shape[1]
-                    == self.intermediate_size * 2
-                    and layer.w13_weight_scale.shape[2]
-                    == self.hidden_size // sf_block_size)
-            assert (layer.w2_weight.dim() == 3
-                    and layer.w2_weight.shape[0] == self.num_experts
-                    and layer.w2_weight.shape[1] == self.hidden_size and
-                    layer.w2_weight.shape[2] == self.intermediate_size // 2)
-            assert (layer.w2_weight_scale.dim() == 3
-                    and layer.w2_weight_scale.shape[1] == self.hidden_size
-                    and layer.w2_weight_scale.shape[2]
-                    == self.intermediate_size // sf_block_size)
-            assert (layer.w13_bias.dim() == 2
-                    and layer.w13_bias.shape[0] == self.num_experts
-                    and layer.w13_bias.shape[1] == self.intermediate_size * 2)
-            assert (layer.w2_bias.dim() == 2
-                    and layer.w2_bias.shape[0] == self.num_experts
-                    and layer.w2_bias.shape[1] == self.hidden_size)
+            assert (
+                layer.w13_weight.dim() == 3
+                and layer.w13_weight.shape[0] == self.num_experts
+                and layer.w13_weight.shape[1] == self.intermediate_size * 2
+                and layer.w13_weight.shape[2] == self.hidden_size // 2
+            )
+            assert (
+                layer.w13_weight_scale.dim() == 3
+                and layer.w13_weight_scale.shape[0] == self.num_experts
+                and layer.w13_weight_scale.shape[1] == self.intermediate_size * 2
+                and layer.w13_weight_scale.shape[2] == self.hidden_size // sf_block_size
+            )
+            assert (
+                layer.w2_weight.dim() == 3
+                and layer.w2_weight.shape[0] == self.num_experts
+                and layer.w2_weight.shape[1] == self.hidden_size
+                and layer.w2_weight.shape[2] == self.intermediate_size // 2
+            )
+            assert (
+                layer.w2_weight_scale.dim() == 3
+                and layer.w2_weight_scale.shape[1] == self.hidden_size
+                and layer.w2_weight_scale.shape[2]
+                == self.intermediate_size // sf_block_size
+            )
+            assert (
+                layer.w13_bias.dim() == 2
+                and layer.w13_bias.shape[0] == self.num_experts
+                and layer.w13_bias.shape[1] == self.intermediate_size * 2
+            )
+            assert (
+                layer.w2_bias.dim() == 2
+                and layer.w2_bias.shape[0] == self.num_experts
+                and layer.w2_bias.shape[1] == self.hidden_size
+            )
 
             # De-interleave and swap for w13 weight, bias, and scales
             w13_w = layer.w13_weight.data
@@ -531,51 +635,55 @@ def swap_every_two_rows(x, axis=-1):
 
                 orig_shape = w13_scale_swapped.shape
                 w13_scale_interleaved = block_scale_interleave(
-                    w13_scale_swapped.view(torch.uint8)).reshape(orig_shape)
+                    w13_scale_swapped.view(torch.uint8)
+                ).reshape(orig_shape)
 
                 w2_s = layer.w2_weight_scale.data
                 orig_shape = w2_s.shape
                 w2_scale_interleaved = block_scale_interleave(
-                    w2_s.view(torch.uint8)).reshape(orig_shape)
-
-                layer.w13_weight = Parameter(w13_weight_swapped,
-                                             requires_grad=False)
-                layer.w13_weight_scale = Parameter(w13_scale_interleaved,
-                                                   requires_grad=False)
-                layer.w13_bias = Parameter(w13_bias_swapped,
-                                           requires_grad=False)
-                layer.w2_weight_scale = Parameter(w2_scale_interleaved,
-                                                  requires_grad=False)
+                    w2_s.view(torch.uint8)
+                ).reshape(orig_shape)
+
+                layer.w13_weight = Parameter(w13_weight_swapped, requires_grad=False)
+                layer.w13_weight_scale = Parameter(
+                    w13_scale_interleaved, requires_grad=False
+                )
+                layer.w13_bias = Parameter(w13_bias_swapped, requires_grad=False)
+                layer.w2_weight_scale = Parameter(
+                    w2_scale_interleaved, requires_grad=False
+                )
             elif self.mxfp4_backend == Mxfp4Backend.SM90_FI_MXFP4_BF16:
 
                 def _interleave_mxfp4_cutlass_sm90(w):
                     w_shape = w.shape
-                    w_interleaved = w.reshape(w_shape[0], w_shape[1],
-                                              (w_shape[2] // 4), 4)
+                    w_interleaved = w.reshape(
+                        w_shape[0], w_shape[1], (w_shape[2] // 4), 4
+                    )
                     w_interleaved = w_interleaved.permute(0, 2, 1, 3)
                     w_interleaved = w_interleaved.reshape(
-                        w_shape[0], w_shape[2] // 4, w_shape[1] * 4)
+                        w_shape[0], w_shape[2] // 4, w_shape[1] * 4
+                    )
                     return w_interleaved
 
-                w31_scales = w13_scale_swapped.to(torch.uint8).view(
-                    torch.uint8)
-                w31_scales_interleaved = _interleave_mxfp4_cutlass_sm90(
-                    w31_scales)
+                w31_scales = w13_scale_swapped.to(torch.uint8).view(torch.uint8)
+                w31_scales_interleaved = _interleave_mxfp4_cutlass_sm90(w31_scales)
 
                 w2_weight_scale = layer.w2_weight_scale.data
                 w2_scales = w2_weight_scale.to(torch.uint8).view(torch.uint8)
-                w2_scales_interleaved = _interleave_mxfp4_cutlass_sm90(
-                    w2_scales)
-
-                layer.w13_weight = torch.nn.Parameter(torch.cat([w3_w, w1_w],
-                                                                dim=1),
-                                                      requires_grad=False)
-                layer.w13_bias = torch.nn.Parameter(w13_bias_swapped,
-                                                    requires_grad=False)
+                w2_scales_interleaved = _interleave_mxfp4_cutlass_sm90(w2_scales)
+
+                layer.w13_weight = torch.nn.Parameter(
+                    torch.cat([w3_w, w1_w], dim=1), requires_grad=False
+                )
+                layer.w13_bias = torch.nn.Parameter(
+                    w13_bias_swapped, requires_grad=False
+                )
                 layer.w13_weight_scale = torch.nn.Parameter(
-                    w31_scales_interleaved, requires_grad=False)
+                    w31_scales_interleaved, requires_grad=False
+                )
                 layer.w2_weight_scale = torch.nn.Parameter(
-                    w2_scales_interleaved, requires_grad=False)
+                    w2_scales_interleaved, requires_grad=False
+                )
         elif self.mxfp4_backend == Mxfp4Backend.TRITON:
             from triton_kernels.matmul_ogs import FlexCtx, PrecisionConfig
 
@@ -590,22 +698,25 @@ def _interleave_mxfp4_cutlass_sm90(w):
             # batched activation format. As self.fused_experts is not
             # initialized at this point, we resort to checking the MoE config
             # directly.
-            is_batched_moe = (self.moe.use_pplx_kernels
-                              or self.moe.use_deepep_ll_kernels)
+            is_batched_moe = self.moe.use_pplx_kernels or self.moe.use_deepep_ll_kernels
             if is_batched_moe:
                 num_warps = 4 if envs.VLLM_MOE_DP_CHUNK_SIZE <= 512 else 8
             else:
                 num_warps = 8
 
             w13_weight, w13_flex, w13_scale = _swizzle_mxfp4(
-                layer.w13_weight, layer.w13_weight_scale, num_warps)
+                layer.w13_weight, layer.w13_weight_scale, num_warps
+            )
             w2_weight, w2_flex, w2_scale = _swizzle_mxfp4(
-                layer.w2_weight, layer.w2_weight_scale, num_warps)
+                layer.w2_weight, layer.w2_weight_scale, num_warps
+            )
 
             self.w13_precision_config = PrecisionConfig(
-                weight_scale=w13_scale, flex_ctx=FlexCtx(rhs_data=w13_flex))
+                weight_scale=w13_scale, flex_ctx=FlexCtx(rhs_data=w13_flex)
+            )
             self.w2_precision_config = PrecisionConfig(
-                weight_scale=w2_scale, flex_ctx=FlexCtx(rhs_data=w2_flex))
+                weight_scale=w2_scale, flex_ctx=FlexCtx(rhs_data=w2_flex)
+            )
 
             self.w13_weight_triton_tensor = w13_weight
             self.w2_weight_triton_tensor = w2_weight
@@ -644,8 +755,8 @@ def _get_tile_tokens_dim(self, x: torch.Tensor, top_k: int):
         return tile_tokens_dim
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
-
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         if self.mxfp4_backend == Mxfp4Backend.MARLIN:
             return mxfp4_w4a16_moe_quant_config(
                 w1_bias=layer.w13_bias,
@@ -677,14 +788,19 @@ def select_gemm_impl(
         prepare_finalize: mk.FusedMoEPrepareAndFinalize,
         layer: torch.nn.Module,
     ) -> mk.FusedMoEPermuteExpertsUnpermute:
-        if (prepare_finalize.activation_format ==
-                mk.FusedMoEActivationFormat.BatchedExperts):
+        if (
+            prepare_finalize.activation_format
+            == mk.FusedMoEActivationFormat.BatchedExperts
+        ):
             raise NotImplementedError(
-                "Mxfp4 does not support batched experts format for EP")
+                "Mxfp4 does not support batched experts format for EP"
+            )
         else:
             assert self.moe_quant_config is not None
-            if (self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_TRTLLM
-                    or self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_BF16):
+            if (
+                self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_TRTLLM
+                or self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_BF16
+            ):
                 # B200 code-path
                 kwargs = {
                     "gemm1_alpha": layer.gemm1_alpha,
@@ -693,36 +809,34 @@ def select_gemm_impl(
                     # TODO(bnell): part of quant_config
                     "max_capture_size": self.max_capture_size,
                 }
-                return TrtLlmGenExperts(self.moe, self.moe_quant_config,
-                                        **kwargs)
-            elif (self.mxfp4_backend == Mxfp4Backend.MARLIN):
+                return TrtLlmGenExperts(self.moe, self.moe_quant_config, **kwargs)
+            elif self.mxfp4_backend == Mxfp4Backend.MARLIN:
                 return MarlinExperts(self.moe_quant_config)
             else:
                 return OAITritonExperts(self.moe_quant_config)
 
     def _route_and_experts(
-            self,
-            layer: torch.nn.Module,
-            x: torch.Tensor,
-            router_logits: torch.Tensor,
-            top_k: int,
-            renormalize: bool,
-            use_grouped_topk: bool = False,
-            topk_group: Optional[int] = None,
-            num_expert_group: Optional[int] = None,
-            global_num_experts: int = -1,
-            expert_map: Optional[torch.Tensor] = None,
-            custom_routing_function: Optional[Callable] = None,
-            scoring_func: str = "softmax",
-            e_score_correction_bias: Optional[torch.Tensor] = None,
-            apply_router_weight_on_input: bool = False,
-            activation: str = "silu",
-            enable_eplb: bool = False,
-            expert_load_view: Optional[torch.Tensor] = None,
-            logical_to_physical_map: Optional[torch.Tensor] = None,
-            logical_replica_count: Optional[torch.Tensor] = None
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        router_logits: torch.Tensor,
+        top_k: int,
+        renormalize: bool,
+        use_grouped_topk: bool = False,
+        topk_group: Optional[int] = None,
+        num_expert_group: Optional[int] = None,
+        global_num_experts: int = -1,
+        expert_map: Optional[torch.Tensor] = None,
+        custom_routing_function: Optional[Callable] = None,
+        scoring_func: str = "softmax",
+        e_score_correction_bias: Optional[torch.Tensor] = None,
+        apply_router_weight_on_input: bool = False,
+        activation: str = "silu",
+        enable_eplb: bool = False,
+        expert_load_view: Optional[torch.Tensor] = None,
+        logical_to_physical_map: Optional[torch.Tensor] = None,
+        logical_replica_count: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-
         assert isinstance(self.fused_experts, mk.FusedMoEModularKernel)
 
         topk_weights, topk_ids, _ = FusedMoE.select_experts(
@@ -741,12 +855,17 @@ def _route_and_experts(
             expert_map=expert_map,
             expert_load_view=expert_load_view,
             logical_to_physical_map=logical_to_physical_map,
-            logical_replica_count=logical_replica_count)
+            logical_replica_count=logical_replica_count,
+        )
 
-        w13_weight = (self.w13_weight_triton_tensor
-                      if layer.w13_weight is None else layer.w13_weight)
-        w2_weight = (self.w2_weight_triton_tensor
-                     if layer.w2_weight is None else layer.w2_weight)
+        w13_weight = (
+            self.w13_weight_triton_tensor
+            if layer.w13_weight is None
+            else layer.w13_weight
+        )
+        w2_weight = (
+            self.w2_weight_triton_tensor if layer.w2_weight is None else layer.w2_weight
+        )
         assert all([w is not None for w in [w13_weight, w2_weight]])
 
         return self.fused_experts(
@@ -785,7 +904,6 @@ def apply(
         logical_to_physical_map: Optional[torch.Tensor] = None,
         logical_replica_count: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, tuple[torch.Tensor, torch.Tensor]]:
-
         if enable_eplb:
             raise NotImplementedError("EPLB is not supported for mxfp4")
 
@@ -824,7 +942,8 @@ def apply(
                 custom_routing_function=custom_routing_function,
                 scoring_func=scoring_func,
                 routed_scaling_factor=routed_scaling_factor,
-                e_score_correction_bias=e_score_correction_bias)
+                e_score_correction_bias=e_score_correction_bias,
+            )
 
             return torch.ops.vllm.fused_marlin_moe(
                 x,
@@ -843,28 +962,39 @@ def apply(
                 apply_router_weight_on_input=apply_router_weight_on_input,
                 global_num_experts=global_num_experts,
                 activation=activation,
-                expert_map=expert_map)
+                expert_map=expert_map,
+            )
 
         assert _can_support_mxfp4(
-            use_grouped_topk, topk_group, num_expert_group, expert_map,
-            custom_routing_function, e_score_correction_bias,
-            apply_router_weight_on_input, scoring_func, activation,
-            expert_load_view, logical_to_physical_map,
-            logical_replica_count), (
-                "MXFP4 are not supported with this configuration.")
-
-        if (self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_TRTLLM
-                or self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_BF16):
+            use_grouped_topk,
+            topk_group,
+            num_expert_group,
+            expert_map,
+            custom_routing_function,
+            e_score_correction_bias,
+            apply_router_weight_on_input,
+            scoring_func,
+            activation,
+            expert_load_view,
+            logical_to_physical_map,
+            logical_replica_count,
+        ), "MXFP4 are not supported with this configuration."
+
+        if (
+            self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_TRTLLM
+            or self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_BF16
+        ):
             from flashinfer import trtllm_fp4_block_scale_moe
+
             if self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_BF16:
                 assert x.dtype == torch.bfloat16
                 x_quant = x
                 x_scale = None
             elif self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_TRTLLM:
                 from flashinfer import mxfp8_quantize
+
                 x_quant, x_scale = mxfp8_quantize(x, False)  # to mxfp8
-                x_scale = x_scale.view(torch.float8_e4m3fn).reshape(
-                    *x.shape[:-1], -1)
+                x_scale = x_scale.view(torch.float8_e4m3fn).reshape(*x.shape[:-1], -1)
 
             trtllm_gen_output = trtllm_fp4_block_scale_moe(
                 router_logits.to(torch.bfloat16),
@@ -897,8 +1027,10 @@ def apply(
                 tune_max_num_tokens=self.max_capture_size,
             )[0]
             return trtllm_gen_output
-        elif (self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_CUTLASS
-              or self.mxfp4_backend == Mxfp4Backend.SM90_FI_MXFP4_BF16):
+        elif (
+            self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_CUTLASS
+            or self.mxfp4_backend == Mxfp4Backend.SM90_FI_MXFP4_BF16
+        ):
             from vllm.utils.flashinfer import flashinfer_cutlass_fused_moe
 
             topk_weights, topk_ids, _ = FusedMoE.select_experts(
@@ -916,13 +1048,11 @@ def apply(
 
             # Backend-specific preparation
             if self.mxfp4_backend == Mxfp4Backend.SM100_FI_MXFP4_MXFP8_CUTLASS:
-
                 from flashinfer import mxfp8_quantize
 
                 x_quant, x_scale = mxfp8_quantize(x, True, 32)
 
-                fake_input_scale = torch.ones(self.num_experts,
-                                              device=x.device)
+                fake_input_scale = torch.ones(self.num_experts, device=x.device)
                 quant_scales = [
                     layer.w13_weight_scale.contiguous().view(torch.int32),
                     fake_input_scale,
@@ -934,10 +1064,8 @@ def apply(
                 extra_kwargs = dict(
                     use_mxfp8_act_scaling=True,
                     input_sf=x_scale,
-                    fc1_expert_weights=layer.w13_weight.contiguous().view(
-                        torch.long),
-                    fc2_expert_weights=layer.w2_weight.contiguous().view(
-                        torch.long),
+                    fc1_expert_weights=layer.w13_weight.contiguous().view(torch.long),
+                    fc2_expert_weights=layer.w2_weight.contiguous().view(torch.long),
                 )
             elif self.mxfp4_backend == Mxfp4Backend.SM90_FI_MXFP4_BF16:
                 assert x.dtype == torch.bfloat16
@@ -978,7 +1106,9 @@ def apply(
             return output
         elif self.mxfp4_backend == Mxfp4Backend.TRITON:
             from vllm.model_executor.layers.fused_moe.gpt_oss_triton_kernels_moe import (  # noqa: E501
-                triton_kernel_moe_forward)
+                triton_kernel_moe_forward,
+            )
+
             return triton_kernel_moe_forward(
                 hidden_states=x,
                 w1=self.w13_weight_triton_tensor,
diff --git a/vllm/model_executor/layers/quantization/petit.py b/vllm/model_executor/layers/quantization/petit.py
index 5b9fee69bb02..60519bdaea02 100644
--- a/vllm/model_executor/layers/quantization/petit.py
+++ b/vllm/model_executor/layers/quantization/petit.py
@@ -9,19 +9,24 @@
 from torch.nn.parameter import Parameter
 
 from vllm.logger import init_logger
-from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
-                                               UnquantizedLinearMethod)
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    LinearMethodBase,
+    UnquantizedLinearMethod,
+)
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.layers.quantization.kv_cache import BaseKVCacheMethod
 from vllm.model_executor.layers.quantization.utils.petit_utils import (
-    apply_petit_nvfp4_linear, prepare_nvfp4_layer_for_petit,
-    verify_petit_nvfp4_supported)
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    is_layer_skipped)
-from vllm.model_executor.parameter import (ModelWeightParameter,
-                                           PerTensorScaleParameter)
+    apply_petit_nvfp4_linear,
+    prepare_nvfp4_layer_for_petit,
+    verify_petit_nvfp4_supported,
+)
+from vllm.model_executor.layers.quantization.utils.quant_utils import is_layer_skipped
+from vllm.model_executor.parameter import ModelWeightParameter, PerTensorScaleParameter
 from vllm.platforms import current_platform
 
 # Initialize logger for the module
@@ -43,8 +48,10 @@ def __init__(
         self._check_hardware_support()
         self.is_checkpoint_nvfp4_serialized = is_checkpoint_nvfp4_serialized
         if is_checkpoint_nvfp4_serialized:
-            logger.warning("Detected nvfp4 checkpoint. Please note that the "
-                           "format is experimental and subject to change.")
+            logger.warning(
+                "Detected nvfp4 checkpoint. Please note that the "
+                "format is experimental and subject to change."
+            )
         self.group_size = group_size
         self.kv_cache_quant_algo = kv_cache_quant_algo
         self.exclude_modules = exclude_modules
@@ -61,7 +68,8 @@ def _check_hardware_support(self) -> None:
                 "The 'petit' quantization backend is designed for AMD GPUs "
                 "and is not supported on the CUDA platform. For NVIDIA GPUs, "
                 "please use a different quantization method such as FP8, AWQ, "
-                "or GPTQ.")
+                "or GPTQ."
+            )
 
     @classmethod
     def get_name(cls) -> QuantizationMethods:
@@ -86,8 +94,7 @@ def from_config(cls, config: dict[str, Any]) -> "PetitNvFp4Config":
 
         quant_method_raw = qc.get("quant_algo")
         if not isinstance(quant_method_raw, str) or not quant_method_raw:
-            raise ValueError(
-                "Missing or invalid 'quant_algo' in quantization config.")
+            raise ValueError("Missing or invalid 'quant_algo' in quantization config.")
         quant_method = quant_method_raw.upper()
 
         group_size_raw = qc.get("group_size")
@@ -101,19 +108,18 @@ def from_config(cls, config: dict[str, Any]) -> "PetitNvFp4Config":
 
         kv_cache_quant_algo_raw = qc.get("kv_cache_quant_algo") or "auto"
         if not isinstance(kv_cache_quant_algo_raw, str):
-            raise ValueError(
-                "'kv_cache_quant_algo' must be a string if provided.")
+            raise ValueError("'kv_cache_quant_algo' must be a string if provided.")
         kv_cache_quant_algo = kv_cache_quant_algo_raw
 
         exclude_raw = qc.get("exclude_modules", [])
         if exclude_raw is None:
             exclude_modules: list[str] = []
         elif isinstance(exclude_raw, list) and all(
-                isinstance(x, str) for x in exclude_raw):
+            isinstance(x, str) for x in exclude_raw
+        ):
             exclude_modules = exclude_raw
         else:
-            raise ValueError(
-                "'exclude_modules' must be a list[str] (or omitted).")
+            raise ValueError("'exclude_modules' must be a list[str] (or omitted).")
 
         is_checkpoint_nvfp4_serialized = "NVFP4" in quant_method
 
@@ -126,7 +132,8 @@ def from_config(cls, config: dict[str, Any]) -> "PetitNvFp4Config":
 
     @classmethod
     def override_quantization_method(
-            cls, hf_quant_cfg, user_quant) -> Optional[QuantizationMethods]:
+        cls, hf_quant_cfg, user_quant
+    ) -> Optional[QuantizationMethods]:
         if not current_platform.is_rocm():
             return None
 
@@ -142,23 +149,24 @@ def is_petit_nvfp4_compatible(cls, quant_config: dict[str, Any]) -> bool:
         algo = (qc.get("quant_algo") or qc.get("quant_method") or "").upper()
         return algo == "NVFP4"
 
-    def is_layer_excluded(self, prefix: str,
-                          exclude_modules: list[str]) -> bool:
+    def is_layer_excluded(self, prefix: str, exclude_modules: list[str]) -> bool:
         for pattern in exclude_modules:
             regex_str = pattern.replace(".", r"\.").replace("*", r".*")
             if re.fullmatch(regex_str, prefix):
                 return True
         return False
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         from vllm.attention.layer import Attention  # Avoid circular import
 
         exclude = self.require_exclude_modules()
 
         if isinstance(layer, LinearBase):
             if is_layer_skipped(prefix, exclude) or self.is_layer_excluded(
-                    prefix, exclude):
+                prefix, exclude
+            ):
                 return UnquantizedLinearMethod()
             return PetitNvFp4LinearMethod(self)
         elif isinstance(layer, Attention):
@@ -220,8 +228,10 @@ def create_weights(
     ):
         del input_size, output_size
         if not self.quant_config.is_checkpoint_nvfp4_serialized:
-            raise ValueError("NVFP4 quantization was selected, "
-                             " dynamic quantization is not supported.")
+            raise ValueError(
+                "NVFP4 quantization was selected, "
+                " dynamic quantization is not supported."
+            )
 
         output_size_per_partition = sum(output_partition_sizes)
         weight_loader = extra_weight_attrs.get("weight_loader")
@@ -231,12 +241,15 @@ def create_weights(
         layer.input_size_per_partition = input_size_per_partition
         layer.output_size_per_partition = output_size_per_partition
         if input_size_per_partition % 16 != 0:
-            raise ValueError("Unsupported model when in features size is "
-                             "not multiple of 16")
+            raise ValueError(
+                "Unsupported model when in features size is not multiple of 16"
+            )
 
-        weight_dtype = (torch.float8_e4m3fn
-                        if self.quant_config.is_checkpoint_nvfp4_serialized
-                        else params_dtype)
+        weight_dtype = (
+            torch.float8_e4m3fn
+            if self.quant_config.is_checkpoint_nvfp4_serialized
+            else params_dtype
+        )
 
         weight = ModelWeightParameter(
             data=torch.empty(
@@ -283,8 +296,9 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         weight_scale_2 = layer.weight_scale_2.max().to(torch.float32)
         layer.input_scale = Parameter(input_scale_2, requires_grad=False)
         layer.weight_scale_2 = Parameter(weight_scale_2, requires_grad=False)
-        layer.alpha = Parameter(layer.input_scale * layer.weight_scale_2,
-                                requires_grad=False)
+        layer.alpha = Parameter(
+            layer.input_scale * layer.weight_scale_2, requires_grad=False
+        )
 
         prepare_nvfp4_layer_for_petit(layer)
         del layer.input_scale
diff --git a/vllm/model_executor/layers/quantization/ptpc_fp8.py b/vllm/model_executor/layers/quantization/ptpc_fp8.py
index 45ea8e3520f1..1ef7ca5d1dbb 100644
--- a/vllm/model_executor/layers/quantization/ptpc_fp8.py
+++ b/vllm/model_executor/layers/quantization/ptpc_fp8.py
@@ -8,18 +8,19 @@
 
 from vllm import _custom_ops as ops
 from vllm.logger import init_logger
-from vllm.model_executor.layers.linear import (LinearBase,
-                                               UnquantizedLinearMethod)
+from vllm.model_executor.layers.linear import LinearBase, UnquantizedLinearMethod
 from vllm.model_executor.layers.quantization import QuantizationMethods
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizeMethodBase)
-from vllm.model_executor.layers.quantization.fp8 import (Fp8Config,
-                                                         Fp8KVCacheMethod,
-                                                         Fp8LinearMethod)
+from vllm.model_executor.layers.quantization.base_config import QuantizeMethodBase
+from vllm.model_executor.layers.quantization.fp8 import (
+    Fp8Config,
+    Fp8KVCacheMethod,
+    Fp8LinearMethod,
+)
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape, is_layer_skipped)
-from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    Fp8LinearOp)
+    GroupShape,
+    is_layer_skipped,
+)
+from vllm.model_executor.layers.quantization.utils.w8a8_utils import Fp8LinearOp
 from vllm.platforms import current_platform
 
 ACTIVATION_SCHEMES = ["static", "dynamic"]
@@ -36,20 +37,20 @@ def __init__(
         ignored_layers: Optional[list[str]] = None,
     ) -> None:
         if not current_platform.is_rocm():
-            raise ValueError(
-                "ptpc_fp8 quantization is supported only on ROCm.")
+            raise ValueError("ptpc_fp8 quantization is supported only on ROCm.")
 
         if not current_platform.has_device_capability(94):
             raise ValueError(
                 "ptpc_fp8 quantization is supported only on AMD Instinct MI300 GPUs and newer."  # noqa: E501
             )
         if activation_scheme == "static":
-            raise ValueError(
-                "ptpc_fp8 as of now only support dynamic quantization.")
+            raise ValueError("ptpc_fp8 as of now only support dynamic quantization.")
 
-        super().__init__(is_checkpoint_fp8_serialized=False,
-                         activation_scheme=activation_scheme,
-                         ignored_layers=ignored_layers)
+        super().__init__(
+            is_checkpoint_fp8_serialized=False,
+            activation_scheme=activation_scheme,
+            ignored_layers=ignored_layers,
+        )
 
     @classmethod
     def get_name(cls) -> QuantizationMethods:
@@ -59,11 +60,11 @@ def get_name(cls) -> QuantizationMethods:
     def from_config(cls, config: dict[str, Any]) -> "PTPCFp8Config":
         activation_scheme = cls.get_from_keys(config, ["activation_scheme"])
         ignored_layers = cls.get_from_keys_or(config, ["ignored_layers"], None)
-        return cls(activation_scheme=activation_scheme,
-                   ignored_layers=ignored_layers)
+        return cls(activation_scheme=activation_scheme, ignored_layers=ignored_layers)
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         from vllm.attention.layer import Attention  # Avoid circular import
 
         if isinstance(layer, LinearBase):
@@ -79,7 +80,7 @@ class PTPCFp8LinearMethod(Fp8LinearMethod):
     """Linear method for Per-Token and Per-Channel FP8 Quantization.
     Only supports loading quantized BF16 model checkpoints with dynamic
     activation scaling. To load FP16 model checkpoints, user must specify
-    to convert the FP16 model weight loading into BF16. 
+    to convert the FP16 model weight loading into BF16.
     The weight scaling factor will be initialized after
     the model weights are loaded.
 
@@ -92,38 +93,45 @@ class PTPCFp8LinearMethod(Fp8LinearMethod):
     """
 
     def __init__(self, quant_config: PTPCFp8Config):
-        assert current_platform.is_rocm(), \
+        assert current_platform.is_rocm(), (
             "PTPCFp8LinearMethod is only supported on ROCm."
+        )
         super().__init__(quant_config=quant_config)
         # Force weight quantization
         self.quant_config.is_checkpoint_fp8_serialized = False
         self.fp8_linear = Fp8LinearOp(
-            act_quant_static=False, act_quant_group_shape=GroupShape.PER_TOKEN)
+            act_quant_static=False, act_quant_group_shape=GroupShape.PER_TOKEN
+        )
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
-        layer.weight = torch.nn.Parameter(layer.weight.data,
-                                          requires_grad=False)
+        layer.weight = torch.nn.Parameter(layer.weight.data, requires_grad=False)
 
-        assert layer.weight.data.dtype == torch.bfloat16, \
-            f"Currently torch._scaled_mm (hipBLASLt) rowwise gemm only support output dtype of bfloat16. {str(layer.weight.data.dtype)} is specified." # noqa: E501
+        assert layer.weight.data.dtype == torch.bfloat16, (
+            f"Currently torch._scaled_mm (hipBLASLt) rowwise gemm only support output dtype of bfloat16. {str(layer.weight.data.dtype)} is specified."
+        )  # noqa: E501
         # Quantize the weights.
         qweight, weight_scale = ops.scaled_fp8_quant(
-            layer.weight, scale=None, use_per_token_if_dynamic=True)
+            layer.weight, scale=None, use_per_token_if_dynamic=True
+        )
 
         # Update the layer with the new values.
         layer.weight = Parameter(
-            qweight.t(), requires_grad=False)  # Pretranspose the weight
+            qweight.t(), requires_grad=False
+        )  # Pretranspose the weight
         layer.weight_scale = Parameter(weight_scale, requires_grad=False)
         layer.input_scale = None
 
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
-
-        return self.fp8_linear.apply(input=x,
-                                     weight=layer.weight,
-                                     weight_scale=layer.weight_scale,
-                                     input_scale=None,
-                                     input_scale_ub=None,
-                                     bias=bias)
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
+        return self.fp8_linear.apply(
+            input=x,
+            weight=layer.weight,
+            weight_scale=layer.weight_scale,
+            input_scale=None,
+            input_scale_ub=None,
+            bias=bias,
+        )
diff --git a/vllm/model_executor/layers/quantization/quark/quark.py b/vllm/model_executor/layers/quantization/quark/quark.py
index c65212c01819..37911a549645 100644
--- a/vllm/model_executor/layers/quantization/quark/quark.py
+++ b/vllm/model_executor/layers/quantization/quark/quark.py
@@ -8,18 +8,30 @@
 
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe import FusedMoE
-from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
-                                               UnquantizedLinearMethod)
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    LinearMethodBase,
+    UnquantizedLinearMethod,
+)
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (  # noqa: E501
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.layers.quantization.kv_cache import BaseKVCacheMethod
 from vllm.model_executor.layers.quantization.quark.quark_moe import (  # noqa: E501
-    QuarkMoEMethod)
+    QuarkMoEMethod,
+)
 from vllm.model_executor.layers.quantization.quark.schemes import (
-    QuarkScheme, QuarkW4A4MXFP4, QuarkW8A8Fp8, QuarkW8A8Int8)
+    QuarkScheme,
+    QuarkW4A4MXFP4,
+    QuarkW8A8Fp8,
+    QuarkW8A8Int8,
+)
 from vllm.model_executor.layers.quantization.quark.utils import (
-    deep_compare, should_ignore_layer)
+    deep_compare,
+    should_ignore_layer,
+)
 from vllm.platforms import current_platform
 
 __all__ = ["QuarkLinearMethod"]
@@ -28,12 +40,13 @@
 
 
 class QuarkConfig(QuantizationConfig):
-
-    def __init__(self,
-                 quant_config: dict[str, Any],
-                 kv_cache_group: Optional[list[str]] = None,
-                 kv_cache_config: Optional[dict[str, Any]] = None,
-                 pack_method: str = "reorder"):
+    def __init__(
+        self,
+        quant_config: dict[str, Any],
+        kv_cache_group: Optional[list[str]] = None,
+        kv_cache_config: Optional[dict[str, Any]] = None,
+        pack_method: str = "reorder",
+    ):
         super().__init__()
         if kv_cache_group is None:
             kv_cache_group = []
@@ -55,15 +68,16 @@ def get_min_capability(cls) -> int:
     def get_name(self) -> QuantizationMethods:
         return "quark"
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         from vllm.attention.layer import Attention  # Avoid circular import
 
         # Check if the layer is skipped for quantization.
         exclude_layers = cast(list[str], self.quant_config.get("exclude"))
-        if should_ignore_layer(prefix,
-                               ignore=exclude_layers,
-                               fused_mapping=self.packed_modules_mapping):
+        if should_ignore_layer(
+            prefix, ignore=exclude_layers, fused_mapping=self.packed_modules_mapping
+        ):
             return UnquantizedLinearMethod()
         if isinstance(layer, LinearBase):
             scheme = self.get_scheme(layer=layer, layer_name=prefix)
@@ -73,17 +87,17 @@ def get_quant_method(self, layer: torch.nn.Module,
             return QuarkKVCacheMethod(self)
 
         if isinstance(layer, FusedMoE):
-            return QuarkMoEMethod.get_moe_method(self,
-                                                 module=layer,
-                                                 layer_name=prefix)
+            return QuarkMoEMethod.get_moe_method(self, module=layer, layer_name=prefix)
         return None
 
     @classmethod
     def from_config(cls, config: dict[str, Any]) -> "QuarkConfig":
         export_config = config.get("export")
         if export_config is None:
-            raise ValueError("The export key should be included in "
-                             "the configurations of Quark quantized model")
+            raise ValueError(
+                "The export key should be included in "
+                "the configurations of Quark quantized model"
+            )
         kv_cache_group = cast(list[str], export_config.get("kv_cache_group"))
         pack_method = cast(str, export_config.get("pack_method"))
 
@@ -96,33 +110,32 @@ def from_config(cls, config: dict[str, Any]) -> "QuarkConfig":
             kv_cache_config = None
         else:
             kv_cache_set = set(kv_cache_group)
-            layer_quant_config = cast(dict[str, Any],
-                                      config.get("layer_quant_config"))
+            layer_quant_config = cast(dict[str, Any], config.get("layer_quant_config"))
             layer_quant_names = list(layer_quant_config.keys())
             layer_quant_set = set(layer_quant_names)
 
             if not kv_cache_set.issubset(layer_quant_set):
-                raise ValueError("The Quark quantized model has the "
-                                 "kv_cache_group parameter setting, "
-                                 "but no kv_cache quantization settings "
-                                 "were found in the quantization "
-                                 "configuration.")
+                raise ValueError(
+                    "The Quark quantized model has the "
+                    "kv_cache_group parameter setting, "
+                    "but no kv_cache quantization settings "
+                    "were found in the quantization "
+                    "configuration."
+                )
 
             q_configs = [
                 cast(dict[str, Any], layer_quant_config.get(name))
                 for name in kv_cache_group
             ]
-            if not all(
-                    deep_compare(q_config, q_configs[0])
-                    for q_config in q_configs):
+            if not all(deep_compare(q_config, q_configs[0]) for q_config in q_configs):
                 raise ValueError(
                     "The quantization method used for kv_cache should "
                     "be the same, but the quantization method for the "
-                    "kv_cache layer in the config is different.")
+                    "kv_cache layer in the config is different."
+                )
             kv_cache_config = q_configs[0].get("output_tensors")
             if kv_cache_config is None:
-                raise ValueError(
-                    "The kv_cache quantization configuration is empty.")
+                raise ValueError("The kv_cache quantization configuration is empty.")
 
             # Since we have already set kv_cache quantization configurations,
             # we will remove the quantization configuration for the
@@ -132,23 +145,22 @@ def from_config(cls, config: dict[str, Any]) -> "QuarkConfig":
 
             # In case q_proj output is also quantized, remove the configuration
             # to keep qkv consistency.
-            q_proj_q_config = cast(dict[str, Any],
-                                   layer_quant_config.get("*q_proj"))
+            q_proj_q_config = cast(dict[str, Any], layer_quant_config.get("*q_proj"))
             if q_proj_q_config is not None:
                 q_proj_q_config["output_tensors"] = None
 
-        return cls(quant_config=config,
-                   kv_cache_group=kv_cache_group,
-                   kv_cache_config=kv_cache_config,
-                   pack_method=pack_method)
+        return cls(
+            quant_config=config,
+            kv_cache_group=kv_cache_group,
+            kv_cache_config=kv_cache_config,
+            pack_method=pack_method,
+        )
 
     @classmethod
     def get_config_filenames(cls) -> list[str]:
         return []
 
-    def _check_scheme_supported(self,
-                                min_capability: int,
-                                error: bool = True) -> bool:
+    def _check_scheme_supported(self, min_capability: int, error: bool = True) -> bool:
         capability_tuple = current_platform.get_device_capability()
 
         if capability_tuple is not None:
@@ -158,26 +170,33 @@ def _check_scheme_supported(self,
                 raise RuntimeError(
                     "Quantization scheme is not supported for ",
                     f"the current GPU. Min capability: {min_capability}. ",
-                    f"Current capability: {capability}.")
+                    f"Current capability: {capability}.",
+                )
             return supported
         else:
             return False
 
-    def _is_fp8_w8a8(self, weight_quant: Optional[dict[str, Any]],
-                     input_quant: Optional[dict[str, Any]]) -> bool:
+    def _is_fp8_w8a8(
+        self,
+        weight_quant: Optional[dict[str, Any]],
+        input_quant: Optional[dict[str, Any]],
+    ) -> bool:
         # Confirm weights and input quantized.
         if weight_quant is None or input_quant is None:
             return False
 
         # Confirm weight scheme is supported
-        is_fp8_dtype = (weight_quant.get("dtype") == "fp8_e4m3"
-                        and input_quant.get("dtype") == "fp8_e4m3")
+        is_fp8_dtype = (
+            weight_quant.get("dtype") == "fp8_e4m3"
+            and input_quant.get("dtype") == "fp8_e4m3"
+        )
         is_static_weight = not weight_quant.get("is_dynamic")
-        is_per_tensor_or_channel_weight = (weight_quant.get("qscheme")
-                                           in ["per_tensor", "per_channel"])
+        is_per_tensor_or_channel_weight = weight_quant.get("qscheme") in [
+            "per_tensor",
+            "per_channel",
+        ]
 
-        if not (is_fp8_dtype and is_static_weight
-                and is_per_tensor_or_channel_weight):
+        if not (is_fp8_dtype and is_static_weight and is_per_tensor_or_channel_weight):
             return False
 
         # Dynamic quantization is always supported if weights supported.
@@ -185,76 +204,86 @@ def _is_fp8_w8a8(self, weight_quant: Optional[dict[str, Any]],
             return True
 
         # Confirm activation scheme is supported.
-        is_per_tensor_activation = (input_quant.get("qscheme") == "per_tensor")
+        is_per_tensor_activation = input_quant.get("qscheme") == "per_tensor"
         return is_per_tensor_activation
 
-    def _is_static_tensor_w8a8(self, weight_quant: Optional[dict[str, Any]],
-                               input_quant: Optional[dict[str, Any]]) -> bool:
+    def _is_static_tensor_w8a8(
+        self,
+        weight_quant: Optional[dict[str, Any]],
+        input_quant: Optional[dict[str, Any]],
+    ) -> bool:
         # Confirm weights and input quantized.
         if weight_quant is None or input_quant is None:
             return False
 
-        is_int8_dtype = (weight_quant.get("dtype") == "int8"
-                         and input_quant.get("dtype") == "int8")
+        is_int8_dtype = (
+            weight_quant.get("dtype") == "int8" and input_quant.get("dtype") == "int8"
+        )
 
-        is_tensor = (weight_quant.get("qscheme")
-                     in ["per_tensor", "per_channel"]
-                     and input_quant.get("qscheme") == "per_tensor")
+        is_tensor = (
+            weight_quant.get("qscheme") in ["per_tensor", "per_channel"]
+            and input_quant.get("qscheme") == "per_tensor"
+        )
 
-        is_static = (not weight_quant.get("is_dynamic")
-                     and not input_quant.get("is_dynamic"))
+        is_static = not weight_quant.get("is_dynamic") and not input_quant.get(
+            "is_dynamic"
+        )
 
-        is_weight_symmetric = (weight_quant.get("symmetric") is True)
+        is_weight_symmetric = weight_quant.get("symmetric") is True
 
         # Both symmetric and asymmetric input quantization supported.
         # Only symmetric weight quantization supported.
         return is_int8_dtype and is_tensor and is_weight_symmetric and is_static
 
-    def _is_mx_fp4(self, weight_quant: Optional[dict[str, Any]],
-                   input_quant: Optional[dict[str, Any]]) -> bool:
+    def _is_mx_fp4(
+        self,
+        weight_quant: Optional[dict[str, Any]],
+        input_quant: Optional[dict[str, Any]],
+    ) -> bool:
         # Confirm weights and input quantized.
         if weight_quant is None or input_quant is None:
-            logger.debug("Quark model is not in MX-FP4 format: "
-                         "weight_quant or input_quant not set")
+            logger.debug(
+                "Quark model is not in MX-FP4 format: "
+                "weight_quant or input_quant not set"
+            )
             return False
 
         # Input and weight dtype needs to be fp4.
-        if weight_quant.get("dtype") != "fp4" or input_quant.get(
-                "dtype") != "fp4":
+        if weight_quant.get("dtype") != "fp4" or input_quant.get("dtype") != "fp4":
             logger.debug("Quark model is not in MX-FP4 format: dtype not fp4")
             return False
 
         # Input and weight qscheme needs to be per group.
-        if weight_quant.get("qscheme") != "per_group" or input_quant.get(
-                "qscheme") != "per_group":
+        if (
+            weight_quant.get("qscheme") != "per_group"
+            or input_quant.get("qscheme") != "per_group"
+        ):
             logger.debug("Quark model is not in MX-FP4 format: not per_group")
             return False
 
         # Input and weight group size needs to be 32.
-        if weight_quant.get("group_size") != 32 or input_quant.get(
-                "group_size") != 32:
-            logger.debug(
-                "Quark model is not in MX-FP4 format: not group_size=32")
+        if weight_quant.get("group_size") != 32 or input_quant.get("group_size") != 32:
+            logger.debug("Quark model is not in MX-FP4 format: not group_size=32")
             return False
 
         # Activations need to use dynamic quantization.
         if input_quant.get("is_dynamic") is False:
-            logger.debug(
-                "Quark model is not in MX-FP4 format: not activation dynamic")
+            logger.debug("Quark model is not in MX-FP4 format: not activation dynamic")
             return False
 
         # Activations and weight scales need to be in e8m0 format.
-        if weight_quant.get("scale_format") != "e8m0" or input_quant.get(
-                "scale_format") != "e8m0":
-            logger.debug(
-                "Quark model is not in MX-FP4 format: not scale_format e8m0")
+        if (
+            weight_quant.get("scale_format") != "e8m0"
+            or input_quant.get("scale_format") != "e8m0"
+        ):
+            logger.debug("Quark model is not in MX-FP4 format: not scale_format e8m0")
             return False
 
         return True
 
-    def _find_matched_config(self, layer_name: str,
-                             module: torch.nn.Module) -> dict[str, Any]:
-
+    def _find_matched_config(
+        self, layer_name: str, module: torch.nn.Module
+    ) -> dict[str, Any]:
         proj_name = layer_name.split(".")[-1]
         if proj_name in self.packed_modules_mapping:
             shard_proj_names = self.packed_modules_mapping[proj_name]
@@ -269,59 +298,66 @@ def _find_matched_config(self, layer_name: str,
                 for shard_name in shard_names
             ]
             if not all(
-                    deep_compare(q_config, shard_configs[0])
-                    for q_config in shard_configs):
+                deep_compare(q_config, shard_configs[0]) for q_config in shard_configs
+            ):
                 raise ValueError(
                     f"Found a different quantization configuration for "
                     f"{shard_proj_names} in {layer_name}. vLLM "
-                    "requires all to use the same scheme.")
+                    "requires all to use the same scheme."
+                )
             return shard_configs[0]
         else:
             layer_quant_config = cast(
-                dict[str, Any], self.quant_config.get("layer_quant_config"))
+                dict[str, Any], self.quant_config.get("layer_quant_config")
+            )
             for name_pattern in layer_quant_config:
                 if fnmatch.fnmatch(layer_name, name_pattern):
                     return layer_quant_config[name_pattern]
 
             layer_type = cast(str, type(module))
             layer_type_quant_config = cast(
-                dict[str, Any],
-                self.quant_config.get("layer_type_quant_config"))
+                dict[str, Any], self.quant_config.get("layer_type_quant_config")
+            )
             if layer_type in layer_type_quant_config:
                 return layer_type_quant_config[layer_type]
 
             global_quant_config = cast(
-                dict[str, Any], self.quant_config.get("global_quant_config"))
+                dict[str, Any], self.quant_config.get("global_quant_config")
+            )
             return global_quant_config
 
     def _get_scheme_from_config(self, config: dict[str, Any]) -> "QuarkScheme":
         if config.get("output_tensors") or config.get("bias"):
             raise NotImplementedError(
                 "Currently, Quark models with output_tensors "
-                "and bias quantized are not supported")
+                "and bias quantized are not supported"
+            )
         weight_config = cast(dict[str, Any], config.get("weight"))
         input_config = cast(dict[str, Any], config.get("input_tensors"))
 
         if self._is_fp8_w8a8(weight_config, input_config):
             is_fp8_w8a8_supported = self._check_scheme_supported(
-                QuarkW8A8Fp8.get_min_capability(), error=False)
+                QuarkW8A8Fp8.get_min_capability(), error=False
+            )
             if is_fp8_w8a8_supported:
                 return QuarkW8A8Fp8(weight_config, input_config)
         elif self._is_static_tensor_w8a8(weight_config, input_config):
             weight_qscheme = cast(str, weight_config.get("qscheme"))
-            return QuarkW8A8Int8(qscheme=weight_qscheme,
-                                 is_static_input_scheme=True,
-                                 input_symmetric=input_config.get("symmetric"))
+            return QuarkW8A8Int8(
+                qscheme=weight_qscheme,
+                is_static_input_scheme=True,
+                input_symmetric=input_config.get("symmetric"),
+            )
         elif self._is_mx_fp4(weight_config, input_config):
             return QuarkW4A4MXFP4(weight_config, input_config)
 
-        raise NotImplementedError("No quark compatible scheme was found. "
-                                  f"Weight config: {weight_config}, "
-                                  f"Input config: {input_config}")
-
-    def get_scheme(self, layer: torch.nn.Module,
-                   layer_name: str) -> "QuarkScheme":
+        raise NotImplementedError(
+            "No quark compatible scheme was found. "
+            f"Weight config: {weight_config}, "
+            f"Input config: {input_config}"
+        )
 
+    def get_scheme(self, layer: torch.nn.Module, layer_name: str) -> "QuarkScheme":
         layer_quant_config = self._find_matched_config(layer_name, layer)
 
         # Find the quant_scheme
@@ -335,7 +371,7 @@ def get_scheme(self, layer: torch.nn.Module,
     def get_cache_scale(self, name: str) -> Optional[str]:
         """
         Check whether the param name matches the format for k/v cache scales
-        in quark. If this is the case, return its equivalent param name 
+        in quark. If this is the case, return its equivalent param name
         expected by vLLM
 
         :param name: param name
@@ -355,18 +391,22 @@ def get_cache_scale(self, name: str) -> Optional[str]:
 
 
 class QuarkLinearMethod(LinearMethodBase):
-
     def __init__(self, quantization_config: QuarkConfig):
         self.quantization_config = quantization_config
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         layer.scheme.process_weights_after_loading(layer)
 
-    def create_weights(self, layer: torch.nn.Module,
-                       input_size_per_partition: int,
-                       output_partition_sizes: list[int], input_size: int,
-                       output_size: int, params_dtype: torch.dtype,
-                       **extra_weight_attrs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        input_size_per_partition: int,
+        output_partition_sizes: list[int],
+        input_size: int,
+        output_size: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         """
         Use the CompressedTensorsScheme associated with each layer to create
         the necessary parameters for the layer. See LinearMethodBase for param
@@ -380,12 +420,15 @@ def create_weights(self, layer: torch.nn.Module,
             output_partition_sizes=output_partition_sizes,
             output_size=output_size,
             params_dtype=params_dtype,
-            weight_loader=weight_loader)
-
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None):
+            weight_loader=weight_loader,
+        )
+
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ):
         """
         Use the output of create_weights and the CompressedTensorsScheme
         associated with the layer to apply the forward pass with the
@@ -422,11 +465,13 @@ def validate_kv_cache_config(kv_cache_config: Optional[dict[str, Any]]):
         if dtype != "fp8_e4m3":
             raise NotImplementedError(
                 "Currently supported kv cache quantization is "
-                f"dtype=fp8_e4m3, however received {dtype}")
+                f"dtype=fp8_e4m3, however received {dtype}"
+            )
 
         qscheme = kv_cache_config.get("qscheme")
         if qscheme != "per_tensor":
             raise NotImplementedError(
                 "Only support per-tensor scaling factor "
                 "for quark KV cache. "
-                f"Expected qscheme: per_tensor, found qscheme: {qscheme}")
+                f"Expected qscheme: per_tensor, found qscheme: {qscheme}"
+            )
diff --git a/vllm/model_executor/layers/quantization/quark/quark_moe.py b/vllm/model_executor/layers/quantization/quark/quark_moe.py
index 24497cc756c1..810057757a83 100644
--- a/vllm/model_executor/layers/quantization/quark/quark_moe.py
+++ b/vllm/model_executor/layers/quantization/quark/quark_moe.py
@@ -8,66 +8,71 @@
 import vllm.envs as envs
 from vllm import _custom_ops as ops
 from vllm.logger import init_logger
-from vllm.model_executor.layers.fused_moe import (FusedMoE, FusedMoEConfig,
-                                                  FusedMoEMethodBase,
-                                                  FusedMoeWeightScaleSupported)
+from vllm.model_executor.layers.fused_moe import (
+    FusedMoE,
+    FusedMoEConfig,
+    FusedMoEMethodBase,
+    FusedMoeWeightScaleSupported,
+)
 from vllm.model_executor.layers.fused_moe.config import (
-    FusedMoEQuantConfig, fp8_w8a8_moe_quant_config,
-    mxfp4_w4a4_moe_quant_config)
+    FusedMoEQuantConfig,
+    fp8_w8a8_moe_quant_config,
+    mxfp4_w4a4_moe_quant_config,
+)
 from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (
-    is_rocm_aiter_moe_enabled)
+    is_rocm_aiter_moe_enabled,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp8 import (
-    prepare_moe_fp8_layer_for_marlin)
-from vllm.model_executor.layers.quantization.utils.mxfp4_utils import (
-    OCP_MX_BLOCK_SIZE)
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape)
+    prepare_moe_fp8_layer_for_marlin,
+)
+from vllm.model_executor.layers.quantization.utils.mxfp4_utils import OCP_MX_BLOCK_SIZE
+from vllm.model_executor.layers.quantization.utils.quant_utils import GroupShape
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    all_close_1d, normalize_e4m3fn_to_e4m3fnuz, per_tensor_dequantize)
+    all_close_1d,
+    normalize_e4m3fn_to_e4m3fnuz,
+    per_tensor_dequantize,
+)
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.platforms import current_platform
 from vllm.scalar_type import scalar_types
 
 logger = init_logger(__name__)
 
-__all__ = [
-    "QuarkMoEMethod", "QuarkW8A8Fp8MoEMethod", "QuarkW4A4MXFp4MoEMethod"
-]
+__all__ = ["QuarkMoEMethod", "QuarkW8A8Fp8MoEMethod", "QuarkW4A4MXFp4MoEMethod"]
 
 
 class QuarkMoEMethod(FusedMoEMethodBase):
-
     def __init__(self, moe: FusedMoEConfig):
         super().__init__(moe)
 
     @staticmethod
     def get_moe_method(
-            quant_config: "QuarkConfig",  # type: ignore # noqa E501 # noqa F821
-            module: torch.nn.Module,
-            layer_name: str) -> "QuarkMoEMethod":
-        layer_quant_config = quant_config._find_matched_config(
-            layer_name, module)
-
-        if (layer_quant_config.get("output_tensors")
-                or layer_quant_config.get("bias")):
-            raise NotImplementedError("Currently, Quark models with "
-                                      "output_tensors and bias "
-                                      "quantized are not supported")
+        quant_config: "QuarkConfig",  # type: ignore # noqa E501 # noqa F821
+        module: torch.nn.Module,
+        layer_name: str,
+    ) -> "QuarkMoEMethod":
+        layer_quant_config = quant_config._find_matched_config(layer_name, module)
+
+        if layer_quant_config.get("output_tensors") or layer_quant_config.get("bias"):
+            raise NotImplementedError(
+                "Currently, Quark models with "
+                "output_tensors and bias "
+                "quantized are not supported"
+            )
         weight_config = layer_quant_config.get("weight")
         input_config = layer_quant_config.get("input_tensors")
 
         if quant_config._is_fp8_w8a8(weight_config, input_config):
-            return QuarkW8A8Fp8MoEMethod(weight_config, input_config,
-                                         module.moe_config)
+            return QuarkW8A8Fp8MoEMethod(weight_config, input_config, module.moe_config)
         elif quant_config._is_mx_fp4(weight_config, input_config):
-            return QuarkW4A4MXFp4MoEMethod(weight_config, input_config,
-                                           module.moe_config)
+            return QuarkW4A4MXFp4MoEMethod(
+                weight_config, input_config, module.moe_config
+            )
         else:
             raise RuntimeError("Unsupported FusedMoe scheme")
 
 
 class QuarkW8A8Fp8MoEMethod(QuarkMoEMethod):
-
     def __init__(
         self,
         weight_config: dict[str, Any],
@@ -80,38 +85,50 @@ def __init__(
 
         self.weight_qscheme = self.weight_quant.get("qscheme")
         self.input_qscheme = self.input_quant.get("qscheme")
-        per_tensor = (self.weight_qscheme == "per_tensor"
-                      and self.input_qscheme == "per_tensor")
-        per_channel = (self.weight_qscheme == "per_channel"
-                       and self.input_qscheme == "per_channel")
-        self.act_quant_group_shape = GroupShape.PER_TOKEN \
-            if per_channel else GroupShape.PER_TENSOR
+        per_tensor = (
+            self.weight_qscheme == "per_tensor" and self.input_qscheme == "per_tensor"
+        )
+        per_channel = (
+            self.weight_qscheme == "per_channel" and self.input_qscheme == "per_channel"
+        )
+        self.act_quant_group_shape = (
+            GroupShape.PER_TOKEN if per_channel else GroupShape.PER_TENSOR
+        )
         if not (per_tensor or per_channel):
             raise ValueError(
                 "For FP8 Fused MoE layers, only per-tensor and per-channel "
                 "scales for weights and activations are supported. Found "
-                f"{self.weight_qscheme}, {self.input_qscheme}")  # noqa E501
+                f"{self.weight_qscheme}, {self.input_qscheme}"
+            )  # noqa E501
 
         self.static_input_scales = not self.input_quant.get("is_dynamic")
         if self.static_input_scales and per_channel:
             raise ValueError(
                 "For FP8 Fused MoE layer, we require either per tensor or "
-                "channelwise, dynamic per token quantization.")
+                "channelwise, dynamic per token quantization."
+            )
 
         # For GPUs that lack FP8 hardware support, we can leverage the Marlin
         # kernel for fast weight-only FP8 quantization
-        self.use_marlin = (not current_platform.has_device_capability(89)
-                           or envs.VLLM_TEST_FORCE_FP8_MARLIN)
+        self.use_marlin = (
+            not current_platform.has_device_capability(89)
+            or envs.VLLM_TEST_FORCE_FP8_MARLIN
+        )
         # Disable marlin for rocm
         if current_platform.is_rocm():
             self.use_marlin = False
 
         self.rocm_aiter_moe_enabled = is_rocm_aiter_moe_enabled()
 
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
-
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         layer.intermediate_size_per_partition = intermediate_size_per_partition
         layer.hidden_size = hidden_size
         layer.num_experts = num_experts
@@ -120,21 +137,27 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
         params_dtype = torch.float8_e4m3fn
 
         # WEIGHTS
-        w13_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            2 * intermediate_size_per_partition,
-            hidden_size,
-            dtype=params_dtype),
-                                        requires_grad=False)
+        w13_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                2 * intermediate_size_per_partition,
+                hidden_size,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_weight", w13_weight)
         set_weight_attrs(w13_weight, extra_weight_attrs)
 
-        w2_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            hidden_size,
-            intermediate_size_per_partition,
-            dtype=params_dtype),
-                                       requires_grad=False)
+        w2_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                hidden_size,
+                intermediate_size_per_partition,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_weight", w2_weight)
         set_weight_attrs(w2_weight, extra_weight_attrs)
 
@@ -142,48 +165,54 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
         if self.weight_qscheme == "per_tensor":
             # Allocate 2 scales for w1 and w3 respectively.
             # They are combined to a single scale after weight loading.
-            w13_weight_scale = torch.nn.Parameter(torch.ones(
-                num_experts, 2, dtype=torch.float32),
-                                                  requires_grad=False)
+            w13_weight_scale = torch.nn.Parameter(
+                torch.ones(num_experts, 2, dtype=torch.float32), requires_grad=False
+            )
             layer.register_parameter("w13_weight_scale", w13_weight_scale)
-            w2_weight_scale = torch.nn.Parameter(torch.ones(
-                num_experts, dtype=torch.float32),
-                                                 requires_grad=False)
+            w2_weight_scale = torch.nn.Parameter(
+                torch.ones(num_experts, dtype=torch.float32), requires_grad=False
+            )
             layer.register_parameter("w2_weight_scale", w2_weight_scale)
             # Add PER-TENSOR quantization for FusedMoE.weight_loader.
             extra_weight_attrs.update(
-                {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value})
+                {"quant_method": FusedMoeWeightScaleSupported.TENSOR.value}
+            )
             set_weight_attrs(w13_weight_scale, extra_weight_attrs)
             set_weight_attrs(w2_weight_scale, extra_weight_attrs)
         elif self.weight_qscheme == "per_channel":
             # quark's scale is 1 dim.
-            w13_weight_scale = torch.nn.Parameter(torch.ones(
-                num_experts,
-                2 * intermediate_size_per_partition,
-                dtype=torch.float32),
-                                                  requires_grad=False)
+            w13_weight_scale = torch.nn.Parameter(
+                torch.ones(
+                    num_experts,
+                    2 * intermediate_size_per_partition,
+                    dtype=torch.float32,
+                ),
+                requires_grad=False,
+            )
             layer.register_parameter("w13_weight_scale", w13_weight_scale)
-            w2_weight_scale = torch.nn.Parameter(torch.ones(
-                num_experts, hidden_size, dtype=torch.float32),
-                                                 requires_grad=False)
+            w2_weight_scale = torch.nn.Parameter(
+                torch.ones(num_experts, hidden_size, dtype=torch.float32),
+                requires_grad=False,
+            )
             layer.register_parameter("w2_weight_scale", w2_weight_scale)
             # Add PER-CHANNEL quantization for FusedMoE.weight_loader.
             extra_weight_attrs.update(
-                {"quant_method": FusedMoeWeightScaleSupported.CHANNEL.value})
+                {"quant_method": FusedMoeWeightScaleSupported.CHANNEL.value}
+            )
             set_weight_attrs(w13_weight_scale, extra_weight_attrs)
             set_weight_attrs(w2_weight_scale, extra_weight_attrs)
 
         # INPUT_SCALES
         if self.static_input_scales:
-            w13_input_scale = torch.nn.Parameter(torch.ones(
-                num_experts, dtype=torch.float32),
-                                                 requires_grad=False)
+            w13_input_scale = torch.nn.Parameter(
+                torch.ones(num_experts, dtype=torch.float32), requires_grad=False
+            )
             layer.register_parameter("w13_input_scale", w13_input_scale)
             set_weight_attrs(w13_input_scale, extra_weight_attrs)
 
-            w2_input_scale = torch.nn.Parameter(torch.ones(
-                num_experts, dtype=torch.float32),
-                                                requires_grad=False)
+            w2_input_scale = torch.nn.Parameter(
+                torch.ones(num_experts, dtype=torch.float32), requires_grad=False
+            )
             layer.register_parameter("w2_input_scale", w2_input_scale)
             set_weight_attrs(w2_input_scale, extra_weight_attrs)
         else:
@@ -194,46 +223,53 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         # Fp8 moe kernels require a single activation scale.
         # We take the max of all the scales in case they differ.
         if self.static_input_scales:
-            if (layer.w13_input_scale is None or layer.w2_input_scale is None):
+            if layer.w13_input_scale is None or layer.w2_input_scale is None:
                 raise ValueError(
                     "QuantConfig has static quantization, but found "
-                    "activation scales are None.")
-            if (not all_close_1d(layer.w13_input_scale)
-                    or not all_close_1d(layer.w2_input_scale)):
+                    "activation scales are None."
+                )
+            if not all_close_1d(layer.w13_input_scale) or not all_close_1d(
+                layer.w2_input_scale
+            ):
                 logger.warning_once(
                     "Found input_scales that are not equal for "
                     "fp8 MoE layer. Using the maximum across experts "
-                    "for each layer. ")
+                    "for each layer. "
+                )
             layer.w13_input_scale = torch.nn.Parameter(
-                layer.w13_input_scale.max(), requires_grad=False)
+                layer.w13_input_scale.max(), requires_grad=False
+            )
             layer.w2_input_scale = torch.nn.Parameter(
-                layer.w2_input_scale.max(), requires_grad=False)
+                layer.w2_input_scale.max(), requires_grad=False
+            )
 
         if current_platform.is_fp8_fnuz():
             # Normalize the weights and scales
-            w13_weight, w13_weight_scale, w13_input_scale = \
-                normalize_e4m3fn_to_e4m3fnuz(
-                    layer.w13_weight, layer.w13_weight_scale,
-                    layer.w13_input_scale)
-            w2_weight, w2_weight_scale, w2_input_scale = \
+            w13_weight, w13_weight_scale, w13_input_scale = (
                 normalize_e4m3fn_to_e4m3fnuz(
-                    layer.w2_weight, layer.w2_weight_scale,
-                    layer.w2_input_scale)
+                    layer.w13_weight, layer.w13_weight_scale, layer.w13_input_scale
+                )
+            )
+            w2_weight, w2_weight_scale, w2_input_scale = normalize_e4m3fn_to_e4m3fnuz(
+                layer.w2_weight, layer.w2_weight_scale, layer.w2_input_scale
+            )
             # Reset the parameter
-            layer.w13_weight = torch.nn.Parameter(w13_weight,
-                                                  requires_grad=False)
-            layer.w13_weight_scale = torch.nn.Parameter(w13_weight_scale,
-                                                        requires_grad=False)
+            layer.w13_weight = torch.nn.Parameter(w13_weight, requires_grad=False)
+            layer.w13_weight_scale = torch.nn.Parameter(
+                w13_weight_scale, requires_grad=False
+            )
             if w13_input_scale is not None:
-                layer.w13_input_scale = torch.nn.Parameter(w13_input_scale,
-                                                           requires_grad=False)
-            layer.w2_weight = torch.nn.Parameter(w2_weight,
-                                                 requires_grad=False)
-            layer.w2_weight_scale = torch.nn.Parameter(w2_weight_scale,
-                                                       requires_grad=False)
+                layer.w13_input_scale = torch.nn.Parameter(
+                    w13_input_scale, requires_grad=False
+                )
+            layer.w2_weight = torch.nn.Parameter(w2_weight, requires_grad=False)
+            layer.w2_weight_scale = torch.nn.Parameter(
+                w2_weight_scale, requires_grad=False
+            )
             if w2_input_scale is not None:
-                layer.w2_input_scale = torch.nn.Parameter(w2_input_scale,
-                                                          requires_grad=False)
+                layer.w2_input_scale = torch.nn.Parameter(
+                    w2_input_scale, requires_grad=False
+                )
 
         # For per-tensor case, Fp8 moe kernel needs single weight scale
         # for w13 per expert. Use max then dequant and requant each expert.
@@ -245,42 +281,45 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
                 start = 0
                 for shard_id in range(2):
                     dq_weight = per_tensor_dequantize(
-                        layer.w13_weight[expert_id][start:start +
-                                                    shard_size, :],
-                        layer.w13_weight_scale[expert_id][shard_id])
-                    layer.w13_weight[expert_id][
-                        start:start + shard_size, :], _ = ops.scaled_fp8_quant(
-                            dq_weight, max_w13_scales[expert_id])
+                        layer.w13_weight[expert_id][start : start + shard_size, :],
+                        layer.w13_weight_scale[expert_id][shard_id],
+                    )
+                    layer.w13_weight[expert_id][start : start + shard_size, :], _ = (
+                        ops.scaled_fp8_quant(dq_weight, max_w13_scales[expert_id])
+                    )
                     start += shard_size
 
-            layer.w13_weight_scale = torch.nn.Parameter(max_w13_scales,
-                                                        requires_grad=False)
+            layer.w13_weight_scale = torch.nn.Parameter(
+                max_w13_scales, requires_grad=False
+            )
         # quark's scale is 1 dim.
         elif self.weight_qscheme == "per_channel":
             if self.act_quant_group_shape == GroupShape.PER_TOKEN:
                 w13_weight_scale = layer.w13_weight_scale.unsqueeze(-1)
                 layer.w13_weight_scale = torch.nn.Parameter(
-                    w13_weight_scale, requires_grad=False)
+                    w13_weight_scale, requires_grad=False
+                )
                 w2_weight_scale = layer.w2_weight_scale.unsqueeze(-1)
-                layer.w2_weight_scale = torch.nn.Parameter(w2_weight_scale,
-                                                           requires_grad=False)
+                layer.w2_weight_scale = torch.nn.Parameter(
+                    w2_weight_scale, requires_grad=False
+                )
         # Property to determine if AITER is used
         if self.rocm_aiter_moe_enabled:
             from vllm.model_executor.layers.fused_moe.rocm_aiter_fused_moe import (  # noqa E501
-                rocm_aiter_fused_experts, shuffle_weights)
+                rocm_aiter_fused_experts,
+                shuffle_weights,
+            )
 
             # reshaping weights is required for aiter moe kernel.
             shuffled_w13, shuffled_w2 = shuffle_weights(
-                layer.w13_weight.data, layer.w2_weight.data)
+                layer.w13_weight.data, layer.w2_weight.data
+            )
 
-            layer.w13_weight = torch.nn.Parameter(shuffled_w13,
-                                                  requires_grad=False)
-            layer.w2_weight = torch.nn.Parameter(shuffled_w2,
-                                                 requires_grad=False)
+            layer.w13_weight = torch.nn.Parameter(shuffled_w13, requires_grad=False)
+            layer.w2_weight = torch.nn.Parameter(shuffled_w2, requires_grad=False)
 
             self.rocm_aiter_fused_experts_func = rocm_aiter_fused_experts
         elif self.use_marlin:
-
             prepare_moe_fp8_layer_for_marlin(layer, False)
             # Activations not quantized for marlin.
             del layer.w13_input_scale
@@ -288,10 +327,12 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             self.fused_experts_func = None
         else:
             from vllm.model_executor.layers.fused_moe import fused_experts
+
             self.fused_experts_func = fused_experts
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         return fp8_w8a8_moe_quant_config(
             w1_scale=layer.w13_weight_scale,
             w2_scale=layer.w2_weight_scale,
@@ -327,7 +368,8 @@ def apply(
 
         if enable_eplb:
             raise NotImplementedError(
-                "EPLB not supported for `QuarkW8A8Fp8MoEMethod` yet.")
+                "EPLB not supported for `QuarkW8A8Fp8MoEMethod` yet."
+            )
 
         topk_weights, topk_ids, _ = FusedMoE.select_experts(
             hidden_states=x,
@@ -341,7 +383,8 @@ def apply(
             scoring_func=scoring_func,
             routed_scaling_factor=routed_scaling_factor,
             e_score_correction_bias=e_score_correction_bias,
-            indices_type=self.topk_indices_dtype)
+            indices_type=self.topk_indices_dtype,
+        )
 
         if self.rocm_aiter_moe_enabled:
             return self.rocm_aiter_fused_experts_func(
@@ -353,10 +396,10 @@ def apply(
                 activation=activation,
                 apply_router_weight_on_input=apply_router_weight_on_input,
                 quant_config=self.moe_quant_config,
-                expert_map=expert_map)
+                expert_map=expert_map,
+            )
         if self.use_marlin:
-            assert activation == "silu", (
-                f"{activation} not supported for Marlin MoE.")
+            assert activation == "silu", f"{activation} not supported for Marlin MoE."
             return torch.ops.vllm.fused_marlin_moe(
                 x,
                 layer.w13_weight,
@@ -371,7 +414,8 @@ def apply(
                 quant_type_id=scalar_types.float8_e4m3fn.id,
                 apply_router_weight_on_input=apply_router_weight_on_input,
                 global_num_experts=global_num_experts,
-                expert_map=expert_map)
+                expert_map=expert_map,
+            )
 
         assert self.fused_experts_func is not None
 
@@ -386,11 +430,11 @@ def apply(
             apply_router_weight_on_input=apply_router_weight_on_input,
             global_num_experts=global_num_experts,
             expert_map=expert_map,
-            quant_config=self.moe_quant_config)
+            quant_config=self.moe_quant_config,
+        )
 
 
 class QuarkW4A4MXFp4MoEMethod(QuarkMoEMethod):
-
     def __init__(
         self,
         weight_config: dict[str, Any],
@@ -403,19 +447,20 @@ def __init__(
 
         weight_qscheme = self.weight_quant.get("qscheme")
         input_qscheme = self.input_quant.get("qscheme")
-        if not (weight_qscheme == "per_group"
-                and input_qscheme == "per_group"):
+        if not (weight_qscheme == "per_group" and input_qscheme == "per_group"):
             raise ValueError(
                 "For MX(FP4) Fused MoE layers, only per-group scales "
                 "for weights and activations are supported. Found "
-                f"{weight_qscheme}, {input_qscheme}")  # noqa E501
+                f"{weight_qscheme}, {input_qscheme}"
+            )  # noqa E501
 
         self.static_input_scales = not self.input_quant.get("is_dynamic")
 
         if self.static_input_scales:
             raise NotImplementedError(
                 "QuarkW4A4MXFp4MoEMethod with static input scales is currently "
-                "not implemented. Please open an issue.")
+                "not implemented. Please open an issue."
+            )
 
         if not current_platform.supports_mx():
             self.emulate = True
@@ -423,7 +468,8 @@ def __init__(
                 "The current platform does not support native MXFP4 "
                 "computation. Simulated weight dequantization and activation "
                 "QDQ (quantize and dequantize) will be used, with the linear "
-                "layers computed in high precision.")
+                "layers computed in high precision."
+            )
         else:
             self.emulate = True
             logger.warning_once(
@@ -431,36 +477,49 @@ def __init__(
                 "computation, but kernels are not yet integrated in vLLM. "
                 "Simulated weight dequantization and activation "
                 "QDQ (quantize and dequantize) will be used, with the linear "
-                "layers computed in high precision.")
-
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
+                "layers computed in high precision."
+            )
 
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         # Add the quantization method used (per tensor/grouped/channel)
         # to ensure the weight scales are loaded in properly
         extra_weight_attrs.update(
-            {"quant_method": FusedMoeWeightScaleSupported.BLOCK.value})
+            {"quant_method": FusedMoeWeightScaleSupported.BLOCK.value}
+        )
 
         params_dtype = torch.uint8
 
         # WEIGHTS
-        w13_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            2 * intermediate_size_per_partition,
-            hidden_size // 2,
-            dtype=params_dtype),
-                                        requires_grad=False)
+        w13_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                2 * intermediate_size_per_partition,
+                hidden_size // 2,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w13_weight", w13_weight)
 
         set_weight_attrs(w13_weight, extra_weight_attrs)
 
-        w2_weight = torch.nn.Parameter(torch.empty(
-            num_experts,
-            hidden_size,
-            intermediate_size_per_partition // 2,
-            dtype=params_dtype),
-                                       requires_grad=False)
+        w2_weight = torch.nn.Parameter(
+            torch.empty(
+                num_experts,
+                hidden_size,
+                intermediate_size_per_partition // 2,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_weight", w2_weight)
 
         set_weight_attrs(w2_weight, extra_weight_attrs)
@@ -491,7 +550,8 @@ def create_weights(self, layer: torch.nn.Module, num_experts: int,
         layer.register_parameter("w2_weight_scale", w2_weight_scale)
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         return mxfp4_w4a4_moe_quant_config(
             w1_scale=layer.w13_weight_scale,
             w2_scale=layer.w2_weight_scale,
@@ -527,7 +587,8 @@ def apply(
 
         if enable_eplb:
             raise NotImplementedError(
-                "EPLB not supported for `QuarkW4A4MXFp4MoEMethod` yet.")
+                "EPLB not supported for `QuarkW4A4MXFp4MoEMethod` yet."
+            )
 
         from vllm.model_executor.layers.fused_moe import fused_experts
 
@@ -543,7 +604,8 @@ def apply(
             scoring_func=scoring_func,
             routed_scaling_factor=routed_scaling_factor,
             e_score_correction_bias=e_score_correction_bias,
-            indices_type=self.topk_indices_dtype)
+            indices_type=self.topk_indices_dtype,
+        )
 
         out = fused_experts(
             x,
diff --git a/vllm/model_executor/layers/quantization/quark/schemes/quark_scheme.py b/vllm/model_executor/layers/quantization/quark/schemes/quark_scheme.py
index c167e949ac26..ddec0f6ea8eb 100644
--- a/vllm/model_executor/layers/quantization/quark/schemes/quark_scheme.py
+++ b/vllm/model_executor/layers/quantization/quark/schemes/quark_scheme.py
@@ -11,7 +11,7 @@
 
 class QuarkScheme(ABC):
     """
-    Abstract class used to describe the weight creation and forward pass 
+    Abstract class used to describe the weight creation and forward pass
     of different quantization schemes supported by Quark.
     """
 
@@ -26,20 +26,21 @@ def get_min_capability(cls) -> int:
     @abstractmethod
     def create_weights(self, *args, **kwargs):
         """
-        Weight creation for the particular scheme. Inputs to this function 
+        Weight creation for the particular scheme. Inputs to this function
 
         """
         raise NotImplementedError
 
     @abstractmethod
-    def apply_weights(self, layer: torch.nn.Module, x: torch.Tensor,
-                      bias: Optional[torch.Tensor]):
+    def apply_weights(
+        self, layer: torch.nn.Module, x: torch.Tensor, bias: Optional[torch.Tensor]
+    ):
         """
-        Run the forward pass for the particular scheme. This is where 
+        Run the forward pass for the particular scheme. This is where
         scheme-specific dequant/quant steps/kernels should be applied.
 
-        :param layer: torch.nn.Module with the registered weights and 
-            other parameters relevant to the particular scheme. 
+        :param layer: torch.nn.Module with the registered weights and
+            other parameters relevant to the particular scheme.
         :param x: input to the layer
         :param bias: bias parameter
 
diff --git a/vllm/model_executor/layers/quantization/quark/schemes/quark_w4a4_mxfp4.py b/vllm/model_executor/layers/quantization/quark/schemes/quark_w4a4_mxfp4.py
index bcf3911095ac..9bedd7fa2563 100644
--- a/vllm/model_executor/layers/quantization/quark/schemes/quark_w4a4_mxfp4.py
+++ b/vllm/model_executor/layers/quantization/quark/schemes/quark_w4a4_mxfp4.py
@@ -10,17 +10,21 @@
 from vllm import envs
 from vllm.model_executor.layers.quantization.quark.schemes import QuarkScheme
 from vllm.model_executor.layers.quantization.utils.mxfp4_utils import (
-    OCP_MX_BLOCK_SIZE, dequant_mxfp4, quant_dequant_mxfp4)
-from vllm.model_executor.parameter import (GroupQuantScaleParameter,
-                                           PackedvLLMParameter)
+    OCP_MX_BLOCK_SIZE,
+    dequant_mxfp4,
+    quant_dequant_mxfp4,
+)
+from vllm.model_executor.parameter import GroupQuantScaleParameter, PackedvLLMParameter
 from vllm.platforms import current_platform
 
 
 @cache
 def is_rocm_aiter_fp4_asm_gemm_enabled() -> bool:
-    return current_platform.is_rocm() \
-        and envs.VLLM_ROCM_USE_AITER_FP4_ASM_GEMM \
+    return (
+        current_platform.is_rocm()
+        and envs.VLLM_ROCM_USE_AITER_FP4_ASM_GEMM
         and envs.VLLM_ROCM_USE_AITER
+    )
 
 
 try:
@@ -29,6 +33,7 @@ def is_rocm_aiter_fp4_asm_gemm_enabled() -> bool:
     from aiter.ops.triton.quant import dynamic_mxfp4_quant
 
     from vllm.utils import direct_register_custom_op
+
     if is_rocm_aiter_fp4_asm_gemm_enabled():
         from aiter import gemm_a4w4, per_1x32_f4_quant_hip
 
@@ -51,17 +56,13 @@ def gemm_with_dynamic_quant(
 
             # 32 alignment is enough for dim0 padding of output for
             # gemm_a4w4 kernel
-            y = torch.empty((M + 31) // 32 * 32,
-                            weight.shape[0],
-                            device=x_q.device,
-                            dtype=out_dtype)
-
-            gemm_a4w4(x_q,
-                      weight,
-                      x_s,
-                      weight_scale.view(x_s.dtype),
-                      y,
-                      bpreshuffle=True)
+            y = torch.empty(
+                (M + 31) // 32 * 32, weight.shape[0], device=x_q.device, dtype=out_dtype
+            )
+
+            gemm_a4w4(
+                x_q, weight, x_s, weight_scale.view(x_s.dtype), y, bpreshuffle=True
+            )
             return y[:M]
         else:
             if x_scales is None:
@@ -69,10 +70,9 @@ def gemm_with_dynamic_quant(
             else:
                 x_q = x
                 x_s = x_scales
-            y = torch.empty(x_q.shape[0],
-                            weight.shape[0],
-                            device=x_q.device,
-                            dtype=out_dtype)
+            y = torch.empty(
+                x_q.shape[0], weight.shape[0], device=x_q.device, dtype=out_dtype
+            )
 
             gemm_afp4wfp4(x_q, weight, x_s, weight_scale.T, out_dtype, y)
             return y
@@ -85,9 +85,9 @@ def gemm_with_dynamic_quant_fake(
         rocm_use_aiter_fp4_asm_gemm: bool = False,
         out_dtype: Optional[torch.dtype] = torch.bfloat16,
     ) -> torch.Tensor:
-        return torch.empty((*x.shape[:-1], weight.shape[0]),
-                           dtype=out_dtype,
-                           device=x.device)
+        return torch.empty(
+            (*x.shape[:-1], weight.shape[0]), dtype=out_dtype, device=x.device
+        )
 
     direct_register_custom_op(
         op_name="gemm_with_dynamic_quant",
@@ -104,46 +104,45 @@ def gemm_with_dynamic_quant_fake(
 
 
 class QuarkW4A4MXFP4(QuarkScheme):
-
-    def __init__(self, weight_quant_spec: dict[str, Any],
-                 input_quant_spec: dict[str, Any]):
+    def __init__(
+        self, weight_quant_spec: dict[str, Any], input_quant_spec: dict[str, Any]
+    ):
         self.out_dtype = torch.get_default_dtype()
         self.qscheme = "per_group"
         self.weight_quant_spec = weight_quant_spec
         self.input_quant_spec = input_quant_spec
         self.emulate = not current_platform.supports_mx()
         self.rocm_use_aiter_fp4_asm_gemm = is_rocm_aiter_fp4_asm_gemm_enabled()
-        if not self.emulate and (dynamic_mxfp4_quant is None
-                                 or gemm_afp4wfp4 is None):
+        if not self.emulate and (dynamic_mxfp4_quant is None or gemm_afp4wfp4 is None):
             # Currently need these kernels if not emulating
             raise NotImplementedError(
                 f"{self.__class__.__name__} requires AITER to be installed "
                 "for non-emulation mode! Please refer to "
-                "https://github.com/ROCm/aiter for installation details.")
+                "https://github.com/ROCm/aiter for installation details."
+            )
 
     @classmethod
     def get_min_capability(cls) -> int:
         return 70
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
-        layer.weight = torch.nn.Parameter(layer.weight.data,
-                                          requires_grad=False)
+        layer.weight = torch.nn.Parameter(layer.weight.data, requires_grad=False)
 
         if self.emulate:
-            layer.weight_scale = torch.nn.Parameter(layer.weight_scale.data,
-                                                    requires_grad=False)
+            layer.weight_scale = torch.nn.Parameter(
+                layer.weight_scale.data, requires_grad=False
+            )
             try:
                 from quark.torch.export.nn.modules import realquantizer
-                from quark.torch.quantization.config.config import (
-                    QuantizationSpec)
+                from quark.torch.quantization.config.config import QuantizationSpec
             except ImportError as err:
                 raise ImportError(
                     "The package `amd-quark` is required to use AMD Quark "
                     "MX-FP4 models. Please install it with `pip install "
-                    "amd-quark`.") from err
+                    "amd-quark`."
+                ) from err
 
-            weight_quant_spec = QuantizationSpec.from_dict(
-                self.weight_quant_spec)
+            weight_quant_spec = QuantizationSpec.from_dict(self.weight_quant_spec)
 
             weight_quantizer = realquantizer.get_real_quantizer(
                 qspec=weight_quant_spec,
@@ -170,29 +169,34 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
                 weight_scale_shuffle = layer.weight_scale.data
                 sm, sn = weight_scale_shuffle.shape
                 weight_scale_shuffle = weight_scale_shuffle.view(
-                    sm // 32, 2, 16, sn // 8, 2, 4, 1)
+                    sm // 32, 2, 16, sn // 8, 2, 4, 1
+                )
                 weight_scale_shuffle = weight_scale_shuffle.permute(
-                    0, 3, 5, 2, 4, 1, 6).contiguous()
+                    0, 3, 5, 2, 4, 1, 6
+                ).contiguous()
                 weight_scale_shuffle = weight_scale_shuffle.view(sm, sn)
-                layer.weight_scale = torch.nn.Parameter(weight_scale_shuffle,
-                                                        requires_grad=False)
+                layer.weight_scale = torch.nn.Parameter(
+                    weight_scale_shuffle, requires_grad=False
+                )
 
                 # shuffle weight
                 weight_shuffle = layer.weight.data
-                weight_shuffle = shuffle_weight(weight_shuffle,
-                                                layout=(16, 16))
-                layer.weight = torch.nn.Parameter(weight_shuffle,
-                                                  requires_grad=False)
+                weight_shuffle = shuffle_weight(weight_shuffle, layout=(16, 16))
+                layer.weight = torch.nn.Parameter(weight_shuffle, requires_grad=False)
             else:
                 layer.weight_scale = torch.nn.Parameter(
-                    layer.weight_scale.data.T.contiguous(),
-                    requires_grad=False)
-
-    def create_weights(self, layer: torch.nn.Module,
-                       output_partition_sizes: list[int],
-                       input_size_per_partition: int,
-                       params_dtype: torch.dtype, weight_loader: Callable,
-                       **kwargs):
+                    layer.weight_scale.data.T.contiguous(), requires_grad=False
+                )
+
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        output_partition_sizes: list[int],
+        input_size_per_partition: int,
+        params_dtype: torch.dtype,
+        weight_loader: Callable,
+        **kwargs,
+    ):
         output_size_per_partition = sum(output_partition_sizes)
         layer.logical_widths = output_partition_sizes
 
@@ -224,16 +228,21 @@ def create_weights(self, layer: torch.nn.Module,
         )
         layer.register_parameter("weight_scale", weight_scale)
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
-
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         if self.emulate:
             dq_w = dequant_mxfp4(layer.weight, layer.weight_scale, x.dtype)
             x = quant_dequant_mxfp4(x)
             return F.linear(x, dq_w, bias)
         else:
             return torch.ops.vllm.gemm_with_dynamic_quant(
-                x, layer.weight, layer.weight_scale,
-                self.rocm_use_aiter_fp4_asm_gemm, self.out_dtype)
+                x,
+                layer.weight,
+                layer.weight_scale,
+                self.rocm_use_aiter_fp4_asm_gemm,
+                self.out_dtype,
+            )
diff --git a/vllm/model_executor/layers/quantization/quark/schemes/quark_w8a8_fp8.py b/vllm/model_executor/layers/quantization/quark/schemes/quark_w8a8_fp8.py
index 2cb35249f49e..553698a7dc94 100644
--- a/vllm/model_executor/layers/quantization/quark/schemes/quark_w8a8_fp8.py
+++ b/vllm/model_executor/layers/quantization/quark/schemes/quark_w8a8_fp8.py
@@ -7,37 +7,43 @@
 from torch.nn import Parameter
 
 from vllm.model_executor.layers.quantization.quark.schemes import QuarkScheme
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape)
+from vllm.model_executor.layers.quantization.utils.quant_utils import GroupShape
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    Fp8LinearOp, normalize_e4m3fn_to_e4m3fnuz, requantize_with_max_scale)
-from vllm.model_executor.parameter import (ChannelQuantScaleParameter,
-                                           ModelWeightParameter,
-                                           PerTensorScaleParameter)
+    Fp8LinearOp,
+    normalize_e4m3fn_to_e4m3fnuz,
+    requantize_with_max_scale,
+)
+from vllm.model_executor.parameter import (
+    ChannelQuantScaleParameter,
+    ModelWeightParameter,
+    PerTensorScaleParameter,
+)
 from vllm.platforms import current_platform
 
 __all__ = ["QuarkW8A8Fp8"]
 
 
 class QuarkW8A8Fp8(QuarkScheme):
-
-    def __init__(self, weight_config: dict[str, Any],
-                 input_config: Optional[dict[str, Any]]):
+    def __init__(
+        self, weight_config: dict[str, Any], input_config: Optional[dict[str, Any]]
+    ):
         self.weight_qscheme = cast(str, weight_config.get("qscheme"))
         self.is_static_input_scheme: bool = False
         self.input_qscheme: Optional[str] = None
         if input_config is not None:
-            self.is_static_input_scheme = not cast(
-                bool, input_config.get("is_dynamic"))
+            self.is_static_input_scheme = not cast(bool, input_config.get("is_dynamic"))
             self.input_qscheme = cast(str, input_config.get("qscheme"))
 
-        per_token = (not self.is_static_input_scheme
-                     and self.input_qscheme == "per_channel")
-        self.act_quant_group_shape = GroupShape.PER_TOKEN \
-            if per_token else GroupShape.PER_TENSOR
+        per_token = (
+            not self.is_static_input_scheme and self.input_qscheme == "per_channel"
+        )
+        self.act_quant_group_shape = (
+            GroupShape.PER_TOKEN if per_token else GroupShape.PER_TENSOR
+        )
         self.fp8_linear = Fp8LinearOp(
             act_quant_static=self.is_static_input_scheme,
-            act_quant_group_shape=self.act_quant_group_shape)
+            act_quant_group_shape=self.act_quant_group_shape,
+        )
         self.out_dtype = torch.get_default_dtype()
 
     @classmethod
@@ -51,14 +57,14 @@ def process_weights_after_loading(self, layer) -> None:
         # requantize so we can always run per tensor
         if self.weight_qscheme == "per_tensor":
             if current_platform.is_fp8_fnuz():
-                input_scale = getattr(layer, 'input_scale', None)
+                input_scale = getattr(layer, "input_scale", None)
                 weight, max_w_scale, input_scale = normalize_e4m3fn_to_e4m3fnuz(
                     weight=layer.weight,
                     weight_scale=layer.weight_scale,
-                    input_scale=input_scale)
+                    input_scale=input_scale,
+                )
                 if input_scale is not None:
-                    layer.input_scale = Parameter(input_scale,
-                                                  requires_grad=False)
+                    layer.input_scale = Parameter(input_scale, requires_grad=False)
             else:
                 max_w_scale = layer.weight_scale
                 weight = layer.weight
@@ -77,15 +83,14 @@ def process_weights_after_loading(self, layer) -> None:
             weight = layer.weight
 
             if current_platform.is_fp8_fnuz():
-                input_scale = getattr(layer, 'input_scale', None)
-                weight, weight_scale, input_scale = \
-                    normalize_e4m3fn_to_e4m3fnuz(
-                        weight=weight,
-                        weight_scale=layer.weight_scale,
-                        input_scale=input_scale)
+                input_scale = getattr(layer, "input_scale", None)
+                weight, weight_scale, input_scale = normalize_e4m3fn_to_e4m3fnuz(
+                    weight=weight,
+                    weight_scale=layer.weight_scale,
+                    input_scale=input_scale,
+                )
                 if input_scale is not None:
-                    layer.input_scale = Parameter(input_scale,
-                                                  requires_grad=False)
+                    layer.input_scale = Parameter(input_scale, requires_grad=False)
             else:
                 weight_scale = layer.weight_scale.data
             if self.act_quant_group_shape == GroupShape.PER_TOKEN:
@@ -95,32 +100,37 @@ def process_weights_after_loading(self, layer) -> None:
             layer.weight_scale = Parameter(weight_scale, requires_grad=False)
 
         else:
-            raise ValueError(
-                f"Unknown quantization scheme {self.weight_qscheme}")
+            raise ValueError(f"Unknown quantization scheme {self.weight_qscheme}")
 
         # INPUT SCALE
         if self.is_static_input_scheme:
-            layer.input_scale = Parameter(layer.input_scale.max(),
-                                          requires_grad=False)
+            layer.input_scale = Parameter(layer.input_scale.max(), requires_grad=False)
         else:
             layer.input_scale = None
 
-    def create_weights(self, layer: torch.nn.Module,
-                       output_partition_sizes: list[int],
-                       input_size_per_partition: int,
-                       params_dtype: torch.dtype, weight_loader: Callable,
-                       **kwargs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        output_partition_sizes: list[int],
+        input_size_per_partition: int,
+        params_dtype: torch.dtype,
+        weight_loader: Callable,
+        **kwargs,
+    ):
         output_size_per_partition = sum(output_partition_sizes)
         layer.logical_widths = output_partition_sizes
 
         # WEIGHT
-        weight = ModelWeightParameter(data=torch.empty(
-            output_size_per_partition,
-            input_size_per_partition,
-            dtype=torch.float8_e4m3fn),
-                                      input_dim=1,
-                                      output_dim=0,
-                                      weight_loader=weight_loader)
+        weight = ModelWeightParameter(
+            data=torch.empty(
+                output_size_per_partition,
+                input_size_per_partition,
+                dtype=torch.float8_e4m3fn,
+            ),
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("weight", weight)
 
         # WEIGHT SCALE
@@ -128,15 +138,16 @@ def create_weights(self, layer: torch.nn.Module,
         # the newly added parameters
         if self.weight_qscheme == "per_channel":
             weight_scale = ChannelQuantScaleParameter(
-                data=torch.empty((sum(output_partition_sizes)),
-                                 dtype=torch.float32),
+                data=torch.empty((sum(output_partition_sizes)), dtype=torch.float32),
                 output_dim=0,
-                weight_loader=weight_loader)
+                weight_loader=weight_loader,
+            )
         else:
             assert self.weight_qscheme == "per_tensor"
-            weight_scale = PerTensorScaleParameter(data=torch.empty(
-                len(output_partition_sizes), dtype=torch.float32),
-                                                   weight_loader=weight_loader)
+            weight_scale = PerTensorScaleParameter(
+                data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
+                weight_loader=weight_loader,
+            )
 
         # min requirement for fp8 kernels
         weight_scale[:] = torch.finfo(torch.float32).min
@@ -144,20 +155,24 @@ def create_weights(self, layer: torch.nn.Module,
 
         # INPUT SCALE
         if self.is_static_input_scheme:
-            input_scale = PerTensorScaleParameter(data=torch.empty(
-                len(output_partition_sizes), dtype=torch.float32),
-                                                  weight_loader=weight_loader)
+            input_scale = PerTensorScaleParameter(
+                data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
+                weight_loader=weight_loader,
+            )
             input_scale[:] = torch.finfo(torch.float32).min
             layer.register_parameter("input_scale", input_scale)
 
-    def apply_weights(self,
-                      layer: torch.nn.Module,
-                      x: torch.Tensor,
-                      bias: Optional[torch.Tensor] = None) -> torch.Tensor:
-
-        return self.fp8_linear.apply(input=x,
-                                     weight=layer.weight,
-                                     weight_scale=layer.weight_scale,
-                                     out_dtype=self.out_dtype,
-                                     input_scale=layer.input_scale,
-                                     bias=bias)
+    def apply_weights(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
+        return self.fp8_linear.apply(
+            input=x,
+            weight=layer.weight,
+            weight_scale=layer.weight_scale,
+            out_dtype=self.out_dtype,
+            input_scale=layer.input_scale,
+            bias=bias,
+        )
diff --git a/vllm/model_executor/layers/quantization/quark/schemes/quark_w8a8_int8.py b/vllm/model_executor/layers/quantization/quark/schemes/quark_w8a8_int8.py
index ae68d5bbc268..c41dd05d1062 100644
--- a/vllm/model_executor/layers/quantization/quark/schemes/quark_w8a8_int8.py
+++ b/vllm/model_executor/layers/quantization/quark/schemes/quark_w8a8_int8.py
@@ -7,12 +7,16 @@
 
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.kernels.scaled_mm import (
-    ScaledMMLinearLayerConfig, choose_scaled_mm_linear_kernel)
+    ScaledMMLinearLayerConfig,
+    choose_scaled_mm_linear_kernel,
+)
 from vllm.model_executor.layers.quantization.quark.schemes import QuarkScheme
-from vllm.model_executor.parameter import (BasevLLMParameter,
-                                           ChannelQuantScaleParameter,
-                                           ModelWeightParameter,
-                                           PerTensorScaleParameter)
+from vllm.model_executor.parameter import (
+    BasevLLMParameter,
+    ChannelQuantScaleParameter,
+    ModelWeightParameter,
+    PerTensorScaleParameter,
+)
 
 logger = init_logger(__name__)
 
@@ -20,8 +24,12 @@
 class QuarkW8A8Int8(QuarkScheme):
     _kernel_backends_being_used: set[str] = set()
 
-    def __init__(self, qscheme: str, is_static_input_scheme: Optional[bool],
-                 input_symmetric: Optional[bool]):
+    def __init__(
+        self,
+        qscheme: str,
+        is_static_input_scheme: Optional[bool],
+        input_symmetric: Optional[bool],
+    ):
         self.qscheme = qscheme
         self.is_static_input_scheme = is_static_input_scheme
         self.input_symmetric = input_symmetric
@@ -31,92 +39,101 @@ def get_min_capability(cls) -> int:
         # turing and up
         return 75
 
-    def create_weights(self, layer: torch.nn.Module,
-                       output_partition_sizes: list[int],
-                       input_size_per_partition: int,
-                       params_dtype: torch.dtype, weight_loader: Callable,
-                       **kwargs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        output_partition_sizes: list[int],
+        input_size_per_partition: int,
+        params_dtype: torch.dtype,
+        weight_loader: Callable,
+        **kwargs,
+    ):
         layer.logical_widths = output_partition_sizes
 
         scaled_mm_linear_kernel_config = ScaledMMLinearLayerConfig(
             is_channelwise=(self.qscheme == "per_channel"),
             is_static_input_scheme=(self.is_static_input_scheme is True),
-            input_symmetric=(self.input_symmetric is True))
+            input_symmetric=(self.input_symmetric is True),
+        )
 
-        kernel_type = choose_scaled_mm_linear_kernel(
-            scaled_mm_linear_kernel_config)
+        kernel_type = choose_scaled_mm_linear_kernel(scaled_mm_linear_kernel_config)
 
         if kernel_type.__name__ not in self._kernel_backends_being_used:
             logger.info("Using %s for QuarkW8A8Int8", kernel_type.__name__)
             self._kernel_backends_being_used.add(kernel_type.__name__)
 
         # WEIGHT
-        weight = ModelWeightParameter(data=torch.empty(
-            sum(output_partition_sizes),
-            input_size_per_partition,
-            dtype=torch.int8),
-                                      input_dim=1,
-                                      output_dim=0,
-                                      weight_loader=weight_loader)
+        weight = ModelWeightParameter(
+            data=torch.empty(
+                sum(output_partition_sizes), input_size_per_partition, dtype=torch.int8
+            ),
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
 
         layer.register_parameter("weight", weight)
 
         # WEIGHT SCALE
         if self.qscheme == "per_channel":
             weight_scale = ChannelQuantScaleParameter(
-                data=torch.empty((sum(output_partition_sizes)),
-                                 dtype=torch.float32),
+                data=torch.empty((sum(output_partition_sizes)), dtype=torch.float32),
                 output_dim=0,
-                weight_loader=weight_loader)
+                weight_loader=weight_loader,
+            )
             ChannelQuantZPParameter = ChannelQuantScaleParameter
             weight_zero_point = ChannelQuantZPParameter(
-                data=torch.empty((sum(output_partition_sizes)),
-                                 dtype=torch.int8),
+                data=torch.empty((sum(output_partition_sizes)), dtype=torch.int8),
                 output_dim=0,
-                weight_loader=weight_loader)
+                weight_loader=weight_loader,
+            )
         else:
             assert self.qscheme == "per_tensor"
-            weight_scale = PerTensorScaleParameter(data=torch.empty(
-                len(output_partition_sizes), dtype=torch.float32),
-                                                   weight_loader=weight_loader)
+            weight_scale = PerTensorScaleParameter(
+                data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
+                weight_loader=weight_loader,
+            )
             PerTensorZPParameter = PerTensorScaleParameter
             weight_zero_point = PerTensorZPParameter(
-                data=torch.empty(len(output_partition_sizes),
-                                 dtype=torch.int8),
-                weight_loader=weight_loader)
+                data=torch.empty(len(output_partition_sizes), dtype=torch.int8),
+                weight_loader=weight_loader,
+            )
         layer.register_parameter("weight_scale", weight_scale)
         layer.register_parameter("weight_zero_point", weight_zero_point)
 
         # INPUT SCALE
         if self.is_static_input_scheme:
-            input_scale = BasevLLMParameter(data=torch.empty(
-                1, dtype=torch.float32),
-                                            weight_loader=weight_loader)
+            input_scale = BasevLLMParameter(
+                data=torch.empty(1, dtype=torch.float32), weight_loader=weight_loader
+            )
             layer.register_parameter("input_scale", input_scale)
 
-            input_zero_point = BasevLLMParameter(data=torch.empty(
-                1, dtype=torch.int8),
-                                                 weight_loader=weight_loader)
+            input_zero_point = BasevLLMParameter(
+                data=torch.empty(1, dtype=torch.int8), weight_loader=weight_loader
+            )
             layer.register_parameter("input_zero_point", input_zero_point)
 
-        self.kernel = kernel_type(c=scaled_mm_linear_kernel_config,
-                                  w_q_param_name="weight",
-                                  w_s_param_name="weight_scale",
-                                  i_s_param_name="input_scale",
-                                  i_zp_param_name="input_zero_point",
-                                  azp_adj_param_name="azp_adj")
+        self.kernel = kernel_type(
+            c=scaled_mm_linear_kernel_config,
+            w_q_param_name="weight",
+            w_s_param_name="weight_scale",
+            i_s_param_name="input_scale",
+            i_zp_param_name="input_zero_point",
+            azp_adj_param_name="azp_adj",
+        )
 
     # Checkpoints are serialized in quark format, which is
     # different from the format the kernel may want. Handle repacking here.
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         layer.register_parameter("weight_zero_point", None)
-        delattr(layer, 'weight_zero_point')
+        delattr(layer, "weight_zero_point")
         if self.input_symmetric:
             layer.register_parameter("input_zero_point", None)
-            delattr(layer, 'input_zero_point')
+            delattr(layer, "input_zero_point")
 
         self.kernel.process_weights_after_loading(layer)
 
-    def apply_weights(self, layer: torch.nn.Module, x: torch.Tensor,
-                      bias: Optional[torch.Tensor]) -> torch.Tensor:
+    def apply_weights(
+        self, layer: torch.nn.Module, x: torch.Tensor, bias: Optional[torch.Tensor]
+    ) -> torch.Tensor:
         return self.kernel.apply_weights(layer, x, bias)
diff --git a/vllm/model_executor/layers/quantization/quark/utils.py b/vllm/model_executor/layers/quantization/quark/utils.py
index 99f5ec15933a..6a3ec17613a3 100644
--- a/vllm/model_executor/layers/quantization/quark/utils.py
+++ b/vllm/model_executor/layers/quantization/quark/utils.py
@@ -24,7 +24,7 @@ def deep_compare(dict1: Any, dict2: Any) -> bool:
 def should_ignore_layer(
     layer_name: Optional[str],
     ignore: Iterable[str],
-    fused_mapping: Mapping[str, list[str]] = MappingProxyType({})
+    fused_mapping: Mapping[str, list[str]] = MappingProxyType({}),
 ) -> bool:
     if layer_name is None:
         return False
@@ -50,7 +50,8 @@ def should_ignore_layer(
         should_ignore_layer = None
         for shard_name in shard_names:
             should_ignore_shard = check_equal_or_regex_match(
-                layer_name=shard_name, targets=ignore)
+                layer_name=shard_name, targets=ignore
+            )
 
             # If shard_idx=0, set layer ignore to match shard.
             if should_ignore_layer is None:
@@ -58,24 +59,26 @@ def should_ignore_layer(
 
             # If shard_idx=1+ confirm scheme matches prior shards.
             elif should_ignore_shard != should_ignore_layer:
-                raise ValueError(f"Found a different quantization schemes for "
-                                 f"{shard_proj_names} in {layer_name}. vLLM "
-                                 "requires all to use the same scheme.")
+                raise ValueError(
+                    f"Found a different quantization schemes for "
+                    f"{shard_proj_names} in {layer_name}. vLLM "
+                    "requires all to use the same scheme."
+                )
 
     # Unfused layers like down_proj and o_proj will match
     # the safetensors checkpoint already.
     else:
-        should_ignore_layer = check_equal_or_regex_match(layer_name=layer_name,
-                                                         targets=ignore)
+        should_ignore_layer = check_equal_or_regex_match(
+            layer_name=layer_name, targets=ignore
+        )
 
     assert should_ignore_layer is not None
     return should_ignore_layer
 
 
-def check_equal_or_regex_match(layer_name: str,
-                               targets: Iterable[str]) -> bool:
+def check_equal_or_regex_match(layer_name: str, targets: Iterable[str]) -> bool:
     """
-    Checks whether a layer_name is exactly equal or a regex match for 
+    Checks whether a layer_name is exactly equal or a regex match for
     if target starts with 're:' to any target in list.
     """
     for target in targets:
@@ -84,9 +87,9 @@ def check_equal_or_regex_match(layer_name: str,
     return False
 
 
-def _is_equal_or_regex_match(value: str,
-                             target: str,
-                             check_contains: bool = False) -> bool:
+def _is_equal_or_regex_match(
+    value: str, target: str, check_contains: bool = False
+) -> bool:
     """
     Checks whether a value is exactly equal or a regex match for target
     if target starts with 're:'. If check_contains is set to True,
diff --git a/vllm/model_executor/layers/quantization/rtn.py b/vllm/model_executor/layers/quantization/rtn.py
index 015dc136bb82..e0070e207048 100644
--- a/vllm/model_executor/layers/quantization/rtn.py
+++ b/vllm/model_executor/layers/quantization/rtn.py
@@ -10,36 +10,45 @@
 from torch.nn.parameter import Parameter
 
 from vllm.logger import init_logger
-from vllm.model_executor.layers.fused_moe import (FusedMoE, FusedMoEConfig,
-                                                  FusedMoEMethodBase)
+from vllm.model_executor.layers.fused_moe import (
+    FusedMoE,
+    FusedMoEConfig,
+    FusedMoEMethodBase,
+)
 from vllm.model_executor.layers.fused_moe.config import (
-    FusedMoEQuantConfig, int4_w4a16_moe_quant_config,
-    int8_w8a16_moe_quant_config)
-from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
-                                               set_weight_attrs)
+    FusedMoEQuantConfig,
+    int4_w4a16_moe_quant_config,
+    int8_w8a16_moe_quant_config,
+)
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    LinearMethodBase,
+    set_weight_attrs,
+)
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 
 logger = init_logger(__name__)
 """By default, use 8 bit as target precision, but it can be 
 overridden by setting the RTN_NUM_BITS envvar
 """
-NUM_BITS = os.getenv('RTN_NUM_BITS', "8")
+NUM_BITS = os.getenv("RTN_NUM_BITS", "8")
 """By default, use group size of 128 parameters, but it can be 
 overridden by setting the RTN_GROUP_SIZE envvar
 """
-GROUP_SIZE = os.getenv('RTN_GROUP_SIZE', "128")
+GROUP_SIZE = os.getenv("RTN_GROUP_SIZE", "128")
 
 
 class RTNConfig(QuantizationConfig):
-    """Config class for RTN.
-    """
+    """Config class for RTN."""
 
     def __init__(
-            self,
-            weight_bits: int = int(NUM_BITS),
-            group_size: int = int(GROUP_SIZE),
+        self,
+        weight_bits: int = int(NUM_BITS),
+        group_size: int = int(GROUP_SIZE),
     ) -> None:
         self.weight_bits = weight_bits
         self.group_size = group_size
@@ -47,11 +56,13 @@ def __init__(
         if self.weight_bits != 4 and self.weight_bits != 8:
             raise ValueError(
                 "Currently, only 4-bit or 8-bit weight quantization is "
-                f"supported for RTN, but got {self.weight_bits} bits.")
+                f"supported for RTN, but got {self.weight_bits} bits."
+            )
 
     def __repr__(self) -> str:
-        return (f"RTNConfig(weight_bits={self.weight_bits}, "
-                f"group_size={self.group_size})")
+        return (
+            f"RTNConfig(weight_bits={self.weight_bits}, group_size={self.group_size})"
+        )
 
     @classmethod
     def get_name(cls) -> QuantizationMethods:
@@ -75,8 +86,9 @@ def from_config(cls, config: dict[str, Any]) -> "RTNConfig":
         group_size = cls.get_from_keys(config, ["group_size"])
         return cls(weight_bits, group_size)
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         if isinstance(layer, LinearBase):
             return RTNLinearMethod(self)
         elif isinstance(layer, FusedMoE):
@@ -89,8 +101,9 @@ class RTNTensor:
     overloading the copy_ method.
     """
 
-    def __init__(self, data: torch.Tensor, scale: torch.Tensor,
-                 quant_config: RTNConfig) -> None:
+    def __init__(
+        self, data: torch.Tensor, scale: torch.Tensor, quant_config: RTNConfig
+    ) -> None:
         self.data = data
         self.scale = scale
         self.quant_config = quant_config
@@ -99,7 +112,9 @@ def narrow(self, dim, start, length):
         factor = 1 if self.quant_config.weight_bits == 8 else 2
         return RTNTensor(
             self.data.narrow(dim, start // factor, length // factor),
-            self.scale.narrow(dim, start, length), self.quant_config)
+            self.scale.narrow(dim, start, length),
+            self.quant_config,
+        )
 
     def __getitem__(self, key):
         return RTNTensor(self.data[key], self.scale[key], self.quant_config)
@@ -115,9 +130,11 @@ def shape(self):
             return torch.Size((shape[0] * factor, shape[1]))
 
     def copy_(self, loaded_weight: torch.Tensor) -> None:
-        qweight, weight_scale = rtn_quantize(loaded_weight.cuda(),
-                                             self.quant_config.weight_bits,
-                                             self.quant_config.group_size)
+        qweight, weight_scale = rtn_quantize(
+            loaded_weight.cuda(),
+            self.quant_config.weight_bits,
+            self.quant_config.group_size,
+        )
 
         self.data.copy_(qweight)
         self.scale.data.copy_(weight_scale)
@@ -133,8 +150,9 @@ class RTNParameter(Parameter):
     def __new__(cls, data: torch.Tensor, **kwargs):
         return super().__new__(cls, data=data, requires_grad=False)
 
-    def __init__(self, data: torch.Tensor, scale: torch.Tensor,
-                 quant_config: RTNConfig) -> None:
+    def __init__(
+        self, data: torch.Tensor, scale: torch.Tensor, quant_config: RTNConfig
+    ) -> None:
         self.scale = scale
         self.quant_config = quant_config
 
@@ -164,31 +182,39 @@ def create_weights(
         **extra_weight_attrs,
     ):
         output_size_per_partition = sum(output_partition_sizes)
-        num_groups_per_col = (input_size_per_partition //
-                              self.quant_config.group_size
-                              if self.quant_config.group_size != -1 else 1)
+        num_groups_per_col = (
+            input_size_per_partition // self.quant_config.group_size
+            if self.quant_config.group_size != -1
+            else 1
+        )
 
         scale = Parameter(
-            torch.empty(output_size_per_partition,
-                        num_groups_per_col,
-                        dtype=params_dtype),
+            torch.empty(
+                output_size_per_partition, num_groups_per_col, dtype=params_dtype
+            ),
             requires_grad=False,
         )
         factor = 1 if self.quant_config.weight_bits == 8 else 2
 
-        weight = RTNParameter(data=torch.empty(output_size_per_partition //
-                                               factor,
-                                               input_size_per_partition,
-                                               dtype=torch.uint8),
-                              scale=scale,
-                              quant_config=self.quant_config)
+        weight = RTNParameter(
+            data=torch.empty(
+                output_size_per_partition // factor,
+                input_size_per_partition,
+                dtype=torch.uint8,
+            ),
+            scale=scale,
+            quant_config=self.quant_config,
+        )
 
         layer.register_parameter("weight", weight)
-        set_weight_attrs(weight, {
-            **extra_weight_attrs,
-            "input_dim": 1,
-            "output_dim": 0,
-        })
+        set_weight_attrs(
+            weight,
+            {
+                **extra_weight_attrs,
+                "input_dim": 1,
+                "output_dim": 0,
+            },
+        )
 
         layer.register_parameter("scale", scale)
         layer.output_size_per_partition = output_size_per_partition
@@ -196,10 +222,12 @@ def create_weights(
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         fix_weights(layer, "weight")
 
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         qweight = layer.weight
         scale = layer.scale
 
@@ -213,57 +241,75 @@ def apply(self,
 
 
 class RTNMoEMethod(FusedMoEMethodBase):
-
     def __init__(self, quant_config: RTNConfig, moe: FusedMoEConfig):
         super().__init__(moe)
         self.quant_config = quant_config
 
-    def create_weights(self, layer: torch.nn.Module, num_experts: int,
-                       hidden_size: int, intermediate_size_per_partition: int,
-                       params_dtype: torch.dtype, **extra_weight_attrs):
-
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        num_experts: int,
+        hidden_size: int,
+        intermediate_size_per_partition: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         factor = 1 if self.quant_config.weight_bits == 8 else 2
 
         # Fused gate_up_proj (column parallel)
-        num_groups_per_col = (hidden_size // self.quant_config.group_size
-                              if self.quant_config.group_size != -1 else 1)
+        num_groups_per_col = (
+            hidden_size // self.quant_config.group_size
+            if self.quant_config.group_size != -1
+            else 1
+        )
         w13_scale = Parameter(
-            torch.empty(num_experts,
-                        2 * intermediate_size_per_partition,
-                        num_groups_per_col,
-                        dtype=params_dtype),
+            torch.empty(
+                num_experts,
+                2 * intermediate_size_per_partition,
+                num_groups_per_col,
+                dtype=params_dtype,
+            ),
             requires_grad=False,
         )
         layer.register_parameter("w13_scale", w13_scale)
 
-        w13_weight = RTNParameter(data=torch.empty(
-            num_experts,
-            2 * intermediate_size_per_partition // factor,
-            hidden_size,
-            dtype=torch.uint8),
-                                  scale=w13_scale,
-                                  quant_config=self.quant_config)
+        w13_weight = RTNParameter(
+            data=torch.empty(
+                num_experts,
+                2 * intermediate_size_per_partition // factor,
+                hidden_size,
+                dtype=torch.uint8,
+            ),
+            scale=w13_scale,
+            quant_config=self.quant_config,
+        )
         layer.register_parameter("w13_weight", w13_weight)
         set_weight_attrs(w13_weight, extra_weight_attrs)
 
         # down_proj (row parallel)
-        num_groups_per_col = (intermediate_size_per_partition //
-                              self.quant_config.group_size
-                              if self.quant_config.group_size != -1 else 1)
-        w2_scale = Parameter(torch.zeros(num_experts,
-                                         hidden_size,
-                                         num_groups_per_col,
-                                         dtype=params_dtype),
-                             requires_grad=False)
+        num_groups_per_col = (
+            intermediate_size_per_partition // self.quant_config.group_size
+            if self.quant_config.group_size != -1
+            else 1
+        )
+        w2_scale = Parameter(
+            torch.zeros(
+                num_experts, hidden_size, num_groups_per_col, dtype=params_dtype
+            ),
+            requires_grad=False,
+        )
         layer.register_parameter("w2_scale", w2_scale)
 
-        w2_weight = RTNParameter(data=torch.empty(
-            num_experts,
-            hidden_size // factor,
-            intermediate_size_per_partition,
-            dtype=torch.uint8),
-                                 scale=w2_scale,
-                                 quant_config=self.quant_config)
+        w2_weight = RTNParameter(
+            data=torch.empty(
+                num_experts,
+                hidden_size // factor,
+                intermediate_size_per_partition,
+                dtype=torch.uint8,
+            ),
+            scale=w2_scale,
+            quant_config=self.quant_config,
+        )
         layer.register_parameter("w2_weight", w2_weight)
         set_weight_attrs(w2_weight, extra_weight_attrs)
 
@@ -273,12 +319,16 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         fix_weights(layer, "w2_weight", weight_bits == 4)
 
     def get_fused_moe_quant_config(
-            self, layer: torch.nn.Module) -> Optional[FusedMoEQuantConfig]:
+        self, layer: torch.nn.Module
+    ) -> Optional[FusedMoEQuantConfig]:
         weight_bits = self.quant_config.weight_bits
         group_size = self.quant_config.group_size
         assert weight_bits == 4 or weight_bits == 8
-        config_builder = (int4_w4a16_moe_quant_config
-                          if weight_bits == 4 else int8_w8a16_moe_quant_config)
+        config_builder = (
+            int4_w4a16_moe_quant_config
+            if weight_bits == 4
+            else int8_w8a16_moe_quant_config
+        )
         return config_builder(
             w1_scale=layer.w13_scale,
             w2_scale=layer.w2_scale,
@@ -313,8 +363,7 @@ def apply(
         assert self.fused_experts is None
 
         if enable_eplb:
-            raise NotImplementedError(
-                "EPLB not supported for `RTNMoEMethod` yet.")
+            raise NotImplementedError("EPLB not supported for `RTNMoEMethod` yet.")
 
         from vllm.model_executor.layers.fused_moe import fused_experts
 
@@ -330,7 +379,8 @@ def apply(
             scoring_func=scoring_func,
             routed_scaling_factor=routed_scaling_factor,
             e_score_correction_bias=e_score_correction_bias,
-            indices_type=self.topk_indices_dtype)
+            indices_type=self.topk_indices_dtype,
+        )
 
         return fused_experts(
             x,
@@ -347,15 +397,16 @@ def apply(
         )
 
 
-def rtn_quantize(tensor: torch.Tensor, num_bits: int,
-                 group_size: int) -> tuple[torch.Tensor, torch.Tensor]:
+def rtn_quantize(
+    tensor: torch.Tensor, num_bits: int, group_size: int
+) -> tuple[torch.Tensor, torch.Tensor]:
     """Quantize a tensor using per-group static scaling factor.
 
     Args:
         tensor: The input tensor.
         num_bits: Target precision for the result (supported values are
                   8 or 4).
-        group_size: Quantization granularity. 
+        group_size: Quantization granularity.
                     If equal to -1, each row in the input tensor is treated
                     as one group.
     """
@@ -364,15 +415,18 @@ def rtn_quantize(tensor: torch.Tensor, num_bits: int,
         tensor = tensor.unsqueeze(0)
 
     q_range = 2**num_bits
-    num_groups = (tensor.shape[1] * tensor.shape[2] //
-                  group_size if group_size != -1 else tensor.shape[1])
+    num_groups = (
+        tensor.shape[1] * tensor.shape[2] // group_size
+        if group_size != -1
+        else tensor.shape[1]
+    )
     """Calculate a scaling factor per input group.
     """
     input_flat = tensor.reshape(tensor.shape[0], num_groups, -1)
     input_min = torch.min(input_flat, dim=2, keepdim=True)[0]
     input_max = torch.max(input_flat, dim=2, keepdim=True)[0]
     input_max_abs = torch.max(input_min.abs(), input_max.abs())
-    scale = (input_max_abs * 2.0 / (q_range - 1))
+    scale = input_max_abs * 2.0 / (q_range - 1)
     """Scale each input group, round to the nearest integer, shift 
     the range and truncate.
     """
@@ -388,9 +442,10 @@ def rtn_quantize(tensor: torch.Tensor, num_bits: int,
     if num_bits == 4:
         """Pack two 4-bit values into each byte.
         """
-        inputs_q = (inputs_q[:, :, 1::2] << 4) | (inputs_q[:, :, ::2] & 0xf)
-        inputs_q = inputs_q.reshape(tensor.shape[0], tensor.shape[1] // 2,
-                                    tensor.shape[2])
+        inputs_q = (inputs_q[:, :, 1::2] << 4) | (inputs_q[:, :, ::2] & 0xF)
+        inputs_q = inputs_q.reshape(
+            tensor.shape[0], tensor.shape[1] // 2, tensor.shape[2]
+        )
         inputs_q = inputs_q.contiguous()
 
     if not batch_present:
@@ -420,9 +475,9 @@ def rtn_dequantize(tensor: torch.Tensor, scale: torch.Tensor) -> torch.Tensor:
     if num_bits == 4:
         input_dim *= 2
 
-    data = torch.empty((batch, input_dim, output_dim),
-                       dtype=scale.dtype,
-                       device=tensor.device)
+    data = torch.empty(
+        (batch, input_dim, output_dim), dtype=scale.dtype, device=tensor.device
+    )
 
     if num_bits == 8:
         data.copy_(tensor)
@@ -432,8 +487,9 @@ def rtn_dequantize(tensor: torch.Tensor, scale: torch.Tensor) -> torch.Tensor:
         """
         tensor = tensor.reshape(batch, input_dim, output_dim // 2)
         for i in range(2):
-            data[:, :, i::2] = ((tensor << 4 *
-                                 (1 - i)) >> 4).to(torch.int8) - q_range // 2
+            data[:, :, i::2] = ((tensor << 4 * (1 - i)) >> 4).to(
+                torch.int8
+            ) - q_range // 2
     """Scale each input group with its scaling factor.
     """
     scale = scale.reshape(batch, num_groups, -1)
@@ -447,9 +503,7 @@ def rtn_dequantize(tensor: torch.Tensor, scale: torch.Tensor) -> torch.Tensor:
     return input_deq
 
 
-def fix_weights(layer: torch.nn.Module,
-                param_name: str,
-                reshape: bool = False):
+def fix_weights(layer: torch.nn.Module, param_name: str, reshape: bool = False):
     """torch.compile does not know how to deal with a Parameter subclass
     (aka RTNParameter). As we don't really need RTNParameters for the
     forward pass, we replace them with equivalent instances of Parameters.
diff --git a/vllm/model_executor/layers/quantization/schema.py b/vllm/model_executor/layers/quantization/schema.py
index a108152929d9..9396da0ecd1a 100644
--- a/vllm/model_executor/layers/quantization/schema.py
+++ b/vllm/model_executor/layers/quantization/schema.py
@@ -30,7 +30,8 @@ class KVCacheQuantSchema(BaseModel):
     def check_is_fp8(self) -> "KVCacheQuantSchema":
         assert self.dtype == "float8_e4m3fn", (
             "Loaded scaling factors intended for KV cache dtype = "
-            f"{self.dtype} rather than float8_e4m3fn!")
+            f"{self.dtype} rather than float8_e4m3fn!"
+        )
         return self
 
     @model_validator(mode="after")
@@ -41,15 +42,18 @@ def check_tp_ranks(self, info: ValidationInfo) -> "KVCacheQuantSchema":
             num_hidden_layers = context["num_hidden_layers"]
             assert len(self.scaling_factor) == tp_size, (
                 f"Loaded dictionary has TP size {len(self.scaling_factor)} "
-                f"but LLM engine is currently running with TP size {tp_size}.")
+                f"but LLM engine is currently running with TP size {tp_size}."
+            )
             for tp_rank, layer_maps in self.scaling_factor.items():
                 assert len(layer_maps) == num_hidden_layers, (
                     f"KV cache scales map for TP rank {tp_rank} is malformed. "
                     f"Expected {num_hidden_layers} layers, got "
-                    f"{len(layer_maps)}.")
+                    f"{len(layer_maps)}."
+                )
             for i in range(tp_size):
                 assert i in self.scaling_factor, (
-                    f"KV cache scales map for TP rank {i} not found.")
+                    f"KV cache scales map for TP rank {i} not found."
+                )
         return self
 
     @model_validator(mode="after")
@@ -62,7 +66,8 @@ def check_current_rank(self, info: ValidationInfo) -> "KVCacheQuantSchema":
             for i in range(num_hidden_layers):
                 assert i in layer_scales_map, (
                     f"Could not find KV cache scales for layer {i} in "
-                    f"TP rank {tp_rank}.")
+                    f"TP rank {tp_rank}."
+                )
         return self
 
 
@@ -82,5 +87,6 @@ def check_model_type(self, info: ValidationInfo) -> "QuantParamSchema":
                 assert model_type == self.model_type, (
                     f"Model type is {model_type} but loaded "
                     f"scaling factors belonging to different "
-                    f"model type {self.model_type}!")
+                    f"model type {self.model_type}!"
+                )
         return self
diff --git a/vllm/model_executor/layers/quantization/torchao.py b/vllm/model_executor/layers/quantization/torchao.py
index 7e38304ad6d9..629d0b863041 100644
--- a/vllm/model_executor/layers/quantization/torchao.py
+++ b/vllm/model_executor/layers/quantization/torchao.py
@@ -8,11 +8,16 @@
 from torch.nn.parameter import Parameter
 
 from vllm.logger import init_logger
-from vllm.model_executor.layers.linear import (LinearBase, LinearMethodBase,
-                                               UnquantizedLinearMethod)
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    LinearMethodBase,
+    UnquantizedLinearMethod,
+)
 from vllm.model_executor.layers.quantization import QuantizationMethods
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.utils import set_weight_attrs
 
 logger = init_logger(__name__)
@@ -39,10 +44,12 @@ def should_skip(prefix: str, skip_modules: list[str]) -> bool:
 class TorchAOConfig(QuantizationConfig):
     """Config class for torchao."""
 
-    def __init__(self,
-                 torchao_config,
-                 skip_modules: Optional[list[str]] = None,
-                 is_checkpoint_torchao_serialized: bool = False) -> None:
+    def __init__(
+        self,
+        torchao_config,
+        skip_modules: Optional[list[str]] = None,
+        is_checkpoint_torchao_serialized: bool = False,
+    ) -> None:
         """
         # TorchAO quantization relies on tensor subclasses. In order,
         # to enable proper caching this needs standalone compile
@@ -63,8 +70,10 @@ def __init__(self,
         self.is_checkpoint_torchao_serialized = is_checkpoint_torchao_serialized
 
     def __repr__(self) -> str:
-        return f"TorchAOConfig({self.torchao_config=}, {self.skip_modules=}, " \
+        return (
+            f"TorchAOConfig({self.torchao_config=}, {self.skip_modules=}, "
             f"{self.is_checkpoint_torchao_serialized=})"
+        )
 
     def get_name(self) -> QuantizationMethods:
         return "torchao"
@@ -95,13 +104,15 @@ def from_config(cls, config: dict[str, Any]) -> "TorchAOConfig":
             ) from err
 
         quant_method = cls.get_from_keys_or(config, ["quant_method"], None)
-        is_checkpoint_torchao_serialized = (quant_method is not None
-                                            and "torchao" in quant_method)
+        is_checkpoint_torchao_serialized = (
+            quant_method is not None and "torchao" in quant_method
+        )
 
         hf_config = cls.get_from_keys_or(config, ["quant_type"], None)
         assert hf_config is not None, "quant_type must be specified"
         assert len(hf_config) == 1 and "default" in hf_config, (
-            "Expected only one key 'default' in quant_type dictionary")
+            "Expected only one key 'default' in quant_type dictionary"
+        )
         quant_type = hf_config["default"]
         ao_config = config_from_dict(quant_type)
 
@@ -127,9 +138,7 @@ def from_config(cls, config: dict[str, Any]) -> "TorchAOConfig":
     def from_config_file(cls, config_file: str) -> "TorchAOConfig":
         """Initialize class from a config file. Example:
         ```
-        config = (
-           Float8DynamicActivationFloat8WeightConfig(granularity=PerRow())
-        )
+        config = Float8DynamicActivationFloat8WeightConfig(granularity=PerRow())
         fn = "torchao_config.json"
 
         with open(fn, "w") as f:
@@ -154,8 +163,9 @@ def from_config_dict_json(cls, config_dict_json: str) -> "TorchAOConfig":
         hf_config = {"quant_type": {"default": config_dict}}
         return cls.from_config(hf_config)
 
-    def get_quant_method(self, layer: torch.nn.Module,
-                         prefix: str) -> Optional["QuantizeMethodBase"]:
+    def get_quant_method(
+        self, layer: torch.nn.Module, prefix: str
+    ) -> Optional["QuantizeMethodBase"]:
         if not isinstance(layer, LinearBase):
             return None
 
@@ -167,12 +177,13 @@ def get_quant_method(self, layer: torch.nn.Module,
         module_fqn = prefix
         if isinstance(self.torchao_config, ModuleFqnToConfig):
             module_fqn_to_config = self.torchao_config.module_fqn_to_config
-            c = module_fqn_to_config.get(
-                module_fqn) or module_fqn_to_config.get("_default", None)
+            c = module_fqn_to_config.get(module_fqn) or module_fqn_to_config.get(
+                "_default", None
+            )
             if c is not None:
                 current_torchao_config = TorchAOConfig(
-                    c, self.skip_modules,
-                    self.is_checkpoint_torchao_serialized)
+                    c, self.skip_modules, self.is_checkpoint_torchao_serialized
+                )
                 return TorchAOLinearMethod(current_torchao_config)
             else:
                 return UnquantizedLinearMethod()
@@ -183,8 +194,9 @@ def get_scaled_act_names(self) -> list[str]:
         return []
 
 
-def torchao_quantize_param_data(param: torch.Tensor,
-                                torchao_config: Any) -> torch.nn.Parameter:
+def torchao_quantize_param_data(
+    param: torch.Tensor, torchao_config: Any
+) -> torch.nn.Parameter:
     """Quantize a Tensor with torchao quantization specified by torchao_config
 
     Args:
@@ -205,7 +217,8 @@ def torchao_quantize_param_data(param: torch.Tensor,
         # while some of our configs need to do module swap, and only non-top
         # level modules support module swap
         dummy_linear = torch.nn.Sequential(
-            torch.nn.Linear(param.shape[1], param.shape[0], bias=False))
+            torch.nn.Linear(param.shape[1], param.shape[0], bias=False)
+        )
 
     dummy_linear[0].weight = param
     quantize_(dummy_linear, torchao_config)
@@ -243,7 +256,8 @@ def create_weights(
         )
         if self.quant_config.is_checkpoint_torchao_serialized:
             weight = torchao_quantize_param_data(
-                weight, self.quant_config.torchao_config)
+                weight, self.quant_config.torchao_config
+            )
 
         set_weight_attrs(weight, {"input_dim": 1, "output_dim": 0})
 
@@ -264,7 +278,8 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
 
         # quantize the weight on the fly if the checkpoint is not already
         # quantized by torchao
-        weight = torchao_quantize_param_data(layer.weight,
-                                             self.quant_config.torchao_config)
+        weight = torchao_quantize_param_data(
+            layer.weight, self.quant_config.torchao_config
+        )
         set_weight_attrs(weight, {"input_dim": 1, "output_dim": 0})
         layer.register_parameter("weight", weight)
diff --git a/vllm/model_executor/layers/quantization/tpu_int8.py b/vllm/model_executor/layers/quantization/tpu_int8.py
index 7f738d170db4..a24cd41659a0 100644
--- a/vllm/model_executor/layers/quantization/tpu_int8.py
+++ b/vllm/model_executor/layers/quantization/tpu_int8.py
@@ -8,8 +8,10 @@
 from torch.nn.parameter import Parameter
 
 from vllm.model_executor.layers.linear import LinearBase, LinearMethodBase
-from vllm.model_executor.layers.quantization import (QuantizationConfig,
-                                                     QuantizationMethods)
+from vllm.model_executor.layers.quantization import (
+    QuantizationConfig,
+    QuantizationMethods,
+)
 from vllm.model_executor.parameter import ModelWeightParameter
 
 ACTIVATION_SCHEMES = ["none", "dynamic"]
@@ -24,8 +26,7 @@ def __init__(
     ) -> None:
         super().__init__()
         if activation_scheme not in ACTIVATION_SCHEMES:
-            raise ValueError(
-                f"Unsupported activation scheme {activation_scheme}")
+            raise ValueError(f"Unsupported activation scheme {activation_scheme}")
         self.activation_scheme = activation_scheme
 
     def get_name(self) -> QuantizationMethods:
@@ -36,8 +37,7 @@ def get_supported_act_dtypes(self) -> list[torch.dtype]:
 
     @classmethod
     def get_min_capability(cls) -> int:
-        raise NotImplementedError(
-            "This function should not be called with TPU Backend")
+        raise NotImplementedError("This function should not be called with TPU Backend")
 
     @staticmethod
     def get_config_filenames() -> list[str]:
@@ -48,50 +48,61 @@ def from_config(cls, config: dict[str, Any]) -> "Int8TpuConfig":
         activation_scheme = cls.get_from_keys(config, ["activation_scheme"])
         return cls(activation_scheme=activation_scheme)
 
-    def get_quant_method(self, layer: Module,
-                         prefix: str) -> Optional["TPUInt8LinearMethod"]:
+    def get_quant_method(
+        self, layer: Module, prefix: str
+    ) -> Optional["TPUInt8LinearMethod"]:
         if isinstance(layer, LinearBase):
             return TPUInt8LinearMethod(self)
         return None
 
 
 class TPUInt8LinearMethod(LinearMethodBase):
-    """Int8 Linear method for TPU Quant. """
+    """Int8 Linear method for TPU Quant."""
 
     def __init__(self, quant_config: Int8TpuConfig):
         self.quant_config = quant_config
         self.quantize_activation = False
-        if self.quant_config.activation_scheme == 'dynamic':
+        if self.quant_config.activation_scheme == "dynamic":
             self.quantize_activation = True
 
-    def create_weights(self, layer: Module, input_size_per_partition: int,
-                       output_partition_sizes: list[int], input_size: int,
-                       output_size: int, params_dtype: torch.dtype,
-                       **extra_weight_attrs):
-
+    def create_weights(
+        self,
+        layer: Module,
+        input_size_per_partition: int,
+        output_partition_sizes: list[int],
+        input_size: int,
+        output_size: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         weight_loader = extra_weight_attrs.get("weight_loader")
-        weight = ModelWeightParameter(data=torch.empty(
-            sum(output_partition_sizes),
-            input_size_per_partition,
-            dtype=params_dtype),
-                                      input_dim=1,
-                                      output_dim=0,
-                                      weight_loader=weight_loader)
+        weight = ModelWeightParameter(
+            data=torch.empty(
+                sum(output_partition_sizes),
+                input_size_per_partition,
+                dtype=params_dtype,
+            ),
+            input_dim=1,
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
         layer.register_parameter("weight", weight)
 
     def _quantize_weight(
-            self, weight: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+        self, weight: torch.Tensor
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         weight_dtype = weight.dtype
         weight = weight.cpu().to(torch.float32)
         n_bit = 8
         eps = 1e-5
-        max_int = 2**(n_bit - 1) - 1
-        min_int = -(2**(n_bit - 1))
+        max_int = 2 ** (n_bit - 1) - 1
+        min_int = -(2 ** (n_bit - 1))
         max_val = weight.abs().amax(dim=-1, keepdim=True)
         max_val = max_val.clamp(min=eps)
         qscale = max_val / max_int
-        qweight = torch.clamp(torch.round(weight * (1.0 / qscale)), min_int,
-                              max_int).to(torch.int8)
+        qweight = torch.clamp(
+            torch.round(weight * (1.0 / qscale)), min_int, max_int
+        ).to(torch.int8)
         qscale = qscale.squeeze().to(weight_dtype)
         return qweight, qscale
 
@@ -104,21 +115,25 @@ def process_weights_after_loading(self, layer: Module) -> None:
         layer.weight = Parameter(qweight, requires_grad=False)
         layer.scale = Parameter(qscale, requires_grad=False)
 
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         try:
             import torch_xla.experimental.custom_kernel  # noqa: F401
         except ImportError as err:
             raise ImportError(
                 "Please install torch_xla by following the instructions at "
                 "https://docs.vllm.ai/en/latest/getting_started/tpu-installation.html "  # noqa: E501
-                "to run vLLM on TPU.") from err
+                "to run vLLM on TPU."
+            ) from err
         weight = layer.weight
         scale = layer.scale
         out = torch.ops.xla.quantized_matmul_int8(
-            x, weight, scale, quantize_activation=self.quantize_activation)
+            x, weight, scale, quantize_activation=self.quantize_activation
+        )
         if bias is not None:
             out = out + bias
         return out
diff --git a/vllm/model_executor/layers/quantization/utils/__init__.py b/vllm/model_executor/layers/quantization/utils/__init__.py
index 6ad56bae3dca..07c18029fb4d 100644
--- a/vllm/model_executor/layers/quantization/utils/__init__.py
+++ b/vllm/model_executor/layers/quantization/utils/__init__.py
@@ -1,6 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from .layer_utils import replace_parameter, update_tensor_inplace
-
-__all__ = ['update_tensor_inplace', 'replace_parameter']
+from .layer_utils import replace_parameter, update_tensor_inplace
+
+__all__ = ["update_tensor_inplace", "replace_parameter"]
diff --git a/vllm/model_executor/layers/quantization/utils/allspark_utils.py b/vllm/model_executor/layers/quantization/utils/allspark_utils.py
index 1992b4d20147..4c324682e5e6 100644
--- a/vllm/model_executor/layers/quantization/utils/allspark_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/allspark_utils.py
@@ -12,41 +12,56 @@
 ALLSPARK_AMPERE_K_ALIGN = 16
 
 
-def check_allspark_supported_dtype_shape(input_size_per_partition: int,
-                                         output_size_per_partition: int,
-                                         group_size: int,
-                                         weight_dtype: ScalarType,
-                                         act_dtype: torch.dtype):
+def check_allspark_supported_dtype_shape(
+    input_size_per_partition: int,
+    output_size_per_partition: int,
+    group_size: int,
+    weight_dtype: ScalarType,
+    act_dtype: torch.dtype,
+):
     capability_tuple = current_platform.get_device_capability()
-    device_capability = (-1 if capability_tuple is None else
-                         capability_tuple.to_int())
+    device_capability = -1 if capability_tuple is None else capability_tuple.to_int()
 
     # For Ampere GPU
     if device_capability >= 80 and device_capability < 90:
         if group_size != -1:
-            return False, \
-                "For Ampere GPU, AllSpark does not support group_size "\
-                f"= {group_size}. Only group_size = -1 are supported."
+            return (
+                False,
+                "For Ampere GPU, AllSpark does not support group_size "
+                f"= {group_size}. Only group_size = -1 are supported.",
+            )
 
         if weight_dtype not in ALLSPARK_SUPPORTED_QUANT_TYPES:
-            return False, "For Ampere GPU, AllSpark does not support "\
-                f"quant type ({weight_dtype}). Only quant type "\
-                f"({ALLSPARK_SUPPORTED_QUANT_TYPES}) are supported."
-
-        if input_size_per_partition % ALLSPARK_AMPERE_K_ALIGN != 0 \
-            or output_size_per_partition % ALLSPARK_AMPERE_N_ALIGN != 0:
-            return False, \
-                "AllSpark needs input_size_per_partition % "\
-                f"{ALLSPARK_AMPERE_K_ALIGN} = 0 and "\
-                f"output_size_per_partition % {ALLSPARK_AMPERE_N_ALIGN} = 0 "\
-                "for Ampere GPU optimized kernels."
+            return (
+                False,
+                "For Ampere GPU, AllSpark does not support "
+                f"quant type ({weight_dtype}). Only quant type "
+                f"({ALLSPARK_SUPPORTED_QUANT_TYPES}) are supported.",
+            )
+
+        if (
+            input_size_per_partition % ALLSPARK_AMPERE_K_ALIGN != 0
+            or output_size_per_partition % ALLSPARK_AMPERE_N_ALIGN != 0
+        ):
+            return (
+                False,
+                "AllSpark needs input_size_per_partition % "
+                f"{ALLSPARK_AMPERE_K_ALIGN} = 0 and "
+                f"output_size_per_partition % {ALLSPARK_AMPERE_N_ALIGN} = 0 "
+                "for Ampere GPU optimized kernels.",
+            )
 
         if act_dtype != torch.float16 and act_dtype != torch.bfloat16:
-            return False, \
-                "AllSpark only supports act_dtype = float16 or bfloat16,"\
-                f"for Ampere GPU, but got act_dtype = {act_dtype}."
+            return (
+                False,
+                "AllSpark only supports act_dtype = float16 or bfloat16,"
+                f"for Ampere GPU, but got act_dtype = {act_dtype}.",
+            )
     else:
-        return False, "AllSpark currently does not support "\
-            f"device_capability = {device_capability}."
+        return (
+            False,
+            "AllSpark currently does not support "
+            f"device_capability = {device_capability}.",
+        )
 
     return True, None
diff --git a/vllm/model_executor/layers/quantization/utils/bitblas_utils.py b/vllm/model_executor/layers/quantization/utils/bitblas_utils.py
index 4c2e54873586..4b7a22a26653 100644
--- a/vllm/model_executor/layers/quantization/utils/bitblas_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/bitblas_utils.py
@@ -28,13 +28,14 @@
 
 # Determines the supported quantization types for BitBLAS based on the
 # device's capability and whether zero-point (zp) is used.
-def query_bitblas_supported_quant_types(has_zp: bool,
-                                        device_capability: Optional[int] = None
-                                        ):
+def query_bitblas_supported_quant_types(
+    has_zp: bool, device_capability: Optional[int] = None
+):
     if device_capability is None:
         capability_tuple = current_platform.get_device_capability()
-        device_capability = (-1 if capability_tuple is None else
-                             capability_tuple.to_int())
+        device_capability = (
+            -1 if capability_tuple is None else capability_tuple.to_int()
+        )
 
     if device_capability < 70:
         return []
@@ -50,97 +51,116 @@ def query_bitblas_supported_quant_types(has_zp: bool,
 
 
 def _check_bitblas_supported(
-        quant_type: ScalarType,
-        group_size: Optional[int],
-        has_zp: bool,
-        device_capability: Optional[int] = None) -> tuple[bool, Optional[str]]:
-
+    quant_type: ScalarType,
+    group_size: Optional[int],
+    has_zp: bool,
+    device_capability: Optional[int] = None,
+) -> tuple[bool, Optional[str]]:
     if device_capability is None:
         capability_tuple = current_platform.get_device_capability()
-        device_capability = (-1 if capability_tuple is None else
-                             capability_tuple.to_int())
+        device_capability = (
+            -1 if capability_tuple is None else capability_tuple.to_int()
+        )
 
-    supported_types = query_bitblas_supported_quant_types(
-        has_zp, device_capability)
+    supported_types = query_bitblas_supported_quant_types(has_zp, device_capability)
 
     if quant_type not in supported_types:
-        return (False, f"BitBLAS does not support weight_bits = {quant_type}. "
-                f"Only types = {supported_types} "
-                f"are supported (for group_size = {group_size}, "
-                f"device_capability = {device_capability}, zp = {has_zp}).")
-    if (group_size is None or group_size not in BITBLAS_SUPPORTED_GROUP_SIZES):
-        return (False, f"BitBLAS does not support group_size = {group_size}. "
-                f"Only group_sizes = {BITBLAS_SUPPORTED_GROUP_SIZES} "
-                "are supported.")
+        return (
+            False,
+            f"BitBLAS does not support weight_bits = {quant_type}. "
+            f"Only types = {supported_types} "
+            f"are supported (for group_size = {group_size}, "
+            f"device_capability = {device_capability}, zp = {has_zp}).",
+        )
+    if group_size is None or group_size not in BITBLAS_SUPPORTED_GROUP_SIZES:
+        return (
+            False,
+            f"BitBLAS does not support group_size = {group_size}. "
+            f"Only group_sizes = {BITBLAS_SUPPORTED_GROUP_SIZES} "
+            "are supported.",
+        )
 
     # Finally, check if bitblas is installed
     try:
         import bitblas
-        if version.parse(
-                bitblas.__version__) < version.parse(MINIMUM_BITBLAS_VERSION):
-            raise ImportError("bitblas version is wrong. Please "
-                              f"install bitblas>={MINIMUM_BITBLAS_VERSION}")
+
+        if version.parse(bitblas.__version__) < version.parse(MINIMUM_BITBLAS_VERSION):
+            raise ImportError(
+                "bitblas version is wrong. Please "
+                f"install bitblas>={MINIMUM_BITBLAS_VERSION}"
+            )
     except ImportError:
         return False, "BitBLAS is not installed."
 
     return True, None
 
 
-def check_bitblas_supported(quant_type: ScalarType,
-                            group_size: int,
-                            has_zp: bool = False,
-                            device_capability: Optional[int] = None) -> bool:
-    cond, _ = _check_bitblas_supported(quant_type, group_size, has_zp,
-                                       device_capability)
+def check_bitblas_supported(
+    quant_type: ScalarType,
+    group_size: int,
+    has_zp: bool = False,
+    device_capability: Optional[int] = None,
+) -> bool:
+    cond, _ = _check_bitblas_supported(
+        quant_type, group_size, has_zp, device_capability
+    )
     return cond
 
 
-def verify_bitblas_supported(quant_type: ScalarType,
-                             group_size: int,
-                             has_zp: bool = False) -> None:
+def verify_bitblas_supported(
+    quant_type: ScalarType, group_size: int, has_zp: bool = False
+) -> None:
     cond, err_msg = _check_bitblas_supported(quant_type, group_size, has_zp)
     if not cond:
         assert err_msg is not None
         raise ValueError(err_msg)
 
 
-def verify_bitblas_supports_shape(output_size_per_partition: int,
-                                  input_size_per_partition: int,
-                                  input_size: int, group_size: int) -> None:
-
+def verify_bitblas_supports_shape(
+    output_size_per_partition: int,
+    input_size_per_partition: int,
+    input_size: int,
+    group_size: int,
+) -> None:
     # Validate output_size_per_partition
     if output_size_per_partition % BITBLAS_MIN_WEIGHT_SIZE_N != 0:
-        raise ValueError(f"Weight output_size_per_partition = "
-                         f"{output_size_per_partition} is not divisible by "
-                         f" min_thread_n = {BITBLAS_MIN_WEIGHT_SIZE_N}. "
-                         "Consider reducing tensor_parallel_size or running "
-                         "with --quantization gptq.")
+        raise ValueError(
+            f"Weight output_size_per_partition = "
+            f"{output_size_per_partition} is not divisible by "
+            f" min_thread_n = {BITBLAS_MIN_WEIGHT_SIZE_N}. "
+            "Consider reducing tensor_parallel_size or running "
+            "with --quantization gptq."
+        )
 
     # Validate input_size_per_partition
     if input_size_per_partition % BITBLAS_MIN_WEIGHT_SIZE_K != 0:
-        raise ValueError(f"Weight input_size_per_partition = "
-                         f"{input_size_per_partition} is not divisible "
-                         f"by min_thread_k = {BITBLAS_MIN_WEIGHT_SIZE_K}. "
-                         "Consider reducing tensor_parallel_size or running "
-                         "with --quantization gptq.")
-
-    if (group_size < input_size
-            and input_size_per_partition % group_size != 0):
+        raise ValueError(
+            f"Weight input_size_per_partition = "
+            f"{input_size_per_partition} is not divisible "
+            f"by min_thread_k = {BITBLAS_MIN_WEIGHT_SIZE_K}. "
+            "Consider reducing tensor_parallel_size or running "
+            "with --quantization gptq."
+        )
+
+    if group_size < input_size and input_size_per_partition % group_size != 0:
         raise ValueError(
             f"Weight input_size_per_partition = {input_size_per_partition}"
             f" is not divisible by group_size = {group_size}."
             "Consider reducing tensor_parallel_size or running "
-            "with --quantization gptq.")
+            "with --quantization gptq."
+        )
 
 
-def check_bitblas_supports_shape(output_size_per_partition: int,
-                                input_size_per_partition: int,
-                                input_size: int, group_size: int) \
-                                    -> tuple[bool, Optional[str]]:
+def check_bitblas_supports_shape(
+    output_size_per_partition: int,
+    input_size_per_partition: int,
+    input_size: int,
+    group_size: int,
+) -> tuple[bool, Optional[str]]:
     try:
-        verify_bitblas_supports_shape(output_size_per_partition,
-                                      input_size_per_partition, input_size,
-                                      group_size)
+        verify_bitblas_supports_shape(
+            output_size_per_partition, input_size_per_partition, input_size, group_size
+        )
     except ValueError as e:
         return False, e.__str__()
     return True, None
@@ -150,8 +170,9 @@ def bitblas_is_k_full(act_order: bool, is_row_parallel: bool) -> bool:
     return (not act_order) or (act_order and not is_row_parallel)
 
 
-def bitblas_repeat_scales_on_all_ranks(act_order: bool, group_size: int,
-                                       is_row_parallel: bool) -> bool:
+def bitblas_repeat_scales_on_all_ranks(
+    act_order: bool, group_size: int, is_row_parallel: bool
+) -> bool:
     # Need to repeat scales on every rank if act_ordering or
     # channelwise and RowParallelLinear
     is_channelwise = group_size == -1
@@ -159,17 +180,18 @@ def bitblas_repeat_scales_on_all_ranks(act_order: bool, group_size: int,
 
 
 def bitblas_make_empty_g_idx(device: torch.device) -> torch.Tensor:
-    return torch.nn.Parameter(torch.empty(0, dtype=torch.int, device=device),
-                              requires_grad=False)
+    return torch.nn.Parameter(
+        torch.empty(0, dtype=torch.int, device=device), requires_grad=False
+    )
 
 
 def bitblas_make_empty_zp(device: torch.device) -> torch.Tensor:
-    return torch.nn.Parameter(torch.empty(0, dtype=torch.int, device=device),
-                              requires_grad=False)
+    return torch.nn.Parameter(
+        torch.empty(0, dtype=torch.int, device=device), requires_grad=False
+    )
 
 
-def bitblas_sort_g_idx(
-        g_idx: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+def bitblas_sort_g_idx(g_idx: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
     g_idx_sort_indices = torch.argsort(g_idx).to(torch.int)
     return g_idx[g_idx_sort_indices], g_idx_sort_indices
 
@@ -186,8 +208,7 @@ def unpack_gptq_qzeros(qzeros, bits, is_gptq_v2=False) -> torch.Tensor:
 
     for col in range(unpacked_zeros.shape[1]):
         i = col % elems_per_int32
-        unpacked_zeros[:, col] = (qzeros[:, col // elems_per_int32] >>
-                                  (bits * i)) & 0xF
+        unpacked_zeros[:, col] = (qzeros[:, col // elems_per_int32] >> (bits * i)) & 0xF
     if not is_gptq_v2:
         return unpacked_zeros + 1
     return unpacked_zeros
@@ -204,7 +225,6 @@ def unpack_gptq_qweight(qweight, bits):
     )
     for col in range(unpacked_weight.shape[1]):
         i = col % elems_per_int8
-        unpacked_weight[:, col] = (qweight[:, col // elems_per_int8] >>
-                                   (bits * i))
+        unpacked_weight[:, col] = qweight[:, col // elems_per_int8] >> (bits * i)
 
     return torch.bitwise_and(unpacked_weight, 2**bits - 1)
diff --git a/vllm/model_executor/layers/quantization/utils/flashinfer_fp4_moe.py b/vllm/model_executor/layers/quantization/utils/flashinfer_fp4_moe.py
index a520302c62d9..7059a029ba67 100644
--- a/vllm/model_executor/layers/quantization/utils/flashinfer_fp4_moe.py
+++ b/vllm/model_executor/layers/quantization/utils/flashinfer_fp4_moe.py
@@ -1,18 +1,23 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Utility helpers for NVFP4 + FlashInfer fused-MoE path"""
+
 from __future__ import annotations
 
 import torch
 
 import vllm.envs as envs
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
-from vllm.model_executor.layers.fused_moe.config import (FusedMoEConfig,
-                                                         FusedMoEQuantConfig)
+from vllm.model_executor.layers.fused_moe.config import (
+    FusedMoEConfig,
+    FusedMoEQuantConfig,
+)
 from vllm.model_executor.layers.fused_moe.flashinfer_cutlass_moe import (
-    FlashInferExperts)
+    FlashInferExperts,
+)
 from vllm.model_executor.layers.fused_moe.flashinfer_cutlass_prepare_finalize import (  # noqa: E501
-    create_flashinfer_prepare_finalize)
+    create_flashinfer_prepare_finalize,
+)
 from vllm.platforms import current_platform
 from vllm.utils.flashinfer import has_flashinfer_cutlass_fused_moe
 
@@ -25,15 +30,17 @@
 
 def is_flashinfer_fp4_cutlass_moe_available() -> bool:
     """Return ``True`` when FlashInfer CUTLASS NV-FP4 kernels can be used."""
-    return (envs.VLLM_USE_FLASHINFER_MOE_FP4
-            and has_flashinfer_cutlass_fused_moe()
-            and current_platform.is_cuda()
-            and current_platform.is_device_capability(100))
+    return (
+        envs.VLLM_USE_FLASHINFER_MOE_FP4
+        and has_flashinfer_cutlass_fused_moe()
+        and current_platform.is_cuda()
+        and current_platform.is_device_capability(100)
+    )
 
 
-def reorder_w1w3_to_w3w1(weight: torch.Tensor,
-                         scale: torch.Tensor,
-                         dim: int = -2) -> tuple[torch.Tensor, torch.Tensor]:
+def reorder_w1w3_to_w3w1(
+    weight: torch.Tensor, scale: torch.Tensor, dim: int = -2
+) -> tuple[torch.Tensor, torch.Tensor]:
     """Re-order the concatenated `[w1, w3]` tensors to `[w3, w1]`"""
     size = weight.size(dim)
     assert size % 2 == 0, f"Expected even size in dim {dim}, got {size}"
@@ -42,18 +49,21 @@ def reorder_w1w3_to_w3w1(weight: torch.Tensor,
     w1, w3 = weight.split(half, dim=dim)
     s1, s3 = scale.split(half, dim=dim)
 
-    return (torch.cat([w3, w1],
-                      dim=dim).contiguous(), torch.cat([s3, s1],
-                                                       dim=dim).contiguous())
+    return (
+        torch.cat([w3, w1], dim=dim).contiguous(),
+        torch.cat([s3, s1], dim=dim).contiguous(),
+    )
 
 
 def build_flashinfer_fp4_cutlass_moe_prepare_finalize(
-        moe: FusedMoEConfig) -> mk.FusedMoEPrepareAndFinalize:
+    moe: FusedMoEConfig,
+) -> mk.FusedMoEPrepareAndFinalize:
     """Create a FlashInfer CUTLASS fused-MoE prepare finalize kernel"""
     use_dp = moe.moe_parallel_config.dp_size > 1
     enable_alltoallv = envs.VLLM_ALL2ALL_BACKEND == "flashinfer_all2allv"
     return create_flashinfer_prepare_finalize(
-        use_dp=use_dp, use_nvfp4=True, enable_alltoallv=enable_alltoallv)
+        use_dp=use_dp, use_nvfp4=True, enable_alltoallv=enable_alltoallv
+    )
 
 
 def select_nvfp4_gemm_impl(
@@ -76,4 +86,5 @@ def select_nvfp4_gemm_impl(
     # native cutlass experts currently don't support DP; TP case won't call this
     raise ValueError(
         "CutlassExpertsFp4 doesn't support DP. Use flashinfer CUTLASS "
-        "Fused MoE backend instead (set VLLM_USE_FLASHINFER_MOE_FP4=1)")
+        "Fused MoE backend instead (set VLLM_USE_FLASHINFER_MOE_FP4=1)"
+    )
diff --git a/vllm/model_executor/layers/quantization/utils/flashinfer_utils.py b/vllm/model_executor/layers/quantization/utils/flashinfer_utils.py
index b779a5355b67..7f32ef00647c 100644
--- a/vllm/model_executor/layers/quantization/utils/flashinfer_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/flashinfer_utils.py
@@ -8,12 +8,16 @@
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm import envs
 from vllm.logger import init_logger
-from vllm.model_executor.layers.fused_moe.config import (FusedMoEConfig,
-                                                         FusedMoEQuantConfig)
+from vllm.model_executor.layers.fused_moe.config import (
+    FusedMoEConfig,
+    FusedMoEQuantConfig,
+)
 from vllm.model_executor.layers.fused_moe.flashinfer_cutlass_moe import (
-    FlashInferExperts)
+    FlashInferExperts,
+)
 from vllm.model_executor.layers.fused_moe.flashinfer_cutlass_prepare_finalize import (  # noqa: E501
-    create_flashinfer_prepare_finalize)
+    create_flashinfer_prepare_finalize,
+)
 
 logger = init_logger(__name__)
 
@@ -24,7 +28,6 @@ class FlashinferMoeBackend(Enum):
 
 
 def calculate_tile_tokens_dim(num_tokens, top_k, num_experts):
-
     # FlashInfer 0.2.10 has issues with larger tile sizes. Set to 8 for now.
     # TODO: Revert this to dynamic calculation once a new version of FlashInfer
     # with the necessary kernels is released.
@@ -44,13 +47,16 @@ def calculate_tile_tokens_dim(num_tokens, top_k, num_experts):
 
 
 def swap_w13_to_w31(x: torch.Tensor) -> torch.Tensor:
-    return x.reshape(-1, 2, x.shape[-2] // 2,
-                     x.shape[-1]).flip(dims=[1]).reshape(x.shape)
+    return (
+        x.reshape(-1, 2, x.shape[-2] // 2, x.shape[-1]).flip(dims=[1]).reshape(x.shape)
+    )
 
 
-def rotate_flashinfer_fp8_moe_weights(gemm1_weights: torch.Tensor,
-                                      gemm2_weights: torch.Tensor):
+def rotate_flashinfer_fp8_moe_weights(
+    gemm1_weights: torch.Tensor, gemm2_weights: torch.Tensor
+):
     from flashinfer import reorder_rows_for_gated_act_gemm, shuffle_matrix_a
+
     epilogue_tile_m = 128
     num_experts = gemm1_weights.shape[0]
     hidden_size = gemm1_weights.shape[-1]
@@ -60,13 +66,13 @@ def rotate_flashinfer_fp8_moe_weights(gemm1_weights: torch.Tensor,
     gemm1_weights_fp8_interleaved = []
     for i in range(num_experts):
         gemm1_weights_fp8_interleaved.append(
-            reorder_rows_for_gated_act_gemm(gemm1_weights[i]))
+            reorder_rows_for_gated_act_gemm(gemm1_weights[i])
+        )
 
     # Stack weights and scales for all experts
-    gemm1_weights_fp8_interleaved = torch.stack(
-        gemm1_weights_fp8_interleaved).reshape(num_experts,
-                                               2 * intermediate_size,
-                                               hidden_size)
+    gemm1_weights_fp8_interleaved = torch.stack(gemm1_weights_fp8_interleaved).reshape(
+        num_experts, 2 * intermediate_size, hidden_size
+    )
 
     # Shuffle weights and scaling factors for transposed mma output
     gemm1_weights_fp8_shuffled = []
@@ -74,18 +80,21 @@ def rotate_flashinfer_fp8_moe_weights(gemm1_weights: torch.Tensor,
     for i in range(num_experts):
         gemm1_weights_fp8_shuffled.append(
             shuffle_matrix_a(
-                gemm1_weights_fp8_interleaved[i].view(torch.uint8),
-                epilogue_tile_m))
+                gemm1_weights_fp8_interleaved[i].view(torch.uint8), epilogue_tile_m
+            )
+        )
 
         gemm2_weights_fp8_shuffled.append(
-            shuffle_matrix_a(gemm2_weights[i].view(torch.uint8),
-                             epilogue_tile_m))
+            shuffle_matrix_a(gemm2_weights[i].view(torch.uint8), epilogue_tile_m)
+        )
 
     # Stack weights for all experts
     gemm1_weights.data = torch.stack(gemm1_weights_fp8_shuffled).view(
-        torch.float8_e4m3fn)
+        torch.float8_e4m3fn
+    )
     gemm2_weights.data = torch.stack(gemm2_weights_fp8_shuffled).view(
-        torch.float8_e4m3fn)
+        torch.float8_e4m3fn
+    )
 
 
 def apply_flashinfer_per_tensor_scale_fp8(
@@ -102,16 +111,22 @@ def apply_flashinfer_per_tensor_scale_fp8(
     from flashinfer.fused_moe import RoutingMethodType
 
     import vllm.model_executor.layers.fused_moe.flashinfer_trtllm_moe  # noqa: E501, F401
+
     assert layer.output1_scales_scalar is not None, (
-        "Expected output1_scales_scalar to be initialized")
+        "Expected output1_scales_scalar to be initialized"
+    )
     assert layer.output1_scales_scalar is not None, (
-        "Expected output1_scales_gate_scalar to be initialized")
+        "Expected output1_scales_gate_scalar to be initialized"
+    )
     assert layer.output1_scales_scalar is not None, (
-        "Expected output2_scales_scalar to be initialized")
+        "Expected output2_scales_scalar to be initialized"
+    )
 
     from vllm.model_executor.models.llama4 import Llama4MoE
-    assert layer.custom_routing_function == Llama4MoE.custom_routing_function, \
+
+    assert layer.custom_routing_function == Llama4MoE.custom_routing_function, (
         "FusedMoE flashinfer kernels are only supported for Llama4"
+    )
     return torch.ops.vllm.flashinfer_fused_moe_per_tensor_scale_fp8(
         routing_logits=router_logits,
         routing_bias=routing_bias,
@@ -140,37 +155,39 @@ def get_moe_scaling_factors(
     activation_scale: torch.Tensor,
     gemm2_weights_scale: torch.Tensor,
 ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
-    output1_scales_scalar = gemm1_weights_scale * input_scale * (
-        1.0 / activation_scale)
+    output1_scales_scalar = gemm1_weights_scale * input_scale * (1.0 / activation_scale)
     output1_scales_gate_scalar = gemm1_weights_scale * input_scale
     output2_scales_scalar = activation_scale * gemm2_weights_scale
 
-    return output1_scales_scalar, output1_scales_gate_scalar, \
-        output2_scales_scalar
+    return output1_scales_scalar, output1_scales_gate_scalar, output2_scales_scalar
 
 
 def register_moe_scaling_factors(layer: torch.nn.Module) -> None:
-    output1_scales, output1_gate_scales, output2_scales = \
-        get_moe_scaling_factors(
-            layer.w13_input_scale, layer.w13_weight_scale,
-            layer.w2_input_scale, layer.w2_weight_scale
-        )
+    output1_scales, output1_gate_scales, output2_scales = get_moe_scaling_factors(
+        layer.w13_input_scale,
+        layer.w13_weight_scale,
+        layer.w2_input_scale,
+        layer.w2_weight_scale,
+    )
     layer.register_parameter(
-        'output1_scales_scalar',
-        torch.nn.Parameter(output1_scales, requires_grad=False))
+        "output1_scales_scalar", torch.nn.Parameter(output1_scales, requires_grad=False)
+    )
     layer.register_parameter(
-        'output1_scales_gate_scalar',
-        torch.nn.Parameter(output1_gate_scales, requires_grad=False))
+        "output1_scales_gate_scalar",
+        torch.nn.Parameter(output1_gate_scales, requires_grad=False),
+    )
     layer.register_parameter(
-        'output2_scales_scalar',
-        torch.nn.Parameter(output2_scales, requires_grad=False))
+        "output2_scales_scalar", torch.nn.Parameter(output2_scales, requires_grad=False)
+    )
     layer.register_parameter(
-        'w2_input_scale_inv',
-        torch.nn.Parameter(1.0 / layer.w2_input_scale, requires_grad=False))
+        "w2_input_scale_inv",
+        torch.nn.Parameter(1.0 / layer.w2_input_scale, requires_grad=False),
+    )
 
 
 def build_flashinfer_fp8_cutlass_moe_prepare_finalize(
-    moe: Optional[FusedMoEConfig], ) -> mk.FusedMoEPrepareAndFinalize:
+    moe: Optional[FusedMoEConfig],
+) -> mk.FusedMoEPrepareAndFinalize:
     """Create a FlashInfer CUTLASS fused-MoE prepare finalize kernel"""
     use_dp = moe.moe_parallel_config.dp_size > 1 if moe is not None else False
     return create_flashinfer_prepare_finalize(use_dp)
@@ -193,8 +210,7 @@ def select_cutlass_fp8_gemm_impl(
             tp_size=moe.moe_parallel_config.tp_size,
         )
 
-    assert out_dtype is not None, (
-        "If moe config is None, out_dtype must be passed")
+    assert out_dtype is not None, "If moe config is None, out_dtype must be passed"
     return FlashInferExperts(
         out_dtype=out_dtype,
         quant_config=quant_config,
@@ -217,9 +233,10 @@ def flashinfer_cutlass_moe_fp8(
 
     fused_experts = mk.FusedMoEModularKernel(
         build_flashinfer_fp8_cutlass_moe_prepare_finalize(moe=None),
-        select_cutlass_fp8_gemm_impl(moe=None,
-                                     quant_config=quant_config,
-                                     out_dtype=hidden_states.dtype))
+        select_cutlass_fp8_gemm_impl(
+            moe=None, quant_config=quant_config, out_dtype=hidden_states.dtype
+        ),
+    )
 
     return fused_experts(
         hidden_states,
@@ -245,4 +262,5 @@ def get_flashinfer_moe_backend() -> FlashinferMoeBackend:
     allowed_backends = ["throughput", "latency"]
     raise ValueError(
         f"Unknown flashinfer moe backend: {flashinfer_moe_backend}"
-        f" expected one of {allowed_backends}")
+        f" expected one of {allowed_backends}"
+    )
diff --git a/vllm/model_executor/layers/quantization/utils/fp8_utils.py b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
index 13bb69190eae..16ede6113a94 100644
--- a/vllm/model_executor/layers/quantization/utils/fp8_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/fp8_utils.py
@@ -15,18 +15,26 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.input_quant_fp8 import QuantFP8
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape, group_broadcast)
+    GroupShape,
+    group_broadcast,
+)
 from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-    CUTLASS_BLOCK_FP8_SUPPORTED)
-from vllm.model_executor.parameter import (BlockQuantScaleParameter,
-                                           ChannelQuantScaleParameter,
-                                           PerTensorScaleParameter)
+    CUTLASS_BLOCK_FP8_SUPPORTED,
+)
+from vllm.model_executor.parameter import (
+    BlockQuantScaleParameter,
+    ChannelQuantScaleParameter,
+    PerTensorScaleParameter,
+)
 from vllm.platforms import current_platform
 from vllm.triton_utils import tl, triton
 from vllm.utils import direct_register_custom_op
-from vllm.utils.deep_gemm import (fp8_gemm_nt, is_deep_gemm_e8m0_used,
-                                  is_deep_gemm_supported,
-                                  should_use_deepgemm_for_fp8_linear)
+from vllm.utils.deep_gemm import (
+    fp8_gemm_nt,
+    is_deep_gemm_e8m0_used,
+    is_deep_gemm_supported,
+    should_use_deepgemm_for_fp8_linear,
+)
 
 logger = init_logger(__name__)
 
@@ -56,7 +64,8 @@ def cutlass_scaled_mm(
         out_dtype=output_dtype,
         scale_a=As,
         # SM90 block FP8 requires row-major scale_b, which we do ahead of time
-        scale_b=Bs if block_size is not None and is_hopper else Bs.T)
+        scale_b=Bs if block_size is not None and is_hopper else Bs.T,
+    )
 
 
 def rocm_aiter_gemm_w8a8_blockscale_impl(
@@ -80,7 +89,6 @@ def rocm_aiter_gemm_w8a8_blockscale_fake(
     block_size: list[int],
     output_dtype: torch.dtype = torch.float16,
 ) -> torch.Tensor:
-
     m = A.shape[0]
     n = B.shape[0]
     Y = torch.empty(m, n, dtype=output_dtype, device=A.device)
@@ -93,9 +101,11 @@ def rocm_aiter_gemm_w8a8_blockscale_fake(
         op_func=rocm_aiter_gemm_w8a8_blockscale_impl,
         fake_impl=rocm_aiter_gemm_w8a8_blockscale_fake,
     )
-    if (envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_LINEAR
-            and current_platform.is_fp8_fnuz()):
-
+    if (
+        envs.VLLM_ROCM_USE_AITER
+        and envs.VLLM_ROCM_USE_AITER_LINEAR
+        and current_platform.is_fp8_fnuz()
+    ):
         import aiter as rocm_aiter
         from aiter import get_hip_quant
 
@@ -113,8 +123,9 @@ def _w8a8_triton_block_scaled_mm_func(
     block_size: list[int],
     output_dtype: torch.dtype,
 ) -> torch.Tensor:
-    return w8a8_triton_block_scaled_mm(qx, weight, x_scale, weight_scale,
-                                       block_size, output_dtype)
+    return w8a8_triton_block_scaled_mm(
+        qx, weight, x_scale, weight_scale, block_size, output_dtype
+    )
 
 
 def _w8a8_triton_block_scaled_mm_fake(
@@ -125,9 +136,9 @@ def _w8a8_triton_block_scaled_mm_fake(
     block_size: list[int],
     output_dtype: torch.dtype,
 ) -> torch.Tensor:
-    return torch.empty((qx.size(0), weight.size(0)),
-                       dtype=output_dtype,
-                       device=qx.device)
+    return torch.empty(
+        (qx.size(0), weight.size(0)), dtype=output_dtype, device=qx.device
+    )
 
 
 direct_register_custom_op(
@@ -147,22 +158,24 @@ def _padded_cutlass(
 ) -> torch.Tensor:
     pad_multiple = 4
     dim = qx.shape[0]
-    padded = dim if dim % pad_multiple == 0 else dim + pad_multiple - (
-        dim % pad_multiple)
+    padded = (
+        dim if dim % pad_multiple == 0 else dim + pad_multiple - (dim % pad_multiple)
+    )
 
     padded_shape = [padded, *qx.shape[1:]]
     padded_qx = torch.zeros(padded_shape, device=qx.device, dtype=qx.dtype)
-    padded_qx[0:qx.shape[0], ...].copy_(qx)
+    padded_qx[0 : qx.shape[0], ...].copy_(qx)
 
     padded_x_scale_shape = [*x_scale.shape[1:], padded]
-    padded_x_scale = torch.ones(padded_x_scale_shape,
-                                device=x_scale.device,
-                                dtype=x_scale.dtype).permute(-1, -2)
-    padded_x_scale[0:x_scale.shape[0], ...].copy_(x_scale)
+    padded_x_scale = torch.ones(
+        padded_x_scale_shape, device=x_scale.device, dtype=x_scale.dtype
+    ).permute(-1, -2)
+    padded_x_scale[0 : x_scale.shape[0], ...].copy_(x_scale)
 
-    output = cutlass_scaled_mm(padded_qx, weight, padded_x_scale, weight_scale,
-                               block_size, output_dtype, True)
-    return output[0:qx.shape[0], ...]
+    output = cutlass_scaled_mm(
+        padded_qx, weight, padded_x_scale, weight_scale, block_size, output_dtype, True
+    )
+    return output[0 : qx.shape[0], ...]
 
 
 def _padded_cutlass_fake(
@@ -173,9 +186,9 @@ def _padded_cutlass_fake(
     block_size: list[int],
     output_dtype: torch.dtype,
 ) -> torch.Tensor:
-    return torch.empty((qx.size(0), weight.size(0)),
-                       dtype=output_dtype,
-                       device=qx.device)
+    return torch.empty(
+        (qx.size(0), weight.size(0)), dtype=output_dtype, device=qx.device
+    )
 
 
 direct_register_custom_op(
@@ -185,18 +198,30 @@ def _padded_cutlass_fake(
 )
 
 
-def _fp8_gemm_nt_op(q_input: torch.Tensor, input_scale: torch.Tensor,
-                    weight: torch.Tensor, weight_scale: torch.Tensor,
-                    output: torch.Tensor, use_deep_gemm_e8m0: bool) -> None:
-    fp8_gemm_nt((q_input, input_scale), (weight, weight_scale),
-                output,
-                is_deep_gemm_e8m0_used=use_deep_gemm_e8m0)
+def _fp8_gemm_nt_op(
+    q_input: torch.Tensor,
+    input_scale: torch.Tensor,
+    weight: torch.Tensor,
+    weight_scale: torch.Tensor,
+    output: torch.Tensor,
+    use_deep_gemm_e8m0: bool,
+) -> None:
+    fp8_gemm_nt(
+        (q_input, input_scale),
+        (weight, weight_scale),
+        output,
+        is_deep_gemm_e8m0_used=use_deep_gemm_e8m0,
+    )
 
 
-def _fp8_gemm_nt_op_fake(q_input: torch.Tensor, input_scale: torch.Tensor,
-                         weight: torch.Tensor, weight_scale: torch.Tensor,
-                         output: torch.Tensor,
-                         use_deep_gemm_e8m0: bool) -> None:
+def _fp8_gemm_nt_op_fake(
+    q_input: torch.Tensor,
+    input_scale: torch.Tensor,
+    weight: torch.Tensor,
+    weight_scale: torch.Tensor,
+    output: torch.Tensor,
+    use_deep_gemm_e8m0: bool,
+) -> None:
     return None
 
 
@@ -233,15 +258,21 @@ def __init__(
         # We can't use _dispatch_w8a8_blockscale_op to figure out if we want
         # to use deepgemm because we don't know the shape of weights (and
         # whether deepgemm supports it) at the init time.
-        self.w8a8_blockscale_op, self.input_quant_op = \
-         self._dispatch_w8a8_blockscale_op(
-            cutlass_block_fp8_supported, use_aiter_and_is_supported)
-        self.deepgemm_input_quant_op = (QuantFP8(
-            False,
-            self.act_quant_group_shape,
-            column_major_scales=True,
-            use_ue8m0=self.use_deep_gemm_e8m0) if self.is_deep_gemm_supported
-                                        else None)
+        self.w8a8_blockscale_op, self.input_quant_op = (
+            self._dispatch_w8a8_blockscale_op(
+                cutlass_block_fp8_supported, use_aiter_and_is_supported
+            )
+        )
+        self.deepgemm_input_quant_op = (
+            QuantFP8(
+                False,
+                self.act_quant_group_shape,
+                column_major_scales=True,
+                use_ue8m0=self.use_deep_gemm_e8m0,
+            )
+            if self.is_deep_gemm_supported
+            else None
+        )
 
     def apply(
         self,
@@ -257,8 +288,9 @@ def apply(
         output_shape = [*input.shape[:-1], weight.shape[0]]
         output_dtype = input.dtype
 
-        if should_use_deepgemm_for_fp8_linear(output_dtype, weight,
-                                              self.is_deep_gemm_supported):
+        if should_use_deepgemm_for_fp8_linear(
+            output_dtype, weight, self.is_deep_gemm_supported
+        ):
             output = self._run_deepgemm(input_2d, weight, weight_scale)
         else:
             output = self.w8a8_blockscale_op(input_2d, weight, weight_scale)
@@ -275,12 +307,14 @@ def _run_deepgemm(
     ) -> torch.Tensor:
         assert self.deepgemm_input_quant_op is not None
         q_input, input_scale = self.deepgemm_input_quant_op(input_2d)
-        output = torch.empty((q_input.shape[0], weight.shape[0]),
-                             dtype=torch.bfloat16,
-                             device=q_input.device)
-        torch.ops.vllm.fp8_gemm_nt_op(q_input, input_scale, weight,
-                                      weight_scale, output,
-                                      self.use_deep_gemm_e8m0)
+        output = torch.empty(
+            (q_input.shape[0], weight.shape[0]),
+            dtype=torch.bfloat16,
+            device=q_input.device,
+        )
+        torch.ops.vllm.fp8_gemm_nt_op(
+            q_input, input_scale, weight, weight_scale, output, self.use_deep_gemm_e8m0
+        )
         return output
 
     def _run_cutlass(
@@ -292,15 +326,24 @@ def _run_cutlass(
         assert self.input_quant_op is not None
         q_input, input_scale = self.input_quant_op(input_2d)
         if self.is_hopper:
-            return torch.ops.vllm.padded_cutlass(q_input, weight, input_scale,
-                                                 weight_scale,
-                                                 list(self.weight_group_shape),
-                                                 input_2d.dtype)
+            return torch.ops.vllm.padded_cutlass(
+                q_input,
+                weight,
+                input_scale,
+                weight_scale,
+                list(self.weight_group_shape),
+                input_2d.dtype,
+            )
         else:
-            return cutlass_scaled_mm(q_input, weight,
-                                     input_scale, weight_scale,
-                                     list(self.weight_group_shape),
-                                     input_2d.dtype, False)
+            return cutlass_scaled_mm(
+                q_input,
+                weight,
+                input_scale,
+                weight_scale,
+                list(self.weight_group_shape),
+                input_2d.dtype,
+                False,
+            )
 
     def _run_aiter(
         self,
@@ -310,10 +353,16 @@ def _run_aiter(
     ) -> torch.Tensor:
         assert self.act_quant_group_shape == GroupShape(1, 128)
         q_input, input_scale = aiter_per1x128_quant(
-            input_2d.contiguous(), quant_dtype=rocm_aiter.dtypes.fp8)
+            input_2d.contiguous(), quant_dtype=rocm_aiter.dtypes.fp8
+        )
         return torch.ops.vllm.rocm_aiter_gemm_w8a8_blockscale(
-            q_input, weight, input_scale, weight_scale,
-            self.weight_group_shape, input_2d.dtype)
+            q_input,
+            weight,
+            input_scale,
+            weight_scale,
+            self.weight_group_shape,
+            input_2d.dtype,
+        )
 
     def _run_triton(
         self,
@@ -324,34 +373,52 @@ def _run_triton(
         assert self.input_quant_op is not None
         q_input, input_scale = self.input_quant_op(input_2d)
         return torch.ops.vllm.w8a8_triton_block_scaled_mm_func(
-            q_input, weight, input_scale, weight_scale,
-            self.weight_group_shape, input_2d.dtype)
+            q_input,
+            weight,
+            input_scale,
+            weight_scale,
+            self.weight_group_shape,
+            input_2d.dtype,
+        )
 
     def _dispatch_w8a8_blockscale_op(
         self,
         use_cutlass: bool,
         use_aiter_and_is_supported: bool,
-    ) -> tuple[Callable[[
-            torch.Tensor,
-            torch.Tensor,
+    ) -> tuple[
+        Callable[
+            [
+                torch.Tensor,
+                torch.Tensor,
+                torch.Tensor,
+            ],
             torch.Tensor,
-    ], torch.Tensor], Optional[QuantFP8]]:
+        ],
+        Optional[QuantFP8],
+    ]:
         if use_cutlass:
-            return self._run_cutlass, (QuantFP8(False,
-                                                self.act_quant_group_shape,
-                                                column_major_scales=True,
-                                                use_ue8m0=False))
+            return self._run_cutlass, (
+                QuantFP8(
+                    False,
+                    self.act_quant_group_shape,
+                    column_major_scales=True,
+                    use_ue8m0=False,
+                )
+            )
         if use_aiter_and_is_supported:
             return self._run_aiter, None
-        return self._run_triton, (QuantFP8(False,
-                                           self.act_quant_group_shape,
-                                           column_major_scales=False,
-                                           use_ue8m0=False))
+        return self._run_triton, (
+            QuantFP8(
+                False,
+                self.act_quant_group_shape,
+                column_major_scales=False,
+                use_ue8m0=False,
+            )
+        )
 
 
 def input_to_float8(
-        x: torch.Tensor,
-        dtype: Optional[torch.dtype] = None
+    x: torch.Tensor, dtype: Optional[torch.dtype] = None
 ) -> tuple[torch.Tensor, torch.Tensor]:
     """This function quantizes input values to float8 values "
     "with tensor-wise quantization."""
@@ -410,8 +477,9 @@ def _per_token_group_quant_fp8(
     row_g_id = g_id % groups_per_row
 
     # Ensure offset calculations use int64 to prevent overflow
-    y_ptr_offset = (row.to(tl.int64) * y_row_stride) + (row_g_id.to(tl.int64) *
-                                                        group_size)
+    y_ptr_offset = (row.to(tl.int64) * y_row_stride) + (
+        row_g_id.to(tl.int64) * group_size
+    )
     y_ptr += y_ptr_offset
 
     y_q_ptr_offset = g_id.to(tl.int64) * group_size
@@ -465,8 +533,9 @@ def _per_token_group_quant_fp8_colmajor(
     row_g_id = g_id % groups_per_row
 
     # Ensure offset calculations use int64 to prevent overflow
-    y_ptr_offset = (row.to(tl.int64) * y_row_stride) + (row_g_id.to(tl.int64) *
-                                                        group_size)
+    y_ptr_offset = (row.to(tl.int64) * y_row_stride) + (
+        row_g_id.to(tl.int64) * group_size
+    )
     y_ptr += y_ptr_offset
 
     y_q_ptr_offset = g_id.to(tl.int64) * group_size
@@ -478,8 +547,7 @@ def _per_token_group_quant_fp8_colmajor(
     scale_col = g_id % blocks_per_row
     scale_row = g_id // blocks_per_row
     # Ensure offset calculation uses int64 for y_s_ptr
-    y_s_ptr_offset = (scale_col.to(tl.int64) * y_s_col_stride) + scale_row.to(
-        tl.int64)
+    y_s_ptr_offset = (scale_col.to(tl.int64) * y_s_col_stride) + scale_row.to(tl.int64)
     y_s_ptr += y_s_ptr_offset
 
     cols = tl.arange(0, BLOCK)  # group_size <= BLOCK
@@ -523,9 +591,10 @@ def per_token_group_quant_fp8(
     if use_ue8m0 is None:
         use_ue8m0 = is_deep_gemm_e8m0_used()
     dtype = current_platform.fp8_dtype() if dtype is None else dtype
-    assert (x.shape[-1] % group_size == 0), (
+    assert x.shape[-1] % group_size == 0, (
         f"the last dimension of `x` {x.shape[-1]} must be divisible "
-        f"by `group_size` {group_size}")
+        f"by `group_size` {group_size}"
+    )
     assert x.stride(-1) == 1, "`x` groups must be contiguous"
 
     finfo = torch.finfo(dtype)
@@ -539,18 +608,18 @@ def per_token_group_quant_fp8(
 
     # Allocate the scale tensor in either row- or column-major format.
     if column_major_scales:
-        shape = (x.shape[-1] // group_size, ) + x.shape[:-1]
-        x_s = torch.empty(shape, device=x.device,
-                          dtype=torch.float32).permute(-1, -2)
+        shape = (x.shape[-1] // group_size,) + x.shape[:-1]
+        x_s = torch.empty(shape, device=x.device, dtype=torch.float32).permute(-1, -2)
     else:
-        shape = x.shape[:-1] + (x.shape[-1] // group_size, )
+        shape = x.shape[:-1] + (x.shape[-1] // group_size,)
         x_s = torch.empty(shape, device=x.device, dtype=torch.float32)
 
     # prefer CUDA kernel if available
     # TODO(bnell): this causes some fp8 moe test to fail.
     if current_platform.is_cuda() and x.is_contiguous():
-        torch.ops._C.per_token_group_fp8_quant(x, x_q, x_s, group_size, eps,
-                                               fp8_min, fp8_max, use_ue8m0)
+        torch.ops._C.per_token_group_fp8_quant(
+            x, x_q, x_s, group_size, eps, fp8_min, fp8_max, use_ue8m0
+        )
         return x_q, x_s
 
     # TRITON FALLBACK
@@ -561,7 +630,7 @@ def per_token_group_quant_fp8(
     num_warps = min(max(BLOCK // 256, 1), 8)
     num_stages = 1
     if column_major_scales:
-        _per_token_group_quant_fp8_colmajor[(M, )](
+        _per_token_group_quant_fp8_colmajor[(M,)](
             x,
             x_q,
             x_s,
@@ -578,7 +647,7 @@ def per_token_group_quant_fp8(
             num_stages=num_stages,
         )
     else:
-        _per_token_group_quant_fp8[(M, )](
+        _per_token_group_quant_fp8[(M,)](
             x,
             x_q,
             x_s,
@@ -656,12 +725,8 @@ def _w8a8_triton_block_scaled_mm(
 
     accumulator = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N), dtype=tl.float32)
     for k in range(0, tl.cdiv(K, BLOCK_SIZE_K)):
-        a = tl.load(a_ptrs,
-                    mask=offs_k[None, :] < K - k * BLOCK_SIZE_K,
-                    other=0.0)
-        b = tl.load(b_ptrs,
-                    mask=offs_k[:, None] < K - k * BLOCK_SIZE_K,
-                    other=0.0)
+        a = tl.load(a_ptrs, mask=offs_k[None, :] < K - k * BLOCK_SIZE_K, other=0.0)
+        b = tl.load(b_ptrs, mask=offs_k[:, None] < K - k * BLOCK_SIZE_K, other=0.0)
 
         k_start = k * BLOCK_SIZE_K
         offs_ks = k_start // group_k
@@ -687,8 +752,9 @@ def _w8a8_triton_block_scaled_mm(
 
 
 @functools.lru_cache
-def get_w8a8_block_fp8_configs(N: int, K: int, block_n: int,
-                               block_k: int) -> Optional[dict[int, Any]]:
+def get_w8a8_block_fp8_configs(
+    N: int, K: int, block_n: int, block_k: int
+) -> Optional[dict[int, Any]]:
     """
     Return optimized configurations for the w8a8 block fp8 kernel.
     The return value will be a dictionary that maps an irregular grid of
@@ -703,7 +769,8 @@ def get_w8a8_block_fp8_configs(N: int, K: int, block_n: int,
     json_file_name = f"N={N},K={K},device_name={device_name},dtype=fp8_w8a8,block_shape=[{block_n},{block_k}].json"  # noqa: E501
 
     config_file_path = os.path.join(
-        os.path.dirname(os.path.realpath(__file__)), "configs", json_file_name)
+        os.path.dirname(os.path.realpath(__file__)), "configs", json_file_name
+    )
     if os.path.exists(config_file_path):
         with open(config_file_path) as f:
             logger.info(
@@ -759,7 +826,7 @@ def w8a8_triton_block_scaled_mm(
     assert triton.cdiv(N, block_n) == Bs.shape[0]
     assert triton.cdiv(K, block_k) == Bs.shape[1]
 
-    C_shape = A.shape[:-1] + (N, )
+    C_shape = A.shape[:-1] + (N,)
     C = A.new_empty(C_shape, dtype=output_dtype)
 
     configs = get_w8a8_block_fp8_configs(N, K, block_size[0], block_size[1])
@@ -780,8 +847,9 @@ def w8a8_triton_block_scaled_mm(
         }
 
     def grid(META):
-        return (triton.cdiv(M, META["BLOCK_SIZE_M"]) *
-                triton.cdiv(N, META["BLOCK_SIZE_N"]), )
+        return (
+            triton.cdiv(M, META["BLOCK_SIZE_M"]) * triton.cdiv(N, META["BLOCK_SIZE_N"]),
+        )
 
     _w8a8_triton_block_scaled_mm[grid](
         A,
@@ -811,9 +879,9 @@ def grid(META):
 
 
 def requant_weight_ue8m0_inplace(
-        weight: torch.Tensor,
-        weight_scale: torch.Tensor,
-        block_size: Sequence[int] = (128, 128),
+    weight: torch.Tensor,
+    weight_scale: torch.Tensor,
+    block_size: Sequence[int] = (128, 128),
 ) -> None:
     """Re-quantise *weight* so that its per-block scaling factors are in the
     UE8M0 (power-of-two) format expected by the new DeepGEMM kernels inplace.
@@ -830,8 +898,9 @@ def requant_weight_ue8m0_inplace(
         return
 
     if weight.dtype != torch.float8_e4m3fn:
-        raise ValueError("Expected *weight* to be torch.float8_e4m3fn, got "
-                         f"{weight.dtype} instead.")
+        raise ValueError(
+            f"Expected *weight* to be torch.float8_e4m3fn, got {weight.dtype} instead."
+        )
 
     from vllm.utils.deep_gemm import per_block_cast_to_fp8
 
@@ -860,8 +929,9 @@ def requant_weight_ue8m0_inplace(
         s_exp = s_exp[:m_cur, :k_cur]
         w_dq = w_q.to(torch.float32) * s_exp
         # Re-quantise using power-of-two scaling (UE8M0).
-        w_requant, s_requant = per_block_cast_to_fp8(w_dq, [block_m, block_k],
-                                                     use_ue8m0=True)
+        w_requant, s_requant = per_block_cast_to_fp8(
+            w_dq, [block_m, block_k], use_ue8m0=True
+        )
 
         # Write back the results in-place.
         w_q.copy_(w_requant)
@@ -871,28 +941,39 @@ def requant_weight_ue8m0_inplace(
 def check_aiter_fp8_linear_support() -> bool:
     """AITER is only supported on ROCm and only for FP8_FNUZ
     and at the moment are MI300 series"""
-    return (current_platform.is_rocm() and envs.VLLM_ROCM_USE_AITER
-            and envs.VLLM_ROCM_USE_AITER_LINEAR
-            and current_platform.is_fp8_fnuz())
+    return (
+        current_platform.is_rocm()
+        and envs.VLLM_ROCM_USE_AITER
+        and envs.VLLM_ROCM_USE_AITER_LINEAR
+        and current_platform.is_fp8_fnuz()
+    )
 
 
 def _maybe_pad_fp8_weight(weight: torch.Tensor) -> torch.Tensor:
     """Pad the weight tensor. This is an optimization on ROCm platform, which
     can benefit from tensors located far enough from one another in memory"""
-    if (envs.VLLM_ROCM_FP8_PADDING and current_platform.is_rocm()
-            and weight.stride(-1) == 1
-            and (weight.stride(-2) * weight.element_size()) % 512 == 0):
+    if (
+        envs.VLLM_ROCM_FP8_PADDING
+        and current_platform.is_rocm()
+        and weight.stride(-1) == 1
+        and (weight.stride(-2) * weight.element_size()) % 512 == 0
+    ):
         num_pad = 256 // weight.element_size()
         import torch.nn.functional as F
+
         weight = F.pad(weight, (0, num_pad), "constant", 0)[..., :-num_pad]
         torch.cuda.empty_cache()
     return weight
 
 
-def validate_fp8_block_shape(layer: torch.nn.Module, input_size: int,
-                             output_size: int, input_size_per_partition: int,
-                             output_partition_sizes: list[int],
-                             block_size: list[int]) -> None:
+def validate_fp8_block_shape(
+    layer: torch.nn.Module,
+    input_size: int,
+    output_size: int,
+    input_size_per_partition: int,
+    output_partition_sizes: list[int],
+    block_size: list[int],
+) -> None:
     """Validate block quantization shapes for tensor parallelism."""
     from vllm.distributed import get_tensor_model_parallel_world_size
 
@@ -900,15 +981,18 @@ def validate_fp8_block_shape(layer: torch.nn.Module, input_size: int,
     block_n, block_k = block_size[0], block_size[1]
 
     # Required by row parallel
-    if (tp_size > 1 and input_size // input_size_per_partition == tp_size
-            and input_size_per_partition % block_k != 0):
+    if (
+        tp_size > 1
+        and input_size // input_size_per_partition == tp_size
+        and input_size_per_partition % block_k != 0
+    ):
         raise ValueError(
             f"Weight input_size_per_partition = {input_size_per_partition} "
-            f"is not divisible by weight quantization block_k = {block_k}.")
+            f"is not divisible by weight quantization block_k = {block_k}."
+        )
 
     # Required by column parallel or enabling merged weights
-    is_tp_split = (tp_size > 1
-                   and output_size // sum(output_partition_sizes) == tp_size)
+    is_tp_split = tp_size > 1 and output_size // sum(output_partition_sizes) == tp_size
     is_merged_gemm = len(output_partition_sizes) > 1
     if is_tp_split or is_merged_gemm:
         sizes_to_check = output_partition_sizes
@@ -921,33 +1005,44 @@ def validate_fp8_block_shape(layer: torch.nn.Module, input_size: int,
                 raise ValueError(
                     f"Weight output_partition_size = "
                     f"{output_partition_size} is not divisible by "
-                    f"weight quantization block_n = {block_n}.")
+                    f"weight quantization block_n = {block_n}."
+                )
 
 
 def create_fp8_weight_parameter(
-        output_size_per_partition: int, input_size_per_partition: int,
-        weight_loader: Optional[Callable]) -> torch.nn.Parameter:
+    output_size_per_partition: int,
+    input_size_per_partition: int,
+    weight_loader: Optional[Callable],
+) -> torch.nn.Parameter:
     """Create FP8 weight parameter."""
     from vllm.model_executor.parameter import ModelWeightParameter
 
-    return ModelWeightParameter(data=torch.empty(output_size_per_partition,
-                                                 input_size_per_partition,
-                                                 dtype=torch.float8_e4m3fn),
-                                input_dim=1,
-                                output_dim=0,
-                                weight_loader=weight_loader)
+    return ModelWeightParameter(
+        data=torch.empty(
+            output_size_per_partition,
+            input_size_per_partition,
+            dtype=torch.float8_e4m3fn,
+        ),
+        input_dim=1,
+        output_dim=0,
+        weight_loader=weight_loader,
+    )
 
 
 def create_fp8_scale_parameter(
-        parameter_type: torch.nn.Parameter, output_partition_sizes: list[int],
-        input_size_per_partition: int, block_size: Optional[list[int]],
-        weight_loader: Optional[Callable]) -> torch.nn.Parameter:
+    parameter_type: torch.nn.Parameter,
+    output_partition_sizes: list[int],
+    input_size_per_partition: int,
+    block_size: Optional[list[int]],
+    weight_loader: Optional[Callable],
+) -> torch.nn.Parameter:
     """Create scale parameter based on quantization strategy."""
     if parameter_type == ChannelQuantScaleParameter:
-        scale = parameter_type(data=torch.empty(
-            (sum(output_partition_sizes), 1), dtype=torch.float32),
-                               output_dim=0,
-                               weight_loader=weight_loader)
+        scale = parameter_type(
+            data=torch.empty((sum(output_partition_sizes), 1), dtype=torch.float32),
+            output_dim=0,
+            weight_loader=weight_loader,
+        )
     elif parameter_type == BlockQuantScaleParameter:
         assert block_size is not None
         block_n, block_k = block_size[0], block_size[1]
@@ -963,9 +1058,10 @@ def create_fp8_scale_parameter(
             weight_loader=weight_loader,
         )
     elif parameter_type == PerTensorScaleParameter:
-        scale = parameter_type(data=torch.empty(len(output_partition_sizes),
-                                                dtype=torch.float32),
-                               weight_loader=weight_loader)
+        scale = parameter_type(
+            data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
+            weight_loader=weight_loader,
+        )
     else:
         raise ValueError(f"Unknown parameter type: {parameter_type}")
 
@@ -974,14 +1070,15 @@ def create_fp8_scale_parameter(
 
 
 def create_fp8_input_scale(
-        output_partition_sizes: list[int],
-        weight_loader: Optional[Callable]) -> torch.nn.Parameter:
+    output_partition_sizes: list[int], weight_loader: Optional[Callable]
+) -> torch.nn.Parameter:
     """Create input scale parameter for static activation quantization."""
     from vllm.model_executor.parameter import PerTensorScaleParameter
 
-    scale = PerTensorScaleParameter(data=torch.empty(
-        len(output_partition_sizes), dtype=torch.float32),
-                                    weight_loader=weight_loader)
+    scale = PerTensorScaleParameter(
+        data=torch.empty(len(output_partition_sizes), dtype=torch.float32),
+        weight_loader=weight_loader,
+    )
     scale[:] = torch.finfo(torch.float32).min
     return scale
 
@@ -990,15 +1087,18 @@ def process_fp8_weight_tensor_strategy(
     weight: torch.Tensor,
     weight_scale: torch.Tensor,
     logical_widths: list[int],
-    input_scale: Optional[torch.Tensor] = None
+    input_scale: Optional[torch.Tensor] = None,
 ) -> tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor]]:
     """Process weights for tensor-wise quantization strategy."""
     from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-        normalize_e4m3fn_to_e4m3fnuz, requantize_with_max_scale)
+        normalize_e4m3fn_to_e4m3fnuz,
+        requantize_with_max_scale,
+    )
 
     if current_platform.is_fp8_fnuz():
         weight, weight_scale, input_scale = normalize_e4m3fn_to_e4m3fnuz(
-            weight=weight, weight_scale=weight_scale, input_scale=input_scale)
+            weight=weight, weight_scale=weight_scale, input_scale=input_scale
+        )
 
     # Requantize with max scale
     weight_scale, weight = requantize_with_max_scale(
@@ -1014,15 +1114,17 @@ def process_fp8_weight_tensor_strategy(
 def process_fp8_weight_channel_strategy(
     weight: torch.Tensor,
     weight_scale: torch.Tensor,
-    input_scale: Optional[torch.Tensor] = None
+    input_scale: Optional[torch.Tensor] = None,
 ) -> tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor]]:
     """Process weights for channel-wise quantization strategy."""
     from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-        normalize_e4m3fn_to_e4m3fnuz)
+        normalize_e4m3fn_to_e4m3fnuz,
+    )
 
     if current_platform.is_fp8_fnuz():
         weight, weight_scale, input_scale = normalize_e4m3fn_to_e4m3fnuz(
-            weight=weight, weight_scale=weight_scale, input_scale=input_scale)
+            weight=weight, weight_scale=weight_scale, input_scale=input_scale
+        )
 
     return weight, weight_scale, input_scale
 
@@ -1033,37 +1135,48 @@ def process_fp8_weight_block_strategy(
 ) -> tuple[torch.Tensor, torch.Tensor]:
     """Process weights for block-wise quantization strategy."""
     from vllm.model_executor.layers.quantization.utils.w8a8_utils import (
-        normalize_e4m3fn_to_e4m3fnuz)
+        normalize_e4m3fn_to_e4m3fnuz,
+    )
 
     if current_platform.is_fp8_fnuz():
         weight, weight_scale, _ = normalize_e4m3fn_to_e4m3fnuz(
-            weight=weight, weight_scale=weight_scale)
+            weight=weight, weight_scale=weight_scale
+        )
 
     weight = _maybe_pad_fp8_weight(weight)
     return weight, weight_scale
 
 
-def maybe_post_process_fp8_weight_block(layer: torch.nn.Module,
-                                        cutlass_block_fp8_supported: bool):
+def maybe_post_process_fp8_weight_block(
+    layer: torch.nn.Module, cutlass_block_fp8_supported: bool
+):
     assert layer.weight_block_size is not None
 
-    from vllm.utils.deep_gemm import (is_deep_gemm_e8m0_used,
-                                      should_use_deepgemm_for_fp8_linear)
+    from vllm.utils.deep_gemm import (
+        is_deep_gemm_e8m0_used,
+        should_use_deepgemm_for_fp8_linear,
+    )
 
     # On Blackwell or Hopper, if E8M0 for DeepGemm is used, we need to
     # requantize the weight and input to the specific scale
     # at the same time.
     should_use_deepgemm = should_use_deepgemm_for_fp8_linear(
-        layer.orig_dtype, layer.weight)
+        layer.orig_dtype, layer.weight
+    )
     if is_deep_gemm_e8m0_used() and should_use_deepgemm:
         block_sz = tuple(layer.weight_block_size)
-        requant_weight_ue8m0_inplace(layer.weight.data,
-                                     layer.weight_scale.data, block_sz)
+        requant_weight_ue8m0_inplace(
+            layer.weight.data, layer.weight_scale.data, block_sz
+        )
     # SM90 Block FP8 CUTLASS requires row-major weight scales
-    elif (current_platform.is_device_capability(90)
-          and cutlass_block_fp8_supported and not should_use_deepgemm):
+    elif (
+        current_platform.is_device_capability(90)
+        and cutlass_block_fp8_supported
+        and not should_use_deepgemm
+    ):
         layer.weight_scale = torch.nn.Parameter(
-            layer.weight_scale.data.T.contiguous(), requires_grad=False)
+            layer.weight_scale.data.T.contiguous(), requires_grad=False
+        )
 
 
 def expert_weight_is_col_major(x: torch.Tensor) -> bool:
diff --git a/vllm/model_executor/layers/quantization/utils/gptq_utils.py b/vllm/model_executor/layers/quantization/utils/gptq_utils.py
index fd76af230620..6209dda955ce 100644
--- a/vllm/model_executor/layers/quantization/utils/gptq_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/gptq_utils.py
@@ -9,10 +9,11 @@
 import regex as re
 import torch
 
-from vllm.model_executor.layers.linear import (LinearBase,
-                                               UnquantizedLinearMethod)
+from vllm.model_executor.layers.linear import LinearBase, UnquantizedLinearMethod
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, UnquantizedEmbeddingMethod)
+    ParallelLMHead,
+    UnquantizedEmbeddingMethod,
+)
 
 if TYPE_CHECKING:
     from ..gptq import GPTQConfig
@@ -25,16 +26,13 @@
 # Match dynamic rules with module name (prefix) and override quantize
 # config if module (prefix) matches a rule
 def override_config(config: Union[GPTQConfig, GPTQMarlinConfig], prefix: str):
-    weight_bits = get_dynamic_override(config, prefix, "bits",
-                                       config.weight_bits)
+    weight_bits = get_dynamic_override(config, prefix, "bits", config.weight_bits)
     if isinstance(weight_bits, int):
         config.weight_bits = weight_bits
-    group_size = get_dynamic_override(config, prefix, "group_size",
-                                      config.group_size)
+    group_size = get_dynamic_override(config, prefix, "group_size", config.group_size)
     if isinstance(group_size, int):
         config.group_size = group_size
-    desc_act = get_dynamic_override(config, prefix, "desc_act",
-                                    config.desc_act)
+    desc_act = get_dynamic_override(config, prefix, "desc_act", config.desc_act)
     if isinstance(desc_act, bool):
         config.desc_act = desc_act
 
@@ -46,25 +44,27 @@ def override_config(config: Union[GPTQConfig, GPTQMarlinConfig], prefix: str):
             config.is_sym = is_sym
 
         if (config.weight_bits, config.is_sym) not in config.TYPE_MAP:
-            raise ValueError("Unsupported quantization config: "
-                             f"bits={config.weight_bits}, sym={config.is_sym}")
+            raise ValueError(
+                "Unsupported quantization config: "
+                f"bits={config.weight_bits}, sym={config.is_sym}"
+            )
 
-        config.quant_type = config.TYPE_MAP[(config.weight_bits,
-                                             config.is_sym)]
+        config.quant_type = config.TYPE_MAP[(config.weight_bits, config.is_sym)]
     elif config.get_name() == "gptq":
         assert isinstance(config, GPTQConfig)
         if config.weight_bits not in [2, 3, 4, 8]:
             raise ValueError(
                 "Currently, only 2/3/4/8-bit weight quantization is "
-                f"supported for GPTQ, but got {config.weight_bits} bits.")
+                f"supported for GPTQ, but got {config.weight_bits} bits."
+            )
 
 
 def get_dynamic_override(
     config: Union[GPTQConfig, GPTQMarlinConfig],
     layer_name: str,
     key: Optional[str] = None,
-    default_value: Union[int, bool,
-                         None] = None) -> Union[dict, int, bool, None]:
+    default_value: Union[int, bool, None] = None,
+) -> Union[dict, int, bool, None]:
     for pattern, pattern_dict in config.dynamic.items():
         # Negative match: matched modules are excluded from quantized init
         if pattern.startswith("-:"):
@@ -83,7 +83,7 @@ def get_dynamic_override(
 def is_layer_gptq_quantized(
     prefix: str,
     quantized_layers: list[str],
-    fused_mapping: Mapping[str, list[str]] = MappingProxyType({})
+    fused_mapping: Mapping[str, list[str]] = MappingProxyType({}),
 ) -> bool:
     # prefix: model.layers.0.self_attn.q_proj
     # proj_name: q_proj
@@ -106,8 +106,9 @@ def is_layer_gptq_quantized(
 
         is_quantized = None
         for shard_prefix in shard_prefixes:
-            is_shard_quantized = any(layer in shard_prefix
-                                     for layer in quantized_layers)
+            is_shard_quantized = any(
+                layer in shard_prefix for layer in quantized_layers
+            )
 
             if is_quantized is None:
                 is_quantized = is_shard_quantized
@@ -115,7 +116,8 @@ def is_layer_gptq_quantized(
                 raise ValueError(
                     f"Detected some but not all shards of {prefix} "
                     "are quantized. All shards of fused layers "
-                    "to have the same precision.")
+                    "to have the same precision."
+                )
     else:
         is_quantized = any(layer in prefix for layer in quantized_layers)
 
@@ -130,18 +132,20 @@ def get_linear_quant_method(
     linear_method_cls: type,
 ):
     cloned_config = deepcopy(config)
-    parallel_lm_head_quantized = isinstance(
-        layer, ParallelLMHead) and cloned_config.lm_head_quantized
+    parallel_lm_head_quantized = (
+        isinstance(layer, ParallelLMHead) and cloned_config.lm_head_quantized
+    )
     if isinstance(layer, LinearBase) or parallel_lm_head_quantized:
         is_layer_quantized = is_layer_gptq_quantized(
             prefix=prefix,
             quantized_layers=cloned_config.modules_in_block_to_quantize,
-            fused_mapping=cloned_config.packed_modules_mapping)
+            fused_mapping=cloned_config.packed_modules_mapping,
+        )
         # False = skip module, None = no override, else = Positive match
         if get_dynamic_override(  # noqa: E712
-                cloned_config,  # noqa: E712
-                layer_name=prefix) == False or (
-                    not is_layer_quantized):  # noqa: E712
+            cloned_config,  # noqa: E712
+            layer_name=prefix,
+        ) == False or (not is_layer_quantized):  # noqa: E712
             if parallel_lm_head_quantized:
                 return UnquantizedEmbeddingMethod()
             return UnquantizedLinearMethod()
diff --git a/vllm/model_executor/layers/quantization/utils/int8_utils.py b/vllm/model_executor/layers/quantization/utils/int8_utils.py
index 62e458ec3c93..1b8efe4332c5 100644
--- a/vllm/model_executor/layers/quantization/utils/int8_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/int8_utils.py
@@ -30,12 +30,9 @@ def apply_w8a8_block_int8_linear(
     output_shape = [*input.shape[:-1], weight.shape[0]]
 
     q_input, x_scale = per_token_group_quant_int8(input_2d, block_size[1])
-    output = w8a8_block_int8_matmul(q_input,
-                                    weight,
-                                    x_scale,
-                                    weight_scale,
-                                    block_size,
-                                    output_dtype=input.dtype)
+    output = w8a8_block_int8_matmul(
+        q_input, weight, x_scale, weight_scale, block_size, output_dtype=input.dtype
+    )
 
     if bias is not None:
         output = output + bias
@@ -43,8 +40,8 @@ def apply_w8a8_block_int8_linear(
 
 
 def input_to_int8(
-        x: torch.Tensor,
-        dtype: torch.dtype = torch.int8) -> tuple[torch.Tensor, torch.Tensor]:
+    x: torch.Tensor, dtype: torch.dtype = torch.int8
+) -> tuple[torch.Tensor, torch.Tensor]:
     """This function quantizes input values to int8 values with
     tensor-wise quantization."""
     iinfo = torch.iinfo(dtype)
@@ -78,8 +75,8 @@ def block_dequant(
     for i in range(k_tiles):
         for j in range(n_tiles):
             x_dq_block[
-                j * block_n:min((j + 1) * block_n, n),
-                i * block_k:min((i + 1) * block_k, k),
+                j * block_n : min((j + 1) * block_n, n),
+                i * block_k : min((i + 1) * block_k, k),
             ] *= x_s[j][i]
 
     return x_dq_block
@@ -91,15 +88,17 @@ def block_dequant(
     # NOTE: This can be removed when hip.libdevice.round() is available.
     @core.extern
     def round_f32(arg0, _builder=None):
-        return core.extern_elementwise("",
-                                       "", [arg0], {
-                                           (core.dtype("fp32"), ):
-                                           ("llvm.round", core.dtype("fp32")),
-                                           (core.dtype("fp64"), ):
-                                           ("llvm.round", core.dtype("fp64")),
-                                       },
-                                       is_pure=True,
-                                       _builder=_builder)
+        return core.extern_elementwise(
+            "",
+            "",
+            [arg0],
+            {
+                (core.dtype("fp32"),): ("llvm.round", core.dtype("fp32")),
+                (core.dtype("fp64"),): ("llvm.round", core.dtype("fp64")),
+            },
+            is_pure=True,
+            _builder=_builder,
+        )
 
     @triton.jit
     def round_int8(x):
@@ -127,8 +126,7 @@ def _per_token_quant_int8(
     cols = tl.arange(0, BLOCK)
     mask = cols < N
 
-    x = tl.load(x_ptr + row_id * stride_x + cols, mask=mask,
-                other=0.0).to(tl.float32)
+    x = tl.load(x_ptr + row_id * stride_x + cols, mask=mask, other=0.0).to(tl.float32)
     absmax = tl.maximum(tl.max(tl.abs(x)), 1e-10)
     scale_x = absmax / 127
     x_q = x * (127 / absmax)
@@ -142,15 +140,13 @@ def per_token_quant_int8(x):
     M = x.numel() // x.shape[-1]
     N = x.shape[-1]
     x_q = torch.empty_like(x, device=x.device, dtype=torch.int8)
-    scales = torch.empty(x.shape[:-1] + (1, ),
-                         device=x.device,
-                         dtype=torch.float32)
+    scales = torch.empty(x.shape[:-1] + (1,), device=x.device, dtype=torch.float32)
     BLOCK = triton.next_power_of_2(N)
     # heuristics for number of warps
     num_warps = min(max(BLOCK // 256, 1), 8)
 
     assert x.is_contiguous()
-    _per_token_quant_int8[(M, )](
+    _per_token_quant_int8[(M,)](
         x,
         x_q,
         scales,
@@ -229,8 +225,9 @@ def per_token_group_quant_int8(
         tuple[torch.Tensor, torch.Tensor]: The quantized tensor and the
             scaling factor for quantization.
     """
-    assert (x.shape[-1] % group_size == 0
-            ), "the last dimension of `x` cannot be divisible by `group_size`"
+    assert x.shape[-1] % group_size == 0, (
+        "the last dimension of `x` cannot be divisible by `group_size`"
+    )
     assert x.is_contiguous(), "`x` is not contiguous"
 
     iinfo = torch.iinfo(dtype)
@@ -239,15 +236,15 @@ def per_token_group_quant_int8(
 
     x_q = torch.empty_like(x, device=x.device, dtype=dtype)
     x_s = torch.empty(
-        x.shape[:-1] + (x.shape[-1] // group_size, ),
+        x.shape[:-1] + (x.shape[-1] // group_size,),
         device=x.device,
         dtype=torch.float32,
     )
     # prefer CUDA kernel if available
     if current_platform.is_cuda():
-        torch.ops._C.per_token_group_quant_int8(x, x_q, x_s, group_size, eps,
-                                                float(int8_min),
-                                                float(int8_max))
+        torch.ops._C.per_token_group_quant_int8(
+            x, x_q, x_s, group_size, eps, float(int8_min), float(int8_max)
+        )
         return x_q, x_s
 
     M = x.numel() // group_size
@@ -257,7 +254,7 @@ def per_token_group_quant_int8(
     # heuristics for number of warps
     num_warps = min(max(BLOCK // 256, 1), 8)
     num_stages = 1
-    _per_token_group_quant_int8[(M, )](
+    _per_token_group_quant_int8[(M,)](
         x,
         x_q,
         x_s,
@@ -333,20 +330,15 @@ def _w8a8_block_int8_matmul(
 
     accumulator = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N), dtype=tl.float32)
     for k in range(0, tl.cdiv(K, BLOCK_SIZE_K)):
-        a = tl.load(a_ptrs,
-                    mask=offs_k[None, :] < K - k * BLOCK_SIZE_K,
-                    other=0.0)
-        b = tl.load(b_ptrs,
-                    mask=offs_k[:, None] < K - k * BLOCK_SIZE_K,
-                    other=0.0)
+        a = tl.load(a_ptrs, mask=offs_k[None, :] < K - k * BLOCK_SIZE_K, other=0.0)
+        b = tl.load(b_ptrs, mask=offs_k[:, None] < K - k * BLOCK_SIZE_K, other=0.0)
 
         k_start = k * BLOCK_SIZE_K
         offs_ks = k_start // group_k
         a_s = tl.load(As_ptrs + offs_ks * stride_As_k)
         b_s = tl.load(Bs_ptrs + offs_ks * stride_Bs_k)
 
-        accumulator += tl.dot(a, b).to(tl.float32) * a_s[:,
-                                                         None] * b_s[None, :]
+        accumulator += tl.dot(a, b).to(tl.float32) * a_s[:, None] * b_s[None, :]
         a_ptrs += BLOCK_SIZE_K * stride_ak
         b_ptrs += BLOCK_SIZE_K * stride_bk
 
@@ -365,8 +357,9 @@ def _w8a8_block_int8_matmul(
 
 
 @functools.lru_cache
-def get_w8a8_block_int8_configs(N: int, K: int, block_n: int,
-                                block_k: int) -> Optional[dict[int, Any]]:
+def get_w8a8_block_int8_configs(
+    N: int, K: int, block_n: int, block_k: int
+) -> Optional[dict[int, Any]]:
     """
     Return optimized configurations for the w8a8 block fp8 kernel.
 
@@ -382,7 +375,8 @@ def get_w8a8_block_int8_configs(N: int, K: int, block_n: int,
     json_file_name = f"N={N},K={K},device_name={device_name},dtype=int8_w8a8,block_shape=[{block_n}, {block_k}].json"  # noqa: E501
 
     config_file_path = os.path.join(
-        os.path.dirname(os.path.realpath(__file__)), "configs", json_file_name)
+        os.path.dirname(os.path.realpath(__file__)), "configs", json_file_name
+    )
     if os.path.exists(config_file_path):
         with open(config_file_path) as f:
             logger.info(
@@ -395,8 +389,10 @@ def get_w8a8_block_int8_configs(N: int, K: int, block_n: int,
     # If no optimized configuration is available, we will use the default
     # configuration
     logger.warning(
-        ("Using default W8A8 Block INT8 kernel config. Performance might "
-         "be sub-optimal! Config file not found at %s"),
+        (
+            "Using default W8A8 Block INT8 kernel config. Performance might "
+            "be sub-optimal! Config file not found at %s"
+        ),
         config_file_path,
     )
     return None
@@ -441,7 +437,7 @@ def w8a8_block_int8_matmul(
     assert triton.cdiv(N, block_n) == Bs.shape[0]
     assert triton.cdiv(K, block_k) == Bs.shape[1]
 
-    C_shape = A.shape[:-1] + (N, )
+    C_shape = A.shape[:-1] + (N,)
     C = A.new_empty(C_shape, dtype=output_dtype)
 
     configs = get_w8a8_block_int8_configs(N, K, block_size[0], block_size[1])
@@ -462,8 +458,9 @@ def w8a8_block_int8_matmul(
         }
 
     def grid(META):
-        return (triton.cdiv(M, META["BLOCK_SIZE_M"]) *
-                triton.cdiv(N, META["BLOCK_SIZE_N"]), )
+        return (
+            triton.cdiv(M, META["BLOCK_SIZE_M"]) * triton.cdiv(N, META["BLOCK_SIZE_N"]),
+        )
 
     _w8a8_block_int8_matmul[grid](
         A,
diff --git a/vllm/model_executor/layers/quantization/utils/layer_utils.py b/vllm/model_executor/layers/quantization/utils/layer_utils.py
index fbc0f23acb59..4bf31340a2f6 100644
--- a/vllm/model_executor/layers/quantization/utils/layer_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/layer_utils.py
@@ -20,12 +20,15 @@ def update_tensor_inplace(dst: torch.Tensor, src: torch.Tensor):
 
 # Newly generated tensors need to replace existing tensors that are
 # already registered as parameters by vLLM (and won't be freed)
-def replace_parameter(mod: torch.nn.Module, name: str,
-                      new: Union[torch.Tensor, torch.nn.Parameter]) -> None:
-
+def replace_parameter(
+    mod: torch.nn.Module, name: str, new: Union[torch.Tensor, torch.nn.Parameter]
+) -> None:
     old = getattr(mod, name)
-    if type(old) is type(new) and old.dtype == new.dtype and \
-        old.untyped_storage().nbytes() == new.untyped_storage().nbytes():
+    if (
+        type(old) is type(new)
+        and old.dtype == new.dtype
+        and old.untyped_storage().nbytes() == new.untyped_storage().nbytes()
+    ):
         # If we can just update in-place to avoid re-registering
         #   can be faster if the underlying storage is the same
         update_tensor_inplace(old, new)
@@ -36,5 +39,4 @@ def replace_parameter(mod: torch.nn.Module, name: str,
         # parameters for `torch.compile` compatibility
         if not isinstance(new, torch.nn.Parameter):
             new = torch.nn.Parameter(new, requires_grad=False)
-        mod.register_parameter(name,
-                               torch.nn.Parameter(new, requires_grad=False))
+        mod.register_parameter(name, torch.nn.Parameter(new, requires_grad=False))
diff --git a/vllm/model_executor/layers/quantization/utils/machete_utils.py b/vllm/model_executor/layers/quantization/utils/machete_utils.py
index fbb850d22776..69466bdcb64c 100644
--- a/vllm/model_executor/layers/quantization/utils/machete_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/machete_utils.py
@@ -39,12 +39,19 @@ def query_machete_supported_group_sizes(act_type: torch.dtype) -> list[int]:
         return [-1, 128]
 
 
-def check_machete_supports_shape(in_features: int, out_featrues: int) \
-    -> tuple[bool, Optional[str]]:
+def check_machete_supports_shape(
+    in_features: int, out_featrues: int
+) -> tuple[bool, Optional[str]]:
     if in_features % MACHETE_PREPACKED_BLOCK_SHAPE[0] != 0:
-        return False, "Input features size must be divisible by "\
-            f"{MACHETE_PREPACKED_BLOCK_SHAPE[0]}"
+        return (
+            False,
+            "Input features size must be divisible by "
+            f"{MACHETE_PREPACKED_BLOCK_SHAPE[0]}",
+        )
     if out_featrues % MACHETE_PREPACKED_BLOCK_SHAPE[1] != 0:
-        return False, "Output features size must be divisible by "\
-            f"{MACHETE_PREPACKED_BLOCK_SHAPE[1]}"
+        return (
+            False,
+            "Output features size must be divisible by "
+            f"{MACHETE_PREPACKED_BLOCK_SHAPE[1]}",
+        )
     return True, None
diff --git a/vllm/model_executor/layers/quantization/utils/marlin_utils.py b/vllm/model_executor/layers/quantization/utils/marlin_utils.py
index 6c7604cc9d04..d2fa5af1b854 100644
--- a/vllm/model_executor/layers/quantization/utils/marlin_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/marlin_utils.py
@@ -40,8 +40,9 @@ def query_marlin_supported_quant_types(
 ):
     if device_capability is None:
         capability_tuple = current_platform.get_device_capability()
-        device_capability = (-1 if capability_tuple is None else
-                             capability_tuple.to_int())
+        device_capability = (
+            -1 if capability_tuple is None else capability_tuple.to_int()
+        )
 
     if device_capability < 80:
         return []
@@ -50,10 +51,12 @@ def query_marlin_supported_quant_types(
     # - has_zp is False: return quant_types that has not zero points
     # - has_zp is None: both
     if has_zp is None:
-        types0 = query_marlin_supported_quant_types(False, include_fp_type,
-                                                    device_capability)
-        types1 = query_marlin_supported_quant_types(True, include_fp_type,
-                                                    device_capability)
+        types0 = query_marlin_supported_quant_types(
+            False, include_fp_type, device_capability
+        )
+        types1 = query_marlin_supported_quant_types(
+            True, include_fp_type, device_capability
+        )
         return types0 + types1
 
     if has_zp:
@@ -68,108 +71,126 @@ def query_marlin_supported_quant_types(
 
 
 def _check_marlin_supported(
-        quant_type: ScalarType,
-        group_size: Optional[int],
-        has_zp: bool,
-        device_capability: Optional[int] = None) -> tuple[bool, Optional[str]]:
-
+    quant_type: ScalarType,
+    group_size: Optional[int],
+    has_zp: bool,
+    device_capability: Optional[int] = None,
+) -> tuple[bool, Optional[str]]:
     if device_capability is None:
         capability_tuple = current_platform.get_device_capability()
-        device_capability = (-1 if capability_tuple is None else
-                             capability_tuple.to_int())
+        device_capability = (
+            -1 if capability_tuple is None else capability_tuple.to_int()
+        )
 
     supported_types = query_marlin_supported_quant_types(
-        has_zp, True, device_capability)
+        has_zp, True, device_capability
+    )
 
     if quant_type not in supported_types:
-        return (False, f"Marlin does not support weight_bits = {quant_type}. "
-                f"Only types = {supported_types} "
-                f"are supported (for group_size = {group_size}, "
-                f"device_capability = {device_capability}, zp = {has_zp}).")
-    if (group_size is None or group_size not in MARLIN_SUPPORTED_GROUP_SIZES):
-        return (False, f"Marlin does not support group_size = {group_size}. "
-                f"Only group_sizes = {MARLIN_SUPPORTED_GROUP_SIZES} "
-                "are supported.")
+        return (
+            False,
+            f"Marlin does not support weight_bits = {quant_type}. "
+            f"Only types = {supported_types} "
+            f"are supported (for group_size = {group_size}, "
+            f"device_capability = {device_capability}, zp = {has_zp}).",
+        )
+    if group_size is None or group_size not in MARLIN_SUPPORTED_GROUP_SIZES:
+        return (
+            False,
+            f"Marlin does not support group_size = {group_size}. "
+            f"Only group_sizes = {MARLIN_SUPPORTED_GROUP_SIZES} "
+            "are supported.",
+        )
 
     return True, None
 
 
-def check_marlin_supported(quant_type: ScalarType,
-                           group_size: int,
-                           has_zp: bool = False,
-                           device_capability: Optional[int] = None) -> bool:
-    cond, _ = _check_marlin_supported(quant_type, group_size, has_zp,
-                                      device_capability)
+def check_marlin_supported(
+    quant_type: ScalarType,
+    group_size: int,
+    has_zp: bool = False,
+    device_capability: Optional[int] = None,
+) -> bool:
+    cond, _ = _check_marlin_supported(quant_type, group_size, has_zp, device_capability)
     return cond
 
 
-def verify_marlin_supported(quant_type: ScalarType,
-                            group_size: int,
-                            has_zp: bool = False) -> None:
+def verify_marlin_supported(
+    quant_type: ScalarType, group_size: int, has_zp: bool = False
+) -> None:
     cond, err_msg = _check_marlin_supported(quant_type, group_size, has_zp)
     if not cond:
         assert err_msg is not None
         raise ValueError(err_msg)
 
 
-def verify_marlin_supports_shape(output_size_per_partition: int,
-                                 input_size_per_partition: int,
-                                 input_size: int, group_size: int) -> None:
-
+def verify_marlin_supports_shape(
+    output_size_per_partition: int,
+    input_size_per_partition: int,
+    input_size: int,
+    group_size: int,
+) -> None:
     # Validate output_size_per_partition
     if output_size_per_partition % GPTQ_MARLIN_MIN_THREAD_N != 0:
-        raise ValueError(f"Weight output_size_per_partition = "
-                         f"{output_size_per_partition} is not divisible by "
-                         f" min_thread_n = {GPTQ_MARLIN_MIN_THREAD_N}. "
-                         "Consider reducing tensor_parallel_size or running "
-                         "with --quantization gptq.")
+        raise ValueError(
+            f"Weight output_size_per_partition = "
+            f"{output_size_per_partition} is not divisible by "
+            f" min_thread_n = {GPTQ_MARLIN_MIN_THREAD_N}. "
+            "Consider reducing tensor_parallel_size or running "
+            "with --quantization gptq."
+        )
 
     # Validate input_size_per_partition
     if input_size_per_partition % GPTQ_MARLIN_MIN_THREAD_K != 0:
-        raise ValueError(f"Weight input_size_per_partition = "
-                         f"{input_size_per_partition} is not divisible "
-                         f"by min_thread_k = {GPTQ_MARLIN_MIN_THREAD_K}. "
-                         "Consider reducing tensor_parallel_size or running "
-                         "with --quantization gptq.")
-
-    if (group_size < input_size
-            and input_size_per_partition % group_size != 0):
+        raise ValueError(
+            f"Weight input_size_per_partition = "
+            f"{input_size_per_partition} is not divisible "
+            f"by min_thread_k = {GPTQ_MARLIN_MIN_THREAD_K}. "
+            "Consider reducing tensor_parallel_size or running "
+            "with --quantization gptq."
+        )
+
+    if group_size < input_size and input_size_per_partition % group_size != 0:
         raise ValueError(
             f"Weight input_size_per_partition = {input_size_per_partition}"
             f" is not divisible by group_size = {group_size}. "
             "Consider reducing tensor_parallel_size or running "
-            "with --quantization gptq.")
+            "with --quantization gptq."
+        )
 
 
-def check_marlin_supports_shape(output_size_per_partition: int,
-                                input_size_per_partition: int,
-                                input_size: int, group_size: int) \
-                                    -> tuple[bool, Optional[str]]:
+def check_marlin_supports_shape(
+    output_size_per_partition: int,
+    input_size_per_partition: int,
+    input_size: int,
+    group_size: int,
+) -> tuple[bool, Optional[str]]:
     try:
-        verify_marlin_supports_shape(output_size_per_partition,
-                                     input_size_per_partition, input_size,
-                                     group_size)
+        verify_marlin_supports_shape(
+            output_size_per_partition, input_size_per_partition, input_size, group_size
+        )
     except ValueError as e:
         return False, e.__str__()
     return True, None
 
 
-def check_marlin_supports_layer(layer: LinearBase, group_size: int) \
-                                    -> bool:
-    output_size_per_partition = getattr(layer, "output_size_per_partition",
-                                        None) or layer.output_size
-    input_size_per_partition = getattr(layer, "input_size_per_partition",
-                                       None) or layer.input_size
+def check_marlin_supports_layer(layer: LinearBase, group_size: int) -> bool:
+    output_size_per_partition = (
+        getattr(layer, "output_size_per_partition", None) or layer.output_size
+    )
+    input_size_per_partition = (
+        getattr(layer, "input_size_per_partition", None) or layer.input_size
+    )
 
     return check_marlin_supports_shape(
         output_size_per_partition=output_size_per_partition,
         input_size_per_partition=input_size_per_partition,
         input_size=layer.input_size,
-        group_size=group_size)[0]
+        group_size=group_size,
+    )[0]
 
 
-def check_moe_marlin_supports_layer(layer: LinearBase, group_size: int) \
-                                    -> bool:
+def check_moe_marlin_supports_layer(layer: LinearBase, group_size: int) -> bool:
     hidden_size = layer.hidden_size
     intermediate_size_per_partition = layer.intermediate_size_per_partition
     # apply_router_weight_on_input is not supported for moe marlin
@@ -180,51 +201,58 @@ def check_moe_marlin_supports_layer(layer: LinearBase, group_size: int) \
     # gate-up: (n, k) = (intermediate_size_per_partition * 2, hidden_size)
     # down: (n, k) = (hidden_size, intermediate_size_per_partition)
     # moe marlin requires n % 128 == 0 and k % 64 == 0
-    supports_shape = hidden_size % 128 == 0 and \
-        intermediate_size_per_partition % max(64, group_size) == 0
+    supports_shape = (
+        hidden_size % 128 == 0
+        and intermediate_size_per_partition % max(64, group_size) == 0
+    )
     supports_group_size = group_size in [-1, 32, 64, 128]
-    return supports_shape and supports_group_size and \
-        supports_router_weight and supports_activation
+    return (
+        supports_shape
+        and supports_group_size
+        and supports_router_weight
+        and supports_activation
+    )
 
 
-def marlin_moe_intermediate_size(w1_packed: torch.Tensor,
-                                 w2_packed: torch.Tensor):
+def marlin_moe_intermediate_size(w1_packed: torch.Tensor, w2_packed: torch.Tensor):
     """
     Given Marlin packed weight matrices w1_packed, and w2_packed,
-    return the MoE intermediate size N 
+    return the MoE intermediate size N
     """
     marlin_tile_size = 16
     return w2_packed.size(1) * marlin_tile_size
 
 
-def marlin_make_workspace(output_size_per_partition: int,
-                          device: torch.device) -> torch.Tensor:
-    max_workspace_size = (output_size_per_partition //
-                          GPTQ_MARLIN_MIN_THREAD_N) * GPTQ_MARLIN_MAX_PARALLEL
+def marlin_make_workspace(
+    output_size_per_partition: int, device: torch.device
+) -> torch.Tensor:
+    max_workspace_size = (
+        output_size_per_partition // GPTQ_MARLIN_MIN_THREAD_N
+    ) * GPTQ_MARLIN_MAX_PARALLEL
 
-    return torch.zeros(max_workspace_size,
-                       dtype=torch.int,
-                       device=device,
-                       requires_grad=False)
+    return torch.zeros(
+        max_workspace_size, dtype=torch.int, device=device, requires_grad=False
+    )
 
 
-def marlin_make_workspace_new(device: torch.device,
-                              max_blocks_per_sm: int = 1) -> torch.Tensor:
+def marlin_make_workspace_new(
+    device: torch.device, max_blocks_per_sm: int = 1
+) -> torch.Tensor:
     # In the new marlin kernel, we use the num of threadblocks as workspace
     # size. The num of threadblocks is sms_count * max_blocks_per_sm.
     sms = torch.cuda.get_device_properties(device).multi_processor_count
-    return torch.zeros(sms * max_blocks_per_sm,
-                       dtype=torch.int,
-                       device=device,
-                       requires_grad=False)
+    return torch.zeros(
+        sms * max_blocks_per_sm, dtype=torch.int, device=device, requires_grad=False
+    )
 
 
 def marlin_is_k_full(act_order: bool, is_row_parallel: bool) -> bool:
     return (not act_order) or (act_order and not is_row_parallel)
 
 
-def marlin_repeat_scales_on_all_ranks(act_order: bool, group_size: int,
-                                      is_row_parallel: bool) -> bool:
+def marlin_repeat_scales_on_all_ranks(
+    act_order: bool, group_size: int, is_row_parallel: bool
+) -> bool:
     # Need to repeat scales on every rank if act_ordering or
     # channelwise and RowParallelLinear
     is_channelwise = group_size == -1
@@ -232,17 +260,18 @@ def marlin_repeat_scales_on_all_ranks(act_order: bool, group_size: int,
 
 
 def marlin_make_empty_g_idx(device: torch.device) -> torch.Tensor:
-    return torch.nn.Parameter(torch.empty(0, dtype=torch.int, device=device),
-                              requires_grad=False)
+    return torch.nn.Parameter(
+        torch.empty(0, dtype=torch.int, device=device), requires_grad=False
+    )
 
 
 def marlin_make_empty_zp(device: torch.device) -> torch.Tensor:
-    return torch.nn.Parameter(torch.empty(0, dtype=torch.int, device=device),
-                              requires_grad=False)
+    return torch.nn.Parameter(
+        torch.empty(0, dtype=torch.int, device=device), requires_grad=False
+    )
 
 
-def marlin_sort_g_idx(
-        g_idx: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+def marlin_sort_g_idx(g_idx: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
     g_idx_sort_indices = torch.argsort(g_idx).to(torch.int)
     return g_idx[g_idx_sort_indices], g_idx_sort_indices
 
@@ -253,14 +282,13 @@ def get_scale_perms():
         scale_perm.extend([i + 8 * j for j in range(8)])
     scale_perm_single: list[int] = []
     for i in range(4):
-        scale_perm_single.extend(
-            [2 * i + j for j in [0, 1, 8, 9, 16, 17, 24, 25]])
+        scale_perm_single.extend([2 * i + j for j in [0, 1, 8, 9, 16, 17, 24, 25]])
     return scale_perm, scale_perm_single
 
 
-def marlin_permute_scales(s: torch.Tensor, size_k: int, size_n: int,
-                          group_size: int) -> torch.Tensor:
-
+def marlin_permute_scales(
+    s: torch.Tensor, size_k: int, size_n: int, group_size: int
+) -> torch.Tensor:
     scale_perm, scale_perm_single = get_scale_perms()
     if group_size < size_k and group_size != -1:
         s = s.reshape((-1, len(scale_perm)))[:, scale_perm]
@@ -296,8 +324,9 @@ def marlin_moe_permute_scales(
     return output
 
 
-def marlin_zero_points(zp: torch.Tensor, size_k: int, size_n: int,
-                       num_bits: int) -> torch.Tensor:
+def marlin_zero_points(
+    zp: torch.Tensor, size_k: int, size_n: int, num_bits: int
+) -> torch.Tensor:
     # Permute zero-points in a similar way to scales, but do not use the
     # "single" permutation, since zero-points are applied on every MMA
     scale_perm, _ = get_scale_perms()
@@ -318,8 +347,9 @@ def marlin_zero_points(zp: torch.Tensor, size_k: int, size_n: int,
     return zp
 
 
-def awq_to_marlin_zero_points(q_zp_packed: torch.Tensor, size_k: int,
-                              size_n: int, num_bits: int) -> torch.Tensor:
+def awq_to_marlin_zero_points(
+    q_zp_packed: torch.Tensor, size_k: int, size_n: int, num_bits: int
+) -> torch.Tensor:
     # AWQ zero-points are quantized and packed on the column dim.
     # In addition, the values are permuted based on dequantizer.
     # Here we undo both of these, and then apply marlin permutation
@@ -341,8 +371,9 @@ def awq_to_marlin_zero_points(q_zp_packed: torch.Tensor, size_k: int,
     return marlin_zp
 
 
-def moe_awq_to_marlin_zero_points(q_zp_packed: torch.Tensor, size_k: int,
-                                  size_n: int, num_bits: int):
+def moe_awq_to_marlin_zero_points(
+    q_zp_packed: torch.Tensor, size_k: int, size_n: int, num_bits: int
+):
     num_experts = q_zp_packed.shape[0]
     output = torch.empty(
         (num_experts, q_zp_packed.shape[1], q_zp_packed.shape[2]),
@@ -350,8 +381,7 @@ def moe_awq_to_marlin_zero_points(q_zp_packed: torch.Tensor, size_k: int,
         dtype=q_zp_packed.dtype,
     )
     for e in range(num_experts):
-        output[e] = awq_to_marlin_zero_points(q_zp_packed[e], size_k, size_n,
-                                              num_bits)
+        output[e] = awq_to_marlin_zero_points(q_zp_packed[e], size_k, size_n, num_bits)
     return output
 
 
@@ -363,7 +393,8 @@ def maybe_warn_marlin_atomic_add(device, dtype):
         logger.info_once(
             "You are running Marlin kernel with bf16 on GPUs before SM90. "
             "You can consider change to fp16 to achieve better performance "
-            "if possible.")
+            "if possible."
+        )
 
 
 def maybe_warn_marlin_atomic_add_env():
@@ -375,12 +406,13 @@ def maybe_warn_marlin_atomic_add_env():
         "Marlin kernel can achieve better performance for small size_n "
         "with experimental use_atomic_add feature. "
         "You can consider set environment variable "
-        "VLLM_MARLIN_USE_ATOMIC_ADD to 1 if possible.")
-
+        "VLLM_MARLIN_USE_ATOMIC_ADD to 1 if possible."
+    )
 
-def should_use_atomic_add_reduce(m: int, n: int, k: int, device: torch.device,
-                                 dtype: torch.dtype) -> bool:
 
+def should_use_atomic_add_reduce(
+    m: int, n: int, k: int, device: torch.device, dtype: torch.dtype
+) -> bool:
     # the performance of atomicAdd is better than global reduce
     # only when m*n is small and k is large
     if n >= 2048 or k < 2048 or device.type != "cuda":
@@ -402,88 +434,98 @@ def should_use_atomic_add_reduce(m: int, n: int, k: int, device: torch.device,
 
 
 def apply_gptq_marlin_linear(
-        input: torch.Tensor,
-        weight: torch.Tensor,
-        weight_scale: torch.Tensor,
-        weight_zp: torch.Tensor,
-        g_idx: torch.Tensor,
-        g_idx_sort_indices: torch.Tensor,
-        workspace: torch.Tensor,
-        wtype: ScalarType,
-        output_size_per_partition: int,
-        input_size_per_partition: int,
-        is_k_full: bool,
-        bias: Optional[torch.Tensor] = None,
-        use_fp32_reduce: bool = USE_FP32_REDUCE_DEFAULT) -> torch.Tensor:
+    input: torch.Tensor,
+    weight: torch.Tensor,
+    weight_scale: torch.Tensor,
+    weight_zp: torch.Tensor,
+    g_idx: torch.Tensor,
+    g_idx_sort_indices: torch.Tensor,
+    workspace: torch.Tensor,
+    wtype: ScalarType,
+    output_size_per_partition: int,
+    input_size_per_partition: int,
+    is_k_full: bool,
+    bias: Optional[torch.Tensor] = None,
+    use_fp32_reduce: bool = USE_FP32_REDUCE_DEFAULT,
+) -> torch.Tensor:
     reshaped_x = input.reshape(-1, input.shape[-1])
-    out_shape = input.shape[:-1] + (output_size_per_partition, )
-
-    use_atomic_add = should_use_atomic_add_reduce(m=reshaped_x.size(0),
-                                                  n=output_size_per_partition,
-                                                  k=reshaped_x.size(1),
-                                                  device=input.device,
-                                                  dtype=input.dtype)
-
-    output = ops.gptq_marlin_gemm(reshaped_x,
-                                  None,
-                                  weight,
-                                  bias,
-                                  weight_scale,
-                                  None,
-                                  weight_zp,
-                                  g_idx,
-                                  g_idx_sort_indices,
-                                  workspace,
-                                  wtype,
-                                  size_m=reshaped_x.shape[0],
-                                  size_n=output_size_per_partition,
-                                  size_k=input_size_per_partition,
-                                  is_k_full=is_k_full,
-                                  use_atomic_add=use_atomic_add,
-                                  use_fp32_reduce=use_fp32_reduce,
-                                  is_zp_float=False)
+    out_shape = input.shape[:-1] + (output_size_per_partition,)
+
+    use_atomic_add = should_use_atomic_add_reduce(
+        m=reshaped_x.size(0),
+        n=output_size_per_partition,
+        k=reshaped_x.size(1),
+        device=input.device,
+        dtype=input.dtype,
+    )
+
+    output = ops.gptq_marlin_gemm(
+        reshaped_x,
+        None,
+        weight,
+        bias,
+        weight_scale,
+        None,
+        weight_zp,
+        g_idx,
+        g_idx_sort_indices,
+        workspace,
+        wtype,
+        size_m=reshaped_x.shape[0],
+        size_n=output_size_per_partition,
+        size_k=input_size_per_partition,
+        is_k_full=is_k_full,
+        use_atomic_add=use_atomic_add,
+        use_fp32_reduce=use_fp32_reduce,
+        is_zp_float=False,
+    )
 
     return output.reshape(out_shape)
 
 
 def apply_awq_marlin_linear(
-        input: torch.Tensor,
-        weight: torch.Tensor,
-        weight_scale: torch.Tensor,
-        weight_zp: torch.Tensor,
-        g_idx: torch.Tensor,
-        g_idx_sort_indices: torch.Tensor,
-        workspace: torch.Tensor,
-        quant_type: ScalarType,
-        output_size_per_partition: int,
-        input_size_per_partition: int,
-        bias: Optional[torch.Tensor] = None,
-        use_fp32_reduce: bool = USE_FP32_REDUCE_DEFAULT) -> torch.Tensor:
+    input: torch.Tensor,
+    weight: torch.Tensor,
+    weight_scale: torch.Tensor,
+    weight_zp: torch.Tensor,
+    g_idx: torch.Tensor,
+    g_idx_sort_indices: torch.Tensor,
+    workspace: torch.Tensor,
+    quant_type: ScalarType,
+    output_size_per_partition: int,
+    input_size_per_partition: int,
+    bias: Optional[torch.Tensor] = None,
+    use_fp32_reduce: bool = USE_FP32_REDUCE_DEFAULT,
+) -> torch.Tensor:
     reshaped_x = input.reshape(-1, input.shape[-1])
-    out_shape = input.shape[:-1] + (output_size_per_partition, )
-
-    use_atomic_add = should_use_atomic_add_reduce(m=reshaped_x.size(0),
-                                                  n=output_size_per_partition,
-                                                  k=reshaped_x.size(1),
-                                                  device=input.device,
-                                                  dtype=input.dtype)
-
-    output = ops.gptq_marlin_gemm(reshaped_x,
-                                  None,
-                                  weight,
-                                  bias,
-                                  weight_scale,
-                                  None,
-                                  weight_zp,
-                                  g_idx,
-                                  g_idx_sort_indices,
-                                  workspace,
-                                  quant_type,
-                                  size_m=reshaped_x.shape[0],
-                                  size_n=output_size_per_partition,
-                                  size_k=input_size_per_partition,
-                                  use_atomic_add=use_atomic_add,
-                                  use_fp32_reduce=use_fp32_reduce,
-                                  is_zp_float=False)
+    out_shape = input.shape[:-1] + (output_size_per_partition,)
+
+    use_atomic_add = should_use_atomic_add_reduce(
+        m=reshaped_x.size(0),
+        n=output_size_per_partition,
+        k=reshaped_x.size(1),
+        device=input.device,
+        dtype=input.dtype,
+    )
+
+    output = ops.gptq_marlin_gemm(
+        reshaped_x,
+        None,
+        weight,
+        bias,
+        weight_scale,
+        None,
+        weight_zp,
+        g_idx,
+        g_idx_sort_indices,
+        workspace,
+        quant_type,
+        size_m=reshaped_x.shape[0],
+        size_n=output_size_per_partition,
+        size_k=input_size_per_partition,
+        use_atomic_add=use_atomic_add,
+        use_fp32_reduce=use_fp32_reduce,
+        is_zp_float=False,
+    )
 
     return output.reshape(out_shape)
diff --git a/vllm/model_executor/layers/quantization/utils/marlin_utils_fp4.py b/vllm/model_executor/layers/quantization/utils/marlin_utils_fp4.py
index 94ffdcd26ecd..c5e34f392fb2 100644
--- a/vllm/model_executor/layers/quantization/utils/marlin_utils_fp4.py
+++ b/vllm/model_executor/layers/quantization/utils/marlin_utils_fp4.py
@@ -8,8 +8,12 @@
 import vllm._custom_ops as ops
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-    USE_FP32_REDUCE_DEFAULT, marlin_make_workspace_new, marlin_permute_bias,
-    marlin_permute_scales, should_use_atomic_add_reduce)
+    USE_FP32_REDUCE_DEFAULT,
+    marlin_make_workspace_new,
+    marlin_permute_bias,
+    marlin_permute_scales,
+    should_use_atomic_add_reduce,
+)
 from vllm.platforms import current_platform
 from vllm.scalar_type import scalar_types
 
@@ -28,7 +32,8 @@ def nvfp4_marlin_process_scales(marlin_scales):
             "NVFP4 Marlin assumes the scales to be >=0, but has encountered "
             "negative scales. Accuracy will likely be degraded. This is "
             "because it changes the scales from FP8-S1E4M3 to a special "
-            "FP8-S0E5M3 format to speedup the dequantization.")
+            "FP8-S0E5M3 format to speedup the dequantization."
+        )
 
     # convert to half first, we would convert to fp8 later
     marlin_scales = marlin_scales.to(torch.half)
@@ -36,11 +41,13 @@ def nvfp4_marlin_process_scales(marlin_scales):
     # 8 is the number of scale number using by one thread
     marlin_scales = marlin_scales.view(marlin_scales.size(0) // 2, 2, -1, 8)
     marlin_scales = marlin_scales.permute(0, 2, 1, 3).reshape(
-        marlin_scales.size(0) * 2, -1)
+        marlin_scales.size(0) * 2, -1
+    )
 
     # fit the layout of fp8 dequantization
     marlin_scales = marlin_scales.view(-1, 4)[:, [0, 2, 1, 3]].view(
-        marlin_scales.size(0), -1)
+        marlin_scales.size(0), -1
+    )
 
     # We assume that weight_scale (FP8-S1E4M3) is always greater
     # than or equal to 0. So we can convert
@@ -60,11 +67,13 @@ def mxfp4_marlin_process_scales(marlin_scales):
     # 8 is the number of scale number using by one thread
     marlin_scales = marlin_scales.view(marlin_scales.size(0) // 2, 2, -1, 8)
     marlin_scales = marlin_scales.permute(0, 2, 1, 3).reshape(
-        marlin_scales.size(0) * 2, -1)
+        marlin_scales.size(0) * 2, -1
+    )
 
     # fit the layout of fp8 dequantization
     marlin_scales = marlin_scales.view(-1, 4)[:, [0, 2, 1, 3]].view(
-        marlin_scales.size(0), -1)
+        marlin_scales.size(0), -1
+    )
     marlin_scales = marlin_scales.to(torch.float8_e8m0fnu)
     return marlin_scales
 
@@ -78,48 +87,49 @@ def nvfp4_marlin_process_global_scale(global_scale):
         target_exponent = 8
     # exponent_bias_fp16 = 2 ** 4 - 2 ** 1 = 14
     # exponent_bias_bf16 = 2 ** 7 - 2 ** 1 = 126
-    exponent_bias = 2**(target_exponent - 1) - 2**(fp4_exponent - 1)
-    return global_scale * (2.0**(exponent_bias - 7))
+    exponent_bias = 2 ** (target_exponent - 1) - 2 ** (fp4_exponent - 1)
+    return global_scale * (2.0 ** (exponent_bias - 7))
 
 
 def apply_fp4_marlin_linear(
-        input: torch.Tensor,
-        weight: torch.Tensor,
-        weight_scale: torch.Tensor,
-        weight_scale_2: Optional[torch.Tensor],
-        workspace: torch.Tensor,
-        size_n: int,
-        size_k: int,
-        bias: Optional[torch.Tensor] = None,
-        use_fp32_reduce: bool = USE_FP32_REDUCE_DEFAULT) -> torch.Tensor:
+    input: torch.Tensor,
+    weight: torch.Tensor,
+    weight_scale: torch.Tensor,
+    weight_scale_2: Optional[torch.Tensor],
+    workspace: torch.Tensor,
+    size_n: int,
+    size_k: int,
+    bias: Optional[torch.Tensor] = None,
+    use_fp32_reduce: bool = USE_FP32_REDUCE_DEFAULT,
+) -> torch.Tensor:
     # For GPUs that lack FP4 hardware support, we can leverage the
     # Marlin kernel for fast weight-only FP4 quantization
 
     reshaped_x = input.reshape(-1, input.shape[-1])
-    out_shape = input.shape[:-1] + (size_n, )
-
-    use_atomic_add = should_use_atomic_add_reduce(m=reshaped_x.size(0),
-                                                  n=size_n,
-                                                  k=size_k,
-                                                  device=input.device,
-                                                  dtype=input.dtype)
-
-    output = ops.gptq_marlin_gemm(a=reshaped_x,
-                                  c=None,
-                                  b_q_weight=weight,
-                                  b_bias=bias,
-                                  b_scales=weight_scale,
-                                  global_scale=weight_scale_2,
-                                  b_zeros=None,
-                                  g_idx=None,
-                                  perm=None,
-                                  workspace=workspace,
-                                  b_q_type=scalar_types.float4_e2m1f,
-                                  size_m=reshaped_x.size(0),
-                                  size_n=size_n,
-                                  size_k=size_k,
-                                  use_atomic_add=use_atomic_add,
-                                  use_fp32_reduce=use_fp32_reduce)
+    out_shape = input.shape[:-1] + (size_n,)
+
+    use_atomic_add = should_use_atomic_add_reduce(
+        m=reshaped_x.size(0), n=size_n, k=size_k, device=input.device, dtype=input.dtype
+    )
+
+    output = ops.gptq_marlin_gemm(
+        a=reshaped_x,
+        c=None,
+        b_q_weight=weight,
+        b_bias=bias,
+        b_scales=weight_scale,
+        global_scale=weight_scale_2,
+        b_zeros=None,
+        g_idx=None,
+        perm=None,
+        workspace=workspace,
+        b_q_type=scalar_types.float4_e2m1f,
+        size_m=reshaped_x.size(0),
+        size_n=size_n,
+        size_k=size_k,
+        use_atomic_add=use_atomic_add,
+        use_fp32_reduce=use_fp32_reduce,
+    )
 
     return output.reshape(out_shape)
 
@@ -129,7 +139,8 @@ def prepare_fp4_layer_for_marlin(layer: torch.nn.Module) -> None:
         "Your GPU does not have native support for FP4 computation but "
         "FP4 quantization is being used. Weight-only FP4 compression will "
         "be used leveraging the Marlin kernel. This may degrade "
-        "performance for compute-heavy workloads.")
+        "performance for compute-heavy workloads."
+    )
 
     is_nvfp4 = hasattr(layer, "weight_scale_2")
     group_size = 16 if is_nvfp4 else 32
@@ -150,11 +161,13 @@ def prepare_fp4_layer_for_marlin(layer: torch.nn.Module) -> None:
     perm = torch.empty(0, dtype=torch.int, device=device)
     qweight = layer.weight.view(torch.int32).T.contiguous()
 
-    marlin_qweight = ops.gptq_marlin_repack(b_q_weight=qweight,
-                                            perm=perm,
-                                            size_k=part_size_k,
-                                            size_n=part_size_n,
-                                            num_bits=4)
+    marlin_qweight = ops.gptq_marlin_repack(
+        b_q_weight=qweight,
+        perm=perm,
+        size_k=part_size_k,
+        size_n=part_size_n,
+        num_bits=4,
+    )
     layer.weight = torch.nn.Parameter(marlin_qweight, requires_grad=False)
 
     # WEIGHT SCALES
@@ -165,27 +178,23 @@ def prepare_fp4_layer_for_marlin(layer: torch.nn.Module) -> None:
         weight_scale = weight_scale.view(torch.float8_e8m0fnu)
 
     weight_scale = weight_scale.to(param_dtype)
-    weight_scale = marlin_permute_scales(s=weight_scale,
-                                         size_k=part_size_k,
-                                         size_n=part_size_n,
-                                         group_size=group_size)
+    weight_scale = marlin_permute_scales(
+        s=weight_scale, size_k=part_size_k, size_n=part_size_n, group_size=group_size
+    )
 
     if is_nvfp4:
         weight_scale = nvfp4_marlin_process_scales(weight_scale)
-        layer.weight_scale = torch.nn.Parameter(weight_scale,
-                                                requires_grad=False)
+        layer.weight_scale = torch.nn.Parameter(weight_scale, requires_grad=False)
 
         weight_scale_2 = layer.weight_scale_2.to(param_dtype)
         weight_scale_2 = nvfp4_marlin_process_global_scale(weight_scale_2)
-        layer.weight_scale_2 = torch.nn.Parameter(weight_scale_2,
-                                                  requires_grad=False)
+        layer.weight_scale_2 = torch.nn.Parameter(weight_scale_2, requires_grad=False)
     else:
         weight_scale = mxfp4_marlin_process_scales(weight_scale)
-        layer.weight_scale = torch.nn.Parameter(weight_scale,
-                                                requires_grad=False)
+        layer.weight_scale = torch.nn.Parameter(weight_scale, requires_grad=False)
 
     if hasattr(layer, "bias") and layer.bias is not None:
-        assert layer.bias.shape == (part_size_n, )
+        assert layer.bias.shape == (part_size_n,)
         bias = marlin_permute_bias(layer.bias)
         layer.bias = torch.nn.Parameter(bias, requires_grad=False)
 
@@ -197,7 +206,8 @@ def prepare_moe_fp4_layer_for_marlin(layer: torch.nn.Module) -> None:
         "Your GPU does not have native support for FP4 computation but "
         "FP4 quantization is being used. Weight-only FP4 compression will "
         "be used leveraging the Marlin kernel. This may degrade "
-        "performance for compute-heavy workloads.")
+        "performance for compute-heavy workloads."
+    )
 
     is_nvfp4 = hasattr(layer, "w13_weight_scale_2")
     group_size = 16 if is_nvfp4 else 32
@@ -227,11 +237,9 @@ def prepare_moe_fp4_layer_for_marlin(layer: torch.nn.Module) -> None:
         for i in range(e):
             qweight = weight[i].view(torch.int32).T.contiguous()
 
-            marlin_qweight = ops.gptq_marlin_repack(b_q_weight=qweight,
-                                                    perm=perm,
-                                                    size_k=size_k,
-                                                    size_n=size_n,
-                                                    num_bits=4)
+            marlin_qweight = ops.gptq_marlin_repack(
+                b_q_weight=qweight, perm=perm, size_k=size_k, size_n=size_n, num_bits=4
+            )
             tensor_list.append(marlin_qweight)
 
         weight = torch.cat([x.unsqueeze(0) for x in tensor_list], 0)
@@ -247,8 +255,7 @@ def prepare_moe_fp4_layer_for_marlin(layer: torch.nn.Module) -> None:
             scales = scales.view(torch.float8_e8m0fnu)
         scales = scales.to(param_dtype)
         if is_nvfp4:
-            global_scale = getattr(layer,
-                                   name + "_weight_scale_2").to(param_dtype)
+            global_scale = getattr(layer, name + "_weight_scale_2").to(param_dtype)
 
         tensor_list = []
         if "w13" in name:
@@ -259,10 +266,9 @@ def prepare_moe_fp4_layer_for_marlin(layer: torch.nn.Module) -> None:
         for i in range(e):
             scale = scales[i].T
 
-            marlin_scales = marlin_permute_scales(s=scale,
-                                                  size_k=size_k,
-                                                  size_n=size_n,
-                                                  group_size=group_size)
+            marlin_scales = marlin_permute_scales(
+                s=scale, size_k=size_k, size_n=size_n, group_size=group_size
+            )
             if is_nvfp4:
                 marlin_scales = nvfp4_marlin_process_scales(marlin_scales)
             else:
@@ -275,8 +281,7 @@ def prepare_moe_fp4_layer_for_marlin(layer: torch.nn.Module) -> None:
 
         if is_nvfp4:
             global_scale = nvfp4_marlin_process_global_scale(global_scale)
-            global_scale = torch.nn.Parameter(global_scale,
-                                              requires_grad=False)
+            global_scale = torch.nn.Parameter(global_scale, requires_grad=False)
             setattr(layer, name + "_weight_scale_2", global_scale)
 
     # BIAS
@@ -306,26 +311,26 @@ def rand_marlin_weight_nvfp4_like(weight, group_size):
     global_scale = scales.max() / 448
     scales = (scales / global_scale).to(torch.float8_e4m3fn)
 
-    fp4_weight = torch.randint(0,
-                               256, (size_n, size_k // 2),
-                               dtype=torch.uint8,
-                               device=weight.device)
-    fp4_weight_part_1 = ((fp4_weight & 0b10000000) |
-                         ((fp4_weight & 0b01110000) >> 2))
+    fp4_weight = torch.randint(
+        0, 256, (size_n, size_k // 2), dtype=torch.uint8, device=weight.device
+    )
+    fp4_weight_part_1 = (fp4_weight & 0b10000000) | ((fp4_weight & 0b01110000) >> 2)
     fp4_weight_part_1 = fp4_weight_part_1.view(torch.float8_e4m3fn)
     fp4_weight_part_1 = fp4_weight_part_1.to(weight.dtype) * (2**6)
 
     fp4_weight2 = fp4_weight << 4
-    fp4_weight_part_2 = ((fp4_weight2 & 0b10000000) |
-                         ((fp4_weight2 & 0b01110000) >> 2))
+    fp4_weight_part_2 = (fp4_weight2 & 0b10000000) | ((fp4_weight2 & 0b01110000) >> 2)
     fp4_weight_part_2 = fp4_weight_part_2.view(torch.float8_e4m3fn)
     fp4_weight_part_2 = fp4_weight_part_2.to(weight.dtype) * (2**6)
 
     weight_ref = torch.cat(
-        [fp4_weight_part_2.unsqueeze(2),
-         fp4_weight_part_1.unsqueeze(2)], 2).view(size_n, size_k)
-    weight_ref = weight_ref * global_scale.to(weight.dtype) * \
-        scales.repeat_interleave(group_size, 1).to(weight.dtype)
+        [fp4_weight_part_2.unsqueeze(2), fp4_weight_part_1.unsqueeze(2)], 2
+    ).view(size_n, size_k)
+    weight_ref = (
+        weight_ref
+        * global_scale.to(weight.dtype)
+        * scales.repeat_interleave(group_size, 1).to(weight.dtype)
+    )
 
     marlin_qweight = ops.gptq_marlin_repack(
         b_q_weight=fp4_weight.view(torch.int32).T.contiguous(),
@@ -335,10 +340,9 @@ def rand_marlin_weight_nvfp4_like(weight, group_size):
         num_bits=4,
     )
 
-    marlin_scales = marlin_permute_scales(s=scales.T.to(weight.dtype),
-                                          size_k=size_k,
-                                          size_n=size_n,
-                                          group_size=group_size)
+    marlin_scales = marlin_permute_scales(
+        s=scales.T.to(weight.dtype), size_k=size_k, size_n=size_n, group_size=group_size
+    )
     marlin_scales = nvfp4_marlin_process_scales(marlin_scales)
 
     global_scale = nvfp4_marlin_process_global_scale(global_scale)
@@ -351,32 +355,31 @@ def rand_marlin_weight_mxfp4_like(weight, group_size):
     size_n, size_k = weight.shape
     device = weight.device
 
-    scales = torch.randint(100,
-                           125, (size_n, size_k // group_size),
-                           dtype=torch.uint8,
-                           device=weight.device)
+    scales = torch.randint(
+        100,
+        125,
+        (size_n, size_k // group_size),
+        dtype=torch.uint8,
+        device=weight.device,
+    )
     scales = scales.view(torch.float8_e8m0fnu)
 
-    fp4_weight = torch.randint(0,
-                               256, (size_n, size_k // 2),
-                               dtype=torch.uint8,
-                               device=weight.device)
-    fp4_weight_part_1 = ((fp4_weight & 0b10000000) |
-                         ((fp4_weight & 0b01110000) >> 2))
+    fp4_weight = torch.randint(
+        0, 256, (size_n, size_k // 2), dtype=torch.uint8, device=weight.device
+    )
+    fp4_weight_part_1 = (fp4_weight & 0b10000000) | ((fp4_weight & 0b01110000) >> 2)
     fp4_weight_part_1 = fp4_weight_part_1.view(torch.float8_e4m3fn)
     fp4_weight_part_1 = fp4_weight_part_1.to(weight.dtype) * (2**6)
 
     fp4_weight2 = fp4_weight << 4
-    fp4_weight_part_2 = ((fp4_weight2 & 0b10000000) |
-                         ((fp4_weight2 & 0b01110000) >> 2))
+    fp4_weight_part_2 = (fp4_weight2 & 0b10000000) | ((fp4_weight2 & 0b01110000) >> 2)
     fp4_weight_part_2 = fp4_weight_part_2.view(torch.float8_e4m3fn)
     fp4_weight_part_2 = fp4_weight_part_2.to(weight.dtype) * (2**6)
 
     weight_ref = torch.cat(
-        [fp4_weight_part_2.unsqueeze(2),
-         fp4_weight_part_1.unsqueeze(2)], 2).view(size_n, size_k)
-    weight_ref = weight_ref * \
-        scales.repeat_interleave(group_size, 1).to(weight.dtype)
+        [fp4_weight_part_2.unsqueeze(2), fp4_weight_part_1.unsqueeze(2)], 2
+    ).view(size_n, size_k)
+    weight_ref = weight_ref * scales.repeat_interleave(group_size, 1).to(weight.dtype)
 
     marlin_qweight = ops.gptq_marlin_repack(
         b_q_weight=fp4_weight.view(torch.int32).T.contiguous(),
@@ -386,10 +389,9 @@ def rand_marlin_weight_mxfp4_like(weight, group_size):
         num_bits=4,
     )
 
-    marlin_scales = marlin_permute_scales(s=scales.T.to(weight.dtype),
-                                          size_k=size_k,
-                                          size_n=size_n,
-                                          group_size=group_size)
+    marlin_scales = marlin_permute_scales(
+        s=scales.T.to(weight.dtype), size_k=size_k, size_n=size_n, group_size=group_size
+    )
 
     marlin_scales = mxfp4_marlin_process_scales(marlin_scales)
 
diff --git a/vllm/model_executor/layers/quantization/utils/marlin_utils_fp8.py b/vllm/model_executor/layers/quantization/utils/marlin_utils_fp8.py
index 511e19545d5a..9348ac158daa 100644
--- a/vllm/model_executor/layers/quantization/utils/marlin_utils_fp8.py
+++ b/vllm/model_executor/layers/quantization/utils/marlin_utils_fp8.py
@@ -8,8 +8,12 @@
 import vllm._custom_ops as ops
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
-    USE_FP32_REDUCE_DEFAULT, marlin_make_workspace_new, marlin_permute_bias,
-    marlin_permute_scales, should_use_atomic_add_reduce)
+    USE_FP32_REDUCE_DEFAULT,
+    marlin_make_workspace_new,
+    marlin_permute_bias,
+    marlin_permute_scales,
+    should_use_atomic_add_reduce,
+)
 from vllm.platforms import current_platform
 from vllm.scalar_type import scalar_types
 
@@ -28,60 +32,63 @@ def fp8_fused_exponent_bias_into_scales(scales):
         target_exponent = 8
     # exponent_bias_fp16 = 2 ** 4 - 2 ** 3 = 8
     # exponent_bias_bf16 = 2 ** 7 - 2 ** 3 = 120
-    exponent_bias = 2**(target_exponent - 1) - 2**(fp8_exponent - 1)
+    exponent_bias = 2 ** (target_exponent - 1) - 2 ** (fp8_exponent - 1)
     s = torch.ones_like(scales) * 2
     s = s**exponent_bias
     return scales * s
 
 
 def apply_fp8_marlin_linear(
-        input: torch.Tensor,
-        weight: torch.Tensor,
-        weight_scale: torch.Tensor,
-        workspace: torch.Tensor,
-        size_n: int,
-        size_k: int,
-        bias: Optional[torch.Tensor],
-        use_fp32_reduce: bool = USE_FP32_REDUCE_DEFAULT) -> torch.Tensor:
+    input: torch.Tensor,
+    weight: torch.Tensor,
+    weight_scale: torch.Tensor,
+    workspace: torch.Tensor,
+    size_n: int,
+    size_k: int,
+    bias: Optional[torch.Tensor],
+    use_fp32_reduce: bool = USE_FP32_REDUCE_DEFAULT,
+) -> torch.Tensor:
     # For GPUs that lack FP8 hardware support, we can leverage the
     # Marlin kernel for fast weight-only FP8 quantization
 
     reshaped_x = input.reshape(-1, input.shape[-1])
-    out_shape = input.shape[:-1] + (size_n, )
-
-    use_atomic_add = should_use_atomic_add_reduce(m=reshaped_x.size(0),
-                                                  n=size_n,
-                                                  k=size_k,
-                                                  device=input.device,
-                                                  dtype=input.dtype)
-
-    output = ops.gptq_marlin_gemm(a=reshaped_x,
-                                  c=None,
-                                  b_q_weight=weight,
-                                  b_bias=bias,
-                                  b_scales=weight_scale,
-                                  global_scale=None,
-                                  b_zeros=None,
-                                  g_idx=None,
-                                  perm=None,
-                                  workspace=workspace,
-                                  b_q_type=scalar_types.float8_e4m3fn,
-                                  size_m=reshaped_x.size(0),
-                                  size_n=size_n,
-                                  size_k=size_k,
-                                  use_atomic_add=use_atomic_add,
-                                  use_fp32_reduce=use_fp32_reduce)
+    out_shape = input.shape[:-1] + (size_n,)
+
+    use_atomic_add = should_use_atomic_add_reduce(
+        m=reshaped_x.size(0), n=size_n, k=size_k, device=input.device, dtype=input.dtype
+    )
+
+    output = ops.gptq_marlin_gemm(
+        a=reshaped_x,
+        c=None,
+        b_q_weight=weight,
+        b_bias=bias,
+        b_scales=weight_scale,
+        global_scale=None,
+        b_zeros=None,
+        g_idx=None,
+        perm=None,
+        workspace=workspace,
+        b_q_type=scalar_types.float8_e4m3fn,
+        size_m=reshaped_x.size(0),
+        size_n=size_n,
+        size_k=size_k,
+        use_atomic_add=use_atomic_add,
+        use_fp32_reduce=use_fp32_reduce,
+    )
 
     return output.reshape(out_shape)
 
 
-def prepare_fp8_layer_for_marlin(layer: torch.nn.Module,
-                                 size_k_first: bool = True) -> None:
+def prepare_fp8_layer_for_marlin(
+    layer: torch.nn.Module, size_k_first: bool = True
+) -> None:
     logger.warning_once(
         "Your GPU does not have native support for FP8 computation but "
         "FP8 quantization is being used. Weight-only FP8 compression will "
         "be used leveraging the Marlin kernel. This may degrade "
-        "performance for compute-heavy workloads.")
+        "performance for compute-heavy workloads."
+    )
 
     part_size_n = layer.output_size_per_partition
     part_size_k = layer.input_size_per_partition
@@ -104,11 +111,13 @@ def prepare_fp8_layer_for_marlin(layer: torch.nn.Module,
     if not size_k_first:
         qweight = qweight.T.contiguous()
 
-    marlin_qweight = ops.gptq_marlin_repack(b_q_weight=qweight,
-                                            perm=perm,
-                                            size_k=part_size_k,
-                                            size_n=part_size_n,
-                                            num_bits=8)
+    marlin_qweight = ops.gptq_marlin_repack(
+        b_q_weight=qweight,
+        perm=perm,
+        size_k=part_size_k,
+        size_n=part_size_n,
+        num_bits=8,
+    )
     layer.weight = torch.nn.Parameter(marlin_qweight, requires_grad=False)
 
     # WEIGHT SCALES
@@ -151,26 +160,27 @@ def prepare_fp8_layer_for_marlin(layer: torch.nn.Module,
         # size_n may not divisible by block_size[0]
         scales = scales[:, :part_size_n]
 
-    marlin_scales = marlin_permute_scales(s=scales,
-                                          size_k=part_size_k,
-                                          size_n=part_size_n,
-                                          group_size=group_size)
+    marlin_scales = marlin_permute_scales(
+        s=scales, size_k=part_size_k, size_n=part_size_n, group_size=group_size
+    )
     marlin_scales = fp8_fused_exponent_bias_into_scales(marlin_scales)
     layer.weight_scale = torch.nn.Parameter(marlin_scales, requires_grad=False)
 
     if hasattr(layer, "bias") and layer.bias is not None:
-        assert layer.bias.shape == (part_size_n, )
+        assert layer.bias.shape == (part_size_n,)
         bias = marlin_permute_bias(layer.bias)
         layer.bias = torch.nn.Parameter(bias, requires_grad=False)
 
 
-def prepare_moe_fp8_layer_for_marlin(layer: torch.nn.Module,
-                                     size_k_first: bool = True) -> None:
+def prepare_moe_fp8_layer_for_marlin(
+    layer: torch.nn.Module, size_k_first: bool = True
+) -> None:
     logger.warning_once(
         "Your GPU does not have native support for FP8 computation but "
         "FP8 quantization is being used. Weight-only FP8 compression will "
         "be used leveraging the Marlin kernel. This may degrade "
-        "performance for compute-heavy workloads.")
+        "performance for compute-heavy workloads."
+    )
 
     e = layer.num_experts
     k = layer.hidden_size
@@ -202,11 +212,9 @@ def prepare_moe_fp8_layer_for_marlin(layer: torch.nn.Module,
             if not size_k_first:
                 qweight = qweight.T.contiguous()
 
-            marlin_qweight = ops.gptq_marlin_repack(b_q_weight=qweight,
-                                                    perm=perm,
-                                                    size_k=size_k,
-                                                    size_n=size_n,
-                                                    num_bits=8)
+            marlin_qweight = ops.gptq_marlin_repack(
+                b_q_weight=qweight, perm=perm, size_k=size_k, size_n=size_n, num_bits=8
+            )
             tensor_list.append(marlin_qweight)
 
         weight = torch.cat([x.unsqueeze(0) for x in tensor_list], 0)
@@ -265,10 +273,9 @@ def prepare_moe_fp8_layer_for_marlin(layer: torch.nn.Module,
             scales = scales[..., :size_n].contiguous()
 
         for i in range(e):
-            marlin_scales = marlin_permute_scales(s=scales[i],
-                                                  size_k=size_k,
-                                                  size_n=size_n,
-                                                  group_size=group_size)
+            marlin_scales = marlin_permute_scales(
+                s=scales[i], size_k=size_k, size_n=size_n, group_size=group_size
+            )
             tensor_list.append(marlin_scales)
 
         scales = torch.cat([x.unsqueeze(0) for x in tensor_list], 0)
@@ -295,8 +302,9 @@ def prepare_moe_fp8_layer_for_marlin(layer: torch.nn.Module,
         setattr(layer, name, bias)
 
 
-def pack_fp8_to_int32(fp8_tensor: torch.Tensor,
-                      size_k_first: bool = True) -> torch.Tensor:
+def pack_fp8_to_int32(
+    fp8_tensor: torch.Tensor, size_k_first: bool = True
+) -> torch.Tensor:
     """
     Repack FP8 weights to gptq format (packed int32 elements)
     """
@@ -335,10 +343,9 @@ def marlin_quant_fp8_torch(weight, group_size):
         num_bits=8,
     )
 
-    marlin_scales = marlin_permute_scales(s=scales.T,
-                                          size_k=size_k,
-                                          size_n=size_n,
-                                          group_size=group_size)
+    marlin_scales = marlin_permute_scales(
+        s=scales.T, size_k=size_k, size_n=size_n, group_size=group_size
+    )
 
     marlin_scales = fp8_fused_exponent_bias_into_scales(marlin_scales)
 
diff --git a/vllm/model_executor/layers/quantization/utils/marlin_utils_test.py b/vllm/model_executor/layers/quantization/utils/marlin_utils_test.py
index f5acd03cc662..1bbd88d5ca71 100644
--- a/vllm/model_executor/layers/quantization/utils/marlin_utils_test.py
+++ b/vllm/model_executor/layers/quantization/utils/marlin_utils_test.py
@@ -9,24 +9,26 @@
 
 from vllm.scalar_type import ScalarType
 
-from .marlin_utils import (GPTQ_MARLIN_TILE, marlin_permute_scales,
-                           marlin_zero_points)
-from .quant_utils import (get_pack_factor, gptq_quantize_weights,
-                          quantize_weights, sort_weights)
+from .marlin_utils import GPTQ_MARLIN_TILE, marlin_permute_scales, marlin_zero_points
+from .quant_utils import (
+    get_pack_factor,
+    gptq_quantize_weights,
+    quantize_weights,
+    sort_weights,
+)
 
 
 class MarlinWorkspace:
-
     def __init__(self, out_features, min_thread_n, max_parallel):
-        assert (out_features % min_thread_n == 0), (
+        assert out_features % min_thread_n == 0, (
             "out_features = {} is indivisible by min_thread_n = {}".format(
-                out_features, min_thread_n))
+                out_features, min_thread_n
+            )
+        )
 
-        max_workspace_size = ((out_features // min_thread_n) * max_parallel)
+        max_workspace_size = (out_features // min_thread_n) * max_parallel
 
-        self.scratch = torch.zeros(max_workspace_size,
-                                   dtype=torch.int,
-                                   device="cuda")
+        self.scratch = torch.zeros(max_workspace_size, dtype=torch.int, device="cuda")
 
 
 def marlin_permute_weights(q_w, size_k, size_n, perm, tile=GPTQ_MARLIN_TILE):
@@ -54,8 +56,7 @@ def marlin_weights(q_w, size_k, size_n, num_bits, perm):
 
     q_w = q_w.cpu().numpy().astype(np.uint32)
 
-    q_packed = np.zeros((q_w.shape[0], q_w.shape[1] // pack_factor),
-                        dtype=np.uint32)
+    q_packed = np.zeros((q_w.shape[0], q_w.shape[1] // pack_factor), dtype=np.uint32)
     for i in range(pack_factor):
         q_packed |= q_w[:, i::pack_factor] << num_bits * i
 
@@ -71,10 +72,10 @@ def get_weight_perm(num_bits: int):
         col = i // 4
         for block in [0, 1]:
             for row in [
-                    2 * (i % 4),
-                    2 * (i % 4) + 1,
-                    2 * (i % 4 + 4),
-                    2 * (i % 4 + 4) + 1,
+                2 * (i % 4),
+                2 * (i % 4) + 1,
+                2 * (i % 4 + 4),
+                2 * (i % 4 + 4) + 1,
             ]:
                 perm1.append(16 * row + col + 8 * block)
         for j in range(4):
@@ -94,11 +95,13 @@ def get_weight_perm(num_bits: int):
     return perm
 
 
-def marlin_quantize(w: torch.Tensor,
-                    quant_type: ScalarType,
-                    group_size: int,
-                    act_order: bool,
-                    test_perm: Optional[torch.Tensor] = None):
+def marlin_quantize(
+    w: torch.Tensor,
+    quant_type: ScalarType,
+    group_size: int,
+    act_order: bool,
+    test_perm: Optional[torch.Tensor] = None,
+):
     size_k, size_n = w.shape
     num_bits = quant_type.size_bits
 
@@ -109,7 +112,8 @@ def marlin_quantize(w: torch.Tensor,
 
     # Quantize (and apply act_order if provided)
     w_ref, q_w, s, g_idx, rand_perm = gptq_quantize_weights(
-        w, quant_type, group_size, act_order, test_perm)
+        w, quant_type, group_size, act_order, test_perm
+    )
 
     # For act_order, sort the "weights" and "g_idx" so that group ids are
     # increasing
@@ -130,8 +134,7 @@ def marlin_quantize(w: torch.Tensor,
     return res_list
 
 
-def awq_marlin_quantize(w: torch.Tensor, quant_type: ScalarType,
-                        group_size: int):
+def awq_marlin_quantize(w: torch.Tensor, quant_type: ScalarType, group_size: int):
     size_k, size_n = w.shape
 
     # Normalize group_size
@@ -144,18 +147,13 @@ def awq_marlin_quantize(w: torch.Tensor, quant_type: ScalarType,
     num_groups = size_k // group_size
 
     # Quantize with zp
-    w_ref, q_w, s, zp = quantize_weights(w,
-                                         quant_type,
-                                         group_size,
-                                         zero_points=True)
+    w_ref, q_w, s, zp = quantize_weights(w, quant_type, group_size, zero_points=True)
 
     # Reformat to marlin
     weight_perm = get_weight_perm(quant_type.size_bits)
-    marlin_q_w = marlin_weights(q_w, size_k, size_n, quant_type.size_bits,
-                                weight_perm)
+    marlin_q_w = marlin_weights(q_w, size_k, size_n, quant_type.size_bits, weight_perm)
     marlin_s = marlin_permute_scales(s, size_k, size_n, group_size)
-    marlin_zp = marlin_zero_points(zp, num_groups, size_n,
-                                   quant_type.size_bits)
+    marlin_zp = marlin_zero_points(zp, num_groups, size_n, quant_type.size_bits)
 
     # Create result
     res_list = [w_ref, marlin_q_w, marlin_s, marlin_zp]
diff --git a/vllm/model_executor/layers/quantization/utils/marlin_utils_test_24.py b/vllm/model_executor/layers/quantization/utils/marlin_utils_test_24.py
index 1c93c364679d..90011f116bb0 100644
--- a/vllm/model_executor/layers/quantization/utils/marlin_utils_test_24.py
+++ b/vllm/model_executor/layers/quantization/utils/marlin_utils_test_24.py
@@ -26,8 +26,7 @@
 # matrix elements into reordered metadata matrix elements (or,
 # equivalently, for gathering reordered metadata matrix element back
 # into metadata matrix elements).
-def _calculate_meta_reordering_scatter_offsets(m, meta_ncols, meta_dtype,
-                                               device):
+def _calculate_meta_reordering_scatter_offsets(m, meta_ncols, meta_dtype, device):
     dst_rows = torch.arange(0, m, device=device)[:, None].repeat(1, meta_ncols)
     dst_cols = torch.arange(0, meta_ncols, device=device).repeat(m, 1)
 
@@ -35,9 +34,13 @@ def _calculate_meta_reordering_scatter_offsets(m, meta_ncols, meta_dtype,
     group_x = 64
     group_y = 32 if meta_dtype.itemsize == 2 else 16
 
-    dst_rows = (dst_rows // group_x * group_x + (dst_rows % 2) * 2 +
-                (dst_rows % 8) // 4 + ((dst_rows % group_y) % 4) // 2 * 32 +
-                ((dst_rows % group_x) // 8) * 4)
+    dst_rows = (
+        dst_rows // group_x * group_x
+        + (dst_rows % 2) * 2
+        + (dst_rows % 8) // 4
+        + ((dst_rows % group_y) % 4) // 2 * 32
+        + ((dst_rows % group_x) // 8) * 4
+    )
 
     topright = ((dst_rows % 2 == 0) & (dst_cols % 2 == 1)).to(torch.int8)
     bottomleft = ((dst_rows % 2 == 1) & (dst_cols % 2 == 0)).to(torch.int8)
@@ -50,8 +53,7 @@ def _calculate_meta_reordering_scatter_offsets(m, meta_ncols, meta_dtype,
     interleave = 2
     cols_maj = dst_cols // interleave
     cols_min = dst_cols % interleave
-    return (cols_maj * m * interleave + dst_rows * interleave +
-            cols_min).view(-1)
+    return (cols_maj * m * interleave + dst_rows * interleave + cols_min).view(-1)
 
 
 # This function converts dense matrix into sparse semi-structured
@@ -75,17 +77,18 @@ def sparse_semi_structured_from_dense_cutlass(dense):
         raise RuntimeError(f"Invalid datatype {dense.dtype} of dense matrix")
     quadbits_per_meta_elem = meta_dtype.itemsize * 8 // 4
     if quadbits_per_meta_elem not in (4, 8):
-        raise RuntimeError(
-            "Invalid number of elements per meta element calculated")
+        raise RuntimeError("Invalid number of elements per meta element calculated")
 
     if meta_dtype == torch.int32:
         if m % 16 != 0:
             raise RuntimeError(
-                f"Number of rows of dense matrix {m} must be divisible by 16")
+                f"Number of rows of dense matrix {m} must be divisible by 16"
+            )
     else:
         if m % 32 != 0:
             raise RuntimeError(
-                f"Number of rows of dense matrix {m} must be divisible by 32")
+                f"Number of rows of dense matrix {m} must be divisible by 32"
+            )
     if k % (4 * quadbits_per_meta_elem) != 0:
         raise RuntimeError(
             f"Number of columns of dense matrix {k} must be divisible by {4 * quadbits_per_meta_elem}"  # noqa: E501
@@ -146,40 +149,39 @@ def sparse_semi_structured_from_dense_cutlass(dense):
     idxs1 = bit2 | (bit3.to(torch.int64) << 1)
 
     if dense.dtype != torch.float:
-        sparse0 = dense_4.gather(
-            -1, idxs0.unsqueeze(-1))  # type: ignore[possibly-undefined]
+        sparse0 = dense_4.gather(-1, idxs0.unsqueeze(-1))  # type: ignore[possibly-undefined]
         sparse1 = dense_4.gather(-1, idxs1.unsqueeze(-1))
         sparse = torch.stack((sparse0, sparse1), dim=-1).view(m, k // 2)
     else:
-        sparse = dense_2.gather(-1,
-                                idxs0.unsqueeze(-1) // 2).view(
-                                    m,
-                                    k // 2)  # type: ignore[possibly-undefined]
+        sparse = dense_2.gather(-1, idxs0.unsqueeze(-1) // 2).view(m, k // 2)  # type: ignore[possibly-undefined]
 
     meta_4 = idxs0 | (idxs1 << 2)
-    meta_n = meta_4.view(
-        (-1, meta_ncols, quadbits_per_meta_elem)).to(meta_dtype)
+    meta_n = meta_4.view((-1, meta_ncols, quadbits_per_meta_elem)).to(meta_dtype)
 
     if quadbits_per_meta_elem == 4:
-        meta = (meta_n[:, :, 0]
-                | (meta_n[:, :, 1] << 4)
-                | (meta_n[:, :, 2] << 8)
-                | (meta_n[:, :, 3] << 12))
+        meta = (
+            meta_n[:, :, 0]
+            | (meta_n[:, :, 1] << 4)
+            | (meta_n[:, :, 2] << 8)
+            | (meta_n[:, :, 3] << 12)
+        )
     elif quadbits_per_meta_elem == 8:
-        meta = (meta_n[:, :, 0]
-                | (meta_n[:, :, 1] << 4)
-                | (meta_n[:, :, 2] << 8)
-                | (meta_n[:, :, 3] << 12)
-                | (meta_n[:, :, 4] << 16)
-                | (meta_n[:, :, 5] << 20)
-                | (meta_n[:, :, 6] << 24)
-                | (meta_n[:, :, 7] << 28))
+        meta = (
+            meta_n[:, :, 0]
+            | (meta_n[:, :, 1] << 4)
+            | (meta_n[:, :, 2] << 8)
+            | (meta_n[:, :, 3] << 12)
+            | (meta_n[:, :, 4] << 16)
+            | (meta_n[:, :, 5] << 20)
+            | (meta_n[:, :, 6] << 24)
+            | (meta_n[:, :, 7] << 28)
+        )
 
     # Reorder meta tensor elements.
-    meta_reordered = meta.new_empty(
-        (m * meta_ncols, ))  # type: ignore[possibly-undefined]
+    meta_reordered = meta.new_empty((m * meta_ncols,))  # type: ignore[possibly-undefined]
     meta_offsets = _calculate_meta_reordering_scatter_offsets(
-        m, meta_ncols, meta_dtype, device)
+        m, meta_ncols, meta_dtype, device
+    )
     meta_reordered.scatter_(0, meta_offsets, meta.view(-1))
 
     return (sparse, meta_reordered.view(m, meta_ncols))
@@ -222,13 +224,14 @@ def sparse_semi_structured_to_dense_cutlass(sparse, meta_reordered):
     if meta_ncols * ksparse * quadbits_per_meta_elem != 2 * k:
         raise RuntimeError(
             f"Number of columns of sparse matrix {k} different from the {meta_ncols * ksparse * quadbits_per_meta_elem // 2}, "  # noqa: E501
-            "expected according to the number of columns of meta matrix")
+            "expected according to the number of columns of meta matrix"
+        )
 
     # Undo meta tensor elements reordering.
     meta_offsets = _calculate_meta_reordering_scatter_offsets(
-        m, meta_ncols, meta_dtype, device)
-    meta = torch.gather(meta_reordered.view(-1), 0,
-                        meta_offsets).view(m, meta_ncols)
+        m, meta_ncols, meta_dtype, device
+    )
+    meta = torch.gather(meta_reordered.view(-1), 0, meta_offsets).view(m, meta_ncols)
 
     # Unpack sparse tensor back to original dense tensor, using
     # information provided by meta tensor.  Note that torch.float
@@ -270,16 +273,17 @@ def sparse_semi_structured_to_dense_cutlass(sparse, meta_reordered):
         meta_2[:, :, 15] = (meta >> 30) & 0b11
 
     dense_offsets = meta_2.view(-1) + (
-        torch.arange(0, 2 * m * k // ksparse, device=device) * 4).view(
-            -1, 1).repeat(1, 2).view(-1)
+        torch.arange(0, 2 * m * k // ksparse, device=device) * 4
+    ).view(-1, 1).repeat(1, 2).view(-1)
 
-    dense = torch.zeros((m * 2 * k, ), dtype=sparse.dtype, device=device)
+    dense = torch.zeros((m * 2 * k,), dtype=sparse.dtype, device=device)
     if sparse.dtype != torch.float:
         # dense.scatter_(0, dense_offsets, sparse.view(-1))
         dense.scatter_(0, dense_offsets, sparse.reshape(-1))
     else:
-        dense.view(torch.half).scatter_(0, dense_offsets,
-                                        sparse.view(torch.half).view(-1))
+        dense.view(torch.half).scatter_(
+            0, dense_offsets, sparse.view(torch.half).view(-1)
+        )
 
     return dense.view(m, 2 * k)
 
@@ -287,8 +291,8 @@ def sparse_semi_structured_to_dense_cutlass(sparse, meta_reordered):
 def mask_creator(tensor):
     """
     Class for creating N:M sparsity masks.
-    Masks will be created using the N:M ratio, where for every block of 
-    M weights, N will be pruned based on ranked weight value. Each mask 
+    Masks will be created using the N:M ratio, where for every block of
+    M weights, N will be pruned based on ranked weight value. Each mask
     will correspond to the given tensor.
 
     :param N: The number of weights in a group to keep
@@ -301,14 +305,14 @@ def mask_creator(tensor):
     # for i, tensor in enumerate(tensors):
     if tensor.numel() % M != 0:
         raise ValueError(
-            f"Tensor of size {tensor.shape} can't be evenly divided into "
-            f"{M} groups")
+            f"Tensor of size {tensor.shape} can't be evenly divided into {M} groups"
+        )
 
     num_groups = tensor.numel() // M
 
     # N:M sparsity for linear layers
     tensor_temp = tensor.detach().abs().reshape(num_groups, M)
-    index = torch.argsort(tensor_temp, dim=1)[:, :int(M - N)]
+    index = torch.argsort(tensor_temp, dim=1)[:, : int(M - N)]
 
     w_b = torch.ones(tensor_temp.shape, device=tensor_temp.device)
     mask = w_b.scatter_(dim=1, index=index, value=0).reshape(tensor.shape)
@@ -342,7 +346,7 @@ def check_24(w, num_rows_to_sample=50, _verbose=False):
     for i in sampled_row_idxs:
         for j in range(0, num_cols - BLOCK_SIZE, BLOCK_SIZE):
             total_segments += 1
-            block = w[i, j:j + BLOCK_SIZE]
+            block = w[i, j : j + BLOCK_SIZE]
             num_nonzero = torch.count_nonzero(block)
             if num_nonzero > MAX_NON_ZEROS:
                 print("i = {} j = {} block = {}".format(i, j, block))
@@ -359,8 +363,7 @@ def compress_quantized_24_weight(q_24, size_k, size_n, wtype: ScalarType):
 
     # Compress
     q_24_no_zp = q_24_no_zp.t().contiguous()
-    q_24_no_zp_comp, meta = sparse_semi_structured_from_dense_cutlass(
-        q_24_no_zp)
+    q_24_no_zp_comp, meta = sparse_semi_structured_from_dense_cutlass(q_24_no_zp)
     q_24_no_zp_comp = q_24_no_zp_comp.t().contiguous()
 
     # Restore bias
@@ -390,13 +393,12 @@ def get_weight_perm_24(num_bits: int):
         col_o = col // 2
         for block in [0, 1]:
             for row in [
-                    2 * (i % 4),
-                    2 * (i % 4) + 1,
-                    2 * (i % 4 + 4),
-                    2 * (i % 4 + 4) + 1,
+                2 * (i % 4),
+                2 * (i % 4) + 1,
+                2 * (i % 4 + 4),
+                2 * (i % 4 + 4) + 1,
             ]:
-                perm1.append(16 * row + col_o * 256 + 8 * (col % 2) +
-                             4 * block)
+                perm1.append(16 * row + col_o * 256 + 8 * (col % 2) + 4 * block)
         for j in range(4):
             perm_list.extend([p + 1 * j for p in perm1])
     perm = numpy.array(perm_list)
@@ -413,9 +415,9 @@ def get_weight_perm_24(num_bits: int):
     return perm
 
 
-def marlin_permute_scales_24(s: torch.Tensor, size_k: int, size_n: int,
-                             group_size: int) -> torch.Tensor:
-
+def marlin_permute_scales_24(
+    s: torch.Tensor, size_k: int, size_n: int, group_size: int
+) -> torch.Tensor:
     scale_perm, scale_perm_single = get_scale_perms_24()
     if group_size < size_k and group_size != -1:
         s = s.reshape((-1, len(scale_perm)))[:, scale_perm]
@@ -443,17 +445,18 @@ def marlin_24_quantize(
 
     # Quantize
     w_24_ref, q_w_24, s, g_idx, rand_perm = gptq_quantize_weights(
-        w_24, quant_type, group_size, act_order=False)
+        w_24, quant_type, group_size, act_order=False
+    )
 
     # Compress quantized weight
-    q_w_24_comp, meta = compress_quantized_24_weight(q_w_24, size_k, size_n,
-                                                     quant_type)
+    q_w_24_comp, meta = compress_quantized_24_weight(q_w_24, size_k, size_n, quant_type)
     size_k_comp = size_k // 2
 
     # Reformat to marlin
     weight_perm = get_weight_perm_24(quant_type.size_bits)
-    marlin_24_q_w_comp = marlin_weights(q_w_24_comp, size_k_comp, size_n,
-                                        quant_type.size_bits, weight_perm)
+    marlin_24_q_w_comp = marlin_weights(
+        q_w_24_comp, size_k_comp, size_n, quant_type.size_bits, weight_perm
+    )
     marlin_24_s = marlin_permute_scales_24(s, size_k, size_n, group_size)
 
     # Create result
diff --git a/vllm/model_executor/layers/quantization/utils/mxfp4_utils.py b/vllm/model_executor/layers/quantization/utils/mxfp4_utils.py
index fb1d041f3449..e1286b243f3b 100644
--- a/vllm/model_executor/layers/quantization/utils/mxfp4_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/mxfp4_utils.py
@@ -14,8 +14,7 @@
 
 
 def _swizzle_mxfp4(quant_tensor, scale, num_warps):
-    """ weight swizzle for mxfp4 moe, used for OAI mxfp4 kernel
-    """
+    """weight swizzle for mxfp4 moe, used for OAI mxfp4 kernel"""
     import triton_kernels.matmul_ogs_details.opt_flags as opt_flags
     from triton_kernels.numerics import InFlexData
     from triton_kernels.tensor import FP4, convert_layout, wrap_torch_tensor
@@ -25,30 +24,38 @@ def _swizzle_mxfp4(quant_tensor, scale, num_warps):
     value_layout_opts: dict[str, Any] = {}
     scale_layout_opts: dict[str, Any] = {}
 
-    if (current_platform.is_cuda()
-            and current_platform.is_device_capability(90)
-            and not is_torch_equal_or_newer("2.8.1")):
+    if (
+        current_platform.is_cuda()
+        and current_platform.is_device_capability(90)
+        and not is_torch_equal_or_newer("2.8.1")
+    ):
         logger.warning_once(
             "Mxfp4 on hopper is running on torch < 2.8.1, "
             "this cause swizling to be disabled, which may "
-            "cause performance degradation. Please upgrade to torch nightly")
+            "cause performance degradation. Please upgrade to torch nightly"
+        )
         value_layout = StridedLayout
         scale_layout = StridedLayout
     elif current_platform.is_rocm():
-        from triton_kernels.tensor_details.layout import (GFX950MXScaleLayout,
-                                                          StridedLayout)
+        from triton_kernels.tensor_details.layout import (
+            GFX950MXScaleLayout,
+            StridedLayout,
+        )
 
         from vllm.platforms.rocm import on_gfx950
+
         value_layout = StridedLayout
         scale_layout = GFX950MXScaleLayout if on_gfx950() else StridedLayout
     else:
-        value_layout, value_layout_opts = \
-            layout.make_default_matmul_mxfp4_w_layout(mx_axis=1)
+        value_layout, value_layout_opts = layout.make_default_matmul_mxfp4_w_layout(
+            mx_axis=1
+        )
         scale_layout, scale_layout_opts = (
             layout.make_default_matmul_mxfp4_w_scale_layout(
-                mx_axis=1, num_warps=num_warps))
-    if current_platform.is_cuda() and \
-        current_platform.is_device_capability(100):
+                mx_axis=1, num_warps=num_warps
+            )
+        )
+    if current_platform.is_cuda() and current_platform.is_device_capability(100):
         constraints = {
             "is_persistent": True,
             "epilogue_subtile": 1,
@@ -57,66 +64,83 @@ def _swizzle_mxfp4(quant_tensor, scale, num_warps):
     # transpose the tensor so that the quantization axis is on dim1
     quant_tensor = quant_tensor.transpose(-2, -1)
     scale = scale.transpose(-2, -1)
-    quant_tensor = convert_layout(wrap_torch_tensor(quant_tensor, dtype=FP4),
-                                  value_layout, **value_layout_opts)
-    scale = convert_layout(wrap_torch_tensor(scale), scale_layout,
-                           **scale_layout_opts)
+    quant_tensor = convert_layout(
+        wrap_torch_tensor(quant_tensor, dtype=FP4), value_layout, **value_layout_opts
+    )
+    scale = convert_layout(wrap_torch_tensor(scale), scale_layout, **scale_layout_opts)
     return quant_tensor, InFlexData(), scale
 
 
-def _can_support_mxfp4(use_grouped_topk: bool = False,
-                       topk_group: Optional[int] = None,
-                       num_expert_group: Optional[int] = None,
-                       expert_map: Optional[torch.Tensor] = None,
-                       custom_routing_function: Optional[Callable] = None,
-                       e_score_correction_bias: Optional[torch.Tensor] = None,
-                       apply_router_weight_on_input: bool = False,
-                       scoring_func: str = "softmax",
-                       activation: str = "swigluoai",
-                       expert_load_view: Optional[torch.Tensor] = None,
-                       logical_to_physical_map: Optional[torch.Tensor] = None,
-                       logical_replica_count: Optional[torch.Tensor] = None):
-    return not (use_grouped_topk or topk_group or num_expert_group
-                or custom_routing_function or e_score_correction_bias
-                or apply_router_weight_on_input or scoring_func != "softmax"
-                or activation != "swigluoai" or expert_load_view
-                or logical_to_physical_map or logical_replica_count)
-
-
-def _dequant_mxfp4(x: torch.Tensor, scale: torch.Tensor,
-                   float_dtype: torch.dtype) -> torch.Tensor:
+def _can_support_mxfp4(
+    use_grouped_topk: bool = False,
+    topk_group: Optional[int] = None,
+    num_expert_group: Optional[int] = None,
+    expert_map: Optional[torch.Tensor] = None,
+    custom_routing_function: Optional[Callable] = None,
+    e_score_correction_bias: Optional[torch.Tensor] = None,
+    apply_router_weight_on_input: bool = False,
+    scoring_func: str = "softmax",
+    activation: str = "swigluoai",
+    expert_load_view: Optional[torch.Tensor] = None,
+    logical_to_physical_map: Optional[torch.Tensor] = None,
+    logical_replica_count: Optional[torch.Tensor] = None,
+):
+    return not (
+        use_grouped_topk
+        or topk_group
+        or num_expert_group
+        or custom_routing_function
+        or e_score_correction_bias
+        or apply_router_weight_on_input
+        or scoring_func != "softmax"
+        or activation != "swigluoai"
+        or expert_load_view
+        or logical_to_physical_map
+        or logical_replica_count
+    )
+
+
+def _dequant_mxfp4(
+    x: torch.Tensor, scale: torch.Tensor, float_dtype: torch.dtype
+) -> torch.Tensor:
     try:
         from quark.torch.kernel import mx
     except ImportError as err:
-        raise ImportError("The package `amd-quark` is required to use "
-                          "MX-FP4 models. Please install it with `pip install "
-                          "amd-quark`.") from err
+        raise ImportError(
+            "The package `amd-quark` is required to use "
+            "MX-FP4 models. Please install it with `pip install "
+            "amd-quark`."
+        ) from err
 
     return mx.dq_mxfp4(x, scale, float_dtype)
 
 
-def _dequant_mxfp4_fake(x: torch.Tensor, scale: torch.Tensor,
-                        float_dtype: torch.dtype) -> torch.Tensor:
-    return torch.empty((*x.shape[:-1], x.shape[-1] * 2),
-                       dtype=float_dtype,
-                       device=x.device)
+def _dequant_mxfp4_fake(
+    x: torch.Tensor, scale: torch.Tensor, float_dtype: torch.dtype
+) -> torch.Tensor:
+    return torch.empty(
+        (*x.shape[:-1], x.shape[-1] * 2), dtype=float_dtype, device=x.device
+    )
 
 
-def _quant_dequant_mxfp4(x: torch.Tensor,
-                         scale_calculation_mode: str = "even") -> torch.Tensor:
+def _quant_dequant_mxfp4(
+    x: torch.Tensor, scale_calculation_mode: str = "even"
+) -> torch.Tensor:
     try:
         from quark.torch.kernel import mx
     except ImportError as err:
-        raise ImportError("The package `amd-quark` is required to use "
-                          "MX-FP4 models. Please install it with `pip install "
-                          "amd-quark`.") from err
+        raise ImportError(
+            "The package `amd-quark` is required to use "
+            "MX-FP4 models. Please install it with `pip install "
+            "amd-quark`."
+        ) from err
 
     return mx.qdq_mxfp4(x, scale_calculation_mode)
 
 
-def _quant_dequant_mxfp4_fake(x: torch.Tensor,
-                              scale_calculation_mode: str = "even"
-                              ) -> torch.Tensor:
+def _quant_dequant_mxfp4_fake(
+    x: torch.Tensor, scale_calculation_mode: str = "even"
+) -> torch.Tensor:
     return torch.empty_like(x)
 
 
diff --git a/vllm/model_executor/layers/quantization/utils/mxfp8_utils.py b/vllm/model_executor/layers/quantization/utils/mxfp8_utils.py
index 2a6b21c918f4..2d211565c19e 100644
--- a/vllm/model_executor/layers/quantization/utils/mxfp8_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/mxfp8_utils.py
@@ -9,12 +9,13 @@
 
 
 def mxfp8_quantize(x: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
-
     try:
         from flashinfer import mxfp8_quantize
     except ImportError as err:
-        raise ImportError("The package `flashinfer` is required to do "
-                          "MX-FP8 quantization. Please install it with" \
-                          "`pip install flashinfer`") from err
+        raise ImportError(
+            "The package `flashinfer` is required to do "
+            "MX-FP8 quantization. Please install it with"
+            "`pip install flashinfer`"
+        ) from err
 
     return mxfp8_quantize(x, is_sf_swizzled_layout=False)
diff --git a/vllm/model_executor/layers/quantization/utils/nvfp4_emulation_utils.py b/vllm/model_executor/layers/quantization/utils/nvfp4_emulation_utils.py
index 8648771cb017..62b480210fc0 100644
--- a/vllm/model_executor/layers/quantization/utils/nvfp4_emulation_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/nvfp4_emulation_utils.py
@@ -12,8 +12,9 @@
 
 FLOAT4_E2M1_MAX = scalar_types.float4_e2m1f.max()
 
-kE2M1ToFloat = torch.tensor([0., 0.5, 1., 1.5, 2., 3., 4., 6.],
-                            dtype=torch.float32)
+kE2M1ToFloat = torch.tensor(
+    [0.0, 0.5, 1.0, 1.5, 2.0, 3.0, 4.0, 6.0], dtype=torch.float32
+)
 
 
 def break_fp4_bytes(a, dtype):
@@ -45,12 +46,9 @@ def convert_swizzled_to_linear(a_sf_swizzled: torch.Tensor, m, k, block_size):
     return out[0:m, 0:k]
 
 
-def dequantize_to_dtype(tensor_fp4,
-                        tensor_sf,
-                        global_scale,
-                        dtype,
-                        device,
-                        block_size=16):
+def dequantize_to_dtype(
+    tensor_fp4, tensor_sf, global_scale, dtype, device, block_size=16
+):
     """Dequantize the fp4 tensor back to high precision."""
     # Two fp4 values are packed into one uint8.
     assert tensor_fp4.dtype == torch.uint8
@@ -95,8 +93,7 @@ def ref_nvfp4_quant(x, global_scale, block_size):
     assert x.ndim == 2
     m, n = x.shape
     x = torch.reshape(x, (m, n // block_size, block_size))
-    vec_max = torch.max(torch.abs(x), dim=-1,
-                        keepdim=True)[0].to(torch.float32)
+    vec_max = torch.max(torch.abs(x), dim=-1, keepdim=True)[0].to(torch.float32)
     scale = global_scale * (vec_max * get_reciprocal(FLOAT4_E2M1_MAX))
     scale = torch.clamp(scale, max=448, min=-448)
     scale = scale.to(torch.float8_e4m3fn).to(torch.float32)
@@ -108,10 +105,13 @@ def ref_nvfp4_quant(x, global_scale, block_size):
     return cast_to_fp4(clipped_x), scale.squeeze(-1)
 
 
-def run_nvfp4_emulations(x: torch.Tensor, input_global_scale: torch.Tensor,
-                         weight: torch.Tensor,
-                         weight_scale_swizzled: torch.Tensor,
-                         weight_global_scale: torch.Tensor):
+def run_nvfp4_emulations(
+    x: torch.Tensor,
+    input_global_scale: torch.Tensor,
+    weight: torch.Tensor,
+    weight_scale_swizzled: torch.Tensor,
+    weight_global_scale: torch.Tensor,
+):
     group_size = 16
     x_m, x_k = x.shape
     output_dtype = x.dtype
@@ -127,9 +127,14 @@ def run_nvfp4_emulations(x: torch.Tensor, input_global_scale: torch.Tensor,
 
     # dequantize weight
     w_fp4 = weight.data.view(torch.uint8)
-    w_dq = dequantize_to_dtype(w_fp4, weight_scale_swizzled.data,
-                               weight_global_scale, output_dtype, x.device,
-                               group_size)
+    w_dq = dequantize_to_dtype(
+        w_fp4,
+        weight_scale_swizzled.data,
+        weight_global_scale,
+        output_dtype,
+        x.device,
+        group_size,
+    )
 
     # matmul
     out = torch.matmul(x_dq, w_dq.t())
diff --git a/vllm/model_executor/layers/quantization/utils/nvfp4_moe_support.py b/vllm/model_executor/layers/quantization/utils/nvfp4_moe_support.py
index 21af74c6b72b..c3f26cc77411 100644
--- a/vllm/model_executor/layers/quantization/utils/nvfp4_moe_support.py
+++ b/vllm/model_executor/layers/quantization/utils/nvfp4_moe_support.py
@@ -5,11 +5,14 @@
 import vllm.envs as envs
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.utils.flashinfer_fp4_moe import (
-    is_flashinfer_fp4_cutlass_moe_available)
+    is_flashinfer_fp4_cutlass_moe_available,
+)
 from vllm.model_executor.layers.quantization.utils.marlin_utils_fp4 import (
-    is_fp4_marlin_supported)
+    is_fp4_marlin_supported,
+)
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    cutlass_fp4_supported)
+    cutlass_fp4_supported,
+)
 
 __all__ = ["detect_nvfp4_moe_support", "NvFp4Support"]
 
@@ -29,12 +32,12 @@ def detect_nvfp4_moe_support(class_name: str = "") -> NvFp4Support:
     """Detect platform support for NV-FP4 fused-MoE path"""
     cutlass_supported = cutlass_fp4_supported()
 
-    allow_flashinfer = (cutlass_supported
-                        and is_flashinfer_fp4_cutlass_moe_available())
+    allow_flashinfer = cutlass_supported and is_flashinfer_fp4_cutlass_moe_available()
 
     if allow_flashinfer:
-        _logger.info_once("Using FlashInfer kernels for %s.", class_name
-                          or "NVFP4 path")
+        _logger.info_once(
+            "Using FlashInfer kernels for %s.", class_name or "NVFP4 path"
+        )
     else:
         if envs.VLLM_USE_FLASHINFER_MOE_FP4:
             _logger.warning_once(
@@ -50,7 +53,8 @@ def detect_nvfp4_moe_support(class_name: str = "") -> NvFp4Support:
         else:
             raise ValueError(
                 "Current platform does not support NVFP4 quantization. "
-                "Please use Blackwell GPUs or enable FlashInfer.")
+                "Please use Blackwell GPUs or enable FlashInfer."
+            )
 
     return NvFp4Support(
         cutlass_supported=cutlass_supported,
diff --git a/vllm/model_executor/layers/quantization/utils/petit_utils.py b/vllm/model_executor/layers/quantization/utils/petit_utils.py
index 00d3def1db81..1f053103fc3c 100644
--- a/vllm/model_executor/layers/quantization/utils/petit_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/petit_utils.py
@@ -11,14 +11,15 @@
 # 1. Create a global variable as a placeholder for the module
 _petit_kernel: Optional["ModuleType"] = None
 
-_PETIT_INSTALL_MSG = ("Petit is not installed. Please install it with "
-                      "`pip install petit-kernel`.")
+_PETIT_INSTALL_MSG = (
+    "Petit is not installed. Please install it with `pip install petit-kernel`."
+)
 
 
 def _import_petit_kernel() -> "ModuleType":
     """
     A helper function to handle the lazy import.
-    The first time this function is called, it will import the petit_kernel 
+    The first time this function is called, it will import the petit_kernel
     library and store it in the global _petit_kernel variable.
     Subsequent calls will return the already-loaded module directly.
     """
@@ -28,6 +29,7 @@ def _import_petit_kernel() -> "ModuleType":
 
     try:
         import petit_kernel
+
         _petit_kernel = petit_kernel
         return _petit_kernel
     except ImportError:
@@ -41,14 +43,16 @@ def _import_petit_kernel() -> "ModuleType":
 
 
 def _check_petit_nvfp4_supported(
-        quant_method: str,
-        group_size: Optional[int]) -> tuple[bool, Optional[str]]:
+    quant_method: str, group_size: Optional[int]
+) -> tuple[bool, Optional[str]]:
     if quant_method != "NVFP4":
         return (
             False,
-            ("Petit currently only supports: NVFP4 quantizations in sglang. "
-             "Please check the `hf_quant_config.json` file for your model's "
-             "quant configuration."),
+            (
+                "Petit currently only supports: NVFP4 quantizations in sglang. "
+                "Please check the `hf_quant_config.json` file for your model's "
+                "quant configuration."
+            ),
         )
     if group_size is not None and group_size != 16:
         return (
@@ -58,10 +62,8 @@ def _check_petit_nvfp4_supported(
     return (True, None)
 
 
-def verify_petit_nvfp4_supported(quant_method: str,
-                                 group_size: Optional[int]) -> None:
-    supported, error_msg = _check_petit_nvfp4_supported(
-        quant_method, group_size)
+def verify_petit_nvfp4_supported(quant_method: str, group_size: Optional[int]) -> None:
+    supported, error_msg = _check_petit_nvfp4_supported(quant_method, group_size)
     if not supported:
         assert error_msg is not None
         raise ValueError(error_msg)
@@ -77,15 +79,15 @@ def prepare_nvfp4_layer_for_petit(layer: torch.nn.Module) -> None:
     qweight = layer.weight.view(torch.int32).contiguous()
 
     # 3. Call functions through the imported module variable.
-    petit_qweight = petit_kernel.repack_nvfp4(qweight,
-                                              size_n=part_size_n,
-                                              size_k=part_size_k)
+    petit_qweight = petit_kernel.repack_nvfp4(
+        qweight, size_n=part_size_n, size_k=part_size_k
+    )
     layer.weight = torch.nn.Parameter(petit_qweight, requires_grad=False)
 
     # Permute scales
-    weight_scale = petit_kernel.process_nvfp4_scales(scales=layer.weight_scale,
-                                                     size_k=part_size_k,
-                                                     size_n=part_size_n)
+    weight_scale = petit_kernel.process_nvfp4_scales(
+        scales=layer.weight_scale, size_k=part_size_k, size_n=part_size_n
+    )
     layer.weight_scale = torch.nn.Parameter(weight_scale, requires_grad=False)
 
 
@@ -102,7 +104,7 @@ def apply_petit_nvfp4_linear(
     petit_kernel = _import_petit_kernel()
 
     reshaped_x = input.reshape(-1, input.shape[-1])
-    out_shape = input.shape[:-1] + (size_n, )
+    out_shape = input.shape[:-1] + (size_n,)
 
     # TODO: Use auto-tuning to find the performant solution_id
     # Call the function via the module variable.
diff --git a/vllm/model_executor/layers/quantization/utils/quant_utils.py b/vllm/model_executor/layers/quantization/utils/quant_utils.py
index acd9058fe694..2e9b279465f9 100644
--- a/vllm/model_executor/layers/quantization/utils/quant_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/quant_utils.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """This file is used for /tests and /benchmarks"""
+
 from collections.abc import Mapping
 from dataclasses import dataclass
 from types import MappingProxyType
@@ -31,8 +32,8 @@ class GroupShape(_GroupShape):
     """
 
     # Aliases for common quantization group shapes
-    PER_TENSOR: ClassVar['GroupShape']
-    PER_TOKEN: ClassVar['GroupShape']
+    PER_TENSOR: ClassVar["GroupShape"]
+    PER_TOKEN: ClassVar["GroupShape"]
 
     def is_per_tensor(self) -> bool:
         return self.row == -1 and self.col == -1
@@ -56,18 +57,26 @@ class ScaleDesc:
     static: static scale if True, dynamic if False
     group_shape: group shape of the scale
     """
+
     dtype: torch.dtype
     static: bool
     group_shape: GroupShape
 
     def __str__(self):
-        group_shape = ('per_tensor'
-                       if self.group_shape == GroupShape.PER_TENSOR else
-                       ('per_token' if self.group_shape == GroupShape.PER_TOKEN
-                        else str(self.group_shape)))
-
-        return (f"{fx.graph.dtype_abbrs[self.dtype]},"
-                f"{'static' if self.static else 'dynamic'},{group_shape}")
+        group_shape = (
+            "per_tensor"
+            if self.group_shape == GroupShape.PER_TENSOR
+            else (
+                "per_token"
+                if self.group_shape == GroupShape.PER_TOKEN
+                else str(self.group_shape)
+            )
+        )
+
+        return (
+            f"{fx.graph.dtype_abbrs[self.dtype]},"
+            f"{'static' if self.static else 'dynamic'},{group_shape}"
+        )
 
 
 @dataclass(frozen=True)
@@ -79,6 +88,7 @@ class QuantKey:
     scale2: second-level scale descriptor
     symmetric: symmetric if True, asymmetric if False
     """
+
     dtype: torch.dtype
     scale: ScaleDesc
     scale2: Optional[ScaleDesc] = None
@@ -86,9 +96,11 @@ class QuantKey:
 
     def __str__(self):
         scale2_str = f"scale2({self.scale2})," if self.scale2 else ""
-        return (f"QuantKey({fx.graph.dtype_abbrs[self.dtype]},"
-                f"scale({self.scale}),{scale2_str}"
-                f"{'a' if not self.symmetric else ''}symmetric)")
+        return (
+            f"QuantKey({fx.graph.dtype_abbrs[self.dtype]},"
+            f"scale({self.scale}),{scale2_str}"
+            f"{'a' if not self.symmetric else ''}symmetric)"
+        )
 
 
 kStaticTensorScale = ScaleDesc(torch.float32, True, GroupShape.PER_TENSOR)
@@ -101,16 +113,16 @@ def __str__(self):
 kFp8DynamicTokenSym = QuantKey(FP8_DTYPE, kDynamicTokenScale, symmetric=True)
 
 kNvfp4GroupScale = ScaleDesc(FP8_DTYPE, False, GroupShape(1, 16))
-kNvfp4Quant = QuantKey(FP4_DTYPE,
-                       scale=kNvfp4GroupScale,
-                       scale2=kStaticTensorScale)
+kNvfp4Quant = QuantKey(FP4_DTYPE, scale=kNvfp4GroupScale, scale2=kStaticTensorScale)
 
 
 # Normalize the group_shape to the full extent for any dims that are -1
 def _normalize_quant_group_shape(x: torch.Tensor, group_shape: GroupShape):
     # -1 means full extent
-    return (group_shape[0] if group_shape[0] > 0 else x.shape[-2],
-            group_shape[1] if group_shape[1] > 0 else x.shape[-1])
+    return (
+        group_shape[0] if group_shape[0] > 0 else x.shape[-2],
+        group_shape[1] if group_shape[1] > 0 else x.shape[-1],
+    )
 
 
 # Useful when treating N-dimensional group scaling as extended numpy-style
@@ -131,9 +143,11 @@ def group_broadcast(t, shape):
     for i, s in enumerate(shape):
         if t.shape[i] != s and t.shape[i] != 1:
             assert s % t.shape[i] == 0
-            t = t.unsqueeze(i + 1)\
-                .expand(*t.shape[:i+1], s // t.shape[i], *t.shape[i+1:])\
+            t = (
+                t.unsqueeze(i + 1)
+                .expand(*t.shape[: i + 1], s // t.shape[i], *t.shape[i + 1 :])
                 .flatten(i, i + 1)
+            )
     return t
 
 
@@ -151,9 +165,10 @@ def scaled_quantize(
     quant_dtype: torch.dtype,
 ) -> tuple[torch.Tensor, torch.Tensor]:
     group_shape = _normalize_quant_group_shape(x, group_shape)
-    assert quant_dtype.is_floating_point, \
-        "currently `scaled_quantize` only supports floating point dtypes " \
+    assert quant_dtype.is_floating_point, (
+        "currently `scaled_quantize` only supports floating point dtypes "
         "but could be extended to support other dtypes"
+    )
 
     finfo = torch.finfo(quant_dtype)
 
@@ -175,11 +190,13 @@ def scaled_quantize(
 
     # Apply scale and convert form:
     # (BLK_M, BLK_N, BLOCK_SIZE_M * BLOCK_SIZE_N) to (M, N)
-    x_scl_sat = (x_blkd_permd * scale.unsqueeze(-1))\
-        .clamp(min=finfo.min, max=finfo.max)\
-        .reshape(blk_m, blk_n, group_shape[0], group_shape[1])\
-        .permute(0, 2, 1, 3)\
+    x_scl_sat = (
+        (x_blkd_permd * scale.unsqueeze(-1))
+        .clamp(min=finfo.min, max=finfo.max)
+        .reshape(blk_m, blk_n, group_shape[0], group_shape[1])
+        .permute(0, 2, 1, 3)
         .reshape(x.shape)
+    )
 
     return x_scl_sat.to(quant_dtype).contiguous(), scale.float().reciprocal()
 
@@ -200,7 +217,8 @@ def scaled_dequantize(
         if group_shape is None:
             raise AssertionError(
                 "if x_s is 1D tensor, group_shape must be provided otherwise "
-                "its ambiguous which dimension to broadcast x_s to")
+                "its ambiguous which dimension to broadcast x_s to"
+            )
         # unsqueeze the scales for the dimension where we want to broadcast
         # across the full extent
         if group_shape[0] == x_q.shape[-2]:
@@ -210,7 +228,8 @@ def scaled_dequantize(
         else:
             raise AssertionError(
                 "if x_s is a vector we should be broadcasting it to the full "
-                "extent of one of the dimensions")
+                "extent of one of the dimensions"
+            )
 
     if group_shape is not None:
         assert x_s.shape[-1] == x_q.shape[-1] // group_shape[1]
@@ -219,9 +238,9 @@ def scaled_dequantize(
     return (x_q.to(torch.float32) * x_s).to(out_dtype)
 
 
-def pack_quantized_values_into_int32(w_q: torch.Tensor,
-                                     wtype: ScalarType,
-                                     packed_dim: int = 0):
+def pack_quantized_values_into_int32(
+    w_q: torch.Tensor, wtype: ScalarType, packed_dim: int = 0
+):
     # move dim to pack to the end
     perm = (*[i for i in range(len(w_q.shape)) if i != packed_dim], packed_dim)
     inv_perm = tuple(perm.index(i) for i in range(len(perm)))
@@ -241,9 +260,9 @@ def pack_quantized_values_into_int32(w_q: torch.Tensor,
     return res.permute(inv_perm)
 
 
-def unpack_quantized_values_into_int32(w_q: torch.Tensor,
-                                       wtype: ScalarType,
-                                       packed_dim: int = 0):
+def unpack_quantized_values_into_int32(
+    w_q: torch.Tensor, wtype: ScalarType, packed_dim: int = 0
+):
     # move dim to pack to the end
     perm = (*[i for i in range(len(w_q.shape)) if i != packed_dim], packed_dim)
     inv_perm = tuple(perm.index(i) for i in range(len(perm)))
@@ -265,7 +284,7 @@ def unpack_quantized_values_into_int32(w_q: torch.Tensor,
 def is_layer_skipped(
     prefix: str,
     ignored_layers: list[str],
-    fused_mapping: Mapping[str, list[str]] = MappingProxyType({})
+    fused_mapping: Mapping[str, list[str]] = MappingProxyType({}),
 ) -> bool:
     # prefix: model.layers.0.self_attn.q_proj
     # proj_name: q_proj
@@ -291,12 +310,16 @@ def is_layer_skipped(
                 raise ValueError(
                     f"Detected some but not all shards of {prefix} "
                     "are quantized. All shards of fused layers "
-                    "to have the same precision.")
+                    "to have the same precision."
+                )
     elif "experts" in prefix:
-        return any([
-            prefix in layer_name for layer_name in ignored_layers
-            if "experts" in layer_name
-        ])
+        return any(
+            [
+                prefix in layer_name
+                for layer_name in ignored_layers
+                if "experts" in layer_name
+            ]
+        )
     else:
         is_skipped = prefix in ignored_layers
 
@@ -309,16 +332,18 @@ def get_pack_factor(num_bits):
     return 32 // num_bits
 
 
-def permute_rows(q_w: torch.Tensor,
-                 w_ref: torch.Tensor,
-                 group_size: int,
-                 test_perm: Optional[torch.Tensor] = None):
+def permute_rows(
+    q_w: torch.Tensor,
+    w_ref: torch.Tensor,
+    group_size: int,
+    test_perm: Optional[torch.Tensor] = None,
+):
     assert q_w.shape == w_ref.shape
 
     orig_device = q_w.device
     k_size, _ = q_w.shape
 
-    g_idx = torch.zeros((k_size, ), dtype=torch.int32)
+    g_idx = torch.zeros((k_size,), dtype=torch.int32)
     for i in range(k_size):
         g_idx[i] = i // group_size
 
@@ -337,16 +362,20 @@ def permute_rows(q_w: torch.Tensor,
     )
 
 
-def quantize_weights(w: torch.Tensor,
-                     quant_type: ScalarType,
-                     group_size: Optional[int],
-                     zero_points: bool = False,
-                     ref_zero_points_after_scales: bool = False):
-    assert quant_type.is_integer(), \
+def quantize_weights(
+    w: torch.Tensor,
+    quant_type: ScalarType,
+    group_size: Optional[int],
+    zero_points: bool = False,
+    ref_zero_points_after_scales: bool = False,
+):
+    assert quant_type.is_integer(), (
         "Floating point quantization may work but has not been tested"
-    assert not zero_points or group_size is not None, \
-        "to have group zero points, group_size must be provided "\
+    )
+    assert not zero_points or group_size is not None, (
+        "to have group zero points, group_size must be provided "
         "(-1 group_size is channelwise)"
+    )
 
     orig_device = w.device
     orig_type = w.dtype
@@ -376,14 +405,16 @@ def quantize_weights(w: torch.Tensor,
         if zero_points:
             assert not quant_type.is_signed() and quant_type.max() > 0
             w_s = (max_val - min_val).clamp(min=1e-5) / quant_type.max()
-            maybe_w_zp = torch.round(torch.abs(min_val / w_s)) \
-                .clamp(min_q_val, max_q_val).int()
+            maybe_w_zp = (
+                torch.round(torch.abs(min_val / w_s)).clamp(min_q_val, max_q_val).int()
+            )
         else:
             # If the bias is such that there are no possible negative/positive
             #  values, set the max value to inf to avoid divide by 0
             w_s = torch.max(
                 abs(max_val / (max_q_val if max_q_val != 0 else torch.inf)),
-                abs(min_val / (min_q_val if min_q_val != 0 else torch.inf)))
+                abs(min_val / (min_q_val if min_q_val != 0 else torch.inf)),
+            )
 
     # Quantize
     w_q = torch.round(w / w_s).int() + (maybe_w_zp if zero_points else 0)
@@ -430,19 +461,22 @@ def reshape_w(w):
 SUPPORTED_GROUP_SIZES = [-1, 32, 64, 128]
 
 
-def gptq_quantize_weights(w: torch.Tensor,
-                          quant_type: ScalarType,
-                          group_size: int,
-                          act_order: bool,
-                          test_perm: Optional[torch.Tensor] = None):
+def gptq_quantize_weights(
+    w: torch.Tensor,
+    quant_type: ScalarType,
+    group_size: int,
+    act_order: bool,
+    test_perm: Optional[torch.Tensor] = None,
+):
     size_k, _ = w.shape
 
     assert w.is_floating_point(), "w must be float"
-    assert quant_type in SUPPORTED_GPTQ_QUANT_TYPES, \
+    assert quant_type in SUPPORTED_GPTQ_QUANT_TYPES, (
         f"Unsupported gptq type = {quant_type}"
-    assert group_size in SUPPORTED_GROUP_SIZES + [
-        size_k
-    ], f"Unsupported groupsize = {group_size}"
+    )
+    assert group_size in SUPPORTED_GROUP_SIZES + [size_k], (
+        f"Unsupported groupsize = {group_size}"
+    )
 
     w_ref, w_q, w_s, _ = quantize_weights(w, quant_type, group_size)
 
@@ -450,13 +484,13 @@ def gptq_quantize_weights(w: torch.Tensor,
     g_idx = torch.empty(0, dtype=torch.int, device=w.device)
     rand_perm = torch.empty(0, dtype=torch.int, device=w.device)
     if act_order:
-        assert (
-            group_size < size_k
-        ), "For act_order, groupsize = {} must be less than size_k = {}".format(
-            group_size, size_k)
+        assert group_size < size_k, (
+            "For act_order, groupsize = {} must be less than size_k = {}".format(
+                group_size, size_k
+            )
+        )
 
-        w_ref, w_q, g_idx, rand_perm = permute_rows(w_q, w_ref, group_size,
-                                                    test_perm)
+        w_ref, w_q, g_idx, rand_perm = permute_rows(w_q, w_ref, group_size, test_perm)
 
     return w_ref, w_q, w_s, g_idx, rand_perm
 
@@ -464,8 +498,7 @@ def gptq_quantize_weights(w: torch.Tensor,
 def sort_weights(q_w: torch.Tensor, g_idx: torch.Tensor):
     orig_device = q_w.device
 
-    sort_indices = torch.argsort(g_idx).to(
-        dtype=torch.int32)  # Sort based on g_idx
+    sort_indices = torch.argsort(g_idx).to(dtype=torch.int32)  # Sort based on g_idx
 
     g_idx = g_idx[sort_indices].contiguous()
     q_w = q_w[sort_indices, :].contiguous()
@@ -535,10 +568,11 @@ def unpack_cols(
 ):
     pack_factor = get_pack_factor(num_bits)
     assert size_n % pack_factor == 0
-    assert packed_q_w.shape == (
-        size_k, size_n // pack_factor
-    ), "packed_q_w.shape = {} size_k = {}, size_n = {} pack_Factor = {}".format(
-        packed_q_w.shape, size_k, size_n, pack_factor)
+    assert packed_q_w.shape == (size_k, size_n // pack_factor), (
+        "packed_q_w.shape = {} size_k = {}, size_n = {} pack_Factor = {}".format(
+            packed_q_w.shape, size_k, size_n, pack_factor
+        )
+    )
 
     orig_device = packed_q_w.device
 
@@ -604,7 +638,8 @@ def swizzle_blockscale(scale: torch.Tensor) -> torch.Tensor:
     """
     assert scale.dtype == torch.float8_e4m3fn, (
         "swizzle_blockscale expects the input tensor to be in "
-        "torch.float8_e4m3fn format.")
+        "torch.float8_e4m3fn format."
+    )
 
     scale_ndim = scale.ndim
     if scale_ndim == 2:
@@ -619,9 +654,9 @@ def _round_up(x: int, m: int) -> int:
     M_padded = _round_up(M, 128)
     K_padded = _round_up(K, 4)
 
-    padded = torch.zeros((B, M_padded, K_padded),
-                         dtype=scale.dtype,
-                         device=scale.device)
+    padded = torch.zeros(
+        (B, M_padded, K_padded), dtype=scale.dtype, device=scale.device
+    )
     padded[:B, :M, :K] = scale
 
     # Reshape / permute to the layout required by the kernel.
diff --git a/vllm/model_executor/layers/quantization/utils/w8a8_utils.py b/vllm/model_executor/layers/quantization/utils/w8a8_utils.py
index b434b7acfea8..c26cd4f28cb6 100644
--- a/vllm/model_executor/layers/quantization/utils/w8a8_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/w8a8_utils.py
@@ -10,8 +10,7 @@
 from vllm import envs
 from vllm.config import CompilationLevel, get_current_vllm_config
 from vllm.model_executor.layers.quantization.input_quant_fp8 import QuantFP8
-from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    GroupShape)
+from vllm.model_executor.layers.quantization.utils.quant_utils import GroupShape
 from vllm.platforms import current_platform
 from vllm.utils import direct_register_custom_op
 from vllm.utils.flashinfer import flashinfer_scaled_fp8_mm, has_flashinfer
@@ -24,9 +23,11 @@
 # torch._scaled_mm rowwise feature.
 # The condition is determined once as the operations
 # are time-consuming.
-USE_ROWWISE_TORCH_SCALED_MM = (current_platform.is_rocm() and version.parse(
-    torch.__version__) >= version.parse("2.7")
-                               and current_platform.has_device_capability(94))
+USE_ROWWISE_TORCH_SCALED_MM = (
+    current_platform.is_rocm()
+    and version.parse(torch.__version__) >= version.parse("2.7")
+    and current_platform.has_device_capability(94)
+)
 
 
 def sparse_cutlass_supported() -> bool:
@@ -74,8 +75,8 @@ def cutlass_group_gemm_supported() -> bool:
 
 
 def per_tensor_dequantize(
-        tensor: torch.Tensor, inv_scale: Union[float,
-                                               torch.Tensor]) -> torch.Tensor:
+    tensor: torch.Tensor, inv_scale: Union[float, torch.Tensor]
+) -> torch.Tensor:
     fake_qweight = tensor.to(torch.float16)
     dq_weight = fake_qweight * inv_scale
     return dq_weight
@@ -87,12 +88,12 @@ def all_close_1d(x: torch.Tensor) -> bool:
 
 
 def convert_to_channelwise(
-        weight_scale: torch.Tensor,
-        logical_widths: list[int]) -> tuple[torch.Tensor, torch.Tensor]:
+    weight_scale: torch.Tensor, logical_widths: list[int]
+) -> tuple[torch.Tensor, torch.Tensor]:
     # Create channelwise buffer
-    weight_scale_channel = torch.empty((sum(logical_widths), 1),
-                                       dtype=torch.float32,
-                                       device=weight_scale.device)
+    weight_scale_channel = torch.empty(
+        (sum(logical_widths), 1), dtype=torch.float32, device=weight_scale.device
+    )
 
     # Expand each scale to match the size of each logical matrix.
     start = 0
@@ -105,8 +106,8 @@ def convert_to_channelwise(
 
 
 def requantize_with_max_scale(
-        weight: torch.Tensor, weight_scale: torch.Tensor,
-        logical_widths: list[int]) -> tuple[torch.Tensor, torch.Tensor]:
+    weight: torch.Tensor, weight_scale: torch.Tensor, logical_widths: list[int]
+) -> tuple[torch.Tensor, torch.Tensor]:
     # Max scale to be used for requanitzation.
     max_w_scale = weight_scale.max()
 
@@ -116,8 +117,9 @@ def requantize_with_max_scale(
     # from disk in this case. Skip requantization in this case (since)
     # we already are quantized with the single scale.
     # * Sample Model: nm-testing/Phi-3-mini-128k-instruct-FP8
-    unfused_module_in_checkpoint = (weight_scale[-1]
-                                    > torch.finfo(torch.float8_e4m3fn).min)
+    unfused_module_in_checkpoint = (
+        weight_scale[-1] > torch.finfo(torch.float8_e4m3fn).min
+    )
 
     # If unfused checkpoint, need requanize with the single scale.
     if unfused_module_in_checkpoint:
@@ -127,10 +129,8 @@ def requantize_with_max_scale(
             if logical_width == 0:
                 continue
             end = start + logical_width
-            weight_dq = per_tensor_dequantize(weight[start:end, :],
-                                              weight_scale[idx])
-            weight[start:end, :], _ = ops.scaled_fp8_quant(
-                weight_dq, max_w_scale)
+            weight_dq = per_tensor_dequantize(weight[start:end, :], weight_scale[idx])
+            weight[start:end, :], _ = ops.scaled_fp8_quant(weight_dq, max_w_scale)
             start = end
 
     return max_w_scale, weight
@@ -143,75 +143,102 @@ def maybe_create_device_identity():
         TORCH_DEVICE_IDENTITY = torch.ones(1, dtype=torch.float32)
 
 
-def cutlass_w8a8_scaled_mm(*, qinput: torch.Tensor, weight: torch.Tensor,
-                           out_dtype: torch.dtype, scale_a: torch.Tensor,
-                           scale_b: torch.Tensor, bias: torch.Tensor,
-                           output_shape: list, **kwargs) -> torch.Tensor:
-
+def cutlass_w8a8_scaled_mm(
+    *,
+    qinput: torch.Tensor,
+    weight: torch.Tensor,
+    out_dtype: torch.dtype,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    bias: torch.Tensor,
+    output_shape: list,
+    **kwargs,
+) -> torch.Tensor:
     # Fused GEMM_DQ
-    output = ops.cutlass_scaled_mm(qinput,
-                                   weight,
-                                   out_dtype=out_dtype,
-                                   scale_a=scale_a,
-                                   scale_b=scale_b,
-                                   bias=bias)
+    output = ops.cutlass_scaled_mm(
+        qinput, weight, out_dtype=out_dtype, scale_a=scale_a, scale_b=scale_b, bias=bias
+    )
     return output.view(*output_shape)
 
 
-def flashinfer_w8a8_scaled_mm(*, qinput: torch.Tensor, weight: torch.Tensor,
-                              out_dtype: torch.dtype, scale_a: torch.Tensor,
-                              scale_b: torch.Tensor, bias: torch.Tensor,
-                              output_shape: list, **kwargs) -> torch.Tensor:
-
-    return flashinfer_scaled_fp8_mm(qinput,
-                                    weight,
-                                    out_dtype=out_dtype,
-                                    scale_a=scale_a,
-                                    scale_b=scale_b,
-                                    bias=bias)
-
-
-def rocm_per_tensor_w8a8_scaled_mm_impl(qinput: torch.Tensor,
-                                        weight: torch.Tensor,
-                                        out_dtype: torch.dtype,
-                                        scale_a: torch.Tensor,
-                                        scale_b: torch.Tensor,
-                                        bias: torch.Tensor) -> torch.Tensor:
+def flashinfer_w8a8_scaled_mm(
+    *,
+    qinput: torch.Tensor,
+    weight: torch.Tensor,
+    out_dtype: torch.dtype,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    bias: torch.Tensor,
+    output_shape: list,
+    **kwargs,
+) -> torch.Tensor:
+    return flashinfer_scaled_fp8_mm(
+        qinput, weight, out_dtype=out_dtype, scale_a=scale_a, scale_b=scale_b, bias=bias
+    )
+
+
+def rocm_per_tensor_w8a8_scaled_mm_impl(
+    qinput: torch.Tensor,
+    weight: torch.Tensor,
+    out_dtype: torch.dtype,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    bias: torch.Tensor,
+) -> torch.Tensor:
     from vllm.platforms.rocm import on_mi3xx
-    if envs.VLLM_ROCM_USE_SKINNY_GEMM and on_mi3xx() and \
-            qinput.shape[0] == 1 and \
-            qinput.shape[1] % 16 == 0 and \
-            ((bias is None) or (bias.dtype == out_dtype)) :
-        output = ops.wvSplitKQ(weight.t(), qinput, out_dtype, scale_a, scale_b,
-                               current_platform.get_cu_count(), bias)
+
+    if (
+        envs.VLLM_ROCM_USE_SKINNY_GEMM
+        and on_mi3xx()
+        and qinput.shape[0] == 1
+        and qinput.shape[1] % 16 == 0
+        and ((bias is None) or (bias.dtype == out_dtype))
+    ):
+        output = ops.wvSplitKQ(
+            weight.t(),
+            qinput,
+            out_dtype,
+            scale_a,
+            scale_b,
+            current_platform.get_cu_count(),
+            bias,
+        )
     else:
-        output = torch._scaled_mm(qinput,
-                                  weight,
-                                  out_dtype=out_dtype,
-                                  scale_a=scale_a,
-                                  scale_b=scale_b,
-                                  bias=bias)
+        output = torch._scaled_mm(
+            qinput,
+            weight,
+            out_dtype=out_dtype,
+            scale_a=scale_a,
+            scale_b=scale_b,
+            bias=bias,
+        )
     return output
 
 
-def rocm_per_tensor_w8a8_scaled_mm_fake(qinput: torch.Tensor,
-                                        weight: torch.Tensor,
-                                        out_dtype: torch.dtype,
-                                        scale_a: torch.Tensor,
-                                        scale_b: torch.Tensor,
-                                        bias: torch.Tensor) -> torch.Tensor:
-    return qinput.new_empty((*qinput.shape[:-1], weight.shape[1]),
-                            dtype=out_dtype)
+def rocm_per_tensor_w8a8_scaled_mm_fake(
+    qinput: torch.Tensor,
+    weight: torch.Tensor,
+    out_dtype: torch.dtype,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    bias: torch.Tensor,
+) -> torch.Tensor:
+    return qinput.new_empty((*qinput.shape[:-1], weight.shape[1]), dtype=out_dtype)
 
 
-def rocm_per_tensor_w8a8_scaled_mm(*, qinput: torch.Tensor,
-                                   weight: torch.Tensor,
-                                   out_dtype: torch.dtype,
-                                   scale_a: torch.Tensor,
-                                   scale_b: torch.Tensor, bias: torch.Tensor,
-                                   output_shape: list) -> torch.Tensor:
+def rocm_per_tensor_w8a8_scaled_mm(
+    *,
+    qinput: torch.Tensor,
+    weight: torch.Tensor,
+    out_dtype: torch.dtype,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    bias: torch.Tensor,
+    output_shape: list,
+) -> torch.Tensor:
     output = torch.ops.vllm.rocm_per_tensor_w8a8_scaled_mm_impl(
-        qinput, weight, out_dtype, scale_a, scale_b, bias)
+        qinput, weight, out_dtype, scale_a, scale_b, bias
+    )
     return torch.narrow(output, 0, 0, qinput.shape[0]).view(*output_shape)
 
 
@@ -222,18 +249,19 @@ def rocm_per_tensor_w8a8_scaled_mm(*, qinput: torch.Tensor,
 )
 
 
-def torch_per_tensor_w8a8_scaled_mm(*, qinput: torch.Tensor,
-                                    weight: torch.Tensor,
-                                    out_dtype: torch.dtype,
-                                    scale_a: torch.Tensor,
-                                    scale_b: torch.Tensor, bias: torch.Tensor,
-                                    output_shape: list) -> torch.Tensor:
-    output = torch._scaled_mm(qinput,
-                              weight,
-                              out_dtype=out_dtype,
-                              scale_a=scale_a,
-                              scale_b=scale_b,
-                              bias=bias)
+def torch_per_tensor_w8a8_scaled_mm(
+    *,
+    qinput: torch.Tensor,
+    weight: torch.Tensor,
+    out_dtype: torch.dtype,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    bias: torch.Tensor,
+    output_shape: list,
+) -> torch.Tensor:
+    output = torch._scaled_mm(
+        qinput, weight, out_dtype=out_dtype, scale_a=scale_a, scale_b=scale_b, bias=bias
+    )
     # A fix for discrepancy in scaled_mm which returns tuple
     # for torch < 2.5 and a single value in torch >= 2.5
     if type(output) is tuple and len(output) == 2:
@@ -242,13 +270,17 @@ def torch_per_tensor_w8a8_scaled_mm(*, qinput: torch.Tensor,
     return torch.narrow(output, 0, 0, qinput.shape[0]).view(*output_shape)
 
 
-def torch_per_token_w8a8_scaled_mm(*, qinput: torch.Tensor,
-                                   weight: torch.Tensor,
-                                   out_dtype: torch.dtype,
-                                   scale_a: torch.Tensor,
-                                   scale_b: torch.Tensor, bias: torch.Tensor,
-                                   output_shape: list,
-                                   **kwargs) -> torch.Tensor:
+def torch_per_token_w8a8_scaled_mm(
+    *,
+    qinput: torch.Tensor,
+    weight: torch.Tensor,
+    out_dtype: torch.dtype,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    bias: torch.Tensor,
+    output_shape: list,
+    **kwargs,
+) -> torch.Tensor:
     # Note: Callers of this function should check USE_ROWWISE_TORCH_SCALED_MM
     #  when using it.
     #  For now it has only been validated on ROCm platform.
@@ -260,25 +292,31 @@ def torch_per_token_w8a8_scaled_mm(*, qinput: torch.Tensor,
     #  rowwise scaled GEMM before using it
 
     # Fused GEMM_DQ Rowwise GEMM
-    output = torch._scaled_mm(qinput,
-                              weight,
-                              out_dtype=out_dtype,
-                              scale_a=scale_a,
-                              scale_b=scale_b.t(),
-                              bias=bias)
+    output = torch._scaled_mm(
+        qinput,
+        weight,
+        out_dtype=out_dtype,
+        scale_a=scale_a,
+        scale_b=scale_b.t(),
+        bias=bias,
+    )
 
     output = torch.narrow(output, 0, 0, qinput.shape[0])
     output = output.view(*output_shape)
     return output
 
 
-def torch_channelwise_w8a8_scaled_mm(*, qinput: torch.Tensor,
-                                     weight: torch.Tensor,
-                                     out_dtype: torch.dtype,
-                                     scale_a: torch.Tensor,
-                                     scale_b: torch.Tensor, bias: torch.Tensor,
-                                     output_shape: list,
-                                     **kwargs) -> torch.Tensor:
+def torch_channelwise_w8a8_scaled_mm(
+    *,
+    qinput: torch.Tensor,
+    weight: torch.Tensor,
+    out_dtype: torch.dtype,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    bias: torch.Tensor,
+    output_shape: list,
+    **kwargs,
+) -> torch.Tensor:
     # Use unfused DQ due to limitations with scaled_mm
 
     # Symmetric quantized GEMM by definition computes the following:
@@ -296,11 +334,13 @@ def torch_channelwise_w8a8_scaled_mm(*, qinput: torch.Tensor,
     # GEMM
     # This computes C = (X * W).
     # Output in fp32 to allow subsequent ops to happen in-place
-    output = torch._scaled_mm(qinput,
-                              weight,
-                              scale_a=TORCH_DEVICE_IDENTITY,
-                              scale_b=TORCH_DEVICE_IDENTITY,
-                              out_dtype=torch.float32)
+    output = torch._scaled_mm(
+        qinput,
+        weight,
+        scale_a=TORCH_DEVICE_IDENTITY,
+        scale_b=TORCH_DEVICE_IDENTITY,
+        out_dtype=torch.float32,
+    )
     # A fix for discrepancy in scaled_mm which returns tuple
     # for torch < 2.5 and a single value in torch >= 2.5
     if type(output) is tuple and len(output) == 2:
@@ -318,9 +358,8 @@ def torch_channelwise_w8a8_scaled_mm(*, qinput: torch.Tensor,
 
 
 def dispatch_w8a8_scaled_mm(
-        preferred_backend: str, per_tensor_weights: bool,
-        per_tensor_activations: bool) -> Callable[..., torch.Tensor]:
-
+    preferred_backend: str, per_tensor_weights: bool, per_tensor_activations: bool
+) -> Callable[..., torch.Tensor]:
     if per_tensor_weights and per_tensor_activations:
         if preferred_backend == "rocm":
             return rocm_per_tensor_w8a8_scaled_mm
@@ -335,8 +374,11 @@ def dispatch_w8a8_scaled_mm(
         return cutlass_w8a8_scaled_mm
 
     # If torch.scaled_mm supports per-channel (weights) per-token (inputs)
-    if not per_tensor_weights and not per_tensor_activations \
-            and USE_ROWWISE_TORCH_SCALED_MM:
+    if (
+        not per_tensor_weights
+        and not per_tensor_activations
+        and USE_ROWWISE_TORCH_SCALED_MM
+    ):
         return torch_per_token_w8a8_scaled_mm
     # Normally, torch.scaled_mm supports per tensor weights + activations only
     # so fallback to naive if per channel or per token
@@ -353,15 +395,16 @@ class Fp8LinearOp:
     in the __init__ method, as reading config is not allowed inside forward.
     """
 
-    def __init__(self,
-                 act_quant_static: bool,
-                 act_quant_group_shape: GroupShape = GroupShape.PER_TENSOR,
-                 pad_output: Optional[bool] = None):
+    def __init__(
+        self,
+        act_quant_static: bool,
+        act_quant_group_shape: GroupShape = GroupShape.PER_TENSOR,
+        pad_output: Optional[bool] = None,
+    ):
         if current_platform.is_rocm():
             self.preferred_backend = "rocm"
         elif current_platform.is_cuda() and cutlass_fp8_supported():
-            if has_flashinfer() and current_platform.has_device_capability(
-                    100):
+            if has_flashinfer() and current_platform.has_device_capability(100):
                 self.preferred_backend = "flashinfer"
             else:
                 self.preferred_backend = "cutlass"
@@ -375,15 +418,19 @@ def __init__(self,
         # as it breaks with dynamic shapes.
         if pad_output is None:
             config = get_current_vllm_config().compilation_config
-            pad_output = config.level < CompilationLevel.PIECEWISE and \
-                         self.preferred_backend == "torch"
+            pad_output = (
+                config.level < CompilationLevel.PIECEWISE
+                and self.preferred_backend == "torch"
+            )
 
         self.output_padding = 17 if pad_output else None
         self.act_quant_static = act_quant_static
         self.act_quant_group_shape = act_quant_group_shape
-        self.quant_fp8 = QuantFP8(static=act_quant_static,
-                                  group_shape=act_quant_group_shape,
-                                  num_token_padding=self.output_padding)
+        self.quant_fp8 = QuantFP8(
+            static=act_quant_static,
+            group_shape=act_quant_group_shape,
+            num_token_padding=self.output_padding,
+        )
 
     def apply(
         self,
@@ -417,27 +464,29 @@ def apply(
         else:
             qinput, x_scale = input_2d, input_scale
 
-        per_tensor_weights = (weight_scale.numel() == 1)
-        per_tensor_activations = (x_scale.numel() == 1)
+        per_tensor_weights = weight_scale.numel() == 1
+        per_tensor_activations = x_scale.numel() == 1
 
         # TODO(luka) do this dispatch during init (after ScaledMM refactor)
-        w8a8_scaled_mm_func = dispatch_w8a8_scaled_mm(self.preferred_backend,
-                                                      per_tensor_weights,
-                                                      per_tensor_activations)
+        w8a8_scaled_mm_func = dispatch_w8a8_scaled_mm(
+            self.preferred_backend, per_tensor_weights, per_tensor_activations
+        )
 
-        return w8a8_scaled_mm_func(qinput=qinput,
-                                   weight=weight,
-                                   out_dtype=out_dtype,
-                                   scale_a=x_scale,
-                                   scale_b=weight_scale,
-                                   bias=bias,
-                                   output_shape=output_shape)
+        return w8a8_scaled_mm_func(
+            qinput=qinput,
+            weight=weight,
+            out_dtype=out_dtype,
+            scale_a=x_scale,
+            scale_b=weight_scale,
+            bias=bias,
+            output_shape=output_shape,
+        )
 
 
 def normalize_e4m3fn_to_e4m3fnuz(
     weight: torch.Tensor,
     weight_scale: torch.Tensor,
-    input_scale: Optional[torch.Tensor] = None
+    input_scale: Optional[torch.Tensor] = None,
 ) -> tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor]]:
     assert weight.dtype == torch.float8_e4m3fn
     # The bits pattern 10000000(-128) represents zero in e4m3fn
diff --git a/vllm/model_executor/layers/resampler.py b/vllm/model_executor/layers/resampler.py
index 3f2d571777c0..6ae2db0f428c 100644
--- a/vllm/model_executor/layers/resampler.py
+++ b/vllm/model_executor/layers/resampler.py
@@ -32,6 +32,7 @@
 
 Example models: Qwen (Qwen-VL), MiniCPM-V 2.0
 """
+
 import math
 from functools import partial
 from typing import Callable, Optional, Union
@@ -47,8 +48,9 @@
 DEFAULT_LN = partial(nn.LayerNorm, eps=1e-6)
 
 
-def get_abs_pos(abs_pos: torch.Tensor, tgt_size: Union[torch.Tensor,
-                                                       int]) -> torch.Tensor:
+def get_abs_pos(
+    abs_pos: torch.Tensor, tgt_size: Union[torch.Tensor, int]
+) -> torch.Tensor:
     # abs_pos: L, C
     # tgt_size: (H, W)
     # return: M, C
@@ -56,21 +58,26 @@ def get_abs_pos(abs_pos: torch.Tensor, tgt_size: Union[torch.Tensor,
     dtype = abs_pos.dtype
     if isinstance(tgt_size, int):
         tgt_size = (tgt_size, tgt_size)
-    if (src_size == tgt_size[0] and src_size == tgt_size[1]):
+    if src_size == tgt_size[0] and src_size == tgt_size[1]:
         return abs_pos
-    return (F.interpolate(
-        abs_pos.float().reshape(1, src_size, src_size, -1).permute(0, 3, 1, 2),
-        size=(tgt_size[0], tgt_size[1]),
-        mode="bicubic",
-        align_corners=False,
-    ).permute(0, 2, 3, 1).flatten(0, 2).to(dtype=dtype))
+    return (
+        F.interpolate(
+            abs_pos.float().reshape(1, src_size, src_size, -1).permute(0, 3, 1, 2),
+            size=(tgt_size[0], tgt_size[1]),
+            mode="bicubic",
+            align_corners=False,
+        )
+        .permute(0, 2, 3, 1)
+        .flatten(0, 2)
+        .to(dtype=dtype)
+    )
 
 
 # sin/cos positional embedding helpers are adapted from:
 # https://github.com/facebookresearch/mae/blob/efb2a8062c206524e35e47d04501ed4f544c0ae8/util/pos_embed.py#L20
 def get_1d_sincos_pos_embed_from_grid(
-    embed_dim: int, pos: np.ndarray,
-    version: tuple[int, int] = (2, 0)) -> torch.Tensor:
+    embed_dim: int, pos: np.ndarray, version: tuple[int, int] = (2, 0)
+) -> torch.Tensor:
     """
     embed_dim: output dimension for each position
     pos: a list of positions to be encoded: size (M,) / (H, W)
@@ -96,15 +103,17 @@ def get_1d_sincos_pos_embed_from_grid(
 
 
 def get_2d_sincos_pos_embed_from_grid(
-    embed_dim: int, grid: np.ndarray,
-    version: tuple[int, int] = (2, 0)) -> torch.Tensor:
+    embed_dim: int, grid: np.ndarray, version: tuple[int, int] = (2, 0)
+) -> torch.Tensor:
     assert embed_dim % 2 == 0
 
     # use half of dimensions to encode grid_h
     emb_h = get_1d_sincos_pos_embed_from_grid(
-        embed_dim // 2, grid[0], version)  # (H*W, D/2) or (H, W, D/2)
+        embed_dim // 2, grid[0], version
+    )  # (H*W, D/2) or (H, W, D/2)
     emb_w = get_1d_sincos_pos_embed_from_grid(
-        embed_dim // 2, grid[1], version)  # (H*W, D/2) or (H, W, D/2)
+        embed_dim // 2, grid[1], version
+    )  # (H*W, D/2) or (H, W, D/2)
 
     if version == (2, 0):
         emb = np.concatenate([emb_h, emb_w], axis=1)  # (H*W, D)
@@ -114,10 +123,10 @@ def get_2d_sincos_pos_embed_from_grid(
 
 
 def get_2d_sincos_pos_embed(
-        embed_dim: int,
-        grid_size: Union[int, tuple[int, int]],
-        cls_token: bool = False,
-        version: tuple[int, int] = (2, 0),
+    embed_dim: int,
+    grid_size: Union[int, tuple[int, int]],
+    cls_token: bool = False,
+    version: tuple[int, int] = (2, 0),
 ) -> torch.Tensor:
     """
     grid_size: int of the grid height and width
@@ -134,15 +143,13 @@ def get_2d_sincos_pos_embed(
     grid_w = np.arange(grid_w_size, dtype=np.float32)
     grid = np.meshgrid(grid_w, grid_h)  # here w goes first
     grid = np.stack(grid, axis=0)
-    assert isinstance(grid, np.ndarray) and \
-        grid.shape == (2, grid_h_size, grid_w_size)
+    assert isinstance(grid, np.ndarray) and grid.shape == (2, grid_h_size, grid_w_size)
 
     if version == (2, 0):
         grid = grid.reshape([2, 1, grid_h_size, grid_w_size])
         pos_embed = get_2d_sincos_pos_embed_from_grid(embed_dim, grid, version)
         if cls_token:
-            pos_embed = np.concatenate([np.zeros([1, embed_dim]), pos_embed],
-                                       axis=0)
+            pos_embed = np.concatenate([np.zeros([1, embed_dim]), pos_embed], axis=0)
     else:
         pos_embed = get_2d_sincos_pos_embed_from_grid(embed_dim, grid, version)
     return pos_embed
@@ -156,15 +163,17 @@ class BaseResampler(nn.Module):
         A tensor with the shape of (grid_size**2, embed_dim)
     """
 
-    def __init__(self,
-                 num_queries: int,
-                 embed_dim: int,
-                 num_heads: int,
-                 kv_dim: Optional[int] = None,
-                 norm_layer: Callable[[int], nn.LayerNorm] = DEFAULT_LN,
-                 do_post_projection: bool = True,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        num_queries: int,
+        embed_dim: int,
+        num_heads: int,
+        kv_dim: Optional[int] = None,
+        norm_layer: Callable[[int], nn.LayerNorm] = DEFAULT_LN,
+        do_post_projection: bool = True,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
 
         self.num_queries = num_queries
@@ -174,14 +183,16 @@ def __init__(self,
         self.query = nn.Parameter(torch.empty(self.num_queries, embed_dim))
 
         if kv_dim is not None and kv_dim != embed_dim:
-            self.kv_proj = ReplicatedLinear(kv_dim,
-                                            embed_dim,
-                                            bias=False,
-                                            quant_config=quant_config,
-                                            prefix=f"{prefix}.kv_proj")
+            self.kv_proj = ReplicatedLinear(
+                kv_dim,
+                embed_dim,
+                bias=False,
+                quant_config=quant_config,
+                prefix=f"{prefix}.kv_proj",
+            )
         else:
             # Maintain the same return value with ReplicatedLinear.forward
-            self.kv_proj = lambda *args, **kwargs: (  # type: ignore # noqa 
+            self.kv_proj = lambda *args, **kwargs: (  # type: ignore # noqa
                 nn.Identity()(*args, **kwargs),
                 None,
             )
@@ -190,9 +201,11 @@ def __init__(self,
         self.ln_kv = norm_layer(embed_dim)
         self.do_post_projection = do_post_projection
         self.ln_post = norm_layer(embed_dim) if do_post_projection else None
-        self.proj = nn.Parameter(
-            (embed_dim**-0.5) *
-            torch.empty(embed_dim, embed_dim)) if do_post_projection else None
+        self.proj = (
+            nn.Parameter((embed_dim**-0.5) * torch.empty(embed_dim, embed_dim))
+            if do_post_projection
+            else None
+        )
 
     def _repeat(self, query, N: int):
         return query.unsqueeze(1).repeat(1, N, 1)
@@ -206,32 +219,35 @@ class Resampler2(BaseResampler):
     present in minicpmv2.0, but not qwen-vl.
     """
 
-    def __init__(self,
-                 grid_size: int,
-                 embed_dim: int,
-                 num_heads: int,
-                 kv_dim: Optional[int] = None,
-                 norm_layer: Callable[[int], nn.LayerNorm] = DEFAULT_LN,
-                 adaptive: bool = False,
-                 do_post_projection: bool = True,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "") -> None:
-        super().__init__(grid_size**2,
-                         embed_dim,
-                         num_heads,
-                         kv_dim,
-                         norm_layer,
-                         do_post_projection=do_post_projection,
-                         quant_config=quant_config,
-                         prefix=prefix)
+    def __init__(
+        self,
+        grid_size: int,
+        embed_dim: int,
+        num_heads: int,
+        kv_dim: Optional[int] = None,
+        norm_layer: Callable[[int], nn.LayerNorm] = DEFAULT_LN,
+        adaptive: bool = False,
+        do_post_projection: bool = True,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> None:
+        super().__init__(
+            grid_size**2,
+            embed_dim,
+            num_heads,
+            kv_dim,
+            norm_layer,
+            do_post_projection=do_post_projection,
+            quant_config=quant_config,
+            prefix=prefix,
+        )
 
         self.adaptive = adaptive
-        pos_embed_arr = get_2d_sincos_pos_embed(embed_dim,
-                                                grid_size,
-                                                version=(2, 0))
+        pos_embed_arr = get_2d_sincos_pos_embed(embed_dim, grid_size, version=(2, 0))
 
         self.pos_embed = nn.Parameter(
-            torch.from_numpy(pos_embed_arr).requires_grad_(False))
+            torch.from_numpy(pos_embed_arr).requires_grad_(False)
+        )
 
     def forward(
         self,
@@ -242,15 +258,16 @@ def forward(
         if tgt_sizes is None:
             tgt_sizes = int(math.sqrt(x.size(1)))
         if self.adaptive:
-            pos_embed_arr = get_2d_sincos_pos_embed(self.embed_dim,
-                                                    tgt_sizes,
-                                                    version=(2, 0))
-            pos_embed = torch.from_numpy(pos_embed_arr).to(device=x.device,
-                                                           dtype=x.dtype)
+            pos_embed_arr = get_2d_sincos_pos_embed(
+                self.embed_dim, tgt_sizes, version=(2, 0)
+            )
+            pos_embed = torch.from_numpy(pos_embed_arr).to(
+                device=x.device, dtype=x.dtype
+            )
         else:
-            pos_embed = get_abs_pos(self.pos_embed,
-                                    tgt_sizes).to(device=x.device,
-                                                  dtype=x.dtype)
+            pos_embed = get_abs_pos(self.pos_embed, tgt_sizes).to(
+                device=x.device, dtype=x.dtype
+            )
 
         x, _ = self.kv_proj(x)
         x = self.ln_kv(x).permute(1, 0, 2)
diff --git a/vllm/model_executor/layers/rotary_embedding/__init__.py b/vllm/model_executor/layers/rotary_embedding/__init__.py
index 3576368981c7..e6956de4bfaa 100644
--- a/vllm/model_executor/layers/rotary_embedding/__init__.py
+++ b/vllm/model_executor/layers/rotary_embedding/__init__.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Rotary Positional Embeddings."""
+
 from typing import Any, Optional
 
 import torch
@@ -37,8 +38,7 @@ def get_rope(
     if rope_scaling is not None:
         # Transforms every value that is a list into a tuple for caching calls
         rope_scaling_tuple = {
-            k: tuple(v) if isinstance(v, list) else v
-            for k, v in rope_scaling.items()
+            k: tuple(v) if isinstance(v, list) else v for k, v in rope_scaling.items()
         }
         rope_scaling_args = tuple(rope_scaling_tuple.items())
     else:
@@ -56,8 +56,16 @@ def get_rope(
 
     if partial_rotary_factor < 1.0:
         rotary_dim = int(rotary_dim * partial_rotary_factor)
-    key = (head_size, rotary_dim, max_position, base, is_neox_style,
-           rope_scaling_args, dual_chunk_attention_args, dtype)
+    key = (
+        head_size,
+        rotary_dim,
+        max_position,
+        base,
+        is_neox_style,
+        rope_scaling_args,
+        dual_chunk_attention_args,
+        dtype,
+    )
     if key in _ROPE_DICT:
         return _ROPE_DICT[key]
 
@@ -67,13 +75,19 @@ def get_rope(
             for k, v in dual_chunk_attention_config.items()
             if k in ("chunk_size", "local_size")
         }
-        rotary_emb = DualChunkRotaryEmbedding(head_size, rotary_dim,
-                                              max_position, base,
-                                              is_neox_style, dtype,
-                                              **extra_kwargs)
+        rotary_emb = DualChunkRotaryEmbedding(
+            head_size,
+            rotary_dim,
+            max_position,
+            base,
+            is_neox_style,
+            dtype,
+            **extra_kwargs,
+        )
     elif not rope_scaling:
-        rotary_emb = RotaryEmbedding(head_size, rotary_dim, max_position, base,
-                                     is_neox_style, dtype)
+        rotary_emb = RotaryEmbedding(
+            head_size, rotary_dim, max_position, base, is_neox_style, dtype
+        )
     else:
         scaling_type = rope_scaling["rope_type"]
 
@@ -81,18 +95,23 @@ def get_rope(
             scaling_factor = rope_scaling["factor"]
             low_freq_factor = rope_scaling["low_freq_factor"]
             high_freq_factor = rope_scaling["high_freq_factor"]
-            original_max_position = rope_scaling[
-                "original_max_position_embeddings"]
-            rotary_emb = Llama3RotaryEmbedding(head_size, rotary_dim,
-                                               max_position, base,
-                                               is_neox_style, dtype,
-                                               scaling_factor, low_freq_factor,
-                                               high_freq_factor,
-                                               original_max_position)
+            original_max_position = rope_scaling["original_max_position_embeddings"]
+            rotary_emb = Llama3RotaryEmbedding(
+                head_size,
+                rotary_dim,
+                max_position,
+                base,
+                is_neox_style,
+                dtype,
+                scaling_factor,
+                low_freq_factor,
+                high_freq_factor,
+                original_max_position,
+            )
         elif scaling_type == "mllama4":
-            rotary_emb = Llama4VisionRotaryEmbedding(head_size, rotary_dim,
-                                                     max_position, base,
-                                                     is_neox_style, dtype)
+            rotary_emb = Llama4VisionRotaryEmbedding(
+                head_size, rotary_dim, max_position, base, is_neox_style, dtype
+            )
         elif scaling_type == "default":
             if "mrope_section" in rope_scaling:
                 rotary_emb = MRotaryEmbedding(
@@ -103,8 +122,7 @@ def get_rope(
                     is_neox_style,
                     dtype,
                     mrope_section=rope_scaling["mrope_section"],
-                    mrope_interleaved=rope_scaling.get("mrope_interleaved",
-                                                       False),
+                    mrope_interleaved=rope_scaling.get("mrope_interleaved", False),
                 )
             else:
                 rotary_emb = RotaryEmbedding(
@@ -117,41 +135,63 @@ def get_rope(
                 )
         elif scaling_type == "linear":
             scaling_factor = rope_scaling["factor"]
-            rotary_emb = LinearScalingRotaryEmbedding(head_size, rotary_dim,
-                                                      max_position, base,
-                                                      is_neox_style,
-                                                      scaling_factor, dtype)
+            rotary_emb = LinearScalingRotaryEmbedding(
+                head_size,
+                rotary_dim,
+                max_position,
+                base,
+                is_neox_style,
+                scaling_factor,
+                dtype,
+            )
         elif scaling_type == "ntk":
             scaling_factor = rope_scaling["factor"]
-            mixed_b = rope_scaling.get('mixed_b', None)
-            rotary_emb = NTKScalingRotaryEmbedding(head_size, rotary_dim,
-                                                   max_position, base,
-                                                   is_neox_style,
-                                                   scaling_factor, dtype,
-                                                   mixed_b)
+            mixed_b = rope_scaling.get("mixed_b", None)
+            rotary_emb = NTKScalingRotaryEmbedding(
+                head_size,
+                rotary_dim,
+                max_position,
+                base,
+                is_neox_style,
+                scaling_factor,
+                dtype,
+                mixed_b,
+            )
         elif scaling_type == "dynamic":
             if "alpha" in rope_scaling:
                 scaling_alpha = rope_scaling["alpha"]
                 rotary_emb = DynamicNTKAlphaRotaryEmbedding(
-                    head_size, rotary_dim, max_position, base, is_neox_style,
-                    scaling_alpha, dtype)
+                    head_size,
+                    rotary_dim,
+                    max_position,
+                    base,
+                    is_neox_style,
+                    scaling_alpha,
+                    dtype,
+                )
             elif "factor" in rope_scaling:
                 scaling_factor = rope_scaling["factor"]
                 rotary_emb = DynamicNTKScalingRotaryEmbedding(
-                    head_size, rotary_dim, max_position, base, is_neox_style,
-                    scaling_factor, dtype)
+                    head_size,
+                    rotary_dim,
+                    max_position,
+                    base,
+                    is_neox_style,
+                    scaling_factor,
+                    dtype,
+                )
             else:
-                raise ValueError("Dynamic rope scaling must contain either "
-                                 "'alpha' or 'factor' field")
+                raise ValueError(
+                    "Dynamic rope scaling must contain either 'alpha' or 'factor' field"
+                )
         elif scaling_type == "yarn":
             scaling_factor = rope_scaling["factor"]
-            original_max_position = rope_scaling[
-                "original_max_position_embeddings"]
+            original_max_position = rope_scaling["original_max_position_embeddings"]
             extra_kwargs = {
                 k: v
                 for k, v in rope_scaling.items()
-                if k in ("extrapolation_factor", "attn_factor", "beta_fast",
-                         "beta_slow")
+                if k
+                in ("extrapolation_factor", "attn_factor", "beta_fast", "beta_slow")
             }
             if "mrope_section" in rope_scaling:
                 rotary_emb = MRotaryEmbedding(
@@ -162,42 +202,69 @@ def get_rope(
                     is_neox_style,
                     dtype,
                     mrope_section=rope_scaling["mrope_section"],
-                    mrope_interleaved=rope_scaling.get("mrope_interleaved",
-                                                       False),
+                    mrope_interleaved=rope_scaling.get("mrope_interleaved", False),
                     scaling_factor=scaling_factor,
-                    **extra_kwargs)
+                    **extra_kwargs,
+                )
             else:
                 rotary_emb = YaRNScalingRotaryEmbedding(
-                    head_size, rotary_dim, original_max_position, base,
-                    is_neox_style, scaling_factor, dtype, **extra_kwargs)
+                    head_size,
+                    rotary_dim,
+                    original_max_position,
+                    base,
+                    is_neox_style,
+                    scaling_factor,
+                    dtype,
+                    **extra_kwargs,
+                )
         elif scaling_type == "deepseek_yarn":
             scaling_factor = rope_scaling["factor"]
-            original_max_position = rope_scaling[
-                "original_max_position_embeddings"]
+            original_max_position = rope_scaling["original_max_position_embeddings"]
             # assert max_position == original_max_position * scaling_factor
             extra_kwargs = {
                 k: v
                 for k, v in rope_scaling.items()
-                if k in ("extrapolation_factor", "attn_factor", "beta_fast",
-                         "beta_slow", "mscale", "mscale_all_dim")
+                if k
+                in (
+                    "extrapolation_factor",
+                    "attn_factor",
+                    "beta_fast",
+                    "beta_slow",
+                    "mscale",
+                    "mscale_all_dim",
+                )
             }
             rotary_emb = DeepseekScalingRotaryEmbedding(
-                head_size, rotary_dim, original_max_position, base,
-                is_neox_style, scaling_factor, dtype, **extra_kwargs)
+                head_size,
+                rotary_dim,
+                original_max_position,
+                base,
+                is_neox_style,
+                scaling_factor,
+                dtype,
+                **extra_kwargs,
+            )
         elif scaling_type == "longrope":
             short_factor = rope_scaling["short_factor"]
             long_factor = rope_scaling["long_factor"]
-            original_max_position = rope_scaling[
-                "original_max_position_embeddings"]
+            original_max_position = rope_scaling["original_max_position_embeddings"]
             extra_kwargs = {
                 k: v
                 for k, v in rope_scaling.items()
                 if k in ("short_mscale", "long_mscale")
             }
             rotary_emb = Phi3LongRoPEScaledRotaryEmbedding(
-                head_size, rotary_dim, max_position, original_max_position,
-                base, is_neox_style, dtype, short_factor, long_factor,
-                **extra_kwargs)
+                head_size,
+                rotary_dim,
+                max_position,
+                original_max_position,
+                base,
+                is_neox_style,
+                dtype,
+                short_factor,
+                long_factor,
+                **extra_kwargs,
+            )
         else:
             raise ValueError(f"Unknown RoPE scaling type {scaling_type}")
     _ROPE_DICT[key] = rotary_emb
diff --git a/vllm/model_executor/layers/rotary_embedding/base.py b/vllm/model_executor/layers/rotary_embedding/base.py
index 0cf634f82a8a..cf50b60118b9 100644
--- a/vllm/model_executor/layers/rotary_embedding/base.py
+++ b/vllm/model_executor/layers/rotary_embedding/base.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Rotary Positional Embeddings Base Class."""
+
 from typing import Optional
 
 import torch
@@ -8,8 +9,10 @@
 from vllm.model_executor.custom_op import CustomOp
 
 from .common import apply_rotary_emb_torch
-from .rocm_aiter_rope_ops import (is_rocm_triton_rotary_embedding_enabled,
-                                  rocm_aiter_rotary_emb)
+from .rocm_aiter_rope_ops import (
+    is_rocm_triton_rotary_embedding_enabled,
+    rocm_aiter_rotary_emb,
+)
 
 
 @CustomOp.register("rotary_embedding")
@@ -47,8 +50,9 @@ def __init__(
             cache = cache.to(dtype)
         self.cos_sin_cache: torch.Tensor
         self.register_buffer("cos_sin_cache", cache, persistent=False)
-        self.is_rocm_triton_rotary_embedding_enabled = \
+        self.is_rocm_triton_rotary_embedding_enabled = (
             is_rocm_triton_rotary_embedding_enabled()
+        )
 
     def _compute_inv_freq(self, base: float) -> torch.Tensor:
         """Compute the inverse frequency."""
@@ -56,8 +60,12 @@ def _compute_inv_freq(self, base: float) -> torch.Tensor:
         # use CPU to compute the cache and then move it to GPU. However, we
         # create the cache on GPU for faster initialization. This may cause
         # a slight numerical difference between the HF implementation and ours.
-        inv_freq = 1.0 / (base**(torch.arange(
-            0, self.rotary_dim, 2, dtype=torch.float) / self.rotary_dim))
+        inv_freq = 1.0 / (
+            base
+            ** (
+                torch.arange(0, self.rotary_dim, 2, dtype=torch.float) / self.rotary_dim
+            )
+        )
         return inv_freq
 
     def _compute_cos_sin_cache(self) -> torch.Tensor:
@@ -74,10 +82,11 @@ def _compute_cos_sin_cache(self) -> torch.Tensor:
     def _match_cos_sin_cache_dtype(self, query: torch.Tensor) -> None:
         # __setattr__ in nn.Module (called by `self.cos_sin_cache = ...`)
         # is expensive, so avoid calling it if possible
-        if self.cos_sin_cache.device != query.device or \
-            self.cos_sin_cache.dtype != query.dtype:
-            self.cos_sin_cache = self.cos_sin_cache.to(query.device,
-                                                       dtype=query.dtype)
+        if (
+            self.cos_sin_cache.device != query.device
+            or self.cos_sin_cache.dtype != query.dtype
+        ):
+            self.cos_sin_cache = self.cos_sin_cache.to(query.device, dtype=query.dtype)
 
     def forward_native(
         self,
@@ -93,20 +102,18 @@ def forward_native(
 
         query_shape = query.shape
         query = query.view(num_tokens, -1, self.head_size)
-        query_rot = query[..., :self.rotary_dim]
-        query_pass = query[..., self.rotary_dim:]
-        query_rot = apply_rotary_emb_torch(query_rot, cos, sin,
-                                           self.is_neox_style)
+        query_rot = query[..., : self.rotary_dim]
+        query_pass = query[..., self.rotary_dim :]
+        query_rot = apply_rotary_emb_torch(query_rot, cos, sin, self.is_neox_style)
         query = torch.cat((query_rot, query_pass), dim=-1).reshape(query_shape)
 
         # key may be None in some cases, e.g. cross-layer KV sharing
         if key is not None:
             key_shape = key.shape
             key = key.view(num_tokens, -1, self.head_size)
-            key_rot = key[..., :self.rotary_dim]
-            key_pass = key[..., self.rotary_dim:]
-            key_rot = apply_rotary_emb_torch(key_rot, cos, sin,
-                                             self.is_neox_style)
+            key_rot = key[..., : self.rotary_dim]
+            key_pass = key[..., self.rotary_dim :]
+            key_rot = apply_rotary_emb_torch(key_rot, cos, sin, self.is_neox_style)
             key = torch.cat((key_rot, key_pass), dim=-1).reshape(key_shape)
         return query, key
 
@@ -117,19 +124,30 @@ def forward_cuda(
         key: Optional[torch.Tensor] = None,
     ) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
         if self.use_flashinfer:
-            torch.ops.vllm.flashinfer_rotary_embedding(positions, query, key,
-                                                       self.head_size,
-                                                       self.cos_sin_cache,
-                                                       self.is_neox_style)
+            torch.ops.vllm.flashinfer_rotary_embedding(
+                positions,
+                query,
+                key,
+                self.head_size,
+                self.cos_sin_cache,
+                self.is_neox_style,
+            )
             return query, key
 
         from vllm import _custom_ops as ops
+
         self._match_cos_sin_cache_dtype(query)
 
         # ops.rotary_embedding() is an in-place operation
         # that updates the query and key tensors.
-        ops.rotary_embedding(positions, query, key, self.head_size,
-                             self.cos_sin_cache, self.is_neox_style)
+        ops.rotary_embedding(
+            positions,
+            query,
+            key,
+            self.head_size,
+            self.cos_sin_cache,
+            self.is_neox_style,
+        )
         return query, key
 
     def forward_hip(
@@ -140,9 +158,15 @@ def forward_hip(
     ) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
         if self.is_rocm_triton_rotary_embedding_enabled:
             self._match_cos_sin_cache_dtype(query)
-            rocm_aiter_rotary_emb(positions, query, key, self.cos_sin_cache,
-                                  self.head_size, self.rotary_dim,
-                                  self.is_neox_style)
+            rocm_aiter_rotary_emb(
+                positions,
+                query,
+                key,
+                self.cos_sin_cache,
+                self.head_size,
+                self.rotary_dim,
+                self.is_neox_style,
+            )
         else:
             # ops.rotary_embedding() is an in-place operation
             # that updates the query and key tensors.
@@ -166,8 +190,14 @@ def forward_xpu(
             # ipex.llm.functional.rotary_embedding_batched
             return self.forward_native(positions, query, key)
         else:
-            ops.rotary_embedding(positions, query, key, self.head_size,
-                                 self.cos_sin_cache, self.is_neox_style)
+            ops.rotary_embedding(
+                positions,
+                query,
+                key,
+                self.head_size,
+                self.cos_sin_cache,
+                self.is_neox_style,
+            )
         return query, key
 
     def extra_repr(self) -> str:
diff --git a/vllm/model_executor/layers/rotary_embedding/common.py b/vllm/model_executor/layers/rotary_embedding/common.py
index 0d11d1ffea9f..124ea0236cbf 100644
--- a/vllm/model_executor/layers/rotary_embedding/common.py
+++ b/vllm/model_executor/layers/rotary_embedding/common.py
@@ -20,8 +20,8 @@
 
 # common functions
 def rotate_neox(x: torch.Tensor) -> torch.Tensor:
-    x1 = x[..., :x.shape[-1] // 2]
-    x2 = x[..., x.shape[-1] // 2:]
+    x1 = x[..., : x.shape[-1] // 2]
+    x2 = x[..., x.shape[-1] // 2 :]
     return torch.cat((-x2, x1), dim=-1)
 
 
@@ -53,9 +53,9 @@ def apply_rotary_emb_torch(
         return torch.stack((o1, o2), dim=-1).flatten(-2)
 
 
-def apply_rotary_emb_dispatch(x: torch.Tensor, cos: torch.Tensor,
-                              sin: torch.Tensor,
-                              is_neox_style: bool) -> torch.Tensor:
+def apply_rotary_emb_dispatch(
+    x: torch.Tensor, cos: torch.Tensor, sin: torch.Tensor, is_neox_style: bool
+) -> torch.Tensor:
     """
     Args:
         x: [num_tokens, num_heads, head_size]
@@ -65,15 +65,14 @@ def apply_rotary_emb_dispatch(x: torch.Tensor, cos: torch.Tensor,
             positional embeddings.
     """
     if current_platform.is_cuda():
-        return apply_rotary_emb(x.unsqueeze(0), cos, sin,
-                                not is_neox_style).squeeze(0)
+        return apply_rotary_emb(x.unsqueeze(0), cos, sin, not is_neox_style).squeeze(0)
     else:
         return apply_rotary_emb_torch(x, cos, sin, is_neox_style)
 
 
 @cache
 def dispatch_rotary_emb_function(
-    default: Optional[Callable[..., torch.Tensor]] = None
+    default: Optional[Callable[..., torch.Tensor]] = None,
 ) -> Callable[..., torch.Tensor]:
     if current_platform.is_cuda():
         return apply_rotary_emb
@@ -81,11 +80,13 @@ def dispatch_rotary_emb_function(
     if current_platform.is_rocm():
         if find_spec("flash_attn") is not None:
             from flash_attn.ops.triton.rotary import apply_rotary
+
             return apply_rotary
         else:
             logger.warning(
                 "flash_attn is not installed. Falling back to PyTorch "
-                "implementation for rotary embeddings.")
+                "implementation for rotary embeddings."
+            )
 
     if default is not None:
         return default
@@ -95,31 +96,37 @@ def dispatch_rotary_emb_function(
 
 # yarn functions
 # Inverse dim formula to find dim based on number of rotations
-def yarn_find_correction_dim(num_rotations: int,
-                             dim: int,
-                             base: float = 10000,
-                             max_position_embeddings: int = 2048) -> float:
-    return (dim * math.log(max_position_embeddings /
-                           (num_rotations * 2 * math.pi))) / (2 *
-                                                              math.log(base))
+def yarn_find_correction_dim(
+    num_rotations: int,
+    dim: int,
+    base: float = 10000,
+    max_position_embeddings: int = 2048,
+) -> float:
+    return (dim * math.log(max_position_embeddings / (num_rotations * 2 * math.pi))) / (
+        2 * math.log(base)
+    )
 
 
 # Find dim range bounds based on rotations
 def yarn_find_correction_range(
-        low_rot: int,
-        high_rot: int,
-        dim: int,
-        base: float = 10000,
-        max_position_embeddings: int = 2048) -> tuple[int, int]:
+    low_rot: int,
+    high_rot: int,
+    dim: int,
+    base: float = 10000,
+    max_position_embeddings: int = 2048,
+) -> tuple[int, int]:
     low = math.floor(
-        yarn_find_correction_dim(low_rot, dim, base, max_position_embeddings))
+        yarn_find_correction_dim(low_rot, dim, base, max_position_embeddings)
+    )
     high = math.ceil(
-        yarn_find_correction_dim(high_rot, dim, base, max_position_embeddings))
+        yarn_find_correction_dim(high_rot, dim, base, max_position_embeddings)
+    )
     return max(low, 0), min(high, dim - 1)  # Clamp values just in case
 
 
-def yarn_linear_ramp_mask(low: float, high: float, dim: int,
-                          dtype: torch.dtype) -> torch.Tensor:
+def yarn_linear_ramp_mask(
+    low: float, high: float, dim: int, dtype: torch.dtype
+) -> torch.Tensor:
     if low == high:
         high += 0.001  # Prevent singularity
 
@@ -143,7 +150,7 @@ def _flashinfer_rotary_embedding(
     is_neox: bool,
 ) -> None:
     """Custom op wrapper for flashinfer's rotary embedding.
-    
+
     This is an in-place operation that modifies query and key tensors directly.
     """
     from flashinfer.rope import apply_rope_with_cos_sin_cache_inplace
diff --git a/vllm/model_executor/layers/rotary_embedding/deepseek_scaling_rope.py b/vllm/model_executor/layers/rotary_embedding/deepseek_scaling_rope.py
index 736ec2c1dd3a..eaedca9b5219 100644
--- a/vllm/model_executor/layers/rotary_embedding/deepseek_scaling_rope.py
+++ b/vllm/model_executor/layers/rotary_embedding/deepseek_scaling_rope.py
@@ -9,8 +9,12 @@
 from vllm.platforms import current_platform
 
 from .base import RotaryEmbedding
-from .common import (rotate_gptj, rotate_neox, yarn_find_correction_range,
-                     yarn_linear_ramp_mask)
+from .common import (
+    rotate_gptj,
+    rotate_neox,
+    yarn_find_correction_range,
+    yarn_linear_ramp_mask,
+)
 
 
 def yarn_get_mscale(scale: float = 1, mscale: float = 1) -> float:
@@ -49,42 +53,56 @@ def __init__(
         self.beta_slow = beta_slow
         # Get n-d magnitude scaling corrected for interpolation.
         self.mscale = float(
-            yarn_get_mscale(self.scaling_factor, float(mscale)) /
-            yarn_get_mscale(self.scaling_factor, float(mscale_all_dim)) *
-            attn_factor)
-        super().__init__(head_size, rotary_dim, max_position_embeddings, base,
-                         is_neox_style, dtype)
+            yarn_get_mscale(self.scaling_factor, float(mscale))
+            / yarn_get_mscale(self.scaling_factor, float(mscale_all_dim))
+            * attn_factor
+        )
+        super().__init__(
+            head_size, rotary_dim, max_position_embeddings, base, is_neox_style, dtype
+        )
 
     def _compute_inv_freq(self, scaling_factor: float) -> torch.Tensor:
-        pos_freqs = self.base**(
-            torch.arange(0,
-                         self.rotary_dim,
-                         2,
-                         dtype=torch.float,
-                         device=current_platform.device_type) /
-            self.rotary_dim)
+        pos_freqs = self.base ** (
+            torch.arange(
+                0,
+                self.rotary_dim,
+                2,
+                dtype=torch.float,
+                device=current_platform.device_type,
+            )
+            / self.rotary_dim
+        )
         inv_freq_extrapolation = 1.0 / pos_freqs
         inv_freq_interpolation = 1.0 / (scaling_factor * pos_freqs)
 
-        low, high = yarn_find_correction_range(self.beta_fast, self.beta_slow,
-                                               self.rotary_dim, self.base,
-                                               self.max_position_embeddings)
+        low, high = yarn_find_correction_range(
+            self.beta_fast,
+            self.beta_slow,
+            self.rotary_dim,
+            self.base,
+            self.max_position_embeddings,
+        )
         # Get n-d rotational scaling corrected for extrapolation
-        inv_freq_mask = (1 - yarn_linear_ramp_mask(
-            low, high, self.rotary_dim // 2,
-            dtype=torch.float)) * self.extrapolation_factor
-        inv_freq = inv_freq_interpolation * (
-            1 - inv_freq_mask) + inv_freq_extrapolation * inv_freq_mask
+        inv_freq_mask = (
+            1
+            - yarn_linear_ramp_mask(low, high, self.rotary_dim // 2, dtype=torch.float)
+        ) * self.extrapolation_factor
+        inv_freq = (
+            inv_freq_interpolation * (1 - inv_freq_mask)
+            + inv_freq_extrapolation * inv_freq_mask
+        )
         return inv_freq
 
     def _compute_cos_sin_cache(self) -> torch.Tensor:
         inv_freq = self._compute_inv_freq(self.scaling_factor)
-        t = torch.arange(self.max_position_embeddings * self.scaling_factor,
-                         device=current_platform.device_type,
-                         dtype=torch.float32)
+        t = torch.arange(
+            self.max_position_embeddings * self.scaling_factor,
+            device=current_platform.device_type,
+            dtype=torch.float32,
+        )
         freqs = torch.einsum("i,j -> ij", t, inv_freq)
-        cos = (freqs.cos() * self.mscale)
-        sin = (freqs.sin() * self.mscale)
+        cos = freqs.cos() * self.mscale
+        sin = freqs.sin() * self.mscale
         cache = torch.cat((cos, sin), dim=-1)
         return cache
 
@@ -98,14 +116,15 @@ def forward_native(
         """PyTorch-native implementation equivalent to forward()."""
         assert key is not None
         self._match_cos_sin_cache_dtype(query)
-        query_rot = query[..., :self.rotary_dim]
-        key_rot = key[..., :self.rotary_dim]
+        query_rot = query[..., : self.rotary_dim]
+        key_rot = key[..., : self.rotary_dim]
         if self.rotary_dim < self.head_size:
-            query_pass = query[..., self.rotary_dim:]
-            key_pass = key[..., self.rotary_dim:]
+            query_pass = query[..., self.rotary_dim :]
+            key_pass = key[..., self.rotary_dim :]
 
-        cos_sin = self.cos_sin_cache[torch.add(positions, offsets)
-                                     if offsets is not None else positions]
+        cos_sin = self.cos_sin_cache[
+            torch.add(positions, offsets) if offsets is not None else positions
+        ]
         cos, sin = cos_sin.chunk(2, dim=-1)
         if self.is_neox_style:
             # NOTE(woosuk): Here we assume that the positions tensor has the
diff --git a/vllm/model_executor/layers/rotary_embedding/dual_chunk_rope.py b/vllm/model_executor/layers/rotary_embedding/dual_chunk_rope.py
index 27e41dd0fa97..0e6eddda772f 100644
--- a/vllm/model_executor/layers/rotary_embedding/dual_chunk_rope.py
+++ b/vllm/model_executor/layers/rotary_embedding/dual_chunk_rope.py
@@ -35,18 +35,17 @@ def __init__(
         self.local_size = local_size
         self.dtype = dtype
         self.device = torch.device(f"cuda:{torch.cuda.current_device()}")
-        (q_cache, qc_cache, k_cache, qc_no_clamp_cache,
-         q_inter_cache) = self._compute_cos_sin_cache()
+        (q_cache, qc_cache, k_cache, qc_no_clamp_cache, q_inter_cache) = (
+            self._compute_cos_sin_cache()
+        )
 
         self.register_buffer("cos_sin_q_cache", q_cache, persistent=False)
         self.register_buffer("cos_sin_qc_cache", qc_cache, persistent=False)
         self.register_buffer("cos_sin_k_cache", k_cache, persistent=False)
-        self.register_buffer("cos_sin_qc_no_clamp_cache",
-                             qc_no_clamp_cache,
-                             persistent=False)
-        self.register_buffer("cos_sin_q_inter_cache",
-                             q_inter_cache,
-                             persistent=False)
+        self.register_buffer(
+            "cos_sin_qc_no_clamp_cache", qc_no_clamp_cache, persistent=False
+        )
+        self.register_buffer("cos_sin_q_inter_cache", q_inter_cache, persistent=False)
 
     def _compute_inv_freq(self, base: float) -> torch.Tensor:
         """Compute the inverse frequency."""
@@ -59,8 +58,12 @@ def _compute_inv_freq(self, base: float) -> torch.Tensor:
         # use CPU to compute the cache and then move it to GPU. However, we
         # create the cache on GPU for faster initialization. This may cause
         # a slight numerical difference between the HF implementation and ours.
-        inv_freq = 1.0 / (base**(torch.arange(
-            0, self.rotary_dim, 2, dtype=torch.float) / self.rotary_dim))
+        inv_freq = 1.0 / (
+            base
+            ** (
+                torch.arange(0, self.rotary_dim, 2, dtype=torch.float) / self.rotary_dim
+            )
+        )
         return inv_freq
 
     def _compute_cos_sin_cache(self) -> torch.Tensor:
@@ -68,16 +71,15 @@ def _compute_cos_sin_cache(self) -> torch.Tensor:
         inv_freq = self._compute_inv_freq(self.base)
         chunk_len = self.chunk_size - self.local_size
         q_t = torch.arange(chunk_len, dtype=torch.float)
-        qc_t = (torch.arange(chunk_len, dtype=torch.float) +
-                chunk_len).clamp(max=self.chunk_size)
-        k_t = torch.arange(self.max_position_embeddings,
-                           dtype=torch.float) % chunk_len
+        qc_t = (torch.arange(chunk_len, dtype=torch.float) + chunk_len).clamp(
+            max=self.chunk_size
+        )
+        k_t = torch.arange(self.max_position_embeddings, dtype=torch.float) % chunk_len
 
         # count from chunk_len, no clamp(self.chunk_size) restriction
         qc_no_clamp_t = torch.arange(chunk_len, dtype=torch.float) + chunk_len
         # count from self.chunk_size for q_inter's rope
-        q_inter_t = torch.arange(chunk_len,
-                                 dtype=torch.float) + self.chunk_size
+        q_inter_t = torch.arange(chunk_len, dtype=torch.float) + self.chunk_size
 
         q_freqs = torch.outer(q_t, inv_freq)
         qc_freqs = torch.outer(qc_t, inv_freq)
@@ -97,18 +99,21 @@ def _compute_cos_sin_cache(self) -> torch.Tensor:
         q_inter_cos = q_inter_freqs.cos()
         q_inter_sin = q_inter_freqs.sin()
 
-        q_cache = torch.cat((q_cos, q_sin), dim=-1).to(dtype=self.dtype,
-                                                       device=self.device)
-        qc_cache = torch.cat((qc_cos, qc_sin), dim=-1).to(dtype=self.dtype,
-                                                          device=self.device)
-        k_cache = torch.cat((k_cos, k_sin), dim=-1).to(dtype=self.dtype,
-                                                       device=self.device)
-        qc_no_clamp_cache = torch.cat((qc_no_clamp_cos, qc_no_clamp_sin),
-                                      dim=-1).to(dtype=self.dtype,
-                                                 device=self.device)
-        q_inter_cache = torch.cat((q_inter_cos, q_inter_sin),
-                                  dim=-1).to(dtype=self.dtype,
-                                             device=self.device)
+        q_cache = torch.cat((q_cos, q_sin), dim=-1).to(
+            dtype=self.dtype, device=self.device
+        )
+        qc_cache = torch.cat((qc_cos, qc_sin), dim=-1).to(
+            dtype=self.dtype, device=self.device
+        )
+        k_cache = torch.cat((k_cos, k_sin), dim=-1).to(
+            dtype=self.dtype, device=self.device
+        )
+        qc_no_clamp_cache = torch.cat((qc_no_clamp_cos, qc_no_clamp_sin), dim=-1).to(
+            dtype=self.dtype, device=self.device
+        )
+        q_inter_cache = torch.cat((q_inter_cos, q_inter_sin), dim=-1).to(
+            dtype=self.dtype, device=self.device
+        )
         return q_cache, qc_cache, k_cache, qc_no_clamp_cache, q_inter_cache
 
     def forward_native(
@@ -120,45 +125,59 @@ def forward_native(
     ) -> tuple[torch.Tensor, torch.Tensor]:
         query = query.view(*query.shape[:-1], -1, self.head_size)
         key = key.view(*key.shape[:-1], -1, self.head_size)
-        query_rot = query[..., :self.rotary_dim]
-        key_rot = key[..., :self.rotary_dim]
+        query_rot = query[..., : self.rotary_dim]
+        key_rot = key[..., : self.rotary_dim]
         if self.rotary_dim < self.head_size:
-            query_pass = query[..., self.rotary_dim:]
-            key_pass = key[..., self.rotary_dim:]
+            query_pass = query[..., self.rotary_dim :]
+            key_pass = key[..., self.rotary_dim :]
         else:
             query_pass = None
             key_pass = None
 
-        positions_with_offsets = (torch.add(positions, offsets)
-                                  if offsets is not None else positions)
+        positions_with_offsets = (
+            torch.add(positions, offsets) if offsets is not None else positions
+        )
         key = self._apply_rotary_embedding(
-            self.cos_sin_k_cache[positions_with_offsets], key_rot, key_pass)
+            self.cos_sin_k_cache[positions_with_offsets], key_rot, key_pass
+        )
         chunk_len = self.chunk_size - self.local_size
         query = self._apply_rotary_embedding(
             self.cos_sin_q_cache[positions_with_offsets % chunk_len],
-            query_rot, query_pass)
+            query_rot,
+            query_pass,
+        )
         query_succ = self._apply_rotary_embedding(
             self.cos_sin_qc_cache[positions_with_offsets % chunk_len],
-            query_rot, query_pass)
+            query_rot,
+            query_pass,
+        )
         query_inter = self._apply_rotary_embedding(
             self.cos_sin_qc_cache[chunk_len - 1].repeat(positions.shape[0], 1),
-            query_rot, query_pass)
+            query_rot,
+            query_pass,
+        )
         query_succ_critical = self._apply_rotary_embedding(
             self.cos_sin_qc_no_clamp_cache[positions_with_offsets % chunk_len],
-            query_rot, query_pass)
+            query_rot,
+            query_pass,
+        )
         query_inter_critical = self._apply_rotary_embedding(
             self.cos_sin_q_inter_cache[positions_with_offsets % chunk_len],
-            query_rot, query_pass)
+            query_rot,
+            query_pass,
+        )
 
         # merge query into one tensor to simplify the interfaces
-        query = torch.cat((
-            query,
-            query_succ,
-            query_inter,
-            query_succ_critical,
-            query_inter_critical,
-        ),
-                          dim=-1)
+        query = torch.cat(
+            (
+                query,
+                query_succ,
+                query_inter,
+                query_succ_critical,
+                query_inter_critical,
+            ),
+            dim=-1,
+        )
         return query, key
 
     def forward_cuda(
diff --git a/vllm/model_executor/layers/rotary_embedding/dynamic_ntk_alpha_rope.py b/vllm/model_executor/layers/rotary_embedding/dynamic_ntk_alpha_rope.py
index 1da39bbd303b..dd9d06d4b288 100644
--- a/vllm/model_executor/layers/rotary_embedding/dynamic_ntk_alpha_rope.py
+++ b/vllm/model_executor/layers/rotary_embedding/dynamic_ntk_alpha_rope.py
@@ -23,14 +23,16 @@ def __init__(
         dtype: torch.dtype,
     ) -> None:
         self.scaling_alpha = scaling_alpha
-        super().__init__(head_size, rotary_dim, max_position_embeddings, base,
-                         is_neox_style, dtype)
+        super().__init__(
+            head_size, rotary_dim, max_position_embeddings, base, is_neox_style, dtype
+        )
 
     def _compute_cos_sin_cache(self) -> torch.Tensor:
         # For Hunyuan DynamicNTKAlphaRotaryEmbedding
         max_len = self.max_position_embeddings
-        base = self.base * self.scaling_alpha**(self.rotary_dim /
-                                                (self.rotary_dim - 2))
+        base = self.base * self.scaling_alpha ** (
+            self.rotary_dim / (self.rotary_dim - 2)
+        )
         inv_freq = self._compute_inv_freq(base)
         t = torch.arange(max_len, dtype=torch.float)
 
diff --git a/vllm/model_executor/layers/rotary_embedding/dynamic_ntk_scaling_rope.py b/vllm/model_executor/layers/rotary_embedding/dynamic_ntk_scaling_rope.py
index ec2008b90cfb..28fd87ecc21f 100644
--- a/vllm/model_executor/layers/rotary_embedding/dynamic_ntk_scaling_rope.py
+++ b/vllm/model_executor/layers/rotary_embedding/dynamic_ntk_scaling_rope.py
@@ -44,8 +44,9 @@ def __init__(
         dtype: torch.dtype,
     ) -> None:
         self.scaling_factor = scaling_factor
-        super().__init__(head_size, rotary_dim, max_position_embeddings, base,
-                         is_neox_style, dtype)
+        super().__init__(
+            head_size, rotary_dim, max_position_embeddings, base, is_neox_style, dtype
+        )
 
     def _compute_cos_sin_cache(self) -> torch.Tensor:
         # NOTE(woosuk): self.max_position_embeddings is the original
@@ -54,9 +55,9 @@ def _compute_cos_sin_cache(self) -> torch.Tensor:
         # self.max_position_embeddings * self.scaling_factor.
         max_len = self.max_position_embeddings * self.scaling_factor
         base = self.base * (
-            (self.scaling_factor * max_len / self.max_position_embeddings) -
-            (self.scaling_factor - 1))**(self.rotary_dim /
-                                         (self.rotary_dim - 2))
+            (self.scaling_factor * max_len / self.max_position_embeddings)
+            - (self.scaling_factor - 1)
+        ) ** (self.rotary_dim / (self.rotary_dim - 2))
         inv_freq = self._compute_inv_freq(base)
         t = torch.arange(max_len, dtype=torch.float)
 
diff --git a/vllm/model_executor/layers/rotary_embedding/ernie45_vl_rope.py b/vllm/model_executor/layers/rotary_embedding/ernie45_vl_rope.py
index 4960c20f4060..2bc0477c5af2 100644
--- a/vllm/model_executor/layers/rotary_embedding/ernie45_vl_rope.py
+++ b/vllm/model_executor/layers/rotary_embedding/ernie45_vl_rope.py
@@ -33,41 +33,37 @@ def forward_native(  # type: ignore[override]
             assert section_h == section_w
             # Split according to [h w h w h w h w... t t t...]
             section_cos_t = cos[..., -section_t:]
-            section_cos_h = cos[..., :section_h + section_w:2]
-            section_cos_w = cos[..., 1:section_h + section_w:2]
+            section_cos_h = cos[..., : section_h + section_w : 2]
+            section_cos_w = cos[..., 1 : section_h + section_w : 2]
 
-            cos_t, cos_h, cos_w = section_cos_t[0], section_cos_h[
-                1], section_cos_w[2]
-            cos_hw = torch.stack([cos_h, cos_w],
-                                 dim=-1).reshape(cos_h.shape[:-1] +
-                                                 (cos_h.shape[-1] * 2, ))
+            cos_t, cos_h, cos_w = section_cos_t[0], section_cos_h[1], section_cos_w[2]
+            cos_hw = torch.stack([cos_h, cos_w], dim=-1).reshape(
+                cos_h.shape[:-1] + (cos_h.shape[-1] * 2,)
+            )
             cos = torch.cat([cos_hw, cos_t], dim=-1)
 
             section_sin_t = sin[..., -section_t:]
-            section_sin_h = sin[..., :section_h + section_w:2]
-            section_sin_w = sin[..., 1:section_h + section_w:2]
+            section_sin_h = sin[..., : section_h + section_w : 2]
+            section_sin_w = sin[..., 1 : section_h + section_w : 2]
 
-            sin_t, sin_h, sin_w = section_sin_t[0], section_sin_h[
-                1], section_sin_w[2]
-            sin_hw = torch.stack([sin_h, sin_w],
-                                 dim=-1).reshape(sin_h.shape[:-1] +
-                                                 (sin_h.shape[-1] * 2, ))
+            sin_t, sin_h, sin_w = section_sin_t[0], section_sin_h[1], section_sin_w[2]
+            sin_hw = torch.stack([sin_h, sin_w], dim=-1).reshape(
+                sin_h.shape[:-1] + (sin_h.shape[-1] * 2,)
+            )
             sin = torch.cat([sin_hw, sin_t], dim=-1)
 
         query_shape = query.shape
         query = query.view(num_tokens, -1, self.head_size)
-        query_rot = query[..., :self.rotary_dim]
-        query_pass = query[..., self.rotary_dim:]
-        query_rot = apply_rotary_emb_dispatch(query_rot, cos, sin,
-                                              self.is_neox_style)
+        query_rot = query[..., : self.rotary_dim]
+        query_pass = query[..., self.rotary_dim :]
+        query_rot = apply_rotary_emb_dispatch(query_rot, cos, sin, self.is_neox_style)
         query = torch.cat((query_rot, query_pass), dim=-1).reshape(query_shape)
 
         key_shape = key.shape
         key = key.view(num_tokens, -1, self.head_size)
-        key_rot = key[..., :self.rotary_dim]
-        key_pass = key[..., self.rotary_dim:]
-        key_rot = apply_rotary_emb_dispatch(key_rot, cos, sin,
-                                            self.is_neox_style)
+        key_rot = key[..., : self.rotary_dim]
+        key_pass = key[..., self.rotary_dim :]
+        key_rot = apply_rotary_emb_dispatch(key_rot, cos, sin, self.is_neox_style)
         key = torch.cat((key_rot, key_pass), dim=-1).reshape(key_shape)
         return query, key
 
@@ -77,4 +73,4 @@ def forward_cuda(  # type: ignore[override]
         query: torch.Tensor,
         key: Optional[torch.Tensor] = None,
     ) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
-        return self.forward_native(positions, query, key)
\ No newline at end of file
+        return self.forward_native(positions, query, key)
diff --git a/vllm/model_executor/layers/rotary_embedding/linear_scaling_rope.py b/vllm/model_executor/layers/rotary_embedding/linear_scaling_rope.py
index 6e920991882d..cbb3ee4e9974 100644
--- a/vllm/model_executor/layers/rotary_embedding/linear_scaling_rope.py
+++ b/vllm/model_executor/layers/rotary_embedding/linear_scaling_rope.py
@@ -71,8 +71,9 @@ def __init__(
         if isinstance(scaling_factors, float):
             scaling_factors = [scaling_factors]
         self.scaling_factors: list[float] = scaling_factors  # noqa
-        super().__init__(head_size, rotary_dim, max_position_embeddings, base,
-                         is_neox_style, dtype)
+        super().__init__(
+            head_size, rotary_dim, max_position_embeddings, base, is_neox_style, dtype
+        )
         # Lazy initialized.
         self._scaling_factor_to_offset: dict[float, int]
 
diff --git a/vllm/model_executor/layers/rotary_embedding/llama3_rope.py b/vllm/model_executor/layers/rotary_embedding/llama3_rope.py
index adcef549bc4c..ed9a6031eb6f 100644
--- a/vllm/model_executor/layers/rotary_embedding/llama3_rope.py
+++ b/vllm/model_executor/layers/rotary_embedding/llama3_rope.py
@@ -9,7 +9,6 @@
 
 
 class Llama3RotaryEmbedding(RotaryEmbedding):
-
     def __init__(
         self,
         head_size: int,
@@ -27,8 +26,9 @@ def __init__(
         self.low_freq_factor = low_freq_factor
         self.high_freq_factor = high_freq_factor
         self.orig_max_position = orig_max_position
-        super().__init__(head_size, rotary_dim, max_position_embeddings, base,
-                         is_neox_style, dtype)
+        super().__init__(
+            head_size, rotary_dim, max_position_embeddings, base, is_neox_style, dtype
+        )
 
     def _compute_inv_freq(self, base: float) -> torch.Tensor:
         inv_freqs = super()._compute_inv_freq(base)
@@ -37,8 +37,9 @@ def _compute_inv_freq(self, base: float) -> torch.Tensor:
 
         wave_len = 2 * math.pi / inv_freqs
         if self.low_freq_factor != self.high_freq_factor:
-            smooth = (self.orig_max_position / wave_len - self.low_freq_factor
-                      ) / (self.high_freq_factor - self.low_freq_factor)
+            smooth = (self.orig_max_position / wave_len - self.low_freq_factor) / (
+                self.high_freq_factor - self.low_freq_factor
+            )
         else:
             smooth = 0
         new_freqs = torch.where(
@@ -47,8 +48,7 @@ def _compute_inv_freq(self, base: float) -> torch.Tensor:
             torch.where(
                 wave_len > low_freq_wavelen,
                 inv_freqs / self.scaling_factor,
-                (1 - smooth) * inv_freqs / self.scaling_factor +
-                smooth * inv_freqs,
+                (1 - smooth) * inv_freqs / self.scaling_factor + smooth * inv_freqs,
             ),
         )
         return new_freqs
diff --git a/vllm/model_executor/layers/rotary_embedding/llama4_vision_rope.py b/vllm/model_executor/layers/rotary_embedding/llama4_vision_rope.py
index c98a426a2a1e..0b808e31c903 100644
--- a/vllm/model_executor/layers/rotary_embedding/llama4_vision_rope.py
+++ b/vllm/model_executor/layers/rotary_embedding/llama4_vision_rope.py
@@ -10,7 +10,6 @@
 
 
 class Llama4VisionRotaryEmbedding(RotaryEmbedding):
-
     def __init__(
         self,
         head_size: int,
@@ -20,12 +19,13 @@ def __init__(
         is_neox_style: bool,
         dtype: torch.dtype,
     ):
-        super().__init__(head_size, rotary_dim, max_position_embeddings, base,
-                         is_neox_style, dtype)
+        super().__init__(
+            head_size, rotary_dim, max_position_embeddings, base, is_neox_style, dtype
+        )
 
     def _compute_inv_freq(self, base: float) -> torch.Tensor:
         inv_freqs = super()._compute_inv_freq(base)
-        inv_freqs = inv_freqs[:(self.rotary_dim // 2)]
+        inv_freqs = inv_freqs[: (self.rotary_dim // 2)]
         return inv_freqs
 
     def _compute_cos_sin_cache(self) -> torch.Tensor:
@@ -34,23 +34,23 @@ def _compute_cos_sin_cache(self) -> torch.Tensor:
         # self.max_position_embeddings here is number of image patches
         # i.e. (image_size // patch_size) ** 2
         num_patches = self.max_position_embeddings
-        img_idx = torch.arange(num_patches,
-                    dtype=torch.int32) \
-                    .reshape(num_patches, 1)
+        img_idx = torch.arange(num_patches, dtype=torch.int32).reshape(num_patches, 1)
         img_idx = torch.cat([img_idx, img_idx[:1]], dim=0)
         img_idx[-1, -1] = -2  # set to ID_CLS_TOKEN
         num_patches_single_dim = int(math.sqrt(num_patches))
         frequencies_x = img_idx % num_patches_single_dim
         frequencies_y = img_idx // num_patches_single_dim
-        freqs_x = ((frequencies_x + 1)[..., None] *
-                   inv_freq[None, None, :]).repeat_interleave(2, dim=-1)
-        freqs_y = ((frequencies_y + 1)[..., None] *
-                   inv_freq[None, None, :]).repeat_interleave(2, dim=-1)
-        freqs = torch.cat([freqs_x, freqs_y],
-                          dim=-1).float().contiguous()[..., ::2]
+        freqs_x = (
+            (frequencies_x + 1)[..., None] * inv_freq[None, None, :]
+        ).repeat_interleave(2, dim=-1)
+        freqs_y = (
+            (frequencies_y + 1)[..., None] * inv_freq[None, None, :]
+        ).repeat_interleave(2, dim=-1)
+        freqs = torch.cat([freqs_x, freqs_y], dim=-1).float().contiguous()[..., ::2]
         freqs = freqs.masked_fill(img_idx.reshape(-1, 1, 1) < 0, 0)
         cache = torch.view_as_complex(
-            torch.stack([torch.cos(freqs), torch.sin(freqs)], dim=-1))
+            torch.stack([torch.cos(freqs), torch.sin(freqs)], dim=-1)
+        )
         return cache
 
     def forward_native(  # type: ignore[override]
@@ -62,10 +62,8 @@ def forward_native(  # type: ignore[override]
         # self.cos_sin_cache here is complex tensor so we cannot cast into
         # query's dtype directly with self._match_cos_sin_cache_dtype
         self.cos_sin_cache: torch.Tensor = self.cos_sin_cache.to(query.device)
-        query_ = torch.view_as_complex(query.float().reshape(
-            *query.shape[:-1], -1, 2))
-        key_ = torch.view_as_complex(key.float().reshape(
-            *key.shape[:-1], -1, 2))
+        query_ = torch.view_as_complex(query.float().reshape(*query.shape[:-1], -1, 2))
+        key_ = torch.view_as_complex(key.float().reshape(*key.shape[:-1], -1, 2))
         broadcast_shape = [
             d if i == 1 or i == (query_.ndim - 1) else 1
             for i, d in enumerate(query_.shape)
diff --git a/vllm/model_executor/layers/rotary_embedding/mrope.py b/vllm/model_executor/layers/rotary_embedding/mrope.py
index 9bf0d6bd15e7..120979970679 100644
--- a/vllm/model_executor/layers/rotary_embedding/mrope.py
+++ b/vllm/model_executor/layers/rotary_embedding/mrope.py
@@ -62,10 +62,8 @@ def _triton_mrope_forward(
     # Updated offsets for half head_dim
     cos_offsets = tl.arange(0, pad_hd // 2)
     if is_interleaved:
-        h_mask = (((cos_offsets % 3) == 1) &
-                  (cos_offsets <= 3 * mrope_section_h))
-        w_mask = (((cos_offsets % 3) == 2) &
-                  (cos_offsets <= 3 * mrope_section_w))
+        h_mask = ((cos_offsets % 3) == 1) & (cos_offsets <= 3 * mrope_section_h)
+        w_mask = ((cos_offsets % 3) == 2) & (cos_offsets <= 3 * mrope_section_w)
         t_mask = ~(h_mask | w_mask)
     else:
         t_end = mrope_section_t
@@ -89,21 +87,25 @@ def _triton_mrope_forward(
     # program instance (i.e. for the current token) separately
     # ####################################################################
     # left half of the head
-    first_half_q_offsets = tl.arange(0, pad_n_qh)[:, None] * hd + tl.arange(
-        0, pad_hd // 2)[None, :]
-    first_half_k_offsets = tl.arange(0, pad_n_kh)[:, None] * hd + tl.arange(
-        0, pad_hd // 2)[None, :]
-    first_q_mask = (tl.arange(0, pad_n_qh)[:, None] < n_qh) & (tl.arange(
-        0, pad_hd // 2)[None, :] < rd // 2)
-    first_k_mask = (tl.arange(0, pad_n_kh)[:, None] < n_kh) & (tl.arange(
-        0, pad_hd // 2)[None, :] < rd // 2)
-
-    q_tile_1 = tl.load(q_ptr + first_half_q_offsets,
-                       mask=first_q_mask,
-                       other=0).to(sin_row.dtype)
-    k_tile_1 = tl.load(k_ptr + first_half_k_offsets,
-                       mask=first_k_mask,
-                       other=0).to(sin_row.dtype)
+    first_half_q_offsets = (
+        tl.arange(0, pad_n_qh)[:, None] * hd + tl.arange(0, pad_hd // 2)[None, :]
+    )
+    first_half_k_offsets = (
+        tl.arange(0, pad_n_kh)[:, None] * hd + tl.arange(0, pad_hd // 2)[None, :]
+    )
+    first_q_mask = (tl.arange(0, pad_n_qh)[:, None] < n_qh) & (
+        tl.arange(0, pad_hd // 2)[None, :] < rd // 2
+    )
+    first_k_mask = (tl.arange(0, pad_n_kh)[:, None] < n_kh) & (
+        tl.arange(0, pad_hd // 2)[None, :] < rd // 2
+    )
+
+    q_tile_1 = tl.load(q_ptr + first_half_q_offsets, mask=first_q_mask, other=0).to(
+        sin_row.dtype
+    )
+    k_tile_1 = tl.load(k_ptr + first_half_k_offsets, mask=first_k_mask, other=0).to(
+        sin_row.dtype
+    )
 
     # right half of the head
     second_half_q_offsets = first_half_q_offsets + (rd // 2)
@@ -111,12 +113,12 @@ def _triton_mrope_forward(
     second_q_mask = first_q_mask
     second_k_mask = first_k_mask
 
-    q_tile_2 = tl.load(q_ptr + second_half_q_offsets,
-                       mask=second_q_mask,
-                       other=0).to(sin_row.dtype)
-    k_tile_2 = tl.load(k_ptr + second_half_k_offsets,
-                       mask=second_k_mask,
-                       other=0).to(sin_row.dtype)
+    q_tile_2 = tl.load(q_ptr + second_half_q_offsets, mask=second_q_mask, other=0).to(
+        sin_row.dtype
+    )
+    k_tile_2 = tl.load(k_ptr + second_half_k_offsets, mask=second_k_mask, other=0).to(
+        sin_row.dtype
+    )
 
     # y = [x1, x2] * [cos, cos] + [-x2, x1] * [sin, sin]
     # Since cos and sin are now half-size,
@@ -168,7 +170,7 @@ def triton_mrope(
     cos = cos.contiguous()
     sin = sin.contiguous()
 
-    _triton_mrope_forward[(n_row, )](
+    _triton_mrope_forward[(n_row,)](
         q,
         k,
         cos,
@@ -189,15 +191,14 @@ def triton_mrope(
     return q, k
 
 
-def apply_interleaved_rope(x: torch.Tensor,
-                           mrope_section: list[int]) -> torch.Tensor:
+def apply_interleaved_rope(x: torch.Tensor, mrope_section: list[int]) -> torch.Tensor:
     """Apply interleaved MRoPE to 3D rotary embeddings.
     Reorganizes frequency layout from chunked [TTT...HHH...WWW] to
     interleaved [THTHWHTHW...TT], preserving frequency continuity.
     """
     x_t = x[0].clone()
-    x_t[..., 1:mrope_section[1] * 3:3] = x[1, ..., 1:mrope_section[1] * 3:3]
-    x_t[..., 2:mrope_section[2] * 3:3] = x[2, ..., 2:mrope_section[2] * 3:3]
+    x_t[..., 1 : mrope_section[1] * 3 : 3] = x[1, ..., 1 : mrope_section[1] * 3 : 3]
+    x_t[..., 2 : mrope_section[2] * 3 : 3] = x[2, ..., 2 : mrope_section[2] * 3 : 3]
     return x_t
 
 
@@ -222,7 +223,6 @@ def __init__(
         beta_fast: int = 32,
         beta_slow: int = 1,
     ) -> None:
-
         self.scaling_factor = scaling_factor
         self.extrapolation_factor = extrapolation_factor
         self.attn_factor = attn_factor
@@ -230,8 +230,7 @@ def __init__(
         self.beta_slow = beta_slow
         if self.scaling_factor is not None:
             # Get n-d magnitude scaling corrected for interpolation
-            self.mscale = float(
-                yarn_get_mscale(self.scaling_factor) * attn_factor)
+            self.mscale = float(yarn_get_mscale(self.scaling_factor) * attn_factor)
         else:
             self.mscale = 1.0
 
@@ -239,8 +238,14 @@ def __init__(
         # the input video. We enlarge max_position_embeddings to 4 times to get
         # a larger the cos and sin cache.
         self.cache_max_position_num = max_position_embeddings * 4
-        super().__init__(head_size, rotary_dim, self.cache_max_position_num,
-                         base, is_neox_style, dtype)
+        super().__init__(
+            head_size,
+            rotary_dim,
+            self.cache_max_position_num,
+            base,
+            is_neox_style,
+            dtype,
+        )
 
         self.mrope_section = mrope_section
         self.mrope_interleaved = mrope_interleaved
@@ -286,31 +291,27 @@ def forward_native(
                 cos = apply_interleaved_rope(cos, self.mrope_section)
                 sin = apply_interleaved_rope(sin, self.mrope_section)
             else:
-                cos = torch.cat([
-                    m[i] for i, m in enumerate(
-                        cos.split(self.mrope_section, dim=-1))
-                ],
-                                dim=-1)
-                sin = torch.cat([
-                    m[i] for i, m in enumerate(
-                        sin.split(self.mrope_section, dim=-1))
-                ],
-                                dim=-1)
+                cos = torch.cat(
+                    [m[i] for i, m in enumerate(cos.split(self.mrope_section, dim=-1))],
+                    dim=-1,
+                )
+                sin = torch.cat(
+                    [m[i] for i, m in enumerate(sin.split(self.mrope_section, dim=-1))],
+                    dim=-1,
+                )
 
         query_shape = query.shape
         query = query.view(num_tokens, -1, self.head_size)
-        query_rot = query[..., :self.rotary_dim]
-        query_pass = query[..., self.rotary_dim:]
-        query_rot = apply_rotary_emb_dispatch(query_rot, cos, sin,
-                                              self.is_neox_style)
+        query_rot = query[..., : self.rotary_dim]
+        query_pass = query[..., self.rotary_dim :]
+        query_rot = apply_rotary_emb_dispatch(query_rot, cos, sin, self.is_neox_style)
         query = torch.cat((query_rot, query_pass), dim=-1).reshape(query_shape)
 
         key_shape = key.shape
         key = key.view(num_tokens, -1, self.head_size)
-        key_rot = key[..., :self.rotary_dim]
-        key_pass = key[..., self.rotary_dim:]
-        key_rot = apply_rotary_emb_dispatch(key_rot, cos, sin,
-                                            self.is_neox_style)
+        key_rot = key[..., : self.rotary_dim]
+        key_pass = key[..., self.rotary_dim :]
+        key_rot = apply_rotary_emb_dispatch(key_rot, cos, sin, self.is_neox_style)
         key = torch.cat((key_rot, key_pass), dim=-1).reshape(key_shape)
         return query, key
 
@@ -321,7 +322,6 @@ def forward_cuda(
         key: Optional[torch.Tensor] = None,
         offsets: Optional[torch.Tensor] = None,
     ) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
-
         assert positions.ndim == 1 or positions.ndim == 2
         assert key is not None
 
@@ -348,17 +348,15 @@ def forward_cuda(
             return q.reshape(query_shape), k.reshape(key_shape)
 
         query = query.view(num_tokens, -1, self.head_size)
-        query_rot = query[..., :self.rotary_dim]
-        query_pass = query[..., self.rotary_dim:]
-        query_rot = apply_rotary_emb_dispatch(query_rot, cos, sin,
-                                              self.is_neox_style)
+        query_rot = query[..., : self.rotary_dim]
+        query_pass = query[..., self.rotary_dim :]
+        query_rot = apply_rotary_emb_dispatch(query_rot, cos, sin, self.is_neox_style)
         query = torch.cat((query_rot, query_pass), dim=-1).reshape(query_shape)
 
         key = key.view(num_tokens, -1, self.head_size)
-        key_rot = key[..., :self.rotary_dim]
-        key_pass = key[..., self.rotary_dim:]
-        key_rot = apply_rotary_emb_dispatch(key_rot, cos, sin,
-                                            self.is_neox_style)
+        key_rot = key[..., : self.rotary_dim]
+        key_pass = key[..., self.rotary_dim :]
+        key_rot = apply_rotary_emb_dispatch(key_rot, cos, sin, self.is_neox_style)
         key = torch.cat((key_rot, key_pass), dim=-1).reshape(key_shape)
         return query, key
 
@@ -397,21 +395,19 @@ def get_input_positions(
 
         image_grid_thw = [] if image_grid_thw is None else image_grid_thw
         video_grid_thw = [] if video_grid_thw is None else video_grid_thw
-        second_per_grid_ts = [] if second_per_grid_ts is None else \
-            second_per_grid_ts
-
-        llm_positions, mrope_position_delta = \
-            cls.get_input_positions_tensor(
-                input_tokens=input_tokens,
-                hf_config=hf_config,
-                image_grid_thw=image_grid_thw,
-                video_grid_thw=video_grid_thw,
-                second_per_grid_ts=second_per_grid_ts,
-                context_len=context_len,
-                seq_len=seq_len,
-                audio_feature_lengths=audio_feature_lengths,
-                use_audio_in_video=use_audio_in_video,
-            )
+        second_per_grid_ts = [] if second_per_grid_ts is None else second_per_grid_ts
+
+        llm_positions, mrope_position_delta = cls.get_input_positions_tensor(
+            input_tokens=input_tokens,
+            hf_config=hf_config,
+            image_grid_thw=image_grid_thw,
+            video_grid_thw=video_grid_thw,
+            second_per_grid_ts=second_per_grid_ts,
+            context_len=context_len,
+            seq_len=seq_len,
+            audio_feature_lengths=audio_feature_lengths,
+            use_audio_in_video=use_audio_in_video,
+        )
 
         return llm_positions.tolist(), mrope_position_delta
 
@@ -429,6 +425,7 @@ def get_input_positions_tensor(
         use_audio_in_video: bool = False,
     ) -> tuple[torch.Tensor, int]:
         from vllm.transformers_utils.config import thinker_uses_mrope
+
         if thinker_uses_mrope(hf_config):
             return cls._omni_get_input_positions_tensor(
                 input_tokens=input_tokens,
@@ -527,7 +524,8 @@ def _glm4v_get_input_positions_tensor(
 
             input_type_group: list[tuple[str, int, int]] = []
             for key, group_iter in itertools.groupby(
-                    enumerate(input_token_type), lambda x: x[1]):
+                enumerate(input_token_type), lambda x: x[1]
+            ):
                 group_list = list(group_iter)
                 start_index = group_list[0][0]
                 end_index = group_list[-1][0] + 1
@@ -536,25 +534,42 @@ def _glm4v_get_input_positions_tensor(
             video_frame_num = 1
             mm_data_idx = 0
             for modality_type, start_idx, end_idx in input_type_group:
-                st_idx = llm_pos_ids_list[-1].max() + 1 if len(
-                    llm_pos_ids_list) > 0 else 0
+                st_idx = (
+                    llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
+                )
                 if modality_type == "image":
                     t, h, w = (
                         image_grid_thw[mm_data_idx][0],
                         image_grid_thw[mm_data_idx][1],
                         image_grid_thw[mm_data_idx][2],
                     )
-                    llm_grid_t, llm_grid_h, llm_grid_w = \
-                        t, h // spatial_merge_size, w // spatial_merge_size
-
-                    t_index = torch.arange(llm_grid_t).view(-1, 1).expand(
-                        -1, llm_grid_h * llm_grid_w).flatten()
-                    h_index = torch.arange(llm_grid_h).view(1, -1, 1).expand(
-                        llm_grid_t, -1, llm_grid_w).flatten()
-                    w_index = torch.arange(llm_grid_w).view(1, 1, -1).expand(
-                        llm_grid_t, llm_grid_h, -1).flatten()
+                    llm_grid_t, llm_grid_h, llm_grid_w = (
+                        t,
+                        h // spatial_merge_size,
+                        w // spatial_merge_size,
+                    )
+
+                    t_index = (
+                        torch.arange(llm_grid_t)
+                        .view(-1, 1)
+                        .expand(-1, llm_grid_h * llm_grid_w)
+                        .flatten()
+                    )
+                    h_index = (
+                        torch.arange(llm_grid_h)
+                        .view(1, -1, 1)
+                        .expand(llm_grid_t, -1, llm_grid_w)
+                        .flatten()
+                    )
+                    w_index = (
+                        torch.arange(llm_grid_w)
+                        .view(1, 1, -1)
+                        .expand(llm_grid_t, llm_grid_h, -1)
+                        .flatten()
+                    )
                     llm_pos_ids_list.append(
-                        torch.stack([t_index, h_index, w_index]) + st_idx)
+                        torch.stack([t_index, h_index, w_index]) + st_idx
+                    )
                     mm_data_idx += 1
 
                 elif modality_type == "video":
@@ -563,18 +578,34 @@ def _glm4v_get_input_positions_tensor(
                         image_grid_thw[mm_data_idx][1],
                         image_grid_thw[mm_data_idx][2],
                     )
-                    llm_grid_t, llm_grid_h, llm_grid_w = \
-                        t, h // spatial_merge_size, w // spatial_merge_size
+                    llm_grid_t, llm_grid_h, llm_grid_w = (
+                        t,
+                        h // spatial_merge_size,
+                        w // spatial_merge_size,
+                    )
 
                     for t_idx in range(llm_grid_t):
-                        t_index = torch.tensor(t_idx).view(-1, 1).expand(
-                            -1, llm_grid_h * llm_grid_w).flatten()
-                        h_index = torch.arange(llm_grid_h).view(
-                            1, -1, 1).expand(1, -1, llm_grid_w).flatten()
-                        w_index = torch.arange(llm_grid_w).view(
-                            1, 1, -1).expand(1, llm_grid_h, -1).flatten()
+                        t_index = (
+                            torch.tensor(t_idx)
+                            .view(-1, 1)
+                            .expand(-1, llm_grid_h * llm_grid_w)
+                            .flatten()
+                        )
+                        h_index = (
+                            torch.arange(llm_grid_h)
+                            .view(1, -1, 1)
+                            .expand(1, -1, llm_grid_w)
+                            .flatten()
+                        )
+                        w_index = (
+                            torch.arange(llm_grid_w)
+                            .view(1, 1, -1)
+                            .expand(1, llm_grid_h, -1)
+                            .flatten()
+                        )
                         llm_pos_ids_list.append(
-                            torch.stack([t_index, h_index, w_index]) + st_idx)
+                            torch.stack([t_index, h_index, w_index]) + st_idx
+                        )
 
                     mm_data_idx += 1
                     video_frame_num += 1
@@ -582,19 +613,17 @@ def _glm4v_get_input_positions_tensor(
                 else:
                     text_len = end_idx - start_idx
                     llm_pos_ids_list.append(
-                        torch.arange(text_len).view(1, -1).expand(3, -1) +
-                        st_idx)
+                        torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx
+                    )
                     video_frame_num = 1
 
         else:
             text_len = len(input_tokens)
-            llm_pos_ids_list.append(
-                torch.arange(text_len).view(1, -1).expand(3, -1))
+            llm_pos_ids_list.append(torch.arange(text_len).view(1, -1).expand(3, -1))
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
         llm_positions = llm_positions[:, context_len:seq_len]
-        mrope_position_delta = (llm_positions.max() + 1 -
-                                len(input_tokens)).item()
+        mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
         return llm_positions, mrope_position_delta
 
     @classmethod
@@ -609,8 +638,7 @@ def _qwen3vl_get_input_positions_tensor(
     ) -> tuple[torch.Tensor, int]:
         """Get mrope input positions and delta value."""
 
-        video_grid_thw = [[1, h, w] for t, h, w in video_grid_thw
-                          for _ in range(t)]
+        video_grid_thw = [[1, h, w] for t, h, w in video_grid_thw for _ in range(t)]
 
         image_token_id = hf_config.image_token_id
         video_token_id = hf_config.video_token_id
@@ -619,7 +647,8 @@ def _qwen3vl_get_input_positions_tensor(
 
         input_tokens_tensor = torch.tensor(input_tokens)
         vision_start_indices = torch.argwhere(
-            input_tokens_tensor == vision_start_token_id).squeeze(1)
+            input_tokens_tensor == vision_start_token_id
+        ).squeeze(1)
         vision_tokens = input_tokens_tensor[vision_start_indices + 1]
         image_nums = (vision_tokens == image_token_id).sum()
         video_nums = (vision_tokens == video_token_id).sum()
@@ -657,35 +686,50 @@ def _qwen3vl_get_input_positions_tensor(
                 remain_videos -= 1
                 ed = ed_video
 
-            llm_grid_t, llm_grid_h, llm_grid_w = \
-                t, h // spatial_merge_size, w // spatial_merge_size
+            llm_grid_t, llm_grid_h, llm_grid_w = (
+                t,
+                h // spatial_merge_size,
+                w // spatial_merge_size,
+            )
             text_len = ed - st
 
-            st_idx = llm_pos_ids_list[-1].max() + 1 if len(
-                llm_pos_ids_list) > 0 else 0
+            st_idx = llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
             llm_pos_ids_list.append(
-                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx)
-
-            t_index = torch.arange(llm_grid_t).view(-1, 1).expand(
-                -1, llm_grid_h * llm_grid_w).flatten()
-            h_index = torch.arange(llm_grid_h).view(1, -1, 1).expand(
-                llm_grid_t, -1, llm_grid_w).flatten()
-            w_index = torch.arange(llm_grid_w).view(1, 1, -1).expand(
-                llm_grid_t, llm_grid_h, -1).flatten()
+                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx
+            )
+
+            t_index = (
+                torch.arange(llm_grid_t)
+                .view(-1, 1)
+                .expand(-1, llm_grid_h * llm_grid_w)
+                .flatten()
+            )
+            h_index = (
+                torch.arange(llm_grid_h)
+                .view(1, -1, 1)
+                .expand(llm_grid_t, -1, llm_grid_w)
+                .flatten()
+            )
+            w_index = (
+                torch.arange(llm_grid_w)
+                .view(1, 1, -1)
+                .expand(llm_grid_t, llm_grid_h, -1)
+                .flatten()
+            )
             llm_pos_ids_list.append(
-                torch.stack([t_index, h_index, w_index]) + text_len + st_idx)
+                torch.stack([t_index, h_index, w_index]) + text_len + st_idx
+            )
             st = ed + llm_grid_t * llm_grid_h * llm_grid_w
 
         if st < len(input_tokens):
-            st_idx = llm_pos_ids_list[-1].max() + 1 if len(
-                llm_pos_ids_list) > 0 else 0
+            st_idx = llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
             text_len = len(input_tokens) - st
             llm_pos_ids_list.append(
-                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx)
+                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx
+            )
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
-        mrope_position_delta = (llm_positions.max() + 1 -
-                                len(input_tokens)).item()
+        mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
         llm_positions = llm_positions[:, context_len:seq_len]
         return llm_positions, mrope_position_delta
 
@@ -729,7 +773,8 @@ def _ernie_get_input_positions_tensor(
 
             input_type_group: list[tuple[str, int, int]] = []
             for key, group_iter in itertools.groupby(
-                    enumerate(input_token_type), lambda x: x[1]):
+                enumerate(input_token_type), lambda x: x[1]
+            ):
                 group_list = list(group_iter)
                 start_index = group_list[0][0]
                 end_index = group_list[-1][0] + 1
@@ -738,25 +783,42 @@ def _ernie_get_input_positions_tensor(
             video_frame_num = 1
             mm_data_idx = 0
             for modality_type, start_idx, end_idx in input_type_group:
-                st_idx = llm_pos_ids_list[-1].max() + 1 if len(
-                    llm_pos_ids_list) > 0 else 0
+                st_idx = (
+                    llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
+                )
                 if modality_type == "image":
                     t, h, w = (
                         image_grid_thw[mm_data_idx][0],
                         image_grid_thw[mm_data_idx][1],
                         image_grid_thw[mm_data_idx][2],
                     )
-                    llm_grid_t, llm_grid_h, llm_grid_w = \
-                        t, h // spatial_conv_size, w // spatial_conv_size
-
-                    t_index = torch.arange(llm_grid_t).view(-1, 1).expand(
-                        -1, llm_grid_h * llm_grid_w).flatten()
-                    h_index = torch.arange(llm_grid_h).view(1, -1, 1).expand(
-                        llm_grid_t, -1, llm_grid_w).flatten()
-                    w_index = torch.arange(llm_grid_w).view(1, 1, -1).expand(
-                        llm_grid_t, llm_grid_h, -1).flatten()
+                    llm_grid_t, llm_grid_h, llm_grid_w = (
+                        t,
+                        h // spatial_conv_size,
+                        w // spatial_conv_size,
+                    )
+
+                    t_index = (
+                        torch.arange(llm_grid_t)
+                        .view(-1, 1)
+                        .expand(-1, llm_grid_h * llm_grid_w)
+                        .flatten()
+                    )
+                    h_index = (
+                        torch.arange(llm_grid_h)
+                        .view(1, -1, 1)
+                        .expand(llm_grid_t, -1, llm_grid_w)
+                        .flatten()
+                    )
+                    w_index = (
+                        torch.arange(llm_grid_w)
+                        .view(1, 1, -1)
+                        .expand(llm_grid_t, llm_grid_h, -1)
+                        .flatten()
+                    )
                     llm_pos_ids_list.append(
-                        torch.stack([t_index, h_index, w_index]) + st_idx)
+                        torch.stack([t_index, h_index, w_index]) + st_idx
+                    )
                     mm_data_idx += 1
 
                 elif modality_type == "video":
@@ -765,22 +827,34 @@ def _ernie_get_input_positions_tensor(
                         video_grid_thw[mm_data_idx][1],
                         video_grid_thw[mm_data_idx][2],
                     )
-                    llm_grid_t, llm_grid_h, llm_grid_w = (t //
-                                                          temporal_conv_size,
-                                                          h //
-                                                          spatial_conv_size,
-                                                          w //
-                                                          spatial_conv_size)
+                    llm_grid_t, llm_grid_h, llm_grid_w = (
+                        t // temporal_conv_size,
+                        h // spatial_conv_size,
+                        w // spatial_conv_size,
+                    )
 
                     for t_idx in range(llm_grid_t):
-                        t_index = torch.tensor(t_idx).view(-1, 1).expand(
-                            -1, llm_grid_h * llm_grid_w).flatten()
-                        h_index = torch.arange(llm_grid_h).view(
-                            1, -1, 1).expand(1, -1, llm_grid_w).flatten()
-                        w_index = torch.arange(llm_grid_w).view(
-                            1, 1, -1).expand(1, llm_grid_h, -1).flatten()
+                        t_index = (
+                            torch.tensor(t_idx)
+                            .view(-1, 1)
+                            .expand(-1, llm_grid_h * llm_grid_w)
+                            .flatten()
+                        )
+                        h_index = (
+                            torch.arange(llm_grid_h)
+                            .view(1, -1, 1)
+                            .expand(1, -1, llm_grid_w)
+                            .flatten()
+                        )
+                        w_index = (
+                            torch.arange(llm_grid_w)
+                            .view(1, 1, -1)
+                            .expand(1, llm_grid_h, -1)
+                            .flatten()
+                        )
                         llm_pos_ids_list.append(
-                            torch.stack([t_index, h_index, w_index]) + st_idx)
+                            torch.stack([t_index, h_index, w_index]) + st_idx
+                        )
 
                     mm_data_idx += 1
                     video_frame_num += 1
@@ -788,19 +862,17 @@ def _ernie_get_input_positions_tensor(
                 else:
                     text_len = end_idx - start_idx
                     llm_pos_ids_list.append(
-                        torch.arange(text_len).view(1, -1).expand(3, -1) +
-                        st_idx)
+                        torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx
+                    )
                     video_frame_num = 1
 
         else:
             text_len = len(input_tokens)
-            llm_pos_ids_list.append(
-                torch.arange(text_len).view(1, -1).expand(3, -1))
+            llm_pos_ids_list.append(torch.arange(text_len).view(1, -1).expand(3, -1))
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
         llm_positions = llm_positions[:, context_len:seq_len]
-        mrope_position_delta = (llm_positions.max() + 1 -
-                                len(input_tokens)).item()
+        mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
         return llm_positions, mrope_position_delta
 
     @classmethod
@@ -817,8 +889,7 @@ def _keye_get_input_positions_tensor(
             video_grid_thw = video_grid_thw[0]
         """Get mrope input positions and delta value (Keye series)."""
 
-        def split_thw(
-                grid_thw: Union[torch.Tensor, list[int]]) -> list[list[int]]:
+        def split_thw(grid_thw: Union[torch.Tensor, list[int]]) -> list[list[int]]:
             """
             Split grid_thw along the t dimension.
 
@@ -889,36 +960,54 @@ def split_thw(
                 remain_frames -= 1
                 ed = ed_video
 
-            llm_grid_t, llm_grid_h, llm_grid_w = \
-                t, h // spatial_merge_size, w // spatial_merge_size
+            llm_grid_t, llm_grid_h, llm_grid_w = (
+                t,
+                h // spatial_merge_size,
+                w // spatial_merge_size,
+            )
             text_len = ed - st
 
-            st_idx = llm_pos_ids_list[-1].max() + 1 if len(
-                llm_pos_ids_list) > 0 else 0
+            st_idx = llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
             llm_pos_ids_list.append(
-                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx)
+                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx
+            )
 
-            t_index = (torch.arange(llm_grid_t).view(-1, 1).expand(
-                -1, llm_grid_h * llm_grid_w)).long().flatten()
+            t_index = (
+                (
+                    torch.arange(llm_grid_t)
+                    .view(-1, 1)
+                    .expand(-1, llm_grid_h * llm_grid_w)
+                )
+                .long()
+                .flatten()
+            )
 
-            h_index = torch.arange(llm_grid_h).view(1, -1, 1).expand(
-                llm_grid_t, -1, llm_grid_w).flatten()
-            w_index = torch.arange(llm_grid_w).view(1, 1, -1).expand(
-                llm_grid_t, llm_grid_h, -1).flatten()
+            h_index = (
+                torch.arange(llm_grid_h)
+                .view(1, -1, 1)
+                .expand(llm_grid_t, -1, llm_grid_w)
+                .flatten()
+            )
+            w_index = (
+                torch.arange(llm_grid_w)
+                .view(1, 1, -1)
+                .expand(llm_grid_t, llm_grid_h, -1)
+                .flatten()
+            )
             llm_pos_ids_list.append(
-                torch.stack([t_index, h_index, w_index]) + text_len + st_idx)
+                torch.stack([t_index, h_index, w_index]) + text_len + st_idx
+            )
             st = ed + llm_grid_t * llm_grid_h * llm_grid_w
 
         if st < len(input_tokens):
-            st_idx = llm_pos_ids_list[-1].max() + 1 if len(
-                llm_pos_ids_list) > 0 else 0
+            st_idx = llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
             text_len = len(input_tokens) - st
             llm_pos_ids_list.append(
-                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx)
+                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx
+            )
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
-        mrope_position_delta = (llm_positions.max() + 1 -
-                                len(input_tokens)).item()
+        mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
         llm_positions = llm_positions[:, context_len:seq_len]
 
         return llm_positions, mrope_position_delta
@@ -940,12 +1029,12 @@ def _vl_get_input_positions_tensor(
         video_token_id = hf_config.video_token_id
         vision_start_token_id = hf_config.vision_start_token_id
         spatial_merge_size = hf_config.vision_config.spatial_merge_size
-        tokens_per_second = getattr(hf_config.vision_config,
-                                    "tokens_per_second", 1.0)
+        tokens_per_second = getattr(hf_config.vision_config, "tokens_per_second", 1.0)
 
         input_tokens_tensor = torch.tensor(input_tokens)
         vision_start_indices = torch.argwhere(
-            input_tokens_tensor == vision_start_token_id).squeeze(1)
+            input_tokens_tensor == vision_start_token_id
+        ).squeeze(1)
         vision_tokens = input_tokens_tensor[vision_start_indices + 1]
         image_nums = (vision_tokens == image_token_id).sum()
         video_nums = (vision_tokens == video_token_id).sum()
@@ -993,37 +1082,56 @@ def _vl_get_input_positions_tensor(
                 remain_videos -= 1
                 ed = ed_video
 
-            llm_grid_t, llm_grid_h, llm_grid_w = \
-                t, h // spatial_merge_size, w // spatial_merge_size
+            llm_grid_t, llm_grid_h, llm_grid_w = (
+                t,
+                h // spatial_merge_size,
+                w // spatial_merge_size,
+            )
             text_len = ed - st
 
-            st_idx = llm_pos_ids_list[-1].max() + 1 if len(
-                llm_pos_ids_list) > 0 else 0
+            st_idx = llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
             llm_pos_ids_list.append(
-                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx)
+                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx
+            )
 
-            t_index = (torch.arange(llm_grid_t).view(-1, 1).expand(
-                -1, llm_grid_h * llm_grid_w) * video_second_per_grid_t *
-                       tokens_per_second).long().flatten()
+            t_index = (
+                (
+                    torch.arange(llm_grid_t)
+                    .view(-1, 1)
+                    .expand(-1, llm_grid_h * llm_grid_w)
+                    * video_second_per_grid_t
+                    * tokens_per_second
+                )
+                .long()
+                .flatten()
+            )
 
-            h_index = torch.arange(llm_grid_h).view(1, -1, 1).expand(
-                llm_grid_t, -1, llm_grid_w).flatten()
-            w_index = torch.arange(llm_grid_w).view(1, 1, -1).expand(
-                llm_grid_t, llm_grid_h, -1).flatten()
+            h_index = (
+                torch.arange(llm_grid_h)
+                .view(1, -1, 1)
+                .expand(llm_grid_t, -1, llm_grid_w)
+                .flatten()
+            )
+            w_index = (
+                torch.arange(llm_grid_w)
+                .view(1, 1, -1)
+                .expand(llm_grid_t, llm_grid_h, -1)
+                .flatten()
+            )
             llm_pos_ids_list.append(
-                torch.stack([t_index, h_index, w_index]) + text_len + st_idx)
+                torch.stack([t_index, h_index, w_index]) + text_len + st_idx
+            )
             st = ed + llm_grid_t * llm_grid_h * llm_grid_w
 
         if st < len(input_tokens):
-            st_idx = llm_pos_ids_list[-1].max() + 1 if len(
-                llm_pos_ids_list) > 0 else 0
+            st_idx = llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
             text_len = len(input_tokens) - st
             llm_pos_ids_list.append(
-                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx)
+                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx
+            )
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
-        mrope_position_delta = (llm_positions.max() + 1 -
-                                len(input_tokens)).item()
+        mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
         llm_positions = llm_positions[:, context_len:seq_len]
 
         return llm_positions, mrope_position_delta
@@ -1070,8 +1178,9 @@ def _omni_get_input_positions_tensor(
         vision_end_token_id = thinker_config.vision_end_token_id
         seconds_per_chunk = thinker_config.seconds_per_chunk
         spatial_merge_size = thinker_config.vision_config.spatial_merge_size
-        tokens_per_second = getattr(thinker_config.vision_config,
-                                    "tokens_per_second", 25)
+        tokens_per_second = getattr(
+            thinker_config.vision_config, "tokens_per_second", 25
+        )
 
         if isinstance(image_grid_thw, list):
             image_grid_thw = torch.tensor(image_grid_thw)
@@ -1091,28 +1200,30 @@ def _omni_get_input_positions_tensor(
         idx = 0
         while idx < len(src_item):
             new_src_item_len = len(new_src_item)
-            start_idx = llm_pos_ids_list[-1].max() + 1 if len(
-                llm_pos_ids_list) > 0 else 0
-            if src_item[idx] not in [
-                    audio_token_id, video_token_id, image_token_id
-            ]:
+            start_idx = (
+                llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
+            )
+            if src_item[idx] not in [audio_token_id, video_token_id, image_token_id]:
                 if use_audio_in_video and idx > 0:
-                    if src_item[idx] == vision_end_token_id and \
-                        src_item[idx - 1] == audio_end_token_id:
+                    if (
+                        src_item[idx] == vision_end_token_id
+                        and src_item[idx - 1] == audio_end_token_id
+                    ):
                         # processing the <|audio_eos|> before <|vision_eos|>
                         start_idx -= 1
-                    elif src_item[idx] == audio_start_token_id and \
-                        src_item[idx - 1] == vision_start_token_id:
+                    elif (
+                        src_item[idx] == audio_start_token_id
+                        and src_item[idx - 1] == vision_start_token_id
+                    ):
                         # processing the <|audio_bos|> after <|vision_eos|>
                         start_idx -= 1
                 new_src_item.append(src_item[idx])
-                llm_pos_ids = torch.tensor([start_idx],
-                                           dtype=torch.long).expand(3, -1)
+                llm_pos_ids = torch.tensor([start_idx], dtype=torch.long).expand(3, -1)
                 llm_pos_ids_list.append(llm_pos_ids)
             elif src_item[idx] == audio_token_id:
                 assert audio_seqlens is not None
                 audio_seqlen = audio_seqlens[audio_idx]
-                place_num = (((audio_seqlen - 1) // 2 + 1 - 2) // 2 + 1)
+                place_num = ((audio_seqlen - 1) // 2 + 1 - 2) // 2 + 1
                 new_src_item.extend([audio_token_id] * place_num)
                 llm_pos_ids = torch.arange(place_num).expand(3, -1) + start_idx
                 llm_pos_ids_list.append(llm_pos_ids)
@@ -1123,26 +1234,30 @@ def _omni_get_input_positions_tensor(
                 grid_ws = image_grid_thw[:, 2]
                 t_index = (torch.arange(grid_t) * 1 * tokens_per_second).long()
                 llm_pos_ids = cls._get_llm_pos_ids_for_vision(
-                    start_idx, image_idx, spatial_merge_size, t_index, grid_hs,
-                    grid_ws)
+                    start_idx, image_idx, spatial_merge_size, t_index, grid_hs, grid_ws
+                )
                 llm_pos_ids_list.append(llm_pos_ids)
                 vision_seqlen = image_grid_thw[image_idx].prod() // (
-                    spatial_merge_size**2)
+                    spatial_merge_size**2
+                )
                 new_src_item.extend([image_token_id] * vision_seqlen)
                 image_idx += 1
             elif src_item[idx] == video_token_id and not use_audio_in_video:
                 grid_t = video_grid_thw[video_idx][0]
                 grid_hs = video_grid_thw[:, 1]
                 grid_ws = video_grid_thw[:, 2]
-                t_index = (torch.arange(grid_t) *
-                           second_per_grid_ts[video_idx] *
-                           tokens_per_second).long()
+                t_index = (
+                    torch.arange(grid_t)
+                    * second_per_grid_ts[video_idx]
+                    * tokens_per_second
+                ).long()
                 llm_pos_ids = cls._get_llm_pos_ids_for_vision(
-                    start_idx, video_idx, spatial_merge_size, t_index, grid_hs,
-                    grid_ws)
+                    start_idx, video_idx, spatial_merge_size, t_index, grid_hs, grid_ws
+                )
                 llm_pos_ids_list.append(llm_pos_ids)
                 vision_seqlen = video_grid_thw[video_idx].prod() // (
-                    spatial_merge_size**2)
+                    spatial_merge_size**2
+                )
                 new_src_item.extend([video_token_id] * vision_seqlen)
                 video_idx += 1
             else:
@@ -1150,56 +1265,73 @@ def _omni_get_input_positions_tensor(
                 assert audio_seqlens is not None
                 audio_seqlen = audio_seqlens[audio_idx]
                 vision_seqlen = video_grid_thw[video_idx].prod() // (
-                    spatial_merge_size**2)
+                    spatial_merge_size**2
+                )
                 grid_t = video_grid_thw[video_idx][0]
                 grid_h = video_grid_thw[video_idx][1]
                 grid_w = video_grid_thw[video_idx][2]
                 grid_hs = video_grid_thw[:, 1]
                 grid_ws = video_grid_thw[:, 2]
                 t_ntoken_per_chunk = int(tokens_per_second * seconds_per_chunk)
-                t_index = (torch.arange(grid_t) *
-                           second_per_grid_ts[video_idx] *
-                           tokens_per_second).long()
+                t_index = (
+                    torch.arange(grid_t)
+                    * second_per_grid_ts[video_idx]
+                    * tokens_per_second
+                ).long()
                 t_index_split_chunk = cls._split_list_into_ranges(
-                    t_index, t_ntoken_per_chunk)
+                    t_index, t_ntoken_per_chunk
+                )
                 place_num = (((audio_seqlen - 1) // 2 + 1 - 2) // 2 + 1) + 2
                 pure_audio_len = place_num - 2
                 added_audio_len = 0
                 audio_llm_pos_ids_list: list[torch.Tensor] = []
                 for t_chunk in t_index_split_chunk:
-                    vision_ntoken_per_chunk = len(
-                        t_chunk) * grid_h * grid_w // (spatial_merge_size**2)
-                    new_src_item.extend([video_token_id] *
-                                        vision_ntoken_per_chunk)
+                    vision_ntoken_per_chunk = (
+                        len(t_chunk) * grid_h * grid_w // (spatial_merge_size**2)
+                    )
+                    new_src_item.extend([video_token_id] * vision_ntoken_per_chunk)
                     vision_llm_pos_ids_list = cls._get_llm_pos_ids_for_vision(
-                        start_idx, video_idx, spatial_merge_size, t_chunk,
-                        grid_hs, grid_ws).split(1, dim=1)
+                        start_idx,
+                        video_idx,
+                        spatial_merge_size,
+                        t_chunk,
+                        grid_hs,
+                        grid_ws,
+                    ).split(1, dim=1)
                     llm_pos_ids_list.extend(vision_llm_pos_ids_list)
                     new_src_item.extend(
-                        min(t_ntoken_per_chunk, pure_audio_len -
-                            added_audio_len) * [audio_token_id])
-                    audio_start_idx = start_idx if len(
-                        audio_llm_pos_ids_list
-                    ) == 0 else audio_llm_pos_ids_list[-1][0].item() + 1
-                    if min(t_ntoken_per_chunk,
-                           pure_audio_len - added_audio_len) > 0:
-                        audio_llm_pos_ids_list = (torch.arange(
-                            min(t_ntoken_per_chunk, pure_audio_len -
-                                added_audio_len)).expand(3, -1) +
-                                                  audio_start_idx).split(1,
-                                                                         dim=1)
+                        min(t_ntoken_per_chunk, pure_audio_len - added_audio_len)
+                        * [audio_token_id]
+                    )
+                    audio_start_idx = (
+                        start_idx
+                        if len(audio_llm_pos_ids_list) == 0
+                        else audio_llm_pos_ids_list[-1][0].item() + 1
+                    )
+                    if min(t_ntoken_per_chunk, pure_audio_len - added_audio_len) > 0:
+                        audio_llm_pos_ids_list = (
+                            torch.arange(
+                                min(
+                                    t_ntoken_per_chunk, pure_audio_len - added_audio_len
+                                )
+                            ).expand(3, -1)
+                            + audio_start_idx
+                        ).split(1, dim=1)
                     else:
                         audio_llm_pos_ids_list = []
-                    added_audio_len += min(t_ntoken_per_chunk,
-                                           pure_audio_len - added_audio_len)
+                    added_audio_len += min(
+                        t_ntoken_per_chunk, pure_audio_len - added_audio_len
+                    )
                     llm_pos_ids_list.extend(audio_llm_pos_ids_list)
                 if added_audio_len < pure_audio_len:
                     new_src_item.extend(
-                        (pure_audio_len - added_audio_len) * [audio_token_id])
+                        (pure_audio_len - added_audio_len) * [audio_token_id]
+                    )
                     audio_llm_pos_ids_list = (
-                        torch.arange(pure_audio_len - added_audio_len).expand(
-                            3, -1) + llm_pos_ids_list[-1].max() + 1).split(
-                                1, dim=1)
+                        torch.arange(pure_audio_len - added_audio_len).expand(3, -1)
+                        + llm_pos_ids_list[-1].max()
+                        + 1
+                    ).split(1, dim=1)
                     llm_pos_ids_list.extend(audio_llm_pos_ids_list)
                 audio_idx += 1
                 video_idx += 1
@@ -1207,8 +1339,9 @@ def _omni_get_input_positions_tensor(
             idx += len(new_src_item) - new_src_item_len
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1)
-        mrope_position_delta = torch.cat(llm_pos_ids_list,
-                                         dim=1).max() + 1 - len(src_item)
+        mrope_position_delta = (
+            torch.cat(llm_pos_ids_list, dim=1).max() + 1 - len(src_item)
+        )
         llm_positions = llm_positions[:, context_len:seq_len]
 
         return llm_positions, mrope_position_delta
@@ -1225,22 +1358,34 @@ def _get_llm_pos_ids_for_vision(
         llm_pos_ids_list = []
         llm_grid_h = grid_hs[vision_idx] // spatial_merge_size
         llm_grid_w = grid_ws[vision_idx] // spatial_merge_size
-        h_index = (torch.arange(llm_grid_h).view(1, -1, 1).expand(
-            len(t_index), -1, llm_grid_w).flatten())
-        w_index = (torch.arange(llm_grid_w).view(1, 1, -1).expand(
-            len(t_index), llm_grid_h, -1).flatten())
-        t_index_tensor = torch.Tensor(t_index).to(llm_grid_h.device).view(
-            -1, 1).expand(-1, llm_grid_h * llm_grid_w).long().flatten()
+        h_index = (
+            torch.arange(llm_grid_h)
+            .view(1, -1, 1)
+            .expand(len(t_index), -1, llm_grid_w)
+            .flatten()
+        )
+        w_index = (
+            torch.arange(llm_grid_w)
+            .view(1, 1, -1)
+            .expand(len(t_index), llm_grid_h, -1)
+            .flatten()
+        )
+        t_index_tensor = (
+            torch.Tensor(t_index)
+            .to(llm_grid_h.device)
+            .view(-1, 1)
+            .expand(-1, llm_grid_h * llm_grid_w)
+            .long()
+            .flatten()
+        )
         _llm_pos_ids = torch.stack([t_index_tensor, h_index, w_index])
         llm_pos_ids_list.append(_llm_pos_ids + start_idx)
         llm_pos_ids = torch.cat(llm_pos_ids_list, dim=1)
         return llm_pos_ids
 
     @staticmethod
-    def _split_list_into_ranges(lst: torch.Tensor,
-                                interval: int) -> list[list[int]]:
-        ranges: list[list[int]] = [[]
-                                   for _ in range((max(lst) // interval) + 1)]
+    def _split_list_into_ranges(lst: torch.Tensor, interval: int) -> list[list[int]]:
+        ranges: list[list[int]] = [[] for _ in range((max(lst) // interval) + 1)]
         for num in lst:
             index = num // interval
             ranges[index].append(num)
@@ -1254,19 +1399,27 @@ def get_next_input_positions(
     ) -> list[list[int]]:
         return [
             list(
-                range(context_len + mrope_position_delta,
-                      seq_len + mrope_position_delta)) for _ in range(3)
+                range(
+                    context_len + mrope_position_delta, seq_len + mrope_position_delta
+                )
+            )
+            for _ in range(3)
         ]
 
     @staticmethod
-    def get_next_input_positions_tensor(out: np.ndarray, out_offset: int,
-                                        mrope_position_delta: int,
-                                        context_len: int, num_new_tokens: int):
-
-        values = np.arange(mrope_position_delta + context_len,
-                           mrope_position_delta + context_len + num_new_tokens,
-                           dtype=out.dtype)
-        out[:, out_offset:out_offset + num_new_tokens] = values
+    def get_next_input_positions_tensor(
+        out: np.ndarray,
+        out_offset: int,
+        mrope_position_delta: int,
+        context_len: int,
+        num_new_tokens: int,
+    ):
+        values = np.arange(
+            mrope_position_delta + context_len,
+            mrope_position_delta + context_len + num_new_tokens,
+            dtype=out.dtype,
+        )
+        out[:, out_offset : out_offset + num_new_tokens] = values
 
     @classmethod
     def omni_get_updates_use_audio_in_video(
@@ -1291,27 +1444,28 @@ def omni_get_updates_use_audio_in_video(
         audio_end_token_id = thinker_config.audio_end_token_id
         seconds_per_chunk = thinker_config.seconds_per_chunk
         spatial_merge_size = thinker_config.vision_config.spatial_merge_size
-        tokens_per_second = getattr(thinker_config.vision_config,
-                                    "tokens_per_second", 25)
+        tokens_per_second = getattr(
+            thinker_config.vision_config, "tokens_per_second", 25
+        )
 
         grid_t = video_grid_thw[0]
         grid_h = video_grid_thw[1]
         grid_w = video_grid_thw[2]
         t_ntoken_per_chunk = int(tokens_per_second * seconds_per_chunk)
-        t_index = (torch.arange(grid_t) * video_second_per_grid_t *
-                   tokens_per_second).long()
-        t_index_split_chunk = cls._split_list_into_ranges(
-            t_index, t_ntoken_per_chunk)
+        t_index = (
+            torch.arange(grid_t) * video_second_per_grid_t * tokens_per_second
+        ).long()
+        t_index_split_chunk = cls._split_list_into_ranges(t_index, t_ntoken_per_chunk)
 
         updates = [audio_start_token_id]
         added_audio_len = 0
         for t_chunk in t_index_split_chunk:
-            vision_ntoken_per_chunk = len(t_chunk) * grid_h * grid_w // (
-                spatial_merge_size**2)
+            vision_ntoken_per_chunk = (
+                len(t_chunk) * grid_h * grid_w // (spatial_merge_size**2)
+            )
             updates.extend([video_token_id] * vision_ntoken_per_chunk)
 
-            audio_chunk_size = min(t_ntoken_per_chunk,
-                                   audio_len - added_audio_len)
+            audio_chunk_size = min(t_ntoken_per_chunk, audio_len - added_audio_len)
             updates.extend(audio_chunk_size * [audio_token_id])
             added_audio_len += audio_chunk_size
         if added_audio_len < audio_len:
diff --git a/vllm/model_executor/layers/rotary_embedding/ntk_scaling_rope.py b/vllm/model_executor/layers/rotary_embedding/ntk_scaling_rope.py
index 42926bad22ef..560fb100413d 100644
--- a/vllm/model_executor/layers/rotary_embedding/ntk_scaling_rope.py
+++ b/vllm/model_executor/layers/rotary_embedding/ntk_scaling_rope.py
@@ -10,33 +10,39 @@
 
 class NTKScalingRotaryEmbedding(RotaryEmbedding):
     """RotaryEmbedding extended with fixed and mixed NTK scaling.
-    https://kexue.fm/archives/9706 """
-
-    def __init__(self,
-                 head_size: int,
-                 rotary_dim: int,
-                 max_position_embeddings: int,
-                 base: float,
-                 is_neox_style: bool,
-                 scaling_factor: float,
-                 dtype: torch.dtype,
-                 mixed_b: Optional[float] = None) -> None:
+    https://kexue.fm/archives/9706"""
+
+    def __init__(
+        self,
+        head_size: int,
+        rotary_dim: int,
+        max_position_embeddings: int,
+        base: float,
+        is_neox_style: bool,
+        scaling_factor: float,
+        dtype: torch.dtype,
+        mixed_b: Optional[float] = None,
+    ) -> None:
         self.scaling_factor = scaling_factor
         self.mixed_b = mixed_b
-        super().__init__(head_size, rotary_dim, max_position_embeddings, base,
-                         is_neox_style, dtype)
+        super().__init__(
+            head_size, rotary_dim, max_position_embeddings, base, is_neox_style, dtype
+        )
 
     def _compute_inv_freq(self, base: float) -> torch.Tensor:
         base = self.base * (self.scaling_factor if self.mixed_b is None else 1)
         inv_freq = super()._compute_inv_freq(base)
 
         if self.mixed_b is None:
-            inv_freq = inv_freq / self.scaling_factor**(2 / self.rotary_dim)
+            inv_freq = inv_freq / self.scaling_factor ** (2 / self.rotary_dim)
         else:
-            a = torch.tensor(self.scaling_factor).log() / (self.rotary_dim /
-                                                           2)**self.mixed_b
-            lambda_1_m = (a * torch.arange(
-                1, self.rotary_dim // 2 + 1).float()**self.mixed_b).exp()
+            a = (
+                torch.tensor(self.scaling_factor).log()
+                / (self.rotary_dim / 2) ** self.mixed_b
+            )
+            lambda_1_m = (
+                a * torch.arange(1, self.rotary_dim // 2 + 1).float() ** self.mixed_b
+            ).exp()
             inv_freq = inv_freq / lambda_1_m
 
         return inv_freq
diff --git a/vllm/model_executor/layers/rotary_embedding/phi3_long_rope_scaled_rope.py b/vllm/model_executor/layers/rotary_embedding/phi3_long_rope_scaled_rope.py
index 9c36d633e2a9..02ad142d676b 100644
--- a/vllm/model_executor/layers/rotary_embedding/phi3_long_rope_scaled_rope.py
+++ b/vllm/model_executor/layers/rotary_embedding/phi3_long_rope_scaled_rope.py
@@ -44,14 +44,13 @@ def __init__(
         self.short_factor = short_factor
         self.long_factor = long_factor
 
-        scale = self.max_position_embeddings / \
-                self.original_max_position_embeddings
+        scale = self.max_position_embeddings / self.original_max_position_embeddings
         if scale <= 1.0:
             scaling_factor = 1.0
         else:
             scaling_factor = math.sqrt(
-                1 + math.log(scale) /
-                math.log(self.original_max_position_embeddings))
+                1 + math.log(scale) / math.log(self.original_max_position_embeddings)
+            )
         if short_mscale is None:
             short_mscale = scaling_factor
         if long_mscale is None:
@@ -61,22 +60,32 @@ def __init__(
         self.long_mscale = long_mscale
 
         short_cache = self._compute_cos_sin_cache(
-            original_max_position_embeddings, short_factor, short_mscale)
+            original_max_position_embeddings, short_factor, short_mscale
+        )
         short_cache = short_cache.to(dtype)
 
-        long_cache = self._compute_cos_sin_cache(max_position_embeddings,
-                                                 long_factor, long_mscale)
+        long_cache = self._compute_cos_sin_cache(
+            max_position_embeddings, long_factor, long_mscale
+        )
         long_cache = long_cache.to(dtype)
 
         long_short_cache = torch.cat([short_cache, long_cache], dim=0)
-        self.register_buffer("long_short_cos_sin_cache",
-                             long_short_cache,
-                             persistent=False)
+        self.register_buffer(
+            "long_short_cos_sin_cache", long_short_cache, persistent=False
+        )
 
     def _compute_inv_freq(self, rescale_factors: list[float]) -> torch.Tensor:
         rescale_factors = torch.tensor(rescale_factors, dtype=torch.float32)
-        inv_freq = 1.0 / (rescale_factors * (self.base**(torch.arange(
-            0, self.rotary_dim, 2, dtype=torch.float) / self.rotary_dim)))
+        inv_freq = 1.0 / (
+            rescale_factors
+            * (
+                self.base
+                ** (
+                    torch.arange(0, self.rotary_dim, 2, dtype=torch.float)
+                    / self.rotary_dim
+                )
+            )
+        )
         return inv_freq
 
     def _compute_cos_sin_cache(
@@ -105,10 +114,14 @@ def forward(
         key = key.view(*key.shape[:-1], -1, self.head_size)
 
         k = self.original_max_position_embeddings
-        long_prompt_offset = (torch.any(positions > k).float() *
-                              torch.full_like(positions, k)).long()
-        idx = (torch.add(positions, long_prompt_offset)
-               if long_prompt_offset is not None else positions)
+        long_prompt_offset = (
+            torch.any(positions > k).float() * torch.full_like(positions, k)
+        ).long()
+        idx = (
+            torch.add(positions, long_prompt_offset)
+            if long_prompt_offset is not None
+            else positions
+        )
         idx = torch.add(idx, offsets) if offsets is not None else idx
         cos_sin = torch.index_select(self.long_short_cos_sin_cache, 0, idx)
 
@@ -116,13 +129,13 @@ def forward(
         cos = cos.repeat(1, 2).unsqueeze(-2)
         sin = sin.repeat(1, 2).unsqueeze(-2)
 
-        query_rot = query[..., :self.rotary_dim]
-        query_pass = query[..., self.rotary_dim:]
+        query_rot = query[..., : self.rotary_dim]
+        query_pass = query[..., self.rotary_dim :]
         query_rot = query_rot * cos + rotate_neox(query_rot) * sin
         query = torch.cat((query_rot, query_pass), dim=-1)
 
-        key_rot = key[..., :self.rotary_dim]
-        key_pass = key[..., self.rotary_dim:]
+        key_rot = key[..., : self.rotary_dim]
+        key_pass = key[..., self.rotary_dim :]
         key_rot = key_rot * cos + rotate_neox(key_rot) * sin
         key = torch.cat((key_rot, key_pass), dim=-1)
 
diff --git a/vllm/model_executor/layers/rotary_embedding/rocm_aiter_rope_ops.py b/vllm/model_executor/layers/rotary_embedding/rocm_aiter_rope_ops.py
index da7c84cb442d..223350d43267 100644
--- a/vllm/model_executor/layers/rotary_embedding/rocm_aiter_rope_ops.py
+++ b/vllm/model_executor/layers/rotary_embedding/rocm_aiter_rope_ops.py
@@ -9,8 +9,11 @@
 
 
 def is_rocm_triton_rotary_embedding_enabled() -> bool:
-    return (current_platform.is_rocm() and envs.VLLM_ROCM_USE_AITER
-            and envs.VLLM_ROCM_USE_TRITON_ROPE)
+    return (
+        current_platform.is_rocm()
+        and envs.VLLM_ROCM_USE_AITER
+        and envs.VLLM_ROCM_USE_TRITON_ROPE
+    )
 
 
 def rocm_aiter_rotary_emb_with_key_forward_triton_impl(
@@ -23,6 +26,7 @@ def rocm_aiter_rotary_emb_with_key_forward_triton_impl(
     is_nope_first: bool = False,
 ) -> None:
     import aiter.ops.triton.rope as ops
+
     ops.rope_cached_thd_positions_2c_fwd_inplace(
         query,
         key,
@@ -48,7 +52,6 @@ def rocm_aiter_rotary_emb_with_key_forward_triton_fake(
 
 
 if is_rocm_triton_rotary_embedding_enabled():
-
     direct_register_custom_op(
         op_name="rocm_aiter_rotary_emb_with_key_forward_triton",
         op_func=rocm_aiter_rotary_emb_with_key_forward_triton_impl,
@@ -58,10 +61,15 @@ def rocm_aiter_rotary_emb_with_key_forward_triton_fake(
     )
 
 
-def rocm_aiter_rotary_emb(positions: torch.Tensor, query: torch.Tensor,
-                          key: torch.Tensor, cos_sin_cache: torch.Tensor,
-                          head_size: int, rotary_dim: int,
-                          is_neox_style: bool):
+def rocm_aiter_rotary_emb(
+    positions: torch.Tensor,
+    query: torch.Tensor,
+    key: torch.Tensor,
+    cos_sin_cache: torch.Tensor,
+    head_size: int,
+    rotary_dim: int,
+    is_neox_style: bool,
+):
     num_tokens = positions.numel()
     cos, sin = cos_sin_cache.chunk(2, dim=-1)
     query_shape = query.shape
diff --git a/vllm/model_executor/layers/rotary_embedding/yarn_scaling_rope.py b/vllm/model_executor/layers/rotary_embedding/yarn_scaling_rope.py
index 851565c5667a..93c92e7801e1 100644
--- a/vllm/model_executor/layers/rotary_embedding/yarn_scaling_rope.py
+++ b/vllm/model_executor/layers/rotary_embedding/yarn_scaling_rope.py
@@ -4,8 +4,7 @@
 import torch
 
 from .base import RotaryEmbedding
-from .common import (yarn_find_correction_range, yarn_get_mscale,
-                     yarn_linear_ramp_mask)
+from .common import yarn_find_correction_range, yarn_get_mscale, yarn_linear_ramp_mask
 
 
 class YaRNScalingRotaryEmbedding(RotaryEmbedding):
@@ -36,33 +35,42 @@ def __init__(
         self.beta_slow = beta_slow
         # Get n-d magnitude scaling corrected for interpolation
         self.mscale = float(yarn_get_mscale(self.scaling_factor) * attn_factor)
-        super().__init__(head_size, rotary_dim, max_position_embeddings, base,
-                         is_neox_style, dtype)
+        super().__init__(
+            head_size, rotary_dim, max_position_embeddings, base, is_neox_style, dtype
+        )
 
     def _compute_inv_freq(self, scaling_factor: float) -> torch.Tensor:
-        pos_freqs = self.base**(
-            torch.arange(0, self.rotary_dim, 2, dtype=torch.float) /
-            self.rotary_dim)
+        pos_freqs = self.base ** (
+            torch.arange(0, self.rotary_dim, 2, dtype=torch.float) / self.rotary_dim
+        )
         inv_freq_extrapolation = 1.0 / pos_freqs
         inv_freq_interpolation = 1.0 / (scaling_factor * pos_freqs)
 
-        low, high = yarn_find_correction_range(self.beta_fast, self.beta_slow,
-                                               self.rotary_dim, self.base,
-                                               self.max_position_embeddings)
+        low, high = yarn_find_correction_range(
+            self.beta_fast,
+            self.beta_slow,
+            self.rotary_dim,
+            self.base,
+            self.max_position_embeddings,
+        )
         # Get n-d rotational scaling corrected for extrapolation
-        inv_freq_mask = (1 - yarn_linear_ramp_mask(
-            low, high, self.rotary_dim // 2,
-            dtype=torch.float)) * self.extrapolation_factor
-        inv_freq = inv_freq_interpolation * (
-            1 - inv_freq_mask) + inv_freq_extrapolation * inv_freq_mask
+        inv_freq_mask = (
+            1
+            - yarn_linear_ramp_mask(low, high, self.rotary_dim // 2, dtype=torch.float)
+        ) * self.extrapolation_factor
+        inv_freq = (
+            inv_freq_interpolation * (1 - inv_freq_mask)
+            + inv_freq_extrapolation * inv_freq_mask
+        )
         return inv_freq
 
     def _compute_cos_sin_cache(self) -> torch.Tensor:
         inv_freq = self._compute_inv_freq(self.scaling_factor)
-        t = torch.arange(self.max_position_embeddings * self.scaling_factor,
-                         dtype=torch.float32)
+        t = torch.arange(
+            self.max_position_embeddings * self.scaling_factor, dtype=torch.float32
+        )
         freqs = torch.einsum("i,j -> ij", t, inv_freq)
-        cos = (freqs.cos() * self.mscale)
-        sin = (freqs.sin() * self.mscale)
+        cos = freqs.cos() * self.mscale
+        sin = freqs.sin() * self.mscale
         cache = torch.cat((cos, sin), dim=-1)
         return cache
diff --git a/vllm/model_executor/layers/shared_fused_moe/__init__.py b/vllm/model_executor/layers/shared_fused_moe/__init__.py
index b87c69d3edd0..b047e9cad04a 100644
--- a/vllm/model_executor/layers/shared_fused_moe/__init__.py
+++ b/vllm/model_executor/layers/shared_fused_moe/__init__.py
@@ -1,6 +1,5 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-from vllm.model_executor.layers.shared_fused_moe.shared_fused_moe import (
-    SharedFusedMoE)
+from vllm.model_executor.layers.shared_fused_moe.shared_fused_moe import SharedFusedMoE
 
 __all__ = ["SharedFusedMoE"]
diff --git a/vllm/model_executor/layers/shared_fused_moe/shared_fused_moe.py b/vllm/model_executor/layers/shared_fused_moe/shared_fused_moe.py
index e1e3d188d985..a8b09a5c3cdb 100644
--- a/vllm/model_executor/layers/shared_fused_moe/shared_fused_moe.py
+++ b/vllm/model_executor/layers/shared_fused_moe/shared_fused_moe.py
@@ -40,8 +40,11 @@ def forward(
 
             # Reduce outputs if necessary, since the MLP should
             # have been created with reduce_results=False.
-            if (self.reduce_results and self.tp_size > 1
-                    and self.must_reduce_shared_expert_outputs()):
+            if (
+                self.reduce_results
+                and self.tp_size > 1
+                and self.must_reduce_shared_expert_outputs()
+            ):
                 shared_out = tensor_model_parallel_all_reduce(shared_out)
 
             fused_out = super().forward(
diff --git a/vllm/model_executor/layers/utils.py b/vllm/model_executor/layers/utils.py
index ac3a604a5a3b..e522cc450d6b 100644
--- a/vllm/model_executor/layers/utils.py
+++ b/vllm/model_executor/layers/utils.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Utility methods for model layers."""
+
 from typing import Callable, Optional
 
 import torch
@@ -24,8 +25,8 @@ def shuffle_weight(w: torch.Tensor) -> torch.Tensor:
     # This will be used together with triton swiglu kernel
     shape = w.shape
     N = shape[-1]
-    first = w[..., :N // 2]
-    second = w[..., N // 2:]
+    first = w[..., : N // 2]
+    second = w[..., N // 2 :]
 
     stacked = torch.stack((first, second), dim=-1)
     w_shuffled = stacked.reshape(shape)
@@ -39,9 +40,9 @@ def get_token_bin_counts_and_mask(
 ) -> tuple[torch.Tensor, torch.Tensor]:
     # Compute the bin counts for the tokens.
     # vocab_size + 1 for padding.
-    bin_counts = torch.zeros((num_seqs, vocab_size + 1),
-                             dtype=torch.long,
-                             device=tokens.device)
+    bin_counts = torch.zeros(
+        (num_seqs, vocab_size + 1), dtype=torch.long, device=tokens.device
+    )
     bin_counts.scatter_add_(1, tokens, torch.ones_like(tokens))
     bin_counts = bin_counts[:, :vocab_size]
     mask = bin_counts > 0
@@ -49,18 +50,21 @@ def get_token_bin_counts_and_mask(
     return bin_counts, mask
 
 
-def apply_penalties(logits: torch.Tensor, prompt_tokens_tensor: torch.Tensor,
-                    output_tokens_tensor: torch.Tensor,
-                    presence_penalties: torch.Tensor,
-                    frequency_penalties: torch.Tensor,
-                    repetition_penalties: torch.Tensor) -> torch.Tensor:
+def apply_penalties(
+    logits: torch.Tensor,
+    prompt_tokens_tensor: torch.Tensor,
+    output_tokens_tensor: torch.Tensor,
+    presence_penalties: torch.Tensor,
+    frequency_penalties: torch.Tensor,
+    repetition_penalties: torch.Tensor,
+) -> torch.Tensor:
     """
     Applies penalties in place to the logits tensor
     logits : The input logits tensor of shape [num_seqs, vocab_size]
-    prompt_tokens_tensor: A tensor containing the prompt tokens. The prompts 
-        are padded to the maximum prompt length within the batch using 
-        `vocab_size` as the padding value. The value `vocab_size` is used 
-        for padding because it does not correspond to any valid token ID 
+    prompt_tokens_tensor: A tensor containing the prompt tokens. The prompts
+        are padded to the maximum prompt length within the batch using
+        `vocab_size` as the padding value. The value `vocab_size` is used
+        for padding because it does not correspond to any valid token ID
         in the vocabulary.
     output_tokens_tensor: The output tokens tensor.
     presence_penalties: The presence penalties of shape (num_seqs, )
@@ -68,15 +72,17 @@ def apply_penalties(logits: torch.Tensor, prompt_tokens_tensor: torch.Tensor,
     repetition_penalties: The repetition penalties of shape (num_seqs, )
     """
     num_seqs, vocab_size = logits.shape
-    _, prompt_mask = get_token_bin_counts_and_mask(prompt_tokens_tensor,
-                                                   vocab_size, num_seqs)
+    _, prompt_mask = get_token_bin_counts_and_mask(
+        prompt_tokens_tensor, vocab_size, num_seqs
+    )
     output_bin_counts, output_mask = get_token_bin_counts_and_mask(
-        output_tokens_tensor, vocab_size, num_seqs)
+        output_tokens_tensor, vocab_size, num_seqs
+    )
 
     # Apply repetition penalties as a custom op
     from vllm._custom_ops import apply_repetition_penalties
-    apply_repetition_penalties(logits, prompt_mask, output_mask,
-                               repetition_penalties)
+
+    apply_repetition_penalties(logits, prompt_mask, output_mask, repetition_penalties)
 
     # We follow the definition in OpenAI API.
     # Refer to https://platform.openai.com/docs/api-reference/parameter-details
@@ -85,22 +91,27 @@ def apply_penalties(logits: torch.Tensor, prompt_tokens_tensor: torch.Tensor,
     return logits
 
 
-def default_unquantized_gemm(layer: torch.nn.Module,
-                             x: torch.Tensor,
-                             weight: torch.Tensor,
-                             bias: Optional[torch.Tensor] = None):
+def default_unquantized_gemm(
+    layer: torch.nn.Module,
+    x: torch.Tensor,
+    weight: torch.Tensor,
+    bias: Optional[torch.Tensor] = None,
+):
     return torch.nn.functional.linear(x, weight, bias)
 
 
 def rocm_unquantized_gemm_impl(
-        x: torch.Tensor,
-        weight: torch.Tensor,
-        bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    x: torch.Tensor, weight: torch.Tensor, bias: Optional[torch.Tensor] = None
+) -> torch.Tensor:
     from vllm.platforms.rocm import on_gfx9
+
     k = weight.shape[1]
-    use_skinny = (envs.VLLM_ROCM_USE_SKINNY_GEMM and on_gfx9() and \
-                    x.dtype in [torch.float16, torch.bfloat16] \
-                    and k % 8 == 0)
+    use_skinny = (
+        envs.VLLM_ROCM_USE_SKINNY_GEMM
+        and on_gfx9()
+        and x.dtype in [torch.float16, torch.bfloat16]
+        and k % 8 == 0
+    )
 
     if use_skinny is not True:
         return torch.nn.functional.linear(x, weight, bias)
@@ -120,16 +131,17 @@ def rocm_unquantized_gemm_impl(
 
 
 def rocm_unquantized_gemm_impl_fake(
-        x: torch.Tensor,
-        weight: torch.Tensor,
-        bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    x: torch.Tensor, weight: torch.Tensor, bias: Optional[torch.Tensor] = None
+) -> torch.Tensor:
     return x.new_empty((*x.shape[:-1], weight.shape[0]))
 
 
-def rocm_unquantized_gemm(layer: torch.nn.Module,
-                          x: torch.Tensor,
-                          weight: torch.Tensor,
-                          bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+def rocm_unquantized_gemm(
+    layer: torch.nn.Module,
+    x: torch.Tensor,
+    weight: torch.Tensor,
+    bias: Optional[torch.Tensor] = None,
+) -> torch.Tensor:
     return torch.ops.vllm.rocm_unquantized_gemm_impl(x, weight, bias)
 
 
@@ -141,9 +153,12 @@ def rocm_unquantized_gemm(layer: torch.nn.Module,
 
 
 def check_cpu_sgl_kernel(n: int, k: int, dtype: torch.dtype) -> bool:
-    return (torch._C._cpu._is_amx_tile_supported()
-            and (dtype in (torch.bfloat16, torch.int8)) and k % 32 == 0
-            and n % 16 == 0)
+    return (
+        torch._C._cpu._is_amx_tile_supported()
+        and (dtype in (torch.bfloat16, torch.int8))
+        and k % 32 == 0
+        and n % 16 == 0
+    )
 
 
 def dispatch_cpu_unquantized_gemm(
@@ -158,32 +173,32 @@ def dispatch_cpu_unquantized_gemm(
             bias_f32 = layer.bias.to(torch.float32)
         else:
             bias_f32 = None
-        layer.cpu_linear = (
-            lambda x, weight, bias: torch.ops._C.weight_packed_linear(
-                x, packed_weight, bias_f32
-                if bias is not None else None, True))
+        layer.cpu_linear = lambda x, weight, bias: torch.ops._C.weight_packed_linear(
+            x, packed_weight, bias_f32 if bias is not None else None, True
+        )
         if remove_weight:
-            layer.weight = torch.nn.Parameter(torch.empty(0),
-                                              requires_grad=False)
-    elif ops._supports_onednn and (current_platform.get_cpu_architecture()
-                                   == CpuArchEnum.X86
-                                   or ops.is_onednn_acl_supported()):
+            layer.weight = torch.nn.Parameter(torch.empty(0), requires_grad=False)
+    elif ops._supports_onednn and (
+        current_platform.get_cpu_architecture() == CpuArchEnum.X86
+        or ops.is_onednn_acl_supported()
+    ):
         origin_weight = layer.weight
         if remove_weight:
-            layer.weight = torch.nn.Parameter(torch.empty(0),
-                                              requires_grad=False)
+            layer.weight = torch.nn.Parameter(torch.empty(0), requires_grad=False)
         handler = ops.create_onednn_mm(origin_weight.t(), 32)
-        layer.cpu_linear = lambda x, weight, bias: ops.onednn_mm(
-            handler, x, bias)
+        layer.cpu_linear = lambda x, weight, bias: ops.onednn_mm(handler, x, bias)
     else:
         layer.cpu_linear = lambda x, weight, bias: torch.nn.functional.linear(
-            x, weight, bias)
+            x, weight, bias
+        )
 
 
-def cpu_unquantized_gemm(layer: torch.nn.Module,
-                         x: torch.Tensor,
-                         weight: torch.Tensor,
-                         bias: Optional[torch.Tensor] = None):
+def cpu_unquantized_gemm(
+    layer: torch.nn.Module,
+    x: torch.Tensor,
+    weight: torch.Tensor,
+    bias: Optional[torch.Tensor] = None,
+):
     return layer.cpu_linear(x, weight, bias)
 
 
diff --git a/vllm/model_executor/layers/vocab_parallel_embedding.py b/vllm/model_executor/layers/vocab_parallel_embedding.py
index aa64d4e09ae1..b7253c7f0e52 100644
--- a/vllm/model_executor/layers/vocab_parallel_embedding.py
+++ b/vllm/model_executor/layers/vocab_parallel_embedding.py
@@ -9,12 +9,18 @@
 import torch.nn.functional as F
 from torch.nn.parameter import Parameter, UninitializedParameter
 
-from vllm.distributed import (divide, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_reduce)
+from vllm.distributed import (
+    divide,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_reduce,
+)
 from vllm.model_executor.custom_op import CustomOp
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase, method_has_implemented_embedding)
+    QuantizationConfig,
+    QuantizeMethodBase,
+    method_has_implemented_embedding,
+)
 from vllm.model_executor.layers.utils import dispatch_unquantized_gemm
 from vllm.model_executor.parameter import BasevLLMParameter
 from vllm.model_executor.utils import set_weight_attrs
@@ -26,65 +32,73 @@
 class UnquantizedEmbeddingMethod(QuantizeMethodBase):
     """Unquantized method for embeddings."""
 
-    def create_weights(self, layer: torch.nn.Module,
-                       input_size_per_partition: int,
-                       output_partition_sizes: list[int], input_size: int,
-                       output_size: int, params_dtype: torch.dtype,
-                       **extra_weight_attrs):
+    def create_weights(
+        self,
+        layer: torch.nn.Module,
+        input_size_per_partition: int,
+        output_partition_sizes: list[int],
+        input_size: int,
+        output_size: int,
+        params_dtype: torch.dtype,
+        **extra_weight_attrs,
+    ):
         """Create weights for embedding layer."""
-        weight = Parameter(torch.empty(sum(output_partition_sizes),
-                                       input_size_per_partition,
-                                       dtype=params_dtype),
-                           requires_grad=False)
+        weight = Parameter(
+            torch.empty(
+                sum(output_partition_sizes),
+                input_size_per_partition,
+                dtype=params_dtype,
+            ),
+            requires_grad=False,
+        )
         set_weight_attrs(weight, {"input_dim": 1, "output_dim": 0})
         layer.register_parameter("weight", weight)
         set_weight_attrs(weight, extra_weight_attrs)
 
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         if current_platform.is_cpu():
-            from vllm.model_executor.layers.utils import (
-                dispatch_cpu_unquantized_gemm)
+            from vllm.model_executor.layers.utils import dispatch_cpu_unquantized_gemm
+
             dispatch_cpu_unquantized_gemm(layer, remove_weight=False)
 
-    def apply(self,
-              layer: torch.nn.Module,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self,
+        layer: torch.nn.Module,
+        x: torch.Tensor,
+        bias: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
         return dispatch_unquantized_gemm()(layer, x, layer.weight, bias)
 
-    def embedding(self, layer: torch.nn.Module,
-                  input_: torch.Tensor) -> torch.Tensor:
+    def embedding(self, layer: torch.nn.Module, input_: torch.Tensor) -> torch.Tensor:
         return F.embedding(input_, layer.weight)
 
 
-def pad_vocab_size(vocab_size: int,
-                   pad_to: int = DEFAULT_VOCAB_PADDING_SIZE) -> int:
+def pad_vocab_size(vocab_size: int, pad_to: int = DEFAULT_VOCAB_PADDING_SIZE) -> int:
     """Pad the vocab size to the given value."""
     return ((vocab_size + pad_to - 1) // pad_to) * pad_to
 
 
 def vocab_range_from_per_partition_vocab_size(
-        per_partition_vocab_size: int,
-        rank: int,
-        offset: int = 0) -> Sequence[int]:
+    per_partition_vocab_size: int, rank: int, offset: int = 0
+) -> Sequence[int]:
     index_f = rank * per_partition_vocab_size
     index_l = index_f + per_partition_vocab_size
     return index_f + offset, index_l + offset
 
 
-def vocab_range_from_global_vocab_size(global_vocab_size: int,
-                                       rank: int,
-                                       world_size: int,
-                                       offset: int = 0) -> Sequence[int]:
+def vocab_range_from_global_vocab_size(
+    global_vocab_size: int, rank: int, world_size: int, offset: int = 0
+) -> Sequence[int]:
     per_partition_vocab_size = divide(global_vocab_size, world_size)
-    return vocab_range_from_per_partition_vocab_size(per_partition_vocab_size,
-                                                     rank,
-                                                     offset=offset)
+    return vocab_range_from_per_partition_vocab_size(
+        per_partition_vocab_size, rank, offset=offset
+    )
 
 
 @dataclass
 class VocabParallelEmbeddingShardIndices:
     """Indices for a shard of a vocab parallel embedding."""
+
     padded_org_vocab_start_index: int
     padded_org_vocab_end_index: int
     padded_added_vocab_start_index: int
@@ -105,13 +119,11 @@ def num_added_elements(self) -> int:
 
     @property
     def num_org_elements_padded(self) -> int:
-        return (self.padded_org_vocab_end_index -
-                self.padded_org_vocab_start_index)
+        return self.padded_org_vocab_end_index - self.padded_org_vocab_start_index
 
     @property
     def num_added_elements_padded(self) -> int:
-        return (self.padded_added_vocab_end_index -
-                self.padded_added_vocab_start_index)
+        return self.padded_added_vocab_end_index - self.padded_added_vocab_start_index
 
     @property
     def num_org_vocab_padding(self) -> int:
@@ -127,17 +139,14 @@ def num_elements_padded(self) -> int:
 
     def __post_init__(self):
         # sanity checks
-        assert (self.padded_org_vocab_start_index
-                <= self.padded_org_vocab_end_index)
-        assert (self.padded_added_vocab_start_index
-                <= self.padded_added_vocab_end_index)
+        assert self.padded_org_vocab_start_index <= self.padded_org_vocab_end_index
+        assert self.padded_added_vocab_start_index <= self.padded_added_vocab_end_index
 
         assert self.org_vocab_start_index <= self.org_vocab_end_index
         assert self.added_vocab_start_index <= self.added_vocab_end_index
 
         assert self.org_vocab_start_index <= self.padded_org_vocab_start_index
-        assert (self.added_vocab_start_index
-                <= self.padded_added_vocab_start_index)
+        assert self.added_vocab_start_index <= self.padded_added_vocab_start_index
         assert self.org_vocab_end_index <= self.padded_org_vocab_end_index
         assert self.added_vocab_end_index <= self.padded_added_vocab_end_index
 
@@ -147,20 +156,27 @@ def __post_init__(self):
 
 @torch.compile(dynamic=True, backend=current_platform.simple_compile_backend)
 def get_masked_input_and_mask(
-        input_: torch.Tensor, org_vocab_start_index: int,
-        org_vocab_end_index: int, num_org_vocab_padding: int,
-        added_vocab_start_index: int,
-        added_vocab_end_index: int) -> tuple[torch.Tensor, torch.Tensor]:
+    input_: torch.Tensor,
+    org_vocab_start_index: int,
+    org_vocab_end_index: int,
+    num_org_vocab_padding: int,
+    added_vocab_start_index: int,
+    added_vocab_end_index: int,
+) -> tuple[torch.Tensor, torch.Tensor]:
     # torch.compile will fuse all of the pointwise ops below
     # into a single kernel, making it very fast
-    org_vocab_mask = (input_ >= org_vocab_start_index) & (
-        input_ < org_vocab_end_index)
+    org_vocab_mask = (input_ >= org_vocab_start_index) & (input_ < org_vocab_end_index)
     added_vocab_mask = (input_ >= added_vocab_start_index) & (
-        input_ < added_vocab_end_index)
-    added_offset = added_vocab_start_index - (
-        org_vocab_end_index - org_vocab_start_index) - num_org_vocab_padding
-    valid_offset = (org_vocab_start_index *
-                    org_vocab_mask) + (added_offset * added_vocab_mask)
+        input_ < added_vocab_end_index
+    )
+    added_offset = (
+        added_vocab_start_index
+        - (org_vocab_end_index - org_vocab_start_index)
+        - num_org_vocab_padding
+    )
+    valid_offset = (org_vocab_start_index * org_vocab_mask) + (
+        added_offset * added_vocab_mask
+    )
     vocab_mask = org_vocab_mask | added_vocab_mask
     input_ = vocab_mask * (input_ - valid_offset)
     return input_, ~vocab_mask
@@ -206,14 +222,16 @@ class VocabParallelEmbedding(CustomOp):
         prefix: full name of the layer in the state dict
     """  # noqa: E501
 
-    def __init__(self,
-                 num_embeddings: int,
-                 embedding_dim: int,
-                 params_dtype: Optional[torch.dtype] = None,
-                 org_num_embeddings: Optional[int] = None,
-                 padding_size: int = DEFAULT_VOCAB_PADDING_SIZE,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        num_embeddings: int,
+        embedding_dim: int,
+        params_dtype: Optional[torch.dtype] = None,
+        org_num_embeddings: Optional[int] = None,
+        padding_size: int = DEFAULT_VOCAB_PADDING_SIZE,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
 
         # Keep the input dimensions.
@@ -223,18 +241,22 @@ def __init__(self,
         self.padding_size = padding_size
         self.org_vocab_size = org_num_embeddings or num_embeddings
         num_added_embeddings = num_embeddings - self.org_vocab_size
-        self.org_vocab_size_padded = pad_vocab_size(self.org_vocab_size,
-                                                    self.padding_size)
+        self.org_vocab_size_padded = pad_vocab_size(
+            self.org_vocab_size, self.padding_size
+        )
         self.num_embeddings_padded = pad_vocab_size(
-            self.org_vocab_size_padded + num_added_embeddings,
-            self.padding_size)
+            self.org_vocab_size_padded + num_added_embeddings, self.padding_size
+        )
         assert self.org_vocab_size_padded <= self.num_embeddings_padded
 
-        self.shard_indices = self._get_indices(self.num_embeddings_padded,
-                                               self.org_vocab_size_padded,
-                                               self.num_embeddings,
-                                               self.org_vocab_size, tp_rank,
-                                               self.tp_size)
+        self.shard_indices = self._get_indices(
+            self.num_embeddings_padded,
+            self.org_vocab_size_padded,
+            self.num_embeddings,
+            self.org_vocab_size,
+            tp_rank,
+            self.tp_size,
+        )
         self.embedding_dim = embedding_dim
 
         quant_method = None
@@ -248,11 +270,13 @@ def __init__(self,
         # layer type like ParallelLMHead, this is not important.
         is_embedding_layer = type(self) is VocabParallelEmbedding
         quant_method_implements_embedding = method_has_implemented_embedding(
-            type(quant_method))
+            type(quant_method)
+        )
         if is_embedding_layer and not quant_method_implements_embedding:
             raise NotImplementedError(
                 f"The class {type(quant_method).__name__} must implement "
-                "the 'embedding' method, see UnquantizedEmbeddingMethod.")
+                "the 'embedding' method, see UnquantizedEmbeddingMethod."
+            )
 
         self.quant_method: QuantizeMethodBase = quant_method
 
@@ -260,58 +284,73 @@ def __init__(self,
             params_dtype = torch.get_default_dtype()
         # Divide the weight matrix along the vocabulary dimension.
         self.num_added_embeddings = self.num_embeddings - self.org_vocab_size
-        self.num_embeddings_per_partition = divide(self.num_embeddings_padded,
-                                                   self.tp_size)
-        assert (self.shard_indices.num_elements_padded ==
-                self.num_embeddings_per_partition)
+        self.num_embeddings_per_partition = divide(
+            self.num_embeddings_padded, self.tp_size
+        )
+        assert (
+            self.shard_indices.num_elements_padded == self.num_embeddings_per_partition
+        )
         self.num_org_embeddings_per_partition = (
-            self.shard_indices.org_vocab_end_index -
-            self.shard_indices.org_vocab_start_index)
+            self.shard_indices.org_vocab_end_index
+            - self.shard_indices.org_vocab_start_index
+        )
         self.num_added_embeddings_per_partition = (
-            self.shard_indices.added_vocab_end_index -
-            self.shard_indices.added_vocab_start_index)
-
-        self.quant_method.create_weights(self,
-                                         self.embedding_dim,
-                                         [self.num_embeddings_per_partition],
-                                         self.embedding_dim,
-                                         self.num_embeddings_padded,
-                                         params_dtype=params_dtype,
-                                         weight_loader=self.weight_loader)
+            self.shard_indices.added_vocab_end_index
+            - self.shard_indices.added_vocab_start_index
+        )
+
+        self.quant_method.create_weights(
+            self,
+            self.embedding_dim,
+            [self.num_embeddings_per_partition],
+            self.embedding_dim,
+            self.num_embeddings_padded,
+            params_dtype=params_dtype,
+            weight_loader=self.weight_loader,
+        )
 
     @classmethod
-    def _get_indices(cls, vocab_size_padded: int, org_vocab_size_padded: int,
-                     vocab_size: int, org_vocab_size: int, tp_rank: int,
-                     tp_size: int) -> VocabParallelEmbeddingShardIndices:
+    def _get_indices(
+        cls,
+        vocab_size_padded: int,
+        org_vocab_size_padded: int,
+        vocab_size: int,
+        org_vocab_size: int,
+        tp_rank: int,
+        tp_size: int,
+    ) -> VocabParallelEmbeddingShardIndices:
         """Get start and end indices for vocab parallel embedding, following the
         layout outlined in the class docstring, based on the given tp_rank and
         tp_size."""
         num_added_embeddings_padded = vocab_size_padded - org_vocab_size_padded
         padded_org_vocab_start_index, padded_org_vocab_end_index = (
-            vocab_range_from_global_vocab_size(org_vocab_size_padded, tp_rank,
-                                               tp_size))
+            vocab_range_from_global_vocab_size(org_vocab_size_padded, tp_rank, tp_size)
+        )
         padded_added_vocab_start_index, padded_added_vocab_end_index = (
-            vocab_range_from_global_vocab_size(num_added_embeddings_padded,
-                                               tp_rank,
-                                               tp_size,
-                                               offset=org_vocab_size))
+            vocab_range_from_global_vocab_size(
+                num_added_embeddings_padded, tp_rank, tp_size, offset=org_vocab_size
+            )
+        )
         # remove padding
-        org_vocab_start_index = min(padded_org_vocab_start_index,
-                                    org_vocab_size)
+        org_vocab_start_index = min(padded_org_vocab_start_index, org_vocab_size)
         org_vocab_end_index = min(padded_org_vocab_end_index, org_vocab_size)
-        added_vocab_start_index = min(padded_added_vocab_start_index,
-                                      vocab_size)
+        added_vocab_start_index = min(padded_added_vocab_start_index, vocab_size)
         added_vocab_end_index = min(padded_added_vocab_end_index, vocab_size)
         return VocabParallelEmbeddingShardIndices(
-            padded_org_vocab_start_index, padded_org_vocab_end_index,
-            padded_added_vocab_start_index, padded_added_vocab_end_index,
-            org_vocab_start_index, org_vocab_end_index,
-            added_vocab_start_index, added_vocab_end_index)
+            padded_org_vocab_start_index,
+            padded_org_vocab_end_index,
+            padded_added_vocab_start_index,
+            padded_added_vocab_end_index,
+            org_vocab_start_index,
+            org_vocab_end_index,
+            added_vocab_start_index,
+            added_vocab_end_index,
+        )
 
     def get_sharded_to_full_mapping(self) -> Optional[list[int]]:
         """Get a mapping that can be used to reindex the gathered
         logits for sampling.
-        
+
         During sampling, we gather logits from all ranks. The relationship
         of index->token_id will follow the same format as outlined in the class
         docstring. However, after the gather, we want to reindex the final
@@ -326,32 +365,49 @@ def get_sharded_to_full_mapping(self) -> Optional[list[int]]:
         added_embeddings: list[int] = []
         padding: list[int] = []
         for tp_rank in range(self.tp_size):
-            shard_indices = self._get_indices(self.num_embeddings_padded,
-                                              self.org_vocab_size_padded,
-                                              self.num_embeddings,
-                                              self.org_vocab_size, tp_rank,
-                                              self.tp_size)
+            shard_indices = self._get_indices(
+                self.num_embeddings_padded,
+                self.org_vocab_size_padded,
+                self.num_embeddings,
+                self.org_vocab_size,
+                tp_rank,
+                self.tp_size,
+            )
             range_start = self.num_embeddings_per_partition * tp_rank
             range_end = self.num_embeddings_per_partition * (tp_rank + 1)
             base_embeddings.extend(
-                range(range_start,
-                      range_start + shard_indices.num_org_elements))
+                range(range_start, range_start + shard_indices.num_org_elements)
+            )
             padding.extend(
-                range(range_start + shard_indices.num_org_elements,
-                      range_start + shard_indices.num_org_elements_padded))
+                range(
+                    range_start + shard_indices.num_org_elements,
+                    range_start + shard_indices.num_org_elements_padded,
+                )
+            )
             added_embeddings.extend(
                 range(
                     range_start + shard_indices.num_org_elements_padded,
-                    range_start + shard_indices.num_org_elements_padded +
-                    shard_indices.num_added_elements))
+                    range_start
+                    + shard_indices.num_org_elements_padded
+                    + shard_indices.num_added_elements,
+                )
+            )
             padding.extend(
                 range(
-                    range_start + shard_indices.num_org_elements_padded +
-                    shard_indices.num_added_elements,
-                    range_start + shard_indices.num_org_elements_padded +
-                    shard_indices.num_added_elements_padded))
-            assert (range_start + shard_indices.num_org_elements_padded +
-                    shard_indices.num_added_elements_padded == range_end)
+                    range_start
+                    + shard_indices.num_org_elements_padded
+                    + shard_indices.num_added_elements,
+                    range_start
+                    + shard_indices.num_org_elements_padded
+                    + shard_indices.num_added_elements_padded,
+                )
+            )
+            assert (
+                range_start
+                + shard_indices.num_org_elements_padded
+                + shard_indices.num_added_elements_padded
+                == range_end
+            )
         ret = base_embeddings + added_embeddings + padding
         assert len(ret) == self.num_embeddings_padded
         return ret
@@ -385,10 +441,14 @@ def weight_loader(self, param: Parameter, loaded_weight: torch.Tensor):
         # If param packed on the same dim we are sharding on, then
         # need to adjust offsets of loaded weight by pack_factor.
         if packed_dim is not None and packed_dim == output_dim:
-            packed_factor = param.packed_factor if isinstance(
-                param, BasevLLMParameter) else param.pack_factor
-            assert loaded_weight.shape[output_dim] == (self.org_vocab_size //
-                                                       param.packed_factor)
+            packed_factor = (
+                param.packed_factor
+                if isinstance(param, BasevLLMParameter)
+                else param.pack_factor
+            )
+            assert loaded_weight.shape[output_dim] == (
+                self.org_vocab_size // param.packed_factor
+            )
             start_idx = start_idx // packed_factor
             shard_size = shard_size // packed_factor
         else:
@@ -396,23 +456,24 @@ def weight_loader(self, param: Parameter, loaded_weight: torch.Tensor):
 
         # Copy the data. Select chunk corresponding to current shard.
         loaded_weight = loaded_weight.narrow(output_dim, start_idx, shard_size)
-        param[:loaded_weight.shape[0]].data.copy_(loaded_weight)
-        param[loaded_weight.shape[0]:].data.fill_(0)
+        param[: loaded_weight.shape[0]].data.copy_(loaded_weight)
+        param[loaded_weight.shape[0] :].data.fill_(0)
 
     def forward_native(self, input_):
         if self.tp_size > 1:
             # Build the mask.
             masked_input, input_mask = get_masked_input_and_mask(
-                input_, self.shard_indices.org_vocab_start_index,
+                input_,
+                self.shard_indices.org_vocab_start_index,
                 self.shard_indices.org_vocab_end_index,
                 self.shard_indices.num_org_vocab_padding,
                 self.shard_indices.added_vocab_start_index,
-                self.shard_indices.added_vocab_end_index)
+                self.shard_indices.added_vocab_end_index,
+            )
         else:
             masked_input = input_
         # Get the embeddings.
-        output_parallel = self.quant_method.embedding(self,
-                                                      masked_input.long())
+        output_parallel = self.quant_method.embedding(self, masked_input.long())
         # Mask the output embedding.
         if self.tp_size > 1:
             output_parallel.masked_fill_(input_mask.unsqueeze(-1), 0)
@@ -427,8 +488,8 @@ def extra_repr(self) -> str:
         s = f"num_embeddings={self.num_embeddings_per_partition}"
         s += f", embedding_dim={self.embedding_dim}"
         s += f", org_vocab_size={self.org_vocab_size}"
-        s += f', num_embeddings_padded={self.num_embeddings_padded}'
-        s += f', tp_size={self.tp_size}'
+        s += f", num_embeddings_padded={self.num_embeddings_padded}"
+        s += f", tp_size={self.tp_size}"
         return s
 
 
@@ -449,27 +510,38 @@ class ParallelLMHead(VocabParallelEmbedding):
         padding_size: padding size for the vocabulary.
     """
 
-    def __init__(self,
-                 num_embeddings: int,
-                 embedding_dim: int,
-                 bias: bool = False,
-                 params_dtype: Optional[torch.dtype] = None,
-                 org_num_embeddings: Optional[int] = None,
-                 padding_size: int = DEFAULT_VOCAB_PADDING_SIZE,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
-        super().__init__(num_embeddings, embedding_dim, params_dtype,
-                         org_num_embeddings, padding_size, quant_config,
-                         prefix)
+    def __init__(
+        self,
+        num_embeddings: int,
+        embedding_dim: int,
+        bias: bool = False,
+        params_dtype: Optional[torch.dtype] = None,
+        org_num_embeddings: Optional[int] = None,
+        padding_size: int = DEFAULT_VOCAB_PADDING_SIZE,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
+        super().__init__(
+            num_embeddings,
+            embedding_dim,
+            params_dtype,
+            org_num_embeddings,
+            padding_size,
+            quant_config,
+            prefix,
+        )
         self.quant_config = quant_config
         if bias:
             self.bias = Parameter(
-                torch.empty(self.num_embeddings_per_partition,
-                            dtype=params_dtype))
-            set_weight_attrs(self.bias, {
-                "output_dim": 0,
-                "weight_loader": self.weight_loader,
-            })
+                torch.empty(self.num_embeddings_per_partition, dtype=params_dtype)
+            )
+            set_weight_attrs(
+                self.bias,
+                {
+                    "output_dim": 0,
+                    "weight_loader": self.weight_loader,
+                },
+            )
         else:
             self.register_parameter("bias", None)
 
diff --git a/vllm/model_executor/model_loader/__init__.py b/vllm/model_executor/model_loader/__init__.py
index 138a2ff30b62..df0d059594a7 100644
--- a/vllm/model_executor/model_loader/__init__.py
+++ b/vllm/model_executor/model_loader/__init__.py
@@ -9,18 +9,20 @@
 from vllm.config.load import LoadConfig
 from vllm.logger import init_logger
 from vllm.model_executor.model_loader.base_loader import BaseModelLoader
-from vllm.model_executor.model_loader.bitsandbytes_loader import (
-    BitsAndBytesModelLoader)
+from vllm.model_executor.model_loader.bitsandbytes_loader import BitsAndBytesModelLoader
 from vllm.model_executor.model_loader.default_loader import DefaultModelLoader
 from vllm.model_executor.model_loader.dummy_loader import DummyModelLoader
 from vllm.model_executor.model_loader.gguf_loader import GGUFModelLoader
 from vllm.model_executor.model_loader.runai_streamer_loader import (
-    RunaiModelStreamerLoader)
-from vllm.model_executor.model_loader.sharded_state_loader import (
-    ShardedStateLoader)
+    RunaiModelStreamerLoader,
+)
+from vllm.model_executor.model_loader.sharded_state_loader import ShardedStateLoader
 from vllm.model_executor.model_loader.tensorizer_loader import TensorizerLoader
 from vllm.model_executor.model_loader.utils import (
-    get_architecture_class_name, get_model_architecture, get_model_cls)
+    get_architecture_class_name,
+    get_model_architecture,
+    get_model_cls,
+)
 
 logger = init_logger(__name__)
 
@@ -69,7 +71,10 @@ def register_model_loader(load_format: str):
 
     Examples:
         >>> from vllm.config.load import LoadConfig
-        >>> from vllm.model_executor.model_loader import get_model_loader, register_model_loader
+        >>> from vllm.model_executor.model_loader import (
+        ...     get_model_loader,
+        ...     register_model_loader,
+        ... )
         >>> from vllm.model_executor.model_loader.base_loader import BaseModelLoader
         >>>
         >>> @register_model_loader("my_loader")
@@ -89,14 +94,20 @@ def _wrapper(model_loader_cls):
         if load_format in _LOAD_FORMAT_TO_MODEL_LOADER:
             logger.warning(
                 "Load format `%s` is already registered, and will be "
-                "overwritten by the new loader class `%s`.", load_format,
-                model_loader_cls)
+                "overwritten by the new loader class `%s`.",
+                load_format,
+                model_loader_cls,
+            )
         if not issubclass(model_loader_cls, BaseModelLoader):
-            raise ValueError("The model loader must be a subclass of "
-                             "`BaseModelLoader`.")
+            raise ValueError(
+                "The model loader must be a subclass of `BaseModelLoader`."
+            )
         _LOAD_FORMAT_TO_MODEL_LOADER[load_format] = model_loader_cls
-        logger.info("Registered model loader `%s` with load format `%s`",
-                    model_loader_cls, load_format)
+        logger.info(
+            "Registered model loader `%s` with load format `%s`",
+            model_loader_cls,
+            load_format,
+        )
         return model_loader_cls
 
     return _wrapper
@@ -110,14 +121,13 @@ def get_model_loader(load_config: LoadConfig) -> BaseModelLoader:
     return _LOAD_FORMAT_TO_MODEL_LOADER[load_format](load_config)
 
 
-def get_model(*,
-              vllm_config: VllmConfig,
-              model_config: Optional[ModelConfig] = None) -> nn.Module:
+def get_model(
+    *, vllm_config: VllmConfig, model_config: Optional[ModelConfig] = None
+) -> nn.Module:
     loader = get_model_loader(vllm_config.load_config)
     if model_config is None:
         model_config = vllm_config.model_config
-    return loader.load_model(vllm_config=vllm_config,
-                             model_config=model_config)
+    return loader.load_model(vllm_config=vllm_config, model_config=model_config)
 
 
 __all__ = [
diff --git a/vllm/model_executor/model_loader/base_loader.py b/vllm/model_executor/model_loader/base_loader.py
index ab538a3c9562..6106a1ab8a85 100644
--- a/vllm/model_executor/model_loader/base_loader.py
+++ b/vllm/model_executor/model_loader/base_loader.py
@@ -9,7 +9,10 @@
 from vllm.config.load import LoadConfig
 from vllm.logger import init_logger
 from vllm.model_executor.model_loader.utils import (
-    initialize_model, process_weights_after_loading, set_default_torch_dtype)
+    initialize_model,
+    process_weights_after_loading,
+    set_default_torch_dtype,
+)
 
 logger = init_logger(__name__)
 
@@ -26,24 +29,26 @@ def download_model(self, model_config: ModelConfig) -> None:
         raise NotImplementedError
 
     @abstractmethod
-    def load_weights(self, model: nn.Module,
-                     model_config: ModelConfig) -> None:
-        """Load weights into a model. This standalone API allows 
+    def load_weights(self, model: nn.Module, model_config: ModelConfig) -> None:
+        """Load weights into a model. This standalone API allows
         inplace weights loading for an already-initialized model"""
         raise NotImplementedError
 
-    def load_model(self, vllm_config: VllmConfig,
-                   model_config: ModelConfig) -> nn.Module:
+    def load_model(
+        self, vllm_config: VllmConfig, model_config: ModelConfig
+    ) -> nn.Module:
         """Load a model with the given configurations."""
         device_config = vllm_config.device_config
         load_config = vllm_config.load_config
-        load_device = device_config.device if load_config.device is None else \
-                      load_config.device
+        load_device = (
+            device_config.device if load_config.device is None else load_config.device
+        )
         target_device = torch.device(load_device)
         with set_default_torch_dtype(model_config.dtype):
             with target_device:
-                model = initialize_model(vllm_config=vllm_config,
-                                         model_config=model_config)
+                model = initialize_model(
+                    vllm_config=vllm_config, model_config=model_config
+                )
 
             logger.debug("Loading weights on %s ...", load_device)
             # Quantization does not happen in `load_weights` but after it
diff --git a/vllm/model_executor/model_loader/bitsandbytes_loader.py b/vllm/model_executor/model_loader/bitsandbytes_loader.py
index 4edf193b54ac..13250bd39492 100644
--- a/vllm/model_executor/model_loader/bitsandbytes_loader.py
+++ b/vllm/model_executor/model_loader/bitsandbytes_loader.py
@@ -18,27 +18,37 @@
 
 from vllm.config import ModelConfig
 from vllm.config.load import LoadConfig
-from vllm.distributed import (get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size)
+from vllm.distributed import (
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
+
 # yapf: enable
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe import FusedMoE
-from vllm.model_executor.layers.linear import (LinearBase,
-                                               MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    LinearBase,
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.model_loader.base_loader import BaseModelLoader
-from vllm.model_executor.model_loader.utils import (ParamMapping,
-                                                    set_default_torch_dtype)
+from vllm.model_executor.model_loader.utils import ParamMapping, set_default_torch_dtype
 from vllm.model_executor.model_loader.weight_utils import (
-    download_safetensors_index_file_from_hf, download_weights_from_hf,
-    filter_duplicate_safetensors_files, filter_files_not_needed_for_inference,
-    pt_weights_iterator, safetensors_weights_iterator)
+    download_safetensors_index_file_from_hf,
+    download_weights_from_hf,
+    filter_duplicate_safetensors_files,
+    filter_files_not_needed_for_inference,
+    pt_weights_iterator,
+    safetensors_weights_iterator,
+)
 from vllm.model_executor.models import is_pooling_model
-from vllm.model_executor.utils import (get_moe_expert_mapping,
-                                       get_packed_modules_mapping,
-                                       set_weight_attrs)
+from vllm.model_executor.utils import (
+    get_moe_expert_mapping,
+    get_packed_modules_mapping,
+    set_weight_attrs,
+)
 from vllm.platforms import current_platform
 
 # yapf conflicts with isort for this block
@@ -48,8 +58,7 @@
 
 def is_moe_model(model: torch.nn.Module) -> bool:
     """Checks if the model contains FusedMoE layers."""
-    return bool(any(
-        isinstance(module, FusedMoE) for module in model.modules()))
+    return bool(any(isinstance(module, FusedMoE) for module in model.modules()))
 
 
 class BitsAndBytesModelLoader(BaseModelLoader):
@@ -92,8 +101,7 @@ def _get_weight_files(
 
         if is_local:
             for pattern in allowed_patterns:
-                weight_files = glob.glob(
-                    os.path.join(model_name_or_path, pattern))
+                weight_files = glob.glob(os.path.join(model_name_or_path, pattern))
                 if weight_files:
                     return model_name_or_path, weight_files, pattern
         else:
@@ -109,20 +117,24 @@ def _get_weight_files(
                         revision,
                         ignore_patterns=self.load_config.ignore_patterns,
                     )
-                    return hf_folder, glob.glob(
-                        os.path.join(hf_folder, pattern)), pattern
+                    return (
+                        hf_folder,
+                        glob.glob(os.path.join(hf_folder, pattern)),
+                        pattern,
+                    )
 
-        raise RuntimeError(
-            f"No model weights found in: `{model_name_or_path}`")
+        raise RuntimeError(f"No model weights found in: `{model_name_or_path}`")
 
-    def _prepare_weights(self, model_name_or_path: str,
-                         revision: Optional[str]) -> tuple[list[str], bool]:
+    def _prepare_weights(
+        self, model_name_or_path: str, revision: Optional[str]
+    ) -> tuple[list[str], bool]:
         """Prepare weight files for the model."""
 
         allowed_patterns = ["*.safetensors", "*.bin", "*.pt"]
 
         hf_folder, hf_weights_files, matched_pattern = self._get_weight_files(
-            model_name_or_path, allowed_patterns, revision)
+            model_name_or_path, allowed_patterns, revision
+        )
 
         use_safetensors = matched_pattern == "*.safetensors"
         is_local = os.path.isdir(model_name_or_path)
@@ -141,25 +153,27 @@ def _prepare_weights(self, model_name_or_path: str,
                     revision,
                 )
             hf_weights_files = filter_duplicate_safetensors_files(
-                hf_weights_files, hf_folder, index_file)
+                hf_weights_files, hf_folder, index_file
+            )
         else:
-            hf_weights_files = filter_files_not_needed_for_inference(
-                hf_weights_files)
+            hf_weights_files = filter_files_not_needed_for_inference(hf_weights_files)
 
         if len(hf_weights_files) == 0:
             raise RuntimeError(
-                f"Cannot find any model weights with `{model_name_or_path}`")
+                f"Cannot find any model weights with `{model_name_or_path}`"
+            )
 
         return hf_weights_files, use_safetensors
 
     def _hf_weight_iter(self, hf_weights_files, use_safetensors: bool):
-
         def _maybe_pool_model(module_name: str):
             # For pool model, we need to add the prefix `model.`
             # for the weight name if possible.
-            if self.is_pool_model and self.target_modules[0]. \
-                startswith("model.") and not module_name.startswith(
-                    "model."):
+            if (
+                self.is_pool_model
+                and self.target_modules[0].startswith("model.")
+                and not module_name.startswith("model.")
+            ):
                 return "model." + module_name
 
             return module_name
@@ -187,8 +201,7 @@ def _get_quantized_weights_iterator(
         self,
         model_name_or_path: str,
         revision: Optional[str],
-    ) -> tuple[Generator[tuple[str, torch.Tensor], None, None], dict[str,
-                                                                     Any]]:
+    ) -> tuple[Generator[tuple[str, torch.Tensor], None, None], dict[str, Any]]:
         """Get an iterator to the model weights with bitsandbytes quantization,
         as well as the quantization state dictionary."""
 
@@ -196,37 +209,41 @@ def _get_quantized_weights_iterator(
         try:
             import bitsandbytes
 
-            if version.parse(
-                    bitsandbytes.__version__) < version.parse("0.46.1"):
-                raise ImportError("bitsandbytes version is wrong. Please "
-                                  "install bitsandbytes>=0.46.1.")
+            if version.parse(bitsandbytes.__version__) < version.parse("0.46.1"):
+                raise ImportError(
+                    "bitsandbytes version is wrong. Please "
+                    "install bitsandbytes>=0.46.1."
+                )
         except ImportError as err:
-            raise ImportError("Please install bitsandbytes>=0.46.1 via "
-                              "`pip install bitsandbytes>=0.46.1` to use "
-                              "bitsandbytes quantizer.") from err
+            raise ImportError(
+                "Please install bitsandbytes>=0.46.1 via "
+                "`pip install bitsandbytes>=0.46.1` to use "
+                "bitsandbytes quantizer."
+            ) from err
 
         hf_weights_files, use_safetensors = self._prepare_weights(
-            model_name_or_path, revision)
+            model_name_or_path, revision
+        )
 
         quant_state_dict: dict[str, Any] = {}
 
         if self.pre_quant:
             if self.load_8bit:
                 return self._quantized_8bit_generator(
-                    hf_weights_files, use_safetensors,
-                    quant_state_dict), quant_state_dict
+                    hf_weights_files, use_safetensors, quant_state_dict
+                ), quant_state_dict
             else:
                 return self._quantized_4bit_generator(
-                    hf_weights_files, use_safetensors,
-                    quant_state_dict), quant_state_dict
+                    hf_weights_files, use_safetensors, quant_state_dict
+                ), quant_state_dict
 
-        return self._unquantized_generator(hf_weights_files, use_safetensors,
-                                           quant_state_dict), quant_state_dict
+        return self._unquantized_generator(
+            hf_weights_files, use_safetensors, quant_state_dict
+        ), quant_state_dict
 
     def _is_8bit_weight_name(self, weight_name: str):
         quantized_suffix = {".scb", ".weight_format"}
-        return any(weight_name.lower().endswith(suffix)
-                   for suffix in quantized_suffix)
+        return any(weight_name.lower().endswith(suffix) for suffix in quantized_suffix)
 
     def _is_4bit_weight_name(self, weight_name: str):
         quantized_suffix = {
@@ -239,12 +256,13 @@ def _is_4bit_weight_name(self, weight_name: str):
         suffix = weight_name.split(".")[-1]
         return any(q_suffix in suffix for q_suffix in quantized_suffix)
 
-    def _quantized_8bit_generator(self, hf_weights_files, use_safetensors,
-                                  quant_state_dict) -> Generator:
+    def _quantized_8bit_generator(
+        self, hf_weights_files, use_safetensors, quant_state_dict
+    ) -> Generator:
         for (
-                org_weight_name,
-                mapped_weight_name,
-                weight_tensor,
+            org_weight_name,
+            mapped_weight_name,
+            weight_tensor,
         ) in self._hf_weight_iter(hf_weights_files, use_safetensors):
             if not mapped_weight_name.lower().endswith(".scb"):
                 continue
@@ -253,9 +271,9 @@ def _quantized_8bit_generator(self, hf_weights_files, use_safetensors,
             quant_state_dict[weight_key] = weight_tensor
 
         for (
-                org_weight_name,
-                mapped_weight_name,
-                weight_tensor,
+            org_weight_name,
+            mapped_weight_name,
+            weight_tensor,
         ) in self._hf_weight_iter(hf_weights_files, use_safetensors):
             if self._is_8bit_weight_name(mapped_weight_name):
                 continue
@@ -266,18 +284,18 @@ def _quantized_8bit_generator(self, hf_weights_files, use_safetensors,
             else:
                 yield org_weight_name, weight_tensor
 
-    def _quantized_4bit_generator(self, hf_weights_files, use_safetensors,
-                                  quant_state_dict) -> Generator:
+    def _quantized_4bit_generator(
+        self, hf_weights_files, use_safetensors, quant_state_dict
+    ) -> Generator:
         from bitsandbytes.functional import QuantState
 
         # First iterate over all quant state weights
-        weight_iterator = self._hf_weight_iter(hf_weights_files,
-                                               use_safetensors)
+        weight_iterator = self._hf_weight_iter(hf_weights_files, use_safetensors)
         temp_state_dict = {}
         for (
-                org_weight_name,
-                mapped_weight_name,
-                weight_tensor,
+            org_weight_name,
+            mapped_weight_name,
+            weight_tensor,
         ) in weight_iterator:
             if not self._is_4bit_weight_name(mapped_weight_name):
                 continue
@@ -289,98 +307,111 @@ def _quantized_4bit_generator(self, hf_weights_files, use_safetensors,
                 temp_state_dict[mapped_weight_name] = weight_tensor
 
         # Closure to parse quant_state for each prequant weight
-        def _parse_quant_state(param_name: str,
-                               temp_state_dict: dict) -> QuantState:
+        def _parse_quant_state(param_name: str, temp_state_dict: dict) -> QuantState:
             quant_state = {}
             for k in temp_state_dict:
                 if param_name + "." in k:
                     quant_state[k] = temp_state_dict[k]
 
-            return QuantState.from_dict(quant_state,
-                                        device=current_platform.device_type)
+            return QuantState.from_dict(
+                quant_state, device=current_platform.device_type
+            )
 
         # Second iterate over all prequant and normal weights
         # pre quantized weights would have a quant_state
         for (
-                org_weight_name,
-                mapped_weight_name,
-                weight_tensor,
+            org_weight_name,
+            mapped_weight_name,
+            weight_tensor,
         ) in self._hf_weight_iter(hf_weights_files, use_safetensors):
             if self._is_4bit_weight_name(mapped_weight_name):
                 continue
 
-            if (f"{mapped_weight_name}.quant_state.bitsandbytes__nf4"
-                    in temp_state_dict) or (
-                        f"{mapped_weight_name}.quant_state.bitsandbytes__fp4"
-                        in temp_state_dict):
-                quant_state = _parse_quant_state(mapped_weight_name,
-                                                 temp_state_dict)
+            if (
+                f"{mapped_weight_name}.quant_state.bitsandbytes__nf4" in temp_state_dict
+            ) or (
+                f"{mapped_weight_name}.quant_state.bitsandbytes__fp4" in temp_state_dict
+            ):
+                quant_state = _parse_quant_state(mapped_weight_name, temp_state_dict)
                 quant_state_dict[mapped_weight_name] = quant_state
                 yield org_weight_name, weight_tensor
             else:
                 yield org_weight_name, weight_tensor
 
-    def _unquantized_generator(self, hf_weights_files, use_safetensors,
-                               quant_state_dict) -> Generator:
+    def _unquantized_generator(
+        self, hf_weights_files, use_safetensors, quant_state_dict
+    ) -> Generator:
         from bitsandbytes.functional import quantize_4bit
 
         global_tp_size = get_tensor_model_parallel_world_size()
         global_tp_rank = get_tensor_model_parallel_rank()
-        check_match = (lambda weight_name, module_name: weight_name.
-                       removesuffix(".weight") == module_name)
+        check_match = (
+            lambda weight_name, module_name: weight_name.removesuffix(".weight")
+            == module_name
+        )
         for (
-                org_weight_name,
-                mapped_weight_name,
-                weight_tensor,
+            org_weight_name,
+            mapped_weight_name,
+            weight_tensor,
         ) in self._hf_weight_iter(hf_weights_files, use_safetensors):
-
             # override tp_size and tp_rank if the module has disabled TP
-            if any(tp_disabled_module in mapped_weight_name
-                   for tp_disabled_module in self.tp_disabled_modules):
+            if any(
+                tp_disabled_module in mapped_weight_name
+                for tp_disabled_module in self.tp_disabled_modules
+            ):
                 tp_size = 1
                 tp_rank = 0
             else:
                 tp_size = global_tp_size
                 tp_rank = global_tp_rank
 
-            if any(target_module in mapped_weight_name
-                   for target_module in self.target_modules
-                   ) and mapped_weight_name.endswith(".weight"):
+            if any(
+                target_module in mapped_weight_name
+                for target_module in self.target_modules
+            ) and mapped_weight_name.endswith(".weight"):
                 # Without sharding
                 if any(
-                        check_match(mapped_weight_name, module)
-                        for module in self.unsharded_weights_modules):
+                    check_match(mapped_weight_name, module)
+                    for module in self.unsharded_weights_modules
+                ):
                     weight_sub_tensor = weight_tensor
                 # Shard by column
                 elif any(
-                        check_match(mapped_weight_name, module)
-                        for module in self.column_sharded_weights_modules):
+                    check_match(mapped_weight_name, module)
+                    for module in self.column_sharded_weights_modules
+                ):
                     total_size = weight_tensor.size(-1)
                     start_index = total_size // tp_size * tp_rank
                     end_index = total_size // tp_size * (tp_rank + 1)
-                    weight_sub_tensor = weight_tensor[...,
-                                                      start_index:end_index]
+                    weight_sub_tensor = weight_tensor[..., start_index:end_index]
                 # Weights have fused on disk. In this case, we assume that the
                 # weight and module use same name.
                 elif any(
-                        check_match(mapped_weight_name, module)
-                        for module in self.maybe_fused_weights_modules):
+                    check_match(mapped_weight_name, module)
+                    for module in self.maybe_fused_weights_modules
+                ):
                     # special case for fused weights
                     # get the size of each shard weight tensor
                     total_shard_sizes = next(
-                        (sizes for module, sizes in
-                         self.maybe_fused_weights_modules.items()
-                         if check_match(mapped_weight_name, module)))
+                        (
+                            sizes
+                            for module, sizes in self.maybe_fused_weights_modules.items()
+                            if check_match(mapped_weight_name, module)
+                        )
+                    )
                     total_size = weight_tensor.size(0)
                     assert total_size == sum(total_shard_sizes)
                     # get the start/end index of each shard weight tensor
                     total_start_index = list(
-                        itertools.accumulate([0] + total_shard_sizes))[:-1]
-                    shard_weights_index = [(
-                        idx + size // tp_size * tp_rank,
-                        idx + size // tp_size * (tp_rank + 1),
-                    ) for idx, size in zip(total_start_index,
-                                           total_shard_sizes)]
+                        itertools.accumulate([0] + total_shard_sizes)
+                    )[:-1]
+                    shard_weights_index = [
+                        (
+                            idx + size // tp_size * tp_rank,
+                            idx + size // tp_size * (tp_rank + 1),
+                        )
+                        for idx, size in zip(total_start_index, total_shard_sizes)
+                    ]
                     # slice and reorder the weight tensor
                     weight_tensor = [
                         weight_tensor[start_index:end_index, ...]
@@ -392,15 +423,15 @@ def _unquantized_generator(self, hf_weights_files, use_safetensors,
                     total_size = weight_tensor.size(0)
                     start_index = total_size // tp_size * tp_rank
                     end_index = total_size // tp_size * (tp_rank + 1)
-                    weight_sub_tensor = weight_tensor[start_index:end_index,
-                                                      ...]
+                    weight_sub_tensor = weight_tensor[start_index:end_index, ...]
 
                 # bitsandbytes requires data in GPU
                 if weight_sub_tensor.is_cuda:
                     loaded_weight = weight_sub_tensor
                 else:
                     loaded_weight = weight_sub_tensor.to(
-                        device=current_platform.device_type)
+                        device=current_platform.device_type
+                    )
 
                 # remove the following after the issue is fixed:
                 # https://github.com/bitsandbytes-foundation/bitsandbytes/issues/1342
@@ -421,12 +452,13 @@ def _unquantized_generator(self, hf_weights_files, use_safetensors,
 
     def _get_bnb_target_modules(self, model: nn.Module) -> None:
         """
-        Identify and collect all modules that support BitsAndBytes 
+        Identify and collect all modules that support BitsAndBytes
         quantization.
         """
         for name, module in model.named_modules():
-            if (isinstance(module, LinearBase)
-                    and hasattr(module.quant_method, "quant_config")):
+            if isinstance(module, LinearBase) and hasattr(
+                module.quant_method, "quant_config"
+            ):
                 if modules_info := self.modules_mapping.get_sub_modules(name):
                     # Map vllm's names to transformers's names.
                     rep_name, sub_modules = modules_info
@@ -442,45 +474,48 @@ def _get_bnb_target_modules(self, model: nn.Module) -> None:
                 if module.disable_tp:
                     self.tp_disabled_modules.append(name)
             elif isinstance(module, FusedMoE) and hasattr(
-                    module.quant_method, "quant_config"):
+                module.quant_method, "quant_config"
+            ):
                 # TODO: support FusedMoE with prequant and 8bit.
                 if self.pre_quant and self.load_8bit:
                     raise ValueError(
                         "Prequant BitsAndBytes 8bit models with FusedMoE "
-                        "is not supported yet.")
+                        "is not supported yet."
+                    )
                 # Get the corresponding weight name using module name and
                 # expert_params_mapping.
 
                 for exp in self.expert_params_mapping:
                     weight_name = exp[1]
-                    rep_name = name.replace("experts",
-                                            "") + weight_name.removesuffix(".")
+                    rep_name = name.replace("experts", "") + weight_name.removesuffix(
+                        "."
+                    )
                     self.target_modules.append(rep_name)
 
-        assert (self.target_modules
-                ), "vLLM currently does not support BNB quantization for"
+        assert self.target_modules, (
+            "vLLM currently does not support BNB quantization for"
+        )
         f" {type(model).__name__}"
 
     def _classify_module_sharding(self, model: nn.Module):
         """
-        Categorize modules based on their weight sharding requirements 
+        Categorize modules based on their weight sharding requirements
         for tensor parallelism.
         """
         for name, module in model.named_modules():
             # Some modules like `ReplicatedLinear` should not have their weights
             # sharded. The reason for implementing it this way is to avoid new
             # static variable in the model implementation.
-            if isinstance(module, (ReplicatedLinear, )):
+            if isinstance(module, (ReplicatedLinear,)):
                 self.unsharded_weights_modules.append(name)
             # `QKVParallelLinear` and `MergedColumnParallelLinear` might have
             # fused weights on disk. We need to use the output sizes of these
             # modules to shard the weights correctly.
-            elif isinstance(module,
-                            (QKVParallelLinear, MergedColumnParallelLinear)):
+            elif isinstance(module, (QKVParallelLinear, MergedColumnParallelLinear)):
                 self.maybe_fused_weights_modules[name] = module.output_sizes
             # In TP, these weights are partitioned along the column
             # dimension (dim=-1)
-            elif isinstance(module, (RowParallelLinear, )):
+            elif isinstance(module, (RowParallelLinear,)):
                 self.column_sharded_weights_modules.append(name)
             elif isinstance(module, FusedMoE):
                 expert_mapping = self.expert_params_mapping
@@ -488,48 +523,53 @@ def _classify_module_sharding(self, model: nn.Module):
                     if exp[-1] == "w2":
                         weight_name = exp[1]
                         rep_name = name.replace(
-                            "experts", "") + weight_name.removesuffix(".")
+                            "experts", ""
+                        ) + weight_name.removesuffix(".")
                         self.column_sharded_weights_modules.append(rep_name)
 
-    def _verify_model_compatibility(self, model: nn.Module,
-                                    model_config: ModelConfig) -> None:
+    def _verify_model_compatibility(
+        self, model: nn.Module, model_config: ModelConfig
+    ) -> None:
         """
         Verify that the model is compatible with BitsAndBytes quantization.
         """
         if not hasattr(model, "load_weights"):
             raise AttributeError(
                 "The required method 'load_weights' is not defined in class"
-                f" {type(model).__name__}.")
+                f" {type(model).__name__}."
+            )
 
         if not hasattr(model, "packed_modules_mapping"):
             raise AttributeError(
                 f"Model {type(model).__name__} does not support BitsAndBytes "
-                "quantization yet. No 'packed_modules_mapping' found.")
+                "quantization yet. No 'packed_modules_mapping' found."
+            )
 
-        quant_config = getattr(model_config.hf_config, "quantization_config",
-                               None)
+        quant_config = getattr(model_config.hf_config, "quantization_config", None)
         if quant_config is not None:
             quant_method = quant_config.get("quant_method")
             if quant_method == "bitsandbytes":
                 self.pre_quant = True
             else:
                 raise ValueError(
-                    f"BitsAndBytes loader does not support {quant_method} "
-                    "quantization")
+                    f"BitsAndBytes loader does not support {quant_method} quantization"
+                )
 
         # The quant_states in pre_quantized models cannot work with a split
         # weight tensor. So TP does not work with pre_quantized bnb models.
         if self.pre_quant and get_tensor_model_parallel_world_size() > 1:
             raise ValueError(
                 "Prequant BitsAndBytes models with tensor parallelism is not "
-                "supported. Please try with pipeline parallelism.")
+                "supported. Please try with pipeline parallelism."
+            )
         if self.pre_quant:
             self.load_8bit = quant_config.get("load_in_8bit", False)
 
-    def _initialize_loader_state(self, model: nn.Module,
-                                 model_config: ModelConfig) -> None:
+    def _initialize_loader_state(
+        self, model: nn.Module, model_config: ModelConfig
+    ) -> None:
         """
-        Initialize the loader's internal state based on the model and 
+        Initialize the loader's internal state based on the model and
         configuration.
         """
         self.is_pool_model = is_pooling_model(model)
@@ -541,7 +581,8 @@ def _initialize_loader_state(self, model: nn.Module,
                 raise AttributeError(
                     f"MoE Model {type(model).__name__} does not support "
                     "BitsAndBytes quantization yet. Ensure this model has "
-                    "'get_expert_mapping' method.")
+                    "'get_expert_mapping' method."
+                )
         # For some models like Molmo, we need to use hf_to_vllm_mapper
         # to ensure correct loading of weights.
         if hf_to_vllm_mapper := getattr(model, "hf_to_vllm_mapper", None):
@@ -552,22 +593,20 @@ def _initialize_loader_state(self, model: nn.Module,
 
     def _dequantize_dq(self, quant_states: Any):
         """
-        When BNB employs Double Quantization, we perform the dequantization of 
-        these constants during weight loading rather than at inference time, 
-        thereby avoiding this computational overhead during inference. This 
+        When BNB employs Double Quantization, we perform the dequantization of
+        these constants during weight loading rather than at inference time,
+        thereby avoiding this computational overhead during inference. This
         comes at the cost of increased memory usage.
         """
         from bitsandbytes.functional import QuantState, dequantize_blockwise
 
         def _dequantize_single_state(quant_state):
             """Helper function to dequantize a single QuantState object."""
-            if not (isinstance(quant_state, QuantState)
-                    and quant_state.nested):
+            if not (isinstance(quant_state, QuantState) and quant_state.nested):
                 return
 
             # Copied from: https://github.com/bitsandbytes-foundation/bitsandbytes/blob/0.45.3/bitsandbytes/functional.py#L1352-#L1356
-            absmax = dequantize_blockwise(quant_state.absmax,
-                                          quant_state.state2)
+            absmax = dequantize_blockwise(quant_state.absmax, quant_state.state2)
             absmax += quant_state.offset
 
             # Ensure float32 dtype
@@ -586,10 +625,9 @@ def _dequantize_single_state(quant_state):
             _dequantize_single_state(quant_states)
         return quant_states
 
-    def _fuse_moe_quant_states(self, model: nn.Module,
-                               quant_states_dict: dict) -> dict:
+    def _fuse_moe_quant_states(self, model: nn.Module, quant_states_dict: dict) -> dict:
         """
-        
+
         This function consolidates individual expert quantization states into
         fused representations for w13 and w2.
         """
@@ -609,12 +647,12 @@ def _fuse_moe_quant_states(self, model: nn.Module,
             for exp in expert_mapping:
                 shard_id = exp[-1]
                 if shard_id not in ("w1", "w2", "w3"):
-                    raise ValueError(f"shard_id must be ['w1','w2','w3'] but "
-                                     f"got {shard_id}.")
+                    raise ValueError(
+                        f"shard_id must be ['w1','w2','w3'] but got {shard_id}."
+                    )
                 layer_prefix = name.split("experts")[0]
                 weight_qual_name = layer_prefix + exp[1] + "weight"
-                quant_state = self._dequantize_dq(
-                    quant_states_dict[weight_qual_name])
+                quant_state = self._dequantize_dq(quant_states_dict[weight_qual_name])
                 if shard_id == "w1":
                     w1_states_lst.append(quant_state)
                 elif shard_id == "w2":
@@ -622,14 +660,12 @@ def _fuse_moe_quant_states(self, model: nn.Module,
                 else:
                     w3_states_lst.append(quant_state)
                 del quant_states_dict[weight_qual_name]
-            assert (len(w1_states_lst) == len(w2_states_lst) ==
-                    len(w3_states_lst))
+            assert len(w1_states_lst) == len(w2_states_lst) == len(w3_states_lst)
             w13_absmax_lst = []
             w2_absmax_lst = []
             w13_total_dim0 = 0
             w2_total_dim0 = 0
-            for w1_qs, w2_qs, w3_qs in zip(w1_states_lst, w2_states_lst,
-                                           w3_states_lst):
+            for w1_qs, w2_qs, w3_qs in zip(w1_states_lst, w2_states_lst, w3_states_lst):
                 assert w1_qs.shape == w3_qs.shape
                 assert w1_qs.blocksize == w2_qs.blocksize == w3_qs.blocksize
                 assert w1_qs.dtype == w2_qs.dtype == w3_qs.dtype
@@ -669,12 +705,13 @@ def _fuse_moe_quant_states(self, model: nn.Module,
         return expert_qs_dict
 
     def _stack_quantization_states(
-            self, model: nn.Module,
-            quant_state_dict: dict) -> dict[str, dict[int, Any]]:
+        self, model: nn.Module, quant_state_dict: dict
+    ) -> dict[str, dict[int, Any]]:
         stacked_quant_state_dict: dict[str, dict[int, Any]] = {}
         # TODO: Change this lazy import to normal import
         # after the checks are updated to run on a new version
         from vllm.model_executor.models.utils import is_pp_missing_parameter
+
         param_dict = dict(model.named_parameters())
         for quant_param_name in quant_state_dict:
             if is_pp_missing_parameter(quant_param_name, model):
@@ -684,23 +721,23 @@ def _stack_quantization_states(
 
             shard_index = 0
             for shard_name, (
-                    weight_name,
-                    index,
+                weight_name,
+                index,
             ) in self.modules_mapping.inverse_packed_mapping.items():
                 # Some models, such as MiniCPM V2.5/2.6, contain both
                 # module names 'kv_proj' and 'qkv_proj'. To prevent 'kv_proj'
                 # from being incorrectly identified as being present in
                 # 'vpm.encoder.layers.0.self_attn.qkv_proj.weight
                 shard_pos = quant_param_name.find(shard_name)
-                can_correct_rename = (shard_pos
-                                      > 0) and (quant_param_name[shard_pos - 1]
-                                                == ".")
+                can_correct_rename = (shard_pos > 0) and (
+                    quant_param_name[shard_pos - 1] == "."
+                )
                 # If the quant_param_name is packed, it won't occur in the
                 # param_dict before renaming.
-                new_quant_param_name = quant_param_name.replace(
-                    shard_name, weight_name)
-                need_rename = (quant_param_name not in param_dict) \
-                              and (new_quant_param_name in param_dict)
+                new_quant_param_name = quant_param_name.replace(shard_name, weight_name)
+                need_rename = (quant_param_name not in param_dict) and (
+                    new_quant_param_name in param_dict
+                )
                 if can_correct_rename and need_rename:
                     shard_index = index
                     quant_param_name = new_quant_param_name
@@ -714,12 +751,14 @@ def _stack_quantization_states(
             if quant_param_name not in stacked_quant_state_dict:
                 stacked_quant_state_dict[quant_param_name] = {}
 
-            stacked_quant_state_dict[quant_param_name][shard_index] = (
-                quant_state_dict[non_stacked_param_name])
+            stacked_quant_state_dict[quant_param_name][shard_index] = quant_state_dict[
+                non_stacked_param_name
+            ]
         return stacked_quant_state_dict
 
-    def _bind_quant_states_to_params(self, model: nn.Module,
-                                     stacked_quant_state_dict: dict) -> None:
+    def _bind_quant_states_to_params(
+        self, model: nn.Module, stacked_quant_state_dict: dict
+    ) -> None:
         # save quant_states and offsets as the attributes of the parameters
         param_dict = dict(model.named_parameters())
         for param_name, param in param_dict.items():
@@ -733,13 +772,11 @@ def _bind_quant_states_to_params(self, model: nn.Module,
 
                 pack_ratio = getattr(param, "pack_factor", -1)
                 if pack_ratio == -1:
-                    raise ValueError(
-                        f"pack_factor not set for parameter {param_name}.")
+                    raise ValueError(f"pack_factor not set for parameter {param_name}.")
 
                 num_elements = [0] * len(quant_states)
                 for seq, quant_state in quant_states.items():
-                    num_elements[seq] = (math.prod(quant_state.shape) //
-                                         pack_ratio)
+                    num_elements[seq] = math.prod(quant_state.shape) // pack_ratio
 
                 offsets = np.concatenate(([0], np.cumsum(num_elements)))
                 # Make torch infer_schema happy
@@ -748,38 +785,39 @@ def _bind_quant_states_to_params(self, model: nn.Module,
 
                 if self.load_8bit:
                     set_weight_attrs(
-                        param, {"matmul_state": [None] * len(quant_states)})
-
-    def load_weights(self, model: nn.Module,
-                     model_config: ModelConfig) -> None:
+                        param, {"matmul_state": [None] * len(quant_states)}
+                    )
 
+    def load_weights(self, model: nn.Module, model_config: ModelConfig) -> None:
         self._verify_model_compatibility(model, model_config)
         self._initialize_loader_state(model, model_config)
 
-        logger.info("Loading weights with BitsAndBytes quantization. "
-                    "May take a while ...")
-        qweight_iterator, quant_state_dict = (
-            self._get_quantized_weights_iterator(
-                model_config.model,
-                model_config.revision,
-            ))
+        logger.info(
+            "Loading weights with BitsAndBytes quantization. May take a while ..."
+        )
+        qweight_iterator, quant_state_dict = self._get_quantized_weights_iterator(
+            model_config.model,
+            model_config.revision,
+        )
         weights_to_load = {name for name, _ in model.named_parameters()}
         loaded_weights = model.load_weights(qweight_iterator)
         # Some models may have weights loading tracker unimplemented.
         if loaded_weights is not None:
             weights_not_loaded = weights_to_load - loaded_weights
             if weights_not_loaded:
-                raise ValueError("Following weights were not initialized from "
-                                 f"checkpoint: {weights_not_loaded}")
-        expert_quant_state_dict = self._fuse_moe_quant_states(
-            model, quant_state_dict)
+                raise ValueError(
+                    "Following weights were not initialized from "
+                    f"checkpoint: {weights_not_loaded}"
+                )
+        expert_quant_state_dict = self._fuse_moe_quant_states(model, quant_state_dict)
 
         stacked_quant_state_dict = self._stack_quantization_states(
-            model, quant_state_dict)
+            model, quant_state_dict
+        )
 
         stacked_quant_state_dict = {
             **expert_quant_state_dict,
-            **stacked_quant_state_dict
+            **stacked_quant_state_dict,
         }
         self._bind_quant_states_to_params(model, stacked_quant_state_dict)
         torch.cuda.empty_cache()
diff --git a/vllm/model_executor/model_loader/default_loader.py b/vllm/model_executor/model_loader/default_loader.py
index 8e2db9292ff8..206b8244569f 100644
--- a/vllm/model_executor/model_loader/default_loader.py
+++ b/vllm/model_executor/model_loader/default_loader.py
@@ -16,12 +16,18 @@
 from vllm.logger import init_logger
 from vllm.model_executor.model_loader.base_loader import BaseModelLoader
 from vllm.model_executor.model_loader.weight_utils import (
-    download_safetensors_index_file_from_hf, download_weights_from_hf,
-    fastsafetensors_weights_iterator, filter_duplicate_safetensors_files,
-    filter_files_not_needed_for_inference, maybe_download_from_modelscope,
+    download_safetensors_index_file_from_hf,
+    download_weights_from_hf,
+    fastsafetensors_weights_iterator,
+    filter_duplicate_safetensors_files,
+    filter_files_not_needed_for_inference,
+    maybe_download_from_modelscope,
     multi_thread_pt_weights_iterator,
-    multi_thread_safetensors_weights_iterator, np_cache_weights_iterator,
-    pt_weights_iterator, safetensors_weights_iterator)
+    multi_thread_safetensors_weights_iterator,
+    np_cache_weights_iterator,
+    pt_weights_iterator,
+    safetensors_weights_iterator,
+)
 from vllm.platforms import current_platform
 
 logger = init_logger(__name__)
@@ -63,9 +69,11 @@ def __init__(self, load_config: LoadConfig):
         unexpected_keys = set(extra_config.keys()) - allowed_keys
 
         if unexpected_keys:
-            raise ValueError(f"Unexpected extra config keys for load format "
-                             f"{load_config.load_format}: "
-                             f"{unexpected_keys}")
+            raise ValueError(
+                f"Unexpected extra config keys for load format "
+                f"{load_config.load_format}: "
+                f"{unexpected_keys}"
+            )
 
     def _prepare_weights(
         self,
@@ -77,8 +85,10 @@ def _prepare_weights(
         """Prepare weights for the model.
 
         If the model is not local, it will be downloaded."""
-        model_name_or_path = (maybe_download_from_modelscope(
-            model_name_or_path, revision) or model_name_or_path)
+        model_name_or_path = (
+            maybe_download_from_modelscope(model_name_or_path, revision)
+            or model_name_or_path
+        )
 
         is_local = os.path.isdir(model_name_or_path)
         load_format = self.load_config.load_format
@@ -87,8 +97,7 @@ def _prepare_weights(
         # Some quantized models use .pt files for storing the weights.
         if load_format == "auto":
             allow_patterns = ["*.safetensors", "*.bin"]
-        elif (load_format == "safetensors"
-              or load_format == "fastsafetensors"):
+        elif load_format == "safetensors" or load_format == "fastsafetensors":
             use_safetensors = True
             allow_patterns = ["*.safetensors"]
         elif load_format == "mistral":
@@ -141,25 +150,29 @@ def _prepare_weights(
                     revision,
                 )
             hf_weights_files = filter_duplicate_safetensors_files(
-                hf_weights_files, hf_folder, index_file)
+                hf_weights_files, hf_folder, index_file
+            )
         else:
-            hf_weights_files = filter_files_not_needed_for_inference(
-                hf_weights_files)
+            hf_weights_files = filter_files_not_needed_for_inference(hf_weights_files)
 
         if len(hf_weights_files) == 0:
             raise RuntimeError(
-                f"Cannot find any model weights with `{model_name_or_path}`")
+                f"Cannot find any model weights with `{model_name_or_path}`"
+            )
 
         return hf_folder, hf_weights_files, use_safetensors
 
     def _get_weights_iterator(
-            self, source: "Source"
+        self, source: "Source"
     ) -> Generator[tuple[str, torch.Tensor], None, None]:
         """Get an iterator for the model weights based on the load format."""
         extra_config = self.load_config.model_loader_extra_config
         hf_folder, hf_weights_files, use_safetensors = self._prepare_weights(
-            source.model_or_path, source.revision, source.fall_back_to_pt,
-            source.allow_patterns_overrides)
+            source.model_or_path,
+            source.revision,
+            source.fall_back_to_pt,
+            source.allow_patterns_overrides,
+        )
         if self.load_config.load_format == "npcache":
             # Currently np_cache only support *.bin checkpoints
             assert use_safetensors is False
@@ -178,13 +191,13 @@ def _get_weights_iterator(
                 )
             else:
                 if extra_config.get("enable_multithread_load"):
-                    weights_iterator = (
-                        multi_thread_safetensors_weights_iterator(
-                            hf_weights_files,
-                            self.load_config.use_tqdm_on_load,
-                            max_workers=extra_config.get(
-                                "num_threads", self.DEFAULT_NUM_THREADS),
-                        ))
+                    weights_iterator = multi_thread_safetensors_weights_iterator(
+                        hf_weights_files,
+                        self.load_config.use_tqdm_on_load,
+                        max_workers=extra_config.get(
+                            "num_threads", self.DEFAULT_NUM_THREADS
+                        ),
+                    )
                 else:
                     weights_iterator = safetensors_weights_iterator(
                         hf_weights_files,
@@ -197,8 +210,9 @@ def _get_weights_iterator(
                     hf_weights_files,
                     self.load_config.use_tqdm_on_load,
                     self.load_config.pt_load_map_location,
-                    max_workers=extra_config.get("num_threads",
-                                                 self.DEFAULT_NUM_THREADS),
+                    max_workers=extra_config.get(
+                        "num_threads", self.DEFAULT_NUM_THREADS
+                    ),
                 )
             else:
                 weights_iterator = pt_weights_iterator(
@@ -226,8 +240,7 @@ def _xla_weights_iterator(iterator: Generator):
         if self.counter_before_loading_weights == 0.0:
             self.counter_before_loading_weights = time.perf_counter()
         # Apply the prefix.
-        return ((source.prefix + name, tensor)
-                for (name, tensor) in weights_iterator)
+        return ((source.prefix + name, tensor) for (name, tensor) in weights_iterator)
 
     def get_all_weights(
         self,
@@ -238,10 +251,8 @@ def get_all_weights(
             model_config.model,
             model_config.revision,
             prefix="",
-            fall_back_to_pt=getattr(model, "fall_back_to_pt_during_load",
-                                    True),
-            allow_patterns_overrides=getattr(model, "allow_patterns_overrides",
-                                             None),
+            fall_back_to_pt=getattr(model, "fall_back_to_pt_during_load", True),
+            allow_patterns_overrides=getattr(model, "allow_patterns_overrides", None),
         )
         yield from self._get_weights_iterator(primary_weights)
 
@@ -253,13 +264,14 @@ def get_all_weights(
             yield from self._get_weights_iterator(source)
 
     def download_model(self, model_config: ModelConfig) -> None:
-        self._prepare_weights(model_config.model,
-                              model_config.revision,
-                              fall_back_to_pt=True,
-                              allow_patterns_overrides=None)
+        self._prepare_weights(
+            model_config.model,
+            model_config.revision,
+            fall_back_to_pt=True,
+            allow_patterns_overrides=None,
+        )
 
-    def load_weights(self, model: nn.Module,
-                     model_config: ModelConfig) -> None:
+    def load_weights(self, model: nn.Module, model_config: ModelConfig) -> None:
         weights_to_load = {name for name, _ in model.named_parameters()}
 
         # if we don't have `model.weight_metadata_and_attr_saved` defined and
@@ -267,38 +279,43 @@ def load_weights(self, model: nn.Module,
         # or the first run of online quantization
         # see online_quantization.py for detailed notes
         offline_quantization_or_first_run_of_online_quantization = not getattr(
-            model, "weight_metadata_and_attr_saved", False)
+            model, "weight_metadata_and_attr_saved", False
+        )
 
         if model_config.quantization is None:
             # model is not quantized
             loaded_weights = model.load_weights(
-                self.get_all_weights(model_config, model))
+                self.get_all_weights(model_config, model)
+            )
         elif offline_quantization_or_first_run_of_online_quantization:
             # case 1: offline quantized checkpoint
             # case 2: Step I1 first run of weight loading with
             # online quantization
             # see online_quantization.py for detailed notes
             loaded_weights = model.load_weights(
-                self.get_all_weights(model_config, model))
+                self.get_all_weights(model_config, model)
+            )
         else:
             # to avoid circular dependency
             from vllm.model_executor.model_loader.online_quantization import (
-                load_weights_and_online_quantize)
+                load_weights_and_online_quantize,
+            )
 
             # subsequent runs of weight loading with online
             # quantization
-            loaded_weights = load_weights_and_online_quantize(
-                self, model, model_config)
+            loaded_weights = load_weights_and_online_quantize(self, model, model_config)
 
         self.counter_after_loading_weights = time.perf_counter()
         logger.info(
             "Loading weights took %.2f seconds",
-            self.counter_after_loading_weights -
-            self.counter_before_loading_weights)
+            self.counter_after_loading_weights - self.counter_before_loading_weights,
+        )
         # We only enable strict check for non-quantized models
         # that have loaded weights tracking currently.
         if model_config.quantization is None and loaded_weights is not None:
             weights_not_loaded = weights_to_load - loaded_weights
             if weights_not_loaded:
-                raise ValueError("Following weights were not initialized from "
-                                 f"checkpoint: {weights_not_loaded}")
+                raise ValueError(
+                    "Following weights were not initialized from "
+                    f"checkpoint: {weights_not_loaded}"
+                )
diff --git a/vllm/model_executor/model_loader/dummy_loader.py b/vllm/model_executor/model_loader/dummy_loader.py
index 5b8c6268f64e..b2a934ce5949 100644
--- a/vllm/model_executor/model_loader/dummy_loader.py
+++ b/vllm/model_executor/model_loader/dummy_loader.py
@@ -5,8 +5,7 @@
 from vllm.config import ModelConfig
 from vllm.config.load import LoadConfig
 from vllm.model_executor.model_loader.base_loader import BaseModelLoader
-from vllm.model_executor.model_loader.weight_utils import (
-    initialize_dummy_weights)
+from vllm.model_executor.model_loader.weight_utils import initialize_dummy_weights
 
 
 class DummyModelLoader(BaseModelLoader):
@@ -15,14 +14,15 @@ class DummyModelLoader(BaseModelLoader):
     def __init__(self, load_config: LoadConfig):
         super().__init__(load_config)
         if load_config.model_loader_extra_config:
-            raise ValueError(f"Model loader extra config is not supported for "
-                             f"load format {load_config.load_format}")
+            raise ValueError(
+                f"Model loader extra config is not supported for "
+                f"load format {load_config.load_format}"
+            )
 
     def download_model(self, model_config: ModelConfig) -> None:
         pass  # Nothing to download
 
-    def load_weights(self, model: nn.Module,
-                     model_config: ModelConfig) -> None:
+    def load_weights(self, model: nn.Module, model_config: ModelConfig) -> None:
         # NOTE(woosuk): For accurate performance evaluation, we assign
         # random values to the weights.
         initialize_dummy_weights(model)
diff --git a/vllm/model_executor/model_loader/gguf_loader.py b/vllm/model_executor/model_loader/gguf_loader.py
index aaee8f3f7635..93dc754a571c 100644
--- a/vllm/model_executor/model_loader/gguf_loader.py
+++ b/vllm/model_executor/model_loader/gguf_loader.py
@@ -13,10 +13,15 @@
 from vllm.config.load import LoadConfig
 from vllm.model_executor.model_loader.base_loader import BaseModelLoader
 from vllm.model_executor.model_loader.utils import (
-    initialize_model, process_weights_after_loading, set_default_torch_dtype)
+    initialize_model,
+    process_weights_after_loading,
+    set_default_torch_dtype,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    get_gguf_extra_tensor_names, get_gguf_weight_type_map,
-    gguf_quant_weights_iterator)
+    get_gguf_extra_tensor_names,
+    get_gguf_weight_type_map,
+    gguf_quant_weights_iterator,
+)
 
 
 class GGUFModelLoader(BaseModelLoader):
@@ -29,15 +34,18 @@ class GGUFModelLoader(BaseModelLoader):
     def __init__(self, load_config: LoadConfig):
         super().__init__(load_config)
         if load_config.model_loader_extra_config:
-            raise ValueError(f"Model loader extra config is not supported for "
-                             f"load format {load_config.load_format}")
+            raise ValueError(
+                f"Model loader extra config is not supported for "
+                f"load format {load_config.load_format}"
+            )
 
     def _prepare_weights(self, model_name_or_path: str):
         if os.path.isfile(model_name_or_path):
             return model_name_or_path
         # for raw HTTPS link
         if model_name_or_path.startswith(
-            ("http://", "https://")) and model_name_or_path.endswith(".gguf"):
+            ("http://", "https://")
+        ) and model_name_or_path.endswith(".gguf"):
             return hf_hub_download(url=model_name_or_path)
         # repo id/filename.gguf
         if "/" in model_name_or_path and model_name_or_path.endswith(".gguf"):
@@ -46,7 +54,8 @@ def _prepare_weights(self, model_name_or_path: str):
         else:
             raise ValueError(
                 f"Unrecognised GGUF reference: {model_name_or_path} "
-                "(expected local file, raw URL, or <repo_id>/<filename>.gguf)")
+                "(expected local file, raw URL, or <repo_id>/<filename>.gguf)"
+            )
 
     def _get_gguf_weights_map(self, model_config: ModelConfig):
         """
@@ -68,25 +77,32 @@ def _get_gguf_weights_map(self, model_config: ModelConfig):
             # GGUF layer map assumes that we will have a merged expert weights
             # so we need to map them manually
             for idx in range(config.num_hidden_layers):
-                gguf_to_hf_name_map[f"blk.{idx}.exp_probs_b.bias"] = \
-                        f"model.layers.{idx}.mlp.gate.e_score_correction_bias"
-                gguf_to_hf_name_map[f"blk.{idx}.ffn_down_exps.weight"] = \
-                        f"model.layers.{idx}.mlp.experts.0.down_proj.weight"
-                gguf_to_hf_name_map[f"blk.{idx}.ffn_gate_exps.weight"] = \
-                        f"model.layers.{idx}.mlp.experts.0.gate_proj.weight"
-                gguf_to_hf_name_map[f"blk.{idx}.ffn_up_exps.weight"] = \
-                        f"model.layers.{idx}.mlp.experts.0.up_proj.weight"
+                gguf_to_hf_name_map[f"blk.{idx}.exp_probs_b.bias"] = (
+                    f"model.layers.{idx}.mlp.gate.e_score_correction_bias"
+                )
+                gguf_to_hf_name_map[f"blk.{idx}.ffn_down_exps.weight"] = (
+                    f"model.layers.{idx}.mlp.experts.0.down_proj.weight"
+                )
+                gguf_to_hf_name_map[f"blk.{idx}.ffn_gate_exps.weight"] = (
+                    f"model.layers.{idx}.mlp.experts.0.gate_proj.weight"
+                )
+                gguf_to_hf_name_map[f"blk.{idx}.ffn_up_exps.weight"] = (
+                    f"model.layers.{idx}.mlp.experts.0.up_proj.weight"
+                )
         if model_type in ("qwen2_moe", "qwen3_moe"):
             model_type = model_type.replace("_", "")
             # GGUF layer map assumes that we will have a merged expert weights
             # so we need to map them manually
             for idx in range(config.num_hidden_layers):
-                gguf_to_hf_name_map[f"blk.{idx}.ffn_down_exps.weight"] = \
-                        f"model.layers.{idx}.mlp.experts.0.down_proj.weight"
-                gguf_to_hf_name_map[f"blk.{idx}.ffn_gate_exps.weight"] = \
-                        f"model.layers.{idx}.mlp.experts.0.gate_proj.weight"
-                gguf_to_hf_name_map[f"blk.{idx}.ffn_up_exps.weight"] = \
-                        f"model.layers.{idx}.mlp.experts.0.up_proj.weight"
+                gguf_to_hf_name_map[f"blk.{idx}.ffn_down_exps.weight"] = (
+                    f"model.layers.{idx}.mlp.experts.0.down_proj.weight"
+                )
+                gguf_to_hf_name_map[f"blk.{idx}.ffn_gate_exps.weight"] = (
+                    f"model.layers.{idx}.mlp.experts.0.gate_proj.weight"
+                )
+                gguf_to_hf_name_map[f"blk.{idx}.ffn_up_exps.weight"] = (
+                    f"model.layers.{idx}.mlp.experts.0.up_proj.weight"
+                )
 
         arch = None
         for key, value in gguf.MODEL_ARCH_NAMES.items():
@@ -99,7 +115,8 @@ def _get_gguf_weights_map(self, model_config: ModelConfig):
         name_map = gguf.get_tensor_name_map(arch, num_layers)
         with torch.device("meta"):
             dummy_model = AutoModelForCausalLM.from_config(
-                config, trust_remote_code=model_config.trust_remote_code)
+                config, trust_remote_code=model_config.trust_remote_code
+            )
         state_dict = dummy_model.state_dict()
 
         for hf_name in state_dict:
@@ -111,31 +128,31 @@ def _get_gguf_weights_map(self, model_config: ModelConfig):
     def _get_weights_iterator(
         self, model_name_or_path: str, gguf_to_hf_name_map: dict[str, str]
     ) -> Generator[tuple[str, torch.Tensor], None, None]:
-        return gguf_quant_weights_iterator(model_name_or_path,
-                                           gguf_to_hf_name_map)
+        return gguf_quant_weights_iterator(model_name_or_path, gguf_to_hf_name_map)
 
     def download_model(self, model_config: ModelConfig) -> None:
         self._prepare_weights(model_config.model)
 
-    def load_weights(self, model: nn.Module,
-                     model_config: ModelConfig) -> None:
+    def load_weights(self, model: nn.Module, model_config: ModelConfig) -> None:
         local_model_path = self._prepare_weights(model_config.model)
         gguf_weights_map = self._get_gguf_weights_map(model_config)
         model.load_weights(
-            self._get_weights_iterator(local_model_path, gguf_weights_map))
+            self._get_weights_iterator(local_model_path, gguf_weights_map)
+        )
 
-    def load_model(self, vllm_config: VllmConfig,
-                   model_config: ModelConfig) -> nn.Module:
+    def load_model(
+        self, vllm_config: VllmConfig, model_config: ModelConfig
+    ) -> nn.Module:
         device_config = vllm_config.device_config
         local_model_path = self._prepare_weights(model_config.model)
         gguf_weights_map = self._get_gguf_weights_map(model_config)
         # we can only know if tie word embeddings after mapping weights
         if "lm_head.weight" in get_gguf_extra_tensor_names(
-                local_model_path, gguf_weights_map):
+            local_model_path, gguf_weights_map
+        ):
             model_config.hf_config.update({"tie_word_embeddings": True})
 
-        weight_type_map = get_gguf_weight_type_map(model_config.model,
-                                                   gguf_weights_map)
+        weight_type_map = get_gguf_weight_type_map(model_config.model, gguf_weights_map)
 
         # filter out unquantized modules to skip
         unquant_names = [
diff --git a/vllm/model_executor/model_loader/online_quantization.py b/vllm/model_executor/model_loader/online_quantization.py
index beec2d20ad69..890dd7231a0e 100644
--- a/vllm/model_executor/model_loader/online_quantization.py
+++ b/vllm/model_executor/model_loader/online_quantization.py
@@ -9,8 +9,7 @@
 from vllm.config import ModelConfig
 from vllm.logger import init_logger
 from vllm.model_executor.model_loader.default_loader import DefaultModelLoader
-from vllm.model_executor.model_loader.utils import (
-    process_weights_after_loading)
+from vllm.model_executor.model_loader.utils import process_weights_after_loading
 
 logger = init_logger(__name__)
 
@@ -63,7 +62,8 @@
 
 
 def maybe_save_metadata_and_attributes_for_weight_reloading(
-        model: nn.Module, model_config: ModelConfig):
+    model: nn.Module, model_config: ModelConfig
+):
     # following is to support on the fly quantization, currently only supported
     # for torchao
     if model_config.quantization != "torchao":
@@ -73,10 +73,12 @@ def maybe_save_metadata_and_attributes_for_weight_reloading(
         # In case `process_weights_after_loading` is called multiple times
         # we'll skip it at later times
         logger.warning(
-            "process_weights_after_loading already called for model %s", model)
+            "process_weights_after_loading already called for model %s", model
+        )
         return
 
     from vllm.model_executor.model_loader.weight_utils import get_quant_config
+
     quant_config = get_quant_config(model_config, None)
 
     # If checkpoint is already torchao serialized, this means it's
@@ -86,8 +88,10 @@ def maybe_save_metadata_and_attributes_for_weight_reloading(
     # This step record the weights metadata and weight attributes so we can
     # restore the bfloat16 model weights during the relad step (R1 and R2)
     # see Notes in online_quantization.py for more details
-    if not (hasattr(quant_config, "is_checkpoint_torchao_serialized") and \
-       not quant_config.is_checkpoint_torchao_serialized):
+    if not (
+        hasattr(quant_config, "is_checkpoint_torchao_serialized")
+        and not quant_config.is_checkpoint_torchao_serialized
+    ):
         return
 
     # This is the I2 step of online quantiztion that saves
@@ -144,23 +148,23 @@ def _bond_method_to_cls(func, obj):
         return types.MethodType(func, obj)
 
 
-def load_weights_and_online_quantize(model_loader: DefaultModelLoader,
-                                     model: nn.Module,
-                                     model_config: ModelConfig) -> set[str]:
+def load_weights_and_online_quantize(
+    model_loader: DefaultModelLoader, model: nn.Module, model_config: ModelConfig
+) -> set[str]:
     # online quantization, right now only enabled for
     # torchao
     # R1, R2, R3, R4 in the Notes
 
     # TODO: Add fp8 support
-    assert model_config.quantization == "torchao", "online " \
-        "quantization is only enabled for torchao currently"
+    assert model_config.quantization == "torchao", (
+        "online quantization is only enabled for torchao currently"
+    )
     # TODO: use create_weights to restore the weights to original state
 
     # Step R1: First restore the quantized weights to original bfloat16
     # weights, with original metadata (shape, dtype, device)
     # and attributes, so that bfloat16 weights can be loaded properly
-    existing_param_names = dict(
-        model.named_parameters(remove_duplicate=False)).keys()
+    existing_param_names = dict(model.named_parameters(remove_duplicate=False)).keys()
     named_modules = dict(model.named_modules(remove_duplicate=False))
     model_device = None
 
@@ -170,9 +174,11 @@ def load_weights_and_online_quantize(model_loader: DefaultModelLoader,
         _dtype = d["dtype"]
         _device = d["device"]
         if model_device is not None:
-            assert model_device == _device, "Expecting all weights " \
-                "to be in the same device for now, got both: " \
+            assert model_device == _device, (
+                "Expecting all weights "
+                "to be in the same device for now, got both: "
                 f"{model_device} and {_device}"
+            )
         else:
             model_device = _device
 
@@ -180,9 +186,10 @@ def load_weights_and_online_quantize(model_loader: DefaultModelLoader,
             module_name, weight_name = name.rsplit(".", 1)
             module = named_modules[module_name]
             setattr(
-                module, weight_name,
-                torch.nn.Parameter(
-                    torch.empty(_shape, dtype=_dtype, device=_device)))
+                module,
+                weight_name,
+                torch.nn.Parameter(torch.empty(_shape, dtype=_dtype, device=_device)),
+            )
 
     # recorded_weight_attr is
     # {"weight_name": {"weight_attr_key": attr}}
@@ -196,8 +203,7 @@ def load_weights_and_online_quantize(model_loader: DefaultModelLoader,
     #     "layer.1.weight": ...,
     #    }
     # }
-    for full_weight_name, weight_attr_dict in \
-            model.recorded_weight_attr.items():
+    for full_weight_name, weight_attr_dict in model.recorded_weight_attr.items():
         for attr_name, attr in weight_attr_dict.items():
             module_name, weight_name = full_weight_name.rsplit(".", 1)
             module = named_modules[module_name]
@@ -207,7 +213,8 @@ def load_weights_and_online_quantize(model_loader: DefaultModelLoader,
 
     # Step I1: reload bfloat16 / high precision weights
     loaded_weights = model.load_weights(
-        model_loader.get_all_weights(model_config, model))
+        model_loader.get_all_weights(model_config, model)
+    )
 
     # Step I2: online quantize the weights
     # manually process weights after loading
diff --git a/vllm/model_executor/model_loader/runai_streamer_loader.py b/vllm/model_executor/model_loader/runai_streamer_loader.py
index dc941401a04e..50a92edd1162 100644
--- a/vllm/model_executor/model_loader/runai_streamer_loader.py
+++ b/vllm/model_executor/model_loader/runai_streamer_loader.py
@@ -13,16 +13,17 @@
 from vllm.config.load import LoadConfig
 from vllm.model_executor.model_loader.base_loader import BaseModelLoader
 from vllm.model_executor.model_loader.weight_utils import (
-    download_safetensors_index_file_from_hf, download_weights_from_hf,
-    runai_safetensors_weights_iterator)
-from vllm.transformers_utils.runai_utils import (is_runai_obj_uri,
-                                                 list_safetensors)
+    download_safetensors_index_file_from_hf,
+    download_weights_from_hf,
+    runai_safetensors_weights_iterator,
+)
+from vllm.transformers_utils.runai_utils import is_runai_obj_uri, list_safetensors
 
 
 class RunaiModelStreamerLoader(BaseModelLoader):
     """
-        Model loader that can load safetensors
-        files from local FS or S3 bucket.
+    Model loader that can load safetensors
+    files from local FS or S3 bucket.
     """
 
     def __init__(self, load_config: LoadConfig):
@@ -30,25 +31,28 @@ def __init__(self, load_config: LoadConfig):
         if load_config.model_loader_extra_config:
             extra_config = load_config.model_loader_extra_config
 
-            if ("concurrency" in extra_config
-                    and isinstance(extra_config.get("concurrency"), int)):
+            if "concurrency" in extra_config and isinstance(
+                extra_config.get("concurrency"), int
+            ):
                 os.environ["RUNAI_STREAMER_CONCURRENCY"] = str(
-                    extra_config.get("concurrency"))
+                    extra_config.get("concurrency")
+                )
 
-            if ("memory_limit" in extra_config
-                    and isinstance(extra_config.get("memory_limit"), int)):
+            if "memory_limit" in extra_config and isinstance(
+                extra_config.get("memory_limit"), int
+            ):
                 os.environ["RUNAI_STREAMER_MEMORY_LIMIT"] = str(
-                    extra_config.get("memory_limit"))
+                    extra_config.get("memory_limit")
+                )
 
-            runai_streamer_s3_endpoint = os.getenv(
-                'RUNAI_STREAMER_S3_ENDPOINT')
-            aws_endpoint_url = os.getenv('AWS_ENDPOINT_URL')
-            if (runai_streamer_s3_endpoint is None
-                    and aws_endpoint_url is not None):
+            runai_streamer_s3_endpoint = os.getenv("RUNAI_STREAMER_S3_ENDPOINT")
+            aws_endpoint_url = os.getenv("AWS_ENDPOINT_URL")
+            if runai_streamer_s3_endpoint is None and aws_endpoint_url is not None:
                 os.environ["RUNAI_STREAMER_S3_ENDPOINT"] = aws_endpoint_url
 
-    def _prepare_weights(self, model_name_or_path: str,
-                         revision: Optional[str]) -> list[str]:
+    def _prepare_weights(
+        self, model_name_or_path: str, revision: Optional[str]
+    ) -> list[str]:
         """Prepare weights for the model.
 
         If the model is not local, it will be downloaded."""
@@ -58,31 +62,34 @@ def _prepare_weights(self, model_name_or_path: str,
         safetensors_pattern = "*.safetensors"
         index_file = SAFE_WEIGHTS_INDEX_NAME
 
-        hf_folder = (model_name_or_path if (is_local or is_object_storage_path)
-                     else download_weights_from_hf(
-                         model_name_or_path,
-                         self.load_config.download_dir,
-                         [safetensors_pattern],
-                         revision,
-                         ignore_patterns=self.load_config.ignore_patterns,
-                     ))
+        hf_folder = (
+            model_name_or_path
+            if (is_local or is_object_storage_path)
+            else download_weights_from_hf(
+                model_name_or_path,
+                self.load_config.download_dir,
+                [safetensors_pattern],
+                revision,
+                ignore_patterns=self.load_config.ignore_patterns,
+            )
+        )
         hf_weights_files = list_safetensors(path=hf_folder)
 
         if not is_local and not is_object_storage_path:
             download_safetensors_index_file_from_hf(
-                model_name_or_path, index_file, self.load_config.download_dir,
-                revision)
+                model_name_or_path, index_file, self.load_config.download_dir, revision
+            )
 
         if not hf_weights_files:
             raise RuntimeError(
-                f"Cannot find any safetensors model weights with "
-                f"`{model_name_or_path}`")
+                f"Cannot find any safetensors model weights with `{model_name_or_path}`"
+            )
 
         return hf_weights_files
 
     def _get_weights_iterator(
-            self, model_or_path: str,
-            revision: str) -> Generator[tuple[str, torch.Tensor], None, None]:
+        self, model_or_path: str, revision: str
+    ) -> Generator[tuple[str, torch.Tensor], None, None]:
         """Get an iterator for the model weights based on the load format."""
         hf_weights_files = self._prepare_weights(model_or_path, revision)
         return runai_safetensors_weights_iterator(
@@ -94,11 +101,11 @@ def download_model(self, model_config: ModelConfig) -> None:
         """Download model if necessary"""
         self._prepare_weights(model_config.model, model_config.revision)
 
-    def load_weights(self, model: nn.Module,
-                     model_config: ModelConfig) -> None:
+    def load_weights(self, model: nn.Module, model_config: ModelConfig) -> None:
         """Load weights into a model."""
         model_weights = model_config.model
         if hasattr(model_config, "model_weights"):
             model_weights = model_config.model_weights
         model.load_weights(
-            self._get_weights_iterator(model_weights, model_config.revision))
+            self._get_weights_iterator(model_weights, model_config.revision)
+        )
diff --git a/vllm/model_executor/model_loader/sharded_state_loader.py b/vllm/model_executor/model_loader/sharded_state_loader.py
index a85ca065d1d2..d50a1a8f9dbf 100644
--- a/vllm/model_executor/model_loader/sharded_state_loader.py
+++ b/vllm/model_executor/model_loader/sharded_state_loader.py
@@ -15,7 +15,9 @@
 from vllm.logger import init_logger
 from vllm.model_executor.model_loader.base_loader import BaseModelLoader
 from vllm.model_executor.model_loader.weight_utils import (
-    download_weights_from_hf, runai_safetensors_weights_iterator)
+    download_weights_from_hf,
+    runai_safetensors_weights_iterator,
+)
 from vllm.transformers_utils.s3_utils import glob as s3_glob
 from vllm.transformers_utils.utils import is_s3
 
@@ -36,23 +38,30 @@ class ShardedStateLoader(BaseModelLoader):
     def __init__(self, load_config: LoadConfig):
         super().__init__(load_config)
 
-        extra_config = ({} if load_config.model_loader_extra_config is None
-                        else load_config.model_loader_extra_config.copy())
+        extra_config = (
+            {}
+            if load_config.model_loader_extra_config is None
+            else load_config.model_loader_extra_config.copy()
+        )
         self.pattern = extra_config.pop("pattern", self.DEFAULT_PATTERN)
         if extra_config:
-            raise ValueError(f"Unexpected extra config keys for load format "
-                             f"{load_config.load_format}: "
-                             f"{load_config.model_loader_extra_config.keys()}")
+            raise ValueError(
+                f"Unexpected extra config keys for load format "
+                f"{load_config.load_format}: "
+                f"{load_config.model_loader_extra_config.keys()}"
+            )
 
     @staticmethod
     def _filter_subtensors(
-        tensors: dict[str, torch.Tensor], ) -> dict[str, torch.Tensor]:
+        tensors: dict[str, torch.Tensor],
+    ) -> dict[str, torch.Tensor]:
         """
         Filter out all tensors that share the same memory or a subset of the
         memory of another tensor.
         """
         same_storage_groups: dict[Any, list[tuple[str, torch.Tensor]]] = (
-            collections.defaultdict(list))
+            collections.defaultdict(list)
+        )
         for key, tensor in tensors.items():
             if tensor.numel():
                 ptr = tensor.untyped_storage().data_ptr()
@@ -80,8 +89,7 @@ def get_end_ptr(tensor: torch.Tensor) -> int:
                     result[k] = t
         return result
 
-    def _prepare_weights(self, model_name_or_path: str,
-                         revision: Optional[str]):
+    def _prepare_weights(self, model_name_or_path: str, revision: Optional[str]):
         if is_s3(model_name_or_path) or os.path.isdir(model_name_or_path):
             return model_name_or_path
         else:
@@ -97,8 +105,7 @@ def _prepare_weights(self, model_name_or_path: str,
     def download_model(self, model_config: ModelConfig) -> None:
         self._prepare_weights(model_config.model, model_config.revision)
 
-    def load_weights(self, model: nn.Module,
-                     model_config: ModelConfig) -> None:
+    def load_weights(self, model: nn.Module, model_config: ModelConfig) -> None:
         from vllm.distributed import get_tensor_model_parallel_rank
 
         model_weights = model_config.model
@@ -115,15 +122,15 @@ def load_weights(self, model: nn.Module,
         filepaths = []
         if is_s3(local_model_path):
             file_pattern = f"*{self.pattern.format(rank=rank, part=' * ')}"
-            filepaths = s3_glob(path=local_model_path,
-                                allow_pattern=[file_pattern])
+            filepaths = s3_glob(path=local_model_path, allow_pattern=[file_pattern])
         else:
             filepaths = glob.glob(pattern)
         if not filepaths:
             # TODO: support un-sharded checkpoints too
             raise ValueError(
                 f"Could not find checkpoint files '{pattern}', only "
-                f"pre-sharded checkpoints are currently supported!")
+                f"pre-sharded checkpoints are currently supported!"
+            )
         state_dict = self._filter_subtensors(model.state_dict())
         for key, tensor in self.iterate_over_files(filepaths):
             # If loading with LoRA enabled, additional padding may
@@ -136,8 +143,7 @@ def load_weights(self, model: nn.Module,
                     param_data = param_data.narrow(dim, 0, size)
             if tensor.shape != param_shape:
                 logger.warning(
-                    "loading tensor of shape %s into "
-                    "parameter '%s' of shape %s",
+                    "loading tensor of shape %s into parameter '%s' of shape %s",
                     tensor.shape,
                     key,
                     param_shape,
@@ -145,15 +151,16 @@ def load_weights(self, model: nn.Module,
             param_data.copy_(tensor)
             state_dict.pop(key)
         if state_dict:
-            raise ValueError(
-                f"Missing keys {tuple(state_dict)} in loaded state!")
+            raise ValueError(f"Missing keys {tuple(state_dict)} in loaded state!")
 
     def iterate_over_files(
-            self, paths) -> Generator[tuple[str, torch.Tensor], None, None]:
+        self, paths
+    ) -> Generator[tuple[str, torch.Tensor], None, None]:
         if self.load_config.load_format == "runai_streamer_sharded":
             yield from runai_safetensors_weights_iterator(paths, True)
         else:
             from safetensors.torch import safe_open
+
             for path in paths:
                 with safe_open(path, framework="pt") as f:
                     for key in f.keys():  # noqa: SIM118
diff --git a/vllm/model_executor/model_loader/tensorizer.py b/vllm/model_executor/model_loader/tensorizer.py
index 13f4eebf1038..9d58278f996b 100644
--- a/vllm/model_executor/model_loader/tensorizer.py
+++ b/vllm/model_executor/model_loader/tensorizer.py
@@ -22,11 +22,9 @@
 from transformers import PretrainedConfig
 
 import vllm.envs as envs
-from vllm.config import (ModelConfig, ParallelConfig, VllmConfig,
-                         set_current_vllm_config)
+from vllm.config import ModelConfig, ParallelConfig, VllmConfig, set_current_vllm_config
 from vllm.logger import init_logger
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.platforms import current_platform
 from vllm.utils import FlexibleArgumentParser, PlaceholderModule
 
@@ -34,11 +32,14 @@
     from vllm.engine.arg_utils import EngineArgs
 
 try:
-    from tensorizer import (DecryptionParams, EncryptionParams,
-                            TensorDeserializer, TensorSerializer)
+    from tensorizer import (
+        DecryptionParams,
+        EncryptionParams,
+        TensorDeserializer,
+        TensorSerializer,
+    )
     from tensorizer.stream_io import open_stream
-    from tensorizer.utils import (convert_bytes, get_mem_usage,
-                                  no_init_or_tensor)
+    from tensorizer.utils import convert_bytes, get_mem_usage, no_init_or_tensor
 
 except ImportError:
     tensorizer = PlaceholderModule("tensorizer")
@@ -52,9 +53,15 @@
     no_init_or_tensor = tensorizer.placeholder_attr("utils.no_init_or_tensor")
 
 __all__ = [
-    'EncryptionParams', 'DecryptionParams', 'TensorDeserializer',
-    'TensorSerializer', 'open_stream', 'convert_bytes', 'get_mem_usage',
-    'no_init_or_tensor', 'TensorizerConfig'
+    "EncryptionParams",
+    "DecryptionParams",
+    "TensorDeserializer",
+    "TensorSerializer",
+    "open_stream",
+    "convert_bytes",
+    "get_mem_usage",
+    "no_init_or_tensor",
+    "TensorizerConfig",
 ]
 
 logger = init_logger(__name__)
@@ -73,12 +80,12 @@ def tensorizer_kwargs_arg(value):
         raise argparse.ArgumentTypeError(
             f"Not deserializable to dict: {value}. serialization_kwargs and "
             f"deserialization_kwargs must be "
-            f"deserializable from a JSON string to a dictionary. ")
+            f"deserializable from a JSON string to a dictionary. "
+        )
     return loaded
 
 
 class MetaTensorMode(TorchDispatchMode):
-
     def __torch_dispatch__(self, func, types, args=(), kwargs=None):
         kwargs = kwargs or {}
 
@@ -88,8 +95,9 @@ def __torch_dispatch__(self, func, types, args=(), kwargs=None):
         return func(*args, **kwargs)
 
 
-def meta_tensor_mode(loading_code=None, ):
-
+def meta_tensor_mode(
+    loading_code=None,
+):
     if loading_code is None:
         return _NoInitOrTensorImpl.context_manager()
     elif callable(loading_code):
@@ -99,15 +107,15 @@ def meta_tensor_mode(loading_code=None, ):
         raise TypeError(
             "expected a callable to evaluate,"
             " or None if being used as a context manager;"
-            f' got an object of type "{type(loading_code).__name__}" instead.')
+            f' got an object of type "{type(loading_code).__name__}" instead.'
+        )
 
 
 class _NoInitOrTensorImpl:
     _MODULES = (torch.nn.Linear, torch.nn.Embedding, torch.nn.LayerNorm)
     _MODULE_ORIGINALS = tuple((m, m.reset_parameters) for m in _MODULES)
 
-    is_active = contextvars.ContextVar("_NoInitOrTensorImpl.is_active",
-                                       default=False)
+    is_active = contextvars.ContextVar("_NoInitOrTensorImpl.is_active", default=False)
     _count_active: int = 0
     _count_active_lock = threading.Lock()
 
@@ -139,7 +147,6 @@ def context_manager(cls):
 
     @staticmethod
     def _disable(func):
-
         def wrapper(*args, **kwargs):
             if not _NoInitOrTensorImpl.is_active.get():
                 return func(*args, **kwargs)
@@ -162,10 +169,10 @@ class TensorizerConfig(MutableMapping):
     stream_kwargs: Optional[dict[str, Any]] = None
     serialization_kwargs: Optional[dict[str, Any]] = None
     deserialization_kwargs: Optional[dict[str, Any]] = None
-    _extra_serialization_attrs: Optional[dict[str, Any]] = field(init=False,
-                                                                 default=None)
-    model_class: Optional[type[torch.nn.Module]] = field(init=False,
-                                                         default=None)
+    _extra_serialization_attrs: Optional[dict[str, Any]] = field(
+        init=False, default=None
+    )
+    model_class: Optional[type[torch.nn.Module]] = field(init=False, default=None)
     hf_config: Optional[PretrainedConfig] = field(init=False, default=None)
     dtype: Optional[Union[str, torch.dtype]] = field(init=False, default=None)
     _is_sharded: bool = field(init=False, default=False)
@@ -220,19 +227,23 @@ class TensorizerConfig(MutableMapping):
 
     def __post_init__(self):
         # check if the configuration is for a sharded vLLM model
-        self._is_sharded = isinstance(self.tensorizer_uri, str) \
-            and re.search(r'%0\dd', self.tensorizer_uri) is not None
+        self._is_sharded = (
+            isinstance(self.tensorizer_uri, str)
+            and re.search(r"%0\dd", self.tensorizer_uri) is not None
+        )
 
         if self.tensorizer_dir and self.lora_dir:
             raise ValueError(
                 "Only one of tensorizer_dir or lora_dir may be specified. "
                 "Use lora_dir exclusively when serializing LoRA adapters, "
-                "and tensorizer_dir or tensorizer_uri otherwise.")
+                "and tensorizer_dir or tensorizer_uri otherwise."
+            )
         if self.tensorizer_dir and self.tensorizer_uri:
             logger.warning_once(
                 "Provided both tensorizer_dir and tensorizer_uri. "
                 "Inferring tensorizer_dir from tensorizer_uri as the "
-                "latter takes precedence.")
+                "latter takes precedence."
+            )
             self.tensorizer_dir = os.path.dirname(self.tensorizer_uri)
         if not self.tensorizer_uri:
             if self.lora_dir:
@@ -240,11 +251,13 @@ def __post_init__(self):
             elif self.tensorizer_dir:
                 self.tensorizer_uri = f"{self.tensorizer_dir}/model.tensors"
             else:
-                raise ValueError("Unable to resolve tensorizer_uri. "
-                                 "A valid tensorizer_uri or tensorizer_dir "
-                                 "must be provided for deserialization, and a "
-                                 "valid tensorizer_uri, tensorizer_uri, or "
-                                 "lora_dir for serialization.")
+                raise ValueError(
+                    "Unable to resolve tensorizer_uri. "
+                    "A valid tensorizer_uri or tensorizer_dir "
+                    "must be provided for deserialization, and a "
+                    "valid tensorizer_uri, tensorizer_uri, or "
+                    "lora_dir for serialization."
+                )
         else:
             self.tensorizer_dir = os.path.dirname(self.tensorizer_uri)
 
@@ -280,8 +293,12 @@ def to_serializable(self) -> dict[str, Any]:
 
         tc_dict = {}
         for k, v in raw_tc_dict.items():
-            if (k not in blacklisted and k not in tc_dict
-                    and not k.startswith("_") and v is not None):
+            if (
+                k not in blacklisted
+                and k not in tc_dict
+                and not k.startswith("_")
+                and v is not None
+            ):
                 tc_dict[k] = v
 
         return tc_dict
@@ -293,26 +310,25 @@ def verify_with_parallel_config(
         self,
         parallel_config: "ParallelConfig",
     ) -> None:
-        if parallel_config.tensor_parallel_size > 1 \
-            and not self._is_sharded:
+        if parallel_config.tensor_parallel_size > 1 and not self._is_sharded:
             raise ValueError(
                 "For a sharded model, tensorizer_uri should include a"
                 " string format template like '%04d' to be formatted"
-                " with the rank of the shard")
+                " with the rank of the shard"
+            )
 
     def verify_with_model_config(self, model_config: "ModelConfig") -> None:
-        if (model_config.quantization is not None
-                and self.tensorizer_uri is not None):
+        if model_config.quantization is not None and self.tensorizer_uri is not None:
             logger.warning(
                 "Loading a model using Tensorizer with quantization on vLLM"
-                " is unstable and may lead to errors.")
+                " is unstable and may lead to errors."
+            )
 
     def open_stream(self, tensorizer_args: Optional["TensorizerArgs"] = None):
         if tensorizer_args is None:
             tensorizer_args = self._construct_tensorizer_args()
 
-        return open_stream(self.tensorizer_uri,
-                           **tensorizer_args.stream_kwargs)
+        return open_stream(self.tensorizer_uri, **tensorizer_args.stream_kwargs)
 
     def keys(self):
         return self._keys
@@ -354,34 +370,36 @@ def __init__(self, tensorizer_config: TensorizerConfig):
         for k, v in tensorizer_config.items():
             setattr(self, k, v)
         self.file_obj = tensorizer_config.tensorizer_uri
-        self.s3_access_key_id = (tensorizer_config.s3_access_key_id
-                                 or envs.S3_ACCESS_KEY_ID)
-        self.s3_secret_access_key = (tensorizer_config.s3_secret_access_key
-                                     or envs.S3_SECRET_ACCESS_KEY)
+        self.s3_access_key_id = (
+            tensorizer_config.s3_access_key_id or envs.S3_ACCESS_KEY_ID
+        )
+        self.s3_secret_access_key = (
+            tensorizer_config.s3_secret_access_key or envs.S3_SECRET_ACCESS_KEY
+        )
         self.s3_endpoint = tensorizer_config.s3_endpoint or envs.S3_ENDPOINT_URL
 
         self.stream_kwargs = {
             "s3_access_key_id": tensorizer_config.s3_access_key_id,
             "s3_secret_access_key": tensorizer_config.s3_secret_access_key,
             "s3_endpoint": tensorizer_config.s3_endpoint,
-            **(tensorizer_config.stream_kwargs or {})
+            **(tensorizer_config.stream_kwargs or {}),
         }
 
         self.deserialization_kwargs = {
             "verify_hash": tensorizer_config.verify_hash,
             "encryption": tensorizer_config.encryption_keyfile,
             "num_readers": tensorizer_config.num_readers,
-            **(tensorizer_config.deserialization_kwargs or {})
+            **(tensorizer_config.deserialization_kwargs or {}),
         }
 
         if self.encryption_keyfile:
             with open_stream(
-                    tensorizer_config.encryption_keyfile,
-                    **self.stream_kwargs,
+                tensorizer_config.encryption_keyfile,
+                **self.stream_kwargs,
             ) as stream:
                 key = stream.read()
                 decryption_params = DecryptionParams.from_key(key)
-                self.deserialization_kwargs['encryption'] = decryption_params
+                self.deserialization_kwargs["encryption"] = decryption_params
 
     @staticmethod
     def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
@@ -389,17 +407,20 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
 
         # Tensorizer options arg group
         group = parser.add_argument_group(
-            'tensorizer options',
-            description=('Options for configuring the behavior of the'
-                         ' tensorizer deserializer when '
-                         'load_format=tensorizer is specified when '
-                         'initializing an LLMEngine, either via the CLI '
-                         'when running the vLLM OpenAI inference server '
-                         'with a JSON string passed to '
-                         '--model-loader-extra-config or as arguments given '
-                         'to TensorizerConfig when passed to '
-                         'model_loader_extra_config in the constructor '
-                         'for LLMEngine.'))
+            "tensorizer options",
+            description=(
+                "Options for configuring the behavior of the"
+                " tensorizer deserializer when "
+                "load_format=tensorizer is specified when "
+                "initializing an LLMEngine, either via the CLI "
+                "when running the vLLM OpenAI inference server "
+                "with a JSON string passed to "
+                "--model-loader-extra-config or as arguments given "
+                "to TensorizerConfig when passed to "
+                "model_loader_extra_config in the constructor "
+                "for LLMEngine."
+            ),
+        )
 
         group.add_argument(
             "--tensorizer-uri",
@@ -419,7 +440,8 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
             type=str,
             default=None,
             help="The file path to a binary file containing a binary key to "
-            "use for decryption. Can be a file path or S3 network URI.")
+            "use for decryption. Can be a file path or S3 network URI.",
+        )
         group.add_argument(
             "--num-readers",
             default=None,
@@ -427,7 +449,8 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
             help="Controls how many threads are allowed to read concurrently "
             "from the source file. Default is `None`, which will dynamically "
             "set the number of readers based on the available resources "
-            "and model size. This greatly increases performance.")
+            "and model size. This greatly increases performance.",
+        )
         group.add_argument(
             "--s3-access-key-id",
             type=str,
@@ -455,72 +478,81 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
     @classmethod
     def from_cli_args(cls, args: argparse.Namespace) -> "TensorizerArgs":
         attrs = [attr.name for attr in dataclasses.fields(cls)]
-        tensorizer_args = cls(**{
-            attr: getattr(args, attr)
-            for attr in attrs if hasattr(args, attr)
-        })
+        tensorizer_args = cls(
+            **{attr: getattr(args, attr) for attr in attrs if hasattr(args, attr)}
+        )
         return tensorizer_args
 
 
 def _check_tensors_on_meta_device(model: nn.Module) -> None:
     for tensor in model.state_dict().values():
-        if tensor.device.type == 'meta':
+        if tensor.device.type == "meta":
             raise ValueError(
                 "The serialized model contains tensors on the meta device,"
                 " indicating that some tensors were not loaded properly."
                 " Please check that the parameters of the model being"
                 " specified match that of the serialized model, such as"
-                " its quantization.")
+                " its quantization."
+            )
 
 
 def _resize_lora_embeddings(model: nn.Module):
     """Modify LoRA embedding layers to use bigger tensors
     to allow for adapter added tokens."""
     for child in model.modules():
-        if (isinstance(child, VocabParallelEmbedding) and child.weight.shape[0]
-                < child.num_embeddings_per_partition):
-            new_weight = torch.empty(child.num_embeddings_per_partition,
-                                     child.embedding_dim,
-                                     dtype=child.weight.dtype,
-                                     device=child.weight.device)
-            new_weight[:child.weight.shape[0]].copy_(child.weight.data)
-            new_weight[child.weight.shape[0]:].fill_(0)
+        if (
+            isinstance(child, VocabParallelEmbedding)
+            and child.weight.shape[0] < child.num_embeddings_per_partition
+        ):
+            new_weight = torch.empty(
+                child.num_embeddings_per_partition,
+                child.embedding_dim,
+                dtype=child.weight.dtype,
+                device=child.weight.device,
+            )
+            new_weight[: child.weight.shape[0]].copy_(child.weight.data)
+            new_weight[child.weight.shape[0] :].fill_(0)
             child.weight.data = new_weight
 
 
-def init_tensorizer_model(tensorizer_config: TensorizerConfig,
-                          vllm_config: VllmConfig) -> nn.Module:
+def init_tensorizer_model(
+    tensorizer_config: TensorizerConfig, vllm_config: VllmConfig
+) -> nn.Module:
     assert tensorizer_config.hf_config is not None
     model_args = tensorizer_config.hf_config
     model_args.torch_dtype = tensorizer_config.dtype
     assert tensorizer_config.model_class is not None
     # TODO: Do we need to consider old-style model class?
-    with meta_tensor_mode(), set_current_vllm_config(vllm_config,
-                                                     check_compile=True):
+    with meta_tensor_mode(), set_current_vllm_config(vllm_config, check_compile=True):
         return tensorizer_config.model_class(vllm_config=vllm_config)
 
 
-def deserialize_tensorizer_model(model: nn.Module,
-                                 tensorizer_config: TensorizerConfig) -> None:
+def deserialize_tensorizer_model(
+    model: nn.Module, tensorizer_config: TensorizerConfig
+) -> None:
     tensorizer_args = tensorizer_config._construct_tensorizer_args()
     if not is_valid_deserialization_uri(tensorizer_config.tensorizer_uri):
         raise ValueError(
             f"{tensorizer_config.tensorizer_uri} is not a valid "
             f"tensorizer URI. Please check that the URI is correct. "
             f"It must either point to a local existing file, or have a "
-            f"S3, HTTP or HTTPS scheme.")
+            f"S3, HTTP or HTTPS scheme."
+        )
     before_mem = get_mem_usage()
     start = time.perf_counter()
-    with open_stream(
-            tensorizer_config.tensorizer_uri,
-            mode="rb",
-            **tensorizer_args.stream_kwargs) as stream, TensorDeserializer(
-                stream,
-                dtype=tensorizer_config.dtype,
-                device=f'xpu:{torch.xpu.current_device()}'
-                if current_platform.is_xpu() else
-                f'cuda:{torch.cuda.current_device()}',
-                **tensorizer_args.deserialization_kwargs) as deserializer:
+    with (
+        open_stream(
+            tensorizer_config.tensorizer_uri, mode="rb", **tensorizer_args.stream_kwargs
+        ) as stream,
+        TensorDeserializer(
+            stream,
+            dtype=tensorizer_config.dtype,
+            device=f"xpu:{torch.xpu.current_device()}"
+            if current_platform.is_xpu()
+            else f"cuda:{torch.cuda.current_device()}",
+            **tensorizer_args.deserialization_kwargs,
+        ) as deserializer,
+    ):
         deserializer.load_into_module(model)
         end = time.perf_counter()
 
@@ -529,8 +561,9 @@ def deserialize_tensorizer_model(model: nn.Module,
     per_second = convert_bytes(deserializer.total_tensor_bytes / duration)
     after_mem = get_mem_usage()
     deserializer.close()
-    logger.info("Deserialized %s in %0.2fs, %s/s", total_bytes_str,
-                end - start, per_second)
+    logger.info(
+        "Deserialized %s in %0.2fs, %s/s", total_bytes_str, end - start, per_second
+    )
     logger.info("Memory usage before: %s", before_mem)
     logger.info("Memory usage after: %s", after_mem)
 
@@ -540,20 +573,21 @@ def deserialize_tensorizer_model(model: nn.Module,
 
 
 def tensorizer_weights_iterator(
-    tensorizer_args: "TensorizerArgs"
+    tensorizer_args: "TensorizerArgs",
 ) -> Generator[tuple[str, torch.Tensor], None, None]:
-    logger.warning("Deserializing HuggingFace models is not optimized for "
-                   "loading on vLLM, as tensorizer is forced to load to CPU. "
-                   "Consider deserializing a vLLM model instead for faster "
-                   "load times. See the "
-                   "examples/others/tensorize_vllm_model.py example script "
-                   "for serializing vLLM models.")
+    logger.warning(
+        "Deserializing HuggingFace models is not optimized for "
+        "loading on vLLM, as tensorizer is forced to load to CPU. "
+        "Consider deserializing a vLLM model instead for faster "
+        "load times. See the "
+        "examples/others/tensorize_vllm_model.py example script "
+        "for serializing vLLM models."
+    )
 
     deserializer_args = tensorizer_args.deserialization_kwargs
     stream_kwargs = tensorizer_args.stream_kwargs
     stream = open_stream(tensorizer_args.tensorizer_uri, **stream_kwargs)
-    with TensorDeserializer(stream, **deserializer_args,
-                            device="cpu") as state:
+    with TensorDeserializer(stream, **deserializer_args, device="cpu") as state:
         yield from state.items()
     del state
 
@@ -571,41 +605,54 @@ def is_vllm_tensorized(tensorizer_config: "TensorizerConfig") -> bool:
         bool: True if the model is a vLLM model, False otherwise.
     """
     tensorizer_args = tensorizer_config._construct_tensorizer_args()
-    deserializer = TensorDeserializer(open_stream(
-        tensorizer_args.tensorizer_uri, **tensorizer_args.stream_kwargs),
-                                      **tensorizer_args.deserialization_kwargs,
-                                      lazy_load=True)
+    deserializer = TensorDeserializer(
+        open_stream(tensorizer_args.tensorizer_uri, **tensorizer_args.stream_kwargs),
+        **tensorizer_args.deserialization_kwargs,
+        lazy_load=True,
+    )
     if tensorizer_config.vllm_tensorized:
         logger.warning(
             "Please note that newly serialized vLLM models are automatically "
             "inferred as vLLM models, so setting vllm_tensorized=True is "
-            "only necessary for models serialized prior to this change.")
+            "only necessary for models serialized prior to this change."
+        )
         return True
     return ".vllm_tensorized_marker" in deserializer
 
 
 def serialize_extra_artifacts(
-        tensorizer_args: TensorizerArgs,
-        served_model_name: Union[str, list[str], None]) -> None:
+    tensorizer_args: TensorizerArgs, served_model_name: Union[str, list[str], None]
+) -> None:
     if not isinstance(served_model_name, str):
         raise ValueError(
             f"served_model_name must be a str for serialize_extra_artifacts, "
-            f"not {type(served_model_name)}.")
+            f"not {type(served_model_name)}."
+        )
 
     with tempfile.TemporaryDirectory() as tmpdir:
-        snapshot_download(served_model_name,
-                          local_dir=tmpdir,
-                          ignore_patterns=[
-                              "*.pt", "*.safetensors", "*.bin", "*.cache",
-                              "*.gitattributes", "*.md"
-                          ])
+        snapshot_download(
+            served_model_name,
+            local_dir=tmpdir,
+            ignore_patterns=[
+                "*.pt",
+                "*.safetensors",
+                "*.bin",
+                "*.cache",
+                "*.gitattributes",
+                "*.md",
+            ],
+        )
         for artifact in os.scandir(tmpdir):
             if not artifact.is_file():
                 continue
-            with open(artifact.path, "rb") as f, open_stream(
+            with (
+                open(artifact.path, "rb") as f,
+                open_stream(
                     f"{tensorizer_args.tensorizer_dir}/{artifact.name}",
                     mode="wb+",
-                    **tensorizer_args.stream_kwargs) as stream:
+                    **tensorizer_args.stream_kwargs,
+                ) as stream,
+            ):
                 logger.info("Writing artifact %s", artifact.name)
                 stream.write(f.read())
 
@@ -617,7 +664,8 @@ def serialize_vllm_model(
 ) -> nn.Module:
     model.register_parameter(
         "vllm_tensorized_marker",
-        nn.Parameter(torch.tensor((1, ), device="meta"), requires_grad=False))
+        nn.Parameter(torch.tensor((1,), device="meta"), requires_grad=False),
+    )
 
     tensorizer_args = tensorizer_config._construct_tensorizer_args()
 
@@ -630,13 +678,17 @@ def serialize_vllm_model(
     output_file = tensorizer_args.tensorizer_uri
     if tensorizer_config._is_sharded:
         from vllm.distributed import get_tensor_model_parallel_rank
+
         output_file = output_file % get_tensor_model_parallel_rank()
 
-    with open_stream(output_file, mode="wb+",
-                     **tensorizer_args.stream_kwargs) as stream:
-        serializer = TensorSerializer(stream,
-                                      encryption=encryption_params,
-                                      **tensorizer_config.serialization_kwargs)
+    with open_stream(
+        output_file, mode="wb+", **tensorizer_args.stream_kwargs
+    ) as stream:
+        serializer = TensorSerializer(
+            stream,
+            encryption=encryption_params,
+            **tensorizer_config.serialization_kwargs,
+        )
         serializer.write_module(model)
         serializer.close()
 
@@ -646,29 +698,32 @@ def serialize_vllm_model(
     return model
 
 
-def tensorize_vllm_model(engine_args: "EngineArgs",
-                         tensorizer_config: TensorizerConfig,
-                         generate_keyfile: bool = True):
+def tensorize_vllm_model(
+    engine_args: "EngineArgs",
+    tensorizer_config: TensorizerConfig,
+    generate_keyfile: bool = True,
+):
     """Utility to load a model and then serialize it with Tensorizer
 
-       Intended to be used separately from running a vLLM server since it
-       creates its own Engine instance.
+    Intended to be used separately from running a vLLM server since it
+    creates its own Engine instance.
     """
     engine_config = engine_args.create_engine_config()
     tensorizer_config.verify_with_model_config(engine_config.model_config)
-    tensorizer_config.verify_with_parallel_config(
-        engine_config.parallel_config)
+    tensorizer_config.verify_with_parallel_config(engine_config.parallel_config)
 
     # generate the encryption key before creating the engine to support sharding
-    if generate_keyfile and (keyfile :=
-                             tensorizer_config.encryption_keyfile) is not None:
+    if (
+        generate_keyfile
+        and (keyfile := tensorizer_config.encryption_keyfile) is not None
+    ):
         encryption_params = EncryptionParams.random()
         with open_stream(
-                keyfile,
-                mode="wb+",
-                s3_access_key_id=tensorizer_config.s3_access_key_id,
-                s3_secret_access_key=tensorizer_config.s3_secret_access_key,
-                s3_endpoint=tensorizer_config.s3_endpoint,
+            keyfile,
+            mode="wb+",
+            s3_access_key_id=tensorizer_config.s3_access_key_id,
+            s3_secret_access_key=tensorizer_config.s3_secret_access_key,
+            s3_endpoint=tensorizer_config.s3_endpoint,
         ) as stream:
             stream.write(encryption_params.key)
 
@@ -683,8 +738,7 @@ def tensorize_vllm_model(engine_args: "EngineArgs",
     )
 
 
-def tensorize_lora_adapter(lora_path: str,
-                           tensorizer_config: TensorizerConfig):
+def tensorize_lora_adapter(lora_path: str, tensorizer_config: TensorizerConfig):
     """
     Uses tensorizer to serialize a LoRA adapter. Assumes that the files
     needed to load a LoRA adapter are a safetensors-format file called
@@ -720,19 +774,20 @@ def tensorize_lora_adapter(lora_path: str,
 
     tensorizer_args = tensorizer_config._construct_tensorizer_args()
 
-    with open_stream(f"{tensorizer_config.tensorizer_dir}/adapter_config.json",
-                     mode="wb+",
-                     **tensorizer_args.stream_kwargs) as f:
-
+    with open_stream(
+        f"{tensorizer_config.tensorizer_dir}/adapter_config.json",
+        mode="wb+",
+        **tensorizer_args.stream_kwargs,
+    ) as f:
         f.write(json.dumps(config).encode("utf-8"))
 
-    lora_uri = (f"{tensorizer_config.tensorizer_dir}"
-                f"/adapter_model.tensors")
-    with open_stream(lora_uri, mode="wb+",
-                     **tensorizer_args.stream_kwargs) as f:
+    lora_uri = f"{tensorizer_config.tensorizer_dir}/adapter_model.tensors"
+    with open_stream(lora_uri, mode="wb+", **tensorizer_args.stream_kwargs) as f:
         serializer = TensorSerializer(f)
         serializer.write_state_dict(tensors)
         serializer.close()
 
-    logger.info("Successfully serialized LoRA files to %s",
-                str(tensorizer_config.tensorizer_dir))
+    logger.info(
+        "Successfully serialized LoRA files to %s",
+        str(tensorizer_config.tensorizer_dir),
+    )
diff --git a/vllm/model_executor/model_loader/tensorizer_loader.py b/vllm/model_executor/model_loader/tensorizer_loader.py
index 65ea49c64294..5585a74f8926 100644
--- a/vllm/model_executor/model_loader/tensorizer_loader.py
+++ b/vllm/model_executor/model_loader/tensorizer_loader.py
@@ -13,11 +13,18 @@
 from vllm.logger import init_logger
 from vllm.model_executor.model_loader.base_loader import BaseModelLoader
 from vllm.model_executor.model_loader.tensorizer import (
-    TensorizerConfig, deserialize_tensorizer_model, init_tensorizer_model,
-    is_vllm_tensorized, serialize_vllm_model, tensorizer_weights_iterator)
-from vllm.model_executor.model_loader.utils import (get_model_architecture,
-                                                    initialize_model,
-                                                    set_default_torch_dtype)
+    TensorizerConfig,
+    deserialize_tensorizer_model,
+    init_tensorizer_model,
+    is_vllm_tensorized,
+    serialize_vllm_model,
+    tensorizer_weights_iterator,
+)
+from vllm.model_executor.model_loader.utils import (
+    get_model_architecture,
+    initialize_model,
+    set_default_torch_dtype,
+)
 
 logger = init_logger(__name__)
 
@@ -44,15 +51,18 @@ def __init__(self, load_config: LoadConfig):
         else:
             validate_config(load_config.model_loader_extra_config)
             self.tensorizer_config = TensorizerConfig(
-                **load_config.model_loader_extra_config["tensorizer_config"])
+                **load_config.model_loader_extra_config["tensorizer_config"]
+            )
 
-    def _verify_config(self, model_config: ModelConfig,
-                       parallel_config: ParallelConfig):
+    def _verify_config(
+        self, model_config: ModelConfig, parallel_config: ParallelConfig
+    ):
         self.tensorizer_config.verify_with_model_config(model_config)
         self.tensorizer_config.verify_with_parallel_config(parallel_config)
 
     def _get_weights_iterator(
-        self, ) -> Generator[tuple[str, torch.Tensor], None, None]:
+        self,
+    ) -> Generator[tuple[str, torch.Tensor], None, None]:
         tensorizer_args = self.tensorizer_config._construct_tensorizer_args()
         return tensorizer_weights_iterator(tensorizer_args)
 
@@ -82,8 +92,7 @@ def download_model(self, model_config: ModelConfig) -> None:
         with self.tensorizer_config.open_stream():
             pass
 
-    def _patch_tensorizer_config(
-            self, model_config: ModelConfig) -> TensorizerConfig:
+    def _patch_tensorizer_config(self, model_config: ModelConfig) -> TensorizerConfig:
         model_class = get_model_architecture(model_config)[0]
         tensorizer_config = copy.copy(self.tensorizer_config)
         tensorizer_config.model_class = model_class
@@ -91,8 +100,7 @@ def _patch_tensorizer_config(
         tensorizer_config.dtype = model_config.dtype
         return tensorizer_config
 
-    def load_weights(self, model: nn.Module,
-                     model_config: ModelConfig) -> None:
+    def load_weights(self, model: nn.Module, model_config: ModelConfig) -> None:
         """Load serialized model weights with tensorizer.
 
         Expects a vLLM-tensorized model. See the
@@ -104,8 +112,9 @@ def load_weights(self, model: nn.Module,
         else:
             model.load_weights(self._get_weights_iterator())
 
-    def load_model(self, vllm_config: VllmConfig,
-                   model_config: ModelConfig) -> nn.Module:
+    def load_model(
+        self, vllm_config: VllmConfig, model_config: ModelConfig
+    ) -> nn.Module:
         parallel_config = vllm_config.parallel_config
         self._verify_config(model_config, parallel_config)
 
@@ -113,8 +122,8 @@ def load_model(self, vllm_config: VllmConfig,
             from vllm.distributed import get_tensor_model_parallel_rank
 
             self.tensorizer_config.tensorizer_uri = (
-                self.tensorizer_config.tensorizer_uri %
-                get_tensor_model_parallel_rank())
+                self.tensorizer_config.tensorizer_uri % get_tensor_model_parallel_rank()
+            )
 
         if is_vllm_tensorized(self.tensorizer_config):
             tensorizer_config = self._patch_tensorizer_config(model_config)
@@ -122,8 +131,8 @@ def load_model(self, vllm_config: VllmConfig,
             with set_default_torch_dtype(model_config.dtype):
                 with torch.device(device_config.device):
                     model = init_tensorizer_model(
-                        tensorizer_config=tensorizer_config,
-                        vllm_config=vllm_config)
+                        tensorizer_config=tensorizer_config, vllm_config=vllm_config
+                    )
             self.load_weights(model, model_config)
             return model
         return self._load_model_serialized_cpu(vllm_config=vllm_config)
diff --git a/vllm/model_executor/model_loader/tpu.py b/vllm/model_executor/model_loader/tpu.py
index a70cdeb483e6..fc97003de8e3 100644
--- a/vllm/model_executor/model_loader/tpu.py
+++ b/vllm/model_executor/model_loader/tpu.py
@@ -13,7 +13,10 @@
 from vllm.logger import init_logger
 from vllm.model_executor.model_loader.default_loader import DefaultModelLoader
 from vllm.model_executor.model_loader.utils import (
-    initialize_model, process_weights_after_loading, set_default_torch_dtype)
+    initialize_model,
+    process_weights_after_loading,
+    set_default_torch_dtype,
+)
 
 logger = init_logger(__name__)
 
@@ -34,33 +37,31 @@ def load_model(
         self.counter_before_loading_weights = time.perf_counter()
         model_config = vllm_config.model_config
         assert model_config.quantization is None, "Quantization not supported"
-        target_device = torch.device('cpu')
+        target_device = torch.device("cpu")
         with set_default_torch_dtype(model_config.dtype):
             with target_device:
                 model = initialize_model(vllm_config=vllm_config)
 
             load_format = vllm_config.load_config.load_format
             if load_format != "dummy":
-                weights_to_load = {
-                    name
-                    for name, _ in model.named_parameters()
-                }
+                weights_to_load = {name for name, _ in model.named_parameters()}
                 all_weights = self.get_all_weights(model_config, model)
                 loaded_weights = model.load_weights(all_weights)
                 self.counter_after_loading_weights = time.perf_counter()
                 logger.info(
                     "Loading weights took %.2f seconds",
-                    self.counter_after_loading_weights -
-                    self.counter_before_loading_weights)
+                    self.counter_after_loading_weights
+                    - self.counter_before_loading_weights,
+                )
                 # We only enable strict check for non-quantized models
                 # that have loaded weights tracking currently.
-                if model_config.quantization is None and \
-                    loaded_weights is not None:
+                if model_config.quantization is None and loaded_weights is not None:
                     weights_not_loaded = weights_to_load - loaded_weights
                     if weights_not_loaded:
                         raise ValueError(
                             "Following weights were not initialized from "
-                            f"checkpoint: {weights_not_loaded}")
+                            f"checkpoint: {weights_not_loaded}"
+                        )
             else:
                 logger.info("Use dummy weight during weight loading.")
 
@@ -68,11 +69,13 @@ def load_model(
 
         counter_before_partition = time.perf_counter()
         model = model.eval()
-        model = model.to('xla')
+        model = model.to("xla")
         shard_model(model, mesh)
         counter_after_partition = time.perf_counter()
-        logger.info("Partition model took %.2f seconds",
-                    counter_after_partition - counter_before_partition)
+        logger.info(
+            "Partition model took %.2f seconds",
+            counter_after_partition - counter_before_partition,
+        )
 
         # Ensure the model is properly loaded.
         self._check_model_is_loaded(mesh, model)
@@ -82,12 +85,12 @@ def load_model(
         if not model_config.is_multimodal_model:
             model.model = torch.compile(model.model, backend="openxla")
         else:
-            model.language_model.model = \
-                torch.compile(model.language_model.model, backend="openxla")
+            model.language_model.model = torch.compile(
+                model.language_model.model, backend="openxla"
+            )
         return model
 
-    def _check_model_is_loaded(self, mesh: Optional[xs.Mesh],
-                               model: nn.Module) -> None:
+    def _check_model_is_loaded(self, mesh: Optional[xs.Mesh], model: nn.Module) -> None:
         """
         Ensure the model is properly loaded.
         1. All model parameters and buffers are on XLA device.
@@ -99,16 +102,18 @@ def _check_model_is_loaded(self, mesh: Optional[xs.Mesh],
         # Check parameters
         for name, param in model.named_parameters():
             assert param.device.type == device_type, (
-                f"Parameter {name} is on {param.device.type} "
-                f"instead of {device_type}")
+                f"Parameter {name} is on {param.device.type} instead of {device_type}"
+            )
 
         # Check buffers
         for name, buffer in model.named_buffers():
             assert buffer.device.type == device_type, (
-                f"Buffer {name} is on {buffer.device.type} "
-                f"instead of {device_type}")
+                f"Buffer {name} is on {buffer.device.type} instead of {device_type}"
+            )
 
         for module in model.modules():
-            if (mesh is not None) and (get_fqn(module) == 'QKVParallelLinear'):
-                raise AssertionError("QKVParallelLinear should be replaced by \
-                            XlaQKVParallelLinear under SPMD mode.")
+            if (mesh is not None) and (get_fqn(module) == "QKVParallelLinear"):
+                raise AssertionError(
+                    "QKVParallelLinear should be replaced by \
+                            XlaQKVParallelLinear under SPMD mode."
+                )
diff --git a/vllm/model_executor/model_loader/utils.py b/vllm/model_executor/model_loader/utils.py
index 293edadcc240..ba8d53c0ba14 100644
--- a/vllm/model_executor/model_loader/utils.py
+++ b/vllm/model_executor/model_loader/utils.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Utilities for selecting and loading models."""
+
 import contextlib
 import inspect
 import warnings
@@ -17,12 +18,16 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.linear import QKVCrossParallelLinear
 from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig, QuantizeMethodBase)
+    QuantizationConfig,
+    QuantizeMethodBase,
+)
 from vllm.model_executor.models.adapters import (
-    as_embedding_model, as_reward_model, as_seq_cls_model,
-    try_create_mm_pooling_model_cls)
-from vllm.model_executor.models.interfaces import (SupportsQuant,
-                                                   supports_multimodal)
+    as_embedding_model,
+    as_reward_model,
+    as_seq_cls_model,
+    try_create_mm_pooling_model_cls,
+)
+from vllm.model_executor.models.interfaces import SupportsQuant, supports_multimodal
 from vllm.utils import is_pin_memory_available
 
 logger = init_logger(__name__)
@@ -57,16 +62,16 @@ def initialize_model(
     all_params = [param.name for param in signatures.parameters.values()]
     if "vllm_config" in all_params and "prefix" in all_params:
         # new-style model class
-        with set_current_vllm_config(vllm_config,
-                                     check_compile=True,
-                                     prefix=prefix):
+        with set_current_vllm_config(vllm_config, check_compile=True, prefix=prefix):
             return model_class(vllm_config=vllm_config, prefix=prefix)
 
-    msg = ("vLLM model class should accept `vllm_config` and `prefix` as "
-           "input arguments. Possibly you have an old-style model class"
-           " registered from out of tree and it is used for new vLLM version. "
-           "Check https://docs.vllm.ai/en/latest/design/arch_overview.html "
-           "for the design and update the model class accordingly.")
+    msg = (
+        "vLLM model class should accept `vllm_config` and `prefix` as "
+        "input arguments. Possibly you have an old-style model class"
+        " registered from out of tree and it is used for new vLLM version. "
+        "Check https://docs.vllm.ai/en/latest/design/arch_overview.html "
+        "for the design and update the model class accordingly."
+    )
     warnings.warn(msg, DeprecationWarning, stacklevel=2)
 
     logger.warning(
@@ -87,20 +92,19 @@ def initialize_model(
         kwargs["lora_config"] = vllm_config.lora_config
     if "scheduler_config" in all_params:
         kwargs["scheduler_config"] = vllm_config.scheduler_config
-    with set_current_vllm_config(vllm_config,
-                                 check_compile=True,
-                                 prefix=prefix):
+    with set_current_vllm_config(vllm_config, check_compile=True, prefix=prefix):
         return model_class(**kwargs)
 
 
-def process_weights_after_loading(model: nn.Module, model_config: ModelConfig,
-                                  target_device: torch.device) -> None:
-
+def process_weights_after_loading(
+    model: nn.Module, model_config: ModelConfig, target_device: torch.device
+) -> None:
     # to avoid circular dependency
     from vllm.model_executor.model_loader.online_quantization import (
-        maybe_save_metadata_and_attributes_for_weight_reloading)
-    maybe_save_metadata_and_attributes_for_weight_reloading(
-        model, model_config)
+        maybe_save_metadata_and_attributes_for_weight_reloading,
+    )
+
+    maybe_save_metadata_and_attributes_for_weight_reloading(model, model_config)
 
     for _, module in model.named_modules():
         if isinstance(module, QKVCrossParallelLinear):
@@ -122,16 +126,16 @@ def process_weights_after_loading(model: nn.Module, model_config: ModelConfig,
     # NOTE: This intentionally happens after other modules so we can easily
     # decompress the weights for MLA.
     for _, module in model.named_modules():
-        if isinstance(module, Attention) and \
-            hasattr(module, "process_weights_after_loading"):
+        if isinstance(module, Attention) and hasattr(
+            module, "process_weights_after_loading"
+        ):
             # TODO(lucas): see if there is a way to unify the signatures
             # of process_weights_after_loading
             module.process_weights_after_loading(model_config.dtype)
 
 
 @contextmanager
-def device_loading_context(module: torch.nn.Module,
-                           target_device: torch.device):
+def device_loading_context(module: torch.nn.Module, target_device: torch.device):
     if target_device.type == "cpu":
         # If target is CPU, no need to move anything
         yield module
@@ -176,8 +180,7 @@ def device_loading_context(module: torch.nn.Module,
 """Caches the outputs of `_get_model_architecture`."""
 
 
-def _get_model_architecture(
-        model_config: ModelConfig) -> tuple[type[nn.Module], str]:
+def _get_model_architecture(model_config: ModelConfig) -> tuple[type[nn.Module], str]:
     architectures = getattr(model_config.hf_config, "architectures", [])
 
     model_cls, arch = model_config.registry.resolve_model_cls(
@@ -191,7 +194,9 @@ def _get_model_architecture(
             logger.warning_once(
                 "%s has no vLLM implementation, falling back to Transformers "
                 "implementation. Some features may not be supported and "
-                "performance may not be optimal.", arch)
+                "performance may not be optimal.",
+                arch,
+            )
 
     convert_type = model_config.convert_type
     if convert_type != "none" and supports_multimodal(model_cls):
@@ -220,16 +225,17 @@ def _get_model_architecture(
     return model_cls, arch
 
 
-def get_model_architecture(
-        model_config: ModelConfig) -> tuple[type[nn.Module], str]:
-    key = hash((
-        model_config.model,
-        model_config.convert_type,
-        model_config.runner_type,
-        model_config.trust_remote_code,
-        model_config.model_impl,
-        tuple(getattr(model_config.hf_config, "architectures", [])),
-    ))
+def get_model_architecture(model_config: ModelConfig) -> tuple[type[nn.Module], str]:
+    key = hash(
+        (
+            model_config.model,
+            model_config.convert_type,
+            model_config.runner_type,
+            model_config.trust_remote_code,
+            model_config.model_impl,
+            tuple(getattr(model_config.hf_config, "architectures", [])),
+        )
+    )
     if key in _MODEL_ARCH_BY_HASH:
         return _MODEL_ARCH_BY_HASH[key]
 
@@ -253,9 +259,9 @@ class ParamMapping:
     It creates a bidirectional mapping between packed parameters and their
     constituent parts.
     """
+
     packed_mapping: dict[str, list[str]]
-    inverse_packed_mapping: dict[str, tuple[str,
-                                            int]] = field(default_factory=dict)
+    inverse_packed_mapping: dict[str, tuple[str, int]] = field(default_factory=dict)
 
     def __post_init__(self):
         for packed_name, sub_params in self.packed_mapping.items():
@@ -268,16 +274,16 @@ def __post_init__(self):
                     index,
                 )
 
-    def get_sub_modules(self,
-                        module_name: str) -> Optional[tuple[str, list[str]]]:
+    def get_sub_modules(self, module_name: str) -> Optional[tuple[str, list[str]]]:
         for key, value in self.packed_mapping.items():
             if module_name.endswith(key):
                 return key, value
         return None
 
 
-def configure_quant_config(quant_config: QuantizationConfig,
-                           model_class: type[nn.Module]):
+def configure_quant_config(
+    quant_config: QuantizationConfig, model_class: type[nn.Module]
+):
     """
     Pass packed_modules_mapping by reference to quant_config so that
     quant_config can properly match fused modules
diff --git a/vllm/model_executor/model_loader/weight_utils.py b/vllm/model_executor/model_loader/weight_utils.py
index 6c5f7bbcc8aa..c40185c1c084 100644
--- a/vllm/model_executor/model_loader/weight_utils.py
+++ b/vllm/model_executor/model_loader/weight_utils.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Utilities for downloading and initializing model weights."""
+
 import concurrent.futures
 import fnmatch
 import glob
@@ -28,18 +29,18 @@
 from vllm.config.load import LoadConfig
 from vllm.distributed import get_tensor_model_parallel_rank
 from vllm.logger import init_logger
-from vllm.model_executor.layers.quantization import (QuantizationConfig,
-                                                     get_quantization_config)
+from vllm.model_executor.layers.quantization import (
+    QuantizationConfig,
+    get_quantization_config,
+)
 from vllm.platforms import current_platform
 from vllm.utils import PlaceholderModule
 
 try:
     from runai_model_streamer import SafetensorsStreamer
 except ImportError:
-    runai_model_streamer = PlaceholderModule(
-        "runai_model_streamer")  # type: ignore[assignment]
-    SafetensorsStreamer = runai_model_streamer.placeholder_attr(
-        "SafetensorsStreamer")
+    runai_model_streamer = PlaceholderModule("runai_model_streamer")  # type: ignore[assignment]
+    SafetensorsStreamer = runai_model_streamer.placeholder_attr("SafetensorsStreamer")
 
 try:
     import gguf
@@ -50,8 +51,7 @@
     from fastsafetensors import SafeTensorsFileLoader, SingleGroup
 except ImportError:
     fastsafetensors = PlaceholderModule("fastsafetensors")
-    SafeTensorsFileLoader = fastsafetensors.placeholder_attr(
-        "SafeTensorsFileLoader")
+    SafeTensorsFileLoader = fastsafetensors.placeholder_attr("SafeTensorsFileLoader")
     SingleGroup = fastsafetensors.placeholder_attr("SingleGroup")
 
 logger = init_logger(__name__)
@@ -64,12 +64,12 @@
 
 
 def enable_hf_transfer():
-    """automatically activates hf_transfer
-    """
+    """automatically activates hf_transfer"""
     if "HF_HUB_ENABLE_HF_TRANSFER" not in os.environ:
         try:
             # enable hf hub transfer if available
             import hf_transfer  # type: ignore # noqa
+
             huggingface_hub.constants.HF_HUB_ENABLE_HF_TRANSFER = True
         except ImportError:
             pass
@@ -79,13 +79,11 @@ def enable_hf_transfer():
 
 
 class DisabledTqdm(tqdm):
-
     def __init__(self, *args, **kwargs):
         super().__init__(*args, **kwargs, disable=True)
 
 
-def get_lock(model_name_or_path: Union[str, Path],
-             cache_dir: Optional[str] = None):
+def get_lock(model_name_or_path: Union[str, Path], cache_dir: Optional[str] = None):
     lock_dir = cache_dir or temp_dir
     model_name_or_path = str(model_name_or_path)
     os.makedirs(os.path.dirname(lock_dir), exist_ok=True)
@@ -94,15 +92,14 @@ def get_lock(model_name_or_path: Union[str, Path],
     # add hash to avoid conflict with old users' lock files
     lock_file_name = hash_name + model_name + ".lock"
     # mode 0o666 is required for the filelock to be shared across users
-    lock = filelock.FileLock(os.path.join(lock_dir, lock_file_name),
-                             mode=0o666)
+    lock = filelock.FileLock(os.path.join(lock_dir, lock_file_name), mode=0o666)
     return lock
 
 
 @contextmanager
-def atomic_writer(filepath: Union[str, Path],
-                  mode: str = 'w',
-                  encoding: Optional[str] = None) -> Generator[IO]:
+def atomic_writer(
+    filepath: Union[str, Path], mode: str = "w", encoding: Optional[str] = None
+) -> Generator[IO]:
     """
     Context manager that provides an atomic file writing routine.
 
@@ -133,8 +130,8 @@ def atomic_writer(filepath: Union[str, Path],
 
     except Exception:
         logger.exception(
-            "Error during atomic write. Original file '%s' not modified",
-            filepath)
+            "Error during atomic write. Original file '%s' not modified", filepath
+        )
         raise
     finally:
         # Clean up the temporary file if it still exists.
@@ -143,16 +140,16 @@ def atomic_writer(filepath: Union[str, Path],
 
 
 def maybe_download_from_modelscope(
-        model: str,
-        revision: Optional[str] = None,
-        download_dir: Optional[str] = None,
-        ignore_patterns: Optional[Union[str, list[str]]] = None,
-        allow_patterns: Optional[Union[list[str],
-                                       str]] = None) -> Optional[str]:
+    model: str,
+    revision: Optional[str] = None,
+    download_dir: Optional[str] = None,
+    ignore_patterns: Optional[Union[str, list[str]]] = None,
+    allow_patterns: Optional[Union[list[str], str]] = None,
+) -> Optional[str]:
     """Download model from ModelScope hub if VLLM_USE_MODELSCOPE is True.
 
-        Returns the path to the downloaded model, or None if the model is not
-        downloaded from ModelScope."""
+    Returns the path to the downloaded model, or None if the model is not
+    downloaded from ModelScope."""
     if envs.VLLM_USE_MODELSCOPE:
         # download model from ModelScope hub,
         # lazy import so that modelscope is not required for normal use.
@@ -226,9 +223,9 @@ def convert_bin_to_safetensor_file(
 
 
 # TODO(woosuk): Move this to other place.
-def get_quant_config(model_config: ModelConfig,
-                     load_config: LoadConfig) -> QuantizationConfig:
-
+def get_quant_config(
+    model_config: ModelConfig, load_config: LoadConfig
+) -> QuantizationConfig:
     quant_cls = get_quantization_config(model_config.quantization)
 
     # GGUF doesn't have config file
@@ -236,16 +233,14 @@ def get_quant_config(model_config: ModelConfig,
         return quant_cls()
 
     # Read the quantization config from the HF model config, if available.
-    hf_quant_config = getattr(model_config.hf_config, "quantization_config",
-                              None)
+    hf_quant_config = getattr(model_config.hf_config, "quantization_config", None)
     # some vision model may keep quantization_config in their text_config
     hf_text_config = getattr(model_config.hf_config, "text_config", None)
     if hf_quant_config is None and hf_text_config is not None:
         hf_quant_config = getattr(hf_text_config, "quantization_config", None)
     if hf_quant_config is None:
         # compressed-tensors uses a compressions_config
-        hf_quant_config = getattr(model_config.hf_config, "compression_config",
-                                  None)
+        hf_quant_config = getattr(model_config.hf_config, "compression_config", None)
 
     if hf_quant_config is not None:
         return quant_cls.from_config(hf_quant_config)
@@ -253,8 +248,7 @@ def get_quant_config(model_config: ModelConfig,
     # if hf_quant_config is None, we will try to get config from
     # hf_overrides
     hf_overrides = model_config.hf_overrides
-    quantization_config_file = hf_overrides.get("quantization_config_file",
-                                                None)
+    quantization_config_file = hf_overrides.get("quantization_config_file", None)
     if quantization_config_file is not None:
         if hasattr(quant_cls, "from_config_file"):
             return quant_cls.from_config_file(quantization_config_file)
@@ -262,9 +256,9 @@ def get_quant_config(model_config: ModelConfig,
             raise NotImplementedError(
                 "from_config_file is specified in hf_override config, "
                 "but quant_cls.from_config_file is not implemented in "
-                f"{quant_cls}")
-    quantization_config_json = hf_overrides.get(
-        "quantization_config_dict_json", None)
+                f"{quant_cls}"
+            )
+    quantization_config_json = hf_overrides.get("quantization_config_dict_json", None)
     if quantization_config_json is not None:
         if hasattr(quant_cls, "from_config_dict_json"):
             return quant_cls.from_config_dict_json(quantization_config_json)
@@ -272,17 +266,21 @@ def get_quant_config(model_config: ModelConfig,
             raise NotImplementedError(
                 "from_config_dict_json is specified in hf_override config, "
                 "but quant_cls.from_config_dict_json is not implemented in "
-                f"{quant_cls}")
+                f"{quant_cls}"
+            )
 
     # Inflight BNB quantization
     if model_config.quantization == "bitsandbytes":
         return quant_cls.from_config({})
-    model_name_or_path = maybe_download_from_modelscope(
-        model_config.model,
-        revision=model_config.revision,
-        download_dir=load_config.download_dir,
-        allow_patterns=["*.json"],
-    ) or model_config.model
+    model_name_or_path = (
+        maybe_download_from_modelscope(
+            model_config.model,
+            revision=model_config.revision,
+            download_dir=load_config.download_dir,
+            allow_patterns=["*.json"],
+        )
+        or model_config.model
+    )
     is_local = os.path.isdir(model_name_or_path)
     if not is_local:
         # Download the config files.
@@ -307,16 +305,15 @@ def get_quant_config(model_config: ModelConfig,
     config_files = glob.glob(os.path.join(hf_folder, "*.json"))
 
     quant_config_files = [
-        f for f in config_files if any(
-            f.endswith(x) for x in possible_config_filenames)
+        f for f in config_files if any(f.endswith(x) for x in possible_config_filenames)
     ]
     if len(quant_config_files) == 0:
-        raise ValueError(
-            f"Cannot find the config file for {model_config.quantization}")
+        raise ValueError(f"Cannot find the config file for {model_config.quantization}")
     if len(quant_config_files) > 1:
         raise ValueError(
             f"Found multiple config files for {model_config.quantization}: "
-            f"{quant_config_files}")
+            f"{quant_config_files}"
+        )
 
     quant_config_file = quant_config_files[0]
     with open(quant_config_file) as f:
@@ -330,7 +327,8 @@ def get_quant_config(model_config: ModelConfig,
             else:
                 raise ValueError(
                     f"Unsupported quantization config"
-                    f" found for {model_config.quantization} in {f}.")
+                    f" found for {model_config.quantization} in {f}."
+                )
 
     return quant_cls.from_config(config)
 
@@ -399,9 +397,7 @@ def download_weights_from_hf(
         # so we only have to call snapshot_download once.
         try:
             fs = HfFileSystem()
-            file_list = fs.ls(model_name_or_path,
-                              detail=False,
-                              revision=revision)
+            file_list = fs.ls(model_name_or_path, detail=False, revision=revision)
 
             # Use the first pattern found in the HF repo's files.
             for pattern in allow_patterns:
@@ -413,7 +409,10 @@ def download_weights_from_hf(
             logger.warning(
                 "Failed to get file list for '%s'. Trying each pattern in "
                 "allow_patterns individually until weights have been "
-                "downloaded. Error: %s", model_name_or_path, e)
+                "downloaded. Error: %s",
+                model_name_or_path,
+                e,
+            )
 
     logger.info("Using model weights format %s", allow_patterns)
     # Use file lock to prevent multiple processes from
@@ -436,8 +435,11 @@ def download_weights_from_hf(
                 break
         time_taken = time.perf_counter() - start_time
         if time_taken > 0.5:
-            logger.info("Time spent downloading weights for %s: %.6f seconds",
-                        model_name_or_path, time_taken)
+            logger.info(
+                "Time spent downloading weights for %s: %.6f seconds",
+                model_name_or_path,
+                time_taken,
+            )
     return hf_folder
 
 
@@ -481,9 +483,9 @@ def download_safetensors_index_file_from_hf(
 # Passing both of these to the weight loader functionality breaks.
 # So, we use the index_file to
 # look up which safetensors files should be used.
-def filter_duplicate_safetensors_files(hf_weights_files: list[str],
-                                       hf_folder: str,
-                                       index_file: str) -> list[str]:
+def filter_duplicate_safetensors_files(
+    hf_weights_files: list[str], hf_folder: str, index_file: str
+) -> list[str]:
     # model.safetensors.index.json is a mapping from keys in the
     # torch state_dict to safetensors file holding that weight.
     index_file_name = os.path.join(hf_folder, index_file)
@@ -496,17 +498,13 @@ def filter_duplicate_safetensors_files(hf_weights_files: list[str],
         weight_map = json.load(f)["weight_map"]
     weight_files_in_index = set()
     for weight_name in weight_map:
-        weight_files_in_index.add(
-            os.path.join(hf_folder, weight_map[weight_name]))
+        weight_files_in_index.add(os.path.join(hf_folder, weight_map[weight_name]))
     # Filter out any fields that are not found in the index file.
-    hf_weights_files = [
-        f for f in hf_weights_files if f in weight_files_in_index
-    ]
+    hf_weights_files = [f for f in hf_weights_files if f in weight_files_in_index]
     return hf_weights_files
 
 
-def filter_files_not_needed_for_inference(
-        hf_weights_files: list[str]) -> list[str]:
+def filter_files_not_needed_for_inference(hf_weights_files: list[str]) -> list[str]:
     """
     Exclude files that are not needed for inference.
 
@@ -520,8 +518,7 @@ def filter_files_not_needed_for_inference(
         "scaler.pt",
     ]
     hf_weights_files = [
-        f for f in hf_weights_files
-        if not any(f.endswith(x) for x in blacklist)
+        f for f in hf_weights_files if not any(f.endswith(x) for x in blacklist)
     ]
     return hf_weights_files
 
@@ -534,8 +531,9 @@ def filter_files_not_needed_for_inference(
 
 
 def enable_tqdm(use_tqdm_on_load: bool):
-    return use_tqdm_on_load and (not torch.distributed.is_initialized()
-                                 or torch.distributed.get_rank() == 0)
+    return use_tqdm_on_load and (
+        not torch.distributed.is_initialized() or torch.distributed.get_rank() == 0
+    )
 
 
 def np_cache_weights_iterator(
@@ -560,14 +558,12 @@ def np_cache_weights_iterator(
         if not os.path.exists(weight_names_file):
             weight_names: list[str] = []
             for bin_file in tqdm(
-                    hf_weights_files,
-                    desc="Loading np_cache checkpoint shards",
-                    disable=not enable_tqdm(use_tqdm_on_load),
-                    bar_format=_BAR_FORMAT,
+                hf_weights_files,
+                desc="Loading np_cache checkpoint shards",
+                disable=not enable_tqdm(use_tqdm_on_load),
+                bar_format=_BAR_FORMAT,
             ):
-                state = torch.load(bin_file,
-                                   map_location="cpu",
-                                   weights_only=True)
+                state = torch.load(bin_file, map_location="cpu", weights_only=True)
                 for name, param in state.items():
                     param_path = os.path.join(np_folder, name)
                     with open(param_path, "wb") as f:
@@ -597,10 +593,10 @@ def safetensors_weights_iterator(
         loading_desc += " (eager)"
 
     for st_file in tqdm(
-            hf_weights_files,
-            desc=loading_desc,
-            disable=not enable_tqdm(use_tqdm_on_load),
-            bar_format=_BAR_FORMAT,
+        hf_weights_files,
+        desc=loading_desc,
+        disable=not enable_tqdm(use_tqdm_on_load),
+        bar_format=_BAR_FORMAT,
     ):
         if safetensors_load_strategy == "eager":
             with open(st_file, "rb") as f:
@@ -624,12 +620,8 @@ def _load_file(st_file: str):
         result = load_file(st_file, device="cpu")
         return result
 
-    with concurrent.futures.ThreadPoolExecutor(
-            max_workers=max_workers) as executor:
-        futures = [
-            executor.submit(_load_file, st_file)
-            for st_file in hf_weights_files
-        ]
+    with concurrent.futures.ThreadPoolExecutor(max_workers=max_workers) as executor:
+        futures = [executor.submit(_load_file, st_file) for st_file in hf_weights_files]
         futures_iter = tqdm(
             concurrent.futures.as_completed(futures),
             total=len(hf_weights_files),
@@ -652,7 +644,8 @@ def runai_safetensors_weights_iterator(
         streamer.stream_files(hf_weights_files)
         total_tensors = sum(
             len(tensors_meta)
-            for tensors_meta in streamer.files_to_tensors_metadata.values())
+            for tensors_meta in streamer.files_to_tensors_metadata.values()
+        )
 
         tensor_iter = tqdm(
             streamer.get_tensors(),
@@ -689,19 +682,19 @@ def fastsafetensors_weights_iterator(
     else:
         pg = SingleGroup()
 
-    device = torch.device(f'cuda:{pg.rank()}')
+    device = torch.device(f"cuda:{pg.rank()}")
     weight_files_sub_lists = [
-        hf_weights_files[i:i + pg.size()]
+        hf_weights_files[i : i + pg.size()]
         for i in range(0, len(hf_weights_files), pg.size())
     ]
 
     nogds = False
 
     for f_list in tqdm(
-            weight_files_sub_lists,
-            desc="Loading safetensors using Fastsafetensor loader",
-            disable=not enable_tqdm(use_tqdm_on_load),
-            bar_format=_BAR_FORMAT,
+        weight_files_sub_lists,
+        desc="Loading safetensors using Fastsafetensor loader",
+        disable=not enable_tqdm(use_tqdm_on_load),
+        bar_format=_BAR_FORMAT,
     ):
         loader = _init_loader(pg, device, f_list, nogds=nogds)
         try:
@@ -738,14 +731,14 @@ def pt_weights_iterator(
 ) -> Generator[tuple[str, torch.Tensor], None, None]:
     """Iterate over the weights in the model bin/pt files."""
     for bin_file in tqdm(
-            hf_weights_files,
-            desc="Loading pt checkpoint shards",
-            disable=not enable_tqdm(use_tqdm_on_load),
-            bar_format=_BAR_FORMAT,
+        hf_weights_files,
+        desc="Loading pt checkpoint shards",
+        disable=not enable_tqdm(use_tqdm_on_load),
+        bar_format=_BAR_FORMAT,
     ):
-        state = torch.load(bin_file,
-                           map_location=pt_load_map_location,
-                           weights_only=True)
+        state = torch.load(
+            bin_file, map_location=pt_load_map_location, weights_only=True
+        )
         yield from state.items()
         del state
 
@@ -759,15 +752,13 @@ def multi_thread_pt_weights_iterator(
     """Multi-Thread iterate over the weights in the model bin/pt files."""
 
     def _load_file(bin_file: str):
-        return torch.load(bin_file,
-                          map_location=pt_load_map_location,
-                          weights_only=True)
+        return torch.load(
+            bin_file, map_location=pt_load_map_location, weights_only=True
+        )
 
-    with concurrent.futures.ThreadPoolExecutor(
-            max_workers=max_workers) as executor:
+    with concurrent.futures.ThreadPoolExecutor(max_workers=max_workers) as executor:
         futures = [
-            executor.submit(_load_file, bin_file)
-            for bin_file in hf_weights_files
+            executor.submit(_load_file, bin_file) for bin_file in hf_weights_files
         ]
         futures_iter = tqdm(
             concurrent.futures.as_completed(futures),
@@ -784,7 +775,8 @@ def _load_file(bin_file: str):
 
 
 def get_gguf_extra_tensor_names(
-        gguf_file: str, gguf_to_hf_name_map: dict[str, str]) -> list[str]:
+    gguf_file: str, gguf_to_hf_name_map: dict[str, str]
+) -> list[str]:
     reader = gguf.GGUFReader(gguf_file)
     expected_gguf_keys = set(gguf_to_hf_name_map.keys())
     exact_gguf_keys = set([tensor.name for tensor in reader.tensors])
@@ -793,14 +785,16 @@ def get_gguf_extra_tensor_names(
 
 
 def get_gguf_weight_type_map(
-        gguf_file: str, gguf_to_hf_name_map: dict[str, str]) -> dict[str, str]:
+    gguf_file: str, gguf_to_hf_name_map: dict[str, str]
+) -> dict[str, str]:
     """
     Return GGUF mapped weight's name and its quant type
     """
     reader = gguf.GGUFReader(gguf_file)
     return {
         gguf_to_hf_name_map[tensor.name]: tensor.tensor_type.name
-        for tensor in reader.tensors if tensor.name in gguf_to_hf_name_map
+        for tensor in reader.tensors
+        if tensor.name in gguf_to_hf_name_map
     }
 
 
@@ -850,8 +844,7 @@ def convert_pyslice_to_tensor(x: Any) -> torch.Tensor:
     return x
 
 
-def default_weight_loader(param: torch.Tensor,
-                          loaded_weight: torch.Tensor) -> None:
+def default_weight_loader(param: torch.Tensor, loaded_weight: torch.Tensor) -> None:
     """Default weight loader."""
     try:
         if param.numel() == 1 and loaded_weight.numel() == 1:
@@ -862,7 +855,8 @@ def default_weight_loader(param: torch.Tensor,
         else:
             assert param.size() == loaded_weight.size(), (
                 f"Attempted to load weight ({loaded_weight.size()}) "
-                f"into parameter ({param.size()})")
+                f"into parameter ({param.size()})"
+            )
 
             param.data.copy_(loaded_weight)
     except Exception:
@@ -871,8 +865,9 @@ def default_weight_loader(param: torch.Tensor,
         raise
 
 
-def row_parallel_weight_loader(param: torch.Tensor,
-                               loaded_weight: torch.Tensor) -> None:
+def row_parallel_weight_loader(
+    param: torch.Tensor, loaded_weight: torch.Tensor
+) -> None:
     """Load weights that are row-parallelized."""
     tp_rank = get_tensor_model_parallel_rank()
     shard_dim = 0 if param.dim() != 1 else None
@@ -904,12 +899,11 @@ def loader(param: torch.Tensor, loaded_weight: torch.Tensor) -> None:
 
 
 def composed_weight_loader(
-        loader: LoaderFunction, fn: Callable[[torch.Tensor],
-                                             torch.Tensor]) -> LoaderFunction:
+    loader: LoaderFunction, fn: Callable[[torch.Tensor], torch.Tensor]
+) -> LoaderFunction:
     """Create a weight loader that post-processes the weights after loading"""
 
-    def composed_loader(param: torch.Tensor,
-                        loaded_weight: torch.Tensor) -> None:
+    def composed_loader(param: torch.Tensor, loaded_weight: torch.Tensor) -> None:
         loader(param, loaded_weight)
         param.data.copy_(fn(param))
         return
@@ -945,13 +939,18 @@ def initialize_dummy_weights(
                 # from a CPU tensor.
                 # Note: We avoid using torch.rank_like as it doesn't currently
                 # support the generator argument.
-                param.copy_((high - low) *
-                            torch.rand(param.shape,
-                                       generator=generator,
-                                       dtype=param.dtype,
-                                       layout=param.layout,
-                                       requires_grad=param.requires_grad,
-                                       device="cpu") + low)
+                param.copy_(
+                    (high - low)
+                    * torch.rand(
+                        param.shape,
+                        generator=generator,
+                        dtype=param.dtype,
+                        layout=param.layout,
+                        requires_grad=param.requires_grad,
+                        device="cpu",
+                    )
+                    + low
+                )
                 torch._sync(param)
                 continue
 
@@ -961,8 +960,7 @@ def initialize_dummy_weights(
                 # uniform_ doesn't support < 16-bit datatypes (FP8)
                 dtype = param.data.dtype
                 tmp_param = param.data.to(torch.float16)
-                tmp_param = tmp_param.uniform_(low, high,
-                                               generator=generator).to(dtype)
+                tmp_param = tmp_param.uniform_(low, high, generator=generator).to(dtype)
                 param.data.copy_(tmp_param)
             else:
                 param.uniform_(low, high, generator=generator)
@@ -991,7 +989,8 @@ def maybe_remap_kv_scale_name(name: str, params_dict: dict) -> Optional[str]:
             "This format is deprecated in favor of separate k_scale and "
             "v_scale tensors and will be removed in a future release. "
             "Functionally, we will remap kv_scale to k_scale and duplicate "
-            "k_scale to v_scale")
+            "k_scale to v_scale"
+        )
         # NOTE: we remap the deprecated kv_scale to k_scale
         remapped_name = name.replace(".kv_scale", ".attn.k_scale")
         if remapped_name not in params_dict:
@@ -1005,23 +1004,26 @@ def maybe_remap_kv_scale_name(name: str, params_dict: dict) -> Optional[str]:
 
     if any("mla_attn" in key for key in params_dict):
         attn_str = "mla_attn.mla_attn"
-        logger.debug_once(f"Found mla_attn with k_scale and v_scale in "
-                          f"the checkpoint, using {attn_str} as attn_str")
+        logger.debug_once(
+            f"Found mla_attn with k_scale and v_scale in "
+            f"the checkpoint, using {attn_str} as attn_str"
+        )
     else:
         attn_str = "attn"
     # Define scale name mapping patterns in order of precedence
     scale_mapping_patterns = [
         # ModelOpt format: .self_attn.{k,v}_proj.{k,v}_scale ->
         # .self_attn.attn.{k,v}_scale
-        (r"\.self_attn\.([kv])_proj\.([kv])_scale$",
-         rf".self_attn.{attn_str}.\2_scale"),
+        (
+            r"\.self_attn\.([kv])_proj\.([kv])_scale$",
+            rf".self_attn.{attn_str}.\2_scale",
+        ),
         # QKV proj format: .self_attn.qkv_proj.{k,v}_scale ->
         # .self_attn.attn.{k,v}_scale
         (r"\.self_attn\.qkv_proj\.([kv])_scale$", r".self_attn.attn.\1_scale"),
         # Qwen3 MoE format: .self_attn.qkqkv_proj.{k,v}_scale ->
         # .self_attn.attn.{k,v}_scale
-        (r"\.self_attn\.qkqkv_proj\.([kv])_scale$", r".self_attn.attn.\1_scale"
-         ),
+        (r"\.self_attn\.qkqkv_proj\.([kv])_scale$", r".self_attn.attn.\1_scale"),
         # Default format: .{k,v}_scale -> .attn.{k,v}_scale
         (r"\.([kv])_scale$", r".attn.\1_scale"),
     ]
diff --git a/vllm/model_executor/models/__init__.py b/vllm/model_executor/models/__init__.py
index 4ccba64f2c11..b56cb3340048 100644
--- a/vllm/model_executor/models/__init__.py
+++ b/vllm/model_executor/models/__init__.py
@@ -1,13 +1,28 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from .interfaces import (HasInnerState, SupportsLoRA, SupportsMRoPE,
-                         SupportsMultiModal, SupportsPP, SupportsTranscription,
-                         SupportsV0Only, has_inner_state, supports_lora,
-                         supports_mrope, supports_multimodal, supports_pp,
-                         supports_transcription, supports_v0_only)
-from .interfaces_base import (VllmModelForPooling, VllmModelForTextGeneration,
-                              is_pooling_model, is_text_generation_model)
+from .interfaces import (
+    HasInnerState,
+    SupportsLoRA,
+    SupportsMRoPE,
+    SupportsMultiModal,
+    SupportsPP,
+    SupportsTranscription,
+    SupportsV0Only,
+    has_inner_state,
+    supports_lora,
+    supports_mrope,
+    supports_multimodal,
+    supports_pp,
+    supports_transcription,
+    supports_v0_only,
+)
+from .interfaces_base import (
+    VllmModelForPooling,
+    VllmModelForTextGeneration,
+    is_pooling_model,
+    is_text_generation_model,
+)
 from .registry import ModelRegistry
 
 __all__ = [
diff --git a/vllm/model_executor/models/adapters.py b/vllm/model_executor/models/adapters.py
index c4328a176a5d..fd8a0b87e43e 100644
--- a/vllm/model_executor/models/adapters.py
+++ b/vllm/model_executor/models/adapters.py
@@ -13,8 +13,7 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.models.config import VerifyAndUpdateConfig
-from vllm.transformers_utils.config import (get_hf_file_bytes,
-                                            get_hf_file_to_dict)
+from vllm.transformers_utils.config import get_hf_file_bytes, get_hf_file_to_dict
 
 from .interfaces_base import VllmModelForPooling, is_pooling_model
 
@@ -37,8 +36,9 @@ def _load_st_projector(model_config: "ModelConfig") -> Optional[nn.Module]:
     """Load Sentence-Transformers Dense projection layers."""
 
     try:
-        modules = get_hf_file_to_dict("modules.json", model_config.model,
-                                      model_config.revision)
+        modules = get_hf_file_to_dict(
+            "modules.json", model_config.model, model_config.revision
+        )
         if not modules:
             return None
 
@@ -46,8 +46,7 @@ def _load_st_projector(model_config: "ModelConfig") -> Optional[nn.Module]:
             modules = modules.get("modules", [])
 
         dense_modules = [
-            m for m in modules
-            if m.get("type") == "sentence_transformers.models.Dense"
+            m for m in modules if m.get("type") == "sentence_transformers.models.Dense"
         ]
         if not dense_modules:
             return None
@@ -57,15 +56,18 @@ def _load_st_projector(model_config: "ModelConfig") -> Optional[nn.Module]:
             folder = module.get("path", "")
 
             config_path = f"{folder}/config.json" if folder else "config.json"
-            layer_config = get_hf_file_to_dict(config_path, model_config.model,
-                                               model_config.revision)
+            layer_config = get_hf_file_to_dict(
+                config_path, model_config.model, model_config.revision
+            )
             if not layer_config:
                 continue
 
-            linear = nn.Linear(layer_config.get("in_features", 768),
-                               layer_config.get("out_features", 768),
-                               bias=layer_config.get("bias", True),
-                               dtype=model_config.head_dtype)
+            linear = nn.Linear(
+                layer_config.get("in_features", 768),
+                layer_config.get("out_features", 768),
+                bias=layer_config.get("bias", True),
+                dtype=model_config.head_dtype,
+            )
 
             if not _load_dense_weights(linear, folder, model_config):
                 continue
@@ -80,40 +82,45 @@ def _load_st_projector(model_config: "ModelConfig") -> Optional[nn.Module]:
     return None
 
 
-def _load_dense_weights(linear: nn.Linear, folder: str,
-                        model_config: "ModelConfig") -> bool:
+def _load_dense_weights(
+    linear: nn.Linear, folder: str, model_config: "ModelConfig"
+) -> bool:
     """Load weights using vLLM's weight_loader pattern."""
-    from vllm.model_executor.model_loader.weight_utils import (
-        default_weight_loader)
+    from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 
     for filename in ["model.safetensors", "pytorch_model.bin"]:
         file_path = f"{folder}/{filename}" if folder else filename
 
         try:
-            file_bytes = get_hf_file_bytes(file_path, model_config.model,
-                                           model_config.revision)
+            file_bytes = get_hf_file_bytes(
+                file_path, model_config.model, model_config.revision
+            )
             if not file_bytes:
                 continue
 
             if filename.endswith(".safetensors"):
                 from safetensors.torch import load as load_safetensors
+
                 state_dict = load_safetensors(file_bytes)
             else:
                 import io
-                state_dict = torch.load(io.BytesIO(file_bytes),
-                                        map_location="cpu",
-                                        weights_only=True)
+
+                state_dict = torch.load(
+                    io.BytesIO(file_bytes), map_location="cpu", weights_only=True
+                )
 
             for weight_key in ["weight", "linear.weight", "dense.weight"]:
                 if weight_key in state_dict:
-                    weight_loader = getattr(linear.weight, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        linear.weight, "weight_loader", default_weight_loader
+                    )
                     weight_loader(linear.weight, state_dict[weight_key])
 
                     bias_key = weight_key.replace("weight", "bias")
                     if linear.bias is not None and bias_key in state_dict:
-                        bias_loader = getattr(linear.bias, "weight_loader",
-                                              default_weight_loader)
+                        bias_loader = getattr(
+                            linear.bias, "weight_loader", default_weight_loader
+                        )
                         bias_loader(linear.bias, state_dict[bias_key])
                     return True
         except Exception:
@@ -133,9 +140,7 @@ def _get_pooling_model_name(orig_model_name: str, pooling_suffix: str) -> str:
 
 
 def try_create_mm_pooling_model_cls(orig_cls: _T) -> _T:
-
     class CallVisitor(ast.NodeVisitor):
-
         def __init__(self):
             self.calls = []
 
@@ -150,7 +155,6 @@ def visit_Call(self, node):
         return None
 
     class ModelForPooling(orig_cls, VllmModelForPooling):
-
         is_pooling_model = True
 
         def __init__(
@@ -172,7 +176,6 @@ def _create_pooling_model_cls(orig_cls: _T) -> _T:
     from .utils import AutoWeightsLoader, WeightsMapper
 
     class ModelForPooling(orig_cls, VllmModelForPooling):
-
         is_pooling_model = True
 
         def __init__(
@@ -202,8 +205,11 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
             # TODO: Support uninitialized params tracking
 
             # We have deleted this attribute, so don't load it
-            weights = ((name, data) for name, data in weights
-                       if not name.startswith("lm_head."))
+            weights = (
+                (name, data)
+                for name, data in weights
+                if not name.startswith("lm_head.")
+            )
 
             # If `*ForCausalLM` defines `load_weights` on the inner model
             # and there are no other inner modules with parameters,
@@ -212,7 +218,8 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
                 # Whether only `self.model` contains parameters
                 model_is_only_param = all(
                     name == "model" or next(child.parameters(), None) is None
-                    for name, child in self.named_children())
+                    for name, child in self.named_children()
+                )
 
                 if model_is_only_param:
                     mapper = WeightsMapper(orig_to_new_prefix={"model.": ""})
@@ -252,7 +259,6 @@ def as_embedding_model(cls: _T) -> _T:
     from vllm.model_executor.layers.pooler import DispatchPooler, Pooler
 
     class ModelForEmbedding(_create_pooling_model_cls(cls)):
-
         def _init_pooler(self, vllm_config: "VllmConfig", prefix: str = ""):
             pooler_config = vllm_config.model_config.pooler_config
             assert pooler_config is not None
@@ -261,10 +267,10 @@ def _init_pooler(self, vllm_config: "VllmConfig", prefix: str = ""):
                 {
                     "encode": Pooler.for_encode(pooler_config),
                     "embed": Pooler.for_embed(pooler_config),
-                }, )
+                },
+            )
 
-    ModelForEmbedding.__name__ = \
-        _get_pooling_model_name(cls.__name__, "ForEmbedding")
+    ModelForEmbedding.__name__ = _get_pooling_model_name(cls.__name__, "ForEmbedding")
 
     return ModelForEmbedding  # type: ignore
 
@@ -287,17 +293,21 @@ def as_seq_cls_model(cls: _T) -> _T:
 
     # Lazy import
     from vllm.model_executor.layers.linear import ReplicatedLinear
-    from vllm.model_executor.layers.pooler import (ClassifierPooler,
-                                                   DispatchPooler, Pooler,
-                                                   PoolingMethod, PoolingType)
+    from vllm.model_executor.layers.pooler import (
+        ClassifierPooler,
+        DispatchPooler,
+        Pooler,
+        PoolingMethod,
+        PoolingType,
+    )
     from vllm.model_executor.models.interfaces import SupportsCrossEncoding
     from vllm.sequence import IntermediateTensors
 
     from .utils import get_model_hidden_size, maybe_prefix
 
-    class ModelForSequenceClassification(_create_pooling_model_cls(cls),
-                                         SupportsCrossEncoding):
-
+    class ModelForSequenceClassification(
+        _create_pooling_model_cls(cls), SupportsCrossEncoding
+    ):
         def _init_pooler(self, vllm_config: "VllmConfig", prefix: str = ""):
             config = vllm_config.model_config.hf_config
             quant_config = vllm_config.quant_config
@@ -319,24 +329,25 @@ def _init_pooler(self, vllm_config: "VllmConfig", prefix: str = ""):
             assert pooling_type_str is not None
             pooling_type = PoolingType[pooling_type_str]
 
-            self.pooler = DispatchPooler({
-                "encode":
-                Pooler.for_encode(pooler_config),
-                "classify":
-                ClassifierPooler(
-                    pooling=PoolingMethod.from_pooling_type(pooling_type),
-                    classifier=self._classifier,
-                    act_fn=ClassifierPooler.act_fn_for_seq_cls(
-                        vllm_config.model_config),
-                ),
-                "score":
-                ClassifierPooler(
-                    pooling=PoolingMethod.from_pooling_type(pooling_type),
-                    classifier=self._classifier,
-                    act_fn=ClassifierPooler.act_fn_for_cross_encoder(
-                        vllm_config.model_config),
-                ),
-            })
+            self.pooler = DispatchPooler(
+                {
+                    "encode": Pooler.for_encode(pooler_config),
+                    "classify": ClassifierPooler(
+                        pooling=PoolingMethod.from_pooling_type(pooling_type),
+                        classifier=self._classifier,
+                        act_fn=ClassifierPooler.act_fn_for_seq_cls(
+                            vllm_config.model_config
+                        ),
+                    ),
+                    "score": ClassifierPooler(
+                        pooling=PoolingMethod.from_pooling_type(pooling_type),
+                        classifier=self._classifier,
+                        act_fn=ClassifierPooler.act_fn_for_cross_encoder(
+                            vllm_config.model_config
+                        ),
+                    ),
+                }
+            )
 
         def _classifier(self, x: torch.Tensor):
             x, _ = self.score(x.float())
@@ -349,8 +360,9 @@ def forward(
             intermediate_tensors: Optional[IntermediateTensors] = None,
             inputs_embeds: Optional[torch.Tensor] = None,
         ) -> torch.Tensor:
-            return super().forward(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+            return super().forward(
+                input_ids, positions, intermediate_tensors, inputs_embeds
+            )
 
         def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
             tokens = getattr(self.config, "classifier_from_token", None)
@@ -363,9 +375,9 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
                 # ForSequenceClassification model.
                 return seq_cls_model_loader(self, weights)
 
-
-    ModelForSequenceClassification.__name__ = \
-        _get_pooling_model_name(cls.__name__, "ForSequenceClassification")
+    ModelForSequenceClassification.__name__ = _get_pooling_model_name(
+        cls.__name__, "ForSequenceClassification"
+    )
 
     return ModelForSequenceClassification  # type: ignore
 
@@ -388,22 +400,20 @@ def as_reward_model(cls: _T) -> _T:
     from vllm.model_executor.layers.pooler import DispatchPooler, Pooler
 
     class ModelForReward(_create_pooling_model_cls(cls)):
-
         def _init_pooler(self, vllm_config: "VllmConfig", prefix: str = ""):
             pooler_config = vllm_config.model_config.pooler_config
             assert pooler_config is not None
 
             self.pooler = DispatchPooler(
-                {"encode": Pooler.for_encode(pooler_config)}, )
+                {"encode": Pooler.for_encode(pooler_config)},
+            )
 
-    ModelForReward.__name__ = \
-        _get_pooling_model_name(cls.__name__, "ForReward")
+    ModelForReward.__name__ = _get_pooling_model_name(cls.__name__, "ForReward")
 
     return ModelForReward  # type: ignore
 
 
 class SequenceClassificationConfig(VerifyAndUpdateConfig):
-
     @staticmethod
     def verify_and_update_config(vllm_config: "VllmConfig") -> None:
         config = vllm_config.model_config.hf_config
@@ -428,12 +438,11 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
 
 
 def load_weights_using_from_2_way_softmax(
-        model, weights: Iterable[tuple[str, torch.Tensor]]):
+    model, weights: Iterable[tuple[str, torch.Tensor]]
+):
     # refer to https://huggingface.co/Qwen/Qwen3-Reranker-0.6B/discussions/3
-    from vllm.model_executor.layers.vocab_parallel_embedding import (
-        ParallelLMHead)
-    from vllm.model_executor.model_loader.weight_utils import (
-        default_weight_loader)
+    from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
+    from vllm.model_executor.model_loader.weight_utils import default_weight_loader
     from vllm.model_executor.models.utils import AutoWeightsLoader
 
     model_config = model.vllm_config.model_config
@@ -446,24 +455,27 @@ def load_weights_using_from_2_way_softmax(
         model.lm_head = model.model.embed_tokens
     else:
         quant_config = model.vllm_config.quant_config
-        model.lm_head = ParallelLMHead(model.config.vocab_size,
-                                       model.config.hidden_size,
-                                       quant_config=quant_config)
+        model.lm_head = ParallelLMHead(
+            model.config.vocab_size, model.config.hidden_size, quant_config=quant_config
+        )
 
     loader = AutoWeightsLoader(model)
     loaded_weights = loader.load_weights(weights)
 
     from vllm.transformers_utils.tokenizer import get_tokenizer
-    tokenizer = get_tokenizer(model_config.tokenizer,
-                              revision=model_config.tokenizer_revision,
-                              tokenizer_mode=model_config.tokenizer_mode,
-                              trust_remote_code=model_config.trust_remote_code)
+
+    tokenizer = get_tokenizer(
+        model_config.tokenizer,
+        revision=model_config.tokenizer_revision,
+        tokenizer_mode=model_config.tokenizer_mode,
+        trust_remote_code=model_config.trust_remote_code,
+    )
 
     false_id = tokenizer.convert_tokens_to_ids(tokens[0])
     true_id = tokenizer.convert_tokens_to_ids(tokens[1])
     score_weight = model.lm_head.weight.data[[true_id]].to(
-        torch.float32) - model.lm_head.weight.data[[false_id]].to(
-            torch.float32)
+        torch.float32
+    ) - model.lm_head.weight.data[[false_id]].to(torch.float32)
 
     param = model.score.weight
     weight_loader = getattr(param, "weight_loader", default_weight_loader)
@@ -475,13 +487,9 @@ def load_weights_using_from_2_way_softmax(
     return loaded_weights
 
 
-def load_weights_no_post_processing(model,
-                                    weights: Iterable[tuple[str,
-                                                            torch.Tensor]]):
-    from vllm.model_executor.layers.vocab_parallel_embedding import (
-        ParallelLMHead)
-    from vllm.model_executor.model_loader.weight_utils import (
-        default_weight_loader)
+def load_weights_no_post_processing(model, weights: Iterable[tuple[str, torch.Tensor]]):
+    from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
+    from vllm.model_executor.model_loader.weight_utils import default_weight_loader
     from vllm.model_executor.models.utils import AutoWeightsLoader
 
     model_config = model.vllm_config.model_config
@@ -493,18 +501,21 @@ def load_weights_no_post_processing(model,
         model.lm_head = model.model.embed_tokens
     else:
         quant_config = model.vllm_config.quant_config
-        model.lm_head = ParallelLMHead(model.config.vocab_size,
-                                       model.config.hidden_size,
-                                       quant_config=quant_config)
+        model.lm_head = ParallelLMHead(
+            model.config.vocab_size, model.config.hidden_size, quant_config=quant_config
+        )
 
     loader = AutoWeightsLoader(model)
     loaded_weights = loader.load_weights(weights)
 
     from vllm.transformers_utils.tokenizer import get_tokenizer
-    tokenizer = get_tokenizer(model_config.tokenizer,
-                              revision=model_config.tokenizer_revision,
-                              tokenizer_mode=model_config.tokenizer_mode,
-                              trust_remote_code=model_config.trust_remote_code)
+
+    tokenizer = get_tokenizer(
+        model_config.tokenizer,
+        revision=model_config.tokenizer_revision,
+        tokenizer_mode=model_config.tokenizer_mode,
+        trust_remote_code=model_config.trust_remote_code,
+    )
 
     token_ids = [tokenizer.convert_tokens_to_ids(t) for t in tokens]
     score_weight = model.lm_head.weight.data[token_ids]
diff --git a/vllm/model_executor/models/aimv2.py b/vllm/model_executor/models/aimv2.py
index 419f8a5ae2c7..2423ad5b0c3a 100644
--- a/vllm/model_executor/models/aimv2.py
+++ b/vllm/model_executor/models/aimv2.py
@@ -14,18 +14,20 @@
 from vllm.distributed.utils import divide
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.transformers_utils.configs.ovis import AIMv2Config
 
 
 class AIMv2SwiGLUFFN(nn.Module):
-
-    def __init__(self, config: AIMv2Config, quant_config: QuantizationConfig,
-                 prefix: str):
+    def __init__(
+        self, config: AIMv2Config, quant_config: QuantizationConfig, prefix: str
+    ):
         super().__init__()
         hidden_features = config.intermediate_size
         in_features = config.hidden_size
@@ -55,7 +57,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class AIMv2PatchEmbed(nn.Module):
-
     def __init__(self, config: AIMv2Config):
         super().__init__()
         self.proj = nn.Conv2d(
@@ -73,14 +74,12 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class AIMv2ViTPreprocessor(nn.Module):
-
     def __init__(self, config: AIMv2Config):
         super().__init__()
-        num_patches = (config.image_size // config.patch_size)**2
+        num_patches = (config.image_size // config.patch_size) ** 2
 
         self.patchifier = AIMv2PatchEmbed(config)
-        self.pos_embed = nn.Parameter(
-            torch.zeros((1, num_patches, config.hidden_size)))
+        self.pos_embed = nn.Parameter(torch.zeros((1, num_patches, config.hidden_size)))
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         tokens = self.patchifier(x)
@@ -91,9 +90,9 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class AIMv2Attention(nn.Module):
-
-    def __init__(self, config: AIMv2Config, quant_config: QuantizationConfig,
-                 prefix: str):
+    def __init__(
+        self, config: AIMv2Config, quant_config: QuantizationConfig, prefix: str
+    ):
         super().__init__()
         self.config = config
         self.embed_dim = config.hidden_size
@@ -103,7 +102,8 @@ def __init__(self, config: AIMv2Config, quant_config: QuantizationConfig,
             raise ValueError(
                 "embed_dim must be divisible by num_heads "
                 f"(got `embed_dim`: {self.embed_dim} and `num_heads`:"
-                f" {self.num_heads}).")
+                f" {self.num_heads})."
+            )
         self.scale = self.head_dim**-0.5
 
         self.qkv = QKVParallelLinear(
@@ -126,8 +126,9 @@ def __init__(self, config: AIMv2Config, quant_config: QuantizationConfig,
         self.tp_size = get_tensor_model_parallel_world_size()
         self.num_heads_per_partition = divide(self.num_heads, self.tp_size)
 
-        self.attn = MultiHeadAttention(self.num_heads_per_partition,
-                                       self.head_dim, self.scale)
+        self.attn = MultiHeadAttention(
+            self.num_heads_per_partition, self.head_dim, self.scale
+        )
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         qkv, _ = self.qkv(x)
@@ -139,17 +140,17 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class AIMv2Block(nn.Module):
-
-    def __init__(self, config: AIMv2Config, quant_config: QuantizationConfig,
-                 prefix: str):
+    def __init__(
+        self, config: AIMv2Config, quant_config: QuantizationConfig, prefix: str
+    ):
         super().__init__()
-        self.attn = AIMv2Attention(config,
-                                   quant_config=quant_config,
-                                   prefix=f"{prefix}.attn")
+        self.attn = AIMv2Attention(
+            config, quant_config=quant_config, prefix=f"{prefix}.attn"
+        )
         self.norm_1 = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.mlp = AIMv2SwiGLUFFN(config,
-                                  quant_config=quant_config,
-                                  prefix=f"{prefix}.mlp")
+        self.mlp = AIMv2SwiGLUFFN(
+            config, quant_config=quant_config, prefix=f"{prefix}.mlp"
+        )
         self.norm_2 = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -159,7 +160,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class AIMv2Transformer(nn.Module):
-
     def __init__(
         self,
         config: AIMv2Config,
@@ -170,13 +170,14 @@ def __init__(
     ):
         super().__init__()
 
-        self.blocks = nn.ModuleList([
-            AIMv2Block(config, quant_config, prefix=f"{prefix}.blocks.{i}")
-            for i in range(config.num_hidden_layers)
-        ])
+        self.blocks = nn.ModuleList(
+            [
+                AIMv2Block(config, quant_config, prefix=f"{prefix}.blocks.{i}")
+                for i in range(config.num_hidden_layers)
+            ]
+        )
         if require_post_norm:
-            self.post_trunk_norm = RMSNorm(config.hidden_size,
-                                           eps=config.rms_norm_eps)
+            self.post_trunk_norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         else:
             self.post_trunk_norm = None
 
@@ -190,29 +191,30 @@ def forward(self, tokens: torch.Tensor) -> torch.Tensor:
 
 
 class AIMv2Model(torch.nn.Module):
-
-    def __init__(self,
-                 config: AIMv2Config,
-                 quant_config: QuantizationConfig,
-                 *,
-                 require_post_norm: Optional[bool] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: AIMv2Config,
+        quant_config: QuantizationConfig,
+        *,
+        require_post_norm: Optional[bool] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.preprocessor = AIMv2ViTPreprocessor(config)
-        self.trunk = AIMv2Transformer(config,
-                                      quant_config=quant_config,
-                                      require_post_norm=require_post_norm,
-                                      prefix=f"{prefix}.trunk")
+        self.trunk = AIMv2Transformer(
+            config,
+            quant_config=quant_config,
+            require_post_norm=require_post_norm,
+            prefix=f"{prefix}.trunk",
+        )
 
     def forward(self, pixel_values: torch.Tensor) -> torch.Tensor:
-
         x = self.preprocessor(pixel_values)
         x = self.trunk(x)
 
         return x
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".fc13", ".fc1", 0),
@@ -223,11 +225,13 @@ def load_weights(self, weights: Iterable[tuple[str,
 
         for name, loaded_weight in weights:
             # post_layernorm is optional in SiglipVisionModel
-            if (name.startswith("trunk.post_trunk_norm")
-                    and self.trunk.post_trunk_norm is None):
+            if (
+                name.startswith("trunk.post_trunk_norm")
+                and self.trunk.post_trunk_norm is None
+            ):
                 continue
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -238,8 +242,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
diff --git a/vllm/model_executor/models/apertus.py b/vllm/model_executor/models/apertus.py
index 6dab4ed14345..743207082721 100644
--- a/vllm/model_executor/models/apertus.py
+++ b/vllm/model_executor/models/apertus.py
@@ -24,6 +24,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Apertus model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from typing import Any, Optional, Union
 
@@ -38,27 +39,38 @@
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import XIELU
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, extract_layer_index,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class ApertusMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -86,8 +98,10 @@ def __init__(
             prefix=f"{prefix}.down_proj",
         )
         if hidden_act != "xielu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only xIELU is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. "
+                "Only xIELU is supported for now."
+            )
         self.act_fn = XIELU()
 
     def forward(self, x):
@@ -98,7 +112,6 @@ def forward(self, x):
 
 
 class ApertusAttention(nn.Module):
-
     def __init__(
         self,
         config: ApertusConfig,
@@ -138,8 +151,7 @@ def __init__(
             head_dim = self.hidden_size // self.total_num_heads
         self.head_dim = head_dim
         # Phi models introduced a partial_rotary_factor parameter in the config
-        self.partial_rotary_factor = getattr(config, "partial_rotary_factor",
-                                             1)
+        self.partial_rotary_factor = getattr(config, "partial_rotary_factor", 1)
         self.q_size = self.num_heads * self.head_dim
         self.kv_size = self.num_kv_heads * self.head_dim
         self.scaling = self.head_dim**-0.5
@@ -164,9 +176,9 @@ def __init__(
             prefix=f"{prefix}.o_proj",
         )
 
-        self._init_rotary_emb(config,
-                              rope_scaling=rope_scaling,
-                              quant_config=quant_config)
+        self._init_rotary_emb(
+            config, rope_scaling=rope_scaling, quant_config=quant_config
+        )
 
         sliding_window = None
         if layer_types := getattr(config, "layer_types", None):
@@ -174,8 +186,11 @@ def __init__(
             if is_sliding:
                 sliding_window = config.sliding_window
 
-        attn_cls = (EncoderOnlyAttention
-                    if attn_type == AttentionType.ENCODER_ONLY else Attention)
+        attn_cls = (
+            EncoderOnlyAttention
+            if attn_type == AttentionType.ENCODER_ONLY
+            else Attention
+        )
 
         self.attn = attn_cls(
             self.num_heads,
@@ -206,9 +221,12 @@ def forward(
         output, _ = self.o_proj(attn_output)
         return output
 
-    def _init_rotary_emb(self, config: ApertusConfig,
-                         rope_scaling: Optional[dict[str, Any]],
-                         quant_config: Optional[QuantizationConfig]) -> None:
+    def _init_rotary_emb(
+        self,
+        config: ApertusConfig,
+        rope_scaling: Optional[dict[str, Any]],
+        quant_config: Optional[QuantizationConfig],
+    ) -> None:
         is_neox_style = True
         is_gguf = quant_config and quant_config.get_name() == "gguf"
         if is_gguf and config.model_type == "apertus":
@@ -226,7 +244,6 @@ def _init_rotary_emb(self, config: ApertusConfig,
 
 
 class ApertusDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: ApertusConfig,
@@ -239,18 +256,20 @@ def __init__(
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
         if rope_scaling is not None and getattr(
-                config, "original_max_position_embeddings", None):
+            config, "original_max_position_embeddings", None
+        ):
             rope_scaling["original_max_position_embeddings"] = (
-                config.original_max_position_embeddings)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+                config.original_max_position_embeddings
+            )
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         # Support abacusai/Smaug-72B-v0.1 with attention_bias
         # Support internlm/internlm-7b with bias
         attention_bias = getattr(config, "attention_bias", False) or getattr(
-            config, "bias", False)
+            config, "bias", False
+        )
         bias_o_proj = attention_bias
         # support internlm/internlm3-8b with qkv_bias
-        if hasattr(config, 'qkv_bias'):
+        if hasattr(config, "qkv_bias"):
             attention_bias = config.qkv_bias
 
         # Apertus defaults to causal attention as it is a decoder-only model.
@@ -266,8 +285,9 @@ def __init__(
             config=config,
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
-            num_kv_heads=getattr(config, "num_key_value_heads",
-                                 config.num_attention_heads),
+            num_kv_heads=getattr(
+                config, "num_key_value_heads", config.num_attention_heads
+            ),
             rope_theta=rope_theta,
             rope_scaling=rope_scaling,
             max_position_embeddings=max_position_embeddings,
@@ -286,10 +306,10 @@ def __init__(
             bias=getattr(config, "mlp_bias", False),
             prefix=f"{prefix}.mlp",
         )
-        self.attention_layernorm = RMSNorm(config.hidden_size,
-                                           eps=config.rms_norm_eps)
-        self.feedforward_layernorm = RMSNorm(config.hidden_size,
-                                             eps=config.rms_norm_eps)
+        self.attention_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.feedforward_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -302,26 +322,24 @@ def forward(
             residual = hidden_states
             hidden_states = self.attention_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.attention_layernorm(
-                hidden_states, residual)
-        hidden_states = self.self_attn(positions=positions,
-                                       hidden_states=hidden_states)
+            hidden_states, residual = self.attention_layernorm(hidden_states, residual)
+        hidden_states = self.self_attn(positions=positions, hidden_states=hidden_states)
 
         # Fully Connected
-        hidden_states, residual = self.feedforward_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.feedforward_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
 
 @support_torch_compile
 class ApertusModel(nn.Module):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 layer_type: type[nn.Module] = ApertusDecoderLayer):
+    def __init__(
+        self,
+        *,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        layer_type: type[nn.Module] = ApertusDecoderLayer,
+    ):
         super().__init__()
 
         config = vllm_config.model_config.hf_config
@@ -331,12 +349,16 @@ def __init__(self,
 
         self.config = config
         self.quant_config = quant_config
-        lora_vocab = (lora_config.lora_extra_vocab_size *
-                      (lora_config.max_loras or 1)) if lora_config else 0
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
-        if get_pp_group().is_first_rank or (config.tie_word_embeddings
-                                            and get_pp_group().is_last_rank):
+        if get_pp_group().is_first_rank or (
+            config.tie_word_embeddings and get_pp_group().is_last_rank
+        ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
@@ -347,10 +369,12 @@ def __init__(self,
             self.embed_tokens = PPMissingLayer()
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: layer_type(config=config,
-                                      cache_config=cache_config,
-                                      quant_config=quant_config,
-                                      prefix=prefix),
+            lambda prefix: layer_type(
+                config=config,
+                cache_config=cache_config,
+                quant_config=quant_config,
+                prefix=prefix,
+            ),
             prefix=f"{prefix}.layers",
         )
         if get_pp_group().is_last_rank:
@@ -360,9 +384,9 @@ def __init__(self,
 
         self.aux_hidden_state_layers = tuple[int, ...]()
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -373,8 +397,9 @@ def forward(
         positions: torch.Tensor,
         intermediate_tensors: Optional[IntermediateTensors],
         inputs_embeds: Optional[torch.Tensor] = None,
-    ) -> Union[torch.Tensor, IntermediateTensors, tuple[torch.Tensor,
-                                                        list[torch.Tensor]]]:
+    ) -> Union[
+        torch.Tensor, IntermediateTensors, tuple[torch.Tensor, list[torch.Tensor]]
+    ]:
         if get_pp_group().is_first_rank:
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
@@ -387,17 +412,15 @@ def forward(
             residual = intermediate_tensors["residual"]
 
         aux_hidden_states = []
-        for idx, layer in enumerate(
-                self.layers[self.start_layer:self.end_layer]):
+        for idx, layer in enumerate(self.layers[self.start_layer : self.end_layer]):
             if idx in self.aux_hidden_state_layers:
                 aux_hidden_states.append(hidden_states + residual)
             hidden_states, residual = layer(positions, hidden_states, residual)
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
 
@@ -405,8 +428,7 @@ def forward(
             return hidden_states, aux_hidden_states
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv_proj", ".q_proj", "q"),
@@ -424,19 +446,19 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            if ("rotary_emb.cos_cached" in name
-                    or "rotary_emb.sin_cached" in name):
+            if "rotary_emb.cos_cached" in name or "rotary_emb.sin_cached" in name:
                 # Models trained using ColossalAI may include these tensors in
                 # the checkpoint. Skip them.
                 continue
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
@@ -469,8 +491,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -482,15 +503,17 @@ class ApertusForCausalLM(nn.Module, SupportsLoRA, SupportsPP):
     # LoRA specific attributes
     embedding_modules = {
         "embed_tokens": "input_embeddings",
-        "lm_head": "output_embeddings"
+        "lm_head": "output_embeddings",
     }
     embedding_padding_modules = ["lm_head"]
 
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 layer_type: type[nn.Module] = ApertusDecoderLayer):
+    def __init__(
+        self,
+        *,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        layer_type: type[nn.Module] = ApertusDecoderLayer,
+    ):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
@@ -498,9 +521,11 @@ def __init__(self,
         self.config = config
         self.lora_config = lora_config
 
-        self.model = self._init_model(vllm_config=vllm_config,
-                                      prefix=maybe_prefix(prefix, "model"),
-                                      layer_type=layer_type)
+        self.model = self._init_model(
+            vllm_config=vllm_config,
+            prefix=maybe_prefix(prefix, "model"),
+            layer_type=layer_type,
+        )
 
         if get_pp_group().is_last_rank:
             self.unpadded_vocab_size = config.vocab_size
@@ -514,24 +539,25 @@ def __init__(self,
                     DEFAULT_VOCAB_PADDING_SIZE
                     # We need bigger padding if using lora for kernel
                     # compatibility
-                    if not lora_config else
-                    lora_config.lora_vocab_padding_size),
+                    if not lora_config
+                    else lora_config.lora_vocab_padding_size
+                ),
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
             if config.tie_word_embeddings:
-                self.lm_head = self.lm_head.tie_weights(
-                    self.model.embed_tokens)
+                self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
 
             logit_scale = getattr(config, "logit_scale", 1.0)
-            self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                    config.vocab_size,
-                                                    logit_scale)
+            self.logits_processor = LogitsProcessor(
+                self.unpadded_vocab_size, config.vocab_size, logit_scale
+            )
         else:
             self.lm_head = PPMissingLayer()
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def set_aux_hidden_state_layers(self, layers: tuple[int, ...]) -> None:
         self.model.aux_hidden_state_layers = layers
@@ -540,13 +566,15 @@ def get_eagle3_aux_hidden_state_layers(self) -> tuple[int, ...]:
         num_layers = len(self.model.layers)
         return (2, num_layers // 2, num_layers - 3)
 
-    def _init_model(self,
-                    vllm_config: VllmConfig,
-                    prefix: str = "",
-                    layer_type: type[nn.Module] = ApertusDecoderLayer):
-        return ApertusModel(vllm_config=vllm_config,
-                            prefix=prefix,
-                            layer_type=layer_type)
+    def _init_model(
+        self,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        layer_type: type[nn.Module] = ApertusDecoderLayer,
+    ):
+        return ApertusModel(
+            vllm_config=vllm_config, prefix=prefix, layer_type=layer_type
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -558,8 +586,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        model_output = self.model(input_ids, positions, intermediate_tensors,
-                                  inputs_embeds)
+        model_output = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return model_output
 
     def compute_logits(
@@ -569,11 +598,9 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/arcee.py b/vllm/model_executor/models/arcee.py
index 1ee378af76c9..634e94b16814 100644
--- a/vllm/model_executor/models/arcee.py
+++ b/vllm/model_executor/models/arcee.py
@@ -20,32 +20,43 @@
 from vllm.distributed import get_pp_group
 from vllm.model_executor.layers.activation import ReLUSquaredActivation
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import ColumnParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+)
 
 
 class ArceeMLP(nn.Module):
     """Feed-forward layer for Arcee using ReLU^2 activation
     (no gating as in LLaMA)."""
 
-    def __init__(self,
-                 hidden_size: int,
-                 intermediate_size: int,
-                 hidden_act: str,
-                 quant_config: Optional[Any] = None,
-                 bias: bool = False,
-                 prefix: str = "",
-                 reduce_results: bool = True) -> None:
+    def __init__(
+        self,
+        hidden_size: int,
+        intermediate_size: int,
+        hidden_act: str,
+        quant_config: Optional[Any] = None,
+        bias: bool = False,
+        prefix: str = "",
+        reduce_results: bool = True,
+    ) -> None:
         super().__init__()
         # Single linear projection up to intermediate size
         # (no separate gate projection)
@@ -66,8 +77,10 @@ def __init__(self,
             prefix=f"{prefix}.down_proj",
         )
         if hidden_act != "relu2":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only 'relu2' is supported for AFM.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. "
+                "Only 'relu2' is supported for AFM."
+            )
         # Define ReLU^2 activation: (ReLU(x))^2 elementwise
         self.act_fn = ReLUSquaredActivation()
 
@@ -82,38 +95,45 @@ class ArceeDecoderLayer(nn.Module):
     """Transformer decoder block for Arcee, with self-attention and
     ReLU^2 MLP."""
 
-    def __init__(self,
-                 config: LlamaConfig,
-                 cache_config: Optional[Any] = None,
-                 quant_config: Optional[Any] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: LlamaConfig,
+        cache_config: Optional[Any] = None,
+        quant_config: Optional[Any] = None,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
         self.hidden_size = config.hidden_size
         # Rotary embedding parameters (reuse LLaMA defaults)
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
         if rope_scaling is not None and getattr(
-                config, "original_max_position_embeddings", None):
+            config, "original_max_position_embeddings", None
+        ):
             rope_scaling["original_max_position_embeddings"] = (
-                config.original_max_position_embeddings)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+                config.original_max_position_embeddings
+            )
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         # Determine if attention bias is needed (some variants use bias terms)
         attention_bias = getattr(config, "attention_bias", False) or getattr(
-            config, "bias", False)
+            config, "bias", False
+        )
         bias_o_proj = attention_bias
         if hasattr(config, "qkv_bias"):
             attention_bias = config.qkv_bias
 
         # Self-Attention (using LLaMA's attention structure)
         from vllm.model_executor.models.llama import (
-            LlamaAttention)  # import here to avoid circular import
+            LlamaAttention,  # import here to avoid circular import
+        )
+
         self.self_attn = LlamaAttention(
             config=config,
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
-            num_kv_heads=getattr(config, "num_key_value_heads",
-                                 config.num_attention_heads),
+            num_kv_heads=getattr(
+                config, "num_key_value_heads", config.num_attention_heads
+            ),
             rope_theta=rope_theta,
             rope_scaling=rope_scaling,
             max_position_embeddings=max_position_embeddings,
@@ -123,8 +143,8 @@ def __init__(self,
             cache_config=cache_config,
             prefix=f"{prefix}.self_attn",
             attn_type=getattr(
-                config, "attn_type",
-                "decoder"),  # assume decoder (causal) unless specified
+                config, "attn_type", "decoder"
+            ),  # assume decoder (causal) unless specified
         )
         # MLP with ReLU^2 activation
         self.mlp = ArceeMLP(
@@ -136,14 +156,16 @@ def __init__(self,
             prefix=f"{prefix}.mlp",
         )
         # Layer normalization layers (RMSNorm as in LLaMA)
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
-            self, positions: torch.Tensor, hidden_states: torch.Tensor,
-            residual: Optional[torch.Tensor]
+        self,
+        positions: torch.Tensor,
+        hidden_states: torch.Tensor,
+        residual: Optional[torch.Tensor],
     ) -> tuple[torch.Tensor, torch.Tensor]:
         # Self-Attention block
         if residual is None:
@@ -151,13 +173,10 @@ def forward(
             hidden_states = self.input_layernorm(hidden_states)
         else:
             # Fused residual add + layernorm if supported
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
-        hidden_states = self.self_attn(positions=positions,
-                                       hidden_states=hidden_states)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
+        hidden_states = self.self_attn(positions=positions, hidden_states=hidden_states)
         # Feed-forward block
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
@@ -167,11 +186,13 @@ class ArceeModel(nn.Module):
     """The transformer model backbone for Arcee (embedding layer + stacked
     decoder blocks + final norm)."""
 
-    def __init__(self,
-                 *,
-                 vllm_config,
-                 prefix: str = "",
-                 layer_type: type[nn.Module] = ArceeDecoderLayer) -> None:
+    def __init__(
+        self,
+        *,
+        vllm_config,
+        prefix: str = "",
+        layer_type: type[nn.Module] = ArceeDecoderLayer,
+    ) -> None:
         super().__init__()
         config: LlamaConfig = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
@@ -182,8 +203,9 @@ def __init__(self,
         self.org_vocab_size = config.vocab_size
 
         # Word embeddings (parallelized if using pipeline parallel)
-        if get_pp_group().is_first_rank or (config.tie_word_embeddings
-                                            and get_pp_group().is_last_rank):
+        if get_pp_group().is_first_rank or (
+            config.tie_word_embeddings and get_pp_group().is_last_rank
+        ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
@@ -191,16 +213,17 @@ def __init__(self,
                 quant_config=quant_config,
             )
         else:
-            self.embed_tokens = PPMissingLayer(
-            )  # placeholder on non-embedding ranks
+            self.embed_tokens = PPMissingLayer()  # placeholder on non-embedding ranks
 
         # Build decoder layers across pipeline ranks
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: layer_type(config=config,
-                                      cache_config=cache_config,
-                                      quant_config=quant_config,
-                                      prefix=prefix),
+            lambda prefix: layer_type(
+                config=config,
+                cache_config=cache_config,
+                quant_config=quant_config,
+                prefix=prefix,
+            ),
             prefix=f"{prefix}.layers",
         )
         # Final RMSNorm on the last pipeline stage
@@ -215,9 +238,9 @@ def __init__(self,
 
         # Prepare factory for empty intermediate tensors
         # (for pipeline scheduling)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -227,44 +250,47 @@ def forward(
         input_ids: Optional[torch.Tensor],
         positions: torch.Tensor,
         intermediate_tensors: Optional[IntermediateTensors],
-        inputs_embeds: Optional[torch.Tensor] = None
-    ) -> Union[torch.Tensor, IntermediateTensors, tuple[torch.Tensor,
-                                                        list[torch.Tensor]]]:
+        inputs_embeds: Optional[torch.Tensor] = None,
+    ) -> Union[
+        torch.Tensor, IntermediateTensors, tuple[torch.Tensor, list[torch.Tensor]]
+    ]:
         # Embedding lookup (on first pipeline rank)
         if get_pp_group().is_first_rank:
-            hidden_states = (inputs_embeds if inputs_embeds is not None else
-                             self.get_input_embeddings(input_ids))
+            hidden_states = (
+                inputs_embeds
+                if inputs_embeds is not None
+                else self.get_input_embeddings(input_ids)
+            )
             residual = None
         else:
             assert intermediate_tensors is not None, (
-                "IntermediateTensors must be provided for non-first "
-                "pipeline ranks")
+                "IntermediateTensors must be provided for non-first pipeline ranks"
+            )
             hidden_states = intermediate_tensors["hidden_states"]
             residual = intermediate_tensors["residual"]
 
         aux_hidden_states: list[torch.Tensor] = []
         for idx, layer in enumerate(
-                islice(self.layers, self.start_layer, self.end_layer)):
+            islice(self.layers, self.start_layer, self.end_layer)
+        ):
             if idx in self.aux_hidden_state_layers:
                 aux_hidden_states.append(
-                    hidden_states +
-                    residual)  # capture pre-layer hidden state if needed
+                    hidden_states + residual
+                )  # capture pre-layer hidden state if needed
             hidden_states, residual = layer(positions, hidden_states, residual)
 
         if not get_pp_group().is_last_rank:
             # Send intermediate results to the next pipeline stage
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         # On last rank: apply final layer norm
         hidden_states, _ = self.norm(hidden_states, residual)
         if len(aux_hidden_states) > 0:
             return hidden_states, aux_hidden_states
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         """Load weights, mapping q/k/v projections to fused qkv_proj."""
         stacked_params_mapping = [
             (".qkv_proj", ".q_proj", "q"),
@@ -278,17 +304,17 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            if ("rotary_emb.cos_cached" in name
-                    or "rotary_emb.sin_cached" in name):
+            if "rotary_emb.cos_cached" in name or "rotary_emb.sin_cached" in name:
                 continue
 
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
@@ -331,8 +357,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 continue
 
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
 
@@ -342,6 +367,7 @@ def load_weights(self, weights: Iterable[tuple[str,
 class ArceeForCausalLM(nn.Module, SupportsLoRA, SupportsPP):
     """Arcee Model for causal language modeling, integrated with vLLM
     runtime."""
+
     # Map fused module names to their submodule components
     # (for quantization and LoRA)
     packed_modules_mapping = {
@@ -354,8 +380,7 @@ def __init__(self, *, vllm_config, prefix: str = "") -> None:
         self.config = config
 
         # Initialize the inner Transformer model (ArceeModel)
-        self.model = ArceeModel(vllm_config=vllm_config,
-                                prefix=f"{prefix}.model")
+        self.model = ArceeModel(vllm_config=vllm_config, prefix=f"{prefix}.model")
         # On the last pipeline stage, set up the LM head and logits processor
         if get_pp_group().is_last_rank:
             # Determine vocabulary size (including any LoRA extra tokens
@@ -373,34 +398,35 @@ def __init__(self, *, vllm_config, prefix: str = "") -> None:
             )
             if config.tie_word_embeddings:
                 # Tie output weights with input embedding matrix
-                self.lm_head = self.lm_head.tie_weights(
-                    self.model.embed_tokens)
+                self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
             logit_scale = getattr(config, "logit_scale", 1.0)
-            self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                    config.vocab_size,
-                                                    logit_scale)
+            self.logits_processor = LogitsProcessor(
+                self.unpadded_vocab_size, config.vocab_size, logit_scale
+            )
         else:
             # Placeholder for lm_head on non-last ranks
             self.lm_head = PPMissingLayer()
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def forward(
         self,
         input_ids: torch.Tensor,
         positions: torch.Tensor,
         intermediate_tensors: Optional[IntermediateTensors] = None,
-        inputs_embeds: Optional[torch.Tensor] = None
+        inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        model_output = self.model(input_ids=input_ids,
-                                  positions=positions,
-                                  intermediate_tensors=intermediate_tensors,
-                                  inputs_embeds=inputs_embeds)
+        model_output = self.model(
+            input_ids=input_ids,
+            positions=positions,
+            intermediate_tensors=intermediate_tensors,
+            inputs_embeds=inputs_embeds,
+        )
         return model_output
 
-    def compute_logits(self,
-                       hidden_states: torch.Tensor) -> Optional[torch.Tensor]:
+    def compute_logits(self, hidden_states: torch.Tensor) -> Optional[torch.Tensor]:
         # Compute final logits from hidden states (last pipeline rank only)
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
@@ -408,15 +434,14 @@ def compute_logits(self,
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         """Load weights into the model (delegates to inner model and handles
         tied embeddings)."""
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
-            skip_substrs=["gate_proj"])
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
+            skip_substrs=["gate_proj"],
+        )
         # AutoWeightLoader handles weight name remapping, including fusing
         # separate q_proj, k_proj, v_proj into qkv_proj
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/arctic.py b/vllm/model_executor/models/arctic.py
index 55d16fd75ceb..760df1cef82b 100644
--- a/vllm/model_executor/models/arctic.py
+++ b/vllm/model_executor/models/arctic.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Inference-only Snowflake Arctic model."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -11,24 +12,33 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (get_pp_group, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_reduce)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_reduce,
+)
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import fused_experts, fused_topk
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.deepspeedfp import (
-    DeepSpeedFPConfig, DeepSpeedFPParameter)
+    DeepSpeedFPConfig,
+    DeepSpeedFPParameter,
+)
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.platforms import current_platform
@@ -36,41 +46,50 @@
 from vllm.transformers_utils.configs.arctic import ArcticConfig
 
 from .interfaces import SupportsPP, SupportsQuant
-from .utils import (extract_layer_index, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
 
 class ArcticMLP(nn.Module):
-
-    def __init__(self,
-                 config: ArcticConfig,
-                 expert_id: int = -1,
-                 is_residual_mlp: bool = False,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 reduce_results: bool = True,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: ArcticConfig,
+        expert_id: int = -1,
+        is_residual_mlp: bool = False,
+        quant_config: Optional[QuantizationConfig] = None,
+        reduce_results: bool = True,
+        prefix: str = "",
+    ):
         super().__init__()
         self.hidden_size = config.hidden_size
         self.expert_id = expert_id
 
-        self.ffn_dim = config.intermediate_size if not is_residual_mlp \
-            else self.hidden_size
-
-        self.w13 = MergedColumnParallelLinear(self.hidden_size,
-                                              [self.ffn_dim] * 2,
-                                              bias=False,
-                                              quant_config=quant_config)
-        self.w2 = RowParallelLinear(self.ffn_dim,
-                                    self.hidden_size,
-                                    bias=False,
-                                    reduce_results=reduce_results,
-                                    quant_config=quant_config)
+        self.ffn_dim = (
+            config.intermediate_size if not is_residual_mlp else self.hidden_size
+        )
+
+        self.w13 = MergedColumnParallelLinear(
+            self.hidden_size, [self.ffn_dim] * 2, bias=False, quant_config=quant_config
+        )
+        self.w2 = RowParallelLinear(
+            self.ffn_dim,
+            self.hidden_size,
+            bias=False,
+            reduce_results=reduce_results,
+            quant_config=quant_config,
+        )
         if config.hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {config.hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {config.hidden_act}. "
+                "Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, hidden_states):
@@ -85,13 +104,15 @@ class ArcticMoE(nn.Module):
     Model-parallel implementation of Arctic MoE Layer.
     """
 
-    def __init__(self,
-                 config: ArcticConfig,
-                 tp_size: Optional[int] = None,
-                 params_dtype: Optional[torch.dtype] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 reduce_results: bool = True,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: ArcticConfig,
+        tp_size: Optional[int] = None,
+        params_dtype: Optional[torch.dtype] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        reduce_results: bool = True,
+        prefix: str = "",
+    ):
         super().__init__()
 
         layer_id = extract_layer_index(prefix)
@@ -111,52 +132,75 @@ def __init__(self,
         self.params_dtype = params_dtype
 
         if not self.is_moe_layer:
-            self.mlp = ArcticMLP(config,
-                                 quant_config=quant_config,
-                                 reduce_results=reduce_results,
-                                 prefix=f"{prefix}.mlp")
+            self.mlp = ArcticMLP(
+                config,
+                quant_config=quant_config,
+                reduce_results=reduce_results,
+                prefix=f"{prefix}.mlp",
+            )
         else:
-            self.gate = ReplicatedLinear(self.hidden_size,
-                                         self.num_experts,
-                                         bias=False,
-                                         params_dtype=self.params_dtype,
-                                         quant_config=quant_config,
-                                         prefix=f"{prefix}.gate")
+            self.gate = ReplicatedLinear(
+                self.hidden_size,
+                self.num_experts,
+                bias=False,
+                params_dtype=self.params_dtype,
+                quant_config=quant_config,
+                prefix=f"{prefix}.gate",
+            )
             if self.is_quant:
                 self.ws = DeepSpeedFPParameter(
-                    torch.Size((self.num_experts, 2 * self.intermediate_size,
-                                self.hidden_size)),
+                    torch.Size(
+                        (self.num_experts, 2 * self.intermediate_size, self.hidden_size)
+                    ),
                     params_dtype=params_dtype,
                     quant_config=quant_config,
                 )
                 self.w2s = DeepSpeedFPParameter(
-                    torch.Size((self.num_experts, self.hidden_size,
-                                self.intermediate_size)),
+                    torch.Size(
+                        (self.num_experts, self.hidden_size, self.intermediate_size)
+                    ),
                     params_dtype=params_dtype,
                     quant_config=quant_config,
                 )
             else:
                 self.ws = nn.Parameter(
-                    torch.empty(self.num_experts,
-                                2 * self.intermediate_size,
-                                self.hidden_size,
-                                device=current_platform.device_type,
-                                dtype=self.params_dtype))
+                    torch.empty(
+                        self.num_experts,
+                        2 * self.intermediate_size,
+                        self.hidden_size,
+                        device=current_platform.device_type,
+                        dtype=self.params_dtype,
+                    )
+                )
                 self.w2s = nn.Parameter(
-                    torch.empty(self.num_experts,
-                                self.hidden_size,
-                                self.intermediate_size,
-                                device=current_platform.device_type,
-                                dtype=self.params_dtype))
-            set_weight_attrs(self.ws, {
-                "weight_loader": self.weight_loader,
-            })
-            set_weight_attrs(self.w2s, {
-                "weight_loader": self.weight_loader,
-            })
-
-    def weight_loader(self, param: nn.Parameter, loaded_weight: torch.Tensor,
-                      weight_name: str, expert_id: int):
+                    torch.empty(
+                        self.num_experts,
+                        self.hidden_size,
+                        self.intermediate_size,
+                        device=current_platform.device_type,
+                        dtype=self.params_dtype,
+                    )
+                )
+            set_weight_attrs(
+                self.ws,
+                {
+                    "weight_loader": self.weight_loader,
+                },
+            )
+            set_weight_attrs(
+                self.w2s,
+                {
+                    "weight_loader": self.weight_loader,
+                },
+            )
+
+    def weight_loader(
+        self,
+        param: nn.Parameter,
+        loaded_weight: torch.Tensor,
+        weight_name: str,
+        expert_id: int,
+    ):
         tp_rank = get_tensor_model_parallel_rank()
         param_data = param.ds_dequantize() if self.is_quant else param.data
         shard_size = self.intermediate_size
@@ -164,8 +208,9 @@ def weight_loader(self, param: nn.Parameter, loaded_weight: torch.Tensor,
         if weight_name.endswith("w1.weight"):
             param_data[expert_id, 0:shard_size, :] = loaded_weight[shard, :]
         if weight_name.endswith("w3.weight"):
-            param_data[expert_id,
-                       shard_size:2 * shard_size, :] = loaded_weight[shard, :]
+            param_data[expert_id, shard_size : 2 * shard_size, :] = loaded_weight[
+                shard, :
+            ]
         if weight_name.endswith("w2.weight"):
             param_data[expert_id, :, :] = loaded_weight[:, shard]
         if self.is_quant:
@@ -178,15 +223,14 @@ def local_moe_fused(self, hidden_states: torch.Tensor) -> torch.Tensor:
         router_logits, _ = self.gate(hidden_states)
         do_normalize = self.top_k > 1
         topk_weights, topk_ids, token_expert_indices = fused_topk(
-            hidden_states, router_logits, self.top_k, renormalize=do_normalize)
+            hidden_states, router_logits, self.top_k, renormalize=do_normalize
+        )
         # topk_ids: (num_tokens, k)
         if self.is_quant:
             if 2 * num_tokens <= self.num_experts:
                 # If much fewer tokens than experts, use selective dequantize.
-                ws_dequantized = self.ws.ds_selective_dequantize(
-                    topk_ids.flatten())
-                w2s_dequantized = self.w2s.ds_selective_dequantize(
-                    topk_ids.flatten())
+                ws_dequantized = self.ws.ds_selective_dequantize(topk_ids.flatten())
+                w2s_dequantized = self.w2s.ds_selective_dequantize(topk_ids.flatten())
                 # We gathered the experts to the tokens so update the mapping.
                 topk_ids = torch.arange(
                     0,
@@ -203,10 +247,10 @@ def local_moe_fused(self, hidden_states: torch.Tensor) -> torch.Tensor:
             w2s_dequantized if self.is_quant else self.w2s,
             topk_weights,
             topk_ids,
-            inplace=True)
+            inplace=True,
+        )
         if self.reduce_results and self.tp_size > 1:
-            final_hidden_states = tensor_model_parallel_all_reduce(
-                final_hidden_states)
+            final_hidden_states = tensor_model_parallel_all_reduce(final_hidden_states)
         return final_hidden_states.view(num_tokens, hidden_size)
 
     def forward(self, hidden_states: torch.Tensor):
@@ -218,7 +262,6 @@ def forward(self, hidden_states: torch.Tensor):
 
 
 class ArcticAttention(nn.Module):
-
     def __init__(
         self,
         config: ArcticConfig,
@@ -248,12 +291,14 @@ def __init__(
         self.rope_theta = config.rope_theta
         self.scaling = self.head_dim**-0.5
 
-        self.qkv_proj = QKVParallelLinear(self.hidden_size,
-                                          self.head_dim,
-                                          self.total_num_heads,
-                                          self.total_num_kv_heads,
-                                          bias=False,
-                                          quant_config=quant_config)
+        self.qkv_proj = QKVParallelLinear(
+            self.hidden_size,
+            self.head_dim,
+            self.total_num_heads,
+            self.total_num_kv_heads,
+            bias=False,
+            quant_config=quant_config,
+        )
         self.o_proj = RowParallelLinear(
             self.total_num_heads * self.head_dim,
             self.hidden_size,
@@ -270,13 +315,15 @@ def __init__(
             is_neox_style=True,
         )
 
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -292,7 +339,6 @@ def forward(
 
 
 class ArcticDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: ArcticConfig,
@@ -305,10 +351,12 @@ def __init__(
         layer_idx = extract_layer_index(prefix)
         is_moe_layer = (layer_idx + 1) % config.moe_layer_frequency == 0
         self.use_residual = config.use_residual and is_moe_layer
-        self.self_attn = ArcticAttention(config,
-                                         cache_config,
-                                         quant_config=quant_config,
-                                         prefix=f"{prefix}.self_attn")
+        self.self_attn = ArcticAttention(
+            config,
+            cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.self_attn",
+        )
         self.block_sparse_moe = ArcticMoE(
             config,
             quant_config=quant_config,
@@ -316,18 +364,21 @@ def __init__(
             prefix=f"{prefix}.block_sparse_moe",
         )
 
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
         if self.use_residual:
-            self.residual_layernorm = RMSNorm(config.hidden_size,
-                                              eps=config.rms_norm_eps)
-            self.residual_mlp = ArcticMLP(config,
-                                          is_residual_mlp=True,
-                                          reduce_results=False,
-                                          prefix=f"{prefix}.residual_mlp")
+            self.residual_layernorm = RMSNorm(
+                config.hidden_size, eps=config.rms_norm_eps
+            )
+            self.residual_mlp = ArcticMLP(
+                config,
+                is_residual_mlp=True,
+                reduce_results=False,
+                prefix=f"{prefix}.residual_mlp",
+            )
 
     def forward(
         self,
@@ -361,7 +412,6 @@ def forward(
 
 @support_torch_compile
 class ArcticModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -371,19 +421,20 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.vocab_size = config.vocab_size
         self.embed_tokens = VocabParallelEmbedding(
-            self.vocab_size,
-            config.hidden_size,
-            org_num_embeddings=self.vocab_size)
+            self.vocab_size, config.hidden_size, org_num_embeddings=self.vocab_size
+        )
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: ArcticDecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.layers",
+        )
         self._attn_implementation = config._attn_implementation
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -419,8 +470,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
         self.config = config
-        self.model = ArcticModel(vllm_config=vllm_config,
-                                 prefix=maybe_prefix(prefix, "model"))
+        self.model = ArcticModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.vocab_size = config.vocab_size
         self.lm_head = ParallelLMHead(
             self.vocab_size,
@@ -433,10 +485,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.num_experts = config.num_local_experts
         self.num_experts_per_tok = config.num_experts_per_tok
         self.unpadded_vocab_size = config.vocab_size
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size
+        )
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -448,8 +502,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -459,8 +514,7 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -474,28 +528,47 @@ def load_weights(self, weights: Iterable[tuple[str,
 
         for layer in range(num_layers):
             mlp_params_mapping.append(
-                (f"layers.{layer}.residual_mlp.w13.weight",
-                 f"layers.{layer}.residual_mlp.w1.weight", 0))
+                (
+                    f"layers.{layer}.residual_mlp.w13.weight",
+                    f"layers.{layer}.residual_mlp.w1.weight",
+                    0,
+                )
+            )
             mlp_params_mapping.append(
-                (f"layers.{layer}.residual_mlp.w13.weight",
-                 f"layers.{layer}.residual_mlp.w3.weight", 1))
+                (
+                    f"layers.{layer}.residual_mlp.w13.weight",
+                    f"layers.{layer}.residual_mlp.w3.weight",
+                    1,
+                )
+            )
             if layer % 2 == 0:
                 # MLP layers
                 mlp_params_mapping.append(
-                    (f"layers.{layer}.block_sparse_moe.mlp.w13.weight",
-                     f"layers.{layer}.block_sparse_moe.mlp.w1.weight", 0))
+                    (
+                        f"layers.{layer}.block_sparse_moe.mlp.w13.weight",
+                        f"layers.{layer}.block_sparse_moe.mlp.w1.weight",
+                        0,
+                    )
+                )
                 mlp_params_mapping.append(
-                    (f"layers.{layer}.block_sparse_moe.mlp.w13.weight",
-                     f"layers.{layer}.block_sparse_moe.mlp.w3.weight", 1))
+                    (
+                        f"layers.{layer}.block_sparse_moe.mlp.w13.weight",
+                        f"layers.{layer}.block_sparse_moe.mlp.w3.weight",
+                        1,
+                    )
+                )
             else:
                 # MoE layers
                 for expert_id in range(self.config.num_local_experts):
                     expert_params_mapping.append(
-                        ("ws", f"experts.{expert_id}.w1.weight", expert_id))
+                        ("ws", f"experts.{expert_id}.w1.weight", expert_id)
+                    )
                     expert_params_mapping.append(
-                        ("w2s", f"experts.{expert_id}.w2.weight", expert_id))
+                        ("w2s", f"experts.{expert_id}.w2.weight", expert_id)
+                    )
                     expert_params_mapping.append(
-                        ("ws", f"experts.{expert_id}.w3.weight", expert_id))
+                        ("ws", f"experts.{expert_id}.w3.weight", expert_id)
+                    )
 
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
@@ -503,9 +576,10 @@ def load_weights(self, weights: Iterable[tuple[str,
         logger.info(
             "It will take ~10 minutes loading from the 16-bit weights. "
             "Alternatively, use the prequantized 8-bit weights of arctic "
-            "and set load-format to `sharded_state` will accelerate loading.")
+            "and set load-format to `sharded_state` will accelerate loading."
+        )
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -530,8 +604,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                     weight_loader(param, loaded_weight, shard_id)
                     break
                 else:
-                    for param_name, weight_name, shard_id \
-                            in expert_params_mapping:
+                    for param_name, weight_name, shard_id in expert_params_mapping:
                         if weight_name not in name:
                             continue
                         name = name.replace(weight_name, param_name)
@@ -539,10 +612,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                             continue
                         param = params_dict[name]
                         weight_loader = param.weight_loader
-                        weight_loader(param,
-                                      loaded_weight,
-                                      weight_name,
-                                      expert_id=shard_id)
+                        weight_loader(
+                            param, loaded_weight, weight_name, expert_id=shard_id
+                        )
                         break
                     else:
                         if name.endswith(".bias") and name not in params_dict:
@@ -551,8 +623,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                             continue
                         param = params_dict[name]
 
-                        weight_loader = getattr(param, "weight_loader",
-                                                default_weight_loader)
+                        weight_loader = getattr(
+                            param, "weight_loader", default_weight_loader
+                        )
                         weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
diff --git a/vllm/model_executor/models/aria.py b/vllm/model_executor/models/aria.py
index 188624e606ff..cefdbf4fefe3 100644
--- a/vllm/model_executor/models/aria.py
+++ b/vllm/model_executor/models/aria.py
@@ -14,20 +14,27 @@
 from vllm.distributed import get_tensor_model_parallel_rank
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.fused_moe import FusedMoE
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import ColumnParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
 from vllm.multimodal.parse import MultiModalDataItems
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
@@ -35,12 +42,18 @@
 # yapf: disable
 from .idefics2_vision_model import Idefics2VisionConfig
 from .idefics2_vision_model import (
-    Idefics2VisionTransformer as Idefics3VisionTransformer)
+    Idefics2VisionTransformer as Idefics3VisionTransformer,
+)
+
 # yapf: enable
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsQuant
 from .llama import LlamaDecoderLayer, LlamaMLP, LlamaModel
-from .utils import (AutoWeightsLoader, WeightsMapper, is_pp_missing_parameter,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    is_pp_missing_parameter,
+    maybe_prefix,
+)
 
 
 class AriaImagePixelInputs(TensorSchema):
@@ -81,8 +94,7 @@ def __init__(
         # Identity layer
         self.post_layernorm = nn.Identity()
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -92,7 +104,6 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-
             # NOTE: post_layernorm is not used in Aria
             if "post_layernorm" in name:
                 continue
@@ -107,15 +118,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class AriaProjectorMLP(nn.Module):
-
     def __init__(
         self,
         in_features: int,
@@ -124,12 +133,8 @@ def __init__(
     ) -> None:
         super().__init__()
 
-        self.linear_in = ColumnParallelLinear(in_features,
-                                              hidden_features,
-                                              bias=False)
-        self.linear_out = RowParallelLinear(hidden_features,
-                                            output_dim,
-                                            bias=False)
+        self.linear_in = ColumnParallelLinear(in_features, hidden_features, bias=False)
+        self.linear_out = RowParallelLinear(hidden_features, output_dim, bias=False)
         self.act = get_act_fn("gelu_new")
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
@@ -163,15 +168,17 @@ def __init__(self, config: AriaConfig) -> None:
         self.output_dim = config.text_config.hidden_size
 
         self.query = nn.Parameter(
-            torch.empty(config.max_value_projector_patch_to_query_dict,
-                        self.in_features))
+            torch.empty(
+                config.max_value_projector_patch_to_query_dict, self.in_features
+            )
+        )
 
         self.cross_attn = AriaCrossAttention(config)
 
         self.layer_norm = nn.LayerNorm(self.in_features)
-        self.feed_forward = AriaProjectorMLP(self.in_features,
-                                             self.hidden_features,
-                                             self.output_dim)
+        self.feed_forward = AriaProjectorMLP(
+            self.in_features, self.hidden_features, self.output_dim
+        )
 
     def forward(
         self,
@@ -181,9 +188,11 @@ def forward(
         batch_size, num_patches = x.shape[0], x.shape[1]
 
         if num_patches not in self.patch_to_query_dict:
-            raise KeyError(f"Number of patches {num_patches} not found in "
-                           "patch_to_query_dict amongst possible values "
-                           f"{self.patch_to_query_dict.keys()}.")
+            raise KeyError(
+                f"Number of patches {num_patches} not found in "
+                "patch_to_query_dict amongst possible values "
+                f"{self.patch_to_query_dict.keys()}."
+            )
 
         query_num = self.patch_to_query_dict[num_patches]
 
@@ -201,32 +210,32 @@ def forward(
 
 
 class AriaFusedMoE(FusedMoE):
-
-    def weight_loader(self, param: nn.Parameter, loaded_weight: torch.Tensor,
-                      shard_id: str) -> None:
+    def weight_loader(
+        self, param: nn.Parameter, loaded_weight: torch.Tensor, shard_id: str
+    ) -> None:
         # Override the weight_loader to handle the expert weights in the Aria
         # model, which are already packed with experts, and merge the gate and
         # up weights for each expert.
         # Note: Loading expert weights with quantization is not supported
         tp_rank = get_tensor_model_parallel_rank()
-        if shard_id == 'w13':
+        if shard_id == "w13":
             # the shape of loaded_weight is
             # (num_experts, hidden_size, 2 * moe_intermediate_size)
             if self.tp_size > 1:
                 up, gate = loaded_weight.chunk(2, dim=-1)
                 up_current_rank = up.chunk(self.tp_size, dim=-1)[tp_rank]
                 gate_current_rank = gate.chunk(self.tp_size, dim=-1)[tp_rank]
-                up_and_gate = torch.cat([up_current_rank, gate_current_rank],
-                                        dim=-1).transpose(1, 2)
+                up_and_gate = torch.cat(
+                    [up_current_rank, gate_current_rank], dim=-1
+                ).transpose(1, 2)
                 param.data.copy_(up_and_gate)
             else:
                 param.data.copy_(loaded_weight.transpose(1, 2))
-        elif shard_id == 'w2':
+        elif shard_id == "w2":
             # the shape of loaded_weight is
             # (num_experts, moe_intermediate_size, hidden_size)
             if self.tp_size > 1:
-                down_current_rank = loaded_weight.chunk(self.tp_size,
-                                                        dim=1)[tp_rank]
+                down_current_rank = loaded_weight.chunk(self.tp_size, dim=1)[tp_rank]
                 param.data.copy_(down_current_rank.transpose(1, 2))
             else:
                 param.data.copy_(loaded_weight.transpose(1, 2))
@@ -251,8 +260,8 @@ def __init__(
         self.config = config
 
         self.router_weight = nn.Parameter(
-            torch.empty(
-                (self.config.moe_num_experts, self.config.hidden_size)))
+            torch.empty((self.config.moe_num_experts, self.config.hidden_size))
+        )
 
         self.experts = AriaFusedMoE(
             num_experts=config.moe_num_experts,
@@ -283,8 +292,7 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
             torch.Tensor: Output tensor after passing through the MoE layer.
         """
 
-        router_output = torch.nn.functional.linear(hidden_states,
-                                                   self.router_weight)
+        router_output = torch.nn.functional.linear(hidden_states, self.router_weight)
 
         hidden_states_copy = hidden_states.clone()
         # NOTE: hidden_states will be modified inplace by `FusedMoE`
@@ -307,9 +315,9 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = "") -> None:
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
 
-        self.mlp = AriaTextMoELayer(config,
-                                    quant_config=quant_config,
-                                    prefix=f"{prefix}.mlp")
+        self.mlp = AriaTextMoELayer(
+            config, quant_config=quant_config, prefix=f"{prefix}.mlp"
+        )
 
 
 class AriaTextModel(LlamaModel, SupportsQuant):
@@ -317,6 +325,7 @@ class AriaTextModel(LlamaModel, SupportsQuant):
     Custom LlamaModel for the AriaMoE model which modifies the standard
     LlamaModel by replacing the `LlamaDecoderLayer` with `MoEDecoderLayer`.
     """
+
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
         "gate_up_proj": ["gate_proj", "up_proj"],
@@ -325,14 +334,13 @@ class AriaTextModel(LlamaModel, SupportsQuant):
     }
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
-        super().__init__(vllm_config=vllm_config,
-                         prefix=prefix,
-                         layer_type=AriaTextDecoderLayer)
+        super().__init__(
+            vllm_config=vllm_config, prefix=prefix, layer_type=AriaTextDecoderLayer
+        )
 
     # Adapted from LlamaModel.load_weights with the modification of adding
     # the expert weights mapping to `stacked_params_mapping`
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv_proj", ".q_proj", "q"),
@@ -340,27 +348,27 @@ def load_weights(self, weights: Iterable[tuple[str,
             (".qkv_proj", ".v_proj", "v"),
             (".gate_up_proj", ".gate_proj", 0),
             (".gate_up_proj", ".up_proj", 1),
-            ("experts.w13_weight", "experts.fc1.weight", 'w13'),
-            ("experts.w2_weight", "experts.fc2.weight", 'w2'),
+            ("experts.w13_weight", "experts.fc1.weight", "w13"),
+            ("experts.w2_weight", "experts.fc2.weight", "w2"),
         ]
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            if ("rotary_emb.cos_cached" in name
-                    or "rotary_emb.sin_cached" in name):
+            if "rotary_emb.cos_cached" in name or "rotary_emb.sin_cached" in name:
                 # Models trained using ColossalAI may include these tensors in
                 # the checkpoint. Skip them.
                 continue
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
@@ -392,15 +400,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class AriaProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(AriaConfig)
 
@@ -419,7 +425,6 @@ def get_num_image_tokens(self) -> int:
 
 
 class AriaDummyInputsBuilder(BaseDummyInputsBuilder[AriaProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -442,16 +447,16 @@ def get_dummy_mm_data(
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=max_image_size,
-                                   height=max_image_size,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=max_image_size,
+                height=max_image_size,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class AriaMultiModalProcessor(BaseMultiModalProcessor[AriaProcessingInfo]):
-
     def _get_mm_fields_config(
         self,
         hf_inputs: BatchFeature,
@@ -482,9 +487,11 @@ def _get_prompt_updates(
         ]
 
 
-@MULTIMODAL_REGISTRY.register_processor(AriaMultiModalProcessor,
-                                        info=AriaProcessingInfo,
-                                        dummy_inputs=AriaDummyInputsBuilder)
+@MULTIMODAL_REGISTRY.register_processor(
+    AriaMultiModalProcessor,
+    info=AriaProcessingInfo,
+    dummy_inputs=AriaDummyInputsBuilder,
+)
 class AriaForConditionalGeneration(nn.Module, SupportsMultiModal):
     """
     Aria model for conditional generation tasks.
@@ -492,6 +499,7 @@ class AriaForConditionalGeneration(nn.Module, SupportsMultiModal):
     This model combines a vision tower, a multi-modal projector, and a language
     model to perform tasks that involve both image and text inputs.
     """
+
     merge_by_field_config = True
 
     hf_to_vllm_mapper = WeightsMapper(
@@ -537,8 +545,9 @@ def __init__(
             vllm_config=vllm_config.with_hf_config(config.text_config),
             prefix=maybe_prefix(prefix, "language_model.model"),
         )
-        self.pad_token_id = (self.config.pad_token_id
-                             if self.config.pad_token_id is not None else -1)
+        self.pad_token_id = (
+            self.config.pad_token_id if self.config.pad_token_id is not None else -1
+        )
         self.unpadded_vocab_size = config.text_config.vocab_size
         self.lm_head = ParallelLMHead(
             self.unpadded_vocab_size,
@@ -548,11 +557,13 @@ def __init__(
             prefix=maybe_prefix(prefix, "lm_head"),
         )
         logit_scale = getattr(config, "logit_scale", 1.0)
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                self.vocab_size, logit_scale)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, self.vocab_size, logit_scale
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[AriaImagePixelInputs]:
+        self, **kwargs: object
+    ) -> Optional[AriaImagePixelInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         pixel_mask = kwargs.pop("pixel_mask", None)
 
@@ -588,8 +599,8 @@ def _process_image_input(
     ) -> tuple[torch.Tensor, torch.Tensor]:
         assert self.vision_tower is not None
 
-        pixel_values = image_input['pixel_values']
-        pixel_mask = image_input['pixel_mask']
+        pixel_values = image_input["pixel_values"]
+        pixel_mask = image_input["pixel_mask"]
 
         patch_attention_mask = self._create_patch_attention_mask(pixel_mask)
 
@@ -607,8 +618,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/aya_vision.py b/vllm/model_executor/models/aya_vision.py
index a682252f4a2b..6e93de524e48 100644
--- a/vllm/model_executor/models/aya_vision.py
+++ b/vllm/model_executor/models/aya_vision.py
@@ -10,30 +10,36 @@
 from transformers.activations import ACT2FN
 from transformers.image_processing_utils import get_size_dict
 from transformers.models.aya_vision import AyaVisionConfig
-from transformers.models.aya_vision.processing_aya_vision import (
-    AyaVisionProcessor)
+from transformers.models.aya_vision.processing_aya_vision import AyaVisionProcessor
 from transformers.models.got_ocr2.image_processing_got_ocr2 import (
-    get_optimal_tiled_canvas)
+    get_optimal_tiled_canvas,
+)
 
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import MultiModalDataDict, MultiModalKwargsItems
-from vllm.multimodal.parse import (ImageProcessorItems, ImageSize,
-                                   MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo,
-                                        MultiModalFieldConfig,
-                                        PromptReplacement, PromptUpdate,
-                                        PromptUpdateDetails)
+from vllm.multimodal.parse import ImageProcessorItems, ImageSize, MultiModalDataItems
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    MultiModalFieldConfig,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
 from .siglip import SiglipVisionModel
-from .utils import (AutoWeightsLoader, WeightsMapper,
-                    init_vllm_registered_model, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 
 
 class AyaVisionImagePixelInputs(TensorSchema):
@@ -61,17 +67,17 @@ class AyaVisionImagePixelInputs(TensorSchema):
 
 
 class AyaVisionMultiModalProjector(nn.Module):
-
     def __init__(self, config: AyaVisionConfig):
         super().__init__()
         self.config = config
         self.downsample_factor = config.downsample_factor
         self.alignment_intermediate_size = getattr(
-            config, "alignment_intermediate_size",
-            config.text_config.hidden_size)
-        self.layernorm = nn.LayerNorm(config.vision_config.hidden_size *
-                                      (config.downsample_factor**2),
-                                      eps=config.adapter_layer_norm_eps)
+            config, "alignment_intermediate_size", config.text_config.hidden_size
+        )
+        self.layernorm = nn.LayerNorm(
+            config.vision_config.hidden_size * (config.downsample_factor**2),
+            eps=config.adapter_layer_norm_eps,
+        )
 
         self.linear_1 = nn.Linear(
             config.vision_config.hidden_size * (config.downsample_factor**2),
@@ -81,9 +87,11 @@ def __init__(self, config: AyaVisionConfig):
 
         self.act = ACT2FN["silu"]  # SwiGLU uses SiLU activation
         # For SwiGLU, project down to half size since we split intermediate dim
-        self.linear_2 = nn.Linear(self.alignment_intermediate_size // 2,
-                                  config.text_config.hidden_size,
-                                  bias=True)
+        self.linear_2 = nn.Linear(
+            self.alignment_intermediate_size // 2,
+            config.text_config.hidden_size,
+            bias=True,
+        )
 
     def forward(self, image_features: torch.Tensor) -> torch.Tensor:
         image_features = self.pixel_shuffle(image_features)
@@ -97,26 +105,31 @@ def forward(self, image_features: torch.Tensor) -> torch.Tensor:
         hidden_states = self.linear_2(hidden_states)
         return hidden_states
 
-    def pixel_shuffle(self,
-                      image_features: torch.Tensor) -> torch.Tensor:  # B, S, D
+    def pixel_shuffle(self, image_features: torch.Tensor) -> torch.Tensor:  # B, S, D
         batch_size, seq_length, _ = image_features.shape
         height = width = int(seq_length**0.5)
-        image_features = image_features.reshape(image_features.shape[0], width,
-                                                height, -1)
+        image_features = image_features.reshape(
+            image_features.shape[0], width, height, -1
+        )
         channels = image_features.shape[-1]
         image_features = image_features.reshape(
-            batch_size, width, int(height / self.downsample_factor),
-            int(channels * self.downsample_factor))
+            batch_size,
+            width,
+            int(height / self.downsample_factor),
+            int(channels * self.downsample_factor),
+        )
         image_features = image_features.permute(0, 2, 1, 3)
         image_features = image_features.reshape(
-            batch_size, int(height / self.downsample_factor),
-            int(width / self.downsample_factor), -1)
+            batch_size,
+            int(height / self.downsample_factor),
+            int(width / self.downsample_factor),
+            -1,
+        )
         image_features = image_features.permute(0, 2, 1, 3)
         return image_features
 
 
 class AyaVisionProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self) -> AyaVisionConfig:
         return self.ctx.get_hf_config(AyaVisionConfig)
 
@@ -131,14 +144,20 @@ def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
 
     def get_image_size_with_most_features(self) -> ImageSize:
         image_processor = self.get_image_processor()
-        height = image_processor.size['height']
-        width = image_processor.size['width']
+        height = image_processor.size["height"]
+        width = image_processor.size["width"]
         max_patches = image_processor.max_patches
-        return ImageSize(height=height * max_patches,
-                         width=width * max_patches)
+        return ImageSize(height=height * max_patches, width=width * max_patches)
 
-    def get_num_patches(self, *, image_width: int, image_height: int,
-                        size: dict, min_patches: int, max_patches: int) -> int:
+    def get_num_patches(
+        self,
+        *,
+        image_width: int,
+        image_height: int,
+        size: dict,
+        min_patches: int,
+        max_patches: int,
+    ) -> int:
         """
         Calculate the number of patches needed for a given image based on size
         constraints.  This method replicates and adjusts the logic from:
@@ -146,15 +165,16 @@ def get_num_patches(self, *, image_width: int, image_height: int,
         """
         size = get_size_dict(size, default_to_square=False)
         num_columns, num_rows = get_optimal_tiled_canvas(
-            (image_height, image_width), (size["height"], size["width"]),
-            min_patches, max_patches)
+            (image_height, image_width),
+            (size["height"], size["width"]),
+            min_patches,
+            max_patches,
+        )
         num_blocks = num_columns * num_rows
         return num_blocks if num_blocks == 1 else num_blocks + 1
 
 
-class AyaVisionDummyInputsBuilder(
-        BaseDummyInputsBuilder[AyaVisionProcessingInfo]):
-
+class AyaVisionDummyInputsBuilder(BaseDummyInputsBuilder[AyaVisionProcessingInfo]):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -170,23 +190,21 @@ def get_dummy_mm_data(
         mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
-        image_size = \
-            self.info.get_image_size_with_most_features()
+        image_size = self.info.get_image_size_with_most_features()
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=image_size.width,
-                                   height=image_size.height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=image_size.width,
+                height=image_size.height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
-class AyaVisionMultiModalProcessor(
-        BaseMultiModalProcessor[AyaVisionProcessingInfo]):
-
+class AyaVisionMultiModalProcessor(BaseMultiModalProcessor[AyaVisionProcessingInfo]):
     def _call_hf_processor(
         self,
         prompt: str,
@@ -205,13 +223,13 @@ def _call_hf_processor(
 
         # HF processor pops the `num_patches` kwarg, which is needed by vLLM
         if (images := mm_data.get("images")) is not None:
-            parsed_images = (self._get_data_parser().parse_mm_data({
-                "image":
-                images
-            }).get_items("image", ImageProcessorItems))
+            parsed_images = (
+                self._get_data_parser()
+                .parse_mm_data({"image": images})
+                .get_items("image", ImageProcessorItems)
+            )
             image_sizes = [
-                parsed_images.get_image_size(i)
-                for i in range(len(parsed_images))
+                parsed_images.get_image_size(i) for i in range(len(parsed_images))
             ]
 
             num_patches = [
@@ -220,7 +238,8 @@ def _call_hf_processor(
                     image_height=image_size.height,
                     size=image_processor.size,
                     min_patches=image_processor.min_patches,
-                    max_patches=image_processor.max_patches)
+                    max_patches=image_processor.max_patches,
+                )
                 for image_size in image_sizes
             ]
             processed_outputs["num_patches"] = torch.tensor(num_patches)
@@ -234,8 +253,7 @@ def _get_mm_fields_config(
     ) -> Mapping[str, MultiModalFieldConfig]:
         num_patches = hf_inputs.get("num_patches", torch.empty(0))
         return dict(
-            pixel_values=MultiModalFieldConfig.flat_from_sizes(
-                "image", num_patches),
+            pixel_values=MultiModalFieldConfig.flat_from_sizes("image", num_patches),
             num_patches=MultiModalFieldConfig.batched("image"),
             image_embeds=MultiModalFieldConfig.batched("image"),
         )
@@ -282,10 +300,10 @@ def _get_num_hidden_layers(hf_config: AyaVisionConfig) -> int:
         return _get_layer_index(feature_layers, num_hidden_layers)
     # If we have multiple feature layers, initialize up to the deepest m
     elif isinstance(feature_layers, (list, tuple)):
-        return max(
-            _get_layer_index(idx, num_hidden_layers) for idx in feature_layers)
-    raise TypeError(f"vision_layer_feature type: {type(feature_layers)}"
-                    " is not supported")
+        return max(_get_layer_index(idx, num_hidden_layers) for idx in feature_layers)
+    raise TypeError(
+        f"vision_layer_feature type: {type(feature_layers)} is not supported"
+    )
 
 
 def _get_layer_index(feature_layer_index: int, num_hidden_layers: int) -> int:
@@ -297,9 +315,9 @@ def _get_layer_index(feature_layer_index: int, num_hidden_layers: int) -> int:
 @MULTIMODAL_REGISTRY.register_processor(
     AyaVisionMultiModalProcessor,
     info=AyaVisionProcessingInfo,
-    dummy_inputs=AyaVisionDummyInputsBuilder)
-class AyaVisionForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                        SupportsPP):
+    dummy_inputs=AyaVisionDummyInputsBuilder,
+)
+class AyaVisionForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP):
     merge_by_field_config = True
 
     hf_to_vllm_mapper = WeightsMapper(
@@ -309,7 +327,8 @@ class AyaVisionForConditionalGeneration(nn.Module, SupportsMultiModal,
             "model.vision_tower.": "vision_tower.",
             "model.multi_modal_projector.": "multi_modal_projector.",
             "lm_head.": "language_model.lm_head.",
-        })
+        }
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -332,7 +351,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             config.vision_config,
             quant_config,
             num_hidden_layers_override=num_hidden_layers,
-            prefix=maybe_prefix(prefix, "vision_model"))
+            prefix=maybe_prefix(prefix, "vision_model"),
+        )
         self.vocab_size = config.text_config.vocab_size
         self.multi_modal_projector = AyaVisionMultiModalProjector(config)
         self.language_model = init_vllm_registered_model(
@@ -340,14 +360,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             hf_config=config.text_config,
             prefix=maybe_prefix(prefix, "model"),
             # Cohere2ForCausalLM and CohereForCausalLM are the same on vllm
-            architectures=["Cohere2ForCausalLM"])
+            architectures=["Cohere2ForCausalLM"],
+        )
 
     @property
     def dtype(self):
         return next(self.parameters()).dtype
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
@@ -361,20 +381,21 @@ def _image_pixels_to_features(
             feature_select_strategy=self.config.vision_feature_select_strategy,
         )
 
-    def _process_image_input(self, image_input: AyaVisionImagePixelInputs,
-                             **kwargs) -> list[torch.Tensor]:
+    def _process_image_input(
+        self, image_input: AyaVisionImagePixelInputs, **kwargs
+    ) -> list[torch.Tensor]:
         assert self.vision_tower is not None
         pixel_values = image_input["pixel_values"]
         num_patches = image_input["num_patches"]
         image_features = self._image_pixels_to_features(
-            self.vision_tower, pixel_values=pixel_values)
+            self.vision_tower, pixel_values=pixel_values
+        )
         image_embeds = self.multi_modal_projector(image_features)
-        return [
-            e.flatten(0, 2) for e in image_embeds.split(num_patches.tolist())
-        ]
+        return [e.flatten(0, 2) for e in image_embeds.split(num_patches.tolist())]
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[AyaVisionImagePixelInputs]:
+        self, **kwargs: object
+    ) -> Optional[AyaVisionImagePixelInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         num_patches = kwargs.pop("num_patches", None)
         image_embeds = kwargs.pop("image_embeds", None)
@@ -390,13 +411,13 @@ def _parse_and_validate_image_input(
             resolve_bindings={
                 "h": self.config.vision_config.image_size,
                 "w": self.config.vision_config.image_size,
-            })
+            },
+        )
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/baichuan.py b/vllm/model_executor/models/baichuan.py
index db8d0a871047..a8f0e5993e2b 100644
--- a/vllm/model_executor/models/baichuan.py
+++ b/vllm/model_executor/models/baichuan.py
@@ -20,6 +20,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only BaiChuan model compatible with HuggingFace weights."""
+
 import math
 from collections.abc import Iterable
 from itertools import islice
@@ -32,32 +33,45 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (get_pp_group, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, row_parallel_weight_loader)
+    default_weight_loader,
+    row_parallel_weight_loader,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP, SupportsQuant
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 def _get_alibi_slopes(total_num_heads: int) -> torch.Tensor:
-    closest_power_of_2 = 2**math.floor(math.log2(total_num_heads))
+    closest_power_of_2 = 2 ** math.floor(math.log2(total_num_heads))
     base = torch.tensor(
-        2**(-(2**-(math.log2(closest_power_of_2) - 3))),
+        2 ** (-(2 ** -(math.log2(closest_power_of_2) - 3))),
         dtype=torch.float32,
     )
     powers = torch.arange(1, 1 + closest_power_of_2, dtype=torch.int32)
@@ -65,22 +79,20 @@ def _get_alibi_slopes(total_num_heads: int) -> torch.Tensor:
 
     if closest_power_of_2 != total_num_heads:
         extra_base = torch.tensor(
-            2**(-(2**-(math.log2(2 * closest_power_of_2) - 3))),
+            2 ** (-(2 ** -(math.log2(2 * closest_power_of_2) - 3))),
             dtype=torch.float32,
         )
-        num_remaining_heads = min(closest_power_of_2,
-                                  total_num_heads - closest_power_of_2)
-        extra_powers = torch.arange(start=1,
-                                    end=1 + 2 * num_remaining_heads,
-                                    step=2,
-                                    dtype=torch.int32)
-        slopes = torch.cat(
-            [slopes, torch.pow(extra_base, extra_powers)], dim=0)
+        num_remaining_heads = min(
+            closest_power_of_2, total_num_heads - closest_power_of_2
+        )
+        extra_powers = torch.arange(
+            start=1, end=1 + 2 * num_remaining_heads, step=2, dtype=torch.int32
+        )
+        slopes = torch.cat([slopes, torch.pow(extra_base, extra_powers)], dim=0)
     return slopes
 
 
 class BaiChuanMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -90,16 +102,15 @@ def __init__(
     ):
         super().__init__()
         self.gate_up_proj = MergedColumnParallelLinear(
-            hidden_size, [intermediate_size] * 2,
-            bias=False,
-            quant_config=quant_config)
-        self.down_proj = RowParallelLinear(intermediate_size,
-                                           hidden_size,
-                                           bias=False,
-                                           quant_config=quant_config)
+            hidden_size, [intermediate_size] * 2, bias=False, quant_config=quant_config
+        )
+        self.down_proj = RowParallelLinear(
+            intermediate_size, hidden_size, bias=False, quant_config=quant_config
+        )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -125,12 +136,10 @@ def __init__(
     ):
         super().__init__()
         self.hidden_size = hidden_size
-        tensor_model_parallel_world_size = get_tensor_model_parallel_world_size(
-        )
+        tensor_model_parallel_world_size = get_tensor_model_parallel_world_size()
         self.total_num_heads = num_heads
         assert self.total_num_heads % tensor_model_parallel_world_size == 0
-        self.num_heads = (self.total_num_heads //
-                          tensor_model_parallel_world_size)
+        self.num_heads = self.total_num_heads // tensor_model_parallel_world_size
         self.head_dim = hidden_size // self.total_num_heads
         self.position_embedding = position_embedding
         self.rope_theta = rope_theta
@@ -160,12 +169,14 @@ def __init__(
             alibi_slopes = alibi_slopes[head_start:head_end].tolist()
 
             scaling = self.head_dim**-0.5
-            self.attn = Attention(self.num_heads,
-                                  self.head_dim,
-                                  scaling,
-                                  alibi_slopes=alibi_slopes,
-                                  quant_config=quant_config,
-                                  prefix=f"{prefix}.attn")
+            self.attn = Attention(
+                self.num_heads,
+                self.head_dim,
+                scaling,
+                alibi_slopes=alibi_slopes,
+                quant_config=quant_config,
+                prefix=f"{prefix}.attn",
+            )
         else:
             self.rotary_emb = get_rope(
                 self.head_dim,
@@ -174,12 +185,14 @@ def __init__(
                 base=self.rope_theta,
             )
             self.scaling = self.head_dim**-0.5
-            self.attn = Attention(self.num_heads,
-                                  self.head_dim,
-                                  self.scaling,
-                                  cache_config=cache_config,
-                                  quant_config=quant_config,
-                                  prefix=f"{prefix}.attn")
+            self.attn = Attention(
+                self.num_heads,
+                self.head_dim,
+                self.scaling,
+                cache_config=cache_config,
+                quant_config=quant_config,
+                prefix=f"{prefix}.attn",
+            )
 
     def forward(
         self,
@@ -196,18 +209,18 @@ def forward(
 
 
 class BaiChuanDecoderLayer(nn.Module):
-
-    def __init__(self,
-                 config: PretrainedConfig,
-                 position_embedding: str,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: PretrainedConfig,
+        position_embedding: str,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.hidden_size = config.hidden_size
         rope_theta = getattr(config, "rope_theta", 10000)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         self.self_attn = BaiChuanAttention(
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
@@ -224,10 +237,10 @@ def __init__(self,
             hidden_act=config.hidden_act,
             quant_config=quant_config,
         )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -240,23 +253,20 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
 
 @support_torch_compile
 class BaiChuanModel(nn.Module):
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -278,17 +288,15 @@ def __init__(
         )
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: BaiChuanDecoderLayer(config,
-                                                position_embedding,
-                                                cache_config,
-                                                quant_config,
-                                                prefix=prefix),
+            lambda prefix: BaiChuanDecoderLayer(
+                config, position_embedding, cache_config, quant_config, prefix=prefix
+            ),
             prefix=f"{prefix}.layers",
         )
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -317,15 +325,16 @@ def forward(
                 residual,
             )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual,
-            })
+            return IntermediateTensors(
+                {
+                    "hidden_states": hidden_states,
+                    "residual": residual,
+                }
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("gate_up_proj", "gate_proj", 0),
@@ -337,7 +346,7 @@ def load_weights(self, weights: Iterable[tuple[str,
             if "rotary_emb.inv_freq" in name:
                 continue
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -357,15 +366,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
-class BaiChuanBaseForCausalLM(nn.Module, SupportsLoRA, SupportsPP,
-                              SupportsQuant):
+class BaiChuanBaseForCausalLM(nn.Module, SupportsLoRA, SupportsPP, SupportsQuant):
     packed_modules_mapping = {
         "W_pack": ["W_pack"],
         "gate_up_proj": [
@@ -389,19 +396,24 @@ def __init__(
         self.lora_config = lora_config
         self.tp_size = get_tensor_model_parallel_world_size()
         self.quant_config = quant_config
-        self.model = BaiChuanModel(vllm_config=vllm_config,
-                                   prefix=prefix,
-                                   position_embedding=position_embedding)
-        self.lm_head = ParallelLMHead(config.vocab_size,
-                                      config.hidden_size,
-                                      quant_config=quant_config,
-                                      prefix=maybe_prefix(prefix, "lm_head"))
+        self.model = BaiChuanModel(
+            vllm_config=vllm_config,
+            prefix=prefix,
+            position_embedding=position_embedding,
+        )
+        self.lm_head = ParallelLMHead(
+            config.vocab_size,
+            config.hidden_size,
+            quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
         self.lm_head.weight.weight_loader = self.lm_head_weight_loader
         if self.config.tie_word_embeddings:
             self.lm_head.weight = self.model.embed_tokens.weight
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -413,8 +425,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -424,13 +437,11 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
 
-    def lm_head_weight_loader(self, param: nn.Parameter,
-                              loaded_weight: torch.Tensor):
+    def lm_head_weight_loader(self, param: nn.Parameter, loaded_weight: torch.Tensor):
         # Unlike Baichuan, Baichuan2 normalizes the head weights.
         # Refer to:
         # https://huggingface.co/baichuan-inc/Baichuan2-7B-Chat/blob/84603cde5ebffb6084e476cfaeceaf0b8b91fe54/modeling_baichuan.py#L508
@@ -454,13 +465,13 @@ class BaichuanForCausalLM(BaiChuanBaseForCausalLM):
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         if config.hidden_size == 4096:  # baichuan2 7b
-            super().__init__(vllm_config=vllm_config,
-                             prefix=prefix,
-                             position_embedding="ROPE")
+            super().__init__(
+                vllm_config=vllm_config, prefix=prefix, position_embedding="ROPE"
+            )
         else:  # baichuan 13b, baichuan2 13b
-            super().__init__(vllm_config=vllm_config,
-                             prefix=prefix,
-                             position_embedding="ALIBI")
+            super().__init__(
+                vllm_config=vllm_config, prefix=prefix, position_embedding="ALIBI"
+            )
 
 
 class BaiChuanForCausalLM(BaiChuanBaseForCausalLM):
@@ -469,6 +480,6 @@ class BaiChuanForCausalLM(BaiChuanBaseForCausalLM):
     """
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
-        super().__init__(vllm_config=vllm_config,
-                         prefix=prefix,
-                         position_embedding="ROPE")
+        super().__init__(
+            vllm_config=vllm_config, prefix=prefix, position_embedding="ROPE"
+        )
diff --git a/vllm/model_executor/models/bailing_moe.py b/vllm/model_executor/models/bailing_moe.py
index 6e470378cb60..0b2283f82d39 100644
--- a/vllm/model_executor/models/bailing_moe.py
+++ b/vllm/model_executor/models/bailing_moe.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only BailingMoE model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -35,31 +36,42 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (get_pp_group, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_reduce)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_reduce,
+)
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class BailingAttention(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -79,8 +91,7 @@ def __init__(
         assert self.total_num_heads >= self.total_kv_heads
 
         self.num_heads = self.total_num_heads // tp_size
-        self.head_dim = config.head_dim or (self.hidden_size //
-                                            self.total_num_heads)
+        self.head_dim = config.head_dim or (self.hidden_size // self.total_num_heads)
         self.q_size_per_rank = self.head_dim * self.num_heads
         self.num_kv_heads = self.total_kv_heads // tp_size
         self.kv_size_per_rank = self.num_kv_heads * self.head_dim
@@ -99,12 +110,16 @@ def __init__(
         )
 
         if self.use_qk_norm:
-            self.query_layernorm = (RMSNorm(
-                self.head_dim, eps=config.rms_norm_eps) if self.use_rmsnorm
-                                    else nn.LayerNorm(self.head_dim, eps=1e-6))
-            self.key_layernorm = (RMSNorm(
-                self.head_dim, eps=config.rms_norm_eps) if self.use_rmsnorm
-                                  else nn.LayerNorm(self.head_dim, eps=1e-6))
+            self.query_layernorm = (
+                RMSNorm(self.head_dim, eps=config.rms_norm_eps)
+                if self.use_rmsnorm
+                else nn.LayerNorm(self.head_dim, eps=1e-6)
+            )
+            self.key_layernorm = (
+                RMSNorm(self.head_dim, eps=config.rms_norm_eps)
+                if self.use_rmsnorm
+                else nn.LayerNorm(self.head_dim, eps=1e-6)
+            )
 
         self.dense = RowParallelLinear(
             self.total_num_heads * self.head_dim,
@@ -115,8 +130,7 @@ def __init__(
             prefix=f"{prefix}.dense",
         )
 
-        self.partial_rotary_factor = getattr(config, "partial_rotary_factor",
-                                             1.0)
+        self.partial_rotary_factor = getattr(config, "partial_rotary_factor", 1.0)
 
         self.rotary_dim = getattr(config, "rotary_dim", self.head_dim)
 
@@ -144,12 +158,10 @@ def forward(
         hidden_states: torch.Tensor,
         position_ids: torch.Tensor,
     ) -> torch.Tensor:
-
         qkv, _ = self.query_key_value(hidden_states)
-        q, k, v = qkv.split([
-            self.q_size_per_rank, self.kv_size_per_rank, self.kv_size_per_rank
-        ],
-                            dim=-1)
+        q, k, v = qkv.split(
+            [self.q_size_per_rank, self.kv_size_per_rank, self.kv_size_per_rank], dim=-1
+        )
 
         if self.use_qk_norm:
             q = q.view(-1, self.num_heads, self.head_dim)
@@ -168,7 +180,6 @@ def forward(
 
 
 class BailingMLP(nn.Module):
-
     def __init__(
         self,
         intermediate_size: int,
@@ -203,7 +214,6 @@ def forward(self, x):
 
 
 class BailingMoE(nn.Module):
-
     def __init__(
         self,
         intermediate_size: int,
@@ -225,10 +235,8 @@ def __init__(
         self.score_function = getattr(config, "score_function", None)
         self.n_group = getattr(config, "n_group", None)
         self.topk_group = getattr(config, "topk_group", None)
-        self.use_grouped_topk = (self.n_group is not None
-                                 and self.topk_group is not None)
-        self.routed_scaling_factor = getattr(config, "routed_scaling_factor",
-                                             1.0)
+        self.use_grouped_topk = self.n_group is not None and self.topk_group is not None
+        self.routed_scaling_factor = getattr(config, "routed_scaling_factor", 1.0)
 
         router_dtype = getattr(config, "router_dtype", None)
         if router_dtype is None:
@@ -247,21 +255,23 @@ def __init__(
 
         if getattr(config, "moe_router_enable_expert_bias", False):
             self.gate.expert_bias = nn.Parameter(
-                torch.empty((config.num_experts, ), dtype=torch.float32))
+                torch.empty((config.num_experts,), dtype=torch.float32)
+            )
         else:
             self.gate.expert_bias = None
 
-        self.correction_bias = (self.gate.expert_bias.data
-                                if self.gate.expert_bias is not None else None)
+        self.correction_bias = (
+            self.gate.expert_bias.data if self.gate.expert_bias is not None else None
+        )
 
         if self.score_function is not None:
             assert (
-                self.score_function == "softmax"
-                and self.correction_bias is None
+                self.score_function == "softmax" and self.correction_bias is None
             ) or (
-                self.score_function == "sigmoid"
-                and self.correction_bias is not None
-            ), "score_function and correction_bias should be in 2 combination (softmax, None) or (sigmoid, not None)"  # noqa: E501
+                self.score_function == "sigmoid" and self.correction_bias is not None
+            ), (
+                "score_function and correction_bias should be in 2 combination (softmax, None) or (sigmoid, not None)"
+            )  # noqa: E501
         else:
             # default value for scoring_func
             self.score_function = "softmax"
@@ -293,7 +303,8 @@ def __init__(
                 config=config,
                 quant_config=quant_config,
                 reduce_results=False,
-                prefix=f"{prefix}.shared_experts")
+                prefix=f"{prefix}.shared_experts",
+            )
         else:
             self.shared_experts = None
 
@@ -306,8 +317,9 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         router_logits = self.gate(hidden_states.to(self.router_dtype))
         router_logits = router_logits.to(hidden_states.dtype)
 
-        final_hidden_states = self.experts(hidden_states=hidden_states,
-                                           router_logits=router_logits)
+        final_hidden_states = self.experts(
+            hidden_states=hidden_states, router_logits=router_logits
+        )
 
         final_hidden_states *= self.routed_scaling_factor
 
@@ -315,13 +327,11 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
             final_hidden_states = final_hidden_states + shared_output
 
         if self.tp_size > 1:
-            final_hidden_states = tensor_model_parallel_all_reduce(
-                final_hidden_states)
+            final_hidden_states = tensor_model_parallel_all_reduce(final_hidden_states)
         return final_hidden_states.view(num_tokens, hidden_size)
 
 
 class BailingMoeBlock(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -330,30 +340,26 @@ def __init__(
         prefix: str = "",
     ):
         super().__init__()
-        layer_idx = int(prefix.split('.')[-1])
+        layer_idx = int(prefix.split(".")[-1])
         self.config = config
         hidden_size = config.hidden_size
         intermediate_size = config.intermediate_size
 
         self.input_layernorm = RMSNorm(hidden_size, eps=config.rms_norm_eps)
-        self.attention = BailingAttention(config,
-                                          cache_config,
-                                          quant_config,
-                                          prefix=f"{prefix}.attention")
+        self.attention = BailingAttention(
+            config, cache_config, quant_config, prefix=f"{prefix}.attention"
+        )
 
-        self.post_attention_layernorm = RMSNorm(hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(hidden_size, eps=config.rms_norm_eps)
 
         # Choose MLP class based on the number of experts and layer index
         if layer_idx < config.first_k_dense_replace:
             mlp_class = BailingMLP
         else:
             mlp_class = BailingMoE
-        self.mlp = mlp_class(intermediate_size,
-                             config,
-                             quant_config,
-                             True,
-                             prefix=f"{prefix}.mlp")
+        self.mlp = mlp_class(
+            intermediate_size, config, quant_config, True, prefix=f"{prefix}.mlp"
+        )
 
     def forward(
         self,
@@ -365,23 +371,20 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
 
         hidden_states = self.attention(
             hidden_states=hidden_states,
             position_ids=position_ids,
         )
 
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
 
 @support_torch_compile
 class BailingMoeModel(nn.Module):
-
     def __init__(
         self,
         *,
@@ -396,11 +399,11 @@ def __init__(
         self.config = config
         self.vocab_size = config.vocab_size
         self.embed_dim = config.hidden_size
-        self.tie_word_embeddings = getattr(config, "tie_word_embeddings",
-                                           False)
+        self.tie_word_embeddings = getattr(config, "tie_word_embeddings", False)
 
-        if get_pp_group().is_first_rank or (self.tie_word_embeddings
-                                            and get_pp_group().is_last_rank):
+        if get_pp_group().is_first_rank or (
+            self.tie_word_embeddings and get_pp_group().is_last_rank
+        ):
             self.word_embeddings = VocabParallelEmbedding(
                 self.vocab_size,
                 self.embed_dim,
@@ -420,11 +423,12 @@ def __init__(
                 quant_config=quant_config,
                 prefix=prefix,
             ),
-            prefix=f"{prefix}.layers")
+            prefix=f"{prefix}.layers",
+        )
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
         if get_pp_group().is_last_rank:
             self.norm = RMSNorm(self.embed_dim, eps=config.rms_norm_eps)
@@ -460,10 +464,9 @@ def forward(
             )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         else:
             if residual is None:
                 hidden_states = self.norm(hidden_states)
@@ -479,8 +482,7 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
             num_experts=self.config.num_experts,
         )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("gate_up_proj", "gate_proj", 0),
@@ -491,14 +493,14 @@ def load_weights(self, weights: Iterable[tuple[str,
         loaded_params: set[str] = set()
         expert_params_mapping = self.get_expert_mapping()
         for name, loaded_weight in weights:
-            if (hasattr(self.config, "norm_head") and self.config.norm_head
-                    and "lm_head.weight" in name):
-                loaded_weight = F.normalize(loaded_weight,
-                                            dim=0,
-                                            p=2,
-                                            eps=1e-7)
-
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            if (
+                hasattr(self.config, "norm_head")
+                and self.config.norm_head
+                and "lm_head.weight" in name
+            ):
+                loaded_weight = F.normalize(loaded_weight, dim=0, p=2, eps=1e-7)
+
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 if "mlp.experts" in name:
@@ -548,15 +550,15 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
 
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class BailingMoeForCausalLM(nn.Module, SupportsPP, SupportsLoRA):
-
     packed_modules_mapping = {
         "query_key_value": ["query_key_value"],
         "gate_up_proj": [
@@ -582,10 +584,10 @@ def __init__(
         self.lora_config = lora_config
         self.quant_config = quant_config
         self.max_position_embeddings = config.max_position_embeddings
-        self.model = BailingMoeModel(vllm_config=vllm_config,
-                                     prefix=maybe_prefix(prefix, "model"))
-        self.tie_word_embeddings = getattr(config, "tie_word_embeddings",
-                                           False)
+        self.model = BailingMoeModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
+        self.tie_word_embeddings = getattr(config, "tie_word_embeddings", False)
 
         if get_pp_group().is_last_rank:
             if self.tie_word_embeddings:
@@ -602,7 +604,8 @@ def __init__(
             self.lm_head = PPMissingLayer()
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -614,8 +617,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        model_output = self.model(input_ids, positions, intermediate_tensors,
-                                  inputs_embeds)
+        model_output = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return model_output
 
     def compute_logits(
@@ -625,8 +629,7 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
             skip_prefixes=(["lm_head."] if self.tie_word_embeddings else None),
diff --git a/vllm/model_executor/models/bamba.py b/vllm/model_executor/models/bamba.py
index c58d6eaa19cb..42c1c7be1a75 100644
--- a/vllm/model_executor/models/bamba.py
+++ b/vllm/model_executor/models/bamba.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Inference-only Bamba model."""
+
 # Added by the IBM Team, 2024
 from collections.abc import Iterable
 from typing import Optional
@@ -16,29 +17,38 @@
 from vllm.distributed.parallel_state import get_pp_group
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.mamba.mamba_mixer2 import MambaMixer2
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
-from .interfaces import (HasInnerState, IsHybrid, SupportsLoRA, SupportsPP,
-                         SupportsQuant)
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .interfaces import HasInnerState, IsHybrid, SupportsLoRA, SupportsPP, SupportsQuant
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class BambaMLP(nn.Module):
-
     def __init__(
         self,
         config: BambaConfig,
@@ -59,8 +69,10 @@ def __init__(
             quant_config=quant_config,
         )
         if config.hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {config.hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {config.hidden_act}. "
+                "Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -71,38 +83,38 @@ def forward(self, x):
 
 
 class BambaMixerDecoderLayer(nn.Module):
-
-    def __init__(self,
-                 config: BambaConfig,
-                 layer_idx: int,
-                 model_config: Optional[ModelConfig] = None,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: BambaConfig,
+        layer_idx: int,
+        model_config: Optional[ModelConfig] = None,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
         self.config = config
-        self.mamba = MambaMixer2(hidden_size= config.hidden_size,
-                                ssm_state_size = config.mamba_d_state,
-                                conv_kernel_size = config.mamba_d_conv,
-                                intermediate_size = config.mamba_expand *\
-                                                    config.hidden_size,
-                                use_conv_bias = config.mamba_conv_bias,
-                                use_bias = config.mamba_proj_bias,
-                                n_groups=config.mamba_n_groups,
-                                num_heads=config.mamba_n_heads,
-                                head_dim=config.mamba_d_head,
-                                rms_norm_eps=config.rms_norm_eps,
-                                activation=config.hidden_act,
-                                model_config=model_config,
-                                cache_config=cache_config,
-                                quant_config=quant_config,
-                                prefix=f"{prefix}.mixer")
+        self.mamba = MambaMixer2(
+            hidden_size=config.hidden_size,
+            ssm_state_size=config.mamba_d_state,
+            conv_kernel_size=config.mamba_d_conv,
+            intermediate_size=config.mamba_expand * config.hidden_size,
+            use_conv_bias=config.mamba_conv_bias,
+            use_bias=config.mamba_proj_bias,
+            n_groups=config.mamba_n_groups,
+            num_heads=config.mamba_n_heads,
+            head_dim=config.mamba_d_head,
+            rms_norm_eps=config.rms_norm_eps,
+            activation=config.hidden_act,
+            model_config=model_config,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.mixer",
+        )
 
         self.feed_forward = BambaMLP(config, quant_config=quant_config)
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.pre_ff_layernorm = RMSNorm(config.hidden_size,
-                                        eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.pre_ff_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def forward(
         self,
@@ -114,8 +126,7 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
 
         output = torch.empty_like(hidden_states)
         self.mamba(hidden_states, output)
@@ -126,7 +137,6 @@ def forward(
 
 
 class BambaAttentionDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: BambaConfig,
@@ -139,8 +149,7 @@ def __init__(
         super().__init__()
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         self.hidden_size = config.hidden_size
         tp_size = get_tensor_model_parallel_world_size()
         self.total_num_heads = config.num_attention_heads
@@ -188,10 +197,12 @@ def __init__(
             bias=False,
             quant_config=quant_config,
         )
-        self.o_proj = RowParallelLinear(self.total_num_heads * self.head_dim,
-                                        config.hidden_size,
-                                        bias=False,
-                                        quant_config=quant_config)
+        self.o_proj = RowParallelLinear(
+            self.total_num_heads * self.head_dim,
+            config.hidden_size,
+            bias=False,
+            quant_config=quant_config,
+        )
 
         self.attn = Attention(
             self.num_heads,
@@ -203,10 +214,8 @@ def __init__(
         )
 
         self.feed_forward = BambaMLP(config, quant_config=quant_config)
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.pre_ff_layernorm = RMSNorm(config.hidden_size,
-                                        eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.pre_ff_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def self_attention(
         self,
@@ -233,29 +242,26 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
 
         hidden_states = self.self_attention(
             positions=positions,
             hidden_states=hidden_states,
         )
         # Fully Connected
-        hidden_states, residual = self.pre_ff_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.pre_ff_layernorm(hidden_states, residual)
         hidden_states = self.feed_forward(hidden_states)
         return hidden_states, residual
 
 
 ALL_DECODER_LAYER_TYPES = {
     "attention": BambaAttentionDecoderLayer,
-    "mamba": BambaMixerDecoderLayer
+    "mamba": BambaMixerDecoderLayer,
 }
 
 
 @support_torch_compile
 class BambaModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -266,8 +272,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         lora_config = vllm_config.lora_config
 
         self.config = config
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
 
@@ -279,8 +288,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         def get_layer(prefix: str):
             layer_idx = int(prefix.rsplit(".", 1)[1])
-            layer_class = ALL_DECODER_LAYER_TYPES[
-                config.layers_block_type[layer_idx]]
+            layer_class = ALL_DECODER_LAYER_TYPES[config.layers_block_type[layer_idx]]
             return layer_class(
                 config,
                 layer_idx,
@@ -291,13 +299,13 @@ def get_layer(prefix: str):
             )
 
         self.start_layer, self.end_layer, self.layers = make_layers(
-            config.num_hidden_layers, get_layer, prefix=f"{prefix}.layers")
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+            config.num_hidden_layers, get_layer, prefix=f"{prefix}.layers"
+        )
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
-        self.final_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
+        self.final_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -309,7 +317,6 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-
         if get_pp_group().is_first_rank:
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
@@ -330,15 +337,13 @@ def forward(
             )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.final_layernorm(hidden_states, residual)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -383,22 +388,22 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
-class BambaForCausalLM(nn.Module, HasInnerState, SupportsLoRA, SupportsPP,
-                       IsHybrid, SupportsQuant):
+class BambaForCausalLM(
+    nn.Module, HasInnerState, SupportsLoRA, SupportsPP, IsHybrid, SupportsQuant
+):
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
             "k_proj",
             "v_proj",
         ],
-        "gate_up_proj": ["up_proj", "down_proj"]
+        "gate_up_proj": ["up_proj", "down_proj"],
     }
 
     # LoRA specific attributes
@@ -413,7 +418,6 @@ def get_mamba_state_dtype_from_config(
         cls,
         vllm_config: "VllmConfig",
     ) -> tuple[torch.dtype, torch.dtype]:
-
         return MambaStateDtypeCalculator.mamba2_state_dtype(
             vllm_config.model_config.dtype,
             vllm_config.cache_config.mamba_cache_dtype,
@@ -460,8 +464,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         self.config = config
         self.scheduler_config = scheduler_config
-        self.model = BambaModel(vllm_config=vllm_config,
-                                prefix=maybe_prefix(prefix, "model"))
+        self.model = BambaModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.unpadded_vocab_size = config.vocab_size
         if lora_config:
             self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
@@ -472,28 +477,33 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             padding_size=DEFAULT_VOCAB_PADDING_SIZE
             # We need bigger padding if using lora for kernel
             # compatibility
-            if not lora_config else lora_config.lora_vocab_padding_size,
+            if not lora_config
+            else lora_config.lora_vocab_padding_size,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
 
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs):
-
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs,
+    ):
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
 
         return hidden_states
 
@@ -504,7 +514,6 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/bert.py b/vllm/model_executor/models/bert.py
index 10e718667122..d9d4c62639d5 100644
--- a/vllm/model_executor/models/bert.py
+++ b/vllm/model_executor/models/bert.py
@@ -13,17 +13,21 @@
 from vllm.config import CacheConfig, PoolerConfig, VllmConfig
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
-from vllm.model_executor.layers.pooler import (ClassifierPooler,
-                                               DispatchPooler, Pooler,
-                                               PoolingMethod,
-                                               PoolingParamsUpdate,
-                                               PoolingType)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
+from vllm.model_executor.layers.pooler import (
+    ClassifierPooler,
+    DispatchPooler,
+    Pooler,
+    PoolingMethod,
+    PoolingParamsUpdate,
+    PoolingType,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.sequence import IntermediateTensors
 from vllm.tasks import PoolingTask
 from vllm.v1.pool.metadata import PoolingMetadata
@@ -34,19 +38,19 @@
 
 
 class BertEmbedding(nn.Module):
-
     def __init__(self, config: BertConfig):
-
         super().__init__()
         self.size = config.hidden_size
-        self.word_embeddings = VocabParallelEmbedding(config.vocab_size,
-                                                      config.hidden_size)
+        self.word_embeddings = VocabParallelEmbedding(
+            config.vocab_size, config.hidden_size
+        )
         self.position_embeddings = VocabParallelEmbedding(
-            config.max_position_embeddings, config.hidden_size)
+            config.max_position_embeddings, config.hidden_size
+        )
         self.token_type_embeddings = VocabParallelEmbedding(
-            config.type_vocab_size, config.hidden_size)
-        self.LayerNorm = nn.LayerNorm(config.hidden_size,
-                                      eps=config.layer_norm_eps)
+            config.type_vocab_size, config.hidden_size
+        )
+        self.LayerNorm = nn.LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
 
         self.register_buffer(
             "position_ids",
@@ -54,8 +58,9 @@ def __init__(self, config: BertConfig):
         )
         self.position_embedding_type = config.position_embedding_type
         if self.position_embedding_type != "absolute":
-            raise ValueError("Only 'absolute' position_embedding_type" +
-                             " is supported")
+            raise ValueError(
+                "Only 'absolute' position_embedding_type" + " is supported"
+            )
 
     def forward(
         self,
@@ -78,7 +83,6 @@ def forward(
 
 
 class BertPooler(Pooler):
-
     def __init__(self, config: BertConfig):
         super().__init__()
 
@@ -113,19 +117,22 @@ def forward(
 
 
 class BertEncoder(nn.Module):
-
     def __init__(self, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
-        self.layer = nn.ModuleList([
-            BertLayer(config=config,
-                      cache_config=cache_config,
-                      quant_config=quant_config,
-                      prefix=f"{prefix}.layer.{layer_idx}")
-            for layer_idx in range(config.num_hidden_layers)
-        ])
+        self.layer = nn.ModuleList(
+            [
+                BertLayer(
+                    config=config,
+                    cache_config=cache_config,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.layer.{layer_idx}",
+                )
+                for layer_idx in range(config.num_hidden_layers)
+            ]
+        )
 
     def forward(
         self,
@@ -137,12 +144,13 @@ def forward(
 
 
 class BertLayer(nn.Module):
-
-    def __init__(self,
-                 config: BertConfig,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: BertConfig,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
 
         self.attention = BertAttention(
@@ -151,20 +159,24 @@ def __init__(self,
             layer_norm_eps=config.layer_norm_eps,
             cache_config=cache_config,
             quant_config=quant_config,
-            prefix=f"{prefix}.attention")
+            prefix=f"{prefix}.attention",
+        )
 
         self.intermediate = BertIntermediate(
             hidden_size=config.hidden_size,
             intermediate_size=config.intermediate_size,
             hidden_act=config.hidden_act,
             quant_config=quant_config,
-            prefix=f"{prefix}.intermediate")
+            prefix=f"{prefix}.intermediate",
+        )
 
-        self.output = BertOutput(hidden_size=config.hidden_size,
-                                 intermediate_size=config.intermediate_size,
-                                 layer_norm_eps=config.layer_norm_eps,
-                                 quant_config=quant_config,
-                                 prefix=f"{prefix}.output")
+        self.output = BertOutput(
+            hidden_size=config.hidden_size,
+            intermediate_size=config.intermediate_size,
+            layer_norm_eps=config.layer_norm_eps,
+            quant_config=quant_config,
+            prefix=f"{prefix}.output",
+        )
 
     def forward(self, hidden_states: torch.Tensor):
         attn_output = self.attention(hidden_states)
@@ -174,7 +186,6 @@ def forward(self, hidden_states: torch.Tensor):
 
 
 class BertAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -186,16 +197,20 @@ def __init__(
     ):
         super().__init__()
 
-        self.self = BertSelfAttention(hidden_size=hidden_size,
-                                      num_attention_heads=num_attention_heads,
-                                      cache_config=cache_config,
-                                      quant_config=quant_config,
-                                      prefix=f"{prefix}.output")
+        self.self = BertSelfAttention(
+            hidden_size=hidden_size,
+            num_attention_heads=num_attention_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.output",
+        )
 
-        self.output = BertSelfOutput(hidden_size=hidden_size,
-                                     layer_norm_eps=layer_norm_eps,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.output")
+        self.output = BertSelfOutput(
+            hidden_size=hidden_size,
+            layer_norm_eps=layer_norm_eps,
+            quant_config=quant_config,
+            prefix=f"{prefix}.output",
+        )
 
     def forward(
         self,
@@ -206,7 +221,6 @@ def forward(
 
 
 class BertSelfAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -239,15 +253,18 @@ def __init__(
             total_num_kv_heads=self.total_num_kv_heads,
             bias=True,
             quant_config=quant_config,
-            prefix=f"{prefix}.qkv_proj")
+            prefix=f"{prefix}.qkv_proj",
+        )
 
-        self.attn = EncoderOnlyAttention(num_heads=self.num_heads,
-                                         head_size=self.head_dim,
-                                         scale=self.scaling,
-                                         num_kv_heads=self.num_kv_heads,
-                                         cache_config=cache_config,
-                                         quant_config=quant_config,
-                                         prefix=f"{prefix}.attn")
+        self.attn = EncoderOnlyAttention(
+            num_heads=self.num_heads,
+            head_size=self.head_dim,
+            scale=self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -260,41 +277,48 @@ def forward(
 
 
 class BertSelfOutput(nn.Module):
-
-    def __init__(self,
-                 hidden_size: int,
-                 layer_norm_eps: float,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        hidden_size: int,
+        layer_norm_eps: float,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
-        self.dense = RowParallelLinear(input_size=hidden_size,
-                                       output_size=hidden_size,
-                                       bias=True,
-                                       quant_config=quant_config,
-                                       prefix=f"{prefix}.dense")
+        self.dense = RowParallelLinear(
+            input_size=hidden_size,
+            output_size=hidden_size,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.dense",
+        )
         self.LayerNorm = nn.LayerNorm(hidden_size, eps=layer_norm_eps)
 
-    def forward(self, hidden_states: torch.Tensor,
-                input_tensor: torch.Tensor) -> torch.Tensor:
+    def forward(
+        self, hidden_states: torch.Tensor, input_tensor: torch.Tensor
+    ) -> torch.Tensor:
         hidden_states, _ = self.dense(hidden_states)
         hidden_states = self.LayerNorm(hidden_states + input_tensor)
         return hidden_states
 
 
 class BertIntermediate(nn.Module):
-
-    def __init__(self,
-                 hidden_size: int,
-                 intermediate_size: int,
-                 hidden_act: str,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        hidden_size: int,
+        intermediate_size: int,
+        hidden_act: str,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
-        self.dense = ColumnParallelLinear(input_size=hidden_size,
-                                          output_size=intermediate_size,
-                                          bias=True,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.dense")
+        self.dense = ColumnParallelLinear(
+            input_size=hidden_size,
+            output_size=intermediate_size,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.dense",
+        )
         self.intermediate_act_fn = get_act_fn(hidden_act)
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
@@ -304,25 +328,29 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class BertOutput(nn.Module):
-
-    def __init__(self,
-                 hidden_size: int,
-                 intermediate_size: int,
-                 layer_norm_eps: float,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        hidden_size: int,
+        intermediate_size: int,
+        layer_norm_eps: float,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
 
-        self.dense = RowParallelLinear(input_size=intermediate_size,
-                                       output_size=hidden_size,
-                                       bias=True,
-                                       quant_config=quant_config,
-                                       prefix=f"{prefix}.dense")
+        self.dense = RowParallelLinear(
+            input_size=intermediate_size,
+            output_size=hidden_size,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.dense",
+        )
 
         self.LayerNorm = nn.LayerNorm(hidden_size, eps=layer_norm_eps)
 
-    def forward(self, hidden_states: torch.Tensor,
-                input_tensor: torch.Tensor) -> torch.Tensor:
+    def forward(
+        self, hidden_states: torch.Tensor, input_tensor: torch.Tensor
+    ) -> torch.Tensor:
         hidden_states, _ = self.dense(hidden_states)
         hidden_states = self.LayerNorm(hidden_states + input_tensor)
         return hidden_states
@@ -331,7 +359,6 @@ def forward(self, hidden_states: torch.Tensor,
 @support_torch_compile
 @default_pooling_type("CLS")
 class BertModel(nn.Module, SupportsQuant):
-
     is_pooling_model = True
 
     packed_modules_mapping = {"qkv_proj": ["query", "key", "value"]}
@@ -347,8 +374,7 @@ def __init__(
 
         self.config = vllm_config.model_config.hf_config
         self.embeddings = embedding_class(self.config)
-        self.encoder = BertEncoder(vllm_config=vllm_config,
-                                   prefix=f"{prefix}.encoder")
+        self.encoder = BertEncoder(vllm_config=vllm_config, prefix=f"{prefix}.encoder")
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embeddings.word_embeddings(input_ids)
@@ -380,7 +406,7 @@ def _load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         other_weights = []
         params_dict = dict(self.named_parameters())
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
 
@@ -398,8 +424,7 @@ def _load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
 
         return other_weights, loaded_stacked_params
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         other_weights, loaded_stacked_params = self._load_weights(weights)
 
         loader = AutoWeightsLoader(self, skip_prefixes=["pooler."])
@@ -410,7 +435,6 @@ def load_weights(self, weights: Iterable[tuple[str,
 
 @default_pooling_type("ALL")
 class BertPoolingModel(BertModel):
-
     is_pooling_model = True
 
     def __init__(
@@ -429,8 +453,7 @@ def __init__(
         config = vllm_config.model_config.hf_config
         self.pooler = BertPooler(config)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         other_weights, loaded_stacked_params = self._load_weights(weights)
 
         loader = AutoWeightsLoader(self)
@@ -459,8 +482,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         pooler_config = vllm_config.model_config.pooler_config
         assert pooler_config is not None
 
-        self.model = self._build_model(vllm_config=vllm_config,
-                                       prefix=maybe_prefix(prefix, "model"))
+        self.model = self._build_model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.pooler = self._build_pooler(pooler_config)
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
@@ -473,34 +497,35 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-        return self.model(input_ids=input_ids,
-                          positions=positions,
-                          inputs_embeds=inputs_embeds,
-                          intermediate_tensors=intermediate_tensors)
+        return self.model(
+            input_ids=input_ids,
+            positions=positions,
+            inputs_embeds=inputs_embeds,
+            intermediate_tensors=intermediate_tensors,
+        )
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         weights_list = list(weights)
 
-        has_model_prefix = any(
-            name.startswith("model.") for name, _ in weights_list)
+        has_model_prefix = any(name.startswith("model.") for name, _ in weights_list)
         if not has_model_prefix:
             mapper = WeightsMapper(orig_to_new_prefix={"": "model."})
 
         loader = AutoWeightsLoader(self, skip_prefixes=["lm_head."])
         return loader.load_weights(weights_list, mapper=mapper)
 
-    def _build_model(self,
-                     vllm_config: VllmConfig,
-                     prefix: str = "") -> BertModel:
-        return BertModel(vllm_config=vllm_config,
-                         prefix=prefix,
-                         embedding_class=BertEmbedding)
+    def _build_model(self, vllm_config: VllmConfig, prefix: str = "") -> BertModel:
+        return BertModel(
+            vllm_config=vllm_config, prefix=prefix, embedding_class=BertEmbedding
+        )
 
     def _build_pooler(self, pooler_config: PoolerConfig) -> Pooler:
-        return DispatchPooler({
-            "encode": Pooler.for_encode(pooler_config),
-            "embed": Pooler.for_embed(pooler_config),
-        })
+        return DispatchPooler(
+            {
+                "encode": Pooler.for_encode(pooler_config),
+                "embed": Pooler.for_embed(pooler_config),
+            }
+        )
 
 
 # Here we encode the token type ids together with the input ids.
@@ -527,18 +552,18 @@ def _build_pooler(self, pooler_config: PoolerConfig) -> Pooler:
 TOKEN_TYPE_SHIFT = 30
 
 
-def _encode_token_type_ids(input_ids: torch.Tensor,
-                           token_type_ids: torch.Tensor) -> None:
+def _encode_token_type_ids(
+    input_ids: torch.Tensor, token_type_ids: torch.Tensor
+) -> None:
     # input_ids can be padded to the right
-    input_ids[:token_type_ids.shape[0]].bitwise_or_(
-        token_type_ids << TOKEN_TYPE_SHIFT)
+    input_ids[: token_type_ids.shape[0]].bitwise_or_(token_type_ids << TOKEN_TYPE_SHIFT)
 
 
 def _decode_token_type_ids(input_ids: torch.Tensor) -> torch.Tensor:
-
-    ids_mask = torch.ones_like(input_ids,
-                               dtype=torch.int32,
-                               device=input_ids.device) << TOKEN_TYPE_SHIFT
+    ids_mask = (
+        torch.ones_like(input_ids, dtype=torch.int32, device=input_ids.device)
+        << TOKEN_TYPE_SHIFT
+    )
     tokens_mask = ids_mask.bitwise_not()
 
     token_type_ids = input_ids.bitwise_and(ids_mask) >> TOKEN_TYPE_SHIFT
@@ -549,17 +574,16 @@ def _decode_token_type_ids(input_ids: torch.Tensor) -> torch.Tensor:
 
 
 @default_pooling_type("CLS")
-class BertForSequenceClassification(nn.Module, SupportsCrossEncoding,
-                                    SupportsQuant):
+class BertForSequenceClassification(nn.Module, SupportsCrossEncoding, SupportsQuant):
     """A model that uses Bert to provide embedding functionalities.
 
-   This class encapsulates the BertModel and provides an interface for
-   embedding operations and customized pooling functions.
+    This class encapsulates the BertModel and provides an interface for
+    embedding operations and customized pooling functions.
 
-   Attributes:
-       model: An instance of BertModel used for forward operations.
-       _pooler: An instance of Pooler used for pooling operations.
-   """
+    Attributes:
+        model: An instance of BertModel used for forward operations.
+        _pooler: An instance of Pooler used for pooling operations.
+    """
 
     is_pooling_model = True
 
@@ -568,34 +592,39 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
 
         self.num_labels = config.num_labels
-        self.bert = BertPoolingModel(vllm_config=vllm_config,
-                                     prefix=maybe_prefix(prefix, "bert"),
-                                     embedding_class=BertEmbedding)
-        self.classifier = nn.Linear(config.hidden_size,
-                                    config.num_labels,
-                                    dtype=vllm_config.model_config.head_dtype)
+        self.bert = BertPoolingModel(
+            vllm_config=vllm_config,
+            prefix=maybe_prefix(prefix, "bert"),
+            embedding_class=BertEmbedding,
+        )
+        self.classifier = nn.Linear(
+            config.hidden_size,
+            config.num_labels,
+            dtype=vllm_config.model_config.head_dtype,
+        )
 
         pooler_config = vllm_config.model_config.pooler_config
         assert pooler_config is not None
 
-        self.pooler = DispatchPooler({
-            "encode":
-            Pooler.for_encode(pooler_config),
-            "classify":
-            ClassifierPooler(
-                pooling=self.bert.pooler,
-                classifier=self.classifier,
-                act_fn=ClassifierPooler.act_fn_for_seq_cls(
-                    vllm_config.model_config),
-            ),
-            "score":
-            ClassifierPooler(
-                pooling=self.bert.pooler,
-                classifier=self.classifier,
-                act_fn=ClassifierPooler.act_fn_for_cross_encoder(
-                    vllm_config.model_config),
-            ),
-        })
+        self.pooler = DispatchPooler(
+            {
+                "encode": Pooler.for_encode(pooler_config),
+                "classify": ClassifierPooler(
+                    pooling=self.bert.pooler,
+                    classifier=self.classifier,
+                    act_fn=ClassifierPooler.act_fn_for_seq_cls(
+                        vllm_config.model_config
+                    ),
+                ),
+                "score": ClassifierPooler(
+                    pooling=self.bert.pooler,
+                    classifier=self.classifier,
+                    act_fn=ClassifierPooler.act_fn_for_cross_encoder(
+                        vllm_config.model_config
+                    ),
+                ),
+            }
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.bert.get_input_embeddings(input_ids)
@@ -613,16 +642,17 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         token_type_ids: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-
         if token_type_ids is not None:
             assert self.bert.config.vocab_size < (1 << TOKEN_TYPE_SHIFT)
             assert input_ids is not None
             _encode_token_type_ids(input_ids, token_type_ids)
 
-        return self.bert(input_ids=input_ids,
-                         positions=positions,
-                         inputs_embeds=inputs_embeds,
-                         intermediate_tensors=intermediate_tensors)
+        return self.bert(
+            input_ids=input_ids,
+            positions=positions,
+            inputs_embeds=inputs_embeds,
+            intermediate_tensors=intermediate_tensors,
+        )
 
 
 @default_pooling_type("ALL")
@@ -634,20 +664,23 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         self.head_dtype = vllm_config.model_config.head_dtype
         self.num_labels = config.num_labels
-        self.bert = BertModel(vllm_config=vllm_config,
-                              prefix=maybe_prefix(prefix, "bert"),
-                              embedding_class=BertEmbedding)
-        self.classifier = nn.Linear(config.hidden_size,
-                                    config.num_labels,
-                                    dtype=self.head_dtype)
+        self.bert = BertModel(
+            vllm_config=vllm_config,
+            prefix=maybe_prefix(prefix, "bert"),
+            embedding_class=BertEmbedding,
+        )
+        self.classifier = nn.Linear(
+            config.hidden_size, config.num_labels, dtype=self.head_dtype
+        )
 
         pooler_config = vllm_config.model_config.pooler_config
         assert pooler_config is not None
 
-        self.pooler = DispatchPooler({
-            "encode":
-            Pooler.for_encode(pooler_config),
-        })
+        self.pooler = DispatchPooler(
+            {
+                "encode": Pooler.for_encode(pooler_config),
+            }
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.bert.get_input_embeddings(input_ids)
@@ -665,16 +698,17 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         token_type_ids: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-
         if token_type_ids is not None:
             assert self.bert.config.vocab_size < (1 << TOKEN_TYPE_SHIFT)
             assert input_ids is not None
             _encode_token_type_ids(input_ids, token_type_ids)
 
-        hidden_states = self.bert(input_ids=input_ids,
-                                  positions=positions,
-                                  inputs_embeds=inputs_embeds,
-                                  intermediate_tensors=intermediate_tensors)
+        hidden_states = self.bert(
+            input_ids=input_ids,
+            positions=positions,
+            inputs_embeds=inputs_embeds,
+            intermediate_tensors=intermediate_tensors,
+        )
 
         hidden_states = hidden_states.to(self.head_dtype)
         return self.classifier(hidden_states)
diff --git a/vllm/model_executor/models/bert_with_rope.py b/vllm/model_executor/models/bert_with_rope.py
index 4e1eba32d259..05cb0e22a0aa 100644
--- a/vllm/model_executor/models/bert_with_rope.py
+++ b/vllm/model_executor/models/bert_with_rope.py
@@ -10,25 +10,30 @@
 from vllm.attention.layers.encoder_only_attention import EncoderOnlyAttention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (divide, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_reduce)
-from vllm.model_executor.layers.activation import (get_act_and_mul_fn,
-                                                   get_act_fn)
-from vllm.model_executor.layers.fused_moe import (activation_without_mul,
-                                                  fused_topk)
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.distributed import (
+    divide,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_reduce,
+)
+from vllm.model_executor.layers.activation import get_act_and_mul_fn, get_act_fn
+from vllm.model_executor.layers.fused_moe import activation_without_mul, fused_topk
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
-from vllm.model_executor.models.utils import (AutoWeightsLoader, WeightsMapper,
-                                              maybe_prefix)
+from vllm.model_executor.models.utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    maybe_prefix,
+)
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.platforms import current_platform
 from vllm.sequence import IntermediateTensors
@@ -40,24 +45,24 @@
 
 
 class BertWithRopeEmbedding(nn.Module):
-
     def __init__(self, config: PretrainedConfig):
-
         super().__init__()
         if config.position_embedding_type not in ["rope", "rotary"]:
-            raise ValueError("Only 'rotary'('rope') position_embedding_type" +
-                             " is supported")
+            raise ValueError(
+                "Only 'rotary'('rope') position_embedding_type" + " is supported"
+            )
 
-        self.word_embeddings = VocabParallelEmbedding(config.vocab_size,
-                                                      config.hidden_size)
+        self.word_embeddings = VocabParallelEmbedding(
+            config.vocab_size, config.hidden_size
+        )
         if config.type_vocab_size > 0:
             self.token_type_embeddings = VocabParallelEmbedding(
-                config.type_vocab_size, config.hidden_size)
+                config.type_vocab_size, config.hidden_size
+            )
         else:
             self.token_type_embeddings = None
 
-        self.LayerNorm = nn.LayerNorm(config.hidden_size,
-                                      eps=config.layer_norm_eps)
+        self.LayerNorm = nn.LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
 
     def forward(
         self,
@@ -70,9 +75,9 @@ def forward(
         embeddings = inputs_embeds
         if self.token_type_embeddings is not None:
             if token_type_ids is None:
-                token_type_ids = torch.zeros(input_shape,
-                                             dtype=torch.long,
-                                             device=inputs_embeds.device)
+                token_type_ids = torch.zeros(
+                    input_shape, dtype=torch.long, device=inputs_embeds.device
+                )
 
             token_type_embeddings = self.token_type_embeddings(token_type_ids)
             embeddings += token_type_embeddings
@@ -82,7 +87,6 @@ def forward(
 
 
 class BertWithRopeAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -119,23 +123,28 @@ def __init__(
             total_num_kv_heads=self.total_num_kv_heads,
             bias=bias,
             quant_config=quant_config,
-            prefix=f"{prefix}.qkv_proj")
+            prefix=f"{prefix}.qkv_proj",
+        )
 
         self.rotary_emb = get_rope(**rotary_kwargs)
 
-        self.attn = EncoderOnlyAttention(num_heads=self.num_heads,
-                                         head_size=self.head_dim,
-                                         scale=self.scaling,
-                                         num_kv_heads=self.num_kv_heads,
-                                         cache_config=cache_config,
-                                         quant_config=quant_config,
-                                         prefix=f"{prefix}.attn")
+        self.attn = EncoderOnlyAttention(
+            num_heads=self.num_heads,
+            head_size=self.head_dim,
+            scale=self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
-        self.out_proj = RowParallelLinear(input_size=hidden_size,
-                                          output_size=hidden_size,
-                                          bias=bias,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.dense")
+        self.out_proj = RowParallelLinear(
+            input_size=hidden_size,
+            output_size=hidden_size,
+            bias=bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.dense",
+        )
 
     def forward(
         self,
@@ -151,14 +160,15 @@ def forward(
 
 
 class BertWithRopeGatedMLP(nn.Module):
-
-    def __init__(self,
-                 hidden_size: int,
-                 intermediate_size: int,
-                 hidden_act: str,
-                 bias: bool = True,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        hidden_size: int,
+        intermediate_size: int,
+        hidden_act: str,
+        bias: bool = True,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.act_fn = get_act_and_mul_fn(hidden_act)
         self.gate_up_proj = MergedColumnParallelLinear(
@@ -168,11 +178,13 @@ def __init__(self,
             quant_config=quant_config,
             prefix=f"{prefix}.gate_up_proj",
         )
-        self.down_proj = RowParallelLinear(input_size=intermediate_size,
-                                           output_size=hidden_size,
-                                           bias=bias,
-                                           quant_config=quant_config,
-                                           prefix=f"{prefix}.down_proj")
+        self.down_proj = RowParallelLinear(
+            input_size=intermediate_size,
+            output_size=hidden_size,
+            bias=bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.down_proj",
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         gate_up, _ = self.gate_up_proj(hidden_states)
@@ -182,26 +194,31 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class BertWithRopeMLP(nn.Module):
-
-    def __init__(self,
-                 hidden_size: int,
-                 intermediate_size: int,
-                 hidden_act: str,
-                 bias: bool = True,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        hidden_size: int,
+        intermediate_size: int,
+        hidden_act: str,
+        bias: bool = True,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.act_fn = get_act_fn(hidden_act)
-        self.up_proj = ColumnParallelLinear(input_size=hidden_size,
-                                            output_size=intermediate_size,
-                                            bias=bias,
-                                            quant_config=quant_config,
-                                            prefix=f"{prefix}.up_proj")
-        self.down_proj = RowParallelLinear(input_size=intermediate_size,
-                                           output_size=hidden_size,
-                                           bias=bias,
-                                           quant_config=quant_config,
-                                           prefix=f"{prefix}.down_proj")
+        self.up_proj = ColumnParallelLinear(
+            input_size=hidden_size,
+            output_size=intermediate_size,
+            bias=bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.up_proj",
+        )
+        self.down_proj = RowParallelLinear(
+            input_size=intermediate_size,
+            output_size=hidden_size,
+            bias=bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.down_proj",
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         hidden_states, _ = self.up_proj(hidden_states)
@@ -211,7 +228,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class NomicMoE(nn.Module):
-
     def __init__(
         self,
         num_experts: int,
@@ -236,28 +252,40 @@ def __init__(
             params_dtype = torch.get_default_dtype()
         self.params_dtype = params_dtype
 
-        self.router = ReplicatedLinear(self.hidden_size,
-                                       self.num_total_experts,
-                                       bias=False)
+        self.router = ReplicatedLinear(
+            self.hidden_size, self.num_total_experts, bias=False
+        )
         self.w1 = nn.Parameter(
-            torch.empty(self.num_total_experts,
-                        self.intermediate_size,
-                        self.hidden_size,
-                        device=current_platform.device_type,
-                        dtype=self.params_dtype))
+            torch.empty(
+                self.num_total_experts,
+                self.intermediate_size,
+                self.hidden_size,
+                device=current_platform.device_type,
+                dtype=self.params_dtype,
+            )
+        )
         self.w2 = nn.Parameter(
-            torch.empty(self.num_total_experts,
-                        self.hidden_size,
-                        self.intermediate_size,
-                        device=current_platform.device_type,
-                        dtype=self.params_dtype))
+            torch.empty(
+                self.num_total_experts,
+                self.hidden_size,
+                self.intermediate_size,
+                device=current_platform.device_type,
+                dtype=self.params_dtype,
+            )
+        )
         self.bias = nn.Parameter(torch.zeros(self.hidden_size))
-        set_weight_attrs(self.w1, {
-            "weight_loader": self.weight_loader,
-        })
-        set_weight_attrs(self.w2, {
-            "weight_loader": self.weight_loader,
-        })
+        set_weight_attrs(
+            self.w1,
+            {
+                "weight_loader": self.weight_loader,
+            },
+        )
+        set_weight_attrs(
+            self.w2,
+            {
+                "weight_loader": self.weight_loader,
+            },
+        )
 
     def weight_loader(
         self,
@@ -293,10 +321,9 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         # FIXME(Isotr0py): This implementation is too tricky,
         # we should use FusedMoE instead in the future
         # after supporting ungated activation for it.
-        topk_weights, topk_ids, _ = fused_topk(hidden_states,
-                                               router_logits,
-                                               self.top_k,
-                                               renormalize=False)
+        topk_weights, topk_ids, _ = fused_topk(
+            hidden_states, router_logits, self.top_k, renormalize=False
+        )
 
         final_hidden_states = torch.ops.vllm.outplace_fused_experts(
             hidden_states=hidden_states,
@@ -308,22 +335,22 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         )
 
         if self.tp_size > 1:
-            final_hidden_states = tensor_model_parallel_all_reduce(
-                final_hidden_states)
+            final_hidden_states = tensor_model_parallel_all_reduce(final_hidden_states)
 
         return final_hidden_states.view(num_tokens, hidden_size) + self.bias
 
 
 class BertWithRopeBlock(nn.Module):
-
-    def __init__(self,
-                 config: PretrainedConfig,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 moe: bool = False,
-                 bias: bool = True,
-                 rotary_kwargs: Optional[dict] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: PretrainedConfig,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        moe: bool = False,
+        bias: bool = True,
+        rotary_kwargs: Optional[dict] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.attn = BertWithRopeAttention(
             hidden_size=config.hidden_size,
@@ -332,14 +359,17 @@ def __init__(self,
             quant_config=quant_config,
             bias=bias,
             rotary_kwargs=rotary_kwargs,
-            prefix=f"{prefix}.attention")
+            prefix=f"{prefix}.attention",
+        )
 
         if moe:
-            self.mlp = NomicMoE(num_experts=config.num_experts,
-                                top_k=config.moe_top_k,
-                                hidden_size=config.hidden_size,
-                                intermediate_size=config.intermediate_size,
-                                hidden_act=config.hidden_act)
+            self.mlp = NomicMoE(
+                num_experts=config.num_experts,
+                top_k=config.moe_top_k,
+                hidden_size=config.hidden_size,
+                intermediate_size=config.intermediate_size,
+                hidden_act=config.hidden_act,
+            )
         else:
             if config.hidden_act in ["silu", "geglu"]:
                 self.mlp = BertWithRopeGatedMLP(
@@ -348,7 +378,8 @@ def __init__(self,
                     hidden_act=config.hidden_act,
                     bias=bias,
                     quant_config=quant_config,
-                    prefix=f"{prefix}.mlp")
+                    prefix=f"{prefix}.mlp",
+                )
             else:
                 self.mlp = BertWithRopeMLP(
                     hidden_size=config.hidden_size,
@@ -356,12 +387,11 @@ def __init__(self,
                     hidden_act=config.hidden_act,
                     bias=bias,
                     quant_config=quant_config,
-                    prefix=f"{prefix}.mlp")
+                    prefix=f"{prefix}.mlp",
+                )
 
-        self.attn_ln = nn.LayerNorm(config.hidden_size,
-                                    eps=config.layer_norm_eps)
-        self.mlp_ln = nn.LayerNorm(config.hidden_size,
-                                   eps=config.layer_norm_eps)
+        self.attn_ln = nn.LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
+        self.mlp_ln = nn.LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
 
     def forward(self, positions: torch.Tensor, hidden_states: torch.Tensor):
         attn_output = self.attn(positions, hidden_states)
@@ -372,27 +402,32 @@ def forward(self, positions: torch.Tensor, hidden_states: torch.Tensor):
 
 
 class BertWithRopeEncoder(nn.Module):
-
-    def __init__(self,
-                 vllm_config: VllmConfig,
-                 bias: bool = True,
-                 rotary_kwargs: Optional[dict] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        bias: bool = True,
+        rotary_kwargs: Optional[dict] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
         every_n = getattr(config, "moe_every_n_layers", 0)
-        self.layers = nn.ModuleList([
-            BertWithRopeBlock(config=config,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              bias=bias,
-                              moe=every_n > 0 and (layer_idx % every_n == 1),
-                              rotary_kwargs=rotary_kwargs,
-                              prefix=f"{prefix}.layer.{layer_idx}")
-            for layer_idx in range(config.num_hidden_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                BertWithRopeBlock(
+                    config=config,
+                    cache_config=cache_config,
+                    quant_config=quant_config,
+                    bias=bias,
+                    moe=every_n > 0 and (layer_idx % every_n == 1),
+                    rotary_kwargs=rotary_kwargs,
+                    prefix=f"{prefix}.layer.{layer_idx}",
+                )
+                for layer_idx in range(config.num_hidden_layers)
+            ]
+        )
 
     def forward(
         self,
@@ -409,11 +444,13 @@ def forward(
 class BertWithRope(nn.Module, SupportsQuant):
     hf_to_vllm_mapper = WeightsMapper(orig_to_new_prefix={"model.": ""})
 
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 add_pooling_layer: bool = False):
+    def __init__(
+        self,
+        *,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        add_pooling_layer: bool = False,
+    ):
         super().__init__()
         self.vllm_config = vllm_config
         self.add_pooling_layer = add_pooling_layer
@@ -423,7 +460,8 @@ def __init__(self,
             vllm_config=vllm_config,
             bias=getattr(self.config, "bias", True),
             rotary_kwargs=self.config.rotary_kwargs,
-            prefix=f"{prefix}.encoder")
+            prefix=f"{prefix}.encoder",
+        )
         self.pooler = BertPooler(self.config) if add_pooling_layer else None
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
@@ -440,12 +478,12 @@ def forward(
         if inputs_embeds is not None:
             hidden_states = inputs_embeds
         else:
-            hidden_states = self.embeddings(input_ids=input_ids,
-                                            token_type_ids=token_type_ids)
+            hidden_states = self.embeddings(
+                input_ids=input_ids, token_type_ids=token_type_ids
+            )
         return self.encoder(positions, hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         weights = self.hf_to_vllm_mapper.apply(weights)
 
         if self.config.hidden_act in ["silu", "geglu"]:
@@ -462,7 +500,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if not self.add_pooling_layer and "pooler" in name:
                 continue
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -478,8 +516,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if name.endswith(".bias") and name not in params_dict:
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 if name.endswith((".w1", ".w2")):
                     # Nomic-MoE has fused experts weights
                     weight_loader(param, loaded_weight, name)
@@ -506,7 +543,8 @@ class NomicBertModel(BertWithRope):
             "experts.mlp.": "",
             "experts.": "",
             "router.layer": "router",
-        })
+        }
+    )
 
 
 class GteNewModel(BertWithRope):
@@ -518,7 +556,8 @@ class GteNewModel(BertWithRope):
             "layer": "layers",
             "attention.qkv_proj": "attn.qkv_proj",
             "attention.o_proj": "attn.out_proj",
-        })
+        }
+    )
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = "", **kwargs):
         super().__init__(vllm_config=vllm_config, prefix=prefix, **kwargs)
@@ -539,15 +578,13 @@ def split_up_gate_proj(self, weights: Iterable[tuple[str, torch.Tensor]]):
             else:
                 yield name, weight
 
-    def ignore_unnecessary_layers(self,
-                                  weights: Iterable[tuple[str, torch.Tensor]]):
+    def ignore_unnecessary_layers(self, weights: Iterable[tuple[str, torch.Tensor]]):
         for name, weight in weights:
             if name.startswith("classifier"):
                 continue
             yield name, weight
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         weights = self.ignore_unnecessary_layers(weights)
         weights = self.split_up_gate_proj(weights)
         return super().load_weights(weights)
@@ -561,7 +598,8 @@ class SnowflakeGteNewModel(GteNewModel):
             "layer": "layers",
             "attention.qkv_proj": "attn.qkv_proj",
             "attention.o_proj": "attn.out_proj",
-        })
+        }
+    )
 
 
 class JinaRobertaModel(BertWithRope):
@@ -576,11 +614,11 @@ class JinaRobertaModel(BertWithRope):
             "mlp.fc1.": "mlp.up_proj.",
             "mlp.fc2": "mlp.down_proj",
             "norm2": "mlp_ln",
-        })
+        }
+    )
 
     @torch.inference_mode()
-    def jina_merge_lora_weights(self, weights: Iterable[tuple[str,
-                                                              torch.Tensor]]):
+    def jina_merge_lora_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         # use for jina-embeddings-v3
         # Merge Lora weights into a single weight tensor.
         # This is a temporary solution until we have a better way to handle
@@ -601,7 +639,7 @@ def jina_merge_lora_weights(self, weights: Iterable[tuple[str,
             if o in name:
                 dtype = weights[name].dtype
                 shape = weights[name].shape
-                weight_name = name[:-len(o)]
+                weight_name = name[: -len(o)]
 
                 if "embeddings" in weight_name:
                     B = weights[weight_name + a][i].to(device).float()
@@ -610,20 +648,23 @@ def jina_merge_lora_weights(self, weights: Iterable[tuple[str,
                     B = weights[weight_name + b][i].to(device).float()
                     A = weights[weight_name + a][i].to(device).float()
 
-                weight = (weights[weight_name + o].to(device) +
-                          torch.matmul(B, A).view(shape) * scaling)
+                weight = (
+                    weights[weight_name + o].to(device)
+                    + torch.matmul(B, A).view(shape) * scaling
+                )
                 weight = weight.cpu().to(dtype)
 
                 weights[weight_name.replace(".parametrizations", "")] = weight
 
-                del weights[weight_name + o], weights[weight_name +
-                                                      a], weights[weight_name +
-                                                                  b]
+                del (
+                    weights[weight_name + o],
+                    weights[weight_name + a],
+                    weights[weight_name + b],
+                )
 
         return [(name, weight) for name, weight in weights.items()]
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         weights = self.jina_merge_lora_weights(weights)
         return super().load_weights(weights)
 
@@ -637,9 +678,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
 
-        self.new = GteNewModel(vllm_config=vllm_config,
-                               prefix=prefix,
-                               add_pooling_layer=True)
+        self.new = GteNewModel(
+            vllm_config=vllm_config, prefix=prefix, add_pooling_layer=True
+        )
         self.classifier = ReplicatedLinear(
             config.hidden_size,
             config.num_labels,
@@ -647,29 +688,31 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             quant_config=quant_config,
             params_dtype=vllm_config.model_config.head_dtype,
             prefix=maybe_prefix(prefix, "classifier"),
-            return_bias=False)
+            return_bias=False,
+        )
 
         pooler_config = vllm_config.model_config.pooler_config
         assert pooler_config is not None
 
-        self.pooler = DispatchPooler({
-            "encode":
-            Pooler.for_encode(pooler_config),
-            "classify":
-            ClassifierPooler(
-                pooling=self.new.pooler,
-                classifier=self.classifier,
-                act_fn=ClassifierPooler.act_fn_for_seq_cls(
-                    vllm_config.model_config),
-            ),
-            "score":
-            ClassifierPooler(
-                pooling=self.new.pooler,
-                classifier=self.classifier,
-                act_fn=ClassifierPooler.act_fn_for_cross_encoder(
-                    vllm_config.model_config),
-            ),
-        })
+        self.pooler = DispatchPooler(
+            {
+                "encode": Pooler.for_encode(pooler_config),
+                "classify": ClassifierPooler(
+                    pooling=self.new.pooler,
+                    classifier=self.classifier,
+                    act_fn=ClassifierPooler.act_fn_for_seq_cls(
+                        vllm_config.model_config
+                    ),
+                ),
+                "score": ClassifierPooler(
+                    pooling=self.new.pooler,
+                    classifier=self.classifier,
+                    act_fn=ClassifierPooler.act_fn_for_cross_encoder(
+                        vllm_config.model_config
+                    ),
+                ),
+            }
+        )
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         loader = AutoWeightsLoader(self)
@@ -686,8 +729,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-
-        return self.new(input_ids=input_ids,
-                        positions=positions,
-                        inputs_embeds=inputs_embeds,
-                        intermediate_tensors=intermediate_tensors)
+        return self.new(
+            input_ids=input_ids,
+            positions=positions,
+            inputs_embeds=inputs_embeds,
+            intermediate_tensors=intermediate_tensors,
+        )
diff --git a/vllm/model_executor/models/blip.py b/vllm/model_executor/models/blip.py
index 2b457fd8a5b2..aa361e0a2a39 100644
--- a/vllm/model_executor/models/blip.py
+++ b/vllm/model_executor/models/blip.py
@@ -1,7 +1,8 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-"""Minimal implementation of BlipVisionModel intended to be only used 
+"""Minimal implementation of BlipVisionModel intended to be only used
 within a vision language model."""
+
 from collections.abc import Iterable
 from typing import Optional, Union
 
@@ -12,9 +13,11 @@
 from vllm.attention.layer import MultiHeadAttention
 from vllm.distributed import divide, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 
@@ -27,14 +30,14 @@ def get_blip_patch_grid_length(*, image_size: int, patch_size: int) -> int:
 
 
 def get_blip_num_patches(*, image_size: int, patch_size: int) -> int:
-    grid_length = get_blip_patch_grid_length(image_size=image_size,
-                                             patch_size=patch_size)
+    grid_length = get_blip_patch_grid_length(
+        image_size=image_size, patch_size=patch_size
+    )
     return grid_length * grid_length
 
 
 # Adapted from https://github.com/huggingface/transformers/blob/v4.39.0/src/transformers/models/blip/modeling_blip.py#L164 # noqa
 class BlipVisionEmbeddings(nn.Module):
-
     def __init__(self, config: Union[BlipVisionConfig, Blip2VisionConfig]):
         super().__init__()
 
@@ -52,25 +55,28 @@ def __init__(self, config: Union[BlipVisionConfig, Blip2VisionConfig]):
             stride=self.patch_size,
         )
 
-        self.num_patches = get_blip_num_patches(image_size=self.image_size,
-                                                patch_size=self.patch_size)
+        self.num_patches = get_blip_num_patches(
+            image_size=self.image_size, patch_size=self.patch_size
+        )
         self.num_positions = self.num_patches + 1
 
         self.position_embedding = nn.Parameter(
-            torch.randn(1, self.num_positions, self.embed_dim))
+            torch.randn(1, self.num_positions, self.embed_dim)
+        )
 
     def forward(self, pixel_values: torch.Tensor) -> torch.Tensor:
         batch_size = pixel_values.shape[0]
         target_dtype = self.patch_embedding.weight.dtype
-        patch_embeds = self.patch_embedding(pixel_values.to(
-            dtype=target_dtype))  # shape = [*, width, grid, grid]
+        patch_embeds = self.patch_embedding(
+            pixel_values.to(dtype=target_dtype)
+        )  # shape = [*, width, grid, grid]
         patch_embeds = patch_embeds.flatten(2).transpose(1, 2)
 
         class_embeds = self.class_embedding.expand(batch_size, 1, -1)
         embeddings = torch.cat([class_embeds, patch_embeds], dim=1)
 
         position_embeds = self.position_embedding.to(target_dtype)
-        embeddings = embeddings + position_embeds[:, :embeddings.size(1), :]
+        embeddings = embeddings + position_embeds[:, : embeddings.size(1), :]
 
         return embeddings
 
@@ -93,7 +99,8 @@ def __init__(
             raise ValueError(
                 "embed_dim must be divisible by num_heads "
                 f"(got `embed_dim`: {self.embed_dim} and `num_heads`:"
-                f" {self.num_heads}).")
+                f" {self.num_heads})."
+            )
         self.scale = self.head_dim**-0.5
         self.dropout = config.attention_dropout
 
@@ -115,12 +122,16 @@ def __init__(
         self.tp_size = get_tensor_model_parallel_world_size()
         self.num_heads_per_partition = divide(self.num_heads, self.tp_size)
 
-        self.attn = MultiHeadAttention(self.num_heads_per_partition,
-                                       self.head_dim, self.scale)
+        self.attn = MultiHeadAttention(
+            self.num_heads_per_partition, self.head_dim, self.scale
+        )
 
     def _shape(self, tensor: torch.Tensor, seq_len: int, bsz: int):
-        return tensor.view(bsz, seq_len, self.num_heads,
-                           self.head_dim).transpose(1, 2).contiguous()
+        return (
+            tensor.view(bsz, seq_len, self.num_heads, self.head_dim)
+            .transpose(1, 2)
+            .contiguous()
+        )
 
     def forward(
         self,
@@ -137,7 +148,6 @@ def forward(
 
 
 class BlipMLP(nn.Module):
-
     def __init__(
         self,
         config: BlipVisionConfig,
@@ -149,16 +159,20 @@ def __init__(
         self.config = config
 
         self.activation_fn = get_act_fn(config.hidden_act)
-        self.fc1 = ColumnParallelLinear(config.hidden_size,
-                                        config.intermediate_size,
-                                        bias=True,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.fc1")
-        self.fc2 = RowParallelLinear(config.intermediate_size,
-                                     config.hidden_size,
-                                     bias=True,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.fc2")
+        self.fc1 = ColumnParallelLinear(
+            config.hidden_size,
+            config.intermediate_size,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc1",
+        )
+        self.fc2 = RowParallelLinear(
+            config.intermediate_size,
+            config.hidden_size,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc2",
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         hidden_states, _ = self.fc1(hidden_states)
@@ -169,7 +183,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class BlipEncoderLayer(nn.Module):
-
     def __init__(
         self,
         config: BlipVisionConfig,
@@ -184,13 +197,9 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.self_attn",
         )
-        self.layer_norm1 = nn.LayerNorm(config.hidden_size,
-                                        eps=config.layer_norm_eps)
-        self.mlp = BlipMLP(config,
-                           quant_config=quant_config,
-                           prefix=f"{prefix}.mlp")
-        self.layer_norm2 = nn.LayerNorm(config.hidden_size,
-                                        eps=config.layer_norm_eps)
+        self.layer_norm1 = nn.LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
+        self.mlp = BlipMLP(config, quant_config=quant_config, prefix=f"{prefix}.mlp")
+        self.layer_norm2 = nn.LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         residual = hidden_states
@@ -209,7 +218,7 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 class BlipEncoder(nn.Module):
     """
-    Transformer encoder consisting of `config.num_hidden_layers` self 
+    Transformer encoder consisting of `config.num_hidden_layers` self
     attention layers. Each layer is a [`BlipEncoderLayer`].
 
     Args:
@@ -232,12 +241,16 @@ def __init__(
         else:
             num_hidden_layers = num_hidden_layers_override
 
-        self.layers = nn.ModuleList([
-            BlipEncoderLayer(config=config,
-                             quant_config=quant_config,
-                             prefix=f"{prefix}.layers.{layer_idx}")
-            for layer_idx in range(num_hidden_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                BlipEncoderLayer(
+                    config=config,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.layers.{layer_idx}",
+                )
+                for layer_idx in range(num_hidden_layers)
+            ]
+        )
 
     def forward(self, inputs_embeds: torch.Tensor):
         hidden_states = inputs_embeds
@@ -284,8 +297,9 @@ def __init__(
             require_post_norm = len(self.encoder.layers) == num_hidden_layers
 
         if require_post_norm:
-            self.post_layernorm = nn.LayerNorm(config.hidden_size,
-                                               eps=config.layer_norm_eps)
+            self.post_layernorm = nn.LayerNorm(
+                config.hidden_size, eps=config.layer_norm_eps
+            )
         else:
             self.post_layernorm = None
 
@@ -298,8 +312,7 @@ def forward(self, pixel_values: torch.Tensor) -> torch.Tensor:
 
         return self.post_layernorm(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -312,8 +325,7 @@ def load_weights(self, weights: Iterable[tuple[str,
 
         for name, loaded_weight in weights:
             # post_layernorm is not needed in BlipVisionModel
-            if (name.startswith("post_layernorm")
-                    and self.post_layernorm is None):
+            if name.startswith("post_layernorm") and self.post_layernorm is None:
                 continue
 
             # omit layers when num_hidden_layers_override is set
@@ -322,7 +334,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if layer_idx >= layer_count:
                     continue
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -332,8 +344,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
diff --git a/vllm/model_executor/models/blip2.py b/vllm/model_executor/models/blip2.py
index 3d057654cca7..8e94d5935026 100644
--- a/vllm/model_executor/models/blip2.py
+++ b/vllm/model_executor/models/blip2.py
@@ -6,27 +6,42 @@
 
 import torch
 import torch.nn as nn
-from transformers import (BatchFeature, Blip2Config, Blip2QFormerConfig,
-                          apply_chunking_to_forward)
+from transformers import (
+    BatchFeature,
+    Blip2Config,
+    Blip2QFormerConfig,
+    apply_chunking_to_forward,
+)
 
 from vllm.config import CacheConfig, VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
 from vllm.multimodal.parse import MultiModalDataItems
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptIndexTargets,
-                                        PromptInsertion, PromptUpdate)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptIndexTargets,
+    PromptInsertion,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .blip import BlipVisionModel
-from .interfaces import (MultiModalEmbeddings, SupportsMultiModal, SupportsPP,
-                         SupportsQuant)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsMultiModal,
+    SupportsPP,
+    SupportsQuant,
+)
 from .utils import AutoWeightsLoader, init_vllm_registered_model, maybe_prefix
 
 
@@ -38,6 +53,7 @@ class Blip2ImagePixelInputs(TensorSchema):
         - h: Height of each image
         - w: Width of each image
     """
+
     type: Literal["pixel_values"]
     data: Annotated[torch.Tensor, TensorShape("bn", 3, "h", "w")]
 
@@ -49,6 +65,7 @@ class Blip2ImageEmbeddingInputs(TensorSchema):
         - f: Image feature size
         - h: Hidden size (must match the hidden size of language model backbone)
     """
+
     type: Literal["image_embeds"]
     data: Annotated[torch.Tensor, TensorShape("bn", "f", "h")]
 
@@ -57,7 +74,6 @@ class Blip2ImageEmbeddingInputs(TensorSchema):
 
 
 class Blip2QFormerMultiHeadAttention(nn.Module):
-
     def __init__(
         self,
         config: Blip2QFormerConfig,
@@ -78,8 +94,7 @@ def __init__(
             )
 
         self.num_attention_heads = config.num_attention_heads
-        self.attention_head_size = (config.hidden_size //
-                                    config.num_attention_heads)
+        self.attention_head_size = config.hidden_size // config.num_attention_heads
         self.all_head_size = self.num_attention_heads * self.attention_head_size
         self.scaling = self.attention_head_size**-0.5
 
@@ -91,18 +106,18 @@ def __init__(
         self.key = nn.Linear(kv_hidden_size, self.all_head_size)
         self.value = nn.Linear(kv_hidden_size, self.all_head_size)
 
-        self.position_embedding_type = getattr(config,
-                                               "position_embedding_type",
-                                               "absolute")
+        self.position_embedding_type = getattr(
+            config, "position_embedding_type", "absolute"
+        )
         if self.position_embedding_type != "absolute":
-            raise NotImplementedError("Unsupported position_embedding_type: "
-                                      f"{self.position_embedding_type}")
+            raise NotImplementedError(
+                f"Unsupported position_embedding_type: {self.position_embedding_type}"
+            )
 
         self.dropout = nn.Dropout(config.attention_probs_dropout_prob)
 
     def transpose_for_scores(self, x):
-        x = x.view(*x.size()[:-1], self.num_attention_heads,
-                   self.attention_head_size)
+        x = x.view(*x.size()[:-1], self.num_attention_heads, self.attention_head_size)
         return x.permute(0, 2, 1, 3)
 
     def forward(
@@ -113,10 +128,8 @@ def forward(
         is_cross_attention = encoder_hidden_states is not None
 
         if is_cross_attention:
-            key_layer = self.transpose_for_scores(
-                self.key(encoder_hidden_states))
-            value_layer = self.transpose_for_scores(
-                self.value(encoder_hidden_states))
+            key_layer = self.transpose_for_scores(self.key(encoder_hidden_states))
+            value_layer = self.transpose_for_scores(self.value(encoder_hidden_states))
         else:
             key_layer = self.transpose_for_scores(self.key(hidden_states))
             value_layer = self.transpose_for_scores(self.value(hidden_states))
@@ -125,10 +138,8 @@ def forward(
 
         query_layer = self.transpose_for_scores(mixed_query_layer)
 
-        attention_scores = torch.matmul(query_layer,
-                                        key_layer.transpose(-1, -2))
-        attention_probs = torch.softmax(attention_scores * self.scaling,
-                                        dim=-1)
+        attention_scores = torch.matmul(query_layer, key_layer.transpose(-1, -2))
+        attention_probs = torch.softmax(attention_scores * self.scaling, dim=-1)
 
         # This is actually dropping out entire tokens to attend to, which might
         # seem a bit unusual, but is taken from the original Transformer paper.
@@ -137,20 +148,19 @@ def forward(
         context_layer = torch.matmul(attention_probs_dropped, value_layer)
 
         context_layer = context_layer.permute(0, 2, 1, 3).contiguous()
-        context_layer = context_layer.view(*context_layer.size()[:-2],
-                                           self.all_head_size)
+        context_layer = context_layer.view(
+            *context_layer.size()[:-2], self.all_head_size
+        )
 
         return context_layer
 
 
 class Blip2QFormerSelfOutput(nn.Module):
-
     def __init__(self, config: Blip2QFormerConfig, prefix: str = "") -> None:
         super().__init__()
 
         self.dense = nn.Linear(config.hidden_size, config.hidden_size)
-        self.LayerNorm = nn.LayerNorm(config.hidden_size,
-                                      eps=config.layer_norm_eps)
+        self.LayerNorm = nn.LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
         self.dropout = nn.Dropout(config.hidden_dropout_prob)
 
     def forward(
@@ -165,7 +175,6 @@ def forward(
 
 
 class Blip2QFormerAttention(nn.Module):
-
     def __init__(
         self,
         config: Blip2QFormerConfig,
@@ -202,7 +211,6 @@ def forward(
 
 
 class Blip2QFormerIntermediate(nn.Module):
-
     def __init__(self, config: Blip2QFormerConfig, prefix: str = "") -> None:
         super().__init__()
 
@@ -216,13 +224,11 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class Blip2QFormerOutput(nn.Module):
-
     def __init__(self, config: Blip2QFormerConfig, prefix: str = "") -> None:
         super().__init__()
 
         self.dense = nn.Linear(config.intermediate_size, config.hidden_size)
-        self.LayerNorm = nn.LayerNorm(config.hidden_size,
-                                      eps=config.layer_norm_eps)
+        self.LayerNorm = nn.LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
         self.dropout = nn.Dropout(config.hidden_dropout_prob)
 
     def forward(
@@ -237,7 +243,6 @@ def forward(
 
 
 class Blip2QFormerLayer(nn.Module):
-
     def __init__(
         self,
         config: Blip2QFormerConfig,
@@ -251,10 +256,12 @@ def __init__(
 
         self.chunk_size_feed_forward = config.chunk_size_feed_forward
         self.seq_len_dim = 1
-        self.attention = Blip2QFormerAttention(config,
-                                               quant_config=quant_config,
-                                               cache_config=cache_config,
-                                               prefix=f"{prefix}.attention")
+        self.attention = Blip2QFormerAttention(
+            config,
+            quant_config=quant_config,
+            cache_config=cache_config,
+            prefix=f"{prefix}.attention",
+        )
 
         self.layer_idx = layer_idx
 
@@ -264,15 +271,16 @@ def __init__(
                 quant_config=quant_config,
                 cache_config=cache_config,
                 is_cross_attention=True,
-                prefix=f"{prefix}.crossattention")
+                prefix=f"{prefix}.crossattention",
+            )
             self.has_cross_attention = True
         else:
             self.has_cross_attention = False
 
         self.intermediate_query = Blip2QFormerIntermediate(
-            config, prefix=f"{prefix}.intermediate_query")
-        self.output_query = Blip2QFormerOutput(config,
-                                               prefix=f"{prefix}.output_query")
+            config, prefix=f"{prefix}.intermediate_query"
+        )
+        self.output_query = Blip2QFormerOutput(config, prefix=f"{prefix}.output_query")
 
     def forward(
         self,
@@ -305,8 +313,7 @@ def forward(
                     self.seq_len_dim,
                     attention_output[:, query_length:, :],
                 )
-                layer_output = torch.cat([layer_output, layer_output_text],
-                                         dim=1)
+                layer_output = torch.cat([layer_output, layer_output_text], dim=1)
         else:
             layer_output = apply_chunking_to_forward(
                 self.feed_forward_chunk,
@@ -317,21 +324,18 @@ def forward(
 
         return layer_output
 
-    def feed_forward_chunk(self,
-                           attention_output: torch.Tensor) -> torch.Tensor:
+    def feed_forward_chunk(self, attention_output: torch.Tensor) -> torch.Tensor:
         intermediate_output = self.intermediate(attention_output)
         layer_output = self.output(intermediate_output, attention_output)
         return layer_output
 
-    def feed_forward_chunk_query(
-            self, attention_output: torch.Tensor) -> torch.Tensor:
+    def feed_forward_chunk_query(self, attention_output: torch.Tensor) -> torch.Tensor:
         intermediate_output = self.intermediate_query(attention_output)
         layer_output = self.output_query(intermediate_output, attention_output)
         return layer_output
 
 
 class Blip2QFormerEncoder(nn.Module):
-
     def __init__(
         self,
         config: Blip2QFormerConfig,
@@ -344,14 +348,18 @@ def __init__(
 
         self.config = config
 
-        self.layer = nn.ModuleList([
-            Blip2QFormerLayer(config,
-                              quant_config=quant_config,
-                              cache_config=cache_config,
-                              layer_idx=layer_idx,
-                              prefix=f"{prefix}.layer.{layer_idx}")
-            for layer_idx in range(config.num_hidden_layers)
-        ])
+        self.layer = nn.ModuleList(
+            [
+                Blip2QFormerLayer(
+                    config,
+                    quant_config=quant_config,
+                    cache_config=cache_config,
+                    layer_idx=layer_idx,
+                    prefix=f"{prefix}.layer.{layer_idx}",
+                )
+                for layer_idx in range(config.num_hidden_layers)
+            ]
+        )
 
     def forward(
         self,
@@ -373,7 +381,6 @@ def forward(
 
 # Adapted from https://github.com/huggingface/transformers/blob/v4.41.2/src/transformers/models/blip_2/modeling_blip_2.py#L1025
 class Blip2QFormerModel(nn.Module):
-
     def __init__(
         self,
         config: Blip2QFormerConfig,
@@ -386,14 +393,15 @@ def __init__(
 
         self.config = config
 
-        self.layernorm = nn.LayerNorm(config.hidden_size,
-                                      eps=config.layer_norm_eps)
+        self.layernorm = nn.LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
         self.dropout = nn.Dropout(config.hidden_dropout_prob)
 
-        self.encoder = Blip2QFormerEncoder(config,
-                                           quant_config=quant_config,
-                                           cache_config=cache_config,
-                                           prefix=f"{prefix}.encoder")
+        self.encoder = Blip2QFormerEncoder(
+            config,
+            quant_config=quant_config,
+            cache_config=cache_config,
+            prefix=f"{prefix}.encoder",
+        )
 
     def forward(
         self,
@@ -415,7 +423,6 @@ def forward(
 
 
 class Blip2ProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(Blip2Config)
 
@@ -428,7 +435,6 @@ def get_num_image_tokens(self) -> int:
 
 
 class Blip2DummyInputsBuilder(BaseDummyInputsBuilder[Blip2ProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         return ""
 
@@ -447,16 +453,16 @@ def get_dummy_mm_data(
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=max_image_size,
-                                   height=max_image_size,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=max_image_size,
+                height=max_image_size,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class Blip2MultiModalProcessor(BaseMultiModalProcessor[Blip2ProcessingInfo]):
-
     def _call_hf_processor(
         self,
         prompt: str,
@@ -509,11 +515,14 @@ def _get_prompt_updates(
         ]
 
 
-@MULTIMODAL_REGISTRY.register_processor(Blip2MultiModalProcessor,
-                                        info=Blip2ProcessingInfo,
-                                        dummy_inputs=Blip2DummyInputsBuilder)
-class Blip2ForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP,
-                                    SupportsQuant):
+@MULTIMODAL_REGISTRY.register_processor(
+    Blip2MultiModalProcessor,
+    info=Blip2ProcessingInfo,
+    dummy_inputs=Blip2DummyInputsBuilder,
+)
+class Blip2ForConditionalGeneration(
+    nn.Module, SupportsMultiModal, SupportsPP, SupportsQuant
+):
     merge_by_field_config = True
 
     @classmethod
@@ -524,7 +533,6 @@ def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
         raise ValueError("Only image modality is supported")
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
-
         super().__init__()
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
@@ -537,13 +545,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.vision_model = BlipVisionModel(config.vision_config, quant_config)
 
         self.query_tokens = nn.Parameter(
-            torch.zeros(1, config.num_query_tokens,
-                        config.qformer_config.hidden_size))
+            torch.zeros(1, config.num_query_tokens, config.qformer_config.hidden_size)
+        )
 
-        self.qformer = Blip2QFormerModel(config.qformer_config,
-                                         cache_config=cache_config,
-                                         quant_config=quant_config,
-                                         prefix=f"{prefix}.qformer")
+        self.qformer = Blip2QFormerModel(
+            config.qformer_config,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.qformer",
+        )
 
         self.language_projection = nn.Linear(
             config.qformer_config.hidden_size,
@@ -558,10 +568,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[Blip2ImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[Blip2ImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_embeds = kwargs.pop("image_embeds", None)
 
@@ -570,12 +582,11 @@ def _parse_and_validate_image_input(
 
         if pixel_values is not None:
             expected_h = expected_w = self.config.vision_config.image_size
-            return Blip2ImagePixelInputs(type="pixel_values",
-                                         data=pixel_values,
-                                         resolve_bindings={
-                                             "h": expected_h,
-                                             "w": expected_w
-                                         })
+            return Blip2ImagePixelInputs(
+                type="pixel_values",
+                data=pixel_values,
+                resolve_bindings={"h": expected_h, "w": expected_w},
+            )
 
         if image_embeds is not None:
             return Blip2ImageEmbeddingInputs(
@@ -585,34 +596,30 @@ def _parse_and_validate_image_input(
 
         raise AssertionError("This line should be unreachable.")
 
-    def _image_pixels_to_features(self, vision_model: BlipVisionModel,
-                                  pixel_values: torch.Tensor) -> torch.Tensor:
-
+    def _image_pixels_to_features(
+        self, vision_model: BlipVisionModel, pixel_values: torch.Tensor
+    ) -> torch.Tensor:
         # NOTE: we skip the step to select the vision feature layer since
         # this is already done inside the vision tower
         image_features = vision_model(pixel_values)
 
         return image_features
 
-    def _process_image_pixels(self,
-                              inputs: Blip2ImagePixelInputs) -> torch.Tensor:
+    def _process_image_pixels(self, inputs: Blip2ImagePixelInputs) -> torch.Tensor:
         assert self.vision_model is not None
 
         pixel_values = inputs["data"]
 
         return self._image_pixels_to_features(self.vision_model, pixel_values)
 
-    def _process_image_input(self,
-                             image_input: Blip2ImageInputs) -> torch.Tensor:
-
+    def _process_image_input(self, image_input: Blip2ImageInputs) -> torch.Tensor:
         if image_input["type"] == "image_embeds":
             return image_input["data"]
 
         assert self.vision_model is not None
         image_features = self._process_image_pixels(image_input)
 
-        query_tokens = self.query_tokens.expand(image_features.shape[0], -1,
-                                                -1)
+        query_tokens = self.query_tokens.expand(image_features.shape[0], -1, -1)
         query_output = self.qformer(
             query_embeds=query_tokens,
             encoder_hidden_states=image_features,
@@ -623,8 +630,7 @@ def _process_image_input(self,
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -651,7 +657,7 @@ def forward(
         `[2, 45641, 35, 653, 18, 5, 1383, 9, 5, 2274, 116, 31652, 35]`.
 
         To reserve space in KV cache, we have to insert placeholder tokens
-        before they are inputted to the model, so the input processor prepends 
+        before they are inputted to the model, so the input processor prepends
         dummy tokens (denoted as `50265`), resulting in:
         `[50265, ..., 50265, 2, 45641, 35, ..., 31652, 35]`.
 
@@ -664,7 +670,7 @@ def forward(
         Args:
             input_ids: Flattened (concatenated) input_ids corresponding to a
                 batch.
-        
+
         Info:
             [`Blip2ImageInputs`][vllm.model_executor.models.blip2.Blip2ImageInputs]
         """
@@ -672,10 +678,9 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.language_model.model(input_ids,
-                                                  positions,
-                                                  intermediate_tensors,
-                                                  inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
 
         return hidden_states
 
@@ -685,7 +690,6 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/bloom.py b/vllm/model_executor/models/bloom.py
index 30816f72a267..4a814fc4020d 100644
--- a/vllm/model_executor/models/bloom.py
+++ b/vllm/model_executor/models/bloom.py
@@ -18,6 +18,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only BLOOM model compatible with HuggingFace weights."""
+
 import math
 from collections.abc import Iterable
 from itertools import islice
@@ -30,29 +31,40 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (get_pp_group, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsPP, SupportsQuant
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 def _get_alibi_slopes(total_num_heads: int) -> torch.Tensor:
-    closest_power_of_2 = 2**math.floor(math.log2(total_num_heads))
+    closest_power_of_2 = 2 ** math.floor(math.log2(total_num_heads))
     base = torch.tensor(
-        2**(-(2**-(math.log2(closest_power_of_2) - 3))),
+        2 ** (-(2 ** -(math.log2(closest_power_of_2) - 3))),
         dtype=torch.float32,
     )
     powers = torch.arange(1, 1 + closest_power_of_2, dtype=torch.int32)
@@ -60,22 +72,20 @@ def _get_alibi_slopes(total_num_heads: int) -> torch.Tensor:
 
     if closest_power_of_2 != total_num_heads:
         extra_base = torch.tensor(
-            2**(-(2**-(math.log2(2 * closest_power_of_2) - 3))),
+            2 ** (-(2 ** -(math.log2(2 * closest_power_of_2) - 3))),
             dtype=torch.float32,
         )
-        num_remaining_heads = min(closest_power_of_2,
-                                  total_num_heads - closest_power_of_2)
-        extra_powers = torch.arange(start=1,
-                                    end=1 + 2 * num_remaining_heads,
-                                    step=2,
-                                    dtype=torch.int32)
-        slopes = torch.cat(
-            [slopes, torch.pow(extra_base, extra_powers)], dim=0)
+        num_remaining_heads = min(
+            closest_power_of_2, total_num_heads - closest_power_of_2
+        )
+        extra_powers = torch.arange(
+            start=1, end=1 + 2 * num_remaining_heads, step=2, dtype=torch.int32
+        )
+        slopes = torch.cat([slopes, torch.pow(extra_base, extra_powers)], dim=0)
     return slopes
 
 
 class BloomAttention(nn.Module):
-
     def __init__(
         self,
         config: BloomConfig,
@@ -115,13 +125,15 @@ def __init__(
         alibi_slopes = alibi_slopes[head_start:head_end].tolist()
 
         scaling = self.head_dim**-0.5
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              scaling,
-                              alibi_slopes=alibi_slopes,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            scaling,
+            alibi_slopes=alibi_slopes,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -137,7 +149,6 @@ def forward(
 
 
 class BloomMLP(nn.Module):
-
     def __init__(
         self,
         config: BloomConfig,
@@ -165,7 +176,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class BloomBlock(nn.Module):
-
     def __init__(
         self,
         config: BloomConfig,
@@ -176,17 +186,17 @@ def __init__(
         super().__init__()
         hidden_size = config.hidden_size
 
-        self.input_layernorm = nn.LayerNorm(hidden_size,
-                                            eps=config.layer_norm_epsilon)
-        self.self_attention = BloomAttention(config,
-                                             cache_config,
-                                             quant_config,
-                                             prefix=f"{prefix}.self_attention")
+        self.input_layernorm = nn.LayerNorm(hidden_size, eps=config.layer_norm_epsilon)
+        self.self_attention = BloomAttention(
+            config, cache_config, quant_config, prefix=f"{prefix}.self_attention"
+        )
         self.post_attention_layernorm = nn.LayerNorm(
-            hidden_size, eps=config.layer_norm_epsilon)
+            hidden_size, eps=config.layer_norm_epsilon
+        )
         self.mlp = BloomMLP(config, quant_config)
         self.apply_residual_connection_post_layernorm = (
-            config.apply_residual_connection_post_layernorm)
+            config.apply_residual_connection_post_layernorm
+        )
 
     def forward(
         self,
@@ -223,7 +233,6 @@ def forward(
 
 @support_torch_compile
 class BloomModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -240,20 +249,23 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.embed_dim,
         )
         self.word_embeddings_layernorm = nn.LayerNorm(
-            self.embed_dim, eps=config.layer_norm_epsilon)
+            self.embed_dim, eps=config.layer_norm_epsilon
+        )
 
         # Transformer blocks
         self.start_layer, self.end_layer, self.h = make_layers(
             config.num_hidden_layers,
             lambda prefix: BloomBlock(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.h")
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.h",
+        )
 
         # Final Layer Norm
         self.ln_f = nn.LayerNorm(self.embed_dim, eps=config.layer_norm_epsilon)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.word_embeddings(input_ids)
@@ -281,8 +293,7 @@ def forward(
         hidden_states = self.ln_f(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters(remove_duplicate=False))
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
@@ -300,14 +311,14 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if output_dim is not None:
                     loaded_weight_shape = loaded_weight.shape
                     loaded_weight = loaded_weight.view(
-                        loaded_weight_shape[:output_dim] + (num_heads, 3, -1) +
-                        loaded_weight_shape[output_dim + 1:])
-                    loaded_weight = loaded_weight.transpose(
-                        output_dim, output_dim + 1)
+                        loaded_weight_shape[:output_dim]
+                        + (num_heads, 3, -1)
+                        + loaded_weight_shape[output_dim + 1 :]
+                    )
+                    loaded_weight = loaded_weight.transpose(output_dim, output_dim + 1)
                     loaded_weight = loaded_weight.reshape(loaded_weight_shape)
 
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
 
@@ -315,27 +326,28 @@ def load_weights(self, weights: Iterable[tuple[str,
 
 
 class BloomForCausalLM(nn.Module, SupportsPP, SupportsQuant):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.transformer = BloomModel(vllm_config=vllm_config,
-                                      prefix=maybe_prefix(
-                                          prefix, "transformer"))
+        self.transformer = BloomModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "transformer")
+        )
         if self.config.tie_word_embeddings:
             self.lm_head = self.transformer.word_embeddings
         else:
-            self.lm_head = ParallelLMHead(self.config.vocab_size,
-                                          self.config.hidden_size,
-                                          prefix=maybe_prefix(
-                                              prefix, "lm_head"))
+            self.lm_head = ParallelLMHead(
+                self.config.vocab_size,
+                self.config.hidden_size,
+                prefix=maybe_prefix(prefix, "lm_head"),
+            )
 
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.transformer.make_empty_intermediate_tensors)
+            self.transformer.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.transformer.get_input_embeddings(input_ids)
@@ -347,8 +359,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.transformer(input_ids, positions,
-                                         intermediate_tensors, inputs_embeds)
+        hidden_states = self.transformer(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -358,17 +371,16 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self, skip_prefixes=["lm_head.weight"])
         weights = _add_transformer_prefix(weights)
         return loader.load_weights(weights)
 
 
 def _add_transformer_prefix(
-    weights: Iterable[tuple[str, torch.Tensor]]
+    weights: Iterable[tuple[str, torch.Tensor]],
 ) -> Iterable[tuple[str, torch.Tensor]]:
     for name, tensor in weights:
-        if not name.startswith('transformer.'):
-            name = 'transformer.' + name
+        if not name.startswith("transformer."):
+            name = "transformer." + name
         yield name, tensor
diff --git a/vllm/model_executor/models/chameleon.py b/vllm/model_executor/models/chameleon.py
index b1432dcb9d6d..d8756e236f4c 100644
--- a/vllm/model_executor/models/chameleon.py
+++ b/vllm/model_executor/models/chameleon.py
@@ -9,8 +9,12 @@
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
-from transformers import (BatchFeature, ChameleonConfig, ChameleonProcessor,
-                          ChameleonVQVAEConfig)
+from transformers import (
+    BatchFeature,
+    ChameleonConfig,
+    ChameleonProcessor,
+    ChameleonVQVAEConfig,
+)
 
 from vllm.attention import Attention
 from vllm.config import CacheConfig, VllmConfig
@@ -19,33 +23,53 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, row_parallel_weight_loader)
+    default_weight_loader,
+    row_parallel_weight_loader,
+)
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
 from vllm.multimodal.parse import MultiModalDataItems
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-from .interfaces import (MultiModalEmbeddings, SupportsMultiModal, SupportsPP,
-                         SupportsQuant)
-from .utils import (is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsMultiModal,
+    SupportsPP,
+    SupportsQuant,
+)
+from .utils import (
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
@@ -58,12 +82,12 @@ class ChameleonImagePixelInputs(TensorSchema):
         - h: Height of each image
         - w: Width of each image
     """
+
     type: Literal["pixel_values"]
     data: Annotated[torch.Tensor, TensorShape("bn", 3, "h", "w")]
 
 
 class ChameleonProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(ChameleonConfig)
 
@@ -78,9 +102,7 @@ def get_num_image_tokens(self) -> int:
         return processor.image_seq_length
 
 
-class ChameleonDummyInputsBuilder(
-        BaseDummyInputsBuilder[ChameleonProcessingInfo]):
-
+class ChameleonDummyInputsBuilder(BaseDummyInputsBuilder[ChameleonProcessingInfo]):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -103,17 +125,16 @@ def get_dummy_mm_data(
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=width,
-                                   height=height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=width,
+                height=height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
-class ChameleonMultiModalProcessor(
-        BaseMultiModalProcessor[ChameleonProcessingInfo]):
-
+class ChameleonMultiModalProcessor(BaseMultiModalProcessor[ChameleonProcessingInfo]):
     def _call_hf_processor(
         self,
         prompt: str,
@@ -182,29 +203,23 @@ def _get_prompt_updates(
 
 
 class ChameleonLayerNorm(nn.LayerNorm):
-
     def __init__(self, hidden_size, *args, **kwargs):
         super().__init__(hidden_size, *args, **kwargs)
-        self.normalized_shape = (hidden_size[-1], )
+        self.normalized_shape = (hidden_size[-1],)
 
-        set_weight_attrs(self.weight,
-                         {"weight_loader": row_parallel_weight_loader})
-        set_weight_attrs(self.bias,
-                         {"weight_loader": row_parallel_weight_loader})
+        set_weight_attrs(self.weight, {"weight_loader": row_parallel_weight_loader})
+        set_weight_attrs(self.bias, {"weight_loader": row_parallel_weight_loader})
 
     def forward(self, hidden_states):
-        hidden_states = F.layer_norm(hidden_states,
-                                     self.normalized_shape,
-                                     None,
-                                     None,
-                                     eps=1e-5)
+        hidden_states = F.layer_norm(
+            hidden_states, self.normalized_shape, None, None, eps=1e-5
+        )
         hidden_states = hidden_states * self.weight + self.bias
         return hidden_states
 
 
 # Copied from vllm.model_executor.models.llama.LlamaMLP -> ChameleonMLP
 class ChameleonMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -218,14 +233,18 @@ def __init__(
             input_size=hidden_size,
             output_sizes=[intermediate_size] * 2,
             bias=bias,
-            quant_config=quant_config)
-        self.down_proj = RowParallelLinear(input_size=intermediate_size,
-                                           output_size=hidden_size,
-                                           bias=bias,
-                                           quant_config=quant_config)
+            quant_config=quant_config,
+        )
+        self.down_proj = RowParallelLinear(
+            input_size=intermediate_size,
+            output_size=hidden_size,
+            bias=bias,
+            quant_config=quant_config,
+        )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -237,7 +256,6 @@ def forward(self, x):
 
 # Modified from vllm.model_executor.models.llama.LlamaAttention -> ChameleonAttention #noqa
 class ChameleonAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -298,16 +316,19 @@ def __init__(
             rope_scaling=rope_scaling,
         )
 
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
-    def _apply_qk_norm(self, q: torch.Tensor,
-                       k: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+    def _apply_qk_norm(
+        self, q: torch.Tensor, k: torch.Tensor
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         # reshape for layernorm
         q = q.reshape(-1, self.num_heads, self.head_dim)
         k = k.reshape(-1, self.num_kv_heads, self.head_dim)
@@ -333,7 +354,6 @@ def forward(
 
 
 class ChameleonDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: ChameleonConfig,
@@ -346,17 +366,19 @@ def __init__(
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
         if rope_scaling is not None and getattr(
-                config, "original_max_position_embeddings", None):
+            config, "original_max_position_embeddings", None
+        ):
             rope_scaling["original_max_position_embeddings"] = (
-                config.original_max_position_embeddings)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          4096)
+                config.original_max_position_embeddings
+            )
+        max_position_embeddings = getattr(config, "max_position_embeddings", 4096)
 
         self.self_attn = ChameleonAttention(
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
-            num_kv_heads=getattr(config, "num_key_value_heads",
-                                 config.num_attention_heads),
+            num_kv_heads=getattr(
+                config, "num_key_value_heads", config.num_attention_heads
+            ),
             rope_theta=rope_theta,
             rope_scaling=rope_scaling,
             max_position_embeddings=max_position_embeddings,
@@ -372,10 +394,10 @@ def __init__(
             quant_config=quant_config,
             bias=getattr(config, "mlp_bias", False),
         )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -383,28 +405,24 @@ def forward(
         hidden_states: torch.Tensor,
         residual: Optional[torch.Tensor],
     ) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
-
         if residual is None:
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
 
         return hidden_states, residual
 
 
 class ChameleonSwinDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: ChameleonConfig,
@@ -417,17 +435,19 @@ def __init__(
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
         if rope_scaling is not None and getattr(
-                config, "original_max_position_embeddings", None):
+            config, "original_max_position_embeddings", None
+        ):
             rope_scaling["original_max_position_embeddings"] = (
-                config.original_max_position_embeddings)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          4096)
+                config.original_max_position_embeddings
+            )
+        max_position_embeddings = getattr(config, "max_position_embeddings", 4096)
 
         self.self_attn = ChameleonAttention(
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
-            num_kv_heads=getattr(config, "num_key_value_heads",
-                                 config.num_attention_heads),
+            num_kv_heads=getattr(
+                config, "num_key_value_heads", config.num_attention_heads
+            ),
             rope_theta=rope_theta,
             rope_scaling=rope_scaling,
             max_position_embeddings=max_position_embeddings,
@@ -443,10 +463,10 @@ def __init__(
             quant_config=quant_config,
             bias=getattr(config, "mlp_bias", False),
         )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -454,7 +474,6 @@ def forward(
         hidden_states: torch.Tensor,
         residual: Optional[torch.Tensor],
     ) -> tuple[torch.Tensor, torch.Tensor]:
-
         residual = hidden_states
         hidden_states = self.self_attn(
             positions=positions,
@@ -475,7 +494,6 @@ def forward(
 
 # Copied from transformers.models.chameleon.modeling_chameleon.ChameleonVQVAEVectorQuantizer #noqa
 class ChameleonVQVAEVectorQuantizer(nn.Module):
-
     def __init__(self, config: ChameleonVQVAEConfig):
         super().__init__()
         self.num_embeddings = config.num_embeddings
@@ -491,55 +509,52 @@ def forward(self, hidden_state: torch.Tensor):
 
         # distances from z to embeddings e_j (z - e)^2 = z^2 + e^2 - 2 e * z
         distances = (
-            torch.sum(hidden_state_flattened**2, dim=1, keepdim=True) +
-            torch.sum(self.embedding.weight**2, dim=1) -
-            2 * torch.einsum("bd,dn->bn", hidden_state_flattened,
-                             self.embedding.weight.transpose(0, 1)))
+            torch.sum(hidden_state_flattened**2, dim=1, keepdim=True)
+            + torch.sum(self.embedding.weight**2, dim=1)
+            - 2
+            * torch.einsum(
+                "bd,dn->bn",
+                hidden_state_flattened,
+                self.embedding.weight.transpose(0, 1),
+            )
+        )
 
         min_encoding_indices = torch.argmin(distances, dim=1)
         hidden_state_quant = self.embedding(min_encoding_indices).view(
-            hidden_state.shape)
+            hidden_state.shape
+        )
 
         # compute loss for embedding
-        loss = torch.mean((hidden_state_quant.detach() - hidden_state)**
-                          2) + self.beta * torch.mean(
-                              (hidden_state_quant - hidden_state.detach())**2)
+        loss = torch.mean(
+            (hidden_state_quant.detach() - hidden_state) ** 2
+        ) + self.beta * torch.mean((hidden_state_quant - hidden_state.detach()) ** 2)
 
         # preserve gradients
-        hidden_state_quant = hidden_state + (hidden_state_quant -
-                                             hidden_state).detach()
+        hidden_state_quant = hidden_state + (hidden_state_quant - hidden_state).detach()
 
         # reshape back to match original input shape
-        hidden_state_quant = hidden_state_quant.permute(0, 3, 1,
-                                                        2).contiguous()
+        hidden_state_quant = hidden_state_quant.permute(0, 3, 1, 2).contiguous()
 
         return hidden_state_quant, loss, min_encoding_indices
 
 
 # Copied from transformers.models.chameleon.modeling_chameleon.ChameleonVQVAEEncoderConvDownsample #noqa
 class ChameleonVQVAEEncoderConvDownsample(nn.Module):
-
     def __init__(self, in_channels: int):
         super().__init__()
-        self.conv = nn.Conv2d(in_channels,
-                              in_channels,
-                              kernel_size=3,
-                              stride=2,
-                              padding=0)
+        self.conv = nn.Conv2d(
+            in_channels, in_channels, kernel_size=3, stride=2, padding=0
+        )
 
     def forward(self, hidden_states: torch.Tensor):
         # no asymmetric padding in torch conv, must do it ourselves
-        hidden_states = F.pad(hidden_states,
-                              pad=(0, 1, 0, 1),
-                              mode="constant",
-                              value=0)
+        hidden_states = F.pad(hidden_states, pad=(0, 1, 0, 1), mode="constant", value=0)
         hidden_states = self.conv(hidden_states)
         return hidden_states
 
 
 # Copied from transformers.models.chameleon.modeling_chameleon.ChameleonVQVAEEncoderResnetBlock #noqa
 class ChameleonVQVAEEncoderResnetBlock(nn.Module):
-
     def __init__(
         self,
         config: ChameleonVQVAEConfig,
@@ -549,42 +564,31 @@ def __init__(
     ):
         super().__init__()
         self.in_channels = in_channels
-        self.out_channels = in_channels if out_channels is None \
-            else out_channels
+        self.out_channels = in_channels if out_channels is None else out_channels
         self.use_conv_shortcut = conv_shortcut
 
-        self.norm1 = torch.nn.GroupNorm(num_groups=32,
-                                        num_channels=in_channels,
-                                        eps=1e-6,
-                                        affine=True)
-        self.conv1 = torch.nn.Conv2d(in_channels,
-                                     out_channels,
-                                     kernel_size=3,
-                                     stride=1,
-                                     padding=1)
-        self.norm2 = torch.nn.GroupNorm(num_groups=32,
-                                        num_channels=out_channels,
-                                        eps=1e-6,
-                                        affine=True)
+        self.norm1 = torch.nn.GroupNorm(
+            num_groups=32, num_channels=in_channels, eps=1e-6, affine=True
+        )
+        self.conv1 = torch.nn.Conv2d(
+            in_channels, out_channels, kernel_size=3, stride=1, padding=1
+        )
+        self.norm2 = torch.nn.GroupNorm(
+            num_groups=32, num_channels=out_channels, eps=1e-6, affine=True
+        )
         self.dropout = torch.nn.Dropout(config.dropout)
-        self.conv2 = torch.nn.Conv2d(out_channels,
-                                     out_channels,
-                                     kernel_size=3,
-                                     stride=1,
-                                     padding=1)
+        self.conv2 = torch.nn.Conv2d(
+            out_channels, out_channels, kernel_size=3, stride=1, padding=1
+        )
         if self.in_channels != self.out_channels:
             if self.use_conv_shortcut:
-                self.conv_shortcut = torch.nn.Conv2d(in_channels,
-                                                     out_channels,
-                                                     kernel_size=3,
-                                                     stride=1,
-                                                     padding=1)
+                self.conv_shortcut = torch.nn.Conv2d(
+                    in_channels, out_channels, kernel_size=3, stride=1, padding=1
+                )
             else:
-                self.nin_shortcut = torch.nn.Conv2d(in_channels,
-                                                    out_channels,
-                                                    kernel_size=1,
-                                                    stride=1,
-                                                    padding=0)
+                self.nin_shortcut = torch.nn.Conv2d(
+                    in_channels, out_channels, kernel_size=1, stride=1, padding=0
+                )
 
     def forward(self, hidden_states: torch.Tensor):
         residual = hidden_states
@@ -608,35 +612,25 @@ def forward(self, hidden_states: torch.Tensor):
 
 # Copied from transformers.models.chameleon.modeling_chameleon.ChameleonVQVAEEncoderAttnBlock #noqa
 class ChameleonVQVAEEncoderAttnBlock(nn.Module):
-
     def __init__(self, in_channels: int):
         super().__init__()
         self.in_channels = in_channels
 
-        self.norm = torch.nn.GroupNorm(num_groups=32,
-                                       num_channels=in_channels,
-                                       eps=1e-6,
-                                       affine=True)
-        self.q = torch.nn.Conv2d(in_channels,
-                                 in_channels,
-                                 kernel_size=1,
-                                 stride=1,
-                                 padding=0)
-        self.k = torch.nn.Conv2d(in_channels,
-                                 in_channels,
-                                 kernel_size=1,
-                                 stride=1,
-                                 padding=0)
-        self.v = torch.nn.Conv2d(in_channels,
-                                 in_channels,
-                                 kernel_size=1,
-                                 stride=1,
-                                 padding=0)
-        self.proj_out = torch.nn.Conv2d(in_channels,
-                                        in_channels,
-                                        kernel_size=1,
-                                        stride=1,
-                                        padding=0)
+        self.norm = torch.nn.GroupNorm(
+            num_groups=32, num_channels=in_channels, eps=1e-6, affine=True
+        )
+        self.q = torch.nn.Conv2d(
+            in_channels, in_channels, kernel_size=1, stride=1, padding=0
+        )
+        self.k = torch.nn.Conv2d(
+            in_channels, in_channels, kernel_size=1, stride=1, padding=0
+        )
+        self.v = torch.nn.Conv2d(
+            in_channels, in_channels, kernel_size=1, stride=1, padding=0
+        )
+        self.proj_out = torch.nn.Conv2d(
+            in_channels, in_channels, kernel_size=1, stride=1, padding=0
+        )
 
     def forward(self, hidden_states: torch.Tensor):
         residual = hidden_states
@@ -647,20 +641,20 @@ def forward(self, hidden_states: torch.Tensor):
 
         # compute attention
         batch_size, channels, height, width = query_states.shape
-        query_states = query_states.reshape(batch_size, channels,
-                                            height * width).permute(0, 2, 1)
+        query_states = query_states.reshape(
+            batch_size, channels, height * width
+        ).permute(0, 2, 1)
         key_states = key_states.reshape(batch_size, channels, height * width)
         attn_weights = torch.bmm(query_states, key_states)
-        attn_weights = attn_weights * (int(channels)**(-0.5))
+        attn_weights = attn_weights * (int(channels) ** (-0.5))
         attn_weights = F.softmax(attn_weights, dim=2)
 
         # attend to values
-        value_states = value_states.reshape(batch_size, channels,
-                                            height * width)
+        value_states = value_states.reshape(batch_size, channels, height * width)
         attn_weights = attn_weights.permute(0, 2, 1)
-        attn_output = torch.bmm(value_states,
-                                attn_weights).reshape(batch_size, channels,
-                                                      height, width)
+        attn_output = torch.bmm(value_states, attn_weights).reshape(
+            batch_size, channels, height, width
+        )
 
         attn_output = self.proj_out(attn_output)
         return residual + attn_output
@@ -668,7 +662,6 @@ def forward(self, hidden_states: torch.Tensor):
 
 # Copied from transformers.models.chameleon.modeling_chameleon.ChameleonVQVAEEncoder #noqa
 class ChameleonVQVAEEncoder(nn.Module):
-
     def __init__(self, config: ChameleonVQVAEConfig):
         super().__init__()
 
@@ -681,14 +674,12 @@ def __init__(self, config: ChameleonVQVAEConfig):
         latent_channels = config.latent_channels
         channel_multiplier = config.channel_multiplier
 
-        self.conv_in = torch.nn.Conv2d(in_channels,
-                                       base_channels,
-                                       kernel_size=3,
-                                       stride=1,
-                                       padding=1)
+        self.conv_in = torch.nn.Conv2d(
+            in_channels, base_channels, kernel_size=3, stride=1, padding=1
+        )
 
         curr_res = resolution
-        in_channel_multiplier = (1, ) + tuple(channel_multiplier)
+        in_channel_multiplier = (1,) + tuple(channel_multiplier)
         self.in_channel_multiplier = in_channel_multiplier
         self.down = nn.ModuleList()
         for i_level in range(self.num_resolutions):
@@ -702,11 +693,14 @@ def __init__(self, config: ChameleonVQVAEConfig):
                         config=config,
                         in_channels=block_in,
                         out_channels=block_out,
-                    ))
+                    )
+                )
                 block_in = block_out
-                if (config.attn_resolutions is not None
-                        and curr_res in config.attn_resolutions
-                        and config.attn_type == "vanilla"):
+                if (
+                    config.attn_resolutions is not None
+                    and curr_res in config.attn_resolutions
+                    and config.attn_type == "vanilla"
+                ):
                     attn.append(ChameleonVQVAEEncoderAttnBlock(block_in))
 
             down = nn.Module()
@@ -723,18 +717,20 @@ def __init__(self, config: ChameleonVQVAEConfig):
             in_channels=block_in,
             out_channels=block_in,
         )
-        self.mid.attn_1 = ChameleonVQVAEEncoderAttnBlock(
-            block_in) if config.attn_type == "vanilla" else nn.Identity()
+        self.mid.attn_1 = (
+            ChameleonVQVAEEncoderAttnBlock(block_in)
+            if config.attn_type == "vanilla"
+            else nn.Identity()
+        )
         self.mid.block_2 = ChameleonVQVAEEncoderResnetBlock(
             config=config,
             in_channels=block_in,
             out_channels=block_in,
         )
 
-        self.norm_out = torch.nn.GroupNorm(num_groups=32,
-                                           num_channels=block_in,
-                                           eps=1e-6,
-                                           affine=True)
+        self.norm_out = torch.nn.GroupNorm(
+            num_groups=32, num_channels=block_in, eps=1e-6, affine=True
+        )
         self.conv_out = torch.nn.Conv2d(
             block_in,
             2 * latent_channels if double_latent else latent_channels,
@@ -750,15 +746,12 @@ def forward(self, pixel_values: torch.Tensor):
         hidden_states = [self.conv_in(pixel_values)]
         for i_level in range(self.num_resolutions):
             for i_block in range(self.num_res_blocks):
-                hidden_state = self.down[i_level].block[i_block](
-                    hidden_states[-1])
+                hidden_state = self.down[i_level].block[i_block](hidden_states[-1])
                 if len(self.down[i_level].attn) > 0:
-                    hidden_state = self.down[i_level].attn[i_block](
-                        hidden_state)
+                    hidden_state = self.down[i_level].attn[i_block](hidden_state)
                 hidden_states.append(hidden_state)
             if i_level != self.num_resolutions - 1:
-                hidden_states.append(self.down[i_level].downsample(
-                    hidden_states[-1]))
+                hidden_states.append(self.down[i_level].downsample(hidden_states[-1]))
 
         # middle
         last_hidden_state = hidden_states[-1]
@@ -775,15 +768,14 @@ def forward(self, pixel_values: torch.Tensor):
 
 # Adapted from transformers.models.chameleon.modeling_chameleon.ChameleonVQVAE #noqa
 class ChameleonVQVAE(nn.Module):
-
     def __init__(self, config: ChameleonVQVAEConfig):
         super().__init__()
         self.encoder = ChameleonVQVAEEncoder(config)
         self.quantize = ChameleonVQVAEVectorQuantizer(config)
-        self.quant_conv = torch.nn.Conv2d(config.latent_channels,
-                                          config.embed_dim, 1)
-        self.post_quant_conv = torch.nn.Conv2d(config.embed_dim,
-                                               config.latent_channels, 1)
+        self.quant_conv = torch.nn.Conv2d(config.latent_channels, config.embed_dim, 1)
+        self.post_quant_conv = torch.nn.Conv2d(
+            config.embed_dim, config.latent_channels, 1
+        )
         self.eval()  # Chameleon's VQ model is frozen
 
     def encode(
@@ -811,10 +803,9 @@ def val2name(self):
 
     @cached_property
     def image_tokens(self):
-        return sorted([
-            val for name, val in self.vocab_map.items()
-            if name.startswith("IMGIMG")
-        ])
+        return sorted(
+            [val for name, val in self.vocab_map.items() if name.startswith("IMGIMG")]
+        )
 
     @cached_property
     def bpe2img(self):
@@ -822,13 +813,10 @@ def bpe2img(self):
 
         def remap(old_name: str) -> str:
             return "".join(
-                img_tkn_chr_mapping.get(c, c)
-                for c in old_name[len("IMGIMG"):-1])
+                img_tkn_chr_mapping.get(c, c) for c in old_name[len("IMGIMG") : -1]
+            )
 
-        return {
-            tok: int(remap(self.val2name[tok]))
-            for tok in self.image_tokens
-        }
+        return {tok: int(remap(self.val2name[tok])) for tok in self.image_tokens}
 
     @cached_property
     def img2bpe(self):
@@ -837,7 +825,8 @@ def img2bpe(self):
     @cached_property
     def bpe2img_search_tensors(self):
         return torch.tensor(sorted(self.bpe2img.keys())), torch.tensor(
-            sorted(self.bpe2img.values()))
+            sorted(self.bpe2img.values())
+        )
 
     @cached_property
     def img2bpe_mapping_tensor(self):
@@ -853,7 +842,6 @@ def convert_img2bpe(self, img_batch: torch.Tensor) -> torch.Tensor:
 
 
 class ChameleonModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -867,25 +855,29 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.vocab_size,
             config.hidden_size,
         )
-        self.vocabulary_mapping = ChameleonImageVocabularyMapping(
-            config.vocabulary_map)
-        decoder_layer = ChameleonDecoderLayer if not self.config.swin_norm \
+        self.vocabulary_mapping = ChameleonImageVocabularyMapping(config.vocabulary_map)
+        decoder_layer = (
+            ChameleonDecoderLayer
+            if not self.config.swin_norm
             else ChameleonSwinDecoderLayer
+        )
 
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: decoder_layer(config=config,
-                                         cache_config=cache_config,
-                                         quant_config=quant_config,
-                                         prefix=prefix),
+            lambda prefix: decoder_layer(
+                config=config,
+                cache_config=cache_config,
+                quant_config=quant_config,
+                prefix=prefix,
+            ),
             prefix=f"{prefix}.layers",
         )
 
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         self.vqmodel = ChameleonVQVAE(config.vq_config)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -926,10 +918,9 @@ def forward(
                 residual,
             )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
@@ -937,14 +928,16 @@ def forward(
 @MULTIMODAL_REGISTRY.register_processor(
     ChameleonMultiModalProcessor,
     info=ChameleonProcessingInfo,
-    dummy_inputs=ChameleonDummyInputsBuilder)
-class ChameleonForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                        SupportsPP, SupportsQuant):
+    dummy_inputs=ChameleonDummyInputsBuilder,
+)
+class ChameleonForConditionalGeneration(
+    nn.Module, SupportsMultiModal, SupportsPP, SupportsQuant
+):
     merge_by_field_config = True
 
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
-        "gate_up_proj": ["gate_proj", "up_proj"]
+        "gate_up_proj": ["gate_proj", "up_proj"],
     }
 
     @classmethod
@@ -960,8 +953,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         multimodal_config = vllm_config.model_config.multimodal_config
         self.config = config
         self.multimodal_config = multimodal_config
-        self.model = ChameleonModel(vllm_config=vllm_config,
-                                    prefix=maybe_prefix(prefix, "model"))
+        self.model = ChameleonModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.unpadded_vocab_size = config.vocab_size
         self.lm_head = ParallelLMHead(
             self.unpadded_vocab_size,
@@ -972,13 +966,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head.weight = self.model.embed_tokens.weight
 
         logit_scale = getattr(config, "logit_scale", 1.0)
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size, logit_scale)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size, logit_scale
+        )
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[ChameleonImagePixelInputs]:
+        self, **kwargs: object
+    ) -> Optional[ChameleonImagePixelInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
 
         if pixel_values is None:
@@ -987,24 +984,23 @@ def _parse_and_validate_image_input(
         vq_config: ChameleonVQVAEConfig = self.config.vq_config
         expected_h = expected_w = vq_config.resolution
 
-        return ChameleonImagePixelInputs(type="pixel_values",
-                                         data=pixel_values,
-                                         resolve_bindings={
-                                             "h": expected_h,
-                                             "w": expected_w
-                                         })
+        return ChameleonImagePixelInputs(
+            type="pixel_values",
+            data=pixel_values,
+            resolve_bindings={"h": expected_h, "w": expected_w},
+        )
 
     def get_language_model(self) -> torch.nn.Module:
         return self.model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
         assert self.model.vqmodel is not None
-        image_tokens = self.model.get_image_tokens(image_input["data"].to(
-            self.config.torch_dtype))
+        image_tokens = self.model.get_image_tokens(
+            image_input["data"].to(self.config.torch_dtype)
+        )
         vision_embeddings = self.model.get_input_embeddings(image_tokens)
         return vision_embeddings
 
@@ -1016,14 +1012,12 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.model(input_ids,
-                                   positions,
-                                   intermediate_tensors,
-                                   inputs_embeds=inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -1040,8 +1034,7 @@ def compute_logits(
 
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv_proj", ".q_proj", "q"),
@@ -1056,8 +1049,7 @@ def load_weights(self, weights: Iterable[tuple[str,
             if "rotary_emb.inv_freq" in name:
                 continue
 
-            if ("rotary_emb.cos_cached" in name
-                    or "rotary_emb.sin_cached" in name):
+            if "rotary_emb.cos_cached" in name or "rotary_emb.sin_cached" in name:
                 # Models trained using ColossalAI may include these tensors in
                 # the checkpoint. Skip them.
                 continue
@@ -1075,8 +1067,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                     # not vqvae for now.
                     use_default_weight_loading = True
             else:
-                for (param_name, weight_name,
-                     shard_id) in stacked_params_mapping:
+                for param_name, weight_name, shard_id in stacked_params_mapping:
                     if weight_name not in name:
                         continue
                     name = name.replace(weight_name, param_name)
@@ -1096,7 +1087,8 @@ def load_weights(self, weights: Iterable[tuple[str,
                     # Remapping the name of FP8 kv-scale.
                     if name.endswith("kv_scale"):
                         remapped_kv_scale_name = name.replace(
-                            ".kv_scale", ".attn.kv_scale")
+                            ".kv_scale", ".attn.kv_scale"
+                        )
                         if remapped_kv_scale_name not in params_dict:
                             logger.warning_once(
                                 "Found kv scale in the checkpoint (e.g. %s), but not found the expected name in the model (e.g. %s). kv-scale is not loaded.",  # noqa: E501
@@ -1109,15 +1101,15 @@ def load_weights(self, weights: Iterable[tuple[str,
                     if is_pp_missing_parameter(name, self):
                         continue
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             if use_default_weight_loading and name in params_dict:
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
diff --git a/vllm/model_executor/models/chatglm.py b/vllm/model_executor/models/chatglm.py
index c182201fe256..ece719df61f7 100644
--- a/vllm/model_executor/models/chatglm.py
+++ b/vllm/model_executor/models/chatglm.py
@@ -3,6 +3,7 @@
 # Adapted from
 # https://github.com/zai-org/ChatGLM2-6B
 """Inference-only ChatGLM model compatible with THUDM weights."""
+
 import json
 from collections.abc import Iterable
 from itertools import islice
@@ -18,26 +19,34 @@
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs import ChatGLMConfig
 
 from .interfaces import SupportsLoRA, SupportsPP, SupportsQuant
-from .utils import (AutoWeightsLoader, WeightsMapper, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class GLMAttention(nn.Module):
-
     def __init__(
         self,
         config: ChatGLMConfig,
@@ -52,9 +61,11 @@ def __init__(
         assert self.total_num_heads % tp_size == 0
         self.num_heads = self.total_num_heads // tp_size
         self.multi_query_attention = config.multi_query_attention
-        self.total_num_kv_heads = (config.multi_query_group_num
-                                   if config.multi_query_attention else
-                                   config.num_attention_heads)
+        self.total_num_kv_heads = (
+            config.multi_query_group_num
+            if config.multi_query_attention
+            else config.num_attention_heads
+        )
         if self.total_num_kv_heads >= tp_size:
             # Number of KV heads is greater than TP size, so we partition
             # the KV heads across multiple tensor parallel GPUs.
@@ -99,13 +110,15 @@ def __init__(
             base=10000 * rope_ratio,
             is_neox_style=is_neox_style,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -183,25 +196,27 @@ def __init__(
     ):
         super().__init__()
         self.apply_residual_connection_post_layernorm = (
-            config.apply_residual_connection_post_layernorm)
+            config.apply_residual_connection_post_layernorm
+        )
 
         self.fp32_residual_connection = config.fp32_residual_connection
 
         layer_norm_func = RMSNorm if config.rmsnorm else LayerNorm
         # Layernorm on the input data.
-        self.input_layernorm = layer_norm_func(config.hidden_size,
-                                               eps=config.layernorm_epsilon)
+        self.input_layernorm = layer_norm_func(
+            config.hidden_size, eps=config.layernorm_epsilon
+        )
 
         # Self attention.
-        self.self_attention = GLMAttention(config,
-                                           cache_config,
-                                           quant_config,
-                                           prefix=f"{prefix}.self_attention")
+        self.self_attention = GLMAttention(
+            config, cache_config, quant_config, prefix=f"{prefix}.self_attention"
+        )
         self.hidden_dropout = config.hidden_dropout
 
         # Layernorm on the attention output
         self.post_attention_layernorm = layer_norm_func(
-            config.hidden_size, eps=config.layernorm_epsilon)
+            config.hidden_size, eps=config.layernorm_epsilon
+        )
 
         # MLP
         self.mlp = GLMMLP(config, quant_config, prefix=f"{prefix}.mlp")
@@ -261,8 +276,7 @@ def __init__(
         # Transformer layers.
         self.start_layer, self.end_layer, self.layers = make_layers(
             self.num_layers,
-            lambda prefix: GLMBlock(
-                config, cache_config, quant_config, prefix=prefix),
+            lambda prefix: GLMBlock(config, cache_config, quant_config, prefix=prefix),
             prefix=f"{prefix}.layers",
         )
 
@@ -270,11 +284,12 @@ def __init__(
             layer_norm_func = RMSNorm if config.rmsnorm else LayerNorm
             # Final layer norm before output.
             self.final_layernorm = layer_norm_func(
-                config.hidden_size, eps=config.layernorm_epsilon)
+                config.hidden_size, eps=config.layernorm_epsilon
+            )
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.hidden_size
+        )
 
     def forward(
         self,
@@ -282,8 +297,9 @@ def forward(
         position_ids: torch.Tensor,
     ) -> Union[torch.Tensor, IntermediateTensors]:
         for layer in islice(self.layers, self.start_layer, self.end_layer):
-            hidden_states = layer(hidden_states=hidden_states,
-                                  position_ids=position_ids)
+            hidden_states = layer(
+                hidden_states=hidden_states, position_ids=position_ids
+            )
 
         if not get_pp_group().is_last_rank:
             return IntermediateTensors({"hidden_states": hidden_states})
@@ -298,8 +314,10 @@ def forward(
 @support_torch_compile
 class ChatGLMModel(nn.Module, SupportsQuant):
     packed_modules_mapping = {
-        "linear_proj.merged_proj":
-        ["linear_proj.gate_proj", "linear_proj.dense_h_to_4h"]
+        "linear_proj.merged_proj": [
+            "linear_proj.gate_proj",
+            "linear_proj.dense_h_to_4h",
+        ]
     }
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
@@ -311,26 +329,30 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.config = config
 
-        self.embedding = VocabParallelEmbedding(config.padded_vocab_size,
-                                                config.hidden_size,
-                                                quant_config=quant_config,
-                                                prefix=f"{prefix}.embedding")
+        self.embedding = VocabParallelEmbedding(
+            config.padded_vocab_size,
+            config.hidden_size,
+            quant_config=quant_config,
+            prefix=f"{prefix}.embedding",
+        )
 
         self.num_layers = config.num_layers
         self.multi_query_group_num = config.multi_query_group_num
         self.kv_channels = config.kv_channels
-        self.encoder = GLMTransformer(config,
-                                      cache_config,
-                                      quant_config,
-                                      prefix=f"{prefix}.encoder")
+        self.encoder = GLMTransformer(
+            config, cache_config, quant_config, prefix=f"{prefix}.encoder"
+        )
 
-        self.output_layer = ParallelLMHead(config.padded_vocab_size,
-                                           config.hidden_size,
-                                           quant_config=quant_config,
-                                           prefix=f"{prefix}.output_layer")
+        self.output_layer = ParallelLMHead(
+            config.padded_vocab_size,
+            config.hidden_size,
+            quant_config=quant_config,
+            prefix=f"{prefix}.output_layer",
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.encoder.make_empty_intermediate_tensors)
+            self.encoder.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embedding(input_ids)
@@ -360,8 +382,7 @@ def forward(
 
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("linear_proj.merged_proj", "linear_proj.gate_proj", 0),
@@ -371,7 +392,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         loaded_params: set[str] = set()
 
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -392,8 +413,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -401,7 +421,8 @@ def load_weights(self, weights: Iterable[tuple[str,
 
 class ChatGLMBaseModel(nn.Module):
     hf_to_vllm_mapper = WeightsMapper(
-        orig_to_new_substr={".word_embeddings": ""}, )
+        orig_to_new_substr={".word_embeddings": ""},
+    )
 
     def __init__(
         self,
@@ -420,18 +441,17 @@ def __init__(
         self.multimodal_config = multimodal_config
 
         self.quant_config = quant_config
-        self.max_position_embeddings = getattr(config, "max_sequence_length",
-                                               8192)
-        self.transformer = transformer_type(vllm_config=vllm_config,
-                                            prefix=maybe_prefix(
-                                                prefix, "transformer"))
+        self.max_position_embeddings = getattr(config, "max_sequence_length", 8192)
+        self.transformer = transformer_type(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "transformer")
+        )
         if self.config.tie_word_embeddings:
-            self.transformer.output_layer.weight = (
-                self.transformer.embedding.weight)
+            self.transformer.output_layer.weight = self.transformer.embedding.weight
         self.lm_head = self.transformer.output_layer
         self.logits_processor = LogitsProcessor(config.padded_vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.transformer.make_empty_intermediate_tensors)
+            self.transformer.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.transformer.get_input_embeddings(input_ids)
@@ -448,11 +468,10 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
 
-class ChatGLMForCausalLM(ChatGLMBaseModel, SupportsLoRA, SupportsPP,
-                         SupportsQuant):
+class ChatGLMForCausalLM(ChatGLMBaseModel, SupportsLoRA, SupportsPP, SupportsQuant):
     packed_modules_mapping = {
         "query_key_value": ["query_key_value"],
-        "dense_h_to_4h": ["dense_h_to_4h"]
+        "dense_h_to_4h": ["dense_h_to_4h"],
     }
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
@@ -463,7 +482,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 "The configuration of this model indicates that it supports "
                 "vision inputs, but you instantiated the text-only version "
                 "of this model. Please use the vision model by setting "
-                f"`--hf-overrides '{json.dumps(hf_overrides)}'`")
+                f"`--hf-overrides '{json.dumps(hf_overrides)}'`"
+            )
 
         super().__init__(vllm_config=vllm_config, prefix=prefix)
 
@@ -474,6 +494,7 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.transformer(input_ids, positions,
-                                         intermediate_tensors, inputs_embeds)
+        hidden_states = self.transformer(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
diff --git a/vllm/model_executor/models/clip.py b/vllm/model_executor/models/clip.py
index 7ec366a2e4aa..f05d5c4cc1d8 100644
--- a/vllm/model_executor/models/clip.py
+++ b/vllm/model_executor/models/clip.py
@@ -6,8 +6,13 @@
 
 import torch
 import torch.nn as nn
-from transformers import (BatchFeature, CLIPConfig, CLIPProcessor,
-                          CLIPTextConfig, CLIPVisionConfig)
+from transformers import (
+    BatchFeature,
+    CLIPConfig,
+    CLIPProcessor,
+    CLIPTextConfig,
+    CLIPVisionConfig,
+)
 
 from vllm.attention import Attention
 from vllm.attention.layer import MultiHeadAttention
@@ -15,24 +20,32 @@
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import divide, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.pooler import DispatchPooler, Pooler
 from vllm.model_executor.layers.quantization import QuantizationConfig
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.interfaces import SupportsQuant
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalInputs, MultiModalKwargsItems,
-                                    MultiModalUUIDDict)
-from vllm.multimodal.parse import (ImageProcessorItems, ImageSize,
-                                   MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptIndexTargets,
-                                        PromptReplacement, PromptUpdate)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalInputs,
+    MultiModalKwargsItems,
+    MultiModalUUIDDict,
+)
+from vllm.multimodal.parse import ImageProcessorItems, ImageSize, MultiModalDataItems
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptIndexTargets,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
@@ -40,10 +53,13 @@
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal
 from .interfaces_base import default_pooling_type
 from .utils import AutoWeightsLoader, maybe_prefix
-from .vision import (VisionEncoderInfo, VisionFeatureSelectStrategy,
-                     VisionFeatureSelectStrategyStr,
-                     get_num_selected_vision_tokens,
-                     resolve_visual_encoder_outputs)
+from .vision import (
+    VisionEncoderInfo,
+    VisionFeatureSelectStrategy,
+    VisionFeatureSelectStrategyStr,
+    get_num_selected_vision_tokens,
+    resolve_visual_encoder_outputs,
+)
 
 
 class CLIPImagePixelInputs(TensorSchema):
@@ -54,19 +70,19 @@ class CLIPImagePixelInputs(TensorSchema):
         - h: Height of each image
         - w: Width of each image
     """
+
     type: Literal["pixel_values"]
     data: Annotated[torch.Tensor, TensorShape("bn", 3, "h", "w")]
 
 
 class CLIPEncoderInfo(VisionEncoderInfo[CLIPVisionConfig]):
-
     def get_num_image_tokens(
         self,
         *,
         image_width: int,
         image_height: int,
     ) -> int:
-        return self.get_patch_grid_length()**2 + 1
+        return self.get_patch_grid_length() ** 2 + 1
 
     def get_image_size(self) -> int:
         return self.vision_config.image_size
@@ -93,12 +109,13 @@ def _get_vision_feature_select_strategy(pooling_type: str):
     try:
         return _POOLING_TYPE_TO_STRATEGY[pooling_type]
     except KeyError:
-        raise ValueError(f"No feature selection strategy is defined for "
-                         f"pooling_type: {pooling_type!r}") from None
+        raise ValueError(
+            f"No feature selection strategy is defined for "
+            f"pooling_type: {pooling_type!r}"
+        ) from None
 
 
 class CLIPProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(CLIPConfig)
 
@@ -145,7 +162,6 @@ def get_max_image_tokens(self) -> int:
 
 
 class CLIPDummyInputsBuilder(BaseDummyInputsBuilder[CLIPProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         return ""
 
@@ -157,22 +173,21 @@ def get_dummy_mm_data(
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class CLIPMultiModalProcessor(BaseMultiModalProcessor[CLIPProcessingInfo]):
-
     @cached_property
     def image_token_id(self) -> int:
         tokenizer = self.info.get_tokenizer()
@@ -195,7 +210,8 @@ def apply(
             raise ValueError(
                 "CLIP accepts text-only or image-only inputs, not both! "
                 "Image-only inputs means passing an image with an empty text "
-                "prompt.")
+                "prompt."
+            )
 
         if mm_data:
             # For multi-modal data, the prompt after processing should
@@ -258,16 +274,15 @@ def get_replacement(item_idx: int):
 
 # Adapted from: https://github.com/huggingface/transformers/blob/v4.56.2/src/transformers/models/clip/modeling_clip.py
 class CLIPTextEmbeddings(nn.Module):
-
     def __init__(self, config: CLIPTextConfig):
         super().__init__()
 
         embed_dim = config.hidden_size
 
-        self.token_embedding = VocabParallelEmbedding(config.vocab_size,
-                                                      embed_dim)
+        self.token_embedding = VocabParallelEmbedding(config.vocab_size, embed_dim)
         self.position_embedding = VocabParallelEmbedding(
-            config.max_position_embeddings, embed_dim)
+            config.max_position_embeddings, embed_dim
+        )
 
     def forward(
         self,
@@ -278,7 +293,8 @@ def forward(
         if inputs_embeds is None:
             if input_ids is None:
                 raise ValueError(
-                    "Either `input_ids` or `input_embeds` must be provided")
+                    "Either `input_ids` or `input_embeds` must be provided"
+                )
 
             inputs_embeds = self.token_embedding(input_ids)
 
@@ -289,7 +305,6 @@ def forward(
 
 
 class CLIPVisionEmbeddings(nn.Module):
-
     def __init__(self, config: CLIPVisionConfig):
         super().__init__()
         self.config = config
@@ -308,19 +323,21 @@ def __init__(self, config: CLIPVisionConfig):
             bias=False,
         )
 
-        self.num_patches = (self.image_size // self.patch_size)**2
+        self.num_patches = (self.image_size // self.patch_size) ** 2
         self.num_positions = self.num_patches + 1
-        self.position_embedding = nn.Embedding(self.num_positions,
-                                               self.embed_dim)
-        self.register_buffer("position_ids",
-                             torch.arange(self.num_positions).expand((1, -1)),
-                             persistent=False)
+        self.position_embedding = nn.Embedding(self.num_positions, self.embed_dim)
+        self.register_buffer(
+            "position_ids",
+            torch.arange(self.num_positions).expand((1, -1)),
+            persistent=False,
+        )
 
     def forward(self, pixel_values: torch.Tensor) -> torch.Tensor:
         batch_size = pixel_values.shape[0]
         target_dtype = self.patch_embedding.weight.dtype
-        patch_embeds = self.patch_embedding(pixel_values.to(
-            dtype=target_dtype))  # shape = [*, width, grid, grid]
+        patch_embeds = self.patch_embedding(
+            pixel_values.to(dtype=target_dtype)
+        )  # shape = [*, width, grid, grid]
         patch_embeds = patch_embeds.flatten(2).transpose(1, 2)
 
         class_embeds = self.class_embedding.expand(batch_size, 1, -1)
@@ -331,7 +348,6 @@ def forward(self, pixel_values: torch.Tensor) -> torch.Tensor:
 
 
 class CLIPAttention(nn.Module):
-
     def __init__(
         self,
         config: Union[CLIPTextConfig, CLIPVisionConfig],
@@ -350,7 +366,8 @@ def __init__(
             raise ValueError(
                 "embed_dim must be divisible by num_heads "
                 f"(got `embed_dim`: {self.embed_dim} and `num_heads`:"
-                f" {self.num_heads}).")
+                f" {self.num_heads})."
+            )
         self.scale = self.head_dim**-0.5
 
         self.qkv_proj = QKVParallelLinear(
@@ -393,7 +410,6 @@ def forward(
 
 
 class CLIPMLP(nn.Module):
-
     def __init__(
         self,
         config: Union[CLIPTextConfig, CLIPVisionConfig],
@@ -403,16 +419,20 @@ def __init__(
         super().__init__()
         self.config = config
         self.activation_fn = get_act_fn(config.hidden_act)
-        self.fc1 = ColumnParallelLinear(config.hidden_size,
-                                        config.intermediate_size,
-                                        bias=True,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.fc1")
-        self.fc2 = RowParallelLinear(config.intermediate_size,
-                                     config.hidden_size,
-                                     bias=True,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.fc2")
+        self.fc1 = ColumnParallelLinear(
+            config.hidden_size,
+            config.intermediate_size,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc1",
+        )
+        self.fc2 = RowParallelLinear(
+            config.intermediate_size,
+            config.hidden_size,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc2",
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         hidden_states, _ = self.fc1(hidden_states)
@@ -423,7 +443,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class CLIPEncoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Union[CLIPTextConfig, CLIPVisionConfig],
@@ -439,16 +458,11 @@ def __init__(
             prefix=f"{prefix}.self_attn",
             attn_cls=attn_cls,
         )
-        self.layer_norm1 = nn.LayerNorm(config.hidden_size,
-                                        eps=config.layer_norm_eps)
-        self.mlp = CLIPMLP(config,
-                           quant_config=quant_config,
-                           prefix=f"{prefix}.mlp")
-        self.layer_norm2 = nn.LayerNorm(config.hidden_size,
-                                        eps=config.layer_norm_eps)
+        self.layer_norm1 = nn.LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
+        self.mlp = CLIPMLP(config, quant_config=quant_config, prefix=f"{prefix}.mlp")
+        self.layer_norm2 = nn.LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
-
         residual = hidden_states
 
         hidden_states = self.layer_norm1(hidden_states)
@@ -489,13 +503,17 @@ def __init__(
             num_hidden_layers = config.num_hidden_layers
         else:
             num_hidden_layers = num_hidden_layers_override
-        self.layers = nn.ModuleList([
-            CLIPEncoderLayer(config=config,
-                             quant_config=quant_config,
-                             prefix=f"{prefix}.layers.{layer_idx}",
-                             attn_cls=attn_cls)
-            for layer_idx in range(num_hidden_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                CLIPEncoderLayer(
+                    config=config,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.layers.{layer_idx}",
+                    attn_cls=attn_cls,
+                )
+                for layer_idx in range(num_hidden_layers)
+            ]
+        )
 
     def forward(
         self,
@@ -517,7 +535,6 @@ def forward(
 
 
 class CLIPTextTransformer(nn.Module):
-
     def __init__(
         self,
         config: CLIPTextConfig,
@@ -567,8 +584,7 @@ def forward(
 
         return last_hidden_state
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -579,7 +595,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         loaded_params: set[str] = set()
 
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -590,15 +606,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class CLIPVisionTransformer(nn.Module):
-
     def __init__(
         self,
         config: CLIPVisionConfig,
@@ -639,8 +653,7 @@ def __init__(
             require_post_norm = len(self.encoder.layers) == num_hidden_layers
 
         if require_post_norm:
-            self.post_layernorm = nn.LayerNorm(embed_dim,
-                                               eps=config.layer_norm_eps)
+            self.post_layernorm = nn.LayerNorm(embed_dim, eps=config.layer_norm_eps)
         else:
             self.post_layernorm = None
 
@@ -659,7 +672,6 @@ def forward(
         select_layers: Optional[list[int]] = None,
         feature_select_strategy: Optional[VisionFeatureSelectStrategy] = None,
     ) -> torch.Tensor:
-
         hidden_states = self.embeddings(pixel_values)
         hidden_states = self.pre_layrnorm(hidden_states)
 
@@ -681,8 +693,7 @@ def forward(
 
         return encoder_outputs
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -695,8 +706,7 @@ def load_weights(self, weights: Iterable[tuple[str,
 
         for name, loaded_weight in weights:
             # post_layernorm is not needed in CLIPVisionModel
-            if (name.startswith("post_layernorm")
-                    and self.post_layernorm is None):
+            if name.startswith("post_layernorm") and self.post_layernorm is None:
                 continue
 
             # omit layers when num_hidden_layers_override is set
@@ -705,7 +715,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if layer_idx >= layer_count:
                     continue
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -716,15 +726,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class CLIPVisionModel(nn.Module):
-
     def __init__(
         self,
         config: CLIPVisionConfig,
@@ -767,11 +775,12 @@ def device(self):
 
 # Assume EOS token corresponds to LAST token in text model
 @default_pooling_type("LAST")
-@MULTIMODAL_REGISTRY.register_processor(CLIPMultiModalProcessor,
-                                        info=CLIPProcessingInfo,
-                                        dummy_inputs=CLIPDummyInputsBuilder)
+@MULTIMODAL_REGISTRY.register_processor(
+    CLIPMultiModalProcessor,
+    info=CLIPProcessingInfo,
+    dummy_inputs=CLIPDummyInputsBuilder,
+)
 class CLIPEmbeddingModel(nn.Module, SupportsMultiModal, SupportsQuant):
-
     is_pooling_model = True
 
     packed_modules_mapping = {"qkv_proj": ["q_proj", "k_proj", "v_proj"]}
@@ -826,10 +835,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         assert pooler_config is not None
         self.pooler_config = pooler_config
 
-        self.pooler = DispatchPooler({
-            "encode": Pooler.for_encode(pooler_config),
-            "embed": Pooler.for_embed(pooler_config),
-        })
+        self.pooler = DispatchPooler(
+            {
+                "encode": Pooler.for_encode(pooler_config),
+                "embed": Pooler.for_embed(pooler_config),
+            }
+        )
 
         # Assumes that self.forward is called after self.get_input_embeddings
         self._is_text_input = True
@@ -857,7 +868,8 @@ def get_image_features(
     ) -> torch.Tensor:
         if feature_select_strategy is None:
             feature_select_strategy = _get_vision_feature_select_strategy(
-                self.pooler_config.pooling_type)
+                self.pooler_config.pooling_type
+            )
 
         pooled_output = self.vision_model(
             pixel_values=pixel_values,
@@ -870,21 +882,20 @@ def get_image_features(
         return image_features
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[CLIPImagePixelInputs]:
+        self, **kwargs: object
+    ) -> Optional[CLIPImagePixelInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         if pixel_values is None:
             return None
 
         expected_h = expected_w = self.config.vision_config.image_size
-        return CLIPImagePixelInputs(type="pixel_values",
-                                    data=pixel_values,
-                                    resolve_bindings={
-                                        "h": expected_h,
-                                        "w": expected_w
-                                    })
-
-    def _process_image_inputs(self,
-                              inputs: CLIPImagePixelInputs) -> torch.Tensor:
+        return CLIPImagePixelInputs(
+            type="pixel_values",
+            data=pixel_values,
+            resolve_bindings={"h": expected_h, "w": expected_w},
+        )
+
+    def _process_image_inputs(self, inputs: CLIPImagePixelInputs) -> torch.Tensor:
         pixel_values = inputs["data"]
 
         return self.get_image_features(pixel_values)
@@ -900,8 +911,9 @@ def get_input_embeddings(
         is_multimodal: Optional[torch.Tensor] = None,
         handle_oov_mm_token: bool = False,
     ) -> torch.Tensor:
-        self._is_text_input = (multimodal_embeddings is None
-                               or len(multimodal_embeddings) == 0)
+        self._is_text_input = (
+            multimodal_embeddings is None or len(multimodal_embeddings) == 0
+        )
 
         # This is to satisfy the type checker for each overload
         if multimodal_embeddings is None or is_multimodal is None:
@@ -914,8 +926,7 @@ def get_input_embeddings(
             handle_oov_mm_token=handle_oov_mm_token,
         )
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -939,9 +950,9 @@ def forward(
             return inputs_embeds
 
         # Text inputs
-        return self.get_text_features(input_ids=input_ids,
-                                      position_ids=positions,
-                                      inputs_embeds=inputs_embeds)
+        return self.get_text_features(
+            input_ids=input_ids, position_ids=positions, inputs_embeds=inputs_embeds
+        )
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         loader = AutoWeightsLoader(
diff --git a/vllm/model_executor/models/cohere2_vision.py b/vllm/model_executor/models/cohere2_vision.py
index 70f2a3fd339a..73aafbd01144 100644
--- a/vllm/model_executor/models/cohere2_vision.py
+++ b/vllm/model_executor/models/cohere2_vision.py
@@ -11,34 +11,44 @@
 from transformers import BatchFeature, PretrainedConfig
 from transformers.models.cohere2_vision import Cohere2VisionConfig
 from transformers.models.cohere2_vision.image_processing_cohere2_vision_fast import (  # noqa: E501
-    get_optimal_tiled_canvas)
+    get_optimal_tiled_canvas,
+)
 from transformers.models.cohere2_vision.processing_cohere2_vision import (
-    Cohere2VisionProcessor)
+    Cohere2VisionProcessor,
+)
 
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import MulAndSilu
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.awq import AWQConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import MultiModalDataDict, MultiModalKwargsItems
-from vllm.multimodal.parse import (ImageProcessorItems, ImageSize,
-                                   MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo,
-                                        MultiModalFieldConfig,
-                                        PromptReplacement, PromptUpdate,
-                                        PromptUpdateDetails)
+from vllm.multimodal.parse import ImageProcessorItems, ImageSize, MultiModalDataItems
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    MultiModalFieldConfig,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
 from .siglip import SiglipVisionModel
-from .utils import (AutoWeightsLoader, WeightsMapper,
-                    init_vllm_registered_model, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 
 
 class Cohere2VisionImagePixelInputs(TensorSchema):
@@ -67,7 +77,7 @@ class Cohere2VisionImagePixelInputs(TensorSchema):
 
 class Cohere2VisionMultiModalProjector(nn.Module):
     """Multimodal projector that maps vision features to text embedding space.
-    
+
     Uses pixel shuffle downsampling followed by SwiGLU activation.
     """
 
@@ -76,8 +86,7 @@ def __init__(self, config: Cohere2VisionConfig, prefix: str = ""):
         self.downsample_factor = config.downsample_factor
 
         # Input dimension after pixel shuffle downsampling
-        input_dim = config.vision_config.hidden_size * (
-            config.downsample_factor**2)
+        input_dim = config.vision_config.hidden_size * (config.downsample_factor**2)
         # MergedColumnParallelLinear expects the intermediate size to be a list
         # of sizes, so that it will load the weights as two separate linear
         # layers before applying any parallelism.
@@ -110,28 +119,26 @@ def forward(self, image_features):
 
     def pixel_shuffle(self, image_features: torch.Tensor) -> torch.Tensor:
         """Apply pixel shuffle downsampling to reduce spatial dimensions.
-        
+
         Args:
             image_features: Input tensor of shape [B, S, D] where S = H*W
-            
+
         Returns:
             Downsampled tensor with increased channel dimension
         """
-        height = width = int(image_features.shape[1]**0.5)
+        height = width = int(image_features.shape[1] ** 0.5)
         x = image_features.reshape(image_features.shape[0], width, height, -1)
         n, h, w, c = x.size()
-        scale_factor = 1. / self.downsample_factor
+        scale_factor = 1.0 / self.downsample_factor
         nh = int(h * scale_factor)
         nw = int(w * scale_factor)
-        x = x.reshape(n, nh, self.downsample_factor, nw,
-                      self.downsample_factor, c)
+        x = x.reshape(n, nh, self.downsample_factor, nw, self.downsample_factor, c)
         x = x.permute(0, 1, 3, 2, 4, 5).contiguous()
         x = x.reshape(n, nh, nw, -1)
         return x
 
 
 class Cohere2VisionProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self) -> Cohere2VisionConfig:
         return self.ctx.get_hf_config(Cohere2VisionConfig)
 
@@ -146,8 +153,8 @@ def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
 
     def get_image_size_with_most_features(self) -> ImageSize:
         image_processor = self.get_image_processor()
-        height = image_processor.size['height']
-        width = image_processor.size['width']
+        height = image_processor.size["height"]
+        width = image_processor.size["width"]
         max_patches = image_processor.max_patches
         return ImageSize(height=height * max_patches, width=width)
 
@@ -196,8 +203,8 @@ def get_num_patches(
 
 
 class Cohere2VisionDummyInputsBuilder(
-        BaseDummyInputsBuilder[Cohere2VisionProcessingInfo]):
-
+    BaseDummyInputsBuilder[Cohere2VisionProcessingInfo]
+):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -213,23 +220,23 @@ def get_dummy_mm_data(
         mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
-        image_size = \
-            self.info.get_image_size_with_most_features()
+        image_size = self.info.get_image_size_with_most_features()
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=image_size.width,
-                                   height=image_size.height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=image_size.width,
+                height=image_size.height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class Cohere2VisionMultiModalProcessor(
-        BaseMultiModalProcessor[Cohere2VisionProcessingInfo]):
-
+    BaseMultiModalProcessor[Cohere2VisionProcessingInfo]
+):
     def _call_hf_processor(
         self,
         prompt: str,
@@ -245,22 +252,26 @@ def _call_hf_processor(
         )
 
         # Ensure num_patches is available for proper tensor splitting
-        if "num_patches" not in processed_outputs and (
-                images := mm_data.get("images")) is not None:
+        if (
+            "num_patches" not in processed_outputs
+            and (images := mm_data.get("images")) is not None
+        ):
             hf_processor = self.info.get_hf_processor(**mm_kwargs)
 
             # Fallback calculation if HF processor didn't provide num_patches
-            parsed_images = self._get_data_parser().parse_mm_data({
-                "image":
-                images
-            }).get_items("image", ImageProcessorItems)
+            parsed_images = (
+                self._get_data_parser()
+                .parse_mm_data({"image": images})
+                .get_items("image", ImageProcessorItems)
+            )
 
             num_patches = [
                 self.info.get_num_patches(
                     image_width=parsed_images.get_image_size(i).width,
                     image_height=parsed_images.get_image_size(i).height,
                     processor=hf_processor,
-                ) for i in range(len(parsed_images))
+                )
+                for i in range(len(parsed_images))
             ]
             processed_outputs["num_patches"] = torch.tensor(num_patches)
 
@@ -273,8 +284,7 @@ def _get_mm_fields_config(
     ) -> Mapping[str, MultiModalFieldConfig]:
         num_patches = hf_inputs.get("num_patches", torch.empty(0))
         return dict(
-            pixel_values=MultiModalFieldConfig.flat_from_sizes(
-                "image", num_patches),
+            pixel_values=MultiModalFieldConfig.flat_from_sizes("image", num_patches),
             num_patches=MultiModalFieldConfig.batched("image"),
             image_embeds=MultiModalFieldConfig.batched("image"),
         )
@@ -301,8 +311,7 @@ def get_replacement(item_idx: int):
                 image_height=image_size.height,
                 processor=hf_processor,
             )
-            patch_tokens = (image_token * img_tokens_per_tile +
-                            img_line_break_token)
+            patch_tokens = image_token * img_tokens_per_tile + img_line_break_token
             repl = f"{boi_token}{patch_tokens * num_patches}{eoi_token}"
 
             return PromptUpdateDetails.select_text(repl, image_token)
@@ -319,9 +328,9 @@ def get_replacement(item_idx: int):
 @MULTIMODAL_REGISTRY.register_processor(
     Cohere2VisionMultiModalProcessor,
     info=Cohere2VisionProcessingInfo,
-    dummy_inputs=Cohere2VisionDummyInputsBuilder)
-class Cohere2VisionForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                            SupportsPP):
+    dummy_inputs=Cohere2VisionDummyInputsBuilder,
+)
+class Cohere2VisionForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP):
     merge_by_field_config = True
 
     hf_to_vllm_mapper = WeightsMapper(
@@ -330,7 +339,8 @@ class Cohere2VisionForConditionalGeneration(nn.Module, SupportsMultiModal,
             "model.multi_modal_projector.": "multi_modal_projector.",
             "model.language_model.": "language_model.model.",
             "lm_head.": "language_model.lm_head.",
-        })
+        }
+    )
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
@@ -342,37 +352,39 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.multimodal_config = multimodal_config
         self._patch_quant_config(config, quant_config)
 
-        self.vision_tower = SiglipVisionModel(config.vision_config,
-                                              quant_config,
-                                              prefix=maybe_prefix(
-                                                  prefix, "vision_tower"))
+        self.vision_tower = SiglipVisionModel(
+            config.vision_config,
+            quant_config,
+            prefix=maybe_prefix(prefix, "vision_tower"),
+        )
         self.vocab_size = config.text_config.vocab_size
-        self.multi_modal_projector = \
-            Cohere2VisionMultiModalProjector(
-                config, prefix=maybe_prefix(prefix, "multi_modal_projector"))
+        self.multi_modal_projector = Cohere2VisionMultiModalProjector(
+            config, prefix=maybe_prefix(prefix, "multi_modal_projector")
+        )
         self.language_model = init_vllm_registered_model(
             vllm_config=vllm_config,
             hf_config=config.text_config,
             prefix=maybe_prefix(prefix, "language_model"),
-            architectures=config.text_config.architectures)
+            architectures=config.text_config.architectures,
+        )
 
     @property
     def dtype(self):
         return next(self.parameters()).dtype
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
-    def _process_image_input(self, image_input: Cohere2VisionImagePixelInputs,
-                             **kwargs) -> list[torch.Tensor]:
+    def _process_image_input(
+        self, image_input: Cohere2VisionImagePixelInputs, **kwargs
+    ) -> list[torch.Tensor]:
         """Process image pixels through vision tower and projector.
-        
+
         Args:
-            image_input: Validated image input containing pixel values and 
+            image_input: Validated image input containing pixel values and
                          patch counts
-            
+
         Returns:
             List of flattened image embeddings, one per image
         """
@@ -388,17 +400,15 @@ def _process_image_input(self, image_input: Cohere2VisionImagePixelInputs,
         image_embeds = self.multi_modal_projector(image_features)
 
         # Split and flatten embeddings per image
-        return [
-            e.flatten(0, 2) for e in image_embeds.split(num_patches.tolist())
-        ]
+        return [e.flatten(0, 2) for e in image_embeds.split(num_patches.tolist())]
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[Cohere2VisionImagePixelInputs]:
+        self, **kwargs: object
+    ) -> Optional[Cohere2VisionImagePixelInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         num_patches = kwargs.pop("num_patches", None)
         image_embeds = kwargs.pop("image_embeds", None)
-        assert image_embeds is None, \
-            "Cohere2Vision does not support image_embeds."
+        assert image_embeds is None, "Cohere2Vision does not support image_embeds."
 
         if pixel_values is None:
             return None
@@ -410,25 +420,26 @@ def _parse_and_validate_image_input(
             resolve_bindings={
                 "h": self.config.vision_config.image_size,
                 "w": self.config.vision_config.image_size,
-            })
+            },
+        )
 
-    def _patch_quant_config(self, config: PretrainedConfig,
-                            quant_config: QuantizationConfig):
+    def _patch_quant_config(
+        self, config: PretrainedConfig, quant_config: QuantizationConfig
+    ):
         # the awq models from OpenGVLab missing `modules_to_not_convert`
         # patch the quant_config to add `modules_to_not_convert` back
         if isinstance(quant_config, AWQConfig):
             text_config = config.text_config
-            llm_quant_config = getattr(text_config, "quantization_config",
-                                       None)
-            if (not quant_config.modules_to_not_convert) and (llm_quant_config
-                                                              is not None):
+            llm_quant_config = getattr(text_config, "quantization_config", None)
+            if (not quant_config.modules_to_not_convert) and (
+                llm_quant_config is not None
+            ):
                 quant_config.modules_to_not_convert.append("vision_tower")
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
diff --git a/vllm/model_executor/models/commandr.py b/vllm/model_executor/models/commandr.py
index f3929ef3b593..e38c3c0492fb 100644
--- a/vllm/model_executor/models/commandr.py
+++ b/vllm/model_executor/models/commandr.py
@@ -22,6 +22,7 @@
 
 # This file is based on the LLama model definition file in transformers
 """PyTorch Cohere model."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -35,26 +36,33 @@
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name,
-    row_parallel_weight_loader)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+    row_parallel_weight_loader,
+)
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.platforms import current_platform
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP, SupportsQuant
-from .utils import (AutoWeightsLoader, extract_layer_index,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 @torch.compile(backend=current_platform.simple_compile_backend)
@@ -63,30 +71,27 @@ def layer_norm_func(hidden_states, weight, variance_epsilon):
     hidden_states = hidden_states.to(torch.float32)
     mean = hidden_states.mean(-1, keepdim=True)
     variance = (hidden_states - mean).pow(2).mean(-1, keepdim=True)
-    hidden_states = (hidden_states - mean) * torch.rsqrt(variance +
-                                                         variance_epsilon)
+    hidden_states = (hidden_states - mean) * torch.rsqrt(variance + variance_epsilon)
     hidden_states = weight.to(torch.float32) * hidden_states
     return hidden_states.to(input_dtype)
 
 
 class LayerNorm(nn.Module):
-
     def __init__(self, param_shape=None, eps=1e-5):
         super().__init__()
         self.weight = nn.Parameter(torch.ones(param_shape))
         self.variance_epsilon = eps
-        set_weight_attrs(self.weight,
-                         {"weight_loader": row_parallel_weight_loader})
+        set_weight_attrs(self.weight, {"weight_loader": row_parallel_weight_loader})
 
     def forward(self, hidden_states, residuals=None):
-        hidden_states = layer_norm_func(hidden_states, self.weight,
-                                        self.variance_epsilon)
+        hidden_states = layer_norm_func(
+            hidden_states, self.weight, self.variance_epsilon
+        )
         return hidden_states, residuals
 
 
 # Copied from transformers.models.llama.modeling_llama.LlamaMLP Llama->Cohere
 class CohereMLP(nn.Module):
-
     def __init__(
         self,
         config: Union[CohereConfig, Cohere2Config],
@@ -121,7 +126,6 @@ def forward(self, x):
 
 
 class CohereAttention(nn.Module):
-
     def __init__(
         self,
         config: Union[CohereConfig, Cohere2Config],
@@ -151,8 +155,8 @@ def __init__(
         self.kv_size = self.num_kv_heads * self.head_dim
         self.scaling = self.head_dim**-0.5
         self.max_position_embeddings = getattr(
-            config, "model_max_length", None) or getattr(
-                config, "max_position_embeddings", 8192)
+            config, "model_max_length", None
+        ) or getattr(config, "max_position_embeddings", 8192)
         self.rope_theta = config.rope_theta
         self.rope_scaling = getattr(config, "rope_scaling", None)
         self.use_qk_norm = getattr(config, "use_qk_norm", False)
@@ -190,21 +194,24 @@ def __init__(
             if config.layer_types[layer_idx] == "sliding_attention":
                 self.sliding_window = config.sliding_window
 
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              per_layer_sliding_window=self.sliding_window,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            per_layer_sliding_window=self.sliding_window,
+            prefix=f"{prefix}.attn",
+        )
         if self.use_qk_norm:
-            self.q_norm = LayerNorm(param_shape=(self.num_heads,
-                                                 self.head_dim),
-                                    eps=config.layer_norm_eps)
-            self.k_norm = LayerNorm(param_shape=(self.num_kv_heads,
-                                                 self.head_dim),
-                                    eps=config.layer_norm_eps)
+            self.q_norm = LayerNorm(
+                param_shape=(self.num_heads, self.head_dim), eps=config.layer_norm_eps
+            )
+            self.k_norm = LayerNorm(
+                param_shape=(self.num_kv_heads, self.head_dim),
+                eps=config.layer_norm_eps,
+            )
 
     def _apply_qk_norm(self, q, k):
         q = q.view(*q.shape[:-1], -1, self.head_dim)
@@ -232,25 +239,27 @@ def forward(
 
 
 class CohereDecoderLayer(nn.Module):
-
-    def __init__(self,
-                 config: Union[CohereConfig, Cohere2Config],
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: Union[CohereConfig, Cohere2Config],
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.hidden_size = config.hidden_size
 
-        self.self_attn = CohereAttention(config,
-                                         cache_config,
-                                         quant_config=quant_config,
-                                         prefix=f"{prefix}.self_attn")
+        self.self_attn = CohereAttention(
+            config,
+            cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.self_attn",
+        )
 
-        self.mlp = CohereMLP(config,
-                             quant_config=quant_config,
-                             prefix=f"{prefix}.mlp")
-        self.input_layernorm = LayerNorm(param_shape=(config.hidden_size),
-                                         eps=config.layer_norm_eps)
+        self.mlp = CohereMLP(config, quant_config=quant_config, prefix=f"{prefix}.mlp")
+        self.input_layernorm = LayerNorm(
+            param_shape=(config.hidden_size), eps=config.layer_norm_eps
+        )
 
     def forward(
         self,
@@ -274,7 +283,6 @@ def forward(
 
 @support_torch_compile
 class CohereModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -285,22 +293,29 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.quant_config = quant_config
 
         self.config = config
-        lora_vocab = (lora_config.lora_extra_vocab_size *
-                      (lora_config.max_loras or 1)) if lora_config else 0
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
-        self.embed_tokens = VocabParallelEmbedding(config.vocab_size,
-                                                   config.hidden_size)
+        self.embed_tokens = VocabParallelEmbedding(
+            config.vocab_size, config.hidden_size
+        )
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: CohereDecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
-        self.norm = LayerNorm(param_shape=(config.hidden_size),
-                              eps=config.layer_norm_eps)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.layers",
+        )
+        self.norm = LayerNorm(
+            param_shape=(config.hidden_size), eps=config.layer_norm_eps
+        )
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -329,15 +344,13 @@ def forward(
                 residual,
             )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -349,14 +362,15 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
@@ -386,8 +400,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -421,13 +434,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         if lora_config:
             self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
         self.quant_config = quant_config
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size,
-                                                scale=config.logit_scale)
-        self.model = CohereModel(vllm_config=vllm_config,
-                                 prefix=maybe_prefix(prefix, "model"))
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size, scale=config.logit_scale
+        )
+        self.model = CohereModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -440,26 +455,27 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
         self,
         hidden_states: torch.Tensor,
     ) -> Optional[torch.Tensor]:
-        is_not_lora = hasattr(self.model.embed_tokens, 'weight')
+        is_not_lora = hasattr(self.model.embed_tokens, "weight")
         if is_not_lora:
-            logits = self.logits_processor(self.model.embed_tokens,
-                                           hidden_states)
+            logits = self.logits_processor(self.model.embed_tokens, hidden_states)
         else:
-            logits = self.logits_processor(self.model.embed_tokens.base_layer,
-                                           hidden_states)
+            logits = self.logits_processor(
+                self.model.embed_tokens.base_layer, hidden_states
+            )
 
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
-            self, skip_prefixes=["lm_head", "rotary_emb.inv_freq"])
+            self, skip_prefixes=["lm_head", "rotary_emb.inv_freq"]
+        )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/config.py b/vllm/model_executor/models/config.py
index c49db74885c1..caf481f5aec6 100644
--- a/vllm/model_executor/models/config.py
+++ b/vllm/model_executor/models/config.py
@@ -10,21 +10,18 @@
 from vllm.v1.kv_cache_interface import FullAttentionSpec, MambaSpec
 
 if TYPE_CHECKING:
-
     from vllm.config import VllmConfig
 
 logger = init_logger(__name__)
 
 
 class VerifyAndUpdateConfig:
-
     @staticmethod
     def verify_and_update_config(vllm_config: "VllmConfig") -> None:
         raise NotImplementedError
 
 
 class Gemma3TextModelConfig:
-
     @staticmethod
     def verify_and_update_config(vllm_config: "VllmConfig") -> None:
         hf_config = vllm_config.model_config.hf_config
@@ -32,7 +29,6 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
 
 
 class GteNewModelConfig(VerifyAndUpdateConfig):
-
     @staticmethod
     def verify_and_update_config(vllm_config: "VllmConfig") -> None:
         config = vllm_config.model_config.hf_config
@@ -48,12 +44,11 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
             "rotary_dim": getattr(config, "rotary_emb_dim", head_dim),
             "max_position": config.max_position_embeddings,
             "base": config.rope_theta,
-            "rope_scaling": getattr(config, "rope_scaling", None)
+            "rope_scaling": getattr(config, "rope_scaling", None),
         }
 
 
 class JambaForSequenceClassificationConfig(VerifyAndUpdateConfig):
-
     @staticmethod
     def verify_and_update_config(vllm_config: "VllmConfig") -> None:
         pooler_config = vllm_config.model_config.pooler_config
@@ -62,7 +57,6 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
 
 
 class JinaRobertaModelConfig(VerifyAndUpdateConfig):
-
     @staticmethod
     def verify_and_update_config(vllm_config: "VllmConfig") -> None:
         config = vllm_config.model_config.hf_config
@@ -76,29 +70,27 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
                 "rotary_dim": getattr(config, "rotary_emb_dim", head_dim),
                 "max_position": config.max_position_embeddings,
                 "base": getattr(config, "rope_theta", config.rotary_emb_base),
-                "rope_scaling": getattr(config, "rope_scaling", None)
+                "rope_scaling": getattr(config, "rope_scaling", None),
             }
 
 
 class NomicBertModelConfig(VerifyAndUpdateConfig):
-
     @staticmethod
     def verify_and_update_config(vllm_config: "VllmConfig") -> None:
         config = vllm_config.model_config.hf_config
 
         assert config.__class__.__name__ == "NomicBertConfig"
         assert config.activation_function in ["swiglu", "gelu"]
-        config.position_embedding_type = getattr(config,
-                                                 "position_embedding_type",
-                                                 "rope")
+        config.position_embedding_type = getattr(
+            config, "position_embedding_type", "rope"
+        )
 
         if config.activation_function == "swiglu":
             config.hidden_act = "silu"
         else:
             config.hidden_act = config.activation_function
 
-        assert (config.mlp_fc1_bias == config.mlp_fc2_bias ==
-                config.qkv_proj_bias)
+        assert config.mlp_fc1_bias == config.mlp_fc2_bias == config.qkv_proj_bias
         config.bias = config.qkv_proj_bias
 
         assert config.rotary_emb_scale_base is None
@@ -117,7 +109,7 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
             "rotary_dim": rotary_emb_dim,
             "max_position": max_trained_positions,
             "base": getattr(config, "rope_theta", config.rotary_emb_base),
-            "rope_scaling": getattr(config, "rope_scaling", None)
+            "rope_scaling": getattr(config, "rope_scaling", None),
         }
 
         # we ignore config.rotary_scaling_factor so that for datasets shorter
@@ -125,15 +117,18 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
         # with SentenceTransformer.
         # The context extension uses vllm style rope_theta and rope_scaling.
         # See #17785 #18755
-        if (not vllm_config.model_config.hf_overrides
-                and vllm_config.model_config.original_max_model_len is None):
+        if (
+            not vllm_config.model_config.hf_overrides
+            and vllm_config.model_config.original_max_model_len is None
+        ):
             # Default
             # Reset max_model_len to max_trained_positions.
             # nomic-embed-text-v2-moe the length is set to 512
             # by sentence_bert_config.json.
             max_model_len_before = vllm_config.model_config.max_model_len
-            max_model_len = min(vllm_config.model_config.max_model_len,
-                                max_trained_positions)
+            max_model_len = min(
+                vllm_config.model_config.max_model_len, max_trained_positions
+            )
 
             vllm_config.recalculate_max_model_len(max_model_len)
             logger.warning(
@@ -141,7 +136,9 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
                 "Changing max_model_len from %s to %s. "
                 "To enable context extension, see: "
                 "https://github.com/vllm-project/vllm/tree/main/examples/offline_inference/context_extension.html",
-                max_model_len_before, vllm_config.model_config.max_model_len)
+                max_model_len_before,
+                vllm_config.model_config.max_model_len,
+            )
         else:
             # We need to re-verify max_model_len to avoid lengths
             # greater than position_embedding.
@@ -151,7 +148,8 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
             if isinstance(model_config.hf_overrides, dict):
                 # hf_overrides_kw
                 max_model_len = model_config.hf_overrides.get(
-                    "max_model_len", vllm_config.model_config.max_model_len)
+                    "max_model_len", vllm_config.model_config.max_model_len
+                )
             else:
                 # hf_overrides_fn
                 # This might be overridden by sentence_bert_config.json.
@@ -173,7 +171,6 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
 
 
 class Qwen2ForProcessRewardModelConfig(VerifyAndUpdateConfig):
-
     @staticmethod
     def verify_and_update_config(vllm_config: "VllmConfig") -> None:
         pooler_config = vllm_config.model_config.pooler_config
@@ -183,7 +180,6 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
 
 
 class Qwen2ForRewardModelConfig(VerifyAndUpdateConfig):
-
     @staticmethod
     def verify_and_update_config(vllm_config: "VllmConfig") -> None:
         pooler_config = vllm_config.model_config.pooler_config
@@ -193,27 +189,26 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
 
 
 class Qwen3ForSequenceClassificationConfig(VerifyAndUpdateConfig):
-
     @staticmethod
     def verify_and_update_config(vllm_config: "VllmConfig") -> None:
         config = vllm_config.model_config.hf_config
 
-        is_original_qwen3_reranker = getattr(config,
-                                             "is_original_qwen3_reranker",
-                                             False)
+        is_original_qwen3_reranker = getattr(
+            config, "is_original_qwen3_reranker", False
+        )
 
         if not is_original_qwen3_reranker:
             return
 
         tokens = getattr(config, "classifier_from_token", None)
-        assert tokens is not None and len(tokens) == 2, \
-            ("Try loading the original Qwen3 Reranker?, see: "
-             "https://github.com/vllm-project/vllm/tree/main/examples/offline_inference/qwen3_reranker.py")
+        assert tokens is not None and len(tokens) == 2, (
+            "Try loading the original Qwen3 Reranker?, see: "
+            "https://github.com/vllm-project/vllm/tree/main/examples/offline_inference/qwen3_reranker.py"
+        )
         vllm_config.model_config.hf_config.method = "from_2_way_softmax"
 
 
 class JinaVLForSequenceClassificationConfig(VerifyAndUpdateConfig):
-
     @staticmethod
     def verify_and_update_config(vllm_config: "VllmConfig") -> None:
         config = vllm_config.model_config.hf_config
@@ -224,7 +219,6 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
 
 
 class SnowflakeGteNewModelConfig(VerifyAndUpdateConfig):
-
     @staticmethod
     def verify_and_update_config(vllm_config: "VllmConfig") -> None:
         config = vllm_config.model_config.hf_config
@@ -240,12 +234,11 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
             "rotary_dim": getattr(config, "rotary_emb_dim", head_dim),
             "max_position": config.max_position_embeddings,
             "base": config.rope_theta,
-            "rope_scaling": getattr(config, "rope_scaling", None)
+            "rope_scaling": getattr(config, "rope_scaling", None),
         }
 
 
 class GptOssForCausalLMConfig(VerifyAndUpdateConfig):
-
     @staticmethod
     def verify_and_update_config(vllm_config: "VllmConfig") -> None:
         structured_outputs_config = vllm_config.structured_outputs_config
@@ -268,12 +261,11 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
                 cuda_graph_sizes += [i for i in range(256, 993, 16)]
                 scheduler_config.cuda_graph_sizes = cuda_graph_sizes
                 logger.info(
-                    "Overriding max cuda graph capture size to "
-                    "%d for performance.", 992)
+                    "Overriding max cuda graph capture size to %d for performance.", 992
+                )
 
 
 class MambaModelConfig(VerifyAndUpdateConfig):
-
     @classmethod
     def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
         """
@@ -305,22 +297,26 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
         ]
         if cache_config.enable_prefix_caching:
             if model_config.architecture in MAMBA2_MODELS:
-                logger.info("Warning: Prefix caching is currently enabled. "
-                            "Its support for Mamba2 layers is experimental. "
-                            "Please report any issues you may observe.")
+                logger.info(
+                    "Warning: Prefix caching is currently enabled. "
+                    "Its support for Mamba2 layers is experimental. "
+                    "Please report any issues you may observe."
+                )
             else:
-                logger.info("Hybrid or mamba-based model detected without "
-                            "support for prefix caching: disabling.")
+                logger.info(
+                    "Hybrid or mamba-based model detected without "
+                    "support for prefix caching: disabling."
+                )
                 cache_config.enable_prefix_caching = False
 
         # TODO(tdoublep): remove once cascade attention is supported
-        logger.info("Disabling cascade attention since it is not supported "
-                    "for hybrid models.")
+        logger.info(
+            "Disabling cascade attention since it is not supported for hybrid models."
+        )
         model_config.disable_cascade_attn = True
 
 
 class HybridAttentionMambaModelConfig(VerifyAndUpdateConfig):
-
     @classmethod
     def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
         """
@@ -354,7 +350,8 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
             block_size=1,
             num_kv_heads=model_config.get_num_kv_heads(parallel_config),
             head_size=model_config.get_head_size(),
-            dtype=kv_cache_dtype).page_size_bytes
+            dtype=kv_cache_dtype,
+        ).page_size_bytes
 
         model_cls, _ = ModelRegistry.resolve_model_cls(
             model_config.architecture,
@@ -385,10 +382,8 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
             # easily by changing the way we layout chunks in the
             # mamba2 kernels.
             chunk_size = model_config.get_mamba_chunk_size()
-            attn_tokens_per_mamba_state = \
-                cdiv(mamba_page_size, attn_page_size_1_token)
-            attn_block_size = chunk_size * \
-                cdiv(attn_tokens_per_mamba_state, chunk_size)
+            attn_tokens_per_mamba_state = cdiv(mamba_page_size, attn_page_size_1_token)
+            attn_block_size = chunk_size * cdiv(attn_tokens_per_mamba_state, chunk_size)
             cache_config.mamba_block_size = attn_block_size
         else:
             # Without prefix caching, select minimum valid attention block size
@@ -398,23 +393,21 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
             # block size to multiple of 16, so let's suggest a value
             # that would work (note: FA is currently not compatible
             # with mamba layers, use FlashInfer instead).
-            attn_block_size = 16 * cdiv(mamba_page_size,
-                                        16 * attn_page_size_1_token)
+            attn_block_size = 16 * cdiv(mamba_page_size, 16 * attn_page_size_1_token)
 
         # override attention block size if either (a) the
         # user has not set it or (b) the user has set it
         # too small.
-        if (cache_config.block_size is None
-                or cache_config.block_size < attn_block_size):
+        if cache_config.block_size is None or cache_config.block_size < attn_block_size:
             cache_config.block_size = attn_block_size
             logger.info(
                 "Setting attention block size to %d tokens "
                 "to ensure that attention page size is >= mamba page size.",
-                attn_block_size)
+                attn_block_size,
+            )
 
         # compute new attention page size
-        attn_page_size = \
-            cache_config.block_size * attn_page_size_1_token
+        attn_page_size = cache_config.block_size * attn_page_size_1_token
 
         assert attn_page_size >= mamba_page_size
 
@@ -423,19 +416,23 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
             return
 
         # pad mamba page size to exactly match attention
-        if (cache_config.mamba_page_size_padded is None
-                or cache_config.mamba_page_size_padded != attn_page_size):
-            cache_config.mamba_page_size_padded = (attn_page_size)
-            mamba_padding_pct = 100 * (attn_page_size -
-                                       mamba_page_size) / mamba_page_size
+        if (
+            cache_config.mamba_page_size_padded is None
+            or cache_config.mamba_page_size_padded != attn_page_size
+        ):
+            cache_config.mamba_page_size_padded = attn_page_size
+            mamba_padding_pct = (
+                100 * (attn_page_size - mamba_page_size) / mamba_page_size
+            )
             logger.info(
                 "Padding mamba page size by %.2f%% to ensure "
                 "that mamba page size and attention page size are "
-                "exactly equal.", mamba_padding_pct)
+                "exactly equal.",
+                mamba_padding_pct,
+            )
 
 
 class DeepseekV32ForCausalLM(VerifyAndUpdateConfig):
-
     @classmethod
     def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
         """
@@ -450,8 +447,9 @@ def verify_and_update_config(cls, vllm_config: "VllmConfig") -> None:
         # For DeepSeekV3.2, we use a custom fp8 format as default (i.e.
         #   "auto")
         cache_config = vllm_config.cache_config
-        if cache_config.cache_dtype == "auto" or \
-            cache_config.cache_dtype.startswith("fp8"):
+        if cache_config.cache_dtype == "auto" or cache_config.cache_dtype.startswith(
+            "fp8"
+        ):
             cache_config.cache_dtype = "fp8_ds_mla"
             logger.info("Using custom fp8 kv-cache format for DeepSeekV3.2")
         if cache_config.cache_dtype == "bfloat16":
diff --git a/vllm/model_executor/models/dbrx.py b/vllm/model_executor/models/dbrx.py
index f863b1da5505..8ec7a82a7b2a 100644
--- a/vllm/model_executor/models/dbrx.py
+++ b/vllm/model_executor/models/dbrx.py
@@ -11,25 +11,39 @@
 
 from vllm.attention import Attention
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (get_pp_group, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.model_executor.layers.fused_moe import FusedMoE
-from vllm.model_executor.layers.linear import (QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class DbrxRouter(nn.Module):
@@ -60,7 +74,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class DbrxExperts(FusedMoE):
-
     def __init__(
         self,
         config: DbrxConfig,
@@ -82,12 +95,16 @@ def __init__(
         )
         self.config = config
         self.d_model = config.d_model
-        self.intermediate_size = (self.config.ffn_config.ffn_hidden_size //
-                                  self.tp_size)
+        self.intermediate_size = self.config.ffn_config.ffn_hidden_size // self.tp_size
 
     # Define custom weight loader for dbrx model
-    def weight_loader(self, param: nn.Parameter, loaded_weight: torch.Tensor,
-                      weight_name: str, param_name: str):
+    def weight_loader(
+        self,
+        param: nn.Parameter,
+        loaded_weight: torch.Tensor,
+        weight_name: str,
+        param_name: str,
+    ):
         tp_rank = get_tensor_model_parallel_rank()
         param_data = param.data
         shard_size = self.intermediate_size
@@ -111,8 +128,9 @@ def weight_loader(self, param: nn.Parameter, loaded_weight: torch.Tensor,
                     loaded_weight,
                     [-1, self.intermediate_size * self.tp_size, self.d_model],
                 )
-                param_data[:, shard_size:2 *
-                           shard_size, :] = loaded_weight[:, shard, :]
+                param_data[:, shard_size : 2 * shard_size, :] = loaded_weight[
+                    :, shard, :
+                ]
             elif param_name.endswith("weight_scale"):
                 param_data[:, 1] = loaded_weight
             else:
@@ -151,10 +169,12 @@ def __init__(
 
         self.router = DbrxRouter(config, self.params_dtype)
 
-        self.experts = DbrxExperts(config=config,
-                                   quant_config=quant_config,
-                                   params_dtype=self.params_dtype,
-                                   prefix=f"{prefix}.experts")
+        self.experts = DbrxExperts(
+            config=config,
+            quant_config=quant_config,
+            params_dtype=self.params_dtype,
+            prefix=f"{prefix}.experts",
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         orig_shape = hidden_states.shape
@@ -166,7 +186,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class DbrxAttention(nn.Module):
-
     def __init__(
         self,
         config: DbrxConfig,
@@ -222,13 +241,15 @@ def __init__(
         self.q_size = self.num_heads * self.head_dim
         self.kv_size = self.num_kv_heads * self.head_dim
         self.scaling = self.head_dim**-0.5
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -246,7 +267,6 @@ def forward(
 
 
 class DbrxFusedNormAttention(nn.Module):
-
     def __init__(
         self,
         config: DbrxConfig,
@@ -256,10 +276,9 @@ def __init__(
     ):
         super().__init__()
         self.d_model = config.d_model
-        self.attn = DbrxAttention(config,
-                                  cache_config,
-                                  quant_config,
-                                  prefix=f"{prefix}.attn")
+        self.attn = DbrxAttention(
+            config, cache_config, quant_config, prefix=f"{prefix}.attn"
+        )
         self.norm_1 = nn.LayerNorm(self.d_model)
         self.norm_2 = nn.LayerNorm(self.d_model)
 
@@ -281,7 +300,6 @@ def forward(
 
 
 class DbrxBlock(nn.Module):
-
     def __init__(
         self,
         config: DbrxConfig,
@@ -291,10 +309,8 @@ def __init__(
     ):
         super().__init__()
         self.norm_attn_norm = DbrxFusedNormAttention(
-            config,
-            cache_config,
-            quant_config,
-            prefix=f"{prefix}.norm_attn_norm")
+            config, cache_config, quant_config, prefix=f"{prefix}.norm_attn_norm"
+        )
         self.ffn = DbrxMoE(config, quant_config, prefix=f"{prefix}.ffn")
 
     def forward(
@@ -312,7 +328,6 @@ def forward(
 
 
 class DbrxModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -327,19 +342,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
         self.start_layer, self.end_layer, self.blocks = make_layers(
             config.n_layers,
-            lambda prefix: DbrxBlock(
-                config, cache_config, quant_config, prefix=prefix),
+            lambda prefix: DbrxBlock(config, cache_config, quant_config, prefix=prefix),
             prefix=f"{prefix}.blocks",
         )
         self.norm_f = nn.LayerNorm(config.d_model, eps=1e-5)
         for module in self.modules():
-            if hasattr(module, "bias") and isinstance(module.bias,
-                                                      nn.Parameter):
+            if hasattr(module, "bias") and isinstance(module.bias, nn.Parameter):
                 # Remove the bias term in Linear and LayerNorm.
                 module.register_parameter("bias", None)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.d_model))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.d_model
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
@@ -366,24 +379,27 @@ def forward(
         hidden_states = self.norm_f(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-        expert_params_mapping = [(
-            "w13" if weight_name in ["w1", "v1"] else "w2",
-            f"mlp.{weight_name}",
-        ) for weight_name in ["w1", "v1", "w2"]]
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
+        expert_params_mapping = [
+            (
+                "w13" if weight_name in ["w1", "v1"] else "w2",
+                f"mlp.{weight_name}",
+            )
+            for weight_name in ["w1", "v1", "w2"]
+        ]
         params_dict = dict(self.named_parameters(remove_duplicate=False))
         loaded_params: set[str] = set()
 
         for name, loaded_weight in weights:
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
@@ -409,28 +425,25 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if name is None:
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class DbrxForCausalLM(nn.Module, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
         self.config = config
         if config.tie_word_embeddings:
-            raise ValueError(
-                "tie_word_embeddings is not supported for Dbrx models.")
+            raise ValueError("tie_word_embeddings is not supported for Dbrx models.")
         self.quant_config = quant_config
         self.unpadded_vocab_size = config.vocab_size
-        self.transformer = DbrxModel(vllm_config=vllm_config,
-                                     prefix=maybe_prefix(
-                                         prefix, "transformer"))
+        self.transformer = DbrxModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "transformer")
+        )
         self.lm_head = ParallelLMHead(
             config.vocab_size,
             config.d_model,
@@ -439,10 +452,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             quant_config=quant_config,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size
+        )
         self.make_empty_intermediate_tensors = (
-            self.transformer.make_empty_intermediate_tensors)
+            self.transformer.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.transformer.get_input_embeddings(input_ids)
@@ -454,8 +469,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.transformer(input_ids, positions,
-                                         intermediate_tensors, inputs_embeds)
+        hidden_states = self.transformer(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -465,7 +481,6 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/deepseek.py b/vllm/model_executor/models/deepseek.py
index ffc843fe033c..67258c2f77b8 100644
--- a/vllm/model_executor/models/deepseek.py
+++ b/vllm/model_executor/models/deepseek.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Deepseek model."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Any, Optional, Union
@@ -33,33 +34,43 @@
 
 from vllm.attention import Attention
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (get_pp_group, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_reduce)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_reduce,
+)
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import fused_experts, fused_topk
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, extract_layer_index,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class DeepseekMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -71,17 +82,19 @@ def __init__(
     ) -> None:
         super().__init__()
         self.gate_up_proj = MergedColumnParallelLinear(
-            hidden_size, [intermediate_size] * 2,
+            hidden_size, [intermediate_size] * 2, bias=False, quant_config=quant_config
+        )
+        self.down_proj = RowParallelLinear(
+            intermediate_size,
+            hidden_size,
             bias=False,
-            quant_config=quant_config)
-        self.down_proj = RowParallelLinear(intermediate_size,
-                                           hidden_size,
-                                           bias=False,
-                                           quant_config=quant_config,
-                                           reduce_results=reduce_results)
+            quant_config=quant_config,
+            reduce_results=reduce_results,
+        )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -92,7 +105,6 @@ def forward(self, x):
 
 
 class DeepseekMoE(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -108,26 +120,29 @@ def __init__(
         if self.tp_size > self.n_routed_experts:
             raise ValueError(
                 f"Tensor parallel size {self.tp_size} is greater than "
-                f"the number of experts {self.n_routed_experts}.")
-
-        self.experts = nn.ModuleList([
-            DeepseekMLP(hidden_size=config.hidden_size,
-                        intermediate_size=config.moe_intermediate_size,
-                        hidden_act=config.hidden_act,
-                        quant_config=quant_config,
-                        reduce_results=False)
-            for idx in range(self.n_routed_experts)
-        ])
+                f"the number of experts {self.n_routed_experts}."
+            )
+
+        self.experts = nn.ModuleList(
+            [
+                DeepseekMLP(
+                    hidden_size=config.hidden_size,
+                    intermediate_size=config.moe_intermediate_size,
+                    hidden_act=config.hidden_act,
+                    quant_config=quant_config,
+                    reduce_results=False,
+                )
+                for idx in range(self.n_routed_experts)
+            ]
+        )
         self.pack_params()
 
-        self.gate = ReplicatedLinear(config.hidden_size,
-                                     self.n_routed_experts,
-                                     bias=False,
-                                     quant_config=None)
+        self.gate = ReplicatedLinear(
+            config.hidden_size, self.n_routed_experts, bias=False, quant_config=None
+        )
 
         if config.n_shared_experts is not None:
-            intermediate_size = (config.moe_intermediate_size *
-                                 config.n_shared_experts)
+            intermediate_size = config.moe_intermediate_size * config.n_shared_experts
             self.shared_experts = DeepseekMLP(
                 hidden_size=config.hidden_size,
                 intermediate_size=intermediate_size,
@@ -167,25 +182,21 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
             hidden_states,
             router_logits,
             self.top_k,
-            renormalize=self.config.norm_topk_prob)
+            renormalize=self.config.norm_topk_prob,
+        )
 
-        final_hidden_states = fused_experts(hidden_states,
-                                            self.w1,
-                                            self.w2,
-                                            topk_weights,
-                                            topk_ids,
-                                            inplace=True)
+        final_hidden_states = fused_experts(
+            hidden_states, self.w1, self.w2, topk_weights, topk_ids, inplace=True
+        )
 
         if self.config.n_shared_experts is not None:
             final_hidden_states = final_hidden_states + shared_output
-        final_hidden_states = tensor_model_parallel_all_reduce(
-            final_hidden_states)
+        final_hidden_states = tensor_model_parallel_all_reduce(final_hidden_states)
 
         return final_hidden_states.view(num_tokens, hidden_dim)
 
 
 class DeepseekAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -244,13 +255,15 @@ def __init__(
             base=rope_theta,
             rope_scaling=rope_scaling,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -266,7 +279,6 @@ def forward(
 
 
 class DeepseekDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -279,8 +291,7 @@ def __init__(
         self.hidden_size = config.hidden_size
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         self.self_attn = DeepseekAttention(
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
@@ -292,12 +303,14 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.self_attn",
         )
-        if (config.n_routed_experts is not None
-                and layer_idx >= config.first_k_dense_replace
-                and layer_idx % config.moe_layer_freq == 0):
-            self.mlp = DeepseekMoE(config=config,
-                                   quant_config=quant_config,
-                                   prefix=f"{prefix}.mlp")
+        if (
+            config.n_routed_experts is not None
+            and layer_idx >= config.first_k_dense_replace
+            and layer_idx % config.moe_layer_freq == 0
+        ):
+            self.mlp = DeepseekMoE(
+                config=config, quant_config=quant_config, prefix=f"{prefix}.mlp"
+            )
         else:
             self.mlp = DeepseekMLP(
                 hidden_size=config.hidden_size,
@@ -306,10 +319,10 @@ def __init__(
                 quant_config=quant_config,
                 prefix=f"{prefix}.mlp",
             )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -322,22 +335,19 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
 
 class DeepseekModel(nn.Module):
-
     fall_back_to_pt_during_load = False
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
@@ -358,11 +368,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             lambda prefix: DeepseekDecoderLayer(
                 config, cache_config, quant_config=quant_config, prefix=prefix
             ),
-            prefix=f"{prefix}.layers")
+            prefix=f"{prefix}.layers",
+        )
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -386,15 +397,13 @@ def forward(
         for layer in islice(self.layers, self.start_layer, self.end_layer):
             hidden_states, residual = layer(positions, hidden_states, residual)
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -409,7 +418,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -417,8 +426,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if name.endswith(".bias") and name not in params_dict:
                     continue
                 # Skip experts that are not assigned to this worker.
-                if (("mlp.experts." in name or "mlp.shared_experts." in name)
-                        and name not in params_dict):
+                if (
+                    "mlp.experts." in name or "mlp.shared_experts." in name
+                ) and name not in params_dict:
                     continue
                 if is_pp_missing_parameter(name, self):
                     continue
@@ -431,14 +441,14 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if name.endswith(".bias") and name not in params_dict:
                     continue
                 # Skip experts that are not assigned to this worker.
-                if (("mlp.experts." in name or "mlp.shared_experts." in name)
-                        and name not in params_dict):
+                if (
+                    "mlp.experts." in name or "mlp.shared_experts." in name
+                ) and name not in params_dict:
                     continue
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -456,8 +466,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.model = DeepseekModel(vllm_config=vllm_config,
-                                   prefix=maybe_prefix(prefix, "model"))
+        self.model = DeepseekModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.lm_head = ParallelLMHead(
             config.vocab_size,
             config.hidden_size,
@@ -468,7 +479,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head.weight = self.model.embed_tokens.weight
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -480,8 +492,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -491,7 +504,6 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/deepseek_eagle.py b/vllm/model_executor/models/deepseek_eagle.py
index c42a66d86912..467468dcc01e 100644
--- a/vllm/model_executor/models/deepseek_eagle.py
+++ b/vllm/model_executor/models/deepseek_eagle.py
@@ -14,18 +14,23 @@
 from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
-from vllm.model_executor.models.deepseek_v2 import (DeepseekV2DecoderLayer,
-                                                    DeepseekV3ForCausalLM)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
+from vllm.model_executor.models.deepseek_v2 import (
+    DeepseekV2DecoderLayer,
+    DeepseekV3ForCausalLM,
+)
 
 from .utils import AutoWeightsLoader, maybe_prefix
 
 
 @support_torch_compile
 class DeepseekV2Model(nn.Module):
-
     def __init__(
         self,
         *,
@@ -34,8 +39,7 @@ def __init__(
         start_layer_id: int = 0,
     ) -> None:
         super().__init__()
-        self.config = vllm_config. \
-            speculative_config.draft_model_config.hf_config
+        self.config = vllm_config.speculative_config.draft_model_config.hf_config
         quant_config = vllm_config.quant_config
         self.vocab_size = self.config.vocab_size
 
@@ -46,12 +50,15 @@ def __init__(
             prefix=maybe_prefix(prefix, "embed_tokens"),
         )
 
-        self.layers = nn.ModuleList([
-            DeepseekV2DecoderLayer(
-                vllm_config,
-                prefix=maybe_prefix(prefix, f"layers.{i + start_layer_id}"),
-            ) for i in range(self.config.num_hidden_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                DeepseekV2DecoderLayer(
+                    vllm_config,
+                    prefix=maybe_prefix(prefix, f"layers.{i + start_layer_id}"),
+                )
+                for i in range(self.config.num_hidden_layers)
+            ]
+        )
 
         self.fc = nn.Linear(
             self.config.model.hidden_size * 2,
@@ -59,12 +66,9 @@ def __init__(
             bias=False,
         )
 
-        self.enorm = RMSNorm(self.config.hidden_size,
-                             eps=self.config.rms_norm_eps)
-        self.hnorm = RMSNorm(self.config.hidden_size,
-                             eps=self.config.rms_norm_eps)
-        self.norm = RMSNorm(self.config.hidden_size,
-                            eps=self.config.rms_norm_eps)
+        self.enorm = RMSNorm(self.config.hidden_size, eps=self.config.rms_norm_eps)
+        self.hnorm = RMSNorm(self.config.hidden_size, eps=self.config.rms_norm_eps)
+        self.norm = RMSNorm(self.config.hidden_size, eps=self.config.rms_norm_eps)
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -78,8 +82,8 @@ def forward(
         input_embeds = self.embed_tokens(input_ids)
 
         inputs = torch.cat(
-            [self.enorm(input_embeds),
-             self.hnorm(hidden_states)], dim=-1)
+            [self.enorm(input_embeds), self.hnorm(hidden_states)], dim=-1
+        )
         hidden_states = self.fc(inputs)
         residual = None
         for layer in self.layers:
@@ -91,8 +95,7 @@ def forward(
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states, hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("gate_up_proj", "gate_proj", 0),
@@ -107,7 +110,8 @@ def load_weights(self, weights: Iterable[tuple[str,
             ckpt_gate_proj_name="gate_proj",
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
-            num_experts=self.config.n_routed_experts)
+            num_experts=self.config.n_routed_experts,
+        )
 
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
@@ -132,8 +136,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                 # QKV fusion is optional, fall back to normal
                 # weight loading if it's not enabled
                 # if go with fusion option, then update name
-                if ((param_name == "fused_qkv_a_proj")
-                        and name_mapped not in params_dict):
+                if (
+                    param_name == "fused_qkv_a_proj"
+                ) and name_mapped not in params_dict:
                     continue
                 else:
                     name = name_mapped
@@ -165,8 +170,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                     break
                 else:
                     # if PP disabled then draft will share embed with target
-                    if get_pp_group().world_size == 1 and \
-                            "embed_tokens." in name:
+                    if get_pp_group().world_size == 1 and "embed_tokens." in name:
                         continue
 
                     # Skip loading extra bias for GPTQ models.
@@ -179,34 +183,37 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
 
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class EagleDeepseekV3ForCausalLM(DeepseekV3ForCausalLM):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         nn.Module.__init__(self)
-        self.config = vllm_config. \
-            speculative_config.draft_model_config.hf_config
+        self.config = vllm_config.speculative_config.draft_model_config.hf_config
         quant_config = vllm_config.quant_config
         target_layer_num = vllm_config.model_config.get_num_layers(
-            vllm_config.parallel_config)
-        self.model = DeepseekV2Model(vllm_config=vllm_config,
-                                     prefix="model",
-                                     start_layer_id=target_layer_num)
+            vllm_config.parallel_config
+        )
+        self.model = DeepseekV2Model(
+            vllm_config=vllm_config, prefix="model", start_layer_id=target_layer_num
+        )
 
-        self.lm_head = ParallelLMHead(self.config.vocab_size,
-                                      self.config.hidden_size,
-                                      quant_config=quant_config,
-                                      prefix=maybe_prefix(prefix, "lm_head"))
+        self.lm_head = ParallelLMHead(
+            self.config.vocab_size,
+            self.config.hidden_size,
+            quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
 
         logit_scale = getattr(self.config, "logit_scale", 1.0)
-        self.logits_processor = LogitsProcessor(self.config.vocab_size,
-                                                scale=logit_scale)
+        self.logits_processor = LogitsProcessor(
+            self.config.vocab_size, scale=logit_scale
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -232,7 +239,6 @@ def compute_logits(
         return logits
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
-
         def transform(inputs):
             name, loaded_weight = inputs
             if "lm_head" not in name:
diff --git a/vllm/model_executor/models/deepseek_mtp.py b/vllm/model_executor/models/deepseek_mtp.py
index 02a25ab762e5..36c1e0cbe69b 100644
--- a/vllm/model_executor/models/deepseek_mtp.py
+++ b/vllm/model_executor/models/deepseek_mtp.py
@@ -13,18 +13,18 @@
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
-from .deepseek_v2 import (DeepseekV2DecoderLayer,
-                          get_spec_layer_idx_from_weight_name)
+from .deepseek_v2 import DeepseekV2DecoderLayer, get_spec_layer_idx_from_weight_name
 from .interfaces import SupportsPP
 from .utils import maybe_prefix
 
 
 class SharedHead(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -33,17 +33,18 @@ def __init__(
     ) -> None:
         super().__init__()
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.head = ParallelLMHead(config.vocab_size,
-                                   config.hidden_size,
-                                   quant_config=quant_config,
-                                   prefix=maybe_prefix(prefix, "head"))
+        self.head = ParallelLMHead(
+            config.vocab_size,
+            config.hidden_size,
+            quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "head"),
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         return self.norm(hidden_states)
 
 
 class DeepSeekMultiTokenPredictorLayer(nn.Module):
-
     def __init__(self, vllm_config: VllmConfig, prefix: str) -> None:
         super().__init__()
 
@@ -52,9 +53,7 @@ def __init__(self, vllm_config: VllmConfig, prefix: str) -> None:
 
         self.enorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         self.hnorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.eh_proj = nn.Linear(config.hidden_size * 2,
-                                 config.hidden_size,
-                                 bias=False)
+        self.eh_proj = nn.Linear(config.hidden_size * 2, config.hidden_size, bias=False)
 
         self.is_v32 = hasattr(config, "index_topk")
         if self.is_v32:
@@ -63,14 +62,16 @@ def __init__(self, vllm_config: VllmConfig, prefix: str) -> None:
                 vllm_config.scheduler_config.max_num_batched_tokens,
                 topk_tokens,
                 dtype=torch.int32,
-                device="cuda")
+                device="cuda",
+            )
         else:
             topk_indices_buffer = None
-        self.shared_head = SharedHead(config=config,
-                                      prefix=prefix,
-                                      quant_config=quant_config)
-        self.mtp_block = DeepseekV2DecoderLayer(vllm_config, prefix,
-                                                topk_indices_buffer)
+        self.shared_head = SharedHead(
+            config=config, prefix=prefix, quant_config=quant_config
+        )
+        self.mtp_block = DeepseekV2DecoderLayer(
+            vllm_config, prefix, topk_indices_buffer
+        )
 
     def forward(
         self,
@@ -87,30 +88,34 @@ def forward(
         previous_hidden_states = self.hnorm(previous_hidden_states)
 
         hidden_states = self.eh_proj(
-            torch.cat([inputs_embeds, previous_hidden_states], dim=-1))
+            torch.cat([inputs_embeds, previous_hidden_states], dim=-1)
+        )
 
-        hidden_states, residual = self.mtp_block(positions=positions,
-                                                 hidden_states=hidden_states,
-                                                 residual=None)
+        hidden_states, residual = self.mtp_block(
+            positions=positions, hidden_states=hidden_states, residual=None
+        )
         hidden_states = residual + hidden_states
         return hidden_states
 
 
 class DeepSeekMultiTokenPredictor(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         self.mtp_start_layer_idx = config.num_hidden_layers
         self.num_mtp_layers = config.num_nextn_predict_layers
         # to map the exact layer index from weights
-        self.layers = torch.nn.ModuleDict({
-            str(idx):
-            DeepSeekMultiTokenPredictorLayer(vllm_config,
-                                             f"{prefix}.layers.{idx}")
-            for idx in range(self.mtp_start_layer_idx,
-                             self.mtp_start_layer_idx + self.num_mtp_layers)
-        })
+        self.layers = torch.nn.ModuleDict(
+            {
+                str(idx): DeepSeekMultiTokenPredictorLayer(
+                    vllm_config, f"{prefix}.layers.{idx}"
+                )
+                for idx in range(
+                    self.mtp_start_layer_idx,
+                    self.mtp_start_layer_idx + self.num_mtp_layers,
+                )
+            }
+        )
         self.embed_tokens = VocabParallelEmbedding(
             config.vocab_size,
             config.hidden_size,
@@ -130,7 +135,7 @@ def forward(
     ) -> torch.Tensor:
         if inputs_embeds is None:
             inputs_embeds = self.embed_tokens(input_ids)
-        current_step_idx = (spec_step_idx % self.num_mtp_layers)
+        current_step_idx = spec_step_idx % self.num_mtp_layers
         return self.layers[str(self.mtp_start_layer_idx + current_step_idx)](
             input_ids,
             positions,
@@ -144,22 +149,21 @@ def compute_logits(
         hidden_states: torch.Tensor,
         spec_step_idx: int = 0,
     ) -> torch.Tensor:
-        current_step_idx = (spec_step_idx % self.num_mtp_layers)
-        mtp_layer = self.layers[str(self.mtp_start_layer_idx +
-                                    current_step_idx)]
-        logits = self.logits_processor(mtp_layer.shared_head.head,
-                                       mtp_layer.shared_head(hidden_states))
+        current_step_idx = spec_step_idx % self.num_mtp_layers
+        mtp_layer = self.layers[str(self.mtp_start_layer_idx + current_step_idx)]
+        logits = self.logits_processor(
+            mtp_layer.shared_head.head, mtp_layer.shared_head(hidden_states)
+        )
         return logits
 
 
 class DeepSeekMTP(nn.Module, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         self.config = vllm_config.model_config.hf_config
-        self.model = DeepSeekMultiTokenPredictor(vllm_config=vllm_config,
-                                                 prefix=maybe_prefix(
-                                                     prefix, "model"))
+        self.model = DeepSeekMultiTokenPredictor(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -173,8 +177,9 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         spec_step_idx: int = 0,
     ) -> torch.Tensor:
-        hidden_states = self.model(input_ids, positions, hidden_states,
-                                   inputs_embeds, spec_step_idx)
+        hidden_states = self.model(
+            input_ids, positions, hidden_states, inputs_embeds, spec_step_idx
+        )
         return hidden_states
 
     def compute_logits(
@@ -184,8 +189,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.model.compute_logits(hidden_states, spec_step_idx)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             ("gate_up_proj", "gate_proj", 0),
             ("gate_up_proj", "up_proj", 1),
@@ -197,7 +201,8 @@ def load_weights(self, weights: Iterable[tuple[str,
             ckpt_gate_proj_name="gate_proj",
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
-            num_experts=self.config.n_routed_experts)
+            num_experts=self.config.n_routed_experts,
+        )
 
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
@@ -208,7 +213,7 @@ def load_weights(self, weights: Iterable[tuple[str,
             if spec_layer is None:
                 continue
             name = self._rewrite_spec_layer_name(spec_layer, name)
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 # Skip non-stacked layers and experts (experts handled below).
                 if weight_name not in name:
                     continue
@@ -218,14 +223,15 @@ def load_weights(self, weights: Iterable[tuple[str,
                 # name will be updated to mlp.experts[0].gate_up_proj, which
                 # will then be updated below in expert_params_mapping
                 # for mlp.experts[0].gate_gate_up_proj, which breaks load.
-                if (("mlp.experts." in name) and name not in params_dict):
+                if ("mlp.experts." in name) and name not in params_dict:
                     continue
                 name_mapped = name.replace(weight_name, param_name)
 
                 # QKV fusion is optional, fall back to normal
                 # weight loading if it's not enabled
-                if ((param_name == "fused_qkv_a_proj")
-                        and name_mapped not in params_dict):
+                if (
+                    param_name == "fused_qkv_a_proj"
+                ) and name_mapped not in params_dict:
                     continue
                 else:
                     name = name_mapped
@@ -247,11 +253,13 @@ def load_weights(self, weights: Iterable[tuple[str,
 
                     param = params_dict[name]
                     weight_loader = param.weight_loader
-                    weight_loader(param,
-                                  loaded_weight,
-                                  name,
-                                  shard_id=shard_id,
-                                  expert_id=expert_id)
+                    weight_loader(
+                        param,
+                        loaded_weight,
+                        name,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                    )
                     break
                 else:
                     # Skip loading extra bias for GPTQ models.
@@ -260,13 +268,16 @@ def load_weights(self, weights: Iterable[tuple[str,
 
                     # According to DeepSeek-V3 Technical Report, MTP modules
                     # shares embedding layer. We only load the first weights.
-                    if (spec_layer != self.model.mtp_start_layer_idx
-                            and ".layers" not in name):
+                    if (
+                        spec_layer != self.model.mtp_start_layer_idx
+                        and ".layers" not in name
+                    ):
                         continue
 
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -278,7 +289,11 @@ def _rewrite_spec_layer_name(self, spec_layer: int, name: str) -> str:
         and rename shared layer weights to be top level.
         """
         spec_layer_weight_names = [
-            "embed_tokens", "enorm", "hnorm", "eh_proj", "shared_head"
+            "embed_tokens",
+            "enorm",
+            "hnorm",
+            "eh_proj",
+            "shared_head",
         ]
         shared_weight_names = ["embed_tokens"]
         spec_layer_weight = False
@@ -291,8 +306,9 @@ def _rewrite_spec_layer_name(self, spec_layer: int, name: str) -> str:
                 break
         if not spec_layer_weight:
             # treat rest weights as weights for transformer layer block
-            name = name.replace(f"model.layers.{spec_layer}.",
-                                f"model.layers.{spec_layer}.mtp_block.")
+            name = name.replace(
+                f"model.layers.{spec_layer}.", f"model.layers.{spec_layer}.mtp_block."
+            )
         elif shared_weight:
             # treat shared weights as top level weights
             name = name.replace(f"model.layers.{spec_layer}.", "model.")
diff --git a/vllm/model_executor/models/deepseek_v2.py b/vllm/model_executor/models/deepseek_v2.py
index b7f96d0d1552..f149b02e5522 100644
--- a/vllm/model_executor/models/deepseek_v2.py
+++ b/vllm/model_executor/models/deepseek_v2.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only DeepseekV2/DeepseekV3 model."""
+
 import typing
 from collections.abc import Callable, Iterable
 from itertools import islice
@@ -36,46 +37,61 @@
 from vllm.attention.backends.abstract import AttentionBackend
 from vllm.attention.ops.common import pack_seq_triton, unpack_seq_triton
 from vllm.compilation.decorators import support_torch_compile
-from vllm.config import (CacheConfig, ParallelConfig, VllmConfig,
-                         get_current_vllm_config)
-from vllm.distributed import (get_ep_group, get_pp_group,
-                              get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_gather)
+from vllm.config import CacheConfig, ParallelConfig, VllmConfig, get_current_vllm_config
+from vllm.distributed import (
+    get_ep_group,
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_gather,
+)
 from vllm.forward_context import get_forward_context
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.attention_layer_base import AttentionLayerBase
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import LayerNorm, RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.mla import MLAModules, MultiHeadLatentAttention
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
-    per_token_group_quant_fp8)
+    per_token_group_quant_fp8,
+)
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.shared_fused_moe import SharedFusedMoE
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.model_executor.models.utils import sequence_parallel_chunk
 from vllm.platforms import current_platform
 from vllm.sequence import IntermediateTensors
 from vllm.utils import cdiv, direct_register_custom_op
 from vllm.utils.deep_gemm import fp8_mqa_logits, fp8_paged_mqa_logits
-from vllm.v1.attention.backends.mla.indexer import (DeepseekV32IndexerBackend,
-                                                    DeepseekV32IndexerMetadata)
+from vllm.v1.attention.backends.mla.indexer import (
+    DeepseekV32IndexerBackend,
+    DeepseekV32IndexerMetadata,
+)
 from vllm.v1.kv_cache_interface import KVCacheSpec, MLAAttentionSpec
 
 from .interfaces import MixtureOfExperts, SupportsLoRA, SupportsPP
-from .utils import (PPMissingLayer, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 if current_platform.is_cuda_alike():
     from vllm import _custom_ops as ops
@@ -86,7 +102,6 @@
 
 
 class DeepseekV2MLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -104,21 +119,26 @@ def __init__(
         # replicated and no collective ops are needed.
         # Otherwise we use standard TP with an allreduce at the end.
         self.gate_up_proj = MergedColumnParallelLinear(
-            hidden_size, [intermediate_size] * 2,
+            hidden_size,
+            [intermediate_size] * 2,
             bias=False,
             quant_config=quant_config,
             disable_tp=is_sequence_parallel,
-            prefix=f"{prefix}.gate_up_proj")
-        self.down_proj = RowParallelLinear(intermediate_size,
-                                           hidden_size,
-                                           bias=False,
-                                           quant_config=quant_config,
-                                           reduce_results=reduce_results,
-                                           disable_tp=is_sequence_parallel,
-                                           prefix=f"{prefix}.down_proj")
+            prefix=f"{prefix}.gate_up_proj",
+        )
+        self.down_proj = RowParallelLinear(
+            intermediate_size,
+            hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            reduce_results=reduce_results,
+            disable_tp=is_sequence_parallel,
+            prefix=f"{prefix}.down_proj",
+        )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -129,7 +149,6 @@ def forward(self, x):
 
 
 class DeepseekV2MoE(nn.Module):
-
     def __init__(
         self,
         config: Union[DeepseekV2Config, DeepseekV3Config],
@@ -152,17 +171,22 @@ def __init__(
         self.is_sequence_parallel = parallel_config.use_sequence_parallel_moe
 
         if config.hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {config.hidden_act}. "
-                             "Only silu is supported for now.")
-
-        self.gate = ReplicatedLinear(config.hidden_size,
-                                     config.n_routed_experts,
-                                     bias=False,
-                                     quant_config=None,
-                                     prefix=f"{prefix}.gate")
+            raise ValueError(
+                f"Unsupported activation: {config.hidden_act}. "
+                "Only silu is supported for now."
+            )
+
+        self.gate = ReplicatedLinear(
+            config.hidden_size,
+            config.n_routed_experts,
+            bias=False,
+            quant_config=None,
+            prefix=f"{prefix}.gate",
+        )
         if config.topk_method == "noaux_tc":
             self.gate.e_score_correction_bias = nn.Parameter(
-                torch.empty(config.n_routed_experts, dtype=torch.float32))
+                torch.empty(config.n_routed_experts, dtype=torch.float32)
+            )
         else:
             self.gate.e_score_correction_bias = None
 
@@ -172,14 +196,13 @@ def __init__(
 
         self.n_redundant_experts = eplb_config.num_redundant_experts
         self.n_logical_experts = self.n_routed_experts
-        self.n_physical_experts = (self.n_logical_experts +
-                                   self.n_redundant_experts)
+        self.n_physical_experts = self.n_logical_experts + self.n_redundant_experts
         self.n_local_physical_experts = self.n_physical_experts // self.ep_size
 
-        self.physical_expert_start = (self.ep_rank *
-                                      self.n_local_physical_experts)
-        self.physical_expert_end = (self.physical_expert_start +
-                                    self.n_local_physical_experts)
+        self.physical_expert_start = self.ep_rank * self.n_local_physical_experts
+        self.physical_expert_end = (
+            self.physical_expert_start + self.n_local_physical_experts
+        )
 
         if config.n_shared_experts is None:
             self.experts = FusedMoE(
@@ -204,8 +227,7 @@ def __init__(
             )
             self.shared_experts = None
         else:
-            intermediate_size = (config.moe_intermediate_size *
-                                 config.n_shared_experts)
+            intermediate_size = config.moe_intermediate_size * config.n_shared_experts
 
             self.shared_experts = DeepseekV2MLP(
                 hidden_size=config.hidden_size,
@@ -253,8 +275,9 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         # router_logits: (num_tokens, n_experts)
         router_logits, _ = self.gate(hidden_states)
 
-        fused_moe_out = self.experts(hidden_states=hidden_states,
-                                     router_logits=router_logits)
+        fused_moe_out = self.experts(
+            hidden_states=hidden_states, router_logits=router_logits
+        )
 
         if self.shared_experts is not None:
             shared_output, final_hidden_states = fused_moe_out
@@ -268,7 +291,7 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
             final_hidden_states *= self.routed_scaling_factor
         elif self.shared_experts is not None:
             assert shared_output is not None
-            shared_output *= (1. / self.routed_scaling_factor)
+            shared_output *= 1.0 / self.routed_scaling_factor
 
         if self.shared_experts is not None:
             assert shared_output is not None
@@ -276,25 +299,26 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
         if self.is_sequence_parallel:
             final_hidden_states = tensor_model_parallel_all_gather(
-                final_hidden_states, 0)
+                final_hidden_states, 0
+            )
             final_hidden_states = final_hidden_states[:num_tokens]
         elif self.tp_size > 1:
-            final_hidden_states = (
-                self.experts.maybe_all_reduce_tensor_model_parallel(
-                    final_hidden_states))
+            final_hidden_states = self.experts.maybe_all_reduce_tensor_model_parallel(
+                final_hidden_states
+            )
 
         return final_hidden_states.view(num_tokens, hidden_dim)
 
 
 def yarn_get_mscale(scale: float = 1, mscale: float = 1) -> float:
     import math
+
     if scale <= 1:
         return 1.0
     return 0.1 * mscale * math.log(scale) + 1.0
 
 
 class DeepseekV2Attention(nn.Module):
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -329,60 +353,70 @@ def __init__(
         self.scaling = self.qk_head_dim**-0.5
         self.rope_theta = rope_theta
         self.max_position_embeddings = max_position_embeddings
-        assert topk_indices_buffer is None, "topk_indices_buffer is not \
+        assert topk_indices_buffer is None, (
+            "topk_indices_buffer is not \
         supported for DeepseekV2Attention"
+        )
 
         if self.q_lora_rank is not None:
-            self.q_a_proj = ReplicatedLinear(self.hidden_size,
-                                             self.q_lora_rank,
-                                             bias=False,
-                                             quant_config=quant_config,
-                                             prefix=f"{prefix}.q_a_proj")
-            self.q_a_layernorm = RMSNorm(self.q_lora_rank,
-                                         eps=config.rms_norm_eps)
-            self.q_b_proj = ColumnParallelLinear(q_lora_rank,
-                                                 self.num_heads *
-                                                 self.qk_head_dim,
-                                                 bias=False,
-                                                 quant_config=quant_config,
-                                                 prefix=f"{prefix}.q_b_proj")
+            self.q_a_proj = ReplicatedLinear(
+                self.hidden_size,
+                self.q_lora_rank,
+                bias=False,
+                quant_config=quant_config,
+                prefix=f"{prefix}.q_a_proj",
+            )
+            self.q_a_layernorm = RMSNorm(self.q_lora_rank, eps=config.rms_norm_eps)
+            self.q_b_proj = ColumnParallelLinear(
+                q_lora_rank,
+                self.num_heads * self.qk_head_dim,
+                bias=False,
+                quant_config=quant_config,
+                prefix=f"{prefix}.q_b_proj",
+            )
         else:
-            self.q_proj = ColumnParallelLinear(self.hidden_size,
-                                               self.num_heads *
-                                               self.qk_head_dim,
-                                               bias=False,
-                                               quant_config=quant_config,
-                                               prefix=f"{prefix}.q_proj")
+            self.q_proj = ColumnParallelLinear(
+                self.hidden_size,
+                self.num_heads * self.qk_head_dim,
+                bias=False,
+                quant_config=quant_config,
+                prefix=f"{prefix}.q_proj",
+            )
 
         self.kv_a_proj_with_mqa = ReplicatedLinear(
             self.hidden_size,
             self.kv_lora_rank + self.qk_rope_head_dim,
             bias=False,
             quant_config=quant_config,
-            prefix=f"{prefix}.kv_a_proj_with_mqa")
-        self.kv_a_layernorm = RMSNorm(self.kv_lora_rank,
-                                      eps=config.rms_norm_eps)
+            prefix=f"{prefix}.kv_a_proj_with_mqa",
+        )
+        self.kv_a_layernorm = RMSNorm(self.kv_lora_rank, eps=config.rms_norm_eps)
         self.kv_b_proj = ColumnParallelLinear(
             self.kv_lora_rank,
             self.num_heads * (self.qk_nope_head_dim + self.v_head_dim),
             bias=False,
             quant_config=quant_config,
-            prefix=f"{prefix}.kv_b_proj")
+            prefix=f"{prefix}.kv_b_proj",
+        )
         # O projection.
-        self.o_proj = RowParallelLinear(self.num_heads * self.v_head_dim,
-                                        self.hidden_size,
-                                        bias=False,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.o_proj")
+        self.o_proj = RowParallelLinear(
+            self.num_heads * self.v_head_dim,
+            self.hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.o_proj",
+        )
         if rope_scaling:
-            rope_scaling["rope_type"] = 'deepseek_yarn'
+            rope_scaling["rope_type"] = "deepseek_yarn"
 
-        self.rotary_emb = get_rope(qk_rope_head_dim,
-                                   rotary_dim=qk_rope_head_dim,
-                                   max_position=max_position_embeddings,
-                                   base=rope_theta,
-                                   rope_scaling=rope_scaling,
-                                   is_neox_style=False)
+        self.rotary_emb = get_rope(
+            qk_rope_head_dim,
+            rotary_dim=qk_rope_head_dim,
+            max_position=max_position_embeddings,
+            base=rope_theta,
+            rope_scaling=rope_scaling,
+            is_neox_style=False,
+        )
 
         if rope_scaling:
             mscale_all_dim = rope_scaling.get("mscale_all_dim", False)
@@ -390,13 +424,15 @@ def __init__(
             mscale = yarn_get_mscale(scaling_factor, float(mscale_all_dim))
             self.scaling = self.scaling * mscale * mscale
 
-        self.attn = Attention(self.num_local_heads,
-                              self.qk_head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_local_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_local_heads,
+            self.qk_head_dim,
+            self.scaling,
+            num_kv_heads=self.num_local_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -406,47 +442,43 @@ def forward(
         if self.q_lora_rank is not None:
             q = self.q_a_proj(hidden_states)[0]
             q = self.q_a_layernorm(q)
-            q = self.q_b_proj(q)[0].view(-1, self.num_local_heads,
-                                         self.qk_head_dim)
+            q = self.q_b_proj(q)[0].view(-1, self.num_local_heads, self.qk_head_dim)
         else:
-            q = self.q_proj(hidden_states)[0].view(-1, self.num_local_heads,
-                                                   self.qk_head_dim)
-        q_nope, q_pe = q.split([self.qk_nope_head_dim, self.qk_rope_head_dim],
-                               dim=-1)
+            q = self.q_proj(hidden_states)[0].view(
+                -1, self.num_local_heads, self.qk_head_dim
+            )
+        q_nope, q_pe = q.split([self.qk_nope_head_dim, self.qk_rope_head_dim], dim=-1)
         latent_cache = self.kv_a_proj_with_mqa(hidden_states)[0]
-        kv_a, _ = latent_cache.split(
-            [self.kv_lora_rank, self.qk_rope_head_dim], dim=-1)
+        kv_a, _ = latent_cache.split([self.kv_lora_rank, self.qk_rope_head_dim], dim=-1)
         latent_cache = latent_cache.unsqueeze(1)
         kv_a = self.kv_a_layernorm(kv_a)
         kv = self.kv_b_proj(kv_a)[0]
-        kv = kv.view(-1, self.num_local_heads,
-                     self.qk_nope_head_dim + self.v_head_dim)
+        kv = kv.view(-1, self.num_local_heads, self.qk_nope_head_dim + self.v_head_dim)
         k_nope, v = kv.split([self.qk_nope_head_dim, self.v_head_dim], dim=-1)
-        k_pe = latent_cache[:, :, self.kv_lora_rank:]
+        k_pe = latent_cache[:, :, self.kv_lora_rank :]
 
         q_pe, k_pe = self.rotary_emb(positions, q_pe, k_pe)
 
-        q[..., self.qk_nope_head_dim:] = q_pe
+        q[..., self.qk_nope_head_dim :] = q_pe
         k = torch.empty_like(q)
-        k[..., :self.qk_nope_head_dim] = k_nope
-        k[..., self.qk_nope_head_dim:] = k_pe
+        k[..., : self.qk_nope_head_dim] = k_nope
+        k[..., self.qk_nope_head_dim :] = k_pe
         # padding value to qk_head_dim for alignment
         v = torch.nn.functional.pad(
-            v, [0, self.qk_head_dim - self.v_head_dim],
-            value=0).view(-1, self.num_local_heads * self.qk_head_dim)
+            v, [0, self.qk_head_dim - self.v_head_dim], value=0
+        ).view(-1, self.num_local_heads * self.qk_head_dim)
         attn_output = self.attn(q, k, v)
-        attn_output = attn_output.view(
-            -1, self.num_local_heads,
-            self.qk_head_dim)[..., :self.v_head_dim].reshape(
-                -1, self.num_local_heads * self.v_head_dim)
+        attn_output = attn_output.view(-1, self.num_local_heads, self.qk_head_dim)[
+            ..., : self.v_head_dim
+        ].reshape(-1, self.num_local_heads * self.v_head_dim)
         output, _ = self.o_proj(attn_output)
         return output
 
 
 class DeepseekV32IndexerCache(torch.nn.Module, AttentionLayerBase):
-
-    def __init__(self, head_dim: int, dtype: torch.dtype, prefix: str,
-                 cache_config: CacheConfig):
+    def __init__(
+        self, head_dim: int, dtype: torch.dtype, prefix: str, cache_config: CacheConfig
+    ):
         super().__init__()
         self.kv_cache = [torch.tensor([])]
         self.head_dim = head_dim
@@ -466,8 +498,7 @@ def get_kv_cache_spec(self) -> KVCacheSpec:
             dtype=self.dtype,
         )
 
-    def forward(self):
-        ...
+    def forward(self): ...
 
     def get_attn_backend(self) -> AttentionBackend:
         return DeepseekV32IndexerBackend
@@ -497,27 +528,33 @@ def cp_gather_indexer_k_quant_cache(
 
         value = []
         scale = []
-        full_block = torch.arange(tot - 1,
-                                  device=kv_cache.device,
-                                  dtype=torch.int32)
-        non_remaining_value = kv_cache[blocks[full_block], :block_size *
-                                       head_dim].view(-1, head_dim)
-        non_remaining_scale = kv_cache[blocks[full_block],
-                                       block_size * head_dim:].view(-1, 4)
+        full_block = torch.arange(tot - 1, device=kv_cache.device, dtype=torch.int32)
+        non_remaining_value = kv_cache[
+            blocks[full_block], : block_size * head_dim
+        ].view(-1, head_dim)
+        non_remaining_scale = kv_cache[
+            blocks[full_block], block_size * head_dim :
+        ].view(-1, 4)
 
         remaining = s - (tot - 1) * block_size
 
-        value = torch.cat([
-            non_remaining_value,
-            kv_cache[blocks[-1], :remaining * head_dim].view(-1, head_dim)
-        ],
-                          dim=0)
-        scale = torch.cat([
-            non_remaining_scale,
-            kv_cache[blocks[-1], block_size * head_dim:block_size * head_dim +
-                     remaining * 4].view(-1, 4)
-        ],
-                          dim=0)
+        value = torch.cat(
+            [
+                non_remaining_value,
+                kv_cache[blocks[-1], : remaining * head_dim].view(-1, head_dim),
+            ],
+            dim=0,
+        )
+        scale = torch.cat(
+            [
+                non_remaining_scale,
+                kv_cache[
+                    blocks[-1],
+                    block_size * head_dim : block_size * head_dim + remaining * 4,
+                ].view(-1, 4),
+            ],
+            dim=0,
+        )
 
         expected_value.append(value)
         expected_scale.append(scale)
@@ -545,7 +582,6 @@ def sparse_attn_indexer(
     total_seq_lens: int,
     topk_indices_buffer: Optional[torch.Tensor],
 ) -> torch.Tensor:
-
     # careful! this will be None in dummy run
     attn_metadata = get_forward_context().attn_metadata
     # assert isinstance(attn_metadata, dict)
@@ -580,16 +616,18 @@ def sparse_attn_indexer(
         scale_fmt,
     )
 
-    topk_indices_buffer[:hidden_states.shape[0]] = -1
+    topk_indices_buffer[: hidden_states.shape[0]] = -1
     if has_prefill:
         prefill_metadata = attn_metadata.prefill
         for chunk in prefill_metadata.chunks:
-            k_fp8 = torch.empty([chunk.total_seq_lens, head_dim],
-                                device=k.device,
-                                dtype=torch.float8_e4m3fn)
-            k_scale = torch.empty([chunk.total_seq_lens, 1],
-                                  device=k.device,
-                                  dtype=torch.float32)
+            k_fp8 = torch.empty(
+                [chunk.total_seq_lens, head_dim],
+                device=k.device,
+                dtype=torch.float8_e4m3fn,
+            )
+            k_scale = torch.empty(
+                [chunk.total_seq_lens, 1], device=k.device, dtype=torch.float32
+            )
             cp_gather_indexer_k_quant_cache(
                 kv_cache,
                 k_fp8,
@@ -599,27 +637,26 @@ def sparse_attn_indexer(
                 chunk.num_reqs,
             )
             logits = fp8_mqa_logits(
-                q_fp8[chunk.token_start:chunk.token_end],
+                q_fp8[chunk.token_start : chunk.token_end],
                 (k_fp8, k_scale),
-                weights[chunk.token_start:chunk.token_end],
+                weights[chunk.token_start : chunk.token_end],
                 chunk.cu_seqlen_ks,
                 chunk.cu_seqlen_ke,
             )
-            topk_indices = logits.topk(min(topk_tokens, logits.shape[-1]),
-                                       dim=-1)[1]
+            topk_indices = logits.topk(min(topk_tokens, logits.shape[-1]), dim=-1)[1]
             topk_indices -= chunk.cu_seqlen_ks[:, None]
             mask_lo = topk_indices >= 0
-            mask_hi = topk_indices - (chunk.cu_seqlen_ke -
-                                      chunk.cu_seqlen_ks)[:, None] < 0
-            mask = torch.full_like(topk_indices,
-                                   False,
-                                   dtype=torch.bool,
-                                   device=topk_indices.device)
+            mask_hi = (
+                topk_indices - (chunk.cu_seqlen_ke - chunk.cu_seqlen_ks)[:, None] < 0
+            )
+            mask = torch.full_like(
+                topk_indices, False, dtype=torch.bool, device=topk_indices.device
+            )
             mask = mask_lo & mask_hi
             topk_indices = topk_indices.masked_fill(~mask, -1)
             topk_indices_buffer[
-                chunk.token_start:chunk.token_end, :topk_indices.
-                shape[-1]] = topk_indices.to(dtype=torch.int32)
+                chunk.token_start : chunk.token_end, : topk_indices.shape[-1]
+            ] = topk_indices.to(dtype=torch.int32)
 
     if has_decode:
         decode_metadata = attn_metadata.decode
@@ -633,10 +670,12 @@ def sparse_attn_indexer(
             # prefill and decode by decode_threshold
             # (currently set to 1 + speculative tokens)
             padded_q_fp8_decode_tokens = pack_seq_triton(
-                q_fp8[:num_decode_tokens], decode_lens)
+                q_fp8[:num_decode_tokens], decode_lens
+            )
         else:
             padded_q_fp8_decode_tokens = q_fp8[:num_decode_tokens].reshape(
-                decode_lens.shape[0], -1, *q_fp8.shape[1:])
+                decode_lens.shape[0], -1, *q_fp8.shape[1:]
+            )
         # TODO: move and optimize below logic with triton kernels
         batch_size = padded_q_fp8_decode_tokens.shape[0]
         next_n = padded_q_fp8_decode_tokens.shape[1]
@@ -654,22 +693,24 @@ def sparse_attn_indexer(
         # padded query len
         current_device = padded_q_fp8_decode_tokens.device
         padded_num_tokens = batch_size * next_n
-        positions = torch.arange(max_model_len,
-                                 device=current_device).unsqueeze(0).expand(
-                                     batch_size * next_n, -1)
-        row_indices = torch.arange(padded_num_tokens,
-                                   device=current_device) // next_n
-        next_n_offset = torch.arange(
-            padded_num_tokens,
-            device=padded_q_fp8_decode_tokens.device) % next_n
-        index_end_pos = (decode_metadata.seq_lens[row_indices] - next_n +
-                         next_n_offset).unsqueeze(1)
+        positions = (
+            torch.arange(max_model_len, device=current_device)
+            .unsqueeze(0)
+            .expand(batch_size * next_n, -1)
+        )
+        row_indices = torch.arange(padded_num_tokens, device=current_device) // next_n
+        next_n_offset = (
+            torch.arange(padded_num_tokens, device=padded_q_fp8_decode_tokens.device)
+            % next_n
+        )
+        index_end_pos = (
+            decode_metadata.seq_lens[row_indices] - next_n + next_n_offset
+        ).unsqueeze(1)
         # index_end_pos: [B * N, 1]
         mask = positions <= index_end_pos
         # mask: [B * N, L]
-        logits = logits.masked_fill(~mask, float('-inf'))
-        topk_indices = logits.topk(topk_tokens,
-                                   dim=-1)[1].to(torch.int32)  # [B * N, K]
+        logits = logits.masked_fill(~mask, float("-inf"))
+        topk_indices = logits.topk(topk_tokens, dim=-1)[1].to(torch.int32)  # [B * N, K]
         # ensure we don't set indices for the top k
         # that is out of range(masked already)
         # this will happen if context length is shorter than K
@@ -679,9 +720,11 @@ def sparse_attn_indexer(
             # the topk indices removing padded tokens
             topk_indices = unpack_seq_triton(
                 topk_indices.reshape(batch_size, -1, topk_indices.shape[-1]),
-                decode_lens)
-        topk_indices_buffer[:num_decode_tokens, :topk_indices.
-                            shape[-1]] = topk_indices.to(dtype=torch.int32)
+                decode_lens,
+            )
+        topk_indices_buffer[:num_decode_tokens, : topk_indices.shape[-1]] = (
+            topk_indices.to(dtype=torch.int32)
+        )
 
     return topk_indices_buffer
 
@@ -704,11 +747,10 @@ def sparse_attn_indexer_fake(
     # profile run
     # NOTE(Chen): create the max possible flattened_kv. So that
     # profile_run can get correct memory usage.
-    _flattened_kv = torch.empty([total_seq_lens, head_dim + 4],
-                                device=k.device,
-                                dtype=torch.uint8)
-    _k_fp8 = _flattened_kv[..., :head_dim].view(
-        torch.float8_e4m3fn).contiguous()
+    _flattened_kv = torch.empty(
+        [total_seq_lens, head_dim + 4], device=k.device, dtype=torch.uint8
+    )
+    _k_fp8 = _flattened_kv[..., :head_dim].view(torch.float8_e4m3fn).contiguous()
     _k_scale = _flattened_kv[..., head_dim:].view(torch.float32).contiguous()
     return topk_indices_buffer
 
@@ -723,16 +765,17 @@ def sparse_attn_indexer_fake(
 
 
 class Indexer(nn.Module):
-
-    def __init__(self,
-                 vllm_config: VllmConfig,
-                 config: Union[DeepseekV2Config, DeepseekV3Config],
-                 hidden_size: int,
-                 q_lora_rank: int,
-                 quant_config: Optional[QuantizationConfig],
-                 cache_config: Optional[CacheConfig],
-                 topk_indices_buffer: Optional[torch.Tensor],
-                 prefix: str = ""):
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        config: Union[DeepseekV2Config, DeepseekV3Config],
+        hidden_size: int,
+        q_lora_rank: int,
+        quant_config: Optional[QuantizationConfig],
+        cache_config: Optional[CacheConfig],
+        topk_indices_buffer: Optional[torch.Tensor],
+        prefix: str = "",
+    ):
         super().__init__()
         self.vllm_config = vllm_config
         self.config = config
@@ -743,21 +786,24 @@ def __init__(self,
         self.rope_dim = config.qk_rope_head_dim  # 64
         self.q_lora_rank = q_lora_rank  # 1536
         # no tensor parallel, just replicated
-        self.wq_b = ReplicatedLinear(self.q_lora_rank,
-                                     self.head_dim * self.n_head,
-                                     bias=False,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.wq_b")
-        self.wk = ReplicatedLinear(hidden_size,
-                                   self.head_dim,
-                                   bias=False,
-                                   quant_config=quant_config,
-                                   prefix=f"{prefix}.wk")
+        self.wq_b = ReplicatedLinear(
+            self.q_lora_rank,
+            self.head_dim * self.n_head,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.wq_b",
+        )
+        self.wk = ReplicatedLinear(
+            hidden_size,
+            self.head_dim,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.wk",
+        )
         self.k_norm = LayerNorm(self.head_dim, eps=1e-6)
-        self.weights_proj = ReplicatedLinear(hidden_size,
-                                             self.n_head,
-                                             quant_config=None,
-                                             prefix=f"{prefix}.weights_proj")
+        self.weights_proj = ReplicatedLinear(
+            hidden_size, self.n_head, quant_config=None, prefix=f"{prefix}.weights_proj"
+        )
         self.softmax_scale = self.head_dim**-0.5
 
         self.scale_fmt = "ue8m0"
@@ -768,28 +814,31 @@ def __init__(self,
         #       where we store value in fp8 and scale in fp32
         #       per self.quant_block_size element
         self.k_cache = DeepseekV32IndexerCache(
-            head_dim=self.head_dim +
-            self.head_dim // self.quant_block_size * 4,
+            head_dim=self.head_dim + self.head_dim // self.quant_block_size * 4,
             dtype=torch.uint8,
             prefix=f"{prefix}.k_cache",
-            cache_config=cache_config)
+            cache_config=cache_config,
+        )
         self.max_model_len = vllm_config.model_config.max_model_len
         self.prefix = prefix
-        from vllm.v1.attention.backends.mla.indexer import (
-            get_max_prefill_buffer_size)
+        from vllm.v1.attention.backends.mla.indexer import get_max_prefill_buffer_size
+
         self.max_total_seq_len = get_max_prefill_buffer_size(vllm_config)
 
-    def forward(self, hidden_states: torch.Tensor, qr: torch.Tensor, positions,
-                rotary_emb) -> torch.Tensor:
+    def forward(
+        self, hidden_states: torch.Tensor, qr: torch.Tensor, positions, rotary_emb
+    ) -> torch.Tensor:
         q, _ = self.wq_b(qr)
         q = q.view(-1, self.n_head, self.head_dim)
         q_pe, q_nope = torch.split(
-            q, [self.rope_dim, self.head_dim - self.rope_dim], dim=-1)
+            q, [self.rope_dim, self.head_dim - self.rope_dim], dim=-1
+        )
 
         k, _ = self.wk(hidden_states)
         k = self.k_norm(k)
         k_pe, k_nope = torch.split(
-            k, [self.rope_dim, self.head_dim - self.rope_dim], dim=-1)
+            k, [self.rope_dim, self.head_dim - self.rope_dim], dim=-1
+        )
 
         q_pe, k_pe = rotary_emb(positions, q_pe, k_pe.unsqueeze(1))
         q = torch.cat([q_pe, q_nope], dim=-1)
@@ -797,17 +846,19 @@ def forward(self, hidden_states: torch.Tensor, qr: torch.Tensor, positions,
 
         # we only quant q here since k quant is fused with cache insertion
         q = q.view(-1, self.head_dim)
-        q_fp8, q_scale = per_token_group_quant_fp8(q,
-                                                   self.quant_block_size,
-                                                   column_major_scales=False,
-                                                   use_ue8m0=self.scale_fmt
-                                                   is not None)
+        q_fp8, q_scale = per_token_group_quant_fp8(
+            q,
+            self.quant_block_size,
+            column_major_scales=False,
+            use_ue8m0=self.scale_fmt is not None,
+        )
         q_fp8 = q_fp8.view(-1, self.n_head, self.head_dim)
         q_scale = q_scale.view(-1, self.n_head, 1)
 
         weights, _ = self.weights_proj(hidden_states)
-        weights = weights.unsqueeze(
-            -1) * q_scale * self.softmax_scale * self.n_head**-0.5
+        weights = (
+            weights.unsqueeze(-1) * q_scale * self.softmax_scale * self.n_head**-0.5
+        )
         weights = weights.squeeze(-1)
 
         return torch.ops.vllm.sparse_attn_indexer(
@@ -831,7 +882,7 @@ class DeepseekV2MLAAttention(nn.Module):
     """
     Main reference: DeepseekV2 paper, and FlashInfer Implementation
     (https://arxiv.org/abs/2405.04434 and https://github.com/flashinfer-ai/flashinfer/pull/551).
-    
+
         For more info see MLACommonImpl in:
         vllm/v1/attention/backends/mla/utils.py
     """
@@ -881,53 +932,60 @@ def __init__(
                 bias=False,
                 quant_config=quant_config,
                 prefix=f"{prefix}.fused_qkv_a_proj",
-                disable_tp=True)
+                disable_tp=True,
+            )
         else:
             self.kv_a_proj_with_mqa = ReplicatedLinear(
                 self.hidden_size,
                 self.kv_lora_rank + self.qk_rope_head_dim,
                 bias=False,
                 quant_config=quant_config,
-                prefix=f"{prefix}.kv_a_proj_with_mqa")
+                prefix=f"{prefix}.kv_a_proj_with_mqa",
+            )
 
         if self.q_lora_rank is not None:
-            self.q_a_layernorm = RMSNorm(self.q_lora_rank,
-                                         eps=config.rms_norm_eps)
-            self.q_b_proj = ColumnParallelLinear(self.q_lora_rank,
-                                                 self.num_heads *
-                                                 self.qk_head_dim,
-                                                 bias=False,
-                                                 quant_config=quant_config,
-                                                 prefix=f"{prefix}.q_b_proj")
+            self.q_a_layernorm = RMSNorm(self.q_lora_rank, eps=config.rms_norm_eps)
+            self.q_b_proj = ColumnParallelLinear(
+                self.q_lora_rank,
+                self.num_heads * self.qk_head_dim,
+                bias=False,
+                quant_config=quant_config,
+                prefix=f"{prefix}.q_b_proj",
+            )
         else:
-            self.q_proj = ColumnParallelLinear(self.hidden_size,
-                                               self.num_heads *
-                                               self.qk_head_dim,
-                                               bias=False,
-                                               quant_config=quant_config,
-                                               prefix=f"{prefix}.q_proj")
-        self.kv_a_layernorm = RMSNorm(self.kv_lora_rank,
-                                      eps=config.rms_norm_eps)
+            self.q_proj = ColumnParallelLinear(
+                self.hidden_size,
+                self.num_heads * self.qk_head_dim,
+                bias=False,
+                quant_config=quant_config,
+                prefix=f"{prefix}.q_proj",
+            )
+        self.kv_a_layernorm = RMSNorm(self.kv_lora_rank, eps=config.rms_norm_eps)
         self.kv_b_proj = ColumnParallelLinear(
             self.kv_lora_rank,
             self.num_heads * (self.qk_nope_head_dim + self.v_head_dim),
             bias=False,
             quant_config=quant_config,
-            prefix=f"{prefix}.kv_b_proj")
-        self.o_proj = RowParallelLinear(self.num_heads * self.v_head_dim,
-                                        self.hidden_size,
-                                        bias=False,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.o_proj")
+            prefix=f"{prefix}.kv_b_proj",
+        )
+        self.o_proj = RowParallelLinear(
+            self.num_heads * self.v_head_dim,
+            self.hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.o_proj",
+        )
 
         if rope_scaling:
-            rope_scaling["rope_type"] = 'deepseek_yarn'
-        self.rotary_emb = get_rope(qk_rope_head_dim,
-                                   rotary_dim=qk_rope_head_dim,
-                                   max_position=max_position_embeddings,
-                                   base=rope_theta,
-                                   rope_scaling=rope_scaling,
-                                   is_neox_style=False)
+            rope_scaling["rope_type"] = "deepseek_yarn"
+        self.rotary_emb = get_rope(
+            qk_rope_head_dim,
+            rotary_dim=qk_rope_head_dim,
+            max_position=max_position_embeddings,
+            base=rope_theta,
+            rope_scaling=rope_scaling,
+            is_neox_style=False,
+        )
         if rope_scaling:
             mscale_all_dim = rope_scaling.get("mscale_all_dim", False)
             scaling_factor = rope_scaling["factor"]
@@ -937,9 +995,16 @@ def __init__(
         self.is_v32 = hasattr(config, "index_topk")
 
         if self.is_v32:
-            self.indexer = Indexer(vllm_config, config, hidden_size,
-                                   q_lora_rank, quant_config, cache_config,
-                                   topk_indices_buffer, f"{prefix}.indexer")
+            self.indexer = Indexer(
+                vllm_config,
+                config,
+                hidden_size,
+                q_lora_rank,
+                quant_config,
+                cache_config,
+                topk_indices_buffer,
+                f"{prefix}.indexer",
+            )
         else:
             self.indexer = None
 
@@ -949,11 +1014,12 @@ def __init__(
             rotary_emb=self.rotary_emb,
             o_proj=self.o_proj,
             fused_qkv_a_proj=self.fused_qkv_a_proj
-            if self.q_lora_rank is not None else None,
+            if self.q_lora_rank is not None
+            else None,
             kv_a_proj_with_mqa=self.kv_a_proj_with_mqa
-            if self.q_lora_rank is None else None,
-            q_a_layernorm=self.q_a_layernorm
-            if self.q_lora_rank is not None else None,
+            if self.q_lora_rank is None
+            else None,
+            q_a_layernorm=self.q_a_layernorm if self.q_lora_rank is not None else None,
             q_b_proj=self.q_b_proj if self.q_lora_rank is not None else None,
             q_proj=self.q_proj if self.q_lora_rank is None else None,
             indexer=self.indexer,
@@ -985,11 +1051,12 @@ def forward(
 
 
 class DeepseekV2DecoderLayer(nn.Module):
-
-    def __init__(self,
-                 vllm_config: VllmConfig,
-                 prefix: str,
-                 topk_indices_buffer: Optional[torch.Tensor] = None) -> None:
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        prefix: str,
+        topk_indices_buffer: Optional[torch.Tensor] = None,
+    ) -> None:
         super().__init__()
 
         config = vllm_config.model_config.hf_config
@@ -1001,11 +1068,10 @@ def __init__(self,
         self.hidden_size = config.hidden_size
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         # DecoderLayers are created with `make_layers` which passes the prefix
         # with the layer's index.
-        layer_idx = int(prefix.split(sep='.')[-1])
+        layer_idx = int(prefix.split(sep=".")[-1])
         self.layer_idx = layer_idx
         if model_config.use_mla:
             attn_cls = DeepseekV2MLAAttention
@@ -1019,8 +1085,7 @@ def __init__(self,
             qk_nope_head_dim=config.qk_nope_head_dim,
             qk_rope_head_dim=config.qk_rope_head_dim,
             v_head_dim=config.v_head_dim,
-            q_lora_rank=config.q_lora_rank
-            if hasattr(config, "q_lora_rank") else None,
+            q_lora_rank=config.q_lora_rank if hasattr(config, "q_lora_rank") else None,
             kv_lora_rank=config.kv_lora_rank,
             rope_theta=rope_theta,
             rope_scaling=rope_scaling,
@@ -1031,9 +1096,11 @@ def __init__(self,
             topk_indices_buffer=topk_indices_buffer,
         )
 
-        if (config.n_routed_experts is not None
-                and layer_idx >= config.first_k_dense_replace
-                and layer_idx % config.moe_layer_freq == 0):
+        if (
+            config.n_routed_experts is not None
+            and layer_idx >= config.first_k_dense_replace
+            and layer_idx % config.moe_layer_freq == 0
+        ):
             self.mlp = DeepseekV2MoE(
                 config=config,
                 parallel_config=parallel_config,
@@ -1048,10 +1115,10 @@ def __init__(self,
                 quant_config=quant_config,
                 prefix=f"{prefix}.mlp",
             )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
         self.routed_scaling_factor = config.routed_scaling_factor
 
     def forward(
@@ -1065,8 +1132,7 @@ def forward(
             residual = hidden_states.clone()
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
@@ -1076,32 +1142,29 @@ def forward(
             # Fix FP16 overflow
             # We scale both hidden_states and residual before
             # rmsnorm, and rmsnorm result would not affect by scale.
-            hidden_states *= 1. / self.routed_scaling_factor
+            hidden_states *= 1.0 / self.routed_scaling_factor
             if self.layer_idx == 0:
                 # The residual is shared by all layers, we only scale it on
                 # first layer.
-                residual *= 1. / self.routed_scaling_factor
+                residual *= 1.0 / self.routed_scaling_factor
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
 
-        if isinstance(self.mlp,
-                      DeepseekV2MLP) and hidden_states.dtype == torch.float16:
+        if isinstance(self.mlp, DeepseekV2MLP) and hidden_states.dtype == torch.float16:
             # Fix FP16 overflow
             # Scaling the DeepseekV2MLP output, it is the input of
             # input_layernorm of next decoder layer.
             # The scaling of DeepseekV2MOE output would be done in the forward
             # of DeepseekV2MOE
-            hidden_states *= 1. / self.routed_scaling_factor
+            hidden_states *= 1.0 / self.routed_scaling_factor
 
         return hidden_states, residual
 
 
 @support_torch_compile
 class DeepseekV2Model(nn.Module):
-
     fall_back_to_pt_during_load = False
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
@@ -1119,7 +1182,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 vllm_config.scheduler_config.max_num_batched_tokens,
                 topk_tokens,
                 dtype=torch.int32,
-                device="cuda")
+                device="cuda",
+            )
         else:
             topk_indices_buffer = None
 
@@ -1128,23 +1192,26 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 config.vocab_size,
                 config.hidden_size,
                 quant_config=quant_config,
-                prefix=f"{prefix}.embed_tokens")
+                prefix=f"{prefix}.embed_tokens",
+            )
         else:
             self.embed_tokens = PPMissingLayer()
 
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: DeepseekV2DecoderLayer(vllm_config, prefix,
-                                                  topk_indices_buffer),
-            prefix=f"{prefix}.layers")
+            lambda prefix: DeepseekV2DecoderLayer(
+                vllm_config, prefix, topk_indices_buffer
+            ),
+            prefix=f"{prefix}.layers",
+        )
 
         if get_pp_group().is_last_rank:
             self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         else:
             self.norm = PPMissingLayer()
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -1171,17 +1238,15 @@ def forward(
             hidden_states, residual = layer(positions, hidden_states, residual)
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
 
-class DeepseekV2ForCausalLM(nn.Module, SupportsPP, MixtureOfExperts,
-                            SupportsLoRA):
+class DeepseekV2ForCausalLM(nn.Module, SupportsPP, MixtureOfExperts, SupportsLoRA):
     packed_modules_mapping = {
         "gate_up_proj": ["gate_proj", "up_proj"],
     }
@@ -1197,16 +1262,18 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         # initializing DeepseekV2Model, as it is passed inplace to
         # quantization config init and may be used to select the
         # quant_method for relevant layers during initialization.
-        self.fuse_qkv_a_proj = hasattr(
-            config, "q_lora_rank") and config.q_lora_rank is not None
+        self.fuse_qkv_a_proj = (
+            hasattr(config, "q_lora_rank") and config.q_lora_rank is not None
+        )
         if self.fuse_qkv_a_proj:
             self.packed_modules_mapping["fused_qkv_a_proj"] = [
                 "q_a_proj",
                 "kv_a_proj_with_mqa",
             ]
 
-        self.model = DeepseekV2Model(vllm_config=vllm_config,
-                                     prefix=maybe_prefix(prefix, "model"))
+        self.model = DeepseekV2Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         if get_pp_group().is_last_rank:
             self.lm_head = ParallelLMHead(
                 config.vocab_size,
@@ -1218,12 +1285,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head = PPMissingLayer()
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
         self.expert_weights = []
 
         # Set MoE hyperparameters
-        self.num_moe_layers = (config.num_hidden_layers -
-                               config.first_k_dense_replace)
+        self.num_moe_layers = config.num_hidden_layers - config.first_k_dense_replace
         self.num_expert_groups = config.n_group
 
         self.moe_layers: list[FusedMoE] = []
@@ -1272,8 +1339,7 @@ def update_physical_experts_metadata(
         assert self.num_local_physical_experts == num_local_physical_experts
         self.num_physical_experts = num_physical_experts
         self.num_local_physical_experts = num_local_physical_experts
-        self.num_redundant_experts = (num_physical_experts -
-                                      self.num_logical_experts)
+        self.num_redundant_experts = num_physical_experts - self.num_logical_experts
         for layer in self.model.layers:
             if isinstance(layer.mlp, DeepseekV2MoE):
                 moe = layer.mlp
@@ -1292,8 +1358,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -1303,8 +1370,7 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("gate_up_proj", "gate_proj", 0),
@@ -1320,7 +1386,8 @@ def load_weights(self, weights: Iterable[tuple[str,
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
             num_experts=self.config.n_routed_experts,
-            num_redundant_experts=self.num_redundant_experts)
+            num_redundant_experts=self.num_redundant_experts,
+        )
 
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
@@ -1332,7 +1399,7 @@ def load_weights(self, weights: Iterable[tuple[str,
             if spec_layer is not None:
                 continue  # skip spec decode layers for main model
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 # Skip non-stacked layers and experts (experts handled below).
                 if weight_name not in name:
                     continue
@@ -1342,15 +1409,16 @@ def load_weights(self, weights: Iterable[tuple[str,
                 # name will be updated to mlp.experts[0].gate_up_proj, which
                 # will then be updated below in expert_params_mapping
                 # for mlp.experts[0].gate_gate_up_proj, which breaks load.
-                if (("mlp.experts." in name) and name not in params_dict):
+                if ("mlp.experts." in name) and name not in params_dict:
                     continue
                 name_mapped = name.replace(weight_name, param_name)
 
                 # QKV fusion is optional, fall back to normal
                 # weight loading if it's not enabled
                 # if go with fusion option, then update name
-                if ((param_name == "fused_qkv_a_proj")
-                        and name_mapped not in params_dict):
+                if (
+                    param_name == "fused_qkv_a_proj"
+                ) and name_mapped not in params_dict:
                     continue
                 else:
                     name = name_mapped
@@ -1387,14 +1455,17 @@ def load_weights(self, weights: Iterable[tuple[str,
                     # We should ask the weight loader to return success or not
                     # here since otherwise we may skip experts with other
                     # available replicas.
-                    weight_loader = typing.cast(Callable[..., bool],
-                                                param.weight_loader)
-                    success = weight_loader(param,
-                                            loaded_weight,
-                                            name_mapped,
-                                            shard_id=shard_id,
-                                            expert_id=expert_id,
-                                            return_success=True)
+                    weight_loader = typing.cast(
+                        Callable[..., bool], param.weight_loader
+                    )
+                    success = weight_loader(
+                        param,
+                        loaded_weight,
+                        name_mapped,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                        return_success=True,
+                    )
                     if success:
                         name = name_mapped
                         break
@@ -1418,8 +1489,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
 
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
 
@@ -1432,13 +1504,15 @@ class DeepseekV3ForCausalLM(DeepseekV2ForCausalLM):
 
 # Compatibility with
 # https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/blob/main/configuration_deepseek.py
-def get_spec_layer_idx_from_weight_name(config: Union[DeepseekV2Config,
-                                                      DeepseekV3Config],
-                                        weight_name: str) -> Optional[int]:
-    if (hasattr(config, "num_nextn_predict_layers")
-            and config.num_nextn_predict_layers > 0):
+def get_spec_layer_idx_from_weight_name(
+    config: Union[DeepseekV2Config, DeepseekV3Config], weight_name: str
+) -> Optional[int]:
+    if (
+        hasattr(config, "num_nextn_predict_layers")
+        and config.num_nextn_predict_layers > 0
+    ):
         layer_idx = config.num_hidden_layers
         for i in range(config.num_nextn_predict_layers):
-            if weight_name.startswith(f"model.layers.{layer_idx+i}."):
+            if weight_name.startswith(f"model.layers.{layer_idx + i}."):
                 return layer_idx + i
     return None
diff --git a/vllm/model_executor/models/deepseek_vl2.py b/vllm/model_executor/models/deepseek_vl2.py
index 107949df2270..8226e88c47a2 100644
--- a/vllm/model_executor/models/deepseek_vl2.py
+++ b/vllm/model_executor/models/deepseek_vl2.py
@@ -3,6 +3,7 @@
 
 # adapted from https://github.com/deepseek-ai/DeepSeek-VL2/blob/faf18023f24b962b32d9f0a2d89e402a8d383a78/deepseek_vl2/models/modeling_deepseek_vl_v2.py
 """Inference-only Deepseek-VL2 model compatible with HuggingFace weights."""
+
 import math
 from collections.abc import Iterable, Mapping, Sequence
 from typing import Annotated, Literal, Optional, Union
@@ -20,28 +21,44 @@
 from vllm.model_executor.model_loader.utils import set_default_torch_dtype
 from vllm.model_executor.models.transformers import replace_linear_class
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems, MultiModalUUIDDict)
-from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
-                                   ImageSize, MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo,
-                                        MultiModalProcessingInfo,
-                                        PromptReplacement, PromptUpdate)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+    MultiModalUUIDDict,
+)
+from vllm.multimodal.parse import (
+    ImageEmbeddingItems,
+    ImageProcessorItems,
+    ImageSize,
+    MultiModalDataItems,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    MultiModalProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
-from vllm.transformers_utils.configs.deepseek_vl2 import (DeepseekVLV2Config,
-                                                          MlpProjectorConfig,
-                                                          VisionEncoderConfig)
-from vllm.transformers_utils.processors.deepseek_vl2 import (
-    DeepseekVLV2Processor)
+from vllm.transformers_utils.configs.deepseek_vl2 import (
+    DeepseekVLV2Config,
+    MlpProjectorConfig,
+    VisionEncoderConfig,
+)
+from vllm.transformers_utils.processors.deepseek_vl2 import DeepseekVLV2Processor
 from vllm.transformers_utils.tokenizer import cached_tokenizer_from_config
 from vllm.utils import is_list_of
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
-from .utils import (AutoWeightsLoader, WeightsMapper,
-                    init_vllm_registered_model, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 
 # The image token id may be various
 _IMAGE_TOKEN = "<image>"
@@ -56,9 +73,9 @@ class DeepseekVL2ImagePixelInputs(TensorSchema):
         - h: Height of each image
         - w: Width of each image
     """
+
     type: Literal["pixel_values"]
-    data: Annotated[torch.Tensor,
-                    TensorShape("bnp", 3, "h", "w", dynamic_dims={"bnp"})]
+    data: Annotated[torch.Tensor, TensorShape("bnp", 3, "h", "w", dynamic_dims={"bnp"})]
     images_spatial_crop: Annotated[torch.Tensor, TensorShape("bn", 2)]
 
 
@@ -69,51 +86,53 @@ class DeepseekVL2VImageEmbeddingInputs(TensorSchema):
         - f: Image feature size
         - h: Hidden size (must match language model backbone)
     """
+
     type: Literal["image_embeds"]
-    data: Annotated[Union[torch.Tensor, list[torch.Tensor]],
-                    TensorShape("bn", "f", "h")]
+    data: Annotated[
+        Union[torch.Tensor, list[torch.Tensor]], TensorShape("bn", "f", "h")
+    ]
 
 
-DeepseekVL2ImageInputs = Union[DeepseekVL2ImagePixelInputs,
-                               DeepseekVL2VImageEmbeddingInputs]
+DeepseekVL2ImageInputs = Union[
+    DeepseekVL2ImagePixelInputs, DeepseekVL2VImageEmbeddingInputs
+]
 
 
 class MlpProjector(nn.Module):
-
     def __init__(self, cfg: MlpProjectorConfig):
-
         super().__init__()
 
         self.cfg = cfg
-        assert not cfg.token_pooling, (
-            "Token pooling is not supported currently.")
+        assert not cfg.token_pooling, "Token pooling is not supported currently."
 
         if cfg.projector_type == "downsample_mlp_gelu":
             mlp_depth = cfg.depth
             mlp_ratio = cfg.mlp_ratio
             modules = [
                 nn.Linear(
-                    cfg.input_dim * cfg.downsample_ratio *
-                    cfg.downsample_ratio, cfg.n_embed * mlp_ratio)
+                    cfg.input_dim * cfg.downsample_ratio * cfg.downsample_ratio,
+                    cfg.n_embed * mlp_ratio,
+                )
             ]
             for _ in range(1, mlp_depth - 1):
                 modules.append(nn.GELU())
                 modules.append(
-                    nn.Linear(cfg.n_embed * mlp_ratio,
-                              cfg.n_embed * mlp_ratio))
+                    nn.Linear(cfg.n_embed * mlp_ratio, cfg.n_embed * mlp_ratio)
+                )
             modules.append(nn.GELU())
             modules.append(nn.Linear(cfg.n_embed * mlp_ratio, cfg.n_embed))
             modules = nn.Sequential(*modules)
 
         else:
             raise NotImplementedError(
-                f"Unsupported projector type: {cfg.projector_type}")
+                f"Unsupported projector type: {cfg.projector_type}"
+            )
 
         self.layers = modules
 
     def forward(self, x):
         bs, hw, input_dim = x.shape
-        h = w = int((hw)**0.5)
+        h = w = int((hw) ** 0.5)
         """compute padding"""
         if h % self.cfg.downsample_ratio:
             pad = self.cfg.downsample_ratio - h % self.cfg.downsample_ratio
@@ -124,17 +143,18 @@ def forward(self, x):
             x = F.pad(x, (0, 0, 0, pad, 0, pad), "constant", 0)
         """4 to 1 concat"""
         x = x.permute(0, 3, 1, 2)  # B, C, H, W
-        x = F.unfold(x,
-                     kernel_size=self.cfg.downsample_ratio,
-                     stride=self.cfg.downsample_ratio,
-                     padding=0)  # B, C*4, HW // 4
+        x = F.unfold(
+            x,
+            kernel_size=self.cfg.downsample_ratio,
+            stride=self.cfg.downsample_ratio,
+            padding=0,
+        )  # B, C*4, HW // 4
         x = x.permute(0, 2, 1)
 
         return self.layers(x)
 
 
 class DeepseekVL2ProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(DeepseekVLV2Config)
 
@@ -144,11 +164,9 @@ def get_hf_processor(self, **kwargs: object):
     def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
         return {"image": None}
 
-    def get_num_image_tokens(self,
-                             *,
-                             image_width: int,
-                             image_height: int,
-                             cropping: bool = True) -> int:
+    def get_num_image_tokens(
+        self, *, image_width: int, image_height: int, cropping: bool = True
+    ) -> int:
         hf_processor = self.get_hf_processor()
         image_size = hf_processor.image_size
         patch_size = hf_processor.patch_size
@@ -156,9 +174,12 @@ def get_num_image_tokens(self,
 
         if cropping:
             best_width, best_height = hf_processor.select_best_resolution(
-                (image_width, image_height))
-            num_width_tiles, num_height_tiles = (best_width // image_size,
-                                                 best_height // image_size)
+                (image_width, image_height)
+            )
+            num_width_tiles, num_height_tiles = (
+                best_width // image_size,
+                best_height // image_size,
+            )
         else:
             num_width_tiles = num_height_tiles = 1
 
@@ -171,15 +192,16 @@ def get_num_image_tokens(self,
     def get_image_size_with_most_features(self) -> ImageSize:
         hf_config = self.get_hf_config()
         candidate_resolutions = hf_config.candidate_resolutions
-        height, width = max(candidate_resolutions,
-                            key=lambda x: self.get_num_image_tokens(
-                                image_width=x[1], image_height=x[0]))
+        height, width = max(
+            candidate_resolutions,
+            key=lambda x: self.get_num_image_tokens(
+                image_width=x[1], image_height=x[0]
+            ),
+        )
         return ImageSize(width=width, height=height)
 
 
-class DeepseekVL2DummyInputsBuilder(
-        BaseDummyInputsBuilder[DeepseekVL2ProcessingInfo]):
-
+class DeepseekVL2DummyInputsBuilder(BaseDummyInputsBuilder[DeepseekVL2ProcessingInfo]):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -201,17 +223,18 @@ def get_dummy_mm_data(
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=max_image_size.width,
-                                   height=max_image_size.height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=max_image_size.width,
+                height=max_image_size.height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class DeepseekVL2MultiModalProcessor(
-        BaseMultiModalProcessor[DeepseekVL2ProcessingInfo]):
-
+    BaseMultiModalProcessor[DeepseekVL2ProcessingInfo]
+):
     def _call_hf_processor(
         self,
         prompt: str,
@@ -221,9 +244,7 @@ def _call_hf_processor(
     ) -> BatchFeature:
         if not mm_data:
             tokenizer = self.info.get_tokenizer()
-            return tokenizer(prompt,
-                             add_special_tokens=True,
-                             return_tensors="pt")
+            return tokenizer(prompt, add_special_tokens=True, return_tensors="pt")
 
         processed_outputs = super()._call_hf_processor(
             prompt=prompt,
@@ -233,7 +254,8 @@ def _call_hf_processor(
         )
 
         processed_outputs["num_patches"] = (
-            processed_outputs["images_spatial_crop"].prod(-1) + 1)
+            processed_outputs["images_spatial_crop"].prod(-1) + 1
+        )
 
         return processed_outputs
 
@@ -245,8 +267,7 @@ def _get_mm_fields_config(
         num_patches = hf_inputs.get("num_patches", torch.empty(0))
 
         return dict(
-            pixel_values=MultiModalFieldConfig.flat_from_sizes(
-                "image", num_patches),
+            pixel_values=MultiModalFieldConfig.flat_from_sizes("image", num_patches),
             images_spatial_crop=MultiModalFieldConfig.batched("image"),
             image_embeds=MultiModalFieldConfig.batched("image"),
         )
@@ -264,7 +285,8 @@ def _get_prompt_updates(
 
         def get_replacement_deepseek_vl2(item_idx: int):
             images = mm_items.get_items(
-                "image", (ImageEmbeddingItems, ImageProcessorItems))
+                "image", (ImageEmbeddingItems, ImageProcessorItems)
+            )
 
             if isinstance(images, ImageEmbeddingItems):
                 num_image_tokens = images.get_feature_size(item_idx)
@@ -319,13 +341,16 @@ def _cached_apply_hf_processor(
 @MULTIMODAL_REGISTRY.register_processor(
     DeepseekVL2MultiModalProcessor,
     info=DeepseekVL2ProcessingInfo,
-    dummy_inputs=DeepseekVL2DummyInputsBuilder)
+    dummy_inputs=DeepseekVL2DummyInputsBuilder,
+)
 class DeepseekVLV2ForCausalLM(nn.Module, SupportsMultiModal, SupportsPP):
     merge_by_field_config = True
 
-    hf_to_vllm_mapper = WeightsMapper(orig_to_new_prefix={
-        "language.": "language_model.",
-    })
+    hf_to_vllm_mapper = WeightsMapper(
+        orig_to_new_prefix={
+            "language.": "language_model.",
+        }
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -351,9 +376,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         tokenizer = cached_tokenizer_from_config(model_config)
         self.image_token_id: int = tokenizer.vocab[_IMAGE_TOKEN]
 
-        self.vision = self._init_vision_module(self.vision_config,
-                                               quant_config,
-                                               maybe_prefix(prefix, "vision"))
+        self.vision = self._init_vision_module(
+            self.vision_config, quant_config, maybe_prefix(prefix, "vision")
+        )
 
         self.projector = MlpProjector(self.projector_config)
         self.tile_tag = config.tile_tag
@@ -361,14 +386,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         # special token for image token sequence format
         embed_std = 1 / torch.sqrt(
-            torch.tensor(self.projector_config.n_embed, dtype=torch.float32))
+            torch.tensor(self.projector_config.n_embed, dtype=torch.float32)
+        )
         if self.tile_tag == "2D":
             # <|view_seperator|>, <|\n|>
             self.image_newline = nn.Parameter(
-                torch.randn(self.projector_config.n_embed) * embed_std)
+                torch.randn(self.projector_config.n_embed) * embed_std
+            )
             # This is a typo in original implementation
             self.view_seperator = nn.Parameter(
-                torch.randn(self.projector_config.n_embed) * embed_std)
+                torch.randn(self.projector_config.n_embed) * embed_std
+            )
         else:
             raise ValueError(
                 f"Only 2D tile_tag is supported currently, got: {self.tile_tag}"
@@ -389,19 +417,19 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _get_parent_and_attr(self, root: torch.nn.Module, dotted_name: str):
         """Return (parent_module, final_attr_name) for a dotted module path."""
-        names = dotted_name.split('.')
+        names = dotted_name.split(".")
         parent = root
         for n in names[:-1]:
             parent = getattr(parent, n)
         return parent, names[-1]
 
-    #patch for timm ViT instance to support tensor parallel
-    def patch_vit_for_tp(self, vit: torch.nn.Module,
-                         quant_config: QuantizationConfig):
+    # patch for timm ViT instance to support tensor parallel
+    def patch_vit_for_tp(self, vit: torch.nn.Module, quant_config: QuantizationConfig):
         try:
             import timm
         except ImportError as e:
@@ -411,17 +439,14 @@ def patch_vit_for_tp(self, vit: torch.nn.Module,
             if isinstance(module, nn.Linear):
                 parent, attr_name = self._get_parent_and_attr(vit, name)
                 if isinstance(parent, timm.layers.Mlp) and attr_name == "fc1":
-                    new_linear = replace_linear_class(module,
-                                                      "colwise",
-                                                      quant_config,
-                                                      prefix=name)
+                    new_linear = replace_linear_class(
+                        module, "colwise", quant_config, prefix=name
+                    )
                     setattr(parent, attr_name, new_linear)
-                elif isinstance(parent,
-                                timm.layers.Mlp) and attr_name == "fc2":
-                    new_linear = replace_linear_class(module,
-                                                      "rowwise",
-                                                      quant_config,
-                                                      prefix=name)
+                elif isinstance(parent, timm.layers.Mlp) and attr_name == "fc2":
+                    new_linear = replace_linear_class(
+                        module, "rowwise", quant_config, prefix=name
+                    )
                     setattr(parent, attr_name, new_linear)
 
         return vit
@@ -454,7 +479,8 @@ def _init_vision_module(
         return model
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[DeepseekVL2ImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[DeepseekVL2ImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         images_spatial_crop = kwargs.pop("images_spatial_crop", None)
         image_embeds = kwargs.pop("image_embeds", None)
@@ -471,7 +497,8 @@ def _parse_and_validate_image_input(
                 resolve_bindings={
                     "h": expected_h,
                     "w": expected_w,
-                })
+                },
+            )
 
         if image_embeds is not None:
             return DeepseekVL2VImageEmbeddingInputs(
@@ -509,8 +536,9 @@ def _pixel_values_to_embedding(
             global_features = images_embeds[tile_index]
 
             # [num_height_tiles * num_width_tiles, hw, D]
-            local_features = images_embeds[tile_index + 1:tile_index + 1 +
-                                           num_tiles_in_image]
+            local_features = images_embeds[
+                tile_index + 1 : tile_index + 1 + num_tiles_in_image
+            ]
             tile_index += num_tiles_in_image + 1
 
             # format global and local features
@@ -522,8 +550,7 @@ def _pixel_values_to_embedding(
             new_lines_in_global = repeat(self.image_newline, "d -> h 1 d", h=h)
 
             # cat([h, w, D], [h, 1, D], dim=1) -> [h, w + 1, D]
-            global_features = torch.cat([global_features, new_lines_in_global],
-                                        dim=1)
+            global_features = torch.cat([global_features, new_lines_in_global], dim=1)
 
             # [h, w + 1, D] -> [h * (w + 1), D]
             global_features = global_features.view(-1, n_dim)
@@ -531,22 +558,22 @@ def _pixel_values_to_embedding(
             # ----------------- local view add newline -----------------
             # [num_height_tiles * num_width_tiles, h * w, D] ->
             # [num_height_tiles * h, num_width_tiles * w, D]
-            local_features = rearrange(local_features,
-                                       "(th tw) (h w) d -> (th h) (tw w) d",
-                                       th=num_height_tiles,
-                                       tw=num_width_tiles,
-                                       h=h,
-                                       w=w)
+            local_features = rearrange(
+                local_features,
+                "(th tw) (h w) d -> (th h) (tw w) d",
+                th=num_height_tiles,
+                tw=num_width_tiles,
+                h=h,
+                w=w,
+            )
 
             # [D] -> [num_height_tiles * h, 1, D]
-            new_lines_in_local = repeat(self.image_newline,
-                                        "d -> (th h) 1 d",
-                                        th=num_height_tiles,
-                                        h=h)
+            new_lines_in_local = repeat(
+                self.image_newline, "d -> (th h) 1 d", th=num_height_tiles, h=h
+            )
 
             # [num_height_tiles * h, num_width_tiles * w + 1, D]
-            local_features = torch.cat([local_features, new_lines_in_local],
-                                       dim=1)
+            local_features = torch.cat([local_features, new_lines_in_local], dim=1)
 
             # [num_height_tiles * h, num_width_tiles * w + 1, D]
             #   --> [(num_height_tiles * h) * (num_width_tiles * w + 1), D]
@@ -554,23 +581,28 @@ def _pixel_values_to_embedding(
 
             # merge global and local tiles
             if self.global_view_pos == "head":
-                global_local_features = torch.cat([
-                    global_features,
-                    self.view_seperator[None, :],
-                    local_features,
-                ])
+                global_local_features = torch.cat(
+                    [
+                        global_features,
+                        self.view_seperator[None, :],
+                        local_features,
+                    ]
+                )
             else:
-                global_local_features = torch.cat([
-                    local_features,
-                    self.view_seperator[None, :],
-                    global_features,
-                ])
+                global_local_features = torch.cat(
+                    [
+                        local_features,
+                        self.view_seperator[None, :],
+                        global_features,
+                    ]
+                )
 
             vision_embeddings.append(global_local_features)
         return vision_embeddings
 
     def _process_image_input(
-            self, image_input: DeepseekVL2ImageInputs) -> list[torch.Tensor]:
+        self, image_input: DeepseekVL2ImageInputs
+    ) -> list[torch.Tensor]:
         if image_input["type"] == "image_embeds":
             image_data = image_input["data"]
             if is_list_of(image_data, torch.Tensor):
@@ -588,33 +620,33 @@ def _process_image_input(
         images_spatial_crop = image_input["images_spatial_crop"]
 
         return self._pixel_values_to_embedding(
-            pixel_values=pixel_values, images_spatial_crop=images_spatial_crop)
+            pixel_values=pixel_values, images_spatial_crop=images_spatial_crop
+        )
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
         vision_embeddings = self._process_image_input(image_input)
         return vision_embeddings
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs: object):
-
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs: object,
+    ):
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.language_model(input_ids,
-                                            positions,
-                                            intermediate_tensors,
-                                            inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
 
         return hidden_states
 
@@ -624,10 +656,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
-        autoloaded_weights = loader.load_weights(weights,
-                                                 mapper=self.hf_to_vllm_mapper)
+        autoloaded_weights = loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
         return autoloaded_weights
diff --git a/vllm/model_executor/models/dots1.py b/vllm/model_executor/models/dots1.py
index 2a09234b59ed..1ae7457fb215 100644
--- a/vllm/model_executor/models/dots1.py
+++ b/vllm/model_executor/models/dots1.py
@@ -24,6 +24,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only dots1 model."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Any, Optional, Union
@@ -35,33 +36,45 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, ModelConfig, VllmConfig
-from vllm.distributed import (get_pp_group,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_reduce)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_reduce,
+)
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class Dots1MLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -73,19 +86,24 @@ def __init__(
     ) -> None:
         super().__init__()
         self.gate_up_proj = MergedColumnParallelLinear(
-            hidden_size, [intermediate_size] * 2,
+            hidden_size,
+            [intermediate_size] * 2,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.gate_up_proj",
+        )
+        self.down_proj = RowParallelLinear(
+            intermediate_size,
+            hidden_size,
             bias=False,
             quant_config=quant_config,
-            prefix=f"{prefix}.gate_up_proj")
-        self.down_proj = RowParallelLinear(intermediate_size,
-                                           hidden_size,
-                                           bias=False,
-                                           quant_config=quant_config,
-                                           reduce_results=reduce_results,
-                                           prefix=f"{prefix}.down_proj")
+            reduce_results=reduce_results,
+            prefix=f"{prefix}.down_proj",
+        )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -96,7 +114,6 @@ def forward(self, x):
 
 
 class Dots1MoE(nn.Module):
-
     def __init__(
         self,
         config: Dots1Config,
@@ -109,17 +126,22 @@ def __init__(
         self.n_shared_experts = config.n_shared_experts
 
         if config.hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {config.hidden_act}. "
-                             "Only silu is supported for now.")
-
-        self.gate = ReplicatedLinear(config.hidden_size,
-                                     config.n_routed_experts,
-                                     bias=False,
-                                     quant_config=None,
-                                     prefix=f"{prefix}.gate")
+            raise ValueError(
+                f"Unsupported activation: {config.hidden_act}. "
+                "Only silu is supported for now."
+            )
+
+        self.gate = ReplicatedLinear(
+            config.hidden_size,
+            config.n_routed_experts,
+            bias=False,
+            quant_config=None,
+            prefix=f"{prefix}.gate",
+        )
         if config.topk_method == "noaux_tc":
-            self.gate.e_score_correction_bias = (nn.Parameter(
-                torch.empty(config.n_routed_experts)))
+            self.gate.e_score_correction_bias = nn.Parameter(
+                torch.empty(config.n_routed_experts)
+            )
         else:
             self.gate.e_score_correction_bias = None
 
@@ -138,11 +160,11 @@ def __init__(
             scoring_func=config.scoring_func,
             # we do scaling outside, set factor to 1.0 to avoid double mul
             routed_scaling_factor=1.0,
-            e_score_correction_bias=self.gate.e_score_correction_bias)
+            e_score_correction_bias=self.gate.e_score_correction_bias,
+        )
 
         if config.n_shared_experts is not None:
-            intermediate_size = (config.moe_intermediate_size *
-                                 config.n_shared_experts)
+            intermediate_size = config.moe_intermediate_size * config.n_shared_experts
             self.shared_experts = Dots1MLP(
                 hidden_size=config.hidden_size,
                 intermediate_size=intermediate_size,
@@ -158,19 +180,18 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         if self.n_shared_experts is not None:
             shared_output = self.shared_experts(hidden_states)
         router_logits, _ = self.gate(hidden_states)
-        final_hidden_states = self.experts(
-            hidden_states=hidden_states,
-            router_logits=router_logits) * self.routed_scaling_factor
+        final_hidden_states = (
+            self.experts(hidden_states=hidden_states, router_logits=router_logits)
+            * self.routed_scaling_factor
+        )
         if shared_output is not None:
             final_hidden_states = final_hidden_states + shared_output
         if self.tp_size > 1:
-            final_hidden_states = tensor_model_parallel_all_reduce(
-                final_hidden_states)
+            final_hidden_states = tensor_model_parallel_all_reduce(final_hidden_states)
         return final_hidden_states.view(num_tokens, hidden_dim)
 
 
 class Dots1Attention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -200,8 +221,7 @@ def __init__(
             # the KV heads across multiple tensor parallel GPUs.
             assert tp_size % self.total_num_kv_heads == 0
         self.num_kv_heads = max(1, self.total_num_kv_heads // tp_size)
-        self.head_dim = getattr(config, "head_dim",
-                                hidden_size // self.total_num_heads)
+        self.head_dim = getattr(config, "head_dim", hidden_size // self.total_num_heads)
         self.q_size = self.num_heads * self.head_dim
         self.kv_size = self.num_kv_heads * self.head_dim
         self.scaling = self.head_dim**-0.5
@@ -244,14 +264,15 @@ def __init__(
         self.q_norm = RMSNorm(self.head_dim, eps=config.rms_norm_eps)
         self.k_norm = RMSNorm(self.head_dim, eps=config.rms_norm_eps)
 
-    def forward(self, positions: torch.Tensor,
-                hidden_states: torch.Tensor) -> torch.Tensor:
+    def forward(
+        self, positions: torch.Tensor, hidden_states: torch.Tensor
+    ) -> torch.Tensor:
         qkv, _ = self.qkv_proj(hidden_states)
         q, k, v = qkv.split([self.q_size, self.kv_size, self.kv_size], dim=-1)
-        q = self.q_norm(q.reshape(-1, self.num_heads,
-                                  self.head_dim)).reshape(q.shape)
-        k = self.k_norm(k.reshape(-1, self.num_kv_heads,
-                                  self.head_dim)).reshape(k.shape)
+        q = self.q_norm(q.reshape(-1, self.num_heads, self.head_dim)).reshape(q.shape)
+        k = self.k_norm(k.reshape(-1, self.num_kv_heads, self.head_dim)).reshape(
+            k.shape
+        )
         q, k = self.rotary_emb(positions, q, k)
         attn_output = self.attn(q, k, v)
         output, _ = self.o_proj(attn_output)
@@ -259,7 +280,6 @@ def forward(self, positions: torch.Tensor,
 
 
 class Dots1DecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Dots1Config,
@@ -272,9 +292,8 @@ def __init__(
         self.hidden_size = config.hidden_size
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
-        layer_idx = int(prefix.split(sep='.')[-1])
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
+        layer_idx = int(prefix.split(sep=".")[-1])
         self.layer_idx = layer_idx
 
         self.self_attn = Dots1Attention(
@@ -289,12 +308,14 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.self_attn",
         )
-        if (config.n_routed_experts is not None
-                and layer_idx >= config.first_k_dense_replace
-                and layer_idx % config.moe_layer_freq == 0):
-            self.mlp = Dots1MoE(config=config,
-                                quant_config=quant_config,
-                                prefix=f"{prefix}.mlp")
+        if (
+            config.n_routed_experts is not None
+            and layer_idx >= config.first_k_dense_replace
+            and layer_idx % config.moe_layer_freq == 0
+        ):
+            self.mlp = Dots1MoE(
+                config=config, quant_config=quant_config, prefix=f"{prefix}.mlp"
+            )
         else:
             self.mlp = Dots1MLP(
                 hidden_size=config.hidden_size,
@@ -303,10 +324,10 @@ def __init__(
                 quant_config=quant_config,
                 prefix=f"{prefix}.mlp",
             )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
         self.routed_scaling_factor = config.routed_scaling_factor
 
     def forward(
@@ -319,19 +340,15 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
-        hidden_states = self.self_attn(positions=positions,
-                                       hidden_states=hidden_states)
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
+        hidden_states = self.self_attn(positions=positions, hidden_states=hidden_states)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
 
 @support_torch_compile
 class Dots1Model(nn.Module):
-
     fall_back_to_pt_during_load = False
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
@@ -350,7 +367,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 config.vocab_size,
                 config.hidden_size,
                 quant_config=quant_config,
-                prefix=f"{prefix}.embed_tokens")
+                prefix=f"{prefix}.embed_tokens",
+            )
         else:
             self.embed_tokens = PPMissingLayer()
 
@@ -363,15 +381,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 cache_config=cache_config,
                 quant_config=quant_config,
             ),
-            prefix=f"{prefix}.layers")
+            prefix=f"{prefix}.layers",
+        )
 
         if get_pp_group().is_last_rank:
             self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         else:
             self.norm = PPMissingLayer()
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -400,10 +419,9 @@ def forward(
                 residual,
             )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
@@ -412,10 +430,10 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
             ckpt_gate_proj_name="gate_proj",
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
-            num_experts=self.config.n_routed_experts)
+            num_experts=self.config.n_routed_experts,
+        )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             ("qkv_proj", "q_proj", "q"),
             ("qkv_proj", "k_proj", "k"),
@@ -430,10 +448,10 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
-                if (("mlp.experts." in name) and name not in params_dict):
+                if ("mlp.experts." in name) and name not in params_dict:
                     continue
                 name = name.replace(weight_name, param_name)
                 if name.endswith(".bias") and name not in params_dict:
@@ -456,11 +474,13 @@ def load_weights(self, weights: Iterable[tuple[str,
 
                     param = params_dict[name]
                     weight_loader = param.weight_loader
-                    weight_loader(param,
-                                  loaded_weight,
-                                  name,
-                                  shard_id=shard_id,
-                                  expert_id=expert_id)
+                    weight_loader(
+                        param,
+                        loaded_weight,
+                        name,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                    )
                     break
                 else:
                     if name.endswith(".bias") and name not in params_dict:
@@ -471,15 +491,15 @@ def load_weights(self, weights: Iterable[tuple[str,
                     if is_pp_missing_parameter(name, self):
                         continue
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class Dots1ForCausalLM(nn.Module, SupportsPP, SupportsLoRA):
-
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -498,19 +518,22 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.model = Dots1Model(vllm_config=vllm_config,
-                                prefix=maybe_prefix(prefix, "model"))
+        self.model = Dots1Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         if get_pp_group().is_last_rank:
-            self.lm_head = ParallelLMHead(config.vocab_size,
-                                          config.hidden_size,
-                                          quant_config=quant_config,
-                                          prefix=maybe_prefix(
-                                              prefix, "lm_head"))
+            self.lm_head = ParallelLMHead(
+                config.vocab_size,
+                config.hidden_size,
+                quant_config=quant_config,
+                prefix=maybe_prefix(prefix, "lm_head"),
+            )
         else:
             self.lm_head = PPMissingLayer()
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -537,8 +560,7 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
 
diff --git a/vllm/model_executor/models/dots_ocr.py b/vllm/model_executor/models/dots_ocr.py
index cda46d123901..ed4be0458733 100644
--- a/vllm/model_executor/models/dots_ocr.py
+++ b/vllm/model_executor/models/dots_ocr.py
@@ -10,40 +10,52 @@
 from transformers.models.qwen2_vl import Qwen2VLProcessor
 
 from vllm.attention.backends.registry import _Backend
-from vllm.attention.layer import (check_upstream_fa_availability,
-                                  maybe_get_vit_flash_attn_backend)
+from vllm.attention.layer import (
+    check_upstream_fa_availability,
+    maybe_get_vit_flash_attn_backend,
+)
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import utils as dist_utils
 from vllm.distributed.parallel_state import (
-    get_tensor_model_parallel_rank, get_tensor_model_parallel_world_size)
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
-from vllm.model_executor.models.interfaces import (MultiModalEmbeddings,
-                                                   SupportsLoRA,
-                                                   SupportsMultiModal,
-                                                   SupportsPP)
+from vllm.model_executor.models.interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.model_executor.models.qwen2 import Qwen2ForCausalLM
 from vllm.model_executor.models.qwen2_5_vl import Qwen2_5_VisionAttention
-from vllm.model_executor.models.qwen2_vl import (Qwen2VLDummyInputsBuilder,
-                                                 Qwen2VLMultiModalProcessor,
-                                                 Qwen2VLProcessingInfo)
-from vllm.model_executor.models.utils import (AutoWeightsLoader, WeightsMapper,
-                                              init_vllm_registered_model,
-                                              maybe_prefix)
+from vllm.model_executor.models.qwen2_vl import (
+    Qwen2VLDummyInputsBuilder,
+    Qwen2VLMultiModalProcessor,
+    Qwen2VLProcessingInfo,
+)
+from vllm.model_executor.models.utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 from vllm.model_executor.models.vision import get_vit_attn_backend
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import MultiModalDataDict
 from vllm.sequence import IntermediateTensors
-from vllm.transformers_utils.configs.dotsocr import (DotsOCRConfig,
-                                                     DotsVisionConfig)
+from vllm.transformers_utils.configs.dotsocr import DotsOCRConfig, DotsVisionConfig
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .vision import run_dp_sharded_mrope_vision_model
@@ -59,6 +71,7 @@ class DotsOCRImagePixelInputs(TensorSchema):
         - ni: Number of images
         - cps: Number of channels * patch_size * patch_size
     """
+
     type: Literal["pixel_values"]
 
     pixel_values: Annotated[torch.Tensor, TensorShape("np", "cps")]
@@ -72,18 +85,17 @@ class DotsOCRImageEmbeddingInputs(TensorSchema):
         - hs: Hidden size
         - ni: Number of images
     """
+
     type: Literal["image_embeds"]
 
     image_embeds: Annotated[torch.Tensor, TensorShape("nf", "hs")]
     image_grid_thw: Annotated[torch.Tensor, TensorShape("ni", 3)]
 
 
-DotsOCRImageInputs = Union[DotsOCRImagePixelInputs,
-                           DotsOCRImageEmbeddingInputs]
+DotsOCRImageInputs = Union[DotsOCRImagePixelInputs, DotsOCRImageEmbeddingInputs]
 
 
 class DotsOCRDummyInputsBuilder(Qwen2VLDummyInputsBuilder):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
         return IMAGE_TOKEN * num_images
@@ -102,23 +114,22 @@ def get_dummy_mm_data(
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
         }
 
 
 class DotsOCRProcessingInfo(Qwen2VLProcessingInfo):
-
     def get_hf_config(self) -> DotsOCRConfig:
         config = self.ctx.get_hf_config()
-        if not config.__class__.__name__ == 'DotsOCRConfig':
+        if not config.__class__.__name__ == "DotsOCRConfig":
             raise TypeError(f"Expected DotsOCRConfig, got {type(config)}")
 
-        if hasattr(config, "vision_config") and isinstance(
-                config.vision_config, dict):
+        if hasattr(config, "vision_config") and isinstance(config.vision_config, dict):
             config.vision_config = DotsVisionConfig(**config.vision_config)
 
         return config
@@ -138,8 +149,7 @@ def get_hf_processor(
         self,
         **kwargs: object,
     ) -> Qwen2VLProcessor:
-        self.get_tokenizer(
-        ).image_token = IMAGE_TOKEN  # Ensure image token is set
+        self.get_tokenizer().image_token = IMAGE_TOKEN  # Ensure image token is set
         processor = self.ctx.get_hf_processor(
             Qwen2VLProcessor,
             **kwargs,
@@ -151,13 +161,14 @@ def get_hf_processor(
 
 def rotate_half(x):
     """Rotates half the hidden dims of the input."""
-    x1 = x[..., :x.shape[-1] // 2]
-    x2 = x[..., x.shape[-1] // 2:]
+    x1 = x[..., : x.shape[-1] // 2]
+    x2 = x[..., x.shape[-1] // 2 :]
     return torch.cat((-x2, x1), dim=-1)
 
 
-def apply_rotary_pos_emb_vision(tensor: torch.Tensor,
-                                freqs: torch.Tensor) -> torch.Tensor:
+def apply_rotary_pos_emb_vision(
+    tensor: torch.Tensor, freqs: torch.Tensor
+) -> torch.Tensor:
     orig_dtype = tensor.dtype
     tensor = tensor.float()
 
@@ -175,23 +186,20 @@ def apply_rotary_pos_emb_vision(tensor: torch.Tensor,
 
 
 class VisionRotaryEmbedding(nn.Module):
-
     def __init__(self, dim: int, theta: float = 10000.0) -> None:
         super().__init__()
-        inv_freq = 1.0 / (theta
-                          **(torch.arange(0, dim, 2, dtype=torch.float) / dim))
+        inv_freq = 1.0 / (theta ** (torch.arange(0, dim, 2, dtype=torch.float) / dim))
         self.register_buffer("inv_freq", inv_freq, persistent=False)
 
     def forward(self, seqlen: int) -> torch.Tensor:
-        seq = torch.arange(seqlen,
-                           device=self.inv_freq.device,
-                           dtype=self.inv_freq.dtype)
+        seq = torch.arange(
+            seqlen, device=self.inv_freq.device, dtype=self.inv_freq.dtype
+        )
         freqs = torch.outer(seq, self.inv_freq)
         return freqs
 
 
 class PatchMerger(nn.Module):
-
     def __init__(
         self,
         dim: int,
@@ -210,19 +218,23 @@ def __init__(
             self.ln_q = RMSNorm(context_dim, eps=1e-6)
 
         self.mlp = nn.Sequential(
-            ColumnParallelLinear(self.hidden_size,
-                                 self.hidden_size,
-                                 bias=True,
-                                 return_bias=False,
-                                 prefix=f"{prefix}.0",
-                                 disable_tp=use_data_parallel),
+            ColumnParallelLinear(
+                self.hidden_size,
+                self.hidden_size,
+                bias=True,
+                return_bias=False,
+                prefix=f"{prefix}.0",
+                disable_tp=use_data_parallel,
+            ),
             nn.GELU(),
-            RowParallelLinear(self.hidden_size,
-                              dim,
-                              bias=True,
-                              return_bias=False,
-                              prefix=f"{prefix}.2",
-                              disable_tp=use_data_parallel),
+            RowParallelLinear(
+                self.hidden_size,
+                dim,
+                bias=True,
+                return_bias=False,
+                prefix=f"{prefix}.2",
+                disable_tp=use_data_parallel,
+            ),
         )
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -234,26 +246,28 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class DotsVisionAttention(nn.Module):
-
-    def __init__(self,
-                 config,
-                 dim: int,
-                 num_heads: int = 16,
-                 bias: bool = True,
-                 *,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "",
-                 use_data_parallel: bool = False) -> None:
+    def __init__(
+        self,
+        config,
+        dim: int,
+        num_heads: int = 16,
+        bias: bool = True,
+        *,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+        use_data_parallel: bool = False,
+    ) -> None:
         super().__init__()
 
         self.embed_dim = dim
-        self.tp_size = (1 if use_data_parallel else
-                        get_tensor_model_parallel_world_size())
-        self.tp_rank = (0 if use_data_parallel else
-                        get_tensor_model_parallel_rank())
+        self.tp_size = (
+            1 if use_data_parallel else get_tensor_model_parallel_world_size()
+        )
+        self.tp_rank = 0 if use_data_parallel else get_tensor_model_parallel_rank()
         self.hidden_size_per_attention_head = dist_utils.divide(dim, num_heads)
         self.num_attention_heads_per_partition = dist_utils.divide(
-            num_heads, self.tp_size)
+            num_heads, self.tp_size
+        )
         # qkv/proj follow Qwen2-VL style; bias controlled by arg
         self.qkv = QKVParallelLinear(
             hidden_size=dim,
@@ -262,31 +276,40 @@ def __init__(self,
             bias=bias,
             quant_config=quant_config,
             prefix=f"{prefix}.qkv",
-            disable_tp=use_data_parallel)
-        self.proj = RowParallelLinear(input_size=dim,
-                                      output_size=dim,
-                                      bias=bias,
-                                      quant_config=quant_config,
-                                      prefix=f"{prefix}.proj",
-                                      disable_tp=use_data_parallel)
+            disable_tp=use_data_parallel,
+        )
+        self.proj = RowParallelLinear(
+            input_size=dim,
+            output_size=dim,
+            bias=bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.proj",
+            disable_tp=use_data_parallel,
+        )
         # Select attention backend
         self.attn_backend = get_vit_attn_backend(
-            self.hidden_size_per_attention_head, torch.get_default_dtype())
+            self.hidden_size_per_attention_head, torch.get_default_dtype()
+        )
         self.use_upstream_fa = False
 
-        self.attn_backend, self.flash_attn_varlen_func \
-            = maybe_get_vit_flash_attn_backend(
+        self.attn_backend, self.flash_attn_varlen_func = (
+            maybe_get_vit_flash_attn_backend(
                 self.attn_backend,
                 self.use_upstream_fa,
             )
+        )
         if self.attn_backend not in {
-                _Backend.FLASH_ATTN, _Backend.TORCH_SDPA, _Backend.XFORMERS,
-                _Backend.ROCM_AITER_FA
+            _Backend.FLASH_ATTN,
+            _Backend.TORCH_SDPA,
+            _Backend.XFORMERS,
+            _Backend.ROCM_AITER_FA,
         }:
             raise RuntimeError(
-                f"Unsupported vision attention backend: {self.attn_backend}")
+                f"Unsupported vision attention backend: {self.attn_backend}"
+            )
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA
+            _Backend.FLASH_ATTN,
+            _Backend.ROCM_AITER_FA,
         }
 
     def forward(
@@ -317,18 +340,23 @@ def forward(
             q_ = q.reshape(bs * q.shape[1], q.shape[2], q.shape[3])
             k_ = k.reshape(bs * k.shape[1], k.shape[2], k.shape[3])
             v_ = v.reshape(bs * v.shape[1], v.shape[2], v.shape[3])
-            output = self.flash_attn_varlen_func(q_,
-                                                 k_,
-                                                 v_,
-                                                 cu_seqlens_q=cu_seqlens,
-                                                 cu_seqlens_k=cu_seqlens,
-                                                 max_seqlen_q=max_seqlen,
-                                                 max_seqlen_k=max_seqlen,
-                                                 dropout_p=0.0,
-                                                 causal=False)
-            context_layer = output.view(bs, -1,
-                                        self.num_attention_heads_per_partition,
-                                        self.hidden_size_per_attention_head)
+            output = self.flash_attn_varlen_func(
+                q_,
+                k_,
+                v_,
+                cu_seqlens_q=cu_seqlens,
+                cu_seqlens_k=cu_seqlens,
+                max_seqlen_q=max_seqlen,
+                max_seqlen_k=max_seqlen,
+                dropout_p=0.0,
+                causal=False,
+            )
+            context_layer = output.view(
+                bs,
+                -1,
+                self.num_attention_heads_per_partition,
+                self.hidden_size_per_attention_head,
+            )
         elif self.attn_backend == _Backend.TORCH_SDPA:
             outputs = []
             for i in range(1, len(cu_seqlens)):
@@ -337,21 +365,20 @@ def forward(
                 q_i = q[:, s:e].permute(0, 2, 1, 3)
                 k_i = k[:, s:e].permute(0, 2, 1, 3)
                 v_i = v[:, s:e].permute(0, 2, 1, 3)
-                out_i = F.scaled_dot_product_attention(q_i,
-                                                       k_i,
-                                                       v_i,
-                                                       dropout_p=0.0)
+                out_i = F.scaled_dot_product_attention(q_i, k_i, v_i, dropout_p=0.0)
                 out_i = out_i.permute(0, 2, 1, 3)
                 outputs.append(out_i)
             context_layer = torch.cat(outputs, dim=1) if outputs else q[:, :0]
         elif self.attn_backend == _Backend.XFORMERS:
             from xformers import ops as xops
             from xformers.ops.fmha.attn_bias import BlockDiagonalMask
-            attn_bias = BlockDiagonalMask.from_seqlens(q_seqlen=seqlens,
-                                                       kv_seqlen=None,
-                                                       device=q.device)
+
+            attn_bias = BlockDiagonalMask.from_seqlens(
+                q_seqlen=seqlens, kv_seqlen=None, device=q.device
+            )
             context_layer = xops.memory_efficient_attention_forward(
-                q, k, v, attn_bias=attn_bias, p=0, scale=None)
+                q, k, v, attn_bias=attn_bias, p=0, scale=None
+            )
         else:
             raise RuntimeError("Unsupported attention backend")
 
@@ -363,31 +390,36 @@ def forward(
 
 
 class DotsSwiGLUFFN(nn.Module):
-
-    def __init__(self,
-                 config,
-                 *,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "",
-                 use_data_parallel: bool = False):
+    def __init__(
+        self,
+        config,
+        *,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+        use_data_parallel: bool = False,
+    ):
         super().__init__()
         hidden_features = config.intermediate_size
         in_features = config.embed_dim
         bias = config.use_bias
 
         # Referenced aimv2.py AIMv2SwiGLUFFN
-        self.fc13 = MergedColumnParallelLinear(in_features,
-                                               [hidden_features] * 2,
-                                               bias=bias,
-                                               quant_config=quant_config,
-                                               prefix=f"{prefix}.fc13",
-                                               disable_tp=use_data_parallel)
-        self.fc2 = RowParallelLinear(hidden_features,
-                                     in_features,
-                                     bias=bias,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.fc2",
-                                     disable_tp=use_data_parallel)
+        self.fc13 = MergedColumnParallelLinear(
+            in_features,
+            [hidden_features] * 2,
+            bias=bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc13",
+            disable_tp=use_data_parallel,
+        )
+        self.fc2 = RowParallelLinear(
+            hidden_features,
+            in_features,
+            bias=bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc2",
+            disable_tp=use_data_parallel,
+        )
         self.act_fn = SiluAndMul()
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -396,8 +428,7 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
         x, _ = self.fc2(x)
         return x
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             ("fc13", "fc1", 0),
             ("fc13", "fc3", 1),
@@ -405,7 +436,6 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-
             for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
@@ -423,15 +453,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class DotsPatchEmbed(nn.Module):
-
     def __init__(self, config):
         super().__init__()
         self.num_channels = config.num_channels
@@ -448,15 +476,19 @@ def __init__(self, config):
         self.norm = RMSNorm(config.embed_dim, eps=config.rms_norm_eps)
 
     def forward(self, x: torch.Tensor, grid_thw=None) -> torch.Tensor:
-        x = x.view(-1, self.num_channels, self.temporal_patch_size,
-                   self.patch_size, self.patch_size)[:, :, 0]
+        x = x.view(
+            -1,
+            self.num_channels,
+            self.temporal_patch_size,
+            self.patch_size,
+            self.patch_size,
+        )[:, :, 0]
         x = self.proj(x).view(-1, self.embed_dim)
         x = self.norm(x)
         return x
 
 
 class DotsViTPreprocessor(nn.Module):
-
     def __init__(self, config):
         super().__init__()
         self.patch_h = config.patch_size
@@ -471,7 +503,6 @@ def forward(self, x: torch.Tensor, grid_thw=None) -> torch.Tensor:
 
 
 class DotsVisionBlock(nn.Module):
-
     def __init__(
         self,
         config,
@@ -482,27 +513,33 @@ def __init__(
     ):
         super().__init__()
 
-        self.attn = DotsVisionAttention(config,
-                                        config.embed_dim,
-                                        num_heads=config.num_attention_heads,
-                                        bias=config.use_bias,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.attn",
-                                        use_data_parallel=use_data_parallel)
+        self.attn = DotsVisionAttention(
+            config,
+            config.embed_dim,
+            num_heads=config.num_attention_heads,
+            bias=config.use_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+            use_data_parallel=use_data_parallel,
+        )
         self.norm1 = RMSNorm(config.embed_dim, eps=config.rms_norm_eps)
-        self.mlp = DotsSwiGLUFFN(config,
-                                 quant_config=quant_config,
-                                 prefix=f"{prefix}.mlp",
-                                 use_data_parallel=use_data_parallel)
+        self.mlp = DotsSwiGLUFFN(
+            config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.mlp",
+            use_data_parallel=use_data_parallel,
+        )
         self.norm2 = RMSNorm(config.embed_dim, eps=config.rms_norm_eps)
 
-    def forward(self,
-                hidden_states: torch.Tensor,
-                *,
-                cu_seqlens: torch.Tensor,
-                rotary_pos_emb: torch.Tensor,
-                max_seqlen: Optional[int] = None,
-                seqlens: Optional[list[int]] = None) -> torch.Tensor:
+    def forward(
+        self,
+        hidden_states: torch.Tensor,
+        *,
+        cu_seqlens: torch.Tensor,
+        rotary_pos_emb: torch.Tensor,
+        max_seqlen: Optional[int] = None,
+        seqlens: Optional[list[int]] = None,
+    ) -> torch.Tensor:
         hidden_states = hidden_states + self.attn(
             self.norm1(hidden_states),
             cu_seqlens=cu_seqlens,
@@ -515,7 +552,6 @@ def forward(self,
 
 
 class DotsVisionTransformer(nn.Module):
-
     def __init__(
         self,
         config: DotsVisionConfig,
@@ -535,26 +571,34 @@ def __init__(
         head_dim = config.embed_dim // config.num_attention_heads
         self.rotary_pos_emb = VisionRotaryEmbedding(head_dim // 2)
         self.attn_backend = get_vit_attn_backend(
-            head_size=head_dim, dtype=torch.get_default_dtype())
-        if self.attn_backend != _Backend.FLASH_ATTN and \
-                check_upstream_fa_availability(torch.get_default_dtype()):
+            head_size=head_dim, dtype=torch.get_default_dtype()
+        )
+        if self.attn_backend != _Backend.FLASH_ATTN and check_upstream_fa_availability(
+            torch.get_default_dtype()
+        ):
             self.attn_backend = _Backend.FLASH_ATTN
         self.out_hidden_size = config.hidden_size
         # Keep blocks for compatibility with other vision towers
-        num_layers = (config.num_hidden_layers if num_hidden_layers_override
-                      is None else num_hidden_layers_override)
-        self.blocks = nn.ModuleList([
-            DotsVisionBlock(config,
-                            quant_config=quant_config,
-                            prefix=f"{prefix}.blocks.{i}",
-                            use_data_parallel=use_data_parallel)
-            for i in range(num_layers)
-        ])
+        num_layers = (
+            config.num_hidden_layers
+            if num_hidden_layers_override is None
+            else num_hidden_layers_override
+        )
+        self.blocks = nn.ModuleList(
+            [
+                DotsVisionBlock(
+                    config,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.blocks.{i}",
+                    use_data_parallel=use_data_parallel,
+                )
+                for i in range(num_layers)
+            ]
+        )
         if require_post_norm is None:
-            require_post_norm = (len(self.blocks) == config.num_hidden_layers)
+            require_post_norm = len(self.blocks) == config.num_hidden_layers
         if require_post_norm and self.config.post_norm:
-            self.post_trunk_norm = RMSNorm(config.embed_dim,
-                                           eps=config.rms_norm_eps)
+            self.post_trunk_norm = RMSNorm(config.embed_dim, eps=config.rms_norm_eps)
         else:
             self.post_trunk_norm = None
 
@@ -595,8 +639,7 @@ def get_pos_ids_by_grid(self, grid_thw):
             )
             wpos_ids = wpos_ids.permute(0, 2, 1, 3)
             wpos_ids = wpos_ids.flatten()
-            pos_ids.append(
-                torch.stack([hpos_ids, wpos_ids], dim=-1).repeat(t, 1))
+            pos_ids.append(torch.stack([hpos_ids, wpos_ids], dim=-1).repeat(t, 1))
 
         return pos_ids
 
@@ -609,42 +652,45 @@ def rot_pos_emb(self, grid_thw):
         return rotary_pos_emb
 
     def compute_attn_mask_seqlen(
-            self, cu_seqlens: torch.Tensor
+        self, cu_seqlens: torch.Tensor
     ) -> tuple[Optional[int], Optional[list[int]]]:
         max_seqlen, seqlens = None, None
-        if (self.attn_backend == _Backend.FLASH_ATTN
-                or self.attn_backend == _Backend.ROCM_AITER_FA):
+        if (
+            self.attn_backend == _Backend.FLASH_ATTN
+            or self.attn_backend == _Backend.ROCM_AITER_FA
+        ):
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
         elif self.attn_backend == _Backend.XFORMERS:
             seqlens = (cu_seqlens[1:] - cu_seqlens[:-1]).tolist()
         return max_seqlen, seqlens
 
-    def forward(self, hidden_states: torch.Tensor,
-                grid_thw: list[list[int]]) -> torch.Tensor:
+    def forward(
+        self, hidden_states: torch.Tensor, grid_thw: list[list[int]]
+    ) -> torch.Tensor:
         # Convert grid_thw to tensor (always expecting list format now)
-        grid_thw = torch.tensor(grid_thw,
-                                device=hidden_states.device,
-                                dtype=torch.long)
+        grid_thw = torch.tensor(grid_thw, device=hidden_states.device, dtype=torch.long)
         hidden_states = hidden_states.to(self.dtype)
         hidden_states = self.patch_embed(hidden_states, grid_thw)
 
         rotary_pos_emb = self.rot_pos_emb(grid_thw)
 
         cu_seqlens = torch.repeat_interleave(
-            grid_thw[:, 1] * grid_thw[:, 2], grid_thw[:, 0]).cumsum(
-                dim=0,
-                dtype=grid_thw.dtype
-                if torch.jit.is_tracing() else torch.int32,
-            )
+            grid_thw[:, 1] * grid_thw[:, 2], grid_thw[:, 0]
+        ).cumsum(
+            dim=0,
+            dtype=grid_thw.dtype if torch.jit.is_tracing() else torch.int32,
+        )
         cu_seqlens = F.pad(cu_seqlens, (1, 0), value=0)
 
         max_seqlen, seqlens = self.compute_attn_mask_seqlen(cu_seqlens)
         for blk in self.blocks:
-            hidden_states = blk(hidden_states,
-                                cu_seqlens=cu_seqlens,
-                                rotary_pos_emb=rotary_pos_emb,
-                                max_seqlen=max_seqlen,
-                                seqlens=seqlens)
+            hidden_states = blk(
+                hidden_states,
+                cu_seqlens=cu_seqlens,
+                rotary_pos_emb=rotary_pos_emb,
+                max_seqlen=max_seqlen,
+                seqlens=seqlens,
+            )
 
         if self.post_trunk_norm is not None:
             hidden_states = self.post_trunk_norm(hidden_states)
@@ -658,8 +704,7 @@ def forward(self, hidden_states: torch.Tensor,
     info=DotsOCRProcessingInfo,
     dummy_inputs=DotsOCRDummyInputsBuilder,
 )
-class DotsOCRForCausalLM(nn.Module, SupportsMultiModal, SupportsPP,
-                         SupportsLoRA):
+class DotsOCRForCausalLM(nn.Module, SupportsMultiModal, SupportsPP, SupportsLoRA):
     merge_by_field_config = True
 
     hf_to_vllm_mapper = WeightsMapper(
@@ -709,7 +754,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             vision_config,
             quant_config=self.quant_config,
             prefix=maybe_prefix(prefix, "vision_tower"),
-            use_data_parallel=self.use_data_parallel)
+            use_data_parallel=self.use_data_parallel,
+        )
         self.language_model: Qwen2ForCausalLM = init_vllm_registered_model(
             vllm_config=vllm_config,
             hf_config=self.config,
@@ -718,7 +764,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[DotsOCRImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[DotsOCRImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_embeds = kwargs.pop("image_embeds", None)
         image_grid_thw = kwargs.pop("image_grid_thw", None)
@@ -727,27 +774,30 @@ def _parse_and_validate_image_input(
             return None
 
         if pixel_values is not None:
-            return DotsOCRImagePixelInputs(type="pixel_values",
-                                           pixel_values=pixel_values,
-                                           image_grid_thw=image_grid_thw)
+            return DotsOCRImagePixelInputs(
+                type="pixel_values",
+                pixel_values=pixel_values,
+                image_grid_thw=image_grid_thw,
+            )
 
         if image_embeds is not None:
-            return DotsOCRImageEmbeddingInputs(type="image_embeds",
-                                               image_embeds=image_embeds,
-                                               image_grid_thw=image_grid_thw)
+            return DotsOCRImageEmbeddingInputs(
+                type="image_embeds",
+                image_embeds=image_embeds,
+                image_grid_thw=image_grid_thw,
+            )
 
     def _process_image_input(
-            self, image_input: DotsOCRImageInputs) -> tuple[torch.Tensor, ...]:
+        self, image_input: DotsOCRImageInputs
+    ) -> tuple[torch.Tensor, ...]:
         grid_thw = image_input["image_grid_thw"]
         assert grid_thw.ndim == 2
         grid_thw_list = grid_thw.tolist()
 
         if image_input["type"] == "image_embeds":
-            image_embeds = image_input["image_embeds"].type(
-                self.vision_tower.dtype)
+            image_embeds = image_input["image_embeds"].type(self.vision_tower.dtype)
         else:
-            pixel_values = image_input["pixel_values"].type(
-                self.vision_tower.dtype)
+            pixel_values = image_input["pixel_values"].type(self.vision_tower.dtype)
 
             if self.use_data_parallel:
                 return run_dp_sharded_mrope_vision_model(
@@ -757,21 +807,23 @@ def _process_image_input(
                     rope_type="rope_3d",
                 )
             else:
-                image_embeds = self.vision_tower(
-                    pixel_values, grid_thw)[:, :self.config.hidden_size]
+                image_embeds = self.vision_tower(pixel_values, grid_thw)[
+                    :, : self.config.hidden_size
+                ]
 
         # Split concatenated embeddings for each image item.
         merge_size = self.vision_tower.spatial_merge_size
-        sizes = (torch.tensor(grid_thw_list, dtype=torch.long).prod(-1) //
-                 (merge_size * merge_size)).tolist()
+        sizes = (
+            torch.tensor(grid_thw_list, dtype=torch.long).prod(-1)
+            // (merge_size * merge_size)
+        ).tolist()
 
         return image_embeds.split(sizes)
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -812,8 +864,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
diff --git a/vllm/model_executor/models/ernie45.py b/vllm/model_executor/models/ernie45.py
index e7302dc5ecdd..b1d26cddcc5e 100644
--- a/vllm/model_executor/models/ernie45.py
+++ b/vllm/model_executor/models/ernie45.py
@@ -22,6 +22,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Erine model compatible with HuggingFace weights."""
+
 from vllm.config import VllmConfig
 from vllm.model_executor.models.llama import LlamaForCausalLM
 
@@ -29,7 +30,6 @@
 
 
 class Ernie4_5ForCausalLM(LlamaForCausalLM):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(vllm_config=vllm_config, prefix=prefix)
         # Hack Llama model to fit HF format Ernie4.5 dense implementation
diff --git a/vllm/model_executor/models/ernie45_moe.py b/vllm/model_executor/models/ernie45_moe.py
index 38c5249380c3..3cb93177a383 100644
--- a/vllm/model_executor/models/ernie45_moe.py
+++ b/vllm/model_executor/models/ernie45_moe.py
@@ -22,6 +22,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only ErineMoE model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Any, Optional, Union
@@ -38,30 +39,40 @@
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, extract_layer_index,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
 
 class Ernie4_5_MoeMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -74,19 +85,24 @@ def __init__(
     ) -> None:
         super().__init__()
         self.gate_up_proj = MergedColumnParallelLinear(
-            hidden_size, [intermediate_size] * 2,
+            hidden_size,
+            [intermediate_size] * 2,
+            bias=use_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.gate_up_proj",
+        )
+        self.down_proj = RowParallelLinear(
+            intermediate_size,
+            hidden_size,
             bias=use_bias,
             quant_config=quant_config,
-            prefix=f"{prefix}.gate_up_proj")
-        self.down_proj = RowParallelLinear(intermediate_size,
-                                           hidden_size,
-                                           bias=use_bias,
-                                           quant_config=quant_config,
-                                           reduce_results=reduce_results,
-                                           prefix=f"{prefix}.down_proj")
+            reduce_results=reduce_results,
+            prefix=f"{prefix}.down_proj",
+        )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -97,7 +113,6 @@ def forward(self, x):
 
 
 class Ernie4_5_MoeMoE(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -109,23 +124,26 @@ def __init__(
         layer_idx = extract_layer_index(prefix)
         self.layer_idx = layer_idx
         self.tp_size = get_tensor_model_parallel_world_size()
-        self.has_shared_experts = (getattr(config, "moe_num_shared_experts", 0)
-                                   > 0)
+        self.has_shared_experts = getattr(config, "moe_num_shared_experts", 0) > 0
 
         if self.tp_size > config.moe_num_experts:
             raise ValueError(
                 f"Tensor parallel size {self.tp_size} is greater than "
-                f"the number of experts {config.moe_num_experts}.")
-
-        self.gate = ReplicatedLinear(config.hidden_size,
-                                     config.moe_num_experts,
-                                     bias=False,
-                                     params_dtype=torch.float32,
-                                     quant_config=None,
-                                     prefix=f"{prefix}.gate")
+                f"the number of experts {config.moe_num_experts}."
+            )
+
+        self.gate = ReplicatedLinear(
+            config.hidden_size,
+            config.moe_num_experts,
+            bias=False,
+            params_dtype=torch.float32,
+            quant_config=None,
+            prefix=f"{prefix}.gate",
+        )
 
         self.gate.e_score_correction_bias = nn.Parameter(
-            torch.empty(config.moe_num_experts, dtype=torch.float32))
+            torch.empty(config.moe_num_experts, dtype=torch.float32)
+        )
 
         self.experts = FusedMoE(
             num_experts=config.moe_num_experts,
@@ -136,19 +154,21 @@ def __init__(
             renormalize=True,
             quant_config=quant_config,
             prefix=f"{prefix}.experts",
-            e_score_correction_bias=self.gate.e_score_correction_bias)
+            e_score_correction_bias=self.gate.e_score_correction_bias,
+        )
 
         if self.has_shared_experts:
-            intermediate_size = (config.moe_intermediate_size *
-                                 config.moe_num_shared_experts)
+            intermediate_size = (
+                config.moe_intermediate_size * config.moe_num_shared_experts
+            )
             self.shared_experts = Ernie4_5_MoeMLP(
                 hidden_size=config.hidden_size,
                 intermediate_size=intermediate_size,
                 hidden_act=config.hidden_act,
                 quant_config=quant_config,
                 prefix=f"{prefix}.shared_experts",
-                reduce_results=self.experts.must_reduce_shared_expert_outputs(
-                ))
+                reduce_results=self.experts.must_reduce_shared_expert_outputs(),
+            )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         orig_shape = hidden_states.shape
@@ -160,23 +180,22 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
         router_logits, _ = self.gate(hidden_states.to(dtype=torch.float32))
 
-        final_hidden_states = self.experts(hidden_states=hidden_states,
-                                           router_logits=router_logits)
+        final_hidden_states = self.experts(
+            hidden_states=hidden_states, router_logits=router_logits
+        )
 
-        if self.has_shared_experts and \
-              shared_output is not None:
+        if self.has_shared_experts and shared_output is not None:
             final_hidden_states = final_hidden_states + shared_output
 
         if self.tp_size > 1:
-            final_hidden_states = (
-                self.experts.maybe_all_reduce_tensor_model_parallel(
-                    final_hidden_states))
+            final_hidden_states = self.experts.maybe_all_reduce_tensor_model_parallel(
+                final_hidden_states
+            )
 
         return final_hidden_states.view(orig_shape)
 
 
 class Ernie4_5_MoeAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -219,19 +238,23 @@ def __init__(
         self.rope_theta = rope_theta
         self.max_position_embeddings = max_position_embeddings
 
-        self.qkv_proj = QKVParallelLinear(hidden_size,
-                                          self.head_dim,
-                                          self.total_num_heads,
-                                          self.total_num_kv_heads,
-                                          bias=qkv_bias,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.qkv_proj")
+        self.qkv_proj = QKVParallelLinear(
+            hidden_size,
+            self.head_dim,
+            self.total_num_heads,
+            self.total_num_kv_heads,
+            bias=qkv_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.qkv_proj",
+        )
 
-        self.o_proj = RowParallelLinear(self.total_num_heads * self.head_dim,
-                                        hidden_size,
-                                        bias=False,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.o_proj")
+        self.o_proj = RowParallelLinear(
+            self.total_num_heads * self.head_dim,
+            hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.o_proj",
+        )
 
         self.rotary_emb = get_rope(
             self.head_dim,
@@ -241,20 +264,21 @@ def __init__(
             is_neox_style=False,
             rope_scaling=rope_scaling,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
         positions: torch.Tensor,
         hidden_states: torch.Tensor,
     ) -> torch.Tensor:
-
         qkv, _ = self.qkv_proj(hidden_states)
 
         q, k, v = qkv.split([self.q_size, self.kv_size, self.kv_size], dim=-1)
@@ -268,7 +292,6 @@ def forward(
 
 
 class Ernie4_5_MoeDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -280,18 +303,17 @@ def __init__(
         self.hidden_size = config.hidden_size
         rope_theta = getattr(config, "rope_theta", 500000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          131072)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 131072)
         self.self_attn = Ernie4_5_MoeAttention(
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
             num_kv_heads=config.num_key_value_heads,
-            head_dim=getattr(config, 'head_dim', None),
+            head_dim=getattr(config, "head_dim", None),
             rope_theta=rope_theta,
             rope_scaling=rope_scaling,
             max_position_embeddings=max_position_embeddings,
             rms_norm_eps=config.rms_norm_eps,
-            qkv_bias=getattr(config, 'use_bias', False),
+            qkv_bias=getattr(config, "use_bias", False),
             cache_config=cache_config,
             quant_config=quant_config,
             prefix=f"{prefix}.self_attn",
@@ -303,30 +325,35 @@ def __init__(
         # MoE
         moe_num_experts = getattr(config, "moe_num_experts", 0)
         moe_layer_start_index = getattr(config, "moe_layer_start_index", 0)
-        moe_layer_end_index = getattr(config, "moe_layer_end_index",
-                                      config.num_hidden_layers - 1)
+        moe_layer_end_index = getattr(
+            config, "moe_layer_end_index", config.num_hidden_layers - 1
+        )
         moe_layer_interval = getattr(config, "moe_layer_interval", 1)
         use_moe = getattr(config, "use_moe", moe_num_experts > 0)
 
-        if (use_moe and ((layer_idx + 1) % moe_layer_interval == 0)
-                and layer_idx >= moe_layer_start_index
-                and layer_idx <= moe_layer_end_index):
-            self.mlp = Ernie4_5_MoeMoE(config=config,
-                                       quant_config=quant_config,
-                                       prefix=f"{prefix}.mlp")
+        if (
+            use_moe
+            and ((layer_idx + 1) % moe_layer_interval == 0)
+            and layer_idx >= moe_layer_start_index
+            and layer_idx <= moe_layer_end_index
+        ):
+            self.mlp = Ernie4_5_MoeMoE(
+                config=config, quant_config=quant_config, prefix=f"{prefix}.mlp"
+            )
         else:
             self.mlp = Ernie4_5_MoeMLP(
                 hidden_size=config.hidden_size,
                 intermediate_size=config.intermediate_size,
                 hidden_act=config.hidden_act,
-                use_bias=getattr(config, 'use_bias', False),
+                use_bias=getattr(config, "use_bias", False),
                 quant_config=quant_config,
-                prefix=f"{prefix}.mlp")
+                prefix=f"{prefix}.mlp",
+            )
 
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -334,14 +361,12 @@ def forward(
         hidden_states: torch.Tensor,
         residual: Optional[torch.Tensor],
     ) -> torch.Tensor:
-
         # Self Attention
         if residual is None:
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
 
         hidden_states = self.self_attn(
             positions=positions,
@@ -349,8 +374,7 @@ def forward(
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
 
         hidden_states = self.mlp(hidden_states)
 
@@ -359,7 +383,6 @@ def forward(
 
 @support_torch_compile
 class Ernie4_5_MoeModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -376,16 +399,19 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 config.vocab_size,
                 config.hidden_size,
                 quant_config=quant_config,
-                prefix=f"{prefix}.embed_tokens")
+                prefix=f"{prefix}.embed_tokens",
+            )
         else:
             self.embed_tokens = PPMissingLayer()
 
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: Ernie4_5_MoeDecoderLayer(config=config,
-                                                    cache_config=cache_config,
-                                                    quant_config=quant_config,
-                                                    prefix=prefix),
+            lambda prefix: Ernie4_5_MoeDecoderLayer(
+                config=config,
+                cache_config=cache_config,
+                quant_config=quant_config,
+                prefix=prefix,
+            ),
             prefix=f"{prefix}.layers",
         )
 
@@ -394,9 +420,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         else:
             self.norm = PPMissingLayer()
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -408,7 +434,6 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-
         if get_pp_group().is_first_rank:
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
@@ -424,27 +449,25 @@ def forward(
             hidden_states, residual = layer(positions, hidden_states, residual)
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
 
         return hidden_states
 
     def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
-
         # Params for weights, fp8 weight scales, fp8 activation scales
         # (param_name, weight_name, expert_id, shard_id)
         return FusedMoE.make_expert_params_mapping(
             ckpt_gate_proj_name="gate_proj",
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
-            num_experts=self.config.moe_num_experts)
+            num_experts=self.config.moe_num_experts,
+        )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -458,8 +481,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         loaded_params: set[str] = set()
         expert_params_mapping = self.get_expert_mapping()
         for name, loaded_weight in weights:
-            if self.config.tie_word_embeddings and name.endswith(
-                    "lm_head.weight"):
+            if self.config.tie_word_embeddings and name.endswith("lm_head.weight"):
                 continue
             # MTP will be supported soon.
             if "mtp" in name:
@@ -469,17 +491,18 @@ def load_weights(self, weights: Iterable[tuple[str,
                 name = name.replace("moe_statics", "gate")
                 loaded_weight = loaded_weight.squeeze(0)
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 # Skip non-stacked layers and experts (experts handled below).
                 if weight_name not in name:
                     continue
 
-                if (("mlp.experts." in name) and name not in params_dict):
+                if ("mlp.experts." in name) and name not in params_dict:
                     continue
                 name = name.replace(weight_name, param_name)
                 # Skip loading extra bias for GPTQ models.
-                if ((name.endswith(".bias") or name.endswith("_bias"))
-                        and name not in params_dict):
+                if (
+                    name.endswith(".bias") or name.endswith("_bias")
+                ) and name not in params_dict:
                     continue
                 # Skip layers on other devices.
                 if is_pp_missing_parameter(name, self):
@@ -502,22 +525,26 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
 
                     # Skip loading extra bias for GPTQ models.
-                    if ((name.endswith(".bias") or name.endswith("_bias"))
-                            and name not in params_dict):
+                    if (
+                        name.endswith(".bias") or name.endswith("_bias")
+                    ) and name not in params_dict:
                         continue
                     param = params_dict[name]
 
                     weight_loader = param.weight_loader
-                    weight_loader(param,
-                                  loaded_weight,
-                                  name,
-                                  shard_id=shard_id,
-                                  expert_id=expert_id)
+                    weight_loader(
+                        param,
+                        loaded_weight,
+                        name,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                    )
                     break
                 else:
                     # Skip loading extra bias for GPTQ models.
-                    if ((name.endswith(".bias") or name.endswith("_bias"))
-                            and name not in params_dict):
+                    if (
+                        name.endswith(".bias") or name.endswith("_bias")
+                    ) and name not in params_dict:
                         continue
                     # Skip layers on other devices.
                     if is_pp_missing_parameter(name, self):
@@ -528,8 +555,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
 
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -556,15 +584,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.model = Ernie4_5_MoeModel(vllm_config=vllm_config,
-                                       prefix=maybe_prefix(prefix, "model"))
+        self.model = Ernie4_5_MoeModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
         if get_pp_group().is_last_rank:
-            self.lm_head = ParallelLMHead(config.vocab_size,
-                                          config.hidden_size,
-                                          quant_config=quant_config,
-                                          prefix=maybe_prefix(
-                                              prefix, "lm_head"))
+            self.lm_head = ParallelLMHead(
+                config.vocab_size,
+                config.hidden_size,
+                quant_config=quant_config,
+                prefix=maybe_prefix(prefix, "lm_head"),
+            )
         else:
             self.lm_head = PPMissingLayer()
 
@@ -572,7 +602,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head.weight = self.model.embed_tokens.weight
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -584,8 +615,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -595,12 +627,10 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
 
diff --git a/vllm/model_executor/models/ernie45_vl.py b/vllm/model_executor/models/ernie45_vl.py
index 903ddf7953ea..493260cf73ef 100644
--- a/vllm/model_executor/models/ernie45_vl.py
+++ b/vllm/model_executor/models/ernie45_vl.py
@@ -22,6 +22,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Erine VL model compatible with HuggingFace weights."""
+
 import math
 from collections.abc import Iterable, Mapping, Sequence
 from functools import partial
@@ -35,8 +36,10 @@
 from transformers import BatchFeature
 
 from vllm.attention.backends.registry import _Backend
-from vllm.attention.layer import (check_upstream_fa_availability,
-                                  maybe_get_vit_flash_attn_backend)
+from vllm.attention.layer import (
+    check_upstream_fa_availability,
+    maybe_get_vit_flash_attn_backend,
+)
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import parallel_state
@@ -44,26 +47,38 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import QuickGELU
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
 from vllm.multimodal.parse import ImageSize, MultiModalDataItems
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.platforms import current_platform
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .ernie45_vl_moe import Ernie4_5_VLMoeForCausalLM
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
 from .utils import AutoWeightsLoader, WeightsMapper, maybe_prefix
 from .vision import get_vit_attn_backend
 
@@ -78,15 +93,14 @@ def rotate_half(x: torch.Tensor, interleaved: bool = False) -> torch.Tensor:
         return torch.cat((-x2, x1), dim=-1)
     else:
         x1, x2 = x[..., ::2], x[..., 1::2]
-        return rearrange(torch.stack((-x2, x1), dim=-1),
-                         "... d two -> ... (d two)",
-                         two=2)
+        return rearrange(
+            torch.stack((-x2, x1), dim=-1), "... d two -> ... (d two)", two=2
+        )
 
 
-def apply_rotary_emb_torch(x: torch.Tensor,
-                           cos: torch.Tensor,
-                           sin: torch.Tensor,
-                           interleaved: bool = False) -> torch.Tensor:
+def apply_rotary_emb_torch(
+    x: torch.Tensor, cos: torch.Tensor, sin: torch.Tensor, interleaved: bool = False
+) -> torch.Tensor:
     """
     x: (batch_size, seqlen, nheads, headdim)
     cos, sin: (seqlen, rotary_dim / 2) or (batch_size, seqlen, rotary_dim / 2)
@@ -94,22 +108,21 @@ def apply_rotary_emb_torch(x: torch.Tensor,
     ro_dim = cos.shape[-1] * 2
     assert ro_dim <= x.shape[-1]
     cos = repeat(
-        cos,
-        "... d -> ... 1 (2 d)" if not interleaved else "... d -> ... 1 (d 2)")
+        cos, "... d -> ... 1 (2 d)" if not interleaved else "... d -> ... 1 (d 2)"
+    )
     sin = repeat(
-        sin,
-        "... d -> ... 1 (2 d)" if not interleaved else "... d -> ... 1 (d 2)")
+        sin, "... d -> ... 1 (2 d)" if not interleaved else "... d -> ... 1 (d 2)"
+    )
     return torch.cat(
         [
-            x[..., :ro_dim] * cos +
-            rotate_half(x[..., :ro_dim], interleaved) * sin, x[..., ro_dim:]
+            x[..., :ro_dim] * cos + rotate_half(x[..., :ro_dim], interleaved) * sin,
+            x[..., ro_dim:],
         ],
         dim=-1,
     )
 
 
-def apply_rotary_pos_emb_vision(t: torch.Tensor,
-                                freqs: torch.Tensor) -> torch.Tensor:
+def apply_rotary_pos_emb_vision(t: torch.Tensor, freqs: torch.Tensor) -> torch.Tensor:
     t_ = t.float()
     cos = freqs.cos()
     sin = freqs.sin()
@@ -123,14 +136,14 @@ def apply_rotary_pos_emb_vision(t: torch.Tensor,
 def all_gather_interleave(local_tensor, hidden_size: int, tp_size: int):
     """All-gather the input tensor interleavely across model parallel group."""
     import torch.distributed as dist
+
     gathered_tensors = [torch.zeros_like(local_tensor) for _ in range(tp_size)]
-    dist.all_gather(gathered_tensors,
-                    local_tensor,
-                    group=parallel_state.get_tp_group().device_group)
+    dist.all_gather(
+        gathered_tensors, local_tensor, group=parallel_state.get_tp_group().device_group
+    )
 
     gathered_tensors_split = [
-        torch.split(tensor, hidden_size // tp_size, -1)
-        for tensor in gathered_tensors
+        torch.split(tensor, hidden_size // tp_size, -1) for tensor in gathered_tensors
     ]
     ordered_tensors = [
         tensor for pair in zip(*gathered_tensors_split) for tensor in pair
@@ -155,9 +168,11 @@ def __init__(
         self.tp_size = parallel_state.get_tensor_model_parallel_world_size()
         self.tp_rank = parallel_state.get_tensor_model_parallel_rank()
         self.hidden_size_per_attention_head = dist_utils.divide(
-            projection_size, num_heads)
+            projection_size, num_heads
+        )
         self.num_attention_heads_per_partition = dist_utils.divide(
-            num_heads, self.tp_size)
+            num_heads, self.tp_size
+        )
 
         self.qkv = QKVParallelLinear(
             hidden_size=embed_dim,
@@ -166,69 +181,79 @@ def __init__(
             total_num_kv_heads=num_heads,
             bias=True,
             quant_config=quant_config,
-            prefix=f"{prefix}.qkv")
-        self.proj = RowParallelLinear(input_size=projection_size,
-                                      output_size=embed_dim,
-                                      quant_config=quant_config,
-                                      prefix=f"{prefix}.proj")
+            prefix=f"{prefix}.qkv",
+        )
+        self.proj = RowParallelLinear(
+            input_size=projection_size,
+            output_size=embed_dim,
+            quant_config=quant_config,
+            prefix=f"{prefix}.proj",
+        )
 
         # Detect attention implementation.
         self.attn_backend = get_vit_attn_backend(
             head_size=self.hidden_size_per_attention_head,
-            dtype=torch.get_default_dtype())
+            dtype=torch.get_default_dtype(),
+        )
 
         self.use_upstream_fa = False
 
-        self.attn_backend, self.flash_attn_varlen_func \
-            = maybe_get_vit_flash_attn_backend(
+        self.attn_backend, self.flash_attn_varlen_func = (
+            maybe_get_vit_flash_attn_backend(
                 self.attn_backend,
                 self.use_upstream_fa,
             )
+        )
 
         if self.attn_backend not in {
-                _Backend.FLASH_ATTN,
-                _Backend.TORCH_SDPA,
-                _Backend.XFORMERS,
-                _Backend.ROCM_AITER_FA,
+            _Backend.FLASH_ATTN,
+            _Backend.TORCH_SDPA,
+            _Backend.XFORMERS,
+            _Backend.ROCM_AITER_FA,
         }:
             raise RuntimeError(
                 f"Ernie45-VL does not support {self.attn_backend} backend now."
             )
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA
+            _Backend.FLASH_ATTN,
+            _Backend.ROCM_AITER_FA,
         }
 
     def split_qkv(self, qkv: torch.Tensor) -> tuple[torch.Tensor, ...]:
         # [s, b, 3 * head * head_dim]
         seq_len, bs, _ = qkv.shape
         if self.tp_size > 1:
-            qkv = all_gather_interleave(qkv, self.qkv.hidden_size,
-                                        self.tp_size)
+            qkv = all_gather_interleave(qkv, self.qkv.hidden_size, self.tp_size)
 
         # [s, b, 3 * head * head_dim] -> 3 * [s, b, head * head_dim]
         q, k, v = qkv.chunk(3, dim=2)
 
         # 3 * [s, b, head * head_dim]
         if self.tp_size > 1:
-            splitter = partial(dist_utils.split_tensor_along_last_dim,
-                               num_partitions=self.tp_size)
+            splitter = partial(
+                dist_utils.split_tensor_along_last_dim, num_partitions=self.tp_size
+            )
             q = splitter(q)[self.tp_rank]
             k = splitter(k)[self.tp_rank]
             v = splitter(v)[self.tp_rank]
 
         # 3 * [s, b, head * head_dim] -> 3 * [s, b, head, head_dim]
-        new_shape = (seq_len, bs, self.num_attention_heads_per_partition,
-                     self.hidden_size_per_attention_head)
+        new_shape = (
+            seq_len,
+            bs,
+            self.num_attention_heads_per_partition,
+            self.hidden_size_per_attention_head,
+        )
         q, k, v = (x.view(*new_shape) for x in (q, k, v))
         return q, k, v
 
     def forward(
-            self,
-            x: torch.Tensor,
-            cu_seqlens: torch.Tensor,
-            rotary_pos_emb: torch.Tensor,
-            max_seqlen: Optional[int] = None,  # Only used for Flash Attention
-            seqlens: Optional[list[int]] = None,  # Only used for xFormers
+        self,
+        x: torch.Tensor,
+        cu_seqlens: torch.Tensor,
+        rotary_pos_emb: torch.Tensor,
+        max_seqlen: Optional[int] = None,  # Only used for Flash Attention
+        seqlens: Optional[list[int]] = None,  # Only used for xFormers
     ) -> torch.Tensor:
         # [s, b, c] --> [s, b, head * 3 * head_dim]
         x, _ = self.qkv(x)
@@ -237,30 +262,30 @@ def forward(
         q, k, v = self.split_qkv(x)
         batch_size = q.shape[1]
 
-        q, k, v = (rearrange(x, "s b ... -> b s ...").contiguous()
-                   for x in (q, k, v))
+        q, k, v = (rearrange(x, "s b ... -> b s ...").contiguous() for x in (q, k, v))
         if rotary_pos_emb is not None:
             qk_concat = torch.cat([q, k], dim=0)
             qk_rotated = apply_rotary_pos_emb_vision(qk_concat, rotary_pos_emb)
             q, k = torch.chunk(qk_rotated, 2, dim=0)
 
         if self.is_flash_attn_backend:
-
             q, k, v = (rearrange(x, "b s ... -> (b s) ...") for x in [q, k, v])
 
-            output = self.flash_attn_varlen_func(q,
-                                                 k,
-                                                 v,
-                                                 cu_seqlens_q=cu_seqlens,
-                                                 cu_seqlens_k=cu_seqlens,
-                                                 max_seqlen_q=max_seqlen,
-                                                 max_seqlen_k=max_seqlen,
-                                                 dropout_p=0.0,
-                                                 causal=False)
-
-            context_layer = rearrange(output,
-                                      "(b s) h d -> s b (h d)",
-                                      b=batch_size).contiguous()
+            output = self.flash_attn_varlen_func(
+                q,
+                k,
+                v,
+                cu_seqlens_q=cu_seqlens,
+                cu_seqlens_k=cu_seqlens,
+                max_seqlen_q=max_seqlen,
+                max_seqlen_k=max_seqlen,
+                dropout_p=0.0,
+                causal=False,
+            )
+
+            context_layer = rearrange(
+                output, "(b s) h d -> s b (h d)", b=batch_size
+            ).contiguous()
         elif self.attn_backend == _Backend.TORCH_SDPA:
             # Execute attention entry by entry for speed & less VRAM.
             outputs = []
@@ -270,36 +295,36 @@ def forward(
                 q_i = q[:, start_idx:end_idx]
                 k_i = k[:, start_idx:end_idx]
                 v_i = v[:, start_idx:end_idx]
-                q_i, k_i, v_i = (rearrange(x, "b s h d -> b h s d")
-                                 for x in [q_i, k_i, v_i])
-                output_i = F.scaled_dot_product_attention(q_i,
-                                                          k_i,
-                                                          v_i,
-                                                          dropout_p=0.0)
+                q_i, k_i, v_i = (
+                    rearrange(x, "b s h d -> b h s d") for x in [q_i, k_i, v_i]
+                )
+                output_i = F.scaled_dot_product_attention(q_i, k_i, v_i, dropout_p=0.0)
                 output_i = rearrange(output_i, "b h s d -> b s h d ")
                 outputs.append(output_i)
             context_layer = torch.cat(outputs, dim=1)
-            context_layer = rearrange(context_layer,
-                                      "b s h d -> s b (h d)").contiguous()
+            context_layer = rearrange(
+                context_layer, "b s h d -> s b (h d)"
+            ).contiguous()
         elif self.attn_backend == _Backend.XFORMERS:
             from xformers import ops as xops
             from xformers.ops.fmha.attn_bias import BlockDiagonalMask
 
-            attn_bias = BlockDiagonalMask.from_seqlens(q_seqlen=seqlens,
-                                                       kv_seqlen=None,
-                                                       device=q.device)
+            attn_bias = BlockDiagonalMask.from_seqlens(
+                q_seqlen=seqlens, kv_seqlen=None, device=q.device
+            )
 
             context_layer = xops.memory_efficient_attention_forward(
-                q, k, v, attn_bias=attn_bias, p=0, scale=None)
-            context_layer = rearrange(context_layer,
-                                      "b s h d -> s b (h d)").contiguous()
+                q, k, v, attn_bias=attn_bias, p=0, scale=None
+            )
+            context_layer = rearrange(
+                context_layer, "b s h d -> s b (h d)"
+            ).contiguous()
 
         output, _ = self.proj(context_layer)
         return output
 
 
 class Ernie4_5_VisionMLP(nn.Module):
-
     def __init__(
         self,
         in_features: int,
@@ -309,15 +334,19 @@ def __init__(
         prefix: str = "",
     ):
         super().__init__()
-        self.fc1 = ColumnParallelLinear(in_features,
-                                        hidden_features,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.fc1")
+        self.fc1 = ColumnParallelLinear(
+            in_features,
+            hidden_features,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc1",
+        )
         self.act = act_layer()
-        self.fc2 = RowParallelLinear(hidden_features,
-                                     in_features,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.fc2")
+        self.fc2 = RowParallelLinear(
+            hidden_features,
+            in_features,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc2",
+        )
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         x_parallel, _ = self.fc1(x)
@@ -327,7 +356,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class Ernie4_5_VisionBlock(nn.Module):
-
     def __init__(
         self,
         dim: int,
@@ -346,27 +374,30 @@ def __init__(
         self.norm2 = norm_layer(dim)
         mlp_hidden_dim = int(dim * mlp_ratio)
 
-        self.attn = Ernie4_5_VisionAttention(embed_dim=dim,
-                                             num_heads=num_heads,
-                                             projection_size=dim,
-                                             quant_config=quant_config,
-                                             prefix=f"{prefix}.attn")
+        self.attn = Ernie4_5_VisionAttention(
+            embed_dim=dim,
+            num_heads=num_heads,
+            projection_size=dim,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
-        self.mlp = Ernie4_5_VisionMLP(dim,
-                                      mlp_hidden_dim,
-                                      act_layer=act_layer,
-                                      quant_config=quant_config,
-                                      prefix=f"{prefix}.mlp")
+        self.mlp = Ernie4_5_VisionMLP(
+            dim,
+            mlp_hidden_dim,
+            act_layer=act_layer,
+            quant_config=quant_config,
+            prefix=f"{prefix}.mlp",
+        )
 
     def forward(
-            self,
-            hidden_states: torch.Tensor,
-            cu_seqlens: torch.Tensor,
-            rotary_pos_emb: torch.Tensor,
-            max_seqlen: Optional[int] = None,  # Only used for Flash Attention
-            seqlens: Optional[list[int]] = None,  # Only used for xFormers
+        self,
+        hidden_states: torch.Tensor,
+        cu_seqlens: torch.Tensor,
+        rotary_pos_emb: torch.Tensor,
+        max_seqlen: Optional[int] = None,  # Only used for Flash Attention
+        seqlens: Optional[list[int]] = None,  # Only used for xFormers
     ) -> torch.Tensor:
-
         hidden_states = hidden_states + self.attn(
             self.norm1(hidden_states),
             cu_seqlens=cu_seqlens,
@@ -379,7 +410,6 @@ def forward(
 
 
 class Ernie4_5_VisionPatchEmbed(nn.Module):
-
     def __init__(
         self,
         patch_size: int = 14,
@@ -387,18 +417,16 @@ def __init__(
         embed_dim: int = 1280,
         prefix="",
     ) -> None:
-
         super().__init__()
         self.patch_size = patch_size
         self.in_channels = in_channels
         self.embed_dim = embed_dim
 
-        self.proj = nn.Linear(in_channels * patch_size * patch_size,
-                              embed_dim,
-                              bias=False)
+        self.proj = nn.Linear(
+            in_channels * patch_size * patch_size, embed_dim, bias=False
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
-
         target_dtype = self.proj.weight.dtype
         hidden_states = hidden_states.to(target_dtype)
         hidden_states = self.proj(hidden_states)
@@ -407,22 +435,21 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class Ernie4_5_VisionRotaryEmbedding(nn.Module):
-
     def __init__(self, dim: int, theta: float = 10000.0) -> None:
         super().__init__()
-        self.inv_freq = 1.0 / theta**(
-            torch.arange(start=0, end=dim, step=2, dtype=torch.float32) / dim)
+        self.inv_freq = 1.0 / theta ** (
+            torch.arange(start=0, end=dim, step=2, dtype=torch.float32) / dim
+        )
 
     def forward(self, seqlen: int) -> torch.Tensor:
-        seq = torch.arange(seqlen,
-                           device=self.inv_freq.device,
-                           dtype=self.inv_freq.dtype)
+        seq = torch.arange(
+            seqlen, device=self.inv_freq.device, dtype=self.inv_freq.dtype
+        )
         freqs = torch.outer(input=seq, vec2=self.inv_freq)
         return freqs
 
 
 class Ernie4_5_VisionTransformer(nn.Module):
-
     def __init__(
         self,
         vision_config,
@@ -430,7 +457,6 @@ def __init__(
         quant_config: Optional[QuantizationConfig] = None,
         prefix: str = "",
     ) -> None:
-
         super().__init__()
         patch_size = vision_config.patch_size
         spatial_merge_size = vision_config.spatial_merge_size
@@ -456,24 +482,31 @@ def __init__(
         head_dim = embed_dim // num_heads
         self.rotary_pos_emb = Ernie4_5_VisionRotaryEmbedding(head_dim // 2)
 
-        self.blocks = nn.ModuleList([
-            Ernie4_5_VisionBlock(dim=embed_dim,
-                                 num_heads=num_heads,
-                                 mlp_ratio=mlp_ratio,
-                                 norm_layer=norm_layer,
-                                 quant_config=quant_config,
-                                 prefix=f"{prefix}.blocks.{layer_idx}")
-            for layer_idx in range(depth)
-        ])
-
-        assert (hidden_size == embed_dim
-                ), "vit's config.hidden must be equal to config.embed_dim"
+        self.blocks = nn.ModuleList(
+            [
+                Ernie4_5_VisionBlock(
+                    dim=embed_dim,
+                    num_heads=num_heads,
+                    mlp_ratio=mlp_ratio,
+                    norm_layer=norm_layer,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.blocks.{layer_idx}",
+                )
+                for layer_idx in range(depth)
+            ]
+        )
+
+        assert hidden_size == embed_dim, (
+            "vit's config.hidden must be equal to config.embed_dim"
+        )
         self.ln = nn.LayerNorm(hidden_size, eps=1e-6)
 
         self.attn_backend = get_vit_attn_backend(
-            head_size=head_dim, dtype=torch.get_default_dtype())
-        if self.attn_backend != _Backend.FLASH_ATTN and \
-        check_upstream_fa_availability(torch.get_default_dtype()):
+            head_size=head_dim, dtype=torch.get_default_dtype()
+        )
+        if self.attn_backend != _Backend.FLASH_ATTN and check_upstream_fa_availability(
+            torch.get_default_dtype()
+        ):
             self.attn_backend = _Backend.FLASH_ATTN
 
     @property
@@ -489,20 +522,27 @@ def rot_pos_emb(self, grid_thw: torch.Tensor) -> torch.Tensor:
         for t, h, w in grid_thw:
             hpos_ids = torch.arange(h).unsqueeze(1).expand(-1, w)
             wpos_ids = torch.arange(w).unsqueeze(0).expand(h, -1)
-            hpos_ids = hpos_ids.reshape(
-                h // self.spatial_merge_size,
-                self.spatial_merge_size,
-                w // self.spatial_merge_size,
-                self.spatial_merge_size,
-            ).permute(0, 2, 1, 3).flatten()
-            wpos_ids = wpos_ids.reshape(
-                h // self.spatial_merge_size,
-                self.spatial_merge_size,
-                w // self.spatial_merge_size,
-                self.spatial_merge_size,
-            ).permute(0, 2, 1, 3).flatten()
-            pos_ids.append(
-                torch.stack([hpos_ids, wpos_ids], dim=-1).repeat(t, 1))
+            hpos_ids = (
+                hpos_ids.reshape(
+                    h // self.spatial_merge_size,
+                    self.spatial_merge_size,
+                    w // self.spatial_merge_size,
+                    self.spatial_merge_size,
+                )
+                .permute(0, 2, 1, 3)
+                .flatten()
+            )
+            wpos_ids = (
+                wpos_ids.reshape(
+                    h // self.spatial_merge_size,
+                    self.spatial_merge_size,
+                    w // self.spatial_merge_size,
+                    self.spatial_merge_size,
+                )
+                .permute(0, 2, 1, 3)
+                .flatten()
+            )
+            pos_ids.append(torch.stack([hpos_ids, wpos_ids], dim=-1).repeat(t, 1))
         pos_ids = torch.cat(pos_ids, dim=0)
         max_grid_size = grid_thw[:, 1:].max()
         rotary_pos_emb_full = self.rotary_pos_emb(max_grid_size)
@@ -510,29 +550,29 @@ def rot_pos_emb(self, grid_thw: torch.Tensor) -> torch.Tensor:
         return rotary_pos_emb
 
     def compute_attn_mask_seqlen(
-            self, cu_seqlens: torch.Tensor
+        self, cu_seqlens: torch.Tensor
     ) -> tuple[Optional[int], Optional[list[int]]]:
         max_seqlen, seqlens = None, None
-        if (self.attn_backend == _Backend.FLASH_ATTN
-                or self.attn_backend == _Backend.ROCM_AITER_FA):
+        if (
+            self.attn_backend == _Backend.FLASH_ATTN
+            or self.attn_backend == _Backend.ROCM_AITER_FA
+        ):
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
         elif self.attn_backend == _Backend.XFORMERS:
             seqlens = (cu_seqlens[1:] - cu_seqlens[:-1]).tolist()
         return max_seqlen, seqlens
 
-    def forward(self,
-                hidden_states: torch.Tensor,
-                grid_thw: torch.Tensor,
-                num_pad=0) -> torch.Tensor:
-
+    def forward(
+        self, hidden_states: torch.Tensor, grid_thw: torch.Tensor, num_pad=0
+    ) -> torch.Tensor:
         hidden_states = self.patch_embed(hidden_states)
 
         rotary_pos_emb = self.rot_pos_emb(grid_thw)
         rotary_pos_emb = rotary_pos_emb.to(hidden_states.device)
 
-        cu_seqlens = torch.repeat_interleave(grid_thw[:, 1] * grid_thw[:, 2],
-                                             grid_thw[:, 0]).cumsum(
-                                                 dim=0, dtype=torch.int32)
+        cu_seqlens = torch.repeat_interleave(
+            grid_thw[:, 1] * grid_thw[:, 2], grid_thw[:, 0]
+        ).cumsum(dim=0, dtype=torch.int32)
 
         if num_pad > 0:
             cu_seqlens = F.pad(cu_seqlens, (1, 1), value=0)
@@ -569,8 +609,7 @@ def load_weights(self, weights) -> set[str]:
 
         for name, loaded_weight in weights:
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -587,6 +626,7 @@ class Ernie4_5_VLImagePixelInputs(TensorSchema):
         - ni: Number of images
         - cps: Number of channels * patch_size * patch_size
     """
+
     type: Literal["pixel_values"]
 
     pixel_values: Annotated[torch.Tensor, TensorShape("np", "cps")]
@@ -605,6 +645,7 @@ class Ernie4_5_VLVideoPixelInputs(TensorSchema):
         - cps: Number of channels * temporal_patch_size * patch_size *
               patch_size
     """
+
     type: Literal["pixel_values_videos"]
     pixel_values_videos: Annotated[torch.Tensor, TensorShape("np", "cps")]
     video_grid_thw: Annotated[torch.Tensor, TensorShape("ni", 3)]
@@ -664,14 +705,15 @@ def smart_resize(
 
 
 class VariableResolutionResamplerModel(nn.Module):
-
-    def __init__(self,
-                 in_dim,
-                 out_dim,
-                 spatial_conv_size,
-                 temporal_conv_size,
-                 config,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        in_dim,
+        out_dim,
+        spatial_conv_size,
+        temporal_conv_size,
+        config,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
         self.in_dim = in_dim
         self.out_dim = out_dim
@@ -681,18 +723,21 @@ def __init__(self,
         self.use_temporal_conv = config.use_temporal_conv
 
         # compress 2d conv(picture) to 1d
-        self.spatial_dim = (self.in_dim * self.spatial_conv_size *
-                            self.spatial_conv_size)
+        self.spatial_dim = self.in_dim * self.spatial_conv_size * self.spatial_conv_size
         # compress 3d conv(video) to 1d
-        self.temporal_dim = (self.in_dim * self.spatial_conv_size *
-                             self.spatial_conv_size * self.temporal_conv_size)
+        self.temporal_dim = (
+            self.in_dim
+            * self.spatial_conv_size
+            * self.spatial_conv_size
+            * self.temporal_conv_size
+        )
 
         self.spatial_linear1 = ColumnParallelLinear(
             self.spatial_dim,
             self.spatial_dim,
             bias=True,
             gather_output=True,
-            quant_config=getattr(config, 'quant_config', None),
+            quant_config=getattr(config, "quant_config", None),
             prefix=f"{prefix}.spatial_linear1",
         )
 
@@ -703,7 +748,7 @@ def __init__(self,
             self.spatial_dim,
             bias=True,
             gather_output=True,
-            quant_config=getattr(config, 'quant_config', None),
+            quant_config=getattr(config, "quant_config", None),
             prefix=f"{prefix}.spatial_linear2",
         )
 
@@ -715,7 +760,7 @@ def __init__(self,
                 self.spatial_dim,
                 bias=True,
                 gather_output=True,
-                quant_config=getattr(config, 'quant_config', None),
+                quant_config=getattr(config, "quant_config", None),
                 prefix=f"{prefix}.temporal_linear1",
             )
 
@@ -726,7 +771,7 @@ def __init__(self,
                 self.spatial_dim,
                 bias=True,
                 gather_output=True,
-                quant_config=getattr(config, 'quant_config', None),
+                quant_config=getattr(config, "quant_config", None),
                 prefix=f"{prefix}.temporal_linear2",
             )
 
@@ -737,12 +782,13 @@ def __init__(self,
             self.out_dim,
             bias=True,
             gather_output=True,
-            quant_config=getattr(config, 'quant_config', None),
+            quant_config=getattr(config, "quant_config", None),
             prefix=f"{prefix}.mlp",
         )
 
-        self.after_norm = RMSNorm(hidden_size=out_dim,
-                                  eps=getattr(config, 'rms_norm_eps', 1e-6))
+        self.after_norm = RMSNorm(
+            hidden_size=out_dim, eps=getattr(config, "rms_norm_eps", 1e-6)
+        )
 
     def spatial_conv_reshape(self, x, spatial_conv_size):
         S, C = x.shape
@@ -750,7 +796,6 @@ def spatial_conv_reshape(self, x, spatial_conv_size):
         return x
 
     def forward(self, x, grid_thw):
-
         def fwd_spatial(x):
             x = self.spatial_conv_reshape(x, self.spatial_conv_size)
 
@@ -762,43 +807,48 @@ def fwd_spatial(x):
             return x
 
         def fwd_placeholder(x, grid_thw, to_tensor=False):
-
             grid_thw_cpu = grid_thw.cpu().numpy()
             grid_t, grid_hw = grid_thw_cpu[:, 0], grid_thw_cpu[:, 1:]
-            grid_hw_after_conv = grid_hw.prod(-1) // (self.spatial_conv_size**
-                                                      2)
+            grid_hw_after_conv = grid_hw.prod(-1) // (self.spatial_conv_size**2)
 
-            tokens_per_img_or_vid = grid_thw_cpu.prod(-1) // (
-                self.spatial_conv_size**2)
-            batch_offset = np.empty(tokens_per_img_or_vid.size,
-                                    dtype=tokens_per_img_or_vid.dtype)
+            tokens_per_img_or_vid = grid_thw_cpu.prod(-1) // (self.spatial_conv_size**2)
+            batch_offset = np.empty(
+                tokens_per_img_or_vid.size, dtype=tokens_per_img_or_vid.dtype
+            )
             batch_offset[0] = 0
             batch_offset[1:] = tokens_per_img_or_vid.cumsum()[:-1]
 
             slice_offsets = []
             for temporoal_size, spatial_size, b_offset in zip(
-                    grid_t, grid_hw_after_conv, batch_offset):
+                grid_t, grid_hw_after_conv, batch_offset
+            ):
                 for temp_offset in range(0, temporoal_size, 2):
                     slice_offsets.append(
                         np.arange(
                             b_offset + (temp_offset) * spatial_size,
                             b_offset + (temp_offset + 1) * spatial_size,
-                        ))
-            slice_offsets = torch.tensor(np.concatenate(slice_offsets,
-                                                        axis=-1)).to(x.device)
+                        )
+                    )
+            slice_offsets = torch.tensor(np.concatenate(slice_offsets, axis=-1)).to(
+                x.device
+            )
 
             slice_offsets2 = []
             for temporoal_size, spatial_size, b_offset in zip(
-                    grid_t, grid_hw_after_conv, batch_offset):
-                for temp_offset in range(1 if temporoal_size > 1 else 0,
-                                         temporoal_size, 2):
+                grid_t, grid_hw_after_conv, batch_offset
+            ):
+                for temp_offset in range(
+                    1 if temporoal_size > 1 else 0, temporoal_size, 2
+                ):
                     slice_offsets2.append(
                         np.arange(
                             b_offset + (temp_offset) * spatial_size,
                             b_offset + (temp_offset + 1) * spatial_size,
-                        ))
-            slice_offsets2 = torch.tensor(
-                np.concatenate(slice_offsets2, axis=-1)).to(x.device)
+                        )
+                    )
+            slice_offsets2 = torch.tensor(np.concatenate(slice_offsets2, axis=-1)).to(
+                x.device
+            )
 
             x_timestep_1 = torch.index_select(x, dim=0, index=slice_offsets)
             x_timestep_2 = torch.index_select(x, dim=0, index=slice_offsets2)
@@ -824,9 +874,7 @@ def fwd_mlp(x):
         x = fwd_mlp(x)
         return x
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters(remove_duplicate=False))
         loaded_params: set[str] = set()
 
@@ -834,15 +882,13 @@ def load_weights(self, weights: Iterable[tuple[str,
             if name not in params_dict:
                 continue
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class Ernie4_5_VLProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.model_config.hf_config
 
@@ -890,11 +936,9 @@ def _get_vision_info(
                 min_pixels=image_processor.min_pixels,
                 max_pixels=image_processor.max_pixels,
             )
-            preprocessed_size = ImageSize(width=resized_width,
-                                          height=resized_height)
+            preprocessed_size = ImageSize(width=resized_width, height=resized_height)
         else:
-            preprocessed_size = ImageSize(width=image_width,
-                                          height=image_height)
+            preprocessed_size = ImageSize(width=image_width, height=image_height)
 
         grid_t = max(num_frames // temporal_conv_size, 1)
         grid_h = preprocessed_size.height // patch_size
@@ -987,8 +1031,7 @@ def get_num_frames_with_most_features(
         max_videos = mm_counts.get("video", 0)
 
         max_image_tokens = self.get_max_image_tokens() * max_images
-        max_total_frames = self._get_max_video_frames(seq_len -
-                                                      max_image_tokens)
+        max_total_frames = self._get_max_video_frames(seq_len - max_image_tokens)
         max_frames_per_video = max_total_frames // max(max_videos, 1)
 
         return max(max_frames_per_video, 2)
@@ -1003,15 +1046,12 @@ def get_max_video_tokens(
         return self.get_num_video_tokens(
             image_width=target_width,
             image_height=target_height,
-            num_frames=self.get_num_frames_with_most_features(
-                seq_len, mm_counts),
+            num_frames=self.get_num_frames_with_most_features(seq_len, mm_counts),
             image_processor=None,
         )
 
 
-class Ernie4_5VLMultiModalProcessor(
-        BaseMultiModalProcessor[Ernie4_5_VLProcessingInfo]):
-
+class Ernie4_5VLMultiModalProcessor(BaseMultiModalProcessor[Ernie4_5_VLProcessingInfo]):
     def _pixel_values_norm(
         self,
         pixel_values: torch.Tensor,
@@ -1020,28 +1060,32 @@ def _pixel_values_norm(
         hf_config = self.info.get_hf_config()
         vision_config = hf_config.vision_config
         image_processor = self.info.get_image_processor(**mm_kwargs)
-        image_mean_tensor = torch.tensor(image_processor.image_mean,
-                                         dtype=torch.float32).reshape(
-                                             [1, 3, 1, 1])
-        image_std_tensor = torch.tensor(image_processor.image_std,
-                                        dtype=torch.float32).reshape(
-                                            [1, 3, 1, 1])
-        rescale_factor = torch.tensor(image_processor.rescale_factor,
-                                      dtype=torch.float32)
+        image_mean_tensor = torch.tensor(
+            image_processor.image_mean, dtype=torch.float32
+        ).reshape([1, 3, 1, 1])
+        image_std_tensor = torch.tensor(
+            image_processor.image_std, dtype=torch.float32
+        ).reshape([1, 3, 1, 1])
+        rescale_factor = torch.tensor(
+            image_processor.rescale_factor, dtype=torch.float32
+        )
         patch_size_squared = vision_config.patch_size**2
 
-        image_mean_tensor = (image_mean_tensor.squeeze(
-            [-2, -1]).repeat_interleave(patch_size_squared, -1))
-        image_std_tensor = (image_std_tensor.squeeze(
-            [-2, -1]).repeat_interleave(patch_size_squared, -1))
+        image_mean_tensor = image_mean_tensor.squeeze([-2, -1]).repeat_interleave(
+            patch_size_squared, -1
+        )
+        image_std_tensor = image_std_tensor.squeeze([-2, -1]).repeat_interleave(
+            patch_size_squared, -1
+        )
 
         if not image_mean_tensor.is_contiguous():
             image_mean_tensor = image_mean_tensor.contiguous()
         if not image_std_tensor.is_contiguous():
             image_std_tensor = image_std_tensor.contiguous()
 
-        pixel_values = (rescale_factor * pixel_values.to(torch.float32) -
-                        image_mean_tensor) / image_std_tensor
+        pixel_values = (
+            rescale_factor * pixel_values.to(torch.float32) - image_mean_tensor
+        ) / image_std_tensor
         pixel_values = pixel_values.to(hf_config.torch_dtype)
         return pixel_values
 
@@ -1057,8 +1101,9 @@ def _call_hf_processor(
         if "images" not in mm_data and "videos" not in mm_data and prompt != "":
             tokenizer = self.info.get_tokenizer()
             prompt_ids = tokenizer.encode(prompt)
-            tokenizer_output = BatchFeature(dict(input_ids=[prompt_ids]),
-                                            tensor_type="pt")
+            tokenizer_output = BatchFeature(
+                dict(input_ids=[prompt_ids]), tensor_type="pt"
+            )
             return tokenizer_output
 
         if "images" not in mm_data:
@@ -1067,38 +1112,40 @@ def _call_hf_processor(
             mm_data["videos"] = []
         processor_output = self.info.ctx.call_hf_processor(
             self.info.get_hf_processor(**mm_kwargs),
-            dict(text=[prompt],
-                 images=mm_data["images"],
-                 videos=mm_data["videos"]),
+            dict(text=[prompt], images=mm_data["images"], videos=mm_data["videos"]),
             dict(**mm_kwargs, **tok_kwargs),
         )
 
         # Divide the processor_output into two modalities: image and video.
         if processor_output is not None:
-            pixel_values = processor_output['images']
+            pixel_values = processor_output["images"]
             if pixel_values is not None:
-                processor_output['images'] = self._pixel_values_norm(
-                    pixel_values, mm_kwargs)
+                processor_output["images"] = self._pixel_values_norm(
+                    pixel_values, mm_kwargs
+                )
             for key in list(processor_output.keys()):
                 if processor_output[key] is None:
                     del processor_output[key]
                     continue
                 if key == "grid_thw":
-                    grid_thw = processor_output['grid_thw']
-                    pixel_values_all = processor_output['images']
+                    grid_thw = processor_output["grid_thw"]
+                    pixel_values_all = processor_output["images"]
                     # Identify elements where the first
                     # dimension is greater than 1 and
                     # treat them as the video modality
                     mask = grid_thw[:, 0] > 1
                     processor_output["video_grid_thw"] = grid_thw[mask]
                     processor_output["image_grid_thw"] = grid_thw[~mask]
-                    image_patch_num = processor_output["image_grid_thw"].prod(
-                        dim=1).sum()
-                    processor_output[
-                        'pixel_values'] = pixel_values_all[:image_patch_num]
-                    processor_output['pixel_values_videos'] = pixel_values_all[
-                        image_patch_num:]
-                    del processor_output['images']
+                    image_patch_num = (
+                        processor_output["image_grid_thw"].prod(dim=1).sum()
+                    )
+                    processor_output["pixel_values"] = pixel_values_all[
+                        :image_patch_num
+                    ]
+                    processor_output["pixel_values_videos"] = pixel_values_all[
+                        image_patch_num:
+                    ]
+                    del processor_output["images"]
 
         return processor_output
 
@@ -1112,13 +1159,13 @@ def _get_prompt_updates(
 
         before_placeholder = {
             "image": "<|image@placeholder|>",
-            "video": "<|video@placeholder|>"
+            "video": "<|video@placeholder|>",
         }
 
         after_placeholder = {
             # image and video have same placeholder
             "image": "<|IMAGE_PLACEHOLDER|>",
-            "video": "<|IMAGE_PLACEHOLDER|>"
+            "video": "<|IMAGE_PLACEHOLDER|>",
         }
 
         merge_length = hf_processor.spatial_conv_size**2
@@ -1128,8 +1175,11 @@ def get_replacement_ernie45vl(item_idx: int, modality: str):
             grid_thw = out_item[f"{modality}_grid_thw"].data
             assert isinstance(grid_thw, torch.Tensor)
             if modality == "video":
-                num_tokens = int(grid_thw.prod(
-                )) // hf_processor.temporal_conv_size // merge_length
+                num_tokens = (
+                    int(grid_thw.prod())
+                    // hf_processor.temporal_conv_size
+                    // merge_length
+                )
             else:
                 num_tokens = int(grid_thw.prod()) // merge_length
             return after_placeholder[modality] * num_tokens
@@ -1138,9 +1188,9 @@ def get_replacement_ernie45vl(item_idx: int, modality: str):
             PromptReplacement(
                 modality=modality,
                 target=before_placeholder[modality],
-                replacement=partial(get_replacement_ernie45vl,
-                                    modality=modality),
-            ) for modality in ("image", "video")
+                replacement=partial(get_replacement_ernie45vl, modality=modality),
+            )
+            for modality in ("image", "video")
         ]
 
     def _get_mm_fields_config(
@@ -1148,7 +1198,6 @@ def _get_mm_fields_config(
         hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
-
         image_grid_thw = hf_inputs.get("image_grid_thw", torch.empty((0, 3)))
         image_grid_sizes = image_grid_thw.prod(-1)
 
@@ -1157,28 +1206,28 @@ def _get_mm_fields_config(
 
         return dict(
             pixel_values=MultiModalFieldConfig.flat_from_sizes(
-                "image", image_grid_sizes),
+                "image", image_grid_sizes
+            ),
             image_grid_thw=MultiModalFieldConfig.batched("image"),
             pixel_values_videos=MultiModalFieldConfig.flat_from_sizes(
-                "video", video_grid_sizes),
+                "video", video_grid_sizes
+            ),
             video_grid_thw=MultiModalFieldConfig.batched("video"),
         )
 
 
-class Ernie4_5_VLDummyInputsBuilder(
-        BaseDummyInputsBuilder[Ernie4_5_VLProcessingInfo]):
-
+class Ernie4_5_VLDummyInputsBuilder(BaseDummyInputsBuilder[Ernie4_5_VLProcessingInfo]):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
         prompt = ""
         for i in range(num_images):
-            prompt += (f"Picture {i+1}:"
-                       "<|IMAGE_START|><|image@placeholder|><|IMAGE_END|>")
+            prompt += (
+                f"Picture {i + 1}:<|IMAGE_START|><|image@placeholder|><|IMAGE_END|>"
+            )
 
         for i in range(num_videos):
-            prompt += (f"Video {i+1}:"
-                       "<|VIDEO_START|><|video@placeholder|><|VIDEO_END|>")
+            prompt += f"Video {i + 1}:<|VIDEO_START|><|video@placeholder|><|VIDEO_END|>"
         return prompt
 
     def get_dummy_mm_data(
@@ -1190,35 +1239,39 @@ def get_dummy_mm_data(
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
 
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
-        target_num_frames = \
-            self.info.get_num_frames_with_most_features(seq_len, mm_counts)
+        target_width, target_height = self.info.get_image_size_with_most_features()
+        target_num_frames = self.info.get_num_frames_with_most_features(
+            seq_len, mm_counts
+        )
 
         image_overrides = mm_options.get("image") if mm_options else None
         video_overrides = mm_options.get("video") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
-            "video":
-            self._get_dummy_videos(width=target_width,
-                                   height=target_height,
-                                   num_frames=target_num_frames,
-                                   num_videos=num_videos,
-                                   overrides=video_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
+            "video": self._get_dummy_videos(
+                width=target_width,
+                height=target_height,
+                num_frames=target_num_frames,
+                num_videos=num_videos,
+                overrides=video_overrides,
+            ),
         }
 
 
 @MULTIMODAL_REGISTRY.register_processor(
     Ernie4_5VLMultiModalProcessor,
     info=Ernie4_5_VLProcessingInfo,
-    dummy_inputs=Ernie4_5_VLDummyInputsBuilder)
-class Ernie4_5_VLMoeForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                             SupportsLoRA, SupportsPP):
+    dummy_inputs=Ernie4_5_VLDummyInputsBuilder,
+)
+class Ernie4_5_VLMoeForConditionalGeneration(
+    nn.Module, SupportsMultiModal, SupportsLoRA, SupportsPP
+):
     merge_by_field_config = True
 
     packed_modules_mapping = {
@@ -1250,7 +1303,8 @@ class Ernie4_5_VLMoeForConditionalGeneration(nn.Module, SupportsMultiModal,
             "temporal_linear.0.": "temporal_linear1.",
             "temporal_linear.2.": "temporal_linear2.",
             "temporal_linear.3.": "temporal_norm.",
-        })
+        },
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -1288,11 +1342,13 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = "") -> None:
             self.config.spatial_conv_size,
             self.config.temporal_conv_size,
             config=self.config,
-            prefix=maybe_prefix(prefix, "resampler_model"))
+            prefix=maybe_prefix(prefix, "resampler_model"),
+        )
 
         self.visual_token_mask = None
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def compute_logits(
         self,
@@ -1311,7 +1367,8 @@ def _vision_forward(
             if grid_thw.numel() % 3 != 0:
                 raise ValueError(
                     f"grid_thw has {grid_thw.numel()} elements after filtering,"
-                    "which is not divisible by 3.")
+                    "which is not divisible by 3."
+                )
             grid_thw = grid_thw.reshape(-1, 3)
             # example: [[1,64,64],[2,80,80]] -> [[1,64,64],[1,80,80],[1,80,80]]
             grid_thw = F.pad(
@@ -1324,8 +1381,9 @@ def _vision_forward(
 
     def _set_visual_token_mask(self, input_ids: torch.Tensor) -> None:
         if getattr(self.config, "im_patch_id", None) is not None:
-            self.visual_token_mask = (
-                input_ids == self.config.im_patch_id).reshape(-1, 1)
+            self.visual_token_mask = (input_ids == self.config.im_patch_id).reshape(
+                -1, 1
+            )
         else:
             self.visual_token_mask = None
 
@@ -1333,7 +1391,8 @@ def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[Ernie4_5_VLImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[Ernie4_5_VLImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_grid_thw = kwargs.pop("image_grid_thw", None)
 
@@ -1341,12 +1400,15 @@ def _parse_and_validate_image_input(
             return None
 
         if pixel_values is not None:
-            return Ernie4_5_VLImagePixelInputs(type="pixel_values",
-                                               pixel_values=pixel_values,
-                                               image_grid_thw=image_grid_thw)
+            return Ernie4_5_VLImagePixelInputs(
+                type="pixel_values",
+                pixel_values=pixel_values,
+                image_grid_thw=image_grid_thw,
+            )
 
     def _parse_and_validate_video_input(
-            self, **kwargs: object) -> Optional[Ernie4_5_VLVideoInputs]:
+        self, **kwargs: object
+    ) -> Optional[Ernie4_5_VLVideoInputs]:
         pixel_values_videos = kwargs.pop("pixel_values_videos", None)
         video_grid_thw = kwargs.pop("video_grid_thw", None)
 
@@ -1361,16 +1423,15 @@ def _parse_and_validate_video_input(
             )
 
     def _process_image_input(
-            self,
-            image_input: Ernie4_5_VLImageInputs) -> tuple[torch.Tensor, ...]:
-
+        self, image_input: Ernie4_5_VLImageInputs
+    ) -> tuple[torch.Tensor, ...]:
         grid_thw = image_input["image_grid_thw"]
         assert grid_thw.ndim == 2
 
-        pixel_values = image_input["pixel_values"].type(
-            self.vision_model.dtype)
-        image_features = self._vision_forward(pixel_values=pixel_values,
-                                              grid_thw=grid_thw)
+        pixel_values = image_input["pixel_values"].type(self.vision_model.dtype)
+        image_features = self._vision_forward(
+            pixel_values=pixel_values, grid_thw=grid_thw
+        )
         image_embeds = self.resampler_model(image_features, grid_thw)
 
         merge_size = self.vision_model.spatial_merge_size
@@ -1379,21 +1440,25 @@ def _process_image_input(
         return image_embeds.split(sizes.tolist())
 
     def _process_video_input(
-            self,
-            video_input: Ernie4_5_VLVideoInputs) -> tuple[torch.Tensor, ...]:
-
+        self, video_input: Ernie4_5_VLVideoInputs
+    ) -> tuple[torch.Tensor, ...]:
         grid_thw = video_input["video_grid_thw"]
         assert grid_thw.ndim == 2
 
         pixel_values_videos = video_input["pixel_values_videos"].type(
-            self.vision_model.dtype)
-        video_features = self._vision_forward(pixel_values=pixel_values_videos,
-                                              grid_thw=grid_thw)
+            self.vision_model.dtype
+        )
+        video_features = self._vision_forward(
+            pixel_values=pixel_values_videos, grid_thw=grid_thw
+        )
         video_embeds = self.resampler_model(video_features, grid_thw)
 
         merge_size = self.vision_model.spatial_merge_size
-        sizes = (grid_thw.prod(-1) //
-                 self.config.temporal_conv_size) // merge_size // merge_size
+        sizes = (
+            (grid_thw.prod(-1) // self.config.temporal_conv_size)
+            // merge_size
+            // merge_size
+        )
 
         return video_embeds.split(sizes.tolist())
 
@@ -1403,20 +1468,22 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if input_key in ("pixel_values",
-                             "image_embeds") and "images" not in modalities:
-                modalities["images"] = self._parse_and_validate_image_input(
-                    **kwargs)
-            if input_key in ("pixel_values_videos",
-                             "video_embeds") and "videos" not in modalities:
-                modalities["videos"] = self._parse_and_validate_video_input(
-                    **kwargs)
+            if (
+                input_key in ("pixel_values", "image_embeds")
+                and "images" not in modalities
+            ):
+                modalities["images"] = self._parse_and_validate_image_input(**kwargs)
+            if (
+                input_key in ("pixel_values_videos", "video_embeds")
+                and "videos" not in modalities
+            ):
+                modalities["videos"] = self._parse_and_validate_video_input(**kwargs)
 
         return modalities
 
     def get_multimodal_embeddings(
-            self, **kwargs: object) -> Optional[MultiModalEmbeddings]:
-
+        self, **kwargs: object
+    ) -> Optional[MultiModalEmbeddings]:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return None
@@ -1447,8 +1514,7 @@ def get_input_embeddings(
         is_multimodal: Optional[torch.Tensor] = None,
         handle_oov_mm_token: bool = False,
     ) -> torch.Tensor:
-        if multimodal_embeddings is not None and len(
-                multimodal_embeddings) > 0:
+        if multimodal_embeddings is not None and len(multimodal_embeddings) > 0:
             self._set_visual_token_mask(input_ids)
 
         # This is to satisfy the type checker for each overload
@@ -1470,7 +1536,6 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs,
     ):
-
         forward_kwargs = {
             "input_ids": input_ids,
             "positions": positions,
@@ -1479,20 +1544,17 @@ def forward(
         }
 
         if self.visual_token_mask is not None:
-
             if self.visual_token_mask.shape[0] != inputs_embeds.shape[0]:
-                padding_len = inputs_embeds.shape[
-                    0] - self.visual_token_mask.shape[0]
+                padding_len = inputs_embeds.shape[0] - self.visual_token_mask.shape[0]
                 # right pad False
                 pad = torch.zeros(
                     (padding_len, self.visual_token_mask.shape[1]),
                     dtype=self.visual_token_mask.dtype,
-                    device=self.visual_token_mask.device)
-                self.visual_token_mask = torch.cat(
-                    [self.visual_token_mask, pad], dim=0)
+                    device=self.visual_token_mask.device,
+                )
+                self.visual_token_mask = torch.cat([self.visual_token_mask, pad], dim=0)
 
-            forward_kwargs.update(
-                {"visual_token_mask": self.visual_token_mask})
+            forward_kwargs.update({"visual_token_mask": self.visual_token_mask})
             self.visual_token_mask = None
 
         hidden_states = self.language_model.model(
@@ -1502,8 +1564,6 @@ def forward(
 
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
diff --git a/vllm/model_executor/models/ernie45_vl_moe.py b/vllm/model_executor/models/ernie45_vl_moe.py
index 21772f766b40..51f49b8587e6 100644
--- a/vllm/model_executor/models/ernie45_vl_moe.py
+++ b/vllm/model_executor/models/ernie45_vl_moe.py
@@ -22,6 +22,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Erine VL model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Any, Optional, Union
@@ -31,31 +32,43 @@
 from transformers import PretrainedConfig
 
 from vllm.attention import Attention
+
 # from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding.ernie45_vl_rope import (
-    Ernie4_5_VLRotaryEmbedding)
+    Ernie4_5_VLRotaryEmbedding,
+)
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .ernie45_moe import Ernie4_5_MoeMLP
 from .interfaces import SupportsPP
-from .utils import (PPMissingLayer, extract_layer_index,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    PPMissingLayer,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
@@ -65,7 +78,6 @@ class Ernie4_5_VLMoeMLP(Ernie4_5_MoeMLP):
 
 
 class Ernie4_5_VLMoeAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -109,19 +121,23 @@ def __init__(
         self.rope_theta = rope_theta
         self.max_position_embeddings = max_position_embeddings
 
-        self.qkv_proj = QKVParallelLinear(hidden_size,
-                                          self.head_dim,
-                                          self.total_num_heads,
-                                          self.total_num_kv_heads,
-                                          bias=qkv_bias,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.qkv_proj")
+        self.qkv_proj = QKVParallelLinear(
+            hidden_size,
+            self.head_dim,
+            self.total_num_heads,
+            self.total_num_kv_heads,
+            bias=qkv_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.qkv_proj",
+        )
 
-        self.o_proj = RowParallelLinear(self.total_num_heads * self.head_dim,
-                                        hidden_size,
-                                        bias=False,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.o_proj")
+        self.o_proj = RowParallelLinear(
+            self.total_num_heads * self.head_dim,
+            hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.o_proj",
+        )
 
         t_rope = freq_allocation
         h_rope = (self.head_dim // 2 - freq_allocation) // 2
@@ -134,22 +150,24 @@ def __init__(
             base=rope_theta,
             is_neox_style=False,
             dtype=torch.get_default_dtype(),
-            mrope_section=[h_rope, w_rope, t_rope])
+            mrope_section=[h_rope, w_rope, t_rope],
+        )
 
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
         positions: torch.Tensor,
         hidden_states: torch.Tensor,
     ) -> torch.Tensor:
-
         qkv, _ = self.qkv_proj(hidden_states)
 
         q, k, v = qkv.split([self.q_size, self.kv_size, self.kv_size], dim=-1)
@@ -163,7 +181,6 @@ def forward(
 
 
 class Ernie4_5_VLMoeMoE(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -175,8 +192,7 @@ def __init__(
         layer_idx = extract_layer_index(prefix)
         self.layer_idx = layer_idx
         self.tp_size = get_tensor_model_parallel_world_size()
-        self.has_shared_experts = (getattr(config, "moe_num_shared_experts", 0)
-                                   > 0)
+        self.has_shared_experts = getattr(config, "moe_num_shared_experts", 0) > 0
         self.hidden_size = config.hidden_size
 
         moe_num_experts = config.moe_num_experts
@@ -185,33 +201,40 @@ def __init__(
         if self.tp_size > max_moe_num_experts:
             raise ValueError(
                 f"Tensor parallel size {self.tp_size} is greater than "
-                f"the number of experts {moe_num_experts}.")
+                f"the number of experts {moe_num_experts}."
+            )
 
         moe_layer_start_index = config.moe_layer_start_index
         text_moe_layer_start_index = moe_layer_start_index[0]
         vision_moe_layer_start_index = moe_layer_start_index[1]
         moe_layer_end_index = config.moe_layer_end_index
         moe_layer_end_index = getattr(
-            config, "moe_layer_end_index",
-            [config.num_hidden_layers - 1, config.num_hidden_layers - 1])
+            config,
+            "moe_layer_end_index",
+            [config.num_hidden_layers - 1, config.num_hidden_layers - 1],
+        )
         text_moe_layer_end_index = moe_layer_end_index[0]
         vision_moe_layer_end_index = moe_layer_end_index[1]
 
         assert config.moe_num_experts[0] == config.moe_num_experts[1]
         self.e_score_correction_bias = nn.Parameter(
-            torch.empty(2, config.moe_num_experts[0], dtype=torch.float32))
+            torch.empty(2, config.moe_num_experts[0], dtype=torch.float32)
+        )
 
         assert text_moe_layer_start_index <= text_moe_layer_end_index
 
-        if layer_idx >= text_moe_layer_start_index and \
-            layer_idx <= text_moe_layer_end_index:
+        if (
+            layer_idx >= text_moe_layer_start_index
+            and layer_idx <= text_moe_layer_end_index
+        ):
             self.text_experts_gate = ReplicatedLinear(
                 config.hidden_size,
                 config.moe_num_experts[0],
                 bias=False,
                 params_dtype=torch.float32,
                 quant_config=quant_config,
-                prefix=f"{prefix}.text_experts_gate")
+                prefix=f"{prefix}.text_experts_gate",
+            )
 
             self.text_experts = FusedMoE(
                 num_experts=config.moe_num_experts[0],
@@ -222,26 +245,31 @@ def __init__(
                 renormalize=True,
                 quant_config=quant_config,
                 e_score_correction_bias=self.e_score_correction_bias[0],
-                prefix=f"{prefix}.text_experts")
+                prefix=f"{prefix}.text_experts",
+            )
         else:
             self.text_experts = Ernie4_5_VLMoeMLP(
                 hidden_size=config.hidden_size,
                 intermediate_size=config.intermediate_size,
                 hidden_act=config.hidden_act,
-                use_bias=getattr(config, 'use_bias', False),
+                use_bias=getattr(config, "use_bias", False),
                 quant_config=quant_config,
-                prefix=f"{prefix}.mlp")
+                prefix=f"{prefix}.mlp",
+            )
 
         assert vision_moe_layer_start_index <= vision_moe_layer_end_index
-        if layer_idx >= vision_moe_layer_start_index and \
-            layer_idx <= vision_moe_layer_end_index:
+        if (
+            layer_idx >= vision_moe_layer_start_index
+            and layer_idx <= vision_moe_layer_end_index
+        ):
             self.vision_experts_gate = ReplicatedLinear(
                 config.hidden_size,
                 config.moe_num_experts[1],
                 bias=False,
                 params_dtype=torch.float32,
                 quant_config=quant_config,
-                prefix=f"{prefix}.vision_experts_gate")
+                prefix=f"{prefix}.vision_experts_gate",
+            )
 
             self.vision_experts = FusedMoE(
                 num_experts=config.moe_num_experts[1],
@@ -252,27 +280,30 @@ def __init__(
                 renormalize=True,
                 quant_config=quant_config,
                 e_score_correction_bias=self.e_score_correction_bias[1],
-                prefix=f"{prefix}.vision_experts")
+                prefix=f"{prefix}.vision_experts",
+            )
         else:
             self.vision_experts = Ernie4_5_VLMoeMLP(
                 hidden_size=config.hidden_size,
                 intermediate_size=config.intermediate_size,
                 hidden_act=config.hidden_act,
-                use_bias=getattr(config, 'use_bias', False),
+                use_bias=getattr(config, "use_bias", False),
                 quant_config=quant_config,
-                prefix=f"{prefix}.mlp")
+                prefix=f"{prefix}.mlp",
+            )
 
         if self.has_shared_experts:
-            intermediate_size = (config.moe_intermediate_size[0] *
-                                 config.moe_num_shared_experts)
+            intermediate_size = (
+                config.moe_intermediate_size[0] * config.moe_num_shared_experts
+            )
             self.shared_experts = Ernie4_5_VLMoeMLP(
                 hidden_size=config.hidden_size,
                 intermediate_size=intermediate_size,
                 hidden_act=config.hidden_act,
                 quant_config=quant_config,
                 prefix=f"{prefix}.shared_experts",
-                reduce_results=self.text_experts.
-                must_reduce_shared_expert_outputs())
+                reduce_results=self.text_experts.must_reduce_shared_expert_outputs(),
+            )
 
     def forward(
         self,
@@ -280,7 +311,6 @@ def forward(
         visual_token_mask: torch.Tensor,
         **kwargs: object,
     ) -> torch.Tensor:
-
         orig_shape = hidden_states.shape
         hidden_dim = hidden_states.shape[-1]
         hidden_states = hidden_states.view(-1, hidden_dim)
@@ -291,54 +321,61 @@ def forward(
         if visual_token_mask is not None and visual_token_mask.all():
             # only vision modal input
             router_logits, _ = self.vision_experts_gate(
-                hidden_states.to(dtype=torch.float32))
+                hidden_states.to(dtype=torch.float32)
+            )
             final_hidden_states = self.vision_experts(
-                hidden_states=hidden_states, router_logits=router_logits)
+                hidden_states=hidden_states, router_logits=router_logits
+            )
         elif visual_token_mask is not None and visual_token_mask.any():
             # text and vision modals input
-            visual_token_mask = visual_token_mask.repeat(
-                1, self.hidden_size).bool()
+            visual_token_mask = visual_token_mask.repeat(1, self.hidden_size).bool()
             text_token_mask = ~visual_token_mask
             final_hidden_states = torch.zeros_like(hidden_states)
 
             text_hidden_states = hidden_states[text_token_mask].reshape(
-                -1, self.hidden_size)
+                -1, self.hidden_size
+            )
             vision_hidden_states = hidden_states[visual_token_mask].reshape(
-                -1, self.hidden_size)
+                -1, self.hidden_size
+            )
 
             text_router_logits, _ = self.text_experts_gate(
-                text_hidden_states.to(dtype=torch.float32))
+                text_hidden_states.to(dtype=torch.float32)
+            )
             final_hidden_states[text_token_mask] = self.text_experts(
-                hidden_states=text_hidden_states,
-                router_logits=text_router_logits).flatten()
+                hidden_states=text_hidden_states, router_logits=text_router_logits
+            ).flatten()
 
             vision_router_logits, _ = self.vision_experts_gate(
-                vision_hidden_states.to(dtype=torch.float32))
+                vision_hidden_states.to(dtype=torch.float32)
+            )
             final_hidden_states[visual_token_mask] = self.vision_experts(
-                hidden_states=vision_hidden_states,
-                router_logits=vision_router_logits).flatten()
+                hidden_states=vision_hidden_states, router_logits=vision_router_logits
+            ).flatten()
         else:
             # only text modal input
             text_router_logits, _ = self.text_experts_gate(
-                hidden_states.to(dtype=torch.float32))
+                hidden_states.to(dtype=torch.float32)
+            )
 
             final_hidden_states = self.text_experts(
-                hidden_states=hidden_states, router_logits=text_router_logits)
+                hidden_states=hidden_states, router_logits=text_router_logits
+            )
 
-        if self.has_shared_experts and \
-              shared_output is not None:
+        if self.has_shared_experts and shared_output is not None:
             final_hidden_states = final_hidden_states + shared_output
 
         if self.tp_size > 1:
             final_hidden_states = (
                 self.text_experts.maybe_all_reduce_tensor_model_parallel(
-                    final_hidden_states))
+                    final_hidden_states
+                )
+            )
 
         return final_hidden_states.view(orig_shape)
 
 
 class Ernie4_5_VLMoeDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -351,20 +388,19 @@ def __init__(
         rope_theta = getattr(config, "rope_theta", 500000)
         rope_scaling = getattr(config, "rope_scaling", None)
         freq_allocation = getattr(config, "freq_allocation", 20)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          131072)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 131072)
 
         self.self_attn = Ernie4_5_VLMoeAttention(
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
             num_kv_heads=config.num_key_value_heads,
-            head_dim=getattr(config, 'head_dim', None),
+            head_dim=getattr(config, "head_dim", None),
             rope_theta=rope_theta,
             rope_scaling=rope_scaling,
             freq_allocation=freq_allocation,
             max_position_embeddings=max_position_embeddings,
             rms_norm_eps=config.rms_norm_eps,
-            qkv_bias=getattr(config, 'use_bias', False),
+            qkv_bias=getattr(config, "use_bias", False),
             cache_config=cache_config,
             quant_config=quant_config,
             prefix=f"{prefix}.self_attn",
@@ -377,8 +413,10 @@ def __init__(
         moe_layer_start_index = config.moe_layer_start_index
         min_moe_layer_start_index = min(moe_layer_start_index)
         moe_layer_end_index = getattr(
-            config, "moe_layer_end_index",
-            [config.num_hidden_layers - 1, config.num_hidden_layers - 1])
+            config,
+            "moe_layer_end_index",
+            [config.num_hidden_layers - 1, config.num_hidden_layers - 1],
+        )
         max_moe_layer_end_index = max(moe_layer_end_index)
         assert min_moe_layer_start_index <= max_moe_layer_end_index
         moe_num_experts = config.moe_num_experts
@@ -386,25 +424,29 @@ def __init__(
         moe_layer_interval = getattr(config, "moe_layer_interval", 1)
         use_moe = getattr(config, "use_moe", max_moe_num_experts > 0)
 
-        if (use_moe and ((layer_idx + 1) % moe_layer_interval == 0)
-                and layer_idx >= min_moe_layer_start_index
-                and layer_idx <= max_moe_layer_end_index):
-            self.mlp = Ernie4_5_VLMoeMoE(config=config,
-                                         quant_config=quant_config,
-                                         prefix=f"{prefix}.mlp")
+        if (
+            use_moe
+            and ((layer_idx + 1) % moe_layer_interval == 0)
+            and layer_idx >= min_moe_layer_start_index
+            and layer_idx <= max_moe_layer_end_index
+        ):
+            self.mlp = Ernie4_5_VLMoeMoE(
+                config=config, quant_config=quant_config, prefix=f"{prefix}.mlp"
+            )
         else:
             self.mlp = Ernie4_5_VLMoeMLP(
                 hidden_size=config.hidden_size,
                 intermediate_size=config.intermediate_size,
                 hidden_act=config.hidden_act,
-                use_bias=getattr(config, 'use_bias', False),
+                use_bias=getattr(config, "use_bias", False),
                 quant_config=quant_config,
-                prefix=f"{prefix}.mlp")
+                prefix=f"{prefix}.mlp",
+            )
 
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -414,14 +456,12 @@ def forward(
         visual_token_mask: Optional[torch.Tensor],
         **kwargs: object,
     ) -> torch.Tensor:
-
         # Self Attention
         if residual is None:
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
 
         hidden_states = self.self_attn(
             positions=positions,
@@ -429,12 +469,10 @@ def forward(
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
 
         if isinstance(self.mlp, Ernie4_5_VLMoeMoE):
-            hidden_states = self.mlp(hidden_states, visual_token_mask,
-                                     **kwargs)
+            hidden_states = self.mlp(hidden_states, visual_token_mask, **kwargs)
         else:
             hidden_states = self.mlp(hidden_states)
 
@@ -452,7 +490,6 @@ def forward(
 #         "visual_token_mask": 0,
 #     })
 class Ernie4_5_VLMoeModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -471,7 +508,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 config.vocab_size,
                 config.hidden_size,
                 quant_config=quant_config,
-                prefix=f"{prefix}.embed_tokens")
+                prefix=f"{prefix}.embed_tokens",
+            )
         else:
             self.embed_tokens = PPMissingLayer()
 
@@ -481,7 +519,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 config=config,
                 cache_config=cache_config,
                 quant_config=quant_config,
-                prefix=prefix),
+                prefix=prefix,
+            ),
             prefix=f"{prefix}.layers",
         )
 
@@ -490,9 +529,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         else:
             self.norm = PPMissingLayer()
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -506,7 +545,6 @@ def forward(
         visual_token_mask: Optional[torch.Tensor] = None,
         **kwargs: object,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-
         if get_pp_group().is_first_rank:
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
@@ -519,14 +557,14 @@ def forward(
             residual = intermediate_tensors["residual"]
 
         for layer in islice(self.layers, self.start_layer, self.end_layer):
-            hidden_states, residual = layer(positions, hidden_states, residual,
-                                            visual_token_mask, **kwargs)
+            hidden_states, residual = layer(
+                positions, hidden_states, residual, visual_token_mask, **kwargs
+            )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
 
@@ -555,15 +593,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.model = Ernie4_5_VLMoeModel(vllm_config=vllm_config,
-                                         prefix=maybe_prefix(prefix, "model"))
+        self.model = Ernie4_5_VLMoeModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
         if get_pp_group().is_last_rank:
-            self.lm_head = ParallelLMHead(config.vocab_size,
-                                          config.hidden_size,
-                                          quant_config=quant_config,
-                                          prefix=maybe_prefix(
-                                              prefix, "lm_head"))
+            self.lm_head = ParallelLMHead(
+                config.vocab_size,
+                config.hidden_size,
+                quant_config=quant_config,
+                prefix=maybe_prefix(prefix, "lm_head"),
+            )
         else:
             self.lm_head = PPMissingLayer()
 
@@ -571,7 +611,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head.weight = self.model.embed_tokens.weight
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -584,8 +625,9 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs: object,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds, **kwargs)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds, **kwargs
+        )
         return hidden_states
 
     def compute_logits(
@@ -595,8 +637,7 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -612,32 +653,31 @@ def load_weights(self, weights: Iterable[tuple[str,
             ckpt_gate_proj_name="gate_proj",
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
-            num_experts=max(self.config.moe_num_experts))
+            num_experts=max(self.config.moe_num_experts),
+        )
 
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            if self.config.tie_word_embeddings and name.endswith(
-                    "lm_head.weight"):
+            if self.config.tie_word_embeddings and name.endswith("lm_head.weight"):
                 loaded_params.add("lm_head.weight")
                 continue
             # MTP will be supported soon.
-            if "mtp" in name or \
-               "vision_model" in name or \
-               "resampler_model" in name:
+            if "mtp" in name or "vision_model" in name or "resampler_model" in name:
                 continue
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 # Skip non-stacked layers and experts (experts handled below).
                 if weight_name not in name:
                     continue
 
-                if (("mlp.experts." in name) and name not in params_dict):
+                if ("mlp.experts." in name) and name not in params_dict:
                     continue
                 name = name.replace(weight_name, param_name)
                 # Skip loading extra bias for GPTQ models.
-                if ((name.endswith(".bias") or name.endswith("_bias"))
-                        and name not in params_dict):
+                if (
+                    name.endswith(".bias") or name.endswith("_bias")
+                ) and name not in params_dict:
                     continue
                 # Skip layers on other devices.
                 if is_pp_missing_parameter(name, self):
@@ -652,14 +692,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if "mlp.experts" in name:
                     moe_offset = int(name.split(".")[-3])
                     vision_expert_start_idx = self.config.moe_num_experts[0]
-                    is_text_expert = \
-                        moe_offset <= vision_expert_start_idx - 1
+                    is_text_expert = moe_offset <= vision_expert_start_idx - 1
                     if is_text_expert:
                         name = name.replace(".experts.", ".text_experts.")
                     else:
                         name = name.replace(
                             f".experts.{moe_offset}",
-                            f".vision_experts.{moe_offset-vision_expert_start_idx}"
+                            f".vision_experts.{moe_offset - vision_expert_start_idx}",
                         )
 
                 for mapping in expert_params_mapping:
@@ -670,8 +709,7 @@ def load_weights(self, weights: Iterable[tuple[str,
 
                     # Distinguish between vision experts and text experts
                     moe_offset = int(name.split(".")[-3])
-                    is_text_expert = \
-                        moe_offset <= self.config.moe_num_experts[0] - 1
+                    is_text_expert = moe_offset <= self.config.moe_num_experts[0] - 1
 
                     name = name.replace(weight_name, param_name)
                     if is_text_expert:
@@ -684,36 +722,40 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
 
                     # Skip loading extra bias for GPTQ models.
-                    if ((name.endswith(".bias") or name.endswith("_bias"))
-                            and name not in params_dict):
+                    if (
+                        name.endswith(".bias") or name.endswith("_bias")
+                    ) and name not in params_dict:
                         continue
                     param = params_dict[name]
 
                     weight_loader = param.weight_loader
-                    weight_loader(param,
-                                  loaded_weight,
-                                  name,
-                                  shard_id=shard_id,
-                                  expert_id=expert_id)
+                    weight_loader(
+                        param,
+                        loaded_weight,
+                        name,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                    )
                     break
                 else:
                     # Distinguish between vision expert gate
                     # and text expert gate
                     if name.endswith("mlp.gate.weight"):
-                        name = name.replace("gate.weight",
-                                            "text_experts_gate.weight")
+                        name = name.replace("gate.weight", "text_experts_gate.weight")
                         loaded_weight = loaded_weight.T
                     elif name.endswith("mlp.gate.weight_1"):
-                        name = name.replace("gate.weight_1",
-                                            "vision_experts_gate.weight")
+                        name = name.replace(
+                            "gate.weight_1", "vision_experts_gate.weight"
+                        )
                         loaded_weight = loaded_weight.T
 
                     if "e_score_correction_bias" in name:
                         name = name.replace(".moe_statics.", ".")
 
                     # Skip loading extra bias for GPTQ models.
-                    if ((name.endswith(".bias") or name.endswith("_bias"))
-                            and name not in params_dict):
+                    if (
+                        name.endswith(".bias") or name.endswith("_bias")
+                    ) and name not in params_dict:
                         continue
                     # Skip layers on other devices.
                     if is_pp_missing_parameter(name, self):
@@ -725,8 +767,9 @@ def load_weights(self, weights: Iterable[tuple[str,
 
                     param = params_dict[name]
 
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
diff --git a/vllm/model_executor/models/ernie_mtp.py b/vllm/model_executor/models/ernie_mtp.py
index 2e6ef2d476a6..46a7131f2499 100644
--- a/vllm/model_executor/models/ernie_mtp.py
+++ b/vllm/model_executor/models/ernie_mtp.py
@@ -22,6 +22,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Ernie-MTP model."""
+
 from collections.abc import Iterable
 from typing import Optional
 
@@ -33,7 +34,9 @@
 from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
@@ -43,7 +46,6 @@
 
 
 class ErnieMultiTokenPredictorLayer(nn.Module):
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -52,13 +54,11 @@ def __init__(
         super().__init__()
         config = vllm_config.model_config.hf_config
 
-        self.mtp_emb_norm = RMSNorm(config.hidden_size,
-                                    eps=config.rms_norm_eps)
-        self.mtp_hidden_norm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.mtp_linear_proj = nn.Linear(config.hidden_size * 2,
-                                         config.hidden_size,
-                                         bias=False)
+        self.mtp_emb_norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.mtp_hidden_norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.mtp_linear_proj = nn.Linear(
+            config.hidden_size * 2, config.hidden_size, bias=False
+        )
         self.mtp_block = LlamaDecoderLayer(vllm_config, prefix)
 
     def forward(
@@ -76,18 +76,18 @@ def forward(
         previous_hidden_states = self.mtp_hidden_norm(previous_hidden_states)
 
         hidden_states = self.mtp_linear_proj(
-            torch.cat([inputs_embeds, previous_hidden_states], dim=-1))
+            torch.cat([inputs_embeds, previous_hidden_states], dim=-1)
+        )
 
-        hidden_states, residual = self.mtp_block(positions=positions,
-                                                 hidden_states=hidden_states,
-                                                 residual=None)
+        hidden_states, residual = self.mtp_block(
+            positions=positions, hidden_states=hidden_states, residual=None
+        )
         hidden_states = residual + hidden_states
 
         return hidden_states
 
 
 class ErnieMultiTokenPredictor(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -95,15 +95,18 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.mtp_start_layer_idx = config.num_hidden_layers
         self.num_mtp_layers = config.num_nextn_predict_layers
         # to map the exact layer index from weights
-        self.layers = torch.nn.ModuleDict({
-            str(idx):
-            ErnieMultiTokenPredictorLayer(
-                vllm_config,
-                f"{prefix}.layers.{idx}",
-            )
-            for idx in range(self.mtp_start_layer_idx,
-                             self.mtp_start_layer_idx + self.num_mtp_layers)
-        })
+        self.layers = torch.nn.ModuleDict(
+            {
+                str(idx): ErnieMultiTokenPredictorLayer(
+                    vllm_config,
+                    f"{prefix}.layers.{idx}",
+                )
+                for idx in range(
+                    self.mtp_start_layer_idx,
+                    self.mtp_start_layer_idx + self.num_mtp_layers,
+                )
+            }
+        )
         self.embed_tokens = VocabParallelEmbedding(
             config.vocab_size,
             config.hidden_size,
@@ -142,17 +145,18 @@ def compute_logits(
 
 
 class ErnieMTP(nn.Module, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
         self.config = vllm_config.model_config.hf_config
-        self.model = ErnieMultiTokenPredictor(vllm_config=vllm_config,
-                                              prefix=maybe_prefix(
-                                                  prefix, "model"))
-        self.lm_head = ParallelLMHead(self.config.vocab_size,
-                                      self.config.hidden_size,
-                                      prefix=maybe_prefix(prefix, "lm_head"))
+        self.model = ErnieMultiTokenPredictor(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
+        self.lm_head = ParallelLMHead(
+            self.config.vocab_size,
+            self.config.hidden_size,
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
 
         if self.config.tie_word_embeddings:
             self.lm_head.weight = self.model.embed_tokens.weight
@@ -170,8 +174,9 @@ def forward(
         spec_step_idx: int = 0,
     ) -> torch.Tensor:
         assert spec_step_idx == 0, "ernie_mtp only support predict one token"
-        hidden_states = self.model(input_ids, positions, hidden_states,
-                                   inputs_embeds, spec_step_idx)
+        hidden_states = self.model(
+            input_ids, positions, hidden_states, inputs_embeds, spec_step_idx
+        )
         return hidden_states
 
     def compute_logits(
@@ -179,11 +184,9 @@ def compute_logits(
         hidden_states: torch.Tensor,
         spec_step_idx: int = 0,
     ) -> Optional[torch.Tensor]:
-        return self.model.compute_logits(hidden_states, self.lm_head,
-                                         spec_step_idx)
+        return self.model.compute_logits(hidden_states, self.lm_head, spec_step_idx)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             ("qkv_proj", "q_proj", "q"),
             ("qkv_proj", "k_proj", "k"),
@@ -195,16 +198,14 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-
-            if self.config.tie_word_embeddings and name.endswith(
-                    "lm_head.weight"):
+            if self.config.tie_word_embeddings and name.endswith("lm_head.weight"):
                 continue
             if "rotary_emb.inv_freq" in name:
                 continue
             if "mtp" in name:
                 name = self._rewrite_spec_layer_name(self.config, name)
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 # Skip non-stacked layers and experts (experts handled below).
                 if weight_name not in name:
                     continue
@@ -216,12 +217,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                 # name will be updated to mlp.experts[0].gate_up_proj, which
                 # will then be updated below in expert_params_mapping
                 # for mlp.experts[0].gate_gate_up_proj, which breaks load.
-                if (("mlp.experts." in name) and name not in params_dict):
+                if ("mlp.experts." in name) and name not in params_dict:
                     continue
                 name = name.replace(weight_name, param_name)
                 # Skip loading extra bias for GPTQ models.
-                if ((name.endswith(".bias") or name.endswith("_bias"))
-                        and name not in params_dict):
+                if (
+                    name.endswith(".bias") or name.endswith("_bias")
+                ) and name not in params_dict:
                     continue
                 # Skip layers on other devices.
                 if is_pp_missing_parameter(name, self):
@@ -233,8 +235,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 # Skip loading extra bias for GPTQ models.
-                if ((name.endswith(".bias") or name.endswith("_bias"))
-                        and name not in params_dict):
+                if (
+                    name.endswith(".bias") or name.endswith("_bias")
+                ) and name not in params_dict:
                     continue
                 # Skip layers on other devices.
                 if is_pp_missing_parameter(name, self):
@@ -242,33 +245,36 @@ def load_weights(self, weights: Iterable[tuple[str,
 
                 # According to DeepSeek-V3 Technical Report, MTP modules
                 # shares embedding layer. We only load the first weights.
-                if "mtp_" not in name and ("embed_tokens" not in name
-                                           and "lm_head" not in name):
+                if "mtp_" not in name and (
+                    "embed_tokens" not in name and "lm_head" not in name
+                ):
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
-    def _rewrite_spec_layer_name(self, config: PretrainedConfig,
-                                 name: str) -> str:
+    def _rewrite_spec_layer_name(self, config: PretrainedConfig, name: str) -> str:
         """
         Rewrite the weight name to match the format of the original model.
         """
         spec_layer_weight_names = [
-            "embed_tokens", "mtp_emb_norm", "mtp_hidden_norm",
-            "mtp_linear_proj"
+            "embed_tokens",
+            "mtp_emb_norm",
+            "mtp_hidden_norm",
+            "mtp_linear_proj",
         ]
         layer_idx = config.num_hidden_layers
         for weight_name in spec_layer_weight_names:
             if weight_name in name:
                 name = name.replace(
                     f"model.{weight_name}.0.",
-                    f"model.layers.{layer_idx}.{weight_name}.")
+                    f"model.layers.{layer_idx}.{weight_name}.",
+                )
                 return name
-        name = name.replace("model.mtp_block.0.",
-                            f"model.layers.{layer_idx}.mtp_block.")
+        name = name.replace(
+            "model.mtp_block.0.", f"model.layers.{layer_idx}.mtp_block."
+        )
         return name
diff --git a/vllm/model_executor/models/exaone.py b/vllm/model_executor/models/exaone.py
index 5dafcd595e4a..1f0b5723721c 100644
--- a/vllm/model_executor/models/exaone.py
+++ b/vllm/model_executor/models/exaone.py
@@ -39,26 +39,37 @@
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class ExaoneGatedMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -84,8 +95,9 @@ def __init__(
             prefix=f"{prefix}.c_proj",
         )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -96,7 +108,6 @@ def forward(self, x):
 
 
 class ExaoneAttention(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -191,7 +202,6 @@ def forward(
 
 
 class ExaoneBlockAttention(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -233,7 +243,6 @@ def forward(
 
 
 class ExaoneDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -246,21 +255,24 @@ def __init__(
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
         if rope_scaling is not None and getattr(
-                config, "original_max_position_embeddings", None):
+            config, "original_max_position_embeddings", None
+        ):
             rope_scaling["original_max_position_embeddings"] = (
-                config.original_max_position_embeddings)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+                config.original_max_position_embeddings
+            )
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         # Support abacusai/Smaug-72B-v0.1 with attention_bias
         # Support internlm/internlm-7b with bias
         attention_bias = getattr(config, "attention_bias", False) or getattr(
-            config, "bias", False)
+            config, "bias", False
+        )
         self.attn = ExaoneBlockAttention(
             config=config,
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
-            num_kv_heads=getattr(config, "num_key_value_heads",
-                                 config.num_attention_heads),
+            num_kv_heads=getattr(
+                config, "num_key_value_heads", config.num_attention_heads
+            ),
             rope_theta=rope_theta,
             rope_scaling=rope_scaling,
             max_position_embeddings=max_position_embeddings,
@@ -305,7 +317,6 @@ def forward(
 
 @support_torch_compile
 class ExaoneModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -316,12 +327,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.config = config
         self.quant_config = quant_config
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.wte = config.vocab_size
-        if get_pp_group().is_first_rank or (config.tie_word_embeddings
-                                            and get_pp_group().is_last_rank):
+        if get_pp_group().is_first_rank or (
+            config.tie_word_embeddings and get_pp_group().is_last_rank
+        ):
             self.wte = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
@@ -341,14 +356,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             prefix=f"{prefix}.h",
         )
         if get_pp_group().is_last_rank:
-            self.ln_f = RMSNorm(config.hidden_size,
-                                eps=config.layer_norm_epsilon)
+            self.ln_f = RMSNorm(config.hidden_size, eps=config.layer_norm_epsilon)
         else:
             self.ln_f = PPMissingLayer()
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
@@ -379,16 +393,14 @@ def forward(
             )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.ln_f(hidden_states, residual)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv_proj", ".q_proj", "q"),
@@ -402,19 +414,19 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            if ("rotary_emb.cos_cached" in name
-                    or "rotary_emb.sin_cached" in name):
+            if "rotary_emb.cos_cached" in name or "rotary_emb.sin_cached" in name:
                 # Models trained using ColossalAI may include these tensors in
                 # the checkpoint. Skip them.
                 continue
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
@@ -447,8 +459,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -499,7 +510,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 padding_size=DEFAULT_VOCAB_PADDING_SIZE
                 # We need bigger padding if using lora for kernel
                 # compatibility
-                if not lora_config else lora_config.lora_vocab_padding_size,
+                if not lora_config
+                else lora_config.lora_vocab_padding_size,
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
@@ -507,14 +519,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 self.lm_head.weight = self.transformer.wte.weight
 
             logit_scale = getattr(config, "logit_scale", 1.0)
-            self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                    config.vocab_size,
-                                                    logit_scale)
+            self.logits_processor = LogitsProcessor(
+                self.unpadded_vocab_size, config.vocab_size, logit_scale
+            )
         else:
             self.lm_head = PPMissingLayer()
 
         self.make_empty_intermediate_tensors = (
-            self.transformer.make_empty_intermediate_tensors)
+            self.transformer.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -526,8 +539,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        model_output = self.transformer(input_ids, positions,
-                                        intermediate_tensors, inputs_embeds)
+        model_output = self.transformer(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return model_output
 
     def compute_logits(
@@ -537,14 +551,12 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
             # With tie_word_embeddings, we can skip lm_head.weight
             # The weight might appear unnecessarily in the files if the model is
             # processed with quantization, LoRA, fine-tuning, etc.
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/exaone4.py b/vllm/model_executor/models/exaone4.py
index c78eedff6670..230a2c80104b 100644
--- a/vllm/model_executor/models/exaone4.py
+++ b/vllm/model_executor/models/exaone4.py
@@ -35,27 +35,38 @@
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, extract_layer_index,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class Exaone4GatedMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -81,8 +92,9 @@ def __init__(
             prefix=f"{prefix}.down_proj",
         )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -93,7 +105,6 @@ def forward(self, x):
 
 
 class Exaone4Attention(nn.Module):
-
     def __init__(
         self,
         config: Exaone4Config,
@@ -208,7 +219,6 @@ def forward(
 
 
 class Exaone4DecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Exaone4Config,
@@ -221,22 +231,25 @@ def __init__(
         rope_theta = getattr(config, "rope_theta", 1000000)
         rope_scaling = getattr(config, "rope_scaling", None)
         if rope_scaling is not None and getattr(
-                config, "original_max_position_embeddings", None):
+            config, "original_max_position_embeddings", None
+        ):
             rope_scaling["original_max_position_embeddings"] = (
-                config.original_max_position_embeddings)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+                config.original_max_position_embeddings
+            )
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         # Support abacusai/Smaug-72B-v0.1 with attention_bias
         # Support internlm/internlm-7b with bias
         attention_bias = getattr(config, "attention_bias", False) or getattr(
-            config, "bias", False)
+            config, "bias", False
+        )
 
         self.self_attn = Exaone4Attention(
             config=config,
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
-            num_kv_heads=getattr(config, "num_key_value_heads",
-                                 config.num_attention_heads),
+            num_kv_heads=getattr(
+                config, "num_key_value_heads", config.num_attention_heads
+            ),
             rope_theta=rope_theta,
             rope_scaling=rope_scaling,
             max_position_embeddings=max_position_embeddings,
@@ -253,10 +266,12 @@ def __init__(
             bias=getattr(config, "mlp_bias", False),
             prefix=f"{prefix}.mlp",
         )
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
-        self.post_feedforward_layernorm = RMSNorm(config.hidden_size,
-                                                  eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
+        self.post_feedforward_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -290,7 +305,6 @@ def forward(
 
 @support_torch_compile
 class Exaone4Model(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -301,11 +315,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.config = config
         self.quant_config = quant_config
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
-        if get_pp_group().is_first_rank or (config.tie_word_embeddings
-                                            and get_pp_group().is_last_rank):
+        if get_pp_group().is_first_rank or (
+            config.tie_word_embeddings and get_pp_group().is_last_rank
+        ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
@@ -329,9 +347,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         else:
             self.norm = PPMissingLayer()
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -362,16 +380,14 @@ def forward(
             )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states = self.norm(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv_proj", ".q_proj", "q"),
@@ -385,19 +401,19 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            if ("rotary_emb.cos_cached" in name
-                    or "rotary_emb.sin_cached" in name):
+            if "rotary_emb.cos_cached" in name or "rotary_emb.sin_cached" in name:
                 # Models trained using ColossalAI may include these tensors in
                 # the checkpoint. Skip them.
                 continue
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
@@ -430,8 +446,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -482,7 +497,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 padding_size=DEFAULT_VOCAB_PADDING_SIZE
                 # We need bigger padding if using lora for kernel
                 # compatibility
-                if not lora_config else lora_config.lora_vocab_padding_size,
+                if not lora_config
+                else lora_config.lora_vocab_padding_size,
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
@@ -490,14 +506,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 self.lm_head.weight = self.model.embed_tokens.weight
 
             logit_scale = getattr(config, "logit_scale", 1.0)
-            self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                    config.vocab_size,
-                                                    logit_scale)
+            self.logits_processor = LogitsProcessor(
+                self.unpadded_vocab_size, config.vocab_size, logit_scale
+            )
         else:
             self.lm_head = PPMissingLayer()
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -509,8 +526,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        model_output = self.model(input_ids, positions, intermediate_tensors,
-                                  inputs_embeds)
+        model_output = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return model_output
 
     def compute_logits(
@@ -520,14 +538,12 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
             # With tie_word_embeddings, we can skip lm_head.weight
             # The weight might appear unnecessarily in the files if the model is
             # processed with quantization, LoRA, fine-tuning, etc.
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/fairseq2_llama.py b/vllm/model_executor/models/fairseq2_llama.py
index d78ee100b26d..ca0e7e64df53 100644
--- a/vllm/model_executor/models/fairseq2_llama.py
+++ b/vllm/model_executor/models/fairseq2_llama.py
@@ -23,8 +23,10 @@
 from torch.nn import Parameter
 
 from vllm.config import VllmConfig
-from vllm.distributed import (get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size)
+from vllm.distributed import (
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.model_executor.layers.linear import set_weight_attrs
 from vllm.model_executor.models.llama import LlamaForCausalLM
 
@@ -32,7 +34,6 @@
 
 
 class Fairseq2LlamaForCausalLM(LlamaForCausalLM):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(vllm_config=vllm_config, prefix=prefix)
         self.tp_rank = get_tensor_model_parallel_rank()
@@ -45,14 +46,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             f"model.{self.tp_rank}.pt",
         ]
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         # fairseq2's serialization adds a wrapper to usual .pt state_dict's:
         # { "model_key": my_model_name, "my_model_name": state_dict }
         # which we first need to unpack
         weights_wrapped = dict(weights)
-        weights = weights_wrapped[
-            weights_wrapped["model_key"]].items()  # type: ignore
+        weights = weights_wrapped[weights_wrapped["model_key"]].items()  # type: ignore
 
         # remap keys
         fs2_to_vllm_mapper = WeightsMapper(
@@ -77,12 +76,14 @@ def load_weights(self, weights: Iterable[tuple[str,
 
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(
-            (self.reshape_fairseq2_weights(name, loaded_weight, params)
-             for name, loaded_weight in weights))
+            (
+                self.reshape_fairseq2_weights(name, loaded_weight, params)
+                for name, loaded_weight in weights
+            )
+        )
 
     def flag_sharded_weights(self, params: dict[str, Parameter]):
         """Sets the `is_sharded_weight` flag to True for all sharded weights"""
@@ -113,35 +114,34 @@ def permute(w: torch.Tensor, n_heads: int) -> torch.Tensor:
                 attn_in //= self.tp_size
                 n_heads //= self.tp_size
             attn_out = self.config.hidden_size
-            return (w.view(n_heads, attn_in // n_heads // 2, 2,
-                           attn_out).transpose(1,
-                                               2).reshape(attn_in, attn_out))
+            return (
+                w.view(n_heads, attn_in // n_heads // 2, 2, attn_out)
+                .transpose(1, 2)
+                .reshape(attn_in, attn_out)
+            )
 
         modules = name.split(".")
 
         # rotary embeds should be sliced
         if "k_proj" in modules:
-            loaded_weight = permute(loaded_weight,
-                                    self.config.num_key_value_heads)
+            loaded_weight = permute(loaded_weight, self.config.num_key_value_heads)
 
         elif "q_proj" in modules:
-            loaded_weight = permute(loaded_weight,
-                                    self.config.num_attention_heads)
+            loaded_weight = permute(loaded_weight, self.config.num_attention_heads)
 
         # We make the loaded weights compatible with both
         # full checkpoints and tp sharded checkpoints.
         # Embeddings are repeated to fit the vocab size.
-        # Other weights are flagged for the weight_loader calls.
+        # Other weights are flagged for the weight_loader calls.
         if any(emb in modules for emb in ["embed_tokens", "lm_head"]):
             # Embeddings are sharded on dim 0
             dim = 0
             # In fairseq2, vocab size has to be divisible by tp_size
             # so we don't worry about padding
-            if self.tp_size > 1 and loaded_weight.shape[
-                    dim] < self.config.vocab_size:
-                assert loaded_weight.shape[
-                    dim] * self.tp_size == self.config.vocab_size, \
-                        "vocab_size should be divisible by tp_size."
+            if self.tp_size > 1 and loaded_weight.shape[dim] < self.config.vocab_size:
+                assert (
+                    loaded_weight.shape[dim] * self.tp_size == self.config.vocab_size
+                ), "vocab_size should be divisible by tp_size."
                 repeats = [1] * len(loaded_weight.size())
                 repeats[dim] = self.tp_size
                 # repeat to match vocab size and to be easily 'narrow'able
diff --git a/vllm/model_executor/models/falcon.py b/vllm/model_executor/models/falcon.py
index 0c50056d1c52..211a9120789e 100644
--- a/vllm/model_executor/models/falcon.py
+++ b/vllm/model_executor/models/falcon.py
@@ -33,55 +33,65 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (get_pp_group, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_reduce)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_reduce,
+)
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs import RWConfig
 
 from .interfaces import SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 FalconConfig = Union[HF_FalconConfig, RWConfig]
 
 
 def _get_alibi_slopes(total_num_heads: int) -> torch.Tensor:
-    closest_power_of_2 = 2**math.floor(math.log2(total_num_heads))
-    base = torch.tensor(2**(-(2**-(math.log2(closest_power_of_2) - 3))),
-                        dtype=torch.float32)
+    closest_power_of_2 = 2 ** math.floor(math.log2(total_num_heads))
+    base = torch.tensor(
+        2 ** (-(2 ** -(math.log2(closest_power_of_2) - 3))), dtype=torch.float32
+    )
     powers = torch.arange(1, 1 + closest_power_of_2, dtype=torch.int32)
     slopes = torch.pow(base, powers)
 
     if closest_power_of_2 != total_num_heads:
         extra_base = torch.tensor(
-            2**(-(2**-(math.log2(2 * closest_power_of_2) - 3))),
-            dtype=torch.float32)
-        num_remaining_heads = min(closest_power_of_2,
-                                  total_num_heads - closest_power_of_2)
-        extra_powers = torch.arange(1,
-                                    1 + 2 * num_remaining_heads,
-                                    2,
-                                    dtype=torch.int32)
-        slopes = torch.cat(
-            [slopes, torch.pow(extra_base, extra_powers)], dim=0)
+            2 ** (-(2 ** -(math.log2(2 * closest_power_of_2) - 3))), dtype=torch.float32
+        )
+        num_remaining_heads = min(
+            closest_power_of_2, total_num_heads - closest_power_of_2
+        )
+        extra_powers = torch.arange(
+            1, 1 + 2 * num_remaining_heads, 2, dtype=torch.int32
+        )
+        slopes = torch.cat([slopes, torch.pow(extra_base, extra_powers)], dim=0)
 
     return slopes
 
 
 class FalconAttention(nn.Module):
-
     def __init__(
         self,
         config: FalconConfig,
@@ -133,59 +143,68 @@ def __init__(
 
         # Layer-wise attention scaling
         self.inv_norm_factor = 1.0 / math.sqrt(self.head_dim)
-        self.reduce_row_parallel_results = not (config.new_decoder_architecture
-                                                or config.parallel_attn)
+        self.reduce_row_parallel_results = not (
+            config.new_decoder_architecture or config.parallel_attn
+        )
         self.dense = RowParallelLinear(
             self.hidden_size,
             self.hidden_size,
             bias=config.bias,
             skip_bias_add=True,
             quant_config=quant_config,
-            reduce_results=self.reduce_row_parallel_results)
+            reduce_results=self.reduce_row_parallel_results,
+        )
 
         self.use_rotary = config.rotary
         self.use_alibi = config.alibi
         assert not (self.use_rotary and self.use_alibi), (
-            "Rotary and alibi are mutually exclusive.")
+            "Rotary and alibi are mutually exclusive."
+        )
 
         if self.use_rotary:
             rope_theta = getattr(config, "rope_theta", 10000)
-            max_position_embeddings = getattr(config,
-                                              "max_position_embeddings", 8192)
+            max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
             self.rotary_emb = get_rope(
                 self.head_dim,
                 rotary_dim=self.head_dim,
                 max_position=max_position_embeddings,
                 base=rope_theta,
             )
-            self.attn = Attention(self.num_heads,
-                                  self.head_dim,
-                                  self.inv_norm_factor,
-                                  num_kv_heads=self.num_kv_heads,
-                                  quant_config=quant_config,
-                                  prefix=f"{prefix}.attn")
+            self.attn = Attention(
+                self.num_heads,
+                self.head_dim,
+                self.inv_norm_factor,
+                num_kv_heads=self.num_kv_heads,
+                quant_config=quant_config,
+                prefix=f"{prefix}.attn",
+            )
         elif self.use_alibi:
             tp_rank = get_tensor_model_parallel_rank()
             head_start = tp_rank * self.num_heads
             head_end = (tp_rank + 1) * self.num_heads
-            alibi_slopes = (_get_alibi_slopes(self.total_num_heads) *
-                            self.inv_norm_factor)
+            alibi_slopes = (
+                _get_alibi_slopes(self.total_num_heads) * self.inv_norm_factor
+            )
             alibi_slopes = alibi_slopes[head_start:head_end].tolist()
-            self.attn = Attention(self.num_heads,
-                                  self.head_dim,
-                                  self.inv_norm_factor,
-                                  num_kv_heads=self.num_kv_heads,
-                                  alibi_slopes=alibi_slopes,
-                                  quant_config=quant_config,
-                                  prefix=f"{prefix}.attn")
+            self.attn = Attention(
+                self.num_heads,
+                self.head_dim,
+                self.inv_norm_factor,
+                num_kv_heads=self.num_kv_heads,
+                alibi_slopes=alibi_slopes,
+                quant_config=quant_config,
+                prefix=f"{prefix}.attn",
+            )
         else:
-            self.attn = Attention(self.num_heads,
-                                  self.head_dim,
-                                  scale=self.inv_norm_factor,
-                                  num_kv_heads=self.num_kv_heads,
-                                  cache_config=cache_config,
-                                  quant_config=quant_config,
-                                  prefix=f"{prefix}.attn")
+            self.attn = Attention(
+                self.num_heads,
+                self.head_dim,
+                scale=self.inv_norm_factor,
+                num_kv_heads=self.num_kv_heads,
+                cache_config=cache_config,
+                quant_config=quant_config,
+                prefix=f"{prefix}.attn",
+            )
 
     def forward(
         self,
@@ -204,7 +223,6 @@ def forward(
 
 
 class FalconMLP(nn.Module):
-
     def __init__(
         self,
         config: FalconConfig,
@@ -213,21 +231,25 @@ def __init__(
         super().__init__()
         hidden_size = config.hidden_size
 
-        self.dense_h_to_4h = ColumnParallelLinear(hidden_size,
-                                                  4 * hidden_size,
-                                                  bias=config.bias,
-                                                  skip_bias_add=True,
-                                                  quant_config=quant_config)
+        self.dense_h_to_4h = ColumnParallelLinear(
+            hidden_size,
+            4 * hidden_size,
+            bias=config.bias,
+            skip_bias_add=True,
+            quant_config=quant_config,
+        )
         self.act = get_act_fn("gelu")
-        self.reduce_row_parallel_results = not (config.new_decoder_architecture
-                                                or config.parallel_attn)
+        self.reduce_row_parallel_results = not (
+            config.new_decoder_architecture or config.parallel_attn
+        )
         self.dense_4h_to_h = RowParallelLinear(
             4 * hidden_size,
             hidden_size,
             bias=config.bias,
             skip_bias_add=True,
             reduce_results=self.reduce_row_parallel_results,
-            quant_config=quant_config)
+            quant_config=quant_config,
+        )
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         # NOTE(zhuohan): Following huggingface, we do not fuse bias add here.
@@ -240,7 +262,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class FalconDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: FalconConfig,
@@ -252,39 +273,36 @@ def __init__(
         hidden_size = config.hidden_size
         self.num_heads = config.num_attention_heads
         self.self_attention = FalconAttention(
-            config,
-            cache_config,
-            quant_config,
-            prefix=f"{prefix}.self_attention")
+            config, cache_config, quant_config, prefix=f"{prefix}.self_attention"
+        )
         self.mlp = FalconMLP(config, quant_config)
         self.config = config
 
-        if (not hasattr(config, "num_ln_in_parallel_attn")):
+        if not hasattr(config, "num_ln_in_parallel_attn"):
             config.num_ln_in_parallel_attn = None
 
-        if (config.num_ln_in_parallel_attn is None
-                and config.new_decoder_architecture):
+        if config.num_ln_in_parallel_attn is None and config.new_decoder_architecture:
             config.num_ln_in_parallel_attn = 2
 
         if not config.parallel_attn:
             self.post_attention_layernorm = LayerNorm(
-                hidden_size, eps=config.layer_norm_epsilon)
-            self.input_layernorm = LayerNorm(hidden_size,
-                                             eps=config.layer_norm_epsilon)
+                hidden_size, eps=config.layer_norm_epsilon
+            )
+            self.input_layernorm = LayerNorm(hidden_size, eps=config.layer_norm_epsilon)
         else:
             if config.num_ln_in_parallel_attn == 2:
                 # The layer norm before self-attention
-                self.ln_attn = LayerNorm(hidden_size,
-                                         eps=config.layer_norm_epsilon)
+                self.ln_attn = LayerNorm(hidden_size, eps=config.layer_norm_epsilon)
                 # The layer norm before the MLP
-                self.ln_mlp = LayerNorm(hidden_size,
-                                        eps=config.layer_norm_epsilon)
+                self.ln_mlp = LayerNorm(hidden_size, eps=config.layer_norm_epsilon)
             else:
-                self.input_layernorm = LayerNorm(hidden_size,
-                                                 eps=config.layer_norm_epsilon)
+                self.input_layernorm = LayerNorm(
+                    hidden_size, eps=config.layer_norm_epsilon
+                )
 
-        self.reduce_row_parallel_results = not (config.new_decoder_architecture
-                                                or config.parallel_attn)
+        self.reduce_row_parallel_results = not (
+            config.new_decoder_architecture or config.parallel_attn
+        )
 
     def forward(
         self,
@@ -314,8 +332,11 @@ def forward(
                 residual += attention_output
                 mlp_layernorm_out = self.post_attention_layernorm(residual)
 
-        if (self.config.new_decoder_architecture and self.config.parallel_attn
-                and self.config.num_ln_in_parallel_attn == 1):
+        if (
+            self.config.new_decoder_architecture
+            and self.config.parallel_attn
+            and self.config.num_ln_in_parallel_attn == 1
+        ):
             mlp_layernorm_out = attention_layernorm_out
 
         # MLP.
@@ -340,7 +361,6 @@ def forward(
 
 @support_torch_compile
 class FalconModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -363,14 +383,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.start_layer, self.end_layer, self.h = make_layers(
             config.num_hidden_layers,
             lambda prefix: FalconDecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.h")
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.h",
+        )
 
         # Final Layer Norm
         self.ln_f = LayerNorm(self.embed_dim, eps=config.layer_norm_epsilon)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.word_embeddings(input_ids)
@@ -396,8 +418,7 @@ def forward(
         hidden_states = self.ln_f(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         total_num_heads = self.config.num_attention_heads
         if self.config.new_decoder_architecture:
             total_num_kv_heads = self.config.num_kv_heads
@@ -420,26 +441,34 @@ def load_weights(self, weights: Iterable[tuple[str,
                 loaded_weight_shape = loaded_weight.shape
                 if output_dim is not None:
                     loaded_weight = loaded_weight.view(
-                        loaded_weight_shape[:output_dim] +
-                        (total_num_kv_heads, num_query_heads_per_kv_head + 2,
-                         -1) + loaded_weight_shape[output_dim + 1:])
+                        loaded_weight_shape[:output_dim]
+                        + (total_num_kv_heads, num_query_heads_per_kv_head + 2, -1)
+                        + loaded_weight_shape[output_dim + 1 :]
+                    )
                     wq = loaded_weight.narrow(
-                        output_dim + 1, 0,
-                        num_query_heads_per_kv_head).reshape(
-                            *loaded_weight_shape[:output_dim], -1,
-                            *loaded_weight_shape[output_dim + 1:])
+                        output_dim + 1, 0, num_query_heads_per_kv_head
+                    ).reshape(
+                        *loaded_weight_shape[:output_dim],
+                        -1,
+                        *loaded_weight_shape[output_dim + 1 :],
+                    )
                     wk = loaded_weight.narrow(
-                        output_dim + 1, num_query_heads_per_kv_head,
-                        1).reshape(*loaded_weight_shape[:output_dim], -1,
-                                   *loaded_weight_shape[output_dim + 1:])
+                        output_dim + 1, num_query_heads_per_kv_head, 1
+                    ).reshape(
+                        *loaded_weight_shape[:output_dim],
+                        -1,
+                        *loaded_weight_shape[output_dim + 1 :],
+                    )
                     wv = loaded_weight.narrow(
-                        output_dim + 1, num_query_heads_per_kv_head + 1,
-                        1).reshape(*loaded_weight_shape[:output_dim], -1,
-                                   *loaded_weight_shape[output_dim + 1:])
+                        output_dim + 1, num_query_heads_per_kv_head + 1, 1
+                    ).reshape(
+                        *loaded_weight_shape[:output_dim],
+                        -1,
+                        *loaded_weight_shape[output_dim + 1 :],
+                    )
                     loaded_weight = torch.cat([wq, wk, wv], dim=output_dim)
 
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -456,15 +485,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.transformer = FalconModel(vllm_config=vllm_config,
-                                       prefix=maybe_prefix(
-                                           prefix, "transformer"))
+        self.transformer = FalconModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "transformer")
+        )
         # only Falcon-11B doesn't share lm_head weight with word embeddings
         # and previous Falcon model doesn't have tie_word_embeddings config
         # so we set tie_word_embeddings to True by default
-        self.tie_word_embeddings = (config.tie_word_embeddings
-                                    if config.tie_word_embeddings is not None
-                                    else True)
+        self.tie_word_embeddings = (
+            config.tie_word_embeddings
+            if config.tie_word_embeddings is not None
+            else True
+        )
         if self.tie_word_embeddings:
             self.lm_head = self.transformer.word_embeddings
         else:
@@ -476,7 +507,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             )
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.transformer.make_empty_intermediate_tensors)
+            self.transformer.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.transformer.get_input_embeddings(input_ids)
@@ -488,8 +520,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-        hidden_states = self.transformer(input_ids, positions,
-                                         intermediate_tensors, inputs_embeds)
+        hidden_states = self.transformer(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -499,11 +532,9 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/falcon_h1.py b/vllm/model_executor/models/falcon_h1.py
index ccea9add093f..8af08711038d 100644
--- a/vllm/model_executor/models/falcon_h1.py
+++ b/vllm/model_executor/models/falcon_h1.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Inference-only FalconH1 model."""
+
 from collections.abc import Iterable
 from typing import Optional
 
@@ -15,28 +16,38 @@
 from vllm.distributed.parallel_state import get_pp_group
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.mamba.mamba_mixer2 import MambaMixer2
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import HasInnerState, IsHybrid, SupportsLoRA, SupportsPP
-from .utils import (PPMissingLayer, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class FalconH1MLP(nn.Module):
-
     def __init__(
         self,
         config: FalconH1Config,
@@ -60,13 +71,15 @@ def __init__(
         self.intermediate_size = config.intermediate_size
         self.gate_multiplier, self.down_multiplier = config.mlp_multipliers
         if config.hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {config.hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {config.hidden_act}. "
+                "Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
         x, _ = self.gate_up_proj(x)
-        x[:, :self.intermediate_size // self.tp_size] *= self.gate_multiplier
+        x[:, : self.intermediate_size // self.tp_size] *= self.gate_multiplier
         x = self.act_fn(x)
         x, _ = self.down_proj(x)
         x = x * self.down_multiplier
@@ -74,7 +87,6 @@ def forward(self, x):
 
 
 class FalconH1SSMDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: FalconH1Config,
@@ -87,8 +99,11 @@ def __init__(
         self.config = config
         self.tp_size = get_tensor_model_parallel_world_size()
 
-        self.d_ssm = (int(config.mamba_expand * config.hidden_size)
-                      if config.mamba_d_ssm is None else config.mamba_d_ssm)
+        self.d_ssm = (
+            int(config.mamba_expand * config.hidden_size)
+            if config.mamba_d_ssm is None
+            else config.mamba_d_ssm
+        )
 
         self.mamba = MambaMixer2(
             hidden_size=config.hidden_size,
@@ -115,15 +130,15 @@ def __init__(
 
     def _init_mup_vector(self):
         """
-        Non learnable per-block scaling vector composed of element-wise 
-        multipliersapplied to each separate contiguous block of the output 
+        Non learnable per-block scaling vector composed of element-wise
+        multipliersapplied to each separate contiguous block of the output
         of the linear projection (in_proj) before further processing
         (gating, convolution, SSM):
 
             - Z block:  [0 : d_ssm]                      → zxbcdt_multipliers[0]
             - X block:  [d_ssm : 2 * d_ssm]              → zxbcdt_multipliers[1]
             - B block:  [2 * d_ssm : 2 * d_ssm + G * S]  → zxbcdt_multipliers[2]
-            - C block:  [2 * d_ssm + G * S : 2 * d_ssm + 2 * G * S] 
+            - C block:  [2 * d_ssm + G * S : 2 * d_ssm + 2 * G * S]
                         → zxbcdt_multipliers[3]
             - dt block: [2 * d_ssm + 2 * G * S : end]    → zxbcdt_multipliers[4]
 
@@ -133,38 +148,38 @@ def _init_mup_vector(self):
             - S:         SSM state size per group
             - All indices are divided by tp_size to support tensor parallelism
         """
-        vector_shape = (2 * self.d_ssm + 2 * self.groups_time_state_size +
-                        self.config.mamba_n_heads) // self.tp_size
+        vector_shape = (
+            2 * self.d_ssm + 2 * self.groups_time_state_size + self.config.mamba_n_heads
+        ) // self.tp_size
         mup_vector = torch.ones(1, vector_shape)
         # Z vector 0 -> d_ssm
-        mup_vector[:, :self.d_ssm //
-                   self.tp_size] *= self.zxbcdt_multipliers[0]
+        mup_vector[:, : self.d_ssm // self.tp_size] *= self.zxbcdt_multipliers[0]
         # X vector d_ssm -> 2 * d_ssm
-        mup_vector[:,
-                   (self.d_ssm //
-                    self.tp_size):(2 * self.d_ssm //
-                                   self.tp_size)] *= self.zxbcdt_multipliers[1]
+        mup_vector[
+            :, (self.d_ssm // self.tp_size) : (2 * self.d_ssm // self.tp_size)
+        ] *= self.zxbcdt_multipliers[1]
         # B vector 2 * d_ssm -> 2 * d_ssm + (n_group * d_state)
         mup_vector[
             :,
-            (2 * self.d_ssm) //
-            self.tp_size:(2 * self.d_ssm + self.groups_time_state_size) //
-            self.tp_size,
+            (2 * self.d_ssm) // self.tp_size : (
+                2 * self.d_ssm + self.groups_time_state_size
+            )
+            // self.tp_size,
         ] *= self.zxbcdt_multipliers[2]
         # C vector 2 * d_ssm + (n_group * d_state)
         # -> 2 * d_ssm + 2 * (n_group * d_state)
         mup_vector[
             :,
-            (2 * self.d_ssm + self.groups_time_state_size) //
-            self.tp_size:(2 * self.d_ssm + 2 * self.groups_time_state_size) //
-            self.tp_size,
+            (2 * self.d_ssm + self.groups_time_state_size) // self.tp_size : (
+                2 * self.d_ssm + 2 * self.groups_time_state_size
+            )
+            // self.tp_size,
         ] *= self.zxbcdt_multipliers[3]
         # dt vector 2 * d_ssm + 2 * (n_group * d_state)
         # -> 2 * d_ssm + 2 * (n_group * d_state) + n_heads
         mup_vector[
             :,
-            (2 * self.d_ssm + 2 * self.groups_time_state_size) //
-            self.tp_size:,
+            (2 * self.d_ssm + 2 * self.groups_time_state_size) // self.tp_size :,
         ] *= self.zxbcdt_multipliers[4]
 
         self.register_buffer("mup_vector", mup_vector, persistent=False)
@@ -185,7 +200,6 @@ def forward(
 
 
 class FalconH1AttentionDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: FalconH1Config,
@@ -196,8 +210,7 @@ def __init__(
         super().__init__()
         rope_theta = getattr(config, "rope_theta", 1e11)
         rope_scaling = getattr(config, "rope_scaling", None)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         self.hidden_size = config.hidden_size
         tp_size = get_tensor_model_parallel_world_size()
         self.total_num_heads = config.num_attention_heads
@@ -213,8 +226,11 @@ def __init__(
             # the KV heads across multiple tensor parallel GPUs.
             assert tp_size % self.total_num_kv_heads == 0
         self.num_kv_heads = max(1, self.total_num_kv_heads // tp_size)
-        self.head_dim = (config.hidden_size // self.total_num_heads if getattr(
-            config, "head_dim", None) is None else config.head_dim)
+        self.head_dim = (
+            config.hidden_size // self.total_num_heads
+            if getattr(config, "head_dim", None) is None
+            else config.head_dim
+        )
         self.q_size = self.num_heads * self.head_dim
         self.kv_size = self.num_kv_heads * self.head_dim
         self.scaling = self.head_dim**-0.5
@@ -345,10 +361,8 @@ def __init__(
 
         self.feed_forward = FalconH1MLP(config)
 
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.pre_ff_layernorm = RMSNorm(config.hidden_size,
-                                        eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.pre_ff_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def forward(
         self,
@@ -380,7 +394,8 @@ def forward(
         # We assume both branches produce outputs of the same
         # dimensionality (config.hidden_size).
         hidden_states = (attn_hidden * self.attn_out_multiplier) + (
-            ssm_hidden * self.ssm_out_multiplier)
+            ssm_hidden * self.ssm_out_multiplier
+        )
         hidden_states = hidden_states + residual
 
         # feed-forward
@@ -394,7 +409,6 @@ def forward(
 
 @support_torch_compile
 class FalconH1Model(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config: FalconH1Config = vllm_config.model_config.hf_config
@@ -404,12 +418,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         lora_config = vllm_config.lora_config
 
         self.config = config
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
         if get_pp_group().is_first_rank:
-
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
@@ -433,13 +449,13 @@ def get_layer(prefix: str):
             )
 
         self.start_layer, self.end_layer, self.layers = make_layers(
-            config.num_hidden_layers, get_layer, prefix=f"{prefix}.layers")
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+            config.num_hidden_layers, get_layer, prefix=f"{prefix}.layers"
+        )
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
         if get_pp_group().is_last_rank:
-            self.final_layernorm = RMSNorm(config.hidden_size,
-                                           eps=config.rms_norm_eps)
+            self.final_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         else:
             self.final_layernorm = PPMissingLayer()
 
@@ -453,13 +469,13 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-
         if get_pp_group().is_first_rank:
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds * self.embedding_multiplier
             else:
-                hidden_states = (self.get_input_embeddings(input_ids) *
-                                 self.embedding_multiplier)
+                hidden_states = (
+                    self.get_input_embeddings(input_ids) * self.embedding_multiplier
+                )
         else:
             assert intermediate_tensors is not None
             hidden_states = intermediate_tensors["hidden_states"]
@@ -471,15 +487,16 @@ def forward(
                 hidden_states=hidden_states,
             )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-            })
+            return IntermediateTensors(
+                {
+                    "hidden_states": hidden_states,
+                }
+            )
         hidden_states = self.final_layernorm(hidden_states)
         return hidden_states
 
 
-class FalconH1ForCausalLM(nn.Module, HasInnerState, SupportsLoRA, SupportsPP,
-                          IsHybrid):
+class FalconH1ForCausalLM(nn.Module, HasInnerState, SupportsLoRA, SupportsPP, IsHybrid):
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
         "gate_up_proj": ["gate_proj", "up_proj"],
@@ -496,7 +513,6 @@ def get_mamba_state_dtype_from_config(
         cls,
         vllm_config: "VllmConfig",
     ) -> tuple[torch.dtype, torch.dtype]:
-
         return MambaStateDtypeCalculator.mamba2_state_dtype(
             vllm_config.model_config.dtype,
             vllm_config.cache_config.mamba_cache_dtype,
@@ -521,10 +537,11 @@ def get_mamba_state_shape_from_config(
         parallel_config = vllm_config.parallel_config
         hf_config = vllm_config.model_config.hf_config
 
-        intermediate_size = (int(hf_config.mamba_expand *
-                                 hf_config.hidden_size)
-                             if hf_config.mamba_d_ssm is None else
-                             hf_config.mamba_d_ssm)
+        intermediate_size = (
+            int(hf_config.mamba_expand * hf_config.hidden_size)
+            if hf_config.mamba_d_ssm is None
+            else hf_config.mamba_d_ssm
+        )
 
         return MambaStateShapeCalculator.mamba2_state_shape(
             intermediate_size=intermediate_size,
@@ -548,8 +565,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         self.config = config
         self.scheduler_config = scheduler_config
-        self.model = FalconH1Model(vllm_config=vllm_config,
-                                   prefix=maybe_prefix(prefix, "model"))
+        self.model = FalconH1Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.tie_word_embeddings = config.tie_word_embeddings
         self.unpadded_vocab_size = config.vocab_size
         if lora_config:
@@ -563,14 +581,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                     DEFAULT_VOCAB_PADDING_SIZE
                     # We need bigger padding if using lora for kernel
                     # compatibility
-                    if not lora_config else
-                    lora_config.lora_vocab_padding_size),
+                    if not lora_config
+                    else lora_config.lora_vocab_padding_size
+                ),
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
             self.lm_head_multiplier = config.lm_head_multiplier
             if self.tie_word_embeddings:
-                self.lm_head = self.lm_head.tie_weights(
-                    self.model.embed_tokens)
+                self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
             # Used to track and store by the Mamba cache between steps.
 
             self.logits_processor = LogitsProcessor(
@@ -582,7 +600,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head = PPMissingLayer()
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -595,7 +614,6 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs,
     ):
-
         hidden_states = self.model(
             input_ids,
             positions,
@@ -613,8 +631,7 @@ def compute_logits(
 
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -661,8 +678,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
 
diff --git a/vllm/model_executor/models/fuyu.py b/vllm/model_executor/models/fuyu.py
index a0f8d0659c59..83572563c15e 100644
--- a/vllm/model_executor/models/fuyu.py
+++ b/vllm/model_executor/models/fuyu.py
@@ -16,28 +16,34 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
-""" PyTorch Fuyu model."""
+"""PyTorch Fuyu model."""
+
 import math
 from collections.abc import Iterable, Mapping, Sequence
 from typing import Annotated, Literal, Optional
 
 import torch
 import torch.nn as nn
-from transformers import (BatchFeature, FuyuConfig, FuyuImageProcessor,
-                          FuyuProcessor)
+from transformers import BatchFeature, FuyuConfig, FuyuImageProcessor, FuyuProcessor
 
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.linear import ColumnParallelLinear
 from vllm.model_executor.models.persimmon import PersimmonForCausalLM
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
-from vllm.multimodal.parse import (ImageProcessorItems, ImageSize,
-                                   MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
+from vllm.multimodal.parse import ImageProcessorItems, ImageSize, MultiModalDataItems
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
@@ -72,7 +78,6 @@ class FuyuImagePatchInputs(TensorSchema):
 
 
 class FuyuProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(FuyuConfig)
 
@@ -124,12 +129,12 @@ def get_num_image_tokens(
 
     def get_image_size_with_most_features(self) -> ImageSize:
         image_processor = self.get_image_processor()
-        return ImageSize(width=image_processor.size["width"],
-                         height=image_processor.size["height"])
+        return ImageSize(
+            width=image_processor.size["width"], height=image_processor.size["height"]
+        )
 
 
 class FuyuDummyInputsBuilder(BaseDummyInputsBuilder[FuyuProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         return ""
 
@@ -139,23 +144,22 @@ def get_dummy_mm_data(
         mm_counts: Mapping[str, int],
         mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
         num_images = mm_counts.get("image", 0)
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class FuyuMultiModalProcessor(BaseMultiModalProcessor[FuyuProcessingInfo]):
-
     def _call_hf_processor(
         self,
         prompt: str,
@@ -179,7 +183,8 @@ def _call_hf_processor(
         image_patches = processed_outputs["image_patches"]
         processed_outputs["image_patches"] = flatten_bn(image_patches)
         processed_outputs["patches_per_image"] = torch.tensor(
-            [len(p) for p in image_patches])
+            [len(p) for p in image_patches]
+        )
 
         return processed_outputs
 
@@ -206,7 +211,8 @@ def _get_mm_fields_config(
 
         return dict(
             image_patches=MultiModalFieldConfig.flat_from_sizes(
-                "image", patches_per_image),
+                "image", patches_per_image
+            ),
             patches_per_image=MultiModalFieldConfig.batched("image"),
         )
 
@@ -232,8 +238,7 @@ def get_replacement_fuyu(item_idx: int):
                 image_width=image_size.width,
                 image_height=image_size.height,
             )
-            image_tokens = ([_IMAGE_TOKEN_ID] * ncols +
-                            [_NEWLINE_TOKEN_ID]) * nrows
+            image_tokens = ([_IMAGE_TOKEN_ID] * ncols + [_NEWLINE_TOKEN_ID]) * nrows
 
             return PromptUpdateDetails.select_token_id(
                 image_tokens + [bos_token_id],
@@ -249,9 +254,11 @@ def get_replacement_fuyu(item_idx: int):
         ]
 
 
-@MULTIMODAL_REGISTRY.register_processor(FuyuMultiModalProcessor,
-                                        info=FuyuProcessingInfo,
-                                        dummy_inputs=FuyuDummyInputsBuilder)
+@MULTIMODAL_REGISTRY.register_processor(
+    FuyuMultiModalProcessor,
+    info=FuyuProcessingInfo,
+    dummy_inputs=FuyuDummyInputsBuilder,
+)
 class FuyuForCausalLM(nn.Module, SupportsMultiModal, SupportsPP):
     merge_by_field_config = True
 
@@ -260,7 +267,8 @@ class FuyuForCausalLM(nn.Module, SupportsMultiModal, SupportsPP):
             "model.vision_embed_tokens.": "vision_embed_tokens.",
             "model.language_model.": "language_model.model.",
             "lm_head.": "language_model.lm_head.",
-        })
+        }
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -292,10 +300,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             prefix=maybe_prefix(prefix, "language_model"),
         )
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[FuyuImagePatchInputs]:
+        self, **kwargs: object
+    ) -> Optional[FuyuImagePatchInputs]:
         image_patches = kwargs.pop("image_patches", None)
         patches_per_image = kwargs.pop("patches_per_image", None)
 
@@ -310,21 +320,20 @@ def _parse_and_validate_image_input(
         )
 
     def _process_image_input(
-            self, image_input: FuyuImagePatchInputs) -> MultiModalEmbeddings:
+        self, image_input: FuyuImagePatchInputs
+    ) -> MultiModalEmbeddings:
         image_patches_flat = image_input["image_patches_flat"]
         patches_per_image = image_input["patches_per_image"]
 
         assert self.vision_embed_tokens is not None
-        vision_embeddings_flat, _ = self.vision_embed_tokens(
-            image_patches_flat)
+        vision_embeddings_flat, _ = self.vision_embed_tokens(image_patches_flat)
 
         return vision_embeddings_flat.split(patches_per_image.tolist(), dim=0)
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -355,10 +364,10 @@ def compute_logits(
         hidden_states: torch.Tensor,
     ) -> Optional[torch.Tensor]:
         logits = self.language_model.logits_processor(
-            self.language_model.lm_head, hidden_states)
+            self.language_model.lm_head, hidden_states
+        )
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/gemma.py b/vllm/model_executor/models/gemma.py
index c19425b6cb6d..b152f52223cf 100644
--- a/vllm/model_executor/models/gemma.py
+++ b/vllm/model_executor/models/gemma.py
@@ -16,6 +16,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Gemma model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from functools import cache
 from itertools import islice
@@ -32,21 +33,26 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import GeluAndMul
 from vllm.model_executor.layers.layernorm import GemmaRMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
@@ -66,19 +72,22 @@ def _get_gemma_act_fn(
                 "`%s`, edit the config JSON to set "
                 "`hidden_activation=%s` instead of `hidden_act`. "
                 "See https://github.com/huggingface/transformers/pull/29402 "
-                "for more details.", hidden_act, hidden_act)
+                "for more details.",
+                hidden_act,
+                hidden_act,
+            )
         return GeluAndMul(approximate="tanh")
     elif hidden_activation == "gelu_pytorch_tanh":
         return GeluAndMul(approximate="tanh")
     elif hidden_activation == "gelu":
         return GeluAndMul(approximate="none")
     else:
-        raise ValueError(f"Activation function {hidden_act} is not "
-                         "supported for Gemma models.")
+        raise ValueError(
+            f"Activation function {hidden_act} is not supported for Gemma models."
+        )
 
 
 class GemmaMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -113,7 +122,6 @@ def forward(self, x):
 
 
 class GemmaAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -172,13 +180,15 @@ def __init__(
             base=self.rope_theta,
             is_neox_style=True,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -194,7 +204,6 @@ def forward(
 
 
 class GemmaDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: GemmaConfig,
@@ -223,10 +232,10 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.mlp",
         )
-        self.input_layernorm = GemmaRMSNorm(config.hidden_size,
-                                            eps=config.rms_norm_eps)
-        self.post_attention_layernorm = GemmaRMSNorm(config.hidden_size,
-                                                     eps=config.rms_norm_eps)
+        self.input_layernorm = GemmaRMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = GemmaRMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -239,23 +248,20 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
 
 @support_torch_compile
 class GemmaModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -272,8 +278,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: GemmaDecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.layers",
+        )
         self.norm = GemmaRMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
         # Normalize the embedding by sqrt(hidden_size)
@@ -281,12 +289,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         # data type such as bfloat16, not float32.
         # See https://github.com/huggingface/transformers/pull/29402
         normalizer = self.config.hidden_size**0.5
-        self.register_buffer("normalizer",
-                             torch.tensor(normalizer),
-                             persistent=False)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.register_buffer("normalizer", torch.tensor(normalizer), persistent=False)
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -315,15 +321,13 @@ def forward(
                 residual,
             )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -335,7 +339,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            for (param_name, shard_name, shard_id) in stacked_params_mapping:
+            for param_name, shard_name, shard_id in stacked_params_mapping:
                 if shard_name not in name:
                     continue
                 name = name.replace(shard_name, param_name)
@@ -355,8 +359,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
 
@@ -388,11 +391,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.lora_config = lora_config
 
         self.quant_config = quant_config
-        self.model = GemmaModel(vllm_config=vllm_config,
-                                prefix=maybe_prefix(prefix, "model"))
+        self.model = GemmaModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -404,8 +409,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -415,11 +421,9 @@ def compute_logits(
         logits = self.logits_processor(self.model.embed_tokens, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/gemma2.py b/vllm/model_executor/models/gemma2.py
index 3f76e1e7d42a..2d26edcf6609 100644
--- a/vllm/model_executor/models/gemma2.py
+++ b/vllm/model_executor/models/gemma2.py
@@ -31,29 +31,35 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import GeluAndMul
 from vllm.model_executor.layers.layernorm import GemmaRMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, extract_layer_index,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
 
 class Gemma2MLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -64,18 +70,17 @@ def __init__(
     ) -> None:
         super().__init__()
         self.gate_up_proj = MergedColumnParallelLinear(
-            hidden_size, [intermediate_size] * 2,
-            bias=False,
-            quant_config=quant_config)
-        self.down_proj = RowParallelLinear(intermediate_size,
-                                           hidden_size,
-                                           bias=False,
-                                           quant_config=quant_config)
+            hidden_size, [intermediate_size] * 2, bias=False, quant_config=quant_config
+        )
+        self.down_proj = RowParallelLinear(
+            intermediate_size, hidden_size, bias=False, quant_config=quant_config
+        )
         if not (hidden_act == hidden_activation == "gelu_pytorch_tanh"):
             raise ValueError(
                 "Gemma2 uses `gelu_pytorch_tanh` as the hidden activation "
                 "function. Please set `hidden_act` and `hidden_activation` to "
-                "`gelu_pytorch_tanh`.")
+                "`gelu_pytorch_tanh`."
+            )
         self.act_fn = GeluAndMul(approximate="tanh")
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -86,19 +91,20 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class Gemma2Attention(nn.Module):
-
-    def __init__(self,
-                 config: Gemma2Config,
-                 hidden_size: int,
-                 num_heads: int,
-                 num_kv_heads: int,
-                 head_dim: int,
-                 max_position_embeddings: int,
-                 rope_theta: float,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 attn_logits_soft_cap: Optional[float] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: Gemma2Config,
+        hidden_size: int,
+        num_heads: int,
+        num_kv_heads: int,
+        head_dim: int,
+        max_position_embeddings: int,
+        rope_theta: float,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        attn_logits_soft_cap: Optional[float] = None,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
         self.config = config
         self.hidden_size = hidden_size
@@ -148,15 +154,17 @@ def __init__(self,
         is_sliding = config.layer_types[layer_idx] == "sliding_attention"
         sliding_window = config.sliding_window if is_sliding else None
 
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              logits_soft_cap=attn_logits_soft_cap,
-                              per_layer_sliding_window=sliding_window,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            logits_soft_cap=attn_logits_soft_cap,
+            per_layer_sliding_window=sliding_window,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -172,7 +180,6 @@ def forward(
 
 
 class Gemma2DecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Gemma2Config,
@@ -203,14 +210,16 @@ def __init__(
             hidden_activation=config.hidden_activation,
             quant_config=quant_config,
         )
-        self.input_layernorm = GemmaRMSNorm(config.hidden_size,
-                                            eps=config.rms_norm_eps)
-        self.post_attention_layernorm = GemmaRMSNorm(config.hidden_size,
-                                                     eps=config.rms_norm_eps)
-        self.pre_feedforward_layernorm = GemmaRMSNorm(config.hidden_size,
-                                                      eps=config.rms_norm_eps)
-        self.post_feedforward_layernorm = GemmaRMSNorm(config.hidden_size,
-                                                       eps=config.rms_norm_eps)
+        self.input_layernorm = GemmaRMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = GemmaRMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
+        self.pre_feedforward_layernorm = GemmaRMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
+        self.post_feedforward_layernorm = GemmaRMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -222,8 +231,7 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
@@ -231,7 +239,8 @@ def forward(
         hidden_states = self.post_attention_layernorm(hidden_states)
 
         hidden_states, residual = self.pre_feedforward_layernorm(
-            hidden_states, residual)
+            hidden_states, residual
+        )
         hidden_states = self.mlp(hidden_states)
         hidden_states = self.post_feedforward_layernorm(hidden_states)
         return hidden_states, residual
@@ -239,7 +248,6 @@ def forward(
 
 @support_torch_compile
 class Gemma2Model(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
@@ -255,8 +263,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: Gemma2DecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.layers",
+        )
         self.norm = GemmaRMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
         # Normalize the embedding by sqrt(hidden_size)
@@ -264,12 +274,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         # data type such as bfloat16, not float32.
         # See https://github.com/huggingface/transformers/pull/29402
         normalizer = self.config.hidden_size**0.5
-        self.register_buffer("normalizer",
-                             torch.tensor(normalizer),
-                             persistent=False)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.register_buffer("normalizer", torch.tensor(normalizer), persistent=False)
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -299,15 +307,13 @@ def forward(
                 residual,
             )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -319,17 +325,17 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache scales for compressed-tensors quantization
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 loaded_weight = loaded_weight[0]
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
-            for (param_name, shard_name, shard_id) in stacked_params_mapping:
+            for param_name, shard_name, shard_id in stacked_params_mapping:
                 if shard_name not in name:
                     continue
                 name = name.replace(shard_name, param_name)
@@ -353,8 +359,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
 
@@ -384,12 +389,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         # currently all existing Gemma models have `tie_word_embeddings` enabled
         assert config.tie_word_embeddings
         self.quant_config = quant_config
-        self.model = Gemma2Model(vllm_config=vllm_config,
-                                 prefix=maybe_prefix(prefix, "model"))
+        self.model = Gemma2Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.logits_processor = LogitsProcessor(
-            config.vocab_size, soft_cap=config.final_logit_softcapping)
+            config.vocab_size, soft_cap=config.final_logit_softcapping
+        )
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -401,8 +409,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -412,11 +421,9 @@ def compute_logits(
         logits = self.logits_processor(self.model.embed_tokens, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/gemma3.py b/vllm/model_executor/models/gemma3.py
index 77c0ef8cb91d..9fa8e1c78b12 100644
--- a/vllm/model_executor/models/gemma3.py
+++ b/vllm/model_executor/models/gemma3.py
@@ -31,30 +31,36 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import GeluAndMul
 from vllm.model_executor.layers.layernorm import GemmaRMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from ...attention.layers.encoder_only_attention import EncoderOnlyAttention
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, extract_layer_index,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
 
 class Gemma3MLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -82,7 +88,8 @@ def __init__(
             raise ValueError(
                 "Gemma3 uses `gelu_pytorch_tanh` as the hidden activation "
                 "function. Please set `hidden_act` and `hidden_activation` to "
-                "`gelu_pytorch_tanh`.")
+                "`gelu_pytorch_tanh`."
+            )
         self.act_fn = GeluAndMul(approximate="tanh")
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -93,18 +100,19 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class Gemma3Attention(nn.Module):
-
-    def __init__(self,
-                 config: Gemma3TextConfig,
-                 hidden_size: int,
-                 num_heads: int,
-                 num_kv_heads: int,
-                 head_dim: int,
-                 max_position_embeddings: int,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 attn_logits_soft_cap: Optional[float] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: Gemma3TextConfig,
+        hidden_size: int,
+        num_heads: int,
+        num_kv_heads: int,
+        head_dim: int,
+        max_position_embeddings: int,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        attn_logits_soft_cap: Optional[float] = None,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
         self.config = config
         self.hidden_size = hidden_size
@@ -174,19 +182,24 @@ def __init__(self,
         else:
             attn_type = AttentionType.ENCODER_ONLY
 
-        attn_cls = (EncoderOnlyAttention
-                    if attn_type == AttentionType.ENCODER_ONLY else Attention)
+        attn_cls = (
+            EncoderOnlyAttention
+            if attn_type == AttentionType.ENCODER_ONLY
+            else Attention
+        )
 
-        self.attn = attn_cls(self.num_heads,
-                             self.head_dim,
-                             self.scaling,
-                             num_kv_heads=self.num_kv_heads,
-                             cache_config=cache_config,
-                             quant_config=quant_config,
-                             attn_type=attn_type,
-                             logits_soft_cap=attn_logits_soft_cap,
-                             per_layer_sliding_window=sliding_window,
-                             prefix=f"{prefix}.attn")
+        self.attn = attn_cls(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            attn_type=attn_type,
+            logits_soft_cap=attn_logits_soft_cap,
+            per_layer_sliding_window=sliding_window,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -225,11 +238,7 @@ def forward(
         # output is discarded and overwritten below. While this duplicates
         # computation, it maintains compatibility.
         # TODO(woosuk): Optimize by implementing custom attention kernels.
-        attn_output = self.naive_attn_with_masks(q,
-                                                 k,
-                                                 v,
-                                                 out=attn_output,
-                                                 **kwargs)
+        attn_output = self.naive_attn_with_masks(q, k, v, out=attn_output, **kwargs)
         output, _ = self.o_proj(attn_output)
         return output
 
@@ -283,7 +292,6 @@ def naive_attn_with_masks(
 
 
 class Gemma3DecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Gemma3TextConfig,
@@ -313,14 +321,16 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.mlp",
         )
-        self.input_layernorm = GemmaRMSNorm(config.hidden_size,
-                                            eps=config.rms_norm_eps)
-        self.post_attention_layernorm = GemmaRMSNorm(config.hidden_size,
-                                                     eps=config.rms_norm_eps)
-        self.pre_feedforward_layernorm = GemmaRMSNorm(config.hidden_size,
-                                                      eps=config.rms_norm_eps)
-        self.post_feedforward_layernorm = GemmaRMSNorm(config.hidden_size,
-                                                       eps=config.rms_norm_eps)
+        self.input_layernorm = GemmaRMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = GemmaRMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
+        self.pre_feedforward_layernorm = GemmaRMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
+        self.post_feedforward_layernorm = GemmaRMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -333,8 +343,7 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
@@ -343,7 +352,8 @@ def forward(
         hidden_states = self.post_attention_layernorm(hidden_states)
 
         hidden_states, residual = self.pre_feedforward_layernorm(
-            hidden_states, residual)
+            hidden_states, residual
+        )
         hidden_states = self.mlp(hidden_states)
         hidden_states = self.post_feedforward_layernorm(hidden_states)
         return hidden_states, residual
@@ -351,7 +361,6 @@ def forward(
 
 @support_torch_compile
 class Gemma3Model(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
@@ -368,8 +377,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: Gemma3DecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.layers",
+        )
         self.norm = GemmaRMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
         # Normalize the embedding by sqrt(hidden_size)
@@ -377,12 +388,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         # data type such as bfloat16, not float32.
         # See https://github.com/huggingface/transformers/pull/29402
         normalizer = self.config.hidden_size**0.5
-        self.register_buffer("normalizer",
-                             torch.tensor(normalizer),
-                             persistent=False)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.register_buffer("normalizer", torch.tensor(normalizer), persistent=False)
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         # NOTE(woosuk): Only apply the normalizer to the output of
@@ -415,15 +424,13 @@ def forward(
                 **kwargs,
             )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -435,33 +442,33 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache scales for compressed-tensors quantization
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 loaded_weight = loaded_weight[0]
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
 
             # Check if this is a scale parameter that needs remapping first
-            if name.endswith(
-                (".k_scale", ".v_scale", ".q_scale", ".prob_scale")):
+            if name.endswith((".k_scale", ".v_scale", ".q_scale", ".prob_scale")):
                 # Try to remap the scale name first
                 remapped_name = maybe_remap_kv_scale_name(name, params_dict)
                 if remapped_name is not None and remapped_name in params_dict:
                     # Successfully remapped, use the remapped name
                     param = params_dict[remapped_name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
                     loaded_params.add(remapped_name)
                     continue
                 # If remapping failed, continue with normal processing
 
-            for (param_name, shard_name, shard_id) in stacked_params_mapping:
+            for param_name, shard_name, shard_id in stacked_params_mapping:
                 if shard_name not in name:
                     continue
                 name = name.replace(shard_name, param_name)
@@ -485,8 +492,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
 
@@ -516,12 +522,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         # currently all existing Gemma models have `tie_word_embeddings` enabled
         assert config.tie_word_embeddings
         self.quant_config = quant_config
-        self.model = Gemma3Model(vllm_config=vllm_config,
-                                 prefix=maybe_prefix(prefix, "model"))
+        self.model = Gemma3Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.logits_processor = LogitsProcessor(
-            config.vocab_size, soft_cap=config.final_logit_softcapping)
+            config.vocab_size, soft_cap=config.final_logit_softcapping
+        )
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -534,8 +543,9 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds, **kwargs)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds, **kwargs
+        )
         return hidden_states
 
     def compute_logits(
@@ -545,11 +555,9 @@ def compute_logits(
         logits = self.logits_processor(self.model.embed_tokens, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/gemma3_mm.py b/vllm/model_executor/models/gemma3_mm.py
index e1956b94cdc8..5ae78cc92159 100644
--- a/vllm/model_executor/models/gemma3_mm.py
+++ b/vllm/model_executor/models/gemma3_mm.py
@@ -16,29 +16,44 @@
 from vllm.model_executor.layers.layernorm import GemmaRMSNorm
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
-from vllm.multimodal.parse import (ImageProcessorItems, ImageSize,
-                                   MultiModalDataItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
+from vllm.multimodal.parse import ImageProcessorItems, ImageSize, MultiModalDataItems
+
 # yapf: disable
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo,
-                                        MultiModalPromptUpdates,
-                                        MultiModalPromptUpdatesApplyResult,
-                                        PlaceholderFeaturesInfo,
-                                        PromptReplacement, PromptUpdate,
-                                        PromptUpdateDetails,
-                                        replace_token_matches)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    MultiModalPromptUpdates,
+    MultiModalPromptUpdatesApplyResult,
+    PlaceholderFeaturesInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+    replace_token_matches,
+)
+
 # yapf: enable
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
 from .siglip import SiglipVisionModel
-from .utils import (AutoWeightsLoader, WeightsMapper,
-                    init_vllm_registered_model, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
@@ -53,6 +68,7 @@ class Gemma3ImagePixelInputs(TensorSchema):
         - w: Width of each patch
         - bn: Batch size * number of images
     """
+
     type: Literal["pixel_values"] = "pixel_values"
 
     pixel_values: Annotated[torch.Tensor, TensorShape("p", 3, "h", "w")]
@@ -64,7 +80,6 @@ class Gemma3ImagePixelInputs(TensorSchema):
 
 
 class Gemma3ProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(Gemma3Config)
 
@@ -107,19 +122,21 @@ def get_num_crops(
             processor = self.get_hf_processor()
 
         images_kwargs = self._resolve_image_kwargs(
-            processor, {
-                "do_pan_and_scan", "pan_and_scan_min_crop_size",
+            processor,
+            {
+                "do_pan_and_scan",
+                "pan_and_scan_min_crop_size",
                 "pan_and_scan_max_num_crops",
-                "pan_and_scan_min_ratio_to_activate"
-            })
+                "pan_and_scan_min_ratio_to_activate",
+            },
+        )
 
         do_pan_and_scan = images_kwargs["do_pan_and_scan"]
-        pan_and_scan_min_crop_size = images_kwargs[
-            "pan_and_scan_min_crop_size"]
-        pan_and_scan_max_num_crops = images_kwargs[
-            "pan_and_scan_max_num_crops"]
+        pan_and_scan_min_crop_size = images_kwargs["pan_and_scan_min_crop_size"]
+        pan_and_scan_max_num_crops = images_kwargs["pan_and_scan_max_num_crops"]
         pan_and_scan_min_ratio_to_activate = images_kwargs[
-            "pan_and_scan_min_ratio_to_activate"]
+            "pan_and_scan_min_ratio_to_activate"
+        ]
 
         if not do_pan_and_scan:
             return 0
@@ -127,7 +144,8 @@ def get_num_crops(
         if envs.VLLM_USE_V1:
             logger.warning_once(
                 "`do_pan_and_scan=True` has suboptimal results on V1 "
-                "because of the simplified attention pattern being used.")
+                "because of the simplified attention pattern being used."
+            )
 
         # Based on Gemma3ImageProcessor.pan_and_scan
         if image_width >= image_height:
@@ -187,10 +205,10 @@ def get_image_repl(
             crops_image_tokens = " ".join(boi_token for _ in range(num_crops))
             image_text = (
                 f"Here is the original image {boi_token} and here are some "
-                f"crops to help you see better {crops_image_tokens}")
+                f"crops to help you see better {crops_image_tokens}"
+            )
 
-        repl_full = image_text.replace(boi_token,
-                                       processor.full_image_sequence)
+        repl_full = image_text.replace(boi_token, processor.full_image_sequence)
 
         tokenizer = processor.tokenizer
         vocab = tokenizer.get_vocab()
@@ -221,7 +239,8 @@ def get_image_size_with_most_features(self) -> ImageSize:
         processor = self.get_hf_processor()
 
         images_kwargs = self._resolve_image_kwargs(
-            processor, {"pan_and_scan_max_num_crops"})
+            processor, {"pan_and_scan_max_num_crops"}
+        )
         max_num_crops = images_kwargs["pan_and_scan_max_num_crops"]
 
         # Result in the max possible feature size (h:w = max_num_crops:1)
@@ -229,7 +248,6 @@ def get_image_size_with_most_features(self) -> ImageSize:
 
 
 class Gemma3DummyInputsBuilder(BaseDummyInputsBuilder[Gemma3ProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -246,22 +264,21 @@ def get_dummy_mm_data(
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class Gemma3MultiModalProcessor(BaseMultiModalProcessor[Gemma3ProcessingInfo]):
-
     def _call_hf_processor(
         self,
         prompt: str,
@@ -278,20 +295,22 @@ def _call_hf_processor(
 
         # HF processor pops the `num_crops` kwarg, which is needed by vLLM
         if (images := mm_data.get("images")) is not None:
-            parsed_images = (self._get_data_parser().parse_mm_data({
-                "image":
-                images
-            }).get_items("image", ImageProcessorItems))
+            parsed_images = (
+                self._get_data_parser()
+                .parse_mm_data({"image": images})
+                .get_items("image", ImageProcessorItems)
+            )
             image_sizes = [
-                parsed_images.get_image_size(i)
-                for i in range(len(parsed_images))
+                parsed_images.get_image_size(i) for i in range(len(parsed_images))
             ]
             hf_processor = self.info.get_hf_processor(**mm_kwargs)
 
             num_crops = [
-                self.info.get_num_crops(image_width=size.width,
-                                        image_height=size.height,
-                                        processor=hf_processor)
+                self.info.get_num_crops(
+                    image_width=size.width,
+                    image_height=size.height,
+                    processor=hf_processor,
+                )
                 for size in image_sizes
             ]
             processed_outputs["num_patches"] = torch.tensor(num_crops) + 1
@@ -306,8 +325,7 @@ def _get_mm_fields_config(
         num_patches = hf_inputs.get("num_patches", torch.empty(0))
 
         return dict(
-            pixel_values=MultiModalFieldConfig.flat_from_sizes(
-                "image", num_patches),
+            pixel_values=MultiModalFieldConfig.flat_from_sizes("image", num_patches),
             num_patches=MultiModalFieldConfig.batched("image"),
         )
 
@@ -343,8 +361,7 @@ def _apply_token_matches(
         prompt: list[int],
         mm_prompt_updates: MultiModalPromptUpdates,
     ) -> tuple[list[int], MultiModalPromptUpdatesApplyResult]:
-        token_ids, res = super()._apply_token_matches(prompt,
-                                                      mm_prompt_updates)
+        token_ids, res = super()._apply_token_matches(prompt, mm_prompt_updates)
 
         # "\n\n\n" and "\n\n\n\n" are single tokens
         # Since our replacement can insert "\n\n" next to "\n"
@@ -403,8 +420,7 @@ def get_repl_toks(tok: int) -> list[int]:
             repl_token_ids.extend(repl_toks)
             repl_orig_idxs.extend(orig_idx for _ in range(len(repl_toks)))
 
-        repls = super()._find_mm_placeholders(repl_token_ids,
-                                              mm_prompt_updates)
+        repls = super()._find_mm_placeholders(repl_token_ids, mm_prompt_updates)
 
         return {
             modality: [
@@ -414,39 +430,43 @@ def get_repl_toks(tok: int) -> list[int]:
                     start_idx=repl_orig_idxs[p.start_idx],
                     tokens=p.tokens,
                     is_embed=p.is_embed,
-                ) for p in placeholders
+                )
+                for p in placeholders
             ]
             for modality, placeholders in repls.items()
         }
 
 
 class Gemma3MultiModalProjector(nn.Module):
-
     def __init__(self, config: Gemma3Config):
         super().__init__()
 
         self.mm_input_projection_weight = nn.Parameter(
-            torch.zeros(config.vision_config.hidden_size,
-                        config.text_config.hidden_size))
+            torch.zeros(
+                config.vision_config.hidden_size, config.text_config.hidden_size
+            )
+        )
 
         self.mm_soft_emb_norm = GemmaRMSNorm(
-            config.vision_config.hidden_size,
-            eps=config.vision_config.layer_norm_eps)
+            config.vision_config.hidden_size, eps=config.vision_config.layer_norm_eps
+        )
 
-        self.patches_per_image = int(config.vision_config.image_size //
-                                     config.vision_config.patch_size)
+        self.patches_per_image = int(
+            config.vision_config.image_size // config.vision_config.patch_size
+        )
         self.tokens_per_side = int(config.mm_tokens_per_image**0.5)
         self.kernel_size = self.patches_per_image // self.tokens_per_side
-        self.avg_pool = nn.AvgPool2d(kernel_size=self.kernel_size,
-                                     stride=self.kernel_size)
+        self.avg_pool = nn.AvgPool2d(
+            kernel_size=self.kernel_size, stride=self.kernel_size
+        )
 
     def forward(self, vision_outputs: torch.Tensor):
         batch_size, _, seq_length = vision_outputs.shape
 
         reshaped_vision_outputs = vision_outputs.transpose(1, 2)
         reshaped_vision_outputs = reshaped_vision_outputs.reshape(
-            batch_size, seq_length, self.patches_per_image,
-            self.patches_per_image)
+            batch_size, seq_length, self.patches_per_image, self.patches_per_image
+        )
         reshaped_vision_outputs = reshaped_vision_outputs.contiguous()
 
         pooled_vision_outputs = self.avg_pool(reshaped_vision_outputs)
@@ -456,15 +476,19 @@ def forward(self, vision_outputs: torch.Tensor):
         normed_vision_outputs = self.mm_soft_emb_norm(pooled_vision_outputs)
 
         projected_vision_outputs = torch.matmul(
-            normed_vision_outputs, self.mm_input_projection_weight)
+            normed_vision_outputs, self.mm_input_projection_weight
+        )
         return projected_vision_outputs.type_as(vision_outputs)
 
 
-@MULTIMODAL_REGISTRY.register_processor(Gemma3MultiModalProcessor,
-                                        info=Gemma3ProcessingInfo,
-                                        dummy_inputs=Gemma3DummyInputsBuilder)
-class Gemma3ForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP,
-                                     SupportsLoRA):
+@MULTIMODAL_REGISTRY.register_processor(
+    Gemma3MultiModalProcessor,
+    info=Gemma3ProcessingInfo,
+    dummy_inputs=Gemma3DummyInputsBuilder,
+)
+class Gemma3ForConditionalGeneration(
+    nn.Module, SupportsMultiModal, SupportsPP, SupportsLoRA
+):
     merge_by_field_config = True
 
     packed_modules_mapping = {
@@ -486,7 +510,8 @@ class Gemma3ForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP,
             "model.vision_tower.": "vision_tower.",
             "model.multi_modal_projector.": "multi_modal_projector.",
             "lm_head.": "language_model.lm_head.",
-        })
+        }
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -504,10 +529,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.quant_config = quant_config
         self.multimodal_config = multimodal_config
 
-        self.vision_tower = SiglipVisionModel(config.vision_config,
-                                              quant_config,
-                                              prefix=maybe_prefix(
-                                                  prefix, "vision_tower"))
+        self.vision_tower = SiglipVisionModel(
+            config.vision_config,
+            quant_config,
+            prefix=maybe_prefix(prefix, "vision_tower"),
+        )
         self.multi_modal_projector = Gemma3MultiModalProjector(config)
 
         self.language_model = init_vllm_registered_model(
@@ -524,14 +550,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.language_model.logits_processor.scale *= logit_scale
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     @property
     def dtype(self):
         return next(self.parameters()).dtype
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[Gemma3ImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[Gemma3ImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         num_patches = kwargs.pop("num_patches", None)
         image_embeds = kwargs.pop("image_embeds", None)
@@ -541,12 +569,11 @@ def _parse_and_validate_image_input(
 
         image_size = self.config.vision_config.image_size
 
-        return Gemma3ImagePixelInputs(pixel_values=pixel_values,
-                                      num_patches=num_patches,
-                                      resolve_bindings={
-                                          "h": image_size,
-                                          "w": image_size
-                                      })
+        return Gemma3ImagePixelInputs(
+            pixel_values=pixel_values,
+            num_patches=num_patches,
+            resolve_bindings={"h": image_size, "w": image_size},
+        )
 
     def _image_pixels_to_features(
         self,
@@ -570,35 +597,36 @@ def _process_image_input(
         )
         image_embeds = self.multi_modal_projector(image_features)
 
-        return [
-            e.flatten(0, 1) for e in image_embeds.split(num_patches.tolist())
-        ]
+        return [e.flatten(0, 1) for e in image_embeds.split(num_patches.tolist())]
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
 
         return self._process_image_input(image_input)
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs: object) -> IntermediateTensors:
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs: object,
+    ) -> IntermediateTensors:
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.language_model.model(input_ids,
-                                                  positions,
-                                                  intermediate_tensors,
-                                                  inputs_embeds=inputs_embeds,
-                                                  **kwargs)
+        hidden_states = self.language_model.model(
+            input_ids,
+            positions,
+            intermediate_tensors,
+            inputs_embeds=inputs_embeds,
+            **kwargs,
+        )
 
         return hidden_states
 
@@ -646,7 +674,7 @@ def prepare_attn_masks(
 
             # Consider the bidirectional attention between image tokens.
             img_mask = torch.zeros_like(global_attn_mask)
-            img_pos = (input_token_ids == self.config.image_token_index)
+            img_pos = input_token_ids == self.config.image_token_index
             img_mask[:, :, :, img_pos] += 1
             img_mask[:, :, img_pos, :] += 1
             global_attn_mask = torch.where(img_mask == 2, 0, global_attn_mask)
@@ -656,10 +684,10 @@ def prepare_attn_masks(
             if sliding_window is not None:
                 # Create a local causal mask with sliding window (1024).
                 local_attn_mask = torch.ones_like(global_attn_mask)
-                local_attn_mask = torch.tril(local_attn_mask,
-                                             diagonal=-sliding_window)
-                local_attn_mask = torch.where(local_attn_mask == 0,
-                                              global_attn_mask, float("-inf"))
+                local_attn_mask = torch.tril(local_attn_mask, diagonal=-sliding_window)
+                local_attn_mask = torch.where(
+                    local_attn_mask == 0, global_attn_mask, float("-inf")
+                )
                 local_attn_masks.append(local_attn_mask)
         kwargs["global_attn_masks"] = global_attn_masks
         kwargs["local_attn_masks"] = local_attn_masks
@@ -671,8 +699,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
@@ -683,4 +710,5 @@ def get_mm_mapping(self) -> MultiModelKeys:
         return MultiModelKeys.from_string_field(
             language_model="language_model",
             connector="multi_modal_projector",
-            tower_model="vision_tower")
+            tower_model="vision_tower",
+        )
diff --git a/vllm/model_executor/models/gemma3n.py b/vllm/model_executor/models/gemma3n.py
index 0b6bccb33498..e4ea4256ebc2 100644
--- a/vllm/model_executor/models/gemma3n.py
+++ b/vllm/model_executor/models/gemma3n.py
@@ -28,28 +28,38 @@
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.forward_context import get_forward_context
 from vllm.logger import init_logger
-from vllm.model_executor.layers.activation import (_ACTIVATION_REGISTRY,
-                                                   GeluAndMul,
-                                                   GeluAndMulSparse)
+from vllm.model_executor.layers.activation import (
+    _ACTIVATION_REGISTRY,
+    GeluAndMul,
+    GeluAndMulSparse,
+)
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 from vllm.v1.attention.backends.utils import KVSharingFastPrefillMetadata
 
 from .interfaces import SupportsQuant
-from .utils import (AutoWeightsLoader, extract_layer_index,
-                    is_pp_missing_parameter, make_layers, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
@@ -110,9 +120,11 @@ def __init__(
             eps=rms_norm_eps,
         )
         self.router_input_scale = torch.tensor(
-            hidden_size**-1.0, dtype=self.modality_router.weight.dtype)
+            hidden_size**-1.0, dtype=self.modality_router.weight.dtype
+        )
         self.correct_output_scale = nn.Parameter(
-            torch.zeros(hidden_size, dtype=torch.float32))
+            torch.zeros(hidden_size, dtype=torch.float32)
+        )
 
     def _compute_router_modalities(self, x: torch.Tensor) -> torch.Tensor:
         router_inputs = self.router_norm(x) * self.router_input_scale
@@ -120,15 +132,17 @@ def _compute_router_modalities(self, x: torch.Tensor) -> torch.Tensor:
         return torch.tanh(routed.float()).type_as(x)
 
     def scale_corrected_output(self, corrected: torch.Tensor) -> torch.Tensor:
-        return (corrected.type_as(self.correct_output_scale) *
-                self.correct_output_scale).type_as(corrected)
+        return (
+            corrected.type_as(self.correct_output_scale) * self.correct_output_scale
+        ).type_as(corrected)
 
     def predict(self, hidden_states: torch.Tensor) -> torch.Tensor:
         # hidden:       [altup_num_inputs, num_tokens, hidden_size]
         # modalities:   [num_tokens, num_altup_inputs]
         # all_coefs:    [num_tokens, num_altup_inputs ** 2]
         modalities = self._compute_router_modalities(
-            hidden_states[self.altup_active_idx])
+            hidden_states[self.altup_active_idx]
+        )
         all_coefs = self.prediction_coefs(modalities)
 
         # Reshape and transpose the 2D matrix for the matmul.
@@ -146,8 +160,9 @@ def predict(self, hidden_states: torch.Tensor) -> torch.Tensor:
         predictions += hidden_states
         return predictions.contiguous()
 
-    def correct(self, predictions: torch.Tensor,
-                activated: torch.Tensor) -> torch.Tensor:
+    def correct(
+        self, predictions: torch.Tensor, activated: torch.Tensor
+    ) -> torch.Tensor:
         # predictions:  [altup_num_inputs, num_tokens, hidden_size]
         # activated:    [num_tokens, hidden_size]
         # modalities:   [num_tokens, altup_num_inputs]
@@ -215,7 +230,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class Gemma3nMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -244,12 +258,16 @@ def __init__(
             raise ValueError(
                 "Gemma3 uses `gelu_pytorch_tanh` as the hidden activation "
                 "function. Please set `hidden_act` and `hidden_activation` to "
-                "`gelu_pytorch_tanh`.")
+                "`gelu_pytorch_tanh`."
+            )
 
-        self.act_fn = GeluAndMulSparse(
-            activation_sparsity=activation_sparsity,
-            approximate="tanh") if activation_sparsity > 0.0 else GeluAndMul(
-                approximate="tanh")
+        self.act_fn = (
+            GeluAndMulSparse(
+                activation_sparsity=activation_sparsity, approximate="tanh"
+            )
+            if activation_sparsity > 0.0
+            else GeluAndMul(approximate="tanh")
+        )
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         gate_up, _ = self.gate_up_proj(x)
@@ -259,17 +277,18 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class Gemma3nAttention(nn.Module):
-
-    def __init__(self,
-                 config: Gemma3nTextConfig,
-                 hidden_size: int,
-                 num_heads: int,
-                 num_kv_heads: int,
-                 head_dim: int,
-                 max_position_embeddings: int,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: Gemma3nTextConfig,
+        hidden_size: int,
+        num_heads: int,
+        num_kv_heads: int,
+        head_dim: int,
+        max_position_embeddings: int,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
         self.config = config
         self.hidden_size = hidden_size
@@ -307,13 +326,11 @@ def __init__(self,
             quant_config=quant_config,
             prefix=f"{prefix}.o_proj",
         )
-        self.q_norm = RMSNorm(hidden_size=self.head_dim,
-                              eps=config.rms_norm_eps)
-        self.k_norm = RMSNorm(hidden_size=self.head_dim,
-                              eps=config.rms_norm_eps)
-        self.v_norm = RMSNorm(hidden_size=self.head_dim,
-                              eps=config.rms_norm_eps,
-                              has_weight=False)
+        self.q_norm = RMSNorm(hidden_size=self.head_dim, eps=config.rms_norm_eps)
+        self.k_norm = RMSNorm(hidden_size=self.head_dim, eps=config.rms_norm_eps)
+        self.v_norm = RMSNorm(
+            hidden_size=self.head_dim, eps=config.rms_norm_eps, has_weight=False
+        )
 
         layer_idx = extract_layer_index(prefix)
         is_sliding = config.layer_types[layer_idx] == "sliding_attention"
@@ -329,8 +346,9 @@ def __init__(self,
             rope_theta = config.rope_theta
             rope_scaling = config.rope_scaling
 
-        first_kv_shared_layer_idx = (config.num_hidden_layers -
-                                     config.num_kv_shared_layers)
+        first_kv_shared_layer_idx = (
+            config.num_hidden_layers - config.num_kv_shared_layers
+        )
         self.is_kv_shared = layer_idx >= first_kv_shared_layer_idx
 
         kv_sharing_target_layer_name = None
@@ -361,7 +379,8 @@ def __init__(self,
             quant_config=quant_config,
             per_layer_sliding_window=self.sliding_window,
             kv_sharing_target_layer_name=kv_sharing_target_layer_name,
-            prefix=f"{prefix}.attn")
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -390,7 +409,6 @@ def forward(
 
 
 class Gemma3nDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Gemma3nTextConfig,
@@ -426,12 +444,12 @@ def __init__(
         self.mlp = Gemma3nMLP(
             hidden_size=config.hidden_size,
             # NOTE: Matformer https://github.com/huggingface/transformers/blob/a52478253bbe522a420e88ea3940d4d98a935300/src/transformers/models/gemma3n/modular_gemma3n.py#L258 # noqa: E501
-            intermediate_size=config.intermediate_size[extract_layer_index(
-                prefix)],
+            intermediate_size=config.intermediate_size[extract_layer_index(prefix)],
             hidden_activation=config.hidden_activation,
             quant_config=quant_config,
             activation_sparsity=config.activation_sparsity_pattern[
-                extract_layer_index(prefix)],
+                extract_layer_index(prefix)
+            ],
             prefix=f"{prefix}.mlp",
         )
         self.laurel = Gemma3nLaurelBlock(
@@ -493,7 +511,6 @@ def forward(
         per_layer_input: torch.Tensor,
         **kwargs,
     ) -> tuple[torch.Tensor, torch.Tensor]:
-
         # ActUp (predict).
         predictions = self.altup.predict(hidden_states)
         active_prediction = predictions[self.altup_active_idx]
@@ -508,8 +525,7 @@ def forward(
         )
         attn = self.post_attention_layernorm(attn)
         attn_gated = attn + active_prediction
-        attn_laurel = (attn_gated + laurel_output) / torch.sqrt(
-            torch.tensor(2.0))
+        attn_laurel = (attn_gated + laurel_output) / torch.sqrt(torch.tensor(2.0))
 
         # MLP.
         attn_norm = self.pre_feedforward_layernorm(attn_laurel)
@@ -518,8 +534,7 @@ def forward(
         attn_ffw_laurel_gated = attn_laurel + attn_ffw_norm
 
         # ActUp (connect).
-        corrected_predictions = self.altup.correct(predictions,
-                                                   attn_ffw_laurel_gated)
+        corrected_predictions = self.altup.correct(predictions, attn_ffw_laurel_gated)
         first_prediction = corrected_predictions[self.altup_active_idx]
         first_prediction = self.altup.scale_corrected_output(first_prediction)
 
@@ -537,8 +552,9 @@ def forward(
 
 
 # This enables torch.compile if --kv-sharing-fast-prefill passed
-@support_torch_compile(enable_if=lambda vllm_config: vllm_config.cache_config.
-                       kv_sharing_fast_prefill)
+@support_torch_compile(
+    enable_if=lambda vllm_config: vllm_config.cache_config.kv_sharing_fast_prefill
+)
 class Gemma3nSelfDecoder(nn.Module):
     """
     Includes altup embedding and self decoder layers
@@ -595,34 +611,41 @@ def __init__(
             eps=config.rms_norm_eps,
         )
         self.per_layer_input_scale = torch.rsqrt(torch.tensor(2.0)).to(
-            self.embed_tokens.weight.dtype)
+            self.embed_tokens.weight.dtype
+        )
         self.per_layer_projection_scale = torch.tensor(
             config.hidden_size**0.5,
             dtype=self.embed_tokens.weight.dtype,
         )
-        self.altup_projections = nn.ModuleList([
-            ColumnParallelLinear(
-                config.hidden_size,
-                config.hidden_size,
-                bias=False,
-                gather_output=True,
-                return_bias=False,
-                quant_config=quant_config,
-                prefix=f"{prefix}.altup_projections.{idx-1}",
-            ) for idx in range(1, self.config.altup_num_inputs)
-        ])
-
-    def get_per_layer_input_embeddings(
-            self, input_ids: torch.Tensor) -> torch.Tensor:
+        self.altup_projections = nn.ModuleList(
+            [
+                ColumnParallelLinear(
+                    config.hidden_size,
+                    config.hidden_size,
+                    bias=False,
+                    gather_output=True,
+                    return_bias=False,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.altup_projections.{idx - 1}",
+                )
+                for idx in range(1, self.config.altup_num_inputs)
+            ]
+        )
+
+    def get_per_layer_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         # Deal with the fact that vocab_size_per_layer_input < vocab_size
         # which causes us to have some out of vocab tokens by setting
         # those token ids to 0. This matches the HF implementation.
         per_layer_inputs_mask = torch.logical_and(
-            input_ids >= 0, input_ids < self.config.vocab_size_per_layer_input)
-        per_layer_inputs_tokens = torch.where(per_layer_inputs_mask, input_ids,
-                                              torch.zeros_like(input_ids))
-        return self.embed_tokens_per_layer(
-            per_layer_inputs_tokens) * self.embed_scale_per_layer
+            input_ids >= 0, input_ids < self.config.vocab_size_per_layer_input
+        )
+        per_layer_inputs_tokens = torch.where(
+            per_layer_inputs_mask, input_ids, torch.zeros_like(input_ids)
+        )
+        return (
+            self.embed_tokens_per_layer(per_layer_inputs_tokens)
+            * self.embed_scale_per_layer
+        )
 
     def get_per_layer_inputs(
         self,
@@ -635,8 +658,7 @@ def get_per_layer_inputs(
             self.config.num_hidden_layers,
             self.config.hidden_size_per_layer_input,
         )
-        per_layer_projection = self.per_layer_projection_norm(
-            per_layer_projection)
+        per_layer_projection = self.per_layer_projection_norm(per_layer_projection)
         if per_layer_inputs is not None:
             # Profiling run does not compute per_layer_inputs
             per_layer_inputs = per_layer_projection + per_layer_inputs
@@ -651,15 +673,13 @@ def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
     def altup_embed(self, hidden_states_0: torch.Tensor) -> torch.Tensor:
         # Altup embed.
         hidden_states = [hidden_states_0] * self.config.altup_num_inputs
-        target_magnitude = torch.mean(hidden_states_0**2, dim=-1,
-                                      keepdim=True)**0.5
+        target_magnitude = torch.mean(hidden_states_0**2, dim=-1, keepdim=True) ** 0.5
         for i in range(1, self.config.altup_num_inputs):
             hidden_states[i] = self.altup_projections[i - 1](hidden_states[i])
-            new_magnitude = torch.mean(hidden_states[i]**2,
-                                       dim=-1,
-                                       keepdim=True)**0.5
-            hidden_states[i] *= target_magnitude / torch.maximum(
-                new_magnitude, EPS)
+            new_magnitude = (
+                torch.mean(hidden_states[i] ** 2, dim=-1, keepdim=True) ** 0.5
+            )
+            hidden_states[i] *= target_magnitude / torch.maximum(new_magnitude, EPS)
         hidden_states = torch.stack(hidden_states, dim=-1)
         return hidden_states
 
@@ -677,7 +697,8 @@ def forward(
             hidden_states_0 = self.get_input_embeddings(input_ids)
 
         adjusted_per_layer_inputs = self.get_per_layer_inputs(
-            hidden_states_0, per_layer_inputs)
+            hidden_states_0, per_layer_inputs
+        )
         hidden_states = self.altup_embed(hidden_states_0)
 
         # [altnum_inputs, num_tokens, hidden_size]
@@ -700,8 +721,9 @@ def forward(
 
 
 # This enables torch.compile if --kv-sharing-fast-prefill passed
-@support_torch_compile(enable_if=lambda vllm_config: vllm_config.cache_config.
-                       kv_sharing_fast_prefill)
+@support_torch_compile(
+    enable_if=lambda vllm_config: vllm_config.cache_config.kv_sharing_fast_prefill
+)
 class Gemma3nCrossDecoder(nn.Module):
     """
     Cross-decoder layers
@@ -743,10 +765,10 @@ def forward(
 
 
 # This disables torch.compile if --kv-sharing-fast-prefill passed
-@support_torch_compile(enable_if=lambda vllm_config: not vllm_config.
-                       cache_config.kv_sharing_fast_prefill)
+@support_torch_compile(
+    enable_if=lambda vllm_config: not vllm_config.cache_config.kv_sharing_fast_prefill
+)
 class Gemma3nTextModel(nn.Module, SupportsQuant):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
@@ -755,27 +777,33 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.config = config
         self.quant_config = quant_config
 
-        self.altup_unembed_projections = nn.ModuleList([
-            ColumnParallelLinear(
-                config.hidden_size,
-                config.hidden_size,
-                bias=False,
-                gather_output=True,
-                return_bias=False,
-                quant_config=quant_config,
-                prefix=f"{prefix}.altup_unembed_projections.{idx-1}",
-            ) for idx in range(1, self.config.altup_num_inputs)
-        ])
+        self.altup_unembed_projections = nn.ModuleList(
+            [
+                ColumnParallelLinear(
+                    config.hidden_size,
+                    config.hidden_size,
+                    bias=False,
+                    gather_output=True,
+                    return_bias=False,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.altup_unembed_projections.{idx - 1}",
+                )
+                for idx in range(1, self.config.altup_num_inputs)
+            ]
+        )
 
         # Allocate config.num_kv_shared_layers layers for self-decoder
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: Gemma3nDecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.layers",
+        )
 
-        first_kv_shared_layer_idx = (config.num_hidden_layers -
-                                     config.num_kv_shared_layers)
+        first_kv_shared_layer_idx = (
+            config.num_hidden_layers - config.num_kv_shared_layers
+        )
 
         # NOTE(sarckk): importing this top level seems to cause issues
         # during running of tests.
@@ -810,18 +838,20 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             # TODO(sarckk): Extract this functionality to interface
             max_num_tokens = vllm_config.scheduler_config.max_num_batched_tokens
             device = next(self.parameters()).device
-            self.positions = torch.zeros(max_num_tokens,
-                                         dtype=torch.int64,
-                                         device=device)
+            self.positions = torch.zeros(
+                max_num_tokens, dtype=torch.int64, device=device
+            )
             self.hidden_states = torch.zeros(
-                (max_num_tokens, config.hidden_size,
-                 self.config.altup_num_inputs),
+                (max_num_tokens, config.hidden_size, self.config.altup_num_inputs),
                 dtype=self.embed_tokens.weight.dtype,
                 device=device,
             )
             self.per_layer_inputs = torch.zeros(
-                (max_num_tokens, self.config.num_hidden_layers,
-                 self.config.hidden_size_per_layer_input),
+                (
+                    max_num_tokens,
+                    self.config.num_hidden_layers,
+                    self.config.hidden_size_per_layer_input,
+                ),
                 dtype=self.embed_tokens.weight.dtype,
                 device=device,
             )
@@ -830,8 +860,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
     def embed_tokens(self):
         return self.self_decoder.embed_tokens
 
-    def get_per_layer_input_embeddings(
-            self, input_ids: torch.Tensor) -> torch.Tensor:
+    def get_per_layer_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.self_decoder.get_per_layer_input_embeddings(input_ids)
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
@@ -849,27 +878,26 @@ def fast_prefill_forward(
         attn_metadata = get_forward_context().attn_metadata
 
         # attn_metadata is None during dummy runs
-        if (self.fast_prefill_enabled and attn_metadata is not None):
+        if self.fast_prefill_enabled and attn_metadata is not None:
             assert isinstance(attn_metadata, dict)
             # Last layer is a KV sharing layer
             layer_attn_metadata = attn_metadata[
-                self.layers[-1].self_attn.attn.layer_name]
-            if (isinstance(layer_attn_metadata, KVSharingFastPrefillMetadata)):
-                logits_indices_padded = (
-                    layer_attn_metadata.logits_indices_padded)
+                self.layers[-1].self_attn.attn.layer_name
+            ]
+            if isinstance(layer_attn_metadata, KVSharingFastPrefillMetadata):
+                logits_indices_padded = layer_attn_metadata.logits_indices_padded
                 num_logits_indices = layer_attn_metadata.num_logits_indices
 
         # Copy inputs for cudagraph
         batch_size = positions.size(0)
         self.positions[:batch_size].copy_(positions)
-        self_decoder_hidden_states, per_layer_inputs_adjusted = \
-            self.self_decoder(
-                input_ids=input_ids,
-                positions=self.positions[:batch_size],
-                inputs_embeds=inputs_embeds,
-                per_layer_inputs=per_layer_inputs,
-                **kwargs,
-            )
+        self_decoder_hidden_states, per_layer_inputs_adjusted = self.self_decoder(
+            input_ids=input_ids,
+            positions=self.positions[:batch_size],
+            inputs_embeds=inputs_embeds,
+            per_layer_inputs=per_layer_inputs,
+            **kwargs,
+        )
 
         if logits_indices_padded is None:
             logits_indices_padded = torch.arange(
@@ -889,11 +917,14 @@ def fast_prefill_forward(
         # Copy inputs for cudagraph
         num_padded_logits_indices = logits_indices_padded.size(0)
         self.positions[:num_padded_logits_indices].copy_(
-            positions[logits_indices_padded])
+            positions[logits_indices_padded]
+        )
         self.hidden_states[:num_padded_logits_indices].copy_(
-            self_decoder_hidden_states[logits_indices_padded])
+            self_decoder_hidden_states[logits_indices_padded]
+        )
         self.per_layer_inputs[:num_padded_logits_indices].copy_(
-            per_layer_inputs_adjusted[logits_indices_padded])
+            per_layer_inputs_adjusted[logits_indices_padded]
+        )
         cross_decoder_hidden_states = self.cross_decoder(
             positions=self.positions[:num_padded_logits_indices],
             hidden_states=self.hidden_states[:num_padded_logits_indices],
@@ -905,7 +936,8 @@ def fast_prefill_forward(
             assert num_logits_indices > 0
             # Merge cross-decoder and self-decoder hidden states
             hidden_states[logits_indices_padded[:num_logits_indices]] = (
-                cross_decoder_hidden_states[:num_logits_indices])
+                cross_decoder_hidden_states[:num_logits_indices]
+            )
         else:
             hidden_states = cross_decoder_hidden_states
 
@@ -939,17 +971,19 @@ def altup_unembed(
         hidden_states: torch.Tensor,
     ) -> torch.Tensor:
         # Altup unembed.
-        target_magnitude = torch.mean(hidden_states[..., 0]**2,
-                                      dim=-1,
-                                      keepdim=True)**0.5
+        target_magnitude = (
+            torch.mean(hidden_states[..., 0] ** 2, dim=-1, keepdim=True) ** 0.5
+        )
         for i in range(1, self.config.altup_num_inputs):
             hidden_states[..., i] = self.altup_unembed_projections[i - 1](
-                hidden_states[..., i])
-            new_magnitude = torch.mean(hidden_states[..., i]**2,
-                                       dim=-1,
-                                       keepdim=True)**0.5
+                hidden_states[..., i]
+            )
+            new_magnitude = (
+                torch.mean(hidden_states[..., i] ** 2, dim=-1, keepdim=True) ** 0.5
+            )
             hidden_states[..., i] *= target_magnitude / torch.maximum(
-                new_magnitude, EPS)
+                new_magnitude, EPS
+            )
         # [num_tokens,hidden_size, altup_num_inputs] -> [num_tokens,hidden_size]
         hidden_states = torch.mean(hidden_states, dim=-1)
         return hidden_states
@@ -982,8 +1016,7 @@ def forward(
         hidden_states = self.altup_unembed(hidden_states)
         return self.norm(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -997,22 +1030,24 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             # decoder layer weights, altup_unembed_projections and rmsnorm
             # are initialized in text model, others are in self decoder
-            if (not name.startswith('layers')
-                    and not name.startswith('altup_unembed_projections')
-                    and not name.startswith('norm')):
+            if (
+                not name.startswith("layers")
+                and not name.startswith("altup_unembed_projections")
+                and not name.startswith("norm")
+            ):
                 name = f"self_decoder.{name}"
 
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache scales for compressed-tensors quantization
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 loaded_weight = loaded_weight[0]
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
-            for (param_name, shard_name, shard_id) in stacked_params_mapping:
+            for param_name, shard_name, shard_id in stacked_params_mapping:
                 if shard_name not in name:
                     continue
                 # Avoid spurious match with ".up_proj".
@@ -1039,8 +1074,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
 
@@ -1067,10 +1101,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         self.config = config
         self.cache_config = vllm_config.cache_config
-        self.model = Gemma3nTextModel(vllm_config=vllm_config,
-                                      prefix=maybe_prefix(prefix, "model"))
+        self.model = Gemma3nTextModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.logits_processor = LogitsProcessor(
-            config.vocab_size, soft_cap=config.final_logit_softcapping)
+            config.vocab_size, soft_cap=config.final_logit_softcapping
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -1085,7 +1121,6 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-
         hidden_states = self.model(
             input_ids,
             positions,
@@ -1103,11 +1138,11 @@ def compute_logits(
         logits = self.logits_processor(self.model.embed_tokens, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-        loader = AutoWeightsLoader(self,
-                                   skip_substrs=([
-                                       "embed_audio.", "embed_vision.",
-                                       "audio_tower.", "vision_tower."
-                                   ]))
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
+        loader = AutoWeightsLoader(
+            self,
+            skip_substrs=(
+                ["embed_audio.", "embed_vision.", "audio_tower.", "vision_tower."]
+            ),
+        )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/gemma3n_mm.py b/vllm/model_executor/models/gemma3n_mm.py
index 22f9967ebdcf..c9647fb55c99 100644
--- a/vllm/model_executor/models/gemma3n_mm.py
+++ b/vllm/model_executor/models/gemma3n_mm.py
@@ -5,6 +5,7 @@
 
 import numpy as np
 import torch
+
 # yapf: disable
 from torch import nn
 from transformers import AutoModel, BatchFeature
@@ -44,10 +45,14 @@
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-from .interfaces import (MultiModalEmbeddings, SupportsMultiModal,
-                         SupportsTranscription)
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
-                    init_vllm_registered_model, maybe_prefix)
+from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsTranscription
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
@@ -64,6 +69,7 @@ class Gemma3nImagePixelInputs(TensorSchema):
         - h: Height of each patch
         - w: Width of each patch
     """
+
     type: Literal["pixel_values"] = "pixel_values"
     pixel_values: Annotated[torch.Tensor, TensorShape("bn", 3, "h", "w")]
 
@@ -75,6 +81,7 @@ class Gemma3nAudioInputs(TensorSchema):
         - s: seq_length
         - f: num_features
     """
+
     type: Literal["audio"] = "audio"
     input_features_padded: Annotated[torch.Tensor, TensorShape("bn", "s", "f")]
     input_features_mask: Annotated[torch.Tensor, TensorShape("bn", "s")]
@@ -84,7 +91,6 @@ class Gemma3nAudioInputs(TensorSchema):
 
 
 class Gemma3nProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(Gemma3nConfig)
 
@@ -95,9 +101,8 @@ def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
         return {"image": None, "audio": None}
 
     def get_max_tokens_per_item(
-            self, seq_len: int,
-            mm_counts: Mapping[str, int]) -> Optional[Mapping[str, int]]:
-
+        self, seq_len: int, mm_counts: Mapping[str, int]
+    ) -> Optional[Mapping[str, int]]:
         return {"image": TOKENS_PER_IMAGE, "audio": TOKENS_PER_AUDIO}
 
     def get_image_repl(
@@ -109,7 +114,7 @@ def get_image_repl(
     ) -> str:
         """
         Get the replacement text for image tokens.
-        
+
         For Gemma3n, this should return the full_image_sequence which includes
         BOI token, repeated image tokens, and EOI token.
         """
@@ -117,7 +122,8 @@ def get_image_repl(
             processor = self.get_hf_processor()
 
         return PromptUpdateDetails.select_token_id(
-            processor.full_image_sequence, processor.image_token_id)
+            processor.full_image_sequence, processor.image_token_id
+        )
 
     def get_audio_repl(
         self,
@@ -126,7 +132,7 @@ def get_audio_repl(
     ) -> str:
         """
         Get the replacement text for audio tokens.
-        
+
         For Gemma3n, this should return the full_audio_sequence which includes
         BOA token, repeated audio tokens, and EOA token.
         """
@@ -135,11 +141,11 @@ def get_audio_repl(
 
         # Return the full audio sequence as defined by the processor
         return PromptUpdateDetails.select_token_id(
-            processor.full_audio_sequence, processor.audio_token_id)
+            processor.full_audio_sequence, processor.audio_token_id
+        )
 
 
 class Gemma3nDummyInputsBuilder(BaseDummyInputsBuilder[Gemma3nProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
         num_audios = mm_counts.get("audio", 0)
@@ -159,7 +165,9 @@ def get_dummy_mm_data(
         num_images = mm_counts.get("image", 0)
         num_audios = mm_counts.get("audio", 0)
         processor = self.info.get_hf_processor()
-        audio_feature_extractor: Gemma3nAudioFeatureExtractor = processor.feature_extractor  # noqa: E501
+        audio_feature_extractor: Gemma3nAudioFeatureExtractor = (
+            processor.feature_extractor
+        )  # noqa: E501
         audio_len = audio_feature_extractor.fft_length
         image_processor: SiglipImageProcessorFast = processor.image_processor
         img_width = image_processor.size.get("width", 224)
@@ -169,21 +177,19 @@ def get_dummy_mm_data(
         audio_overrides = mm_options.get("audio") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=img_width,
-                                   height=img_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
-            "audio":
-            self._get_dummy_audios(length=audio_len,
-                                   num_audios=num_audios,
-                                   overrides=audio_overrides)
+            "image": self._get_dummy_images(
+                width=img_width,
+                height=img_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
+            "audio": self._get_dummy_audios(
+                length=audio_len, num_audios=num_audios, overrides=audio_overrides
+            ),
         }
 
 
-class Gemma3nMultiModalProcessor(BaseMultiModalProcessor[Gemma3nProcessingInfo]
-                                 ):
-
+class Gemma3nMultiModalProcessor(BaseMultiModalProcessor[Gemma3nProcessingInfo]):
     def _get_data_parser(self) -> MultiModalDataParser:
         feature_extractor = self.info.get_hf_processor().feature_extractor
         return MultiModalDataParser(target_sr=feature_extractor.sampling_rate)
@@ -195,12 +201,11 @@ def _call_hf_processor(
         mm_kwargs: Mapping[str, object],
         tok_kwargs: Mapping[str, object],
     ) -> BatchFeature:
-
         # HF Transformers audio processor no longer accepts `audios` key.
         # We pop `audios` and replace it with `audio` key to suppress
         # the warning.
-        if 'audios' in mm_data:
-            mm_data['audio'] = mm_data.pop('audios')
+        if "audios" in mm_data:
+            mm_data["audio"] = mm_data.pop("audios")
         processed_outputs = super()._call_hf_processor(
             prompt,
             mm_data,
@@ -208,15 +213,17 @@ def _call_hf_processor(
             tok_kwargs,
         )
 
-        if 'input_features' in processed_outputs:
+        if "input_features" in processed_outputs:
             # Padding enables audio_tower to run in batched mode
-            processed_outputs["input_features_padded"] = \
-                processed_outputs["input_features"]
+            processed_outputs["input_features_padded"] = processed_outputs[
+                "input_features"
+            ]
 
             # Unpad features here since we need the output of each item to be
             # independent of other items for the cache to work correctly
             unpadded_features = [
-                f[mask] for f, mask in zip(
+                f[mask]
+                for f, mask in zip(
                     processed_outputs["input_features"],
                     processed_outputs["input_features_mask"],
                 )
@@ -229,7 +236,6 @@ def _get_mm_fields_config(
         hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
-
         return dict(
             pixel_values=MultiModalFieldConfig.batched("image"),
             input_features_padded=MultiModalFieldConfig.batched("audio"),
@@ -264,21 +270,25 @@ def get_replacement_image(item_idx: int):
                     modality="image",
                     target=image_token,
                     replacement=get_replacement_image,
-                ))
+                )
+            )
 
         # Handle audio tokens
         if "audio" in mm_items:
             audio_token = hf_processor.audio_token
 
             def get_replacement_audio(item_idx: int):
-                return self.info.get_audio_repl(processor=hf_processor, )
+                return self.info.get_audio_repl(
+                    processor=hf_processor,
+                )
 
             prompt_updates.append(
                 PromptReplacement(
                     modality="audio",
                     target=audio_token,
                     replacement=get_replacement_audio,
-                ))
+                )
+            )
 
         return prompt_updates
 
@@ -287,8 +297,7 @@ def _apply_token_matches(
         prompt: list[int],
         mm_prompt_updates: MultiModalPromptUpdates,
     ) -> tuple[list[int], MultiModalPromptUpdatesApplyResult]:
-        token_ids, res = super()._apply_token_matches(prompt,
-                                                      mm_prompt_updates)
+        token_ids, res = super()._apply_token_matches(prompt, mm_prompt_updates)
 
         # "\n\n\n" and "\n\n\n\n" are single tokens
         # Since our replacement can insert "\n\n" next to "\n"
@@ -347,8 +356,7 @@ def get_repl_toks(tok: int) -> list[int]:
             repl_token_ids.extend(repl_toks)
             repl_orig_idxs.extend(orig_idx for _ in range(len(repl_toks)))
 
-        repls = super()._find_mm_placeholders(repl_token_ids,
-                                              mm_prompt_updates)
+        repls = super()._find_mm_placeholders(repl_token_ids, mm_prompt_updates)
 
         return {
             modality: [
@@ -358,14 +366,15 @@ def get_repl_toks(tok: int) -> list[int]:
                     start_idx=repl_orig_idxs[p.start_idx],
                     tokens=p.tokens,
                     is_embed=p.is_embed,
-                ) for p in placeholders
+                )
+                for p in placeholders
             ]
             for modality, placeholders in repls.items()
         }
 
 
 class Gemma3nMultimodalEmbedder(nn.Module):
-    """Embeds token ids or soft tokens for multimodal content into language 
+    """Embeds token ids or soft tokens for multimodal content into language
     model space."""
 
     def __init__(
@@ -425,7 +434,8 @@ def forward(
         """  # noqa: E501
         if (input_ids is None) ^ (inputs_embeds is not None):
             raise ValueError(
-                "You must specify exactly one of input_ids or inputs_embeds")
+                "You must specify exactly one of input_ids or inputs_embeds"
+            )
 
         if inputs_embeds is not None:
             emb_norm = self.soft_embedding_norm(inputs_embeds)
@@ -437,11 +447,14 @@ def forward(
         return self.embedding_post_projection_norm(emb_norm_proj)
 
 
-@MULTIMODAL_REGISTRY.register_processor(Gemma3nMultiModalProcessor,
-                                        info=Gemma3nProcessingInfo,
-                                        dummy_inputs=Gemma3nDummyInputsBuilder)
-class Gemma3nForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                      SupportsTranscription):
+@MULTIMODAL_REGISTRY.register_processor(
+    Gemma3nMultiModalProcessor,
+    info=Gemma3nProcessingInfo,
+    dummy_inputs=Gemma3nDummyInputsBuilder,
+)
+class Gemma3nForConditionalGeneration(
+    nn.Module, SupportsMultiModal, SupportsTranscription
+):
     merge_by_field_config = True
     supported_languages = ISO639_1_SUPPORTED_LANGS
 
@@ -468,7 +481,8 @@ class Gemma3nForConditionalGeneration(nn.Module, SupportsMultiModal,
             "model.multi_modal_projector.": "multi_modal_projector.",
             "lm_head.": "language_model.lm_head.",
             "model": "language_model.model",
-        })
+        }
+    )
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
@@ -482,10 +496,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.vision_tower = AutoModel.from_config(config=config.vision_config)
         self.audio_tower = AutoModel.from_config(config=config.audio_config)
-        self.embed_vision = Gemma3nMultimodalEmbedder(config.vision_config,
-                                                      config.text_config)
-        self.embed_audio = Gemma3nMultimodalEmbedder(config.audio_config,
-                                                     config.text_config)
+        self.embed_vision = Gemma3nMultimodalEmbedder(
+            config.vision_config, config.text_config
+        )
+        self.embed_audio = Gemma3nMultimodalEmbedder(
+            config.audio_config, config.text_config
+        )
 
         self.language_model: nn.Module = init_vllm_registered_model(
             vllm_config=vllm_config,
@@ -501,10 +517,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.config.text_config.num_hidden_layers,
             self.config.text_config.hidden_size_per_layer_input,
             device=self.language_model.model.embed_tokens.weight.device,
-            dtype=self.language_model.model.embed_tokens.weight.dtype)
+            dtype=self.language_model.model.embed_tokens.weight.dtype,
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[Gemma3nImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[Gemma3nImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_embeds = kwargs.pop("image_embeds", None)
         # TODO is this the case?
@@ -515,8 +533,8 @@ def _parse_and_validate_image_input(
         return Gemma3nImagePixelInputs(pixel_values=pixel_values)
 
     def _parse_and_validate_audio_input(
-            self, **kwargs: object) -> Optional[Gemma3nAudioInputs]:
-
+        self, **kwargs: object
+    ) -> Optional[Gemma3nAudioInputs]:
         input_features_padded = kwargs.pop("input_features_padded", None)
         if input_features_padded is None:
             return None
@@ -536,14 +554,20 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if input_key in ("pixel_values", "image_embeds"
-                             ) and "image" not in mm_input_by_modality:
-                mm_input_by_modality[
-                    "image"] = self._parse_and_validate_image_input(**kwargs)
-            if input_key == "input_features_padded" \
-                and "audio" not in mm_input_by_modality:
-                mm_input_by_modality[
-                    "audio"] = self._parse_and_validate_audio_input(**kwargs)
+            if (
+                input_key in ("pixel_values", "image_embeds")
+                and "image" not in mm_input_by_modality
+            ):
+                mm_input_by_modality["image"] = self._parse_and_validate_image_input(
+                    **kwargs
+                )
+            if (
+                input_key == "input_features_padded"
+                and "audio" not in mm_input_by_modality
+            ):
+                mm_input_by_modality["audio"] = self._parse_and_validate_audio_input(
+                    **kwargs
+                )
         return mm_input_by_modality
 
     def _process_image_input(
@@ -553,16 +577,20 @@ def _process_image_input(
         assert self.vision_tower is not None
 
         pixel_values = image_input["pixel_values"]
-        vision_outputs = self.vision_tower(pixel_values=pixel_values,
-                                           do_pooling=False,
-                                           return_dict=True).last_hidden_state
+        vision_outputs = self.vision_tower(
+            pixel_values=pixel_values, do_pooling=False, return_dict=True
+        ).last_hidden_state
         # TODO try to avoid copy here
         # (batch, channels, height, width) to (batch, height * width, channels)
-        vision_outputs = vision_outputs.reshape(
-            vision_outputs.shape[0],
-            self.config.vision_config.hidden_size,
-            self.config.vision_soft_tokens_per_image,
-        ).permute(0, 2, 1).contiguous()
+        vision_outputs = (
+            vision_outputs.reshape(
+                vision_outputs.shape[0],
+                self.config.vision_config.hidden_size,
+                self.config.vision_soft_tokens_per_image,
+            )
+            .permute(0, 2, 1)
+            .contiguous()
+        )
         # Normalize and embed the soft tokens into language model space.
         vision_outputs *= self.config.vision_config.hidden_size**0.5
         # Return a list of embeddings instead of a batched tensor
@@ -576,8 +604,9 @@ def _process_audio_input(
         # Run on padded features to enable batching
         input_features = audio_input["input_features_padded"].squeeze(1)
         input_features_mask = audio_input["input_features_mask"].squeeze(1)
-        audio_outputs, audio_mask = self.audio_tower(input_features,
-                                                     ~input_features_mask)
+        audio_outputs, audio_mask = self.audio_tower(
+            input_features, ~input_features_mask
+        )
         audio_features = self.embed_audio(inputs_embeds=audio_outputs)
 
         # ruff: noqa
@@ -587,30 +616,29 @@ def _process_audio_input(
         # depending on the length of the longest audio input in the batch. When we encounter this situation, we pad
         # the audio feature out to 188 soft tokens with the embedding of the last token in the embed_audio vocab.
         # TODO precompute and cache padding
-        audio_padding_toks = torch.tensor([[self.vocab_size - 1]],
-                                          dtype=torch.long,
-                                          device=audio_features.device)
+        audio_padding_toks = torch.tensor(
+            [[self.vocab_size - 1]], dtype=torch.long, device=audio_features.device
+        )
         audio_padding_embs = self.embed_audio(input_ids=audio_padding_toks)
-        audio_features = torch.where(audio_mask.unsqueeze(-1),
-                                     audio_padding_embs, audio_features)
+        audio_features = torch.where(
+            audio_mask.unsqueeze(-1), audio_padding_embs, audio_features
+        )
 
         audio_batch_size, audio_seq_len, audio_embed_dim = audio_features.shape
         extra_padding_tokens = self.config.audio_soft_tokens_per_image - audio_seq_len  # noqa: E501
         extra_padding_features = audio_padding_embs.expand(
-            audio_batch_size, extra_padding_tokens, audio_embed_dim)
+            audio_batch_size, extra_padding_tokens, audio_embed_dim
+        )
 
-        audio_features = torch.cat((audio_features, extra_padding_features),
-                                   dim=1)
+        audio_features = torch.cat((audio_features, extra_padding_features), dim=1)
         # Return a list of embeddings instead of a batched tensor
         return audio_features.unbind(0)
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
-        mm_input_by_modality = self._parse_and_validate_multimodal_inputs(
-            **kwargs)
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+        mm_input_by_modality = self._parse_and_validate_multimodal_inputs(**kwargs)
         if mm_input_by_modality is None:
             return []
 
@@ -640,12 +668,16 @@ def get_input_embeddings(
         # them here, as the model  forward has only access to the input_embeds.
         if input_ids is not None:
             per_layer_inputs = self.language_model.model.get_per_layer_input_embeddings(
-                input_ids)
+                input_ids
+            )
             per_layer_inputs = per_layer_inputs.reshape(
-                -1, self.config.text_config.num_hidden_layers,
-                self.config.text_config.hidden_size_per_layer_input)
-            self.per_layer_embeddings[:per_layer_inputs.shape[0]].copy_(
-                per_layer_inputs)
+                -1,
+                self.config.text_config.num_hidden_layers,
+                self.config.text_config.hidden_size_per_layer_input,
+            )
+            self.per_layer_embeddings[: per_layer_inputs.shape[0]].copy_(
+                per_layer_inputs
+            )
 
         # This is to satisfy the type checker for each overload
         if multimodal_embeddings is None or is_multimodal is None:
@@ -658,12 +690,14 @@ def get_input_embeddings(
             handle_oov_mm_token=handle_oov_mm_token,
         )
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs: object) -> IntermediateTensors:
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs: object,
+    ) -> IntermediateTensors:
         if intermediate_tensors is not None:
             inputs_embeds = None
 
@@ -672,7 +706,7 @@ def forward(self,
         # select a chunk of pre-allocated PLEs. During normal execution,
         # `get_input_embeddings` is called before forward, hence this slice
         # will contain PLEs computed from the actual input_ids.
-        per_layer_inputs = self.per_layer_embeddings[:inputs_embeds.shape[0]]
+        per_layer_inputs = self.per_layer_embeddings[: inputs_embeds.shape[0]]
 
         hidden_states = self.language_model.model(
             input_ids,
@@ -680,7 +714,8 @@ def forward(self,
             per_layer_inputs=per_layer_inputs,
             intermediate_tensors=intermediate_tensors,
             inputs_embeds=inputs_embeds,
-            **kwargs)
+            **kwargs,
+        )
 
         return hidden_states
 
@@ -690,8 +725,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
@@ -702,7 +736,8 @@ def get_mm_mapping(self) -> MultiModelKeys:
         return MultiModelKeys.from_string_field(
             language_model="language_model",
             connector="multi_modal_projector",
-            tower_model="vision_tower")
+            tower_model="vision_tower",
+        )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -714,16 +749,19 @@ def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
             raise ValueError(f"Unsupported modality: {modality}")
 
     @classmethod
-    def get_generation_prompt(cls, audio: np.ndarray,
-                              stt_config: SpeechToTextConfig,
-                              model_config: ModelConfig,
-                              language: Optional[str],
-                              task_type: Literal["transcribe", "translate"],
-                              request_prompt: str,
-                              to_language: Optional[str]) -> PromptType:
+    def get_generation_prompt(
+        cls,
+        audio: np.ndarray,
+        stt_config: SpeechToTextConfig,
+        model_config: ModelConfig,
+        language: Optional[str],
+        task_type: Literal["transcribe", "translate"],
+        request_prompt: str,
+        to_language: Optional[str],
+    ) -> PromptType:
         """
         Gemma3n supports "free-form" transcription.
-        We fix its prompt here to standardize transcriptions/translations 
+        We fix its prompt here to standardize transcriptions/translations
         requests.
         """
         # Transcribe this audio [into <>] | for transcription
@@ -752,8 +790,9 @@ def get_generation_prompt(cls, audio: np.ndarray,
         return cast(PromptType, prompts_dict)
 
     @classmethod
-    def get_speech_to_text_config(cls, model_config: ModelConfig,
-                                  task_type: str) -> SpeechToTextConfig:
+    def get_speech_to_text_config(
+        cls, model_config: ModelConfig, task_type: str
+    ) -> SpeechToTextConfig:
         return SpeechToTextConfig(
             # Let's set this to 30 as suggested in the docs for now, although
             # the model is only limited by its context length.
diff --git a/vllm/model_executor/models/glm.py b/vllm/model_executor/models/glm.py
index defa77b84e44..a6991f8e43fe 100644
--- a/vllm/model_executor/models/glm.py
+++ b/vllm/model_executor/models/glm.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Inference-only HF format GLM-4 model compatible with THUDM weights."""
+
 from vllm.config import VllmConfig
 from vllm.model_executor.models.llama import LlamaForCausalLM
 
@@ -8,7 +9,6 @@
 
 
 class GlmForCausalLM(LlamaForCausalLM):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         vllm_config.model_config.hf_config.partial_rotary_factor = 0.5
         super().__init__(vllm_config=vllm_config, prefix=prefix)
diff --git a/vllm/model_executor/models/glm4.py b/vllm/model_executor/models/glm4.py
index f49f21a40f82..f25f50602e6c 100644
--- a/vllm/model_executor/models/glm4.py
+++ b/vllm/model_executor/models/glm4.py
@@ -22,6 +22,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only GLM-4-0414 model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from typing import Optional, Union
 
@@ -34,8 +35,7 @@
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import QKVParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
@@ -49,21 +49,22 @@
 
 
 class Glm4Attention(nn.Module):
-
-    def __init__(self,
-                 config: Glm4Config,
-                 hidden_size: int,
-                 num_heads: int,
-                 num_kv_heads: int,
-                 max_position: int = 4096 * 32,
-                 head_dim: Optional[int] = None,
-                 qkv_bias: bool = False,
-                 rope_theta: float = 10000,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 rope_scaling: Optional[tuple] = None,
-                 prefix: str = "",
-                 attn_type: str = AttentionType.DECODER) -> None:
+    def __init__(
+        self,
+        config: Glm4Config,
+        hidden_size: int,
+        num_heads: int,
+        num_kv_heads: int,
+        max_position: int = 4096 * 32,
+        head_dim: Optional[int] = None,
+        qkv_bias: bool = False,
+        rope_theta: float = 10000,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        rope_scaling: Optional[tuple] = None,
+        prefix: str = "",
+        attn_type: str = AttentionType.DECODER,
+    ) -> None:
         super().__init__()
         self.hidden_size = hidden_size
         tp_size = get_tensor_model_parallel_world_size()
@@ -112,14 +113,16 @@ def __init__(self,
             partial_rotary_factor=partial_rotary_factor,
             is_neox_style=False,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn",
-                              attn_type=attn_type)
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+            attn_type=attn_type,
+        )
 
     def forward(
         self,
@@ -135,11 +138,12 @@ def forward(
 
 
 class Glm4DecoderLayer(nn.Module):
-
-    def __init__(self,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 config: Optional[Glm4Config] = None) -> None:
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        config: Optional[Glm4Config] = None,
+    ) -> None:
         super().__init__()
 
         config = config or vllm_config.model_config.hf_config
@@ -157,8 +161,8 @@ def __init__(self,
             max_position=config.max_position_embeddings,
             num_kv_heads=config.num_key_value_heads,
             rope_theta=rope_theta,
-            qkv_bias=getattr(config, 'attention_bias', False),
-            head_dim=getattr(config, 'head_dim', None),
+            qkv_bias=getattr(config, "attention_bias", False),
+            head_dim=getattr(config, "head_dim", None),
             cache_config=cache_config,
             quant_config=quant_config,
             rope_scaling=rope_scaling,
@@ -172,14 +176,14 @@ def __init__(self,
             quant_config=quant_config,
             prefix=f"{prefix}.mlp",
         )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
-        self.post_self_attn_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
-        self.post_mlp_layernorm = RMSNorm(config.hidden_size,
-                                          eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
+        self.post_self_attn_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
+        self.post_mlp_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def forward(
         self,
@@ -192,8 +196,7 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
@@ -202,8 +205,7 @@ def forward(
         hidden_states = self.post_self_attn_layernorm(hidden_states)
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         hidden_states = self.post_mlp_layernorm(hidden_states)
 
@@ -221,13 +223,13 @@ def forward(
         "positions": -1,
         "intermediate_tensors": 0,
         "inputs_embeds": 0,
-    })
+    }
+)
 class Glm4Model(LlamaModel):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
-        super().__init__(vllm_config=vllm_config,
-                         prefix=prefix,
-                         layer_type=Glm4DecoderLayer)
+        super().__init__(
+            vllm_config=vllm_config, prefix=prefix, layer_type=Glm4DecoderLayer
+        )
 
 
 class Glm4ForCausalLM(nn.Module, SupportsLoRA, SupportsPP):
@@ -253,25 +255,28 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.lora_config = lora_config
 
         self.quant_config = quant_config
-        self.model = Glm4Model(vllm_config=vllm_config,
-                               prefix=maybe_prefix(prefix, "model"))
+        self.model = Glm4Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
         if get_pp_group().is_last_rank:
             if config.tie_word_embeddings:
                 self.lm_head = self.model.embed_tokens
             else:
-                self.lm_head = ParallelLMHead(config.vocab_size,
-                                              config.hidden_size,
-                                              quant_config=quant_config,
-                                              prefix=maybe_prefix(
-                                                  prefix, "lm_head"))
+                self.lm_head = ParallelLMHead(
+                    config.vocab_size,
+                    config.hidden_size,
+                    quant_config=quant_config,
+                    prefix=maybe_prefix(prefix, "lm_head"),
+                )
         else:
             self.lm_head = PPMissingLayer()
 
         self.logits_processor = LogitsProcessor(config.vocab_size)
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -283,8 +288,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -294,11 +300,9 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/glm4_1v.py b/vllm/model_executor/models/glm4_1v.py
index 36e2e2995184..304e721fade5 100644
--- a/vllm/model_executor/models/glm4_1v.py
+++ b/vllm/model_executor/models/glm4_1v.py
@@ -41,47 +41,65 @@
 from transformers import __version__ as TRANSFORMERS_VERSION
 from transformers.models.glm4v.configuration_glm4v import Glm4vVisionConfig
 from transformers.models.glm4v.image_processing_glm4v import (
-    Glm4vImageProcessor, smart_resize)
-from transformers.models.glm4v.video_processing_glm4v import (
-    Glm4vVideoProcessor)
+    Glm4vImageProcessor,
+    smart_resize,
+)
+from transformers.models.glm4v.video_processing_glm4v import Glm4vVideoProcessor
 from transformers.video_utils import VideoMetadata
 
 from vllm.attention.backends.registry import _Backend
-from vllm.attention.layer import (check_upstream_fa_availability,
-                                  maybe_get_vit_flash_attn_backend)
+from vllm.attention.layer import (
+    check_upstream_fa_availability,
+    maybe_get_vit_flash_attn_backend,
+)
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions, VideoDummyOptions
-from vllm.distributed import (get_tensor_model_parallel_world_size,
-                              parallel_state)
+from vllm.distributed import get_tensor_model_parallel_world_size, parallel_state
 from vllm.distributed import utils as dist_utils
 from vllm.logger import init_logger
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems, VideoItem)
-from vllm.multimodal.parse import (ImageSize, MultiModalDataItems,
-                                   MultiModalDataParser)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+    VideoItem,
+)
+from vllm.multimodal.parse import ImageSize, MultiModalDataItems, MultiModalDataParser
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from ..layers.activation import SiluAndMul
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP)
-from .qwen2_vl import (_create_qwen2vl_field_factory,
-                       apply_rotary_pos_emb_vision)
-from .utils import (AutoWeightsLoader, WeightsMapper,
-                    init_vllm_registered_model, maybe_prefix)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
+from .qwen2_vl import _create_qwen2vl_field_factory, apply_rotary_pos_emb_vision
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 from .vision import get_vit_attn_backend, run_dp_sharded_mrope_vision_model
 
 logger = init_logger(__name__)
@@ -100,6 +118,7 @@ class Glm4vImagePixelInputs(TensorSchema):
         - ni: Number of images
         - g: Grid dimensions (3 for grid_t, grid_h, grid_w)
     """
+
     type: Literal["pixel_values"] = "pixel_values"
 
     pixel_values: Annotated[torch.Tensor, TensorShape("np", "cpp")]
@@ -114,6 +133,7 @@ class Glm4vImageEmbeddingInputs(TensorSchema):
         - n: Number of images
         - g: Grid dimensions (3 for grid_t, grid_h, grid_w)
     """
+
     type: Literal["image_embeds"] = "image_embeds"
 
     image_embeds: Annotated[torch.Tensor, TensorShape("f", "h")]
@@ -133,6 +153,7 @@ class Glm4vVideoPixelInputs(TensorSchema):
         - g: Grid dimensions (3 for grid_t which is usually 1 for processed
           video, grid_h, grid_w)
     """
+
     type: Literal["pixel_values_videos"] = "pixel_values_videos"
 
     pixel_values_videos: Annotated[torch.Tensor, TensorShape("np", "ctpp")]
@@ -148,6 +169,7 @@ class Glm4vVideoEmbeddingInputs(TensorSchema):
         - g: Grid dimensions (3 for grid_t which is usually 1 for processed
           video, grid_h, grid_w)
     """
+
     type: Literal["video_embeds"] = "video_embeds"
 
     video_embeds: Annotated[torch.Tensor, TensorShape("p", "h")]
@@ -160,7 +182,6 @@ class Glm4vVideoEmbeddingInputs(TensorSchema):
 
 
 class Glm4vVisionMLP(nn.Module):
-
     def __init__(
         self,
         in_features: int,
@@ -208,8 +229,7 @@ def all_gather_interleave(local_tensor, hidden_size: int, tp_size: int):
     )
 
     gathered_tensors_split = [
-        torch.split(tensor, hidden_size // tp_size, -1)
-        for tensor in gathered_tensors
+        torch.split(tensor, hidden_size // tp_size, -1) for tensor in gathered_tensors
     ]
     ordered_tensors = [
         tensor for pair in zip(*gathered_tensors_split) for tensor in pair
@@ -219,7 +239,6 @@ def all_gather_interleave(local_tensor, hidden_size: int, tp_size: int):
 
 
 class Glm4vVisionAttention(nn.Module):
-
     def __init__(
         self,
         embed_dim: int,
@@ -231,14 +250,18 @@ def __init__(
     ) -> None:
         super().__init__()
         # Per attention head and per partition values.
-        self.tp_size = (1 if use_data_parallel else
-                        get_tensor_model_parallel_world_size())
-        self.tp_rank = (0 if use_data_parallel else
-                        parallel_state.get_tensor_model_parallel_rank())
+        self.tp_size = (
+            1 if use_data_parallel else get_tensor_model_parallel_world_size()
+        )
+        self.tp_rank = (
+            0 if use_data_parallel else parallel_state.get_tensor_model_parallel_rank()
+        )
         self.hidden_size_per_attention_head = dist_utils.divide(
-            projection_size, num_heads)
+            projection_size, num_heads
+        )
         self.num_attention_heads_per_partition = dist_utils.divide(
-            num_heads, self.tp_size)
+            num_heads, self.tp_size
+        )
 
         self.qkv = QKVParallelLinear(
             hidden_size=embed_dim,
@@ -263,26 +286,30 @@ def __init__(
         # Detect attention implementation.
         self.attn_backend = get_vit_attn_backend(
             head_size=self.hidden_size_per_attention_head,
-            dtype=torch.get_default_dtype())
+            dtype=torch.get_default_dtype(),
+        )
         self.use_upstream_fa = False
 
-        self.attn_backend, self.flash_attn_varlen_func \
-            = maybe_get_vit_flash_attn_backend(
+        self.attn_backend, self.flash_attn_varlen_func = (
+            maybe_get_vit_flash_attn_backend(
                 self.attn_backend,
                 self.use_upstream_fa,
             )
+        )
 
         if self.attn_backend not in {
-                _Backend.FLASH_ATTN,
-                _Backend.TORCH_SDPA,
-                _Backend.XFORMERS,
-                _Backend.ROCM_AITER_FA,
+            _Backend.FLASH_ATTN,
+            _Backend.TORCH_SDPA,
+            _Backend.XFORMERS,
+            _Backend.ROCM_AITER_FA,
         }:
             raise RuntimeError(
-                f"GLM-4V does not support {self.attn_backend} backend now.")
+                f"GLM-4V does not support {self.attn_backend} backend now."
+            )
 
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA
+            _Backend.FLASH_ATTN,
+            _Backend.ROCM_AITER_FA,
         }
 
     def split_qkv(self, qkv: torch.Tensor) -> tuple[torch.Tensor, ...]:
@@ -303,12 +330,12 @@ def split_qkv(self, qkv: torch.Tensor) -> tuple[torch.Tensor, ...]:
         return q, k, v
 
     def forward(
-            self,
-            x: torch.Tensor,
-            cu_seqlens: torch.Tensor,
-            rotary_pos_emb: torch.Tensor,
-            max_seqlen: Optional[int] = None,  # Only used for Flash Attention
-            seqlens: Optional[list[int]] = None,  # Only used for xFormers
+        self,
+        x: torch.Tensor,
+        cu_seqlens: torch.Tensor,
+        rotary_pos_emb: torch.Tensor,
+        max_seqlen: Optional[int] = None,  # Only used for Flash Attention
+        seqlens: Optional[list[int]] = None,  # Only used for xFormers
     ) -> torch.Tensor:
         # [s, b, c] --> [s, b, head * 3 * head_dim]
         x, _ = self.qkv(x)
@@ -317,8 +344,7 @@ def forward(
         q, k, v = self.split_qkv(x)
         batch_size = q.shape[1]
 
-        q, k, v = (rearrange(x, "s b ... -> b s ...").contiguous()
-                   for x in (q, k, v))
+        q, k, v = (rearrange(x, "s b ... -> b s ...").contiguous() for x in (q, k, v))
         if rotary_pos_emb is not None:
             # [2 * b, s, heads, head_dim]
             qk_concat = torch.cat([q, k], dim=0)
@@ -326,7 +352,6 @@ def forward(
             q, k = torch.chunk(qk_rotated, 2, dim=0)
 
         if self.is_flash_attn_backend:
-
             q, k, v = (rearrange(x, "b s ... -> (b s) ...") for x in [q, k, v])
 
             output = self.flash_attn_varlen_func(
@@ -341,9 +366,9 @@ def forward(
                 causal=False,
             )
 
-            context_layer = rearrange(output,
-                                      "(b s) h d -> s b (h d)",
-                                      b=batch_size).contiguous()
+            context_layer = rearrange(
+                output, "(b s) h d -> s b (h d)", b=batch_size
+            ).contiguous()
         elif self.attn_backend == _Backend.TORCH_SDPA:
             # Execute attention entry by entry for speed & less VRAM.
             outputs = []
@@ -353,36 +378,36 @@ def forward(
                 q_i = q[:, start_idx:end_idx]
                 k_i = k[:, start_idx:end_idx]
                 v_i = v[:, start_idx:end_idx]
-                q_i, k_i, v_i = (rearrange(x, "b s h d -> b h s d")
-                                 for x in [q_i, k_i, v_i])
-                output_i = F.scaled_dot_product_attention(q_i,
-                                                          k_i,
-                                                          v_i,
-                                                          dropout_p=0.0)
+                q_i, k_i, v_i = (
+                    rearrange(x, "b s h d -> b h s d") for x in [q_i, k_i, v_i]
+                )
+                output_i = F.scaled_dot_product_attention(q_i, k_i, v_i, dropout_p=0.0)
                 output_i = rearrange(output_i, "b h s d -> b s h d ")
                 outputs.append(output_i)
             context_layer = torch.cat(outputs, dim=1)
-            context_layer = rearrange(context_layer,
-                                      "b s h d -> s b (h d)").contiguous()
+            context_layer = rearrange(
+                context_layer, "b s h d -> s b (h d)"
+            ).contiguous()
         elif self.attn_backend == _Backend.XFORMERS:
             from xformers import ops as xops
             from xformers.ops.fmha.attn_bias import BlockDiagonalMask
 
-            attn_bias = BlockDiagonalMask.from_seqlens(q_seqlen=seqlens,
-                                                       kv_seqlen=None,
-                                                       device=q.device)
+            attn_bias = BlockDiagonalMask.from_seqlens(
+                q_seqlen=seqlens, kv_seqlen=None, device=q.device
+            )
 
             context_layer = xops.memory_efficient_attention_forward(
-                q, k, v, attn_bias=attn_bias, p=0, scale=None)
-            context_layer = rearrange(context_layer,
-                                      "b s h d -> s b (h d)").contiguous()
+                q, k, v, attn_bias=attn_bias, p=0, scale=None
+            )
+            context_layer = rearrange(
+                context_layer, "b s h d -> s b (h d)"
+            ).contiguous()
 
         output, _ = self.proj(context_layer)
         return output
 
 
 class Glm4vVisionBlock(nn.Module):
-
     def __init__(
         self,
         dim: int,
@@ -416,12 +441,12 @@ def __init__(
         )
 
     def forward(
-            self,
-            x: torch.Tensor,
-            cu_seqlens: torch.Tensor,
-            rotary_pos_emb: torch.Tensor,
-            max_seqlen: Optional[int] = None,  # Only used for Flash Attention
-            seqlens: Optional[list[int]] = None,  # Only used for xFormers
+        self,
+        x: torch.Tensor,
+        cu_seqlens: torch.Tensor,
+        rotary_pos_emb: torch.Tensor,
+        max_seqlen: Optional[int] = None,  # Only used for Flash Attention
+        seqlens: Optional[list[int]] = None,  # Only used for xFormers
     ) -> torch.Tensor:
         x_attn = self.attn(
             self.norm1(x),
@@ -437,7 +462,6 @@ def forward(
 
 
 class Glm4vVisionPatchEmbed(nn.Module):
-
     def __init__(
         self,
         patch_size: int = 14,
@@ -461,14 +485,12 @@ def __init__(
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         L, C = x.shape
-        x = x.view(L, -1, self.temporal_patch_size, self.patch_size,
-                   self.patch_size)
+        x = x.view(L, -1, self.temporal_patch_size, self.patch_size, self.patch_size)
         x = self.proj(x).view(L, self.hidden_size)
         return x
 
 
 class Glm4vPatchMerger(nn.Module):
-
     def __init__(
         self,
         d_model: int,
@@ -519,7 +541,6 @@ def forward(self, x: torch.Tensor):
 
 
 class Glm4vVisionEmbeddings(nn.Module):
-
     def __init__(self, config: Glm4vVisionConfig):
         super().__init__()
         self.config = config
@@ -527,18 +548,18 @@ def __init__(self, config: Glm4vVisionConfig):
         self.image_size = config.image_size
         self.patch_size = config.patch_size
 
-        self.num_patches = (self.image_size // self.patch_size)**2
+        self.num_patches = (self.image_size // self.patch_size) ** 2
         self.num_positions = self.num_patches
-        self.position_embedding = nn.Embedding(self.num_positions,
-                                               self.embed_dim)
+        self.position_embedding = nn.Embedding(self.num_positions, self.embed_dim)
         self.register_buffer(
             "position_ids",
             torch.arange(self.num_positions).expand((1, -1)),
             persistent=False,
         )
 
-    def forward(self, embeddings, lengths, image_shapes, h_coords,
-                w_coords) -> torch.Tensor:
+    def forward(
+        self, embeddings, lengths, image_shapes, h_coords, w_coords
+    ) -> torch.Tensor:
         pos_embed_weight = self.position_embedding.weight
         hidden_size = pos_embed_weight.shape[1]
         total_seq = h_coords.shape[0]
@@ -549,29 +570,27 @@ def forward(self, embeddings, lengths, image_shapes, h_coords,
 
         # Handle empty sequence case
         if total_seq == 0:
-            adapted_pos_embed = torch.empty(0,
-                                            hidden_size,
-                                            device=device,
-                                            dtype=pos_embed_weight.dtype)
+            adapted_pos_embed = torch.empty(
+                0, hidden_size, device=device, dtype=pos_embed_weight.dtype
+            )
         else:
             # Convert inputs to tensors if needed
             if isinstance(lengths, list):
-                lengths = torch.tensor(lengths,
-                                       device=device,
-                                       dtype=torch.long)
+                lengths = torch.tensor(lengths, device=device, dtype=torch.long)
             if not isinstance(image_shapes, torch.Tensor):
-                image_shapes = torch.tensor(image_shapes,
-                                            device=device,
-                                            dtype=torch.long)
+                image_shapes = torch.tensor(
+                    image_shapes, device=device, dtype=torch.long
+                )
 
             # Prepare 2D position embedding
             orig_size_sq = pos_embed_weight.shape[0]
             orig_size = int(orig_size_sq**0.5)
-            pos_embed_2d = (pos_embed_weight.view(
-                orig_size, orig_size,
-                hidden_size).permute(2, 0,
-                                     1).unsqueeze(0).to(device=device,
-                                                        dtype=torch.float32))
+            pos_embed_2d = (
+                pos_embed_weight.view(orig_size, orig_size, hidden_size)
+                .permute(2, 0, 1)
+                .unsqueeze(0)
+                .to(device=device, dtype=torch.float32)
+            )
 
             # Calculate target dimensions for each patch
             # Add bounds checking for data parallel mode
@@ -584,23 +603,21 @@ def forward(self, embeddings, lengths, image_shapes, h_coords,
                 for i in range(len(lengths)):
                     # Cycle through available shapes
                     shape_idx = i % image_shapes.shape[0]
-                    target_h_list.append(image_shapes[shape_idx,
-                                                      1].repeat(lengths[i]))
-                    target_w_list.append(image_shapes[shape_idx,
-                                                      2].repeat(lengths[i]))
-                target_h = torch.cat(target_h_list).to(device=device,
-                                                       dtype=torch.float32)
-                target_w = torch.cat(target_w_list).to(device=device,
-                                                       dtype=torch.float32)
+                    target_h_list.append(image_shapes[shape_idx, 1].repeat(lengths[i]))
+                    target_w_list.append(image_shapes[shape_idx, 2].repeat(lengths[i]))
+                target_h = torch.cat(target_h_list).to(
+                    device=device, dtype=torch.float32
+                )
+                target_w = torch.cat(target_w_list).to(
+                    device=device, dtype=torch.float32
+                )
             else:
-                target_h = torch.cat([
-                    image_shapes[i, 1].repeat(lengths[i])
-                    for i in range(len(lengths))
-                ]).to(device=device, dtype=torch.float32)
-                target_w = torch.cat([
-                    image_shapes[i, 2].repeat(lengths[i])
-                    for i in range(len(lengths))
-                ]).to(device=device, dtype=torch.float32)
+                target_h = torch.cat(
+                    [image_shapes[i, 1].repeat(lengths[i]) for i in range(len(lengths))]
+                ).to(device=device, dtype=torch.float32)
+                target_w = torch.cat(
+                    [image_shapes[i, 2].repeat(lengths[i]) for i in range(len(lengths))]
+                ).to(device=device, dtype=torch.float32)
 
             # Normalize coordinates to [-1, 1] range for grid_sample
             h_coords = h_coords.to(device=device, dtype=torch.float32)
@@ -609,8 +626,7 @@ def forward(self, embeddings, lengths, image_shapes, h_coords,
             norm_h = ((h_coords + 0.5) / target_h) * 2 - 1
 
             # Create sampling grid
-            grid = (torch.stack((norm_w, norm_h),
-                                dim=-1).unsqueeze(0).unsqueeze(2))
+            grid = torch.stack((norm_w, norm_h), dim=-1).unsqueeze(0).unsqueeze(2)
 
             # Perform bicubic interpolation
             interpolated_embed_fp32 = F.grid_sample(
@@ -623,9 +639,11 @@ def forward(self, embeddings, lengths, image_shapes, h_coords,
 
             # Reshape and convert back to original dtype
             adapted_pos_embed_fp32 = (
-                interpolated_embed_fp32.squeeze(0).squeeze(-1).permute(1, 0))
-            adapted_pos_embed = adapted_pos_embed_fp32.to(
-                pos_embed_weight.dtype).to(embeddings.device)
+                interpolated_embed_fp32.squeeze(0).squeeze(-1).permute(1, 0)
+            )
+            adapted_pos_embed = adapted_pos_embed_fp32.to(pos_embed_weight.dtype).to(
+                embeddings.device
+            )
 
         # Add adapted position encoding to embeddings
         embeddings = embeddings + adapted_pos_embed
@@ -633,13 +651,11 @@ def forward(self, embeddings, lengths, image_shapes, h_coords,
 
 
 class Glm4vVisionRotaryEmbedding(nn.Module):
-
     def __init__(self, dim: int, theta: float = 10000.0) -> None:
         super().__init__()
         self.dim = dim
         self.theta = theta
-        inv_freq = 1.0 / (theta
-                          **(torch.arange(0, dim, 2, dtype=torch.float) / dim))
+        inv_freq = 1.0 / (theta ** (torch.arange(0, dim, 2, dtype=torch.float) / dim))
         self.register_buffer("inv_freq", inv_freq, persistent=False)
         self._seq_len_cached = 0
         self._freqs_cached = None
@@ -648,16 +664,22 @@ def update_freqs_cache(self, seqlen: int) -> None:
         if seqlen > self._seq_len_cached:
             seqlen *= 2
             self._seq_len_cached = seqlen
-            self.inv_freq = 1.0 / (self.theta**(torch.arange(
-                0,
-                self.dim,
-                2,
-                dtype=torch.float,
-                device=self.inv_freq.device,
-            ) / self.dim))
-            seq = torch.arange(seqlen,
-                               device=self.inv_freq.device,
-                               dtype=self.inv_freq.dtype)
+            self.inv_freq = 1.0 / (
+                self.theta
+                ** (
+                    torch.arange(
+                        0,
+                        self.dim,
+                        2,
+                        dtype=torch.float,
+                        device=self.inv_freq.device,
+                    )
+                    / self.dim
+                )
+            )
+            seq = torch.arange(
+                seqlen, device=self.inv_freq.device, dtype=self.inv_freq.dtype
+            )
             freqs = torch.outer(seq, self.inv_freq)
             self._freqs_cached = freqs
 
@@ -667,7 +689,6 @@ def forward(self, seqlen: int) -> torch.Tensor:
 
 
 class Glm4vVisionTransformer(nn.Module):
-
     def __init__(
         self,
         vision_config: Glm4vVisionConfig,
@@ -700,17 +721,20 @@ def __init__(
         norm_layer = partial(RMSNorm, eps=norm_eps)
         head_dim = self.hidden_size // self.num_heads
         self.rotary_pos_emb = Glm4vVisionRotaryEmbedding(head_dim // 2)
-        self.blocks = nn.ModuleList([
-            Glm4vVisionBlock(
-                dim=self.hidden_size,
-                num_heads=self.num_heads,
-                mlp_hidden_dim=vision_config.out_hidden_size,
-                norm_layer=norm_layer,
-                quant_config=quant_config,
-                prefix=f"{prefix}.blocks.{layer_idx}",
-                use_data_parallel=self.use_data_parallel,
-            ) for layer_idx in range(depth)
-        ])
+        self.blocks = nn.ModuleList(
+            [
+                Glm4vVisionBlock(
+                    dim=self.hidden_size,
+                    num_heads=self.num_heads,
+                    mlp_hidden_dim=vision_config.out_hidden_size,
+                    norm_layer=norm_layer,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.blocks.{layer_idx}",
+                    use_data_parallel=self.use_data_parallel,
+                )
+                for layer_idx in range(depth)
+            ]
+        )
         self.merger = Glm4vPatchMerger(
             d_model=vision_config.out_hidden_size,
             context_dim=vision_config.intermediate_size,
@@ -721,21 +745,25 @@ def __init__(
         )
         self.embeddings = Glm4vVisionEmbeddings(vision_config)
 
-        self.post_conv_layernorm = RMSNorm(vision_config.hidden_size,
-                                           eps=vision_config.rms_norm_eps)
+        self.post_conv_layernorm = RMSNorm(
+            vision_config.hidden_size, eps=vision_config.rms_norm_eps
+        )
         self.downsample = nn.Conv2d(
             in_channels=vision_config.hidden_size,
             out_channels=vision_config.out_hidden_size,
             kernel_size=vision_config.spatial_merge_size,
             stride=vision_config.spatial_merge_size,
         )
-        self.post_layernorm = RMSNorm(vision_config.hidden_size,
-                                      eps=vision_config.rms_norm_eps)
+        self.post_layernorm = RMSNorm(
+            vision_config.hidden_size, eps=vision_config.rms_norm_eps
+        )
 
         self.attn_backend = get_vit_attn_backend(
-            head_size=head_dim, dtype=torch.get_default_dtype())
-        if self.attn_backend != _Backend.FLASH_ATTN and \
-            check_upstream_fa_availability(torch.get_default_dtype()):
+            head_size=head_dim, dtype=torch.get_default_dtype()
+        )
+        if self.attn_backend != _Backend.FLASH_ATTN and check_upstream_fa_availability(
+            torch.get_default_dtype()
+        ):
             self.attn_backend = _Backend.FLASH_ATTN
 
     @property
@@ -751,20 +779,27 @@ def rot_pos_emb(self, grid_thw: torch.Tensor) -> torch.Tensor:
         for t, h, w in grid_thw:
             hpos_ids = torch.arange(h).unsqueeze(1).expand(-1, w)
             wpos_ids = torch.arange(w).unsqueeze(0).expand(h, -1)
-            hpos_ids = (hpos_ids.reshape(
-                h // self.spatial_merge_size,
-                self.spatial_merge_size,
-                w // self.spatial_merge_size,
-                self.spatial_merge_size,
-            ).permute(0, 2, 1, 3).flatten())
-            wpos_ids = (wpos_ids.reshape(
-                h // self.spatial_merge_size,
-                self.spatial_merge_size,
-                w // self.spatial_merge_size,
-                self.spatial_merge_size,
-            ).permute(0, 2, 1, 3).flatten())
-            pos_ids.append(
-                torch.stack([hpos_ids, wpos_ids], dim=-1).repeat(t, 1))
+            hpos_ids = (
+                hpos_ids.reshape(
+                    h // self.spatial_merge_size,
+                    self.spatial_merge_size,
+                    w // self.spatial_merge_size,
+                    self.spatial_merge_size,
+                )
+                .permute(0, 2, 1, 3)
+                .flatten()
+            )
+            wpos_ids = (
+                wpos_ids.reshape(
+                    h // self.spatial_merge_size,
+                    self.spatial_merge_size,
+                    w // self.spatial_merge_size,
+                    self.spatial_merge_size,
+                )
+                .permute(0, 2, 1, 3)
+                .flatten()
+            )
+            pos_ids.append(torch.stack([hpos_ids, wpos_ids], dim=-1).repeat(t, 1))
         pos_ids = torch.cat(pos_ids, dim=0)
         max_grid_size = grid_thw[:, 1:].max()
         rotary_pos_emb_full = self.rotary_pos_emb(max_grid_size)
@@ -777,8 +812,10 @@ def compute_attn_mask_seqlen(
     ) -> tuple[Optional[int], Optional[list[int]]]:
         max_seqlen, seqlens = None, None
         seqlens = (cu_seqlens[1:] - cu_seqlens[:-1]).tolist()
-        if (self.attn_backend == _Backend.FLASH_ATTN
-                or self.attn_backend == _Backend.ROCM_AITER_FA):
+        if (
+            self.attn_backend == _Backend.FLASH_ATTN
+            or self.attn_backend == _Backend.ROCM_AITER_FA
+        ):
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
         return max_seqlen, seqlens
 
@@ -798,15 +835,16 @@ def forward(
         # compute position embedding
         rotary_pos_emb, image_type_ids = self.rot_pos_emb(grid_thw)
         # compute cu_seqlens
-        cu_seqlens = torch.repeat_interleave(grid_thw[:, 1] * grid_thw[:, 2],
-                                             grid_thw[:, 0]).cumsum(
-                                                 dim=0, dtype=torch.int32)
+        cu_seqlens = torch.repeat_interleave(
+            grid_thw[:, 1] * grid_thw[:, 2], grid_thw[:, 0]
+        ).cumsum(dim=0, dtype=torch.int32)
         cu_seqlens = F.pad(cu_seqlens, (1, 0), "constant", 0)
 
         # pre-compute seqlens for attn mask to reduce cuMemcpy operations
         max_seqlen, seqlens = self.compute_attn_mask_seqlen(cu_seqlens)
-        x = self.embeddings(x, seqlens, grid_thw, image_type_ids[:, 0],
-                            image_type_ids[:, 1])
+        x = self.embeddings(
+            x, seqlens, grid_thw, image_type_ids[:, 0], image_type_ids[:, 1]
+        )
 
         # transformers
         x = x.unsqueeze(1)
@@ -822,16 +860,14 @@ def forward(
         # adapter
         x = self.post_layernorm(x)
 
-        x = x.view(-1, self.spatial_merge_size, self.spatial_merge_size,
-                   x.shape[-1])
+        x = x.view(-1, self.spatial_merge_size, self.spatial_merge_size, x.shape[-1])
         x = x.permute(0, 3, 1, 2)
         x = self.downsample(x).view(-1, self.out_hidden_size)
         x = self.merger(x)
 
         return x
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("attn.qkv.", "attn.q.", "q"),
@@ -855,15 +891,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class Glm4vProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config()
 
@@ -896,17 +930,16 @@ def _get_vision_info(
         if do_resize:
             resized_height, resized_width = smart_resize(
                 num_frames=num_frames
-                if num_frames > temporal_patch_size else temporal_patch_size,
+                if num_frames > temporal_patch_size
+                else temporal_patch_size,
                 height=image_height,
                 width=image_width,
                 factor=patch_size * merge_size,
                 max_pixels=max_image_pixels,
             )
-            preprocessed_size = ImageSize(width=resized_width,
-                                          height=resized_height)
+            preprocessed_size = ImageSize(width=resized_width, height=resized_height)
         else:
-            preprocessed_size = ImageSize(width=image_width,
-                                          height=image_height)
+            preprocessed_size = ImageSize(width=image_width, height=image_height)
 
         # NOTE: Frames are padded to be divisible by `temporal_patch_size`
         # https://github.com/huggingface/transformers/blob/v4.48.3/src/transformers/models/qwen2_vl/image_processing_qwen2_vl.py#L294
@@ -922,8 +955,9 @@ def _get_vision_info(
         return preprocessed_size, num_vision_tokens
 
     def get_image_size_with_most_features(self) -> ImageSize:
-        max_image_size, _ = self._get_vision_info(image_width=9999999,
-                                                  image_height=9999999)
+        max_image_size, _ = self._get_vision_info(
+            image_width=9999999, image_height=9999999
+        )
         return max_image_size
 
     def get_num_image_tokens(
@@ -990,22 +1024,22 @@ def get_num_frames_with_most_features(
         max_videos = mm_counts.get("video", 0)
 
         max_image_tokens = self.get_max_image_tokens() * max_images
-        max_total_frames = self._get_max_video_frames(seq_len -
-                                                      max_image_tokens)
-        max_frames_per_video = min(max_total_frames // max(max_videos, 1),
-                                   _MAX_FRAMES_PER_VIDEO)
+        max_total_frames = self._get_max_video_frames(seq_len - max_image_tokens)
+        max_frames_per_video = min(
+            max_total_frames // max(max_videos, 1), _MAX_FRAMES_PER_VIDEO
+        )
 
         return max(max_frames_per_video, 1)
 
-    def _get_video_second_idx(self, metadata: dict[str, Any],
-                              total_frames: int) -> list[int]:
+    def _get_video_second_idx(
+        self, metadata: dict[str, Any], total_frames: int
+    ) -> list[int]:
         video_processor = self.get_video_processor()
 
         video_fps = metadata.get("fps", video_processor.fps)
         meta_frames = metadata.get("total_num_frames", total_frames)
         max_frame_idx = meta_frames - 1
-        duration = metadata.get("duration",
-                                round(max_frame_idx / video_fps) + 1)
+        duration = metadata.get("duration", round(max_frame_idx / video_fps) + 1)
         do_sample_frames = metadata["do_sample_frames"]
         if not do_sample_frames:
             frame_indices = metadata["frames_indices"]
@@ -1016,18 +1050,17 @@ def _get_video_second_idx(self, metadata: dict[str, Any],
                     min(
                         max_frame_idx,
                         int(math.ceil(i * video_fps / video_processor.fps)),
-                    ) for i in range(n)
+                    )
+                    for i in range(n)
                 ]
             else:
-                num_samples = int(video_processor.max_duration *
-                                  video_processor.fps)
+                num_samples = int(video_processor.max_duration * video_processor.fps)
                 if num_samples >= meta_frames:
                     frame_indices = list(range(meta_frames))
                 else:
-                    target_seconds = np.linspace(0,
-                                                 duration,
-                                                 num_samples,
-                                                 endpoint=True)
+                    target_seconds = np.linspace(
+                        0, duration, num_samples, endpoint=True
+                    )
                     frame_indices = [
                         min(max_frame_idx, int(math.ceil(t * video_fps)))
                         for t in target_seconds
@@ -1069,8 +1102,7 @@ def _construct_video_placeholder(
         assert isinstance(grid_thw, torch.Tensor)
         timestamps = self._get_video_second_idx(metadata, len(video_array))
         frames_idx_token = [
-            tokenizer.encode(str(i), add_special_tokens=False)
-            for i in timestamps
+            tokenizer.encode(str(i), add_special_tokens=False) for i in timestamps
         ]
         T, H, W = grid_thw
         num_tokens_per_frame = int(H * W) // merge_length
@@ -1078,8 +1110,7 @@ def _construct_video_placeholder(
         placeholder.append(bov_token_id)
         for frame_idx in frames_idx_token:
             placeholder.append(boi_token_id)
-            placeholder.extend([hf_processor.video_token_id] *
-                               num_tokens_per_frame)
+            placeholder.extend([hf_processor.video_token_id] * num_tokens_per_frame)
             placeholder.append(eoi_token_id)
             placeholder.extend(frame_idx)
         placeholder.append(eov_token_id)
@@ -1088,7 +1119,6 @@ def _construct_video_placeholder(
 
 
 class Glm4vDummyInputsBuilder(BaseDummyInputsBuilder[Glm4vProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -1116,22 +1146,22 @@ def get_dummy_mm_data(
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
 
-        target_width, target_height = (
-            self.info.get_image_size_with_most_features())
+        target_width, target_height = self.info.get_image_size_with_most_features()
         target_num_frames = self.info.get_num_frames_with_most_features(
-            seq_len, mm_counts)
+            seq_len, mm_counts
+        )
 
         image_overrides = mm_options.get("image") if mm_options else None
         video_overrides = mm_options.get("video") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
-            "video":
-            self._get_dummy_videos(
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
+            "video": self._get_dummy_videos(
                 width=target_width,
                 height=target_height,
                 num_frames=target_num_frames,
@@ -1155,21 +1185,27 @@ def _get_dummy_videos(
                     logger.warning(
                         "video.num_frames override (%d) exceeds model's "
                         "maximum number of frames (%d), will be ignored",
-                        overrides.num_frames, num_frames)
+                        overrides.num_frames,
+                        num_frames,
+                    )
                 num_frames = min(num_frames, overrides.num_frames)
             if overrides.width:
                 if overrides.width > width:
                     logger.warning(
                         "video.width override (%d) exceeds model's "
-                        "maximum width (%d), will be ignored", overrides.width,
-                        width)
+                        "maximum width (%d), will be ignored",
+                        overrides.width,
+                        width,
+                    )
                 width = min(width, overrides.width)
             if overrides.height:
                 if overrides.height > height:
                     logger.warning(
                         "video.height override (%d) exceeds model's "
                         "maximum height (%d), will be ignored",
-                        overrides.height, height)
+                        overrides.height,
+                        height,
+                    )
                 height = min(height, overrides.height)
 
         video = np.full((num_frames, width, height, 3), 255, dtype=np.uint8)
@@ -1190,7 +1226,6 @@ def _get_dummy_videos(
 
 
 class Glm4vMultiModalProcessor(BaseMultiModalProcessor[Glm4vProcessingInfo]):
-
     def _get_data_parser(self) -> MultiModalDataParser:
         return MultiModalDataParser(video_needs_metadata=True)
 
@@ -1207,8 +1242,11 @@ def _call_hf_processor(
         # GLM-4.1V use `image_token_id` as video placeholder, we need to
         # replace it with `video_token_id` for video processing. So we
         # separate video processing from image processing.
-        if ("videos" in mm_data and isinstance(mm_data["videos"], list)
-                and len(mm_data["videos"]) > 0):
+        if (
+            "videos" in mm_data
+            and isinstance(mm_data["videos"], list)
+            and len(mm_data["videos"]) > 0
+        ):
             video_grid_thw_lst = []
             pixel_values_videos_lst = []
             for item in mm_data.pop("videos", []):
@@ -1217,25 +1255,31 @@ def _call_hf_processor(
                 # don't update mm_kwargs inplace
                 video_mm_kwargs = dict(**mm_kwargs)
                 video_mm_kwargs["do_sample_frames"] = metadata.get(
-                    "do_sample_frames", True)
+                    "do_sample_frames", True
+                )
 
                 video_mm_data = dict()
                 video_mm_data["videos"] = [[video_array]]
 
                 # backward compatibility for Transformers 4.55
                 unuse_metadata = ["do_sample_frames"]
-                if not hasattr(
-                        VideoMetadata,
-                        "frames_indices") and "frames_indices" in metadata:
+                if (
+                    not hasattr(VideoMetadata, "frames_indices")
+                    and "frames_indices" in metadata
+                ):
                     unuse_metadata.append("frames_indices")
 
-                video_mm_data["video_metadata"] = [[
-                    VideoMetadata(
-                        **{
-                            k: metadata[k]
-                            for k in metadata if k not in unuse_metadata
-                        })
-                ]]
+                video_mm_data["video_metadata"] = [
+                    [
+                        VideoMetadata(
+                            **{
+                                k: metadata[k]
+                                for k in metadata
+                                if k not in unuse_metadata
+                            }
+                        )
+                    ]
+                ]
 
                 video_outputs = super()._call_hf_processor(
                     prompt="<|begin_of_video|><|video|><|end_of_video|>",
@@ -1244,7 +1288,8 @@ def _call_hf_processor(
                     tok_kwargs=tok_kwargs,
                 )
                 if not video_mm_kwargs["do_sample_frames"] and Version(
-                        TRANSFORMERS_VERSION) < Version("4.56.0"):
+                    TRANSFORMERS_VERSION
+                ) < Version("4.56.0"):
                     # Transformers v4.55 has incorrect timestamps issue for
                     # skip sampling. We construct the placeholder manually to
                     # get placeholders with correct timestamps.
@@ -1257,9 +1302,9 @@ def _call_hf_processor(
                 else:
                     input_ids = video_outputs.pop("input_ids")
                     input_ids[input_ids == processor.image_token_id] = (
-                        processor.video_token_id)
-                    video_placeholder = processor.tokenizer.batch_decode(
-                        input_ids)[0]
+                        processor.video_token_id
+                    )
+                    video_placeholder = processor.tokenizer.batch_decode(input_ids)[0]
                 prompt = prompt.replace(
                     "<|begin_of_video|><|video|><|end_of_video|>",
                     video_placeholder,
@@ -1267,8 +1312,7 @@ def _call_hf_processor(
                 )
 
                 video_grid_thw_lst.append(video_outputs["video_grid_thw"])
-                pixel_values_videos_lst.append(
-                    video_outputs["pixel_values_videos"])
+                pixel_values_videos_lst.append(video_outputs["pixel_values_videos"])
             video_outputs = dict(
                 pixel_values_videos=torch.cat(pixel_values_videos_lst),
                 video_grid_thw=torch.cat(video_grid_thw_lst),
@@ -1294,8 +1338,8 @@ def _get_mm_fields_config(
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
         return _create_qwen2vl_field_factory(
-            self.info.get_hf_config().vision_config.spatial_merge_size)(
-                hf_inputs)
+            self.info.get_hf_config().vision_config.spatial_merge_size
+        )(hf_inputs)
 
     def _get_prompt_updates(
         self,
@@ -1304,8 +1348,7 @@ def _get_prompt_updates(
         out_mm_kwargs: MultiModalKwargsItems,
     ) -> Sequence[PromptUpdate]:
         hf_processor = self.info.get_hf_processor(**hf_processor_mm_kwargs)
-        image_processor = self.info.get_image_processor(
-            **hf_processor_mm_kwargs)
+        image_processor = self.info.get_image_processor(**hf_processor_mm_kwargs)
 
         merge_length = image_processor.merge_size**2
 
@@ -1324,7 +1367,8 @@ def get_video_replacement_glm4v(item_idx: int):
 
             video, metadata = mm_items["video"][item_idx]
             placeholder = self.info._construct_video_placeholder(
-                video, metadata, grid_thw)
+                video, metadata, grid_thw
+            )
             return PromptUpdateDetails.select_token_id(
                 placeholder,
                 embed_token_id=hf_processor.video_token_id,
@@ -1349,8 +1393,9 @@ def get_video_replacement_glm4v(item_idx: int):
     info=Glm4vProcessingInfo,
     dummy_inputs=Glm4vDummyInputsBuilder,
 )
-class Glm4vForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                    SupportsLoRA, SupportsPP):
+class Glm4vForConditionalGeneration(
+    nn.Module, SupportsMultiModal, SupportsLoRA, SupportsPP
+):
     merge_by_field_config = True
 
     packed_modules_mapping = {
@@ -1359,7 +1404,7 @@ class Glm4vForConditionalGeneration(nn.Module, SupportsMultiModal,
             "k_proj",
             "v_proj",
         ],
-        "gate_up_proj": ["gate_up_proj"]
+        "gate_up_proj": ["gate_up_proj"],
     }
 
     # To ensure correct weight loading and mapping.
@@ -1368,7 +1413,8 @@ class Glm4vForConditionalGeneration(nn.Module, SupportsMultiModal,
             "lm_head.": "language_model.lm_head.",
             "model.language_model.": "language_model.model.",
             "model.visual.": "visual.",
-        })
+        }
+    )
 
     supports_encoder_tp_data = True
 
@@ -1410,13 +1456,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             vllm_config=vllm_config,
             hf_config=config.text_config,
             prefix=maybe_prefix(prefix, "language_model"),
-            architectures=architectures)
+            architectures=architectures,
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[Glm4vImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[Glm4vImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_embeds = kwargs.pop("image_embeds", None)
         image_grid_thw = kwargs.pop("image_grid_thw", None)
@@ -1439,7 +1488,8 @@ def _parse_and_validate_image_input(
             )
 
     def _parse_and_validate_video_input(
-            self, **kwargs: object) -> Optional[Glm4vVideoInputs]:
+        self, **kwargs: object
+    ) -> Optional[Glm4vVideoInputs]:
         pixel_values_videos = kwargs.pop("pixel_values_videos", None)
         video_embeds = kwargs.pop("video_embeds", None)
         video_grid_thw = kwargs.pop("video_grid_thw", None)
@@ -1462,7 +1512,8 @@ def _parse_and_validate_video_input(
             )
 
     def _process_image_input(
-            self, image_input: Glm4vImageInputs) -> tuple[torch.Tensor, ...]:
+        self, image_input: Glm4vImageInputs
+    ) -> tuple[torch.Tensor, ...]:
         grid_thw = image_input["image_grid_thw"]
         assert grid_thw.ndim == 2
         grid_thw_list = grid_thw.tolist()
@@ -1472,20 +1523,21 @@ def _process_image_input(
         else:
             pixel_values = image_input["pixel_values"].type(self.visual.dtype)
             if self.use_data_parallel:
-                return run_dp_sharded_mrope_vision_model(self.visual,
-                                                         pixel_values,
-                                                         grid_thw.tolist(),
-                                                         rope_type="rope_3d")
+                return run_dp_sharded_mrope_vision_model(
+                    self.visual, pixel_values, grid_thw.tolist(), rope_type="rope_3d"
+                )
             else:
-                image_embeds = self.visual(pixel_values,
-                                           grid_thw=grid_thw.tolist())
+                image_embeds = self.visual(pixel_values, grid_thw=grid_thw.tolist())
         merge_size = self.visual.spatial_merge_size
-        sizes = (torch.tensor(grid_thw_list, dtype=torch.long).prod(-1) //
-                 (merge_size * merge_size)).tolist()
+        sizes = (
+            torch.tensor(grid_thw_list, dtype=torch.long).prod(-1)
+            // (merge_size * merge_size)
+        ).tolist()
         return image_embeds.split(sizes)
 
     def _process_video_input(
-            self, video_input: Glm4vVideoInputs) -> tuple[torch.Tensor, ...]:
+        self, video_input: Glm4vVideoInputs
+    ) -> tuple[torch.Tensor, ...]:
         grid_thw = video_input["video_grid_thw"]
         assert grid_thw.ndim == 2
         grid_thw_list = grid_thw.tolist()
@@ -1494,19 +1546,25 @@ def _process_video_input(
             video_embeds = video_input["video_embeds"].type(self.visual.dtype)
         else:
             pixel_values_videos = video_input["pixel_values_videos"].type(
-                self.visual.dtype)
+                self.visual.dtype
+            )
             if self.use_data_parallel:
-                return run_dp_sharded_mrope_vision_model(self.visual,
-                                                         pixel_values_videos,
-                                                         grid_thw.tolist(),
-                                                         rope_type="rope_3d")
+                return run_dp_sharded_mrope_vision_model(
+                    self.visual,
+                    pixel_values_videos,
+                    grid_thw.tolist(),
+                    rope_type="rope_3d",
+                )
             else:
-                video_embeds = self.visual(pixel_values_videos,
-                                           grid_thw=grid_thw.tolist())
+                video_embeds = self.visual(
+                    pixel_values_videos, grid_thw=grid_thw.tolist()
+                )
         # Split concatenated embeddings for each video item.
         merge_size = self.visual.spatial_merge_size
-        sizes = (torch.tensor(grid_thw_list, dtype=torch.long).prod(-1) //
-                 (merge_size * merge_size)).tolist()
+        sizes = (
+            torch.tensor(grid_thw_list, dtype=torch.long).prod(-1)
+            // (merge_size * merge_size)
+        ).tolist()
         return video_embeds.split(sizes)
 
     def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
@@ -1515,23 +1573,29 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if (input_key in ("pixel_values", "image_embeds")
-                    and "image" not in mm_input_by_modality):
-                mm_input_by_modality["image"] = (
-                    self._parse_and_validate_image_input(**kwargs))
-            if (input_key in ("pixel_values_videos", "video_embeds")
-                    and "video" not in mm_input_by_modality):
-                mm_input_by_modality["video"] = (
-                    self._parse_and_validate_video_input(**kwargs))
+            if (
+                input_key in ("pixel_values", "image_embeds")
+                and "image" not in mm_input_by_modality
+            ):
+                mm_input_by_modality["image"] = self._parse_and_validate_image_input(
+                    **kwargs
+                )
+            if (
+                input_key in ("pixel_values_videos", "video_embeds")
+                and "video" not in mm_input_by_modality
+            ):
+                mm_input_by_modality["video"] = self._parse_and_validate_video_input(
+                    **kwargs
+                )
         return mm_input_by_modality
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
     def get_multimodal_embeddings(
-            self, **kwargs: object) -> Optional[MultiModalEmbeddings]:
-        mm_input_by_modality = self._parse_and_validate_multimodal_inputs(
-            **kwargs)
+        self, **kwargs: object
+    ) -> Optional[MultiModalEmbeddings]:
+        mm_input_by_modality = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not mm_input_by_modality:
             return None
 
@@ -1591,8 +1655,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
diff --git a/vllm/model_executor/models/glm4_moe.py b/vllm/model_executor/models/glm4_moe.py
index 2557748b7faa..5db6f297dbf2 100644
--- a/vllm/model_executor/models/glm4_moe.py
+++ b/vllm/model_executor/models/glm4_moe.py
@@ -22,6 +22,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only GLM-4.5, GLM-4.6 model compatible with HuggingFace weights."""
+
 import typing
 from collections.abc import Callable, Iterable
 from itertools import islice
@@ -34,35 +35,48 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig, get_current_vllm_config
-from vllm.distributed import (get_ep_group, get_pp_group,
-                              get_tensor_model_parallel_world_size)
+from vllm.distributed import (
+    get_ep_group,
+    get_pp_group,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.shared_fused_moe import SharedFusedMoE
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
 
 class Glm4MoeMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -74,19 +88,24 @@ def __init__(
     ) -> None:
         super().__init__()
         self.gate_up_proj = MergedColumnParallelLinear(
-            hidden_size, [intermediate_size] * 2,
+            hidden_size,
+            [intermediate_size] * 2,
             bias=False,
             quant_config=quant_config,
-            prefix=f"{prefix}.gate_up_proj")
-        self.down_proj = RowParallelLinear(intermediate_size,
-                                           hidden_size,
-                                           bias=False,
-                                           quant_config=quant_config,
-                                           reduce_results=reduce_results,
-                                           prefix=f"{prefix}.down_proj")
+            prefix=f"{prefix}.gate_up_proj",
+        )
+        self.down_proj = RowParallelLinear(
+            intermediate_size,
+            hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            reduce_results=reduce_results,
+            prefix=f"{prefix}.down_proj",
+        )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -97,7 +116,6 @@ def forward(self, x):
 
 
 class Glm4MoE(nn.Module):
-
     def __init__(
         self,
         config: Glm4MoeConfig,
@@ -116,8 +134,10 @@ def __init__(
         self.n_shared_experts: int = config.n_shared_experts
 
         if config.hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {config.hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {config.hidden_act}. "
+                "Only silu is supported for now."
+            )
         # NOTE In the transformers implementation, the gate isn't an nn.Linear,
         # so we cannot use ReplicatedLinear here.
         # See: https://github.com/huggingface/transformers/blob/v4.55.1/src/transformers/models/glm4_moe/modeling_glm4_moe.py#L260
@@ -128,7 +148,8 @@ def __init__(
             dtype=torch.float32,
         )
         self.gate.e_score_correction_bias = nn.Parameter(
-            torch.empty(config.n_routed_experts, dtype=torch.float32))
+            torch.empty(config.n_routed_experts, dtype=torch.float32)
+        )
 
         # Load balancing settings.
         vllm_config = get_current_vllm_config()
@@ -137,18 +158,16 @@ def __init__(
 
         self.n_redundant_experts = eplb_config.num_redundant_experts
         self.n_logical_experts = self.n_routed_experts
-        self.n_physical_experts = (self.n_logical_experts +
-                                   self.n_redundant_experts)
+        self.n_physical_experts = self.n_logical_experts + self.n_redundant_experts
         self.n_local_physical_experts = self.n_physical_experts // self.ep_size
 
-        self.physical_expert_start = (self.ep_rank *
-                                      self.n_local_physical_experts)
-        self.physical_expert_end = (self.physical_expert_start +
-                                    self.n_local_physical_experts)
+        self.physical_expert_start = self.ep_rank * self.n_local_physical_experts
+        self.physical_expert_end = (
+            self.physical_expert_start + self.n_local_physical_experts
+        )
 
         if config.n_shared_experts is not None:
-            intermediate_size = (config.moe_intermediate_size *
-                                 config.n_shared_experts)
+            intermediate_size = config.moe_intermediate_size * config.n_shared_experts
             self.shared_experts = Glm4MoeMLP(
                 hidden_size=config.hidden_size,
                 intermediate_size=intermediate_size,
@@ -195,7 +214,8 @@ def __init__(
                 routed_scaling_factor=1.0,
                 e_score_correction_bias=self.gate.e_score_correction_bias,
                 enable_eplb=self.enable_eplb,
-                num_redundant_experts=self.n_redundant_experts)
+                num_redundant_experts=self.n_redundant_experts,
+            )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         num_tokens, hidden_dim = hidden_states.shape
@@ -204,27 +224,27 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         # router_logits: (num_tokens, n_experts)
         router_logits = self.gate(hidden_states.to(dtype=torch.float32))
 
-        fused_moe_out = self.experts(hidden_states=hidden_states,
-                                     router_logits=router_logits)
+        fused_moe_out = self.experts(
+            hidden_states=hidden_states, router_logits=router_logits
+        )
 
         if self.shared_experts is not None:
             shared_output, final_hidden_states = fused_moe_out
             assert shared_output is not None
-            final_hidden_states = \
-                final_hidden_states * self.routed_scaling_factor\
-                    + shared_output
+            final_hidden_states = (
+                final_hidden_states * self.routed_scaling_factor + shared_output
+            )
         else:
             final_hidden_states = fused_moe_out * self.routed_scaling_factor
 
         if self.tp_size > 1:
-            final_hidden_states = (
-                self.experts.maybe_all_reduce_tensor_model_parallel(
-                    final_hidden_states))
+            final_hidden_states = self.experts.maybe_all_reduce_tensor_model_parallel(
+                final_hidden_states
+            )
         return final_hidden_states.view(num_tokens, hidden_dim)
 
 
 class Glm4MoeAttention(nn.Module):
-
     def __init__(
         self,
         config: Glm4MoeConfig,
@@ -266,19 +286,23 @@ def __init__(
         self.max_position_embeddings = max_position_embeddings
         self.use_qk_norm = use_qk_norm
 
-        self.qkv_proj = QKVParallelLinear(hidden_size,
-                                          self.head_dim,
-                                          self.total_num_heads,
-                                          self.total_num_kv_heads,
-                                          bias=qkv_bias,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.qkv_proj")
+        self.qkv_proj = QKVParallelLinear(
+            hidden_size,
+            self.head_dim,
+            self.total_num_heads,
+            self.total_num_kv_heads,
+            bias=qkv_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.qkv_proj",
+        )
 
-        self.o_proj = RowParallelLinear(self.total_num_heads * self.head_dim,
-                                        hidden_size,
-                                        bias=False,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.o_proj")
+        self.o_proj = RowParallelLinear(
+            self.total_num_heads * self.head_dim,
+            hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.o_proj",
+        )
 
         partial_rotary_factor = getattr(config, "partial_rotary_factor", 0.5)
         self.rotary_emb = get_rope(
@@ -311,10 +335,12 @@ def forward(
         qkv, _ = self.qkv_proj(hidden_states)
         q, k, v = qkv.split([self.q_size, self.kv_size, self.kv_size], dim=-1)
         if self.use_qk_norm:
-            q = self.q_norm(q.reshape(-1, self.num_heads,
-                                      self.head_dim)).reshape(q.shape)
-            k = self.k_norm(k.reshape(-1, self.num_kv_heads,
-                                      self.head_dim)).reshape(k.shape)
+            q = self.q_norm(q.reshape(-1, self.num_heads, self.head_dim)).reshape(
+                q.shape
+            )
+            k = self.k_norm(k.reshape(-1, self.num_kv_heads, self.head_dim)).reshape(
+                k.shape
+            )
 
         q, k = self.rotary_emb(positions, q, k)
         attn_output = self.attn(q, k, v)
@@ -323,7 +349,6 @@ def forward(
 
 
 class Glm4MoeDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Glm4MoeConfig,
@@ -336,11 +361,10 @@ def __init__(
         self.hidden_size = config.hidden_size
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          131072)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 131072)
         # DecoderLayers are created with `make_layers` which passes the prefix
         # with the layer's index.
-        layer_idx = int(prefix.split(sep='.')[-1])
+        layer_idx = int(prefix.split(sep=".")[-1])
         self.layer_idx = layer_idx
 
         self.self_attn = Glm4MoeAttention(
@@ -360,8 +384,10 @@ def __init__(
             use_qk_norm=config.use_qk_norm,
         )
 
-        if (config.n_routed_experts is not None
-                and layer_idx >= config.first_k_dense_replace):
+        if (
+            config.n_routed_experts is not None
+            and layer_idx >= config.first_k_dense_replace
+        ):
             self.mlp = Glm4MoE(
                 config=config,
                 quant_config=quant_config,
@@ -369,16 +395,18 @@ def __init__(
                 enable_eplb=enable_eplb,
             )
         else:
-            self.mlp = Glm4MoeMLP(hidden_size=config.hidden_size,
-                                  intermediate_size=config.intermediate_size,
-                                  hidden_act=config.hidden_act,
-                                  quant_config=quant_config,
-                                  prefix=f"{prefix}.mlp")
-
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+            self.mlp = Glm4MoeMLP(
+                hidden_size=config.hidden_size,
+                intermediate_size=config.intermediate_size,
+                hidden_act=config.hidden_act,
+                quant_config=quant_config,
+                prefix=f"{prefix}.mlp",
+            )
+
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
         self.routed_scaling_factor = config.routed_scaling_factor
 
     def forward(
@@ -391,12 +419,9 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
-        hidden_states = self.self_attn(positions=positions,
-                                       hidden_states=hidden_states)
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
+        hidden_states = self.self_attn(positions=positions, hidden_states=hidden_states)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
@@ -407,9 +432,9 @@ def forward(
         "positions": -1,
         "intermediate_tensors": 0,
         "inputs_embeds": 0,
-    })
+    }
+)
 class Glm4MoeModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -423,9 +448,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         if get_pp_group().is_first_rank:
             self.embed_tokens = VocabParallelEmbedding(
-                config.vocab_size,
-                config.hidden_size,
-                prefix=f"{prefix}.embed_tokens")
+                config.vocab_size, config.hidden_size, prefix=f"{prefix}.embed_tokens"
+            )
         else:
             self.embed_tokens = PPMissingLayer()
 
@@ -438,15 +462,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 prefix=prefix,
                 enable_eplb=enable_eplb,
             ),
-            prefix=f"{prefix}.layers")
+            prefix=f"{prefix}.layers",
+        )
 
         if get_pp_group().is_last_rank:
             self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         else:
             self.norm = PPMissingLayer()
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -473,27 +498,26 @@ def forward(
             hidden_states, residual = layer(positions, hidden_states, residual)
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
     def make_empty_intermediate_tensors(
-            self, batch_size: int, dtype: torch.dtype,
-            device: torch.device) -> IntermediateTensors:
-        return IntermediateTensors({
-            "hidden_states":
-            torch.zeros((batch_size, self.config.hidden_size),
-                        dtype=dtype,
-                        device=device),
-            "residual":
-            torch.zeros((batch_size, self.config.hidden_size),
-                        dtype=dtype,
-                        device=device),
-        })
+        self, batch_size: int, dtype: torch.dtype, device: torch.device
+    ) -> IntermediateTensors:
+        return IntermediateTensors(
+            {
+                "hidden_states": torch.zeros(
+                    (batch_size, self.config.hidden_size), dtype=dtype, device=device
+                ),
+                "residual": torch.zeros(
+                    (batch_size, self.config.hidden_size), dtype=dtype, device=device
+                ),
+            }
+        )
 
     def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
         # Params for weights, fp8 weight scales, fp8 activation scales
@@ -502,10 +526,10 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
             ckpt_gate_proj_name="gate_proj",
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
-            num_experts=self.config.n_routed_experts)
+            num_experts=self.config.n_routed_experts,
+        )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -522,7 +546,7 @@ def load_weights(self, weights: Iterable[tuple[str,
             spec_layer = get_spec_layer_idx_from_weight_name(self.config, name)
             if spec_layer is not None:
                 continue
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 # Skip non-stacked layers and experts (experts handled below).
                 if weight_name not in name:
                     continue
@@ -532,7 +556,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 # name will be updated to mlp.experts[0].gate_up_proj, which
                 # will then be updated below in expert_params_mapping
                 # for mlp.experts[0].gate_gate_up_proj, which breaks load.
-                if (("mlp.experts." in name) and name not in params_dict):
+                if ("mlp.experts." in name) and name not in params_dict:
                     continue
                 name = name.replace(weight_name, param_name)
                 # Skip loading extra bias for GPTQ models.
@@ -567,14 +591,17 @@ def load_weights(self, weights: Iterable[tuple[str,
                     # We should ask the weight loader to return success or not
                     # here since otherwise we may skip experts with other
                     # available replicas.
-                    weight_loader = typing.cast(Callable[..., bool],
-                                                param.weight_loader)
-                    success = weight_loader(param,
-                                            loaded_weight,
-                                            name_mapped,
-                                            shard_id=shard_id,
-                                            expert_id=expert_id,
-                                            return_success=True)
+                    weight_loader = typing.cast(
+                        Callable[..., bool], param.weight_loader
+                    )
+                    success = weight_loader(
+                        param,
+                        loaded_weight,
+                        name_mapped,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                        return_success=True,
+                    )
                     if success:
                         name = name_mapped
                         break
@@ -598,8 +625,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
 
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
 
@@ -627,24 +655,26 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.model = Glm4MoeModel(vllm_config=vllm_config,
-                                  prefix=maybe_prefix(prefix, "model"))
+        self.model = Glm4MoeModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         if get_pp_group().is_last_rank:
-            self.lm_head = ParallelLMHead(config.vocab_size,
-                                          config.hidden_size,
-                                          quant_config=quant_config,
-                                          prefix=maybe_prefix(
-                                              prefix, "lm_head"))
+            self.lm_head = ParallelLMHead(
+                config.vocab_size,
+                config.hidden_size,
+                quant_config=quant_config,
+                prefix=maybe_prefix(prefix, "lm_head"),
+            )
         else:
             self.lm_head = PPMissingLayer()
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
         self.expert_weights = []
 
         # Set MoE hyperparameters
-        self.num_moe_layers = (config.num_hidden_layers -
-                               config.first_k_dense_replace)
+        self.num_moe_layers = config.num_hidden_layers - config.first_k_dense_replace
         self.num_expert_groups = config.n_group
 
         self.moe_layers: list[FusedMoE] = []
@@ -695,8 +725,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -706,8 +737,7 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
 
@@ -715,13 +745,14 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
         return self.model.get_expert_mapping()
 
 
-def get_spec_layer_idx_from_weight_name(config: Glm4MoeConfig,
-                                        weight_name: str) -> Optional[int]:
-    if hasattr(config,
-               "num_nextn_predict_layers") and (config.num_nextn_predict_layers
-                                                > 0):
+def get_spec_layer_idx_from_weight_name(
+    config: Glm4MoeConfig, weight_name: str
+) -> Optional[int]:
+    if hasattr(config, "num_nextn_predict_layers") and (
+        config.num_nextn_predict_layers > 0
+    ):
         layer_idx = config.num_hidden_layers
         for i in range(config.num_nextn_predict_layers):
-            if f"layers.{layer_idx+i}." in weight_name:
+            if f"layers.{layer_idx + i}." in weight_name:
                 return layer_idx + i
     return None
diff --git a/vllm/model_executor/models/glm4_moe_mtp.py b/vllm/model_executor/models/glm4_moe_mtp.py
index 57b698e239ec..beb40632246c 100644
--- a/vllm/model_executor/models/glm4_moe_mtp.py
+++ b/vllm/model_executor/models/glm4_moe_mtp.py
@@ -36,7 +36,9 @@
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
@@ -46,7 +48,6 @@
 
 
 class SharedHead(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -55,17 +56,18 @@ def __init__(
     ) -> None:
         super().__init__()
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.head = ParallelLMHead(config.vocab_size,
-                                   config.hidden_size,
-                                   quant_config=quant_config,
-                                   prefix=maybe_prefix(prefix, "head"))
+        self.head = ParallelLMHead(
+            config.vocab_size,
+            config.hidden_size,
+            quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "head"),
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         return self.norm(hidden_states)
 
 
 class Glm4MoeMultiTokenPredictorLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -76,16 +78,16 @@ def __init__(
         super().__init__()
         self.enorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         self.hnorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.eh_proj = nn.Linear(config.hidden_size * 2,
-                                 config.hidden_size,
-                                 bias=False)
-        self.shared_head = SharedHead(config=config,
-                                      prefix=prefix,
-                                      quant_config=quant_config)
-        self.mtp_block = Glm4MoeDecoderLayer(config=config,
-                                             cache_config=cache_config,
-                                             quant_config=quant_config,
-                                             prefix=prefix)
+        self.eh_proj = nn.Linear(config.hidden_size * 2, config.hidden_size, bias=False)
+        self.shared_head = SharedHead(
+            config=config, prefix=prefix, quant_config=quant_config
+        )
+        self.mtp_block = Glm4MoeDecoderLayer(
+            config=config,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=prefix,
+        )
 
     def forward(
         self,
@@ -102,34 +104,37 @@ def forward(
         previous_hidden_states = self.hnorm(previous_hidden_states)
 
         hidden_states = self.eh_proj(
-            torch.cat([inputs_embeds, previous_hidden_states], dim=-1))
+            torch.cat([inputs_embeds, previous_hidden_states], dim=-1)
+        )
 
-        hidden_states, residual = self.mtp_block(positions=positions,
-                                                 hidden_states=hidden_states,
-                                                 residual=None)
+        hidden_states, residual = self.mtp_block(
+            positions=positions, hidden_states=hidden_states, residual=None
+        )
         hidden_states = residual + hidden_states
         return hidden_states
 
 
 class Glm4MoeMultiTokenPredictor(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         self.mtp_start_layer_idx = config.num_hidden_layers
         self.num_mtp_layers = config.num_nextn_predict_layers
         # to map the exact layer index from weights
-        self.layers = torch.nn.ModuleDict({
-            str(idx):
-            Glm4MoeMultiTokenPredictorLayer(
-                config,
-                f"{prefix}.layers.{idx}",
-                cache_config=vllm_config.cache_config,
-                quant_config=vllm_config.quant_config,
-            )
-            for idx in range(self.mtp_start_layer_idx,
-                             self.mtp_start_layer_idx + self.num_mtp_layers)
-        })
+        self.layers = torch.nn.ModuleDict(
+            {
+                str(idx): Glm4MoeMultiTokenPredictorLayer(
+                    config,
+                    f"{prefix}.layers.{idx}",
+                    cache_config=vllm_config.cache_config,
+                    quant_config=vllm_config.quant_config,
+                )
+                for idx in range(
+                    self.mtp_start_layer_idx,
+                    self.mtp_start_layer_idx + self.num_mtp_layers,
+                )
+            }
+        )
         self.embed_tokens = VocabParallelEmbedding(
             config.vocab_size,
             config.hidden_size,
@@ -149,7 +154,7 @@ def forward(
     ) -> torch.Tensor:
         if inputs_embeds is None:
             inputs_embeds = self.embed_tokens(input_ids)
-        current_step_idx = (spec_step_idx % self.num_mtp_layers)
+        current_step_idx = spec_step_idx % self.num_mtp_layers
         return self.layers[str(self.mtp_start_layer_idx + current_step_idx)](
             input_ids,
             positions,
@@ -163,22 +168,21 @@ def compute_logits(
         hidden_states: torch.Tensor,
         spec_step_idx: int = 0,
     ) -> torch.Tensor:
-        current_step_idx = (spec_step_idx % self.num_mtp_layers)
-        mtp_layer = self.layers[str(self.mtp_start_layer_idx +
-                                    current_step_idx)]
-        logits = self.logits_processor(mtp_layer.shared_head.head,
-                                       mtp_layer.shared_head(hidden_states))
+        current_step_idx = spec_step_idx % self.num_mtp_layers
+        mtp_layer = self.layers[str(self.mtp_start_layer_idx + current_step_idx)]
+        logits = self.logits_processor(
+            mtp_layer.shared_head.head, mtp_layer.shared_head(hidden_states)
+        )
         return logits
 
 
 class Glm4MoeMTP(nn.Module, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         self.config = vllm_config.model_config.hf_config
-        self.model = Glm4MoeMultiTokenPredictor(vllm_config=vllm_config,
-                                                prefix=maybe_prefix(
-                                                    prefix, "model"))
+        self.model = Glm4MoeMultiTokenPredictor(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -192,8 +196,9 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         spec_step_idx: int = 0,
     ) -> torch.Tensor:
-        hidden_states = self.model(input_ids, positions, hidden_states,
-                                   inputs_embeds, spec_step_idx)
+        hidden_states = self.model(
+            input_ids, positions, hidden_states, inputs_embeds, spec_step_idx
+        )
         return hidden_states
 
     def compute_logits(
@@ -203,8 +208,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.model.compute_logits(hidden_states, spec_step_idx)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -220,7 +224,8 @@ def load_weights(self, weights: Iterable[tuple[str,
             ckpt_gate_proj_name="gate_proj",
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
-            num_experts=self.config.n_routed_experts)
+            num_experts=self.config.n_routed_experts,
+        )
 
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
@@ -229,7 +234,7 @@ def load_weights(self, weights: Iterable[tuple[str,
             if spec_layer is None:
                 continue
             name = self._rewrite_spec_layer_name(spec_layer, name)
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 # Skip non-stacked layers and experts (experts handled below).
                 if weight_name not in name:
                     continue
@@ -239,7 +244,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 # name will be updated to mlp.experts[0].gate_up_proj, which
                 # will then be updated below in expert_params_mapping
                 # for mlp.experts[0].gate_gate_up_proj, which breaks load.
-                if (("mlp.experts." in name) and name not in params_dict):
+                if ("mlp.experts." in name) and name not in params_dict:
                     continue
                 name = name.replace(weight_name, param_name)
                 # Skip loading extra bias for GPTQ models.
@@ -259,11 +264,13 @@ def load_weights(self, weights: Iterable[tuple[str,
 
                     param = params_dict[name]
                     weight_loader = param.weight_loader
-                    weight_loader(param,
-                                  loaded_weight,
-                                  name,
-                                  shard_id=shard_id,
-                                  expert_id=expert_id)
+                    weight_loader(
+                        param,
+                        loaded_weight,
+                        name,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                    )
                     break
                 else:
                     # Skip loading extra bias for GPTQ models.
@@ -272,13 +279,16 @@ def load_weights(self, weights: Iterable[tuple[str,
 
                     # According to DeepSeek-V3 Technical Report, MTP modules
                     # shares embedding layer. We only load the first weights.
-                    if (spec_layer != self.model.mtp_start_layer_idx
-                            and ".layers" not in name):
+                    if (
+                        spec_layer != self.model.mtp_start_layer_idx
+                        and ".layers" not in name
+                    ):
                         continue
 
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -290,7 +300,11 @@ def _rewrite_spec_layer_name(self, spec_layer: int, name: str) -> str:
         and rename shared layer weights to be top level.
         """
         spec_layer_weight_names = [
-            "embed_tokens", "enorm", "hnorm", "eh_proj", "shared_head"
+            "embed_tokens",
+            "enorm",
+            "hnorm",
+            "eh_proj",
+            "shared_head",
         ]
         shared_weight_names = ["embed_tokens"]
         spec_layer_weight = False
@@ -303,8 +317,9 @@ def _rewrite_spec_layer_name(self, spec_layer: int, name: str) -> str:
                 break
         if not spec_layer_weight:
             # treat rest weights as weights for transformer layer block
-            name = name.replace(f"model.layers.{spec_layer}.",
-                                f"model.layers.{spec_layer}.mtp_block.")
+            name = name.replace(
+                f"model.layers.{spec_layer}.", f"model.layers.{spec_layer}.mtp_block."
+            )
         elif shared_weight:
             # treat shared weights as top level weights
             name = name.replace(f"model.layers.{spec_layer}.", "model.")
diff --git a/vllm/model_executor/models/glm4v.py b/vllm/model_executor/models/glm4v.py
index bc898105cbcb..a5c3ce0e6bf7 100644
--- a/vllm/model_executor/models/glm4v.py
+++ b/vllm/model_executor/models/glm4v.py
@@ -4,6 +4,7 @@
 # Adapted from
 # https://github.com/zai-org/CogAgent
 """Inference-only CogAgent model compatible with THUDM weights."""
+
 from argparse import Namespace
 from collections.abc import Mapping, Sequence
 from typing import Annotated, Literal, Optional, Union
@@ -22,28 +23,40 @@
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul, get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
 from vllm.multimodal.parse import MultiModalDataItems
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs import ChatGLMConfig
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .chatglm import ChatGLMBaseModel, ChatGLMModel
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
 
 
 class GLMVImagePixelInputs(TensorSchema):
@@ -54,21 +67,22 @@ class GLMVImagePixelInputs(TensorSchema):
         - h: Height of image
         - w: Width of image
     """
+
     type: Literal["pixel_values"] = "pixel_values"
     data: Annotated[torch.Tensor, TensorShape("b", 3, "h", "w")]
 
 
 class EVA2CLIPPatchEmbedding(nn.Module):
-
     def __init__(self, config):
         super().__init__()
-        self.proj = nn.Conv2d(config.in_channels,
-                              config.hidden_size,
-                              kernel_size=config.patch_size,
-                              stride=config.patch_size)
+        self.proj = nn.Conv2d(
+            config.in_channels,
+            config.hidden_size,
+            kernel_size=config.patch_size,
+            stride=config.patch_size,
+        )
         self.cls_embedding = nn.Parameter(torch.zeros(1, config.hidden_size))
-        self.position_embedding = nn.Embedding(config.num_positions,
-                                               config.hidden_size)
+        self.position_embedding = nn.Embedding(config.num_positions, config.hidden_size)
 
     def forward(self, images: torch.Tensor) -> torch.Tensor:
         """
@@ -80,8 +94,7 @@ def forward(self, images: torch.Tensor) -> torch.Tensor:
         torch.Tensor
             Transformed tensor with shape (B, L, D)
         """
-        images = images.to(device=self.proj.weight.device,
-                           dtype=self.proj.weight.dtype)
+        images = images.to(device=self.proj.weight.device, dtype=self.proj.weight.dtype)
         x = self.proj(images)
         x = x.flatten(2).transpose(1, 2)
         cls_token = self.cls_embedding.expand(x.shape[0], -1, -1)
@@ -91,12 +104,11 @@ def forward(self, images: torch.Tensor) -> torch.Tensor:
 
 
 class EVA2CLIPAttention(nn.Module):
-
     def __init__(
         self,
         config,
         quant_config: Optional[QuantizationConfig] = None,
-        prefix: str = '',
+        prefix: str = "",
     ):
         super().__init__()
         self.hidden_size = config.hidden_size
@@ -119,8 +131,9 @@ def __init__(
             prefix=f"{prefix}.dense",
         )
 
-        self.attn = MultiHeadAttention(self.num_heads_per_rank, self.head_dim,
-                                       self.scale)
+        self.attn = MultiHeadAttention(
+            self.num_heads_per_rank, self.head_dim, self.scale
+        )
         self.output_dropout = torch.nn.Dropout(config.dropout_prob)
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -134,12 +147,11 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class EVA2CLIPMLP(nn.Module):
-
     def __init__(
         self,
         config,
         quant_config: Optional[QuantizationConfig] = None,
-        prefix: str = '',
+        prefix: str = "",
     ):
         super().__init__()
         self.config = config
@@ -165,29 +177,27 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class EVA2CLIPTransformerLayer(nn.Module):
-
     def __init__(
         self,
         config,
         quant_config: Optional[QuantizationConfig] = None,
-        prefix: str = '',
+        prefix: str = "",
     ):
         super().__init__()
-        self.input_layernorm = LayerNorm(config.hidden_size,
-                                         eps=config.layer_norm_eps)
-        self.attention = EVA2CLIPAttention(config,
-                                           quant_config=quant_config,
-                                           prefix=f"{prefix}.attention")
-        self.mlp = EVA2CLIPMLP(config,
-                               quant_config=quant_config,
-                               prefix=f"{prefix}.mlp")
-        self.post_attention_layernorm = LayerNorm(config.hidden_size,
-                                                  eps=config.layer_norm_eps)
+        self.input_layernorm = LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
+        self.attention = EVA2CLIPAttention(
+            config, quant_config=quant_config, prefix=f"{prefix}.attention"
+        )
+        self.mlp = EVA2CLIPMLP(
+            config, quant_config=quant_config, prefix=f"{prefix}.mlp"
+        )
+        self.post_attention_layernorm = LayerNorm(
+            config.hidden_size, eps=config.layer_norm_eps
+        )
 
     def forward(self, hidden_states):
         attention_input = hidden_states
-        attention_output = self.input_layernorm(
-            self.attention(attention_input))
+        attention_output = self.input_layernorm(self.attention(attention_input))
         hidden_states = attention_input + attention_output
         mlp_input = hidden_states
         mlp_output = self.post_attention_layernorm(self.mlp(mlp_input))
@@ -196,20 +206,23 @@ def forward(self, hidden_states):
 
 
 class EVA2CLIPTransformer(nn.Module):
-
     def __init__(
         self,
         config,
         quant_config: Optional[QuantizationConfig] = None,
-        prefix: str = '',
+        prefix: str = "",
     ):
         super().__init__()
-        self.layers = nn.ModuleList([
-            EVA2CLIPTransformerLayer(config,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.layers.{layer_idx}")
-            for layer_idx in range(config.num_hidden_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                EVA2CLIPTransformerLayer(
+                    config,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.layers.{layer_idx}",
+                )
+                for layer_idx in range(config.num_hidden_layers)
+            ]
+        )
 
     def forward(self, hidden_states):
         for layer_module in self.layers:
@@ -218,13 +231,12 @@ def forward(self, hidden_states):
 
 
 class EVA2CLIPGLU(nn.Module):
-
     def __init__(
         self,
         config,
         in_features,
         quant_config: Optional[QuantizationConfig] = None,
-        prefix: str = '',
+        prefix: str = "",
     ):
         """
         The original implementation is the same as:
@@ -233,14 +245,14 @@ def __init__(
             config.hidden_size,
             config.ffn_hidden_size,
             bias=False,
-            quant_config=quant_config
+            quant_config=quant_config,
         )
 
         self.gate_proj = ColumnParallelLinear(
             config.hidden_size,
             config.ffn_hidden_size,
             bias=False,
-            quant_config=quant_config
+            quant_config=quant_config,
         )
         ```
         ```
@@ -255,7 +267,7 @@ def __init__(
             config.hidden_size,
             [config.ffn_hidden_size] * 2,
             bias=False,
-            quant_config=quant_config
+            quant_config=quant_config,
         )
         ```
         ```
@@ -263,27 +275,32 @@ def __init__(
         ```
         """
         super().__init__()
-        self.linear_proj = ReplicatedLinear(in_features,
-                                            config.hidden_size,
-                                            bias=False,
-                                            quant_config=quant_config,
-                                            prefix=f"{prefix}.linear_proj")
+        self.linear_proj = ReplicatedLinear(
+            in_features,
+            config.hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.linear_proj",
+        )
         self.norm1 = nn.LayerNorm(config.hidden_size)
         self.act1 = nn.GELU()
         self.act2 = SiluAndMul()
 
         self.merged_proj = MergedColumnParallelLinear(
-            config.hidden_size, [config.ffn_hidden_size] * 2,
+            config.hidden_size,
+            [config.ffn_hidden_size] * 2,
             bias=False,
             quant_config=quant_config,
-            prefix=f"{prefix}.merged_proj")
+            prefix=f"{prefix}.merged_proj",
+        )
 
         self.dense_4h_to_h = RowParallelLinear(
             config.ffn_hidden_size,
             config.hidden_size,
             bias=False,
             quant_config=quant_config,
-            prefix=f"{prefix}.dense_4h_to_h")
+            prefix=f"{prefix}.dense_4h_to_h",
+        )
 
     def forward(self, x):
         x, _ = self.linear_proj(x)
@@ -295,27 +312,30 @@ def forward(self, x):
 
 
 class EVA2CLIPModel(nn.Module):
-
     def __init__(
         self,
         config,
         quant_config: Optional[QuantizationConfig] = None,
-        prefix: str = '',
+        prefix: str = "",
     ):
         super().__init__()
         vision_config = Namespace(**config.vision_config)
         self.patch_embedding = EVA2CLIPPatchEmbedding(vision_config)
-        self.transformer = EVA2CLIPTransformer(vision_config,
-                                               quant_config=quant_config,
-                                               prefix=f"{prefix}.transformer")
-        self.linear_proj = EVA2CLIPGLU(config,
-                                       in_features=config.hidden_size,
-                                       quant_config=quant_config,
-                                       prefix=f"{prefix}.linear_proj")
-        self.conv = nn.Conv2d(in_channels=vision_config.hidden_size,
-                              out_channels=config.hidden_size,
-                              kernel_size=2,
-                              stride=2)
+        self.transformer = EVA2CLIPTransformer(
+            vision_config, quant_config=quant_config, prefix=f"{prefix}.transformer"
+        )
+        self.linear_proj = EVA2CLIPGLU(
+            config,
+            in_features=config.hidden_size,
+            quant_config=quant_config,
+            prefix=f"{prefix}.linear_proj",
+        )
+        self.conv = nn.Conv2d(
+            in_channels=vision_config.hidden_size,
+            out_channels=config.hidden_size,
+            kernel_size=2,
+            stride=2,
+        )
         self.boi = nn.Parameter(torch.zeros(1, 1, config.hidden_size))
         self.eoi = nn.Parameter(torch.zeros(1, 1, config.hidden_size))
         self.scaling_factor = vision_config.scaling_factor
@@ -349,15 +369,14 @@ def forward(self, images: torch.Tensor) -> torch.Tensor:
 
 
 class GLM4VModel(ChatGLMModel):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(vllm_config=vllm_config, prefix=prefix)
 
         quant_config = vllm_config.quant_config
 
-        self.vision = EVA2CLIPModel(self.config,
-                                    quant_config,
-                                    prefix=f"{prefix}.vision")
+        self.vision = EVA2CLIPModel(
+            self.config, quant_config, prefix=f"{prefix}.vision"
+        )
 
 
 class GLM4VProcessor:
@@ -379,17 +398,19 @@ def __init__(
         vision_config = config.vision_config
         image_size = vision_config["image_size"]
 
-        self.image_transform = transforms.Compose([
-            transforms.Resize(
-                (image_size, image_size),
-                interpolation=InterpolationMode.BICUBIC,
-            ),
-            transforms.ToTensor(),
-            transforms.Normalize(
-                mean=(0.48145466, 0.4578275, 0.40821073),
-                std=(0.26862954, 0.26130258, 0.27577711),
-            ),
-        ])
+        self.image_transform = transforms.Compose(
+            [
+                transforms.Resize(
+                    (image_size, image_size),
+                    interpolation=InterpolationMode.BICUBIC,
+                ),
+                transforms.ToTensor(),
+                transforms.Normalize(
+                    mean=(0.48145466, 0.4578275, 0.40821073),
+                    std=(0.26862954, 0.26130258, 0.27577711),
+                ),
+            ]
+        )
 
     def __call__(
         self,
@@ -424,7 +445,6 @@ def __call__(
 
 
 class GLM4VProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(ChatGLMConfig)
 
@@ -454,7 +474,6 @@ def get_num_image_feature_tokens(self) -> int:
 
 
 class GLM4VDummyInputsBuilder(BaseDummyInputsBuilder[GLM4VProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -477,16 +496,16 @@ def get_dummy_mm_data(
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class GLM4VMultiModalProcessor(BaseMultiModalProcessor[GLM4VProcessingInfo]):
-
     def _hf_processor_applies_updates(
         self,
         prompt_text: str,
@@ -530,17 +549,18 @@ def get_replacement(item_idx: int):
         ]
 
 
-@MULTIMODAL_REGISTRY.register_processor(GLM4VMultiModalProcessor,
-                                        info=GLM4VProcessingInfo,
-                                        dummy_inputs=GLM4VDummyInputsBuilder)
-class GLM4VForCausalLM(ChatGLMBaseModel, SupportsMultiModal, SupportsLoRA,
-                       SupportsPP):
+@MULTIMODAL_REGISTRY.register_processor(
+    GLM4VMultiModalProcessor,
+    info=GLM4VProcessingInfo,
+    dummy_inputs=GLM4VDummyInputsBuilder,
+)
+class GLM4VForCausalLM(ChatGLMBaseModel, SupportsMultiModal, SupportsLoRA, SupportsPP):
     merge_by_field_config = True
 
     packed_modules_mapping = {
         "query_key_value": ["query_key_value"],
         "dense_h_to_4h": ["dense_h_to_4h"],
-        "merged_proj": ["gate_proj", "dense_h_to_4h"]
+        "merged_proj": ["gate_proj", "dense_h_to_4h"],
     }
 
     def get_mm_mapping(self) -> MultiModelKeys:
@@ -550,7 +570,8 @@ def get_mm_mapping(self) -> MultiModelKeys:
         return MultiModelKeys.from_string_field(
             language_model="transformer.encoder",
             connector="transformer.vision.linear_proj",
-            tower_model="transformer.vision.transformer")
+            tower_model="transformer.vision.transformer",
+        )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -575,22 +596,21 @@ def __init__(
         self.transformer: GLM4VModel
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[GLMVImagePixelInputs]:
+        self, **kwargs: object
+    ) -> Optional[GLMVImagePixelInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
 
         if pixel_values is not None:
             expected_h = expected_w = self.config.vision_config["image_size"]
-            return GLMVImagePixelInputs(type="pixel_values",
-                                        data=pixel_values,
-                                        resolve_bindings={
-                                            "h": expected_h,
-                                            "w": expected_w
-                                        })
+            return GLMVImagePixelInputs(
+                type="pixel_values",
+                data=pixel_values,
+                resolve_bindings={"h": expected_h, "w": expected_w},
+            )
 
         return None
 
-    def _process_image_input(
-            self, image_input: GLMVImagePixelInputs) -> torch.Tensor:
+    def _process_image_input(self, image_input: GLMVImagePixelInputs) -> torch.Tensor:
         pixel_values = image_input["data"].to(dtype=self.config.torch_dtype)
 
         return self.transformer.vision(pixel_values)
@@ -600,8 +620,7 @@ def get_language_model(self) -> torch.nn.Module:
 
     get_input_embeddings = SupportsMultiModal.get_input_embeddings
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -620,7 +639,8 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.transformer(input_ids, positions,
-                                         intermediate_tensors, inputs_embeds)
+        hidden_states = self.transformer(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
 
         return hidden_states
diff --git a/vllm/model_executor/models/gpt2.py b/vllm/model_executor/models/gpt2.py
index 24274db148bd..53d6026c5938 100644
--- a/vllm/model_executor/models/gpt2.py
+++ b/vllm/model_executor/models/gpt2.py
@@ -19,6 +19,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only GPT-2 model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -31,27 +32,36 @@
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed.parallel_state import (
-    get_pp_group, get_tensor_model_parallel_world_size)
+    get_pp_group,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from ..layers.pooler import DispatchPooler, Pooler
 from .interfaces import SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class GPT2Attention(nn.Module):
-
     def __init__(
         self,
         config: GPT2Config,
@@ -62,8 +72,7 @@ def __init__(
         super().__init__()
         self.hidden_size = config.hidden_size
         total_num_heads = config.num_attention_heads
-        tensor_model_parallel_world_size = (
-            get_tensor_model_parallel_world_size())
+        tensor_model_parallel_world_size = get_tensor_model_parallel_world_size()
         assert total_num_heads % tensor_model_parallel_world_size == 0
         self.num_heads = total_num_heads // tensor_model_parallel_world_size
         self.head_dim = self.hidden_size // total_num_heads
@@ -84,12 +93,14 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.c_proj",
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              scale=self.scale,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            scale=self.scale,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -103,7 +114,6 @@ def forward(
 
 
 class GPT2MLP(nn.Module):
-
     def __init__(
         self,
         intermediate_size: int,
@@ -137,7 +147,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class GPT2Block(nn.Module):
-
     def __init__(
         self,
         config: GPT2Config,
@@ -147,19 +156,14 @@ def __init__(
     ):
         super().__init__()
         hidden_size = config.hidden_size
-        inner_dim = (config.n_inner if config.n_inner is not None else 4 *
-                     hidden_size)
+        inner_dim = config.n_inner if config.n_inner is not None else 4 * hidden_size
 
         self.ln_1 = nn.LayerNorm(hidden_size, eps=config.layer_norm_epsilon)
-        self.attn = GPT2Attention(config,
-                                  cache_config,
-                                  quant_config,
-                                  prefix=f"{prefix}.attn")
+        self.attn = GPT2Attention(
+            config, cache_config, quant_config, prefix=f"{prefix}.attn"
+        )
         self.ln_2 = nn.LayerNorm(hidden_size, eps=config.layer_norm_epsilon)
-        self.mlp = GPT2MLP(inner_dim,
-                           config,
-                           quant_config,
-                           prefix=f"{prefix}.mlp")
+        self.mlp = GPT2MLP(inner_dim, config, quant_config, prefix=f"{prefix}.mlp")
 
     def forward(
         self,
@@ -181,7 +185,6 @@ def forward(
 
 @support_torch_compile
 class GPT2Model(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -194,20 +197,22 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         assert not config.scale_attn_by_inverse_layer_idx
         assert not config.reorder_and_upcast_attn
         self.embed_dim = config.hidden_size
-        self.wte = VocabParallelEmbedding(config.vocab_size,
-                                          self.embed_dim,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.wte")
+        self.wte = VocabParallelEmbedding(
+            config.vocab_size,
+            self.embed_dim,
+            quant_config=quant_config,
+            prefix=f"{prefix}.wte",
+        )
         self.wpe = nn.Embedding(config.max_position_embeddings, self.embed_dim)
         self.start_layer, self.end_layer, self.h = make_layers(
             config.num_hidden_layers,
-            lambda prefix: GPT2Block(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.h")
+            lambda prefix: GPT2Block(config, cache_config, quant_config, prefix=prefix),
+            prefix=f"{prefix}.h",
+        )
         self.ln_f = nn.LayerNorm(self.embed_dim, eps=config.layer_norm_epsilon)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.n_embd))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.n_embd
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
@@ -237,8 +242,7 @@ def forward(
         hidden_states = self.ln_f(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters(remove_duplicate=False))
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
@@ -260,34 +264,35 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if not name.endswith(".weight"):
                     continue
                 loaded_weight = loaded_weight.t()
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class GPT2LMHeadModel(nn.Module, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.transformer = GPT2Model(vllm_config=vllm_config,
-                                     prefix=maybe_prefix(
-                                         prefix, "transformer"))
-        self.lm_head = ParallelLMHead(self.config.vocab_size,
-                                      self.config.hidden_size,
-                                      quant_config=quant_config,
-                                      prefix=f"{prefix}.lm_head")
+        self.transformer = GPT2Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "transformer")
+        )
+        self.lm_head = ParallelLMHead(
+            self.config.vocab_size,
+            self.config.hidden_size,
+            quant_config=quant_config,
+            prefix=f"{prefix}.lm_head",
+        )
         if self.config.tie_word_embeddings:
             self.lm_head = self.lm_head.tie_weights(self.transformer.wte)
 
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.transformer.make_empty_intermediate_tensors)
+            self.transformer.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.transformer.get_input_embeddings(input_ids)
@@ -299,8 +304,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.transformer(input_ids, positions,
-                                         intermediate_tensors, inputs_embeds)
+        hidden_states = self.transformer(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -310,8 +316,7 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         weights = _add_transformer_prefix(weights)
         return loader.load_weights(weights)
@@ -334,22 +339,25 @@ class GPT2ForSequenceClassification(nn.Module):
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
-        self.transformer = GPT2Model(vllm_config=vllm_config,
-                                     prefix=maybe_prefix(prefix, "gpt2"))
-        self.score = nn.Linear(config.n_embd,
-                               config.num_labels,
-                               bias=False,
-                               dtype=vllm_config.model_config.head_dtype)
+        self.transformer = GPT2Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "gpt2")
+        )
+        self.score = nn.Linear(
+            config.n_embd,
+            config.num_labels,
+            bias=False,
+            dtype=vllm_config.model_config.head_dtype,
+        )
 
         pooler_config = vllm_config.model_config.pooler_config
         assert pooler_config is not None
 
-        self.pooler = DispatchPooler({
-            "encode":
-            Pooler.for_encode(pooler_config),
-            "classify":
-            Pooler.for_classify(pooler_config, classifier=self.score),
-        })
+        self.pooler = DispatchPooler(
+            {
+                "encode": Pooler.for_encode(pooler_config),
+                "classify": Pooler.for_classify(pooler_config, classifier=self.score),
+            }
+        )
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         loader = AutoWeightsLoader(self)
@@ -366,15 +374,15 @@ def forward(
             input_ids=input_ids,
             position_ids=positions,
             inputs_embeds=inputs_embeds,
-            intermediate_tensors=intermediate_tensors)
+            intermediate_tensors=intermediate_tensors,
+        )
         return hidden_states
 
 
 def _add_transformer_prefix(
-    weights: Iterable[tuple[str, torch.Tensor]]
+    weights: Iterable[tuple[str, torch.Tensor]],
 ) -> Iterable[tuple[str, torch.Tensor]]:
     for name, tensor in weights:
-        if not name.startswith('transformer.') and not name.startswith(
-                "lm_head"):
-            name = 'transformer.' + name
+        if not name.startswith("transformer.") and not name.startswith("lm_head"):
+            name = "transformer." + name
         yield name, tensor
diff --git a/vllm/model_executor/models/gpt_bigcode.py b/vllm/model_executor/models/gpt_bigcode.py
index 162018450e7c..b6d3d8f3f2e6 100644
--- a/vllm/model_executor/models/gpt_bigcode.py
+++ b/vllm/model_executor/models/gpt_bigcode.py
@@ -20,6 +20,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only GPTBigCode model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -33,24 +34,31 @@
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class GPTBigCodeAttention(nn.Module):
-
     def __init__(
         self,
         config: GPTBigCodeConfig,
@@ -61,11 +69,9 @@ def __init__(
         super().__init__()
         self.hidden_size = config.hidden_size
         total_num_heads = config.num_attention_heads
-        self.tensor_model_parallel_world_size = (
-            get_tensor_model_parallel_world_size())
+        self.tensor_model_parallel_world_size = get_tensor_model_parallel_world_size()
         assert total_num_heads % self.tensor_model_parallel_world_size == 0
-        self.num_heads = (total_num_heads //
-                          self.tensor_model_parallel_world_size)
+        self.num_heads = total_num_heads // self.tensor_model_parallel_world_size
         self.head_dim = self.hidden_size // total_num_heads
         self.scale = self.head_dim**-0.5
 
@@ -94,13 +100,15 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.c_proj",
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              scale=self.scale,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            scale=self.scale,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -110,7 +118,8 @@ def forward(
         q, k, v = qkv.split(
             [
                 self.hidden_size // self.tensor_model_parallel_world_size,
-                self.kv_dim, self.kv_dim
+                self.kv_dim,
+                self.kv_dim,
             ],
             dim=-1,
         )
@@ -120,7 +129,6 @@ def forward(
 
 
 class GPTBigMLP(nn.Module):
-
     def __init__(
         self,
         intermediate_size: int,
@@ -154,7 +162,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class GPTBigCodeBlock(nn.Module):
-
     def __init__(
         self,
         config: GPTBigCodeConfig,
@@ -164,19 +171,14 @@ def __init__(
     ):
         super().__init__()
         hidden_size = config.hidden_size
-        inner_dim = (config.n_inner if config.n_inner is not None else 4 *
-                     hidden_size)
+        inner_dim = config.n_inner if config.n_inner is not None else 4 * hidden_size
 
         self.ln_1 = nn.LayerNorm(hidden_size, eps=config.layer_norm_epsilon)
-        self.attn = GPTBigCodeAttention(config,
-                                        cache_config,
-                                        quant_config,
-                                        prefix=f"{prefix}.attn")
+        self.attn = GPTBigCodeAttention(
+            config, cache_config, quant_config, prefix=f"{prefix}.attn"
+        )
         self.ln_2 = nn.LayerNorm(hidden_size, eps=config.layer_norm_epsilon)
-        self.mlp = GPTBigMLP(inner_dim,
-                             config,
-                             quant_config,
-                             prefix=f"{prefix}.mlp")
+        self.mlp = GPTBigMLP(inner_dim, config, quant_config, prefix=f"{prefix}.mlp")
 
     def forward(
         self,
@@ -184,7 +186,9 @@ def forward(
     ) -> torch.Tensor:
         residual = hidden_states
         hidden_states = self.ln_1(hidden_states)
-        attn_output = self.attn(hidden_states=hidden_states, )
+        attn_output = self.attn(
+            hidden_states=hidden_states,
+        )
         # residual connection
         hidden_states = attn_output + residual
 
@@ -198,7 +202,6 @@ def forward(
 
 @support_torch_compile
 class GPTBigCodeModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -211,23 +214,27 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         assert not config.add_cross_attention
 
         self.embed_dim = config.hidden_size
-        lora_vocab = (lora_config.lora_extra_vocab_size *
-                      (lora_config.max_loras or 1)) if lora_config else 0
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
-        self.wte = VocabParallelEmbedding(self.vocab_size,
-                                          self.embed_dim,
-                                          org_num_embeddings=config.vocab_size)
+        self.wte = VocabParallelEmbedding(
+            self.vocab_size, self.embed_dim, org_num_embeddings=config.vocab_size
+        )
         self.wpe = nn.Embedding(config.max_position_embeddings, self.embed_dim)
         self.start_layer, self.end_layer, self.h = make_layers(
             config.num_hidden_layers,
             lambda prefix: GPTBigCodeBlock(
-                config, cache_config, quant_config, prefix=prefix),
+                config, cache_config, quant_config, prefix=prefix
+            ),
             prefix=f"{prefix}.h",
         )
         self.ln_f = nn.LayerNorm(self.embed_dim, eps=config.layer_norm_epsilon)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.n_embd))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.n_embd
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
@@ -254,8 +261,7 @@ def forward(
         hidden_states = self.ln_f(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters(remove_duplicate=False))
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
@@ -266,13 +272,12 @@ def load_weights(self, weights: Iterable[tuple[str,
             if is_pp_missing_parameter(name, self):
                 continue
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             # TODO (@robertgshaw2-neuralmagic): move to fp8 linear method
             if "c_attn.input_scale" in name:
-                weight_loader(param, loaded_weight, 'q')
-                weight_loader(param, loaded_weight, 'k')
-                weight_loader(param, loaded_weight, 'v')
+                weight_loader(param, loaded_weight, "q")
+                weight_loader(param, loaded_weight, "k")
+                weight_loader(param, loaded_weight, "v")
             else:
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
@@ -292,9 +297,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.lora_config = lora_config
 
         self.quant_config = quant_config
-        self.transformer = GPTBigCodeModel(vllm_config=vllm_config,
-                                           prefix=maybe_prefix(
-                                               prefix, "transformer"))
+        self.transformer = GPTBigCodeModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "transformer")
+        )
         if self.config.tie_word_embeddings:
             self.lm_head = self.transformer.wte
         else:
@@ -302,14 +307,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 self.transformer.vocab_size,
                 self.transformer.embed_dim,
                 org_num_embeddings=self.config.vocab_size,
-                prefix=maybe_prefix(prefix, "lm_head"))
+                prefix=maybe_prefix(prefix, "lm_head"),
+            )
         self.unpadded_vocab_size = config.vocab_size
         if lora_config:
             self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size
+        )
         self.make_empty_intermediate_tensors = (
-            self.transformer.make_empty_intermediate_tensors)
+            self.transformer.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.transformer.get_input_embeddings(input_ids)
@@ -321,8 +329,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.transformer(input_ids, positions,
-                                         intermediate_tensors, inputs_embeds)
+        hidden_states = self.transformer(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -332,8 +341,7 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         skip_prefixes = None
         if self.config.tie_word_embeddings:
             skip_prefixes = ["lm_head."]
diff --git a/vllm/model_executor/models/gpt_j.py b/vllm/model_executor/models/gpt_j.py
index 698387fab946..5428512dec19 100644
--- a/vllm/model_executor/models/gpt_j.py
+++ b/vllm/model_executor/models/gpt_j.py
@@ -18,6 +18,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only GPT-J model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -31,26 +32,35 @@
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class GPTJAttention(nn.Module):
-
     def __init__(
         self,
         config: GPTJConfig,
@@ -85,8 +95,7 @@ def __init__(
         assert getattr(config, "rotary", True)
         assert config.rotary_dim % 2 == 0
         rope_theta = getattr(config, "rope_theta", 10000)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         self.rotary_emb = get_rope(
             self.head_size,
             rotary_dim=config.rotary_dim,
@@ -94,12 +103,14 @@ def __init__(
             base=rope_theta,
             is_neox_style=False,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_size,
-                              scaling,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_size,
+            scaling,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -115,7 +126,6 @@ def forward(
 
 
 class GPTJMLP(nn.Module):
-
     def __init__(
         self,
         intermediate_size: int,
@@ -144,7 +154,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class GPTJBlock(nn.Module):
-
     def __init__(
         self,
         config: GPTJConfig,
@@ -153,13 +162,11 @@ def __init__(
         prefix: str = "",
     ):
         super().__init__()
-        inner_dim = (4 * config.n_embd
-                     if config.n_inner is None else config.n_inner)
+        inner_dim = 4 * config.n_embd if config.n_inner is None else config.n_inner
         self.ln_1 = nn.LayerNorm(config.n_embd, eps=config.layer_norm_epsilon)
-        self.attn = GPTJAttention(config,
-                                  cache_config,
-                                  quant_config,
-                                  prefix=f"{prefix}.attn")
+        self.attn = GPTJAttention(
+            config, cache_config, quant_config, prefix=f"{prefix}.attn"
+        )
         self.mlp = GPTJMLP(inner_dim, config, quant_config)
 
     def forward(
@@ -180,7 +187,6 @@ def forward(
 
 @support_torch_compile
 class GPTJModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -197,14 +203,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
         self.start_layer, self.end_layer, self.h = make_layers(
             config.n_layer,
-            lambda prefix: GPTJBlock(
-                config, cache_config, quant_config, prefix=prefix),
+            lambda prefix: GPTJBlock(config, cache_config, quant_config, prefix=prefix),
             prefix=f"{prefix}.h",
         )
         self.ln_f = nn.LayerNorm(self.embed_dim, eps=config.layer_norm_epsilon)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.n_embd))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.n_embd
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
@@ -230,8 +235,7 @@ def forward(
         hidden_states = self.ln_f(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -246,19 +250,20 @@ def load_weights(self, weights: Iterable[tuple[str,
             if "attn.bias" in name or "attn.masked_bias" in name:
                 continue
 
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -281,15 +286,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class GPTJForCausalLM(nn.Module, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
@@ -297,9 +300,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.config = config
         self.quant_config = quant_config
         assert not config.tie_word_embeddings
-        self.transformer = GPTJModel(vllm_config=vllm_config,
-                                     prefix=maybe_prefix(
-                                         prefix, "transformer"))
+        self.transformer = GPTJModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "transformer")
+        )
         self.lm_head = ParallelLMHead(
             config.vocab_size,
             config.n_embd,
@@ -309,7 +312,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.transformer.make_empty_intermediate_tensors)
+            self.transformer.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.transformer.get_input_embeddings(input_ids)
@@ -321,19 +325,18 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.transformer(input_ids, positions,
-                                         intermediate_tensors, inputs_embeds)
+        hidden_states = self.transformer(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
         self,
         hidden_states: torch.Tensor,
     ) -> Optional[torch.Tensor]:
-        logits = self.logits_processor(self.lm_head, hidden_states,
-                                       self.lm_head.bias)
+        logits = self.logits_processor(self.lm_head, hidden_states, self.lm_head.bias)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/gpt_neox.py b/vllm/model_executor/models/gpt_neox.py
index 45519a94d854..8278ae03d88a 100644
--- a/vllm/model_executor/models/gpt_neox.py
+++ b/vllm/model_executor/models/gpt_neox.py
@@ -18,6 +18,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only GPT-NeoX model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -31,25 +32,32 @@
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class GPTNeoXAttention(nn.Module):
-
     def __init__(
         self,
         config: GPTNeoXConfig,
@@ -63,11 +71,9 @@ def __init__(
         self.head_size = self.hidden_size // self.total_num_heads
         self.bias = getattr(config, "attention_bias", True)
 
-        tensor_model_parallel_world_size = (
-            get_tensor_model_parallel_world_size())
+        tensor_model_parallel_world_size = get_tensor_model_parallel_world_size()
         assert self.total_num_heads % tensor_model_parallel_world_size == 0
-        self.num_heads = (self.total_num_heads //
-                          tensor_model_parallel_world_size)
+        self.num_heads = self.total_num_heads // tensor_model_parallel_world_size
 
         self.query_key_value = QKVParallelLinear(
             config.hidden_size,
@@ -86,20 +92,21 @@ def __init__(
         rotary_dim = int(self.head_size * config.rotary_pct)
         assert rotary_dim % 2 == 0
         rope_theta = getattr(config, "rope_theta", 10000)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         self.rotary_emb = get_rope(
             self.head_size,
             rotary_dim=rotary_dim,
             max_position=max_position_embeddings,
             base=rope_theta,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_size,
-                              scaling,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_size,
+            scaling,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -115,7 +122,6 @@ def forward(
 
 
 class GPTNeoXMLP(nn.Module):
-
     def __init__(
         self,
         config: GPTNeoXConfig,
@@ -142,7 +148,6 @@ def forward(self, hidden_states):
 
 
 class GPTNeoXLayer(nn.Module):
-
     def __init__(
         self,
         config: GPTNeoXConfig,
@@ -152,14 +157,15 @@ def __init__(
     ):
         super().__init__()
         self.use_parallel_residual = config.use_parallel_residual
-        self.input_layernorm = nn.LayerNorm(config.hidden_size,
-                                            eps=config.layer_norm_eps)
-        self.post_attention_layernorm = nn.LayerNorm(config.hidden_size,
-                                                     eps=config.layer_norm_eps)
-        self.attention = GPTNeoXAttention(config,
-                                          cache_config,
-                                          quant_config,
-                                          prefix=f"{prefix}.attention")
+        self.input_layernorm = nn.LayerNorm(
+            config.hidden_size, eps=config.layer_norm_eps
+        )
+        self.post_attention_layernorm = nn.LayerNorm(
+            config.hidden_size, eps=config.layer_norm_eps
+        )
+        self.attention = GPTNeoXAttention(
+            config, cache_config, quant_config, prefix=f"{prefix}.attention"
+        )
         self.mlp = GPTNeoXMLP(config, quant_config)
 
     def forward(
@@ -192,7 +198,6 @@ def forward(
 
 @support_torch_compile
 class GPTNeoXModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -209,14 +214,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: GPTNeoXLayer(
-                config, cache_config, quant_config, prefix=prefix),
+                config, cache_config, quant_config, prefix=prefix
+            ),
             prefix=f"{prefix}.layers",
         )
-        self.final_layer_norm = nn.LayerNorm(config.hidden_size,
-                                             eps=config.layer_norm_eps)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.hidden_size))
+        self.final_layer_norm = nn.LayerNorm(
+            config.hidden_size, eps=config.layer_norm_eps
+        )
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_in(input_ids)
@@ -242,16 +249,17 @@ def forward(
         hidden_states = self.final_layer_norm(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            if ("attention.bias" in name or "attention.masked_bias" in name
-                    or "rotary_emb.inv_freq" in name):
+            if (
+                "attention.bias" in name
+                or "attention.masked_bias" in name
+                or "rotary_emb.inv_freq" in name
+            ):
                 continue
-            if ("rotary_emb.cos_cached" in name
-                    or "rotary_emb.sin_cached" in name):
+            if "rotary_emb.cos_cached" in name or "rotary_emb.sin_cached" in name:
                 # Models trained using OpenRLHF may include
                 # these tensors in the checkpoint. Skip them.
                 continue
@@ -269,29 +277,29 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if output_dim is not None:
                     loaded_weight_shape = loaded_weight.shape
                     loaded_weight = loaded_weight.view(
-                        loaded_weight_shape[:output_dim] + (num_heads, 3, -1) +
-                        loaded_weight_shape[output_dim + 1:])
-                    loaded_weight = loaded_weight.transpose(
-                        output_dim, output_dim + 1)
+                        loaded_weight_shape[:output_dim]
+                        + (num_heads, 3, -1)
+                        + loaded_weight_shape[output_dim + 1 :]
+                    )
+                    loaded_weight = loaded_weight.transpose(output_dim, output_dim + 1)
                     loaded_weight = loaded_weight.reshape(loaded_weight_shape)
 
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class GPTNeoXForCausalLM(nn.Module, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.gpt_neox = GPTNeoXModel(vllm_config=vllm_config,
-                                     prefix=maybe_prefix(prefix, "gpt_neox"))
+        self.gpt_neox = GPTNeoXModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "gpt_neox")
+        )
         self.embed_out = ParallelLMHead(
             config.vocab_size,
             config.hidden_size,
@@ -302,7 +310,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.embed_out.weight = self.gpt_neox.embed_in.weight
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.gpt_neox.make_empty_intermediate_tensors)
+            self.gpt_neox.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.gpt_neox.get_input_embeddings(input_ids)
@@ -314,8 +323,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.gpt_neox(input_ids, positions,
-                                      intermediate_tensors, inputs_embeds)
+        hidden_states = self.gpt_neox(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -325,7 +335,6 @@ def compute_logits(
         logits = self.logits_processor(self.embed_out, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/gpt_oss.py b/vllm/model_executor/models/gpt_oss.py
index 47ba5084d608..17f911435079 100644
--- a/vllm/model_executor/models/gpt_oss.py
+++ b/vllm/model_executor/models/gpt_oss.py
@@ -11,33 +11,41 @@
 from vllm.attention import Attention, AttentionType
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (get_ep_group, get_pp_group,
-                              get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_gather)
+from vllm.distributed import (
+    get_ep_group,
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_gather,
+)
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import QKVParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.utils import sequence_parallel_chunk
 from vllm.sequence import IntermediateTensors
 from vllm.utils import cdiv
 
 from .interfaces import SupportsEagle3, SupportsPP
-from .utils import (AutoWeightsLoader, WeightsMapper, extract_layer_index,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class OAIAttention(nn.Module):
-
     def __init__(
         self,
         config: GptOssConfig,
@@ -59,16 +67,13 @@ def __init__(
             base=config.rope_theta,
             dtype=torch.float32,
             rope_scaling={
-                "rope_type":
-                "yarn",
-                "factor":
-                config.rope_scaling["factor"],
-                "original_max_position_embeddings":
-                config.rope_scaling["original_max_position_embeddings"],
-                "beta_fast":
-                config.rope_scaling["beta_fast"],
-                "beta_slow":
-                config.rope_scaling["beta_slow"],
+                "rope_type": "yarn",
+                "factor": config.rope_scaling["factor"],
+                "original_max_position_embeddings": config.rope_scaling[
+                    "original_max_position_embeddings"
+                ],
+                "beta_fast": config.rope_scaling["beta_fast"],
+                "beta_slow": config.rope_scaling["beta_slow"],
             },
             is_neox_style=True,
         )
@@ -76,8 +81,8 @@ def __init__(
         tp_size = get_tensor_model_parallel_world_size()
 
         self.sinks = torch.nn.Parameter(
-            torch.empty(config.num_attention_heads // tp_size,
-                        requires_grad=False))
+            torch.empty(config.num_attention_heads // tp_size, requires_grad=False)
+        )
 
         self.q_size = self.num_attention_heads * self.head_dim // tp_size
         self.kv_size = self.num_key_value_heads * self.head_dim // tp_size
@@ -104,8 +109,7 @@ def __init__(
         self.num_local_key_value_heads = config.num_key_value_heads // tp_size
 
         # Only apply sliding window to every other layer
-        sliding_window = (config.sliding_window if self.layer_idx %
-                          2 == 0 else None)
+        sliding_window = config.sliding_window if self.layer_idx % 2 == 0 else None
         self.attn = Attention(
             self.num_local_attention_heads,
             self.head_dim,
@@ -119,8 +123,9 @@ def __init__(
             sinks=self.sinks,
         )
 
-    def forward(self, hidden_states: torch.Tensor,
-                positions: torch.Tensor) -> torch.Tensor:
+    def forward(
+        self, hidden_states: torch.Tensor, positions: torch.Tensor
+    ) -> torch.Tensor:
         qkv, _ = self.qkv(hidden_states)
         q, k, v = qkv.split([self.q_size, self.kv_size, self.kv_size], dim=-1)
         q, k = self.rotary_emb(positions, q, k)
@@ -131,7 +136,6 @@ def forward(self, hidden_states: torch.Tensor,
 
 
 class MLPBlock(torch.nn.Module):
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -150,21 +154,22 @@ def __init__(
         self.num_experts = config.num_local_experts
         self.experts_per_token = config.num_experts_per_tok
         self.world_size = dist.get_world_size() if dist.is_initialized() else 1
-        self.router = torch.nn.Linear(config.hidden_size,
-                                      config.num_local_experts)
+        self.router = torch.nn.Linear(config.hidden_size, config.num_local_experts)
         assert config.intermediate_size % self.world_size == 0
-        self.experts = FusedMoE(num_experts=config.num_local_experts,
-                                top_k=config.num_experts_per_tok,
-                                hidden_size=config.hidden_size,
-                                intermediate_size=config.intermediate_size,
-                                reduce_results=True,
-                                renormalize=True,
-                                quant_config=quant_config,
-                                prefix=f"{prefix}.experts",
-                                apply_router_weight_on_input=False,
-                                has_bias=True,
-                                activation="swigluoai",
-                                is_sequence_parallel=self.is_sequence_parallel)
+        self.experts = FusedMoE(
+            num_experts=config.num_local_experts,
+            top_k=config.num_experts_per_tok,
+            hidden_size=config.hidden_size,
+            intermediate_size=config.intermediate_size,
+            reduce_results=True,
+            renormalize=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.experts",
+            apply_router_weight_on_input=False,
+            has_bias=True,
+            activation="swigluoai",
+            is_sequence_parallel=self.is_sequence_parallel,
+        )
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         num_tokens = x.shape[0]
@@ -181,7 +186,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class TransformerBlock(torch.nn.Module):
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -193,12 +197,10 @@ def __init__(
         cache_config = vllm_config.cache_config
 
         self.layer_idx = extract_layer_index(prefix)
-        self.attn = OAIAttention(config,
-                                 prefix=f"{prefix}.attn",
-                                 cache_config=cache_config)
-        self.mlp = MLPBlock(vllm_config,
-                            self.layer_idx,
-                            prefix=f"{prefix}.mlp")
+        self.attn = OAIAttention(
+            config, prefix=f"{prefix}.attn", cache_config=cache_config
+        )
+        self.mlp = MLPBlock(vllm_config, self.layer_idx, prefix=f"{prefix}.mlp")
         self.input_layernorm = RMSNorm(config.hidden_size, eps=1e-5)
         self.post_attention_layernorm = RMSNorm(config.hidden_size, eps=1e-5)
 
@@ -213,19 +215,16 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.attn(hidden_states, positions)
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         output = self.mlp(hidden_states)
         return output, residual
 
 
 @support_torch_compile
 class GptOssModel(nn.Module):
-
     def __init__(
         self,
         *,
@@ -249,9 +248,9 @@ def __init__(
             prefix=f"{prefix}.layers",
         )
         self.norm = RMSNorm(self.config.hidden_size, eps=1e-5)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], self.config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], self.config.hidden_size
+        )
         self.aux_hidden_state_layers = tuple[int, ...]()
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
@@ -280,14 +279,10 @@ def forward(
         for i in range(self.start_layer, self.end_layer):
             layer = self.layers[i]
             if i in self.aux_hidden_state_layers:
-                aux_hidden_states.append(x if residual is None else x +
-                                         residual)
+                aux_hidden_states.append(x if residual is None else x + residual)
             x, residual = layer(x, positions, residual)
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": x,
-                "residual": residual
-            })
+            return IntermediateTensors({"hidden_states": x, "residual": residual})
         x, _ = self.norm(x, residual)
 
         if len(aux_hidden_states) > 0:
@@ -315,15 +310,12 @@ def _load_weights_mxfp4(
 
         intermediate_size = self.config.intermediate_size
         intermediate_size_block = intermediate_size // mxfp4_block
-        per_rank_intermediate_size_block = cdiv(intermediate_size_block,
-                                                tp_size)
-        per_rank_intermediate_size = (per_rank_intermediate_size_block *
-                                      mxfp4_block)
+        per_rank_intermediate_size_block = cdiv(intermediate_size_block, tp_size)
+        per_rank_intermediate_size = per_rank_intermediate_size_block * mxfp4_block
 
         # Calculate common slicing bounds for current rank
         tp_rank_start = tp_rank * per_rank_intermediate_size
-        tp_rank_end = min((tp_rank + 1) * per_rank_intermediate_size,
-                          intermediate_size)
+        tp_rank_end = min((tp_rank + 1) * per_rank_intermediate_size, intermediate_size)
 
         for name, weight in weights:
             # Skip layers on other devices.
@@ -338,18 +330,17 @@ def _load_weights_mxfp4(
                 if use_ep:
                     narrow_weight = weight[ep_rank_start:ep_rank_end, ...]
                 else:
-                    narrow_weight = weight[:,
-                                           2 * tp_rank_start:2 * tp_rank_end,
-                                           ...]
+                    narrow_weight = weight[:, 2 * tp_rank_start : 2 * tp_rank_end, ...]
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                weight_loader(param,
-                              narrow_weight,
-                              weight_name=name,
-                              shard_id=None,
-                              expert_id=None)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                weight_loader(
+                    param,
+                    narrow_weight,
+                    weight_name=name,
+                    shard_id=None,
+                    expert_id=None,
+                )
                 loaded_params.add(name)
                 continue
             elif ".w2_weight_scale" in name:
@@ -357,66 +348,68 @@ def _load_weights_mxfp4(
                 if use_ep:
                     narrow_weight = weight[ep_rank_start:ep_rank_end, ...]
                 else:
-                    narrow_weight = weight[..., tp_rank_start //
-                                           mxfp4_block:tp_rank_end //
-                                           mxfp4_block]
+                    narrow_weight = weight[
+                        ..., tp_rank_start // mxfp4_block : tp_rank_end // mxfp4_block
+                    ]
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                weight_loader(param,
-                              narrow_weight,
-                              weight_name=name,
-                              shard_id=None,
-                              expert_id=None)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                weight_loader(
+                    param,
+                    narrow_weight,
+                    weight_name=name,
+                    shard_id=None,
+                    expert_id=None,
+                )
                 loaded_params.add(name)
                 continue
             elif ".w13_weight" in name:
                 # Handle MLP gate and up projection weights
                 # flat weight from (E, 2 * N, block_size, entry_per_block)
                 # to (E, 2 * N, -1), shouldn't trigger copy for contiguous
-                weight = weight.view(num_experts, 2 * intermediate_size,
-                                     -1).contiguous()
+                weight = weight.view(
+                    num_experts, 2 * intermediate_size, -1
+                ).contiguous()
 
                 # Extract gate and up projection parts
                 # since the weight is shuffled, we can slice directly
                 if use_ep:
                     narrow_weight = weight[ep_rank_start:ep_rank_end, ...]
                 else:
-                    narrow_weight = weight[:,
-                                           2 * tp_rank_start:2 * tp_rank_end,
-                                           ...]
+                    narrow_weight = weight[:, 2 * tp_rank_start : 2 * tp_rank_end, ...]
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                weight_loader(param,
-                              narrow_weight,
-                              weight_name=name,
-                              shard_id=None,
-                              expert_id=None)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                weight_loader(
+                    param,
+                    narrow_weight,
+                    weight_name=name,
+                    shard_id=None,
+                    expert_id=None,
+                )
                 loaded_params.add(name)
                 continue
             elif ".w2_weight" in name:
                 # Handle MLP down projection weights
                 # same flatten here, but since 2 mx4 value are packed in 1
                 # uint8, divide by 2
-                weight = weight.view(num_experts, -1,
-                                     intermediate_size // 2).contiguous()
+                weight = weight.view(
+                    num_experts, -1, intermediate_size // 2
+                ).contiguous()
                 if use_ep:
                     narrow_weight = weight[ep_rank_start:ep_rank_end, ...]
                 else:
-                    narrow_weight = weight[...,
-                                           tp_rank_start // 2:tp_rank_end // 2]
+                    narrow_weight = weight[..., tp_rank_start // 2 : tp_rank_end // 2]
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                weight_loader(param,
-                              narrow_weight,
-                              weight_name=name,
-                              shard_id=None,
-                              expert_id=None)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                weight_loader(
+                    param,
+                    narrow_weight,
+                    weight_name=name,
+                    shard_id=None,
+                    expert_id=None,
+                )
                 loaded_params.add(name)
                 continue
             elif ".w13_bias" in name:
@@ -425,35 +418,32 @@ def _load_weights_mxfp4(
                 if use_ep:
                     narrow_weight = weight[ep_rank_start:ep_rank_end, ...]
                 else:
-                    narrow_weight = weight[:,
-                                           2 * tp_rank_start:2 * tp_rank_end]
+                    narrow_weight = weight[:, 2 * tp_rank_start : 2 * tp_rank_end]
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                weight_loader(param,
-                              narrow_weight,
-                              weight_name=name,
-                              shard_id=None,
-                              expert_id=None)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                weight_loader(
+                    param,
+                    narrow_weight,
+                    weight_name=name,
+                    shard_id=None,
+                    expert_id=None,
+                )
                 loaded_params.add(name)
                 continue
             elif ".w2_bias" in name:
                 # Handle MLP down projection bias
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 if use_ep:
                     weight = weight[ep_rank_start:ep_rank_end, ...]
                 else:
                     # (only load on rank 0 to avoid duplication)
                     if tp_rank != 0:
                         weight.zero_()
-                weight_loader(param,
-                              weight,
-                              weight_name=name,
-                              shard_id=None,
-                              expert_id=None)
+                weight_loader(
+                    param, weight, weight_name=name, shard_id=None, expert_id=None
+                )
                 loaded_params.add(name)
                 continue
             elif "sinks" in name:
@@ -468,8 +458,7 @@ def _load_weights_mxfp4(
                     continue
                 name = name.replace(weight_name, param_name)
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 if weight_loader == default_weight_loader:
                     weight_loader(param, weight)
                 else:
@@ -480,8 +469,7 @@ def _load_weights_mxfp4(
                 if name not in params_dict:
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, weight)
             loaded_params.add(name)
         return loaded_params
@@ -507,8 +495,7 @@ def _load_weights_other(
         per_rank_intermediate_size = cdiv(intermediate_size, tp_size)
         # Calculate common slicing bounds for current rank
         tp_rank_start = tp_rank * per_rank_intermediate_size
-        tp_rank_end = min((tp_rank + 1) * per_rank_intermediate_size,
-                          intermediate_size)
+        tp_rank_end = min((tp_rank + 1) * per_rank_intermediate_size, intermediate_size)
 
         for name, weight in weights:
             # Skip layers on other devices.
@@ -521,8 +508,7 @@ def _load_weights_other(
                 if use_ep:
                     narrow_weight = weight[ep_rank_start:ep_rank_end, ...]
                 else:
-                    narrow_weight = weight[:, :,
-                                           2 * tp_rank_start:2 * tp_rank_end]
+                    narrow_weight = weight[:, :, 2 * tp_rank_start : 2 * tp_rank_end]
 
                 narrow_weight = narrow_weight.permute(0, 2, 1).contiguous()
                 param = params_dict[name]
@@ -548,8 +534,7 @@ def _load_weights_other(
                 if use_ep:
                     narrow_weight = weight[ep_rank_start:ep_rank_end, ...]
                 else:
-                    narrow_weight = weight[:,
-                                           2 * tp_rank_start:2 * tp_rank_end]
+                    narrow_weight = weight[:, 2 * tp_rank_start : 2 * tp_rank_end]
 
                 param = params_dict[name]
                 param.copy_(narrow_weight)
@@ -579,8 +564,7 @@ def _load_weights_other(
                     continue
                 name = name.replace(weight_name, param_name)
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 if weight_loader == default_weight_loader:
                     weight_loader(param, weight)
                 else:
@@ -591,14 +575,12 @@ def _load_weights_other(
                 if name not in params_dict:
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, weight)
             loaded_params.add(name)
         return loaded_params
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv", ".q_proj", "q"),
@@ -620,16 +602,29 @@ def load_weights(self, weights: Iterable[tuple[str,
         ep_rank_start = ep_rank * experts_per_rank
         ep_rank_end = (ep_rank + 1) * experts_per_rank
 
-        quant_method = (self.config.quantization_config['quant_method'] if
-                        hasattr(self.config, "quantization_config") else None)
+        quant_method = (
+            self.config.quantization_config["quant_method"]
+            if hasattr(self.config, "quantization_config")
+            else None
+        )
         if quant_method == "mxfp4":
-            return self._load_weights_mxfp4(ep_rank_end, ep_rank_start,
-                                            heads_per_rank, head_start,
-                                            weights, stacked_params_mapping)
+            return self._load_weights_mxfp4(
+                ep_rank_end,
+                ep_rank_start,
+                heads_per_rank,
+                head_start,
+                weights,
+                stacked_params_mapping,
+            )
         else:
-            return self._load_weights_other(ep_rank_end, ep_rank_start,
-                                            heads_per_rank, head_start,
-                                            weights, stacked_params_mapping)
+            return self._load_weights_other(
+                ep_rank_end,
+                ep_rank_start,
+                heads_per_rank,
+                head_start,
+                weights,
+                stacked_params_mapping,
+            )
 
 
 class GptOssForCausalLM(nn.Module, SupportsPP, SupportsEagle3):
@@ -641,17 +636,14 @@ class GptOssForCausalLM(nn.Module, SupportsPP, SupportsEagle3):
         },
         orig_to_new_suffix={
             ".embed_tokens.weight": ".embedding.weight",
-
             # MoE MXFP4 weights
             ".gate_up_proj_blocks": ".w13_weight",
             ".down_proj_blocks": ".w2_weight",
             ".gate_up_proj_scales": ".w13_weight_scale",
             ".down_proj_scales": ".w2_weight_scale",
-
             # MoE other weights
             ".gate_up_proj": ".w13_weight",
             ".down_proj": ".w2_weight",
-
             # MoE Bias
             ".gate_up_proj_bias": ".w13_bias",
             ".down_proj_bias": ".w2_bias",
@@ -678,7 +670,8 @@ def __init__(
         )
         self.logits_processor = LogitsProcessor(self.config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def set_aux_hidden_state_layers(self, layers: tuple[int, ...]) -> None:
         self.model.aux_hidden_state_layers = layers
@@ -690,23 +683,22 @@ def get_eagle3_aux_hidden_state_layers(self) -> tuple[int, ...]:
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None) -> torch.Tensor:
-        return self.model(input_ids, positions, intermediate_tensors,
-                          inputs_embeds)
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+    ) -> torch.Tensor:
+        return self.model(input_ids, positions, intermediate_tensors, inputs_embeds)
 
     def compute_logits(self, hidden_states: torch.Tensor) -> torch.Tensor:
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
diff --git a/vllm/model_executor/models/granite.py b/vllm/model_executor/models/granite.py
index 893cc8a41455..e9bc592c0797 100644
--- a/vllm/model_executor/models/granite.py
+++ b/vllm/model_executor/models/granite.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only IBM Granite model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Any, Optional, Union
@@ -37,25 +38,36 @@
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, is_pp_missing_parameter,
-                    make_layers, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class GraniteMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -71,15 +83,19 @@ def __init__(
             output_sizes=[intermediate_size] * 2,
             bias=bias,
             quant_config=quant_config,
-            prefix=f"{prefix}.gate_up_proj")
-        self.down_proj = RowParallelLinear(input_size=intermediate_size,
-                                           output_size=hidden_size,
-                                           bias=bias,
-                                           quant_config=quant_config,
-                                           prefix=f"{prefix}.down_proj")
+            prefix=f"{prefix}.gate_up_proj",
+        )
+        self.down_proj = RowParallelLinear(
+            input_size=intermediate_size,
+            output_size=hidden_size,
+            bias=bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.down_proj",
+        )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -90,7 +106,6 @@ def forward(self, x):
 
 
 class GraniteAttention(nn.Module):
-
     def __init__(
         self,
         config: GraniteConfig,
@@ -155,13 +170,15 @@ def __init__(
             base=rope_theta,
             rope_scaling=rope_scaling,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -177,7 +194,6 @@ def forward(
 
 
 class GraniteDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: GraniteConfig,
@@ -191,21 +207,24 @@ def __init__(
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
         if rope_scaling is not None and getattr(
-                config, "original_max_position_embeddings", None):
+            config, "original_max_position_embeddings", None
+        ):
             rope_scaling["original_max_position_embeddings"] = (
-                config.original_max_position_embeddings)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+                config.original_max_position_embeddings
+            )
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         # Support abacusai/Smaug-72B-v0.1 with attention_bias
         # Support internlm/internlm-7b with bias
         attention_bias = getattr(config, "attention_bias", False) or getattr(
-            config, "bias", False)
+            config, "bias", False
+        )
         self.self_attn = GraniteAttention(
             config=config,
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
-            num_kv_heads=getattr(config, "num_key_value_heads",
-                                 config.num_attention_heads),
+            num_kv_heads=getattr(
+                config, "num_key_value_heads", config.num_attention_heads
+            ),
             rope_theta=rope_theta,
             rope_scaling=rope_scaling,
             max_position_embeddings=max_position_embeddings,
@@ -223,10 +242,10 @@ def __init__(
             bias=getattr(config, "mlp_bias", False),
             prefix=f"{prefix}.mlp",
         )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -251,7 +270,6 @@ def forward(
 
 @support_torch_compile
 class GraniteModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -262,12 +280,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.config = config
         self.quant_config = quant_config
-        lora_vocab = (lora_config.lora_extra_vocab_size *
-                      (lora_config.max_loras or 1)) if lora_config else 0
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
-        if get_pp_group().is_first_rank or (config.tie_word_embeddings
-                                            and get_pp_group().is_last_rank):
+        if get_pp_group().is_first_rank or (
+            config.tie_word_embeddings and get_pp_group().is_last_rank
+        ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
@@ -275,18 +297,22 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 padding_size=DEFAULT_VOCAB_PADDING_SIZE
                 # We need bigger padding if using lora for kernel
                 # compatibility
-                if not lora_config else lora_config.lora_vocab_padding_size,
+                if not lora_config
+                else lora_config.lora_vocab_padding_size,
                 quant_config=quant_config,
             )
         else:
             self.embed_tokens = PPMissingLayer()
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: GraniteDecoderLayer(config=config,
-                                               cache_config=cache_config,
-                                               quant_config=quant_config,
-                                               prefix=prefix),
-            prefix=f"{prefix}.layers")
+            lambda prefix: GraniteDecoderLayer(
+                config=config,
+                cache_config=cache_config,
+                quant_config=quant_config,
+                prefix=prefix,
+            ),
+            prefix=f"{prefix}.layers",
+        )
         if get_pp_group().is_last_rank:
             self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         else:
@@ -317,15 +343,16 @@ def forward(
             hidden_states = layer(positions, hidden_states)
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-            })
+            return IntermediateTensors(
+                {
+                    "hidden_states": hidden_states,
+                }
+            )
 
         hidden_states = self.norm(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv_proj", ".q_proj", "q"),
@@ -337,18 +364,19 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -377,8 +405,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -414,8 +441,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.lora_config = lora_config
         self.quant_config = quant_config
 
-        self.model = GraniteModel(vllm_config=vllm_config,
-                                  prefix=maybe_prefix(prefix, "model"))
+        self.model = GraniteModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         if get_pp_group().is_last_rank:
             self.unpadded_vocab_size = config.vocab_size
             if lora_config:
@@ -427,7 +455,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 padding_size=DEFAULT_VOCAB_PADDING_SIZE
                 # We need bigger padding if using lora for kernel
                 # compatibility
-                if not lora_config else lora_config.lora_vocab_padding_size,
+                if not lora_config
+                else lora_config.lora_vocab_padding_size,
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
@@ -438,9 +467,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             if hasattr(config, "logits_scaling"):
                 logit_scale /= config.logits_scaling
 
-            self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                    config.vocab_size,
-                                                    scale=logit_scale)
+            self.logits_processor = LogitsProcessor(
+                self.unpadded_vocab_size, config.vocab_size, scale=logit_scale
+            )
         else:
             self.lm_head = PPMissingLayer()
 
@@ -454,32 +483,31 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        model_output = self.model(input_ids, positions, intermediate_tensors,
-                                  inputs_embeds)
+        model_output = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return model_output
 
-    def compute_logits(self,
-                       hidden_states: torch.Tensor) -> Optional[torch.Tensor]:
+    def compute_logits(self, hidden_states: torch.Tensor) -> Optional[torch.Tensor]:
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
     def make_empty_intermediate_tensors(
-            self, batch_size: int, dtype: torch.dtype,
-            device: torch.device) -> IntermediateTensors:
-        return IntermediateTensors({
-            "hidden_states":
-            torch.zeros((batch_size, self.config.hidden_size),
-                        dtype=dtype,
-                        device=device),
-        })
-
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+        self, batch_size: int, dtype: torch.dtype, device: torch.device
+    ) -> IntermediateTensors:
+        return IntermediateTensors(
+            {
+                "hidden_states": torch.zeros(
+                    (batch_size, self.config.hidden_size), dtype=dtype, device=device
+                ),
+            }
+        )
+
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         # With tie_word_embeddings, we can skip lm_head.weight
         # The weight might appear unnecessarily in the files if the model is
         # processed with quantization, LoRA, fine-tuning, etc.
-        skip_prefixes = (["lm_head."]
-                         if self.config.tie_word_embeddings else None)
+        skip_prefixes = ["lm_head."] if self.config.tie_word_embeddings else None
 
         loader = AutoWeightsLoader(
             self,
diff --git a/vllm/model_executor/models/granite_speech.py b/vllm/model_executor/models/granite_speech.py
index e543c6040fc0..82bceaf3ed01 100644
--- a/vllm/model_executor/models/granite_speech.py
+++ b/vllm/model_executor/models/granite_speech.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only IBM Granite speech model."""
+
 import math
 from collections.abc import Iterable, Mapping
 from typing import Annotated, Optional, Union
@@ -34,25 +35,37 @@
 
 from vllm.config import CacheConfig, VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import ColumnParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
-from vllm.multimodal.parse import (AudioProcessorItems, MultiModalDataItems,
-                                   MultiModalDataParser)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
+from vllm.multimodal.parse import (
+    AudioProcessorItems,
+    MultiModalDataItems,
+    MultiModalDataParser,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .blip2 import Blip2QFormerModel
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
 from .utils import AutoWeightsLoader, init_vllm_registered_model, maybe_prefix
 
 
@@ -60,7 +73,7 @@
 class GraniteSpeechAudioInputs(TensorSchema):
     """
     Audio input features for Granite Speech model.
-    
+
     Dimensions:
         - b: Batch size
         - fi: Number of input features from the Mel spectrogram.
@@ -79,7 +92,6 @@ class GraniteSpeechAudioInputs(TensorSchema):
 
 
 class GraniteSpeechMultiModalProcessingInfo(BaseProcessingInfo):
-
     def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
         return {"audio": 1}
 
@@ -96,8 +108,8 @@ def get_max_audio_len(self):
 
 ### Input Processing  & Multimodal utils
 class GraniteSpeechMultiModalProcessor(
-        BaseMultiModalProcessor[GraniteSpeechMultiModalProcessingInfo]):
-
+    BaseMultiModalProcessor[GraniteSpeechMultiModalProcessingInfo]
+):
     def _get_data_parser(self) -> MultiModalDataParser:
         feature_extractor = self.info.get_hf_processor().audio_processor
         sampling_rate = feature_extractor.melspec_kwargs["sample_rate"]
@@ -133,7 +145,8 @@ def get_replacement(item_idx: int):
             audio = audios.get(item_idx)
             audio_length = audio.shape[-1]
             num_projector_features = feature_extractor._get_num_audio_features(
-                [audio_length])[0]
+                [audio_length]
+            )[0]
             return [audio_token_id] * num_projector_features
 
         return [
@@ -170,14 +183,15 @@ def _call_hf_processor(
             # This is used to split the batch back out after padding.
             audio_token_index = self.info.get_hf_config().audio_token_index
             processed_outputs["audio_embed_sizes"] = (
-                processed_outputs["input_ids"] == audio_token_index).sum(-1)
+                processed_outputs["input_ids"] == audio_token_index
+            ).sum(-1)
 
         return processed_outputs
 
 
 class GraniteSpeechDummyInputsBuilder(
-        BaseDummyInputsBuilder[GraniteSpeechMultiModalProcessingInfo]):
-
+    BaseDummyInputsBuilder[GraniteSpeechMultiModalProcessingInfo]
+):
     def get_dummy_mm_data(
         self,
         seq_len: int,
@@ -188,8 +202,7 @@ def get_dummy_mm_data(
         audio_overrides = mm_options.get("audio") if mm_options else None
 
         return {
-            "audio":
-            self._get_dummy_audios(
+            "audio": self._get_dummy_audios(
                 length=self.info.get_max_audio_len(),
                 num_audios=num_audios,
                 overrides=audio_overrides,
@@ -205,7 +218,6 @@ def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
 
 ### QFormer Projector
 class GraniteSpeechEncoderProjector(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -220,8 +232,8 @@ def __init__(
         self.num_queries = config.window_size // config.downsample_rate
 
         self.query = nn.Parameter(
-            torch.zeros(1, self.num_queries,
-                        config.projector_config.hidden_size))
+            torch.zeros(1, self.num_queries, config.projector_config.hidden_size)
+        )
 
         # NOTE - this is implemented generically in transformers,
         # but for now we create the QFormer model directly since
@@ -232,17 +244,16 @@ def __init__(
             cache_config=cache_config,
             prefix=f"{prefix}.qformer",
         )
-        self.linear = nn.Linear(config.projector_config.hidden_size,
-                                config.text_config.hidden_size)
+        self.linear = nn.Linear(
+            config.projector_config.hidden_size, config.text_config.hidden_size
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         batch_size, seq_len, dim = hidden_states.size()
         nblocks = math.ceil(seq_len / self.window_size)
         pad = nblocks * self.window_size - seq_len
-        hidden_states = nn.functional.pad(hidden_states, (0, 0, 0, pad),
-                                          "constant", 0)
-        hidden_states = hidden_states.view(batch_size * nblocks,
-                                           self.window_size, dim)
+        hidden_states = nn.functional.pad(hidden_states, (0, 0, 0, pad), "constant", 0)
+        hidden_states = hidden_states.view(batch_size * nblocks, self.window_size, dim)
 
         last_hidden_state = self.qformer(
             query_embeds=self.query.data,
@@ -254,7 +265,8 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
                 batch_size,
                 nblocks * self.window_size // self.downsample_rate,
                 -1,
-            ))
+            )
+        )
         return query_proj
 
 
@@ -264,10 +276,12 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 class GraniteSpeechConformerFeedForward(nn.Module):
     """Feedforward module for conformer encoder blocks."""
 
-    def __init__(self,
-                 config: PretrainedConfig,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: PretrainedConfig,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.pre_norm = nn.LayerNorm(config.hidden_dim)
 
@@ -313,16 +327,16 @@ def __init__(self, config: PretrainedConfig, prefix: str = ""):
         self.to_q = nn.Linear(config.hidden_dim, inner_dim, bias=False)
         self.to_kv = nn.Linear(config.hidden_dim, inner_dim * 2, bias=False)
         self.to_out = nn.Linear(inner_dim, config.hidden_dim)
-        self.rel_pos_emb = nn.Embedding(2 * self.max_pos_emb + 1,
-                                        self.dim_head)
+        self.rel_pos_emb = nn.Embedding(2 * self.max_pos_emb + 1, self.dim_head)
 
         if self.context_size <= 0 or self.context_size > self.max_pos_emb:
             raise ValueError(
                 "Context size is either less than 0 or exceeds the max_pos_emb"
             )
 
-    def forward(self, hidden_states: torch.Tensor,
-                attention_dists: torch.Tensor) -> torch.Tensor:
+    def forward(
+        self, hidden_states: torch.Tensor, attention_dists: torch.Tensor
+    ) -> torch.Tensor:
         hidden_states = self.pre_norm(hidden_states)
         bsz, num_features, _ = hidden_states.shape
 
@@ -331,47 +345,53 @@ def forward(self, hidden_states: torch.Tensor,
         if remainder > 0:
             # right padding to reach block size
             hidden_states = torch.nn.functional.pad(
-                hidden_states, (0, 0, 0, self.context_size - remainder))
+                hidden_states, (0, 0, 0, self.context_size - remainder)
+            )
 
         # NOTE: would be nice to try to use qkvparallellinear
         # here for this block attention implementation if possible
         query_states = self.to_q(hidden_states)
         key_states, value_states = self.to_kv(hidden_states).chunk(2, dim=-1)
 
-        query_states = query_states.reshape(bsz, num_blocks, self.context_size,
-                                            self.num_heads,
-                                            -1).transpose(2, 3)
-        key_states = key_states.reshape(bsz, num_blocks, self.context_size,
-                                        self.num_heads, -1).transpose(2, 3)
-        value_states = value_states.reshape(bsz, num_blocks, self.context_size,
-                                            self.num_heads,
-                                            -1).transpose(2, 3)
+        query_states = query_states.reshape(
+            bsz, num_blocks, self.context_size, self.num_heads, -1
+        ).transpose(2, 3)
+        key_states = key_states.reshape(
+            bsz, num_blocks, self.context_size, self.num_heads, -1
+        ).transpose(2, 3)
+        value_states = value_states.reshape(
+            bsz, num_blocks, self.context_size, self.num_heads, -1
+        ).transpose(2, 3)
 
         # shaw's relative positional embedding
         dist = attention_dists.to(hidden_states.device)
         rel_pos_emb = self.rel_pos_emb(dist)
-        rel_pos_emb_expanded = rel_pos_emb.view([1, 1, 1] +
-                                                list(rel_pos_emb.shape))
-        pos_attn = torch.sum(query_states.unsqueeze(-2) * rel_pos_emb_expanded,
-                             dim=-1) * self.scale
+        rel_pos_emb_expanded = rel_pos_emb.view([1, 1, 1] + list(rel_pos_emb.shape))
+        pos_attn = (
+            torch.sum(query_states.unsqueeze(-2) * rel_pos_emb_expanded, dim=-1)
+            * self.scale
+        )
 
         if remainder > 0:
             # masked attention in the extended block
-            mask = torch.ones(self.context_size,
-                              self.context_size,
-                              dtype=bool,
-                              device=hidden_states.device)
+            mask = torch.ones(
+                self.context_size,
+                self.context_size,
+                dtype=bool,
+                device=hidden_states.device,
+            )
             mask[:remainder, :remainder] = 0
             mask_value = -torch.finfo(pos_attn.dtype).max
             pos_attn[:, -1, :].masked_fill_(mask, mask_value)
 
-        with torch.nn.attention.sdpa_kernel(
-                torch.nn.attention.SDPBackend.MATH):
-            out = F.scaled_dot_product_attention(query_states,
-                                                 key_states,
-                                                 value_states,
-                                                 attn_mask=pos_attn,
-                                                 scale=self.scale)
+        with torch.nn.attention.sdpa_kernel(torch.nn.attention.SDPBackend.MATH):
+            out = F.scaled_dot_product_attention(
+                query_states,
+                key_states,
+                value_states,
+                attn_mask=pos_attn,
+                scale=self.scale,
+            )
         out = out.transpose(2, 3).reshape(bsz, hidden_states.shape[1], -1)
         return self.to_out(out[:, :num_features, :])
 
@@ -379,22 +399,16 @@ def forward(self, hidden_states: torch.Tensor,
 class GraniteSpeechConformerDepthWiseConv1d(nn.Module):
     """Wrapper for padded 1D pointwise convolution."""
 
-    def __init__(self,
-                 chan_in: int,
-                 chan_out: int,
-                 kernel_size: int,
-                 prefix: str = ""):
+    def __init__(self, chan_in: int, chan_out: int, kernel_size: int, prefix: str = ""):
         super().__init__()
         # Padding for the 1D conv is symmetric or close (i.e., offset by one).
         pad = kernel_size // 2
         pad_offset = (kernel_size + 1) % 2
         self.padding = (pad, pad - pad_offset)
 
-        self.conv = nn.Conv1d(chan_in,
-                              chan_out,
-                              kernel_size,
-                              groups=chan_in,
-                              bias=False)
+        self.conv = nn.Conv1d(
+            chan_in, chan_out, kernel_size, groups=chan_in, bias=False
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         hidden_states = F.pad(hidden_states, self.padding)
@@ -439,21 +453,19 @@ class GraniteSpeechConformerBlock(nn.Module):
 
     def __init__(self, config: PretrainedConfig, prefix: str = ""):
         super().__init__()
-        self.ff1 = GraniteSpeechConformerFeedForward(config,
-                                                     prefix=f"{prefix}.ff1")
-        self.attn = GraniteSpeechConformerAttention(config,
-                                                    prefix=f"{prefix}.attn")
-        self.conv = GraniteSpeechConformerConvModule(config,
-                                                     prefix=f"{prefix}.conv")
-        self.ff2 = GraniteSpeechConformerFeedForward(config,
-                                                     prefix=f"{prefix}.ff2")
+        self.ff1 = GraniteSpeechConformerFeedForward(config, prefix=f"{prefix}.ff1")
+        self.attn = GraniteSpeechConformerAttention(config, prefix=f"{prefix}.attn")
+        self.conv = GraniteSpeechConformerConvModule(config, prefix=f"{prefix}.conv")
+        self.ff2 = GraniteSpeechConformerFeedForward(config, prefix=f"{prefix}.ff2")
         self.post_norm = nn.LayerNorm(config.hidden_dim)
 
-    def forward(self, hidden_states: torch.Tensor,
-                attention_dists: torch.Tensor) -> torch.Tensor:
+    def forward(
+        self, hidden_states: torch.Tensor, attention_dists: torch.Tensor
+    ) -> torch.Tensor:
         hidden_states = 0.5 * self.ff1(hidden_states) + hidden_states
-        hidden_states = self.attn(
-            hidden_states, attention_dists=attention_dists) + hidden_states
+        hidden_states = (
+            self.attn(hidden_states, attention_dists=attention_dists) + hidden_states
+        )
         hidden_states = self.conv(hidden_states) + hidden_states
         hidden_states = 0.5 * self.ff2(hidden_states) + hidden_states
         hidden_states = self.post_norm(hidden_states)
@@ -463,29 +475,33 @@ def forward(self, hidden_states: torch.Tensor,
 class GraniteSpeechCTCEncoder(nn.Module):
     """CTC Encoder comprising conformer blocks and additional linear layers."""
 
-    def __init__(self,
-                 config: PretrainedConfig,
-                 prefix: str,
-                 quant_config: Optional[QuantizationConfig] = None):
+    def __init__(
+        self,
+        config: PretrainedConfig,
+        prefix: str,
+        quant_config: Optional[QuantizationConfig] = None,
+    ):
         super().__init__()
         self.config = config
 
         # Precompute clamped relative positional encoding distances
         seq = torch.arange(config.context_size)
         relpos_dist = seq.view(-1, 1) - seq.view(1, -1)
-        self.attention_dists = torch.clamp(
-            relpos_dist, -config.context_size,
-            config.context_size) + config.max_pos_emb
-
-        self.input_linear = nn.Linear(config.input_dim,
-                                      config.hidden_dim,
-                                      bias=True)
-        self.layers = nn.ModuleList([
-            GraniteSpeechConformerBlock(
-                config,
-                prefix=f"{prefix}.layers.{idx}",
-            ) for idx in range(config.num_layers)
-        ])
+        self.attention_dists = (
+            torch.clamp(relpos_dist, -config.context_size, config.context_size)
+            + config.max_pos_emb
+        )
+
+        self.input_linear = nn.Linear(config.input_dim, config.hidden_dim, bias=True)
+        self.layers = nn.ModuleList(
+            [
+                GraniteSpeechConformerBlock(
+                    config,
+                    prefix=f"{prefix}.layers.{idx}",
+                )
+                for idx in range(config.num_layers)
+            ]
+        )
 
         self.out = ColumnParallelLinear(
             input_size=config.hidden_dim,
@@ -508,8 +524,7 @@ def __init__(self,
     def forward(self, hidden_states: torch.Tensor):
         hidden_states = self.input_linear(hidden_states)
         for idx, layer in enumerate(self.layers, start=1):
-            hidden_states = layer(hidden_states,
-                                  attention_dists=self.attention_dists)
+            hidden_states = layer(hidden_states, attention_dists=self.attention_dists)
 
             if idx == self.num_layers // 2:
                 hidden_states_mid = hidden_states.clone()
@@ -523,12 +538,13 @@ def forward(self, hidden_states: torch.Tensor):
 @MULTIMODAL_REGISTRY.register_processor(
     GraniteSpeechMultiModalProcessor,
     info=GraniteSpeechMultiModalProcessingInfo,
-    dummy_inputs=GraniteSpeechDummyInputsBuilder)
+    dummy_inputs=GraniteSpeechDummyInputsBuilder,
+)
 class GraniteSpeechForConditionalGeneration(
-        nn.Module,
-        SupportsMultiModal,
-        SupportsPP,
-        SupportsLoRA,
+    nn.Module,
+    SupportsMultiModal,
+    SupportsPP,
+    SupportsLoRA,
 ):
     merge_by_field_config = True
 
@@ -584,7 +600,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_audio_input(
         self,
@@ -602,17 +619,21 @@ def _parse_and_validate_audio_input(
         # from the processor, but we handle rebuilding it here since
         # vLLM generally processes everything independently + batches.
         if input_features_mask is None:
-            input_features_mask = self._build_input_features_mask(
-                audio_embed_sizes)
+            input_features_mask = self._build_input_features_mask(audio_embed_sizes)
 
         if not isinstance(input_features, (torch.Tensor, list)):
-            raise ValueError("Incorrect type of audio input features. "
-                             f"Got type: {type(input_features)}")
+            raise ValueError(
+                "Incorrect type of audio input features. "
+                f"Got type: {type(input_features)}"
+            )
 
         if input_features_mask is not None and not isinstance(
-                input_features_mask, torch.Tensor):
-            raise ValueError("Incorrect type of audio input features mask. "
-                             f"Got type: {type(input_features_mask)}")
+            input_features_mask, torch.Tensor
+        ):
+            raise ValueError(
+                "Incorrect type of audio input features mask. "
+                f"Got type: {type(input_features_mask)}"
+            )
 
         if isinstance(input_features, torch.Tensor):
             # Granite speech currently only allows one audio token per instance
@@ -625,16 +646,17 @@ def _parse_and_validate_audio_input(
             if len(input_features.shape) != 3:
                 raise ValueError(
                     "Squeezed input features should be 3D but are of shape "
-                    f"{input_features.shape}")
-            input_features = input_features.to(
-                self.encoder.input_linear.weight.dtype)
+                    f"{input_features.shape}"
+                )
+            input_features = input_features.to(self.encoder.input_linear.weight.dtype)
 
         else:
             # Otherwise we have a list of tensors, which are almost certainly
             # differing in their respective numbers of audio features;
             # stack them into a 3D tensor of size [bsz, most_num_features, 160].
             input_features = self._pad_and_stack_input_features(
-                input_features, ).to(self.encoder.input_linear.weight.dtype)
+                input_features,
+            ).to(self.encoder.input_linear.weight.dtype)
 
         return GraniteSpeechAudioInputs(
             input_features=input_features,
@@ -706,7 +728,7 @@ def _process_audio_input(
         audio_input: GraniteSpeechAudioInputs,
     ) -> tuple[torch.Tensor]:
         """Compute the audio features to be merged into the LLM embeddings.
-        
+
         Args:
             audio_input: GraniteSpeechAudioInputs
                 Audio inputs object containing Mel features, an input features
@@ -769,8 +791,9 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        model_output = self.language_model(input_ids, positions,
-                                           intermediate_tensors, inputs_embeds)
+        model_output = self.language_model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return model_output
 
     def compute_logits(
diff --git a/vllm/model_executor/models/granitemoe.py b/vllm/model_executor/models/granitemoe.py
index 489c0bb3d3af..4711ed05c587 100644
--- a/vllm/model_executor/models/granitemoe.py
+++ b/vllm/model_executor/models/granitemoe.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only GraniteMoe model."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Any, Optional
@@ -33,27 +34,35 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (get_pp_group,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_gather)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_gather,
+)
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.model_executor.models.utils import sequence_parallel_chunk
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter, make_layers,
-                    maybe_prefix)
+from .utils import AutoWeightsLoader, is_pp_missing_parameter, make_layers, maybe_prefix
 
 
 class GraniteMoeMoE(nn.Module):
@@ -64,39 +73,45 @@ class GraniteMoeMoE(nn.Module):
     across ranks.
     """
 
-    def __init__(self,
-                 num_experts: int,
-                 top_k: int,
-                 hidden_size: int,
-                 intermediate_size: int,
-                 params_dtype: Optional[torch.dtype] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 tp_size: Optional[int] = None,
-                 is_sequence_parallel=False,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        num_experts: int,
+        top_k: int,
+        hidden_size: int,
+        intermediate_size: int,
+        params_dtype: Optional[torch.dtype] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        tp_size: Optional[int] = None,
+        is_sequence_parallel=False,
+        prefix: str = "",
+    ):
         super().__init__()
         self.hidden_size = hidden_size
         self.is_sequence_parallel = is_sequence_parallel
 
         # Gate always runs at half / full precision for now.
-        self.gate = ReplicatedLinear(hidden_size,
-                                     num_experts,
-                                     bias=False,
-                                     params_dtype=params_dtype,
-                                     quant_config=None,
-                                     prefix=f"{prefix}.gate")
-
-        self.experts = FusedMoE(num_experts=num_experts,
-                                top_k=top_k,
-                                hidden_size=hidden_size,
-                                intermediate_size=intermediate_size,
-                                params_dtype=params_dtype,
-                                reduce_results=True,
-                                renormalize=True,
-                                quant_config=quant_config,
-                                tp_size=tp_size,
-                                prefix=f"{prefix}.experts",
-                                is_sequence_parallel=self.is_sequence_parallel)
+        self.gate = ReplicatedLinear(
+            hidden_size,
+            num_experts,
+            bias=False,
+            params_dtype=params_dtype,
+            quant_config=None,
+            prefix=f"{prefix}.gate",
+        )
+
+        self.experts = FusedMoE(
+            num_experts=num_experts,
+            top_k=top_k,
+            hidden_size=hidden_size,
+            intermediate_size=intermediate_size,
+            params_dtype=params_dtype,
+            reduce_results=True,
+            renormalize=True,
+            quant_config=quant_config,
+            tp_size=tp_size,
+            prefix=f"{prefix}.experts",
+            is_sequence_parallel=self.is_sequence_parallel,
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         # NOTE: hidden_states can have either 1D or 2D shape.
@@ -112,7 +127,8 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
         if self.is_sequence_parallel:
             final_hidden_states = tensor_model_parallel_all_gather(
-                final_hidden_states, 0)
+                final_hidden_states, 0
+            )
             num_tokens = orig_shape[0]
             final_hidden_states = final_hidden_states[:num_tokens]
 
@@ -120,7 +136,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class GraniteMoeAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -153,8 +168,11 @@ def __init__(
         self.head_dim = hidden_size // self.total_num_heads
         self.q_size = self.num_heads * self.head_dim
         self.kv_size = self.num_kv_heads * self.head_dim
-        self.scaling = (attention_multiplier if attention_multiplier
-                        is not None else self.head_dim**-1)
+        self.scaling = (
+            attention_multiplier
+            if attention_multiplier is not None
+            else self.head_dim**-1
+        )
         self.rope_theta = rope_theta
 
         self.qkv_proj = QKVParallelLinear(
@@ -181,13 +199,15 @@ def __init__(
             is_neox_style=True,
             rope_scaling=rope_scaling,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -203,7 +223,6 @@ def forward(
 
 
 class GraniteMoeDecoderLayer(nn.Module):
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -230,7 +249,8 @@ def __init__(
             cache_config=cache_config,
             quant_config=quant_config,
             prefix=f"{prefix}.self_attn",
-            attention_multiplier=config.attention_multiplier)
+            attention_multiplier=config.attention_multiplier,
+        )
         self.block_sparse_moe = GraniteMoeMoE(
             num_experts=config.num_local_experts,
             top_k=config.num_experts_per_tok,
@@ -238,12 +258,13 @@ def __init__(
             intermediate_size=config.intermediate_size,
             quant_config=quant_config,
             is_sequence_parallel=parallel_config.use_sequence_parallel_moe,
-            prefix=f"{prefix}.block_sparse_moe")
+            prefix=f"{prefix}.block_sparse_moe",
+        )
 
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
         self.residual_multiplier = config.residual_multiplier
 
@@ -270,7 +291,6 @@ def forward(
 
 @support_torch_compile
 class GraniteMoeModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -280,8 +300,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.config = config
         self.quant_config = quant_config  # Required by MixtralModel
-        lora_vocab = (lora_config.lora_extra_vocab_size *
-                      (lora_config.max_loras or 1)) if lora_config else 0
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
 
@@ -295,7 +318,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: GraniteMoeDecoderLayer(vllm_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
+            prefix=f"{prefix}.layers",
+        )
 
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
@@ -321,17 +345,18 @@ def forward(
         for layer in islice(self.layers, self.start_layer, self.end_layer):
             hidden_states = layer(positions, hidden_states)
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-            })
+            return IntermediateTensors(
+                {
+                    "hidden_states": hidden_states,
+                }
+            )
         hidden_states = self.norm(hidden_states)
         return hidden_states
 
-    def _load_weights(self,
-                      weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
+    def _load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         """
-        This function is copied from `MixtralModel.load_weights`, mainly to 
-        decouple from mixtral, avoiding impact on support like BNB  
+        This function is copied from `MixtralModel.load_weights`, mainly to
+        decouple from mixtral, avoiding impact on support like BNB
         quantization.
         """
         stacked_params_mapping = [
@@ -347,30 +372,33 @@ def _load_weights(self,
             ckpt_gate_proj_name="w1",
             ckpt_down_proj_name="w2",
             ckpt_up_proj_name="w3",
-            num_experts=self.config.num_local_experts)
+            num_experts=self.config.num_local_experts,
+        )
 
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
                 # Skip loading extra bias for GPTQ models.
-                if ((name.endswith(".bias") or name.endswith("_bias"))
-                        and name not in params_dict):
+                if (
+                    name.endswith(".bias") or name.endswith("_bias")
+                ) and name not in params_dict:
                     continue
                 # Skip layers on other devices.
                 if is_pp_missing_parameter(name, self):
@@ -393,21 +421,25 @@ def _load_weights(self,
                     # Skip layers on other devices.
                     if is_pp_missing_parameter(name, self):
                         continue
-                    if ((name.endswith(".bias") or name.endswith("_bias"))
-                            and name not in params_dict):
+                    if (
+                        name.endswith(".bias") or name.endswith("_bias")
+                    ) and name not in params_dict:
                         continue
                     param = params_dict[name]
                     weight_loader = param.weight_loader
-                    weight_loader(param,
-                                  loaded_weight,
-                                  name,
-                                  shard_id=shard_id,
-                                  expert_id=expert_id)
+                    weight_loader(
+                        param,
+                        loaded_weight,
+                        name,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                    )
                     break
                 else:
                     # Skip loading extra bias for GPTQ models.
-                    if ((name.endswith(".bias") or name.endswith("_bias"))
-                            and name not in params_dict):
+                    if (
+                        name.endswith(".bias") or name.endswith("_bias")
+                    ) and name not in params_dict:
                         continue
                     # Skip layers on other devices.
                     if is_pp_missing_parameter(name, self):
@@ -418,40 +450,45 @@ def _load_weights(self,
                         continue
 
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         new_weights = {}
         for n, p in weights:
-            if n.endswith('.block_sparse_moe.input_linear.weight'):
+            if n.endswith(".block_sparse_moe.input_linear.weight"):
                 for e in range(p.size(0)):
                     w1_name = n.replace(
-                        '.block_sparse_moe.input_linear.weight',
-                        f".block_sparse_moe.experts.{e}.w1.weight")
+                        ".block_sparse_moe.input_linear.weight",
+                        f".block_sparse_moe.experts.{e}.w1.weight",
+                    )
                     w3_name = n.replace(
-                        '.block_sparse_moe.input_linear.weight',
-                        f".block_sparse_moe.experts.{e}.w3.weight")
+                        ".block_sparse_moe.input_linear.weight",
+                        f".block_sparse_moe.experts.{e}.w3.weight",
+                    )
                     w1_param, w3_param = p[e].chunk(2, dim=0)
                     assert w1_name not in new_weights
                     assert w3_name not in new_weights
                     new_weights[w1_name] = w1_param
                     new_weights[w3_name] = w3_param
-            elif n.endswith('.block_sparse_moe.output_linear.weight'):
+            elif n.endswith(".block_sparse_moe.output_linear.weight"):
                 for e in range(p.size(0)):
                     w2_name = n.replace(
-                        '.block_sparse_moe.output_linear.weight',
-                        f".block_sparse_moe.experts.{e}.w2.weight")
+                        ".block_sparse_moe.output_linear.weight",
+                        f".block_sparse_moe.experts.{e}.w2.weight",
+                    )
                     w2_param = p[e]
                     assert w2_name not in new_weights
                     new_weights[w2_name] = w2_param
-            elif n.endswith('.block_sparse_moe.router.layer.weight'):
-                gate_name = n.replace('.block_sparse_moe.router.layer.weight',
-                                      ".block_sparse_moe.gate.weight")
+            elif n.endswith(".block_sparse_moe.router.layer.weight"):
+                gate_name = n.replace(
+                    ".block_sparse_moe.router.layer.weight",
+                    ".block_sparse_moe.gate.weight",
+                )
                 assert gate_name not in new_weights
                 new_weights[gate_name] = p
             else:
@@ -486,8 +523,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.config = config
         self.lora_config = lora_config
 
-        self.model = GraniteMoeModel(vllm_config=vllm_config,
-                                     prefix=maybe_prefix(prefix, "model"))
+        self.model = GraniteMoeModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.unpadded_vocab_size = config.vocab_size
         if lora_config:
             self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
@@ -498,17 +536,19 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             padding_size=DEFAULT_VOCAB_PADDING_SIZE
             # We need bigger padding if using lora for kernel
             # compatibility
-            if not lora_config else lora_config.lora_vocab_padding_size,
+            if not lora_config
+            else lora_config.lora_vocab_padding_size,
             quant_config=quant_config,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
         if config.tie_word_embeddings:
             self.lm_head.weight = self.model.embed_tokens.weight
 
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size,
-                                                scale=1 /
-                                                self.config.logits_scaling)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size,
+            config.vocab_size,
+            scale=1 / self.config.logits_scaling,
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -520,30 +560,29 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
-    def compute_logits(self,
-                       hidden_states: torch.Tensor) -> Optional[torch.Tensor]:
+    def compute_logits(self, hidden_states: torch.Tensor) -> Optional[torch.Tensor]:
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
     def make_empty_intermediate_tensors(
-            self, batch_size: int, dtype: torch.dtype,
-            device: torch.device) -> IntermediateTensors:
-        return IntermediateTensors({
-            "hidden_states":
-            torch.zeros((batch_size, self.config.hidden_size),
-                        dtype=dtype,
-                        device=device),
-        })
-
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+        self, batch_size: int, dtype: torch.dtype, device: torch.device
+    ) -> IntermediateTensors:
+        return IntermediateTensors(
+            {
+                "hidden_states": torch.zeros(
+                    (batch_size, self.config.hidden_size), dtype=dtype, device=device
+                ),
+            }
+        )
+
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/granitemoehybrid.py b/vllm/model_executor/models/granitemoehybrid.py
index dc213e029cd5..f877dc576427 100644
--- a/vllm/model_executor/models/granitemoehybrid.py
+++ b/vllm/model_executor/models/granitemoehybrid.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Inference-only GraniteMoeHybrid model."""
+
 # Added by the IBM Team, 2025
 from collections.abc import Iterable
 from typing import Optional
@@ -15,58 +16,67 @@
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.distributed.parallel_state import get_pp_group
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import QKVParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.mamba.mamba_mixer2 import MambaMixer2
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .granitemoe import GraniteMoeMoE
 from .granitemoeshared import GraniteMoeSharedMLP
-from .interfaces import (HasInnerState, IsHybrid, SupportsLoRA, SupportsPP,
-                         SupportsQuant)
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .interfaces import HasInnerState, IsHybrid, SupportsLoRA, SupportsPP, SupportsQuant
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class GraniteMoeHybridMambaDecoderLayer(nn.Module):
-
-    def __init__(self,
-                 config: GraniteMoeHybridConfig,
-                 layer_idx: int,
-                 model_config: Optional[ModelConfig] = None,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: GraniteMoeHybridConfig,
+        layer_idx: int,
+        model_config: Optional[ModelConfig] = None,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
         self.config = config
         self.hidden_size = config.hidden_size
         self.residual_multiplier = config.residual_multiplier
 
-        self.mamba = MambaMixer2(hidden_size= config.hidden_size,
-                                ssm_state_size = config.mamba_d_state,
-                                conv_kernel_size = config.mamba_d_conv,
-                                intermediate_size = config.mamba_expand *\
-                                                    config.hidden_size,
-                                use_conv_bias = config.mamba_conv_bias,
-                                use_bias = config.mamba_proj_bias,
-                                n_groups=config.mamba_n_groups,
-                                num_heads=config.mamba_n_heads,
-                                head_dim=config.mamba_d_head,
-                                rms_norm_eps=config.rms_norm_eps,
-                                activation=config.hidden_act,
-                                model_config=model_config,
-                                cache_config=cache_config,
-                                quant_config=quant_config,
-                                prefix=f"{prefix}.mixer")
+        self.mamba = MambaMixer2(
+            hidden_size=config.hidden_size,
+            ssm_state_size=config.mamba_d_state,
+            conv_kernel_size=config.mamba_d_conv,
+            intermediate_size=config.mamba_expand * config.hidden_size,
+            use_conv_bias=config.mamba_conv_bias,
+            use_bias=config.mamba_proj_bias,
+            n_groups=config.mamba_n_groups,
+            num_heads=config.mamba_n_heads,
+            head_dim=config.mamba_d_head,
+            rms_norm_eps=config.rms_norm_eps,
+            activation=config.hidden_act,
+            model_config=model_config,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.mixer",
+        )
 
         self.block_sparse_moe = None
         if getattr(config, "num_local_experts", 0) > 0:
@@ -76,20 +86,21 @@ def __init__(self,
                 hidden_size=config.hidden_size,
                 intermediate_size=config.intermediate_size,
                 quant_config=quant_config,
-                prefix=f"{prefix}.block_sparse_moe")
+                prefix=f"{prefix}.block_sparse_moe",
+            )
 
-        self.shared_mlp = None if \
-            getattr(config, 'shared_intermediate_size', 0) == 0 \
+        self.shared_mlp = (
+            None
+            if getattr(config, "shared_intermediate_size", 0) == 0
             else GraniteMoeSharedMLP(
-                config,
-                quant_config=quant_config,
-                prefix=f"{prefix}.shared_mlp"
+                config, quant_config=quant_config, prefix=f"{prefix}.shared_mlp"
             )
+        )
 
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -114,8 +125,7 @@ def forward(
             if self.block_sparse_moe is not None:
                 moe_hidden_states = hidden_states.clone()
                 moe_hidden_states = self.block_sparse_moe(moe_hidden_states)
-                hidden_states = moe_hidden_states + self.shared_mlp(
-                    hidden_states)
+                hidden_states = moe_hidden_states + self.shared_mlp(hidden_states)
                 del moe_hidden_states
             else:
                 hidden_states = self.shared_mlp(hidden_states)
@@ -125,7 +135,6 @@ def forward(
 
 
 class GraniteMoeHybridAttentionDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: GraniteMoeHybridConfig,
@@ -143,7 +152,8 @@ def __init__(
             config,
             cache_config=cache_config,
             quant_config=quant_config,
-            prefix=f"{prefix}.self_attn")
+            prefix=f"{prefix}.self_attn",
+        )
 
         self.block_sparse_moe = None
         if getattr(config, "num_local_experts", 0) > 0:
@@ -153,20 +163,21 @@ def __init__(
                 hidden_size=config.hidden_size,
                 intermediate_size=config.intermediate_size,
                 quant_config=quant_config,
-                prefix=f"{prefix}.block_sparse_moe")
+                prefix=f"{prefix}.block_sparse_moe",
+            )
 
-        self.shared_mlp = None if \
-            getattr(config, 'shared_intermediate_size', 0) == 0 \
+        self.shared_mlp = (
+            None
+            if getattr(config, "shared_intermediate_size", 0) == 0
             else GraniteMoeSharedMLP(
-                config,
-                quant_config=quant_config,
-                prefix=f"{prefix}.shared_mlp"
+                config, quant_config=quant_config, prefix=f"{prefix}.shared_mlp"
             )
+        )
 
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -194,8 +205,7 @@ def forward(
             if self.block_sparse_moe is not None:
                 moe_hidden_states = hidden_states.clone()
                 moe_hidden_states = self.block_sparse_moe(moe_hidden_states)
-                hidden_states = moe_hidden_states + self.shared_mlp(
-                    hidden_states)
+                hidden_states = moe_hidden_states + self.shared_mlp(hidden_states)
                 del moe_hidden_states
             else:
                 hidden_states = self.shared_mlp(hidden_states)
@@ -205,7 +215,6 @@ def forward(
 
 
 class GraniteMoeHybridAttention(nn.Module):
-
     def __init__(
         self,
         config: GraniteMoeHybridConfig,
@@ -237,19 +246,23 @@ def __init__(
             assert tp_size % self.total_num_kv_heads == 0
         self.num_key_value_heads = max(1, self.total_num_kv_heads // tp_size)
 
-        self.qkv_proj = QKVParallelLinear(self.hidden_size,
-                                          self.head_dim,
-                                          self.total_num_heads,
-                                          self.total_num_kv_heads,
-                                          bias=self.attention_bias,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.qkv_proj")
+        self.qkv_proj = QKVParallelLinear(
+            self.hidden_size,
+            self.head_dim,
+            self.total_num_heads,
+            self.total_num_kv_heads,
+            bias=self.attention_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.qkv_proj",
+        )
 
-        self.o_proj = RowParallelLinear(self.hidden_size,
-                                        self.hidden_size,
-                                        bias=self.attention_bias,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.o_proj")
+        self.o_proj = RowParallelLinear(
+            self.hidden_size,
+            self.hidden_size,
+            bias=self.attention_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.o_proj",
+        )
 
         if config.position_embedding_type == "rope":
             self.rotary_emb = get_rope(
@@ -257,34 +270,38 @@ def __init__(
                 rotary_dim=self.head_dim,
                 max_position=config.max_position_embeddings,
                 base=int(config.rope_theta),
-                rope_scaling=config.rope_scaling \
-                    if hasattr(config, "rope_scaling") \
-                    and config.rope_scaling is not None else None,
+                rope_scaling=config.rope_scaling
+                if hasattr(config, "rope_scaling") and config.rope_scaling is not None
+                else None,
                 is_neox_style=True,
             )
         else:
             self.rotary_emb = None
 
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.attention_multiplier,
-                              num_kv_heads=self.num_key_value_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.attention_multiplier,
+            num_kv_heads=self.num_key_value_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
         positions: torch.Tensor,
         hidden_states: torch.Tensor,
     ) -> torch.Tensor:
-
         qkv, _ = self.qkv_proj(hidden_states)
-        query, key, value = qkv.split([
-            self.num_heads * self.head_dim, self.num_key_value_heads *
-            self.head_dim, self.num_key_value_heads * self.head_dim
-        ],
-                                      dim=-1)
+        query, key, value = qkv.split(
+            [
+                self.num_heads * self.head_dim,
+                self.num_key_value_heads * self.head_dim,
+                self.num_key_value_heads * self.head_dim,
+            ],
+            dim=-1,
+        )
 
         if self.rotary_emb is not None:
             query, key = self.rotary_emb(positions, query, key)
@@ -304,7 +321,6 @@ def forward(
 
 @support_torch_compile
 class GraniteMoeHybridModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -315,8 +331,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         lora_config = vllm_config.lora_config
 
         self.config = config
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
 
@@ -329,8 +348,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         def get_layer(prefix: str):
             layer_idx = int(prefix.rsplit(".", 1)[1])
-            layer_class = ALL_DECODER_LAYER_TYPES[
-                config.layer_types[layer_idx]]
+            layer_class = ALL_DECODER_LAYER_TYPES[config.layer_types[layer_idx]]
             return layer_class(
                 config,
                 layer_idx,
@@ -341,10 +359,11 @@ def get_layer(prefix: str):
             )
 
         self.start_layer, self.end_layer, self.layers = make_layers(
-            config.num_hidden_layers, get_layer, prefix=f"{prefix}.layers")
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+            config.num_hidden_layers, get_layer, prefix=f"{prefix}.layers"
+        )
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
@@ -358,7 +377,6 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-
         if get_pp_group().is_first_rank:
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
@@ -368,7 +386,7 @@ def forward(
             residual = None
         else:
             if intermediate_tensors is None:
-                raise RuntimeError('Intermediate tensors may not be None!')
+                raise RuntimeError("Intermediate tensors may not be None!")
             hidden_states = intermediate_tensors["hidden_states"]
             residual = intermediate_tensors["residual"]
 
@@ -376,21 +394,19 @@ def forward(
         for i, layer in enumerate(self.layers):
             if isinstance(layer, GraniteMoeHybridAttentionDecoderLayer):
                 num_attn += 1
-            hidden_states, residual = layer(positions=positions,
-                                            hidden_states=hidden_states,
-                                            residual=residual)
+            hidden_states, residual = layer(
+                positions=positions, hidden_states=hidden_states, residual=residual
+            )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states = self.norm(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv_proj", ".q_proj", "q"),
@@ -402,8 +418,7 @@ def load_weights(self, weights: Iterable[tuple[str,
 
         def _load(n, p):
             param = params_dict[n]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, p)
             loaded_params.add(n)
 
@@ -411,20 +426,14 @@ def _load_shard(n, p, shard_id):
             # Skip layers on other devices.
             if not is_pp_missing_parameter(n, self):
                 param = params_dict[n]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, p, shard_id)
                 loaded_params.add(n)
 
         def _load_expert(n, p, name, shard_id, expert_id):
             param = params_dict[n]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
-            weight_loader(param,
-                          p,
-                          name,
-                          shard_id=shard_id,
-                          expert_id=expert_id)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
+            weight_loader(param, p, name, shard_id=shard_id, expert_id=expert_id)
             loaded_params.add(n)
 
         for n, p in weights:
@@ -437,49 +446,62 @@ def _load_expert(n, p, name, shard_id, expert_id):
             #  to vLLM (experts_w13({e}.w1, {e}.w2), experts_w3({e}.w3), gate)
             # The renaming and parameter loading logic is the same for weight
             # and weight_scale tensors so we can reuse them without issues.
-            if (n.endswith('.block_sparse_moe.input_linear.weight') or
-                    n.endswith('.block_sparse_moe.input_linear.weight_scale')):
+            if n.endswith(".block_sparse_moe.input_linear.weight") or n.endswith(
+                ".block_sparse_moe.input_linear.weight_scale"
+            ):
                 for e in range(p.size(0)):
                     w1_name = n.replace(
-                        '.block_sparse_moe.input_linear.weight',
-                        f".block_sparse_moe.experts.{e}.w1.weight")
+                        ".block_sparse_moe.input_linear.weight",
+                        f".block_sparse_moe.experts.{e}.w1.weight",
+                    )
                     w3_name = n.replace(
-                        '.block_sparse_moe.input_linear.weight',
-                        f".block_sparse_moe.experts.{e}.w3.weight")
+                        ".block_sparse_moe.input_linear.weight",
+                        f".block_sparse_moe.experts.{e}.w3.weight",
+                    )
                     w1_param, w3_param = p[e].chunk(2, dim=0)
-                    _load_expert(n.replace('.input_linear.', '.experts.w13_'),
-                                 w1_param,
-                                 w1_name,
-                                 shard_id='w1',
-                                 expert_id=e)
-                    _load_expert(n.replace('.input_linear.', '.experts.w13_'),
-                                 w3_param,
-                                 w3_name,
-                                 shard_id='w3',
-                                 expert_id=e)
-            elif (n.endswith('.block_sparse_moe.output_linear.weight') or
-                  n.endswith('.block_sparse_moe.output_linear.weight_scale')):
+                    _load_expert(
+                        n.replace(".input_linear.", ".experts.w13_"),
+                        w1_param,
+                        w1_name,
+                        shard_id="w1",
+                        expert_id=e,
+                    )
+                    _load_expert(
+                        n.replace(".input_linear.", ".experts.w13_"),
+                        w3_param,
+                        w3_name,
+                        shard_id="w3",
+                        expert_id=e,
+                    )
+            elif n.endswith(".block_sparse_moe.output_linear.weight") or n.endswith(
+                ".block_sparse_moe.output_linear.weight_scale"
+            ):
                 for e in range(p.size(0)):
                     w2_name = n.replace(
-                        '.block_sparse_moe.output_linear.weight',
-                        f".block_sparse_moe.experts.{e}.w2.weight")
+                        ".block_sparse_moe.output_linear.weight",
+                        f".block_sparse_moe.experts.{e}.w2.weight",
+                    )
                     w2_param = p[e]
-                    _load_expert(n.replace('.output_linear.', '.experts.w2_'),
-                                 w2_param,
-                                 w2_name,
-                                 shard_id='w2',
-                                 expert_id=e)
-            elif n.endswith('.block_sparse_moe.router.layer.weight'):
-                gate_name = n.replace('.block_sparse_moe.router.layer.weight',
-                                      ".block_sparse_moe.gate.weight")
+                    _load_expert(
+                        n.replace(".output_linear.", ".experts.w2_"),
+                        w2_param,
+                        w2_name,
+                        shard_id="w2",
+                        expert_id=e,
+                    )
+            elif n.endswith(".block_sparse_moe.router.layer.weight"):
+                gate_name = n.replace(
+                    ".block_sparse_moe.router.layer.weight",
+                    ".block_sparse_moe.gate.weight",
+                )
                 _load(gate_name, p)
             else:
                 loaded = False
                 for param_name, weight_name, shard_id in stacked_params_mapping:
                     if weight_name in n:
-                        _load_shard(n.replace(weight_name, param_name),
-                                    p,
-                                    shard_id=shard_id)
+                        _load_shard(
+                            n.replace(weight_name, param_name), p, shard_id=shard_id
+                        )
                         loaded = True
                 if not loaded:
                     _load(n, p)
@@ -487,8 +509,9 @@ def _load_expert(n, p, name, shard_id, expert_id):
         return loaded_params
 
 
-class GraniteMoeHybridForCausalLM(nn.Module, HasInnerState, SupportsLoRA,
-                                  SupportsPP, IsHybrid, SupportsQuant):
+class GraniteMoeHybridForCausalLM(
+    nn.Module, HasInnerState, SupportsLoRA, SupportsPP, IsHybrid, SupportsQuant
+):
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -507,7 +530,6 @@ def get_mamba_state_dtype_from_config(
         cls,
         vllm_config: "VllmConfig",
     ) -> tuple[torch.dtype, torch.dtype]:
-
         return MambaStateDtypeCalculator.mamba2_state_dtype(
             vllm_config.model_config.dtype,
             vllm_config.cache_config.mamba_cache_dtype,
@@ -554,9 +576,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.quant_config = vllm_config.quant_config
         self.config = config
         self.scheduler_config = scheduler_config
-        self.model = GraniteMoeHybridModel(vllm_config=vllm_config,
-                                           prefix=maybe_prefix(
-                                               prefix, "model"))
+        self.model = GraniteMoeHybridModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.unpadded_vocab_size = config.vocab_size
         if lora_config:
             self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
@@ -568,31 +590,37 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             padding_size=DEFAULT_VOCAB_PADDING_SIZE
             # We need bigger padding if using lora for kernel
             # compatibility
-            if not lora_config else lora_config.lora_vocab_padding_size,
+            if not lora_config
+            else lora_config.lora_vocab_padding_size,
             quant_config=self.quant_config,
-            prefix=maybe_prefix(prefix, "lm_head"))
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
         if config.tie_word_embeddings:
             self.lm_head.weight = self.model.embed_tokens.weight
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size,
-                                                scale=1 /
-                                                self.config.logits_scaling)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size,
+            config.vocab_size,
+            scale=1 / self.config.logits_scaling,
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs):
-
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs,
+    ):
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
 
         return hidden_states
 
@@ -603,7 +631,6 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/granitemoeshared.py b/vllm/model_executor/models/granitemoeshared.py
index c864856db654..93302821ca68 100644
--- a/vllm/model_executor/models/granitemoeshared.py
+++ b/vllm/model_executor/models/granitemoeshared.py
@@ -5,6 +5,7 @@
 The architecture is the same as granitemoe but with the addition of shared
 experts.
 """
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional
@@ -18,12 +19,17 @@
 from vllm.distributed import get_pp_group
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.sequence import IntermediateTensors
 
 from .granitemoe import GraniteMoeAttention, GraniteMoeModel, GraniteMoeMoE
@@ -32,7 +38,6 @@
 
 
 class GraniteMoeSharedMLP(nn.Module):
-
     def __init__(
         self,
         config: GraniteMoeSharedConfig,
@@ -48,16 +53,20 @@ def __init__(
             output_sizes=[self.hidden_size] * 2,
             bias=False,
             quant_config=quant_config,
-            prefix=f"{prefix}.input_linear")
+            prefix=f"{prefix}.input_linear",
+        )
         self.output_linear = RowParallelLinear(
             self.hidden_size,
             self.input_size,
             bias=False,
             quant_config=quant_config,
-            prefix=f"{prefix}.output_linear")
+            prefix=f"{prefix}.output_linear",
+        )
         if config.hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {config.hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {config.hidden_act}. "
+                "Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
@@ -68,7 +77,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class GraniteMoeSharedDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: GraniteMoeSharedConfig,
@@ -91,26 +99,28 @@ def __init__(
             cache_config=cache_config,
             quant_config=quant_config,
             prefix=f"{prefix}.self_attn",
-            attention_multiplier=config.attention_multiplier)
+            attention_multiplier=config.attention_multiplier,
+        )
         self.block_sparse_moe = GraniteMoeMoE(
             num_experts=config.num_local_experts,
             top_k=config.num_experts_per_tok,
             hidden_size=config.hidden_size,
             intermediate_size=config.intermediate_size,
             quant_config=quant_config,
-            prefix=f"{prefix}.block_sparse_moe")
-        self.shared_mlp = None if \
-            getattr(config, 'shared_intermediate_size', 0) == 0 \
+            prefix=f"{prefix}.block_sparse_moe",
+        )
+        self.shared_mlp = (
+            None
+            if getattr(config, "shared_intermediate_size", 0) == 0
             else GraniteMoeSharedMLP(
-                config,
-                quant_config=quant_config,
-                prefix=f"{prefix}.shared_mlp"
+                config, quant_config=quant_config, prefix=f"{prefix}.shared_mlp"
             )
+        )
 
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
         self.residual_multiplier = config.residual_multiplier
 
@@ -144,7 +154,6 @@ def forward(
 
 @support_torch_compile
 class GraniteMoeSharedModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -156,8 +165,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.config = config
         self.quant_config = quant_config  # Required by MixtralModel
         self.padding_idx = config.pad_token_id
-        lora_vocab = (lora_config.lora_extra_vocab_size *
-                      (lora_config.max_loras or 1)) if lora_config else 0
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
 
@@ -174,7 +186,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             lambda prefix: GraniteMoeSharedDecoderLayer(
                 config, cache_config, quant_config=quant_config, prefix=prefix
             ),
-            prefix=f"{prefix}.layers")
+            prefix=f"{prefix}.layers",
+        )
 
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
@@ -200,40 +213,46 @@ def forward(
         for layer in islice(self.layers, self.start_layer, self.end_layer):
             hidden_states = layer(positions, hidden_states)
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-            })
+            return IntermediateTensors(
+                {
+                    "hidden_states": hidden_states,
+                }
+            )
         hidden_states = self.norm(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         new_weights = {}
         for n, p in weights:
-            if n.endswith('.block_sparse_moe.input_linear.weight'):
+            if n.endswith(".block_sparse_moe.input_linear.weight"):
                 for e in range(p.size(0)):
                     w1_name = n.replace(
-                        '.block_sparse_moe.input_linear.weight',
-                        f".block_sparse_moe.experts.{e}.w1.weight")
+                        ".block_sparse_moe.input_linear.weight",
+                        f".block_sparse_moe.experts.{e}.w1.weight",
+                    )
                     w3_name = n.replace(
-                        '.block_sparse_moe.input_linear.weight',
-                        f".block_sparse_moe.experts.{e}.w3.weight")
+                        ".block_sparse_moe.input_linear.weight",
+                        f".block_sparse_moe.experts.{e}.w3.weight",
+                    )
                     w1_param, w3_param = p[e].chunk(2, dim=0)
                     assert w1_name not in new_weights
                     assert w3_name not in new_weights
                     new_weights[w1_name] = w1_param
                     new_weights[w3_name] = w3_param
-            elif n.endswith('.block_sparse_moe.output_linear.weight'):
+            elif n.endswith(".block_sparse_moe.output_linear.weight"):
                 for e in range(p.size(0)):
                     w2_name = n.replace(
-                        '.block_sparse_moe.output_linear.weight',
-                        f".block_sparse_moe.experts.{e}.w2.weight")
+                        ".block_sparse_moe.output_linear.weight",
+                        f".block_sparse_moe.experts.{e}.w2.weight",
+                    )
                     w2_param = p[e]
                     assert w2_name not in new_weights
                     new_weights[w2_name] = w2_param
-            elif n.endswith('.block_sparse_moe.router.layer.weight'):
-                gate_name = n.replace('.block_sparse_moe.router.layer.weight',
-                                      ".block_sparse_moe.gate.weight")
+            elif n.endswith(".block_sparse_moe.router.layer.weight"):
+                gate_name = n.replace(
+                    ".block_sparse_moe.router.layer.weight",
+                    ".block_sparse_moe.gate.weight",
+                )
                 assert gate_name not in new_weights
                 new_weights[gate_name] = p
             else:
@@ -268,9 +287,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.config = config
         self.lora_config = lora_config
 
-        self.model = GraniteMoeSharedModel(vllm_config=vllm_config,
-                                           prefix=maybe_prefix(
-                                               prefix, "model"))
+        self.model = GraniteMoeSharedModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.unpadded_vocab_size = config.vocab_size
         if lora_config:
             self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
@@ -281,16 +300,19 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             padding_size=DEFAULT_VOCAB_PADDING_SIZE
             # We need bigger padding if using lora for kernel
             # compatibility
-            if not lora_config else lora_config.lora_vocab_padding_size,
+            if not lora_config
+            else lora_config.lora_vocab_padding_size,
             quant_config=quant_config,
-            prefix=maybe_prefix(prefix, "lm_head"))
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
         if config.tie_word_embeddings:
             self.lm_head.weight = self.model.embed_tokens.weight
 
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size,
-                                                scale=1 /
-                                                self.config.logits_scaling)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size,
+            config.vocab_size,
+            scale=1 / self.config.logits_scaling,
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -302,30 +324,29 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
-    def compute_logits(self,
-                       hidden_states: torch.Tensor) -> Optional[torch.Tensor]:
+    def compute_logits(self, hidden_states: torch.Tensor) -> Optional[torch.Tensor]:
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
     def make_empty_intermediate_tensors(
-            self, batch_size: int, dtype: torch.dtype,
-            device: torch.device) -> IntermediateTensors:
-        return IntermediateTensors({
-            "hidden_states":
-            torch.zeros((batch_size, self.config.hidden_size),
-                        dtype=dtype,
-                        device=device),
-        })
-
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+        self, batch_size: int, dtype: torch.dtype, device: torch.device
+    ) -> IntermediateTensors:
+        return IntermediateTensors(
+            {
+                "hidden_states": torch.zeros(
+                    (batch_size, self.config.hidden_size), dtype=dtype, device=device
+                ),
+            }
+        )
+
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/gritlm.py b/vllm/model_executor/models/gritlm.py
index 639d8f620f94..ac78dd9e753a 100644
--- a/vllm/model_executor/models/gritlm.py
+++ b/vllm/model_executor/models/gritlm.py
@@ -9,11 +9,15 @@
 
 from vllm.config import ModelConfig, VllmConfig
 from vllm.logger import init_logger
-from vllm.model_executor.layers.pooler import (DispatchPooler, Pooler,
-                                               PoolerHead, PoolerNormalize,
-                                               PoolingParamsUpdate,
-                                               get_prompt_lens,
-                                               get_prompt_token_ids)
+from vllm.model_executor.layers.pooler import (
+    DispatchPooler,
+    Pooler,
+    PoolerHead,
+    PoolerNormalize,
+    PoolingParamsUpdate,
+    get_prompt_lens,
+    get_prompt_token_ids,
+)
 from vllm.model_executor.models.llama import LlamaForCausalLM
 from vllm.tasks import PoolingTask
 from vllm.transformers_utils.tokenizer import cached_tokenizer_from_config
@@ -47,12 +51,11 @@ def __init__(self, model_config: ModelConfig):
         def tokens_to_ids(tokens: list[str]) -> np.ndarray:
             return np.array([self.token_ids[token] for token in tokens])
 
-        self.user_pattern_ids = tokens_to_ids(
-            ["▁<", "|", "user", "|", ">", "<0x0A>"])
+        self.user_pattern_ids = tokens_to_ids(["▁<", "|", "user", "|", ">", "<0x0A>"])
         self.embed_newline_pattern_ids = tokens_to_ids(
-            ["<0x0A>", "<", "|", "embed", "|", ">", "<0x0A>"])
-        self.embed_pattern_ids = tokens_to_ids(
-            ["▁<", "|", "embed", "|", ">", "<0x0A>"])
+            ["<0x0A>", "<", "|", "embed", "|", ">", "<0x0A>"]
+        )
+        self.embed_pattern_ids = tokens_to_ids(["▁<", "|", "embed", "|", ">", "<0x0A>"])
 
     def _find_array(
         self,
@@ -86,7 +89,7 @@ def _find_array(
             end_idx = arr_len
 
         for i in range(start_idx, min(end_idx, arr_len - target_len + 1)):
-            if (arr[i:i + target_len] == target).all():
+            if (arr[i : i + target_len] == target).all():
                 return i
 
         return -1
@@ -105,31 +108,37 @@ def _get_instruction_len(self, prompt_token_ids: np.ndarray) -> int:
 
         # Return no instruction in case of missing BOS token.
         if prompt_token_ids[0] != self.token_ids["<s>"]:
-            logger.warning("BOS token not found in prompt, "
-                           "thus using empty string for instruction. "
-                           "GritLM requires BOS token in prompt.")
+            logger.warning(
+                "BOS token not found in prompt, "
+                "thus using empty string for instruction. "
+                "GritLM requires BOS token in prompt."
+            )
             return instruction_len
 
         # If user pattern is found in the prompt, that means there should be
         # a newline token before the embed pattern.
         embed_pattern_ids = self.embed_pattern_ids
-        if self._find_array(prompt_token_ids,
-                            self.user_pattern_ids,
-                            start_idx=1,
-                            end_idx=2) == 1:
+        if (
+            self._find_array(
+                prompt_token_ids, self.user_pattern_ids, start_idx=1, end_idx=2
+            )
+            == 1
+        ):
             embed_pattern_ids = self.embed_newline_pattern_ids
 
         # Find the embed pattern in the prompt.
-        found_embed_pattern_idx = self._find_array(prompt_token_ids,
-                                                   embed_pattern_ids,
-                                                   start_idx=1)
+        found_embed_pattern_idx = self._find_array(
+            prompt_token_ids, embed_pattern_ids, start_idx=1
+        )
 
         if found_embed_pattern_idx != -1:
             instruction_len = found_embed_pattern_idx + len(embed_pattern_ids)
         else:
-            logger.warning("Query instruction not found in prompt, "
-                           "thus using BOS token as instruction instead. "
-                           "GritLM requires query instruction in prompt.")
+            logger.warning(
+                "Query instruction not found in prompt, "
+                "thus using BOS token as instruction instead. "
+                "GritLM requires query instruction in prompt."
+            )
             instruction_len = 1
 
         return instruction_len
@@ -146,8 +155,9 @@ def forward_one(
         prompt_len: Optional[torch.Tensor] = None,
         instr_len: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-        assert prompt_len is None or prompt_len == hidden_states.shape[0], \
+        assert prompt_len is None or prompt_len == hidden_states.shape[0], (
             "partial prefill not supported with MEAN pooling"
+        )
 
         return hidden_states[instr_len:].mean(dim=0, dtype=torch.float32)
 
@@ -161,9 +171,11 @@ def forward_all(
         pooled_data = list[torch.Tensor]()
 
         for prompt_len, instr_len in zip(prompt_lens, instr_lens):
-            pooled_data.append(hidden_states[offset + instr_len:offset +
-                                             prompt_len].mean(
-                                                 dim=0, dtype=torch.float32))
+            pooled_data.append(
+                hidden_states[offset + instr_len : offset + prompt_len].mean(
+                    dim=0, dtype=torch.float32
+                )
+            )
             offset += prompt_len
 
         return pooled_data
@@ -184,15 +196,16 @@ def forward(
 
         if isinstance(hidden_states, list):
             return [
-                self.forward_one(h, prompt_len, instr_len) for h, prompt_len,
-                instr_len in zip(hidden_states, prompt_lens, instr_lens)
+                self.forward_one(h, prompt_len, instr_len)
+                for h, prompt_len, instr_len in zip(
+                    hidden_states, prompt_lens, instr_lens
+                )
             ]
 
         return self.forward_all(hidden_states, prompt_lens, instr_lens)
 
 
 class GritLMPooler(Pooler):
-
     def __init__(self, model_config: ModelConfig):
         super().__init__()
 
@@ -254,9 +267,9 @@ def __init__(
 
         pooler_config = vllm_config.model_config.pooler_config
         if pooler_config is not None:
-            self.pooler = DispatchPooler({
-                "encode":
-                Pooler.for_encode(pooler_config),
-                "embed":
-                GritLMPooler(vllm_config.model_config),
-            })
+            self.pooler = DispatchPooler(
+                {
+                    "encode": Pooler.for_encode(pooler_config),
+                    "embed": GritLMPooler(vllm_config.model_config),
+                }
+            )
diff --git a/vllm/model_executor/models/grok1.py b/vllm/model_executor/models/grok1.py
index 996e41fe84ff..f4139685b79f 100644
--- a/vllm/model_executor/models/grok1.py
+++ b/vllm/model_executor/models/grok1.py
@@ -22,6 +22,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Grok1 model."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -36,22 +37,33 @@
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 # Default Grok1-specific constants, overridden by config values if present
 DEFAULT_ATTN_OUTPUT_MULTIPLIER = 0.08838834764831845
@@ -68,37 +80,43 @@ class Grok1MoE(nn.Module):
     across ranks.
     """
 
-    def __init__(self,
-                 num_experts: int,
-                 top_k: int,
-                 hidden_size: int,
-                 intermediate_size: int,
-                 params_dtype: Optional[torch.dtype] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 tp_size: Optional[int] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        num_experts: int,
+        top_k: int,
+        hidden_size: int,
+        intermediate_size: int,
+        params_dtype: Optional[torch.dtype] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        tp_size: Optional[int] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.hidden_size = hidden_size
 
         # Gate always runs at half / full precision for now.
-        self.gate = ReplicatedLinear(hidden_size,
-                                     num_experts,
-                                     bias=False,
-                                     params_dtype=params_dtype,
-                                     quant_config=None,
-                                     prefix=f"{prefix}.gate")
-
-        self.experts = FusedMoE(num_experts=num_experts,
-                                top_k=top_k,
-                                hidden_size=hidden_size,
-                                intermediate_size=intermediate_size,
-                                params_dtype=params_dtype,
-                                reduce_results=True,
-                                renormalize=True,
-                                quant_config=quant_config,
-                                tp_size=tp_size,
-                                activation="gelu",
-                                prefix=f"{prefix}.experts")
+        self.gate = ReplicatedLinear(
+            hidden_size,
+            num_experts,
+            bias=False,
+            params_dtype=params_dtype,
+            quant_config=None,
+            prefix=f"{prefix}.gate",
+        )
+
+        self.experts = FusedMoE(
+            num_experts=num_experts,
+            top_k=top_k,
+            hidden_size=hidden_size,
+            intermediate_size=intermediate_size,
+            params_dtype=params_dtype,
+            reduce_results=True,
+            renormalize=True,
+            quant_config=quant_config,
+            tp_size=tp_size,
+            activation="gelu",
+            prefix=f"{prefix}.experts",
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         # NOTE: hidden_states can have either 1D or 2D shape.
@@ -112,18 +130,17 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class Grok1Attention(nn.Module):
-
     def __init__(
-            self,
-            hidden_size: int,
-            num_heads: int,
-            num_kv_heads: int,
-            max_position: int = 4096 * 32,
-            rope_theta: float = 10000,
-            cache_config: Optional[CacheConfig] = None,
-            quant_config: Optional[QuantizationConfig] = None,
-            prefix: str = "",
-            config=None,  # Added config parameter
+        self,
+        hidden_size: int,
+        num_heads: int,
+        num_kv_heads: int,
+        max_position: int = 4096 * 32,
+        rope_theta: float = 10000,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+        config=None,  # Added config parameter
     ) -> None:
         super().__init__()
         self.hidden_size = hidden_size
@@ -172,19 +189,21 @@ def __init__(
             is_neox_style=True,
         )
 
-        attn_logits_soft_cap = max(
-            getattr(config, "attn_logit_softcapping", 30.0), 0.0)
+        attn_logits_soft_cap = max(getattr(config, "attn_logit_softcapping", 30.0), 0.0)
 
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              logits_soft_cap=attn_logits_soft_cap,
-                              prefix=f"{prefix}.attn")
-        self.attn_multiplier = getattr(self.config, "attn_output_multiplier",
-                                       1.0) if self.config else 1.0
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            logits_soft_cap=attn_logits_soft_cap,
+            prefix=f"{prefix}.attn",
+        )
+        self.attn_multiplier = (
+            getattr(self.config, "attn_output_multiplier", 1.0) if self.config else 1.0
+        )
 
     def forward(
         self,
@@ -201,7 +220,6 @@ def forward(
 
 
 class Grok1DecoderLayer(nn.Module):
-
     def __init__(
         self,
         config,
@@ -214,8 +232,7 @@ def __init__(
         # Check for fp8 quantization
         self.use_fp8 = False
         if quant_config is not None:
-            self.use_fp8 = getattr(quant_config, "is_fp8_w8a8",
-                                   lambda: False)()
+            self.use_fp8 = getattr(quant_config, "is_fp8_w8a8", lambda: False)()
             if not self.use_fp8 and hasattr(quant_config, "is_fp8"):
                 self.use_fp8 = quant_config.is_fp8
 
@@ -231,27 +248,26 @@ def __init__(
             cache_config=cache_config,
             quant_config=quant_config,
             prefix=f"{prefix}.attn",
-            config=config)  # Pass config to Grok1Attention
+            config=config,
+        )  # Pass config to Grok1Attention
 
         # Grok1 uses "num_experts" in its config
         num_experts = getattr(config, "num_experts", 8)
         num_experts_per_tok = getattr(config, "num_experts_per_tok", 2)
 
-        self.moe_block = Grok1MoE(num_experts=num_experts,
-                                  top_k=num_experts_per_tok,
-                                  hidden_size=config.hidden_size,
-                                  intermediate_size=config.intermediate_size,
-                                  quant_config=quant_config,
-                                  prefix=f"{prefix}.moe_block")
-
-        self.pre_attn_norm = RMSNorm(config.hidden_size,
-                                     eps=config.rms_norm_eps)
-        self.post_attn_norm = RMSNorm(config.hidden_size,
-                                      eps=config.rms_norm_eps)
-        self.pre_moe_norm = RMSNorm(config.hidden_size,
-                                    eps=config.rms_norm_eps)
-        self.post_moe_norm = RMSNorm(config.hidden_size,
-                                     eps=config.rms_norm_eps)
+        self.moe_block = Grok1MoE(
+            num_experts=num_experts,
+            top_k=num_experts_per_tok,
+            hidden_size=config.hidden_size,
+            intermediate_size=config.intermediate_size,
+            quant_config=quant_config,
+            prefix=f"{prefix}.moe_block",
+        )
+
+        self.pre_attn_norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attn_norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.pre_moe_norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_moe_norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def forward(
         self,
@@ -264,8 +280,7 @@ def forward(
             residual = hidden_states
             hidden_states = self.pre_attn_norm(hidden_states)
         else:
-            hidden_states, residual = self.pre_attn_norm(
-                hidden_states, residual)
+            hidden_states, residual = self.pre_attn_norm(hidden_states, residual)
 
         hidden_states = self.attn(
             positions=positions,
@@ -285,7 +300,6 @@ def forward(
 
 @support_torch_compile
 class Grok1Model(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -297,13 +311,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.config = config
         self.quant_config = quant_config
         self.padding_idx = config.pad_token_id
-        lora_vocab = (lora_config.lora_extra_vocab_size *
-                      (lora_config.max_loras or 1)) if lora_config else 0
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
         self.embedding_multiplier_scale = getattr(
-            config, "embedding_multiplier_scale",
-            DEFAULT_EMBEDDING_MULTIPLIER_SCALE)
+            config, "embedding_multiplier_scale", DEFAULT_EMBEDDING_MULTIPLIER_SCALE
+        )
 
         self.embed_tokens = VocabParallelEmbedding(
             self.vocab_size,
@@ -317,12 +334,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             lambda prefix: Grok1DecoderLayer(
                 config, cache_config, quant_config=quant_config, prefix=prefix
             ),
-            prefix=f"{prefix}.layers")
+            prefix=f"{prefix}.layers",
+        )
 
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         hidden_states = self.embed_tokens(input_ids)
@@ -351,10 +369,9 @@ def forward(
             hidden_states, residual = layer(positions, hidden_states, residual)
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
@@ -367,10 +384,10 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
             ckpt_gate_proj_name="linear",  # Grok1 specific
             ckpt_down_proj_name="linear_1",  # Grok1 specific
             ckpt_up_proj_name="linear_v",  # Grok1 specific
-            num_experts=num_experts)
+            num_experts=num_experts,
+        )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -382,25 +399,27 @@ def load_weights(self, weights: Iterable[tuple[str,
         loaded_params: set[str] = set()
         expert_params_mapping = self.get_expert_mapping()
         for name, loaded_weight in weights:
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
                 # Skip loading extra bias for GPTQ models.
-                if ((name.endswith(".bias") or name.endswith("_bias"))
-                        and name not in params_dict):
+                if (
+                    name.endswith(".bias") or name.endswith("_bias")
+                ) and name not in params_dict:
                     continue
                 # Skip layers on other devices.
                 if is_pp_missing_parameter(name, self):
@@ -423,21 +442,25 @@ def load_weights(self, weights: Iterable[tuple[str,
                     # Skip layers on other devices.
                     if is_pp_missing_parameter(name, self):
                         continue
-                    if ((name.endswith(".bias") or name.endswith("_bias"))
-                            and name not in params_dict):
+                    if (
+                        name.endswith(".bias") or name.endswith("_bias")
+                    ) and name not in params_dict:
                         continue
                     param = params_dict[name]
                     weight_loader = param.weight_loader
-                    weight_loader(param,
-                                  loaded_weight,
-                                  name,
-                                  shard_id=shard_id,
-                                  expert_id=expert_id)
+                    weight_loader(
+                        param,
+                        loaded_weight,
+                        name,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                    )
                     break
                 else:
                     # Skip loading extra bias for GPTQ models.
-                    if ((name.endswith(".bias") or name.endswith("_bias"))
-                            and name not in params_dict):
+                    if (
+                        name.endswith(".bias") or name.endswith("_bias")
+                    ) and name not in params_dict:
                         continue
                     # Skip layers on other devices.
                     if is_pp_missing_parameter(name, self):
@@ -453,8 +476,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                         name = name.replace("scale", "weight")
 
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -482,8 +506,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.lora_config = lora_config
         self.quant_config = quant_config
 
-        self.model = Grok1Model(vllm_config=vllm_config,
-                                prefix=maybe_prefix(prefix, "model"))
+        self.model = Grok1Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
         self.unpadded_vocab_size = config.vocab_size
         if lora_config:
@@ -502,13 +527,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head.weight = self.model.embed_tokens.weight
 
         self.output_multiplier_scale = getattr(
-            config, "output_multiplier_scale", DEFAULT_OUTPUT_MULTIPLIER_SCALE)
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size,
-                                                self.output_multiplier_scale)
+            config, "output_multiplier_scale", DEFAULT_OUTPUT_MULTIPLIER_SCALE
+        )
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size, self.output_multiplier_scale
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -520,8 +547,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -531,11 +559,9 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         # Skip lm_head when tie_word_embeddings is True
-        skip_prefixes = (["lm_head"]
-                         if self.config.tie_word_embeddings else None)
+        skip_prefixes = ["lm_head"] if self.config.tie_word_embeddings else None
 
         loader = AutoWeightsLoader(
             self,
diff --git a/vllm/model_executor/models/h2ovl.py b/vllm/model_executor/models/h2ovl.py
index b42df3ad8650..d7ee0fd8fd37 100644
--- a/vllm/model_executor/models/h2ovl.py
+++ b/vllm/model_executor/models/h2ovl.py
@@ -18,20 +18,33 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import MultiModalKwargsItems, MultiModalUUIDDict
-from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
-                                   MultiModalDataItems)
-from vllm.multimodal.processing import (MultiModalProcessingInfo,
-                                        PromptReplacement, PromptUpdate,
-                                        PromptUpdateDetails)
+from vllm.multimodal.parse import (
+    ImageEmbeddingItems,
+    ImageProcessorItems,
+    MultiModalDataItems,
+)
+from vllm.multimodal.processing import (
+    MultiModalProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
 from .intern_vit import InternVisionModel
-from .internvl import (IMG_CONTEXT, IMG_END, IMG_START,
-                       BaseInternVLDummyInputsBuilder,
-                       BaseInternVLMultiModalProcessor,
-                       BaseInternVLProcessingInfo, BaseInternVLProcessor,
-                       InternVLChatModel, build_transform,
-                       find_closest_aspect_ratio, get_internvl_target_ratios)
+from .internvl import (
+    IMG_CONTEXT,
+    IMG_END,
+    IMG_START,
+    BaseInternVLDummyInputsBuilder,
+    BaseInternVLMultiModalProcessor,
+    BaseInternVLProcessingInfo,
+    BaseInternVLProcessor,
+    InternVLChatModel,
+    build_transform,
+    find_closest_aspect_ratio,
+    get_internvl_target_ratios,
+)
 
 
 def resolve_h2ovl_min_max_num(
@@ -61,8 +74,10 @@ def get_h2ovl_target_ratios(
     # if prior_aspect_ratio is provided, filter the target ratios
     if prior_aspect_ratio is not None:
         target_ratios = [
-            ratio for ratio in target_ratios if prior_aspect_ratio[0] %
-            ratio[0] != 0 and prior_aspect_ratio[1] % ratio[1] != 0
+            ratio
+            for ratio in target_ratios
+            if prior_aspect_ratio[0] % ratio[0] != 0
+            and prior_aspect_ratio[1] % ratio[1] != 0
         ]
 
     return target_ratios
@@ -207,7 +222,8 @@ def image_to_pixel_values_h2ovl(
         )
         # combine pixel values
         pixel_values = torch.cat(
-            [pixel_values2[:-1], pixel_values1[:-1], pixel_values2[-1:]], 0)
+            [pixel_values2[:-1], pixel_values1[:-1], pixel_values2[-1:]], 0
+        )
 
     else:
         pixel_values, _ = _preprocess_image(
@@ -223,7 +239,6 @@ def image_to_pixel_values_h2ovl(
 
 
 class H2OVLProcessor(BaseInternVLProcessor):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -270,14 +285,18 @@ def resolve_min_max_num(
         dynamic_image_size: Optional[bool] = None,
         use_thumbnail: Optional[bool] = None,
     ) -> tuple[int, int]:
-        min_dynamic_patch = (self.min_dynamic_patch if min_dynamic_patch
-                             is None else min_dynamic_patch)
-        max_dynamic_patch = (self.max_dynamic_patch if max_dynamic_patch
-                             is None else max_dynamic_patch)
-        dynamic_image_size = (self.dynamic_image_size if dynamic_image_size
-                              is None else dynamic_image_size)
-        use_thumbnail = (self.use_thumbnail
-                         if use_thumbnail is None else use_thumbnail)
+        min_dynamic_patch = (
+            self.min_dynamic_patch if min_dynamic_patch is None else min_dynamic_patch
+        )
+        max_dynamic_patch = (
+            self.max_dynamic_patch if max_dynamic_patch is None else max_dynamic_patch
+        )
+        dynamic_image_size = (
+            self.dynamic_image_size
+            if dynamic_image_size is None
+            else dynamic_image_size
+        )
+        use_thumbnail = self.use_thumbnail if use_thumbnail is None else use_thumbnail
 
         return resolve_h2ovl_min_max_num(
             min_dynamic_patch=min_dynamic_patch,
@@ -318,7 +337,7 @@ def get_num_image_tokens(
         image_height: int,
         use_msac: Optional[bool] = None,
     ) -> int:
-        use_msac = (self.use_msac if use_msac is None else use_msac)
+        use_msac = self.use_msac if use_msac is None else use_msac
 
         use_thumbnail = self.use_thumbnail
 
@@ -387,12 +406,12 @@ def _images_to_pixel_values_lst(
                 max_num=max_num,
                 use_thumbnail=self.use_thumbnail,
                 use_msac=use_msac,
-            ) for image in images
+            )
+            for image in images
         ]
 
 
 class H2OVLProcessingInfo(BaseInternVLProcessingInfo):
-
     def get_hf_processor(self, **kwargs: object) -> H2OVLProcessor:
         return self.ctx.init_processor(
             H2OVLProcessor,
@@ -419,9 +438,7 @@ def get_num_image_tokens(
         )
 
 
-class H2OVLMultiModalProcessor(
-        BaseInternVLMultiModalProcessor[H2OVLProcessingInfo]):
-
+class H2OVLMultiModalProcessor(BaseInternVLMultiModalProcessor[H2OVLProcessingInfo]):
     def _get_prompt_updates(
         self,
         mm_items: MultiModalDataItems,
@@ -446,7 +463,8 @@ def _get_prompt_updates(
 
         def get_replacement_internvl(item_idx: int):
             images = mm_items.get_items(
-                "image", (ImageEmbeddingItems, ImageProcessorItems))
+                "image", (ImageEmbeddingItems, ImageProcessorItems)
+            )
 
             if isinstance(images, ImageEmbeddingItems):
                 feature_size = images.get_feature_size(item_idx)
@@ -506,9 +524,9 @@ def _cached_apply_hf_processor(
 @MULTIMODAL_REGISTRY.register_processor(
     H2OVLMultiModalProcessor,
     info=H2OVLProcessingInfo,
-    dummy_inputs=BaseInternVLDummyInputsBuilder)
+    dummy_inputs=BaseInternVLDummyInputsBuilder,
+)
 class H2OVLChatModel(InternVLChatModel):
-
     def _init_vision_model(
         self,
         config: PretrainedConfig,
@@ -520,8 +538,9 @@ def _init_vision_model(
         if not is_mono:
             vision_feature_layer = config.select_layer
             if vision_feature_layer < 0:
-                num_hidden_layers = (config.vision_config.num_hidden_layers +
-                                     vision_feature_layer + 1)
+                num_hidden_layers = (
+                    config.vision_config.num_hidden_layers + vision_feature_layer + 1
+                )
             else:
                 num_hidden_layers = vision_feature_layer + 1
 
diff --git a/vllm/model_executor/models/hunyuan_v1.py b/vllm/model_executor/models/hunyuan_v1.py
index 09f124426fa1..d33406b7be2b 100644
--- a/vllm/model_executor/models/hunyuan_v1.py
+++ b/vllm/model_executor/models/hunyuan_v1.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only HunYuan model compatible with HuggingFace weights."""
+
 import typing
 from collections.abc import Callable, Iterable
 from typing import Any, Optional, Union
@@ -35,29 +36,44 @@
 from vllm.attention import Attention, AttentionType
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig, get_current_vllm_config
-from vllm.distributed import (get_ep_group, get_pp_group,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_reduce)
+from vllm.distributed import (
+    get_ep_group,
+    get_pp_group,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_reduce,
+)
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import MixtureOfExperts, SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, is_pp_missing_parameter,
-                    make_layers, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_layers,
+    maybe_prefix,
+)
 
 
 def _is_moe(config: PretrainedConfig) -> bool:
@@ -80,7 +96,6 @@ def _get_cla_factor(config: PretrainedConfig) -> int:
 
 
 class HunYuanMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -108,8 +123,9 @@ def __init__(
             reduce_results=reduce_results,
         )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -120,7 +136,6 @@ def forward(self, x):
 
 
 class HunYuanAttention(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -204,10 +219,8 @@ def __init__(
         )
 
         if self.use_qk_norm:
-            self.query_layernorm = RMSNorm(self.head_dim,
-                                           eps=config.rms_norm_eps)
-            self.key_layernorm = RMSNorm(self.head_dim,
-                                         eps=config.rms_norm_eps)
+            self.query_layernorm = RMSNorm(self.head_dim, eps=config.rms_norm_eps)
+            self.key_layernorm = RMSNorm(self.head_dim, eps=config.rms_norm_eps)
 
     def forward(
         self,
@@ -221,9 +234,11 @@ def forward(
         ori_k = k
         if self.use_qk_norm:
             q = self.query_layernorm(
-                q.view(-1, self.num_heads, self.head_dim).contiguous())
+                q.view(-1, self.num_heads, self.head_dim).contiguous()
+            )
             k = self.key_layernorm(
-                k.view(-1, self.num_kv_heads, self.head_dim).contiguous())
+                k.view(-1, self.num_kv_heads, self.head_dim).contiguous()
+            )
 
         attn_output = self.attn(q, k, v)
         # For o_proj
@@ -233,7 +248,6 @@ def forward(
 
 
 class HunYuanCrossAttention(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -316,10 +330,8 @@ def __init__(
         )
 
         if self.use_qk_norm:
-            self.query_layernorm = RMSNorm(self.head_dim,
-                                           eps=config.rms_norm_eps)
-            self.key_layernorm = RMSNorm(self.head_dim,
-                                         eps=config.rms_norm_eps)
+            self.query_layernorm = RMSNorm(self.head_dim, eps=config.rms_norm_eps)
+            self.key_layernorm = RMSNorm(self.head_dim, eps=config.rms_norm_eps)
 
     def forward(
         self,
@@ -335,9 +347,11 @@ def forward(
         q, _ = self.rotary_emb(positions, q, k_tmp)
         if self.use_qk_norm:
             q = self.query_layernorm(
-                q.view(-1, self.num_heads, self.head_dim).contiguous())
+                q.view(-1, self.num_heads, self.head_dim).contiguous()
+            )
             k = self.key_layernorm(
-                k.view(-1, self.num_kv_heads, self.head_dim).contiguous())
+                k.view(-1, self.num_kv_heads, self.head_dim).contiguous()
+            )
 
         attn_output = self.attn(q, k, v)
         # For o_proj
@@ -347,7 +361,6 @@ def forward(
 
 
 class HunYuanSparseMoeBlock(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -367,7 +380,8 @@ def __init__(
         if self.tp_size > config.num_experts:
             raise ValueError(
                 f"Tensor parallel size {self.tp_size} is greater than "
-                f"the number of experts {config.num_experts}.")
+                f"the number of experts {config.num_experts}."
+            )
 
         # Get layer_id topk if config.moe_topk is a list
         if isinstance(config.moe_topk, list):
@@ -380,9 +394,11 @@ def __init__(
         # If it is moe, moe_intermediate_size is preferred
         intermediate_size = config.intermediate_size
         if config.moe_intermediate_size is not None:
-            intermediate_size = (config.moe_intermediate_size if isinstance(
-                config.moe_intermediate_size, int) else
-                                 config.moe_intermediate_size[layer_id])
+            intermediate_size = (
+                config.moe_intermediate_size
+                if isinstance(config.moe_intermediate_size, int)
+                else config.moe_intermediate_size[layer_id]
+            )
 
         # Load balancing settings.
         vllm_config = get_current_vllm_config()
@@ -391,13 +407,12 @@ def __init__(
 
         self.n_logical_experts = self.n_routed_experts
         self.n_redundant_experts = eplb_config.num_redundant_experts
-        self.n_physical_experts = (self.n_logical_experts +
-                                   self.n_redundant_experts)
+        self.n_physical_experts = self.n_logical_experts + self.n_redundant_experts
         self.n_local_physical_experts = self.n_physical_experts // self.ep_size
-        self.physical_expert_start = (self.ep_rank *
-                                      self.n_local_physical_experts)
-        self.physical_expert_end = (self.physical_expert_start +
-                                    self.n_local_physical_experts)
+        self.physical_expert_start = self.ep_rank * self.n_local_physical_experts
+        self.physical_expert_end = (
+            self.physical_expert_start + self.n_local_physical_experts
+        )
 
         self.experts = FusedMoE(
             num_experts=self.n_routed_experts,
@@ -412,11 +427,13 @@ def __init__(
             num_redundant_experts=self.n_redundant_experts,
         )
 
-        self.gate = ReplicatedLinear(config.hidden_size,
-                                     config.num_experts,
-                                     bias=False,
-                                     quant_config=None,
-                                     prefix=f"{prefix}.gate")
+        self.gate = ReplicatedLinear(
+            config.hidden_size,
+            config.num_experts,
+            bias=False,
+            quant_config=None,
+            prefix=f"{prefix}.gate",
+        )
         if config.use_mixed_mlp_moe > 0:
             # Get layer_id num_shared_expert if config.num_shared_expert is
             # a list.
@@ -448,19 +465,18 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
         # router_logits: (num_tokens, n_experts)
         router_logits, _ = self.gate(hidden_states)
-        final_hidden_states = self.experts(hidden_states=hidden_states,
-                                           router_logits=router_logits)
+        final_hidden_states = self.experts(
+            hidden_states=hidden_states, router_logits=router_logits
+        )
         if shared_output is not None:
             final_hidden_states = final_hidden_states + shared_output
         if self.tp_size > 1:
-            final_hidden_states = tensor_model_parallel_all_reduce(
-                final_hidden_states)
+            final_hidden_states = tensor_model_parallel_all_reduce(final_hidden_states)
 
         return final_hidden_states.view(orig_shape)
 
 
 class HunYuanDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -474,30 +490,37 @@ def __init__(
         assert layer_id >= 0
         self.layer_id = layer_id
         self.hidden_size = config.hidden_size
-        self.intermediate_size = (config.intermediate_size if isinstance(
-            config.intermediate_size, int) else
-                                  config.intermediate_size[layer_id])
+        self.intermediate_size = (
+            config.intermediate_size
+            if isinstance(config.intermediate_size, int)
+            else config.intermediate_size[layer_id]
+        )
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
         if rope_scaling is not None and getattr(
-                config, "original_max_position_embeddings", None):
+            config, "original_max_position_embeddings", None
+        ):
             rope_scaling["original_max_position_embeddings"] = (
-                config.original_max_position_embeddings)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+                config.original_max_position_embeddings
+            )
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         attention_bias = getattr(config, "attention_bias", False) or getattr(
-            config, "bias", False)
+            config, "bias", False
+        )
         cla_factor = _get_cla_factor(config)
-        attention_type = (AttentionType.ENCODER_DECODER
-                          if layer_id >= 0 and layer_id % cla_factor != 0 else
-                          AttentionType.DECODER)
+        attention_type = (
+            AttentionType.ENCODER_DECODER
+            if layer_id >= 0 and layer_id % cla_factor != 0
+            else AttentionType.DECODER
+        )
         if attention_type == AttentionType.DECODER:
             self.self_attn = HunYuanAttention(
                 config=config,
                 hidden_size=self.hidden_size,
                 num_heads=config.num_attention_heads,
-                num_kv_heads=getattr(config, "num_key_value_heads",
-                                     config.num_attention_heads),
+                num_kv_heads=getattr(
+                    config, "num_key_value_heads", config.num_attention_heads
+                ),
                 rope_theta=rope_theta,
                 rope_scaling=rope_scaling,
                 max_position_embeddings=max_position_embeddings,
@@ -512,8 +535,9 @@ def __init__(
                 config=config,
                 hidden_size=self.hidden_size,
                 num_heads=config.num_attention_heads,
-                num_kv_heads=getattr(config, "num_key_value_heads",
-                                     config.num_attention_heads),
+                num_kv_heads=getattr(
+                    config, "num_key_value_heads", config.num_attention_heads
+                ),
                 rope_theta=rope_theta,
                 rope_scaling=rope_scaling,
                 max_position_embeddings=max_position_embeddings,
@@ -544,10 +568,10 @@ def __init__(
                 prefix=f"{prefix}.mlp",
             )
 
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -561,8 +585,7 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states, ori_kv_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
@@ -570,15 +593,13 @@ def forward(
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual, ori_kv_states
 
 
 @support_torch_compile
 class HunYuanModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -593,12 +614,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.config = config
         self.quant_config = quant_config
         self.padding_idx = config.pad_token_id
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
-        if get_pp_group().is_first_rank or (config.tie_word_embeddings
-                                            and get_pp_group().is_last_rank):
+        if get_pp_group().is_first_rank or (
+            config.tie_word_embeddings and get_pp_group().is_last_rank
+        ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
@@ -656,25 +681,27 @@ def forward(
                 prev_kv_states,
             )
 
-            if (getattr(self.config, "use_cla", False)
-                    and (i - self.start_layer) % cla_factor == 0):
+            if (
+                getattr(self.config, "use_cla", False)
+                and (i - self.start_layer) % cla_factor == 0
+            ):
                 prev_kv_states = kv_states
             else:
                 prev_kv_states = None
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
     def _split_qkv_weight(self, qkv: torch.Tensor):
         num_attention_heads = self.config.num_attention_heads
-        num_kv_heads = getattr(self.config, "num_key_value_heads",
-                               self.config.num_attention_heads)
+        num_kv_heads = getattr(
+            self.config, "num_key_value_heads", self.config.num_attention_heads
+        )
         num_key_value_groups = num_attention_heads // num_kv_heads
         hidden_size = self.config.hidden_size
 
@@ -685,8 +712,9 @@ def _split_qkv_weight(self, qkv: torch.Tensor):
         else:
             attention_head_dim = self.config.hidden_size // num_attention_heads
 
-        qkv = qkv.reshape(num_kv_heads, num_key_value_groups + 2,
-                          attention_head_dim, hidden_size)
+        qkv = qkv.reshape(
+            num_kv_heads, num_key_value_groups + 2, attention_head_dim, hidden_size
+        )
         q, k, v = torch.split(qkv, (num_key_value_groups, 1, 1), dim=1)
         q = q.reshape(-1, hidden_size)
         k = k.reshape(-1, hidden_size)
@@ -719,16 +747,16 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         ]
 
         num_attention_heads = self.config.num_attention_heads
-        num_kv_heads = getattr(self.config, "num_key_value_heads",
-                               self.config.num_attention_heads)
+        num_kv_heads = getattr(
+            self.config, "num_key_value_heads", self.config.num_attention_heads
+        )
         split_params_mapping = [
             (".gate_up_proj", ".gate_and_up_proj", 2, [(1, 1), (0, 1)], None),
             (
                 ".qkv_proj",
                 ".qkv_proj",
                 num_attention_heads + num_kv_heads * 2,
-                [("q", num_attention_heads), ("k", num_kv_heads),
-                 ("v", num_kv_heads)],
+                [("q", num_attention_heads), ("k", num_kv_heads), ("v", num_kv_heads)],
                 self._split_qkv_weight,
             ),
         ]
@@ -743,8 +771,7 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
                 name = name.replace("gate_proj_bias", "gate_proj.bias")
             if "up_proj_bias" in name:
                 name = name.replace("up_proj_bias", "up_proj.bias")
-            if ("rotary_emb.cos_cached" in name
-                    or "rotary_emb.sin_cached" in name):
+            if "rotary_emb.cos_cached" in name or "rotary_emb.sin_cached" in name:
                 # Models trained using ColossalAI may include these tensors in
                 # the checkpoint. Skip them.
                 continue
@@ -754,11 +781,11 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
             if self.config.tie_word_embeddings and "lm_head.weight" in name:
                 continue
             if self.quant_config is not None and (
-                    scale_name := self.quant_config.get_cache_scale(name)):
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache scales for compressed-tensors quantization
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 loaded_weight = loaded_weight[0]
                 weight_loader(param, loaded_weight)
                 continue
@@ -794,11 +821,11 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
                 continue
 
             for (
-                    param_name,
-                    weight_name,
-                    den,
-                    split_param,
-                    func,
+                param_name,
+                weight_name,
+                den,
+                split_param,
+                func,
             ) in split_params_mapping:
                 if weight_name not in name:
                     continue
@@ -819,12 +846,11 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
                 for shard_id, num in split_param:
                     new_offset = offset + num * units
                     if func:
-                        weight_loader(param,
-                                      func(loaded_weight)[offset:new_offset],
-                                      shard_id)
+                        weight_loader(
+                            param, func(loaded_weight)[offset:new_offset], shard_id
+                        )
                     else:
-                        weight_loader(param, loaded_weight[offset:new_offset],
-                                      shard_id)
+                        weight_loader(param, loaded_weight[offset:new_offset], shard_id)
                     offset = new_offset
 
                 break
@@ -850,8 +876,9 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
                     # We should ask the weight loader to return success or not
                     # here since otherwise we may skip experts with other
                     # available replicas.
-                    weight_loader = typing.cast(Callable[..., bool],
-                                                param.weight_loader)
+                    weight_loader = typing.cast(
+                        Callable[..., bool], param.weight_loader
+                    )
                     success = weight_loader(
                         param,
                         loaded_weight,
@@ -881,8 +908,9 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
                         name = name.replace("wg.", "")
 
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -924,9 +952,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 self.lm_head.weight = self.model.embed_tokens.weight
 
             logit_scale = getattr(config, "logit_scale", 1.0)
-            self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                    config.vocab_size,
-                                                    logit_scale)
+            self.logits_processor = LogitsProcessor(
+                self.unpadded_vocab_size, config.vocab_size, logit_scale
+            )
         else:
             self.lm_head = PPMissingLayer()
 
@@ -937,8 +965,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        model_output = self.model(input_ids, positions, intermediate_tensors,
-                                  inputs_embeds)
+        model_output = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return model_output
 
     def compute_logits(
@@ -949,25 +978,23 @@ def compute_logits(
         return logits
 
     def make_empty_intermediate_tensors(
-            self, batch_size: int, dtype: torch.dtype,
-            device: torch.device) -> IntermediateTensors:
-        return IntermediateTensors({
-            "hidden_states":
-            torch.zeros((batch_size, self.config.hidden_size),
-                        dtype=dtype,
-                        device=device),
-            "residual":
-            torch.zeros((batch_size, self.config.hidden_size),
-                        dtype=dtype,
-                        device=device),
-        })
-
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+        self, batch_size: int, dtype: torch.dtype, device: torch.device
+    ) -> IntermediateTensors:
+        return IntermediateTensors(
+            {
+                "hidden_states": torch.zeros(
+                    (batch_size, self.config.hidden_size), dtype=dtype, device=device
+                ),
+                "residual": torch.zeros(
+                    (batch_size, self.config.hidden_size), dtype=dtype, device=device
+                ),
+            }
+        )
+
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
 
@@ -976,7 +1003,6 @@ def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
 
 
 class HunYuanMoEV1Base(HunyuanV1ModelBase, MixtureOfExperts):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(vllm_config=vllm_config, prefix=prefix)
 
@@ -1028,8 +1054,7 @@ def update_physical_experts_metadata(
         assert self.num_local_physical_experts == num_local_physical_experts
         self.num_physical_experts = num_physical_experts
         self.num_local_physical_experts = num_local_physical_experts
-        self.num_redundant_experts = (num_physical_experts -
-                                      self.num_logical_experts)
+        self.num_redundant_experts = num_physical_experts - self.num_logical_experts
         for layer in self.model.layers:
             if isinstance(layer.mlp, HunYuanSparseMoeBlock):
                 moe = layer.mlp
@@ -1043,7 +1068,6 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
 
 
 class HunYuanDenseV1Base(HunyuanV1ModelBase):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(vllm_config=vllm_config, prefix=prefix)
 
@@ -1053,4 +1077,4 @@ class HunYuanDenseV1ForCausalLM(HunYuanDenseV1Base):
 
 
 class HunYuanMoEV1ForCausalLM(HunYuanMoEV1Base):
-    pass
\ No newline at end of file
+    pass
diff --git a/vllm/model_executor/models/hyperclovax_vision.py b/vllm/model_executor/models/hyperclovax_vision.py
index 4d1ab3aad3b4..ab80eb2395b6 100644
--- a/vllm/model_executor/models/hyperclovax_vision.py
+++ b/vllm/model_executor/models/hyperclovax_vision.py
@@ -22,13 +22,19 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.cache import BaseMultiModalProcessorCache
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
 from vllm.multimodal.parse import ImageSize, MultiModalDataItems
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo,
-                                        InputProcessingContext,
-                                        PromptReplacement, PromptUpdate)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    InputProcessingContext,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
@@ -36,8 +42,12 @@
 from .clip import CLIPVisionModel
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
 from .siglip import SiglipVisionModel
-from .utils import (AutoWeightsLoader, flatten_bn, init_vllm_registered_model,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 from .vision import get_vision_encoder_info
 
 EOT = "<|endofturn|>"
@@ -48,8 +58,8 @@
 # Based on combine_frames_into_images in
 # https://huggingface.co/naver-hyperclovax/HyperCLOVAX-SEED-Vision-Instruct-3B/blob/main/processing_hyperclovax.py
 def get_num_combined_frames(
-        num_frames: int,
-        max_grid_shape: tuple[int, int] = (3, 3),
+    num_frames: int,
+    max_grid_shape: tuple[int, int] = (3, 3),
 ) -> int:
     max_num_grids = max_grid_shape[0] * max_grid_shape[1]
 
@@ -69,10 +79,11 @@ class HCXVisionImagePixelInputs(TensorSchema):
         - h: Height
         - w: Width
     """
+
     type: Literal["pixel_values"] = "pixel_values"
     pixel_values_images: Annotated[
-        list[torch.Tensor],
-        TensorShape("n", "g", 3, "h", "w", dynamic_dims={"g"})]
+        list[torch.Tensor], TensorShape("n", "g", 3, "h", "w", dynamic_dims={"g"})
+    ]
     image_sizes_images: Annotated[torch.Tensor, TensorShape("n", 2)]
 
 
@@ -89,17 +100,18 @@ class HCXVisionVideoPixelInputs(TensorSchema):
         - h: Height
         - w: Width
     """
+
     type: Literal["pixel_values_videos"] = "pixel_values_videos"
     pixel_values_videos: Annotated[
         list[list[torch.Tensor]],
-        TensorShape("n", "f", "g", 3, "h", "w", dynamic_dims={"f", "g"})]
+        TensorShape("n", "f", "g", 3, "h", "w", dynamic_dims={"f", "g"}),
+    ]
 
 
 HCXVisionVideoInputs = HCXVisionVideoPixelInputs
 
 
 class HCXVisionProcessingInfo(BaseProcessingInfo):
-
     def get_vision_encoder_info(self):
         return get_vision_encoder_info(self.get_hf_config())
 
@@ -140,15 +152,14 @@ def get_max_image_tokens(self) -> int:
         )
 
 
-class HCXVisionDummyInputsBuilder(
-        BaseDummyInputsBuilder[HCXVisionProcessingInfo]):
-
+class HCXVisionDummyInputsBuilder(BaseDummyInputsBuilder[HCXVisionProcessingInfo]):
     def get_dummy_text(
         self,
         mm_counts: Mapping[str, int],
     ) -> str:
         dummy_text = IMAGE_TOKEN * mm_counts.get(
-            "image", 0) + VIDEO_TOKEN * mm_counts.get("video", 0)
+            "image", 0
+        ) + VIDEO_TOKEN * mm_counts.get("video", 0)
         return dummy_text
 
     def get_dummy_mm_data(
@@ -160,35 +171,30 @@ def get_dummy_mm_data(
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
 
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
         target_num_frames = 32
 
         image_overrides = mm_options.get("image") if mm_options else None
         video_overrides = mm_options.get("video") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(
+            "image": self._get_dummy_images(
                 width=target_width,
                 height=target_height,
                 num_images=num_images,
                 overrides=image_overrides,
             ),
-            "video":
-            self._get_dummy_videos(
+            "video": self._get_dummy_videos(
                 width=target_width - 1,
                 height=target_height - 1,
                 num_frames=target_num_frames,
                 num_videos=num_videos,
                 overrides=video_overrides,
-            )
+            ),
         }
 
 
-class HCXVisionMultiModalProcessor(
-        BaseMultiModalProcessor[HCXVisionProcessingInfo]):
-
+class HCXVisionMultiModalProcessor(BaseMultiModalProcessor[HCXVisionProcessingInfo]):
     def _call_hf_processor(
         self,
         prompt: str,
@@ -230,26 +236,31 @@ def _call_hf_processor(
 
             if images:
                 _processed_outputs["image_sizes_images"] = torch.tensor(
-                    _processed_outputs["image_sizes_images"])
-                _processed_outputs[
-                    "vision_query_lengths_images"] = torch.tensor(
-                        _processed_outputs["vision_query_lengths_images"])
+                    _processed_outputs["image_sizes_images"]
+                )
+                _processed_outputs["vision_query_lengths_images"] = torch.tensor(
+                    _processed_outputs["vision_query_lengths_images"]
+                )
 
             if videos:
                 _idx_per_video = [
-                    0, *accumulate(
-                        get_num_combined_frames(len(video))
-                        for video in videos)
+                    0,
+                    *accumulate(
+                        get_num_combined_frames(len(video)) for video in videos
+                    ),
                 ]
                 _processed_outputs["pixel_values_videos"] = [
-                    _processed_outputs["pixel_values_videos"]
-                    [_idx_per_video[i]:_idx_per_video[i + 1]]
+                    _processed_outputs["pixel_values_videos"][
+                        _idx_per_video[i] : _idx_per_video[i + 1]
+                    ]
                     for i in range(len(videos))
                 ]
                 _processed_outputs["vision_query_lengths_videos"] = [
                     torch.tensor(
-                        _processed_outputs["vision_query_lengths_videos"]
-                        [_idx_per_video[i]:_idx_per_video[i + 1]])
+                        _processed_outputs["vision_query_lengths_videos"][
+                            _idx_per_video[i] : _idx_per_video[i + 1]
+                        ]
+                    )
                     for i in range(len(videos))
                 ]
 
@@ -287,12 +298,10 @@ def get_replacement_hyperclovax(
 
             if modality == "image":
                 lens = out_item["vision_query_lengths_images"].data.tolist()
-                num_tokens = self.info.get_num_image_tokens(
-                    vision_query_length=lens)
+                num_tokens = self.info.get_num_image_tokens(vision_query_length=lens)
             elif modality == "video":
                 lens = out_item["vision_query_lengths_videos"].data.tolist()
-                num_tokens = self.info.get_num_video_tokens(
-                    vision_query_length=lens)
+                num_tokens = self.info.get_num_video_tokens(vision_query_length=lens)
             else:
                 raise NotImplementedError(modality)
 
@@ -309,7 +318,8 @@ def get_replacement_hyperclovax(
                     modality=modality,
                     out_mm_kwargs=out_mm_kwargs,
                 ),
-            ) for modality in ("image", "video")
+            )
+            for modality in ("image", "video")
         ]
 
     def _get_mm_fields_config(
@@ -327,7 +337,8 @@ def _get_mm_fields_config(
 
 
 def _build_hcxvision_hf_info(
-    ctx: InputProcessingContext, ) -> HCXVisionProcessingInfo:
+    ctx: InputProcessingContext,
+) -> HCXVisionProcessingInfo:
     return HCXVisionProcessingInfo(ctx)
 
 
@@ -385,7 +396,6 @@ def init_vision_tower_for_hcxvision(
 
 
 class HCXVisionMlp(nn.Module):
-
     def __init__(
         self,
         mm_projector_type,
@@ -407,8 +417,9 @@ def __init__(
             self.act = act_layer()
             self.fc2 = nn.Linear(2 * hidden_features, out_features)
         else:
-            raise NotImplementedError("{} is not implemented".format(
-                self.mm_projector_type))
+            raise NotImplementedError(
+                "{} is not implemented".format(self.mm_projector_type)
+            )
 
     def forward(self, x):
         x = self.fc1(x)
@@ -420,7 +431,7 @@ def forward(self, x):
 class HCXVisionCAbstractor(nn.Module):
     """
     This module is based on C-Abstractor, whose license is under apache-2.0.
-    You can check the original code at 
+    You can check the original code at
     https://github.com/khanrc/honeybee/blob/main/honeybee/projectors/projectors.py
     and we made necessary modifications.
     """
@@ -442,7 +453,8 @@ def __init__(
         # Positional embedding
         if pos_emb:
             self.pos_emb = torch.nn.Parameter(
-                torch.zeros(1, num_input_tokens, encoder_hidden_size))
+                torch.zeros(1, num_input_tokens, encoder_hidden_size)
+            )
             self.pos_emb.data.normal_(mean=0.0, std=0.02)
         else:
             self.pos_emb = None
@@ -453,8 +465,9 @@ def __init__(
         else:
             self.prenorm = None
 
-        self.build_net(num_queries, encoder_hidden_size, hidden_size,
-                       output_hidden_size)
+        self.build_net(
+            num_queries, encoder_hidden_size, hidden_size, output_hidden_size
+        )
         self.dtype = next(self.parameters()).dtype
 
     def forward(
@@ -491,7 +504,8 @@ def _forward(
         if num_queries_vis_abstractors is not None:
             assert num_grids is not None
             return self._forward_adaptive_num_query(
-                x, num_queries_vis_abstractors, num_grids)
+                x, num_queries_vis_abstractors, num_grids
+            )
 
         x = self.net(x)
         x = rearrange(x, "b d h w -> b (h w) d")
@@ -512,7 +526,7 @@ def _forward_adaptive_num_query(
         for i, num_queries in enumerate(num_queries_vis_abstractors):
             hw = int(num_queries**0.5)
             sampler = nn.AdaptiveAvgPool2d((hw, hw))
-            out = sampler(x[num_grids[i]:num_grids[i + 1], :])
+            out = sampler(x[num_grids[i] : num_grids[i + 1], :])
             out = self.net[2](out)  # s2
 
             out = rearrange(out, "b d h w -> b (h w) d")
@@ -530,8 +544,9 @@ def build_net(
         depth: int = 3,
         mlp_depth: int = 2,
     ):
-        assert (n_queries**0.5).is_integer(
-        ), f"n_queries must be square number. n_queries: {n_queries}"
+        assert (n_queries**0.5).is_integer(), (
+            f"n_queries must be square number. n_queries: {n_queries}"
+        )
         hw = int(n_queries**0.5)
 
         # RegBlock = ResBlock + SE
@@ -556,8 +571,7 @@ def build_net(
         )
 
         self.net = nn.Sequential(s1, sampler, s2)
-        self.readout = self.build_mlp(mlp_depth, hidden_size,
-                                      output_hidden_size)
+        self.readout = self.build_mlp(mlp_depth, hidden_size, output_hidden_size)
 
     def build_mlp(
         self,
@@ -575,13 +589,14 @@ def build_mlp(
 @MULTIMODAL_REGISTRY.register_processor(
     _build_hcxvision_hf_processor,
     info=_build_hcxvision_hf_info,
-    dummy_inputs=HCXVisionDummyInputsBuilder)
+    dummy_inputs=HCXVisionDummyInputsBuilder,
+)
 class HCXVisionForCausalLM(nn.Module, SupportsMultiModal, SupportsPP):
     merge_by_field_config = True
 
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
-        "gate_up_proj": ["gate_proj", "up_proj"]
+        "gate_up_proj": ["gate_proj", "up_proj"],
     }
 
     def __init__(
@@ -611,7 +626,8 @@ def __init__(
 
         ## possible_resolution should be matched with preprocessor_config.json
         config.possible_resolutions = self._init_possible_resolutions(
-            config, vision_config)
+            config, vision_config
+        )
 
         # init models & parameters
         with no_init_weights():  # weight will be loaded in from_pretrained
@@ -622,11 +638,11 @@ def __init__(
                 require_post_norm=False,
                 prefix=maybe_prefix(prefix, "vision_model"),
             )
-        self.mm_projector = self._init_mm_projector(config, text_config,
-                                                    vision_config)
+        self.mm_projector = self._init_mm_projector(config, text_config, vision_config)
 
-        self.lm_head_vocab_size = getattr(text_config, "padded_vocab_size",
-                                          text_config.vocab_size)
+        self.lm_head_vocab_size = getattr(
+            text_config, "padded_vocab_size", text_config.vocab_size
+        )
         self.language_model = init_vllm_registered_model(
             vllm_config=vllm_config,
             hf_config=text_config,
@@ -635,7 +651,8 @@ def __init__(
 
         if config.anyres:
             self.image_newline = nn.Parameter(
-                torch.empty(text_config.hidden_size, dtype=self.dtype))
+                torch.empty(text_config.hidden_size, dtype=self.dtype)
+            )
 
         self.config = config
         self.vision_config = vision_config
@@ -679,7 +696,8 @@ def _parse_and_validate_video_input(
             return None
 
         return HCXVisionVideoPixelInputs(
-            pixel_values_videos=pixel_values_videos, )
+            pixel_values_videos=pixel_values_videos,
+        )
 
     def _process_image_input(
         self,
@@ -695,7 +713,8 @@ def _process_video_input(
         video_input: HCXVisionVideoInputs,
     ) -> tuple[torch.Tensor, ...]:
         return self.forward_videos(
-            pixel_values_videos=video_input["pixel_values_videos"], )
+            pixel_values_videos=video_input["pixel_values_videos"],
+        )
 
     def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         modalities = {}
@@ -703,14 +722,10 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if (input_key == "pixel_values_images"
-                    and "images" not in modalities):
-                modalities["images"] = self._parse_and_validate_image_input(
-                    **kwargs)
-            if (input_key == "pixel_values_videos"
-                    and "videos" not in modalities):
-                modalities["videos"] = self._parse_and_validate_video_input(
-                    **kwargs)
+            if input_key == "pixel_values_images" and "images" not in modalities:
+                modalities["images"] = self._parse_and_validate_image_input(**kwargs)
+            if input_key == "pixel_values_videos" and "videos" not in modalities:
+                modalities["videos"] = self._parse_and_validate_video_input(**kwargs)
 
         return modalities
 
@@ -754,10 +769,9 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.language_model.model(input_ids,
-                                                  positions,
-                                                  intermediate_tensors,
-                                                  inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
         return hidden_states
 
     def forward_images(
@@ -768,24 +782,21 @@ def forward_images(
         pixel_values_image_flat = flatten_bn(pixel_values_images, concat=True)
 
         visual_token_idx = 0 if "siglip" in self.vision_config.model_type else 1
-        image_forward_outs = self.vision_model(
-            pixel_values_image_flat)[:, visual_token_idx:]
+        image_forward_outs = self.vision_model(pixel_values_image_flat)[
+            :, visual_token_idx:
+        ]
 
-        image_forward_outs = image_forward_outs.to(
-            dtype=self.mm_projector.dtype)
+        image_forward_outs = image_forward_outs.to(dtype=self.mm_projector.dtype)
         image_forward_outs = self.mm_projector(image_forward_outs)  # b (h w) d
 
         split_sizes = [len(item) for item in pixel_values_images]
-        image_forward_outs = torch.split(image_forward_outs,
-                                         split_sizes,
-                                         dim=0)
+        image_forward_outs = torch.split(image_forward_outs, split_sizes, dim=0)
 
         # newline for anyres postprocessing
         image_features = anyres_postprocessing(
             image_forward_outs=image_forward_outs,
             image_sizes=image_sizes_images.tolist(),
-            num_queries_vis_abstractor=self.config.
-            num_queries_vis_abstractor_image,
+            num_queries_vis_abstractor=self.config.num_queries_vis_abstractor_image,
             unpad=self.config.unpad,
             patch_size=self.vision_config.patch_size,
             grid_size=self.vision_config.image_size,
@@ -805,11 +816,11 @@ def forward_videos(
         )
 
         visual_token_idx = 0 if "siglip" in self.vision_config.model_type else 1
-        video_forward_outs = self.vision_model(
-            pixel_values_videos_flat)[:, visual_token_idx:]
+        video_forward_outs = self.vision_model(pixel_values_videos_flat)[
+            :, visual_token_idx:
+        ]
 
-        video_forward_outs = video_forward_outs.to(
-            dtype=self.mm_projector.dtype)
+        video_forward_outs = video_forward_outs.to(dtype=self.mm_projector.dtype)
 
         # Run MM-Projector
         # len(num_grids) == len(num_queries_vis_abstractors) + 1
@@ -817,8 +828,7 @@ def forward_videos(
         num_grids = [
             grid_idx
         ]  # e.g. [0, 9, 18, 19, 27, 28, 36, 37, 45, 46, 54, 55, 56]
-        num_queries_vis_abstractors = [
-        ]  # e.g. [81, 81, 81, 9, 81, 9, 81, 9, 81, 9, 81, 9]
+        num_queries_vis_abstractors = []  # e.g. [81, 81, 81, 9, 81, 9, 81, 9, 81, 9, 81, 9]
         len_total_frames = video_forward_outs.shape[0]
 
         if self.config.first_last_frames_slow:
@@ -826,22 +836,26 @@ def forward_videos(
             assert len_total_frames != 0
             if len_total_frames <= 2:
                 num_queries_vis_abstractors.append(
-                    self.config.num_queries_vis_abstractor_video_slow)
+                    self.config.num_queries_vis_abstractor_video_slow
+                )
                 grid_idx += len_total_frames
                 num_grids.append(grid_idx)
             else:
                 num_queries_vis_abstractors.append(
-                    self.config.num_queries_vis_abstractor_video_slow)
+                    self.config.num_queries_vis_abstractor_video_slow
+                )
                 grid_idx += 1
                 num_grids.append(grid_idx)
 
                 num_queries_vis_abstractors.append(
-                    self.config.num_queries_vis_abstractor_video_fast)
+                    self.config.num_queries_vis_abstractor_video_fast
+                )
                 grid_idx += len_total_frames - 2
                 num_grids.append(grid_idx)
 
                 num_queries_vis_abstractors.append(
-                    self.config.num_queries_vis_abstractor_video_slow)
+                    self.config.num_queries_vis_abstractor_video_slow
+                )
                 grid_idx += 1
                 num_grids.append(grid_idx)
         else:
@@ -850,17 +864,19 @@ def forward_videos(
                 for pixel_values_frame in pixel_values_frames:
                     if len(pixel_values_frame) > 0:
                         num_queries_vis_abstractors.append(
-                            self.config.num_queries_vis_abstractor_video_slow)
+                            self.config.num_queries_vis_abstractor_video_slow
+                        )
                         grid_idx += 1
                         num_grids.append(grid_idx)
                         num_queries_vis_abstractors.append(
-                            self.config.num_queries_vis_abstractor_video_fast)
+                            self.config.num_queries_vis_abstractor_video_fast
+                        )
                         grid_idx = grid_idx + len(pixel_values_frame) - 1
                         num_grids.append(grid_idx)
 
-        video_forward_outs = self.mm_projector(video_forward_outs,
-                                               num_queries_vis_abstractors,
-                                               num_grids)
+        video_forward_outs = self.mm_projector(
+            video_forward_outs, num_queries_vis_abstractors, num_grids
+        )
 
         video_features = []  # what we want to return
         target_features = []
@@ -882,18 +898,19 @@ def forward_videos(
                 target_group_size = 0
 
             elif video_group_size < target_group_size:
-                raise RuntimeError(
-                    f"{video_group_size=} < {target_group_size=}")
+                raise RuntimeError(f"{video_group_size=} < {target_group_size=}")
 
-        assert len(target_features
-                   ) == 0, f"target_features is not empty!! {target_features}"
+        assert len(target_features) == 0, (
+            f"target_features is not empty!! {target_features}"
+        )
         assert len(video_groups) == len(video_features)
 
         feats_per_video = [len(video) for video in pixel_values_videos]
         idxs_per_video = [0, *accumulate(feats_per_video)]
         return tuple(
-            torch.cat(video_features[idxs_per_video[i]:idxs_per_video[i + 1]])
-            for i in range(len(feats_per_video)))
+            torch.cat(video_features[idxs_per_video[i] : idxs_per_video[i + 1]])
+            for i in range(len(feats_per_video))
+        )
 
     def _prepare_multimodal_kwargs(self, **kwargs: object):
         output = defaultdict(list)
@@ -902,7 +919,7 @@ def _prepare_multimodal_kwargs(self, **kwargs: object):
                 continue  # if empty batch of empty sample
 
             new_k, is_video = k, False
-            if (not k.endswith("_images") and not k.endswith("_videos")):
+            if not k.endswith("_images") and not k.endswith("_videos"):
                 pass
             else:
                 new_k, is_video = k.split("_")[:-1], k.split("_")[-1]
@@ -955,10 +972,10 @@ def _init_possible_resolutions(
                         if i * j <= config.max_num_grids:
                             possible_resolutions.append([i, j])
 
-                possible_resolutions = [[
-                    ys * vision_config.image_size,
-                    xs * vision_config.image_size
-                ] for ys, xs in possible_resolutions]
+                possible_resolutions = [
+                    [ys * vision_config.image_size, xs * vision_config.image_size]
+                    for ys, xs in possible_resolutions
+                ]
             return possible_resolutions
         else:
             return config.possible_resolutions
@@ -971,14 +988,13 @@ def _init_mm_projector(
     ):
         input_hidden_size = vision_config.hidden_size
         if config.mm_projector_type == "linear":
-            mm_projector = nn.Linear(input_hidden_size,
-                                     text_config.hidden_size)
+            mm_projector = nn.Linear(input_hidden_size, text_config.hidden_size)
             mm_projector.dtype = next(mm_projector.parameters()).dtype
         elif config.mm_projector_type == "cabstractor":
             mm_projector = HCXVisionCAbstractor(
                 num_queries=config.num_queries_vis_abstractor_image,
-                num_input_tokens=(vision_config.image_size //
-                                  vision_config.patch_size)**2,
+                num_input_tokens=(vision_config.image_size // vision_config.patch_size)
+                ** 2,
                 encoder_hidden_size=input_hidden_size,
                 hidden_size=input_hidden_size,
                 output_hidden_size=text_config.hidden_size,
@@ -995,8 +1011,7 @@ def _init_mm_projector(
         return mm_projector
 
 
-def unpad_image(tensor: torch.Tensor,
-                original_size: tuple[int, int]) -> torch.Tensor:
+def unpad_image(tensor: torch.Tensor, original_size: tuple[int, int]) -> torch.Tensor:
     original_width, original_height = original_size
     current_height, current_width = tensor.shape[1:]
 
@@ -1007,18 +1022,17 @@ def unpad_image(tensor: torch.Tensor,
         scale_factor = current_width / original_width
         new_height = int(original_height * scale_factor)
         padding = (current_height - new_height) // 2
-        unpadded_tensor = tensor[:, padding:current_height - padding, :]
+        unpadded_tensor = tensor[:, padding : current_height - padding, :]
     else:
         scale_factor = current_height / original_height
         new_width = int(original_width * scale_factor)
         padding = (current_width - new_width) // 2
-        unpadded_tensor = tensor[:, :, padding:current_width - padding]
+        unpadded_tensor = tensor[:, :, padding : current_width - padding]
 
     return unpadded_tensor
 
 
-def select_best_resolution(original_size: tuple,
-                           possible_resolutions: list) -> tuple:
+def select_best_resolution(original_size: tuple, possible_resolutions: list) -> tuple:
     original_height, original_width = original_size
     best_fit = None
     max_effective_resolution = 0
@@ -1026,15 +1040,19 @@ def select_best_resolution(original_size: tuple,
 
     for height, width in possible_resolutions:
         scale = min(width / original_width, height / original_height)
-        downscaled_width, downscaled_height = int(original_width * scale), int(
-            original_height * scale)
-        effective_resolution = min(downscaled_width * downscaled_height,
-                                   original_width * original_height)
+        downscaled_width, downscaled_height = (
+            int(original_width * scale),
+            int(original_height * scale),
+        )
+        effective_resolution = min(
+            downscaled_width * downscaled_height, original_width * original_height
+        )
         wasted_resolution = (width * height) - effective_resolution
 
         if effective_resolution > max_effective_resolution or (
-                effective_resolution == max_effective_resolution
-                and wasted_resolution < min_wasted_resolution):
+            effective_resolution == max_effective_resolution
+            and wasted_resolution < min_wasted_resolution
+        ):
             max_effective_resolution = effective_resolution
             min_wasted_resolution = wasted_resolution
             best_fit = (height, width)
@@ -1047,12 +1065,16 @@ def get_anyres_image_grid_shape(
     grid_pinpoints: Union[str, list[tuple[int, int]]],
     patch_size: int,
 ) -> tuple[int, int]:
-    possible_resolutions = grid_pinpoints if isinstance(
-        grid_pinpoints, list) else ast.literal_eval(grid_pinpoints)
+    possible_resolutions = (
+        grid_pinpoints
+        if isinstance(grid_pinpoints, list)
+        else ast.literal_eval(grid_pinpoints)
+    )
 
     original_width, original_height = image_size
-    height, width = select_best_resolution((original_height, original_width),
-                                           possible_resolutions)
+    height, width = select_best_resolution(
+        (original_height, original_width), possible_resolutions
+    )
     return width // patch_size, height // patch_size
 
 
@@ -1070,12 +1092,15 @@ def reshape_and_unpad_image_features(
     image_feature = image_feature[1:]
 
     assert height * width == base_image_feature.shape[0], (
-        f"{height=} * {width=} != {base_image_feature.shape[0]=}")
+        f"{height=} * {width=} != {base_image_feature.shape[0]=}"
+    )
 
     num_patch_width, num_patch_height = get_anyres_image_grid_shape(
-        image_size, possible_resolutions, grid_size)
-    image_feature = image_feature.view(num_patch_height, num_patch_width,
-                                       height, width, -1)
+        image_size, possible_resolutions, grid_size
+    )
+    image_feature = image_feature.view(
+        num_patch_height, num_patch_width, height, width, -1
+    )
 
     if unpad:
         image_feature = image_feature.permute(4, 0, 2, 1, 3).contiguous()
@@ -1084,8 +1109,9 @@ def reshape_and_unpad_image_features(
         image_feature = torch.cat(
             (
                 image_feature,
-                image_newline[:, None, None].expand(
-                    *image_feature.shape[:-1], 1).to(image_feature.device),
+                image_newline[:, None, None]
+                .expand(*image_feature.shape[:-1], 1)
+                .to(image_feature.device),
             ),
             dim=-1,
         )
@@ -1111,8 +1137,9 @@ def anyres_postprocessing(
     height = width = grid_size // patch_size
 
     if num_queries_vis_abstractor > 0:
-        assert (num_queries_vis_abstractor**0.5
-                ).is_integer(), "n_queries must be square number"
+        assert (num_queries_vis_abstractor**0.5).is_integer(), (
+            "n_queries must be square number"
+        )
         height = width = int(num_queries_vis_abstractor**0.5)
 
     # post-processing (unpad, add newline)
@@ -1132,8 +1159,8 @@ def anyres_postprocessing(
         else:
             image_feature = image_feature[0]
             image_feature = torch.cat(
-                (image_feature, image_newline[None].to(image_feature.device)),
-                dim=0)
+                (image_feature, image_newline[None].to(image_feature.device)), dim=0
+            )
         new_image_features.append(image_feature)
 
     return new_image_features
diff --git a/vllm/model_executor/models/idefics2_vision_model.py b/vllm/model_executor/models/idefics2_vision_model.py
index 2f0c4240413b..02c46a11a179 100644
--- a/vllm/model_executor/models/idefics2_vision_model.py
+++ b/vllm/model_executor/models/idefics2_vision_model.py
@@ -24,14 +24,18 @@
 import torch
 from torch import nn
 from transformers.models.idefics2.configuration_idefics2 import (
-    Idefics2Config, Idefics2VisionConfig)
+    Idefics2Config,
+    Idefics2VisionConfig,
+)
 
 from vllm.attention.layer import MultiHeadAttention
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 
@@ -67,13 +71,14 @@ def __init__(self, config: Idefics2VisionConfig):
         self.num_patches_per_side = self.image_size // self.patch_size
         self.num_patches = self.num_patches_per_side**2
         self.num_positions = self.num_patches
-        self.position_embedding = nn.Embedding(self.num_positions,
-                                               self.embed_dim)
+        self.position_embedding = nn.Embedding(self.num_positions, self.embed_dim)
 
-    def forward(self,
-                pixel_values: torch.FloatTensor,
-                patch_attention_mask: torch.BoolTensor,
-                tgt_sizes: Optional[torch.IntTensor] = None) -> torch.Tensor:
+    def forward(
+        self,
+        pixel_values: torch.FloatTensor,
+        patch_attention_mask: torch.BoolTensor,
+        tgt_sizes: Optional[torch.IntTensor] = None,
+    ) -> torch.Tensor:
         batch_size, _, max_im_h, max_im_w = pixel_values.shape
         target_dtype = self.patch_embedding.weight.dtype
         patch_embeds = self.patch_embedding(pixel_values.to(target_dtype))
@@ -82,14 +87,14 @@ def forward(self,
             max_im_h // self.patch_size,
             max_im_w // self.patch_size,
         )
-        boundaries = torch.arange(1 / self.num_patches_per_side, 1.0,
-                                  1 / self.num_patches_per_side)
-        position_ids = torch.full(size=(batch_size,
-                                        max_nb_patches_h * max_nb_patches_w),
-                                  fill_value=0)
+        boundaries = torch.arange(
+            1 / self.num_patches_per_side, 1.0, 1 / self.num_patches_per_side
+        )
+        position_ids = torch.full(
+            size=(batch_size, max_nb_patches_h * max_nb_patches_w), fill_value=0
+        )
 
         for batch_idx, p_attn_mask in enumerate(patch_attention_mask):
-
             if tgt_sizes is not None:
                 nb_patches_h = tgt_sizes[batch_idx][0]
                 nb_patches_w = tgt_sizes[batch_idx][1]
@@ -98,14 +103,15 @@ def forward(self,
                 nb_patches_w = p_attn_mask[0].sum()
             fractional_coords_h = torch.arange(0, 1 - 1e-6, 1 / nb_patches_h)
             fractional_coords_w = torch.arange(0, 1 - 1e-6, 1 / nb_patches_w)
-            bucket_coords_h = torch.bucketize(fractional_coords_h,
-                                              boundaries,
-                                              right=True)
-            bucket_coords_w = torch.bucketize(fractional_coords_w,
-                                              boundaries,
-                                              right=True)
-            pos_ids = (bucket_coords_h[:, None] * self.num_patches_per_side +
-                       bucket_coords_w).flatten()
+            bucket_coords_h = torch.bucketize(
+                fractional_coords_h, boundaries, right=True
+            )
+            bucket_coords_w = torch.bucketize(
+                fractional_coords_w, boundaries, right=True
+            )
+            pos_ids = (
+                bucket_coords_h[:, None] * self.num_patches_per_side + bucket_coords_w
+            ).flatten()
             position_ids[batch_idx][p_attn_mask.view(-1).cpu()] = pos_ids
         position_ids = position_ids.to(self.position_embedding.weight.device)
         embeddings += self.position_embedding(position_ids)
@@ -130,12 +136,12 @@ def __init__(
         if self.head_dim * self.num_heads != self.embed_dim:
             raise ValueError(
                 f"embed_dim must be divisible by num_heads (got `embed_dim`: {self.embed_dim} and `num_heads`:"  # noqa: E501
-                f" {self.num_heads}).")
+                f" {self.num_heads})."
+            )
         self.scale = self.head_dim**-0.5
         self.dropout = config.attention_dropout
 
-        tp_size = (1 if use_data_parallel else
-                   get_tensor_model_parallel_world_size())
+        tp_size = 1 if use_data_parallel else get_tensor_model_parallel_world_size()
         assert self.num_heads % tp_size == 0
         self.num_heads_per_partition = self.num_heads // tp_size
 
@@ -156,8 +162,9 @@ def __init__(
             disable_tp=use_data_parallel,
         )
         # Use unified MultiHeadAttention with Flash Attention support
-        self.attn = MultiHeadAttention(self.num_heads_per_partition,
-                                       self.head_dim, self.scale)
+        self.attn = MultiHeadAttention(
+            self.num_heads_per_partition, self.head_dim, self.scale
+        )
 
     def forward(
         self,
@@ -175,7 +182,6 @@ def forward(
 
 
 class Idefics2VisionMLP(nn.Module):
-
     def __init__(
         self,
         config: Idefics2VisionConfig,
@@ -211,7 +217,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class Idefics2EncoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Idefics2Config,
@@ -225,15 +230,16 @@ def __init__(
             config,
             quant_config=quant_config,
             prefix=f"{prefix}.self_attn",
-            use_data_parallel=use_data_parallel)
-        self.layer_norm1 = nn.LayerNorm(self.embed_dim,
-                                        eps=config.layer_norm_eps)
-        self.mlp = Idefics2VisionMLP(config,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.mlp",
-                                     use_data_parallel=use_data_parallel)
-        self.layer_norm2 = nn.LayerNorm(self.embed_dim,
-                                        eps=config.layer_norm_eps)
+            use_data_parallel=use_data_parallel,
+        )
+        self.layer_norm1 = nn.LayerNorm(self.embed_dim, eps=config.layer_norm_eps)
+        self.mlp = Idefics2VisionMLP(
+            config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.mlp",
+            use_data_parallel=use_data_parallel,
+        )
+        self.layer_norm2 = nn.LayerNorm(self.embed_dim, eps=config.layer_norm_eps)
 
     def forward(
         self,
@@ -284,13 +290,17 @@ def __init__(
         else:
             num_hidden_layers = num_hidden_layers_override
 
-        self.layers = nn.ModuleList([
-            Idefics2EncoderLayer(config,
-                                 quant_config=quant_config,
-                                 prefix=f"{prefix}.layers.{layer_idx}",
-                                 use_data_parallel=use_data_parallel)
-            for layer_idx in range(num_hidden_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                Idefics2EncoderLayer(
+                    config,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.layers.{layer_idx}",
+                    use_data_parallel=use_data_parallel,
+                )
+                for layer_idx in range(num_hidden_layers)
+            ]
+        )
 
     def forward(
         self,
@@ -313,7 +323,6 @@ def forward(
 
 
 class Idefics2VisionTransformer(nn.Module):
-
     def __init__(
         self,
         config: Idefics2VisionConfig,
@@ -335,7 +344,8 @@ def __init__(
             quant_config=quant_config,
             num_hidden_layers_override=num_hidden_layers_override,
             prefix=f"{prefix}.encoder",
-            use_data_parallel=use_data_parallel)
+            use_data_parallel=use_data_parallel,
+        )
 
         num_hidden_layers = config.num_hidden_layers
         if len(self.encoder.layers) > config.num_hidden_layers:
@@ -345,10 +355,14 @@ def __init__(
             )
 
         self.require_post_norm = require_post_norm
-        self.post_layernorm = nn.LayerNorm(
-            embed_dim,
-            eps=config.layer_norm_eps,
-        ) if require_post_norm else nn.Identity()
+        self.post_layernorm = (
+            nn.LayerNorm(
+                embed_dim,
+                eps=config.layer_norm_eps,
+            )
+            if require_post_norm
+            else nn.Identity()
+        )
 
     def get_input_embeddings(self):
         return self.embeddings
@@ -365,15 +379,13 @@ def forward(
             tgt_sizes=tgt_sizes,
         )
         if self.use_data_parallel:
-            encoder_outputs = run_dp_sharded_vision_model(
-                hidden_states, self.encoder)
+            encoder_outputs = run_dp_sharded_vision_model(hidden_states, self.encoder)
         else:
             encoder_outputs = self.encoder(hidden_states)
         last_hidden_state = self.post_layernorm(encoder_outputs)
         return last_hidden_state
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -390,8 +402,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 continue
 
             # post_layernorm is optional
-            if (name.startswith("post_layernorm.")
-                    and not self.require_post_norm):
+            if name.startswith("post_layernorm.") and not self.require_post_norm:
                 continue
 
             # omit layers when num_hidden_layers_override is set
@@ -410,8 +421,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
diff --git a/vllm/model_executor/models/idefics3.py b/vllm/model_executor/models/idefics3.py
index 5e69c10b4024..ec18507465e7 100644
--- a/vllm/model_executor/models/idefics3.py
+++ b/vllm/model_executor/models/idefics3.py
@@ -22,8 +22,12 @@
 
 import torch
 from torch import nn
-from transformers import (BatchFeature, Idefics3Config, Idefics3ImageProcessor,
-                          Idefics3Processor)
+from transformers import (
+    BatchFeature,
+    Idefics3Config,
+    Idefics3ImageProcessor,
+    Idefics3Processor,
+)
 
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
@@ -33,15 +37,24 @@
 from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
 from vllm.multimodal.parse import ImageProcessorItems, ImageSize
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo,
-                                        MultiModalDataItems, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    MultiModalDataItems,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
+
 # yapf: enable
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
@@ -49,7 +62,9 @@
 
 # yapf: disable
 from .idefics2_vision_model import (
-    Idefics2VisionTransformer as Idefics3VisionTransformer)
+    Idefics2VisionTransformer as Idefics3VisionTransformer,
+)
+
 # yapf: enable
 from .interfaces import MultiModalEmbeddings, SupportsLoRA, SupportsMultiModal
 from .llama import LlamaModel
@@ -65,6 +80,7 @@ class Idefics3ImagePixelInputs(TensorSchema):
         - h: Height
         - w: Width
     """
+
     type: Literal["pixel_values"]
     pixel_values: Annotated[torch.Tensor, TensorShape("bnp", 3, "h", "w")]
     pixel_attention_mask: Annotated[torch.Tensor, TensorShape("bnp", "h", "w")]
@@ -78,6 +94,7 @@ class Idefics3ImageEmbeddingInputs(TensorSchema):
         - f: Image feature size
         - h: Hidden size (must match the hidden size of language model backbone)
     """
+
     type: Literal["image_embeds"]
     data: Annotated[torch.Tensor, TensorShape("bn", "f", "h")]
 
@@ -86,20 +103,21 @@ class Idefics3ImageEmbeddingInputs(TensorSchema):
 
 
 class Idefics3ProcessingInfo(BaseProcessingInfo):
-
     def get_hf_processor(self, **kwargs: object) -> Idefics3Processor:
         return self.ctx.get_hf_processor(Idefics3Processor, **kwargs)
 
     def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
         return {"image": None}
 
-    def _resize_output_size(self,
-                            *,
-                            height: int,
-                            width: int,
-                            max_len: Optional[int] = None,
-                            min_len: int = 1,
-                            max_size: Optional[int] = None) -> tuple[int, int]:
+    def _resize_output_size(
+        self,
+        *,
+        height: int,
+        width: int,
+        max_len: Optional[int] = None,
+        min_len: int = 1,
+        max_size: Optional[int] = None,
+    ) -> tuple[int, int]:
         # Set default value for max_len if not provided
         max_len = max(height, width) if max_len is None else max_len
         aspect_ratio = width / height
@@ -135,18 +153,19 @@ def _get_resize_output_image_size(
     ) -> tuple[int, int]:
         hf_processor = self.get_hf_processor()
         image_processor: Idefics3ImageProcessor = hf_processor.image_processor
-        max_image_size = image_processor.size['longest_edge']
+        max_image_size = image_processor.size["longest_edge"]
         if resolution_max_side > max_image_size:
             raise ValueError(
-                "`resolution_max_side` cannot be larger than `max_image_size`")
+                "`resolution_max_side` cannot be larger than `max_image_size`"
+            )
 
         height, width = image_height, image_width
 
         # Find the output size, when rescaling the longest edge to max_len and
         # preserving the aspect ratio
-        height, width = self._resize_output_size(height=height,
-                                                 width=width,
-                                                 max_len=resolution_max_side)
+        height, width = self._resize_output_size(
+            height=height, width=width, max_len=resolution_max_side
+        )
         return height, width
 
     def _get_image_feature_grid_size(
@@ -161,12 +180,13 @@ def _get_image_feature_grid_size(
 
         image_processor: Idefics3ImageProcessor = processor.image_processor
 
-        max_image_size = image_processor.max_image_size['longest_edge']
-        size = image_processor.size['longest_edge']
+        max_image_size = image_processor.max_image_size["longest_edge"]
+        size = image_processor.size["longest_edge"]
         assert size % max_image_size == 0, (
             "`longest_edge` in image_processor's `size` must be divisible by "
             "`longest_edge` in `max_image_size`, this may be caused by "
-            "incorrect mm_kwargs override.")
+            "incorrect mm_kwargs override."
+        )
 
         resized_height, resized_width = self._get_resize_output_image_size(
             image_width=image_width,
@@ -196,8 +216,8 @@ def get_num_patches(
         return grid_w * grid_h + 1
 
     def _get_image_token(
-            self,
-            processor: Optional[Idefics3Processor]) -> tuple[str, str, str]:
+        self, processor: Optional[Idefics3Processor]
+    ) -> tuple[str, str, str]:
         if processor is None:
             processor = self.get_hf_processor()
 
@@ -217,7 +237,8 @@ def get_image_repl(
             processor = self.get_hf_processor()
 
         image_token, fake_image_token, global_img_token = self._get_image_token(
-            processor)
+            processor
+        )
         image_seq_len = processor.image_seq_len
         grid_placeholder = "<row_{n_h}_col_{n_w}>"
 
@@ -236,19 +257,20 @@ def get_image_repl(
         tiles_placeholder = list[str]()
         for i in range(grid_h):
             for j in range(grid_w):
-                placeholder_per_tile = tile_img_placeholder.format(n_h=i + 1,
-                                                                   n_w=j + 1)
+                placeholder_per_tile = tile_img_placeholder.format(n_h=i + 1, n_w=j + 1)
                 tiles_placeholder.append(placeholder_per_tile)
                 # Add line break if it is the last tile in the row
                 if j == grid_w - 1:
                     tiles_placeholder.append("\n")
 
-        return "".join([
-            *tiles_placeholder,
-            "\n",
-            global_img_placeholder,
-            fake_image_token,
-        ])
+        return "".join(
+            [
+                *tiles_placeholder,
+                "\n",
+                global_img_placeholder,
+                fake_image_token,
+            ]
+        )
 
     def get_num_image_tokens(
         self,
@@ -278,9 +300,7 @@ def get_image_size_with_most_features(self) -> ImageSize:
         )
 
 
-class Idefics3DummyInputsBuilder(BaseDummyInputsBuilder[Idefics3ProcessingInfo]
-                                 ):
-
+class Idefics3DummyInputsBuilder(BaseDummyInputsBuilder[Idefics3ProcessingInfo]):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -298,22 +318,21 @@ def get_dummy_mm_data(
         num_images = mm_counts.get("image", 0)
         hf_processor = self.info.get_hf_processor()
         image_processor: Idefics3ImageProcessor = hf_processor.image_processor
-        longest_edge = image_processor.max_image_size['longest_edge']
+        longest_edge = image_processor.max_image_size["longest_edge"]
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=longest_edge,
-                                   height=longest_edge,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=longest_edge,
+                height=longest_edge,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
-class Idefics3MultiModalProcessor(
-        BaseMultiModalProcessor[Idefics3ProcessingInfo]):
-
+class Idefics3MultiModalProcessor(BaseMultiModalProcessor[Idefics3ProcessingInfo]):
     def _call_hf_processor(
         self,
         prompt: str,
@@ -334,9 +353,11 @@ def _call_hf_processor(
             tok_kwargs,
         )
 
-        parsed_images = (self._get_data_parser().parse_mm_data({
-            "image": images
-        }).get_items("image", ImageProcessorItems))
+        parsed_images = (
+            self._get_data_parser()
+            .parse_mm_data({"image": images})
+            .get_items("image", ImageProcessorItems)
+        )
         image_sizes = [
             parsed_images.get_image_size(i) for i in range(len(parsed_images))
         ]
@@ -347,7 +368,8 @@ def _call_hf_processor(
                 image_width=size.width,
                 image_height=size.height,
                 processor=hf_processor,
-            ) for size in image_sizes
+            )
+            for size in image_sizes
         ]
         processed_outputs["num_patches"] = torch.tensor(num_patches)
 
@@ -365,10 +387,10 @@ def _get_mm_fields_config(
         num_patches = hf_inputs.get("num_patches", torch.empty(0))
 
         return dict(
-            pixel_values=MultiModalFieldConfig.flat_from_sizes(
-                "image", num_patches),
+            pixel_values=MultiModalFieldConfig.flat_from_sizes("image", num_patches),
             pixel_attention_mask=MultiModalFieldConfig.flat_from_sizes(
-                "image", num_patches),
+                "image", num_patches
+            ),
             image_embeds=MultiModalFieldConfig.batched("image"),
             num_patches=MultiModalFieldConfig.batched("image"),
         )
@@ -408,7 +430,6 @@ def get_replacement_idefics3(item_idx: int) -> PromptUpdateDetails:
 
 
 class Idefics3SimpleMLP(nn.Module):
-
     def __init__(
         self,
         config: Idefics3Config,
@@ -416,8 +437,7 @@ def __init__(
         prefix: str = "",
     ):
         super().__init__()
-        input_size = config.vision_config.hidden_size * (config.scale_factor**
-                                                         2)
+        input_size = config.vision_config.hidden_size * (config.scale_factor**2)
         output_size = config.text_config.hidden_size
         self.proj = ReplicatedLinear(
             input_size,
@@ -433,7 +453,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class Idefics3Connector(nn.Module):
-
     def __init__(
         self,
         config: Idefics3Config,
@@ -448,14 +467,11 @@ def __init__(
             prefix=maybe_prefix(prefix, "modality_projection"),
         )
 
-    def pixel_shuffle(self,
-                      x: torch.Tensor,
-                      scale_factor: int = 2) -> torch.Tensor:
+    def pixel_shuffle(self, x: torch.Tensor, scale_factor: int = 2) -> torch.Tensor:
         bsz, seq, embed_dim = x.size()
         height = width = int(seq**0.5)
         x = x.view(bsz, height, width, embed_dim)
-        x = x.view(bsz, height, int(width / scale_factor),
-                   embed_dim * scale_factor)
+        x = x.view(bsz, height, int(width / scale_factor), embed_dim * scale_factor)
         x = x.permute(0, 2, 1, 3)
         x = x.reshape(
             bsz,
@@ -464,19 +480,16 @@ def pixel_shuffle(self,
             embed_dim * (scale_factor**2),
         )
         x = x.permute(0, 2, 1, 3)
-        x = x.reshape(bsz, int(seq / (scale_factor**2)),
-                      embed_dim * (scale_factor**2))
+        x = x.reshape(bsz, int(seq / (scale_factor**2)), embed_dim * (scale_factor**2))
         return x
 
     def forward(self, image_hidden_states: torch.Tensor) -> torch.Tensor:
-        image_hidden_states = self.pixel_shuffle(image_hidden_states,
-                                                 self.scale_factor)
+        image_hidden_states = self.pixel_shuffle(image_hidden_states, self.scale_factor)
         image_hidden_states = self.modality_projection(image_hidden_states)
         return image_hidden_states
 
 
 class Idefics3Model(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -488,7 +501,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.vision_model = Idefics3VisionTransformer(
             config.vision_config,
             quant_config=quant_config,
-            prefix=maybe_prefix(prefix, "vision_model"))
+            prefix=maybe_prefix(prefix, "vision_model"),
+        )
         self.connector = Idefics3Connector(
             config,
             quant_config,
@@ -500,8 +514,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
 
         self.image_seq_len = int(
-            ((config.vision_config.image_size //
-              config.vision_config.patch_size)**2) / (config.scale_factor**2))
+            ((config.vision_config.image_size // config.vision_config.patch_size) ** 2)
+            / (config.scale_factor**2)
+        )
         self.image_token_id = self.config.image_token_id
 
     def image_pixels_to_features(
@@ -518,21 +533,21 @@ def image_pixels_to_features(
         # Remove padding images - padding images are full 0.
         nb_values_per_image = pixel_values.shape[1:].numel()
         real_images_inds = (pixel_values == 0.0).sum(
-            dim=(-1, -2, -3)) != nb_values_per_image
+            dim=(-1, -2, -3)
+        ) != nb_values_per_image
         pixel_values = pixel_values[real_images_inds].contiguous()
 
         # Handle the vision attention mask
         # Remove padding images from the mask
-        pixel_attention_mask = pixel_attention_mask[
-            real_images_inds].contiguous()
+        pixel_attention_mask = pixel_attention_mask[real_images_inds].contiguous()
 
         patch_size = self.config.vision_config.patch_size
-        patches_subgrid = pixel_attention_mask.unfold(dimension=1,
-                                                      size=patch_size,
-                                                      step=patch_size)
-        patches_subgrid = patches_subgrid.unfold(dimension=2,
-                                                 size=patch_size,
-                                                 step=patch_size)
+        patches_subgrid = pixel_attention_mask.unfold(
+            dimension=1, size=patch_size, step=patch_size
+        )
+        patches_subgrid = patches_subgrid.unfold(
+            dimension=2, size=patch_size, step=patch_size
+        )
         patch_attention_mask = (patches_subgrid.sum(dim=(-1, -2)) > 0).bool()
 
         # Get sequence from the vision encoder
@@ -553,7 +568,6 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-
         hidden_states = self.text_model(
             input_ids,
             positions,
@@ -566,9 +580,9 @@ def forward(
 @MULTIMODAL_REGISTRY.register_processor(
     Idefics3MultiModalProcessor,
     info=Idefics3ProcessingInfo,
-    dummy_inputs=Idefics3DummyInputsBuilder)
-class Idefics3ForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                       SupportsLoRA):
+    dummy_inputs=Idefics3DummyInputsBuilder,
+)
+class Idefics3ForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsLoRA):
     merge_by_field_config = True
 
     packed_modules_mapping = {
@@ -600,8 +614,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.config = config
         self.multimodal_config = multimodal_config
 
-        self.model = Idefics3Model(vllm_config=vllm_config,
-                                   prefix=maybe_prefix(prefix, "model"))
+        self.model = Idefics3Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.image_token_id = self.config.image_token_id
 
         self.lm_head = ParallelLMHead(
@@ -615,7 +630,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.logits_processor = LogitsProcessor(config.text_config.vocab_size)
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[ImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[ImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_embeds = kwargs.pop("image_embeds", None)
 
@@ -638,16 +654,12 @@ def _parse_and_validate_image_input(
                 pixel_values=pixel_values,
                 pixel_attention_mask=pixel_attention_mask,
                 num_patches=num_patches,
-                resolve_bindings={
-                    "h": expected_h,
-                    "w": expected_w
-                },
+                resolve_bindings={"h": expected_h, "w": expected_w},
             )
 
         raise AssertionError("This line should be unreachable.")
 
-    def _process_image_pixels(
-            self, inputs: Idefics3ImagePixelInputs) -> torch.Tensor:
+    def _process_image_pixels(self, inputs: Idefics3ImagePixelInputs) -> torch.Tensor:
         pixel_values = inputs["pixel_values"]
         pixel_attention_mask = inputs["pixel_attention_mask"]
 
@@ -667,15 +679,12 @@ def _process_image_input(
         image_features = self.model.connector(image_features)
 
         num_patches = image_input["num_patches"]
-        return [
-            e.flatten(0, 1) for e in image_features.split(num_patches.tolist())
-        ]
+        return [e.flatten(0, 1) for e in image_features.split(num_patches.tolist())]
 
     def get_language_model(self) -> torch.nn.Module:
         return self.model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -693,10 +702,9 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.model.text_model(input_ids,
-                                              positions,
-                                              intermediate_tensors,
-                                              inputs_embeds=inputs_embeds)
+        hidden_states = self.model.text_model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
 
         return hidden_states
 
@@ -704,8 +712,7 @@ def compute_logits(self, hidden_states: torch.Tensor) -> torch.Tensor:
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
 
@@ -716,4 +723,5 @@ def get_mm_mapping(self) -> MultiModelKeys:
         return MultiModelKeys.from_string_field(
             language_model="model.text_model",
             connector="model.connector",
-            tower_model="model.vision_model")
+            tower_model="model.vision_model",
+        )
diff --git a/vllm/model_executor/models/interfaces.py b/vllm/model_executor/models/interfaces.py
index c95c63cd8534..38c9d5abb587 100644
--- a/vllm/model_executor/models/interfaces.py
+++ b/vllm/model_executor/models/interfaces.py
@@ -2,8 +2,17 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 from collections.abc import Iterable, Mapping, MutableSequence
-from typing import (TYPE_CHECKING, Callable, ClassVar, Literal, Optional,
-                    Protocol, Union, overload, runtime_checkable)
+from typing import (
+    TYPE_CHECKING,
+    Callable,
+    ClassVar,
+    Literal,
+    Optional,
+    Protocol,
+    Union,
+    overload,
+    runtime_checkable,
+)
 
 import numpy as np
 import torch
@@ -76,10 +85,9 @@ def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
         """
         ...
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         """
-        Returns multimodal embeddings generated from multimodal kwargs 
+        Returns multimodal embeddings generated from multimodal kwargs
         to be merged with text embeddings.
 
         Note:
@@ -93,7 +101,7 @@ def get_language_model(self) -> VllmModel:
         """
         Returns the underlying language model used for text generation.
 
-        This is typically the `torch.nn.Module` instance responsible for 
+        This is typically the `torch.nn.Module` instance responsible for
         processing the merged multimodal embeddings and producing hidden states
 
         Returns:
@@ -102,8 +110,7 @@ def get_language_model(self) -> VllmModel:
         ...
 
     @overload
-    def get_input_embeddings(self, input_ids: Tensor) -> Tensor:
-        ...
+    def get_input_embeddings(self, input_ids: Tensor) -> Tensor: ...
 
     @overload
     def get_input_embeddings(
@@ -113,8 +120,7 @@ def get_input_embeddings(
         *,
         is_multimodal: torch.Tensor,
         handle_oov_mm_token: bool = False,
-    ) -> Tensor:
-        ...
+    ) -> Tensor: ...
 
     def _get_text_embeddings(
         self,
@@ -172,7 +178,8 @@ def get_input_embeddings(
             raise ValueError(
                 "`get_input_embeddings` now requires `is_multimodal` arg, "
                 "please update your model runner according to "
-                "https://github.com/vllm-project/vllm/pull/16229.")
+                "https://github.com/vllm-project/vllm/pull/16229."
+            )
 
         return _merge_multimodal_embeddings(
             inputs_embeds=inputs_embeds,
@@ -187,12 +194,15 @@ class SupportsMultiModalPruning(Protocol):
     embeddings and positions. Model may require custom positions for dynamic
     pruning of multimodal embeddings.
     """
+
     supports_multimodal_pruning: ClassVar[Literal[True]] = True
 
     def recompute_mrope_positions(
-            self, input_ids: list[int],
-            multimodal_embeddings: MultiModalEmbeddings,
-            mrope_positions: torch.LongTensor, num_computed_tokens: int
+        self,
+        input_ids: list[int],
+        multimodal_embeddings: MultiModalEmbeddings,
+        mrope_positions: torch.LongTensor,
+        num_computed_tokens: int,
     ) -> tuple[MultiModalEmbeddings, Tensor, int]:
         """
         Update part of input mrope positions (starting with
@@ -218,14 +228,11 @@ def recompute_mrope_positions(
 
 
 @overload
-def supports_multimodal(
-        model: type[object]) -> TypeIs[type[SupportsMultiModal]]:
-    ...
+def supports_multimodal(model: type[object]) -> TypeIs[type[SupportsMultiModal]]: ...
 
 
 @overload
-def supports_multimodal(model: object) -> TypeIs[SupportsMultiModal]:
-    ...
+def supports_multimodal(model: object) -> TypeIs[SupportsMultiModal]: ...
 
 
 def supports_multimodal(
@@ -234,32 +241,27 @@ def supports_multimodal(
     return getattr(model, "supports_multimodal", False)
 
 
-def supports_multimodal_raw_input_only(
-        model: Union[type[object], object]) -> bool:
+def supports_multimodal_raw_input_only(model: Union[type[object], object]) -> bool:
     return getattr(model, "supports_multimodal_raw_input_only", False)
 
 
-def supports_multimodal_encoder_tp_data(
-        model: Union[type[object], object]) -> bool:
+def supports_multimodal_encoder_tp_data(model: Union[type[object], object]) -> bool:
     return getattr(model, "supports_encoder_tp_data", False)
 
 
 @overload
 def supports_multimodal_pruning(
-        model: type[object]) -> TypeIs[type[SupportsMultiModalPruning]]:
-    ...
+    model: type[object],
+) -> TypeIs[type[SupportsMultiModalPruning]]: ...
 
 
 @overload
-def supports_multimodal_pruning(
-        model: object) -> TypeIs[SupportsMultiModalPruning]:
-    ...
+def supports_multimodal_pruning(model: object) -> TypeIs[SupportsMultiModalPruning]: ...
 
 
 def supports_multimodal_pruning(
     model: Union[type[object], object],
-) -> Union[TypeIs[type[SupportsMultiModalPruning]],
-           TypeIs[SupportsMultiModalPruning]]:
+) -> Union[TypeIs[type[SupportsMultiModalPruning]], TypeIs[SupportsMultiModalPruning]]:
     return getattr(model, "supports_multimodal_pruning", False)
 
 
@@ -280,7 +282,7 @@ class SupportsScoreTemplate(Protocol):
     def get_score_template(cls, query: str, document: str) -> Optional[str]:
         """
         Generate a full prompt by populating the score template with query and document content.
-        """ # noqa: E501
+        """  # noqa: E501
         ...
 
     @classmethod
@@ -293,13 +295,12 @@ def post_process_tokens(cls, prompt: TokensPrompt) -> None:
 
 @overload
 def supports_score_template(
-        model: type[object]) -> TypeIs[type[SupportsScoreTemplate]]:
-    ...
+    model: type[object],
+) -> TypeIs[type[SupportsScoreTemplate]]: ...
 
 
 @overload
-def supports_score_template(model: object) -> TypeIs[SupportsScoreTemplate]:
-    ...
+def supports_score_template(model: object) -> TypeIs[SupportsScoreTemplate]: ...
 
 
 def supports_score_template(
@@ -339,13 +340,11 @@ class _SupportsLoRAType(Protocol):
 
 
 @overload
-def supports_lora(model: type[object]) -> TypeIs[type[SupportsLoRA]]:
-    ...
+def supports_lora(model: type[object]) -> TypeIs[type[SupportsLoRA]]: ...
 
 
 @overload
-def supports_lora(model: object) -> TypeIs[SupportsLoRA]:
-    ...
+def supports_lora(model: object) -> TypeIs[SupportsLoRA]: ...
 
 
 def supports_lora(
@@ -359,8 +358,7 @@ def supports_lora(
             "embedding_modules",
             "embedding_padding_modules",
         )
-        missing_attrs = tuple(attr for attr in lora_attrs
-                              if not hasattr(model, attr))
+        missing_attrs = tuple(attr for attr in lora_attrs if not hasattr(model, attr))
 
         if getattr(model, "supports_lora", False):
             if missing_attrs:
@@ -374,7 +372,9 @@ def supports_lora(
             if not missing_attrs:
                 logger.warning(
                     "The model (%s) contains all LoRA-specific attributes, "
-                    "but does not set `supports_lora=True`.", model)
+                    "but does not set `supports_lora=True`.",
+                    model,
+                )
 
     return result
 
@@ -434,25 +434,21 @@ def make_empty_intermediate_tensors(
         batch_size: int,
         dtype: torch.dtype,
         device: torch.device,
-    ) -> "IntermediateTensors":
-        ...
+    ) -> "IntermediateTensors": ...
 
     def forward(
         self,
         *,
         intermediate_tensors: Optional["IntermediateTensors"],
-    ) -> Union[Tensor, "IntermediateTensors"]:
-        ...
+    ) -> Union[Tensor, "IntermediateTensors"]: ...
 
 
 @overload
-def supports_pp(model: type[object]) -> TypeIs[type[SupportsPP]]:
-    ...
+def supports_pp(model: type[object]) -> TypeIs[type[SupportsPP]]: ...
 
 
 @overload
-def supports_pp(model: object) -> TypeIs[SupportsPP]:
-    ...
+def supports_pp(model: object) -> TypeIs[SupportsPP]: ...
 
 
 def supports_pp(
@@ -464,12 +460,13 @@ def supports_pp(
     if supports_attributes and not supports_inspect:
         logger.warning(
             "The model (%s) sets `supports_pp=True`, but does not accept "
-            "`intermediate_tensors` in its `forward` method", model)
+            "`intermediate_tensors` in its `forward` method",
+            model,
+        )
 
     if not supports_attributes:
-        pp_attrs = ("make_empty_intermediate_tensors", )
-        missing_attrs = tuple(attr for attr in pp_attrs
-                              if not hasattr(model, attr))
+        pp_attrs = ("make_empty_intermediate_tensors",)
+        missing_attrs = tuple(attr for attr in pp_attrs if not hasattr(model, attr))
 
         if getattr(model, "supports_pp", False):
             if missing_attrs:
@@ -483,7 +480,9 @@ def supports_pp(
             if not missing_attrs:
                 logger.warning(
                     "The model (%s) contains all PP-specific attributes, "
-                    "but does not set `supports_pp=True`.", model)
+                    "but does not set `supports_pp=True`.",
+                    model,
+                )
 
     return supports_attributes and supports_inspect
 
@@ -516,17 +515,15 @@ class HasInnerState(Protocol):
 
 
 @overload
-def has_inner_state(model: object) -> TypeIs[HasInnerState]:
-    ...
+def has_inner_state(model: object) -> TypeIs[HasInnerState]: ...
 
 
 @overload
-def has_inner_state(model: type[object]) -> TypeIs[type[HasInnerState]]:
-    ...
+def has_inner_state(model: type[object]) -> TypeIs[type[HasInnerState]]: ...
 
 
 def has_inner_state(
-    model: Union[type[object], object]
+    model: Union[type[object], object],
 ) -> Union[TypeIs[type[HasInnerState]], TypeIs[HasInnerState]]:
     return getattr(model, "has_inner_state", False)
 
@@ -545,17 +542,15 @@ class IsAttentionFree(Protocol):
 
 
 @overload
-def is_attention_free(model: object) -> TypeIs[IsAttentionFree]:
-    ...
+def is_attention_free(model: object) -> TypeIs[IsAttentionFree]: ...
 
 
 @overload
-def is_attention_free(model: type[object]) -> TypeIs[type[IsAttentionFree]]:
-    ...
+def is_attention_free(model: type[object]) -> TypeIs[type[IsAttentionFree]]: ...
 
 
 def is_attention_free(
-    model: Union[type[object], object]
+    model: Union[type[object], object],
 ) -> Union[TypeIs[type[IsAttentionFree]], TypeIs[IsAttentionFree]]:
     return getattr(model, "is_attention_free", False)
 
@@ -563,7 +558,7 @@ def is_attention_free(
 @runtime_checkable
 class IsHybrid(Protocol):
     """The interface required for all models like Jamba that have both
-    attention and mamba blocks, indicates that 
+    attention and mamba blocks, indicates that
     hf_config has 'layers_block_type'"""
 
     is_hybrid: ClassVar[Literal[True]] = True
@@ -593,17 +588,15 @@ def get_mamba_state_shape_from_config(
 
 
 @overload
-def is_hybrid(model: object) -> TypeIs[IsHybrid]:
-    ...
+def is_hybrid(model: object) -> TypeIs[IsHybrid]: ...
 
 
 @overload
-def is_hybrid(model: type[object]) -> TypeIs[type[IsHybrid]]:
-    ...
+def is_hybrid(model: type[object]) -> TypeIs[type[IsHybrid]]: ...
 
 
 def is_hybrid(
-    model: Union[type[object], object]
+    model: Union[type[object], object],
 ) -> Union[TypeIs[type[IsHybrid]], TypeIs[IsHybrid]]:
     return getattr(model, "is_hybrid", False)
 
@@ -654,7 +647,7 @@ def set_eplb_state(
     ) -> None:
         """
         Register the EPLB state in the MoE model.
-        
+
         Since these are views of the actual EPLB state, any changes made by
         the EPLB algorithm are automatically reflected in the model's behavior
         without requiring additional method calls to set new states.
@@ -674,8 +667,7 @@ def update_physical_experts_metadata(
         self,
         num_physical_experts: int,
         num_local_physical_experts: int,
-    ) -> None:
-        ...
+    ) -> None: ...
 
 
 def is_mixture_of_experts(model: object) -> TypeIs[MixtureOfExperts]:
@@ -688,17 +680,15 @@ class HasNoOps(Protocol):
 
 
 @overload
-def has_noops(model: object) -> TypeIs[HasNoOps]:
-    ...
+def has_noops(model: object) -> TypeIs[HasNoOps]: ...
 
 
 @overload
-def has_noops(model: type[object]) -> TypeIs[type[HasNoOps]]:
-    ...
+def has_noops(model: type[object]) -> TypeIs[type[HasNoOps]]: ...
 
 
 def has_noops(
-    model: Union[type[object], object]
+    model: Union[type[object], object],
 ) -> Union[TypeIs[type[HasNoOps]], TypeIs[HasNoOps]]:
     return getattr(model, "has_noops", False)
 
@@ -712,13 +702,12 @@ class SupportsCrossEncoding(Protocol):
 
 @overload
 def supports_cross_encoding(
-        model: type[object]) -> TypeIs[type[SupportsCrossEncoding]]:
-    ...
+    model: type[object],
+) -> TypeIs[type[SupportsCrossEncoding]]: ...
 
 
 @overload
-def supports_cross_encoding(model: object) -> TypeIs[SupportsCrossEncoding]:
-    ...
+def supports_cross_encoding(model: object) -> TypeIs[SupportsCrossEncoding]: ...
 
 
 def _supports_cross_encoding(
@@ -746,7 +735,6 @@ def __new__(cls, *args, **kwargs) -> Self:
         # find config passed in arguments
         quant_config = cls._find_quant_config(*args, **kwargs)
         if quant_config is not None:
-
             # attach config to model for general use
             instance.quant_config = quant_config
 
@@ -755,7 +743,8 @@ def __new__(cls, *args, **kwargs) -> Self:
                 instance.quant_config.apply_vllm_mapper(hf_to_vllm_mapper)
             if instance.packed_modules_mapping is not None:
                 instance.quant_config.packed_modules_mapping.update(
-                    instance.packed_modules_mapping)
+                    instance.packed_modules_mapping
+                )
 
         return instance
 
@@ -778,6 +767,7 @@ def _find_quant_config(*args, **kwargs) -> Optional[QuantizationConfig]:
 @runtime_checkable
 class SupportsTranscription(Protocol):
     """The interface required for all models that support transcription."""
+
     # Mapping from ISO639_1 language codes: language names
     supported_languages: ClassVar[Mapping[str, str]]
 
@@ -798,16 +788,20 @@ def __init_subclass__(cls, **kwargs):
             raise ValueError(
                 f"{cls.__name__}.supported_languages contains invalid "
                 f"language codes: {sorted(invalid)}\n. "
-                f"Valid choices are: {sorted(LANGUAGES.keys())}")
+                f"Valid choices are: {sorted(LANGUAGES.keys())}"
+            )
 
     @classmethod
-    def get_generation_prompt(cls, audio: np.ndarray,
-                              stt_config: SpeechToTextConfig,
-                              model_config: ModelConfig,
-                              language: Optional[str],
-                              task_type: Literal["transcribe", "translate"],
-                              request_prompt: str,
-                              to_language: Optional[str]) -> PromptType:
+    def get_generation_prompt(
+        cls,
+        audio: np.ndarray,
+        stt_config: SpeechToTextConfig,
+        model_config: ModelConfig,
+        language: Optional[str],
+        task_type: Literal["transcribe", "translate"],
+        request_prompt: str,
+        to_language: Optional[str],
+    ) -> PromptType:
         """Get the prompt for the ASR model.
         The model has control over the construction, as long as it
         returns a valid PromptType."""
@@ -816,17 +810,14 @@ def get_generation_prompt(cls, audio: np.ndarray,
     @classmethod
     def get_other_languages(cls) -> Mapping[str, str]:
         # other possible language codes from the whisper map
-        return {
-            k: v
-            for k, v in LANGUAGES.items() if k not in cls.supported_languages
-        }
+        return {k: v for k, v in LANGUAGES.items() if k not in cls.supported_languages}
 
     @classmethod
     def validate_language(cls, language: Optional[str]) -> Optional[str]:
         """
-        Ensure the language specified in the transcription request 
-        is a valid ISO 639-1 language code. If the request language is 
-        valid, but not natively supported by the model, trigger a 
+        Ensure the language specified in the transcription request
+        is a valid ISO 639-1 language code. If the request language is
+        valid, but not natively supported by the model, trigger a
         warning (but not an exception).
         """
         if language is None or language in cls.supported_languages:
@@ -843,22 +834,25 @@ def validate_language(cls, language: Optional[str]) -> Optional[str]:
         else:
             raise ValueError(
                 f"Unsupported language: {language!r}.  Must be one of "
-                f"{list(cls.supported_languages.keys())}.")
+                f"{list(cls.supported_languages.keys())}."
+            )
 
     @classmethod
     def get_speech_to_text_config(
-            cls, model_config: ModelConfig,
-            task_type: Literal["transcribe",
-                               "translate"]) -> SpeechToTextConfig:
+        cls, model_config: ModelConfig, task_type: Literal["transcribe", "translate"]
+    ) -> SpeechToTextConfig:
         """Get the speech to text config for the ASR model."""
         ...
 
     @classmethod
-    def get_num_audio_tokens(cls, audio_duration_s: float,
-                             stt_config: SpeechToTextConfig,
-                             model_config: ModelConfig) -> Optional[int]:
+    def get_num_audio_tokens(
+        cls,
+        audio_duration_s: float,
+        stt_config: SpeechToTextConfig,
+        model_config: ModelConfig,
+    ) -> Optional[int]:
         """
-        Map from audio duration to number of audio tokens produced by the ASR 
+        Map from audio duration to number of audio tokens produced by the ASR
         model, without running a forward pass.
         This is used for estimating the amount of processing for this audio.
         """
@@ -867,13 +861,12 @@ def get_num_audio_tokens(cls, audio_duration_s: float,
 
 @overload
 def supports_transcription(
-        model: type[object]) -> TypeIs[type[SupportsTranscription]]:
-    ...
+    model: type[object],
+) -> TypeIs[type[SupportsTranscription]]: ...
 
 
 @overload
-def supports_transcription(model: object) -> TypeIs[SupportsTranscription]:
-    ...
+def supports_transcription(model: object) -> TypeIs[SupportsTranscription]: ...
 
 
 def supports_transcription(
@@ -890,13 +883,11 @@ class SupportsV0Only(Protocol):
 
 
 @overload
-def supports_v0_only(model: type[object]) -> TypeIs[type[SupportsV0Only]]:
-    ...
+def supports_v0_only(model: type[object]) -> TypeIs[type[SupportsV0Only]]: ...
 
 
 @overload
-def supports_v0_only(model: object) -> TypeIs[SupportsV0Only]:
-    ...
+def supports_v0_only(model: object) -> TypeIs[SupportsV0Only]: ...
 
 
 def supports_v0_only(
@@ -907,7 +898,7 @@ def supports_v0_only(
 
 @runtime_checkable
 class SupportsEagle3(Protocol):
-    """The interface required for models that support 
+    """The interface required for models that support
     EAGLE3 speculative decoding."""
 
     supports_eagle3: ClassVar[Literal[True]] = True
@@ -924,7 +915,7 @@ def set_aux_hidden_state_layers(self, layers: tuple[int, ...]) -> None:
         """
         Set which layers should output auxiliary
         hidden states for EAGLE3.
-        
+
         Args:
             layers: Tuple of layer indices that should output auxiliary
                 hidden states.
@@ -935,7 +926,7 @@ def get_eagle3_aux_hidden_state_layers(self) -> tuple[int, ...]:
         """
         Get the layer indices that should output auxiliary hidden states
         for EAGLE3.
-        
+
         Returns:
             Tuple of layer indices for auxiliary hidden state outputs.
         """
@@ -943,13 +934,11 @@ def get_eagle3_aux_hidden_state_layers(self) -> tuple[int, ...]:
 
 
 @overload
-def supports_eagle3(model: type[object]) -> TypeIs[type[SupportsEagle3]]:
-    ...
+def supports_eagle3(model: type[object]) -> TypeIs[type[SupportsEagle3]]: ...
 
 
 @overload
-def supports_eagle3(model: object) -> TypeIs[SupportsEagle3]:
-    ...
+def supports_eagle3(model: object) -> TypeIs[SupportsEagle3]: ...
 
 
 def supports_eagle3(
@@ -985,10 +974,10 @@ def get_mrope_input_positions(
     ) -> tuple[torch.Tensor, int]:
         """
         Get M-RoPE input positions and delta value for this specific model.
-        
+
         This method should be implemented by each model that supports M-RoPE
         to provide model-specific logic for computing input positions.
-        
+
         Args:
             input_tokens: List of input token IDs
             hf_config: HuggingFace model configuration
@@ -999,7 +988,7 @@ def get_mrope_input_positions(
             seq_len: Sequence length
             audio_feature_lengths: Audio feature lengths for multimodal models
             use_audio_in_video: Whether to use audio in video for interleaving
-            
+
         Returns:
             Tuple of (llm_positions, mrope_position_delta)
             - llm_positions: Tensor of shape [3, num_tokens]
@@ -1010,13 +999,11 @@ def get_mrope_input_positions(
 
 
 @overload
-def supports_mrope(model: type[object]) -> TypeIs[type[SupportsMRoPE]]:
-    ...
+def supports_mrope(model: type[object]) -> TypeIs[type[SupportsMRoPE]]: ...
 
 
 @overload
-def supports_mrope(model: object) -> TypeIs[SupportsMRoPE]:
-    ...
+def supports_mrope(model: object) -> TypeIs[SupportsMRoPE]: ...
 
 
 def supports_mrope(
diff --git a/vllm/model_executor/models/interfaces_base.py b/vllm/model_executor/models/interfaces_base.py
index 84146db0943c..b697eb25b5cc 100644
--- a/vllm/model_executor/models/interfaces_base.py
+++ b/vllm/model_executor/models/interfaces_base.py
@@ -1,7 +1,16 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-from typing import (TYPE_CHECKING, Any, ClassVar, Literal, Optional, Protocol,
-                    Union, overload, runtime_checkable)
+from typing import (
+    TYPE_CHECKING,
+    Any,
+    ClassVar,
+    Literal,
+    Optional,
+    Protocol,
+    Union,
+    overload,
+    runtime_checkable,
+)
 
 import torch
 import torch.nn as nn
@@ -38,8 +47,7 @@ def __init__(
         self,
         vllm_config: VllmConfig,
         prefix: str = "",
-    ) -> None:
-        ...
+    ) -> None: ...
 
     def get_input_embeddings(
         self,
@@ -52,8 +60,7 @@ def forward(
         self,
         input_ids: torch.Tensor,
         positions: torch.Tensor,
-    ) -> T_co:
-        ...
+    ) -> T_co: ...
 
 
 def _check_vllm_model_init(model: Union[type[object], object]) -> bool:
@@ -61,8 +68,7 @@ def _check_vllm_model_init(model: Union[type[object], object]) -> bool:
     return supports_kw(model_init, "vllm_config")
 
 
-def _check_vllm_model_get_input_embeddings(
-        model: Union[type[object], object]) -> bool:
+def _check_vllm_model_get_input_embeddings(model: Union[type[object], object]) -> bool:
     model_get_input_embeddings = getattr(model, "get_input_embeddings", None)
     if not callable(model_get_input_embeddings):
         logger.warning(
@@ -80,11 +86,9 @@ def _check_vllm_model_forward(model: Union[type[object], object]) -> bool:
         return False
 
     vllm_kws = ("input_ids", "positions")
-    missing_kws = tuple(kw for kw in vllm_kws
-                        if not supports_kw(model_forward, kw))
+    missing_kws = tuple(kw for kw in vllm_kws if not supports_kw(model_forward, kw))
 
-    if missing_kws and (isinstance(model, type)
-                        and issubclass(model, nn.Module)):
+    if missing_kws and (isinstance(model, type) and issubclass(model, nn.Module)):
         logger.warning(
             "The model (%s) is missing "
             "vLLM-specific keywords from its `forward` method: %s",
@@ -96,21 +100,21 @@ def _check_vllm_model_forward(model: Union[type[object], object]) -> bool:
 
 
 @overload
-def is_vllm_model(model: type[object]) -> TypeIs[type[VllmModel]]:
-    ...
+def is_vllm_model(model: type[object]) -> TypeIs[type[VllmModel]]: ...
 
 
 @overload
-def is_vllm_model(model: object) -> TypeIs[VllmModel]:
-    ...
+def is_vllm_model(model: object) -> TypeIs[VllmModel]: ...
 
 
 def is_vllm_model(
     model: Union[type[object], object],
 ) -> Union[TypeIs[type[VllmModel]], TypeIs[VllmModel]]:
-    return (_check_vllm_model_init(model)
-            and _check_vllm_model_get_input_embeddings(model)
-            and _check_vllm_model_forward(model))
+    return (
+        _check_vllm_model_init(model)
+        and _check_vllm_model_get_input_embeddings(model)
+        and _check_vllm_model_forward(model)
+    )
 
 
 @runtime_checkable
@@ -127,20 +131,19 @@ def compute_logits(
 
 @overload
 def is_text_generation_model(
-        model: type[object]) -> TypeIs[type[VllmModelForTextGeneration]]:
-    ...
+    model: type[object],
+) -> TypeIs[type[VllmModelForTextGeneration]]: ...
 
 
 @overload
-def is_text_generation_model(
-        model: object) -> TypeIs[VllmModelForTextGeneration]:
-    ...
+def is_text_generation_model(model: object) -> TypeIs[VllmModelForTextGeneration]: ...
 
 
 def is_text_generation_model(
     model: Union[type[object], object],
-) -> Union[TypeIs[type[VllmModelForTextGeneration]],
-           TypeIs[VllmModelForTextGeneration]]:
+) -> Union[
+    TypeIs[type[VllmModelForTextGeneration]], TypeIs[VllmModelForTextGeneration]
+]:
     if not is_vllm_model(model):
         return False
 
@@ -179,13 +182,11 @@ class VllmModelForPooling(VllmModel[T_co], Protocol[T_co]):
 
 
 @overload
-def is_pooling_model(model: type[object]) -> TypeIs[type[VllmModelForPooling]]:
-    ...
+def is_pooling_model(model: type[object]) -> TypeIs[type[VllmModelForPooling]]: ...
 
 
 @overload
-def is_pooling_model(model: object) -> TypeIs[VllmModelForPooling]:
-    ...
+def is_pooling_model(model: object) -> TypeIs[VllmModelForPooling]: ...
 
 
 def is_pooling_model(
diff --git a/vllm/model_executor/models/intern_vit.py b/vllm/model_executor/models/intern_vit.py
index 2c341d283971..9435ff0d26cf 100644
--- a/vllm/model_executor/models/intern_vit.py
+++ b/vllm/model_executor/models/intern_vit.py
@@ -17,28 +17,32 @@
 from transformers import PretrainedConfig
 
 from vllm.attention.layer import MultiHeadAttention
-from vllm.distributed import (divide, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              split_tensor_along_last_dim,
-                              tensor_model_parallel_all_gather)
+from vllm.distributed import (
+    divide,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    split_tensor_along_last_dim,
+    tensor_model_parallel_all_gather,
+)
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 
 from .vision import run_dp_sharded_vision_model
 
 NORM2FN = {
-    'rms_norm': RMSNorm,
-    'layer_norm': nn.LayerNorm,
+    "rms_norm": RMSNorm,
+    "layer_norm": nn.LayerNorm,
 }
 
 
 class InternVisionEmbeddings(nn.Module):
-
     def __init__(self, config: PretrainedConfig):
         super().__init__()
         self.config = config
@@ -48,28 +52,36 @@ def __init__(self, config: PretrainedConfig):
 
         self.class_embedding = nn.Parameter(torch.randn(1, 1, self.embed_dim))
 
-        self.patch_embedding = nn.Conv2d(in_channels=3,
-                                         out_channels=self.embed_dim,
-                                         kernel_size=self.patch_size,
-                                         stride=self.patch_size)
+        self.patch_embedding = nn.Conv2d(
+            in_channels=3,
+            out_channels=self.embed_dim,
+            kernel_size=self.patch_size,
+            stride=self.patch_size,
+        )
 
-        self.num_patches = (self.image_size // self.patch_size)**2
+        self.num_patches = (self.image_size // self.patch_size) ** 2
         self.num_positions = self.num_patches + 1
 
         self.position_embedding = nn.Parameter(
-            torch.randn(1, self.num_positions, self.embed_dim))
+            torch.randn(1, self.num_positions, self.embed_dim)
+        )
 
     def _get_pos_embed(self, pos_embed: torch.Tensor, H: int, W: int):
         target_dtype = pos_embed.dtype
-        pos_embed = pos_embed.float().reshape(
-            1, self.image_size // self.patch_size,
-            self.image_size // self.patch_size, -1).permute(0, 3, 1, 2)
-        pos_embed = F.interpolate(pos_embed,
-                                  size=(H, W),
-                                  mode='bicubic',
-                                  align_corners=False)
-        return pos_embed.reshape(1, -1, H * W).permute(0, 2,
-                                                       1).to(target_dtype)
+        pos_embed = (
+            pos_embed.float()
+            .reshape(
+                1,
+                self.image_size // self.patch_size,
+                self.image_size // self.patch_size,
+                -1,
+            )
+            .permute(0, 3, 1, 2)
+        )
+        pos_embed = F.interpolate(
+            pos_embed, size=(H, W), mode="bicubic", align_corners=False
+        )
+        return pos_embed.reshape(1, -1, H * W).permute(0, 2, 1).to(target_dtype)
 
     def _get_position_embedding(self, H: int, W: int) -> torch.Tensor:
         position_embedding = self.position_embedding
@@ -86,12 +98,12 @@ def _get_position_embedding(self, H: int, W: int) -> torch.Tensor:
 
     def forward(self, pixel_values: torch.FloatTensor) -> torch.Tensor:
         target_dtype = self.patch_embedding.weight.dtype
-        patch_embeds = self.patch_embedding(pixel_values.to(
-            target_dtype))  # shape = [*, channel, width, height]
+        patch_embeds = self.patch_embedding(
+            pixel_values.to(target_dtype)
+        )  # shape = [*, channel, width, height]
         batch_size, _, height, width = patch_embeds.shape
         patch_embeds = patch_embeds.flatten(2).transpose(1, 2)
-        class_embeds = self.class_embedding.expand(batch_size, 1,
-                                                   -1).to(target_dtype)
+        class_embeds = self.class_embedding.expand(batch_size, 1, -1).to(target_dtype)
         embeddings = torch.cat([class_embeds, patch_embeds], dim=1)
         position_embedding = self._get_position_embedding(height, width)
         embeddings = embeddings + position_embedding.to(target_dtype)
@@ -99,7 +111,6 @@ def forward(self, pixel_values: torch.FloatTensor) -> torch.Tensor:
 
 
 class InternVisionPatchModel(nn.Module):
-
     def __init__(self, config: PretrainedConfig):
         super().__init__()
         self.config = config
@@ -114,8 +125,7 @@ def forward(
         pixel_embeds: Optional[torch.Tensor] = None,
     ) -> torch.FloatTensor:
         if pixel_values is None and pixel_embeds is None:
-            raise ValueError(
-                'You have to specify pixel_values or pixel_embeds')
+            raise ValueError("You have to specify pixel_values or pixel_embeds")
 
         if pixel_embeds is not None:
             hidden_states = pixel_embeds
@@ -123,8 +133,7 @@ def forward(
             if pixel_values.ndim == 4:
                 hidden_states = self.embeddings(pixel_values)
             else:
-                raise ValueError(
-                    f'wrong pixel_values size: {pixel_values.shape}')
+                raise ValueError(f"wrong pixel_values size: {pixel_values.shape}")
 
         return hidden_states
 
@@ -149,19 +158,21 @@ def __init__(
         self.head_dim = self.embed_dim // self.num_heads
         if self.head_dim * self.num_heads != self.embed_dim:
             raise ValueError(
-                f'embed_dim must be divisible by num_heads '
-                f'(got `embed_dim`: {self.embed_dim} and `num_heads`:'
-                f' {self.num_heads}).')
+                f"embed_dim must be divisible by num_heads "
+                f"(got `embed_dim`: {self.embed_dim} and `num_heads`:"
+                f" {self.num_heads})."
+            )
 
-        self.tp_size = (1 if use_data_parallel else
-                        get_tensor_model_parallel_world_size())
-        self.tp_rank = (0 if use_data_parallel else
-                        get_tensor_model_parallel_rank())
+        self.tp_size = (
+            1 if use_data_parallel else get_tensor_model_parallel_world_size()
+        )
+        self.tp_rank = 0 if use_data_parallel else get_tensor_model_parallel_rank()
 
         # Additional dummy heads are used to enable TP for common GPU counts.
         self.dummy_dim = (num_dummy_heads + self.num_heads) * self.head_dim
-        self.num_heads_per_partition = divide(num_dummy_heads + self.num_heads,
-                                              self.tp_size)
+        self.num_heads_per_partition = divide(
+            num_dummy_heads + self.num_heads, self.tp_size
+        )
 
         self.scale = self.head_dim**-0.5
         self.qkv = QKVParallelLinear(
@@ -177,12 +188,16 @@ def __init__(
         self.qk_normalization = config.qk_normalization
 
         if self.qk_normalization:
-            self.q_norm = RMSNorm(self.dummy_dim,
-                                  eps=config.layer_norm_eps,
-                                  var_hidden_size=self.embed_dim)
-            self.k_norm = RMSNorm(self.dummy_dim,
-                                  eps=config.layer_norm_eps,
-                                  var_hidden_size=self.embed_dim)
+            self.q_norm = RMSNorm(
+                self.dummy_dim,
+                eps=config.layer_norm_eps,
+                var_hidden_size=self.embed_dim,
+            )
+            self.k_norm = RMSNorm(
+                self.dummy_dim,
+                eps=config.layer_norm_eps,
+                var_hidden_size=self.embed_dim,
+            )
 
         self.proj = RowParallelLinear(
             self.dummy_dim,
@@ -192,8 +207,9 @@ def __init__(
             disable_tp=use_data_parallel,
         )
 
-        self.attn = MultiHeadAttention(self.num_heads_per_partition,
-                                       self.head_dim, self.scale)
+        self.attn = MultiHeadAttention(
+            self.num_heads_per_partition, self.head_dim, self.scale
+        )
 
     def _apply_qk_norm(self, q: torch.Tensor, k: torch.Tensor):
         if self.tp_size > 1:
@@ -202,8 +218,7 @@ def _apply_qk_norm(self, q: torch.Tensor, k: torch.Tensor):
         q = self.q_norm(q)
         k = self.k_norm(k)
         if self.tp_size > 1:
-            splitter = partial(split_tensor_along_last_dim,
-                               num_partitions=self.tp_size)
+            splitter = partial(split_tensor_along_last_dim, num_partitions=self.tp_size)
             q = splitter(q)[self.tp_rank]
             k = splitter(k)[self.tp_rank]
         return q, k
@@ -222,7 +237,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class InternMLP(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -234,18 +248,22 @@ def __init__(
 
         self.config = config
         self.activation_fn = get_act_fn(config.hidden_act)
-        self.fc1 = ColumnParallelLinear(config.hidden_size,
-                                        config.intermediate_size,
-                                        bias=True,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.fc1",
-                                        disable_tp=use_data_parallel)
-        self.fc2 = RowParallelLinear(config.intermediate_size,
-                                     config.hidden_size,
-                                     bias=True,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.fc2",
-                                     disable_tp=use_data_parallel)
+        self.fc1 = ColumnParallelLinear(
+            config.hidden_size,
+            config.intermediate_size,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc1",
+            disable_tp=use_data_parallel,
+        )
+        self.fc2 = RowParallelLinear(
+            config.intermediate_size,
+            config.hidden_size,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc2",
+            disable_tp=use_data_parallel,
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         hidden_states, _ = self.fc1(hidden_states)
@@ -256,7 +274,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class InternVisionEncoderLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -272,25 +289,25 @@ def __init__(
         self.intermediate_size = config.intermediate_size
         self.norm_type = config.norm_type
 
-        self.attn = self._init_attn(config,
-                                    quant_config,
-                                    num_dummy_heads=num_dummy_heads,
-                                    prefix=f"{prefix}.attn",
-                                    use_data_parallel=use_data_parallel)
-
-        self.mlp = InternMLP(config,
-                             quant_config=quant_config,
-                             prefix=f"{prefix}.mlp",
-                             use_data_parallel=use_data_parallel)
-        self.norm1 = NORM2FN[self.norm_type](self.embed_dim,
-                                             eps=config.layer_norm_eps)
-        self.norm2 = NORM2FN[self.norm_type](self.embed_dim,
-                                             eps=config.layer_norm_eps)
-
-        self.ls1 = nn.Parameter(config.initializer_factor *
-                                torch.ones(self.embed_dim))
-        self.ls2 = nn.Parameter(config.initializer_factor *
-                                torch.ones(self.embed_dim))
+        self.attn = self._init_attn(
+            config,
+            quant_config,
+            num_dummy_heads=num_dummy_heads,
+            prefix=f"{prefix}.attn",
+            use_data_parallel=use_data_parallel,
+        )
+
+        self.mlp = InternMLP(
+            config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.mlp",
+            use_data_parallel=use_data_parallel,
+        )
+        self.norm1 = NORM2FN[self.norm_type](self.embed_dim, eps=config.layer_norm_eps)
+        self.norm2 = NORM2FN[self.norm_type](self.embed_dim, eps=config.layer_norm_eps)
+
+        self.ls1 = nn.Parameter(config.initializer_factor * torch.ones(self.embed_dim))
+        self.ls2 = nn.Parameter(config.initializer_factor * torch.ones(self.embed_dim))
 
     def _init_attn(
         self,
@@ -302,35 +319,34 @@ def _init_attn(
         use_data_parallel: bool = False,
     ):
         # fallback to sdpa attention if tp unavailable
-        tp_size = (1 if use_data_parallel else
-                   get_tensor_model_parallel_world_size())
+        tp_size = 1 if use_data_parallel else get_tensor_model_parallel_world_size()
         num_heads = config.num_attention_heads
 
         # if the number of heads is not divisible by tp_size,
         # we also disable Attention's TP
-        use_data_parallel = (use_data_parallel
-                             or (num_heads + num_dummy_heads) % tp_size != 0)
-        return InternParallelAttention(config,
-                                       quant_config=quant_config,
-                                       num_dummy_heads=num_dummy_heads,
-                                       prefix=prefix,
-                                       use_data_parallel=use_data_parallel)
+        use_data_parallel = (
+            use_data_parallel or (num_heads + num_dummy_heads) % tp_size != 0
+        )
+        return InternParallelAttention(
+            config,
+            quant_config=quant_config,
+            num_dummy_heads=num_dummy_heads,
+            prefix=prefix,
+            use_data_parallel=use_data_parallel,
+        )
 
     def forward(
         self,
         hidden_states: torch.Tensor,
     ):
-        hidden_states = hidden_states + self.attn(
-            self.norm1(hidden_states)) * self.ls1
+        hidden_states = hidden_states + self.attn(self.norm1(hidden_states)) * self.ls1
 
-        hidden_states = hidden_states + self.mlp(
-            self.norm2(hidden_states)) * self.ls2
+        hidden_states = hidden_states + self.mlp(self.norm2(hidden_states)) * self.ls2
 
         return hidden_states
 
 
 class InternVisionEncoder(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -350,17 +366,20 @@ def __init__(
         else:
             num_hidden_layers = num_hidden_layers_override
 
-        self.layers = nn.ModuleList([
-            InternVisionEncoderLayer(config,
-                                     quant_config,
-                                     num_dummy_heads=num_dummy_heads,
-                                     prefix=f"{prefix}.layers.{layer_idx}",
-                                     use_data_parallel=use_data_parallel)
-            for layer_idx in range(num_hidden_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                InternVisionEncoderLayer(
+                    config,
+                    quant_config,
+                    num_dummy_heads=num_dummy_heads,
+                    prefix=f"{prefix}.layers.{layer_idx}",
+                    use_data_parallel=use_data_parallel,
+                )
+                for layer_idx in range(num_hidden_layers)
+            ]
+        )
 
     def forward(self, inputs_embeds: torch.Tensor):
-
         hidden_states = inputs_embeds
         for encoder_layer in self.layers:
             hidden_states = encoder_layer(hidden_states)
@@ -369,7 +388,6 @@ def forward(self, inputs_embeds: torch.Tensor):
 
 
 class InternVisionModel(nn.Module):
-
     packed_modules_mapping = {
         "qkv": ["qkv"],
     }
@@ -408,8 +426,7 @@ def forward(
         pixel_embeds: Optional[torch.Tensor] = None,
     ) -> torch.FloatTensor:
         if pixel_values is None and pixel_embeds is None:
-            raise ValueError(
-                'You have to specify pixel_values or pixel_embeds')
+            raise ValueError("You have to specify pixel_values or pixel_embeds")
 
         if pixel_embeds is not None:
             hidden_states = pixel_embeds
@@ -417,25 +434,21 @@ def forward(
             if pixel_values.ndim == 4:
                 hidden_states = self.embeddings(pixel_values)
             else:
-                raise ValueError(
-                    f'wrong pixel_values size: {pixel_values.shape}')
+                raise ValueError(f"wrong pixel_values size: {pixel_values.shape}")
 
         if self.use_data_parallel:
-            encoder_outputs = run_dp_sharded_vision_model(
-                hidden_states, self.encoder)
+            encoder_outputs = run_dp_sharded_vision_model(hidden_states, self.encoder)
         else:
             encoder_outputs = self.encoder(inputs_embeds=hidden_states)
 
         return encoder_outputs
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
diff --git a/vllm/model_executor/models/internlm2.py b/vllm/model_executor/models/internlm2.py
index 221ff08b4384..128791541b3d 100644
--- a/vllm/model_executor/models/internlm2.py
+++ b/vllm/model_executor/models/internlm2.py
@@ -13,33 +13,42 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (get_pp_group, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              split_tensor_along_last_dim,
-                              tensor_model_parallel_all_gather)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    split_tensor_along_last_dim,
+    tensor_model_parallel_all_gather,
+)
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.pooler import DispatchPooler, Pooler
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
 from .interfaces_base import default_pooling_type
-from .utils import (is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class InternLM2MLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -64,8 +73,9 @@ def __init__(
             prefix=f"{prefix}.w2",
         )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -76,7 +86,6 @@ def forward(self, x):
 
 
 class InternLM2Attention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -157,16 +166,16 @@ def split_qkv(self, qkv: torch.Tensor):
             qkv = qkv[::3] + qkv[1::3] + qkv[2::3]
             qkv = torch.cat(qkv, dim=-1)
 
-        qkv = qkv.view(seq_len, self.total_num_kv_heads,
-                       self.key_value_groups + 2, self.head_dim)
+        qkv = qkv.view(
+            seq_len, self.total_num_kv_heads, self.key_value_groups + 2, self.head_dim
+        )
         q, k, v = torch.split(qkv, [self.key_value_groups, 1, 1], dim=-2)
         q = q.reshape(seq_len, self.q_size * self.tp_size)
         k = k.reshape(seq_len, self.kv_size * self.tp_size)
         v = v.reshape(seq_len, self.kv_size * self.tp_size)
 
         if self.tp_size > 1:
-            splitter = partial(split_tensor_along_last_dim,
-                               num_partitions=self.tp_size)
+            splitter = partial(split_tensor_along_last_dim, num_partitions=self.tp_size)
             q = splitter(q)[self.tp_rank]
             k = splitter(k)[self.tp_rank]
             v = splitter(v)[self.tp_rank]
@@ -186,7 +195,6 @@ def forward(
 
 
 class InternLMDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -198,8 +206,7 @@ def __init__(
         self.hidden_size = config.hidden_size
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         self.attention = InternLM2Attention(
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
@@ -218,8 +225,7 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.feed_forward",
         )
-        self.attention_norm = RMSNorm(config.hidden_size,
-                                      eps=config.rms_norm_eps)
+        self.attention_norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         self.ffn_norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def forward(
@@ -233,8 +239,7 @@ def forward(
             residual = hidden_states
             hidden_states = self.attention_norm(hidden_states)
         else:
-            hidden_states, residual = self.attention_norm(
-                hidden_states, residual)
+            hidden_states, residual = self.attention_norm(hidden_states, residual)
         hidden_states = self.attention(
             positions=positions,
             hidden_states=hidden_states,
@@ -248,13 +253,13 @@ def forward(
 
 @support_torch_compile
 class InternLM2Model(nn.Module):
-
     def __init__(
-            self,
-            *,
-            vllm_config: VllmConfig,
-            prefix: str = "",
-            layer_type: type[InternLMDecoderLayer] = InternLMDecoderLayer):
+        self,
+        *,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        layer_type: type[InternLMDecoderLayer] = InternLMDecoderLayer,
+    ):
         super().__init__()
 
         config = vllm_config.model_config.hf_config
@@ -270,12 +275,14 @@ def __init__(
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: layer_type(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.layers",
+        )
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.tok_embeddings(input_ids)
@@ -300,10 +307,9 @@ def forward(
         for layer in islice(self.layers, self.start_layer, self.end_layer):
             hidden_states, residual = layer(positions, hidden_states, residual)
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
@@ -314,11 +320,13 @@ class InternLM2ForCausalLM(nn.Module, SupportsPP, SupportsLoRA):
         "gate_up_proj": ["w1", "w3"],
     }
 
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 model_type: type[InternLM2Model] = InternLM2Model):
+    def __init__(
+        self,
+        *,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        model_type: type[InternLM2Model] = InternLM2Model,
+    ):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
@@ -328,17 +336,21 @@ def __init__(self,
         self.quant_config = quant_config
         self.lora_config = lora_config
 
-        self.model = model_type(vllm_config=vllm_config,
-                                prefix=maybe_prefix(prefix, "model"))
-        self.output = ParallelLMHead(config.vocab_size,
-                                     config.hidden_size,
-                                     quant_config=quant_config,
-                                     prefix=maybe_prefix(prefix, "output"))
+        self.model = model_type(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
+        self.output = ParallelLMHead(
+            config.vocab_size,
+            config.hidden_size,
+            quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "output"),
+        )
         if self.config.tie_word_embeddings:
             self.output.weight = self.model.tok_embeddings.weight
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -350,8 +362,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors],
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -361,8 +374,7 @@ def compute_logits(
         logits = self.logits_processor(self.output, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("gate_up_proj", "w1", 0),
@@ -373,7 +385,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -393,8 +405,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -402,7 +413,6 @@ def load_weights(self, weights: Iterable[tuple[str,
 
 @default_pooling_type("ALL")
 class InternLM2ForRewardModel(InternLM2ForCausalLM):
-
     is_pooling_model = True
 
     def __init__(
@@ -412,9 +422,7 @@ def __init__(
         prefix: str = "",
         model_type: type[InternLM2Model] = InternLM2Model,
     ):
-        super().__init__(vllm_config=vllm_config,
-                         prefix=prefix,
-                         model_type=model_type)
+        super().__init__(vllm_config=vllm_config, prefix=prefix, model_type=model_type)
 
         for attr in ("output", "logits_processor"):
             delattr(self, attr)
@@ -422,19 +430,22 @@ def __init__(
         config = vllm_config.model_config.hf_config
         self.head_dtype = vllm_config.model_config.head_dtype
 
-        self.v_head = RowParallelLinear(config.hidden_size,
-                                        1,
-                                        bias=False,
-                                        input_is_parallel=False,
-                                        params_dtype=self.head_dtype,
-                                        prefix=maybe_prefix(prefix, "v_head"),
-                                        return_bias=False)
+        self.v_head = RowParallelLinear(
+            config.hidden_size,
+            1,
+            bias=False,
+            input_is_parallel=False,
+            params_dtype=self.head_dtype,
+            prefix=maybe_prefix(prefix, "v_head"),
+            return_bias=False,
+        )
 
         pooler_config = vllm_config.model_config.pooler_config
         assert pooler_config is not None
 
         self.pooler = DispatchPooler(
-            {"encode": Pooler.for_encode(pooler_config)}, )
+            {"encode": Pooler.for_encode(pooler_config)},
+        )
 
     def forward(
         self,
@@ -443,8 +454,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         hidden_states = hidden_states.to(self.head_dtype)
         logits = self.v_head(hidden_states)
         return logits
diff --git a/vllm/model_executor/models/internlm2_ve.py b/vllm/model_executor/models/internlm2_ve.py
index d41ac2b70bc6..5344ded280b2 100644
--- a/vllm/model_executor/models/internlm2_ve.py
+++ b/vllm/model_executor/models/internlm2_ve.py
@@ -12,14 +12,16 @@
 from vllm.distributed import get_pp_group
 from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.layers.quantization import QuantizationConfig
-from vllm.model_executor.models.internlm2 import (InternLM2Attention,
-                                                  InternLM2ForCausalLM,
-                                                  InternLM2MLP, InternLM2Model)
+from vllm.model_executor.models.internlm2 import (
+    InternLM2Attention,
+    InternLM2ForCausalLM,
+    InternLM2MLP,
+    InternLM2Model,
+)
 from vllm.sequence import IntermediateTensors
 
 
 class InternLM2VEDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -31,8 +33,7 @@ def __init__(
         self.hidden_size = config.hidden_size
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         self.attention = InternLM2Attention(
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
@@ -58,8 +59,7 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.feed_forward_ve",
         )
-        self.attention_norm = RMSNorm(config.hidden_size,
-                                      eps=config.rms_norm_eps)
+        self.attention_norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         self.ffn_norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def forward(
@@ -74,8 +74,7 @@ def forward(
             residual = hidden_states
             hidden_states = self.attention_norm(hidden_states)
         else:
-            hidden_states, residual = self.attention_norm(
-                hidden_states, residual)
+            hidden_states, residual = self.attention_norm(hidden_states, residual)
         hidden_states = self.attention(
             positions=positions,
             hidden_states=hidden_states,
@@ -84,27 +83,25 @@ def forward(
         # Fully Connected
         hidden_states, residual = self.ffn_norm(hidden_states, residual)
         if visual_token_mask is not None and visual_token_mask.any():
-            visual_token_mask = visual_token_mask.repeat(
-                1, self.hidden_size).bool()
+            visual_token_mask = visual_token_mask.repeat(1, self.hidden_size).bool()
             text_token_mask = ~visual_token_mask
             hidden_states[visual_token_mask] = self.feed_forward_ve(
-                hidden_states[visual_token_mask].reshape(
-                    -1, self.hidden_size)).flatten()
+                hidden_states[visual_token_mask].reshape(-1, self.hidden_size)
+            ).flatten()
             if text_token_mask.any():
                 hidden_states[text_token_mask] = self.feed_forward(
-                    hidden_states[text_token_mask].reshape(
-                        -1, self.hidden_size)).flatten()
+                    hidden_states[text_token_mask].reshape(-1, self.hidden_size)
+                ).flatten()
         else:
             hidden_states = self.feed_forward(hidden_states)
         return hidden_states, residual
 
 
 class InternLM2VEModel(InternLM2Model):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
-        super().__init__(vllm_config=vllm_config,
-                         prefix=prefix,
-                         layer_type=InternLM2VEDecoderLayer)
+        super().__init__(
+            vllm_config=vllm_config, prefix=prefix, layer_type=InternLM2VEDecoderLayer
+        )
 
     def forward(
         self,
@@ -132,17 +129,15 @@ def forward(
                 visual_token_mask=visual_token_mask,
             )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
 
 class InternLM2VEForCausalLM(InternLM2ForCausalLM):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
-        super().__init__(vllm_config=vllm_config,
-                         prefix=prefix,
-                         model_type=InternLM2VEModel)
+        super().__init__(
+            vllm_config=vllm_config, prefix=prefix, model_type=InternLM2VEModel
+        )
diff --git a/vllm/model_executor/models/interns1.py b/vllm/model_executor/models/interns1.py
index 7d82dad34a7a..06c7c8ccd0b5 100644
--- a/vllm/model_executor/models/interns1.py
+++ b/vllm/model_executor/models/interns1.py
@@ -15,9 +15,11 @@
 from transformers import BatchFeature, InternVLProcessor, PretrainedConfig
 from transformers.activations import ACT2FN
 from transformers.models.got_ocr2.image_processing_got_ocr2_fast import (
-    GotOcr2ImageProcessorFast)
+    GotOcr2ImageProcessorFast,
+)
 from transformers.models.internvl.video_processing_internvl import (
-    InternVLVideoProcessor)
+    InternVLVideoProcessor,
+)
 
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
@@ -25,38 +27,57 @@
 from vllm.model_executor.models.interns1_vit import InternS1VisionModel
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
-from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
-                                   ImageSize, MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
+from vllm.multimodal.parse import (
+    ImageEmbeddingItems,
+    ImageProcessorItems,
+    ImageSize,
+    MultiModalDataItems,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
-from vllm.transformers_utils.processor import (
-    cached_video_processor_from_config)
+from vllm.transformers_utils.processor import cached_video_processor_from_config
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP)
-from .utils import (AutoWeightsLoader, WeightsMapper,
-                    init_vllm_registered_model, maybe_prefix)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 
 
 class InternS1MultiModalProjector(nn.Module):
-
     def __init__(self, config):
         super().__init__()
-        self.layer_norm = nn.LayerNorm(config.vision_config.hidden_size *
-                                       int(1 / config.downsample_ratio)**2)
+        self.layer_norm = nn.LayerNorm(
+            config.vision_config.hidden_size * int(1 / config.downsample_ratio) ** 2
+        )
         self.linear_1 = nn.Linear(
-            config.vision_config.hidden_size *
-            int(1 / config.downsample_ratio)**2,
-            config.text_config.hidden_size)
+            config.vision_config.hidden_size * int(1 / config.downsample_ratio) ** 2,
+            config.text_config.hidden_size,
+        )
         self.act = ACT2FN[config.projector_hidden_act]
-        self.linear_2 = nn.Linear(config.text_config.hidden_size,
-                                  config.text_config.hidden_size)
+        self.linear_2 = nn.Linear(
+            config.text_config.hidden_size, config.text_config.hidden_size
+        )
 
     def forward(self, image_features):
         hidden_states = self.layer_norm(image_features)
@@ -75,6 +96,7 @@ class InternS1ImagePixelInputs(TensorSchema):
         - w: Width
         - bn: Batch size * number of images
     """
+
     type: Literal["pixel_values"] = "pixel_values"
     pixel_values: Annotated[torch.Tensor, TensorShape("bnp", 3, "h", "w")]
     num_patches: Annotated[torch.Tensor, TensorShape("bn")]
@@ -87,13 +109,14 @@ class InternS1ImageEmbeddingInputs(TensorSchema):
         - tifs: Total image feature size
         - hs: Hidden size (must match language model backbone)
     """
+
     type: Literal["image_embeds"] = "image_embeds"
-    data: Annotated[Union[torch.Tensor, list[torch.Tensor]],
-                    TensorShape("ni", "tifs", "hs")]
+    data: Annotated[
+        Union[torch.Tensor, list[torch.Tensor]], TensorShape("ni", "tifs", "hs")
+    ]
 
 
-InternS1ImageInputs = Union[InternS1ImagePixelInputs,
-                            InternS1ImageEmbeddingInputs]
+InternS1ImageInputs = Union[InternS1ImagePixelInputs, InternS1ImageEmbeddingInputs]
 
 
 class InternS1VideoPixelInputs(TensorSchema):
@@ -105,6 +128,7 @@ class InternS1VideoPixelInputs(TensorSchema):
         - h: Height
         - w: Width
     """
+
     type: Literal["pixel_values_videos"] = "pixel_values_videos"
     pixel_values: Annotated[torch.Tensor, TensorShape("bnv", 3, "h", "w")]
     num_patches: Annotated[torch.Tensor, TensorShape("bn")]
@@ -117,13 +141,14 @@ class InternS1VideoEmbeddingInputs(TensorSchema):
         - tvfs: Total video feature size
         - hs: Hidden size (must match language model backbone)
     """
+
     type: Literal["video_embeds"] = "video_embeds"
-    data: Annotated[Union[torch.Tensor, list[torch.Tensor]],
-                    TensorShape("nv", "tvfs", "hs")]
+    data: Annotated[
+        Union[torch.Tensor, list[torch.Tensor]], TensorShape("nv", "tvfs", "hs")
+    ]
 
 
-InternS1VideoInputs = Union[InternS1VideoPixelInputs,
-                            InternS1VideoEmbeddingInputs]
+InternS1VideoInputs = Union[InternS1VideoPixelInputs, InternS1VideoEmbeddingInputs]
 
 
 def resolve_interns1_min_max_num(
@@ -145,10 +170,13 @@ def get_interns1_target_ratios(
     min_num: int,
     max_num: int,
 ) -> list[tuple[int, int]]:
-    target_ratios = {(i, j)
-                     for n in range(min_num, max_num + 1)
-                     for i in range(1, n + 1)
-                     for j in range(1, n + 1) if min_num <= i * j <= max_num}
+    target_ratios = {
+        (i, j)
+        for n in range(min_num, max_num + 1)
+        for i in range(1, n + 1)
+        for j in range(1, n + 1)
+        if min_num <= i * j <= max_num
+    }
     return sorted(target_ratios, key=lambda x: x[0] * x[1])
 
 
@@ -158,9 +186,8 @@ class InternS1ProcessingInfo(BaseProcessingInfo):
     def get_hf_processor(self, **kwargs: object) -> InternVLProcessor:
         hf_processor = self.ctx.get_hf_processor(InternVLProcessor, **kwargs)
         hf_processor.video_processor = cached_video_processor_from_config(
-            self.ctx.model_config,
-            processor_cls=InternVLVideoProcessor,
-            **kwargs)
+            self.ctx.model_config, processor_cls=InternVLVideoProcessor, **kwargs
+        )
         return hf_processor
 
     def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
@@ -171,18 +198,19 @@ def get_num_image_tokens(
         *,
         image_width: int,
         image_height: int,
-        processor: Optional['GotOcr2ImageProcessorFast'] = None,
+        processor: Optional["GotOcr2ImageProcessorFast"] = None,
     ) -> int:
         if processor is None:
             processor = self.get_hf_processor().image_processor
 
         if not isinstance(processor, GotOcr2ImageProcessorFast):
-            raise ValueError(f'GotOcr2ImageProcessorFast is expected but got '
-                             f'{type(processor)}')
+            raise ValueError(
+                f"GotOcr2ImageProcessorFast is expected but got {type(processor)}"
+            )
         num_image_patches = processor.get_number_of_image_patches(
-            image_height, image_width, images_kwargs=dict())
-        num_image_tokens = self.get_hf_processor(
-        ).image_seq_length * num_image_patches
+            image_height, image_width, images_kwargs=dict()
+        )
+        num_image_tokens = self.get_hf_processor().image_seq_length * num_image_patches
         return num_image_tokens
 
     def resolve_target_ratios(self, use_thumbnail: Optional[bool] = None):
@@ -197,7 +225,8 @@ def resolve_target_ratios(self, use_thumbnail: Optional[bool] = None):
             min_dynamic_patch,
             max_dynamic_patch,
             dynamic_image_size,
-            use_thumbnail=use_thumbnail)
+            use_thumbnail=use_thumbnail,
+        )
 
         return get_interns1_target_ratios(min_num, max_num)
 
@@ -219,11 +248,11 @@ def get_image_size_with_most_features(self) -> ImageSize:
             )
             if feat_size > largest_feature_size:
                 largest_feature_size = feat_size
-                largest_feature_pinpoint = ImageSize(width=width,
-                                                     height=height)
+                largest_feature_pinpoint = ImageSize(width=width, height=height)
 
-        assert not (largest_feature_size == 0 or largest_feature_pinpoint
-                    is None), ("Cannot have a largest feature size of 0!")
+        assert not (largest_feature_size == 0 or largest_feature_pinpoint is None), (
+            "Cannot have a largest feature size of 0!"
+        )
 
         return largest_feature_pinpoint
 
@@ -248,15 +277,13 @@ def get_num_frames_with_most_features(
         processor = self.get_hf_processor()
 
         max_image_tokens = self.get_max_image_tokens() * max_images
-        max_total_frames = (seq_len -
-                            max_image_tokens) // processor.image_seq_length
+        max_total_frames = (seq_len - max_image_tokens) // processor.image_seq_length
         max_frames_per_video = max_total_frames // max(max_videos, 1)
 
         return max(max_frames_per_video, 1)
 
 
-class InternS1DummyInputsBuilder(BaseDummyInputsBuilder[InternS1ProcessingInfo]
-                                 ):
+class InternS1DummyInputsBuilder(BaseDummyInputsBuilder[InternS1ProcessingInfo]):
     """DummyInputsBuilder for InternS1-style models."""
 
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
@@ -273,10 +300,10 @@ def get_dummy_mm_data(
         mm_counts: Mapping[str, int],
         mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
-        target_num_frames = \
-                self.info.get_num_frames_with_most_features(seq_len, mm_counts)
+        target_width, target_height = self.info.get_image_size_with_most_features()
+        target_num_frames = self.info.get_num_frames_with_most_features(
+            seq_len, mm_counts
+        )
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
 
@@ -287,23 +314,24 @@ def get_dummy_mm_data(
         video_overrides = mm_options.get("video") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
-            "video":
-            self._get_dummy_videos(width=image_size_w,
-                                   height=image_size_h,
-                                   num_frames=target_num_frames,
-                                   num_videos=num_videos,
-                                   overrides=video_overrides),
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
+            "video": self._get_dummy_videos(
+                width=image_size_w,
+                height=image_size_h,
+                num_frames=target_num_frames,
+                num_videos=num_videos,
+                overrides=video_overrides,
+            ),
         }
 
 
-class InternS1MultiModalProcessor(
-        BaseMultiModalProcessor[InternS1ProcessingInfo]):
-    """ Basic image-only MultiModalProcessor for InternS1-style models."""
+class InternS1MultiModalProcessor(BaseMultiModalProcessor[InternS1ProcessingInfo]):
+    """Basic image-only MultiModalProcessor for InternS1-style models."""
 
     def _call_hf_processor(
         self,
@@ -320,15 +348,14 @@ def _call_hf_processor(
 
         hf_processor = self.info.get_hf_processor(**mm_kwargs)
         tokenizer = hf_processor.tokenizer
-        video_token_id = tokenizer.encode(hf_processor.video_token,
-                                          add_special_tokens=False)
+        video_token_id = tokenizer.encode(
+            hf_processor.video_token, add_special_tokens=False
+        )
         assert len(video_token_id) == 1
         video_token_id = video_token_id[0]
 
-        prompt = re.sub(hf_processor.image_token, "<image_placeholder>",
-                        prompt)
-        prompt = re.sub(hf_processor.video_token, "<video_placeholder>",
-                        prompt)
+        prompt = re.sub(hf_processor.image_token, "<image_placeholder>", prompt)
+        prompt = re.sub(hf_processor.video_token, "<video_placeholder>", prompt)
 
         image_outputs = {}
         if images:
@@ -340,13 +367,11 @@ def _call_hf_processor(
                     mm_kwargs=mm_kwargs,
                     tok_kwargs=tok_kwargs,
                 )
-                image_pixel_values.append(
-                    processed_outputs.pop("pixel_values"))
+                image_pixel_values.append(processed_outputs.pop("pixel_values"))
 
                 input_ids = processed_outputs.pop("input_ids")
                 image_placeholder = tokenizer.batch_decode(input_ids)[0]
-                prompt = prompt.replace("<image_placeholder>",
-                                        image_placeholder, 1)
+                prompt = prompt.replace("<image_placeholder>", image_placeholder, 1)
 
             num_patches = [len(item) for item in image_pixel_values]
             image_outputs = {
@@ -365,16 +390,13 @@ def _call_hf_processor(
                     mm_kwargs=mm_kwargs,
                     tok_kwargs=tok_kwargs,
                 )
-                video_pixel_values.append(
-                    processed_outputs.pop("pixel_values"))
+                video_pixel_values.append(processed_outputs.pop("pixel_values"))
 
                 input_ids = processed_outputs.pop("input_ids")
-                input_ids[input_ids ==
-                          hf_processor.image_token_id] = video_token_id
+                input_ids[input_ids == hf_processor.image_token_id] = video_token_id
 
                 video_placeholder = tokenizer.batch_decode(input_ids)[0]
-                prompt = prompt.replace("<video_placeholder>",
-                                        video_placeholder, 1)
+                prompt = prompt.replace("<video_placeholder>", video_placeholder, 1)
 
             num_frames = [len(item) for item in video_pixel_values]
             video_outputs = {
@@ -383,10 +405,8 @@ def _call_hf_processor(
                 "video_token_id": torch.tensor(video_token_id),
             }
 
-        prompt = re.sub("<image_placeholder>", hf_processor.image_token,
-                        prompt)
-        prompt = re.sub("<video_placeholder>", hf_processor.video_token,
-                        prompt)
+        prompt = re.sub("<image_placeholder>", hf_processor.image_token, prompt)
+        prompt = re.sub("<video_placeholder>", hf_processor.video_token, prompt)
         text_outputs = tokenizer(prompt, **tok_kwargs, return_tensors="pt")
 
         return BatchFeature({**text_outputs, **image_outputs, **video_outputs})
@@ -396,7 +416,6 @@ def _get_mm_fields_config(
         hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
-
         image_num_patches = hf_inputs.get("image_num_patches", torch.empty(0))
         video_num_patches = hf_inputs.get("video_num_patches", torch.empty(0))
         num_images = len(image_num_patches)
@@ -404,12 +423,14 @@ def _get_mm_fields_config(
 
         return dict(
             pixel_values=MultiModalFieldConfig.flat_from_sizes(
-                "image", image_num_patches),
+                "image", image_num_patches
+            ),
             image_num_patches=MultiModalFieldConfig.batched("image"),
             image_embeds=MultiModalFieldConfig.batched("image"),
             image_token_id=MultiModalFieldConfig.shared("image", num_images),
             pixel_values_videos=MultiModalFieldConfig.flat_from_sizes(
-                "video", video_num_patches),
+                "video", video_num_patches
+            ),
             video_num_patches=MultiModalFieldConfig.batched("video"),
             video_token_id=MultiModalFieldConfig.shared("video", num_videos),
         )
@@ -443,7 +464,8 @@ def _get_prompt_updates(
 
         def get_replacement_interns1_image(item_idx: int):
             images = mm_items.get_items(
-                "image", (ImageEmbeddingItems, ImageProcessorItems))
+                "image", (ImageEmbeddingItems, ImageProcessorItems)
+            )
 
             if isinstance(images, ImageEmbeddingItems):
                 feature_size = images.get_feature_size(item_idx)
@@ -453,19 +475,16 @@ def get_replacement_interns1_image(item_idx: int):
 
             repl_features = img_context_token * feature_size
             repl_full = start_image_token + repl_features + end_image_token
-            return PromptUpdateDetails.select_text(repl_full,
-                                                   img_context_token)
+            return PromptUpdateDetails.select_text(repl_full, img_context_token)
 
         def get_replacement_interns1_video(item_idx: int):
             num_patches = video_num_patches[item_idx]
             repl_features = video_token * hf_processor.image_seq_length
-            repl_features_with_sep = (start_image_token + repl_features +
-                                      end_image_token)
+            repl_features_with_sep = start_image_token + repl_features + end_image_token
             # num_patches is equal to num_frames
-            repl_full = '\n'.join([
-                f'Frame{i+1}: {repl_features_with_sep}'
-                for i in range(num_patches)
-            ])
+            repl_full = "\n".join(
+                [f"Frame{i + 1}: {repl_features_with_sep}" for i in range(num_patches)]
+            )
 
             return PromptUpdateDetails.select_text(repl_full, video_token)
 
@@ -486,9 +505,11 @@ def get_replacement_interns1_video(item_idx: int):
 @MULTIMODAL_REGISTRY.register_processor(
     InternS1MultiModalProcessor,
     info=InternS1ProcessingInfo,
-    dummy_inputs=InternS1DummyInputsBuilder)
-class InternS1ForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                       SupportsPP, SupportsLoRA):
+    dummy_inputs=InternS1DummyInputsBuilder,
+)
+class InternS1ForConditionalGeneration(
+    nn.Module, SupportsMultiModal, SupportsPP, SupportsLoRA
+):
     merge_by_field_config = True
 
     # To ensure correct weight loading and mapping.
@@ -498,14 +519,15 @@ class InternS1ForConditionalGeneration(nn.Module, SupportsMultiModal,
             "model.language_model.": "language_model.model.",
             "model.vision_tower.": "vision_tower.",
             "model.multi_modal_projector.": "multi_modal_projector.",
-        })
+        }
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
         # transformers InternVLProcessor uses <IMG_CONTEXT> as the separator
         # refer to https://github.com/huggingface/transformers/blob/f90de364c2484c7c325bbe05befdcf487bd75b63/src/transformers/models/internvl/processing_internvl.py#L116
         if modality.startswith("image"):
-            return '<IMG_CONTEXT>'
+            return "<IMG_CONTEXT>"
         if modality.startswith("video"):
             return "<video>"
 
@@ -524,7 +546,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         patch_size = config.vision_config.patch_size[0]
         self.patch_size = patch_size
         self.num_image_token = int(
-            (image_size // patch_size)**2 * (config.downsample_ratio**2))
+            (image_size // patch_size) ** 2 * (config.downsample_ratio**2)
+        )
         self.downsample_ratio = config.downsample_ratio
 
         self.llm_arch_name = config.text_config.architectures[0]
@@ -547,7 +570,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
 
         self.visual_token_mask = None
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _init_vision_model(
         self,
@@ -573,8 +597,12 @@ def pixel_shuffle(self, x, scale_factor=0.5):
         x = x.view(n, w, int(h * scale_factor), int(c / scale_factor))
         # N, W, H * scale, C // scale --> N, H * scale, W, C // scale
         x = x.permute(0, 2, 1, 3).contiguous()
-        x = x.view(n, int(h * scale_factor), int(w * scale_factor),
-                   int(c / (scale_factor * scale_factor)))
+        x = x.view(
+            n,
+            int(h * scale_factor),
+            int(w * scale_factor),
+            int(c / (scale_factor * scale_factor)),
+        )
         x = x.permute(0, 2, 1, 3).contiguous()
         return x
 
@@ -582,18 +610,17 @@ def extract_feature(self, pixel_values: torch.Tensor) -> torch.Tensor:
         vit_embeds = self.vision_tower(pixel_values=pixel_values)
         vit_embeds = vit_embeds[:, 1:, :]
 
-        h = w = int(vit_embeds.shape[1]**0.5)
+        h = w = int(vit_embeds.shape[1] ** 0.5)
         vit_embeds = vit_embeds.reshape(vit_embeds.shape[0], h, w, -1)
-        vit_embeds = self.pixel_shuffle(vit_embeds,
-                                        scale_factor=self.downsample_ratio)
-        vit_embeds = vit_embeds.reshape(vit_embeds.shape[0], -1,
-                                        vit_embeds.shape[-1])
+        vit_embeds = self.pixel_shuffle(vit_embeds, scale_factor=self.downsample_ratio)
+        vit_embeds = vit_embeds.reshape(vit_embeds.shape[0], -1, vit_embeds.shape[-1])
 
         vit_embeds = self.multi_modal_projector(vit_embeds)
         return vit_embeds
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[InternS1ImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[InternS1ImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_num_patches = kwargs.pop("image_num_patches", None)
         image_embeds = kwargs.pop("image_embeds", None)
@@ -626,7 +653,8 @@ def _parse_and_validate_image_input(
         raise AssertionError("This line should be unreachable.")
 
     def _parse_and_validate_video_input(
-            self, **kwargs: object) -> Optional[InternS1VideoInputs]:
+        self, **kwargs: object
+    ) -> Optional[InternS1VideoInputs]:
         pixel_values_flat_video = kwargs.pop("pixel_values_videos", None)
         video_num_patches = kwargs.pop("video_num_patches", None)
         video_embeds = kwargs.pop("video_embeds", None)
@@ -662,8 +690,10 @@ def _process_vision_input(
         self,
         image_input: Union[InternS1ImageInputs, InternS1VideoInputs],
     ) -> tuple[torch.Tensor, ...]:
-        if (image_input["type"] == "image_embeds"
-                or image_input["type"] == "video_embeds"):
+        if (
+            image_input["type"] == "image_embeds"
+            or image_input["type"] == "video_embeds"
+        ):
             return image_input["data"]
 
         assert self.vision_tower is not None
@@ -674,14 +704,12 @@ def _process_vision_input(
 
         # Only one image in the current batch
         if len(num_patches) == 1:
-            return (image_embeds.view(-1,
-                                      self.config.text_config.hidden_size), )
+            return (image_embeds.view(-1, self.config.text_config.hidden_size),)
 
         # NOTE: Image embeddings are split into separate tensors for each image
         # by the size of each embedding.
         feature_size = image_embeds.shape[1]
-        image_embeds = image_embeds.view(-1,
-                                         self.config.text_config.hidden_size)
+        image_embeds = image_embeds.view(-1, self.config.text_config.hidden_size)
         image_feature_sizes = [
             num_patches * feature_size for num_patches in num_patches
         ]
@@ -693,14 +721,13 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if input_key in ("pixel_values",
-                             "image_embeds") and "images" not in modalities:
-                modalities["images"] = self._parse_and_validate_image_input(
-                    **kwargs)
-            if input_key in (
-                    "pixel_values_videos", ) and "videos" not in modalities:
-                modalities["videos"] = self._parse_and_validate_video_input(
-                    **kwargs)
+            if (
+                input_key in ("pixel_values", "image_embeds")
+                and "images" not in modalities
+            ):
+                modalities["images"] = self._parse_and_validate_image_input(**kwargs)
+            if input_key in ("pixel_values_videos",) and "videos" not in modalities:
+                modalities["videos"] = self._parse_and_validate_video_input(**kwargs)
 
         return modalities
 
@@ -710,9 +737,7 @@ def _set_visual_token_mask(self, input_ids: torch.Tensor) -> None:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
-
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
@@ -743,8 +768,7 @@ def get_input_embeddings(
         is_multimodal: Optional[torch.Tensor] = None,
         handle_oov_mm_token: bool = False,
     ) -> torch.Tensor:
-        if multimodal_embeddings is not None and len(
-                multimodal_embeddings) > 0:
+        if multimodal_embeddings is not None and len(multimodal_embeddings) > 0:
             self._set_visual_token_mask(input_ids)
 
         # This is to satisfy the type checker for each overload
@@ -766,7 +790,6 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs: object,
     ) -> IntermediateTensors:
-
         if intermediate_tensors is not None:
             input_ids = None
             inputs_embeds = None
@@ -787,8 +810,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
@@ -799,4 +821,5 @@ def get_mm_mapping(self) -> MultiModelKeys:
         return MultiModelKeys.from_string_field(
             language_model="language_model",
             connector="multi_modal_projector",
-            tower_model="vision_tower")
+            tower_model="vision_tower",
+        )
diff --git a/vllm/model_executor/models/interns1_vit.py b/vllm/model_executor/models/interns1_vit.py
index eb6b685d03dc..f5965bdf7c9c 100644
--- a/vllm/model_executor/models/interns1_vit.py
+++ b/vllm/model_executor/models/interns1_vit.py
@@ -18,48 +18,45 @@
 from vllm.attention.layer import MultiHeadAttention
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import ColumnParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 
 NORM2FN = {
-    'rms_norm': RMSNorm,
-    'layer_norm': nn.LayerNorm,
+    "rms_norm": RMSNorm,
+    "layer_norm": nn.LayerNorm,
 }
 
 
 class InternS1VisionPatchEmbeddings(nn.Module):
-
     def __init__(self, config):
         super().__init__()
         image_size, patch_size = config.image_size, config.patch_size
         num_channels, hidden_size = config.num_channels, config.hidden_size
 
-        num_patches = (image_size[1] // patch_size[1]) * (image_size[0] //
-                                                          patch_size[0])
-        patch_shape = (image_size[0] // patch_size[0],
-                       image_size[1] // patch_size[1])
+        num_patches = (image_size[1] // patch_size[1]) * (
+            image_size[0] // patch_size[0]
+        )
+        patch_shape = (image_size[0] // patch_size[0], image_size[1] // patch_size[1])
         self.image_size = image_size
         self.patch_size = patch_size
         self.num_channels = num_channels
         self.num_patches = num_patches
         self.patch_shape = patch_shape
 
-        self.projection = nn.Conv2d(num_channels,
-                                    hidden_size,
-                                    kernel_size=patch_size,
-                                    stride=patch_size)
+        self.projection = nn.Conv2d(
+            num_channels, hidden_size, kernel_size=patch_size, stride=patch_size
+        )
 
     def forward(self, pixel_values: torch.Tensor) -> torch.Tensor:
         batch_size, num_channels, height, width = pixel_values.shape
         if num_channels != self.num_channels:
             raise ValueError(
                 "Make sure that the channel dimension of the pixel values "
-                "match with the one set in the configuration.")
+                "match with the one set in the configuration."
+            )
 
-        embeddings = self.projection(
-            pixel_values.to(self.projection.weight.dtype))
+        embeddings = self.projection(pixel_values.to(self.projection.weight.dtype))
         patch_height, patch_width = embeddings.shape[2], embeddings.shape[3]
         embeddings = embeddings.flatten(2).transpose(1, 2)
 
@@ -67,30 +64,32 @@ def forward(self, pixel_values: torch.Tensor) -> torch.Tensor:
 
 
 class InternS1VisionEmbeddings(nn.Module):
-
     def __init__(self, config: PretrainedConfig):
         super().__init__()
         self.config = config
         self.cls_token = nn.Parameter(torch.zeros(1, 1, config.hidden_size))
         if config.use_mask_token:
-            self.mask_token = nn.Parameter(
-                torch.zeros(1, 1, config.hidden_size))
+            self.mask_token = nn.Parameter(torch.zeros(1, 1, config.hidden_size))
         else:
             self.mask_token = None
         self.patch_embeddings = InternS1VisionPatchEmbeddings(config)
         self.patch_size = config.patch_size
-        self.image_size = (config.image_size if isinstance(
-            config.image_size, Iterable) else
-                           (config.image_size, config.image_size))
+        self.image_size = (
+            config.image_size
+            if isinstance(config.image_size, Iterable)
+            else (config.image_size, config.image_size)
+        )
         num_patches = self.patch_embeddings.num_patches
         if config.use_absolute_position_embeddings:
             self.position_embeddings = nn.Parameter(
-                torch.zeros(1, num_patches + 1, config.hidden_size))
+                torch.zeros(1, num_patches + 1, config.hidden_size)
+            )
         else:
             self.position_embeddings = None
 
-    def interpolate_pos_encoding(self, embeddings: torch.Tensor, height: int,
-                                 width: int) -> torch.Tensor:
+    def interpolate_pos_encoding(
+        self, embeddings: torch.Tensor, height: int, width: int
+    ) -> torch.Tensor:
         """
         This method allows to interpolate the pre-trained position encodings, to be able to use the model on higher resolution
         images. This method is also adapted to support torch.jit tracing.
@@ -105,8 +104,11 @@ def interpolate_pos_encoding(self, embeddings: torch.Tensor, height: int,
 
         # always interpolate when tracing to ensure the exported model
         # works for dynamic input shapes
-        if not torch.jit.is_tracing(
-        ) and num_patches == num_positions and height == width:
+        if (
+            not torch.jit.is_tracing()
+            and num_patches == num_positions
+            and height == width
+        ):
             return self.position_embeddings
 
         class_pos_embed = self.position_embeddings[:, :1]
@@ -118,8 +120,9 @@ def interpolate_pos_encoding(self, embeddings: torch.Tensor, height: int,
         new_width = width // self.patch_size[1]
 
         sqrt_num_positions = torch_int(num_positions**0.5)
-        patch_pos_embed = patch_pos_embed.reshape(1, sqrt_num_positions,
-                                                  sqrt_num_positions, dim)
+        patch_pos_embed = patch_pos_embed.reshape(
+            1, sqrt_num_positions, sqrt_num_positions, dim
+        )
         patch_pos_embed = patch_pos_embed.permute(0, 3, 1, 2)
 
         patch_pos_embed = nn.functional.interpolate(
@@ -139,8 +142,7 @@ def forward(
         bool_masked_pos: Optional[torch.BoolTensor] = None,
     ) -> torch.Tensor:
         _, _, height, width = pixel_values.shape
-        embeddings, (patch_height,
-                     patch_width) = self.patch_embeddings(pixel_values)
+        embeddings, (patch_height, patch_width) = self.patch_embeddings(pixel_values)
         batch_size, seq_len, _ = embeddings.size()
 
         if bool_masked_pos is not None:
@@ -154,7 +156,8 @@ def forward(
 
         if self.position_embeddings is not None:
             embeddings = embeddings + self.interpolate_pos_encoding(
-                embeddings, height, width)
+                embeddings, height, width
+            )
 
         return embeddings, (patch_height, patch_width)
 
@@ -176,39 +179,43 @@ def __init__(
         self.head_dim = self.embed_dim // self.num_heads
         if self.head_dim * self.num_heads != self.embed_dim:
             raise ValueError(
-                f'embed_dim must be divisible by num_heads '
-                f'(got `embed_dim`: {self.embed_dim} and `num_heads`:'
-                f' {self.num_heads}).')
+                f"embed_dim must be divisible by num_heads "
+                f"(got `embed_dim`: {self.embed_dim} and `num_heads`:"
+                f" {self.num_heads})."
+            )
 
         # Additional dummy heads are used to enable TP for common GPU counts.
         self.dummy_dim = (num_dummy_heads + self.num_heads) * self.head_dim
 
         self.scale = self.head_dim**-0.5
 
-        self.q_proj = nn.Linear(self.embed_dim,
-                                self.num_heads * self.head_dim,
-                                bias=config.attention_bias)
-        self.k_proj = nn.Linear(self.embed_dim,
-                                self.num_heads * self.head_dim,
-                                bias=config.attention_bias)
-        self.v_proj = nn.Linear(self.embed_dim,
-                                self.num_heads * self.head_dim,
-                                bias=config.attention_bias)
+        self.q_proj = nn.Linear(
+            self.embed_dim, self.num_heads * self.head_dim, bias=config.attention_bias
+        )
+        self.k_proj = nn.Linear(
+            self.embed_dim, self.num_heads * self.head_dim, bias=config.attention_bias
+        )
+        self.v_proj = nn.Linear(
+            self.embed_dim, self.num_heads * self.head_dim, bias=config.attention_bias
+        )
 
         self.qk_normalization = config.use_qk_norm
         if self.qk_normalization:
-            self.q_norm = RMSNorm(self.dummy_dim,
-                                  eps=config.layer_norm_eps,
-                                  var_hidden_size=self.embed_dim)
-            self.k_norm = RMSNorm(self.dummy_dim,
-                                  eps=config.layer_norm_eps,
-                                  var_hidden_size=self.embed_dim)
+            self.q_norm = RMSNorm(
+                self.dummy_dim,
+                eps=config.layer_norm_eps,
+                var_hidden_size=self.embed_dim,
+            )
+            self.k_norm = RMSNorm(
+                self.dummy_dim,
+                eps=config.layer_norm_eps,
+                var_hidden_size=self.embed_dim,
+            )
 
         self.projection_layer = nn.Linear(self.dummy_dim, self.embed_dim)
 
         # Use unified MultiHeadAttention with automatic backend selection
-        self.attn = MultiHeadAttention(self.num_heads, self.head_dim,
-                                       self.scale)
+        self.attn = MultiHeadAttention(self.num_heads, self.head_dim, self.scale)
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         B, N, C = x.shape
@@ -230,7 +237,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class InternS1VisionMLP(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -241,16 +247,20 @@ def __init__(
 
         self.config = config
         self.activation_fn = get_act_fn(config.hidden_act)
-        self.fc1 = ColumnParallelLinear(config.hidden_size,
-                                        config.intermediate_size,
-                                        bias=True,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.fc1")
-        self.fc2 = RowParallelLinear(config.intermediate_size,
-                                     config.hidden_size,
-                                     bias=True,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.fc2")
+        self.fc1 = ColumnParallelLinear(
+            config.hidden_size,
+            config.intermediate_size,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc1",
+        )
+        self.fc2 = RowParallelLinear(
+            config.intermediate_size,
+            config.hidden_size,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc2",
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         hidden_states, _ = self.fc1(hidden_states)
@@ -261,7 +271,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class InternS1VisionLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -272,26 +281,30 @@ def __init__(
     ) -> None:
         super().__init__()
 
-        self.attention = self._init_attn(config,
-                                         quant_config,
-                                         num_dummy_heads=num_dummy_heads,
-                                         prefix=f"{prefix}.attention")
+        self.attention = self._init_attn(
+            config,
+            quant_config,
+            num_dummy_heads=num_dummy_heads,
+            prefix=f"{prefix}.attention",
+        )
 
-        self.mlp = InternS1VisionMLP(config,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.mlp")
+        self.mlp = InternS1VisionMLP(
+            config, quant_config=quant_config, prefix=f"{prefix}.mlp"
+        )
         self.layernorm_before = NORM2FN[config.norm_type](
-            config.hidden_size, eps=config.layer_norm_eps)
+            config.hidden_size, eps=config.layer_norm_eps
+        )
         self.layernorm_after = NORM2FN[config.norm_type](
-            config.hidden_size, eps=config.layer_norm_eps)
+            config.hidden_size, eps=config.layer_norm_eps
+        )
 
         init_values = config.layer_scale_init_value
-        self.lambda_1 = nn.Parameter(init_values *
-                                     torch.ones(config.hidden_size),
-                                     requires_grad=True)
-        self.lambda_2 = nn.Parameter(init_values *
-                                     torch.ones(config.hidden_size),
-                                     requires_grad=True)
+        self.lambda_1 = nn.Parameter(
+            init_values * torch.ones(config.hidden_size), requires_grad=True
+        )
+        self.lambda_2 = nn.Parameter(
+            init_values * torch.ones(config.hidden_size), requires_grad=True
+        )
 
     def _init_attn(
         self,
@@ -307,17 +320,20 @@ def forward(
         self,
         hidden_states: torch.Tensor,
     ):
-        hidden_states = hidden_states + self.attention(
-            self.layernorm_before(hidden_states)) * self.lambda_1
+        hidden_states = (
+            hidden_states
+            + self.attention(self.layernorm_before(hidden_states)) * self.lambda_1
+        )
 
-        hidden_states = hidden_states + self.mlp(
-            self.layernorm_after(hidden_states)) * self.lambda_2
+        hidden_states = (
+            hidden_states
+            + self.mlp(self.layernorm_after(hidden_states)) * self.lambda_2
+        )
 
         return hidden_states
 
 
 class InternS1VisionEncoder(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -336,16 +352,19 @@ def __init__(
         else:
             num_hidden_layers = num_hidden_layers_override
 
-        self.layer = nn.ModuleList([
-            InternS1VisionLayer(config,
-                                quant_config,
-                                num_dummy_heads=num_dummy_heads,
-                                prefix=f"{prefix}.layer.{layer_idx}")
-            for layer_idx in range(num_hidden_layers)
-        ])
+        self.layer = nn.ModuleList(
+            [
+                InternS1VisionLayer(
+                    config,
+                    quant_config,
+                    num_dummy_heads=num_dummy_heads,
+                    prefix=f"{prefix}.layer.{layer_idx}",
+                )
+                for layer_idx in range(num_hidden_layers)
+            ]
+        )
 
     def forward(self, inputs_embeds: torch.Tensor):
-
         hidden_states = inputs_embeds
         for encoder_layer in self.layer:
             hidden_states = encoder_layer(hidden_states)
@@ -354,7 +373,6 @@ def forward(self, inputs_embeds: torch.Tensor):
 
 
 class InternS1VisionModel(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -375,9 +393,11 @@ def __init__(
             num_dummy_heads=num_dummy_heads,
             prefix=f"{prefix}.encoder",
         )
-        self.layernorm = (nn.Identity() if config.use_mean_pooling else
-                          nn.LayerNorm(config.hidden_size,
-                                       eps=config.layer_norm_eps))
+        self.layernorm = (
+            nn.Identity()
+            if config.use_mean_pooling
+            else nn.LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
+        )
 
     def get_input_embeddings(self):
         return self.embeddings.patch_embeddings
@@ -388,8 +408,7 @@ def forward(
         pixel_embeds: Optional[torch.Tensor] = None,
     ) -> torch.FloatTensor:
         if pixel_values is None and pixel_embeds is None:
-            raise ValueError(
-                'You have to specify pixel_values or pixel_embeds')
+            raise ValueError("You have to specify pixel_values or pixel_embeds")
 
         if pixel_embeds is not None:
             hidden_states = pixel_embeds
@@ -397,22 +416,19 @@ def forward(
             if pixel_values.ndim == 4:
                 hidden_states, _ = self.embeddings(pixel_values)
             else:
-                raise ValueError(
-                    f'wrong pixel_values size: {pixel_values.shape}')
+                raise ValueError(f"wrong pixel_values size: {pixel_values.shape}")
 
         encoder_outputs = self.encoder(inputs_embeds=hidden_states)
         encoder_outputs = self.layernorm(encoder_outputs)
 
         return encoder_outputs
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
diff --git a/vllm/model_executor/models/internvl.py b/vllm/model_executor/models/internvl.py
index 48ea5a18a22d..3cd3807dd888 100644
--- a/vllm/model_executor/models/internvl.py
+++ b/vllm/model_executor/models/internvl.py
@@ -23,31 +23,48 @@
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.awq import AWQConfig
-from vllm.model_executor.models.intern_vit import (InternVisionModel,
-                                                   InternVisionPatchModel)
+from vllm.model_executor.models.intern_vit import (
+    InternVisionModel,
+    InternVisionPatchModel,
+)
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.image import convert_image_mode
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
-from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
-                                   ImageSize, MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
+from vllm.multimodal.parse import (
+    ImageEmbeddingItems,
+    ImageProcessorItems,
+    ImageSize,
+    MultiModalDataItems,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 from vllm.utils import set_default_torch_num_threads
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
 from .utils import AutoWeightsLoader, init_vllm_registered_model, maybe_prefix
 
-IMG_START = '<img>'
-IMG_END = '</img>'
-IMG_CONTEXT = '<IMG_CONTEXT>'
+IMG_START = "<img>"
+IMG_END = "</img>"
+IMG_CONTEXT = "<IMG_CONTEXT>"
 
 IMAGENET_MEAN = (0.485, 0.456, 0.406)
 IMAGENET_STD = (0.229, 0.224, 0.225)
@@ -62,6 +79,7 @@ class InternVLImagePixelInputs(TensorSchema):
         - h: Height of each image patch
         - w: Width of each image patch
     """
+
     type: Literal["pixel_values"]
     pixel_values_flat: Annotated[torch.Tensor, TensorShape("bnp", 3, "h", "w")]
     num_patches: Annotated[torch.Tensor, TensorShape("bn")]
@@ -74,13 +92,12 @@ class InternVLImageEmbeddingInputs(TensorSchema):
         - f: Total image feature size
         - h: Hidden size (must match the hidden size of language model backbone)
     """
+
     type: Literal["image_embeds"]
-    data: Annotated[Union[torch.Tensor, list[torch.Tensor]],
-                    TensorShape("n", "f", "h")]
+    data: Annotated[Union[torch.Tensor, list[torch.Tensor]], TensorShape("n", "f", "h")]
 
 
-InternVLImageInputs = Union[InternVLImagePixelInputs,
-                            InternVLImageEmbeddingInputs]
+InternVLImageInputs = Union[InternVLImagePixelInputs, InternVLImageEmbeddingInputs]
 
 
 class InternVLVideoPixelInputs(TensorSchema):
@@ -92,6 +109,7 @@ class InternVLVideoPixelInputs(TensorSchema):
         - h: Height of each video frame
         - w: Width of each video frame
     """
+
     type: Literal["pixel_values_videos"]
     pixel_values_flat: Annotated[torch.Tensor, TensorShape("bvf", 3, "h", "w")]
     num_patches: Annotated[torch.Tensor, TensorShape("bn")]
@@ -104,25 +122,27 @@ class InternVLVideoEmbeddingInputs(TensorSchema):
         - f: Total video feature size
         - h: Hidden size (must match the hidden size of language model backbone)
     """
+
     type: Literal["video_embeds"]
-    data: Annotated[Union[torch.Tensor, list[torch.Tensor]],
-                    TensorShape("n", "f", "h")]
+    data: Annotated[Union[torch.Tensor, list[torch.Tensor]], TensorShape("n", "f", "h")]
 
 
-InternVLVideoInputs = Union[InternVLVideoPixelInputs,
-                            InternVLVideoEmbeddingInputs]
+InternVLVideoInputs = Union[InternVLVideoPixelInputs, InternVLVideoEmbeddingInputs]
 
 
 # adapted from https://huggingface.co/OpenGVLab/InternVL2-1B
 def build_transform(input_size: int):
     MEAN, STD = IMAGENET_MEAN, IMAGENET_STD
-    transform = T.Compose([
-        T.Lambda(lambda img: convert_image_mode(img, 'RGB')),
-        T.Resize((input_size, input_size),
-                 interpolation=T.InterpolationMode.BICUBIC),
-        T.ToTensor(),
-        T.Normalize(mean=MEAN, std=STD)
-    ])
+    transform = T.Compose(
+        [
+            T.Lambda(lambda img: convert_image_mode(img, "RGB")),
+            T.Resize(
+                (input_size, input_size), interpolation=T.InterpolationMode.BICUBIC
+            ),
+            T.ToTensor(),
+            T.Normalize(mean=MEAN, std=STD),
+        ]
+    )
     # Image transformation operations (which include tensor computations
     # on the CPU) can occupy a substantial number of CPU cores, introducing
     # overhead due to CPU contention. This issue becomes particularly
@@ -147,7 +167,7 @@ def find_closest_aspect_ratio(
     height: int,
     image_size: int,
 ) -> tuple[int, int]:
-    best_ratio_diff = float('inf')
+    best_ratio_diff = float("inf")
     best_ratio = (1, 1)
     area = width * height
     for ratio in target_ratios:
@@ -182,10 +202,13 @@ def get_internvl_target_ratios(
     min_num: int,
     max_num: int,
 ) -> list[tuple[int, int]]:
-    target_ratios = {(i, j)
-                     for n in range(min_num, max_num + 1)
-                     for i in range(1, n + 1)
-                     for j in range(1, n + 1) if min_num <= i * j <= max_num}
+    target_ratios = {
+        (i, j)
+        for n in range(min_num, max_num + 1)
+        for i in range(1, n + 1)
+        for j in range(1, n + 1)
+        if min_num <= i * j <= max_num
+    }
     return sorted(target_ratios, key=lambda x: x[0] * x[1])
 
 
@@ -243,10 +266,12 @@ def dynamic_preprocess_internvl(
     resized_img = image.resize((target_width, target_height))
     processed_images = []
     for i in range(blocks):
-        box = ((i % (target_width // image_size)) * image_size,
-               (i // (target_width // image_size)) * image_size,
-               ((i % (target_width // image_size)) + 1) * image_size,
-               ((i // (target_width // image_size)) + 1) * image_size)
+        box = (
+            (i % (target_width // image_size)) * image_size,
+            (i // (target_width // image_size)) * image_size,
+            ((i % (target_width // image_size)) + 1) * image_size,
+            ((i // (target_width // image_size)) + 1) * image_size,
+        )
         # split the image
         split_img = resized_img.crop(box)
         processed_images.append(split_img)
@@ -349,7 +374,8 @@ def __init__(
         assert isinstance(dynamic_image_size, bool)
 
         self.num_image_token = int(
-            (image_size // patch_size)**2 * (config.downsample_ratio**2))
+            (image_size // patch_size) ** 2 * (config.downsample_ratio**2)
+        )
         self.image_size = image_size
         self.min_dynamic_patch = min_dynamic_patch
         self.max_dynamic_patch = max_dynamic_patch
@@ -377,14 +403,18 @@ def resolve_min_max_num(
         dynamic_image_size: Optional[bool] = None,
         use_thumbnail: Optional[bool] = None,
     ) -> tuple[int, int]:
-        min_dynamic_patch = (self.min_dynamic_patch if min_dynamic_patch
-                             is None else min_dynamic_patch)
-        max_dynamic_patch = (self.max_dynamic_patch if max_dynamic_patch
-                             is None else max_dynamic_patch)
-        dynamic_image_size = (self.dynamic_image_size if dynamic_image_size
-                              is None else dynamic_image_size)
-        use_thumbnail = (self.use_thumbnail
-                         if use_thumbnail is None else use_thumbnail)
+        min_dynamic_patch = (
+            self.min_dynamic_patch if min_dynamic_patch is None else min_dynamic_patch
+        )
+        max_dynamic_patch = (
+            self.max_dynamic_patch if max_dynamic_patch is None else max_dynamic_patch
+        )
+        dynamic_image_size = (
+            self.dynamic_image_size
+            if dynamic_image_size is None
+            else dynamic_image_size
+        )
+        use_thumbnail = self.use_thumbnail if use_thumbnail is None else use_thumbnail
 
         return resolve_internvl_min_max_num(
             min_dynamic_patch=min_dynamic_patch,
@@ -451,7 +481,8 @@ def _images_to_pixel_values_lst(
                 min_num=min_num,
                 max_num=max_num,
                 use_thumbnail=self.use_thumbnail,
-            ) for image in images
+            )
+            for image in images
         ]
 
     def _preprocess_image(
@@ -472,10 +503,10 @@ def _preprocess_image(
                 dynamic_image_size=dynamic_image_size,
             )
             image_inputs = {
-                "pixel_values_flat":
-                torch.cat(pixel_values_lst),
-                "image_num_patches":
-                torch.tensor([len(item) for item in pixel_values_lst]),
+                "pixel_values_flat": torch.cat(pixel_values_lst),
+                "image_num_patches": torch.tensor(
+                    [len(item) for item in pixel_values_lst]
+                ),
             }
 
             for pixel_values in pixel_values_lst:
@@ -483,11 +514,10 @@ def _preprocess_image(
                 feature_size = num_patches * self.num_image_token
 
                 image_repl = self.get_image_repl(feature_size, num_patches)
-                text = [t.replace('<image>', image_repl.full, 1) for t in text]
+                text = [t.replace("<image>", image_repl.full, 1) for t in text]
         return text, image_inputs
 
-    def _make_batch_input(self,
-                          input_item: Optional[Union[Any, list[Any]]] = None):
+    def _make_batch_input(self, input_item: Optional[Union[Any, list[Any]]] = None):
         if input_item is None:
             input_item = []
         if not isinstance(input_item, list):
@@ -581,7 +611,8 @@ def _videos_to_pixel_values_lst(
                 min_num=min_num,
                 max_num=max_num,
                 use_thumbnail=False,
-            ) for video in videos
+            )
+            for video in videos
         ]
 
     def _preprocess_video(
@@ -598,18 +629,19 @@ def _preprocess_video(
                 dynamic_image_size=dynamic_image_size,
             )
             video_inputs = {
-                "pixel_values_flat_video":
-                torch.cat(pixel_values_lst_video),
-                "video_num_patches":
-                torch.tensor([len(item) for item in pixel_values_lst_video]),
+                "pixel_values_flat_video": torch.cat(pixel_values_lst_video),
+                "video_num_patches": torch.tensor(
+                    [len(item) for item in pixel_values_lst_video]
+                ),
             }
 
             for pixel_values in pixel_values_lst_video:
                 num_patches = pixel_values.shape[0]
 
-                video_repl = self.get_video_repl(self.num_image_token,
-                                                 num_patches, self.video_token)
-                text = [t.replace('<video>', video_repl.full, 1) for t in text]
+                video_repl = self.get_video_repl(
+                    self.num_image_token, num_patches, self.video_token
+                )
+                text = [t.replace("<video>", video_repl.full, 1) for t in text]
         return text, video_inputs
 
     def __call__(
@@ -665,9 +697,9 @@ def get_video_repl(
         repl_features = video_context_token * self.num_image_token
         repl_features_with_sep = IMG_START + repl_features + IMG_END
         # num_patches is equal to num_frames
-        repl_full = ''.join([
-            f'Frame{i+1}: {repl_features_with_sep}' for i in range(num_patches)
-        ])
+        repl_full = "".join(
+            [f"Frame{i + 1}: {repl_features_with_sep}" for i in range(num_patches)]
+        )
 
         return PromptUpdateDetails.select_text(repl_full, video_context_token)
 
@@ -714,8 +746,7 @@ def get_image_size_with_most_features(self) -> ImageSize:
             )
             if feat_size > largest_feature_size:
                 largest_feature_size = feat_size
-                largest_feature_pinpoint = ImageSize(width=width,
-                                                     height=height)
+                largest_feature_pinpoint = ImageSize(width=width, height=height)
 
         if largest_feature_size == 0 or largest_feature_pinpoint is None:
             raise ValueError("Cannot have a largest feature size of 0!")
@@ -750,23 +781,23 @@ def get_dummy_mm_data(
         mm_counts: Mapping[str, int],
         mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
         num_images = mm_counts.get("image", 0)
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class BaseInternVLMultiModalProcessor(BaseMultiModalProcessor[_I]):
-    """ Basic image-only MultiModalProcessor for InternVL-style models."""
+    """Basic image-only MultiModalProcessor for InternVL-style models."""
 
     def _call_hf_processor(
         self,
@@ -802,7 +833,8 @@ def _get_mm_fields_config(
 
         return dict(
             pixel_values_flat=MultiModalFieldConfig.flat_from_sizes(
-                "image", image_num_patches),
+                "image", image_num_patches
+            ),
             image_num_patches=MultiModalFieldConfig.batched("image"),
             image_embeds=MultiModalFieldConfig.batched("image"),
             image_token_id=MultiModalFieldConfig.shared("image", num_images),
@@ -830,7 +862,8 @@ def _get_prompt_updates(
 
         def get_replacement_internvl(item_idx: int):
             images = mm_items.get_items(
-                "image", (ImageEmbeddingItems, ImageProcessorItems))
+                "image", (ImageEmbeddingItems, ImageProcessorItems)
+            )
 
             if isinstance(images, ImageEmbeddingItems):
                 feature_size = images.get_feature_size(item_idx)
@@ -889,8 +922,7 @@ def get_num_frames_with_most_features(
         processor = self.get_hf_processor()
 
         max_image_tokens = self.get_max_image_tokens() * max_images
-        max_total_frames = (seq_len -
-                            max_image_tokens) // processor.num_image_token
+        max_total_frames = (seq_len - max_image_tokens) // processor.num_image_token
         max_frames_per_video = max_total_frames // max(max_videos, 1)
 
         return max(max_frames_per_video, 1)
@@ -906,7 +938,8 @@ def get_hf_processor(self, **kwargs: object) -> InternVLProcessor:
 
 
 class InternVLDummyInputsBuilder(
-        BaseInternVLDummyInputsBuilder[InternVLProcessingInfo]):
+    BaseInternVLDummyInputsBuilder[InternVLProcessingInfo]
+):
     """InternVL DummyInputsBuilder extended for video support"""
 
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
@@ -920,23 +953,25 @@ def get_dummy_mm_data(
         mm_counts: Mapping[str, int],
         mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
-        dummy_image = super().get_dummy_mm_data(seq_len=seq_len,
-                                                mm_counts=mm_counts,
-                                                mm_options=mm_options)
+        dummy_image = super().get_dummy_mm_data(
+            seq_len=seq_len, mm_counts=mm_counts, mm_options=mm_options
+        )
         if self.info.supports_video:
             config = self.info.get_hf_config()
             image_size: int = config.vision_config.image_size
-            target_num_frames = \
-                self.info.get_num_frames_with_most_features(seq_len, mm_counts)
+            target_num_frames = self.info.get_num_frames_with_most_features(
+                seq_len, mm_counts
+            )
             num_videos = mm_counts.get("video", 0)
             video_overrides = mm_options.get("video") if mm_options else None
             dummy_video = {
-                "video":
-                self._get_dummy_videos(width=image_size,
-                                       height=image_size,
-                                       num_frames=target_num_frames,
-                                       num_videos=num_videos,
-                                       overrides=video_overrides)
+                "video": self._get_dummy_videos(
+                    width=image_size,
+                    height=image_size,
+                    num_frames=target_num_frames,
+                    num_videos=num_videos,
+                    overrides=video_overrides,
+                )
             }
         else:
             dummy_video = {}
@@ -944,7 +979,8 @@ def get_dummy_mm_data(
 
 
 class InternVLMultiModalProcessor(
-        BaseInternVLMultiModalProcessor[InternVLProcessingInfo]):
+    BaseInternVLMultiModalProcessor[InternVLProcessingInfo]
+):
     """InternVL MultiModalProcessor extended for video support"""
 
     def _call_hf_processor(
@@ -954,12 +990,15 @@ def _call_hf_processor(
         mm_kwargs: Mapping[str, object],
         tok_kwargs: Mapping[str, object],
     ) -> BatchFeature:
-        processed_outputs = super()._call_hf_processor(prompt, mm_data,
-                                                       mm_kwargs, tok_kwargs)
+        processed_outputs = super()._call_hf_processor(
+            prompt, mm_data, mm_kwargs, tok_kwargs
+        )
 
         hf_processor = self.info.get_hf_processor(**mm_kwargs)
-        if self.info.supports_video and (
-                video_token_id := hf_processor.video_token_id) is not None:
+        if (
+            self.info.supports_video
+            and (video_token_id := hf_processor.video_token_id) is not None
+        ):
             processed_outputs["video_token_id"] = torch.tensor(video_token_id)
         return processed_outputs
 
@@ -968,18 +1007,16 @@ def _get_mm_fields_config(
         hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
-        image_fields = super()._get_mm_fields_config(hf_inputs,
-                                                     hf_processor_mm_kwargs)
+        image_fields = super()._get_mm_fields_config(hf_inputs, hf_processor_mm_kwargs)
         if self.info.supports_video:
-            video_num_patches = hf_inputs.get("video_num_patches",
-                                              torch.empty(0))
+            video_num_patches = hf_inputs.get("video_num_patches", torch.empty(0))
             num_videos = len(video_num_patches)
             video_fields = dict(
                 pixel_values_flat_video=MultiModalFieldConfig.flat_from_sizes(
-                    "video", video_num_patches),
+                    "video", video_num_patches
+                ),
                 video_num_patches=MultiModalFieldConfig.batched("video"),
-                video_token_id=MultiModalFieldConfig.shared(
-                    "video", num_videos),
+                video_token_id=MultiModalFieldConfig.shared("video", num_videos),
             )
         else:
             video_fields = {}
@@ -1015,9 +1052,8 @@ def get_video_replacement_internvl(item_idx: int):
                 assert isinstance(num_patches, int)
 
             return hf_processor.get_video_repl(
-                feature_size,
-                num_patches,
-                video_context_token=hf_processor.video_token)
+                feature_size, num_patches, video_context_token=hf_processor.video_token
+            )
 
         if self.info.supports_video:
             prompt_repl = [
@@ -1026,7 +1062,7 @@ def get_video_replacement_internvl(item_idx: int):
                     modality="video",
                     target="<video>",
                     replacement=get_video_replacement_internvl,
-                )
+                ),
             ]
 
         return prompt_repl
@@ -1035,9 +1071,9 @@ def get_video_replacement_internvl(item_idx: int):
 @MULTIMODAL_REGISTRY.register_processor(
     InternVLMultiModalProcessor,
     info=InternVLProcessingInfo,
-    dummy_inputs=InternVLDummyInputsBuilder)
-class InternVLChatModel(nn.Module, SupportsMultiModal, SupportsPP,
-                        SupportsLoRA):
+    dummy_inputs=InternVLDummyInputsBuilder,
+)
+class InternVLChatModel(nn.Module, SupportsMultiModal, SupportsPP, SupportsLoRA):
     merge_by_field_config = True
 
     supports_encoder_tp_data = True
@@ -1067,12 +1103,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         patch_size = config.vision_config.patch_size
         self.patch_size = patch_size
         self.num_image_token = int(
-            (image_size // patch_size)**2 * (config.downsample_ratio**2))
+            (image_size // patch_size) ** 2 * (config.downsample_ratio**2)
+        )
         self.downsample_ratio = config.downsample_ratio
         self.ps_version = config.ps_version
 
         self.llm_arch_name = config.text_config.architectures[0]
-        self.is_mono = self.llm_arch_name == 'InternLM2VEForCausalLM'
+        self.is_mono = self.llm_arch_name == "InternLM2VEForCausalLM"
         self.vision_model = self._init_vision_model(
             config,
             quant_config=quant_config,
@@ -1093,18 +1130,20 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
 
         self.visual_token_mask = None
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
-    def _patch_quant_config(self, config: PretrainedConfig,
-                            quant_config: QuantizationConfig):
+    def _patch_quant_config(
+        self, config: PretrainedConfig, quant_config: QuantizationConfig
+    ):
         # the awq models from OpenGVLab missing `modules_to_not_convert`
         # patch the quant_config to add `modules_to_not_convert` back
         if isinstance(quant_config, AWQConfig):
             text_config = config.text_config
-            llm_quant_config = getattr(text_config, "quantization_config",
-                                       None)
-            if (not quant_config.modules_to_not_convert) and \
-                (llm_quant_config is not None):
+            llm_quant_config = getattr(text_config, "quantization_config", None)
+            if (not quant_config.modules_to_not_convert) and (
+                llm_quant_config is not None
+            ):
                 quant_config.modules_to_not_convert.append("vision_model")
 
     def _init_vision_model(
@@ -1118,8 +1157,9 @@ def _init_vision_model(
         if not is_mono:
             vision_feature_layer = config.select_layer
             if vision_feature_layer < 0:
-                num_hidden_layers = config.vision_config.num_hidden_layers \
-                    + vision_feature_layer + 1
+                num_hidden_layers = (
+                    config.vision_config.num_hidden_layers + vision_feature_layer + 1
+                )
             else:
                 num_hidden_layers = vision_feature_layer + 1
 
@@ -1128,7 +1168,8 @@ def _init_vision_model(
                 quant_config=quant_config,
                 num_hidden_layers_override=num_hidden_layers,
                 prefix=prefix,
-                use_data_parallel=self.use_data_parallel)
+                use_data_parallel=self.use_data_parallel,
+            )
         else:
             return InternVisionPatchModel(config.vision_config)
 
@@ -1137,9 +1178,10 @@ def _init_mlp1(self, config: PretrainedConfig) -> nn.Module:
         llm_hidden_size = config.text_config.hidden_size
 
         return nn.Sequential(
-            nn.LayerNorm(vit_hidden_size * int(1 / self.downsample_ratio)**2),
-            nn.Linear(vit_hidden_size * int(1 / self.downsample_ratio)**2,
-                      llm_hidden_size),
+            nn.LayerNorm(vit_hidden_size * int(1 / self.downsample_ratio) ** 2),
+            nn.Linear(
+                vit_hidden_size * int(1 / self.downsample_ratio) ** 2, llm_hidden_size
+            ),
             nn.GELU(),
             nn.Linear(llm_hidden_size, llm_hidden_size),
         )
@@ -1150,9 +1192,13 @@ def pixel_shuffle(self, x, scale_factor=0.5):
         x = x.view(n, w, int(h * scale_factor), int(c / scale_factor))
         # N, W, H * scale, C // scale --> N, H * scale, W, C // scale
         x = x.permute(0, 2, 1, 3).contiguous()
-        x = x.view(n, int(h * scale_factor), int(w * scale_factor),
-                   int(c / (scale_factor * scale_factor)))
-        if self.ps_version == 'v1':
+        x = x.view(
+            n,
+            int(h * scale_factor),
+            int(w * scale_factor),
+            int(c / (scale_factor * scale_factor)),
+        )
+        if self.ps_version == "v1":
             pass
         else:
             x = x.permute(0, 2, 1, 3).contiguous()
@@ -1162,17 +1208,16 @@ def extract_feature(self, pixel_values: torch.Tensor) -> torch.Tensor:
         vit_embeds = self.vision_model(pixel_values=pixel_values)
         vit_embeds = vit_embeds[:, 1:, :]
 
-        h = w = int(vit_embeds.shape[1]**0.5)
+        h = w = int(vit_embeds.shape[1] ** 0.5)
         vit_embeds = vit_embeds.reshape(vit_embeds.shape[0], h, w, -1)
-        vit_embeds = self.pixel_shuffle(vit_embeds,
-                                        scale_factor=self.downsample_ratio)
-        vit_embeds = vit_embeds.reshape(vit_embeds.shape[0], -1,
-                                        vit_embeds.shape[-1])
+        vit_embeds = self.pixel_shuffle(vit_embeds, scale_factor=self.downsample_ratio)
+        vit_embeds = vit_embeds.reshape(vit_embeds.shape[0], -1, vit_embeds.shape[-1])
         vit_embeds = self.mlp1(vit_embeds)
         return vit_embeds
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[InternVLImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[InternVLImageInputs]:
         pixel_values_flat = kwargs.pop("pixel_values_flat", None)
         image_num_patches = kwargs.pop("image_num_patches", None)
         image_embeds = kwargs.pop("image_embeds", None)
@@ -1204,7 +1249,8 @@ def _parse_and_validate_image_input(
         raise AssertionError("This line should be unreachable.")
 
     def _parse_and_validate_video_input(
-            self, **kwargs: object) -> Optional[InternVLVideoPixelInputs]:
+        self, **kwargs: object
+    ) -> Optional[InternVLVideoPixelInputs]:
         pixel_values_flat_video = kwargs.pop("pixel_values_flat_video", None)
         video_num_patches = kwargs.pop("video_num_patches", None)
         video_embeds = kwargs.pop("image_embeds", None)
@@ -1239,8 +1285,10 @@ def _process_vision_input(
         self,
         image_input: Union[InternVLImageInputs, InternVLVideoInputs],
     ) -> tuple[torch.Tensor, ...]:
-        if (image_input["type"] == "image_embeds"
-                or image_input["type"] == "video_embeds"):
+        if (
+            image_input["type"] == "image_embeds"
+            or image_input["type"] == "video_embeds"
+        ):
             return image_input["data"]
 
         assert self.vision_model is not None
@@ -1251,14 +1299,12 @@ def _process_vision_input(
 
         # Only one image in the current batch
         if len(num_patches) == 1:
-            return (image_embeds.view(-1,
-                                      self.config.text_config.hidden_size), )
+            return (image_embeds.view(-1, self.config.text_config.hidden_size),)
 
         # NOTE: Image embeddings are split into separate tensors for each image
         # by the size of each embedding.
         feature_size = image_embeds.shape[1]
-        image_embeds = image_embeds.view(-1,
-                                         self.config.text_config.hidden_size)
+        image_embeds = image_embeds.view(-1, self.config.text_config.hidden_size)
         image_feature_sizes = [
             num_patches * feature_size for num_patches in num_patches
         ]
@@ -1270,31 +1316,29 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if input_key in ("pixel_values_flat",
-                             "image_embeds") and "images" not in modalities:
-                modalities["images"] = self._parse_and_validate_image_input(
-                    **kwargs)
-            if input_key in ("pixel_values_flat_video",
-                             ) and "videos" not in modalities:
-                modalities["videos"] = self._parse_and_validate_video_input(
-                    **kwargs)
+            if (
+                input_key in ("pixel_values_flat", "image_embeds")
+                and "images" not in modalities
+            ):
+                modalities["images"] = self._parse_and_validate_image_input(**kwargs)
+            if input_key in ("pixel_values_flat_video",) and "videos" not in modalities:
+                modalities["videos"] = self._parse_and_validate_video_input(**kwargs)
 
         return modalities
 
     def _set_visual_token_mask(self, input_ids: torch.Tensor) -> None:
         if self.is_mono:
             assert self.img_context_token_id is not None
-            self.visual_token_mask = (
-                input_ids == self.img_context_token_id).reshape(-1, 1)
+            self.visual_token_mask = (input_ids == self.img_context_token_id).reshape(
+                -1, 1
+            )
         else:
             self.visual_token_mask = None
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
-
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
@@ -1325,8 +1369,7 @@ def get_input_embeddings(
         is_multimodal: Optional[torch.Tensor] = None,
         handle_oov_mm_token: bool = False,
     ) -> torch.Tensor:
-        if multimodal_embeddings is not None and len(
-                multimodal_embeddings) > 0:
+        if multimodal_embeddings is not None and len(multimodal_embeddings) > 0:
             self._set_visual_token_mask(input_ids)
 
         # This is to satisfy the type checker for each overload
@@ -1348,7 +1391,6 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs: object,
     ) -> IntermediateTensors:
-
         if intermediate_tensors is not None:
             input_ids = None
             inputs_embeds = None
@@ -1362,8 +1404,7 @@ def forward(
 
         # Only required if the model is mono-architecture
         if self.visual_token_mask is not None:
-            forward_kwargs.update(
-                {"visual_token_mask": self.visual_token_mask})
+            forward_kwargs.update({"visual_token_mask": self.visual_token_mask})
             self.visual_token_mask = None
 
         hidden_states = self.language_model.model(**forward_kwargs)
@@ -1375,14 +1416,21 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         # unused modules appear in OpenGVLab/InternVideo2_5_Chat_8B
         skip_prefixes = [
-            "action_embed", "temporal_embed", "track_embed",
-            "track_embed_decoder", "box_token", "cg_criterion", "cg_model",
-            "loc_encoder", "loc_decoder", "sam", "temporal_token",
-            "track_token"
+            "action_embed",
+            "temporal_embed",
+            "track_embed",
+            "track_embed_decoder",
+            "box_token",
+            "cg_criterion",
+            "cg_model",
+            "loc_encoder",
+            "loc_decoder",
+            "sam",
+            "temporal_token",
+            "track_token",
         ]
         loader = AutoWeightsLoader(self, skip_prefixes=skip_prefixes)
         return loader.load_weights(weights)
@@ -1394,4 +1442,5 @@ def get_mm_mapping(self) -> MultiModelKeys:
         return MultiModelKeys.from_string_field(
             language_model="language_model",
             connector="mlp1",
-            tower_model="vision_model")
+            tower_model="vision_model",
+        )
diff --git a/vllm/model_executor/models/jais.py b/vllm/model_executor/models/jais.py
index 0eb1578b4361..d788ed7ec2af 100644
--- a/vllm/model_executor/models/jais.py
+++ b/vllm/model_executor/models/jais.py
@@ -32,48 +32,57 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (get_pp_group, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size)
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs import JAISConfig
 
 from .interfaces import SupportsPP
-from .utils import (is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class SwiGLUActivation(nn.Module):
-
     def forward(self, x1: torch.Tensor, x2: torch.Tensor) -> torch.Tensor:
         return x1 * nn.functional.silu(x2)
 
 
 def _get_alibi_slopes(n):
-
     def get_slopes_power_of_2(n):
-        start = 2**(-(2**-(math.log2(n) - 3)))
+        start = 2 ** (-(2 ** -(math.log2(n) - 3)))
         ratio = start
         return [start * ratio**i for i in range(n)]
 
     if math.log2(n).is_integer():
         return get_slopes_power_of_2(n)
     else:
-        closest_power_of_2 = 2**math.floor(math.log2(n))
-        return (get_slopes_power_of_2(closest_power_of_2) + _get_alibi_slopes(
-            2 * closest_power_of_2)[0::2][:n - closest_power_of_2])
+        closest_power_of_2 = 2 ** math.floor(math.log2(n))
+        return (
+            get_slopes_power_of_2(closest_power_of_2)
+            + _get_alibi_slopes(2 * closest_power_of_2)[0::2][: n - closest_power_of_2]
+        )
 
 
 class JAISAttention(nn.Module):
-
     def __init__(
         self,
         config: JAISConfig,
@@ -84,8 +93,7 @@ def __init__(
         super().__init__()
         self.hidden_size = config.hidden_size
         total_num_heads = config.num_attention_heads
-        tensor_model_parallel_world_size = (
-            get_tensor_model_parallel_world_size())
+        tensor_model_parallel_world_size = get_tensor_model_parallel_world_size()
         assert total_num_heads % tensor_model_parallel_world_size == 0
         self.num_heads = total_num_heads // tensor_model_parallel_world_size
         self.head_dim = self.hidden_size // total_num_heads
@@ -113,13 +121,15 @@ def __init__(
         head_end = (tp_rank + 1) * self.num_heads
         alibi_slopes = _get_alibi_slopes(total_num_heads)
         alibi_slopes = alibi_slopes[head_start:head_end]
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              scale=self.scale,
-                              alibi_slopes=alibi_slopes,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            scale=self.scale,
+            alibi_slopes=alibi_slopes,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -133,7 +143,6 @@ def forward(
 
 
 class JAISMLP(nn.Module):
-
     def __init__(
         self,
         intermediate_size: int,
@@ -149,12 +158,16 @@ def __init__(
             bias=True,
             quant_config=quant_config,
         )
-        self.c_fc2 = (ColumnParallelLinear(
-            hidden_size,
-            intermediate_size,
-            bias=True,
-            quant_config=quant_config,
-        ) if self.swiglu else None)
+        self.c_fc2 = (
+            ColumnParallelLinear(
+                hidden_size,
+                intermediate_size,
+                bias=True,
+                quant_config=quant_config,
+            )
+            if self.swiglu
+            else None
+        )
         self.c_proj = RowParallelLinear(
             intermediate_size,
             hidden_size,
@@ -168,14 +181,16 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         if self.swiglu:
             hidden_states2, _ = self.c_fc2(hidden_states)
         hidden_states, _ = self.c_fc(hidden_states)
-        hidden_states = (self.act(hidden_states, hidden_states2)
-                         if self.swiglu else self.act(hidden_states))
+        hidden_states = (
+            self.act(hidden_states, hidden_states2)
+            if self.swiglu
+            else self.act(hidden_states)
+        )
         hidden_states, _ = self.c_proj(hidden_states)
         return hidden_states
 
 
 class JAISBlock(nn.Module):
-
     def __init__(
         self,
         config: JAISConfig,
@@ -185,14 +200,12 @@ def __init__(
     ):
         super().__init__()
         hidden_size = config.hidden_size
-        inner_dim = (config.n_inner if config.n_inner is not None else 4 *
-                     hidden_size)
+        inner_dim = config.n_inner if config.n_inner is not None else 4 * hidden_size
 
         self.ln_1 = nn.LayerNorm(hidden_size, eps=config.layer_norm_epsilon)
-        self.attn = JAISAttention(config,
-                                  cache_config,
-                                  quant_config,
-                                  prefix=f"{prefix}.attn")
+        self.attn = JAISAttention(
+            config, cache_config, quant_config, prefix=f"{prefix}.attn"
+        )
         self.ln_2 = nn.LayerNorm(hidden_size, eps=config.layer_norm_epsilon)
         self.mlp = JAISMLP(inner_dim, config, quant_config)
 
@@ -202,7 +215,9 @@ def forward(
     ) -> torch.Tensor:
         residual = hidden_states
         hidden_states = self.ln_1(hidden_states)
-        attn_output = self.attn(hidden_states=hidden_states, )
+        attn_output = self.attn(
+            hidden_states=hidden_states,
+        )
         # residual connection
         hidden_states = attn_output + residual
 
@@ -216,7 +231,6 @@ def forward(
 
 @support_torch_compile
 class JAISModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -230,9 +244,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         assert not config.reorder_and_upcast_attn
         self.embed_dim = config.hidden_size
         self.wte = VocabParallelEmbedding(config.vocab_size, self.embed_dim)
-        self.wpe = (nn.Embedding(config.max_position_embeddings,
-                                 self.embed_dim)
-                    if config.position_embedding_type != "alibi" else None)
+        self.wpe = (
+            nn.Embedding(config.max_position_embeddings, self.embed_dim)
+            if config.position_embedding_type != "alibi"
+            else None
+        )
         if hasattr(config, "embeddings_scale"):
             self.embeddings_scale = config.embeddings_scale
         else:
@@ -240,17 +256,19 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.start_layer, self.end_layer, self.h = make_layers(
             config.num_hidden_layers,
-            lambda prefix: JAISBlock(config=config,
-                                     cache_config=cache_config,
-                                     quant_config=quant_config,
-                                     prefix=prefix),
+            lambda prefix: JAISBlock(
+                config=config,
+                cache_config=cache_config,
+                quant_config=quant_config,
+                prefix=prefix,
+            ),
             prefix=f"{prefix}.h",
         )
 
         self.ln_f = nn.LayerNorm(self.embed_dim, eps=config.layer_norm_epsilon)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.n_embd))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.n_embd
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
@@ -270,8 +288,9 @@ def forward(
                 hidden_states = inputs_embeds + position_embeds
             else:
                 hidden_states = inputs_embeds
-            hidden_states *= torch.tensor(float(self.embeddings_scale),
-                                          dtype=hidden_states.dtype)
+            hidden_states *= torch.tensor(
+                float(self.embeddings_scale), dtype=hidden_states.dtype
+            )
         else:
             assert intermediate_tensors is not None
             hidden_states = intermediate_tensors["hidden_states"]
@@ -287,32 +306,33 @@ def forward(
 
 
 class JAISLMHeadModel(nn.Module, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.transformer = JAISModel(vllm_config=vllm_config,
-                                     prefix=maybe_prefix(
-                                         prefix, "transformer"))
+        self.transformer = JAISModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "transformer")
+        )
         if self.config.tie_word_embeddings:
             self.lm_head = self.transformer.wte
         else:
-            self.lm_head = ParallelLMHead(self.config.vocab_size,
-                                          self.config.hidden_size,
-                                          prefix=maybe_prefix(
-                                              prefix, "lm_head"))
+            self.lm_head = ParallelLMHead(
+                self.config.vocab_size,
+                self.config.hidden_size,
+                prefix=maybe_prefix(prefix, "lm_head"),
+            )
         if hasattr(config, "width_scale"):
             self.output_logits_scale = config.width_scale
         else:
-            self.output_logits_scale = (config.mup_output_alpha *
-                                        config.mup_width_scale)
-        self.logits_processor = LogitsProcessor(vocab_size=config.vocab_size,
-                                                scale=self.output_logits_scale)
+            self.output_logits_scale = config.mup_output_alpha * config.mup_width_scale
+        self.logits_processor = LogitsProcessor(
+            vocab_size=config.vocab_size, scale=self.output_logits_scale
+        )
         self.make_empty_intermediate_tensors = (
-            self.transformer.make_empty_intermediate_tensors)
+            self.transformer.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.transformer.get_input_embeddings(input_ids)
@@ -324,8 +344,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[IntermediateTensors, torch.Tensor]:
-        hidden_states = self.transformer(input_ids, positions,
-                                         intermediate_tensors, inputs_embeds)
+        hidden_states = self.transformer(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -335,8 +356,7 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters(remove_duplicate=False))
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
@@ -366,8 +386,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if not name.endswith(".weight"):
                     continue
                 loaded_weight = loaded_weight.t()
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
diff --git a/vllm/model_executor/models/jamba.py b/vllm/model_executor/models/jamba.py
index e8277e259bc5..0371458f5578 100644
--- a/vllm/model_executor/models/jamba.py
+++ b/vllm/model_executor/models/jamba.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Inference-only Jamba model."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional
@@ -16,37 +17,50 @@
 from vllm.distributed.parallel_state import get_pp_group
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.mamba.mamba_mixer import MambaMixer
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.pooler import DispatchPooler, Pooler
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.llama import LlamaMLP as JambaMLP
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import HasInnerState, IsHybrid, SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, WeightsMapper, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class JambaMoE(nn.Module):
-
-    def __init__(self,
-                 config: JambaConfig,
-                 num_experts: Optional[int] = None,
-                 top_k: Optional[int] = None,
-                 params_dtype: Optional[torch.dtype] = None,
-                 tp_size: Optional[int] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: JambaConfig,
+        num_experts: Optional[int] = None,
+        top_k: Optional[int] = None,
+        params_dtype: Optional[torch.dtype] = None,
+        tp_size: Optional[int] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.num_total_experts = num_experts or config.num_experts
         self.top_k = top_k or config.num_experts_per_tok
@@ -54,23 +68,27 @@ def __init__(self,
         self.intermediate_size = config.intermediate_size
 
         if self.num_total_experts > 1:
-            self.router = ReplicatedLinear(self.hidden_size,
-                                           self.num_total_experts,
-                                           bias=False,
-                                           quant_config=None,
-                                           params_dtype=params_dtype)
-
-        self.experts = FusedMoE(self.num_total_experts,
-                                self.top_k,
-                                self.hidden_size,
-                                self.intermediate_size,
-                                tp_size=tp_size,
-                                params_dtype=params_dtype,
-                                reduce_results=True,
-                                renormalize=False,
-                                use_grouped_topk=False,
-                                quant_config=quant_config,
-                                prefix=f"{prefix}.experts")
+            self.router = ReplicatedLinear(
+                self.hidden_size,
+                self.num_total_experts,
+                bias=False,
+                quant_config=None,
+                params_dtype=params_dtype,
+            )
+
+        self.experts = FusedMoE(
+            self.num_total_experts,
+            self.top_k,
+            self.hidden_size,
+            self.intermediate_size,
+            tp_size=tp_size,
+            params_dtype=params_dtype,
+            reduce_results=True,
+            renormalize=False,
+            use_grouped_topk=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.experts",
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         orig_shape = hidden_states.shape
@@ -79,43 +97,46 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         if self.num_total_experts > 1:
             router_logits, _ = self.router(hidden_states)
         else:
-            router_logits = torch.ones((hidden_states.shape[0], 1),
-                                       device=hidden_states.device,
-                                       dtype=hidden_states.dtype)
+            router_logits = torch.ones(
+                (hidden_states.shape[0], 1),
+                device=hidden_states.device,
+                dtype=hidden_states.dtype,
+            )
         hidden_states = self.experts(hidden_states, router_logits)
         return hidden_states.view(orig_shape)
 
 
 class JambaMambaDecoderLayer(nn.Module):
-
-    def __init__(self,
-                 config: JambaConfig,
-                 layer_idx: int,
-                 model_config: Optional[ModelConfig] = None,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 is_lora_enabled: Optional[bool] = False,
-                 prefix: str = "",
-                 **kwargs) -> None:
+    def __init__(
+        self,
+        config: JambaConfig,
+        layer_idx: int,
+        model_config: Optional[ModelConfig] = None,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        is_lora_enabled: Optional[bool] = False,
+        prefix: str = "",
+        **kwargs,
+    ) -> None:
         super().__init__()
         self.config = config
         self.is_lora_enabled = is_lora_enabled
-        self.mamba = MambaMixer(hidden_size= config.hidden_size,
-                                ssm_state_size = config.mamba_d_state,
-                                conv_kernel_size = config.mamba_d_conv,
-                                intermediate_size = config.mamba_expand *\
-                                                    config.hidden_size,
-                                time_step_rank = config.mamba_dt_rank,
-                                use_conv_bias = config.mamba_conv_bias,
-                                use_bias = config.mamba_proj_bias,
-                                use_rms_norm=True,
-                                rms_norm_eps=config.rms_norm_eps,
-                                activation=config.hidden_act,
-                                is_lora_enabled = self.is_lora_enabled,
-                                model_config=model_config,
-                                cache_config=cache_config,
-                                prefix=f"{prefix}.mixer",
-                                )
+        self.mamba = MambaMixer(
+            hidden_size=config.hidden_size,
+            ssm_state_size=config.mamba_d_state,
+            conv_kernel_size=config.mamba_d_conv,
+            intermediate_size=config.mamba_expand * config.hidden_size,
+            time_step_rank=config.mamba_dt_rank,
+            use_conv_bias=config.mamba_conv_bias,
+            use_bias=config.mamba_proj_bias,
+            use_rms_norm=True,
+            rms_norm_eps=config.rms_norm_eps,
+            activation=config.hidden_act,
+            is_lora_enabled=self.is_lora_enabled,
+            model_config=model_config,
+            cache_config=cache_config,
+            prefix=f"{prefix}.mixer",
+        )
 
         num_experts = config.layers_num_experts[layer_idx]
         if num_experts > 1:
@@ -132,10 +153,8 @@ def __init__(self,
                 quant_config=quant_config,
                 prefix=f"{prefix}.feed_forward",
             )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.pre_ff_layernorm = RMSNorm(config.hidden_size,
-                                        eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.pre_ff_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def forward(
         self,
@@ -147,8 +166,7 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
 
         output = torch.empty_like(hidden_states)
         self.mamba(hidden_states, output)
@@ -159,15 +177,16 @@ def forward(
 
 
 class JambaAttentionDecoderLayer(nn.Module):
-
-    def __init__(self,
-                 config: JambaConfig,
-                 layer_idx: int,
-                 model_config: Optional[ModelConfig] = None,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "",
-                 **kwargs) -> None:
+    def __init__(
+        self,
+        config: JambaConfig,
+        layer_idx: int,
+        model_config: Optional[ModelConfig] = None,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+        **kwargs,
+    ) -> None:
         super().__init__()
         self.hidden_size = config.hidden_size
         tp_size = get_tensor_model_parallel_world_size()
@@ -197,10 +216,12 @@ def __init__(self,
             bias=False,
             quant_config=quant_config,
         )
-        self.o_proj = RowParallelLinear(self.total_num_heads * self.head_dim,
-                                        config.hidden_size,
-                                        bias=False,
-                                        quant_config=quant_config)
+        self.o_proj = RowParallelLinear(
+            self.total_num_heads * self.head_dim,
+            config.hidden_size,
+            bias=False,
+            quant_config=quant_config,
+        )
 
         self.attn = Attention(
             self.num_heads,
@@ -226,10 +247,8 @@ def __init__(self,
                 quant_config=quant_config,
                 prefix=f"{prefix}.feed_forward",
             )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.pre_ff_layernorm = RMSNorm(config.hidden_size,
-                                        eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.pre_ff_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def self_attention(
         self,
@@ -254,29 +273,26 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
 
         hidden_states = self.self_attention(
             positions=positions,
             hidden_states=hidden_states,
         )
         # Fully Connected
-        hidden_states, residual = self.pre_ff_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.pre_ff_layernorm(hidden_states, residual)
         hidden_states = self.feed_forward(hidden_states)
         return hidden_states, residual
 
 
 ALL_DECODER_LAYER_TYPES = {
     "attention": JambaAttentionDecoderLayer,
-    "mamba": JambaMambaDecoderLayer
+    "mamba": JambaMambaDecoderLayer,
 }
 
 
 @support_torch_compile
 class JambaModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -287,8 +303,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         lora_config = vllm_config.lora_config
 
         self.config = config
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
 
@@ -302,24 +321,25 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         def get_layer(prefix: str):
             layer_idx = int(prefix.rsplit(".", 1)[1])
-            layer_class = ALL_DECODER_LAYER_TYPES[
-                config.layers_block_type[layer_idx]]
-            return layer_class(config,
-                               layer_idx,
-                               model_config,
-                               cache_config,
-                               quant_config=quant_config,
-                               prefix=prefix,
-                               **extra_kwargs)
+            layer_class = ALL_DECODER_LAYER_TYPES[config.layers_block_type[layer_idx]]
+            return layer_class(
+                config,
+                layer_idx,
+                model_config,
+                cache_config,
+                quant_config=quant_config,
+                prefix=prefix,
+                **extra_kwargs,
+            )
 
         self.start_layer, self.end_layer, self.layers = make_layers(
-            config.num_hidden_layers, get_layer, prefix=f"{prefix}.layers")
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+            config.num_hidden_layers, get_layer, prefix=f"{prefix}.layers"
+        )
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
-        self.final_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
+        self.final_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -343,15 +363,14 @@ def forward(
             residual = intermediate_tensors["residual"]
 
         for layer in islice(self.layers, self.start_layer, self.end_layer):
-            hidden_states, residual = layer(positions=positions,
-                                            hidden_states=hidden_states,
-                                            residual=residual)
+            hidden_states, residual = layer(
+                positions=positions, hidden_states=hidden_states, residual=residual
+            )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.final_layernorm(hidden_states, residual)
         return hidden_states
 
@@ -362,10 +381,10 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
             ckpt_gate_proj_name="gate_proj",
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
-            num_experts=self.config.num_experts)
+            num_experts=self.config.num_experts,
+        )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -384,7 +403,7 @@ def load_weights(self, weights: Iterable[tuple[str,
             for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
-                if 'experts' in name:
+                if "experts" in name:
                     continue
                 name = name.replace(weight_name, param_name)
                 # Skip loading extra bias for GPTQ models.
@@ -399,10 +418,10 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 for (
-                        param_name,
-                        weight_name,
-                        expert_id,
-                        shard_id,
+                    param_name,
+                    weight_name,
+                    expert_id,
+                    shard_id,
                 ) in expert_params_mapping:
                     if weight_name not in name:
                         continue
@@ -412,11 +431,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                     name = name.replace(weight_name, param_name)
                     param = params_dict[name]
                     weight_loader = param.weight_loader
-                    weight_loader(param,
-                                  loaded_weight,
-                                  name,
-                                  shard_id=shard_id,
-                                  expert_id=expert_id)
+                    weight_loader(
+                        param,
+                        loaded_weight,
+                        name,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                    )
                     break
                 else:
                     # Skip loading extra bias for GPTQ models.
@@ -426,19 +447,18 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
 
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
-class JambaForCausalLM(nn.Module, HasInnerState, SupportsLoRA, SupportsPP,
-                       IsHybrid):
-    hf_to_vllm_mapper = WeightsMapper(orig_to_new_substr={
-        ".self_attn.": ".",
-        ".A_log": ".A"
-    }, )
+class JambaForCausalLM(nn.Module, HasInnerState, SupportsLoRA, SupportsPP, IsHybrid):
+    hf_to_vllm_mapper = WeightsMapper(
+        orig_to_new_substr={".self_attn.": ".", ".A_log": ".A"},
+    )
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -461,16 +481,18 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         cache_config = vllm_config.cache_config
         lora_config = vllm_config.lora_config
         scheduler_config = vllm_config.scheduler_config
-        assert not cache_config.enable_prefix_caching, \
+        assert not cache_config.enable_prefix_caching, (
             "Jamba currently does not support prefix caching"
+        )
 
         super().__init__()
         self.config = config
         self.vllm_config = vllm_config
         self.model_config = vllm_config.model_config
         self.scheduler_config = scheduler_config
-        self.model = JambaModel(vllm_config=vllm_config,
-                                prefix=maybe_prefix(prefix, "model"))
+        self.model = JambaModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.unpadded_vocab_size = config.vocab_size
         if lora_config:
             self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
@@ -481,33 +503,37 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             padding_size=DEFAULT_VOCAB_PADDING_SIZE
             # We need bigger padding if using lora for kernel
             # compatibility
-            if not lora_config else lora_config.lora_vocab_padding_size,
+            if not lora_config
+            else lora_config.lora_vocab_padding_size,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
 
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs):
-
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs,
+    ):
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def copy_inputs_before_cuda_graphs(self, input_buffers, **kwargs):
-        return self.mamba_cache.copy_inputs_before_cuda_graphs(
-            input_buffers, **kwargs)
+        return self.mamba_cache.copy_inputs_before_cuda_graphs(input_buffers, **kwargs)
 
     def get_seqlen_agnostic_capture_inputs(self, batch_size: int):
         return self.mamba_cache.get_seqlen_agnostic_capture_inputs(batch_size)
@@ -517,7 +543,6 @@ def get_mamba_state_dtype_from_config(
         cls,
         vllm_config: "VllmConfig",
     ) -> tuple[torch.dtype, torch.dtype]:
-
         return MambaStateDtypeCalculator.mamba1_state_dtype(
             vllm_config.model_config.dtype,
             vllm_config.cache_config.mamba_cache_dtype,
@@ -547,8 +572,7 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
@@ -557,7 +581,6 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
 
 
 class JambaForSequenceClassification(JambaForCausalLM):
-
     is_pooling_model = True
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
@@ -565,7 +588,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         config = vllm_config.model_config.hf_config
         num_labels: int = config.num_labels
-        score_bias: bool = getattr(config, 'score_bias', False)
+        score_bias: bool = getattr(config, "score_bias", False)
 
         # TODO: The original reward weights have float32 accuracy data, we
         # would like to load them in fp32 to get that extra precision.
@@ -580,12 +603,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         pooler_config = vllm_config.model_config.pooler_config
         assert pooler_config is not None
 
-        self.pooler = DispatchPooler({
-            "encode":
-            Pooler.for_encode(pooler_config),
-            "classify":
-            Pooler.for_classify(
-                pooler_config,
-                classifier=self.score,
-            ),
-        })
+        self.pooler = DispatchPooler(
+            {
+                "encode": Pooler.for_encode(pooler_config),
+                "classify": Pooler.for_classify(
+                    pooler_config,
+                    classifier=self.score,
+                ),
+            }
+        )
diff --git a/vllm/model_executor/models/jina_vl.py b/vllm/model_executor/models/jina_vl.py
index f8c2a1e507a7..9711eeeeec33 100644
--- a/vllm/model_executor/models/jina_vl.py
+++ b/vllm/model_executor/models/jina_vl.py
@@ -10,36 +10,34 @@
 from vllm.config import ModelConfig, VllmConfig
 from vllm.inputs import TokensPrompt
 from vllm.logger import init_logger
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import ColumnParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.pooler import DispatchPooler, Pooler
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.sequence import IntermediateTensors
 
-from .interfaces import (SupportsCrossEncoding, SupportsMultiModal,
-                         SupportsScoreTemplate)
-from .qwen2_vl import (Qwen2VLDummyInputsBuilder,
-                       Qwen2VLForConditionalGeneration,
-                       Qwen2VLMultiModalProcessor, Qwen2VLProcessingInfo)
+from .interfaces import SupportsCrossEncoding, SupportsMultiModal, SupportsScoreTemplate
+from .qwen2_vl import (
+    Qwen2VLDummyInputsBuilder,
+    Qwen2VLForConditionalGeneration,
+    Qwen2VLMultiModalProcessor,
+    Qwen2VLProcessingInfo,
+)
 from .utils import AutoWeightsLoader, WeightsMapper, maybe_prefix
 
 logger = init_logger(__name__)
 
 
 class JinaVLScorer(nn.Module):
-
     def __init__(self, model_config: "ModelConfig"):
         super().__init__()
         config = model_config.hf_config
         head_dtype = model_config.head_dtype
-        self.dense = ColumnParallelLinear(config.hidden_size,
-                                          config.hidden_size,
-                                          params_dtype=head_dtype,
-                                          bias=True)
-        self.out_proj = RowParallelLinear(config.hidden_size,
-                                          config.num_labels,
-                                          params_dtype=head_dtype,
-                                          bias=True)
+        self.dense = ColumnParallelLinear(
+            config.hidden_size, config.hidden_size, params_dtype=head_dtype, bias=True
+        )
+        self.out_proj = RowParallelLinear(
+            config.hidden_size, config.num_labels, params_dtype=head_dtype, bias=True
+        )
 
     def forward(self, x, **kwargs):
         x, _ = self.dense(x)
@@ -49,7 +47,6 @@ def forward(self, x, **kwargs):
 
 
 class JinaVLMultiModalProcessor(Qwen2VLMultiModalProcessor):
-
     def _call_hf_processor(
         self,
         prompt: str,
@@ -57,25 +54,26 @@ def _call_hf_processor(
         mm_kwargs: Mapping[str, object],
         tok_kwargs: Mapping[str, object],
     ) -> BatchFeature:
-
         # NOTE: We should reverse the order of the mm_data because the
         # query prompt is placed after the document prompt in the score
         # template for JinaVLForRanking model, but in mm_data they are
         # stored in the opposite order (query first, then document).
         for _, value in mm_data.items():
             value.reverse()
-        return super()._call_hf_processor(prompt, mm_data, mm_kwargs,
-                                          tok_kwargs)
-
-
-@MULTIMODAL_REGISTRY.register_processor(JinaVLMultiModalProcessor,
-                                        info=Qwen2VLProcessingInfo,
-                                        dummy_inputs=Qwen2VLDummyInputsBuilder)
-class JinaVLForSequenceClassification(Qwen2VLForConditionalGeneration,
-                                      SupportsCrossEncoding,
-                                      SupportsMultiModal,
-                                      SupportsScoreTemplate):
-
+        return super()._call_hf_processor(prompt, mm_data, mm_kwargs, tok_kwargs)
+
+
+@MULTIMODAL_REGISTRY.register_processor(
+    JinaVLMultiModalProcessor,
+    info=Qwen2VLProcessingInfo,
+    dummy_inputs=Qwen2VLDummyInputsBuilder,
+)
+class JinaVLForSequenceClassification(
+    Qwen2VLForConditionalGeneration,
+    SupportsCrossEncoding,
+    SupportsMultiModal,
+    SupportsScoreTemplate,
+):
     is_pooling_model = True
     weight_mapper = WeightsMapper(
         orig_to_new_prefix={
@@ -87,23 +85,24 @@ class JinaVLForSequenceClassification(Qwen2VLForConditionalGeneration,
             # mapping for original checkpoint
             "lm_head.": "language_model.lm_head.",
             "model.": "language_model.model.",
-        })
+        }
+    )
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
-        super().__init__(vllm_config=vllm_config,
-                         prefix=maybe_prefix(prefix, "qwen2_vl"))
+        super().__init__(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "qwen2_vl")
+        )
         pooler_config = vllm_config.model_config.pooler_config
         assert pooler_config is not None
 
         self.score = JinaVLScorer(vllm_config.model_config)
-        self.pooler = DispatchPooler({
-            "encode":
-            Pooler.for_encode(pooler_config),
-            "classify":
-            Pooler.for_classify(pooler_config, classifier=self.score),
-            "score":
-            Pooler.for_classify(pooler_config, classifier=self.score),
-        })
+        self.pooler = DispatchPooler(
+            {
+                "encode": Pooler.for_encode(pooler_config),
+                "classify": Pooler.for_classify(pooler_config, classifier=self.score),
+                "score": Pooler.for_classify(pooler_config, classifier=self.score),
+            }
+        )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -118,9 +117,8 @@ def get_score_template(cls, query: str, document: str) -> Optional[str]:
 
     @classmethod
     def post_process_tokens(cls, prompt: TokensPrompt) -> None:
-
         # add score target token at the end of prompt tokens
-        prompt['prompt_token_ids'].append(100)
+        prompt["prompt_token_ids"].append(100)
 
     def forward(
         self,
diff --git a/vllm/model_executor/models/keye.py b/vllm/model_executor/models/keye.py
index dda24bb78491..7ccbc81431f6 100644
--- a/vllm/model_executor/models/keye.py
+++ b/vllm/model_executor/models/keye.py
@@ -13,8 +13,7 @@
 from transformers import PretrainedConfig
 from transformers.activations import GELUActivation
 from transformers.feature_extraction_utils import BatchFeature
-from transformers.modeling_outputs import (BaseModelOutput,
-                                           BaseModelOutputWithPooling)
+from transformers.modeling_outputs import BaseModelOutput, BaseModelOutputWithPooling
 from transformers.utils import torch_int
 
 from vllm.attention.backends.registry import _Backend
@@ -23,33 +22,57 @@
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.logger import init_logger
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (ImageItem, ModalityData,
-                                    MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems, VideoItem)
-from vllm.multimodal.parse import (DictEmbeddingItems, ImageSize,
-                                   ModalityDataItems, MultiModalDataItems,
-                                   MultiModalDataParser)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate)
+from vllm.multimodal.inputs import (
+    ImageItem,
+    ModalityData,
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+    VideoItem,
+)
+from vllm.multimodal.parse import (
+    DictEmbeddingItems,
+    ImageSize,
+    ModalityDataItems,
+    MultiModalDataItems,
+    MultiModalDataParser,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
 from .siglip import SiglipMLP
-from .utils import (AutoWeightsLoader, WeightsMapper,
-                    init_vllm_registered_model, is_pp_missing_parameter,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    init_vllm_registered_model,
+    is_pp_missing_parameter,
+    maybe_prefix,
+)
 from .vision import get_vit_attn_backend
 
 logger = init_logger(__name__)
@@ -81,8 +104,10 @@ def smart_resize(
         width = factor
 
     if max(height, width) / min(height, width) > 200:
-        raise ValueError("absolute aspect ratio must be smaller than 200, got "
-                         "{max(height, width) / min(height, width)}")
+        raise ValueError(
+            "absolute aspect ratio must be smaller than 200, got "
+            "{max(height, width) / min(height, width)}"
+        )
     h_bar = round(height / factor) * factor
     w_bar = round(width / factor) * factor
     if h_bar * w_bar > max_pixels:
@@ -105,10 +130,11 @@ class KeyeImagePixelInputs(TensorSchema):
         - ni: Number of images
         - g: Grid dimensions (3 for t, h, w)
     """
+
     type: Literal["pixel_values"]
     pixel_values: Annotated[
-        torch.Tensor,
-        TensorShape("bnp", 3, "ps", "ps", dynamic_dims={"bnp"})]
+        torch.Tensor, TensorShape("bnp", 3, "ps", "ps", dynamic_dims={"bnp"})
+    ]
     image_grid_thw: Annotated[torch.Tensor, TensorShape("ni", 3)]
 
 
@@ -116,11 +142,12 @@ class KeyeImageEmbeddingInputs(TensorSchema):
     """
     Dimensions:
         - nf: Number of image features
-        - hs: Hidden size (must match the hidden size of language model 
+        - hs: Hidden size (must match the hidden size of language model
           backbone)
         - ni: Number of images
         - g: Grid dimensions (3 for t, h, w)
     """
+
     type: Literal["image_embeds"]
     image_embeds: Annotated[torch.Tensor, TensorShape("nf", "hs")]
     image_grid_thw: Annotated[torch.Tensor, TensorShape("ni", 3)]
@@ -138,10 +165,11 @@ class KeyeVideoPixelInputs(TensorSchema):
         - ni: Number of images
         - g: Grid dimensions (3 for t, h, w)
     """
+
     type: Literal["pixel_values_videos"]
     pixel_values_videos: Annotated[
-        torch.Tensor,
-        TensorShape("bnp", 3, "ps", "ps", dynamic_dims={"bnp"})]
+        torch.Tensor, TensorShape("bnp", 3, "ps", "ps", dynamic_dims={"bnp"})
+    ]
     video_grid_thw: Annotated[torch.Tensor, TensorShape("nv", 3)]
 
 
@@ -149,11 +177,12 @@ class KeyeVideoEmbeddingInputs(TensorSchema):
     """
     Dimensions:
         - nf: Number of video features
-        - hs: Hidden size (must match the hidden size of language model 
+        - hs: Hidden size (must match the hidden size of language model
           backbone)
         - nv: Number of videos
         - g: Grid dimensions (3 for t, h, w)
     """
+
     type: Literal["video_embeds"]
     video_embeds: Annotated[torch.Tensor, TensorShape("nf", "hs")]
     video_grid_thw: Annotated[torch.Tensor, TensorShape("nv", 3)]
@@ -163,7 +192,6 @@ class KeyeVideoEmbeddingInputs(TensorSchema):
 
 
 class KeyeVisionEmbeddings(nn.Module):
-
     def __init__(self, config: PretrainedConfig):
         super().__init__()
         self.config = config
@@ -179,12 +207,11 @@ def __init__(self, config: PretrainedConfig):
             padding="valid",
         )
 
-        self.num_patches = (self.image_size // self.patch_size)**2
+        self.num_patches = (self.image_size // self.patch_size) ** 2
         self.num_positions = self.num_patches
         self.cache_position_embedding = dict()
         self.cache_position_count = dict()
-        self.position_embedding = nn.Embedding(self.num_positions,
-                                               self.embed_dim)
+        self.position_embedding = nn.Embedding(self.num_positions, self.embed_dim)
         self.packing_position_embedding = nn.Embedding(32768, self.embed_dim)
 
         self.register_buffer(
@@ -200,7 +227,6 @@ def interpolate_pos_encoding(
         width: int,
         is_after_patchify: bool = False,
     ) -> torch.Tensor:
-
         num_positions = self.position_embedding.weight.shape[0]
 
         patch_pos_embed = self.position_embedding.weight.unsqueeze(0)
@@ -215,8 +241,9 @@ def interpolate_pos_encoding(
             new_width = width // self.patch_size
 
         sqrt_num_positions = torch_int(num_positions**0.5)
-        patch_pos_embed = patch_pos_embed.reshape(1, sqrt_num_positions,
-                                                  sqrt_num_positions, dim)
+        patch_pos_embed = patch_pos_embed.reshape(
+            1, sqrt_num_positions, sqrt_num_positions, dim
+        )
         patch_pos_embed = patch_pos_embed.permute(0, 3, 1, 2)
 
         patch_pos_embed = nn.functional.interpolate(
@@ -229,11 +256,7 @@ def interpolate_pos_encoding(
         patch_pos_embed = patch_pos_embed.permute(0, 2, 3, 1).view(1, -1, dim)
         return patch_pos_embed
 
-    def fetch_position_embedding_lfu_cache(self,
-                                           embeddings,
-                                           h,
-                                           w,
-                                           max_cache: int = 20):
+    def fetch_position_embedding_lfu_cache(self, embeddings, h, w, max_cache: int = 20):
         grid = (h, w)
         if grid in self.cache_position_embedding:
             self.cache_position_count[grid] += 1
@@ -247,8 +270,7 @@ def fetch_position_embedding_lfu_cache(self,
             self.cache_position_count.pop(min_hit_grid)
             self.cache_position_embedding.pop(min_hit_grid)
 
-        position_embedding = self.interpolate_pos_encoding(
-            embeddings, h, w, True)
+        position_embedding = self.interpolate_pos_encoding(embeddings, h, w, True)
         self.cache_position_count[grid] = 1
         self.cache_position_embedding[grid] = position_embedding
         return position_embedding
@@ -257,10 +279,14 @@ def forward(
         self,
         pixel_values: torch.FloatTensor,
         position_ids: Optional[torch.Tensor] = None,
-        image_grid_thw: Optional[list[Union[
-            tuple[int, int, int],
-            list[tuple[int, int, int]],
-        ]]] = None,
+        image_grid_thw: Optional[
+            list[
+                Union[
+                    tuple[int, int, int],
+                    list[tuple[int, int, int]],
+                ]
+            ]
+        ] = None,
         interpolate_pos_encoding=False,
     ) -> torch.Tensor:
         if pixel_values.dim() == 4:
@@ -279,8 +305,7 @@ def forward(
             ) = pixel_values.shape
             target_dtype = self.patch_embedding.weight.dtype
             pixel_values = rearrange(pixel_values, "b l c h w -> (b l) c h w")
-            patch_embeds = self.patch_embedding(
-                pixel_values.to(dtype=target_dtype))
+            patch_embeds = self.patch_embedding(pixel_values.to(dtype=target_dtype))
             embeddings = patch_embeds.flatten(-2).squeeze(-1)
 
             if interpolate_pos_encoding and image_grid_thw is not None:
@@ -290,19 +315,23 @@ def forward(
                     t, h, w = image_grid
                     end = start + t * h * w
                     image_embeddings = embeddings[start:end, :]
-                    position_embedding = (self.interpolate_pos_encoding(
-                        image_embeddings, h, w, True).squeeze(0).repeat(t, 1))
+                    position_embedding = (
+                        self.interpolate_pos_encoding(image_embeddings, h, w, True)
+                        .squeeze(0)
+                        .repeat(t, 1)
+                    )
                     image_embeddings = image_embeddings + position_embedding
                     tmp_embeddings.append(image_embeddings)
                     start = end
                 embeddings = torch.concat(tmp_embeddings, dim=0).unsqueeze(0)
             else:
-                embeddings = embeddings + self.packing_position_embedding(
-                    position_ids)
+                embeddings = embeddings + self.packing_position_embedding(position_ids)
             return embeddings
         else:
-            raise ValueError("Unsupported pixel_values dimension:"
-                             f" {pixel_values.dim()}. Expected 4 or 5.")
+            raise ValueError(
+                "Unsupported pixel_values dimension:"
+                f" {pixel_values.dim()}. Expected 4 or 5."
+            )
 
 
 def apply_rotary_pos_emb_flashatt(
@@ -369,18 +398,20 @@ def __init__(
 
         # Detect attention implementation.
         self.attn_backend = get_vit_attn_backend(
-            head_size=self.head_dim, dtype=torch.get_default_dtype())
+            head_size=self.head_dim, dtype=torch.get_default_dtype()
+        )
 
         self.use_upstream_fa = False
-        if self.attn_backend != _Backend.FLASH_ATTN and \
-            check_upstream_fa_availability(
-                torch.get_default_dtype()):
+        if self.attn_backend != _Backend.FLASH_ATTN and check_upstream_fa_availability(
+            torch.get_default_dtype()
+        ):
             self.attn_backend = _Backend.FLASH_ATTN
             self.use_upstream_fa = True
 
         if self.attn_backend not in {_Backend.FLASH_ATTN, _Backend.XFORMERS}:
             raise RuntimeError(
-                f"Keye-VL does not support {self.attn_backend} backend now.")
+                f"Keye-VL does not support {self.attn_backend} backend now."
+            )
 
     def forward(
         self,
@@ -414,8 +445,7 @@ def forward(
             )
         else:
             if cu_seqlens is None:
-                raise ValueError(
-                    "cu_seqlens cannot be None when rope_emb is not None.")
+                raise ValueError("cu_seqlens cannot be None when rope_emb is not None.")
             cos, sin = rope_emb
             q = q.view(*q.shape[:-1], self.num_heads, self.head_dim)
             k = k.view(
@@ -449,29 +479,26 @@ def forward(
                 causal=False,
                 softmax_scale=self.scale,
             )
-            context_layer = rearrange(output,
-                                      "(b s) ... -> b s ...",
-                                      b=batch_size)
+            context_layer = rearrange(output, "(b s) ... -> b s ...", b=batch_size)
         elif self.attn_backend == _Backend.XFORMERS:
             from xformers import ops as xops
             from xformers.ops.fmha.attn_bias import BlockDiagonalMask
 
-            attn_bias = BlockDiagonalMask.from_seqlens(q_seqlen=seqlens,
-                                                       kv_seqlen=None,
-                                                       device=q.device)
+            attn_bias = BlockDiagonalMask.from_seqlens(
+                q_seqlen=seqlens, kv_seqlen=None, device=q.device
+            )
 
             context_layer = xops.memory_efficient_attention_forward(
-                q, k, v, attn_bias=attn_bias, p=0, scale=None)
+                q, k, v, attn_bias=attn_bias, p=0, scale=None
+            )
 
-        context_layer = rearrange(context_layer,
-                                  "b s h d -> b s (h d)").contiguous()
+        context_layer = rearrange(context_layer, "b s h d -> b s (h d)").contiguous()
 
         output, _ = self.out_proj(context_layer)
         return output
 
 
 class SigLIPRotaryEmbedding(nn.Module):
-
     def __init__(self, dim: int, theta: float = 10000.0) -> None:
         super().__init__()
         self.dim = dim
@@ -479,8 +506,9 @@ def __init__(self, dim: int, theta: float = 10000.0) -> None:
         self.rope_init()
 
     def rope_init(self):
-        inv_freq = 1.0 / (self.theta**(
-            torch.arange(0, self.dim, 2, dtype=torch.float) / self.dim))
+        inv_freq = 1.0 / (
+            self.theta ** (torch.arange(0, self.dim, 2, dtype=torch.float) / self.dim)
+        )
         self.register_buffer("inv_freq", inv_freq, persistent=False)
 
     def forward(self, seqlen: int) -> torch.Tensor:
@@ -494,7 +522,6 @@ def forward(self, seqlen: int) -> torch.Tensor:
 
 
 class KeyeSiglipEncoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Union[PretrainedConfig],
@@ -503,15 +530,13 @@ def __init__(
     ):
         super().__init__()
         self.embed_dim = config.hidden_size
-        self.layer_norm1 = nn.LayerNorm(self.embed_dim,
-                                        eps=config.layer_norm_eps)
+        self.layer_norm1 = nn.LayerNorm(self.embed_dim, eps=config.layer_norm_eps)
         self.self_attn = KeyeSiglipAttention(
             config,
             quant_config=quant_config,
             prefix=f"{prefix}.self_attn",
         )
-        self.layer_norm2 = nn.LayerNorm(self.embed_dim,
-                                        eps=config.layer_norm_eps)
+        self.layer_norm2 = nn.LayerNorm(self.embed_dim, eps=config.layer_norm_eps)
         self.mlp = SiglipMLP(
             config,
             quant_config=quant_config,
@@ -526,7 +551,6 @@ def forward(
         cu_seqlens: Optional[list[torch.Tensor]] = None,
         rope_emb: Optional[tuple[torch.Tensor, torch.Tensor]] = None,
     ) -> tuple[torch.FloatTensor]:
-
         residual = hidden_states
 
         hidden_states = self.layer_norm1(hidden_states)
@@ -550,7 +574,6 @@ def forward(
 
 
 class KeyeSiglipEncoder(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -562,13 +585,16 @@ def __init__(
         embed_dim = config.hidden_size
         num_heads = config.num_attention_heads
         head_dim = embed_dim // num_heads
-        self.layers = nn.ModuleList([
-            KeyeSiglipEncoderLayer(
-                config,
-                quant_config=quant_config,
-                prefix=f"{prefix}.layers.{layer_idx}",
-            ) for layer_idx in range(config.num_hidden_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                KeyeSiglipEncoderLayer(
+                    config,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.layers.{layer_idx}",
+                )
+                for layer_idx in range(config.num_hidden_layers)
+            ]
+        )
         self.rotary_pos_emb = SigLIPRotaryEmbedding(head_dim // 2)
 
     @staticmethod
@@ -588,10 +614,14 @@ def forward(
         output_attentions: Optional[bool] = None,
         output_hidden_states: Optional[bool] = None,
         cu_seqlens: Optional[list[torch.Tensor]] = None,
-        image_grid_thw: Optional[list[Union[
-            tuple[int, int, int],
-            list[tuple[int, int, int]],
-        ]]] = None,
+        image_grid_thw: Optional[
+            list[
+                Union[
+                    tuple[int, int, int],
+                    list[tuple[int, int, int]],
+                ]
+            ]
+        ] = None,
         height_position_ids: Optional[torch.Tensor] = None,
         width_position_ids: Optional[torch.Tensor] = None,
         use_rope: Optional[bool] = False,
@@ -607,8 +637,7 @@ def forward(
                 split_hids = list()
                 split_wids = list()
                 for t, h, w in flatten_image_grid_thw:
-                    image_pids = torch.arange(t * h * w,
-                                              device=device) % (h * w)
+                    image_pids = torch.arange(t * h * w, device=device) % (h * w)
                     sample_hids = image_pids // w
                     sample_wids = image_pids % w
                     split_hids.append(sample_hids)
@@ -644,7 +673,6 @@ def forward(
 
 
 class KeyeSiglipVisionTransformer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -661,8 +689,7 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.encoder",
         )
-        self.post_layernorm = nn.LayerNorm(embed_dim,
-                                           eps=config.layer_norm_eps)
+        self.post_layernorm = nn.LayerNorm(embed_dim, eps=config.layer_norm_eps)
 
     def forward(
         self,
@@ -679,15 +706,18 @@ def forward(
         cu_seqlens: Optional[list[torch.Tensor]] = None,
         padding_mask: Optional[torch.Tensor] = None,
         vision_return_embed_list: Optional[bool] = False,
-        image_grid_thw: Optional[list[Union[
-            tuple[int, int, int],
-            list[tuple[int, int, int]],
-        ]]] = None,
+        image_grid_thw: Optional[
+            list[
+                Union[
+                    tuple[int, int, int],
+                    list[tuple[int, int, int]],
+                ]
+            ]
+        ] = None,
         return_pooler_output: Optional[bool] = True,
         use_rope: Optional[bool] = False,
         window_size: Optional[bool] = -1,
     ) -> BaseModelOutputWithPooling:
-
         hidden_states = self.embeddings(
             pixel_values,
             interpolate_pos_encoding=interpolate_pos_encoding,
@@ -713,8 +743,10 @@ def forward(
 
         sample_hidden_state = list()
         if cu_seqlens is None:
-            raise ValueError("cu_seqlens cannot be None for "
-                             "SiglipVisionTransformer output processing.")
+            raise ValueError(
+                "cu_seqlens cannot be None for "
+                "SiglipVisionTransformer output processing."
+            )
         for i in range(cu_seqlens.shape[0] - 1):
             start = cu_seqlens[i]
             end = cu_seqlens[i + 1]
@@ -763,16 +795,19 @@ def forward(
         interpolate_pos_encoding: bool = False,
         position_ids: Optional[torch.Tensor] = None,
         vision_return_embed_list: Optional[bool] = False,
-        image_grid_thw: Optional[list[Union[
-            tuple[int, int, int],
-            list[tuple[int, int, int]],
-        ]]] = None,
+        image_grid_thw: Optional[
+            list[
+                Union[
+                    tuple[int, int, int],
+                    list[tuple[int, int, int]],
+                ]
+            ]
+        ] = None,
         cu_seqlens: Optional[list[torch.Tensor]] = None,
         return_pooler_output: Optional[bool] = True,
         use_rope: Optional[bool] = False,
         window_size: Optional[bool] = -1,
     ) -> BaseModelOutputWithPooling:
-
         return self.vision_model(
             pixel_values=pixel_values,
             output_attentions=output_attentions,
@@ -788,8 +823,7 @@ def forward(
             window_size=window_size,
         )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             ("qkv_proj", "q_proj", "q"),
             ("qkv_proj", "k_proj", "k"),
@@ -805,22 +839,24 @@ def load_weights(self, weights: Iterable[tuple[str,
             if "head.mlp" in name or "head.probe" in name:
                 continue
             if self.quant_config is not None and (
-                    scale_name := self.quant_config.get_cache_scale(name)):
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 param = params_dict[scale_name]
                 weight_loader = getattr(
                     param,
                     "weight_loader",
                     default_weight_loader,
                 )
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
             for (
-                    param_name,
-                    weight_name,
-                    shard_id,
+                param_name,
+                weight_name,
+                shard_id,
             ) in stacked_params_mapping:
                 if weight_name not in name:
                     continue
@@ -853,7 +889,6 @@ def load_weights(self, weights: Iterable[tuple[str,
 
 
 class Projector(nn.Module):
-
     def __init__(
         self,
         text_config: PretrainedConfig,
@@ -866,12 +901,13 @@ def __init__(
         self.vision_config = vision_config
         self.merge_kernel_size = (2, 2)
 
-        self.hidden_size = (self.vision_config.hidden_size *
-                            self.merge_kernel_size[0] *
-                            self.merge_kernel_size[1])
+        self.hidden_size = (
+            self.vision_config.hidden_size
+            * self.merge_kernel_size[0]
+            * self.merge_kernel_size[1]
+        )
 
-        self.pre_norm = torch.nn.LayerNorm(self.vision_config.hidden_size,
-                                           eps=1e-05)
+        self.pre_norm = torch.nn.LayerNorm(self.vision_config.hidden_size, eps=1e-05)
         self.act = GELUActivation()
 
         self.linear_1 = ColumnParallelLinear(
@@ -897,8 +933,7 @@ def forward(
         m1, m2 = self.merge_kernel_size
         if isinstance(image_features, (list, tuple)):
             processed_features = list()
-            for image_feature, image_grid in zip(image_features,
-                                                 image_grid_thw):
+            for image_feature, image_grid in zip(image_features, image_grid_thw):
                 image_feature = self.pre_norm(image_feature)
                 t, h, w = image_grid
 
@@ -921,8 +956,7 @@ def forward(
         dims = image_features.shape[:-1]
         dim = image_features.shape[-1]
         image_features = image_features.view(np.prod(dims), dim)
-        hidden_states = self.pre_norm(image_features).view(
-            -1, self.hidden_size)
+        hidden_states = self.pre_norm(image_features).view(-1, self.hidden_size)
         hidden_states = self.linear_1(hidden_states)
         hidden_states = self.act(hidden_states)
         hidden_states = self.linear_2(hidden_states)
@@ -930,7 +964,9 @@ def forward(
         return hidden_states.view(*dims, -1)
 
 
-def _keye_field_config(hf_inputs: Mapping[str, torch.Tensor], ):
+def _keye_field_config(
+    hf_inputs: Mapping[str, torch.Tensor],
+):
     image_grid_thw = hf_inputs.get("image_grid_thw", torch.empty((0, 3)))
     image_grid_sizes = image_grid_thw.prod(-1)
 
@@ -938,21 +974,18 @@ def _keye_field_config(hf_inputs: Mapping[str, torch.Tensor], ):
     video_grid_sizes = video_grid_thw.prod(-1)
 
     return dict(
-        pixel_values=MultiModalFieldConfig.flat_from_sizes(
-            "image", image_grid_sizes),
-        image_embeds=MultiModalFieldConfig.flat_from_sizes(
-            "image", image_grid_sizes),
+        pixel_values=MultiModalFieldConfig.flat_from_sizes("image", image_grid_sizes),
+        image_embeds=MultiModalFieldConfig.flat_from_sizes("image", image_grid_sizes),
         image_grid_thw=MultiModalFieldConfig.batched("image"),
         pixel_values_videos=MultiModalFieldConfig.flat_from_sizes(
-            "video", video_grid_sizes),
-        video_embeds=MultiModalFieldConfig.flat_from_sizes(
-            "video", video_grid_sizes),
+            "video", video_grid_sizes
+        ),
+        video_embeds=MultiModalFieldConfig.flat_from_sizes("video", video_grid_sizes),
         video_grid_thw=MultiModalFieldConfig.batched("video"),
     )
 
 
 class KeyeMultiModalDataParser(MultiModalDataParser):
-
     def _parse_image_data(
         self,
         data: Union[dict[str, torch.Tensor], ModalityData[ImageItem]],
@@ -989,17 +1022,18 @@ def _parse_video_data(
 
 
 class KeyeProcessingInfo(BaseProcessingInfo):
-
     def get_max_image_size(self) -> int:
-        return 9999999  #_MAX_IMAGE_SIZE
+        return 9999999  # _MAX_IMAGE_SIZE
 
     def get_max_frame_per_video(self) -> int:
-        return 16  #_MAX_FRAMES_PER_VIDEO
+        return 16  # _MAX_FRAMES_PER_VIDEO
 
     def get_image_processor(self, **kwargs: object):
         return self.get_hf_processor(**kwargs).image_processor
 
-    def get_supported_mm_limits(self, ) -> Mapping[str, Optional[int]]:
+    def get_supported_mm_limits(
+        self,
+    ) -> Mapping[str, Optional[int]]:
         return {"image": None, "video": None}
 
     def get_mm_max_tokens_per_item(
@@ -1038,11 +1072,9 @@ def _get_vision_info(
                 min_pixels=image_processor.min_pixels,
                 max_pixels=image_processor.max_pixels,
             )
-            preprocessed_size = ImageSize(width=resized_width,
-                                          height=resized_height)
+            preprocessed_size = ImageSize(width=resized_width, height=resized_height)
         else:
-            preprocessed_size = ImageSize(width=image_width,
-                                          height=image_height)
+            preprocessed_size = ImageSize(width=image_width, height=image_height)
 
         padded_num_frames = num_frames + num_frames % temporal_patch_size
 
@@ -1085,7 +1117,9 @@ def get_num_video_tokens(
         )
         return num_video_tokens
 
-    def get_image_size_with_most_features(self, ) -> ImageSize:
+    def get_image_size_with_most_features(
+        self,
+    ) -> ImageSize:
         max_image_size, _ = self._get_vision_info(
             image_width=self.get_max_image_size(),
             image_height=self.get_max_image_size(),
@@ -1129,8 +1163,7 @@ def get_num_frames_with_most_features(self, seq_len: int) -> int:
         max_videos = mm_config.get_limit_per_prompt("video")
 
         max_image_tokens = self.get_max_image_tokens() * max_images
-        max_total_frames = self._get_max_video_frames(seq_len -
-                                                      max_image_tokens)
+        max_total_frames = self._get_max_video_frames(seq_len - max_image_tokens)
         max_frames_per_video = min(
             max_total_frames // max(max_videos, 1),
             self.get_max_frame_per_video(),
@@ -1153,7 +1186,6 @@ def get_max_video_tokens(self, seq_len: int) -> int:
 
 
 class KeyeBaseDummyInputsBuilder(BaseDummyInputsBuilder[_I]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -1173,24 +1205,20 @@ def get_dummy_mm_data(
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
 
-        target_width, target_height = (
-            self.info.get_image_size_with_most_features())
-        target_num_frames = self.info.get_num_frames_with_most_features(
-            seq_len)
+        target_width, target_height = self.info.get_image_size_with_most_features()
+        target_num_frames = self.info.get_num_frames_with_most_features(seq_len)
 
         image_overrides = mm_options.get("image") if mm_options else None
         video_overrides = mm_options.get("video") if mm_options else None
 
         mm_data = {
-            "image":
-            self._get_dummy_images(
+            "image": self._get_dummy_images(
                 width=target_width,
                 height=target_height,
                 num_images=num_images,
                 overrides=image_overrides,
             ),
-            "video":
-            self._get_dummy_videos(
+            "video": self._get_dummy_videos(
                 width=target_width,
                 height=target_height,
                 num_frames=target_num_frames,
@@ -1202,12 +1230,10 @@ def get_dummy_mm_data(
         return mm_data
 
 
-class KeyeDummyInputsBuilder(KeyeBaseDummyInputsBuilder[KeyeProcessingInfo]):
-    ...
+class KeyeDummyInputsBuilder(KeyeBaseDummyInputsBuilder[KeyeProcessingInfo]): ...
 
 
 class KeyeMultiModalProcessor(BaseMultiModalProcessor[KeyeProcessingInfo]):
-
     def _get_data_parser(self) -> MultiModalDataParser:
         return KeyeMultiModalDataParser()
 
@@ -1218,8 +1244,7 @@ def _get_prompt_updates(
         out_mm_kwargs: MultiModalKwargsItems,
     ) -> Sequence[PromptUpdate]:
         hf_processor = self.info.get_hf_processor(**hf_processor_mm_kwargs)
-        image_processor = self.info.get_image_processor(
-            **hf_processor_mm_kwargs)
+        image_processor = self.info.get_image_processor(**hf_processor_mm_kwargs)
         tokenizer = self.info.get_tokenizer()
         vocab = tokenizer.get_vocab()
 
@@ -1243,7 +1268,8 @@ def get_replacement_keye(item_idx: int, modality: str):
                 modality=modality,
                 target=[placeholder[modality]],
                 replacement=partial(get_replacement_keye, modality=modality),
-            ) for modality in ("image", "video")
+            )
+            for modality in ("image", "video")
         ]
 
     def _get_mm_fields_config(
@@ -1269,10 +1295,12 @@ class BaseKeyeModule(nn.Module):
         ],
     }
 
-    hf_to_vllm_mapper = WeightsMapper(orig_to_new_prefix={
-        "lm_head.": "language_model.lm_head.",
-        "model.": "language_model.model.",
-    })
+    hf_to_vllm_mapper = WeightsMapper(
+        orig_to_new_prefix={
+            "lm_head.": "language_model.lm_head.",
+            "model.": "language_model.model.",
+        }
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -1312,18 +1340,20 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     @abstractmethod
-    def _build_projector(self,
-                         text_config: PretrainedConfig,
-                         vision_config: PretrainedConfig,
-                         quant_config: Optional[QuantizationConfig] = None,
-                         prefix: str = "") -> nn.Module:
+    def _build_projector(
+        self,
+        text_config: PretrainedConfig,
+        vision_config: PretrainedConfig,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> nn.Module:
         raise ValueError("Need projector")
 
-    def _process_image_input(self,
-                             image_input: Any) -> tuple[torch.Tensor, ...]:
+    def _process_image_input(self, image_input: Any) -> tuple[torch.Tensor, ...]:
         siglip_position_ids = list()
         image_grid_hws = list()
         sample_indices = list()
@@ -1338,21 +1368,22 @@ def _process_image_input(self,
             image_grid_hws.append(thw_tuple)
             image_position_ids = torch.arange(numel) % np.prod(thw_tuple[1:])
             siglip_position_ids.append(image_position_ids)
-            sample_indices.append(torch.full((numel, ), idx,
-                                             dtype=torch.int64))
+            sample_indices.append(torch.full((numel,), idx, dtype=torch.int64))
             cu_seqlens.append(cu_seqlens[-1] + numel)
 
         if image_input["type"] == "image_embeds":
             raise ValueError(
-                "Image embeddings are not supported for this processing path.")
+                "Image embeddings are not supported for this processing path."
+            )
         else:
             pixel_values = image_input["pixel_values"].type(self.visual.dtype)
-            siglip_position_ids = torch.concat(siglip_position_ids,
-                                               dim=0).to(pixel_values.device)
+            siglip_position_ids = torch.concat(siglip_position_ids, dim=0).to(
+                pixel_values.device
+            )
             cu_seqlens = torch.tensor(cu_seqlens, dtype=torch.int32).to(
-                pixel_values.device)
-            sample_indices = torch.concat(sample_indices,
-                                          dim=0).to(pixel_values.device)
+                pixel_values.device
+            )
+            sample_indices = torch.concat(sample_indices, dim=0).to(pixel_values.device)
 
             image_embeds = self.visual(
                 pixel_values=pixel_values,
@@ -1372,7 +1403,7 @@ def _process_video_embeds(
         self,
         video_type: Literal["video_embeds", "pixel_values_videos"],
         video_grid_thw: list[torch.Tensor],
-        pixel_values_videos: Optional[torch.Tensor] = None
+        pixel_values_videos: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, list[torch.Tensor]]:
         siglip_position_ids = list()
         video_grid_hws = list()
@@ -1387,21 +1418,24 @@ def _process_video_embeds(
             video_grid_hws.append(thw_tuple)
             video_position_ids = torch.arange(numel) % np.prod(thw_tuple[1:])
             siglip_position_ids.append(video_position_ids)
-            sample_indices.append(torch.full((numel, ), idx,
-                                             dtype=torch.int64))
+            sample_indices.append(torch.full((numel,), idx, dtype=torch.int64))
             cu_seqlens.append(cu_seqlens[-1] + numel)
 
         if video_type == "video_embeds":
             raise ValueError(
-                "Video embeddings are not supported for this processing path.")
+                "Video embeddings are not supported for this processing path."
+            )
         else:
             pixel_values_videos = pixel_values_videos.type(self.visual.dtype)
             siglip_position_ids = torch.concat(siglip_position_ids, dim=0).to(
-                pixel_values_videos.device)
+                pixel_values_videos.device
+            )
             cu_seqlens = torch.tensor(cu_seqlens, dtype=torch.int32).to(
-                pixel_values_videos.device)
-            sample_indices = torch.concat(sample_indices,
-                                          dim=0).to(pixel_values_videos.device)
+                pixel_values_videos.device
+            )
+            sample_indices = torch.concat(sample_indices, dim=0).to(
+                pixel_values_videos.device
+            )
 
             video_embeds = self.visual(
                 pixel_values=pixel_values_videos,
@@ -1421,14 +1455,16 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         modalities = {}
 
         for input_key in kwargs:
-            if (input_key in ("pixel_values", "image_embeds")
-                    and "images" not in modalities):
-                modalities["images"] = self._parse_and_validate_image_input(
-                    **kwargs)
-            if (input_key in ("pixel_values_videos", "video_embeds")
-                    and "videos" not in modalities):
-                modalities["videos"] = self._parse_and_validate_video_input(
-                    **kwargs)
+            if (
+                input_key in ("pixel_values", "image_embeds")
+                and "images" not in modalities
+            ):
+                modalities["images"] = self._parse_and_validate_image_input(**kwargs)
+            if (
+                input_key in ("pixel_values_videos", "video_embeds")
+                and "videos" not in modalities
+            ):
+                modalities["videos"] = self._parse_and_validate_video_input(**kwargs)
 
         return modalities
 
@@ -1436,8 +1472,8 @@ def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
     def get_multimodal_embeddings(
-            self, **kwargs: object) -> Optional[MultiModalEmbeddings]:
-
+        self, **kwargs: object
+    ) -> Optional[MultiModalEmbeddings]:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return None
@@ -1494,8 +1530,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
@@ -1513,18 +1548,21 @@ def get_mm_mapping(self) -> MultiModelKeys:
     info=KeyeProcessingInfo,
     dummy_inputs=KeyeDummyInputsBuilder,
 )
-class KeyeForConditionalGeneration(BaseKeyeModule, SupportsMultiModal,
-                                   SupportsLoRA, SupportsPP):
-
-    def _build_projector(self,
-                         text_config: PretrainedConfig,
-                         vision_config: PretrainedConfig,
-                         quant_config: Optional[QuantizationConfig] = None,
-                         prefix: str = "") -> nn.Module:
+class KeyeForConditionalGeneration(
+    BaseKeyeModule, SupportsMultiModal, SupportsLoRA, SupportsPP
+):
+    def _build_projector(
+        self,
+        text_config: PretrainedConfig,
+        vision_config: PretrainedConfig,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> nn.Module:
         return Projector(text_config, vision_config, quant_config, prefix)
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[KeyeImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[KeyeImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_embeds = kwargs.pop("image_embeds", None)
         image_grid_thw = kwargs.pop("image_grid_thw", None)
@@ -1547,7 +1585,8 @@ def _parse_and_validate_image_input(
             )
 
     def _parse_and_validate_video_input(
-            self, **kwargs: object) -> Optional[KeyeVideoInputs]:
+        self, **kwargs: object
+    ) -> Optional[KeyeVideoInputs]:
         pixel_values_videos = kwargs.pop("pixel_values_videos", None)
         video_embeds = kwargs.pop("video_embeds", None)
         video_grid_thw = kwargs.pop("video_grid_thw", None)
@@ -1570,11 +1609,12 @@ def _parse_and_validate_video_input(
             )
 
     def _process_video_input(
-            self, video_input: KeyeVideoInputs) -> tuple[torch.Tensor, ...]:
+        self, video_input: KeyeVideoInputs
+    ) -> tuple[torch.Tensor, ...]:
         video_type = video_input["type"]
         video_grid_thw = video_input["video_grid_thw"]
         pixel_values_videos = video_input.get("pixel_values_videos", None)
 
         return tuple(
-            self._process_video_embeds(video_type, video_grid_thw,
-                                       pixel_values_videos))
+            self._process_video_embeds(video_type, video_grid_thw, pixel_values_videos)
+        )
diff --git a/vllm/model_executor/models/keye_vl1_5.py b/vllm/model_executor/models/keye_vl1_5.py
index 6e34230878d3..578436fcad21 100644
--- a/vllm/model_executor/models/keye_vl1_5.py
+++ b/vllm/model_executor/models/keye_vl1_5.py
@@ -15,22 +15,36 @@
 
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import ColumnParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (ImageItem, ModalityData,
-                                    MultiModalFieldConfig,
-                                    MultiModalKwargsItems, VideoItem)
-from vllm.multimodal.parse import (DictEmbeddingItems, ModalityDataItems,
-                                   MultiModalDataItems, MultiModalDataParser)
-from vllm.multimodal.processing import (PromptReplacement, PromptUpdate,
-                                        PromptUpdateDetails)
+from vllm.multimodal.inputs import (
+    ImageItem,
+    ModalityData,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+    VideoItem,
+)
+from vllm.multimodal.parse import (
+    DictEmbeddingItems,
+    ModalityDataItems,
+    MultiModalDataItems,
+    MultiModalDataParser,
+)
+from vllm.multimodal.processing import (
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .interfaces import SupportsLoRA, SupportsMultiModal, SupportsPP
-from .keye import (BaseKeyeModule, BaseMultiModalProcessor,
-                   KeyeBaseDummyInputsBuilder, KeyeProcessingInfo)
+from .keye import (
+    BaseKeyeModule,
+    BaseMultiModalProcessor,
+    KeyeBaseDummyInputsBuilder,
+    KeyeProcessingInfo,
+)
 
 logger = init_logger(__name__)
 
@@ -58,8 +72,9 @@ def split_thw(grid_thw: torch.Tensor) -> torch.Tensor:
     return torch.cat([ones, h_w], dim=1).repeat_interleave(t, dim=0)
 
 
-def get_num_patches(grid_thw: torch.Tensor,
-                    num_frames: Union[list[int], torch.Tensor]) -> list[int]:
+def get_num_patches(
+    grid_thw: torch.Tensor, num_frames: Union[list[int], torch.Tensor]
+) -> list[int]:
     """
     Return num_patches per video.
 
@@ -73,9 +88,13 @@ def get_num_patches(grid_thw: torch.Tensor,
 
     Examples:
         >>> # Suppose there are 2 videos with a total of 3 grids
-        >>> grid_thw = torch.tensor([[2, 2, 2],  # grid 0: 2*2*2=8 patches
-        ...                          [2, 2, 2],  # grid 1: 2*2*2=8 patches
-        ...                          [1, 1, 1]]) # grid 2: 1*1*1=1 patches
+        >>> grid_thw = torch.tensor(
+        ...     [
+        ...         [2, 2, 2],  # grid 0: 2*2*2=8 patches
+        ...         [2, 2, 2],  # grid 1: 2*2*2=8 patches
+        ...         [1, 1, 1],
+        ...     ]
+        ... )  # grid 2: 1*1*1=1 patches
         >>> num_frames = [2, 1]  # The first video contains 2 grids,
                                    the second contains 1 grid.
         >>> get_num_patches(grid_thw, num_frames)
@@ -90,11 +109,14 @@ def get_num_patches(grid_thw: torch.Tensor,
     num_grids_per_frame = grid_thw.prod(dim=1)
     start_idx_per_video = [0, *itertools.accumulate(num_frames)]
     num_patches = [
-        num_grids_per_frame[start_idx_per_video[i]:start_idx_per_video[i + 1]].
-        sum() for i in range(len(num_frames))
+        num_grids_per_frame[start_idx_per_video[i] : start_idx_per_video[i + 1]].sum()
+        for i in range(len(num_frames))
     ]
-    return torch.stack(num_patches) if num_patches else torch.zeros(
-        0, dtype=grid_thw.dtype, device=grid_thw.device)
+    return (
+        torch.stack(num_patches)
+        if num_patches
+        else torch.zeros(0, dtype=grid_thw.dtype, device=grid_thw.device)
+    )
 
 
 class KeyeVL1_5ImagePixelInputs(TensorSchema):
@@ -106,11 +128,12 @@ class KeyeVL1_5ImagePixelInputs(TensorSchema):
         - ni: Number of images
         - g: Grid dimensions (3 for t, h, w)
     """
+
     type: Literal["pixel_values"]
 
     pixel_values: Annotated[
-        torch.Tensor,
-        TensorShape("bnp", 3, "ps", "ps", dynamic_dims={"bnp"})]
+        torch.Tensor, TensorShape("bnp", 3, "ps", "ps", dynamic_dims={"bnp"})
+    ]
 
     image_grid_thw: Annotated[torch.Tensor, TensorShape("ni", 3)]
 
@@ -124,13 +147,13 @@ class KeyeVL1_5ImageEmbeddingInputs(TensorSchema):
         - ni: Number of images
         - g: Grid dimensions (3 for t, h, w)
     """
+
     type: Literal["image_embeds"]
     image_embeds: Annotated[torch.Tensor, TensorShape("nf", "hs")]
     image_grid_thw: Annotated[torch.Tensor, TensorShape("ni", 3)]
 
 
-KeyeVL1_5ImageInputs = Union[KeyeVL1_5ImagePixelInputs,
-                             KeyeVL1_5ImageEmbeddingInputs]
+KeyeVL1_5ImageInputs = Union[KeyeVL1_5ImagePixelInputs, KeyeVL1_5ImageEmbeddingInputs]
 
 
 class KeyeVL1_5VideoPixelInputs(TensorSchema):
@@ -142,10 +165,11 @@ class KeyeVL1_5VideoPixelInputs(TensorSchema):
         - ni: Number of images
         - g: Grid dimensions (3 for t, h, w)
     """
+
     type: Literal["pixel_values_videos"]
     pixel_values_videos: Annotated[
-        torch.Tensor,
-        TensorShape("bnp", 3, "ps", "ps", dynamic_dims={"bnp"})]
+        torch.Tensor, TensorShape("bnp", 3, "ps", "ps", dynamic_dims={"bnp"})
+    ]
     video_grid_thw: Annotated[torch.Tensor, TensorShape("nv", 3)]
 
     num_frames: torch.Tensor
@@ -160,18 +184,17 @@ class KeyeVL1_5VideoEmbeddingInputs(TensorSchema):
         - nv: Number of videos
         - g: Grid dimensions (3 for t, h, w)
     """
+
     type: Literal["video_embeds"]
     video_embeds: Annotated[torch.Tensor, TensorShape("nf", "hs")]
     video_grid_thw: Annotated[torch.Tensor, TensorShape("nv", 3)]
     num_frames: torch.Tensor
 
 
-KeyeVL1_5VideoInputs = Union[KeyeVL1_5VideoPixelInputs,
-                             KeyeVL1_5VideoEmbeddingInputs]
+KeyeVL1_5VideoInputs = Union[KeyeVL1_5VideoPixelInputs, KeyeVL1_5VideoEmbeddingInputs]
 
 
 class KeyeVL1_5Projector(nn.Module):
-
     def __init__(
         self,
         text_config: PretrainedConfig,
@@ -184,9 +207,11 @@ def __init__(
         self.vision_config = vision_config
         self.merge_kernel_size = (2, 2)
 
-        self.hidden_size = (self.vision_config.hidden_size *
-                            self.merge_kernel_size[0] *
-                            self.merge_kernel_size[1])
+        self.hidden_size = (
+            self.vision_config.hidden_size
+            * self.merge_kernel_size[0]
+            * self.merge_kernel_size[1]
+        )
 
         self.pre_norm = torch.nn.LayerNorm(self.hidden_size, eps=1e-05)
         self.act = GELUActivation()
@@ -208,15 +233,13 @@ def __init__(
 
     def forward(
         self,
-        image_features: Union[torch.Tensor, tuple[torch.Tensor],
-                              list[torch.Tensor]],
+        image_features: Union[torch.Tensor, tuple[torch.Tensor], list[torch.Tensor]],
         image_grid_thw: list[tuple[int, int, int]],
     ) -> Union[torch.Tensor, list[torch.Tensor]]:
         m1, m2 = self.merge_kernel_size
         if isinstance(image_features, (list, tuple)):
             processed_features = list()
-            for image_feature, image_grid in zip(image_features,
-                                                 image_grid_thw):
+            for image_feature, image_grid in zip(image_features, image_grid_thw):
                 t, h, w = image_grid
                 image_feature = rearrange(
                     image_feature,
@@ -238,8 +261,7 @@ def forward(
         dims = image_features.shape[:-1]
         dim = image_features.shape[-1]
         image_features = image_features.view(np.prod(dims), dim)
-        hidden_states = self.pre_norm(image_features.view(
-            -1, self.hidden_size))
+        hidden_states = self.pre_norm(image_features.view(-1, self.hidden_size))
         hidden_states = self.linear_1(hidden_states)
         hidden_states = self.act(hidden_states)
         hidden_states = self.linear_2(hidden_states)
@@ -248,24 +270,28 @@ def forward(
 
 
 class KeyeVL1_5ProcessingInfo(KeyeProcessingInfo):
-
     def get_max_frame_per_video(self) -> int:
         return 2048
 
-    def get_supported_mm_limits(self, ) -> Mapping[str, Optional[int]]:
+    def get_supported_mm_limits(
+        self,
+    ) -> Mapping[str, Optional[int]]:
         return {"image": None, "video": 1}
 
 
-def _keye_field_config(hf_inputs: Mapping[str, torch.Tensor], ):
-    image_grid_thw = hf_inputs.get("image_grid_thw",
-                                   torch.empty((0, 3), dtype=torch.int64))
+def _keye_field_config(
+    hf_inputs: Mapping[str, torch.Tensor],
+):
+    image_grid_thw = hf_inputs.get(
+        "image_grid_thw", torch.empty((0, 3), dtype=torch.int64)
+    )
     image_grid_sizes = image_grid_thw.prod(-1)
 
-    video_grid_thw = hf_inputs.get("video_grid_thw",
-                                   torch.empty((0, 3), dtype=torch.int64))
+    video_grid_thw = hf_inputs.get(
+        "video_grid_thw", torch.empty((0, 3), dtype=torch.int64)
+    )
     video_grid_thw = split_thw(video_grid_thw)
-    num_frames = hf_inputs.get("num_frames",
-                               video_grid_thw[:, 0]).clone().tolist()
+    num_frames = hf_inputs.get("num_frames", video_grid_thw[:, 0]).clone().tolist()
 
     video_num_patches = get_num_patches(video_grid_thw, num_frames)
 
@@ -285,22 +311,20 @@ def _keye_field_config(hf_inputs: Mapping[str, torch.Tensor], ):
             else:
                 j += 1
     video_num_grids = torch.tensor(video_num_grids)
-    return dict(pixel_values=MultiModalFieldConfig.flat_from_sizes(
-        "image", image_grid_sizes),
-                image_embeds=MultiModalFieldConfig.flat_from_sizes(
-                    "image", image_grid_sizes),
-                image_grid_thw=MultiModalFieldConfig.batched("image"),
-                pixel_values_videos=MultiModalFieldConfig.flat_from_sizes(
-                    "video", video_num_patches),
-                video_embeds=MultiModalFieldConfig.flat_from_sizes(
-                    "video", video_num_patches),
-                video_grid_thw=MultiModalFieldConfig.flat_from_sizes(
-                    "video", video_num_grids),
-                num_frames=MultiModalFieldConfig.batched("video"))
+    return dict(
+        pixel_values=MultiModalFieldConfig.flat_from_sizes("image", image_grid_sizes),
+        image_embeds=MultiModalFieldConfig.flat_from_sizes("image", image_grid_sizes),
+        image_grid_thw=MultiModalFieldConfig.batched("image"),
+        pixel_values_videos=MultiModalFieldConfig.flat_from_sizes(
+            "video", video_num_patches
+        ),
+        video_embeds=MultiModalFieldConfig.flat_from_sizes("video", video_num_patches),
+        video_grid_thw=MultiModalFieldConfig.flat_from_sizes("video", video_num_grids),
+        num_frames=MultiModalFieldConfig.batched("video"),
+    )
 
 
 class KeyeVL1_5MultiModalDataParser(MultiModalDataParser):
-
     def _parse_image_data(
         self,
         data: Union[dict[str, torch.Tensor], ModalityData[ImageItem]],
@@ -336,9 +360,7 @@ def _parse_video_data(
         return super()._parse_video_data(data)
 
 
-class KeyeVL1_5MultiModalProcessor(
-        BaseMultiModalProcessor[KeyeVL1_5ProcessingInfo]):
-
+class KeyeVL1_5MultiModalProcessor(BaseMultiModalProcessor[KeyeVL1_5ProcessingInfo]):
     def _get_data_parser(self) -> MultiModalDataParser:
         return KeyeVL1_5MultiModalDataParser()
 
@@ -349,8 +371,7 @@ def _get_prompt_updates(
         out_mm_kwargs: MultiModalKwargsItems,
     ) -> Sequence[PromptUpdate]:
         hf_processor = self.info.get_hf_processor(**hf_processor_mm_kwargs)
-        image_processor = self.info.get_image_processor(
-            **hf_processor_mm_kwargs)
+        image_processor = self.info.get_image_processor(**hf_processor_mm_kwargs)
         tokenizer = self.info.get_tokenizer()
         vocab = tokenizer.get_vocab()
         image_token_id = vocab[hf_processor.image_token]
@@ -359,44 +380,49 @@ def _get_prompt_updates(
         merge_length = image_processor.merge_size**2
 
         out_mm_kwargs_data = out_mm_kwargs.get_data()
-        frame_types: list[torch.Tensor] = \
-            hf_processor_mm_kwargs.get("frame_types", None)
-        timestamps: list[torch.Tensor] = \
-            hf_processor_mm_kwargs.get("timestamps", None)
+        frame_types: list[torch.Tensor] = hf_processor_mm_kwargs.get(
+            "frame_types", None
+        )
+        timestamps: list[torch.Tensor] = hf_processor_mm_kwargs.get("timestamps", None)
         num_videos = mm_items.get_count("video", strict=False)
 
         if frame_types is None:
             frame_types = [None] * num_videos
-        assert len(frame_types) == num_videos, \
-            f"Number of frame_types={len(frame_types)} " \
+        assert len(frame_types) == num_videos, (
+            f"Number of frame_types={len(frame_types)} "
             f"doesn't equal to number of videos={num_videos}"
+        )
         if timestamps is None:
             timestamps = [None] * num_videos
-        assert len(timestamps) == num_videos, \
-            f"Number of timestamps={len(timestamps)} " \
+        assert len(timestamps) == num_videos, (
+            f"Number of timestamps={len(timestamps)} "
             f"doesn't equal to number of videos={num_videos}"
+        )
 
         video_grid_thw = out_mm_kwargs_data.get(
-            'video_grid_thw', torch.empty((0, 3), dtype=torch.int64))
+            "video_grid_thw", torch.empty((0, 3), dtype=torch.int64)
+        )
         num_frames = out_mm_kwargs_data.get(
-            'num_frames', torch.tensor([], dtype=torch.int64))
+            "num_frames", torch.tensor([], dtype=torch.int64)
+        )
 
-        assert len(num_frames) == num_videos, \
-            f"Size of num_frames={len(num_frames)} " \
+        assert len(num_frames) == num_videos, (
+            f"Size of num_frames={len(num_frames)} "
             f"doesn't equal to number of videos={num_videos}"
+        )
 
         video_grid_hws = split_thw(video_grid_thw)
         assert int(num_frames.sum().tolist()) == video_grid_hws.shape[0], (
             f"The first dimension of `video_grid_hws`={video_grid_hws.shape[0]}"
-            f"doesn't equal to num of frames.")
+            f"doesn't equal to num of frames."
+        )
 
-        cu_seqlens = torch.cumsum(torch.tensor([0] + num_frames.tolist()),
-                                  dim=-1)
+        cu_seqlens = torch.cumsum(torch.tensor([0] + num_frames.tolist()), dim=-1)
 
         def get_replacement_keye(item_idx: int, modality: str):
             """
             Args:
-                item_idx(int): The item index of modality to replace 
+                item_idx(int): The item index of modality to replace
                 modality(str): The modality
             """
             if modality == "image":
@@ -411,16 +437,15 @@ def get_replacement_keye(item_idx: int, modality: str):
                 video_timestamps = timestamps[item_idx]
                 video_frame_types = frame_types[item_idx]
                 grid_thw = video_grid_hws[
-                    cu_seqlens[item_idx]:cu_seqlens[item_idx + 1]]
+                    cu_seqlens[item_idx] : cu_seqlens[item_idx + 1]
+                ]
 
                 nframes = grid_thw.shape[0]
 
                 if video_timestamps is None:
                     video_timestamps = [""] * nframes
                 else:
-                    video_timestamps = [
-                        format(ts, ".1f") for ts in video_timestamps
-                    ]
+                    video_timestamps = [format(ts, ".1f") for ts in video_timestamps]
 
                 if video_frame_types is None:
                     video_frame_types = [0] * nframes
@@ -435,7 +460,8 @@ def get_replacement_keye(item_idx: int, modality: str):
                         placeholders.append(vocab[hf_processor.fast_end])
 
                 return PromptUpdateDetails.select_token_id(
-                    placeholders, embed_token_id=video_token_id)
+                    placeholders, embed_token_id=video_token_id
+                )
             else:
                 raise ValueError(f"Unsupported modality {modality}")
 
@@ -444,7 +470,8 @@ def get_replacement_keye(item_idx: int, modality: str):
                 modality=modality,
                 target=[placeholder[modality]],
                 replacement=partial(get_replacement_keye, modality=modality),
-            ) for modality in ("image", "video")
+            )
+            for modality in ("image", "video")
         ]
 
     def _get_mm_fields_config(
@@ -456,8 +483,8 @@ def _get_mm_fields_config(
 
 
 class KeyeVL1_5DummyInputsBuilder(
-        KeyeBaseDummyInputsBuilder[KeyeVL1_5ProcessingInfo]):
-    ...
+    KeyeBaseDummyInputsBuilder[KeyeVL1_5ProcessingInfo]
+): ...
 
 
 @MULTIMODAL_REGISTRY.register_processor(
@@ -465,16 +492,17 @@ class KeyeVL1_5DummyInputsBuilder(
     info=KeyeVL1_5ProcessingInfo,
     dummy_inputs=KeyeVL1_5DummyInputsBuilder,
 )
-class KeyeVL1_5ForConditionalGeneration(BaseKeyeModule, SupportsMultiModal,
-                                        SupportsLoRA, SupportsPP):
-
-    def _build_projector(self,
-                         text_config: PretrainedConfig,
-                         vision_config: PretrainedConfig,
-                         quant_config: Optional[QuantizationConfig] = None,
-                         prefix: str = "") -> nn.Module:
-        return KeyeVL1_5Projector(text_config, vision_config, quant_config,
-                                  prefix)
+class KeyeVL1_5ForConditionalGeneration(
+    BaseKeyeModule, SupportsMultiModal, SupportsLoRA, SupportsPP
+):
+    def _build_projector(
+        self,
+        text_config: PretrainedConfig,
+        vision_config: PretrainedConfig,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> nn.Module:
+        return KeyeVL1_5Projector(text_config, vision_config, quant_config, prefix)
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config: PretrainedConfig = vllm_config.model_config.hf_config
@@ -482,7 +510,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(vllm_config=vllm_config, prefix=prefix)
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[KeyeVL1_5ImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[KeyeVL1_5ImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_embeds = kwargs.pop("image_embeds", None)
         image_grid_thw = kwargs.pop("image_grid_thw", None)
@@ -505,7 +534,8 @@ def _parse_and_validate_image_input(
             )
 
     def _parse_and_validate_video_input(
-            self, **kwargs: object) -> Optional[KeyeVL1_5VideoInputs]:
+        self, **kwargs: object
+    ) -> Optional[KeyeVL1_5VideoInputs]:
         pixel_values_videos = kwargs.pop("pixel_values_videos", None)
         video_embeds = kwargs.pop("video_embeds", None)
         video_grid_thw = kwargs.pop("video_grid_thw", None)
@@ -519,23 +549,27 @@ def _parse_and_validate_video_input(
                 type="pixel_values_videos",
                 pixel_values_videos=pixel_values_videos,
                 video_grid_thw=video_grid_thw,
-                num_frames=num_frames)
+                num_frames=num_frames,
+            )
 
         if video_embeds is not None:
-            return KeyeVL1_5VideoEmbeddingInputs(type="video_embeds",
-                                                 video_embeds=video_embeds,
-                                                 video_grid_thw=video_grid_thw,
-                                                 num_frames=num_frames)
+            return KeyeVL1_5VideoEmbeddingInputs(
+                type="video_embeds",
+                video_embeds=video_embeds,
+                video_grid_thw=video_grid_thw,
+                num_frames=num_frames,
+            )
 
     def _process_video_input(
-            self,
-            video_input: KeyeVL1_5VideoInputs) -> tuple[torch.Tensor, ...]:
+        self, video_input: KeyeVL1_5VideoInputs
+    ) -> tuple[torch.Tensor, ...]:
         video_type = video_input["type"]
         video_grid_thw = split_thw(video_input["video_grid_thw"])
         pixel_values_videos = video_input.get("pixel_values_videos", None)
 
-        video_embeds = self._process_video_embeds(video_type, video_grid_thw,
-                                                  pixel_values_videos)
+        video_embeds = self._process_video_embeds(
+            video_type, video_grid_thw, pixel_values_videos
+        )
         video_embeds = torch.concat(video_embeds, dim=0)
 
         num_frames = video_input["num_frames"].clone().tolist()
@@ -543,10 +577,11 @@ def _process_video_input(
         num_patches = get_num_patches(video_grid_thw, num_frames).tolist()
 
         patch_cu_seqlens = torch.cumsum(
-            torch.tensor([0] + num_patches).detach().clone(), dim=-1)
-        patch_cu_seqlens = torch.div(patch_cu_seqlens,
-                                     self.merge_size**2,
-                                     rounding_mode="floor")
+            torch.tensor([0] + num_patches).detach().clone(), dim=-1
+        )
+        patch_cu_seqlens = torch.div(
+            patch_cu_seqlens, self.merge_size**2, rounding_mode="floor"
+        )
 
         new_video_embeds = []
         for idx in range(patch_cu_seqlens.shape[0] - 1):
diff --git a/vllm/model_executor/models/kimi_vl.py b/vllm/model_executor/models/kimi_vl.py
index 60404376f276..f7381e6b6b93 100644
--- a/vllm/model_executor/models/kimi_vl.py
+++ b/vllm/model_executor/models/kimi_vl.py
@@ -60,21 +60,34 @@
 from vllm.model_executor.layers.linear import ReplicatedLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.model_executor.models.deepseek_v2 import DeepseekV2Model
-from vllm.model_executor.models.interfaces import (SupportsMultiModal,
-                                                   SupportsPP)
+from vllm.model_executor.models.interfaces import SupportsMultiModal, SupportsPP
 from vllm.model_executor.models.moonvit import MoonVitPretrainedModel
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems, NestedTensors)
-from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
-                                   MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+    NestedTensors,
+)
+from vllm.multimodal.parse import (
+    ImageEmbeddingItems,
+    ImageProcessorItems,
+    MultiModalDataItems,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs import KimiVLConfig, MoonViTConfig
@@ -93,33 +106,35 @@ class MaxImageTokenMeta:
 
 
 class KimiVLMultiModalProjector(nn.Module):
-
-    def __init__(self, config: KimiVLConfig, \
-                 use_data_parallel: bool = False, prefix: str = ""):
+    def __init__(
+        self, config: KimiVLConfig, use_data_parallel: bool = False, prefix: str = ""
+    ):
         super().__init__()
         self.use_data_parallel = use_data_parallel
 
-        self.hidden_size = (config.vision_config.hidden_size *
-                            config.vision_config.merge_kernel_size[0] *
-                            config.vision_config.merge_kernel_size[1])
-
-        self.pre_norm = torch.nn.LayerNorm(config.vision_config.hidden_size,
-                                           eps=1e-5)
-        self.linear_1 = ReplicatedLinear(self.hidden_size,
-                                         self.hidden_size,
-                                         bias=True,
-                                         prefix=maybe_prefix(
-                                             prefix, "linear_1"))
-        self.linear_2 = ReplicatedLinear(self.hidden_size,
-                                         config.text_config.hidden_size,
-                                         bias=True,
-                                         prefix=maybe_prefix(
-                                             prefix, "linear_2"))
+        self.hidden_size = (
+            config.vision_config.hidden_size
+            * config.vision_config.merge_kernel_size[0]
+            * config.vision_config.merge_kernel_size[1]
+        )
+
+        self.pre_norm = torch.nn.LayerNorm(config.vision_config.hidden_size, eps=1e-5)
+        self.linear_1 = ReplicatedLinear(
+            self.hidden_size,
+            self.hidden_size,
+            bias=True,
+            prefix=maybe_prefix(prefix, "linear_1"),
+        )
+        self.linear_2 = ReplicatedLinear(
+            self.hidden_size,
+            config.text_config.hidden_size,
+            bias=True,
+            prefix=maybe_prefix(prefix, "linear_2"),
+        )
         self.act = GELUActivation()
 
     def forward(self, image_features: torch.Tensor) -> torch.Tensor:
-        hidden_states = self.pre_norm(image_features).view(
-            -1, self.hidden_size)
+        hidden_states = self.pre_norm(image_features).view(-1, self.hidden_size)
         hidden_states, _ = self.linear_1(hidden_states)
         hidden_states = self.act(hidden_states)
         hidden_states, _ = self.linear_2(hidden_states)
@@ -134,6 +149,7 @@ class KimiVLImagePixelInputs(TensorSchema):
         - ps: Patch size
         - ni: Number of images
     """
+
     type: Literal["pixel_values"] = "pixel_values"
 
     pixel_values: Annotated[
@@ -150,7 +166,6 @@ class KimiVLImagePixelInputs(TensorSchema):
 
 
 class KimiVLProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(KimiVLConfig)
 
@@ -169,25 +184,25 @@ def get_num_image_tokens(
         in_token_limit = hf_processor.image_processor.in_token_limit
         height = image_height
         width = image_width
-        assert isinstance(height,
-                          int), f"height must be int, current height {height}"
-        assert isinstance(width,
-                          int), f"width must be int, current width {width}"
+        assert isinstance(height, int), f"height must be int, current height {height}"
+        assert isinstance(width, int), f"width must be int, current width {width}"
         assert kernel_size is not None, "kernel_size must be specified"
 
         if (width // patch_size) * (height // patch_size) > in_token_limit:
-            scale = math.sqrt(in_token_limit / ((width // patch_size) *
-                                                (height // patch_size)))
+            scale = math.sqrt(
+                in_token_limit / ((width // patch_size) * (height // patch_size))
+            )
             new_w, new_h = int(width * scale), int(height * scale)
             width, height = new_w, new_h
 
         kernel_height, kernel_width = kernel_size
 
-        pad_height = (kernel_height * patch_size - height %
-                      (kernel_height * patch_size)) % (kernel_height *
-                                                       patch_size)
-        pad_width = (kernel_width * patch_size - width %
-                     (kernel_width * patch_size)) % (kernel_width * patch_size)
+        pad_height = (
+            kernel_height * patch_size - height % (kernel_height * patch_size)
+        ) % (kernel_height * patch_size)
+        pad_width = (
+            kernel_width * patch_size - width % (kernel_width * patch_size)
+        ) % (kernel_width * patch_size)
 
         # Calculate new dimensions after padding and patching
         token_height = (height + pad_height) // (kernel_size[0] * patch_size)
@@ -200,7 +215,6 @@ def image_token_id(self) -> int:
 
 
 class KimiVLDummyInputsBuilder(BaseDummyInputsBuilder[KimiVLProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -220,16 +234,16 @@ def get_dummy_mm_data(
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=MaxImageTokenMeta.width,
-                                   height=MaxImageTokenMeta.height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=MaxImageTokenMeta.width,
+                height=MaxImageTokenMeta.height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class KimiVLMultiModalProcessor(BaseMultiModalProcessor[KimiVLProcessingInfo]):
-
     def _get_mm_fields_config(
         self,
         hf_inputs: BatchFeature,
@@ -242,7 +256,8 @@ def _get_mm_fields_config(
         # image_grid_hws is shapes for each subtensor in pixel_values
         return dict(
             pixel_values=MultiModalFieldConfig.flat_from_sizes(
-                "image", image_grid_sizes),
+                "image", image_grid_sizes
+            ),
             image_grid_hws=MultiModalFieldConfig.batched("image"),
         )
 
@@ -256,7 +271,8 @@ def _get_prompt_updates(
 
         def get_replacement(item_idx: int):
             images = mm_items.get_items(
-                "image", (ImageEmbeddingItems, ImageProcessorItems))
+                "image", (ImageEmbeddingItems, ImageProcessorItems)
+            )
 
             if isinstance(images, ImageEmbeddingItems):
                 num_image_tokens = images.get_feature_size(item_idx)
@@ -278,11 +294,12 @@ def get_replacement(item_idx: int):
         ]
 
 
-@MULTIMODAL_REGISTRY.register_processor(KimiVLMultiModalProcessor,
-                                        info=KimiVLProcessingInfo,
-                                        dummy_inputs=KimiVLDummyInputsBuilder)
-class KimiVLForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                     SupportsPP):
+@MULTIMODAL_REGISTRY.register_processor(
+    KimiVLMultiModalProcessor,
+    info=KimiVLProcessingInfo,
+    dummy_inputs=KimiVLDummyInputsBuilder,
+)
+class KimiVLForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP):
     merge_by_field_config = True
 
     supports_encoder_tp_data = True
@@ -306,21 +323,27 @@ def __init__(
         quant_config = vllm_config.quant_config
 
         assert isinstance(config.vision_config, MoonViTConfig)
-        self.use_data_parallel = model_config.multimodal_config.mm_encoder_tp_mode == "data"
+        self.use_data_parallel = (
+            model_config.multimodal_config.mm_encoder_tp_mode == "data"
+        )
         self.hidden_size = config.text_config.hidden_size
-        self.vision_tower = MoonVitPretrainedModel(config.vision_config,
-                                                   self.use_data_parallel,
-                                                   prefix=maybe_prefix(
-                                                       prefix, "vision_tower"))
+        self.vision_tower = MoonVitPretrainedModel(
+            config.vision_config,
+            self.use_data_parallel,
+            prefix=maybe_prefix(prefix, "vision_tower"),
+        )
 
         self.multi_modal_projector = KimiVLMultiModalProjector(
             config=config,
             use_data_parallel=self.use_data_parallel,
-            prefix=maybe_prefix(prefix, "multi_modal_projector"))
+            prefix=maybe_prefix(prefix, "multi_modal_projector"),
+        )
 
         self.quant_config = quant_config
         sub_vllm_config = copy.deepcopy(vllm_config)
-        sub_vllm_config.model_config.hf_config = sub_vllm_config.model_config.hf_config.text_config
+        sub_vllm_config.model_config.hf_config = (
+            sub_vllm_config.model_config.hf_config.text_config
+        )
         self.language_model = DeepseekV2Model(
             vllm_config=sub_vllm_config,
             prefix=maybe_prefix(prefix, "language_model"),
@@ -337,14 +360,17 @@ def __init__(
         else:
             self.lm_head = PPMissingLayer()
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
         logit_scale = getattr(config, "logit_scale", 1.0)
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size, logit_scale)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size, logit_scale
+        )
         self.media_placeholder: int = self.config.media_placeholder_token_id
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[KimiVLImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[KimiVLImageInputs]:
         # image input type must be pixel values now
         pixel_values = kwargs.pop("pixel_values", None)
         image_grid_hws = kwargs.pop("image_grid_hws", None)
@@ -360,34 +386,32 @@ def _parse_and_validate_image_input(
 
     # perform vt on processored pixel_values
     @torch.inference_mode()
-    def _process_image_pixels(self,
-                              inputs: KimiVLImagePixelInputs) -> torch.Tensor:
+    def _process_image_pixels(self, inputs: KimiVLImagePixelInputs) -> torch.Tensor:
         assert self.vision_tower is not None
 
         pixel_values = inputs["pixel_values"]
         image_grid_hws = inputs["image_grid_hws"]
         if self.use_data_parallel:
-            return run_dp_sharded_mrope_vision_model(self.vision_tower,
-                                                     pixel_values,
-                                                     image_grid_hws.tolist(),
-                                                     rope_type="rope_2d")
+            return run_dp_sharded_mrope_vision_model(
+                self.vision_tower,
+                pixel_values,
+                image_grid_hws.tolist(),
+                rope_type="rope_2d",
+            )
         else:
             return self.vision_tower(pixel_values, image_grid_hws)
 
-    def _process_image_input(self,
-                             image_input: KimiVLImageInputs) -> torch.Tensor:
+    def _process_image_input(self, image_input: KimiVLImageInputs) -> torch.Tensor:
         assert image_input["type"] == "pixel_values"
         image_features = self._process_image_pixels(image_input)
         assert isinstance(image_features, (list, tuple))
         lengths = [x.shape[0] for x in image_features]
-        return self.multi_modal_projector(
-            torch.cat(image_features)).split(lengths)
+        return self.multi_modal_projector(torch.cat(image_features)).split(lengths)
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> Optional[NestedTensors]:
+    def get_multimodal_embeddings(self, **kwargs: object) -> Optional[NestedTensors]:
         # Validate the multimodal input keyword arguments
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
@@ -417,8 +441,7 @@ def forward(
 
         return hidden_states
 
-    def compute_logits(self, hidden_states: torch.Tensor,
-                       **kwargs) -> torch.Tensor:
+    def compute_logits(self, hidden_states: torch.Tensor, **kwargs) -> torch.Tensor:
         logits = self.logits_processor(self.lm_head, hidden_states, **kwargs)
         return logits
 
@@ -447,7 +470,8 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
                 ckpt_gate_proj_name="gate_proj",
                 ckpt_down_proj_name="down_proj",
                 ckpt_up_proj_name="up_proj",
-                num_experts=config.n_routed_experts)
+                num_experts=config.n_routed_experts,
+            )
         else:
             expert_params_mapping = []
 
@@ -463,8 +487,7 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
             if spec_layer is not None:
                 continue  # skip spec decode layers for main model
 
-            if ("rotary_emb.cos_cached" in name
-                    or "rotary_emb.sin_cached" in name):
+            if "rotary_emb.cos_cached" in name or "rotary_emb.sin_cached" in name:
                 # Models trained using ColossalAI may include these tensors in
                 # the checkpoint. Skip them.
                 continue
@@ -478,8 +501,7 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
                     # not vision model for now.
                     use_default_weight_loading = True
             else:
-                for (param_name, weight_name,
-                     shard_id) in stacked_params_mapping:
+                for param_name, weight_name, shard_id in stacked_params_mapping:
                     if weight_name not in name:
                         continue
                     # We have mlp.experts[0].gate_proj in the checkpoint.
@@ -488,7 +510,7 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
                     # name will be updated to mlp.experts[0].gate_up_proj, which
                     # will then be updated below in expert_params_mapping
                     # for mlp.experts[0].gate_gate_up_proj, which breaks load.
-                    if (("mlp.experts." in name) and name not in params_dict):
+                    if ("mlp.experts." in name) and name not in params_dict:
                         continue
                     name = name.replace(weight_name, param_name)
                     # Skip loading extra bias for GPTQ models.
@@ -503,8 +525,12 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
                     weight_loader(param, loaded_weight, shard_id, **kwargs)
                     break
                 else:
-                    for idx, (param_name, weight_name, expert_id,
-                              shard_id) in enumerate(expert_params_mapping):
+                    for idx, (
+                        param_name,
+                        weight_name,
+                        expert_id,
+                        shard_id,
+                    ) in enumerate(expert_params_mapping):
                         if weight_name not in name:
                             continue
                         name = name.replace(weight_name, param_name)
@@ -514,12 +540,14 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
 
                         param = params_dict[name]
                         weight_loader = param.weight_loader
-                        weight_loader(param,
-                                      loaded_weight,
-                                      name,
-                                      expert_id=expert_id,
-                                      shard_id=shard_id,
-                                      **kwargs)
+                        weight_loader(
+                            param,
+                            loaded_weight,
+                            name,
+                            expert_id=expert_id,
+                            shard_id=shard_id,
+                            **kwargs,
+                        )
                         break
                     else:
                         use_default_weight_loading = True
@@ -536,18 +564,18 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight, **kwargs)
 
 
-def get_spec_layer_idx_from_weight_name(config: DeepseekV2Config,
-                                        weight_name: str) -> Optional[int]:
-    if hasattr(config,
-               "num_nextn_predict_layers") and (config.num_nextn_predict_layers
-                                                > 0):
+def get_spec_layer_idx_from_weight_name(
+    config: DeepseekV2Config, weight_name: str
+) -> Optional[int]:
+    if hasattr(config, "num_nextn_predict_layers") and (
+        config.num_nextn_predict_layers > 0
+    ):
         layer_idx = config.num_hidden_layers
         for i in range(config.num_nextn_predict_layers):
-            if weight_name.startswith(f"model.layers.{layer_idx+i}."):
+            if weight_name.startswith(f"model.layers.{layer_idx + i}."):
                 return layer_idx + i
     return None
diff --git a/vllm/model_executor/models/lfm2.py b/vllm/model_executor/models/lfm2.py
index f9def222a1ec..ae5c97426ee7 100644
--- a/vllm/model_executor/models/lfm2.py
+++ b/vllm/model_executor/models/lfm2.py
@@ -14,30 +14,40 @@
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.mamba.short_conv import ShortConv
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
-from .interfaces import (HasInnerState, IsHybrid, SupportsLoRA, SupportsPP,
-                         SupportsQuant)
-from .utils import (AutoWeightsLoader, PPMissingLayer, extract_layer_index,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .interfaces import HasInnerState, IsHybrid, SupportsLoRA, SupportsPP, SupportsQuant
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class Lfm2MLP(nn.Module):
-
     def __init__(
         self,
         dim: int,
@@ -80,7 +90,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class Lfm2Attention(nn.Module):
-
     def __init__(
         self,
         config: Lfm2Config,
@@ -177,7 +186,6 @@ def forward(
 
 
 class Lfm2AttentionDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Lfm2Config,
@@ -195,11 +203,12 @@ def __init__(
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
         if rope_scaling is not None and getattr(
-                config, "original_max_position_embeddings", None):
+            config, "original_max_position_embeddings", None
+        ):
             rope_scaling["original_max_position_embeddings"] = (
-                config.original_max_position_embeddings)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+                config.original_max_position_embeddings
+            )
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
 
         self.self_attn = Lfm2Attention(
             config=config,
@@ -238,16 +247,13 @@ def forward(
             residual = hidden_states
             hidden_states = self.operator_norm(hidden_states)
         else:
-            hidden_states, residual = self.operator_norm(
-                hidden_states, residual)
-        hidden_states = self.self_attn(positions=positions,
-                                       hidden_states=hidden_states)
+            hidden_states, residual = self.operator_norm(hidden_states, residual)
+        hidden_states = self.self_attn(positions=positions, hidden_states=hidden_states)
         hidden_states, residual = self.ffn_norm(hidden_states, residual)
         return self.feed_forward(hidden_states), residual
 
 
 class Lfm2ShortConvDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Lfm2Config,
@@ -290,8 +296,7 @@ def forward(
             residual = hidden_states
             hidden_states = self.operator_norm(hidden_states)
         else:
-            hidden_states, residual = self.operator_norm(
-                hidden_states, residual)
+            hidden_states, residual = self.operator_norm(hidden_states, residual)
         output = torch.empty_like(hidden_states)
         self.conv(
             hidden_states,
@@ -304,7 +309,6 @@ def forward(
 
 @support_torch_compile
 class Lfm2Model(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -315,21 +319,24 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         lora_config = vllm_config.lora_config
 
         self.config = config
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
 
         self.embed_tokens = VocabParallelEmbedding(
-            self.vocab_size,
-            config.hidden_size,
-            org_num_embeddings=config.vocab_size)
+            self.vocab_size, config.hidden_size, org_num_embeddings=config.vocab_size
+        )
 
         def get_layer(prefix: str):
             layer_idx = extract_layer_index(prefix)
             is_attn = self.config.layer_types[layer_idx] == "full_attention"
-            layer_class = (Lfm2AttentionDecoderLayer
-                           if is_attn else Lfm2ShortConvDecoderLayer)
+            layer_class = (
+                Lfm2AttentionDecoderLayer if is_attn else Lfm2ShortConvDecoderLayer
+            )
             return layer_class(
                 config,
                 layer_idx,
@@ -340,14 +347,14 @@ def get_layer(prefix: str):
             )
 
         self.start_layer, self.end_layer, self.layers = make_layers(
-            config.num_hidden_layers, get_layer, prefix=f"{prefix}.layers")
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+            config.num_hidden_layers, get_layer, prefix=f"{prefix}.layers"
+        )
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
         if get_pp_group().is_last_rank:
-            self.embedding_norm = RMSNorm(config.hidden_size,
-                                          eps=config.norm_eps)
+            self.embedding_norm = RMSNorm(config.hidden_size, eps=config.norm_eps)
         else:
             self.embedding_norm = PPMissingLayer()
 
@@ -379,15 +386,13 @@ def forward(
                 residual=residual,
             )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.embedding_norm(hidden_states, residual)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             (".qkv_proj", ".q_proj", "q"),
             (".qkv_proj", ".k_proj", "k"),
@@ -398,7 +403,6 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-
             for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
@@ -414,15 +418,15 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
-class Lfm2ForCausalLM(nn.Module, HasInnerState, SupportsLoRA, SupportsPP,
-                      IsHybrid, SupportsQuant):
+class Lfm2ForCausalLM(
+    nn.Module, HasInnerState, SupportsLoRA, SupportsPP, IsHybrid, SupportsQuant
+):
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -447,7 +451,6 @@ def get_mamba_state_dtype_from_config(
         cls,
         vllm_config: "VllmConfig",
     ) -> tuple[torch.dtype, ...]:
-
         return MambaStateDtypeCalculator.short_conv_state_dtype(
             vllm_config.model_config.dtype,
             vllm_config.cache_config.mamba_cache_dtype,
@@ -458,7 +461,7 @@ def get_mamba_state_shape_from_config(
         cls,
         vllm_config: "VllmConfig",
     ) -> tuple[tuple[int, int]]:
-        """ Calculate shapes for LFM2's convolutional cache.
+        """Calculate shapes for LFM2's convolutional cache.
 
         Args:
             vllm_config: vLLM config
@@ -482,8 +485,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         cache_config = vllm_config.cache_config
         lora_config = vllm_config.lora_config
         scheduler_config = vllm_config.scheduler_config
-        assert (not cache_config.enable_prefix_caching
-                ), "Lfm2 currently does not support prefix caching"
+        assert not cache_config.enable_prefix_caching, (
+            "Lfm2 currently does not support prefix caching"
+        )
 
         super().__init__()
         self.config = config
@@ -491,8 +495,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         self.scheduler_config = scheduler_config
         self.model_config = vllm_config.model_config
 
-        self.model = Lfm2Model(vllm_config=vllm_config,
-                               prefix=maybe_prefix(prefix, "model"))
+        self.model = Lfm2Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
         if get_pp_group().is_last_rank:
             self.unpadded_vocab_size = self.config.vocab_size
@@ -507,8 +512,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
                     DEFAULT_VOCAB_PADDING_SIZE
                     # We need bigger padding if using lora for kernel
                     # compatibility
-                    if not lora_config else
-                    lora_config.lora_vocab_padding_size),
+                    if not lora_config
+                    else lora_config.lora_vocab_padding_size
+                ),
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
@@ -516,11 +522,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         else:
             self.lm_head = PPMissingLayer()
 
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -533,19 +541,18 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs,
     ) -> torch.Tensor:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(self, hidden_states: torch.Tensor) -> torch.Tensor:
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/llama.py b/vllm/model_executor/models/llama.py
index a6081d331511..faed1abb3bab 100644
--- a/vllm/model_executor/models/llama.py
+++ b/vllm/model_executor/models/llama.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only LLaMA model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Any, Optional, Union
@@ -38,27 +39,38 @@
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsEagle3, SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, extract_layer_index,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class LlamaMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -89,8 +101,9 @@ def __init__(
             prefix=f"{prefix}.down_proj",
         )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -101,7 +114,6 @@ def forward(self, x):
 
 
 class LlamaAttention(nn.Module):
-
     def __init__(
         self,
         config: LlamaConfig,
@@ -141,8 +153,7 @@ def __init__(
             head_dim = self.hidden_size // self.total_num_heads
         self.head_dim = head_dim
         # Phi models introduced a partial_rotary_factor parameter in the config
-        self.partial_rotary_factor = getattr(config, "partial_rotary_factor",
-                                             1)
+        self.partial_rotary_factor = getattr(config, "partial_rotary_factor", 1)
         self.q_size = self.num_heads * self.head_dim
         self.kv_size = self.num_kv_heads * self.head_dim
         self.scaling = self.head_dim**-0.5
@@ -167,33 +178,36 @@ def __init__(
             prefix=f"{prefix}.o_proj",
         )
 
-        self._init_rotary_emb(config,
-                              rope_scaling=rope_scaling,
-                              quant_config=quant_config)
+        self._init_rotary_emb(
+            config, rope_scaling=rope_scaling, quant_config=quant_config
+        )
 
         sliding_window = None
         if layer_types := getattr(config, "layer_types", None):
             # Fix for Eagle3 compatibility:
             # for draft models, subtract target layer count
             # to get draft-relative layer index starting from 0
-            if hasattr(config, 'target_layer_count'):
+            if hasattr(config, "target_layer_count"):
                 # This is a draft model,
                 # adjust layer_idx to be relative to draft layers
                 effective_layer_idx = layer_idx - config.target_layer_count
             else:
                 # This is a target model, use layer_idx directly
                 effective_layer_idx = layer_idx
-            assert effective_layer_idx < len(layer_types), \
+            assert effective_layer_idx < len(layer_types), (
                 f"effective_layer_idx: {effective_layer_idx} \
                 is out of bounds for layer_types: {layer_types}"
+            )
 
-            is_sliding = layer_types[
-                effective_layer_idx] == "sliding_attention"
+            is_sliding = layer_types[effective_layer_idx] == "sliding_attention"
             if is_sliding:
                 sliding_window = config.sliding_window
 
-        attn_cls = (EncoderOnlyAttention
-                    if attn_type == AttentionType.ENCODER_ONLY else Attention)
+        attn_cls = (
+            EncoderOnlyAttention
+            if attn_type == AttentionType.ENCODER_ONLY
+            else Attention
+        )
 
         self.attn = attn_cls(
             self.num_heads,
@@ -219,9 +233,12 @@ def forward(
         output, _ = self.o_proj(attn_output)
         return output
 
-    def _init_rotary_emb(self, config: LlamaConfig,
-                         rope_scaling: Optional[dict[str, Any]],
-                         quant_config: Optional[QuantizationConfig]) -> None:
+    def _init_rotary_emb(
+        self,
+        config: LlamaConfig,
+        rope_scaling: Optional[dict[str, Any]],
+        quant_config: Optional[QuantizationConfig],
+    ) -> None:
         is_neox_style = True
         is_gguf = quant_config and quant_config.get_name() == "gguf"
         if is_gguf and config.model_type == "llama":
@@ -239,11 +256,12 @@ def _init_rotary_emb(self, config: LlamaConfig,
 
 
 class LlamaDecoderLayer(nn.Module):
-
-    def __init__(self,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 config: Optional[LlamaConfig] = None) -> None:
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        config: Optional[LlamaConfig] = None,
+    ) -> None:
         super().__init__()
 
         config = config or vllm_config.model_config.hf_config
@@ -254,18 +272,20 @@ def __init__(self,
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
         if rope_scaling is not None and getattr(
-                config, "original_max_position_embeddings", None):
+            config, "original_max_position_embeddings", None
+        ):
             rope_scaling["original_max_position_embeddings"] = (
-                config.original_max_position_embeddings)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+                config.original_max_position_embeddings
+            )
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         # Support abacusai/Smaug-72B-v0.1 with attention_bias
         # Support internlm/internlm-7b with bias
         attention_bias = getattr(config, "attention_bias", False) or getattr(
-            config, "bias", False)
+            config, "bias", False
+        )
         bias_o_proj = attention_bias
         # support internlm/internlm3-8b with qkv_bias
-        if hasattr(config, 'qkv_bias'):
+        if hasattr(config, "qkv_bias"):
             attention_bias = config.qkv_bias
 
         # By default, Llama uses causal attention as it is a decoder-only model.
@@ -281,8 +301,9 @@ def __init__(self,
             config=config,
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
-            num_kv_heads=getattr(config, "num_key_value_heads",
-                                 config.num_attention_heads),
+            num_kv_heads=getattr(
+                config, "num_key_value_heads", config.num_attention_heads
+            ),
             rope_theta=rope_theta,
             rope_scaling=rope_scaling,
             max_position_embeddings=max_position_embeddings,
@@ -301,10 +322,10 @@ def __init__(self,
             bias=getattr(config, "mlp_bias", False),
             prefix=f"{prefix}.mlp",
         )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -317,31 +338,28 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
-        hidden_states = self.self_attn(positions=positions,
-                                       hidden_states=hidden_states)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
+        hidden_states = self.self_attn(positions=positions, hidden_states=hidden_states)
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
-    def get_quant_config(
-            self, vllm_config: VllmConfig) -> Optional[QuantizationConfig]:
+    def get_quant_config(self, vllm_config: VllmConfig) -> Optional[QuantizationConfig]:
         """Get quantization config for this layer. Override in subclasses."""
         return vllm_config.quant_config
 
 
 @support_torch_compile
 class LlamaModel(nn.Module):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 layer_type: type[nn.Module] = LlamaDecoderLayer):
+    def __init__(
+        self,
+        *,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        layer_type: type[nn.Module] = LlamaDecoderLayer,
+    ):
         super().__init__()
 
         config = vllm_config.model_config.hf_config
@@ -350,12 +368,16 @@ def __init__(self,
 
         self.config = config
         self.quant_config = quant_config
-        lora_vocab = (lora_config.lora_extra_vocab_size *
-                      (lora_config.max_loras or 1)) if lora_config else 0
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
-        if get_pp_group().is_first_rank or (config.tie_word_embeddings
-                                            and get_pp_group().is_last_rank):
+        if get_pp_group().is_first_rank or (
+            config.tie_word_embeddings and get_pp_group().is_last_rank
+        ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
@@ -376,9 +398,9 @@ def __init__(self,
 
         self.aux_hidden_state_layers = tuple[int, ...]()
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -389,8 +411,9 @@ def forward(
         positions: torch.Tensor,
         intermediate_tensors: Optional[IntermediateTensors],
         inputs_embeds: Optional[torch.Tensor] = None,
-    ) -> Union[torch.Tensor, IntermediateTensors, tuple[torch.Tensor,
-                                                        list[torch.Tensor]]]:
+    ) -> Union[
+        torch.Tensor, IntermediateTensors, tuple[torch.Tensor, list[torch.Tensor]]
+    ]:
         if get_pp_group().is_first_rank:
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
@@ -404,16 +427,16 @@ def forward(
 
         aux_hidden_states = []
         for idx, layer in enumerate(
-                islice(self.layers, self.start_layer, self.end_layer)):
+            islice(self.layers, self.start_layer, self.end_layer)
+        ):
             if idx in self.aux_hidden_state_layers:
                 aux_hidden_states.append(hidden_states + residual)
             hidden_states, residual = layer(positions, hidden_states, residual)
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
 
@@ -421,8 +444,7 @@ def forward(
             return hidden_states, aux_hidden_states
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv_proj", ".q_proj", "q"),
@@ -436,19 +458,19 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            if ("rotary_emb.cos_cached" in name
-                    or "rotary_emb.sin_cached" in name):
+            if "rotary_emb.cos_cached" in name or "rotary_emb.sin_cached" in name:
                 # Models trained using ColossalAI may include these tensors in
                 # the checkpoint. Skip them.
                 continue
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
@@ -481,8 +503,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -491,13 +512,13 @@ def load_weights(self, weights: Iterable[tuple[str,
 class LlamaForCausalLM(nn.Module, SupportsLoRA, SupportsPP, SupportsEagle3):
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
-        "gate_up_proj": ["gate_proj", "up_proj"]
+        "gate_up_proj": ["gate_proj", "up_proj"],
     }
 
     # LoRA specific attributes
     embedding_modules = {
         "embed_tokens": "input_embeddings",
-        "lm_head": "output_embeddings"
+        "lm_head": "output_embeddings",
     }
     embedding_padding_modules = ["lm_head"]
 
@@ -527,11 +548,13 @@ class LlamaForCausalLM(nn.Module, SupportsLoRA, SupportsPP, SupportsEagle3):
         "norm": "model.norm",
     }
 
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 layer_type: type[nn.Module] = LlamaDecoderLayer):
+    def __init__(
+        self,
+        *,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        layer_type: type[nn.Module] = LlamaDecoderLayer,
+    ):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
@@ -539,9 +562,11 @@ def __init__(self,
         self.config = config
         self.lora_config = lora_config
 
-        self.model = self._init_model(vllm_config=vllm_config,
-                                      prefix=maybe_prefix(prefix, "model"),
-                                      layer_type=layer_type)
+        self.model = self._init_model(
+            vllm_config=vllm_config,
+            prefix=maybe_prefix(prefix, "model"),
+            layer_type=layer_type,
+        )
 
         if get_pp_group().is_last_rank:
             self.unpadded_vocab_size = config.vocab_size
@@ -555,24 +580,25 @@ def __init__(self,
                     DEFAULT_VOCAB_PADDING_SIZE
                     # We need bigger padding if using lora for kernel
                     # compatibility
-                    if not lora_config else
-                    lora_config.lora_vocab_padding_size),
+                    if not lora_config
+                    else lora_config.lora_vocab_padding_size
+                ),
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
             if config.tie_word_embeddings:
-                self.lm_head = self.lm_head.tie_weights(
-                    self.model.embed_tokens)
+                self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
 
             logit_scale = getattr(config, "logit_scale", 1.0)
-            self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                    config.vocab_size,
-                                                    logit_scale)
+            self.logits_processor = LogitsProcessor(
+                self.unpadded_vocab_size, config.vocab_size, logit_scale
+            )
         else:
             self.lm_head = PPMissingLayer()
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def set_aux_hidden_state_layers(self, layers: tuple[int, ...]) -> None:
         self.model.aux_hidden_state_layers = layers
@@ -581,13 +607,13 @@ def get_eagle3_aux_hidden_state_layers(self) -> tuple[int, ...]:
         num_layers = len(self.model.layers)
         return (2, num_layers // 2, num_layers - 3)
 
-    def _init_model(self,
-                    vllm_config: VllmConfig,
-                    prefix: str = "",
-                    layer_type: type[nn.Module] = LlamaDecoderLayer):
-        return LlamaModel(vllm_config=vllm_config,
-                          prefix=prefix,
-                          layer_type=layer_type)
+    def _init_model(
+        self,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        layer_type: type[nn.Module] = LlamaDecoderLayer,
+    ):
+        return LlamaModel(vllm_config=vllm_config, prefix=prefix, layer_type=layer_type)
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -599,8 +625,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        model_output = self.model(input_ids, positions, intermediate_tensors,
-                                  inputs_embeds)
+        model_output = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return model_output
 
     def compute_logits(
@@ -610,16 +637,15 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(
             self.maybe_remap_mistral(name, loaded_weight)
-            for name, loaded_weight in weights)
+            for name, loaded_weight in weights
+        )
 
     # This function is used to remap the mistral format as
     # used by Mistral and Llama <=2
@@ -628,12 +654,14 @@ def maybe_remap_mistral(
         name: str,
         loaded_weight: torch.Tensor,
     ) -> tuple[str, torch.Tensor]:
-
         def permute(w: torch.Tensor, n_heads: int, attn_out: int):
             attn_in = self.config.head_dim * n_heads
 
-            return w.view(n_heads, attn_in // n_heads // 2, 2,
-                          attn_out).transpose(1, 2).reshape(attn_in, attn_out)
+            return (
+                w.view(n_heads, attn_in // n_heads // 2, 2, attn_out)
+                .transpose(1, 2)
+                .reshape(attn_in, attn_out)
+            )
 
         mapping = self.mistral_mapping
         modules = name.split(".")
@@ -642,29 +670,32 @@ def permute(w: torch.Tensor, n_heads: int, attn_out: int):
         # If using quantized model in mistral format,
         # quantization scales (qscale_weight) also need to be sliced
         if "wk" in modules and modules[-1] == "weight":
-            loaded_weight = permute(loaded_weight,
-                                    self.config.num_key_value_heads,
-                                    self.config.hidden_size)
-        elif "wk" in modules and modules[
-                -1] == "qscale_weight" and loaded_weight.numel() > 1:
-            loaded_weight = permute(loaded_weight,
-                                    self.config.num_key_value_heads, 1)
+            loaded_weight = permute(
+                loaded_weight, self.config.num_key_value_heads, self.config.hidden_size
+            )
+        elif (
+            "wk" in modules
+            and modules[-1] == "qscale_weight"
+            and loaded_weight.numel() > 1
+        ):
+            loaded_weight = permute(loaded_weight, self.config.num_key_value_heads, 1)
         elif "wq" in modules and modules[-1] == "weight":
-            loaded_weight = permute(loaded_weight,
-                                    self.config.num_attention_heads,
-                                    self.config.hidden_size)
-        elif "wq" in modules and modules[
-                -1] == "qscale_weight" and loaded_weight.numel() > 1:
-            loaded_weight = permute(loaded_weight,
-                                    self.config.num_attention_heads, 1)
+            loaded_weight = permute(
+                loaded_weight, self.config.num_attention_heads, self.config.hidden_size
+            )
+        elif (
+            "wq" in modules
+            and modules[-1] == "qscale_weight"
+            and loaded_weight.numel() > 1
+        ):
+            loaded_weight = permute(loaded_weight, self.config.num_attention_heads, 1)
 
         num_modules = len(modules)
         for i in range(num_modules):
             item = modules[i]
             next_item = modules[i + 1] if i < num_modules - 1 else None
 
-            combined_item = (f"{item}.{next_item}"
-                             if next_item is not None else None)
+            combined_item = f"{item}.{next_item}" if next_item is not None else None
 
             if combined_item in mapping:
                 name = name.replace(combined_item, mapping[combined_item])
diff --git a/vllm/model_executor/models/llama4.py b/vllm/model_executor/models/llama4.py
index 32d4f69c6bf1..075f35a098a4 100644
--- a/vllm/model_executor/models/llama4.py
+++ b/vllm/model_executor/models/llama4.py
@@ -17,6 +17,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only LLaMA model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from typing import Any, Optional
 
@@ -28,27 +29,36 @@
 from vllm.attention.layers.chunked_local_attention import ChunkedLocalAttention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_gather)
+from vllm.distributed import (
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_gather,
+)
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.shared_fused_moe import SharedFusedMoE
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.model_executor.models.utils import sequence_parallel_chunk
 
 from .llama import LlamaForCausalLM, LlamaMLP, LlamaModel
-from .utils import (AutoWeightsLoader, extract_layer_index, fast_topk,
-                    is_pp_missing_parameter)
+from .utils import (
+    AutoWeightsLoader,
+    extract_layer_index,
+    fast_topk,
+    is_pp_missing_parameter,
+)
 
 
 class Llama4MoE(nn.Module):
-
     @staticmethod
     def custom_routing_function(
         hidden_states: torch.Tensor,
@@ -73,11 +83,13 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = ""):
         self.is_sequence_parallel = parallel_config.use_sequence_parallel_moe
 
         intermediate_size_moe = config.intermediate_size
-        self.router = ReplicatedLinear(config.hidden_size,
-                                       config.num_local_experts,
-                                       bias=False,
-                                       quant_config=None,
-                                       prefix=f"{prefix}.router")
+        self.router = ReplicatedLinear(
+            config.hidden_size,
+            config.num_local_experts,
+            bias=False,
+            quant_config=None,
+            prefix=f"{prefix}.router",
+        )
 
         self.shared_expert = LlamaMLP(
             hidden_size=config.hidden_size,
@@ -123,26 +135,28 @@ def forward(self, hidden_states):
             experts_out = experts_out[:num_tokens]
         elif self.tp_size > 1:
             experts_out = self.experts.maybe_all_reduce_tensor_model_parallel(
-                experts_out)
+                experts_out
+            )
 
         return experts_out
 
 
 class Llama4Attention(nn.Module):
-
-    def __init__(self,
-                 config: Llama4TextConfig,
-                 hidden_size: int,
-                 num_heads: int,
-                 num_kv_heads: int,
-                 rope_theta: float = 10000,
-                 rope_scaling: Optional[dict[str, Any]] = None,
-                 max_position_embeddings: int = 8192,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 bias: bool = False,
-                 bias_o_proj: bool = False,
-                 cache_config: Optional[CacheConfig] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: Llama4TextConfig,
+        hidden_size: int,
+        num_heads: int,
+        num_kv_heads: int,
+        rope_theta: float = 10000,
+        rope_scaling: Optional[dict[str, Any]] = None,
+        max_position_embeddings: int = 8192,
+        quant_config: Optional[QuantizationConfig] = None,
+        bias: bool = False,
+        bias_o_proj: bool = False,
+        cache_config: Optional[CacheConfig] = None,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
         self.layer_idx = extract_layer_index(prefix)
         self.hidden_size = hidden_size
@@ -167,20 +181,23 @@ def __init__(self,
         self.q_size = self.num_heads * self.head_dim
         self.kv_size = self.num_kv_heads * self.head_dim
         self.scaling = self.head_dim**-0.5
-        self.attn_temperature_tuning = self.nope and \
-            config.attn_temperature_tuning
+        self.attn_temperature_tuning = self.nope and config.attn_temperature_tuning
 
         self.floor_scale = getattr(config, "floor_scale", 8192.0)
         self.attn_scale = getattr(config, "attn_scale", 0.1)
         self.rope_theta = rope_theta
         self.max_position_embeddings = max_position_embeddings
         self.n_rep = self.num_heads // self.num_kv_heads
-        self.qk_norm = RMSNorm(
-            hidden_size=self.head_dim,
-            eps=config.rms_norm_eps,
-            has_weight=False,
-            dtype=torch.float32,
-        ) if self.use_qk_norm else None
+        self.qk_norm = (
+            RMSNorm(
+                hidden_size=self.head_dim,
+                eps=config.rms_norm_eps,
+                has_weight=False,
+                dtype=torch.float32,
+            )
+            if self.use_qk_norm
+            else None
+        )
         self.qkv_proj = QKVParallelLinear(
             hidden_size=hidden_size,
             head_size=self.head_dim,
@@ -203,18 +220,21 @@ def __init__(self,
         if is_gguf and config.model_type == "llama":
             is_neox_style = False
 
-        self.rotary_emb = get_rope(
-            self.head_dim,
-            rotary_dim=self.head_dim,
-            max_position=max_position_embeddings,
-            base=int(rope_theta),
-            rope_scaling=rope_scaling if rope_scaling != "default" else None,
-            is_neox_style=is_neox_style,
-        ) if not self.nope else None
+        self.rotary_emb = (
+            get_rope(
+                self.head_dim,
+                rotary_dim=self.head_dim,
+                max_position=max_position_embeddings,
+                base=int(rope_theta),
+                rope_scaling=rope_scaling if rope_scaling != "default" else None,
+                is_neox_style=is_neox_style,
+            )
+            if not self.nope
+            else None
+        )
 
         use_chunked_local_attn = not self.nope and config.attention_chunk_size
-        attn_cls = (ChunkedLocalAttention
-                    if use_chunked_local_attn else Attention)
+        attn_cls = ChunkedLocalAttention if use_chunked_local_attn else Attention
         self.attn = attn_cls(
             self.num_heads,
             self.head_dim,
@@ -223,9 +243,12 @@ def __init__(self,
             cache_config=cache_config,
             quant_config=quant_config,
             prefix=f"{prefix}.attn",
-            **({
-                "attention_chunk_size": config.attention_chunk_size
-            } if use_chunked_local_attn else {}))
+            **(
+                {"attention_chunk_size": config.attention_chunk_size}
+                if use_chunked_local_attn
+                else {}
+            ),
+        )
 
     def _get_attn_scale(self, positions: torch.Tensor) -> torch.Tensor:
         floor = torch.floor((positions + 1.0) / self.floor_scale)
@@ -270,11 +293,12 @@ def forward(
 
 
 class Llama4DecoderLayer(nn.Module):
-
-    def __init__(self,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 config: Optional[Llama4TextConfig] = None) -> None:
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        config: Optional[Llama4TextConfig] = None,
+    ) -> None:
         super().__init__()
 
         config = config or vllm_config.model_config.hf_config
@@ -302,8 +326,10 @@ def __init__(self,
             cache_config=cache_config,
             prefix=f"{prefix}.self_attn",
         )
-        is_moe_layer = config.interleave_moe_layer_step > 0 and (
-            self.layer_idx + 1) % config.interleave_moe_layer_step == 0
+        is_moe_layer = (
+            config.interleave_moe_layer_step > 0
+            and (self.layer_idx + 1) % config.interleave_moe_layer_step == 0
+        )
         if is_moe_layer:
             self.feed_forward = Llama4MoE(
                 vllm_config=vllm_config,
@@ -318,10 +344,10 @@ def __init__(self,
                 bias=False,
                 prefix=f"{prefix}.feed_forward",
             )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -334,30 +360,26 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
-        hidden_states = self.self_attn(positions=positions,
-                                       hidden_states=hidden_states)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
+        hidden_states = self.self_attn(positions=positions, hidden_states=hidden_states)
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.feed_forward(hidden_states)
         return hidden_states, residual
 
 
 @support_torch_compile
 class Llama4Model(LlamaModel):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 layer_type: type[Llama4DecoderLayer] = Llama4DecoderLayer):
+    def __init__(
+        self,
+        *,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        layer_type: type[Llama4DecoderLayer] = Llama4DecoderLayer,
+    ):
         self.num_experts = vllm_config.model_config.hf_config.num_local_experts
-        super().__init__(vllm_config=vllm_config,
-                         prefix=prefix,
-                         layer_type=layer_type)
+        super().__init__(vllm_config=vllm_config, prefix=prefix, layer_type=layer_type)
 
     def load_moe_expert_weights(
         self,
@@ -408,9 +430,7 @@ def load_moe_expert_weights(
 
         # Iterate over all the expert parameters and load the weights if we find
         # a match in weight name.
-        for (param_name, weight_name, expert_id,
-             shard_id) in expert_params_mapping:
-
+        for param_name, weight_name, expert_id, shard_id in expert_params_mapping:
             # Get a view of the loaded_weight to avoid modifying the original
             # one across iterations.
             new_loaded_weight = loaded_weight
@@ -419,7 +439,7 @@ def load_moe_expert_weights(
             # the expert index from the expected weight name.
             if fused:
                 # The string between e_str and proj_str is the expert index.
-                e_str, _, proj_str, _ = weight_name.split('.')
+                e_str, _, proj_str, _ = weight_name.split(".")
                 weight_name = f"{e_str}.{proj_str}"
                 param_name = f"{param_name}weight"
 
@@ -436,8 +456,9 @@ def load_moe_expert_weights(
                 continue
 
             # Skip if the current weight is for the bias.
-            if ((name.endswith(".bias") or name.endswith("_bias"))
-                    and name not in params_dict):
+            if (
+                name.endswith(".bias") or name.endswith("_bias")
+            ) and name not in params_dict:
                 continue
 
             param = params_dict[full_param_name]
@@ -456,13 +477,14 @@ def load_moe_expert_weights(
                 # starting expert index for the current EP rank and extract the
                 # corresponding expert weights.
                 layer_idx = extract_layer_index(name)
-                expert_map = self.layers[
-                    layer_idx].feed_forward.experts.expert_map
+                expert_map = self.layers[layer_idx].feed_forward.experts.expert_map
                 if expert_map is not None:
-                    local_expert_indices = (expert_map != -1) \
-                                            .nonzero() \
-                                            .flatten() \
-                                            .to(new_loaded_weight.device)
+                    local_expert_indices = (
+                        (expert_map != -1)
+                        .nonzero()
+                        .flatten()
+                        .to(new_loaded_weight.device)
+                    )
                     new_loaded_weight = new_loaded_weight[local_expert_indices]
                     expert_id = local_expert_indices[0].item()
             else:
@@ -471,19 +493,20 @@ def load_moe_expert_weights(
 
             # Load the weight into the module parameter with corresponding
             # shard id and expert id.
-            weight_loader(param,
-                          new_loaded_weight,
-                          full_param_name,
-                          shard_id=shard_id,
-                          expert_id=expert_id)
+            weight_loader(
+                param,
+                new_loaded_weight,
+                full_param_name,
+                shard_id=shard_id,
+                expert_id=expert_id,
+            )
 
             loaded_params.add(full_param_name)
             expert_param_loaded = True
 
         return expert_param_loaded
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         # Name mapping from the parameter name to the shard name and
         # corresponding shard id.
         stacked_params_mapping = [
@@ -503,14 +526,16 @@ def load_weights(self, weights: Iterable[tuple[str,
             ckpt_gate_proj_name="gate_proj",
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
-            num_experts=self.num_experts)
+            num_experts=self.num_experts,
+        )
         # Expert parameter mapping for the case where the expert weights are
         # fused into a single weight tensor.
         expert_params_mapping_fused = FusedMoE.make_expert_params_mapping(
             ckpt_gate_proj_name="gate_up_proj",
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="gate_up_proj",
-            num_experts=1)
+            num_experts=1,
+        )
         # All the module parameters.
         params_dict = dict(self.named_parameters())
         # The module parameters that have been loaded.
@@ -518,7 +543,6 @@ def load_weights(self, weights: Iterable[tuple[str,
 
         # Iterate over all the weights and load them into module parameters.
         for name, loaded_weight in weights:
-
             # If the name contains "experts.gate_up_proj" or "experts.down_proj"
             # without the expert indices, it means the expert weights are fused
             # into a single weight tensor across all experts.
@@ -529,13 +553,14 @@ def load_weights(self, weights: Iterable[tuple[str,
             # If kv cache quantization scales exist and the weight name
             # corresponds to one of the kv cache quantization scales, load
             # them.
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
@@ -552,8 +577,9 @@ def load_weights(self, weights: Iterable[tuple[str,
 
                 # For ModelOpt checkpoints, we need to rename the self_attn
                 # weight/weight_scale names except for kv cache scales.
-                if not (name.endswith(
-                    (".k_scale", ".v_scale")) and "self_attn" in name):
+                if not (
+                    name.endswith((".k_scale", ".v_scale")) and "self_attn" in name
+                ):
                     name = name.replace(weight_name, param_name)
 
                 # Skip if the current weight corresponds to a parameter that
@@ -572,8 +598,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 # Load the weight into the module parameter with corresponding
                 # shard id and exit the for loop and the else block.
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
 
                 if weight_loader == default_weight_loader:
                     weight_loader(param, loaded_weight)
@@ -587,12 +612,14 @@ def load_weights(self, weights: Iterable[tuple[str,
             else:
                 # First, try to load MoE weights using load_moe_expert_weights.
                 # If successful, move on to next loaded weight.
-                if self.load_moe_expert_weights(name,
-                                                loaded_weight,
-                                                params_dict,
-                                                loaded_params,
-                                                expert_params_mapping,
-                                                fused=fused_experts_params):
+                if self.load_moe_expert_weights(
+                    name,
+                    loaded_weight,
+                    params_dict,
+                    loaded_params,
+                    expert_params_mapping,
+                    fused=fused_experts_params,
+                ):
                     continue
 
                 # Skip if the current weight corresponds to a parameter that
@@ -604,37 +631,40 @@ def load_weights(self, weights: Iterable[tuple[str,
                 # per-expert patterns, i.e. one weight scale tensor for all
                 # experts.
                 scale_names = [
-                    "w13_input_scale", "w13_weight_scale", "w2_input_scale",
-                    "w2_weight_scale"
+                    "w13_input_scale",
+                    "w13_weight_scale",
+                    "w2_input_scale",
+                    "w2_weight_scale",
                 ]
-                if ("experts." in name and any(scale_name in name
-                                               for scale_name in scale_names)):
-
+                if "experts." in name and any(
+                    scale_name in name for scale_name in scale_names
+                ):
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
 
                     # If weight loader supports special moe loading, use it to
                     # avoid expensive runtime reflection
-                    if getattr(weight_loader, 'supports_moe_loading', False):
+                    if getattr(weight_loader, "supports_moe_loading", False):
                         # Map the weight name to the corresponding shard id.
                         shard_id = "w2" if "w2_" in name else "w1"
 
                         # Transpose if weight scales are FP8 block scales with
                         # three dimensions:
                         # [num_experts, hidden_in, hidden_out].
-                        if name.endswith("weight_scale") \
-                            and loaded_weight.dtype == torch.float8_e4m3fn \
-                            and loaded_weight.ndim == 3:
+                        if (
+                            name.endswith("weight_scale")
+                            and loaded_weight.dtype == torch.float8_e4m3fn
+                            and loaded_weight.ndim == 3
+                        ):
                             loaded_weight = loaded_weight.transpose(-1, -2)
 
                         # Load the weight into the module parameter with
                         # corresponding shard id and expert id.
-                        weight_loader(param,
-                                      loaded_weight,
-                                      name,
-                                      shard_id=shard_id,
-                                      expert_id=0)
+                        weight_loader(
+                            param, loaded_weight, name, shard_id=shard_id, expert_id=0
+                        )
 
                     else:
                         # Regular weight loader (handles both
@@ -646,8 +676,7 @@ def load_weights(self, weights: Iterable[tuple[str,
 
                 # Handle normal (non-stacked, non-MoE) weights.
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
                 loaded_params.add(name)
 
@@ -656,7 +685,6 @@ def load_weights(self, weights: Iterable[tuple[str,
 
 
 class Llama4ForCausalLM(LlamaForCausalLM):
-
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
         "gate_up_proj": ["gate_proj", "up_proj"],
@@ -667,30 +695,29 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         gen_config = vllm_config.model_config.try_get_generation_config()
         gen_config.update(vllm_config.model_config.override_generation_config)
         # enable temperature tuning by default when max_model_len > 32K
-        default_attn_temperature_tuning = \
-            vllm_config.model_config.max_model_len > 32768
-        vllm_config.model_config.hf_config.attn_temperature_tuning \
-            = gen_config.get(
-                "attn_temperature_tuning", default_attn_temperature_tuning)
-
-        super().__init__(vllm_config=vllm_config,
-                         prefix=prefix,
-                         layer_type=Llama4DecoderLayer)
-
-    def _init_model(self,
-                    vllm_config: VllmConfig,
-                    prefix: str = "",
-                    layer_type: type[Llama4DecoderLayer] = Llama4DecoderLayer):
-        return Llama4Model(vllm_config=vllm_config,
-                           prefix=prefix,
-                           layer_type=layer_type)
-
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+        default_attn_temperature_tuning = vllm_config.model_config.max_model_len > 32768
+        vllm_config.model_config.hf_config.attn_temperature_tuning = gen_config.get(
+            "attn_temperature_tuning", default_attn_temperature_tuning
+        )
+
+        super().__init__(
+            vllm_config=vllm_config, prefix=prefix, layer_type=Llama4DecoderLayer
+        )
+
+    def _init_model(
+        self,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        layer_type: type[Llama4DecoderLayer] = Llama4DecoderLayer,
+    ):
+        return Llama4Model(
+            vllm_config=vllm_config, prefix=prefix, layer_type=layer_type
+        )
+
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         weights = [
             self.permute_qk_weight_for_rotary(name, loaded_weight)
@@ -703,10 +730,8 @@ def permute_qk_weight_for_rotary(
         name: str,
         loaded_weight: torch.Tensor,
     ) -> tuple[str, torch.Tensor]:
-
         # Helper function to permute the weight's channels
         def permute(w: torch.Tensor, n_heads: int, is_weight_scale: bool):
-
             # Calculate the expected shape of the weight.
             # Do not rely on w's shape, as it may be in another layout.
             attn_in = self.config.head_dim * n_heads
@@ -719,28 +744,39 @@ def permute(w: torch.Tensor, n_heads: int, is_weight_scale: bool):
 
             # If the weight is a weight scale, we need to divide attn_out by
             # block size, which is currently 16.
-            elif w.dtype == torch.float8_e4m3fn and is_weight_scale \
-                and w.shape[1] * 16 == attn_out:
+            elif (
+                w.dtype == torch.float8_e4m3fn
+                and is_weight_scale
+                and w.shape[1] * 16 == attn_out
+            ):
                 attn_out = attn_out // 16
 
-            return w.view(n_heads, attn_in // n_heads // 2, 2,
-                          attn_out).transpose(1, 2).reshape(attn_in, attn_out)
+            return (
+                w.view(n_heads, attn_in // n_heads // 2, 2, attn_out)
+                .transpose(1, 2)
+                .reshape(attn_in, attn_out)
+            )
 
         modules = name.split(".")
 
         # Permute Q/K weights and weight block scales for rotary embedding
         is_weight = modules[-1] == "weight"
-        is_nvfp4_weight_scale = (modules[-1] == "weight_scale" and
-                                 loaded_weight.dtype == torch.float8_e4m3fn)
+        is_nvfp4_weight_scale = (
+            modules[-1] == "weight_scale" and loaded_weight.dtype == torch.float8_e4m3fn
+        )
 
         if is_weight or is_nvfp4_weight_scale:
-            if ("wk" in modules or "k_proj" in modules):
-                loaded_weight = permute(loaded_weight,
-                                        self.config.num_key_value_heads,
-                                        is_nvfp4_weight_scale)
-            elif ("wq" in modules or "q_proj" in modules):
-                loaded_weight = permute(loaded_weight,
-                                        self.config.num_attention_heads,
-                                        is_nvfp4_weight_scale)
+            if "wk" in modules or "k_proj" in modules:
+                loaded_weight = permute(
+                    loaded_weight,
+                    self.config.num_key_value_heads,
+                    is_nvfp4_weight_scale,
+                )
+            elif "wq" in modules or "q_proj" in modules:
+                loaded_weight = permute(
+                    loaded_weight,
+                    self.config.num_attention_heads,
+                    is_nvfp4_weight_scale,
+                )
 
         return name, loaded_weight
diff --git a/vllm/model_executor/models/llama4_eagle.py b/vllm/model_executor/models/llama4_eagle.py
index 572eca344e0a..b3c8472e6a4b 100644
--- a/vllm/model_executor/models/llama4_eagle.py
+++ b/vllm/model_executor/models/llama4_eagle.py
@@ -30,11 +30,9 @@
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.torchao import TorchAOConfig
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
-from vllm.model_executor.models.llama4 import (Llama4DecoderLayer,
-                                               Llama4ForCausalLM)
+from vllm.model_executor.models.llama4 import Llama4DecoderLayer, Llama4ForCausalLM
 from vllm.model_executor.models.utils import extract_layer_index
 
 from .interfaces import SupportsMultiModal
@@ -45,7 +43,6 @@
 
 @support_torch_compile
 class LlamaModel(nn.Module):
-
     def __init__(
         self,
         *,
@@ -55,8 +52,7 @@ def __init__(
         quant_config: Optional[QuantizationConfig] = None,
     ) -> None:
         super().__init__()
-        self.config = (
-            vllm_config.speculative_config.draft_model_config.hf_config)
+        self.config = vllm_config.speculative_config.draft_model_config.hf_config
         self.validate_and_update_config(start_layer_id, quant_config)
         self.vocab_size = self.config.vocab_size
         self.embed_tokens = VocabParallelEmbedding(
@@ -65,18 +61,20 @@ def __init__(
             prefix=maybe_prefix(prefix, "embed_tokens"),
         )
 
-        self.layers = nn.ModuleList([
-            Llama4DecoderLayer(
-                vllm_config=vllm_config,
-                prefix=maybe_prefix(prefix, f"layers.{i + start_layer_id}"),
-                config=self.config,
-            ) for i in range(self.config.num_hidden_layers)
-        ])
-        self.fc = torch.nn.Linear(self.config.hidden_size * 2,
-                                  self.config.hidden_size,
-                                  bias=False)
-        self.norm = RMSNorm(self.config.hidden_size,
-                            eps=self.config.rms_norm_eps)
+        self.layers = nn.ModuleList(
+            [
+                Llama4DecoderLayer(
+                    vllm_config=vllm_config,
+                    prefix=maybe_prefix(prefix, f"layers.{i + start_layer_id}"),
+                    config=self.config,
+                )
+                for i in range(self.config.num_hidden_layers)
+            ]
+        )
+        self.fc = torch.nn.Linear(
+            self.config.hidden_size * 2, self.config.hidden_size, bias=False
+        )
+        self.norm = RMSNorm(self.config.hidden_size, eps=self.config.rms_norm_eps)
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -90,8 +88,7 @@ def forward(
     ) -> tuple[torch.Tensor, torch.Tensor]:
         if inputs_embeds is None:
             inputs_embeds = self.get_input_embeddings(input_ids)
-        hidden_states = self.fc(
-            torch.cat((inputs_embeds, hidden_states), dim=-1))
+        hidden_states = self.fc(torch.cat((inputs_embeds, hidden_states), dim=-1))
         residual = None
         for layer in self.layers:
             hidden_states, residual = layer(
@@ -102,8 +99,7 @@ def forward(
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states, hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv_proj", ".q_proj", "q"),
@@ -126,69 +122,65 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 # if PP disabled then draft will share embed with target
-                if get_pp_group().world_size == 1 and \
-                    "embed_tokens." in name:
+                if get_pp_group().world_size == 1 and "embed_tokens." in name:
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         for name in params_dict:
             # if PP disabled then draft will share embed with target
-            if get_pp_group().world_size == 1 and \
-                "embed_tokens." in name:
+            if get_pp_group().world_size == 1 and "embed_tokens." in name:
                 continue
             assert name in loaded_params, f"{name} is not loaded!"
         return loaded_params
 
     def validate_and_update_config(
-            self,
-            start_layer_id: int,
-            quant_config: Optional[QuantizationConfig] = None) -> None:
+        self, start_layer_id: int, quant_config: Optional[QuantizationConfig] = None
+    ) -> None:
         # yoco and moe is not supported by draft model yet
         assert self.config.yoco_global_kv_layer is None
         assert self.config.yoco_local_kv_layer is None
         assert len(self.config.moe_layers) == 0
         # draft model layer index is increased by start_layer_id,
         # so we need to pad relevant configs accordingly
-        self.config.no_rope_layers = [
-            0
-        ] * start_layer_id + self.config.no_rope_layers
+        self.config.no_rope_layers = [0] * start_layer_id + self.config.no_rope_layers
         # currently only TorchAO quantization is supported
         if isinstance(quant_config, TorchAOConfig):
 
             def pad_layer_name(layer: str) -> str:
                 layer_index = extract_layer_index(layer)
-                return layer.replace(str(layer_index),
-                                     str(layer_index + start_layer_id))
+                return layer.replace(
+                    str(layer_index), str(layer_index + start_layer_id)
+                )
 
             quant_config.torchao_config.module_fqn_to_config = {
                 pad_layer_name(layer): quantization
-                for layer, quantization in
-                quant_config.torchao_config.module_fqn_to_config.items()
+                for layer, quantization in quant_config.torchao_config.module_fqn_to_config.items()
             }
 
 
 class EagleLlama4ForCausalLM(Llama4ForCausalLM):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         nn.Module.__init__(self)
-        self.config = (
-            vllm_config.speculative_config.draft_model_config.hf_config)
+        self.config = vllm_config.speculative_config.draft_model_config.hf_config
         target_layer_num = vllm_config.model_config.get_num_layers(
-            vllm_config.parallel_config)
+            vllm_config.parallel_config
+        )
         # draft model quantization config may differ from target model
         quant_config = VllmConfig.get_quantization_config(
-            vllm_config.speculative_config.draft_model_config,
-            vllm_config.load_config)
-        self.model = LlamaModel(vllm_config=vllm_config,
-                                prefix="model",
-                                start_layer_id=target_layer_num,
-                                quant_config=quant_config)
+            vllm_config.speculative_config.draft_model_config, vllm_config.load_config
+        )
+        self.model = LlamaModel(
+            vllm_config=vllm_config,
+            prefix="model",
+            start_layer_id=target_layer_num,
+            quant_config=quant_config,
+        )
         logit_scale = getattr(self.config, "logit_scale", 1.0)
-        self.logits_processor = LogitsProcessor(self.config.vocab_size,
-                                                scale=logit_scale)
+        self.logits_processor = LogitsProcessor(
+            self.config.vocab_size, scale=logit_scale
+        )
 
     def get_language_model(self) -> torch.nn.Module:
         return self.model
@@ -204,13 +196,10 @@ def forward(
     ) -> tuple[torch.Tensor, torch.Tensor]:
         return self.model(input_ids, positions, hidden_states, inputs_embeds)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> None:
-
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> None:
         def transform(inputs):
             name, loaded_weight = inputs
-            name, weight = self.permute_qk_weight_for_rotary(
-                name, loaded_weight)
+            name, weight = self.permute_qk_weight_for_rotary(name, loaded_weight)
             if "lm_head" not in name:
                 name = "model." + name
             return name, weight
diff --git a/vllm/model_executor/models/llama_eagle.py b/vllm/model_executor/models/llama_eagle.py
index d7d6b1745fc8..5df158818c9f 100644
--- a/vllm/model_executor/models/llama_eagle.py
+++ b/vllm/model_executor/models/llama_eagle.py
@@ -13,11 +13,9 @@
 from vllm.distributed.parallel_state import get_pp_group
 from vllm.logger import init_logger
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
-from vllm.model_executor.models.llama import (LlamaDecoderLayer,
-                                              LlamaForCausalLM)
+from vllm.model_executor.models.llama import LlamaDecoderLayer, LlamaForCausalLM
 
 from .utils import AutoWeightsLoader, maybe_prefix
 
@@ -25,7 +23,6 @@
 
 
 class LlamaDecoderLayer(LlamaDecoderLayer):
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -44,7 +41,6 @@ def __init__(
 
 @support_torch_compile
 class LlamaModel(nn.Module):
-
     def __init__(
         self,
         *,
@@ -53,8 +49,7 @@ def __init__(
         start_layer_id: int = 0,
     ) -> None:
         super().__init__()
-        self.config = vllm_config. \
-            speculative_config.draft_model_config.hf_config
+        self.config = vllm_config.speculative_config.draft_model_config.hf_config
         self.vocab_size = self.config.vocab_size
 
         self.embed_tokens = VocabParallelEmbedding(
@@ -63,17 +58,20 @@ def __init__(
             prefix=maybe_prefix(prefix, "embed_tokens"),
         )
 
-        self.layers = nn.ModuleList([
-            LlamaDecoderLayer(
-                vllm_config,
-                i == 0,
-                prefix=maybe_prefix(prefix, f"layers.{i + start_layer_id}"),
-                config=self.config,
-            ) for i in range(self.config.num_hidden_layers)
-        ])
-        self.fc = torch.nn.Linear(self.config.hidden_size * 2,
-                                  self.config.hidden_size,
-                                  bias=False)
+        self.layers = nn.ModuleList(
+            [
+                LlamaDecoderLayer(
+                    vllm_config,
+                    i == 0,
+                    prefix=maybe_prefix(prefix, f"layers.{i + start_layer_id}"),
+                    config=self.config,
+                )
+                for i in range(self.config.num_hidden_layers)
+            ]
+        )
+        self.fc = torch.nn.Linear(
+            self.config.hidden_size * 2, self.config.hidden_size, bias=False
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -85,8 +83,7 @@ def forward(
         hidden_states: torch.Tensor,
     ) -> tuple[torch.Tensor, torch.Tensor]:
         input_embeds = self.embed_tokens(input_ids)
-        hidden_states = self.fc(
-            torch.cat((input_embeds, hidden_states), dim=-1))
+        hidden_states = self.fc(torch.cat((input_embeds, hidden_states), dim=-1))
         residual = None
         for layer in self.layers:
             hidden_states, residual = layer(
@@ -97,8 +94,7 @@ def forward(
         hidden_states = hidden_states + residual
         return hidden_states, hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv_proj", ".q_proj", "q"),
@@ -119,40 +115,37 @@ def load_weights(self, weights: Iterable[tuple[str,
                 weight_loader(param, loaded_weight, shard_id)
                 break
             else:
-
                 # if PP disabled then draft will share embed with target
-                if get_pp_group().world_size == 1 and \
-                    "embed_tokens." in name:
+                if get_pp_group().world_size == 1 and "embed_tokens." in name:
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class EagleLlamaForCausalLM(LlamaForCausalLM):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         nn.Module.__init__(self)
-        self.config = vllm_config. \
-            speculative_config.draft_model_config.hf_config
+        self.config = vllm_config.speculative_config.draft_model_config.hf_config
         # Ensure draft_vocab_size is set
         # default to the base vocab size when absent
         if getattr(self.config, "draft_vocab_size", None) is None:
             base_vocab_size = getattr(self.config, "vocab_size", None)
             self.config.draft_vocab_size = base_vocab_size
         target_layer_num = vllm_config.model_config.get_num_layers(
-            vllm_config.parallel_config)
-        self.model = LlamaModel(vllm_config=vllm_config,
-                                prefix="model",
-                                start_layer_id=target_layer_num)
+            vllm_config.parallel_config
+        )
+        self.model = LlamaModel(
+            vllm_config=vllm_config, prefix="model", start_layer_id=target_layer_num
+        )
 
         logit_scale = getattr(self.config, "logit_scale", 1.0)
-        self.logits_processor = LogitsProcessor(self.config.vocab_size,
-                                                scale=logit_scale)
+        self.logits_processor = LogitsProcessor(
+            self.config.vocab_size, scale=logit_scale
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -171,7 +164,6 @@ def forward(
         return self.model(input_ids, positions, hidden_states)
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
-
         def transform(inputs):
             name, loaded_weight = inputs
             if "lm_head" not in name:
diff --git a/vllm/model_executor/models/llama_eagle3.py b/vllm/model_executor/models/llama_eagle3.py
index 3fb6f2f8d5ec..712c8df3dbbb 100644
--- a/vllm/model_executor/models/llama_eagle3.py
+++ b/vllm/model_executor/models/llama_eagle3.py
@@ -13,13 +13,14 @@
 from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.layers.linear import QKVParallelLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
-from vllm.model_executor.layers.quantization.base_config import (
-    QuantizationConfig)
+from vllm.model_executor.layers.quantization.base_config import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
-from vllm.model_executor.models.llama import (LlamaDecoderLayer,
-                                              LlamaForCausalLM)
+from vllm.model_executor.models.llama import LlamaDecoderLayer, LlamaForCausalLM
 
 from .utils import AutoWeightsLoader, maybe_prefix
 
@@ -27,11 +28,12 @@
 
 
 class LlamaDecoderLayer(LlamaDecoderLayer):
-
-    def __init__(self,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 config: Optional[LlamaConfig] = None) -> None:
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        config: Optional[LlamaConfig] = None,
+    ) -> None:
         super().__init__(vllm_config, prefix=prefix, config=config)
 
         config = config or vllm_config.model_config.hf_config
@@ -55,26 +57,27 @@ def __init__(self,
         else:
             self._residual_norm = self._norm_after_residual
 
-    def get_quant_config(
-            self, vllm_config: VllmConfig) -> Optional[QuantizationConfig]:
+    def get_quant_config(self, vllm_config: VllmConfig) -> Optional[QuantizationConfig]:
         """Use drafter's quantization config instead of verifier's."""
         draft_model_config = vllm_config.speculative_config.draft_model_config
         draft_load_config = vllm_config.load_config
 
-        return VllmConfig.get_quantization_config(
-            draft_model_config,
-            draft_load_config) if draft_model_config else None
+        return (
+            VllmConfig.get_quantization_config(draft_model_config, draft_load_config)
+            if draft_model_config
+            else None
+        )
 
     def _norm_before_residual(
-            self,
-            hidden_states: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+        self, hidden_states: torch.Tensor
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         hidden_states = self.hidden_norm(hidden_states)
         residual = hidden_states
         return hidden_states, residual
 
     def _norm_after_residual(
-            self,
-            hidden_states: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+        self, hidden_states: torch.Tensor
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         residual = hidden_states
         hidden_states = self.hidden_norm(hidden_states)
         return hidden_states, residual
@@ -86,11 +89,9 @@ def forward(
         hidden_states: torch.Tensor,
         residual: Optional[torch.Tensor],
     ) -> tuple[torch.Tensor, torch.Tensor]:
-
         embeds = self.input_layernorm(embeds)
 
-        hidden_states, residual = self._residual_norm(
-            hidden_states=hidden_states)
+        hidden_states, residual = self._residual_norm(hidden_states=hidden_states)
 
         hidden_states = torch.cat([embeds, hidden_states], dim=-1)
         # Self Attention
@@ -99,8 +100,7 @@ def forward(
             hidden_states=hidden_states,
         )
 
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
 
         # Fully Connected
         hidden_states = self.mlp(hidden_states)
@@ -109,7 +109,6 @@ def forward(
 
 
 class LlamaModel(nn.Module):
-
     def __init__(
         self,
         *,
@@ -118,8 +117,7 @@ def __init__(
         prefix: str = "",
     ) -> None:
         super().__init__()
-        self.config = vllm_config. \
-            speculative_config.draft_model_config.hf_config
+        self.config = vllm_config.speculative_config.draft_model_config.hf_config
         self.vocab_size = self.config.vocab_size
 
         current_vllm_config = get_current_vllm_config()
@@ -130,21 +128,23 @@ def __init__(
             prefix=maybe_prefix(prefix, "embed_tokens"),
         )
 
-        self.layers = nn.ModuleList([
-            LlamaDecoderLayer(
-                current_vllm_config,
-                prefix=maybe_prefix(prefix, f"layers.{start_layer_id}"),
-                config=self.config,
-            )
-        ])
+        self.layers = nn.ModuleList(
+            [
+                LlamaDecoderLayer(
+                    current_vllm_config,
+                    prefix=maybe_prefix(prefix, f"layers.{start_layer_id}"),
+                    config=self.config,
+                )
+            ]
+        )
         if hasattr(self.config, "target_hidden_size"):
-            self.fc = torch.nn.Linear(self.config.target_hidden_size * 3,
-                                      self.config.hidden_size,
-                                      bias=False)
+            self.fc = torch.nn.Linear(
+                self.config.target_hidden_size * 3, self.config.hidden_size, bias=False
+            )
         else:
-            self.fc = torch.nn.Linear(self.config.hidden_size * 3,
-                                      self.config.hidden_size,
-                                      bias=False)
+            self.fc = torch.nn.Linear(
+                self.config.hidden_size * 3, self.config.hidden_size, bias=False
+            )
         self.norm = RMSNorm(
             self.config.hidden_size,
             eps=self.config.rms_norm_eps,
@@ -175,8 +175,7 @@ def forward(
         hidden_states, hidden_prenorm = self.norm(hidden_states, residual)
         return hidden_states, hidden_prenorm
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv_proj", ".q_proj", "q"),
@@ -188,8 +187,8 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            if 'midlayer.' in name:
-                name = name.replace('midlayer.', 'layers.0.')
+            if "midlayer." in name:
+                name = name.replace("midlayer.", "layers.0.")
             for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
@@ -200,33 +199,31 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class Eagle3LlamaForCausalLM(LlamaForCausalLM):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         nn.Module.__init__(self)
-        self.config = vllm_config. \
-            speculative_config.draft_model_config.hf_config
+        self.config = vllm_config.speculative_config.draft_model_config.hf_config
         # Ensure draft_vocab_size is set
         # default to the base vocab size when absent
         if getattr(self.config, "draft_vocab_size", None) is None:
             base_vocab_size = getattr(self.config, "vocab_size", None)
             self.config.draft_vocab_size = base_vocab_size
         target_layer_num = vllm_config.model_config.get_num_layers(
-            vllm_config.parallel_config)
+            vllm_config.parallel_config
+        )
 
         # Store target layer count in draft config for
         # proper layer_types indexing in draft models
         self.config.target_layer_count = target_layer_num
-        self.model = LlamaModel(vllm_config=vllm_config,
-                                prefix="model",
-                                start_layer_id=target_layer_num)
+        self.model = LlamaModel(
+            vllm_config=vllm_config, prefix="model", start_layer_id=target_layer_num
+        )
 
         logit_scale = getattr(self.config, "logit_scale", 1.0)
         self.lm_head = ParallelLMHead(
@@ -234,9 +231,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.config.hidden_size,
             org_num_embeddings=self.config.draft_vocab_size,
             padding_size=(DEFAULT_VOCAB_PADDING_SIZE),
-            prefix=maybe_prefix(prefix, "lm_head"))
-        self.logits_processor = LogitsProcessor(self.config.draft_vocab_size,
-                                                scale=logit_scale)
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
+        self.logits_processor = LogitsProcessor(
+            self.config.draft_vocab_size, scale=logit_scale
+        )
         self.draft_id_to_target_id = nn.Parameter(
             torch.zeros(self.config.draft_vocab_size, dtype=torch.long),
             requires_grad=False,
@@ -260,17 +259,21 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         logits = self.logits_processor(self.lm_head, hidden_states)
         if self.draft_id_to_target_id is None:
-            assert logits.shape[1] == self.config.vocab_size, \
-                "Expected logits to have shape " \
+            assert logits.shape[1] == self.config.vocab_size, (
+                "Expected logits to have shape "
                 f"(*, {self.config.vocab_size}), but got {logits.shape}"
+            )
             return logits
 
         base = torch.arange(self.config.draft_vocab_size, device=logits.device)
         targets = base + self.draft_id_to_target_id
-        logits_new = logits.new_full((
-            logits.shape[0],
-            self.config.vocab_size,
-        ), float('-inf'))
+        logits_new = logits.new_full(
+            (
+                logits.shape[0],
+                self.config.vocab_size,
+            ),
+            float("-inf"),
+        )
         logits_new[:, targets] = logits
         return logits_new
 
diff --git a/vllm/model_executor/models/llava.py b/vllm/model_executor/models/llava.py
index 725468ddef86..d784be069f06 100644
--- a/vllm/model_executor/models/llava.py
+++ b/vllm/model_executor/models/llava.py
@@ -3,35 +3,49 @@
 
 from abc import abstractmethod
 from collections.abc import Iterable, Mapping, Sequence
-from typing import (Annotated, Final, Literal, Optional, Protocol, TypeVar,
-                    Union)
+from typing import Annotated, Final, Literal, Optional, Protocol, TypeVar, Union
 
 import torch
 import torch.nn as nn
-from transformers import (BatchFeature, CLIPVisionConfig, LlavaConfig,
-                          PixtralVisionConfig, PretrainedConfig,
-                          SiglipVisionConfig)
+from transformers import (
+    BatchFeature,
+    CLIPVisionConfig,
+    LlavaConfig,
+    PixtralVisionConfig,
+    PretrainedConfig,
+    SiglipVisionConfig,
+)
 from transformers.models.llava import LlavaProcessor
 from transformers.models.pixtral import PixtralProcessor
 
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import ColumnParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.cache import BaseMultiModalProcessorCache
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalInputs, MultiModalKwargsItems,
-                                    MultiModalUUIDDict)
-from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
-                                   ImageSize, MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo,
-                                        InputProcessingContext,
-                                        PromptReplacement, PromptUpdate,
-                                        PromptUpdateDetails)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalInputs,
+    MultiModalKwargsItems,
+    MultiModalUUIDDict,
+)
+from vllm.multimodal.parse import (
+    ImageEmbeddingItems,
+    ImageProcessorItems,
+    ImageSize,
+    MultiModalDataItems,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    InputProcessingContext,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
@@ -40,8 +54,13 @@
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
 from .pixtral import PixtralHFEncoderInfo, PixtralHFVisionModel
 from .siglip import SiglipVisionModel
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
-                    init_vllm_registered_model, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 from .vision import get_num_selected_vision_tokens, get_vision_encoder_info
 
 
@@ -52,10 +71,11 @@ class LlavaImagePixelInputs(TensorSchema):
         - c: Number of channels (3)
         - h: Height
         - w: Width
-    
+
     Note that `height` or `width` may be different per batch and image,
     in which case the data is passed as a list instead of a batched tensor.
     """
+
     type: Literal["pixel_values"] = "pixel_values"
     pixel_values: Annotated[torch.Tensor, TensorShape("bn", 3, "h", "w")]
 
@@ -67,14 +87,16 @@ class PixtralHFImagePixelInputs(TensorSchema):
         - c: Number of channels
         - h: Height
         - w: Width
-    
+
     Note that `height` or `width` may be different per batch and image,
     in which case the data is passed as a list instead of a batched tensor.
     """
+
     type: Literal["pixel_values_pixtral"] = "pixel_values_pixtral"
     pixel_values: Annotated[
         Union[torch.Tensor, list[torch.Tensor]],
-        TensorShape("bn", "c", "h", "w", dynamic_dims={"h", "w"})]
+        TensorShape("bn", "c", "h", "w", dynamic_dims={"h", "w"}),
+    ]
 
 
 class LlavaImageEmbeddingInputs(TensorSchema):
@@ -84,36 +106,43 @@ class LlavaImageEmbeddingInputs(TensorSchema):
         - ifs: Image feature size
         - hs: Hidden size (must match language model backbone)
     """
+
     type: Literal["image_embeds"] = "image_embeds"
     data: Annotated[torch.Tensor, TensorShape("bn", "ifs", "hs")]
 
 
-LlavaImageInputs = Union[LlavaImagePixelInputs, PixtralHFImagePixelInputs,
-                         LlavaImageEmbeddingInputs]
+LlavaImageInputs = Union[
+    LlavaImagePixelInputs, PixtralHFImagePixelInputs, LlavaImageEmbeddingInputs
+]
 
 
 class LlavaMultiModalProjector(nn.Module):
-
-    def __init__(self,
-                 vision_hidden_size: int,
-                 text_hidden_size: int,
-                 projector_hidden_act: str,
-                 multimodal_projector_bias: bool,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        vision_hidden_size: int,
+        text_hidden_size: int,
+        projector_hidden_act: str,
+        multimodal_projector_bias: bool,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
 
-        self.linear_1 = ColumnParallelLinear(vision_hidden_size,
-                                             text_hidden_size,
-                                             bias=multimodal_projector_bias,
-                                             quant_config=quant_config,
-                                             prefix=f"{prefix}.linear_1")
+        self.linear_1 = ColumnParallelLinear(
+            vision_hidden_size,
+            text_hidden_size,
+            bias=multimodal_projector_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.linear_1",
+        )
         self.act = get_act_fn(projector_hidden_act)
-        self.linear_2 = RowParallelLinear(text_hidden_size,
-                                          text_hidden_size,
-                                          bias=multimodal_projector_bias,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.linear_2")
+        self.linear_2 = RowParallelLinear(
+            text_hidden_size,
+            text_hidden_size,
+            bias=multimodal_projector_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.linear_2",
+        )
 
     def forward(self, image_features: torch.Tensor) -> torch.Tensor:
         hidden_states, _ = self.linear_1(image_features)
@@ -134,7 +163,6 @@ class LlavaLikeProcessor(Protocol):
 
 
 class BaseLlavaProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self) -> LlavaLikeConfig:
         return self.ctx.get_hf_config(LlavaConfig)
 
@@ -183,7 +211,6 @@ def get_max_image_tokens(self) -> int:
 
 
 class LlavaDummyInputsBuilder(BaseDummyInputsBuilder[_I]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -200,22 +227,21 @@ def get_dummy_mm_data(
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class LlavaProcessingInfo(BaseLlavaProcessingInfo):
-
     def get_hf_processor(self, **kwargs: object):
         hf_processor = self.ctx.get_hf_processor(LlavaProcessor, **kwargs)
         # In case patch_size is omitted from `processor_config.json`
@@ -227,7 +253,6 @@ def get_hf_processor(self, **kwargs: object):
 
 
 class BaseLlavaMultiModalProcessor(BaseMultiModalProcessor[_I]):
-
     # Copied from BaseMultiModalProcessor
     @abstractmethod
     def _get_mm_fields_config(
@@ -248,7 +273,8 @@ def _get_prompt_updates(
 
         def get_replacement(item_idx: int):
             images = mm_items.get_items(
-                "image", (ImageEmbeddingItems, ImageProcessorItems))
+                "image", (ImageEmbeddingItems, ImageProcessorItems)
+            )
 
             if isinstance(images, ImageEmbeddingItems):
                 num_image_tokens = images.get_feature_size(item_idx)
@@ -270,9 +296,7 @@ def get_replacement(item_idx: int):
         ]
 
 
-class LlavaMultiModalProcessor(
-        BaseLlavaMultiModalProcessor[LlavaProcessingInfo]):
-
+class LlavaMultiModalProcessor(BaseLlavaMultiModalProcessor[LlavaProcessingInfo]):
     def _get_mm_fields_config(
         self,
         hf_inputs: BatchFeature,
@@ -285,14 +309,11 @@ def _get_mm_fields_config(
 
 
 class PixtralHFProcessingInfo(BaseLlavaProcessingInfo):
-
     def get_hf_processor(self, **kwargs: object):
         return self.ctx.get_hf_processor(PixtralProcessor, **kwargs)
 
 
-class PixtralHFMultiModalProcessor(
-        BaseMultiModalProcessor[PixtralHFProcessingInfo]):
-
+class PixtralHFMultiModalProcessor(BaseMultiModalProcessor[PixtralHFProcessingInfo]):
     def _call_hf_processor(
         self,
         prompt: str,
@@ -372,7 +393,8 @@ def get_replacement(item_idx: int):
 
 
 def _build_llava_or_pixtral_hf_info(
-    ctx: InputProcessingContext, ) -> BaseLlavaProcessingInfo:
+    ctx: InputProcessingContext,
+) -> BaseLlavaProcessingInfo:
     hf_config = ctx.get_hf_config(LlavaConfig)
 
     if isinstance(hf_config.vision_config, PixtralVisionConfig):
@@ -407,7 +429,7 @@ def _build_llava_or_pixtral_hf_processor(
 def _get_num_hidden_layers(hf_config: LlavaLikeConfig) -> int:
     """Determine the number of hidden layers to initialize up to in the
     visual encoder.
-    
+
     Args:
         hf_config: Model config with vision feature layer(s).
     """
@@ -418,10 +440,10 @@ def _get_num_hidden_layers(hf_config: LlavaLikeConfig) -> int:
         return _get_layer_index(feature_layers, num_hidden_layers)
     # If we have multiple feature layers, initialize up to the deepest one
     elif isinstance(feature_layers, (list, tuple)):
-        return max(
-            _get_layer_index(idx, num_hidden_layers) for idx in feature_layers)
-    raise TypeError(f"vision_layer_feature type: {type(feature_layers)}"
-                    " is not supported")
+        return max(_get_layer_index(idx, num_hidden_layers) for idx in feature_layers)
+    raise TypeError(
+        f"vision_layer_feature type: {type(feature_layers)} is not supported"
+    )
 
 
 def _get_layer_index(feature_layer_index: int, num_hidden_layers: int) -> int:
@@ -479,14 +501,15 @@ def init_vision_tower_for_llava(
     raise NotImplementedError(msg)
 
 
-@MULTIMODAL_REGISTRY.register_processor(_build_llava_or_pixtral_hf_processor,
-                                        info=_build_llava_or_pixtral_hf_info,
-                                        dummy_inputs=LlavaDummyInputsBuilder)
+@MULTIMODAL_REGISTRY.register_processor(
+    _build_llava_or_pixtral_hf_processor,
+    info=_build_llava_or_pixtral_hf_info,
+    dummy_inputs=LlavaDummyInputsBuilder,
+)
 class LlavaForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP):
-
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
-        "gate_up_proj": ["gate_proj", "up_proj"]
+        "gate_up_proj": ["gate_proj", "up_proj"],
     }
 
     hf_to_vllm_mapper = WeightsMapper(
@@ -496,7 +519,8 @@ class LlavaForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP):
             "model.vision_tower.": "vision_tower.",
             "model.multi_modal_projector.": "multi_modal_projector.",
             "lm_head.": "language_model.lm_head.",
-        })
+        }
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -517,11 +541,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
 
         # NOTE: These are special cases for Pixtral-12B in the HF-format
         # https://huggingface.co/mistral-community/pixtral-12b/blob/main/config.json  # noqa
-        if (config.text_config.architectures is None
-                and config.text_config.model_type == "mistral"):
+        if (
+            config.text_config.architectures is None
+            and config.text_config.model_type == "mistral"
+        ):
             config.text_config.architectures = ["MistralForCausalLM"]
-        if (config.projector_hidden_act is None
-                and config.vision_config.hidden_act == "gelu"):
+        if (
+            config.projector_hidden_act is None
+            and config.vision_config.hidden_act == "gelu"
+        ):
             config.projector_hidden_act = "gelu"
 
         # TODO: Optionally initializes this for supporting embeddings.
@@ -530,14 +558,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
                 config,
                 quant_config,
                 require_post_norm=False,
-                prefix=maybe_prefix(prefix, "vision_tower"))
+                prefix=maybe_prefix(prefix, "vision_tower"),
+            )
             self.multi_modal_projector = LlavaMultiModalProjector(
                 vision_hidden_size=config.vision_config.hidden_size,
                 text_hidden_size=config.text_config.hidden_size,
                 projector_hidden_act=config.projector_hidden_act,
                 multimodal_projector_bias=config.multimodal_projector_bias,
                 quant_config=quant_config,
-                prefix=maybe_prefix(prefix, "multi_modal_projector"))
+                prefix=maybe_prefix(prefix, "multi_modal_projector"),
+            )
         else:
             self.vision_tower = None
             self.multi_modal_projector = None
@@ -549,10 +579,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[LlavaImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[LlavaImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_embeds = kwargs.pop("image_embeds", None)
 
@@ -561,8 +593,9 @@ def _parse_and_validate_image_input(
 
         if pixel_values is not None:
             if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values)}")
+                raise ValueError(
+                    f"Incorrect type of pixel values. Got type: {type(pixel_values)}"
+                )
 
             if self.config.vision_config.model_type == "pixtral":
                 return PixtralHFImagePixelInputs(
@@ -574,16 +607,15 @@ def _parse_and_validate_image_input(
             return LlavaImagePixelInputs(
                 type="pixel_values",
                 pixel_values=flatten_bn(pixel_values, concat=True),
-                resolve_bindings={
-                    "h": expected_h,
-                    "w": expected_w
-                },
+                resolve_bindings={"h": expected_h, "w": expected_w},
             )
 
         if image_embeds is not None:
             if not isinstance(image_embeds, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image embeddings. "
-                                 f"Got type: {type(image_embeds)}")
+                raise ValueError(
+                    "Incorrect type of image embeddings. "
+                    f"Got type: {type(image_embeds)}"
+                )
 
             if self.config.vision_config.model_type == "pixtral":
                 raise ValueError("Pixtral-HF does not support image_embeds.")
@@ -597,8 +629,7 @@ def _parse_and_validate_image_input(
 
     def _image_pixels_to_features(
         self,
-        vision_tower: Union[CLIPVisionModel, SiglipVisionModel,
-                            PixtralHFVisionModel],
+        vision_tower: Union[CLIPVisionModel, SiglipVisionModel, PixtralHFVisionModel],
         pixel_values: Union[torch.Tensor, list[torch.Tensor]],
     ) -> Union[torch.Tensor, tuple[torch.Tensor, ...]]:
         # NOTE: we skip the step to select the vision feature layer since
@@ -631,9 +662,7 @@ def _process_image_input(
         if isinstance(image_features, torch.Tensor):
             return self.multi_modal_projector(image_features)
 
-        feature_sizes = [
-            image_feature.shape[0] for image_feature in image_features
-        ]
+        feature_sizes = [image_feature.shape[0] for image_feature in image_features]
 
         image_embeds = self.multi_modal_projector(torch.cat(image_features))
         image_embeds = torch.split(image_embeds, feature_sizes)
@@ -642,8 +671,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -698,10 +726,9 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.language_model.model(input_ids,
-                                                  positions,
-                                                  intermediate_tensors,
-                                                  inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
 
         return hidden_states
 
@@ -711,8 +738,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         skip_prefixes = []
         if self.vision_tower is None and self.multi_modal_projector is None:
             skip_prefixes.extend(["vision_tower.", "multi_modal_projector."])
@@ -722,7 +748,6 @@ def load_weights(self, weights: Iterable[tuple[str,
 
 
 class MantisProcessingInfo(LlavaProcessingInfo):
-
     def get_hf_processor(self, **kwargs: object):
         hf_config = self.get_hf_config()
         vision_info = self.get_vision_encoder_info()
@@ -737,7 +762,6 @@ def get_hf_processor(self, **kwargs: object):
 
 
 class MantisMultiModalProcessor(LlavaMultiModalProcessor):
-
     def apply(
         self,
         prompt: Union[str, list[int]],
@@ -755,11 +779,13 @@ def apply(
             image_height=-1,
         )
 
-        result = super().apply(prompt,
-                               mm_data,
-                               hf_processor_mm_kwargs,
-                               tokenization_kwargs,
-                               mm_uuids=mm_uuids)
+        result = super().apply(
+            prompt,
+            mm_data,
+            hf_processor_mm_kwargs,
+            tokenization_kwargs,
+            mm_uuids=mm_uuids,
+        )
 
         mm_items = self._to_mm_items(mm_data)
         mm_item_counts = mm_items.get_all_counts()
@@ -769,19 +795,24 @@ def apply(
         # We reimplement the functionality of MLlavaProcessor from
         # https://github.com/TIGER-AI-Lab/Mantis.git
         def get_replacement_mantis(item_idx: int):
-            return "".join([
-                f"(image {item_idx+1}: <Image>",  # 7 tokens
-                "<image>" * num_image_tokens,
-                "</Image>)",  # 3 tokens
-            ])
-
-        mantis_mm_repls = self._bind_and_group_updates([
-            PromptReplacement(
-                modality="image",
-                target=[image_token_id] * num_image_tokens,
-                replacement=get_replacement_mantis,
+            return "".join(
+                [
+                    f"(image {item_idx + 1}: <Image>",  # 7 tokens
+                    "<image>" * num_image_tokens,
+                    "</Image>)",  # 3 tokens
+                ]
             )
-        ], mm_item_counts)
+
+        mantis_mm_repls = self._bind_and_group_updates(
+            [
+                PromptReplacement(
+                    modality="image",
+                    target=[image_token_id] * num_image_tokens,
+                    replacement=get_replacement_mantis,
+                )
+            ],
+            mm_item_counts,
+        )
 
         prompt_ids, _ = self._apply_prompt_updates(
             result["prompt_token_ids"],
@@ -812,8 +843,10 @@ def get_replacement_mantis(item_idx: int):
 
 # To use this model, please use
 # `--hf_overrides '{"architectures": ["MantisForConditionalGeneration"]}'`
-@MULTIMODAL_REGISTRY.register_processor(MantisMultiModalProcessor,
-                                        info=MantisProcessingInfo,
-                                        dummy_inputs=LlavaDummyInputsBuilder)
+@MULTIMODAL_REGISTRY.register_processor(
+    MantisMultiModalProcessor,
+    info=MantisProcessingInfo,
+    dummy_inputs=LlavaDummyInputsBuilder,
+)
 class MantisForConditionalGeneration(LlavaForConditionalGeneration):
     pass
diff --git a/vllm/model_executor/models/llava_next.py b/vllm/model_executor/models/llava_next.py
index 70fd0b2e5efb..57fccdf94233 100644
--- a/vllm/model_executor/models/llava_next.py
+++ b/vllm/model_executor/models/llava_next.py
@@ -3,14 +3,15 @@
 
 from abc import abstractmethod
 from collections.abc import Iterable, Mapping
-from typing import (Annotated, Final, Literal, Optional, Protocol, TypeVar,
-                    Union)
+from typing import Annotated, Final, Literal, Optional, Protocol, TypeVar, Union
 
 import torch
 import torch.nn as nn
 from transformers import BatchFeature, LlavaNextConfig, LlavaNextProcessor
 from transformers.models.llava_next.modeling_llava_next import (
-    get_anyres_image_grid_shape, unpad_image)
+    get_anyres_image_grid_shape,
+    unpad_image,
+)
 
 from vllm.config import VllmConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
@@ -21,12 +22,22 @@
 
 from .clip import CLIPVisionModel
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
-from .llava import (BaseLlavaMultiModalProcessor, BaseLlavaProcessingInfo,
-                    LlavaDummyInputsBuilder, LlavaLikeConfig,
-                    LlavaMultiModalProjector, init_vision_tower_for_llava)
+from .llava import (
+    BaseLlavaMultiModalProcessor,
+    BaseLlavaProcessingInfo,
+    LlavaDummyInputsBuilder,
+    LlavaLikeConfig,
+    LlavaMultiModalProjector,
+    init_vision_tower_for_llava,
+)
 from .siglip import SiglipVisionModel
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
-                    init_vllm_registered_model, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 from .vision import get_num_selected_vision_tokens
 
 
@@ -38,14 +49,16 @@ class LlavaNextImagePixelInputs(TensorSchema):
         - c: Number of channels (3)
         - h: Height
         - w: Width
-    
+
     Note that `num_patches` may be different per batch and image,
     in which case the data is passed as a list instead of a batched tensor.
     """
+
     type: Literal["pixel_values"] = "pixel_values"
     pixel_values: Annotated[
         Union[torch.Tensor, list[torch.Tensor]],
-        TensorShape("bn", "np", 3, "h", "w", dynamic_dims={"np"})]
+        TensorShape("bn", "np", 3, "h", "w", dynamic_dims={"np"}),
+    ]
 
     image_sizes: Annotated[Optional[torch.Tensor], TensorShape("bn", 2)]
     # This should be in `(height, width)` format.
@@ -58,12 +71,12 @@ class LlavaNextImageEmbeddingInputs(TensorSchema):
         - ifs: Image feature size
         - hs: Hidden size (must match language model backbone)
     """
+
     type: Literal["image_embeds"] = "image_embeds"
     data: Annotated[torch.Tensor, TensorShape("bn", "ifs", "hs")]
 
 
-LlavaNextImageInputs = Union[LlavaNextImagePixelInputs,
-                             LlavaNextImageEmbeddingInputs]
+LlavaNextImageInputs = Union[LlavaNextImagePixelInputs, LlavaNextImageEmbeddingInputs]
 
 
 class LlavaNextLikeConfig(LlavaLikeConfig, Protocol):
@@ -71,7 +84,6 @@ class LlavaNextLikeConfig(LlavaLikeConfig, Protocol):
 
 
 class LlavaNextProcessingInfo(BaseLlavaProcessingInfo):
-
     def get_hf_config(self) -> LlavaNextLikeConfig:
         return self.ctx.get_hf_config(LlavaNextConfig)
 
@@ -141,12 +153,14 @@ def _get_num_unpadded_features(
 
         if aspect_ratio > current_aspect_ratio:
             new_height = int(
-                round(original_height * (current_width / original_width), 7))
+                round(original_height * (current_width / original_width), 7)
+            )
             padding = (current_height - new_height) // 2
             current_height = current_height - (2 * padding)
         else:
             new_width = int(
-                round(original_width * (current_height / original_height), 7))
+                round(original_width * (current_height / original_height), 7)
+            )
             padding = (current_width - new_width) // 2
             current_width = current_width - (2 * padding)
 
@@ -159,13 +173,13 @@ def get_image_size_with_most_features(self) -> ImageSize:
         hf_config = self.get_hf_config()
 
         largest_feature_size, largest_feature_pinpoint = 0, None
-        for (height, width) in hf_config.image_grid_pinpoints:
-            feat_size = self.get_num_image_tokens(image_width=width,
-                                                  image_height=height)
+        for height, width in hf_config.image_grid_pinpoints:
+            feat_size = self.get_num_image_tokens(
+                image_width=width, image_height=height
+            )
             if feat_size > largest_feature_size:
                 largest_feature_size = feat_size
-                largest_feature_pinpoint = ImageSize(width=width,
-                                                     height=height)
+                largest_feature_pinpoint = ImageSize(width=width, height=height)
 
         if largest_feature_size == 0 or largest_feature_pinpoint is None:
             raise ValueError("Cannot have a largest feature size of 0!")
@@ -177,7 +191,6 @@ def get_image_size_with_most_features(self) -> ImageSize:
 
 
 class BaseLlavaNextMultiModalProcessor(BaseLlavaMultiModalProcessor[_I]):
-
     # Copied from BaseMultiModalProcessor
     @abstractmethod
     def _get_mm_fields_config(
@@ -189,8 +202,8 @@ def _get_mm_fields_config(
 
 
 class LlavaNextMultiModalProcessor(
-        BaseLlavaNextMultiModalProcessor[LlavaNextProcessingInfo]):
-
+    BaseLlavaNextMultiModalProcessor[LlavaNextProcessingInfo]
+):
     def _get_mm_fields_config(
         self,
         hf_inputs: BatchFeature,
@@ -203,12 +216,12 @@ def _get_mm_fields_config(
         )
 
 
-@MULTIMODAL_REGISTRY.register_processor(LlavaNextMultiModalProcessor,
-                                        info=LlavaNextProcessingInfo,
-                                        dummy_inputs=LlavaDummyInputsBuilder)
-class LlavaNextForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                        SupportsPP):
-
+@MULTIMODAL_REGISTRY.register_processor(
+    LlavaNextMultiModalProcessor,
+    info=LlavaNextProcessingInfo,
+    dummy_inputs=LlavaDummyInputsBuilder,
+)
+class LlavaNextForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP):
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_prefix={
             # mapping for new names in checkpoint saved after transformers v4.52
@@ -217,7 +230,8 @@ class LlavaNextForConditionalGeneration(nn.Module, SupportsMultiModal,
             "model.multi_modal_projector.": "multi_modal_projector.",
             "model.image_newline": "image_newline",
             "lm_head.": "language_model.lm_head.",
-        })
+        }
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -240,12 +254,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         # Used for multimodal granite models to control encoder outputs
         elif isinstance(vision_feature_layer, (list, tuple)):
             vision_hidden_size = config.vision_config.hidden_size * len(
-                vision_feature_layer)
+                vision_feature_layer
+            )
             self.select_layers = vision_feature_layer
         else:
             raise TypeError(
                 f"vision_layer_feature type: {type(vision_feature_layer)}"
-                " is not supported")
+                " is not supported"
+            )
 
         self.config = config
         self.multimodal_config = multimodal_config
@@ -255,14 +271,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
             config,
             quant_config,
             require_post_norm=False,
-            prefix=maybe_prefix(prefix, "vision_tower"))
-        self.image_newline = nn.Parameter(
-            torch.empty(config.text_config.hidden_size))
+            prefix=maybe_prefix(prefix, "vision_tower"),
+        )
+        self.image_newline = nn.Parameter(torch.empty(config.text_config.hidden_size))
         self.multi_modal_projector = LlavaMultiModalProjector(
             vision_hidden_size=vision_hidden_size,
             text_hidden_size=config.text_config.hidden_size,
             projector_hidden_act=config.projector_hidden_act,
-            multimodal_projector_bias=config.multimodal_projector_bias)
+            multimodal_projector_bias=config.multimodal_projector_bias,
+        )
 
         self.language_model = init_vllm_registered_model(
             vllm_config=vllm_config,
@@ -271,10 +288,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[LlavaNextImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[LlavaNextImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_sizes = kwargs.pop("image_sizes", None)
         image_embeds = kwargs.pop("image_embeds", None)
@@ -284,12 +303,14 @@ def _parse_and_validate_image_input(
 
         if pixel_values is not None:
             if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values)}")
+                raise ValueError(
+                    f"Incorrect type of pixel values. Got type: {type(pixel_values)}"
+                )
 
             if not isinstance(image_sizes, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image sizes. "
-                                 f"Got type: {type(image_sizes)}")
+                raise ValueError(
+                    f"Incorrect type of image sizes. Got type: {type(image_sizes)}"
+                )
 
             expected_h = expected_w = self.config.vision_config.image_size
             return LlavaNextImagePixelInputs(
@@ -299,12 +320,14 @@ def _parse_and_validate_image_input(
                 resolve_bindings={
                     "h": expected_h,
                     "w": expected_w,
-                })
+                },
+            )
 
         if image_embeds is not None:
             if not isinstance(image_embeds, torch.Tensor):
-                raise ValueError("Incorrect type of image embeds. "
-                                 f"Got type: {type(image_embeds)}")
+                raise ValueError(
+                    f"Incorrect type of image embeds. Got type: {type(image_embeds)}"
+                )
 
             return LlavaNextImageEmbeddingInputs(
                 type="image_embeds",
@@ -327,21 +350,23 @@ def _image_pixels_to_features(
         )
 
     # Based on: https://github.com/haotian-liu/LLaVA/blob/main/llava/model/llava_arch.py
-    def _merge_image_patch_embeddings(self, image_size: torch.Tensor,
-                                      patch_embeddings: torch.Tensor, *,
-                                      strategy: str) -> torch.Tensor:
+    def _merge_image_patch_embeddings(
+        self, image_size: torch.Tensor, patch_embeddings: torch.Tensor, *, strategy: str
+    ) -> torch.Tensor:
         if strategy == "flat":
             return patch_embeddings.flatten(0, 1)
 
         if strategy.startswith("spatial"):
-            height = width = self.config.vision_config.image_size \
+            height = width = (
+                self.config.vision_config.image_size
                 // self.config.vision_config.patch_size
+            )
 
             base_patch_embeds = patch_embeddings[0]
             if height * width != base_patch_embeds.shape[0]:
                 raise ValueError(
-                    "The number of patches is not consistent with the "
-                    "image size.")
+                    "The number of patches is not consistent with the image size."
+                )
 
             if patch_embeddings.shape[0] > 1:
                 other_patch_embeds = patch_embeddings[1:]
@@ -358,37 +383,51 @@ def _merge_image_patch_embeddings(self, image_size: torch.Tensor,
                 num_patches = num_patch_height * num_patch_width
 
                 # Image patches might be padded for batch processing
-                other_patch_embeds = other_patch_embeds[:num_patches] \
-                    .view(num_patch_height, num_patch_width, height, width, -1)
+                other_patch_embeds = other_patch_embeds[:num_patches].view(
+                    num_patch_height, num_patch_width, height, width, -1
+                )
 
                 if "unpad" in strategy:
-                    other_patch_embeds = other_patch_embeds \
-                        .permute(4, 0, 2, 1, 3).contiguous() \
-                        .flatten(1, 2).flatten(2, 3)
-                    other_patch_embeds = unpad_image(other_patch_embeds,
-                                                     (orig_height, orig_width))
-                    other_patch_embeds = torch.cat((
-                        other_patch_embeds,
-                        self.image_newline[:, None, None] \
-                            .expand(*other_patch_embeds.shape[:-1], 1) \
+                    other_patch_embeds = (
+                        other_patch_embeds.permute(4, 0, 2, 1, 3)
+                        .contiguous()
+                        .flatten(1, 2)
+                        .flatten(2, 3)
+                    )
+                    other_patch_embeds = unpad_image(
+                        other_patch_embeds, (orig_height, orig_width)
+                    )
+                    other_patch_embeds = torch.cat(
+                        (
+                            other_patch_embeds,
+                            self.image_newline[:, None, None]
+                            .expand(*other_patch_embeds.shape[:-1], 1)
                             .to(other_patch_embeds.device),
-                    ), dim=-1)
-                    other_patch_embeds = other_patch_embeds \
-                        .flatten(1, 2).transpose(0, 1)
+                        ),
+                        dim=-1,
+                    )
+                    other_patch_embeds = other_patch_embeds.flatten(1, 2).transpose(
+                        0, 1
+                    )
                 else:
-                    other_patch_embeds = other_patch_embeds \
-                        .permute(0, 2, 1, 3, 4).contiguous() \
+                    other_patch_embeds = (
+                        other_patch_embeds.permute(0, 2, 1, 3, 4)
+                        .contiguous()
                         .flatten(0, 3)
+                    )
 
                 merged_patch_embeddings = torch.cat(
-                    (base_patch_embeds, other_patch_embeds), dim=0)
+                    (base_patch_embeds, other_patch_embeds), dim=0
+                )
             else:
                 if "unpad" in strategy:
                     merged_patch_embeddings = torch.cat(
-                        (base_patch_embeds,
-                         self.image_newline[None] \
-                            .to(base_patch_embeds.device)
-                    ), dim=0)
+                        (
+                            base_patch_embeds,
+                            self.image_newline[None].to(base_patch_embeds.device),
+                        ),
+                        dim=0,
+                    )
                 else:
                     merged_patch_embeddings = base_patch_embeds
 
@@ -408,20 +447,25 @@ def _process_image_pixels(
             b, num_patches, c, h, w = pixel_values.shape
             stacked_pixel_values = pixel_values.view(b * num_patches, c, h, w)
             stacked_image_features = self._image_pixels_to_features(
-                self.vision_tower, stacked_pixel_values)
+                self.vision_tower, stacked_pixel_values
+            )
             stacked_patch_embeddings = self.multi_modal_projector(
-                stacked_image_features)
+                stacked_image_features
+            )
 
             return stacked_patch_embeddings.view(
-                b, num_patches, *stacked_patch_embeddings.shape[1:])
+                b, num_patches, *stacked_patch_embeddings.shape[1:]
+            )
 
         num_patches_per_batch = [v.shape[0] for v in pixel_values]
         stacked_pixel_values = torch.cat(pixel_values)
         stacked_image_features = self._image_pixels_to_features(
-            self.vision_tower, stacked_pixel_values)
+            self.vision_tower, stacked_pixel_values
+        )
 
-        return torch.split(self.multi_modal_projector(stacked_image_features),
-                           num_patches_per_batch)
+        return torch.split(
+            self.multi_modal_projector(stacked_image_features), num_patches_per_batch
+        )
 
     def _process_image_input(
         self,
@@ -437,21 +481,21 @@ def _process_image_input(
             batch_size = len(image_input["data"])
             vision_config = self.config.vision_config
             default_height = default_width = vision_config.image_size
-            image_sizes = torch.as_tensor([[default_height, default_width]
-                                           for _ in range(batch_size)])
+            image_sizes = torch.as_tensor(
+                [[default_height, default_width] for _ in range(batch_size)]
+            )
 
         return [
-            self._merge_image_patch_embeddings(image_sizes[i],
-                                               patch_features_batch,
-                                               strategy="spatial_unpad")
+            self._merge_image_patch_embeddings(
+                image_sizes[i], patch_features_batch, strategy="spatial_unpad"
+            )
             for i, patch_features_batch in enumerate(patch_embeddings)
         ]
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -535,10 +579,9 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.language_model.model(input_ids,
-                                                  positions,
-                                                  intermediate_tensors,
-                                                  inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -547,7 +590,6 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
diff --git a/vllm/model_executor/models/llava_next_video.py b/vllm/model_executor/models/llava_next_video.py
index 7aabef32b4a9..9041b18d0f63 100644
--- a/vllm/model_executor/models/llava_next_video.py
+++ b/vllm/model_executor/models/llava_next_video.py
@@ -7,21 +7,30 @@
 
 import torch
 import torch.nn as nn
-from transformers import (BatchFeature, LlavaNextVideoConfig,
-                          LlavaNextVideoProcessor)
+from transformers import BatchFeature, LlavaNextVideoConfig, LlavaNextVideoProcessor
 
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.models.clip import CLIPVisionModel
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
-from vllm.multimodal.parse import (ImageSize, MultiModalDataItems,
-                                   VideoEmbeddingItems, VideoProcessorItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
+from vllm.multimodal.parse import (
+    ImageSize,
+    MultiModalDataItems,
+    VideoEmbeddingItems,
+    VideoProcessorItems,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils import is_list_of
@@ -30,13 +39,17 @@
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
 from .llava import init_vision_tower_for_llava
 from .siglip import SiglipVisionModel
-from .utils import (AutoWeightsLoader, WeightsMapper,
-                    init_vllm_registered_model, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 from .vision import get_vision_encoder_info
 
 
 class LlavaNextVideoPixelInputs(TensorSchema):
-    """    
+    """
     Dimensions:
         - bs: Batch size
         - nv: Number of videos
@@ -50,14 +63,16 @@ class LlavaNextVideoPixelInputs(TensorSchema):
 
     Note that it only supports one video input for one batch.
     """
+
     type: Literal["pixel_values_videos"] = "pixel_values_videos"
 
-    data: Annotated[Union[torch.Tensor, list[torch.Tensor]],
-                    TensorShape("bs", "nv", "nf", 3, "h", "w")]
+    data: Annotated[
+        Union[torch.Tensor, list[torch.Tensor]],
+        TensorShape("bs", "nv", "nf", 3, "h", "w"),
+    ]
 
 
 class LlavaNextVideoProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(LlavaNextVideoConfig)
 
@@ -137,8 +152,8 @@ def get_num_frames_with_most_features(
 
 
 class LlavaNextVideoDummyInputsBuilder(
-        BaseDummyInputsBuilder[LlavaNextVideoProcessingInfo]):
-
+    BaseDummyInputsBuilder[LlavaNextVideoProcessingInfo]
+):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_videos = mm_counts.get("video", 0)
 
@@ -155,16 +170,15 @@ def get_dummy_mm_data(
     ) -> MultiModalDataDict:
         num_videos = mm_counts.get("video", 0)
 
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
-        target_num_frames = \
-            self.info.get_num_frames_with_most_features(seq_len, mm_counts)
+        target_width, target_height = self.info.get_image_size_with_most_features()
+        target_num_frames = self.info.get_num_frames_with_most_features(
+            seq_len, mm_counts
+        )
 
         video_overrides = mm_options.get("video") if mm_options else None
 
         return {
-            "video":
-            self._get_dummy_videos(
+            "video": self._get_dummy_videos(
                 width=target_width,
                 height=target_height,
                 num_frames=target_num_frames,
@@ -175,8 +189,8 @@ def get_dummy_mm_data(
 
 
 class LlavaNextVideoMultiModalProcessor(
-        BaseMultiModalProcessor[LlavaNextVideoProcessingInfo]):
-
+    BaseMultiModalProcessor[LlavaNextVideoProcessingInfo]
+):
     def _get_mm_fields_config(
         self,
         hf_inputs: BatchFeature,
@@ -195,7 +209,8 @@ def _get_prompt_updates(
 
         def get_replacement(item_idx: int):
             videos = mm_items.get_items(
-                "video", (VideoEmbeddingItems, VideoProcessorItems))
+                "video", (VideoEmbeddingItems, VideoProcessorItems)
+            )
 
             if isinstance(videos, VideoEmbeddingItems):
                 num_video_tokens = videos.get_feature_size(item_idx)
@@ -220,7 +235,6 @@ def get_replacement(item_idx: int):
 
 # adopted from transformers modeling_llava_next_video.py
 class LlavaNextVideoPooler(nn.Module):
-
     def __init__(self, config: LlavaNextVideoConfig):
         super().__init__()
 
@@ -237,36 +251,41 @@ def __init__(self, config: LlavaNextVideoConfig):
         else:
             # TODO: Support Conv2d pooling layer, need to load weights
             raise ValueError(
-                f"Unknown pooling mode: {mode}. Expected [`average`, `max`]")
+                f"Unknown pooling mode: {mode}. Expected [`average`, `max`]"
+            )
 
     def forward(self, image_features: torch.Tensor):
         ori_width = int(
-            math.sqrt(image_features.shape[1] * self.image_size //
-                      self.image_size))
+            math.sqrt(image_features.shape[1] * self.image_size // self.image_size)
+        )
         ori_height = int(ori_width * self.image_size // self.image_size)
 
         batch_size, _, dim = image_features.shape
-        image_features_spatial = image_features \
-            .view(batch_size, ori_height, ori_height, dim) \
-            .permute(0, 3, 1, 2)
+        image_features_spatial = image_features.view(
+            batch_size, ori_height, ori_height, dim
+        ).permute(0, 3, 1, 2)
         image_features_spatial = self.pool(image_features_spatial)
 
         return image_features_spatial.flatten(2).transpose(1, 2).contiguous()
 
 
 class LlavaNextMultiModalProjector(nn.Module):
-
-    def __init__(self, vision_hidden_size: int, text_hidden_size: int,
-                 projector_hidden_act: str, multimodal_projector_bias: bool):
+    def __init__(
+        self,
+        vision_hidden_size: int,
+        text_hidden_size: int,
+        projector_hidden_act: str,
+        multimodal_projector_bias: bool,
+    ):
         super().__init__()
 
-        self.linear_1 = nn.Linear(vision_hidden_size,
-                                  text_hidden_size,
-                                  bias=multimodal_projector_bias)
+        self.linear_1 = nn.Linear(
+            vision_hidden_size, text_hidden_size, bias=multimodal_projector_bias
+        )
         self.act = get_act_fn(projector_hidden_act)
-        self.linear_2 = nn.Linear(text_hidden_size,
-                                  text_hidden_size,
-                                  bias=multimodal_projector_bias)
+        self.linear_2 = nn.Linear(
+            text_hidden_size, text_hidden_size, bias=multimodal_projector_bias
+        )
 
     def forward(self, image_features: torch.Tensor) -> torch.Tensor:
         hidden_states = self.linear_1(image_features)
@@ -280,9 +299,7 @@ def forward(self, image_features: torch.Tensor) -> torch.Tensor:
     info=LlavaNextVideoProcessingInfo,
     dummy_inputs=LlavaNextVideoDummyInputsBuilder,
 )
-class LlavaNextVideoForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                             SupportsPP):
-
+class LlavaNextVideoForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP):
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_prefix={
             # mapping for new names in checkpoint saved after transformers v4.52
@@ -291,7 +308,8 @@ class LlavaNextVideoForConditionalGeneration(nn.Module, SupportsMultiModal,
             "model.multi_modal_projector.": "multi_modal_projector.",
             "model.image_newline": "image_newline",
             "lm_head.": "language_model.lm_head.",
-        })
+        }
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -316,13 +334,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
             config,
             quant_config,
             require_post_norm=False,
-            prefix=maybe_prefix(prefix, "vision_tower"))
+            prefix=maybe_prefix(prefix, "vision_tower"),
+        )
         self.vision_resampler = LlavaNextVideoPooler(config)
         self.multi_modal_projector = LlavaNextMultiModalProjector(
             vision_hidden_size=config.vision_config.hidden_size,
             text_hidden_size=config.text_config.hidden_size,
             projector_hidden_act=config.projector_hidden_act,
-            multimodal_projector_bias=config.multimodal_projector_bias)
+            multimodal_projector_bias=config.multimodal_projector_bias,
+        )
         self.language_model = init_vllm_registered_model(
             vllm_config=vllm_config,
             hf_config=config.text_config,
@@ -330,14 +350,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.model.make_empty_intermediate_tensors)
+            self.language_model.model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_video_input(
-            self, **kwargs: object) -> Optional[LlavaNextVideoPixelInputs]:
+        self, **kwargs: object
+    ) -> Optional[LlavaNextVideoPixelInputs]:
         """
         A legal video input should have the following dimensions:
         {
-            "pixel_values_videos" : 
+            "pixel_values_videos" :
                 list[b, Tensor(nb_frames, nb_channels, height, width)]
         }
         """
@@ -347,12 +369,14 @@ def _parse_and_validate_video_input(
             return None
 
         expected_h = expected_w = self.config.vision_config.image_size
-        return LlavaNextVideoPixelInputs(type="pixel_values_videos",
-                                         data=pixel_values_videos,
-                                         resolve_bindings={
-                                             "h": expected_h,
-                                             "w": expected_w,
-                                         })
+        return LlavaNextVideoPixelInputs(
+            type="pixel_values_videos",
+            data=pixel_values_videos,
+            resolve_bindings={
+                "h": expected_h,
+                "w": expected_w,
+            },
+        )
 
     def _video_pixels_to_features(
         self,
@@ -377,31 +401,31 @@ def _process_video_pixels(self, inputs: LlavaNextVideoPixelInputs):
         if isinstance(video_pixels, torch.Tensor):
             # TODO: support multiple videos per input
             b, num_videos, num_frames, c, h, w = video_pixels.shape
-            assert (num_videos == 1)
-            stacked_pixels = video_pixels.view(b * num_videos * num_frames, c,
-                                               h, w)
+            assert num_videos == 1
+            stacked_pixels = video_pixels.view(b * num_videos * num_frames, c, h, w)
             stacked_embeddings = self._video_pixels_to_features(
-                self.vision_tower, stacked_pixels)
-            embeds = stacked_embeddings.view(b, num_frames,
-                                             *stacked_embeddings.shape[1:])
+                self.vision_tower, stacked_pixels
+            )
+            embeds = stacked_embeddings.view(
+                b, num_frames, *stacked_embeddings.shape[1:]
+            )
 
         elif is_list_of(video_pixels, torch.Tensor):
             frames_per_videos = [v.shape[0] for v in video_pixels]
             stacked_pixels = torch.cat(video_pixels, dim=0)
             stacked_embeddings = self._video_pixels_to_features(
-                self.vision_tower, stacked_pixels)
+                self.vision_tower, stacked_pixels
+            )
             embeds = torch.split(stacked_embeddings, frames_per_videos, dim=0)
         else:
-            raise ValueError(
-                f"Unsupported type of video input {type(video_pixels)}")
+            raise ValueError(f"Unsupported type of video input {type(video_pixels)}")
 
         return [e.flatten(0, 1) for e in embeds]
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         video_input = self._parse_and_validate_video_input(**kwargs)
         if video_input is None:
             return []
@@ -425,10 +449,9 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.language_model.model(input_ids,
-                                                  positions,
-                                                  intermediate_tensors,
-                                                  inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
 
         return hidden_states
 
@@ -438,8 +461,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
             # This model doesn't support images for now
diff --git a/vllm/model_executor/models/llava_onevision.py b/vllm/model_executor/models/llava_onevision.py
index 4379f24da1bf..643854ef7c16 100644
--- a/vllm/model_executor/models/llava_onevision.py
+++ b/vllm/model_executor/models/llava_onevision.py
@@ -7,19 +7,27 @@
 
 import torch
 import torch.nn as nn
-from transformers import (BatchFeature, LlavaOnevisionConfig,
-                          LlavaOnevisionProcessor)
+from transformers import BatchFeature, LlavaOnevisionConfig, LlavaOnevisionProcessor
 from transformers.models.llava_onevision.modeling_llava_onevision import (
-    get_anyres_image_grid_shape, unpad_image)
+    get_anyres_image_grid_shape,
+    unpad_image,
+)
 
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
-from vllm.multimodal.parse import (ImageSize, MultiModalDataItems,
-                                   VideoEmbeddingItems, VideoProcessorItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
+from vllm.multimodal.parse import (
+    ImageSize,
+    MultiModalDataItems,
+    VideoEmbeddingItems,
+    VideoProcessorItems,
+)
 from vllm.multimodal.processing import PromptReplacement, PromptUpdate
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
@@ -27,11 +35,19 @@
 from .clip import CLIPVisionModel
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
 from .llava import LlavaDummyInputsBuilder, init_vision_tower_for_llava
-from .llava_next import (BaseLlavaNextMultiModalProcessor, LlavaNextLikeConfig,
-                         LlavaNextProcessingInfo)
+from .llava_next import (
+    BaseLlavaNextMultiModalProcessor,
+    LlavaNextLikeConfig,
+    LlavaNextProcessingInfo,
+)
 from .siglip import SiglipVisionModel
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
-                    init_vllm_registered_model, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 
 # For profile run
 _MAX_FRAMES_PER_VIDEO = 16
@@ -50,6 +66,7 @@ class LlavaOnevisionVideoPixelInputs(TensorSchema):
         may be different for each video, in which case the data is passed as a
         list instead of a batched tensor.
     """
+
     type: Literal["pixel_values_videos"] = "pixel_values_videos"
 
     pixel_values_videos: Annotated[
@@ -70,6 +87,7 @@ class LlavaOnevisionImagePixelInputs(TensorSchema):
         Note that `num_patches` may be different per batch and image,
         in which case the data is passed as a list instead of a batched tensor.
     """
+
     type: Literal["pixel_values"] = "pixel_values"
 
     pixel_values: Annotated[
@@ -87,6 +105,7 @@ class LlavaOnevisionImageEmbeddingInputs(TensorSchema):
         - ifs: Image feature size
         - hs: Hidden size (must match language model backbone)
     """
+
     type: Literal["image_embeds"] = "image_embeds"
 
     data: Annotated[
@@ -95,11 +114,13 @@ class LlavaOnevisionImageEmbeddingInputs(TensorSchema):
     ]
 
 
-LlavaOnevisionImageInputs = Union[LlavaOnevisionImagePixelInputs,
-                                  LlavaOnevisionImageEmbeddingInputs]
+LlavaOnevisionImageInputs = Union[
+    LlavaOnevisionImagePixelInputs, LlavaOnevisionImageEmbeddingInputs
+]
 
-LlavaOnevisionMultiInputs = Union[LlavaOnevisionImageInputs,
-                                  LlavaOnevisionVideoPixelInputs]
+LlavaOnevisionMultiInputs = Union[
+    LlavaOnevisionImageInputs, LlavaOnevisionVideoPixelInputs
+]
 
 
 class LlavaOnevisionLikeConfig(LlavaNextLikeConfig, Protocol):
@@ -107,7 +128,6 @@ class LlavaOnevisionLikeConfig(LlavaNextLikeConfig, Protocol):
 
 
 class LlavaOnevisionProcessingInfo(LlavaNextProcessingInfo):
-
     def get_hf_config(self) -> LlavaOnevisionLikeConfig:
         return self.ctx.get_hf_config(LlavaOnevisionConfig)
 
@@ -136,12 +156,14 @@ def _get_num_unpadded_features(
 
         if aspect_ratio > current_aspect_ratio:
             new_height = int(
-                round(original_height * (current_width / original_width), 7))
+                round(original_height * (current_width / original_width), 7)
+            )
             padding = (current_height - new_height) // 2
             current_height = current_height - (2 * padding)
         else:
             new_width = int(
-                round(original_width * (current_height / original_height), 7))
+                round(original_width * (current_height / original_height), 7)
+            )
             padding = (current_width - new_width) // 2
             current_width = current_width - (2 * padding)
 
@@ -218,8 +240,9 @@ def get_num_frames_with_most_features(
         max_videos = mm_counts.get("video", 0)
 
         max_total_frames = self._get_max_video_frames(seq_len)
-        max_frames_per_video = min(max_total_frames // max(max_videos, 1),
-                                   _MAX_FRAMES_PER_VIDEO)
+        max_frames_per_video = min(
+            max_total_frames // max(max_videos, 1), _MAX_FRAMES_PER_VIDEO
+        )
 
         return max(max_frames_per_video, 1)
 
@@ -233,14 +256,13 @@ def get_max_video_tokens(
         return self.get_num_video_tokens(
             image_width=target_width,
             image_height=target_height,
-            num_frames=self.get_num_frames_with_most_features(
-                seq_len, mm_counts),
+            num_frames=self.get_num_frames_with_most_features(seq_len, mm_counts),
         )
 
 
 class LlavaOnevisionDummyInputsBuilder(
-        LlavaDummyInputsBuilder[LlavaOnevisionProcessingInfo]):
-
+    LlavaDummyInputsBuilder[LlavaOnevisionProcessingInfo]
+):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -260,35 +282,34 @@ def get_dummy_mm_data(
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
 
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
-        target_num_frames = \
-            self.info.get_num_frames_with_most_features(seq_len,
-                                                        mm_counts)
+        target_width, target_height = self.info.get_image_size_with_most_features()
+        target_num_frames = self.info.get_num_frames_with_most_features(
+            seq_len, mm_counts
+        )
 
         image_overrides = mm_options.get("image") if mm_options else None
         video_overrides = mm_options.get("video") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
-            "video":
-            self._get_dummy_videos(
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
+            "video": self._get_dummy_videos(
                 width=target_width,
                 height=target_height,
                 num_frames=target_num_frames,
                 num_videos=num_videos,
                 overrides=video_overrides,
-            )
+            ),
         }
 
 
 class LlavaOnevisionMultiModalProcessor(
-        BaseLlavaNextMultiModalProcessor[LlavaOnevisionProcessingInfo]):
-
+    BaseLlavaNextMultiModalProcessor[LlavaOnevisionProcessingInfo]
+):
     def _get_mm_fields_config(
         self,
         hf_inputs: BatchFeature,
@@ -405,7 +426,8 @@ def _get_prompt_updates(
 
         def get_video_replacement(item_idx: int):
             videos = mm_items.get_items(
-                "video", (VideoEmbeddingItems, VideoProcessorItems))
+                "video", (VideoEmbeddingItems, VideoProcessorItems)
+            )
 
             if isinstance(videos, VideoEmbeddingItems):
                 num_video_tokens = videos.get_feature_size(item_idx)
@@ -430,17 +452,20 @@ def get_video_replacement(item_idx: int):
 
 
 class LlavaOnevisionMultiModalProjector(nn.Module):
-
     def __init__(self, config: LlavaOnevisionConfig):
         super().__init__()
 
-        self.linear_1 = nn.Linear(config.vision_config.hidden_size,
-                                  config.text_config.hidden_size,
-                                  bias=config.multimodal_projector_bias)
+        self.linear_1 = nn.Linear(
+            config.vision_config.hidden_size,
+            config.text_config.hidden_size,
+            bias=config.multimodal_projector_bias,
+        )
         self.act = get_act_fn(config.projector_hidden_act)
-        self.linear_2 = nn.Linear(config.text_config.hidden_size,
-                                  config.text_config.hidden_size,
-                                  bias=config.multimodal_projector_bias)
+        self.linear_2 = nn.Linear(
+            config.text_config.hidden_size,
+            config.text_config.hidden_size,
+            bias=config.multimodal_projector_bias,
+        )
 
     def forward(self, image_features: torch.Tensor) -> torch.Tensor:
         hidden_states = self.linear_1(image_features)
@@ -452,10 +477,9 @@ def forward(self, image_features: torch.Tensor) -> torch.Tensor:
 @MULTIMODAL_REGISTRY.register_processor(
     LlavaOnevisionMultiModalProcessor,
     info=LlavaOnevisionProcessingInfo,
-    dummy_inputs=LlavaOnevisionDummyInputsBuilder)
-class LlavaOnevisionForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                             SupportsPP):
-
+    dummy_inputs=LlavaOnevisionDummyInputsBuilder,
+)
+class LlavaOnevisionForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP):
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_prefix={
             # mapping for new names in checkpoint saved after transformers v4.52
@@ -464,7 +488,8 @@ class LlavaOnevisionForConditionalGeneration(nn.Module, SupportsMultiModal,
             "model.multi_modal_projector.": "multi_modal_projector.",
             "model.image_newline": "image_newline",
             "lm_head.": "language_model.lm_head.",
-        })
+        }
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -489,21 +514,23 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
             config,
             quant_config,
             require_post_norm=False,
-            prefix=maybe_prefix(prefix, "vision_tower"))
+            prefix=maybe_prefix(prefix, "vision_tower"),
+        )
         self.multi_modal_projector = LlavaOnevisionMultiModalProjector(config)
         self.language_model = init_vllm_registered_model(
             vllm_config=vllm_config,
             hf_config=config.text_config,
             prefix=maybe_prefix(prefix, "language_model"),
         )
-        self.image_newline = nn.Parameter(
-            torch.empty(config.text_config.hidden_size))
+        self.image_newline = nn.Parameter(torch.empty(config.text_config.hidden_size))
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.model.make_empty_intermediate_tensors)
+            self.language_model.model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[LlavaOnevisionImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[LlavaOnevisionImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_sizes = kwargs.pop("image_sizes", None)
         image_embeds = kwargs.pop("image_embeds", None)
@@ -513,12 +540,14 @@ def _parse_and_validate_image_input(
 
         if pixel_values is not None:
             if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values)}")
+                raise ValueError(
+                    f"Incorrect type of pixel values. Got type: {type(pixel_values)}"
+                )
 
             if not isinstance(image_sizes, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image sizes. "
-                                 f"Got type: {type(image_sizes)}")
+                raise ValueError(
+                    f"Incorrect type of image sizes. Got type: {type(image_sizes)}"
+                )
 
             return LlavaOnevisionImagePixelInputs(
                 type="pixel_values",
@@ -526,13 +555,15 @@ def _parse_and_validate_image_input(
                 image_sizes=flatten_bn(image_sizes, concat=True),
                 resolve_bindings={
                     "h": self.config.vision_config.image_size,
-                    "w": self.config.vision_config.image_size
-                })
+                    "w": self.config.vision_config.image_size,
+                },
+            )
 
         if image_embeds is not None:
             if not isinstance(image_embeds, torch.Tensor):
-                raise ValueError("Incorrect type of image embeds. "
-                                 f"Got type: {type(image_embeds)}")
+                raise ValueError(
+                    f"Incorrect type of image embeds. Got type: {type(image_embeds)}"
+                )
 
             return LlavaOnevisionImageEmbeddingInputs(
                 type="image_embeds",
@@ -542,12 +573,12 @@ def _parse_and_validate_image_input(
         raise AssertionError("This line should be unreachable.")
 
     def _parse_and_validate_video_input(
-            self,
-            **kwargs: object) -> Optional[LlavaOnevisionVideoPixelInputs]:
+        self, **kwargs: object
+    ) -> Optional[LlavaOnevisionVideoPixelInputs]:
         """
         A legal video input should have the following dimensions:
         {
-            "pixel_values_videos" : 
+            "pixel_values_videos" :
                 list[b, Tensor(nb_frames, nb_channels, height, width)]
         }
         """
@@ -556,16 +587,19 @@ def _parse_and_validate_video_input(
             return None
 
         if not isinstance(pixel_values_videos, (torch.Tensor, list)):
-            raise ValueError("Incorrect type of pixel_values_videos. "
-                             f"Got type: {type(pixel_values_videos)}")
+            raise ValueError(
+                "Incorrect type of pixel_values_videos. "
+                f"Got type: {type(pixel_values_videos)}"
+            )
 
         return LlavaOnevisionVideoPixelInputs(
             type="pixel_values_videos",
             pixel_values_videos=flatten_bn(pixel_values_videos),
             resolve_bindings={
                 "h": self.config.vision_config.image_size,
-                "w": self.config.vision_config.image_size
-            })
+                "w": self.config.vision_config.image_size,
+            },
+        )
 
     def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         mm_input_by_modality = {}
@@ -573,14 +607,20 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if input_key in ("pixel_values", "image_embeds"
-                             ) and "image" not in mm_input_by_modality:
-                mm_input_by_modality[
-                    "image"] = self._parse_and_validate_image_input(**kwargs)
-            if input_key in ("pixel_values_videos", "video_embeds"
-                             ) and "video" not in mm_input_by_modality:
-                mm_input_by_modality[
-                    "video"] = self._parse_and_validate_video_input(**kwargs)
+            if (
+                input_key in ("pixel_values", "image_embeds")
+                and "image" not in mm_input_by_modality
+            ):
+                mm_input_by_modality["image"] = self._parse_and_validate_image_input(
+                    **kwargs
+                )
+            if (
+                input_key in ("pixel_values_videos", "video_embeds")
+                and "video" not in mm_input_by_modality
+            ):
+                mm_input_by_modality["video"] = self._parse_and_validate_video_input(
+                    **kwargs
+                )
 
         return mm_input_by_modality
 
@@ -597,25 +637,29 @@ def _image_pixels_to_features(
         )
 
     # Based on: https://github.com/haotian-liu/LLaVA/blob/main/llava/model/llava_arch.py
-    def _merge_image_patch_embeddings(self,
-                                      image_size: torch.Tensor,
-                                      patch_embeddings: torch.Tensor,
-                                      *,
-                                      image_newline=None,
-                                      vision_aspect_ratio="anyres_max_9",
-                                      strategy: str) -> torch.Tensor:
+    def _merge_image_patch_embeddings(
+        self,
+        image_size: torch.Tensor,
+        patch_embeddings: torch.Tensor,
+        *,
+        image_newline=None,
+        vision_aspect_ratio="anyres_max_9",
+        strategy: str,
+    ) -> torch.Tensor:
         if strategy == "flat":
             return patch_embeddings.flatten(0, 1)
 
         if strategy.startswith("spatial"):
-            height = width = self.config.vision_config.image_size \
+            height = width = (
+                self.config.vision_config.image_size
                 // self.config.vision_config.patch_size
+            )
 
             base_patch_embeds = patch_embeddings[0]
             if height * width != base_patch_embeds.shape[0]:
                 raise ValueError(
-                    "The number of patches is not consistent with the "
-                    "image size.")
+                    "The number of patches is not consistent with the image size."
+                )
 
             if patch_embeddings.shape[0] > 1:
                 other_patch_embeds = patch_embeddings[1:]
@@ -632,53 +676,66 @@ def _merge_image_patch_embeddings(self,
                 num_patches = num_patch_height * num_patch_width
 
                 # Image patches might be padded for batch processing
-                other_patch_embeds = other_patch_embeds[:num_patches] \
-                    .view(num_patch_height, num_patch_width, height, width, -1)
+                other_patch_embeds = other_patch_embeds[:num_patches].view(
+                    num_patch_height, num_patch_width, height, width, -1
+                )
 
                 if "unpad" in strategy:
-                    other_patch_embeds = other_patch_embeds \
-                        .permute(4, 0, 2, 1, 3).contiguous() \
-                        .flatten(1, 2).flatten(2, 3)
-                    other_patch_embeds = unpad_image(other_patch_embeds,
-                                                     (orig_height, orig_width))
+                    other_patch_embeds = (
+                        other_patch_embeds.permute(4, 0, 2, 1, 3)
+                        .contiguous()
+                        .flatten(1, 2)
+                        .flatten(2, 3)
+                    )
+                    other_patch_embeds = unpad_image(
+                        other_patch_embeds, (orig_height, orig_width)
+                    )
                     max_num_patches = int(
-                        vision_aspect_ratio.removeprefix("anyres_max_"))
+                        vision_aspect_ratio.removeprefix("anyres_max_")
+                    )
                     channels, curr_height, curr_width = other_patch_embeds.shape
-                    ratio = math.sqrt(curr_height * curr_width /
-                                      (max_num_patches * height**2))
+                    ratio = math.sqrt(
+                        curr_height * curr_width / (max_num_patches * height**2)
+                    )
                     if ratio > 1.1:
                         other_patch_embeds = other_patch_embeds[None]
                         other_patch_embeds = nn.functional.interpolate(
-                            other_patch_embeds, [
-                                int(curr_height // ratio),
-                                int(curr_width // ratio)
-                            ],
-                            mode="bilinear")[0]
+                            other_patch_embeds,
+                            [int(curr_height // ratio), int(curr_width // ratio)],
+                            mode="bilinear",
+                        )[0]
                     if image_newline is not None:
                         other_patch_embeds = torch.cat(
                             (
                                 other_patch_embeds,
-                                image_newline[:, None, None] \
-                                .expand(*other_patch_embeds.shape[:-1], 1) \
+                                image_newline[:, None, None]
+                                .expand(*other_patch_embeds.shape[:-1], 1)
                                 .to(other_patch_embeds.device),
                             ),
-                        dim=-1)
-                    other_patch_embeds = other_patch_embeds \
-                        .flatten(1, 2).transpose(0, 1)
+                            dim=-1,
+                        )
+                    other_patch_embeds = other_patch_embeds.flatten(1, 2).transpose(
+                        0, 1
+                    )
                 else:
-                    other_patch_embeds = other_patch_embeds \
-                        .permute(0, 2, 1, 3, 4).contiguous() \
+                    other_patch_embeds = (
+                        other_patch_embeds.permute(0, 2, 1, 3, 4)
+                        .contiguous()
                         .flatten(0, 3)
+                    )
 
                 merged_patch_embeddings = torch.cat(
-                    (base_patch_embeds, other_patch_embeds), dim=0)
+                    (base_patch_embeds, other_patch_embeds), dim=0
+                )
             else:
                 if "unpad" in strategy:
                     merged_patch_embeddings = torch.cat(
-                        (base_patch_embeds,
-                         self.image_newline[None] \
-                            .to(base_patch_embeds.device)
-                    ), dim=0)
+                        (
+                            base_patch_embeds,
+                            self.image_newline[None].to(base_patch_embeds.device),
+                        ),
+                        dim=0,
+                    )
                 else:
                     merged_patch_embeddings = base_patch_embeds
 
@@ -698,21 +755,27 @@ def _process_image_pixels(
             b, num_patches, c, h, w = pixel_values.shape
             stacked_pixel_values = pixel_values.view(b * num_patches, c, h, w)
             stacked_image_features = self._image_pixels_to_features(
-                self.vision_tower, stacked_pixel_values)
+                self.vision_tower, stacked_pixel_values
+            )
             stacked_patch_embeddings = self.multi_modal_projector(
-                stacked_image_features)
+                stacked_image_features
+            )
 
             return stacked_patch_embeddings.view(
-                b, num_patches, *stacked_patch_embeddings.shape[1:])
+                b, num_patches, *stacked_patch_embeddings.shape[1:]
+            )
 
         num_patches_per_batch = [v.shape[0] for v in pixel_values]
         stacked_pixel_values = torch.cat(pixel_values)
         stacked_image_features = self._image_pixels_to_features(
-            self.vision_tower, stacked_pixel_values)
+            self.vision_tower, stacked_pixel_values
+        )
 
         return [
-            self.multi_modal_projector(image_features) for image_features in
-            torch.split(stacked_image_features, num_patches_per_batch)
+            self.multi_modal_projector(image_features)
+            for image_features in torch.split(
+                stacked_image_features, num_patches_per_batch
+            )
         ]
 
     def _process_image_input(
@@ -729,15 +792,17 @@ def _process_image_input(
             batch_size = len(image_input["pixel_values"])
             vision_config = self.config.vision_config
             default_height = default_width = vision_config.image_size
-            image_sizes = torch.as_tensor([[default_height, default_width]
-                                           for _ in range(batch_size)])
+            image_sizes = torch.as_tensor(
+                [[default_height, default_width] for _ in range(batch_size)]
+            )
 
         return [
             self._merge_image_patch_embeddings(
                 image_sizes[i],
                 patch_features_batch,
                 image_newline=self.image_newline,
-                strategy="spatial_unpad")
+                strategy="spatial_unpad",
+            )
             for i, patch_features_batch in enumerate(patch_embeddings)
         ]
 
@@ -763,36 +828,39 @@ def _process_video_pixels(self, inputs: LlavaOnevisionVideoPixelInputs):
 
         if isinstance(video_pixels, torch.Tensor):
             total_videos, frames, c, h, w = video_pixels.shape
-            video_pixels_flat = video_pixels.view(total_videos * frames, c, h,
-                                                  w)
+            video_pixels_flat = video_pixels.view(total_videos * frames, c, h, w)
 
             embeddings_flat = self._video_pixels_to_features(
-                self.vision_tower, video_pixels_flat)
+                self.vision_tower, video_pixels_flat
+            )
 
             embeddings_flat = embeddings_flat.reshape(
-                total_videos, frames * embeddings_flat.shape[1], -1)
+                total_videos, frames * embeddings_flat.shape[1], -1
+            )
 
             image_newline = self.image_newline[None, None, :].expand(
-                total_videos, -1, -1)
+                total_videos, -1, -1
+            )
             return torch.cat((embeddings_flat, image_newline), dim=1)
 
         frames_per_video = [len(video) for video in video_pixels]
         video_pixels_flat = torch.cat(video_pixels)
 
         embeddings_flat = self._video_pixels_to_features(
-            self.vision_tower, video_pixels_flat)
+            self.vision_tower, video_pixels_flat
+        )
 
         image_newline = self.image_newline[None, None, :]
 
         return [
             torch.cat(
                 (
-                    embeds.reshape(1, num_frame * embeddings_flat.shape[1],
-                                   -1),
+                    embeds.reshape(1, num_frame * embeddings_flat.shape[1], -1),
                     image_newline,
                 ),
                 dim=1,
-            ) for num_frame, embeds in zip(
+            )
+            for num_frame, embeds in zip(
                 frames_per_video,
                 torch.split(embeddings_flat, frames_per_video),
             )
@@ -808,9 +876,9 @@ def apply_pooling(self, image_features: torch.Tensor, stride: int = 2):
         # TODO support other pooling types config
         height, width = image_features.shape[2:]
         scaled_shape = [math.ceil(height / stride), math.ceil(width / stride)]
-        image_feature = nn.functional.interpolate(image_features,
-                                                  size=scaled_shape,
-                                                  mode='bilinear')
+        image_feature = nn.functional.interpolate(
+            image_features, size=scaled_shape, mode="bilinear"
+        )
         image_feature = image_feature.permute(0, 2, 3, 1)
         image_feature = image_feature.view(batch_frames, -1, dim)
         return image_feature
@@ -818,10 +886,8 @@ def apply_pooling(self, image_features: torch.Tensor, stride: int = 2):
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
-        mm_input_by_modality = self._parse_and_validate_multimodal_inputs(
-            **kwargs)
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+        mm_input_by_modality = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not mm_input_by_modality:
             return []
             return None
@@ -860,10 +926,9 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.language_model.model(input_ids,
-                                                  positions,
-                                                  intermediate_tensors,
-                                                  inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
 
         return hidden_states
 
@@ -873,7 +938,6 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
diff --git a/vllm/model_executor/models/longcat_flash.py b/vllm/model_executor/models/longcat_flash.py
index 78e6e3d4b535..5020da37df89 100644
--- a/vllm/model_executor/models/longcat_flash.py
+++ b/vllm/model_executor/models/longcat_flash.py
@@ -32,6 +32,7 @@
 # OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
 # SOFTWARE.
 """Inference-only Flash model compatible with HuggingFace weights."""
+
 import typing
 from collections.abc import Callable, Iterable
 from typing import Optional, Union
@@ -47,29 +48,37 @@
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
-from vllm.model_executor.layers.quantization.utils.int8_utils import (
-    block_dequant)
+from vllm.model_executor.layers.quantization.utils.int8_utils import block_dequant
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.deepseek_v2 import DeepseekV2MLAAttention
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (PPMissingLayer, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
 
 class FlashConfig(PretrainedConfig):
     """Flash model configuration."""
+
     model_type = "longcat_flash"
     keys_to_ignore_at_inference = ["past_key_values"]
 
@@ -132,8 +141,9 @@ def __init__(
         self.vocab_size = vocab_size
         self.max_position_embeddings = max_position_embeddings
         self.hidden_size = hidden_size
-        self.num_hidden_layers = (num_hidden_layers if num_hidden_layers
-                                  is not None else num_layers)
+        self.num_hidden_layers = (
+            num_hidden_layers if num_hidden_layers is not None else num_layers
+        )
         self.num_attention_heads = num_attention_heads
         self.ep_size = ep_size
         self.kv_lora_rank = kv_lora_rank
@@ -162,8 +172,11 @@ def __init__(
         self.zero_expert_type = zero_expert_type
         self.routed_scaling_factor = routed_scaling_factor
         self.hidden_act = "silu"
-        self.intermediate_size = self.ffn_hidden_size if hasattr(
-            self, "ffn_hidden_size") else self.intermediate_size
+        self.intermediate_size = (
+            self.ffn_hidden_size
+            if hasattr(self, "ffn_hidden_size")
+            else self.intermediate_size
+        )
         if hasattr(self, "moe_intermediate_size"):
             self.moe_intermediate_size = self.moe_intermediate_size
         elif hasattr(self, "expert_ffn_hidden_size"):
@@ -201,8 +214,9 @@ def __init__(
             prefix=f"{prefix}.down_proj",
         )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -216,15 +230,19 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class LongcatRouter(nn.Module):
-
-    def __init__(self,
-                 config,
-                 zero_expert_num=0,
-                 rounter_params_dtype=torch.bfloat16,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config,
+        zero_expert_num=0,
+        rounter_params_dtype=torch.bfloat16,
+        prefix: str = "",
+    ):
         super().__init__()
-        self.n_routed_experts = config.n_routed_experts if hasattr(
-            config, "n_routed_experts") else config.num_experts[0]
+        self.n_routed_experts = (
+            config.n_routed_experts
+            if hasattr(config, "n_routed_experts")
+            else config.num_experts[0]
+        )
         self.n_routed_experts = self.n_routed_experts + zero_expert_num
         self.classifier = ReplicatedLinear(
             config.hidden_size,
@@ -235,7 +253,8 @@ def __init__(self,
             prefix=f"{prefix}.classifier",
         )
         self.e_score_correction_bias = nn.Parameter(
-            torch.zeros((self.n_routed_experts), dtype=rounter_params_dtype))
+            torch.zeros((self.n_routed_experts), dtype=rounter_params_dtype)
+        )
 
     def forward(self, hidden_states):
         logits, _ = self.classifier(hidden_states)
@@ -243,7 +262,6 @@ def forward(self, hidden_states):
 
 
 class LongcatMoe(nn.Module):
-
     def __init__(
         self,
         config: FlashConfig,
@@ -271,7 +289,8 @@ def __init__(
             config=config,
             zero_expert_num=self.zero_expert_num,
             rounter_params_dtype=self.rounter_params_dtype,
-            prefix=f"{prefix}.gate")
+            prefix=f"{prefix}.gate",
+        )
 
         self.experts = FusedMoE(
             num_experts=num_experts,
@@ -291,14 +310,13 @@ def __init__(
         )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
-
         num_tokens, hidden_dim = hidden_states.shape
         hidden_states = hidden_states.view(-1, hidden_dim)
 
-        router_logits = self.router(hidden_states.to(
-            self.rounter_params_dtype))
-        final_hidden_states = self.experts(hidden_states=hidden_states,
-                                           router_logits=router_logits)
+        router_logits = self.router(hidden_states.to(self.rounter_params_dtype))
+        final_hidden_states = self.experts(
+            hidden_states=hidden_states, router_logits=router_logits
+        )
 
         return final_hidden_states.view(num_tokens, hidden_dim)
 
@@ -316,67 +334,76 @@ def __init__(
         enable_eplb: bool = False,
     ) -> None:
         super().__init__()
-        self.layer_idx = int(prefix.split(sep='.')[-1])
+        self.layer_idx = int(prefix.split(sep=".")[-1])
         self.hidden_size = config.hidden_size
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         if rope_scaling is not None and getattr(
-                config, "original_max_position_embeddings", None):
+            config, "original_max_position_embeddings", None
+        ):
             rope_scaling["original_max_position_embeddings"] = (
-                config.original_max_position_embeddings)
+                config.original_max_position_embeddings
+            )
 
         # Dual attention structure
-        self.self_attn = nn.ModuleList([
-            DeepseekV2MLAAttention(
-                vllm_config=vllm_config,
-                config=config,
-                hidden_size=self.hidden_size,
-                num_heads=config.num_attention_heads,
-                qk_nope_head_dim=config.qk_nope_head_dim,
-                qk_rope_head_dim=config.qk_rope_head_dim,
-                v_head_dim=config.v_head_dim,
-                q_lora_rank=(config.q_lora_rank if hasattr(
-                    config, "q_lora_rank") else None),
-                kv_lora_rank=config.kv_lora_rank,
-                rope_theta=rope_theta,
-                rope_scaling=rope_scaling,
-                max_position_embeddings=max_position_embeddings,
-                cache_config=cache_config,
-                quant_config=None if "self_attn" in getattr(
-                    config, "disable_quant_module", []) else quant_config,
-                prefix=f"{prefix}.self_attn.{i}",
-            ) for i in range(2)
-        ])
-        self.input_layernorm = nn.ModuleList([
-            RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-            for i in range(2)
-        ])
-        self.post_attention_layernorm = nn.ModuleList([
-            RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-            for i in range(2)
-        ])
+        self.self_attn = nn.ModuleList(
+            [
+                DeepseekV2MLAAttention(
+                    vllm_config=vllm_config,
+                    config=config,
+                    hidden_size=self.hidden_size,
+                    num_heads=config.num_attention_heads,
+                    qk_nope_head_dim=config.qk_nope_head_dim,
+                    qk_rope_head_dim=config.qk_rope_head_dim,
+                    v_head_dim=config.v_head_dim,
+                    q_lora_rank=(
+                        config.q_lora_rank if hasattr(config, "q_lora_rank") else None
+                    ),
+                    kv_lora_rank=config.kv_lora_rank,
+                    rope_theta=rope_theta,
+                    rope_scaling=rope_scaling,
+                    max_position_embeddings=max_position_embeddings,
+                    cache_config=cache_config,
+                    quant_config=None
+                    if "self_attn" in getattr(config, "disable_quant_module", [])
+                    else quant_config,
+                    prefix=f"{prefix}.self_attn.{i}",
+                )
+                for i in range(2)
+            ]
+        )
+        self.input_layernorm = nn.ModuleList(
+            [RMSNorm(config.hidden_size, eps=config.rms_norm_eps) for i in range(2)]
+        )
+        self.post_attention_layernorm = nn.ModuleList(
+            [RMSNorm(config.hidden_size, eps=config.rms_norm_eps) for i in range(2)]
+        )
 
         # Dual MLP structure
-        self.mlps = nn.ModuleList([
-            FlashMLP(
-                hidden_size=self.hidden_size,
-                intermediate_size=config.intermediate_size,
-                hidden_act=config.hidden_act,
-                quant_config=None if "mlps" in getattr(
-                    config, "disable_quant_module", []) else quant_config,
-                prefix=f"{prefix}.mlps.{i}",
-            ) for i in range(2)
-        ])
+        self.mlps = nn.ModuleList(
+            [
+                FlashMLP(
+                    hidden_size=self.hidden_size,
+                    intermediate_size=config.intermediate_size,
+                    hidden_act=config.hidden_act,
+                    quant_config=None
+                    if "mlps" in getattr(config, "disable_quant_module", [])
+                    else quant_config,
+                    prefix=f"{prefix}.mlps.{i}",
+                )
+                for i in range(2)
+            ]
+        )
 
         self.mlp = LongcatMoe(
             config=config,
-            num_experts=config.n_routed_experts if hasattr(
-                config, "n_routed_experts") else
-            config.num_experts[self.layer_idx],
+            num_experts=config.n_routed_experts
+            if hasattr(config, "n_routed_experts")
+            else config.num_experts[self.layer_idx],
             top_k=config.moe_topk
-            if hasattr(config, "moe_topk") else config.num_experts_per_tok,
+            if hasattr(config, "moe_topk")
+            else config.num_experts_per_tok,
             hidden_size=config.hidden_size,
             intermediate_size=config.moe_intermediate_size,
             quant_config=quant_config,
@@ -389,13 +416,11 @@ def forward(
         hidden_states: torch.Tensor,
         residual: Optional[torch.Tensor],
     ) -> tuple[torch.Tensor, torch.Tensor]:
-
         if residual is None:
             residual = hidden_states
             hidden_states = self.input_layernorm[0](hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm[0](hidden_states,
-                                                              residual)
+            hidden_states, residual = self.input_layernorm[0](hidden_states, residual)
 
         hidden_states = self.self_attn[0](
             positions=positions,
@@ -403,7 +428,8 @@ def forward(
         )
 
         hidden_states, residual = self.post_attention_layernorm[0](
-            hidden_states, residual)
+            hidden_states, residual
+        )
 
         # moe
         hidden_states_copy = hidden_states.clone()
@@ -412,8 +438,7 @@ def forward(
         # first mlp
         hidden_states = self.mlps[0](hidden_states)
 
-        hidden_states, residual = self.input_layernorm[1](hidden_states,
-                                                          residual)
+        hidden_states, residual = self.input_layernorm[1](hidden_states, residual)
 
         # second_attn
         hidden_states = self.self_attn[1](
@@ -421,7 +446,8 @@ def forward(
             hidden_states=hidden_states,
         )
         hidden_states, residual = self.post_attention_layernorm[1](
-            hidden_states, residual)
+            hidden_states, residual
+        )
 
         # second_mlp
         hidden_states = self.mlps[1](hidden_states)
@@ -462,14 +488,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 quant_config=quant_config,
                 prefix=prefix,
             ),
-            prefix=f"{prefix}.layers")
+            prefix=f"{prefix}.layers",
+        )
         if get_pp_group().is_last_rank:
             self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         else:
             self.norm = PPMissingLayer()
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -501,10 +528,9 @@ def forward(
             )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
@@ -532,26 +558,32 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         lora_config = vllm_config.lora_config
 
         self.config = config
-        config.intermediate_size = config.ffn_hidden_size if hasattr(
-            config, "ffn_hidden_size") else config.intermediate_size
+        config.intermediate_size = (
+            config.ffn_hidden_size
+            if hasattr(config, "ffn_hidden_size")
+            else config.intermediate_size
+        )
         self.lora_config = lora_config
         self.quant_config = quant_config
 
-        self.model = FlashModel(vllm_config=vllm_config,
-                                prefix=maybe_prefix(prefix, "model"))
+        self.model = FlashModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
         if get_pp_group().is_last_rank:
-            self.lm_head = ParallelLMHead(config.vocab_size,
-                                          config.hidden_size,
-                                          quant_config=quant_config,
-                                          prefix=maybe_prefix(
-                                              prefix, "lm_head"))
+            self.lm_head = ParallelLMHead(
+                config.vocab_size,
+                config.hidden_size,
+                quant_config=quant_config,
+                prefix=maybe_prefix(prefix, "lm_head"),
+            )
         else:
             self.lm_head = PPMissingLayer()
 
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -563,8 +595,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -581,14 +614,12 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
             ckpt_gate_proj_name="gate_proj",
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
-            num_experts=self.config.n_routed_experts if hasattr(
-                self.config, "n_routed_experts") else
-            self.config.num_experts[0],
+            num_experts=self.config.n_routed_experts
+            if hasattr(self.config, "n_routed_experts")
+            else self.config.num_experts[0],
         )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             ("fused_qkv_a_proj", "q_a_proj", 0),
             ("fused_qkv_a_proj", "kv_a_proj_with_mqa", 1),
@@ -610,8 +641,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
                 name = name.replace(weight_name, param_name)
                 # Skip loading extra bias for GPTQ models.
-                if (name.endswith(".bias")
-                        or name.endswith("_bias")) and name not in params_dict:
+                if (
+                    name.endswith(".bias") or name.endswith("_bias")
+                ) and name not in params_dict:
                     continue
                 # Skip mtp
                 if ".mtp." in name:
@@ -633,22 +665,25 @@ def load_weights(self, weights: Iterable[tuple[str,
                     # Skip mtp
                     if ".mtp." in name_mapped:
                         continue
-                    if (name_mapped.endswith(".bias")
-                            or name_mapped.endswith("_bias")
-                        ) and name not in params_dict:
+                    if (
+                        name_mapped.endswith(".bias") or name_mapped.endswith("_bias")
+                    ) and name not in params_dict:
                         continue
                     if is_pp_missing_parameter(name, self):
                         continue
                     param = params_dict[name_mapped]
                     weight_loader = param.weight_loader
-                    weight_loader = typing.cast(Callable[..., bool],
-                                                param.weight_loader)
-                    success = weight_loader(param,
-                                            loaded_weight,
-                                            name_mapped,
-                                            shard_id=shard_id,
-                                            expert_id=expert_id,
-                                            return_success=True)
+                    weight_loader = typing.cast(
+                        Callable[..., bool], param.weight_loader
+                    )
+                    success = weight_loader(
+                        param,
+                        loaded_weight,
+                        name_mapped,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                        return_success=True,
+                    )
                     if success:
                         name = name_mapped
                         break
@@ -672,8 +707,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                     if is_pp_missing_parameter(name, self):
                         continue
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         for layer_id in range(self.config.num_hidden_layers):
@@ -681,35 +717,35 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if isinstance(self.model.layers[layer_id], PPMissingLayer):
                     continue
                 self_attn = self.model.layers[layer_id].self_attn[i]
-                if hasattr(self.quant_config, "weight_block_size"
-                           ) and self_attn.kv_b_proj.weight.dtype in (
-                               torch.float8_e4m3fn,
-                               torch.float8_e4m3fnuz,
-                           ):
+                if hasattr(
+                    self.quant_config, "weight_block_size"
+                ) and self_attn.kv_b_proj.weight.dtype in (
+                    torch.float8_e4m3fn,
+                    torch.float8_e4m3fnuz,
+                ):
                     weight_block_size = self.quant_config.weight_block_size
                     if weight_block_size is not None:
                         assert hasattr(self_attn.kv_b_proj, "weight_scale_inv")
                         dtype = torch.get_default_dtype()
-                        w = block_dequant(self_attn.kv_b_proj.weight,
-                                          self_attn.kv_b_proj.weight_scale_inv,
-                                          weight_block_size).to(dtype)
+                        w = block_dequant(
+                            self_attn.kv_b_proj.weight,
+                            self_attn.kv_b_proj.weight_scale_inv,
+                            weight_block_size,
+                        ).to(dtype)
                 else:
                     w = self_attn.kv_b_proj.weight
 
                 w_kc, w_vc = w.unflatten(
-                    0,
-                    (-1,
-                     self_attn.qk_nope_head_dim + self_attn.v_head_dim)).split(
-                         [self_attn.qk_nope_head_dim, self_attn.v_head_dim],
-                         dim=1)
-                self_attn.w_kc = w_kc.transpose(1, 2).contiguous().transpose(
-                    1, 2)
+                    0, (-1, self_attn.qk_nope_head_dim + self_attn.v_head_dim)
+                ).split([self_attn.qk_nope_head_dim, self_attn.v_head_dim], dim=1)
+                self_attn.w_kc = w_kc.transpose(1, 2).contiguous().transpose(1, 2)
                 self_attn.w_vc = w_vc.contiguous().transpose(1, 2)
                 if self.config.mla_scale_q_lora:
                     self_attn.q_a_layernorm.weight.data *= (
-                        self.config.hidden_size / self.config.q_lora_rank)**0.5
+                        self.config.hidden_size / self.config.q_lora_rank
+                    ) ** 0.5
                 if self.config.mla_scale_kv_lora:
                     self_attn.kv_a_layernorm.weight.data *= (
-                        self.config.hidden_size /
-                        self.config.kv_lora_rank)**0.5
+                        self.config.hidden_size / self.config.kv_lora_rank
+                    ) ** 0.5
         return loaded_params
diff --git a/vllm/model_executor/models/longcat_flash_mtp.py b/vllm/model_executor/models/longcat_flash_mtp.py
index e288658a7ebf..0f3e9bc623ab 100644
--- a/vllm/model_executor/models/longcat_flash_mtp.py
+++ b/vllm/model_executor/models/longcat_flash_mtp.py
@@ -15,10 +15,11 @@
 from vllm.model_executor.layers.linear import ReplicatedLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
-from vllm.model_executor.layers.quantization.utils.int8_utils import (
-    block_dequant)
+from vllm.model_executor.layers.quantization.utils.int8_utils import block_dequant
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.longcat_flash import FlashConfig
 from vllm.sequence import IntermediateTensors
@@ -29,7 +30,6 @@
 
 
 class LongCatMultiTokenPredictorLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -40,14 +40,15 @@ def __init__(
         super().__init__()
         self.enorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         self.hnorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.eh_proj = ReplicatedLinear(2 * config.hidden_size,
-                                        config.hidden_size,
-                                        bias=False,
-                                        quant_config=quant_config,
-                                        prefix="eh_proj")
+        self.eh_proj = ReplicatedLinear(
+            2 * config.hidden_size,
+            config.hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            prefix="eh_proj",
+        )
         self.mtp_block = DeepseekV2DecoderLayer(vllm_config, prefix)
-        self.final_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
+        self.final_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def forward(
         self,
@@ -62,39 +63,43 @@ def forward(
         previous_hidden_states = self.hnorm(previous_hidden_states)
 
         hidden_states, _ = self.eh_proj(
-            torch.cat([inputs_embeds, previous_hidden_states], dim=-1))
+            torch.cat([inputs_embeds, previous_hidden_states], dim=-1)
+        )
 
-        hidden_states, residual = self.mtp_block(positions=positions,
-                                                 hidden_states=hidden_states,
-                                                 residual=None)
+        hidden_states, residual = self.mtp_block(
+            positions=positions, hidden_states=hidden_states, residual=None
+        )
         hidden_states, _ = self.final_layernorm(hidden_states, residual)
         return hidden_states
 
 
 class LongCatMultiTokenPredictor(nn.Module):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        *,
+        vllm_config: VllmConfig,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         config = FlashConfig(**vllm_config.model_config.hf_config.__dict__)
-        vllm_config.model_config.hf_config.intermediate_size \
-                                                = config.intermediate_size
+        vllm_config.model_config.hf_config.intermediate_size = config.intermediate_size
         self.mtp_start_layer_idx = config.num_hidden_layers * 2
         self.num_mtp_layers = 1
-        self.layers = torch.nn.ModuleDict({
-            str(idx):
-            LongCatMultiTokenPredictorLayer(
-                config,
-                prefix=f"{prefix}.layers.{idx}",
-                vllm_config=vllm_config,
-                quant_config=quant_config,
-            )
-            for idx in range(self.mtp_start_layer_idx,
-                             self.mtp_start_layer_idx + self.num_mtp_layers)
-        })
+        self.layers = torch.nn.ModuleDict(
+            {
+                str(idx): LongCatMultiTokenPredictorLayer(
+                    config,
+                    prefix=f"{prefix}.layers.{idx}",
+                    vllm_config=vllm_config,
+                    quant_config=quant_config,
+                )
+                for idx in range(
+                    self.mtp_start_layer_idx,
+                    self.mtp_start_layer_idx + self.num_mtp_layers,
+                )
+            }
+        )
         self.embed_tokens = VocabParallelEmbedding(
             config.vocab_size,
             config.hidden_size,
@@ -110,7 +115,7 @@ def forward(
     ) -> torch.Tensor:
         if inputs_embeds is None:
             inputs_embeds = self.embed_tokens(input_ids)
-        current_step_idx = (spec_step_idx % self.num_mtp_layers)
+        current_step_idx = spec_step_idx % self.num_mtp_layers
         return self.layers[str(self.mtp_start_layer_idx + current_step_idx)](
             input_ids,
             positions,
@@ -121,21 +126,22 @@ def forward(
 
 
 class LongCatFlashMTP(nn.Module, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         # LongCat MTP without MoE layers
         vllm_config.model_config.hf_config.n_routed_experts = None
-        self.config = FlashConfig(
-            **vllm_config.model_config.hf_config.__dict__)
-        self.quant_config = None if "mtp" in getattr(
-            self.config, "disable_quant_module",
-            []) else vllm_config.quant_config
+        self.config = FlashConfig(**vllm_config.model_config.hf_config.__dict__)
+        self.quant_config = (
+            None
+            if "mtp" in getattr(self.config, "disable_quant_module", [])
+            else vllm_config.quant_config
+        )
 
-        self.model = LongCatMultiTokenPredictor(vllm_config=vllm_config,
-                                                quant_config=self.quant_config,
-                                                prefix=maybe_prefix(
-                                                    prefix, "model"))
+        self.model = LongCatMultiTokenPredictor(
+            vllm_config=vllm_config,
+            quant_config=self.quant_config,
+            prefix=maybe_prefix(prefix, "model"),
+        )
         self.lm_head = ParallelLMHead(
             self.config.vocab_size,
             self.config.hidden_size,
@@ -153,8 +159,9 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         spec_step_idx: int = 0,
     ) -> torch.Tensor:
-        hidden_states = self.model(input_ids, positions, hidden_states,
-                                   inputs_embeds, spec_step_idx)
+        hidden_states = self.model(
+            input_ids, positions, hidden_states, inputs_embeds, spec_step_idx
+        )
         return hidden_states
 
     def compute_logits(
@@ -162,12 +169,10 @@ def compute_logits(
         hidden_states: torch.Tensor,
         spec_step_idx: int = 0,
     ) -> Optional[torch.Tensor]:
-
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             ("gate_up_proj", "gate_proj", 0),
             ("gate_up_proj", "up_proj", 1),
@@ -176,53 +181,31 @@ def load_weights(self, weights: Iterable[tuple[str,
         ]
 
         new_to_old_names_mapping = {
-            "model.mtp.embed_tokens.weight":
-            "model.layers.0.embed_tokens.weight",
+            "model.mtp.embed_tokens.weight": "model.layers.0.embed_tokens.weight",
             "model.mtp.layers.0.eh_proj.weight": "eh_proj.weight",
-            "model.mtp.layers.0.eh_proj.weight_scale_inv":
-            "eh_proj.weight_scale_inv",
+            "model.mtp.layers.0.eh_proj.weight_scale_inv": "eh_proj.weight_scale_inv",
             "model.mtp.layers.0.enorm.m.weight": "enorm.weight",
             "model.mtp.layers.0.hnorm.m.weight": "hnorm.weight",
-            "model.mtp.layers.0.input_layernorm.weight":
-            "model.layers.0.input_layernorm.weight",
-            "model.mtp.layers.0.post_attention_layernorm.weight":
-            "model.layers.0.post_attention_layernorm.weight",
-            "model.mtp.layers.0.self_attn.kv_a_layernorm.weight":
-            "model.layers.0.self_attn.kv_a_layernorm.weight",
-            "model.mtp.layers.0.self_attn.kv_a_proj_with_mqa.weight":
-            "model.layers.0.self_attn.kv_a_proj_with_mqa.weight",
-            "model.mtp.layers.0.self_attn.kv_a_proj_with_mqa.weight_scale_inv":
-            "model.layers.0.self_attn.kv_a_proj_with_mqa.weight_scale_inv",
-            "model.mtp.layers.0.self_attn.kv_b_proj.weight":
-            "model.layers.0.self_attn.kv_b_proj.weight",
-            "model.mtp.layers.0.self_attn.kv_b_proj.weight_scale_inv":
-            "model.layers.0.self_attn.kv_b_proj.weight_scale_inv",
-            "model.mtp.layers.0.self_attn.o_proj.weight":
-            "model.layers.0.self_attn.o_proj.weight",
-            "model.mtp.layers.0.self_attn.o_proj.weight_scale_inv":
-            "model.layers.0.self_attn.o_proj.weight_scale_inv",
-            "model.mtp.layers.0.self_attn.q_a_layernorm.weight":
-            "model.layers.0.self_attn.q_a_layernorm.weight",
-            "model.mtp.layers.0.self_attn.q_a_proj.weight":
-            "model.layers.0.self_attn.q_a_proj.weight",
-            "model.mtp.layers.0.self_attn.q_a_proj.weight_scale_inv":
-            "model.layers.0.self_attn.q_a_proj.weight_scale_inv",
-            "model.mtp.layers.0.self_attn.q_b_proj.weight":
-            "model.layers.0.self_attn.q_b_proj.weight",
-            "model.mtp.layers.0.self_attn.q_b_proj.weight_scale_inv":
-            "model.layers.0.self_attn.q_b_proj.weight_scale_inv",
-            "model.mtp.layers.0.transformer_layer.mlp.down_proj.weight":
-            "model.layers.0.mlp.down_proj.weight",
-            "model.mtp.layers.0.transformer_layer.mlp.down_proj.weight_scale_inv":
-            "model.layers.0.mlp.down_proj.weight_scale_inv",
-            "model.mtp.layers.0.transformer_layer.mlp.gate_proj.weight":
-            "model.layers.0.mlp.gate_proj.weight",
-            "model.mtp.layers.0.transformer_layer.mlp.gate_proj.weight_scale_inv":
-            "model.layers.0.mlp.gate_proj.weight_scale_inv",
-            "model.mtp.layers.0.transformer_layer.mlp.up_proj.weight":
-            "model.layers.0.mlp.up_proj.weight",
-            "model.mtp.layers.0.transformer_layer.mlp.up_proj.weight_scale_inv":
-            "model.layers.0.mlp.up_proj.weight_scale_inv",
+            "model.mtp.layers.0.input_layernorm.weight": "model.layers.0.input_layernorm.weight",
+            "model.mtp.layers.0.post_attention_layernorm.weight": "model.layers.0.post_attention_layernorm.weight",
+            "model.mtp.layers.0.self_attn.kv_a_layernorm.weight": "model.layers.0.self_attn.kv_a_layernorm.weight",
+            "model.mtp.layers.0.self_attn.kv_a_proj_with_mqa.weight": "model.layers.0.self_attn.kv_a_proj_with_mqa.weight",
+            "model.mtp.layers.0.self_attn.kv_a_proj_with_mqa.weight_scale_inv": "model.layers.0.self_attn.kv_a_proj_with_mqa.weight_scale_inv",
+            "model.mtp.layers.0.self_attn.kv_b_proj.weight": "model.layers.0.self_attn.kv_b_proj.weight",
+            "model.mtp.layers.0.self_attn.kv_b_proj.weight_scale_inv": "model.layers.0.self_attn.kv_b_proj.weight_scale_inv",
+            "model.mtp.layers.0.self_attn.o_proj.weight": "model.layers.0.self_attn.o_proj.weight",
+            "model.mtp.layers.0.self_attn.o_proj.weight_scale_inv": "model.layers.0.self_attn.o_proj.weight_scale_inv",
+            "model.mtp.layers.0.self_attn.q_a_layernorm.weight": "model.layers.0.self_attn.q_a_layernorm.weight",
+            "model.mtp.layers.0.self_attn.q_a_proj.weight": "model.layers.0.self_attn.q_a_proj.weight",
+            "model.mtp.layers.0.self_attn.q_a_proj.weight_scale_inv": "model.layers.0.self_attn.q_a_proj.weight_scale_inv",
+            "model.mtp.layers.0.self_attn.q_b_proj.weight": "model.layers.0.self_attn.q_b_proj.weight",
+            "model.mtp.layers.0.self_attn.q_b_proj.weight_scale_inv": "model.layers.0.self_attn.q_b_proj.weight_scale_inv",
+            "model.mtp.layers.0.transformer_layer.mlp.down_proj.weight": "model.layers.0.mlp.down_proj.weight",
+            "model.mtp.layers.0.transformer_layer.mlp.down_proj.weight_scale_inv": "model.layers.0.mlp.down_proj.weight_scale_inv",
+            "model.mtp.layers.0.transformer_layer.mlp.gate_proj.weight": "model.layers.0.mlp.gate_proj.weight",
+            "model.mtp.layers.0.transformer_layer.mlp.gate_proj.weight_scale_inv": "model.layers.0.mlp.gate_proj.weight_scale_inv",
+            "model.mtp.layers.0.transformer_layer.mlp.up_proj.weight": "model.layers.0.mlp.up_proj.weight",
+            "model.mtp.layers.0.transformer_layer.mlp.up_proj.weight_scale_inv": "model.layers.0.mlp.up_proj.weight_scale_inv",
             "model.mtp.norm.weight": "final_layernorm.weight",
         }
 
@@ -231,13 +214,13 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            spec_layer = self.get_spec_layer_idx_from_weight_name(
-                self.config, name)
+            spec_layer = self.get_spec_layer_idx_from_weight_name(self.config, name)
             if spec_layer is None:
                 continue
-            name = self._rewrite_spec_layer_name(spec_layer, name,
-                                                 new_to_old_names_mapping)
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            name = self._rewrite_spec_layer_name(
+                spec_layer, name, new_to_old_names_mapping
+            )
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 # Skip non-stacked layers and experts (experts handled below).
                 if weight_name not in name:
                     continue
@@ -247,14 +230,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                 # name will be updated to mlp.experts[0].gate_up_proj, which
                 # will then be updated below in expert_params_mapping
                 # for mlp.experts[0].gate_gate_up_proj, which breaks load.
-                if (("mlp.experts." in name) and name not in params_dict):
+                if ("mlp.experts." in name) and name not in params_dict:
                     continue
                 name = name.replace(weight_name, param_name)
 
                 # QKV fusion is optional, fall back to normal
                 # weight loading if it's not enabled
-                if ((param_name == "fused_qkv_a_proj")
-                        and name not in params_dict):
+                if (param_name == "fused_qkv_a_proj") and name not in params_dict:
                     continue
 
                 # Skip loading extra bias for GPTQ models.
@@ -272,48 +254,54 @@ def load_weights(self, weights: Iterable[tuple[str,
 
                 # According to DeepSeek-V3 Technical Report, MTP modules
                 # shares embedding layer. We only load the first weights.
-                if (spec_layer != self.model.mtp_start_layer_idx
-                        and ".layers" not in name):
+                if (
+                    spec_layer != self.model.mtp_start_layer_idx
+                    and ".layers" not in name
+                ):
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         spec_layer_id = self.config.num_hidden_layers * 2
         self_attn = self.model.layers[str(spec_layer_id)].mtp_block.self_attn
         if hasattr(
-                self.quant_config,
-                "weight_block_size") and self_attn.kv_b_proj.weight.dtype in (
-                    torch.float8_e4m3fn,
-                    torch.float8_e4m3fnuz,
-                ):
+            self.quant_config, "weight_block_size"
+        ) and self_attn.kv_b_proj.weight.dtype in (
+            torch.float8_e4m3fn,
+            torch.float8_e4m3fnuz,
+        ):
             weight_block_size = self.quant_config.weight_block_size
             if weight_block_size is not None:
                 dtype = torch.get_default_dtype()
-                w = block_dequant(self_attn.kv_b_proj.weight,
-                                  self_attn.kv_b_proj.weight_scale_inv,
-                                  weight_block_size).to(dtype)
+                w = block_dequant(
+                    self_attn.kv_b_proj.weight,
+                    self_attn.kv_b_proj.weight_scale_inv,
+                    weight_block_size,
+                ).to(dtype)
             else:
                 w = self_attn.kv_b_proj.weight
         else:
             w = self_attn.kv_b_proj.weight
         w_kc, w_vc = w.unflatten(
-            0, (-1, self_attn.qk_nope_head_dim + self_attn.v_head_dim)).split(
-                [self_attn.qk_nope_head_dim, self_attn.v_head_dim], dim=1)
+            0, (-1, self_attn.qk_nope_head_dim + self_attn.v_head_dim)
+        ).split([self_attn.qk_nope_head_dim, self_attn.v_head_dim], dim=1)
         self_attn.w_kc = w_kc.transpose(1, 2).contiguous().transpose(1, 2)
         self_attn.w_vc = w_vc.contiguous().transpose(1, 2)
         if self.config.mla_scale_q_lora:
             self_attn.q_a_layernorm.weight.data *= (
-                self.config.hidden_size / self.config.q_lora_rank)**0.5
+                self.config.hidden_size / self.config.q_lora_rank
+            ) ** 0.5
         if self.config.mla_scale_kv_lora:
             self_attn.kv_a_layernorm.weight.data *= (
-                self.config.hidden_size / self.config.kv_lora_rank)**0.5
+                self.config.hidden_size / self.config.kv_lora_rank
+            ) ** 0.5
         return loaded_params
 
-    def _rewrite_spec_layer_name(self, spec_layer: int, name: str,
-                                 new_to_old_names_mapping: dict) -> str:
+    def _rewrite_spec_layer_name(
+        self, spec_layer: int, name: str, new_to_old_names_mapping: dict
+    ) -> str:
         """
         Rewrite the weight name to match the format of the original model.
         Add .mtp_block for modules in transformer layer block for spec layer
@@ -322,11 +310,18 @@ def _rewrite_spec_layer_name(self, spec_layer: int, name: str,
         if name in new_to_old_names_mapping:
             name = new_to_old_names_mapping[name]
         spec_layer_weight_names = [
-            "embed_tokens", "enorm", "hnorm", "eh_proj", "shared_head"
+            "embed_tokens",
+            "enorm",
+            "hnorm",
+            "eh_proj",
+            "shared_head",
         ]
-        if name.startswith("enorm") or name.startswith(
-                "hnorm") or name.startswith("eh_proj") or name.startswith(
-                    "final_layernorm"):
+        if (
+            name.startswith("enorm")
+            or name.startswith("hnorm")
+            or name.startswith("eh_proj")
+            or name.startswith("final_layernorm")
+        ):
             name = "model.layers." + str(spec_layer) + "." + name
         shared_weight_names = ["embed_tokens"]
         spec_layer_weight = False
@@ -339,15 +334,17 @@ def _rewrite_spec_layer_name(self, spec_layer: int, name: str,
                 break
         if not spec_layer_weight:
             # treat rest weights as weights for transformer layer block
-            name = name.replace("model.layers.0.",
-                                f"model.layers.{spec_layer}.mtp_block.")
+            name = name.replace(
+                "model.layers.0.", f"model.layers.{spec_layer}.mtp_block."
+            )
         elif shared_weight:
             # treat shared weights as top level weights
             name = name.replace("model.layers.0.", "model.")
         return name
 
-    def get_spec_layer_idx_from_weight_name(self, config: PretrainedConfig,
-                                            weight_name: str) -> Optional[int]:
+    def get_spec_layer_idx_from_weight_name(
+        self, config: PretrainedConfig, weight_name: str
+    ) -> Optional[int]:
         if "model.mtp" in weight_name:
             return config.num_hidden_layers * 2
         return None
diff --git a/vllm/model_executor/models/mamba.py b/vllm/model_executor/models/mamba.py
index d810701c50b4..fa11f92cce33 100644
--- a/vllm/model_executor/models/mamba.py
+++ b/vllm/model_executor/models/mamba.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """PyTorch MAMBA model."""
+
 from collections.abc import Iterable
 from typing import Optional
 
@@ -15,51 +16,66 @@
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.mamba.mamba_mixer import MambaMixer
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
-from vllm.model_executor.models.interfaces import (HasInnerState,
-                                                   IsAttentionFree, SupportsPP)
+from vllm.model_executor.models.interfaces import (
+    HasInnerState,
+    IsAttentionFree,
+    SupportsPP,
+)
 from vllm.sequence import IntermediateTensors
 
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 KVCache = tuple[torch.Tensor, torch.Tensor]
 
 
 class MambaDecoderLayer(nn.Module):
-
-    def __init__(self,
-                 config: MambaConfig,
-                 model_config: Optional[ModelConfig] = None,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 is_lora_enabled: Optional[bool] = False,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: MambaConfig,
+        model_config: Optional[ModelConfig] = None,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        is_lora_enabled: Optional[bool] = False,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
         self.config = config
         self.is_falcon_mamba = config.model_type == "falcon_mamba"
         self.is_lora_enabled = is_lora_enabled
         mixer_rms_eps = config.mixer_rms_eps if self.is_falcon_mamba else None
-        self.mixer = MambaMixer(hidden_size=config.hidden_size,
-                                ssm_state_size=config.state_size,
-                                conv_kernel_size=config.conv_kernel,
-                                intermediate_size=config.intermediate_size,
-                                time_step_rank=config.time_step_rank,
-                                use_conv_bias=config.use_conv_bias,
-                                use_bias=config.use_bias,
-                                use_rms_norm=self.is_falcon_mamba,
-                                rms_norm_has_weight=not self.is_falcon_mamba,
-                                rms_norm_eps=mixer_rms_eps,
-                                activation=config.hidden_act,
-                                is_lora_enabled=self.is_lora_enabled,
-                                model_config=model_config,
-                                cache_config=cache_config,
-                                prefix=f"{prefix}.mixer")
+        self.mixer = MambaMixer(
+            hidden_size=config.hidden_size,
+            ssm_state_size=config.state_size,
+            conv_kernel_size=config.conv_kernel,
+            intermediate_size=config.intermediate_size,
+            time_step_rank=config.time_step_rank,
+            use_conv_bias=config.use_conv_bias,
+            use_bias=config.use_bias,
+            use_rms_norm=self.is_falcon_mamba,
+            rms_norm_has_weight=not self.is_falcon_mamba,
+            rms_norm_eps=mixer_rms_eps,
+            activation=config.hidden_act,
+            is_lora_enabled=self.is_lora_enabled,
+            model_config=model_config,
+            cache_config=cache_config,
+            prefix=f"{prefix}.mixer",
+        )
 
         self.norm = RMSNorm(config.hidden_size, eps=config.layer_norm_epsilon)
 
@@ -82,7 +98,6 @@ def forward(
 
 @support_torch_compile
 class MambaModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -94,8 +109,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         is_lora_enabled = bool(lora_config)
 
         self.config = config
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
 
@@ -107,19 +125,21 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: MambaDecoderLayer(config,
-                                             model_config=model_config,
-                                             cache_config=cache_config,
-                                             quant_config=quant_config,
-                                             is_lora_enabled=is_lora_enabled,
-                                             prefix=prefix),
-            prefix=f"{prefix}.layers")
-
-        self.norm_f = RMSNorm(config.hidden_size,
-                              eps=config.layer_norm_epsilon)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+            lambda prefix: MambaDecoderLayer(
+                config,
+                model_config=model_config,
+                cache_config=cache_config,
+                quant_config=quant_config,
+                is_lora_enabled=is_lora_enabled,
+                prefix=prefix,
+            ),
+            prefix=f"{prefix}.layers",
+        )
+
+        self.norm_f = RMSNorm(config.hidden_size, eps=config.layer_norm_epsilon)
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embeddings(input_ids)
@@ -144,20 +164,18 @@ def forward(
 
         for i in range(self.start_layer, self.end_layer):
             layer = self.layers[i]
-            hidden_states, residual = layer(positions=positions,
-                                            hidden_states=hidden_states,
-                                            residual=residual)
+            hidden_states, residual = layer(
+                positions=positions, hidden_states=hidden_states, residual=residual
+            )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm_f(hidden_states, residual)
 
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
@@ -170,29 +188,29 @@ def load_weights(self, weights: Iterable[tuple[str,
                 continue
 
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class MambaForCausalLM(nn.Module, HasInnerState, IsAttentionFree, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
         lora_config = vllm_config.lora_config
         self.scheduler_config = vllm_config.scheduler_config
-        assert not cache_config.enable_prefix_caching, \
+        assert not cache_config.enable_prefix_caching, (
             "Mamba does not support prefix caching"
+        )
 
         super().__init__()
         self.config = config
         self.vllm_config = vllm_config
         self.model_config = vllm_config.model_config
-        self.backbone = MambaModel(vllm_config=vllm_config,
-                                   prefix=maybe_prefix(prefix, "backbone"))
+        self.backbone = MambaModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "backbone")
+        )
         self.unpadded_vocab_size = config.vocab_size
         if lora_config:
             self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
@@ -206,28 +224,33 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 padding_size=DEFAULT_VOCAB_PADDING_SIZE
                 # We need bigger padding if using lora for kernel
                 # compatibility
-                if not lora_config else lora_config.lora_vocab_padding_size,
+                if not lora_config
+                else lora_config.lora_vocab_padding_size,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
 
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.backbone.make_empty_intermediate_tensors)
+            self.backbone.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.backbone.get_input_embeddings(input_ids)
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs):
-
-        hidden_states = self.backbone(input_ids, positions,
-                                      intermediate_tensors, inputs_embeds)
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs,
+    ):
+        hidden_states = self.backbone(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
 
         return hidden_states
 
@@ -236,7 +259,6 @@ def get_mamba_state_dtype_from_config(
         cls,
         vllm_config: "VllmConfig",
     ) -> tuple[torch.dtype, torch.dtype]:
-
         return MambaStateDtypeCalculator.mamba1_state_dtype(
             vllm_config.model_config.dtype,
             vllm_config.cache_config.mamba_cache_dtype,
@@ -255,11 +277,11 @@ def get_mamba_state_shape_from_config(
             tp_world_size=parallel_config.tensor_parallel_size,
             intermediate_size=hf_config.intermediate_size,
             state_size=hf_config.state_size,
-            conv_kernel=hf_config.conv_kernel)
+            conv_kernel=hf_config.conv_kernel,
+        )
 
     def copy_inputs_before_cuda_graphs(self, input_buffers, **kwargs):
-        return self.mamba_cache.copy_inputs_before_cuda_graphs(
-            input_buffers, **kwargs)
+        return self.mamba_cache.copy_inputs_before_cuda_graphs(input_buffers, **kwargs)
 
     def get_seqlen_agnostic_capture_inputs(self, batch_size: int):
         return self.mamba_cache.get_seqlen_agnostic_capture_inputs(batch_size)
@@ -268,7 +290,6 @@ def compute_logits(self, hidden_states: torch.Tensor) -> torch.Tensor:
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/mamba2.py b/vllm/model_executor/models/mamba2.py
index 250698a61387..4491648f3a0a 100644
--- a/vllm/model_executor/models/mamba2.py
+++ b/vllm/model_executor/models/mamba2.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """PyTorch MAMBA2 model."""
+
 from collections.abc import Iterable
 from typing import Optional
 
@@ -15,49 +16,60 @@
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.mamba.mamba_mixer2 import MambaMixer2
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
-from vllm.model_executor.models.interfaces import (HasInnerState,
-                                                   IsAttentionFree)
+from vllm.model_executor.models.interfaces import HasInnerState, IsAttentionFree
 from vllm.sequence import IntermediateTensors
 
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 KVCache = tuple[torch.Tensor, torch.Tensor]
 
 
 class Mamba2DecoderLayer(nn.Module):
-
-    def __init__(self,
-                 config: MambaConfig,
-                 model_config: Optional[ModelConfig] = None,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: MambaConfig,
+        model_config: Optional[ModelConfig] = None,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
         self.config = config
-        self.mixer = MambaMixer2(hidden_size=config.hidden_size,
-                                 ssm_state_size=config.state_size,
-                                 conv_kernel_size=config.conv_kernel,
-                                 intermediate_size=getattr(
-                                     config, "intermediate_size",
-                                     config.expand * config.hidden_size),
-                                 use_conv_bias=config.use_conv_bias,
-                                 use_bias=config.use_bias,
-                                 n_groups=config.n_groups,
-                                 num_heads=config.num_heads,
-                                 head_dim=config.head_dim,
-                                 rms_norm_eps=config.layer_norm_epsilon,
-                                 activation=config.hidden_act,
-                                 model_config=model_config,
-                                 cache_config=cache_config,
-                                 quant_config=quant_config,
-                                 prefix=f"{prefix}.mixer")
+        self.mixer = MambaMixer2(
+            hidden_size=config.hidden_size,
+            ssm_state_size=config.state_size,
+            conv_kernel_size=config.conv_kernel,
+            intermediate_size=getattr(
+                config, "intermediate_size", config.expand * config.hidden_size
+            ),
+            use_conv_bias=config.use_conv_bias,
+            use_bias=config.use_bias,
+            n_groups=config.n_groups,
+            num_heads=config.num_heads,
+            head_dim=config.head_dim,
+            rms_norm_eps=config.layer_norm_epsilon,
+            activation=config.hidden_act,
+            model_config=model_config,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.mixer",
+        )
 
         self.norm = RMSNorm(config.hidden_size, eps=config.layer_norm_epsilon)
 
@@ -80,7 +92,6 @@ def forward(
 
 @support_torch_compile
 class Mamba2Model(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -93,8 +104,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         assert not is_lora_enabled
 
         self.config = config
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
 
@@ -106,18 +120,20 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: Mamba2DecoderLayer(config,
-                                              model_config=model_config,
-                                              cache_config=cache_config,
-                                              quant_config=quant_config,
-                                              prefix=prefix),
-            prefix=f"{prefix}.layers")
-
-        self.norm_f = RMSNorm(config.hidden_size,
-                              eps=config.layer_norm_epsilon)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+            lambda prefix: Mamba2DecoderLayer(
+                config,
+                model_config=model_config,
+                cache_config=cache_config,
+                quant_config=quant_config,
+                prefix=prefix,
+            ),
+            prefix=f"{prefix}.layers",
+        )
+
+        self.norm_f = RMSNorm(config.hidden_size, eps=config.layer_norm_epsilon)
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embeddings(input_ids)
@@ -141,22 +157,20 @@ def forward(
             residual = intermediate_tensors["residual"]
 
         for i, layer in enumerate(self.layers):
-            hidden_states, residual = layer(positions=positions,
-                                            hidden_states=hidden_states,
-                                            residual=residual)
+            hidden_states, residual = layer(
+                positions=positions, hidden_states=hidden_states, residual=residual
+            )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm_f(hidden_states, residual)
 
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
@@ -170,21 +184,18 @@ def load_weights(self, weights: Iterable[tuple[str,
                 continue
 
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class Mamba2ForCausalLM(nn.Module, HasInnerState, IsAttentionFree):
-
     @classmethod
     def get_mamba_state_dtype_from_config(
         cls,
         vllm_config: "VllmConfig",
     ) -> tuple[torch.dtype, torch.dtype]:
-
         return MambaStateDtypeCalculator.mamba2_state_dtype(
             vllm_config.model_config.dtype,
             vllm_config.cache_config.mamba_cache_dtype,
@@ -230,8 +241,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.vllm_config = vllm_config
         self.scheduler_config = scheduler_config
         self.model_config = vllm_config.model_config
-        self.backbone = Mamba2Model(vllm_config=vllm_config,
-                                    prefix=maybe_prefix(prefix, "backbone"))
+        self.backbone = Mamba2Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "backbone")
+        )
         self.unpadded_vocab_size = config.vocab_size
         if lora_config:
             self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
@@ -243,36 +255,40 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             padding_size=DEFAULT_VOCAB_PADDING_SIZE
             # We need bigger padding if using lora for kernel
             # compatibility
-            if not lora_config else lora_config.lora_vocab_padding_size,
+            if not lora_config
+            else lora_config.lora_vocab_padding_size,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
         if config.tie_word_embeddings:
             self.lm_head = self.lm_head.tie_weights(self.backbone.embeddings)
 
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.backbone.make_empty_intermediate_tensors)
+            self.backbone.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.backbone.get_input_embeddings(input_ids)
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs):
-
-        hidden_states = self.backbone(input_ids, positions,
-                                      intermediate_tensors, inputs_embeds)
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs,
+    ):
+        hidden_states = self.backbone(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
 
         return hidden_states
 
     def copy_inputs_before_cuda_graphs(self, input_buffers, **kwargs):
-        return self.mamba_cache.copy_inputs_before_cuda_graphs(
-            input_buffers, **kwargs)
+        return self.mamba_cache.copy_inputs_before_cuda_graphs(input_buffers, **kwargs)
 
     def get_seqlen_agnostic_capture_inputs(self, batch_size: int):
         return self.mamba_cache.get_seqlen_agnostic_capture_inputs(batch_size)
@@ -281,7 +297,6 @@ def compute_logits(self, hidden_states: torch.Tensor) -> torch.Tensor:
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/medusa.py b/vllm/model_executor/models/medusa.py
index f083c2cb0380..7e1d2bf14bb5 100644
--- a/vllm/model_executor/models/medusa.py
+++ b/vllm/model_executor/models/medusa.py
@@ -9,24 +9,28 @@
 from vllm.config import VllmConfig
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 
 from .utils import maybe_prefix
 
 
 class ResidualBlock(nn.Module):
-
-    def __init__(self, config: VllmConfig, hidden_size: int,
-                 num_layers: int) -> None:
+    def __init__(self, config: VllmConfig, hidden_size: int, num_layers: int) -> None:
         super().__init__()
 
-        self.layers = nn.ModuleList([
-            nn.Linear(hidden_size,
-                      hidden_size,
-                      bias=getattr(config, "medusa_fc_bias", False))
-            for _ in range(num_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                nn.Linear(
+                    hidden_size,
+                    hidden_size,
+                    bias=getattr(config, "medusa_fc_bias", False),
+                )
+                for _ in range(num_layers)
+            ]
+        )
         self.act = nn.SiLU()
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -38,13 +42,13 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 class Medusa(nn.Module):
     """This class implements the Medusa draft model from the paper: https://arxiv.org/abs/2401.10774
     Reference implementation: https://github.com/FasterDecoding/Medusa
-    
+
     Differences from reference implementation:
     1. Currently this only supports generating proposals from top-1 tokens.
-    2. We have an optional token_map which reduces draft vocab to most 
-       frequently used tokens to give some additional speed-up by reducing 
-       sampling overhead. This is disabled unless the checkpoint file has 
-       explicit token_map tensor and config has an optional attribute 
+    2. We have an optional token_map which reduces draft vocab to most
+       frequently used tokens to give some additional speed-up by reducing
+       sampling overhead. This is disabled unless the checkpoint file has
+       explicit token_map tensor and config has an optional attribute
        truncated_vocab_size < vocab_size. To use this technique, one has to find
        the top-k most frequent tokens in target dataset and add that as a tensor
        in the draft checkpoint (using key token_map). Also, the draft config
@@ -54,12 +58,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         config = vllm_config.speculative_config.draft_model_config.hf_config
         super().__init__()
         self.config = config
-        self.blocks = nn.ModuleList([
-            ResidualBlock(config=config,
-                          hidden_size=self.config.hidden_size,
-                          num_layers=self.config.num_hidden_layers)
-            for _ in range(self.config.num_heads)
-        ])
+        self.blocks = nn.ModuleList(
+            [
+                ResidualBlock(
+                    config=config,
+                    hidden_size=self.config.hidden_size,
+                    num_layers=self.config.num_hidden_layers,
+                )
+                for _ in range(self.config.num_heads)
+            ]
+        )
         self.orig_vocab_size = config.vocab_size
         self.truncated_vocab_size = config.truncated_vocab_size
         self.unpadded_vocab_size = self.truncated_vocab_size
@@ -72,24 +80,25 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
                 padding_size=DEFAULT_VOCAB_PADDING_SIZE,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
-            self.lm_heads = [
-                self.lm_head for _ in range(self.config.num_heads)
-            ]
+            self.lm_heads = [self.lm_head for _ in range(self.config.num_heads)]
         else:
-            self.lm_heads = nn.ModuleList([
-                ParallelLMHead(
-                    self.unpadded_vocab_size,
-                    config.hidden_size,
-                    org_num_embeddings=self.truncated_vocab_size,
-                    padding_size=DEFAULT_VOCAB_PADDING_SIZE,
-                    prefix=maybe_prefix(prefix, f"lm_heads.{i}"),
-                ) for i in range(self.config.num_heads)
-            ])
+            self.lm_heads = nn.ModuleList(
+                [
+                    ParallelLMHead(
+                        self.unpadded_vocab_size,
+                        config.hidden_size,
+                        org_num_embeddings=self.truncated_vocab_size,
+                        padding_size=DEFAULT_VOCAB_PADDING_SIZE,
+                        prefix=maybe_prefix(prefix, f"lm_heads.{i}"),
+                    )
+                    for i in range(self.config.num_heads)
+                ]
+            )
 
         logit_scale = getattr(config, "logit_scale", 1.0)
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                self.truncated_vocab_size,
-                                                logit_scale)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, self.truncated_vocab_size, logit_scale
+        )
 
         # Token map is a idx to token mapping to reduce the vocab size for
         # the draft model. Using smaller vocab size for draft, containing
@@ -120,17 +129,20 @@ def compute_logits(
             if self.token_map is None:
                 logits_lst.append(_logits)
             else:
-                logits_lst.append(-torch.inf * torch.ones(
-                    size=(*_logits.shape[:-1], self.orig_vocab_size),
-                    device=_logits.device,
-                    dtype=_logits.dtype))
+                logits_lst.append(
+                    -torch.inf
+                    * torch.ones(
+                        size=(*_logits.shape[:-1], self.orig_vocab_size),
+                        device=_logits.device,
+                        dtype=_logits.dtype,
+                    )
+                )
 
                 logits_lst[-1][..., self.token_map] = _logits
 
         return logits_lst
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
 
@@ -141,30 +153,33 @@ def load_weights(self, weights: Iterable[tuple[str,
 
             if name == "token_map":
                 if self.truncated_vocab_size < self.orig_vocab_size:
-                    self.token_map = nn.Parameter(loaded_weight,
-                                                  requires_grad=False)
+                    self.token_map = nn.Parameter(loaded_weight, requires_grad=False)
             elif name in params_dict:
                 weights_map[name] = loaded_weight
-            elif (getattr(self.config, "original_lm_head", False)
-                  and name == "lm_heads.0.weight"):
+            elif (
+                getattr(self.config, "original_lm_head", False)
+                and name == "lm_heads.0.weight"
+            ):
                 weights_map["lm_head.weight"] = loaded_weight
 
         for name, loaded_weight in weights_map.items():
-            if "lm_head" in name and self.token_map is not None and\
-                loaded_weight.shape[0] > self.token_map.shape[0]:
-
+            if (
+                "lm_head" in name
+                and self.token_map is not None
+                and loaded_weight.shape[0] > self.token_map.shape[0]
+            ):
                 loaded_weight = loaded_weight[self.token_map]
 
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
 
         if self.token_map is not None:
             self.token_map.to(device=self.lm_heads[0].weight.device)
 
-        assert (self.truncated_vocab_size
-                == self.orig_vocab_size) or (self.token_map is not None)
+        assert (self.truncated_vocab_size == self.orig_vocab_size) or (
+            self.token_map is not None
+        )
 
         return loaded_params
diff --git a/vllm/model_executor/models/midashenglm.py b/vllm/model_executor/models/midashenglm.py
index 65b3ee1c0e18..47839a2c6b03 100644
--- a/vllm/model_executor/models/midashenglm.py
+++ b/vllm/model_executor/models/midashenglm.py
@@ -39,17 +39,26 @@
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
 from vllm.multimodal.parse import MultiModalDataItems, MultiModalDataParser
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs.midashenglm import DashengConfig
@@ -63,7 +72,8 @@
 def _resolve_tuple2(x: _Tuple2) -> tuple[int, int]:
     if isinstance(x, collections.abc.Sequence):
         assert len(x) == 2, (
-            f"Expected a sequence of length 2, got {x} with length {len(x)}")
+            f"Expected a sequence of length 2, got {x} with length {len(x)}"
+        )
         return cast(tuple[int, int], tuple(x))
     return (x, x)
 
@@ -80,12 +90,14 @@ def calculate_mel_frames_dasheng(
     if center:
         audio_length_samples = audio_length_samples + n_fft
 
-    return (int(1 + ((audio_length_samples - n_fft) / hop_size)) //
-            dasheng_subsampling // model_subsampling)
+    return (
+        int(1 + ((audio_length_samples - n_fft) / hop_size))
+        // dasheng_subsampling
+        // model_subsampling
+    )
 
 
 class AudioPatchEmbed(nn.Module):
-
     def __init__(
         self,
         input_size: _Tuple2 = 64,
@@ -118,14 +130,14 @@ def __init__(
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         x = self.proj(x)
         if self.flatten:
-            x = torch.permute(torch.flatten(
-                x, 2, 3), (0, 2, 1))  # rearrange(x, "b c f t -> b (f t) c")
+            x = torch.permute(
+                torch.flatten(x, 2, 3), (0, 2, 1)
+            )  # rearrange(x, "b c f t -> b (f t) c")
         x = self.norm(x)
         return x
 
 
 class LayerScale(nn.Module):
-
     def __init__(self, dim, init_values=1e-5, inplace=False):
         super().__init__()
         self.inplace = inplace
@@ -136,7 +148,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class DashengMlp(nn.Module):
-
     def __init__(
         self,
         in_features: int,
@@ -170,7 +181,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class DashengAttention(nn.Module):
-
     def __init__(
         self,
         dim: int,
@@ -237,7 +247,6 @@ def forward(self, x: torch.Tensor, mask: Optional[torch.Tensor] = None):
 
 
 class DashengBlock(nn.Module):
-
     def __init__(
         self,
         dim: int,
@@ -257,8 +266,9 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.attn",
         )
-        self.ls1 = (LayerScale(dim, init_values=init_values)
-                    if init_values else nn.Identity())
+        self.ls1 = (
+            LayerScale(dim, init_values=init_values) if init_values else nn.Identity()
+        )
 
         self.norm2 = nn.LayerNorm(dim, eps=1e-6)
         self.mlp = DashengMlp(
@@ -267,8 +277,9 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.mlp",
         )
-        self.ls2 = (LayerScale(dim, init_values=init_values)
-                    if init_values else nn.Identity())
+        self.ls2 = (
+            LayerScale(dim, init_values=init_values) if init_values else nn.Identity()
+        )
 
     # Kwargs usually has a mask parameter that is passed to Attention
     def forward(
@@ -282,7 +293,6 @@ def forward(
 
 
 class DashengFrontend(nn.Module):
-
     def __init__(self, config: DashengConfig):
         super().__init__()
         self.config = config
@@ -302,9 +312,7 @@ def __init__(self, config: DashengConfig):
             n_mels=self.config.n_mels,
             sample_rate=self.config.sample_rate,
         )
-        self.register_buffer("melscale_fbanks",
-                             melscale_fbanks,
-                             persistent=False)
+        self.register_buffer("melscale_fbanks", melscale_fbanks, persistent=False)
         self.melscale_fbanks: torch.Tensor
 
     def forward(self, waveform: torch.Tensor) -> torch.Tensor:
@@ -319,8 +327,7 @@ def forward(self, waveform: torch.Tensor) -> torch.Tensor:
             normalized=False,
             center=self.config.center,
         )
-        mel_spectrogram = (
-            spectrogram.mT @ self.melscale_fbanks.to(torch.float32)).mT
+        mel_spectrogram = (spectrogram.mT @ self.melscale_fbanks.to(torch.float32)).mT
         # x has shape [batch, freq, time].
         # F.amplitude_to_DB accepts inputs shaped as:
         #   - [freq, time]
@@ -339,7 +346,6 @@ def forward(self, waveform: torch.Tensor) -> torch.Tensor:
 
 
 class DashengAudioTransformer(nn.Module):
-
     def __init__(
         self,
         config: DashengConfig,
@@ -365,9 +371,11 @@ def __init__(
         )
 
         self.time_pos_embed = nn.Parameter(
-            torch.empty(1, config.embed_dim, 1, self.patch_embed.grid_size[1]))
+            torch.empty(1, config.embed_dim, 1, self.patch_embed.grid_size[1])
+        )
         self.freq_pos_embed = nn.Parameter(
-            torch.empty(1, config.embed_dim, self.patch_embed.grid_size[0], 1))
+            torch.empty(1, config.embed_dim, self.patch_embed.grid_size[0], 1)
+        )
         self.blocks = nn.ModuleList(
             DashengBlock(
                 dim=config.embed_dim,
@@ -377,7 +385,9 @@ def __init__(
                 init_values=config.init_values,
                 quant_config=quant_config,
                 prefix=f"{prefix}.blocks.{i}",
-            ) for i in range(config.depth))
+            )
+            for i in range(config.depth)
+        )
         self.norm = nn.LayerNorm(config.embed_dim, eps=1e-6)
 
     def forward_features(
@@ -387,10 +397,12 @@ def forward_features(
     ) -> torch.Tensor:
         t = x.shape[-1]
         x = x + self.time_pos_embed[:, :, :, :t]
-        x = (x + self.freq_pos_embed[:, :, :, :]
-             )  # Just to support __getitem__ in posembed
-        x = torch.permute(torch.flatten(x, 2, 3),
-                          (0, 2, 1))  # rearrange(x, "b c f t -> b (f t) c")
+        x = (
+            x + self.freq_pos_embed[:, :, :, :]
+        )  # Just to support __getitem__ in posembed
+        x = torch.permute(
+            torch.flatten(x, 2, 3), (0, 2, 1)
+        )  # rearrange(x, "b c f t -> b (f t) c")
         for block in self.blocks:
             x = block(x, mask)
         x = self.norm(x)
@@ -423,7 +435,8 @@ def forward(
 
         if x_length is not None:
             assert len(x_length) == len(x), (
-                "batchsizes of input x and x_length need to be same")
+                "batchsizes of input x and x_length need to be same"
+            )
             assert x_length.ndim == 1, "Lengths are of size (B,)"
             scaled_lengths = (x_length / (self.hop_length * 4)).long()
             mask = self._to_mask(max_length=t, lengths=scaled_lengths)
@@ -444,7 +457,6 @@ def forward(
 
 
 class AudioProjectorSubsample(nn.Module):
-
     def __init__(
         self,
         in_dim: int,
@@ -483,13 +495,14 @@ def forward(self, x, mask=None):
                 mask = mask[:, :-num_frames_to_discard]
         if mask is None:
             mask = torch.ones(x.shape[:-1], dtype=torch.long, device=x.device)
-        x = x.reshape(batch_size, -1, self.k *
-                      dim)  # rearrange(x, "b (s k) d -> b s (k d)", k=self.k)
+        x = x.reshape(
+            batch_size, -1, self.k * dim
+        )  # rearrange(x, "b (s k) d -> b s (k d)", k=self.k)
         for layer in self.net:
             x = layer(x)
         mask = mask.reshape(
-            batch_size, -1,
-            self.k)  # rearrange(mask, "b (s k) -> b s k", k=self.k)
+            batch_size, -1, self.k
+        )  # rearrange(mask, "b (s k) -> b s k", k=self.k)
         mask = mask.any(dim=-1).long()
         return x, mask
 
@@ -503,7 +516,6 @@ class MiDashengLMAudioInputs(TypedDict):
 
 
 class MiDashengLMProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config()
 
@@ -522,9 +534,7 @@ def get_max_audio_len(self):
         return 160000
 
 
-class MiDashengLMDummyInputsBuilder(
-        BaseDummyInputsBuilder[MiDashengLMProcessingInfo]):
-
+class MiDashengLMDummyInputsBuilder(BaseDummyInputsBuilder[MiDashengLMProcessingInfo]):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_audios = mm_counts.get("audio", 0)
 
@@ -547,16 +557,17 @@ def get_dummy_mm_data(
         audio_overrides = mm_options.get("audio") if mm_options else None
 
         return {
-            "audio":
-            self._get_dummy_audios(length=self.info.get_max_audio_len(),
-                                   num_audios=num_audios,
-                                   overrides=audio_overrides)
+            "audio": self._get_dummy_audios(
+                length=self.info.get_max_audio_len(),
+                num_audios=num_audios,
+                overrides=audio_overrides,
+            )
         }
 
 
 class MiDashengLMMultiModalProcessor(
-        BaseMultiModalProcessor[MiDashengLMProcessingInfo]):
-
+    BaseMultiModalProcessor[MiDashengLMProcessingInfo]
+):
     def _get_data_parser(self) -> MultiModalDataParser:
         feature_extractor = self.info.get_feature_extractor()
         return MultiModalDataParser(target_sr=feature_extractor.sampling_rate)
@@ -578,8 +589,10 @@ def _call_hf_processor(
                 (0, min_audio_len - audio.shape[-1]),
                 mode="constant",
                 constant_values=0,
-            ) if isinstance(audio, np.ndarray)
-            and audio.shape[-1] < min_audio_len else audio for audio in audios
+            )
+            if isinstance(audio, np.ndarray) and audio.shape[-1] < min_audio_len
+            else audio
+            for audio in audios
         ]
 
         if processed_audios:
@@ -590,7 +603,9 @@ def _call_hf_processor(
             prompt_ids = self._apply_hf_processor_tokens_only(prompt_ids)
             return BatchFeature(dict(input_ids=[prompt_ids]), tensor_type="pt")
 
-        mm_kwargs = dict(**mm_kwargs, )
+        mm_kwargs = dict(
+            **mm_kwargs,
+        )
 
         return super()._call_hf_processor(
             prompt=prompt,
@@ -627,11 +642,13 @@ def _get_prompt_updates(
         if audio_length is None:
             audio_output_lengths = []
         else:
-            audio_length_np = (audio_length.cpu().numpy() if isinstance(
-                audio_length, torch.Tensor) else audio_length)
+            audio_length_np = (
+                audio_length.cpu().numpy()
+                if isinstance(audio_length, torch.Tensor)
+                else audio_length
+            )
             audio_output_lengths = [
-                max(1, calculate_mel_frames_dasheng(
-                    int(length)))  # at least one frame
+                max(1, calculate_mel_frames_dasheng(int(length)))  # at least one frame
                 for length in audio_length_np
             ]
 
@@ -708,22 +725,23 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.quant_config = quant_config
         self.make_empty_intermediate_tensors = (
-            self.decoder.make_empty_intermediate_tensors)
+            self.decoder.make_empty_intermediate_tensors
+        )
 
-    def _validate_and_reshape_mm_tensor(self, mm_input: object,
-                                        name: str) -> torch.Tensor:
+    def _validate_and_reshape_mm_tensor(
+        self, mm_input: object, name: str
+    ) -> torch.Tensor:
         if not isinstance(mm_input, (torch.Tensor, list)):
-            raise ValueError(
-                f"Incorrect type of {name}. Got type: {type(mm_input)}")
+            raise ValueError(f"Incorrect type of {name}. Got type: {type(mm_input)}")
         if isinstance(mm_input, torch.Tensor):
             return mm_input.reshape(-1, *mm_input.shape[2:])
 
         if name == "input_values":
             max_length = max(tensor.shape[1] for tensor in mm_input)
             padded_mm_input = [
-                torch.nn.functional.pad(tensor,
-                                        (0, max_length - tensor.shape[1]))
-                if tensor.shape[1] < max_length else tensor
+                torch.nn.functional.pad(tensor, (0, max_length - tensor.shape[1]))
+                if tensor.shape[1] < max_length
+                else tensor
                 for tensor in mm_input
             ]
             return torch.concat(padded_mm_input)
@@ -731,65 +749,67 @@ def _validate_and_reshape_mm_tensor(self, mm_input: object,
         return torch.concat(mm_input)
 
     def _parse_and_validate_audio_input(
-            self, **kwargs: object) -> Optional[MiDashengLMAudioInputs]:
+        self, **kwargs: object
+    ) -> Optional[MiDashengLMAudioInputs]:
         input_values = kwargs.pop("input_values", None)
         audio_length = kwargs.pop("audio_length", None)
 
         if input_values is None:
             return None
         input_values = self._validate_and_reshape_mm_tensor(
-            input_values, "input_values")
+            input_values, "input_values"
+        )
         audio_length = self._validate_and_reshape_mm_tensor(
-            audio_length, "audio_length")
+            audio_length, "audio_length"
+        )
         if not isinstance(input_values, (torch.Tensor, list)):
-            raise ValueError("Incorrect type of audio input features. "
-                             f"Got type: {type(input_values)}")
+            raise ValueError(
+                "Incorrect type of audio input features. "
+                f"Got type: {type(input_values)}"
+            )
 
         return MiDashengLMAudioInputs(
             input_values=input_values,
             audio_length=audio_length,
         )
 
-    def _process_audio_input(
-            self, audio_input: MiDashengLMAudioInputs) -> torch.Tensor:
+    def _process_audio_input(self, audio_input: MiDashengLMAudioInputs) -> torch.Tensor:
         # Process audio through encoder and projector
         input_values = audio_input["input_values"]
         audio_length = audio_input["audio_length"]
 
-        encoder_out, encoder_atts = self.audio_encoder(input_values,
-                                                       audio_length)
+        encoder_out, encoder_atts = self.audio_encoder(input_values, audio_length)
         audio_embeddings, _ = self.audio_projector(encoder_out, encoder_atts)
-        audio_embeddings = audio_embeddings.to(
-            audio_input["input_values"].dtype)
+        audio_embeddings = audio_embeddings.to(audio_input["input_values"].dtype)
         batch_size, max_audio_tokens, embed_dim = audio_embeddings.shape
 
-        audio_length_np = (audio_length.cpu().numpy() if isinstance(
-            audio_length, torch.Tensor) else audio_length)
+        audio_length_np = (
+            audio_length.cpu().numpy()
+            if isinstance(audio_length, torch.Tensor)
+            else audio_length
+        )
         audio_output_lengths = [
-            max(1, calculate_mel_frames_dasheng(
-                int(length)))  # at least one frame
+            max(1, calculate_mel_frames_dasheng(int(length)))  # at least one frame
             for length in audio_length_np
         ]
         audio_output_lengths = torch.tensor(audio_output_lengths).to(
-            audio_embeddings.device)
+            audio_embeddings.device
+        )
 
         audio_feature_mask = torch.arange(
-            max_audio_tokens,
-            device=audio_embeddings.device).unsqueeze(0).expand(
-                batch_size,
-                max_audio_tokens) < audio_output_lengths.unsqueeze(1)
+            max_audio_tokens, device=audio_embeddings.device
+        ).unsqueeze(0).expand(
+            batch_size, max_audio_tokens
+        ) < audio_output_lengths.unsqueeze(1)
 
-        masked_audio_features = audio_embeddings[audio_feature_mask].view(
-            -1, embed_dim)
+        masked_audio_features = audio_embeddings[audio_feature_mask].view(-1, embed_dim)
 
-        return torch.split(masked_audio_features,
-                           audio_output_lengths.tolist())
+        return torch.split(masked_audio_features, audio_output_lengths.tolist())
 
     def get_language_model(self) -> torch.nn.Module:
         return self.decoder
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         audio_input = self._parse_and_validate_audio_input(**kwargs)
 
         if audio_input is None:
@@ -828,7 +848,6 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.decoder.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/mimo.py b/vllm/model_executor/models/mimo.py
index d256c1f3eed7..e01e06421842 100644
--- a/vllm/model_executor/models/mimo.py
+++ b/vllm/model_executor/models/mimo.py
@@ -25,6 +25,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only MiMo model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -39,7 +40,9 @@
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.model_executor.models.qwen2 import Qwen2ForCausalLM, Qwen2Model
 from vllm.sequence import IntermediateTensors
 
@@ -54,9 +57,9 @@
         "positions": -1,
         "intermediate_tensors": 0,
         "inputs_embeds": 0,
-    })
+    }
+)
 class MiMoModel(Qwen2Model):
-
     def forward(
         self,
         input_ids: torch.Tensor,
@@ -81,15 +84,13 @@ def forward(
                 residual,
             )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states = hidden_states + residual
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             ("qkv_proj", "q_proj", "q"),
             ("qkv_proj", "k_proj", "k"),
@@ -104,18 +105,19 @@ def load_weights(self, weights: Iterable[tuple[str,
                 continue
             if "rotary_emb.inv_freq" in name:
                 continue
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -139,15 +141,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class MiMoForCausalLM(Qwen2ForCausalLM, nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         nn.Module.__init__(self)
         config = vllm_config.model_config.hf_config
@@ -159,25 +159,28 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.quant_config = quant_config
 
-        self.model = MiMoModel(vllm_config=vllm_config,
-                               prefix=maybe_prefix(prefix, "model"))
+        self.model = MiMoModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
         if get_pp_group().is_last_rank:
             if config.tie_word_embeddings:
                 self.lm_head = self.model.embed_tokens
             else:
-                self.lm_head = ParallelLMHead(config.vocab_size,
-                                              config.hidden_size,
-                                              quant_config=quant_config,
-                                              prefix=maybe_prefix(
-                                                  prefix, "lm_head"))
+                self.lm_head = ParallelLMHead(
+                    config.vocab_size,
+                    config.hidden_size,
+                    quant_config=quant_config,
+                    prefix=maybe_prefix(prefix, "lm_head"),
+                )
         else:
             self.lm_head = PPMissingLayer()
 
         self.logits_processor = LogitsProcessor(config.vocab_size)
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def compute_logits(
         self,
diff --git a/vllm/model_executor/models/mimo_mtp.py b/vllm/model_executor/models/mimo_mtp.py
index 9c1e36094c4a..b678a06b7f20 100644
--- a/vllm/model_executor/models/mimo_mtp.py
+++ b/vllm/model_executor/models/mimo_mtp.py
@@ -19,6 +19,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only MiMo-MTP model."""
+
 from collections.abc import Iterable
 from typing import Optional
 
@@ -31,7 +32,9 @@
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.qwen2 import Qwen2DecoderLayer
 from vllm.sequence import IntermediateTensors
@@ -40,7 +43,6 @@
 
 
 class MiMoMultiTokenPredictorLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -51,19 +53,18 @@ def __init__(
     ) -> None:
         super().__init__()
 
-        self.token_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.hidden_layernorm = RMSNorm(config.hidden_size,
-                                        eps=config.rms_norm_eps)
-        self.input_proj = nn.Linear(config.hidden_size * 2,
-                                    config.hidden_size,
-                                    bias=False)
-        self.mtp_block = Qwen2DecoderLayer(config=config,
-                                           cache_config=cache_config,
-                                           quant_config=quant_config,
-                                           prefix=prefix)
-        self.final_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
+        self.token_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.hidden_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.input_proj = nn.Linear(
+            config.hidden_size * 2, config.hidden_size, bias=False
+        )
+        self.mtp_block = Qwen2DecoderLayer(
+            config=config,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=prefix,
+        )
+        self.final_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def forward(
         self,
@@ -79,17 +80,17 @@ def forward(
         previous_hidden_states = self.hidden_layernorm(previous_hidden_states)
 
         hidden_states = self.input_proj(
-            torch.cat([previous_hidden_states, inputs_embeds], dim=-1))
+            torch.cat([previous_hidden_states, inputs_embeds], dim=-1)
+        )
 
-        hidden_states, residual = self.mtp_block(positions=positions,
-                                                 hidden_states=hidden_states,
-                                                 residual=None)
+        hidden_states, residual = self.mtp_block(
+            positions=positions, hidden_states=hidden_states, residual=None
+        )
         hidden_states = residual + hidden_states
         return self.final_layernorm(hidden_states)
 
 
 class MiMoMultiTokenPredictor(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -102,18 +103,21 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             config.hidden_size,
         )
 
-        self.mtp_layers = torch.nn.ModuleDict({
-            str(idx):
-            MiMoMultiTokenPredictorLayer(
-                config,
-                f"{prefix}.layers.{idx}",
-                model_config=vllm_config.model_config,
-                cache_config=vllm_config.cache_config,
-                quant_config=vllm_config.quant_config,
-            )
-            for idx in range(self.mtp_start_layer_idx,
-                             self.mtp_start_layer_idx + self.num_mtp_layers)
-        })
+        self.mtp_layers = torch.nn.ModuleDict(
+            {
+                str(idx): MiMoMultiTokenPredictorLayer(
+                    config,
+                    f"{prefix}.layers.{idx}",
+                    model_config=vllm_config.model_config,
+                    cache_config=vllm_config.cache_config,
+                    quant_config=vllm_config.quant_config,
+                )
+                for idx in range(
+                    self.mtp_start_layer_idx,
+                    self.mtp_start_layer_idx + self.num_mtp_layers,
+                )
+            }
+        )
 
         self.logits_processor = LogitsProcessor(config.vocab_size)
 
@@ -128,7 +132,6 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         spec_step_idx: int = 0,
     ) -> torch.Tensor:
-
         if inputs_embeds is None:
             inputs_embeds = self.embed_tokens(input_ids)
         return self.mtp_layers[str(self.mtp_start_layer_idx + spec_step_idx)](
@@ -150,16 +153,17 @@ def compute_logits(
 
 
 class MiMoMTP(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         self.config = vllm_config.model_config.hf_config
-        self.model = MiMoMultiTokenPredictor(vllm_config=vllm_config,
-                                             prefix=maybe_prefix(
-                                                 prefix, "model"))
-        self.lm_head = ParallelLMHead(self.config.vocab_size,
-                                      self.config.hidden_size,
-                                      prefix=maybe_prefix(prefix, "lm_head"))
+        self.model = MiMoMultiTokenPredictor(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
+        self.lm_head = ParallelLMHead(
+            self.config.vocab_size,
+            self.config.hidden_size,
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -174,8 +178,9 @@ def forward(
         spec_step_idx: int = 0,
     ) -> torch.Tensor:
         assert spec_step_idx == 0, "mimo_mtp only support predict one token now"
-        hidden_states = self.model(input_ids, positions, hidden_states,
-                                   inputs_embeds, spec_step_idx)
+        hidden_states = self.model(
+            input_ids, positions, hidden_states, inputs_embeds, spec_step_idx
+        )
         return hidden_states
 
     def compute_logits(
@@ -183,11 +188,9 @@ def compute_logits(
         hidden_states: torch.Tensor,
         spec_step_idx: int = 0,
     ) -> Optional[torch.Tensor]:
-        return self.model.compute_logits(hidden_states, self.lm_head,
-                                         spec_step_idx)
+        return self.model.compute_logits(hidden_states, self.lm_head, spec_step_idx)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             ("qkv_proj", "q_proj", "q"),
             ("qkv_proj", "k_proj", "k"),
@@ -199,12 +202,11 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-
             if "rotary_emb.inv_freq" in name:
                 continue
             name = self.map_model_name_to_mtp_param_name(name)
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 # Skip non-stacked layers and experts (experts handled below).
                 if weight_name not in name:
                     continue
@@ -216,7 +218,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 # name will be updated to mlp.experts[0].gate_up_proj, which
                 # will then be updated below in expert_params_mapping
                 # for mlp.experts[0].gate_gate_up_proj, which breaks load.
-                if (("mlp.experts." in name) and name not in params_dict):
+                if ("mlp.experts." in name) and name not in params_dict:
                     continue
                 name = name.replace(weight_name, param_name)
                 # Skip loading extra bias for GPTQ models.
@@ -231,12 +233,12 @@ def load_weights(self, weights: Iterable[tuple[str,
                 # Skip loading extra bias for GPTQ models.
                 if name.endswith(".bias") and name not in params_dict:
                     continue
-                if "mtp_layers" not in name and ("embed_tokens" not in name
-                                                 and "lm_head" not in name):
+                if "mtp_layers" not in name and (
+                    "embed_tokens" not in name and "lm_head" not in name
+                ):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -253,8 +255,10 @@ def map_model_name_to_mtp_param_name(self, name: str) -> str:
             name = name.replace(match.group(), f"{match.group(1)}{new_num}.")
         # check for early turn
         name_without_prefix = [
-            "token_layernorm", "hidden_layernorm", "input_proj",
-            "final_layernorm"
+            "token_layernorm",
+            "hidden_layernorm",
+            "input_proj",
+            "final_layernorm",
         ]
         for sub_name in name_without_prefix:
             if sub_name in name:
@@ -272,7 +276,11 @@ def _rewrite_spec_layer_name(self, spec_layer: int, name: str) -> str:
         Add .mtp_block for modules in transformer layer block for spec layer
         """
         spec_layer_weight_names = [
-            "embed_tokens", "enorm", "hnorm", "eh_proj", "shared_head"
+            "embed_tokens",
+            "enorm",
+            "hnorm",
+            "eh_proj",
+            "shared_head",
         ]
         spec_layer_weight = False
         for weight_name in spec_layer_weight_names:
@@ -281,6 +289,7 @@ def _rewrite_spec_layer_name(self, spec_layer: int, name: str) -> str:
                 break
         if not spec_layer_weight:
             # treat rest weights as weights for transformer layer block
-            name = name.replace(f"model.layers.{spec_layer}.",
-                                f"model.layers.{spec_layer}.mtp_block.")
+            name = name.replace(
+                f"model.layers.{spec_layer}.", f"model.layers.{spec_layer}.mtp_block."
+            )
         return name
diff --git a/vllm/model_executor/models/minicpm.py b/vllm/model_executor/models/minicpm.py
index 55fe3e2ae3ae..06cb6bc61576 100644
--- a/vllm/model_executor/models/minicpm.py
+++ b/vllm/model_executor/models/minicpm.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only MiniCPM model compatible with HuggingFace weights."""
+
 import math
 from collections.abc import Iterable
 from itertools import islice
@@ -35,30 +36,42 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (get_pp_group, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_reduce)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_reduce,
+)
 from vllm.model_executor.layers.activation import FatreluAndMul, SiluAndMul
 from vllm.model_executor.layers.fused_moe import fused_experts, fused_topk
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.platforms import current_platform
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsEagle3, SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class MiniCPMMoE(nn.Module):
@@ -90,34 +103,53 @@ def __init__(
             params_dtype = torch.get_default_dtype()
         self.params_dtype = params_dtype
 
-        self.gate = ReplicatedLinear(self.hidden_size,
-                                     self.num_total_experts,
-                                     bias=False,
-                                     params_dtype=self.params_dtype,
-                                     quant_config=None)
+        self.gate = ReplicatedLinear(
+            self.hidden_size,
+            self.num_total_experts,
+            bias=False,
+            params_dtype=self.params_dtype,
+            quant_config=None,
+        )
 
         self.ws = nn.Parameter(
-            torch.empty(self.num_total_experts,
-                        2 * self.intermediate_size,
-                        self.hidden_size,
-                        device=current_platform.device_type,
-                        dtype=self.params_dtype))
+            torch.empty(
+                self.num_total_experts,
+                2 * self.intermediate_size,
+                self.hidden_size,
+                device=current_platform.device_type,
+                dtype=self.params_dtype,
+            )
+        )
         self.w2s = nn.Parameter(
-            torch.empty(self.num_total_experts,
-                        self.hidden_size,
-                        self.intermediate_size,
-                        device=current_platform.device_type,
-                        dtype=self.params_dtype))
-
-        set_weight_attrs(self.ws, {
-            "weight_loader": self.weight_loader,
-        })
-        set_weight_attrs(self.w2s, {
-            "weight_loader": self.weight_loader,
-        })
-
-    def weight_loader(self, param: nn.Parameter, loaded_weight: torch.Tensor,
-                      weight_name: str, expert_id: int):
+            torch.empty(
+                self.num_total_experts,
+                self.hidden_size,
+                self.intermediate_size,
+                device=current_platform.device_type,
+                dtype=self.params_dtype,
+            )
+        )
+
+        set_weight_attrs(
+            self.ws,
+            {
+                "weight_loader": self.weight_loader,
+            },
+        )
+        set_weight_attrs(
+            self.w2s,
+            {
+                "weight_loader": self.weight_loader,
+            },
+        )
+
+    def weight_loader(
+        self,
+        param: nn.Parameter,
+        loaded_weight: torch.Tensor,
+        weight_name: str,
+        expert_id: int,
+    ):
         tp_rank = get_tensor_model_parallel_rank()
         param_data = param.data
         shard_size = self.intermediate_size
@@ -125,8 +157,9 @@ def weight_loader(self, param: nn.Parameter, loaded_weight: torch.Tensor,
         if weight_name.endswith("w1.weight"):
             param_data[expert_id, 0:shard_size, :] = loaded_weight[shard, :]
         if weight_name.endswith("w3.weight"):
-            param_data[expert_id,
-                       shard_size:2 * shard_size, :] = loaded_weight[shard, :]
+            param_data[expert_id, shard_size : 2 * shard_size, :] = loaded_weight[
+                shard, :
+            ]
         if weight_name.endswith("w2.weight"):
             param_data[expert_id, :, :] = loaded_weight[:, shard]
 
@@ -136,27 +169,21 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         # router_logits: (num_tokens, n_experts)
         router_logits, _ = self.gate(hidden_states)
 
-        topk_weights, topk_ids, _ = fused_topk(hidden_states,
-                                               router_logits,
-                                               self.top_k,
-                                               renormalize=True)
+        topk_weights, topk_ids, _ = fused_topk(
+            hidden_states, router_logits, self.top_k, renormalize=True
+        )
 
-        final_hidden_states = fused_experts(hidden_states,
-                                            self.ws,
-                                            self.w2s,
-                                            topk_weights,
-                                            topk_ids,
-                                            inplace=True)
+        final_hidden_states = fused_experts(
+            hidden_states, self.ws, self.w2s, topk_weights, topk_ids, inplace=True
+        )
 
         if self.tp_size > 1:
-            final_hidden_states = tensor_model_parallel_all_reduce(
-                final_hidden_states)
+            final_hidden_states = tensor_model_parallel_all_reduce(final_hidden_states)
 
         return final_hidden_states.view(num_tokens, hidden_size)
 
 
 class MiniCPMMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -167,20 +194,20 @@ def __init__(
     ) -> None:
         super().__init__()
         self.gate_up_proj = MergedColumnParallelLinear(
-            hidden_size, [intermediate_size] * 2,
-            bias=False,
-            quant_config=quant_config)
-        self.down_proj = RowParallelLinear(intermediate_size,
-                                           hidden_size,
-                                           bias=False,
-                                           quant_config=quant_config)
+            hidden_size, [intermediate_size] * 2, bias=False, quant_config=quant_config
+        )
+        self.down_proj = RowParallelLinear(
+            intermediate_size, hidden_size, bias=False, quant_config=quant_config
+        )
         if hidden_act == "silu":
             self.act_fn = SiluAndMul()
         elif hidden_act == "fatrelu":
             self.act_fn = FatreluAndMul(threshold=hidden_act_param)
         else:
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu and fatrelu are supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. "
+                "Only silu and fatrelu are supported for now."
+            )
 
     def forward(self, x):
         gate_up, _ = self.gate_up_proj(x)
@@ -190,7 +217,6 @@ def forward(self, x):
 
 
 class MiniCPMAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -249,13 +275,15 @@ def __init__(
             rope_scaling=rope_scaling,
         )
 
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -274,7 +302,6 @@ def forward(
 
 
 class MiniCPMDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -289,15 +316,15 @@ def __init__(
         self.hidden_size = config.hidden_size
         self.rope_theta = getattr(config, "rope_theta", 10000)
         self.rope_scaling = getattr(config, "rope_scaling", None)
-        self.max_position_embeddings = getattr(config,
-                                               "max_position_embeddings", 8192)
+        self.max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         self.prefix = prefix
         self._init_attn_block()
         self._init_ffn_block()
 
     def _init_attn_block(self):
-        self.input_layernorm = RMSNorm(self.config.hidden_size,
-                                       eps=self.config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(
+            self.config.hidden_size, eps=self.config.rms_norm_eps
+        )
         self.self_attn = MiniCPMAttention(
             hidden_size=self.hidden_size,
             num_heads=self.config.num_attention_heads,
@@ -311,15 +338,16 @@ def _init_attn_block(self):
         )
 
     def _init_ffn_block(self):
-        self.post_attention_layernorm = RMSNorm(self.config.hidden_size,
-                                                eps=self.config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            self.config.hidden_size, eps=self.config.rms_norm_eps
+        )
         self.num_experts = getattr(self.config, "num_experts", 0)
         if self.num_experts == 0:
             self.mlp = MiniCPMMLP(
                 hidden_size=self.hidden_size,
                 intermediate_size=self.config.intermediate_size,
                 hidden_act=self.config.hidden_act,
-                hidden_act_param=getattr(self.config, "hidden_act_param", 0.),
+                hidden_act_param=getattr(self.config, "hidden_act_param", 0.0),
                 quant_config=self.quant_config,
             )
         else:
@@ -327,7 +355,8 @@ def _init_ffn_block(self):
                 num_experts=self.config.num_experts,
                 top_k=self.config.num_experts_per_tok,
                 hidden_size=self.config.hidden_size,
-                intermediate_size=self.config.intermediate_size)
+                intermediate_size=self.config.intermediate_size,
+            )
 
     def forward(
         self,
@@ -342,22 +371,23 @@ def forward(
             positions=positions,
             hidden_states=hidden_states,
         )
-        hidden_states = residual + hidden_states * \
-            (self.config.scale_depth / math.sqrt(self.config.num_hidden_layers))
+        hidden_states = residual + hidden_states * (
+            self.config.scale_depth / math.sqrt(self.config.num_hidden_layers)
+        )
 
         # Fully Connected
         residual = hidden_states
         hidden_states = self.post_attention_layernorm(hidden_states)
         hidden_states = self.mlp(hidden_states)
-        hidden_states = residual + hidden_states * \
-            (self.config.scale_depth / math.sqrt(self.config.num_hidden_layers))
+        hidden_states = residual + hidden_states * (
+            self.config.scale_depth / math.sqrt(self.config.num_hidden_layers)
+        )
 
         return hidden_states, None
 
 
 @support_torch_compile
 class MiniCPMModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -369,8 +399,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.config = config
         self.cache_config = cache_config
         self.quant_config = quant_config
-        lora_vocab = (lora_config.lora_extra_vocab_size *
-                      (lora_config.max_loras or 1)) if lora_config else 0
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
         self.embed_tokens = VocabParallelEmbedding(
@@ -384,9 +417,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.aux_hidden_state_layers = tuple[int, ...]()
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], self.config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], self.config.hidden_size
+        )
 
     def _init_layers(
         self,
@@ -398,8 +431,10 @@ def _init_layers(
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: MiniCPMDecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.layers",
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         embedding = self.embed_tokens(input_ids)
@@ -411,8 +446,9 @@ def forward(
         positions: torch.Tensor,
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
-    ) -> Union[torch.Tensor, IntermediateTensors, tuple[torch.Tensor,
-                                                        list[torch.Tensor]]]:
+    ) -> Union[
+        torch.Tensor, IntermediateTensors, tuple[torch.Tensor, list[torch.Tensor]]
+    ]:
         if get_pp_group().is_first_rank:
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
@@ -425,11 +461,12 @@ def forward(
 
         aux_hidden_states = []
         for idx, layer in enumerate(
-                islice(self.layers, self.start_layer, self.end_layer)):
+            islice(self.layers, self.start_layer, self.end_layer)
+        ):
             if idx in self.aux_hidden_state_layers:
                 aux_hidden_states.append(
-                    hidden_states +
-                    residual if residual is not None else hidden_states)
+                    hidden_states + residual if residual is not None else hidden_states
+                )
             hidden_states, residual = layer(
                 positions,
                 hidden_states,
@@ -437,10 +474,9 @@ def forward(
             )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states = self.norm(hidden_states)
 
@@ -448,8 +484,7 @@ def forward(
             return hidden_states, aux_hidden_states
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -460,8 +495,11 @@ def load_weights(self, weights: Iterable[tuple[str,
         ]
         expert_params_mapping = [
             # (param_name, weight_name, expert_id)
-            ("ws" if weight_name in ["w1", "w3"] else "w2s",
-             f"experts.{expert_id}.{weight_name}.weight", expert_id)
+            (
+                "ws" if weight_name in ["w1", "w3"] else "w2s",
+                f"experts.{expert_id}.{weight_name}.weight",
+                expert_id,
+            )
             for expert_id in range(self.num_experts)
             for weight_name in ["w1", "w2", "w3"]
         ]
@@ -471,12 +509,11 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            if ("rotary_emb.cos_cached" in name
-                    or "rotary_emb.sin_cached" in name):
+            if "rotary_emb.cos_cached" in name or "rotary_emb.sin_cached" in name:
                 # Models trained using ColossalAI may include these tensors in
                 # the checkpoint. Skip them.
                 continue
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -498,10 +535,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
                     param = params_dict[name]
                     weight_loader = param.weight_loader
-                    weight_loader(param,
-                                  loaded_weight,
-                                  weight_name,
-                                  expert_id=expert_id)
+                    weight_loader(
+                        param, loaded_weight, weight_name, expert_id=expert_id
+                    )
                     break
                 else:
                     # Skip loading extra bias for GPTQ models.
@@ -510,8 +546,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                     if is_pp_missing_parameter(name, self):
                         continue
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -551,8 +588,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.cache_config = cache_config
         self.quant_config = quant_config
 
-        self.model = self._init_model(vllm_config=vllm_config,
-                                      prefix=maybe_prefix(prefix, "model"))
+        self.model = self._init_model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
         unpadded_vocab_size = config.vocab_size
         if lora_config:
@@ -564,7 +602,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             padding_size=DEFAULT_VOCAB_PADDING_SIZE
             # We need bigger padding if using lora for kernel
             # compatibility
-            if not lora_config else lora_config.lora_vocab_padding_size,
+            if not lora_config
+            else lora_config.lora_vocab_padding_size,
             quant_config=quant_config,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
@@ -572,10 +611,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
         self.scale_width = self.config.hidden_size / self.config.dim_model_base
 
-        self.logits_processor = LogitsProcessor(unpadded_vocab_size,
-                                                config.vocab_size)
+        self.logits_processor = LogitsProcessor(unpadded_vocab_size, config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def _init_model(self, *, vllm_config: VllmConfig, prefix: str = ""):
         return MiniCPMModel(vllm_config=vllm_config, prefix=prefix)
@@ -596,10 +635,12 @@ def forward(
         positions: torch.Tensor,
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
-    ) -> Union[torch.Tensor, IntermediateTensors, tuple[torch.Tensor,
-                                                        list[torch.Tensor]]]:
-        model_output = self.model(input_ids, positions, intermediate_tensors,
-                                  inputs_embeds)
+    ) -> Union[
+        torch.Tensor, IntermediateTensors, tuple[torch.Tensor, list[torch.Tensor]]
+    ]:
+        model_output = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
 
         if isinstance(model_output, tuple) and len(model_output) == 2:
             # Aux hidden states are present.
@@ -621,11 +662,9 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/minicpm3.py b/vllm/model_executor/models/minicpm3.py
index 92c13e81bf3e..35f02a1538e8 100644
--- a/vllm/model_executor/models/minicpm3.py
+++ b/vllm/model_executor/models/minicpm3.py
@@ -24,6 +24,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only MiniCPM3 model compatible with HuggingFace weights."""
+
 from typing import Any, Optional
 
 import torch
@@ -34,20 +35,23 @@
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
-from vllm.model_executor.models.minicpm import (MiniCPMDecoderLayer,
-                                                MiniCPMForCausalLM,
-                                                MiniCPMModel)
+from vllm.model_executor.models.minicpm import (
+    MiniCPMDecoderLayer,
+    MiniCPMForCausalLM,
+    MiniCPMModel,
+)
 
 from .utils import make_layers
 
 
 class MiniCPM3Attention(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -83,33 +87,37 @@ def __init__(
         self.rope_theta = rope_theta
         self.max_position_embeddings = max_position_embeddings
 
-        self.q_a_proj = ReplicatedLinear(self.hidden_size,
-                                         self.q_lora_rank,
-                                         bias=False,
-                                         quant_config=quant_config)
+        self.q_a_proj = ReplicatedLinear(
+            self.hidden_size, self.q_lora_rank, bias=False, quant_config=quant_config
+        )
         self.q_a_layernorm = RMSNorm(self.q_lora_rank, eps=config.rms_norm_eps)
-        self.q_b_proj = ColumnParallelLinear(q_lora_rank,
-                                             self.num_heads * self.qk_head_dim,
-                                             bias=False,
-                                             quant_config=quant_config)
-
-        self.kv_a_proj_with_mqa = ReplicatedLinear(self.hidden_size,
-                                                   self.kv_lora_rank +
-                                                   self.qk_rope_head_dim,
-                                                   bias=False,
-                                                   quant_config=quant_config)
-        self.kv_a_layernorm = RMSNorm(self.kv_lora_rank,
-                                      eps=config.rms_norm_eps)
+        self.q_b_proj = ColumnParallelLinear(
+            q_lora_rank,
+            self.num_heads * self.qk_head_dim,
+            bias=False,
+            quant_config=quant_config,
+        )
+
+        self.kv_a_proj_with_mqa = ReplicatedLinear(
+            self.hidden_size,
+            self.kv_lora_rank + self.qk_rope_head_dim,
+            bias=False,
+            quant_config=quant_config,
+        )
+        self.kv_a_layernorm = RMSNorm(self.kv_lora_rank, eps=config.rms_norm_eps)
         self.kv_b_proj = ColumnParallelLinear(
             self.kv_lora_rank,
             self.num_heads * (self.qk_nope_head_dim + self.v_head_dim),
             bias=False,
-            quant_config=quant_config)
+            quant_config=quant_config,
+        )
         # O projection.
-        self.o_proj = RowParallelLinear(self.num_heads * self.v_head_dim,
-                                        self.hidden_size,
-                                        bias=False,
-                                        quant_config=quant_config)
+        self.o_proj = RowParallelLinear(
+            self.num_heads * self.v_head_dim,
+            self.hidden_size,
+            bias=False,
+            quant_config=quant_config,
+        )
 
         self.rotary_emb = get_rope(
             self.qk_rope_head_dim,
@@ -118,13 +126,15 @@ def __init__(
             base=rope_theta,
             rope_scaling=rope_scaling,
         )
-        self.attn = Attention(self.num_local_heads,
-                              self.qk_head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_local_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_local_heads,
+            self.qk_head_dim,
+            self.scaling,
+            num_kv_heads=self.num_local_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -135,55 +145,52 @@ def forward(
         q = self.q_a_layernorm(q)
         q, _ = self.q_b_proj(q)
         q = q.view(-1, self.num_local_heads, self.qk_head_dim)
-        _, q_pe = q.split([self.qk_nope_head_dim, self.qk_rope_head_dim],
-                          dim=-1)
+        _, q_pe = q.split([self.qk_nope_head_dim, self.qk_rope_head_dim], dim=-1)
         latent_cache, _ = self.kv_a_proj_with_mqa(hidden_states)
-        kv_a, _ = latent_cache.split(
-            [self.kv_lora_rank, self.qk_rope_head_dim], dim=-1)
+        kv_a, _ = latent_cache.split([self.kv_lora_rank, self.qk_rope_head_dim], dim=-1)
         latent_cache = latent_cache.unsqueeze(1)
         kv_a = self.kv_a_layernorm(kv_a.contiguous())
         kv, _ = self.kv_b_proj(kv_a)
-        kv = kv.view(-1, self.num_local_heads,
-                     self.qk_nope_head_dim + self.v_head_dim)
+        kv = kv.view(-1, self.num_local_heads, self.qk_nope_head_dim + self.v_head_dim)
         k_nope, v = kv.split([self.qk_nope_head_dim, self.v_head_dim], dim=-1)
 
-        k_pe = latent_cache[:, :, self.kv_lora_rank:]
+        k_pe = latent_cache[:, :, self.kv_lora_rank :]
 
         q_pe, k_pe = self.rotary_emb(
             positions,
             q_pe.reshape(-1, self.num_local_heads * self.qk_rope_head_dim),
-            k_pe.reshape(-1, self.qk_rope_head_dim))
+            k_pe.reshape(-1, self.qk_rope_head_dim),
+        )
         q_pe = q_pe.view(-1, self.num_local_heads, self.qk_rope_head_dim)
         k_pe = k_pe.view(-1, 1, self.qk_rope_head_dim)
 
-        q[..., self.qk_nope_head_dim:] = q_pe
+        q[..., self.qk_nope_head_dim :] = q_pe
 
         k = torch.empty_like(q)
 
-        k[..., :self.qk_nope_head_dim] = k_nope
-        k[..., self.qk_nope_head_dim:] = k_pe
+        k[..., : self.qk_nope_head_dim] = k_nope
+        k[..., self.qk_nope_head_dim :] = k_pe
 
         q = q.reshape(-1, self.num_local_heads * self.qk_head_dim)
         k = k.view(-1, self.num_local_heads * self.qk_head_dim)
         v = torch.nn.functional.pad(
-            v, [0, self.qk_head_dim - self.v_head_dim],
-            value=0).view(-1, self.num_local_heads * self.qk_head_dim)
+            v, [0, self.qk_head_dim - self.v_head_dim], value=0
+        ).view(-1, self.num_local_heads * self.qk_head_dim)
 
         attn_output = self.attn(q, k, v)
-        attn_output = attn_output.view(
-            -1, self.num_local_heads,
-            self.qk_head_dim)[..., :self.v_head_dim].reshape(
-                -1, self.num_local_heads * self.v_head_dim)
+        attn_output = attn_output.view(-1, self.num_local_heads, self.qk_head_dim)[
+            ..., : self.v_head_dim
+        ].reshape(-1, self.num_local_heads * self.v_head_dim)
 
         output, _ = self.o_proj(attn_output)
         return output
 
 
 class MiniCPM3DecoderLayer(MiniCPMDecoderLayer):
-
     def _init_attn_block(self):
-        self.input_layernorm = RMSNorm(self.config.hidden_size,
-                                       eps=self.config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(
+            self.config.hidden_size, eps=self.config.rms_norm_eps
+        )
         self.self_attn = MiniCPM3Attention(
             config=self.config,
             hidden_size=self.hidden_size,
@@ -203,7 +210,6 @@ def _init_attn_block(self):
 
 
 class MiniCPM3Model(MiniCPMModel):
-
     def _init_layers(
         self,
         prefix: str,
@@ -214,8 +220,10 @@ def _init_layers(
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: MiniCPM3DecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.layers",
+        )
 
 
 class MiniCPM3ForCausalLM(MiniCPMForCausalLM):
diff --git a/vllm/model_executor/models/minicpm_eagle.py b/vllm/model_executor/models/minicpm_eagle.py
index 2af0d546ce63..6c635b248109 100644
--- a/vllm/model_executor/models/minicpm_eagle.py
+++ b/vllm/model_executor/models/minicpm_eagle.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only EagleMiniCPM model compatible with HuggingFace weights."""
+
 import math
 from collections.abc import Iterable
 from typing import Optional, Union
@@ -37,7 +38,10 @@
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
@@ -45,12 +49,15 @@
 from .minicpm import MiniCPMAttention as EagleMiniCPMAttention
 from .minicpm import MiniCPMMLP as EagleMiniCPMMLP
 from .minicpm import MiniCPMMoE as EagleMiniCPMMoE
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    maybe_prefix,
+)
 
 
 class EagleMiniCPMDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -65,15 +72,15 @@ def __init__(
         self.hidden_size = config.hidden_size
         self.rope_theta = getattr(config, "rope_theta", 10000)
         self.rope_scaling = getattr(config, "rope_scaling", None)
-        self.max_position_embeddings = getattr(config,
-                                               "max_position_embeddings", 8192)
+        self.max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         self.prefix = prefix
         self._init_attn_block()
         self._init_ffn_block()
 
     def _init_attn_block(self):
-        self.input_layernorm = RMSNorm(self.config.hidden_size,
-                                       eps=self.config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(
+            self.config.hidden_size, eps=self.config.rms_norm_eps
+        )
         self.self_attn = EagleMiniCPMAttention(
             hidden_size=self.hidden_size,
             num_heads=self.config.num_attention_heads,
@@ -87,15 +94,16 @@ def _init_attn_block(self):
         )
 
     def _init_ffn_block(self):
-        self.post_attention_layernorm = RMSNorm(self.config.hidden_size,
-                                                eps=self.config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            self.config.hidden_size, eps=self.config.rms_norm_eps
+        )
         self.num_experts = getattr(self.config, "num_experts", 0)
         if self.num_experts == 0:
             self.mlp = EagleMiniCPMMLP(
                 hidden_size=self.hidden_size,
                 intermediate_size=self.config.intermediate_size,
                 hidden_act=self.config.hidden_act,
-                hidden_act_param=getattr(self.config, "hidden_act_param", 0.),
+                hidden_act_param=getattr(self.config, "hidden_act_param", 0.0),
                 quant_config=self.quant_config,
             )
         else:
@@ -103,7 +111,8 @@ def _init_ffn_block(self):
                 num_experts=self.config.num_experts,
                 top_k=self.config.num_experts_per_tok,
                 hidden_size=self.config.hidden_size,
-                intermediate_size=self.config.intermediate_size)
+                intermediate_size=self.config.intermediate_size,
+            )
 
     def forward(
         self,
@@ -118,27 +127,26 @@ def forward(
             positions=positions,
             hidden_states=hidden_states,
         )
-        hidden_states = residual + hidden_states * \
-            (self.config.scale_depth / math.sqrt(self.config.mup_denominator))
+        hidden_states = residual + hidden_states * (
+            self.config.scale_depth / math.sqrt(self.config.mup_denominator)
+        )
 
         # Fully Connected
         residual = hidden_states
         hidden_states = self.post_attention_layernorm(hidden_states)
         hidden_states = self.mlp(hidden_states)
-        hidden_states = residual + hidden_states * \
-            (self.config.scale_depth / math.sqrt(self.config.mup_denominator))
+        hidden_states = residual + hidden_states * (
+            self.config.scale_depth / math.sqrt(self.config.mup_denominator)
+        )
 
         return hidden_states, None
 
 
 @support_torch_compile
 class EagleMiniCPMModel(nn.Module):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 start_layer: int = 0):
+    def __init__(
+        self, *, vllm_config: VllmConfig, prefix: str = "", start_layer: int = 0
+    ):
         super().__init__()
 
         config = vllm_config.speculative_config.draft_model_config.hf_config
@@ -149,13 +157,16 @@ def __init__(self,
         self.config = config
         self.cache_config = cache_config
         self.quant_config = quant_config
-        lora_vocab = (lora_config.lora_extra_vocab_size *
-                      (lora_config.max_loras or 1)) if lora_config else 0
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
-        self.fc = torch.nn.Linear(self.config.hidden_size * 2,
-                                  self.config.hidden_size,
-                                  bias=False)
+        self.fc = torch.nn.Linear(
+            self.config.hidden_size * 2, self.config.hidden_size, bias=False
+        )
         self.input_norm1 = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         self.input_norm2 = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         self.embed_tokens = VocabParallelEmbedding(
@@ -164,12 +175,11 @@ def __init__(self,
             org_num_embeddings=config.vocab_size,
         )
         self.num_experts = getattr(self.config, "num_experts", 0)
-        self._init_layers(prefix, config, cache_config, quant_config,
-                          start_layer)
+        self._init_layers(prefix, config, cache_config, quant_config, start_layer)
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], self.config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], self.config.hidden_size
+        )
 
     def _init_layers(
         self,
@@ -179,14 +189,17 @@ def _init_layers(
         quant_config: Optional[QuantizationConfig],
         start_layer: int,
     ):
-        self.eagle_layers = nn.ModuleList([
-            EagleMiniCPMDecoderLayer(
-                config,
-                cache_config,
-                quant_config,
-                f"{prefix}.eagle_layers.{i + start_layer}",
-            ) for i in range(self.config.num_hidden_layers)
-        ])
+        self.eagle_layers = nn.ModuleList(
+            [
+                EagleMiniCPMDecoderLayer(
+                    config,
+                    cache_config,
+                    quant_config,
+                    f"{prefix}.eagle_layers.{i + start_layer}",
+                )
+                for i in range(self.config.num_hidden_layers)
+            ]
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         embedding = self.embed_tokens(input_ids)
@@ -202,8 +215,7 @@ def forward(
         input_embeds = self.input_norm1(input_embeds)
         hidden_states = self.input_norm2(hidden_states)
 
-        hidden_states = self.fc(
-            torch.cat((input_embeds, hidden_states), dim=-1))
+        hidden_states = self.fc(torch.cat((input_embeds, hidden_states), dim=-1))
         residual = None
         for layer in self.eagle_layers:
             hidden_states, residual = layer(
@@ -214,8 +226,7 @@ def forward(
 
         return hidden_states, hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -226,8 +237,11 @@ def load_weights(self, weights: Iterable[tuple[str,
         ]
         expert_params_mapping = [
             # (param_name, weight_name, expert_id)
-            ("ws" if weight_name in ["w1", "w3"] else "w2s",
-             f"experts.{expert_id}.{weight_name}.weight", expert_id)
+            (
+                "ws" if weight_name in ["w1", "w3"] else "w2s",
+                f"experts.{expert_id}.{weight_name}.weight",
+                expert_id,
+            )
             for expert_id in range(self.num_experts)
             for weight_name in ["w1", "w2", "w3"]
         ]
@@ -237,12 +251,11 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            if ("rotary_emb.cos_cached" in name
-                    or "rotary_emb.sin_cached" in name):
+            if "rotary_emb.cos_cached" in name or "rotary_emb.sin_cached" in name:
                 # Models trained using ColossalAI may include these tensors in
                 # the checkpoint. Skip them.
                 continue
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -264,10 +277,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
                     param = params_dict[name]
                     weight_loader = param.weight_loader
-                    weight_loader(param,
-                                  loaded_weight,
-                                  weight_name,
-                                  expert_id=expert_id)
+                    weight_loader(
+                        param, loaded_weight, weight_name, expert_id=expert_id
+                    )
                     break
                 else:
                     # Skip loading extra bias for GPTQ models.
@@ -276,8 +288,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                     if is_pp_missing_parameter(name, self):
                         continue
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
 
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
@@ -319,11 +332,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.quant_config = quant_config
 
         target_layer_num = vllm_config.model_config.get_num_layers(
-            vllm_config.parallel_config)
+            vllm_config.parallel_config
+        )
 
-        self.model = self._init_model(vllm_config=vllm_config,
-                                      prefix=maybe_prefix(prefix, "model"),
-                                      start_layer=target_layer_num)
+        self.model = self._init_model(
+            vllm_config=vllm_config,
+            prefix=maybe_prefix(prefix, "model"),
+            start_layer=target_layer_num,
+        )
 
         unpadded_vocab_size = config.vocab_size
         if lora_config:
@@ -335,7 +351,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             padding_size=DEFAULT_VOCAB_PADDING_SIZE
             # We need bigger padding if using lora for kernel
             # compatibility
-            if not lora_config else lora_config.lora_vocab_padding_size,
+            if not lora_config
+            else lora_config.lora_vocab_padding_size,
             quant_config=quant_config,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
@@ -343,19 +360,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
         self.scale_width = self.config.hidden_size / self.config.dim_model_base
 
-        self.logits_processor = LogitsProcessor(unpadded_vocab_size,
-                                                config.vocab_size)
+        self.logits_processor = LogitsProcessor(unpadded_vocab_size, config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
-    def _init_model(self,
-                    *,
-                    vllm_config: VllmConfig,
-                    prefix: str = "",
-                    start_layer: int = 0):
-        return EagleMiniCPMModel(vllm_config=vllm_config,
-                                 prefix=prefix,
-                                 start_layer=start_layer)
+    def _init_model(
+        self, *, vllm_config: VllmConfig, prefix: str = "", start_layer: int = 0
+    ):
+        return EagleMiniCPMModel(
+            vllm_config=vllm_config, prefix=prefix, start_layer=start_layer
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -366,8 +381,7 @@ def forward(
         positions: torch.Tensor,
         hidden_states: torch.Tensor,
     ) -> tuple[torch.Tensor, torch.Tensor]:
-        hidden_states, hidden_states2 = self.model(input_ids, positions,
-                                                   hidden_states)
+        hidden_states, hidden_states2 = self.model(input_ids, positions, hidden_states)
         hidden_states = hidden_states / self.scale_width
         hidden_states2 = hidden_states2 / self.scale_width
         return hidden_states, hidden_states2
@@ -379,11 +393,9 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/minicpmo.py b/vllm/model_executor/models/minicpmo.py
index 74b2a2e62cd5..34f05122abe3 100644
--- a/vllm/model_executor/models/minicpmo.py
+++ b/vllm/model_executor/models/minicpmo.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only MiniCPM-O model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable, Mapping, Sequence
 from typing import Annotated, Any, Callable, Literal, Optional, Union
 
@@ -30,31 +31,47 @@
 from torch import nn
 from transformers import BatchFeature
 from transformers.modeling_outputs import BaseModelOutputWithPast
-from transformers.models.whisper.modeling_whisper import (ACT2FN,
-                                                          WhisperAttention,
-                                                          WhisperConfig,
-                                                          WhisperEncoder)
+from transformers.models.whisper.modeling_whisper import (
+    ACT2FN,
+    WhisperAttention,
+    WhisperConfig,
+    WhisperEncoder,
+)
 
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.multimodal import MULTIMODAL_REGISTRY, MultiModalKwargsItems
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    NestedTensors)
-from vllm.multimodal.parse import (AudioItem, AudioProcessorItems,
-                                   DictEmbeddingItems, ModalityData,
-                                   ModalityDataItems, MultiModalDataItems,
-                                   MultiModalDataParser)
-from vllm.multimodal.processing import (PromptReplacement, PromptUpdate,
-                                        PromptUpdateDetails)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    NestedTensors,
+)
+from vllm.multimodal.parse import (
+    AudioItem,
+    AudioProcessorItems,
+    DictEmbeddingItems,
+    ModalityData,
+    ModalityDataItems,
+    MultiModalDataItems,
+    MultiModalDataParser,
+)
+from vllm.multimodal.processing import (
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-from .minicpmv import (_MAX_FRAMES_PER_VIDEO, MiniCPMV2_6,
-                       MiniCPMVDummyInputsBuilder,
-                       MiniCPMVMultiModalDataParser,
-                       MiniCPMVMultiModalProcessor, MiniCPMVProcessingInfo,
-                       _minicpmv_field_config)
-from .utils import (AutoWeightsLoader, cast_overflow_tensors, flatten_bn,
-                    maybe_prefix)
+from .minicpmv import (
+    _MAX_FRAMES_PER_VIDEO,
+    MiniCPMV2_6,
+    MiniCPMVDummyInputsBuilder,
+    MiniCPMVMultiModalDataParser,
+    MiniCPMVMultiModalProcessor,
+    MiniCPMVProcessingInfo,
+    _minicpmv_field_config,
+)
+from .utils import AutoWeightsLoader, cast_overflow_tensors, flatten_bn, maybe_prefix
 
 CPU_DEVICE = torch.device("cpu")
 
@@ -68,6 +85,7 @@ class MiniCPMOAudioFeatureInputs(TensorSchema):
         - l: Length
         - s: Number of slices
     """
+
     type: Literal["audio_features"] = "audio_features"
 
     audio_features: Annotated[
@@ -96,9 +114,10 @@ class MiniCPMOAudioEmbeddingInputs(TensorSchema):
         - bn: Batch size * number of audios
         - s: Number of slices
         - h: Hidden size (must match language model backbone)
-    
+
     Length of each slice may vary, so pass it as a list.
     """
+
     type: Literal["audio_embeds"] = "audio_embeds"
 
     audio_embeds: Annotated[
@@ -107,8 +126,7 @@ class MiniCPMOAudioEmbeddingInputs(TensorSchema):
     ]
 
 
-MiniCPMOAudioInputs = Union[MiniCPMOAudioFeatureInputs,
-                            MiniCPMOAudioEmbeddingInputs]
+MiniCPMOAudioInputs = Union[MiniCPMOAudioFeatureInputs, MiniCPMOAudioEmbeddingInputs]
 
 
 def _minicpmo_field_config(hf_inputs: Mapping[str, torch.Tensor]):
@@ -125,7 +143,6 @@ def _minicpmo_field_config(hf_inputs: Mapping[str, torch.Tensor]):
 
 
 class MiniCPMOAudioEmbeddingItems(DictEmbeddingItems):
-
     def __init__(
         self,
         data: Mapping[str, torch.Tensor],
@@ -143,7 +160,6 @@ def __init__(
 
 
 class MiniCPMOMultiModalDataParser(MiniCPMVMultiModalDataParser):
-
     def _parse_audio_data(
         self,
         data: Union[dict[str, torch.Tensor], ModalityData[AudioItem]],
@@ -215,18 +231,17 @@ def get_num_frames_with_most_features(
 
         max_image_tokens = self.get_max_image_tokens() * max_images
         max_audio_tokens = self.get_max_audio_tokens() * max_audios
-        max_total_frames = self.get_max_video_frames(seq_len -
-                                                     max_image_tokens -
-                                                     max_audio_tokens)
-        max_frames_per_video = min(max_total_frames // max(max_videos, 1),
-                                   _MAX_FRAMES_PER_VIDEO)
+        max_total_frames = self.get_max_video_frames(
+            seq_len - max_image_tokens - max_audio_tokens
+        )
+        max_frames_per_video = min(
+            max_total_frames // max(max_videos, 1), _MAX_FRAMES_PER_VIDEO
+        )
 
         return max(max_frames_per_video, 1)
 
 
-class MiniCPMODummyInputsBuilder(
-        MiniCPMVDummyInputsBuilder[MiniCPMOProcessingInfo]):
-
+class MiniCPMODummyInputsBuilder(MiniCPMVDummyInputsBuilder[MiniCPMOProcessingInfo]):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_audios = mm_counts.get("audio", 0)
 
@@ -241,16 +256,17 @@ def get_dummy_mm_data(
         mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
         num_audios = mm_counts.get("audio", 0)
-        audio_len = self.info.get_max_audio_chunks_with_most_features() * \
-            self.info.get_default_audio_sampling_rate()
+        audio_len = (
+            self.info.get_max_audio_chunks_with_most_features()
+            * self.info.get_default_audio_sampling_rate()
+        )
 
         audio_overrides = mm_options.get("audio") if mm_options else None
 
         audio_mm_data = {
-            "audio":
-            self._get_dummy_audios(length=audio_len,
-                                   num_audios=num_audios,
-                                   overrides=audio_overrides)
+            "audio": self._get_dummy_audios(
+                length=audio_len, num_audios=num_audios, overrides=audio_overrides
+            )
         }
 
         return {
@@ -259,12 +275,11 @@ def get_dummy_mm_data(
         }
 
 
-class MiniCPMOMultiModalProcessor(
-        MiniCPMVMultiModalProcessor[MiniCPMOProcessingInfo]):
-
+class MiniCPMOMultiModalProcessor(MiniCPMVMultiModalProcessor[MiniCPMOProcessingInfo]):
     def _get_data_parser(self) -> MultiModalDataParser:
         return MiniCPMOMultiModalDataParser(
-            target_sr=self.info.get_default_audio_sampling_rate())
+            target_sr=self.info.get_default_audio_sampling_rate()
+        )
 
     def get_audio_prompt_texts(
         self,
@@ -287,10 +302,11 @@ def process_audios(
         if (audios := mm_data.get("audios")) is None:
             return {}
 
-        parsed_audios = (self._get_data_parser().parse_mm_data({
-            "audio": audios
-        }).get_items("audio",
-                     (MiniCPMOAudioEmbeddingItems, AudioProcessorItems)))
+        parsed_audios = (
+            self._get_data_parser()
+            .parse_mm_data({"audio": audios})
+            .get_items("audio", (MiniCPMOAudioEmbeddingItems, AudioProcessorItems))
+        )
 
         if isinstance(parsed_audios, MiniCPMOAudioEmbeddingItems):
             audio_inputs = {}
@@ -298,9 +314,7 @@ def process_audios(
             audio_inputs = self._base_call_hf_processor(
                 prompts=[self.info.audio_pattern] * len(parsed_audios),
                 mm_data={"audios": [[audio] for audio in parsed_audios]},
-                mm_kwargs={
-                    **mm_kwargs, "chunk_input": True
-                },
+                mm_kwargs={**mm_kwargs, "chunk_input": True},
                 tok_kwargs=tok_kwargs,
                 out_keys={"audio_features", "audio_feature_lens"},
             )
@@ -308,7 +322,8 @@ def process_audios(
             # Avoid padding since we need the output for each audio to be
             # independent of other audios for the cache to work correctly
             unpadded_audio_features = [
-                feat[:, :feature_len] for feat, feature_len in zip(
+                feat[:, :feature_len]
+                for feat, feature_len in zip(
                     audio_inputs["audio_features"],
                     audio_inputs["audio_feature_lens"],
                 )
@@ -348,12 +363,14 @@ def _get_prompt_updates(
 
         def get_audio_replacement(item_idx: int):
             audios = mm_items.get_items(
-                "audio", (MiniCPMOAudioEmbeddingItems, AudioProcessorItems))
+                "audio", (MiniCPMOAudioEmbeddingItems, AudioProcessorItems)
+            )
 
             if isinstance(audios, MiniCPMOAudioEmbeddingItems):
                 single_audio_embeds = audios.get(item_idx)["audio_embeds"]
                 audio_len = self.info.get_audio_len_by_num_chunks(
-                    sum(map(len, single_audio_embeds)))
+                    sum(map(len, single_audio_embeds))
+                )
             else:
                 audio_len = audios.get_audio_length(item_idx)
 
@@ -364,9 +381,11 @@ def get_audio_replacement(item_idx: int):
 
         return [
             *base_updates,
-            PromptReplacement(modality="audio",
-                              target=audio_placeholder,
-                              replacement=get_audio_replacement),
+            PromptReplacement(
+                modality="audio",
+                target=audio_placeholder,
+                replacement=get_audio_replacement,
+            ),
         ]
 
     def _get_mm_fields_config(
@@ -378,16 +397,11 @@ def _get_mm_fields_config(
 
 
 class MultiModalProjector(nn.Module):
-
     def __init__(self, in_dim: int, out_dim: int):
         super().__init__()
-        self.linear1 = nn.Linear(in_features=in_dim,
-                                 out_features=out_dim,
-                                 bias=True)
+        self.linear1 = nn.Linear(in_features=in_dim, out_features=out_dim, bias=True)
         self.relu = nn.ReLU()
-        self.linear2 = nn.Linear(in_features=out_dim,
-                                 out_features=out_dim,
-                                 bias=True)
+        self.linear2 = nn.Linear(in_features=out_dim, out_features=out_dim, bias=True)
 
     def forward(self, audio_features: torch.Tensor) -> torch.Tensor:
         hidden_states = self.relu(self.linear1(audio_features))
@@ -396,7 +410,6 @@ def forward(self, audio_features: torch.Tensor) -> torch.Tensor:
 
 
 class MiniCPMWhisperEncoderLayer(nn.Module):
-
     def __init__(self, config: WhisperConfig, layer_idx: int):
         super().__init__()
         self.embed_dim = config.d_model
@@ -428,39 +441,40 @@ def forward(
             attention_mask=attention_mask,
             past_key_value=past_key_values,
         )
-        hidden_states = nn.functional.dropout(hidden_states,
-                                              p=self.dropout,
-                                              training=self.training)
+        hidden_states = nn.functional.dropout(
+            hidden_states, p=self.dropout, training=self.training
+        )
         hidden_states = residual + hidden_states
 
         residual = hidden_states
         hidden_states = self.final_layer_norm(hidden_states)
         hidden_states = self.activation_fn(self.fc1(hidden_states))
-        hidden_states = nn.functional.dropout(hidden_states,
-                                              p=self.activation_dropout,
-                                              training=self.training)
+        hidden_states = nn.functional.dropout(
+            hidden_states, p=self.activation_dropout, training=self.training
+        )
         hidden_states = self.fc2(hidden_states)
-        hidden_states = nn.functional.dropout(hidden_states,
-                                              p=self.dropout,
-                                              training=self.training)
+        hidden_states = nn.functional.dropout(
+            hidden_states, p=self.dropout, training=self.training
+        )
         hidden_states = residual + hidden_states
 
         if hidden_states.dtype == torch.float16:
             hidden_states = cast_overflow_tensors(hidden_states)
 
-        outputs = (hidden_states, )
+        outputs = (hidden_states,)
 
         return outputs
 
 
 class MiniCPMWhisperEncoder(WhisperEncoder):
-
     def __init__(self, config: WhisperConfig):
         super().__init__(config)
-        self.layers = nn.ModuleList([
-            MiniCPMWhisperEncoderLayer(config, layer_idx=i)
-            for i in range(config.encoder_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                MiniCPMWhisperEncoderLayer(config, layer_idx=i)
+                for i in range(config.encoder_layers)
+            ]
+        )
 
     def forward(
         self,
@@ -468,8 +482,9 @@ def forward(
         attention_mask: Optional[torch.Tensor] = None,
     ) -> BaseModelOutputWithPast:
         # Ignore copy
-        input_features = input_features.to(dtype=self.conv1.weight.dtype,
-                                           device=self.conv1.weight.device)
+        input_features = input_features.to(
+            dtype=self.conv1.weight.dtype, device=self.conv1.weight.device
+        )
 
         inputs_embeds = nn.functional.gelu(self.conv1(input_features))
         inputs_embeds = nn.functional.gelu(self.conv2(inputs_embeds))
@@ -478,17 +493,17 @@ def forward(
 
         embed_pos = self.embed_positions.weight
 
-        embed_pos = embed_pos[:inputs_embeds.shape[1], :]
+        embed_pos = embed_pos[: inputs_embeds.shape[1], :]
 
         hidden_states = inputs_embeds + embed_pos
-        hidden_states = nn.functional.dropout(hidden_states,
-                                              p=self.dropout,
-                                              training=self.training)
+        hidden_states = nn.functional.dropout(
+            hidden_states, p=self.dropout, training=self.training
+        )
 
         encoder_states = ()
 
         for idx, encoder_layer in enumerate(self.layers):
-            encoder_states = encoder_states + (hidden_states, )
+            encoder_states = encoder_states + (hidden_states,)
             to_drop = False
             if self.training:
                 dropout_probability = torch.rand([])
@@ -507,7 +522,7 @@ def forward(
                 hidden_states = layer_outputs[0]
 
         hidden_states = self.layer_norm(hidden_states)
-        encoder_states = encoder_states + (hidden_states, )
+        encoder_states = encoder_states + (hidden_states,)
 
         return BaseModelOutputWithPast(
             last_hidden_state=hidden_states,
@@ -518,7 +533,8 @@ def forward(
 @MULTIMODAL_REGISTRY.register_processor(
     MiniCPMOMultiModalProcessor,
     info=MiniCPMOProcessingInfo,
-    dummy_inputs=MiniCPMODummyInputsBuilder)
+    dummy_inputs=MiniCPMODummyInputsBuilder,
+)
 class MiniCPMO(MiniCPMV2_6):
     packed_modules_mapping = {
         "qkv_proj": [
@@ -545,8 +561,9 @@ def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(vllm_config=vllm_config, prefix=prefix)
-        self.apm = self.init_audio_module(vllm_config=vllm_config,
-                                          prefix=maybe_prefix(prefix, "apm"))
+        self.apm = self.init_audio_module(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "apm")
+        )
 
         self.audio_token_id = None
 
@@ -555,16 +572,16 @@ def init_audio_module(self, *, vllm_config: VllmConfig, prefix: str = ""):
         audio_config = self.config.audio_config
         model = MiniCPMWhisperEncoder(audio_config)
         audio_output_dim = int(audio_config.encoder_ffn_dim // 4)
-        self.audio_avg_pooler = \
-            nn.AvgPool1d(self.config.audio_pool_step,
-                         stride=self.config.audio_pool_step)
-        self.audio_projection_layer = \
-            MultiModalProjector(in_dim=audio_output_dim,out_dim=self.embed_dim)
+        self.audio_avg_pooler = nn.AvgPool1d(
+            self.config.audio_pool_step, stride=self.config.audio_pool_step
+        )
+        self.audio_projection_layer = MultiModalProjector(
+            in_dim=audio_output_dim, out_dim=self.embed_dim
+        )
         self.audio_encoder_layer = -1
         return model
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self, skip_prefixes=["tts"])
         return loader.load_weights(weights)
 
@@ -585,14 +602,13 @@ def subsequent_chunk_mask(
             start_indices = torch.zeros_like(row_indices)
         else:
             # Compute start indices vectorially
-            start_chunk_indices = torch.clamp(chunk_indices - num_left_chunks,
-                                              min=0)
+            start_chunk_indices = torch.clamp(chunk_indices - num_left_chunks, min=0)
             start_indices = start_chunk_indices * chunk_size
         # Compute ending indices vectorially
         end_chunk_indices = chunk_indices + 1
-        end_indices = torch.clamp(end_chunk_indices * chunk_size +
-                                  num_lookhead,
-                                  max=size)
+        end_indices = torch.clamp(
+            end_chunk_indices * chunk_size + num_lookhead, max=size
+        )
         # Create column indices for broadcasting
         col_indices = torch.arange(size, device=device).unsqueeze(0)
         start_indices = start_indices.unsqueeze(1)
@@ -601,19 +617,18 @@ def subsequent_chunk_mask(
         ret = (col_indices >= start_indices) & (col_indices < end_indices)
         return ret
 
-    def _get_feat_extract_output_lengths(self,
-                                         input_lengths: torch.LongTensor):
+    def _get_feat_extract_output_lengths(self, input_lengths: torch.LongTensor):
         input_lengths_after_cnn = (input_lengths - 1) // 2 + 1
         input_lengths_after_pooling = (
-            input_lengths_after_cnn -
-            self.config.audio_pool_step) // self.config.audio_pool_step + 1
-        input_lengths_after_pooling = input_lengths_after_pooling.to(
-            dtype=torch.int32)
+            input_lengths_after_cnn - self.config.audio_pool_step
+        ) // self.config.audio_pool_step + 1
+        input_lengths_after_pooling = input_lengths_after_pooling.to(dtype=torch.int32)
 
         return input_lengths_after_cnn, input_lengths_after_pooling
 
     def get_audio_hidden_states(
-            self, data: MiniCPMOAudioFeatureInputs) -> list[torch.Tensor]:
+        self, data: MiniCPMOAudioFeatureInputs
+    ) -> list[torch.Tensor]:
         chunk_length = self.config.audio_chunk_length
 
         # (bs, 80, frames) or [], multi audios need filled in advance
@@ -642,23 +657,26 @@ def get_audio_hidden_states(
         max_seq_len = (max_mel_seq_len - 1) // 2 + 1
 
         # Create a sequence tensor of shape (batch_size, max_seq_len)
-        seq_range = (torch.arange(
-            0,
-            max_seq_len,
-            dtype=audio_feature_lens.dtype,
-            device=audio_feature_lens.device).unsqueeze(0).expand(
-                batch_size, max_seq_len))
-        lengths_expand = audio_feature_lens.unsqueeze(1).expand(
-            batch_size, max_seq_len)
+        seq_range = (
+            torch.arange(
+                0,
+                max_seq_len,
+                dtype=audio_feature_lens.dtype,
+                device=audio_feature_lens.device,
+            )
+            .unsqueeze(0)
+            .expand(batch_size, max_seq_len)
+        )
+        lengths_expand = audio_feature_lens.unsqueeze(1).expand(batch_size, max_seq_len)
         # Create mask
         padding_mask = seq_range >= lengths_expand  # 1 for padded values
 
-        audio_attention_mask_ = padding_mask.view(
-            batch_size, 1, 1, max_seq_len).expand(batch_size, 1, max_seq_len,
-                                                  max_seq_len)
+        audio_attention_mask_ = padding_mask.view(batch_size, 1, 1, max_seq_len).expand(
+            batch_size, 1, max_seq_len, max_seq_len
+        )
         audio_attention_mask = audio_attention_mask_.to(
-            dtype=self.apm.conv1.weight.dtype,
-            device=self.apm.conv1.weight.device)
+            dtype=self.apm.conv1.weight.dtype, device=self.apm.conv1.weight.device
+        )
 
         if chunk_length > 0:
             chunk_num_frame = int(chunk_length * 50)
@@ -669,20 +687,22 @@ def get_audio_hidden_states(
                 device=audio_attention_mask_.device,
             )
             audio_attention_mask_ = torch.logical_or(
-                audio_attention_mask_, torch.logical_not(chunk_mask))
+                audio_attention_mask_, torch.logical_not(chunk_mask)
+            )
 
         audio_attention_mask[audio_attention_mask_] = float("-inf")
         audio_states = self.apm(
-            wavforms, attention_mask=audio_attention_mask).hidden_states[
-                self.audio_encoder_layer]
+            wavforms, attention_mask=audio_attention_mask
+        ).hidden_states[self.audio_encoder_layer]
         audio_embeds = self.audio_projection_layer(audio_states)
 
         audio_embeds = audio_embeds.transpose(1, 2)
         audio_embeds = self.audio_avg_pooler(audio_embeds)
         audio_embeds = audio_embeds.transpose(1, 2)
 
-        _, feature_lens_after_pooling = \
-            self._get_feat_extract_output_lengths(audio_feature_lens)
+        _, feature_lens_after_pooling = self._get_feat_extract_output_lengths(
+            audio_feature_lens
+        )
 
         num_audio_tokens = feature_lens_after_pooling
 
@@ -692,7 +712,8 @@ def get_audio_hidden_states(
             target_audio_embeds_lst = list[torch.Tensor]()
             for _ in range(len(audio_feature_lens_raw[i])):
                 target_audio_embeds_lst.append(
-                    audio_embeds[idx, :num_audio_tokens[idx], :])
+                    audio_embeds[idx, : num_audio_tokens[idx], :]
+                )
                 idx += 1
 
             final_audio_embeds.append(torch.cat(target_audio_embeds_lst))
@@ -700,7 +721,8 @@ def get_audio_hidden_states(
         return final_audio_embeds
 
     def _parse_and_validate_audio_input(
-            self, **kwargs: object) -> Optional[MiniCPMOAudioInputs]:
+        self, **kwargs: object
+    ) -> Optional[MiniCPMOAudioInputs]:
         audio_features = kwargs.pop("audio_features", None)
         audio_embeds = kwargs.pop("audio_embeds", None)
 
@@ -714,8 +736,9 @@ def _parse_and_validate_audio_input(
 
         if audio_embeds is not None:
             if not isinstance(audio_embeds, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of audio_embeds. "
-                                 f"Got type: {type(audio_embeds)}")
+                raise ValueError(
+                    f"Incorrect type of audio_embeds. Got type: {type(audio_embeds)}"
+                )
 
             audio_embeds_flat = flatten_bn(audio_embeds)
 
@@ -725,13 +748,16 @@ def _parse_and_validate_audio_input(
             )
 
         if not isinstance(audio_features, (torch.Tensor, list)):
-            raise ValueError("Incorrect type of audio_features. "
-                             f"Got type: {type(audio_features)}")
+            raise ValueError(
+                f"Incorrect type of audio_features. Got type: {type(audio_features)}"
+            )
 
         audio_feature_lens = kwargs.pop("audio_feature_lens")
         if not isinstance(audio_feature_lens, (torch.Tensor, list)):
-            raise ValueError("Incorrect type of audio_feature_lens. "
-                             f"Got type: {type(audio_feature_lens)}")
+            raise ValueError(
+                "Incorrect type of audio_feature_lens. "
+                f"Got type: {type(audio_feature_lens)}"
+            )
 
         audio_features_flat = flatten_bn(audio_features)
         audio_feature_lens_flat = flatten_bn(audio_feature_lens)
@@ -748,10 +774,11 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if input_key in ("audio_features",
-                             "audio_embeds") and "audios" not in modalities:
-                modalities["audios"] = self._parse_and_validate_audio_input(
-                    **kwargs)
+            if (
+                input_key in ("audio_features", "audio_embeds")
+                and "audios" not in modalities
+            ):
+                modalities["audios"] = self._parse_and_validate_audio_input(**kwargs)
 
         return modalities
 
diff --git a/vllm/model_executor/models/minicpmv.py b/vllm/model_executor/models/minicpmv.py
index 8bef1ec514ab..09f973e98db9 100644
--- a/vllm/model_executor/models/minicpmv.py
+++ b/vllm/model_executor/models/minicpmv.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only MiniCPM-V model compatible with HuggingFace weights."""
+
 import math
 from collections import defaultdict
 from collections.abc import Iterable, Mapping, Sequence
@@ -43,8 +44,11 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.awq import AWQConfig
 from vllm.model_executor.layers.quantization.awq_marlin import AWQMarlinConfig
-from vllm.model_executor.layers.resampler import (BaseResampler, Resampler2,
-                                                  get_2d_sincos_pos_embed)
+from vllm.model_executor.layers.resampler import (
+    BaseResampler,
+    Resampler2,
+    get_2d_sincos_pos_embed,
+)
 from vllm.model_executor.model_loader.utils import set_default_torch_dtype
 from vllm.model_executor.models.llama import LlamaForCausalLM
 from vllm.model_executor.models.minicpm import MiniCPMForCausalLM
@@ -52,17 +56,33 @@
 from vllm.model_executor.models.qwen2 import Qwen2ForCausalLM
 from vllm.model_executor.models.qwen3 import Qwen3ForCausalLM
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems, NestedTensors)
-from vllm.multimodal.parse import (DictEmbeddingItems, ImageItem,
-                                   ImageProcessorItems, ImageSize,
-                                   ModalityData, ModalityDataItems,
-                                   MultiModalDataItems, MultiModalDataParser,
-                                   VideoItem, VideoProcessorItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails,
-                                        ResolvedPromptUpdate, _seq2text)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+    NestedTensors,
+)
+from vllm.multimodal.parse import (
+    DictEmbeddingItems,
+    ImageItem,
+    ImageProcessorItems,
+    ImageSize,
+    ModalityData,
+    ModalityDataItems,
+    MultiModalDataItems,
+    MultiModalDataParser,
+    VideoItem,
+    VideoProcessorItems,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+    ResolvedPromptUpdate,
+    _seq2text,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.platforms import current_platform
 from vllm.sequence import IntermediateTensors
@@ -70,8 +90,12 @@
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .idefics2_vision_model import Idefics2VisionTransformer
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
 from .utils import AutoWeightsLoader, flatten_bn, maybe_prefix
 
 # For profile run
@@ -121,45 +145,48 @@ class MiniCPMVImageEmbeddingInputs(TensorSchema):
     ]
 
 
-MiniCPMVImageInputs = Union[MiniCPMVImagePixelInputs,
-                            MiniCPMVImageEmbeddingInputs]
+MiniCPMVImageInputs = Union[MiniCPMVImagePixelInputs, MiniCPMVImageEmbeddingInputs]
 
 DEFAULT_LN = partial(nn.LayerNorm, eps=1e-6)
 
 
 class Resampler2_5(BaseResampler):
-
-    def __init__(self,
-                 num_queries: int,
-                 embed_dim: int,
-                 num_heads: int,
-                 kv_dim: Optional[int] = None,
-                 norm_layer: Callable[[int], nn.LayerNorm] = DEFAULT_LN,
-                 max_size: tuple[int, int] = (70, 70),
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "") -> None:
-        super().__init__(num_queries,
-                         embed_dim,
-                         num_heads,
-                         kv_dim,
-                         norm_layer,
-                         quant_config=quant_config,
-                         prefix=prefix)
+    def __init__(
+        self,
+        num_queries: int,
+        embed_dim: int,
+        num_heads: int,
+        kv_dim: Optional[int] = None,
+        norm_layer: Callable[[int], nn.LayerNorm] = DEFAULT_LN,
+        max_size: tuple[int, int] = (70, 70),
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> None:
+        super().__init__(
+            num_queries,
+            embed_dim,
+            num_heads,
+            kv_dim,
+            norm_layer,
+            quant_config=quant_config,
+            prefix=prefix,
+        )
 
         self.max_size = max_size
         self._set_2d_pos_cache(self.max_size)
 
-    def _set_2d_pos_cache(self,
-                          max_size: tuple[int, int],
-                          device: torch.types.Device = "cpu") -> None:
-        pos_embed_arr = get_2d_sincos_pos_embed(self.embed_dim,
-                                                max_size,
-                                                version=(2, 5))
+    def _set_2d_pos_cache(
+        self, max_size: tuple[int, int], device: torch.types.Device = "cpu"
+    ) -> None:
+        pos_embed_arr = get_2d_sincos_pos_embed(
+            self.embed_dim, max_size, version=(2, 5)
+        )
         pos_embed = torch.from_numpy(pos_embed_arr).float().to(device)
         self.register_buffer("pos_embed", pos_embed, persistent=False)
 
-    def _adjust_pos_cache(self, tgt_sizes: torch.Tensor,
-                          device: torch.types.Device) -> None:
+    def _adjust_pos_cache(
+        self, tgt_sizes: torch.Tensor, device: torch.types.Device
+    ) -> None:
         max_h = tgt_sizes[:, 0].max().item()
         max_w = tgt_sizes[:, 1].max().item()
         assert isinstance(max_h, int) and isinstance(max_w, int)
@@ -171,8 +198,7 @@ def _adjust_pos_cache(self, tgt_sizes: torch.Tensor,
             )
             self._set_2d_pos_cache(self.max_size, device)
 
-    def forward(self, x: torch.Tensor,
-                tgt_sizes: torch.Tensor) -> torch.Tensor:
+    def forward(self, x: torch.Tensor, tgt_sizes: torch.Tensor) -> torch.Tensor:
         assert x.shape[0] == tgt_sizes.shape[0]
         bs = x.shape[0]
 
@@ -186,21 +212,20 @@ def forward(self, x: torch.Tensor,
         max_patch_len = patch_len.max().item()
         assert isinstance(max_patch_len, int)
 
-        key_padding_mask = torch.zeros((bs, max_patch_len),
-                                       dtype=torch.bool,
-                                       device=device)
+        key_padding_mask = torch.zeros(
+            (bs, max_patch_len), dtype=torch.bool, device=device
+        )
 
         pos_embed = []
         for i in range(bs):
             tgt_h, tgt_w = tgt_sizes[i].tolist()
-            pos_embed.append(self.pos_embed[:tgt_h, :tgt_w, :].reshape(
-                (tgt_h * tgt_w, -1)).to(dtype))  # patches * D
-            key_padding_mask[i, patch_len[i]:] = True
-        pos_embed = torch.nn.utils.rnn.pad_sequence(pos_embed,
-                                                    batch_first=True,
-                                                    padding_value=0.0).permute(
-                                                        1, 0,
-                                                        2)  # BLD => L * B * D
+            pos_embed.append(
+                self.pos_embed[:tgt_h, :tgt_w, :].reshape((tgt_h * tgt_w, -1)).to(dtype)
+            )  # patches * D
+            key_padding_mask[i, patch_len[i] :] = True
+        pos_embed = torch.nn.utils.rnn.pad_sequence(
+            pos_embed, batch_first=True, padding_value=0.0
+        ).permute(1, 0, 2)  # BLD => L * B * D
         x, _ = self.kv_proj(x)  # B * L * D
         x = self.ln_kv(x).permute(1, 0, 2)  # L * B * D
 
@@ -221,33 +246,37 @@ def forward(self, x: torch.Tensor,
 
 
 class Resampler4_5(Resampler2_5):
+    def __init__(
+        self,
+        num_queries: int,
+        embed_dim: int,
+        num_heads: int,
+        kv_dim: Optional[int] = None,
+        norm_layer: Callable[[int], nn.LayerNorm] = DEFAULT_LN,
+        max_size: tuple[int, int] = (70, 70),
+        max_temporal_size: int = 36000,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> None:
+        super().__init__(
+            num_queries,
+            embed_dim,
+            num_heads,
+            kv_dim,
+            norm_layer,
+            max_size,
+            quant_config=quant_config,
+            prefix=prefix,
+        )
 
-    def __init__(self,
-                 num_queries: int,
-                 embed_dim: int,
-                 num_heads: int,
-                 kv_dim: Optional[int] = None,
-                 norm_layer: Callable[[int], nn.LayerNorm] = DEFAULT_LN,
-                 max_size: tuple[int, int] = (70, 70),
-                 max_temporal_size: int = 36000,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "") -> None:
-        super().__init__(num_queries,
-                         embed_dim,
-                         num_heads,
-                         kv_dim,
-                         norm_layer,
-                         max_size,
-                         quant_config=quant_config,
-                         prefix=prefix)
-
-        trunc_normal_(self.query, std=.02)
+        trunc_normal_(self.query, std=0.02)
         self.max_temporal_size = max_temporal_size
         self._set_temporal_pos_cache(self.max_temporal_size)
         self.apply(self._init_weights)
 
-    def get_1d_sincos_pos_embed_from_temporal_size(self, embed_dim: int,
-                                                   pos: np.ndarray):
+    def get_1d_sincos_pos_embed_from_temporal_size(
+        self, embed_dim: int, pos: np.ndarray
+    ):
         """
         embed_dim: output dimension for each position
         pos: a list of positions to be encoded: size (M,)
@@ -255,11 +284,11 @@ def get_1d_sincos_pos_embed_from_temporal_size(self, embed_dim: int,
         """
         assert embed_dim % 2 == 0
         omega = np.arange(embed_dim // 2, dtype=np.float32)
-        omega /= embed_dim / 2.
-        omega = 1. / 10000**omega  # (D/2,)
+        omega /= embed_dim / 2.0
+        omega = 1.0 / 10000**omega  # (D/2,)
 
         pos = pos.reshape(-1)  # (M,)
-        out = np.einsum('m,d->md', pos, omega)  # (M, D/2), outer product
+        out = np.einsum("m,d->md", pos, omega)  # (M, D/2), outer product
 
         emb_sin = np.sin(out)  # (M, D/2)
         emb_cos = np.cos(out)  # (M, D/2)
@@ -267,25 +296,31 @@ def get_1d_sincos_pos_embed_from_temporal_size(self, embed_dim: int,
         emb = np.concatenate([emb_sin, emb_cos], axis=1)  # (M, D)
         return emb
 
-    def _set_temporal_pos_cache(self,
-                                max_temporal_size: int,
-                                device: torch.types.Device = "cpu") -> None:
+    def _set_temporal_pos_cache(
+        self, max_temporal_size: int, device: torch.types.Device = "cpu"
+    ) -> None:
         temporal_size = np.arange(max_temporal_size, dtype=np.float32)
-        pos_embed = torch.from_numpy(
-            self.get_1d_sincos_pos_embed_from_temporal_size(
-                self.embed_dim, temporal_size)).float().to(device)
+        pos_embed = (
+            torch.from_numpy(
+                self.get_1d_sincos_pos_embed_from_temporal_size(
+                    self.embed_dim, temporal_size
+                )
+            )
+            .float()
+            .to(device)
+        )
         self.register_buffer("temporal_pos_embed", pos_embed, persistent=False)
 
-    def _adjust_temporal_pos_cache(self,
-                                   max_temporal_size: int,
-                                   device: torch.types.Device = "cpu"):
+    def _adjust_temporal_pos_cache(
+        self, max_temporal_size: int, device: torch.types.Device = "cpu"
+    ):
         if max_temporal_size > self.max_temporal_size:
             self.max_temporal_size = max_temporal_size
             self._set_temporal_pos_cache(self.max_temporal_size, device)
 
     def _init_weights(self, m: Union[nn.Linear, nn.LayerNorm]):
         if isinstance(m, nn.Linear):
-            trunc_normal_(m.weight, std=.02)
+            trunc_normal_(m.weight, std=0.02)
             if isinstance(m, nn.Linear) and m.bias is not None:
                 nn.init.constant_(m.bias, 0)
         elif isinstance(m, nn.LayerNorm):
@@ -297,7 +332,7 @@ def forward(
         x: torch.Tensor,
         tgt_sizes: torch.Tensor,
         # temporal_ids for high refresh rate videos
-        temporal_ids=None
+        temporal_ids=None,
     ) -> torch.Tensor:
         assert x.shape[0] == tgt_sizes.shape[0]
         bs = x.shape[0]
@@ -323,9 +358,9 @@ def forward(
         max_patch_len = patch_len.max().item()
         assert isinstance(max_patch_len, int)
 
-        key_padding_mask = torch.zeros((bs, max_patch_len),
-                                       dtype=torch.bool,
-                                       device=device)
+        key_padding_mask = torch.zeros(
+            (bs, max_patch_len), dtype=torch.bool, device=device
+        )
 
         x, _ = self.kv_proj(x)  # B * L * D
         x = self.ln_kv(x).permute(1, 0, 2)  # L * B * D
@@ -338,19 +373,21 @@ def forward(
             if temporal_pos_emb:
                 if temporal_ids_flatten[i] == -1:
                     pos_embed_temporal.append(
-                        torch.zeros(self.embed_dim, dtype=dtype,
-                                    device=device))
+                        torch.zeros(self.embed_dim, dtype=dtype, device=device)
+                    )
                 else:
-                    pos_embed_temporal.append(self.temporal_pos_embed[
-                        temporal_ids_flatten[i]].to(dtype))  # D
+                    pos_embed_temporal.append(
+                        self.temporal_pos_embed[temporal_ids_flatten[i]].to(dtype)
+                    )  # D
 
-            pos_embed_2d.append(self.pos_embed[:tgt_h, :tgt_w, :].reshape(
-                (tgt_h * tgt_w, -1)).to(dtype))  # patches * D
-            key_padding_mask[i, patch_len[i]:] = True
+            pos_embed_2d.append(
+                self.pos_embed[:tgt_h, :tgt_w, :].reshape((tgt_h * tgt_w, -1)).to(dtype)
+            )  # patches * D
+            key_padding_mask[i, patch_len[i] :] = True
 
         pos_embed_2d = torch.nn.utils.rnn.pad_sequence(
-            pos_embed_2d, batch_first=True,
-            padding_value=0.0).permute(1, 0, 2)  # BLD => L * B * D
+            pos_embed_2d, batch_first=True, padding_value=0.0
+        ).permute(1, 0, 2)  # BLD => L * B * D
 
         k = x
         v = x + pos_embed_2d
@@ -366,26 +403,27 @@ def forward(
                 end = start + len(tp)
                 # L * (end-start) * D -> (end-start) * L * D
                 # -> 1 * L*(end-start) * D
-                merge_k.append(k[:, start:end, :].permute(1, 0, 2).reshape(
-                    -1, self.embed_dim))
-                merge_v.append(v[:, start:end, :].permute(1, 0, 2).reshape(
-                    -1, self.embed_dim))
+                merge_k.append(
+                    k[:, start:end, :].permute(1, 0, 2).reshape(-1, self.embed_dim)
+                )
+                merge_v.append(
+                    v[:, start:end, :].permute(1, 0, 2).reshape(-1, self.embed_dim)
+                )
                 merge_key_padding_mask.append(
-                    key_padding_mask[start:end, :].reshape(-1, 1))
+                    key_padding_mask[start:end, :].reshape(-1, 1)
+                )
 
                 start = end
 
-            k = torch.nn.utils.rnn.pad_sequence(merge_k,
-                                                batch_first=True,
-                                                padding_value=0.0).permute(
-                                                    1, 0, 2)  # L*(end-start)
-            v = torch.nn.utils.rnn.pad_sequence(merge_v,
-                                                batch_first=True,
-                                                padding_value=0.0).permute(
-                                                    1, 0, 2)  # L*(end-start)
+            k = torch.nn.utils.rnn.pad_sequence(
+                merge_k, batch_first=True, padding_value=0.0
+            ).permute(1, 0, 2)  # L*(end-start)
+            v = torch.nn.utils.rnn.pad_sequence(
+                merge_v, batch_first=True, padding_value=0.0
+            ).permute(1, 0, 2)  # L*(end-start)
             key_padding_mask = torch.nn.utils.rnn.pad_sequence(
-                merge_key_padding_mask, batch_first=True,
-                padding_value=True).squeeze(-1)
+                merge_key_padding_mask, batch_first=True, padding_value=True
+            ).squeeze(-1)
 
         out = self.attn(
             self._repeat(q, bs),  # Q * B * D
@@ -436,7 +474,6 @@ def _minicpmv_field_config(hf_inputs: Mapping[str, torch.Tensor]):
 
 
 class MiniCPMVImageEmbeddingItems(DictEmbeddingItems):
-
     def __init__(
         self,
         data: Mapping[str, torch.Tensor],
@@ -458,7 +495,6 @@ def get_image_size(self, index: int) -> ImageSize:
 
 
 class MiniCPMVVideoEmbeddingItems(DictEmbeddingItems):
-
     def __init__(
         self,
         data: Mapping[str, torch.Tensor],
@@ -483,7 +519,6 @@ def get_num_frames(self, index: int) -> int:
 
 
 class MiniCPMVMultiModalDataParser(MultiModalDataParser):
-
     def _parse_image_data(
         self,
         data: Union[dict[str, torch.Tensor], ModalityData[ImageItem]],
@@ -652,21 +687,18 @@ def get_num_frames_with_most_features(
         max_videos = mm_counts.get("video", 0)
 
         max_image_tokens = self.get_max_image_tokens() * max_images
-        max_total_frames = self.get_max_video_frames(seq_len -
-                                                     max_image_tokens)
-        max_frames_per_video = min(max_total_frames // max(max_videos, 1),
-                                   _MAX_FRAMES_PER_VIDEO)
+        max_total_frames = self.get_max_video_frames(seq_len - max_image_tokens)
+        max_frames_per_video = min(
+            max_total_frames // max(max_videos, 1), _MAX_FRAMES_PER_VIDEO
+        )
 
         return max(max_frames_per_video, 1)
 
 
-_I = TypeVar("_I",
-             bound=MiniCPMVProcessingInfo,
-             default=MiniCPMVProcessingInfo)
+_I = TypeVar("_I", bound=MiniCPMVProcessingInfo, default=MiniCPMVProcessingInfo)
 
 
 class MiniCPMVDummyInputsBuilder(BaseDummyInputsBuilder[_I]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -685,52 +717,54 @@ def get_dummy_mm_data(
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
 
-        image_width, image_height = \
-            self.info.get_image_size_with_most_features()
-        video_width, video_height = \
-            self.info.get_video_frame_size_with_most_features()
-        num_video_frames = \
-            self.info.get_num_frames_with_most_features(seq_len, mm_counts)
+        image_width, image_height = self.info.get_image_size_with_most_features()
+        video_width, video_height = self.info.get_video_frame_size_with_most_features()
+        num_video_frames = self.info.get_num_frames_with_most_features(
+            seq_len, mm_counts
+        )
 
         image_overrides = mm_options.get("image") if mm_options else None
         video_overrides = mm_options.get("video") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=image_width,
-                                   height=image_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
+            "image": self._get_dummy_images(
+                width=image_width,
+                height=image_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
             "video": [
-                self._get_dummy_images(width=video_width,
-                                       height=video_height,
-                                       num_images=num_video_frames,
-                                       overrides=video_overrides)
-            ] * num_videos,
+                self._get_dummy_images(
+                    width=video_width,
+                    height=video_height,
+                    num_images=num_video_frames,
+                    overrides=video_overrides,
+                )
+            ]
+            * num_videos,
         }
 
 
 class MiniCPMVMultiModalProcessor(BaseMultiModalProcessor[_I]):
-
     def _get_data_parser(self) -> MultiModalDataParser:
         return MiniCPMVMultiModalDataParser()
 
-    def get_image_prompt_texts(self,
-                               image_size: ImageSize,
-                               image_idx: int = 0) -> str:
+    def get_image_prompt_texts(self, image_size: ImageSize, image_idx: int = 0) -> str:
         return self.info.get_slice_image_placeholder(
             image_size,
             image_idx=image_idx,
         )
 
-    def get_video_prompt_texts(self, image_size: ImageSize,
-                               num_frames: int) -> str:
-        return self.info.get_slice_image_placeholder(
-            image_size=image_size,
-            image_idx=0,
-            max_slice_nums=self.info.get_video_max_slice_num(),
-            use_image_id=False,
-        ) * num_frames
+    def get_video_prompt_texts(self, image_size: ImageSize, num_frames: int) -> str:
+        return (
+            self.info.get_slice_image_placeholder(
+                image_size=image_size,
+                image_idx=0,
+                max_slice_nums=self.info.get_video_max_slice_num(),
+                use_image_id=False,
+            )
+            * num_frames
+        )
 
     def process_images(
         self,
@@ -741,10 +775,11 @@ def process_images(
         if (images := mm_data.get("images")) is None:
             return {}
 
-        parsed_images = (self._get_data_parser().parse_mm_data({
-            "image": images
-        }).get_items("image",
-                     (MiniCPMVImageEmbeddingItems, ImageProcessorItems)))
+        parsed_images = (
+            self._get_data_parser()
+            .parse_mm_data({"image": images})
+            .get_items("image", (MiniCPMVImageEmbeddingItems, ImageProcessorItems))
+        )
 
         if isinstance(parsed_images, MiniCPMVImageEmbeddingItems):
             image_inputs = {}
@@ -772,24 +807,23 @@ def process_videos(
         if (videos := mm_data.get("videos")) is None:
             return {}
 
-        parsed_videos = (self._get_data_parser().parse_mm_data({
-            "video": videos
-        }).get_items("video",
-                     (MiniCPMVVideoEmbeddingItems, VideoProcessorItems)))
+        parsed_videos = (
+            self._get_data_parser()
+            .parse_mm_data({"video": videos})
+            .get_items("video", (MiniCPMVVideoEmbeddingItems, VideoProcessorItems))
+        )
 
         if isinstance(parsed_videos, MiniCPMVVideoEmbeddingItems):
             video_inputs = {}
         else:
             video_inputs = self._base_call_hf_processor(
                 prompts=[
-                    self.info.image_pattern * len(video)
-                    for video in parsed_videos
+                    self.info.image_pattern * len(video) for video in parsed_videos
                 ],
                 mm_data={"images": list(parsed_videos)},
                 mm_kwargs={
                     **mm_kwargs,
-                    "max_slice_nums":
-                    self.info.get_video_max_slice_num(),
+                    "max_slice_nums": self.info.get_video_max_slice_num(),
                 },
                 tok_kwargs=tok_kwargs,
                 out_keys={"pixel_values", "image_sizes", "tgt_sizes"},
@@ -837,10 +871,7 @@ def _base_call_hf_processor(
             for i, prompt in enumerate(prompts):
                 inputs_one = super()._call_hf_processor(
                     prompt=prompt,
-                    mm_data={
-                        k: v[i]
-                        for k, v in mm_data.items()
-                    },
+                    mm_data={k: v[i] for k, v in mm_data.items()},
                     mm_kwargs=mm_kwargs,
                     tok_kwargs=tok_kwargs,
                 )
@@ -863,10 +894,12 @@ def _call_hf_processor(
         input_ids = torch.tensor([tokenizer.encode(prompt, **tok_kwargs)])
         mm_inputs = self.process_mm_inputs(mm_data, mm_kwargs, tok_kwargs)
 
-        return BatchFeature({
-            "input_ids": input_ids,
-            **mm_inputs,
-        })
+        return BatchFeature(
+            {
+                "input_ids": input_ids,
+                **mm_inputs,
+            }
+        )
 
     def _hf_processor_applies_updates(
         self,
@@ -883,22 +916,26 @@ def _get_prompt_updates(
         hf_processor_mm_kwargs: Mapping[str, object],
         out_mm_kwargs: MultiModalKwargsItems,
     ) -> Sequence[PromptUpdate]:
-        placeholders = [("image", self.info.image_pattern),
-                        ("video", self.info.video_pattern)]
+        placeholders = [
+            ("image", self.info.image_pattern),
+            ("video", self.info.video_pattern),
+        ]
 
         # hard code for inconsistency of encode-decode image_pattern
         additional_placeholders = []
         tokenizer = self.info.get_tokenizer()
         for modality, pattern in placeholders:
             sub_pattern = tokenizer.decode(
-                tokenizer.encode(pattern, add_special_tokens=False))
+                tokenizer.encode(pattern, add_special_tokens=False)
+            )
             if sub_pattern != pattern:
                 additional_placeholders.append((modality, sub_pattern))
         placeholders += additional_placeholders
 
         def get_image_replacement(item_idx: int):
             images = mm_items.get_items(
-                "image", (MiniCPMVImageEmbeddingItems, ImageProcessorItems))
+                "image", (MiniCPMVImageEmbeddingItems, ImageProcessorItems)
+            )
 
             image_size = images.get_image_size(item_idx)
 
@@ -909,7 +946,8 @@ def get_image_replacement(item_idx: int):
 
         def get_video_replacement(item_idx: int):
             videos = mm_items.get_items(
-                "video", (MiniCPMVVideoEmbeddingItems, VideoProcessorItems))
+                "video", (MiniCPMVVideoEmbeddingItems, VideoProcessorItems)
+            )
 
             frame_size = videos.get_frame_size(item_idx)
             num_frames = videos.get_num_frames(item_idx)
@@ -925,9 +963,9 @@ def get_video_replacement(item_idx: int):
         }
 
         return [
-            PromptReplacement(modality=modality,
-                              target=pattern,
-                              replacement=get_replacement[modality])
+            PromptReplacement(
+                modality=modality, target=pattern, replacement=get_replacement[modality]
+            )
             for modality, pattern in placeholders
         ]
 
@@ -964,7 +1002,8 @@ def _recompute_cached_prompt_update(
                         1,
                     ),
                     "<unk>",
-                ))
+                )
+            )
 
         return new_update
 
@@ -1007,24 +1046,28 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.multimodal_config = multimodal_config
 
         self.version = get_version_by_config(self.config)
-        self.llm = self.init_llm(vllm_config=vllm_config,
-                                 prefix=maybe_prefix(prefix, "llm"))
-        self.vpm = self.init_vision_module(config,
-                                           quant_config,
-                                           prefix=maybe_prefix(prefix, "vpm"))
-        self.vision_dim = (self.vpm.embed_dim if self.version == (2, 0) else
-                           self.vpm.embeddings.embed_dim)
+        self.llm = self.init_llm(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "llm")
+        )
+        self.vpm = self.init_vision_module(
+            config, quant_config, prefix=maybe_prefix(prefix, "vpm")
+        )
+        self.vision_dim = (
+            self.vpm.embed_dim
+            if self.version == (2, 0)
+            else self.vpm.embeddings.embed_dim
+        )
         self.embed_dim = self.config.hidden_size
 
-        self.resampler = self.init_resampler(self.embed_dim,
-                                             self.vision_dim,
-                                             quant_config=quant_config,
-                                             prefix=maybe_prefix(
-                                                 prefix, "resampler"))
+        self.resampler = self.init_resampler(
+            self.embed_dim,
+            self.vision_dim,
+            quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "resampler"),
+        )
 
         self.mm_token_ids = set[int]()
-        self.make_empty_intermediate_tensors = (
-            self.llm.make_empty_intermediate_tensors)
+        self.make_empty_intermediate_tensors = self.llm.make_empty_intermediate_tensors
 
     def _parse_and_validate_vision_input(
         self,
@@ -1046,7 +1089,8 @@ def _parse_and_validate_vision_input(
             if not isinstance(image_embeds, (torch.Tensor, list)):
                 raise ValueError(
                     f"Incorrect type of image_embeds for {modality=}. "
-                    f"Got type: {type(image_embeds)}")
+                    f"Got type: {type(image_embeds)}"
+                )
 
             image_embeds_flat = flatten_bn(image_embeds)
 
@@ -1058,12 +1102,15 @@ def _parse_and_validate_vision_input(
         if not isinstance(pixel_values, (torch.Tensor, list)):
             raise ValueError(
                 f"Incorrect type of pixel_values for {modality=}. "
-                f"Got type: {type(pixel_values)}")
+                f"Got type: {type(pixel_values)}"
+            )
 
         tgt_sizes = kwargs.pop("tgt_sizes")
         if not isinstance(tgt_sizes, (torch.Tensor, list)):
-            raise ValueError(f"Incorrect type of tgt_sizes for {modality=}. "
-                             f"Got type: {type(tgt_sizes)}")
+            raise ValueError(
+                f"Incorrect type of tgt_sizes for {modality=}. "
+                f"Got type: {type(tgt_sizes)}"
+            )
 
         num_slices = [[len(p) for p in ps] for ps in pixel_values]
         num_slices_flat = flatten_bn(torch.tensor(num_slices))
@@ -1084,12 +1131,17 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if input_key in ("pixel_values",
-                             "image_embeds") and "images" not in modalities:
+            if (
+                input_key in ("pixel_values", "image_embeds")
+                and "images" not in modalities
+            ):
                 modalities["images"] = self._parse_and_validate_vision_input(
-                    "images", **kwargs)
-            if input_key in ("video_pixel_values",
-                             "video_embeds") and "videos" not in modalities:
+                    "images", **kwargs
+                )
+            if (
+                input_key in ("video_pixel_values", "video_embeds")
+                and "videos" not in modalities
+            ):
 
                 def _image_key(video_key: str):
                     if video_key == "video_token_id":
@@ -1098,10 +1150,8 @@ def _image_key(video_key: str):
                     return video_key.removeprefix("video_")
 
                 modalities["videos"] = self._parse_and_validate_vision_input(
-                    "videos", **{
-                        _image_key(k): v
-                        for k, v in kwargs.items()
-                    })
+                    "videos", **{_image_key(k): v for k, v in kwargs.items()}
+                )
 
         return modalities
 
@@ -1115,10 +1165,7 @@ def _process_vision_input(
         image_features_flat = self.get_vision_hidden_states(image_input)
 
         num_slices = image_input["num_slices"]
-        return [
-            e.flatten(0, 1)
-            for e in image_features_flat.split(num_slices.tolist())
-        ]
+        return [e.flatten(0, 1) for e in image_features_flat.split(num_slices.tolist())]
 
     def _process_multimodal_inputs(self, modalities: dict):
         # The result multimodal_embeddings is tuple of tensors, with each
@@ -1142,8 +1189,7 @@ def _process_multimodal_inputs(self, modalities: dict):
     def get_language_model(self) -> torch.nn.Module:
         return self.llm
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
@@ -1175,8 +1221,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.llm.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
 
@@ -1184,9 +1229,9 @@ def get_mm_mapping(self) -> MultiModelKeys:
         """
         Get the module prefix in multimodal models
         """
-        return MultiModelKeys.from_string_field(language_model="llm",
-                                                connector="resampler",
-                                                tower_model="vpm")
+        return MultiModelKeys.from_string_field(
+            language_model="llm", connector="resampler", tower_model="vpm"
+        )
 
     def init_llm(
         self,
@@ -1203,20 +1248,20 @@ def init_vision_module(
     ) -> nn.Module:
         raise NotImplementedError
 
-    def init_resampler(self,
-                       embed_dim: int,
-                       vision_dim: int,
-                       quant_config: Optional[QuantizationConfig] = None,
-                       prefix: str = "") -> nn.Module:
+    def init_resampler(
+        self,
+        embed_dim: int,
+        vision_dim: int,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> nn.Module:
         raise NotImplementedError
 
-    def get_vision_hidden_states(
-            self, data: MiniCPMVImagePixelInputs) -> torch.Tensor:
+    def get_vision_hidden_states(self, data: MiniCPMVImagePixelInputs) -> torch.Tensor:
         raise NotImplementedError
 
 
 class MiniCPMV2_0(MiniCPMVBaseModel):
-
     supports_encoder_tp_data = False
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
@@ -1253,8 +1298,10 @@ def init_vision_module(
 
         model = model.to(dtype=torch.get_default_dtype())
 
-        if (isinstance(model, timm.models.VisionTransformer)
-                and model.attn_pool is not None):
+        if (
+            isinstance(model, timm.models.VisionTransformer)
+            and model.attn_pool is not None
+        ):
             model.attn_pool = torch.nn.Identity()
 
         if self.config.drop_vision_last_layer:
@@ -1262,27 +1309,30 @@ def init_vision_module(
 
         return model
 
-    def init_resampler(self,
-                       embed_dim: int,
-                       vision_dim: int,
-                       quant_config: Optional[QuantizationConfig] = None,
-                       prefix: str = "") -> nn.Module:
+    def init_resampler(
+        self,
+        embed_dim: int,
+        vision_dim: int,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> nn.Module:
         with set_default_torch_dtype(torch.float16):
-            resampler = Resampler2(embed_dim=embed_dim,
-                                   num_heads=embed_dim // 128,
-                                   grid_size=int(
-                                       math.sqrt(self.config.query_num)),
-                                   kv_dim=vision_dim,
-                                   adaptive=False,
-                                   do_post_projection=True,
-                                   quant_config=quant_config,
-                                   prefix=prefix)
-
-        return resampler.to(device=current_platform.device_type,
-                            dtype=torch.get_default_dtype())
-
-    def get_vision_hidden_states(
-            self, data: MiniCPMVImagePixelInputs) -> torch.Tensor:
+            resampler = Resampler2(
+                embed_dim=embed_dim,
+                num_heads=embed_dim // 128,
+                grid_size=int(math.sqrt(self.config.query_num)),
+                kv_dim=vision_dim,
+                adaptive=False,
+                do_post_projection=True,
+                quant_config=quant_config,
+                prefix=prefix,
+            )
+
+        return resampler.to(
+            device=current_platform.device_type, dtype=torch.get_default_dtype()
+        )
+
+    def get_vision_hidden_states(self, data: MiniCPMVImagePixelInputs) -> torch.Tensor:
         pixel_values = data["pixel_values"]
 
         P_h, P_w = self.vpm.patch_embed.patch_size
@@ -1294,7 +1344,8 @@ def get_vision_hidden_states(
             H, W = pixel_value[0].shape[-2:]
             tgt_size = (math.ceil(H / P_h), math.ceil(W / P_w))
             vision_embedding = self.vpm.forward_features(
-                pixel_value.unsqueeze(0).type(dtype))
+                pixel_value.unsqueeze(0).type(dtype)
+            )
 
             if num_prefix_tokens > 0:
                 vision_embedding = vision_embedding[:, num_prefix_tokens:]
@@ -1343,24 +1394,28 @@ def init_vision_module(
             model.encoder.layers = model.encoder.layers[:-1]
         return model
 
-    def init_resampler(self,
-                       embed_dim: int,
-                       vision_dim: int,
-                       quant_config: Optional[QuantizationConfig] = None,
-                       prefix: str = "") -> nn.Module:
+    def init_resampler(
+        self,
+        embed_dim: int,
+        vision_dim: int,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> nn.Module:
         with set_default_torch_dtype(torch.float16):
-            resampler = Resampler2_5(num_queries=self.config.query_num,
-                                     embed_dim=embed_dim,
-                                     num_heads=embed_dim // 128,
-                                     kv_dim=vision_dim,
-                                     quant_config=quant_config,
-                                     prefix=prefix)
-
-        return resampler.to(device=current_platform.device_type,
-                            dtype=torch.get_default_dtype())
-
-    def get_vision_hidden_states(
-            self, data: MiniCPMVImagePixelInputs) -> torch.Tensor:
+            resampler = Resampler2_5(
+                num_queries=self.config.query_num,
+                embed_dim=embed_dim,
+                num_heads=embed_dim // 128,
+                kv_dim=vision_dim,
+                quant_config=quant_config,
+                prefix=prefix,
+            )
+
+        return resampler.to(
+            device=current_platform.device_type, dtype=torch.get_default_dtype()
+        )
+
+    def get_vision_hidden_states(self, data: MiniCPMVImagePixelInputs) -> torch.Tensor:
         pixel_values = data["pixel_values"]
         tgt_sizes = data["tgt_sizes"]
 
@@ -1370,9 +1425,7 @@ def get_vision_hidden_states(
         device = pixel_values[0].device
         dtype = pixel_values[0].dtype
 
-        all_pixel_values = torch.zeros((B, 3, P, L),
-                                       dtype=dtype,
-                                       device=device)
+        all_pixel_values = torch.zeros((B, 3, P, L), dtype=dtype, device=device)
         for i, pixel_values_item in enumerate(pixel_values):
             L_item = pixel_values_item.shape[-1]
             all_pixel_values[i, ..., :L_item] = pixel_values_item
@@ -1381,9 +1434,7 @@ def get_vision_hidden_states(
         max_patches = num_patches.max().item()
         assert isinstance(max_patches, int)
 
-        patch_attn_mask = torch.zeros((B, max_patches),
-                                      dtype=torch.bool,
-                                      device=device)
+        patch_attn_mask = torch.zeros((B, max_patches), dtype=torch.bool, device=device)
         for i, num_patches_item in enumerate(num_patches):
             patch_attn_mask[i, :num_patches_item] = True
 
@@ -1436,25 +1487,29 @@ def init_vision_module(
             model.encoder.layers = model.encoder.layers[:-1]
         return model
 
-    def init_resampler(self,
-                       embed_dim: int,
-                       vision_dim: int,
-                       quant_config: Optional[QuantizationConfig] = None,
-                       prefix: str = "") -> nn.Module:
+    def init_resampler(
+        self,
+        embed_dim: int,
+        vision_dim: int,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> nn.Module:
         with set_default_torch_dtype(torch.float16):
             # The resampler in 2.6 remains consistent with the one in 2.5.
-            resampler = Resampler2_5(num_queries=self.config.query_num,
-                                     embed_dim=embed_dim,
-                                     num_heads=embed_dim // 128,
-                                     kv_dim=vision_dim,
-                                     quant_config=quant_config,
-                                     prefix=prefix)
-
-        return resampler.to(device=current_platform.device_type,
-                            dtype=torch.get_default_dtype())
-
-    def get_vision_hidden_states(
-            self, data: MiniCPMVImagePixelInputs) -> torch.Tensor:
+            resampler = Resampler2_5(
+                num_queries=self.config.query_num,
+                embed_dim=embed_dim,
+                num_heads=embed_dim // 128,
+                kv_dim=vision_dim,
+                quant_config=quant_config,
+                prefix=prefix,
+            )
+
+        return resampler.to(
+            device=current_platform.device_type, dtype=torch.get_default_dtype()
+        )
+
+    def get_vision_hidden_states(self, data: MiniCPMVImagePixelInputs) -> torch.Tensor:
         pixel_values = data["pixel_values"]
         tgt_sizes = data["tgt_sizes"]
 
@@ -1464,9 +1519,7 @@ def get_vision_hidden_states(
         device = pixel_values[0].device
         dtype = pixel_values[0].dtype
 
-        all_pixel_values = torch.zeros((B, 3, P, L),
-                                       dtype=dtype,
-                                       device=device)
+        all_pixel_values = torch.zeros((B, 3, P, L), dtype=dtype, device=device)
         for i, pixel_values_item in enumerate(pixel_values):
             L_item = pixel_values_item.shape[-1]
             all_pixel_values[i, ..., :L_item] = pixel_values_item
@@ -1475,9 +1528,7 @@ def get_vision_hidden_states(
         max_patches = num_patches.max().item()
         assert isinstance(max_patches, int)
 
-        patch_attn_mask = torch.zeros((B, max_patches),
-                                      dtype=torch.bool,
-                                      device=device)
+        patch_attn_mask = torch.zeros((B, max_patches), dtype=torch.bool, device=device)
         for i, num_patches_item in enumerate(num_patches):
             patch_attn_mask[i, :num_patches_item] = True
 
@@ -1489,10 +1540,8 @@ def get_vision_hidden_states(
 
         return self.resampler(vision_embedding, tgt_sizes)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-        loader = AutoWeightsLoader(self,
-                                   skip_prefixes=["apm.", "audio", "tts"])
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
+        loader = AutoWeightsLoader(self, skip_prefixes=["apm.", "audio", "tts"])
         return loader.load_weights(weights)
 
 
@@ -1552,18 +1601,20 @@ def init_resampler(
         quant_config = self._maybe_ignore_quant_config(quant_config)
         with set_default_torch_dtype(torch.float16):
             # The resampler in 4.0 remains consistent with the one in 2.5/2.6.
-            resampler = Resampler2_5(num_queries=self.config.query_num,
-                                     embed_dim=embed_dim,
-                                     num_heads=embed_dim // 128,
-                                     kv_dim=vision_dim,
-                                     quant_config=quant_config,
-                                     prefix=prefix)
-
-        return resampler.to(device=current_platform.device_type,
-                            dtype=torch.get_default_dtype())
-
-    def get_vision_hidden_states(
-            self, data: MiniCPMVImagePixelInputs) -> torch.Tensor:
+            resampler = Resampler2_5(
+                num_queries=self.config.query_num,
+                embed_dim=embed_dim,
+                num_heads=embed_dim // 128,
+                kv_dim=vision_dim,
+                quant_config=quant_config,
+                prefix=prefix,
+            )
+
+        return resampler.to(
+            device=current_platform.device_type, dtype=torch.get_default_dtype()
+        )
+
+    def get_vision_hidden_states(self, data: MiniCPMVImagePixelInputs) -> torch.Tensor:
         pixel_values = data["pixel_values"]
         tgt_sizes = data["tgt_sizes"]
 
@@ -1573,9 +1624,7 @@ def get_vision_hidden_states(
         device = pixel_values[0].device
         dtype = pixel_values[0].dtype
 
-        all_pixel_values = torch.zeros((B, 3, P, L),
-                                       dtype=dtype,
-                                       device=device)
+        all_pixel_values = torch.zeros((B, 3, P, L), dtype=dtype, device=device)
         for i, pixel_values_item in enumerate(pixel_values):
             L_item = pixel_values_item.shape[-1]
             all_pixel_values[i, ..., :L_item] = pixel_values_item
@@ -1584,9 +1633,7 @@ def get_vision_hidden_states(
         max_patches = num_patches.max().item()
         assert isinstance(max_patches, int)
 
-        patch_attn_mask = torch.zeros((B, max_patches),
-                                      dtype=torch.bool,
-                                      device=device)
+        patch_attn_mask = torch.zeros((B, max_patches), dtype=torch.bool, device=device)
         for i, num_patches_item in enumerate(num_patches):
             patch_attn_mask[i, :num_patches_item] = True
 
@@ -1598,10 +1645,8 @@ def get_vision_hidden_states(
 
         return self.resampler(vision_embedding, tgt_sizes)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-        loader = AutoWeightsLoader(self,
-                                   skip_prefixes=["apm.", "audio", "tts"])
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
+        loader = AutoWeightsLoader(self, skip_prefixes=["apm.", "audio", "tts"])
         return loader.load_weights(weights)
 
 
@@ -1661,21 +1706,23 @@ def init_resampler(
         quant_config = self._maybe_ignore_quant_config(quant_config)
         with set_default_torch_dtype(torch.float16):
             # The resampler in 4.0 remains consistent with the one in 2.5/2.6.
-            resampler = Resampler4_5(num_queries=self.config.query_num,
-                                     embed_dim=embed_dim,
-                                     num_heads=embed_dim // 128,
-                                     kv_dim=vision_dim,
-                                     quant_config=quant_config,
-                                     prefix=prefix)
-
-        return resampler.to(device=current_platform.device_type,
-                            dtype=torch.get_default_dtype())
-
-    def get_vision_hidden_states(
-            self, data: MiniCPMVImagePixelInputs) -> torch.Tensor:
+            resampler = Resampler4_5(
+                num_queries=self.config.query_num,
+                embed_dim=embed_dim,
+                num_heads=embed_dim // 128,
+                kv_dim=vision_dim,
+                quant_config=quant_config,
+                prefix=prefix,
+            )
+
+        return resampler.to(
+            device=current_platform.device_type, dtype=torch.get_default_dtype()
+        )
+
+    def get_vision_hidden_states(self, data: MiniCPMVImagePixelInputs) -> torch.Tensor:
         pixel_values = data["pixel_values"]
         tgt_sizes = data["tgt_sizes"]
-        temporal_ids = data.get('temporal_ids', None)
+        temporal_ids = data.get("temporal_ids", None)
 
         B = len(pixel_values)
         P = pixel_values[0].shape[-2]
@@ -1683,11 +1730,10 @@ def get_vision_hidden_states(
         device = pixel_values[0].device
         dtype = pixel_values[0].dtype
 
-        all_pixel_values = torch.zeros((B, 3, P, L),
-                                       dtype=dtype,
-                                       device=device)
-        all_temporal_ids = None if temporal_ids is None else flatten_2d_lists(
-            temporal_ids)
+        all_pixel_values = torch.zeros((B, 3, P, L), dtype=dtype, device=device)
+        all_temporal_ids = (
+            None if temporal_ids is None else flatten_2d_lists(temporal_ids)
+        )
         for i, pixel_values_item in enumerate(pixel_values):
             L_item = pixel_values_item.shape[-1]
             all_pixel_values[i, ..., :L_item] = pixel_values_item
@@ -1696,9 +1742,7 @@ def get_vision_hidden_states(
         max_patches = num_patches.max().item()
         assert isinstance(max_patches, int)
 
-        patch_attn_mask = torch.zeros((B, max_patches),
-                                      dtype=torch.bool,
-                                      device=device)
+        patch_attn_mask = torch.zeros((B, max_patches), dtype=torch.bool, device=device)
         for i, num_patches_item in enumerate(num_patches):
             patch_attn_mask[i, :num_patches_item] = True
 
@@ -1710,10 +1754,8 @@ def get_vision_hidden_states(
 
         return self.resampler(vision_embedding, tgt_sizes, all_temporal_ids)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-        loader = AutoWeightsLoader(self,
-                                   skip_prefixes=["apm.", "audio", "tts"])
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
+        loader = AutoWeightsLoader(self, skip_prefixes=["apm.", "audio", "tts"])
         return loader.load_weights(weights)
 
 
@@ -1729,7 +1771,8 @@ def load_weights(self, weights: Iterable[tuple[str,
 @MULTIMODAL_REGISTRY.register_processor(
     MiniCPMVMultiModalProcessor,
     info=MiniCPMVProcessingInfo,
-    dummy_inputs=MiniCPMVDummyInputsBuilder)
+    dummy_inputs=MiniCPMVDummyInputsBuilder,
+)
 class MiniCPMV(MiniCPMVBaseModel, SupportsMultiModal, SupportsLoRA):
     """
     Different versions of MiniCPMV use different visual encoders and LLMs,
@@ -1751,9 +1794,12 @@ def __new__(cls, *, vllm_config: VllmConfig, prefix: str = ""):
         instance_cls = _SUPPORT_VERSION.get(version)
         if instance_cls is None:
             supported_versions = ", ".join(
-                [f"{v[0]}.{v[1]}" for v in sorted(_SUPPORT_VERSION.keys())])
-            raise ValueError(f"Currently, MiniCPMV only supports versions "
-                             f"{supported_versions}. Got version: {version}")
+                [f"{v[0]}.{v[1]}" for v in sorted(_SUPPORT_VERSION.keys())]
+            )
+            raise ValueError(
+                f"Currently, MiniCPMV only supports versions "
+                f"{supported_versions}. Got version: {version}"
+            )
 
         # quant_config references base class members,
         # so update values before init is called
diff --git a/vllm/model_executor/models/minimax_text_01.py b/vllm/model_executor/models/minimax_text_01.py
index 45228aa0bb93..e6e0952f71dd 100644
--- a/vllm/model_executor/models/minimax_text_01.py
+++ b/vllm/model_executor/models/minimax_text_01.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Inference-only MiniMaxText01 model."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import TYPE_CHECKING, Optional, Union
@@ -18,25 +19,33 @@
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, ModelConfig, VllmConfig
 from vllm.distributed.parallel_state import (
-    get_pp_group, get_tensor_model_parallel_rank,
-    get_tensor_model_parallel_world_size)
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.forward_context import get_forward_context
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
-from vllm.model_executor.layers.mamba.linear_attn import (
-    MiniMaxText01LinearAttention)
+from vllm.model_executor.layers.mamba.linear_attn import MiniMaxText01LinearAttention
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.utils import maybe_prefix
 from vllm.sequence import IntermediateTensors
@@ -45,25 +54,22 @@
 from .utils import PPMissingLayer, is_pp_missing_parameter, make_layers
 
 
-def replace_weight_name(name: str,
-                        key: str = None,
-                        to: str = None,
-                        count: int = None,
-                        prefix: str = None) -> str:
-    name = name.replace(key, to) if count is None else \
-        name.replace(key, to, count)
+def replace_weight_name(
+    name: str, key: str = None, to: str = None, count: int = None, prefix: str = None
+) -> str:
+    name = name.replace(key, to) if count is None else name.replace(key, to, count)
     return name
 
 
 def weight_loader_with_alias(alias: str):
-
     def wrapper(func: callable):
-
-        def inner_func(param: torch.Tensor,
-                       loaded_weight: torch.Tensor,
-                       *args,
-                       prefix: str = None,
-                       **kwargs):
+        def inner_func(
+            param: torch.Tensor,
+            loaded_weight: torch.Tensor,
+            *args,
+            prefix: str = None,
+            **kwargs,
+        ):
             value = func(param, loaded_weight, *args, **kwargs)
             return value
 
@@ -73,7 +79,6 @@ def inner_func(param: torch.Tensor,
 
 
 class MiniMaxText01MLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -103,7 +108,6 @@ def __init__(
         return
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
-
         gate_up, _ = self.gate_up_proj(x)
         x = self.act_fn(gate_up)
         x, _ = self.down_proj(x)
@@ -111,7 +115,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class MiniMaxText01MoE(nn.Module):
-
     def __init__(
         self,
         num_experts: int,
@@ -162,8 +165,7 @@ def __init__(
         return
 
     @staticmethod
-    def gate_weight_loader(param: nn.Parameter,
-                           loaded_weight: torch.Tensor) -> None:
+    def gate_weight_loader(param: nn.Parameter, loaded_weight: torch.Tensor) -> None:
         assert param.size() == loaded_weight.size()
         param.data.copy_(loaded_weight.to(torch.float32))
         return
@@ -173,13 +175,13 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         hidden_states = hidden_states.view(-1, self.hidden_size)
         router_logits_fp32, _ = self.gate(hidden_states.to(torch.float32))
         final_hidden_states = self.experts(
-            hidden_states, router_logits_fp32.to(hidden_states.dtype))
+            hidden_states, router_logits_fp32.to(hidden_states.dtype)
+        )
         final_hidden = final_hidden_states.view(num_tokens, hidden_size)
         return final_hidden
 
 
 class MiniMaxText01Attention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -253,8 +255,13 @@ def __init__(
         )
         return
 
-    def forward(self, hidden_states: torch.Tensor, output: torch.Tensor,
-                positions: torch.Tensor, **kwargs) -> None:
+    def forward(
+        self,
+        hidden_states: torch.Tensor,
+        output: torch.Tensor,
+        positions: torch.Tensor,
+        **kwargs,
+    ) -> None:
         qkv, _ = self.qkv_proj(hidden_states)
         q, k, v = qkv.split([self.q_size, self.kv_size, self.kv_size], dim=-1)
         q, k = self.rotary_emb(positions, q, k)
@@ -263,7 +270,6 @@ def forward(self, hidden_states: torch.Tensor, output: torch.Tensor,
 
 
 class MiniMaxText01DecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: MiniMaxConfig,
@@ -288,14 +294,17 @@ def __init__(
         head_dim = getattr(config, "head_dim", None)
         if head_dim is None:
             head_dim = config.hidden_size // config.num_attention_heads
-        if hasattr(config, "max_model_len") and isinstance(
-                config.max_model_len, int):
-            max_position_embeddings = min(config.max_position_embeddings,
-                                          config.max_model_len)
+        if hasattr(config, "max_model_len") and isinstance(config.max_model_len, int):
+            max_position_embeddings = min(
+                config.max_position_embeddings, config.max_model_len
+            )
         if config.attention_type == 0:
             use_headxdim = True
-            hidden_inner = (head_dim * config.num_attention_heads
-                            if use_headxdim else config.hidden_size)
+            hidden_inner = (
+                head_dim * config.num_attention_heads
+                if use_headxdim
+                else config.hidden_size
+            )
             self.self_attn = MiniMaxText01LinearAttention(
                 hidden_size=self.hidden_size,
                 hidden_inner_size=hidden_inner,
@@ -309,14 +318,16 @@ def __init__(
                 quant_config=quant_config,
                 layer_idx=self._ilayer,
                 linear_layer_idx=linear_layer_id,
-                prefix=prefix)
+                prefix=prefix,
+            )
         elif config.attention_type == 1:
             self.self_attn = MiniMaxText01Attention(
                 hidden_size=self.hidden_size,
                 num_heads=config.num_attention_heads,
                 head_dim=head_dim,
                 rotary_dim=config.rotary_dim
-                if hasattr(config, "rotary_dim") else head_dim,
+                if hasattr(config, "rotary_dim")
+                else head_dim,
                 num_kv_heads=config.num_key_value_heads,
                 max_position=max_position_embeddings,
                 rope_theta=rope_theta,
@@ -324,10 +335,12 @@ def __init__(
                 quant_config=quant_config,
                 layer_idx=self._ilayer,
                 cache_config=cache_config,
-                prefix=prefix)
+                prefix=prefix,
+            )
         else:
             raise ValueError(
-                f"Unsupported attention type: {self.config.attention_type}")
+                f"Unsupported attention type: {self.config.attention_type}"
+            )
 
         if expert_num == 1:
             self.mlp = MiniMaxText01MLP(
@@ -335,7 +348,8 @@ def __init__(
                 intermediate_size=config.intermediate_size,
                 quant_config=quant_config,
                 layer_idx=self._ilayer,
-                prefix=prefix)
+                prefix=prefix,
+            )
         else:
             self.block_sparse_moe = MiniMaxText01MoE(
                 num_experts=expert_num,
@@ -344,39 +358,51 @@ def __init__(
                 intermediate_size=config.intermediate_size,
                 layer_idx=self._ilayer,
                 quant_config=quant_config,
-                prefix=prefix)
+                prefix=prefix,
+            )
 
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
         if config.attention_type == 0:
             self.layernorm_attention_alpha = getattr(
-                config, 'layernorm_linear_attention_alpha',
-                getattr(config, 'linear_attn_alpha_factor', 1))
+                config,
+                "layernorm_linear_attention_alpha",
+                getattr(config, "linear_attn_alpha_factor", 1),
+            )
             self.layernorm_attention_beta = getattr(
-                config, 'layernorm_linear_attention_beta',
-                getattr(config, 'linear_attn_beta_factor', 1))
+                config,
+                "layernorm_linear_attention_beta",
+                getattr(config, "linear_attn_beta_factor", 1),
+            )
         else:
             self.layernorm_attention_alpha = getattr(
-                config, 'layernorm_full_attention_alpha',
-                getattr(config, 'full_attn_alpha_factor', 1))
+                config,
+                "layernorm_full_attention_alpha",
+                getattr(config, "full_attn_alpha_factor", 1),
+            )
             self.layernorm_attention_beta = getattr(
-                config, 'layernorm_full_attention_beta',
-                getattr(config, 'full_attn_beta_factor', 1))
+                config,
+                "layernorm_full_attention_beta",
+                getattr(config, "full_attn_beta_factor", 1),
+            )
         self.layernorm_mlp_alpha = getattr(
-            config, 'layernorm_mlp_alpha',
-            getattr(config, 'mlp_alpha_factor', 1))
+            config, "layernorm_mlp_alpha", getattr(config, "mlp_alpha_factor", 1)
+        )
         self.layernorm_mlp_beta = getattr(
-            config, 'layernorm_mlp_beta', getattr(config, 'mlp_beta_factor',
-                                                  1))
-        self.postnorm = getattr(config, 'postnorm', False)
+            config, "layernorm_mlp_beta", getattr(config, "mlp_beta_factor", 1)
+        )
+        self.postnorm = getattr(config, "postnorm", False)
         self.shared_moe = False
 
-        shared_intermediate = getattr(config, 'shared_intermediate_size', 0)
+        shared_intermediate = getattr(config, "shared_intermediate_size", 0)
         if isinstance(shared_intermediate, list):
-            shared_intermediate = shared_intermediate[
-                layer_id] if layer_id < len(shared_intermediate) else 0
+            shared_intermediate = (
+                shared_intermediate[layer_id]
+                if layer_id < len(shared_intermediate)
+                else 0
+            )
         if shared_intermediate > 0:
             self.shared_moe = True
             self.shared_mlp = MiniMaxText01MLP(
@@ -384,7 +410,8 @@ def __init__(
                 intermediate_size=shared_intermediate,
                 quant_config=quant_config,
                 layer_idx=self._ilayer,
-                prefix=prefix)
+                prefix=prefix,
+            )
             self.coefficient = ReplicatedLinear(
                 self.hidden_size,
                 1,
@@ -392,20 +419,19 @@ def __init__(
                 quant_config=quant_config,
                 params_dtype=torch.float32,
             )
-            self.coefficient.weight.weight_loader = (
-                self.shared_moe_coefficient_loader)
-            self.shared_moe_mode = getattr(config, 'shared_moe_mode',
-                                           'softmax')
+            self.coefficient.weight.weight_loader = self.shared_moe_coefficient_loader
+            self.shared_moe_mode = getattr(config, "shared_moe_mode", "softmax")
         return
 
-    def forward(self,
-                hidden_states: torch.Tensor,
-                positions: torch.Tensor,
-                attn_metadata: AttentionMetadata,
-                residual: Optional[torch.Tensor],
-                is_warmup: bool = False,
-                **kwargs) -> tuple[torch.Tensor, torch.Tensor]:
-
+    def forward(
+        self,
+        hidden_states: torch.Tensor,
+        positions: torch.Tensor,
+        attn_metadata: AttentionMetadata,
+        residual: Optional[torch.Tensor],
+        is_warmup: bool = False,
+        **kwargs,
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         layernorm_input = hidden_states
         layernorm_output = self.input_layernorm(layernorm_input)
         residual = layernorm_output if self.postnorm else layernorm_input
@@ -417,8 +443,7 @@ def forward(self,
         )
 
         residual = residual * self.layernorm_attention_alpha
-        self_attention_output = (self_attention_output *
-                                 self.layernorm_attention_beta)
+        self_attention_output = self_attention_output * self.layernorm_attention_beta
 
         layernorm_input = residual + self_attention_output
         layernorm_output = self.post_attention_layernorm(layernorm_input)
@@ -432,19 +457,16 @@ def forward(self,
             if self.shared_moe:
                 before_moe_dtype = layernorm_output.dtype
                 moe_hidden_fp32 = moe_hidden_states.to(torch.float32)
-                output_mlp = self.shared_mlp(layernorm_output).to(
-                    torch.float32)
+                output_mlp = self.shared_mlp(layernorm_output).to(torch.float32)
 
                 coef, _ = self.coefficient(layernorm_output.to(torch.float32))
 
-                if self.shared_moe_mode == 'softmax':
+                if self.shared_moe_mode == "softmax":
                     coef = torch.nn.functional.softmax(coef, dim=-1)
-                    hidden_states = moe_hidden_fp32 * (
-                        1 - coef) + output_mlp * coef
-                elif self.shared_moe_mode == 'sigmoid':
+                    hidden_states = moe_hidden_fp32 * (1 - coef) + output_mlp * coef
+                elif self.shared_moe_mode == "sigmoid":
                     coef = torch.nn.functional.sigmoid(coef)
-                    hidden_states = moe_hidden_fp32 * (
-                        1 - coef) + output_mlp * coef
+                    hidden_states = moe_hidden_fp32 * (1 - coef) + output_mlp * coef
 
                 hidden_states = hidden_states.to(before_moe_dtype)
             else:
@@ -458,8 +480,9 @@ def forward(self,
         return hidden_states, None
 
     @staticmethod
-    def shared_moe_coefficient_loader(param: torch.Tensor,
-                                      loaded_weight: torch.Tensor) -> None:
+    def shared_moe_coefficient_loader(
+        param: torch.Tensor, loaded_weight: torch.Tensor
+    ) -> None:
         assert param.size() == loaded_weight.size()
 
         param.data.copy_(loaded_weight.to(torch.float32))
@@ -468,7 +491,6 @@ def shared_moe_coefficient_loader(param: torch.Tensor,
 
 @support_torch_compile
 class MiniMaxText01Model(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config: MiniMaxConfig = vllm_config.model_config.hf_config
@@ -481,8 +503,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.vocab_size = config.vocab_size
 
         self.decoder_attention_types = getattr(
-            config, "attn_type_list", False) or getattr(
-                config, "decoder_attention_types", False)
+            config, "attn_type_list", False
+        ) or getattr(config, "decoder_attention_types", False)
         # The HF format uses "layer_types" instead of "attn_type_list"
         # where "linear_attention" is 0 and "full_attention" is 1
         if not self.decoder_attention_types and hasattr(config, "layer_types"):
@@ -510,50 +532,57 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.embed_tokens = PPMissingLayer()
 
         def layer_fn(prefix):
-            layer_idx = int(prefix.split('.')[-1])
+            layer_idx = int(prefix.split(".")[-1])
             layer_config = config
-            layer_config.attention_type = self.decoder_attention_types[
-                layer_idx]
+            layer_config.attention_type = self.decoder_attention_types[layer_idx]
             layer_config.layer_idx = layer_idx
 
             decoder_kwargs = {
                 "quant_config": quant_config,
                 "layer_id": layer_idx,
                 "model_config": model_config,
-                "cache_config": cache_config
+                "cache_config": cache_config,
             }
 
             if layer_config.attention_type == 0:
                 decoder_kwargs["linear_layer_id"] = sum(
-                    1 for i in range(layer_idx)
-                    if self.decoder_attention_types[i] == 0)
+                    1 for i in range(layer_idx) if self.decoder_attention_types[i] == 0
+                )
             else:
                 decoder_kwargs["linear_layer_id"] = None
 
             if hasattr(config, "num_local_experts") and isinstance(
-                    config.num_local_experts, list):
-                decoder_kwargs["expert_num"] = config.num_local_experts[
-                    layer_idx]
+                config.num_local_experts, list
+            ):
+                decoder_kwargs["expert_num"] = config.num_local_experts[layer_idx]
             elif hasattr(config, "num_local_experts") and isinstance(
-                    config.num_local_experts, int):
+                config.num_local_experts, int
+            ):
                 decoder_kwargs["expert_num"] = config.num_local_experts
             else:
                 decoder_kwargs["expert_num"] = 1
 
-            return MiniMaxText01DecoderLayer(layer_config,
-                                             **decoder_kwargs,
-                                             prefix=prefix)
+            return MiniMaxText01DecoderLayer(
+                layer_config, **decoder_kwargs, prefix=prefix
+            )
 
         self.start_layer, self.end_layer, self.layers = make_layers(
-            config.num_hidden_layers, layer_fn, prefix=f"{prefix}.layers")
+            config.num_hidden_layers, layer_fn, prefix=f"{prefix}.layers"
+        )
 
-        linear_layer_nums = sum(1 for i in range(config.num_hidden_layers)
-                                if self.decoder_attention_types[i] == 0)
+        linear_layer_nums = sum(
+            1
+            for i in range(config.num_hidden_layers)
+            if self.decoder_attention_types[i] == 0
+        )
         max_slots_number = scheduler_config.max_num_seqs
-        self.cache_shape = (linear_layer_nums, max_slots_number,
-                            config.num_attention_heads //
-                            get_tensor_model_parallel_world_size(),
-                            config.head_dim, config.head_dim)
+        self.cache_shape = (
+            linear_layer_nums,
+            max_slots_number,
+            config.num_attention_heads // get_tensor_model_parallel_world_size(),
+            config.head_dim,
+            config.head_dim,
+        )
         _dummy = torch.zeros(1)
         self._dtype = _dummy.dtype
         del _dummy
@@ -568,12 +597,12 @@ def layer_fn(prefix):
         self.embed_scale = 1.0
         return
 
-    def _clear_prefill_cache(self, attn_metadata,
-                             minimax_cache_tensors: torch.Tensor, **kwargs):
+    def _clear_prefill_cache(
+        self, attn_metadata, minimax_cache_tensors: torch.Tensor, **kwargs
+    ):
         seq_to_slot_maps = {}
         seq_id_map = sum(list(kwargs["request_ids_to_seq_ids"].values()), [])
-        for _, seq_to_slot_map in (
-                self.minimax_cache.cache_indices_mapping.items()):
+        for _, seq_to_slot_map in self.minimax_cache.cache_indices_mapping.items():
             seq_to_slot_maps.update(seq_to_slot_map)
 
         slots_to_clear = []
@@ -581,25 +610,29 @@ def _clear_prefill_cache(self, attn_metadata,
             if _prefill_id >= len(seq_id_map):
                 break
             seq_id = seq_id_map[_prefill_id]
-            if attn_metadata.context_lens_tensor[
-                    _prefill_id] == 0 and seq_id in seq_to_slot_maps:
+            if (
+                attn_metadata.context_lens_tensor[_prefill_id] == 0
+                and seq_id in seq_to_slot_maps
+            ):
                 slots_to_clear.append(seq_to_slot_maps[seq_id])
 
         if slots_to_clear:
-            slots_tensor = torch.tensor(slots_to_clear,
-                                        device=minimax_cache_tensors.device,
-                                        dtype=torch.long)
+            slots_tensor = torch.tensor(
+                slots_to_clear, device=minimax_cache_tensors.device, dtype=torch.long
+            )
             minimax_cache_tensors[:, slots_tensor, ...] = 0
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
 
-    def forward(self,
-                input_ids: Optional[torch.Tensor],
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs) -> Union[torch.Tensor, IntermediateTensors]:
+    def forward(
+        self,
+        input_ids: Optional[torch.Tensor],
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs,
+    ) -> Union[torch.Tensor, IntermediateTensors]:
         forward_context = get_forward_context()
         attn_metadata = forward_context.attn_metadata
 
@@ -622,10 +655,9 @@ def forward(self,
                 residual=residual,
             )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         if residual is not None:
             hidden_states, _ = self.norm(hidden_states, residual)
         else:
@@ -635,9 +667,7 @@ def forward(self,
 
 
 class MiniMaxText01ForCausalLM(nn.Module, HasInnerState, IsHybrid):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
-
         super().__init__()
         config = vllm_config.model_config.hf_config
         lora_config = vllm_config.lora_config
@@ -652,8 +682,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         self.unpadded_vocab_size = self.config.vocab_size
         if hasattr(vllm_config.model_config, "max_model_len"):
             self.config.max_model_len = vllm_config.model_config.max_model_len
-        self.model = MiniMaxText01Model(vllm_config=vllm_config,
-                                        prefix=maybe_prefix(prefix, "model"))
+        self.model = MiniMaxText01Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         if get_pp_group().is_last_rank:
             self.lm_head = ParallelLMHead(
                 self.unpadded_vocab_size,
@@ -663,37 +694,41 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
 
-            self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                    self.config.vocab_size)
+            self.logits_processor = LogitsProcessor(
+                self.unpadded_vocab_size, self.config.vocab_size
+            )
 
         else:
             self.lm_head = PPMissingLayer()
         self.lm_head.float()
         flash_layer_count = sum(
-            1 for attn_type in self.model.decoder_attention_types
-            if attn_type == 1)
+            1 for attn_type in self.model.decoder_attention_types if attn_type == 1
+        )
         self.kv_cache = [torch.tensor([]) for _ in range(flash_layer_count)]
         return
 
     def copy_inputs_before_cuda_graphs(self, input_buffers, **kwargs):
         return self.model.minimax_cache.copy_inputs_before_cuda_graphs(
-            input_buffers, **kwargs)
+            input_buffers, **kwargs
+        )
 
     def get_seqlen_agnostic_capture_inputs(self, batch_size: int):
-        return self.model.minimax_cache.get_seqlen_agnostic_capture_inputs(
-            batch_size)
+        return self.model.minimax_cache.get_seqlen_agnostic_capture_inputs(batch_size)
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs) -> torch.Tensor:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds, **kwargs)
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs,
+    ) -> torch.Tensor:
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds, **kwargs
+        )
 
         return hidden_states
 
@@ -703,21 +738,20 @@ def compute_logits(self, hidden_states: torch.Tensor) -> torch.Tensor:
         return logits
 
     def make_empty_intermediate_tensors(
-            self, batch_size: int, dtype: torch.dtype,
-            device: torch.device) -> IntermediateTensors:
-        return IntermediateTensors({
-            "hidden_states":
-            torch.zeros((batch_size, self.config.hidden_size),
-                        dtype=dtype,
-                        device=device),
-            "residual":
-            torch.zeros((batch_size, self.config.hidden_size),
-                        dtype=dtype,
-                        device=device),
-        })
-
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+        self, batch_size: int, dtype: torch.dtype, device: torch.device
+    ) -> IntermediateTensors:
+        return IntermediateTensors(
+            {
+                "hidden_states": torch.zeros(
+                    (batch_size, self.config.hidden_size), dtype=dtype, device=device
+                ),
+                "residual": torch.zeros(
+                    (batch_size, self.config.hidden_size), dtype=dtype, device=device
+                ),
+            }
+        )
+
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
 
@@ -729,7 +763,8 @@ def which_layer(name: str) -> int:
 
         def is_linear_attn_layer(layer_idx: int) -> bool:
             if layer_idx is None or layer_idx >= len(
-                    self.model.decoder_attention_types):
+                self.model.decoder_attention_types
+            ):
                 return False
             return self.model.decoder_attention_types[layer_idx] == 0
 
@@ -737,39 +772,48 @@ def is_moe_weight(name: str) -> bool:
             return "block_sparse_moe" in name and not name.endswith(".bias")
 
         def get_expert_id(param_name):
-            pattern = r'model\.layers\.\d+\.block_sparse_moe\.experts\.(\d+)\.'
+            pattern = r"model\.layers\.\d+\.block_sparse_moe\.experts\.(\d+)\."
             match = re.search(pattern, param_name)
             if match:
                 return match.group(1)
             return None
 
-        def load_sparse_moe_weight(name: str, loaded_weight: torch.Tensor,
-                                   self) -> None:
+        def load_sparse_moe_weight(
+            name: str, loaded_weight: torch.Tensor, self
+        ) -> None:
             if isinstance(self.config.num_local_experts, list):
                 expert_params_mapping = [
-                    ("w13_weight"
-                     if weight_name in ["w1", "w3"] else "w2_weight",
-                     f"experts.{expert_id}.{weight_name}.weight", expert_id)
+                    (
+                        "w13_weight" if weight_name in ["w1", "w3"] else "w2_weight",
+                        f"experts.{expert_id}.{weight_name}.weight",
+                        expert_id,
+                    )
                     for expert_id in range(max(self.config.num_local_experts))
                     for weight_name in ["w1", "w2", "w3"]
                 ]
             else:
                 expert_params_mapping = [
-                    ("w13_scale" if weight_name in ["w1", "w3"] else
-                     "w2_scale", f"{expert_id}.{weight_name}.weight_scale",
-                     expert_id, weight_name)
+                    (
+                        "w13_scale" if weight_name in ["w1", "w3"] else "w2_scale",
+                        f"{expert_id}.{weight_name}.weight_scale",
+                        expert_id,
+                        weight_name,
+                    )
                     for expert_id in range(self.config.num_local_experts)
                     for weight_name in ["w1", "w2", "w3"]
-                ] + [("w13_weight" if weight_name in ["w1", "w3"] else
-                      "w2_weight", f"{expert_id}.{weight_name}.weight",
-                      expert_id, weight_name)
-                     for expert_id in range(self.config.num_local_experts)
-                     for weight_name in ["w1", "w2", "w3"]]
-            for (param_name, weight_name, expert_id,
-                 shard_id) in expert_params_mapping:
+                ] + [
+                    (
+                        "w13_weight" if weight_name in ["w1", "w3"] else "w2_weight",
+                        f"{expert_id}.{weight_name}.weight",
+                        expert_id,
+                        weight_name,
+                    )
+                    for expert_id in range(self.config.num_local_experts)
+                    for weight_name in ["w1", "w2", "w3"]
+                ]
+            for param_name, weight_name, expert_id, shard_id in expert_params_mapping:
                 name_expert_id = get_expert_id(name)
-                if name_expert_id is not None and int(name_expert_id) != int(
-                        expert_id):
+                if name_expert_id is not None and int(name_expert_id) != int(expert_id):
                     continue
                 if weight_name not in name:
                     continue
@@ -779,19 +823,20 @@ def load_sparse_moe_weight(name: str, loaded_weight: torch.Tensor,
                 param = params_dict[name]
                 weight_loader = param.weight_loader
                 weight_loader = weight_loader_with_alias(name)(weight_loader)
-                weight_loader(param,
-                              loaded_weight,
-                              weight_name,
-                              expert_id=expert_id,
-                              shard_id=shard_id)
+                weight_loader(
+                    param,
+                    loaded_weight,
+                    weight_name,
+                    expert_id=expert_id,
+                    shard_id=shard_id,
+                )
                 loaded_params.add(name)
                 break
             else:
                 if is_pp_missing_parameter(name, self):
                     return
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader = weight_loader_with_alias(name)(weight_loader)
                 weight_loader(param, loaded_weight)
                 loaded_params.add(name)
@@ -800,8 +845,9 @@ def load_sparse_moe_weight(name: str, loaded_weight: torch.Tensor,
         def is_shared_mlp_weight(name: str) -> bool:
             return "shared_mlp" in name and not name.endswith(".bias")
 
-        def load_shared_mlp_weight(name: str, loaded_weight: torch.Tensor,
-                                   self) -> None:
+        def load_shared_mlp_weight(
+            name: str, loaded_weight: torch.Tensor, self
+        ) -> None:
             if not self.CONCAT_FFN:
                 if "gate_proj" in name:
                     name = name.replace("gate_proj", "w1", 1)
@@ -819,8 +865,7 @@ def load_shared_mlp_weight(name: str, loaded_weight: torch.Tensor,
             if is_pp_missing_parameter(name, self):
                 return
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader = weight_loader_with_alias(name)(weight_loader)
             if not self.CONCAT_FFN:
                 weight_loader(param, loaded_weight)
@@ -830,31 +875,31 @@ def load_shared_mlp_weight(name: str, loaded_weight: torch.Tensor,
                 elif "down_proj" in name:
                     weight_loader(param, loaded_weight)
                 else:
-                    raise AssertionError(
-                        "MLP weight not in [gate_up_proj, down_proj]")
+                    raise AssertionError("MLP weight not in [gate_up_proj, down_proj]")
             loaded_params.add(name)
             return
 
         def is_mha_weight(name: str) -> bool:
             return "self_attn" in name and not name.endswith(".bias")
 
-        def load_linear_attn_weight(name: str, loaded_weight: torch.Tensor,
-                                    self) -> None:
+        def load_linear_attn_weight(
+            name: str, loaded_weight: torch.Tensor, self
+        ) -> None:
             if is_pp_missing_parameter(name, self):
                 return
             param = params_dict[name]
 
             weight_loader = getattr(
-                param, "weight_loader",
-                MiniMaxText01LinearAttention.weight_direct_load)
+                param, "weight_loader", MiniMaxText01LinearAttention.weight_direct_load
+            )
             weight_loader = weight_loader_with_alias(name)(weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
             return
 
-        def load_flash_attn_weight(name: str, loaded_weight: torch.Tensor,
-                                   self) -> None:
-
+        def load_flash_attn_weight(
+            name: str, loaded_weight: torch.Tensor, self
+        ) -> None:
             flash_mha_params_mapping = [
                 ("qkv_proj", "q_proj", "q"),
                 ("qkv_proj", "k_proj", "k"),
@@ -862,16 +907,14 @@ def load_flash_attn_weight(name: str, loaded_weight: torch.Tensor,
                 ("gate_up_proj", "gate_proj", 0),
                 ("gate_up_proj", "up_proj", 1),
             ]
-            for (param_name, weight_name,
-                 shard_id) in flash_mha_params_mapping:
+            for param_name, weight_name, shard_id in flash_mha_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
                 if is_pp_missing_parameter(name, self):
                     return
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader = weight_loader_with_alias(name)(weight_loader)
                 weight_loader(param, loaded_weight, shard_id)
                 loaded_params.add(name)
@@ -881,36 +924,32 @@ def load_flash_attn_weight(name: str, loaded_weight: torch.Tensor,
                     return
                 param = params_dict[name]
 
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader = weight_loader_with_alias(name)(weight_loader)
                 weight_loader(param, loaded_weight)
                 loaded_params.add(name)
             return
 
         def is_layer_norm_weight(name: str) -> bool:
-            return "norm" in name and not name.endswith(
-                ".bias") and name in params_dict
+            return "norm" in name and not name.endswith(".bias") and name in params_dict
 
-        def load_layer_norm_weight(name: str, loaded_weight: torch.Tensor,
-                                   self) -> None:
+        def load_layer_norm_weight(
+            name: str, loaded_weight: torch.Tensor, self
+        ) -> None:
             if is_pp_missing_parameter(name, self):
                 return
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader = weight_loader_with_alias(name)(weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
             return
 
-        def load_basic_weight(name: str, loaded_weight: torch.Tensor,
-                              self) -> None:
+        def load_basic_weight(name: str, loaded_weight: torch.Tensor, self) -> None:
             if is_pp_missing_parameter(name, self):
                 return
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader = weight_loader_with_alias(name)(weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
@@ -919,7 +958,8 @@ def load_basic_weight(name: str, loaded_weight: torch.Tensor,
         for name, loaded_weight in weights:
             weight_at_layer = which_layer(name)
             if weight_at_layer and weight_at_layer >= len(
-                    self.model.decoder_attention_types):
+                self.model.decoder_attention_types
+            ):
                 continue
 
             if is_layer_norm_weight(name):
@@ -949,7 +989,6 @@ def get_mamba_state_dtype_from_config(
         cls,
         vllm_config: "VllmConfig",
     ) -> tuple[torch.dtype, torch.dtype]:
-
         return MambaStateDtypeCalculator.linear_attention_state_dtype(
             vllm_config.model_config.dtype,
             vllm_config.cache_config.mamba_cache_dtype,
diff --git a/vllm/model_executor/models/minimax_vl_01.py b/vllm/model_executor/models/minimax_vl_01.py
index 938c9a689fcf..338e3d5dca7b 100644
--- a/vllm/model_executor/models/minimax_vl_01.py
+++ b/vllm/model_executor/models/minimax_vl_01.py
@@ -7,12 +7,13 @@
 import torch.nn as nn
 from transformers import BatchFeature, PretrainedConfig
 from transformers.models.llava_next.modeling_llava_next import (
-    get_anyres_image_grid_shape, unpad_image)
+    get_anyres_image_grid_shape,
+    unpad_image,
+)
 
 from vllm.config import VllmConfig
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import ColumnParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import MultiModalFieldConfig
@@ -21,13 +22,20 @@
 
 from .clip import CLIPVisionModel
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
-from .llava import (BaseLlavaMultiModalProcessor, LlavaDummyInputsBuilder,
-                    init_vision_tower_for_llava)
+from .llava import (
+    BaseLlavaMultiModalProcessor,
+    LlavaDummyInputsBuilder,
+    init_vision_tower_for_llava,
+)
 from .llava_next import LlavaNextProcessingInfo
 from .pixtral import PixtralHFVisionModel
 from .siglip import SiglipVisionModel
-from .utils import (AutoWeightsLoader, flatten_bn, init_vllm_registered_model,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 
 
 class MiniMaxVL01ImagePixelInputs(TensorSchema):
@@ -42,10 +50,12 @@ class MiniMaxVL01ImagePixelInputs(TensorSchema):
     Note that `num_patches` may be different per batch and image,
     in which case the data is passed as a list instead of a batched tensor.
     """
+
     type: Literal["pixel_values"] = "pixel_values"
     pixel_values: Annotated[
         Union[torch.Tensor, list[torch.Tensor]],
-        TensorShape("bn", "np", 3, "h", "w", dynamic_dims={"np", "h", "w"})]
+        TensorShape("bn", "np", 3, "h", "w", dynamic_dims={"np", "h", "w"}),
+    ]
 
     image_sizes: Annotated[Optional[torch.Tensor], TensorShape("bn", 2)]
     # This should be in `(height, width)` format.
@@ -58,36 +68,43 @@ class MiniMaxVL01ImageEmbeddingInputs(TensorSchema):
         - ifs: Image feature size
         - hs: Hidden size (must match language model backbone)
     """
+
     type: Literal["image_embeds"] = "image_embeds"
     data: Annotated[torch.Tensor, TensorShape("bn", "ifs", "hs")]
 
 
-MiniMaxVL01ImageInputs = Union[MiniMaxVL01ImagePixelInputs,
-                               MiniMaxVL01ImageEmbeddingInputs]
+MiniMaxVL01ImageInputs = Union[
+    MiniMaxVL01ImagePixelInputs, MiniMaxVL01ImageEmbeddingInputs
+]
 
 
 class MiniMaxVL01MultiModalProjector(nn.Module):
-
-    def __init__(self,
-                 vision_hidden_size: int,
-                 text_hidden_size: int,
-                 projector_hidden_act: str,
-                 multimodal_projector_bias: bool,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        vision_hidden_size: int,
+        text_hidden_size: int,
+        projector_hidden_act: str,
+        multimodal_projector_bias: bool,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
 
-        self.linear_1 = ColumnParallelLinear(vision_hidden_size,
-                                             text_hidden_size,
-                                             bias=multimodal_projector_bias,
-                                             quant_config=quant_config,
-                                             prefix=f"{prefix}.linear_1")
+        self.linear_1 = ColumnParallelLinear(
+            vision_hidden_size,
+            text_hidden_size,
+            bias=multimodal_projector_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.linear_1",
+        )
         self.act = get_act_fn(projector_hidden_act)
-        self.linear_2 = RowParallelLinear(text_hidden_size,
-                                          text_hidden_size,
-                                          bias=multimodal_projector_bias,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.linear_2")
+        self.linear_2 = RowParallelLinear(
+            text_hidden_size,
+            text_hidden_size,
+            bias=multimodal_projector_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.linear_2",
+        )
 
     def forward(self, image_features: torch.Tensor) -> torch.Tensor:
         hidden_states, _ = self.linear_1(image_features)
@@ -101,15 +118,13 @@ class MiniMaxVL01DummyInputsBuilder(LlavaDummyInputsBuilder):
 
 
 class MiniMaxVL01ProcessingInfo(LlavaNextProcessingInfo):
-
     def get_hf_config(self):  # Need to override the config type
         return self.ctx.get_hf_config(PretrainedConfig)
 
     def get_hf_processor(self, **kwargs: object):
         hf_processor = self.ctx.get_hf_processor(**kwargs)
         image_processor = hf_processor.image_processor
-        image_processor.anyres_preprocess = (
-            image_processor.anyres_for_vllm_preprocess)
+        image_processor.anyres_preprocess = image_processor.anyres_for_vllm_preprocess
 
         return hf_processor
 
@@ -118,8 +133,8 @@ def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
 
 
 class MiniMaxVL01MultiModalProcessor(
-        BaseLlavaMultiModalProcessor[MiniMaxVL01ProcessingInfo]):
-
+    BaseLlavaMultiModalProcessor[MiniMaxVL01ProcessingInfo]
+):
     def _call_hf_processor(
         self,
         prompt: str,
@@ -162,13 +177,12 @@ def _get_mm_fields_config(
 @MULTIMODAL_REGISTRY.register_processor(
     MiniMaxVL01MultiModalProcessor,
     info=MiniMaxVL01ProcessingInfo,
-    dummy_inputs=MiniMaxVL01DummyInputsBuilder)
-class MiniMaxVL01ForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                          SupportsPP):
-
+    dummy_inputs=MiniMaxVL01DummyInputsBuilder,
+)
+class MiniMaxVL01ForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP):
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
-        "gate_up_proj": ["gate_proj", "up_proj"]
+        "gate_up_proj": ["gate_proj", "up_proj"],
     }
 
     @classmethod
@@ -193,16 +207,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
             config,
             quant_config,
             require_post_norm=False,
-            prefix=maybe_prefix(prefix, "vision_tower"))
+            prefix=maybe_prefix(prefix, "vision_tower"),
+        )
         self.multi_modal_projector = MiniMaxVL01MultiModalProjector(
             vision_hidden_size=config.vision_config.hidden_size,
             text_hidden_size=config.text_config.hidden_size,
             projector_hidden_act=config.projector_hidden_act,
             multimodal_projector_bias=True,
             quant_config=quant_config,
-            prefix=maybe_prefix(prefix, "multi_modal_projector"))
-        self.image_newline = nn.Parameter(
-            torch.empty(config.text_config.hidden_size))
+            prefix=maybe_prefix(prefix, "multi_modal_projector"),
+        )
+        self.image_newline = nn.Parameter(torch.empty(config.text_config.hidden_size))
         self.language_model = init_vllm_registered_model(
             vllm_config=vllm_config,
             hf_config=config.text_config,
@@ -215,15 +230,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
             self.pad_token_id = self.config.pad_token_id
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
     def _image_pixels_to_features(
         self,
-        vision_tower: Union[CLIPVisionModel, SiglipVisionModel,
-                            PixtralHFVisionModel],
+        vision_tower: Union[CLIPVisionModel, SiglipVisionModel, PixtralHFVisionModel],
         pixel_values: Union[torch.Tensor, list[torch.Tensor]],
     ) -> Union[torch.Tensor, tuple[torch.Tensor, ...]]:
         # NOTE: we skip the step to select the vision feature layer since
@@ -231,55 +246,55 @@ def _image_pixels_to_features(
         feature_select_strategy = self.config.vision_feature_select_strategy
         return tuple(
             vision_tower(p, feature_select_strategy=feature_select_strategy)
-            for p in pixel_values)
+            for p in pixel_values
+        )
 
     # adapted from https://huggingface.co/MiniMaxAI/MiniMax-VL-01/blob/main/modeling_minimax_vl_01.py#L616-L631
-    def pack_image_features(self, image_features: list[torch.Tensor],
-                            image_sizes: torch.Tensor):
+    def pack_image_features(
+        self, image_features: list[torch.Tensor], image_sizes: torch.Tensor
+    ):
         new_image_features = []
         for image_idx, image_feature in enumerate(image_features):
             if image_feature.shape[0] > 1:
                 base_image_feature = image_feature[0]
                 image_feature = image_feature[1:]
-                height = width = (self.config.vision_config.image_size //
-                                  self.config.vision_config.patch_size)
+                height = width = (
+                    self.config.vision_config.image_size
+                    // self.config.vision_config.patch_size
+                )
                 if height * width != base_image_feature.shape[0]:
                     raise ValueError(
-                        "The number of patches is not consistent with "
-                        "the image size.")
+                        "The number of patches is not consistent with the image size."
+                    )
                 num_patch_height, num_patch_width = get_anyres_image_grid_shape(
                     image_sizes[image_idx],
                     self.config.image_grid_pinpoints,
                     self.config.vision_config.image_size,
                 )
 
-                image_feature = image_feature.view(num_patch_height,
-                                                   num_patch_width, height,
-                                                   width, -1)
-                image_feature = image_feature.permute(4, 0, 2, 1,
-                                                      3).contiguous()
+                image_feature = image_feature.view(
+                    num_patch_height, num_patch_width, height, width, -1
+                )
+                image_feature = image_feature.permute(4, 0, 2, 1, 3).contiguous()
                 image_feature = image_feature.flatten(1, 2).flatten(2, 3)
-                image_feature = unpad_image(image_feature,
-                                            image_sizes[image_idx])
+                image_feature = unpad_image(image_feature, image_sizes[image_idx])
 
                 image_feature = torch.cat(
                     (
                         image_feature,
-                        self.image_newline[:, None, None].expand(
-                            *image_feature.shape[:-1], 1).to(
-                                image_feature.dtype),
+                        self.image_newline[:, None, None]
+                        .expand(*image_feature.shape[:-1], 1)
+                        .to(image_feature.dtype),
                     ),
                     dim=-1,
                 )
                 image_feature = image_feature.flatten(1, 2).transpose(0, 1)
-                image_feature = torch.cat((base_image_feature, image_feature),
-                                          dim=0)
+                image_feature = torch.cat((base_image_feature, image_feature), dim=0)
             else:
                 image_feature = image_feature[0]
                 image_feature = torch.cat(
-                    (image_feature,
-                     self.image_newline[None].to(image_feature)),
-                    dim=0)
+                    (image_feature, self.image_newline[None].to(image_feature)), dim=0
+                )
             new_image_features.append(image_feature)
         return new_image_features
 
@@ -305,9 +320,7 @@ def _process_image_input(
         if isinstance(image_features, torch.Tensor):
             return self.multi_modal_projector(image_features)
 
-        feature_sizes = [
-            image_feature.shape[0] for image_feature in image_features
-        ]
+        feature_sizes = [image_feature.shape[0] for image_feature in image_features]
 
         image_embeds = self.multi_modal_projector(torch.cat(image_features))
         image_embeds = torch.split(image_embeds, feature_sizes)
@@ -315,7 +328,8 @@ def _process_image_input(
         return self.pack_image_features(image_embeds, image_sizes)
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[MiniMaxVL01ImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[MiniMaxVL01ImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_sizes = kwargs.pop("image_sizes", None)
         image_embeds = kwargs.pop("image_embeds", None)
@@ -325,12 +339,14 @@ def _parse_and_validate_image_input(
 
         if pixel_values is not None and image_sizes is not None:
             if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values)}")
+                raise ValueError(
+                    f"Incorrect type of pixel values. Got type: {type(pixel_values)}"
+                )
 
             if not isinstance(image_sizes, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image sizes. "
-                                 f"Got type: {type(image_sizes)}")
+                raise ValueError(
+                    f"Incorrect type of image sizes. Got type: {type(image_sizes)}"
+                )
 
             return MiniMaxVL01ImagePixelInputs(
                 type="pixel_values",
@@ -340,8 +356,10 @@ def _parse_and_validate_image_input(
 
         if image_embeds is not None:
             if not isinstance(image_embeds, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image embeddings. "
-                                 f"Got type: {type(image_embeds)}")
+                raise ValueError(
+                    "Incorrect type of image embeddings. "
+                    f"Got type: {type(image_embeds)}"
+                )
 
             return MiniMaxVL01ImageEmbeddingInputs(
                 type="image_embeds",
@@ -350,8 +368,7 @@ def _parse_and_validate_image_input(
 
         raise AssertionError("This line should be unreachable.")
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -366,7 +383,6 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs: object,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-
         if intermediate_tensors is not None:
             inputs_embeds = None
         elif inputs_embeds is None:
@@ -378,10 +394,9 @@ def forward(
             )
             input_ids = None
 
-        hidden_states = self.language_model.model(input_ids,
-                                                  positions,
-                                                  intermediate_tensors,
-                                                  inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
 
         return hidden_states
 
@@ -391,7 +406,6 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/mistral3.py b/vllm/model_executor/models/mistral3.py
index d7c48758cca7..65fb1894b61f 100644
--- a/vllm/model_executor/models/mistral3.py
+++ b/vllm/model_executor/models/mistral3.py
@@ -3,43 +3,59 @@
 
 from abc import abstractmethod
 from collections.abc import Iterable, Mapping, Sequence
-from typing import (Annotated, Final, Literal, Optional, Protocol, TypeVar,
-                    Union)
+from typing import Annotated, Final, Literal, Optional, Protocol, TypeVar, Union
 
 import torch
 import torch.nn as nn
-from transformers import (BatchFeature, Mistral3Config, PixtralVisionConfig,
-                          PretrainedConfig)
+from transformers import (
+    BatchFeature,
+    Mistral3Config,
+    PixtralVisionConfig,
+    PretrainedConfig,
+)
 from transformers.models.pixtral import PixtralProcessor
 
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import get_act_fn
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import ColumnParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.cache import BaseMultiModalProcessorCache
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
-from vllm.multimodal.parse import (ImageProcessorItems, ImageSize,
-                                   MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo,
-                                        InputProcessingContext,
-                                        PromptReplacement, PromptUpdate,
-                                        PromptUpdateDetails)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
+from vllm.multimodal.parse import ImageProcessorItems, ImageSize, MultiModalDataItems
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    InputProcessingContext,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
 from .pixtral import PixtralHFEncoderInfo, PixtralHFVisionModel
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
-                    init_vllm_registered_model, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 from .vision import get_vision_encoder_info
 
 
@@ -67,38 +83,43 @@ class Mistral3PatchMerger(nn.Module):
     Learned merging of spatial_merge_size ** 2 patches
     """
 
-    def __init__(self, vision_hidden_size: int, spatial_merge_size: int,
-                 patch_size: int):
+    def __init__(
+        self, vision_hidden_size: int, spatial_merge_size: int, patch_size: int
+    ):
         super().__init__()
 
         self.vision_hidden_size = vision_hidden_size
         self.spatial_merge_size = spatial_merge_size
         self.patch_size = patch_size
-        self.merging_layer = nn.Linear(vision_hidden_size *
-                                       self.spatial_merge_size**2,
-                                       vision_hidden_size,
-                                       bias=False)
+        self.merging_layer = nn.Linear(
+            vision_hidden_size * self.spatial_merge_size**2,
+            vision_hidden_size,
+            bias=False,
+        )
 
-    def forward(self, image_features: torch.Tensor,
-                image_sizes: torch.Tensor) -> torch.Tensor:
-        image_sizes = [(image_size[0] // self.patch_size,
-                        image_size[1] // self.patch_size)
-                       for image_size in image_sizes]
+    def forward(
+        self, image_features: torch.Tensor, image_sizes: torch.Tensor
+    ) -> torch.Tensor:
+        image_sizes = [
+            (image_size[0] // self.patch_size, image_size[1] // self.patch_size)
+            for image_size in image_sizes
+        ]
 
         tokens_per_image = [h * w for h, w in image_sizes]
         d = image_features.shape[-1]
 
         permuted_tensor = []
         for image_index, image_tokens in enumerate(
-                image_features.split(tokens_per_image)):
+            image_features.split(tokens_per_image)
+        ):
             # Reshape image_tokens into a 2D grid
             h, w = image_sizes[image_index]
-            image_grid = image_tokens.view(h, w, d).permute(2, 0,
-                                                            1).unsqueeze(0)
+            image_grid = image_tokens.view(h, w, d).permute(2, 0, 1).unsqueeze(0)
             grid = torch.nn.functional.unfold(
                 image_grid,
                 kernel_size=self.spatial_merge_size,
-                stride=self.spatial_merge_size)
+                stride=self.spatial_merge_size,
+            )
             grid = grid.view(d * self.spatial_merge_size**2, -1).t()
             permuted_tensor.append(grid)
 
@@ -108,38 +129,45 @@ def forward(self, image_features: torch.Tensor,
 
 
 class Mistral3MultiModalProjector(nn.Module):
-
-    def __init__(self,
-                 vision_hidden_size: int,
-                 text_hidden_size: int,
-                 spatial_merge_size: int,
-                 patch_size: int,
-                 projector_hidden_act: str,
-                 multimodal_projector_bias: bool,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        vision_hidden_size: int,
+        text_hidden_size: int,
+        spatial_merge_size: int,
+        patch_size: int,
+        projector_hidden_act: str,
+        multimodal_projector_bias: bool,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
 
         self.norm = RMSNorm(vision_hidden_size, eps=1e-5)
         self.patch_merger = Mistral3PatchMerger(
             vision_hidden_size=vision_hidden_size,
             spatial_merge_size=spatial_merge_size,
-            patch_size=patch_size)
+            patch_size=patch_size,
+        )
 
-        self.linear_1 = ColumnParallelLinear(vision_hidden_size,
-                                             text_hidden_size,
-                                             bias=multimodal_projector_bias,
-                                             quant_config=quant_config,
-                                             prefix=f"{prefix}.linear_1")
+        self.linear_1 = ColumnParallelLinear(
+            vision_hidden_size,
+            text_hidden_size,
+            bias=multimodal_projector_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.linear_1",
+        )
         self.act = get_act_fn(projector_hidden_act)
-        self.linear_2 = RowParallelLinear(text_hidden_size,
-                                          text_hidden_size,
-                                          bias=multimodal_projector_bias,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.linear_2")
-
-    def forward(self, image_features: torch.Tensor,
-                image_sizes: torch.Tensor) -> torch.Tensor:
+        self.linear_2 = RowParallelLinear(
+            text_hidden_size,
+            text_hidden_size,
+            bias=multimodal_projector_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.linear_2",
+        )
+
+    def forward(
+        self, image_features: torch.Tensor, image_sizes: torch.Tensor
+    ) -> torch.Tensor:
         image_features = self.norm(image_features)
         image_features = self.patch_merger(image_features, image_sizes)
         hidden_states, _ = self.linear_1(image_features)
@@ -160,7 +188,6 @@ class LlavaLikeProcessor(Protocol):
 
 
 class BaseLlavaProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self) -> LlavaLikeConfig:
         return self.ctx.get_hf_config(Mistral3Config)
 
@@ -196,7 +223,6 @@ def get_image_size_with_most_features(self) -> ImageSize:
 
 
 class Mistral3DummyInputsBuilder(BaseDummyInputsBuilder[_I]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -213,29 +239,26 @@ def get_dummy_mm_data(
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class Mistral3ProcessingInfo(BaseLlavaProcessingInfo):
-
     def get_hf_processor(self, **kwargs: object):
         return self.ctx.get_hf_processor(PixtralProcessor, **kwargs)
 
 
-class Mistral3MultiModalProcessor(
-        BaseMultiModalProcessor[Mistral3ProcessingInfo]):
-
+class Mistral3MultiModalProcessor(BaseMultiModalProcessor[Mistral3ProcessingInfo]):
     def _call_hf_processor(
         self,
         prompt: str,
@@ -252,7 +275,6 @@ def _call_hf_processor(
 
         pixel_values = processed_outputs.get("pixel_values")
         if pixel_values is not None:
-
             # Avoid padding since we need the output for each image to be
             # independent of other images for the cache to work correctly
             image_sizes = processed_outputs["image_sizes"]
@@ -316,7 +338,8 @@ def get_replacement(item_idx: int):
 
 
 def _build_mistral3_info(
-    ctx: InputProcessingContext, ) -> BaseLlavaProcessingInfo:
+    ctx: InputProcessingContext,
+) -> BaseLlavaProcessingInfo:
     hf_config = ctx.get_hf_config(Mistral3Config)
     assert isinstance(hf_config.vision_config, PixtralVisionConfig)
     return Mistral3ProcessingInfo(ctx)
@@ -339,7 +362,7 @@ def _build_mistral3_processor(
 def _get_num_hidden_layers(hf_config: LlavaLikeConfig) -> int:
     """Determine the number of hidden layers to initialize up to in the
     visual encoder.
-    
+
     Args:
         hf_config: Model config with vision feature layer(s).
     """
@@ -350,10 +373,10 @@ def _get_num_hidden_layers(hf_config: LlavaLikeConfig) -> int:
         return _get_layer_index(feature_layers, num_hidden_layers)
     # If we have multiple feature layers, initialize up to the deepest one
     elif isinstance(feature_layers, (list, tuple)):
-        return max(
-            _get_layer_index(idx, num_hidden_layers) for idx in feature_layers)
-    raise TypeError(f"vision_layer_feature type: {type(feature_layers)}"
-                    " is not supported")
+        return max(_get_layer_index(idx, num_hidden_layers) for idx in feature_layers)
+    raise TypeError(
+        f"vision_layer_feature type: {type(feature_layers)} is not supported"
+    )
 
 
 def _get_layer_index(feature_layer_index: int, num_hidden_layers: int) -> int:
@@ -396,13 +419,14 @@ def init_vision_tower_for_llava(
 @MULTIMODAL_REGISTRY.register_processor(
     _build_mistral3_processor,
     info=_build_mistral3_info,
-    dummy_inputs=Mistral3DummyInputsBuilder)
-class Mistral3ForConditionalGeneration(nn.Module, SupportsLoRA,
-                                       SupportsMultiModal, SupportsPP):
-
+    dummy_inputs=Mistral3DummyInputsBuilder,
+)
+class Mistral3ForConditionalGeneration(
+    nn.Module, SupportsLoRA, SupportsMultiModal, SupportsPP
+):
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
-        "gate_up_proj": ["gate_proj", "up_proj"]
+        "gate_up_proj": ["gate_proj", "up_proj"],
     }
 
     hf_to_vllm_mapper = WeightsMapper(
@@ -412,7 +436,8 @@ class Mistral3ForConditionalGeneration(nn.Module, SupportsLoRA,
             "model.vision_tower.": "vision_tower.",
             "model.multi_modal_projector.": "multi_modal_projector.",
             "lm_head.": "language_model.lm_head.",
-        })
+        }
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -433,11 +458,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
 
         # NOTE: These are special cases for Pixtral-12B in the HF-format
         # https://huggingface.co/mistral-community/pixtral-12b/blob/main/config.json  # noqa
-        if (config.text_config.architectures is None
-                and config.text_config.model_type == "mistral"):
+        if (
+            config.text_config.architectures is None
+            and config.text_config.model_type == "mistral"
+        ):
             config.text_config.architectures = ["MistralForCausalLM"]
-        if (config.projector_hidden_act is None
-                and config.vision_config.hidden_act == "gelu"):
+        if (
+            config.projector_hidden_act is None
+            and config.vision_config.hidden_act == "gelu"
+        ):
             config.projector_hidden_act = "gelu"
 
         # TODO: Optionally initializes this for supporting embeddings.
@@ -446,7 +475,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
                 config,
                 quant_config,
                 require_post_norm=False,
-                prefix=maybe_prefix(prefix, "vision_tower"))
+                prefix=maybe_prefix(prefix, "vision_tower"),
+            )
             self.multi_modal_projector = Mistral3MultiModalProjector(
                 vision_hidden_size=config.vision_config.hidden_size,
                 text_hidden_size=config.text_config.hidden_size,
@@ -455,7 +485,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
                 patch_size=config.vision_config.patch_size,
                 multimodal_projector_bias=config.multimodal_projector_bias,
                 quant_config=quant_config,
-                prefix=maybe_prefix(prefix, "multi_modal_projector"))
+                prefix=maybe_prefix(prefix, "multi_modal_projector"),
+            )
         else:
             self.vision_tower = None
             self.multi_modal_projector = None
@@ -467,10 +498,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[Mistral3ImagePixelInputs]:
+        self, **kwargs: object
+    ) -> Optional[Mistral3ImagePixelInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_embeds = kwargs.pop("image_embeds", None)
 
@@ -479,8 +512,9 @@ def _parse_and_validate_image_input(
 
         assert pixel_values is not None
         if not isinstance(pixel_values, (torch.Tensor, list)):
-            raise ValueError("Incorrect type of pixel values. "
-                             f"Got type: {type(pixel_values)}")
+            raise ValueError(
+                f"Incorrect type of pixel values. Got type: {type(pixel_values)}"
+            )
 
         return Mistral3ImagePixelInputs(
             type="pixel_values_pixtral",
@@ -494,8 +528,9 @@ def _process_image_input(
         if image_input["type"] == "image_embeds":
             return image_input["data"]
 
-        image_sizes = [(img.shape[-2], img.shape[-1])
-                       for img in image_input["pixel_values"]]
+        image_sizes = [
+            (img.shape[-2], img.shape[-1]) for img in image_input["pixel_values"]
+        ]
 
         image_features = self.vision_tower(image_input["pixel_values"])
 
@@ -507,19 +542,19 @@ def _process_image_input(
             for image_feature in image_features
         ]
 
-        image_embeds = self.multi_modal_projector(torch.cat(image_features),
-                                                  image_sizes)
+        image_embeds = self.multi_modal_projector(
+            torch.cat(image_features), image_sizes
+        )
         if len(feature_sizes) > 1:
             image_embeds = torch.split(image_embeds, feature_sizes)
         else:
-            image_embeds = (image_embeds, )
+            image_embeds = (image_embeds,)
         return image_embeds
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -576,10 +611,9 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.language_model.model(input_ids,
-                                                  positions,
-                                                  intermediate_tensors,
-                                                  inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
 
         return hidden_states
 
@@ -589,8 +623,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         skip_prefixes = []
         if self.vision_tower is None and self.multi_modal_projector is None:
             skip_prefixes = ["vision_tower.", "multi_modal_projector."]
@@ -605,4 +638,5 @@ def get_mm_mapping(self) -> MultiModelKeys:
         return MultiModelKeys.from_string_field(
             language_model="language_model",
             connector="multi_modal_projector",
-            tower_model="vision_tower")
+            tower_model="vision_tower",
+        )
diff --git a/vllm/model_executor/models/mixtral.py b/vllm/model_executor/models/mixtral.py
index bebf0b5adac5..37b49349ec12 100644
--- a/vllm/model_executor/models/mixtral.py
+++ b/vllm/model_executor/models/mixtral.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Mixtral model."""
+
 import typing
 from collections.abc import Callable, Iterable
 from itertools import islice
@@ -35,26 +36,41 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig, get_current_vllm_config
-from vllm.distributed import (get_ep_group, get_pp_group,
-                              get_tensor_model_parallel_world_size)
+from vllm.distributed import (
+    get_ep_group,
+    get_pp_group,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import MixtureOfExperts, SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class MixtralMoE(nn.Module):
@@ -66,17 +82,19 @@ class MixtralMoE(nn.Module):
     across ranks.
     """
 
-    def __init__(self,
-                 num_experts: int,
-                 top_k: int,
-                 hidden_size: int,
-                 intermediate_size: int,
-                 params_dtype: Optional[torch.dtype] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 tp_size: Optional[int] = None,
-                 dp_size: Optional[int] = None,
-                 prefix: str = "",
-                 enable_eplb: bool = False):
+    def __init__(
+        self,
+        num_experts: int,
+        top_k: int,
+        hidden_size: int,
+        intermediate_size: int,
+        params_dtype: Optional[torch.dtype] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        tp_size: Optional[int] = None,
+        dp_size: Optional[int] = None,
+        prefix: str = "",
+        enable_eplb: bool = False,
+    ):
         super().__init__()
         self.hidden_size = hidden_size
 
@@ -91,38 +109,40 @@ def __init__(self,
 
         self.n_routed_experts = num_experts
         self.n_logical_experts = num_experts
-        self.n_redundant_experts = (
-            parallel_config.eplb_config.num_redundant_experts)
-        self.n_physical_experts = (self.n_logical_experts +
-                                   self.n_redundant_experts)
+        self.n_redundant_experts = parallel_config.eplb_config.num_redundant_experts
+        self.n_physical_experts = self.n_logical_experts + self.n_redundant_experts
         self.n_local_physical_experts = self.n_physical_experts // self.ep_size
-        self.physical_expert_start = (self.ep_rank *
-                                      self.n_local_physical_experts)
-        self.physical_expert_end = (self.physical_expert_start +
-                                    self.n_local_physical_experts)
+        self.physical_expert_start = self.ep_rank * self.n_local_physical_experts
+        self.physical_expert_end = (
+            self.physical_expert_start + self.n_local_physical_experts
+        )
 
         # Gate always runs at half / full precision for now.
 
-        self.gate = ReplicatedLinear(hidden_size,
-                                     num_experts,
-                                     bias=False,
-                                     params_dtype=params_dtype,
-                                     quant_config=None,
-                                     prefix=f"{prefix}.gate")
-
-        self.experts = FusedMoE(num_experts=num_experts,
-                                top_k=top_k,
-                                hidden_size=hidden_size,
-                                intermediate_size=intermediate_size,
-                                params_dtype=params_dtype,
-                                reduce_results=True,
-                                renormalize=True,
-                                quant_config=quant_config,
-                                tp_size=tp_size,
-                                dp_size=dp_size,
-                                prefix=f"{prefix}.experts",
-                                enable_eplb=self.enable_eplb,
-                                num_redundant_experts=self.n_redundant_experts)
+        self.gate = ReplicatedLinear(
+            hidden_size,
+            num_experts,
+            bias=False,
+            params_dtype=params_dtype,
+            quant_config=None,
+            prefix=f"{prefix}.gate",
+        )
+
+        self.experts = FusedMoE(
+            num_experts=num_experts,
+            top_k=top_k,
+            hidden_size=hidden_size,
+            intermediate_size=intermediate_size,
+            params_dtype=params_dtype,
+            reduce_results=True,
+            renormalize=True,
+            quant_config=quant_config,
+            tp_size=tp_size,
+            dp_size=dp_size,
+            prefix=f"{prefix}.experts",
+            enable_eplb=self.enable_eplb,
+            num_redundant_experts=self.n_redundant_experts,
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         # NOTE: hidden_states can have either 1D or 2D shape.
@@ -135,7 +155,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class MixtralAttention(nn.Module):
-
     def __init__(
         self,
         config: MixtralConfig,
@@ -196,13 +215,15 @@ def __init__(
             base=int(self.rope_theta),
             is_neox_style=True,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -218,7 +239,6 @@ def forward(
 
 
 class MixtralDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: MixtralConfig,
@@ -240,7 +260,8 @@ def __init__(
             rope_theta=rope_theta,
             cache_config=cache_config,
             quant_config=quant_config,
-            prefix=f"{prefix}.self_attn")
+            prefix=f"{prefix}.self_attn",
+        )
         self.block_sparse_moe = MixtralMoE(
             num_experts=config.num_local_experts,
             top_k=config.num_experts_per_tok,
@@ -248,11 +269,12 @@ def __init__(
             intermediate_size=config.intermediate_size,
             quant_config=quant_config,
             prefix=f"{prefix}.block_sparse_moe",
-            enable_eplb=enable_eplb)
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+            enable_eplb=enable_eplb,
+        )
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -265,23 +287,20 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.block_sparse_moe(hidden_states)
         return hidden_states, residual
 
 
 @support_torch_compile
 class MixtralModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -293,8 +312,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.config = config
         self.quant_config = quant_config
-        lora_vocab = (lora_config.lora_extra_vocab_size *
-                      (lora_config.max_loras or 1)) if lora_config else 0
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
 
@@ -305,8 +327,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
 
         self.enable_eplb = parallel_config.enable_eplb
-        self.num_redundant_experts = (
-            parallel_config.eplb_config.num_redundant_experts)
+        self.num_redundant_experts = parallel_config.eplb_config.num_redundant_experts
 
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
@@ -317,12 +338,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 prefix=prefix,
                 enable_eplb=self.enable_eplb,
             ),
-            prefix=f"{prefix}.layers")
+            prefix=f"{prefix}.layers",
+        )
 
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -347,10 +369,9 @@ def forward(
         for layer in islice(self.layers, self.start_layer, self.end_layer):
             hidden_states, residual = layer(positions, hidden_states, residual)
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
@@ -362,10 +383,10 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
             ckpt_down_proj_name="w2",
             ckpt_up_proj_name="w3",
             num_experts=self.config.num_local_experts,
-            num_redundant_experts=self.num_redundant_experts)
+            num_redundant_experts=self.num_redundant_experts,
+        )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -377,25 +398,27 @@ def load_weights(self, weights: Iterable[tuple[str,
         loaded_params: set[str] = set()
         expert_params_mapping = self.get_expert_mapping()
         for name, loaded_weight in weights:
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
                 # Skip loading extra bias for GPTQ models.
-                if ((name.endswith(".bias") or name.endswith("_bias"))
-                        and name not in params_dict):
+                if (
+                    name.endswith(".bias") or name.endswith("_bias")
+                ) and name not in params_dict:
                     continue
                 # Skip layers on other devices.
                 if is_pp_missing_parameter(name, self):
@@ -424,20 +447,23 @@ def load_weights(self, weights: Iterable[tuple[str,
                     if is_pp_missing_parameter(name_mapped, self):
                         continue
 
-                    if ((name_mapped.endswith(".bias")
-                         or name_mapped.endswith("_bias"))
-                            and name_mapped not in params_dict):
+                    if (
+                        name_mapped.endswith(".bias") or name_mapped.endswith("_bias")
+                    ) and name_mapped not in params_dict:
                         continue
 
                     param = params_dict[name_mapped]
-                    weight_loader = typing.cast(Callable[..., bool],
-                                                param.weight_loader)
-                    success = weight_loader(param,
-                                            loaded_weight,
-                                            name_mapped,
-                                            shard_id=shard_id,
-                                            expert_id=expert_id,
-                                            return_success=True)
+                    weight_loader = typing.cast(
+                        Callable[..., bool], param.weight_loader
+                    )
+                    success = weight_loader(
+                        param,
+                        loaded_weight,
+                        name_mapped,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                        return_success=True,
+                    )
                     if success:
                         name = name_mapped
                         break
@@ -445,8 +471,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                     if is_expert_weight:
                         continue
                     # Skip loading extra bias for GPTQ models.
-                    if ((name.endswith(".bias") or name.endswith("_bias"))
-                            and name not in params_dict):
+                    if (
+                        name.endswith(".bias") or name.endswith("_bias")
+                    ) and name not in params_dict:
                         continue
                     # Skip layers on other devices.
                     if is_pp_missing_parameter(name, self):
@@ -457,15 +484,15 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
 
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
-class MixtralForCausalLM(nn.Module, SupportsLoRA, SupportsPP,
-                         MixtureOfExperts):
+class MixtralForCausalLM(nn.Module, SupportsLoRA, SupportsPP, MixtureOfExperts):
     fall_back_to_pt_during_load = False
 
     packed_modules_mapping = {
@@ -492,8 +519,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.lora_config = lora_config
         self.quant_config = quant_config
 
-        self.model = MixtralModel(vllm_config=vllm_config,
-                                  prefix=maybe_prefix(prefix, "model"))
+        self.model = MixtralModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.unpadded_vocab_size = config.vocab_size
         if lora_config:
             self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
@@ -504,16 +532,19 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             padding_size=DEFAULT_VOCAB_PADDING_SIZE
             # We need bigger padding if using lora for kernel
             # compatibility
-            if not lora_config else lora_config.lora_vocab_padding_size,
+            if not lora_config
+            else lora_config.lora_vocab_padding_size,
             quant_config=quant_config,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
         if self.config.tie_word_embeddings:
             self.lm_head.weight = self.model.embed_tokens.weight
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size
+        )
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
         self.expert_weights = []
         self.moe_layers: list[FusedMoE] = []
@@ -524,7 +555,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 continue
             assert isinstance(layer, MixtralDecoderLayer)
             if hasattr(layer, "block_sparse_moe") and isinstance(
-                    layer.block_sparse_moe, MixtralMoE):
+                layer.block_sparse_moe, MixtralMoE
+            ):
                 example_moe = layer.block_sparse_moe
                 self.moe_layers.append(layer.block_sparse_moe.experts)
 
@@ -565,11 +597,11 @@ def update_physical_experts_metadata(
         assert self.num_local_physical_experts == num_local_physical_experts
         self.num_physical_experts = num_physical_experts
         self.num_local_physical_experts = num_local_physical_experts
-        self.num_redundant_experts = (num_physical_experts -
-                                      self.num_logical_experts)
+        self.num_redundant_experts = num_physical_experts - self.num_logical_experts
         for layer in self.model.layers:
             if hasattr(layer, "block_sparse_moe") and isinstance(
-                    layer.block_sparse_moe, MixtralMoE):
+                layer.block_sparse_moe, MixtralMoE
+            ):
                 moe = layer.block_sparse_moe
                 moe.n_local_physical_experts = num_local_physical_experts
                 moe.n_physical_experts = num_physical_experts
@@ -586,8 +618,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -597,8 +630,7 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
 
diff --git a/vllm/model_executor/models/mllama4.py b/vllm/model_executor/models/mllama4.py
index 9864ca2dc474..1c8e8686ccae 100644
--- a/vllm/model_executor/models/mllama4.py
+++ b/vllm/model_executor/models/mllama4.py
@@ -27,30 +27,39 @@
 from transformers.image_utils import SizeDict
 from transformers.models.llama4 import Llama4Processor
 from transformers.models.llama4.image_processing_llama4_fast import (
-    find_supported_resolutions, get_best_fit)
+    find_supported_resolutions,
+    get_best_fit,
+)
 
 from vllm.attention.layer import MultiHeadAttention
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_tensor_model_parallel_world_size
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.model_loader.utils import initialize_model
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
-from vllm.multimodal.parse import (ImageProcessorItems, ImageSize,
-                                   MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo,
-                                        InputProcessingContext,
-                                        PromptReplacement, PromptUpdate,
-                                        PromptUpdateDetails)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
+from vllm.multimodal.parse import ImageProcessorItems, ImageSize, MultiModalDataItems
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    InputProcessingContext,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
@@ -72,9 +81,10 @@ class Llama4ImagePatchInputs(TensorSchema):
 
     type: Literal["pixel_values"] = "pixel_values"
 
-    flat_data: Annotated[torch.Tensor,
-                         TensorShape("total_num_chunks", "num_channels",
-                                     "image_size", "image_size")]
+    flat_data: Annotated[
+        torch.Tensor,
+        TensorShape("total_num_chunks", "num_channels", "image_size", "image_size"),
+    ]
 
     patches_per_image: Annotated[torch.Tensor, TensorShape("batch_size")]
     """
@@ -93,7 +103,6 @@ class Llama4ImagePatchInputs(TensorSchema):
 
 
 class Llama4VisionMLP(nn.Module):
-
     def __init__(
         self,
         input_size: int,
@@ -135,7 +144,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class Llama4MultiModalProjector(nn.Module):
-
     def __init__(
         self,
         config,
@@ -165,9 +173,9 @@ def pixel_shuffle(input_tensor, shuffle_ratio):
     input_tensor = input_tensor.view(batch_size, patch_size, patch_size, -1)
     batch_size, height, width, channels = input_tensor.size()
 
-    reshaped_tensor = input_tensor.view(batch_size, height,
-                                        int(width * shuffle_ratio),
-                                        int(channels / shuffle_ratio))
+    reshaped_tensor = input_tensor.view(
+        batch_size, height, int(width * shuffle_ratio), int(channels / shuffle_ratio)
+    )
     reshaped_tensor = reshaped_tensor.permute(0, 2, 1, 3).contiguous()
 
     reshaped_tensor = reshaped_tensor.view(
@@ -178,13 +186,11 @@ def pixel_shuffle(input_tensor, shuffle_ratio):
     )
     reshaped_tensor = reshaped_tensor.permute(0, 2, 1, 3).contiguous()
 
-    output_tensor = reshaped_tensor.view(batch_size, -1,
-                                         reshaped_tensor.shape[-1])
+    output_tensor = reshaped_tensor.view(batch_size, -1, reshaped_tensor.shape[-1])
     return output_tensor
 
 
 class Llama4VisionPixelShuffleMLP(nn.Module):
-
     def __init__(
         self,
         config,
@@ -194,8 +200,9 @@ def __init__(
     ):
         super().__init__()
         self.pixel_shuffle_ratio = config.pixel_shuffle_ratio
-        self.inner_dim = int(config.projector_input_dim //
-                             (self.pixel_shuffle_ratio**2))
+        self.inner_dim = int(
+            config.projector_input_dim // (self.pixel_shuffle_ratio**2)
+        )
         self.output_dim = config.projector_output_dim
         self.mlp = Llama4VisionMLP(
             input_size=config.intermediate_size,
@@ -209,13 +216,11 @@ def __init__(
         )
 
     def forward(self, encoded_patches: torch.Tensor) -> torch.Tensor:
-        encoded_patches = pixel_shuffle(encoded_patches,
-                                        self.pixel_shuffle_ratio)
+        encoded_patches = pixel_shuffle(encoded_patches, self.pixel_shuffle_ratio)
         return self.mlp(encoded_patches)
 
 
 class Llama4VisionAttention(nn.Module):
-
     def __init__(
         self,
         config: Llama4VisionConfig,
@@ -225,8 +230,9 @@ def __init__(
     ):
         super().__init__()
         self.config = config
-        self.tp_size = (1 if use_data_parallel else
-                        get_tensor_model_parallel_world_size())
+        self.tp_size = (
+            1 if use_data_parallel else get_tensor_model_parallel_world_size()
+        )
         self.embed_dim = config.hidden_size
         self.num_heads = config.num_attention_heads
         self.head_dim = config.hidden_size // self.num_heads
@@ -237,8 +243,9 @@ def __init__(
         self.attention_dropout = config.attention_dropout
         self.scaling = self.head_dim**-0.5
 
-        self.attn = MultiHeadAttention(self.num_local_heads, self.head_dim,
-                                       self.scaling)
+        self.attn = MultiHeadAttention(
+            self.num_local_heads, self.head_dim, self.scaling
+        )
 
         if use_data_parallel:
             self.qkv_proj = ReplicatedLinear(
@@ -277,7 +284,7 @@ def __init__(
             head_size=self.head_dim,
             rotary_dim=config.hidden_size // config.num_attention_heads // 2,
             # number of image patches
-            max_position=(config.image_size // config.patch_size)**2,
+            max_position=(config.image_size // config.patch_size) ** 2,
             base=config.rope_theta,
             rope_scaling={"rope_type": "mllama4"},
             is_neox_style=False,
@@ -308,7 +315,6 @@ def forward(
 
 
 class Llama4VisionEncoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Llama4VisionConfig,
@@ -357,12 +363,11 @@ def forward(
         hidden_state = self.mlp(hidden_state)
         hidden_state = residual + hidden_state
 
-        outputs = (hidden_state, )
+        outputs = (hidden_state,)
         return outputs
 
 
 class Llama4VisionEncoder(nn.Module):
-
     def __init__(
         self,
         config: Llama4VisionConfig,
@@ -372,14 +377,17 @@ def __init__(
     ):
         super().__init__()
         self.config = config
-        self.layers = nn.ModuleList([
-            Llama4VisionEncoderLayer(
-                config,
-                quant_config=quant_config,
-                prefix=f"{prefix}.layers.{layer_idx}",
-                use_data_parallel=use_data_parallel,
-            ) for layer_idx in range(config.num_hidden_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                Llama4VisionEncoderLayer(
+                    config,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.layers.{layer_idx}",
+                    use_data_parallel=use_data_parallel,
+                )
+                for layer_idx in range(config.num_hidden_layers)
+            ]
+        )
 
     def forward(
         self,
@@ -387,9 +395,9 @@ def forward(
     ) -> torch.Tensor:
         r"""
         Args:
-            hidden_states: Input tensor of shape 
+            hidden_states: Input tensor of shape
                 (batch_size, sequence_length, hidden_size).
-                Hidden states from the model embeddings, representing 
+                Hidden states from the model embeddings, representing
                 the input tokens.
                 associated vectors than the model's internal embedding
                 lookup matrix.
@@ -403,7 +411,6 @@ def forward(
 
 
 class Llama4UnfoldConvolution(nn.Module):
-
     def __init__(
         self,
         config: Llama4VisionConfig,
@@ -415,8 +422,7 @@ def __init__(
         kernel_size = config.patch_size
         if isinstance(kernel_size, int):
             kernel_size = (kernel_size, kernel_size)
-        self.unfold = torch.nn.Unfold(kernel_size=kernel_size,
-                                      stride=config.patch_size)
+        self.unfold = torch.nn.Unfold(kernel_size=kernel_size, stride=config.patch_size)
         self.linear = ColumnParallelLinear(
             input_size=config.num_channels * kernel_size[0] * kernel_size[1],
             output_size=config.hidden_size,
@@ -435,7 +441,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class Llama4VisionModel(nn.Module):
-
     def __init__(
         self,
         config: Llama4VisionConfig,
@@ -450,7 +455,7 @@ def __init__(
         self.hidden_size = config.hidden_size
         self.num_channels = config.num_channels
 
-        self.num_patches = (self.image_size // self.patch_size)**2 + 1
+        self.num_patches = (self.image_size // self.patch_size) ** 2 + 1
         self.scale = config.hidden_size**-0.5
 
         self.patch_embedding = Llama4UnfoldConvolution(
@@ -460,10 +465,10 @@ def __init__(
             use_data_parallel=use_data_parallel,
         )
 
-        self.class_embedding = nn.Parameter(self.scale *
-                                            torch.randn(self.hidden_size))
+        self.class_embedding = nn.Parameter(self.scale * torch.randn(self.hidden_size))
         self.positional_embedding_vlm = nn.Parameter(
-            self.scale * torch.randn(self.num_patches, self.hidden_size))
+            self.scale * torch.randn(self.num_patches, self.hidden_size)
+        )
 
         # layer norms
         self.layernorm_pre = nn.LayerNorm(self.hidden_size, eps=1e-5)
@@ -492,8 +497,9 @@ def forward(
         num_tiles, num_patches, hidden_dim = hidden_state.shape
 
         # Add cls token
-        class_embedding = self.class_embedding.expand(hidden_state.shape[0], 1,
-                                                      hidden_state.shape[-1])
+        class_embedding = self.class_embedding.expand(
+            hidden_state.shape[0], 1, hidden_state.shape[-1]
+        )
         hidden_state = torch.cat([hidden_state, class_embedding], dim=1)
         num_patches += 1
 
@@ -505,7 +511,8 @@ def forward(
             hidden_dim,
         )
         positional_embedding = self.positional_embedding_vlm.to(
-            dtype=hidden_state.dtype, device=hidden_state.device)
+            dtype=hidden_state.dtype, device=hidden_state.device
+        )
         hidden_state = hidden_state + positional_embedding
         hidden_state = self.layernorm_pre(hidden_state)
         hidden_state = hidden_state.view(num_tiles, -1, hidden_dim)
@@ -524,7 +531,6 @@ def forward(
 
 
 class Mllama4ProcessingInfo(BaseProcessingInfo):
-
     def __init__(self, ctx: InputProcessingContext) -> None:
         super().__init__(ctx)
 
@@ -532,9 +538,9 @@ def get_hf_config(self) -> Llama4Config:
         return self.ctx.get_hf_config(Llama4Config)
 
     def get_hf_processor(self, **kwargs: object) -> Llama4Processor:
-        return self.ctx.get_hf_processor(Llama4Processor,
-                                         use_fast=kwargs.pop("use_fast", True),
-                                         **kwargs)
+        return self.ctx.get_hf_processor(
+            Llama4Processor, use_fast=kwargs.pop("use_fast", True), **kwargs
+        )
 
     def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
         # Although vLLM can support more images from an infra capability
@@ -546,13 +552,13 @@ def get_patch_per_chunk(vision_config: Llama4VisionConfig) -> int:
         image_size = vision_config.image_size
         patch_size = vision_config.patch_size
 
-        assert (
-            image_size %
-            patch_size == 0), f"chunk size {image_size} should be multiple of "
+        assert image_size % patch_size == 0, (
+            f"chunk size {image_size} should be multiple of "
+        )
         f"patch_size {patch_size}"
 
         ds_ratio = int(round(1.0 / (vision_config.pixel_shuffle_ratio**2)))
-        return (image_size // patch_size)**2 // ds_ratio
+        return (image_size // patch_size) ** 2 // ds_ratio
 
     def get_max_num_tiles(self) -> int:
         image_processor = self.get_hf_processor().image_processor
@@ -562,13 +568,10 @@ def get_image_size_with_most_features(self) -> ImageSize:
         vision_config = self.get_hf_config().vision_config
         image_size = vision_config.image_size
         # Result in the max possible feature size (h:w = 16:1)
-        return ImageSize(height=self.get_max_num_tiles() * image_size,
-                         width=image_size)
+        return ImageSize(height=self.get_max_num_tiles() * image_size, width=image_size)
 
 
-class Mllama4MultiModalProcessor(BaseMultiModalProcessor[Mllama4ProcessingInfo]
-                                 ):
-
+class Mllama4MultiModalProcessor(BaseMultiModalProcessor[Mllama4ProcessingInfo]):
     def _call_hf_processor(
         self,
         prompt: str,
@@ -592,15 +595,16 @@ def _call_hf_processor(
         vision_config = self.info.get_hf_config().vision_config
 
         if processed_outputs.get("pixel_values") is not None:
-            assert (
-                "images" in mm_data
-            ), "images expected to be in mm_data when pixel_values is present"
+            assert "images" in mm_data, (
+                "images expected to be in mm_data when pixel_values is present"
+            )
 
             images = mm_data["images"]
-            parsed_images = (self._get_data_parser().parse_mm_data({
-                "image":
-                images
-            }).get_items("image", ImageProcessorItems))
+            parsed_images = (
+                self._get_data_parser()
+                .parse_mm_data({"image": images})
+                .get_items("image", ImageProcessorItems)
+            )
 
             tile_size = vision_config.image_size
             possible_resolutions = find_supported_resolutions(
@@ -612,20 +616,20 @@ def _call_hf_processor(
                     (image.size[1], image.size[0]),
                     torch.tensor(possible_resolutions),
                     resize_to_max_canvas=image_processor.resize_to_max_canvas,
-                ) for image in parsed_images
+                )
+                for image in parsed_images
             ]
             # TODO tile height/width do not necessarily need to match
-            aspect_ratios = [(image_size[0] // tile_size,
-                              image_size[1] // tile_size)
-                             for image_size in best_fit_sizes]
+            aspect_ratios = [
+                (image_size[0] // tile_size, image_size[1] // tile_size)
+                for image_size in best_fit_sizes
+            ]
             patches_per_image = [
-                1 if r_h * r_w == 1 else 1 + r_h * r_w
-                for (r_h, r_w) in aspect_ratios
+                1 if r_h * r_w == 1 else 1 + r_h * r_w for (r_h, r_w) in aspect_ratios
             ]
 
             processed_outputs["aspect_ratios"] = torch.tensor(aspect_ratios)
-            processed_outputs["patches_per_image"] = torch.tensor(
-                patches_per_image)
+            processed_outputs["patches_per_image"] = torch.tensor(patches_per_image)
 
         return processed_outputs
 
@@ -637,7 +641,8 @@ def _get_mm_fields_config(
         patches_per_image = hf_inputs.get("patches_per_image", torch.empty(0))
         return dict(
             pixel_values=MultiModalFieldConfig.flat_from_sizes(
-                "image", patches_per_image),
+                "image", patches_per_image
+            ),
             patches_per_image=MultiModalFieldConfig.batched("image"),
             aspect_ratios=MultiModalFieldConfig.batched("image"),
         )
@@ -677,7 +682,6 @@ def get_replacement(item_idx: int):
 
 
 class Mllama4DummyInputsBuilder(BaseDummyInputsBuilder[Mllama4ProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -694,17 +698,17 @@ def get_dummy_mm_data(
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
-        (target_width,
-         target_height) = self.info.get_image_size_with_most_features()
+        (target_width, target_height) = self.info.get_image_size_with_most_features()
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
@@ -713,8 +717,7 @@ def get_dummy_mm_data(
     info=Mllama4ProcessingInfo,
     dummy_inputs=Mllama4DummyInputsBuilder,
 )
-class Llama4ForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                     SupportsPP):
+class Llama4ForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP):
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
         "gate_up_proj": ["gate_proj", "up_proj"],
@@ -747,24 +750,26 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 use_data_parallel=self.use_data_parallel,
             )
             self.multi_modal_projector = Llama4MultiModalProjector(
-                self.config,
-                None,
-                prefix=maybe_prefix(prefix, "multi_modal_projector"))
+                self.config, None, prefix=maybe_prefix(prefix, "multi_modal_projector")
+            )
         else:
             self.vision_model = None
             self.multi_modal_projector = None
         self.language_model = initialize_model(
-            vllm_config=vllm_config.with_hf_config(config.text_config,
-                                                   ["LlamaForCausalLM"]),
+            vllm_config=vllm_config.with_hf_config(
+                config.text_config, ["LlamaForCausalLM"]
+            ),
             prefix=maybe_prefix(prefix, "language_model"),
             model_class=Llama4ForCausalLM,
         )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[Llama4ImagePatchInputs]:
+        self, **kwargs: object
+    ) -> Optional[Llama4ImagePatchInputs]:
         # num_images, 1, num_chunks, channel, image_size, image_size
         pixel_values = kwargs.pop("pixel_values", None)
         if pixel_values is None:
@@ -786,8 +791,8 @@ def _parse_and_validate_image_input(
         )
 
     def _process_image_input(
-            self, image_input: Llama4ImagePatchInputs) -> MultiModalEmbeddings:
-
+        self, image_input: Llama4ImagePatchInputs
+    ) -> MultiModalEmbeddings:
         assert self.vision_model and self.multi_modal_projector
         flat_data = image_input["flat_data"]
         patches_per_image = image_input["patches_per_image"].tolist()
@@ -795,12 +800,12 @@ def _process_image_input(
         # shard image input
         if self.use_data_parallel:
             vision_embeddings_flat = run_dp_sharded_vision_model(
-                flat_data, self.vision_model)
+                flat_data, self.vision_model
+            )
         else:
             vision_embeddings_flat = self.vision_model(flat_data)
 
-        vision_embeddings_flat = self.multi_modal_projector(
-            vision_embeddings_flat)
+        vision_embeddings_flat = self.multi_modal_projector(vision_embeddings_flat)
 
         return [
             img.flatten(0, 1)
@@ -828,8 +833,9 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        return self.language_model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        return self.language_model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
 
     def compute_logits(
         self,
@@ -841,8 +847,7 @@ def separate_weights(
         self,
         weights: Iterable[tuple[str, torch.Tensor]],
         prefix: str,
-    ) -> tuple[Iterable[tuple[str, torch.Tensor]], Iterable[tuple[
-            str, torch.Tensor]]]:
+    ) -> tuple[Iterable[tuple[str, torch.Tensor]], Iterable[tuple[str, torch.Tensor]]]:
         weights1, weights2 = tee(weights, 2)
 
         def get_prefix_weights() -> Iterable[tuple[str, torch.Tensor]]:
@@ -884,31 +889,33 @@ def _consolidate_qkv_weights(
     def _rename_weight_for_modelopt_checkpoint(self, name: str) -> str:
         """Rename weights from ModelOpt llama4 fp8 checkpoints to vLLM
         format."""
-        if name.startswith("model.") or name.startswith(
-                "language_model.model."):
-            renamed = name.replace("model.", "language_model.model.",
-                                   1) if name.startswith("model.") else name
+        if name.startswith("model.") or name.startswith("language_model.model."):
+            renamed = (
+                name.replace("model.", "language_model.model.", 1)
+                if name.startswith("model.")
+                else name
+            )
             # Handle expert scale parameters with flat naming
-            if "feed_forward.experts." in name and ("_input_scale" in name or
-                                                    "_weight_scale" in name):
+            if "feed_forward.experts." in name and (
+                "_input_scale" in name or "_weight_scale" in name
+            ):
                 # Map checkpoint naming to vLLM's expected naming
                 if "down_proj_input_scale" in renamed:
-                    return renamed.replace("down_proj_input_scale",
-                                           "w2_input_scale")
+                    return renamed.replace("down_proj_input_scale", "w2_input_scale")
                 elif "down_proj_weight_scale" in renamed:
-                    return renamed.replace("down_proj_weight_scale",
-                                           "w2_weight_scale")
+                    return renamed.replace("down_proj_weight_scale", "w2_weight_scale")
                 elif "gate_up_proj_input_scale" in renamed:
-                    return renamed.replace("gate_up_proj_input_scale",
-                                           "w13_input_scale")
+                    return renamed.replace(
+                        "gate_up_proj_input_scale", "w13_input_scale"
+                    )
                 elif "gate_up_proj_weight_scale" in renamed:
-                    return renamed.replace("gate_up_proj_weight_scale",
-                                           "w13_weight_scale")
+                    return renamed.replace(
+                        "gate_up_proj_weight_scale", "w13_weight_scale"
+                    )
                 return renamed
 
             # Handle attention scale parameters
-            elif "self_attn." in name and (".k_scale" in name
-                                           or ".v_scale" in name):
+            elif "self_attn." in name and (".k_scale" in name or ".v_scale" in name):
                 if ".k_proj.k_scale" in renamed:
                     return renamed.replace(".k_proj.k_scale", ".attn.k_scale")
                 elif ".v_proj.v_scale" in renamed:
@@ -919,8 +926,7 @@ def _rename_weight_for_modelopt_checkpoint(self, name: str) -> str:
             return renamed
 
         elif name.startswith("lm_head.weight"):
-            return name.replace("lm_head.weight",
-                                "language_model.lm_head.weight")
+            return name.replace("lm_head.weight", "language_model.lm_head.weight")
 
         return name
 
@@ -943,7 +949,7 @@ def _separate_and_rename_weights(
         return language_model_weights, other_weights
 
     def _handle_expert_scale_broadcasting(
-            self, weights: list[tuple[str, torch.Tensor]], params_dict: dict
+        self, weights: list[tuple[str, torch.Tensor]], params_dict: dict
     ) -> tuple[list[tuple[str, torch.Tensor]], set[str]]:
         """Handle expert scale parameters that need broadcasting.
 
@@ -956,12 +962,18 @@ def _handle_expert_scale_broadcasting(
 
         for name, weight in weights:
             # Check if this is an expert scale parameter that needs broadcasting
-            if ("feed_forward.experts." in name and "scale" in name
-                    and ".shared_expert" not in name):
+            if (
+                "feed_forward.experts." in name
+                and "scale" in name
+                and ".shared_expert" not in name
+            ):
                 if name in params_dict:
                     param = params_dict[name]
-                    if (hasattr(param, 'data') and param.data.numel() > 1
-                            and weight.numel() == 1):
+                    if (
+                        hasattr(param, "data")
+                        and param.data.numel() > 1
+                        and weight.numel() == 1
+                    ):
                         # Broadcast single value to all experts
                         param.data.fill_(weight.item())
                         updated_params.add(name)
@@ -973,10 +985,12 @@ def _handle_expert_scale_broadcasting(
 
         return regular_weights, expert_scale_weights, updated_params
 
-    def _load_other_weights(self, other_weights: Iterable[tuple[str,
-                                                                torch.Tensor]],
-                            params_dict: dict,
-                            stacked_params_mapping: list) -> set[str]:
+    def _load_other_weights(
+        self,
+        other_weights: Iterable[tuple[str, torch.Tensor]],
+        params_dict: dict,
+        stacked_params_mapping: list,
+    ) -> set[str]:
         """Load non-language-model weights with stacking support."""
         updated_params = set()
 
@@ -997,16 +1011,13 @@ def _load_other_weights(self, other_weights: Iterable[tuple[str,
             else:
                 # Use regular weight loading
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
                 updated_params.add(name)
 
         return updated_params
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".self_attn.qkv_proj", ".self_attn.q_proj", "q"),
@@ -1023,8 +1034,9 @@ def load_weights(self, weights: Iterable[tuple[str,
         updated_params: set[str] = set()
 
         # Separate and rename weights
-        language_model_weights, other_weights = (
-            self._separate_and_rename_weights(weights))
+        language_model_weights, other_weights = self._separate_and_rename_weights(
+            weights
+        )
 
         # Skip loading vision model and projector if they're not initialized.
         if self.vision_model is None and self.multi_modal_projector is None:
@@ -1032,8 +1044,8 @@ def load_weights(self, weights: Iterable[tuple[str,
 
         # Handle expert scale parameters
         regular_weights, expert_scale_weights, updated_params_from_experts = (
-            self._handle_expert_scale_broadcasting(language_model_weights,
-                                                   params_dict))
+            self._handle_expert_scale_broadcasting(language_model_weights, params_dict)
+        )
         updated_params.update(updated_params_from_experts)
 
         loader = AutoWeightsLoader(self)
@@ -1042,13 +1054,12 @@ def load_weights(self, weights: Iterable[tuple[str,
         updated_params.update(loaded_language_model_params)
 
         if expert_scale_weights:
-            loaded_expert_scale_params = loader.load_weights(
-                expert_scale_weights)
+            loaded_expert_scale_params = loader.load_weights(expert_scale_weights)
             if loaded_expert_scale_params:
                 updated_params.update(loaded_expert_scale_params)
 
         updated_params.update(
-            self._load_other_weights(other_weights, params_dict,
-                                     stacked_params_mapping))
+            self._load_other_weights(other_weights, params_dict, stacked_params_mapping)
+        )
 
         return updated_params
diff --git a/vllm/model_executor/models/mlp_speculator.py b/vllm/model_executor/models/mlp_speculator.py
index 0f375134ef00..4901ac74fb28 100644
--- a/vllm/model_executor/models/mlp_speculator.py
+++ b/vllm/model_executor/models/mlp_speculator.py
@@ -10,7 +10,9 @@
 from vllm.config import VllmConfig
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 
 from .utils import maybe_prefix
@@ -74,8 +76,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         self.n_predict = config.n_predict
         self.vocab_size = config.vocab_size
         self.emb_dim = config.emb_dim
-        self.inner_dim = config.inner_dim if config.inner_dim != 0 \
-            else config.emb_dim
+        self.inner_dim = config.inner_dim if config.inner_dim != 0 else config.emb_dim
 
         self.max_speculative_tokens = config.num_lookahead_tokens
 
@@ -83,72 +84,93 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         self.scale_input = config.scale_input
 
         if self.tie_weights:
-            assert (
-                self.n_predict > 1
-            ), "You cannot tie weights between stages when only 1 exists"
+            assert self.n_predict > 1, (
+                "You cannot tie weights between stages when only 1 exists"
+            )
             embedding = VocabParallelEmbedding(
-                config.vocab_size,
-                self.inner_dim,
-                org_num_embeddings=config.vocab_size)
+                config.vocab_size, self.inner_dim, org_num_embeddings=config.vocab_size
+            )
             self.emb = nn.ModuleList([embedding] * self.max_speculative_tokens)
 
             # the initial projection from the base model may
             # have a different size, so that stays separate.
             proj_first = nn.Linear(self.emb_dim, self.inner_dim, bias=False)
             proj_tied = nn.Linear(self.inner_dim, self.inner_dim, bias=False)
-            self.proj = nn.ModuleList([proj_first] + [proj_tied] *
-                                      (self.max_speculative_tokens - 1))
-
-            self.head = nn.ModuleList([
-                ParallelLMHead(self.vocab_size,
-                               self.inner_dim,
-                               bias=False,
-                               prefix=maybe_prefix(prefix, f"head.{i}"))
-                for i in range(self.max_speculative_tokens)
-            ])
-
-            ln = MLPSpeculatorLayerNorm(self.inner_dim,
-                                        elementwise_scale_and_shift=True)
+            self.proj = nn.ModuleList(
+                [proj_first] + [proj_tied] * (self.max_speculative_tokens - 1)
+            )
+
+            self.head = nn.ModuleList(
+                [
+                    ParallelLMHead(
+                        self.vocab_size,
+                        self.inner_dim,
+                        bias=False,
+                        prefix=maybe_prefix(prefix, f"head.{i}"),
+                    )
+                    for i in range(self.max_speculative_tokens)
+                ]
+            )
+
+            ln = MLPSpeculatorLayerNorm(
+                self.inner_dim, elementwise_scale_and_shift=True
+            )
             self.ln = nn.ModuleList([ln] * self.max_speculative_tokens)
 
         else:
-            self.emb = nn.ModuleList([
-                VocabParallelEmbedding(config.vocab_size,
-                                       self.inner_dim,
-                                       org_num_embeddings=config.vocab_size)
-                for _ in range(self.max_speculative_tokens)
-            ])
-
-            self.proj = nn.ModuleList([
-                nn.Linear((self.emb_dim if i == 0 else self.inner_dim),
-                          self.inner_dim,
-                          bias=False)
-                for i in range(self.max_speculative_tokens)
-            ])
-
-            self.head = nn.ModuleList([
-                ParallelLMHead(self.vocab_size,
-                               self.inner_dim,
-                               bias=False,
-                               prefix=maybe_prefix(prefix, f"head.{i}"))
-                for i in range(self.max_speculative_tokens)
-            ])
-            self.ln = nn.ModuleList([
-                MLPSpeculatorLayerNorm(self.inner_dim,
-                                       elementwise_scale_and_shift=True)
-                for _ in range(self.max_speculative_tokens)
-            ])
+            self.emb = nn.ModuleList(
+                [
+                    VocabParallelEmbedding(
+                        config.vocab_size,
+                        self.inner_dim,
+                        org_num_embeddings=config.vocab_size,
+                    )
+                    for _ in range(self.max_speculative_tokens)
+                ]
+            )
+
+            self.proj = nn.ModuleList(
+                [
+                    nn.Linear(
+                        (self.emb_dim if i == 0 else self.inner_dim),
+                        self.inner_dim,
+                        bias=False,
+                    )
+                    for i in range(self.max_speculative_tokens)
+                ]
+            )
+
+            self.head = nn.ModuleList(
+                [
+                    ParallelLMHead(
+                        self.vocab_size,
+                        self.inner_dim,
+                        bias=False,
+                        prefix=maybe_prefix(prefix, f"head.{i}"),
+                    )
+                    for i in range(self.max_speculative_tokens)
+                ]
+            )
+            self.ln = nn.ModuleList(
+                [
+                    MLPSpeculatorLayerNorm(
+                        self.inner_dim, elementwise_scale_and_shift=True
+                    )
+                    for _ in range(self.max_speculative_tokens)
+                ]
+            )
         if self.scale_input:
             self.ln0 = MLPSpeculatorLayerNorm(
-                self.emb_dim, elementwise_scale_and_shift=False)
+                self.emb_dim, elementwise_scale_and_shift=False
+            )
 
-        self.state_weight = 0.5**(0.5 / config.n_predict)
-        self.emb_weight = math.sqrt(
-            (1 - self.state_weight**2) * (self.inner_dim / 2))
+        self.state_weight = 0.5 ** (0.5 / config.n_predict)
+        self.emb_weight = math.sqrt((1 - self.state_weight**2) * (self.inner_dim / 2))
         self.activation = nn.GELU()
         self.config = config
-        self.logits_processor = LogitsProcessor(config.vocab_size,
-                                                config.vocab_size, 1.0)
+        self.logits_processor = LogitsProcessor(
+            config.vocab_size, config.vocab_size, 1.0
+        )
 
     # NOTE(woosuk): This method is commented out because it is old code
     # using V0. We should either port it to V1 or remove it.
@@ -201,16 +223,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
 
     #     return next_tokens
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
             name = name.replace("speculator.", "")
             param = params_dict.get(name)
             if param is not None:
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
                 loaded_params.add(name)
         return loaded_params
diff --git a/vllm/model_executor/models/modernbert.py b/vllm/model_executor/models/modernbert.py
index e4a51b369737..2e3b76aaaabc 100644
--- a/vllm/model_executor/models/modernbert.py
+++ b/vllm/model_executor/models/modernbert.py
@@ -11,16 +11,17 @@
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import VllmConfig
 from vllm.distributed import get_tensor_model_parallel_world_size
-from vllm.model_executor.layers.linear import (QKVParallelLinear,
-                                               RowParallelLinear)
-from vllm.model_executor.layers.pooler import (ClassifierPooler,
-                                               DispatchPooler, Pooler,
-                                               PoolingMethod,
-                                               PoolingParamsUpdate,
-                                               PoolingType)
+from vllm.model_executor.layers.linear import QKVParallelLinear, RowParallelLinear
+from vllm.model_executor.layers.pooler import (
+    ClassifierPooler,
+    DispatchPooler,
+    Pooler,
+    PoolingMethod,
+    PoolingParamsUpdate,
+    PoolingType,
+)
 from vllm.model_executor.layers.rotary_embedding import RotaryEmbedding
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 from vllm.tasks import PoolingTask
@@ -32,16 +33,15 @@
 
 
 class ModernBertEmbeddings(nn.Module):
-
     def __init__(self, config: ModernBertConfig):
-
         super().__init__()
         self.config = config
-        self.tok_embeddings = VocabParallelEmbedding(config.vocab_size,
-                                                     config.hidden_size)
-        self.norm = nn.LayerNorm(config.hidden_size,
-                                 eps=config.layer_norm_eps,
-                                 bias=config.norm_bias)
+        self.tok_embeddings = VocabParallelEmbedding(
+            config.vocab_size, config.hidden_size
+        )
+        self.norm = nn.LayerNorm(
+            config.hidden_size, eps=config.layer_norm_eps, bias=config.norm_bias
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.tok_embeddings(input_ids)
@@ -60,24 +60,20 @@ def forward(
 
 
 class ModernBertRotaryEmbedding(RotaryEmbedding):
-
-    def __init__(self, config: ModernBertConfig, head_size: int, dim: int,
-                 base: float):
+    def __init__(self, config: ModernBertConfig, head_size: int, dim: int, base: float):
         super().__init__(
             head_size=head_size,
             rotary_dim=dim,
             max_position_embeddings=config.max_position_embeddings,
             base=base,
             is_neox_style=True,
-            dtype=torch.float16)
+            dtype=torch.float16,
+        )
         self.config = config
 
 
 class ModernBertAttention(nn.Module):
-
-    def __init__(self,
-                 config: ModernBertConfig,
-                 layer_id: Optional[int] = None):
+    def __init__(self, config: ModernBertConfig, layer_id: Optional[int] = None):
         super().__init__()
         self.config = config
         self.hidden_size = config.hidden_size
@@ -99,24 +95,27 @@ def __init__(self,
         sliding_window = None
         if layer_id % config.global_attn_every_n_layers != 0:
             sliding_window = config.local_attention // 2
-            rope_theta = config.local_rope_theta if config.local_rope_theta \
-                    is not None else config.global_rope_theta
+            rope_theta = (
+                config.local_rope_theta
+                if config.local_rope_theta is not None
+                else config.global_rope_theta
+            )
         else:
             rope_theta = config.global_rope_theta
 
-        self.rotary_emb = ModernBertRotaryEmbedding(config=config,
-                                                    head_size=self.head_dim,
-                                                    dim=self.head_dim,
-                                                    base=rope_theta)
+        self.rotary_emb = ModernBertRotaryEmbedding(
+            config=config, head_size=self.head_dim, dim=self.head_dim, base=rope_theta
+        )
         self.attn = EncoderOnlyAttention(
             self.num_heads,
             self.head_dim,
             self.scaling,
             prefix=f"{layer_id}.attn",
-            per_layer_sliding_window=sliding_window)
-        self.Wo = RowParallelLinear(config.hidden_size,
-                                    config.hidden_size,
-                                    bias=config.attention_bias)
+            per_layer_sliding_window=sliding_window,
+        )
+        self.Wo = RowParallelLinear(
+            config.hidden_size, config.hidden_size, bias=config.attention_bias
+        )
 
     def forward(
         self,
@@ -133,17 +132,16 @@ def forward(
 
 
 class ModernBertMLP(nn.Module):
-
     def __init__(self, config: ModernBertConfig):
         super().__init__()
         self.config = config
-        self.Wi = nn.Linear(config.hidden_size,
-                            int(config.intermediate_size) * 2,
-                            bias=config.mlp_bias)
+        self.Wi = nn.Linear(
+            config.hidden_size, int(config.intermediate_size) * 2, bias=config.mlp_bias
+        )
         self.act = nn.GELU()
-        self.Wo = RowParallelLinear(config.intermediate_size,
-                                    config.hidden_size,
-                                    bias=config.mlp_bias)
+        self.Wo = RowParallelLinear(
+            config.intermediate_size, config.hidden_size, bias=config.mlp_bias
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         input, gate = self.Wi(hidden_states).chunk(2, dim=-1)
@@ -151,23 +149,21 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class ModernBertLayer(nn.Module):
-
-    def __init__(self,
-                 config: ModernBertConfig,
-                 prefix: str = "",
-                 layer_id: Optional[int] = None):
+    def __init__(
+        self, config: ModernBertConfig, prefix: str = "", layer_id: Optional[int] = None
+    ):
         super().__init__()
         self.config = config
         if layer_id == 0:
             self.attn_norm = nn.Identity()
         else:
-            self.attn_norm = nn.LayerNorm(config.hidden_size,
-                                          eps=config.norm_eps,
-                                          bias=config.norm_bias)
+            self.attn_norm = nn.LayerNorm(
+                config.hidden_size, eps=config.norm_eps, bias=config.norm_bias
+            )
         self.attn = ModernBertAttention(config=config, layer_id=layer_id)
-        self.mlp_norm = nn.LayerNorm(config.hidden_size,
-                                     eps=config.norm_eps,
-                                     bias=config.norm_bias)
+        self.mlp_norm = nn.LayerNorm(
+            config.hidden_size, eps=config.norm_eps, bias=config.norm_bias
+        )
         self.mlp = ModernBertMLP(config)
 
     def forward(
@@ -175,8 +171,9 @@ def forward(
         hidden_states: torch.Tensor,
         position_ids: torch.Tensor,
     ) -> torch.Tensor:
-        attn_outputs = self.attn(hidden_states=self.attn_norm(hidden_states),
-                                 position_ids=position_ids)
+        attn_outputs = self.attn(
+            hidden_states=self.attn_norm(hidden_states), position_ids=position_ids
+        )
         hidden_states = hidden_states + attn_outputs
         mlp_output = self.mlp(self.mlp_norm(hidden_states))
         hidden_states = hidden_states + mlp_output
@@ -184,14 +181,15 @@ def forward(
 
 
 class ModernBertEncoderLayer(nn.Module):
-
     def __init__(self, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
-        self.layers = nn.ModuleList([
-            ModernBertLayer(config=config, layer_id=layer_id)
-            for layer_id in range(config.num_hidden_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                ModernBertLayer(config=config, layer_id=layer_id)
+                for layer_id in range(config.num_hidden_layers)
+            ]
+        )
 
     def forward(
         self,
@@ -207,7 +205,8 @@ def forward(
 @default_pooling_type("CLS")
 class ModernBertModel(nn.Module):
     hf_to_vllm_mapper = WeightsMapper(
-        orig_to_new_prefix={"layers.": "encoder_layer.layers."})
+        orig_to_new_prefix={"layers.": "encoder_layer.layers."}
+    )
 
     def __init__(
         self,
@@ -219,15 +218,14 @@ def __init__(
         self.config = config
         self.embeddings = ModernBertEmbeddings(config)
         self.encoder_layer = ModernBertEncoderLayer(vllm_config)
-        self.final_norm = nn.LayerNorm(config.hidden_size,
-                                       eps=config.norm_eps,
-                                       bias=config.norm_bias)
+        self.final_norm = nn.LayerNorm(
+            config.hidden_size, eps=config.norm_eps, bias=config.norm_bias
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embeddings.get_input_embeddings(input_ids)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         weights = self.hf_to_vllm_mapper.apply(weights)
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
@@ -235,8 +233,7 @@ def load_weights(self, weights: Iterable[tuple[str,
             if name.endswith(".bias") and name not in params_dict:
                 continue
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -251,8 +248,9 @@ def forward(
         if inputs_embeds is not None:
             hidden_states = inputs_embeds
         else:
-            hidden_states = self.embeddings(input_ids=input_ids,
-                                            inputs_embeds=inputs_embeds)
+            hidden_states = self.embeddings(
+                input_ids=input_ids, inputs_embeds=inputs_embeds
+            )
 
         outputs = self.encoder_layer(
             hidden_states=hidden_states,
@@ -263,18 +261,18 @@ def forward(
 
 
 class ModernBertPooler(Pooler):
-
     def __init__(self, config: ModernBertConfig):
         super().__init__()
 
         pooling_type = PoolingType[config.classifier_pooling.upper()]
         self.pooling = PoolingMethod.from_pooling_type(pooling_type)
-        self.dense = nn.Linear(config.hidden_size, config.hidden_size,
-                               config.classifier_bias)
+        self.dense = nn.Linear(
+            config.hidden_size, config.hidden_size, config.classifier_bias
+        )
         self.act = nn.GELU()
-        self.norm = nn.LayerNorm(config.hidden_size,
-                                 eps=config.norm_eps,
-                                 bias=config.norm_bias)
+        self.norm = nn.LayerNorm(
+            config.hidden_size, eps=config.norm_eps, bias=config.norm_bias
+        )
 
     def get_supported_tasks(self) -> Set[PoolingTask]:
         return self.pooling.get_supported_tasks()
@@ -303,53 +301,55 @@ def forward(
 
 @default_pooling_type("CLS")
 class ModernBertForSequenceClassification(nn.Module, SupportsCrossEncoding):
-
     is_pooling_model = True
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         self.config = config
-        self.model = ModernBertModel(vllm_config=vllm_config,
-                                     prefix=maybe_prefix(prefix, "modernbert"))
-        self.classifier = nn.Linear(config.hidden_size,
-                                    config.num_labels,
-                                    dtype=vllm_config.model_config.head_dtype)
+        self.model = ModernBertModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "modernbert")
+        )
+        self.classifier = nn.Linear(
+            config.hidden_size,
+            config.num_labels,
+            dtype=vllm_config.model_config.head_dtype,
+        )
         self.pooling = ModernBertPooler(config)
 
         pooler_config = vllm_config.model_config.pooler_config
         assert pooler_config is not None
 
-        self.pooler = DispatchPooler({
-            "encode":
-            Pooler.for_encode(pooler_config),
-            "classify":
-            ClassifierPooler(
-                pooling=self.pooling,
-                classifier=self.classifier,
-                act_fn=ClassifierPooler.act_fn_for_seq_cls(
-                    vllm_config.model_config),
-            ),
-            "score":
-            ClassifierPooler(
-                pooling=self.pooling,
-                classifier=self.classifier,
-                act_fn=ClassifierPooler.act_fn_for_cross_encoder(
-                    vllm_config.model_config),
-            ),
-        })
+        self.pooler = DispatchPooler(
+            {
+                "encode": Pooler.for_encode(pooler_config),
+                "classify": ClassifierPooler(
+                    pooling=self.pooling,
+                    classifier=self.classifier,
+                    act_fn=ClassifierPooler.act_fn_for_seq_cls(
+                        vllm_config.model_config
+                    ),
+                ),
+                "score": ClassifierPooler(
+                    pooling=self.pooling,
+                    classifier=self.classifier,
+                    act_fn=ClassifierPooler.act_fn_for_cross_encoder(
+                        vllm_config.model_config
+                    ),
+                ),
+            }
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
-
         self_weights = []
 
         def weight_filter():
             for name, weight in weights:
                 if name.startswith("model."):
-                    yield name[len("model."):], weight
+                    yield name[len("model.") :], weight
                 else:
                     self_weights.append((name, weight))
 
@@ -360,13 +360,11 @@ def weight_filter():
         for name, loaded_weight in self_weights:
             if name.startswith("classifier"):
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             if name.startswith("head"):
-                param = params_dict["pooling." + name[len("head") + 1:]]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                param = params_dict["pooling." + name[len("head") + 1 :]]
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
 
     def forward(
diff --git a/vllm/model_executor/models/module_mapping.py b/vllm/model_executor/models/module_mapping.py
index 11a2a384c165..666796d835a3 100644
--- a/vllm/model_executor/models/module_mapping.py
+++ b/vllm/model_executor/models/module_mapping.py
@@ -54,19 +54,22 @@ class MultiModelKeys(ModelKeys):
     generator: list[str] = field(default_factory=list)
 
     @staticmethod
-    def from_string_field(language_model: Union[str, list[str]] = None,
-                          connector: Union[str, list[str]] = None,
-                          tower_model: Union[str, list[str]] = None,
-                          generator: Union[str, list[str]] = None,
-                          **kwargs) -> 'MultiModelKeys':
-
+    def from_string_field(
+        language_model: Union[str, list[str]] = None,
+        connector: Union[str, list[str]] = None,
+        tower_model: Union[str, list[str]] = None,
+        generator: Union[str, list[str]] = None,
+        **kwargs,
+    ) -> "MultiModelKeys":
         def to_list(value):
             if value is None:
                 return []
             return [value] if isinstance(value, str) else list(value)
 
-        return MultiModelKeys(language_model=to_list(language_model),
-                              connector=to_list(connector),
-                              tower_model=to_list(tower_model),
-                              generator=to_list(generator),
-                              **kwargs)
+        return MultiModelKeys(
+            language_model=to_list(language_model),
+            connector=to_list(connector),
+            tower_model=to_list(tower_model),
+            generator=to_list(generator),
+            **kwargs,
+        )
diff --git a/vllm/model_executor/models/molmo.py b/vllm/model_executor/models/molmo.py
index a77a2eb0f5a8..734841d0dc98 100644
--- a/vllm/model_executor/models/molmo.py
+++ b/vllm/model_executor/models/molmo.py
@@ -13,8 +13,7 @@
 import torch.nn as nn
 import torch.nn.functional as F
 from einops import rearrange
-from transformers import (BatchFeature, PretrainedConfig, ProcessorMixin,
-                          TensorType)
+from transformers import BatchFeature, PretrainedConfig, ProcessorMixin, TensorType
 from transformers.image_utils import ImageInput
 from transformers.tokenization_utils_base import TextInput
 
@@ -23,43 +22,65 @@
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
-from vllm.distributed import (get_pp_group, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              split_tensor_along_last_dim,
-                              tensor_model_parallel_all_gather)
-from vllm.model_executor.layers.activation import (MulAndSilu, QuickGELU,
-                                                   SiluAndMul)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    split_tensor_along_last_dim,
+    tensor_model_parallel_all_gather,
+)
+from vllm.model_executor.layers.activation import MulAndSilu, QuickGELU, SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
-from vllm.multimodal.parse import (ImageProcessorItems, ImageSize,
-                                   MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptIndexTargets,
-                                        PromptInsertion, PromptUpdate,
-                                        PromptUpdateDetails)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
+from vllm.multimodal.parse import ImageProcessorItems, ImageSize, MultiModalDataItems
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptIndexTargets,
+    PromptInsertion,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP, SupportsQuant)
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+    SupportsQuant,
+)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    flatten_bn,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 # TODO: hard-coded for now. Consider making it configurable.
 VIT_LAYERS = [-2, -9]
@@ -81,16 +102,22 @@ class MolmoImageInputs(TensorSchema):
         - tp: Token sequence positions
         - pd: Patch dimension
     """
-    images: Annotated[Union[torch.Tensor, list[torch.Tensor]],
-                      TensorShape("bn", "nc", "np", "pd", dynamic_dims={"nc"})]
+
+    images: Annotated[
+        Union[torch.Tensor, list[torch.Tensor]],
+        TensorShape("bn", "nc", "np", "pd", dynamic_dims={"nc"}),
+    ]
     # Number of crops may vary per batch and image, so pass it as a list.
 
-    image_masks: Annotated[Optional[Union[torch.Tensor, list[torch.Tensor]]],
-                           TensorShape("bn", "nc", "np", dynamic_dims={"nc"})]
+    image_masks: Annotated[
+        Optional[Union[torch.Tensor, list[torch.Tensor]]],
+        TensorShape("bn", "nc", "np", dynamic_dims={"nc"}),
+    ]
 
     feat_is_patch: Annotated[
         Union[torch.Tensor, list[torch.Tensor]],
-        TensorShape("bn", "nc", "tp", dynamic_dims={"nc"})]
+        TensorShape("bn", "nc", "tp", dynamic_dims={"nc"}),
+    ]
     # A boolean mask indicating which image features correspond to patch tokens.
     num_crops: Annotated[torch.Tensor, TensorShape("bn")]
 
@@ -110,8 +137,7 @@ class VisionBackboneConfig:
     image_norm_eps: float = 1e-5
 
     def __post_init__(self):
-        self.image_default_input_size = tuple(
-            self.image_default_input_size)  # type: ignore[assignment]
+        self.image_default_input_size = tuple(self.image_default_input_size)  # type: ignore[assignment]
 
     @property
     def image_num_patch(self):
@@ -207,15 +233,13 @@ def __init__(
         )
 
         self.scale = self.head_dim**-0.5
-        self.attn = MultiHeadAttention(self.num_heads,
-                                       self.head_dim,
-                                       self.scale,
-                                       num_kv_heads=self.num_kv_heads)
-
-    def forward(self,
-                inputs_q: torch.Tensor,
-                inputs_kv: Optional[torch.Tensor] = None) -> torch.Tensor:
+        self.attn = MultiHeadAttention(
+            self.num_heads, self.head_dim, self.scale, num_kv_heads=self.num_kv_heads
+        )
 
+    def forward(
+        self, inputs_q: torch.Tensor, inputs_kv: Optional[torch.Tensor] = None
+    ) -> torch.Tensor:
         if inputs_kv is not None:
             inputs_k = inputs_kv
             inputs_v = inputs_kv
@@ -242,8 +266,7 @@ def __init__(
         quant_config: Optional[QuantizationConfig] = None,
     ):
         super().__init__()
-        self.attention = MultiHeadDotProductAttention(
-            config, quant_config=quant_config)
+        self.attention = MultiHeadDotProductAttention(config, quant_config=quant_config)
         self.feed_forward = ViTMLP(config, quant_config)
         self.attention_norm = nn.LayerNorm(
             config.image_emb_dim,
@@ -269,10 +292,12 @@ def __init__(
         quant_config: Optional[QuantizationConfig] = None,
     ):
         super().__init__()
-        self.resblocks = nn.ModuleList([
-            ResidualAttentionBlock(config, quant_config)
-            for _ in range(config.image_num_layers)
-        ])
+        self.resblocks = nn.ModuleList(
+            [
+                ResidualAttentionBlock(config, quant_config)
+                for _ in range(config.image_num_layers)
+            ]
+        )
 
     def forward(self, x: torch.Tensor) -> list[torch.Tensor]:
         hidden_states = []
@@ -297,19 +322,18 @@ def __init__(
         super().__init__()
         scale = config.image_emb_dim**-0.5
         self.patch_num = config.image_num_patch
-        self.class_embedding = nn.Parameter(
-            torch.randn(config.image_emb_dim) * scale)
+        self.class_embedding = nn.Parameter(torch.randn(config.image_emb_dim) * scale)
         self.num_prefix_tokens: int = NUM_PREFIX_TOKENS
         self.positional_embedding = nn.Parameter(
-            torch.randn(config.image_num_pos, config.image_emb_dim) * scale)
+            torch.randn(config.image_num_pos, config.image_emb_dim) * scale
+        )
         image_patch_size = config.image_patch_size
         self.patch_embedding = nn.Linear(
             image_patch_size * image_patch_size * 3,
             config.image_emb_dim,
             bias=False,
         )
-        self.pre_ln = nn.LayerNorm(config.image_emb_dim,
-                                   eps=config.image_norm_eps)
+        self.pre_ln = nn.LayerNorm(config.image_emb_dim, eps=config.image_norm_eps)
         self.transformer = BlockCollection(config, quant_config)
 
     def add_pos_emb(self, x: torch.Tensor, patch_num: int) -> torch.Tensor:
@@ -317,8 +341,12 @@ def add_pos_emb(self, x: torch.Tensor, patch_num: int) -> torch.Tensor:
         pos_emb = self.positional_embedding[1:]
 
         pos_emb = pos_emb.reshape(
-            (int(math.sqrt(pos_emb.shape[0])),
-             int(math.sqrt(pos_emb.shape[0])), pos_emb.shape[1]))
+            (
+                int(math.sqrt(pos_emb.shape[0])),
+                int(math.sqrt(pos_emb.shape[0])),
+                pos_emb.shape[1],
+            )
+        )
 
         (patch_num_0, patch_num_1) = patch_num
 
@@ -335,13 +363,12 @@ def add_pos_emb(self, x: torch.Tensor, patch_num: int) -> torch.Tensor:
             pos_emb = pos_emb.permute(0, 2, 3, 1).squeeze(0)
 
         pos_emb = pos_emb.reshape(-1, pos_emb.shape[-1])
-        x = x + torch.cat([cls_emb[None, :, :], pos_emb[None, :, :]],
-                          dim=1).to(x.dtype)
+        x = x + torch.cat([cls_emb[None, :, :], pos_emb[None, :, :]], dim=1).to(x.dtype)
         return x
 
-    def forward(self,
-                x: torch.Tensor,
-                patch_num: Optional[int] = None) -> list[torch.Tensor]:
+    def forward(
+        self, x: torch.Tensor, patch_num: Optional[int] = None
+    ) -> list[torch.Tensor]:
         """
         : param x: (batch_size, num_patch, n_pixels)
         """
@@ -353,8 +380,8 @@ def forward(self,
 
         # class embeddings and positional embeddings
         x = torch.cat(
-            [_expand_token(self.class_embedding, x.shape[0]).to(x.dtype), x],
-            dim=1)
+            [_expand_token(self.class_embedding, x.shape[0]).to(x.dtype), x], dim=1
+        )
         x = self.add_pos_emb(x, patch_num)
 
         x = self.pre_ln(x)
@@ -382,8 +409,7 @@ def __init__(
         assert self.total_num_heads % self.tp_size == 0
 
         self.num_heads = self.total_num_heads // self.tp_size
-        self.total_num_kv_heads = config.num_key_value_heads \
-            or self.total_num_heads
+        self.total_num_kv_heads = config.num_key_value_heads or self.total_num_heads
         if self.total_num_kv_heads >= self.tp_size:
             assert self.total_num_kv_heads % self.tp_size == 0
         else:
@@ -411,10 +437,10 @@ def __init__(
         self.q_norm: Optional[nn.Module] = None
         if config.attention_layer_norm:
             self.tp_rank = get_tensor_model_parallel_rank()
-            self.k_norm = RMSNorm(self.total_num_kv_heads * self.head_dim,
-                                  eps=config.layer_norm_eps)
-            self.q_norm = RMSNorm(config.hidden_size,
-                                  eps=config.layer_norm_eps)
+            self.k_norm = RMSNorm(
+                self.total_num_kv_heads * self.head_dim, eps=config.layer_norm_eps
+            )
+            self.q_norm = RMSNorm(config.hidden_size, eps=config.layer_norm_eps)
 
         # Rotary embeddings.
         self.rotary_emb = get_rope(
@@ -424,13 +450,15 @@ def __init__(
             base=self.rope_theta,
         )
         self.scaling = self.head_dim**-0.5
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
         # Attention output projection.
         self.o_proj = RowParallelLinear(
@@ -440,16 +468,16 @@ def __init__(
             quant_config=quant_config,
         )
 
-    def _apply_qk_norm(self, q: torch.Tensor,
-                       k: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+    def _apply_qk_norm(
+        self, q: torch.Tensor, k: torch.Tensor
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         if self.tp_size > 1:
             q = tensor_model_parallel_all_gather(q.contiguous())
             k = tensor_model_parallel_all_gather(k.contiguous())
         q = self.q_norm(q)
         k = self.k_norm(k)
         if self.tp_size > 1:
-            splitter = partial(split_tensor_along_last_dim,
-                               num_partitions=self.tp_size)
+            splitter = partial(split_tensor_along_last_dim, num_partitions=self.tp_size)
             q = splitter(q)[self.tp_rank]
             k = splitter(k)[self.tp_rank]
         return q, k
@@ -472,10 +500,12 @@ def forward(
 class LanguageModelMLP(nn.Module):
     """Molmo's LLM mlp."""
 
-    def __init__(self,
-                 config: PretrainedConfig,
-                 input_dim: Optional[int] = None,
-                 quant_config: Optional[QuantizationConfig] = None) -> None:
+    def __init__(
+        self,
+        config: PretrainedConfig,
+        input_dim: Optional[int] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+    ) -> None:
         super().__init__()
         self.hidden_size = config.hidden_size
         self.intermediate_size = config.intermediate_size // 2
@@ -547,7 +577,6 @@ def forward(
 
 
 class MolmoDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -557,20 +586,19 @@ def __init__(
     ) -> None:
         super().__init__()
         # Attention block.
-        self.self_attn = MolmoAttention(config,
-                                        cache_config,
-                                        quant_config,
-                                        prefix=f"{prefix}.self_attn")
+        self.self_attn = MolmoAttention(
+            config, cache_config, quant_config, prefix=f"{prefix}.self_attn"
+        )
 
         # MLP block.
         self.mlp = LanguageModelMLP(config, quant_config=quant_config)
 
         # LayerNorm
         assert config.layer_norm_type == "rms"
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.layer_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.layer_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.layer_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.layer_norm_eps
+        )
 
     def forward(
         self,
@@ -583,21 +611,18 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
         )
 
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
 
 class MolmoDecoderNormAfterLayer(MolmoDecoderLayer):
-
     def forward(
         self,
         positions: torch.Tensor,
@@ -638,16 +663,14 @@ def __init__(
             (self.image_num_patch[0] + 1) // POOLING_SIZE,
             (self.image_num_patch[1] + 1) // POOLING_SIZE,
         )
-        self.image_vit = VisionTransformer(vision_config,
-                                           quant_config=quant_config)
+        self.image_vit = VisionTransformer(vision_config, quant_config=quant_config)
         self.num_prefix_tokens = self.image_vit.num_prefix_tokens
-        assert self.num_prefix_tokens in {
-            0, 1
-        }, "Only 0 or 1 prefix tokens are supported"
+        assert self.num_prefix_tokens in {0, 1}, (
+            "Only 0 or 1 prefix tokens are supported"
+        )
         self.image_pooling_2d = MultiHeadDotProductAttention(
-            vision_config,
-            nlayers=len(self.vit_layers),
-            quant_config=quant_config)
+            vision_config, nlayers=len(self.vit_layers), quant_config=quant_config
+        )
         self.image_projector = ImageProjectorMLP(
             config,
             input_dim=vision_config.image_emb_dim,
@@ -671,8 +694,7 @@ def encode_image(self, images: torch.Tensor) -> torch.Tensor:
         """
         B, T, N, D = images.shape
 
-        mask = ~torch.all(
-            images.view(B * T, N, D) == -1, dim=(1, 2), keepdim=True)
+        mask = ~torch.all(images.view(B * T, N, D) == -1, dim=(1, 2), keepdim=True)
 
         images = images.view(B * T, N, D)
         image_features = self.image_vit(images)
@@ -707,21 +729,22 @@ def forward(
         assert image_masks is not None
         pad_embed = self.pad_embed[:, None, None, None, :]
         all_pad = image_masks == 0
-        partial_pad = torch.logical_and(
-            image_masks < 1,
-            torch.logical_not(all_pad)).to(dtype=torch.float32)
+        partial_pad = torch.logical_and(image_masks < 1, torch.logical_not(all_pad)).to(
+            dtype=torch.float32
+        )
         all_pad = all_pad.to(dtype=torch.float32)
-        image_features = image_features + pad_embed[0] * torch.unsqueeze(
-            all_pad, -1)
+        image_features = image_features + pad_embed[0] * torch.unsqueeze(all_pad, -1)
         image_features = image_features + pad_embed[1] * torch.unsqueeze(
-            partial_pad, -1)
+            partial_pad, -1
+        )
 
         image_features = image_features.to(og_dtype)
 
         image_features = image_features.reshape(
-            (batch_size, num_image) + self.image_num_patch + (-1, ), )
+            (batch_size, num_image) + self.image_num_patch + (-1,),
+        )
 
-        if (missing_w := self.image_num_patch[0] % POOLING_SIZE):
+        if missing_w := self.image_num_patch[0] % POOLING_SIZE:
             # Padding for image pooling (see below)
             image_features = F.pad(
                 image_features,
@@ -731,7 +754,7 @@ def forward(
         # image pooling
         image_features = rearrange(
             image_features,
-            'b n (h dh) (w dw) c -> (b n h w) (dh dw) c',
+            "b n (h dh) (w dw) c -> (b n h w) (dh dw) c",
             dh=POOLING_SIZE,
             dw=POOLING_SIZE,
         )
@@ -747,8 +770,7 @@ def forward(
         # image_features: (batch_size, num_image, num_patch, d_model)
         return image_features
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("merged_linear", "gate_proj", 0),
@@ -758,7 +780,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         loaded_params: set[str] = set()
 
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -777,8 +799,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -786,7 +807,6 @@ def load_weights(self, weights: Iterable[tuple[str,
 
 @support_torch_compile
 class MolmoModel(nn.Module, SupportsQuant):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -804,21 +824,23 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             quant_config=quant_config,
         )
 
-        decoder_layer = MolmoDecoderNormAfterLayer if config.norm_after \
-            else MolmoDecoderLayer
+        decoder_layer = (
+            MolmoDecoderNormAfterLayer if config.norm_after else MolmoDecoderLayer
+        )
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: decoder_layer(
-                config, cache_config, quant_config, prefix=prefix),
+                config, cache_config, quant_config, prefix=prefix
+            ),
             prefix=f"{prefix}.layers",
         )
 
         assert config.layer_norm_type == "rms"
         self.norm = RMSNorm(config.hidden_size, config.layer_norm_eps)
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -849,18 +871,16 @@ def forward(
                 residual,
             )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         if residual is not None:
             hidden_states, _ = self.norm(hidden_states, residual)
         else:
             hidden_states = self.norm(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
 
@@ -871,8 +891,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 continue
 
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -939,8 +958,12 @@ def get_patches_grid_size(
 
 
 def get_candidate_tilings(max_num: int) -> list[tuple[int, int]]:
-    tilings = [(i, j) for i in range(1, max_num + 1)
-               for j in range(1, max_num + 1) if i * j <= max_num]
+    tilings = [
+        (i, j)
+        for i in range(1, max_num + 1)
+        for j in range(1, max_num + 1)
+        if i * j <= max_num
+    ]
     return sorted(tilings, key=lambda x: x[0] * x[1])
 
 
@@ -1128,7 +1151,8 @@ def __call__(
         **kwargs,
     ) -> BatchFeature:
         outputs = self.processor.process(  # type: ignore
-            text, images, **kwargs)
+            text, images, **kwargs
+        )
 
         if images is None:
             images = []
@@ -1146,7 +1170,8 @@ def __call__(
                 self.select_tiling(
                     image_width=image.size[0],
                     image_height=image.size[1],
-                ) for image in images
+                )
+                for image in images
             ]
             # For each image: tiling_h * tiling_w + extra
             num_crops = torch.tensor(tilings).prod(-1) + 1
@@ -1160,7 +1185,6 @@ def __call__(
 
 
 class MolmoProcessingInfo(BaseProcessingInfo):
-
     def get_hf_processor(self, **kwargs: object) -> MolmoProcessorWrapper:
         processor = self.ctx.get_hf_processor(**kwargs)
         return MolmoProcessorWrapper(processor)
@@ -1209,8 +1233,7 @@ def get_image_size_with_most_features(self) -> ImageSize:
             )
             if feat_size > largest_feature_size:
                 largest_feature_size = feat_size
-                largest_feature_pinpoint = ImageSize(width=width,
-                                                     height=height)
+                largest_feature_pinpoint = ImageSize(width=width, height=height)
 
         if largest_feature_size == 0 or largest_feature_pinpoint is None:
             raise ValueError("Cannot have a largest feature size of 0!")
@@ -1219,7 +1242,6 @@ def get_image_size_with_most_features(self) -> ImageSize:
 
 
 class MolmoDummyInputsBuilder(BaseDummyInputsBuilder[MolmoProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         return ""
 
@@ -1229,23 +1251,22 @@ def get_dummy_mm_data(
         mm_counts: Mapping[str, int],
         mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
         num_images = mm_counts.get("image", 0)
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class MolmoMultiModalProcessor(BaseMultiModalProcessor[MolmoProcessingInfo]):
-
     def _apply_hf_processor_tokens_only(
         self,
         prompt_tokens: list[int],
@@ -1263,7 +1284,7 @@ def _apply_hf_processor_tokens_only(
             processor,  # type: ignore
             dict(tokens=tokens),
         )
-        prompt_ids, = processed_data.pop("input_ids").tolist()
+        (prompt_ids,) = processed_data.pop("input_ids").tolist()
 
         return prompt_ids
 
@@ -1277,10 +1298,8 @@ def _get_mm_fields_config(
 
         return dict(
             images=MultiModalFieldConfig.flat_from_sizes("image", num_crops),
-            image_masks=MultiModalFieldConfig.flat_from_sizes(
-                "image", num_crops),
-            feat_is_patch=MultiModalFieldConfig.flat_from_sizes(
-                "image", num_crops),
+            image_masks=MultiModalFieldConfig.flat_from_sizes("image", num_crops),
+            feat_is_patch=MultiModalFieldConfig.flat_from_sizes("image", num_crops),
             num_crops=MultiModalFieldConfig.batched("image"),
             img_patch_id=MultiModalFieldConfig.shared("image", num_images),
         )
@@ -1303,8 +1322,7 @@ def _get_prompt_updates(
         img_end_id = processor.im_end_id
 
         extra_row = [img_patch_id] * image_token_length_w + [img_col_id]
-        extra_joint = ([img_start_id] + extra_row * image_token_length_h +
-                       [img_end_id])
+        extra_joint = [img_start_id] + extra_row * image_token_length_h + [img_end_id]
 
         def get_insertion_molmo(item_idx: int):
             images = mm_items.get_items("image", ImageProcessorItems)
@@ -1315,10 +1333,12 @@ def get_insertion_molmo(item_idx: int):
                 image_height=image_size.height,
             )
 
-            joint_row = ([img_patch_id] * ((ncols + 1) // pooling_size) +
-                         [img_col_id])
-            joint = ([img_start_id] + joint_row *
-                     ((nrows + 1) // pooling_size) + [img_end_id])
+            joint_row = [img_patch_id] * ((ncols + 1) // pooling_size) + [img_col_id]
+            joint = (
+                [img_start_id]
+                + joint_row * ((nrows + 1) // pooling_size)
+                + [img_end_id]
+            )
 
             return PromptUpdateDetails.select_token_id(
                 extra_joint + joint,
@@ -1334,11 +1354,14 @@ def get_insertion_molmo(item_idx: int):
         ]
 
 
-@MULTIMODAL_REGISTRY.register_processor(MolmoMultiModalProcessor,
-                                        info=MolmoProcessingInfo,
-                                        dummy_inputs=MolmoDummyInputsBuilder)
-class MolmoForCausalLM(nn.Module, SupportsMultiModal, SupportsPP, SupportsLoRA,
-                       SupportsQuant):
+@MULTIMODAL_REGISTRY.register_processor(
+    MolmoMultiModalProcessor,
+    info=MolmoProcessingInfo,
+    dummy_inputs=MolmoDummyInputsBuilder,
+)
+class MolmoForCausalLM(
+    nn.Module, SupportsMultiModal, SupportsPP, SupportsLoRA, SupportsQuant
+):
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_substr={
             # vision backbone mapping
@@ -1370,7 +1393,7 @@ class MolmoForCausalLM(nn.Module, SupportsMultiModal, SupportsPP, SupportsLoRA,
     packed_modules_mapping = {
         "qkv_proj": ["qkv_proj"],
         "gate_up_proj": ["gate_up_proj"],  # language model
-        "merged_linear": ["gate_proj", "up_proj"]  # image_projector
+        "merged_linear": ["gate_proj", "up_proj"],  # image_projector
     }
 
     @classmethod
@@ -1391,10 +1414,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.lora_config = lora_config
 
         vision_config = VisionBackboneConfig()
-        self.vision_backbone = MolmoVisionBackbone(config, vision_config,
-                                                   quant_config)
-        self.model = MolmoModel(vllm_config=vllm_config,
-                                prefix=maybe_prefix(prefix, "model"))
+        self.vision_backbone = MolmoVisionBackbone(config, vision_config, quant_config)
+        self.model = MolmoModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.img_patch_id = None
 
         if self.config.weight_tying:
@@ -1407,11 +1430,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
 
-        self.logits_processor = LogitsProcessor(config.embedding_size
-                                                or config.vocab_size)
+        self.logits_processor = LogitsProcessor(
+            config.embedding_size or config.vocab_size
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
         self,
@@ -1426,14 +1451,16 @@ def _parse_and_validate_image_input(
             return None
 
         if not isinstance(num_crops, (torch.Tensor, list)):
-            raise ValueError("Incorrect type of num_crops. "
-                             f"Got type: {type(num_crops)}")
+            raise ValueError(
+                f"Incorrect type of num_crops. Got type: {type(num_crops)}"
+            )
         num_crops = flatten_bn(num_crops, concat=True)
 
         img_patch_id = kwargs.pop("img_patch_id", None)
         if not isinstance(img_patch_id, torch.Tensor):
-            raise ValueError("Incorrect type of img_patch_id. "
-                             f"Got type: {type(img_patch_id)}")
+            raise ValueError(
+                f"Incorrect type of img_patch_id. Got type: {type(img_patch_id)}"
+            )
         self.img_patch_id = img_patch_id.flatten().unique().item()
 
         return MolmoImageInputs(
@@ -1454,19 +1481,22 @@ def _process_image_input(
 
         # Call the vision backbone on the whole batch at once
         images_flat = flatten_bn(images, concat=True)
-        image_masks_flat = (None if image_masks is None else flatten_bn(
-            image_masks, concat=True))
+        image_masks_flat = (
+            None if image_masks is None else flatten_bn(image_masks, concat=True)
+        )
         feat_is_patch_flat = flatten_bn(feat_is_patch, concat=True)
 
         image_features_flat = self.vision_backbone(
             images=images_flat.unsqueeze(0),
-            image_masks=(None if image_masks_flat is None else
-                         image_masks_flat.unsqueeze(0)),
+            image_masks=(
+                None if image_masks_flat is None else image_masks_flat.unsqueeze(0)
+            ),
         ).squeeze(0)
 
         # Only the features corresponding to patch tokens are relevant
         return [
-            feats[f_is_patch] for feats, f_is_patch in zip(
+            feats[f_is_patch]
+            for feats, f_is_patch in zip(
                 image_features_flat.split(num_crops.tolist()),
                 feat_is_patch_flat.split(num_crops.tolist()),
             )
@@ -1475,8 +1505,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -1491,14 +1520,12 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs: object,
     ) -> torch.Tensor:
-
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.model(input_ids,
-                                   positions,
-                                   intermediate_tensors,
-                                   inputs_embeds=inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
 
         return hidden_states
 
@@ -1507,7 +1534,6 @@ def compute_logits(self, hidden_states: torch.Tensor) -> torch.Tensor:
         return logits
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
-
         loader = AutoWeightsLoader(self)
         weights = _get_weights_with_merged_embedding(weights)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
@@ -1524,7 +1550,7 @@ def get_mm_mapping(self) -> MultiModelKeys:
 
 
 def _get_weights_with_merged_embedding(
-    weights: Iterable[tuple[str, torch.Tensor]]
+    weights: Iterable[tuple[str, torch.Tensor]],
 ) -> Iterable[tuple[str, torch.Tensor]]:
     embedding_weights = {}
     for name, weight in weights:
diff --git a/vllm/model_executor/models/moonvit.py b/vllm/model_executor/models/moonvit.py
index caa00763fc3d..3bf8fce0de0d 100644
--- a/vllm/model_executor/models/moonvit.py
+++ b/vllm/model_executor/models/moonvit.py
@@ -91,10 +91,10 @@ def multihead_attention(
     """
     # Unified format legal check
     assert q.dim() == k.dim() == v.dim() == 3, "q, k, v must have 3 dims"
-    assert q_cu_seqlens[-1] == q.shape[
-        0], "q_cu_seqlens must sum to q.shape[0]"
-    assert (k_cu_seqlens[-1] == k.shape[0] ==
-            v.shape[0]), "k_cu_seqlens must sum to k.shape[0]"
+    assert q_cu_seqlens[-1] == q.shape[0], "q_cu_seqlens must sum to q.shape[0]"
+    assert k_cu_seqlens[-1] == k.shape[0] == v.shape[0], (
+        "k_cu_seqlens must sum to k.shape[0]"
+    )
     assert q.dtype in [
         torch.bfloat16,
         torch.float16,
@@ -137,23 +137,19 @@ def sdpa_attention(
         k_cu_seqlens: Optional cumulative sequence lengths of k.
     """
     seq_length = q.shape[0]
-    attention_mask = torch.zeros([1, seq_length, seq_length],
-                                 device=q.device,
-                                 dtype=torch.bool)
+    attention_mask = torch.zeros(
+        [1, seq_length, seq_length], device=q.device, dtype=torch.bool
+    )
     for i in range(1, len(q_cu_seqlens)):
         attention_mask[
             ...,
-            q_cu_seqlens[i - 1]:q_cu_seqlens[i],
-            q_cu_seqlens[i - 1]:q_cu_seqlens[i],
+            q_cu_seqlens[i - 1] : q_cu_seqlens[i],
+            q_cu_seqlens[i - 1] : q_cu_seqlens[i],
         ] = True
     q = q.transpose(0, 1)
     k = k.transpose(0, 1)
     v = v.transpose(0, 1)
-    attn_output = F.scaled_dot_product_attention(q,
-                                                 k,
-                                                 v,
-                                                 attention_mask,
-                                                 dropout_p=0.0)
+    attn_output = F.scaled_dot_product_attention(q, k, v, attention_mask, dropout_p=0.0)
     attn_output = attn_output.transpose(0, 1)
     attn_output = attn_output.reshape(seq_length, -1)
     return attn_output
@@ -172,8 +168,9 @@ def _apply_rope_input_validation(x, freqs_cis):
     assert freqs_cis.dtype == torch.complex64, freqs_cis.dtype
 
 
-def apply_rope(xq: torch.Tensor, xk: torch.Tensor,
-               freqs_cis: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+def apply_rope(
+    xq: torch.Tensor, xk: torch.Tensor, freqs_cis: torch.Tensor
+) -> tuple[torch.Tensor, torch.Tensor]:
     """
     Args: (The leading dimensions of all inputs should be the same)
         xq: query, tensor of shape (..., num_heads, head_dim)
@@ -189,20 +186,15 @@ def apply_rope(xq: torch.Tensor, xk: torch.Tensor,
     # ..., num_heads, head_dim/2
     xq_ = torch.view_as_complex(xq.float().view(*xq.shape[:-1], -1, 2))
     xk_ = torch.view_as_complex(xk.float().view(*xq.shape[:-1], -1, 2))
-    xq_out = torch.view_as_real(xq_ * freqs_cis).flatten(
-        -2)  # ..., num_heads, head_dim
-    xk_out = torch.view_as_real(xk_ * freqs_cis).flatten(
-        -2)  # ..., num_heads, head_dim
+    xq_out = torch.view_as_real(xq_ * freqs_cis).flatten(-2)  # ..., num_heads, head_dim
+    xk_out = torch.view_as_real(xk_ * freqs_cis).flatten(-2)  # ..., num_heads, head_dim
     return xq_out.type_as(xq), xk_out.type_as(xk)
 
 
 class Learnable2DInterpPosEmb(nn.Module):
-
-    def __init__(self,
-                 height: int,
-                 width: int,
-                 dim: int,
-                 interpolation_mode: str = "bicubic") -> None:
+    def __init__(
+        self, height: int, width: int, dim: int, interpolation_mode: str = "bicubic"
+    ) -> None:
         super().__init__()
         self.height = height
         self.width = width
@@ -224,13 +216,16 @@ def forward(self, x: torch.Tensor, grid_hws: torch.Tensor) -> torch.Tensor:
                         self.weight.permute((2, 0, 1)).unsqueeze(0),
                         size=shape,
                         mode=self.interpolation_mode,
-                    ).squeeze(0).permute((1, 2, 0)).flatten(end_dim=1))
+                    )
+                    .squeeze(0)
+                    .permute((1, 2, 0))
+                    .flatten(end_dim=1)
+                )
         out = x + torch.cat(pos_embs)
         return out
 
 
 class MoonVisionPatchEmbed(nn.Module):
-
     def __init__(
         self,
         out_dim: int,
@@ -240,23 +235,23 @@ def __init__(
         pos_emb_width: int = 14,
     ):
         super().__init__()
-        assert isinstance(
-            patch_size,
-            (int, Sequence)), f"Invalid patch_size type: {type(patch_size)}"
+        assert isinstance(patch_size, (int, Sequence)), (
+            f"Invalid patch_size type: {type(patch_size)}"
+        )
         if isinstance(patch_size, int):
             patch_size = (patch_size, patch_size)
-        assert (len(patch_size) == 2
-                ), f"Expected patch_size to be a tuple of 2, got {patch_size}"
+        assert len(patch_size) == 2, (
+            f"Expected patch_size to be a tuple of 2, got {patch_size}"
+        )
         self.patch_size = patch_size
 
-        self.proj = nn.Conv2d(in_dim,
-                              out_dim,
-                              kernel_size=patch_size,
-                              stride=patch_size)
+        self.proj = nn.Conv2d(
+            in_dim, out_dim, kernel_size=patch_size, stride=patch_size
+        )
 
-        self.pos_emb = Learnable2DInterpPosEmb(height=pos_emb_height,
-                                               width=pos_emb_width,
-                                               dim=out_dim)
+        self.pos_emb = Learnable2DInterpPosEmb(
+            height=pos_emb_height, width=pos_emb_width, dim=out_dim
+        )
 
     def forward(self, x: torch.Tensor, grid_hw: torch.Tensor) -> torch.Tensor:
         """
@@ -295,12 +290,9 @@ class Rope2DPosEmb(nn.Module):
         device (str): the device to store the precomputed cis
     """
 
-    def __init__(self,
-                 dim: int,
-                 max_height: int,
-                 max_width: int,
-                 theta_base=10000,
-                 device="cuda"):
+    def __init__(
+        self, dim: int, max_height: int, max_width: int, theta_base=10000, device="cuda"
+    ):
         super().__init__()
         self.dim = dim
         assert self.dim % 4 == 0, "dim must be divisible by 4"
@@ -325,18 +317,18 @@ def precomputed_freqs_cis(self) -> torch.Tensor:
         flat_pos = torch.arange(0, N).float().to(self.device)
         x_pos = flat_pos % self.max_width
         y_pos = flat_pos // self.max_width
-        dim_range = (torch.arange(0, self.dim,
-                                  4)[:(self.dim // 4)].float().to(self.device)
-                     )  # C/4
-        freqs = 1.0 / (self.theta_base**(dim_range / self.dim))
+        dim_range = (
+            torch.arange(0, self.dim, 4)[: (self.dim // 4)].float().to(self.device)
+        )  # C/4
+        freqs = 1.0 / (self.theta_base ** (dim_range / self.dim))
         x_freqs = torch.outer(x_pos, freqs).float()  # N, C/4
         y_freqs = torch.outer(y_pos, freqs).float()  # N, C/4
         x_cis = torch.polar(torch.ones_like(x_freqs), x_freqs)  # N, C/4
         y_cis = torch.polar(torch.ones_like(y_freqs), y_freqs)  # N, C/4
         # N, C/4, 2
         freqs_cis = torch.cat(
-            [x_cis.unsqueeze(dim=-1),
-             y_cis.unsqueeze(dim=-1)], dim=-1)
+            [x_cis.unsqueeze(dim=-1), y_cis.unsqueeze(dim=-1)], dim=-1
+        )
         # max_height, max_width, C/2
         freqs_cis = freqs_cis.reshape(self.max_height, self.max_width, -1)
         return freqs_cis
@@ -349,12 +341,13 @@ def get_freqs_cis_by_seqlens(self, grid_hws: torch.Tensor) -> torch.Tensor:
             freqs_cis: tensor of shape (sum(t * height * width), dim//2)
         """
         shapes = grid_hws.tolist()
-        assert all(1 <= h <= self.max_height and 1 <= w <= self.max_width
-                   for h, w in shapes), (
-                       shapes,
-                       self.max_height,
-                       self.max_width,
-                   )
+        assert all(
+            1 <= h <= self.max_height and 1 <= w <= self.max_width for h, w in shapes
+        ), (
+            shapes,
+            self.max_height,
+            self.max_width,
+        )
         freqs_cis = torch.cat(
             [
                 self.precomputed_freqs_cis[:h, :w].reshape(-1, self.dim // 2)
@@ -364,8 +357,9 @@ def get_freqs_cis_by_seqlens(self, grid_hws: torch.Tensor) -> torch.Tensor:
         )
         return freqs_cis
 
-    def get_freqs_cis_by_idx(self, pos_idx: torch.Tensor,
-                             pos_idx_mask: torch.Tensor) -> torch.Tensor:
+    def get_freqs_cis_by_idx(
+        self, pos_idx: torch.Tensor, pos_idx_mask: torch.Tensor
+    ) -> torch.Tensor:
         """
         Args:
             pos_idx: tensor of shape (..., 2), It contains the (h, w) position indices of each 2D token.
@@ -374,16 +368,20 @@ def get_freqs_cis_by_idx(self, pos_idx: torch.Tensor,
         Return:
             freqs_cis: tensor of shape (..., dim//2)
         """
-        assert (pos_idx.shape[:-1] == pos_idx_mask.shape
-                and pos_idx.shape[-1] == 2 and pos_idx.ndim
-                == pos_idx_mask.ndim + 1), (pos_idx.shape, pos_idx_mask.shape)
+        assert (
+            pos_idx.shape[:-1] == pos_idx_mask.shape
+            and pos_idx.shape[-1] == 2
+            and pos_idx.ndim == pos_idx_mask.ndim + 1
+        ), (pos_idx.shape, pos_idx_mask.shape)
         assert pos_idx_mask.dtype == torch.bool, pos_idx_mask.dtype
 
-        shp = pos_idx_mask.shape + (self.dim // 2, )  # ..., head_dim/2
-        freqs_cis = torch.ones(shp, dtype=torch.complex64,
-                               device=self.device)  # ..., head_dim/2
-        freqs_cis[pos_idx_mask] = self.precomputed_freqs_cis[pos_idx[
-            ..., 0][pos_idx_mask], pos_idx[..., 1][pos_idx_mask]]
+        shp = pos_idx_mask.shape + (self.dim // 2,)  # ..., head_dim/2
+        freqs_cis = torch.ones(
+            shp, dtype=torch.complex64, device=self.device
+        )  # ..., head_dim/2
+        freqs_cis[pos_idx_mask] = self.precomputed_freqs_cis[
+            pos_idx[..., 0][pos_idx_mask], pos_idx[..., 1][pos_idx_mask]
+        ]
         return freqs_cis
 
 
@@ -394,23 +392,23 @@ class MLP2(nn.Module):
         bias: whether to use bias in linear layer.
     """
 
-    def __init__(self,
-                 dims: list[int],
-                 activation,
-                 bias: bool = True,
-                 prefix: str = "",
-                 use_data_parallel: bool = False):
+    def __init__(
+        self,
+        dims: list[int],
+        activation,
+        bias: bool = True,
+        prefix: str = "",
+        use_data_parallel: bool = False,
+    ):
         super().__init__()
         assert len(dims) == 3
         self.use_data_parallel = use_data_parallel
-        self.fc0 = ReplicatedLinear(dims[0],
-                                    dims[1],
-                                    bias=bias,
-                                    prefix=maybe_prefix(prefix, "fc0"))
-        self.fc1 = ReplicatedLinear(dims[1],
-                                    dims[2],
-                                    bias=bias,
-                                    prefix=maybe_prefix(prefix, "fc1"))
+        self.fc0 = ReplicatedLinear(
+            dims[0], dims[1], bias=bias, prefix=maybe_prefix(prefix, "fc0")
+        )
+        self.fc1 = ReplicatedLinear(
+            dims[1], dims[2], bias=bias, prefix=maybe_prefix(prefix, "fc1")
+        )
         self.activation = activation
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -421,7 +419,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class MoonVitEncoderLayer(nn.Module):
-
     def __init__(
         self,
         num_heads: int,
@@ -446,18 +443,18 @@ def __init__(
         self.norm0 = nn.LayerNorm(hidden_dim)
         self.norm1 = nn.LayerNorm(hidden_dim)
         self.use_data_parallel = use_data_parallel
-        self.mlp = MLP2([hidden_dim, mlp_dim, hidden_dim],
-                        activation,
-                        prefix=f"{prefix}.mlp",
-                        use_data_parallel=use_data_parallel)
-        self.wqkv = ReplicatedLinear(hidden_dim,
-                                     hidden_dim * 3,
-                                     bias=attn_bias,
-                                     prefix=f"{prefix}.wqkv")
-        self.wo = ReplicatedLinear(hidden_dim,
-                                   hidden_dim,
-                                   bias=attn_bias,
-                                   prefix=f"{prefix}.wo")
+        self.mlp = MLP2(
+            [hidden_dim, mlp_dim, hidden_dim],
+            activation,
+            prefix=f"{prefix}.mlp",
+            use_data_parallel=use_data_parallel,
+        )
+        self.wqkv = ReplicatedLinear(
+            hidden_dim, hidden_dim * 3, bias=attn_bias, prefix=f"{prefix}.wqkv"
+        )
+        self.wo = ReplicatedLinear(
+            hidden_dim, hidden_dim, bias=attn_bias, prefix=f"{prefix}.wo"
+        )
 
     def attention_qkvpacked(
         self,
@@ -484,11 +481,9 @@ def attention_qkvpacked(
         xq, xk = apply_rope(xq, xk, rope_freqs_cis)
 
         attn_func = VL_VISION_ATTENTION_FUNCTIONS[self.attn_implementation]
-        attn_out = attn_func(xq,
-                             xk,
-                             xv,
-                             q_cu_seqlens=cu_seqlens,
-                             k_cu_seqlens=cu_seqlens)
+        attn_out = attn_func(
+            xq, xk, xv, q_cu_seqlens=cu_seqlens, k_cu_seqlens=cu_seqlens
+        )
         attn_out, _ = self.wo(attn_out)
         return attn_out
 
@@ -507,9 +502,9 @@ def forward(
         """
         residual = hidden_states
         hidden_states = self.norm0(hidden_states)
-        attn_out = self.attention_qkvpacked(hidden_states,
-                                            cu_seqlens,
-                                            rope_freqs_cis=rope_freqs_cis)
+        attn_out = self.attention_qkvpacked(
+            hidden_states, cu_seqlens, rope_freqs_cis=rope_freqs_cis
+        )
         hidden_states = residual + attn_out
 
         residual = hidden_states
@@ -519,7 +514,6 @@ def forward(
 
 
 class MoonVitEncoder(nn.Module):
-
     def __init__(
         self,
         hidden_dim: int,
@@ -531,27 +525,37 @@ def __init__(
         super().__init__()
 
         self.rope_2d = Rope2DPosEmb(
-            block_cfg["hidden_dim"] // block_cfg["num_heads"], 512, 512)
+            block_cfg["hidden_dim"] // block_cfg["num_heads"], 512, 512
+        )
         self.blocks = nn.ModuleList(
-            [MoonVitEncoderLayer(use_data_parallel=use_data_parallel, \
-                                 prefix=f"{prefix}.blocks.{layer_idx}", \
-                                 **block_cfg) for layer_idx in range(num_layers)])
+            [
+                MoonVitEncoderLayer(
+                    use_data_parallel=use_data_parallel,
+                    prefix=f"{prefix}.blocks.{layer_idx}",
+                    **block_cfg,
+                )
+                for layer_idx in range(num_layers)
+            ]
+        )
         self.final_layernorm = nn.LayerNorm(hidden_dim)
 
-    def forward(self, hidden_states: torch.Tensor,
-                grid_hw: torch.Tensor) -> torch.Tensor:
-        rope_freqs_cis = self.rope_2d.get_freqs_cis_by_seqlens(
-            grid_hws=grid_hw)
+    def forward(
+        self, hidden_states: torch.Tensor, grid_hw: torch.Tensor
+    ) -> torch.Tensor:
+        rope_freqs_cis = self.rope_2d.get_freqs_cis_by_seqlens(grid_hws=grid_hw)
 
         lengths = torch.cat(
-            (torch.zeros(1, device=hidden_states.device, dtype=grid_hw.dtype),
-             (grid_hw[:, 0] * grid_hw[:, 1]).to(hidden_states.device)))
+            (
+                torch.zeros(1, device=hidden_states.device, dtype=grid_hw.dtype),
+                (grid_hw[:, 0] * grid_hw[:, 1]).to(hidden_states.device),
+            )
+        )
         cu_seqlens = lengths.cumsum(dim=0, dtype=torch.int32)
 
         for _, block in enumerate(self.blocks):
-            hidden_states = block(hidden_states,
-                                  cu_seqlens,
-                                  rope_freqs_cis=rope_freqs_cis)
+            hidden_states = block(
+                hidden_states, cu_seqlens, rope_freqs_cis=rope_freqs_cis
+            )
 
         hidden_states = self.final_layernorm(hidden_states)
 
@@ -559,9 +563,9 @@ def forward(self, hidden_states: torch.Tensor,
 
 
 def patch_merger(
-        x: torch.Tensor,
-        grid_hw: torch.Tensor,
-        merge_kernel_size: list[int, int] = (2, 2),
+    x: torch.Tensor,
+    grid_hw: torch.Tensor,
+    merge_kernel_size: list[int, int] = (2, 2),
 ) -> list[torch.Tensor]:
     d_model = x.size(-1)
 
@@ -570,15 +574,17 @@ def patch_merger(
     for x_shape in grid_hw.tolist():
         height, width = x_shape[0], x_shape[1]
         # Get the current sequence
-        seq = x[pre_sum:pre_sum + height * width]
+        seq = x[pre_sum : pre_sum + height * width]
         # Reshape along self.merge_kernel_size and concat to the last dimension
         kernel_height, kernel_width = merge_kernel_size
         new_height, new_width = height // kernel_height, width // kernel_width
-        reshaped_seq = seq.view(new_height, kernel_height, new_width,
-                                kernel_width, d_model)
+        reshaped_seq = seq.view(
+            new_height, kernel_height, new_width, kernel_width, d_model
+        )
         reshaped_seq = reshaped_seq.permute(0, 2, 1, 3, 4).contiguous()
-        padded_seq = reshaped_seq.view(new_height * new_width,
-                                       kernel_height * kernel_width, -1)
+        padded_seq = reshaped_seq.view(
+            new_height * new_width, kernel_height * kernel_width, -1
+        )
         outputs.append(padded_seq)
         pre_sum += height * width
 
@@ -586,7 +592,6 @@ def patch_merger(
 
 
 class MoonVitVLProjector(nn.Module):
-
     def __init__(
         self,
         in_channels: int,
@@ -596,13 +601,10 @@ def __init__(
         out_dim: int = 4096,
     ):
         super().__init__()
-        self.hidden_size = in_channels * merge_kernel_size[
-            0] * merge_kernel_size[1]
+        self.hidden_size = in_channels * merge_kernel_size[0] * merge_kernel_size[1]
 
         self.pre_norm = nn.nn.LayerNorm(in_channels, eps=ln_eps)
-        self.linear_1 = nn.Linear(self.hidden_size,
-                                  self.hidden_size,
-                                  bias=True)
+        self.linear_1 = nn.Linear(self.hidden_size, self.hidden_size, bias=True)
         self.act = ACT2FN[hidden_act]
         self.linear_2 = nn.Linear(self.hidden_size, out_dim, bias=True)
 
@@ -621,12 +623,14 @@ class MoonVitPretrainedModel(PreTrainedModel):
     _supports_flash_attn_2 = True
     _supports_sdpa = True
 
-    def __init__(self,
-                 config: MoonViTConfig,
-                 use_data_parallel: bool = False,
-                 prefix: str = "",
-                 *inputs,
-                 **kwargs):
+    def __init__(
+        self,
+        config: MoonViTConfig,
+        use_data_parallel: bool = False,
+        prefix: str = "",
+        *inputs,
+        **kwargs,
+    ):
         super().__init__(config, *inputs, **kwargs)
         config = deepcopy(config)
         self.use_data_parallel = use_data_parallel
@@ -655,8 +659,9 @@ def __init__(self,
             prefix=f"{prefix}.encoder",
         )
 
-    def forward(self, pixel_values: torch.Tensor,
-                grid_hw: torch.Tensor) -> torch.Tensor:
+    def forward(
+        self, pixel_values: torch.Tensor, grid_hw: torch.Tensor
+    ) -> torch.Tensor:
         """
         Args:
             pixel_values (torch.Tensor): The input pixel values.
@@ -667,7 +672,7 @@ def forward(self, pixel_values: torch.Tensor,
         """
         hidden_states = self.patch_embed(pixel_values, grid_hw)
         hidden_states = self.encoder(hidden_states, grid_hw)
-        hidden_states = patch_merger(hidden_states,
-                                     grid_hw,
-                                     merge_kernel_size=self.merge_kernel_size)
+        hidden_states = patch_merger(
+            hidden_states, grid_hw, merge_kernel_size=self.merge_kernel_size
+        )
         return hidden_states
diff --git a/vllm/model_executor/models/mpt.py b/vllm/model_executor/models/mpt.py
index 64d669e8ac3e..3f1f2bbcb026 100644
--- a/vllm/model_executor/models/mpt.py
+++ b/vllm/model_executor/models/mpt.py
@@ -14,30 +14,38 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (get_pp_group, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 def _get_alibi_slopes(
     total_num_heads: int,
     alibi_bias_max: int,
 ) -> torch.Tensor:
-    next_power_of_2 = 2**math.ceil(math.log2(total_num_heads))
+    next_power_of_2 = 2 ** math.ceil(math.log2(total_num_heads))
     m = torch.arange(1, next_power_of_2 + 1, dtype=torch.float32)
     m = m.mul(alibi_bias_max / next_power_of_2)
     slopes = 1.0 / torch.pow(2, m)
@@ -47,7 +55,6 @@ def _get_alibi_slopes(
 
 
 class MPTAttention(nn.Module):
-
     def __init__(
         self,
         config: MptConfig,
@@ -107,20 +114,21 @@ def __init__(
         tp_rank = get_tensor_model_parallel_rank()
         head_start = tp_rank * self.num_heads
         head_end = (tp_rank + 1) * self.num_heads
-        alibi_slopes = _get_alibi_slopes(self.total_num_heads,
-                                         self.alibi_bias_max)
+        alibi_slopes = _get_alibi_slopes(self.total_num_heads, self.alibi_bias_max)
         alibi_slopes = alibi_slopes[head_start:head_end].tolist()
 
         self.head_dim = self.d_model // self.total_num_heads
         scaling = self.head_dim**-0.5
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              scaling,
-                              alibi_slopes=alibi_slopes,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            scaling,
+            alibi_slopes=alibi_slopes,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -141,7 +149,6 @@ def forward(
 
 
 class MPTMLP(nn.Module):
-
     def __init__(
         self,
         config: MptConfig,
@@ -173,7 +180,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class MPTBlock(nn.Module):
-
     def __init__(
         self,
         config: MptConfig,
@@ -184,10 +190,9 @@ def __init__(
         super().__init__()
         hidden_size = config.d_model
         self.norm_1 = nn.LayerNorm(hidden_size)
-        self.attn = MPTAttention(config,
-                                 cache_config,
-                                 quant_config,
-                                 prefix=f"{prefix}.attn")
+        self.attn = MPTAttention(
+            config, cache_config, quant_config, prefix=f"{prefix}.attn"
+        )
         self.norm_2 = nn.LayerNorm(hidden_size)
         self.ffn = MPTMLP(config, quant_config)
 
@@ -210,7 +215,6 @@ def forward(
 
 @support_torch_compile
 class MPTModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -227,19 +231,18 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
         self.start_layer, self.end_layer, self.blocks = make_layers(
             config.n_layers,
-            lambda prefix: MPTBlock(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.blocks")
+            lambda prefix: MPTBlock(config, cache_config, quant_config, prefix=prefix),
+            prefix=f"{prefix}.blocks",
+        )
         self.norm_f = nn.LayerNorm(config.d_model)
         if config.no_bias:
             for module in self.modules():
-                if hasattr(module, "bias") and isinstance(
-                        module.bias, nn.Parameter):
+                if hasattr(module, "bias") and isinstance(module.bias, nn.Parameter):
                     # Remove the bias term in Linear and LayerNorm.
                     module.register_parameter("bias", None)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.d_model))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.d_model
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
@@ -267,8 +270,7 @@ def forward(
         hidden_states = self.norm_f(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters(remove_duplicate=False))
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
@@ -278,15 +280,13 @@ def load_weights(self, weights: Iterable[tuple[str,
             if is_pp_missing_parameter(name, self):
                 continue
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class MPTForCausalLM(nn.Module, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
@@ -295,12 +295,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         assert config.tie_word_embeddings
         self.quant_config = quant_config
 
-        self.transformer = MPTModel(vllm_config=vllm_config,
-                                    prefix=maybe_prefix(prefix, "transformer"))
+        self.transformer = MPTModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "transformer")
+        )
         self.lm_head = self.transformer.wte
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.transformer.make_empty_intermediate_tensors)
+            self.transformer.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.transformer.get_input_embeddings(input_ids)
@@ -312,8 +314,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.transformer(input_ids, positions,
-                                         intermediate_tensors, inputs_embeds)
+        hidden_states = self.transformer(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -323,7 +326,6 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index 22f6ddef9336..b7fac22fe99d 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -25,28 +25,49 @@
 from vllm.model_executor.layers.activation import ReLUSquaredActivation
 from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
-from vllm.model_executor.models.interfaces import (HasInnerState, IsHybrid,
-                                                   MultiModalEmbeddings,
-                                                   SupportsMultiModal)
-from vllm.model_executor.models.internvl import (calculate_internvl_targets,
-                                                 get_internvl_target_ratios)
+from vllm.model_executor.models.interfaces import (
+    HasInnerState,
+    IsHybrid,
+    MultiModalEmbeddings,
+    SupportsMultiModal,
+)
+from vllm.model_executor.models.internvl import (
+    calculate_internvl_targets,
+    get_internvl_target_ratios,
+)
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.model_executor.models.nemotron_h import NemotronHForCausalLM
 from vllm.model_executor.models.radio import RadioModel
-from vllm.model_executor.models.utils import (flatten_bn,
-                                              init_vllm_registered_model,
-                                              maybe_prefix)
+from vllm.model_executor.models.utils import (
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.evs import (compute_retained_tokens_count,
-                                 compute_retention_mask)
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargs, MultiModalKwargsItems)
-from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
-                                   ImageSize, MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails,
-                                        _seq2tokens)
+from vllm.multimodal.evs import (
+    compute_retained_tokens_count,
+    compute_retention_mask,
+)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargs,
+    MultiModalKwargsItems,
+)
+from vllm.multimodal.parse import (
+    ImageEmbeddingItems,
+    ImageProcessorItems,
+    ImageSize,
+    MultiModalDataItems,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+    _seq2tokens,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs.radio import RadioConfig
@@ -92,8 +113,9 @@ class NanoNemotronVLImageEmbeddinInputs(TypedDict):
     """
 
 
-NanoNemotronVLImageInputs = Union[NanoNemotronVLImagePixelInputs,
-                                  NanoNemotronVLImageEmbeddinInputs]
+NanoNemotronVLImageInputs = Union[
+    NanoNemotronVLImagePixelInputs, NanoNemotronVLImageEmbeddinInputs
+]
 
 
 class NanoNemotronVLVideoPixelInputs(TensorSchema):
@@ -105,6 +127,7 @@ class NanoNemotronVLVideoPixelInputs(TensorSchema):
         - h: Height of each video frame
         - w: Width of each video frame
     """
+
     type: Literal["pixel_values_videos"]
     pixel_values_flat: Annotated[torch.Tensor, TensorShape("bvf", 3, "h", "w")]
     num_patches: Annotated[torch.Tensor, TensorShape("bn")]
@@ -117,21 +140,19 @@ class NanoNemotronVLVideoEmbeddingInputs(TensorSchema):
         - f: Total video feature size
         - h: Hidden size (must match the hidden size of language model backbone)
     """
+
     type: Literal["video_embeds"]
-    data: Annotated[Union[torch.Tensor, list[torch.Tensor]],
-                    TensorShape("n", "f", "h")]
+    data: Annotated[Union[torch.Tensor, list[torch.Tensor]], TensorShape("n", "f", "h")]
 
 
-NanoNemotronVLVideoInputs = Union[NanoNemotronVLVideoPixelInputs,
-                                  NanoNemotronVLVideoEmbeddingInputs]
+NanoNemotronVLVideoInputs = Union[
+    NanoNemotronVLVideoPixelInputs, NanoNemotronVLVideoEmbeddingInputs
+]
 
 
-def dynamic_preprocess(image,
-                       *,
-                       image_size=512,
-                       max_num_tiles=12,
-                       use_thumbnail=True,
-                       idx=0):
+def dynamic_preprocess(
+    image, *, image_size=512, max_num_tiles=12, use_thumbnail=True, idx=0
+):
     orig_width, orig_height = image.size
 
     target_ratios = get_internvl_target_ratios(1, max_num_tiles)
@@ -141,7 +162,8 @@ def dynamic_preprocess(image,
         orig_height=orig_height,
         target_ratios=target_ratios,
         image_size=image_size,
-        use_thumbnail=False)
+        use_thumbnail=False,
+    )
     # resize the image
     resized_img = image.resize((target_width, target_height))
     processed_images = []
@@ -161,12 +183,12 @@ def dynamic_preprocess(image,
         processed_images.append(thumbnail_img)
 
     processed_images = [
-        img.convert("RGB") if img.mode != "RGB" else img
-        for img in processed_images
+        img.convert("RGB") if img.mode != "RGB" else img for img in processed_images
     ]
     processed_images = [
-        T.Resize((image_size, image_size),
-                 interpolation=T.InterpolationMode.BICUBIC)(img)
+        T.Resize((image_size, image_size), interpolation=T.InterpolationMode.BICUBIC)(
+            img
+        )
         for img in processed_images
     ]
     processed_images = [T.ToTensor()(img) for img in processed_images]
@@ -229,8 +251,9 @@ class BaseNanoNemotronVLProcessor(ABC):
     https://huggingface.co/OpenGVLab/InternVL2-1B/blob/main/modeling_internvl_chat.py#L252
     """
 
-    def __init__(self, config: PretrainedConfig, tokenizer: AnyTokenizer,
-                 *args, **kwargs) -> None:
+    def __init__(
+        self, config: PretrainedConfig, tokenizer: AnyTokenizer, *args, **kwargs
+    ) -> None:
         super().__init__()
 
         self.config = config
@@ -240,7 +263,8 @@ def __init__(self, config: PretrainedConfig, tokenizer: AnyTokenizer,
         patch_size: int = config.patch_size
 
         self.num_image_token = int(
-            (image_size // patch_size)**2 * (config.downsample_ratio**2))
+            (image_size // patch_size) ** 2 * (config.downsample_ratio**2)
+        )
         self.image_size = image_size
         self.use_thumbnail: bool = config.use_thumbnail
         self.norm_mean = torch.Tensor(config.norm_mean).reshape(1, 3, 1, 1)
@@ -290,7 +314,8 @@ def _images_to_pixel_values_lst(
                 max_num=max_num_tiles,
                 use_thumbnail=self.use_thumbnail,
                 idx=idx,
-            ) for idx, image in enumerate(images)
+            )
+            for idx, image in enumerate(images)
         ]
 
     def _preprocess_image(
@@ -302,24 +327,22 @@ def _preprocess_image(
         if len(images) == 0:
             image_inputs = {}
         else:
-            pixel_values_lst = self._images_to_pixel_values_lst(
-                images, max_num_tiles)
+            pixel_values_lst = self._images_to_pixel_values_lst(images, max_num_tiles)
             image_inputs = {
-                "pixel_values_flat":
-                torch.cat(pixel_values_lst),
-                "image_num_patches":
-                torch.tensor([len(item) for item in pixel_values_lst]),
+                "pixel_values_flat": torch.cat(pixel_values_lst),
+                "image_num_patches": torch.tensor(
+                    [len(item) for item in pixel_values_lst]
+                ),
             }
 
             for pixel_values in pixel_values_lst:
                 num_patches = pixel_values.shape[0]
                 feature_size = num_patches * self.num_image_token
                 image_repl = self.get_image_repl(feature_size, num_patches)
-                text = [t.replace('<image>', image_repl.full, 1) for t in text]
+                text = [t.replace("<image>", image_repl.full, 1) for t in text]
         return text, image_inputs
 
-    def _make_batch_input(self,
-                          input_item: Optional[Union[Any, list[Any]]] = None):
+    def _make_batch_input(self, input_item: Optional[Union[Any, list[Any]]] = None):
         if input_item is None:
             input_item = []
         if not isinstance(input_item, list):
@@ -399,14 +422,14 @@ def _videos_to_pixel_values_lst(
         max_num_tiles: int,
         dynamic_image_size: Optional[bool] = None,
     ) -> list[torch.Tensor]:
-
         return [
             video_to_pixel_values(
                 video,
                 input_size=self.image_size,
                 max_num_tiles=max_num_tiles,
                 use_thumbnail=self.use_thumbnail,
-            ) for video in videos
+            )
+            for video in videos
         ]
 
     def _preprocess_video(
@@ -426,10 +449,10 @@ def _preprocess_video(
             )
 
             video_inputs = {
-                "pixel_values_flat_video":
-                torch.cat(pixel_values_lst_video),
-                "video_num_patches":
-                torch.tensor([len(item) for item in pixel_values_lst_video]),
+                "pixel_values_flat_video": torch.cat(pixel_values_lst_video),
+                "video_num_patches": torch.tensor(
+                    [len(item) for item in pixel_values_lst_video]
+                ),
             }
 
             image_size: int = self.config.force_image_size
@@ -592,8 +615,7 @@ def get_num_image_tokens(
             max_num_tiles=max_num_tiles,
         )
 
-    def get_image_size_with_most_features(self,
-                                          max_num_tiles: int) -> ImageSize:
+    def get_image_size_with_most_features(self, max_num_tiles: int) -> ImageSize:
         processor = self.get_hf_processor()
 
         base_size = processor.image_size
@@ -611,8 +633,7 @@ def get_image_size_with_most_features(self,
             )
             if feat_size > largest_feature_size:
                 largest_feature_size = feat_size
-                largest_feature_pinpoint = ImageSize(width=width,
-                                                     height=height)
+                largest_feature_pinpoint = ImageSize(width=width, height=height)
 
         if largest_feature_size == 0 or largest_feature_pinpoint is None:
             raise ValueError("Cannot have a largest feature size of 0!")
@@ -624,7 +645,8 @@ def get_max_image_tokens(self) -> int:
         # Use default max_num_tiles for max tokens calculation
         max_num_tiles = 12
         target_width, target_height = self.get_image_size_with_most_features(
-            max_num_tiles)
+            max_num_tiles
+        )
 
         return self.get_num_image_tokens(
             image_width=target_width,
@@ -638,7 +660,7 @@ def get_max_image_tokens(self) -> int:
 
 
 class NanoNemotronVLProcessingInfo(BaseNanoNemotronVLProcessingInfo):
-    """ ProcessingInfo extended for video processing"""
+    """ProcessingInfo extended for video processing"""
 
     @property
     def supports_video(self):
@@ -662,8 +684,7 @@ def get_num_frames_with_most_features(
         processor = self.get_hf_processor()  # we get the CustomProcessor here
 
         max_image_tokens = self.get_max_image_tokens() * max_images
-        max_total_frames = (seq_len -
-                            max_image_tokens) // processor.num_image_token
+        max_total_frames = (seq_len - max_image_tokens) // processor.num_image_token
         max_frames_per_video = max_total_frames // max(max_videos, 1)
 
         max_frames_per_video = min(max_frames_per_video, MAX_FRAMES)
@@ -716,7 +737,8 @@ def _get_mm_fields_config(
 
         return dict(
             pixel_values_flat=MultiModalFieldConfig.flat_from_sizes(
-                "image", image_num_patches),
+                "image", image_num_patches
+            ),
             image_num_patches=MultiModalFieldConfig.batched("image"),
             image_embeds=MultiModalFieldConfig.batched("image"),
             image_token_id=MultiModalFieldConfig.shared("image", num_images),
@@ -742,7 +764,8 @@ def _get_prompt_updates(
 
         def get_replacement_custom(item_idx: int):
             images = mm_items.get_items(
-                "image", (ImageEmbeddingItems, ImageProcessorItems))
+                "image", (ImageEmbeddingItems, ImageProcessorItems)
+            )
 
             if isinstance(images, ImageEmbeddingItems):
                 feature_size = images.get_feature_size(item_idx)
@@ -761,9 +784,9 @@ def get_replacement_custom(item_idx: int):
             local_image_num_patches = image_num_patches
             if isinstance(local_image_num_patches, torch.Tensor):
                 local_image_num_patches = local_image_num_patches.tolist()
-            if isinstance(
-                    local_image_num_patches,
-                (list, tuple)) and item_idx < len(local_image_num_patches):
+            if isinstance(local_image_num_patches, (list, tuple)) and item_idx < len(
+                local_image_num_patches
+            ):
                 num_patches = int(local_image_num_patches[item_idx])
 
             return hf_processor.get_image_repl(feature_size, num_patches)
@@ -778,7 +801,8 @@ def get_replacement_custom(item_idx: int):
 
 
 class NanoNemotronVLMultiModalProcessor(
-        NanoNemotronBaseVLMultiModalProcessor[NanoNemotronVLProcessingInfo]):
+    NanoNemotronBaseVLMultiModalProcessor[NanoNemotronVLProcessingInfo]
+):
     """MultiModalProcessor extended for video support"""
 
     def _call_hf_processor(
@@ -788,12 +812,15 @@ def _call_hf_processor(
         mm_kwargs: Mapping[str, object],
         tok_kwargs: Mapping[str, object],
     ) -> BatchFeature:
-        processed_outputs = super()._call_hf_processor(prompt, mm_data,
-                                                       mm_kwargs, tok_kwargs)
+        processed_outputs = super()._call_hf_processor(
+            prompt, mm_data, mm_kwargs, tok_kwargs
+        )
 
         hf_processor = self.info.get_hf_processor(**mm_kwargs)
-        if self.info.supports_video and (
-                video_token_id := hf_processor.video_token_id) is not None:
+        if (
+            self.info.supports_video
+            and (video_token_id := hf_processor.video_token_id) is not None
+        ):
             processed_outputs["video_token_id"] = torch.tensor(video_token_id)
         return processed_outputs
 
@@ -802,18 +829,17 @@ def _get_mm_fields_config(
         hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
-        image_fields = super()._get_mm_fields_config(hf_inputs,
-                                                     hf_processor_mm_kwargs)
+        image_fields = super()._get_mm_fields_config(hf_inputs, hf_processor_mm_kwargs)
         if self.info.supports_video:
-            video_num_patches = hf_inputs.get("video_num_patches",
-                                              torch.empty(0))
+            video_num_patches = hf_inputs.get("video_num_patches", torch.empty(0))
             num_videos = len(video_num_patches)
             video_fields = dict(
                 pixel_values_flat_video=MultiModalFieldConfig.flat_from_sizes(
-                    "video", video_num_patches),
+                    "video", video_num_patches
+                ),
                 video_num_patches=MultiModalFieldConfig.batched("video"),
-                video_token_id=MultiModalFieldConfig.shared(
-                    "video", num_videos))
+                video_token_id=MultiModalFieldConfig.shared("video", num_videos),
+            )
         else:
             video_fields = {}
 
@@ -872,7 +898,7 @@ def get_video_replacement_internvl(item_idx: int):
                     modality="video",
                     target="<video>",
                     replacement=get_video_replacement_internvl,
-                )
+                ),
             ]
 
         return prompt_repl
@@ -894,23 +920,26 @@ def get_dummy_mm_data(
     ) -> MultiModalDataDict:
         # Use default max_num_tiles for dummy data generation
         max_num_tiles = 12
-        target_width, target_height = (
-            self.info.get_image_size_with_most_features(max_num_tiles))
+        target_width, target_height = self.info.get_image_size_with_most_features(
+            max_num_tiles
+        )
         num_images = mm_counts.get("image", 0)
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class NanoNemotronVLDummyInputsBuilder(
-        NanoNemotronVLDummyInputsBuilder[NanoNemotronVLProcessingInfo]):
+    NanoNemotronVLDummyInputsBuilder[NanoNemotronVLProcessingInfo]
+):
     """DummyInputsBuilder extended for video support"""
 
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
@@ -924,23 +953,25 @@ def get_dummy_mm_data(
         mm_counts: Mapping[str, int],
         mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
-        dummy_image = super().get_dummy_mm_data(seq_len=seq_len,
-                                                mm_counts=mm_counts,
-                                                mm_options=mm_options)
+        dummy_image = super().get_dummy_mm_data(
+            seq_len=seq_len, mm_counts=mm_counts, mm_options=mm_options
+        )
         if self.info.supports_video:
             config = self.info.get_hf_config()
             image_size: int = config.force_image_size
-            target_num_frames = \
-                self.info.get_num_frames_with_most_features(seq_len, mm_counts)
+            target_num_frames = self.info.get_num_frames_with_most_features(
+                seq_len, mm_counts
+            )
             num_videos = mm_counts.get("video", 0)
             video_overrides = mm_options.get("video") if mm_options else None
             dummy_video = {
-                "video":
-                self._get_dummy_videos(width=image_size,
-                                       height=image_size,
-                                       num_frames=target_num_frames,
-                                       num_videos=num_videos,
-                                       overrides=video_overrides)
+                "video": self._get_dummy_videos(
+                    width=image_size,
+                    height=image_size,
+                    num_frames=target_num_frames,
+                    num_videos=num_videos,
+                    overrides=video_overrides,
+                )
             }
         else:
             dummy_video = {}
@@ -952,9 +983,7 @@ def get_dummy_mm_data(
     info=NanoNemotronVLProcessingInfo,
     dummy_inputs=NanoNemotronVLDummyInputsBuilder,
 )
-class NemotronH_Nano_VL_V2(nn.Module, HasInnerState, IsHybrid,
-                           SupportsMultiModal):
-
+class NemotronH_Nano_VL_V2(nn.Module, HasInnerState, IsHybrid, SupportsMultiModal):
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
         if modality.startswith("image"):
@@ -972,7 +1001,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.patch_size = patch_size
         self.template = config.template
         self.num_image_token = int(
-            (image_size // patch_size)**2 * (config.downsample_ratio**2))
+            (image_size // patch_size) ** 2 * (config.downsample_ratio**2)
+        )
         self.downsample_ratio = config.downsample_ratio
         self.ps_version = config.ps_version
         self.image_tag_type = config.image_tag_type
@@ -983,7 +1013,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             prefix=maybe_prefix(prefix, "language_model"),
         )
         self.vision_model = self.get_vit_model_from_radio_config(config).to(
-            self.language_model.config.torch_dtype)
+            self.language_model.config.torch_dtype
+        )
 
         # Construct the vision projection.
         vit_hidden_size = config.vit_hidden_size
@@ -991,18 +1022,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         llm_hidden_size = config.text_config.hidden_size
 
         self.mlp1 = nn.Sequential(
-            RMSNorm(hidden_size=vit_hidden_size *
-                    int(1 / self.downsample_ratio)**2,
-                    eps=1e-5),
+            RMSNorm(
+                hidden_size=vit_hidden_size * int(1 / self.downsample_ratio) ** 2,
+                eps=1e-5,
+            ),
             nn.Linear(
-                vit_hidden_size * int(1 / self.downsample_ratio)**2,
+                vit_hidden_size * int(1 / self.downsample_ratio) ** 2,
                 vision_projection_hidden_size,
                 bias=False,
             ),
             ReLUSquaredActivation(),
-            nn.Linear(vision_projection_hidden_size,
-                      llm_hidden_size,
-                      bias=False),
+            nn.Linear(vision_projection_hidden_size, llm_hidden_size, bias=False),
         )
         self.mlp1 = self.mlp1.to(self.language_model.config.torch_dtype)
 
@@ -1043,17 +1073,16 @@ def pixel_shuffle(self, x, scale_factor=0.5):
     def extract_feature(self, pixel_values):
         vit_embeds = self.vision_model(pixel_values)
         vit_embeds = vit_embeds.to(dtype=torch.bfloat16)
-        h = w = int(vit_embeds.shape[1]**0.5)
+        h = w = int(vit_embeds.shape[1] ** 0.5)
         vit_embeds = vit_embeds.reshape(vit_embeds.shape[0], h, w, -1)
-        vit_embeds = self.pixel_shuffle(vit_embeds,
-                                        scale_factor=self.downsample_ratio)
-        vit_embeds = vit_embeds.reshape(vit_embeds.shape[0], -1,
-                                        vit_embeds.shape[-1])
+        vit_embeds = self.pixel_shuffle(vit_embeds, scale_factor=self.downsample_ratio)
+        vit_embeds = vit_embeds.reshape(vit_embeds.shape[0], -1, vit_embeds.shape[-1])
         vit_embeds = self.mlp1(vit_embeds)
         return vit_embeds
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[NanoNemotronVLImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[NanoNemotronVLImageInputs]:
         pixel_values_flat = kwargs.pop("pixel_values_flat", None)
         image_num_patches = kwargs.pop("image_num_patches", None)
         image_embeds = kwargs.pop("image_embeds", None)
@@ -1063,8 +1092,10 @@ def _parse_and_validate_image_input(
 
         if image_embeds is not None:
             if not isinstance(image_embeds, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image embeddings. "
-                                 f"Got type: {type(image_embeds)}")
+                raise ValueError(
+                    "Incorrect type of image embeddings. "
+                    f"Got type: {type(image_embeds)}"
+                )
 
             return NanoNemotronVLImageEmbeddinInputs(
                 type="image_embeds",
@@ -1077,12 +1108,16 @@ def _parse_and_validate_image_input(
 
         if pixel_values_flat is not None:
             if not isinstance(pixel_values_flat, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values_flat)}")
+                raise ValueError(
+                    "Incorrect type of pixel values. "
+                    f"Got type: {type(pixel_values_flat)}"
+                )
 
             if not isinstance(image_num_patches, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image_num_patches. "
-                                 f"Got type: {type(image_num_patches)}")
+                raise ValueError(
+                    "Incorrect type of image_num_patches. "
+                    f"Got type: {type(image_num_patches)}"
+                )
 
             pixel_values_flat = flatten_bn(pixel_values_flat, concat=True)
             image_num_patches = flatten_bn(image_num_patches, concat=True)
@@ -1108,14 +1143,12 @@ def _process_image_input(
 
         # Only one image in the current batch
         if len(num_patches) == 1:
-            return (image_embeds.view(-1,
-                                      self.config.text_config.hidden_size), )
+            return (image_embeds.view(-1, self.config.text_config.hidden_size),)
 
         # NOTE: Image embeddings are split into separate tensors for each image
         # by the size of each embedding.
         feature_size = image_embeds.shape[1]
-        image_embeds = image_embeds.view(-1,
-                                         self.config.text_config.hidden_size)
+        image_embeds = image_embeds.view(-1, self.config.text_config.hidden_size)
         image_feature_sizes = [
             num_patches * feature_size for num_patches in num_patches
         ]
@@ -1212,8 +1245,8 @@ def _create_final_video_embeddings(self, video_embeddings: torch.Tensor,
         return final_video_embeddings
 
     def _parse_and_validate_video_input(
-            self,
-            **kwargs: object) -> Optional[NanoNemotronVLVideoPixelInputs]:
+        self, **kwargs: object
+    ) -> Optional[NanoNemotronVLVideoPixelInputs]:
         pixel_values_flat_video = kwargs.pop("pixel_values_flat_video", None)
         video_num_patches = kwargs.pop("video_num_patches", None)
         video_embeds = kwargs.pop("video_embeds", None)
@@ -1233,15 +1266,18 @@ def _parse_and_validate_video_input(
 
         if pixel_values_flat_video is not None:
             if not isinstance(pixel_values_flat_video, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values_flat_video)}")
+                raise ValueError(
+                    "Incorrect type of pixel values. "
+                    f"Got type: {type(pixel_values_flat_video)}"
+                )
 
             if not isinstance(video_num_patches, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image_num_patches. "
-                                 f"Got type: {type(video_num_patches)}")
+                raise ValueError(
+                    "Incorrect type of image_num_patches. "
+                    f"Got type: {type(video_num_patches)}"
+                )
 
-            pixel_values_flat_video = flatten_bn(pixel_values_flat_video,
-                                                 concat=True)
+            pixel_values_flat_video = flatten_bn(pixel_values_flat_video, concat=True)
             video_num_patches = flatten_bn(video_num_patches, concat=True)
             expected_h = expected_w = self.config.force_image_size
             resolve_bindings = {"h": expected_h, "w": expected_w}
@@ -1260,19 +1296,17 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if input_key in ("pixel_values_flat",
-                             "image_embeds") and "images" not in modalities:
-                modalities["images"] = self._parse_and_validate_image_input(
-                    **kwargs)
-            if input_key in ("pixel_values_flat_video",
-                             ) and "videos" not in modalities:
-                modalities["videos"] = self._parse_and_validate_video_input(
-                    **kwargs)
+            if (
+                input_key in ("pixel_values_flat", "image_embeds")
+                and "images" not in modalities
+            ):
+                modalities["images"] = self._parse_and_validate_image_input(**kwargs)
+            if input_key in ("pixel_values_flat_video",) and "videos" not in modalities:
+                modalities["videos"] = self._parse_and_validate_video_input(**kwargs)
 
         return modalities
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         # Validate the multimodal input keyword arguments
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if modalities is None:
@@ -1365,16 +1399,13 @@ def is_vision_weights(name: str) -> bool:
                     default_weight_loader(param, w)
             elif is_vision_weights(name):
                 # Convert: vision_model.radio_model.* → radio_model.*
-                hf_key = name[len(
-                    "vision_model."):]  # Remove "vision_model." prefix
+                hf_key = name[len("vision_model.") :]  # Remove "vision_model." prefix
                 vision_weights.append((hf_key, w))
 
         self.language_model.load_weights(llm_weights)
         self.vision_model.load_weights(vision_weights)
 
-    def print_architecture(self,
-                           detailed: bool = True,
-                           save_to_file: str = None):
+    def print_architecture(self, detailed: bool = True, save_to_file: str = None):
         """
         Print model architecture with parameter names, shapes, and sizes.
 
@@ -1410,20 +1441,26 @@ def print_architecture(self,
                 # Group parameters by main component
                 if name.startswith("language_model"):
                     param_groups["language_model"].append(
-                        (name, param.shape, param_size, param.dtype))
+                        (name, param.shape, param_size, param.dtype)
+                    )
                 elif name.startswith("vision_model"):
                     param_groups["vision_model"].append(
-                        (name, param.shape, param_size, param.dtype))
+                        (name, param.shape, param_size, param.dtype)
+                    )
                 elif name.startswith("mlp1"):
                     param_groups["mlp1"].append(
-                        (name, param.shape, param_size, param.dtype))
+                        (name, param.shape, param_size, param.dtype)
+                    )
                 else:
                     param_groups["other"].append(
-                        (name, param.shape, param_size, param.dtype))
+                        (name, param.shape, param_size, param.dtype)
+                    )
 
                 if detailed:
-                    print(f"{name:<70} | Shape: {str(param.shape):<25} | "
-                          f"Size: {param_size:>12,} | Dtype: {param.dtype}")
+                    print(
+                        f"{name:<70} | Shape: {str(param.shape):<25} | "
+                        f"Size: {param_size:>12,} | Dtype: {param.dtype}"
+                    )
 
             print("=" * 100)
             print("Summary by Component:")
@@ -1432,11 +1469,16 @@ def print_architecture(self,
             for component, params in param_groups.items():
                 if params:  # Only show components that have parameters
                     component_total = sum(size for _, _, size, _ in params)
-                    percentage = ((component_total / total_params) *
-                                  100 if total_params > 0 else 0)
-                    print(f"{component:<20} | Parameters: {len(params):>4} | "
-                          f"Total Size: {component_total:>15,} | "
-                          f"{percentage:>6.2f}%")
+                    percentage = (
+                        (component_total / total_params) * 100
+                        if total_params > 0
+                        else 0
+                    )
+                    print(
+                        f"{component:<20} | Parameters: {len(params):>4} | "
+                        f"Total Size: {component_total:>15,} | "
+                        f"{percentage:>6.2f}%"
+                    )
 
             print("-" * 60)
             print(f"{'Total Parameters':<20} | {total_params:>15,}")
@@ -1492,10 +1534,9 @@ def get_vit_model_from_radio_config(self, hf_config):
         hf_config_vision = hf_config.vision_config
         model_name = hf_config_vision.args.get("model")
         if model_name is None:
-            raise ValueError(f'Unsupported vit model type: {model_name}')
+            raise ValueError(f"Unsupported vit model type: {model_name}")
 
-        preferred_resolution = getattr(hf_config_vision,
-                                       "preferred_resolution", None)
+        preferred_resolution = getattr(hf_config_vision, "preferred_resolution", None)
         image_size = preferred_resolution[0] if preferred_resolution else 224
         patch_size = getattr(hf_config_vision, "patch_size", 16)
 
@@ -1505,33 +1546,36 @@ def get_vit_model_from_radio_config(self, hf_config):
             patch_size=patch_size,
             norm_mean=hf_config.norm_mean,
             norm_std=hf_config.norm_std,
-            reg_tokens=(hf_config_vision.args.get("register_multiple")
-                        if hasattr(hf_config_vision, "args")
-                        and isinstance(hf_config_vision.args, dict) else None),
+            reg_tokens=(
+                hf_config_vision.args.get("register_multiple")
+                if hasattr(hf_config_vision, "args")
+                and isinstance(hf_config_vision.args, dict)
+                else None
+            ),
         )
 
         return RadioModel(config=radio_config)
 
     def copy_inputs_before_cuda_graphs(self, input_buffers, **kwargs):
         return self.language_model.mamba_cache.copy_inputs_before_cuda_graphs(
-            input_buffers, **kwargs)
+            input_buffers, **kwargs
+        )
 
     def get_seqlen_agnostic_capture_inputs(self, batch_size: int):
-        return (self.language_model.mamba_cache.
-                get_seqlen_agnostic_capture_inputs(batch_size))
+        return self.language_model.mamba_cache.get_seqlen_agnostic_capture_inputs(
+            batch_size
+        )
 
     @classmethod
     def get_mamba_state_shape_from_config(cls, vllm_config: "VllmConfig"):
         text_config = vllm_config.model_config.hf_config.text_config
         temp_vllm_config = copy.deepcopy(vllm_config)
         temp_vllm_config.model_config.hf_config = text_config
-        return NemotronHForCausalLM.get_mamba_state_shape_from_config(
-            temp_vllm_config)
+        return NemotronHForCausalLM.get_mamba_state_shape_from_config(temp_vllm_config)
 
     @classmethod
     def get_mamba_state_dtype_from_config(cls, vllm_config: "VllmConfig"):
         text_config = vllm_config.model_config.hf_config.text_config
         temp_vllm_config = copy.deepcopy(vllm_config)
         temp_vllm_config.model_config.hf_config = text_config
-        return NemotronHForCausalLM.get_mamba_state_dtype_from_config(
-            temp_vllm_config)
+        return NemotronHForCausalLM.get_mamba_state_dtype_from_config(temp_vllm_config)
diff --git a/vllm/model_executor/models/nemotron.py b/vllm/model_executor/models/nemotron.py
index 6bb2f7392cb4..8f07a2cf12f7 100644
--- a/vllm/model_executor/models/nemotron.py
+++ b/vllm/model_executor/models/nemotron.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Nemotron model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Any, Optional, Union
@@ -35,23 +36,35 @@
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs import NemotronConfig
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 # The architecture is pretty similar to Llama, with these changes:
 # - There is no gate_proj, just up_proj
@@ -65,20 +78,21 @@ def _cast_if_autocast_enabled(*args):
         return args
     else:
         return torch.amp.autocast_mode._cast(
-            args, device_type="cuda", dtype=torch.get_autocast_gpu_dtype())
+            args, device_type="cuda", dtype=torch.get_autocast_gpu_dtype()
+        )
 
 
 class NemotronLayerNorm1P(nn.LayerNorm):
-
-    def __init__(self,
-                 normalized_shape: Union[int, list[int], torch.Size],
-                 eps: float = 1e-5,
-                 elementwise_affine: bool = True,
-                 bias: bool = True,
-                 device=None,
-                 dtype=None):
-        super().__init__(normalized_shape, eps, elementwise_affine, bias,
-                         device, dtype)
+    def __init__(
+        self,
+        normalized_shape: Union[int, list[int], torch.Size],
+        eps: float = 1e-5,
+        elementwise_affine: bool = True,
+        bias: bool = True,
+        device=None,
+        dtype=None,
+    ):
+        super().__init__(normalized_shape, eps, elementwise_affine, bias, device, dtype)
 
     def forward(
         self,
@@ -88,15 +102,15 @@ def forward(
         if residual is not None:
             x = x + residual
             residual = x
-        args = _cast_if_autocast_enabled(x, self.normalized_shape,
-                                         self.weight + 1, self.bias, self.eps)
+        args = _cast_if_autocast_enabled(
+            x, self.normalized_shape, self.weight + 1, self.bias, self.eps
+        )
         with torch.amp.autocast("cuda", enabled=False):
             x = torch.nn.functional.layer_norm(*args)
             return x if residual is None else (x, residual)
 
 
 class NemotronMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -107,16 +121,20 @@ def __init__(
         prefix: str = "",
     ) -> None:
         super().__init__()
-        self.up_proj = ColumnParallelLinear(input_size=hidden_size,
-                                            output_size=intermediate_size,
-                                            bias=bias,
-                                            quant_config=quant_config,
-                                            prefix=f"{prefix}.up_proj")
-        self.down_proj = RowParallelLinear(input_size=intermediate_size,
-                                           output_size=hidden_size,
-                                           bias=bias,
-                                           quant_config=quant_config,
-                                           prefix=f"{prefix}.down_proj")
+        self.up_proj = ColumnParallelLinear(
+            input_size=hidden_size,
+            output_size=intermediate_size,
+            bias=bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.up_proj",
+        )
+        self.down_proj = RowParallelLinear(
+            input_size=intermediate_size,
+            output_size=hidden_size,
+            bias=bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.down_proj",
+        )
         self.act_fn = get_act_fn(hidden_act)
 
     def forward(self, x):
@@ -127,7 +145,6 @@ def forward(self, x):
 
 
 class NemotronAttention(nn.Module):
-
     def __init__(
         self,
         config: NemotronConfig,
@@ -194,13 +211,15 @@ def __init__(
             rope_scaling=rope_scaling,
             partial_rotary_factor=self.partial_rotary_factor,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -216,7 +235,6 @@ def forward(
 
 
 class NemotronDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: NemotronConfig,
@@ -229,21 +247,24 @@ def __init__(
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
         if rope_scaling is not None and getattr(
-                config, "original_max_position_embeddings", None):
+            config, "original_max_position_embeddings", None
+        ):
             rope_scaling["original_max_position_embeddings"] = (
-                config.original_max_position_embeddings)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+                config.original_max_position_embeddings
+            )
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         # Support abacusai/Smaug-72B-v0.1 with attention_bias
         # Support internlm/internlm-7b with bias
         attention_bias = getattr(config, "attention_bias", False) or getattr(
-            config, "bias", False)
+            config, "bias", False
+        )
         self.self_attn = NemotronAttention(
             config=config,
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
-            num_kv_heads=getattr(config, "num_key_value_heads",
-                                 config.num_attention_heads),
+            num_kv_heads=getattr(
+                config, "num_key_value_heads", config.num_attention_heads
+            ),
             rope_theta=rope_theta,
             rope_scaling=rope_scaling,
             max_position_embeddings=max_position_embeddings,
@@ -260,10 +281,12 @@ def __init__(
             bias=getattr(config, "mlp_bias", False),
             prefix=f"{prefix}.mlp",
         )
-        self.input_layernorm = NemotronLayerNorm1P(config.hidden_size,
-                                                   eps=config.norm_eps)
+        self.input_layernorm = NemotronLayerNorm1P(
+            config.hidden_size, eps=config.norm_eps
+        )
         self.post_attention_layernorm = NemotronLayerNorm1P(
-            config.hidden_size, eps=config.norm_eps)
+            config.hidden_size, eps=config.norm_eps
+        )
 
     def forward(
         self,
@@ -276,23 +299,20 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
 
 @support_torch_compile
 class NemotronModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -303,12 +323,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.config = config
         self.quant_config = quant_config
-        lora_vocab = (lora_config.lora_extra_vocab_size *
-                      (lora_config.max_loras or 1)) if lora_config else 0
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
-        if get_pp_group().is_first_rank or (config.tie_word_embeddings
-                                            and get_pp_group().is_last_rank):
+        if get_pp_group().is_first_rank or (
+            config.tie_word_embeddings and get_pp_group().is_last_rank
+        ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
@@ -318,19 +342,21 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.embed_tokens = PPMissingLayer()
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: NemotronDecoderLayer(config=config,
-                                                cache_config=cache_config,
-                                                quant_config=quant_config,
-                                                prefix=prefix),
-            prefix=f"{prefix}.layers")
+            lambda prefix: NemotronDecoderLayer(
+                config=config,
+                cache_config=cache_config,
+                quant_config=quant_config,
+                prefix=prefix,
+            ),
+            prefix=f"{prefix}.layers",
+        )
         if get_pp_group().is_last_rank:
-            self.norm = NemotronLayerNorm1P(config.hidden_size,
-                                            eps=config.norm_eps)
+            self.norm = NemotronLayerNorm1P(config.hidden_size, eps=config.norm_eps)
         else:
             self.norm = PPMissingLayer()
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -357,16 +383,14 @@ def forward(
             hidden_states, residual = layer(positions, hidden_states, residual)
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv_proj", ".q_proj", "q"),
@@ -376,18 +400,19 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -416,8 +441,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -450,8 +474,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.lora_config = lora_config
         self.quant_config = quant_config
 
-        self.model = NemotronModel(vllm_config=vllm_config,
-                                   prefix=maybe_prefix(prefix, "model"))
+        self.model = NemotronModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         if get_pp_group().is_last_rank:
             self.unpadded_vocab_size = config.vocab_size
             if lora_config:
@@ -463,7 +488,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 padding_size=DEFAULT_VOCAB_PADDING_SIZE
                 # We need bigger padding if using lora for kernel
                 # compatibility
-                if not lora_config else lora_config.lora_vocab_padding_size,
+                if not lora_config
+                else lora_config.lora_vocab_padding_size,
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
@@ -471,14 +497,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 self.lm_head.weight = self.model.embed_tokens.weight
 
             logit_scale = getattr(config, "logit_scale", 1.0)
-            self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                    config.vocab_size,
-                                                    logit_scale)
+            self.logits_processor = LogitsProcessor(
+                self.unpadded_vocab_size, config.vocab_size, logit_scale
+            )
         else:
             self.lm_head = PPMissingLayer()
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -490,8 +517,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        model_output = self.model(input_ids, positions, intermediate_tensors,
-                                  inputs_embeds)
+        model_output = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return model_output
 
     def compute_logits(
@@ -501,7 +529,6 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/nemotron_h.py b/vllm/model_executor/models/nemotron_h.py
index c89550923938..0a05c63a31ea 100644
--- a/vllm/model_executor/models/nemotron_h.py
+++ b/vllm/model_executor/models/nemotron_h.py
@@ -17,6 +17,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only NemotronH model."""
+
 from collections.abc import Iterable
 from typing import Optional
 
@@ -30,30 +31,46 @@
 from vllm.distributed.parallel_state import get_pp_group
 from vllm.model_executor.layers.activation import ReLUSquaredActivation
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.mamba.mamba_mixer2 import MambaMixer2
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
-from vllm.model_executor.models.interfaces import (HasInnerState, IsHybrid,
-                                                   SupportsLoRA, SupportsPP,
-                                                   SupportsQuant)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
+from vllm.model_executor.models.interfaces import (
+    HasInnerState,
+    IsHybrid,
+    SupportsLoRA,
+    SupportsPP,
+    SupportsQuant,
+)
 from vllm.model_executor.models.utils import (
-    AutoWeightsLoader, WeightsMapper, make_empty_intermediate_tensors_factory,
-    make_layers, maybe_prefix)
+    AutoWeightsLoader,
+    WeightsMapper,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs import NemotronHConfig
 
 
 class NemotronHMLP(nn.Module):
-
     def __init__(
         self,
         config: NemotronHConfig,
@@ -65,7 +82,7 @@ def __init__(
         super().__init__()
 
         hybrid_override_pattern = config.hybrid_override_pattern
-        mlp_index = hybrid_override_pattern[:layer_idx + 1].count("-") - 1
+        mlp_index = hybrid_override_pattern[: layer_idx + 1].count("-") - 1
         if isinstance(config.intermediate_size, list):
             if len(config.intermediate_size) == 1:
                 intermediate_size = config.intermediate_size[0]
@@ -98,7 +115,6 @@ def forward(self, x: torch.Tensor):
 
 
 class NemotronHMLPDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: NemotronHConfig,
@@ -138,7 +154,6 @@ def forward(
 
 
 class NemotronHMambaDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: NemotronHConfig,
@@ -188,7 +203,6 @@ def forward(
 
 
 class NemotronHAttention(nn.Module):
-
     def __init__(
         self,
         config: NemotronHConfig,
@@ -261,7 +275,6 @@ def forward(
 
 
 class NemotronHAttentionDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: NemotronHConfig,
@@ -310,7 +323,6 @@ def forward(
 
 @support_torch_compile
 class NemotronHModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -321,8 +333,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         lora_config = vllm_config.lora_config
 
         self.config = config
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
 
@@ -335,7 +350,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         def get_layer(prefix: str):
             layer_idx = int(prefix.rsplit(".", 1)[1])
             layer_class = ALL_DECODER_LAYER_TYPES[
-                config.hybrid_override_pattern[layer_idx]]
+                config.hybrid_override_pattern[layer_idx]
+            ]
             return layer_class(
                 config,
                 layer_idx,
@@ -346,11 +362,11 @@ def get_layer(prefix: str):
             )
 
         self.start_layer, self.end_layer, self.layers = make_layers(
-            len(config.hybrid_override_pattern),
-            get_layer,
-            prefix=f"{prefix}.layers")
+            len(config.hybrid_override_pattern), get_layer, prefix=f"{prefix}.layers"
+        )
         self.make_empty_intmd_tensors = make_empty_intermediate_tensors_factory(
-            ["hidden_states", "residual"], config.hidden_size)
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
         self.norm_f = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
@@ -364,7 +380,6 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-
         if get_pp_group().is_first_rank:
             if inputs_embeds is not None:
                 hidden_states = inputs_embeds
@@ -385,15 +400,13 @@ def forward(
             )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm_f(hidden_states, residual)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -427,22 +440,19 @@ def load_weights(self, weights: Iterable[tuple[str,
             # load other params
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
 
             loaded_params.add(name)
         return loaded_params
 
 
-class NemotronHForCausalLM(nn.Module, HasInnerState, SupportsLoRA, SupportsPP,
-                           IsHybrid, SupportsQuant):
+class NemotronHForCausalLM(
+    nn.Module, HasInnerState, SupportsLoRA, SupportsPP, IsHybrid, SupportsQuant
+):
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_prefix={"backbone": "model"},
-        orig_to_new_substr={
-            "A_log": "A",
-            "embeddings": "embed_tokens"
-        },
+        orig_to_new_substr={"A_log": "A", "embeddings": "embed_tokens"},
     )
 
     packed_modules_mapping = {
@@ -465,7 +475,6 @@ def get_mamba_state_dtype_from_config(
         cls,
         vllm_config: "VllmConfig",
     ) -> tuple[torch.dtype, torch.dtype]:
-
         return MambaStateDtypeCalculator.mamba2_state_dtype(
             vllm_config.model_config.dtype,
             vllm_config.cache_config.mamba_cache_dtype,
@@ -513,8 +522,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         self.config = config
         self.scheduler_config = scheduler_config
-        self.model = NemotronHModel(vllm_config=vllm_config,
-                                    prefix=maybe_prefix(prefix, "model"))
+        self.model = NemotronHModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.unpadded_vocab_size = config.vocab_size
         if lora_config:
             self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
@@ -525,27 +535,31 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             padding_size=DEFAULT_VOCAB_PADDING_SIZE
             # We need bigger padding if using lora for kernel
             # compatibility
-            if not lora_config else lora_config.lora_vocab_padding_size,
+            if not lora_config
+            else lora_config.lora_vocab_padding_size,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
 
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size
+        )
 
-        self.make_empty_intmd_tensors = (self.model.make_empty_intmd_tensors)
+        self.make_empty_intmd_tensors = self.model.make_empty_intmd_tensors
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs):
-
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs,
+    ):
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
 
         return hidden_states
 
@@ -556,7 +570,6 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
diff --git a/vllm/model_executor/models/nemotron_nas.py b/vllm/model_executor/models/nemotron_nas.py
index d474c8db41b2..ddd623b5de23 100644
--- a/vllm/model_executor/models/nemotron_nas.py
+++ b/vllm/model_executor/models/nemotron_nas.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only deci model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Any, Optional, Union
@@ -40,16 +41,26 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.model_executor.models.llama import LlamaAttention, LlamaMLP
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import HasNoOps, SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 def _ffn_mult_to_intermediate_size(ffn_mult: float, n_embd: int) -> int:
@@ -66,7 +77,6 @@ def _find_multiple(n: int, k: int) -> int:
 
 
 class DeciLMAttention(LlamaAttention):
-
     def __init__(
         self,
         config: LlamaConfig,
@@ -83,18 +93,34 @@ def __init__(
         prefix: str = "",
         attn_type: str = AttentionType.DECODER,
     ) -> None:
-        super().__init__(config, hidden_size, num_heads, num_kv_heads,
-                         rope_theta, rope_scaling, max_position_embeddings,
-                         quant_config, bias, bias_o_proj, cache_config, prefix,
-                         attn_type)
+        super().__init__(
+            config,
+            hidden_size,
+            num_heads,
+            num_kv_heads,
+            rope_theta,
+            rope_scaling,
+            max_position_embeddings,
+            quant_config,
+            bias,
+            bias_o_proj,
+            cache_config,
+            prefix,
+            attn_type,
+        )
 
-    def _init_rotary_emb(self, config, rope_scaling: Optional[dict[str, Any]],
-                         quant_config: Optional[QuantizationConfig]) -> None:
+    def _init_rotary_emb(
+        self,
+        config,
+        rope_scaling: Optional[dict[str, Any]],
+        quant_config: Optional[QuantizationConfig],
+    ) -> None:
         # Enables YARN for Mistral and LLaMA4 derivatives.
         is_neox_style = True
         if hasattr(config, "position_embedding_type"):
             is_neox_style = config.position_embedding_type not in [
-                "mistral_yarn", "rope_llama4"
+                "mistral_yarn",
+                "rope_llama4",
             ]
 
         self.rotary_emb = get_rope(
@@ -104,11 +130,11 @@ def _init_rotary_emb(self, config, rope_scaling: Optional[dict[str, Any]],
             base=self.rope_theta,
             rope_scaling=rope_scaling,
             is_neox_style=is_neox_style,
-            partial_rotary_factor=self.partial_rotary_factor)
+            partial_rotary_factor=self.partial_rotary_factor,
+        )
 
 
 class DeciLMDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: LlamaConfig,
@@ -126,23 +152,26 @@ def __init__(
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
         if rope_scaling is not None and getattr(
-                config, "original_max_position_embeddings", None):
+            config, "original_max_position_embeddings", None
+        ):
             rope_scaling["original_max_position_embeddings"] = (
-                config.original_max_position_embeddings)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+                config.original_max_position_embeddings
+            )
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         # Support abacusai/Smaug-72B-v0.1 with attention_bias
         # Support internlm/internlm-7b with bias
         attention_bias = getattr(config, "attention_bias", False) or getattr(
-            config, "bias", False)
+            config, "bias", False
+        )
         bias_o_proj = attention_bias
         # support internlm/internlm3-8b with qkv_bias
         if hasattr(config, "qkv_bias"):
             attention_bias = config.qkv_bias
 
         if not self._is_no_op_attention:
-            num_kv_heads = (config.num_attention_heads //
-                            block_config.attention.n_heads_in_group)
+            num_kv_heads = (
+                config.num_attention_heads // block_config.attention.n_heads_in_group
+            )
             self.self_attn = DeciLMAttention(
                 config=config,
                 hidden_size=self.hidden_size,
@@ -157,13 +186,13 @@ def __init__(
                 cache_config=cache_config,
                 prefix=f"{prefix}.self_attn",
             )
-            self.input_layernorm = RMSNorm(config.hidden_size,
-                                           eps=config.rms_norm_eps)
+            self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
         if not self._is_no_op_ffn:
             ffn_mult = block_config.ffn.ffn_mult
             intermediate_size = _ffn_mult_to_intermediate_size(
-                ffn_mult, config.hidden_size)
+                ffn_mult, config.hidden_size
+            )
 
             self.mlp = LlamaMLP(
                 hidden_size=self.hidden_size,
@@ -173,8 +202,9 @@ def __init__(
                 bias=getattr(config, "mlp_bias", False),
                 prefix=f"{prefix}.mlp",
             )
-            self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                    eps=config.rms_norm_eps)
+            self.post_attention_layernorm = RMSNorm(
+                config.hidden_size, eps=config.rms_norm_eps
+            )
 
     def forward(
         self,
@@ -187,12 +217,11 @@ def forward(
         if self._is_no_op_attention:
             pass
         else:
-            if (residual is None):
+            if residual is None:
                 residual = hidden_states
                 hidden_states = self.input_layernorm(hidden_states)
             else:
-                hidden_states, residual = self.input_layernorm(
-                    hidden_states, residual)
+                hidden_states, residual = self.input_layernorm(hidden_states, residual)
             hidden_states = self.self_attn(
                 positions=positions,
                 hidden_states=hidden_states,
@@ -201,14 +230,14 @@ def forward(
         # Fully Connected
         if not self._is_no_op_ffn:
             hidden_states, residual = self.post_attention_layernorm(
-                hidden_states, residual)
+                hidden_states, residual
+            )
             hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
 
 @support_torch_compile
 class DeciModel(nn.Module):
-
     def __init__(
         self,
         *,
@@ -226,12 +255,16 @@ def __init__(
         self.config = config
         self.quant_config = quant_config
         self.padding_idx = config.pad_token_id
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
-        if get_pp_group().is_first_rank or (config.tie_word_embeddings
-                                            and get_pp_group().is_last_rank):
+        if get_pp_group().is_first_rank or (
+            config.tie_word_embeddings and get_pp_group().is_last_rank
+        ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
@@ -261,9 +294,9 @@ def get_layer(prefix: str):
         else:
             self.norm = PPMissingLayer()
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -289,24 +322,20 @@ def forward(
         kv_cache_index = 0
         for layer in islice(self.layers, self.start_layer, self.end_layer):
             if not layer._is_no_op_attention:
-                hidden_states, residual = layer(positions, hidden_states,
-                                                residual)
+                hidden_states, residual = layer(positions, hidden_states, residual)
                 kv_cache_index += 1
             else:
-                hidden_states, residual = layer(positions, hidden_states,
-                                                residual)
+                hidden_states, residual = layer(positions, hidden_states, residual)
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv_proj", ".q_proj", "q"),
@@ -320,19 +349,19 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            if ("rotary_emb.cos_cached" in name
-                    or "rotary_emb.sin_cached" in name):
+            if "rotary_emb.cos_cached" in name or "rotary_emb.sin_cached" in name:
                 # Models trained using ColossalAI may include these tensors in
                 # the checkpoint. Skip them.
                 continue
             if self.quant_config is not None and (
-                    scale_name := self.quant_config.get_cache_scale(name)):
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
@@ -365,8 +394,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -413,8 +441,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.config = config
         self.lora_config = lora_config
 
-        self.model = self._init_model(vllm_config=vllm_config,
-                                      prefix=maybe_prefix(prefix, "model"))
+        self.model = self._init_model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
         if get_pp_group().is_last_rank:
             self.unpadded_vocab_size = config.vocab_size
@@ -428,24 +457,25 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                     DEFAULT_VOCAB_PADDING_SIZE
                     # We need bigger padding if using lora for kernel
                     # compatibility
-                    if not lora_config else
-                    lora_config.lora_vocab_padding_size),
+                    if not lora_config
+                    else lora_config.lora_vocab_padding_size
+                ),
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
             if config.tie_word_embeddings:
-                self.lm_head = self.lm_head.tie_weights(
-                    self.model.embed_tokens)
+                self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
 
             logit_scale = getattr(config, "logit_scale", 1.0)
-            self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                    config.vocab_size,
-                                                    logit_scale)
+            self.logits_processor = LogitsProcessor(
+                self.unpadded_vocab_size, config.vocab_size, logit_scale
+            )
         else:
             self.lm_head = PPMissingLayer()
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def _init_model(self, vllm_config: VllmConfig, prefix: str = ""):
         return DeciModel(vllm_config=vllm_config, prefix=prefix)
@@ -460,8 +490,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        model_output = self.model(input_ids, positions, intermediate_tensors,
-                                  inputs_embeds)
+        model_output = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return model_output
 
     def compute_logits(
@@ -471,11 +502,9 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/nemotron_vl.py b/vllm/model_executor/models/nemotron_vl.py
index e6c4c5b022dc..268644bc9249 100644
--- a/vllm/model_executor/models/nemotron_vl.py
+++ b/vllm/model_executor/models/nemotron_vl.py
@@ -22,34 +22,45 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.awq import AWQConfig
 from vllm.model_executor.models.internvl import (
-    BaseInternVLDummyInputsBuilder, BaseInternVLMultiModalProcessor,
-    BaseInternVLProcessingInfo, InternVLImageEmbeddingInputs,
-    InternVLImageInputs, InternVLImagePixelInputs, InternVLProcessor)
+    BaseInternVLDummyInputsBuilder,
+    BaseInternVLMultiModalProcessor,
+    BaseInternVLProcessingInfo,
+    InternVLImageEmbeddingInputs,
+    InternVLImageInputs,
+    InternVLImagePixelInputs,
+    InternVLProcessor,
+)
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.image import convert_image_mode
 from vllm.multimodal.processing import PromptUpdateDetails
 from vllm.sequence import IntermediateTensors
-from vllm.transformers_utils.processor import (
-    cached_image_processor_from_config)
+from vllm.transformers_utils.processor import cached_image_processor_from_config
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
 from .utils import AutoWeightsLoader, init_vllm_registered_model, maybe_prefix
 
-IMG_START = '<img>'
-IMG_END = '</img>'
-IMG_CONTEXT = '<image>'
+IMG_START = "<img>"
+IMG_END = "</img>"
+IMG_CONTEXT = "<image>"
 
 
 def build_transform(input_size: int):
-    return T.Compose([
-        T.Lambda(lambda img: convert_image_mode(img, 'RGB')),
-        T.Resize((input_size, input_size),
-                 interpolation=T.InterpolationMode.BICUBIC),
-        T.ToTensor(),
-    ])
+    return T.Compose(
+        [
+            T.Lambda(lambda img: convert_image_mode(img, "RGB")),
+            T.Resize(
+                (input_size, input_size), interpolation=T.InterpolationMode.BICUBIC
+            ),
+            T.ToTensor(),
+        ]
+    )
 
 
 # adapted from https://huggingface.co/nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1
@@ -61,15 +72,16 @@ def find_closest_aspect_ratio(
     height: int,
     image_size: int,
 ) -> tuple[int, int]:
-    best_factor = float('-inf')
+    best_factor = float("-inf")
     best_ratio = (1, 1)
     area = width * height
 
     for rw, rh in target_ratios:
         target_aspect_ratio = rw / rh
         size_factor = min((rw * rh * image_size * image_size) / area, 0.6)
-        ratio_closeness = min(target_aspect_ratio / aspect_ratio,
-                              aspect_ratio / target_aspect_ratio)
+        ratio_closeness = min(
+            target_aspect_ratio / aspect_ratio, aspect_ratio / target_aspect_ratio
+        )
         factor = size_factor * ratio_closeness
 
         if factor > best_factor:
@@ -132,10 +144,12 @@ def dynamic_preprocess_nemotron_vl(
     resized_img = image.resize((target_width, target_height))
     processed_images = []
     for i in range(blocks):
-        box = ((i % (target_width // image_size)) * image_size,
-               (i // (target_width // image_size)) * image_size,
-               ((i % (target_width // image_size)) + 1) * image_size,
-               ((i // (target_width // image_size)) + 1) * image_size)
+        box = (
+            (i % (target_width // image_size)) * image_size,
+            (i // (target_width // image_size)) * image_size,
+            ((i % (target_width // image_size)) + 1) * image_size,
+            ((i // (target_width // image_size)) + 1) * image_size,
+        )
         # split the image
         split_img = resized_img.crop(box)
         processed_images.append(split_img)
@@ -153,10 +167,13 @@ def get_nemotron_vl_target_ratios(
     min_num: int,
     max_num: int,
 ) -> list[tuple[int, int]]:
-    target_ratios = {(i, j)
-                     for n in range(min_num, max_num + 1)
-                     for i in range(1, n + 1)
-                     for j in range(1, n + 1) if min_num <= i * j <= max_num}
+    target_ratios = {
+        (i, j)
+        for n in range(min_num, max_num + 1)
+        for i in range(1, n + 1)
+        for j in range(1, n + 1)
+        if min_num <= i * j <= max_num
+    }
     return sorted(target_ratios, key=lambda x: x[0] * x[1])
 
 
@@ -184,7 +201,6 @@ def image_to_pixel_values_nemotron_vl(
 
 
 class NemotronVLProcessor(InternVLProcessor):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -215,7 +231,8 @@ def __init__(
         assert isinstance(dynamic_image_size, bool)
 
         self.num_image_token = int(
-            (image_size // patch_size)**2 * (config.downsample_ratio**2))
+            (image_size // patch_size) ** 2 * (config.downsample_ratio**2)
+        )
         self.image_size = image_size
         self.min_dynamic_patch = min_dynamic_patch
         self.max_dynamic_patch = max_dynamic_patch
@@ -267,7 +284,8 @@ def _images_to_pixel_values_lst(
                 min_num=min_num,
                 max_num=max_num,
                 use_thumbnail=self.use_thumbnail,
-            ) for image in images
+            )
+            for image in images
         ]
 
     def _preprocess_image(
@@ -288,10 +306,10 @@ def _preprocess_image(
                 dynamic_image_size=dynamic_image_size,
             )
             image_inputs = {
-                "pixel_values_flat":
-                torch.cat(pixel_values_lst),
-                "image_num_patches":
-                torch.tensor([len(item) for item in pixel_values_lst]),
+                "pixel_values_flat": torch.cat(pixel_values_lst),
+                "image_num_patches": torch.tensor(
+                    [len(item) for item in pixel_values_lst]
+                ),
             }
 
             for pixel_values in pixel_values_lst:
@@ -299,10 +317,9 @@ def _preprocess_image(
                 feature_size = num_patches * self.num_image_token
                 image_repl = self.get_image_repl(feature_size, num_patches)
                 NVL_IMAGE_CONTEXT = image_repl.full.replace(
-                    "<image>", "<NVL_IMG_CONTEXT>")
-                text = [
-                    t.replace('<image>', NVL_IMAGE_CONTEXT, 1) for t in text
-                ]
+                    "<image>", "<NVL_IMG_CONTEXT>"
+                )
+                text = [t.replace("<image>", NVL_IMAGE_CONTEXT, 1) for t in text]
             text = [t.replace("<NVL_IMG_CONTEXT>", IMG_CONTEXT) for t in text]
         return text, image_inputs
 
@@ -339,9 +356,9 @@ def get_image_processor(self, **kwargs: object):
 @MULTIMODAL_REGISTRY.register_processor(
     BaseInternVLMultiModalProcessor[NemotronVLProcessingInfo],
     info=NemotronVLProcessingInfo,
-    dummy_inputs=BaseInternVLDummyInputsBuilder[NemotronVLProcessingInfo])
-class LlamaNemotronVLChatModel(nn.Module, SupportsMultiModal, SupportsPP,
-                               SupportsLoRA):
+    dummy_inputs=BaseInternVLDummyInputsBuilder[NemotronVLProcessingInfo],
+)
+class LlamaNemotronVLChatModel(nn.Module, SupportsMultiModal, SupportsPP, SupportsLoRA):
     merge_by_field_config = True
 
     @classmethod
@@ -366,7 +383,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         patch_size = config.vision_config.patch_size
         self.patch_size = patch_size
         self.num_image_token = int(
-            (image_size // patch_size)**2 * (config.downsample_ratio**2))
+            (image_size // patch_size) ** 2 * (config.downsample_ratio**2)
+        )
         self.downsample_ratio = config.downsample_ratio
         self.ps_version = config.ps_version
 
@@ -389,18 +407,20 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
 
         self.visual_token_mask = None
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
-    def _patch_quant_config(self, config: PretrainedConfig,
-                            quant_config: QuantizationConfig):
+    def _patch_quant_config(
+        self, config: PretrainedConfig, quant_config: QuantizationConfig
+    ):
         # the awq models from OpenGVLab missing `modules_to_not_convert`
         # patch the quant_config to add `modules_to_not_convert` back
         if isinstance(quant_config, AWQConfig):
             text_config = config.text_config
-            llm_quant_config = getattr(text_config, "quantization_config",
-                                       None)
-            if (not quant_config.modules_to_not_convert) and \
-                (llm_quant_config is not None):
+            llm_quant_config = getattr(text_config, "quantization_config", None)
+            if (not quant_config.modules_to_not_convert) and (
+                llm_quant_config is not None
+            ):
                 quant_config.modules_to_not_convert.append("vision_model")
 
     def _init_vision_model(
@@ -410,8 +430,7 @@ def _init_vision_model(
         *,
         prefix: str,
     ):
-        return AutoModel.from_config(config.vision_config,
-                                     trust_remote_code=True)
+        return AutoModel.from_config(config.vision_config, trust_remote_code=True)
 
     def _init_mlp1(self, config: PretrainedConfig) -> nn.Module:
         vit_hidden_size = config.vit_hidden_size
@@ -419,11 +438,14 @@ def _init_mlp1(self, config: PretrainedConfig) -> nn.Module:
         llm_hidden_size = config.text_config.hidden_size
 
         return nn.Sequential(
-            nn.LayerNorm(vit_hidden_size * int(1 / self.downsample_ratio)**2,
-                         bias=True),
-            nn.Linear(vit_hidden_size * int(1 / self.downsample_ratio)**2,
-                      vision_projection_hidden_size,
-                      bias=True),
+            nn.LayerNorm(
+                vit_hidden_size * int(1 / self.downsample_ratio) ** 2, bias=True
+            ),
+            nn.Linear(
+                vit_hidden_size * int(1 / self.downsample_ratio) ** 2,
+                vision_projection_hidden_size,
+                bias=True,
+            ),
             nn.GELU(),
             nn.Linear(vision_projection_hidden_size, llm_hidden_size),
         )
@@ -434,9 +456,13 @@ def pixel_shuffle(self, x, scale_factor=0.5):
         x = x.view(n, w, int(h * scale_factor), int(c / scale_factor))
         # N, W, H * scale, C // scale --> N, H * scale, W, C // scale
         x = x.permute(0, 2, 1, 3).contiguous()
-        x = x.view(n, int(h * scale_factor), int(w * scale_factor),
-                   int(c / (scale_factor * scale_factor)))
-        if self.ps_version == 'v1':
+        x = x.view(
+            n,
+            int(h * scale_factor),
+            int(w * scale_factor),
+            int(c / (scale_factor * scale_factor)),
+        )
+        if self.ps_version == "v1":
             pass
         else:
             x = x.permute(0, 2, 1, 3).contiguous()
@@ -447,17 +473,16 @@ def extract_feature(self, pixel_values: torch.Tensor) -> torch.Tensor:
         vit_embeds = self.vision_model(x=pixel_values).features
         vit_embeds = vit_embeds.to(dtype=torch.bfloat16)
 
-        h = w = int(vit_embeds.shape[1]**0.5)
+        h = w = int(vit_embeds.shape[1] ** 0.5)
         vit_embeds = vit_embeds.reshape(vit_embeds.shape[0], h, w, -1)
-        vit_embeds = self.pixel_shuffle(vit_embeds,
-                                        scale_factor=self.downsample_ratio)
-        vit_embeds = vit_embeds.reshape(vit_embeds.shape[0], -1,
-                                        vit_embeds.shape[-1])
+        vit_embeds = self.pixel_shuffle(vit_embeds, scale_factor=self.downsample_ratio)
+        vit_embeds = vit_embeds.reshape(vit_embeds.shape[0], -1, vit_embeds.shape[-1])
         vit_embeds = self.mlp1(vit_embeds)
         return vit_embeds
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[InternVLImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[InternVLImageInputs]:
         pixel_values_flat = kwargs.pop("pixel_values_flat", None)
         image_num_patches = kwargs.pop("image_num_patches", None)
         image_embeds = kwargs.pop("image_embeds", None)
@@ -482,7 +507,7 @@ def _parse_and_validate_image_input(
                 num_patches=image_num_patches,
                 resolve_bindings={
                     "h": self.config.force_image_size,
-                    "w": self.config.force_image_size
+                    "w": self.config.force_image_size,
                 },
             )
 
@@ -503,14 +528,12 @@ def _process_image_input(
 
         # Only one image in the current batch
         if len(num_patches) == 1:
-            return (image_embeds.view(-1,
-                                      self.config.text_config.hidden_size), )
+            return (image_embeds.view(-1, self.config.text_config.hidden_size),)
 
         # NOTE: Image embeddings are split into separate tensors for each image
         # by the size of each embedding.
         feature_size = image_embeds.shape[1]
-        image_embeds = image_embeds.view(-1,
-                                         self.config.text_config.hidden_size)
+        image_embeds = image_embeds.view(-1, self.config.text_config.hidden_size)
         image_feature_sizes = [
             num_patches * feature_size for num_patches in num_patches
         ]
@@ -522,10 +545,11 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if input_key in ("pixel_values_flat",
-                             "image_embeds") and "images" not in modalities:
-                modalities["images"] = self._parse_and_validate_image_input(
-                    **kwargs)
+            if (
+                input_key in ("pixel_values_flat", "image_embeds")
+                and "images" not in modalities
+            ):
+                modalities["images"] = self._parse_and_validate_image_input(**kwargs)
 
         return modalities
 
@@ -535,9 +559,7 @@ def _set_visual_token_mask(self, input_ids: torch.Tensor) -> None:
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
-
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
@@ -564,8 +586,7 @@ def get_input_embeddings(
         is_multimodal: Optional[torch.Tensor] = None,
         handle_oov_mm_token: bool = False,
     ) -> torch.Tensor:
-        if multimodal_embeddings is not None and len(
-                multimodal_embeddings) > 0:
+        if multimodal_embeddings is not None and len(multimodal_embeddings) > 0:
             self._set_visual_token_mask(input_ids)
 
         # This is to satisfy the type checker for each overload
@@ -587,7 +608,6 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs: object,
     ) -> IntermediateTensors:
-
         if intermediate_tensors is not None:
             input_ids = None
             inputs_embeds = None
@@ -601,8 +621,7 @@ def forward(
 
         # Only required if the model is mono-architecture
         if self.visual_token_mask is not None:
-            forward_kwargs.update(
-                {"visual_token_mask": self.visual_token_mask})
+            forward_kwargs.update({"visual_token_mask": self.visual_token_mask})
             self.visual_token_mask = None
 
         hidden_states = self.language_model.model(**forward_kwargs)
@@ -614,8 +633,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         ## Ignore registered_buffers
         ## see https://huggingface.co/nvidia/C-RADIOv2-H/blob/main/input_conditioner.py#L28 # noqa: E501
         skip_substrs = ["norm_mean", "norm_std"]
@@ -629,4 +647,5 @@ def get_mm_mapping(self) -> MultiModelKeys:
         return MultiModelKeys.from_string_field(
             language_model="language_model",
             connector="mlp1",
-            tower_model="vision_model")
+            tower_model="vision_model",
+        )
diff --git a/vllm/model_executor/models/nvlm_d.py b/vllm/model_executor/models/nvlm_d.py
index 03b77823e969..f17bf3b09d5b 100644
--- a/vllm/model_executor/models/nvlm_d.py
+++ b/vllm/model_executor/models/nvlm_d.py
@@ -18,22 +18,30 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import MultiModalDataDict, MultiModalKwargsItems
-from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
-                                   MultiModalDataItems)
-from vllm.multimodal.processing import (PromptReplacement, PromptUpdate,
-                                        PromptUpdateDetails)
+from vllm.multimodal.parse import (
+    ImageEmbeddingItems,
+    ImageProcessorItems,
+    MultiModalDataItems,
+)
+from vllm.multimodal.processing import (
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 
 from .intern_vit import InternVisionModel
-from .internvl import (BaseInternVLDummyInputsBuilder,
-                       BaseInternVLMultiModalProcessor,
-                       BaseInternVLProcessingInfo, BaseInternVLProcessor,
-                       InternVLChatModel)
+from .internvl import (
+    BaseInternVLDummyInputsBuilder,
+    BaseInternVLMultiModalProcessor,
+    BaseInternVLProcessingInfo,
+    BaseInternVLProcessor,
+    InternVLChatModel,
+)
 
 IMG_PAD = "<|vision_pad|>"
 
 
 class NVLMProcessor(BaseInternVLProcessor):
-
     @property
     def image_token_id(self) -> int:
         return self.tokenizer.get_vocab()[IMG_PAD]
@@ -51,8 +59,9 @@ def get_image_repl(
             tile_pos_identifiers += ["<tile_global_thumbnail>"]
 
         context_size = feature_size // num_patches
-        features = "".join(identifier + IMG_PAD * context_size
-                           for identifier in tile_pos_identifiers)
+        features = "".join(
+            identifier + IMG_PAD * context_size for identifier in tile_pos_identifiers
+        )
 
         # We include the start and end as well because "<Image><tile" is
         # tokenized as ["<Image", "><", "tile"], resulting in assertion error
@@ -63,7 +72,6 @@ def get_image_repl(
 
 
 class NVLMProcessingInfo(BaseInternVLProcessingInfo):
-
     def get_hf_processor(self, **kwargs: object) -> NVLMProcessor:
         return self.ctx.init_processor(
             NVLMProcessor,
@@ -73,9 +81,7 @@ def get_hf_processor(self, **kwargs: object) -> NVLMProcessor:
         )
 
 
-class NVLMDummyInputsBuilder(BaseInternVLDummyInputsBuilder[NVLMProcessingInfo]
-                             ):
-
+class NVLMDummyInputsBuilder(BaseInternVLDummyInputsBuilder[NVLMProcessingInfo]):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -89,24 +95,22 @@ def get_dummy_mm_data(
         mm_counts: Mapping[str, int],
         mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
         num_images = mm_counts.get("image", 0)
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
-class NVLMMultiModalProcessor(
-        BaseInternVLMultiModalProcessor[NVLMProcessingInfo]):
-
+class NVLMMultiModalProcessor(BaseInternVLMultiModalProcessor[NVLMProcessingInfo]):
     def _get_prompt_updates(
         self,
         mm_items: MultiModalDataItems,
@@ -129,7 +133,8 @@ def _get_prompt_updates(
 
         def get_replacement_nvlm(item_idx: int):
             images = mm_items.get_items(
-                "image", (ImageEmbeddingItems, ImageProcessorItems))
+                "image", (ImageEmbeddingItems, ImageProcessorItems)
+            )
 
             if isinstance(images, ImageEmbeddingItems):
                 feature_size = images.get_feature_size(item_idx)
@@ -159,21 +164,24 @@ def get_replacement_nvlm(item_idx: int):
         ]
 
 
-@MULTIMODAL_REGISTRY.register_processor(NVLMMultiModalProcessor,
-                                        info=NVLMProcessingInfo,
-                                        dummy_inputs=NVLMDummyInputsBuilder)
+@MULTIMODAL_REGISTRY.register_processor(
+    NVLMMultiModalProcessor,
+    info=NVLMProcessingInfo,
+    dummy_inputs=NVLMDummyInputsBuilder,
+)
 class NVLM_D_Model(InternVLChatModel):
-
     def _init_mlp1(self, config: PretrainedConfig) -> nn.Module:
         vit_hidden_size = config.vision_config.hidden_size
         llm_intermediate_size = config.text_config.intermediate_size
         llm_hidden_size = config.text_config.hidden_size
 
         return nn.Sequential(
-            nn.LayerNorm(vit_hidden_size * int(1 / self.downsample_ratio)**2),
-            nn.Linear(vit_hidden_size * int(1 / self.downsample_ratio)**2,
-                      llm_intermediate_size,
-                      bias=False),
+            nn.LayerNorm(vit_hidden_size * int(1 / self.downsample_ratio) ** 2),
+            nn.Linear(
+                vit_hidden_size * int(1 / self.downsample_ratio) ** 2,
+                llm_intermediate_size,
+                bias=False,
+            ),
             nn.GELU(),
             nn.Linear(llm_intermediate_size, llm_hidden_size, bias=False),
         )
@@ -189,8 +197,9 @@ def _init_vision_model(
         if not is_mono:
             vision_feature_layer = config.select_layer
             if vision_feature_layer < 0:
-                num_hidden_layers = config.vision_config.num_hidden_layers \
-                    + vision_feature_layer + 1
+                num_hidden_layers = (
+                    config.vision_config.num_hidden_layers + vision_feature_layer + 1
+                )
             else:
                 num_hidden_layers = vision_feature_layer + 1
 
diff --git a/vllm/model_executor/models/olmo.py b/vllm/model_executor/models/olmo.py
index 9fa8760073c1..f334bbf9feeb 100644
--- a/vllm/model_executor/models/olmo.py
+++ b/vllm/model_executor/models/olmo.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only OLMo model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -36,21 +37,29 @@
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class OlmoAttention(nn.Module):
@@ -70,15 +79,13 @@ def __init__(
         super().__init__()
         self.config = config
         self.hidden_size = config.hidden_size
-        tensor_model_parallel_world_size = (
-            get_tensor_model_parallel_world_size())
+        tensor_model_parallel_world_size = get_tensor_model_parallel_world_size()
         self.total_num_heads = config.num_attention_heads
 
         assert self.hidden_size % self.total_num_heads == 0
         assert self.total_num_heads % tensor_model_parallel_world_size == 0
 
-        self.num_heads = (self.total_num_heads //
-                          tensor_model_parallel_world_size)
+        self.num_heads = self.total_num_heads // tensor_model_parallel_world_size
         self.head_dim = self.hidden_size // self.total_num_heads
         self.max_position_embeddings = config.max_position_embeddings
         self.rope_theta = config.rope_theta
@@ -102,12 +109,14 @@ def __init__(
             base=self.rope_theta,
         )
         self.scaling = self.head_dim**-0.5
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              scale=self.scaling,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            scale=self.scaling,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
         # Attention output projection.
         self.o_proj = RowParallelLinear(
@@ -189,28 +198,29 @@ class OlmoDecoderLayer(nn.Module):
     (plus another skip connection).
     """
 
-    def __init__(self,
-                 config: OlmoConfig,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: OlmoConfig,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         # Attention block.
-        self.self_attn = OlmoAttention(config,
-                                       cache_config,
-                                       quant_config,
-                                       prefix=f"{prefix}.self_attn")
+        self.self_attn = OlmoAttention(
+            config, cache_config, quant_config, prefix=f"{prefix}.self_attn"
+        )
 
         # MLP block.
         self.mlp = OlmoMLP(config, quant_config, prefix=f"{prefix}.mlp")
 
         # LayerNorm
-        self.input_layernorm = nn.LayerNorm(config.hidden_size,
-                                            elementwise_affine=False,
-                                            bias=False)
-        self.post_attention_layernorm = nn.LayerNorm(config.hidden_size,
-                                                     elementwise_affine=False,
-                                                     bias=False)
+        self.input_layernorm = nn.LayerNorm(
+            config.hidden_size, elementwise_affine=False, bias=False
+        )
+        self.post_attention_layernorm = nn.LayerNorm(
+            config.hidden_size, elementwise_affine=False, bias=False
+        )
 
     def forward(
         self,
@@ -233,7 +243,6 @@ def forward(
 
 @support_torch_compile
 class OlmoModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -243,19 +252,22 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.config = config
 
-        self.embed_tokens = VocabParallelEmbedding(config.vocab_size,
-                                                   config.hidden_size)
+        self.embed_tokens = VocabParallelEmbedding(
+            config.vocab_size, config.hidden_size
+        )
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: OlmoDecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
-        self.norm = nn.LayerNorm(config.hidden_size,
-                                 elementwise_affine=False,
-                                 bias=False)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.hidden_size))
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.layers",
+        )
+        self.norm = nn.LayerNorm(
+            config.hidden_size, elementwise_affine=False, bias=False
+        )
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -291,8 +303,7 @@ def forward(
         hidden_states = self.norm(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -304,7 +315,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters(remove_duplicate=False))
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -324,8 +335,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -335,6 +345,7 @@ class OlmoForCausalLM(nn.Module, SupportsPP, SupportsLoRA):
     """
     Extremely barebones HF model wrapper.
     """
+
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -352,8 +363,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
         self.config = config
-        self.model = OlmoModel(vllm_config=vllm_config,
-                               prefix=maybe_prefix(prefix, "model"))
+        self.model = OlmoModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         if config.tie_word_embeddings:
             self.lm_head = self.model.embed_tokens
         else:
@@ -367,7 +379,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             )
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -394,11 +407,11 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head.weight"]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(
+                ["lm_head.weight"] if self.config.tie_word_embeddings else None
+            ),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/olmo2.py b/vllm/model_executor/models/olmo2.py
index e7e30ee8df0f..79234cc4dd8d 100644
--- a/vllm/model_executor/models/olmo2.py
+++ b/vllm/model_executor/models/olmo2.py
@@ -42,18 +42,27 @@
 from vllm.distributed.utils import split_tensor_along_last_dim
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.interfaces import SupportsLoRA, SupportsPP
 from vllm.model_executor.models.utils import (
-    AutoWeightsLoader, extract_layer_index, is_pp_missing_parameter,
-    make_empty_intermediate_tensors_factory, make_layers, maybe_prefix)
+    AutoWeightsLoader,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs import Olmo3Config
 
@@ -78,8 +87,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         assert self.total_num_heads % self.tp_size == 0
 
         self.num_heads = self.total_num_heads // self.tp_size
-        self.total_num_kv_heads = (self.config.num_key_value_heads
-                                   or self.total_num_heads)
+        self.total_num_kv_heads = (
+            self.config.num_key_value_heads or self.total_num_heads
+        )
         if self.total_num_kv_heads >= self.tp_size:
             assert self.total_num_kv_heads % self.tp_size == 0
         else:
@@ -108,15 +118,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.total_num_kv_heads * self.head_dim,
             eps=self.config.rms_norm_eps,
         )
-        self.q_norm = RMSNorm(self.config.hidden_size,
-                              eps=self.config.rms_norm_eps)
+        self.q_norm = RMSNorm(self.config.hidden_size, eps=self.config.rms_norm_eps)
 
         self.scaling = self.head_dim**-0.5
 
         layer_idx = extract_layer_index(prefix)
         sliding_window = None
-        if ((layer_types := getattr(self.config, "layer_types", None))
-                is not None and layer_types[layer_idx] == "sliding_attention"):
+        if (
+            layer_types := getattr(self.config, "layer_types", None)
+        ) is not None and layer_types[layer_idx] == "sliding_attention":
             sliding_window = self.config.sliding_window
 
         self.attn = Attention(
@@ -132,8 +142,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         # Rotary embeddings. Rope scaling is only applied on full attention
         # layers.
-        self.rope_scaling = (self.config.rope_scaling
-                             if sliding_window is None else None)
+        self.rope_scaling = self.config.rope_scaling if sliding_window is None else None
         self.rotary_emb = get_rope(
             self.head_dim,
             rotary_dim=self.head_dim,
@@ -151,16 +160,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             prefix=f"{prefix}.o_proj",
         )
 
-    def _apply_qk_norm(self, q: torch.Tensor,
-                       k: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+    def _apply_qk_norm(
+        self, q: torch.Tensor, k: torch.Tensor
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         if self.tp_size > 1:
             q = tensor_model_parallel_all_gather(q.contiguous())
             k = tensor_model_parallel_all_gather(k.contiguous())
         q = self.q_norm(q)
         k = self.k_norm(k)
         if self.tp_size > 1:
-            splitter = partial(split_tensor_along_last_dim,
-                               num_partitions=self.tp_size)
+            splitter = partial(split_tensor_along_last_dim, num_partitions=self.tp_size)
             q = splitter(q)[self.tp_rank]
             k = splitter(k)[self.tp_rank]
         return q, k
@@ -236,18 +245,21 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         assert isinstance(config, (Olmo2Config, Olmo3Config))
         # Attention block.
-        self.self_attn = Olmo2Attention(vllm_config=vllm_config,
-                                        prefix=f"{prefix}.self_attn")
+        self.self_attn = Olmo2Attention(
+            vllm_config=vllm_config, prefix=f"{prefix}.self_attn"
+        )
 
         # MLP block.
         self.mlp = Olmo2MLP(vllm_config=vllm_config, prefix=f"{prefix}.mlp")
 
         # LayerNorm
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
-        self.post_feedforward_layernorm = RMSNorm(config.hidden_size,
-                                                  eps=config.rms_norm_eps)
+        self.post_feedforward_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -270,7 +282,6 @@ def forward(
 
 @support_torch_compile
 class Olmo2Model(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         self.config = vllm_config.model_config.hf_config
@@ -283,17 +294,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
         self.start_layer, self.end_layer, self.layers = make_layers(
             self.config.num_hidden_layers,
-            lambda prefix: Olmo2DecoderLayer(vllm_config=vllm_config,
-                                             prefix=prefix),
+            lambda prefix: Olmo2DecoderLayer(vllm_config=vllm_config, prefix=prefix),
             prefix=f"{prefix}.layers",
         )
         self.norm = RMSNorm(
             self.config.hidden_size,
             eps=self.config.rms_norm_eps,
         )
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    self.config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], self.config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -334,8 +344,7 @@ def forward(
         hidden_states = self.norm(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -366,8 +375,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if name.endswith(".bias") and name not in params_dict:
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -377,6 +385,7 @@ class Olmo2ForCausalLM(nn.Module, SupportsPP, SupportsLoRA):
     """
     Extremely barebones HF model wrapper.
     """
+
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -394,8 +403,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         assert isinstance(config, (Olmo2Config, Olmo3Config))
         self.config = config
-        self.model = Olmo2Model(vllm_config=vllm_config,
-                                prefix=maybe_prefix(prefix, "model"))
+        self.model = Olmo2Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         if config.tie_word_embeddings:
             self.lm_head = self.model.embed_tokens
         else:
@@ -409,7 +419,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             )
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -439,7 +450,8 @@ def compute_logits(
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head.weight"]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(
+                ["lm_head.weight"] if self.config.tie_word_embeddings else None
+            ),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/olmoe.py b/vllm/model_executor/models/olmoe.py
index 77ece544d490..90ec1a890417 100644
--- a/vllm/model_executor/models/olmoe.py
+++ b/vllm/model_executor/models/olmoe.py
@@ -13,6 +13,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only OLMoE model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from functools import partial
 from itertools import islice
@@ -25,28 +26,39 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
-from vllm.distributed import (get_pp_group, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_gather)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_gather,
+)
 from vllm.distributed.utils import split_tensor_along_last_dim
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
@@ -60,33 +72,36 @@ class OlmoeMoE(nn.Module):
     across ranks.
     """
 
-    def __init__(self,
-                 num_experts: int,
-                 top_k: int,
-                 hidden_size: int,
-                 intermediate_size: int,
-                 params_dtype: Optional[torch.dtype] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 tp_size: Optional[int] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        num_experts: int,
+        top_k: int,
+        hidden_size: int,
+        intermediate_size: int,
+        params_dtype: Optional[torch.dtype] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        tp_size: Optional[int] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.hidden_size = hidden_size
 
         # Gate always runs at half / full precision for now.
-        self.gate = ReplicatedLinear(hidden_size,
-                                     num_experts,
-                                     bias=False,
-                                     quant_config=None)
-
-        self.experts = FusedMoE(num_experts=num_experts,
-                                top_k=top_k,
-                                hidden_size=hidden_size,
-                                intermediate_size=intermediate_size,
-                                reduce_results=True,
-                                renormalize=False,
-                                quant_config=quant_config,
-                                tp_size=tp_size,
-                                prefix=f"{prefix}.experts")
+        self.gate = ReplicatedLinear(
+            hidden_size, num_experts, bias=False, quant_config=None
+        )
+
+        self.experts = FusedMoE(
+            num_experts=num_experts,
+            top_k=top_k,
+            hidden_size=hidden_size,
+            intermediate_size=intermediate_size,
+            reduce_results=True,
+            renormalize=False,
+            quant_config=quant_config,
+            tp_size=tp_size,
+            prefix=f"{prefix}.experts",
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         # NOTE: hidden_states can have either 1D or 2D shape.
@@ -95,13 +110,13 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         hidden_states = hidden_states.view(-1, hidden_dim)
         # router_logits: (num_tokens, n_experts)
         router_logits, _ = self.gate(hidden_states)
-        final_hidden_states = self.experts(hidden_states=hidden_states,
-                                           router_logits=router_logits)
+        final_hidden_states = self.experts(
+            hidden_states=hidden_states, router_logits=router_logits
+        )
         return final_hidden_states.view(orig_shape)
 
 
 class OlmoeAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -148,8 +163,7 @@ def __init__(
         self.tp_size = tp_size
         self.tp_rank = get_tensor_model_parallel_rank()
         self.q_norm = RMSNorm(self.total_num_heads * self.head_dim, eps=1e-5)
-        self.k_norm = RMSNorm(self.total_num_kv_heads * self.head_dim,
-                              eps=1e-5)
+        self.k_norm = RMSNorm(self.total_num_kv_heads * self.head_dim, eps=1e-5)
         self.o_proj = RowParallelLinear(
             self.total_num_heads * self.head_dim,
             hidden_size,
@@ -165,24 +179,26 @@ def __init__(
             rope_scaling=rope_scaling,
             is_neox_style=True,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
-
-    def _apply_qk_norm(self, q: torch.Tensor,
-                       k: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
+
+    def _apply_qk_norm(
+        self, q: torch.Tensor, k: torch.Tensor
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         if self.tp_size > 1:
             q = tensor_model_parallel_all_gather(q.contiguous())
             k = tensor_model_parallel_all_gather(k.contiguous())
         q = self.q_norm(q)
         k = self.k_norm(k)
         if self.tp_size > 1:
-            splitter = partial(split_tensor_along_last_dim,
-                               num_partitions=self.tp_size)
+            splitter = partial(split_tensor_along_last_dim, num_partitions=self.tp_size)
             q = splitter(q)[self.tp_rank]
             k = splitter(k)[self.tp_rank]
         return q, k
@@ -202,7 +218,6 @@ def forward(
 
 
 class OlmoeDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: OlmoeConfig,
@@ -214,8 +229,7 @@ def __init__(
         self.hidden_size = config.hidden_size
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          4096)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 4096)
 
         self.self_attn = OlmoeAttention(
             hidden_size=self.hidden_size,
@@ -251,8 +265,7 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
 
         hidden_states = self.self_attn(
             positions=positions,
@@ -260,15 +273,13 @@ def forward(
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
 
 @support_torch_compile
 class OlmoeModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -285,13 +296,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: OlmoeDecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.layers",
+        )
         self.norm = RMSNorm(config.hidden_size, eps=1e-5)
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -322,10 +335,9 @@ def forward(
             )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
@@ -337,10 +349,10 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
             ckpt_gate_proj_name="gate_proj",
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
-            num_experts=self.config.num_experts)
+            num_experts=self.config.num_experts,
+        )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -354,7 +366,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         loaded_params: set[str] = set()
         expert_params_mapping = self.get_expert_mapping()
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 # Skip non-stacked layers and experts (experts handled below).
                 if weight_name not in name:
                     continue
@@ -391,11 +403,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
                     param = params_dict[name]
                     weight_loader = param.weight_loader
-                    weight_loader(param,
-                                  loaded_weight,
-                                  name,
-                                  shard_id=shard_id,
-                                  expert_id=expert_id)
+                    weight_loader(
+                        param,
+                        loaded_weight,
+                        name,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                    )
                     break
                 else:
                     # Skip loading extra bias for GPTQ models.
@@ -407,7 +421,8 @@ def load_weights(self, weights: Iterable[tuple[str,
                     # Remapping the name of FP8 kv-scale.
                     if name.endswith("kv_scale"):
                         remapped_kv_scale_name = name.replace(
-                            ".kv_scale", ".attn.kv_scale")
+                            ".kv_scale", ".attn.kv_scale"
+                        )
                         if remapped_kv_scale_name not in params_dict:
                             logger.warning_once(
                                 "Found kv scale in the checkpoint (e.g. %s), but not found the expected name in the model (e.g. %s). kv-scale is not loaded.",  # noqa: E501
@@ -419,8 +434,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                             name = remapped_kv_scale_name
 
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -445,16 +461,20 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.model = OlmoeModel(vllm_config=vllm_config,
-                                prefix=maybe_prefix(prefix, "model"))
-        self.lm_head = ParallelLMHead(config.vocab_size,
-                                      config.hidden_size,
-                                      quant_config=quant_config,
-                                      prefix=maybe_prefix(prefix, "lm_head"))
+        self.model = OlmoeModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
+        self.lm_head = ParallelLMHead(
+            config.vocab_size,
+            config.hidden_size,
+            quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
         self.logits_processor = LogitsProcessor(config.vocab_size)
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -466,16 +486,16 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(self, hidden_states: torch.Tensor) -> torch.Tensor:
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
 
diff --git a/vllm/model_executor/models/opt.py b/vllm/model_executor/models/opt.py
index c4746166471c..eadfea6084e5 100644
--- a/vllm/model_executor/models/opt.py
+++ b/vllm/model_executor/models/opt.py
@@ -19,6 +19,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only OPT model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -32,25 +33,33 @@
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, WeightsMapper, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class OPTLearnedPositionalEmbedding(nn.Embedding):
-
     def __init__(self, num_embeddings: int, embedding_dim: int):
         # OPT is set up so that if padding_idx is specified then offset the
         # embedding ids by 2 and adjust num_embeddings appropriately. Other
@@ -63,7 +72,6 @@ def forward(self, positions: torch.Tensor):
 
 
 class OPTAttention(nn.Module):
-
     def __init__(
         self,
         embed_dim: int,
@@ -75,8 +83,7 @@ def __init__(
     ) -> None:
         super().__init__()
         self.embed_dim = embed_dim
-        tensor_model_parallel_world_size = (
-            get_tensor_model_parallel_world_size())
+        tensor_model_parallel_world_size = get_tensor_model_parallel_world_size()
         total_num_heads = num_heads
         assert num_heads % tensor_model_parallel_world_size == 0
         self.num_heads = total_num_heads // tensor_model_parallel_world_size
@@ -98,12 +105,14 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.out_proj",
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              scale=self.scaling,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            scale=self.scaling,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -117,7 +126,6 @@ def forward(
 
 
 class OPTDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: OPTConfig,
@@ -139,8 +147,8 @@ def __init__(
         self.do_layer_norm_before = config.do_layer_norm_before
 
         self.self_attn_layer_norm = nn.LayerNorm(
-            self.embed_dim,
-            elementwise_affine=config.layer_norm_elementwise_affine)
+            self.embed_dim, elementwise_affine=config.layer_norm_elementwise_affine
+        )
         self.fc1 = ColumnParallelLinear(
             self.embed_dim,
             config.ffn_dim,
@@ -157,8 +165,8 @@ def __init__(
             prefix=f"{prefix}.fc2",
         )
         self.final_layer_norm = nn.LayerNorm(
-            self.embed_dim,
-            elementwise_affine=config.layer_norm_elementwise_affine)
+            self.embed_dim, elementwise_affine=config.layer_norm_elementwise_affine
+        )
 
     def forward(
         self,
@@ -191,7 +199,6 @@ def forward(
 
 
 class OPTDecoder(nn.Module):
-
     def __init__(
         self,
         config: OPTConfig,
@@ -210,24 +217,29 @@ def __init__(
         )
         # Positional embeddings are replicated (not sharded).
         self.embed_positions = OPTLearnedPositionalEmbedding(
-            config.max_position_embeddings, config.hidden_size)
+            config.max_position_embeddings, config.hidden_size
+        )
 
         # Project out & in will be replicated if they exist.
         if config.word_embed_proj_dim != config.hidden_size:
-            self.project_out = ReplicatedLinear(config.hidden_size,
-                                                config.word_embed_proj_dim,
-                                                bias=False,
-                                                quant_config=quant_config,
-                                                prefix=f"{prefix}.project_out")
+            self.project_out = ReplicatedLinear(
+                config.hidden_size,
+                config.word_embed_proj_dim,
+                bias=False,
+                quant_config=quant_config,
+                prefix=f"{prefix}.project_out",
+            )
         else:
             self.project_out = None
 
         if config.word_embed_proj_dim != config.hidden_size:
-            self.project_in = ReplicatedLinear(config.word_embed_proj_dim,
-                                               config.hidden_size,
-                                               bias=False,
-                                               quant_config=quant_config,
-                                               prefix=f"{prefix}.project_in")
+            self.project_in = ReplicatedLinear(
+                config.word_embed_proj_dim,
+                config.hidden_size,
+                bias=False,
+                quant_config=quant_config,
+                prefix=f"{prefix}.project_in",
+            )
         else:
             self.project_in = None
 
@@ -238,15 +250,18 @@ def __init__(
         if config.do_layer_norm_before and not config._remove_final_layer_norm:
             self.final_layer_norm = nn.LayerNorm(
                 config.hidden_size,
-                elementwise_affine=config.layer_norm_elementwise_affine)
+                elementwise_affine=config.layer_norm_elementwise_affine,
+            )
         else:
             self.final_layer_norm = None
 
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: OPTDecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.layers",
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -283,7 +298,6 @@ def forward(
 
 @support_torch_compile
 class OPTModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -291,13 +305,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         cache_config = vllm_config.cache_config
         quant_config = vllm_config.quant_config
 
-        self.decoder = OPTDecoder(config,
-                                  cache_config,
-                                  quant_config,
-                                  prefix=f"{prefix}.decoder")
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.hidden_size))
+        self.decoder = OPTDecoder(
+            config, cache_config, quant_config, prefix=f"{prefix}.decoder"
+        )
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.decoder.get_input_embeddings(input_ids)
@@ -309,13 +322,11 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors],
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        return self.decoder(input_ids,
-                            positions,
-                            intermediate_tensors,
-                            inputs_embeds=inputs_embeds)
+        return self.decoder(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -325,7 +336,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters(remove_duplicate=False))
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -345,8 +356,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -357,9 +367,11 @@ class OPTForCausalLM(nn.Module, SupportsPP, SupportsLoRA):
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
     }
 
-    hf_to_vllm_mapper = WeightsMapper(orig_to_new_prefix={
-        "decoder.": "model.decoder.",
-    })
+    hf_to_vllm_mapper = WeightsMapper(
+        orig_to_new_prefix={
+            "decoder.": "model.decoder.",
+        }
+    )
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
@@ -367,18 +379,21 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.model = OPTModel(vllm_config=vllm_config,
-                              prefix=maybe_prefix(prefix, "model"))
+        self.model = OPTModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         if self.config.tie_word_embeddings:
             self.lm_head = self.model.decoder.embed_tokens
         else:
-            self.lm_head = ParallelLMHead(config.vocab_size,
-                                          config.word_embed_proj_dim,
-                                          prefix=maybe_prefix(
-                                              prefix, "lm_head"))
+            self.lm_head = ParallelLMHead(
+                config.vocab_size,
+                config.word_embed_proj_dim,
+                prefix=maybe_prefix(prefix, "lm_head"),
+            )
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -390,8 +405,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -401,11 +417,11 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head.weight"]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(
+                ["lm_head.weight"] if self.config.tie_word_embeddings else None
+            ),
         )
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
diff --git a/vllm/model_executor/models/orion.py b/vllm/model_executor/models/orion.py
index 586fea343d6f..0ce172938955 100644
--- a/vllm/model_executor/models/orion.py
+++ b/vllm/model_executor/models/orion.py
@@ -6,6 +6,7 @@
 # Copyright (c) OrionStar Inc.
 # LICENSE: https://huggingface.co/OrionStarAI/Orion-14B-Base/blob/main/LICENSE
 """Inference-only Orion-14B model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Any, Optional, Union
@@ -19,25 +20,32 @@
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class OrionMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -47,16 +55,15 @@ def __init__(
     ) -> None:
         super().__init__()
         self.gate_up_proj = MergedColumnParallelLinear(
-            hidden_size, [intermediate_size] * 2,
-            bias=False,
-            quant_config=quant_config)
-        self.down_proj = RowParallelLinear(intermediate_size,
-                                           hidden_size,
-                                           bias=False,
-                                           quant_config=quant_config)
+            hidden_size, [intermediate_size] * 2, bias=False, quant_config=quant_config
+        )
+        self.down_proj = RowParallelLinear(
+            intermediate_size, hidden_size, bias=False, quant_config=quant_config
+        )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -67,7 +74,6 @@ def forward(self, x):
 
 
 class OrionAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -125,13 +131,15 @@ def __init__(
             base=rope_theta,
             rope_scaling=rope_scaling,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -147,7 +155,6 @@ def forward(
 
 
 class OrionDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -159,8 +166,7 @@ def __init__(
         self.hidden_size = config.hidden_size
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         self.self_attn = OrionAttention(
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
@@ -179,10 +185,10 @@ def __init__(
             quant_config=quant_config,
         )
 
-        self.input_layernorm = nn.LayerNorm(config.hidden_size,
-                                            eps=config.rms_norm_eps)
-        self.post_attention_layernorm = nn.LayerNorm(config.hidden_size,
-                                                     eps=config.rms_norm_eps)
+        self.input_layernorm = nn.LayerNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = nn.LayerNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -209,7 +215,6 @@ def forward(
 
 @support_torch_compile
 class OrionModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -226,13 +231,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: OrionDecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.layers",
+        )
         self.norm = nn.LayerNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory([
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            [
                 "hidden_states",
-            ], config.hidden_size))
+            ],
+            config.hidden_size,
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -255,14 +264,15 @@ def forward(
         for layer in islice(self.layers, self.start_layer, self.end_layer):
             hidden_states = layer(positions, hidden_states)
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-            })
+            return IntermediateTensors(
+                {
+                    "hidden_states": hidden_states,
+                }
+            )
         hidden_states = self.norm(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -274,7 +284,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -294,32 +304,34 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class OrionForCausalLM(nn.Module, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.model = OrionModel(vllm_config=vllm_config,
-                                prefix=maybe_prefix(prefix, "model"))
-        self.lm_head = ParallelLMHead(config.vocab_size,
-                                      config.hidden_size,
-                                      quant_config=quant_config,
-                                      prefix=maybe_prefix(prefix, "lm_head"))
+        self.model = OrionModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
+        self.lm_head = ParallelLMHead(
+            config.vocab_size,
+            config.hidden_size,
+            quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
         if self.config.tie_word_embeddings:
             self.lm_head.weight = self.model.embed_tokens.weight
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -331,8 +343,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -342,7 +355,6 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/ovis.py b/vllm/model_executor/models/ovis.py
index f8674b4f0e3f..08ce8c5d83a6 100644
--- a/vllm/model_executor/models/ovis.py
+++ b/vllm/model_executor/models/ovis.py
@@ -16,7 +16,8 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
-""" PyTorch Ovis model."""
+"""PyTorch Ovis model."""
+
 import math
 from collections.abc import Iterable, Mapping
 from typing import Annotated, Literal, Optional, Union
@@ -33,15 +34,24 @@
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.models.aimv2 import AIMv2Model
 from vllm.model_executor.models.siglip import SiglipVisionModel
-from vllm.model_executor.models.utils import (AutoWeightsLoader, flatten_bn,
-                                              init_vllm_registered_model,
-                                              maybe_prefix)
+from vllm.model_executor.models.utils import (
+    AutoWeightsLoader,
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
 from vllm.multimodal.parse import ImageSize, MultiModalDataItems
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.processors.ovis import OvisProcessor
@@ -74,7 +84,6 @@ def st_argmax(y_soft: torch.Tensor, dim: int):  # straight-through softmax
 
 
 class VisualTokenizer(torch.nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -92,12 +101,15 @@ def __init__(
         head_dim = config.vocab_size - len(IMAGE_INDICATOR_IDS)
         self.head = torch.nn.Sequential(
             ReplicatedLinear(
-                config.backbone_config.hidden_size * config.hidden_stride *
-                config.hidden_stride,
+                config.backbone_config.hidden_size
+                * config.hidden_stride
+                * config.hidden_stride,
                 head_dim,
                 bias=False,
                 return_bias=False,
-            ), torch.nn.LayerNorm(head_dim))
+            ),
+            torch.nn.LayerNorm(head_dim),
+        )
 
     def _init_backbone(
         self,
@@ -120,8 +132,7 @@ def _init_backbone(
                 quant_config=quant_config,
                 prefix=prefix,
             )
-        raise ValueError(
-            f"Unsupported visual tokenizer model_type: {model_type}")
+        raise ValueError(f"Unsupported visual tokenizer model_type: {model_type}")
 
     @property
     def dtype(self) -> torch.dtype:
@@ -132,16 +143,17 @@ def device(self) -> torch.device:
         return next(self.head.parameters()).device
 
     def tokenize(self, logits: torch.Tensor) -> torch.Tensor:
-        if self.config.tokenize_function == 'softmax':
+        if self.config.tokenize_function == "softmax":
             tokens = softmax(logits, dim=-1)
-        elif self.config.tokenize_function == 'gumbel_argmax':
+        elif self.config.tokenize_function == "gumbel_argmax":
             tokens = gumbel_softmax(logits, tau=self.config.tau, hard=True)
-        elif self.config.tokenize_function == 'st_argmax':
+        elif self.config.tokenize_function == "st_argmax":
             tokens = st_argmax(logits, dim=-1)
         else:
             raise ValueError(
-                'Invalid `max_type`, expected softmax or gumbel_argmax '
-                f'or st_argmax, but got {self.config.tokenize_function}')
+                "Invalid `max_type`, expected softmax or gumbel_argmax "
+                f"or st_argmax, but got {self.config.tokenize_function}"
+            )
         return tokens
 
     def encode(self, pixel_values: torch.Tensor) -> torch.Tensor:
@@ -158,25 +170,30 @@ def encode(self, pixel_values: torch.Tensor) -> torch.Tensor:
             n, L, d = features.shape
             sqrt_l = int(L**0.5)
             assert sqrt_l**2 == L, (
-                "The token sequence length should be a perfect square.")
+                "The token sequence length should be a perfect square."
+            )
             features = features.reshape(n, sqrt_l, sqrt_l, d)
-            pl = (self.config.hidden_stride -
-                  (sqrt_l %
-                   self.config.hidden_stride)) % self.config.hidden_stride
+            pl = (
+                self.config.hidden_stride - (sqrt_l % self.config.hidden_stride)
+            ) % self.config.hidden_stride
             features = pad(features, (0, 0, 0, pl, 0, pl), "constant", 0)
             sqrt_l += pl
-            features = features.reshape(n, sqrt_l // self.config.hidden_stride,
-                                        self.config.hidden_stride,
-                                        sqrt_l // self.config.hidden_stride,
-                                        self.config.hidden_stride, d)
+            features = features.reshape(
+                n,
+                sqrt_l // self.config.hidden_stride,
+                self.config.hidden_stride,
+                sqrt_l // self.config.hidden_stride,
+                self.config.hidden_stride,
+                d,
+            )
             # [n, sqrt_l/hs, sqrt_l/hs, hs, hs, d]
             features = features.permute(0, 1, 3, 2, 4, 5)
             # [n, sqrt_l/hs, sqrt_l/hs, hs*hs*d]
             features = features.flatten(3)
             # [n, sqrt_l/hs*sqrt_l/hs, hs*hs*d]
             features = features.reshape(
-                n, -1,
-                self.config.hidden_stride * self.config.hidden_stride * d)
+                n, -1, self.config.hidden_stride * self.config.hidden_stride * d
+            )
 
         return features
 
@@ -206,23 +223,25 @@ class OvisImagePatchInputs(TensorSchema):
         - patches_per_image: List of number of total patches for each image
           in the batch.
     """
+
     type: Literal["image_patches"]
-    flat_data: Annotated[torch.Tensor,
-                         TensorShape("batch_patches", "patch_size")]
+    flat_data: Annotated[torch.Tensor, TensorShape("batch_patches", "patch_size")]
     indicator_tokens: Annotated[torch.Tensor, TensorShape("patch_indicators")]
-    patches_per_image: Annotated[list[int],
-                                 TensorShape("num_patches_per_image")]
+    patches_per_image: Annotated[list[int], TensorShape("num_patches_per_image")]
     # This is used to restore the first two dimensions of `flat_data`.
 
 
 class VisualEmbedding(torch.nn.Embedding):
-
     def __init__(self, *args, **kwargs):
         super().__init__(*args, **kwargs)
 
     def forward(self, visual_tokens: Tensor) -> Tensor:
         if visual_tokens.dtype in [
-                torch.int8, torch.int16, torch.int32, torch.int64, torch.long
+            torch.int8,
+            torch.int16,
+            torch.int32,
+            torch.int64,
+            torch.long,
         ]:
             return super().forward(visual_tokens)
         return torch.matmul(visual_tokens, self.weight)
@@ -237,7 +256,6 @@ def dtype(self):
 
 
 class OvisProcessingInfo(BaseProcessingInfo):
-
     def get_hf_processor(self, **kwargs: object):
         return self.ctx.get_hf_processor(
             OvisProcessor,
@@ -254,9 +272,10 @@ def get_image_segment_len(self) -> int:
         patch_grid_length = math.ceil(image_size / patch_size)
         assert patch_grid_length % hidden_stride == 0, (
             f"patch_grid_length {patch_grid_length} is not divisible by "
-            f"hidden_stride {hidden_stride}")
+            f"hidden_stride {hidden_stride}"
+        )
         # minus 1 for presented image token
-        return (patch_grid_length // hidden_stride)**2 - 1
+        return (patch_grid_length // hidden_stride) ** 2 - 1
 
     def get_image_pad_token(self) -> str:
         hf_text_config = self.get_hf_config().get_text_config()
@@ -275,7 +294,6 @@ def get_image_size_with_most_features(self) -> ImageSize:
 
 
 class OvisDummyInputsBuilder(BaseDummyInputsBuilder[OvisProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
         return IMAGE_TOKEN * num_images
@@ -288,29 +306,28 @@ def get_dummy_mm_data(
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         mm_data = {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
         }
         return mm_data
 
 
 class OvisMultiModalProcessor(BaseMultiModalProcessor[OvisProcessingInfo]):
-
     def image_indicators_to_visual_tokens(
         self,
         image_indicators: list[int],
     ) -> list[int]:
         """
-        Filter image indicators placeholders and convert them to corresponding 
+        Filter image indicators placeholders and convert them to corresponding
         tokens in visual tokenizer.
         For example, [-301, -300, -302, -300, -303, -300, -304, -300, -305]
         should return [vocab_size-1, vocab_size-2, ..., vocab_size-5]
@@ -356,7 +373,6 @@ def _apply_hf_processor_tokens_only(
         self,
         prompt_tokens: list[int],
     ) -> list[int]:
-
         return prompt_tokens
 
     def _get_mm_fields_config(
@@ -364,9 +380,11 @@ def _get_mm_fields_config(
         hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
-        return dict(pixel_values=MultiModalFieldConfig.batched("image"),
-                    grids=MultiModalFieldConfig.batched("image"),
-                    indicator_tokens=MultiModalFieldConfig.batched("image"))
+        return dict(
+            pixel_values=MultiModalFieldConfig.batched("image"),
+            grids=MultiModalFieldConfig.batched("image"),
+            indicator_tokens=MultiModalFieldConfig.batched("image"),
+        )
 
     def _get_prompt_updates(
         self,
@@ -374,7 +392,6 @@ def _get_prompt_updates(
         hf_processor_mm_kwargs: Mapping[str, object],
         out_mm_kwargs: MultiModalKwargsItems,
     ) -> list[PromptReplacement]:
-
         def get_replacement_ovis(item_idx: int):
             out_item = out_mm_kwargs["image"][item_idx]
             grid = out_item["grids"].data
@@ -391,11 +408,12 @@ def get_replacement_ovis(item_idx: int):
         ]
 
 
-@MULTIMODAL_REGISTRY.register_processor(OvisMultiModalProcessor,
-                                        info=OvisProcessingInfo,
-                                        dummy_inputs=OvisDummyInputsBuilder)
+@MULTIMODAL_REGISTRY.register_processor(
+    OvisMultiModalProcessor,
+    info=OvisProcessingInfo,
+    dummy_inputs=OvisDummyInputsBuilder,
+)
 class Ovis(nn.Module, SupportsMultiModal, SupportsPP):
-
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
         if modality.startswith("image"):
@@ -421,17 +439,19 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
 
         self.vte = VisualEmbedding(
-            self.config.visual_tokenizer_config.vocab_size,
-            self.config.hidden_size)
+            self.config.visual_tokenizer_config.vocab_size, self.config.hidden_size
+        )
 
         text_model_type = self.config.get_text_config().model_type
         self.image_pad_token_id = IMAGE_PAD_TOKEN_ID_MAP[text_model_type]
 
         self.make_empty_intermediate_tensors = (
-            self.get_language_model().make_empty_intermediate_tensors)
+            self.get_language_model().make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[OvisImagePatchInputs]:
+        self, **kwargs: object
+    ) -> Optional[OvisImagePatchInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         indicator_tokens = kwargs.pop("indicator_tokens", None)
 
@@ -440,12 +460,15 @@ def _parse_and_validate_image_input(
 
         if pixel_values is not None and indicator_tokens is not None:
             if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values)}")
+                raise ValueError(
+                    f"Incorrect type of pixel values. Got type: {type(pixel_values)}"
+                )
 
             if not isinstance(indicator_tokens, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of indicator_tokens. "
-                                 f"Got type: {type(pixel_values)}")
+                raise ValueError(
+                    "Incorrect type of indicator_tokens. "
+                    f"Got type: {type(pixel_values)}"
+                )
 
             flat_data = flatten_bn(pixel_values, concat=True)
             if flat_data.ndim >= 3:
@@ -453,49 +476,46 @@ def _parse_and_validate_image_input(
             return OvisImagePatchInputs(
                 type="image_patches",
                 flat_data=flat_data,
-                patches_per_image=[
-                    x.shape[0] for x in flatten_bn(pixel_values)
-                ],
-                indicator_tokens=flatten_bn(flatten_bn(indicator_tokens),
-                                            concat=True),
+                patches_per_image=[x.shape[0] for x in flatten_bn(pixel_values)],
+                indicator_tokens=flatten_bn(flatten_bn(indicator_tokens), concat=True),
             )
 
         raise AssertionError("This line should be unreachable.")
 
     def _process_image_input(
-            self, image_input: OvisImagePatchInputs) -> MultiModalEmbeddings:
+        self, image_input: OvisImagePatchInputs
+    ) -> MultiModalEmbeddings:
         image_patches_flat = image_input["flat_data"]
         patches_per_image = image_input["patches_per_image"]
         indicator_tokens = image_input["indicator_tokens"]
 
         indicator_per_image = list(
-            map(lambda x: x + 1 if x > 1 else x + 2, patches_per_image))
+            map(lambda x: x + 1 if x > 1 else x + 2, patches_per_image)
+        )
 
         target_dtype = self.visual_tokenizer.dtype
-        visual_tokens = self.visual_tokenizer(
-            image_patches_flat.to(target_dtype))
+        visual_tokens = self.visual_tokenizer(image_patches_flat.to(target_dtype))
         visual_embeds = self.vte(visual_tokens)  # 1:1 numeric eq.
 
         indicator_embeds = self.vte(indicator_tokens)
-        indicator_embeds_per_image = indicator_embeds.split(
-            indicator_per_image)
+        indicator_embeds_per_image = indicator_embeds.split(indicator_per_image)
 
         visual_embeds_per_image = visual_embeds.split(patches_per_image, dim=0)
         vision_embeddings = []
-        for indicator, visual in zip(indicator_embeds_per_image,
-                                     visual_embeds_per_image):
+        for indicator, visual in zip(
+            indicator_embeds_per_image, visual_embeds_per_image
+        ):
             vision_embeddings_per_image = []
             for i in range(visual.shape[0]):
                 vision_embeddings_per_image.append(
-                    torch.cat([indicator[i:i + 1], visual[i]], dim=0))
-            vision_embeddings_per_image.append(indicator[i + 1:])
-            vision_embeddings.append(
-                torch.cat(vision_embeddings_per_image, dim=0))
+                    torch.cat([indicator[i : i + 1], visual[i]], dim=0)
+                )
+            vision_embeddings_per_image.append(indicator[i + 1 :])
+            vision_embeddings.append(torch.cat(vision_embeddings_per_image, dim=0))
 
         return tuple(vision_embeddings)
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -532,8 +552,7 @@ def compute_logits(
         logits = self.llm.compute_logits(hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
 
diff --git a/vllm/model_executor/models/ovis2_5.py b/vllm/model_executor/models/ovis2_5.py
index 18dea14379a6..8f73f2ff8263 100644
--- a/vllm/model_executor/models/ovis2_5.py
+++ b/vllm/model_executor/models/ovis2_5.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-""" PyTorch Ovis model."""
+"""PyTorch Ovis model."""
+
 from collections.abc import Iterable, Mapping
 from functools import partial
 from typing import Literal, Optional, TypedDict, Union
@@ -13,18 +14,26 @@
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.linear import ReplicatedLinear
 from vllm.model_executor.layers.quantization import QuantizationConfig
-from vllm.model_executor.models.ovis import (OvisImagePatchInputs,
-                                             VisualEmbedding)
+from vllm.model_executor.models.ovis import OvisImagePatchInputs, VisualEmbedding
 from vllm.model_executor.models.siglip2navit import Siglip2NavitModel
-from vllm.model_executor.models.utils import (AutoWeightsLoader, flatten_bn,
-                                              init_vllm_registered_model,
-                                              maybe_prefix)
+from vllm.model_executor.models.utils import (
+    AutoWeightsLoader,
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
 from vllm.multimodal.parse import ImageSize, MultiModalDataItems
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.processors.ovis2_5 import Ovis2_5Processor
@@ -71,12 +80,14 @@ class OvisVideoPatchInputs(TypedDict):
 
 
 def _ovis2_5_field_config():
-    return dict(pixel_values=MultiModalFieldConfig.batched("image"),
-                grids=MultiModalFieldConfig.batched("image"),
-                indicator_tokens=MultiModalFieldConfig.batched("image"),
-                video_pixel_values=MultiModalFieldConfig.batched("video"),
-                video_indicator_tokens=MultiModalFieldConfig.batched("video"),
-                video_grids=MultiModalFieldConfig.batched("video"))
+    return dict(
+        pixel_values=MultiModalFieldConfig.batched("image"),
+        grids=MultiModalFieldConfig.batched("image"),
+        indicator_tokens=MultiModalFieldConfig.batched("image"),
+        video_pixel_values=MultiModalFieldConfig.batched("video"),
+        video_indicator_tokens=MultiModalFieldConfig.batched("video"),
+        video_grids=MultiModalFieldConfig.batched("video"),
+    )
 
 
 class VisualTokenizer(torch.nn.Module):
@@ -108,7 +119,9 @@ def __init__(
                 head_dim,
                 bias=False,
                 return_bias=False,
-            ), torch.nn.LayerNorm(head_dim))
+            ),
+            torch.nn.LayerNorm(head_dim),
+        )
 
     def _init_backbone(
         self,
@@ -119,12 +132,13 @@ def _init_backbone(
     ):
         model_type = config.model_type
         if model_type == "siglip2_navit":
-            return Siglip2NavitModel(config=config,
-                                     quant_config=quant_config,
-                                     prefix=prefix,
-                                     use_data_parallel=use_data_parallel)
-        raise ValueError(
-            f"Unsupported visual tokenizer model_type: {model_type}")
+            return Siglip2NavitModel(
+                config=config,
+                quant_config=quant_config,
+                prefix=prefix,
+                use_data_parallel=use_data_parallel,
+            )
+        raise ValueError(f"Unsupported visual tokenizer model_type: {model_type}")
 
     @property
     def dtype(self) -> torch.dtype:
@@ -135,22 +149,22 @@ def device(self) -> torch.device:
         return next(self.head.parameters()).device
 
     def tokenize(self, logits: torch.Tensor) -> torch.Tensor:
-        tokens = torch.softmax(logits, dim=-1,
-                               dtype=torch.float32).to(logits.dtype)
+        tokens = torch.softmax(logits, dim=-1, dtype=torch.float32).to(logits.dtype)
         return tokens
 
-    def encode(self, pixel_values: torch.Tensor,
-               grid_thws: torch.Tensor) -> torch.Tensor:
+    def encode(
+        self, pixel_values: torch.Tensor, grid_thws: torch.Tensor
+    ) -> torch.Tensor:
         features = self.vit(pixel_values, grid_thws)
         # refer to qwen2.5-vl patchmerger
         seq_len, _ = features.shape
-        features = features.reshape(seq_len // (self.config.hidden_stride**2),
-                                    -1)
+        features = features.reshape(seq_len // (self.config.hidden_stride**2), -1)
 
         return features
 
-    def forward(self, pixel_values: torch.Tensor,
-                grid_thws: torch.Tensor) -> torch.Tensor:
+    def forward(
+        self, pixel_values: torch.Tensor, grid_thws: torch.Tensor
+    ) -> torch.Tensor:
         features = self.encode(pixel_values, grid_thws)
         logits = self.head(features)
         tokens = self.tokenize(logits)
@@ -167,7 +181,6 @@ def forward(self, pixel_values: torch.Tensor,
 
 
 class Ovis2_5ProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config()
 
@@ -220,8 +233,9 @@ def get_num_image_tokens(
 
     def get_max_image_tokens(self) -> int:
         target_width, target_height = self.get_image_size_with_most_features()
-        return self.get_num_image_tokens(image_width=target_width,
-                                         image_height=target_height)
+        return self.get_num_image_tokens(
+            image_width=target_width, image_height=target_height
+        )
 
     def _get_max_video_frames(self, max_tokens: int) -> int:
         target_width, target_height = self.get_image_size_with_most_features()
@@ -247,8 +261,7 @@ def get_num_frames_with_most_features(
         max_images = mm_counts.get("image", 0)
         max_videos = mm_counts.get("video", 0)
         max_image_tokens = self.get_max_image_tokens() * max_images
-        max_total_frames = self._get_max_video_frames(seq_len -
-                                                      max_image_tokens)
+        max_total_frames = self._get_max_video_frames(seq_len - max_image_tokens)
         max_frames_per_video = max_total_frames // max(max_videos, 1)
         return max(max_frames_per_video, 1)
 
@@ -260,9 +273,9 @@ def get_num_video_tokens(
         num_frames: int,
         image_processor: Optional[BaseImageProcessor],
     ) -> int:
-        num_video_tokens = self.get_num_image_tokens(image_width=image_width,
-                                                     image_height=image_height,
-                                                     num_frames=num_frames)
+        num_video_tokens = self.get_num_image_tokens(
+            image_width=image_width, image_height=image_height, num_frames=num_frames
+        )
         return num_video_tokens
 
     def get_max_video_tokens(
@@ -274,14 +287,12 @@ def get_max_video_tokens(
         return self.get_num_video_tokens(
             image_width=target_width,
             image_height=target_height,
-            num_frames=self.get_num_frames_with_most_features(
-                seq_len, mm_counts),
+            num_frames=self.get_num_frames_with_most_features(seq_len, mm_counts),
             image_processor=None,
         )
 
 
 class Ovis2_5DummyInputsBuilder(BaseDummyInputsBuilder[Ovis2_5ProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -296,48 +307,47 @@ def get_dummy_mm_data(
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
 
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
-        target_num_frames = \
-            self.info.get_num_frames_with_most_features(seq_len, mm_counts)
+        target_width, target_height = self.info.get_image_size_with_most_features()
+        target_num_frames = self.info.get_num_frames_with_most_features(
+            seq_len, mm_counts
+        )
 
         image_overrides = mm_options.get("image") if mm_options else None
         video_overrides = mm_options.get("video") if mm_options else None
 
         mm_data = {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
-            "video":
-            self._get_dummy_videos(
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
+            "video": self._get_dummy_videos(
                 width=target_width,
                 height=target_height,
                 num_frames=target_num_frames,
                 num_videos=num_videos,
                 overrides=video_overrides,
-            )
+            ),
         }
         return mm_data
 
 
-class Ovis2_5MultiModalProcessor(BaseMultiModalProcessor[Ovis2_5ProcessingInfo]
-                                 ):
-
+class Ovis2_5MultiModalProcessor(BaseMultiModalProcessor[Ovis2_5ProcessingInfo]):
     def visual_indicators_to_visual_tokens(
         self,
         visual_indicators: list[int],
     ) -> list[int]:
         """
-        Filter image indicators placeholders and convert them to corresponding 
+        Filter image indicators placeholders and convert them to corresponding
         tokens in visual tokenizer.
         """
         hf_config = self.info.get_hf_config()
         vte_vocab_size = hf_config.visual_vocab_size
         return [
             vte_vocab_size - len(INDICATOR_IDS) + abs(x + 300) - 1
-            for x in visual_indicators if x < -300
+            for x in visual_indicators
+            if x < -300
         ]
 
     def _call_hf_processor(
@@ -388,7 +398,6 @@ def _apply_hf_processor_tokens_only(
         self,
         prompt_tokens: list[int],
     ) -> list[int]:
-
         return prompt_tokens
 
     def _get_mm_fields_config(
@@ -404,7 +413,6 @@ def _get_prompt_updates(
         hf_processor_mm_kwargs: Mapping[str, object],
         out_mm_kwargs: MultiModalKwargsItems,
     ) -> list[PromptReplacement]:
-
         def get_replacement_ovis(item_idx, modality: str):
             if modality == "image":
                 out_item = out_mm_kwargs["image"][item_idx]
@@ -413,22 +421,26 @@ def get_replacement_ovis(item_idx, modality: str):
                 out_item = out_mm_kwargs["video"][item_idx]
                 grid = out_item["video_grids"].data
             hf_processor = self.info.get_hf_processor()
-            return hf_processor.construct_visual_placeholders(grid[0], )
+            return hf_processor.construct_visual_placeholders(
+                grid[0],
+            )
 
         return [
             PromptReplacement(
                 modality=modality,
                 target=IMAGE_TOKEN if modality == "image" else VIDEO_TOKEN,
                 replacement=partial(get_replacement_ovis, modality=modality),
-            ) for modality in ("image", "video")
+            )
+            for modality in ("image", "video")
         ]
 
 
-@MULTIMODAL_REGISTRY.register_processor(Ovis2_5MultiModalProcessor,
-                                        info=Ovis2_5ProcessingInfo,
-                                        dummy_inputs=Ovis2_5DummyInputsBuilder)
+@MULTIMODAL_REGISTRY.register_processor(
+    Ovis2_5MultiModalProcessor,
+    info=Ovis2_5ProcessingInfo,
+    dummy_inputs=Ovis2_5DummyInputsBuilder,
+)
 class Ovis2_5(nn.Module, SupportsMultiModal, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
@@ -447,17 +459,18 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             prefix=f"{prefix}.visual_tokenizer",
         )
 
-        self.vte = VisualEmbedding(config.visual_vocab_size,
-                                   config.hidden_size)
+        self.vte = VisualEmbedding(config.visual_vocab_size, config.hidden_size)
 
         text_model_type = self.config.get_text_config().model_type
         self.image_pad_token_id = IMAGE_PAD_TOKEN_ID_MAP[text_model_type]
 
         self.make_empty_intermediate_tensors = (
-            self.get_language_model().make_empty_intermediate_tensors)
+            self.get_language_model().make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[OvisImagePatchInputs]:
+        self, **kwargs: object
+    ) -> Optional[OvisImagePatchInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         indicator_tokens = kwargs.pop("indicator_tokens", None)
         grids = kwargs.pop("grids", None)
@@ -466,12 +479,15 @@ def _parse_and_validate_image_input(
 
         if pixel_values is not None and indicator_tokens is not None:
             if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values)}")
+                raise ValueError(
+                    f"Incorrect type of pixel values. Got type: {type(pixel_values)}"
+                )
 
             if not isinstance(indicator_tokens, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of indicator_tokens. "
-                                 f"Got type: {type(indicator_tokens)}")
+                raise ValueError(
+                    "Incorrect type of indicator_tokens. "
+                    f"Got type: {type(indicator_tokens)}"
+                )
 
             return OvisImagePatchInputs(
                 type="image_patches",
@@ -480,15 +496,15 @@ def _parse_and_validate_image_input(
                     x.shape[0] // (self.config.vit_config.hidden_stride**2)
                     for x in flatten_bn(pixel_values)
                 ],
-                indicator_tokens=flatten_bn(flatten_bn(indicator_tokens),
-                                            concat=True),
+                indicator_tokens=flatten_bn(flatten_bn(indicator_tokens), concat=True),
                 grids=flatten_bn(flatten_bn(grids), concat=True),
             )
 
         raise AssertionError("This line should be unreachable.")
 
     def _parse_and_validate_video_input(
-            self, **kwargs: object) -> Optional[OvisImagePatchInputs]:
+        self, **kwargs: object
+    ) -> Optional[OvisImagePatchInputs]:
         pixel_values = kwargs.pop("video_pixel_values", None)
         indicator_tokens = kwargs.pop("video_indicator_tokens", None)
         grids = kwargs.pop("video_grids", None)
@@ -497,12 +513,15 @@ def _parse_and_validate_video_input(
 
         if pixel_values is not None and indicator_tokens is not None:
             if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values)}")
+                raise ValueError(
+                    f"Incorrect type of pixel values. Got type: {type(pixel_values)}"
+                )
 
             if not isinstance(indicator_tokens, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of indicator_tokens. "
-                                 f"Got type: {type(indicator_tokens)}")
+                raise ValueError(
+                    "Incorrect type of indicator_tokens. "
+                    f"Got type: {type(indicator_tokens)}"
+                )
 
             return OvisVideoPatchInputs(
                 type="video_patches",
@@ -511,8 +530,7 @@ def _parse_and_validate_video_input(
                     x.shape[0] // (self.config.vit_config.hidden_stride**2)
                     for x in flatten_bn(pixel_values)
                 ],
-                indicator_tokens=flatten_bn(flatten_bn(indicator_tokens),
-                                            concat=True),
+                indicator_tokens=flatten_bn(flatten_bn(indicator_tokens), concat=True),
                 grids=flatten_bn(flatten_bn(grids), concat=True),
             )
 
@@ -527,30 +545,32 @@ def _process_image_input(
         grid_thws = image_input["grids"]
 
         indicator_per_image = list(
-            map(lambda x: 2 if x > 1 else x + 2, patches_per_image))
+            map(lambda x: 2 if x > 1 else x + 2, patches_per_image)
+        )
 
         target_dtype = self.visual_tokenizer.dtype
         visual_tokens = self.visual_tokenizer(
-            image_patches_flat.to(target_dtype), grid_thws)
+            image_patches_flat.to(target_dtype), grid_thws
+        )
 
         visual_embeds = self.vte(visual_tokens)  # 1:1 numeric eq.
         indicator_embeds = self.vte(indicator_tokens)
 
         visual_embeds_per_image = visual_embeds.split(patches_per_image, dim=0)
-        indicator_embeds_per_image = indicator_embeds.split(
-            indicator_per_image)
+        indicator_embeds_per_image = indicator_embeds.split(indicator_per_image)
 
         vision_embeddings = []
-        for indicator, visual in zip(indicator_embeds_per_image,
-                                     visual_embeds_per_image):
+        for indicator, visual in zip(
+            indicator_embeds_per_image, visual_embeds_per_image
+        ):
             vision_embeddings_per_image = []
             visual = visual.unsqueeze(0)
             for i in range(visual.shape[0]):
                 vision_embeddings_per_image.append(
-                    torch.cat([indicator[i:i + 1], visual[i]], dim=0))
-            vision_embeddings_per_image.append(indicator[i + 1:])
-            vision_embeddings.append(
-                torch.cat(vision_embeddings_per_image, dim=0))
+                    torch.cat([indicator[i : i + 1], visual[i]], dim=0)
+                )
+            vision_embeddings_per_image.append(indicator[i + 1 :])
+            vision_embeddings.append(torch.cat(vision_embeddings_per_image, dim=0))
         return tuple(vision_embeddings)
 
     def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
@@ -559,20 +579,21 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if input_key in ("pixel_values", "indicator_tokens",
-                             "grids") and "images" not in modalities:
-                modalities["images"] = self._parse_and_validate_image_input(
-                    **kwargs)
-            if input_key in ("video_pixel_values", "video_indicator_tokens",
-                             "video_grids") and "videos" not in modalities:
-                modalities["videos"] = self._parse_and_validate_video_input(
-                    **kwargs)
+            if (
+                input_key in ("pixel_values", "indicator_tokens", "grids")
+                and "images" not in modalities
+            ):
+                modalities["images"] = self._parse_and_validate_image_input(**kwargs)
+            if (
+                input_key
+                in ("video_pixel_values", "video_indicator_tokens", "video_grids")
+                and "videos" not in modalities
+            ):
+                modalities["videos"] = self._parse_and_validate_video_input(**kwargs)
 
         return modalities
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
-
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
@@ -620,8 +641,7 @@ def compute_logits(
         logits = self.llm.compute_logits(hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
 
diff --git a/vllm/model_executor/models/paligemma.py b/vllm/model_executor/models/paligemma.py
index ff6b8e4b9b4f..7bddfc5ee855 100644
--- a/vllm/model_executor/models/paligemma.py
+++ b/vllm/model_executor/models/paligemma.py
@@ -11,23 +11,39 @@
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.logger import init_logger
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalInputs, MultiModalKwargsItems,
-                                    MultiModalUUIDDict)
-from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
-                                   MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptIndexTargets,
-                                        PromptInsertion, PromptUpdate,
-                                        PromptUpdateDetails)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalInputs,
+    MultiModalKwargsItems,
+    MultiModalUUIDDict,
+)
+from vllm.multimodal.parse import (
+    ImageEmbeddingItems,
+    ImageProcessorItems,
+    MultiModalDataItems,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptIndexTargets,
+    PromptInsertion,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
 from .siglip import SiglipVisionModel
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
-                    init_vllm_registered_model, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 from .vision import get_vision_encoder_info
 
 logger = init_logger(__name__)
@@ -41,6 +57,7 @@ class PaliGemmaImagePixelInputs(TensorSchema):
         - h: Height
         - w: Width
     """
+
     type: Literal["pixel_values"] = "pixel_values"
     data: Annotated[torch.Tensor, TensorShape("bn", 3, "h", "w")]
 
@@ -52,16 +69,15 @@ class PaliGemmaImageEmbeddingInputs(TensorSchema):
         - ifs: Image feature size
         - hs: Hidden size (must match language model backbone)
     """
+
     type: Literal["image_embeds"] = "image_embeds"
     data: Annotated[torch.Tensor, TensorShape("bn", "ifs", "hs")]
 
 
-PaliGemmaImageInputs = Union[PaliGemmaImagePixelInputs,
-                             PaliGemmaImageEmbeddingInputs]
+PaliGemmaImageInputs = Union[PaliGemmaImagePixelInputs, PaliGemmaImageEmbeddingInputs]
 
 
 class PaliGemmaMultiModalProjector(nn.Module):
-
     def __init__(self, vision_hidden_size: int, projection_dim: int):
         super().__init__()
 
@@ -73,7 +89,6 @@ def forward(self, image_features: torch.Tensor) -> torch.Tensor:
 
 
 class PaliGemmaProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(PaliGemmaConfig)
 
@@ -97,9 +112,7 @@ def get_num_image_tokens(
         )
 
 
-class PaliGemmaDummyInputsBuilder(
-        BaseDummyInputsBuilder[PaliGemmaProcessingInfo]):
-
+class PaliGemmaDummyInputsBuilder(BaseDummyInputsBuilder[PaliGemmaProcessingInfo]):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         return ""
 
@@ -118,17 +131,16 @@ def get_dummy_mm_data(
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=max_image_size,
-                                   height=max_image_size,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=max_image_size,
+                height=max_image_size,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
-class PaliGemmaMultiModalProcessor(
-        BaseMultiModalProcessor[PaliGemmaProcessingInfo]):
-
+class PaliGemmaMultiModalProcessor(BaseMultiModalProcessor[PaliGemmaProcessingInfo]):
     def _call_hf_processor(
         self,
         prompt: str,
@@ -171,7 +183,8 @@ def _get_prompt_updates(
 
         def get_insertion(item_idx: int):
             images = mm_items.get_items(
-                "image", (ImageEmbeddingItems, ImageProcessorItems))
+                "image", (ImageEmbeddingItems, ImageProcessorItems)
+            )
 
             if isinstance(images, ImageEmbeddingItems):
                 num_image_tokens = images.get_feature_size(item_idx)
@@ -196,7 +209,8 @@ def get_insertion(item_idx: int):
             PromptInsertion(
                 modality="image",
                 target=PromptIndexTargets.prefix(
-                    [bos_token_id] if tokenizer.add_bos_token else []),
+                    [bos_token_id] if tokenizer.add_bos_token else []
+                ),
                 insertion=get_insertion,
             )
         ]
@@ -209,11 +223,13 @@ def apply(
         tokenization_kwargs: Optional[Mapping[str, object]] = None,
         mm_uuids: Optional[MultiModalUUIDDict] = None,
     ) -> MultiModalInputs:
-        mm_inputs = super().apply(prompt,
-                                  mm_data,
-                                  hf_processor_mm_kwargs,
-                                  tokenization_kwargs,
-                                  mm_uuids=mm_uuids)
+        mm_inputs = super().apply(
+            prompt,
+            mm_data,
+            hf_processor_mm_kwargs,
+            tokenization_kwargs,
+            mm_uuids=mm_uuids,
+        )
         prompt_token_ids = mm_inputs["prompt_token_ids"]
 
         tokenizer = self.info.get_tokenizer()
@@ -231,9 +247,9 @@ def apply(
 @MULTIMODAL_REGISTRY.register_processor(
     PaliGemmaMultiModalProcessor,
     info=PaliGemmaProcessingInfo,
-    dummy_inputs=PaliGemmaDummyInputsBuilder)
-class PaliGemmaForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                        SupportsPP):
+    dummy_inputs=PaliGemmaDummyInputsBuilder,
+)
+class PaliGemmaForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP):
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -253,7 +269,8 @@ class PaliGemmaForConditionalGeneration(nn.Module, SupportsMultiModal,
             "model.vision_tower.": "vision_tower.",
             "model.multi_modal_projector.": "multi_modal_projector.",
             "lm_head.": "language_model.lm_head.",
-        })
+        }
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -270,13 +287,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.config = config
         self.multimodal_config = multimodal_config
 
-        self.vision_tower = SiglipVisionModel(config.vision_config,
-                                              quant_config,
-                                              prefix=maybe_prefix(
-                                                  prefix, "vision_tower"))
+        self.vision_tower = SiglipVisionModel(
+            config.vision_config,
+            quant_config,
+            prefix=maybe_prefix(prefix, "vision_tower"),
+        )
         self.multi_modal_projector = PaliGemmaMultiModalProjector(
             vision_hidden_size=config.vision_config.hidden_size,
-            projection_dim=config.vision_config.projection_dim)
+            projection_dim=config.vision_config.projection_dim,
+        )
 
         self.quant_config = quant_config
 
@@ -293,10 +312,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.language_model.logits_processor.scale *= logit_scale
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[PaliGemmaImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[PaliGemmaImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_embeds = kwargs.pop("image_embeds", None)
 
@@ -307,12 +328,11 @@ def _parse_and_validate_image_input(
             pixel_values = flatten_bn(pixel_values, concat=True)
 
             h = w = self.config.vision_config.image_size
-            return PaliGemmaImagePixelInputs(type="pixel_values",
-                                             data=pixel_values,
-                                             resolve_bindings={
-                                                 "h": h,
-                                                 "w": w
-                                             })
+            return PaliGemmaImagePixelInputs(
+                type="pixel_values",
+                data=pixel_values,
+                resolve_bindings={"h": h, "w": w},
+            )
 
         if image_embeds is not None:
             image_embeds = flatten_bn(image_embeds, concat=True)
@@ -329,7 +349,6 @@ def _image_pixels_to_features(
         vision_tower: SiglipVisionModel,
         pixel_values: torch.Tensor,
     ) -> torch.Tensor:
-
         target_dtype = vision_tower.get_input_embeddings().weight.dtype
         image_features = vision_tower(pixel_values.to(dtype=target_dtype))
 
@@ -339,7 +358,6 @@ def _process_image_input(
         self,
         image_input: PaliGemmaImageInputs,
     ) -> torch.Tensor:
-
         if image_input["type"] == "image_embeds":
             return image_input["data"]
 
@@ -355,8 +373,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -365,19 +382,20 @@ def get_multimodal_embeddings(self,
         vision_embeddings = vision_embeddings * (self.config.hidden_size**-0.5)
         return vision_embeddings
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs: object) -> IntermediateTensors:
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs: object,
+    ) -> IntermediateTensors:
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.language_model.model(input_ids,
-                                                  positions,
-                                                  intermediate_tensors,
-                                                  inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
 
         return hidden_states
 
@@ -387,7 +405,6 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
diff --git a/vllm/model_executor/models/persimmon.py b/vllm/model_executor/models/persimmon.py
index 23fb7bb85215..d3df5f9a59b5 100644
--- a/vllm/model_executor/models/persimmon.py
+++ b/vllm/model_executor/models/persimmon.py
@@ -22,6 +22,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only persimmon model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -35,35 +36,42 @@
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class PersimmonMLP(nn.Module):
-
-    def __init__(self,
-                 config: PersimmonConfig,
-                 quant_config: Optional[QuantizationConfig] = None):
+    def __init__(
+        self, config: PersimmonConfig, quant_config: Optional[QuantizationConfig] = None
+    ):
         super().__init__()
-        self.dense_h_to_4h = ColumnParallelLinear(config.hidden_size,
-                                                  config.intermediate_size,
-                                                  quant_config=quant_config)
-        self.dense_4h_to_h = RowParallelLinear(config.intermediate_size,
-                                               config.hidden_size,
-                                               quant_config=quant_config)
+        self.dense_h_to_4h = ColumnParallelLinear(
+            config.hidden_size, config.intermediate_size, quant_config=quant_config
+        )
+        self.dense_4h_to_h = RowParallelLinear(
+            config.intermediate_size, config.hidden_size, quant_config=quant_config
+        )
         self.act = get_act_fn(config.hidden_act)
 
     def forward(self, hidden_states) -> torch.Tensor:
@@ -74,12 +82,13 @@ def forward(self, hidden_states) -> torch.Tensor:
 
 
 class PersimmonAttention(nn.Module):
-
-    def __init__(self,
-                 config: PersimmonConfig,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: PersimmonConfig,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.config = config
         tensor_parallel_world_size = get_tensor_model_parallel_world_size()
@@ -123,12 +132,14 @@ def __init__(self,
             partial_rotary_factor=self.partial_rotary_factor,
         )
         self.scaling = self.head_dim**-0.5
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              scale=self.scaling,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            scale=self.scaling,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def _split_heads(self, x: torch.Tensor) -> torch.Tensor:
         # [seq_length, hidden_size] -> [seq_length, num_heads, head_dim]
@@ -167,23 +178,28 @@ def forward(
 
 
 class PersimmonDecoderLayer(nn.Module):
-
-    def __init__(self,
-                 config: PersimmonConfig,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: PersimmonConfig,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.hidden_size = config.hidden_size
-        self.self_attn = PersimmonAttention(config=config,
-                                            cache_config=cache_config,
-                                            quant_config=quant_config,
-                                            prefix=f"{prefix}.self_attn")
+        self.self_attn = PersimmonAttention(
+            config=config,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.self_attn",
+        )
         self.mlp = PersimmonMLP(config, quant_config=quant_config)
-        self.input_layernorm = nn.LayerNorm(config.hidden_size,
-                                            eps=config.layer_norm_eps)
-        self.post_attention_layernorm = nn.LayerNorm(config.hidden_size,
-                                                     eps=config.layer_norm_eps)
+        self.input_layernorm = nn.LayerNorm(
+            config.hidden_size, eps=config.layer_norm_eps
+        )
+        self.post_attention_layernorm = nn.LayerNorm(
+            config.hidden_size, eps=config.layer_norm_eps
+        )
 
     def forward(
         self,
@@ -214,7 +230,6 @@ def forward(
 
 @support_torch_compile
 class PersimmonModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -224,18 +239,22 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.vocab_size = config.vocab_size
         self.config = config
-        self.embed_tokens = VocabParallelEmbedding(config.vocab_size,
-                                                   config.hidden_size)
+        self.embed_tokens = VocabParallelEmbedding(
+            config.vocab_size, config.hidden_size
+        )
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: PersimmonDecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
-        self.final_layernorm = nn.LayerNorm(config.hidden_size,
-                                            eps=config.layer_norm_eps)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.hidden_size))
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.layers",
+        )
+        self.final_layernorm = nn.LayerNorm(
+            config.hidden_size, eps=config.layer_norm_eps
+        )
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -262,8 +281,7 @@ def forward(
         hidden_states = self.final_layernorm(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_dict = dict(self.named_parameters(remove_duplicate=False))
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
@@ -282,35 +300,38 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if output_dim is not None:
                     loaded_weight_shape = loaded_weight.shape
                     loaded_weight = loaded_weight.view(
-                        loaded_weight_shape[:output_dim] + (num_heads, 3, -1) +
-                        loaded_weight_shape[output_dim + 1:])
-                    loaded_weight = loaded_weight.transpose(
-                        output_dim, output_dim + 1)
+                        loaded_weight_shape[:output_dim]
+                        + (num_heads, 3, -1)
+                        + loaded_weight_shape[output_dim + 1 :]
+                    )
+                    loaded_weight = loaded_weight.transpose(output_dim, output_dim + 1)
                     loaded_weight = loaded_weight.reshape(loaded_weight_shape)
 
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class PersimmonForCausalLM(nn.Module, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         self.config = config
         self.vocab_size = config.vocab_size
-        self.model = PersimmonModel(vllm_config=vllm_config,
-                                    prefix=maybe_prefix(prefix, "model"))
-        self.lm_head = ParallelLMHead(config.vocab_size,
-                                      config.hidden_size,
-                                      bias=False,
-                                      prefix=maybe_prefix(prefix, "lm_head"))
+        self.model = PersimmonModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
+        self.lm_head = ParallelLMHead(
+            config.vocab_size,
+            config.hidden_size,
+            bias=False,
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -337,7 +358,6 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/phi.py b/vllm/model_executor/models/phi.py
index 9cf288e85005..779b391008bb 100644
--- a/vllm/model_executor/models/phi.py
+++ b/vllm/model_executor/models/phi.py
@@ -37,6 +37,7 @@
 # OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
 # OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
 """Inference-only Phi-1.5 model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -50,40 +51,47 @@
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class PhiAttention(nn.Module):
-
-    def __init__(self,
-                 config: PhiConfig,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: PhiConfig,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.total_num_heads = config.num_attention_heads
         self.hidden_size = config.hidden_size
         self.head_size = self.hidden_size // self.total_num_heads
 
-        tensor_model_parallel_world_size = (
-            get_tensor_model_parallel_world_size())
+        tensor_model_parallel_world_size = get_tensor_model_parallel_world_size()
         assert self.total_num_heads % tensor_model_parallel_world_size == 0
-        self.num_heads = (self.total_num_heads //
-                          tensor_model_parallel_world_size)
+        self.num_heads = self.total_num_heads // tensor_model_parallel_world_size
 
         # pylint: disable=C0103
         self.qkv_proj = QKVParallelLinear(
@@ -100,28 +108,31 @@ def __init__(self,
         )
 
         scaling = self.head_size**-0.5
-        rotary_dim = int(config.partial_rotary_factor *
-                         (config.hidden_size // config.num_attention_heads))
+        rotary_dim = int(
+            config.partial_rotary_factor
+            * (config.hidden_size // config.num_attention_heads)
+        )
         assert rotary_dim % 2 == 0
 
         # pylint: disable=C0301
         # Refer to:
         # https://huggingface.co/microsoft/phi-1_5/blob/d212a789620c380ff32ca1d1ee9943a777360987/modeling_phi.py#L518
         rope_theta = getattr(config, "rope_theta", 10000.0)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          2048)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 2048)
         self.rotary_emb = get_rope(
             self.head_size,
             rotary_dim=rotary_dim,
             max_position=max_position_embeddings,
             base=rope_theta,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_size,
-                              scaling,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_size,
+            scaling,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -137,10 +148,9 @@ def forward(
 
 
 class PhiMLP(nn.Module):
-
-    def __init__(self,
-                 config: PhiConfig,
-                 quant_config: Optional[QuantizationConfig] = None):
+    def __init__(
+        self, config: PhiConfig, quant_config: Optional[QuantizationConfig] = None
+    ):
         super().__init__()
 
         n_inner = getattr(config, "n_inner", None)
@@ -166,19 +176,20 @@ def forward(self, hidden_states):
 
 
 class PhiLayer(nn.Module):
-
-    def __init__(self,
-                 config: PhiConfig,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: PhiConfig,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
-        self.input_layernorm = nn.LayerNorm(config.hidden_size,
-                                            eps=config.layer_norm_eps)
-        self.self_attn = PhiAttention(config,
-                                      cache_config,
-                                      quant_config,
-                                      prefix=f"{prefix}.self_attn")
+        self.input_layernorm = nn.LayerNorm(
+            config.hidden_size, eps=config.layer_norm_eps
+        )
+        self.self_attn = PhiAttention(
+            config, cache_config, quant_config, prefix=f"{prefix}.self_attn"
+        )
         self.mlp = PhiMLP(config, quant_config)
 
     def forward(
@@ -199,7 +210,6 @@ def forward(
 
 @support_torch_compile
 class PhiModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -209,18 +219,20 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.config = config
         self.quant_config = quant_config
-        self.embed_tokens = VocabParallelEmbedding(config.vocab_size,
-                                                   config.hidden_size)
+        self.embed_tokens = VocabParallelEmbedding(
+            config.vocab_size, config.hidden_size
+        )
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: PhiLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
-        self.final_layernorm = nn.LayerNorm(config.hidden_size,
-                                            eps=config.layer_norm_eps)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.hidden_size))
+            lambda prefix: PhiLayer(config, cache_config, quant_config, prefix=prefix),
+            prefix=f"{prefix}.layers",
+        )
+        self.final_layernorm = nn.LayerNorm(
+            config.hidden_size, eps=config.layer_norm_eps
+        )
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -250,13 +262,12 @@ def forward(
 
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
             ("qkv_proj", "k_proj", "k"),
-            ("qkv_proj", "v_proj", "v")
+            ("qkv_proj", "v_proj", "v"),
         ]
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
@@ -265,7 +276,7 @@ def load_weights(self, weights: Iterable[tuple[str,
             if "rotary_emb.inv_freq" in name:
                 continue
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -287,8 +298,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -315,17 +325,21 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.quant_config = quant_config
 
-        self.model = PhiModel(vllm_config=vllm_config,
-                              prefix=maybe_prefix(prefix, "model"))
+        self.model = PhiModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
-        self.lm_head = ParallelLMHead(config.vocab_size,
-                                      config.hidden_size,
-                                      bias=True,
-                                      quant_config=quant_config,
-                                      prefix=maybe_prefix(prefix, "lm_head"))
+        self.lm_head = ParallelLMHead(
+            config.vocab_size,
+            config.hidden_size,
+            bias=True,
+            quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -337,8 +351,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
 
         return hidden_states
 
@@ -346,11 +361,9 @@ def compute_logits(
         self,
         hidden_states: torch.Tensor,
     ) -> Optional[torch.Tensor]:
-        logits = self.logits_processor(self.lm_head, hidden_states,
-                                       self.lm_head.bias)
+        logits = self.logits_processor(self.lm_head, hidden_states, self.lm_head.bias)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/phi3.py b/vllm/model_executor/models/phi3.py
index f4e870c53030..56c8755123d3 100644
--- a/vllm/model_executor/models/phi3.py
+++ b/vllm/model_executor/models/phi3.py
@@ -8,7 +8,6 @@
 
 
 class Phi3ForCausalLM(LlamaForCausalLM):
-
     packed_modules_mapping = {
         "qkv_proj": [
             "qkv_proj",
diff --git a/vllm/model_executor/models/phi3v.py b/vllm/model_executor/models/phi3v.py
index df5f0f0039d3..eb5a0f555a3c 100644
--- a/vllm/model_executor/models/phi3v.py
+++ b/vllm/model_executor/models/phi3v.py
@@ -21,28 +21,43 @@
 import regex as re
 import torch
 import torch.nn as nn
-from transformers import (BatchFeature, CLIPVisionConfig, PretrainedConfig,
-                          ProcessorMixin)
+from transformers import (
+    BatchFeature,
+    CLIPVisionConfig,
+    PretrainedConfig,
+    ProcessorMixin,
+)
 
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization import QuantizationConfig
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
-from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
-                                   ImageSize, MultiModalDataItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
+from vllm.multimodal.parse import (
+    ImageEmbeddingItems,
+    ImageProcessorItems,
+    ImageSize,
+    MultiModalDataItems,
+)
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo,
-                                        MultiModalPromptUpdates,
-                                        PlaceholderFeaturesInfo,
-                                        PromptReplacement, PromptUpdate,
-                                        ResolvedPromptUpdate)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    MultiModalPromptUpdates,
+    PlaceholderFeaturesInfo,
+    PromptReplacement,
+    PromptUpdate,
+    ResolvedPromptUpdate,
+)
+
 # yapf: enable
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
@@ -50,39 +65,51 @@
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .clip import CLIPVisionModel
-from .interfaces import (MultiModalEmbeddings, SupportsMultiModal, SupportsPP,
-                         SupportsQuant)
-from .utils import (AutoWeightsLoader, WeightsMapper,
-                    _merge_multimodal_embeddings, flatten_bn,
-                    init_vllm_registered_model, maybe_prefix)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsMultiModal,
+    SupportsPP,
+    SupportsQuant,
+)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    _merge_multimodal_embeddings,
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
 # Cannot find the following 2 numbers from hf config.
 _IMAGE_TOKEN_ID = 32044
 
-CLIP_VIT_LARGE_PATCH14_336_CONFIG = CLIPVisionConfig(dropout=0.0,
-                                                     hidden_act="quick_gelu",
-                                                     hidden_size=1024,
-                                                     image_size=336,
-                                                     intermediate_size=4096,
-                                                     num_attention_heads=16,
-                                                     num_channels=3,
-                                                     num_hidden_layers=24,
-                                                     patch_size=14,
-                                                     projection_dim=768)
-
-
-def _init_img_processor(hf_config: PretrainedConfig,
-                        quant_config: Optional[QuantizationConfig],
-                        prefix: str = "") -> CLIPVisionModel:
+CLIP_VIT_LARGE_PATCH14_336_CONFIG = CLIPVisionConfig(
+    dropout=0.0,
+    hidden_act="quick_gelu",
+    hidden_size=1024,
+    image_size=336,
+    intermediate_size=4096,
+    num_attention_heads=16,
+    num_channels=3,
+    num_hidden_layers=24,
+    patch_size=14,
+    projection_dim=768,
+)
+
+
+def _init_img_processor(
+    hf_config: PretrainedConfig,
+    quant_config: Optional[QuantizationConfig],
+    prefix: str = "",
+) -> CLIPVisionModel:
     clip_config = CLIP_VIT_LARGE_PATCH14_336_CONFIG
-    layer_idx = hf_config.img_processor.get('layer_idx', -2)
+    layer_idx = hf_config.img_processor.get("layer_idx", -2)
 
     # Initialize the CLIP only up to the required feature layer
     if layer_idx < 0:
-        num_hidden_layers = clip_config.num_hidden_layers + \
-            layer_idx + 1
+        num_hidden_layers = clip_config.num_hidden_layers + layer_idx + 1
     else:
         num_hidden_layers = layer_idx + 1
 
@@ -111,8 +138,9 @@ class Phi3VImagePixelInputs(TensorSchema):
     # Supports either a stacked tensor or a list of (p, 3, h, w) tensors
     pixel_values: Annotated[
         Union[torch.Tensor, list[torch.Tensor]],
-        TensorShape("bn", "p", 3, "h", "w", dynamic_dims={"p"}
-                    ),  # 'p' may vary across items
+        TensorShape(
+            "bn", "p", 3, "h", "w", dynamic_dims={"p"}
+        ),  # 'p' may vary across items
     ]
 
     # Stacked tensor with height and width for each image
@@ -127,6 +155,7 @@ class Phi3VImageEmbeddingInputs(TensorSchema):
         - f: Image feature size (e.g., number of tokens per image)
         - h: Hidden size (must match language model backbone)
     """
+
     type: Literal["image_embeds"] = "image_embeds"
     data: Annotated[
         Union[torch.Tensor, list[torch.Tensor]],
@@ -138,15 +167,13 @@ class Phi3VImageEmbeddingInputs(TensorSchema):
 
 
 class Phi3ImageEmbeddingBase(nn.Module):
-
     def __init__(self) -> None:
         super().__init__()
         self.layer_idx: int
         self.type_feature: str
         self.img_processor: CLIPVisionModel
 
-    def get_img_features(self,
-                         img_embeds: torch.FloatTensor) -> torch.FloatTensor:
+    def get_img_features(self, img_embeds: torch.FloatTensor) -> torch.FloatTensor:
         TYPE_FEATURE = self.type_feature
 
         # NOTE: we skip the step to select the vision feature layer since
@@ -167,52 +194,51 @@ def get_img_features(self,
 class Phi3HDImageEmbedding(Phi3ImageEmbeddingBase):
     """Phi3 Image embedding with HD transform."""
 
-    def __init__(self,
-                 config: PretrainedConfig,
-                 quant_config: Optional[QuantizationConfig],
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: PretrainedConfig,
+        quant_config: Optional[QuantizationConfig],
+        prefix: str = "",
+    ) -> None:
         super().__init__()
 
         # n_embed or hidden_size
-        hidden_size = config.n_embd if hasattr(
-            config, 'n_embd') else config.hidden_size
+        hidden_size = config.n_embd if hasattr(config, "n_embd") else config.hidden_size
 
         self.img_processor = _init_img_processor(
-            config, quant_config, prefix=f"{prefix}.img_processor")
+            config, quant_config, prefix=f"{prefix}.img_processor"
+        )
 
-        image_dim_out = config.img_processor['image_dim_out']
-        self.num_img_tokens = config.img_processor['num_img_tokens']
+        image_dim_out = config.img_processor["image_dim_out"]
+        self.num_img_tokens = config.img_processor["num_img_tokens"]
 
         self.image_dim_out = image_dim_out
 
         # global_gn and sub_gn for hd transform, serves as line separator
-        self.use_hd_transform = config.embd_layer.get('use_hd_transform',
-                                                      False)
+        self.use_hd_transform = config.embd_layer.get("use_hd_transform", False)
         self.with_learnable_separator = config.embd_layer.get(
-            'with_learnable_separator', False)
-        self.hd_transform_order = config.embd_layer.get(
-            'hd_transform_order', 'glb_sub')
+            "with_learnable_separator", False
+        )
+        self.hd_transform_order = config.embd_layer.get("hd_transform_order", "glb_sub")
         # with_hd_transform and with_learnable_separator should have same value
         assert self.use_hd_transform and self.with_learnable_separator
 
         # 1024 * 4, merge spatial to channel dimension
         self.glb_GN = nn.Parameter(torch.empty([1, 1, self.image_dim_out * 4]))
-        self.sub_GN = nn.Parameter(
-            torch.empty([1, 1, 1, self.image_dim_out * 4]))
+        self.sub_GN = nn.Parameter(torch.empty([1, 1, 1, self.image_dim_out * 4]))
 
         dim_projection = hidden_size
         depth = 2
         layers = [nn.Linear(image_dim_out * 4, dim_projection)]
         for _ in range(1, depth):
-            layers.extend(
-                [nn.GELU(),
-                 nn.Linear(dim_projection, dim_projection)])
+            layers.extend([nn.GELU(), nn.Linear(dim_projection, dim_projection)])
         self.img_projection = nn.Sequential(*layers)
 
-        self.type_feature = config.img_processor.get('type_feature', 'patch')
+        self.type_feature = config.img_processor.get("type_feature", "patch")
 
-    def forward(self, pixel_values: torch.FloatTensor,
-                image_sizes: torch.Tensor) -> torch.FloatTensor:
+    def forward(
+        self, pixel_values: torch.FloatTensor, image_sizes: torch.Tensor
+    ) -> torch.FloatTensor:
         """
         process image and return vision embeddings.
 
@@ -222,19 +248,19 @@ def forward(self, pixel_values: torch.FloatTensor,
         num_images, num_crops, c, h, w = pixel_values.shape
         pixel_values = pixel_values.flatten(0, 1)
         img_features = self.get_img_features(pixel_values)
-        img_features = img_features.reshape(num_images, num_crops, -1,
-                                            self.image_dim_out)
-        image_features_proj = self.hd_feature_transform(
-            img_features, image_sizes)
+        img_features = img_features.reshape(
+            num_images, num_crops, -1, self.image_dim_out
+        )
+        image_features_proj = self.hd_feature_transform(img_features, image_sizes)
         return image_features_proj
 
     def hd_feature_transform(self, image_features, image_sizes):
         """
         image_features: (num_images, num_crops+1, 24*24, 1024)
         """
-        assert (
-            self.hd_transform_order == 'sub_glb'
-        ), f'hd_transform_order `{self.hd_transform_order}` not implemented'
+        assert self.hd_transform_order == "sub_glb", (
+            f"hd_transform_order `{self.hd_transform_order}` not implemented"
+        )
         if isinstance(self.img_projection, nn.Sequential):
             target_device = self.img_projection[0].bias.device
             target_dtype = self.img_projection[0].bias.dtype
@@ -242,13 +268,14 @@ def hd_feature_transform(self, image_features, image_sizes):
             target_device = self.img_projection.bias.device
             target_dtype = self.img_projection.bias.dtype
 
-        global_image_features = image_features[:,
-                                               0]  # (num_images, 24*24, 1024)
+        global_image_features = image_features[:, 0]  # (num_images, 24*24, 1024)
         # global feature can be viewed as a special HD case with num_crops 1x1
         global_image_features_hd = self.reshape_hd_patches_2x2merge(
-            global_image_features, 1, 1)
+            global_image_features, 1, 1
+        )
         global_image_features_hd_newline = self.add_image_newline(
-            global_image_features_hd)
+            global_image_features_hd
+        )
 
         batch_image_features_proj = []
         # need a for loop to process each image because of different image sizes
@@ -261,21 +288,27 @@ def hd_feature_transform(self, image_features, image_sizes):
 
             # NOTE: real num_crops is padded
             # (num_crops, 24*24, 1024)
-            sub_image_features = image_features[i, 1:1 + num_crops]
+            sub_image_features = image_features[i, 1 : 1 + num_crops]
             sub_image_features_hd = self.reshape_hd_patches_2x2merge(
-                sub_image_features, h_crop, w_crop)
+                sub_image_features, h_crop, w_crop
+            )
             sub_image_features_hd_newline = self.add_image_newline(
-                sub_image_features_hd)
+                sub_image_features_hd
+            )
 
             # [sub features, separator, global features]
-            image_embeddings = torch.cat([
-                sub_image_features_hd_newline.squeeze(
-                    0),  # (h_crop*12*(w_crop*12+1), 4096)
-                self.glb_GN.squeeze(0),
-                global_image_features_hd_newline[i],
-            ])
+            image_embeddings = torch.cat(
+                [
+                    sub_image_features_hd_newline.squeeze(
+                        0
+                    ),  # (h_crop*12*(w_crop*12+1), 4096)
+                    self.glb_GN.squeeze(0),
+                    global_image_features_hd_newline[i],
+                ]
+            )
             img_proj = self.img_projection(
-                image_embeddings.to(target_device, target_dtype))
+                image_embeddings.to(target_device, target_dtype)
+            )
             batch_image_features_proj.append(img_proj)
 
         return batch_image_features_proj
@@ -295,11 +328,13 @@ def reshape_hd_patches_2x2merge(self, image_features, h_crop, w_crop):
             .reshape(N, H // 2, 2, H // 2, 2, C)  # N, 12, 2, 12, 2, 1024
             .permute(0, 1, 3, 2, 4, 5)  # N, 12, 12, 2, 2, 1024
             .reshape(N, -1, 4 * C)  # N, 144, 4096
-            .reshape(num_images, h_crop, w_crop, H // 2, H // 2,
-                     -1)  # n_img, h_crop, w_crop, 12, 12, 4096
+            .reshape(
+                num_images, h_crop, w_crop, H // 2, H // 2, -1
+            )  # n_img, h_crop, w_crop, 12, 12, 4096
             .permute(0, 1, 3, 2, 4, 5)  # n_img, h_crop, 12, w_crop, 12, 4096
-            .reshape(num_images, h_crop * H // 2, w_crop * H // 2,
-                     4 * C)  # n_img, h_crop*12, w_crop*12, 4096
+            .reshape(
+                num_images, h_crop * H // 2, w_crop * H // 2, 4 * C
+            )  # n_img, h_crop*12, w_crop*12, 4096
         )
         return image_features_hd
 
@@ -310,16 +345,16 @@ def add_image_newline(self, image_features_hd):
         """
         num_images, h, w, hid_dim = image_features_hd.shape
         # add the newline token to the HD image feature patches
-        newline_embeddings = self.sub_GN.expand(num_images, h, -1,
-                                                -1)  # (n_img, h, 1, hid_dim)
+        newline_embeddings = self.sub_GN.expand(
+            num_images, h, -1, -1
+        )  # (n_img, h, 1, hid_dim)
         image_features_hd_newline = torch.cat(
-            [image_features_hd, newline_embeddings],
-            dim=2).reshape(num_images, -1, hid_dim)
+            [image_features_hd, newline_embeddings], dim=2
+        ).reshape(num_images, -1, hid_dim)
         return image_features_hd_newline
 
 
 class Phi3VProcessingInfo(BaseProcessingInfo):
-
     def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
         return {"image": None}
 
@@ -344,7 +379,6 @@ def get_image_size_with_most_features(self) -> ImageSize:
 
 
 class Phi3VDummyInputsBuilder(BaseDummyInputsBuilder[Phi3VProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -361,22 +395,21 @@ def get_dummy_mm_data(
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class Phi3VMultiModalProcessor(BaseMultiModalProcessor[Phi3VProcessingInfo]):
-
     def _call_hf_processor(
         self,
         prompt: str,
@@ -423,7 +456,8 @@ def _get_prompt_updates(
 
         def get_replacement_phi3v(item_idx: int):
             images = mm_items.get_items(
-                "image", (ImageEmbeddingItems, ImageProcessorItems))
+                "image", (ImageEmbeddingItems, ImageProcessorItems)
+            )
 
             if isinstance(images, ImageEmbeddingItems):
                 num_image_tokens = images.get_feature_size(item_idx)
@@ -487,8 +521,7 @@ def _apply_prompt_updates(
             # https://huggingface.co/microsoft/Phi-3.5-vision-instruct/blob/64f88b6/processing_phi3_v.py#L407
             pattern = r"<\|image_\d+\|>"
             prompt_chunks = [
-                tokenizer(chunk).input_ids
-                for chunk in re.split(pattern, text)
+                tokenizer(chunk).input_ids for chunk in re.split(pattern, text)
             ]
             image_tags = [
                 tokenizer(chunk, add_special_tokens=False).input_ids
@@ -497,8 +530,10 @@ def _apply_prompt_updates(
             if len(prompt_chunks) > len(image_tags):
                 image_tags.append([])
             token_ids = [
-                e for sublist in zip(prompt_chunks, image_tags)
-                for ele in sublist for e in ele
+                e
+                for sublist in zip(prompt_chunks, image_tags)
+                for ele in sublist
+                for e in ele
             ]
 
         token_ids, placeholders = super()._apply_prompt_updates(
@@ -507,8 +542,9 @@ def _apply_prompt_updates(
         )
 
         # Keep the behavior in line with HF processor
-        if len(mm_prompt_updates) and (token_ids[:2] == tokenizer.encode(
-                "<s> <|image|>", add_special_tokens=False)):
+        if len(mm_prompt_updates) and (
+            token_ids[:2] == tokenizer.encode("<s> <|image|>", add_special_tokens=False)
+        ):
             token_ids = [token_ids[0], *token_ids[2:]]
             placeholders = {
                 modality: [
@@ -518,7 +554,8 @@ def _apply_prompt_updates(
                         start_idx=p.start_idx - 1,
                         tokens=p.tokens,
                         is_embed=p.is_embed,
-                    ) for p in ps
+                    )
+                    for p in ps
                 ]
                 for modality, ps in placeholders.items()
             }
@@ -526,18 +563,20 @@ def _apply_prompt_updates(
         return token_ids, placeholders
 
 
-@MULTIMODAL_REGISTRY.register_processor(Phi3VMultiModalProcessor,
-                                        info=Phi3VProcessingInfo,
-                                        dummy_inputs=Phi3VDummyInputsBuilder)
-class Phi3VForCausalLM(nn.Module, SupportsMultiModal, SupportsPP,
-                       SupportsQuant):
+@MULTIMODAL_REGISTRY.register_processor(
+    Phi3VMultiModalProcessor,
+    info=Phi3VProcessingInfo,
+    dummy_inputs=Phi3VDummyInputsBuilder,
+)
+class Phi3VForCausalLM(nn.Module, SupportsMultiModal, SupportsPP, SupportsQuant):
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_prefix={
             "model.vision_embed_tokens.wte": "embed_tokens",
             "model.vision_embed_tokens.": "vision_embed_tokens.",
             "lm_head.": "language_model.lm_head.",
             "model.": "language_model.model.",
-        })
+        }
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -566,7 +605,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.vision_embed_tokens = Phi3HDImageEmbedding(
             config,
             self.quant_config,
-            prefix=maybe_prefix(prefix, "model.vision_embed_tokens"))
+            prefix=maybe_prefix(prefix, "model.vision_embed_tokens"),
+        )
 
         self.language_model = init_vllm_registered_model(
             vllm_config=vllm_config,
@@ -580,10 +620,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[Phi3VImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[Phi3VImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_sizes = kwargs.pop("image_sizes", None)
         image_embeds = kwargs.pop("image_embeds", None)
@@ -598,8 +640,9 @@ def _parse_and_validate_image_input(
                 image_sizes=flatten_bn(image_sizes, concat=True),
                 resolve_bindings={
                     "h": CLIP_VIT_LARGE_PATCH14_336_CONFIG.image_size,
-                    "w": CLIP_VIT_LARGE_PATCH14_336_CONFIG.image_size
-                })
+                    "w": CLIP_VIT_LARGE_PATCH14_336_CONFIG.image_size,
+                },
+            )
 
         if image_embeds is not None:
             return Phi3VImageEmbeddingInputs(
@@ -613,7 +656,6 @@ def _process_image_input(
         self,
         image_input: Phi3VImageInputs,
     ) -> torch.Tensor:
-
         if image_input["type"] == "image_embeds":
             image_data = image_input["data"]
             if is_list_of(image_data, torch.Tensor):
@@ -628,16 +670,16 @@ def _process_image_input(
             )
 
         assert self.vision_embed_tokens is not None
-        image_embeds = self.vision_embed_tokens(image_input["pixel_values"],
-                                                image_input["image_sizes"])
+        image_embeds = self.vision_embed_tokens(
+            image_input["pixel_values"], image_input["image_sizes"]
+        )
 
         return image_embeds
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -666,7 +708,8 @@ def get_input_embeddings(
             raise ValueError(
                 "`get_input_embeddings` now requires `is_multimodal` arg, "
                 "please update your model runner according to "
-                "https://github.com/vllm-project/vllm/pull/16229.")
+                "https://github.com/vllm-project/vllm/pull/16229."
+            )
 
         return _merge_multimodal_embeddings(
             inputs_embeds=inputs_embeds,
@@ -674,20 +717,20 @@ def get_input_embeddings(
             is_multimodal=is_multimodal,
         )
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs: object):
-
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs: object,
+    ):
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.language_model.model(input_ids,
-                                                  positions,
-                                                  intermediate_tensors,
-                                                  inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
 
         return hidden_states
 
@@ -697,12 +740,9 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
-        autoloaded_weights = loader.load_weights(weights,
-                                                 mapper=self.hf_to_vllm_mapper)
+        autoloaded_weights = loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
         # The HF config doesn't specify whether these are tied,
         # so we detect it this way
diff --git a/vllm/model_executor/models/phi4_multimodal.py b/vllm/model_executor/models/phi4_multimodal.py
index a5cc87d327b5..002233d0677b 100644
--- a/vllm/model_executor/models/phi4_multimodal.py
+++ b/vllm/model_executor/models/phi4_multimodal.py
@@ -8,35 +8,60 @@
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
-from transformers import (BatchFeature, Phi4MultimodalAudioConfig,
-                          Phi4MultimodalConfig, Phi4MultimodalFeatureExtractor,
-                          Phi4MultimodalImageProcessorFast)
+from transformers import (
+    BatchFeature,
+    Phi4MultimodalAudioConfig,
+    Phi4MultimodalConfig,
+    Phi4MultimodalFeatureExtractor,
+    Phi4MultimodalImageProcessorFast,
+)
 from transformers import Phi4MultimodalProcessor as Phi4MMProcessor
 from transformers.models.phi4_multimodal.modeling_phi4_multimodal import (
-    Phi4MultimodalAudioConvModule, Phi4MultimodalAudioNemoConvSubsampling,
-    Phi4MultimodalAudioRelativeAttentionBias, adaptive_enc_mask, unfold_tensor)
+    Phi4MultimodalAudioConvModule,
+    Phi4MultimodalAudioNemoConvSubsampling,
+    Phi4MultimodalAudioRelativeAttentionBias,
+    adaptive_enc_mask,
+    unfold_tensor,
+)
 
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
-from vllm.distributed import (divide, get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size)
+from vllm.distributed import (
+    divide,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.model_executor.layers.activation import MulAndSilu, get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems, NestedTensors)
-from vllm.multimodal.parse import (AudioProcessorItems, ImageEmbeddingItems,
-                                   ImageProcessorItems, ImageSize,
-                                   MultiModalDataItems, MultiModalDataParser)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+    NestedTensors,
+)
+from vllm.multimodal.parse import (
+    AudioProcessorItems,
+    ImageEmbeddingItems,
+    ImageProcessorItems,
+    ImageSize,
+    MultiModalDataItems,
+    MultiModalDataParser,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils import is_list_of
@@ -44,14 +69,20 @@
 
 from .idefics2_vision_model import Idefics2VisionTransformer
 from .interfaces import MultiModalEmbeddings, SupportsLoRA, SupportsMultiModal
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
-                    init_vllm_registered_model, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 
 _AUDIO_MAX_SOUNDFILE_SIZE = 241_000
 
 
-def _get_padding_size(orig_width: int, orig_height: int, target_height: int,
-                      target_width: int):
+def _get_padding_size(
+    orig_width: int, orig_height: int, target_height: int, target_width: int
+):
     ratio_width = target_width / orig_width
     ratio_height = target_height / orig_height
 
@@ -65,7 +96,6 @@ def _get_padding_size(orig_width: int, orig_height: int, target_height: int,
 
 
 class Phi4MMProjector(nn.Module):
-
     def __init__(self, input_size: int, hidden_size: int):
         super().__init__()
         self.up = ColumnParallelLinear(input_size, hidden_size)
@@ -89,41 +119,44 @@ def __init__(self, config: Phi4MultimodalConfig):
         self.crop_size = config.vision_config.crop_size
         self.image_dim_out = config.vision_config.hidden_size
 
-        n_patches = (config.vision_config.image_size //
-                     config.vision_config.patch_size)
+        n_patches = config.vision_config.image_size // config.vision_config.patch_size
         if n_patches % 2 != 0:
             self.img_processor_padding = nn.ReflectionPad2d((0, 1, 0, 1))
             n_patches += 1
-        self.num_img_tokens = (n_patches // 2)**2
+        self.num_img_tokens = (n_patches // 2) ** 2
 
-        num_hidden_layers = (config.vision_config.num_hidden_layers +
-                             self.layer_idx +
-                             1 if self.layer_idx < 0 else self.layer_idx + 1)
+        num_hidden_layers = (
+            config.vision_config.num_hidden_layers + self.layer_idx + 1
+            if self.layer_idx < 0
+            else self.layer_idx + 1
+        )
         self.img_processor = Idefics2VisionTransformer(
             config.vision_config,
             require_post_norm=False,
-            num_hidden_layers_override=num_hidden_layers)
+            num_hidden_layers_override=num_hidden_layers,
+        )
         self.image_token_compression = nn.AvgPool2d(kernel_size=2, stride=2)
-        self.img_projection = Phi4MMProjector(self.image_dim_out,
-                                              config.hidden_size)
+        self.img_projection = Phi4MMProjector(self.image_dim_out, config.hidden_size)
         self.global_img_feature_extensor = nn.Parameter(
-            torch.zeros([1, 1, self.image_dim_out]))
+            torch.zeros([1, 1, self.image_dim_out])
+        )
         self.sub_img_feature_extensor = nn.Parameter(
-            torch.zeros([1, 1, 1, self.image_dim_out]))
+            torch.zeros([1, 1, 1, self.image_dim_out])
+        )
 
     def get_img_features(
         self,
         img_embeds: torch.FloatTensor,
         attention_mask: Optional[torch.Tensor] = None,
     ) -> torch.FloatTensor:
-        img_feature = self.img_processor(img_embeds,
-                                         patch_attention_mask=attention_mask)
+        img_feature = self.img_processor(
+            img_embeds, patch_attention_mask=attention_mask
+        )
 
         patch_feature = img_feature
         # reshape to 2D tensor
         width = int(math.sqrt(patch_feature.size(1)))
-        patch_feature = patch_feature.view(-1, width, width,
-                                           patch_feature.size(-1))
+        patch_feature = patch_feature.view(-1, width, width, patch_feature.size(-1))
         # convert to NCHW
         patch_feature = patch_feature.permute(0, 3, 1, 2)
         if getattr(self, "img_processor_padding", None) is not None:
@@ -132,9 +165,8 @@ def get_img_features(
         # convert to NHWC
         patch_feature = patch_feature.permute(0, 2, 3, 1)
         patch_feature = patch_feature.view(
-            -1,
-            patch_feature.size(1) * patch_feature.size(2),
-            patch_feature.size(-1))
+            -1, patch_feature.size(1) * patch_feature.size(2), patch_feature.size(-1)
+        )
         return patch_feature
 
     def forward(
@@ -144,7 +176,8 @@ def forward(
         image_attention_mask: Optional[torch.Tensor] = None,
     ) -> torch.FloatTensor:
         image_pixel_values = image_pixel_values.to(
-            self.img_processor.embeddings.patch_embedding.weight.dtype)
+            self.img_processor.embeddings.patch_embedding.weight.dtype
+        )
 
         target_device = self.img_projection.up.bias.device
         target_dtype = self.img_projection.up.bias.dtype
@@ -154,11 +187,13 @@ def forward(
         img_features = self.get_img_features(
             image_pixel_values.flatten(0, 1),
             attention_mask=image_attention_mask.flatten(0, 1).to(
-                dtype=bool, device=target_device),
+                dtype=bool, device=target_device
+            ),
         )
         base_feat_size = int(np.sqrt(img_features.shape[1]))
-        img_features = img_features.view(batch_size, -1, base_feat_size**2,
-                                         self.image_dim_out)
+        img_features = img_features.view(
+            batch_size, -1, base_feat_size**2, self.image_dim_out
+        )
         image_sizes = image_sizes.view(-1, 2)
 
         output_imgs = []
@@ -169,58 +204,70 @@ def forward(
             area_ratio = height_ratio * width_ratio
 
             global_img = img_features[idx, :1]
-            global_img = global_img.reshape(1, base_feat_size, base_feat_size,
-                                            self.image_dim_out).contiguous()
+            global_img = global_img.reshape(
+                1, base_feat_size, base_feat_size, self.image_dim_out
+            ).contiguous()
             temporary_extensor = self.sub_img_feature_extensor.repeat(
-                1, base_feat_size, 1, 1)
-            global_img = torch.cat([global_img, temporary_extensor],
-                                   dim=2).reshape(1, -1, self.image_dim_out)
+                1, base_feat_size, 1, 1
+            )
+            global_img = torch.cat([global_img, temporary_extensor], dim=2).reshape(
+                1, -1, self.image_dim_out
+            )
 
             sub_img = img_features[idx, 1:]
             sub_img = sub_img[:area_ratio]
-            sub_img = (sub_img.reshape(
-                height_ratio, width_ratio, base_feat_size, base_feat_size,
-                self.image_dim_out).transpose(1, 2).reshape(
-                    1, height_ratio * base_feat_size,
+            sub_img = (
+                sub_img.reshape(
+                    height_ratio,
+                    width_ratio,
+                    base_feat_size,
+                    base_feat_size,
+                    self.image_dim_out,
+                )
+                .transpose(1, 2)
+                .reshape(
+                    1,
+                    height_ratio * base_feat_size,
                     width_ratio * base_feat_size,
-                    self.image_dim_out).contiguous())
+                    self.image_dim_out,
+                )
+                .contiguous()
+            )
 
             if image_attention_mask is not None:
                 reshaped_image_attention_mask = (
-                    image_attention_mask[idx, 1:area_ratio + 1,
-                                         0::2, 0::2].reshape(
-                                             height_ratio, width_ratio,
-                                             base_feat_size,
-                                             base_feat_size).transpose(
-                                                 1, 2).reshape(
-                                                     1, height_ratio *
-                                                     base_feat_size,
-                                                     width_ratio *
-                                                     base_feat_size))
-                useful_height = int(
-                    reshaped_image_attention_mask[0, :, 0].sum().item())
-                useful_width = int(
-                    reshaped_image_attention_mask[0, 0, :].sum().item())
+                    image_attention_mask[idx, 1 : area_ratio + 1, 0::2, 0::2]
+                    .reshape(height_ratio, width_ratio, base_feat_size, base_feat_size)
+                    .transpose(1, 2)
+                    .reshape(
+                        1, height_ratio * base_feat_size, width_ratio * base_feat_size
+                    )
+                )
+                useful_height = int(reshaped_image_attention_mask[0, :, 0].sum().item())
+                useful_width = int(reshaped_image_attention_mask[0, 0, :].sum().item())
                 sub_img = sub_img[:, :useful_height, :useful_width]
                 temporary_extensor = self.sub_img_feature_extensor.repeat(
-                    1, useful_height, 1, 1)
+                    1, useful_height, 1, 1
+                )
             else:
                 temporary_extensor = self.sub_img_feature_extensor.repeat(
-                    1, height_ratio * base_feat_size, 1, 1)
+                    1, height_ratio * base_feat_size, 1, 1
+                )
 
-            sub_img = torch.cat([sub_img, temporary_extensor],
-                                dim=2).reshape(1, -1, self.image_dim_out)
+            sub_img = torch.cat([sub_img, temporary_extensor], dim=2).reshape(
+                1, -1, self.image_dim_out
+            )
 
             # Merge global and sub
             output_imgs.append(
                 torch.cat(
-                    [sub_img, self.global_img_feature_extensor, global_img],
-                    dim=1))
+                    [sub_img, self.global_img_feature_extensor, global_img], dim=1
+                )
+            )
 
         img_set_tensor = []
         for output_img in output_imgs:
-            output_img = output_img.to(device=target_device,
-                                       dtype=target_dtype)
+            output_img = output_img.to(device=target_device, dtype=target_dtype)
             img_feature_proj = self.img_projection(output_img)
             img_set_tensor.append(img_feature_proj.flatten(0, 1))
 
@@ -228,7 +275,6 @@ def forward(
 
 
 class Phi4MultimodalAudioMLP(nn.Module):
-
     def __init__(
         self,
         config: Phi4MultimodalAudioConfig,
@@ -239,15 +285,19 @@ def __init__(
         self.layer_norm = nn.LayerNorm(config.hidden_size)
         self.act_fn = MulAndSilu()
         self.gate_up_proj = MergedColumnParallelLinear(
-            config.hidden_size, [config.intermediate_size] * 2,
+            config.hidden_size,
+            [config.intermediate_size] * 2,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.gate_up_proj",
+        )
+        self.down_proj = RowParallelLinear(
+            config.intermediate_size,
+            config.hidden_size,
             bias=True,
             quant_config=quant_config,
-            prefix=f"{prefix}.gate_up_proj")
-        self.down_proj = RowParallelLinear(config.intermediate_size,
-                                           config.hidden_size,
-                                           bias=True,
-                                           quant_config=quant_config,
-                                           prefix=f"{prefix}.down_proj")
+            prefix=f"{prefix}.down_proj",
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         hidden_states = self.layer_norm(hidden_states)
@@ -258,7 +308,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class Phi4MultimodalAudioAttention(nn.Module):
-
     def __init__(
         self,
         config: Phi4MultimodalAudioConfig,
@@ -274,7 +323,8 @@ def __init__(
             raise ValueError(
                 "embed_dim must be divisible by num_heads "
                 f"(got `embed_dim`: {self.embed_dim} and `num_heads`:"
-                f" {self.num_heads}).")
+                f" {self.num_heads})."
+            )
         self.scale = self.head_dim**-0.5
 
         self.qkv_proj = QKVParallelLinear(
@@ -331,7 +381,6 @@ def forward(
 
 
 class Phi4MultimodalAudioConformerEncoderLayer(nn.Module):
-
     def __init__(self, config: Phi4MultimodalAudioConfig):
         super().__init__()
 
@@ -350,11 +399,9 @@ def forward(
         residual = hidden_states + 0.5 * self.feed_forward_in(hidden_states)
         hidden_states = self.layer_norm_att(residual)
 
-        hidden_states = residual + self.self_attn(hidden_states,
-                                                  attention_mask)
+        hidden_states = residual + self.self_attn(hidden_states, attention_mask)
         hidden_states = hidden_states + self.conv(hidden_states)
-        hidden_states = hidden_states + 0.5 * self.feed_forward_out(
-            hidden_states)
+        hidden_states = hidden_states + 0.5 * self.feed_forward_out(hidden_states)
 
         out = self.layer_norm(hidden_states)
 
@@ -368,7 +415,7 @@ class Phi4MMAudioMeanVarianceNormLayer(nn.Module):
     Typically used as a very first layer in a model.
 
     Args:
-        config: [Phi4MultimodalAudioConfig](https://huggingface.co/docs/transformers/model_doc/phi4_multimodal#transformers.Phi4MultimodalAudioConfig) 
+        config: [Phi4MultimodalAudioConfig](https://huggingface.co/docs/transformers/model_doc/phi4_multimodal#transformers.Phi4MultimodalAudioConfig)
             object containing model parameters.
     """
 
@@ -388,19 +435,21 @@ def forward(self, input_: torch.Tensor) -> torch.Tensor:
 
 
 class Phi4MultimodalAudioModel(nn.Module):
-
     def __init__(self, config: Phi4MultimodalAudioConfig):
         super().__init__()
         self.config = config
 
         self.encoder_embedding = Phi4MMAudioMeanVarianceNormLayer(config)
         self.embed = Phi4MultimodalAudioNemoConvSubsampling(config)
-        self.relative_attention_bias_layer = (
-            Phi4MultimodalAudioRelativeAttentionBias(config))
-        self.encoders = nn.ModuleList([
-            Phi4MultimodalAudioConformerEncoderLayer(config)
-            for _ in range(config.num_blocks)
-        ])
+        self.relative_attention_bias_layer = Phi4MultimodalAudioRelativeAttentionBias(
+            config
+        )
+        self.encoders = nn.ModuleList(
+            [
+                Phi4MultimodalAudioConformerEncoderLayer(config)
+                for _ in range(config.num_blocks)
+            ]
+        )
 
     def _streaming_mask(
         self,
@@ -413,9 +462,11 @@ def _streaming_mask(
         # S stores start index. if chunksize is 18, s is [0,18,36,....]
         chunk_start_idx = np.arange(0, seq_len, chunk_size)
 
-        enc_streaming_mask = (adaptive_enc_mask(
-            seq_len, chunk_start_idx,
-            left_window=left_chunk).unsqueeze(0).expand([batch_size, -1, -1]))
+        enc_streaming_mask = (
+            adaptive_enc_mask(seq_len, chunk_start_idx, left_window=left_chunk)
+            .unsqueeze(0)
+            .expand([batch_size, -1, -1])
+        )
         return enc_streaming_mask
 
     def forward_embeddings(
@@ -424,18 +475,18 @@ def forward_embeddings(
         masks: torch.Tensor,
     ):
         """Forwarding the inputs through the top embedding layers"""
-        seq_len = math.ceil(hidden_states.shape[1] /
-                            self.config.time_reduction)
+        seq_len = math.ceil(hidden_states.shape[1] / self.config.time_reduction)
         if seq_len <= 0:
             raise ValueError(
                 f"Sequence length after time reduction is invalid: {seq_len}."
-                "Your input feature is too short.")
+                "Your input feature is too short."
+            )
 
         batch_size = hidden_states.shape[0]
 
-        enc_streaming_mask = self._streaming_mask(seq_len, batch_size,
-                                                  self.config.chunk_size,
-                                                  self.config.left_chunk)
+        enc_streaming_mask = self._streaming_mask(
+            seq_len, batch_size, self.config.chunk_size, self.config.left_chunk
+        )
         enc_streaming_mask = enc_streaming_mask.to(hidden_states.device)
 
         hidden_states, masks = self.embed(hidden_states, masks)
@@ -450,13 +501,14 @@ def forward_embeddings(
 
         return hidden_states, hs_mask, masks
 
-    def calculate_hs_mask(self, hidden_states: torch.Tensor,
-                          device: torch.device, mask: torch.Tensor):
+    def calculate_hs_mask(
+        self, hidden_states: torch.Tensor, device: torch.device, mask: torch.Tensor
+    ):
         max_audio_length = hidden_states.shape[1]
         batch_size = hidden_states.shape[0]
-        enc_streaming_mask = self._streaming_mask(max_audio_length, batch_size,
-                                                  self.config.chunk_size,
-                                                  self.config.left_chunk)
+        enc_streaming_mask = self._streaming_mask(
+            max_audio_length, batch_size, self.config.chunk_size, self.config.left_chunk
+        )
         enc_streaming_mask = enc_streaming_mask.to(device)
         if mask is None:
             return enc_streaming_mask
@@ -464,17 +516,15 @@ def calculate_hs_mask(self, hidden_states: torch.Tensor,
         feature_lens = mask.sum(1)
         padding_length = feature_lens
         pad_mask = torch.arange(0, max_audio_length, device=device).expand(
-            padding_length.size(0), -1) < padding_length.unsqueeze(1)
+            padding_length.size(0), -1
+        ) < padding_length.unsqueeze(1)
         pad_mask = pad_mask.unsqueeze(1)
         pad_mask = pad_mask & enc_streaming_mask
         return pad_mask
 
-    def forward(self,
-                hidden_states: torch.Tensor,
-                mask: Optional[torch.Tensor] = None):
+    def forward(self, hidden_states: torch.Tensor, mask: Optional[torch.Tensor] = None):
         hidden_states = self.encoder_embedding(hidden_states)
-        hidden_states, hs_mask, mask = self.forward_embeddings(
-            hidden_states, mask)
+        hidden_states, hs_mask, mask = self.forward_embeddings(hidden_states, mask)
 
         unfolded = False
         bs, seq_len, _ = hidden_states.shape
@@ -490,9 +540,9 @@ def forward(self,
             else:
                 chunk_pad_size = 0
             if chunk_pad_size > 0:
-                hidden_states_pad = F.pad(hidden_states,
-                                          (0, 0, 0, chunk_pad_size),
-                                          "constant", 0)
+                hidden_states_pad = F.pad(
+                    hidden_states, (0, 0, 0, chunk_pad_size), "constant", 0
+                )
                 hidden_states = hidden_states_pad.to(hidden_states.device)
 
             hidden_states = unfold_tensor(hidden_states, max_seq_len)
@@ -500,24 +550,24 @@ def forward(self,
             if mask is not None:
                 # revise hs_mask here because the previous calculated hs_mask
                 # did not consider extra pad
-                subsampled_pad_mask = mask.squeeze(
-                    1)  # [bz, subsampled_unmask_seq_len]
+                subsampled_pad_mask = mask.squeeze(1)  # [bz, subsampled_unmask_seq_len]
                 extra_padded_subsamlped_pad_mask = F.pad(
-                    subsampled_pad_mask, (0, chunk_pad_size), "constant",
-                    False)  # extra padding to the pad mask
+                    subsampled_pad_mask, (0, chunk_pad_size), "constant", False
+                )  # extra padding to the pad mask
                 extra_padded_subsamlped_pad_mask = (
-                    extra_padded_subsamlped_pad_mask.unsqueeze(-1).float())
+                    extra_padded_subsamlped_pad_mask.unsqueeze(-1).float()
+                )
                 masks_unfold = unfold_tensor(
                     extra_padded_subsamlped_pad_mask, max_seq_len
                 )  # unfold the pad mask like we did to the input tensor
                 masks_unfold = masks_unfold.squeeze(
-                    -1).bool()  # unfold op does not support bool tensor
+                    -1
+                ).bool()  # unfold op does not support bool tensor
             hs_mask = self.calculate_hs_mask(
                 hidden_states, hidden_states.device, masks_unfold
             )  # calculate hs_mask based on the unfolded pad mask
 
-        relative_attention_bias = self.relative_attention_bias_layer(
-            hidden_states)
+        relative_attention_bias = self.relative_attention_bias_layer(hidden_states)
         attention_mask = hs_mask.unsqueeze(1) + relative_attention_bias
 
         for layer in self.encoders:
@@ -534,7 +584,6 @@ def forward(self,
 
 
 class Phi4MMAudioEmbedding(nn.Module):
-
     def __init__(self, config: Phi4MultimodalConfig):
         super().__init__()
         self.config = config
@@ -543,12 +592,11 @@ def __init__(self, config: Phi4MultimodalConfig):
         self.encoder = Phi4MultimodalAudioModel(config.audio_config)
 
         audio_config = config.audio_config
-        proj_input_size = (audio_config.hidden_size *
-                           audio_config.downsample_rate)
+        proj_input_size = audio_config.hidden_size * audio_config.downsample_rate
         self.vision_speech_projection = Phi4MMProjector(
-            proj_input_size, config.hidden_size)
-        self.speech_projection = Phi4MMProjector(proj_input_size,
-                                                 config.hidden_size)
+            proj_input_size, config.hidden_size
+        )
+        self.speech_projection = Phi4MMProjector(proj_input_size, config.hidden_size)
 
     def get_projection(
         self,
@@ -566,23 +614,23 @@ def forward(
         audio_attention_mask=None,
         audio_projection_mode="speech",
     ) -> torch.FloatTensor:
-
         audio_projection = self.get_projection(audio_projection_mode)
 
         target_device = audio_projection.up.bias.device
         target_dtype = audio_projection.up.bias.dtype
 
-        audio_input_features = audio_input_features.to(device=target_device,
-                                                       dtype=target_dtype)
+        audio_input_features = audio_input_features.to(
+            device=target_device, dtype=target_dtype
+        )
 
-        audio_encoder_hidden_states = self.encoder(audio_input_features,
-                                                   audio_attention_mask)
+        audio_encoder_hidden_states = self.encoder(
+            audio_input_features, audio_attention_mask
+        )
         audio_embeds = audio_projection(audio_encoder_hidden_states)
 
         return audio_embeds.flatten(0, 1)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -603,8 +651,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -627,8 +674,9 @@ class Phi4MMImagePixelInputs(TensorSchema):
 
     data: Annotated[
         Union[torch.Tensor, list[torch.Tensor]],
-        TensorShape("bn", "p", 3, "h", "w", dynamic_dims={"p"}
-                    ),  # may be different per batch and image
+        TensorShape(
+            "bn", "p", 3, "h", "w", dynamic_dims={"p"}
+        ),  # may be different per batch and image
     ]
 
     image_sizes: Annotated[
@@ -705,9 +753,9 @@ def cat_with_pad(tensors, dim, padding_value=0):
     cat along dim, while pad to max for all other dims
     """
     ndim = tensors[0].dim()
-    assert all(
-        t.dim() == ndim for t in
-        tensors[1:]), "All tensors must have the same number of dimensions"
+    assert all(t.dim() == ndim for t in tensors[1:]), (
+        "All tensors must have the same number of dimensions"
+    )
 
     out_size = [max(t.shape[i] for t in tensors) for i in range(ndim)]
     out_size[dim] = sum(t.shape[dim] for t in tensors)
@@ -727,15 +775,13 @@ def cat_with_pad(tensors, dim, padding_value=0):
 
 
 class Phi4MMProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self) -> Phi4MultimodalConfig:
         return self.ctx.get_hf_config(Phi4MultimodalConfig)
 
     def get_hf_processor(self, **kwargs: object) -> Phi4MMProcessor:
         return self.ctx.get_hf_processor(Phi4MMProcessor, **kwargs)
 
-    def get_feature_extractor(
-            self, **kwargs: object) -> Phi4MultimodalFeatureExtractor:
+    def get_feature_extractor(self, **kwargs: object) -> Phi4MultimodalFeatureExtractor:
         return self.get_hf_processor(**kwargs).audio_processor
 
     def get_image_processor(
@@ -769,9 +815,12 @@ def _find_target_aspect_ratio(
             aspect_ratio = orig_width / orig_height
 
             # calculate the existing image aspect ratio
-            target_ratios = set((i, j) for i in range(1, max_num + 1)
-                                for j in range(1, max_num + 1)
-                                if i * j <= max_num and i * j >= min_num)
+            target_ratios = set(
+                (i, j)
+                for i in range(1, max_num + 1)
+                for j in range(1, max_num + 1)
+                if i * j <= max_num and i * j >= min_num
+            )
             target_ratios = sorted(target_ratios, key=lambda x: x[0] * x[1])
 
             # find the closest aspect ratio to the target
@@ -804,49 +853,56 @@ def _compute_num_image_tokens(
     ):
         """
         compute the number of tokens an image is expected to take up considering
-        the image encoder architecture and exclude output features containing 
+        the image encoder architecture and exclude output features containing
         only padding pixels
 
-        for siglip, vit_image_size=448, vit_patch_size=14, so output will be 
+        for siglip, vit_image_size=448, vit_patch_size=14, so output will be
         32x32 feature map
         NOTE right now, Phi4MM uses hard-coded token_compression_factor=2
         """
         assert vit_image_size % vit_patch_size == 0, (
-            "vit_image_size must be divisible by vit_patch_size")
-        assert (vit_image_size // vit_patch_size %
-                token_compression_factor == 0), (
-                    "vit_image_size // vit_patch_size must be divisible by "
-                    "token_compression_factor")
+            "vit_image_size must be divisible by vit_patch_size"
+        )
+        assert vit_image_size // vit_patch_size % token_compression_factor == 0, (
+            "vit_image_size // vit_patch_size must be divisible by "
+            "token_compression_factor"
+        )
 
         target_aspect_ratio, target_height, target_width = (
-            self._find_target_aspect_ratio(orig_width,
-                                           orig_height,
-                                           vit_image_size,
-                                           dynamic_hd_size,
-                                           min_num=1))
+            self._find_target_aspect_ratio(
+                orig_width, orig_height, vit_image_size, dynamic_hd_size, min_num=1
+            )
+        )
         assert target_aspect_ratio[0] * vit_image_size == target_width, (
-            f"{target_aspect_ratio[0]} * {vit_image_size} != {target_width}")
+            f"{target_aspect_ratio[0]} * {vit_image_size} != {target_width}"
+        )
         assert target_aspect_ratio[1] * vit_image_size == target_height, (
-            f"{target_aspect_ratio[1]} * {vit_image_size} != {target_height}")
-        assert (target_height % vit_image_size == 0
-                and target_width % vit_image_size == 0)
+            f"{target_aspect_ratio[1]} * {vit_image_size} != {target_height}"
+        )
+        assert (
+            target_height % vit_image_size == 0 and target_width % vit_image_size == 0
+        )
 
         padding_height, padding_width = _get_padding_size(
-            orig_width, orig_height, target_height, target_width)
-        assert padding_width == 0 or padding_height == 0, \
+            orig_width, orig_height, target_height, target_width
+        )
+        assert padding_width == 0 or padding_height == 0, (
             "padding_width or padding_height must be 0"
+        )
 
         target_feat_width = target_width // vit_patch_size
         target_feat_height = target_height // vit_patch_size
         if padding_width >= vit_patch_size:
             assert padding_height == 0, "padding_height not 0"
             non_pad_feat_width = target_feat_width - math.floor(
-                padding_width / vit_patch_size)
+                padding_width / vit_patch_size
+            )
             non_pad_feat_height = target_feat_height
         elif padding_height >= vit_patch_size:
             assert padding_width == 0, "padding_width not 0"
             non_pad_feat_height = target_feat_height - math.floor(
-                padding_height / vit_patch_size)
+                padding_height / vit_patch_size
+            )
             non_pad_feat_width = target_feat_width
         else:
             # small padding shorter than a vit patch
@@ -863,15 +919,17 @@ def _compute_num_image_tokens(
         num_hd_patch_tokens = feat_width * feat_height
         num_hd_newline_tokens = feat_height
         vit_feature_size = vit_image_size // vit_patch_size
-        num_global_image_tokens = (vit_feature_size //
-                                   token_compression_factor)**2
+        num_global_image_tokens = (vit_feature_size // token_compression_factor) ** 2
         num_sep_tokens = 1
-        num_global_image_newline_tokens = \
-            vit_feature_size // token_compression_factor
-
-        return (num_global_image_tokens + num_sep_tokens +
-                num_hd_patch_tokens + num_hd_newline_tokens +
-                num_global_image_newline_tokens)
+        num_global_image_newline_tokens = vit_feature_size // token_compression_factor
+
+        return (
+            num_global_image_tokens
+            + num_sep_tokens
+            + num_hd_patch_tokens
+            + num_hd_newline_tokens
+            + num_global_image_newline_tokens
+        )
 
     def get_num_image_tokens(
         self,
@@ -966,7 +1024,6 @@ def _compute_audio_embed_size(self, audio_frames: int) -> int:
 
 
 class Phi4MMDummyInputsBuilder(BaseDummyInputsBuilder[Phi4MMProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_audios = mm_counts.get("audio", 0)
         num_images = mm_counts.get("image", 0)
@@ -986,29 +1043,29 @@ def get_dummy_mm_data(
         num_audios = mm_counts.get("audio", 0)
         num_images = mm_counts.get("image", 0)
 
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
 
         image_overrides = mm_options.get("image") if mm_options else None
         audio_overrides = mm_options.get("audio") if mm_options else None
 
         mm_data = {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
-            "audio":
-            self._get_dummy_audios(length=_AUDIO_MAX_SOUNDFILE_SIZE,
-                                   num_audios=num_audios,
-                                   overrides=audio_overrides),
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
+            "audio": self._get_dummy_audios(
+                length=_AUDIO_MAX_SOUNDFILE_SIZE,
+                num_audios=num_audios,
+                overrides=audio_overrides,
+            ),
         }
 
         return mm_data
 
 
 class Phi4MMMultiModalProcessor(BaseMultiModalProcessor[Phi4MMProcessingInfo]):
-
     def _get_data_parser(self) -> MultiModalDataParser:
         feature_extractor = self.info.get_feature_extractor()
         return MultiModalDataParser(target_sr=feature_extractor.sampling_rate)
@@ -1027,29 +1084,29 @@ def _call_hf_processor(
 
         audio_data = mm_data.pop("audios", [])
         if audio_data:
-            mm_data['audio'] = audio_data
+            mm_data["audio"] = audio_data
 
-        processed_outputs = super()._call_hf_processor(prompt, mm_data,
-                                                       mm_kwargs, tok_kwargs)
+        processed_outputs = super()._call_hf_processor(
+            prompt, mm_data, mm_kwargs, tok_kwargs
+        )
 
         if "image_pixel_values" in processed_outputs:
             num_img_tokens = [
-                self.info.get_num_image_tokens(image_width=img_size[0],
-                                               image_height=img_size[1])
+                self.info.get_num_image_tokens(
+                    image_width=img_size[0], image_height=img_size[1]
+                )
                 for img_size in processed_outputs["image_sizes"]
             ]
             processed_outputs["num_img_tokens"] = num_img_tokens
 
         if audio_data:
-            audio_features = processed_outputs['audio_input_features']
+            audio_features = processed_outputs["audio_input_features"]
             sr = self.info.get_feature_extractor(**mm_kwargs).sampling_rate
             feature_sizes = [
-                self.info.get_audio_num_frames(len(audio), sr)
-                for audio in audio_data
+                self.info.get_audio_num_frames(len(audio), sr) for audio in audio_data
             ]
-            processed_outputs['audio_input_features'] = [
-                audio_features[idx, :size]
-                for idx, size in enumerate(feature_sizes)
+            processed_outputs["audio_input_features"] = [
+                audio_features[idx, :size] for idx, size in enumerate(feature_sizes)
             ]
 
         return processed_outputs
@@ -1078,12 +1135,12 @@ def _get_prompt_updates(
         audio_token_id: int = tokenizer.vocab[tokenizer.audio_token]
 
         hf_processor = self.info.get_hf_processor(**hf_processor_mm_kwargs)
-        audio_processor = self.info.get_feature_extractor(
-            **hf_processor_mm_kwargs)
+        audio_processor = self.info.get_feature_extractor(**hf_processor_mm_kwargs)
 
         def get_image_replacement_phi4mm(item_idx: int):
             images = mm_items.get_items(
-                "image", (ImageEmbeddingItems, ImageProcessorItems))
+                "image", (ImageEmbeddingItems, ImageProcessorItems)
+            )
 
             if isinstance(images, ImageEmbeddingItems):
                 num_image_tokens = images.get_feature_size(item_idx)
@@ -1102,9 +1159,9 @@ def get_audio_replacement_phi4mm(item_idx: int):
             # TODO(Isotr0py): support embedding inputs
             audio_len = audios.get_audio_length(item_idx)
             audio_frames = self.info.get_audio_num_frames(
-                audio_len, audio_processor.sampling_rate)
-            audio_embed_size = self.info._compute_audio_embed_size(
-                audio_frames)
+                audio_len, audio_processor.sampling_rate
+            )
+            audio_embed_size = self.info._compute_audio_embed_size(audio_frames)
 
             return [audio_token_id] * audio_embed_size
 
@@ -1131,6 +1188,7 @@ class Phi4MultimodalForCausalLM(nn.Module, SupportsLoRA, SupportsMultiModal):
     """
     Implements the Phi-4-multimodal-instruct model in vLLM.
     """
+
     packed_modules_mapping = {
         "qkv_proj": [
             "qkv_proj",
@@ -1190,12 +1248,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_audio_input(
-            self, **kwargs: object) -> Optional[Phi4MMAudioInputs]:
+        self, **kwargs: object
+    ) -> Optional[Phi4MMAudioInputs]:
         """
-        Parse and validate the audio input to the model.  This handles both 
+        Parse and validate the audio input to the model.  This handles both
         audio features and audio embeddings, but only the former is used for
         now.
 
@@ -1212,17 +1272,18 @@ def _parse_and_validate_audio_input(
             return None
 
         if audio_features is not None:
-            return Phi4MMAudioFeatureInputs(type="audio_features",
-                                            data=flatten_bn(audio_features))
+            return Phi4MMAudioFeatureInputs(
+                type="audio_features", data=flatten_bn(audio_features)
+            )
 
         if audio_embeds is not None:
-            return Phi4MMAudioEmbeddingInputs(type="audio_embeds",
-                                              data=audio_embeds)
+            return Phi4MMAudioEmbeddingInputs(type="audio_embeds", data=audio_embeds)
 
         raise AssertionError("This line should be unreachable.")
 
-    def _process_audio_input(self, audio_input: Phi4MMAudioInputs,
-                             audio_projection_mode: str) -> NestedTensors:
+    def _process_audio_input(
+        self, audio_input: Phi4MMAudioInputs, audio_projection_mode: str
+    ) -> NestedTensors:
         """
         Create the audio embeddings from the audio input, where the audio input
         is pairs of audio features and audio embed lengths.  The audio input is
@@ -1246,12 +1307,14 @@ def _process_audio_input(self, audio_input: Phi4MMAudioInputs,
             self.audio_embed(
                 features.unsqueeze(0).to(dtype),
                 audio_projection_mode=audio_projection_mode,
-            ) for features in audio_features
+            )
+            for features in audio_features
         ]
         return audio_embeds
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[Phi4MMImagePixelInputs]:
+        self, **kwargs: object
+    ) -> Optional[Phi4MMImagePixelInputs]:
         image_pixel_values: NestedTensors = kwargs.get("image_pixel_values")
         if image_pixel_values is None:
             return None
@@ -1259,12 +1322,16 @@ def _parse_and_validate_image_input(
         image_sizes = kwargs.get("image_sizes")
         image_attention_mask = kwargs.get("image_attention_mask")
         num_img_tokens = kwargs.get("num_img_tokens")
-        assert image_sizes is not None and image_attention_mask is not None\
-              and num_img_tokens is not None, "Missing image inputs"
+        assert (
+            image_sizes is not None
+            and image_attention_mask is not None
+            and num_img_tokens is not None
+        ), "Missing image inputs"
 
         if is_list_of(image_pixel_values, torch.Tensor):
-            assert all(p.dim() == 5
-                       for p in image_pixel_values), "Incorrect image inputs"
+            assert all(p.dim() == 5 for p in image_pixel_values), (
+                "Incorrect image inputs"
+            )
             # list len is batch_size.
             # each tensor has dimension: num_img_per_example, num_hd_patches,
             # channels, height, width.
@@ -1297,8 +1364,7 @@ def _parse_and_validate_image_input(
 
         if isinstance(num_img_tokens, list):
             num_img_tokens = [
-                n for num_tensor in num_img_tokens
-                for n in num_tensor.tolist()
+                n for num_tensor in num_img_tokens for n in num_tensor.tolist()
             ]
         elif isinstance(num_img_tokens, torch.Tensor):
             num_img_tokens = num_img_tokens.flatten(0, 1).tolist()
@@ -1319,33 +1385,35 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if input_key in ("image_pixel_values",
-                             "image_embeds") and "images" not in modalities:
-                modalities["images"] = self._parse_and_validate_image_input(
-                    **kwargs)
-            if input_key in ("audio_input_features",
-                             "audio_embeds") and "audios" not in modalities:
-                modalities["audios"] = self._parse_and_validate_audio_input(
-                    **kwargs)
+            if (
+                input_key in ("image_pixel_values", "image_embeds")
+                and "images" not in modalities
+            ):
+                modalities["images"] = self._parse_and_validate_image_input(**kwargs)
+            if (
+                input_key in ("audio_input_features", "audio_embeds")
+                and "audios" not in modalities
+            ):
+                modalities["audios"] = self._parse_and_validate_audio_input(**kwargs)
 
         return modalities
 
     def _process_image_input(
-            self, image_input: Phi4MMImagePixelInputs) -> list[torch.Tensor]:
+        self, image_input: Phi4MMImagePixelInputs
+    ) -> list[torch.Tensor]:
         if image_input["type"] == "image_embeds":
             image_embeds = image_input["image_embeds"].type(self.visual.dtype)
         else:
             dtype = next(self.image_embed.parameters()).dtype
-            pixel_values = image_input['data'].to(dtype)
-            image_sizes = image_input['image_sizes']
-            image_attention_mask = image_input['image_attention_mask']
-            image_embeds = self.image_embed(pixel_values, image_sizes,
-                                            image_attention_mask)
+            pixel_values = image_input["data"].to(dtype)
+            image_sizes = image_input["image_sizes"]
+            image_attention_mask = image_input["image_attention_mask"]
+            image_embeds = self.image_embed(
+                pixel_values, image_sizes, image_attention_mask
+            )
         return image_embeds
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
-
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
@@ -1356,7 +1424,7 @@ def get_multimodal_embeddings(self,
 
         # NOTE: It is important to iterate over the keys in this dictionary
         # to preserve the order of the modalities.
-        audio_projection_mode = 'speech'
+        audio_projection_mode = "speech"
         for modality in modalities:
             # make sure process images first
             if modality == "images":
@@ -1367,7 +1435,8 @@ def get_multimodal_embeddings(self,
             if modality == "audios":
                 audio_input = modalities["audios"]
                 audio_embeddings = self._process_audio_input(
-                    audio_input, audio_projection_mode=audio_projection_mode)
+                    audio_input, audio_projection_mode=audio_projection_mode
+                )
                 multimodal_embeddings += tuple(audio_embeddings)
 
         return multimodal_embeddings
@@ -1398,8 +1467,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
@@ -1410,8 +1478,9 @@ def get_mm_mapping(self) -> MultiModelKeys:
         return MultiModelKeys.from_string_field(
             language_model="language_model.",
             connector=[
-                "img_projection", "vision_speech_projection",
-                "speech_projection"
+                "img_projection",
+                "vision_speech_projection",
+                "speech_projection",
             ],
             tower_model=["image_embed", "audio_embed"],
         )
diff --git a/vllm/model_executor/models/phi4mm.py b/vllm/model_executor/models/phi4mm.py
index e3529dc393cf..abe6a63b5cae 100644
--- a/vllm/model_executor/models/phi4mm.py
+++ b/vllm/model_executor/models/phi4mm.py
@@ -7,8 +7,13 @@
 import numpy as np
 import torch
 import torch.nn as nn
-from transformers import (BatchFeature, PretrainedConfig, ProcessorMixin,
-                          SequenceFeatureExtractor, SiglipVisionConfig)
+from transformers import (
+    BatchFeature,
+    PretrainedConfig,
+    ProcessorMixin,
+    SequenceFeatureExtractor,
+    SiglipVisionConfig,
+)
 
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
@@ -16,18 +21,33 @@
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+)
 from vllm.model_executor.models.llama import LlamaModel
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems, NestedTensors)
-from vllm.multimodal.parse import (AudioProcessorItems, ImageEmbeddingItems,
-                                   ImageProcessorItems, ImageSize,
-                                   MultiModalDataItems, MultiModalDataParser)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, ResolvedPromptUpdate)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+    NestedTensors,
+)
+from vllm.multimodal.parse import (
+    AudioProcessorItems,
+    ImageEmbeddingItems,
+    ImageProcessorItems,
+    ImageSize,
+    MultiModalDataItems,
+    MultiModalDataParser,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+    ResolvedPromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils import is_list_of
@@ -47,16 +67,17 @@
 
 SIGLIP_NAME = "siglip-so400m-patch14-448"
 VISION_ENCODER_TO_PROCESSING_CONFIG = {
-    'siglip-so400m-patch14-448': {
-        'vit_image_size': 448,
-        'vit_patch_size': 14,
-        'token_compression_factor': 2,
+    "siglip-so400m-patch14-448": {
+        "vit_image_size": 448,
+        "vit_patch_size": 14,
+        "token_compression_factor": 2,
     },
 }
 
 
-def _get_padding_size(orig_width: int, orig_height: int, target_height: int,
-                      target_width: int):
+def _get_padding_size(
+    orig_width: int, orig_height: int, target_height: int, target_width: int
+):
     ratio_width = target_width / orig_width
     ratio_height = target_height / orig_height
 
@@ -82,8 +103,7 @@ def get_navit_vision_model(layer_idx: int = -1, **kwargs):
 
     model_config = SiglipVisionConfig(**vision_config, **kwargs)
     if layer_idx < 0:
-        num_hidden_layers = model_config.num_hidden_layers \
-            + layer_idx + 1
+        num_hidden_layers = model_config.num_hidden_layers + layer_idx + 1
     else:
         num_hidden_layers = layer_idx + 1
 
@@ -99,38 +119,38 @@ def get_navit_vision_model(layer_idx: int = -1, **kwargs):
 class Phi4MMImageEncoder(nn.Module):
     """Image embedding."""
 
-    def __init__(self,
-                 config: PretrainedConfig,
-                 quant_config: Optional[QuantizationConfig],
-                 prefix: str = "",
-                 model_dir: str = "") -> None:
+    def __init__(
+        self,
+        config: PretrainedConfig,
+        quant_config: Optional[QuantizationConfig],
+        prefix: str = "",
+        model_dir: str = "",
+    ) -> None:
         super().__init__()
 
         # n_embed or hidden_size
-        hidden_size = config.n_embd if hasattr(
-            config, 'n_embd') else config.hidden_size
+        hidden_size = config.n_embd if hasattr(config, "n_embd") else config.hidden_size
 
         # layer_idx to output the img features
         if isinstance(config.img_processor, dict):
-            self.layer_idx = config.img_processor.get('layer_idx', -2)
-            self.type_feature = config.img_processor.get(
-                'type_feature', 'patch')
+            self.layer_idx = config.img_processor.get("layer_idx", -2)
+            self.type_feature = config.img_processor.get("type_feature", "patch")
         else:
             self.layer_idx = -2
-            self.type_feature = 'patch'
+            self.type_feature = "patch"
 
         self.img_processor = get_navit_vision_model(layer_idx=self.layer_idx)
 
         pe_weight = self.img_processor.embeddings.position_embedding.weight
         L, D = pe_weight.size()
         H = int(math.sqrt(L))
-        assert H**2 == L, f'position embedding size {L} is not square'
+        assert H**2 == L, f"position embedding size {L} is not square"
         if H % 2 != 0:
             self.img_processor_padding = nn.ReflectionPad2d((0, 1, 0, 1))
             H += 1
         image_dim_out = D
         # ((448/14)//2)**2
-        self.num_img_tokens = (H // 2)**2
+        self.num_img_tokens = (H // 2) ** 2
         self.base_feat_height_target = H
 
         self.image_dim_out = image_dim_out
@@ -145,37 +165,35 @@ def __init__(self,
         self.crop_size = 448
 
         # image token compression
-        self.image_token_compression_cls = 'avg_pool_2d'
+        self.image_token_compression_cls = "avg_pool_2d"
         self.image_token_compression = nn.AvgPool2d(kernel_size=2, stride=2)
         self.base_feat_height_reduction = 1
         self.base_feat_height_target = self.base_feat_height_target // 2
 
         # with_hd_transform and with_learnable_separator should have same value
-        assert self.use_hd_transform == self.with_learnable_separator, \
-        'use_hd_transform and with_learnable_separator should have same value'
-        assert self.use_hd_transform, \
-            'learnable separator is only for hd transform'
+        assert self.use_hd_transform == self.with_learnable_separator, (
+            "use_hd_transform and with_learnable_separator should have same value"
+        )
+        assert self.use_hd_transform, "learnable separator is only for hd transform"
         # 1024 * 4, merge spatial to channel dimension
         self.glb_GN = nn.Parameter(
-            torch.zeros([
-                1, 1, self.image_dim_out * self.base_feat_height_reduction**2
-            ]))
+            torch.zeros([1, 1, self.image_dim_out * self.base_feat_height_reduction**2])
+        )
         self.sub_GN = nn.Parameter(
-            torch.zeros([
-                1, 1, 1,
-                self.image_dim_out * self.base_feat_height_reduction**2
-            ]))
+            torch.zeros(
+                [1, 1, 1, self.image_dim_out * self.base_feat_height_reduction**2]
+            )
+        )
 
         dim_projection = hidden_size
         depth = 2
         layers = [
-            nn.Linear(image_dim_out * self.base_feat_height_reduction**2,
-                      dim_projection)
+            nn.Linear(
+                image_dim_out * self.base_feat_height_reduction**2, dim_projection
+            )
         ]
         for _ in range(1, depth):
-            layers.extend(
-                [nn.GELU(),
-                 nn.Linear(dim_projection, dim_projection)])
+            layers.extend([nn.GELU(), nn.Linear(dim_projection, dim_projection)])
         self.img_projection = nn.Sequential(*layers)
 
         self.vocab_size = config.vocab_size
@@ -183,24 +201,24 @@ def __init__(self,
 
         self.use_out_place_operations = False
 
-    def get_img_features(self,
-                         img_embeds: torch.FloatTensor,
-                         attention_mask=None) -> torch.FloatTensor:
-
-        img_feature = self.img_processor(img_embeds,
-                                         patch_attention_mask=attention_mask)
+    def get_img_features(
+        self, img_embeds: torch.FloatTensor, attention_mask=None
+    ) -> torch.FloatTensor:
+        img_feature = self.img_processor(
+            img_embeds, patch_attention_mask=attention_mask
+        )
 
         if self.type_feature == "patch":
             patch_feature = img_feature
 
             use_token_compression = self.image_token_compression is not None
-            use_padding = getattr(self, 'img_processor_padding',
-                                  None) is not None
+            use_padding = getattr(self, "img_processor_padding", None) is not None
             if use_token_compression or use_padding:
                 # reshape to 2D tensor
                 width = int(math.sqrt(patch_feature.size(1)))
-                patch_feature = patch_feature.view(-1, width, width,
-                                                   patch_feature.size(-1))
+                patch_feature = patch_feature.view(
+                    -1, width, width, patch_feature.size(-1)
+                )
                 # convert to NCHW
                 patch_feature = patch_feature.permute(0, 3, 1, 2)
 
@@ -214,15 +232,19 @@ def get_img_features(self,
                 patch_feature = patch_feature.view(
                     -1,
                     patch_feature.size(1) * patch_feature.size(2),
-                    patch_feature.size(-1))
+                    patch_feature.size(-1),
+                )
 
             return patch_feature
 
         raise NotImplementedError
 
-    def forward(self, pixel_values: torch.FloatTensor,
-                image_sizes: torch.Tensor,
-                image_attention_mask: torch.Tensor) -> list[torch.FloatTensor]:
+    def forward(
+        self,
+        pixel_values: torch.FloatTensor,
+        image_sizes: torch.Tensor,
+        image_attention_mask: torch.Tensor,
+    ) -> list[torch.FloatTensor]:
         """
         process image and return vision embeddings.
 
@@ -251,25 +273,27 @@ def forward(self, pixel_values: torch.FloatTensor,
 
         img_features = self.get_img_features(
             pixel_values,
-            image_attention_mask.type(torch.BoolTensor).flatten(
-                0, 1).to(target_device))
+            image_attention_mask.type(torch.BoolTensor).flatten(0, 1).to(target_device),
+        )
 
         base_feat_height_target = self.base_feat_height_target
         base_resolution = self.crop_size
         base_feat_height_reduction = self.base_feat_height_reduction
 
-        base_feat_height = base_feat_width = int(np.sqrt(
-            img_features.shape[1]))
-        assert base_feat_height == base_feat_height_target \
-            and base_feat_width == base_feat_height_target, \
-                (f"base_feat_height: {base_feat_height}, "
-                 f"base_feat_width: {base_feat_width}, "
-                 f"expect {base_feat_height_target} features for hd transform")
+        base_feat_height = base_feat_width = int(np.sqrt(img_features.shape[1]))
+        assert (
+            base_feat_height == base_feat_height_target
+            and base_feat_width == base_feat_height_target
+        ), (
+            f"base_feat_height: {base_feat_height}, "
+            f"base_feat_width: {base_feat_width}, "
+            f"expect {base_feat_height_target} features for hd transform"
+        )
 
         # bs x max_num_crops x (24x24) x C
-        img_features = img_features.view(bs, -1,
-                                         base_feat_height * base_feat_width,
-                                         self.image_dim_out)
+        img_features = img_features.view(
+            bs, -1, base_feat_height * base_feat_width, self.image_dim_out
+        )
         C = self.image_dim_out
         H = base_feat_height
 
@@ -288,22 +312,32 @@ def forward(self, pixel_values: torch.FloatTensor,
             global_img_feature = img_features[_bs, :1]
 
             # 1 x 12 x 12 x 4096
-            glb_img = global_img_feature.reshape(1, H, H, C).reshape(
-                1, H // base_feat_height_reduction, base_feat_height_reduction,
-                H // base_feat_height_reduction, base_feat_height_reduction,
-                C).contiguous().permute(0, 1, 3, 2, 4, 5).reshape(
-                    1, H // base_feat_height_reduction,
+            glb_img = (
+                global_img_feature.reshape(1, H, H, C)
+                .reshape(
+                    1,
+                    H // base_feat_height_reduction,
+                    base_feat_height_reduction,
                     H // base_feat_height_reduction,
-                    base_feat_height_reduction * base_feat_height_reduction *
-                    C).contiguous()
-            temp_glb_GN = self.sub_GN.repeat(1,
-                                             H // base_feat_height_reduction,
-                                             1, 1)
+                    base_feat_height_reduction,
+                    C,
+                )
+                .contiguous()
+                .permute(0, 1, 3, 2, 4, 5)
+                .reshape(
+                    1,
+                    H // base_feat_height_reduction,
+                    H // base_feat_height_reduction,
+                    base_feat_height_reduction * base_feat_height_reduction * C,
+                )
+                .contiguous()
+            )
+            temp_glb_GN = self.sub_GN.repeat(1, H // base_feat_height_reduction, 1, 1)
 
             # 1 x 156 x 4096
             glb_img = torch.cat([glb_img, temp_glb_GN], dim=2).reshape(
-                1, -1,
-                base_feat_height_reduction * base_feat_height_reduction * C)
+                1, -1, base_feat_height_reduction * base_feat_height_reduction * C
+            )
 
             # (max_num_crops-1) x (12x12) x C
             sub_img = img_features[_bs, 1:]
@@ -313,79 +347,106 @@ def forward(self, pixel_values: torch.FloatTensor,
 
             # (num_crops, 12, 2, 12, 2, 1024) ->
             # (num_crops, 12, 12, 2, 2, 1024) -> (num_crops, 12*12, 4*1024)
-            sub_img = sub_img.reshape(B_, H, H, C).reshape(
-                B_, H // base_feat_height_reduction,
-                base_feat_height_reduction, H // base_feat_height_reduction,
-                base_feat_height_reduction,
-                C).contiguous().permute(0, 1, 3, 2, 4, 5).reshape(
-                    B_, -1, base_feat_height_reduction *
-                    base_feat_height_reduction * C).contiguous()
-            sub_img = sub_img.reshape(
-                1, h, w, base_feat_height // base_feat_height_reduction,
-                base_feat_width // base_feat_height_reduction,
-                -1).permute(0, 1, 3, 2, 4, 5).reshape(
-                    1, h * base_feat_height // base_feat_height_reduction,
+            sub_img = (
+                sub_img.reshape(B_, H, H, C)
+                .reshape(
+                    B_,
+                    H // base_feat_height_reduction,
+                    base_feat_height_reduction,
+                    H // base_feat_height_reduction,
+                    base_feat_height_reduction,
+                    C,
+                )
+                .contiguous()
+                .permute(0, 1, 3, 2, 4, 5)
+                .reshape(
+                    B_, -1, base_feat_height_reduction * base_feat_height_reduction * C
+                )
+                .contiguous()
+            )
+            sub_img = (
+                sub_img.reshape(
+                    1,
+                    h,
+                    w,
+                    base_feat_height // base_feat_height_reduction,
+                    base_feat_width // base_feat_height_reduction,
+                    -1,
+                )
+                .permute(0, 1, 3, 2, 4, 5)
+                .reshape(
+                    1,
+                    h * base_feat_height // base_feat_height_reduction,
                     w * base_feat_width // base_feat_height_reduction,
-                    base_feat_height_reduction * base_feat_height_reduction *
-                    C)
-
-            if image_attention_mask is not None and len(
-                    image_attention_mask) > 0:
-                reshaped_image_attention_mask = image_attention_mask[
-                    _bs, 1:B_ + 1, 0::2, 0::2].reshape(
-                        1, h, w,
+                    base_feat_height_reduction * base_feat_height_reduction * C,
+                )
+            )
+
+            if image_attention_mask is not None and len(image_attention_mask) > 0:
+                reshaped_image_attention_mask = (
+                    image_attention_mask[_bs, 1 : B_ + 1, 0::2, 0::2]
+                    .reshape(
+                        1,
+                        h,
+                        w,
                         base_feat_height // base_feat_height_reduction,
-                        base_feat_width // base_feat_height_reduction).permute(
-                            0, 1, 3, 2, 4).reshape(
-                                1, h * base_feat_height //
-                                base_feat_height_reduction, w *
-                                base_feat_width // base_feat_height_reduction)
-                useful_height = int(
-                    reshaped_image_attention_mask[0, :, 0].sum().item())
-                useful_width = int(
-                    reshaped_image_attention_mask[0, 0, :].sum().item())
+                        base_feat_width // base_feat_height_reduction,
+                    )
+                    .permute(0, 1, 3, 2, 4)
+                    .reshape(
+                        1,
+                        h * base_feat_height // base_feat_height_reduction,
+                        w * base_feat_width // base_feat_height_reduction,
+                    )
+                )
+                useful_height = int(reshaped_image_attention_mask[0, :, 0].sum().item())
+                useful_width = int(reshaped_image_attention_mask[0, 0, :].sum().item())
                 sub_img = sub_img[:, :useful_height, :useful_width]
                 temp_sub_GN = self.sub_GN.repeat(1, useful_height, 1, 1)
-                temp_len = int(
-                    image_attention_mask[_bs, :B_ + 1, 0::2, 0::2].sum().item(
-                    )) + (useful_height +
-                          1) + base_feat_height // base_feat_height_reduction
+                temp_len = (
+                    int(image_attention_mask[_bs, : B_ + 1, 0::2, 0::2].sum().item())
+                    + (useful_height + 1)
+                    + base_feat_height // base_feat_height_reduction
+                )
             else:
                 temp_sub_GN = self.sub_GN.repeat(
-                    1, h * base_feat_height // base_feat_height_reduction, 1,
-                    1)
-                temp_len = int((h * w + 1) * self.num_img_tokens + 1 +
-                               (h + 1) * base_feat_height //
-                               base_feat_height_reduction)
+                    1, h * base_feat_height // base_feat_height_reduction, 1, 1
+                )
+                temp_len = int(
+                    (h * w + 1) * self.num_img_tokens
+                    + 1
+                    + (h + 1) * base_feat_height // base_feat_height_reduction
+                )
 
             sub_img = torch.cat([sub_img, temp_sub_GN], dim=2).reshape(
-                1, -1,
-                base_feat_height_reduction * base_feat_height_reduction * C)
+                1, -1, base_feat_height_reduction * base_feat_height_reduction * C
+            )
             # (1, num_img_tokens, 1024*4)
 
             # glb + sub
-            if self.hd_transform_order == 'glb_sub':
-                output_imgs.append(
-                    torch.cat([glb_img, self.glb_GN, sub_img], dim=1))
-            elif self.hd_transform_order == 'sub_glb':
-                output_imgs.append(
-                    torch.cat([sub_img, self.glb_GN, glb_img], dim=1))
+            if self.hd_transform_order == "glb_sub":
+                output_imgs.append(torch.cat([glb_img, self.glb_GN, sub_img], dim=1))
+            elif self.hd_transform_order == "sub_glb":
+                output_imgs.append(torch.cat([sub_img, self.glb_GN, glb_img], dim=1))
             else:
                 raise NotImplementedError(
                     f'hd_transform_order = {self.hd_transform_order}, "\
-                        "not implemented')
+                        "not implemented'
+                )
 
-            #temp_len = int((h*w+1)*144 + 1 + (h+1)*12)
-            assert temp_len == output_imgs[-1].shape[
-                1], f'temp_len: {temp_len}, output_imgs[-1].shape[1]: "\
+            # temp_len = int((h*w+1)*144 + 1 + (h+1)*12)
+            assert temp_len == output_imgs[-1].shape[1], (
+                f'temp_len: {temp_len}, output_imgs[-1].shape[1]: "\
                     "{output_imgs[-1].shape[1]}'
+            )
 
             output_len.append(temp_len)
 
         img_set_tensor = []
         for _output_img in output_imgs:
             img_feature_proj = self.img_projection(
-                _output_img.to(target_device).to(target_dtype))
+                _output_img.to(target_device).to(target_dtype)
+            )
             img_set_tensor.append(img_feature_proj.squeeze(0))
 
         return img_set_tensor
@@ -408,8 +469,9 @@ class Phi4MMImagePixelInputs(TensorSchema):
 
     data: Annotated[
         Union[torch.Tensor, list[torch.Tensor]],
-        TensorShape("bn", "p", 3, "h", "w", dynamic_dims={"p"}
-                    ),  # may be different per batch and image
+        TensorShape(
+            "bn", "p", 3, "h", "w", dynamic_dims={"p"}
+        ),  # may be different per batch and image
     ]
 
     image_sizes: Annotated[
@@ -451,6 +513,7 @@ class Phi4MMAudioEmbeddingInputs(TensorSchema):
         - f: Audio feature size
         - h: Hidden size (must match language model backbone)
     """
+
     type: Literal["audio_embeds"]
     data: Annotated[
         NestedTensors,
@@ -466,9 +529,9 @@ def cat_with_pad(tensors, dim, padding_value=0):
     cat along dim, while pad to max for all other dims
     """
     ndim = tensors[0].dim()
-    assert all(
-        t.dim() == ndim for t in
-        tensors[1:]), "All tensors must have the same number of dimensions"
+    assert all(t.dim() == ndim for t in tensors[1:]), (
+        "All tensors must have the same number of dimensions"
+    )
 
     out_size = [max(t.shape[i] for t in tensors) for i in range(ndim)]
     out_size[dim] = sum(t.shape[dim] for t in tensors)
@@ -488,14 +551,13 @@ def cat_with_pad(tensors, dim, padding_value=0):
 
 
 class Phi4MMProcessingInfo(BaseProcessingInfo):
-
     @property
     def image_tokens(self) -> list[str]:
-        return [f"<|image_{i+1}|>" for i in range(100)]
+        return [f"<|image_{i + 1}|>" for i in range(100)]
 
     @property
     def audio_tokens(self) -> list[str]:
-        return [f"<|audio_{i+1}|>" for i in range(100)]
+        return [f"<|audio_{i + 1}|>" for i in range(100)]
 
     def get_dynamic_hd(
         self,
@@ -506,8 +568,7 @@ def get_dynamic_hd(
         image_processor = processor.image_processor
         return image_processor.dynamic_hd
 
-    def get_feature_extractor(self,
-                              **kwargs: object) -> SequenceFeatureExtractor:
+    def get_feature_extractor(self, **kwargs: object) -> SequenceFeatureExtractor:
         return self.get_hf_processor(**kwargs).audio_processor
 
     def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
@@ -527,9 +588,12 @@ def _find_target_aspect_ratio(
             aspect_ratio = orig_width / orig_height
 
             # calculate the existing image aspect ratio
-            target_ratios = set((i, j) for i in range(1, max_num + 1)
-                                for j in range(1, max_num + 1)
-                                if i * j <= max_num and i * j >= min_num)
+            target_ratios = set(
+                (i, j)
+                for i in range(1, max_num + 1)
+                for j in range(1, max_num + 1)
+                if i * j <= max_num and i * j >= min_num
+            )
             target_ratios = sorted(target_ratios, key=lambda x: x[0] * x[1])
 
             # find the closest aspect ratio to the target
@@ -562,49 +626,56 @@ def _compute_num_image_tokens(
     ):
         """
         compute the number of tokens an image is expected to take up considering
-        the image encoder architecture and exclude output features containing 
+        the image encoder architecture and exclude output features containing
         only padding pixels
 
-        for siglip, vit_image_size=448, vit_patch_size=14, so output will be 
+        for siglip, vit_image_size=448, vit_patch_size=14, so output will be
         32x32 feature map
         NOTE right now, Phi4MM uses hard-coded token_compression_factor=2
         """
         assert vit_image_size % vit_patch_size == 0, (
-            "vit_image_size must be divisible by vit_patch_size")
-        assert (vit_image_size // vit_patch_size %
-                token_compression_factor == 0), (
-                    "vit_image_size // vit_patch_size must be divisible by "
-                    "token_compression_factor")
+            "vit_image_size must be divisible by vit_patch_size"
+        )
+        assert vit_image_size // vit_patch_size % token_compression_factor == 0, (
+            "vit_image_size // vit_patch_size must be divisible by "
+            "token_compression_factor"
+        )
 
         target_aspect_ratio, target_height, target_width = (
-            self._find_target_aspect_ratio(orig_width,
-                                           orig_height,
-                                           vit_image_size,
-                                           dynamic_hd_size,
-                                           min_num=1))
+            self._find_target_aspect_ratio(
+                orig_width, orig_height, vit_image_size, dynamic_hd_size, min_num=1
+            )
+        )
         assert target_aspect_ratio[0] * vit_image_size == target_width, (
-            f"{target_aspect_ratio[0]} * {vit_image_size} != {target_width}")
+            f"{target_aspect_ratio[0]} * {vit_image_size} != {target_width}"
+        )
         assert target_aspect_ratio[1] * vit_image_size == target_height, (
-            f"{target_aspect_ratio[1]} * {vit_image_size} != {target_height}")
-        assert (target_height % vit_image_size == 0
-                and target_width % vit_image_size == 0)
+            f"{target_aspect_ratio[1]} * {vit_image_size} != {target_height}"
+        )
+        assert (
+            target_height % vit_image_size == 0 and target_width % vit_image_size == 0
+        )
 
         padding_height, padding_width = _get_padding_size(
-            orig_width, orig_height, target_height, target_width)
-        assert padding_width == 0 or padding_height == 0, \
+            orig_width, orig_height, target_height, target_width
+        )
+        assert padding_width == 0 or padding_height == 0, (
             "padding_width or padding_height must be 0"
+        )
 
         target_feat_width = target_width // vit_patch_size
         target_feat_height = target_height // vit_patch_size
         if padding_width >= vit_patch_size:
             assert padding_height == 0, "padding_height not 0"
             non_pad_feat_width = target_feat_width - math.floor(
-                padding_width / vit_patch_size)
+                padding_width / vit_patch_size
+            )
             non_pad_feat_height = target_feat_height
         elif padding_height >= vit_patch_size:
             assert padding_width == 0, "padding_width not 0"
             non_pad_feat_height = target_feat_height - math.floor(
-                padding_height / vit_patch_size)
+                padding_height / vit_patch_size
+            )
             non_pad_feat_width = target_feat_width
         else:
             # small padding shorter than a vit patch
@@ -621,15 +692,17 @@ def _compute_num_image_tokens(
         num_hd_patch_tokens = feat_width * feat_height
         num_hd_newline_tokens = feat_height
         vit_feature_size = vit_image_size // vit_patch_size
-        num_global_image_tokens = (vit_feature_size //
-                                   token_compression_factor)**2
+        num_global_image_tokens = (vit_feature_size // token_compression_factor) ** 2
         num_sep_tokens = 1
-        num_global_image_newline_tokens = \
-            vit_feature_size // token_compression_factor
-
-        return (num_global_image_tokens + num_sep_tokens +
-                num_hd_patch_tokens + num_hd_newline_tokens +
-                num_global_image_newline_tokens)
+        num_global_image_newline_tokens = vit_feature_size // token_compression_factor
+
+        return (
+            num_global_image_tokens
+            + num_sep_tokens
+            + num_hd_patch_tokens
+            + num_hd_newline_tokens
+            + num_global_image_newline_tokens
+        )
 
     def get_num_image_tokens(
         self,
@@ -642,11 +715,10 @@ def get_num_image_tokens(
         vision_encoder_name = hf_config.img_processor
         if vision_encoder_name is None:
             vision_encoder_name = SIGLIP_NAME
-        prepro_config = VISION_ENCODER_TO_PROCESSING_CONFIG[
-            vision_encoder_name]
-        vit_image_size = prepro_config['vit_image_size']
-        vit_patch_size = prepro_config['vit_patch_size']
-        token_compression_factor = prepro_config['token_compression_factor']
+        prepro_config = VISION_ENCODER_TO_PROCESSING_CONFIG[vision_encoder_name]
+        vit_image_size = prepro_config["vit_image_size"]
+        vit_patch_size = prepro_config["vit_patch_size"]
+        token_compression_factor = prepro_config["token_compression_factor"]
 
         dynamic_hd_size = self.get_dynamic_hd(processor=processor)
 
@@ -669,9 +741,8 @@ def get_image_size_with_most_features(
         vision_encoder_name = hf_config.img_processor
         if vision_encoder_name is None:
             vision_encoder_name = SIGLIP_NAME
-        prepro_config = VISION_ENCODER_TO_PROCESSING_CONFIG[
-            vision_encoder_name]
-        vit_image_size = prepro_config['vit_image_size']
+        prepro_config = VISION_ENCODER_TO_PROCESSING_CONFIG[vision_encoder_name]
+        vit_image_size = prepro_config["vit_image_size"]
 
         max_side = vit_image_size * self.get_dynamic_hd(processor=processor)
         return ImageSize(height=max_side, width=vit_image_size)
@@ -717,8 +788,7 @@ def _compute_audio_embed_size(self, audio_frames: int) -> int:
         compression rate.
         """
         hf_config = self.get_hf_config()
-        compression_rate = hf_config.embd_layer['audio_embd_layer'][
-            'compression_rate']
+        compression_rate = hf_config.embd_layer["audio_embd_layer"]["compression_rate"]
         # NOTE: this is a hard-coded value but might be configurable
         # in the future
         qformer_compression_rate = 1
@@ -736,7 +806,6 @@ def _compute_audio_embed_size(self, audio_frames: int) -> int:
 
 
 class Phi4MMDummyInputsBuilder(BaseDummyInputsBuilder[Phi4MMProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_audios = mm_counts.get("audio", 0)
         num_images = mm_counts.get("image", 0)
@@ -755,33 +824,34 @@ def get_dummy_mm_data(
         num_audios = mm_counts.get("audio", 0)
         num_images = mm_counts.get("image", 0)
 
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
 
         image_overrides = mm_options.get("image") if mm_options else None
         audio_overrides = mm_options.get("audio") if mm_options else None
 
         mm_data = {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
-            "audio":
-            self._get_dummy_audios(length=_AUDIO_MAX_SOUNDFILE_SIZE,
-                                   num_audios=num_audios,
-                                   overrides=audio_overrides),
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
+            "audio": self._get_dummy_audios(
+                length=_AUDIO_MAX_SOUNDFILE_SIZE,
+                num_audios=num_audios,
+                overrides=audio_overrides,
+            ),
         }
 
         return mm_data
 
 
 class Phi4MMMultiModalProcessor(BaseMultiModalProcessor[Phi4MMProcessingInfo]):
-
     def _get_data_parser(self) -> MultiModalDataParser:
         feature_extractor = self.info.get_feature_extractor()
-        return MultiModalDataParser(target_sr=feature_extractor.sampling_rate,
-                                    audio_resample_method="scipy")
+        return MultiModalDataParser(
+            target_sr=feature_extractor.sampling_rate, audio_resample_method="scipy"
+        )
 
     def _call_hf_processor(
         self,
@@ -796,27 +866,27 @@ def _call_hf_processor(
             return BatchFeature(dict(input_ids=[prompt_ids]), tensor_type="pt")
 
         sr = self.info.get_feature_extractor(**mm_kwargs).sampling_rate
-        if (audio_data := mm_data.get("audios", [])):
-            mm_data['audios'] = [(data, sr) for data in audio_data]
+        if audio_data := mm_data.get("audios", []):
+            mm_data["audios"] = [(data, sr) for data in audio_data]
 
-        processed_outputs = super()._call_hf_processor(prompt, mm_data,
-                                                       mm_kwargs, tok_kwargs)
+        processed_outputs = super()._call_hf_processor(
+            prompt, mm_data, mm_kwargs, tok_kwargs
+        )
 
         num_img_tokens = [
-            self.info.get_num_image_tokens(image_width=img_size[0],
-                                           image_height=img_size[1])
+            self.info.get_num_image_tokens(
+                image_width=img_size[0], image_height=img_size[1]
+            )
             for img_size in processed_outputs["image_sizes"]
         ]
         processed_outputs["num_img_tokens"] = num_img_tokens
 
-        audio_features = processed_outputs['input_audio_embeds']
+        audio_features = processed_outputs["input_audio_embeds"]
         feature_sizes = [
-            self.info.get_audio_num_frames(len(audio), sr)
-            for audio in audio_data
+            self.info.get_audio_num_frames(len(audio), sr) for audio in audio_data
         ]
-        processed_outputs['input_audio_embeds'] = [
-            audio_features[idx, :size]
-            for idx, size in enumerate(feature_sizes)
+        processed_outputs["input_audio_embeds"] = [
+            audio_features[idx, :size] for idx, size in enumerate(feature_sizes)
         ]
 
         return processed_outputs
@@ -842,13 +912,13 @@ def _get_prompt_updates(
     ) -> Sequence[PromptUpdate]:
         image_tokens: list[str] = self.info.image_tokens  # type: ignore
         audio_tokens: list[str] = self.info.audio_tokens  # type: ignore
-        feature_extractor = self.info.get_feature_extractor(
-            **hf_processor_mm_kwargs)
+        feature_extractor = self.info.get_feature_extractor(**hf_processor_mm_kwargs)
         hf_processor = self.info.get_hf_processor(**hf_processor_mm_kwargs)
 
         def get_image_replacement_phi4mm(item_idx: int):
             images = mm_items.get_items(
-                "image", (ImageEmbeddingItems, ImageProcessorItems))
+                "image", (ImageEmbeddingItems, ImageProcessorItems)
+            )
 
             if isinstance(images, ImageEmbeddingItems):
                 num_image_tokens = images.get_feature_size(item_idx)
@@ -867,9 +937,9 @@ def get_audio_replacement_phi4mm(item_idx: int):
             # TODO(Isotr0py): support embedding inputs
             audio_len = audios.get_audio_length(item_idx)
             audio_frames = self.info.get_audio_num_frames(
-                audio_len, feature_extractor.sampling_rate)
-            audio_embed_size = self.info._compute_audio_embed_size(
-                audio_frames)
+                audio_len, feature_extractor.sampling_rate
+            )
+            audio_embed_size = self.info._compute_audio_embed_size(audio_frames)
 
             return [_AUDIO_PLACEHOLDER_TOKEN_ID] * audio_embed_size
 
@@ -915,6 +985,7 @@ class Phi4MMForCausalLM(nn.Module, SupportsLoRA, SupportsMultiModal):
     """
     Implements the Phi-4-multimodal-instruct model in vLLM.
     """
+
     packed_modules_mapping = {
         "qkv_proj": [
             "qkv_proj",
@@ -929,10 +1000,8 @@ class Phi4MMForCausalLM(nn.Module, SupportsLoRA, SupportsMultiModal):
             "base_layer.": "",
         },
         orig_to_new_prefix={
-            "model.embed_tokens_extend.audio_embed.audio_projection.vision.":
-            "embed_tokens_extend.audio_projection_for_vision.",
-            "model.embed_tokens_extend.audio_embed.audio_projection.speech.":
-            "embed_tokens_extend.audio_projection.",
+            "model.embed_tokens_extend.audio_embed.audio_projection.vision.": "embed_tokens_extend.audio_projection_for_vision.",
+            "model.embed_tokens_extend.audio_embed.audio_projection.speech.": "embed_tokens_extend.audio_projection.",
             "model.embed_tokens_extend.audio_embed.": "embed_tokens_extend.",
             "model.embed_tokens_extend.image_embed.": "vision_encoder.",
         },
@@ -961,19 +1030,18 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.lora_config = lora_config
 
         # Tensor/Pipeline parallel not supported for now.
-        assert get_pp_group(
-        ).world_size == 1, "pipeline parallel is not supported"
+        assert get_pp_group().world_size == 1, "pipeline parallel is not supported"
 
         self.vision_encoder = Phi4MMImageEncoder(
             config,
             quant_config,
             prefix="model.vision_embed_tokens",
-            model_dir=config._name_or_path)
+            model_dir=config._name_or_path,
+        )
 
         if isinstance(config.embd_layer["audio_embd_layer"], dict):
             embedding_config = {
-                "embedding_cls":
-                config.embd_layer["audio_embd_layer"]["embedding_cls"],
+                "embedding_cls": config.embd_layer["audio_embd_layer"]["embedding_cls"],
                 **config.embd_layer["audio_embd_layer"],
             }
         else:
@@ -982,8 +1050,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             }
 
         self.embed_tokens_extend = AudioEmbedding(config, **embedding_config)
-        self.model = LlamaModel(vllm_config=vllm_config,
-                                prefix=maybe_prefix(prefix, "model"))
+        self.model = LlamaModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
         self.unpadded_vocab_size = config.vocab_size
         if lora_config:
@@ -999,13 +1068,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         if config.tie_word_embeddings:
             self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
         logit_scale = getattr(config, "logit_scale", 1.0)
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size, logit_scale)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size, logit_scale
+        )
 
     def _parse_and_validate_audio_input(
-            self, **kwargs: object) -> Optional[Phi4MMAudioInputs]:
+        self, **kwargs: object
+    ) -> Optional[Phi4MMAudioInputs]:
         """
-        Parse and validate the audio input to the model.  This handles both 
+        Parse and validate the audio input to the model.  This handles both
         audio features and audio embeddings, but only the former is used for
         now.
 
@@ -1022,17 +1093,18 @@ def _parse_and_validate_audio_input(
             return None
 
         if audio_features is not None:
-            return Phi4MMAudioFeatureInputs(type="audio_features",
-                                            data=flatten_bn(audio_features))
+            return Phi4MMAudioFeatureInputs(
+                type="audio_features", data=flatten_bn(audio_features)
+            )
 
         if audio_embeds is not None:
-            return Phi4MMAudioEmbeddingInputs(type="audio_embeds",
-                                              data=audio_embeds)
+            return Phi4MMAudioEmbeddingInputs(type="audio_embeds", data=audio_embeds)
 
         raise AssertionError("This line should be unreachable.")
 
-    def _process_audio_input(self, audio_input: Phi4MMAudioInputs,
-                             audio_projection_mode: str) -> NestedTensors:
+    def _process_audio_input(
+        self, audio_input: Phi4MMAudioInputs, audio_projection_mode: str
+    ) -> NestedTensors:
         """
         Create the audio embeddings from the audio input, where the audio input
         is pairs of audio features and audio embed lengths.  The audio input is
@@ -1056,12 +1128,14 @@ def _process_audio_input(self, audio_input: Phi4MMAudioInputs,
             self.embed_tokens_extend(
                 features.to(dtype),
                 audio_projection_mode=audio_projection_mode,
-            ) for features in audio_features
+            )
+            for features in audio_features
         ]
         return audio_embeds
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[Phi4MMImagePixelInputs]:
+        self, **kwargs: object
+    ) -> Optional[Phi4MMImagePixelInputs]:
         input_image_embeds: NestedTensors = kwargs.get("input_image_embeds")
         if input_image_embeds is None:
             return None
@@ -1069,12 +1143,16 @@ def _parse_and_validate_image_input(
         image_sizes = kwargs.get("image_sizes")
         image_attention_mask = kwargs.get("image_attention_mask")
         num_img_tokens = kwargs.get("num_img_tokens")
-        assert image_sizes is not None and image_attention_mask is not None\
-              and num_img_tokens is not None, "Missing image inputs"
+        assert (
+            image_sizes is not None
+            and image_attention_mask is not None
+            and num_img_tokens is not None
+        ), "Missing image inputs"
 
         if is_list_of(input_image_embeds, torch.Tensor):
-            assert all(p.dim() == 5
-                       for p in input_image_embeds), "Incorrect image inputs"
+            assert all(p.dim() == 5 for p in input_image_embeds), (
+                "Incorrect image inputs"
+            )
             # list len is batch_size.
             # each tensor has dimension: num_img_per_example, num_hd_patches,
             # channels, height, width.
@@ -1107,8 +1185,7 @@ def _parse_and_validate_image_input(
 
         if isinstance(num_img_tokens, list):
             num_img_tokens = [
-                n for num_tensor in num_img_tokens
-                for n in num_tensor.tolist()
+                n for num_tensor in num_img_tokens for n in num_tensor.tolist()
             ]
         elif isinstance(num_img_tokens, torch.Tensor):
             num_img_tokens = num_img_tokens.flatten(0, 1).tolist()
@@ -1129,31 +1206,32 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if input_key in ("input_image_embeds",
-                             "image_embeds") and "images" not in modalities:
-                modalities["images"] = self._parse_and_validate_image_input(
-                    **kwargs)
-            if input_key in ("input_audio_embeds",
-                             "audio_embeds") and "audios" not in modalities:
-                modalities["audios"] = self._parse_and_validate_audio_input(
-                    **kwargs)
+            if (
+                input_key in ("input_image_embeds", "image_embeds")
+                and "images" not in modalities
+            ):
+                modalities["images"] = self._parse_and_validate_image_input(**kwargs)
+            if (
+                input_key in ("input_audio_embeds", "audio_embeds")
+                and "audios" not in modalities
+            ):
+                modalities["audios"] = self._parse_and_validate_audio_input(**kwargs)
 
         return modalities
 
     def _process_image_input(
-            self, image_input: Phi4MMImagePixelInputs) -> list[torch.Tensor]:
-
+        self, image_input: Phi4MMImagePixelInputs
+    ) -> list[torch.Tensor]:
         dtype = next(self.vision_encoder.parameters()).dtype
-        pixel_values = image_input['data'].to(dtype)
-        image_sizes = image_input['image_sizes']
-        image_attention_mask = image_input['image_attention_mask']
-        image_embeds = self.vision_encoder(pixel_values, image_sizes,
-                                           image_attention_mask)
+        pixel_values = image_input["data"].to(dtype)
+        image_sizes = image_input["image_sizes"]
+        image_attention_mask = image_input["image_attention_mask"]
+        image_embeds = self.vision_encoder(
+            pixel_values, image_sizes, image_attention_mask
+        )
         return image_embeds
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
-
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
@@ -1164,7 +1242,7 @@ def get_multimodal_embeddings(self,
 
         # NOTE: It is important to iterate over the keys in this dictionary
         # to preserve the order of the modalities.
-        audio_projection_mode = 'speech'
+        audio_projection_mode = "speech"
         for modality in modalities:
             # make sure process images first
             if modality == "images":
@@ -1175,7 +1253,8 @@ def get_multimodal_embeddings(self,
             if modality == "audios":
                 audio_input = modalities["audios"]
                 audio_embeddings = self._process_audio_input(
-                    audio_input, audio_projection_mode=audio_projection_mode)
+                    audio_input, audio_projection_mode=audio_projection_mode
+                )
                 multimodal_embeddings += tuple(audio_embeddings)
 
         return multimodal_embeddings
@@ -1207,8 +1286,7 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> None:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> None:
         loader = AutoWeightsLoader(self, skip_substrs=["lora"])
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
diff --git a/vllm/model_executor/models/phi4mm_audio.py b/vllm/model_executor/models/phi4mm_audio.py
index a1c452053ddd..d289e26efa10 100644
--- a/vllm/model_executor/models/phi4mm_audio.py
+++ b/vllm/model_executor/models/phi4mm_audio.py
@@ -14,15 +14,24 @@
 import torch.nn.functional as F
 from torch import Tensor, nn
 from torch.distributed.algorithms._checkpoint.checkpoint_wrapper import (
-    CheckpointWrapper)
-from torch.distributed.fsdp.fully_sharded_data_parallel import (
-    FullyShardedDataParallel)
+    CheckpointWrapper,
+)
+from torch.distributed.fsdp.fully_sharded_data_parallel import FullyShardedDataParallel
 from transformers import PretrainedConfig
 
 from vllm.model_executor.models.phi4mm_utils import (
-    AbsolutePositionalEncoding, ConvModule, FeedForward, MeanVarianceNormLayer,
-    MultiHeadedAttention, MultiSequential, NemoConvSubsampling,
-    T5RelativeAttentionLogitBias, adaptive_enc_mask, get_offset, unfold_tensor)
+    AbsolutePositionalEncoding,
+    ConvModule,
+    FeedForward,
+    MeanVarianceNormLayer,
+    MultiHeadedAttention,
+    MultiSequential,
+    NemoConvSubsampling,
+    T5RelativeAttentionLogitBias,
+    adaptive_enc_mask,
+    get_offset,
+    unfold_tensor,
+)
 
 _AUDIO_PLACEHOLDER_TOKEN_ID = 200011  # <|endoftext11|>
 
@@ -40,9 +49,9 @@ class ConformerEncoderLayer(nn.Module):
             if > 0, ext_pw_out_channel is a dim channel size
              for the last pointwise conv after swish activation.
         depthwise_seperable_out_channel: int
-            if set different to 0, the number of 
+            if set different to 0, the number of
              depthwise_seperable_out_channel will be used as a
-             channel_out of the second conv1d layer. 
+             channel_out of the second conv1d layer.
              otherwise, it equals to 0, the second conv1d layer is skipped.
         depthwise_multiplier: int
             number of input_dim channels duplication. this value
@@ -119,10 +128,10 @@ class ConformerEncoderLayer(nn.Module):
              and allow the onnx conversion for inference.
               default False.
         use_pt_scaled_dot_product_attention: bool, optional
-            if set to True, use pytorch's scaled dot product attention 
+            if set to True, use pytorch's scaled dot product attention
             implementation in training.
         attn_group_sizes: int, optional
-            the number of groups to use for attention, default 1 
+            the number of groups to use for attention, default 1
             (Multi-Head Attention),
             1 = typical Multi-Head Attention,
             1 < attn_group_sizes < attention_heads = Grouped-Query Attention
@@ -173,8 +182,7 @@ def __init__(
             attention_inner_dim,
             attention_glu_type,
             bias_in_glu,
-            use_pt_scaled_dot_product_attention=
-            use_pt_scaled_dot_product_attention,
+            use_pt_scaled_dot_product_attention=use_pt_scaled_dot_product_attention,
             group_size=attn_group_sizes,
         )
         self.conv = ConvModule(
@@ -296,7 +304,7 @@ class TransformerEncoderBase(abc.ABC, nn.Module):
             (Q*K^T + B) implemented in cmb.basics.embedding.
             [T5/ALiBi]RelativeAttentionLogitBias
             usage: relative_attention_bias_args={"type": t5/alibi}
-            additional method-specific arguments can be provided (see 
+            additional method-specific arguments can be provided (see
             transformer_base.py)
         positional_dropout_rate: float, optional
             dropout rate after positional encoding. default 0.0
@@ -310,10 +318,10 @@ class TransformerEncoderBase(abc.ABC, nn.Module):
             supraframe utts in batch.
             Default: none
         attention_group_size: int, optional
-            the number of groups to use for attention, default 1 
+            the number of groups to use for attention, default 1
             (Multi-Head Attention),
             1 = typical Multi-Head Attention,
-            1 < attention_group_size < attention_heads = Grouped-Query 
+            1 < attention_group_size < attention_heads = Grouped-Query
             Attention
             attention_group_size = attention_heads = Multi-Query Attention
     """
@@ -334,8 +342,7 @@ def __init__(
         relative_attention_bias_args: Optional[dict[str, Any]] = None,
         positional_dropout_rate: float = 0.0,
         nemo_conv_settings: Optional[dict[str, Any]] = None,
-        conv2d_extra_padding: Literal["feat", "feat_time", "none",
-                                      True] = "none",
+        conv2d_extra_padding: Literal["feat", "feat_time", "none", True] = "none",
         attention_group_size: int = 1,
         encoder_embedding_config: Optional[dict[str, Any]] = None,
     ) -> None:
@@ -366,70 +373,77 @@ def __init__(
             if nemo_conv_settings:
                 default_nemo_conv_settings.update(nemo_conv_settings)
                 for i in ["subsampling_factor", "feat_in", "feat_out"]:
-                    assert (
-                        i not in nemo_conv_settings
-                    ), "{i} should be specified outside of the NeMo dictionary"
+                    assert i not in nemo_conv_settings, (
+                        "{i} should be specified outside of the NeMo dictionary"
+                    )
 
-            self.embed = NemoConvSubsampling(**default_nemo_conv_settings, )
+            self.embed = NemoConvSubsampling(
+                **default_nemo_conv_settings,
+            )
         else:
             raise ValueError("unknown input_layer: " + input_layer)
 
-        self.pos_emb = AbsolutePositionalEncoding(attention_dim,
-                                                  positional_dropout_rate)
+        self.pos_emb = AbsolutePositionalEncoding(
+            attention_dim, positional_dropout_rate
+        )
 
         self.relative_attention_bias_type = (
             relative_attention_bias_args.get("type")
-            if relative_attention_bias_args else None)
+            if relative_attention_bias_args
+            else None
+        )
         if self.relative_attention_bias_type == "t5":
-            assert (self.num_heads % self.attention_group_size == 0
-                    ), "attention_group_size must divide n_head"
+            assert self.num_heads % self.attention_group_size == 0, (
+                "attention_group_size must divide n_head"
+            )
             self.relative_attention_bias_layer = T5RelativeAttentionLogitBias(
                 self.num_heads // self.attention_group_size,
                 max_distance=relative_attention_bias_args.get(
-                    "t5_bias_max_distance", 1000),
-                symmetric=relative_attention_bias_args.get(
-                    "t5_bias_symmetric", False),
+                    "t5_bias_max_distance", 1000
+                ),
+                symmetric=relative_attention_bias_args.get("t5_bias_symmetric", False),
             )
         else:
             raise NotImplementedError
 
         self.encoder_embedding = MeanVarianceNormLayer(
-            self.encoder_embedding_config["input_size"])
+            self.encoder_embedding_config["input_size"]
+        )
 
     def compute_lens_change(
-            self,
-            feature_lens: Union[int,
-                                torch.Tensor]) -> Union[int, torch.Tensor]:
+        self, feature_lens: Union[int, torch.Tensor]
+    ) -> Union[int, torch.Tensor]:
         """feature_lens: int
         return updated feature lens.
 
-        This used to return a different lambda function for each case that 
-        computed the right thing.  That does not work within Torchscript. 
+        This used to return a different lambda function for each case that
+        computed the right thing.  That does not work within Torchscript.
         If you really need this to be faster, create nn.Module()-s for all
         the cases and return one of them.  Torchscript does support that.
         """
         if self.input_layer == "nemo_conv":
             # Handle the special causal case
             subsampling_causal_cond = self.nemo_conv_settings.get(
-                "subsampling", "dw_striding") in [
-                    "dw_striding",
-                    "striding",
-                    "striding_conv1d",
-                ]
+                "subsampling", "dw_striding"
+            ) in [
+                "dw_striding",
+                "striding",
+                "striding_conv1d",
+            ]
             is_causal = self.nemo_conv_settings.get("is_causal", False)
             if is_causal and subsampling_causal_cond:
-                lens_change = (torch.ceil(feature_lens /
-                                          self.time_reduction).long()
-                               if isinstance(feature_lens, Tensor) else
-                               math.ceil(feature_lens / self.time_reduction))
+                lens_change = (
+                    torch.ceil(feature_lens / self.time_reduction).long()
+                    if isinstance(feature_lens, Tensor)
+                    else math.ceil(feature_lens / self.time_reduction)
+                )
                 feature_lens_remainder = feature_lens % self.time_reduction
                 if isinstance(feature_lens, Tensor):
                     lens_change[feature_lens_remainder != 1] += 1
                 elif feature_lens_remainder != 1:
                     lens_change += 1
                 return lens_change
-            ceil_func = (math.ceil
-                         if isinstance(feature_lens, int) else torch.ceil)
+            ceil_func = math.ceil if isinstance(feature_lens, int) else torch.ceil
             return ceil_func(feature_lens / self.time_reduction)
 
     @abc.abstractmethod
@@ -437,10 +451,10 @@ def forward(self) -> Any:
         """Abstract forward method implementation."""
 
     def _chunk_size_selection(
-            self,
-            chunk_size: Optional[Union[int, list[int]]] = None,
-            left_chunk: Optional[Union[int,
-                                       list[int]]] = None) -> tuple[int, int]:
+        self,
+        chunk_size: Optional[Union[int, list[int]]] = None,
+        left_chunk: Optional[Union[int, list[int]]] = None,
+    ) -> tuple[int, int]:
         """If chunk size is a list, we will randomly select a chunk size."""
 
         if chunk_size is None:
@@ -450,15 +464,16 @@ def _chunk_size_selection(
         if isinstance(chunk_size, list):
             # Variable chunk size during training
             chunk_size_index = int(
-                torch.randint(low=0, high=len(chunk_size), size=(1, )))
+                torch.randint(low=0, high=len(chunk_size), size=(1,))
+            )
             chunk_size_train_eff = chunk_size[chunk_size_index]
             if not isinstance(left_chunk, list):
                 raise ValueError(
-                    "Since chunk_size is a list, left_chunk must be a list")
+                    "Since chunk_size is a list, left_chunk must be a list"
+                )
             if len(left_chunk) != len(chunk_size):
                 raise ValueError(
-                    "The length of left_chunk must be the same as length of "\
-                        "chunk_size."
+                    "The length of left_chunk must be the same as length of chunk_size."
                 )
             left_chunk_train_eff = left_chunk[chunk_size_index]
         else:
@@ -479,8 +494,8 @@ def _get_embed_class(self, embed: nn.Module) -> nn.Module:
         return embed_class
 
     def _forward_embeddings_core(
-            self, input_tensor: torch.Tensor,
-            masks: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+        self, input_tensor: torch.Tensor, masks: torch.Tensor
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         embed_class = self._get_embed_class(self.embed)
         assert isinstance(embed_class, NemoConvSubsampling)
         input_tensor, masks = self.embed(input_tensor, masks)
@@ -493,23 +508,32 @@ def _position_embedding(
         pos_v = None
         if self.relative_attention_bias_layer is None:
             input_tensor = self.pos_emb(
-                input_tensor)  # default to add abs sinusoid embedding
+                input_tensor
+            )  # default to add abs sinusoid embedding
         return pos_k, pos_v
 
-    def _streaming_mask(self, seq_len: int, batch_size: int,
-                        chunk_size: Union[int, list[int]],
-                        left_chunk: Union[int, list[int]]) -> torch.Tensor:
-        chunk_size_train_eff, left_chunk_train_eff = \
-            self._chunk_size_selection(chunk_size, left_chunk)
+    def _streaming_mask(
+        self,
+        seq_len: int,
+        batch_size: int,
+        chunk_size: Union[int, list[int]],
+        left_chunk: Union[int, list[int]],
+    ) -> torch.Tensor:
+        chunk_size_train_eff, left_chunk_train_eff = self._chunk_size_selection(
+            chunk_size, left_chunk
+        )
 
         # Create mask matrix for streaming
         # S stores start index. if chunksize is 18, s is [0,18,36,....]
         chunk_start_idx = np.arange(0, seq_len, chunk_size_train_eff)
 
-        enc_streaming_mask = (adaptive_enc_mask(
-            seq_len, chunk_start_idx,
-            left_window=left_chunk_train_eff).unsqueeze(0).expand(
-                [batch_size, -1, -1]))
+        enc_streaming_mask = (
+            adaptive_enc_mask(
+                seq_len, chunk_start_idx, left_window=left_chunk_train_eff
+            )
+            .unsqueeze(0)
+            .expand([batch_size, -1, -1])
+        )
         return enc_streaming_mask
 
     def forward_embeddings(
@@ -517,12 +541,24 @@ def forward_embeddings(
         xs_pad: torch.Tensor,
         masks: torch.Tensor,
         chunk_size_nc: Optional[Union[int, list[int]]] = None,
-        left_chunk_nc: Optional[Union[int, list[int]]] = None
-    ) -> Union[tuple[torch.Tensor, Optional[torch.Tensor],
-                     Optional[torch.Tensor], torch.Tensor, torch.Tensor],
-               tuple[torch.Tensor, Optional[torch.Tensor],
-                     Optional[torch.Tensor], torch.Tensor, torch.Tensor,
-                     torch.Tensor]]:
+        left_chunk_nc: Optional[Union[int, list[int]]] = None,
+    ) -> Union[
+        tuple[
+            torch.Tensor,
+            Optional[torch.Tensor],
+            Optional[torch.Tensor],
+            torch.Tensor,
+            torch.Tensor,
+        ],
+        tuple[
+            torch.Tensor,
+            Optional[torch.Tensor],
+            Optional[torch.Tensor],
+            torch.Tensor,
+            torch.Tensor,
+            torch.Tensor,
+        ],
+    ]:
         """Forwarding the inputs through the top embedding layers
 
         Args:
@@ -530,7 +566,7 @@ def forward_embeddings(
                 input tensor
             masks: torch.Tensor
                 input mask
-            chunk_size_nc: (optional, default is None) chunk size for 
+            chunk_size_nc: (optional, default is None) chunk size for
                             non-causal layers
             left_chunk_nc: (optional, default is None) # of left chunks for
                             non-causal layers
@@ -543,21 +579,21 @@ def forward_embeddings(
                 f"""The sequence length after time reduction is invalid: 
                 {seq_len}. Your input feature is too short. Consider 
                 filtering out the very short sentence from data 
-                loader""", )
+                loader""",
+            )
 
         batch_size = xs_pad.shape[0]
 
-        enc_streaming_mask = self._streaming_mask(seq_len, batch_size,
-                                                  self.chunk_size,
-                                                  self.left_chunk)
+        enc_streaming_mask = self._streaming_mask(
+            seq_len, batch_size, self.chunk_size, self.left_chunk
+        )
 
         if xs_pad.is_cuda:
             enc_streaming_mask = enc_streaming_mask.cuda()
             xs_pad = xs_pad.cuda()
 
         input_tensor = xs_pad
-        input_tensor, masks = self._forward_embeddings_core(
-            input_tensor, masks)
+        input_tensor, masks = self._forward_embeddings_core(input_tensor, masks)
 
         streaming_mask = enc_streaming_mask
         if streaming_mask is not None and masks is not None:
@@ -569,7 +605,8 @@ def forward_embeddings(
 
         if chunk_size_nc is not None:
             enc_streaming_mask_nc = self._streaming_mask(
-                seq_len, batch_size, chunk_size_nc, left_chunk_nc)
+                seq_len, batch_size, chunk_size_nc, left_chunk_nc
+            )
             if xs_pad.is_cuda:
                 enc_streaming_mask_nc = enc_streaming_mask_nc.cuda()
             if masks is not None:
@@ -622,8 +659,8 @@ class ConformerEncoder(TransformerEncoderBase):
             left_chunk = 6
             left_chunk = [12, 9, 6, 3]
         num_lang: int
-            This parameter is used to store the number of languages in the 
-            lang_dict, only used for multiseed/multilingual models. 
+            This parameter is used to store the number of languages in the
+            lang_dict, only used for multiseed/multilingual models.
             default None.
         attention_dim: int, optional
             attention dimension. default 256.
@@ -721,16 +758,16 @@ class ConformerEncoder(TransformerEncoderBase):
         extra_layer_output_idx: int
             the layer index to be exposed.
         relative_attention_bias_args: dict, optional
-            use more efficient scalar bias-based relative multihead attention 
+            use more efficient scalar bias-based relative multihead attention
             (Q*K^T + B) implemented in cmb.basics.embedding.
             [T5/ALiBi]RelativeAttentionLogitBias
             usage: relative_attention_bias_args={"type": t5/alibi}
-            additional method-specific arguments can be provided (see 
+            additional method-specific arguments can be provided (see
             transformer_base.py)
         time_reduction: int optional
             time reduction factor
             default 4
-        use_pt_scaled_dot_product_attention: whether to use pytorch scaled 
+        use_pt_scaled_dot_product_attention: whether to use pytorch scaled
             dot product attention in training.
             Default: False
         nemo_conv_settings: dict, optional
@@ -748,12 +785,12 @@ class ConformerEncoder(TransformerEncoderBase):
             Add extra padding in conv2d subsampling layers. Choices are
             (feat, feat_time, none, True)
             Default: none
-        replication_pad_for_subsample_embedding:  For batched-streaming 
+        replication_pad_for_subsample_embedding:  For batched-streaming
             decoding, use "replication" padding for the cache at start of
             utterance.
             Default: False
         attention_group_size: int, optional
-            the number of groups to use for attention, default 1 
+            the number of groups to use for attention, default 1
             (Multi-Head Attention),
             1 = typical Multi-Head Attention,
             1 < attention_group_size < attention_heads = Grouped-Query
@@ -799,8 +836,7 @@ def __init__(  # pylint: disable-all
         time_reduction: int = 4,
         use_pt_scaled_dot_product_attention: bool = False,
         nemo_conv_settings: Optional[dict[str, Any]] = None,
-        conv2d_extra_padding: Literal["feat", "feat_time", "none",
-                                      True] = "none",
+        conv2d_extra_padding: Literal["feat", "feat_time", "none", True] = "none",
         replication_pad_for_subsample_embedding: bool = False,
         attention_group_size: int = 1,
         encoder_embedding_config: Optional[dict[str, Any]] = None,
@@ -827,39 +863,43 @@ def __init__(  # pylint: disable-all
         self.num_lang = num_lang
         self.kernel_size = kernel_size
         self.replication_pad_for_subsample_embedding: bool = (
-            replication_pad_for_subsample_embedding)
-        assert (self.num_heads % attention_group_size == 0
-                ), "attention_group_size must divide n_head"
+            replication_pad_for_subsample_embedding
+        )
+        assert self.num_heads % attention_group_size == 0, (
+            "attention_group_size must divide n_head"
+        )
         self.num_heads_k = self.num_heads // attention_group_size
 
-        self.encoders = MultiSequential(*[
-            ConformerEncoderLayer(
-                d_model=attention_dim,
-                ext_pw_out_channel=ext_pw_out_channel,
-                depthwise_seperable_out_channel=depthwise_seperable_out_channel,
-                depthwise_multiplier=depthwise_multiplier,
-                n_head=attention_heads,
-                d_ffn=linear_units,
-                ext_pw_kernel_size=ext_pw_kernel_size,
-                kernel_size=kernel_size,
-                dropout_rate=dropout_rate,
-                causal=causal,
-                batch_norm=batch_norm,
-                activation=activation,
-                chunk_se=chunk_se,
-                chunk_size=chunk_size,
-                conv_activation=conv_activation,
-                conv_glu_type=conv_glu_type,
-                bias_in_glu=bias_in_glu,
-                linear_glu_in_convm=linear_glu_in_convm,
-                attention_glu_type=attention_glu_type,
-                activation_checkpointing=activation_checkpointing,
-                export=export,
-                use_pt_scaled_dot_product_attention=
-                use_pt_scaled_dot_product_attention,
-                attn_group_sizes=attention_group_size,
-            ) for _ in range(num_blocks)
-        ])
+        self.encoders = MultiSequential(
+            *[
+                ConformerEncoderLayer(
+                    d_model=attention_dim,
+                    ext_pw_out_channel=ext_pw_out_channel,
+                    depthwise_seperable_out_channel=depthwise_seperable_out_channel,
+                    depthwise_multiplier=depthwise_multiplier,
+                    n_head=attention_heads,
+                    d_ffn=linear_units,
+                    ext_pw_kernel_size=ext_pw_kernel_size,
+                    kernel_size=kernel_size,
+                    dropout_rate=dropout_rate,
+                    causal=causal,
+                    batch_norm=batch_norm,
+                    activation=activation,
+                    chunk_se=chunk_se,
+                    chunk_size=chunk_size,
+                    conv_activation=conv_activation,
+                    conv_glu_type=conv_glu_type,
+                    bias_in_glu=bias_in_glu,
+                    linear_glu_in_convm=linear_glu_in_convm,
+                    attention_glu_type=attention_glu_type,
+                    activation_checkpointing=activation_checkpointing,
+                    export=export,
+                    use_pt_scaled_dot_product_attention=use_pt_scaled_dot_product_attention,
+                    attn_group_sizes=attention_group_size,
+                )
+                for _ in range(num_blocks)
+            ]
+        )
         self.extra_layer_output_idx = extra_layer_output_idx
         self.extra_multi_layer_output_idxs = extra_multi_layer_output_idxs
         # Make a zeros scalar we can use in get_initial_state to determine
@@ -867,34 +907,36 @@ def __init__(  # pylint: disable-all
         self.register_buffer("dev_type", torch.zeros(()), persistent=False)
 
     def init_relative_attention_bias(
-            self, input_tensor: torch.Tensor) -> Optional[torch.Tensor]:
+        self, input_tensor: torch.Tensor
+    ) -> Optional[torch.Tensor]:
         if self.relative_attention_bias_layer:
             return self.relative_attention_bias_layer(input_tensor)
 
-    def calculate_hs_mask(self, xs_pad: torch.Tensor, device: torch.device,
-                          mask: Optional[torch.Tensor]) -> torch.Tensor:
+    def calculate_hs_mask(
+        self, xs_pad: torch.Tensor, device: torch.device, mask: Optional[torch.Tensor]
+    ) -> torch.Tensor:
         max_audio_length = xs_pad.shape[1]
         batch_size = xs_pad.shape[0]
-        enc_streaming_mask = self._streaming_mask(max_audio_length, batch_size,
-                                                  self.chunk_size,
-                                                  self.left_chunk)
+        enc_streaming_mask = self._streaming_mask(
+            max_audio_length, batch_size, self.chunk_size, self.left_chunk
+        )
         enc_streaming_mask = enc_streaming_mask.to(device)
         if mask is None:
             return enc_streaming_mask
 
         feature_lens = mask.sum(1)
         padding_length = feature_lens
-        pad_mask = (torch.arange(0, max_audio_length,
-                                 device=device).expand(padding_length.size(0),
-                                                       -1)
-                    < padding_length.unsqueeze(1))
+        pad_mask = torch.arange(0, max_audio_length, device=device).expand(
+            padding_length.size(0), -1
+        ) < padding_length.unsqueeze(1)
         pad_mask = pad_mask.unsqueeze(1)
         pad_mask = pad_mask & enc_streaming_mask
         return pad_mask
 
     @torch.jit.ignore
-    def forward(self, xs_pad: torch.Tensor,
-                masks: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+    def forward(
+        self, xs_pad: torch.Tensor, masks: torch.Tensor
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         """Conformer Forward function
 
         Args:
@@ -905,11 +947,12 @@ def forward(self, xs_pad: torch.Tensor,
         """
         xs_pad = self.encoder_embedding(xs_pad)
         input_tensor, pos_k, pos_v, hs_mask, masks = self.forward_embeddings(
-            xs_pad, masks)
+            xs_pad, masks
+        )
 
         unfolded = False
         ori_bz, seq_len, D = input_tensor.shape
-        max_seq_len = 500  #maximum position for absolute positional encoding
+        max_seq_len = 500  # maximum position for absolute positional encoding
         if seq_len > max_seq_len:
             # audio sequence is longer than max_seq_len, unfold it into chunks
             # of max_seq_len
@@ -921,26 +964,29 @@ def forward(self, xs_pad: torch.Tensor,
             else:
                 chunk_pad_size = 0
             if chunk_pad_size > 0:
-                input_tensor_pad = F.pad(input_tensor,
-                                         (0, 0, 0, chunk_pad_size), "constant",
-                                         0)
+                input_tensor_pad = F.pad(
+                    input_tensor, (0, 0, 0, chunk_pad_size), "constant", 0
+                )
                 input_tensor = input_tensor_pad.to(input_tensor.device)
             input_tensor = unfold_tensor(input_tensor, max_seq_len)
             if masks is not None:
                 # revise hs_mask here because the previous calculated hs_mask
                 # did not consider extra pad
                 subsampled_pad_mask = masks.squeeze(
-                    1)  # [bz, subsampled_unmask_seq_len]
+                    1
+                )  # [bz, subsampled_unmask_seq_len]
                 extra_padded_subsamlped_pad_mask = F.pad(
-                    subsampled_pad_mask, (0, chunk_pad_size), "constant",
-                    False)  # extra padding to the pad mask
-                extra_padded_subsamlped_pad_mask = \
+                    subsampled_pad_mask, (0, chunk_pad_size), "constant", False
+                )  # extra padding to the pad mask
+                extra_padded_subsamlped_pad_mask = (
                     extra_padded_subsamlped_pad_mask.unsqueeze(-1).float()
+                )
                 masks_unfold = unfold_tensor(
                     extra_padded_subsamlped_pad_mask, max_seq_len
                 )  # unfold the pad mask like we did to the input tensor
                 masks_unfold = masks_unfold.squeeze(
-                    -1).bool()  # unfold op does not support bool tensor
+                    -1
+                ).bool()  # unfold op does not support bool tensor
             else:
                 masks_unfold = None
             hs_mask = self.calculate_hs_mask(
@@ -949,15 +995,14 @@ def forward(self, xs_pad: torch.Tensor,
 
         # layer_emb = None
 
-        relative_attention_bias = self.init_relative_attention_bias(
-            input_tensor)
+        relative_attention_bias = self.init_relative_attention_bias(input_tensor)
 
-        _simplified_path = (self.extra_layer_output_idx == -1
-                            and relative_attention_bias is None)
+        _simplified_path = (
+            self.extra_layer_output_idx == -1 and relative_attention_bias is None
+        )
 
         if _simplified_path:
-            input_tensor, *_ = self.encoders(input_tensor, pos_k, pos_v,
-                                             hs_mask)
+            input_tensor, *_ = self.encoders(input_tensor, pos_k, pos_v, hs_mask)
         else:
             for i, layer in enumerate(self.encoders):
                 input_tensor, _, _, _ = layer(
@@ -997,28 +1042,32 @@ def __init__(
     ):
         super().__init__()
 
-        self.decoders = nn.ModuleList([
-            nn.TransformerDecoderLayer(
-                d_model=attention_dim,
-                nhead=attention_heads,
-                dim_feedforward=linear_units,
-                dropout=dropout_rate,
-                activation="relu",
-                batch_first=True,
-                norm_first=normalize_before,  # TODO need to verify
-            ) for _ in range(num_blocks)
-        ])
+        self.decoders = nn.ModuleList(
+            [
+                nn.TransformerDecoderLayer(
+                    d_model=attention_dim,
+                    nhead=attention_heads,
+                    dim_feedforward=linear_units,
+                    dropout=dropout_rate,
+                    activation="relu",
+                    batch_first=True,
+                    norm_first=normalize_before,  # TODO need to verify
+                )
+                for _ in range(num_blocks)
+            ]
+        )
 
         self.queries = nn.Parameter(torch.zeros(1, num_queries, attention_dim))
-        self.after_norm = (nn.LayerNorm(attention_dim, eps=1e-12)
-                           if normalize_before else None)
+        self.after_norm = (
+            nn.LayerNorm(attention_dim, eps=1e-12) if normalize_before else None
+        )
         self.window_size = window_size
 
     def forward(
-            self,
-            audio_embed: torch.Tensor,
-            mask: Optional[torch.Tensor],
-            embed_len: Optional[int] = None
+        self,
+        audio_embed: torch.Tensor,
+        mask: Optional[torch.Tensor],
+        embed_len: Optional[int] = None,
     ) -> tuple[torch.Tensor, Optional[int]]:
         """forward decoder"""
         # audio_embed: N x T x D => N x D x T
@@ -1027,8 +1076,9 @@ def forward(
         # audio_embed: N x D x 1 x T => N x DK x T'
         padding = audio_embed.shape[-1] % self.window_size
         if padding > 0:
-            audio_embed = F.pad(audio_embed, (0, self.window_size - padding),
-                                "constant", 0)
+            audio_embed = F.pad(
+                audio_embed, (0, self.window_size - padding), "constant", 0
+            )
 
         embed_chunk = F.unfold(
             audio_embed[..., None, :],
@@ -1045,10 +1095,7 @@ def forward(
         # NT' x 1 x D
         q = self.queries.expand(bsz * slen, -1, -1)
         for layer in self.decoders:
-            q = layer(tgt=q,
-                      memory=embed_chunk,
-                      tgt_mask=None,
-                      memory_mask=mask)
+            q = layer(tgt=q, memory=embed_chunk, tgt_mask=None, memory_mask=mask)
 
         if self.after_norm is not None:
             q = self.after_norm(q)
@@ -1068,8 +1115,7 @@ def __init__(self, config: PretrainedConfig, **kwargs: Any) -> None:
         super().__init__()
         self.config = config
         # n_embed or hidden_size for text LM
-        hidden_size = (config.n_embd
-                       if hasattr(config, "n_embd") else config.hidden_size)
+        hidden_size = config.n_embd if hasattr(config, "n_embd") else config.hidden_size
 
         # self.wte = nn.Embedding(config.vocab_size, hidden_size)
 
@@ -1078,8 +1124,10 @@ def __init__(self, config: PretrainedConfig, **kwargs: Any) -> None:
         )
         self.layer_idx = -2
 
-        if (isinstance(config.audio_processor, dict)
-                and config.audio_processor.get("name", None) == "cascades"):
+        if (
+            isinstance(config.audio_processor, dict)
+            and config.audio_processor.get("name", None) == "cascades"
+        ):
             encoder_config = config.audio_processor.get("config", None)
             assert encoder_config is not None
             self.encoder = ConformerEncoder(**encoder_config)
@@ -1089,13 +1137,11 @@ def __init__(self, config: PretrainedConfig, **kwargs: Any) -> None:
         else:
             raise NotImplementedError("")
 
-        assert (audio_dim_out
-                is not None), "Remember to set values for audio_dim_out"
+        assert audio_dim_out is not None, "Remember to set values for audio_dim_out"
         self.audio_dim_out = audio_dim_out
         self.audio_dim_in = n_mels
 
-        self.freeze_audio_processor = kwargs.get("freeze_audio_processor",
-                                                 False)
+        self.freeze_audio_processor = kwargs.get("freeze_audio_processor", False)
 
         self.downsample_rate = kwargs.get("downsample_rate", 1)
 
@@ -1107,8 +1153,9 @@ def __init__(self, config: PretrainedConfig, **kwargs: Any) -> None:
             self.qformer = None
 
         if kwargs.get("use_conv_downsample", False):
-            assert (self.qformer is None
-                    ), "don't support use qformer and conv downsample together"
+            assert self.qformer is None, (
+                "don't support use qformer and conv downsample together"
+            )
             nemo_conv_settings = kwargs.get("nemo_conv_settings", {})
             default_nemo_conv_settings = {
                 "subsampling": "dw_striding",
@@ -1124,11 +1171,13 @@ def __init__(self, config: PretrainedConfig, **kwargs: Any) -> None:
             if nemo_conv_settings:
                 default_nemo_conv_settings.update(nemo_conv_settings)
                 for i in ["subsampling_factor", "feat_in", "feat_out"]:
-                    assert (
-                        i not in nemo_conv_settings
-                    ), "{i} should be specified outside of the NeMo dictionary"
+                    assert i not in nemo_conv_settings, (
+                        "{i} should be specified outside of the NeMo dictionary"
+                    )
 
-            self.conv_ds = NemoConvSubsampling(**default_nemo_conv_settings, )
+            self.conv_ds = NemoConvSubsampling(
+                **default_nemo_conv_settings,
+            )
         else:
             self.conv_ds = None
 
@@ -1140,30 +1189,26 @@ def __init__(self, config: PretrainedConfig, **kwargs: Any) -> None:
             # (do not use image_projection and image_proj_norm)
             dim_projection = hidden_size
             depth = 2
-            self.linear_downsample_rate = (1 if (self.qformer or self.conv_ds)
-                                           else self.downsample_rate)
+            self.linear_downsample_rate = (
+                1 if (self.qformer or self.conv_ds) else self.downsample_rate
+            )
             layers = [
-                nn.Linear(audio_dim_out * self.linear_downsample_rate,
-                          dim_projection)
+                nn.Linear(audio_dim_out * self.linear_downsample_rate, dim_projection)
             ]
             for _ in range(1, depth):
-                layers.extend(
-                    [nn.GELU(),
-                     nn.Linear(dim_projection, dim_projection)])
+                layers.extend([nn.GELU(), nn.Linear(dim_projection, dim_projection)])
             self.audio_projection = nn.Sequential(*layers)
             # NOTE vision-speech tasks use a separate projection layer
             layers = [
-                nn.Linear(audio_dim_out * self.linear_downsample_rate,
-                          dim_projection)
+                nn.Linear(audio_dim_out * self.linear_downsample_rate, dim_projection)
             ]
             for _ in range(1, depth):
-                layers.extend(
-                    [nn.GELU(),
-                     nn.Linear(dim_projection, dim_projection)])
+                layers.extend([nn.GELU(), nn.Linear(dim_projection, dim_projection)])
             self.audio_projection_for_vision = nn.Sequential(*layers)
         else:
             raise NotImplementedError(
-                f"projection_cls = {projection_cls}, not implemented")
+                f"projection_cls = {projection_cls}, not implemented"
+            )
 
         # TODO: audio sequence compression - Qformer
         self.vocab_size = config.vocab_size
@@ -1188,11 +1233,9 @@ def get_audio_features(
         """
         if self.freeze_audio_processor:
             with torch.no_grad():
-                audio_features, masks = self.encoder(input_embeds,
-                                                     audio_attention_mask)
+                audio_features, masks = self.encoder(input_embeds, audio_attention_mask)
         else:
-            audio_features, masks = self.encoder(input_embeds,
-                                                 audio_attention_mask)
+            audio_features, masks = self.encoder(input_embeds, audio_attention_mask)
 
         if self.qformer is not None:
             audio_features, _ = self.qformer(audio_features, mask=None)
@@ -1221,14 +1264,13 @@ def get_audio_features(
                 feat_dim * self.linear_downsample_rate,
             )
 
-        if audio_projection_mode == 'speech':
+        if audio_projection_mode == "speech":
             audio_set_tensor = self.audio_projection(audio_features)
-        elif audio_projection_mode == 'vision':
+        elif audio_projection_mode == "vision":
             audio_set_tensor = self.audio_projection_for_vision(audio_features)
         else:
             raise ValueError(
-                f"audio_projection_mode = {audio_projection_mode} not "\
-                    "implemented"
+                f"audio_projection_mode = {audio_projection_mode} not implemented"
             )
 
         return audio_set_tensor
@@ -1242,7 +1284,7 @@ def forward(
         """
         arguments:
             audio_features: audio features (T, D)
-        
+
         returns:
             audio_embeds: audio embeddings (num_audio_tokens, hidden_dim)
         """
diff --git a/vllm/model_executor/models/phi4mm_utils.py b/vllm/model_executor/models/phi4mm_utils.py
index 6fbfca619a42..d50547c199ac 100644
--- a/vllm/model_executor/models/phi4mm_utils.py
+++ b/vllm/model_executor/models/phi4mm_utils.py
@@ -43,18 +43,17 @@ def get_activation(name: str = "relu") -> torch.nn.Module:
     return nn.Identity()
 
 
-def adaptive_enc_mask(x_len: int,
-                      chunk_start_idx: list[int],
-                      left_window: int = 0,
-                      right_window: int = 0) -> torch.Tensor:
+def adaptive_enc_mask(
+    x_len: int, chunk_start_idx: list[int], left_window: int = 0, right_window: int = 0
+) -> torch.Tensor:
     """
     The function is very important for Transformer Transducer Streaming mode
     Args:
         x_len: sequence length
-        chunk_start_idx: first idx of each chunk, such as [0,18,36,48]. 
+        chunk_start_idx: first idx of each chunk, such as [0,18,36,48].
         It also supports adaptive chunk size [0,10,15,45]
         left_window: how many left chunks can be seen
-        right_window: how many right chunks can be seen. It is used for 
+        right_window: how many right chunks can be seen. It is used for
         chunk overlap model.
         Returns:
             mask (torch.Tensor): a mask tensor for streaming model
@@ -67,21 +66,23 @@ def adaptive_enc_mask(x_len: int,
                     [False., True., True., False.],
                     [False., False., True., True.]])
     """
-    chunk_start_idx = torch.Tensor(chunk_start_idx).long(
-    )  # first idx of each chunk, such as [0,18,36,48].
+    chunk_start_idx = torch.Tensor(
+        chunk_start_idx
+    ).long()  # first idx of each chunk, such as [0,18,36,48].
     start_pad = torch.nn.functional.pad(
-        chunk_start_idx,
-        (1, 0))  # append 0 to the beginning, so it becomes [0, 0, 18, 36, 48]
+        chunk_start_idx, (1, 0)
+    )  # append 0 to the beginning, so it becomes [0, 0, 18, 36, 48]
     end_pad = torch.nn.functional.pad(
         chunk_start_idx, (0, 1), value=x_len
     )  # append x_len to the end, so it becomes [0,18,36,48, x_len]
-    seq_range = torch.arange(0,
-                             x_len).unsqueeze(-1)  # seq_range size: [x_len, 1]
-    idx = ((seq_range < end_pad) &
-           (seq_range >= start_pad)).nonzero()[:, 1]  # idx size: [x_len]
+    seq_range = torch.arange(0, x_len).unsqueeze(-1)  # seq_range size: [x_len, 1]
+    idx = ((seq_range < end_pad) & (seq_range >= start_pad)).nonzero()[
+        :, 1
+    ]  # idx size: [x_len]
     # boundary = end_pad[idx]  # boundary size: [x_len]
-    seq_range_expand = (torch.arange(0, x_len).unsqueeze(0).expand(x_len, -1)
-                        )  # seq_range_expand size [x_len, x_len]
+    seq_range_expand = (
+        torch.arange(0, x_len).unsqueeze(0).expand(x_len, -1)
+    )  # seq_range_expand size [x_len, x_len]
     idx_left = idx - left_window
     idx_left[idx_left < 0] = 0
     boundary_left = start_pad[idx_left]
@@ -231,18 +232,23 @@ def forward(self, x: Tensor) -> Tensor:
         x = self.ext_pw_conv_1d(x)
         if self.glu_type == "bilinear":
             if self.bias_in_glu:
-                x = (x[:, 0:self.output_dim, :] + self.b1) * (
-                    x[:, self.output_dim:self.output_dim * 2, :] + self.b2)
+                x = (x[:, 0 : self.output_dim, :] + self.b1) * (
+                    x[:, self.output_dim : self.output_dim * 2, :] + self.b2
+                )
             else:
-                x = (x[:, 0:self.output_dim, :]) * (
-                    x[:, self.output_dim:self.output_dim * 2, :])
+                x = (
+                    (x[:, 0 : self.output_dim, :])
+                    * (x[:, self.output_dim : self.output_dim * 2, :])
+                )
         else:
             if self.bias_in_glu:
-                x = (x[:, 0:self.output_dim, :] + self.b1) * self.glu_act(
-                    x[:, self.output_dim:self.output_dim * 2, :] + self.b2)
+                x = (x[:, 0 : self.output_dim, :] + self.b1) * self.glu_act(
+                    x[:, self.output_dim : self.output_dim * 2, :] + self.b2
+                )
             else:
-                x = (x[:, 0:self.output_dim, :]) * self.glu_act(
-                    x[:, self.output_dim:self.output_dim * 2, :])
+                x = (x[:, 0 : self.output_dim, :]) * self.glu_act(
+                    x[:, self.output_dim : self.output_dim * 2, :]
+                )
 
         x = x.permute([0, 2, 1])
         return x
@@ -257,7 +263,7 @@ class DepthWiseSeperableConv1d(nn.Module):
         input_dim: int
             input channel size.
         depthwise_seperable_out_channel: int
-            if set different to 0, the number of 
+            if set different to 0, the number of
              depthwise_seperable_out_channel will be used as a channel_out
              of the second conv1d layer.
              otherwise, it equals to 0, the second conv1d layer is skipped.
@@ -327,7 +333,7 @@ class ConvModule(nn.Module):
             if > 0, ext_pw_out_channel is a dim channel size
              for the last pointwise conv after swish activation.
         depthwise_seperable_out_channel: int
-            if set different to 0, the number of 
+            if set different to 0, the number of
              depthwise_seperable_out_channel
              will be used as a channel_out of the second conv1d layer.
              otherwise, it equal to 0, the second conv1d layer is skipped.
@@ -431,12 +437,10 @@ def __init__(
 
         if depthwise_seperable_out_channel != 0:
             if input_dim != depthwise_seperable_out_channel:
-                self.ln2 = nn.Linear(depthwise_seperable_out_channel,
-                                     input_dim)
+                self.ln2 = nn.Linear(depthwise_seperable_out_channel, input_dim)
         else:
             if depthwise_multiplier != 1:
-                self.ln2 = nn.Linear(input_dim * depthwise_multiplier,
-                                     input_dim)
+                self.ln2 = nn.Linear(input_dim * depthwise_multiplier, input_dim)
 
     def _add_ext_pw_layer(self) -> None:
         """
@@ -445,7 +449,8 @@ def _add_ext_pw_layer(self) -> None:
         of the conformer.
         """
         self.ln1 = self.glu = self.bn_layer = self.ext_pw_conv_1d = (
-            nn.Identity())  # jit hacks.
+            nn.Identity()
+        )  # jit hacks.
         self.squeeze_excitation = nn.Identity()  # jit.
         self.apply_ln1 = self.fix_len1 = False  # jit.
 
@@ -509,7 +514,7 @@ def forward(self, x: Tensor) -> Tensor:
         if self.ext_pw_out_channel != 0:
             x = self.glu(x)
             if self.causal and self.ext_pw_kernel_size > 1:
-                x = x[:, :-(self.ext_pw_kernel_size - 1), :]
+                x = x[:, : -(self.ext_pw_kernel_size - 1), :]
             if self.apply_ln1:
                 x = self.ln1(x)
         else:
@@ -521,7 +526,7 @@ def forward(self, x: Tensor) -> Tensor:
 
         x = self.dw_sep_conv_1d(x)
         if self.causal and self.kernel_size > 1:
-            x = x[:, :, :-(self.kernel_size - 1)]
+            x = x[:, :, : -(self.kernel_size - 1)]
         if hasattr(self, "ln2"):
             x = x.permute([0, 2, 1])
             x = self.ln2(x)
@@ -533,7 +538,7 @@ def forward(self, x: Tensor) -> Tensor:
         if self.ext_pw_out_channel != 0:
             x = self.ext_pw_conv_1d(x)
             if self.fix_len1:
-                x = x[:, :, :-(self.ext_pw_kernel_size - 1)]
+                x = x[:, :, : -(self.ext_pw_kernel_size - 1)]
 
             if self.apply_ln1:
                 x = x.permute([0, 2, 1])
@@ -652,7 +657,7 @@ def _pre_hook(
 
     Note:
         We saved self.pe until v.0.5.2 but we have omitted it later.
-        Therefore, we remove the item "pe" from `state_dict` for backward 
+        Therefore, we remove the item "pe" from `state_dict` for backward
         compatibility.
 
     """
@@ -663,7 +668,7 @@ def _pre_hook(
 
 class T5RelativeAttentionLogitBias(nn.Module):
     """
-    This module implements the relative position bias described in Section 
+    This module implements the relative position bias described in Section
     2.1 of the T5 paper: https://arxiv.org/pdf/1910.10683.pdf
 
     The Huggingface implementation is used as a reference
@@ -671,18 +676,18 @@ class T5RelativeAttentionLogitBias(nn.Module):
     transformers/models/t5/modeling_t5.py#L435
 
     Modifies attention as Q*K^T + B, where B is a learned scalar bias based
-    on relative position of the query and key. It is HxNxN, where H is the 
+    on relative position of the query and key. It is HxNxN, where H is the
     number of heads, N is the sequence length.
 
     I've made these modifications to the original T5 bias:
-    - Skipping of the bucketing step. Original T5 bias converted rel 
-      position distances into logarithmically increasing buckets. This is 
+    - Skipping of the bucketing step. Original T5 bias converted rel
+      position distances into logarithmically increasing buckets. This is
       supposed to help with length generalization.
-    - I just directly use rel position index as bias values, as we don't 
-      need length generalization (40s max is good enough for ASR encoder), 
+    - I just directly use rel position index as bias values, as we don't
+      need length generalization (40s max is good enough for ASR encoder),
       and it keeps ONNX export simple.
-    - I've also extended it so that biases can be asymmetric, the default 
-      implementation treats L->R and R->L the same. Asymmetric was found to 
+    - I've also extended it so that biases can be asymmetric, the default
+      implementation treats L->R and R->L the same. Asymmetric was found to
       yield better results in my experiments.
 
     Args:
@@ -690,26 +695,28 @@ class T5RelativeAttentionLogitBias(nn.Module):
             Number of attention heads
         num_buckets: int
             Number of buckets to use for relative attention bias. This is the
-            size of the learnable bias parameter. Bucketing is not yet 
+            size of the learnable bias parameter. Bucketing is not yet
             supported, so this defaults to -1 which means no bucketing is
             used (max_distance determines size of bias param).
         max_distance: int
-            Maximum distance to use for relative attention bias. With 
-            num_buckets=-1, this directly controls the max size of the bias 
-            parameter. When num_buckets > 0 is supported, this will control 
-            the maximum distance for logarithmic bucketing after which all 
+            Maximum distance to use for relative attention bias. With
+            num_buckets=-1, this directly controls the max size of the bias
+            parameter. When num_buckets > 0 is supported, this will control
+            the maximum distance for logarithmic bucketing after which all
             positions are in the same bucket.
         symmetric: bool
             Whether to use symmetric or asymmetric biases. symmetric=False uses
-            2x number of bias params to distinguish L->R from R->L. This was 
+            2x number of bias params to distinguish L->R from R->L. This was
             found to be better for the encoder.
     """
 
-    def __init__(self,
-                 num_heads: int,
-                 num_buckets: int = -1,
-                 max_distance: int = 1000,
-                 symmetric: bool = False) -> None:
+    def __init__(
+        self,
+        num_heads: int,
+        num_buckets: int = -1,
+        max_distance: int = 1000,
+        symmetric: bool = False,
+    ) -> None:
         super().__init__()
         self.num_heads = num_heads
         self.num_buckets = num_buckets
@@ -720,7 +727,8 @@ def __init__(self,
             self.num_buckets = max_distance
         else:
             raise NotImplementedError(
-                "T5 attention bias with bucketed positions is not yet tested")
+                "T5 attention bias with bucketed positions is not yet tested"
+            )
         if not self.symmetric:
             self.num_buckets *= 2
         self.bias_values = nn.Embedding(self.num_buckets, self.num_heads)
@@ -728,19 +736,21 @@ def __init__(self,
     def forward(self, x: Tensor) -> Tensor:
         # instantiate bias compatible with shape of x
         maxpos = x.size(1)
-        context_position = torch.arange(maxpos,
-                                        device=x.device,
-                                        dtype=torch.long)[:, None]
-        memory_position = torch.arange(maxpos,
-                                       device=x.device,
-                                       dtype=torch.long)[None, :]
+        context_position = torch.arange(maxpos, device=x.device, dtype=torch.long)[
+            :, None
+        ]
+        memory_position = torch.arange(maxpos, device=x.device, dtype=torch.long)[
+            None, :
+        ]
         relative_position = memory_position - context_position
         # clipping to a maximum distance using ops that play well with ONNX
         # export
         relative_position = relative_position.masked_fill(
-            relative_position < -self.max_distance, -self.max_distance)
+            relative_position < -self.max_distance, -self.max_distance
+        )
         relative_position = relative_position.masked_fill(
-            relative_position > self.max_distance - 1, self.max_distance - 1)
+            relative_position > self.max_distance - 1, self.max_distance - 1
+        )
 
         # mapping from relative position to index in the bias parameter
         if self._skip_bucketing:
@@ -753,8 +763,7 @@ def forward(self, x: Tensor) -> Tensor:
             bias_idx += self.num_buckets // 2
 
         t5_rel_att_bias = self.bias_values(bias_idx)  # [L, L, H]
-        t5_rel_att_bias = t5_rel_att_bias.permute(2, 0, 1).unsqueeze(
-            0)  # [1, H, L, L]
+        t5_rel_att_bias = t5_rel_att_bias.permute(2, 0, 1).unsqueeze(0)  # [1, H, L, L]
 
         return t5_rel_att_bias
 
@@ -766,11 +775,13 @@ def _bucket_relative_position(self, relative_position: Tensor) -> Tensor:
         if not self.causal:
             self.num_buckets //= 2
             relative_buckets += (relative_position > 0).to(
-                torch.long) * self.num_buckets
+                torch.long
+            ) * self.num_buckets
             relative_position = torch.abs(relative_position)
         else:
-            relative_position = -torch.min(relative_position,
-                                           torch.zeros_like(relative_position))
+            relative_position = -torch.min(
+                relative_position, torch.zeros_like(relative_position)
+            )
         # now relative_position is in the range [0, inf)
 
         # half of the buckets are for exact increments in positions
@@ -780,16 +791,18 @@ def _bucket_relative_position(self, relative_position: Tensor) -> Tensor:
         # The other half of the buckets are for logarithmically bigger bins in
         # positions up to max_distance
         relative_position_if_large = max_exact + (
-            torch.log(relative_position.float() / max_exact) /
-            math.log(self.max_distance / max_exact) *
-            (self.num_buckets - max_exact)).to(torch.long)
+            torch.log(relative_position.float() / max_exact)
+            / math.log(self.max_distance / max_exact)
+            * (self.num_buckets - max_exact)
+        ).to(torch.long)
         relative_position_if_large = torch.min(
             relative_position_if_large,
             torch.full_like(relative_position_if_large, self.num_buckets - 1),
         )
 
-        relative_buckets += torch.where(is_small, relative_position,
-                                        relative_position_if_large)
+        relative_buckets += torch.where(
+            is_small, relative_position, relative_position_if_large
+        )
         return relative_buckets
 
 
@@ -808,10 +821,7 @@ class AbsolutePositionalEncoding(nn.Module):
 
     """
 
-    def __init__(self,
-                 d_model: int,
-                 dropout_rate: float,
-                 max_len: int = 5000) -> None:
+    def __init__(self, d_model: int, dropout_rate: float, max_len: int = 5000) -> None:
         """Construct an PositionalEncoding object."""
         super().__init__()
         self.d_model = d_model
@@ -834,8 +844,9 @@ def extend_pe(self, x: torch.Tensor) -> None:
         pe = torch.zeros(x.size(1), self.d_model)
         position = torch.arange(0, x.size(1), dtype=torch.float32).unsqueeze(1)
         div_term = torch.exp(
-            torch.arange(0, self.d_model, 2, dtype=torch.float32) *
-            -(math.log(10000.0) / self.d_model))
+            torch.arange(0, self.d_model, 2, dtype=torch.float32)
+            * -(math.log(10000.0) / self.d_model)
+        )
         pe[:, 0::2] = torch.sin(position * div_term)
         pe[:, 1::2] = torch.cos(position * div_term)
         pe = pe.unsqueeze(0)
@@ -852,7 +863,7 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
         """
         self.extend_pe(x)
-        x = x * self.xscale + self.pe[:, :x.size(1)]
+        x = x * self.xscale + self.pe[:, : x.size(1)]
         return self.dropout(x)
 
 
@@ -889,14 +900,14 @@ class CausalConv1D(nn.Conv1d):
     locations on its right or left
     All arguments are the same as nn.Conv1d except padding.
 
-    If padding is set None, then paddings are set automatically to make it a 
+    If padding is set None, then paddings are set automatically to make it a
     causal convolution where each location would not see any steps on its right.
 
-    If padding is set as a list (size of 2), then padding[0] would be used as 
+    If padding is set as a list (size of 2), then padding[0] would be used as
     left padding and padding[1] as right padding.
     It would make it possible to control the number of steps to be accessible
     on the right and left.
-    This mode is not supported when stride > 1. padding[0]+padding[1] should 
+    This mode is not supported when stride > 1. padding[0]+padding[1] should
     be equal to (kernel_size - 1).
     """
 
@@ -920,13 +931,15 @@ def __init__(
             self._right_padding = stride - 1
         else:
             if stride != 1 and padding != kernel_size - 1:
-                raise ValueError(
-                    "No striding allowed for non-symmetric convolutions!")
+                raise ValueError("No striding allowed for non-symmetric convolutions!")
             if isinstance(padding, int):
                 self._left_padding = padding
                 self._right_padding = padding
-            elif (isinstance(padding, list) and len(padding) == 2
-                  and padding[0] + padding[1] == kernel_size - 1):
+            elif (
+                isinstance(padding, list)
+                and len(padding) == 2
+                and padding[0] + padding[1] == kernel_size - 1
+            ):
                 self._left_padding = padding[0]
                 self._right_padding = padding[1]
             else:
@@ -949,9 +962,8 @@ def __init__(
         )
 
     def update_cache(
-            self,
-            x: Tensor,
-            cache: Optional[Tensor] = None) -> tuple[Tensor, Optional[Tensor]]:
+        self, x: Tensor, cache: Optional[Tensor] = None
+    ) -> tuple[Tensor, Optional[Tensor]]:
         if cache is None:
             new_x = F.pad(x, pad=(self._left_padding, self._right_padding))
             next_cache = cache
@@ -959,16 +971,14 @@ def update_cache(
             new_x = F.pad(x, pad=(0, self._right_padding))
             new_x = torch.cat([cache, new_x], dim=-1)
             if self.cache_drop_size > 0:
-                next_cache = new_x[:, :, :-self.cache_drop_size]
+                next_cache = new_x[:, :, : -self.cache_drop_size]
             else:
                 next_cache = new_x
-            next_cache = next_cache[:, :, -cache.size(-1):]
+            next_cache = next_cache[:, :, -cache.size(-1) :]
         return new_x, next_cache
 
     def forward(
-        self,
-        x: Tensor,
-        cache: Optional[Tensor] = None
+        self, x: Tensor, cache: Optional[Tensor] = None
     ) -> Union[Tensor, tuple[Tensor, Optional[Tensor]]]:
         x, cache = self.update_cache(x, cache=cache)
         x = super().forward(x)
@@ -982,7 +992,7 @@ class CausalConv2D(nn.Conv2d):
     """
     A causal version of nn.Conv2d where each location in the 2D matrix would
     have no access to locations on its right or down
-    All arguments are the same as nn.Conv2d except padding which should be 
+    All arguments are the same as nn.Conv2d except padding which should be
     set as None
     """
 
@@ -1001,8 +1011,7 @@ def __init__(
         dtype=None,
     ) -> None:
         if padding is not None:
-            raise ValueError(
-                "Argument padding should be set to None for CausalConv2D.")
+            raise ValueError("Argument padding should be set to None for CausalConv2D.")
         self._left_padding = kernel_size - 1
         self._right_padding = stride - 1
 
@@ -1038,17 +1047,17 @@ class NemoConvSubsampling(torch.nn.Module):
     (https://github.com/NVIDIA/NeMo/blob/b367413645d5c72db3c2c96e46e95a
     34501479cf/nemo/collections/asr/parts/submodules/subsampling.py)
 
-    Striding Subsampling: "Speech-Transformer: A No-Recurrence 
-    Sequence-to-Sequence Model for Speech Recognition" by Linhao Dong 
+    Striding Subsampling: "Speech-Transformer: A No-Recurrence
+    Sequence-to-Sequence Model for Speech Recognition" by Linhao Dong
     et al. (https://ieeexplore.ieee.org/document/8462506)
 
 
-    Compared with the EncoderConv2D (`input_layer: custom`), this is a 
+    Compared with the EncoderConv2D (`input_layer: custom`), this is a
     much simplified approach, and uses no LayerNorm and far fewer Conv2Ds.
     Moreover, depthwise convolutions are used to reduce FLOPs, but the first
       layer is kept as a regular convolution so as not to degrade accuracy.
 
-    `Striding` and `dw_striding` are the same except that the latter uses 
+    `Striding` and `dw_striding` are the same except that the latter uses
     depthwise convolutions after the first layer, whereas the former does not.
 
     Args:
@@ -1056,11 +1065,11 @@ class NemoConvSubsampling(torch.nn.Module):
         feat_in (int): size of the input features
         feat_out (int): size of the output features
         subsampling (str): The subsampling technique, choose from
-            {"striding", "dw-striding", "striding_conv1d", 
+            {"striding", "dw-striding", "striding_conv1d",
             "dw_striding_conv1d"}
-        conv_channels (int): Number of channels for the convolution layers, 
+        conv_channels (int): Number of channels for the convolution layers,
                             default is 256.
-        subsampling_conv_chunking_factor (int): Input chunking factor which 
+        subsampling_conv_chunking_factor (int): Input chunking factor which
             can be -1 (no chunking) 1 (auto) or a power of 2. Default is 1
         activation (Module): activation function, default is nn.ReLU()
         is_causal (bool): whether to use causal Conv1/2D, where each step will
@@ -1095,15 +1104,15 @@ def __init__(
             "striding_conv1d",
         )
 
-        if (subsampling_conv_chunking_factor != -1
-                and subsampling_conv_chunking_factor != 1
-                and subsampling_conv_chunking_factor % 2 != 0):
+        if (
+            subsampling_conv_chunking_factor != -1
+            and subsampling_conv_chunking_factor != 1
+            and subsampling_conv_chunking_factor % 2 != 0
+        ):
             raise ValueError(
-                "subsampling_conv_chunking_factor should be -1, 1, or a "\
-                    "power of 2"
+                "subsampling_conv_chunking_factor should be -1, 1, or a power of 2"
             )
-        self.subsampling_conv_chunking_factor = \
-            subsampling_conv_chunking_factor
+        self.subsampling_conv_chunking_factor = subsampling_conv_chunking_factor
 
         in_channels = 1
         layers = []
@@ -1131,7 +1140,8 @@ def __init__(
                         kernel_size=self._kernel_size,
                         stride=self._stride,
                         padding=None,
-                    ))
+                    )
+                )
             else:
                 layers.append(
                     torch.nn.Conv2d(
@@ -1140,7 +1150,8 @@ def __init__(
                         kernel_size=self._kernel_size,
                         stride=self._stride,
                         padding=self._left_padding,
-                    ))
+                    )
+                )
             in_channels = conv_channels
             layers.append(activation)
 
@@ -1154,7 +1165,8 @@ def __init__(
                             stride=self._stride,
                             padding=None,
                             groups=in_channels,
-                        ))
+                        )
+                    )
                 else:
                     layers.append(
                         torch.nn.Conv2d(
@@ -1164,7 +1176,8 @@ def __init__(
                             stride=self._stride,
                             padding=self._left_padding,
                             groups=in_channels,
-                        ))
+                        )
+                    )
 
                 layers.append(
                     torch.nn.Conv2d(
@@ -1174,7 +1187,8 @@ def __init__(
                         stride=1,
                         padding=0,
                         groups=1,
-                    ))
+                    )
+                )
                 layers.append(activation)
                 in_channels = conv_channels
 
@@ -1201,7 +1215,8 @@ def __init__(
                             kernel_size=self._kernel_size,
                             stride=self._stride,
                             padding=None,
-                        ))
+                        )
+                    )
                 else:
                     layers.append(
                         torch.nn.Conv2d(
@@ -1210,7 +1225,8 @@ def __init__(
                             kernel_size=self._kernel_size,
                             stride=self._stride,
                             padding=self._left_padding,
-                        ))
+                        )
+                    )
                 layers.append(activation)
                 in_channels = conv_channels
 
@@ -1235,22 +1251,30 @@ def __init__(
                     layers.append(
                         CausalConv1D(
                             in_channels=in_channels,
-                            out_channels=(feat_out if self._sampling_num == i +
-                                          1 else conv_channels),
+                            out_channels=(
+                                feat_out
+                                if self._sampling_num == i + 1
+                                else conv_channels
+                            ),
                             kernel_size=self._kernel_size,
                             stride=self._stride,
                             padding=None,
-                        ))
+                        )
+                    )
                 else:
                     layers.append(
                         torch.nn.Conv1d(
                             in_channels=in_channels,
-                            out_channels=(feat_out if self._sampling_num == i +
-                                          1 else conv_channels),
+                            out_channels=(
+                                feat_out
+                                if self._sampling_num == i + 1
+                                else conv_channels
+                            ),
                             kernel_size=self._kernel_size,
                             stride=self._stride,
                             padding=self._left_padding,
-                        ))
+                        )
+                    )
                 layers.append(activation)
                 in_channels = conv_channels
 
@@ -1265,30 +1289,8 @@ def __init__(
             self._right_padding = (self._kernel_size - 1) // 2
 
             # Layer 1
-            layers.extend([
-                torch.nn.Conv1d(
-                    in_channels=in_channels,
-                    out_channels=in_channels,
-                    kernel_size=self._kernel_size,
-                    stride=self._stride,
-                    padding=self._left_padding,
-                    groups=in_channels,
-                ),
-                torch.nn.Conv1d(
-                    in_channels=in_channels,
-                    out_channels=(feat_out if self._sampling_num == 1 else
-                                  conv_channels),
-                    kernel_size=1,
-                    stride=1,
-                    padding=0,
-                    groups=1,
-                ),
-            ])
-            in_channels = conv_channels
-            layers.append(activation)
-
-            for i in range(self._sampling_num - 1):
-                layers.extend([
+            layers.extend(
+                [
                     torch.nn.Conv1d(
                         in_channels=in_channels,
                         out_channels=in_channels,
@@ -1299,14 +1301,44 @@ def __init__(
                     ),
                     torch.nn.Conv1d(
                         in_channels=in_channels,
-                        out_channels=(feat_out if self._sampling_num == i +
-                                      2 else conv_channels),
+                        out_channels=(
+                            feat_out if self._sampling_num == 1 else conv_channels
+                        ),
                         kernel_size=1,
                         stride=1,
                         padding=0,
                         groups=1,
                     ),
-                ])
+                ]
+            )
+            in_channels = conv_channels
+            layers.append(activation)
+
+            for i in range(self._sampling_num - 1):
+                layers.extend(
+                    [
+                        torch.nn.Conv1d(
+                            in_channels=in_channels,
+                            out_channels=in_channels,
+                            kernel_size=self._kernel_size,
+                            stride=self._stride,
+                            padding=self._left_padding,
+                            groups=in_channels,
+                        ),
+                        torch.nn.Conv1d(
+                            in_channels=in_channels,
+                            out_channels=(
+                                feat_out
+                                if self._sampling_num == i + 2
+                                else conv_channels
+                            ),
+                            kernel_size=1,
+                            stride=1,
+                            padding=0,
+                            groups=1,
+                        ),
+                    ]
+                )
                 layers.append(activation)
                 in_channels = conv_channels
 
@@ -1323,8 +1355,7 @@ def __init__(
                 ceil_mode=self._ceil_mode,
                 repeat_num=self._sampling_num,
             )
-            self.out = torch.nn.Linear(conv_channels * int(out_length),
-                                       feat_out)
+            self.out = torch.nn.Linear(conv_channels * int(out_length), feat_out)
             self.conv2d_subsampling = True
         elif subsampling in ["striding_conv1d", "dw_striding_conv1d"]:
             self.out = None
@@ -1340,8 +1371,9 @@ def get_sampling_frames(self) -> list[int]:
     def get_streaming_cache_size(self) -> list[int]:
         return [0, self.subsampling_factor + 1]
 
-    def forward(self, x: Tensor,
-                mask: Optional[Tensor]) -> tuple[Tensor, Optional[Tensor]]:
+    def forward(
+        self, x: Tensor, mask: Optional[Tensor]
+    ) -> tuple[Tensor, Optional[Tensor]]:
         """
         Forward method for NeMo subsampling.
 
@@ -1350,24 +1382,22 @@ def forward(self, x: Tensor,
             mask: input mask
 
         Returns:
-            x: Resulting tensor from subsampling (B, T // 
+            x: Resulting tensor from subsampling (B, T //
                 time_reduction_factor, feat_out)
-            pad_mask: tensor of padded hidden state sequences (B, 1, T // 
+            pad_mask: tensor of padded hidden state sequences (B, 1, T //
                 time_reduction_factor)
         """
         x = x.unsqueeze(1) if self.conv2d_subsampling else x.transpose(1, 2)
 
         # split inputs if chunking_factor is set
-        if (self.subsampling_conv_chunking_factor != -1
-                and self.conv2d_subsampling):
+        if self.subsampling_conv_chunking_factor != -1 and self.conv2d_subsampling:
             if self.subsampling_conv_chunking_factor == 1:
                 # if subsampling_conv_chunking_factor is 1, we split only
                 # if needed.
                 # avoiding a bug / feature limiting indexing of tensors
                 # to 2**31.
                 # see https://github.com/pytorch/pytorch/issues/80020
-                x_ceil = (2**31 / self._conv_channels * self._stride *
-                          self._stride)
+                x_ceil = 2**31 / self._conv_channels * self._stride * self._stride
                 need_to_split = torch.numel(x) > x_ceil
             else:
                 # if subsampling_conv_chunking_factor > 1 we always split
@@ -1403,7 +1433,8 @@ def forward(self, x: Tensor,
             feature_lens_remainder = feature_lens % self.subsampling_factor
             padding_length[feature_lens_remainder != 1] += 1
         pad_mask = torch.arange(0, max_audio_length, device=x.device).expand(
-            padding_length.size(0), -1) < padding_length.unsqueeze(1)
+            padding_length.size(0), -1
+        ) < padding_length.unsqueeze(1)
         return x, pad_mask.unsqueeze(1)
 
     def reset_parameters(self) -> None:
@@ -1412,27 +1443,22 @@ def reset_parameters(self) -> None:
             with torch.no_grad():
                 # init conv
                 scale = 1.0 / self._kernel_size
-                dw_max = (self._kernel_size**2)**-0.5
+                dw_max = (self._kernel_size**2) ** -0.5
                 pw_max = self._conv_channels**-0.5
 
                 torch.nn.init.uniform_(self.conv[0].weight, -scale, scale)
                 torch.nn.init.uniform_(self.conv[0].bias, -scale, scale)
 
                 for idx in range(2, len(self.conv), 3):
-                    torch.nn.init.uniform_(self.conv[idx].weight, -dw_max,
-                                           dw_max)
-                    torch.nn.init.uniform_(self.conv[idx].bias, -dw_max,
-                                           dw_max)
-                    torch.nn.init.uniform_(self.conv[idx + 1].weight, -pw_max,
-                                           pw_max)
-                    torch.nn.init.uniform_(self.conv[idx + 1].bias, -pw_max,
-                                           pw_max)
+                    torch.nn.init.uniform_(self.conv[idx].weight, -dw_max, dw_max)
+                    torch.nn.init.uniform_(self.conv[idx].bias, -dw_max, dw_max)
+                    torch.nn.init.uniform_(self.conv[idx + 1].weight, -pw_max, pw_max)
+                    torch.nn.init.uniform_(self.conv[idx + 1].bias, -pw_max, pw_max)
 
                 # init fc (80 * 64 = 5120 from https://github.com/kssteven418/
                 # Squeezeformer/blob/13c97d6cf92f2844d2cb3142b4c5bfa9ad1a8951/
                 # src/models/conformer_encoder.py#L487
-                fc_scale = (self._feat_out * self._feat_in /
-                            self._sampling_num)**-0.5
+                fc_scale = (self._feat_out * self._feat_in / self._sampling_num) ** -0.5
                 torch.nn.init.uniform_(self.out.weight, -fc_scale, fc_scale)
                 torch.nn.init.uniform_(self.out.bias, -fc_scale, fc_scale)
 
@@ -1456,15 +1482,14 @@ def conv_split_by_batch(self, x: Tensor) -> tuple[Tensor, bool]:
             return x, False
 
         return (
-            torch.cat([
-                self.conv(chunk)
-                for chunk in torch.split(x, new_batch_size, 0)
-            ]),
+            torch.cat(
+                [self.conv(chunk) for chunk in torch.split(x, new_batch_size, 0)]
+            ),
             True,
         )
 
     def conv_split_by_channel(self, x: Tensor) -> Tensor:
-        """For dw convs, tries to split input by time, run conv and concat 
+        """For dw convs, tries to split input by time, run conv and concat
         results"""
         x = self.conv[0](x)  # full conv2D
         x = self.conv[1](x)  # activation
@@ -1489,22 +1514,21 @@ def conv_split_by_channel(self, x: Tensor) -> Tensor:
             if new_t == 0:
                 new_t = 1
 
-            x = self.channel_chunked_conv(self.conv[i * 3 + 2], new_c,
-                                          x)  # conv2D, depthwise
+            x = self.channel_chunked_conv(
+                self.conv[i * 3 + 2], new_c, x
+            )  # conv2D, depthwise
 
             # splitting pointwise convs by time
             x = torch.cat(
-                [
-                    self.conv[i * 3 + 3](chunk)
-                    for chunk in torch.split(x, new_t, 2)
-                ],
+                [self.conv[i * 3 + 3](chunk) for chunk in torch.split(x, new_t, 2)],
                 2,
             )  # conv2D, pointwise
             x = self.conv[i * 3 + 4](x)  # activation
         return x
 
-    def channel_chunked_conv(self, conv: torch.nn.Module, chunk_size: int,
-                             x: Tensor) -> Tensor:
+    def channel_chunked_conv(
+        self, conv: torch.nn.Module, chunk_size: int, x: Tensor
+    ) -> Tensor:
         """Performs channel chunked convolution"""
 
         ind = 0
@@ -1524,8 +1548,8 @@ def channel_chunked_conv(self, conv: torch.nn.Module, chunk_size: int,
                 )
                 ch_out = nn.functional.conv2d(
                     chunk,
-                    conv.weight[ind:ind + step, :, :, :],
-                    bias=conv.bias[ind:ind + step],
+                    conv.weight[ind : ind + step, :, :, :],
+                    bias=conv.bias[ind : ind + step],
                     stride=self._stride,
                     padding=0,
                     groups=step,
@@ -1533,8 +1557,8 @@ def channel_chunked_conv(self, conv: torch.nn.Module, chunk_size: int,
             else:
                 ch_out = nn.functional.conv2d(
                     chunk,
-                    conv.weight[ind:ind + step, :, :, :],
-                    bias=conv.bias[ind:ind + step],
+                    conv.weight[ind : ind + step, :, :, :],
+                    bias=conv.bias[ind : ind + step],
                     stride=self._stride,
                     padding=self._left_padding,
                     groups=step,
@@ -1545,30 +1569,33 @@ def channel_chunked_conv(self, conv: torch.nn.Module, chunk_size: int,
         return torch.cat(out_chunks, 1)
 
     def change_subsampling_conv_chunking_factor(
-            self, subsampling_conv_chunking_factor: int) -> None:
-        if (subsampling_conv_chunking_factor != -1
-                and subsampling_conv_chunking_factor != 1
-                and subsampling_conv_chunking_factor % 2 != 0):
+        self, subsampling_conv_chunking_factor: int
+    ) -> None:
+        if (
+            subsampling_conv_chunking_factor != -1
+            and subsampling_conv_chunking_factor != 1
+            and subsampling_conv_chunking_factor % 2 != 0
+        ):
             raise ValueError(
-                "subsampling_conv_chunking_factor should be -1, 1, or a "\
-                    "power of 2"
+                "subsampling_conv_chunking_factor should be -1, 1, or a power of 2"
             )
         self.subsampling_conv_chunking_factor = subsampling_conv_chunking_factor
 
 
-def calc_length(lengths: Tensor,
-                all_paddings: int,
-                kernel_size: int,
-                stride: int,
-                ceil_mode: bool,
-                repeat_num: int = 1) -> Tensor:
+def calc_length(
+    lengths: Tensor,
+    all_paddings: int,
+    kernel_size: int,
+    stride: int,
+    ceil_mode: bool,
+    repeat_num: int = 1,
+) -> Tensor:
     """Calculates the output length of a Tensor passed through a convolution or
-      max pooling layer"""
+    max pooling layer"""
     add_pad: float = all_paddings - kernel_size
     one: float = 1.0
     for i in range(repeat_num):
-        lengths = (torch.div(lengths.to(dtype=torch.float) + add_pad, stride) +
-                   one)
+        lengths = torch.div(lengths.to(dtype=torch.float) + add_pad, stride) + one
         lengths = torch.ceil(lengths) if ceil_mode else torch.floor(lengths)
     return lengths.to(dtype=torch.int)
 
@@ -1619,14 +1646,15 @@ def masked_softmax(
         mask = mask.unsqueeze(1).eq(0)  # (batch, 1, time1, time2)
         scores = scores.masked_fill(mask, -torch.inf)
         attn = torch.softmax(scores, dim=-1).masked_fill(
-            mask, 0.0)  # (batch, head, time1, time2)
+            mask, 0.0
+        )  # (batch, head, time1, time2)
     else:
         attn = torch.softmax(scores, dim=-1)  # (batch, head, time1, time2)
     return attn
 
 
 class MultiHeadedAttention(nn.Module):
-    """Multi-Head Attention layer with optional relative position embedding 
+    """Multi-Head Attention layer with optional relative position embedding
     and GLU.
 
     Args:
@@ -1642,12 +1670,12 @@ class MultiHeadedAttention(nn.Module):
             default: -1 (equal to n_feat).
         use_pt_scaled_dot_product_attention: bool, optional
             if set True, use pytorch scaled dot product attention in training.
-            NOTE: this will NOT be used in ONNX decoding due to a lack of 
-            support.  In that case, we use the original attention 
+            NOTE: this will NOT be used in ONNX decoding due to a lack of
+            support.  In that case, we use the original attention
             implementation, which shows no regression.
             default: False.
         n_value: int, optional
-            if set to values other than -1, use a different dimension for 
+            if set to values other than -1, use a different dimension for
             value. With the default value (i.e. -1), it is backward compatible.
         group_size: int, optional. must divide `n_head`
             if group_size > 1:       GQA
@@ -1695,8 +1723,7 @@ def __init__(
         self.attn = torch.jit.Attribute(None, Optional[Tensor])
         self.dropout = nn.Dropout(p=dropout_rate)
         self.dropout_rate = dropout_rate
-        self.use_pt_scaled_dot_product_attention = (
-            use_pt_scaled_dot_product_attention)
+        self.use_pt_scaled_dot_product_attention = use_pt_scaled_dot_product_attention
 
         if use_pt_scaled_dot_product_attention and group_size > 1:
             raise ValueError("Cannot use PT Scaled Attention with GQA")
@@ -1728,25 +1755,24 @@ def forward(
             pos_k: key tensor used for relative positional embedding.
             pos_v: value tensor used for relative positional embedding.
             mask: mask tensor (batch, time1, time2)
-            relative_attention_bias: bias added to attention logits w.r.t. 
+            relative_attention_bias: bias added to attention logits w.r.t.
                 relative positions
                 (1, n_head, time1, time2)
         """
         n_batch = query.size(0)
 
-        q = self.linear_q(query).view(n_batch, -1, self.h,
-                                      self.d_k)  # (b, t, d)
-        k = self.linear_k(key).view(n_batch, -1, self.h_k,
-                                    self.d_k)  # (b, t, d)
+        q = self.linear_q(query).view(n_batch, -1, self.h, self.d_k)  # (b, t, d)
+        k = self.linear_k(key).view(n_batch, -1, self.h_k, self.d_k)  # (b, t, d)
         v = self.linear_v(value).view(n_batch, -1, self.h_k, self.d_k)
-        q = (q.transpose(1, 2) if self.use_pt_scaled_dot_product_attention
-             and not torch.jit.is_scripting() else q.transpose(1, 2) *
-             self.inv_sqrt_d_k)
+        q = (
+            q.transpose(1, 2)
+            if self.use_pt_scaled_dot_product_attention and not torch.jit.is_scripting()
+            else q.transpose(1, 2) * self.inv_sqrt_d_k
+        )
         k = k.transpose(1, 2)  # (batch, head_k, time2, d_k)
         v = v.transpose(1, 2)  # (batch, head_k, time2, d_k)
 
-        if (self.use_pt_scaled_dot_product_attention
-                and not torch.jit.is_scripting()):
+        if self.use_pt_scaled_dot_product_attention and not torch.jit.is_scripting():
             attn_mask = None
             if mask is not None:
                 mask = mask.unsqueeze(1)
@@ -1757,12 +1783,14 @@ def forward(
                 if mask.dtype != q.dtype:
                     attn_mask = attn_mask.to(q.dtype)
 
-            with torch.nn.attention.sdpa_kernel([
+            with torch.nn.attention.sdpa_kernel(
+                [
                     torch.nn.attention.SDPBackend.FLASH_ATTENTION,
                     torch.nn.attention.SDPBackend.EFFICIENT_ATTENTION,
                     torch.nn.attention.SDPBackend.MATH,
                     torch.nn.attention.SDPBackend.CUDNN_ATTENTION,
-            ]):
+                ]
+            ):
                 x = torch.nn.functional.scaled_dot_product_attention(
                     q,
                     k,
@@ -1780,14 +1808,17 @@ def forward(
                 if self.h != self.h_k:
                     B = torch.einsum("b g h t d, t s d -> b h t s", q, pos_k)
                 else:
-                    reshape_q = (q.contiguous().view(n_batch * self.h, -1,
-                                                     self.d_k).transpose(0, 1)
-                                 )  # (t1,nh,dk)
-                    B = torch.matmul(reshape_q,
-                                     pos_k.transpose(-2,
-                                                     -1))  # pos_k: (t1,dk,t2)
-                    B = B.transpose(0, 1).view(n_batch, self.h, pos_k.size(0),
-                                               pos_k.size(1))
+                    reshape_q = (
+                        q.contiguous()
+                        .view(n_batch * self.h, -1, self.d_k)
+                        .transpose(0, 1)
+                    )  # (t1,nh,dk)
+                    B = torch.matmul(
+                        reshape_q, pos_k.transpose(-2, -1)
+                    )  # pos_k: (t1,dk,t2)
+                    B = B.transpose(0, 1).view(
+                        n_batch, self.h, pos_k.size(0), pos_k.size(1)
+                    )
                 scores = A + B
             else:
                 scores = A
@@ -1800,20 +1831,24 @@ def forward(
             self.attn = attn
 
             p_attn = self.dropout(attn)
-            x = torch.matmul(p_attn.to(v.dtype),
-                             v)  # (batch, head, time1, d_k)
+            x = torch.matmul(p_attn.to(v.dtype), v)  # (batch, head, time1, d_k)
             if pos_v is not None:
-                reshape_attn = (p_attn.contiguous().view(
-                    n_batch * self.h, pos_v.size(0),
-                    pos_v.size(1)).transpose(0, 1))  # (t1, bh, t2)
-
-                attn_v = (torch.matmul(reshape_attn, pos_v).transpose(
-                    0, 1).contiguous().view(n_batch, self.h, pos_v.size(0),
-                                            self.d_k))
+                reshape_attn = (
+                    p_attn.contiguous()
+                    .view(n_batch * self.h, pos_v.size(0), pos_v.size(1))
+                    .transpose(0, 1)
+                )  # (t1, bh, t2)
+
+                attn_v = (
+                    torch.matmul(reshape_attn, pos_v)
+                    .transpose(0, 1)
+                    .contiguous()
+                    .view(n_batch, self.h, pos_v.size(0), self.d_k)
+                )
                 x = x + attn_v
-        x = (x.transpose(1, 2).contiguous().view(n_batch, -1,
-                                                 self.h_k * self.d_k)
-             )  # (batch, time1, d_model)
+        x = (
+            x.transpose(1, 2).contiguous().view(n_batch, -1, self.h_k * self.d_k)
+        )  # (batch, time1, d_model)
 
         return self.linear_out(x)  # (batch, time1, d_model)
 
@@ -1830,7 +1865,7 @@ def forward(self, *args) -> tuple:
 
 
 def get_offset(input_layer: str, time_reduction: int) -> int:
-    """Get an offset. We will use the offset for determining #frames of a 
+    """Get an offset. We will use the offset for determining #frames of a
     subsampled feature.
 
     Args:
@@ -1841,7 +1876,7 @@ def get_offset(input_layer: str, time_reduction: int) -> int:
     """
     if input_layer in ("conv2d", "nemo_conv") and time_reduction == 4:
         return 3
-    if input_layer in ("conv2d", ) and time_reduction == 6:
+    if input_layer in ("conv2d",) and time_reduction == 6:
         return 1
     if input_layer in ("conv2d", "nemo_conv") and time_reduction == 8:
         return 7
@@ -1850,8 +1885,8 @@ def get_offset(input_layer: str, time_reduction: int) -> int:
 
 def unfold_tensor(xs_pad: Tensor, max_seq_len: int) -> Tensor:
     """
-    For a given tensor with shape of (N, T, D), if sequence length T is 
-    longer than max_seq_len, this function unfold it to a 
+    For a given tensor with shape of (N, T, D), if sequence length T is
+    longer than max_seq_len, this function unfold it to a
     (NT', max_seq_len, D) where T' is T // max_seq_len.
     Args:
         xs_pad: input tensor with shape (N, T, D)
diff --git a/vllm/model_executor/models/phimoe.py b/vllm/model_executor/models/phimoe.py
index 7308fef092b5..fee52edfe26c 100644
--- a/vllm/model_executor/models/phimoe.py
+++ b/vllm/model_executor/models/phimoe.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only PhiMoE model."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -36,26 +37,36 @@
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.fused_moe import FusedMoE
-from vllm.model_executor.layers.linear import (QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class PhiMoEConfig(PretrainedConfig):
-
     model_type = "phimoe"
     keys_to_ignore_at_inference = ["past_key_values"]
 
@@ -128,7 +139,6 @@ def __init__(
 
 
 class mp(torch.autograd.Function):
-
     @staticmethod
     def forward(
         ctx,
@@ -173,8 +183,9 @@ def sparsemixer(scores, jitter_eps=0.01):
         # compute mask for sparsity
         mask_logits_threshold, max_ind = scores.max(dim=-1, keepdim=True)
         factor = scores.abs().clamp(min=mask_logits_threshold)
-        mask_logits_threshold = ((mask_logits_threshold - scores) /
-                                 factor) > (2 * jitter_eps)
+        mask_logits_threshold = ((mask_logits_threshold - scores) / factor) > (
+            2 * jitter_eps
+        )
 
     # apply mask
     masked_gates = scores.masked_fill(mask_logits_threshold, float("-inf"))
@@ -195,24 +206,21 @@ def sparsemixer(scores, jitter_eps=0.01):
     )
     with torch.no_grad():
         # compute mask for sparsity
-        mask_logits_threshold, max_ind = masked_scores.max(dim=-1,
-                                                           keepdim=True)
+        mask_logits_threshold, max_ind = masked_scores.max(dim=-1, keepdim=True)
         factor = scores.abs().clamp(min=mask_logits_threshold)
-        mask_logits_threshold = ((mask_logits_threshold - scores) /
-                                 factor) > (2 * jitter_eps)
+        mask_logits_threshold = ((mask_logits_threshold - scores) / factor) > (
+            2 * jitter_eps
+        )
 
     # apply mask
-    masked_gates_top2 = masked_scores.masked_fill(mask_logits_threshold,
-                                                  float("-inf"))
+    masked_gates_top2 = masked_scores.masked_fill(mask_logits_threshold, float("-inf"))
     selected_experts_top2 = max_ind
     # compute scores for gradients
     masked_gates_top2 = torch.softmax(masked_gates_top2, dim=-1)
-    multiplier_top2 = masked_gates_top2.gather(dim=-1,
-                                               index=selected_experts_top2)
+    multiplier_top2 = masked_gates_top2.gather(dim=-1, index=selected_experts_top2)
 
     multiplier = torch.concat((multiplier, multiplier_top2), dim=-1)
-    selected_experts = torch.concat((selected_experts, selected_experts_top2),
-                                    dim=-1)
+    selected_experts = torch.concat((selected_experts, selected_experts_top2), dim=-1)
 
     return (
         multiplier,
@@ -226,8 +234,7 @@ def phimoe_routing_function(
     topk: int,
     renormalize: bool,
 ):
-    assert hidden_states.shape[0] == gating_output.shape[0], (
-        "Number of tokens mismatch")
+    assert hidden_states.shape[0] == gating_output.shape[0], "Number of tokens mismatch"
     assert topk == 2, "Only top-2 routing is supported"
     assert renormalize is False, "Renormalization is not supported"
 
@@ -278,7 +285,8 @@ def __init__(
             quant_config=quant_config,
             tp_size=tp_size,
             custom_routing_function=phimoe_routing_function,
-            prefix=f"{prefix}.experts")
+            prefix=f"{prefix}.experts",
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         # NOTE: hidden_states can have either 1D or 2D shape.
@@ -291,7 +299,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class PhiMoEAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -376,7 +383,6 @@ def forward(
 
 
 class PhiMoEDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: PhiMoEConfig,
@@ -393,8 +399,9 @@ def __init__(
             num_heads=config.num_attention_heads,
             max_position=config.max_position_embeddings,
             num_kv_heads=config.num_key_value_heads,
-            head_dim=getattr(config, "head_dim",
-                             self.hidden_size // config.num_attention_heads),
+            head_dim=getattr(
+                config, "head_dim", self.hidden_size // config.num_attention_heads
+            ),
             rope_theta=rope_theta,
             cache_config=cache_config,
             quant_config=quant_config,
@@ -409,12 +416,12 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.block_sparse_moe",
         )
-        self.input_layernorm = nn.LayerNorm(config.hidden_size,
-                                            eps=config.rms_norm_eps,
-                                            elementwise_affine=True)
-        self.post_attention_layernorm = nn.LayerNorm(config.hidden_size,
-                                                     eps=config.rms_norm_eps,
-                                                     elementwise_affine=True)
+        self.input_layernorm = nn.LayerNorm(
+            config.hidden_size, eps=config.rms_norm_eps, elementwise_affine=True
+        )
+        self.post_attention_layernorm = nn.LayerNorm(
+            config.hidden_size, eps=config.rms_norm_eps, elementwise_affine=True
+        )
 
     def forward(
         self,
@@ -444,7 +451,6 @@ def forward(
 
 @support_torch_compile
 class PhiMoEModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -453,8 +459,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         quant_config = vllm_config.quant_config
         lora_config = vllm_config.lora_config
 
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
         self.config = config
@@ -468,15 +477,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: PhiMoEDecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.layers")
-        self.norm = nn.LayerNorm(config.hidden_size,
-                                 eps=config.rms_norm_eps,
-                                 elementwise_affine=True)
+                config, cache_config, quant_config, prefix=prefix
+            ),
+            prefix=f"{prefix}.layers",
+        )
+        self.norm = nn.LayerNorm(
+            config.hidden_size, eps=config.rms_norm_eps, elementwise_affine=True
+        )
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -507,10 +518,9 @@ def forward(
             )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states = self.norm(hidden_states)
         return hidden_states
@@ -523,8 +533,7 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
             num_experts=self.config.num_local_experts,
         )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -536,14 +545,15 @@ def load_weights(self, weights: Iterable[tuple[str,
         loaded_params: set[str] = set()
         expert_params_mapping = self.get_expert_mapping()
         for name, loaded_weight in weights:
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
@@ -594,8 +604,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
 
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -627,8 +638,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.lora_config = lora_config
         self.quant_config = vllm_config.quant_config
 
-        self.model = PhiMoEModel(vllm_config=vllm_config,
-                                 prefix=maybe_prefix(prefix, "model"))
+        self.model = PhiMoEModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.unpadded_vocab_size = config.vocab_size
         if lora_config:
             self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
@@ -640,16 +652,20 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 DEFAULT_VOCAB_PADDING_SIZE
                 # We need bigger padding if using lora for kernel
                 # compatibility
-                if not lora_config else lora_config.lora_vocab_padding_size),
+                if not lora_config
+                else lora_config.lora_vocab_padding_size
+            ),
             quant_config=None,
             bias=True,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -661,16 +677,16 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(self, hidden_states: torch.Tensor) -> torch.Tensor:
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
 
diff --git a/vllm/model_executor/models/pixtral.py b/vllm/model_executor/models/pixtral.py
index 1c6e3a31d985..52a5a6324457 100644
--- a/vllm/model_executor/models/pixtral.py
+++ b/vllm/model_executor/models/pixtral.py
@@ -10,17 +10,20 @@
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
-from mistral_common.protocol.instruct.messages import (ImageChunk, TextChunk,
-                                                       UserMessage)
+from mistral_common.protocol.instruct.messages import ImageChunk, TextChunk, UserMessage
 from mistral_common.protocol.instruct.request import ChatCompletionRequest
 from mistral_common.tokens.tokenizers.multimodal import ImageEncoder
 from PIL import Image
 from transformers import BatchFeature, PixtralVisionConfig, TensorType
 from transformers.image_utils import ImageInput
 from transformers.models.pixtral.image_processing_pixtral import (
-    _num_image_tokens as _get_pixtral_hf_num_image_tokens)
+    _num_image_tokens as _get_pixtral_hf_num_image_tokens,
+)
 from transformers.models.pixtral.modeling_pixtral import (
-    PixtralRotaryEmbedding, apply_rotary_pos_emb, position_ids_in_meshgrid)
+    PixtralRotaryEmbedding,
+    apply_rotary_pos_emb,
+    position_ids_in_meshgrid,
+)
 from transformers.tokenization_utils_base import TextInput
 
 from vllm.config import VllmConfig
@@ -28,37 +31,50 @@
 from vllm.distributed import divide, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_and_mul_fn
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.multimodal import MULTIMODAL_REGISTRY, MultiModalKwargsItems
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalUUIDDict, NestedTensors)
-from vllm.multimodal.parse import (ImageProcessorItems, ImageSize,
-                                   MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo,
-                                        MultiModalProcessingInfo,
-                                        PromptReplacement, PromptUpdate,
-                                        PromptUpdateDetails)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalUUIDDict,
+    NestedTensors,
+)
+from vllm.multimodal.parse import ImageProcessorItems, ImageSize, MultiModalDataItems
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    MultiModalProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder, ProcessorInputs
 from vllm.platforms import current_platform
 from vllm.sequence import IntermediateTensors
-from vllm.transformers_utils.tokenizer import (MistralTokenizer,
-                                               cached_tokenizer_from_config)
+from vllm.transformers_utils.tokenizer import (
+    MistralTokenizer,
+    cached_tokenizer_from_config,
+)
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
 from .utils import flatten_bn, init_vllm_registered_model, maybe_prefix
-from .vision import (VisionEncoderInfo, VisionFeatureSelectStrategy,
-                     resolve_visual_encoder_outputs)
+from .vision import (
+    VisionEncoderInfo,
+    VisionFeatureSelectStrategy,
+    resolve_visual_encoder_outputs,
+)
 
 try:
     from xformers import ops as xops
-    if (current_platform.is_cuda()
-            and current_platform.has_device_capability(100)):
+
+    if current_platform.is_cuda() and current_platform.has_device_capability(100):
         # Xformers FA is not compatible with B200
         USE_XFORMERS_OPS = False
     else:
@@ -76,13 +92,16 @@ class PixtralImagePixelInputs(TensorSchema):
         - c: Number of channels (3)
         - h: Height of each image
         - w: Width of each image
-    
+
     The result of stacking `ImageEncoding.tokens` from each prompt.
     """
+
     type: Literal["pixel_values"] = "pixel_values"
 
-    images: Annotated[Union[torch.Tensor, list[torch.Tensor]],
-                      TensorShape("bn", 3, "h", "w", dynamic_dims={"h", "w"})]
+    images: Annotated[
+        Union[torch.Tensor, list[torch.Tensor]],
+        TensorShape("bn", 3, "h", "w", dynamic_dims={"h", "w"}),
+    ]
 
 
 class PixtralProcessorAdapter:
@@ -150,7 +169,8 @@ def __call__(
                 "Make sure to process your input via `mistral_common`'s "
                 "tokenizer or pass a chat completion request. "
                 "For more info, see: "
-                "https://github.com/vllm-project/vllm/issues/8411.")
+                "https://github.com/vllm-project/vllm/issues/8411."
+            )
 
         images_processed = list[torch.Tensor]()
         images_tokens = list[torch.Tensor]()
@@ -163,16 +183,15 @@ def __call__(
             images_processed.append(image_processed)
             images_tokens.append(image_tokens)
 
-        return BatchFeature({
-            "input_ids":
-            torch.cat(images_tokens)[None].expand(len(text), -1),
-            "images":
-            images_processed,
-        })
+        return BatchFeature(
+            {
+                "input_ids": torch.cat(images_tokens)[None].expand(len(text), -1),
+                "images": images_processed,
+            }
+        )
 
 
 class PixtralProcessingInfo(BaseProcessingInfo):
-
     def get_tokenizer(self) -> MistralTokenizer:
         tokenizer = cached_tokenizer_from_config(self.ctx.model_config)
         if not isinstance(tokenizer, MistralTokenizer):
@@ -209,7 +228,8 @@ def get_num_image_tokens(
             processor = self.get_hf_processor()
 
         ncols, nrows = processor.image_processor._image_to_num_tokens(
-            Image.new("RGB", (image_width, image_height)))
+            Image.new("RGB", (image_width, image_height))
+        )
 
         return ncols * nrows
 
@@ -221,7 +241,6 @@ def get_image_size_with_most_features(self) -> ImageSize:
 
 
 class PixtralDummyInputsBuilder(BaseDummyInputsBuilder[PixtralProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         return ""
 
@@ -233,17 +252,17 @@ def get_dummy_mm_data(
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
     def get_dummy_processor_inputs(
@@ -259,23 +278,27 @@ def get_dummy_processor_inputs(
         dummy_images = dummy_mm_data.get("image", [])
         tokenization_kwargs = {"truncation": False}
 
-        request = ChatCompletionRequest(messages=[
-            UserMessage(content=[
-                TextChunk(text=dummy_text),
-                *(ImageChunk(image=image) for image in dummy_images),
-            ]),
-        ])
+        request = ChatCompletionRequest(
+            messages=[
+                UserMessage(
+                    content=[
+                        TextChunk(text=dummy_text),
+                        *(ImageChunk(image=image) for image in dummy_images),
+                    ]
+                ),
+            ]
+        )
         res = tokenizer.mistral.encode_chat_completion(request)
         dummy_tokens = res.tokens
 
-        return ProcessorInputs(prompt=dummy_tokens,
-                               mm_data=dummy_mm_data,
-                               tokenization_kwargs=tokenization_kwargs)
-
+        return ProcessorInputs(
+            prompt=dummy_tokens,
+            mm_data=dummy_mm_data,
+            tokenization_kwargs=tokenization_kwargs,
+        )
 
-class PixtralMultiModalProcessor(BaseMultiModalProcessor[PixtralProcessingInfo]
-                                 ):
 
+class PixtralMultiModalProcessor(BaseMultiModalProcessor[PixtralProcessingInfo]):
     def _get_mm_fields_config(
         self,
         hf_inputs: Mapping[str, NestedTensors],
@@ -300,7 +323,8 @@ def get_replacement(item_idx: int):
             image_size = images.get_image_size(item_idx)
 
             ncols, nrows = processor.image_processor._image_to_num_tokens(
-                Image.new("RGB", (image_size.width, image_size.height)))
+                Image.new("RGB", (image_size.width, image_size.height))
+            )
 
             tokens = ([image_token_id] * ncols + [image_break_id]) * nrows
             tokens[-1] = image_end_id
@@ -335,12 +359,12 @@ def _cached_apply_hf_processor(
         return prompt_ids, mm_info, True
 
 
-@MULTIMODAL_REGISTRY.register_processor(PixtralMultiModalProcessor,
-                                        info=PixtralProcessingInfo,
-                                        dummy_inputs=PixtralDummyInputsBuilder)
-class PixtralForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                      SupportsPP):
-
+@MULTIMODAL_REGISTRY.register_processor(
+    PixtralMultiModalProcessor,
+    info=PixtralProcessingInfo,
+    dummy_inputs=PixtralDummyInputsBuilder,
+)
+class PixtralForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP):
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
         if modality.startswith("image"):
@@ -374,8 +398,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.vision_encoder = VisionTransformer(self.vision_args)
 
         if self.vision_args.add_pre_mm_projector_layer_norm:
-            self.pre_mm_projector_norm = RMSNorm(self.vision_args.hidden_size,
-                                                 eps=1e-5)
+            self.pre_mm_projector_norm = RMSNorm(self.vision_args.hidden_size, eps=1e-5)
 
         if self.vision_args.mm_projector_id == PATCH_MERGE:
             self.patch_merger = PatchMerger(
@@ -385,13 +408,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             )
 
         self.vision_language_adapter = VisionLanguageAdapter(
-            self.vision_args, dim=config.text_config.hidden_size)
+            self.vision_args, dim=config.text_config.hidden_size
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[PixtralImagePixelInputs]:
+        self, **kwargs: object
+    ) -> Optional[PixtralImagePixelInputs]:
         images = kwargs.pop("images", None)
         if images is None:
             return None
@@ -407,23 +433,24 @@ def _process_image_input(
     ) -> tuple[torch.Tensor, ...]:
         images = image_input["images"]
         image_features = self.vision_encoder(images)
-        feature_sizes = [
-            image_feature.shape[0] for image_feature in image_features
-        ]
+        feature_sizes = [image_feature.shape[0] for image_feature in image_features]
         image_features = torch.cat(image_features)
         if self.vision_args.add_pre_mm_projector_layer_norm:
             image_features = self.pre_mm_projector_norm(image_features)
         if self.vision_args.mm_projector_id == PATCH_MERGE:
             patch_size = self.vision_args.patch_size
             spatial_merge_size_square = self.vision_args.spatial_merge_size**2
-            img_patch_dims = [(img.shape[1] // patch_size,
-                               img.shape[2] // patch_size) for img in images]
+            img_patch_dims = [
+                (img.shape[1] // patch_size, img.shape[2] // patch_size)
+                for img in images
+            ]
             feature_sizes = [
                 feature_size // spatial_merge_size_square
                 for feature_size in feature_sizes
             ]
-            image_features = self.patch_merger(image_features,
-                                               image_sizes=img_patch_dims)
+            image_features = self.patch_merger(
+                image_features, image_sizes=img_patch_dims
+            )
         image_embeds = self.vision_language_adapter(image_features)
         image_embeds = torch.split(image_embeds, feature_sizes)
         return image_embeds
@@ -431,8 +458,7 @@ def _process_image_input(
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -451,10 +477,9 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.language_model.model(input_ids,
-                                                  positions,
-                                                  intermediate_tensors,
-                                                  inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
 
         return hidden_states
 
@@ -465,7 +490,6 @@ def compute_logits(
         return self.language_model.compute_logits(hidden_states)
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
-
         def is_vision_encoder_weights(weight: tuple[str, torch.Tensor]):
             return weight[0].startswith("vision_encoder")
 
@@ -480,38 +504,42 @@ def is_pre_mm_projector_norm(weight: tuple[str, torch.Tensor]):
 
         # Get references to parameters for direct loading
         vision_encoder_dict = dict(self.vision_encoder.named_parameters())
-        patch_merger_dict = dict(self.patch_merger.named_parameters(
-        )) if self.vision_args.mm_projector_id == PATCH_MERGE else dict()
-        pre_mm_projector_norm_dict = dict(
-            self.pre_mm_projector_norm.named_parameters(
-            )) if self.vision_args.add_pre_mm_projector_layer_norm else dict()
-        vision_lang_adapter_dict = dict(
-            self.vision_language_adapter.named_parameters())
+        patch_merger_dict = (
+            dict(self.patch_merger.named_parameters())
+            if self.vision_args.mm_projector_id == PATCH_MERGE
+            else dict()
+        )
+        pre_mm_projector_norm_dict = (
+            dict(self.pre_mm_projector_norm.named_parameters())
+            if self.vision_args.add_pre_mm_projector_layer_norm
+            else dict()
+        )
+        vision_lang_adapter_dict = dict(self.vision_language_adapter.named_parameters())
 
         def llm_weights_generator():
             # Single pass over weights
             for name, w in weights:
                 if is_vision_encoder_weights((name, w)):
                     # Load vision encoder weights directly
-                    trimmed_name = '.'.join(name.split(".")[1:])
+                    trimmed_name = ".".join(name.split(".")[1:])
                     param = vision_encoder_dict[trimmed_name]
                     with torch.no_grad():
                         default_weight_loader(param, w)
                 elif is_patch_merger((name, w)):
                     # Load vision patch merger weights directly
-                    trimmed_name = '.'.join(name.split(".")[1:])
+                    trimmed_name = ".".join(name.split(".")[1:])
                     param = patch_merger_dict[trimmed_name]
                     with torch.no_grad():
                         default_weight_loader(param, w)
                 elif is_pre_mm_projector_norm((name, w)):
                     # Load vision pre_mm_projector_norm weights directly
-                    trimmed_name = '.'.join(name.split(".")[1:])
+                    trimmed_name = ".".join(name.split(".")[1:])
                     param = pre_mm_projector_norm_dict[trimmed_name]
                     with torch.no_grad():
                         default_weight_loader(param, w)
                 elif is_vision_lang_adapter_weights((name, w)):
                     # Load vision-language adapter weights directly
-                    trimmed_name = '.'.join(name.split(".")[1:])
+                    trimmed_name = ".".join(name.split(".")[1:])
                     param = vision_lang_adapter_dict[trimmed_name]
                     with torch.no_grad():
                         default_weight_loader(param, w)
@@ -542,8 +570,7 @@ class VisionEncoderArgs:
     mm_projector_id: str = ""
 
 
-def _reshape_for_broadcast(freqs_cis: torch.Tensor,
-                           x: torch.Tensor) -> torch.Tensor:
+def _reshape_for_broadcast(freqs_cis: torch.Tensor, x: torch.Tensor) -> torch.Tensor:
     """
     freqs_cis: complex - (seq_len, head_dim / 2)
     x: complex - (bsz, seq_len, head_dim / 2)
@@ -554,9 +581,7 @@ def _reshape_for_broadcast(freqs_cis: torch.Tensor,
         freqs_cis.shape,
         (x.shape[1], x.shape[-1]),
     )
-    shape = [
-        d if i == 1 or i == ndim - 1 else 1 for i, d in enumerate(x.shape)
-    ]
+    shape = [d if i == 1 or i == ndim - 1 else 1 for i, d in enumerate(x.shape)]
     return freqs_cis.view(*shape)
 
 
@@ -571,7 +596,7 @@ def precompute_freqs_cis_2d(
         to be indexed by (height, width) position tuples
     """
     # (dim / 2) frequency bases
-    freqs = 1.0 / (theta**(torch.arange(0, dim, 2).float() / dim))
+    freqs = 1.0 / (theta ** (torch.arange(0, dim, 2).float() / dim))
 
     h = torch.arange(height, device=freqs.device)
     w = torch.arange(width, device=freqs.device)
@@ -603,26 +628,18 @@ def apply_rotary_emb_vit(
 
 
 class FeedForward(nn.Module):
-
     def __init__(self, args: VisionEncoderArgs):
         super().__init__()
         assert args.intermediate_size is not None
-        self.w1 = nn.Linear(args.hidden_size,
-                            args.intermediate_size,
-                            bias=False)
-        self.w2 = nn.Linear(args.intermediate_size,
-                            args.hidden_size,
-                            bias=False)
-        self.w3 = nn.Linear(args.hidden_size,
-                            args.intermediate_size,
-                            bias=False)
+        self.w1 = nn.Linear(args.hidden_size, args.intermediate_size, bias=False)
+        self.w2 = nn.Linear(args.intermediate_size, args.hidden_size, bias=False)
+        self.w3 = nn.Linear(args.hidden_size, args.intermediate_size, bias=False)
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         return self.w2(F.silu(self.w1(x)) * self.w3(x))
 
 
 class Attention(nn.Module):
-
     def __init__(self, args: VisionEncoderArgs):
         super().__init__()
         self.args = args
@@ -656,10 +673,7 @@ def forward(
             q = q.transpose(1, 2)
             k = k.transpose(1, 2)
             v = v.transpose(1, 2)
-            out = nn.functional.scaled_dot_product_attention(q,
-                                                             k,
-                                                             v,
-                                                             attn_mask=mask)
+            out = nn.functional.scaled_dot_product_attention(q, k, v, attn_mask=mask)
             out = out.transpose(1, 2)
 
         out = out.reshape(batch, patches, self.n_heads * self.head_dim)
@@ -667,7 +681,6 @@ def forward(
 
 
 class TransformerBlock(nn.Module):
-
     def __init__(self, args: VisionEncoderArgs):
         super().__init__()
         self.attention = Attention(args)
@@ -681,9 +694,9 @@ def forward(
         mask: torch.Tensor,
         freqs_cis: torch.Tensor,
     ) -> torch.Tensor:
-        r = self.attention.forward(self.attention_norm(x),
-                                   mask=mask,
-                                   freqs_cis=freqs_cis)
+        r = self.attention.forward(
+            self.attention_norm(x), mask=mask, freqs_cis=freqs_cis
+        )
         h = x + r
         r = self.feed_forward.forward(self.ffn_norm(h))
         out = h + r
@@ -691,7 +704,6 @@ def forward(
 
 
 class Transformer(nn.Module):
-
     def __init__(self, args: VisionEncoderArgs):
         super().__init__()
         self.layers = torch.nn.ModuleList()
@@ -709,22 +721,26 @@ def forward(
         return x
 
 
-def position_meshgrid(patch_embeds_list: list[torch.Tensor], ) -> torch.Tensor:
-    positions = torch.cat([
-        torch.stack(
-            torch.meshgrid(
-                torch.arange(p.shape[-2]),
-                torch.arange(p.shape[-1]),
-                indexing="ij",
-            ),
-            dim=-1,
-        ).reshape(-1, 2) for p in patch_embeds_list
-    ])
+def position_meshgrid(
+    patch_embeds_list: list[torch.Tensor],
+) -> torch.Tensor:
+    positions = torch.cat(
+        [
+            torch.stack(
+                torch.meshgrid(
+                    torch.arange(p.shape[-2]),
+                    torch.arange(p.shape[-1]),
+                    indexing="ij",
+                ),
+                dim=-1,
+            ).reshape(-1, 2)
+            for p in patch_embeds_list
+        ]
+    )
     return positions
 
 
 class VisionTransformer(nn.Module):
-
     def __init__(self, args: VisionEncoderArgs):
         super().__init__()
         self.args = args
@@ -786,9 +802,7 @@ def forward(
             self.patch_conv(img.unsqueeze(0).to(self.dtype)) for img in images
         ]
 
-        patch_embeds = [
-            p.flatten(2).permute(0, 2, 1) for p in patch_embeds_list
-        ]
+        patch_embeds = [p.flatten(2).permute(0, 2, 1) for p in patch_embeds_list]
         embed_sizes = [p.shape[1] for p in patch_embeds]
 
         # flatten to a single sequence
@@ -802,13 +816,16 @@ def forward(
         # pass through Transformer with a block diagonal mask delimiting images
         if USE_XFORMERS_OPS:
             mask = xops.fmha.attn_bias.BlockDiagonalMask.from_seqlens(
-                [p.shape[-2] * p.shape[-1] for p in patch_embeds_list], )
+                [p.shape[-2] * p.shape[-1] for p in patch_embeds_list],
+            )
         else:
             from transformers.models.pixtral.modeling_pixtral import (
-                generate_block_attention_mask)
+                generate_block_attention_mask,
+            )
+
             mask = generate_block_attention_mask(
-                [p.shape[-2] * p.shape[-1] for p in patch_embeds_list],
-                patch_embeds)
+                [p.shape[-2] * p.shape[-1] for p in patch_embeds_list], patch_embeds
+            )
         out = self.transformer(patch_embeds, mask=mask, freqs_cis=freqs_cis)
 
         # squeeze dim 0 and split into separate tensors for each image
@@ -816,7 +833,6 @@ def forward(
 
 
 class VisionLanguageAdapter(nn.Module):
-
     def __init__(self, args: VisionEncoderArgs, dim: int):
         super().__init__()
         assert isinstance(args, VisionEncoderArgs)
@@ -856,8 +872,9 @@ def __init__(
             bias=use_mlp_bias,
         )
 
-    def forward(self, x: torch.Tensor,
-                image_sizes: list[tuple[int, int]]) -> torch.Tensor:
+    def forward(
+        self, x: torch.Tensor, image_sizes: list[tuple[int, int]]
+    ) -> torch.Tensor:
         # image_sizes specified in tokens
         assert sum([h * w for h, w in image_sizes]) == len(x)
 
@@ -889,15 +906,14 @@ def permute(
         """
 
         sub_grids = get_sub_grids(
-            x=x,
-            image_sizes=image_sizes,
-            spatial_merge_size=self.spatial_merge_size
+            x=x, image_sizes=image_sizes, spatial_merge_size=self.spatial_merge_size
         )  # list of [d x sub_grid_size x sub_grid_size x n_patches]
         permuted_tensor: list[torch.Tensor] = []
         for grid in sub_grids:
             n_patches = grid.shape[-1]
-            permuted_tensor.append(grid.view(-1, n_patches).t(
-            ))  # n_patches x d * sub_grid_size * sub_grid_size
+            permuted_tensor.append(
+                grid.view(-1, n_patches).t()
+            )  # n_patches x d * sub_grid_size * sub_grid_size
         return torch.cat(
             permuted_tensor, dim=0
         )  # (N / spatial_merge_size ** 2, d * spatial_merge_size ** 2)
@@ -917,14 +933,15 @@ def get_sub_grids(
     for image_index, image_tokens in enumerate(x.split(tokens_per_image)):
         # Reshape image_tokens into a 2D grid
         h, w = image_sizes[image_index]
-        image_grid = image_tokens.view(h, w, d).permute(
-            2, 0, 1)[None, :, :, :]  # 1 x d x h x w
-        sub_grids = torch.nn.functional.unfold(image_grid,
-                                               kernel_size=sub_grid_size,
-                                               stride=sub_grid_size)
+        image_grid = image_tokens.view(h, w, d).permute(2, 0, 1)[
+            None, :, :, :
+        ]  # 1 x d x h x w
+        sub_grids = torch.nn.functional.unfold(
+            image_grid, kernel_size=sub_grid_size, stride=sub_grid_size
+        )
         sub_grids = sub_grids.view(
-            1, d, sub_grid_size, sub_grid_size,
-            -1)  # 1 x d x sub_grid_size x sub_grid_size x n_patches
+            1, d, sub_grid_size, sub_grid_size, -1
+        )  # 1 x d x sub_grid_size x sub_grid_size x n_patches
 
         all_img_sub_grids.append(sub_grids[0])
 
@@ -940,7 +957,6 @@ def get_sub_grids(
 
 
 class PixtralHFEncoderInfo(VisionEncoderInfo[PixtralVisionConfig]):
-
     def get_num_image_tokens(
         self,
         *,
@@ -993,7 +1009,6 @@ def get_patch_grid_size(
 
 
 class PixtralHFMLP(nn.Module):
-
     def __init__(
         self,
         config: PixtralVisionConfig,
@@ -1009,12 +1024,15 @@ def __init__(
             output_sizes=[config.intermediate_size] * 2,
             bias=False,
             quant_config=quant_config,
-            prefix=f"{prefix}.gate_up_proj")
-        self.down_proj = RowParallelLinear(input_size=config.intermediate_size,
-                                           output_size=config.hidden_size,
-                                           bias=False,
-                                           quant_config=quant_config,
-                                           prefix=f"{prefix}.down_proj")
+            prefix=f"{prefix}.gate_up_proj",
+        )
+        self.down_proj = RowParallelLinear(
+            input_size=config.intermediate_size,
+            output_size=config.hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.down_proj",
+        )
         self.act_and_mul = get_act_and_mul_fn(config.hidden_act)
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -1025,7 +1043,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class PixtralHFAttention(nn.Module):
-
     def __init__(
         self,
         config: PixtralVisionConfig,
@@ -1081,14 +1098,12 @@ def forward(
             # Transpose q and k back for attention
             q = q.transpose(1, 2).contiguous()
             k = k.transpose(1, 2).contiguous()
-            out = xops.memory_efficient_attention(q,
-                                                  k,
-                                                  v,
-                                                  attn_bias=attention_mask)
+            out = xops.memory_efficient_attention(q, k, v, attn_bias=attention_mask)
         else:
             v = v.transpose(1, 2)
             out = nn.functional.scaled_dot_product_attention(
-                q, k, v, attn_mask=attention_mask)
+                q, k, v, attn_mask=attention_mask
+            )
             out = out.transpose(1, 2)
 
         out = out.view(batch, patches, self.n_heads * self.head_dim)
@@ -1098,7 +1113,6 @@ def forward(
 
 
 class PixtralHFTransformerBlock(nn.Module):
-
     def __init__(
         self,
         config: PixtralVisionConfig,
@@ -1109,12 +1123,12 @@ def __init__(
         super().__init__()
 
         self.attention_norm = RMSNorm(config.hidden_size, eps=1e-5)
-        self.attention = PixtralHFAttention(config,
-                                            quant_config=quant_config,
-                                            prefix=f"{prefix}.attention")
-        self.feed_forward = PixtralHFMLP(config,
-                                         quant_config=quant_config,
-                                         prefix=f"{prefix}.feed_forward")
+        self.attention = PixtralHFAttention(
+            config, quant_config=quant_config, prefix=f"{prefix}.attention"
+        )
+        self.feed_forward = PixtralHFMLP(
+            config, quant_config=quant_config, prefix=f"{prefix}.feed_forward"
+        )
         self.ffn_norm = RMSNorm(config.hidden_size, eps=1e-5)
 
     def forward(
@@ -1123,9 +1137,11 @@ def forward(
         attention_mask: torch.Tensor,
         position_embeddings: torch.Tensor,
     ) -> torch.Tensor:
-        r, _ = self.attention.forward(self.attention_norm(hidden_states),
-                                      attention_mask=attention_mask,
-                                      position_embeddings=position_embeddings)
+        r, _ = self.attention.forward(
+            self.attention_norm(hidden_states),
+            attention_mask=attention_mask,
+            position_embeddings=position_embeddings,
+        )
         h = hidden_states + r
         r = self.feed_forward.forward(self.ffn_norm(h))
         out = h + r
@@ -1133,7 +1149,6 @@ def forward(
 
 
 class PixtralHFTransformer(nn.Module):
-
     def __init__(
         self,
         config: PixtralVisionConfig,
@@ -1149,12 +1164,16 @@ def __init__(
         else:
             num_hidden_layers = num_hidden_layers_override
 
-        self.layers = nn.ModuleList([
-            PixtralHFTransformerBlock(config=config,
-                                      quant_config=quant_config,
-                                      prefix=f"{prefix}.layers.{layer_idx}")
-            for layer_idx in range(num_hidden_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                PixtralHFTransformerBlock(
+                    config=config,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.layers.{layer_idx}",
+                )
+                for layer_idx in range(num_hidden_layers)
+            ]
+        )
 
     def forward(
         self,
@@ -1177,7 +1196,6 @@ def forward(
 
 
 class PixtralHFVisionModel(nn.Module):
-
     def __init__(
         self,
         config: PixtralVisionConfig,
@@ -1211,7 +1229,8 @@ def __init__(
             raise ValueError(
                 f"The original encoder only has {num_hidden_layers} "
                 f"layers, but you requested {len(self.transformer.layers)} "
-                "layers.")
+                "layers."
+            )
 
         if require_post_norm is True:
             msg = "PixtralHFVisionModel does not have post-layernorm"
@@ -1219,8 +1238,7 @@ def __init__(
 
         self.dtype = next(self.parameters()).dtype
         self.device = next(self.parameters()).device
-        self.patch_positional_embedding = PixtralRotaryEmbedding(
-            config, self.device)
+        self.patch_positional_embedding = PixtralRotaryEmbedding(config, self.device)
 
     def forward(
         self,
@@ -1245,13 +1263,10 @@ def forward(
         """
         # pass images through initial convolution independently
         patch_embeds_list = [
-            self.patch_conv(img.unsqueeze(0).to(self.dtype))
-            for img in pixel_values
+            self.patch_conv(img.unsqueeze(0).to(self.dtype)) for img in pixel_values
         ]
 
-        patch_embeds = [
-            p.flatten(2).permute(0, 2, 1) for p in patch_embeds_list
-        ]
+        patch_embeds = [p.flatten(2).permute(0, 2, 1) for p in patch_embeds_list]
         embed_sizes = [p.shape[1] for p in patch_embeds]
 
         # flatten to a single sequence
@@ -1261,20 +1276,22 @@ def forward(
         # positional embeddings
         position_ids = position_ids_in_meshgrid(
             patch_embeds_list,
-            max_width=self.config.image_size // self.config.patch_size).to(
-                self.device)
-        position_embedding = self.patch_positional_embedding(
-            patch_embeds, position_ids)
+            max_width=self.config.image_size // self.config.patch_size,
+        ).to(self.device)
+        position_embedding = self.patch_positional_embedding(patch_embeds, position_ids)
 
         if USE_XFORMERS_OPS:
             attention_mask = xops.fmha.attn_bias.BlockDiagonalMask.from_seqlens(
-                [p.shape[-2] * p.shape[-1] for p in patch_embeds_list], )
+                [p.shape[-2] * p.shape[-1] for p in patch_embeds_list],
+            )
         else:
             from transformers.models.pixtral.modeling_pixtral import (
-                generate_block_attention_mask)
+                generate_block_attention_mask,
+            )
+
             attention_mask = generate_block_attention_mask(
-                [p.shape[-2] * p.shape[-1] for p in patch_embeds_list],
-                patch_embeds)
+                [p.shape[-2] * p.shape[-1] for p in patch_embeds_list], patch_embeds
+            )
 
         out = self.transformer(
             patch_embeds,
@@ -1296,8 +1313,7 @@ def forward(
 
     # (TODO) Add prefix argument for filtering out weights to be loaded
     #        ref: https://github.com/vllm-project/vllm/pull/7186#discussion_r1734163986
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv_proj", ".q_proj", "q"),
@@ -1317,7 +1333,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if layer_idx >= layer_count:
                     continue
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -1327,8 +1343,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
diff --git a/vllm/model_executor/models/plamo2.py b/vllm/model_executor/models/plamo2.py
index 8234d40e94ab..278957e7cf6c 100644
--- a/vllm/model_executor/models/plamo2.py
+++ b/vllm/model_executor/models/plamo2.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Inference-only PLaMo2 model."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import TYPE_CHECKING, Optional
@@ -22,31 +23,45 @@
 from vllm.model_executor.custom_op import CustomOp
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.mamba.abstract import MambaBase
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.mamba.ops.causal_conv1d import (
-    causal_conv1d_fn, causal_conv1d_update)
-from vllm.model_executor.layers.mamba.ops.mamba_ssm import (
-    selective_state_update)
+    causal_conv1d_fn,
+    causal_conv1d_update,
+)
+from vllm.model_executor.layers.mamba.ops.mamba_ssm import selective_state_update
 from vllm.model_executor.layers.mamba.ops.ssd_combined import (
-    mamba_chunk_scan_combined_varlen)
+    mamba_chunk_scan_combined_varlen,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    composed_weight_loader, default_weight_loader, sharded_weight_loader)
-from vllm.model_executor.models.interfaces import (HasInnerState, IsHybrid,
-                                                   SupportsPP)
+    composed_weight_loader,
+    default_weight_loader,
+    sharded_weight_loader,
+)
+from vllm.model_executor.models.interfaces import HasInnerState, IsHybrid, SupportsPP
 from vllm.model_executor.models.utils import (
-    is_pp_missing_parameter, make_empty_intermediate_tensors_factory,
-    make_layers, maybe_prefix)
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.sequence import IntermediateTensors
 from vllm.utils import direct_register_custom_op
@@ -89,12 +104,7 @@ def is_mamba(config: Plamo2Config, i: int) -> bool:
 # transformers.models.mamba.modeling_mamba.MambaMixer
 @CustomOp.register(name="plamo2_mamba_mixer")
 class Plamo2MambaMixer(MambaBase, CustomOp):
-
-    def __init__(self,
-                 vllm_config: VllmConfig,
-                 *,
-                 prefix: str = "",
-                 **kwargs) -> None:
+    def __init__(self, vllm_config: VllmConfig, *, prefix: str = "", **kwargs) -> None:
         super().__init__()
         self.config = vllm_config.model_config.hf_config
         self.cache_config = vllm_config.cache_config
@@ -103,8 +113,9 @@ def __init__(self,
         self.hidden_size = self.config.hidden_size
         self.ssm_state_size = self.config.mamba_d_state
         self.conv_kernel_size = self.config.mamba_d_conv
-        self.intermediate_size = (self.config.mamba_num_heads *
-                                  self.config.hidden_size_per_head)
+        self.intermediate_size = (
+            self.config.mamba_num_heads * self.config.hidden_size_per_head
+        )
         self.tp_size = get_tensor_model_parallel_world_size()
         self.head_dim = self.config.hidden_size_per_head
         self.num_heads = self.config.mamba_num_heads
@@ -155,17 +166,17 @@ def __init__(self,
             torch.empty(
                 divide(self.num_heads, self.tp_size),
                 dtype=torch.float32,
-            ))
+            )
+        )
         self.D = nn.Parameter(torch.ones(divide(self.num_heads, self.tp_size)))
-        self.dt_bias = nn.Parameter(
-            torch.ones(divide(self.num_heads, self.tp_size)))
+        self.dt_bias = nn.Parameter(torch.ones(divide(self.num_heads, self.tp_size)))
 
         set_weight_attrs(self.D, {"weight_loader": sharded_weight_loader(0)})
         a_weight_loader = composed_weight_loader(
-            sharded_weight_loader(0), lambda x: -torch.exp(x.float()))
+            sharded_weight_loader(0), lambda x: -torch.exp(x.float())
+        )
         set_weight_attrs(self.A, {"weight_loader": a_weight_loader})
-        set_weight_attrs(self.dt_bias,
-                         {"weight_loader": sharded_weight_loader(0)})
+        set_weight_attrs(self.dt_bias, {"weight_loader": sharded_weight_loader(0)})
 
         self.out_proj = RowParallelLinear(
             self.intermediate_size,
@@ -179,12 +190,9 @@ def __init__(self,
         # The activation function is fixed to SiLU.
         self.activation = "silu"
 
-        self.dt_norm = RMSNorm(self.time_step_rank,
-                               eps=self.config.rms_norm_eps)
-        self.B_norm = RMSNorm(self.ssm_state_size,
-                              eps=self.config.rms_norm_eps)
-        self.C_norm = RMSNorm(self.ssm_state_size,
-                              eps=self.config.rms_norm_eps)
+        self.dt_norm = RMSNorm(self.time_step_rank, eps=self.config.rms_norm_eps)
+        self.B_norm = RMSNorm(self.ssm_state_size, eps=self.config.rms_norm_eps)
+        self.C_norm = RMSNorm(self.ssm_state_size, eps=self.config.rms_norm_eps)
 
         self.chunk_size = self.config.mamba_chunk_size
 
@@ -239,7 +247,6 @@ def forward_cuda(
         output: torch.Tensor,
         **kwargs,
     ):
-
         forward_context = get_forward_context()
         # attn_metadata contains metadata necessary for the mamba2 triton
         # kernels to operate in continuous batching and in chunked prefill
@@ -269,13 +276,15 @@ def forward_cuda(
         gate, hidden_states = projected_states.chunk(2, dim=-1)
 
         # 2. Convolution sequence transformation
-        conv_weights = self.conv1d.weight.view(self.conv1d.weight.size(0),
-                                               self.conv1d.weight.size(2))
+        conv_weights = self.conv1d.weight.view(
+            self.conv1d.weight.size(0), self.conv1d.weight.size(2)
+        )
 
         if attn_metadata is None:
             # profile run
-            hidden_states = (hidden_states.transpose(0, 1).clone().transpose(
-                0, 1)).contiguous()
+            hidden_states = (
+                hidden_states.transpose(0, 1).clone().transpose(0, 1)
+            ).contiguous()
             output[:] = self.out_proj(hidden_states)
             return
 
@@ -294,9 +303,9 @@ def forward_cuda(
             [num_decodes, num_prefill_tokens],
             dim=0,
         )
-        gate_d, gate_p = torch.split(gate[:num_actual_tokens],
-                                     [num_decodes, num_prefill_tokens],
-                                     dim=0)
+        gate_d, gate_p = torch.split(
+            gate[:num_actual_tokens], [num_decodes, num_prefill_tokens], dim=0
+        )
         # Split along batch dimension
         state_indices_tensor_d, state_indices_tensor_p = torch.split(
             state_indices_tensor,
@@ -309,7 +318,7 @@ def forward_cuda(
         preallocated_ssm_out = torch.empty(
             [
                 num_prefill_tokens + num_decodes,
-                (self.num_heads // self.tp_size) * self.head_dim
+                (self.num_heads // self.tp_size) * self.head_dim,
             ],
             dtype=hidden_states.dtype,
             device=hidden_states.device,
@@ -325,8 +334,7 @@ def forward_cuda(
             # 2. Convolution sequence transformation
             # - "cache_indices" updates the conv_state cache in positions
             #   pointed to by "state_indices_tensor"
-            x = hidden_states_p.transpose(
-                0, 1)  # this is the form that causal-conv see
+            x = hidden_states_p.transpose(0, 1)  # this is the form that causal-conv see
             hidden_states_p = causal_conv1d_fn(
                 x,
                 conv_weights,
@@ -336,7 +344,8 @@ def forward_cuda(
                 has_initial_state=has_initial_states_p,
                 cache_indices=state_indices_tensor_p,
                 metadata=attn_metadata,
-                query_start_loc=query_start_loc_p)
+                query_start_loc=query_start_loc_p,
+            )
             hidden_states_p = hidden_states_p.transpose(0, 1)
             hidden_states_p = hidden_states_p[:num_prefill_tokens]
             # In some instances, the following `bcdt_proj` op
@@ -352,20 +361,23 @@ def forward_cuda(
                 # making a copy of the states
                 initial_states = torch.where(
                     has_initial_states_p[:, None, None, None],
-                    ssm_state[state_indices_tensor_p], 0)
+                    ssm_state[state_indices_tensor_p],
+                    0,
+                )
 
             varlen_state = mamba_chunk_scan_combined_varlen(
-                hidden_states_p.view(num_prefill_tokens,
-                                     self.num_heads // self.tp_size,
-                                     self.head_dim),
+                hidden_states_p.view(
+                    num_prefill_tokens, self.num_heads // self.tp_size, self.head_dim
+                ),
                 dt,
                 self.A,
                 B.view(num_prefill_tokens, 1, -1),
                 C.view(num_prefill_tokens, 1, -1),
                 chunk_size=chunk_size,
                 D=self.D,
-                z=gate_p.view(num_prefill_tokens,
-                              self.num_heads // self.tp_size, self.head_dim),
+                z=gate_p.view(
+                    num_prefill_tokens, self.num_heads // self.tp_size, self.head_dim
+                ),
                 dt_bias=self.dt_bias,
                 seq_idx=seq_idx_p,
                 cu_seqlens=query_start_loc_p,
@@ -374,8 +386,7 @@ def forward_cuda(
                 initial_states=initial_states,
                 dt_softplus=True,
                 dt_limit=(0.0, float("inf")),
-                out=preallocated_ssm_out_p.view(num_prefill_tokens, -1,
-                                                self.head_dim),
+                out=preallocated_ssm_out_p.view(num_prefill_tokens, -1, self.head_dim),
                 state_dtype=ssm_state.dtype,
             )
 
@@ -392,21 +403,23 @@ def forward_cuda(
                 conv_weights,
                 self.conv1d.bias,
                 self.activation,
-                conv_state_indices=state_indices_tensor_d)
+                conv_state_indices=state_indices_tensor_d,
+            )
 
             B, C, dt = self._project_ssm_parameters(hidden_states_d)
 
             # 3. State Space Model sequence transformation
-            A = self.A[:, None, ...][:, :,
-                                     None].expand(-1, self.head_dim,
-                                                  self.config.mamba_d_state)
+            A = self.A[:, None, ...][:, :, None].expand(
+                -1, self.head_dim, self.config.mamba_d_state
+            )
             dt = dt[:, :, None].expand(-1, -1, self.head_dim)
             dt_bias = self.dt_bias[:, None, ...].expand(-1, self.head_dim)
             D = self.D[:, None, ...].expand(-1, self.head_dim)
             B = B.unsqueeze(1)
             C = C.unsqueeze(1)
             hidden_states_d = hidden_states_d.view(
-                -1, self.num_heads // self.tp_size, self.head_dim)
+                -1, self.num_heads // self.tp_size, self.head_dim
+            )
 
             # - the hidden is reshaped into (bs, num_heads, head_dim)
             # - ssm_state's slots will be selected
@@ -425,8 +438,7 @@ def forward_cuda(
                 dt_bias=dt_bias,
                 dt_softplus=True,
                 state_batch_indices=state_indices_tensor_d,
-                out=preallocated_ssm_out_d.view(num_decodes, -1,
-                                                self.head_dim),
+                out=preallocated_ssm_out_d.view(num_decodes, -1, self.head_dim),
             )
 
         # 4. Final linear projection
@@ -457,8 +469,8 @@ def mamba_type(self) -> str:
         return "mamba2"
 
     def get_attn_backend(self) -> type["AttentionBackend"]:
-        from vllm.v1.attention.backends.mamba2_attn import (
-            Mamba2AttentionBackend)
+        from vllm.v1.attention.backends.mamba2_attn import Mamba2AttentionBackend
+
         return Mamba2AttentionBackend
 
 
@@ -489,7 +501,6 @@ def plamo2_mamba_mixer_fake(
 
 
 class DenseMLP(nn.Module):
-
     def __init__(
         self,
         config: Plamo2Config,
@@ -508,12 +519,14 @@ def __init__(
             return_bias=False,
         )
         self.act = SiluAndMul()
-        self.down_proj = RowParallelLinear(self.intermediate_size,
-                                           self.hidden_size,
-                                           bias=False,
-                                           prefix=f"{prefix}.down_proj",
-                                           quant_config=quant_config,
-                                           return_bias=False)
+        self.down_proj = RowParallelLinear(
+            self.intermediate_size,
+            self.hidden_size,
+            bias=False,
+            prefix=f"{prefix}.down_proj",
+            quant_config=quant_config,
+            return_bias=False,
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         h = self.gate_up_proj(hidden_states)
@@ -522,12 +535,7 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class Plamo2AttentionMixer(nn.Module):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 **kwargs) -> None:
+    def __init__(self, *, vllm_config: VllmConfig, prefix: str = "", **kwargs) -> None:
         super().__init__()
         config = vllm_config.model_config.hf_config
         cache_config = vllm_config.cache_config
@@ -560,20 +568,22 @@ def __init__(self,
             bias=False,
             quant_config=quant_config,
         )
-        self.o_proj = RowParallelLinear(self.total_num_heads * self.head_dim,
-                                        config.hidden_size,
-                                        bias=False,
-                                        quant_config=quant_config)
+        self.o_proj = RowParallelLinear(
+            self.total_num_heads * self.head_dim,
+            config.hidden_size,
+            bias=False,
+            quant_config=quant_config,
+        )
 
-        self.rope_theta = config.rope_theta if hasattr(config,
-                                                       "rope_theta") else 10000
-        self.rope_scaling = config.rope_scaling if hasattr(
-            config, "rope_scaling") else None
+        self.rope_theta = config.rope_theta if hasattr(config, "rope_theta") else 10000
+        self.rope_scaling = (
+            config.rope_scaling if hasattr(config, "rope_scaling") else None
+        )
         max_position = config.max_position_embeddings
         if hasattr(vllm_config.model_config, "max_model_len") and isinstance(
-                vllm_config.model_config.max_model_len, int):
-            max_position = min(max_position,
-                               vllm_config.model_config.max_model_len)
+            vllm_config.model_config.max_model_len, int
+        ):
+            max_position = min(max_position, vllm_config.model_config.max_model_len)
 
         self.rotary_emb = get_rope(
             self.head_dim,
@@ -582,22 +592,24 @@ def __init__(self,
             base=self.rope_theta,
             rope_scaling=self.rope_scaling,
         )
-        self.q_norm = RMSNorm(config.hidden_size_per_head,
-                              eps=config.rms_norm_eps)
+        self.q_norm = RMSNorm(config.hidden_size_per_head, eps=config.rms_norm_eps)
         self.q_norm.weight = torch.nn.Parameter(
-            torch.ones((self.num_heads, config.hidden_size_per_head)))
-        set_weight_attrs(self.q_norm.weight,
-                         {"weight_loader": sharded_weight_loader(0)})
-        self.k_norm = RMSNorm(config.hidden_size_per_head,
-                              eps=config.rms_norm_eps)
+            torch.ones((self.num_heads, config.hidden_size_per_head))
+        )
+        set_weight_attrs(
+            self.q_norm.weight, {"weight_loader": sharded_weight_loader(0)}
+        )
+        self.k_norm = RMSNorm(config.hidden_size_per_head, eps=config.rms_norm_eps)
         self.k_norm.weight = torch.nn.Parameter(
-            torch.ones((self.num_kv_heads, config.hidden_size_per_head)))
+            torch.ones((self.num_kv_heads, config.hidden_size_per_head))
+        )
         # Tensor-parallelism shards the K norm weights to the tp ranks
         # in a head-wise manner. This approach does not work if there is only
         # a single KV head, as is the case for PLaMo 2-1B.
         if self.total_num_kv_heads != 1:
-            set_weight_attrs(self.k_norm.weight,
-                             {"weight_loader": sharded_weight_loader(0)})
+            set_weight_attrs(
+                self.k_norm.weight, {"weight_loader": sharded_weight_loader(0)}
+            )
 
         self.attn = Attention(
             self.num_heads,
@@ -631,35 +643,30 @@ def forward(
 
 
 class Plamo2DecoderLayer(nn.Module):
-
-    def __init__(self,
-                 vllm_config: VllmConfig,
-                 layer_idx: int,
-                 prefix: str = "",
-                 **kwargs) -> None:
+    def __init__(
+        self, vllm_config: VllmConfig, layer_idx: int, prefix: str = "", **kwargs
+    ) -> None:
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
 
         self.is_mamba = is_mamba(config, layer_idx)
         if self.is_mamba:
-            self.mixer = Plamo2MambaMixer(vllm_config=vllm_config,
-                                          prefix=f"{prefix}.mixer")
+            self.mixer = Plamo2MambaMixer(
+                vllm_config=vllm_config, prefix=f"{prefix}.mixer"
+            )
         else:
-            self.mixer = Plamo2AttentionMixer(vllm_config=vllm_config,
-                                              prefix=f"{prefix}.mixer")
-
-        self.mlp = DenseMLP(config=config,
-                            quant_config=quant_config,
-                            prefix=f"{prefix}.mlp")
-        self.pre_mixer_norm = RMSNorm(config.hidden_size,
-                                      eps=config.rms_norm_eps)
-        self.post_mixer_norm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.pre_mlp_norm = RMSNorm(config.hidden_size,
-                                    eps=config.rms_norm_eps)
-        self.post_mlp_norm = RMSNorm(config.hidden_size,
-                                     eps=config.rms_norm_eps)
+            self.mixer = Plamo2AttentionMixer(
+                vllm_config=vllm_config, prefix=f"{prefix}.mixer"
+            )
+
+        self.mlp = DenseMLP(
+            config=config, quant_config=quant_config, prefix=f"{prefix}.mlp"
+        )
+        self.pre_mixer_norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_mixer_norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.pre_mlp_norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_mlp_norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def forward(
         self,
@@ -672,8 +679,7 @@ def forward(
             residual = hidden_states
             hidden_states = self.pre_mixer_norm(hidden_states)
         else:
-            hidden_states, residual = self.pre_mixer_norm(
-                hidden_states, residual)
+            hidden_states, residual = self.pre_mixer_norm(hidden_states, residual)
 
         if self.is_mamba:
             # Plamo2MambaMixer writes output to this tensor
@@ -700,7 +706,6 @@ def forward(
 
 
 class Plamo2Decoder(torch.nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         super().__init__()
         config = vllm_config.model_config.hf_config
@@ -708,13 +713,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
 
         def get_layer(prefix: str):
             layer_idx = int(prefix.rsplit(".", 1)[1])
-            return Plamo2DecoderLayer(vllm_config=vllm_config,
-                                      layer_idx=layer_idx,
-                                      prefix=prefix,
-                                      **extra_kwargs)
+            return Plamo2DecoderLayer(
+                vllm_config=vllm_config,
+                layer_idx=layer_idx,
+                prefix=prefix,
+                **extra_kwargs,
+            )
 
         self.start_layer, self.end_layer, self.layers = make_layers(
-            config.num_hidden_layers, get_layer, prefix=f"{prefix}.layers")
+            config.num_hidden_layers, get_layer, prefix=f"{prefix}.layers"
+        )
 
     def forward(
         self,
@@ -733,7 +741,6 @@ def forward(
 
 @support_torch_compile
 class Plamo2Model(torch.nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -750,11 +757,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             org_num_embeddings=config.vocab_size,
             prefix=f"{prefix}.embed_tokens",
         )
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
-        self.layers = Plamo2Decoder(vllm_config=vllm_config,
-                                    prefix=f"{prefix}.layers")
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
+        self.layers = Plamo2Decoder(vllm_config=vllm_config, prefix=f"{prefix}.layers")
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
@@ -784,10 +790,9 @@ def forward(
             residual=residual,
         )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
@@ -816,8 +821,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         # the case for PLaMo2, as indicated by the FIXME comment.
         self.config.head_dim = self.config.hidden_size_per_head
 
-        self.model = Plamo2Model(vllm_config=vllm_config,
-                                 prefix=maybe_prefix(prefix, "model"))
+        self.model = Plamo2Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.vocab_size = self.config.vocab_size
         self.unpadded_vocab_size = self.config.vocab_size
         num_embeddings = ((self.vocab_size + 15) // 16) * 16
@@ -831,23 +837,27 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         if self.config.tie_word_embeddings:
             self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
 
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                self.config.vocab_size)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, self.config.vocab_size
+        )
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs):
-
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs,
+    ):
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     @classmethod
@@ -855,7 +865,6 @@ def get_mamba_state_dtype_from_config(
         cls,
         vllm_config: "VllmConfig",
     ) -> tuple[torch.dtype, torch.dtype]:
-
         return MambaStateDtypeCalculator.mamba2_state_dtype(
             vllm_config.model_config.dtype,
             vllm_config.cache_config.mamba_cache_dtype,
@@ -877,8 +886,7 @@ def get_mamba_state_shape_from_config(
         """
         parallel_config = vllm_config.parallel_config
         hf_config = vllm_config.model_config.hf_config
-        intermediate_size =\
-                hf_config.mamba_num_heads * hf_config.hidden_size_per_head
+        intermediate_size = hf_config.mamba_num_heads * hf_config.hidden_size_per_head
 
         return MambaStateShapeCalculator.mamba2_state_shape(
             intermediate_size=intermediate_size,
@@ -900,7 +908,6 @@ def compute_logits(
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         params_dict = dict(self.named_parameters())
         for name, loaded_weight in weights:
-
             # Both tie_word_embeddings=True and lm_head.weight in the safetensor
             # at the same time causes dict key access error.
             if name == "lm_head.weight" and self.config.tie_word_embeddings:
@@ -932,10 +939,12 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
             # Also, in addition to the quantized weights,
             # the zero points and scales have to be reshaped as well.
             # Packing should not be affected by this.
-            if ".mixer.in_proj.weight" in name \
-                or "mixer.in_proj.qweight" in name \
-                or "mixer.in_proj.scales" in name \
-                or "mixer.in_proj.qzeros" in name:
+            if (
+                ".mixer.in_proj.weight" in name
+                or "mixer.in_proj.qweight" in name
+                or "mixer.in_proj.scales" in name
+                or "mixer.in_proj.qzeros" in name
+            ):
                 if "mixer.in_proj.weight" in name:
                     loaded_weight = loaded_weight.transpose(0, 1)
                 # for weight:
@@ -945,14 +954,14 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
                 # for scales and qzeros:
                 # loaded_weight.shape[0] == self.config.hidden_size // self.vllm_config.quant_config.group_size  # noqa
                 loaded_weight = loaded_weight.reshape(
-                    loaded_weight.shape[0], self.config.mamba_num_heads, -1)
-                gate_weight, hidden_states_weight = loaded_weight.chunk(2,
-                                                                        dim=-1)
+                    loaded_weight.shape[0], self.config.mamba_num_heads, -1
+                )
+                gate_weight, hidden_states_weight = loaded_weight.chunk(2, dim=-1)
                 gate_weight = gate_weight.reshape(loaded_weight.shape[0], -1)
                 hidden_states_weight = hidden_states_weight.reshape(
-                    loaded_weight.shape[0], -1)
-                loaded_weight = torch.cat([gate_weight, hidden_states_weight],
-                                          dim=-1)
+                    loaded_weight.shape[0], -1
+                )
+                loaded_weight = torch.cat([gate_weight, hidden_states_weight], dim=-1)
                 if "mixer.in_proj.weight" in name:
                     loaded_weight = loaded_weight.transpose(0, 1)
 
@@ -973,6 +982,5 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
                 continue
 
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
diff --git a/vllm/model_executor/models/qwen.py b/vllm/model_executor/models/qwen.py
index e0c08a6a8827..6a12776b7f94 100644
--- a/vllm/model_executor/models/qwen.py
+++ b/vllm/model_executor/models/qwen.py
@@ -6,6 +6,7 @@
 # Copyright (c) Alibaba Cloud.
 # LICENSE: https://huggingface.co/Qwen/Qwen-7B/blob/main/LICENSE
 """Inference-only QWen model compatible with HuggingFace weights."""
+
 import json
 from collections.abc import Iterable
 from itertools import islice
@@ -21,21 +22,28 @@
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class QWenMLP(nn.Module):
@@ -51,16 +59,15 @@ def __init__(
     ):
         super().__init__()
         self.gate_up_proj = MergedColumnParallelLinear(
-            hidden_size, [intermediate_size] * 2,
-            bias=False,
-            quant_config=quant_config)
-        self.c_proj = RowParallelLinear(intermediate_size,
-                                        hidden_size,
-                                        bias=False,
-                                        quant_config=quant_config)
+            hidden_size, [intermediate_size] * 2, bias=False, quant_config=quant_config
+        )
+        self.c_proj = RowParallelLinear(
+            intermediate_size, hidden_size, bias=False, quant_config=quant_config
+        )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -71,7 +78,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class QWenAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -85,12 +91,10 @@ def __init__(
     ):
         super().__init__()
         self.hidden_size = hidden_size
-        tensor_model_parallel_world_size = get_tensor_model_parallel_world_size(
-        )
+        tensor_model_parallel_world_size = get_tensor_model_parallel_world_size()
         self.total_num_heads = num_heads
         assert self.total_num_heads % tensor_model_parallel_world_size == 0
-        self.num_heads = (self.total_num_heads //
-                          tensor_model_parallel_world_size)
+        self.num_heads = self.total_num_heads // tensor_model_parallel_world_size
         self.head_dim = hidden_size // self.total_num_heads
         self.c_attn = QKVParallelLinear(
             hidden_size,
@@ -114,12 +118,14 @@ def __init__(
             base=rope_theta,
             rope_scaling=rope_scaling,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -135,7 +141,6 @@ def forward(
 
 
 class QWenBlock(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -148,20 +153,22 @@ def __init__(
 
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        self.attn = QWenAttention(config.hidden_size,
-                                  config.num_attention_heads,
-                                  config.max_position_embeddings,
-                                  rope_theta=rope_theta,
-                                  rope_scaling=rope_scaling,
-                                  cache_config=cache_config,
-                                  quant_config=quant_config,
-                                  prefix=f"{prefix}.attn")
+        self.attn = QWenAttention(
+            config.hidden_size,
+            config.num_attention_heads,
+            config.max_position_embeddings,
+            rope_theta=rope_theta,
+            rope_scaling=rope_scaling,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
         self.ln_2 = RMSNorm(config.hidden_size, eps=config.layer_norm_epsilon)
 
-        self.mlp = QWenMLP(config.hidden_size,
-                           config.intermediate_size // 2,
-                           quant_config=quant_config)
+        self.mlp = QWenMLP(
+            config.hidden_size, config.intermediate_size // 2, quant_config=quant_config
+        )
 
     def forward(
         self,
@@ -188,7 +195,6 @@ def forward(
 
 @support_torch_compile
 class QWenModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -205,13 +211,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
         self.start_layer, self.end_layer, self.h = make_layers(
             config.num_hidden_layers,
-            lambda prefix: QWenBlock(
-                config, cache_config, quant_config, prefix=prefix),
-            prefix=f"{prefix}.h")
+            lambda prefix: QWenBlock(config, cache_config, quant_config, prefix=prefix),
+            prefix=f"{prefix}.h",
+        )
         self.ln_f = RMSNorm(config.hidden_size, eps=config.layer_norm_epsilon)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.wte(input_ids)
@@ -241,16 +247,14 @@ def forward(
                 residual,
             )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.ln_f(hidden_states, residual)
         return hidden_states
 
 
 class QWenBaseModel(nn.Module):
-
     def __init__(
         self,
         *,
@@ -265,18 +269,21 @@ def __init__(
         self.config = config
         self.multimodal_config = multimodal_config
         self.quant_config = quant_config
-        self.transformer = transformer_type(vllm_config=vllm_config,
-                                            prefix=maybe_prefix(
-                                                prefix, "transformer"))
-        self.lm_head = ParallelLMHead(config.vocab_size,
-                                      config.hidden_size,
-                                      quant_config=quant_config,
-                                      prefix=maybe_prefix(prefix, "lm_head"))
+        self.transformer = transformer_type(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "transformer")
+        )
+        self.lm_head = ParallelLMHead(
+            config.vocab_size,
+            config.hidden_size,
+            quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
         if self.config.tie_word_embeddings:
             self.lm_head.weight = self.transformer.wte.weight
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.transformer.make_empty_intermediate_tensors)
+            self.transformer.make_empty_intermediate_tensors
+        )
 
     def compute_logits(
         self,
@@ -285,8 +292,7 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("gate_up_proj", "w2", 0),
@@ -297,7 +303,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -319,8 +325,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -338,14 +343,13 @@ class QWenLMHeadModel(QWenBaseModel, SupportsPP, SupportsLoRA):
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         if hasattr(config, "visual"):
-            hf_overrides = {
-                "architectures": ["QwenVLForConditionalGeneration"]
-            }
+            hf_overrides = {"architectures": ["QwenVLForConditionalGeneration"]}
             raise RuntimeError(
                 "The configuration of this model indicates that it supports "
                 "vision inputs, but you instantiated the text-only version "
                 "of this model. Please use the vision model by setting "
-                f"`--hf-overrides '{json.dumps(hf_overrides)}'`")
+                f"`--hf-overrides '{json.dumps(hf_overrides)}'`"
+            )
 
         super().__init__(vllm_config=vllm_config, prefix=prefix)
 
@@ -356,6 +360,7 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.transformer(input_ids, positions,
-                                         intermediate_tensors, inputs_embeds)
+        hidden_states = self.transformer(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
diff --git a/vllm/model_executor/models/qwen2.py b/vllm/model_executor/models/qwen2.py
index c536b0f60c30..c8bc17dbfa0a 100644
--- a/vllm/model_executor/models/qwen2.py
+++ b/vllm/model_executor/models/qwen2.py
@@ -24,6 +24,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Qwen2 model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Any, Optional, Union
@@ -39,28 +40,38 @@
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.config import is_interleaved
 
 from .interfaces import SupportsEagle3, SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, extract_layer_index,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class Qwen2MLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -85,8 +96,9 @@ def __init__(
             prefix=f"{prefix}.down_proj",
         )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -97,7 +109,6 @@ def forward(self, x):
 
 
 class Qwen2Attention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -160,8 +171,11 @@ def __init__(
             rope_scaling=rope_scaling,
             dual_chunk_attention_config=dual_chunk_attention_config,
         )
-        attn_cls = (EncoderOnlyAttention
-                    if attn_type == AttentionType.ENCODER_ONLY else Attention)
+        attn_cls = (
+            EncoderOnlyAttention
+            if attn_type == AttentionType.ENCODER_ONLY
+            else Attention
+        )
         self.attn = attn_cls(
             self.num_heads,
             self.head_dim,
@@ -174,7 +188,10 @@ def __init__(
             **{
                 "layer_idx": extract_layer_index(prefix),
                 "dual_chunk_attention_config": dual_chunk_attention_config,
-            } if dual_chunk_attention_config else {})
+            }
+            if dual_chunk_attention_config
+            else {},
+        )
 
     def forward(
         self,
@@ -190,7 +207,6 @@ def forward(
 
 
 class Qwen2DecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Qwen2Config,
@@ -203,9 +219,9 @@ def __init__(
         # Requires transformers > 4.32.0
         rope_theta = getattr(config, "rope_theta", 1000000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        dual_chunk_attention_config = getattr(config,
-                                              "dual_chunk_attention_config",
-                                              None)
+        dual_chunk_attention_config = getattr(
+            config, "dual_chunk_attention_config", None
+        )
 
         # By default, Qwen2 uses causal attention as it is a decoder-only model.
         # You can override the HF config with `is_causal=False` to enable
@@ -236,10 +252,10 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.mlp",
         )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -252,16 +268,14 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
@@ -274,14 +288,16 @@ def forward(
         "positions": -1,
         "intermediate_tensors": 0,
         "inputs_embeds": 0,
-    })
+    }
+)
 class Qwen2Model(nn.Module):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 decoder_layer_type: type[nn.Module] = Qwen2DecoderLayer):
+    def __init__(
+        self,
+        *,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        decoder_layer_type: type[nn.Module] = Qwen2DecoderLayer,
+    ):
         super().__init__()
 
         config = vllm_config.model_config.hf_config.get_text_config()
@@ -297,14 +313,16 @@ def __init__(self,
                 "to discuss this feature.".format(
                     config.max_window_layers,
                     config.num_hidden_layers,
-                ))
+                )
+            )
 
         self.config = config
         self.quant_config = quant_config
         self.vocab_size = config.vocab_size
 
-        if get_pp_group().is_first_rank or (config.tie_word_embeddings
-                                            and get_pp_group().is_last_rank):
+        if get_pp_group().is_first_rank or (
+            config.tie_word_embeddings and get_pp_group().is_last_rank
+        ):
             self.embed_tokens = VocabParallelEmbedding(
                 config.vocab_size,
                 config.hidden_size,
@@ -318,16 +336,18 @@ def __init__(self,
         decoder_layer_type = decoder_layer_type or Qwen2DecoderLayer
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: decoder_layer_type(config=config,
-                                              cache_config=cache_config,
-                                              quant_config=quant_config,
-                                              prefix=prefix),
+            lambda prefix: decoder_layer_type(
+                config=config,
+                cache_config=cache_config,
+                quant_config=quant_config,
+                prefix=prefix,
+            ),
             prefix=f"{prefix}.layers",
         )
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
         if get_pp_group().is_last_rank:
             self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         else:
@@ -358,16 +378,16 @@ def forward(
 
         aux_hidden_states = []
         for idx, layer in enumerate(
-                islice(self.layers, self.start_layer, self.end_layer)):
+            islice(self.layers, self.start_layer, self.end_layer)
+        ):
             if idx in self.aux_hidden_state_layers:
                 aux_hidden_states.append(hidden_states + residual)
             hidden_states, residual = layer(positions, hidden_states, residual)
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
 
@@ -376,8 +396,7 @@ def forward(
 
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -391,18 +410,19 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -417,8 +437,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                     if name is None:
                         continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 if weight_loader == default_weight_loader:
                     weight_loader(param, loaded_weight)
                 else:
@@ -435,8 +454,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -465,25 +483,28 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.lora_config = lora_config
 
         self.quant_config = quant_config
-        self.model = Qwen2Model(vllm_config=vllm_config,
-                                prefix=maybe_prefix(prefix, "model"))
+        self.model = Qwen2Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
         if get_pp_group().is_last_rank:
             if config.tie_word_embeddings:
                 self.lm_head = self.model.embed_tokens
             else:
-                self.lm_head = ParallelLMHead(config.vocab_size,
-                                              config.hidden_size,
-                                              quant_config=quant_config,
-                                              prefix=maybe_prefix(
-                                                  prefix, "lm_head"))
+                self.lm_head = ParallelLMHead(
+                    config.vocab_size,
+                    config.hidden_size,
+                    quant_config=quant_config,
+                    prefix=maybe_prefix(prefix, "lm_head"),
+                )
         else:
             self.lm_head = PPMissingLayer()
 
         self.logits_processor = LogitsProcessor(config.vocab_size)
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -502,8 +523,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -513,11 +535,9 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/qwen2_5_omni_thinker.py b/vllm/model_executor/models/qwen2_5_omni_thinker.py
index 219769b07b08..1ab2f43c9d73 100644
--- a/vllm/model_executor/models/qwen2_5_omni_thinker.py
+++ b/vllm/model_executor/models/qwen2_5_omni_thinker.py
@@ -31,11 +31,15 @@
 import torch.nn as nn
 from transformers.feature_extraction_utils import BatchFeature
 from transformers.models.qwen2_5_omni.configuration_qwen2_5_omni import (
-    Qwen2_5OmniConfig, Qwen2_5OmniThinkerConfig)
+    Qwen2_5OmniConfig,
+    Qwen2_5OmniThinkerConfig,
+)
 from transformers.models.qwen2_5_omni.modeling_qwen2_5_omni import (
-    Qwen2_5OmniAudioEncoder)
+    Qwen2_5OmniAudioEncoder,
+)
 from transformers.models.qwen2_5_omni.processing_qwen2_5_omni import (
-    Qwen2_5OmniProcessor)
+    Qwen2_5OmniProcessor,
+)
 from transformers.models.whisper import WhisperFeatureExtractor
 
 from vllm.config import VllmConfig
@@ -44,33 +48,60 @@
 from vllm.model_executor.layers.rotary_embedding import MRotaryEmbedding
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.model_executor.models.qwen2_5_vl import (
-    Qwen2_5_VisionTransformer, Qwen2_5_VLImageEmbeddingInputs,
-    Qwen2_5_VLImageInputs, Qwen2_5_VLImagePixelInputs,
-    Qwen2_5_VLProcessingInfo, Qwen2_5_VLVideoEmbeddingInputs,
-    Qwen2_5_VLVideoInputs, Qwen2_5_VLVideoPixelInputs)
+    Qwen2_5_VisionTransformer,
+    Qwen2_5_VLImageEmbeddingInputs,
+    Qwen2_5_VLImageInputs,
+    Qwen2_5_VLImagePixelInputs,
+    Qwen2_5_VLProcessingInfo,
+    Qwen2_5_VLVideoEmbeddingInputs,
+    Qwen2_5_VLVideoInputs,
+    Qwen2_5_VLVideoPixelInputs,
+)
 from vllm.model_executor.models.qwen2_audio import (
-    Qwen2AudioProcessingInfo, _get_feat_extract_output_lengths)
+    Qwen2AudioProcessingInfo,
+    _get_feat_extract_output_lengths,
+)
 from vllm.model_executor.models.qwen2_vl import Qwen2VLMultiModalDataParser
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (ImageItem, ModalityData,
-                                    MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems, NestedTensors)
-from vllm.multimodal.parse import (AudioProcessorItems, DictEmbeddingItems,
-                                   ModalityDataItems, MultiModalDataItems,
-                                   MultiModalDataParser)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        MultiModalPromptUpdates,
-                                        PlaceholderFeaturesInfo,
-                                        PromptReplacement, PromptUpdate)
+from vllm.multimodal.inputs import (
+    ImageItem,
+    ModalityData,
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+    NestedTensors,
+)
+from vllm.multimodal.parse import (
+    AudioProcessorItems,
+    DictEmbeddingItems,
+    ModalityDataItems,
+    MultiModalDataItems,
+    MultiModalDataParser,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    MultiModalPromptUpdates,
+    PlaceholderFeaturesInfo,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.tokenizer import encode_tokens
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP)
-from .utils import (AutoWeightsLoader, WeightsMapper,
-                    init_vllm_registered_model, maybe_prefix)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 
 try:
     import flash_attn
@@ -88,6 +119,7 @@ class Qwen2_5OmniAudioFeatureInputs(TensorSchema):
         - msl: Maximum sequence length
         - tsl: Total sequence length
     """
+
     type: Literal["audio_features"]
     input_features: Annotated[
         Union[torch.Tensor, list[torch.Tensor]],
@@ -101,52 +133,55 @@ class Qwen2_5OmniAudioFeatureInputs(TensorSchema):
 
 
 def create_qwen2_5_omni_thinker_field_factory(
-    spatial_merge_size: int
-) -> Callable[[Mapping[str, torch.Tensor]], Mapping[str,
-                                                    MultiModalFieldConfig]]:
-
-    def _qwen2_5_omni_thinker_field_config(hf_inputs: Mapping[str,
-                                                              torch.Tensor]):
-        audio_feature_lengths = hf_inputs.get("audio_feature_lengths",
-                                              torch.empty((0, )))
+    spatial_merge_size: int,
+) -> Callable[[Mapping[str, torch.Tensor]], Mapping[str, MultiModalFieldConfig]]:
+    def _qwen2_5_omni_thinker_field_config(hf_inputs: Mapping[str, torch.Tensor]):
+        audio_feature_lengths = hf_inputs.get(
+            "audio_feature_lengths", torch.empty((0,))
+        )
 
         image_grid_thw = hf_inputs.get("image_grid_thw", torch.empty((0, 3)))
         image_pixel_grid_sizes = image_grid_thw.prod(-1)
-        image_embed_grid_sizes = (image_pixel_grid_sizes //
-                                  spatial_merge_size // spatial_merge_size)
+        image_embed_grid_sizes = (
+            image_pixel_grid_sizes // spatial_merge_size // spatial_merge_size
+        )
 
         video_grid_thw = hf_inputs.get("video_grid_thw", torch.empty((0, 3)))
         video_grid_sizes = video_grid_thw.prod(-1)
-        video_embed_grid_sizes = (video_grid_sizes // spatial_merge_size //
-                                  spatial_merge_size)
+        video_embed_grid_sizes = (
+            video_grid_sizes // spatial_merge_size // spatial_merge_size
+        )
 
         num_videos = len(video_grid_sizes)
 
         return dict(
             input_audio_features=MultiModalFieldConfig.flat_from_sizes(
-                "audio", audio_feature_lengths, dim=1),
+                "audio", audio_feature_lengths, dim=1
+            ),
             feature_attention_mask=MultiModalFieldConfig.batched("audio"),
             audio_feature_lengths=MultiModalFieldConfig.batched("audio"),
             pixel_values=MultiModalFieldConfig.flat_from_sizes(
-                "image", image_pixel_grid_sizes),
+                "image", image_pixel_grid_sizes
+            ),
             image_embeds=MultiModalFieldConfig.flat_from_sizes(
-                "image", image_embed_grid_sizes),
+                "image", image_embed_grid_sizes
+            ),
             image_grid_thw=MultiModalFieldConfig.batched("image"),
             pixel_values_videos=MultiModalFieldConfig.flat_from_sizes(
-                "video", video_grid_sizes),
+                "video", video_grid_sizes
+            ),
             video_embeds=MultiModalFieldConfig.flat_from_sizes(
-                "video", video_embed_grid_sizes),
+                "video", video_embed_grid_sizes
+            ),
             video_grid_thw=MultiModalFieldConfig.batched("video"),
             second_per_grid_ts=MultiModalFieldConfig.batched("video"),
-            use_audio_in_video=MultiModalFieldConfig.shared(
-                "video", num_videos),
+            use_audio_in_video=MultiModalFieldConfig.shared("video", num_videos),
         )
 
     return _qwen2_5_omni_thinker_field_config
 
 
 class Qwen2_5OmniThinkerMultiModalDataParser(Qwen2VLMultiModalDataParser):
-
     def __init__(self, spatial_merge_size: int, *args, **kwargs):
         self._spatial_merge_size = spatial_merge_size
         super().__init__(self._spatial_merge_size, *args, **kwargs)
@@ -159,19 +194,18 @@ def _parse_audio_data(
             return DictEmbeddingItems(
                 data,
                 modality="audio",
-                required_fields={
-                    "input_audio_features", "audio_feature_lengths"
-                },
+                required_fields={"input_audio_features", "audio_feature_lengths"},
                 fields_factory=create_qwen2_5_omni_thinker_field_factory(
-                    self._spatial_merge_size),
+                    self._spatial_merge_size
+                ),
             )
 
         return super()._parse_audio_data(data)
 
 
-class Qwen2_5OmniThinkerProcessingInfo(Qwen2AudioProcessingInfo,
-                                       Qwen2_5_VLProcessingInfo):
-
+class Qwen2_5OmniThinkerProcessingInfo(
+    Qwen2AudioProcessingInfo, Qwen2_5_VLProcessingInfo
+):
     def get_hf_config(self):
         return self.ctx.get_hf_config(Qwen2_5OmniConfig).thinker_config
 
@@ -193,8 +227,8 @@ def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
 
 
 class Qwen2_5OmniThinkerDummyInputsBuilder(
-        BaseDummyInputsBuilder[Qwen2_5OmniThinkerProcessingInfo]):
-
+    BaseDummyInputsBuilder[Qwen2_5OmniThinkerProcessingInfo]
+):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_audios = mm_counts.get("audio", 0)
         num_images = mm_counts.get("image", 0)
@@ -206,8 +240,11 @@ def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         image_token: str = hf_processor.image_token
         video_token: str = hf_processor.video_token
 
-        return (audio_token * num_audios + image_token * num_images +
-                video_token * num_videos)
+        return (
+            audio_token * num_audios
+            + image_token * num_images
+            + video_token * num_videos
+        )
 
     def get_dummy_mm_data(
         self,
@@ -221,49 +258,55 @@ def get_dummy_mm_data(
 
         feature_extractor = self.info.get_feature_extractor()
 
-        target_audio_length = min(
-            feature_extractor.chunk_length,
-            30,
-        ) * feature_extractor.sampling_rate
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
-        target_num_frames = \
-            self.info.get_num_frames_with_most_features(seq_len, mm_counts)
+        target_audio_length = (
+            min(
+                feature_extractor.chunk_length,
+                30,
+            )
+            * feature_extractor.sampling_rate
+        )
+        target_width, target_height = self.info.get_image_size_with_most_features()
+        target_num_frames = self.info.get_num_frames_with_most_features(
+            seq_len, mm_counts
+        )
 
         image_overrides = mm_options.get("image") if mm_options else None
         video_overrides = mm_options.get("video") if mm_options else None
         audio_overrides = mm_options.get("audio") if mm_options else None
 
         mm_data = {
-            "audio":
-            self._get_dummy_audios(length=target_audio_length,
-                                   num_audios=num_audios,
-                                   overrides=audio_overrides),
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
-            "video":
-            self._get_dummy_videos(width=target_width,
-                                   height=target_height,
-                                   num_frames=target_num_frames,
-                                   num_videos=num_videos,
-                                   overrides=video_overrides),
+            "audio": self._get_dummy_audios(
+                length=target_audio_length,
+                num_audios=num_audios,
+                overrides=audio_overrides,
+            ),
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
+            "video": self._get_dummy_videos(
+                width=target_width,
+                height=target_height,
+                num_frames=target_num_frames,
+                num_videos=num_videos,
+                overrides=video_overrides,
+            ),
         }
 
         return mm_data
 
 
 class Qwen2_5OmniThinkerMultiModalProcessor(
-        BaseMultiModalProcessor[Qwen2_5OmniThinkerProcessingInfo]):
-
+    BaseMultiModalProcessor[Qwen2_5OmniThinkerProcessingInfo]
+):
     def _get_data_parser(self) -> MultiModalDataParser:
         feature_extractor = self.info.get_feature_extractor()
         return Qwen2_5OmniThinkerMultiModalDataParser(
-            spatial_merge_size=self.info.get_hf_config(
-            ).vision_config.spatial_merge_size,
-            target_sr=feature_extractor.sampling_rate)
+            spatial_merge_size=self.info.get_hf_config().vision_config.spatial_merge_size,
+            target_sr=feature_extractor.sampling_rate,
+        )
 
     def _call_hf_processor(
         self,
@@ -279,7 +322,9 @@ def _call_hf_processor(
         if audios:
             # NOTE: Qwen2.5-Omni processor accept "audio"
             mm_data["audio"] = audios
-            mm_kwargs = dict(**mm_kwargs, )
+            mm_kwargs = dict(
+                **mm_kwargs,
+            )
 
         hf_inputs = super()._call_hf_processor(
             prompt=prompt,
@@ -288,17 +333,19 @@ def _call_hf_processor(
             tok_kwargs=tok_kwargs,
         )
 
-        input_features = hf_inputs.pop('input_features', None)
-        feature_attention_mask = hf_inputs.get('feature_attention_mask', None)
-        if ('input_audio_features' not in hf_inputs
-                and input_features is not None):
+        input_features = hf_inputs.pop("input_features", None)
+        feature_attention_mask = hf_inputs.get("feature_attention_mask", None)
+        if "input_audio_features" not in hf_inputs and input_features is not None:
             if feature_attention_mask is not None:
-                input_features = input_features.permute(
-                    0, 2, 1)[feature_attention_mask.bool()].permute(1, 0)
-            hf_inputs['input_audio_features'] = input_features
-        if ('audio_feature_lengths' not in hf_inputs
-                and feature_attention_mask is not None):
-            hf_inputs['audio_feature_lengths'] = feature_attention_mask.sum(-1)
+                input_features = input_features.permute(0, 2, 1)[
+                    feature_attention_mask.bool()
+                ].permute(1, 0)
+            hf_inputs["input_audio_features"] = input_features
+        if (
+            "audio_feature_lengths" not in hf_inputs
+            and feature_attention_mask is not None
+        ):
+            hf_inputs["audio_feature_lengths"] = feature_attention_mask.sum(-1)
 
         video_second_per_grid = hf_inputs.get("video_second_per_grid", None)
         if video_second_per_grid is not None:
@@ -315,8 +362,8 @@ def _get_mm_fields_config(
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
         return create_qwen2_5_omni_thinker_field_factory(
-            self.info.get_hf_config().vision_config.spatial_merge_size)(
-                hf_inputs)
+            self.info.get_hf_config().vision_config.spatial_merge_size
+        )(hf_inputs)
 
     def _maybe_apply_prompt_updates(
         self,
@@ -335,13 +382,12 @@ def _maybe_apply_prompt_updates(
 
         use_audio_in_video = False
         if "video" in mm_kwargs:
-            video_items = [
-                item for item in mm_kwargs["video"] if item is not None
-            ]
+            video_items = [item for item in mm_kwargs["video"] if item is not None]
             # only check video items (if there are any)
             if video_items:
-                use_audio_in_video = all(item["use_audio_in_video"].data
-                                         for item in video_items)
+                use_audio_in_video = all(
+                    item["use_audio_in_video"].data for item in video_items
+                )
 
         if is_update_applied:
             mm_placeholders = self._find_mm_placeholders(
@@ -374,8 +420,7 @@ def _get_prompt_updates(
     ) -> Sequence[PromptUpdate]:
         processor = self.info.get_hf_processor(**hf_processor_mm_kwargs)
         tokenizer = self.info.get_tokenizer()
-        image_processor = self.info.get_image_processor(
-            **hf_processor_mm_kwargs)
+        image_processor = self.info.get_image_processor(**hf_processor_mm_kwargs)
         vocab = tokenizer.get_vocab()
 
         audio_token = processor.audio_token
@@ -392,12 +437,14 @@ def _get_prompt_updates(
             audio_output_lengths = []
         elif audio_feature_lengths is not None:
             _, audio_output_lens = _get_feat_extract_output_lengths(
-                audio_feature_lengths)
+                audio_feature_lengths
+            )
             audio_output_lengths = audio_output_lens.tolist()
         elif feature_attention_mask is not None:
             assert isinstance(feature_attention_mask, torch.Tensor)
             _, audio_output_lens = _get_feat_extract_output_lengths(
-                feature_attention_mask.sum(-1))
+                feature_attention_mask.sum(-1)
+            )
             audio_output_lengths = audio_output_lens.tolist()
 
         # number of audios read from video.
@@ -412,7 +459,8 @@ def get_replacement_qwen2_audio(item_idx: int):
                 audio = audios.get(item_idx)
                 raise ValueError(
                     f"The audio {audio} (len={len(audio)}) is too short "
-                    "to be represented inside the model")
+                    "to be represented inside the model"
+                )
 
             return [audio_token_id] * num_features
 
@@ -424,21 +472,20 @@ def get_replacement_qwen2_vision(item_idx: int, modality: str):
             token_id = image_token_id if modality == "image" else video_token_id
             return [token_id] * (int(grid_thw.prod()) // merge_length)
 
-        use_audio_in_video = hf_processor_mm_kwargs.get(
-            "use_audio_in_video", False)
+        use_audio_in_video = hf_processor_mm_kwargs.get("use_audio_in_video", False)
         thinker_config = self.info.get_hf_config()
 
         def get_replacement_qwen2_use_audio_in_video(item_idx: int):
             nonlocal audio_in_video_item_idx
 
-            audio_num_features = audio_output_lengths[audio_in_video_item_idx +
-                                                      item_idx]
+            audio_num_features = audio_output_lengths[
+                audio_in_video_item_idx + item_idx
+            ]
             video_grid_thw = out_mm_data["video_grid_thw"][item_idx]
 
             audio_in_video_item_idx += 1
 
-            second_per_grid_ts = hf_processor_mm_kwargs.get(
-                "second_per_grid_ts", None)
+            second_per_grid_ts = hf_processor_mm_kwargs.get("second_per_grid_ts", None)
             if second_per_grid_ts:
                 video_second_per_grid_t = second_per_grid_ts[item_idx]
             else:
@@ -452,8 +499,10 @@ def get_replacement_qwen2_use_audio_in_video(item_idx: int):
             )
 
         video_replacement_fn = (
-            get_replacement_qwen2_use_audio_in_video if use_audio_in_video else
-            partial(get_replacement_qwen2_vision, modality="video"))
+            get_replacement_qwen2_use_audio_in_video
+            if use_audio_in_video
+            else partial(get_replacement_qwen2_vision, modality="video")
+        )
 
         return [
             PromptReplacement(
@@ -464,8 +513,7 @@ def get_replacement_qwen2_use_audio_in_video(item_idx: int):
             PromptReplacement(
                 modality="image",
                 target=image_token,
-                replacement=partial(get_replacement_qwen2_vision,
-                                    modality="image"),
+                replacement=partial(get_replacement_qwen2_vision, modality="image"),
             ),
             PromptReplacement(
                 modality="video",
@@ -518,8 +566,7 @@ def _apply_hf_processor_mm_only(
         """
         mm_counts = mm_items.get_all_counts()
 
-        use_audio_in_video = hf_processor_mm_kwargs.get(
-            "use_audio_in_video", False)
+        use_audio_in_video = hf_processor_mm_kwargs.get("use_audio_in_video", False)
         if use_audio_in_video and "video" in mm_counts:
             assert "audio" in mm_counts
             mm_counts["audio"] -= mm_counts["video"]
@@ -548,14 +595,11 @@ def _validate_mm_placeholders(
 
 
 class Qwen2_5OmniConditionalGenerationMixin:
-
-    def _validate_and_reshape_mm_tensor(self,
-                                        mm_input: object,
-                                        name: str,
-                                        dim: int = 0) -> torch.Tensor:
+    def _validate_and_reshape_mm_tensor(
+        self, mm_input: object, name: str, dim: int = 0
+    ) -> torch.Tensor:
         if not isinstance(mm_input, (torch.Tensor, list)):
-            raise ValueError(f"Incorrect type of {name}. "
-                             f"Got type: {type(mm_input)}")
+            raise ValueError(f"Incorrect type of {name}. Got type: {type(mm_input)}")
         if isinstance(mm_input, torch.Tensor):
             if dim == 0:
                 return mm_input.reshape(-1, *mm_input.shape[2:])
@@ -564,25 +608,31 @@ def _validate_and_reshape_mm_tensor(self,
             return torch.concat(mm_input, dim=dim)
 
     def _parse_and_validate_audio_input(
-            self, **kwargs: object) -> Optional[Qwen2_5OmniAudioFeatureInputs]:
-        input_audio_features = kwargs.pop('input_audio_features', None)
-        audio_feature_lengths = kwargs.pop('audio_feature_lengths', None)
-        feature_attention_mask = kwargs.pop('feature_attention_mask', None)
+        self, **kwargs: object
+    ) -> Optional[Qwen2_5OmniAudioFeatureInputs]:
+        input_audio_features = kwargs.pop("input_audio_features", None)
+        audio_feature_lengths = kwargs.pop("audio_feature_lengths", None)
+        feature_attention_mask = kwargs.pop("feature_attention_mask", None)
         if input_audio_features is None:
             return None
         input_audio_features = self._validate_and_reshape_mm_tensor(
-            input_audio_features, 'input_audio_features', dim=1)
+            input_audio_features, "input_audio_features", dim=1
+        )
         if feature_attention_mask is not None:
             feature_attention_mask = self._validate_and_reshape_mm_tensor(
-                feature_attention_mask, 'feature_attention_mask')
+                feature_attention_mask, "feature_attention_mask"
+            )
         if not isinstance(input_audio_features, (torch.Tensor, list)):
-            raise ValueError("Incorrect type of audio input features. "
-                             f"Got type: {type(input_audio_features)}")
+            raise ValueError(
+                "Incorrect type of audio input features. "
+                f"Got type: {type(input_audio_features)}"
+            )
         return Qwen2_5OmniAudioFeatureInputs(
             type="audio_features",
             input_features=input_audio_features,
             audio_feature_lengths=audio_feature_lengths,
-            feature_attention_mask=feature_attention_mask)
+            feature_attention_mask=feature_attention_mask,
+        )
 
     def _parse_and_validate_image_input(
         self,
@@ -597,31 +647,42 @@ def _parse_and_validate_image_input(
 
         if pixel_values is not None:
             pixel_values = self._validate_and_reshape_mm_tensor(
-                pixel_values, "image pixel values")
+                pixel_values, "image pixel values"
+            )
             image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, "image grid_thw")
+                image_grid_thw, "image grid_thw"
+            )
 
             if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image pixel values. "
-                                 f"Got type: {type(pixel_values)}")
+                raise ValueError(
+                    "Incorrect type of image pixel values. "
+                    f"Got type: {type(pixel_values)}"
+                )
 
-            return Qwen2_5_VLImagePixelInputs(type="pixel_values",
-                                              pixel_values=pixel_values,
-                                              image_grid_thw=image_grid_thw)
+            return Qwen2_5_VLImagePixelInputs(
+                type="pixel_values",
+                pixel_values=pixel_values,
+                image_grid_thw=image_grid_thw,
+            )
 
         if image_embeds is not None:
             image_embeds = self._validate_and_reshape_mm_tensor(
-                image_embeds, "image embeds")
+                image_embeds, "image embeds"
+            )
             image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, "image grid_thw")
+                image_grid_thw, "image grid_thw"
+            )
 
             if not isinstance(image_embeds, torch.Tensor):
-                raise ValueError("Incorrect type of image embeddings. "
-                                 f"Got type: {type(image_embeds)}")
+                raise ValueError(
+                    "Incorrect type of image embeddings. "
+                    f"Got type: {type(image_embeds)}"
+                )
             return Qwen2_5_VLImageEmbeddingInputs(
                 type="image_embeds",
                 image_embeds=image_embeds,
-                image_grid_thw=image_grid_thw)
+                image_grid_thw=image_grid_thw,
+            )
 
     def _parse_and_validate_video_input(
         self,
@@ -636,9 +697,11 @@ def _parse_and_validate_video_input(
 
         if pixel_values_videos is not None:
             pixel_values_videos = self._validate_and_reshape_mm_tensor(
-                pixel_values_videos, "video pixel values")
+                pixel_values_videos, "video pixel values"
+            )
             video_grid_thw = self._validate_and_reshape_mm_tensor(
-                video_grid_thw, "video grid_thw")
+                video_grid_thw, "video grid_thw"
+            )
 
             return Qwen2_5_VLVideoPixelInputs(
                 type="pixel_values_videos",
@@ -648,17 +711,22 @@ def _parse_and_validate_video_input(
 
         if video_embeds is not None:
             video_embeds = self._validate_and_reshape_mm_tensor(
-                video_embeds, "video embeds")
+                video_embeds, "video embeds"
+            )
             video_grid_thw = self._validate_and_reshape_mm_tensor(
-                video_grid_thw, "video grid_thw")
+                video_grid_thw, "video grid_thw"
+            )
 
             if not isinstance(video_embeds, torch.Tensor):
-                raise ValueError("Incorrect type of video embeddings. "
-                                 f"Got type: {type(video_embeds)}")
+                raise ValueError(
+                    "Incorrect type of video embeddings. "
+                    f"Got type: {type(video_embeds)}"
+                )
             return Qwen2_5_VLVideoEmbeddingInputs(
                 type="video_embeds",
                 video_embeds=video_embeds,
-                video_grid_thw=video_grid_thw)
+                video_grid_thw=video_grid_thw,
+            )
 
     def _process_audio_input(
         self,
@@ -666,35 +734,35 @@ def _process_audio_input(
         audio_hashes: list[str] = None,
         cached_audio_features: torch.Tensor = None,
     ) -> torch.Tensor:
-
         input_features = audio_input["input_features"]
         audio_feature_lengths = audio_input["audio_feature_lengths"]
         if input_features.ndim == 3:
             assert input_features.shape[0] == 1
             input_features = input_features.squeeze(0)
         if audio_feature_lengths.ndim == 2:
-            assert audio_feature_lengths.shape[
-                0] == 1 or audio_feature_lengths.shape[1] == 1
+            assert (
+                audio_feature_lengths.shape[0] == 1
+                or audio_feature_lengths.shape[1] == 1
+            )
             if audio_feature_lengths.shape[0] == 1:
                 audio_feature_lengths = audio_feature_lengths.squeeze(0)
             else:
                 audio_feature_lengths = audio_feature_lengths.squeeze(1)
 
         audio_feat_lengths, audio_output_lengths = (
-            self.audio_tower._get_feat_extract_output_lengths(
-                audio_feature_lengths))
+            self.audio_tower._get_feat_extract_output_lengths(audio_feature_lengths)
+        )
 
         audio_outputs = self.audio_tower(
             input_features.to(self.audio_tower.dtype),
             feature_lens=audio_feature_lengths,
             aftercnn_lens=audio_feat_lengths,
         )
-        return audio_outputs.last_hidden_state.split(
-            audio_output_lengths.tolist())
+        return audio_outputs.last_hidden_state.split(audio_output_lengths.tolist())
 
     def _process_image_input(
-            self,
-            image_input: Qwen2_5_VLImageInputs) -> tuple[torch.Tensor, ...]:
+        self, image_input: Qwen2_5_VLImageInputs
+    ) -> tuple[torch.Tensor, ...]:
         if image_input["type"] == "image_embeds":
             return image_input["image_embeds"].type(self.visual.dtype)
 
@@ -710,18 +778,18 @@ def _process_image_input(
         return image_embeds.split(sizes.tolist())
 
     def _process_video_input(
-            self,
-            video_input: Qwen2_5_VLVideoInputs,
-            video_hashes: list[str] = None,
-            cached_video_embeds: torch.Tensor = None) -> torch.Tensor:
+        self,
+        video_input: Qwen2_5_VLVideoInputs,
+        video_hashes: list[str] = None,
+        cached_video_embeds: torch.Tensor = None,
+    ) -> torch.Tensor:
         if video_input["type"] == "video_embeds":
             return video_input["video_embeds"].type(self.visual.dtype)
 
         grid_thw = video_input["video_grid_thw"]
         assert grid_thw.ndim == 2
 
-        pixel_values_videos = video_input["pixel_values_videos"].type(
-            self.visual.dtype)
+        pixel_values_videos = video_input["pixel_values_videos"].type(self.visual.dtype)
         video_embeds = self.visual(pixel_values_videos, grid_thw=grid_thw)
         # Split concatenated embeddings for each video item.
         merge_size = self.visual.spatial_merge_size
@@ -736,14 +804,19 @@ def _process_video_input(
     dummy_inputs=Qwen2_5OmniThinkerDummyInputsBuilder,
 )
 class Qwen2_5OmniThinkerForConditionalGeneration(
-        nn.Module, SupportsMultiModal, SupportsPP, SupportsLoRA,
-        Qwen2_5OmniConditionalGenerationMixin):
+    nn.Module,
+    SupportsMultiModal,
+    SupportsPP,
+    SupportsLoRA,
+    Qwen2_5OmniConditionalGenerationMixin,
+):
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_prefix={
             "thinker.lm_head.": "language_model.lm_head.",
             "thinker.model.": "language_model.model.",
             "thinker.": "",
-        })
+        }
+    )
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -775,7 +848,8 @@ def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         thinker_config: Qwen2_5OmniThinkerConfig = (
-            vllm_config.model_config.hf_config.thinker_config)
+            vllm_config.model_config.hf_config.thinker_config
+        )
         quant_config = vllm_config.quant_config
         multimodal_config = vllm_config.model_config.multimodal_config
         self.config = thinker_config
@@ -791,20 +865,20 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             logger.warning(
                 "flash_attn is not available, the model may not yield the "
                 "exactly same result as the transformers implementation "
-                "in the audio tower part.")
+                "in the audio tower part."
+            )
 
         if multimodal_config.get_limit_per_prompt("audio"):
-            self.audio_tower = Qwen2_5OmniAudioEncoder(
-                thinker_config.audio_config)
+            self.audio_tower = Qwen2_5OmniAudioEncoder(thinker_config.audio_config)
         else:
             self.audio_tower = None
 
         if multimodal_config.get_limit_per_prompt(
-                "image") or multimodal_config.get_limit_per_prompt("video"):
+            "image"
+        ) or multimodal_config.get_limit_per_prompt("video"):
             self.visual = Qwen2_5_VisionTransformer(
                 vision_config=thinker_config.vision_config,
-                norm_eps=getattr(thinker_config.text_config, "rms_norm_eps",
-                                 1e-6),
+                norm_eps=getattr(thinker_config.text_config, "rms_norm_eps", 1e-6),
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "visual"),
             )
@@ -820,7 +894,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         mm_input_by_modality = {}
@@ -828,28 +903,34 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if input_key in ("pixel_values", "image_embeds"
-                             ) and "image" not in mm_input_by_modality:
-                mm_input_by_modality[
-                    "image"] = self._parse_and_validate_image_input(**kwargs)
-            if input_key in ("pixel_values_videos", "video_embeds"
-                             ) and "video" not in mm_input_by_modality:
-                mm_input_by_modality[
-                    "video"] = self._parse_and_validate_video_input(**kwargs)
-            if input_key in ("input_audio_features"
-                             ) and "audio" not in mm_input_by_modality:
-                mm_input_by_modality[
-                    "audio"] = self._parse_and_validate_audio_input(**kwargs)
+            if (
+                input_key in ("pixel_values", "image_embeds")
+                and "image" not in mm_input_by_modality
+            ):
+                mm_input_by_modality["image"] = self._parse_and_validate_image_input(
+                    **kwargs
+                )
+            if (
+                input_key in ("pixel_values_videos", "video_embeds")
+                and "video" not in mm_input_by_modality
+            ):
+                mm_input_by_modality["video"] = self._parse_and_validate_video_input(
+                    **kwargs
+                )
+            if (
+                input_key in ("input_audio_features")
+                and "audio" not in mm_input_by_modality
+            ):
+                mm_input_by_modality["audio"] = self._parse_and_validate_audio_input(
+                    **kwargs
+                )
         return mm_input_by_modality
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
-
-        mm_input_by_modality = self._parse_and_validate_multimodal_inputs(
-            **kwargs)
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+        mm_input_by_modality = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not mm_input_by_modality:
             return []
 
@@ -893,8 +974,7 @@ def get_input_embeddings(
             handle_oov_mm_token=handle_oov_mm_token,
         )
 
-    def get_multimodal_embeddings_v0(
-            self, **kwargs: object) -> Optional[NestedTensors]:
+    def get_multimodal_embeddings_v0(self, **kwargs: object) -> Optional[NestedTensors]:
         audio_input = self._parse_and_validate_audio_input(**kwargs)
         image_input = self._parse_and_validate_image_input(**kwargs)
         video_input = self._parse_and_validate_video_input(**kwargs)
@@ -926,10 +1006,9 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.language_model.model(input_ids,
-                                                  positions,
-                                                  intermediate_tensors,
-                                                  inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -938,8 +1017,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         skip_prefixes = ["talker.", "token2wav."]
         if self.audio_tower is None:
             skip_prefixes.extend(["audio_tower."])
@@ -950,8 +1028,7 @@ def load_weights(self, weights: Iterable[tuple[str,
             self,
             skip_prefixes=skip_prefixes,
         )
-        loaded_weights = loader.load_weights(weights,
-                                             mapper=self.hf_to_vllm_mapper)
+        loaded_weights = loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
         return loaded_weights
 
@@ -962,4 +1039,5 @@ def get_mm_mapping(self) -> MultiModelKeys:
         return MultiModelKeys.from_string_field(
             language_model="language_model",
             connector="merger.",
-            tower_model=["visual.", "audio_tower."])
+            tower_model=["visual.", "audio_tower."],
+        )
diff --git a/vllm/model_executor/models/qwen2_5_vl.py b/vllm/model_executor/models/qwen2_5_vl.py
index f7078197da48..7cd091e64a94 100644
--- a/vllm/model_executor/models/qwen2_5_vl.py
+++ b/vllm/model_executor/models/qwen2_5_vl.py
@@ -25,6 +25,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Qwen2.5-VL model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable, Mapping, Sequence
 from functools import lru_cache, partial
 from typing import Annotated, Any, Callable, Literal, Optional, Union
@@ -36,31 +37,41 @@
 from transformers import BatchFeature
 from transformers.models.qwen2_5_vl import Qwen2_5_VLProcessor
 from transformers.models.qwen2_5_vl.configuration_qwen2_5_vl import (
-    Qwen2_5_VLConfig, Qwen2_5_VLVisionConfig)
+    Qwen2_5_VLConfig,
+    Qwen2_5_VLVisionConfig,
+)
 
 from vllm.attention.backends.registry import _Backend
-from vllm.attention.layer import (check_upstream_fa_availability,
-                                  maybe_get_vit_flash_attn_backend)
+from vllm.attention.layer import (
+    check_upstream_fa_availability,
+    maybe_get_vit_flash_attn_backend,
+)
 from vllm.config import VllmConfig
 from vllm.distributed import parallel_state
 from vllm.distributed import utils as dist_utils
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import get_act_and_mul_fn
 from vllm.model_executor.layers.layernorm import RMSNorm
+
 # yapf: disable
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
+
 # yapf: enable
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.evs import (compute_mrope_for_media,
-                                 compute_retained_tokens_count,
-                                 compute_retention_mask,
-                                 recompute_mrope_positions)
+from vllm.multimodal.evs import (
+    compute_mrope_for_media,
+    compute_retained_tokens_count,
+    compute_retention_mask,
+    recompute_mrope_positions,
+)
 from vllm.multimodal.inputs import MultiModalFieldConfig, MultiModalKwargs
 from vllm.multimodal.parse import MultiModalDataItems
 from vllm.multimodal.processing import PromptReplacement, PromptUpdate
@@ -68,14 +79,28 @@
 from vllm.utils import is_pin_memory_available
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-from .interfaces import (MultiModalEmbeddings, SupportsEagle3, SupportsLoRA,
-                         SupportsMultiModal, SupportsMultiModalPruning,
-                         SupportsPP, SupportsQuant)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsEagle3,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsMultiModalPruning,
+    SupportsPP,
+    SupportsQuant,
+)
 from .qwen2_vl import Qwen2VLDummyInputsBuilder as Qwen2_5_VLDummyInputsBuilder
-from .qwen2_vl import (Qwen2VLMultiModalProcessor, Qwen2VLProcessingInfo,
-                       apply_rotary_pos_emb_vision)
-from .utils import (AutoWeightsLoader, WeightsMapper, cast_overflow_tensors,
-                    init_vllm_registered_model, maybe_prefix)
+from .qwen2_vl import (
+    Qwen2VLMultiModalProcessor,
+    Qwen2VLProcessingInfo,
+    apply_rotary_pos_emb_vision,
+)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    cast_overflow_tensors,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 from .vision import get_vit_attn_backend, run_dp_sharded_mrope_vision_model
 
 logger = init_logger(__name__)
@@ -96,6 +121,7 @@ class Qwen2_5_VLImagePixelInputs(TensorSchema):
         - image_grid_thw shape: (num_images, 3) in (grid_t, grid_h, grid_w)
           formatnum_channels * patch_size * patch_size
     """
+
     type: Literal["pixel_values"]
 
     pixel_values: Annotated[
@@ -124,6 +150,7 @@ class Qwen2_5_VLImageEmbeddingInputs(TensorSchema):
         - image_grid_thw shape: (num_images, 3) in (grid_t, grid_h, grid_w)
           format
     """
+
     type: Literal["image_embeds"]
 
     image_embeds: Annotated[
@@ -137,8 +164,9 @@ class Qwen2_5_VLImageEmbeddingInputs(TensorSchema):
     ]
 
 
-Qwen2_5_VLImageInputs = Union[Qwen2_5_VLImagePixelInputs,
-                              Qwen2_5_VLImageEmbeddingInputs]
+Qwen2_5_VLImageInputs = Union[
+    Qwen2_5_VLImagePixelInputs, Qwen2_5_VLImageEmbeddingInputs
+]
 
 
 class Qwen2_5_VLVideoPixelInputs(TensorSchema):
@@ -158,6 +186,7 @@ class Qwen2_5_VLVideoPixelInputs(TensorSchema):
           grid along the temporal dimension in the 3D position IDs. Returned
           when `videos` is not `None`.
     """
+
     type: Literal["pixel_values_videos"]
 
     pixel_values_videos: Annotated[
@@ -191,6 +220,7 @@ class Qwen2_5_VLVideoEmbeddingInputs(TensorSchema):
         - video_grid_thw shape: (num_videos, 3) in (grid_t, grid_h, grid_w)
           format
     """
+
     type: Literal["video_embeds"]
 
     video_embeds: Annotated[
@@ -204,22 +234,24 @@ class Qwen2_5_VLVideoEmbeddingInputs(TensorSchema):
     ]
 
 
-Qwen2_5_VLVideoInputs = Union[Qwen2_5_VLVideoPixelInputs,
-                              Qwen2_5_VLVideoEmbeddingInputs]
+Qwen2_5_VLVideoInputs = Union[
+    Qwen2_5_VLVideoPixelInputs, Qwen2_5_VLVideoEmbeddingInputs
+]
 
 # === Vision Encoder === #
 
 
 class Qwen2_5_VisionMLP(nn.Module):
-
-    def __init__(self,
-                 in_features: int,
-                 hidden_features: int,
-                 bias: bool = False,
-                 act_fn: Callable[[torch.Tensor], torch.Tensor] = F.silu,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "",
-                 use_data_parallel: bool = False):
+    def __init__(
+        self,
+        in_features: int,
+        hidden_features: int,
+        bias: bool = False,
+        act_fn: Callable[[torch.Tensor], torch.Tensor] = F.silu,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+        use_data_parallel: bool = False,
+    ):
         super().__init__()
         self.gate_up_proj = MergedColumnParallelLinear(
             input_size=in_features,
@@ -227,14 +259,17 @@ def __init__(self,
             bias=bias,
             quant_config=quant_config,
             prefix=f"{prefix}.gate_up_proj",
-            disable_tp=use_data_parallel)
-
-        self.down_proj = RowParallelLinear(hidden_features,
-                                           in_features,
-                                           bias=bias,
-                                           quant_config=quant_config,
-                                           prefix=f"{prefix}.down_proj",
-                                           disable_tp=use_data_parallel)
+            disable_tp=use_data_parallel,
+        )
+
+        self.down_proj = RowParallelLinear(
+            hidden_features,
+            in_features,
+            bias=bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.down_proj",
+            disable_tp=use_data_parallel,
+        )
         self.act_fn = act_fn
 
     def forward(self, x: torch.Tensor):
@@ -247,14 +282,14 @@ def forward(self, x: torch.Tensor):
 def all_gather_interleave(local_tensor, hidden_size: int, tp_size: int):
     """All-gather the input tensor interleavely across model parallel group."""
     import torch.distributed as dist
+
     gathered_tensors = [torch.zeros_like(local_tensor) for _ in range(tp_size)]
-    dist.all_gather(gathered_tensors,
-                    local_tensor,
-                    group=parallel_state.get_tp_group().device_group)
+    dist.all_gather(
+        gathered_tensors, local_tensor, group=parallel_state.get_tp_group().device_group
+    )
 
     gathered_tensors_split = [
-        torch.split(tensor, hidden_size // tp_size, -1)
-        for tensor in gathered_tensors
+        torch.split(tensor, hidden_size // tp_size, -1) for tensor in gathered_tensors
     ]
     ordered_tensors = [
         tensor for pair in zip(*gathered_tensors_split) for tensor in pair
@@ -264,7 +299,6 @@ def all_gather_interleave(local_tensor, hidden_size: int, tp_size: int):
 
 
 class Qwen2_5_VisionAttention(nn.Module):
-
     def __init__(
         self,
         embed_dim: int,
@@ -278,13 +312,18 @@ def __init__(
     ) -> None:
         super().__init__()
         # Per attention head and per partition values.
-        self.tp_size = (1 if use_data_parallel else
-                        parallel_state.get_tensor_model_parallel_world_size())
+        self.tp_size = (
+            1
+            if use_data_parallel
+            else parallel_state.get_tensor_model_parallel_world_size()
+        )
         self.tp_rank = parallel_state.get_tensor_model_parallel_rank()
         self.hidden_size_per_attention_head = dist_utils.divide(
-            projection_size, num_heads)
+            projection_size, num_heads
+        )
         self.num_attention_heads_per_partition = dist_utils.divide(
-            num_heads, self.tp_size)
+            num_heads, self.tp_size
+        )
 
         self.qkv = QKVParallelLinear(
             hidden_size=embed_dim,
@@ -294,55 +333,64 @@ def __init__(
             bias=True,
             quant_config=quant_config,
             prefix=f"{prefix}.qkv",
-            disable_tp=use_data_parallel)
+            disable_tp=use_data_parallel,
+        )
 
-        self.proj = RowParallelLinear(input_size=projection_size,
-                                      output_size=embed_dim,
-                                      quant_config=quant_config,
-                                      prefix=f"{prefix}.proj",
-                                      disable_tp=use_data_parallel)
+        self.proj = RowParallelLinear(
+            input_size=projection_size,
+            output_size=embed_dim,
+            quant_config=quant_config,
+            prefix=f"{prefix}.proj",
+            disable_tp=use_data_parallel,
+        )
         self.attn_backend = attn_backend
         self.use_upstream_fa = use_upstream_fa
-        self.attn_backend, self.flash_attn_varlen_func \
-            = maybe_get_vit_flash_attn_backend(
+        self.attn_backend, self.flash_attn_varlen_func = (
+            maybe_get_vit_flash_attn_backend(
                 self.attn_backend,
                 self.use_upstream_fa,
             )
+        )
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA
+            _Backend.FLASH_ATTN,
+            _Backend.ROCM_AITER_FA,
         }
 
     def split_qkv(self, qkv: torch.Tensor) -> tuple[torch.Tensor, ...]:
         # [s, b, 3 * head * head_dim]
         seq_len, bs, _ = qkv.shape
         if self.tp_size > 1:
-            qkv = all_gather_interleave(qkv, self.qkv.hidden_size,
-                                        self.tp_size)
+            qkv = all_gather_interleave(qkv, self.qkv.hidden_size, self.tp_size)
 
         # [s, b, 3 * head * head_dim] -> 3 * [s, b, head * head_dim]
         q, k, v = qkv.chunk(3, dim=2)
 
         # 3 * [s, b, head * head_dim]
         if self.tp_size > 1:
-            splitter = partial(dist_utils.split_tensor_along_last_dim,
-                               num_partitions=self.tp_size)
+            splitter = partial(
+                dist_utils.split_tensor_along_last_dim, num_partitions=self.tp_size
+            )
             q = splitter(q)[self.tp_rank]
             k = splitter(k)[self.tp_rank]
             v = splitter(v)[self.tp_rank]
 
         # 3 * [s, b, head * head_dim] -> 3 * [s, b, head, head_dim]
-        new_shape = (seq_len, bs, self.num_attention_heads_per_partition,
-                     self.hidden_size_per_attention_head)
+        new_shape = (
+            seq_len,
+            bs,
+            self.num_attention_heads_per_partition,
+            self.hidden_size_per_attention_head,
+        )
         q, k, v = (x.view(*new_shape) for x in (q, k, v))
         return q, k, v
 
     def forward(
-            self,
-            x: torch.Tensor,
-            cu_seqlens: torch.Tensor,
-            rotary_pos_emb: torch.Tensor,
-            max_seqlen: Optional[int] = None,  # Only used for Flash Attention
-            seqlens: Optional[list[int]] = None,  # Only used for xFormers
+        self,
+        x: torch.Tensor,
+        cu_seqlens: torch.Tensor,
+        rotary_pos_emb: torch.Tensor,
+        max_seqlen: Optional[int] = None,  # Only used for Flash Attention
+        seqlens: Optional[list[int]] = None,  # Only used for xFormers
     ) -> torch.Tensor:
         # [s, b, c] --> [s, b, head * 3 * head_dim]
         x, _ = self.qkv(x)
@@ -351,8 +399,7 @@ def forward(
         q, k, v = self.split_qkv(x)
         batch_size = q.shape[1]
 
-        q, k, v = (rearrange(x, "s b ... -> b s ...").contiguous()
-                   for x in (q, k, v))
+        q, k, v = (rearrange(x, "s b ... -> b s ...").contiguous() for x in (q, k, v))
         if rotary_pos_emb is not None:
             # [2 * b, s, heads, head_dim]
             qk_concat = torch.cat([q, k], dim=0)
@@ -360,22 +407,23 @@ def forward(
             q, k = torch.chunk(qk_rotated, 2, dim=0)
 
         if self.is_flash_attn_backend:
-
             q, k, v = (rearrange(x, "b s ... -> (b s) ...") for x in [q, k, v])
 
-            output = self.flash_attn_varlen_func(q,
-                                                 k,
-                                                 v,
-                                                 cu_seqlens_q=cu_seqlens,
-                                                 cu_seqlens_k=cu_seqlens,
-                                                 max_seqlen_q=max_seqlen,
-                                                 max_seqlen_k=max_seqlen,
-                                                 dropout_p=0.0,
-                                                 causal=False)
-
-            context_layer = rearrange(output,
-                                      "(b s) h d -> s b (h d)",
-                                      b=batch_size).contiguous()
+            output = self.flash_attn_varlen_func(
+                q,
+                k,
+                v,
+                cu_seqlens_q=cu_seqlens,
+                cu_seqlens_k=cu_seqlens,
+                max_seqlen_q=max_seqlen,
+                max_seqlen_k=max_seqlen,
+                dropout_p=0.0,
+                causal=False,
+            )
+
+            context_layer = rearrange(
+                output, "(b s) h d -> s b (h d)", b=batch_size
+            ).contiguous()
         elif self.attn_backend == _Backend.TORCH_SDPA:
             # Execute attention entry by entry for speed & less VRAM.
             outputs = []
@@ -385,36 +433,36 @@ def forward(
                 q_i = q[:, start_idx:end_idx]
                 k_i = k[:, start_idx:end_idx]
                 v_i = v[:, start_idx:end_idx]
-                q_i, k_i, v_i = (rearrange(x, "b s h d -> b h s d")
-                                 for x in [q_i, k_i, v_i])
-                output_i = F.scaled_dot_product_attention(q_i,
-                                                          k_i,
-                                                          v_i,
-                                                          dropout_p=0.0)
+                q_i, k_i, v_i = (
+                    rearrange(x, "b s h d -> b h s d") for x in [q_i, k_i, v_i]
+                )
+                output_i = F.scaled_dot_product_attention(q_i, k_i, v_i, dropout_p=0.0)
                 output_i = rearrange(output_i, "b h s d -> b s h d ")
                 outputs.append(output_i)
             context_layer = torch.cat(outputs, dim=1)
-            context_layer = rearrange(context_layer,
-                                      "b s h d -> s b (h d)").contiguous()
+            context_layer = rearrange(
+                context_layer, "b s h d -> s b (h d)"
+            ).contiguous()
         elif self.attn_backend == _Backend.XFORMERS:
             from xformers import ops as xops
             from xformers.ops.fmha.attn_bias import BlockDiagonalMask
 
-            attn_bias = BlockDiagonalMask.from_seqlens(q_seqlen=seqlens,
-                                                       kv_seqlen=None,
-                                                       device=q.device)
+            attn_bias = BlockDiagonalMask.from_seqlens(
+                q_seqlen=seqlens, kv_seqlen=None, device=q.device
+            )
 
             context_layer = xops.memory_efficient_attention_forward(
-                q, k, v, attn_bias=attn_bias, p=0, scale=None)
-            context_layer = rearrange(context_layer,
-                                      "b s h d -> s b (h d)").contiguous()
+                q, k, v, attn_bias=attn_bias, p=0, scale=None
+            )
+            context_layer = rearrange(
+                context_layer, "b s h d -> s b (h d)"
+            ).contiguous()
 
         output, _ = self.proj(context_layer)
         return output
 
 
 class Qwen2_5_VisionBlock(nn.Module):
-
     def __init__(
         self,
         dim: int,
@@ -441,35 +489,39 @@ def __init__(
             prefix=f"{prefix}.attn",
             use_data_parallel=use_data_parallel,
             attn_backend=attn_backend,
-            use_upstream_fa=use_upstream_fa)
-        self.mlp = Qwen2_5_VisionMLP(dim,
-                                     mlp_hidden_dim,
-                                     act_fn=act_fn,
-                                     bias=True,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.mlp",
-                                     use_data_parallel=use_data_parallel)
+            use_upstream_fa=use_upstream_fa,
+        )
+        self.mlp = Qwen2_5_VisionMLP(
+            dim,
+            mlp_hidden_dim,
+            act_fn=act_fn,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.mlp",
+            use_data_parallel=use_data_parallel,
+        )
 
     def forward(
-            self,
-            x: torch.Tensor,
-            cu_seqlens: torch.Tensor,
-            rotary_pos_emb: torch.Tensor,
-            max_seqlen: Optional[int] = None,  # Only used for Flash Attention
-            seqlens: Optional[list[int]] = None,  # Only used for xFormers
+        self,
+        x: torch.Tensor,
+        cu_seqlens: torch.Tensor,
+        rotary_pos_emb: torch.Tensor,
+        max_seqlen: Optional[int] = None,  # Only used for Flash Attention
+        seqlens: Optional[list[int]] = None,  # Only used for xFormers
     ) -> torch.Tensor:
-        x_attn = self.attn(self.norm1(x),
-                           cu_seqlens=cu_seqlens,
-                           rotary_pos_emb=rotary_pos_emb,
-                           max_seqlen=max_seqlen,
-                           seqlens=seqlens)
+        x_attn = self.attn(
+            self.norm1(x),
+            cu_seqlens=cu_seqlens,
+            rotary_pos_emb=rotary_pos_emb,
+            max_seqlen=max_seqlen,
+            seqlens=seqlens,
+        )
         x_fused_norm, residual = self.norm2(x, residual=x_attn)
         x = residual + self.mlp(x_fused_norm)
         return x
 
 
 class Qwen2_5_VisionPatchEmbed(nn.Module):
-
     def __init__(
         self,
         patch_size: int = 14,
@@ -483,22 +535,22 @@ def __init__(
         self.hidden_size = hidden_size
 
         kernel_size = (temporal_patch_size, patch_size, patch_size)
-        self.proj = nn.Conv3d(in_channels,
-                              hidden_size,
-                              kernel_size=kernel_size,
-                              stride=kernel_size,
-                              bias=False)
+        self.proj = nn.Conv3d(
+            in_channels,
+            hidden_size,
+            kernel_size=kernel_size,
+            stride=kernel_size,
+            bias=False,
+        )
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         L, C = x.shape
-        x = x.view(L, -1, self.temporal_patch_size, self.patch_size,
-                   self.patch_size)
+        x = x.view(L, -1, self.temporal_patch_size, self.patch_size, self.patch_size)
         x = self.proj(x).view(L, self.hidden_size)
         return x
 
 
 class Qwen2_5_VisionPatchMerger(nn.Module):
-
     def __init__(
         self,
         d_model: int,
@@ -545,13 +597,13 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class Qwen2_5_VisionRotaryEmbedding(nn.Module):
-
     def __init__(self, dim: int, theta: float = 10000.0) -> None:
         super().__init__()
         self.dim = dim
         self.theta = theta
-        inv_freq = 1.0 / (theta**(
-            torch.arange(0, dim, 2, dtype=torch.float, device='cpu') / dim))
+        inv_freq = 1.0 / (
+            theta ** (torch.arange(0, dim, 2, dtype=torch.float, device="cpu") / dim)
+        )
         self.register_buffer("inv_freq", inv_freq, persistent=False)
         self._seq_len_cached = 0
         self._freqs_cached = None
@@ -560,12 +612,18 @@ def update_freqs_cache(self, seqlen: int) -> None:
         if seqlen > self._seq_len_cached:
             seqlen *= 2
             self._seq_len_cached = seqlen
-            self.inv_freq = 1.0 / (self.theta**(torch.arange(
-                0, self.dim, 2, dtype=torch.float, device=self.inv_freq.device)
-                                                / self.dim))
-            seq = torch.arange(seqlen,
-                               device=self.inv_freq.device,
-                               dtype=self.inv_freq.dtype)
+            self.inv_freq = 1.0 / (
+                self.theta
+                ** (
+                    torch.arange(
+                        0, self.dim, 2, dtype=torch.float, device=self.inv_freq.device
+                    )
+                    / self.dim
+                )
+            )
+            seq = torch.arange(
+                seqlen, device=self.inv_freq.device, dtype=self.inv_freq.dtype
+            )
             freqs = torch.outer(seq, self.inv_freq)
             self._freqs_cached = freqs
 
@@ -575,7 +633,6 @@ def forward(self, seqlen: int) -> torch.Tensor:
 
 
 class Qwen2_5_VisionTransformer(nn.Module):
-
     def __init__(
         self,
         vision_config: Qwen2_5_VLVisionConfig,
@@ -615,35 +672,43 @@ def __init__(
 
         use_upstream_fa = False
         self.attn_backend = get_vit_attn_backend(
-            head_size=head_dim, dtype=torch.get_default_dtype())
-        if self.attn_backend != _Backend.FLASH_ATTN and \
-            self.attn_backend != _Backend.ROCM_AITER_FA and \
-            check_upstream_fa_availability(
-                torch.get_default_dtype()):
+            head_size=head_dim, dtype=torch.get_default_dtype()
+        )
+        if (
+            self.attn_backend != _Backend.FLASH_ATTN
+            and self.attn_backend != _Backend.ROCM_AITER_FA
+            and check_upstream_fa_availability(torch.get_default_dtype())
+        ):
             self.attn_backend = _Backend.FLASH_ATTN
             use_upstream_fa = True
 
         if self.attn_backend not in {
-                _Backend.FLASH_ATTN, _Backend.TORCH_SDPA, _Backend.XFORMERS,
-                _Backend.ROCM_AITER_FA
+            _Backend.FLASH_ATTN,
+            _Backend.TORCH_SDPA,
+            _Backend.XFORMERS,
+            _Backend.ROCM_AITER_FA,
         }:
             raise RuntimeError(
                 f"Qwen2.5-VL does not support {self.attn_backend} backend now."
             )
 
-        self.blocks = nn.ModuleList([
-            Qwen2_5_VisionBlock(
-                dim=self.hidden_size,
-                num_heads=self.num_heads,
-                mlp_hidden_dim=vision_config.intermediate_size,
-                act_fn=get_act_and_mul_fn(vision_config.hidden_act),
-                norm_layer=norm_layer,
-                quant_config=quant_config,
-                prefix=f"{prefix}.blocks.{layer_idx}",
-                use_data_parallel=use_data_parallel,
-                attn_backend=self.attn_backend,
-                use_upstream_fa=use_upstream_fa) for layer_idx in range(depth)
-        ])
+        self.blocks = nn.ModuleList(
+            [
+                Qwen2_5_VisionBlock(
+                    dim=self.hidden_size,
+                    num_heads=self.num_heads,
+                    mlp_hidden_dim=vision_config.intermediate_size,
+                    act_fn=get_act_and_mul_fn(vision_config.hidden_act),
+                    norm_layer=norm_layer,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.blocks.{layer_idx}",
+                    use_data_parallel=use_data_parallel,
+                    attn_backend=self.attn_backend,
+                    use_upstream_fa=use_upstream_fa,
+                )
+                for layer_idx in range(depth)
+            ]
+        )
         self.merger = Qwen2_5_VisionPatchMerger(
             d_model=vision_config.out_hidden_size,
             context_dim=self.hidden_size,
@@ -665,48 +730,66 @@ def device(self) -> torch.device:
     def rotary_pos_emb_thw(self, t, h, w):
         hpos_ids = torch.arange(h).unsqueeze(1).expand(-1, w)
         wpos_ids = torch.arange(w).unsqueeze(0).expand(h, -1)
-        hpos_ids = hpos_ids.reshape(
-            h // self.spatial_merge_size,
-            self.spatial_merge_size,
-            w // self.spatial_merge_size,
-            self.spatial_merge_size,
-        ).permute(0, 2, 1, 3).flatten()
-        wpos_ids = wpos_ids.reshape(
-            h // self.spatial_merge_size,
-            self.spatial_merge_size,
-            w // self.spatial_merge_size,
-            self.spatial_merge_size,
-        ).permute(0, 2, 1, 3).flatten()
+        hpos_ids = (
+            hpos_ids.reshape(
+                h // self.spatial_merge_size,
+                self.spatial_merge_size,
+                w // self.spatial_merge_size,
+                self.spatial_merge_size,
+            )
+            .permute(0, 2, 1, 3)
+            .flatten()
+        )
+        wpos_ids = (
+            wpos_ids.reshape(
+                h // self.spatial_merge_size,
+                self.spatial_merge_size,
+                w // self.spatial_merge_size,
+                self.spatial_merge_size,
+            )
+            .permute(0, 2, 1, 3)
+            .flatten()
+        )
         pos_ids = torch.stack([hpos_ids, wpos_ids], dim=-1).repeat(t, 1)
         max_size = max(h, w)
         rotary_pos_emb_full = self.rotary_pos_emb(max_size)
         rotary_pos_emb = rotary_pos_emb_full[pos_ids].flatten(1)
         rotary_pos_emb = rotary_pos_emb.reshape(
             rotary_pos_emb.shape[0] // self.spatial_merge_unit,
-            self.spatial_merge_unit, -1)
+            self.spatial_merge_unit,
+            -1,
+        )
 
         return rotary_pos_emb
 
     def get_window_index_thw(self, grid_t, grid_h, grid_w):
-        vit_merger_window_size = (self.window_size //
-                                  self.spatial_merge_size // self.patch_size)
+        vit_merger_window_size = (
+            self.window_size // self.spatial_merge_size // self.patch_size
+        )
 
         llm_grid_h = grid_h // self.spatial_merge_size
         llm_grid_w = grid_w // self.spatial_merge_size
         index = torch.arange(grid_t * llm_grid_h * llm_grid_w).reshape(
-            grid_t, llm_grid_h, llm_grid_w)
+            grid_t, llm_grid_h, llm_grid_w
+        )
         pad_h = vit_merger_window_size - llm_grid_h % vit_merger_window_size
         pad_w = vit_merger_window_size - llm_grid_w % vit_merger_window_size
         num_windows_h = (llm_grid_h + pad_h) // vit_merger_window_size
         num_windows_w = (llm_grid_w + pad_w) // vit_merger_window_size
-        index_padded = F.pad(index, (0, pad_w, 0, pad_h), 'constant', -100)
-        index_padded = index_padded.reshape(grid_t, num_windows_h,
-                                            vit_merger_window_size,
-                                            num_windows_w,
-                                            vit_merger_window_size)
+        index_padded = F.pad(index, (0, pad_w, 0, pad_h), "constant", -100)
+        index_padded = index_padded.reshape(
+            grid_t,
+            num_windows_h,
+            vit_merger_window_size,
+            num_windows_w,
+            vit_merger_window_size,
+        )
         index_padded = index_padded.permute(0, 1, 3, 2, 4).reshape(
-            grid_t, num_windows_h * num_windows_w, vit_merger_window_size,
-            vit_merger_window_size)
+            grid_t,
+            num_windows_h * num_windows_w,
+            vit_merger_window_size,
+            vit_merger_window_size,
+        )
         seqlens = (index_padded != -100).sum([2, 3]).reshape(-1)
         index_padded = index_padded.reshape(-1)
         index_new = index_padded[index_padded != -100]
@@ -718,23 +801,29 @@ def get_window_index_thw(self, grid_t, grid_h, grid_w):
 
     @lru_cache(maxsize=1024)  # noqa: B019
     def get_rope_by_thw(self, t, h, w):
-        window_index_thw, cu_seqlens_window_thw = self.get_window_index_thw(
-            t, h, w)
+        window_index_thw, cu_seqlens_window_thw = self.get_window_index_thw(t, h, w)
         rotary_pos_emb_thw = self.rotary_pos_emb_thw(t, h, w)
         rotary_pos_emb_thw = rotary_pos_emb_thw[window_index_thw, :, :]
         rotary_pos_emb_thw = rotary_pos_emb_thw.flatten(start_dim=0, end_dim=1)
         cu_seqlens_thw = torch.repeat_interleave(
-            torch.tensor([h * w], dtype=torch.int32), t)
-        return (rotary_pos_emb_thw, window_index_thw, cu_seqlens_window_thw,
-                cu_seqlens_thw)
+            torch.tensor([h * w], dtype=torch.int32), t
+        )
+        return (
+            rotary_pos_emb_thw,
+            window_index_thw,
+            cu_seqlens_window_thw,
+            cu_seqlens_thw,
+        )
 
     def compute_attn_mask_seqlen(
         self,
         cu_seqlens: torch.Tensor,
     ) -> tuple[Optional[int], Optional[list[int]]]:
         max_seqlen, seqlens = None, None
-        if (self.attn_backend == _Backend.FLASH_ATTN
-                or self.attn_backend == _Backend.ROCM_AITER_FA):
+        if (
+            self.attn_backend == _Backend.FLASH_ATTN
+            or self.attn_backend == _Backend.ROCM_AITER_FA
+        ):
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
         elif self.attn_backend == _Backend.XFORMERS:
             seqlens = (cu_seqlens[1:] - cu_seqlens[:-1]).tolist()
@@ -744,9 +833,7 @@ def compute_attn_mask_seqlen(
     def invert_permutation(perm: torch.Tensor) -> torch.Tensor:
         # building the inverse permutation in O(n) time
         inv = torch.empty_like(perm, pin_memory=is_pin_memory_available())
-        inv[perm] = torch.arange(perm.numel(),
-                                 device=perm.device,
-                                 dtype=perm.dtype)
+        inv[perm] = torch.arange(perm.numel(), device=perm.device, dtype=perm.dtype)
         return inv
 
     def forward(
@@ -779,10 +866,9 @@ def forward(
             ) = self.get_rope_by_thw(t, h, w)
 
             window_index.append(window_index_thw + window_index_id)
-            window_index_id += (t * llm_h * llm_w)
+            window_index_id += t * llm_h * llm_w
 
-            cu_seqlens_window_thw = (cu_seqlens_window_thw +
-                                     cu_window_seqlens_last)
+            cu_seqlens_window_thw = cu_seqlens_window_thw + cu_window_seqlens_last
             cu_window_seqlens_last = cu_seqlens_window_thw[-1]
             cu_window_seqlens.append(cu_seqlens_window_thw)
 
@@ -802,23 +888,22 @@ def forward(
 
         # transformers
         # pre-compute seqlens for window/full attn to reduce cuMemcpy operations
-        max_seqlen_full, seqlens_full = self.compute_attn_mask_seqlen(
-            cu_seqlens)
+        max_seqlen_full, seqlens_full = self.compute_attn_mask_seqlen(cu_seqlens)
         max_seqlen_window, seqlens_window = self.compute_attn_mask_seqlen(
-            cu_window_seqlens)
+            cu_window_seqlens
+        )
 
         cu_seqlens = cu_seqlens.to(device=self.device, non_blocking=True)
-        cu_window_seqlens = cu_window_seqlens.to(device=self.device,
-                                                 non_blocking=True)
-        rotary_pos_emb = rotary_pos_emb.to(device=self.device,
-                                           non_blocking=True)
-        window_index = window_index.to(device=hidden_states.device,
-                                       non_blocking=True)
-        reverse_indices = reverse_indices.to(device=hidden_states.device,
-                                             non_blocking=True)
+        cu_window_seqlens = cu_window_seqlens.to(device=self.device, non_blocking=True)
+        rotary_pos_emb = rotary_pos_emb.to(device=self.device, non_blocking=True)
+        window_index = window_index.to(device=hidden_states.device, non_blocking=True)
+        reverse_indices = reverse_indices.to(
+            device=hidden_states.device, non_blocking=True
+        )
 
         hidden_states = hidden_states.reshape(
-            seq_len // self.spatial_merge_unit, self.spatial_merge_unit, -1)
+            seq_len // self.spatial_merge_unit, self.spatial_merge_unit, -1
+        )
         hidden_states = hidden_states[window_index, :, :]
         hidden_states = hidden_states.reshape(seq_len, -1)
 
@@ -852,8 +937,7 @@ def forward(
         hidden_states = hidden_states[reverse_indices, :]
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("attn.qkv.", "attn.q.", "q"),
@@ -866,7 +950,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         loaded_params: set[str] = set()
 
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -876,15 +960,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class Qwen2_5_VLProcessingInfo(Qwen2VLProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(Qwen2_5_VLConfig)
 
@@ -897,7 +979,6 @@ def get_hf_processor(self, **kwargs: object) -> Qwen2_5_VLProcessor:
 
 
 class Qwen2_5_VLMultiModalProcessor(Qwen2VLMultiModalProcessor):
-
     def _get_mm_fields_config(
         self,
         hf_inputs: BatchFeature,
@@ -915,8 +996,7 @@ def _get_prompt_updates(
         out_mm_kwargs: MultiModalKwargs,
     ) -> Sequence[PromptUpdate]:
         hf_processor = self.info.get_hf_processor(**hf_processor_mm_kwargs)
-        image_processor = self.info.get_image_processor(
-            **hf_processor_mm_kwargs)
+        image_processor = self.info.get_image_processor(**hf_processor_mm_kwargs)
         tokenizer = self.info.get_tokenizer()
         vocab = tokenizer.get_vocab()
 
@@ -955,21 +1035,26 @@ def get_replacement_qwen2vl(item_idx: int, modality: str):
             PromptReplacement(
                 modality=modality,
                 target=[placeholder[modality]],
-                replacement=partial(get_replacement_qwen2vl,
-                                    modality=modality),
-            ) for modality in ("image", "video")
+                replacement=partial(get_replacement_qwen2vl, modality=modality),
+            )
+            for modality in ("image", "video")
         ]
 
 
 @MULTIMODAL_REGISTRY.register_processor(
     Qwen2_5_VLMultiModalProcessor,
     info=Qwen2_5_VLProcessingInfo,
-    dummy_inputs=Qwen2_5_VLDummyInputsBuilder)
-class Qwen2_5_VLForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                         SupportsLoRA, SupportsPP,
-                                         SupportsQuant, SupportsEagle3,
-                                         SupportsMultiModalPruning):
-
+    dummy_inputs=Qwen2_5_VLDummyInputsBuilder,
+)
+class Qwen2_5_VLForConditionalGeneration(
+    nn.Module,
+    SupportsMultiModal,
+    SupportsLoRA,
+    SupportsPP,
+    SupportsQuant,
+    SupportsEagle3,
+    SupportsMultiModalPruning,
+):
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
         "gate_up_proj": ["gate_proj", "up_proj"],
@@ -984,7 +1069,8 @@ class Qwen2_5_VLForConditionalGeneration(nn.Module, SupportsMultiModal,
             # mapping for original checkpoint
             "lm_head.": "language_model.lm_head.",
             "model.": "language_model.model.",
-        })
+        }
+    )
 
     supports_encoder_tp_data = True
 
@@ -1007,10 +1093,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.multimodal_config = multimodal_config
         self.video_pruning_rate = multimodal_config.video_pruning_rate
         self.is_multimodal_pruning_enabled = (
-            multimodal_config.is_multimodal_pruning_enabled())
+            multimodal_config.is_multimodal_pruning_enabled()
+        )
 
-        if multimodal_config.get_limit_per_prompt("image") or \
-            multimodal_config.get_limit_per_prompt("video"):
+        if multimodal_config.get_limit_per_prompt(
+            "image"
+        ) or multimodal_config.get_limit_per_prompt("video"):
             self.visual = Qwen2_5_VisionTransformer(
                 config.vision_config,
                 norm_eps=getattr(config, "rms_norm_eps", 1e-6),
@@ -1028,7 +1116,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def set_aux_hidden_state_layers(self, layers: tuple[int, ...]) -> None:
         self.language_model.model.aux_hidden_state_layers = layers
@@ -1037,24 +1126,27 @@ def get_eagle3_aux_hidden_state_layers(self) -> tuple[int, ...]:
         num_layers = len(self.language_model.model.layers)
         return (2, num_layers // 2, num_layers - 3)
 
-    def _validate_and_reshape_mm_tensor(self, mm_input: object,
-                                        name: str) -> torch.Tensor:
+    def _validate_and_reshape_mm_tensor(
+        self, mm_input: object, name: str
+    ) -> torch.Tensor:
         if not isinstance(mm_input, (torch.Tensor, list)):
-            raise ValueError(f"Incorrect type of {name}. "
-                             f"Got type: {type(mm_input)}")
+            raise ValueError(f"Incorrect type of {name}. Got type: {type(mm_input)}")
         if isinstance(mm_input, torch.Tensor):
             if mm_input.ndim == 2:
                 return mm_input
             if mm_input.ndim != 3:
-                raise ValueError(f"{name} should be 2D or batched 3D tensor. "
-                                 f"Got ndim: {mm_input.ndim} "
-                                 f"(shape={mm_input.shape})")
+                raise ValueError(
+                    f"{name} should be 2D or batched 3D tensor. "
+                    f"Got ndim: {mm_input.ndim} "
+                    f"(shape={mm_input.shape})"
+                )
             return mm_input.reshape(-1, mm_input.shape[-1])
         else:
             return torch.concat(mm_input)
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[Qwen2_5_VLImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[Qwen2_5_VLImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_embeds = kwargs.pop("image_embeds", None)
         image_grid_thw = kwargs.pop("image_grid_thw", None)
@@ -1064,27 +1156,35 @@ def _parse_and_validate_image_input(
 
         if pixel_values is not None:
             pixel_values = self._validate_and_reshape_mm_tensor(
-                pixel_values, "image pixel values")
+                pixel_values, "image pixel values"
+            )
             image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, "image grid_thw")
+                image_grid_thw, "image grid_thw"
+            )
 
-            return Qwen2_5_VLImagePixelInputs(type="pixel_values",
-                                              pixel_values=pixel_values,
-                                              image_grid_thw=image_grid_thw)
+            return Qwen2_5_VLImagePixelInputs(
+                type="pixel_values",
+                pixel_values=pixel_values,
+                image_grid_thw=image_grid_thw,
+            )
 
         if image_embeds is not None:
             image_embeds = self._validate_and_reshape_mm_tensor(
-                image_embeds, "image embeds")
+                image_embeds, "image embeds"
+            )
             image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, "image grid_thw")
+                image_grid_thw, "image grid_thw"
+            )
 
             return Qwen2_5_VLImageEmbeddingInputs(
                 type="image_embeds",
                 image_embeds=image_embeds,
-                image_grid_thw=image_grid_thw)
+                image_grid_thw=image_grid_thw,
+            )
 
     def _parse_and_validate_video_input(
-            self, **kwargs: object) -> Optional[Qwen2_5_VLVideoInputs]:
+        self, **kwargs: object
+    ) -> Optional[Qwen2_5_VLVideoInputs]:
         pixel_values_videos = kwargs.pop("pixel_values_videos", None)
         video_embeds = kwargs.pop("video_embeds", None)
         video_grid_thw = kwargs.pop("video_grid_thw", None)
@@ -1095,9 +1195,11 @@ def _parse_and_validate_video_input(
 
         if pixel_values_videos is not None:
             pixel_values_videos = self._validate_and_reshape_mm_tensor(
-                pixel_values_videos, "video pixel values")
+                pixel_values_videos, "video pixel values"
+            )
             video_grid_thw = self._validate_and_reshape_mm_tensor(
-                video_grid_thw, "video grid_thw")
+                video_grid_thw, "video grid_thw"
+            )
             if second_per_grid_ts is not None and second_per_grid_ts.ndim == 2:
                 second_per_grid_ts = second_per_grid_ts.squeeze(-1)
             return Qwen2_5_VLVideoPixelInputs(
@@ -1109,19 +1211,21 @@ def _parse_and_validate_video_input(
 
         if video_embeds is not None:
             video_embeds = self._validate_and_reshape_mm_tensor(
-                video_embeds, "video embeds")
+                video_embeds, "video embeds"
+            )
             video_grid_thw = self._validate_and_reshape_mm_tensor(
-                video_grid_thw, "video grid_thw")
+                video_grid_thw, "video grid_thw"
+            )
 
             return Qwen2_5_VLVideoEmbeddingInputs(
                 type="video_embeds",
                 video_embeds=video_embeds,
-                video_grid_thw=video_grid_thw)
+                video_grid_thw=video_grid_thw,
+            )
 
     def _process_image_input(
-            self,
-            image_input: Qwen2_5_VLImageInputs) -> tuple[torch.Tensor, ...]:
-
+        self, image_input: Qwen2_5_VLImageInputs
+    ) -> tuple[torch.Tensor, ...]:
         grid_thw = image_input["image_grid_thw"]
         assert grid_thw.ndim == 2
         grid_thw_list = grid_thw.tolist()
@@ -1132,25 +1236,27 @@ def _process_image_input(
             pixel_values = image_input["pixel_values"]
 
             if self.use_data_parallel:
-                return run_dp_sharded_mrope_vision_model(self.visual,
-                                                         pixel_values,
-                                                         grid_thw_list,
-                                                         rope_type="rope_3d")
+                return run_dp_sharded_mrope_vision_model(
+                    self.visual, pixel_values, grid_thw_list, rope_type="rope_3d"
+                )
             else:
-                image_embeds = self.visual(pixel_values,
-                                           grid_thw=grid_thw_list)
+                image_embeds = self.visual(pixel_values, grid_thw=grid_thw_list)
 
         # Split concatenated embeddings for each image item.
         # Using prod on grid_thw_list instead of grid_thw.prod avoids CUDA sync
         merge_size = self.visual.spatial_merge_size
-        sizes = (torch.tensor(grid_thw_list, dtype=torch.long).prod(-1) //
-                 (merge_size * merge_size)).tolist()
+        sizes = (
+            torch.tensor(grid_thw_list, dtype=torch.long).prod(-1)
+            // (merge_size * merge_size)
+        ).tolist()
 
         return image_embeds.split(sizes)
 
     def _postprocess_image_embeds_evs(
-            self, image_embeds_split: tuple[torch.Tensor, ...],
-            image_input: Qwen2_5_VLImageInputs) -> tuple[torch.Tensor, ...]:
+        self,
+        image_embeds_split: tuple[torch.Tensor, ...],
+        image_input: Qwen2_5_VLImageInputs,
+    ) -> tuple[torch.Tensor, ...]:
         """
         Append mrope positions for each for images.
         This is necessary to recover correct mrope
@@ -1171,17 +1277,15 @@ def _postprocess_image_embeds_evs(
         grid_thw_list = grid_thw.tolist()
         image_embeds_out = []
         for emb, size in zip(image_embeds_split, grid_thw_list):
-            positions = compute_mrope_for_media(size,
-                                                merge_size).to(emb.device)
+            positions = compute_mrope_for_media(size, merge_size).to(emb.device)
             emb = torch.cat([emb, positions], dim=1)
             image_embeds_out.append(emb)
         image_embeds_split = image_embeds_out
         return tuple(image_embeds_split)
 
     def _process_video_input(
-            self,
-            video_input: Qwen2_5_VLVideoInputs) -> tuple[torch.Tensor, ...]:
-
+        self, video_input: Qwen2_5_VLVideoInputs
+    ) -> tuple[torch.Tensor, ...]:
         grid_thw = video_input["video_grid_thw"]
         assert grid_thw.ndim == 2
         grid_thw_list = grid_thw.tolist()
@@ -1191,25 +1295,27 @@ def _process_video_input(
         else:
             pixel_values_videos = video_input["pixel_values_videos"]
             if self.use_data_parallel:
-                return run_dp_sharded_mrope_vision_model(self.visual,
-                                                         pixel_values_videos,
-                                                         grid_thw_list,
-                                                         rope_type="rope_3d")
+                return run_dp_sharded_mrope_vision_model(
+                    self.visual, pixel_values_videos, grid_thw_list, rope_type="rope_3d"
+                )
             else:
-                video_embeds = self.visual(pixel_values_videos,
-                                           grid_thw=grid_thw_list)
+                video_embeds = self.visual(pixel_values_videos, grid_thw=grid_thw_list)
 
         # Split concatenated embeddings for each video item.
         merge_size = self.visual.spatial_merge_size
         # Using prod on grid_thw_list instead of grid_thw.prod avoids CUDA sync
-        sizes = (torch.tensor(grid_thw_list, dtype=torch.long).prod(-1) //
-                 (merge_size * merge_size)).tolist()
+        sizes = (
+            torch.tensor(grid_thw_list, dtype=torch.long).prod(-1)
+            // (merge_size * merge_size)
+        ).tolist()
 
         return video_embeds.split(sizes)
 
     def _postprocess_video_embeds_evs(
-            self, video_embeds_split: tuple[torch.Tensor, ...],
-            video_input: Qwen2_5_VLVideoInputs) -> tuple[torch.Tensor, ...]:
+        self,
+        video_embeds_split: tuple[torch.Tensor, ...],
+        video_input: Qwen2_5_VLVideoInputs,
+    ) -> tuple[torch.Tensor, ...]:
         """
         Prunes video embeddings via Efficient Video Sampling (EVS)
         and then appends mrope positions for each retained embeddings
@@ -1234,9 +1340,9 @@ def _postprocess_video_embeds_evs(
         tokens_per_second = self.config.vision_config.tokens_per_second
 
         video_embeds_out = []
-        for emb, size, video_second_per_grid_t in zip(video_embeds_split,
-                                                      grid_thw_list,
-                                                      second_per_grid_ts):
+        for emb, size, video_second_per_grid_t in zip(
+            video_embeds_split, grid_thw_list, second_per_grid_ts
+        ):
             # For each video, we compute retention mask using EVS
             retention_mask = compute_retention_mask(
                 emb,
@@ -1288,13 +1394,14 @@ def recompute_mrope_positions(
         vision_start_token_id = self.config.vision_start_token_id
 
         # Device
-        device = (multimodal_embeddings[0].device
-                  if len(multimodal_embeddings) else mrope_positions.device)
+        device = (
+            multimodal_embeddings[0].device
+            if len(multimodal_embeddings)
+            else mrope_positions.device
+        )
 
         # Tensors
-        input_ids_t = torch.as_tensor(input_ids,
-                                      device=device,
-                                      dtype=torch.long)
+        input_ids_t = torch.as_tensor(input_ids, device=device, dtype=torch.long)
 
         # fmt: off
         mm_embeddings_out = [mm[:, :-4] for mm in
@@ -1321,24 +1428,27 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if input_key in ("pixel_values", "image_embeds"
-                             ) and "image" not in mm_input_by_modality:
-                mm_input_by_modality[
-                    "image"] = self._parse_and_validate_image_input(**kwargs)
-            if input_key in ("pixel_values_videos", "video_embeds"
-                             ) and "video" not in mm_input_by_modality:
-                mm_input_by_modality[
-                    "video"] = self._parse_and_validate_video_input(**kwargs)
+            if (
+                input_key in ("pixel_values", "image_embeds")
+                and "image" not in mm_input_by_modality
+            ):
+                mm_input_by_modality["image"] = self._parse_and_validate_image_input(
+                    **kwargs
+                )
+            if (
+                input_key in ("pixel_values_videos", "video_embeds")
+                and "video" not in mm_input_by_modality
+            ):
+                mm_input_by_modality["video"] = self._parse_and_validate_video_input(
+                    **kwargs
+                )
         return mm_input_by_modality
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
-
-        mm_input_by_modality = self._parse_and_validate_multimodal_inputs(
-            **kwargs)
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
+        mm_input_by_modality = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not mm_input_by_modality:
             return []
 
@@ -1402,9 +1512,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         skip_prefixes = []
         if self.visual is None:
             skip_prefixes.extend(["visual."])
diff --git a/vllm/model_executor/models/qwen2_audio.py b/vllm/model_executor/models/qwen2_audio.py
index f407692e1151..e61a730f97bb 100644
--- a/vllm/model_executor/models/qwen2_audio.py
+++ b/vllm/model_executor/models/qwen2_audio.py
@@ -22,29 +22,44 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Qwen2-Audio model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable, Mapping, Sequence
 from typing import Annotated, Any, Literal, Optional, Union
 
 import torch
 import torch.nn as nn
 from transformers import BatchFeature
-from transformers.models.qwen2_audio import (Qwen2AudioConfig,
-                                             Qwen2AudioEncoder,
-                                             Qwen2AudioProcessor)
+from transformers.models.qwen2_audio import (
+    Qwen2AudioConfig,
+    Qwen2AudioEncoder,
+    Qwen2AudioProcessor,
+)
 from transformers.models.whisper import WhisperFeatureExtractor
 
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (AudioItem, ModalityData,
-                                    MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
-from vllm.multimodal.parse import (AudioProcessorItems, DictEmbeddingItems,
-                                   ModalityDataItems, MultiModalDataItems,
-                                   MultiModalDataParser)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails)
+from vllm.multimodal.inputs import (
+    AudioItem,
+    ModalityData,
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
+from vllm.multimodal.parse import (
+    AudioProcessorItems,
+    DictEmbeddingItems,
+    ModalityDataItems,
+    MultiModalDataItems,
+    MultiModalDataParser,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
@@ -60,6 +75,7 @@ class Qwen2AudioFeatureInputs(TensorSchema):
         - na: Number of audios
         - nmb: Number of mel bins
     """
+
     type: Literal["audio_features"]
     input_features: Annotated[
         Union[torch.Tensor, list[torch.Tensor]],
@@ -80,6 +96,7 @@ class Qwen2AudioEmbeddingInputs(TensorSchema):
         - hs: Hidden size (must match the hidden size of language model
           backbone)
     """
+
     type: Literal["audio_embeds"] = "audio_embeds"
 
     audio_embeds: Annotated[
@@ -94,7 +111,6 @@ class Qwen2AudioEmbeddingInputs(TensorSchema):
 
 
 class Qwen2AudioMultiModalProjector(nn.Module):
-
     def __init__(self, audio_hidden_size: int, text_hidden_size: int):
         super().__init__()
         self.linear = nn.Linear(audio_hidden_size, text_hidden_size, bias=True)
@@ -112,15 +128,13 @@ def _get_feat_extract_output_lengths(input_lengths: torch.Tensor):
 
 
 class Qwen2AudioProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(Qwen2AudioConfig)
 
     def get_hf_processor(self, **kwargs: object) -> Qwen2AudioProcessor:
         return self.ctx.get_hf_processor(Qwen2AudioProcessor, **kwargs)
 
-    def get_feature_extractor(self,
-                              **kwargs: object) -> WhisperFeatureExtractor:
+    def get_feature_extractor(self, **kwargs: object) -> WhisperFeatureExtractor:
         hf_processor = self.get_hf_processor(**kwargs)
         feature_extractor = hf_processor.feature_extractor  # type: ignore
         assert isinstance(feature_extractor, WhisperFeatureExtractor)
@@ -130,9 +144,7 @@ def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
         return {"audio": None}
 
 
-class Qwen2AudioDummyInputsBuilder(
-        BaseDummyInputsBuilder[Qwen2AudioProcessingInfo]):
-
+class Qwen2AudioDummyInputsBuilder(BaseDummyInputsBuilder[Qwen2AudioProcessingInfo]):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_audios = mm_counts.get("audio", 0)
 
@@ -156,10 +168,9 @@ def get_dummy_mm_data(
         audio_overrides = mm_options.get("audio") if mm_options else None
 
         return {
-            "audio":
-            self._get_dummy_audios(length=audio_len,
-                                   num_audios=num_audios,
-                                   overrides=audio_overrides)
+            "audio": self._get_dummy_audios(
+                length=audio_len, num_audios=num_audios, overrides=audio_overrides
+            )
         }
 
 
@@ -172,7 +183,6 @@ def _qwen2audio_field_config(hf_inputs: Mapping[str, torch.Tensor]):
 
 
 class Qwen2AudioMultiModalDataParser(MultiModalDataParser):
-
     def _parse_audio_data(
         self,
         data: Union[dict[str, torch.Tensor], ModalityData[AudioItem]],
@@ -188,13 +198,10 @@ def _parse_audio_data(
         return super()._parse_audio_data(data)
 
 
-class Qwen2AudioMultiModalProcessor(
-        BaseMultiModalProcessor[Qwen2AudioProcessingInfo]):
-
+class Qwen2AudioMultiModalProcessor(BaseMultiModalProcessor[Qwen2AudioProcessingInfo]):
     def _get_data_parser(self) -> MultiModalDataParser:
         feature_extractor = self.info.get_feature_extractor()
-        return Qwen2AudioMultiModalDataParser(
-            target_sr=feature_extractor.sampling_rate)
+        return Qwen2AudioMultiModalDataParser(target_sr=feature_extractor.sampling_rate)
 
     def _call_hf_processor(
         self,
@@ -242,17 +249,14 @@ def _get_prompt_updates(
         hf_processor_mm_kwargs: Mapping[str, object],
         out_mm_kwargs: MultiModalKwargsItems,
     ) -> Sequence[PromptUpdate]:
-
         processor = self.info.get_hf_processor(**hf_processor_mm_kwargs)
         tokenizer = self.info.get_tokenizer()
         vocab = tokenizer.get_vocab()
 
         # Use getattr with default to be compatible with transformers<4.48
         audio_token = getattr(processor, "audio_token", "<|AUDIO|>")
-        audio_bos_token = getattr(processor, "audio_bos_token",
-                                  "<|audio_bos|>")
-        audio_eos_token = getattr(processor, "audio_eos_token",
-                                  "<|audio_eos|>")
+        audio_bos_token = getattr(processor, "audio_bos_token", "<|audio_bos|>")
+        audio_eos_token = getattr(processor, "audio_eos_token", "<|audio_eos|>")
 
         audio_token_id = vocab[audio_token]
         audio_bos_id = vocab[audio_bos_token]
@@ -265,26 +269,27 @@ def _get_prompt_updates(
         else:
             assert isinstance(feature_attention_mask, torch.Tensor)
             _, audio_output_lens = _get_feat_extract_output_lengths(
-                feature_attention_mask.sum(-1))
+                feature_attention_mask.sum(-1)
+            )
 
             audio_output_lengths = audio_output_lens.tolist()
 
         def get_replacement_qwen2_audio(item_idx: int):
-
             if audio_output_lengths:
                 num_features = audio_output_lengths[item_idx]
             else:
                 audio_embeds = out_mm_data["audio_embeds"][item_idx]
-                assert len(audio_embeds.shape
-                           ) == 2, "audio_embeds must be a 2D tensor"
+                assert len(audio_embeds.shape) == 2, "audio_embeds must be a 2D tensor"
                 num_features = audio_embeds.shape[0]
 
             if num_features == 0:
                 audios = mm_items.get_items("audio", AudioProcessorItems)
                 audio_len = audios.get_audio_length(item_idx)
 
-                raise ValueError(f"The audio (len={audio_len}) is too short "
-                                 "to be represented inside the model")
+                raise ValueError(
+                    f"The audio (len={audio_len}) is too short "
+                    "to be represented inside the model"
+                )
 
             audio_tokens = [audio_token_id] * num_features
 
@@ -305,10 +310,9 @@ def get_replacement_qwen2_audio(item_idx: int):
 @MULTIMODAL_REGISTRY.register_processor(
     Qwen2AudioMultiModalProcessor,
     info=Qwen2AudioProcessingInfo,
-    dummy_inputs=Qwen2AudioDummyInputsBuilder)
-class Qwen2AudioForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                         SupportsPP):
-
+    dummy_inputs=Qwen2AudioDummyInputsBuilder,
+)
+class Qwen2AudioForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP):
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
         if modality.startswith("audio"):
@@ -326,7 +330,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.audio_tower = Qwen2AudioEncoder(config.audio_config)
         self.multi_modal_projector = Qwen2AudioMultiModalProjector(
-            config.audio_config.d_model, config.text_config.hidden_size)
+            config.audio_config.d_model, config.text_config.hidden_size
+        )
 
         self.quant_config = quant_config
 
@@ -338,45 +343,53 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
-    def _validate_and_reshape_mm_tensor(self, mm_input: object,
-                                        name: str) -> torch.Tensor:
+    def _validate_and_reshape_mm_tensor(
+        self, mm_input: object, name: str
+    ) -> torch.Tensor:
         if not isinstance(mm_input, (torch.Tensor, list)):
-            raise ValueError(f"Incorrect type of {name}. "
-                             f"Got type: {type(mm_input)}")
+            raise ValueError(f"Incorrect type of {name}. Got type: {type(mm_input)}")
         if isinstance(mm_input, torch.Tensor):
             return mm_input.reshape(-1, *mm_input.shape[2:])
         else:
             return torch.concat(mm_input)
 
     def _parse_and_validate_audio_input(
-            self, **kwargs: object) -> Optional[Qwen2AudioInputs]:
-        input_features = kwargs.pop('input_features', None)
-        audio_embeds = kwargs.pop('audio_embeds', None)
-        feature_attention_mask = kwargs.pop('feature_attention_mask', None)
+        self, **kwargs: object
+    ) -> Optional[Qwen2AudioInputs]:
+        input_features = kwargs.pop("input_features", None)
+        audio_embeds = kwargs.pop("audio_embeds", None)
+        feature_attention_mask = kwargs.pop("feature_attention_mask", None)
 
         if input_features is None and audio_embeds is None:
             return None
 
         if audio_embeds is not None:
             if not isinstance(audio_embeds, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of audio embeds. "
-                                 f"Got type: {type(audio_embeds)}")
+                raise ValueError(
+                    f"Incorrect type of audio embeds. Got type: {type(audio_embeds)}"
+                )
             audio_embeds = self._validate_and_reshape_mm_tensor(
-                audio_embeds, "audio_embeds")
-            return Qwen2AudioEmbeddingInputs(type="audio_embeds",
-                                             audio_embeds=audio_embeds)
+                audio_embeds, "audio_embeds"
+            )
+            return Qwen2AudioEmbeddingInputs(
+                type="audio_embeds", audio_embeds=audio_embeds
+            )
 
         if input_features is not None:
             input_features = self._validate_and_reshape_mm_tensor(
-                input_features, 'input_features')
+                input_features, "input_features"
+            )
             feature_attention_mask = self._validate_and_reshape_mm_tensor(
-                feature_attention_mask, 'feature_attention_mask')
+                feature_attention_mask, "feature_attention_mask"
+            )
             return Qwen2AudioFeatureInputs(
                 type="audio_features",
                 input_features=input_features,
-                feature_attention_mask=feature_attention_mask)
+                feature_attention_mask=feature_attention_mask,
+            )
 
         raise AssertionError("This line should be unreachable.")
 
@@ -392,51 +405,62 @@ def _process_audio_input(
 
         audio_feat_lengths, audio_output_lengths = (
             self.audio_tower._get_feat_extract_output_lengths(
-                feature_attention_mask.sum(-1)))
+                feature_attention_mask.sum(-1)
+            )
+        )
 
         batch_size, _, max_mel_seq_len = input_features.shape
         max_seq_len = (max_mel_seq_len - 2) // 2 + 1
         # Create a sequence tensor of shape (batch_size, max_seq_len)
-        seq_range = (torch.arange(
-            0,
-            max_seq_len,
-            dtype=audio_feat_lengths.dtype,
-            device=audio_feat_lengths.device).unsqueeze(0).expand(
-                batch_size, max_seq_len))
+        seq_range = (
+            torch.arange(
+                0,
+                max_seq_len,
+                dtype=audio_feat_lengths.dtype,
+                device=audio_feat_lengths.device,
+            )
+            .unsqueeze(0)
+            .expand(batch_size, max_seq_len)
+        )
         lengths_expand = audio_feat_lengths.unsqueeze(-1).expand(
-            batch_size, max_seq_len)
+            batch_size, max_seq_len
+        )
         # Create mask
         padding_mask = seq_range >= lengths_expand
 
-        audio_attention_mask_ = padding_mask.view(
-            batch_size, 1, 1, max_seq_len).expand(batch_size, 1, max_seq_len,
-                                                  max_seq_len)
+        audio_attention_mask_ = padding_mask.view(batch_size, 1, 1, max_seq_len).expand(
+            batch_size, 1, max_seq_len, max_seq_len
+        )
         audio_attention_mask = audio_attention_mask_.to(
             dtype=self.audio_tower.conv1.weight.dtype,
-            device=self.audio_tower.conv1.weight.device)
+            device=self.audio_tower.conv1.weight.device,
+        )
         audio_attention_mask[audio_attention_mask_] = float("-inf")
 
-        audio_outputs = self.audio_tower(input_features,
-                                         attention_mask=audio_attention_mask)
+        audio_outputs = self.audio_tower(
+            input_features, attention_mask=audio_attention_mask
+        )
         selected_audio_feature = audio_outputs.last_hidden_state
         audio_features = self.multi_modal_projector(selected_audio_feature)
         num_audios, max_audio_tokens, embed_dim = audio_features.shape
         audio_output_lengths = audio_output_lengths.unsqueeze(1)
-        audio_features_mask = torch.arange(max_audio_tokens).expand(
-            num_audios, max_audio_tokens).to(
-                audio_output_lengths.device) < audio_output_lengths
-        masked_audio_features = audio_features[audio_features_mask].view(
-            -1, embed_dim)
+        audio_features_mask = (
+            torch.arange(max_audio_tokens)
+            .expand(num_audios, max_audio_tokens)
+            .to(audio_output_lengths.device)
+            < audio_output_lengths
+        )
+        masked_audio_features = audio_features[audio_features_mask].view(-1, embed_dim)
 
         # Split to tuple of embeddings for individual audio input.
-        return torch.split(masked_audio_features,
-                           audio_output_lengths.flatten().tolist())
+        return torch.split(
+            masked_audio_features, audio_output_lengths.flatten().tolist()
+        )
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         audio_input = self._parse_and_validate_audio_input(**kwargs)
         if audio_input is None:
             return []
@@ -451,14 +475,12 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs: object,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.language_model.model(input_ids,
-                                                  positions,
-                                                  intermediate_tensors,
-                                                  inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -467,7 +489,6 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/qwen2_moe.py b/vllm/model_executor/models/qwen2_moe.py
index 6a9acaf2c3fe..61b203a08349 100644
--- a/vllm/model_executor/models/qwen2_moe.py
+++ b/vllm/model_executor/models/qwen2_moe.py
@@ -24,6 +24,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Qwen2MoE model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Any, Optional, Union
@@ -41,29 +42,36 @@
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, extract_layer_index,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
 
 class Qwen2MoeMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -75,19 +83,24 @@ def __init__(
     ) -> None:
         super().__init__()
         self.gate_up_proj = MergedColumnParallelLinear(
-            hidden_size, [intermediate_size] * 2,
+            hidden_size,
+            [intermediate_size] * 2,
             bias=False,
             quant_config=quant_config,
-            prefix=f"{prefix}.gate_up_proj")
-        self.down_proj = RowParallelLinear(intermediate_size,
-                                           hidden_size,
-                                           bias=False,
-                                           quant_config=quant_config,
-                                           reduce_results=reduce_results,
-                                           prefix=f"{prefix}.down_proj")
+            prefix=f"{prefix}.gate_up_proj",
+        )
+        self.down_proj = RowParallelLinear(
+            intermediate_size,
+            hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            reduce_results=reduce_results,
+            prefix=f"{prefix}.down_proj",
+        )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -98,7 +111,6 @@ def forward(self, x):
 
 
 class Qwen2MoeSparseMoeBlock(nn.Module):
-
     def __init__(
         self,
         config: Qwen2MoeConfig,
@@ -111,37 +123,39 @@ def __init__(
         if self.tp_size > config.num_experts:
             raise ValueError(
                 f"Tensor parallel size {self.tp_size} is greater than "
-                f"the number of experts {config.num_experts}.")
-
-        self.experts = FusedMoE(num_experts=config.num_experts,
-                                top_k=config.num_experts_per_tok,
-                                hidden_size=config.hidden_size,
-                                intermediate_size=config.moe_intermediate_size,
-                                reduce_results=False,
-                                renormalize=config.norm_topk_prob,
-                                quant_config=quant_config,
-                                prefix=f"{prefix}.experts")
-
-        self.gate = ReplicatedLinear(config.hidden_size,
-                                     config.num_experts,
-                                     bias=False,
-                                     quant_config=None,
-                                     prefix=f"{prefix}.gate")
+                f"the number of experts {config.num_experts}."
+            )
+
+        self.experts = FusedMoE(
+            num_experts=config.num_experts,
+            top_k=config.num_experts_per_tok,
+            hidden_size=config.hidden_size,
+            intermediate_size=config.moe_intermediate_size,
+            reduce_results=False,
+            renormalize=config.norm_topk_prob,
+            quant_config=quant_config,
+            prefix=f"{prefix}.experts",
+        )
+
+        self.gate = ReplicatedLinear(
+            config.hidden_size,
+            config.num_experts,
+            bias=False,
+            quant_config=None,
+            prefix=f"{prefix}.gate",
+        )
         if config.shared_expert_intermediate_size > 0:
             self.shared_expert = Qwen2MoeMLP(
                 hidden_size=config.hidden_size,
                 intermediate_size=config.shared_expert_intermediate_size,
                 hidden_act=config.hidden_act,
                 quant_config=quant_config,
-                reduce_results=self.experts.must_reduce_shared_expert_outputs(
-                ),
+                reduce_results=self.experts.must_reduce_shared_expert_outputs(),
                 prefix=f"{prefix}.shared_expert",
             )
         else:
             self.shared_expert = None
-        self.shared_expert_gate = torch.nn.Linear(config.hidden_size,
-                                                  1,
-                                                  bias=False)
+        self.shared_expert_gate = torch.nn.Linear(config.hidden_size, 1, bias=False)
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         # NOTE: hidden_states can have either 1D or 2D shape.
@@ -152,24 +166,26 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         if self.shared_expert is not None:
             shared_output = self.shared_expert(hidden_states)
             if self.shared_expert_gate is not None:
-                shared_output = F.sigmoid(
-                    self.shared_expert_gate(hidden_states)) * shared_output
+                shared_output = (
+                    F.sigmoid(self.shared_expert_gate(hidden_states)) * shared_output
+                )
 
         # router_logits: (num_tokens, n_experts)
         router_logits, _ = self.gate(hidden_states)
-        final_hidden_states = self.experts(hidden_states=hidden_states,
-                                           router_logits=router_logits)
+        final_hidden_states = self.experts(
+            hidden_states=hidden_states, router_logits=router_logits
+        )
         if shared_output is not None:
             final_hidden_states = final_hidden_states + shared_output
         if self.tp_size > 1:
             final_hidden_states = self.experts.maybe_all_reduce_tensor_model_parallel(  # noqa E501
-                final_hidden_states)
+                final_hidden_states
+            )
 
         return final_hidden_states.view(orig_shape)
 
 
 class Qwen2MoeAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -207,19 +223,23 @@ def __init__(
         self.max_position_embeddings = max_position_embeddings
         self.dual_chunk_attention_config = dual_chunk_attention_config
 
-        self.qkv_proj = QKVParallelLinear(hidden_size,
-                                          self.head_dim,
-                                          self.total_num_heads,
-                                          self.total_num_kv_heads,
-                                          bias=True,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.qkv_proj")
+        self.qkv_proj = QKVParallelLinear(
+            hidden_size,
+            self.head_dim,
+            self.total_num_heads,
+            self.total_num_kv_heads,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.qkv_proj",
+        )
 
-        self.o_proj = RowParallelLinear(self.total_num_heads * self.head_dim,
-                                        hidden_size,
-                                        bias=False,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.o_proj")
+        self.o_proj = RowParallelLinear(
+            self.total_num_heads * self.head_dim,
+            hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.o_proj",
+        )
 
         self.rotary_emb = get_rope(
             self.head_dim,
@@ -240,7 +260,10 @@ def __init__(
             **{
                 "layer_idx": extract_layer_index(prefix),
                 "dual_chunk_attention_config": dual_chunk_attention_config,
-            } if dual_chunk_attention_config else {})
+            }
+            if dual_chunk_attention_config
+            else {},
+        )
 
     def forward(
         self,
@@ -256,7 +279,6 @@ def forward(
 
 
 class Qwen2MoeDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Qwen2MoeConfig,
@@ -268,11 +290,10 @@ def __init__(
         self.hidden_size = config.hidden_size
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        dual_chunk_attention_config = getattr(config,
-                                              "dual_chunk_attention_config",
-                                              None)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+        dual_chunk_attention_config = getattr(
+            config, "dual_chunk_attention_config", None
+        )
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         self.self_attn = Qwen2MoeAttention(
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
@@ -289,24 +310,27 @@ def __init__(
         # Note: Qwen/Qwen2-57B-A14B-Instruct does not have
         # `mlp_only_layers` in the config.
         layer_idx = extract_layer_index(prefix)
-        mlp_only_layers = ([] if not hasattr(config, "mlp_only_layers") else
-                           config.mlp_only_layers)
+        mlp_only_layers = (
+            [] if not hasattr(config, "mlp_only_layers") else config.mlp_only_layers
+        )
         if (layer_idx not in mlp_only_layers) and (
-                config.num_experts > 0 and
-            (layer_idx + 1) % config.decoder_sparse_step == 0):
-            self.mlp = Qwen2MoeSparseMoeBlock(config=config,
-                                              quant_config=quant_config,
-                                              prefix=f"{prefix}.mlp")
+            config.num_experts > 0 and (layer_idx + 1) % config.decoder_sparse_step == 0
+        ):
+            self.mlp = Qwen2MoeSparseMoeBlock(
+                config=config, quant_config=quant_config, prefix=f"{prefix}.mlp"
+            )
         else:
-            self.mlp = Qwen2MoeMLP(hidden_size=config.hidden_size,
-                                   intermediate_size=config.intermediate_size,
-                                   hidden_act=config.hidden_act,
-                                   quant_config=quant_config,
-                                   prefix=f"{prefix}.mlp")
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+            self.mlp = Qwen2MoeMLP(
+                hidden_size=config.hidden_size,
+                intermediate_size=config.intermediate_size,
+                hidden_act=config.hidden_act,
+                quant_config=quant_config,
+                prefix=f"{prefix}.mlp",
+            )
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -319,23 +343,20 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
 
 @support_torch_compile
 class Qwen2MoeModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -352,16 +373,18 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: Qwen2MoeDecoderLayer(config=config,
-                                                cache_config=cache_config,
-                                                quant_config=quant_config,
-                                                prefix=prefix),
+            lambda prefix: Qwen2MoeDecoderLayer(
+                config=config,
+                cache_config=cache_config,
+                quant_config=quant_config,
+                prefix=prefix,
+            ),
             prefix=f"{prefix}.layers",
         )
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -386,10 +409,9 @@ def forward(
         for layer in islice(self.layers, self.start_layer, self.end_layer):
             hidden_states, residual = layer(positions, hidden_states, residual)
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
@@ -400,10 +422,10 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
             ckpt_gate_proj_name="gate_proj",
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
-            num_experts=self.config.num_experts)
+            num_experts=self.config.num_experts,
+        )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -417,7 +439,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         loaded_params: set[str] = set()
         expert_params_mapping = self.get_expert_mapping()
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 # Skip non-stacked layers and experts (experts handled below).
                 if weight_name not in name:
                     continue
@@ -431,8 +453,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
                 name = name.replace(weight_name, param_name)
                 # Skip loading extra bias for GPTQ models.
-                if ((name.endswith(".bias") or name.endswith("_bias"))
-                        and name not in params_dict):
+                if (
+                    name.endswith(".bias") or name.endswith("_bias")
+                ) and name not in params_dict:
                     continue
                 # Skip layers on other devices.
                 if is_pp_missing_parameter(name, self):
@@ -455,21 +478,25 @@ def load_weights(self, weights: Iterable[tuple[str,
                     if is_pp_missing_parameter(name, self):
                         continue
                     # Skip loading extra bias for GPTQ models.
-                    if ((name.endswith(".bias") or name.endswith("_bias"))
-                            and name not in params_dict):
+                    if (
+                        name.endswith(".bias") or name.endswith("_bias")
+                    ) and name not in params_dict:
                         continue
                     param = params_dict[name]
                     weight_loader = param.weight_loader
-                    weight_loader(param,
-                                  loaded_weight,
-                                  name,
-                                  shard_id=shard_id,
-                                  expert_id=expert_id)
+                    weight_loader(
+                        param,
+                        loaded_weight,
+                        name,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                    )
                     break
                 else:
                     # Skip loading extra bias for GPTQ models.
-                    if ((name.endswith(".bias") or name.endswith("_bias"))
-                            and name not in params_dict):
+                    if (
+                        name.endswith(".bias") or name.endswith("_bias")
+                    ) and name not in params_dict:
                         continue
                     # Skip layers on other devices.
                     if is_pp_missing_parameter(name, self):
@@ -477,7 +504,8 @@ def load_weights(self, weights: Iterable[tuple[str,
                     # Remapping the name of FP8 kv-scale.
                     if name.endswith("kv_scale"):
                         remapped_kv_scale_name = name.replace(
-                            ".kv_scale", ".attn.kv_scale")
+                            ".kv_scale", ".attn.kv_scale"
+                        )
                         if remapped_kv_scale_name not in params_dict:
                             logger.warning_once(
                                 "Found kv_scale in the checkpoint (e.g. %s), but not found the expected name in the model (e.g. %s). kv_scale is not loaded.",  #  noqa: E501
@@ -488,15 +516,15 @@ def load_weights(self, weights: Iterable[tuple[str,
                         else:
                             name = remapped_kv_scale_name
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class Qwen2MoeForCausalLM(nn.Module, SupportsPP, SupportsLoRA):
-
     fall_back_to_pt_during_load = False
     packed_modules_mapping = {
         "qkv_proj": [
@@ -516,17 +544,21 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.model = Qwen2MoeModel(vllm_config=vllm_config,
-                                   prefix=maybe_prefix(prefix, "model"))
-        self.lm_head = ParallelLMHead(config.vocab_size,
-                                      config.hidden_size,
-                                      quant_config=quant_config,
-                                      prefix=maybe_prefix(prefix, "lm_head"))
+        self.model = Qwen2MoeModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
+        self.lm_head = ParallelLMHead(
+            config.vocab_size,
+            config.hidden_size,
+            quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
         if self.config.tie_word_embeddings:
             self.lm_head.weight = self.model.embed_tokens.weight
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -538,8 +570,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -549,8 +582,7 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
 
diff --git a/vllm/model_executor/models/qwen2_rm.py b/vllm/model_executor/models/qwen2_rm.py
index 2bd9d2b52628..75ed95477f78 100644
--- a/vllm/model_executor/models/qwen2_rm.py
+++ b/vllm/model_executor/models/qwen2_rm.py
@@ -6,6 +6,7 @@
 # Copyright 2024 The Qwen team.
 # Copyright 2023 The vLLM team.
 """Inference-only Qwen2-RM model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from typing import Optional, Union
 
@@ -13,8 +14,7 @@
 from torch import nn
 
 from vllm.config import VllmConfig
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import ColumnParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.pooler import DispatchPooler, Pooler
 from vllm.sequence import IntermediateTensors
 
@@ -25,7 +25,6 @@
 
 
 class Qwen2RewardBaseModel(nn.Module, SupportsLoRA, SupportsPP):
-
     is_pooling_model = True
     pooler: Pooler
 
@@ -51,25 +50,31 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.lora_config = lora_config
 
         self.quant_config = quant_config
-        self.model = Qwen2Model(vllm_config=vllm_config,
-                                prefix=maybe_prefix(prefix, "model"))
+        self.model = Qwen2Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.head_dtype = vllm_config.model_config.head_dtype
 
         self.score = nn.Sequential(
-            ColumnParallelLinear(config.hidden_size,
-                                 config.hidden_size,
-                                 quant_config=quant_config,
-                                 params_dtype=self.head_dtype,
-                                 return_bias=False),
+            ColumnParallelLinear(
+                config.hidden_size,
+                config.hidden_size,
+                quant_config=quant_config,
+                params_dtype=self.head_dtype,
+                return_bias=False,
+            ),
             nn.ReLU(),
-            RowParallelLinear(config.hidden_size,
-                              config.num_labels,
-                              params_dtype=self.head_dtype,
-                              quant_config=quant_config,
-                              return_bias=False),
+            RowParallelLinear(
+                config.hidden_size,
+                config.num_labels,
+                params_dtype=self.head_dtype,
+                quant_config=quant_config,
+                return_bias=False,
+            ),
         )
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -81,22 +86,20 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         hidden_states = hidden_states.to(self.head_dtype)
         logits = self.score(hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-        loader = AutoWeightsLoader(self,
-                                   ignore_unexpected_prefixes=["lm_head."])
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
+        loader = AutoWeightsLoader(self, ignore_unexpected_prefixes=["lm_head."])
         return loader.load_weights(weights)
 
 
 @default_pooling_type("ALL")
 class Qwen2ForRewardModel(Qwen2RewardBaseModel):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         vllm_config.model_config.hf_config.num_labels = 1
         super().__init__(vllm_config=vllm_config, prefix=prefix)
@@ -105,12 +108,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         assert pooler_config is not None
 
         self.pooler = DispatchPooler(
-            {"encode": Pooler.for_encode(pooler_config)}, )
+            {"encode": Pooler.for_encode(pooler_config)},
+        )
 
 
 @default_pooling_type("STEP")
 class Qwen2ForProcessRewardModel(Qwen2RewardBaseModel):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         vllm_config.model_config.hf_config.num_labels = 2
         super().__init__(vllm_config=vllm_config, prefix=prefix)
@@ -118,5 +121,4 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         pooler_config = vllm_config.model_config.pooler_config
         assert pooler_config is not None
 
-        self.pooler = DispatchPooler(
-            {"encode": Pooler.for_encode(pooler_config)})
+        self.pooler = DispatchPooler({"encode": Pooler.for_encode(pooler_config)})
diff --git a/vllm/model_executor/models/qwen2_vl.py b/vllm/model_executor/models/qwen2_vl.py
index 11d6a0c8dc19..cb1bf3825c74 100644
--- a/vllm/model_executor/models/qwen2_vl.py
+++ b/vllm/model_executor/models/qwen2_vl.py
@@ -24,6 +24,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Qwen2-VL model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable, Mapping, Sequence
 from functools import partial
 from typing import Annotated, Any, Callable, Literal, Optional, Union
@@ -33,49 +34,72 @@
 import torch.nn.functional as F
 from einops import rearrange, repeat
 from transformers import AutoConfig, BatchFeature, PretrainedConfig
-from transformers.models.qwen2_vl import (Qwen2VLImageProcessor,
-                                          Qwen2VLProcessor)
+from transformers.models.qwen2_vl import Qwen2VLImageProcessor, Qwen2VLProcessor
 from transformers.models.qwen2_vl.configuration_qwen2_vl import (
-    Qwen2VLConfig, Qwen2VLVisionConfig)
+    Qwen2VLConfig,
+    Qwen2VLVisionConfig,
+)
 from transformers.models.qwen2_vl.image_processing_qwen2_vl import smart_resize
-from transformers.models.qwen2_vl.video_processing_qwen2_vl import (
-    Qwen2VLVideoProcessor)
+from transformers.models.qwen2_vl.video_processing_qwen2_vl import Qwen2VLVideoProcessor
 
 from vllm.attention.backends.registry import _Backend
-from vllm.attention.layer import (check_upstream_fa_availability,
-                                  maybe_get_vit_flash_attn_backend)
+from vllm.attention.layer import (
+    check_upstream_fa_availability,
+    maybe_get_vit_flash_attn_backend,
+)
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import parallel_state, tensor_model_parallel_all_gather
 from vllm.distributed import utils as dist_utils
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import QuickGELU
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import ColumnParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding.common import (
-    dispatch_rotary_emb_function)
+    dispatch_rotary_emb_function,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (ImageItem, ModalityData,
-                                    MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems, VideoItem)
-from vllm.multimodal.parse import (DictEmbeddingItems, ImageSize,
-                                   ModalityDataItems, MultiModalDataItems,
-                                   MultiModalDataParser)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate)
+from vllm.multimodal.inputs import (
+    ImageItem,
+    ModalityData,
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+    VideoItem,
+)
+from vllm.multimodal.parse import (
+    DictEmbeddingItems,
+    ImageSize,
+    ModalityDataItems,
+    MultiModalDataItems,
+    MultiModalDataParser,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA, SupportsMRoPE,
-                         SupportsMultiModal, SupportsPP)
-from .utils import (AutoWeightsLoader, WeightsMapper,
-                    init_vllm_registered_model, maybe_prefix)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMRoPE,
+    SupportsMultiModal,
+    SupportsPP,
+)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 from .vision import get_vit_attn_backend, run_dp_sharded_mrope_vision_model
 
 logger = init_logger(__name__)
@@ -93,13 +117,14 @@ class Qwen2VLImagePixelInputs(TensorSchema):
               the batch
         - ni: Number of images
         - cps: Number of channels * patch_size * patch_size
-    
+
     Historical context:
-        - pixel_values shape: (num_patches, num_channels * patch_size * 
+        - pixel_values shape: (num_patches, num_channels * patch_size *
           patch_size)
         - image_grid_thw shape: (num_images, 3) in (grid_t, grid_h, grid_w)
           format
     """
+
     type: Literal["pixel_values"]
 
     pixel_values: Annotated[
@@ -119,7 +144,7 @@ class Qwen2VLImageEmbeddingInputs(TensorSchema):
         - nf: Number of image features
         - hs: Hidden size
         - ni: Number of images
-    
+
     Historical context:
         - image_embeds shape: (num_image_features, hidden_size)
         - num_image_features varies based on the number and resolution of the
@@ -128,6 +153,7 @@ class Qwen2VLImageEmbeddingInputs(TensorSchema):
         - image_grid_thw shape: (num_images, 3) in (grid_t, grid_h, grid_w)
           format
     """
+
     type: Literal["image_embeds"]
 
     image_embeds: Annotated[
@@ -141,8 +167,7 @@ class Qwen2VLImageEmbeddingInputs(TensorSchema):
     ]
 
 
-Qwen2VLImageInputs = Union[Qwen2VLImagePixelInputs,
-                           Qwen2VLImageEmbeddingInputs]
+Qwen2VLImageInputs = Union[Qwen2VLImagePixelInputs, Qwen2VLImageEmbeddingInputs]
 
 
 class Qwen2VLVideoPixelInputs(TensorSchema):
@@ -150,16 +175,17 @@ class Qwen2VLVideoPixelInputs(TensorSchema):
     Dimensions:
         - np: The total number of patches over each video over each prompt in
               the batch
-        - ctps: Number of channels * temporal_patch_size * patch_size * 
+        - ctps: Number of channels * temporal_patch_size * patch_size *
           patch_size
         - nv: Number of videos
-    
+
     Historical context:
-        - pixel_values_videos shape: (num_patches, num_channels * 
+        - pixel_values_videos shape: (num_patches, num_channels *
           temporal_patch_size * patch_size * patch_size)
         - video_grid_thw shape: (num_videos, 3) in (grid_t, grid_h, grid_w)
           format
     """
+
     type: Literal["pixel_values_videos"]
 
     pixel_values_videos: Annotated[
@@ -179,7 +205,7 @@ class Qwen2VLVideoEmbeddingInputs(TensorSchema):
         - nf: Number of video features
         - hs: Hidden size
         - nv: Number of videos
-    
+
     Historical context:
         - video_embeds shape: (num_video_features, hidden_size)
         - num_video_features varies based on the number and resolution of the
@@ -188,6 +214,7 @@ class Qwen2VLVideoEmbeddingInputs(TensorSchema):
         - video_grid_thw shape: (num_videos, 3) in (grid_t, grid_h, grid_w)
           format
     """
+
     type: Literal["video_embeds"]
 
     video_embeds: Annotated[
@@ -201,14 +228,12 @@ class Qwen2VLVideoEmbeddingInputs(TensorSchema):
     ]
 
 
-Qwen2VLVideoInputs = Union[Qwen2VLVideoPixelInputs,
-                           Qwen2VLVideoEmbeddingInputs]
+Qwen2VLVideoInputs = Union[Qwen2VLVideoPixelInputs, Qwen2VLVideoEmbeddingInputs]
 
 # === Vision Encoder === #
 
 
 class Qwen2VisionMLP(nn.Module):
-
     def __init__(
         self,
         in_features: int,
@@ -219,17 +244,21 @@ def __init__(
         use_data_parallel: bool = False,
     ):
         super().__init__()
-        self.fc1 = ColumnParallelLinear(in_features,
-                                        hidden_features,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.fc1",
-                                        disable_tp=use_data_parallel)
+        self.fc1 = ColumnParallelLinear(
+            in_features,
+            hidden_features,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc1",
+            disable_tp=use_data_parallel,
+        )
         self.act = act_layer()
-        self.fc2 = RowParallelLinear(hidden_features,
-                                     in_features,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.fc2",
-                                     disable_tp=use_data_parallel)
+        self.fc2 = RowParallelLinear(
+            hidden_features,
+            in_features,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc2",
+            disable_tp=use_data_parallel,
+        )
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         x_parallel, _ = self.fc1(x)
@@ -244,15 +273,14 @@ def rotate_half(x: torch.Tensor, interleaved: bool = False) -> torch.Tensor:
         return torch.cat((-x2, x1), dim=-1)
     else:
         x1, x2 = x[..., ::2], x[..., 1::2]
-        return rearrange(torch.stack((-x2, x1), dim=-1),
-                         "... d two -> ... (d two)",
-                         two=2)
+        return rearrange(
+            torch.stack((-x2, x1), dim=-1), "... d two -> ... (d two)", two=2
+        )
 
 
-def apply_rotary_emb_torch(x: torch.Tensor,
-                           cos: torch.Tensor,
-                           sin: torch.Tensor,
-                           interleaved: bool = False) -> torch.Tensor:
+def apply_rotary_emb_torch(
+    x: torch.Tensor, cos: torch.Tensor, sin: torch.Tensor, interleaved: bool = False
+) -> torch.Tensor:
     """
     x: (batch_size, seqlen, nheads, headdim)
     cos, sin: (seqlen, rotary_dim / 2) or (batch_size, seqlen, rotary_dim / 2)
@@ -260,24 +288,22 @@ def apply_rotary_emb_torch(x: torch.Tensor,
     ro_dim = cos.shape[-1] * 2
     assert ro_dim <= x.shape[-1]
     cos = repeat(
-        cos,
-        "... d -> ... 1 (2 d)" if not interleaved else "... d -> ... 1 (d 2)")
+        cos, "... d -> ... 1 (2 d)" if not interleaved else "... d -> ... 1 (d 2)"
+    )
     sin = repeat(
-        sin,
-        "... d -> ... 1 (2 d)" if not interleaved else "... d -> ... 1 (d 2)")
+        sin, "... d -> ... 1 (2 d)" if not interleaved else "... d -> ... 1 (d 2)"
+    )
     return torch.cat(
         [
-            x[..., :ro_dim] * cos +
-            rotate_half(x[..., :ro_dim], interleaved) * sin, x[..., ro_dim:]
+            x[..., :ro_dim] * cos + rotate_half(x[..., :ro_dim], interleaved) * sin,
+            x[..., ro_dim:],
         ],
         dim=-1,
     )
 
 
-def apply_rotary_pos_emb_vision(t: torch.Tensor,
-                                freqs: torch.Tensor) -> torch.Tensor:
-    rotary_emb_function = dispatch_rotary_emb_function(
-        default=apply_rotary_emb_torch)
+def apply_rotary_pos_emb_vision(t: torch.Tensor, freqs: torch.Tensor) -> torch.Tensor:
+    rotary_emb_function = dispatch_rotary_emb_function(default=apply_rotary_emb_torch)
     t_ = t.float()
     cos = freqs.cos()
     sin = freqs.sin()
@@ -286,7 +312,6 @@ def apply_rotary_pos_emb_vision(t: torch.Tensor,
 
 
 class Qwen2VisionAttention(nn.Module):
-
     def __init__(
         self,
         embed_dim: int,
@@ -298,46 +323,61 @@ def __init__(
     ) -> None:
         super().__init__()
         # Per attention head and per partition values.
-        self.tp_size = (1 if use_data_parallel else
-                        parallel_state.get_tensor_model_parallel_world_size())
+        self.tp_size = (
+            1
+            if use_data_parallel
+            else parallel_state.get_tensor_model_parallel_world_size()
+        )
         self.tp_rank = parallel_state.get_tensor_model_parallel_rank()
         self.hidden_size_per_attention_head = dist_utils.divide(
-            projection_size, num_heads)
+            projection_size, num_heads
+        )
         self.num_attention_heads_per_partition = dist_utils.divide(
-            num_heads, self.tp_size)
-
-        self.qkv = ColumnParallelLinear(input_size=embed_dim,
-                                        output_size=3 * projection_size,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.qkv",
-                                        disable_tp=use_data_parallel)
-        self.proj = RowParallelLinear(input_size=projection_size,
-                                      output_size=embed_dim,
-                                      quant_config=quant_config,
-                                      prefix=f"{prefix}.proj",
-                                      disable_tp=use_data_parallel)
+            num_heads, self.tp_size
+        )
+
+        self.qkv = ColumnParallelLinear(
+            input_size=embed_dim,
+            output_size=3 * projection_size,
+            quant_config=quant_config,
+            prefix=f"{prefix}.qkv",
+            disable_tp=use_data_parallel,
+        )
+        self.proj = RowParallelLinear(
+            input_size=projection_size,
+            output_size=embed_dim,
+            quant_config=quant_config,
+            prefix=f"{prefix}.proj",
+            disable_tp=use_data_parallel,
+        )
 
         # Detect attention implementation.
         self.attn_backend = get_vit_attn_backend(
             head_size=self.hidden_size_per_attention_head,
-            dtype=torch.get_default_dtype())
+            dtype=torch.get_default_dtype(),
+        )
         self.use_upstream_fa = False
 
-        self.attn_backend, self.flash_attn_varlen_func \
-            = maybe_get_vit_flash_attn_backend(
+        self.attn_backend, self.flash_attn_varlen_func = (
+            maybe_get_vit_flash_attn_backend(
                 self.attn_backend,
                 self.use_upstream_fa,
             )
+        )
 
         if self.attn_backend not in {
-                _Backend.FLASH_ATTN, _Backend.TORCH_SDPA, _Backend.XFORMERS,
-                _Backend.ROCM_AITER_FA
+            _Backend.FLASH_ATTN,
+            _Backend.TORCH_SDPA,
+            _Backend.XFORMERS,
+            _Backend.ROCM_AITER_FA,
         }:
             raise RuntimeError(
-                f"Qwen2-VL does not support {self.attn_backend} backend now.")
+                f"Qwen2-VL does not support {self.attn_backend} backend now."
+            )
 
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA
+            _Backend.FLASH_ATTN,
+            _Backend.ROCM_AITER_FA,
         }
 
     def split_qkv(self, qkv: torch.Tensor) -> tuple[torch.Tensor, ...]:
@@ -351,27 +391,31 @@ def split_qkv(self, qkv: torch.Tensor) -> tuple[torch.Tensor, ...]:
 
         # 3 * [s, b, head * head_dim]
         if self.tp_size > 1:
-            splitter = partial(dist_utils.split_tensor_along_last_dim,
-                               num_partitions=self.tp_size)
+            splitter = partial(
+                dist_utils.split_tensor_along_last_dim, num_partitions=self.tp_size
+            )
             q = splitter(q)[self.tp_rank]
             k = splitter(k)[self.tp_rank]
             v = splitter(v)[self.tp_rank]
 
         # 3 * [s, b, head * head_dim] -> 3 * [s, b, head, head_dim]
-        new_shape = (seq_len, bs, self.num_attention_heads_per_partition,
-                     self.hidden_size_per_attention_head)
+        new_shape = (
+            seq_len,
+            bs,
+            self.num_attention_heads_per_partition,
+            self.hidden_size_per_attention_head,
+        )
         q, k, v = (x.view(*new_shape) for x in (q, k, v))
         return q, k, v
 
     def forward(
-            self,
-            x: torch.Tensor,
-            cu_seqlens: torch.Tensor,
-            rotary_pos_emb: torch.Tensor,
-            max_seqlen: Optional[int] = None,  # Only used for Flash Attention
-            seqlens: Optional[list[int]] = None,  # Only used for xFormers
+        self,
+        x: torch.Tensor,
+        cu_seqlens: torch.Tensor,
+        rotary_pos_emb: torch.Tensor,
+        max_seqlen: Optional[int] = None,  # Only used for Flash Attention
+        seqlens: Optional[list[int]] = None,  # Only used for xFormers
     ) -> torch.Tensor:
-
         # [s, b, c] --> [s, b, 3 * head * head_dim]
         x, _ = self.qkv(x)
 
@@ -379,8 +423,7 @@ def forward(
         q, k, v = self.split_qkv(x)
         batch_size = q.shape[1]
 
-        q, k, v = (rearrange(x, "s b ... -> b s ...").contiguous()
-                   for x in (q, k, v))
+        q, k, v = (rearrange(x, "s b ... -> b s ...").contiguous() for x in (q, k, v))
         if rotary_pos_emb is not None:
             # [2 * b, s, heads, head_dim]
             qk_concat = torch.cat([q, k], dim=0)
@@ -388,22 +431,23 @@ def forward(
             q, k = torch.chunk(qk_rotated, 2, dim=0)
 
         if self.is_flash_attn_backend:
-
             q, k, v = (rearrange(x, "b s ... -> (b s) ...") for x in [q, k, v])
 
-            output = self.flash_attn_varlen_func(q,
-                                                 k,
-                                                 v,
-                                                 cu_seqlens_q=cu_seqlens,
-                                                 cu_seqlens_k=cu_seqlens,
-                                                 max_seqlen_q=max_seqlen,
-                                                 max_seqlen_k=max_seqlen,
-                                                 dropout_p=0.0,
-                                                 causal=False)
-
-            context_layer = rearrange(output,
-                                      "(b s) h d -> s b (h d)",
-                                      b=batch_size).contiguous()
+            output = self.flash_attn_varlen_func(
+                q,
+                k,
+                v,
+                cu_seqlens_q=cu_seqlens,
+                cu_seqlens_k=cu_seqlens,
+                max_seqlen_q=max_seqlen,
+                max_seqlen_k=max_seqlen,
+                dropout_p=0.0,
+                causal=False,
+            )
+
+            context_layer = rearrange(
+                output, "(b s) h d -> s b (h d)", b=batch_size
+            ).contiguous()
         elif self.attn_backend == _Backend.TORCH_SDPA:
             # Execute attention entry by entry for speed & less VRAM.
             outputs = []
@@ -413,36 +457,36 @@ def forward(
                 q_i = q[:, start_idx:end_idx]
                 k_i = k[:, start_idx:end_idx]
                 v_i = v[:, start_idx:end_idx]
-                q_i, k_i, v_i = (rearrange(x, "b s h d -> b h s d")
-                                 for x in [q_i, k_i, v_i])
-                output_i = F.scaled_dot_product_attention(q_i,
-                                                          k_i,
-                                                          v_i,
-                                                          dropout_p=0.0)
+                q_i, k_i, v_i = (
+                    rearrange(x, "b s h d -> b h s d") for x in [q_i, k_i, v_i]
+                )
+                output_i = F.scaled_dot_product_attention(q_i, k_i, v_i, dropout_p=0.0)
                 output_i = rearrange(output_i, "b h s d -> b s h d ")
                 outputs.append(output_i)
             context_layer = torch.cat(outputs, dim=1)
-            context_layer = rearrange(context_layer,
-                                      "b s h d -> s b (h d)").contiguous()
+            context_layer = rearrange(
+                context_layer, "b s h d -> s b (h d)"
+            ).contiguous()
         elif self.attn_backend == _Backend.XFORMERS:
             from xformers import ops as xops
             from xformers.ops.fmha.attn_bias import BlockDiagonalMask
 
-            attn_bias = BlockDiagonalMask.from_seqlens(q_seqlen=seqlens,
-                                                       kv_seqlen=None,
-                                                       device=q.device)
+            attn_bias = BlockDiagonalMask.from_seqlens(
+                q_seqlen=seqlens, kv_seqlen=None, device=q.device
+            )
 
             context_layer = xops.memory_efficient_attention_forward(
-                q, k, v, attn_bias=attn_bias, p=0, scale=None)
-            context_layer = rearrange(context_layer,
-                                      "b s h d -> s b (h d)").contiguous()
+                q, k, v, attn_bias=attn_bias, p=0, scale=None
+            )
+            context_layer = rearrange(
+                context_layer, "b s h d -> s b (h d)"
+            ).contiguous()
 
         output, _ = self.proj(context_layer)
         return output
 
 
 class Qwen2VisionBlock(nn.Module):
-
     def __init__(
         self,
         dim: int,
@@ -461,26 +505,30 @@ def __init__(
         self.norm2 = norm_layer(dim)
         mlp_hidden_dim = int(dim * mlp_ratio)
 
-        self.attn = Qwen2VisionAttention(embed_dim=dim,
-                                         num_heads=num_heads,
-                                         projection_size=dim,
-                                         quant_config=quant_config,
-                                         prefix=f"{prefix}.attn",
-                                         use_data_parallel=use_data_parallel)
-        self.mlp = Qwen2VisionMLP(dim,
-                                  mlp_hidden_dim,
-                                  act_layer=act_layer,
-                                  quant_config=quant_config,
-                                  prefix=f"{prefix}.mlp",
-                                  use_data_parallel=use_data_parallel)
+        self.attn = Qwen2VisionAttention(
+            embed_dim=dim,
+            num_heads=num_heads,
+            projection_size=dim,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+            use_data_parallel=use_data_parallel,
+        )
+        self.mlp = Qwen2VisionMLP(
+            dim,
+            mlp_hidden_dim,
+            act_layer=act_layer,
+            quant_config=quant_config,
+            prefix=f"{prefix}.mlp",
+            use_data_parallel=use_data_parallel,
+        )
 
     def forward(
-            self,
-            x: torch.Tensor,
-            cu_seqlens: torch.Tensor,
-            rotary_pos_emb: torch.Tensor,
-            max_seqlen: Optional[int] = None,  # Only used for Flash Attention
-            seqlens: Optional[list[int]] = None,  # Only used for xFormers
+        self,
+        x: torch.Tensor,
+        cu_seqlens: torch.Tensor,
+        rotary_pos_emb: torch.Tensor,
+        max_seqlen: Optional[int] = None,  # Only used for Flash Attention
+        seqlens: Optional[list[int]] = None,  # Only used for xFormers
     ) -> torch.Tensor:
         x = x + self.attn(
             self.norm1(x),
@@ -495,7 +543,6 @@ def forward(
 
 
 class Qwen2VisionPatchEmbed(nn.Module):
-
     def __init__(
         self,
         patch_size: int = 14,
@@ -509,22 +556,22 @@ def __init__(
         self.embed_dim = embed_dim
 
         kernel_size = (temporal_patch_size, patch_size, patch_size)
-        self.proj = nn.Conv3d(in_channels,
-                              embed_dim,
-                              kernel_size=kernel_size,
-                              stride=kernel_size,
-                              bias=False)
+        self.proj = nn.Conv3d(
+            in_channels,
+            embed_dim,
+            kernel_size=kernel_size,
+            stride=kernel_size,
+            bias=False,
+        )
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         L, C = x.shape
-        x = x.view(L, -1, self.temporal_patch_size, self.patch_size,
-                   self.patch_size)
+        x = x.view(L, -1, self.temporal_patch_size, self.patch_size, self.patch_size)
         x = self.proj(x).view(L, self.embed_dim)
         return x
 
 
 class Qwen2VisionPatchMerger(nn.Module):
-
     def __init__(
         self,
         d_model: int,
@@ -540,21 +587,27 @@ def __init__(
         if norm_layer is None:
             norm_layer = partial(nn.LayerNorm, eps=1e-6)
         self.ln_q = norm_layer(context_dim)
-        self.mlp = nn.ModuleList([
-            ColumnParallelLinear(self.hidden_size,
-                                 self.hidden_size,
-                                 bias=True,
-                                 quant_config=quant_config,
-                                 prefix=f"{prefix}.mlp.0",
-                                 disable_tp=use_data_parallel),
-            nn.GELU(),
-            RowParallelLinear(self.hidden_size,
-                              d_model,
-                              bias=True,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.mlp.2",
-                              disable_tp=use_data_parallel),
-        ])
+        self.mlp = nn.ModuleList(
+            [
+                ColumnParallelLinear(
+                    self.hidden_size,
+                    self.hidden_size,
+                    bias=True,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.mlp.0",
+                    disable_tp=use_data_parallel,
+                ),
+                nn.GELU(),
+                RowParallelLinear(
+                    self.hidden_size,
+                    d_model,
+                    bias=True,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.mlp.2",
+                    disable_tp=use_data_parallel,
+                ),
+            ]
+        )
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         x = self.ln_q(x)
@@ -568,13 +621,11 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class Qwen2VisionRotaryEmbedding(nn.Module):
-
     def __init__(self, dim: int, theta: float = 10000.0) -> None:
         super().__init__()
         self.dim = dim
         self.theta = theta
-        inv_freq = 1.0 / (theta
-                          **(torch.arange(0, dim, 2, dtype=torch.float) / dim))
+        inv_freq = 1.0 / (theta ** (torch.arange(0, dim, 2, dtype=torch.float) / dim))
         self.register_buffer("inv_freq", inv_freq, persistent=False)
         self._seq_len_cached = 0
         self._freqs_cached = None
@@ -583,12 +634,18 @@ def update_freqs_cache(self, seqlen: int) -> None:
         if seqlen > self._seq_len_cached:
             seqlen *= 2
             self._seq_len_cached = seqlen
-            self.inv_freq = 1.0 / (self.theta**(torch.arange(
-                0, self.dim, 2, dtype=torch.float, device=self.inv_freq.device)
-                                                / self.dim))
-            seq = torch.arange(seqlen,
-                               device=self.inv_freq.device,
-                               dtype=self.inv_freq.dtype)
+            self.inv_freq = 1.0 / (
+                self.theta
+                ** (
+                    torch.arange(
+                        0, self.dim, 2, dtype=torch.float, device=self.inv_freq.device
+                    )
+                    / self.dim
+                )
+            )
+            seq = torch.arange(
+                seqlen, device=self.inv_freq.device, dtype=self.inv_freq.dtype
+            )
             freqs = torch.outer(seq, self.inv_freq)
             self._freqs_cached = freqs
 
@@ -598,7 +655,6 @@ def forward(self, seqlen: int) -> torch.Tensor:
 
 
 class Qwen2VisionTransformer(nn.Module):
-
     def __init__(
         self,
         vision_config: Qwen2VLVisionConfig,
@@ -637,16 +693,20 @@ def __init__(
         head_dim = embed_dim // num_heads
         self.rotary_pos_emb = Qwen2VisionRotaryEmbedding(head_dim // 2)
 
-        self.blocks = nn.ModuleList([
-            Qwen2VisionBlock(dim=embed_dim,
-                             num_heads=num_heads,
-                             mlp_ratio=mlp_ratio,
-                             norm_layer=norm_layer,
-                             quant_config=quant_config,
-                             prefix=f"{prefix}.blocks.{layer_idx}",
-                             use_data_parallel=use_data_parallel)
-            for layer_idx in range(depth)
-        ])
+        self.blocks = nn.ModuleList(
+            [
+                Qwen2VisionBlock(
+                    dim=embed_dim,
+                    num_heads=num_heads,
+                    mlp_ratio=mlp_ratio,
+                    norm_layer=norm_layer,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.blocks.{layer_idx}",
+                    use_data_parallel=use_data_parallel,
+                )
+                for layer_idx in range(depth)
+            ]
+        )
         self.merger = Qwen2VisionPatchMerger(
             d_model=hidden_size,
             context_dim=embed_dim,
@@ -656,10 +716,11 @@ def __init__(
             use_data_parallel=use_data_parallel,
         )
         self.attn_backend = get_vit_attn_backend(
-            head_size=head_dim, dtype=torch.get_default_dtype())
-        if self.attn_backend != _Backend.FLASH_ATTN and \
-            check_upstream_fa_availability(
-                torch.get_default_dtype()):
+            head_size=head_dim, dtype=torch.get_default_dtype()
+        )
+        if self.attn_backend != _Backend.FLASH_ATTN and check_upstream_fa_availability(
+            torch.get_default_dtype()
+        ):
             self.attn_backend = _Backend.FLASH_ATTN
 
     @property
@@ -676,20 +737,27 @@ def rot_pos_emb(self, grid_thw: list[list[int]]) -> torch.Tensor:
         for t, h, w in grid_thw:
             hpos_ids = torch.arange(h).unsqueeze(1).expand(-1, w)
             wpos_ids = torch.arange(w).unsqueeze(0).expand(h, -1)
-            hpos_ids = hpos_ids.reshape(
-                h // self.spatial_merge_size,
-                self.spatial_merge_size,
-                w // self.spatial_merge_size,
-                self.spatial_merge_size,
-            ).permute(0, 2, 1, 3).flatten()
-            wpos_ids = wpos_ids.reshape(
-                h // self.spatial_merge_size,
-                self.spatial_merge_size,
-                w // self.spatial_merge_size,
-                self.spatial_merge_size,
-            ).permute(0, 2, 1, 3).flatten()
-            pos_ids.append(
-                torch.stack([hpos_ids, wpos_ids], dim=-1).repeat(t, 1))
+            hpos_ids = (
+                hpos_ids.reshape(
+                    h // self.spatial_merge_size,
+                    self.spatial_merge_size,
+                    w // self.spatial_merge_size,
+                    self.spatial_merge_size,
+                )
+                .permute(0, 2, 1, 3)
+                .flatten()
+            )
+            wpos_ids = (
+                wpos_ids.reshape(
+                    h // self.spatial_merge_size,
+                    self.spatial_merge_size,
+                    w // self.spatial_merge_size,
+                    self.spatial_merge_size,
+                )
+                .permute(0, 2, 1, 3)
+                .flatten()
+            )
+            pos_ids.append(torch.stack([hpos_ids, wpos_ids], dim=-1).repeat(t, 1))
             max_grid_size = max(max_grid_size, h, w)
         pos_ids = torch.cat(pos_ids, dim=0)
         rotary_pos_emb_full = self.rotary_pos_emb(max_grid_size)
@@ -697,11 +765,13 @@ def rot_pos_emb(self, grid_thw: list[list[int]]) -> torch.Tensor:
         return rotary_pos_emb
 
     def compute_attn_mask_seqlen(
-            self, cu_seqlens: torch.Tensor
+        self, cu_seqlens: torch.Tensor
     ) -> tuple[Optional[int], Optional[list[int]]]:
         max_seqlen, seqlens = None, None
-        if (self.attn_backend == _Backend.FLASH_ATTN
-                or self.attn_backend == _Backend.ROCM_AITER_FA):
+        if (
+            self.attn_backend == _Backend.FLASH_ATTN
+            or self.attn_backend == _Backend.ROCM_AITER_FA
+        ):
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
         elif self.attn_backend == _Backend.XFORMERS:
             seqlens = (cu_seqlens[1:] - cu_seqlens[:-1]).tolist()
@@ -721,9 +791,9 @@ def forward(
 
         # compute cu_seqlens
         grid_thw_ = torch.tensor(grid_thw, device=x.device, dtype=torch.long)
-        cu_seqlens = torch.repeat_interleave(grid_thw_[:, 1] * grid_thw_[:, 2],
-                                             grid_thw_[:, 0]).cumsum(
-                                                 dim=0, dtype=torch.int32)
+        cu_seqlens = torch.repeat_interleave(
+            grid_thw_[:, 1] * grid_thw_[:, 2], grid_thw_[:, 0]
+        ).cumsum(dim=0, dtype=torch.int32)
         cu_seqlens = F.pad(cu_seqlens, (1, 0), "constant", 0)
 
         # transformers
@@ -745,8 +815,7 @@ def forward(
 
         return x
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -757,7 +826,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         loaded_params: set[str] = set()
 
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -768,41 +837,45 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 def _create_qwen2vl_field_factory(
-    spatial_merge_size: int
+    spatial_merge_size: int,
 ) -> Callable[
     [Mapping[str, torch.Tensor]],
-        Mapping[str, MultiModalFieldConfig],
+    Mapping[str, MultiModalFieldConfig],
 ]:
-
     def _qwen2vl_field_config(hf_inputs: Mapping[str, torch.Tensor]):
         image_grid_thw = hf_inputs.get("image_grid_thw", torch.empty((0, 3)))
         image_pixel_grid_sizes = image_grid_thw.prod(-1)
-        image_embed_grid_sizes = (image_pixel_grid_sizes //
-                                  spatial_merge_size // spatial_merge_size)
+        image_embed_grid_sizes = (
+            image_pixel_grid_sizes // spatial_merge_size // spatial_merge_size
+        )
 
         video_grid_thw = hf_inputs.get("video_grid_thw", torch.empty((0, 3)))
         video_grid_sizes = video_grid_thw.prod(-1)
-        video_embed_grid_sizes = (video_grid_sizes // spatial_merge_size //
-                                  spatial_merge_size)
+        video_embed_grid_sizes = (
+            video_grid_sizes // spatial_merge_size // spatial_merge_size
+        )
 
         return dict(
             pixel_values=MultiModalFieldConfig.flat_from_sizes(
-                "image", image_pixel_grid_sizes),
+                "image", image_pixel_grid_sizes
+            ),
             image_embeds=MultiModalFieldConfig.flat_from_sizes(
-                "image", image_embed_grid_sizes),
+                "image", image_embed_grid_sizes
+            ),
             image_grid_thw=MultiModalFieldConfig.batched("image"),
             pixel_values_videos=MultiModalFieldConfig.flat_from_sizes(
-                "video", video_grid_sizes),
+                "video", video_grid_sizes
+            ),
             video_embeds=MultiModalFieldConfig.flat_from_sizes(
-                "video", video_embed_grid_sizes),
+                "video", video_embed_grid_sizes
+            ),
             video_grid_thw=MultiModalFieldConfig.batched("video"),
         )
 
@@ -810,7 +883,6 @@ def _qwen2vl_field_config(hf_inputs: Mapping[str, torch.Tensor]):
 
 
 class Qwen2VLMultiModalDataParser(MultiModalDataParser):
-
     def __init__(self, spatial_merge_size: int, *args, **kwargs):
         self._spatial_merge_size = spatial_merge_size
         super().__init__(*args, **kwargs)
@@ -824,8 +896,7 @@ def _parse_image_data(
                 data,
                 modality="image",
                 required_fields={"image_embeds", "image_grid_thw"},
-                fields_factory=_create_qwen2vl_field_factory(
-                    self._spatial_merge_size),
+                fields_factory=_create_qwen2vl_field_factory(self._spatial_merge_size),
             )
 
         return super()._parse_image_data(data)
@@ -839,15 +910,13 @@ def _parse_video_data(
                 data,
                 modality="video",
                 required_fields={"video_embeds", "video_grid_thw"},
-                fields_factory=_create_qwen2vl_field_factory(
-                    self._spatial_merge_size),
+                fields_factory=_create_qwen2vl_field_factory(self._spatial_merge_size),
             )
 
         return super()._parse_video_data(data)
 
 
 class Qwen2VLProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(Qwen2VLConfig)
 
@@ -899,11 +968,9 @@ def _get_vision_info(
                 min_pixels=image_processor.min_pixels,
                 max_pixels=image_processor.max_pixels,
             )
-            preprocessed_size = ImageSize(width=resized_width,
-                                          height=resized_height)
+            preprocessed_size = ImageSize(width=resized_width, height=resized_height)
         else:
-            preprocessed_size = ImageSize(width=image_width,
-                                          height=image_height)
+            preprocessed_size = ImageSize(width=image_width, height=image_height)
 
         # NOTE: Frames are padded to be divisible by `temporal_patch_size`
         # https://github.com/huggingface/transformers/blob/v4.48.3/src/transformers/models/qwen2_vl/image_processing_qwen2_vl.py#L294
@@ -967,9 +1034,7 @@ def get_max_image_tokens(self) -> int:
             image_processor=None,
         )
 
-    def _get_max_video_frames(self,
-                              max_tokens: int,
-                              start_num_frames: int = 1) -> int:
+    def _get_max_video_frames(self, max_tokens: int, start_num_frames: int = 1) -> int:
         target_width, target_height = self.get_image_size_with_most_features()
 
         num_frames = start_num_frames
@@ -999,8 +1064,9 @@ def get_num_frames_with_most_features(
         max_videos = mm_counts.get("video", 0)
 
         max_total_frames = self._get_max_video_frames(seq_len)
-        max_frames_per_video = min(max_total_frames // max(max_videos, 1),
-                                   max_frames_per_video)
+        max_frames_per_video = min(
+            max_total_frames // max(max_videos, 1), max_frames_per_video
+        )
 
         return max(max_frames_per_video, 1)
 
@@ -1014,14 +1080,12 @@ def get_max_video_tokens(
         return self.get_num_video_tokens(
             image_width=target_width,
             image_height=target_height,
-            num_frames=self.get_num_frames_with_most_features(
-                seq_len, mm_counts),
+            num_frames=self.get_num_frames_with_most_features(seq_len, mm_counts),
             image_processor=None,
         )
 
 
 class Qwen2VLDummyInputsBuilder(BaseDummyInputsBuilder[Qwen2VLProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -1041,37 +1105,36 @@ def get_dummy_mm_data(
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
 
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
-        target_num_frames = \
-            self.info.get_num_frames_with_most_features(seq_len, mm_counts)
+        target_width, target_height = self.info.get_image_size_with_most_features()
+        target_num_frames = self.info.get_num_frames_with_most_features(
+            seq_len, mm_counts
+        )
 
         image_overrides = mm_options.get("image") if mm_options else None
         video_overrides = mm_options.get("video") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
-            "video":
-            self._get_dummy_videos(
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
+            "video": self._get_dummy_videos(
                 width=target_width,
                 height=target_height,
                 num_frames=target_num_frames,
                 num_videos=num_videos,
                 overrides=video_overrides,
-            )
+            ),
         }
 
 
-class Qwen2VLMultiModalProcessor(BaseMultiModalProcessor[Qwen2VLProcessingInfo]
-                                 ):
-
+class Qwen2VLMultiModalProcessor(BaseMultiModalProcessor[Qwen2VLProcessingInfo]):
     def _get_data_parser(self) -> MultiModalDataParser:
         return Qwen2VLMultiModalDataParser(
-            self.info.get_hf_config().vision_config.spatial_merge_size)
+            self.info.get_hf_config().vision_config.spatial_merge_size
+        )
 
     def _get_prompt_updates(
         self,
@@ -1080,8 +1143,7 @@ def _get_prompt_updates(
         out_mm_kwargs: MultiModalKwargsItems,
     ) -> Sequence[PromptUpdate]:
         hf_processor = self.info.get_hf_processor(**hf_processor_mm_kwargs)
-        image_processor = self.info.get_image_processor(
-            **hf_processor_mm_kwargs)
+        image_processor = self.info.get_image_processor(**hf_processor_mm_kwargs)
         tokenizer = self.info.get_tokenizer()
         vocab = tokenizer.get_vocab()
 
@@ -1104,9 +1166,9 @@ def get_replacement_qwen2vl(item_idx: int, modality: str):
             PromptReplacement(
                 modality=modality,
                 target=[placeholder[modality]],
-                replacement=partial(get_replacement_qwen2vl,
-                                    modality=modality),
-            ) for modality in ("image", "video")
+                replacement=partial(get_replacement_qwen2vl, modality=modality),
+            )
+            for modality in ("image", "video")
         ]
 
     def _get_mm_fields_config(
@@ -1115,16 +1177,18 @@ def _get_mm_fields_config(
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
         return _create_qwen2vl_field_factory(
-            self.info.get_hf_config().vision_config.spatial_merge_size)(
-                hf_inputs)
-
-
-@MULTIMODAL_REGISTRY.register_processor(Qwen2VLMultiModalProcessor,
-                                        info=Qwen2VLProcessingInfo,
-                                        dummy_inputs=Qwen2VLDummyInputsBuilder)
-class Qwen2VLForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                      SupportsLoRA, SupportsPP, SupportsMRoPE):
-
+            self.info.get_hf_config().vision_config.spatial_merge_size
+        )(hf_inputs)
+
+
+@MULTIMODAL_REGISTRY.register_processor(
+    Qwen2VLMultiModalProcessor,
+    info=Qwen2VLProcessingInfo,
+    dummy_inputs=Qwen2VLDummyInputsBuilder,
+)
+class Qwen2VLForConditionalGeneration(
+    nn.Module, SupportsMultiModal, SupportsLoRA, SupportsPP, SupportsMRoPE
+):
     # To ensure correct weight loading and mapping.
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_prefix={
@@ -1134,7 +1198,8 @@ class Qwen2VLForConditionalGeneration(nn.Module, SupportsMultiModal,
             # mapping for original checkpoint
             "lm_head.": "language_model.lm_head.",
             "model.": "language_model.model.",
-        })
+        }
+    )
 
     supports_encoder_tp_data = True
 
@@ -1162,12 +1227,12 @@ def get_mrope_input_positions(
         video_token_id = hf_config.video_token_id
         vision_start_token_id = hf_config.vision_start_token_id
         spatial_merge_size = hf_config.vision_config.spatial_merge_size
-        tokens_per_second = getattr(hf_config.vision_config,
-                                    "tokens_per_second", 1.0)
+        tokens_per_second = getattr(hf_config.vision_config, "tokens_per_second", 1.0)
 
         input_tokens_tensor = torch.tensor(input_tokens)
         vision_start_indices = torch.argwhere(
-            input_tokens_tensor == vision_start_token_id).squeeze(1)
+            input_tokens_tensor == vision_start_token_id
+        ).squeeze(1)
         vision_tokens = input_tokens_tensor[vision_start_indices + 1]
         image_nums = (vision_tokens == image_token_id).sum()
         video_nums = (vision_tokens == video_token_id).sum()
@@ -1215,37 +1280,56 @@ def get_mrope_input_positions(
                 remain_videos -= 1
                 ed = ed_video
 
-            llm_grid_t, llm_grid_h, llm_grid_w = \
-                t, h // spatial_merge_size, w // spatial_merge_size
+            llm_grid_t, llm_grid_h, llm_grid_w = (
+                t,
+                h // spatial_merge_size,
+                w // spatial_merge_size,
+            )
             text_len = ed - st
 
-            st_idx = llm_pos_ids_list[-1].max() + 1 if len(
-                llm_pos_ids_list) > 0 else 0
+            st_idx = llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
             llm_pos_ids_list.append(
-                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx)
+                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx
+            )
 
-            t_index = (torch.arange(llm_grid_t).view(-1, 1).expand(
-                -1, llm_grid_h * llm_grid_w) * video_second_per_grid_t *
-                       tokens_per_second).long().flatten()
+            t_index = (
+                (
+                    torch.arange(llm_grid_t)
+                    .view(-1, 1)
+                    .expand(-1, llm_grid_h * llm_grid_w)
+                    * video_second_per_grid_t
+                    * tokens_per_second
+                )
+                .long()
+                .flatten()
+            )
 
-            h_index = torch.arange(llm_grid_h).view(1, -1, 1).expand(
-                llm_grid_t, -1, llm_grid_w).flatten()
-            w_index = torch.arange(llm_grid_w).view(1, 1, -1).expand(
-                llm_grid_t, llm_grid_h, -1).flatten()
+            h_index = (
+                torch.arange(llm_grid_h)
+                .view(1, -1, 1)
+                .expand(llm_grid_t, -1, llm_grid_w)
+                .flatten()
+            )
+            w_index = (
+                torch.arange(llm_grid_w)
+                .view(1, 1, -1)
+                .expand(llm_grid_t, llm_grid_h, -1)
+                .flatten()
+            )
             llm_pos_ids_list.append(
-                torch.stack([t_index, h_index, w_index]) + text_len + st_idx)
+                torch.stack([t_index, h_index, w_index]) + text_len + st_idx
+            )
             st = ed + llm_grid_t * llm_grid_h * llm_grid_w
 
         if st < len(input_tokens):
-            st_idx = llm_pos_ids_list[-1].max() + 1 if len(
-                llm_pos_ids_list) > 0 else 0
+            st_idx = llm_pos_ids_list[-1].max() + 1 if len(llm_pos_ids_list) > 0 else 0
             text_len = len(input_tokens) - st
             llm_pos_ids_list.append(
-                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx)
+                torch.arange(text_len).view(1, -1).expand(3, -1) + st_idx
+            )
 
         llm_positions = torch.cat(llm_pos_ids_list, dim=1).reshape(3, -1)
-        mrope_position_delta = (llm_positions.max() + 1 -
-                                len(input_tokens)).item()
+        mrope_position_delta = (llm_positions.max() + 1 - len(input_tokens)).item()
         llm_positions = llm_positions[:, context_len:seq_len]
 
         return llm_positions, mrope_position_delta
@@ -1269,8 +1353,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.config = config
         self.multimodal_config = multimodal_config
 
-        if multimodal_config.get_limit_per_prompt("image") or \
-            multimodal_config.get_limit_per_prompt("video"):
+        if multimodal_config.get_limit_per_prompt(
+            "image"
+        ) or multimodal_config.get_limit_per_prompt("video"):
             self.visual = Qwen2VisionTransformer(
                 config.vision_config,
                 norm_eps=getattr(config, "rms_norm_eps", 1e-6),
@@ -1288,26 +1373,30 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
-    def _validate_and_reshape_mm_tensor(self, mm_input: object,
-                                        name: str) -> torch.Tensor:
+    def _validate_and_reshape_mm_tensor(
+        self, mm_input: object, name: str
+    ) -> torch.Tensor:
         if not isinstance(mm_input, (torch.Tensor, list)):
-            raise ValueError(f"Incorrect type of {name}. "
-                             f"Got type: {type(mm_input)}")
+            raise ValueError(f"Incorrect type of {name}. Got type: {type(mm_input)}")
         if isinstance(mm_input, torch.Tensor):
             if mm_input.ndim == 2:
                 return mm_input
             if mm_input.ndim != 3:
-                raise ValueError(f"{name} should be 2D or batched 3D tensor. "
-                                 f"Got ndim: {mm_input.ndim} "
-                                 f"(shape={mm_input.shape})")
+                raise ValueError(
+                    f"{name} should be 2D or batched 3D tensor. "
+                    f"Got ndim: {mm_input.ndim} "
+                    f"(shape={mm_input.shape})"
+                )
             return mm_input.reshape(-1, mm_input.shape[-1])
         else:
             return torch.concat(mm_input)
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[Qwen2VLImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[Qwen2VLImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_embeds = kwargs.pop("image_embeds", None)
         image_grid_thw = kwargs.pop("image_grid_thw", None)
@@ -1317,26 +1406,35 @@ def _parse_and_validate_image_input(
 
         if pixel_values is not None:
             pixel_values = self._validate_and_reshape_mm_tensor(
-                pixel_values, "image pixel values")
+                pixel_values, "image pixel values"
+            )
             image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, "image grid_thw")
+                image_grid_thw, "image grid_thw"
+            )
 
-            return Qwen2VLImagePixelInputs(type="pixel_values",
-                                           pixel_values=pixel_values,
-                                           image_grid_thw=image_grid_thw)
+            return Qwen2VLImagePixelInputs(
+                type="pixel_values",
+                pixel_values=pixel_values,
+                image_grid_thw=image_grid_thw,
+            )
 
         if image_embeds is not None:
             image_embeds = self._validate_and_reshape_mm_tensor(
-                image_embeds, "image embeds")
+                image_embeds, "image embeds"
+            )
             image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, "image grid_thw")
+                image_grid_thw, "image grid_thw"
+            )
 
-            return Qwen2VLImageEmbeddingInputs(type="image_embeds",
-                                               image_embeds=image_embeds,
-                                               image_grid_thw=image_grid_thw)
+            return Qwen2VLImageEmbeddingInputs(
+                type="image_embeds",
+                image_embeds=image_embeds,
+                image_grid_thw=image_grid_thw,
+            )
 
     def _parse_and_validate_video_input(
-            self, **kwargs: object) -> Optional[Qwen2VLVideoInputs]:
+        self, **kwargs: object
+    ) -> Optional[Qwen2VLVideoInputs]:
         pixel_values_videos = kwargs.pop("pixel_values_videos", None)
         video_embeds = kwargs.pop("video_embeds", None)
         video_grid_thw = kwargs.pop("video_grid_thw", None)
@@ -1346,9 +1444,11 @@ def _parse_and_validate_video_input(
 
         if pixel_values_videos is not None:
             pixel_values_videos = self._validate_and_reshape_mm_tensor(
-                pixel_values_videos, "video pixel values")
+                pixel_values_videos, "video pixel values"
+            )
             video_grid_thw = self._validate_and_reshape_mm_tensor(
-                video_grid_thw, "video grid_thw")
+                video_grid_thw, "video grid_thw"
+            )
 
             return Qwen2VLVideoPixelInputs(
                 type="pixel_values_videos",
@@ -1358,17 +1458,21 @@ def _parse_and_validate_video_input(
 
         if video_embeds is not None:
             video_embeds = self._validate_and_reshape_mm_tensor(
-                video_embeds, "video embeds")
+                video_embeds, "video embeds"
+            )
             video_grid_thw = self._validate_and_reshape_mm_tensor(
-                video_grid_thw, "video grid_thw")
+                video_grid_thw, "video grid_thw"
+            )
 
-            return Qwen2VLVideoEmbeddingInputs(type="video_embeds",
-                                               video_embeds=video_embeds,
-                                               video_grid_thw=video_grid_thw)
+            return Qwen2VLVideoEmbeddingInputs(
+                type="video_embeds",
+                video_embeds=video_embeds,
+                video_grid_thw=video_grid_thw,
+            )
 
     def _process_image_input(
-            self, image_input: Qwen2VLImageInputs) -> tuple[torch.Tensor, ...]:
-
+        self, image_input: Qwen2VLImageInputs
+    ) -> tuple[torch.Tensor, ...]:
         grid_thw = image_input["image_grid_thw"]
         assert grid_thw.ndim == 2
         grid_thw_list = grid_thw.tolist()
@@ -1379,24 +1483,24 @@ def _process_image_input(
             pixel_values = image_input["pixel_values"]
 
             if self.use_data_parallel:
-                return run_dp_sharded_mrope_vision_model(self.visual,
-                                                         pixel_values,
-                                                         grid_thw_list,
-                                                         rope_type="rope_3d")
+                return run_dp_sharded_mrope_vision_model(
+                    self.visual, pixel_values, grid_thw_list, rope_type="rope_3d"
+                )
             else:
-                image_embeds = self.visual(pixel_values,
-                                           grid_thw=grid_thw_list)
+                image_embeds = self.visual(pixel_values, grid_thw=grid_thw_list)
 
         # Split concatenated embeddings for each image item.
         merge_size = self.visual.spatial_merge_size
-        sizes = (torch.tensor(grid_thw_list, dtype=torch.long).prod(-1) //
-                 (merge_size * merge_size)).tolist()
+        sizes = (
+            torch.tensor(grid_thw_list, dtype=torch.long).prod(-1)
+            // (merge_size * merge_size)
+        ).tolist()
 
         return image_embeds.split(sizes)
 
     def _process_video_input(
-            self, video_input: Qwen2VLVideoInputs) -> tuple[torch.Tensor, ...]:
-
+        self, video_input: Qwen2VLVideoInputs
+    ) -> tuple[torch.Tensor, ...]:
         grid_thw = video_input["video_grid_thw"]
         assert grid_thw.ndim == 2
         grid_thw_list = grid_thw.tolist()
@@ -1406,18 +1510,18 @@ def _process_video_input(
         else:
             pixel_values_videos = video_input["pixel_values_videos"]
             if self.use_data_parallel:
-                return run_dp_sharded_mrope_vision_model(self.visual,
-                                                         pixel_values_videos,
-                                                         grid_thw_list,
-                                                         rope_type="rope_3d")
+                return run_dp_sharded_mrope_vision_model(
+                    self.visual, pixel_values_videos, grid_thw_list, rope_type="rope_3d"
+                )
             else:
-                video_embeds = self.visual(pixel_values_videos,
-                                           grid_thw=grid_thw_list)
+                video_embeds = self.visual(pixel_values_videos, grid_thw=grid_thw_list)
 
         # Split concatenated embeddings for each video item.
         merge_size = self.visual.spatial_merge_size
-        sizes = (torch.tensor(grid_thw_list, dtype=torch.long).prod(-1) //
-                 (merge_size * merge_size)).tolist()
+        sizes = (
+            torch.tensor(grid_thw_list, dtype=torch.long).prod(-1)
+            // (merge_size * merge_size)
+        ).tolist()
 
         return video_embeds.split(sizes)
 
@@ -1427,23 +1531,23 @@ def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         # Preserve the order of modalities if there are multiple of them
         # from the order of kwargs.
         for input_key in kwargs:
-            if input_key in ("pixel_values",
-                             "image_embeds") and "images" not in modalities:
-                modalities["images"] = self._parse_and_validate_image_input(
-                    **kwargs)
-            if input_key in ("pixel_values_videos",
-                             "video_embeds") and "videos" not in modalities:
-                modalities["videos"] = self._parse_and_validate_video_input(
-                    **kwargs)
+            if (
+                input_key in ("pixel_values", "image_embeds")
+                and "images" not in modalities
+            ):
+                modalities["images"] = self._parse_and_validate_image_input(**kwargs)
+            if (
+                input_key in ("pixel_values_videos", "video_embeds")
+                and "videos" not in modalities
+            ):
+                modalities["videos"] = self._parse_and_validate_video_input(**kwargs)
 
         return modalities
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
-
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         modalities = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not modalities:
             return []
@@ -1505,9 +1609,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         skip_prefixes = []
         if self.visual is None:
             skip_prefixes.extend(["visual."])
@@ -1530,7 +1632,6 @@ class Tarsier2MultiModalProcessor(Qwen2VLMultiModalProcessor):
 
 
 class Tarsier2ImageProcessor(Qwen2VLImageProcessor):
-
     def __init__(
         self,
         size: Optional[dict[str, int]] = None,
@@ -1540,7 +1641,7 @@ def __init__(
             # Remap if Tarsier2-specific format is provided
             remapped_size = {
                 "shortest_edge": size["min_pixels"],
-                "longest_edge": size["max_pixels"]
+                "longest_edge": size["max_pixels"],
             }
             super().__init__(size=remapped_size, **kwargs)
         else:
@@ -1548,7 +1649,6 @@ def __init__(
 
 
 class Tarsier2Processor(Qwen2VLProcessor):
-
     def __init__(
         self,
         vision_config: dict,
@@ -1561,11 +1661,11 @@ def __init__(
             tokenizer=tokenizer,
             video_processor=Qwen2VLVideoProcessor(**vision_config),
             chat_template=None,
-            **kwargs)
+            **kwargs,
+        )
 
 
 class Tarsier2ProcessingInfo(Qwen2VLProcessingInfo):
-
     def get_hf_config(self) -> Qwen2VLConfig:
         model_path = self.ctx.model_config.model
         original_config = AutoConfig.from_pretrained(model_path)
@@ -1582,17 +1682,20 @@ def get_hf_processor(self, **kwargs: object) -> Tarsier2Processor:
         )
 
     def get_image_processor(self) -> Tarsier2ImageProcessor:
-        return Tarsier2ImageProcessor(
-            **self.ctx.get_hf_image_processor_config())
+        return Tarsier2ImageProcessor(**self.ctx.get_hf_image_processor_config())
 
 
-@MULTIMODAL_REGISTRY.register_processor(Tarsier2MultiModalProcessor,
-                                        info=Tarsier2ProcessingInfo,
-                                        dummy_inputs=Qwen2VLDummyInputsBuilder)
+@MULTIMODAL_REGISTRY.register_processor(
+    Tarsier2MultiModalProcessor,
+    info=Tarsier2ProcessingInfo,
+    dummy_inputs=Qwen2VLDummyInputsBuilder,
+)
 class Tarsier2ForConditionalGeneration(Qwen2VLForConditionalGeneration):
-    hf_to_vllm_mapper = WeightsMapper(orig_to_new_prefix={
-        "vision_tower.": "visual.",
-    })
+    hf_to_vllm_mapper = WeightsMapper(
+        orig_to_new_prefix={
+            "vision_tower.": "visual.",
+        }
+    )
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         # Tarsier2 uses llava as model_type, which will create a Qwen2VLConfig
@@ -1603,9 +1706,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         vllm_config.model_config.hf_config = qwen2vl_config
         super().__init__(vllm_config=vllm_config, prefix=prefix)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         skip_prefixes = []
         if self.visual is None:
             skip_prefixes.extend(["visual."])
diff --git a/vllm/model_executor/models/qwen3.py b/vllm/model_executor/models/qwen3.py
index ae72fd30c399..bcd4968ba5c4 100644
--- a/vllm/model_executor/models/qwen3.py
+++ b/vllm/model_executor/models/qwen3.py
@@ -22,6 +22,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Qwen3 model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from typing import Any, Optional, Union
 
@@ -35,8 +36,7 @@
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.logger import init_logger
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import QKVParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
@@ -46,14 +46,12 @@
 from .interfaces import SupportsEagle3, SupportsLoRA, SupportsPP
 from .qwen2 import Qwen2MLP as Qwen3MLP
 from .qwen2 import Qwen2Model
-from .utils import (AutoWeightsLoader, PPMissingLayer, extract_layer_index,
-                    maybe_prefix)
+from .utils import AutoWeightsLoader, PPMissingLayer, extract_layer_index, maybe_prefix
 
 logger = init_logger(__name__)
 
 
 class Qwen3Attention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -131,7 +129,9 @@ def __init__(
             **{
                 "layer_idx": extract_layer_index(prefix),
                 "dual_chunk_attention_config": dual_chunk_attention_config,
-            } if dual_chunk_attention_config else {},
+            }
+            if dual_chunk_attention_config
+            else {},
         )
         self.q_norm = RMSNorm(self.head_dim, eps=rms_norm_eps)
         self.k_norm = RMSNorm(self.head_dim, eps=rms_norm_eps)
@@ -144,12 +144,10 @@ def forward(
         qkv, _ = self.qkv_proj(hidden_states)
         q, k, v = qkv.split([self.q_size, self.kv_size, self.kv_size], dim=-1)
         # Add qk-norm
-        q_by_head = q.view(*q.shape[:-1], q.shape[-1] // self.head_dim,
-                           self.head_dim)
+        q_by_head = q.view(*q.shape[:-1], q.shape[-1] // self.head_dim, self.head_dim)
         q_by_head = self.q_norm(q_by_head)
         q = q_by_head.view(q.shape)
-        k_by_head = k.view(*k.shape[:-1], k.shape[-1] // self.head_dim,
-                           self.head_dim)
+        k_by_head = k.view(*k.shape[:-1], k.shape[-1] // self.head_dim, self.head_dim)
         k_by_head = self.k_norm(k_by_head)
         k = k_by_head.view(k.shape)
         q, k = self.rotary_emb(positions, q, k)
@@ -159,7 +157,6 @@ def forward(
 
 
 class Qwen3DecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Qwen3Config,
@@ -172,9 +169,9 @@ def __init__(
         # Requires transformers > 4.32.0
         rope_theta = getattr(config, "rope_theta", 1000000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        dual_chunk_attention_config = getattr(config,
-                                              "dual_chunk_attention_config",
-                                              None)
+        dual_chunk_attention_config = getattr(
+            config, "dual_chunk_attention_config", None
+        )
 
         # By default, Qwen3 uses causal attention as it is a decoder-only model.
         # You can override the HF config with `is_causal=False` to enable
@@ -192,8 +189,8 @@ def __init__(
             num_kv_heads=config.num_key_value_heads,
             rope_theta=rope_theta,
             rms_norm_eps=config.rms_norm_eps,
-            qkv_bias=getattr(config, 'attention_bias', False),
-            head_dim=getattr(config, 'head_dim', None),
+            qkv_bias=getattr(config, "attention_bias", False),
+            head_dim=getattr(config, "head_dim", None),
             cache_config=cache_config,
             quant_config=quant_config,
             rope_scaling=rope_scaling,
@@ -208,10 +205,10 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.mlp",
         )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -224,16 +221,14 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
@@ -251,13 +246,13 @@ def forward(
         "positions": -1,
         "intermediate_tensors": 0,
         "inputs_embeds": 0,
-    })
+    }
+)
 class Qwen3Model(Qwen2Model):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
-        super().__init__(vllm_config=vllm_config,
-                         prefix=prefix,
-                         decoder_layer_type=Qwen3DecoderLayer)
+        super().__init__(
+            vllm_config=vllm_config, prefix=prefix, decoder_layer_type=Qwen3DecoderLayer
+        )
 
 
 class Qwen3ForCausalLM(nn.Module, SupportsLoRA, SupportsPP, SupportsEagle3):
@@ -283,25 +278,28 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.lora_config = lora_config
 
         self.quant_config = quant_config
-        self.model = Qwen3Model(vllm_config=vllm_config,
-                                prefix=maybe_prefix(prefix, "model"))
+        self.model = Qwen3Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
         if get_pp_group().is_last_rank:
             if config.tie_word_embeddings:
                 self.lm_head = self.model.embed_tokens
             else:
-                self.lm_head = ParallelLMHead(config.vocab_size,
-                                              config.hidden_size,
-                                              quant_config=quant_config,
-                                              prefix=maybe_prefix(
-                                                  prefix, "lm_head"))
+                self.lm_head = ParallelLMHead(
+                    config.vocab_size,
+                    config.hidden_size,
+                    quant_config=quant_config,
+                    prefix=maybe_prefix(prefix, "lm_head"),
+                )
         else:
             self.lm_head = PPMissingLayer()
 
         self.logits_processor = LogitsProcessor(config.vocab_size)
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def set_aux_hidden_state_layers(self, layers: tuple[int, ...]) -> None:
         self.model.aux_hidden_state_layers = layers
@@ -320,8 +318,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -331,11 +330,9 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/qwen3_moe.py b/vllm/model_executor/models/qwen3_moe.py
index 61f1abad72b6..34b5af846493 100644
--- a/vllm/model_executor/models/qwen3_moe.py
+++ b/vllm/model_executor/models/qwen3_moe.py
@@ -22,6 +22,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Qwen3MoE model compatible with HuggingFace weights."""
+
 import typing
 from collections.abc import Callable, Iterable
 from itertools import islice
@@ -33,38 +34,51 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig, get_current_vllm_config
-from vllm.distributed import (get_ep_group, get_pp_group,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_gather)
+from vllm.distributed import (
+    get_ep_group,
+    get_pp_group,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_gather,
+)
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.model_executor.models.utils import sequence_parallel_chunk
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import MixtureOfExperts, SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, extract_layer_index,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
 
 class Qwen3MoeMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -76,19 +90,24 @@ def __init__(
     ) -> None:
         super().__init__()
         self.gate_up_proj = MergedColumnParallelLinear(
-            hidden_size, [intermediate_size] * 2,
+            hidden_size,
+            [intermediate_size] * 2,
             bias=False,
             quant_config=quant_config,
-            prefix=f"{prefix}.gate_up_proj")
-        self.down_proj = RowParallelLinear(intermediate_size,
-                                           hidden_size,
-                                           bias=False,
-                                           quant_config=quant_config,
-                                           reduce_results=reduce_results,
-                                           prefix=f"{prefix}.down_proj")
+            prefix=f"{prefix}.gate_up_proj",
+        )
+        self.down_proj = RowParallelLinear(
+            intermediate_size,
+            hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            reduce_results=reduce_results,
+            prefix=f"{prefix}.down_proj",
+        )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -99,7 +118,6 @@ def forward(self, x):
 
 
 class Qwen3MoeSparseMoeBlock(nn.Module):
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -123,7 +141,8 @@ def __init__(
         if self.tp_size > config.num_experts:
             raise ValueError(
                 f"Tensor parallel size {self.tp_size} is greater than "
-                f"the number of experts {config.num_experts}.")
+                f"the number of experts {config.num_experts}."
+            )
 
         # Load balancing settings.
         vllm_config = get_current_vllm_config()
@@ -132,36 +151,40 @@ def __init__(
 
         self.n_logical_experts = self.n_routed_experts
         self.n_redundant_experts = eplb_config.num_redundant_experts
-        self.n_physical_experts = (self.n_logical_experts +
-                                   self.n_redundant_experts)
+        self.n_physical_experts = self.n_logical_experts + self.n_redundant_experts
         self.n_local_physical_experts = self.n_physical_experts // self.ep_size
 
-        self.physical_expert_start = (self.ep_rank *
-                                      self.n_local_physical_experts)
-        self.physical_expert_end = (self.physical_expert_start +
-                                    self.n_local_physical_experts)
-
-        self.experts = FusedMoE(num_experts=self.n_routed_experts,
-                                top_k=config.num_experts_per_tok,
-                                hidden_size=config.hidden_size,
-                                intermediate_size=config.moe_intermediate_size,
-                                reduce_results=True,
-                                renormalize=config.norm_topk_prob,
-                                quant_config=quant_config,
-                                prefix=f"{prefix}.experts",
-                                enable_eplb=self.enable_eplb,
-                                num_redundant_experts=self.n_redundant_experts,
-                                is_sequence_parallel=self.is_sequence_parallel)
-
-        self.gate = ReplicatedLinear(config.hidden_size,
-                                     config.num_experts,
-                                     bias=False,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.gate")
+        self.physical_expert_start = self.ep_rank * self.n_local_physical_experts
+        self.physical_expert_end = (
+            self.physical_expert_start + self.n_local_physical_experts
+        )
+
+        self.experts = FusedMoE(
+            num_experts=self.n_routed_experts,
+            top_k=config.num_experts_per_tok,
+            hidden_size=config.hidden_size,
+            intermediate_size=config.moe_intermediate_size,
+            reduce_results=True,
+            renormalize=config.norm_topk_prob,
+            quant_config=quant_config,
+            prefix=f"{prefix}.experts",
+            enable_eplb=self.enable_eplb,
+            num_redundant_experts=self.n_redundant_experts,
+            is_sequence_parallel=self.is_sequence_parallel,
+        )
+
+        self.gate = ReplicatedLinear(
+            config.hidden_size,
+            config.num_experts,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.gate",
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
-        assert hidden_states.dim(
-        ) <= 2, "Qwen3MoeSparseMoeBlock only supports 1D or 2D inputs"
+        assert hidden_states.dim() <= 2, (
+            "Qwen3MoeSparseMoeBlock only supports 1D or 2D inputs"
+        )
         is_input_1d = hidden_states.dim() == 1
         num_tokens, hidden_dim = hidden_states.shape
         hidden_states = hidden_states.view(-1, hidden_dim)
@@ -171,21 +194,21 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
         # router_logits: (num_tokens, n_experts)
         router_logits, _ = self.gate(hidden_states)
-        final_hidden_states = self.experts(hidden_states=hidden_states,
-                                           router_logits=router_logits)
+        final_hidden_states = self.experts(
+            hidden_states=hidden_states, router_logits=router_logits
+        )
 
         if self.is_sequence_parallel:
             final_hidden_states = tensor_model_parallel_all_gather(
-                final_hidden_states, 0)
+                final_hidden_states, 0
+            )
             final_hidden_states = final_hidden_states[:num_tokens]
 
         # return to 1d if input is 1d
-        return final_hidden_states.squeeze(0) if is_input_1d else \
-            final_hidden_states
+        return final_hidden_states.squeeze(0) if is_input_1d else final_hidden_states
 
 
 class Qwen3MoeAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -226,19 +249,23 @@ def __init__(
         self.max_position_embeddings = max_position_embeddings
         self.dual_chunk_attention_config = dual_chunk_attention_config
 
-        self.qkv_proj = QKVParallelLinear(hidden_size,
-                                          self.head_dim,
-                                          self.total_num_heads,
-                                          self.total_num_kv_heads,
-                                          bias=qkv_bias,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.qkv_proj")
+        self.qkv_proj = QKVParallelLinear(
+            hidden_size,
+            self.head_dim,
+            self.total_num_heads,
+            self.total_num_kv_heads,
+            bias=qkv_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.qkv_proj",
+        )
 
-        self.o_proj = RowParallelLinear(self.total_num_heads * self.head_dim,
-                                        hidden_size,
-                                        bias=False,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.o_proj")
+        self.o_proj = RowParallelLinear(
+            self.total_num_heads * self.head_dim,
+            hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.o_proj",
+        )
 
         self.rotary_emb = get_rope(
             self.head_dim,
@@ -259,7 +286,9 @@ def __init__(
             **{
                 "layer_idx": extract_layer_index(prefix),
                 "dual_chunk_attention_config": dual_chunk_attention_config,
-            } if dual_chunk_attention_config else {},
+            }
+            if dual_chunk_attention_config
+            else {},
         )
 
         self.q_norm = RMSNorm(self.head_dim, eps=rms_norm_eps)
@@ -273,13 +302,11 @@ def forward(
         qkv, _ = self.qkv_proj(hidden_states)
         q, k, v = qkv.split([self.q_size, self.kv_size, self.kv_size], dim=-1)
         # Add qk-norm
-        q_by_head = q.view(*q.shape[:-1], q.shape[-1] // self.head_dim,
-                           self.head_dim)
+        q_by_head = q.view(*q.shape[:-1], q.shape[-1] // self.head_dim, self.head_dim)
         q_by_head = self.q_norm(q_by_head)
         q = q_by_head.view(q.shape)
 
-        k_by_head = k.view(*k.shape[:-1], k.shape[-1] // self.head_dim,
-                           self.head_dim)
+        k_by_head = k.view(*k.shape[:-1], k.shape[-1] // self.head_dim, self.head_dim)
         k_by_head = self.k_norm(k_by_head)
         k = k_by_head.view(k.shape)
         q, k = self.rotary_emb(positions, q, k)
@@ -289,7 +316,6 @@ def forward(
 
 
 class Qwen3MoeDecoderLayer(nn.Module):
-
     def __init__(self, vllm_config: VllmConfig, prefix: str = "") -> None:
         super().__init__()
 
@@ -300,11 +326,10 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = "") -> None:
         self.hidden_size = config.hidden_size
         rope_theta = getattr(config, "rope_theta", 10000)
         rope_scaling = getattr(config, "rope_scaling", None)
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
-        dual_chunk_attention_config = getattr(config,
-                                              "dual_chunk_attention_config",
-                                              None)
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
+        dual_chunk_attention_config = getattr(
+            config, "dual_chunk_attention_config", None
+        )
         self.self_attn = Qwen3MoeAttention(
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
@@ -313,8 +338,8 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = "") -> None:
             rope_scaling=rope_scaling,
             max_position_embeddings=max_position_embeddings,
             rms_norm_eps=config.rms_norm_eps,
-            qkv_bias=getattr(config, 'attention_bias', False),
-            head_dim=getattr(config, 'head_dim', None),
+            qkv_bias=getattr(config, "attention_bias", False),
+            head_dim=getattr(config, "head_dim", None),
             cache_config=cache_config,
             quant_config=quant_config,
             prefix=f"{prefix}.self_attn",
@@ -323,23 +348,27 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = "") -> None:
 
         # `mlp_only_layers` in the config.
         layer_idx = extract_layer_index(prefix)
-        mlp_only_layers = ([] if not hasattr(config, "mlp_only_layers") else
-                           config.mlp_only_layers)
+        mlp_only_layers = (
+            [] if not hasattr(config, "mlp_only_layers") else config.mlp_only_layers
+        )
         if (layer_idx not in mlp_only_layers) and (
-                config.num_experts > 0 and
-            (layer_idx + 1) % config.decoder_sparse_step == 0):
-            self.mlp = Qwen3MoeSparseMoeBlock(vllm_config=vllm_config,
-                                              prefix=f"{prefix}.mlp")
+            config.num_experts > 0 and (layer_idx + 1) % config.decoder_sparse_step == 0
+        ):
+            self.mlp = Qwen3MoeSparseMoeBlock(
+                vllm_config=vllm_config, prefix=f"{prefix}.mlp"
+            )
         else:
-            self.mlp = Qwen3MoeMLP(hidden_size=config.hidden_size,
-                                   intermediate_size=config.intermediate_size,
-                                   hidden_act=config.hidden_act,
-                                   quant_config=quant_config,
-                                   prefix=f"{prefix}.mlp")
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+            self.mlp = Qwen3MoeMLP(
+                hidden_size=config.hidden_size,
+                intermediate_size=config.intermediate_size,
+                hidden_act=config.hidden_act,
+                quant_config=quant_config,
+                prefix=f"{prefix}.mlp",
+            )
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -352,23 +381,20 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
 
 @support_torch_compile
 class Qwen3MoeModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -385,17 +411,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             config.vocab_size,
             config.hidden_size,
             quant_config=quant_config,
-            prefix=f"{prefix}.embed_tokens")
+            prefix=f"{prefix}.embed_tokens",
+        )
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: Qwen3MoeDecoderLayer(vllm_config=vllm_config,
-                                                prefix=prefix),
+            lambda prefix: Qwen3MoeDecoderLayer(vllm_config=vllm_config, prefix=prefix),
             prefix=f"{prefix}.layers",
         )
         self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -420,10 +446,9 @@ def forward(
         for layer in islice(self.layers, self.start_layer, self.end_layer):
             hidden_states, residual = layer(positions, hidden_states, residual)
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
@@ -435,10 +460,10 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
             num_experts=self.config.num_experts,
-            num_redundant_experts=self.num_redundant_experts)
+            num_redundant_experts=self.num_redundant_experts,
+        )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -449,15 +474,24 @@ def load_weights(self, weights: Iterable[tuple[str,
         ]
 
         # Skip loading extra parameters for GPTQ/modelopt models.
-        ignore_suffixes = (".bias", "_bias", ".k_scale", "_k_scale",
-                           ".v_scale", "_v_scale", ".weight_scale",
-                           "_weight_scale", ".input_scale", "_input_scale")
+        ignore_suffixes = (
+            ".bias",
+            "_bias",
+            ".k_scale",
+            "_k_scale",
+            ".v_scale",
+            "_v_scale",
+            ".weight_scale",
+            "_weight_scale",
+            ".input_scale",
+            "_input_scale",
+        )
 
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         expert_params_mapping = self.get_expert_mapping()
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 # Skip non-stacked layers and experts (experts handled below).
                 if weight_name not in name:
                     continue
@@ -487,8 +521,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 if weight_loader == default_weight_loader:
                     weight_loader(param, loaded_weight)
                 else:
@@ -513,23 +546,27 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
 
                     # Skip loading extra parameters for GPTQ/modelopt models.
-                    if name_mapped.endswith(
-                            ignore_suffixes
-                    ) and name_mapped not in params_dict:
+                    if (
+                        name_mapped.endswith(ignore_suffixes)
+                        and name_mapped not in params_dict
+                    ):
                         continue
 
                     param = params_dict[name_mapped]
                     # We should ask the weight loader to return success or not
                     # here since otherwise we may skip experts with other
                     # available replicas.
-                    weight_loader = typing.cast(Callable[..., bool],
-                                                param.weight_loader)
-                    success = weight_loader(param,
-                                            loaded_weight,
-                                            name_mapped,
-                                            shard_id=shard_id,
-                                            expert_id=expert_id,
-                                            return_success=True)
+                    weight_loader = typing.cast(
+                        Callable[..., bool], param.weight_loader
+                    )
+                    success = weight_loader(
+                        param,
+                        loaded_weight,
+                        name_mapped,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                        return_success=True,
+                    )
                     if success:
                         name = name_mapped
                         break
@@ -541,8 +578,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
 
                     # Skip loading extra parameters for GPTQ/modelopt models.
-                    if name.endswith(
-                            ignore_suffixes) and name not in params_dict:
+                    if name.endswith(ignore_suffixes) and name not in params_dict:
                         continue
                     # Skip layers on other devices.
                     if is_pp_missing_parameter(name, self):
@@ -550,7 +586,8 @@ def load_weights(self, weights: Iterable[tuple[str,
                     # Remapping the name of FP8 kv-scale.
                     if name.endswith("kv_scale"):
                         remapped_kv_scale_name = name.replace(
-                            ".kv_scale", ".attn.kv_scale")
+                            ".kv_scale", ".attn.kv_scale"
+                        )
                         if remapped_kv_scale_name not in params_dict:
                             logger.warning_once(
                                 "Found kv scale in the checkpoint (e.g. %s), but not found the expected name in the model (e.g. %s). kv-scale is not loaded.",  # noqa: E501
@@ -561,15 +598,15 @@ def load_weights(self, weights: Iterable[tuple[str,
                         else:
                             name = remapped_kv_scale_name
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
-class Qwen3MoeForCausalLM(nn.Module, SupportsPP, SupportsLoRA,
-                          MixtureOfExperts):
+class Qwen3MoeForCausalLM(nn.Module, SupportsPP, SupportsLoRA, MixtureOfExperts):
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -590,17 +627,21 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.model = Qwen3MoeModel(vllm_config=vllm_config,
-                                   prefix=maybe_prefix(prefix, "model"))
-        self.lm_head = ParallelLMHead(config.vocab_size,
-                                      config.hidden_size,
-                                      quant_config=quant_config,
-                                      prefix=maybe_prefix(prefix, "lm_head"))
+        self.model = Qwen3MoeModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
+        self.lm_head = ParallelLMHead(
+            config.vocab_size,
+            config.hidden_size,
+            quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
         if self.config.tie_word_embeddings:
             self.lm_head.weight = self.model.embed_tokens.weight
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
         # Set MoE hyperparameters
         self.expert_weights = []
@@ -652,8 +693,7 @@ def update_physical_experts_metadata(
         assert self.num_local_physical_experts == num_local_physical_experts
         self.num_physical_experts = num_physical_experts
         self.num_local_physical_experts = num_local_physical_experts
-        self.num_redundant_experts = (num_physical_experts -
-                                      self.num_logical_experts)
+        self.num_redundant_experts = num_physical_experts - self.num_logical_experts
         for layer in self.model.layers:
             if isinstance(layer.mlp, Qwen3MoeSparseMoeBlock):
                 moe = layer.mlp
@@ -672,8 +712,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -683,8 +724,7 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
 
diff --git a/vllm/model_executor/models/qwen3_next.py b/vllm/model_executor/models/qwen3_next.py
index 14d19874a51e..34ffa9b69894 100644
--- a/vllm/model_executor/models/qwen3_next.py
+++ b/vllm/model_executor/models/qwen3_next.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Inference-only Qwen3Next model."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional
@@ -13,40 +14,63 @@
 
 from vllm.attention import Attention, AttentionBackend, AttentionMetadata
 from vllm.compilation.decorators import support_torch_compile
-from vllm.config import (CacheConfig, ModelConfig, SpeculativeConfig,
-                         VllmConfig, get_current_vllm_config)
-from vllm.distributed import (divide, get_ep_group, get_pp_group,
-                              get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_gather)
+from vllm.config import (
+    CacheConfig,
+    ModelConfig,
+    SpeculativeConfig,
+    VllmConfig,
+    get_current_vllm_config,
+)
+from vllm.distributed import (
+    divide,
+    get_ep_group,
+    get_pp_group,
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_gather,
+)
 from vllm.forward_context import ForwardContext, get_forward_context
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fla.ops import (
-    RMSNormGated, chunk_gated_delta_rule, fused_recurrent_gated_delta_rule)
+    RMSNormGated,
+    chunk_gated_delta_rule,
+    fused_recurrent_gated_delta_rule,
+)
 from vllm.model_executor.layers.fused_moe import FusedMoE
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.model_executor.layers.layernorm import (
-    GemmaRMSNorm as Qwen3NextRMSNorm)
+from vllm.model_executor.layers.layernorm import GemmaRMSNorm as Qwen3NextRMSNorm
+
 # yapf: enable
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.mamba.abstract import MambaBase
-from vllm.model_executor.layers.mamba.mamba_mixer2 import (
-    mamba_v2_sharded_weight_loader)
+from vllm.model_executor.layers.mamba.mamba_mixer2 import mamba_v2_sharded_weight_loader
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.mamba.ops.causal_conv1d import (
-    causal_conv1d_fn, causal_conv1d_update)
+    causal_conv1d_fn,
+    causal_conv1d_update,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, sharded_weight_loader)
+    default_weight_loader,
+    sharded_weight_loader,
+)
 from vllm.model_executor.models.qwen2_moe import Qwen2MoeMLP as Qwen3NextMLP
 from vllm.model_executor.models.utils import sequence_parallel_chunk
 from vllm.model_executor.utils import set_weight_attrs
@@ -57,12 +81,22 @@
 from vllm.utils import direct_register_custom_op
 from vllm.v1.attention.backends.gdn_attn import GDNAttentionMetadata
 
-from .interfaces import (HasInnerState, IsHybrid, MixtureOfExperts,
-                         SupportsLoRA, SupportsPP)
-from .utils import (AutoWeightsLoader, PPMissingLayer, extract_layer_index,
-                    is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .interfaces import (
+    HasInnerState,
+    IsHybrid,
+    MixtureOfExperts,
+    SupportsLoRA,
+    SupportsPP,
+)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    extract_layer_index,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
@@ -70,7 +104,6 @@
 
 
 class Qwen3NextSparseMoeBlock(nn.Module):
-
     def __init__(self, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -90,7 +123,8 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = ""):
         if self.tp_size > config.num_experts:
             raise ValueError(
                 f"Tensor parallel size {self.tp_size} is greater than "
-                f"the number of experts {config.num_experts}.")
+                f"the number of experts {config.num_experts}."
+            )
 
         # Load balancing settings.
         vllm_config = get_current_vllm_config()
@@ -99,32 +133,35 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = ""):
 
         self.n_logical_experts = self.n_routed_experts
         self.n_redundant_experts = eplb_config.num_redundant_experts
-        self.n_physical_experts = (self.n_logical_experts +
-                                   self.n_redundant_experts)
+        self.n_physical_experts = self.n_logical_experts + self.n_redundant_experts
         self.n_local_physical_experts = self.n_physical_experts // self.ep_size
 
-        self.physical_expert_start = (self.ep_rank *
-                                      self.n_local_physical_experts)
-        self.physical_expert_end = (self.physical_expert_start +
-                                    self.n_local_physical_experts)
-
-        self.experts = FusedMoE(num_experts=self.n_routed_experts,
-                                top_k=config.num_experts_per_tok,
-                                hidden_size=config.hidden_size,
-                                intermediate_size=config.moe_intermediate_size,
-                                reduce_results=False,
-                                renormalize=config.norm_topk_prob,
-                                quant_config=quant_config,
-                                prefix=f"{prefix}.experts",
-                                enable_eplb=self.enable_eplb,
-                                num_redundant_experts=self.n_redundant_experts,
-                                is_sequence_parallel=self.is_sequence_parallel)
-
-        self.gate = ReplicatedLinear(config.hidden_size,
-                                     config.num_experts,
-                                     bias=False,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.gate")
+        self.physical_expert_start = self.ep_rank * self.n_local_physical_experts
+        self.physical_expert_end = (
+            self.physical_expert_start + self.n_local_physical_experts
+        )
+
+        self.experts = FusedMoE(
+            num_experts=self.n_routed_experts,
+            top_k=config.num_experts_per_tok,
+            hidden_size=config.hidden_size,
+            intermediate_size=config.moe_intermediate_size,
+            reduce_results=False,
+            renormalize=config.norm_topk_prob,
+            quant_config=quant_config,
+            prefix=f"{prefix}.experts",
+            enable_eplb=self.enable_eplb,
+            num_redundant_experts=self.n_redundant_experts,
+            is_sequence_parallel=self.is_sequence_parallel,
+        )
+
+        self.gate = ReplicatedLinear(
+            config.hidden_size,
+            config.num_experts,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.gate",
+        )
 
         if config.shared_expert_intermediate_size > 0:
             self.shared_expert = Qwen3NextMLP(
@@ -132,15 +169,12 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = ""):
                 intermediate_size=config.shared_expert_intermediate_size,
                 hidden_act=config.hidden_act,
                 quant_config=quant_config,
-                reduce_results=self.experts.must_reduce_shared_expert_outputs(
-                ),
+                reduce_results=self.experts.must_reduce_shared_expert_outputs(),
                 prefix=f"{prefix}.shared_expert",
             )
         else:
             self.shared_expert = None
-        self.shared_expert_gate = torch.nn.Linear(config.hidden_size,
-                                                  1,
-                                                  bias=False)
+        self.shared_expert_gate = torch.nn.Linear(config.hidden_size, 1, bias=False)
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         # NOTE: hidden_states can have either 1D or 2D shape.
@@ -155,46 +189,57 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         if self.shared_expert is not None:
             shared_output = self.shared_expert(hidden_states)
             if self.shared_expert_gate is not None:
-                shared_output = F.sigmoid(
-                    self.shared_expert_gate(hidden_states)) * shared_output
+                shared_output = (
+                    F.sigmoid(self.shared_expert_gate(hidden_states)) * shared_output
+                )
 
         # router_logits: (num_tokens, n_experts)
         router_logits, _ = self.gate(hidden_states)
-        final_hidden_states = self.experts(hidden_states=hidden_states,
-                                           router_logits=router_logits)
+        final_hidden_states = self.experts(
+            hidden_states=hidden_states, router_logits=router_logits
+        )
 
         if shared_output is not None:
             final_hidden_states = final_hidden_states + shared_output
 
         if self.is_sequence_parallel:
             final_hidden_states = tensor_model_parallel_all_gather(
-                final_hidden_states, 0)
+                final_hidden_states, 0
+            )
             final_hidden_states = final_hidden_states[:num_tokens]
         elif self.tp_size > 1:
             final_hidden_states = self.experts.maybe_all_reduce_tensor_model_parallel(  # noqa E501
-                final_hidden_states)
+                final_hidden_states
+            )
 
         return final_hidden_states.view(orig_shape)
 
 
 class Qwen3NextGatedDeltaNet(nn.Module, MambaBase):
-
     @property
     def mamba_type(self) -> str:
         return "linear_attention"
 
     def get_attn_backend(self) -> type["AttentionBackend"]:
         from vllm.v1.attention.backends.gdn_attn import GDNAttentionBackend
+
         return GDNAttentionBackend
 
     def get_state_dtype(self) -> tuple[torch.dtype, torch.dtype]:
         return MambaStateDtypeCalculator.gated_delta_net_state_dtype(
-            self.model_config.dtype, self.cache_config.mamba_cache_dtype)
+            self.model_config.dtype, self.cache_config.mamba_cache_dtype
+        )
 
     def get_state_shape(self) -> tuple[tuple[int, ...], tuple[int, ...]]:
         return MambaStateShapeCalculator.gated_delta_net_state_shape(
-            self.tp_size, self.num_k_heads, self.num_v_heads, self.head_k_dim,
-            self.head_v_dim, self.conv_kernel_size, self.num_spec)
+            self.tp_size,
+            self.num_k_heads,
+            self.num_v_heads,
+            self.head_k_dim,
+            self.head_v_dim,
+            self.conv_kernel_size,
+            self.num_spec,
+        )
 
     def __init__(
         self,
@@ -228,8 +273,11 @@ def __init__(
         self.cache_config = cache_config
         self.quant_config = quant_config
         self.speculative_config = speculative_config
-        self.num_spec = (self.speculative_config.num_speculative_tokens
-                         if self.speculative_config else 0)
+        self.num_spec = (
+            self.speculative_config.num_speculative_tokens
+            if self.speculative_config
+            else 0
+        )
 
         # QKV
         self.conv_dim = self.key_dim * 2 + self.value_dim
@@ -265,31 +313,36 @@ def __init__(
 
         delattr(self.conv1d.weight, "weight_loader")
         set_weight_attrs(
-            self.conv1d.weight, {
-                "weight_loader":
-                mamba_v2_sharded_weight_loader([
-                    query_key_settings,
-                    query_key_settings,
-                    value_settings,
-                ], self.tp_size, self.tp_rank)
-            })
+            self.conv1d.weight,
+            {
+                "weight_loader": mamba_v2_sharded_weight_loader(
+                    [
+                        query_key_settings,
+                        query_key_settings,
+                        value_settings,
+                    ],
+                    self.tp_size,
+                    self.tp_rank,
+                )
+            },
+        )
 
         # selective projection used to make dt, B and C input dependant
 
         # time step projection (discretization)
         # instantiate once and copy inv_dt in init_weights of PretrainedModel
         self.dt_bias = nn.Parameter(
-            torch.ones(self.num_v_heads // self.tp_size), )
+            torch.ones(self.num_v_heads // self.tp_size),
+        )
         self.A_log = nn.Parameter(
             torch.empty(
                 divide(self.num_v_heads, self.tp_size),
                 dtype=torch.float32,
-            ))
+            )
+        )
 
-        set_weight_attrs(self.A_log,
-                         {"weight_loader": sharded_weight_loader(0)})
-        set_weight_attrs(self.dt_bias,
-                         {"weight_loader": sharded_weight_loader(0)})
+        set_weight_attrs(self.A_log, {"weight_loader": sharded_weight_loader(0)})
+        set_weight_attrs(self.dt_bias, {"weight_loader": sharded_weight_loader(0)})
 
         self.norm = RMSNormGated(
             self.head_v_dim,
@@ -300,12 +353,14 @@ def __init__(
             dtype=config.torch_dtype,
         )
 
-        self.out_proj = RowParallelLinear(self.value_dim,
-                                          self.hidden_size,
-                                          bias=False,
-                                          input_is_parallel=True,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.out_proj")
+        self.out_proj = RowParallelLinear(
+            self.value_dim,
+            self.hidden_size,
+            bias=False,
+            input_is_parallel=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.out_proj",
+        )
 
         compilation_config = get_current_vllm_config().compilation_config
         if prefix in compilation_config.static_forward_context:
@@ -322,9 +377,13 @@ def fix_query_key_value_ordering(
         """
         new_tensor_shape_qkvz = mixed_qkvz.size()[:-1] + (
             self.num_k_heads // self.tp_size,
-            (self.head_k_dim + self.head_k_dim +
-             (self.head_v_dim + self.head_v_dim) * self.num_v_heads //
-             self.num_k_heads),
+            (
+                self.head_k_dim
+                + self.head_k_dim
+                + (self.head_v_dim + self.head_v_dim)
+                * self.num_v_heads
+                // self.num_k_heads
+            ),
         )
         new_tensor_shape_ba = mixed_qkvz.size()[:-1] + (
             self.num_k_heads // self.tp_size,
@@ -342,15 +401,13 @@ def fix_query_key_value_ordering(
         ]
         split_arg_list_ba = [
             self.num_v_heads // self.num_k_heads,
-            self.num_v_heads // self.num_k_heads
+            self.num_v_heads // self.num_k_heads,
         ]
 
         # [b, sq, ng, (hn + hn + np/ng * hn + np/ng + np/ng)]
         # --> [b, sq, ng, hn], [b, sq, ng, hn], [b, sq, ng, np/ng * hn],
         #  [b, sq, ng, np/ng * hn], [b, sq, ng, np/ng], [b, sq, ng, np/ng]
-        (query, key, value, z) = torch.split(mixed_qkvz,
-                                             split_arg_list_qkvz,
-                                             dim=2)
+        (query, key, value, z) = torch.split(mixed_qkvz, split_arg_list_qkvz, dim=2)
         (b, a) = torch.split(mixed_ba, split_arg_list_ba, dim=2)
 
         # [b, sq, ng, np/ng * hn] -> [b, sq, np, hn]
@@ -374,9 +431,10 @@ def rearrange_mixed_qkv(self, mixed_qkv):
             dim=-1,
         )
         query, key = map(
-            lambda x: rearrange(x, 'l (h d) -> 1 l h d', d=self.head_k_dim),
-            (query, key))
-        value = rearrange(value, 'l (h d) -> 1 l h d', d=self.head_v_dim)
+            lambda x: rearrange(x, "l (h d) -> 1 l h d", d=self.head_k_dim),
+            (query, key),
+        )
+        value = rearrange(value, "l (h d) -> 1 l h d", d=self.head_v_dim)
         return query, key, value
 
     def forward(
@@ -421,23 +479,23 @@ def _forward(
             spec_token_masks = spec_token_masks[:num_actual_tokens]
 
         # 1. Set up dimensions for reshapes later
-        projected_states_qkvz, _ = self.in_proj_qkvz(
-            hidden_states[:num_actual_tokens])
-        projected_states_ba, _ = self.in_proj_ba(
-            hidden_states[:num_actual_tokens])
+        projected_states_qkvz, _ = self.in_proj_qkvz(hidden_states[:num_actual_tokens])
+        projected_states_ba, _ = self.in_proj_ba(hidden_states[:num_actual_tokens])
         query, key, value, z, b, a = self.fix_query_key_value_ordering(
-            projected_states_qkvz, projected_states_ba)
-        query, key, value = map(lambda x: rearrange(x, 'l p d -> l (p d)'),
-                                (query, key, value))
+            projected_states_qkvz, projected_states_ba
+        )
+        query, key, value = map(
+            lambda x: rearrange(x, "l p d -> l (p d)"), (query, key, value)
+        )
         mixed_qkv = torch.cat((query, key, value), dim=-1)
 
         # 2. Convolution sequence transformation
-        conv_weights = self.conv1d.weight.view(self.conv1d.weight.size(0),
-                                               self.conv1d.weight.size(2))
+        conv_weights = self.conv1d.weight.view(
+            self.conv1d.weight.size(0), self.conv1d.weight.size(2)
+        )
 
         if spec_sequence_masks is not None:
-            if (attn_metadata.num_prefills == 0
-                    and attn_metadata.num_decodes == 0):
+            if attn_metadata.num_prefills == 0 and attn_metadata.num_decodes == 0:
                 mixed_qkv_spec = mixed_qkv
                 mixed_qkv_non_spec = None
             else:
@@ -455,8 +513,9 @@ def _forward(
                 conv_weights,
                 self.conv1d.bias,
                 self.activation,
-                conv_state_indices=spec_state_indices_tensor[:, 0]
-                [:attn_metadata.num_spec_decodes],
+                conv_state_indices=spec_state_indices_tensor[:, 0][
+                    : attn_metadata.num_spec_decodes
+                ],
                 num_accepted_tokens=num_accepted_tokens,
                 query_start_loc=spec_query_start_loc,
                 max_query_len=spec_state_indices_tensor.size(-1),
@@ -486,26 +545,26 @@ def _forward(
                 conv_weights,
                 self.conv1d.bias,
                 self.activation,
-                conv_state_indices=non_spec_state_indices_tensor[:attn_metadata
-                                                                 .num_decodes],
+                conv_state_indices=non_spec_state_indices_tensor[
+                    : attn_metadata.num_decodes
+                ],
                 validate_data=True,
             )
         else:
             mixed_qkv_non_spec = None
 
-        query_spec, key_spec, value_spec = self.rearrange_mixed_qkv(
-            mixed_qkv_spec)
+        query_spec, key_spec, value_spec = self.rearrange_mixed_qkv(mixed_qkv_spec)
         query_non_spec, key_non_spec, value_non_spec = self.rearrange_mixed_qkv(
-            mixed_qkv_non_spec)
+            mixed_qkv_non_spec
+        )
 
         beta = b.sigmoid()
         # g = -self.A_log.float().exp() * F.softplus(a.float() + self.dt_bias)
         g = fused_gdn_gating(self.A_log, a, self.dt_bias)
-        g, beta = map(lambda x: rearrange(x, 'l d -> 1 l d'), (g, beta))
+        g, beta = map(lambda x: rearrange(x, "l d -> 1 l d"), (g, beta))
 
         if spec_sequence_masks is not None:
-            if (attn_metadata.num_prefills == 0
-                    and attn_metadata.num_decodes == 0):
+            if attn_metadata.num_prefills == 0 and attn_metadata.num_decodes == 0:
                 g_spec = g
                 beta_spec = beta
                 g_non_spec = None
@@ -525,28 +584,25 @@ def _forward(
 
         # 3.1: process the mutlti-query part
         if spec_sequence_masks is not None:
-            core_attn_out_spec, last_recurrent_state = (
-                fused_recurrent_gated_delta_rule(
-                    q=query_spec,
-                    k=key_spec,
-                    v=value_spec,
-                    g=g_spec,
-                    beta=beta_spec,
-                    initial_state=ssm_state,
-                    inplace_final_state=True,
-                    cu_seqlens=spec_query_start_loc[:attn_metadata.
-                                                    num_spec_decodes + 1],
-                    ssm_state_indices=spec_state_indices_tensor,
-                    num_accepted_tokens=num_accepted_tokens,
-                    use_qk_l2norm_in_kernel=True,
-                ))
+            core_attn_out_spec, last_recurrent_state = fused_recurrent_gated_delta_rule(
+                q=query_spec,
+                k=key_spec,
+                v=value_spec,
+                g=g_spec,
+                beta=beta_spec,
+                initial_state=ssm_state,
+                inplace_final_state=True,
+                cu_seqlens=spec_query_start_loc[: attn_metadata.num_spec_decodes + 1],
+                ssm_state_indices=spec_state_indices_tensor,
+                num_accepted_tokens=num_accepted_tokens,
+                use_qk_l2norm_in_kernel=True,
+            )
         else:
             core_attn_out_spec, last_recurrent_state = None, None
 
         # 3.2: process the remaining part
         if attn_metadata.num_prefills > 0:
-            initial_state = ssm_state[
-                non_spec_state_indices_tensor].contiguous()
+            initial_state = ssm_state[non_spec_state_indices_tensor].contiguous()
             initial_state[~has_initial_state, ...] = 0
             (
                 core_attn_out_non_spec,
@@ -565,7 +621,8 @@ def _forward(
             )
             # Init cache
             ssm_state[non_spec_state_indices_tensor] = last_recurrent_state.to(
-                ssm_state.dtype)
+                ssm_state.dtype
+            )
         elif attn_metadata.num_decodes > 0:
             core_attn_out_non_spec, last_recurrent_state = (
                 fused_recurrent_gated_delta_rule(
@@ -576,17 +633,18 @@ def _forward(
                     beta=beta_non_spec,
                     initial_state=ssm_state,
                     inplace_final_state=True,
-                    cu_seqlens=non_spec_query_start_loc[:attn_metadata.
-                                                        num_decodes + 1],
+                    cu_seqlens=non_spec_query_start_loc[
+                        : attn_metadata.num_decodes + 1
+                    ],
                     ssm_state_indices=non_spec_state_indices_tensor,
                     use_qk_l2norm_in_kernel=True,
-                ))
+                )
+            )
         else:
             core_attn_out_non_spec, last_recurrent_state = None, None
 
         # Merge core attention output
-        if (spec_sequence_masks is not None
-                and core_attn_out_non_spec is not None):
+        if spec_sequence_masks is not None and core_attn_out_non_spec is not None:
             core_attn_out = torch.empty(
                 (1, num_actual_tokens, *core_attn_out_spec.shape[2:]),
                 dtype=core_attn_out_non_spec.dtype,
@@ -605,13 +663,12 @@ def _forward(
         z = z.reshape(-1, z.shape[-1])
         core_attn_out = self.norm(core_attn_out, z)
         core_attn_out = core_attn_out.reshape(z_shape_og)
-        core_attn_out = rearrange(core_attn_out, '... h d -> ... (h d)')
+        core_attn_out = rearrange(core_attn_out, "... h d -> ... (h d)")
 
         output[:num_actual_tokens], _ = self.out_proj(core_attn_out)
 
 
 class Qwen3NextAttention(nn.Module):
-
     def __init__(
         self,
         config: Qwen3NextConfig,
@@ -642,7 +699,8 @@ def __init__(
         self.kv_size = self.num_kv_heads * self.head_dim
         self.scaling = self.head_dim**-0.5
         self.dual_chunk_attention_config = getattr(
-            config, "dual_chunk_attention_config", None)
+            config, "dual_chunk_attention_config", None
+        )
         self.attn_output_gate = getattr(config, "attn_output_gate", True)
 
         self.qkv_proj = QKVParallelLinear(
@@ -683,9 +741,10 @@ def __init__(
             prefix=f"{prefix}.attn",
             **{
                 "layer_idx": extract_layer_index(prefix),
-                "dual_chunk_attention_config":
-                self.dual_chunk_attention_config,
-            } if self.dual_chunk_attention_config else {},
+                "dual_chunk_attention_config": self.dual_chunk_attention_config,
+            }
+            if self.dual_chunk_attention_config
+            else {},
         )
 
         self.q_norm = Qwen3NextRMSNorm(self.head_dim, eps=config.rms_norm_eps)
@@ -701,20 +760,22 @@ def forward(
 
         if self.attn_output_gate:
             q_gate, k, v = qkv.split(
-                [self.q_size * 2, self.kv_size, self.kv_size], dim=-1)
+                [self.q_size * 2, self.kv_size, self.kv_size], dim=-1
+            )
             orig_shape = q_gate.shape[:-1]
             q_gate = q_gate.view(*orig_shape, self.num_heads, -1)
             q, gate = torch.chunk(q_gate, 2, dim=-1)
             q = q.reshape(*orig_shape, -1)
             gate = gate.reshape(*orig_shape, -1)
         else:
-            q, k, v = qkv.split([self.q_size, self.kv_size, self.kv_size],
-                                dim=-1)
+            q, k, v = qkv.split([self.q_size, self.kv_size, self.kv_size], dim=-1)
 
         q = self.q_norm(q.view(-1, self.num_heads, self.head_dim)).view(
-            -1, self.num_heads * self.head_dim)
+            -1, self.num_heads * self.head_dim
+        )
         k = self.k_norm(k.view(-1, self.num_kv_heads, self.head_dim)).view(
-            -1, self.num_kv_heads * self.head_dim)
+            -1, self.num_kv_heads * self.head_dim
+        )
 
         q, k = self.rotary_emb(positions, q, k)
 
@@ -728,7 +789,6 @@ def forward(
 
 
 class Qwen3NextDecoderLayer(nn.Module):
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -753,23 +813,26 @@ def __init__(
                 cache_config=cache_config,
                 quant_config=quant_config,
                 speculative_config=speculative_config,
-                prefix=f'{prefix}.linear_attn')
+                prefix=f"{prefix}.linear_attn",
+            )
         elif self.layer_type == "full_attention":
             self.self_attn = Qwen3NextAttention(
                 config,
                 model_config=model_config,
                 cache_config=cache_config,
                 quant_config=quant_config,
-                prefix=f'{prefix}.self_attn',
+                prefix=f"{prefix}.self_attn",
             )
         else:
             raise ValueError(f"Invalid layer_type {self.layer_type}")
 
-        mlp_only_layers = ([] if not hasattr(config, "mlp_only_layers") else
-                           config.mlp_only_layers)
+        mlp_only_layers = (
+            [] if not hasattr(config, "mlp_only_layers") else config.mlp_only_layers
+        )
         if (self.layer_idx not in mlp_only_layers) and (
-                config.num_experts > 0 and
-            (self.layer_idx + 1) % config.decoder_sparse_step == 0):
+            config.num_experts > 0
+            and (self.layer_idx + 1) % config.decoder_sparse_step == 0
+        ):
             self.mlp = Qwen3NextSparseMoeBlock(
                 vllm_config=vllm_config,
                 prefix=f"{prefix}.mlp",
@@ -782,10 +845,12 @@ def __init__(
                 quant_config=quant_config,
             )
 
-        self.input_layernorm = Qwen3NextRMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = Qwen3NextRMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
         self.post_attention_layernorm = Qwen3NextRMSNorm(
-            config.hidden_size, eps=config.rms_norm_eps)
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
         self.layer_scale = getattr(config, "layer_scale", False)
         if self.layer_scale:
@@ -795,14 +860,16 @@ def __init__(
                     1,
                     config.hidden_size,
                     dtype=config.torch_dtype,
-                ), )
+                ),
+            )
             self.ffn_layer_scale = torch.nn.Parameter(
                 torch.zeros(
                     1,
                     1,
                     config.hidden_size,
                     dtype=config.torch_dtype,
-                ), )
+                ),
+            )
 
     def forward(
         self,
@@ -815,8 +882,7 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
 
         self_attention_output = torch.empty_like(hidden_states)
         if self.layer_type == "linear_attention":
@@ -837,33 +903,35 @@ def forward(
         if self.layer_scale:
             if len(hidden_states.shape) == 2:
                 hidden_states = hidden_states * (
-                    self.attn_layer_scale.to(hidden_states.dtype)[0] + 1)
+                    self.attn_layer_scale.to(hidden_states.dtype)[0] + 1
+                )
             else:
                 hidden_states = hidden_states * (
-                    self.attn_layer_scale.to(hidden_states.dtype) + 1)
+                    self.attn_layer_scale.to(hidden_states.dtype) + 1
+                )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
 
         if self.layer_scale:
             if len(hidden_states.shape) == 2:
                 hidden_states = hidden_states * (
-                    self.ffn_layer_scale.to(hidden_states.dtype)[0] + 1)
+                    self.ffn_layer_scale.to(hidden_states.dtype)[0] + 1
+                )
             else:
-                assert len(hidden_states.shape) == len(
-                    self.ffn_layer_scale.shape
-                ), f'shape must be the same {len(hidden_states.shape)}, {len(self.ffn_layer_scale.shape)}'  # noqa: E501
+                assert len(hidden_states.shape) == len(self.ffn_layer_scale.shape), (
+                    f"shape must be the same {len(hidden_states.shape)}, {len(self.ffn_layer_scale.shape)}"
+                )  # noqa: E501
                 hidden_states = hidden_states * (
-                    self.ffn_layer_scale.to(hidden_states.dtype) + 1)
+                    self.ffn_layer_scale.to(hidden_states.dtype) + 1
+                )
 
         return hidden_states, residual
 
 
 @support_torch_compile
 class Qwen3NextModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -874,8 +942,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.num_redundant_experts = eplb_config.num_redundant_experts
 
         self.config = config
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
 
         self.embed_tokens = VocabParallelEmbedding(
@@ -892,14 +963,14 @@ def get_layer(prefix: str):
             )
 
         self.start_layer, self.end_layer, self.layers = make_layers(
-            config.num_hidden_layers, get_layer, prefix=f"{prefix}.layers")
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+            config.num_hidden_layers, get_layer, prefix=f"{prefix}.layers"
+        )
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
         if get_pp_group().is_last_rank:
-            self.norm = Qwen3NextRMSNorm(config.hidden_size,
-                                         eps=config.rms_norm_eps)
+            self.norm = Qwen3NextRMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         else:
             self.norm = PPMissingLayer()
 
@@ -932,10 +1003,9 @@ def forward(
             )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
@@ -947,10 +1017,10 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
             num_experts=self.config.num_experts,
-            num_redundant_experts=self.num_redundant_experts)
+            num_redundant_experts=self.num_redundant_experts,
+        )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -1001,16 +1071,19 @@ def load_weights(self, weights: Iterable[tuple[str,
                     if is_pp_missing_parameter(name, self):
                         continue
                     # Skip loading extra bias for GPTQ models.
-                    if ((name.endswith(".bias") or name.endswith("_bias"))
-                            and name not in params_dict):
+                    if (
+                        name.endswith(".bias") or name.endswith("_bias")
+                    ) and name not in params_dict:
                         continue
                     param = params_dict[name]
                     weight_loader = param.weight_loader
-                    weight_loader(param,
-                                  loaded_weight,
-                                  name,
-                                  shard_id=shard_id,
-                                  expert_id=expert_id)
+                    weight_loader(
+                        param,
+                        loaded_weight,
+                        name,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                    )
                     break
                 else:
                     # Skip loading extra bias for GPTQ models.
@@ -1019,15 +1092,17 @@ def load_weights(self, weights: Iterable[tuple[str,
                     if is_pp_missing_parameter(name, self):
                         continue
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
-class Qwen3NextForCausalLM(nn.Module, HasInnerState, SupportsLoRA, SupportsPP,
-                           MixtureOfExperts, IsHybrid):
+class Qwen3NextForCausalLM(
+    nn.Module, HasInnerState, SupportsLoRA, SupportsPP, MixtureOfExperts, IsHybrid
+):
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -1044,15 +1119,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         cache_config = vllm_config.cache_config
         lora_config = vllm_config.lora_config
         scheduler_config = vllm_config.scheduler_config
-        assert not cache_config.enable_prefix_caching, \
+        assert not cache_config.enable_prefix_caching, (
             "Qwen3Next currently does not support prefix caching"
+        )
         self.quant_config = vllm_config.quant_config
 
         super().__init__()
         self.config = config
         self.scheduler_config = scheduler_config
-        self.model = Qwen3NextModel(vllm_config=vllm_config,
-                                    prefix=maybe_prefix(prefix, "model"))
+        self.model = Qwen3NextModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.unpadded_vocab_size = config.vocab_size
         if lora_config:
             self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
@@ -1063,12 +1140,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             padding_size=DEFAULT_VOCAB_PADDING_SIZE
             # We need bigger padding if using lora for kernel
             # compatibility
-            if not lora_config else lora_config.lora_vocab_padding_size,
-            prefix=maybe_prefix(prefix, "lm_head"))
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size)
+            if not lora_config
+            else lora_config.lora_vocab_padding_size,
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size
+        )
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
         # Set MoE hyperparameters
         self.expert_weights = []
@@ -1120,8 +1201,7 @@ def update_physical_experts_metadata(
         assert self.num_local_physical_experts == num_local_physical_experts
         self.num_physical_experts = num_physical_experts
         self.num_local_physical_experts = num_local_physical_experts
-        self.num_redundant_experts = (num_physical_experts -
-                                      self.num_logical_experts)
+        self.num_redundant_experts = num_physical_experts - self.num_logical_experts
         for layer in self.model.layers:
             if isinstance(layer.mlp, Qwen3NextSparseMoeBlock):
                 moe = layer.mlp
@@ -1141,8 +1221,9 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs: object,
     ):
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
 
         return hidden_states
 
@@ -1152,23 +1233,30 @@ def get_mamba_state_dtype_from_config(
         vllm_config: "VllmConfig",
     ) -> tuple[torch.dtype, torch.dtype]:
         return MambaStateDtypeCalculator.gated_delta_net_state_dtype(
-            vllm_config.model_config.dtype,
-            vllm_config.cache_config.mamba_cache_dtype)
+            vllm_config.model_config.dtype, vllm_config.cache_config.mamba_cache_dtype
+        )
 
     @classmethod
     def get_mamba_state_shape_from_config(
-            cls, vllm_config: "VllmConfig"
+        cls, vllm_config: "VllmConfig"
     ) -> tuple[tuple[int, int], tuple[int, int]]:
         parallel_config = vllm_config.parallel_config
         hf_config = vllm_config.model_config.hf_config
         tp_size = parallel_config.tensor_parallel_size
-        num_spec = (vllm_config.speculative_config.num_speculative_tokens
-                    if vllm_config.speculative_config else 0)
+        num_spec = (
+            vllm_config.speculative_config.num_speculative_tokens
+            if vllm_config.speculative_config
+            else 0
+        )
         return MambaStateShapeCalculator.gated_delta_net_state_shape(
-            tp_size, hf_config.linear_num_key_heads,
-            hf_config.linear_num_value_heads, hf_config.linear_key_head_dim,
-            hf_config.linear_value_head_dim, hf_config.linear_conv_kernel_dim,
-            num_spec)
+            tp_size,
+            hf_config.linear_num_key_heads,
+            hf_config.linear_num_value_heads,
+            hf_config.linear_key_head_dim,
+            hf_config.linear_value_head_dim,
+            hf_config.linear_conv_kernel_dim,
+            num_spec,
+        )
 
     def compute_logits(
         self,
@@ -1176,8 +1264,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.logits_processor(self.lm_head, hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
             skip_prefixes=["mtp."],
@@ -1236,8 +1323,9 @@ def fused_gdn_gating_kernel(
     blk_bias = tl.load(dt_bias + head_off, mask=mask)
     # If the model is loaded in fp16, without the .float() here, A might be -inf
     x = blk_a.to(tl.float32) + blk_bias.to(tl.float32)
-    softplus_x = tl.where(beta * x <= threshold,
-                          (1 / beta) * tl.log(1 + tl.exp(beta * x)), x)
+    softplus_x = tl.where(
+        beta * x <= threshold, (1 / beta) * tl.log(1 + tl.exp(beta * x)), x
+    )
     blk_g = -tl.exp(blk_A_log.to(tl.float32)) * softplus_x
     tl.store(g + off, blk_g.to(g.dtype.element_ty), mask=mask)
 
@@ -1253,14 +1341,7 @@ def fused_gdn_gating(
     seq_len = 1
     grid = (batch, seq_len, triton.cdiv(num_heads, 8))
     g = torch.empty_like(a, dtype=torch.float32)
-    fused_gdn_gating_kernel[grid](g,
-                                  A_log,
-                                  a,
-                                  dt_bias,
-                                  seq_len,
-                                  num_heads,
-                                  beta,
-                                  threshold,
-                                  8,
-                                  num_warps=1)
+    fused_gdn_gating_kernel[grid](
+        g, A_log, a, dt_bias, seq_len, num_heads, beta, threshold, 8, num_warps=1
+    )
     return g
diff --git a/vllm/model_executor/models/qwen3_next_mtp.py b/vllm/model_executor/models/qwen3_next_mtp.py
index e950699a0c49..828931716c8f 100644
--- a/vllm/model_executor/models/qwen3_next_mtp.py
+++ b/vllm/model_executor/models/qwen3_next_mtp.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Inference-only Qwen3Next MTP model."""
+
 from collections.abc import Iterable
 from typing import Optional
 
@@ -15,16 +16,25 @@
 from vllm.model_executor.layers.linear import ColumnParallelLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
-from vllm.model_executor.models.qwen3_next import (Qwen3NextDecoderLayer,
-                                                   Qwen3NextRMSNorm)
+from vllm.model_executor.models.qwen3_next import (
+    Qwen3NextDecoderLayer,
+    Qwen3NextRMSNorm,
+)
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs import Qwen3NextConfig
 
 from .interfaces import SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
@@ -33,7 +43,6 @@
 
 @support_torch_compile
 class Qwen3NextMultiTokenPredictor(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -43,8 +52,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config: Qwen3NextConfig = model_config.hf_config
 
         self.config = config
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
 
@@ -57,31 +69,36 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             org_num_embeddings=config.vocab_size,
         )
 
-        self.fc = ColumnParallelLinear(self.config.hidden_size * 2,
-                                       self.config.hidden_size,
-                                       gather_output=True,
-                                       bias=False,
-                                       return_bias=False,
-                                       quant_config=quant_config,
-                                       prefix=f'{prefix}.fc')
+        self.fc = ColumnParallelLinear(
+            self.config.hidden_size * 2,
+            self.config.hidden_size,
+            gather_output=True,
+            bias=False,
+            return_bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc",
+        )
 
         self.layers = torch.nn.ModuleList(
             Qwen3NextDecoderLayer(
                 vllm_config,
                 layer_type="full_attention",
-                prefix=f'{prefix}.layers.{idx}',
-            ) for idx in range(self.num_mtp_layers))
+                prefix=f"{prefix}.layers.{idx}",
+            )
+            for idx in range(self.num_mtp_layers)
+        )
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
-        self.norm = Qwen3NextRMSNorm(config.hidden_size,
-                                     eps=config.rms_norm_eps)
-        self.pre_fc_norm_hidden = Qwen3NextRMSNorm(config.hidden_size,
-                                                   eps=config.rms_norm_eps)
-        self.pre_fc_norm_embedding = Qwen3NextRMSNorm(config.hidden_size,
-                                                      eps=config.rms_norm_eps)
+        self.norm = Qwen3NextRMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.pre_fc_norm_hidden = Qwen3NextRMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
+        self.pre_fc_norm_embedding = Qwen3NextRMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -109,7 +126,7 @@ def forward(
             hidden_states = intermediate_tensors["hidden_states"]
             residual = intermediate_tensors["residual"]
 
-        current_step_idx = (spec_step_idx % self.num_mtp_layers)
+        current_step_idx = spec_step_idx % self.num_mtp_layers
         hidden_states, residual = self.layers[current_step_idx](
             positions=positions,
             hidden_states=hidden_states,
@@ -117,16 +134,14 @@ def forward(
         )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -142,7 +157,8 @@ def load_weights(self, weights: Iterable[tuple[str,
             ckpt_gate_proj_name="gate_proj",
             ckpt_down_proj_name="down_proj",
             ckpt_up_proj_name="up_proj",
-            num_experts=self.config.num_experts)
+            num_experts=self.config.num_experts,
+        )
 
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
@@ -180,16 +196,19 @@ def load_weights(self, weights: Iterable[tuple[str,
                     if is_pp_missing_parameter(name, self):
                         continue
                     # Skip loading extra bias for GPTQ models.
-                    if ((name.endswith(".bias") or name.endswith("_bias"))
-                            and name not in params_dict):
+                    if (
+                        name.endswith(".bias") or name.endswith("_bias")
+                    ) and name not in params_dict:
                         continue
                     param = params_dict[name]
                     weight_loader = param.weight_loader
-                    weight_loader(param,
-                                  loaded_weight,
-                                  name,
-                                  shard_id=shard_id,
-                                  expert_id=expert_id)
+                    weight_loader(
+                        param,
+                        loaded_weight,
+                        name,
+                        shard_id=shard_id,
+                        expert_id=expert_id,
+                    )
                     break
                 else:
                     # Skip loading extra bias for GPTQ models.
@@ -199,8 +218,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                         continue
 
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -214,33 +234,38 @@ class Qwen3NextMTP(nn.Module, SupportsPP):
             "k_proj",
             "v_proj",
         ],
-        "gate_up_proj": ["up_proj", "down_proj"]
+        "gate_up_proj": ["up_proj", "down_proj"],
     }
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         config = vllm_config.model_config.hf_config
         self.vllm_config = vllm_config
         cache_config = vllm_config.cache_config
-        assert not cache_config.enable_prefix_caching, \
+        assert not cache_config.enable_prefix_caching, (
             "Qwen3NextMTP currently does not support prefix caching"
+        )
 
         self.quant_config = vllm_config.quant_config
 
         super().__init__()
         self.config = config
-        self.model = Qwen3NextMultiTokenPredictor(vllm_config=vllm_config,
-                                                  prefix=maybe_prefix(
-                                                      prefix, "mtp"))
+        self.model = Qwen3NextMultiTokenPredictor(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "mtp")
+        )
         self.unpadded_vocab_size = config.vocab_size
-        self.lm_head = ParallelLMHead(self.unpadded_vocab_size,
-                                      config.hidden_size,
-                                      org_num_embeddings=config.vocab_size,
-                                      padding_size=DEFAULT_VOCAB_PADDING_SIZE,
-                                      prefix=maybe_prefix(prefix, "lm_head"))
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size)
+        self.lm_head = ParallelLMHead(
+            self.unpadded_vocab_size,
+            config.hidden_size,
+            org_num_embeddings=config.vocab_size,
+            padding_size=DEFAULT_VOCAB_PADDING_SIZE,
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size
+        )
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -254,8 +279,9 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs: object,
     ):
-        hidden_states = self.model(input_ids, positions, hidden_states,
-                                   intermediate_tensors, inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, hidden_states, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -265,8 +291,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.logits_processor(self.lm_head, hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         shared_weight_names = ["embed_tokens", "lm_head"]
 
         def remap_weight_names(weights):
diff --git a/vllm/model_executor/models/qwen3_vl.py b/vllm/model_executor/models/qwen3_vl.py
index 822c8d6d5f30..1c532376256d 100644
--- a/vllm/model_executor/models/qwen3_vl.py
+++ b/vllm/model_executor/models/qwen3_vl.py
@@ -23,6 +23,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Qwen3VL model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable, Mapping, Sequence
 from functools import partial
 from typing import Any, Callable, Optional, Union
@@ -34,13 +35,16 @@
 from transformers import BatchFeature
 from transformers.models.qwen2_vl import Qwen2VLImageProcessorFast
 from transformers.models.qwen2_vl.image_processing_qwen2_vl import (
-    smart_resize as image_smart_resize)
-from transformers.models.qwen3_vl import (Qwen3VLProcessor,
-                                          Qwen3VLVideoProcessor)
+    smart_resize as image_smart_resize,
+)
+from transformers.models.qwen3_vl import Qwen3VLProcessor, Qwen3VLVideoProcessor
 from transformers.models.qwen3_vl.configuration_qwen3_vl import (
-    Qwen3VLConfig, Qwen3VLVisionConfig)
+    Qwen3VLConfig,
+    Qwen3VLVisionConfig,
+)
 from transformers.models.qwen3_vl.video_processing_qwen3_vl import (
-    smart_resize as video_smart_resize)
+    smart_resize as video_smart_resize,
+)
 from transformers.video_utils import VideoMetadata
 
 from vllm.attention.backends.registry import _Backend
@@ -51,38 +55,56 @@
 from vllm.distributed import get_pp_group
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import _ACTIVATION_REGISTRY
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import ColumnParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItem,
-                                    MultiModalKwargsItems, VideoItem)
-from vllm.multimodal.parse import (ImageSize, MultiModalDataItems,
-                                   MultiModalDataParser)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        PromptReplacement, PromptUpdate,
-                                        PromptUpdateDetails)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItem,
+    MultiModalKwargsItems,
+    VideoItem,
+)
+from vllm.multimodal.parse import ImageSize, MultiModalDataItems, MultiModalDataParser
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils import is_list_of
 
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP)
-from .qwen2_5_vl import (Qwen2_5_VisionAttention,
-                         Qwen2_5_VisionRotaryEmbedding,
-                         Qwen2_5_VLImageEmbeddingInputs, Qwen2_5_VLImageInputs,
-                         Qwen2_5_VLImagePixelInputs,
-                         Qwen2_5_VLVideoEmbeddingInputs, Qwen2_5_VLVideoInputs,
-                         Qwen2_5_VLVideoPixelInputs)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
+from .qwen2_5_vl import (
+    Qwen2_5_VisionAttention,
+    Qwen2_5_VisionRotaryEmbedding,
+    Qwen2_5_VLImageEmbeddingInputs,
+    Qwen2_5_VLImageInputs,
+    Qwen2_5_VLImagePixelInputs,
+    Qwen2_5_VLVideoEmbeddingInputs,
+    Qwen2_5_VLVideoInputs,
+    Qwen2_5_VLVideoPixelInputs,
+)
 from .qwen2_vl import Qwen2VLProcessingInfo
 from .qwen3 import Qwen3ForCausalLM, Qwen3Model
-from .utils import (AutoWeightsLoader, PPMissingLayer, WeightsMapper,
-                    _merge_multimodal_embeddings, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    WeightsMapper,
+    _merge_multimodal_embeddings,
+    maybe_prefix,
+)
 from .vision import get_vit_attn_backend, run_dp_sharded_mrope_vision_model
 
 logger = init_logger(__name__)
@@ -92,7 +114,6 @@
 
 
 class Qwen3_VisionPatchEmbed(nn.Module):
-
     def __init__(
         self,
         patch_size: int = 14,
@@ -106,45 +127,51 @@ def __init__(
         self.hidden_size = hidden_size
 
         kernel_size = (temporal_patch_size, patch_size, patch_size)
-        self.proj = nn.Conv3d(in_channels,
-                              hidden_size,
-                              kernel_size=kernel_size,
-                              stride=kernel_size,
-                              bias=True)
+        self.proj = nn.Conv3d(
+            in_channels,
+            hidden_size,
+            kernel_size=kernel_size,
+            stride=kernel_size,
+            bias=True,
+        )
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         L, C = x.shape
-        x = x.view(L, -1, self.temporal_patch_size, self.patch_size,
-                   self.patch_size)
+        x = x.view(L, -1, self.temporal_patch_size, self.patch_size, self.patch_size)
         x = self.proj(x).view(L, self.hidden_size)
         return x
 
 
 class Qwen3_VisionMLP(nn.Module):
-
-    def __init__(self,
-                 in_features: int,
-                 hidden_features: int,
-                 bias: bool = False,
-                 act_fn: Callable[[torch.Tensor], torch.Tensor] = F.silu,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "",
-                 use_data_parallel: bool = False):
+    def __init__(
+        self,
+        in_features: int,
+        hidden_features: int,
+        bias: bool = False,
+        act_fn: Callable[[torch.Tensor], torch.Tensor] = F.silu,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+        use_data_parallel: bool = False,
+    ):
         super().__init__()
-        self.linear_fc1 = ColumnParallelLinear(in_features,
-                                               hidden_features,
-                                               bias=bias,
-                                               quant_config=quant_config,
-                                               return_bias=False,
-                                               prefix=f"{prefix}.linear_fc1",
-                                               disable_tp=use_data_parallel)
-        self.linear_fc2 = RowParallelLinear(hidden_features,
-                                            in_features,
-                                            bias=bias,
-                                            quant_config=quant_config,
-                                            return_bias=False,
-                                            prefix=f"{prefix}.linear_fc2",
-                                            disable_tp=use_data_parallel)
+        self.linear_fc1 = ColumnParallelLinear(
+            in_features,
+            hidden_features,
+            bias=bias,
+            quant_config=quant_config,
+            return_bias=False,
+            prefix=f"{prefix}.linear_fc1",
+            disable_tp=use_data_parallel,
+        )
+        self.linear_fc2 = RowParallelLinear(
+            hidden_features,
+            in_features,
+            bias=bias,
+            quant_config=quant_config,
+            return_bias=False,
+            prefix=f"{prefix}.linear_fc2",
+            disable_tp=use_data_parallel,
+        )
         self.act_fn = act_fn
 
     def forward(self, x: torch.Tensor):
@@ -153,7 +180,6 @@ def forward(self, x: torch.Tensor):
 
 
 class Qwen3_VisionBlock(nn.Module):
-
     def __init__(
         self,
         dim: int,
@@ -180,35 +206,39 @@ def __init__(
             prefix=f"{prefix}.attn",
             use_data_parallel=use_data_parallel,
             attn_backend=attn_backend,
-            use_upstream_fa=use_upstream_fa)
-        self.mlp = Qwen3_VisionMLP(dim,
-                                   mlp_hidden_dim,
-                                   act_fn=act_fn,
-                                   bias=True,
-                                   quant_config=quant_config,
-                                   prefix=f"{prefix}.mlp",
-                                   use_data_parallel=use_data_parallel)
+            use_upstream_fa=use_upstream_fa,
+        )
+        self.mlp = Qwen3_VisionMLP(
+            dim,
+            mlp_hidden_dim,
+            act_fn=act_fn,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.mlp",
+            use_data_parallel=use_data_parallel,
+        )
 
     def forward(
-            self,
-            x: torch.Tensor,
-            cu_seqlens: torch.Tensor,
-            rotary_pos_emb: torch.Tensor,
-            max_seqlen: Optional[int] = None,  # Only used for Flash Attention
-            seqlens: Optional[list[int]] = None,  # Only used for xFormers
+        self,
+        x: torch.Tensor,
+        cu_seqlens: torch.Tensor,
+        rotary_pos_emb: torch.Tensor,
+        max_seqlen: Optional[int] = None,  # Only used for Flash Attention
+        seqlens: Optional[list[int]] = None,  # Only used for xFormers
     ) -> torch.Tensor:
-        x = x + self.attn(self.norm1(x),
-                          cu_seqlens=cu_seqlens,
-                          rotary_pos_emb=rotary_pos_emb,
-                          max_seqlen=max_seqlen,
-                          seqlens=seqlens)
+        x = x + self.attn(
+            self.norm1(x),
+            cu_seqlens=cu_seqlens,
+            rotary_pos_emb=rotary_pos_emb,
+            max_seqlen=max_seqlen,
+            seqlens=seqlens,
+        )
 
         x = x + self.mlp(self.norm2(x))
         return x
 
 
 class Qwen3_VisionPatchMerger(nn.Module):
-
     def __init__(
         self,
         d_model: int,
@@ -230,19 +260,23 @@ def __init__(
         if norm_layer is None:
             norm_layer = partial(nn.LayerNorm, eps=1e-6)
         self.norm = norm_layer(context_dim)
-        self.linear_fc1 = ColumnParallelLinear(self.hidden_size,
-                                               self.hidden_size,
-                                               bias=True,
-                                               quant_config=quant_config,
-                                               prefix=f"{prefix}.linear_fc1",
-                                               disable_tp=use_data_parallel)
+        self.linear_fc1 = ColumnParallelLinear(
+            self.hidden_size,
+            self.hidden_size,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.linear_fc1",
+            disable_tp=use_data_parallel,
+        )
         self.act_fn = nn.GELU()
-        self.linear_fc2 = RowParallelLinear(self.hidden_size,
-                                            d_model,
-                                            bias=True,
-                                            quant_config=quant_config,
-                                            prefix=f"{prefix}.linear_fc2",
-                                            disable_tp=use_data_parallel)
+        self.linear_fc2 = RowParallelLinear(
+            self.hidden_size,
+            d_model,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.linear_fc2",
+            disable_tp=use_data_parallel,
+        )
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         if self.use_postshuffle_norm:
@@ -257,7 +291,6 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class Qwen3_VisionTransformer(nn.Module):
-
     def __init__(
         self,
         vision_config: Qwen3VLVisionConfig,
@@ -280,8 +313,9 @@ def __init__(
 
         # NOTE: This is used for creating empty tensor for all_gather for
         # DP ViT. Here out_hidden_size is enlarged due to deepstack
-        self.out_hidden_size = (vision_config.out_hidden_size *
-                                (1 + len(self.deepstack_visual_indexes)))
+        self.out_hidden_size = vision_config.out_hidden_size * (
+            1 + len(self.deepstack_visual_indexes)
+        )
 
         self.patch_embed = Qwen3_VisionPatchEmbed(
             patch_size=self.patch_size,
@@ -290,8 +324,7 @@ def __init__(
             hidden_size=self.hidden_size,
         )
 
-        self.pos_embed = nn.Embedding(self.num_position_embeddings,
-                                      self.hidden_size)
+        self.pos_embed = nn.Embedding(self.num_position_embeddings, self.hidden_size)
 
         norm_layer = partial(nn.LayerNorm, eps=norm_eps)
         head_dim = self.hidden_size // self.num_heads
@@ -307,50 +340,61 @@ def __init__(
             use_data_parallel=use_data_parallel,
         )
 
-        self.deepstack_merger_list = nn.ModuleList([
-            Qwen3_VisionPatchMerger(
-                d_model=vision_config.out_hidden_size,
-                context_dim=self.hidden_size,
-                spatial_merge_size=self.spatial_merge_size,
-                use_postshuffle_norm=True,
-                norm_layer=norm_layer,
-                quant_config=quant_config,
-                prefix=f"{prefix}.deepstack_merger_list.{layer_idx}",
-                use_data_parallel=use_data_parallel)
-            for layer_idx in range(len(self.deepstack_visual_indexes))
-        ])
+        self.deepstack_merger_list = nn.ModuleList(
+            [
+                Qwen3_VisionPatchMerger(
+                    d_model=vision_config.out_hidden_size,
+                    context_dim=self.hidden_size,
+                    spatial_merge_size=self.spatial_merge_size,
+                    use_postshuffle_norm=True,
+                    norm_layer=norm_layer,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.deepstack_merger_list.{layer_idx}",
+                    use_data_parallel=use_data_parallel,
+                )
+                for layer_idx in range(len(self.deepstack_visual_indexes))
+            ]
+        )
 
         self.attn_backend = get_vit_attn_backend(
-            head_size=head_dim, dtype=torch.get_default_dtype())
+            head_size=head_dim, dtype=torch.get_default_dtype()
+        )
         use_upstream_fa = False
-        if self.attn_backend != _Backend.FLASH_ATTN and \
-            self.attn_backend != _Backend.ROCM_AITER_FA and \
-            check_upstream_fa_availability(
-                torch.get_default_dtype()):
+        if (
+            self.attn_backend != _Backend.FLASH_ATTN
+            and self.attn_backend != _Backend.ROCM_AITER_FA
+            and check_upstream_fa_availability(torch.get_default_dtype())
+        ):
             self.attn_backend = _Backend.FLASH_ATTN
             use_upstream_fa = True
 
         if self.attn_backend not in {
-                _Backend.FLASH_ATTN, _Backend.TORCH_SDPA, _Backend.XFORMERS,
-                _Backend.ROCM_AITER_FA
+            _Backend.FLASH_ATTN,
+            _Backend.TORCH_SDPA,
+            _Backend.XFORMERS,
+            _Backend.ROCM_AITER_FA,
         }:
             raise RuntimeError(
-                f"Qwen3-VL does not support {self.attn_backend} backend now.")
-
-        self.blocks = nn.ModuleList([
-            Qwen3_VisionBlock(
-                dim=self.hidden_size,
-                num_heads=self.num_heads,
-                mlp_hidden_dim=vision_config.intermediate_size,
-                act_fn=_ACTIVATION_REGISTRY[vision_config.hidden_act],
-                norm_layer=norm_layer,
-                quant_config=quant_config,
-                prefix=f"{prefix}.blocks.{layer_idx}",
-                use_data_parallel=use_data_parallel,
-                attn_backend=self.attn_backend,
-                use_upstream_fa=use_upstream_fa)
-            for layer_idx in range(vision_config.depth)
-        ])
+                f"Qwen3-VL does not support {self.attn_backend} backend now."
+            )
+
+        self.blocks = nn.ModuleList(
+            [
+                Qwen3_VisionBlock(
+                    dim=self.hidden_size,
+                    num_heads=self.num_heads,
+                    mlp_hidden_dim=vision_config.intermediate_size,
+                    act_fn=_ACTIVATION_REGISTRY[vision_config.hidden_act],
+                    norm_layer=norm_layer,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.blocks.{layer_idx}",
+                    use_data_parallel=use_data_parallel,
+                    attn_backend=self.attn_backend,
+                    use_upstream_fa=use_upstream_fa,
+                )
+                for layer_idx in range(vision_config.depth)
+            ]
+        )
 
     @property
     def dtype(self) -> torch.dtype:
@@ -389,32 +433,25 @@ def rot_pos_emb(self, grid_thw):
             )
             wpos_ids = wpos_ids.permute(0, 2, 1, 3)
             wpos_ids = wpos_ids.flatten()
-            pos_ids.append(
-                torch.stack([hpos_ids, wpos_ids], dim=-1).repeat(t, 1))
+            pos_ids.append(torch.stack([hpos_ids, wpos_ids], dim=-1).repeat(t, 1))
         pos_ids = torch.cat(pos_ids, dim=0)
         rotary_pos_emb_full = self.rotary_pos_emb(max_grid_size)
         rotary_pos_emb = rotary_pos_emb_full[pos_ids].flatten(1)
         return rotary_pos_emb
 
-    def fast_pos_embed_interpolate(self,
-                                   grid_thw: list[list[int]]) -> torch.Tensor:
-
+    def fast_pos_embed_interpolate(self, grid_thw: list[list[int]]) -> torch.Tensor:
         num_grid_per_side = self.num_grid_per_side
         m_size = self.spatial_merge_size
         hidden_dim = self.pos_embed.embedding_dim
 
         outputs = []
         for t, h, w in grid_thw:
-            h_idxs = torch.linspace(0,
-                                    num_grid_per_side - 1,
-                                    h,
-                                    dtype=torch.float32,
-                                    device=self.device)
-            w_idxs = torch.linspace(0,
-                                    num_grid_per_side - 1,
-                                    w,
-                                    dtype=torch.float32,
-                                    device=self.device)
+            h_idxs = torch.linspace(
+                0, num_grid_per_side - 1, h, dtype=torch.float32, device=self.device
+            )
+            w_idxs = torch.linspace(
+                0, num_grid_per_side - 1, w, dtype=torch.float32, device=self.device
+            )
 
             h_floor = h_idxs.to(torch.long)
             w_floor = w_idxs.to(torch.long)
@@ -425,13 +462,9 @@ def fast_pos_embed_interpolate(self,
             dw = w_idxs - w_floor
 
             # Create meshgrid view for all h, w vars
-            dh_grid, dw_grid = torch.meshgrid(dh, dw, indexing='ij')
-            h_floor_grid, w_floor_grid = torch.meshgrid(h_floor,
-                                                        w_floor,
-                                                        indexing='ij')
-            h_ceil_grid, w_ceil_grid = torch.meshgrid(h_ceil,
-                                                      w_ceil,
-                                                      indexing='ij')
+            dh_grid, dw_grid = torch.meshgrid(dh, dw, indexing="ij")
+            h_floor_grid, w_floor_grid = torch.meshgrid(h_floor, w_floor, indexing="ij")
+            h_ceil_grid, w_ceil_grid = torch.meshgrid(h_ceil, w_ceil, indexing="ij")
             h_floor_grid_idx = h_floor_grid * num_grid_per_side
             h_ceil_grid_idx = h_ceil_grid * num_grid_per_side
 
@@ -452,10 +485,8 @@ def fast_pos_embed_interpolate(self,
             idx10 = h_ceil_grid_idx + w_floor_grid
             idx11 = h_ceil_grid_idx + w_ceil_grid
 
-            indices = torch.stack([idx00, idx01, idx10, idx11],
-                                  dim=0).reshape(4, -1)
-            weights = torch.stack([w00, w01, w10, w11],
-                                  dim=0).reshape(4, -1, 1)
+            indices = torch.stack([idx00, idx01, idx10, idx11], dim=0).reshape(4, -1)
+            weights = torch.stack([w00, w01, w10, w11], dim=0).reshape(4, -1, 1)
             weights = weights.to(dtype=self.dtype, device=self.device)
 
             embeds = self.pos_embed(indices)
@@ -465,10 +496,10 @@ def fast_pos_embed_interpolate(self,
 
             combined = combined.view(h * w, hidden_dim)
             repeated = combined.unsqueeze(0).expand(t, -1, -1).contiguous()
-            repeated = repeated.view(t, h // m_size, m_size, w // m_size,
-                                     m_size, hidden_dim)
-            repeated = repeated.permute(0, 1, 3, 2, 4,
-                                        5).reshape(-1, hidden_dim)
+            repeated = repeated.view(
+                t, h // m_size, m_size, w // m_size, m_size, hidden_dim
+            )
+            repeated = repeated.permute(0, 1, 3, 2, 4, 5).reshape(-1, hidden_dim)
             outputs.append(repeated)
 
         return torch.cat(outputs, dim=0)
@@ -478,8 +509,10 @@ def compute_attn_mask_seqlen(
         cu_seqlens: torch.Tensor,
     ) -> tuple[Optional[int], Optional[list[int]]]:
         max_seqlen, seqlens = None, None
-        if (self.attn_backend == _Backend.FLASH_ATTN
-                or self.attn_backend == _Backend.ROCM_AITER_FA):
+        if (
+            self.attn_backend == _Backend.FLASH_ATTN
+            or self.attn_backend == _Backend.ROCM_AITER_FA
+        ):
             max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
         elif self.attn_backend == _Backend.XFORMERS:
             seqlens = (cu_seqlens[1:] - cu_seqlens[:-1]).tolist()
@@ -497,17 +530,14 @@ def forward(
         hidden_states = hidden_states + pos_embeds
         rotary_pos_emb = self.rot_pos_emb(grid_thw)
 
-        grid_thw_tensor = torch.tensor(grid_thw,
-                                       device=self.device,
-                                       dtype=torch.int32)
+        grid_thw_tensor = torch.tensor(grid_thw, device=self.device, dtype=torch.int32)
 
         cu_seqlens = torch.repeat_interleave(
-            grid_thw_tensor[:, 1] * grid_thw_tensor[:, 2],
-            grid_thw_tensor[:, 0]).cumsum(
-                dim=0,
-                dtype=grid_thw_tensor.dtype
-                if torch.jit.is_tracing() else torch.int32,
-            )
+            grid_thw_tensor[:, 1] * grid_thw_tensor[:, 2], grid_thw_tensor[:, 0]
+        ).cumsum(
+            dim=0,
+            dtype=grid_thw_tensor.dtype if torch.jit.is_tracing() else torch.int32,
+        )
         cu_seqlens = F.pad(cu_seqlens, (1, 0), value=0)
 
         hidden_states = hidden_states.unsqueeze(1)
@@ -516,25 +546,26 @@ def forward(
 
         deepstack_feature_lists = []
         for layer_num, blk in enumerate(self.blocks):
-            hidden_states = blk(hidden_states,
-                                cu_seqlens=cu_seqlens,
-                                rotary_pos_emb=rotary_pos_emb,
-                                max_seqlen=max_seqlen,
-                                seqlens=seqlens)
+            hidden_states = blk(
+                hidden_states,
+                cu_seqlens=cu_seqlens,
+                rotary_pos_emb=rotary_pos_emb,
+                max_seqlen=max_seqlen,
+                seqlens=seqlens,
+            )
             if layer_num in self.deepstack_visual_indexes:
-                deepstack_merger_idx = self.deepstack_visual_indexes.index(
-                    layer_num)
-                deepstack_feature = self.deepstack_merger_list[
-                    deepstack_merger_idx](hidden_states)
+                deepstack_merger_idx = self.deepstack_visual_indexes.index(layer_num)
+                deepstack_feature = self.deepstack_merger_list[deepstack_merger_idx](
+                    hidden_states
+                )
                 deepstack_feature_lists.append(deepstack_feature)
         hidden_states = self.merger(hidden_states)
         hidden_states = torch.cat(
-            [hidden_states] + deepstack_feature_lists,
-            dim=1)  # [seq_len, hidden_size * (1 + depth_of_deepstack)]
+            [hidden_states] + deepstack_feature_lists, dim=1
+        )  # [seq_len, hidden_size * (1 + depth_of_deepstack)]
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("attn.qkv.", "attn.q.", "q"),
@@ -545,7 +576,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         loaded_params: set[str] = set()
 
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -556,15 +587,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class Qwen3VLProcessingInfo(Qwen2VLProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(Qwen3VLConfig)
 
@@ -578,8 +607,7 @@ def get_hf_processor(self, **kwargs: object) -> Qwen3VLProcessor:
     def get_tokenizer(self):
         return self.ctx.tokenizer
 
-    def get_image_processor(self,
-                            **kwargs: object) -> Qwen2VLImageProcessorFast:
+    def get_image_processor(self, **kwargs: object) -> Qwen2VLImageProcessorFast:
         return self.get_hf_processor(**kwargs).image_processor
 
     def get_video_processor(self, **kwargs: object) -> Qwen3VLVideoProcessor:
@@ -592,8 +620,9 @@ def _get_vision_info(
         image_height: int,
         num_frames: int = 2,
         do_resize: bool = True,
-        image_processor: Optional[Union[Qwen2VLImageProcessorFast,
-                                        Qwen3VLVideoProcessor]],
+        image_processor: Optional[
+            Union[Qwen2VLImageProcessorFast, Qwen3VLVideoProcessor]
+        ],
     ) -> tuple[ImageSize, int]:
         if image_processor is None and num_frames > 1:
             image_processor = self.get_video_processor()
@@ -613,7 +642,7 @@ def _get_vision_info(
                 smart_resize = video_smart_resize
                 extra_kwargs = {
                     "num_frames": num_frames,
-                    "temporal_factor": temporal_patch_size
+                    "temporal_factor": temporal_patch_size,
                 }
             else:
                 smart_resize = image_smart_resize
@@ -626,11 +655,9 @@ def _get_vision_info(
                 max_pixels=image_processor.size["longest_edge"],
                 **extra_kwargs,
             )
-            preprocessed_size = ImageSize(width=resized_width,
-                                          height=resized_height)
+            preprocessed_size = ImageSize(width=resized_width, height=resized_height)
         else:
-            preprocessed_size = ImageSize(width=image_width,
-                                          height=image_height)
+            preprocessed_size = ImageSize(width=image_width, height=image_height)
 
         padded_num_frames = num_frames + num_frames % temporal_patch_size
 
@@ -643,11 +670,10 @@ def _get_vision_info(
 
         return preprocessed_size, num_vision_tokens
 
-    def _get_max_video_frames(self,
-                              max_tokens: int,
-                              start_num_frames: int = 2) -> int:
-        return super()._get_max_video_frames(max_tokens,
-                                             start_num_frames=start_num_frames)
+    def _get_max_video_frames(self, max_tokens: int, start_num_frames: int = 2) -> int:
+        return super()._get_max_video_frames(
+            max_tokens, start_num_frames=start_num_frames
+        )
 
     def get_num_frames_with_most_features(
         self,
@@ -655,7 +681,8 @@ def get_num_frames_with_most_features(
         mm_counts: Mapping[str, int],
     ) -> int:
         return super().get_num_frames_with_most_features(
-            seq_len, mm_counts, max_frames_per_video=_MAX_FRAMES_PER_VIDEO)
+            seq_len, mm_counts, max_frames_per_video=_MAX_FRAMES_PER_VIDEO
+        )
 
     def get_max_video_tokens(
         self,
@@ -666,8 +693,7 @@ def get_max_video_tokens(
         video_soft_tokens = self.get_num_video_tokens(
             image_width=target_width,
             image_height=target_height,
-            num_frames=self.get_num_frames_with_most_features(
-                seq_len, mm_counts),
+            num_frames=self.get_num_frames_with_most_features(seq_len, mm_counts),
             image_processor=None,
         )
 
@@ -676,25 +702,28 @@ def get_max_video_tokens(
         formatted_video_soft_tokens = video_soft_tokens * 12.5
         return int(formatted_video_soft_tokens)
 
-    def _calculate_timestamps(self, indices: list[int] | torch.Tensor,
-                              video_fps: float, merge_size: int):
+    def _calculate_timestamps(
+        self, indices: list[int] | torch.Tensor, video_fps: float, merge_size: int
+    ):
         if not isinstance(indices, list):
             indices = indices.tolist()
         if len(indices) % merge_size != 0:
             # don't update metadata's frames_indices directly
-            indices = indices + [indices[-1]
-                                 ] * (merge_size - len(indices) % merge_size)
+            indices = indices + [indices[-1]] * (merge_size - len(indices) % merge_size)
         timestamps = [idx / video_fps for idx in indices]
-        timestamps = [(timestamps[i] + timestamps[i + merge_size - 1]) / 2
-                      for i in range(0, len(timestamps), merge_size)]
+        timestamps = [
+            (timestamps[i] + timestamps[i + merge_size - 1]) / 2
+            for i in range(0, len(timestamps), merge_size)
+        ]
         return timestamps
 
     def _get_video_second_idx(
-            self,
-            metadata: dict[str, Any],
-            out_item: MultiModalKwargsItem,
-            do_sample_frames: Optional[bool] = None,
-            sampled_fps: Optional[float] = None) -> list[int]:
+        self,
+        metadata: dict[str, Any],
+        out_item: MultiModalKwargsItem,
+        do_sample_frames: Optional[bool] = None,
+        sampled_fps: Optional[float] = None,
+    ) -> list[int]:
         video_processor = self.get_video_processor()
         merge_size = video_processor.merge_size
         indices = metadata["frames_indices"]
@@ -714,16 +743,23 @@ def _get_video_second_idx(
             total_num_frames = metadata["total_num_frames"]
             num_frames = int(total_num_frames / metadata["fps"] * video_fps)
             num_frames = min(
-                min(max(num_frames, video_processor.min_frames),
-                    video_processor.max_frames), total_num_frames)
-            indices = np.linspace(0, total_num_frames - 1,
-                                  num_frames).round().astype(int).tolist()
+                min(
+                    max(num_frames, video_processor.min_frames),
+                    video_processor.max_frames,
+                ),
+                total_num_frames,
+            )
+            indices = (
+                np.linspace(0, total_num_frames - 1, num_frames)
+                .round()
+                .astype(int)
+                .tolist()
+            )
         timestamps = self._calculate_timestamps(indices, video_fps, merge_size)
         return timestamps
 
 
 class Qwen3VLDummyInputsBuilder(BaseDummyInputsBuilder[Qwen3VLProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
         num_videos = mm_counts.get("video", 0)
@@ -744,10 +780,10 @@ def get_dummy_mm_data(
         image_overrides = mm_options.get("image") if mm_options else None
         video_overrides = mm_options.get("video") if mm_options else None
 
-        target_width, target_height = (
-            self.info.get_image_size_with_most_features())
+        target_width, target_height = self.info.get_image_size_with_most_features()
         target_num_frames = self.info.get_num_frames_with_most_features(
-            seq_len, mm_counts)
+            seq_len, mm_counts
+        )
 
         if video_overrides:
             assert isinstance(video_overrides, VideoDummyOptions)
@@ -757,11 +793,15 @@ def get_dummy_mm_data(
                     logger.warning(
                         "video.num_frames override (%d) exceeds model's "
                         "maximum number of frames (%d), will be ignored",
-                        num_frames_override, target_num_frames)
+                        num_frames_override,
+                        target_num_frames,
+                    )
                 if num_frames_override < 2:
                     logger.warning(
                         "video.num_frames override (%d) cannot be less "
-                        "than 2, will be ignored", num_frames_override)
+                        "than 2, will be ignored",
+                        num_frames_override,
+                    )
                 target_num_frames = min(target_num_frames, num_frames_override)
         target_num_frames = max(target_num_frames, 2)
 
@@ -781,8 +821,10 @@ def get_dummy_mm_data(
                 if width_override > width:
                     logger.warning(
                         "video.width override (%d) exceeds model's "
-                        "maximum width (%d), will be ignored", width_override,
-                        width)
+                        "maximum width (%d), will be ignored",
+                        width_override,
+                        width,
+                    )
                 width = min(width, width_override)
             height_override = video_overrides.height
             if height_override:
@@ -790,17 +832,19 @@ def get_dummy_mm_data(
                     logger.warning(
                         "video.height override (%d) exceeds model's "
                         "maximum height (%d), will be ignored",
-                        height_override, height)
+                        height_override,
+                        height,
+                    )
                 height = min(height, height_override)
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
-            "video":
-            self._get_dummy_videos(
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
+            "video": self._get_dummy_videos(
                 width=width,
                 height=height,
                 num_frames=target_num_frames,
@@ -832,9 +876,7 @@ def _get_dummy_videos(
         return video_items
 
 
-class Qwen3VLMultiModalProcessor(BaseMultiModalProcessor[Qwen3VLProcessingInfo]
-                                 ):
-
+class Qwen3VLMultiModalProcessor(BaseMultiModalProcessor[Qwen3VLProcessingInfo]):
     def _get_data_parser(self) -> MultiModalDataParser:
         return MultiModalDataParser(video_needs_metadata=True)
 
@@ -850,8 +892,11 @@ def _call_hf_processor(
 
         # Separate video processing from image processing. Because the videos
         # are processed into serval image patches
-        if ("videos" in mm_data and isinstance(mm_data["videos"], list)
-                and len(mm_data["videos"]) > 0):
+        if (
+            "videos" in mm_data
+            and isinstance(mm_data["videos"], list)
+            and len(mm_data["videos"]) > 0
+        ):
             video_grid_thw_lst = []
             pixel_values_videos_lst = []
 
@@ -870,12 +915,12 @@ def _call_hf_processor(
                     # qwen_vl_utils already has "do_sample_frames" in
                     # mm_kwargs, don't overwrite it.
                     video_mm_kwargs["do_sample_frames"] = metadata.get(
-                        "do_sample_frames", False)
+                        "do_sample_frames", False
+                    )
 
-                metadata = VideoMetadata(**{
-                    k: metadata[k]
-                    for k in metadata if k != "do_sample_frames"
-                })
+                metadata = VideoMetadata(
+                    **{k: metadata[k] for k in metadata if k != "do_sample_frames"}
+                )
 
                 video_mm_data = dict()
                 video_mm_data["videos"] = [[video_array]]
@@ -888,8 +933,7 @@ def _call_hf_processor(
                     tok_kwargs=tok_kwargs,
                 )
                 input_ids = video_outputs.pop("input_ids")
-                video_placeholder = processor.tokenizer.batch_decode(
-                    input_ids)[0]
+                video_placeholder = processor.tokenizer.batch_decode(input_ids)[0]
                 prompt = prompt.replace(
                     "<|vision_start|><|video_pad|><|vision_end|>",
                     video_placeholder,
@@ -897,8 +941,7 @@ def _call_hf_processor(
                 )
 
                 video_grid_thw_lst.append(video_outputs["video_grid_thw"])
-                pixel_values_videos_lst.append(
-                    video_outputs["pixel_values_videos"])
+                pixel_values_videos_lst.append(video_outputs["pixel_values_videos"])
             video_outputs = dict(
                 pixel_values_videos=torch.cat(pixel_values_videos_lst),
                 video_grid_thw=torch.cat(video_grid_thw_lst),
@@ -931,14 +974,18 @@ def _get_mm_fields_config(
 
         return dict(
             pixel_values=MultiModalFieldConfig.flat_from_sizes(
-                "image", image_grid_sizes),
+                "image", image_grid_sizes
+            ),
             image_embeds=MultiModalFieldConfig.flat_from_sizes(
-                "image", image_grid_sizes),
+                "image", image_grid_sizes
+            ),
             image_grid_thw=MultiModalFieldConfig.batched("image"),
             pixel_values_videos=MultiModalFieldConfig.flat_from_sizes(
-                "video", video_grid_sizes),
+                "video", video_grid_sizes
+            ),
             video_embeds=MultiModalFieldConfig.flat_from_sizes(
-                "video", video_grid_sizes),
+                "video", video_grid_sizes
+            ),
             video_grid_thw=MultiModalFieldConfig.batched("video"),
         )
 
@@ -949,8 +996,7 @@ def _get_prompt_updates(
         out_mm_kwargs: MultiModalKwargsItems,
     ) -> Sequence[PromptUpdate]:
         hf_processor = self.info.get_hf_processor(**hf_processor_mm_kwargs)
-        image_processor = self.info.get_image_processor(
-            **hf_processor_mm_kwargs)
+        image_processor = self.info.get_image_processor(**hf_processor_mm_kwargs)
         tokenizer = self.info.get_tokenizer()
         hf_config = self.info.get_hf_config()
 
@@ -979,26 +1025,28 @@ def get_video_replacement_qwen3vl(item_idx: int):
             if is_list_of(sampled_fps, float):
                 sampled_fps = sampled_fps[item_idx]
             timestamps = self.info._get_video_second_idx(
-                metadata, out_item, do_sample_frames, sampled_fps)
+                metadata, out_item, do_sample_frames, sampled_fps
+            )
 
             assert len(timestamps) == grid_thw[0], (
                 f"The timestamps length({len(timestamps)}) should be equal "
-                f"video length ({grid_thw[0]}).")
+                f"video length ({grid_thw[0]})."
+            )
 
             frames_idx_token = [
-                tokenizer.encode(f"<{curr_time:.1f} seconds>",
-                                 add_special_tokens=False)
+                tokenizer.encode(f"<{curr_time:.1f} seconds>", add_special_tokens=False)
                 for curr_time in timestamps
             ]
             num_tokens_per_frame = int(grid_thw[1:].prod()) // merge_length
             placeholder = []
             for frame_idx in frames_idx_token:
                 placeholder.extend(frame_idx)
-                placeholder.extend([vision_start_token_id] +
-                                   [video_token_id] * num_tokens_per_frame +
-                                   [vision_end_token_id])
-            return PromptUpdateDetails.select_token_id(placeholder,
-                                                       video_token_id)
+                placeholder.extend(
+                    [vision_start_token_id]
+                    + [video_token_id] * num_tokens_per_frame
+                    + [vision_end_token_id]
+                )
+            return PromptUpdateDetails.select_token_id(placeholder, video_token_id)
 
         return [
             PromptReplacement(
@@ -1006,7 +1054,6 @@ def get_video_replacement_qwen3vl(item_idx: int):
                 target=hf_processor.image_token,
                 replacement=get_image_replacement_qwen3vl,
             ),
-
             # NOTE: We match string on purpose since searching sequence of
             # token ids takes more time.
             PromptReplacement(
@@ -1026,18 +1073,19 @@ def get_video_replacement_qwen3vl(item_idx: int):
         "intermediate_tensors": 0,
         "inputs_embeds": 0,
         # the same shape as input_embeds
-        "deepstack_input_embeds": 0
-    })
+        "deepstack_input_embeds": 0,
+    }
+)
 class Qwen3LLMModel(Qwen3Model):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(vllm_config=vllm_config, prefix=prefix)
         if not get_pp_group().is_first_rank:
             assert self.start_layer >= len(
-                vllm_config.model_config.hf_config.vision_config.
-                deepstack_visual_indexes), (
-                    "start_layer should be greater than or equal to "
-                    "len(deepstack_visual_indexes)")
+                vllm_config.model_config.hf_config.vision_config.deepstack_visual_indexes
+            ), (
+                "start_layer should be greater than or equal to "
+                "len(deepstack_visual_indexes)"
+            )
 
     def forward(
         self,
@@ -1059,7 +1107,8 @@ def forward(
             hidden_states = intermediate_tensors["hidden_states"]
             residual = intermediate_tensors["residual"]
         for layer_idx, layer in enumerate(
-                self.layers[self.start_layer:self.end_layer]):
+            self.layers[self.start_layer : self.end_layer]
+        ):
             layer_idx = layer_idx + self.start_layer
 
             hidden_states, residual = layer(
@@ -1068,22 +1117,23 @@ def forward(
                 residual,
             )
 
-            if deepstack_input_embeds is not None and \
-                    layer_idx in range(0, len(deepstack_input_embeds)):
-                hidden_states = hidden_states + deepstack_input_embeds[
-                    f"deepstack_input_embeds_{layer_idx}"]
+            if deepstack_input_embeds is not None and layer_idx in range(
+                0, len(deepstack_input_embeds)
+            ):
+                hidden_states = (
+                    hidden_states
+                    + deepstack_input_embeds[f"deepstack_input_embeds_{layer_idx}"]
+                )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
 
 class Qwen3LLMForCausalLM(Qwen3ForCausalLM):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super(Qwen3ForCausalLM, self).__init__()
         config = vllm_config.model_config.hf_config.text_config
@@ -1100,24 +1150,30 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             if config.tie_word_embeddings:
                 self.lm_head = self.model.embed_tokens
             else:
-                self.lm_head = ParallelLMHead(config.vocab_size,
-                                              config.hidden_size,
-                                              quant_config=quant_config,
-                                              prefix="lm_head")
+                self.lm_head = ParallelLMHead(
+                    config.vocab_size,
+                    config.hidden_size,
+                    quant_config=quant_config,
+                    prefix="lm_head",
+                )
         else:
             self.lm_head = PPMissingLayer()
 
         self.logits_processor = LogitsProcessor(config.vocab_size)
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
 
-@MULTIMODAL_REGISTRY.register_processor(Qwen3VLMultiModalProcessor,
-                                        info=Qwen3VLProcessingInfo,
-                                        dummy_inputs=Qwen3VLDummyInputsBuilder)
-class Qwen3VLForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                      SupportsLoRA, SupportsPP):
+@MULTIMODAL_REGISTRY.register_processor(
+    Qwen3VLMultiModalProcessor,
+    info=Qwen3VLProcessingInfo,
+    dummy_inputs=Qwen3VLDummyInputsBuilder,
+)
+class Qwen3VLForConditionalGeneration(
+    nn.Module, SupportsMultiModal, SupportsLoRA, SupportsPP
+):
     packed_modules_mapping = {
         "qkv_proj": [
             "q_proj",
@@ -1138,7 +1194,8 @@ class Qwen3VLForConditionalGeneration(nn.Module, SupportsMultiModal,
             "model.visual.": "visual.",
             "lm_head.": "language_model.lm_head.",
             "model.language_model.": "language_model.model.",
-        })
+        }
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -1158,8 +1215,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "model"):
         self.config = config
         self.multimodal_config = multimodal_config
         self.use_data_parallel = multimodal_config.mm_encoder_tp_mode == "data"
-        if not multimodal_config.get_limit_per_prompt("image") and \
-            not multimodal_config.get_limit_per_prompt("video"):
+        if not multimodal_config.get_limit_per_prompt(
+            "image"
+        ) and not multimodal_config.get_limit_per_prompt("video"):
             self.visual = None
         else:
             self.visual = Qwen3_VisionTransformer(
@@ -1170,25 +1228,27 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "model"):
                 use_data_parallel=self.use_data_parallel,
             )
 
-        self.language_model = Qwen3LLMForCausalLM(vllm_config=vllm_config,
-                                                  prefix=maybe_prefix(
-                                                      prefix,
-                                                      "language_model"))
+        self.language_model = Qwen3LLMForCausalLM(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "language_model")
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
-        self.use_deepstack = hasattr(config.vision_config,
-                                     'deepstack_visual_indexes')
-        self.deepstack_num_level = len(
-            config.vision_config.deepstack_visual_indexes
-        ) if self.use_deepstack else 0
+        self.use_deepstack = hasattr(config.vision_config, "deepstack_visual_indexes")
+        self.deepstack_num_level = (
+            len(config.vision_config.deepstack_visual_indexes)
+            if self.use_deepstack
+            else 0
+        )
         # register buffer for deepstack
         if self.use_deepstack and self.visual is not None:
             self.deepstack_input_embeds = [
                 torch.zeros(
                     vllm_config.scheduler_config.max_num_batched_tokens,
-                    config.text_config.hidden_size)
+                    config.text_config.hidden_size,
+                )
                 for _ in range(self.deepstack_num_level)
             ]
         else:
@@ -1196,30 +1256,34 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "model"):
         self.visual_dim = config.vision_config.out_hidden_size
         self.multiscale_dim = self.visual_dim * self.deepstack_num_level
 
-    def _get_deepstack_input_embeds(self,
-                                    num_tokens: int) -> IntermediateTensors:
+    def _get_deepstack_input_embeds(self, num_tokens: int) -> IntermediateTensors:
         # get deepstack_input_embeds from buffer, and clear the buffer
-        return IntermediateTensors({
-            f"deepstack_input_embeds_{idx}":
-            self.deepstack_input_embeds[idx][:num_tokens]
-            for idx in range(self.deepstack_num_level)
-        })
-
-    def _set_deepstack_input_embeds(
-            self, deepstack_input_embeds: torch.Tensor) -> None:
+        return IntermediateTensors(
+            {
+                f"deepstack_input_embeds_{idx}": self.deepstack_input_embeds[idx][
+                    :num_tokens
+                ]
+                for idx in range(self.deepstack_num_level)
+            }
+        )
+
+    def _set_deepstack_input_embeds(self, deepstack_input_embeds: torch.Tensor) -> None:
         # set deepstack_input_embeds to buffer
         num_tokens = deepstack_input_embeds.size(1)
         if num_tokens > self.deepstack_input_embeds[0].size(0):
             self.deepstack_input_embeds = [
-                torch.zeros(num_tokens,
-                            self.config.text_config.hidden_size,
-                            device=self.deepstack_input_embeds[0].device,
-                            dtype=self.deepstack_input_embeds[0].dtype)
+                torch.zeros(
+                    num_tokens,
+                    self.config.text_config.hidden_size,
+                    device=self.deepstack_input_embeds[0].device,
+                    dtype=self.deepstack_input_embeds[0].dtype,
+                )
                 for _ in range(self.deepstack_num_level)
             ]
         for idx in range(self.deepstack_num_level):
             self.deepstack_input_embeds[idx][:num_tokens].copy_(
-                deepstack_input_embeds[idx])
+                deepstack_input_embeds[idx]
+            )
 
     def _clear_deepstack_input_embeds(self, num_tokens: int) -> None:
         # clear deepstack_input_embeds in buffer
@@ -1227,24 +1291,27 @@ def _clear_deepstack_input_embeds(self, num_tokens: int) -> None:
             for idx in range(self.deepstack_num_level):
                 self.deepstack_input_embeds[idx][:num_tokens].zero_()
 
-    def _validate_and_reshape_mm_tensor(self, mm_input: object,
-                                        name: str) -> torch.Tensor:
+    def _validate_and_reshape_mm_tensor(
+        self, mm_input: object, name: str
+    ) -> torch.Tensor:
         if not isinstance(mm_input, (torch.Tensor, list)):
-            raise ValueError(f"Incorrect type of {name}. "
-                             f"Got type: {type(mm_input)}")
+            raise ValueError(f"Incorrect type of {name}. Got type: {type(mm_input)}")
         if isinstance(mm_input, torch.Tensor):
             if mm_input.ndim == 2:
                 return mm_input
             if mm_input.ndim != 3:
-                raise ValueError(f"{name} should be 2D or batched 3D tensor. "
-                                 f"Got ndim: {mm_input.ndim} "
-                                 f"(shape={mm_input.shape})")
+                raise ValueError(
+                    f"{name} should be 2D or batched 3D tensor. "
+                    f"Got ndim: {mm_input.ndim} "
+                    f"(shape={mm_input.shape})"
+                )
             return torch.concat(list(mm_input))
         else:
             return torch.concat(mm_input)
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[Qwen2_5_VLImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[Qwen2_5_VLImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_embeds = kwargs.pop("image_embeds", None)
         image_grid_thw = kwargs.pop("image_grid_thw", None)
@@ -1254,34 +1321,46 @@ def _parse_and_validate_image_input(
 
         if pixel_values is not None:
             pixel_values = self._validate_and_reshape_mm_tensor(
-                pixel_values, "image pixel values")
+                pixel_values, "image pixel values"
+            )
             image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, "image grid_thw")
+                image_grid_thw, "image grid_thw"
+            )
 
             if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image pixel values. "
-                                 f"Got type: {type(pixel_values)}")
+                raise ValueError(
+                    "Incorrect type of image pixel values. "
+                    f"Got type: {type(pixel_values)}"
+                )
 
-            return Qwen2_5_VLImagePixelInputs(type="pixel_values",
-                                              pixel_values=pixel_values,
-                                              image_grid_thw=image_grid_thw)
+            return Qwen2_5_VLImagePixelInputs(
+                type="pixel_values",
+                pixel_values=pixel_values,
+                image_grid_thw=image_grid_thw,
+            )
 
         if image_embeds is not None:
             image_embeds = self._validate_and_reshape_mm_tensor(
-                image_embeds, "image embeds")
+                image_embeds, "image embeds"
+            )
             image_grid_thw = self._validate_and_reshape_mm_tensor(
-                image_grid_thw, "image grid_thw")
+                image_grid_thw, "image grid_thw"
+            )
 
             if not isinstance(image_embeds, torch.Tensor):
-                raise ValueError("Incorrect type of image embeddings. "
-                                 f"Got type: {type(image_embeds)}")
+                raise ValueError(
+                    "Incorrect type of image embeddings. "
+                    f"Got type: {type(image_embeds)}"
+                )
             return Qwen2_5_VLImageEmbeddingInputs(
                 type="image_embeds",
                 image_embeds=image_embeds,
-                image_grid_thw=image_grid_thw)
+                image_grid_thw=image_grid_thw,
+            )
 
     def _parse_and_validate_video_input(
-            self, **kwargs: object) -> Optional[Qwen2_5_VLVideoInputs]:
+        self, **kwargs: object
+    ) -> Optional[Qwen2_5_VLVideoInputs]:
         pixel_values_videos = kwargs.pop("pixel_values_videos", None)
         video_embeds = kwargs.pop("video_embeds", None)
         video_grid_thw = kwargs.pop("video_grid_thw", None)
@@ -1292,9 +1371,11 @@ def _parse_and_validate_video_input(
 
         if pixel_values_videos is not None:
             pixel_values_videos = self._validate_and_reshape_mm_tensor(
-                pixel_values_videos, "video pixel values")
+                pixel_values_videos, "video pixel values"
+            )
             video_grid_thw = self._validate_and_reshape_mm_tensor(
-                video_grid_thw, "video grid_thw")
+                video_grid_thw, "video grid_thw"
+            )
 
             return Qwen2_5_VLVideoPixelInputs(
                 type="pixel_values_videos",
@@ -1305,22 +1386,26 @@ def _parse_and_validate_video_input(
 
         if video_embeds is not None:
             video_embeds = self._validate_and_reshape_mm_tensor(
-                video_embeds, "video embeds")
+                video_embeds, "video embeds"
+            )
             video_grid_thw = self._validate_and_reshape_mm_tensor(
-                video_grid_thw, "video grid_thw")
+                video_grid_thw, "video grid_thw"
+            )
 
             if not isinstance(video_embeds, torch.Tensor):
-                raise ValueError("Incorrect type of video embeddings. "
-                                 f"Got type: {type(video_embeds)}")
+                raise ValueError(
+                    "Incorrect type of video embeddings. "
+                    f"Got type: {type(video_embeds)}"
+                )
             return Qwen2_5_VLVideoEmbeddingInputs(
                 type="video_embeds",
                 video_embeds=video_embeds,
-                video_grid_thw=video_grid_thw)
+                video_grid_thw=video_grid_thw,
+            )
 
     def _process_image_input(
-            self,
-            image_input: Qwen2_5_VLImageInputs) -> tuple[torch.Tensor, ...]:
-
+        self, image_input: Qwen2_5_VLImageInputs
+    ) -> tuple[torch.Tensor, ...]:
         grid_thw = image_input["image_grid_thw"]
         assert grid_thw.ndim == 2
         grid_thw_list = grid_thw.tolist()
@@ -1330,25 +1415,24 @@ def _process_image_input(
         else:
             pixel_values = image_input["pixel_values"].type(self.visual.dtype)
             if self.use_data_parallel:
-                return run_dp_sharded_mrope_vision_model(self.visual,
-                                                         pixel_values,
-                                                         grid_thw_list,
-                                                         rope_type="rope_3d")
+                return run_dp_sharded_mrope_vision_model(
+                    self.visual, pixel_values, grid_thw_list, rope_type="rope_3d"
+                )
             else:
-                image_embeds = self.visual(pixel_values,
-                                           grid_thw=grid_thw_list)
+                image_embeds = self.visual(pixel_values, grid_thw=grid_thw_list)
 
         # Split concatenated embeddings for each image item.
         # Using prod on grid_thw_list instead of grid_thw.prod avoids CUDA sync
         merge_size = self.visual.spatial_merge_size
-        sizes = (torch.tensor(grid_thw_list, dtype=torch.long).prod(-1) //
-                 (merge_size * merge_size)).tolist()
+        sizes = (
+            torch.tensor(grid_thw_list, dtype=torch.long).prod(-1)
+            // (merge_size * merge_size)
+        ).tolist()
         return image_embeds.split(sizes)
 
     def _process_video_input(
-            self,
-            video_input: Qwen2_5_VLVideoInputs) -> tuple[torch.Tensor, ...]:
-
+        self, video_input: Qwen2_5_VLVideoInputs
+    ) -> tuple[torch.Tensor, ...]:
         grid_thw = video_input["video_grid_thw"]
         assert grid_thw.ndim == 2
         grid_thw_list = grid_thw.tolist()
@@ -1357,44 +1441,50 @@ def _process_video_input(
             video_embeds = video_input["video_embeds"].type(self.visual.dtype)
         else:
             pixel_values_videos = video_input["pixel_values_videos"].type(
-                self.visual.dtype)
+                self.visual.dtype
+            )
             if self.use_data_parallel:
-                return run_dp_sharded_mrope_vision_model(self.visual,
-                                                         pixel_values_videos,
-                                                         grid_thw_list,
-                                                         rope_type="rope_3d")
+                return run_dp_sharded_mrope_vision_model(
+                    self.visual, pixel_values_videos, grid_thw_list, rope_type="rope_3d"
+                )
             else:
-                video_embeds = self.visual(pixel_values_videos,
-                                           grid_thw=grid_thw_list)
+                video_embeds = self.visual(pixel_values_videos, grid_thw=grid_thw_list)
 
         # Split concatenated embeddings for each video item.
         # Using prod on grid_thw_list instead of grid_thw.prod avoids CUDA sync
         merge_size = self.visual.spatial_merge_size
-        sizes = (torch.tensor(grid_thw_list, dtype=torch.long).prod(-1) //
-                 (merge_size * merge_size)).tolist()
+        sizes = (
+            torch.tensor(grid_thw_list, dtype=torch.long).prod(-1)
+            // (merge_size * merge_size)
+        ).tolist()
         return video_embeds.split(sizes)
 
     def _parse_and_validate_multimodal_inputs(self, **kwargs: object) -> dict:
         mm_input_by_modality = {}
         for input_key in kwargs:
-            if input_key in ("pixel_values", "image_embeds"
-                             ) and "image" not in mm_input_by_modality:
-                mm_input_by_modality[
-                    "image"] = self._parse_and_validate_image_input(**kwargs)
-            if input_key in ("pixel_values_videos", "video_embeds"
-                             ) and "video" not in mm_input_by_modality:
-                mm_input_by_modality[
-                    "video"] = self._parse_and_validate_video_input(**kwargs)
+            if (
+                input_key in ("pixel_values", "image_embeds")
+                and "image" not in mm_input_by_modality
+            ):
+                mm_input_by_modality["image"] = self._parse_and_validate_image_input(
+                    **kwargs
+                )
+            if (
+                input_key in ("pixel_values_videos", "video_embeds")
+                and "video" not in mm_input_by_modality
+            ):
+                mm_input_by_modality["video"] = self._parse_and_validate_video_input(
+                    **kwargs
+                )
         return mm_input_by_modality
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
     def get_multimodal_embeddings(
-            self, **kwargs: object) -> Optional[MultiModalEmbeddings]:
-
-        mm_input_by_modality = self._parse_and_validate_multimodal_inputs(
-            **kwargs)
+        self, **kwargs: object
+    ) -> Optional[MultiModalEmbeddings]:
+        mm_input_by_modality = self._parse_and_validate_multimodal_inputs(**kwargs)
         if not mm_input_by_modality:
             return None
 
@@ -1432,15 +1522,16 @@ def _compute_deepstack_embeds(
             dim=-1,
         )
 
-        multimodal_embeddings = torch.split(multimodal_embeddings_main,
-                                            visual_lens,
-                                            dim=0)
+        multimodal_embeddings = torch.split(
+            multimodal_embeddings_main, visual_lens, dim=0
+        )
         multimodal_embeddings_multiscale = torch.split(
-            multimodal_embeddings_multiscale, visual_lens, dim=0)
+            multimodal_embeddings_multiscale, visual_lens, dim=0
+        )
 
         deepstack_input_embeds = inputs_embeds.new_zeros(
-            inputs_embeds.size(0),
-            self.deepstack_num_level * inputs_embeds.size(1))
+            inputs_embeds.size(0), self.deepstack_num_level * inputs_embeds.size(1)
+        )
 
         deepstack_input_embeds = _merge_multimodal_embeddings(
             inputs_embeds=deepstack_input_embeds,
@@ -1448,7 +1539,8 @@ def _compute_deepstack_embeds(
             is_multimodal=is_multimodal,
         )
         deepstack_input_embeds = deepstack_input_embeds.view(
-            inputs_embeds.shape[0], self.deepstack_num_level, self.visual_dim)
+            inputs_embeds.shape[0], self.deepstack_num_level, self.visual_dim
+        )
         deepstack_input_embeds = deepstack_input_embeds.permute(1, 0, 2)
 
         return deepstack_input_embeds, multimodal_embeddings
@@ -1475,7 +1567,8 @@ def get_input_embeddings(
             raise ValueError(
                 "`get_input_embeddings` now requires `is_multimodal` arg, "
                 "please update your model runner according to "
-                "https://github.com/vllm-project/vllm/pull/16229.")
+                "https://github.com/vllm-project/vllm/pull/16229."
+            )
 
         if self.use_deepstack:
             (
@@ -1496,8 +1589,12 @@ def get_input_embeddings(
         )
 
         if deepstack_input_embeds is not None:
-            deepstack_input_embeds = torch.zeros_like(inputs_embeds).unsqueeze(
-                0).repeat(self.deepstack_num_level, 1, 1).contiguous()
+            deepstack_input_embeds = (
+                torch.zeros_like(inputs_embeds)
+                .unsqueeze(0)
+                .repeat(self.deepstack_num_level, 1, 1)
+                .contiguous()
+            )
             self._set_deepstack_input_embeds(deepstack_input_embeds)
 
         return inputs_embeds
@@ -1537,10 +1634,14 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        if self.use_deepstack and inputs_embeds is not None and get_pp_group(
-        ).is_first_rank:
+        if (
+            self.use_deepstack
+            and inputs_embeds is not None
+            and get_pp_group().is_first_rank
+        ):
             deepstack_input_embeds = self._get_deepstack_input_embeds(
-                inputs_embeds.size(0))
+                inputs_embeds.size(0)
+            )
         else:
             deepstack_input_embeds = None
 
@@ -1564,9 +1665,7 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         skip_prefixes = []
         if self.visual is None:
             skip_prefixes.extend(["visual."])
diff --git a/vllm/model_executor/models/qwen3_vl_moe.py b/vllm/model_executor/models/qwen3_vl_moe.py
index bd4aae7404c6..cd8046d04248 100644
--- a/vllm/model_executor/models/qwen3_vl_moe.py
+++ b/vllm/model_executor/models/qwen3_vl_moe.py
@@ -23,13 +23,13 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only Qwen3-VL-MoE model compatible with HuggingFace weights."""
+
 import typing
 from collections.abc import Iterable
 from typing import Callable, Optional, Union
 
 import torch
-from transformers.models.qwen3_vl_moe.configuration_qwen3_vl_moe import (
-    Qwen3VLMoeConfig)
+from transformers.models.qwen3_vl_moe.configuration_qwen3_vl_moe import Qwen3VLMoeConfig
 
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import VllmConfig
@@ -38,21 +38,26 @@
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.sequence import IntermediateTensors
 
 from .qwen3_moe import Qwen3MoeForCausalLM, Qwen3MoeModel
-from .qwen3_vl import (Qwen3_VisionTransformer, Qwen3VLDummyInputsBuilder,
-                       Qwen3VLForConditionalGeneration,
-                       Qwen3VLMultiModalProcessor, Qwen3VLProcessingInfo)
+from .qwen3_vl import (
+    Qwen3_VisionTransformer,
+    Qwen3VLDummyInputsBuilder,
+    Qwen3VLForConditionalGeneration,
+    Qwen3VLMultiModalProcessor,
+    Qwen3VLProcessingInfo,
+)
 from .utils import is_pp_missing_parameter, maybe_prefix
 
 logger = init_logger(__name__)
 
 
 class Qwen3VLMoeProcessingInfo(Qwen3VLProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config(Qwen3VLMoeConfig)
 
@@ -66,18 +71,19 @@ def get_hf_config(self):
         "intermediate_tensors": 0,
         "inputs_embeds": 0,
         # the same shape as input_embeds
-        "deepstack_input_embeds": 0
-    })
+        "deepstack_input_embeds": 0,
+    }
+)
 class Qwen3MoeLLMModel(Qwen3MoeModel):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(vllm_config=vllm_config, prefix=prefix)
         if not get_pp_group().is_first_rank:
             assert self.start_layer >= len(
-                vllm_config.model_config.hf_config.vision_config.
-                deepstack_visual_indexes), (
-                    "start_layer should be greater than or equal to "
-                    "len(deepstack_visual_indexes)")
+                vllm_config.model_config.hf_config.vision_config.deepstack_visual_indexes
+            ), (
+                "start_layer should be greater than or equal to "
+                "len(deepstack_visual_indexes)"
+            )
 
     def forward(
         self,
@@ -98,7 +104,8 @@ def forward(
             hidden_states = intermediate_tensors["hidden_states"]
             residual = intermediate_tensors["residual"]
         for layer_idx, layer in enumerate(
-                self.layers[self.start_layer:self.end_layer]):
+            self.layers[self.start_layer : self.end_layer]
+        ):
             layer_idx = layer_idx + self.start_layer
 
             hidden_states, residual = layer(
@@ -107,40 +114,48 @@ def forward(
                 residual,
             )
 
-            if deepstack_input_embeds is not None and \
-                    layer_idx in range(0, len(deepstack_input_embeds)):
-                hidden_states = hidden_states + deepstack_input_embeds[
-                    f"deepstack_input_embeds_{layer_idx}"]
+            if deepstack_input_embeds is not None and layer_idx in range(
+                0, len(deepstack_input_embeds)
+            ):
+                hidden_states = (
+                    hidden_states
+                    + deepstack_input_embeds[f"deepstack_input_embeds_{layer_idx}"]
+                )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
-    def load_fused_expert_weights(self, name: str, params_dict: dict,
-                                  loaded_weight: torch.Tensor, shard_id: str,
-                                  num_experts: int) -> bool:
+    def load_fused_expert_weights(
+        self,
+        name: str,
+        params_dict: dict,
+        loaded_weight: torch.Tensor,
+        shard_id: str,
+        num_experts: int,
+    ) -> bool:
         param = params_dict[name]
         weight_loader = typing.cast(Callable[..., bool], param.weight_loader)
         loaded_local_expert = False
         for expert_id in range(num_experts):
             curr_expert_weight = loaded_weight[expert_id]
-            success = weight_loader(param,
-                                    curr_expert_weight,
-                                    name,
-                                    shard_id,
-                                    expert_id,
-                                    return_success=True)
+            success = weight_loader(
+                param,
+                curr_expert_weight,
+                name,
+                shard_id,
+                expert_id,
+                return_success=True,
+            )
             if success:
                 loaded_local_expert = True
 
         return loaded_local_expert
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -150,9 +165,18 @@ def load_weights(self, weights: Iterable[tuple[str,
             ("gate_up_proj", "up_proj", 1),
         ]
         # Skip loading extra parameters for GPTQ/modelopt models.
-        ignore_suffixes = (".bias", "_bias", ".k_scale", "_k_scale",
-                           ".v_scale", "_v_scale", ".weight_scale",
-                           "_weight_scale", ".input_scale", "_input_scale")
+        ignore_suffixes = (
+            ".bias",
+            "_bias",
+            ".k_scale",
+            "_k_scale",
+            ".v_scale",
+            "_v_scale",
+            ".weight_scale",
+            "_weight_scale",
+            ".input_scale",
+            "_input_scale",
+        )
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         expert_params_mapping = self.get_expert_mapping()
@@ -163,9 +187,8 @@ def load_weights(self, weights: Iterable[tuple[str,
         ]
         num_experts = self.config.num_experts
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
-                if ("experts.gate_up_proj" in name
-                        or "experts.down_proj" in name):
+            for param_name, weight_name, shard_id in stacked_params_mapping:
+                if "experts.gate_up_proj" in name or "experts.down_proj" in name:
                     is_fused_expert = True
                     expert_params_mapping = fused_expert_params_mapping
 
@@ -195,8 +218,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if name not in params_dict:
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 if weight_loader == default_weight_loader:
                     weight_loader(param, loaded_weight)
                 else:
@@ -215,40 +237,55 @@ def load_weights(self, weights: Iterable[tuple[str,
                     if is_pp_missing_parameter(name_mapped, self):
                         continue
                     if is_fused_expert:
-                        loaded_weight = loaded_weight.transpose(-1,
-                                                                -2)  # no bias
+                        loaded_weight = loaded_weight.transpose(-1, -2)  # no bias
                         if "experts.gate_up_proj" in name:
                             loaded_weight = loaded_weight.chunk(2, dim=-2)
                             success_w1 = self.load_fused_expert_weights(
-                                name_mapped, params_dict, loaded_weight[0],
-                                "w1", num_experts)
+                                name_mapped,
+                                params_dict,
+                                loaded_weight[0],
+                                "w1",
+                                num_experts,
+                            )
                             success_w3 = self.load_fused_expert_weights(
-                                name_mapped, params_dict, loaded_weight[1],
-                                "w3", num_experts)
+                                name_mapped,
+                                params_dict,
+                                loaded_weight[1],
+                                "w3",
+                                num_experts,
+                            )
                             success = success_w1 and success_w3
                         else:
                             # down_proj
                             success = self.load_fused_expert_weights(
-                                name_mapped, params_dict, loaded_weight,
-                                shard_id, num_experts)
+                                name_mapped,
+                                params_dict,
+                                loaded_weight,
+                                shard_id,
+                                num_experts,
+                            )
                     else:
                         # Skip loading extra parameters for GPTQ/modelopt models
-                        if name_mapped.endswith(
-                                ignore_suffixes
-                        ) and name_mapped not in params_dict:
+                        if (
+                            name_mapped.endswith(ignore_suffixes)
+                            and name_mapped not in params_dict
+                        ):
                             continue
                         param = params_dict[name_mapped]
                         # We should ask the weight loader to return success or
                         # not here since otherwise we may skip experts with
                         # other available replicas.
-                        weight_loader = typing.cast(Callable[..., bool],
-                                                    param.weight_loader)
-                        success = weight_loader(param,
-                                                loaded_weight,
-                                                name_mapped,
-                                                shard_id=shard_id,
-                                                expert_id=expert_id,
-                                                return_success=True)
+                        weight_loader = typing.cast(
+                            Callable[..., bool], param.weight_loader
+                        )
+                        success = weight_loader(
+                            param,
+                            loaded_weight,
+                            name_mapped,
+                            shard_id=shard_id,
+                            expert_id=expert_id,
+                            return_success=True,
+                        )
                     if success:
                         name = name_mapped
                         break
@@ -259,8 +296,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                         # So we simply skip it
                         continue
                     # Skip loading extra parameters for GPTQ/modelopt models.
-                    if name.endswith(
-                            ignore_suffixes) and name not in params_dict:
+                    if name.endswith(ignore_suffixes) and name not in params_dict:
                         continue
                     # Skip layers on other devices.
                     if is_pp_missing_parameter(name, self):
@@ -268,7 +304,8 @@ def load_weights(self, weights: Iterable[tuple[str,
                     # Remapping the name of FP8 kv-scale.
                     if name.endswith("kv_scale"):
                         remapped_kv_scale_name = name.replace(
-                            ".kv_scale", ".attn.kv_scale")
+                            ".kv_scale", ".attn.kv_scale"
+                        )
                         if remapped_kv_scale_name not in params_dict:
                             logger.warning_once(
                                 "Found kv scale in the checkpoint (e.g. %s), but not found the expected name in the model (e.g. %s). kv-scale is not loaded.",  # noqa: E501
@@ -279,37 +316,42 @@ def load_weights(self, weights: Iterable[tuple[str,
                         else:
                             name = remapped_kv_scale_name
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class Qwen3MoeLLMForCausalLM(Qwen3MoeForCausalLM):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super(Qwen3MoeForCausalLM, self).__init__()
         self.config = vllm_config.model_config.hf_config.text_config
         self.quant_config = vllm_config.quant_config
-        self.model = Qwen3MoeLLMModel(vllm_config=vllm_config,
-                                      prefix=maybe_prefix(prefix, "model"))
-        self.lm_head = ParallelLMHead(self.config.vocab_size,
-                                      self.config.hidden_size,
-                                      quant_config=self.quant_config,
-                                      prefix=maybe_prefix(prefix, "lm_head"))
+        self.model = Qwen3MoeLLMModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
+        self.lm_head = ParallelLMHead(
+            self.config.vocab_size,
+            self.config.hidden_size,
+            quant_config=self.quant_config,
+            prefix=maybe_prefix(prefix, "lm_head"),
+        )
         if self.config.tie_word_embeddings:
             self.lm_head.weight = self.model.embed_tokens.weight
         self.logits_processor = LogitsProcessor(self.config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
 
-@MULTIMODAL_REGISTRY.register_processor(Qwen3VLMultiModalProcessor,
-                                        info=Qwen3VLMoeProcessingInfo,
-                                        dummy_inputs=Qwen3VLDummyInputsBuilder)
+@MULTIMODAL_REGISTRY.register_processor(
+    Qwen3VLMultiModalProcessor,
+    info=Qwen3VLMoeProcessingInfo,
+    dummy_inputs=Qwen3VLDummyInputsBuilder,
+)
 class Qwen3VLMoeForConditionalGeneration(Qwen3VLForConditionalGeneration):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super(Qwen3VLForConditionalGeneration, self).__init__()
         config: Qwen3VLMoeConfig = vllm_config.model_config.hf_config
@@ -320,8 +362,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.multimodal_config = multimodal_config
         self.use_data_parallel = multimodal_config.mm_encoder_tp_mode == "data"
 
-        if not multimodal_config.get_limit_per_prompt("image") and \
-            not multimodal_config.get_limit_per_prompt("video"):
+        if not multimodal_config.get_limit_per_prompt(
+            "image"
+        ) and not multimodal_config.get_limit_per_prompt("video"):
             self.visual = None
         else:
             self.visual = Qwen3_VisionTransformer(
@@ -332,25 +375,27 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 use_data_parallel=self.use_data_parallel,
             )
 
-        self.language_model = Qwen3MoeLLMForCausalLM(vllm_config=vllm_config,
-                                                     prefix=maybe_prefix(
-                                                         prefix,
-                                                         "language_model"))
+        self.language_model = Qwen3MoeLLMForCausalLM(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "language_model")
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
-        self.use_deepstack = hasattr(config.vision_config,
-                                     'deepstack_visual_indexes')
-        self.deepstack_num_level = len(
-            config.vision_config.deepstack_visual_indexes
-        ) if self.use_deepstack else 0
+        self.use_deepstack = hasattr(config.vision_config, "deepstack_visual_indexes")
+        self.deepstack_num_level = (
+            len(config.vision_config.deepstack_visual_indexes)
+            if self.use_deepstack
+            else 0
+        )
         # register buffer for deepstack
         if self.use_deepstack and self.visual is not None:
             self.deepstack_input_embeds = [
                 torch.zeros(
                     vllm_config.scheduler_config.max_num_batched_tokens,
-                    config.text_config.hidden_size)
+                    config.text_config.hidden_size,
+                )
                 for _ in range(self.deepstack_num_level)
             ]
         else:
diff --git a/vllm/model_executor/models/qwen_vl.py b/vllm/model_executor/models/qwen_vl.py
index a94e1e700c67..1786ea6a6878 100644
--- a/vllm/model_executor/models/qwen_vl.py
+++ b/vllm/model_executor/models/qwen_vl.py
@@ -18,33 +18,45 @@
 from torch import nn
 from torchvision import transforms
 from torchvision.transforms import InterpolationMode
-from transformers import (BatchFeature, PretrainedConfig, PreTrainedTokenizer,
-                          TensorType)
+from transformers import BatchFeature, PretrainedConfig, PreTrainedTokenizer, TensorType
 from transformers.image_utils import ImageInput
 from transformers.tokenization_utils_base import TextInput
 
 from vllm.config import VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.resampler import Resampler2, get_abs_pos
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
 from vllm.multimodal.parse import MultiModalDataItems
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
 from .qwen import QWenBaseModel, QWenModel
 from .utils import flatten_bn
 
@@ -56,11 +68,12 @@ class QwenImagePixelInputs(TensorSchema):
         - c: Number of channels (3)
         - h: Height
         - w: Width
-    
+
     Note that image_size is the value in the vision config to which we resize
     the image to in the normalization transform. Currently multi-image support
     can only be leveraged by passing image embeddings directly.
     """
+
     type: Literal["pixel_values"] = "pixel_values"
     data: Annotated[torch.Tensor, TensorShape("bn", 3, "h", "w")]
 
@@ -71,10 +84,11 @@ class QwenImageEmbeddingInputs(TensorSchema):
         - bn: Batch size * number of images
         - ifs: Image feature size (256)
         - hs: Hidden size
-    
+
     `hidden_size` must match the hidden size of the language model backbone
     and is stored in the visual config of the model if we have one.
     """
+
     type: Literal["image_embeds"] = "image_embeds"
     data: Annotated[torch.Tensor, TensorShape("bn", 256, "hs")]
 
@@ -100,8 +114,7 @@ def __init__(
         self.embed_dim = embed_dim
         self.kdim = kdim if kdim is not None else embed_dim
         self.vdim = vdim if vdim is not None else embed_dim
-        self._qkv_same_embed_dim = self.kdim == embed_dim \
-            and self.vdim == embed_dim
+        self._qkv_same_embed_dim = self.kdim == embed_dim and self.vdim == embed_dim
 
         self.num_heads = num_heads
 
@@ -112,8 +125,9 @@ def __init__(
         self.hidden_size_per_partition = embed_dim
 
         # Strided linear layer.
-        assert self._qkv_same_embed_dim, \
-                'Visual Attention implementation only supports self-attention'
+        assert self._qkv_same_embed_dim, (
+            "Visual Attention implementation only supports self-attention"
+        )
         self.in_proj = ReplicatedLinear(embed_dim, 3 * embed_dim)
         self.out_proj = ReplicatedLinear(embed_dim, embed_dim)
         self.norm_factor = math.sqrt(self.hidden_size_per_attention_head)
@@ -128,50 +142,63 @@ def forward(
         mixed_x_layer, _ = self.in_proj(x)
 
         # [sq, b, (np * 3 * hn)] --> [sq, b, np, 3 * hn]
-        new_tensor_shape = mixed_x_layer.size()[:-1] + \
-            (self.num_attention_heads_per_partition,
-             3 * self.hidden_size_per_attention_head)
+        new_tensor_shape = mixed_x_layer.size()[:-1] + (
+            self.num_attention_heads_per_partition,
+            3 * self.hidden_size_per_attention_head,
+        )
         mixed_x_layer = mixed_x_layer.view(*new_tensor_shape)
 
         # [sq, b, np, 3 * hn] --> 3 [sq, b, np, hn]
         query_layer, key_layer, value_layer = mixed_x_layer.split(
-            self.hidden_size_per_attention_head, dim=-1)
+            self.hidden_size_per_attention_head, dim=-1
+        )
 
         # [sq, b, np, hn] -> [sq, b * np, hn]
         query_layer = query_layer.view(
-            sq, b * self.num_attention_heads_per_partition,
-            self.hidden_size_per_attention_head).transpose(0, 1)
+            sq,
+            b * self.num_attention_heads_per_partition,
+            self.hidden_size_per_attention_head,
+        ).transpose(0, 1)
         # [sk, b, np, hn] -> [sk, b * np, hn]
         key_layer = key_layer.view(
-            sq, b * self.num_attention_heads_per_partition,
-            self.hidden_size_per_attention_head).transpose(0, 1)
+            sq,
+            b * self.num_attention_heads_per_partition,
+            self.hidden_size_per_attention_head,
+        ).transpose(0, 1)
 
         q_scaled = query_layer / self.norm_factor
         if attn_mask is not None:
-            attention_probs = torch.baddbmm(attn_mask, q_scaled,
-                                            key_layer.transpose(-2, -1))
+            attention_probs = torch.baddbmm(
+                attn_mask, q_scaled, key_layer.transpose(-2, -1)
+            )
         else:
             attention_probs = torch.bmm(q_scaled, key_layer.transpose(-2, -1))
         attention_probs = attention_probs.softmax(dim=-1)
 
         value_layer = value_layer.view(
-            sq, b * self.num_attention_heads_per_partition,
-            self.hidden_size_per_attention_head).transpose(0, 1)
+            sq,
+            b * self.num_attention_heads_per_partition,
+            self.hidden_size_per_attention_head,
+        ).transpose(0, 1)
 
         # matmul: [b * np, sq, hn]
         context_layer = torch.bmm(attention_probs, value_layer)
 
         # change view [b, np, sq, hn]
         context_layer = context_layer.view(
-            b, self.num_attention_heads_per_partition, sq,
-            self.hidden_size_per_attention_head)
+            b,
+            self.num_attention_heads_per_partition,
+            sq,
+            self.hidden_size_per_attention_head,
+        )
 
         # [b, np, sq, hn] --> [sq, b, np, hn]
         context_layer = context_layer.permute(2, 0, 1, 3).contiguous()
 
         # [sq, b, np, hn] --> [sq, b, hp]
-        new_context_layer_shape = context_layer.size()[:-2] + \
-            (self.hidden_size_per_partition,)
+        new_context_layer_shape = context_layer.size()[:-2] + (
+            self.hidden_size_per_partition,
+        )
         context_layer = context_layer.view(*new_context_layer_shape)
 
         output, _ = self.out_proj(context_layer)
@@ -189,10 +216,9 @@ def __init__(
         quant_config: Optional[QuantizationConfig] = None,
     ):
         super().__init__()
-        self.c_fc = ColumnParallelLinear(hidden_size,
-                                         intermediate_size,
-                                         bias=True,
-                                         quant_config=quant_config)
+        self.c_fc = ColumnParallelLinear(
+            hidden_size, intermediate_size, bias=True, quant_config=quant_config
+        )
         self.act_fn = get_act_fn("gelu")
         self.c_proj = RowParallelLinear(
             intermediate_size,
@@ -209,7 +235,6 @@ def forward(self, x):
 
 
 class VisualAttentionBlock(nn.Module):
-
     def __init__(
         self,
         d_model: int,
@@ -249,7 +274,6 @@ def forward(
 
 
 class TransformerBlock(nn.Module):
-
     def __init__(
         self,
         width: int,
@@ -263,14 +287,18 @@ def __init__(
         self.width = width
         self.layers = layers
 
-        self.resblocks = nn.ModuleList([
-            VisualAttentionBlock(width,
-                                 heads,
-                                 mlp_ratio,
-                                 norm_layer=norm_layer,
-                                 quant_config=quant_config)
-            for _ in range(layers)
-        ])
+        self.resblocks = nn.ModuleList(
+            [
+                VisualAttentionBlock(
+                    width,
+                    heads,
+                    mlp_ratio,
+                    norm_layer=norm_layer,
+                    quant_config=quant_config,
+                )
+                for _ in range(layers)
+            ]
+        )
 
     def get_cast_dtype(self) -> torch.dtype:
         return self.resblocks[0].mlp.c_fc.weight.dtype
@@ -278,54 +306,57 @@ def get_cast_dtype(self) -> torch.dtype:
     def get_cast_device(self) -> torch.device:
         return self.resblocks[0].mlp.c_fc.weight.device
 
-    def forward(self,
-                x: torch.Tensor,
-                attn_mask: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def forward(
+        self, x: torch.Tensor, attn_mask: Optional[torch.Tensor] = None
+    ) -> torch.Tensor:
         for r in self.resblocks:
             x = r(x, attn_mask=attn_mask)
         return x
 
 
 class VisionTransformer(nn.Module):
-
-    def __init__(self,
-                 image_size: int,
-                 patch_size: int,
-                 width: int,
-                 layers: int,
-                 heads: int,
-                 mlp_ratio: float,
-                 n_queries: int = 256,
-                 output_dim: int = 512,
-                 image_start_id: int = 151857,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 **kwargs):
+    def __init__(
+        self,
+        image_size: int,
+        patch_size: int,
+        width: int,
+        layers: int,
+        heads: int,
+        mlp_ratio: float,
+        n_queries: int = 256,
+        output_dim: int = 512,
+        image_start_id: int = 151857,
+        quant_config: Optional[QuantizationConfig] = None,
+        **kwargs,
+    ):
         super().__init__()
         image_height, image_width = self.image_size = (image_size, image_size)
         patch_height, patch_width = self.patch_size = (patch_size, patch_size)
-        self.grid_size = (image_height // patch_height,
-                          image_width // patch_width)
+        self.grid_size = (image_height // patch_height, image_width // patch_width)
         self.output_dim = output_dim
-        self.conv1 = nn.Conv2d(in_channels=3,
-                               out_channels=width,
-                               kernel_size=patch_size,
-                               stride=patch_size,
-                               bias=False)
+        self.conv1 = nn.Conv2d(
+            in_channels=3,
+            out_channels=width,
+            kernel_size=patch_size,
+            stride=patch_size,
+            bias=False,
+        )
 
         # class embeddings and positional embeddings
         scale = width**-0.5
-        self.positional_embedding = nn.Parameter(scale *
-                                                 torch.randn(256, width))
+        self.positional_embedding = nn.Parameter(scale * torch.randn(256, width))
 
         norm_layer = partial(nn.LayerNorm, eps=1e-6)
 
         self.ln_pre = norm_layer(width)
-        self.transformer = TransformerBlock(width,
-                                            layers,
-                                            heads,
-                                            mlp_ratio,
-                                            norm_layer=norm_layer,
-                                            quant_config=quant_config)
+        self.transformer = TransformerBlock(
+            width,
+            layers,
+            heads,
+            mlp_ratio,
+            norm_layer=norm_layer,
+            quant_config=quant_config,
+        )
 
         self.attn_pool = Resampler2(
             grid_size=int(math.sqrt(n_queries)),
@@ -342,7 +373,8 @@ def __init__(self,
 
         self.ln_post = norm_layer(output_dim)
         self.proj = nn.Parameter(
-            (output_dim**-0.5) * torch.randn(output_dim, output_dim))
+            (output_dim**-0.5) * torch.randn(output_dim, output_dim)
+        )
 
         self.image_start_id = image_start_id
         self.image_end_id = image_start_id + 1
@@ -356,12 +388,10 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
         # to patches
         x = self.conv1(x)  # shape = [*, width, grid, grid]
-        x = x.reshape(x.shape[0], x.shape[1],
-                      -1)  # shape = [*, width, grid ** 2]
+        x = x.reshape(x.shape[0], x.shape[1], -1)  # shape = [*, width, grid ** 2]
         x = x.permute(0, 2, 1)  # shape = [*, grid ** 2, width]
 
-        x = x + get_abs_pos(self.positional_embedding, int(math.sqrt(
-            x.size(1))))
+        x = x + get_abs_pos(self.positional_embedding, int(math.sqrt(x.size(1))))
 
         x = self.ln_pre(x)
 
@@ -377,20 +407,19 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class QwenVLModel(QWenModel):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(vllm_config=vllm_config, prefix=prefix)
 
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
 
-        self.visual = VisionTransformer(**config.visual,
-                                        quant_config=quant_config)
+        self.visual = VisionTransformer(**config.visual, quant_config=quant_config)
 
 
 @lru_cache(maxsize=1)
 def _get_tokenizer_without_image_pad(
-        tokenizer: PreTrainedTokenizer) -> PreTrainedTokenizer:
+    tokenizer: PreTrainedTokenizer,
+) -> PreTrainedTokenizer:
     """
     The logic of adding image pad tokens should only be applied in
     [`QwenVLProcessor`][vllm.model_executor.models.qwen_vl.QwenVLProcessor],
@@ -402,7 +431,6 @@ def _get_tokenizer_without_image_pad(
     new_tokenizer = copy.deepcopy(tokenizer)
 
     class TokenizerWithoutImagePad(tokenizer.__class__):  # type: ignore
-
         def tokenize(
             self,
             text: str,
@@ -413,7 +441,8 @@ def tokenize(
             text = unicodedata.normalize("NFC", text)
 
             return [
-                self.decoder[t] for t in self.tokenizer.encode(
+                self.decoder[t]
+                for t in self.tokenizer.encode(
                     text,
                     allowed_special=allowed_special,
                     disallowed_special=disallowed_special,
@@ -435,8 +464,7 @@ def _decode(
                 errors=errors or self.errors,
             )
 
-    TokenizerWithoutImagePad.__name__ = \
-        f"{tokenizer.__class__.__name__}WithoutImagePad"
+    TokenizerWithoutImagePad.__name__ = f"{tokenizer.__class__.__name__}WithoutImagePad"
 
     new_tokenizer.__class__ = TokenizerWithoutImagePad
     return new_tokenizer
@@ -467,17 +495,19 @@ def __init__(
         vision_config = config.visual
         image_size = vision_config["image_size"]
 
-        self.image_transform = transforms.Compose([
-            transforms.Resize(
-                (image_size, image_size),
-                interpolation=InterpolationMode.BICUBIC,
-            ),
-            transforms.ToTensor(),
-            transforms.Normalize(
-                mean=(0.48145466, 0.4578275, 0.40821073),
-                std=(0.26862954, 0.26130258, 0.27577711),
-            ),
-        ])
+        self.image_transform = transforms.Compose(
+            [
+                transforms.Resize(
+                    (image_size, image_size),
+                    interpolation=InterpolationMode.BICUBIC,
+                ),
+                transforms.ToTensor(),
+                transforms.Normalize(
+                    mean=(0.48145466, 0.4578275, 0.40821073),
+                    std=(0.26862954, 0.26130258, 0.27577711),
+                ),
+            ]
+        )
 
     @property
     def image_start_tag(self) -> str:
@@ -524,7 +554,6 @@ def __call__(
 
 
 class QwenVLProcessingInfo(BaseProcessingInfo):
-
     def get_tokenizer(self) -> PreTrainedTokenizer:
         tokenizer = self.ctx.tokenizer
         assert isinstance(tokenizer, PreTrainedTokenizer)
@@ -553,7 +582,6 @@ def get_num_image_tokens(self) -> int:
 
 
 class QwenVLDummyInputsBuilder(BaseDummyInputsBuilder[QwenVLProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -561,8 +589,9 @@ def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         img_start = hf_processor.image_start_tag
         img_end = hf_processor.image_end_tag
 
-        return "".join(f"Picture {i}: {img_start}{img_end}\n"
-                       for i in range(1, num_images + 1))
+        return "".join(
+            f"Picture {i}: {img_start}{img_end}\n" for i in range(1, num_images + 1)
+        )
 
     def get_dummy_mm_data(
         self,
@@ -579,16 +608,16 @@ def get_dummy_mm_data(
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
 class QwenVLMultiModalProcessor(BaseMultiModalProcessor[QwenVLProcessingInfo]):
-
     def _call_hf_processor(
         self,
         prompt: str,
@@ -644,8 +673,7 @@ def _get_prompt_updates(
         out_mm_kwargs: MultiModalKwargsItems,
     ) -> Sequence[PromptUpdate]:
         tokenizer = self.info.get_tokenizer()
-        special_tokens: dict[str,
-                             int] = tokenizer.special_tokens  # type: ignore
+        special_tokens: dict[str, int] = tokenizer.special_tokens  # type: ignore
 
         processor = self.info.get_hf_processor()
         img_start_id = special_tokens[processor.image_start_tag]
@@ -667,11 +695,14 @@ def _get_prompt_updates(
         ]
 
 
-@MULTIMODAL_REGISTRY.register_processor(QwenVLMultiModalProcessor,
-                                        info=QwenVLProcessingInfo,
-                                        dummy_inputs=QwenVLDummyInputsBuilder)
-class QwenVLForConditionalGeneration(QWenBaseModel, SupportsPP, SupportsLoRA,
-                                     SupportsMultiModal):
+@MULTIMODAL_REGISTRY.register_processor(
+    QwenVLMultiModalProcessor,
+    info=QwenVLProcessingInfo,
+    dummy_inputs=QwenVLDummyInputsBuilder,
+)
+class QwenVLForConditionalGeneration(
+    QWenBaseModel, SupportsPP, SupportsLoRA, SupportsMultiModal
+):
     packed_modules_mapping = {
         "c_attn": ["c_attn"],
         "gate_up_proj": [
@@ -687,7 +718,8 @@ def get_mm_mapping(self) -> MultiModelKeys:
         return MultiModelKeys.from_string_field(
             language_model="transformer.h",
             connector="transformer.visual.attn_pool",
-            tower_model="transformer.visual.transformer")
+            tower_model="transformer.visual.transformer",
+        )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -712,14 +744,16 @@ def __init__(
         self.transformer: QwenVLModel
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[QwenImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[QwenImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_embeds = kwargs.pop("image_embeds", None)
 
         if pixel_values is not None:
             if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values)}")
+                raise ValueError(
+                    f"Incorrect type of pixel values. Got type: {type(pixel_values)}"
+                )
 
             expected_h = expected_w = self.config.visual["image_size"]
             resolve_bindings = {"h": expected_h, "w": expected_w}
@@ -732,8 +766,10 @@ def _parse_and_validate_image_input(
 
         if image_embeds is not None:
             if not isinstance(image_embeds, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image embeddings. "
-                                 f"Got type: {type(image_embeds)}")
+                raise ValueError(
+                    "Incorrect type of image embeddings. "
+                    f"Got type: {type(image_embeds)}"
+                )
 
             return QwenImageEmbeddingInputs(
                 type="image_embeds",
@@ -742,8 +778,7 @@ def _parse_and_validate_image_input(
 
         return None
 
-    def _process_image_input(self,
-                             image_input: QwenImageInputs) -> torch.Tensor:
+    def _process_image_input(self, image_input: QwenImageInputs) -> torch.Tensor:
         if image_input["type"] == "image_embeds":
             return image_input["data"]
 
@@ -752,8 +787,7 @@ def _process_image_input(self,
     def get_language_model(self) -> torch.nn.Module:
         return self.transformer
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -772,6 +806,7 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.transformer(input_ids, positions,
-                                         intermediate_tensors, inputs_embeds)
+        hidden_states = self.transformer(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
diff --git a/vllm/model_executor/models/radio.py b/vllm/model_executor/models/radio.py
index 9cbf844ae9f8..2313b98348b7 100644
--- a/vllm/model_executor/models/radio.py
+++ b/vllm/model_executor/models/radio.py
@@ -28,7 +28,6 @@
 
 
 def _ntuple(n):
-
     def parse(x):
         if isinstance(x, Iterable) and not isinstance(x, str):
             return tuple(x)
@@ -45,7 +44,6 @@ def parse(x):
 
 
 class InputConditioner(nn.Module):
-
     def __init__(
         self,
         input_scale: float,
@@ -72,7 +70,6 @@ def _to_tensor(v: norm_t):
 
 
 class ClsToken(nn.Module):
-
     def __init__(
         self,
         ndim: int,
@@ -91,12 +88,14 @@ def __init__(
             if num_registers:
                 self.num_registers = num_registers
             elif register_multiple:
-                self.num_registers = register_multiple - (num_tokens %
-                                                          register_multiple)
+                self.num_registers = register_multiple - (
+                    num_tokens % register_multiple
+                )
 
             scale = ndim**-0.5
             self.token = nn.Parameter(
-                torch.randn(num_tokens + self.num_registers, ndim) * scale)
+                torch.randn(num_tokens + self.num_registers, ndim) * scale
+            )
 
         else:
             self.token = None
@@ -108,16 +107,18 @@ def forward(self, x: torch.Tensor):
             return x
 
         token = self.token.unsqueeze(0).expand(x.shape[0], -1, -1)
-        x = torch.cat([
-            token,
-            x,
-        ], dim=1)
+        x = torch.cat(
+            [
+                token,
+                x,
+            ],
+            dim=1,
+        )
 
         return x
 
 
 class ViTPatchGenerator(nn.Module):
-
     def __init__(
         self,
         #  config: PretrainedConfig,
@@ -147,8 +148,8 @@ def __init__(
             max_input_dims = (max_input_dims, max_input_dims)
 
         max_input_dims = tuple(
-            int(math.ceil(d / patch_size) * patch_size)
-            for d in max_input_dims)
+            int(math.ceil(d / patch_size) * patch_size) for d in max_input_dims
+        )
 
         self.cpe_mode = max_input_dims != input_dims
         self.pos_dropout = pos_dropout
@@ -167,15 +168,15 @@ def __init__(
         self.max_input_dims = max_input_dims
 
         self.im_to_patches = Im2Patches(patch_size)
-        self.embedder = ViTPatchLinear(patch_size,
-                                       embed_dim,
-                                       bias=patch_bias,
-                                       **factory)
+        self.embedder = ViTPatchLinear(
+            patch_size, embed_dim, bias=patch_bias, **factory
+        )
 
         if abs_pos:
             scale = embed_dim**-0.5
             self.pos_embed = nn.Parameter(
-                torch.randn(1, self.num_patches, embed_dim, **factory) * scale)
+                torch.randn(1, self.num_patches, embed_dim, **factory) * scale
+            )
 
         self.cls_token = ClsToken(
             embed_dim,
@@ -185,8 +186,9 @@ def __init__(
             num_registers=num_registers,
         )
 
-        self.patch_normalizer = nn.LayerNorm(
-            embed_dim) if normalize_patches else nn.Identity()
+        self.patch_normalizer = (
+            nn.LayerNorm(embed_dim) if normalize_patches else nn.Identity()
+        )
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         patches = self.embed_patches(x)
@@ -221,42 +223,48 @@ def _load_embed(self, src_embed: torch.Tensor, targ_embed: nn.Parameter):
         if src_embed.shape != targ_embed.shape:
             src_size = int(math.sqrt(src_embed.shape[1]))
 
-            assert src_size**2 == src_embed.shape[
-                1], 'Unable to interpolate non-square embedding'
-
-            src_embed = rearrange(src_embed,
-                                  'b (h w) c -> b c h w',
-                                  h=src_size,
-                                  w=src_size)
-            src_embed = F.interpolate(src_embed,
-                                      size=(self.num_rows, self.num_cols),
-                                      mode='bicubic',
-                                      align_corners=True,
-                                      antialias=False)
-            src_embed = rearrange(src_embed, 'b c h w -> b (h w) c')
+            assert src_size**2 == src_embed.shape[1], (
+                "Unable to interpolate non-square embedding"
+            )
+
+            src_embed = rearrange(
+                src_embed, "b (h w) c -> b c h w", h=src_size, w=src_size
+            )
+            src_embed = F.interpolate(
+                src_embed,
+                size=(self.num_rows, self.num_cols),
+                mode="bicubic",
+                align_corners=True,
+                antialias=False,
+            )
+            src_embed = rearrange(src_embed, "b c h w -> b (h w) c")
         targ_embed.data.copy_(src_embed)
 
-    def _load_projection(self, src_proj_weight: torch.Tensor,
-                         targ_proj_weight: torch.Tensor):
+    def _load_projection(
+        self, src_proj_weight: torch.Tensor, targ_proj_weight: torch.Tensor
+    ):
         if src_proj_weight.shape != targ_proj_weight.shape:
             src_patch_size = int(math.sqrt(src_proj_weight.shape[1] // 3))
 
-            assert (src_patch_size**2) * 3 == src_proj_weight.shape[
-                1], 'Unable to interpolate non-square patch size'
-
-            src_proj_weight = rearrange(src_proj_weight,
-                                        'b (c h w) -> b c h w',
-                                        c=3,
-                                        h=src_patch_size,
-                                        w=src_patch_size)
-            src_proj_weight = F.interpolate(src_proj_weight,
-                                            size=(self.patch_size,
-                                                  self.patch_size),
-                                            mode='bicubic',
-                                            align_corners=True,
-                                            antialias=False)
-            src_proj_weight = rearrange(src_proj_weight,
-                                        'b c h w -> b (c h w)')
+            assert (src_patch_size**2) * 3 == src_proj_weight.shape[1], (
+                "Unable to interpolate non-square patch size"
+            )
+
+            src_proj_weight = rearrange(
+                src_proj_weight,
+                "b (c h w) -> b c h w",
+                c=3,
+                h=src_patch_size,
+                w=src_patch_size,
+            )
+            src_proj_weight = F.interpolate(
+                src_proj_weight,
+                size=(self.patch_size, self.patch_size),
+                mode="bicubic",
+                align_corners=True,
+                antialias=False,
+            )
+            src_proj_weight = rearrange(src_proj_weight, "b c h w -> b (c h w)")
         targ_proj_weight.data.copy_(src_proj_weight)
 
     def embed_patches(self, x: torch.Tensor) -> torch.Tensor:
@@ -276,11 +284,12 @@ def apply_pos_enc(
         pos_enc = self.get_pos_enc(patches.shape[0], patch_idxs, input_size)
 
         if self.training and self.pos_dropout > 0:
-            keeps = torch.rand(patches.shape[0],
-                               1,
-                               1,
-                               dtype=pos_enc.dtype,
-                               device=pos_enc.device) > self.pos_dropout
+            keeps = (
+                torch.rand(
+                    patches.shape[0], 1, 1, dtype=pos_enc.dtype, device=pos_enc.device
+                )
+                > self.pos_dropout
+            )
             pos_enc_drop = torch.where(keeps, pos_enc, 0)
         else:
             pos_enc_drop = pos_enc
@@ -303,56 +312,58 @@ def get_pos_enc(
         if patch_idxs is None:
             return pos_embed
 
-        exp_patch_idxs = patch_idxs.unsqueeze(-1).expand(
-            -1, -1, pos_embed.shape[-1])
+        exp_patch_idxs = patch_idxs.unsqueeze(-1).expand(-1, -1, pos_embed.shape[-1])
 
-        pos_embed = torch.gather(pos_embed.expand(patch_idxs.shape[0], -1, -1),
-                                 dim=1,
-                                 index=exp_patch_idxs)
+        pos_embed = torch.gather(
+            pos_embed.expand(patch_idxs.shape[0], -1, -1), dim=1, index=exp_patch_idxs
+        )
         return pos_embed
 
-    def _get_pos_embeddings(self, batch_size: int, input_dims: tuple[int,
-                                                                     int]):
+    def _get_pos_embeddings(self, batch_size: int, input_dims: tuple[int, int]):
         if (self.num_rows, self.num_cols) == input_dims:
             return self.pos_embed
 
-        pos_embed = self.pos_embed.reshape(1, self.num_rows, self.num_cols,
-                                           -1).permute(0, 3, 1, 2)
+        pos_embed = self.pos_embed.reshape(1, self.num_rows, self.num_cols, -1).permute(
+            0, 3, 1, 2
+        )
 
         def window_select(pos_embed):
             if input_dims[0] < pos_embed.shape[-2]:
-                pos_embed = pos_embed[..., :input_dims[0], :]
+                pos_embed = pos_embed[..., : input_dims[0], :]
             if input_dims[1] < pos_embed.shape[-1]:
-                pos_embed = pos_embed[..., :, :input_dims[1]]
+                pos_embed = pos_embed[..., :, : input_dims[1]]
             return pos_embed
 
         if self.cpe_mode:
             if self.training:
                 min_scale = math.sqrt(0.1)
-                scale = torch.rand(batch_size, 1, 1, device=pos_embed.device
-                                   ) * (1 - min_scale) + min_scale
+                scale = (
+                    torch.rand(batch_size, 1, 1, device=pos_embed.device)
+                    * (1 - min_scale)
+                    + min_scale
+                )
                 aspect_min = math.log(3 / 4)
                 aspect_max = -aspect_min
                 aspect = torch.exp(
-                    torch.rand(batch_size, 1, 1, device=pos_embed.device) *
-                    (aspect_max - aspect_min) + aspect_min)
+                    torch.rand(batch_size, 1, 1, device=pos_embed.device)
+                    * (aspect_max - aspect_min)
+                    + aspect_min
+                )
 
                 scale_x = scale * aspect
                 scale_y = scale * (1 / aspect)
                 scale_xy = torch.stack([scale_x, scale_y], dim=-1).clamp_(0, 1)
 
-                pos_xy = torch.rand(
-                    batch_size, 1, 1, 2,
-                    device=pos_embed.device) * (1 - scale_xy)
+                pos_xy = torch.rand(batch_size, 1, 1, 2, device=pos_embed.device) * (
+                    1 - scale_xy
+                )
 
                 lin_x = torch.linspace(
-                    0, 1, steps=input_dims[1],
-                    device=pos_embed.device)[None, None].expand(
-                        batch_size, input_dims[0], -1)
+                    0, 1, steps=input_dims[1], device=pos_embed.device
+                )[None, None].expand(batch_size, input_dims[0], -1)
                 lin_y = torch.linspace(
-                    0, 1, steps=input_dims[0],
-                    device=pos_embed.device)[None, :, None].expand(
-                        batch_size, -1, input_dims[1])
+                    0, 1, steps=input_dims[0], device=pos_embed.device
+                )[None, :, None].expand(batch_size, -1, input_dims[1])
 
                 lin_xy = torch.stack([lin_x, lin_y], dim=-1)
 
@@ -364,26 +375,27 @@ def window_select(pos_embed):
                 pos_embed = F.grid_sample(
                     pos_embed.float().expand(batch_size, -1, -1, -1),
                     grid=grid_xy,
-                    mode='bilinear',
-                    padding_mode='zeros',
+                    mode="bilinear",
+                    padding_mode="zeros",
                     align_corners=True,
                 ).to(pos_embed.dtype)
             else:
                 max_dim = max(input_dims)
-                pos_embed = F.interpolate(pos_embed.float(),
-                                          size=(max_dim, max_dim),
-                                          align_corners=True,
-                                          mode='bilinear').to(pos_embed.dtype)
+                pos_embed = F.interpolate(
+                    pos_embed.float(),
+                    size=(max_dim, max_dim),
+                    align_corners=True,
+                    mode="bilinear",
+                ).to(pos_embed.dtype)
 
                 pos_embed = window_select(pos_embed)
         else:
             pos_embed = window_select(pos_embed)
 
         if pos_embed.shape[-2:] != input_dims:
-            pos_embed = F.interpolate(pos_embed.float(),
-                                      size=input_dims,
-                                      align_corners=True,
-                                      mode='bilinear').to(pos_embed.dtype)
+            pos_embed = F.interpolate(
+                pos_embed.float(), size=input_dims, align_corners=True, mode="bilinear"
+            ).to(pos_embed.dtype)
 
         pos_embed = pos_embed.flatten(2).permute(0, 2, 1)
 
@@ -391,7 +403,6 @@ def window_select(pos_embed):
 
 
 class Im2Patches(nn.Module):
-
     def __init__(self, patch_size: int):
         super().__init__()
         self.patch_size = patch_size
@@ -406,7 +417,7 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
         px = x.shape[-1] // self.patch_size
         patches = rearrange(
             x,
-            'b c (py yy) (px xx) -> b (py px) (c yy xx)',
+            "b c (py yy) (px xx) -> b (py px) (c yy xx)",
             py=py,
             yy=self.patch_size,
             px=px,
@@ -416,12 +427,7 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class ViTPatchLinear(nn.Linear):
-
-    def __init__(self,
-                 patch_size: int,
-                 embed_dim: int,
-                 bias: bool = False,
-                 **factory):
+    def __init__(self, patch_size: int, embed_dim: int, bias: bool = False, **factory):
         super().__init__(3 * (patch_size**2), embed_dim, bias=bias, **factory)
         self.patch_size = patch_size
 
@@ -444,16 +450,19 @@ def __init__(
 
         self.config = config
         self.img_size, self.grid_size, self.num_patches = self._init_img_size(
-            to_2tuple(config.patch_size), config.image_size)
+            to_2tuple(config.patch_size), config.image_size
+        )
         max_img_size = int(
-            round(config.max_img_size / config.patch_size) * config.patch_size)
+            round(config.max_img_size / config.patch_size) * config.patch_size
+        )
         self.patch_generator = ViTPatchGenerator(
             config.patch_size,
             config.hidden_size,
             input_dims=self.img_size,
             max_input_dims=max_img_size,
             cls_token=True,
-            register_multiple=config.reg_tokens)
+            register_multiple=config.reg_tokens,
+        )
 
         self.encoder = InternVisionEncoder(
             config=config,
@@ -463,8 +472,7 @@ def __init__(
             prefix=f"{prefix}.encoder",
         )
 
-    def _init_img_size(self, patch_size, img_size: Union[int, tuple[int,
-                                                                    int]]):
+    def _init_img_size(self, patch_size, img_size: Union[int, tuple[int, int]]):
         if img_size is None:
             return None, None, None
         img_size = to_2tuple(img_size)
@@ -509,7 +517,8 @@ def __init__(
             quant_config=quant_config,
             num_hidden_layers_override=num_hidden_layers_override,
             num_dummy_heads=num_dummy_heads,
-            prefix=prefix)
+            prefix=prefix,
+        )
 
     def forward(
         self,
@@ -534,7 +543,7 @@ def load_weights(self, weights) -> set[str]:
                 # Skip non-radio weights
                 continue
 
-            sub = name[len("radio_model."):]  # drop "radio_model." prefix
+            sub = name[len("radio_model.") :]  # drop "radio_model." prefix
 
             # Skip buffers not used in vLLM
             if sub in {"summary_idxs"}:
@@ -553,15 +562,13 @@ def load_weights(self, weights) -> set[str]:
                     layer_idx = parts[2]
                     suffix = ".".join(parts[3:])
                     # Skip layer-scale entries that vLLM doesn't use
-                    if suffix in {"ls1", "ls2"} or suffix.startswith(
-                        ("ls1.", "ls2.")):
+                    if suffix in {"ls1", "ls2"} or suffix.startswith(("ls1.", "ls2.")):
                         continue
                     vllm_key = f"model.encoder.layers.{layer_idx}.{suffix}"
 
             if vllm_key and vllm_key in params_dict:
                 param = params_dict[vllm_key]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, weight)
                 loaded_params.add(vllm_key)
 
@@ -571,6 +578,6 @@ def _extract_final(self, y: torch.Tensor):
         # Remove CLS + REGISTERS tokens
         patch_gen = getattr(self.model, "patch_generator", None)
         if patch_gen is not None:
-            all_feat = y[:, patch_gen.num_skip:]
+            all_feat = y[:, patch_gen.num_skip :]
 
         return all_feat
diff --git a/vllm/model_executor/models/registry.py b/vllm/model_executor/models/registry.py
index bc2dc697d1c5..d96730346727 100644
--- a/vllm/model_executor/models/registry.py
+++ b/vllm/model_executor/models/registry.py
@@ -4,6 +4,7 @@
 Whenever you add an architecture to this page, please also update
 `tests/models/registry.py` with example HuggingFace models for it.
 """
+
 import hashlib
 import importlib
 import json
@@ -23,21 +24,33 @@
 import transformers
 
 from vllm import envs
-from vllm.config import (ModelConfig, iter_architecture_defaults,
-                         try_match_architecture_defaults)
+from vllm.config import (
+    ModelConfig,
+    iter_architecture_defaults,
+    try_match_architecture_defaults,
+)
 from vllm.logger import init_logger
 from vllm.logging_utils import logtime
-from vllm.transformers_utils.dynamic_module import (
-    try_get_class_from_dynamic_module)
-
-from .interfaces import (has_inner_state, has_noops, is_attention_free,
-                         is_hybrid, supports_cross_encoding,
-                         supports_multimodal,
-                         supports_multimodal_encoder_tp_data,
-                         supports_multimodal_raw_input_only, supports_pp,
-                         supports_transcription, supports_v0_only)
-from .interfaces_base import (get_default_pooling_type, is_pooling_model,
-                              is_text_generation_model)
+from vllm.transformers_utils.dynamic_module import try_get_class_from_dynamic_module
+
+from .interfaces import (
+    has_inner_state,
+    has_noops,
+    is_attention_free,
+    is_hybrid,
+    supports_cross_encoding,
+    supports_multimodal,
+    supports_multimodal_encoder_tp_data,
+    supports_multimodal_raw_input_only,
+    supports_pp,
+    supports_transcription,
+    supports_v0_only,
+)
+from .interfaces_base import (
+    get_default_pooling_type,
+    is_pooling_model,
+    is_text_generation_model,
+)
 
 logger = init_logger(__name__)
 
@@ -333,9 +346,7 @@
 # can modify  this variable to alter the args if needed. e.g.
 # when we use par format to pack things together, sys.executable
 # might not be the target we want to run.
-_SUBPROCESS_COMMAND = [
-    sys.executable, "-m", "vllm.model_executor.models.registry"
-]
+_SUBPROCESS_COMMAND = [sys.executable, "-m", "vllm.model_executor.models.registry"]
 
 _PREVIOUSLY_SUPPORTED_MODELS = {
     "MotifForCausalLM": "0.10.2",
@@ -380,24 +391,26 @@ def from_model_cls(model: type[nn.Module]) -> "_ModelInfo":
             default_pooling_type=get_default_pooling_type(model),
             supports_cross_encoding=supports_cross_encoding(model),
             supports_multimodal=supports_multimodal(model),
-            supports_multimodal_raw_input_only=
-            supports_multimodal_raw_input_only(model),
-            supports_multimodal_encoder_tp_data=
-            supports_multimodal_encoder_tp_data(model),
+            supports_multimodal_raw_input_only=supports_multimodal_raw_input_only(
+                model
+            ),
+            supports_multimodal_encoder_tp_data=supports_multimodal_encoder_tp_data(
+                model
+            ),
             supports_pp=supports_pp(model),
             has_inner_state=has_inner_state(model),
             is_attention_free=is_attention_free(model),
             is_hybrid=is_hybrid(model),
             supports_transcription=supports_transcription(model),
-            supports_transcription_only=(supports_transcription(model) and
-                                         model.supports_transcription_only),
+            supports_transcription_only=(
+                supports_transcription(model) and model.supports_transcription_only
+            ),
             supports_v0_only=supports_v0_only(model),
             has_noops=has_noops(model),
         )
 
 
 class _BaseRegisteredModel(ABC):
-
     @abstractmethod
     def inspect_model_cls(self) -> _ModelInfo:
         raise NotImplementedError
@@ -435,6 +448,7 @@ class _LazyRegisteredModel(_BaseRegisteredModel):
     """
     Represents a model that has not been imported in the main process.
     """
+
     module_name: str
     class_name: str
 
@@ -446,38 +460,42 @@ def _get_cache_filename(self) -> str:
         cls_name = f"{self.module_name}-{self.class_name}".replace(".", "-")
         return f"{cls_name}.json"
 
-    def _load_modelinfo_from_cache(self,
-                                   module_hash: str) -> _ModelInfo | None:
+    def _load_modelinfo_from_cache(self, module_hash: str) -> _ModelInfo | None:
         try:
             try:
-                modelinfo_path = self._get_cache_dir(
-                ) / self._get_cache_filename()
+                modelinfo_path = self._get_cache_dir() / self._get_cache_filename()
                 with open(modelinfo_path, encoding="utf-8") as file:
                     mi_dict = json.load(file)
             except FileNotFoundError:
-                logger.debug(("Cached model info file "
-                              "for class %s.%s not found"), self.module_name,
-                             self.class_name)
+                logger.debug(
+                    ("Cached model info file for class %s.%s not found"),
+                    self.module_name,
+                    self.class_name,
+                )
                 return None
 
             if mi_dict["hash"] != module_hash:
-                logger.debug(("Cached model info file "
-                              "for class %s.%s is stale"), self.module_name,
-                             self.class_name)
+                logger.debug(
+                    ("Cached model info file for class %s.%s is stale"),
+                    self.module_name,
+                    self.class_name,
+                )
                 return None
 
             # file not changed, use cached _ModelInfo properties
             return _ModelInfo(**mi_dict["modelinfo"])
         except Exception:
-            logger.exception(("Cached model info "
-                              "for class %s.%s error. "), self.module_name,
-                             self.class_name)
+            logger.exception(
+                ("Cached model info for class %s.%s error. "),
+                self.module_name,
+                self.class_name,
+            )
             return None
 
-    def _save_modelinfo_to_cache(self, mi: _ModelInfo,
-                                 module_hash: str) -> None:
+    def _save_modelinfo_to_cache(self, mi: _ModelInfo, module_hash: str) -> None:
         """save dictionary json file to cache"""
         from vllm.model_executor.model_loader.weight_utils import atomic_writer
+
         try:
             modelinfo_dict = {
                 "hash": module_hash,
@@ -486,15 +504,14 @@ def _save_modelinfo_to_cache(self, mi: _ModelInfo,
             cache_dir = self._get_cache_dir()
             cache_dir.mkdir(parents=True, exist_ok=True)
             modelinfo_path = cache_dir / self._get_cache_filename()
-            with atomic_writer(modelinfo_path, encoding='utf-8') as f:
+            with atomic_writer(modelinfo_path, encoding="utf-8") as f:
                 json.dump(modelinfo_dict, f, indent=2)
         except Exception:
             logger.exception("Error saving model info cache.")
 
     @logtime(logger=logger, msg="Registry inspect model class")
     def inspect_model_cls(self) -> _ModelInfo:
-        model_path = Path(
-            __file__).parent / f"{self.module_name.split('.')[-1]}.py"
+        model_path = Path(__file__).parent / f"{self.module_name.split('.')[-1]}.py"
         module_hash = None
 
         if model_path.exists():
@@ -503,21 +520,26 @@ def inspect_model_cls(self) -> _ModelInfo:
 
             mi = self._load_modelinfo_from_cache(module_hash)
             if mi is not None:
-                logger.debug(("Loaded model info "
-                              "for class %s.%s from cache"), self.module_name,
-                             self.class_name)
+                logger.debug(
+                    ("Loaded model info for class %s.%s from cache"),
+                    self.module_name,
+                    self.class_name,
+                )
                 return mi
             else:
-                logger.debug(("Cache model info "
-                              "for class %s.%s miss. "
-                              "Loading model instead."), self.module_name,
-                             self.class_name)
+                logger.debug(
+                    ("Cache model info for class %s.%s miss. Loading model instead."),
+                    self.module_name,
+                    self.class_name,
+                )
 
         # Performed in another process to avoid initializing CUDA
         mi = _run_in_subprocess(
-            lambda: _ModelInfo.from_model_cls(self.load_model_cls()))
-        logger.debug("Loaded model info for class %s.%s", self.module_name,
-                     self.class_name)
+            lambda: _ModelInfo.from_model_cls(self.load_model_cls())
+        )
+        logger.debug(
+            "Loaded model info for class %s.%s", self.module_name, self.class_name
+        )
 
         # save cache file
         if module_hash is not None:
@@ -536,12 +558,12 @@ def _try_load_model_cls(
     model: _BaseRegisteredModel,
 ) -> Optional[type[nn.Module]]:
     from vllm.platforms import current_platform
+
     current_platform.verify_model_arch(model_arch)
     try:
         return model.load_model_cls()
     except Exception:
-        logger.exception("Error in loading model architecture '%s'",
-                         model_arch)
+        logger.exception("Error in loading model architecture '%s'", model_arch)
         return None
 
 
@@ -553,8 +575,7 @@ def _try_inspect_model_cls(
     try:
         return model.inspect_model_cls()
     except Exception:
-        logger.exception("Error in inspecting model architecture '%s'",
-                         model_arch)
+        logger.exception("Error in inspecting model architecture '%s'", model_arch)
         return None
 
 
@@ -589,8 +610,10 @@ def register_model(
         if model_arch in self.models:
             logger.warning(
                 "Model architecture %s is already registered, and will be "
-                "overwritten by the new model class %s.", model_arch,
-                model_cls)
+                "overwritten by the new model class %s.",
+                model_arch,
+                model_cls,
+            )
 
         if isinstance(model_cls, str):
             split_str = model_cls.split(":")
@@ -602,8 +625,10 @@ def register_model(
         elif isinstance(model_cls, type) and issubclass(model_cls, nn.Module):
             model = _RegisteredModel.from_model_cls(model_cls)
         else:
-            msg = ("`model_cls` should be a string or PyTorch model class, "
-                   f"not a {type(model_arch)}")
+            msg = (
+                "`model_cls` should be a string or PyTorch model class, "
+                f"not a {type(model_arch)}"
+            )
             raise TypeError(msg)
 
         self.models[model_arch] = model
@@ -614,7 +639,8 @@ def _raise_for_unsupported(self, architectures: list[str]):
         if any(arch in all_supported_archs for arch in architectures):
             raise ValueError(
                 f"Model architectures {architectures} failed "
-                "to be inspected. Please check the logs for more details.")
+                "to be inspected. Please check the logs for more details."
+            )
 
         for arch in architectures:
             if arch in _PREVIOUSLY_SUPPORTED_MODELS:
@@ -624,14 +650,15 @@ def _raise_for_unsupported(self, architectures: list[str]):
                     f"Model architecture {arch} was supported in vLLM until "
                     f"v{previous_version}, and is not supported anymore. "
                     "Please use an older version of vLLM if you want to "
-                    "use this model architecture.")
+                    "use this model architecture."
+                )
 
         raise ValueError(
             f"Model architectures {architectures} are not supported for now. "
-            f"Supported architectures: {all_supported_archs}")
+            f"Supported architectures: {all_supported_archs}"
+        )
 
-    def _try_load_model_cls(self,
-                            model_arch: str) -> Optional[type[nn.Module]]:
+    def _try_load_model_cls(self, model_arch: str) -> Optional[type[nn.Module]]:
         if model_arch not in self.models:
             return None
 
@@ -651,8 +678,9 @@ def _try_resolve_transformers(
         if architecture in _TRANSFORMERS_BACKEND_MODELS:
             return architecture
 
-        auto_map: dict[str, str] = getattr(model_config.hf_config, "auto_map",
-                                           None) or dict()
+        auto_map: dict[str, str] = (
+            getattr(model_config.hf_config, "auto_map", None) or dict()
+        )
 
         # Make sure that config class is always initialized before model class,
         # otherwise the model class won't be able to access the config class,
@@ -694,7 +722,8 @@ def _try_resolve_transformers(
                     "registered model in the Transformers library (only "
                     "relevant if the model is meant to be in Transformers) "
                     "and 'AutoModel' is not present in the model config's "
-                    "'auto_map' (relevant if the model is custom).")
+                    "'auto_map' (relevant if the model is custom)."
+                )
 
         if not model_module.is_backend_compatible():
             if model_config.model_impl != "transformers":
@@ -702,7 +731,8 @@ def _try_resolve_transformers(
 
             raise ValueError(
                 f"The Transformers implementation of {architecture!r} "
-                "is not compatible with vLLM.")
+                "is not compatible with vLLM."
+            )
 
         return model_config._get_transformers_backend_cls()
 
@@ -744,8 +774,7 @@ def inspect_model_cls(
 
         # Require transformers impl
         if model_config.model_impl == "transformers":
-            arch = self._try_resolve_transformers(architectures[0],
-                                                  model_config)
+            arch = self._try_resolve_transformers(architectures[0], model_config)
             if arch is not None:
                 model_info = self._try_inspect_model_cls(arch)
                 if model_info is not None:
@@ -755,11 +784,12 @@ def inspect_model_cls(
             return (model_info, "Terratorch")
 
         # Fallback to transformers impl (after resolving convert_type)
-        if (all(arch not in self.models for arch in architectures)
-                and model_config.model_impl == "auto"
-                and getattr(model_config, "convert_type", "none") == "none"):
-            arch = self._try_resolve_transformers(architectures[0],
-                                                  model_config)
+        if (
+            all(arch not in self.models for arch in architectures)
+            and model_config.model_impl == "auto"
+            and getattr(model_config, "convert_type", "none") == "none"
+        ):
+            arch = self._try_resolve_transformers(architectures[0], model_config)
             if arch is not None:
                 model_info = self._try_inspect_model_cls(arch)
                 if model_info is not None:
@@ -772,10 +802,11 @@ def inspect_model_cls(
                 return (model_info, arch)
 
         # Fallback to transformers impl (before resolving runner_type)
-        if (all(arch not in self.models for arch in architectures)
-                and model_config.model_impl == "auto"):
-            arch = self._try_resolve_transformers(architectures[0],
-                                                  model_config)
+        if (
+            all(arch not in self.models for arch in architectures)
+            and model_config.model_impl == "auto"
+        ):
+            arch = self._try_resolve_transformers(architectures[0], model_config)
             if arch is not None:
                 model_info = self._try_inspect_model_cls(arch)
                 if model_info is not None:
@@ -795,8 +826,7 @@ def resolve_model_cls(
 
         # Require transformers impl
         if model_config.model_impl == "transformers":
-            arch = self._try_resolve_transformers(architectures[0],
-                                                  model_config)
+            arch = self._try_resolve_transformers(architectures[0], model_config)
             if arch is not None:
                 model_cls = self._try_load_model_cls(arch)
                 if model_cls is not None:
@@ -808,11 +838,12 @@ def resolve_model_cls(
                 return (model_cls, arch)
 
         # Fallback to transformers impl (after resolving convert_type)
-        if (all(arch not in self.models for arch in architectures)
-                and model_config.model_impl == "auto"
-                and getattr(model_config, "convert_type", "none") == "none"):
-            arch = self._try_resolve_transformers(architectures[0],
-                                                  model_config)
+        if (
+            all(arch not in self.models for arch in architectures)
+            and model_config.model_impl == "auto"
+            and getattr(model_config, "convert_type", "none") == "none"
+        ):
+            arch = self._try_resolve_transformers(architectures[0], model_config)
             if arch is not None:
                 model_cls = self._try_load_model_cls(arch)
                 if model_cls is not None:
@@ -825,10 +856,11 @@ def resolve_model_cls(
                 return (model_cls, arch)
 
         # Fallback to transformers impl (before resolving runner_type)
-        if (all(arch not in self.models for arch in architectures)
-                and model_config.model_impl == "auto"):
-            arch = self._try_resolve_transformers(architectures[0],
-                                                  model_config)
+        if (
+            all(arch not in self.models for arch in architectures)
+            and model_config.model_impl == "auto"
+        ):
+            arch = self._try_resolve_transformers(architectures[0], model_config)
             if arch is not None:
                 model_cls = self._try_load_model_cls(arch)
                 if model_cls is not None:
@@ -941,14 +973,15 @@ def is_v1_compatible(
         return not model_cls.supports_v0_only
 
 
-ModelRegistry = _ModelRegistry({
-    model_arch:
-    _LazyRegisteredModel(
-        module_name=f"vllm.model_executor.models.{mod_relname}",
-        class_name=cls_name,
-    )
-    for model_arch, (mod_relname, cls_name) in _VLLM_MODELS.items()
-})
+ModelRegistry = _ModelRegistry(
+    {
+        model_arch: _LazyRegisteredModel(
+            module_name=f"vllm.model_executor.models.{mod_relname}",
+            class_name=cls_name,
+        )
+        for model_arch, (mod_relname, cls_name) in _VLLM_MODELS.items()
+    }
+)
 
 _T = TypeVar("_T")
 
@@ -961,21 +994,23 @@ def _run_in_subprocess(fn: Callable[[], _T]) -> _T:
 
         # `cloudpickle` allows pickling lambda functions directly
         import cloudpickle
+
         input_bytes = cloudpickle.dumps((fn, output_filepath))
 
         # cannot use `sys.executable __file__` here because the script
         # contains relative imports
-        returned = subprocess.run(_SUBPROCESS_COMMAND,
-                                  input=input_bytes,
-                                  capture_output=True)
+        returned = subprocess.run(
+            _SUBPROCESS_COMMAND, input=input_bytes, capture_output=True
+        )
 
         # check if the subprocess is successful
         try:
             returned.check_returncode()
         except Exception as e:
             # wrap raised exception to provide more information
-            raise RuntimeError(f"Error raised in subprocess:\n"
-                               f"{returned.stderr.decode()}") from e
+            raise RuntimeError(
+                f"Error raised in subprocess:\n{returned.stderr.decode()}"
+            ) from e
 
         with open(output_filepath, "rb") as f:
             return pickle.load(f)
@@ -984,6 +1019,7 @@ def _run_in_subprocess(fn: Callable[[], _T]) -> _T:
 def _run() -> None:
     # Setup plugins
     from vllm.plugins import load_general_plugins
+
     load_general_plugins()
 
     fn, output_file = pickle.loads(sys.stdin.buffer.read())
diff --git a/vllm/model_executor/models/roberta.py b/vllm/model_executor/models/roberta.py
index a13042a6367c..6408cf7937b2 100644
--- a/vllm/model_executor/models/roberta.py
+++ b/vllm/model_executor/models/roberta.py
@@ -9,16 +9,25 @@
 from transformers import RobertaConfig
 
 from vllm.config import ModelConfig, VllmConfig
-from vllm.model_executor.layers.pooler import (ClassifierPooler, CLSPool,
-                                               DispatchPooler, Pooler)
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
-from vllm.model_executor.models.bert import (TOKEN_TYPE_SHIFT,
-                                             BertEmbeddingModel, BertModel,
-                                             _decode_token_type_ids,
-                                             _encode_token_type_ids)
-from vllm.model_executor.models.utils import (AutoWeightsLoader, WeightsMapper,
-                                              maybe_prefix)
+from vllm.model_executor.layers.pooler import (
+    ClassifierPooler,
+    CLSPool,
+    DispatchPooler,
+    Pooler,
+)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
+from vllm.model_executor.models.bert import (
+    TOKEN_TYPE_SHIFT,
+    BertEmbeddingModel,
+    BertModel,
+    _decode_token_type_ids,
+    _encode_token_type_ids,
+)
+from vllm.model_executor.models.utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    maybe_prefix,
+)
 from vllm.sequence import IntermediateTensors
 
 from .bert_with_rope import BertWithRope, JinaRobertaModel
@@ -27,21 +36,23 @@
 
 
 class RobertaEmbedding(nn.Module):
-
     def __init__(self, config: RobertaConfig):
         super().__init__()
         self.size = config.hidden_size
-        self.word_embeddings = VocabParallelEmbedding(config.vocab_size,
-                                                      config.hidden_size)
+        self.word_embeddings = VocabParallelEmbedding(
+            config.vocab_size, config.hidden_size
+        )
         self.padding_idx = config.pad_token_id
-        self.position_embeddings = nn.Embedding(config.max_position_embeddings,
-                                                config.hidden_size,
-                                                padding_idx=self.padding_idx)
-
-        self.token_type_embeddings = nn.Embedding(config.type_vocab_size,
-                                                  config.hidden_size)
-        self.LayerNorm = nn.LayerNorm(config.hidden_size,
-                                      eps=config.layer_norm_eps)
+        self.position_embeddings = nn.Embedding(
+            config.max_position_embeddings,
+            config.hidden_size,
+            padding_idx=self.padding_idx,
+        )
+
+        self.token_type_embeddings = nn.Embedding(
+            config.type_vocab_size, config.hidden_size
+        )
+        self.LayerNorm = nn.LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
         self.register_buffer(
             "position_ids",
             torch.arange(config.max_position_embeddings).unsqueeze(0),
@@ -49,8 +60,9 @@ def __init__(self, config: RobertaConfig):
 
         self.position_embedding_type = config.position_embedding_type
         if self.position_embedding_type != "absolute":
-            raise ValueError("Only 'absolute' position_embedding_type" +
-                             " is supported")
+            raise ValueError(
+                "Only 'absolute' position_embedding_type" + " is supported"
+            )
 
     def forward(
         self,
@@ -79,12 +91,10 @@ def __init__(self, model_config: "ModelConfig"):
         super().__init__()
         config = model_config.hf_config
         head_dtype = model_config.head_dtype
-        self.dense = nn.Linear(config.hidden_size,
-                               config.hidden_size,
-                               dtype=head_dtype)
-        self.out_proj = nn.Linear(config.hidden_size,
-                                  config.num_labels,
-                                  dtype=head_dtype)
+        self.dense = nn.Linear(config.hidden_size, config.hidden_size, dtype=head_dtype)
+        self.out_proj = nn.Linear(
+            config.hidden_size, config.num_labels, dtype=head_dtype
+        )
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         # CLSPool has already been applied in `pooling`
@@ -98,13 +108,13 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 class RobertaEmbeddingModel(BertEmbeddingModel):
     """A model that uses Roberta to provide embedding functionalities.
 
-   This class encapsulates the BertModel and provides an interface for
-   embedding operations and customized pooling functions.
+    This class encapsulates the BertModel and provides an interface for
+    embedding operations and customized pooling functions.
 
-   Attributes:
-       model: An instance of BertModel used for forward operations.
-       _pooler: An instance of Pooler used for pooling operations.
-   """
+    Attributes:
+        model: An instance of BertModel used for forward operations.
+        _pooler: An instance of Pooler used for pooling operations.
+    """
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(vllm_config=vllm_config, prefix=prefix)
@@ -117,34 +127,35 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-
         # Fix Roberta positions here outside of the CUDA graph.
         # Because we need the to extract the sequences from
         # input_ids the control flow is data dependent.
-        replace_roberta_positions(input_ids=input_ids,
-                                  position_ids=positions,
-                                  padding_idx=self.padding_idx)
-
-        return self.model(input_ids=input_ids,
-                          positions=positions,
-                          inputs_embeds=inputs_embeds,
-                          intermediate_tensors=intermediate_tensors)
-
-    def _build_model(self,
-                     vllm_config: VllmConfig,
-                     prefix: str = "") -> Union[BertModel, BertWithRope]:
-        if (vllm_config.model_config.hf_config.position_embedding_type ==
-                "rotary"):
+        replace_roberta_positions(
+            input_ids=input_ids, position_ids=positions, padding_idx=self.padding_idx
+        )
+
+        return self.model(
+            input_ids=input_ids,
+            positions=positions,
+            inputs_embeds=inputs_embeds,
+            intermediate_tensors=intermediate_tensors,
+        )
+
+    def _build_model(
+        self, vllm_config: VllmConfig, prefix: str = ""
+    ) -> Union[BertModel, BertWithRope]:
+        if vllm_config.model_config.hf_config.position_embedding_type == "rotary":
             return JinaRobertaModel(vllm_config=vllm_config, prefix=prefix)
         else:
-            return BertModel(vllm_config=vllm_config,
-                             prefix=prefix,
-                             embedding_class=RobertaEmbedding)
+            return BertModel(
+                vllm_config=vllm_config, prefix=prefix, embedding_class=RobertaEmbedding
+            )
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         weights_list = list(weights)
         has_roberta_prefix = any(
-            name.startswith("roberta.") for name, _ in weights_list)
+            name.startswith("roberta.") for name, _ in weights_list
+        )
         if has_roberta_prefix:
             # For models with the `roberta.` prefix e.g.
             # `FacebookAI/roberta-base`
@@ -162,26 +173,27 @@ def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
 class RobertaForSequenceClassification(nn.Module, SupportsCrossEncoding):
     """A model that uses Roberta to provide embedding functionalities.
 
-   This class encapsulates the BertModel and provides an interface for
-   embedding operations and customized pooling functions.
+    This class encapsulates the BertModel and provides an interface for
+    embedding operations and customized pooling functions.
 
-   Attributes:
-       roberta: An instance of BertModel used for forward operations.
-       _pooler: An instance of Pooler used for pooling operations.
-   """
+    Attributes:
+        roberta: An instance of BertModel used for forward operations.
+        _pooler: An instance of Pooler used for pooling operations.
+    """
 
     is_pooling_model = True
     jina_to_vllm_mapper = WeightsMapper(
         orig_to_new_substr={
-            'emb_ln': "embeddings.LayerNorm",
-            'layers': "layer",
-            'mixer.Wqkv': "attention.self.qkv_proj",
-            'mixer.out_proj': "attention.output.dense",
-            'norm1': "attention.output.LayerNorm",
-            'mlp.fc1': "intermediate.dense",
-            'mlp.fc2': "output.dense",
-            'norm2': "output.LayerNorm",
-        })
+            "emb_ln": "embeddings.LayerNorm",
+            "layers": "layer",
+            "mixer.Wqkv": "attention.self.qkv_proj",
+            "mixer.out_proj": "attention.output.dense",
+            "norm1": "attention.output.LayerNorm",
+            "mlp.fc1": "intermediate.dense",
+            "mlp.fc2": "output.dense",
+            "norm2": "output.LayerNorm",
+        }
+    )
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
@@ -189,32 +201,35 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.padding_idx: int = vllm_config.model_config.hf_config.pad_token_id
 
         self.num_labels = config.num_labels
-        self.roberta = BertModel(vllm_config=vllm_config,
-                                 prefix=maybe_prefix(prefix, "bert"),
-                                 embedding_class=RobertaEmbedding)
+        self.roberta = BertModel(
+            vllm_config=vllm_config,
+            prefix=maybe_prefix(prefix, "bert"),
+            embedding_class=RobertaEmbedding,
+        )
         self.classifier = RobertaClassificationHead(vllm_config.model_config)
 
         pooler_config = vllm_config.model_config.pooler_config
         assert pooler_config is not None
 
-        self.pooler = DispatchPooler({
-            "encode":
-            Pooler.for_encode(pooler_config),
-            "classify":
-            ClassifierPooler(
-                pooling=CLSPool(),
-                classifier=self.classifier,
-                act_fn=ClassifierPooler.act_fn_for_seq_cls(
-                    vllm_config.model_config),
-            ),
-            "score":
-            ClassifierPooler(
-                pooling=CLSPool(),
-                classifier=self.classifier,
-                act_fn=ClassifierPooler.act_fn_for_cross_encoder(
-                    vllm_config.model_config),
-            ),
-        })
+        self.pooler = DispatchPooler(
+            {
+                "encode": Pooler.for_encode(pooler_config),
+                "classify": ClassifierPooler(
+                    pooling=CLSPool(),
+                    classifier=self.classifier,
+                    act_fn=ClassifierPooler.act_fn_for_seq_cls(
+                        vllm_config.model_config
+                    ),
+                ),
+                "score": ClassifierPooler(
+                    pooling=CLSPool(),
+                    classifier=self.classifier,
+                    act_fn=ClassifierPooler.act_fn_for_cross_encoder(
+                        vllm_config.model_config
+                    ),
+                ),
+            }
+        )
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
         loader = AutoWeightsLoader(self)
@@ -231,22 +246,24 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         token_type_ids: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
-        replace_roberta_positions(input_ids=input_ids,
-                                  position_ids=positions,
-                                  padding_idx=self.padding_idx)
+        replace_roberta_positions(
+            input_ids=input_ids, position_ids=positions, padding_idx=self.padding_idx
+        )
         if token_type_ids is not None:
             assert self.roberta.config.vocab_size < (1 << TOKEN_TYPE_SHIFT)
             assert input_ids is not None
             _encode_token_type_ids(input_ids, token_type_ids)
-        return self.roberta(input_ids=input_ids,
-                            positions=positions,
-                            inputs_embeds=inputs_embeds,
-                            intermediate_tensors=intermediate_tensors)
+        return self.roberta(
+            input_ids=input_ids,
+            positions=positions,
+            inputs_embeds=inputs_embeds,
+            intermediate_tensors=intermediate_tensors,
+        )
 
 
-def replace_roberta_positions(input_ids: torch.Tensor,
-                              position_ids: torch.Tensor,
-                              padding_idx: int) -> None:
+def replace_roberta_positions(
+    input_ids: torch.Tensor, position_ids: torch.Tensor, padding_idx: int
+) -> None:
     # Replace position ids because in RoBERTa models
     # they have to start at padding_idx + 1 and ignore
     # existing padding tokens
diff --git a/vllm/model_executor/models/rvl.py b/vllm/model_executor/models/rvl.py
index 594d018f6bb6..89150677f3ce 100644
--- a/vllm/model_executor/models/rvl.py
+++ b/vllm/model_executor/models/rvl.py
@@ -13,14 +13,16 @@
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import MultiModalDataDict
 
-from .llava_next import (LlavaDummyInputsBuilder, LlavaNextMultiModalProcessor,
-                         LlavaNextProcessingInfo)
+from .llava_next import (
+    LlavaDummyInputsBuilder,
+    LlavaNextMultiModalProcessor,
+    LlavaNextProcessingInfo,
+)
 from .llava_onevision import LlavaOnevisionForConditionalGeneration
 from .utils import WeightsMapper
 
 
 class RVLProcessingInfo(LlavaNextProcessingInfo):
-
     def get_hf_config(self):
         return self.ctx.get_hf_config()
 
@@ -29,7 +31,6 @@ def get_hf_processor(self, **kwargs: object):
 
 
 class RVLDummyInputsBuilder(LlavaDummyInputsBuilder[RVLProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
         image_token = "<image>"
@@ -44,26 +45,24 @@ def get_dummy_mm_data(
     ) -> MultiModalDataDict:
         num_images = mm_counts.get("image", 0)
 
-        target_width, target_height = (
-            self.info.get_image_size_with_most_features())
+        target_width, target_height = self.info.get_image_size_with_most_features()
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
         }
 
 
 class RVLMultiModalProjector(nn.Module):
-
     def __init__(self, config):
         super().__init__()
-        self.pre_norm = nn.LayerNorm(config.vision_config.hidden_size,
-                                     eps=1e-06)
+        self.pre_norm = nn.LayerNorm(config.vision_config.hidden_size, eps=1e-06)
         self.linear_1 = nn.Linear(
             config.vision_config.hidden_size,
             config.text_config.hidden_size,
@@ -91,7 +90,6 @@ def forward(self, image_feature: torch.Tensor) -> torch.Tensor:
     dummy_inputs=RVLDummyInputsBuilder,
 )
 class RForConditionalGeneration(LlavaOnevisionForConditionalGeneration):
-
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_prefix={
             # mapping for new names in checkpoint saved after transformers
@@ -101,7 +99,8 @@ class RForConditionalGeneration(LlavaOnevisionForConditionalGeneration):
             "model.multi_modal_projector.": "multi_modal_projector.",
             "model.image_newline": "image_newline",
             "lm_head.": "language_model.lm_head.",
-        })
+        }
+    )
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         super().__init__(vllm_config=vllm_config, prefix=prefix)
diff --git a/vllm/model_executor/models/seed_oss.py b/vllm/model_executor/models/seed_oss.py
index a217c820fedf..ca33a694a3b6 100644
--- a/vllm/model_executor/models/seed_oss.py
+++ b/vllm/model_executor/models/seed_oss.py
@@ -22,6 +22,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Inference-only SeedOss model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -37,28 +38,38 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
 
 class SeedOssMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -83,8 +94,9 @@ def __init__(
             prefix=f"{prefix}.down_proj",
         )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -95,7 +107,6 @@ def forward(self, x):
 
 
 class SeedOssAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -181,7 +192,6 @@ def forward(
 
 
 class SeedOssDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: SeedOssConfig,
@@ -224,10 +234,10 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.mlp",
         )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -240,16 +250,14 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
@@ -260,14 +268,16 @@ def forward(
         "positions": -1,
         "intermediate_tensors": 0,
         "inputs_embeds": 0,
-    })
+    }
+)
 class SeedOssModel(nn.Module):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 decoder_layer_type: type[nn.Module] = SeedOssDecoderLayer):
+    def __init__(
+        self,
+        *,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        decoder_layer_type: type[nn.Module] = SeedOssDecoderLayer,
+    ):
         super().__init__()
 
         config = vllm_config.model_config.hf_config
@@ -275,8 +285,9 @@ def __init__(self,
         quant_config = vllm_config.quant_config
 
         # TODO (@robertgshaw2): see if this can be moved out
-        if (cache_config.sliding_window is not None
-                and hasattr(config, "max_window_layers")):
+        if cache_config.sliding_window is not None and hasattr(
+            config, "max_window_layers"
+        ):
             assert config.max_window_layers == config.num_hidden_layers, (
                 "Sliding window for some but all layers is not supported. "
                 "This model uses sliding window but `max_window_layers` = {} "
@@ -284,14 +295,16 @@ def __init__(self,
                 "to discuss this feature.".format(
                     config.max_window_layers,
                     config.num_hidden_layers,
-                ))
+                )
+            )
 
         self.config = config
         self.quant_config = quant_config
         self.vocab_size = config.vocab_size
 
-        if get_pp_group().is_first_rank or (config.tie_word_embeddings
-                                            and get_pp_group().is_last_rank):
+        if get_pp_group().is_first_rank or (
+            config.tie_word_embeddings and get_pp_group().is_last_rank
+        ):
             self.embed_tokens = VocabParallelEmbedding(
                 config.vocab_size,
                 config.hidden_size,
@@ -305,16 +318,18 @@ def __init__(self,
         decoder_layer_type = decoder_layer_type or SeedOssDecoderLayer
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: decoder_layer_type(config=config,
-                                              cache_config=cache_config,
-                                              quant_config=quant_config,
-                                              prefix=prefix),
+            lambda prefix: decoder_layer_type(
+                config=config,
+                cache_config=cache_config,
+                quant_config=quant_config,
+                prefix=prefix,
+            ),
             prefix=f"{prefix}.layers",
         )
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
         if get_pp_group().is_last_rank:
             self.norm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
         else:
@@ -347,15 +362,13 @@ def forward(
                 residual,
             )
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -369,18 +382,19 @@ def load_weights(self, weights: Iterable[tuple[str,
         for name, loaded_weight in weights:
             if "rotary_emb.inv_freq" in name:
                 continue
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -404,8 +418,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -434,25 +447,28 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.lora_config = lora_config
 
         self.quant_config = quant_config
-        self.model = SeedOssModel(vllm_config=vllm_config,
-                                  prefix=maybe_prefix(prefix, "model"))
+        self.model = SeedOssModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
         if get_pp_group().is_last_rank:
             if config.tie_word_embeddings:
                 self.lm_head = self.model.embed_tokens
             else:
-                self.lm_head = ParallelLMHead(config.vocab_size,
-                                              config.hidden_size,
-                                              quant_config=quant_config,
-                                              prefix=maybe_prefix(
-                                                  prefix, "lm_head"))
+                self.lm_head = ParallelLMHead(
+                    config.vocab_size,
+                    config.hidden_size,
+                    quant_config=quant_config,
+                    prefix=maybe_prefix(prefix, "lm_head"),
+                )
         else:
             self.lm_head = PPMissingLayer()
 
         self.logits_processor = LogitsProcessor(config.vocab_size)
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -464,8 +480,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -475,11 +492,9 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/siglip.py b/vllm/model_executor/models/siglip.py
index 4c60d96c77d7..ee21a03c8525 100644
--- a/vllm/model_executor/models/siglip.py
+++ b/vllm/model_executor/models/siglip.py
@@ -14,28 +14,33 @@
 from vllm.attention.layer import MultiHeadAttention
 from vllm.distributed import divide, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 
-from .vision import (VisionEncoderInfo, VisionFeatureSelectStrategy,
-                     resolve_visual_encoder_outputs)
+from .vision import (
+    VisionEncoderInfo,
+    VisionFeatureSelectStrategy,
+    resolve_visual_encoder_outputs,
+)
 
 
 class SiglipEncoderInfo(VisionEncoderInfo[SiglipVisionConfig]):
-
     def get_num_image_tokens(
         self,
         *,
         image_width: int,
         image_height: int,
     ) -> int:
-        return self.get_patch_grid_length()**2
+        return self.get_patch_grid_length() ** 2
 
     def get_image_size(self) -> int:
         return self.vision_config.image_size
@@ -50,7 +55,6 @@ def get_patch_grid_length(self) -> int:
 
 # Adapted from https://github.com/huggingface/transformers/blob/v4.43.3/src/transformers/models/siglip/modeling_siglip.py#L249 # noqa
 class SiglipVisionEmbeddings(nn.Module):
-
     def __init__(self, config: SiglipVisionConfig):
         super().__init__()
         self.config = config
@@ -66,19 +70,20 @@ def __init__(self, config: SiglipVisionConfig):
             padding="valid",
         )
 
-        self.num_patches = (self.image_size // self.patch_size)**2
+        self.num_patches = (self.image_size // self.patch_size) ** 2
         self.num_positions = self.num_patches
         self.position_embedding = VocabParallelEmbedding(
-            self.num_positions, self.embed_dim)
+            self.num_positions, self.embed_dim
+        )
         self.register_buffer(
             "position_ids",
-            torch.arange(self.num_positions, dtype=torch.int64).expand(
-                (1, -1)),
+            torch.arange(self.num_positions, dtype=torch.int64).expand((1, -1)),
             persistent=False,
         )
 
-    def interpolate_pos_encoding(self, embeddings: torch.Tensor, height: int,
-                                 width: int) -> torch.Tensor:
+    def interpolate_pos_encoding(
+        self, embeddings: torch.Tensor, height: int, width: int
+    ) -> torch.Tensor:
         """
         This method is an adapted method for SigLIP (due to SigLIP not having
         class embedding unlike other ViTs) that allows the model to interpolate
@@ -103,8 +108,8 @@ class embedding unlike other ViTs) that allows the model to interpolate
         height, width = height + 0.1, width + 0.1
 
         patch_pos_embed = position_embeddings.reshape(
-            1, int(math.sqrt(num_positions)), int(math.sqrt(num_positions)),
-            dim)
+            1, int(math.sqrt(num_positions)), int(math.sqrt(num_positions)), dim
+        )
         patch_pos_embed = patch_pos_embed.permute(0, 3, 1, 2)
         patch_pos_embed = nn.functional.interpolate(
             patch_pos_embed,
@@ -115,33 +120,36 @@ class embedding unlike other ViTs) that allows the model to interpolate
             mode="bicubic",
             align_corners=False,
         )
-        if (int(height) != patch_pos_embed.shape[-2]
-                or int(width) != patch_pos_embed.shape[-1]):
-            raise ValueError("Width or height does not match with "
-                             "the interpolated position embeddings")
+        if (
+            int(height) != patch_pos_embed.shape[-2]
+            or int(width) != patch_pos_embed.shape[-1]
+        ):
+            raise ValueError(
+                "Width or height does not match with "
+                "the interpolated position embeddings"
+            )
 
         patch_pos_embed = patch_pos_embed.permute(0, 2, 3, 1).view(1, -1, dim)
         return patch_pos_embed
 
-    def forward(self,
-                pixel_values: torch.Tensor,
-                interpolate_pos_encoding: bool = False) -> torch.Tensor:
+    def forward(
+        self, pixel_values: torch.Tensor, interpolate_pos_encoding: bool = False
+    ) -> torch.Tensor:
         _, _, height, width = pixel_values.shape
         target_dtype = self.patch_embedding.weight.dtype
-        patch_embeds = self.patch_embedding(pixel_values.to(
-            dtype=target_dtype))  # shape = [*, width, grid, grid]
+        patch_embeds = self.patch_embedding(
+            pixel_values.to(dtype=target_dtype)
+        )  # shape = [*, width, grid, grid]
         embeddings = patch_embeds.flatten(2).transpose(1, 2)
 
         if interpolate_pos_encoding:
-            embeddings += self.interpolate_pos_encoding(
-                embeddings, height, width)
+            embeddings += self.interpolate_pos_encoding(embeddings, height, width)
         else:
             embeddings += self.position_embedding(self.position_ids)
         return embeddings
 
 
 class SiglipAttention(nn.Module):
-
     def __init__(
         self,
         config: SiglipVisionConfig,
@@ -155,9 +163,11 @@ def __init__(
         self.num_heads = config.num_attention_heads
         self.head_dim = self.embed_dim // self.num_heads
         if self.head_dim * self.num_heads != self.embed_dim:
-            raise ValueError(f"embed_dim must be divisible by num_heads (got "
-                             "`embed_dim`: {self.embed_dim} and `num_heads`:"
-                             f" {self.num_heads}).")
+            raise ValueError(
+                f"embed_dim must be divisible by num_heads (got "
+                "`embed_dim`: {self.embed_dim} and `num_heads`:"
+                f" {self.num_heads})."
+            )
 
         self.scale = self.head_dim**-0.5
         self.dropout = config.attention_dropout
@@ -179,8 +189,9 @@ def __init__(
         self.tp_size = get_tensor_model_parallel_world_size()
         self.num_heads_per_partition = divide(self.num_heads, self.tp_size)
 
-        self.attn = MultiHeadAttention(self.num_heads_per_partition,
-                                       self.head_dim, self.scale)
+        self.attn = MultiHeadAttention(
+            self.num_heads_per_partition, self.head_dim, self.scale
+        )
 
     def forward(
         self,
@@ -197,7 +208,6 @@ def forward(
 
 
 class SiglipMLP(nn.Module):
-
     def __init__(
         self,
         config: SiglipVisionConfig,
@@ -209,15 +219,14 @@ def __init__(
         self.config = config
         self.activation_fn = get_act_fn(config.hidden_act)
         # Special handling for BNB and torchao quantization
-        if quant_config and quant_config.get_name() in [
-                "bitsandbytes", "torchao"
-        ]:
+        if quant_config and quant_config.get_name() in ["bitsandbytes", "torchao"]:
             quantizable = True
         else:
             # For other quantization, we require the hidden size to be a
             # multiple of 64
-            quantizable = (config.hidden_size % 64 == 0
-                           and config.intermediate_size % 64 == 0)
+            quantizable = (
+                config.hidden_size % 64 == 0 and config.intermediate_size % 64 == 0
+            )
         self.fc1 = ColumnParallelLinear(
             config.hidden_size,
             config.intermediate_size,
@@ -239,7 +248,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class SiglipEncoderLayer(nn.Module):
-
     def __init__(
         self,
         config: SiglipVisionConfig,
@@ -255,15 +263,13 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.self_attn",
         )
-        self.layer_norm1 = nn.LayerNorm(self.embed_dim,
-                                        eps=config.layer_norm_eps)
+        self.layer_norm1 = nn.LayerNorm(self.embed_dim, eps=config.layer_norm_eps)
         self.mlp = SiglipMLP(
             config,
             quant_config=quant_config,
             prefix=f"{prefix}.mlp",
         )
-        self.layer_norm2 = nn.LayerNorm(self.embed_dim,
-                                        eps=config.layer_norm_eps)
+        self.layer_norm2 = nn.LayerNorm(self.embed_dim, eps=config.layer_norm_eps)
 
     def forward(
         self,
@@ -284,7 +290,6 @@ def forward(
 
 
 class SiglipEncoder(nn.Module):
-
     def __init__(
         self,
         config: SiglipVisionConfig,
@@ -301,12 +306,16 @@ def __init__(
         else:
             num_hidden_layers = num_hidden_layers_override
 
-        self.layers = nn.ModuleList([
-            SiglipEncoderLayer(config,
-                               quant_config=quant_config,
-                               prefix=f"{prefix}.layers.{layer_idx}")
-            for layer_idx in range(num_hidden_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                SiglipEncoderLayer(
+                    config,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.layers.{layer_idx}",
+                )
+                for layer_idx in range(num_hidden_layers)
+            ]
+        )
 
     def forward(
         self,
@@ -341,12 +350,12 @@ def __init__(
         self.probe = nn.Parameter(torch.randn(1, 1, config.hidden_size))
         # TODO(ChristopherCho): Implement vLLM version of MultiheadAttention
         self.attention = torch.nn.MultiheadAttention(
-            config.hidden_size, config.num_attention_heads, batch_first=True)
-        self.layernorm = nn.LayerNorm(config.hidden_size,
-                                      eps=config.layer_norm_eps)
-        self.mlp = SiglipMLP(config=config,
-                             quant_config=quant_config,
-                             prefix=f"{prefix}.mlp")
+            config.hidden_size, config.num_attention_heads, batch_first=True
+        )
+        self.layernorm = nn.LayerNorm(config.hidden_size, eps=config.layer_norm_eps)
+        self.mlp = SiglipMLP(
+            config=config, quant_config=quant_config, prefix=f"{prefix}.mlp"
+        )
 
     def forward(self, hidden_state: torch.Tensor) -> torch.Tensor:
         batch_size = hidden_state.shape[0]
@@ -363,7 +372,6 @@ def forward(self, hidden_state: torch.Tensor) -> torch.Tensor:
 
 
 class SiglipVisionTransformer(nn.Module):
-
     def __init__(
         self,
         config: SiglipVisionConfig,
@@ -399,13 +407,13 @@ def __init__(
             require_post_norm = len(self.encoder.layers) == num_hidden_layers
 
         if require_post_norm:
-            self.post_layernorm = nn.LayerNorm(embed_dim,
-                                               eps=config.layer_norm_eps)
+            self.post_layernorm = nn.LayerNorm(embed_dim, eps=config.layer_norm_eps)
         else:
             self.post_layernorm = None
 
-        self.use_head = (True if not hasattr(config, "vision_use_head") else
-                         config.vision_use_head)
+        self.use_head = (
+            True if not hasattr(config, "vision_use_head") else config.vision_use_head
+        )
         if self.use_head:
             self.head = SiglipMultiheadAttentionPoolingHead(
                 config=config,
@@ -493,8 +501,7 @@ def forward(
             feature_select_strategy=feature_select_strategy,
         )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -507,8 +514,10 @@ def load_weights(self, weights: Iterable[tuple[str,
 
         for name, loaded_weight in weights:
             # post_layernorm is optional in SiglipVisionModel
-            if (name.startswith("vision_model.post_layernorm")
-                    and self.vision_model.post_layernorm is None):
+            if (
+                name.startswith("vision_model.post_layernorm")
+                and self.vision_model.post_layernorm is None
+            ):
                 continue
 
             # omit layers when num_hidden_layers_override is set
@@ -518,21 +527,21 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
 
             # Check if this is a scale parameter that needs remapping first
-            if name.endswith(
-                (".k_scale", ".v_scale", ".q_scale", ".prob_scale")):
+            if name.endswith((".k_scale", ".v_scale", ".q_scale", ".prob_scale")):
                 # Try to remap the scale name first
                 remapped_name = maybe_remap_kv_scale_name(name, params_dict)
                 if remapped_name is not None and remapped_name in params_dict:
                     # Successfully remapped, use the remapped name
                     param = params_dict[remapped_name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
                     loaded_params.add(remapped_name)
                     continue
                 # If remapping failed, continue with normal processing
 
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -543,8 +552,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
diff --git a/vllm/model_executor/models/siglip2navit.py b/vllm/model_executor/models/siglip2navit.py
index 5bea5b1daf4d..7cd133d9da1d 100644
--- a/vllm/model_executor/models/siglip2navit.py
+++ b/vllm/model_executor/models/siglip2navit.py
@@ -17,10 +17,13 @@
 from vllm.attention.layer import maybe_get_vit_flash_attn_backend
 from vllm.distributed import divide, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               LinearBase, QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    LinearBase,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 
@@ -28,23 +31,20 @@
 
 
 class VisionRotaryEmbedding(nn.Module):
-
     def __init__(self, dim: int, theta: float = 10000.0) -> None:
         super().__init__()
-        inv_freq = 1.0 / (theta
-                          **(torch.arange(0, dim, 2, dtype=torch.float) / dim))
+        inv_freq = 1.0 / (theta ** (torch.arange(0, dim, 2, dtype=torch.float) / dim))
         self.register_buffer("inv_freq", inv_freq, persistent=False)
 
     def forward(self, seqlen: int) -> torch.Tensor:
-        seq = torch.arange(seqlen,
-                           device=self.inv_freq.device,
-                           dtype=self.inv_freq.dtype)
+        seq = torch.arange(
+            seqlen, device=self.inv_freq.device, dtype=self.inv_freq.dtype
+        )
         freqs = torch.outer(seq, self.inv_freq)
         return freqs
 
 
 class Siglip2VisionEmbeddings(nn.Module):
-
     def __init__(self, config: PretrainedConfig):
         super().__init__()
         self.config = config
@@ -58,15 +58,13 @@ def __init__(self, config: PretrainedConfig):
         # siglip2 naflex
         if self.num_patches > 0:
             self.patch_embedding = ReplicatedLinear(
-                input_size=config.num_channels * self.patch_size *
-                self.patch_size,
+                input_size=config.num_channels * self.patch_size * self.patch_size,
                 output_size=self.embed_dim,
                 return_bias=False,
             )
             if self.preserve_original_pe:
                 self.position_embedding_size = int(self.num_patches**0.5)
-                self.position_embedding = nn.Embedding(self.num_patches,
-                                                       self.embed_dim)
+                self.position_embedding = nn.Embedding(self.num_patches, self.embed_dim)
 
         else:
             self.patch_embedding = nn.Conv2d(
@@ -77,15 +75,15 @@ def __init__(self, config: PretrainedConfig):
                 padding="valid",
             )
             if self.preserve_original_pe:
-                self.num_patches = (self.image_size // self.patch_size)**2
-                self.position_embedding_size = (self.image_size //
-                                                self.patch_size)
-                self.position_embedding = nn.Embedding(self.num_patches,
-                                                       self.embed_dim)
-
-    def forward(self,
-                pixel_values: torch.FloatTensor,
-                grid_thws: Optional[torch.LongTensor] = None) -> torch.Tensor:
+                self.num_patches = (self.image_size // self.patch_size) ** 2
+                self.position_embedding_size = self.image_size // self.patch_size
+                self.position_embedding = nn.Embedding(self.num_patches, self.embed_dim)
+
+    def forward(
+        self,
+        pixel_values: torch.FloatTensor,
+        grid_thws: Optional[torch.LongTensor] = None,
+    ) -> torch.Tensor:
         """
         Args:
             pixel_values (`torch.FloatTensor`):
@@ -100,36 +98,48 @@ def forward(self,
         # Apply patch embeddings to already patchified pixel values
         target_dtype = self.patch_embedding.weight.dtype
         if isinstance(self.patch_embedding, LinearBase):
-            patch_embeds = self.patch_embedding(
-                pixel_values.to(dtype=target_dtype))
+            patch_embeds = self.patch_embedding(pixel_values.to(dtype=target_dtype))
         elif isinstance(self.patch_embedding, nn.Conv2d):
             pixel_values = pixel_values.view(
-                -1, self.config.num_channels * self.config.temporal_patch_size,
-                self.patch_size, self.patch_size)
-            patch_embeds = self.patch_embedding(
-                pixel_values.to(dtype=target_dtype))
+                -1,
+                self.config.num_channels * self.config.temporal_patch_size,
+                self.patch_size,
+                self.patch_size,
+            )
+            patch_embeds = self.patch_embedding(pixel_values.to(dtype=target_dtype))
             patch_embeds = patch_embeds.reshape(-1, self.embed_dim)
 
         if self.preserve_original_pe:
             assert grid_thws is not None
             pos_embed_new = torch.zeros_like(patch_embeds)
-            positional_embeddings = self.position_embedding.weight.reshape(
-                self.position_embedding_size, self.position_embedding_size,
-                -1).unsqueeze(0).permute(0, 3, 1, 2)
+            positional_embeddings = (
+                self.position_embedding.weight.reshape(
+                    self.position_embedding_size, self.position_embedding_size, -1
+                )
+                .unsqueeze(0)
+                .permute(0, 3, 1, 2)
+            )
             cnt = 0
             for t, h, w in grid_thws:
                 volume = t * h * w
-                pe = F.interpolate(positional_embeddings,
-                                   size=(h, w),
-                                   mode='bicubic',
-                                   align_corners=False)
+                pe = F.interpolate(
+                    positional_embeddings,
+                    size=(h, w),
+                    mode="bicubic",
+                    align_corners=False,
+                )
                 pe = pe.permute(0, 2, 3, 1).reshape(1, h * w, -1)
                 pe = pe[0].repeat(t, 1)
-                pe = pe.reshape(t, h // self.hidden_stride, self.hidden_stride,
-                                w // self.hidden_stride, self.hidden_stride,
-                                -1)
+                pe = pe.reshape(
+                    t,
+                    h // self.hidden_stride,
+                    self.hidden_stride,
+                    w // self.hidden_stride,
+                    self.hidden_stride,
+                    -1,
+                )
                 pe = pe.permute(0, 1, 3, 2, 4, 5).reshape(volume, -1)
-                pos_embed_new[cnt:cnt + volume] = pe
+                pos_embed_new[cnt : cnt + volume] = pe
                 cnt += volume
             patch_embeds = patch_embeds + pos_embed_new
 
@@ -143,9 +153,9 @@ def rotate_half(x, interleaved=False):
         return torch.cat((-x2, x1), dim=-1)
     else:
         x1, x2 = x[..., ::2], x[..., 1::2]
-        return rearrange(torch.stack((-x2, x1), dim=-1),
-                         "... d two -> ... (d two)",
-                         two=2)
+        return rearrange(
+            torch.stack((-x2, x1), dim=-1), "... d two -> ... (d two)", two=2
+        )
 
 
 def apply_rotary_emb_torch(x, cos, sin, interleaved=False):
@@ -156,15 +166,15 @@ def apply_rotary_emb_torch(x, cos, sin, interleaved=False):
     ro_dim = cos.shape[-1] * 2
     assert ro_dim <= x.shape[-1]
     cos = repeat(
-        cos,
-        "... d -> ... 1 (2 d)" if not interleaved else "... d -> ... 1 (d 2)")
+        cos, "... d -> ... 1 (2 d)" if not interleaved else "... d -> ... 1 (d 2)"
+    )
     sin = repeat(
-        sin,
-        "... d -> ... 1 (2 d)" if not interleaved else "... d -> ... 1 (d 2)")
+        sin, "... d -> ... 1 (2 d)" if not interleaved else "... d -> ... 1 (d 2)"
+    )
     return torch.cat(
         [
-            x[..., :ro_dim] * cos +
-            rotate_half(x[..., :ro_dim], interleaved) * sin, x[..., ro_dim:]
+            x[..., :ro_dim] * cos + rotate_half(x[..., :ro_dim], interleaved) * sin,
+            x[..., ro_dim:],
         ],
         dim=-1,
     )
@@ -181,13 +191,12 @@ def apply_rotary_pos_emb(
     sin = sin.chunk(2, dim=-1)[0].contiguous()
     if is_flash_attn_backend:
         from flash_attn.layers.rotary import apply_rotary_emb
+
         apply_rotary_emb_func = apply_rotary_emb
     else:
         apply_rotary_emb_func = apply_rotary_emb_torch
-    q_embed = apply_rotary_emb_func(q.float(), cos.float(),
-                                    sin.float()).type_as(q)
-    k_embed = apply_rotary_emb_func(k.float(), cos.float(),
-                                    sin.float()).type_as(k)
+    q_embed = apply_rotary_emb_func(q.float(), cos.float(), sin.float()).type_as(q)
+    k_embed = apply_rotary_emb_func(k.float(), cos.float(), sin.float()).type_as(k)
     return q_embed, k_embed
 
 
@@ -210,7 +219,8 @@ def __init__(
             raise ValueError(
                 f"embed_dim must be divisible by num_heads "
                 f"(got `embed_dim`: {self.embed_dim} and `num_heads`:"
-                f" {self.num_heads}).")
+                f" {self.num_heads})."
+            )
         self.scale = self.head_dim**-0.5
         self.dropout = config.attention_dropout
         self.is_causal = False
@@ -231,37 +241,41 @@ def __init__(
             prefix=f"{prefix}.out_proj",
         )
 
-        self.tp_size = (1 if use_data_parallel else
-                        get_tensor_model_parallel_world_size())
+        self.tp_size = (
+            1 if use_data_parallel else get_tensor_model_parallel_world_size()
+        )
         self.num_heads_per_partition = divide(self.num_heads, self.tp_size)
         self.use_rope = config.use_rope
 
         # Detect attention implementation.
         self.attn_backend = get_vit_attn_backend(
-            head_size=self.head_dim, dtype=torch.get_default_dtype())
+            head_size=self.head_dim, dtype=torch.get_default_dtype()
+        )
         self.use_upstream_fa = False
 
-        self.attn_backend, self.flash_attn_varlen_func \
-            = maybe_get_vit_flash_attn_backend(
+        self.attn_backend, self.flash_attn_varlen_func = (
+            maybe_get_vit_flash_attn_backend(
                 self.attn_backend,
                 self.use_upstream_fa,
             )
+        )
 
         if self.attn_backend not in {
-                _Backend.FLASH_ATTN, _Backend.TORCH_SDPA,
-                _Backend.ROCM_AITER_FA
+            _Backend.FLASH_ATTN,
+            _Backend.TORCH_SDPA,
+            _Backend.ROCM_AITER_FA,
         }:
             self.attn_backend = _Backend.TORCH_SDPA
         self.is_flash_attn_backend = self.attn_backend in {
-            _Backend.FLASH_ATTN, _Backend.ROCM_AITER_FA
+            _Backend.FLASH_ATTN,
+            _Backend.ROCM_AITER_FA,
         }
 
     def forward(
         self,
         hidden_states: torch.Tensor,
         cu_seqlens: torch.Tensor,
-        position_embeddings: Optional[tuple[torch.Tensor,
-                                            torch.Tensor]] = None,
+        position_embeddings: Optional[tuple[torch.Tensor, torch.Tensor]] = None,
     ) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
         """Input shape: Batch x Time x Channel"""
 
@@ -270,26 +284,27 @@ def forward(
         qkv_states, _ = self.qkv_proj(hidden_states)
         queries, keys, values = qkv_states.chunk(3, dim=-1)
 
-        queries = queries.view(seq_length, self.num_heads_per_partition,
-                               self.head_dim)
-        keys = keys.view(seq_length, self.num_heads_per_partition,
-                         self.head_dim)
-        values = values.view(seq_length, self.num_heads_per_partition,
-                             self.head_dim)
+        queries = queries.view(seq_length, self.num_heads_per_partition, self.head_dim)
+        keys = keys.view(seq_length, self.num_heads_per_partition, self.head_dim)
+        values = values.view(seq_length, self.num_heads_per_partition, self.head_dim)
 
         if self.use_rope:
             cos, sin = position_embeddings
-            queries, keys = apply_rotary_pos_emb(queries.unsqueeze(0),
-                                                 keys.unsqueeze(0), cos, sin,
-                                                 self.is_flash_attn_backend)
+            queries, keys = apply_rotary_pos_emb(
+                queries.unsqueeze(0),
+                keys.unsqueeze(0),
+                cos,
+                sin,
+                self.is_flash_attn_backend,
+            )
             queries = queries.squeeze(0)
             keys = keys.squeeze(0)
 
         max_seqlen = (cu_seqlens[1:] - cu_seqlens[:-1]).max().item()
         if self.is_flash_attn_backend:
             attn_output = self.flash_attn_varlen_func(
-                queries, keys, values, cu_seqlens, cu_seqlens, max_seqlen,
-                max_seqlen).reshape(seq_length, -1)
+                queries, keys, values, cu_seqlens, cu_seqlens, max_seqlen, max_seqlen
+            ).reshape(seq_length, -1)
         elif self.attn_backend == _Backend.TORCH_SDPA:
             # Execute attention entry by entry for speed & less VRAM.
             batch_size = cu_seqlens.shape[0] - 1
@@ -308,13 +323,9 @@ def forward(
                 # (1, num_heads, seq_len, head_dim)
                 q_i, k_i, v_i = [x.transpose(1, 2) for x in (q_i, k_i, v_i)]
 
-                output_i = F.scaled_dot_product_attention(q_i,
-                                                          k_i,
-                                                          v_i,
-                                                          dropout_p=0.0)
+                output_i = F.scaled_dot_product_attention(q_i, k_i, v_i, dropout_p=0.0)
                 # (1, num_heads, seq_len, head_dim) -> (seq_len, embed_dim)
-                output_i = output_i.transpose(1, 2).reshape(
-                    end_idx - start_idx, -1)
+                output_i = output_i.transpose(1, 2).reshape(end_idx - start_idx, -1)
                 outputs.append(output_i)
 
             attn_output = torch.cat(outputs, dim=0)
@@ -323,7 +334,6 @@ def forward(
 
 
 class Siglip2MLP(nn.Module):
-
     def __init__(
         self,
         config: Siglip2VisionConfig,
@@ -357,7 +367,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class Siglip2EncoderLayer(nn.Module):
-
     def __init__(
         self,
         config: Siglip2VisionConfig,
@@ -367,21 +376,27 @@ def __init__(
     ):
         super().__init__()
         self.embed_dim = config.hidden_size
-        self.layer_norm1 = nn.LayerNorm(self.embed_dim,
-                                        eps=config.layer_norm_eps)
-        self.self_attn = Siglip2Attention(config,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.self_attn",
-                                          use_data_parallel=use_data_parallel)
-        self.layer_norm2 = nn.LayerNorm(self.embed_dim,
-                                        eps=config.layer_norm_eps)
-        self.mlp = Siglip2MLP(config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.mlp",
-                              use_data_parallel=use_data_parallel)
-
-    def forward(self, hidden_states: torch.Tensor, cu_seqlens: torch.Tensor,
-                position_embeddings: torch.Tensor) -> tuple[torch.FloatTensor]:
+        self.layer_norm1 = nn.LayerNorm(self.embed_dim, eps=config.layer_norm_eps)
+        self.self_attn = Siglip2Attention(
+            config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.self_attn",
+            use_data_parallel=use_data_parallel,
+        )
+        self.layer_norm2 = nn.LayerNorm(self.embed_dim, eps=config.layer_norm_eps)
+        self.mlp = Siglip2MLP(
+            config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.mlp",
+            use_data_parallel=use_data_parallel,
+        )
+
+    def forward(
+        self,
+        hidden_states: torch.Tensor,
+        cu_seqlens: torch.Tensor,
+        position_embeddings: torch.Tensor,
+    ) -> tuple[torch.FloatTensor]:
         """
         Args:
             hidden_states: Input tensor of shape (batch, seq_len, embed_dim).
@@ -391,9 +406,11 @@ def forward(self, hidden_states: torch.Tensor, cu_seqlens: torch.Tensor,
         residual = hidden_states
 
         hidden_states = self.layer_norm1(hidden_states)
-        hidden_states = self.self_attn(hidden_states=hidden_states,
-                                       cu_seqlens=cu_seqlens,
-                                       position_embeddings=position_embeddings)
+        hidden_states = self.self_attn(
+            hidden_states=hidden_states,
+            cu_seqlens=cu_seqlens,
+            position_embeddings=position_embeddings,
+        )
         hidden_states = residual + hidden_states
 
         residual = hidden_states
@@ -405,7 +422,7 @@ def forward(self, hidden_states: torch.Tensor, cu_seqlens: torch.Tensor,
 
 class Siglip2Encoder(nn.Module):
     """
-    Transformer encoder consisting of `config.num_hidden_layers` 
+    Transformer encoder consisting of `config.num_hidden_layers`
     self attention layers. Each layer is a [`Siglip2EncoderLayer`].
 
     Args:
@@ -421,16 +438,21 @@ def __init__(
     ):
         super().__init__()
         self.config = config
-        self.layers = nn.ModuleList([
-            Siglip2EncoderLayer(config,
-                                quant_config=quant_config,
-                                prefix=f"{prefix}.layers.{idx}",
-                                use_data_parallel=use_data_parallel)
-            for idx in range(config.num_hidden_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                Siglip2EncoderLayer(
+                    config,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.layers.{idx}",
+                    use_data_parallel=use_data_parallel,
+                )
+                for idx in range(config.num_hidden_layers)
+            ]
+        )
 
         self.rotary_pos_emb = VisionRotaryEmbedding(
-            config.hidden_size // config.num_attention_heads // 2)
+            config.hidden_size // config.num_attention_heads // 2
+        )
         self.patch_size = config.patch_size
         self.hidden_stride = config.hidden_stride
         self.window_size = config.window_size
@@ -439,7 +461,7 @@ def __init__(
             self.fullatt_block_indexes = None
         else:
             self.fullatt_block_indexes = [
-                int(i) for i in config.fullatt_block_indexes.split('|')
+                int(i) for i in config.fullatt_block_indexes.split("|")
             ]
 
     # copied from qwen2.5_vl
@@ -465,8 +487,7 @@ def rot_pos_emb(self, grid_thw):
             )
             wpos_ids = wpos_ids.permute(0, 2, 1, 3)
             wpos_ids = wpos_ids.flatten()
-            pos_ids.append(
-                torch.stack([hpos_ids, wpos_ids], dim=-1).repeat(t, 1))
+            pos_ids.append(torch.stack([hpos_ids, wpos_ids], dim=-1).repeat(t, 1))
         pos_ids = torch.cat(pos_ids, dim=0)
         max_grid_size = grid_thw[:, 1:].max()
         rotary_pos_emb_full = self.rotary_pos_emb(max_grid_size)
@@ -478,8 +499,9 @@ def get_window_index(self, grid_thw):
         cu_window_seqlens: list = [0]
         window_index_id = 0
         # patch (after merge) number in each window
-        vit_merger_window_size = (self.window_size // self.hidden_stride //
-                                  self.patch_size)
+        vit_merger_window_size = (
+            self.window_size // self.hidden_stride // self.patch_size
+        )
 
         for grid_t, grid_h, grid_w in grid_thw:
             llm_grid_h, llm_grid_w = (
@@ -487,7 +509,8 @@ def get_window_index(self, grid_thw):
                 grid_w // self.hidden_stride,
             )
             index = torch.arange(grid_t * llm_grid_h * llm_grid_w).reshape(
-                grid_t, llm_grid_h, llm_grid_w)
+                grid_t, llm_grid_h, llm_grid_w
+            )
             pad_h = vit_merger_window_size - llm_grid_h % vit_merger_window_size
             pad_w = vit_merger_window_size - llm_grid_w % vit_merger_window_size
             num_windows_h = (llm_grid_h + pad_h) // vit_merger_window_size
@@ -510,8 +533,9 @@ def get_window_index(self, grid_thw):
             index_padded = index_padded.reshape(-1)
             index_new = index_padded[index_padded != -100]
             window_index.append(index_new + window_index_id)
-            cu_seqlens_tmp = seqlens.cumsum(
-                0) * self.spatial_merge_unit + cu_window_seqlens[-1]
+            cu_seqlens_tmp = (
+                seqlens.cumsum(0) * self.spatial_merge_unit + cu_window_seqlens[-1]
+            )
             cu_window_seqlens.extend(cu_seqlens_tmp.tolist())
             window_index_id += (grid_t * llm_grid_h * llm_grid_w).item()
         window_index = torch.cat(window_index, dim=0)
@@ -525,10 +549,10 @@ def forward(
     ) -> torch.Tensor:
         r"""
         Args:
-            inputs_embeds: Input tensor of shape 
+            inputs_embeds: Input tensor of shape
                 (batch_size, sequence_length, hidden_size).
                 Embedded representation of the input tokens.
-            grid_thws: Grid tensor of shape (num_patches, 3) 
+            grid_thws: Grid tensor of shape (num_patches, 3)
                 containing grid dimensions.
                 Whether or not to return a [`~utils.ModelOutput`] instead of
                 a plain tuple.
@@ -544,11 +568,13 @@ def forward(
 
         seq_len, _ = inputs_embeds.size()
         inputs_embeds = inputs_embeds.reshape(
-            seq_len // self.spatial_merge_unit, self.spatial_merge_unit, -1)
+            seq_len // self.spatial_merge_unit, self.spatial_merge_unit, -1
+        )
         inputs_embeds = inputs_embeds[window_index, :, :]
         inputs_embeds = inputs_embeds.reshape(seq_len, -1)
         rotary_pos_emb = rotary_pos_emb.reshape(
-            seq_len // self.spatial_merge_unit, self.spatial_merge_unit, -1)
+            seq_len // self.spatial_merge_unit, self.spatial_merge_unit, -1
+        )
         rotary_pos_emb = rotary_pos_emb[window_index, :, :]
         rotary_pos_emb = rotary_pos_emb.reshape(seq_len, -1)
         emb = torch.cat((rotary_pos_emb, rotary_pos_emb), dim=-1)
@@ -572,23 +598,21 @@ def forward(
 
         hidden_states = inputs_embeds
         for index, block in enumerate(self.layers):
-            if (not self.fullatt_block_indexes
-                    or index in self.fullatt_block_indexes):
+            if not self.fullatt_block_indexes or index in self.fullatt_block_indexes:
                 cu_seqlens_tmp = cu_seqlens
             else:
                 cu_seqlens_tmp = cu_window_seqlens
-            hidden_states = block(hidden_states, cu_seqlens_tmp,
-                                  position_embeddings)
+            hidden_states = block(hidden_states, cu_seqlens_tmp, position_embeddings)
 
         hidden_states = hidden_states.reshape(
-            seq_len // self.spatial_merge_unit, self.spatial_merge_unit, -1)
+            seq_len // self.spatial_merge_unit, self.spatial_merge_unit, -1
+        )
         hidden_states = hidden_states[reverse_indices, :].reshape(seq_len, -1)
 
         return hidden_states
 
 
 class Siglip2VisionTransformer(nn.Module):
-
     def __init__(
         self,
         config: Siglip2VisionConfig,
@@ -601,12 +625,13 @@ def __init__(
         embed_dim = config.hidden_size
 
         self.embeddings = Siglip2VisionEmbeddings(config)
-        self.encoder = Siglip2Encoder(config,
-                                      quant_config=quant_config,
-                                      prefix=f"{prefix}.encoder",
-                                      use_data_parallel=use_data_parallel)
-        self.post_layernorm = nn.LayerNorm(embed_dim,
-                                           eps=config.layer_norm_eps)
+        self.encoder = Siglip2Encoder(
+            config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.encoder",
+            use_data_parallel=use_data_parallel,
+        )
+        self.post_layernorm = nn.LayerNorm(embed_dim, eps=config.layer_norm_eps)
 
     def forward(
         self,
@@ -627,7 +652,6 @@ def forward(
 
 
 class Siglip2NavitModel(torch.nn.Module):
-
     def __init__(
         self,
         config: Siglip2VisionConfig,
@@ -641,7 +665,8 @@ def __init__(
             config,
             quant_config=quant_config,
             prefix=f"{prefix}.vision_model",
-            use_data_parallel=use_data_parallel)
+            use_data_parallel=use_data_parallel,
+        )
 
     def forward(
         self,
@@ -653,8 +678,7 @@ def forward(
             grid_thws=grid_thws,
         )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -665,7 +689,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         loaded_params: set[str] = set()
 
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -676,8 +700,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
diff --git a/vllm/model_executor/models/skyworkr1v.py b/vllm/model_executor/models/skyworkr1v.py
index af99e4953b1a..f0f6917ddf91 100644
--- a/vllm/model_executor/models/skyworkr1v.py
+++ b/vllm/model_executor/models/skyworkr1v.py
@@ -21,17 +21,30 @@
 from vllm.model_executor.layers.linear import ReplicatedLinear
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.quantization.awq import AWQConfig
-from vllm.model_executor.models.intern_vit import (InternVisionModel,
-                                                   InternVisionPatchModel)
+from vllm.model_executor.models.intern_vit import (
+    InternVisionModel,
+    InternVisionPatchModel,
+)
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.image import convert_image_mode
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
-from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
-                                   ImageSize, MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
+from vllm.multimodal.parse import (
+    ImageEmbeddingItems,
+    ImageProcessorItems,
+    ImageSize,
+    MultiModalDataItems,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.tokenizer import AnyTokenizer
@@ -40,9 +53,9 @@
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
 from .utils import AutoWeightsLoader, init_vllm_registered_model, maybe_prefix
 
-IMG_START = '<img>'
-IMG_END = '</img>'
-IMG_CONTEXT = '<IMG_CONTEXT>'
+IMG_START = "<img>"
+IMG_END = "</img>"
+IMG_CONTEXT = "<IMG_CONTEXT>"
 
 IMAGENET_MEAN = (0.485, 0.456, 0.406)
 IMAGENET_STD = (0.229, 0.224, 0.225)
@@ -57,6 +70,7 @@ class SkyworkR1VImagePixelInputs(TensorSchema):
         - w: Width
         - bn: Batch size * number of images
     """
+
     type: Literal["pixel_values"] = "pixel_values"
 
     pixel_values_flat: Annotated[
@@ -75,9 +89,10 @@ class SkyworkR1VImageEmbeddingInputs(TensorSchema):
     Dimensions:
         - ni: Number of images
         - ifs: Image feature size
-        - hs: Hidden size (must match the hidden size of language model 
+        - hs: Hidden size (must match the hidden size of language model
           backbone)
     """
+
     type: Literal["image_embeds"] = "image_embeds"
 
     data: Annotated[
@@ -86,20 +101,24 @@ class SkyworkR1VImageEmbeddingInputs(TensorSchema):
     ]
 
 
-SkyworkR1VImageInputs = Union[SkyworkR1VImagePixelInputs,
-                              SkyworkR1VImageEmbeddingInputs]
+SkyworkR1VImageInputs = Union[
+    SkyworkR1VImagePixelInputs, SkyworkR1VImageEmbeddingInputs
+]
 
 
 # adapted from https://huggingface.co/Skywork/Skywork-R1V-38B/
 def build_transform(input_size: int):
     MEAN, STD = IMAGENET_MEAN, IMAGENET_STD
-    return T.Compose([
-        T.Lambda(lambda img: convert_image_mode(img, 'RGB')),
-        T.Resize((input_size, input_size),
-                 interpolation=T.InterpolationMode.BICUBIC),
-        T.ToTensor(),
-        T.Normalize(mean=MEAN, std=STD)
-    ])
+    return T.Compose(
+        [
+            T.Lambda(lambda img: convert_image_mode(img, "RGB")),
+            T.Resize(
+                (input_size, input_size), interpolation=T.InterpolationMode.BICUBIC
+            ),
+            T.ToTensor(),
+            T.Normalize(mean=MEAN, std=STD),
+        ]
+    )
 
 
 # adapted from https://huggingface.co/Skywork/Skywork-R1V-38B/
@@ -111,7 +130,7 @@ def find_closest_aspect_ratio(
     height: int,
     image_size: int,
 ) -> tuple[int, int]:
-    best_ratio_diff = float('inf')
+    best_ratio_diff = float("inf")
     best_ratio = (1, 1)
     area = width * height
     for ratio in target_ratios:
@@ -146,10 +165,13 @@ def get_skyworkr1v_target_ratios(
     min_num: int,
     max_num: int,
 ) -> list[tuple[int, int]]:
-    target_ratios = {(i, j)
-                     for n in range(min_num, max_num + 1)
-                     for i in range(1, n + 1)
-                     for j in range(1, n + 1) if min_num <= i * j <= max_num}
+    target_ratios = {
+        (i, j)
+        for n in range(min_num, max_num + 1)
+        for i in range(1, n + 1)
+        for j in range(1, n + 1)
+        if min_num <= i * j <= max_num
+    }
     return sorted(target_ratios, key=lambda x: x[0] * x[1])
 
 
@@ -206,10 +228,12 @@ def dynamic_preprocess_skyworkr1v(
     resized_img = image.resize((target_width, target_height))
     processed_images = []
     for i in range(blocks):
-        box = ((i % (target_width // image_size)) * image_size,
-               (i // (target_width // image_size)) * image_size,
-               ((i % (target_width // image_size)) + 1) * image_size,
-               ((i // (target_width // image_size)) + 1) * image_size)
+        box = (
+            (i % (target_width // image_size)) * image_size,
+            (i // (target_width // image_size)) * image_size,
+            ((i % (target_width // image_size)) + 1) * image_size,
+            ((i // (target_width // image_size)) + 1) * image_size,
+        )
         # split the image
         split_img = resized_img.crop(box)
         processed_images.append(split_img)
@@ -285,7 +309,8 @@ def __init__(
         assert isinstance(dynamic_image_size, bool)
 
         self.num_image_token = int(
-            (image_size // patch_size)**2 * (config.downsample_ratio**2))
+            (image_size // patch_size) ** 2 * (config.downsample_ratio**2)
+        )
         self.image_size = image_size
         self.min_dynamic_patch = min_dynamic_patch
         self.max_dynamic_patch = max_dynamic_patch
@@ -314,14 +339,18 @@ def resolve_min_max_num(
         dynamic_image_size: Optional[bool] = None,
         use_thumbnail: Optional[bool] = None,
     ) -> tuple[int, int]:
-        min_dynamic_patch = (self.min_dynamic_patch if min_dynamic_patch
-                             is None else min_dynamic_patch)
-        max_dynamic_patch = (self.max_dynamic_patch if max_dynamic_patch
-                             is None else max_dynamic_patch)
-        dynamic_image_size = (self.dynamic_image_size if dynamic_image_size
-                              is None else dynamic_image_size)
-        use_thumbnail = (self.use_thumbnail
-                         if use_thumbnail is None else use_thumbnail)
+        min_dynamic_patch = (
+            self.min_dynamic_patch if min_dynamic_patch is None else min_dynamic_patch
+        )
+        max_dynamic_patch = (
+            self.max_dynamic_patch if max_dynamic_patch is None else max_dynamic_patch
+        )
+        dynamic_image_size = (
+            self.dynamic_image_size
+            if dynamic_image_size is None
+            else dynamic_image_size
+        )
+        use_thumbnail = self.use_thumbnail if use_thumbnail is None else use_thumbnail
 
         return resolve_skyworkr1v_min_max_num(
             min_dynamic_patch=min_dynamic_patch,
@@ -388,7 +417,8 @@ def _images_to_pixel_values_lst(
                 min_num=min_num,
                 max_num=max_num,
                 use_thumbnail=self.use_thumbnail,
-            ) for image in images
+            )
+            for image in images
         ]
 
     def __call__(
@@ -419,10 +449,10 @@ def __call__(
                 dynamic_image_size=dynamic_image_size,
             )
             image_inputs = {
-                "pixel_values_flat":
-                torch.cat(pixel_values_lst),
-                "image_num_patches":
-                torch.tensor([len(item) for item in pixel_values_lst]),
+                "pixel_values_flat": torch.cat(pixel_values_lst),
+                "image_num_patches": torch.tensor(
+                    [len(item) for item in pixel_values_lst]
+                ),
             }
 
             for pixel_values in pixel_values_lst:
@@ -431,7 +461,7 @@ def __call__(
 
                 image_repl = self.get_image_repl(feature_size, num_patches)
 
-                text = [t.replace('<image>', image_repl.full, 1) for t in text]
+                text = [t.replace("<image>", image_repl.full, 1) for t in text]
 
         text_inputs = self.tokenizer(text)
 
@@ -441,7 +471,6 @@ def __call__(
 
 
 class SkyworkR1VProcessingInfo(BaseProcessingInfo):
-
     def get_hf_processor(self, **kwargs: object) -> SkyworkR1VProcessor:
         return self.ctx.init_processor(
             SkyworkR1VProcessor,
@@ -485,8 +514,7 @@ def get_image_size_with_most_features(self) -> ImageSize:
             )
             if feat_size > largest_feature_size:
                 largest_feature_size = feat_size
-                largest_feature_pinpoint = ImageSize(width=width,
-                                                     height=height)
+                largest_feature_pinpoint = ImageSize(width=width, height=height)
 
         if largest_feature_size == 0 or largest_feature_pinpoint is None:
             raise ValueError("Cannot have a largest feature size of 0!")
@@ -494,9 +522,7 @@ def get_image_size_with_most_features(self) -> ImageSize:
         return largest_feature_pinpoint
 
 
-class SkyworkR1VDummyInputsBuilder(
-        BaseDummyInputsBuilder[SkyworkR1VProcessingInfo]):
-
+class SkyworkR1VDummyInputsBuilder(BaseDummyInputsBuilder[SkyworkR1VProcessingInfo]):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -508,24 +534,22 @@ def get_dummy_mm_data(
         mm_counts: Mapping[str, int],
         mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
         num_images = mm_counts.get("image", 0)
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
-class SkyworkR1VMultiModalProcessor(
-        BaseMultiModalProcessor[SkyworkR1VProcessingInfo]):
-
+class SkyworkR1VMultiModalProcessor(BaseMultiModalProcessor[SkyworkR1VProcessingInfo]):
     def _call_hf_processor(
         self,
         prompt: str,
@@ -560,7 +584,8 @@ def _get_mm_fields_config(
 
         return dict(
             pixel_values_flat=MultiModalFieldConfig.flat_from_sizes(
-                "image", image_num_patches),
+                "image", image_num_patches
+            ),
             image_num_patches=MultiModalFieldConfig.batched("image"),
             image_embeds=MultiModalFieldConfig.batched("image"),
             image_token_id=MultiModalFieldConfig.shared("image", num_images),
@@ -588,7 +613,8 @@ def _get_prompt_updates(
 
         def get_replacement_skyworkr1v(item_idx: int):
             images = mm_items.get_items(
-                "image", (ImageEmbeddingItems, ImageProcessorItems))
+                "image", (ImageEmbeddingItems, ImageProcessorItems)
+            )
 
             if isinstance(images, ImageEmbeddingItems):
                 feature_size = images.get_feature_size(item_idx)
@@ -618,7 +644,8 @@ def get_replacement_skyworkr1v(item_idx: int):
 @MULTIMODAL_REGISTRY.register_processor(
     SkyworkR1VMultiModalProcessor,
     info=SkyworkR1VProcessingInfo,
-    dummy_inputs=SkyworkR1VDummyInputsBuilder)
+    dummy_inputs=SkyworkR1VDummyInputsBuilder,
+)
 class SkyworkR1VChatModel(nn.Module, SupportsMultiModal, SupportsPP):
     merge_by_field_config = True
 
@@ -644,12 +671,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         patch_size = config.vision_config.patch_size
         self.patch_size = patch_size
         self.num_image_token = int(
-            (image_size // patch_size)**2 * (config.downsample_ratio**2))
+            (image_size // patch_size) ** 2 * (config.downsample_ratio**2)
+        )
         self.downsample_ratio = config.downsample_ratio
         self.ps_version = config.ps_version
 
         self.llm_arch_name = config.text_config.architectures[0]
-        self.is_mono = self.llm_arch_name == 'SkyworkLM2VEForCausalLM'
+        self.is_mono = self.llm_arch_name == "SkyworkLM2VEForCausalLM"
         self.vision_model = self._init_vision_model(
             config,
             quant_config=quant_config,
@@ -668,18 +696,20 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         self.img_context_token_id = None
         self.visual_token_mask = None
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
-    def _patch_quant_config(self, config: PretrainedConfig,
-                            quant_config: QuantizationConfig):
+    def _patch_quant_config(
+        self, config: PretrainedConfig, quant_config: QuantizationConfig
+    ):
         # the awq models from OpenGVLab missing `modules_to_not_convert`
         # patch the quant_config to add `modules_to_not_convert` back
         if isinstance(quant_config, AWQConfig):
             text_config = config.text_config
-            llm_quant_config = getattr(text_config, "quantization_config",
-                                       None)
-            if (not quant_config.modules_to_not_convert) and \
-                (llm_quant_config is not None):
+            llm_quant_config = getattr(text_config, "quantization_config", None)
+            if (not quant_config.modules_to_not_convert) and (
+                llm_quant_config is not None
+            ):
                 quant_config.modules_to_not_convert.append("vision_model")
 
     def _init_vision_model(
@@ -693,8 +723,9 @@ def _init_vision_model(
         if not is_mono:
             vision_feature_layer = config.select_layer
             if vision_feature_layer < 0:
-                num_hidden_layers = config.vision_config.num_hidden_layers \
-                    + vision_feature_layer + 1
+                num_hidden_layers = (
+                    config.vision_config.num_hidden_layers + vision_feature_layer + 1
+                )
             else:
                 num_hidden_layers = vision_feature_layer + 1
 
@@ -712,15 +743,14 @@ def _init_mlp1(self, config: PretrainedConfig) -> nn.Module:
         llm_hidden_size = config.text_config.hidden_size
 
         return nn.Sequential(
-            nn.LayerNorm(vit_hidden_size * int(1 / self.downsample_ratio)**2),
-            ReplicatedLinear(vit_hidden_size *
-                             int(1 / self.downsample_ratio)**2,
-                             llm_hidden_size,
-                             return_bias=False),
+            nn.LayerNorm(vit_hidden_size * int(1 / self.downsample_ratio) ** 2),
+            ReplicatedLinear(
+                vit_hidden_size * int(1 / self.downsample_ratio) ** 2,
+                llm_hidden_size,
+                return_bias=False,
+            ),
             nn.GELU(),
-            ReplicatedLinear(llm_hidden_size,
-                             llm_hidden_size,
-                             return_bias=False),
+            ReplicatedLinear(llm_hidden_size, llm_hidden_size, return_bias=False),
         )
 
     def pixel_shuffle(self, x, scale_factor=0.5):
@@ -729,9 +759,13 @@ def pixel_shuffle(self, x, scale_factor=0.5):
         x = x.view(n, w, int(h * scale_factor), int(c / scale_factor))
         # N, W, H * scale, C // scale --> N, H * scale, W, C // scale
         x = x.permute(0, 2, 1, 3).contiguous()
-        x = x.view(n, int(h * scale_factor), int(w * scale_factor),
-                   int(c / (scale_factor * scale_factor)))
-        if self.ps_version == 'v1':
+        x = x.view(
+            n,
+            int(h * scale_factor),
+            int(w * scale_factor),
+            int(c / (scale_factor * scale_factor)),
+        )
+        if self.ps_version == "v1":
             pass
         else:
             x = x.permute(0, 2, 1, 3).contiguous()
@@ -741,17 +775,16 @@ def extract_feature(self, pixel_values: torch.Tensor) -> torch.Tensor:
         vit_embeds = self.vision_model(pixel_values=pixel_values)
         vit_embeds = vit_embeds[:, 1:, :]
 
-        h = w = int(vit_embeds.shape[1]**0.5)
+        h = w = int(vit_embeds.shape[1] ** 0.5)
         vit_embeds = vit_embeds.reshape(vit_embeds.shape[0], h, w, -1)
-        vit_embeds = self.pixel_shuffle(vit_embeds,
-                                        scale_factor=self.downsample_ratio)
-        vit_embeds = vit_embeds.reshape(vit_embeds.shape[0], -1,
-                                        vit_embeds.shape[-1])
+        vit_embeds = self.pixel_shuffle(vit_embeds, scale_factor=self.downsample_ratio)
+        vit_embeds = vit_embeds.reshape(vit_embeds.shape[0], -1, vit_embeds.shape[-1])
         vit_embeds = self.mlp1(vit_embeds)
         return vit_embeds
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[SkyworkR1VImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[SkyworkR1VImageInputs]:
         pixel_values_flat = kwargs.pop("pixel_values_flat", None)
         image_num_patches = kwargs.pop("image_num_patches", None)
         image_embeds = kwargs.pop("image_embeds", None)
@@ -777,7 +810,8 @@ def _parse_and_validate_image_input(
                 resolve_bindings={
                     "h": self.config.vision_config.image_size,
                     "w": self.config.vision_config.image_size,
-                })
+                },
+            )
 
         raise AssertionError("This line should be unreachable.")
 
@@ -796,14 +830,14 @@ def _process_image_input(
 
         # Only one image in the current batch
         if len(num_patches) == 1:
-            return image_embeds.view(
-                -1, self.config.text_config.hidden_size).unsqueeze(0)
+            return image_embeds.view(-1, self.config.text_config.hidden_size).unsqueeze(
+                0
+            )
 
         # NOTE: Image embeddings are split into separate tensors for each image
         # by the size of each embedding.
         feature_size = image_embeds.shape[1]
-        image_embeds = image_embeds.view(-1,
-                                         self.config.text_config.hidden_size)
+        image_embeds = image_embeds.view(-1, self.config.text_config.hidden_size)
         image_feature_sizes = [
             num_patches * feature_size for num_patches in num_patches
         ]
@@ -811,16 +845,16 @@ def _process_image_input(
 
     def _set_visual_token_mask(self, input_ids: torch.Tensor) -> None:
         if self.is_mono:
-            self.visual_token_mask = (
-                input_ids == self.img_context_token_id).reshape(-1, 1)
+            self.visual_token_mask = (input_ids == self.img_context_token_id).reshape(
+                -1, 1
+            )
         else:
             self.visual_token_mask = None
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -835,8 +869,7 @@ def get_input_embeddings(
         is_multimodal: Optional[torch.Tensor] = None,
         handle_oov_mm_token: bool = False,
     ) -> torch.Tensor:
-        if multimodal_embeddings is not None and len(
-                multimodal_embeddings) > 0:
+        if multimodal_embeddings is not None and len(multimodal_embeddings) > 0:
             self._set_visual_token_mask(input_ids)
 
         # This is to satisfy the type checker for each overload
@@ -858,7 +891,6 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs: object,
     ) -> IntermediateTensors:
-
         if intermediate_tensors is not None:
             input_ids = None
             inputs_embeds = None
@@ -872,8 +904,7 @@ def forward(
 
         # Only required if the model is mono-architecture
         if self.visual_token_mask is not None:
-            forward_kwargs.update(
-                {"visual_token_mask": self.visual_token_mask})
+            forward_kwargs.update({"visual_token_mask": self.visual_token_mask})
             self.visual_token_mask = None
 
         hidden_states = self.language_model.model(**forward_kwargs)
@@ -885,13 +916,20 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         skip_prefixes = [
-            "action_embed", "temporal_embed", "track_embed",
-            "track_embed_decoder", "box_token", "cg_criterion", "cg_model",
-            "loc_encoder", "loc_decoder", "sam", "temporal_token",
-            "track_token"
+            "action_embed",
+            "temporal_embed",
+            "track_embed",
+            "track_embed_decoder",
+            "box_token",
+            "cg_criterion",
+            "cg_model",
+            "loc_encoder",
+            "loc_decoder",
+            "sam",
+            "temporal_token",
+            "track_token",
         ]
         loader = AutoWeightsLoader(self, skip_prefixes=skip_prefixes)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/smolvlm.py b/vllm/model_executor/models/smolvlm.py
index 2adfad67152b..d0018f95dfd2 100644
--- a/vllm/model_executor/models/smolvlm.py
+++ b/vllm/model_executor/models/smolvlm.py
@@ -10,20 +10,19 @@
 
 # yapf: disable
 from .idefics3 import Idefics3DummyInputsBuilder as SmolVLMDummyInputsBuilder
-from .idefics3 import Idefics3ForConditionalGeneration
+from .idefics3 import Idefics3ForConditionalGeneration, Idefics3ProcessingInfo
 from .idefics3 import Idefics3MultiModalProcessor as SmolVLMMultiModalProcessor
-from .idefics3 import Idefics3ProcessingInfo
 
 # yapf: enable
 
 
 class SmolVLMProcessingInfo(Idefics3ProcessingInfo):
-
     def get_hf_processor(self, **kwargs: object) -> SmolVLMProcessor:
         return self.ctx.get_hf_processor(SmolVLMProcessor, **kwargs)
 
     def _get_image_token(
-            self, processor: Optional[SmolVLMProcessor]) -> tuple[str, str]:
+        self, processor: Optional[SmolVLMProcessor]
+    ) -> tuple[str, str]:
         if processor is None:
             processor = self.get_hf_processor()
         image_token = processor.image_token
@@ -32,11 +31,12 @@ def _get_image_token(
         return image_token, fake_image_token, global_image_token
 
 
-@MULTIMODAL_REGISTRY.register_processor(SmolVLMMultiModalProcessor,
-                                        info=SmolVLMProcessingInfo,
-                                        dummy_inputs=SmolVLMDummyInputsBuilder)
+@MULTIMODAL_REGISTRY.register_processor(
+    SmolVLMMultiModalProcessor,
+    info=SmolVLMProcessingInfo,
+    dummy_inputs=SmolVLMDummyInputsBuilder,
+)
 class SmolVLMForConditionalGeneration(Idefics3ForConditionalGeneration):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(
             vllm_config=vllm_config,
diff --git a/vllm/model_executor/models/solar.py b/vllm/model_executor/models/solar.py
index c5b82b0ca4a0..5abcb47c6e25 100644
--- a/vllm/model_executor/models/solar.py
+++ b/vllm/model_executor/models/solar.py
@@ -37,26 +37,37 @@
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsLoRA, SupportsPP
-from .utils import (AutoWeightsLoader, PPMissingLayer, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class SolarMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -82,8 +93,9 @@ def __init__(
             prefix=f"{prefix}.down_proj",
         )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
 
     def forward(self, x):
@@ -94,7 +106,6 @@ def forward(self, x):
 
 
 class SolarAttention(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -183,7 +194,6 @@ def forward(
 
 
 class SolarDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -197,21 +207,24 @@ def __init__(
         rope_scaling = getattr(config, "rope_scaling", None)
 
         if rope_scaling is not None and getattr(
-                config, "original_max_position_embeddings", None):
-            rope_scaling["original_max_position_embeddings"] \
-                = config.original_max_position_embeddings
-        max_position_embeddings = getattr(config, "max_position_embeddings",
-                                          8192)
+            config, "original_max_position_embeddings", None
+        ):
+            rope_scaling["original_max_position_embeddings"] = (
+                config.original_max_position_embeddings
+            )
+        max_position_embeddings = getattr(config, "max_position_embeddings", 8192)
         # Support abacusai/Smaug-72B-v0.1 with attention_bias
         # Support internlm/internlm-7b with bias
         attention_bias = getattr(config, "attention_bias", False) or getattr(
-            config, "bias", False)
+            config, "bias", False
+        )
         self.self_attn = SolarAttention(
             config=config,
             hidden_size=self.hidden_size,
             num_heads=config.num_attention_heads,
-            num_kv_heads=getattr(config, "num_key_value_heads",
-                                 config.num_attention_heads),
+            num_kv_heads=getattr(
+                config, "num_key_value_heads", config.num_attention_heads
+            ),
             rope_theta=rope_theta,
             rope_scaling=rope_scaling,
             max_position_embeddings=max_position_embeddings,
@@ -228,10 +241,10 @@ def __init__(
             bias=getattr(config, "mlp_bias", False),
             prefix=f"{prefix}.mlp",
         )
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
         self,
@@ -244,23 +257,20 @@ def forward(
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
         )
 
         # Fully Connected
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
         hidden_states = self.mlp(hidden_states)
         return hidden_states, residual
 
 
 @support_torch_compile
 class SolarModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -271,12 +281,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.config = config
         self.quant_config = quant_config
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
-        if get_pp_group().is_first_rank or (config.tie_word_embeddings
-                                            and get_pp_group().is_last_rank):
+        if get_pp_group().is_first_rank or (
+            config.tie_word_embeddings and get_pp_group().is_last_rank
+        ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
@@ -299,9 +313,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         else:
             self.norm = PPMissingLayer()
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states", "residual"], config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states", "residual"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -328,8 +342,7 @@ def forward(
         bskcn_h_2 = None
         bskcn_r_1 = None
         bskcn_r_2 = None
-        bskcn_tv = (self.config.bskcn_tv[0]
-                    if self.training else self.config.bskcn_tv[1])
+        bskcn_tv = self.config.bskcn_tv[0] if self.training else self.config.bskcn_tv[1]
 
         for i in range(self.start_layer, self.end_layer):
             if i in self.config.bskcn_1:
@@ -339,12 +352,10 @@ def forward(
                 bskcn_h_2 = hidden_states.clone()
                 bskcn_r_2 = residual.clone()
             if i in self.config.bskcn_3:
-                hidden_states = bskcn_h_1 * bskcn_tv + hidden_states * (
-                    1 - bskcn_tv)
+                hidden_states = bskcn_h_1 * bskcn_tv + hidden_states * (1 - bskcn_tv)
                 residual = bskcn_r_1 * bskcn_tv + residual * (1 - bskcn_tv)
             if i in self.config.bskcn_4:
-                hidden_states = bskcn_h_2 * bskcn_tv + hidden_states * (
-                    1 - bskcn_tv)
+                hidden_states = bskcn_h_2 * bskcn_tv + hidden_states * (1 - bskcn_tv)
                 residual = bskcn_r_2 * bskcn_tv + residual * (1 - bskcn_tv)
             layer = self.layers[i]
             hidden_states, residual = layer(
@@ -354,16 +365,14 @@ def forward(
             )
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual
-            })
+            return IntermediateTensors(
+                {"hidden_states": hidden_states, "residual": residual}
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".qkv_proj", ".q_proj", "q"),
@@ -375,14 +384,15 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            if (self.quant_config is not None and
-                (scale_name := self.quant_config.get_cache_scale(name))):
+            if self.quant_config is not None and (
+                scale_name := self.quant_config.get_cache_scale(name)
+            ):
                 # Loading kv cache quantization scales
                 param = params_dict[scale_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
-                loaded_weight = (loaded_weight if loaded_weight.dim() == 0 else
-                                 loaded_weight[0])
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
+                loaded_weight = (
+                    loaded_weight if loaded_weight.dim() == 0 else loaded_weight[0]
+                )
                 weight_loader(param, loaded_weight)
                 loaded_params.add(scale_name)
                 continue
@@ -415,8 +425,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
@@ -466,7 +475,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 padding_size=DEFAULT_VOCAB_PADDING_SIZE
                 # We need bigger padding if using lora for kernel
                 # compatibility
-                if not lora_config else lora_config.lora_vocab_padding_size,
+                if not lora_config
+                else lora_config.lora_vocab_padding_size,
                 quant_config=quant_config,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
@@ -474,14 +484,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 self.lm_head.weight = self.model.embed_tokens.weight
 
             logit_scale = getattr(config, "logit_scale", 1.0)
-            self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                    config.vocab_size,
-                                                    logit_scale)
+            self.logits_processor = LogitsProcessor(
+                self.unpadded_vocab_size, config.vocab_size, logit_scale
+            )
         else:
             self.lm_head = PPMissingLayer()
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -493,15 +504,15 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        model_output = self.model(input_ids, positions, intermediate_tensors,
-                                  inputs_embeds)
+        model_output = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return model_output
 
     def compute_logits(self, hidden_states: torch.Tensor) -> torch.Tensor:
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/stablelm.py b/vllm/model_executor/models/stablelm.py
index e4dfe8d5a9a3..79ed00183344 100644
--- a/vllm/model_executor/models/stablelm.py
+++ b/vllm/model_executor/models/stablelm.py
@@ -21,6 +21,7 @@
 # https://huggingface.co/stabilityai/stablelm-3b-4e1t/blob/main/config.json
 """Inference-only StabeLM (https://github.com/Stability-AI/StableLM)
 model compatible with HuggingFace weights."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -33,43 +34,56 @@
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul
-from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class StablelmMLP(nn.Module):
-
-    def __init__(self,
-                 config: StableLmConfig,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: StableLmConfig,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
         self.config = config
         self.hidden_size = config.hidden_size
         self.intermediate_size = config.intermediate_size
         self.gate_up_proj = MergedColumnParallelLinear(
-            config.hidden_size, [config.intermediate_size] * 2,
+            config.hidden_size,
+            [config.intermediate_size] * 2,
             bias=False,
             quant_config=quant_config,
-            prefix=f"{prefix}.gate_up_proj")
-        self.down_proj = RowParallelLinear(config.intermediate_size,
-                                           config.hidden_size,
-                                           bias=False,
-                                           quant_config=quant_config,
-                                           prefix=f"{prefix}.down_proj")
+            prefix=f"{prefix}.gate_up_proj",
+        )
+        self.down_proj = RowParallelLinear(
+            config.intermediate_size,
+            config.hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.down_proj",
+        )
         self.act_fn = SiluAndMul()
 
     def forward(self, x: torch.Tensor) -> torch.Tensor:
@@ -80,12 +94,13 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 
 
 class StablelmAttention(nn.Module):
-
-    def __init__(self,
-                 config: StableLmConfig,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: StableLmConfig,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
         self.config = config
         self.hidden_size = config.hidden_size
@@ -102,33 +117,39 @@ def __init__(self,
             # Number of KV heads is less than TP size, so we replicate
             # the KV heads across multiple tensor parallel GPUs.
             assert tp_size % self.total_num_key_value_heads == 0
-        self.num_key_value_heads = max(
-            1, self.total_num_key_value_heads // tp_size)
+        self.num_key_value_heads = max(1, self.total_num_key_value_heads // tp_size)
         self.head_dim = self.hidden_size // self.total_num_heads
         self.max_position_embeddings = config.max_position_embeddings
         self.partial_rotary_factor = getattr(
-            config, "rope_pct", getattr(config, "partial_rotary_factor", 1))
+            config, "rope_pct", getattr(config, "partial_rotary_factor", 1)
+        )
         self.scaling = self.head_dim**-0.5
         self.q_size = self.num_heads * self.head_dim
         self.kv_size = self.num_key_value_heads * self.head_dim
         self.qkv_bias = getattr(config, "use_qkv_bias", False)
         if (self.head_dim * self.num_heads * tp_size) != self.hidden_size:
-            raise ValueError(f"hidden_size must be divisible by num_heads "
-                             f"(got `hidden_size`: {self.hidden_size}"
-                             f" and `num_heads`: {self.num_heads}).")
-
-        self.qkv_proj = QKVParallelLinear(self.hidden_size,
-                                          self.head_dim,
-                                          self.total_num_heads,
-                                          self.total_num_key_value_heads,
-                                          self.qkv_bias,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.qkv_proj")
-        self.o_proj = RowParallelLinear(self.total_num_heads * self.head_dim,
-                                        self.hidden_size,
-                                        bias=False,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.o_proj")
+            raise ValueError(
+                f"hidden_size must be divisible by num_heads "
+                f"(got `hidden_size`: {self.hidden_size}"
+                f" and `num_heads`: {self.num_heads})."
+            )
+
+        self.qkv_proj = QKVParallelLinear(
+            self.hidden_size,
+            self.head_dim,
+            self.total_num_heads,
+            self.total_num_key_value_heads,
+            self.qkv_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.qkv_proj",
+        )
+        self.o_proj = RowParallelLinear(
+            self.total_num_heads * self.head_dim,
+            self.hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.o_proj",
+        )
         self.rotary_emb = get_rope(
             self.head_dim,
             rotary_dim=self.head_dim,
@@ -136,13 +157,15 @@ def __init__(self,
             base=self.config.rope_theta,
             partial_rotary_factor=self.partial_rotary_factor,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_key_value_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_key_value_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -158,7 +181,6 @@ def forward(
 
 
 class StablelmDecoderLayer(nn.Module):
-
     def __init__(
         self,
         config: StableLmConfig,
@@ -167,16 +189,13 @@ def __init__(
         prefix: str = "",
     ) -> None:
         super().__init__()
-        self.self_attn = StablelmAttention(config,
-                                           cache_config,
-                                           quant_config,
-                                           prefix=f"{prefix}.self_attn")
+        self.self_attn = StablelmAttention(
+            config, cache_config, quant_config, prefix=f"{prefix}.self_attn"
+        )
         self.mlp = StablelmMLP(config, quant_config, prefix=f"{prefix}.mlp")
-        norm_eps = getattr(config, "norm_eps",
-                           getattr(config, "layer_norm_eps", 1e-05))
+        norm_eps = getattr(config, "norm_eps", getattr(config, "layer_norm_eps", 1e-05))
         self.input_layernorm = nn.LayerNorm(config.hidden_size, eps=norm_eps)
-        self.post_attention_layernorm = nn.LayerNorm(config.hidden_size,
-                                                     eps=norm_eps)
+        self.post_attention_layernorm = nn.LayerNorm(config.hidden_size, eps=norm_eps)
 
     def forward(
         self,
@@ -202,7 +221,6 @@ def forward(
 
 
 class StableLMEpochModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -219,15 +237,15 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: StablelmDecoderLayer(
-                config, cache_config, quant_config, prefix=prefix),
+                config, cache_config, quant_config, prefix=prefix
+            ),
             prefix=f"{prefix}.layers",
         )
-        norm_eps = getattr(config, "norm_eps",
-                           getattr(config, "layer_norm_eps", 1e-05))
+        norm_eps = getattr(config, "norm_eps", getattr(config, "layer_norm_eps", 1e-05))
         self.norm = nn.LayerNorm(config.hidden_size, eps=norm_eps)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -254,8 +272,7 @@ def forward(
         hidden_states = self.norm(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -267,7 +284,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -287,32 +304,34 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class StablelmForCausalLM(nn.Module, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
         self.config = config
         self.quant_config = quant_config
-        self.model = StableLMEpochModel(vllm_config=vllm_config,
-                                        prefix=maybe_prefix(prefix, "model"))
-        self.lm_head = ParallelLMHead(config.vocab_size,
-                                      config.hidden_size,
-                                      quant_config=quant_config,
-                                      prefix=f"{prefix}.lm_head")
+        self.model = StableLMEpochModel(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
+        self.lm_head = ParallelLMHead(
+            config.vocab_size,
+            config.hidden_size,
+            quant_config=quant_config,
+            prefix=f"{prefix}.lm_head",
+        )
         if self.config.tie_word_embeddings:
             self.lm_head.weight = self.model.embed_tokens.weight
         self.logits_processor = LogitsProcessor(config.vocab_size)
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -324,8 +343,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -335,7 +355,6 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/starcoder2.py b/vllm/model_executor/models/starcoder2.py
index 7f379ab95a03..ec894140c3bf 100644
--- a/vllm/model_executor/models/starcoder2.py
+++ b/vllm/model_executor/models/starcoder2.py
@@ -19,7 +19,8 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
-""" PyTorch Starcoder2 model."""
+"""PyTorch Starcoder2 model."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Optional, Union
@@ -33,31 +34,43 @@
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import (
-    default_weight_loader, maybe_remap_kv_scale_name)
+    default_weight_loader,
+    maybe_remap_kv_scale_name,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsPP
-from .utils import (AutoWeightsLoader, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 
 class Starcoder2Attention(nn.Module):
-
-    def __init__(self,
-                 config: Starcoder2Config,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: Starcoder2Config,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.config = config
 
@@ -107,13 +120,15 @@ def __init__(self,
             base=int(self.rope_theta),
             is_neox_style=True,
         )
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              self.scaling,
-                              num_kv_heads=self.num_kv_heads,
-                              cache_config=cache_config,
-                              quant_config=quant_config,
-                              prefix=f"{prefix}.attn")
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            self.scaling,
+            num_kv_heads=self.num_kv_heads,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attn",
+        )
 
     def forward(
         self,
@@ -129,11 +144,12 @@ def forward(
 
 
 class Starcoder2MLP(nn.Module):
-
-    def __init__(self,
-                 config: Starcoder2Config,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: Starcoder2Config,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.c_fc = ColumnParallelLinear(
             config.hidden_size,
@@ -159,25 +175,28 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class Starcoder2DecoderLayer(nn.Module):
-
-    def __init__(self,
-                 config: Starcoder2Config,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: Starcoder2Config,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.hidden_size = config.hidden_size
-        self.self_attn = Starcoder2Attention(config,
-                                             cache_config,
-                                             quant_config=quant_config,
-                                             prefix=f"{prefix}.self_attn")
-        self.mlp = Starcoder2MLP(config,
-                                 quant_config=quant_config,
-                                 prefix=f"{prefix}.mlp")
-        self.input_layernorm = nn.LayerNorm(config.hidden_size,
-                                            eps=config.norm_epsilon)
-        self.post_attention_layernorm = nn.LayerNorm(config.hidden_size,
-                                                     eps=config.norm_epsilon)
+        self.self_attn = Starcoder2Attention(
+            config,
+            cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.self_attn",
+        )
+        self.mlp = Starcoder2MLP(
+            config, quant_config=quant_config, prefix=f"{prefix}.mlp"
+        )
+        self.input_layernorm = nn.LayerNorm(config.hidden_size, eps=config.norm_epsilon)
+        self.post_attention_layernorm = nn.LayerNorm(
+            config.hidden_size, eps=config.norm_epsilon
+        )
 
     def forward(
         self,
@@ -204,7 +223,6 @@ def forward(
 
 @support_torch_compile
 class Starcoder2Model(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
 
@@ -219,7 +237,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             config.vocab_size,
             config.hidden_size,
             quant_config=quant_config,
-            prefix=f"{prefix}.embed_tokens")
+            prefix=f"{prefix}.embed_tokens",
+        )
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
             lambda prefix: Starcoder2DecoderLayer(
@@ -228,9 +247,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             prefix=f"{prefix}.layers",
         )
         self.norm = nn.LayerNorm(config.hidden_size, eps=config.norm_epsilon)
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -257,8 +276,7 @@ def forward(
         hidden_states = self.norm(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -269,7 +287,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         params_dict = dict(self.named_parameters(remove_duplicate=False))
         loaded_params: set[str] = set()
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -286,22 +304,21 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if is_pp_missing_parameter(name, self):
                     continue
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class Starcoder2ForCausalLM(nn.Module, SupportsPP):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
         quant_config = vllm_config.quant_config
         self.config = config
-        self.model = Starcoder2Model(vllm_config=vllm_config,
-                                     prefix=maybe_prefix(prefix, "model"))
+        self.model = Starcoder2Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
         self.vocab_size = config.vocab_size
         self.unpadded_vocab_size = config.vocab_size
         if config.tie_word_embeddings:
@@ -316,10 +333,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 quant_config=quant_config,
                 prefix=f"{prefix}.lm_head",
             )
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size
+        )
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
@@ -331,8 +350,9 @@ def forward(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(
@@ -342,13 +362,13 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
             # Models trained using ColossalAI may include these tensors in
             # the checkpoint. Skip them.
-            skip_prefixes=(["lm_head.weight"]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(
+                ["lm_head.weight"] if self.config.tie_word_embeddings else None
+            ),
         )
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/step3_text.py b/vllm/model_executor/models/step3_text.py
index 960813822139..2099055e641c 100644
--- a/vllm/model_executor/models/step3_text.py
+++ b/vllm/model_executor/models/step3_text.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Inference-only Jurassic model."""
+
 from collections.abc import Iterable
 from itertools import islice
 from typing import Any, Optional
@@ -11,60 +12,77 @@
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, ModelConfig, VllmConfig
-from vllm.distributed import (get_pp_group,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_reduce)
+from vllm.distributed import (
+    get_pp_group,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_reduce,
+)
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import SiluAndMul
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
 from .interfaces import SupportsPP
-from .utils import (PPMissingLayer, is_pp_missing_parameter,
-                    make_empty_intermediate_tensors_factory, make_layers,
-                    maybe_prefix)
+from .utils import (
+    PPMissingLayer,
+    is_pp_missing_parameter,
+    make_empty_intermediate_tensors_factory,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
 
 class FusedMoEBlock(nn.Module):
-
-    def __init__(self,
-                 config: ModelConfig,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        config: ModelConfig,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
         self.tp_size = get_tensor_model_parallel_world_size()
 
         if self.tp_size > config.moe_num_experts:
             raise ValueError(
                 f"Tensor parallel size {self.tp_size} is greater than "
-                f"the number of experts {config.moe_num_experts}.")
-
-        self.experts = FusedMoE(num_experts=config.moe_num_experts,
-                                top_k=config.moe_top_k,
-                                hidden_size=config.hidden_size,
-                                intermediate_size=config.moe_intermediate_size,
-                                reduce_results=False,
-                                renormalize=config.norm_expert_weight,
-                                quant_config=quant_config,
-                                prefix=f"{prefix}.experts")
-        self.gate = ReplicatedLinear(config.hidden_size,
-                                     config.moe_num_experts,
-                                     bias=False,
-                                     quant_config=None,
-                                     prefix=f"{prefix}.gate")
+                f"the number of experts {config.moe_num_experts}."
+            )
+
+        self.experts = FusedMoE(
+            num_experts=config.moe_num_experts,
+            top_k=config.moe_top_k,
+            hidden_size=config.hidden_size,
+            intermediate_size=config.moe_intermediate_size,
+            reduce_results=False,
+            renormalize=config.norm_expert_weight,
+            quant_config=quant_config,
+            prefix=f"{prefix}.experts",
+        )
+        self.gate = ReplicatedLinear(
+            config.hidden_size,
+            config.moe_num_experts,
+            bias=False,
+            quant_config=None,
+            prefix=f"{prefix}.gate",
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         orig_shape = hidden_states.shape
@@ -73,17 +91,16 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
         router_logits, _ = self.gate(hidden_states)
 
-        final_hidden_states = self.experts(hidden_states=hidden_states,
-                                           router_logits=router_logits)
+        final_hidden_states = self.experts(
+            hidden_states=hidden_states, router_logits=router_logits
+        )
         if self.tp_size > 1:
-            final_hidden_states = tensor_model_parallel_all_reduce(
-                final_hidden_states)
+            final_hidden_states = tensor_model_parallel_all_reduce(final_hidden_states)
 
         return final_hidden_states.view(orig_shape)
 
 
 class Step3TextMLP(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -94,18 +111,23 @@ def __init__(
     ) -> None:
         super().__init__()
         self.gate_up_proj = MergedColumnParallelLinear(
-            hidden_size, [intermediate_size] * 2,
+            hidden_size,
+            [intermediate_size] * 2,
             bias=False,
             quant_config=quant_config,
-            prefix=f"{prefix}.gate_up_proj")
-        self.down_proj = RowParallelLinear(intermediate_size,
-                                           hidden_size,
-                                           bias=False,
-                                           quant_config=quant_config,
-                                           prefix=f"{prefix}.down_proj")
+            prefix=f"{prefix}.gate_up_proj",
+        )
+        self.down_proj = RowParallelLinear(
+            intermediate_size,
+            hidden_size,
+            bias=False,
+            quant_config=quant_config,
+            prefix=f"{prefix}.down_proj",
+        )
         if hidden_act != "silu":
-            raise ValueError(f"Unsupported activation: {hidden_act}. "
-                             "Only silu is supported for now.")
+            raise ValueError(
+                f"Unsupported activation: {hidden_act}. Only silu is supported for now."
+            )
         self.act_fn = SiluAndMul()
         self.hidden_size = hidden_size
 
@@ -117,7 +139,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class Step3TextAttention(nn.Module):
-
     def __init__(
         self,
         hidden_size: int,
@@ -142,8 +163,9 @@ def __init__(
         self.num_heads = self.total_num_heads // tp_size
 
         if num_kv_heads != 1:
-            raise ValueError(f"Step3TextAttention num_kv_heads must be 1, "
-                             f"but got {num_kv_heads}.")
+            raise ValueError(
+                f"Step3TextAttention num_kv_heads must be 1, but got {num_kv_heads}."
+            )
         self.num_kv_heads = num_kv_heads
 
         self.head_dim = head_dim
@@ -173,21 +195,26 @@ def __init__(
             quant_config=quant_config,
             prefix=f"{prefix}.wq",
         )
-        self.rotary_emb = get_rope(self.head_dim,
-                                   rotary_dim=self.head_dim,
-                                   max_position=max_position_embedding,
-                                   base=rope_theta,
-                                   rope_scaling=rope_scaling)
+        self.rotary_emb = get_rope(
+            self.head_dim,
+            rotary_dim=self.head_dim,
+            max_position=max_position_embedding,
+            base=rope_theta,
+            rope_scaling=rope_scaling,
+        )
         scaling = self.head_dim**-0.5
-        self.attn = Attention(self.num_heads,
-                              self.head_dim,
-                              scaling,
-                              self.num_kv_heads,
-                              cache_config=cache_config,
-                              prefix=f"{prefix}.attn")
-
-    def forward(self, positions: torch.Tensor,
-                hidden_states: torch.Tensor) -> torch.Tensor:
+        self.attn = Attention(
+            self.num_heads,
+            self.head_dim,
+            scaling,
+            self.num_kv_heads,
+            cache_config=cache_config,
+            prefix=f"{prefix}.attn",
+        )
+
+    def forward(
+        self, positions: torch.Tensor, hidden_states: torch.Tensor
+    ) -> torch.Tensor:
         qkv, _ = self.qkv_proj(hidden_states)
         q, k, v = qkv.split([self.q_size, self.kv_size, self.kv_size], dim=-1)
         q = self.inter_norm(q)
@@ -199,12 +226,13 @@ def forward(self, positions: torch.Tensor,
 
 
 class Step3TextDecoderLayer(nn.Module):
-
-    def __init__(self,
-                 config: ModelConfig,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: ModelConfig,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
         config = config.hf_config
         self.hidden_size = config.hidden_size
@@ -222,59 +250,61 @@ def __init__(self,
             share_q_dim=config.share_q_dim,
             rope_theta=config.rope_theta,
             rope_scaling=rope_scaling,
-            prefix=f"{prefix}.self_attn")
+            prefix=f"{prefix}.self_attn",
+        )
 
         layer_idx = int(prefix.split("layers.")[1].split(".")[0])
         moe_layers_enum = getattr(config, "moe_layers_enum", None)
         if moe_layers_enum is not None:
-            moe_layers_idx = [
-                int(i) for i in moe_layers_enum.strip().split(',')
-            ]
+            moe_layers_idx = [int(i) for i in moe_layers_enum.strip().split(",")]
         else:
             # Default to 1dense.
             moe_layers_idx = [i for i in range(1, config.num_hidden_layers)]
 
         if layer_idx in moe_layers_idx:
-            self.moe = FusedMoEBlock(config=config,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.moe")
+            self.moe = FusedMoEBlock(
+                config=config, quant_config=quant_config, prefix=f"{prefix}.moe"
+            )
             self.share_expert = Step3TextMLP(
                 hidden_size=self.hidden_size,
                 intermediate_size=config.share_expert_dim,
                 hidden_act="silu",
                 quant_config=quant_config,
-                prefix=f"{prefix}.share_expert")
+                prefix=f"{prefix}.share_expert",
+            )
             self.use_moe = True
         else:
-            self.mlp = Step3TextMLP(hidden_size=config.hidden_size,
-                                    intermediate_size=config.intermediate_size,
-                                    hidden_act="silu",
-                                    quant_config=quant_config,
-                                    prefix=f"{prefix}.mlp")
+            self.mlp = Step3TextMLP(
+                hidden_size=config.hidden_size,
+                intermediate_size=config.intermediate_size,
+                hidden_act="silu",
+                quant_config=quant_config,
+                prefix=f"{prefix}.mlp",
+            )
             self.use_moe = False
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
-        self.post_attention_layernorm = RMSNorm(config.hidden_size,
-                                                eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
+        self.post_attention_layernorm = RMSNorm(
+            config.hidden_size, eps=config.rms_norm_eps
+        )
 
     def forward(
-            self, positions: torch.Tensor, hidden_states: torch.Tensor,
-            residual: Optional[torch.Tensor]
+        self,
+        positions: torch.Tensor,
+        hidden_states: torch.Tensor,
+        residual: Optional[torch.Tensor],
     ) -> tuple[torch.Tensor, torch.Tensor]:
         if residual is None:
             residual = hidden_states
             hidden_states = self.input_layernorm(hidden_states)
         else:
-            hidden_states, residual = self.input_layernorm(
-                hidden_states, residual)
+            hidden_states, residual = self.input_layernorm(hidden_states, residual)
 
         hidden_states = self.self_attn(
             positions=positions,
             hidden_states=hidden_states,
         )
 
-        hidden_states, residual = self.post_attention_layernorm(
-            hidden_states, residual)
+        hidden_states, residual = self.post_attention_layernorm(hidden_states, residual)
 
         if self.use_moe:
             share_output = self.share_expert(hidden_states)
@@ -288,7 +318,6 @@ def forward(
 
 @support_torch_compile
 class Step3TextModel(nn.Module):
-
     def __init__(self, vllm_config: VllmConfig, prefix: str = "") -> None:
         super().__init__()
         config = vllm_config.model_config.hf_config
@@ -297,8 +326,9 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = "") -> None:
         self.vocab_size = config.vocab_size
         self.config = config
 
-        if get_pp_group().is_first_rank or (config.tie_word_embeddings
-                                            and get_pp_group().is_last_rank):
+        if get_pp_group().is_first_rank or (
+            config.tie_word_embeddings and get_pp_group().is_last_rank
+        ):
             self.embed_tokens = VocabParallelEmbedding(
                 self.vocab_size,
                 config.hidden_size,
@@ -308,11 +338,12 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = "") -> None:
 
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.num_hidden_layers,
-            lambda prefix: Step3TextDecoderLayer(config=vllm_config.
-                                                 model_config,
-                                                 cache_config=cache_config,
-                                                 quant_config=quant_config,
-                                                 prefix=prefix),
+            lambda prefix: Step3TextDecoderLayer(
+                config=vllm_config.model_config,
+                cache_config=cache_config,
+                quant_config=quant_config,
+                prefix=prefix,
+            ),
             prefix=f"{prefix}.layers",
         )
         if get_pp_group().is_last_rank:
@@ -320,9 +351,9 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = "") -> None:
         else:
             self.norm = PPMissingLayer()
 
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(["hidden_states"],
-                                                    config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], config.hidden_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.embed_tokens(input_ids)
@@ -349,17 +380,18 @@ def forward(
             hidden_states, residual = layer(positions, hidden_states, residual)
 
         if not get_pp_group().is_last_rank:
-            return IntermediateTensors({
-                "hidden_states": hidden_states,
-                "residual": residual,
-            })
+            return IntermediateTensors(
+                {
+                    "hidden_states": hidden_states,
+                    "residual": residual,
+                }
+            )
 
         hidden_states, _ = self.norm(hidden_states, residual)
         return hidden_states
 
 
 class Step3TextForCausalLM(nn.Module, SupportsPP):
-
     def __init__(
         self,
         *,
@@ -383,48 +415,65 @@ def __init__(
                 config.hidden_size,
                 org_num_embeddings=config.vocab_size,
                 padding_size=DEFAULT_VOCAB_PADDING_SIZE
-                if not lora_config else lora_config.lora_vocab_padding_size,
+                if not lora_config
+                else lora_config.lora_vocab_padding_size,
                 prefix=maybe_prefix(prefix, "lm_head"),
             )
-            self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                    config.vocab_size)
+            self.logits_processor = LogitsProcessor(
+                self.unpadded_vocab_size, config.vocab_size
+            )
         else:
             self.lm_head = PPMissingLayer()
 
         self.make_empty_intermediate_tensors = (
-            self.model.make_empty_intermediate_tensors)
+            self.model.make_empty_intermediate_tensors
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         return self.model.get_input_embeddings(input_ids)
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[IntermediateTensors] = None,
-                inputs_embeds: Optional[torch.Tensor] = None):
-        hidden_states = self.model(input_ids, positions, intermediate_tensors,
-                                   inputs_embeds)
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[IntermediateTensors] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+    ):
+        hidden_states = self.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(self, hidden_states: torch.Tensor) -> torch.Tensor:
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         qkv_params_mapping = [
             # (param_name, shard_name, relative_start_idx, relative_end_idx)
-            (".qkv_proj", ".q_proj", 0, self.config.share_q_dim /
-             (self.config.share_q_dim + self.config.head_dim * 2)),
-            (".qkv_proj", ".k_proj", self.config.share_q_dim /
-             (self.config.share_q_dim + self.config.head_dim * 2),
-             (self.config.share_q_dim + self.config.head_dim) /
-             (self.config.share_q_dim + self.config.head_dim * 2)),
-            (".qkv_proj", ".v_proj",
-             (self.config.share_q_dim + self.config.head_dim) /
-             (self.config.share_q_dim + self.config.head_dim * 2),
-             (self.config.share_q_dim + self.config.head_dim * 2) /
-             (self.config.share_q_dim + self.config.head_dim * 2)),
+            (
+                ".qkv_proj",
+                ".q_proj",
+                0,
+                self.config.share_q_dim
+                / (self.config.share_q_dim + self.config.head_dim * 2),
+            ),
+            (
+                ".qkv_proj",
+                ".k_proj",
+                self.config.share_q_dim
+                / (self.config.share_q_dim + self.config.head_dim * 2),
+                (self.config.share_q_dim + self.config.head_dim)
+                / (self.config.share_q_dim + self.config.head_dim * 2),
+            ),
+            (
+                ".qkv_proj",
+                ".v_proj",
+                (self.config.share_q_dim + self.config.head_dim)
+                / (self.config.share_q_dim + self.config.head_dim * 2),
+                (self.config.share_q_dim + self.config.head_dim * 2)
+                / (self.config.share_q_dim + self.config.head_dim * 2),
+            ),
         ]
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
@@ -437,20 +486,19 @@ def load_weights(self, weights: Iterable[tuple[str,
         expert_params_mapping = [
             (".moe.experts.w13_weight", ".moe.gate_proj.weight", "w1"),
             (".moe.experts.w13_weight", ".moe.up_proj.weight", "w3"),
-            (".moe.experts.w2_weight", ".moe.down_proj.weight", "w2")
+            (".moe.experts.w2_weight", ".moe.down_proj.weight", "w2"),
         ]
 
-        disable_moe_stacked_params = [
-            data[1] for data in expert_params_mapping
-        ]
+        disable_moe_stacked_params = [data[1] for data in expert_params_mapping]
 
         for name, loaded_weight in weights:
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
-                if any(disable_moe_stacked_param in name
-                       for disable_moe_stacked_param in
-                       disable_moe_stacked_params):
+                if any(
+                    disable_moe_stacked_param in name
+                    for disable_moe_stacked_param in disable_moe_stacked_params
+                ):
                     continue
                 name = name.replace(weight_name, param_name)
                 if is_pp_missing_parameter(name, self):
@@ -470,23 +518,30 @@ def load_weights(self, weights: Iterable[tuple[str,
                     if is_pp_missing_parameter(name, self):
                         continue
                     # Skip loading extra bias for GPTQ models.
-                    if ((name.endswith(".bias") or name.endswith("_bias"))
-                            and name not in params_dict):
+                    if (
+                        name.endswith(".bias") or name.endswith("_bias")
+                    ) and name not in params_dict:
                         continue
                     param = params_dict[name]
                     weight_loader = param.weight_loader
                     for expert_id in range(loaded_weight.shape[0]):
                         loaded_weight_expert = loaded_weight[expert_id]
-                        weight_loader(param,
-                                      loaded_weight_expert,
-                                      name,
-                                      shard_id=shard_id,
-                                      expert_id=expert_id)
+                        weight_loader(
+                            param,
+                            loaded_weight_expert,
+                            name,
+                            shard_id=shard_id,
+                            expert_id=expert_id,
+                        )
                     loaded_params.add(name)
                     break
                 else:
-                    for (param_name, weight_name, start_idx,
-                         end_idx) in qkv_params_mapping:
+                    for (
+                        param_name,
+                        weight_name,
+                        start_idx,
+                        end_idx,
+                    ) in qkv_params_mapping:
                         if weight_name not in name:
                             continue
                         name = name.replace(weight_name, param_name)
@@ -496,8 +551,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                         dim = param.shape[param.output_dim]
                         begin_idx = int(start_idx * dim)
                         end_idx = int(end_idx * dim)
-                        param_slice = param.narrow(param.output_dim, begin_idx,
-                                                   end_idx - begin_idx)
+                        param_slice = param.narrow(
+                            param.output_dim, begin_idx, end_idx - begin_idx
+                        )
                         param_slice.copy_(loaded_weight)
                         loaded_params.add(name)
                         break
@@ -505,8 +561,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                         if is_pp_missing_parameter(name, self):
                             continue
                         param = params_dict[name]
-                        weight_loader = getattr(param, "weight_loader",
-                                                default_weight_loader)
+                        weight_loader = getattr(
+                            param, "weight_loader", default_weight_loader
+                        )
                         weight_loader(param, loaded_weight)
                         loaded_params.add(name)
         return loaded_params
diff --git a/vllm/model_executor/models/step3_vl.py b/vllm/model_executor/models/step3_vl.py
index da507e0d9732..c4033dd12558 100644
--- a/vllm/model_executor/models/step3_vl.py
+++ b/vllm/model_executor/models/step3_vl.py
@@ -20,25 +20,39 @@
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
 from vllm.multimodal.parse import ImageSize, MultiModalDataItems
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate, PromptUpdateDetails)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs import Step3VisionEncoderConfig
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
-                    init_vllm_registered_model, maybe_prefix)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 from .vision import run_dp_sharded_vision_model
 
 
@@ -54,8 +68,7 @@ class Step3VLImageEmbeddingInputs(TypedDict):
     image_embeds: torch.Tensor
 
 
-Step3VLImageInputs = Union[Step3VLImagePixelInputs,
-                           Step3VLImageEmbeddingInputs]
+Step3VLImageInputs = Union[Step3VLImagePixelInputs, Step3VLImageEmbeddingInputs]
 
 ImageWithPatches = tuple[Image.Image, list[Image.Image], list[int] | None]
 
@@ -63,31 +76,42 @@ class Step3VLImageEmbeddingInputs(TypedDict):
 
 
 class Step3VisionProcessor:
-
     def __init__(self, size, interpolation_mode="bicubic", patch_size=None):
         mean = [0.48145466, 0.4578275, 0.40821073]
         std = [0.26862954, 0.26130258, 0.27577711]
         patch_size = patch_size if patch_size is not None else size
 
-        self.transform = transforms.Compose([
-            transforms.ToTensor(),
-            transforms.Normalize(mean, std),
-            transforms.Resize(
-                (size, size),
-                interpolation=InterpolationMode.BICUBIC if interpolation_mode
-                == "bicubic" else InterpolationMode.BILINEAR,
-                antialias=True),
-        ])
-
-        self.patch_transform = transforms.Compose([
-            transforms.ToTensor(),
-            transforms.Normalize(mean, std),
-            transforms.Resize(
-                (patch_size, patch_size),
-                interpolation=InterpolationMode.BICUBIC if interpolation_mode
-                == "bicubic" else InterpolationMode.BILINEAR,
-                antialias=True),
-        ]) if patch_size is not None else None
+        self.transform = transforms.Compose(
+            [
+                transforms.ToTensor(),
+                transforms.Normalize(mean, std),
+                transforms.Resize(
+                    (size, size),
+                    interpolation=InterpolationMode.BICUBIC
+                    if interpolation_mode == "bicubic"
+                    else InterpolationMode.BILINEAR,
+                    antialias=True,
+                ),
+            ]
+        )
+
+        self.patch_transform = (
+            transforms.Compose(
+                [
+                    transforms.ToTensor(),
+                    transforms.Normalize(mean, std),
+                    transforms.Resize(
+                        (patch_size, patch_size),
+                        interpolation=InterpolationMode.BICUBIC
+                        if interpolation_mode == "bicubic"
+                        else InterpolationMode.BILINEAR,
+                        antialias=True,
+                    ),
+                ]
+            )
+            if patch_size is not None
+            else None
+        )
 
     def __call__(self, image, is_patch=False):
         if is_patch:
@@ -97,7 +121,6 @@ def __call__(self, image, is_patch=False):
 
 
 class ImagePatcher:
-
     def determine_window_size(self, long: int, short: int) -> int:
         if long <= 728:
             return short if long / short > 1.5 else 0
@@ -118,14 +141,12 @@ def slide_window(
             size_w, size_h = size
             step_w, step_h = step
 
-            x_num = 1 if width <= size_w else ceil((width - size_w) / step_w +
-                                                   1)
+            x_num = 1 if width <= size_w else ceil((width - size_w) / step_w + 1)
             x_start = [step_w * i for i in range(x_num)]
             if len(x_start) > 1 and x_start[-1] + size_w > width:
                 x_start[-1] = width - size_w
 
-            y_num = 1 if height <= size_h else ceil((height - size_h) /
-                                                    step_h + 1)
+            y_num = 1 if height <= size_h else ceil((height - size_h) / step_h + 1)
             y_start = [step_h * i for i in range(y_num)]
             if len(y_start) > 1 and y_start[-1] + size_h > height:
                 y_start[-1] = height - size_h
@@ -135,8 +156,10 @@ def slide_window(
             windows.append(np.concatenate([start, start + size], axis=1))
         windows = np.concatenate(windows, axis=0)
 
-        return [(int(box[0]), int(box[1]), int(box[2] - box[0]),
-                 int(box[3] - box[1])) for box in windows], (x_num, y_num)
+        return [
+            (int(box[0]), int(box[1]), int(box[2] - box[0]), int(box[3] - box[1]))
+            for box in windows
+        ], (x_num, y_num)
 
     def square_pad(self, img: Image.Image) -> Image.Image:
         w, h = img.size
@@ -147,25 +170,27 @@ def square_pad(self, img: Image.Image) -> Image.Image:
         padded.paste(img, (0, 0))
         return padded
 
-    def get_image_size_for_padding(self, img_width: int,
-                                   img_height: int) -> tuple[int, int]:
+    def get_image_size_for_padding(
+        self, img_width: int, img_height: int
+    ) -> tuple[int, int]:
         ratio = img_width / img_height
         if min(img_height, img_width) < 32 and (ratio > 4 or ratio < 1 / 4):
             new_size = max(img_height, img_width)
             return new_size, new_size
         return img_width, img_height
 
-    def get_image_size_for_preprocess(self, img_width: int,
-                                      img_height: int) -> tuple[int, int]:
-
+    def get_image_size_for_preprocess(
+        self, img_width: int, img_height: int
+    ) -> tuple[int, int]:
         if max(img_height, img_width) > MAX_IMAGE_SIZE:
             scale_factor = MAX_IMAGE_SIZE / max(img_height, img_width)
             img_width = int(img_width * scale_factor)
             img_height = int(img_height * scale_factor)
         return img_width, img_height
 
-    def get_image_size_for_crop(self, img_width: int, img_height: int,
-                                window_size: int):
+    def get_image_size_for_crop(
+        self, img_width: int, img_height: int, window_size: int
+    ):
         w_ratio = img_width / window_size
         h_ratio = img_height / window_size
 
@@ -187,22 +212,26 @@ def patch_crop(self, img: Image.Image, i: int, j: int, th: int, tw: int):
         target = img.crop((j, i, j + tw, i + th))
         return target
 
-    def get_num_patches(self, img_width: int,
-                        img_height: int) -> tuple[int, int]:
-        img_width, img_height = self.get_image_size_for_padding(
-            img_width, img_height)
+    def get_num_patches(self, img_width: int, img_height: int) -> tuple[int, int]:
+        img_width, img_height = self.get_image_size_for_padding(img_width, img_height)
         img_width, img_height = self.get_image_size_for_preprocess(
-            img_width, img_height)
-        window_size = self.determine_window_size(max(img_height, img_width),
-                                                 min(img_height, img_width))
+            img_width, img_height
+        )
+        window_size = self.determine_window_size(
+            max(img_height, img_width), min(img_height, img_width)
+        )
         if window_size == 0:
             return 0, 0
         else:
             img_width, img_height = self.get_image_size_for_crop(
-                img_width, img_height, window_size)
+                img_width, img_height, window_size
+            )
             center_list, (x_num, y_num) = self.slide_window(
-                img_width, img_height, [(window_size, window_size)],
-                [(window_size, window_size)])
+                img_width,
+                img_height,
+                [(window_size, window_size)],
+                [(window_size, window_size)],
+            )
             full_rows = (len(center_list) - 1) // x_num + 1
             if len(center_list) > 0 and len(center_list) % x_num == 0:
                 full_rows -= 1
@@ -213,39 +242,44 @@ def __call__(
     ) -> tuple[Image.Image, list[Image.Image], list[bool] | None]:
         img_width, img_height = img.size
         new_img_width, new_img_height = self.get_image_size_for_padding(
-            img_width, img_height)
+            img_width, img_height
+        )
         if new_img_width != img_width or new_img_height != img_height:
             img = self.square_pad(img)
             img_width, img_height = img.size
 
         new_img_width, new_img_height = self.get_image_size_for_preprocess(
-            img_width, img_height)
-        img = img.resize((new_img_width, new_img_height),
-                         Image.Resampling.BILINEAR)
+            img_width, img_height
+        )
+        img = img.resize((new_img_width, new_img_height), Image.Resampling.BILINEAR)
         window_size = self.determine_window_size(
-            max(new_img_height, new_img_width),
-            min(new_img_height, new_img_width))
+            max(new_img_height, new_img_width), min(new_img_height, new_img_width)
+        )
 
         if window_size == 0:
             return img, [], None
         else:
             new_img_width, new_img_height = self.get_image_size_for_crop(
-                new_img_width, new_img_height, window_size)
+                new_img_width, new_img_height, window_size
+            )
             if (new_img_width, new_img_height) != (img_width, img_height):
-                img_for_crop = img.resize((new_img_width, new_img_height),
-                                          Image.Resampling.BILINEAR)
+                img_for_crop = img.resize(
+                    (new_img_width, new_img_height), Image.Resampling.BILINEAR
+                )
             else:
                 img_for_crop = img
 
             patches = []
             newlines = []
             center_list, (x_num, y_num) = self.slide_window(
-                new_img_width, new_img_height, [(window_size, window_size)],
-                [(window_size, window_size)])
+                new_img_width,
+                new_img_height,
+                [(window_size, window_size)],
+                [(window_size, window_size)],
+            )
             for patch_id, center_lf_point in enumerate(center_list):
                 x, y, patch_w, patch_h = center_lf_point
-                big_patch = self.patch_crop(img_for_crop, y, x, patch_h,
-                                            patch_w)
+                big_patch = self.patch_crop(img_for_crop, y, x, patch_h, patch_w)
                 patches.append(big_patch)
                 if (patch_id + 1) % x_num == 0:
                     newlines.append(patch_id)
@@ -253,12 +287,16 @@ def __call__(
             if newlines and newlines[-1] == len(patches) - 1:
                 newlines.pop()
 
-            return img, patches, [i in newlines for i in range(len(patches))
-                                  ] if len(patches) > 0 else None
+            return (
+                img,
+                patches,
+                [i in newlines for i in range(len(patches))]
+                if len(patches) > 0
+                else None,
+            )
 
 
 class Step3VLProcessor:
-
     def __init__(
         self,
         config: PretrainedConfig,
@@ -271,17 +309,15 @@ def __init__(
 
         self.image_size = 728
         self.patch_size = 504
-        self.image_preprocessor = Step3VisionProcessor(self.image_size,
-                                                       "bilinear",
-                                                       self.patch_size)
+        self.image_preprocessor = Step3VisionProcessor(
+            self.image_size, "bilinear", self.patch_size
+        )
 
         self.num_image_feature_size = 169
         self.num_patch_feature_size = 81
         self.image_token = "<im_patch>"
-        self.image_feature_placeholder = (self.image_token *
-                                          self.num_image_feature_size)
-        self.patch_feature_placeholder = (self.image_token *
-                                          self.num_patch_feature_size)
+        self.image_feature_placeholder = self.image_token * self.num_image_feature_size
+        self.patch_feature_placeholder = self.image_token * self.num_patch_feature_size
 
         self.patcher = ImagePatcher()
 
@@ -290,15 +326,16 @@ def image_token_id(self) -> int:
         return self.tokenizer.get_vocab()[self.image_token]
 
     def get_num_image_tokens(self, img_width: int, img_height: int) -> int:
-        num_patches, num_newlines = self.patcher.get_num_patches(
-            img_width, img_height)
+        num_patches, num_newlines = self.patcher.get_num_patches(img_width, img_height)
 
-        return num_patches * (
-            self.num_patch_feature_size +
-            2) + self.num_image_feature_size + 2 + num_newlines
+        return (
+            num_patches * (self.num_patch_feature_size + 2)
+            + self.num_image_feature_size
+            + 2
+            + num_newlines
+        )
 
-    def _split_images(self,
-                      images: list[Image.Image]) -> list[ImageWithPatches]:
+    def _split_images(self, images: list[Image.Image]) -> list[ImageWithPatches]:
         result = []
         for img in images:
             result.append(self.patcher(img))
@@ -325,13 +362,15 @@ def _get_patch_repl(
             assert len(patch_newline_mask) == num_patches
             text += f"<patch_start>{self.patch_feature_placeholder}<patch_end>"
             token_ids.extend(
-                [self.tokenizer.convert_tokens_to_ids("<patch_start>")] +
-                [self.image_token_id] * self.num_patch_feature_size +
-                [self.tokenizer.convert_tokens_to_ids("<patch_end>")])
+                [self.tokenizer.convert_tokens_to_ids("<patch_start>")]
+                + [self.image_token_id] * self.num_patch_feature_size
+                + [self.tokenizer.convert_tokens_to_ids("<patch_end>")]
+            )
             if patch_newline_mask and patch_newline_mask[i]:
                 text += "<patch_newline>"
                 token_ids.append(
-                    self.tokenizer.convert_tokens_to_ids("<patch_newline>"))
+                    self.tokenizer.convert_tokens_to_ids("<patch_newline>")
+                )
         return text, token_ids
 
     def _get_image_repl(
@@ -339,11 +378,11 @@ def _get_image_repl(
         num_images: int,
     ) -> tuple[str, list[int]]:
         text = f"<im_start>{self.image_feature_placeholder}<im_end>"
-        token_ids = [
-            self.tokenizer.convert_tokens_to_ids("<im_start>")
-        ] + [self.image_token_id] * self.num_image_feature_size + [
-            self.tokenizer.convert_tokens_to_ids("<im_end>")
-        ]
+        token_ids = (
+            [self.tokenizer.convert_tokens_to_ids("<im_start>")]
+            + [self.image_token_id] * self.num_image_feature_size
+            + [self.tokenizer.convert_tokens_to_ids("<im_end>")]
+        )
         return text * num_images, token_ids * num_images
 
     def _get_image_repl_features(
@@ -354,15 +393,15 @@ def _get_image_repl_features(
     ) -> tuple[str, list[int]]:
         if num_patches > 0:
             patch_repl, patch_repl_ids = self._get_patch_repl(
-                num_patches, patch_new_line_idx)
+                num_patches, patch_new_line_idx
+            )
         else:
             patch_repl = ""
             patch_repl_ids = []
         image_repl, image_repl_ids = self._get_image_repl(num_images)
         return patch_repl + image_repl, patch_repl_ids + image_repl_ids
 
-    def replace_placeholder(self, text: str, placeholder: str,
-                            repls: list[str]) -> str:
+    def replace_placeholder(self, text: str, placeholder: str, repls: list[str]) -> str:
         parts = text.split(placeholder)
 
         if len(parts) - 1 != len(repls):
@@ -404,17 +443,17 @@ def __call__(
             image_repl_ids_lst = []
             num_patches = []
             for raw_img, img_patches, patch_newline_mask in splitted_images_data:  # noqa: E501
-                pixel_values_lst.extend(
-                    self._convert_images_to_pixel_values([raw_img]))
+                pixel_values_lst.extend(self._convert_images_to_pixel_values([raw_img]))
 
                 if len(img_patches) > 0:
                     patch_pixel_values_lst.extend(
-                        self._convert_images_to_pixel_values(img_patches,
-                                                             is_patch=True))
+                        self._convert_images_to_pixel_values(img_patches, is_patch=True)
+                    )
                 num_patches.append(len(img_patches))
 
                 image_repl_str, image_repl_ids = self._get_image_repl_features(
-                    1, len(img_patches), patch_newline_mask)
+                    1, len(img_patches), patch_newline_mask
+                )
                 image_repl_str_lst.append(image_repl_str)
                 image_repl_ids_lst.extend(image_repl_ids)
 
@@ -426,15 +465,15 @@ def __call__(
                 "num_patches": num_patches,
             }
             if patch_pixel_values_lst:
-                image_inputs["patch_pixel_values"] = torch.cat(
-                    patch_pixel_values_lst)
+                image_inputs["patch_pixel_values"] = torch.cat(patch_pixel_values_lst)
             if patch_newline_mask_lst:
                 image_inputs["patch_newline_mask"] = torch.tensor(
-                    patch_newline_mask_lst, dtype=torch.bool)
+                    patch_newline_mask_lst, dtype=torch.bool
+                )
 
             text = [
-                self.replace_placeholder(t, self.image_token,
-                                         image_repl_str_lst) for t in text
+                self.replace_placeholder(t, self.image_token, image_repl_str_lst)
+                for t in text
             ]
             text_inputs = self.tokenizer(text)
 
@@ -448,7 +487,6 @@ def __call__(
 
 
 class Step3VLProcessingInfo(BaseProcessingInfo):
-
     def get_hf_processor(self) -> Step3VLProcessor:
         return Step3VLProcessor(
             self.get_hf_config(),
@@ -462,7 +500,8 @@ def get_max_image_tokens(self) -> int:
         hf_processor = self.get_hf_processor()
         return hf_processor.get_num_image_tokens(
             self.get_image_size_with_most_features().width,
-            self.get_image_size_with_most_features().height)
+            self.get_image_size_with_most_features().height,
+        )
 
     def get_mm_max_tokens_per_item(
         self,
@@ -476,19 +515,19 @@ def get_image_size_with_most_features(self) -> ImageSize:
 
     def get_num_mm_tokens(self, mm_data: MultiModalDataDict) -> int:
         if len(mm_data) != 1 or "image" not in mm_data:
-            raise ValueError(
-                "mm_data could only contain one key 'image' for steo1o")
+            raise ValueError("mm_data could only contain one key 'image' for steo1o")
 
         image_data = mm_data["image"]
         if not isinstance(image_data, (list, tuple)):
             image_data = [image_data]
 
-        return sum(self.get_hf_processor().get_num_image_tokens(
-            img.width, img.height) for img in image_data)
+        return sum(
+            self.get_hf_processor().get_num_image_tokens(img.width, img.height)
+            for img in image_data
+        )
 
 
 class Step3VLDummyInputsBuilder(BaseDummyInputsBuilder[Step3VLProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
         return "<im_patch>" * num_images
@@ -499,24 +538,22 @@ def get_dummy_mm_data(
         mm_counts: Mapping[str, int],
         mm_options: Optional[Mapping[str, BaseDummyOptions]] = None,
     ) -> MultiModalDataDict:
-        target_width, target_height = \
-            self.info.get_image_size_with_most_features()
+        target_width, target_height = self.info.get_image_size_with_most_features()
         num_images = mm_counts.get("image", 0)
 
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides)
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            )
         }
 
 
-class Step3VLMultiModalProcessor(BaseMultiModalProcessor[Step3VLProcessingInfo]
-                                 ):
-
+class Step3VLMultiModalProcessor(BaseMultiModalProcessor[Step3VLProcessingInfo]):
     def _get_prompt_updates(
         self,
         mm_items: MultiModalDataItems,
@@ -532,10 +569,10 @@ def get_replacement_step1o(item_idx: int):
             if num_patches > 0:
                 patch_newline_mask = out_item["patch_newline_mask"].data
                 image_repl_ids = hf_processor._get_image_repl_features(
-                    1, num_patches, patch_newline_mask.tolist())[1]
+                    1, num_patches, patch_newline_mask.tolist()
+                )[1]
             else:
-                image_repl_ids = hf_processor._get_image_repl_features(
-                    1, 0, None)[1]
+                image_repl_ids = hf_processor._get_image_repl_features(1, 0, None)[1]
             return PromptUpdateDetails.select_token_id(
                 seq=image_repl_ids,
                 embed_token_id=image_placeholder_token_id,
@@ -559,10 +596,12 @@ def _get_mm_fields_config(
         return dict(
             pixel_values=MultiModalFieldConfig.batched("image"),
             patch_pixel_values=MultiModalFieldConfig.flat_from_sizes(
-                "image", num_patches),
+                "image", num_patches
+            ),
             num_patches=MultiModalFieldConfig.batched("image"),
             patch_newline_mask=MultiModalFieldConfig.flat_from_sizes(
-                "image", num_patches),
+                "image", num_patches
+            ),
         )
 
 
@@ -576,29 +615,29 @@ def get_abs_pos(abs_pos, tgt_size):
     dtype = abs_pos.dtype
 
     if src_size != tgt_size:
-        old_pos_embed = old_pos_embed.view(1, src_size, src_size,
-                                           dim).permute(0, 3, 1,
-                                                        2).contiguous()
+        old_pos_embed = (
+            old_pos_embed.view(1, src_size, src_size, dim)
+            .permute(0, 3, 1, 2)
+            .contiguous()
+        )
         old_pos_embed = old_pos_embed.to(torch.float32)
         new_pos_embed = F.interpolate(
             old_pos_embed,
             size=(tgt_size, tgt_size),
-            mode='bicubic',
+            mode="bicubic",
             antialias=True,
             align_corners=False,
         ).to(dtype)
         new_pos_embed = new_pos_embed.permute(0, 2, 3, 1)
         new_pos_embed = new_pos_embed.view(tgt_size * tgt_size, dim)
         vision_pos_embed = torch.cat([cls_token, new_pos_embed], dim=0)
-        vision_pos_embed = vision_pos_embed.view(1, tgt_size * tgt_size + 1,
-                                                 dim)
+        vision_pos_embed = vision_pos_embed.view(1, tgt_size * tgt_size + 1, dim)
         return vision_pos_embed
     else:
         return abs_pos
 
 
 class Step3VisionEmbeddings(nn.Module):
-
     def __init__(self, config: Step3VisionEncoderConfig):
         super().__init__()
         self.config = config
@@ -616,43 +655,51 @@ def __init__(self, config: Step3VisionEncoderConfig):
             bias=True,
         )
 
-        self.num_patches = (self.image_size // self.patch_size)**2
+        self.num_patches = (self.image_size // self.patch_size) ** 2
         self.pad_tp_size = 4  # hard code for padding
         # To load the pretrained weights, we still use P+1 as the seqlen
-        self.position_embedding = torch.nn.Embedding(self.num_patches + 1,
-                                                     self.embed_dim)
-        self.register_buffer("position_ids",
-                             torch.arange(self.num_patches + 1).expand(
-                                 (1, -1)),
-                             persistent=False)
+        self.position_embedding = torch.nn.Embedding(
+            self.num_patches + 1, self.embed_dim
+        )
+        self.register_buffer(
+            "position_ids",
+            torch.arange(self.num_patches + 1).expand((1, -1)),
+            persistent=False,
+        )
 
     def forward(self, pixel_values: torch.Tensor) -> torch.Tensor:
         batch_size = pixel_values.shape[0]
         patch_embeds = self.patch_embedding(
-            pixel_values)  # shape = [*, width, grid, grid]
+            pixel_values
+        )  # shape = [*, width, grid, grid]
         patch_embeds = patch_embeds.flatten(2).transpose(1, 2)
 
         # pad
         class_embeds = self.class_embedding.expand(batch_size, 1, -1)
         embeddings = torch.cat([class_embeds, patch_embeds], dim=1)
         embeddings = embeddings + get_abs_pos(
-            self.position_embedding(self.position_ids), patch_embeds.size(1))
-        embeddings = torch.cat([
-            embeddings[:, 0, :].unsqueeze(1).repeat(1, self.pad_tp_size - 1,
-                                                    1), embeddings
-        ],
-                               dim=1)
+            self.position_embedding(self.position_ids), patch_embeds.size(1)
+        )
+        embeddings = torch.cat(
+            [
+                embeddings[:, 0, :].unsqueeze(1).repeat(1, self.pad_tp_size - 1, 1),
+                embeddings,
+            ],
+            dim=1,
+        )
         return embeddings
 
 
 class Step3VisionAttention(nn.Module):
     """Multi-headed attention from 'Attention Is All You Need' paper"""
 
-    def __init__(self,
-                 config,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "",
-                 use_data_parallel: bool = False):
+    def __init__(
+        self,
+        config,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+        use_data_parallel: bool = False,
+    ):
         super().__init__()
         self.config = config
         self.embed_dim = config.hidden_size
@@ -661,8 +708,7 @@ def __init__(self,
 
         self.scale = self.head_dim**-0.5
 
-        tp_size = (1 if use_data_parallel else
-                   get_tensor_model_parallel_world_size())
+        tp_size = 1 if use_data_parallel else get_tensor_model_parallel_world_size()
         assert self.total_num_heads % tp_size == 0
         self.num_heads = self.total_num_heads // tp_size
 
@@ -677,16 +723,17 @@ def __init__(self,
             prefix=f"{prefix}.qkv_proj",
             disable_tp=use_data_parallel,
         )
-        self.out_proj = RowParallelLinear(self.embed_dim,
-                                          self.embed_dim,
-                                          bias=True,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.out_proj",
-                                          disable_tp=use_data_parallel)
+        self.out_proj = RowParallelLinear(
+            self.embed_dim,
+            self.embed_dim,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.out_proj",
+            disable_tp=use_data_parallel,
+        )
 
         # Use unified MultiHeadAttention with automatic backend selection
-        self.attn = MultiHeadAttention(self.num_heads, self.head_dim,
-                                       self.scale)
+        self.attn = MultiHeadAttention(self.num_heads, self.head_dim, self.scale)
 
     def forward(
         self,
@@ -708,27 +755,32 @@ def forward(
 
 
 class Step3VisionMLP(nn.Module):
-
-    def __init__(self,
-                 config,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "",
-                 use_data_parallel: bool = False):
+    def __init__(
+        self,
+        config,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+        use_data_parallel: bool = False,
+    ):
         super().__init__()
         self.config = config
         self.activation_fn = get_act_fn(config.hidden_act)
-        self.fc1 = ColumnParallelLinear(config.hidden_size,
-                                        config.intermediate_size,
-                                        bias=True,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}.fc1",
-                                        disable_tp=use_data_parallel)
-        self.fc2 = RowParallelLinear(config.intermediate_size,
-                                     config.hidden_size,
-                                     bias=True,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.fc2",
-                                     disable_tp=use_data_parallel)
+        self.fc1 = ColumnParallelLinear(
+            config.hidden_size,
+            config.intermediate_size,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc1",
+            disable_tp=use_data_parallel,
+        )
+        self.fc2 = RowParallelLinear(
+            config.intermediate_size,
+            config.hidden_size,
+            bias=True,
+            quant_config=quant_config,
+            prefix=f"{prefix}.fc2",
+            disable_tp=use_data_parallel,
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         hidden_states, _ = self.fc1(hidden_states)
@@ -738,12 +790,13 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class Step3VisionEncoderLayer(nn.Module):
-
-    def __init__(self,
-                 config: Step3VisionEncoderConfig,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "",
-                 use_data_parallel: bool = False):
+    def __init__(
+        self,
+        config: Step3VisionEncoderConfig,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+        use_data_parallel: bool = False,
+    ):
         super().__init__()
         self.use_data_parallel = use_data_parallel
         self.embed_dim = config.hidden_size
@@ -751,44 +804,48 @@ def __init__(self,
             config,
             quant_config,
             prefix=f"{prefix}.self_attn",
-            use_data_parallel=self.use_data_parallel)
-        self.layer_norm1 = nn.LayerNorm(self.embed_dim,
-                                        eps=config.layer_norm_eps)
-        self.mlp = Step3VisionMLP(config,
-                                  quant_config,
-                                  prefix=f"{prefix}.mlp",
-                                  use_data_parallel=self.use_data_parallel)
-        self.layer_norm2 = nn.LayerNorm(self.embed_dim,
-                                        eps=config.layer_norm_eps)
+            use_data_parallel=self.use_data_parallel,
+        )
+        self.layer_norm1 = nn.LayerNorm(self.embed_dim, eps=config.layer_norm_eps)
+        self.mlp = Step3VisionMLP(
+            config,
+            quant_config,
+            prefix=f"{prefix}.mlp",
+            use_data_parallel=self.use_data_parallel,
+        )
+        self.layer_norm2 = nn.LayerNorm(self.embed_dim, eps=config.layer_norm_eps)
 
     def forward(
         self,
         hidden_states: torch.Tensor,
     ) -> torch.FloatTensor:
-        hidden_states = hidden_states + self.layer_norm1(
-            self.self_attn(hidden_states))
-        hidden_states = hidden_states + self.layer_norm2(
-            self.mlp(hidden_states))
+        hidden_states = hidden_states + self.layer_norm1(self.self_attn(hidden_states))
+        hidden_states = hidden_states + self.layer_norm2(self.mlp(hidden_states))
         return hidden_states
 
 
 class Step3VisionEncoder(nn.Module):
-
-    def __init__(self,
-                 config: Step3VisionEncoderConfig,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "",
-                 use_data_parallel: bool = False):
+    def __init__(
+        self,
+        config: Step3VisionEncoderConfig,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+        use_data_parallel: bool = False,
+    ):
         super().__init__()
         self.config = config
         self.use_data_parallel = use_data_parallel
-        self.layers = nn.ModuleList([
-            Step3VisionEncoderLayer(config,
-                                    quant_config,
-                                    prefix=f"{prefix}.layers.{i}",
-                                    use_data_parallel=self.use_data_parallel)
-            for i in range(config.num_hidden_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                Step3VisionEncoderLayer(
+                    config,
+                    quant_config,
+                    prefix=f"{prefix}.layers.{i}",
+                    use_data_parallel=self.use_data_parallel,
+                )
+                for i in range(config.num_hidden_layers)
+            ]
+        )
 
     def forward(
         self,
@@ -801,12 +858,13 @@ def forward(
 
 
 class Step3VisionTransformer(nn.Module):
-
-    def __init__(self,
-                 config: Step3VisionEncoderConfig,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "",
-                 use_data_parallel: bool = False):
+    def __init__(
+        self,
+        config: Step3VisionEncoderConfig,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+        use_data_parallel: bool = False,
+    ):
         super().__init__()
         self.config = config
         self.use_data_parallel = use_data_parallel
@@ -816,7 +874,8 @@ def __init__(self,
             config,
             quant_config,
             prefix=f"{prefix}.transformer",
-            use_data_parallel=self.use_data_parallel)
+            use_data_parallel=self.use_data_parallel,
+        )
 
     def forward(
         self,
@@ -824,23 +883,24 @@ def forward(
     ):
         hidden_states = self.embeddings(pixel_values)
         if self.use_data_parallel:
-            hidden_states = run_dp_sharded_vision_model(
-                hidden_states, self.transformer)
+            hidden_states = run_dp_sharded_vision_model(hidden_states, self.transformer)
         else:
             hidden_states = self.transformer(inputs_embeds=hidden_states)
         return hidden_states
 
 
-@MULTIMODAL_REGISTRY.register_processor(Step3VLMultiModalProcessor,
-                                        info=Step3VLProcessingInfo,
-                                        dummy_inputs=Step3VLDummyInputsBuilder)
-class Step3VLForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                      SupportsPP):
-
-    hf_to_vllm_mapper = WeightsMapper(orig_to_new_prefix={
-        "model.": "language_model.model.",
-        "lm_head.": "language_model.lm_head.",
-    })
+@MULTIMODAL_REGISTRY.register_processor(
+    Step3VLMultiModalProcessor,
+    info=Step3VLProcessingInfo,
+    dummy_inputs=Step3VLDummyInputsBuilder,
+)
+class Step3VLForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP):
+    hf_to_vllm_mapper = WeightsMapper(
+        orig_to_new_prefix={
+            "model.": "language_model.model.",
+            "lm_head.": "language_model.lm_head.",
+        }
+    )
 
     supports_encoder_tp_data = True
 
@@ -866,12 +926,14 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
                 config.vision_config,
                 None,
                 prefix=maybe_prefix(prefix, "vision_model"),
-                use_data_parallel=self.use_data_parallel)
+                use_data_parallel=self.use_data_parallel,
+            )
             self.vit_downsampler = nn.Conv2d(
                 config.vision_config.hidden_size,
                 config.vision_config.output_hidden_size,
                 kernel_size=2,
-                stride=config.understand_projector_stride)
+                stride=config.understand_projector_stride,
+            )
             self.vit_downsampler2 = nn.Conv2d(
                 config.vision_config.output_hidden_size,
                 config.vision_config.output_hidden_size * 2,
@@ -893,10 +955,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         self.language_model = init_vllm_registered_model(
             vllm_config=vllm_config,
             hf_config=config.text_config,
-            prefix=maybe_prefix(prefix, "language_model"))
+            prefix=maybe_prefix(prefix, "language_model"),
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     @property
     def device(self):
@@ -907,7 +971,8 @@ def dtype(self):
         return next(self.parameters()).dtype
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[Step3VLImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[Step3VLImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         patch_pixel_values = kwargs.pop("patch_pixel_values", None)
         num_patches = kwargs.pop("num_patches", None)
@@ -921,10 +986,10 @@ def _parse_and_validate_image_input(
             if pixel_values.dim() >= 3:
                 pixel_values = pixel_values.view(-1, *pixel_values.shape[-3:])
             if patch_pixel_values is not None:
-                patch_pixel_values = flatten_bn(patch_pixel_values,
-                                                concat=True)
+                patch_pixel_values = flatten_bn(patch_pixel_values, concat=True)
                 patch_pixel_values = patch_pixel_values.view(
-                    -1, *patch_pixel_values.shape[-3:])
+                    -1, *patch_pixel_values.shape[-3:]
+                )
                 # Handle empty patch_pixel_values by setting to None
                 if patch_pixel_values.shape[0] == 0:
                     patch_pixel_values = None
@@ -933,8 +998,9 @@ def _parse_and_validate_image_input(
             return Step3VLImagePixelInputs(
                 type="pixel_values",
                 pixel_values=pixel_values.to(self.dtype).to(self.device),
-                patch_pixel_values=patch_pixel_values.to(self.dtype).to(
-                    self.device) if patch_pixel_values is not None else None,
+                patch_pixel_values=patch_pixel_values.to(self.dtype).to(self.device)
+                if patch_pixel_values is not None
+                else None,
                 num_patches=num_patches,
             )
 
@@ -943,7 +1009,8 @@ def _parse_and_validate_image_input(
                 image_embeds = image_embeds.view(-1, image_embeds.shape[-1])
             else:
                 raise ValueError(
-                    f"Unexpected shape for image_embeds: {image_embeds.shape}")
+                    f"Unexpected shape for image_embeds: {image_embeds.shape}"
+                )
 
             return Step3VLImageEmbeddingInputs(
                 type="image_embeds",
@@ -951,8 +1018,7 @@ def _parse_and_validate_image_input(
             )
         return None
 
-    def _process_image_features(self,
-                                image_features: torch.Tensor) -> torch.Tensor:
+    def _process_image_features(self, image_features: torch.Tensor) -> torch.Tensor:
         B, P = image_features.shape[:2]
         HW = int(sqrt(P))
         image_features = image_features.permute(0, 2, 1).view(B, -1, HW, HW)
@@ -963,26 +1029,29 @@ def _process_image_features(self,
         image_features = self.vit_large_projector(image_features)
         return image_features
 
-    def _get_vision_model_output(self,
-                                 input_tensor: torch.Tensor) -> torch.Tensor:
+    def _get_vision_model_output(self, input_tensor: torch.Tensor) -> torch.Tensor:
         return self.vision_model(input_tensor)[:, 4:]
 
     def _process_image_input(
-            self, image_input: Step3VLImageInputs) -> tuple[torch.Tensor, ...]:
-
+        self, image_input: Step3VLImageInputs
+    ) -> tuple[torch.Tensor, ...]:
         if image_input["type"] == "image_embeds":
             image_features = image_input["image_embeds"]
         else:
-            image_features = self._get_vision_model_output(
-                image_input["pixel_values"])
-            patch_image_features = self._get_vision_model_output(
-                image_input["patch_pixel_values"]
-            ) if image_input["patch_pixel_values"] is not None else None
+            image_features = self._get_vision_model_output(image_input["pixel_values"])
+            patch_image_features = (
+                self._get_vision_model_output(image_input["patch_pixel_values"])
+                if image_input["patch_pixel_values"] is not None
+                else None
+            )
             num_patches = image_input["num_patches"]
 
         image_features = self._process_image_features(image_features)
-        patch_image_features = self._process_image_features(
-            patch_image_features) if patch_image_features is not None else None
+        patch_image_features = (
+            self._process_image_features(patch_image_features)
+            if patch_image_features is not None
+            else None
+        )
 
         merged_image_features = []
         cur_patch_idx = 0
@@ -990,14 +1059,14 @@ def _process_image_input(
             cur_feature = []
             if num_patch > 0:
                 patch_slice = patch_image_features[
-                    cur_patch_idx:cur_patch_idx + num_patch]
+                    cur_patch_idx : cur_patch_idx + num_patch
+                ]
                 cur_feature.append(patch_slice.view(-1, patch_slice.shape[-1]))
-            cur_feature.append(image_features[i].view(
-                -1, image_features.shape[-1]))
+            cur_feature.append(image_features[i].view(-1, image_features.shape[-1]))
             cur_patch_idx += num_patch
             merged_image_features.append(
-                torch.cat(cur_feature) if len(cur_feature) >
-                1 else cur_feature[0])
+                torch.cat(cur_feature) if len(cur_feature) > 1 else cur_feature[0]
+            )
         return merged_image_features
 
     def get_language_model(self) -> torch.nn.Module:
@@ -1049,10 +1118,9 @@ def forward(
             )
             input_ids = None
 
-        hidden_states = self.language_model(input_ids,
-                                            positions,
-                                            intermediate_tensors,
-                                            inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
 
         return hidden_states
 
@@ -1063,15 +1131,15 @@ def compute_logits(
         return self.language_model.compute_logits(hidden_states)
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]):
-
         skip_prefixes = []
         if self.vision_model is None and self.vit_large_projector is None:
             skip_prefixes = [
-                "vision_model.", "vit_downsampler.", "vit_downsampler2.",
-                "vit_large_projector."
+                "vision_model.",
+                "vit_downsampler.",
+                "vit_downsampler2.",
+                "vit_large_projector.",
             ]
 
         loader = AutoWeightsLoader(self, skip_prefixes=skip_prefixes)
-        loaded_weights = loader.load_weights(weights,
-                                             mapper=self.hf_to_vllm_mapper)
+        loaded_weights = loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
         return loaded_weights
diff --git a/vllm/model_executor/models/swin.py b/vllm/model_executor/models/swin.py
index 30b441f5b4df..485c008e830a 100644
--- a/vllm/model_executor/models/swin.py
+++ b/vllm/model_executor/models/swin.py
@@ -7,21 +7,21 @@
 import torch
 import torch.nn as nn
 from transformers import SwinConfig
-from transformers.models.swin.modeling_swin import SwinEmbeddings
+from transformers.models.swin.modeling_swin import SwinEmbeddings, SwinPatchMerging
 from transformers.models.swin.modeling_swin import SwinLayer as HFSwinLayer
-from transformers.models.swin.modeling_swin import SwinPatchMerging
 from transformers.pytorch_utils import meshgrid
 
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 
 
 class SwinSelfAttention(nn.Module):
-
     def __init__(
         self,
         config: SwinConfig,
@@ -35,35 +35,40 @@ def __init__(
         if dim % num_heads != 0:
             raise ValueError(
                 f"The hidden size ({dim}) is not a multiple of the number of "
-                f"attention heads ({num_heads})")
+                f"attention heads ({num_heads})"
+            )
 
         self.num_attention_heads = num_heads
         self.attention_head_size = int(dim / num_heads)
         self.all_head_size = self.num_attention_heads * self.attention_head_size
-        self.window_size = (window_size if isinstance(window_size, Iterable)
-                            else (window_size, window_size))
+        self.window_size = (
+            window_size
+            if isinstance(window_size, Iterable)
+            else (window_size, window_size)
+        )
         self.scale = self.attention_head_size**-0.5
 
         self.relative_position_bias_table = nn.Parameter(
             torch.zeros(
-                (2 * self.window_size[0] - 1) * (2 * self.window_size[1] - 1),
-                num_heads))
+                (2 * self.window_size[0] - 1) * (2 * self.window_size[1] - 1), num_heads
+            )
+        )
 
         # get pair-wise relative position index for each token inside the window
         coords_h = torch.arange(self.window_size[0])
         coords_w = torch.arange(self.window_size[1])
         coords = torch.stack(meshgrid([coords_h, coords_w], indexing="ij"))
         coords_flatten = torch.flatten(coords, 1)
-        relative_coords = coords_flatten[:, :, None] - coords_flatten[:,
-                                                                      None, :]
+        relative_coords = coords_flatten[:, :, None] - coords_flatten[:, None, :]
         relative_coords = relative_coords.permute(1, 2, 0).contiguous()
         relative_coords[:, :, 0] += self.window_size[0] - 1
         relative_coords[:, :, 1] += self.window_size[1] - 1
         relative_coords[:, :, 0] *= 2 * self.window_size[1] - 1
         relative_position_index = relative_coords.sum(-1)
 
-        self.relative_position_index = nn.Parameter(relative_position_index,
-                                                    requires_grad=False)
+        self.relative_position_index = nn.Parameter(
+            relative_position_index, requires_grad=False
+        )
 
         self.qkv = QKVParallelLinear(
             hidden_size=dim,
@@ -75,19 +80,23 @@ def __init__(
         )
 
     def transpose_for_scores(self, x):
-        new_x_shape = x.size()[:-1] + (self.num_attention_heads,
-                                       self.attention_head_size)
+        new_x_shape = x.size()[:-1] + (
+            self.num_attention_heads,
+            self.attention_head_size,
+        )
         x = x.view(new_x_shape)
         return x.permute(0, 2, 1, 3)
 
     def _get_rel_pos_bias(self) -> torch.Tensor:
         relative_position_bias = self.relative_position_bias_table[
-            self.relative_position_index.view(-1)]
+            self.relative_position_index.view(-1)
+        ]
         relative_position_bias = relative_position_bias.view(
             self.window_size[0] * self.window_size[1],
-            self.window_size[0] * self.window_size[1], -1)
-        relative_position_bias = relative_position_bias.permute(
-            2, 0, 1).contiguous()
+            self.window_size[0] * self.window_size[1],
+            -1,
+        )
+        relative_position_bias = relative_position_bias.permute(2, 0, 1).contiguous()
         return relative_position_bias.unsqueeze(0)
 
     def forward(
@@ -110,38 +119,38 @@ def forward(
         if attention_mask is not None:
             mask_shape = attention_mask.shape[0]
             attention_mask_expanded = attention_mask.view(
-                1, mask_shape, 1, dim,
-                dim).expand(batch_size // mask_shape, mask_shape,
-                            self.num_attention_heads, dim, dim)
-            attention_scores = attention_scores + \
-            attention_mask_expanded.unsqueeze(
-                1).unsqueeze(0)
-            attention_scores = attention_scores.view(-1,
-                                                     self.num_attention_heads,
-                                                     dim, dim)
+                1, mask_shape, 1, dim, dim
+            ).expand(
+                batch_size // mask_shape, mask_shape, self.num_attention_heads, dim, dim
+            )
+            attention_scores = attention_scores + attention_mask_expanded.unsqueeze(
+                1
+            ).unsqueeze(0)
+            attention_scores = attention_scores.view(
+                -1, self.num_attention_heads, dim, dim
+            )
 
         context_layer = torch.nn.functional.scaled_dot_product_attention(
             query_layer,
             key_layer,
             value_layer,
             attn_mask=attention_scores,
-            dropout_p=0.,
+            dropout_p=0.0,
         )
         attention_probs = None
 
         context_layer = context_layer.permute(0, 2, 1, 3).contiguous()
-        new_context_layer_shape = context_layer.size()[:-2] + (
-            self.all_head_size, )
+        new_context_layer_shape = context_layer.size()[:-2] + (self.all_head_size,)
         context_layer = context_layer.view(new_context_layer_shape)
 
-        outputs = (context_layer,
-                   attention_probs) if output_attentions else (context_layer, )
+        outputs = (
+            (context_layer, attention_probs) if output_attentions else (context_layer,)
+        )
 
         return outputs
 
 
 class SwinSelfOutput(nn.Module):
-
     def __init__(
         self,
         config: SwinConfig,
@@ -157,33 +166,36 @@ def __init__(
             prefix=f"{prefix}.dense",
         )
 
-    def forward(self, hidden_states: torch.Tensor,
-                input_tensor: torch.Tensor) -> torch.Tensor:
+    def forward(
+        self, hidden_states: torch.Tensor, input_tensor: torch.Tensor
+    ) -> torch.Tensor:
         hidden_states, _ = self.dense(hidden_states)
 
         return hidden_states
 
 
 class SwinAttention(nn.Module):
-
-    def __init__(self,
-                 config: SwinConfig,
-                 dim: int,
-                 num_heads: int,
-                 window_size: int,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: SwinConfig,
+        dim: int,
+        num_heads: int,
+        window_size: int,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
-        self.self = SwinSelfAttention(config,
-                                      dim,
-                                      num_heads,
-                                      window_size,
-                                      quant_config=quant_config,
-                                      prefix=f"{prefix}.self")
-        self.output = SwinSelfOutput(config,
-                                     dim,
-                                     quant_config=quant_config,
-                                     prefix=f"{prefix}.output")
+        self.self = SwinSelfAttention(
+            config,
+            dim,
+            num_heads,
+            window_size,
+            quant_config=quant_config,
+            prefix=f"{prefix}.self",
+        )
+        self.output = SwinSelfOutput(
+            config, dim, quant_config=quant_config, prefix=f"{prefix}.output"
+        )
         self.pruned_heads = set()
 
     def forward(
@@ -193,25 +205,29 @@ def forward(
         head_mask: Optional[torch.FloatTensor] = None,
         output_attentions: Optional[bool] = False,
     ) -> tuple[torch.Tensor]:
-        self_outputs = self.self(hidden_states, attention_mask, head_mask,
-                                 output_attentions)
+        self_outputs = self.self(
+            hidden_states, attention_mask, head_mask, output_attentions
+        )
         attention_output = self.output(self_outputs[0], hidden_states)
-        outputs = (attention_output, ) + self_outputs[1:]
+        outputs = (attention_output,) + self_outputs[1:]
         return outputs
 
 
 class SwinIntermediate(nn.Module):
-
-    def __init__(self,
-                 config: SwinConfig,
-                 dim: int,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: SwinConfig,
+        dim: int,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
-        self.dense = ColumnParallelLinear(dim,
-                                          int(config.mlp_ratio * dim),
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.dense")
+        self.dense = ColumnParallelLinear(
+            dim,
+            int(config.mlp_ratio * dim),
+            quant_config=quant_config,
+            prefix=f"{prefix}.dense",
+        )
         self.intermediate_act_fn = get_act_fn(config.hidden_act)
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
@@ -221,17 +237,20 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class SwinOutput(nn.Module):
-
-    def __init__(self,
-                 config: SwinConfig,
-                 dim: int,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: SwinConfig,
+        dim: int,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> None:
         super().__init__()
-        self.dense = RowParallelLinear(int(config.mlp_ratio * dim),
-                                       dim,
-                                       quant_config=quant_config,
-                                       prefix=f"{prefix}.dense")
+        self.dense = RowParallelLinear(
+            int(config.mlp_ratio * dim),
+            dim,
+            quant_config=quant_config,
+            prefix=f"{prefix}.dense",
+        )
 
     def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         hidden_states, _ = self.dense(hidden_states)
@@ -239,7 +258,6 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
 
 
 class SwinLayer(HFSwinLayer):
-
     def __init__(
         self,
         config: SwinConfig,
@@ -260,24 +278,23 @@ def __init__(
             shift_size=shift_size,
         )
 
-        self.attention = SwinAttention(config,
-                                       dim,
-                                       num_heads,
-                                       window_size=self.window_size,
-                                       quant_config=quant_config,
-                                       prefix=f"{prefix}.attention")
-        self.intermediate = SwinIntermediate(config,
-                                             dim,
-                                             quant_config=quant_config,
-                                             prefix=f"{prefix}.intermediate")
-        self.output = SwinOutput(config,
-                                 dim,
-                                 quant_config=quant_config,
-                                 prefix=f"{prefix}.output")
+        self.attention = SwinAttention(
+            config,
+            dim,
+            num_heads,
+            window_size=self.window_size,
+            quant_config=quant_config,
+            prefix=f"{prefix}.attention",
+        )
+        self.intermediate = SwinIntermediate(
+            config, dim, quant_config=quant_config, prefix=f"{prefix}.intermediate"
+        )
+        self.output = SwinOutput(
+            config, dim, quant_config=quant_config, prefix=f"{prefix}.output"
+        )
 
 
 class SwinStage(nn.Module):
-
     def __init__(
         self,
         config: SwinConfig,
@@ -293,24 +310,27 @@ def __init__(
         super().__init__()
         self.config = config
         self.dim = dim
-        self.blocks = nn.ModuleList([
-            SwinLayer(config=config,
-                      dim=dim,
-                      input_resolution=input_resolution,
-                      num_heads=num_heads,
-                      drop_path_rate=drop_path[layer_idx],
-                      shift_size=0 if
-                      (layer_idx % 2 == 0) else config.window_size // 2,
-                      quant_config=quant_config,
-                      prefix=f"{prefix}.blocks.{layer_idx}")
-            for layer_idx in range(depth)
-        ])
+        self.blocks = nn.ModuleList(
+            [
+                SwinLayer(
+                    config=config,
+                    dim=dim,
+                    input_resolution=input_resolution,
+                    num_heads=num_heads,
+                    drop_path_rate=drop_path[layer_idx],
+                    shift_size=0 if (layer_idx % 2 == 0) else config.window_size // 2,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.blocks.{layer_idx}",
+                )
+                for layer_idx in range(depth)
+            ]
+        )
 
         # patch merging layer
         if downsample is not None:
-            self.downsample = downsample(input_resolution,
-                                         dim=dim,
-                                         norm_layer=nn.LayerNorm)
+            self.downsample = downsample(
+                input_resolution, dim=dim, norm_layer=nn.LayerNorm
+            )
         else:
             self.downsample = None
 
@@ -328,25 +348,31 @@ def forward(
         for i, layer_module in enumerate(self.blocks):
             layer_head_mask = head_mask[i] if head_mask is not None else None
 
-            layer_outputs = layer_module(hidden_states, input_dimensions,
-                                         layer_head_mask, output_attentions,
-                                         always_partition)
+            layer_outputs = layer_module(
+                hidden_states,
+                input_dimensions,
+                layer_head_mask,
+                output_attentions,
+                always_partition,
+            )
 
             hidden_states = layer_outputs[0]
 
         hidden_states_before_downsampling = hidden_states
         if self.downsample is not None:
-            height_downsampled, width_downsampled = (height + 1) // 2, (width +
-                                                                        1) // 2
-            output_dimensions = (height, width, height_downsampled,
-                                 width_downsampled)
-            hidden_states = self.downsample(hidden_states_before_downsampling,
-                                            input_dimensions)
+            height_downsampled, width_downsampled = (height + 1) // 2, (width + 1) // 2
+            output_dimensions = (height, width, height_downsampled, width_downsampled)
+            hidden_states = self.downsample(
+                hidden_states_before_downsampling, input_dimensions
+            )
         else:
             output_dimensions = (height, width, height, width)
 
-        stage_outputs = (hidden_states, hidden_states_before_downsampling,
-                         output_dimensions)
+        stage_outputs = (
+            hidden_states,
+            hidden_states_before_downsampling,
+            output_dimensions,
+        )
 
         if output_attentions:
             stage_outputs += layer_outputs[1:]
@@ -354,7 +380,6 @@ def forward(
 
 
 class SwinEncoder(nn.Module):
-
     def __init__(
         self,
         config: SwinConfig,
@@ -366,24 +391,36 @@ def __init__(
         self.num_layers = len(config.depths)
         self.config = config
         dpr = [
-            x.item() for x in torch.linspace(
-                0, config.drop_path_rate, sum(config.depths), device="cpu")
+            x.item()
+            for x in torch.linspace(
+                0, config.drop_path_rate, sum(config.depths), device="cpu"
+            )
         ]
-        self.layers = nn.ModuleList([
-            SwinStage(config=config,
-                      dim=int(config.embed_dim * 2**layer_idx),
-                      input_resolution=(grid_size[0] // (2**layer_idx),
-                                        grid_size[1] // (2**layer_idx)),
-                      depth=config.depths[layer_idx],
-                      num_heads=config.num_heads[layer_idx],
-                      drop_path=dpr[sum(config.depths[:layer_idx]
-                                        ):sum(config.depths[:layer_idx + 1])],
-                      downsample=SwinPatchMerging if
-                      (layer_idx < self.num_layers - 1) else None,
-                      quant_config=quant_config,
-                      prefix=f"{prefix}.layers.{layer_idx}")
-            for layer_idx in range(self.num_layers)
-        ])
+        self.layers = nn.ModuleList(
+            [
+                SwinStage(
+                    config=config,
+                    dim=int(config.embed_dim * 2**layer_idx),
+                    input_resolution=(
+                        grid_size[0] // (2**layer_idx),
+                        grid_size[1] // (2**layer_idx),
+                    ),
+                    depth=config.depths[layer_idx],
+                    num_heads=config.num_heads[layer_idx],
+                    drop_path=dpr[
+                        sum(config.depths[:layer_idx]) : sum(
+                            config.depths[: layer_idx + 1]
+                        )
+                    ],
+                    downsample=SwinPatchMerging
+                    if (layer_idx < self.num_layers - 1)
+                    else None,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}.layers.{layer_idx}",
+                )
+                for layer_idx in range(self.num_layers)
+            ]
+        )
 
     def forward(
         self,
@@ -396,9 +433,13 @@ def forward(
         for i, layer_module in enumerate(self.layers):
             layer_head_mask = head_mask[i] if head_mask is not None else None
 
-            layer_outputs = layer_module(hidden_states, input_dimensions,
-                                         layer_head_mask, output_attentions,
-                                         always_partition)
+            layer_outputs = layer_module(
+                hidden_states,
+                input_dimensions,
+                layer_head_mask,
+                output_attentions,
+                always_partition,
+            )
 
             hidden_states = layer_outputs[0]
             output_dimensions = layer_outputs[2]
@@ -420,13 +461,15 @@ def __init__(
         super().__init__()
         self.config = config
         self.num_layers = len(config.depths)
-        self.num_features = int(config.embed_dim * 2**(self.num_layers - 1))
+        self.num_features = int(config.embed_dim * 2 ** (self.num_layers - 1))
 
         self.embeddings = SwinEmbeddings(config)
-        self.encoder = SwinEncoder(config,
-                                   self.embeddings.patch_grid,
-                                   quant_config=quant_config,
-                                   prefix=f"{prefix}.encoder")
+        self.encoder = SwinEncoder(
+            config,
+            self.embeddings.patch_grid,
+            quant_config=quant_config,
+            prefix=f"{prefix}.encoder",
+        )
 
     def forward(
         self,
@@ -445,8 +488,7 @@ def forward(
 
         return encoder_outputs
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             ("qkv", "query", "q"),
             ("qkv", "key", "k"),
@@ -456,8 +498,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         loaded_params: set[str] = set()
 
         for name, loaded_weight in weights:
-
-            for (param_name, weight_name, shard_id) in stacked_params_mapping:
+            for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in name:
                     continue
                 name = name.replace(weight_name, param_name)
@@ -468,8 +509,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 break
             else:
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
diff --git a/vllm/model_executor/models/tarsier.py b/vllm/model_executor/models/tarsier.py
index 8759c4ea4a64..73f1e79fd62d 100644
--- a/vllm/model_executor/models/tarsier.py
+++ b/vllm/model_executor/models/tarsier.py
@@ -3,14 +3,17 @@
 
 import math
 from collections.abc import Iterable, Mapping, Sequence
-from typing import (Annotated, Final, Literal, Optional, Protocol, TypeVar,
-                    Union)
+from typing import Annotated, Final, Literal, Optional, Protocol, TypeVar, Union
 
 import torch
 import torch.nn as nn
-from transformers import BatchFeature, CLIPVisionConfig
+from transformers import (
+    BatchFeature,
+    CLIPVisionConfig,
+    PretrainedConfig,
+    SiglipVisionConfig,
+)
 from transformers import LlavaConfig as HfLlavaConfig
-from transformers import PretrainedConfig, SiglipVisionConfig
 from transformers.image_utils import ImageInput, get_image_size, to_numpy_array
 from transformers.models.llava import LlavaProcessor
 from transformers.processing_utils import ProcessingKwargs, Unpack
@@ -18,19 +21,25 @@
 
 from vllm.config import VllmConfig
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import ColumnParallelLinear, RowParallelLinear
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.models.llava import LlavaDummyInputsBuilder
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.cache import BaseMultiModalProcessorCache
 from vllm.multimodal.inputs import MultiModalFieldConfig, MultiModalKwargsItems
-from vllm.multimodal.parse import (ImageEmbeddingItems, ImageProcessorItems,
-                                   ImageSize, MultiModalDataItems)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo,
-                                        InputProcessingContext,
-                                        PromptReplacement, PromptUpdate)
+from vllm.multimodal.parse import (
+    ImageEmbeddingItems,
+    ImageProcessorItems,
+    ImageSize,
+    MultiModalDataItems,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    InputProcessingContext,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
@@ -38,10 +47,17 @@
 from .clip import CLIPVisionModel
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsPP
 from .siglip import SiglipVisionModel
-from .utils import (AutoWeightsLoader, flatten_bn, init_vllm_registered_model,
-                    maybe_prefix)
-from .vision import (VisionEncoderInfo, get_num_selected_vision_tokens,
-                     get_vision_encoder_info)
+from .utils import (
+    AutoWeightsLoader,
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
+from .vision import (
+    VisionEncoderInfo,
+    get_num_selected_vision_tokens,
+    get_vision_encoder_info,
+)
 
 
 class TarsierImagePixelInputs(TensorSchema):
@@ -52,6 +68,7 @@ class TarsierImagePixelInputs(TensorSchema):
         - h: Height
         - w: Width
     """
+
     type: Literal["pixel_values"] = "pixel_values"
     pixel_values: Annotated[torch.Tensor, TensorShape("bn", 3, "h", "w")]
 
@@ -64,12 +81,12 @@ class TarsierImageEmbeddingInputs(TensorSchema):
         - hs: Hidden size (must match the hidden size of language model
           backbone)
     """
+
     type: Literal["image_embeds"] = "image_embeds"
     data: Annotated[torch.Tensor, TensorShape("bn", "ifs", "hs")]
 
 
-TarsierImageInputs = Union[TarsierImagePixelInputs,
-                           TarsierImageEmbeddingInputs]
+TarsierImageInputs = Union[TarsierImagePixelInputs, TarsierImageEmbeddingInputs]
 
 
 class TarsierHfConfig(Protocol):  # Based on the Tarsier's LlavaConfig
@@ -94,19 +111,18 @@ class TarsierProcessorKwargs(ProcessingKwargs, total=False):
 
 
 class TarsierProcessor(LlavaProcessor):
-
     def __call__(
         self,
         images: ImageInput = None,
-        text: Union[TextInput, PreTokenizedInput, list[TextInput],
-                    list[PreTokenizedInput]] = None,
+        text: Union[
+            TextInput, PreTokenizedInput, list[TextInput], list[PreTokenizedInput]
+        ] = None,
         audio=None,
         videos=None,
         **kwargs: Unpack[TarsierProcessorKwargs],
     ) -> BatchFeature:
         if images is None and text is None:
-            raise ValueError(
-                "You have to specify at least one of `images` or `text`.")
+            raise ValueError("You have to specify at least one of `images` or `text`.")
 
         output_kwargs = self._merge_kwargs(
             TarsierProcessorKwargs,
@@ -115,15 +131,17 @@ def __call__(
         )
         if images is not None:
             image_inputs = self.image_processor(
-                images, **output_kwargs["images_kwargs"])
+                images, **output_kwargs["images_kwargs"]
+            )
         else:
             image_inputs = {}
 
         if isinstance(text, str):
             text = [text]
         elif not isinstance(text, list) and not isinstance(text[0], str):
-            raise ValueError("Invalid input text. Please provide a string,"
-                             " or a list of strings")
+            raise ValueError(
+                "Invalid input text. Please provide a string, or a list of strings"
+            )
 
         # try to expand inputs in processing if we have the necessary parts
         prompt_strings = text
@@ -131,51 +149,55 @@ def __call__(
             # Replace the image token with the expanded image token sequence
             pixel_values = image_inputs["pixel_values"]
             height, width = get_image_size(to_numpy_array(pixel_values[0]))
-            num_image_tokens = (height // self.patch_size) * (
-                width // self.patch_size +
-                1) + self.num_additional_image_tokens + 1
+            num_image_tokens = (
+                (height // self.patch_size) * (width // self.patch_size + 1)
+                + self.num_additional_image_tokens
+                + 1
+            )
             if self.vision_feature_select_strategy == "default":
                 num_image_tokens -= 1
 
             prompt_strings = []
             for sample in text:
-                sample = sample.replace(self.image_token,
-                                        self.image_token * num_image_tokens)
+                sample = sample.replace(
+                    self.image_token, self.image_token * num_image_tokens
+                )
                 prompt_strings.append(sample)
 
-        return_tensors = output_kwargs["text_kwargs"].pop(
-            "return_tensors", None)
-        text_inputs = self.tokenizer(prompt_strings,
-                                     **output_kwargs["text_kwargs"])
-        return BatchFeature(data={
-            **text_inputs,
-            **image_inputs
-        },
-                            tensor_type=return_tensors)
+        return_tensors = output_kwargs["text_kwargs"].pop("return_tensors", None)
+        text_inputs = self.tokenizer(prompt_strings, **output_kwargs["text_kwargs"])
+        return BatchFeature(
+            data={**text_inputs, **image_inputs}, tensor_type=return_tensors
+        )
 
 
 class TarsierMultiModalProjector(nn.Module):
-
-    def __init__(self,
-                 vision_hidden_size: int,
-                 text_hidden_size: int,
-                 projector_hidden_act: str,
-                 multimodal_projector_bias: bool,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = ""):
+    def __init__(
+        self,
+        vision_hidden_size: int,
+        text_hidden_size: int,
+        projector_hidden_act: str,
+        multimodal_projector_bias: bool,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ):
         super().__init__()
 
-        self.linear_1 = ColumnParallelLinear(vision_hidden_size,
-                                             text_hidden_size,
-                                             bias=multimodal_projector_bias,
-                                             quant_config=quant_config,
-                                             prefix=f"{prefix}.linear_1")
+        self.linear_1 = ColumnParallelLinear(
+            vision_hidden_size,
+            text_hidden_size,
+            bias=multimodal_projector_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.linear_1",
+        )
         self.act = get_act_fn(projector_hidden_act)
-        self.linear_2 = RowParallelLinear(text_hidden_size,
-                                          text_hidden_size,
-                                          bias=multimodal_projector_bias,
-                                          quant_config=quant_config,
-                                          prefix=f"{prefix}.linear_2")
+        self.linear_2 = RowParallelLinear(
+            text_hidden_size,
+            text_hidden_size,
+            bias=multimodal_projector_bias,
+            quant_config=quant_config,
+            prefix=f"{prefix}.linear_2",
+        )
 
     def forward(self, image_features: torch.Tensor) -> torch.Tensor:
         hidden_states, _ = self.linear_1(image_features)
@@ -185,7 +207,6 @@ def forward(self, image_features: torch.Tensor) -> torch.Tensor:
 
 
 class TarsierProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self) -> TarsierHfConfig:
         return self.ctx.get_hf_config(HfLlavaConfig)
 
@@ -227,12 +248,10 @@ def get_num_image_tokens(
                 hf_config.vision_feature_select_strategy,
             )
             if num_projected_patches_default <= 0:
-                raise ValueError(
-                    "Could not determine a valid number of image patches.")
+                raise ValueError("Could not determine a valid number of image patches.")
             num_projected_patches = num_projected_patches_default
         num_height_patches = int(math.sqrt(num_projected_patches))
-        total_image_tokens_for_llm = num_projected_patches \
-            + num_height_patches + 1
+        total_image_tokens_for_llm = num_projected_patches + num_height_patches + 1
         return total_image_tokens_for_llm
 
     def get_image_size_with_most_features(self) -> ImageSize:
@@ -258,12 +277,10 @@ def get_image_new_idx(self) -> int:
 
 
 class TarsierDummyInputsBuilder(LlavaDummyInputsBuilder[_I_Tarsier]):
-
     pass
 
 
 class TarsierMultiModalProcessor(BaseMultiModalProcessor[_I_Tarsier]):
-
     def _get_mm_fields_config(
         self,
         hf_inputs: BatchFeature,
@@ -285,14 +302,14 @@ def _get_prompt_updates(
 
         def get_replacement(item_idx: int):
             images = mm_items.get_items(
-                "image", (ImageEmbeddingItems, ImageProcessorItems))
+                "image", (ImageEmbeddingItems, ImageProcessorItems)
+            )
 
             if isinstance(images, ImageEmbeddingItems):
                 num_projected_patches = images.get_feature_size(item_idx)
                 # This assumes num_projected_patches is a perfect square
                 num_height_patches = int(math.sqrt(num_projected_patches))
-                num_final_image_tokens = num_projected_patches \
-                + num_height_patches + 1
+                num_final_image_tokens = num_projected_patches + num_height_patches + 1
             else:
                 image_size = images.get_image_size(item_idx)
                 num_final_image_tokens = self.info.get_num_image_tokens(
@@ -311,8 +328,7 @@ def get_replacement(item_idx: int):
         ]
 
 
-def _build_tarsier_hf_info(
-        ctx: InputProcessingContext) -> TarsierProcessingInfo:
+def _build_tarsier_hf_info(ctx: InputProcessingContext) -> TarsierProcessingInfo:
     return TarsierProcessingInfo(ctx)
 
 
@@ -343,22 +359,23 @@ def init_vision_tower_for_tarsier(
     feature_layers = hf_config.vision_feature_layer
     base_num_hidden_layers = vision_config.num_hidden_layers
 
-    def _get_layer_index(feature_layer_index: int,
-                         num_hidden_layers_total: int) -> int:
+    def _get_layer_index(feature_layer_index: int, num_hidden_layers_total: int) -> int:
         if feature_layer_index < 0:
             return num_hidden_layers_total + feature_layer_index + 1
         return feature_layer_index
 
     if isinstance(feature_layers, int):
-        num_hidden_layers_to_init = _get_layer_index(feature_layers,
-                                                     base_num_hidden_layers)
+        num_hidden_layers_to_init = _get_layer_index(
+            feature_layers, base_num_hidden_layers
+        )
     elif isinstance(feature_layers, (list, tuple)):
         num_hidden_layers_to_init = max(
-            _get_layer_index(idx, base_num_hidden_layers)
-            for idx in feature_layers)
+            _get_layer_index(idx, base_num_hidden_layers) for idx in feature_layers
+        )
     else:
-        raise TypeError(f"vision_layer_feature type: {type(feature_layers)}"
-                        " is not supported")
+        raise TypeError(
+            f"vision_layer_feature type: {type(feature_layers)} is not supported"
+        )
 
     if isinstance(vision_config, CLIPVisionConfig):
         return CLIPVisionModel(
@@ -381,14 +398,15 @@ def _get_layer_index(feature_layer_index: int,
     raise NotImplementedError(msg)
 
 
-@MULTIMODAL_REGISTRY.register_processor(_build_tarsier_hf_processor,
-                                        info=_build_tarsier_hf_info,
-                                        dummy_inputs=TarsierDummyInputsBuilder)
-class TarsierForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                      SupportsPP):
+@MULTIMODAL_REGISTRY.register_processor(
+    _build_tarsier_hf_processor,
+    info=_build_tarsier_hf_info,
+    dummy_inputs=TarsierDummyInputsBuilder,
+)
+class TarsierForConditionalGeneration(nn.Module, SupportsMultiModal, SupportsPP):
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
-        "gate_up_proj": ["gate_proj", "up_proj"]
+        "gate_up_proj": ["gate_proj", "up_proj"],
     }
 
     @classmethod
@@ -407,7 +425,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
             config,
             quant_config,
             require_post_norm=False,
-            prefix=maybe_prefix(prefix, "vision_tower"))
+            prefix=maybe_prefix(prefix, "vision_tower"),
+        )
         projector_bias = getattr(config, "multimodal_projector_bias", True)
 
         self.multi_modal_projector = TarsierMultiModalProjector(
@@ -416,27 +435,31 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
             projector_hidden_act=config.projector_hidden_act,
             multimodal_projector_bias=projector_bias,
             quant_config=quant_config,
-            prefix=maybe_prefix(prefix, "multi_modal_projector"))
+            prefix=maybe_prefix(prefix, "multi_modal_projector"),
+        )
         self.language_model = init_vllm_registered_model(
             vllm_config=vllm_config,
-            hf_config=config.
-            text_config,  # Use text_config from Tarsier's main config
+            hf_config=config.text_config,  # Use text_config from Tarsier's main config
             prefix=maybe_prefix(prefix, "language_model"),
         )
-        self.register_buffer('image_newline_idx_tensor',
-                             torch.tensor([config.image_newline_idx],
-                                          dtype=torch.long),
-                             persistent=False)
-        self.register_buffer('image_new_idx_tensor',
-                             torch.tensor([config.image_new_idx],
-                                          dtype=torch.long),
-                             persistent=False)
+        self.register_buffer(
+            "image_newline_idx_tensor",
+            torch.tensor([config.image_newline_idx], dtype=torch.long),
+            persistent=False,
+        )
+        self.register_buffer(
+            "image_new_idx_tensor",
+            torch.tensor([config.image_new_idx], dtype=torch.long),
+            persistent=False,
+        )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def _parse_and_validate_image_input(
-            self, **kwargs: object) -> Optional[TarsierImageInputs]:
+        self, **kwargs: object
+    ) -> Optional[TarsierImageInputs]:
         pixel_values = kwargs.pop("pixel_values", None)
         image_embeds = kwargs.pop("image_embeds", None)
 
@@ -445,8 +468,9 @@ def _parse_and_validate_image_input(
 
         if pixel_values is not None:
             if not isinstance(pixel_values, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of pixel values. "
-                                 f"Got type: {type(pixel_values)}")
+                raise ValueError(
+                    f"Incorrect type of pixel values. Got type: {type(pixel_values)}"
+                )
 
             return TarsierImagePixelInputs(
                 type="pixel_values",
@@ -455,8 +479,10 @@ def _parse_and_validate_image_input(
 
         if image_embeds is not None:
             if not isinstance(image_embeds, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of image embeddings. "
-                                 f"Got type: {type(image_embeds)}")
+                raise ValueError(
+                    "Incorrect type of image embeddings. "
+                    f"Got type: {type(image_embeds)}"
+                )
             return TarsierImageEmbeddingInputs(
                 type="image_embeds",
                 data=flatten_bn(image_embeds, concat=True),
@@ -476,23 +502,24 @@ def _image_pixels_to_features(
         )
 
     def _add_tarsier_split_tokens(
-            self, projected_image_features: torch.Tensor) -> torch.Tensor:
+        self, projected_image_features: torch.Tensor
+    ) -> torch.Tensor:
         """
         Implements Tarsier's `add_split_tokens` logic.
         """
-        num_images, num_projected_patches, embed_dim = \
-            projected_image_features.shape
+        num_images, num_projected_patches, embed_dim = projected_image_features.shape
         num_height_patches = int(math.sqrt(num_projected_patches))
         num_width_patches = num_projected_patches // num_height_patches
         device = projected_image_features.device
         embedding_layer = self.language_model.model.embed_tokens
         image_newline_emb = embedding_layer(
-            self.image_newline_idx_tensor.to(device)).squeeze(0)
-        image_new_emb = embedding_layer(
-            self.image_new_idx_tensor.to(device)).squeeze(0)
+            self.image_newline_idx_tensor.to(device)
+        ).squeeze(0)
+        image_new_emb = embedding_layer(self.image_new_idx_tensor.to(device)).squeeze(0)
         try:
             current_image_features_grid = projected_image_features.view(
-                num_images, num_height_patches, num_width_patches, embed_dim)
+                num_images, num_height_patches, num_width_patches, embed_dim
+            )
         except RuntimeError as e:
             raise RuntimeError(
                 "Cannot reshape projected_image_features"
@@ -502,22 +529,24 @@ def _add_tarsier_split_tokens(
                 "Ensure num_projected_patches is compatible"
                 " with a grid structure. "
                 f"num_projected_patches={num_projected_patches}, "
-                f"derived num_height_patches={num_height_patches}. ") from e
+                f"derived num_height_patches={num_height_patches}. "
+            ) from e
 
         image_newline_expanded = image_newline_emb.expand(
-            (num_images, num_height_patches, 1, embed_dim))
+            (num_images, num_height_patches, 1, embed_dim)
+        )
         features_with_newlines = torch.cat(
             [current_image_features_grid, image_newline_expanded],
-            dim=2  # Concatenate along width dim
+            dim=2,  # Concatenate along width dim
         )
-        new_num_patches_after_newline = num_projected_patches \
-            + num_height_patches
+        new_num_patches_after_newline = num_projected_patches + num_height_patches
         features_with_newlines_flat = features_with_newlines.view(
-            num_images, new_num_patches_after_newline, embed_dim)
+            num_images, new_num_patches_after_newline, embed_dim
+        )
         image_new_expanded = image_new_emb.expand((num_images, 1, embed_dim))
         final_image_features = torch.cat(
             [features_with_newlines_flat, image_new_expanded],
-            dim=1  # Concatenate along patch sequence dim
+            dim=1,  # Concatenate along patch sequence dim
         )
         return final_image_features
 
@@ -528,16 +557,17 @@ def _process_image_pixels(
         assert self.vision_tower is not None
         pixel_values = inputs["pixel_values"]
         image_features_selected = self._image_pixels_to_features(
-            self.vision_tower, pixel_values)  # type: ignore
+            self.vision_tower, pixel_values
+        )  # type: ignore
         if isinstance(image_features_selected, torch.Tensor):
-            projected_features = self.multi_modal_projector(
-                image_features_selected)
+            projected_features = self.multi_modal_projector(image_features_selected)
             final_features = self._add_tarsier_split_tokens(projected_features)
             return final_features
         else:
             raise TypeError(
                 f"_image_pixels_to_features type:"
-                f" {type(image_features_selected)} is not supported")
+                f" {type(image_features_selected)} is not supported"
+            )
 
     def _process_image_input(
         self,
@@ -548,16 +578,17 @@ def _process_image_input(
             if isinstance(projected_features, torch.Tensor):
                 return self._add_tarsier_split_tokens(projected_features)
             else:
-                raise ValueError("Incorrect type of image_embeds. "
-                                 f"Got type: {type(projected_features)}. ")
+                raise ValueError(
+                    "Incorrect type of image_embeds. "
+                    f"Got type: {type(projected_features)}. "
+                )
         assert self.vision_tower is not None
         return self._process_image_pixels(image_input)
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         image_input = self._parse_and_validate_image_input(**kwargs)
         if image_input is None:
             return []
@@ -585,7 +616,8 @@ def forward(
             input_ids=input_ids,
             positions=positions,
             intermediate_tensors=intermediate_tensors,
-            inputs_embeds=inputs_embeds)
+            inputs_embeds=inputs_embeds,
+        )
         return hidden_states
 
     def compute_logits(
@@ -594,7 +626,6 @@ def compute_logits(
     ) -> Optional[torch.Tensor]:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights)
diff --git a/vllm/model_executor/models/telechat2.py b/vllm/model_executor/models/telechat2.py
index 49a7677151a9..113581d55ff5 100644
--- a/vllm/model_executor/models/telechat2.py
+++ b/vllm/model_executor/models/telechat2.py
@@ -30,12 +30,15 @@
 from vllm.model_executor.models.llama import LlamaForCausalLM, LlamaModel
 
 from .llama import LlamaDecoderLayer
-from .utils import (AutoWeightsLoader, PPMissingLayer, WeightsMapper,
-                    is_pp_missing_parameter)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    WeightsMapper,
+    is_pp_missing_parameter,
+)
 
 
 class TeleChat2Model(LlamaModel):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         hf_config = vllm_config.model_config.hf_config
 
@@ -43,7 +46,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             "num_hidden_layers": "n_layer",
             "num_attention_heads": "n_head",
             "intermediate_size": "ffn_hidden_size",
-            "rms_norm_eps": "layer_norm_epsilon"
+            "rms_norm_eps": "layer_norm_epsilon",
         }
         vllm_config.model_config.hf_config.hidden_act = "silu"
 
@@ -62,11 +65,10 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                 layer.mlp.gate_up_proj.bias = None
                 layer.mlp.gate_up_proj.skip_bias_add = True
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
-            ('gate_up_proj', 'gate_proj', 0),
-            ('gate_up_proj', 'up_proj', 1),
+            ("gate_up_proj", "gate_proj", 0),
+            ("gate_up_proj", "up_proj", 1),
         ]
         params_dict = dict(self.named_parameters())
         loaded_params: set[str] = set()
@@ -78,9 +80,10 @@ def load_weights(self, weights: Iterable[tuple[str,
                 v_weight = []
                 for i in range(total_num_heads):
                     start = i * head_dim * 2
-                    k_weight.append(loaded_weight[start:start + head_dim, :])
-                    v_weight.append(loaded_weight[start + head_dim:start +
-                                                  2 * head_dim:])
+                    k_weight.append(loaded_weight[start : start + head_dim, :])
+                    v_weight.append(
+                        loaded_weight[start + head_dim : start + 2 * head_dim :]
+                    )
                 k_weight = torch.cat(k_weight, dim=0)
                 v_weight = torch.cat(v_weight, dim=0)
                 name = name.replace("key_value", "qkv_proj")
@@ -112,15 +115,15 @@ def load_weights(self, weights: Iterable[tuple[str,
                     if is_pp_missing_parameter(name, self):
                         continue
                     param = params_dict[name]
-                    weight_loader = getattr(param, "weight_loader",
-                                            default_weight_loader)
+                    weight_loader = getattr(
+                        param, "weight_loader", default_weight_loader
+                    )
                     weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class TeleChat2ForCausalLM(LlamaForCausalLM):
-
     hf_to_vllm_mapper = WeightsMapper(
         orig_to_new_prefix={
             "transformer.": "model.",
@@ -134,18 +137,17 @@ class TeleChat2ForCausalLM(LlamaForCausalLM):
         },
     )
 
-    def _init_model(self,
-                    vllm_config: VllmConfig,
-                    prefix: str = "",
-                    layer_type: type[nn.Module] = LlamaDecoderLayer):
+    def _init_model(
+        self,
+        vllm_config: VllmConfig,
+        prefix: str = "",
+        layer_type: type[nn.Module] = LlamaDecoderLayer,
+    ):
         return TeleChat2Model(vllm_config=vllm_config, prefix=prefix)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(
             self,
-            skip_prefixes=(["lm_head."]
-                           if self.config.tie_word_embeddings else None),
+            skip_prefixes=(["lm_head."] if self.config.tie_word_embeddings else None),
         )
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
diff --git a/vllm/model_executor/models/teleflm.py b/vllm/model_executor/models/teleflm.py
index 3666f7011a99..4dfeddb0b28e 100644
--- a/vllm/model_executor/models/teleflm.py
+++ b/vllm/model_executor/models/teleflm.py
@@ -28,12 +28,14 @@
 
 from vllm.config import VllmConfig
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
-from vllm.model_executor.models.llama import (LlamaDecoderLayer,
-                                              LlamaForCausalLM, LlamaModel)
+from vllm.model_executor.models.llama import (
+    LlamaDecoderLayer,
+    LlamaForCausalLM,
+    LlamaModel,
+)
 
 
 class TeleFLMModel(LlamaModel):
-
     def __init__(
         self,
         *,
@@ -41,9 +43,7 @@ def __init__(
         prefix: str = "",
         layer_type: type[nn.Module] = LlamaDecoderLayer,
     ):
-        super().__init__(vllm_config=vllm_config,
-                         prefix=prefix,
-                         layer_type=layer_type)
+        super().__init__(vllm_config=vllm_config, prefix=prefix, layer_type=layer_type)
         """
         This implementation is based on the µScaling paper presented at  
         the ICLR 2025 Workshop:  
@@ -65,7 +65,6 @@ def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
 
 
 class TeleFLMForCausalLM(LlamaForCausalLM):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(vllm_config=vllm_config, prefix=prefix)
         # mup
@@ -74,6 +73,6 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             self.mup_scale_factor = self.config.mup_scale_factor
             self.output_mult = self.config.output_mult / self.mup_scale_factor
             logit_scale = self.output_mult
-            self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                    self.config.vocab_size,
-                                                    logit_scale)
+            self.logits_processor = LogitsProcessor(
+                self.unpadded_vocab_size, self.config.vocab_size, logit_scale
+            )
diff --git a/vllm/model_executor/models/terratorch.py b/vllm/model_executor/models/terratorch.py
index cc71adbebd33..c7c82e9e10d1 100644
--- a/vllm/model_executor/models/terratorch.py
+++ b/vllm/model_executor/models/terratorch.py
@@ -23,8 +23,12 @@
 
 import torch
 import torch.nn as nn
-from terratorch.vllm import (DummyDataGenerator, InferenceRunner,
-                             InputDefinition, InputTypeEnum)
+from terratorch.vllm import (
+    DummyDataGenerator,
+    InferenceRunner,
+    InputDefinition,
+    InputTypeEnum,
+)
 from transformers import BatchFeature
 
 from vllm.config import VllmConfig
@@ -35,19 +39,31 @@
 from vllm.model_executor.models.utils import AutoWeightsLoader
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.cache import MultiModalProcessorOnlyCache
-from vllm.multimodal.inputs import (ImageItem, ModalityData,
-                                    MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalInputs, MultiModalKwargsItems,
-                                    MultiModalUUIDDict, PlaceholderRange)
-from vllm.multimodal.parse import (DictEmbeddingItems, ModalityDataItems,
-                                   MultiModalDataItems, MultiModalDataParser)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptUpdate)
+from vllm.multimodal.inputs import (
+    ImageItem,
+    ModalityData,
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalInputs,
+    MultiModalKwargsItems,
+    MultiModalUUIDDict,
+    PlaceholderRange,
+)
+from vllm.multimodal.parse import (
+    DictEmbeddingItems,
+    ModalityDataItems,
+    MultiModalDataItems,
+    MultiModalDataParser,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 
-from .interfaces import (IsAttentionFree, MultiModalEmbeddings,
-                         SupportsMultiModal)
+from .interfaces import IsAttentionFree, MultiModalEmbeddings, SupportsMultiModal
 from .interfaces_base import default_pooling_type
 
 logger = init_logger(__name__)
@@ -59,12 +75,11 @@ def _terratorch_field_names(pretrained_cfg: dict):
 
 
 def _terratorch_field_factory(
-    pretrained_cfg: dict
+    pretrained_cfg: dict,
 ) -> Callable[
     [Mapping[str, torch.Tensor]],
-        Mapping[str, MultiModalFieldConfig],
+    Mapping[str, MultiModalFieldConfig],
 ]:
-
     def _terratorch_field_config(hf_inputs: Mapping[str, torch.Tensor]):
         input_definition = InputDefinition(**pretrained_cfg["input"])
         fields = {}
@@ -75,24 +90,24 @@ def _terratorch_field_config(hf_inputs: Mapping[str, torch.Tensor]):
         mm_fields_config = {}
         for field_name, field_modality in fields.items():
             mm_fields_config[field_name] = MultiModalFieldConfig.shared(
-                batch_size=1, modality=field_modality)
+                batch_size=1, modality=field_modality
+            )
         return mm_fields_config
 
     return _terratorch_field_config
 
 
 class TerratorchProcessingInfo(BaseProcessingInfo):
-
     def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
         return {"image": None}
 
 
 class TerratorchInputBuilder(BaseDummyInputsBuilder[TerratorchProcessingInfo]):
-
     def __init__(self, info: TerratorchProcessingInfo):
         super().__init__(info)
         self.dummy_data_generator = DummyDataGenerator(
-            self.info.get_hf_config().to_dict()["pretrained_cfg"])
+            self.info.get_hf_config().to_dict()["pretrained_cfg"]
+        )
 
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         return ""
@@ -107,15 +122,16 @@ def get_dummy_mm_data(
         # defined in the HF configuration file
 
         if mm_options:
-            logger.warning("Configurable multimodal profiling "
-                           "options are not supported for Terratorch. "
-                           "They are ignored for now.")
+            logger.warning(
+                "Configurable multimodal profiling "
+                "options are not supported for Terratorch. "
+                "They are ignored for now."
+            )
 
         return self.dummy_data_generator.get_dummy_mm_data()
 
 
 class TerratorchMultiModalDataParser(MultiModalDataParser):
-
     def __init__(self, pretrained_cfg: dict, *args, **kwargs):
         self._pretrained_cfg = pretrained_cfg
         super().__init__(*args, **kwargs)
@@ -125,7 +141,6 @@ def _parse_image_data(
         data: Union[dict[str, torch.Tensor], ModalityData[ImageItem]],
     ) -> Optional[ModalityDataItems[Any, Any]]:
         if isinstance(data, dict):
-
             terratorch_fields = _terratorch_field_names(self._pretrained_cfg)
 
             return DictEmbeddingItems(
@@ -139,20 +154,18 @@ def _parse_image_data(
 
 
 class TerratorchMultiModalProcessor(BaseMultiModalProcessor):
-
     def __init__(
-            self,
-            info: TerratorchProcessingInfo,
-            dummy_inputs: "BaseDummyInputsBuilder[TerratorchProcessingInfo]",
-            *,
-            cache: Optional[MultiModalProcessorOnlyCache] = None) -> None:
-
+        self,
+        info: TerratorchProcessingInfo,
+        dummy_inputs: "BaseDummyInputsBuilder[TerratorchProcessingInfo]",
+        *,
+        cache: Optional[MultiModalProcessorOnlyCache] = None,
+    ) -> None:
         self.pretrained_cfg = info.get_hf_config().to_dict()["pretrained_cfg"]
         super().__init__(info=info, dummy_inputs=dummy_inputs, cache=cache)
 
     def _get_data_parser(self) -> MultiModalDataParser:
-        return TerratorchMultiModalDataParser(
-            pretrained_cfg=self.pretrained_cfg)
+        return TerratorchMultiModalDataParser(pretrained_cfg=self.pretrained_cfg)
 
     def _get_mm_fields_config(
         self,
@@ -185,18 +198,16 @@ def apply(
 
         mm_items = self._to_mm_items(mm_data)
         tokenization_kwargs = tokenization_kwargs or {}
-        mm_hashes = self._hash_mm_items(mm_items,
-                                        hf_processor_mm_kwargs,
-                                        tokenization_kwargs,
-                                        mm_uuids=mm_uuids)
+        mm_hashes = self._hash_mm_items(
+            mm_items, hf_processor_mm_kwargs, tokenization_kwargs, mm_uuids=mm_uuids
+        )
         mm_placeholders = {"image": [PlaceholderRange(offset=0, length=0)]}
 
         mm_processed_data = BatchFeature(image_data)
 
         mm_kwargs = MultiModalKwargsItems.from_hf_inputs(
             mm_processed_data,
-            self._get_mm_fields_config(mm_processed_data,
-                                       hf_processor_mm_kwargs),
+            self._get_mm_fields_config(mm_processed_data, hf_processor_mm_kwargs),
         )
 
         return MultiModalInputs(
@@ -237,7 +248,8 @@ def __init__(self, vllm_config: VllmConfig, prefix: str = ""):
         assert pooler_config is not None
 
         self.pooler = DispatchPooler(
-            {"encode": Pooler.for_encode(pooler_config)}, )
+            {"encode": Pooler.for_encode(pooler_config)},
+        )
 
     def get_input_embeddings(
         self,
@@ -265,8 +277,7 @@ def forward(
 
         return model_output.output
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         params_list = []
         model_buffers = dict(self.named_buffers())
         loaded_buffers = []
@@ -289,8 +300,9 @@ def load_weights(self, weights: Iterable[tuple[str,
                             if "_timm_module." in name:
                                 name = name.replace("_timm_module.", "")
                             buffer = model_buffers[name]
-                            weight_loader = getattr(buffer, "weight_loader",
-                                                    default_weight_loader)
+                            weight_loader = getattr(
+                                buffer, "weight_loader", default_weight_loader
+                            )
                             weight_loader(buffer, weight)
                             loaded_buffers.append(name)
                         else:
diff --git a/vllm/model_executor/models/transformers.py b/vllm/model_executor/models/transformers.py
index 99114a39295a..a5f40e4fce28 100644
--- a/vllm/model_executor/models/transformers.py
+++ b/vllm/model_executor/models/transformers.py
@@ -15,6 +15,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Wrapper around `transformers` models"""
+
 from collections.abc import Iterable, Mapping
 from contextlib import contextmanager
 from pathlib import Path
@@ -25,42 +26,63 @@
 import transformers
 from packaging.version import Version
 from torch import nn
-from transformers import (AutoModel, BatchFeature, PretrainedConfig,
-                          PreTrainedModel)
+from transformers import AutoModel, BatchFeature, PretrainedConfig, PreTrainedModel
 from transformers.modeling_utils import ALL_ATTENTION_FUNCTIONS
 
 from vllm.attention import Attention, AttentionType
 from vllm.compilation.decorators import support_torch_compile
-from vllm.config import (CacheConfig, DeviceConfig, ModelConfig,
-                         ParallelConfig, VllmConfig)
+from vllm.config import (
+    CacheConfig,
+    DeviceConfig,
+    ModelConfig,
+    ParallelConfig,
+    VllmConfig,
+)
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.config.utils import getattr_iter
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.distributed.utils import get_pp_indices
 from vllm.logger import init_logger
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    ParallelLMHead, VocabParallelEmbedding)
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.multimodal import MULTIMODAL_REGISTRY, MultiModalKwargsItems
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalInputs, MultiModalUUIDDict,
-                                    PlaceholderRange)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalInputs,
+    MultiModalUUIDDict,
+    PlaceholderRange,
+)
 from vllm.multimodal.parse import ImageProcessorItems, MultiModalDataItems
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo)
+from vllm.multimodal.processing import BaseMultiModalProcessor, BaseProcessingInfo
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP, SupportsQuant)
-from .utils import (AutoWeightsLoader, PPMissingLayer, WeightsMapper,
-                    flatten_bn, make_empty_intermediate_tensors_factory,
-                    maybe_prefix)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+    SupportsQuant,
+)
+from .utils import (
+    AutoWeightsLoader,
+    PPMissingLayer,
+    WeightsMapper,
+    flatten_bn,
+    make_empty_intermediate_tensors_factory,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
@@ -81,17 +103,18 @@ def get_feature_request_tip(
 
 
 def vllm_flash_attention_forward(
-        # Transformers args
-        module: torch.nn.Module,
-        query: torch.Tensor,
-        key: torch.Tensor,
-        value: torch.Tensor,
-        attention_mask: torch.Tensor,
-        # Transformers kwargs
-        scaling: Optional[float] = None,
-        # vLLM kwargs
-        attention_instances: Optional[dict[Attention]] = None,
-        **kwargs):
+    # Transformers args
+    module: torch.nn.Module,
+    query: torch.Tensor,
+    key: torch.Tensor,
+    value: torch.Tensor,
+    attention_mask: torch.Tensor,
+    # Transformers kwargs
+    scaling: Optional[float] = None,
+    # vLLM kwargs
+    attention_instances: Optional[dict[Attention]] = None,
+    **kwargs,
+):
     self_attn = attention_instances[module.layer_idx]
     if scaling is not None:
         self_attn.impl.scale = float(scaling)
@@ -125,8 +148,7 @@ def can_enable_torch_compile(vllm_config: VllmConfig) -> bool:
     return enable
 
 
-Style = Literal["colwise", "colwise_rep", "rowwise", "rowwise_rep",
-                "replicate"]
+Style = Literal["colwise", "colwise_rep", "rowwise", "rowwise_rep", "replicate"]
 
 
 def replace_linear_class(
@@ -148,18 +170,13 @@ def replace_linear_class(
     """
 
     if not isinstance(style, str):
-        raise ValueError(
-            f"Unsupported parallel style type {type(style)}, expected str")
+        raise ValueError(f"Unsupported parallel style type {type(style)}, expected str")
 
     vllm_linear_cls, vllm_linear_kwargs = {
         "colwise": (ColumnParallelLinear, {}),
-        "colwise_rep": (ColumnParallelLinear, {
-            "gather_output": True
-        }),
+        "colwise_rep": (ColumnParallelLinear, {"gather_output": True}),
         "rowwise": (RowParallelLinear, {}),
-        "rowwise_rep": (RowParallelLinear, {
-            "input_is_parallel": False
-        }),
+        "rowwise_rep": (RowParallelLinear, {"input_is_parallel": False}),
         "replicate": (ReplicatedLinear, {}),
     }.get(style, (ReplicatedLinear, {}))
 
@@ -187,7 +204,7 @@ def replace_rms_norm_class(rms_norm: nn.Module, hidden_size: int) -> RMSNorm:
     kwargs = {
         "hidden_size": hidden_size,
         "eps": getattr_iter(rms_norm, ("eps", "variance_epsilon"), 1e-6),
-        "has_weight": getattr(rms_norm, "with_scale", True)
+        "has_weight": getattr(rms_norm, "with_scale", True),
     }
     if (weight := getattr(rms_norm, "weight", None)) is not None:
         # If weight is a Parameter, get its data tensor
@@ -221,12 +238,12 @@ def register_empty_parameter(module, name, param):
             kwargs = module._parameters[name].__dict__
             kwargs["requires_grad"] = param.requires_grad
             module._parameters[name] = param_cls(
-                module._parameters[name].to(device), **kwargs)
+                module._parameters[name].to(device), **kwargs
+            )
 
     tensor_constructors_to_patch = {}
 
     def patch_tensor_constructor(fn):
-
         def wrapper(*args, **kwargs):
             kwargs["device"] = device
             return fn(*args, **kwargs)
@@ -237,18 +254,21 @@ def wrapper(*args, **kwargs):
         nn.Module.register_parameter = register_empty_parameter
         for torch_function_name in tensor_constructors_to_patch:
             setattr(
-                torch, torch_function_name,
-                patch_tensor_constructor(getattr(torch, torch_function_name)))
+                torch,
+                torch_function_name,
+                patch_tensor_constructor(getattr(torch, torch_function_name)),
+            )
         yield
     finally:
         nn.Module.register_parameter = old_register_parameter
-        for torch_function_name, old_torch_function in (
-                tensor_constructors_to_patch.items()):
+        for (
+            torch_function_name,
+            old_torch_function,
+        ) in tensor_constructors_to_patch.items():
             setattr(torch, torch_function_name, old_torch_function)
 
 
 class MultiModalProcessingInfo(BaseProcessingInfo):
-
     def get_supported_mm_limits(self):
         return {"image": None}
 
@@ -261,7 +281,8 @@ def get_max_image_tokens(self) -> int:
         multimodal_config = self.ctx.model_config.multimodal_config
         mm_processor_kwargs = multimodal_config.mm_processor_kwargs or {}
         mm_tokens = processor._get_num_multimodal_tokens(
-            image_sizes=([height, width], ), **mm_processor_kwargs)
+            image_sizes=([height, width],), **mm_processor_kwargs
+        )
         image_tokens = mm_tokens["num_image_tokens"][0]
         return image_tokens
 
@@ -269,9 +290,7 @@ def get_max_image_size(self):
         return 10_000, 10_000  # hardcode for arbitrary very large size
 
 
-class MultiModalDummyInputsBuilder(
-        BaseDummyInputsBuilder[MultiModalProcessingInfo]):
-
+class MultiModalDummyInputsBuilder(BaseDummyInputsBuilder[MultiModalProcessingInfo]):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_images = mm_counts.get("image", 0)
 
@@ -295,16 +314,16 @@ def get_dummy_mm_data(
         image_overrides = mm_options.get("image") if mm_options else None
 
         return {
-            "image":
-            self._get_dummy_images(width=target_width,
-                                   height=target_height,
-                                   num_images=num_images,
-                                   overrides=image_overrides),
+            "image": self._get_dummy_images(
+                width=target_width,
+                height=target_height,
+                num_images=num_images,
+                overrides=image_overrides,
+            ),
         }
 
 
 class MultiModalProcessor(BaseMultiModalProcessor[MultiModalProcessingInfo]):
-
     def _get_prompt_updates(
         self,
         mm_items: MultiModalDataItems,
@@ -335,12 +354,12 @@ def _get_mm_fields_config(
         # HF Processors always return a mask but vLLM doesn't need it
         hf_inputs.pop("attention_mask", None)
         mm_fields = {
-            key: MultiModalFieldConfig.flat_from_sizes("image",
-                                                       num_image_patches)
+            key: MultiModalFieldConfig.flat_from_sizes("image", num_image_patches)
             for key in hf_inputs
         }
         mm_fields["image_embeds"] = MultiModalFieldConfig.flat_from_sizes(
-            "image", num_image_patches)
+            "image", num_image_patches
+        )
         mm_fields["num_image_patches"] = MultiModalFieldConfig.batched("image")
         return mm_fields
 
@@ -368,11 +387,12 @@ def _apply_hf_processor_text_mm(
         )
         processed_data.update(passthrough_data)
 
-        prompt_ids, = processed_data.pop("input_ids").tolist()
-        mm_token_type_ids = processed_data.pop(
-            "mm_token_type_ids"
-        ) if "mm_token_type_ids" in processed_data else processed_data.pop(
-            "token_type_ids")  # for gemma3 only
+        (prompt_ids,) = processed_data.pop("input_ids").tolist()
+        mm_token_type_ids = (
+            processed_data.pop("mm_token_type_ids")
+            if "mm_token_type_ids" in processed_data
+            else processed_data.pop("token_type_ids")
+        )  # for gemma3 only
 
         return prompt_ids, processed_data, mm_token_type_ids
 
@@ -401,13 +421,14 @@ def apply(
             # into string
             prompt = hf_processor.decode(prompt)
 
-        (prompt_ids, processed_data,
-         mm_token_type_ids) = self._apply_hf_processor_text_mm(
-             prompt_text=prompt,
-             mm_items=mm_items,
-             hf_processor_mm_kwargs=hf_processor_mm_kwargs,
-             tokenization_kwargs=tokenization_kwargs,
-         )
+        (prompt_ids, processed_data, mm_token_type_ids) = (
+            self._apply_hf_processor_text_mm(
+                prompt_text=prompt,
+                mm_items=mm_items,
+                hf_processor_mm_kwargs=hf_processor_mm_kwargs,
+                tokenization_kwargs=tokenization_kwargs,
+            )
+        )
 
         # HF processor will return `mm_token_type_ids` from which
         # we can infer mm_placeholders. Until then hardcode to make code run
@@ -422,7 +443,8 @@ def apply(
             image_sizes.append((image_size.height, image_size.width))
 
         mm_tokens_per_modality = hf_processor._get_num_multimodal_tokens(
-            image_sizes=image_sizes, **mm_processor_kwargs)
+            image_sizes=image_sizes, **mm_processor_kwargs
+        )
 
         mm_placeholders = {}
         split_sizes = mm_tokens_per_modality["num_image_tokens"]
@@ -434,27 +456,29 @@ def apply(
                 PlaceholderRange(
                     offset=positions[0].item(),
                     length=positions.shape[0],
-                    is_embed=(mm_tokens == hf_processor.image_token_id).bool())
-                for positions, mm_tokens in zip(chunked_mm_positions,
-                                                chunked_mm_tokens)
+                    is_embed=(mm_tokens == hf_processor.image_token_id).bool(),
+                )
+                for positions, mm_tokens in zip(chunked_mm_positions, chunked_mm_tokens)
             ]
             mm_placeholders = {"image": ranges}
 
-        num_image_patches = torch.tensor(
-            mm_tokens_per_modality["num_image_patches"]
-        ) if "num_image_patches" in mm_tokens_per_modality else None
-        processed_data['num_image_patches'] = num_image_patches
+        num_image_patches = (
+            torch.tensor(mm_tokens_per_modality["num_image_patches"])
+            if "num_image_patches" in mm_tokens_per_modality
+            else None
+        )
+        processed_data["num_image_patches"] = num_image_patches
         mm_kwargs = MultiModalKwargsItems.from_hf_inputs(
             processed_data,
-            self._get_mm_fields_config(processed_data, hf_processor_mm_kwargs,
-                                       num_image_patches),
+            self._get_mm_fields_config(
+                processed_data, hf_processor_mm_kwargs, num_image_patches
+            ),
         )
 
         # Use overrides if provided; fallback to data-dependent hashing.
-        mm_hashes = self._hash_mm_items(mm_items,
-                                        hf_processor_mm_kwargs,
-                                        tokenization_kwargs,
-                                        mm_uuids=mm_uuids)
+        mm_hashes = self._hash_mm_items(
+            mm_items, hf_processor_mm_kwargs, tokenization_kwargs, mm_uuids=mm_uuids
+        )
 
         return MultiModalInputs(
             type="multimodal",
@@ -467,8 +491,7 @@ def apply(
 
 class TransformersBase(nn.Module, SupportsQuant, SupportsLoRA, SupportsPP):
     embedding_padding_modules = ["lm_head"]
-    embedding_modules = ["embed_tokens"
-                         ]  # TODO transformers will have a util to get it
+    embedding_modules = ["embed_tokens"]  # TODO transformers will have a util to get it
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
@@ -480,8 +503,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.device_config: DeviceConfig = vllm_config.device_config
         self.model_config: ModelConfig = vllm_config.model_config
         self.parallel_config: ParallelConfig = vllm_config.parallel_config
-        self.quant_config: Optional[
-            QuantizationConfig] = vllm_config.quant_config
+        self.quant_config: Optional[QuantizationConfig] = vllm_config.quant_config
 
         self.pp_group = get_pp_group()
         self.pp_size = self.pp_group.world_size
@@ -503,8 +525,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             quant_method_name = self.quant_config.get_name()
             # Check for unsupported quantization methods.
             if quant_method_name == "mxfp4":
-                raise NotImplementedError("Transformers backend does not "
-                                          "support MXFP4 quantization yet.")
+                raise NotImplementedError(
+                    "Transformers backend does not support MXFP4 quantization yet."
+                )
             # Skip loading extra bias for GPTQ models.
             if "gptq" in quant_method_name:
                 self.ignore_unexpected_suffixes.append(".bias")
@@ -538,15 +561,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                     embedding_dim=embedding_dim,
                     org_num_embeddings=self.text_config.vocab_size,
                     quant_config=self.quant_config,
-                ))
+                )
+            )
 
         # Initialize any parameters that have not had their modules replaced
         self.init_parameters(self.model)
 
         # Pipeline parallel intermediate tensors
-        self.make_empty_intermediate_tensors = (
-            make_empty_intermediate_tensors_factory(
-                ["hidden_states"], self.text_config.hidden_size))
+        self.make_empty_intermediate_tensors = make_empty_intermediate_tensors_factory(
+            ["hidden_states"], self.text_config.hidden_size
+        )
 
     def pipeline_parallel(self):
         """
@@ -556,8 +580,9 @@ def pipeline_parallel(self):
             return
 
         if not self.model.supports_pp_plan:
-            tip = get_feature_request_tip(self.model_config.model,
-                                          self.model_config.trust_remote_code)
+            tip = get_feature_request_tip(
+                self.model_config.model, self.model_config.trust_remote_code
+            )
             raise ValueError(
                 f"{type(self.model)} does not support pipeline parallel. {tip}"
             )
@@ -573,22 +598,23 @@ def pipeline_parallel(self):
         if len(module_lists) > 1:
             raise ValueError(
                 "Pipeline parallel of models with multiple `ModuleList`s "
-                "in the base model are not supported yet!")
+                "in the base model are not supported yet!"
+            )
         if module_list_idx is None:
-            raise ValueError(
-                f"Could not find `ModuleList` in {type(self.model)}")
+            raise ValueError(f"Could not find `ModuleList` in {type(self.model)}")
 
         # Layers before module list
         for name in pp_plan[:module_list_idx]:
             if self.pp_group.is_first_rank or (
-                    self.text_config.tie_word_embeddings
-                    and self.pp_group.is_last_rank):
+                self.text_config.tie_word_embeddings and self.pp_group.is_last_rank
+            ):
                 continue
             setattr(self.model, name, PPMissingLayer())
 
         # Module list
         start_layer, end_layer = get_pp_indices(
-            self.text_config.num_hidden_layers, self.pp_rank, self.pp_size)
+            self.text_config.num_hidden_layers, self.pp_rank, self.pp_size
+        )
         layers_name = pp_plan[module_list_idx]
         layers = getattr(self.model, layers_name)
         for i in range(len(layers)):
@@ -597,7 +623,7 @@ def pipeline_parallel(self):
             layers[i] = PPMissingLayer()
 
         # Layers after module list
-        for name in pp_plan[module_list_idx + 1:]:
+        for name in pp_plan[module_list_idx + 1 :]:
             # Modules that should be on last rank
             if not self.pp_group.is_last_rank:
                 setattr(self.model, name, PPMissingLayer())
@@ -613,10 +639,12 @@ def recursive_replace(self):
         tp_plan = self.model.tp_plan
 
         if not tp_plan and self.tp_size > 1:
-            tip = get_feature_request_tip(self.model_config.model,
-                                          self.model_config.trust_remote_code)
+            tip = get_feature_request_tip(
+                self.model_config.model, self.model_config.trust_remote_code
+            )
             raise ValueError(
-                f"{type(self.model)} does not support tensor parallel. {tip}")
+                f"{type(self.model)} does not support tensor parallel. {tip}"
+            )
 
         # Prefix the patterns because we always start from `self.model`
         tp_plan = {maybe_prefix("model", k): v for k, v in tp_plan.items()}
@@ -632,10 +660,9 @@ def _recursive_replace(module: nn.Module, prefix: str):
                     # LinearBase, so we set a default style which causes any
                     # unspecified layers to be replaced with ReplicatedLinear
                     style = tp_plan.get(pattern, "replicate")
-                    new_module = replace_linear_class(child_module,
-                                                      style,
-                                                      self.quant_config,
-                                                      prefix=qual_name)
+                    new_module = replace_linear_class(
+                        child_module, style, self.quant_config, prefix=qual_name
+                    )
                 # TODO(hmellor): Enable RMSNorm replacement once we have a way
                 # to choose RMSNorm vs GemmaRMSNorm
                 # elif child_module.__class__.__name__.endswith("RMSNorm"):
@@ -651,25 +678,26 @@ def _recursive_replace(module: nn.Module, prefix: str):
         _recursive_replace(self.model, prefix="model")
 
     def create_attention_instances(
-        self,
-        attn_type: AttentionType = AttentionType.DECODER
+        self, attn_type: AttentionType = AttentionType.DECODER
     ) -> dict[int, Attention]:
         """
         Create `Attention` instances to inform KV cache allocation.
         """
-        num_heads = self.model_config.get_num_attention_heads(
-            self.parallel_config)
+        num_heads = self.model_config.get_num_attention_heads(self.parallel_config)
         head_size = self.model_config.get_head_size()
         num_kv_heads = self.model_config.get_num_kv_heads(self.parallel_config)
-        start, end = get_pp_indices(self.text_config.num_hidden_layers,
-                                    self.pp_rank, self.pp_size)
+        start, end = get_pp_indices(
+            self.text_config.num_hidden_layers, self.pp_rank, self.pp_size
+        )
 
         attention_instances = {}
         for i in range(start, end):
             # Handle interleaved sliding window attention
             per_layer_sliding_window = None
-            if (hasattr(self.config, "layer_types")
-                    and self.config.layer_types[i] == "sliding_attention"):
+            if (
+                hasattr(self.config, "layer_types")
+                and self.config.layer_types[i] == "sliding_attention"
+            ):
                 per_layer_sliding_window = self.config.sliding_window
 
             attention_instances[i] = Attention(
@@ -683,12 +711,11 @@ def create_attention_instances(
                 quant_config=self.quant_config,
                 per_layer_sliding_window=per_layer_sliding_window,
                 prefix=f"{i}.attn",
-                attn_type=attn_type)
+                attn_type=attn_type,
+            )
         return attention_instances
 
-    def init_parameters(self,
-                        module: nn.Module,
-                        dtype: Optional[torch.dtype] = None):
+    def init_parameters(self, module: nn.Module, dtype: Optional[torch.dtype] = None):
         """
         If a `parameter` is on the `meta` device, then its parent
         `module` is the original module created by:
@@ -707,7 +734,8 @@ def _init_parameters(module: nn.Module, dtype: Optional[torch.dtype]):
                             param.data,
                             dtype=dtype or self.model_config.dtype,
                             device=self.device_config.device,
-                        ))
+                        )
+                    )
                     setattr(module, name, new_param)
             for child in module.children():
                 _init_parameters(child, dtype)
@@ -742,7 +770,8 @@ def forward(
             use_cache=False,
             position_ids=position_ids,
             attention_instances=self.attention_instances,
-            return_dict=False)[0][0, ...]  # we remove batch dimension for now
+            return_dict=False,
+        )[0][0, ...]  # we remove batch dimension for now
 
         if not get_pp_group().is_last_rank:
             return IntermediateTensors({"hidden_states": hidden_states})
@@ -768,12 +797,12 @@ def check_version(self, min_version: str, feature: str):
         if installed < required:
             raise ImportError(
                 f"Transformers backend requires transformers>={required} "
-                f"for {feature}, but got {installed}")
+                f"for {feature}, but got {installed}"
+            )
 
 
 @support_torch_compile(enable_if=can_enable_torch_compile)
 class TransformersForCausalLM(TransformersBase):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(vllm_config=vllm_config, prefix=prefix)
 
@@ -792,12 +821,13 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             )
             if self.text_config.tie_word_embeddings:
                 self.lm_head = self.lm_head.tie_weights(
-                    self.model.get_input_embeddings())
+                    self.model.get_input_embeddings()
+                )
 
             logit_scale = getattr(self.text_config, "logit_scale", 1.0)
             self.logits_processor = LogitsProcessor(
-                self.unpadded_vocab_size, self.text_config.vocab_size,
-                logit_scale)
+                self.unpadded_vocab_size, self.text_config.vocab_size, logit_scale
+            )
         else:
             self.lm_head = PPMissingLayer()
 
@@ -826,7 +856,8 @@ def _can_concat(x: list[torch.Tensor]):
 @MULTIMODAL_REGISTRY.register_processor(
     MultiModalProcessor,
     info=MultiModalProcessingInfo,
-    dummy_inputs=MultiModalDummyInputsBuilder)
+    dummy_inputs=MultiModalDummyInputsBuilder,
+)
 @support_torch_compile(
     # set `positions` to last dim to support Qwen-mrope
     dynamic_arg_dims={
@@ -835,7 +866,8 @@ def _can_concat(x: list[torch.Tensor]):
         "intermediate_tensors": 0,
         "inputs_embeds": 0,
     },
-    enable_if=can_enable_torch_compile)
+    enable_if=can_enable_torch_compile,
+)
 class TransformersForMultimodalLM(TransformersForCausalLM, SupportsMultiModal):
     merge_by_field_config = True
     # Backwards compatibility for prev released models. State dicts back then
@@ -859,7 +891,8 @@ class TransformersForMultimodalLM(TransformersForCausalLM, SupportsMultiModal):
             "model.embed_tokens": "model.language_model.embed_tokens",
             "model.layers": "model.language_model.layers",
             "model.norm": "model.language_model.norm",
-        })
+        }
+    )
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(vllm_config=vllm_config, prefix=prefix)
@@ -874,8 +907,9 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
         **kwargs: object,
     ) -> Union[torch.Tensor, IntermediateTensors]:
-        model_output = super().forward(input_ids, positions,
-                                       intermediate_tensors, inputs_embeds)
+        model_output = super().forward(
+            input_ids, positions, intermediate_tensors, inputs_embeds
+        )
         return model_output
 
     def get_language_model(self) -> torch.nn.Module:
@@ -896,8 +930,7 @@ def get_multimodal_embeddings(self, **kwargs):
 
         num_image_patches = kwargs.pop("num_image_patches")
         if pixel_values is not None:
-            vision_embeddings = self.model.get_image_features(
-                pixel_values, **kwargs)
+            vision_embeddings = self.model.get_image_features(pixel_values, **kwargs)
 
             if isinstance(vision_embeddings, torch.Tensor):
                 if isinstance(num_image_patches, list):
@@ -910,8 +943,8 @@ def get_multimodal_embeddings(self, **kwargs):
                 # but transformers returns concat tensors if each patch
                 # is of different size. We split it back to make vLLM happy
                 vision_embeddings = torch.split(
-                    vision_embeddings,
-                    num_image_patches.flatten().tolist())
+                    vision_embeddings, num_image_patches.flatten().tolist()
+                )
                 vision_embeddings = [
                     embed.flatten(start_dim=0, end_dim=-2)
                     for embed in vision_embeddings
@@ -954,7 +987,8 @@ def get_input_embeddings(
             raise ValueError(
                 "`get_input_embeddings` now requires `is_multimodal` arg, "
                 "please update your model runner according to "
-                "https://github.com/vllm-project/vllm/pull/16229.")
+                "https://github.com/vllm-project/vllm/pull/16229."
+            )
 
         return _merge_multimodal_embeddings(
             inputs_embeds=inputs_embeds,
diff --git a/vllm/model_executor/models/transformers_moe.py b/vllm/model_executor/models/transformers_moe.py
index f4ae015fdc64..9fba80dd1db8 100644
--- a/vllm/model_executor/models/transformers_moe.py
+++ b/vllm/model_executor/models/transformers_moe.py
@@ -15,6 +15,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Wrapper around `transformers` MoE models."""
+
 from typing import Any
 
 import torch
@@ -29,9 +30,13 @@
 from vllm.platforms import current_platform
 from vllm.utils import direct_register_custom_op
 
-from .transformers import (TransformersBase, TransformersForCausalLM,
-                           TransformersForMultimodalLM,
-                           can_enable_torch_compile, log_replacement)
+from .transformers import (
+    TransformersBase,
+    TransformersForCausalLM,
+    TransformersForMultimodalLM,
+    can_enable_torch_compile,
+    log_replacement,
+)
 from .utils import maybe_prefix
 
 
@@ -43,8 +48,7 @@ def __init__(self, *args, **kwargs):
         super().__init__(*args, **kwargs)
         self._topk_ids: torch.Tensor = None
 
-        def custom_routing_function(hidden_states, gating_output, topk,
-                                    renormalize):
+        def custom_routing_function(hidden_states, gating_output, topk, renormalize):
             """Return `topk_weights` from `gating_output` and the
             `topk_ids` we stored in the layer earlier."""
             topk_weights = gating_output
@@ -56,13 +60,18 @@ def custom_routing_function(hidden_states, gating_output, topk,
                 is_sp = self.is_sequence_parallel
                 dist_group = get_ep_group() if is_sp else get_dp_group()
                 assert sizes[dist_group.rank_in_group] == topk_ids.shape[0]
-                topk_ids, = dist_group.all_gatherv([topk_ids], 0, sizes)
+                (topk_ids,) = dist_group.all_gatherv([topk_ids], 0, sizes)
             return topk_weights, topk_ids
 
         self.custom_routing_function = custom_routing_function
 
-    def forward(self, hidden_states: torch.Tensor, topk_ids: torch.Tensor,
-                topk_weights: torch.Tensor, **kwargs: Any) -> torch.Tensor:
+    def forward(
+        self,
+        hidden_states: torch.Tensor,
+        topk_ids: torch.Tensor,
+        topk_weights: torch.Tensor,
+        **kwargs: Any,
+    ) -> torch.Tensor:
         """In Transformers `experts.forward` will have this signature.
 
         We discard any extra kwargs because we cannot use them here."""
@@ -74,10 +83,12 @@ def forward(self, hidden_states: torch.Tensor, topk_ids: torch.Tensor,
         )
 
 
-def transformers_moe_forward(hidden_states: torch.Tensor,
-                             topk_ids: torch.Tensor,
-                             topk_weights: torch.Tensor,
-                             layer_name: str) -> torch.Tensor:
+def transformers_moe_forward(
+    hidden_states: torch.Tensor,
+    topk_ids: torch.Tensor,
+    topk_weights: torch.Tensor,
+    layer_name: str,
+) -> torch.Tensor:
     """Store the `topk_ids` in the layer and call the actual forward."""
     forward_context: ForwardContext = get_forward_context()
     self = forward_context.no_compile_layers[layer_name]
@@ -86,10 +97,12 @@ def transformers_moe_forward(hidden_states: torch.Tensor,
     return self.forward_impl(hidden_states.clone(), topk_weights)
 
 
-def transformers_moe_forward_fake(hidden_states: torch.Tensor,
-                                  topk_ids: torch.Tensor,
-                                  topk_weights: torch.Tensor,
-                                  layer_name: str) -> torch.Tensor:
+def transformers_moe_forward_fake(
+    hidden_states: torch.Tensor,
+    topk_ids: torch.Tensor,
+    topk_weights: torch.Tensor,
+    layer_name: str,
+) -> torch.Tensor:
     return torch.empty_like(hidden_states)
 
 
@@ -99,12 +112,11 @@ def transformers_moe_forward_fake(hidden_states: torch.Tensor,
     mutates_args=["hidden_states"],
     fake_impl=transformers_moe_forward_fake,
     dispatch_key=current_platform.dispatch_key,
-    tags=(torch.Tag.needs_fixed_stride_order, ),
+    tags=(torch.Tag.needs_fixed_stride_order,),
 )
 
 
 class TransformersMoEBase(TransformersBase):
-
     def __init__(self, *, vllm_config, prefix=""):
         self.check_version("4.57.0.dev0", "MoE models support")
         super().__init__(vllm_config=vllm_config, prefix=prefix)
@@ -112,7 +124,8 @@ def __init__(self, *, vllm_config, prefix=""):
         if self.parallel_config.enable_eplb:
             raise NotImplementedError(
                 "Transformers backend does not support expert parallel load "
-                "balancing yet.")
+                "balancing yet."
+            )
 
     def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
         """
@@ -134,7 +147,8 @@ def get_expert_mapping(self) -> list[tuple[str, str, int, str]]:
                     ckpt_up_proj_name=up_proj,
                     num_experts=self.model_config.get_num_experts(),
                     num_redundant_experts=0,  # TODO: enable EPLB
-                ))
+                )
+            )
         return expert_mapping
 
     def recursive_replace(self):
@@ -143,30 +157,30 @@ def recursive_replace(self):
 
         # Positional arguments
         num_experts = self.model_config.get_num_experts()
-        top_k = getattr_iter(text_config, ["num_experts_per_tok", "top_k"],
-                             None)
+        top_k = getattr_iter(text_config, ["num_experts_per_tok", "top_k"], None)
         assert top_k is not None
         hidden_size = text_config.hidden_size
         intermediate_size = getattr_iter(
-            text_config, ["moe_intermediate_size", "intermediate_size"], None)
+            text_config, ["moe_intermediate_size", "intermediate_size"], None
+        )
         assert intermediate_size is not None
 
         # If there are shared experts, the results are
         # reduced after mlp.forward() not inside FusedMoE
-        num_experts_shared = getattr_iter(text_config, [
-            "num_experts_shared", "n_shared_experts", "moe_num_shared_experts"
-        ], 0)
+        num_experts_shared = getattr_iter(
+            text_config,
+            ["num_experts_shared", "n_shared_experts", "moe_num_shared_experts"],
+            0,
+        )
         reduce_results = num_experts_shared == 0
 
         def add_all_reduce(mlp: nn.Module):
             """Adds an all-reduce to the output of `mlp.forward()`."""
 
             class MLPWithAllReduce(mlp.__class__):
-
                 def forward(self, *args, **kwargs):
                     output = super().forward(*args, **kwargs)
-                    return self.experts.maybe_all_reduce_tensor_model_parallel(
-                        output)
+                    return self.experts.maybe_all_reduce_tensor_model_parallel(output)
 
             mlp.__class__ = MLPWithAllReduce
 
@@ -205,8 +219,7 @@ def forward(self, *args, **kwargs):
         def _recursive_replace(module: nn.Module, prefix: str):
             for child_name, child_module in module.named_children():
                 qual_name = maybe_prefix(prefix, child_name)
-                if (child_name == "experts"
-                        and isinstance(child_module, nn.ModuleList)):
+                if child_name == "experts" and isinstance(child_module, nn.ModuleList):
                     # Alias for readability
                     mlp = module
                     experts = child_module
@@ -248,8 +261,9 @@ def _recursive_replace(module: nn.Module, prefix: str):
                     # If results are not all-reduced in FusedMoE, ensure they
                     # are all-reduced at the end of mlp.forward() if tensor
                     # parallel or expert parallel is enabled
-                    if not reduce_results and (fused_experts.tp_size > 1
-                                               or fused_experts.ep_size > 1):
+                    if not reduce_results and (
+                        fused_experts.tp_size > 1 or fused_experts.ep_size > 1
+                    ):
                         add_all_reduce(mlp)
                 else:
                     _recursive_replace(child_module, prefix=qual_name)
@@ -272,7 +286,9 @@ class TransformersMoEForCausalLM(TransformersMoEBase, TransformersForCausalLM):
         "intermediate_tensors": 0,
         "inputs_embeds": 0,
     },
-    enable_if=can_enable_torch_compile)
-class TransformersMoEForMultimodalLM(TransformersMoEForCausalLM,
-                                     TransformersForMultimodalLM):
+    enable_if=can_enable_torch_compile,
+)
+class TransformersMoEForMultimodalLM(
+    TransformersMoEForCausalLM, TransformersForMultimodalLM
+):
     pass
diff --git a/vllm/model_executor/models/transformers_pooling.py b/vllm/model_executor/models/transformers_pooling.py
index 27fd40999fe2..98d2611351c0 100644
--- a/vllm/model_executor/models/transformers_pooling.py
+++ b/vllm/model_executor/models/transformers_pooling.py
@@ -15,6 +15,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Wrapper around `transformers` models for pooling tasks."""
+
 from typing import Optional, Union
 
 import torch
@@ -23,8 +24,12 @@
 from vllm.attention import Attention, AttentionType
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import VllmConfig
-from vllm.model_executor.layers.pooler import (ClassifierPooler, CLSPool,
-                                               DispatchPooler, Pooler)
+from vllm.model_executor.layers.pooler import (
+    ClassifierPooler,
+    CLSPool,
+    DispatchPooler,
+    Pooler,
+)
 from vllm.sequence import IntermediateTensors
 
 from .interfaces_base import VllmModelForPooling
@@ -52,16 +57,22 @@ class TransformersPoolingBase(TransformersBase, VllmModelForPooling):
             # Replace legacy suffixes used for norms
             ".gamma": ".weight",
             ".beta": ".bias",
-        })
+        },
+    )
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__(vllm_config=vllm_config, prefix=prefix)
 
         # Skip unsupported/unwanted output embeddings layers
-        self.skip_prefixes.extend([
-            "model.lm_head.", "model.predictions.", "model.qa_outputs.",
-            "model.embeddings_project.", "model.discriminator_predictions."
-        ])
+        self.skip_prefixes.extend(
+            [
+                "model.lm_head.",
+                "model.predictions.",
+                "model.qa_outputs.",
+                "model.embeddings_project.",
+                "model.discriminator_predictions.",
+            ]
+        )
 
         # Some encoder models have the position_ids buffer in the checkpoint.
         # vLLM will always pass position_ids as an argument, so we skip loading
@@ -80,8 +91,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.padding_idx = self.text_config.pad_token_id
 
     def create_attention_instances(
-        self,
-        attn_type: AttentionType = AttentionType.DECODER
+        self, attn_type: AttentionType = AttentionType.DECODER
     ) -> dict[int, Attention]:
         # TODO(hmellor): Better way to detect encoder models
         # In encoder models, the attention layers will have `is_causal=False`
@@ -107,10 +117,12 @@ def forward(
         if self.is_roberta:
             # RoBERTa-specific positions padding
             positions += self.padding_idx + 1
-        return super().forward(input_ids=input_ids,
-                               positions=positions,
-                               intermediate_tensors=intermediate_tensors,
-                               inputs_embeds=inputs_embeds)
+        return super().forward(
+            input_ids=input_ids,
+            positions=positions,
+            intermediate_tensors=intermediate_tensors,
+            inputs_embeds=inputs_embeds,
+        )
 
 
 @support_torch_compile(enable_if=can_enable_torch_compile)
@@ -123,10 +135,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         pooler_config = vllm_config.model_config.pooler_config
         assert pooler_config is not None
 
-        self.pooler = DispatchPooler({
-            "encode": Pooler.for_encode(pooler_config),
-            "embed": Pooler.for_embed(pooler_config),
-        })
+        self.pooler = DispatchPooler(
+            {
+                "encode": Pooler.for_encode(pooler_config),
+                "embed": Pooler.for_embed(pooler_config),
+            }
+        )
 
 
 @support_torch_compile(enable_if=can_enable_torch_compile)
@@ -158,12 +172,12 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         if self.model.pooler is not None:
             raise ValueError(
                 "Sequence classification models with pooling layers are not "
-                "supported yet in the Transformers backend.")
+                "supported yet in the Transformers backend."
+            )
 
         # Unlike `lm_head`, `classifier` is not always `nn.Linear`.
         self.classifier = seq_cls_model.classifier
-        self.init_parameters(self.classifier,
-                             dtype=self.model_config.head_dtype)
+        self.init_parameters(self.classifier, dtype=self.model_config.head_dtype)
 
         class ClassifierWithReshape(self.classifier.__class__):
             """CLSPool has already been applied in `pooling`.
@@ -176,33 +190,34 @@ def forward(self, *args, **kwargs):
 
         self.classifier.__class__ = ClassifierWithReshape
 
-        self.pooler = DispatchPooler({
-            "encode":
-            Pooler.for_encode(pooler_config),
-            "classify":
-            ClassifierPooler(
-                pooling=CLSPool(),
-                classifier=self.classifier,
-                act_fn=ClassifierPooler.act_fn_for_seq_cls(
-                    vllm_config.model_config),
-            ),
-            "score":
-            ClassifierPooler(
-                pooling=CLSPool(),
-                classifier=self.classifier,
-                act_fn=ClassifierPooler.act_fn_for_cross_encoder(
-                    vllm_config.model_config),
-            ),
-        })
+        self.pooler = DispatchPooler(
+            {
+                "encode": Pooler.for_encode(pooler_config),
+                "classify": ClassifierPooler(
+                    pooling=CLSPool(),
+                    classifier=self.classifier,
+                    act_fn=ClassifierPooler.act_fn_for_seq_cls(
+                        vllm_config.model_config
+                    ),
+                ),
+                "score": ClassifierPooler(
+                    pooling=CLSPool(),
+                    classifier=self.classifier,
+                    act_fn=ClassifierPooler.act_fn_for_cross_encoder(
+                        vllm_config.model_config
+                    ),
+                ),
+            }
+        )
 
 
 @support_torch_compile(enable_if=can_enable_torch_compile)
-class TransformersMoEEmbeddingModel(TransformersMoEBase,
-                                    TransformersEmbeddingModel):
+class TransformersMoEEmbeddingModel(TransformersMoEBase, TransformersEmbeddingModel):
     pass
 
 
 @support_torch_compile(enable_if=can_enable_torch_compile)
 class TransformersMoEForSequenceClassification(
-        TransformersMoEBase, TransformersForSequenceClassification):
+    TransformersMoEBase, TransformersForSequenceClassification
+):
     pass
diff --git a/vllm/model_executor/models/ultravox.py b/vllm/model_executor/models/ultravox.py
index 7744a19946a2..8f071eac2201 100644
--- a/vllm/model_executor/models/ultravox.py
+++ b/vllm/model_executor/models/ultravox.py
@@ -3,6 +3,7 @@
 
 # Adapted from https://github.com/fixie-ai/ultravox/blob/ecd58c4041030bae2ad15aa6bcf04ab43199ea02/ultravox/model/ultravox_model.py
 """PyTorch Ultravox model."""
+
 from collections.abc import Iterable, Mapping, Sequence
 from typing import Annotated, Any, Literal, Optional, Union
 
@@ -20,21 +21,37 @@
 from vllm.model_executor.model_loader import DefaultModelLoader
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems, NestedTensors)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+    NestedTensors,
+)
 from vllm.multimodal.parse import MultiModalDataItems, MultiModalDataParser
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo, PromptReplacement,
-                                        PromptUpdate)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.transformers_utils.configs.ultravox import UltravoxConfig
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-from .interfaces import (MultiModalEmbeddings, SupportsLoRA,
-                         SupportsMultiModal, SupportsPP)
-from .utils import (AutoWeightsLoader, WeightsMapper, flatten_bn,
-                    init_vllm_registered_model, maybe_prefix)
+from .interfaces import (
+    MultiModalEmbeddings,
+    SupportsLoRA,
+    SupportsMultiModal,
+    SupportsPP,
+)
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    flatten_bn,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
 
 _AUDIO_PLACEHOLDER_OVERRIDE = "<|audio|>"
 _MAX_ENCODER_BATCH_SIZE = 16
@@ -48,15 +65,21 @@ class UltravoxAudioFeatureInputs(TensorSchema):
     - t: Time frames (M)
     - nmb: Number of mel bins
     """
+
     type: Literal["audio_features"]
-    data: Annotated[Union[torch.Tensor, list[torch.Tensor],
-                          list[list[torch.Tensor]]],
-                    TensorShape("b", "n", "nmb", "t", dynamic_dims={"n"})]
-    lens: Annotated[Union[torch.Tensor, list[torch.Tensor]],
-                    TensorShape("b", "n", dynamic_dims={"n"})]
+    data: Annotated[
+        Union[torch.Tensor, list[torch.Tensor], list[list[torch.Tensor]]],
+        TensorShape("b", "n", "nmb", "t", dynamic_dims={"n"}),
+    ]
+    lens: Annotated[
+        Union[torch.Tensor, list[torch.Tensor]],
+        TensorShape("b", "n", dynamic_dims={"n"}),
+    ]
     """Length of the audio frames. Used for attention mask in WhisperEncoder."""
-    token_len: Annotated[Union[torch.Tensor, list[torch.Tensor]],
-                         TensorShape("b", "n", dynamic_dims={"n"})]
+    token_len: Annotated[
+        Union[torch.Tensor, list[torch.Tensor]],
+        TensorShape("b", "n", dynamic_dims={"n"}),
+    ]
     """Length of the audio tokens. Used for flattening the audio features."""
 
 
@@ -68,17 +91,17 @@ class UltravoxAudioEmbeddingInputs(TensorSchema):
     - afs: audio feature size
     - hs: hidden size
     """
+
     type: Literal["audio_embeds"]
-    data: Annotated[Union[torch.Tensor, list[torch.Tensor]],
-                    TensorShape("b", "na", "afs", "hs")]
+    data: Annotated[
+        Union[torch.Tensor, list[torch.Tensor]], TensorShape("b", "na", "afs", "hs")
+    ]
 
 
-UltravoxAudioInputs = Union[UltravoxAudioFeatureInputs,
-                            UltravoxAudioEmbeddingInputs]
+UltravoxAudioInputs = Union[UltravoxAudioFeatureInputs, UltravoxAudioEmbeddingInputs]
 
 
 class UltravoxProcessingInfo(BaseProcessingInfo):
-
     def get_hf_processor(self, **kwargs: object) -> ProcessorMixin:
         config = self.ctx.model_config.hf_config
         hf_processor = self.ctx.get_hf_processor(**kwargs)
@@ -91,8 +114,7 @@ def get_hf_processor(self, **kwargs: object) -> ProcessorMixin:
 
         return hf_processor
 
-    def get_feature_extractor(self,
-                              **kwargs: object) -> WhisperFeatureExtractor:
+    def get_feature_extractor(self, **kwargs: object) -> WhisperFeatureExtractor:
         hf_processor = self.get_hf_processor(**kwargs)
         audio_processor = hf_processor.audio_processor  # type: ignore
         feature_extractor = audio_processor.feature_extractor  # type: ignore
@@ -103,9 +125,7 @@ def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
         return {"audio": None}
 
 
-class UltravoxDummyInputsBuilder(BaseDummyInputsBuilder[UltravoxProcessingInfo]
-                                 ):
-
+class UltravoxDummyInputsBuilder(BaseDummyInputsBuilder[UltravoxProcessingInfo]):
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_audios = mm_counts.get("audio", 0)
 
@@ -120,23 +140,21 @@ def get_dummy_mm_data(
         feature_extractor = self.info.get_feature_extractor()
 
         sampling_rate = feature_extractor.sampling_rate
-        audio_len = (feature_extractor.chunk_length * sampling_rate *
-                     _MAX_ENCODER_BATCH_SIZE)
+        audio_len = (
+            feature_extractor.chunk_length * sampling_rate * _MAX_ENCODER_BATCH_SIZE
+        )
         num_audios = mm_counts.get("audio", 0)
 
         audio_overrides = mm_options.get("audio") if mm_options else None
 
         return {
-            "audio":
-            self._get_dummy_audios(length=audio_len,
-                                   num_audios=num_audios,
-                                   overrides=audio_overrides)
+            "audio": self._get_dummy_audios(
+                length=audio_len, num_audios=num_audios, overrides=audio_overrides
+            )
         }
 
 
-class UltravoxMultiModalProcessor(
-        BaseMultiModalProcessor[UltravoxProcessingInfo]):
-
+class UltravoxMultiModalProcessor(BaseMultiModalProcessor[UltravoxProcessingInfo]):
     def _get_data_parser(self) -> MultiModalDataParser:
         feature_extractor = self.info.get_feature_extractor()
         return MultiModalDataParser(target_sr=feature_extractor.sampling_rate)
@@ -151,7 +169,8 @@ def _call_hf_processor(
         # Text-only input not supported in composite processor
         if not mm_data.get("audios", []):
             prompt_ids = self.info.get_tokenizer().encode(
-                prompt, add_special_tokens=False)
+                prompt, add_special_tokens=False
+            )
             prompt_ids = self._apply_hf_processor_tokens_only(prompt_ids)
             return BatchFeature(dict(input_ids=[prompt_ids]), tensor_type="pt")
 
@@ -178,7 +197,7 @@ def _call_hf_processor(
             mm_kwargs=mm_kwargs,
             tok_kwargs=tok_kwargs,
         )
-        output['audio_features'] = output.pop('audio_values')
+        output["audio_features"] = output.pop("audio_values")
 
         return output
 
@@ -187,17 +206,14 @@ def _get_mm_fields_config(
         hf_inputs: BatchFeature,
         hf_processor_mm_kwargs: Mapping[str, object],
     ) -> Mapping[str, MultiModalFieldConfig]:
-        num_chunks = hf_inputs.get('audio_num_chunks', torch.zeros(0))
+        num_chunks = hf_inputs.get("audio_num_chunks", torch.zeros(0))
         return dict(
             # to handle longer than 30s audio, each audio might be split
             # into multiple chunks as such, their batch dimension can be
             # higher than the number of audio samples
-            audio_features=MultiModalFieldConfig.flat_from_sizes(
-                "audio", num_chunks),
-            audio_token_len=MultiModalFieldConfig.flat_from_sizes(
-                "audio", num_chunks),
-            audio_lens=MultiModalFieldConfig.flat_from_sizes(
-                "audio", num_chunks),
+            audio_features=MultiModalFieldConfig.flat_from_sizes("audio", num_chunks),
+            audio_token_len=MultiModalFieldConfig.flat_from_sizes("audio", num_chunks),
+            audio_lens=MultiModalFieldConfig.flat_from_sizes("audio", num_chunks),
             # num_chunks can convert audio_chunked to audio batch dimension
             audio_num_chunks=MultiModalFieldConfig.batched("audio"),
             audio_embeds=MultiModalFieldConfig.batched("audio"),
@@ -218,11 +234,12 @@ def _get_prompt_updates(
         # belonging to the i-th audio.
         out_mm_data = out_mm_kwargs.get_data()
         num_chunks = out_mm_data.get("audio_num_chunks", torch.zeros(0))
-        chunks_start_idx: torch.Tensor = torch.cumsum(num_chunks,
-                                                      dim=0,
-                                                      dtype=torch.int32)
+        chunks_start_idx: torch.Tensor = torch.cumsum(
+            num_chunks, dim=0, dtype=torch.int32
+        )
         chunks_start_idx = torch.cat(
-            [torch.tensor([0], dtype=torch.int32), chunks_start_idx])
+            [torch.tensor([0], dtype=torch.int32), chunks_start_idx]
+        )
 
         def get_replacement_ultravox(item_idx: int):
             start = chunks_start_idx[item_idx]
@@ -251,17 +268,16 @@ def __init__(self, stack_factor: int = 8):
 
     def forward(self, audio_embeds: torch.Tensor) -> torch.Tensor:
         B, T, C = audio_embeds.shape
-        T_pad = (T + self.stack_factor -
-                 1) // self.stack_factor * self.stack_factor
+        T_pad = (T + self.stack_factor - 1) // self.stack_factor * self.stack_factor
         audio_embeds = F.pad(audio_embeds, (0, 0, 0, T_pad - T))
         B, T, C = audio_embeds.shape
-        audio_embeds = audio_embeds.view(B, T // self.stack_factor,
-                                         C * self.stack_factor)
+        audio_embeds = audio_embeds.view(
+            B, T // self.stack_factor, C * self.stack_factor
+        )
         return audio_embeds
 
 
 class UltravoxProjector(nn.Module):
-
     def __init__(self, config: UltravoxConfig):
         super().__init__()
         self.hidden_dim = config.hidden_size
@@ -325,12 +341,15 @@ def __init__(self, *args, **kwargs):
 
     @property
     def max_context_length(self):
-        return (self.config.max_source_positions * self.conv1.stride[0] *
-                self.conv2.stride[0])
+        return (
+            self.config.max_source_positions
+            * self.conv1.stride[0]
+            * self.conv2.stride[0]
+        )
 
-    def get_attention_mask_by_audio_len(self,
-                                        audio_lens: Optional[torch.Tensor],
-                                        hidden_states: torch.Tensor):
+    def get_attention_mask_by_audio_len(
+        self, audio_lens: Optional[torch.Tensor], hidden_states: torch.Tensor
+    ):
         """
         Create attention mask based on audio lengths to mask out padding tokens
         For each sample in batch:
@@ -346,9 +365,9 @@ def get_attention_mask_by_audio_len(self,
 
         audio_feature_len = self._get_feat_extract_output_lengths(audio_lens)
         max_seq_len = hidden_states.shape[1]
-        attention_mask = torch.arange(max_seq_len,
-                                      device=hidden_states.device)[None, :].lt(
-                                          audio_feature_len.view(-1, 1))
+        attention_mask = torch.arange(max_seq_len, device=hidden_states.device)[
+            None, :
+        ].lt(audio_feature_len.view(-1, 1))
         attention_mask = self.get_extended_attention_mask(
             attention_mask,
             None,
@@ -367,21 +386,21 @@ def forward(
                 f"Whisper expects the mel input features to be of length "
                 f"{expected_seq_length} or less, but found "
                 f"{input_features.shape[-1]}. Make sure to pad the input mel "
-                f"features to {expected_seq_length}.")
+                f"features to {expected_seq_length}."
+            )
 
         inputs_embeds = nn.functional.gelu(self.conv1(input_features))
         inputs_embeds = nn.functional.gelu(self.conv2(inputs_embeds))
 
         inputs_embeds = inputs_embeds.permute(0, 2, 1)
-        embed_pos = self.embed_positions.weight[:inputs_embeds.size(-2)]
+        embed_pos = self.embed_positions.weight[: inputs_embeds.size(-2)]
 
         hidden_states = inputs_embeds + embed_pos
-        hidden_states = nn.functional.dropout(hidden_states,
-                                              p=self.dropout,
-                                              training=self.training)
+        hidden_states = nn.functional.dropout(
+            hidden_states, p=self.dropout, training=self.training
+        )
 
-        attention_mask = self.get_attention_mask_by_audio_len(
-            audio_lens, hidden_states)
+        attention_mask = self.get_attention_mask_by_audio_len(audio_lens, hidden_states)
 
         for encoder_layer in self.layers:
             layer_outputs = encoder_layer(
@@ -399,16 +418,17 @@ def forward(
 @MULTIMODAL_REGISTRY.register_processor(
     UltravoxMultiModalProcessor,
     info=UltravoxProcessingInfo,
-    dummy_inputs=UltravoxDummyInputsBuilder)
+    dummy_inputs=UltravoxDummyInputsBuilder,
+)
 class UltravoxModel(nn.Module, SupportsMultiModal, SupportsPP, SupportsLoRA):
-
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
-        "gate_up_proj": ["gate_proj", "up_proj"]
+        "gate_up_proj": ["gate_proj", "up_proj"],
     }
 
     hf_to_vllm_mapper = WeightsMapper(
-        orig_to_new_prefix={"audio_tower.model.encoder.": "audio_tower."})
+        orig_to_new_prefix={"audio_tower.model.encoder.": "audio_tower."}
+    )
 
     @classmethod
     def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
@@ -435,7 +455,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
                     model_or_path=config.audio_model_id,
                     revision=None,
                     prefix="audio_tower.",
-                ))
+                )
+            )
         self.multi_modal_projector = UltravoxProjector(config)
         self.language_model = init_vllm_registered_model(
             vllm_config=vllm_config,
@@ -446,12 +467,16 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             # this prefix is not for initialization, but for loading weights
             # note the trailing dot
             self.secondary_weights.append(
-                DefaultModelLoader.Source(model_or_path=config.text_model_id,
-                                          revision=None,
-                                          prefix="language_model."))
+                DefaultModelLoader.Source(
+                    model_or_path=config.text_model_id,
+                    revision=None,
+                    prefix="language_model.",
+                )
+            )
 
         self.make_empty_intermediate_tensors = (
-            self.language_model.make_empty_intermediate_tensors)
+            self.language_model.make_empty_intermediate_tensors
+        )
 
     def get_mm_mapping(self) -> MultiModelKeys:
         """
@@ -464,8 +489,8 @@ def get_mm_mapping(self) -> MultiModelKeys:
         )
 
     def _audio_features_to_embeddings(
-            self, input_features: torch.Tensor,
-            audio_lens: torch.Tensor) -> torch.Tensor:
+        self, input_features: torch.Tensor, audio_lens: torch.Tensor
+    ) -> torch.Tensor:
         audio_features = input_features.to(self.audio_tower.dtype)
         batch_size = audio_features.size(0)
         audio_embeddings = []
@@ -474,8 +499,9 @@ def _audio_features_to_embeddings(
         for start in range(0, batch_size, _MAX_ENCODER_BATCH_SIZE):
             end = min(start + _MAX_ENCODER_BATCH_SIZE, batch_size)
             # Process through audio tower
-            batch_features = self.audio_tower(audio_features[start:end],
-                                              audio_lens[start:end])
+            batch_features = self.audio_tower(
+                audio_features[start:end], audio_lens[start:end]
+            )
             batch_features = batch_features.to(self.audio_tower.dtype)
 
             # Process through projector
@@ -487,7 +513,8 @@ def _audio_features_to_embeddings(
         return audio_embeddings
 
     def _parse_and_validate_audio_input(
-            self, **kwargs: object) -> Optional[UltravoxAudioInputs]:
+        self, **kwargs: object
+    ) -> Optional[UltravoxAudioInputs]:
         audio_features = kwargs.pop("audio_features", None)
         audio_embeds = kwargs.pop("audio_embeds", None)
         audio_lens = kwargs.pop("audio_lens", None)
@@ -497,14 +524,15 @@ def _parse_and_validate_audio_input(
             return None
 
         if audio_features is not None:
-            return UltravoxAudioFeatureInputs(type="audio_features",
-                                              data=audio_features,
-                                              lens=audio_lens,
-                                              token_len=audio_token_len)
+            return UltravoxAudioFeatureInputs(
+                type="audio_features",
+                data=audio_features,
+                lens=audio_lens,
+                token_len=audio_token_len,
+            )
 
         if audio_embeds is not None:
-            return UltravoxAudioEmbeddingInputs(type="audio_embeds",
-                                                data=audio_embeds)
+            return UltravoxAudioEmbeddingInputs(type="audio_embeds", data=audio_embeds)
 
         raise AssertionError("This line should be unreachable.")
 
@@ -520,11 +548,10 @@ def _process_audio_input(
         audio_features = pad_and_concat_to_dim3(audio_input["data"])
 
         # [B1, B2] -> [B1+B2]
-        audio_lens = flatten_bn(audio_input['lens'], concat=True)
-        audio_token_len = flatten_bn(audio_input['token_len'], concat=True)
+        audio_lens = flatten_bn(audio_input["lens"], concat=True)
+        audio_token_len = flatten_bn(audio_input["token_len"], concat=True)
 
-        embeddings = self._audio_features_to_embeddings(
-            audio_features, audio_lens)
+        embeddings = self._audio_features_to_embeddings(audio_features, audio_lens)
 
         # We should flatten and concatenate embeddings based on token lengths
         # For example, with token_len = [4, 2, 3], flattened_embeddings will be
@@ -533,23 +560,22 @@ def _process_audio_input(
         # Create a mask of valid indices based on token lengths
         max_len = embeddings.shape[1]
         indices = torch.arange(max_len, device=embeddings.device).expand(
-            embeddings.shape[0], -1)
+            embeddings.shape[0], -1
+        )
         mask = indices < audio_token_len[:, None]
         # Apply mask and flatten
         flattened_embeddings = embeddings[mask]
 
         # Return one tensor per input audio
         embed_lens = [
-            token_len_item.sum().item()
-            for token_len_item in audio_input['token_len']
+            token_len_item.sum().item() for token_len_item in audio_input["token_len"]
         ]
         return flattened_embeddings.split(embed_lens)
 
     def get_language_model(self) -> torch.nn.Module:
         return self.language_model
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         audio_input = self._parse_and_validate_audio_input(**kwargs)
         if audio_input is None:
             return []
@@ -576,12 +602,14 @@ def get_input_embeddings(
             handle_oov_mm_token=handle_oov_mm_token,
         )
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                intermediate_tensors: Optional[torch.Tensor] = None,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs) -> Union[torch.Tensor, IntermediateTensors]:
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        intermediate_tensors: Optional[torch.Tensor] = None,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs,
+    ) -> Union[torch.Tensor, IntermediateTensors]:
         """Run forward pass for Ultravox
 
         One key thing to understand is the `input_ids` already accounts for the
@@ -607,25 +635,21 @@ def forward(self,
         if hasattr(language_model, "language_model"):
             language_model = language_model.language_model
 
-        hidden_states = language_model.model(input_ids,
-                                             positions,
-                                             intermediate_tensors,
-                                             inputs_embeds=inputs_embeds)
+        hidden_states = language_model.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
         return hidden_states
 
     def compute_logits(self, hidden_states: torch.Tensor) -> torch.Tensor:
         return self.language_model.compute_logits(hidden_states)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
-
-        loader = AutoWeightsLoader(self,
-                                   ignore_unexpected_prefixes=["audio_tower."])
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
+        loader = AutoWeightsLoader(self, ignore_unexpected_prefixes=["audio_tower."])
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
 
 
 def pad_and_concat_to_dim3(
-    features: Union[torch.Tensor, list[torch.Tensor], list[list[torch.Tensor]]]
+    features: Union[torch.Tensor, list[torch.Tensor], list[list[torch.Tensor]]],
 ) -> torch.Tensor:
     """
     Pad and concatenate a list of tensors.
diff --git a/vllm/model_executor/models/utils.py b/vllm/model_executor/models/utils.py
index d6fa88f06e56..2a64f6865f12 100644
--- a/vllm/model_executor/models/utils.py
+++ b/vllm/model_executor/models/utils.py
@@ -14,15 +14,21 @@
 
 import vllm.envs as envs
 from vllm.config import VllmConfig
-from vllm.distributed import (get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size)
+from vllm.distributed import (
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.logger import init_logger
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.multimodal import NestedTensors
 from vllm.sequence import IntermediateTensors
-from vllm.utils import (cdiv, direct_register_custom_op,
-                        get_cuda_view_from_cpu_tensor, is_pin_memory_available,
-                        is_uva_available)
+from vllm.utils import (
+    cdiv,
+    direct_register_custom_op,
+    get_cuda_view_from_cpu_tensor,
+    is_pin_memory_available,
+    is_uva_available,
+)
 
 logger = init_logger(__name__)
 
@@ -65,12 +71,16 @@ def _map_name(self, key: str) -> Optional[str]:
     def apply(
         self, weights: Iterable[tuple[str, torch.Tensor]]
     ) -> Iterable[tuple[str, torch.Tensor]]:
-        return ((out_name, data) for name, data in weights
-                if (out_name := self._map_name(name)) is not None)
+        return (
+            (out_name, data)
+            for name, data in weights
+            if (out_name := self._map_name(name)) is not None
+        )
 
     def apply_list(self, values: list[str]) -> list[str]:
         return [
-            out_name for name in values
+            out_name
+            for name in values
             if (out_name := self._map_name(name)) is not None
         ]
 
@@ -129,17 +139,20 @@ def _groupby_prefix(
         self,
         weights: Iterable[tuple[str, torch.Tensor]],
     ) -> Iterable[tuple[str, Iterable[tuple[str, torch.Tensor]]]]:
-        weights_by_parts = ((weight_name.split(".", 1), weight_data)
-                            for weight_name, weight_data in weights)
+        weights_by_parts = (
+            (weight_name.split(".", 1), weight_data)
+            for weight_name, weight_data in weights
+        )
 
-        for prefix, group in itertools.groupby(weights_by_parts,
-                                               key=lambda x: x[0][0]):
+        for prefix, group in itertools.groupby(weights_by_parts, key=lambda x: x[0][0]):
             yield (
                 prefix,
                 # Because maxsplit=1 in weight_name.split(...),
                 # the length of `parts` must either be 1 or 2
-                (("" if len(parts) == 1 else parts[1], weights_data)
-                 for parts, weights_data in group),
+                (
+                    ("" if len(parts) == 1 else parts[1], weights_data)
+                    for parts, weights_data in group
+                ),
             )
 
     def _get_qualname(self, prefix: str, rest: str) -> str:
@@ -151,8 +164,9 @@ def _get_qualname(self, prefix: str, rest: str) -> str:
         return ".".join((prefix, rest))
 
     def _can_skip(self, qualname: str) -> bool:
-        return (any(qualname.startswith(p) for p in self.skip_prefixes)
-                or any(substr in qualname for substr in self.skip_substrs))
+        return any(qualname.startswith(p) for p in self.skip_prefixes) or any(
+            substr in qualname for substr in self.skip_substrs
+        )
 
     def _can_ignore_unexpected(self, qualname: str) -> bool:
         iup = (qualname.startswith(p) for p in self.ignore_unexpected_prefixes)
@@ -181,24 +195,26 @@ def _load_param(
 
                 raise ValueError(
                     f"Attempted to load nested weight '{weight_qualname}' "
-                    f"into a single parameter '{base_prefix}'")
+                    f"into a single parameter '{base_prefix}'"
+                )
 
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, weight_data)
 
-            logger.debug("Loaded weight %s with shape %s", weight_qualname,
-                         param.shape)
+            logger.debug("Loaded weight %s with shape %s", weight_qualname, param.shape)
 
             yield weight_qualname
 
-    def _add_loadable_non_param_tensors(self, module: nn.Module,
-                                        child_params: dict[str, torch.Tensor]):
+    def _add_loadable_non_param_tensors(
+        self, module: nn.Module, child_params: dict[str, torch.Tensor]
+    ):
         """
         Add tensor names that are not in the model params that may be in the
         safetensors, e.g., batch normalization stats.
         """
-        if isinstance(module, (
+        if isinstance(
+            module,
+            (
                 nn.BatchNorm1d,
                 nn.BatchNorm2d,
                 nn.BatchNorm3d,
@@ -206,10 +222,10 @@ def _add_loadable_non_param_tensors(self, module: nn.Module,
                 nn.LazyBatchNorm2d,
                 nn.LazyBatchNorm3d,
                 nn.SyncBatchNorm,
-        )):
+            ),
+        ):
             module_state_dict = module.state_dict()
-            for stat_name in ("running_mean", "running_var",
-                              "num_batches_tracked"):
+            for stat_name in ("running_mean", "running_var", "num_batches_tracked"):
                 child_params[stat_name] = module_state_dict[stat_name]
 
     def _load_module(
@@ -229,8 +245,8 @@ def _load_module(
                 loaded_params = module_load_weights(weights)
                 if loaded_params is None:
                     logger.warning(
-                        "Unable to collect loaded parameters "
-                        "for module %s", module)
+                        "Unable to collect loaded parameters for module %s", module
+                    )
                 else:
                     yield from map(
                         lambda x: self._get_qualname(base_prefix, x),
@@ -253,17 +269,18 @@ def _load_module(
 
                     continue
 
-                yield from self._load_module(prefix,
-                                             child_modules[child_prefix],
-                                             child_weights)
+                yield from self._load_module(
+                    prefix, child_modules[child_prefix], child_weights
+                )
             elif child_prefix in child_params:
                 if self._can_skip(prefix):
                     logger.debug("Skipping param %s", prefix)
 
                     continue
 
-                yield from self._load_param(prefix, child_params[child_prefix],
-                                            child_weights)
+                yield from self._load_param(
+                    prefix, child_params[child_prefix], child_weights
+                )
             else:
                 can_skip_module = self._can_skip(prefix + ".")
                 can_skip_param = self._can_skip(prefix)
@@ -279,8 +296,10 @@ def _load_module(
 
                     continue
 
-                msg = (f"There is no module or parameter named '{prefix}' "
-                       f"in {type(self.module).__name__}")
+                msg = (
+                    f"There is no module or parameter named '{prefix}' "
+                    f"in {type(self.module).__name__}"
+                )
                 raise ValueError(msg)
 
     def load_weights(
@@ -292,8 +311,9 @@ def load_weights(
         if mapper is not None:
             weights = mapper.apply(weights)
         # filter out weights with first-prefix/substr to skip in name
-        weights = ((name, weight) for name, weight in weights
-                   if not self._can_skip(name))
+        weights = (
+            (name, weight) for name, weight in weights if not self._can_skip(name)
+        )
 
         autoloaded_weights = set(self._load_module("", self.module, weights))
         return autoloaded_weights
@@ -317,20 +337,17 @@ def init_vllm_registered_model(
         hf_config = vllm_config.model_config.hf_config
 
     if hf_config is not None:
-        vllm_config = vllm_config.with_hf_config(hf_config,
-                                                 architectures=architectures)
+        vllm_config = vllm_config.with_hf_config(hf_config, architectures=architectures)
 
     return initialize_model(vllm_config=vllm_config, prefix=prefix)
 
 
 @overload
-def flatten_bn(x: torch.Tensor) -> torch.Tensor:
-    ...
+def flatten_bn(x: torch.Tensor) -> torch.Tensor: ...
 
 
 @overload
-def flatten_bn(x: list[torch.Tensor]) -> list[torch.Tensor]:
-    ...
+def flatten_bn(x: list[torch.Tensor]) -> list[torch.Tensor]: ...
 
 
 @overload
@@ -338,8 +355,7 @@ def flatten_bn(
     x: Union[list[torch.Tensor], torch.Tensor],
     *,
     concat: Literal[True],
-) -> torch.Tensor:
-    ...
+) -> torch.Tensor: ...
 
 
 @overload
@@ -347,8 +363,7 @@ def flatten_bn(
     x: Union[list[torch.Tensor], torch.Tensor],
     *,
     concat: bool = False,
-) -> Union[list[torch.Tensor], torch.Tensor]:
-    ...
+) -> Union[list[torch.Tensor], torch.Tensor]: ...
 
 
 def flatten_bn(
@@ -392,8 +407,7 @@ def _embedding_count_expression(embeddings: NestedTensors) -> str:
     if isinstance(embeddings, torch.Tensor):
         return " x ".join([str(dim) for dim in embeddings.shape[:-1]])
 
-    return " + ".join(
-        _embedding_count_expression(inner) for inner in embeddings)
+    return " + ".join(_embedding_count_expression(inner) for inner in embeddings)
 
 
 def _merge_multimodal_embeddings(
@@ -421,8 +435,9 @@ def _merge_multimodal_embeddings(
 
         # NOTE: This can avoid D2H sync (#22105), but fails to
         # raise an error if is_multimodal.sum() < len(mm_embeds_flat)
-        inputs_embeds.masked_scatter_(is_multimodal.unsqueeze(-1),
-                                      mm_embeds_flat.to(dtype=input_dtype))
+        inputs_embeds.masked_scatter_(
+            is_multimodal.unsqueeze(-1), mm_embeds_flat.to(dtype=input_dtype)
+        )
     except RuntimeError as e:
         num_actual_tokens = len(mm_embeds_flat)
         num_expected_tokens = is_multimodal.sum().item()
@@ -440,9 +455,11 @@ def _merge_multimodal_embeddings(
     return inputs_embeds
 
 
-@deprecated("`merge_multimodal_embeddings` has been replaced with "
-            "`SupportsMultiModal.get_input_embeddings` and will be "
-            "removed in v0.12.")
+@deprecated(
+    "`merge_multimodal_embeddings` has been replaced with "
+    "`SupportsMultiModal.get_input_embeddings` and will be "
+    "removed in v0.12."
+)
 def merge_multimodal_embeddings(
     input_ids: torch.Tensor,
     inputs_embeds: torch.Tensor,
@@ -477,7 +494,7 @@ def merge_multimodal_embeddings(
     if isinstance(placeholder_token_id, list):
         is_multimodal = isin_list(input_ids, placeholder_token_id)
     else:
-        is_multimodal = (input_ids == placeholder_token_id)
+        is_multimodal = input_ids == placeholder_token_id
 
     return _merge_multimodal_embeddings(
         inputs_embeds,
@@ -499,9 +516,7 @@ def isin_list(
 
 
 class LayerFn(Protocol):
-
-    def __call__(self, prefix: str) -> torch.nn.Module:
-        ...
+    def __call__(self, prefix: str) -> torch.nn.Module: ...
 
 
 class PPMissingLayer(torch.nn.Identity):
@@ -544,8 +559,7 @@ def maybe_offload_to_cpu(module: torch.nn.Module) -> torch.nn.Module:
     uva_available = is_uva_available()
 
     if envs.VLLM_USE_V1:
-        assert uva_available, ("V1 CPU offloading requires"
-                               " uva (pin memory) support")
+        assert uva_available, "V1 CPU offloading requires uva (pin memory) support"
         uva_offloading = True
     else:
         uva_offloading = False
@@ -560,12 +574,14 @@ def maybe_offload_to_cpu(module: torch.nn.Module) -> torch.nn.Module:
             break
 
         # `torch.empty_like` does not support `pin_memory` argument
-        cpu_data = torch.empty_strided(size=p.data.size(),
-                                       stride=p.data.stride(),
-                                       dtype=p.data.dtype,
-                                       layout=p.data.layout,
-                                       device='cpu',
-                                       pin_memory=pin_memory)
+        cpu_data = torch.empty_strided(
+            size=p.data.size(),
+            stride=p.data.stride(),
+            dtype=p.data.dtype,
+            layout=p.data.layout,
+            device="cpu",
+            pin_memory=pin_memory,
+        )
         cpu_data.copy_(p.data)
         if not uva_offloading:
             p.data = cpu_data
@@ -587,10 +603,7 @@ def forward(*args, **kwargs):
                 k: v.to(device, non_blocking=True)
                 for k, v in module.state_dict().items()
             }
-            output = functional_call(module,
-                                     device_state,
-                                     args=args,
-                                     kwargs=kwargs)
+            output = functional_call(module, device_state, args=args, kwargs=kwargs)
             module.forward = forward
             return output
 
@@ -609,14 +622,18 @@ def make_layers(
     """
     from vllm.distributed.parallel_state import get_pp_group
     from vllm.distributed.utils import get_pp_indices
-    start_layer, end_layer = get_pp_indices(num_hidden_layers,
-                                            get_pp_group().rank_in_group,
-                                            get_pp_group().world_size)
+
+    start_layer, end_layer = get_pp_indices(
+        num_hidden_layers, get_pp_group().rank_in_group, get_pp_group().world_size
+    )
     modules = torch.nn.ModuleList(
-        [PPMissingLayer() for _ in range(start_layer)] + [
+        [PPMissingLayer() for _ in range(start_layer)]
+        + [
             maybe_offload_to_cpu(layer_fn(prefix=f"{prefix}.{idx}"))
             for idx in range(start_layer, end_layer)
-        ] + [PPMissingLayer() for _ in range(end_layer, num_hidden_layers)])
+        ]
+        + [PPMissingLayer() for _ in range(end_layer, num_hidden_layers)]
+    )
     return start_layer, end_layer, modules
 
 
@@ -636,7 +653,7 @@ def get_pp_missing_layer_names(model: torch.nn.Module) -> list[str]:
             # NOTE: the trailing dot is used to match the prefix of the layer.
             # without the dot, we could match a layer that is not missing,
             # e.g., 'encoder.layer.1' would match 'encoder.layer.11'
-            missing_layer_names.append(name + '.')
+            missing_layer_names.append(name + ".")
     _model_to_pp_missing_layer_names[model_id] = missing_layer_names
 
     return missing_layer_names
@@ -649,21 +666,22 @@ def is_pp_missing_parameter(name: str, model: torch.nn.Module) -> bool:
 
     return any(
         name.startswith(missing_layer_name)
-        for missing_layer_name in get_pp_missing_layer_names(model))
+        for missing_layer_name in get_pp_missing_layer_names(model)
+    )
 
 
 def make_empty_intermediate_tensors_factory(keys: list[str], hidden_size: int):
-
     def make_empty_intermediate_tensors(
         batch_size: int,
         dtype: torch.dtype,
         device: torch.device,
     ) -> IntermediateTensors:
-        return IntermediateTensors({
-            key:
-            torch.zeros((batch_size, hidden_size), dtype=dtype, device=device)
-            for key in keys
-        })
+        return IntermediateTensors(
+            {
+                key: torch.zeros((batch_size, hidden_size), dtype=dtype, device=device)
+                for key in keys
+            }
+        )
 
     return make_empty_intermediate_tensors
 
@@ -698,15 +716,20 @@ def extract_layer_index(layer_name: str, num_attn_module: int = 1) -> int:
         except ValueError:
             continue
     if num_attn_module == 1 or "attn" not in layer_name:
-        assert len(int_vals) == 1, (f"layer name {layer_name} should"
-                                    " only contain one integer")
+        assert len(int_vals) == 1, (
+            f"layer name {layer_name} should only contain one integer"
+        )
 
         return int_vals[0]
     else:
-        assert len(int_vals) <= 2, (f"layer name {layer_name} should"
-                                    " contain most two integers")
-        layer_index = int_vals[0] * num_attn_module + int_vals[1] if len(
-            int_vals) == 2 else int_vals[0]
+        assert len(int_vals) <= 2, (
+            f"layer name {layer_name} should contain most two integers"
+        )
+        layer_index = (
+            int_vals[0] * num_attn_module + int_vals[1]
+            if len(int_vals) == 2
+            else int_vals[0]
+        )
         return layer_index
 
 
@@ -720,19 +743,20 @@ def cast_overflow_tensors(
     return tensors
 
 
-def fast_topk(values: torch.Tensor, topk: int,
-              dim: int) -> tuple[torch.Tensor, torch.Tensor]:
+def fast_topk(
+    values: torch.Tensor, topk: int, dim: int
+) -> tuple[torch.Tensor, torch.Tensor]:
     """
     Optimized topk implementation that uses torch.max for k=1 case.
-    
+
     This function provides better performance for the common case of k=1
     by using torch.max instead of the more general torch.topk.
-    
+
     Args:
         values: Input tensor to find top-k values from
         topk: Number of top values to return (k). Must be > 0.
         dim: Dimension along which to compute topk
-        
+
     Returns:
         Tuple of (values, indices) where values are the top-k values
         and indices are their corresponding indices in the input tensor
@@ -791,5 +815,5 @@ def sequence_parallel_chunk_impl_fake(x: torch.Tensor) -> torch.Tensor:
     op_name="sequence_parallel_chunk_impl",
     op_func=sequence_parallel_chunk_impl,
     fake_impl=sequence_parallel_chunk_impl_fake,
-    tags=(torch.Tag.needs_fixed_stride_order, ),
+    tags=(torch.Tag.needs_fixed_stride_order,),
 )
diff --git a/vllm/model_executor/models/vision.py b/vllm/model_executor/models/vision.py
index b4007ff2e1cf..74262f8b94a6 100644
--- a/vllm/model_executor/models/vision.py
+++ b/vllm/model_executor/models/vision.py
@@ -4,16 +4,17 @@
 import itertools
 import math
 from abc import ABC, abstractmethod
-from typing import (Callable, Final, Generic, Literal, Optional, Protocol,
-                    TypeVar, Union)
+from typing import Callable, Final, Generic, Literal, Optional, Protocol, TypeVar, Union
 
 import torch
 from transformers import PretrainedConfig
 
 from vllm.attention.backends.registry import _Backend
-from vllm.distributed import (get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size,
-                              tensor_model_parallel_all_gather)
+from vllm.distributed import (
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+    tensor_model_parallel_all_gather,
+)
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 
@@ -27,7 +28,6 @@ class _RootConfig(Protocol[_C]):
 
 
 class VisionEncoderInfo(ABC, Generic[_C]):
-
     def __init__(self, hf_config: _RootConfig[_C]) -> None:
         super().__init__()
 
@@ -60,8 +60,7 @@ class VisionLanguageConfig(Protocol):
     vision_config: Final[PretrainedConfig]
 
 
-def get_vision_encoder_info(
-        hf_config: VisionLanguageConfig) -> VisionEncoderInfo:
+def get_vision_encoder_info(hf_config: VisionLanguageConfig) -> VisionEncoderInfo:
     # Avoid circular imports
     from .clip import CLIPEncoderInfo, CLIPVisionConfig
     from .pixtral import PixtralHFEncoderInfo, PixtralVisionConfig
@@ -164,12 +163,13 @@ def resolve_visual_encoder_outputs(
     """
     if select_layers is None:
         if not isinstance(encoder_outputs, torch.Tensor):
-            raise ValueError("Expected only a single encoder output when "
-                             "`select_layers` is not provided")
+            raise ValueError(
+                "Expected only a single encoder output when "
+                "`select_layers` is not provided"
+            )
 
         if feature_select_strategy is not None:
-            select_features = _get_vision_feature_selector(
-                feature_select_strategy)
+            select_features = _get_vision_feature_selector(feature_select_strategy)
             encoder_outputs = select_features(encoder_outputs)
 
         if post_layer_norm is not None:
@@ -178,8 +178,9 @@ def resolve_visual_encoder_outputs(
         return encoder_outputs
 
     if max_possible_layers is None:
-        raise ValueError("`max_possible_layers` must be provided "
-                         "alongside `select_layers`")
+        raise ValueError(
+            "`max_possible_layers` must be provided alongside `select_layers`"
+        )
 
     # Get the hidden states corresponding to the layer indices.
     # Negative values are relative to the full visual encoder,
@@ -191,7 +192,8 @@ def resolve_visual_encoder_outputs(
     offset = max_possible_layers - num_loaded_layers
     hs_pool = [
         encoder_outputs[layer_idx]
-        if layer_idx >= 0 else encoder_outputs[layer_idx + offset]
+        if layer_idx >= 0
+        else encoder_outputs[layer_idx + offset]
         for layer_idx in select_layers
     ]
 
@@ -207,9 +209,10 @@ def resolve_visual_encoder_outputs(
     return torch.cat(hs_pool, dim=-1)
 
 
-def run_dp_sharded_vision_model(image_input: torch.Tensor,
-                                vision_model: torch.nn.Module) -> torch.Tensor:
-    """Run a vision model with data parallelism (DP) sharding. The function 
+def run_dp_sharded_vision_model(
+    image_input: torch.Tensor, vision_model: torch.nn.Module
+) -> torch.Tensor:
+    """Run a vision model with data parallelism (DP) sharding. The function
     will shard the input image tensor on the first dimension and run the vision
     model
 
@@ -224,18 +227,17 @@ def run_dp_sharded_vision_model(image_input: torch.Tensor,
     mp_world_size = get_tensor_model_parallel_world_size()
     num_chunks_per_rank = (num_chunks + mp_world_size - 1) // mp_world_size
     num_padded_chunks = num_chunks_per_rank * mp_world_size - num_chunks
-    pad = (0, ) * (2 * (image_input.dim() - 1)) + (0, num_padded_chunks)
+    pad = (0,) * (2 * (image_input.dim() - 1)) + (0, num_padded_chunks)
     image_input_padded = torch.nn.functional.pad(image_input, pad)
     rank = get_tensor_model_parallel_rank()
-    image_input_per_rank = image_input_padded[rank *
-                                              num_chunks_per_rank:(rank + 1) *
-                                              num_chunks_per_rank, ...]
+    image_input_per_rank = image_input_padded[
+        rank * num_chunks_per_rank : (rank + 1) * num_chunks_per_rank, ...
+    ]
 
     vision_embeddings = vision_model(image_input_per_rank)
     # Ensure tensor is contiguous before all_gather
     vision_embeddings = vision_embeddings.contiguous()
-    vision_embeddings = tensor_model_parallel_all_gather(vision_embeddings,
-                                                         dim=0)
+    vision_embeddings = tensor_model_parallel_all_gather(vision_embeddings, dim=0)
     vision_embeddings = vision_embeddings[:num_chunks, ...]
     return vision_embeddings
 
@@ -245,27 +247,27 @@ def get_load_balance_assignment(
     num_gpus: int = 2,
 ) -> tuple[list[int], list[int], list[int]]:
     """
-    Generate load balancing assignment and metadata 
+    Generate load balancing assignment and metadata
     for distributing data across GPUs.
     The load is determined by the total image sizes,
     not the number of images.
-    
+
     Args:
         sizes: The size of each image
         num_gpus: Number of GPUs to balance across
-    
+
     Returns:
-        shuffle_indices: 
+        shuffle_indices:
             Indices to reorder data for balanced loading
-        gpu_sample_counts: 
+        gpu_sample_counts:
             Number of samples assigned to each GPU
-        grouped_sizes_per_gpu: 
+        grouped_sizes_per_gpu:
             Total size assigned to each GPU
-    
+
     Example:
         ```
         sizes = [1000, 100, 200, 50]
-        num_gpus=2
+        num_gpus = 2
         ```
 
     """
@@ -283,9 +285,9 @@ def get_load_balance_assignment(
     # Sort indices by size (largest first for better load balancing)
     # sizes = [1000, 100, 200, 50]
     # large_to_small_indices = [0, 2, 1, 3]
-    large_to_small_indices = sorted(range(n_samples),
-                                    key=lambda i: sizes[i],
-                                    reverse=True)
+    large_to_small_indices = sorted(
+        range(n_samples), key=lambda i: sizes[i], reverse=True
+    )
 
     for idx in large_to_small_indices:
         # Find GPU with minimum current load (by total size)
@@ -316,11 +318,11 @@ def run_dp_sharded_mrope_vision_model(
     *,
     rope_type: Literal["rope_3d", "rope_2d"],
 ) -> tuple[torch.Tensor, ...]:
-    """Run a vision model with data parallelism (DP) sharding. 
-    The function will shard the input image tensor on the 
+    """Run a vision model with data parallelism (DP) sharding.
+    The function will shard the input image tensor on the
     first dimension and run the vision model.
     This function is used to run the vision model with mrope.
-    
+
     Args:
         vision_model (torch.nn.Module): Vision model.
         pixel_values (torch.Tensor): Image/Video input tensor.
@@ -338,7 +340,7 @@ def run_dp_sharded_mrope_vision_model(
         vision_model.spatial_merge_size = 2
         pixel_values.shape = (1350, channel)
         grid_thw_list = [[1, 10, 100], [1, 10, 10], [1, 10, 20], [1, 50]]
-        tp_size=2
+        tp_size = 2
         ```
 
     """
@@ -357,51 +359,57 @@ def run_dp_sharded_mrope_vision_model(
     # image_to_tp_rank = [0, 2, 1, 3]
     # gpu_sample_counts = [1, 3]
     # grouped_pixel_values_len = [1000, 350]
-    (image_to_tp_rank, gpu_sample_counts,
-     grouped_pixel_values_len) = get_load_balance_assignment(
-         patches_per_image, tp_size)
+    (image_to_tp_rank, gpu_sample_counts, grouped_pixel_values_len) = (
+        get_load_balance_assignment(patches_per_image, tp_size)
+    )
 
     # cu_gpu_sample_counts = [0, 1, 4]
     cum_gpu_sample_counts = [0, *itertools.accumulate(gpu_sample_counts)]
 
     # GPU_0 image_idxs_local = [0]
     # GPU_1 image_idxs_local = [2, 1, 3]
-    image_idxs_local = image_to_tp_rank[cum_gpu_sample_counts[tp_rank_local]:
-                                        cum_gpu_sample_counts[tp_rank_local +
-                                                              1]]
+    image_idxs_local = image_to_tp_rank[
+        cum_gpu_sample_counts[tp_rank_local] : cum_gpu_sample_counts[tp_rank_local + 1]
+    ]
 
     # Get the pixel values for the local images based on the image_idxs_local
     if len(image_idxs_local) > 0:
-        pixel_values_local = torch.cat([
-            pixel_values[cum_patches_per_image[i]:cum_patches_per_image[i + 1]]
-            for i in image_idxs_local
-        ])
+        pixel_values_local = torch.cat(
+            [
+                pixel_values[cum_patches_per_image[i] : cum_patches_per_image[i + 1]]
+                for i in image_idxs_local
+            ]
+        )
     else:
         # Handle case where this rank has no images
-        pixel_values_local = torch.empty((0, pixel_values.shape[1]),
-                                         device=pixel_values.device,
-                                         dtype=pixel_values.dtype)
+        pixel_values_local = torch.empty(
+            (0, pixel_values.shape[1]),
+            device=pixel_values.device,
+            dtype=pixel_values.dtype,
+        )
     # embed_dim_reduction_factor = 2 * 2
     if rope_type == "rope_2d":
-        embed_dim_reduction_factor = (vision_model.merge_kernel_size[0] *
-                                      vision_model.merge_kernel_size[1])
+        embed_dim_reduction_factor = (
+            vision_model.merge_kernel_size[0] * vision_model.merge_kernel_size[1]
+        )
     else:
-        embed_dim_reduction_factor = (vision_model.spatial_merge_size *
-                                      vision_model.spatial_merge_size)
+        embed_dim_reduction_factor = (
+            vision_model.spatial_merge_size * vision_model.spatial_merge_size
+        )
 
     # Find the max length across all ranks
     # The output embedding of every DP rank has to be
     # padded to this length for tensor_model_parallel_all_gather
     # to work
-    max_len_per_rank = max(
-        grouped_pixel_values_len) // embed_dim_reduction_factor
+    max_len_per_rank = max(grouped_pixel_values_len) // embed_dim_reduction_factor
     local_grid_thw_list = [grid_thw_list[i] for i in image_idxs_local]
 
     # Run the vision model on the local pixel_values_local
     if rope_type == "rope_2d":
         if pixel_values_local.shape[0] > 0:
             image_embeds_local = vision_model(
-                pixel_values_local, torch.tensor(local_grid_thw_list))
+                pixel_values_local, torch.tensor(local_grid_thw_list)
+            )
             if isinstance(image_embeds_local, list):
                 image_embeds_local = torch.cat(image_embeds_local, dim=0)
         else:
@@ -409,16 +417,18 @@ def run_dp_sharded_mrope_vision_model(
             image_embeds_local = torch.empty(
                 (0, embed_dim_reduction_factor, out_dim),
                 device=pixel_values.device,
-                dtype=pixel_values.dtype)
+                dtype=pixel_values.dtype,
+            )
     else:
         if pixel_values_local.shape[0] > 0:
-            image_embeds_local = vision_model(pixel_values_local,
-                                              local_grid_thw_list)
+            image_embeds_local = vision_model(pixel_values_local, local_grid_thw_list)
         else:
             # Handle empty case
-            image_embeds_local = torch.empty((0, vision_model.out_hidden_size),
-                                             device=pixel_values.device,
-                                             dtype=pixel_values.dtype)
+            image_embeds_local = torch.empty(
+                (0, vision_model.out_hidden_size),
+                device=pixel_values.device,
+                dtype=pixel_values.dtype,
+            )
 
     # Pad the output based on max_len_per_rank
     # for tensor_model_parallel_all_gather to work
@@ -426,33 +436,40 @@ def run_dp_sharded_mrope_vision_model(
     if current_len < max_len_per_rank:
         padding_size = max_len_per_rank - current_len
         if rope_type == "rope_2d":
-            padding = torch.empty((padding_size, image_embeds_local.shape[1],
-                                   image_embeds_local.shape[2]),
-                                  dtype=image_embeds_local.dtype,
-                                  device=image_embeds_local.device)
+            padding = torch.empty(
+                (
+                    padding_size,
+                    image_embeds_local.shape[1],
+                    image_embeds_local.shape[2],
+                ),
+                dtype=image_embeds_local.dtype,
+                device=image_embeds_local.device,
+            )
         else:
-            padding = torch.empty((padding_size, image_embeds_local.shape[1]),
-                                  dtype=image_embeds_local.dtype,
-                                  device=image_embeds_local.device)
-        image_embeds_local_padded = torch.cat([image_embeds_local, padding],
-                                              dim=0)
+            padding = torch.empty(
+                (padding_size, image_embeds_local.shape[1]),
+                dtype=image_embeds_local.dtype,
+                device=image_embeds_local.device,
+            )
+        image_embeds_local_padded = torch.cat([image_embeds_local, padding], dim=0)
     else:
         image_embeds_local_padded = image_embeds_local
 
     # Do all_gather to collect embeddings from all ranks
-    gathered_embeds = tensor_model_parallel_all_gather(
-        image_embeds_local_padded, dim=0)
+    gathered_embeds = tensor_model_parallel_all_gather(image_embeds_local_padded, dim=0)
 
     # Remove padding and reconstruct per-rank embeddings
     rank_embeddings = list[torch.Tensor]()
     for rank in range(tp_size):
         start_idx = rank * max_len_per_rank
-        end_idx = start_idx + (grouped_pixel_values_len[rank] //
-                               embed_dim_reduction_factor)
+        end_idx = start_idx + (
+            grouped_pixel_values_len[rank] // embed_dim_reduction_factor
+        )
         rank_embeddings.append(gathered_embeds[start_idx:end_idx])
 
-    patches_per_output_image = [(patch_size // embed_dim_reduction_factor)
-                                for patch_size in patches_per_image]
+    patches_per_output_image = [
+        (patch_size // embed_dim_reduction_factor) for patch_size in patches_per_image
+    ]
 
     # Reconstruct embeddings in the original order
     original_order_embeddings = [None] * len(grid_thw_list)
@@ -463,7 +480,7 @@ def run_dp_sharded_mrope_vision_model(
             # Get images assigned to this rank in shuffled order
             # GPU_0 = image_idxs_local  [0]
             # GPU_1 = image_idxs_local  [2, 1, 3]
-            rank_images = image_to_tp_rank[current_idx:current_idx + count]
+            rank_images = image_to_tp_rank[current_idx : current_idx + count]
 
             rank_embed = rank_embeddings[rank]
             # Split rank embeddings back to individual images
@@ -471,11 +488,14 @@ def run_dp_sharded_mrope_vision_model(
             for img_idx in rank_images:
                 img_patches = patches_per_output_image[img_idx]
                 original_order_embeddings[img_idx] = rank_embed[
-                    embed_start:embed_start + img_patches]
+                    embed_start : embed_start + img_patches
+                ]
                 embed_start += img_patches
             current_idx += count
-    out_embeddings = tuple(embed for embed in original_order_embeddings
-                           if embed is not None)
-    assert len(out_embeddings) == len(
-        original_order_embeddings), "Found unassigned embeddings"
+    out_embeddings = tuple(
+        embed for embed in original_order_embeddings if embed is not None
+    )
+    assert len(out_embeddings) == len(original_order_embeddings), (
+        "Found unassigned embeddings"
+    )
     return out_embeddings
diff --git a/vllm/model_executor/models/voxtral.py b/vllm/model_executor/models/voxtral.py
index ad494a7a7ec9..6d15a3a02507 100644
--- a/vllm/model_executor/models/voxtral.py
+++ b/vllm/model_executor/models/voxtral.py
@@ -12,8 +12,12 @@
 import torch
 import torch.nn as nn
 from mistral_common.audio import mel_filter_bank
-from mistral_common.protocol.instruct.messages import (AudioChunk, RawAudio,
-                                                       TextChunk, UserMessage)
+from mistral_common.protocol.instruct.messages import (
+    AudioChunk,
+    RawAudio,
+    TextChunk,
+    UserMessage,
+)
 from mistral_common.protocol.instruct.request import ChatCompletionRequest
 from mistral_common.protocol.transcription.request import TranscriptionRequest
 from mistral_common.tokens.tokenizers.audio import Audio, AudioEncoder
@@ -28,23 +32,37 @@
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models import SupportsPP
 from vllm.model_executor.models.module_mapping import MultiModelKeys
+
 # yapf: disable
 from vllm.model_executor.models.whisper import WhisperEncoder
+
 # yapf: enable
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems, MultiModalUUIDDict,
-                                    NestedTensors)
-from vllm.multimodal.parse import (AudioProcessorItems, MultiModalDataItems,
-                                   MultiModalDataParser)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo,
-                                        MultiModalProcessingInfo,
-                                        PromptReplacement, PromptUpdate)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+    MultiModalUUIDDict,
+    NestedTensors,
+)
+from vllm.multimodal.parse import (
+    AudioProcessorItems,
+    MultiModalDataItems,
+    MultiModalDataParser,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    MultiModalProcessingInfo,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder, ProcessorInputs
 from vllm.sequence import IntermediateTensors
-from vllm.transformers_utils.tokenizer import (MistralTokenizer,
-                                               cached_tokenizer_from_config)
+from vllm.transformers_utils.tokenizer import (
+    MistralTokenizer,
+    cached_tokenizer_from_config,
+)
 
 from .interfaces import SupportsLoRA, SupportsMultiModal, SupportsTranscription
 from .utils import flatten_bn, init_vllm_registered_model, maybe_prefix
@@ -109,7 +127,8 @@ def get_num_audio_tokens(
         audio_length: int,
     ) -> int:
         pad_audio_length = self._audio_processor.next_multiple_of_chunk_frames(
-            audio_length, self.sampling_rate)
+            audio_length, self.sampling_rate
+        )
         return ceil(pad_audio_length / (self.sampling_rate // self.frame_rate))
 
     def __call__(
@@ -139,7 +158,8 @@ def __call__(
                 "Make sure to process your input via `mistral_common`'s "
                 "tokenizer or pass a chat completion request. "
                 "For more info, see: "
-                "https://github.com/vllm-project/vllm/issues/8411.")
+                "https://github.com/vllm-project/vllm/issues/8411."
+            )
 
         audios_tokens = list[torch.Tensor]()
         audios_processed = list[torch.Tensor]()
@@ -150,23 +170,22 @@ def __call__(
             # pad if necessary
             audio = self._audio_processor.pad(audio, self.sampling_rate)
 
-            audio_tokens = [
-                self.begin_audio_token_id
-            ] + [self.audio_token_id] * self.get_num_audio_tokens(len(audio))
+            audio_tokens = [self.begin_audio_token_id] + [
+                self.audio_token_id
+            ] * self.get_num_audio_tokens(len(audio))
 
             audios_tokens.append(torch.tensor(audio_tokens))
             audios_processed.append(torch.tensor(audio))
 
-        return BatchFeature({
-            "input_ids":
-            torch.cat(audios_tokens)[None].expand(len(text), -1),
-            "audio_arrays":
-            audios_processed,
-        })
+        return BatchFeature(
+            {
+                "input_ids": torch.cat(audios_tokens)[None].expand(len(text), -1),
+                "audio_arrays": audios_processed,
+            }
+        )
 
 
 class VoxtralProcessingInfo(BaseProcessingInfo):
-
     def get_tokenizer(self) -> MistralTokenizer:
         tokenizer = cached_tokenizer_from_config(self.ctx.model_config)
         if not isinstance(tokenizer, MistralTokenizer):
@@ -193,11 +212,11 @@ def get_max_audio_tokens(self) -> int:
     def get_max_audio_array_len(self) -> int:
         processor = self.get_hf_processor()
         return self.get_max_audio_tokens() * int(
-            processor.sampling_rate // processor.frame_rate)
+            processor.sampling_rate // processor.frame_rate
+        )
 
 
 class VoxtralDummyInputsBuilder(BaseDummyInputsBuilder[VoxtralProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         return ""
 
@@ -214,10 +233,9 @@ def get_dummy_mm_data(
         audio_overrides = mm_options.get("audio") if mm_options else None
 
         return {
-            "audio":
-            self._get_dummy_audios(length=target_length,
-                                   num_audios=num_audios,
-                                   overrides=audio_overrides)
+            "audio": self._get_dummy_audios(
+                length=target_length, num_audios=num_audios, overrides=audio_overrides
+            )
         }
 
     def get_dummy_processor_inputs(
@@ -243,9 +261,11 @@ def get_dummy_processor_inputs(
             chunk = AudioChunk(input_audio=RawAudio.from_audio(audio_item))
             audio_chunks.append(chunk)
 
-        request = ChatCompletionRequest(messages=[
-            UserMessage(content=[TextChunk(text=dummy_text), *audio_chunks]),
-        ])
+        request = ChatCompletionRequest(
+            messages=[
+                UserMessage(content=[TextChunk(text=dummy_text), *audio_chunks]),
+            ]
+        )
         res = tokenizer.mistral.encode_chat_completion(request)
         dummy_tokens = res.tokens
         # whixtral tokenizer adds padding to the audio
@@ -255,9 +275,7 @@ def get_dummy_processor_inputs(
         return ProcessorInputs(prompt=dummy_tokens, mm_data=dummy_mm_data)
 
 
-class VoxtralMultiModalProcessor(BaseMultiModalProcessor[VoxtralProcessingInfo]
-                                 ):
-
+class VoxtralMultiModalProcessor(BaseMultiModalProcessor[VoxtralProcessingInfo]):
     def _get_mm_fields_config(
         self,
         hf_inputs: Mapping[str, NestedTensors],
@@ -315,17 +333,19 @@ def _get_data_parser(self) -> MultiModalDataParser:
         return MultiModalDataParser(target_sr=sampling_rate)
 
 
-@MULTIMODAL_REGISTRY.register_processor(VoxtralMultiModalProcessor,
-                                        info=VoxtralProcessingInfo,
-                                        dummy_inputs=VoxtralDummyInputsBuilder)
-class VoxtralForConditionalGeneration(nn.Module, SupportsMultiModal,
-                                      SupportsPP, SupportsLoRA,
-                                      SupportsTranscription):
+@MULTIMODAL_REGISTRY.register_processor(
+    VoxtralMultiModalProcessor,
+    info=VoxtralProcessingInfo,
+    dummy_inputs=VoxtralDummyInputsBuilder,
+)
+class VoxtralForConditionalGeneration(
+    nn.Module, SupportsMultiModal, SupportsPP, SupportsLoRA, SupportsTranscription
+):
     supported_languages = ISO639_1_SUPPORTED_LANGS
 
     packed_modules_mapping = {
         "qkv_proj": ["q_proj", "k_proj", "v_proj"],
-        "gate_up_proj": ["gate_proj", "up_proj"]
+        "gate_up_proj": ["gate_proj", "up_proj"],
     }
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
@@ -336,7 +356,8 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         # match the vLLM model names
         if hasattr(vllm_config, "quant_config"):
             vllm_config.quant_config = self.maybe_update_quant_config(
-                vllm_config.quant_config)
+                vllm_config.quant_config
+            )
 
         config = vllm_config.model_config.hf_config
         self.config = config
@@ -378,17 +399,15 @@ def forward(
         if intermediate_tensors is not None:
             inputs_embeds = None
 
-        hidden_states = self.language_model.model(input_ids,
-                                                  positions,
-                                                  intermediate_tensors,
-                                                  inputs_embeds=inputs_embeds)
+        hidden_states = self.language_model.model(
+            input_ids, positions, intermediate_tensors, inputs_embeds=inputs_embeds
+        )
 
         return hidden_states
 
     def get_multimodal_embeddings(
         self, **kwargs
-    ) -> Union[list[torch.Tensor], torch.Tensor, tuple[torch.Tensor, ...],
-               None]:
+    ) -> Union[list[torch.Tensor], torch.Tensor, tuple[torch.Tensor, ...], None]:
         audio_inputs = self._parse_and_validate_audio_arrays(**kwargs)
         if audio_inputs is None:
             return None
@@ -399,34 +418,36 @@ def get_multimodal_embeddings(
             seq_len, dim = audio_embedding.shape
             # Pad such that seq_len is divisible by downsample_factor
             target_seq_len = self.downsample_factor * math.ceil(
-                seq_len / self.downsample_factor)
+                seq_len / self.downsample_factor
+            )
             audio_embedding = torch.nn.functional.pad(
                 audio_embedding,
                 (0, 0, 0, target_seq_len - seq_len),
             )
             audio_embeddings[i] = audio_embedding.reshape(
-                target_seq_len // self.downsample_factor,
-                dim * self.downsample_factor)
+                target_seq_len // self.downsample_factor, dim * self.downsample_factor
+            )
 
         # Concat, project and resplit
         audio_embeddings_packed = torch.cat(audio_embeddings, dim=0)
-        audio_embeddings_packed = self.audio_language_adapter(
-            audio_embeddings_packed)
-        audio_embeddings = torch.split(audio_embeddings_packed,
-                                       [a.shape[0] for a in audio_embeddings],
-                                       dim=0)
+        audio_embeddings_packed = self.audio_language_adapter(audio_embeddings_packed)
+        audio_embeddings = torch.split(
+            audio_embeddings_packed, [a.shape[0] for a in audio_embeddings], dim=0
+        )
 
         return audio_embeddings
 
     def _parse_and_validate_audio_arrays(
-            self, **kwargs: object) -> Union[list[torch.Tensor], None]:
+        self, **kwargs: object
+    ) -> Union[list[torch.Tensor], None]:
         audio_arrays = kwargs.pop("audio_arrays", None)
         if audio_arrays is None:
             return None
 
         if not isinstance(audio_arrays, (torch.Tensor, list)):
-            raise ValueError("Incorrect type of audio_arrays. "
-                             f"Got type: {type(audio_arrays)}")
+            raise ValueError(
+                f"Incorrect type of audio_arrays. Got type: {type(audio_arrays)}"
+            )
 
         audio_arrays = flatten_bn(audio_arrays)
         if isinstance(audio_arrays, torch.Tensor):
@@ -440,8 +461,9 @@ def compute_logits(
         return self.language_model.compute_logits(hidden_states)
 
     @classmethod
-    def get_speech_to_text_config(cls, model_config: ModelConfig,
-                                  task_type: str) -> SpeechToTextConfig:
+    def get_speech_to_text_config(
+        cls, model_config: ModelConfig, task_type: str
+    ) -> SpeechToTextConfig:
         tokenizer = cached_tokenizer_from_config(model_config)
         audio_config = tokenizer.instruct.audio_encoder.audio_config
         max_audio_clip_s = audio_config.chunk_length_s
@@ -455,19 +477,23 @@ def get_speech_to_text_config(cls, model_config: ModelConfig,
 
     @classmethod
     # for speech-to-text transcription
-    def get_generation_prompt(cls, audio: np.ndarray,
-                              model_config: ModelConfig,
-                              stt_config: SpeechToTextConfig,
-                              language: Optional[str],
-                              task_type: Literal["transcribe", "translate"],
-                              request_prompt: str,
-                              to_language: Optional[str]) -> PromptType:
+    def get_generation_prompt(
+        cls,
+        audio: np.ndarray,
+        model_config: ModelConfig,
+        stt_config: SpeechToTextConfig,
+        language: Optional[str],
+        task_type: Literal["transcribe", "translate"],
+        request_prompt: str,
+        to_language: Optional[str],
+    ) -> PromptType:
         tokenizer = cached_tokenizer_from_config(model_config)
-        audio = Audio(audio, int(stt_config.sample_rate),
-                      format="wav")  # lossless
-        req = TranscriptionRequest(model=model_config.model,
-                                   audio=RawAudio.from_audio(audio),
-                                   language=language)
+        audio = Audio(audio, int(stt_config.sample_rate), format="wav")  # lossless
+        req = TranscriptionRequest(
+            model=model_config.model,
+            audio=RawAudio.from_audio(audio),
+            language=language,
+        )
 
         tokenized = tokenizer.instruct.encode_transcription(req)
         audio = (tokenized.audios[0].audio_array, stt_config.sample_rate)
@@ -476,21 +502,24 @@ def get_generation_prompt(cls, audio: np.ndarray,
         return cast(PromptType, prompts_dict)
 
     @classmethod
-    def get_num_audio_tokens(cls, audio_duration_s: float,
-                             stt_config: SpeechToTextConfig,
-                             model_config: ModelConfig) -> Optional[int]:
+    def get_num_audio_tokens(
+        cls,
+        audio_duration_s: float,
+        stt_config: SpeechToTextConfig,
+        model_config: ModelConfig,
+    ) -> Optional[int]:
         """
-        Map from audio duration to number of audio tokens produced by the ASR 
+        Map from audio duration to number of audio tokens produced by the ASR
         model, without running a forward pass.
         This is used for estimating the amount of processing for this audio.
         """
         tokenizer = cached_tokenizer_from_config(model_config)
         adapter = VoxtralProcessorAdapter(tokenizer)
         return adapter.get_num_audio_tokens(
-            int(audio_duration_s * stt_config.sample_rate))
+            int(audio_duration_s * stt_config.sample_rate)
+        )
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         # fmt: off
         remapping_rules = [
             (r"mm_whisper_embeddings\.(.*)", r"\1"),
@@ -501,10 +530,12 @@ def load_weights(self, weights: Iterable[tuple[str,
         # fmt: on
 
         audio_params = dict(
-            nn.ModuleDict({
-                "audio_language_adapter":
-                self.audio_language_adapter,
-            }).named_parameters())
+            nn.ModuleDict(
+                {
+                    "audio_language_adapter": self.audio_language_adapter,
+                }
+            ).named_parameters()
+        )
 
         loaded_weights = set()
 
@@ -512,10 +543,12 @@ def llm_weights_generator():
             nonlocal loaded_weights
             for name, w in weights:
                 is_encoder = (
-                    name.startswith("mm_whisper_embeddings") and
-                    not name.startswith("mm_whisper_embeddings.tok_embeddings")
+                    name.startswith("mm_whisper_embeddings")
+                    and not name.startswith("mm_whisper_embeddings.tok_embeddings")
                     and not name.startswith(
-                        "mm_whisper_embeddings.audio_language_projection"))
+                        "mm_whisper_embeddings.audio_language_projection"
+                    )
+                )
 
                 for pattern, repl in remapping_rules:
                     if re.fullmatch(pattern, name):
@@ -546,7 +579,8 @@ def llm_weights_generator():
         return loaded_weights
 
     def maybe_update_quant_config(
-            self, quant_config: QuantizationConfig) -> QuantizationConfig:
+        self, quant_config: QuantizationConfig
+    ) -> QuantizationConfig:
         """
         Update quant config to so that ignored module and target module names
         match the vLLM model names.
@@ -555,32 +589,54 @@ def maybe_update_quant_config(
         """
         remapping_rules = [
             (r"output", r"language_model.lm_head"),
-            (r"layers\.(\d+)\.attention\.wo",
-             r"language_model.model.layers.\1.self_attn.out_proj"),
-            (r"layers\.(\d+)\.attention\.w(.*)",
-             r"language_model.model.layers.\1.self_attn.\2_proj"),
-            (r"layers\.(\d+)\.feed_forward\.w1",
-             r"language_model.model.layers.\1.mlp.gate_proj"),
-            (r"layers\.(\d+)\.feed_forward\.w2",
-             r"language_model.model.layers.\1.mlp.down_proj"),
-            (r"layers\.(\d+)\.feed_forward\.w3",
-             r"language_model.model.layers.\1.mlp.up_proj"),
-            (r"mm_whisper_embeddings\.whisper_encoder\.transformer\.layers\.(\d+)\.attention.w(.*)",
-             r"whisper_encoder.whisper_encoder.layers.\1.layers.self_attn.\2_proj"
-             ),
-            (r"mm_whisper_embeddings\.whisper_encoder\.transformer\.layers\.(\d+)\.attention.wo",
-             r"whisper_encoder.whisper_encoder.layers.\1.layers.self_attn.out_proj"
-             ),
-            (r"mm_whisper_embeddings\.whisper_encoder\.transformer\.layers\.(\d+)\.feed_forward.w(\d+)",
-             r"whisper_encoder.whisper_encoder.layers.\1.layers.mlp.fc\2"),
-            (r"mm_whisper_embeddings\.whisper_encoder\.conv_layers\.0",
-             r"whisper_encoder.whisper_encoder.conv1"),
-            (r"mm_whisper_embeddings\.whisper_encoder\.conv_layers\.1",
-             r"whisper_encoder.whisper_encoder.conv2"),
-            (r"mm_whisper_embeddings\.audio_language_projection\.0",
-             r"audio_language_adapter.w_in"),
-            (r"mm_whisper_embeddings\.audio_language_projection\.2",
-             r"audio_language_adapter.w_out"),
+            (
+                r"layers\.(\d+)\.attention\.wo",
+                r"language_model.model.layers.\1.self_attn.out_proj",
+            ),
+            (
+                r"layers\.(\d+)\.attention\.w(.*)",
+                r"language_model.model.layers.\1.self_attn.\2_proj",
+            ),
+            (
+                r"layers\.(\d+)\.feed_forward\.w1",
+                r"language_model.model.layers.\1.mlp.gate_proj",
+            ),
+            (
+                r"layers\.(\d+)\.feed_forward\.w2",
+                r"language_model.model.layers.\1.mlp.down_proj",
+            ),
+            (
+                r"layers\.(\d+)\.feed_forward\.w3",
+                r"language_model.model.layers.\1.mlp.up_proj",
+            ),
+            (
+                r"mm_whisper_embeddings\.whisper_encoder\.transformer\.layers\.(\d+)\.attention.w(.*)",
+                r"whisper_encoder.whisper_encoder.layers.\1.layers.self_attn.\2_proj",
+            ),
+            (
+                r"mm_whisper_embeddings\.whisper_encoder\.transformer\.layers\.(\d+)\.attention.wo",
+                r"whisper_encoder.whisper_encoder.layers.\1.layers.self_attn.out_proj",
+            ),
+            (
+                r"mm_whisper_embeddings\.whisper_encoder\.transformer\.layers\.(\d+)\.feed_forward.w(\d+)",
+                r"whisper_encoder.whisper_encoder.layers.\1.layers.mlp.fc\2",
+            ),
+            (
+                r"mm_whisper_embeddings\.whisper_encoder\.conv_layers\.0",
+                r"whisper_encoder.whisper_encoder.conv1",
+            ),
+            (
+                r"mm_whisper_embeddings\.whisper_encoder\.conv_layers\.1",
+                r"whisper_encoder.whisper_encoder.conv2",
+            ),
+            (
+                r"mm_whisper_embeddings\.audio_language_projection\.0",
+                r"audio_language_adapter.w_in",
+            ),
+            (
+                r"mm_whisper_embeddings\.audio_language_projection\.2",
+                r"audio_language_adapter.w_out",
+            ),
         ]
 
         # Update ignore list
@@ -613,7 +669,6 @@ def maybe_update_quant_config(
 
 
 class AudioLanguageAdapter(nn.Module):
-
     def __init__(self, hidden_size: int, dim: int) -> None:
         super().__init__()
         self.w_in = nn.Linear(hidden_size, dim, bias=False)
@@ -650,10 +705,11 @@ def __init__(
         super().__init__()
         self.config = cast(WhisperConfig, vllm_config.model_config.hf_config)
         self.dtype: torch.dtype = vllm_config.model_config.dtype
-        self.whisper_encoder = WhisperEncoder(vllm_config=vllm_config,
-                                              prefix=maybe_prefix(
-                                                  prefix, "whisper_encoder"),
-                                              init_in_fp32=True)
+        self.whisper_encoder = WhisperEncoder(
+            vllm_config=vllm_config,
+            prefix=maybe_prefix(prefix, "whisper_encoder"),
+            init_in_fp32=True,
+        )
         mel_filters = mel_filter_bank(
             num_frequency_bins=1 + self.config.window_size // 2,
             num_mel_bins=self.config.num_mel_bins,
@@ -668,8 +724,7 @@ def compute_whisper_melspec(
         audio_waveforms: torch.Tensor,
     ) -> torch.Tensor:
         input_dtype = audio_waveforms.dtype
-        window = torch.hann_window(self.config.window_size).to(
-            audio_waveforms.device)
+        window = torch.hann_window(self.config.window_size).to(audio_waveforms.device)
         stft = torch.stft(
             audio_waveforms,
             self.config.window_size,
@@ -677,7 +732,7 @@ def compute_whisper_melspec(
             window=window,
             return_complex=True,
         )
-        magnitudes = stft[..., :-1].abs()**2
+        magnitudes = stft[..., :-1].abs() ** 2
         mel_spec = self.mel_filters.T @ magnitudes
         log_spec = torch.clamp(mel_spec, min=1e-10).log10()
         log_spec = torch.maximum(log_spec, log_spec.max() - 8.0)
@@ -686,8 +741,9 @@ def compute_whisper_melspec(
 
     @property
     def downsample_factor(self) -> int:
-        return self.whisper_encoder.conv1.stride[
-            0] * self.whisper_encoder.conv2.stride[0]
+        return (
+            self.whisper_encoder.conv1.stride[0] * self.whisper_encoder.conv2.stride[0]
+        )
 
     @property
     def chunk_size(self) -> int:
@@ -721,8 +777,7 @@ def forward(
             input_features = [input_features]
 
         # Split long inputs into chunks
-        input_embeds, chunks_per_example = (
-            self.prepare_inputs_for_conv(input_features))
+        input_embeds, chunks_per_example = self.prepare_inputs_for_conv(input_features)
 
         # [total_num_chunks, ceil(chunk_size / downsample_factor), hidden_size]
         out = self.whisper_encoder([input_embeds])
@@ -731,7 +786,7 @@ def forward(
         chunk_idx = 0
         results = []
         for n_chunks in chunks_per_example:
-            result = out[chunk_idx:chunk_idx + n_chunks].flatten(0, 1)
+            result = out[chunk_idx : chunk_idx + n_chunks].flatten(0, 1)
             results.append(result)
             chunk_idx += n_chunks
 
@@ -751,7 +806,7 @@ def load_weight(self, weight: tuple[str, torch.Tensor]) -> str:
             if re.fullmatch(pattern, name):
                 name = re.sub(pattern, repl, name)
 
-        for (param_name, weight_name, shard_id) in stacked_params_mapping:
+        for param_name, weight_name, shard_id in stacked_params_mapping:
             if weight_name not in name:
                 continue
             name = name.replace(weight_name, param_name)
@@ -762,8 +817,7 @@ def load_weight(self, weight: tuple[str, torch.Tensor]) -> str:
             break
         else:
             param = params_dict[name]
-            weight_loader = getattr(param, "weight_loader",
-                                    default_weight_loader)
+            weight_loader = getattr(param, "weight_loader", default_weight_loader)
             weight_loader(param, loaded_weight)
 
         return name
diff --git a/vllm/model_executor/models/whisper.py b/vllm/model_executor/models/whisper.py
index 84686b8b1941..ce9634935d24 100644
--- a/vllm/model_executor/models/whisper.py
+++ b/vllm/model_executor/models/whisper.py
@@ -9,43 +9,58 @@
 import numpy as np
 import torch
 from torch import nn
-from transformers import (BatchFeature, WhisperConfig, WhisperFeatureExtractor,
-                          WhisperProcessor)
+from transformers import (
+    BatchFeature,
+    WhisperConfig,
+    WhisperFeatureExtractor,
+    WhisperProcessor,
+)
 from transformers.models.whisper.modeling_whisper import sinusoids
 
 from vllm.attention import Attention, AttentionType
 from vllm.attention.layer import MultiHeadAttention
 from vllm.attention.layers.cross_attention import CrossAttention
-from vllm.config import (CacheConfig, ModelConfig, SpeechToTextConfig,
-                         VllmConfig)
+from vllm.config import CacheConfig, ModelConfig, SpeechToTextConfig, VllmConfig
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.inputs.data import PromptType
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import get_act_fn
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    QKVParallelLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
 from vllm.model_executor.model_loader.utils import set_default_torch_dtype
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.multimodal import MULTIMODAL_REGISTRY, NestedTensors
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
 from vllm.multimodal.parse import MultiModalDataItems, MultiModalDataParser
-from vllm.multimodal.processing import (BaseProcessingInfo,
-                                        EncDecMultiModalProcessor,
-                                        PromptReplacement, PromptUpdate)
+from vllm.multimodal.processing import (
+    BaseProcessingInfo,
+    EncDecMultiModalProcessor,
+    PromptReplacement,
+    PromptUpdate,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.transformers_utils.processor import cached_get_processor
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-from .interfaces import (MultiModalEmbeddings, SupportsMultiModal,
-                         SupportsTranscription)
-from .utils import (AutoWeightsLoader, WeightsMapper, cast_overflow_tensors,
-                    make_layers, maybe_prefix)
+from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsTranscription
+from .utils import (
+    AutoWeightsLoader,
+    WeightsMapper,
+    cast_overflow_tensors,
+    make_layers,
+    maybe_prefix,
+)
 
 logger = init_logger(__name__)
 
@@ -108,7 +123,7 @@
     "uk": "Ukrainian",
     "ur": "Urdu",
     "vi": "Vietnamese",
-    "cy": "Welsh"
+    "cy": "Welsh",
 }
 
 
@@ -120,8 +135,7 @@ class WhisperAudioInputs(TensorSchema):
         - t: Time frames (M)
     """
 
-    input_features: Annotated[Optional[NestedTensors],
-                              TensorShape("b", "nmb", "t")]
+    input_features: Annotated[Optional[NestedTensors], TensorShape("b", "nmb", "t")]
 
 
 class WhisperEncoderAttention(MultiHeadAttention):
@@ -153,7 +167,6 @@ def forward(
 
 
 class WhisperPositionalEmbedding(nn.Embedding):
-
     def __init__(self, num_positions: int, embedding_dim: int):
         super().__init__(num_positions, embedding_dim)
 
@@ -162,7 +175,6 @@ def forward(self, position_ids):
 
 
 class WhisperAttention(nn.Module):
-
     def __init__(
         self,
         embed_dim: int,
@@ -196,7 +208,8 @@ def __init__(
         if (self.head_dim * num_heads) != self.embed_dim:
             raise ValueError(
                 f"embed_dim must be divisible by num_heads (got `embed_dim`: "
-                f"{self.embed_dim} and `num_heads`: {num_heads}).")
+                f"{self.embed_dim} and `num_heads`: {num_heads})."
+            )
         self.scaling = self.head_dim**-0.5
 
         self._init_qkv(embed_dim, bias, quant_config, prefix=prefix)
@@ -269,7 +282,6 @@ def forward(
 
 
 class WhisperCrossAttention(WhisperAttention):
-
     def __init__(
         self,
         embed_dim: int,
@@ -336,7 +348,6 @@ def forward(
 
 
 class WhisperMLP(nn.Module):
-
     def __init__(
         self,
         embed_dim: int,
@@ -369,7 +380,6 @@ def forward(self, hidden_states: torch.Tensor):
 
 
 class WhisperEncoderLayer(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
@@ -414,7 +424,6 @@ def forward(
 
 
 class WhisperDecoderLayer(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
@@ -474,48 +483,39 @@ def forward(
 
 
 class WhisperEncoder(nn.Module):
-
-    def __init__(self,
-                 *,
-                 vllm_config: VllmConfig,
-                 prefix: str = "",
-                 init_in_fp32: bool = False):
+    def __init__(
+        self, *, vllm_config: VllmConfig, prefix: str = "", init_in_fp32: bool = False
+    ):
         super().__init__()
         config = vllm_config.model_config.hf_config
         embed_dim = config.d_model
         self.num_mel_bins = config.num_mel_bins
         self.max_source_positions = config.max_source_positions
-        self.embed_scale = (math.sqrt(embed_dim)
-                            if config.scale_embedding else 1.0)
-
-        self.conv1 = nn.Conv1d(self.num_mel_bins,
-                               embed_dim,
-                               kernel_size=3,
-                               padding=1)
-        self.conv2 = nn.Conv1d(embed_dim,
-                               embed_dim,
-                               kernel_size=3,
-                               stride=2,
-                               padding=1)
+        self.embed_scale = math.sqrt(embed_dim) if config.scale_embedding else 1.0
+
+        self.conv1 = nn.Conv1d(self.num_mel_bins, embed_dim, kernel_size=3, padding=1)
+        self.conv2 = nn.Conv1d(embed_dim, embed_dim, kernel_size=3, stride=2, padding=1)
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.encoder_layers,
-            lambda prefix: WhisperEncoderLayer(vllm_config=vllm_config,
-                                               prefix=f"{prefix}.layers"),
+            lambda prefix: WhisperEncoderLayer(
+                vllm_config=vllm_config, prefix=f"{prefix}.layers"
+            ),
             prefix=f"{prefix}.layers",
         )
         self.layer_norm = nn.LayerNorm(config.d_model)
 
-        maybe_fp32_init_ctx = set_default_torch_dtype(
-            torch.float32) if init_in_fp32 else nullcontext()
+        maybe_fp32_init_ctx = (
+            set_default_torch_dtype(torch.float32) if init_in_fp32 else nullcontext()
+        )
 
         with (
-                torch.no_grad(),
-                maybe_fp32_init_ctx,
+            torch.no_grad(),
+            maybe_fp32_init_ctx,
         ):
-            self.embed_positions = nn.Embedding(self.max_source_positions,
-                                                embed_dim)
+            self.embed_positions = nn.Embedding(self.max_source_positions, embed_dim)
             self.embed_positions.weight.copy_(
-                sinusoids(*self.embed_positions.weight.shape))
+                sinusoids(*self.embed_positions.weight.shape)
+            )
 
     def forward(self, input_features: Union[torch.Tensor, list[torch.Tensor]]):
         hidden_states = []
@@ -523,9 +523,9 @@ def forward(self, input_features: Union[torch.Tensor, list[torch.Tensor]]):
             embeds = nn.functional.gelu(self.conv1(features))
             embeds = nn.functional.gelu(self.conv2(embeds))
             embeds = embeds.transpose(-1, -2)
-            embeds = (embeds +
-                      self.embed_positions.weight[:embeds.size(-2), :]).to(
-                          embeds.dtype)
+            embeds = (embeds + self.embed_positions.weight[: embeds.size(-2), :]).to(
+                embeds.dtype
+            )
             hidden_states.append(embeds)
         hidden_states = torch.cat(hidden_states)
 
@@ -537,7 +537,6 @@ def forward(self, input_features: Union[torch.Tensor, list[torch.Tensor]]):
 
 
 class WhisperDecoder(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
         config = vllm_config.model_config.hf_config
@@ -545,17 +544,19 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         self.padding_idx = config.pad_token_id
         self.max_target_positions = config.max_target_positions
         self.max_source_positions = config.max_source_positions
-        self.embed_scale = (math.sqrt(config.d_model)
-                            if config.scale_embedding else 1.0)
+        self.embed_scale = math.sqrt(config.d_model) if config.scale_embedding else 1.0
 
-        self.embed_tokens = nn.Embedding(config.vocab_size, config.d_model,
-                                         self.padding_idx)
+        self.embed_tokens = nn.Embedding(
+            config.vocab_size, config.d_model, self.padding_idx
+        )
         self.embed_positions = WhisperPositionalEmbedding(
-            self.max_target_positions, config.d_model)
+            self.max_target_positions, config.d_model
+        )
         self.start_layer, self.end_layer, self.layers = make_layers(
             config.decoder_layers,
-            lambda prefix: WhisperDecoderLayer(vllm_config=vllm_config,
-                                               prefix=f"{prefix}.layers"),
+            lambda prefix: WhisperDecoderLayer(
+                vllm_config=vllm_config, prefix=f"{prefix}.layers"
+            ),
             prefix=f"{prefix}.layers",
         )
         self.layer_norm = nn.LayerNorm(config.d_model)
@@ -584,13 +585,14 @@ def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
 
 
 class WhisperModel(nn.Module):
-
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
-        self.encoder = WhisperEncoder(vllm_config=vllm_config,
-                                      prefix=f"{prefix}.encoder")
-        self.decoder = WhisperDecoder(vllm_config=vllm_config,
-                                      prefix=f"{prefix}.decoder")
+        self.encoder = WhisperEncoder(
+            vllm_config=vllm_config, prefix=f"{prefix}.encoder"
+        )
+        self.decoder = WhisperDecoder(
+            vllm_config=vllm_config, prefix=f"{prefix}.decoder"
+        )
 
     def forward(
         self,
@@ -614,8 +616,7 @@ def get_encoder_outputs(
             return None
         return self.encoder(input_features)
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             (".self_attn.qkv_proj", ".self_attn.q_proj", "q"),
@@ -645,15 +646,13 @@ def load_weights(self, weights: Iterable[tuple[str,
                     continue
 
                 param = params_dict[name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(name)
         return loaded_params
 
 
 class WhisperProcessingInfo(BaseProcessingInfo):
-
     def get_hf_config(self) -> WhisperConfig:
         return self.ctx.get_hf_config(WhisperConfig)
 
@@ -670,8 +669,7 @@ def get_hf_processor(self, **kwargs: object) -> WhisperProcessor:
     def get_supported_mm_limits(self) -> Mapping[str, Optional[int]]:
         return {"audio": 1}
 
-    def get_feature_extractor(self,
-                              **kwargs: object) -> WhisperFeatureExtractor:
+    def get_feature_extractor(self, **kwargs: object) -> WhisperFeatureExtractor:
         hf_processor = self.get_hf_processor(**kwargs)
         feature_extractor = hf_processor.feature_extractor  # type: ignore
         assert isinstance(feature_extractor, WhisperFeatureExtractor)
@@ -682,7 +680,6 @@ def get_num_audio_tokens(self) -> int:
 
 
 class WhisperDummyInputsBuilder(BaseDummyInputsBuilder[WhisperProcessingInfo]):
-
     def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
         num_audios = mm_counts.get("audio", 0)
 
@@ -703,16 +700,13 @@ def get_dummy_mm_data(
         audio_overrides = mm_options.get("audio") if mm_options else None
 
         return {
-            "audio":
-            self._get_dummy_audios(length=audio_len,
-                                   num_audios=num_audios,
-                                   overrides=audio_overrides)
+            "audio": self._get_dummy_audios(
+                length=audio_len, num_audios=num_audios, overrides=audio_overrides
+            )
         }
 
 
-class WhisperMultiModalProcessor(
-        EncDecMultiModalProcessor[WhisperProcessingInfo]):
-
+class WhisperMultiModalProcessor(EncDecMultiModalProcessor[WhisperProcessingInfo]):
     def _get_data_parser(self) -> MultiModalDataParser:
         feature_extractor = self.info.get_feature_extractor()
         return MultiModalDataParser(target_sr=feature_extractor.sampling_rate)
@@ -779,11 +773,14 @@ def _get_prompt_updates(
         ]
 
 
-@MULTIMODAL_REGISTRY.register_processor(WhisperMultiModalProcessor,
-                                        info=WhisperProcessingInfo,
-                                        dummy_inputs=WhisperDummyInputsBuilder)
-class WhisperForConditionalGeneration(nn.Module, SupportsTranscription,
-                                      SupportsMultiModal):
+@MULTIMODAL_REGISTRY.register_processor(
+    WhisperMultiModalProcessor,
+    info=WhisperProcessingInfo,
+    dummy_inputs=WhisperDummyInputsBuilder,
+)
+class WhisperForConditionalGeneration(
+    nn.Module, SupportsTranscription, SupportsMultiModal
+):
     packed_modules_mapping = {
         "self_attn.qkv_proj": [
             "self_attn.q_proj",
@@ -793,10 +790,9 @@ class WhisperForConditionalGeneration(nn.Module, SupportsTranscription,
         "encoder_attn.kv_proj": ["encoder_attn.k_proj", "encoder_attn.v_proj"],
     }
 
-    hf_to_vllm_mapper = WeightsMapper(orig_to_new_substr={
-        ".fc1.": ".mlp.fc1.",
-        ".fc2.": ".mlp.fc2."
-    })
+    hf_to_vllm_mapper = WeightsMapper(
+        orig_to_new_substr={".fc1.": ".mlp.fc1.", ".fc2.": ".mlp.fc2."}
+    )
 
     # Whisper only supports audio-conditioned generation.
     supports_transcription_only = True
@@ -811,23 +807,26 @@ def validate_language(cls, language: Optional[str]) -> Optional[str]:
             logger.warning(
                 "Defaulting to language='en'. If you wish to transcribe "
                 "audio in a different language, pass the `language` field "
-                "in the TranscriptionRequest.")
+                "in the TranscriptionRequest."
+            )
             language = "en"
         return super().validate_language(language)
 
     @classmethod
     def get_generation_prompt(
-            cls,
-            audio: np.ndarray,
-            model_config: ModelConfig,  # not needed here
-            stt_config: SpeechToTextConfig,
-            language: Optional[str],
-            task_type: Literal["transcribe", "translate"],
-            request_prompt: str,
-            to_language: Optional[str]) -> PromptType:
+        cls,
+        audio: np.ndarray,
+        model_config: ModelConfig,  # not needed here
+        stt_config: SpeechToTextConfig,
+        language: Optional[str],
+        task_type: Literal["transcribe", "translate"],
+        request_prompt: str,
+        to_language: Optional[str],
+    ) -> PromptType:
         if language is None:
             raise ValueError(
-                "Language must be specified when creating the Whisper prompt")
+                "Language must be specified when creating the Whisper prompt"
+            )
         prompt = {
             "encoder_prompt": {
                 # Whisper does not support encoder prompt.
@@ -836,10 +835,11 @@ def get_generation_prompt(
                     "audio": (audio, stt_config.sample_rate),
                 },
             },
-            "decoder_prompt":
-            ((f"<|prev|>{request_prompt}" if request_prompt else "") +
-             f"<|startoftranscript|><|{language}|>" +
-             f"<|{task_type}|><|notimestamps|>")
+            "decoder_prompt": (
+                (f"<|prev|>{request_prompt}" if request_prompt else "")
+                + f"<|startoftranscript|><|{language}|>"
+                + f"<|{task_type}|><|notimestamps|>"
+            ),
         }
         return cast(PromptType, prompt)
 
@@ -851,8 +851,9 @@ def get_placeholder_str(cls, modality: str, i: int) -> Optional[str]:
         raise ValueError("Only audio modality is supported")
 
     @classmethod
-    def get_speech_to_text_config(cls, model_config: ModelConfig,
-                                  task_type: str) -> SpeechToTextConfig:
+    def get_speech_to_text_config(
+        cls, model_config: ModelConfig, task_type: str
+    ) -> SpeechToTextConfig:
         processor = cached_get_processor(model_config.model)
 
         return SpeechToTextConfig(
@@ -861,9 +862,12 @@ def get_speech_to_text_config(cls, model_config: ModelConfig,
         )
 
     @classmethod
-    def get_num_audio_tokens(cls, audio_duration_s: float,
-                             stt_config: SpeechToTextConfig,
-                             model_config: ModelConfig) -> Optional[int]:
+    def get_num_audio_tokens(
+        cls,
+        audio_duration_s: float,
+        stt_config: SpeechToTextConfig,
+        model_config: ModelConfig,
+    ) -> Optional[int]:
         processor = cached_get_processor(model_config.model)
         hop_length = processor.feature_extractor.hop_length
         assert hop_length is not None
@@ -871,8 +875,7 @@ def get_num_audio_tokens(cls, audio_duration_s: float,
         # prompts directly at least not to Whisper.
         # One indicator of the encoder amount of processing
         # is the log-mel spectogram length.
-        return math.ceil(audio_duration_s * stt_config.sample_rate /
-                         hop_length)
+        return math.ceil(audio_duration_s * stt_config.sample_rate / hop_length)
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
         super().__init__()
@@ -883,15 +886,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
 
         self.model = WhisperModel(vllm_config=vllm_config, prefix=prefix)
         self.unpadded_vocab_size = config.vocab_size
-        self.proj_out = ParallelLMHead(config.vocab_size,
-                                       config.d_model,
-                                       quant_config=quant_config,
-                                       prefix=maybe_prefix(prefix, "proj_out"))
-        self.proj_out = self.proj_out.tie_weights(
-            self.model.decoder.embed_tokens)
+        self.proj_out = ParallelLMHead(
+            config.vocab_size,
+            config.d_model,
+            quant_config=quant_config,
+            prefix=maybe_prefix(prefix, "proj_out"),
+        )
+        self.proj_out = self.proj_out.tie_weights(self.model.decoder.embed_tokens)
         logit_scale = getattr(config, "logit_scale", 1.0)
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size, logit_scale)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size, logit_scale
+        )
 
     def forward(
         self,
@@ -910,8 +915,7 @@ def forward(
     def get_language_model(self) -> torch.nn.Module:
         return self.model.decoder
 
-    def get_multimodal_embeddings(self,
-                                  **kwargs: object) -> MultiModalEmbeddings:
+    def get_multimodal_embeddings(self, **kwargs: object) -> MultiModalEmbeddings:
         # Required as part of SupportsMultiModal interface.
         audio_input = self._parse_and_validate_audio_input(**kwargs)
         return [self.model.get_encoder_outputs(audio_input["input_features"])]
@@ -928,16 +932,16 @@ def get_input_embeddings(
         # Whisper does not have encoder text tokens.
         return self.model.decoder.get_input_embeddings(input_ids)
 
-    def _parse_and_validate_audio_input(
-            self, **kwargs: object) -> WhisperAudioInputs:
+    def _parse_and_validate_audio_input(self, **kwargs: object) -> WhisperAudioInputs:
         input_features = kwargs.pop("input_features", None)
 
         if input_features is not None:
             if not isinstance(input_features, (torch.Tensor, list)):
-                raise ValueError("Incorrect type of audio features. "
-                                 f"Got type: {type(input_features)}")
-            input_features = torch.cat(
-                [feat.to(self.dtype) for feat in input_features])
+                raise ValueError(
+                    "Incorrect type of audio features. "
+                    f"Got type: {type(input_features)}"
+                )
+            input_features = torch.cat([feat.to(self.dtype) for feat in input_features])
 
         return WhisperAudioInputs(input_features=input_features)
 
@@ -945,8 +949,7 @@ def compute_logits(self, hidden_states: torch.Tensor) -> torch.Tensor:
         logits = self.logits_processor(self.proj_out, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self, skip_prefixes=["proj_out."])
 
         # add fake zeros bias for k_proj to state_dict
@@ -955,7 +958,7 @@ def load_weights(self, weights: Iterable[tuple[str,
 
 
 def _create_fake_bias_for_k_proj(
-    weights: Iterable[tuple[str, torch.Tensor]]
+    weights: Iterable[tuple[str, torch.Tensor]],
 ) -> Iterable[tuple[str, torch.Tensor]]:
     """
     Create full zeros bias for k_proj weight in self-attn and x-attn layers.
diff --git a/vllm/model_executor/models/zamba2.py b/vllm/model_executor/models/zamba2.py
index 1803fa259cf4..b69204d02096 100644
--- a/vllm/model_executor/models/zamba2.py
+++ b/vllm/model_executor/models/zamba2.py
@@ -2,11 +2,12 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """PyTorch Zamba2 model implementation for vLLM.
 
-This module implements the Zamba2 architecture from 
-https://arxiv.org/abs/2411.15242, which combines Mamba and Transformer 
-architectures in a hybrid model optimized for efficient sequence modeling. The 
+This module implements the Zamba2 architecture from
+https://arxiv.org/abs/2411.15242, which combines Mamba and Transformer
+architectures in a hybrid model optimized for efficient sequence modeling. The
 model alternates between state space model layers and attention-based layers.
 """
+
 from collections.abc import Iterable
 from itertools import cycle
 from typing import Any, Optional, Union
@@ -21,19 +22,26 @@
 from vllm.distributed import get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import GeluAndMul
 from vllm.model_executor.layers.layernorm import RMSNorm
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               MergedColumnParallelLinear,
-                                               QKVParallelLinear,
-                                               ReplicatedLinear,
-                                               RowParallelLinear)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    MergedColumnParallelLinear,
+    QKVParallelLinear,
+    ReplicatedLinear,
+    RowParallelLinear,
+)
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.mamba.mamba_mixer2 import MambaMixer2
 from vllm.model_executor.layers.mamba.mamba_utils import (
-    MambaStateDtypeCalculator, MambaStateShapeCalculator)
+    MambaStateDtypeCalculator,
+    MambaStateShapeCalculator,
+)
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.vocab_parallel_embedding import (
-    DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
+    DEFAULT_VOCAB_PADDING_SIZE,
+    ParallelLMHead,
+    VocabParallelEmbedding,
+)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.sequence import IntermediateTensors
 
@@ -43,7 +51,7 @@
 
 class Zamba2LoRA(nn.Module):
     """LoRA layer for the Zamba2 model.
-    
+
     Implements a LoRA layer that is used in shared attention and gated MLP
     blocks.
     """
@@ -57,7 +65,7 @@ def __init__(
         prefix: str = "",
     ):
         """Initialize the attention layer.
-        
+
         Args:
             input_dim: input dimension
             rank: LoRA rank
@@ -66,20 +74,15 @@ def __init__(
         """
         super().__init__()
 
-        self.A = ColumnParallelLinear(input_dim,
-                                      rank,
-                                      bias=False,
-                                      quant_config=quant_config,
-                                      gather_output=True)
+        self.A = ColumnParallelLinear(
+            input_dim, rank, bias=False, quant_config=quant_config, gather_output=True
+        )
 
         if isinstance(output_dim, list):
             B_class = MergedColumnParallelLinear
         else:
             B_class = ColumnParallelLinear
-        self.B = B_class(rank,
-                         output_dim,
-                         bias=False,
-                         quant_config=quant_config)
+        self.B = B_class(rank, output_dim, bias=False, quant_config=quant_config)
 
     def forward(
         self,
@@ -92,8 +95,8 @@ def forward(
 
 class Zamba2Attention(nn.Module):
     """Multi-head attention mechanism for the Zamba2 model.
-    
-    Implements attention with parallel computation, QKV projections, optional 
+
+    Implements attention with parallel computation, QKV projections, optional
     adapters and rotary position embeddings. The attention is computed across
     distributed blocks for efficient processing.
     """
@@ -108,7 +111,7 @@ def __init__(
         prefix: str = "",
     ) -> None:
         """Initialize the attention layer.
-        
+
         Args:
             config: The Zamba2 model configuration
             bare_block_idx: Index of the bare attention block
@@ -129,15 +132,17 @@ def __init__(
         self.num_attention_heads = config.num_attention_heads // tp_size
         self.attention_head_dim = config.attention_head_dim
         self.qkv_size = self.attention_hidden_size // tp_size
-        self.scale = (self.attention_head_dim / 2)**-0.5
+        self.scale = (self.attention_head_dim / 2) ** -0.5
 
-        if (self.attention_head_dim *
-                self.total_num_attention_heads) != self.attention_hidden_size:
+        if (
+            self.attention_head_dim * self.total_num_attention_heads
+        ) != self.attention_hidden_size:
             raise ValueError(
                 f"attention_hidden_size must be divisible by"
                 f" num_attention_heads"
                 f" (got `attention_hidden_size`: {self.attention_hidden_size}"
-                f" and `num_heads`: {self.num_attention_heads}).")
+                f" and `num_heads`: {self.num_attention_heads})."
+            )
 
         self.qkv_proj = QKVParallelLinear(
             self.attention_hidden_size,
@@ -146,10 +151,12 @@ def __init__(
             bias=False,
             quant_config=quant_config,
         )
-        self.o_proj = RowParallelLinear(self.attention_hidden_size,
-                                        config.hidden_size,
-                                        bias=False,
-                                        quant_config=quant_config)
+        self.o_proj = RowParallelLinear(
+            self.attention_hidden_size,
+            config.hidden_size,
+            bias=False,
+            quant_config=quant_config,
+        )
 
         # Even though in Zamba2 weights are shared between attention layers, KV
         # cache is unique for every attention layer. Hence, we need to define
@@ -158,8 +165,11 @@ def __init__(
 
         # Initialize attention blocks with proper indexing
         self.dpa_list = nn.ModuleList([])
-        j = bare_block_idx * (self.num_hybrid_layers + config.num_mem_blocks -
-                              1) // config.num_mem_blocks
+        j = (
+            bare_block_idx
+            * (self.num_hybrid_layers + config.num_mem_blocks - 1)
+            // config.num_mem_blocks
+        )
         for block_idx in range(self.num_hybrid_layers):
             if block_idx % config.num_mem_blocks == bare_block_idx:
                 dpa = Attention(
@@ -226,18 +236,17 @@ def forward(
         position_ids: torch.Tensor,
     ) -> torch.Tensor:
         """Forward pass through the attention layer.
-        
+
         Args:
             hidden_states: Input tensor [batch_size, seq_len, hidden_size]
             position_ids: Position IDs for positional embeddings
             block_idx: Current shared transformer block index
-            
+
         Returns:
             Output tensor [batch_size, seq_len, hidden_size]
         """
         qkv, _ = self.qkv_proj(hidden_states)
-        query_states, key_states, value_states = qkv.split([self.qkv_size] * 3,
-                                                           dim=-1)
+        query_states, key_states, value_states = qkv.split([self.qkv_size] * 3, dim=-1)
 
         if self.config.use_shared_attention_adapter:
             # Apply adapter transformations to Q, K, V if enabled
@@ -257,9 +266,9 @@ def forward(
             value_states = value_states + v_lora_output
 
         if self.config.use_mem_rope:
-            query_states, key_states = self.rotary_emb(position_ids,
-                                                       query_states,
-                                                       key_states)
+            query_states, key_states = self.rotary_emb(
+                position_ids, query_states, key_states
+            )
 
         y = self.dpa_list[block_idx](query_states, key_states, value_states)
         y, _ = self.o_proj(y)
@@ -268,9 +277,9 @@ def forward(
 
 class Zamba2MLP(nn.Module):
     """Feed-forward MLP layer for the Zamba2 model.
-    
-    Implements a gated feed-forward network that projects inputs to a larger 
-    intermediate size, applies GELU activation with gating, then projects back 
+
+    Implements a gated feed-forward network that projects inputs to a larger
+    intermediate size, applies GELU activation with gating, then projects back
     to the original size. Includes optional adapter layers for model adaptation.
     """
 
@@ -283,7 +292,7 @@ def __init__(
         prefix: str = "",
     ) -> None:
         """Initialize the MLP layer.
-        
+
         Args:
             config: The Zamba2 model configuration
             bare_block_idx: Index of the bare block in the model
@@ -302,17 +311,22 @@ def __init__(
             self.hidden_size,
             2 * [self.intermediate_size],  # 2x for gate and input projections
             bias=self.config.add_bias_linear,
-            quant_config=quant_config)
+            quant_config=quant_config,
+        )
 
-        self.down_proj = RowParallelLinear(self.intermediate_size,
-                                           self.hidden_size,
-                                           bias=self.config.add_bias_linear,
-                                           quant_config=quant_config)
+        self.down_proj = RowParallelLinear(
+            self.intermediate_size,
+            self.hidden_size,
+            bias=self.config.add_bias_linear,
+            quant_config=quant_config,
+        )
 
         # Only allow GELU activations
         if config.hidden_act != "gelu":
-            raise ValueError(f"Only GELU activation is supported "
-                             f"(got `hidden_act`: {config.hidden_act})")
+            raise ValueError(
+                f"Only GELU activation is supported "
+                f"(got `hidden_act`: {config.hidden_act})"
+            )
         self.act_fn = GeluAndMul()
 
         # Initialize adapter layers
@@ -329,14 +343,13 @@ def __init__(
                 gate_up_proj_adapter = nn.Identity()
             self.gate_up_proj_adapter_list.append(gate_up_proj_adapter)
 
-    def forward(self, hidden_states: torch.Tensor,
-                block_idx: int) -> torch.Tensor:
+    def forward(self, hidden_states: torch.Tensor, block_idx: int) -> torch.Tensor:
         """Forward pass through the MLP layer.
-        
+
         Args:
             hidden_states: Input tensor [batch_size, seq_len, hidden_size]
             block_idx: Current shared transformer block index
-            
+
         Returns:
             Output tensor [batch_size, seq_len, hidden_size] after applying
             gated feed-forward transformation
@@ -360,7 +373,7 @@ def forward(self, hidden_states: torch.Tensor,
 
 class Zamba2AttentionDecoderLayer(nn.Module):
     """Single decoder layer combining attention and feed-forward networks.
-    
+
     This layer implements a standard transformer block with:
     - Input layer normalization
     - Multi-head self-attention
@@ -378,7 +391,7 @@ def __init__(
         prefix: str = "",
     ) -> None:
         """Initialize the decoder layer.
-        
+
         Args:
             config: The Zamba2 model configuration
             bare_block_idx: Index of the bare block
@@ -409,11 +422,9 @@ def __init__(
 
         # Initialize layer normalizations
         # Input normalization operates on concatenated states
-        self.input_layernorm = RMSNorm(2 * config.hidden_size,
-                                       eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(2 * config.hidden_size, eps=config.rms_norm_eps)
         # Pre-FF normalization operates on attention output
-        self.pre_ff_layernorm = RMSNorm(config.hidden_size,
-                                        eps=config.rms_norm_eps)
+        self.pre_ff_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def forward(
         self,
@@ -423,14 +434,14 @@ def forward(
         positions: torch.Tensor,
     ) -> torch.Tensor:
         """Forward pass through the decoder layer.
-        
+
         Args:
             hidden_states: Input tensor from previous layer
-            original_hidden_states: Original input tensor for residual 
+            original_hidden_states: Original input tensor for residual
                 connection
             block_idx: Current shared transformer block index
             positions: IDs for positional embeddings
-            
+
         Returns:
             Transformed hidden states after attention and feed-forward
         """
@@ -440,7 +451,8 @@ def forward(
         # The concatenated tensor is then used as input of the pre-attention
         # RMSNorm (see fig. 2 in https://arxiv.org/pdf/2405.16712).
         hidden_states = torch.concatenate(
-            [hidden_states, original_hidden_states], dim=-1)
+            [hidden_states, original_hidden_states], dim=-1
+        )
 
         # Layer norm before attention
         hidden_states = self.input_layernorm(hidden_states)
@@ -463,20 +475,22 @@ def forward(
 
 class Zamba2MambaDecoderLayer(nn.Module):
     """Single Mamba decoder layer with normalization.
-    
-    This implements a  Mamba block. It includes input normalization 
-    and can process sequences using either chunked or full 
+
+    This implements a  Mamba block. It includes input normalization
+    and can process sequences using either chunked or full
     computation depending on configuration.
     """
 
-    def __init__(self,
-                 config: Zamba2Config,
-                 model_config: Optional[ModelConfig] = None,
-                 cache_config: Optional[CacheConfig] = None,
-                 quant_config: Optional[QuantizationConfig] = None,
-                 prefix: str = "") -> None:
+    def __init__(
+        self,
+        config: Zamba2Config,
+        model_config: Optional[ModelConfig] = None,
+        cache_config: Optional[CacheConfig] = None,
+        quant_config: Optional[QuantizationConfig] = None,
+        prefix: str = "",
+    ) -> None:
         """Initialize the Mamba decoder layer.
-        
+
         Args:
             config: The Zamba2 model configuration
             quant_config: Configuration for model quantization
@@ -485,26 +499,26 @@ def __init__(self,
 
         # Initialize Mamba mixer with expanded intermediate size
         intermediate_size = config.mamba_expand * config.hidden_size
-        self.mamba = MambaMixer2(hidden_size=config.hidden_size,
-                                 ssm_state_size=config.mamba_d_state,
-                                 conv_kernel_size=config.mamba_d_conv,
-                                 intermediate_size=intermediate_size,
-                                 use_conv_bias=config.use_conv_bias,
-                                 use_bias=config.add_bias_linear,
-                                 n_groups=config.mamba_ngroups,
-                                 num_heads=config.n_mamba_heads,
-                                 head_dim=intermediate_size //
-                                 config.n_mamba_heads,
-                                 rms_norm_eps=config.rms_norm_eps,
-                                 activation="silu",
-                                 model_config=model_config,
-                                 cache_config=cache_config,
-                                 quant_config=quant_config,
-                                 prefix=f"{prefix}.mixer")
+        self.mamba = MambaMixer2(
+            hidden_size=config.hidden_size,
+            ssm_state_size=config.mamba_d_state,
+            conv_kernel_size=config.mamba_d_conv,
+            intermediate_size=intermediate_size,
+            use_conv_bias=config.use_conv_bias,
+            use_bias=config.add_bias_linear,
+            n_groups=config.mamba_ngroups,
+            num_heads=config.n_mamba_heads,
+            head_dim=intermediate_size // config.n_mamba_heads,
+            rms_norm_eps=config.rms_norm_eps,
+            activation="silu",
+            model_config=model_config,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=f"{prefix}.mixer",
+        )
 
         # Input normalization
-        self.input_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
+        self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def forward(
         self,
@@ -514,14 +528,14 @@ def forward(
         original_hidden_states: Optional[torch.Tensor] = None,
     ) -> torch.Tensor:
         """Forward pass through the Mamba decoder layer.
-        
+
         Args:
             hidden_states: Input tensor [batch_size, seq_len, hidden_size]
             transformer_hidden_states: Optional output from transformer path
                 Added to input if provided (used in hybrid architecture)
             positions: Optional position IDs (unused in Mamba)
             original_hidden_states: Optional original inputs (unused in Mamba)
-            
+
         Returns:
             Transformed hidden states with residual connection applied
         """
@@ -555,7 +569,7 @@ def forward(
 
 class Zamba2HybridLayer(nn.Module):
     """Hybrid layer combining Transformer and Mamba architectures.
-    
+
     This layer implements the hybrid architecture described in the Zamba paper,
     where a shared transformer pathway processes input in parallel with a Mamba
     pathway. The transformer output is projected and added to the Mamba input
@@ -573,22 +587,26 @@ def __init__(
         prefix: str = "",
     ) -> None:
         """Initialize the hybrid layer.
-        
+
         Args:
             shared_transformer: Transformer decoder layer for attention pathway
         """
         super().__init__()
         self.block_idx = block_idx
         self.shared_transformer = shared_transformer
-        self.linear = ReplicatedLinear(config.hidden_size,
-                                       config.hidden_size,
-                                       bias=False,
-                                       quant_config=quant_config)
-        self.mamba_decoder = Zamba2MambaDecoderLayer(config,
-                                                     model_config=model_config,
-                                                     cache_config=cache_config,
-                                                     quant_config=quant_config,
-                                                     prefix=prefix)
+        self.linear = ReplicatedLinear(
+            config.hidden_size,
+            config.hidden_size,
+            bias=False,
+            quant_config=quant_config,
+        )
+        self.mamba_decoder = Zamba2MambaDecoderLayer(
+            config,
+            model_config=model_config,
+            cache_config=cache_config,
+            quant_config=quant_config,
+            prefix=prefix,
+        )
 
     def forward(
         self,
@@ -597,19 +615,19 @@ def forward(
         positions: torch.Tensor,
     ) -> torch.Tensor:
         """Forward pass through the hybrid layer.
-        
+
         Processes input through parallel transformer and Mamba paths:
         1. Transformer path processes input with attention
         2. Transformer output is projected to match hidden size
         3. Projected output is added to Mamba path input
         4. Final output combines both paths' representations
-        
+
         Args:
             hidden_states: Input tensor [batch_size, seq_len, hidden_size]
-            original_hidden_states: Original input for transformer residual 
+            original_hidden_states: Original input for transformer residual
                 connection
             positions: Position IDs for positional embeddings
-            
+
         Returns:
             Output tensor combining transformer and Mamba representations
         """
@@ -636,16 +654,16 @@ def forward(
 @support_torch_compile
 class Zamba2Model(nn.Module):
     """Core Zamba2 model combining transformer and Mamba architectures.
-    
-    The model processes input through a sequence of hybrid and Mamba-only 
+
+    The model processes input through a sequence of hybrid and Mamba-only
     layers, using token embeddings and final layer normalization.
     """
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         """Initialize the Zamba2 model.
-        
+
         Args:
-            vllm_config: Configuration object containing model, cache, 
+            vllm_config: Configuration object containing model, cache,
                 quantization and LoRA settings
             prefix: Optional prefix for parameter names in state dict
         """
@@ -660,8 +678,11 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         assert not is_lora_enabled
 
         self.config = config
-        lora_vocab = ((lora_config.lora_extra_vocab_size *
-                       (lora_config.max_loras or 1)) if lora_config else 0)
+        lora_vocab = (
+            (lora_config.lora_extra_vocab_size * (lora_config.max_loras or 1))
+            if lora_config
+            else 0
+        )
         self.vocab_size = config.vocab_size + lora_vocab
         self.org_vocab_size = config.vocab_size
 
@@ -679,15 +700,19 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         }
 
         # Create cyclic iterator of transformer blocks
-        blocks = cycle([
-            Zamba2AttentionDecoderLayer(config,
-                                        bare_block_idx=idx,
-                                        num_hybrid_layers=len(layer2block_map),
-                                        cache_config=cache_config,
-                                        quant_config=quant_config,
-                                        prefix=f"{prefix}")
-            for idx in range(config.num_mem_blocks)
-        ])
+        blocks = cycle(
+            [
+                Zamba2AttentionDecoderLayer(
+                    config,
+                    bare_block_idx=idx,
+                    num_hybrid_layers=len(layer2block_map),
+                    cache_config=cache_config,
+                    quant_config=quant_config,
+                    prefix=f"{prefix}",
+                )
+                for idx in range(config.num_mem_blocks)
+            ]
+        )
 
         # Initialize layers according to block type configuration
         layers = []
@@ -699,32 +724,37 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
                 block = next(blocks)
                 block_idx = layer2block_map[layer_idx]
                 layers.append(
-                    Zamba2HybridLayer(block,
-                                      config,
-                                      block_idx,
-                                      model_config=model_config,
-                                      cache_config=cache_config,
-                                      quant_config=quant_config,
-                                      prefix=prefix))
+                    Zamba2HybridLayer(
+                        block,
+                        config,
+                        block_idx,
+                        model_config=model_config,
+                        cache_config=cache_config,
+                        quant_config=quant_config,
+                        prefix=prefix,
+                    )
+                )
             else:
                 layers.append(
-                    Zamba2MambaDecoderLayer(config,
-                                            model_config=model_config,
-                                            cache_config=cache_config,
-                                            quant_config=quant_config,
-                                            prefix=prefix))
+                    Zamba2MambaDecoderLayer(
+                        config,
+                        model_config=model_config,
+                        cache_config=cache_config,
+                        quant_config=quant_config,
+                        prefix=prefix,
+                    )
+                )
         self.layers = nn.ModuleList(layers)
 
         # Final layer normalization
-        self.final_layernorm = RMSNorm(config.hidden_size,
-                                       eps=config.rms_norm_eps)
+        self.final_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         """Convert input token IDs to embeddings.
-        
+
         Args:
             input_ids: Tensor of input token IDs
-            
+
         Returns:
             Embedded representation of the input tokens
         """
@@ -737,14 +767,14 @@ def forward(
         inputs_embeds: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, IntermediateTensors]:
         """Forward pass through the model.
-        
+
         Args:
             input_ids: Input token IDs
             positions: Position IDs for embeddings
             inputs_embeds: Optional pre-computed input embeddings
-            
+
         Returns:
-            Either final hidden states or intermediate tensors for pipeline 
+            Either final hidden states or intermediate tensors for pipeline
             parallelism
         """
         # Handle pipeline parallelism for first rank
@@ -765,8 +795,7 @@ def forward(
         hidden_states = self.final_layernorm(hidden_states)
         return hidden_states
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         stacked_params_mapping = [
             # (param_name, shard_name, shard_id)
             ("qkv_proj", "q_proj", "q"),
@@ -780,8 +809,7 @@ def load_weights(self, weights: Iterable[tuple[str,
             for param_name, weight_name, shard_id in stacked_params_mapping:
                 if weight_name not in chkpt_weight_name:
                     continue
-                chkpt_weight_name = chkpt_weight_name.replace(
-                    weight_name, param_name)
+                chkpt_weight_name = chkpt_weight_name.replace(weight_name, param_name)
                 param = params_dict[chkpt_weight_name]
                 weight_loader = param.weight_loader
                 weight_loader(param, loaded_weight, shard_id)
@@ -790,8 +818,7 @@ def load_weights(self, weights: Iterable[tuple[str,
                 if chkpt_weight_name not in params_dict:
                     continue
                 param = params_dict[chkpt_weight_name]
-                weight_loader = getattr(param, "weight_loader",
-                                        default_weight_loader)
+                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                 weight_loader(param, loaded_weight)
             loaded_params.add(chkpt_weight_name)
         return loaded_params
@@ -799,26 +826,28 @@ def load_weights(self, weights: Iterable[tuple[str,
 
 class Zamba2ForCausalLM(nn.Module, HasInnerState, IsHybrid):
     """Zamba2 model with causal language modeling head.
-    
+
     This class wraps the core Zamba2 model and adds:
     - A language modeling head for next token prediction
     - Mamba state caching functionality
     - Support for model parallelism and quantization
     - Sampling capabilities for text generation
     """
+
     # To ensure correct weight loading and mapping.
-    hf_to_vllm_mapper = WeightsMapper(orig_to_new_substr={
-        "A_log": "A",
-        "0.weight": "A.weight",
-        "1.weight": "B.weight",
-    })
+    hf_to_vllm_mapper = WeightsMapper(
+        orig_to_new_substr={
+            "A_log": "A",
+            "0.weight": "A.weight",
+            "1.weight": "B.weight",
+        }
+    )
 
     @classmethod
     def get_mamba_state_dtype_from_config(
         cls,
         vllm_config: "VllmConfig",
     ) -> tuple[torch.dtype, torch.dtype]:
-
         return MambaStateDtypeCalculator.mamba2_state_dtype(
             vllm_config.model_config.dtype,
             vllm_config.cache_config.mamba_cache_dtype,
@@ -857,14 +886,14 @@ def get_mamba_state_shape_from_config(
 
     def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
         """Initialize the Zamba2 model for causal language modeling.
-        
+
         Args:
             vllm_config: Configuration containing model, cache, quantization,
                         LoRA and scheduler settings
             prefix: Optional prefix for parameter names
-        
+
         Raises:
-            AssertionError: If prefix caching is enabled 
+            AssertionError: If prefix caching is enabled
                 (not supported by Mamba)
         """
         config = vllm_config.model_config.hf_config
@@ -881,8 +910,9 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
             self.unpadded_vocab_size += lora_config.lora_extra_vocab_size
 
         # Initialize core model
-        self.model = Zamba2Model(vllm_config=vllm_config,
-                                 prefix=maybe_prefix(prefix, "model"))
+        self.model = Zamba2Model(
+            vllm_config=vllm_config, prefix=maybe_prefix(prefix, "model")
+        )
 
         # Initialize language modeling head
         self.lm_head = ParallelLMHead(
@@ -892,15 +922,17 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = "") -> None:
             padding_size=DEFAULT_VOCAB_PADDING_SIZE
             # We need bigger padding if using lora for kernel
             # compatibility
-            if not lora_config else lora_config.lora_vocab_padding_size,
+            if not lora_config
+            else lora_config.lora_vocab_padding_size,
             prefix=maybe_prefix(prefix, "lm_head"),
         )
         # Tie weights with input embeddings if using same dimensions
         self.lm_head = self.lm_head.tie_weights(self.model.embed_tokens)
 
         # Initialize logits processing and sampling
-        self.logits_processor = LogitsProcessor(self.unpadded_vocab_size,
-                                                config.vocab_size)
+        self.logits_processor = LogitsProcessor(
+            self.unpadded_vocab_size, config.vocab_size
+        )
 
     def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         """Convert input token IDs to embeddings.
@@ -911,19 +943,21 @@ def get_input_embeddings(self, input_ids: torch.Tensor) -> torch.Tensor:
         """
         return self.model.get_input_embeddings(input_ids)
 
-    def forward(self,
-                input_ids: torch.Tensor,
-                positions: torch.Tensor,
-                inputs_embeds: Optional[torch.Tensor] = None,
-                **kwargs: Any) -> torch.Tensor:
+    def forward(
+        self,
+        input_ids: torch.Tensor,
+        positions: torch.Tensor,
+        inputs_embeds: Optional[torch.Tensor] = None,
+        **kwargs: Any,
+    ) -> torch.Tensor:
         """Forward pass through the model.
-        
+
         Args:
             input_ids: Input token IDs
             positions: Position IDs for embeddings
             inputs_embeds: Optional pre-computed input embeddings
             **kwargs: Additional arguments passed to cache manager
-            
+
         Returns:
             Output hidden states
         """
@@ -951,7 +985,6 @@ def compute_logits(
         logits = self.logits_processor(self.lm_head, hidden_states)
         return logits
 
-    def load_weights(self, weights: Iterable[tuple[str,
-                                                   torch.Tensor]]) -> set[str]:
+    def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
         loader = AutoWeightsLoader(self)
         return loader.load_weights(weights, mapper=self.hf_to_vllm_mapper)
diff --git a/vllm/model_executor/parameter.py b/vllm/model_executor/parameter.py
index 66add98dab44..9341665f1bca 100644
--- a/vllm/model_executor/parameter.py
+++ b/vllm/model_executor/parameter.py
@@ -9,14 +9,21 @@
 import torch
 from torch.nn import Parameter
 
-from vllm.distributed import (get_tensor_model_parallel_rank,
-                              get_tensor_model_parallel_world_size)
+from vllm.distributed import (
+    get_tensor_model_parallel_rank,
+    get_tensor_model_parallel_world_size,
+)
 from vllm.logger import init_logger
 
 __all__ = [
-    "BasevLLMParameter", "PackedvLLMParameter", "PerTensorScaleParameter",
-    "ModelWeightParameter", "ChannelQuantScaleParameter",
-    "GroupQuantScaleParameter", "PackedColumnParameter", "RowvLLMParameter"
+    "BasevLLMParameter",
+    "PackedvLLMParameter",
+    "PerTensorScaleParameter",
+    "ModelWeightParameter",
+    "ChannelQuantScaleParameter",
+    "GroupQuantScaleParameter",
+    "PackedColumnParameter",
+    "RowvLLMParameter",
 ]
 
 logger = init_logger(__name__)
@@ -30,7 +37,6 @@ class BasevLLMParameter(Parameter):
     """
 
     def __new__(cls, data: Optional[torch.Tensor], **kwargs):
-
         return super().__new__(cls, data=data, requires_grad=False)
 
     def __init__(self, data: torch.Tensor, weight_loader: Callable):
@@ -52,9 +58,9 @@ def __init__(self, data: torch.Tensor, weight_loader: Callable):
         # This sometimes causes OOM errors during model loading. To avoid this,
         # we sync the param tensor after its weight loader is called.
         from vllm.platforms import current_platform
+
         if current_platform.use_sync_weight_loader():
-            weight_loader = current_platform.make_synced_weight_loader(
-                weight_loader)
+            weight_loader = current_platform.make_synced_weight_loader(weight_loader)
 
         self._weight_loader = weight_loader
         self.tp_rank = get_tensor_model_parallel_rank()
@@ -67,8 +73,9 @@ def weight_loader(self) -> Callable:
         # weight loading should be implemented via Model.load_weights. In the
         # meantime, support deleting and overriding `weight_loader`` attribute
         if self._weight_loader is None:
-            raise AttributeError(f"{self.__class__.__name__} weight_loader "
-                                 "attribute has been deleted")
+            raise AttributeError(
+                f"{self.__class__.__name__} weight_loader attribute has been deleted"
+            )
         return self._weight_loader
 
     @weight_loader.setter
@@ -82,11 +89,12 @@ def weight_loader(self):
     def _is_1d_and_scalar(self, loaded_weight: torch.Tensor):
         cond1 = self.data.ndim == 1 and self.data.numel() == 1
         cond2 = loaded_weight.ndim == 0 and loaded_weight.numel() == 1
-        return (cond1 and cond2)
+        return cond1 and cond2
 
     def _assert_and_load(self, loaded_weight: torch.Tensor):
-        assert (self.data.shape == loaded_weight.shape
-                or self._is_1d_and_scalar(loaded_weight))
+        assert self.data.shape == loaded_weight.shape or self._is_1d_and_scalar(
+            loaded_weight
+        )
         self.data.copy_(loaded_weight)
 
     def load_column_parallel_weight(self, loaded_weight: torch.Tensor):
@@ -121,11 +129,11 @@ def __torch_function__(cls, func, types, args=(), kwargs=None):
 
 class _ColumnvLLMParameter(BasevLLMParameter):
     """
-    Private class defining weight loading functionality 
+    Private class defining weight loading functionality
     (load_merged_column_weight, load_qkv_weight)
     for parameters being loaded into linear layers with column
     parallelism. This includes QKV and MLP layers which are
-    not already fused on disk. Requires an output dimension 
+    not already fused on disk. Requires an output dimension
     to be defined. Called within the weight loader of
     each of the column parallel linear layers.
     """
@@ -140,57 +148,55 @@ def output_dim(self):
 
     def load_column_parallel_weight(self, loaded_weight: torch.Tensor):
         shard_size = self.data.shape[self.output_dim]
-        loaded_weight = loaded_weight.narrow(self.output_dim,
-                                             self.tp_rank * shard_size,
-                                             shard_size)
+        loaded_weight = loaded_weight.narrow(
+            self.output_dim, self.tp_rank * shard_size, shard_size
+        )
         assert self.data.shape == loaded_weight.shape
         self.data.copy_(loaded_weight)
 
     def load_merged_column_weight(self, loaded_weight: torch.Tensor, **kwargs):
-
         shard_offset = kwargs.get("shard_offset")
         shard_size = kwargs.get("shard_size")
 
         # TODO: move these to PackedColumnParameter and PackedvLLMParameter
-        if isinstance(
-                self,
-            (PackedColumnParameter,
-             PackedvLLMParameter)) and self.packed_dim == self.output_dim:
+        if (
+            isinstance(self, (PackedColumnParameter, PackedvLLMParameter))
+            and self.packed_dim == self.output_dim
+        ):
             shard_size, shard_offset = self.adjust_shard_indexes_for_packing(
-                shard_offset=shard_offset, shard_size=shard_size)
+                shard_offset=shard_offset, shard_size=shard_size
+            )
 
         param_data = self.data
 
-        param_data = param_data.narrow(self.output_dim, shard_offset,
-                                       shard_size)
-        loaded_weight = loaded_weight.narrow(self.output_dim,
-                                             self.tp_rank * shard_size,
-                                             shard_size)
+        param_data = param_data.narrow(self.output_dim, shard_offset, shard_size)
+        loaded_weight = loaded_weight.narrow(
+            self.output_dim, self.tp_rank * shard_size, shard_size
+        )
         assert param_data.shape == loaded_weight.shape
         param_data.copy_(loaded_weight)
 
     def load_qkv_weight(self, loaded_weight: torch.Tensor, **kwargs):
-
         shard_offset = kwargs.get("shard_offset")
         shard_size = kwargs.get("shard_size")
         shard_id = kwargs.get("shard_id")
         num_heads = kwargs.get("num_heads")
 
         # TODO: move these to PackedColumnParameter and PackedvLLMParameter
-        if isinstance(
-                self,
-            (PackedColumnParameter,
-             PackedvLLMParameter)) and self.output_dim == self.packed_dim:
+        if (
+            isinstance(self, (PackedColumnParameter, PackedvLLMParameter))
+            and self.output_dim == self.packed_dim
+        ):
             shard_size, shard_offset = self.adjust_shard_indexes_for_packing(
-                shard_offset=shard_offset, shard_size=shard_size)
+                shard_offset=shard_offset, shard_size=shard_size
+            )
 
         param_data = self.data
-        shard_id = (self.tp_rank if shard_id == "q" else self.tp_rank //
-                    num_heads)
-        param_data = param_data.narrow(self.output_dim, shard_offset,
-                                       shard_size)
-        loaded_weight = loaded_weight.narrow(self.output_dim,
-                                             shard_id * shard_size, shard_size)
+        shard_id = self.tp_rank if shard_id == "q" else self.tp_rank // num_heads
+        param_data = param_data.narrow(self.output_dim, shard_offset, shard_size)
+        loaded_weight = loaded_weight.narrow(
+            self.output_dim, shard_id * shard_size, shard_size
+        )
 
         assert param_data.shape == loaded_weight.shape
         param_data.copy_(loaded_weight)
@@ -214,9 +220,9 @@ def input_dim(self):
 
     def load_row_parallel_weight(self, loaded_weight: torch.Tensor):
         shard_size = self.data.shape[self.input_dim]
-        loaded_weight = loaded_weight.narrow(self.input_dim,
-                                             self.tp_rank * shard_size,
-                                             shard_size)
+        loaded_weight = loaded_weight.narrow(
+            self.input_dim, self.tp_rank * shard_size, shard_size
+        )
 
         if len(loaded_weight.shape) == 0:
             loaded_weight = loaded_weight.reshape(1)
@@ -230,6 +236,7 @@ class ModelWeightParameter(_ColumnvLLMParameter, RowvLLMParameter):
     Parameter class for linear layer weights. Uses both column and
     row parallelism.
     """
+
     pass
 
 
@@ -238,6 +245,7 @@ class GroupQuantScaleParameter(_ColumnvLLMParameter, RowvLLMParameter):
     Parameter class for weight scales loaded for weights with
     grouped quantization. Uses both column and row parallelism.
     """
+
     pass
 
 
@@ -246,6 +254,7 @@ class ChannelQuantScaleParameter(_ColumnvLLMParameter):
     Parameter class for weight scales loaded for weights with
     channel-wise quantization. Equivalent to _ColumnvLLMParameter.
     """
+
     pass
 
 
@@ -256,11 +265,11 @@ class PerTensorScaleParameter(BasevLLMParameter):
     layers (e.g. for QKV, there are 3 scales loaded from disk).
     This is relevant to weights with per-tensor quantization.
     Adds functionality to map the scalers to a shard during
-    weight loading. 
+    weight loading.
 
-    Note: additional parameter manipulation may be handled 
-    for each quantization config specifically, within 
-    process_weights_after_loading 
+    Note: additional parameter manipulation may be handled
+    for each quantization config specifically, within
+    process_weights_after_loading
     """
 
     def __init__(self, **kwargs):
@@ -280,10 +289,11 @@ def load_qkv_weight(self, *args, **kwargs):
     def load_column_parallel_weight(self, *args, **kwargs):
         super().load_row_parallel_weight(*args, **kwargs)
 
-    def _load_into_shard_id(self, loaded_weight: torch.Tensor,
-                            shard_id: Union[str, int], **kwargs):
+    def _load_into_shard_id(
+        self, loaded_weight: torch.Tensor, shard_id: Union[str, int], **kwargs
+    ):
         """
-        Slice the parameter data based on the shard id for 
+        Slice the parameter data based on the shard id for
         loading.
         """
 
@@ -308,12 +318,14 @@ class PackedColumnParameter(_ColumnvLLMParameter):
     for more details on the packed properties.
     """
 
-    def __init__(self,
-                 packed_factor: Union[int, Fraction],
-                 packed_dim: int,
-                 marlin_tile_size: Optional[int] = None,
-                 bitblas_tile_size: Optional[int] = None,
-                 **kwargs):
+    def __init__(
+        self,
+        packed_factor: Union[int, Fraction],
+        packed_dim: int,
+        marlin_tile_size: Optional[int] = None,
+        bitblas_tile_size: Optional[int] = None,
+        **kwargs,
+    ):
         self._packed_factor = packed_factor
         self._packed_dim = packed_dim
         self._marlin_tile_size = marlin_tile_size
@@ -342,7 +354,8 @@ def adjust_shard_indexes_for_packing(self, shard_size, shard_offset):
             shard_offset=shard_offset,
             packed_factor=self.packed_factor,
             marlin_tile_size=self.marlin_tile_size,
-            bitblas_tile_size=self.bitblas_tile_size)
+            bitblas_tile_size=self.bitblas_tile_size,
+        )
 
 
 class PackedvLLMParameter(ModelWeightParameter):
@@ -351,17 +364,19 @@ class PackedvLLMParameter(ModelWeightParameter):
     Example: GPTQ Marlin weights are int4 or int8, packed into int32.
     Extends the ModelWeightParameter to take in the
     packed factor, the packed dimension, and optionally, marlin
-    tile size for marlin kernels. Adjusts the shard_size and 
+    tile size for marlin kernels. Adjusts the shard_size and
     shard_offset for fused linear layers model weight loading
     by accounting for packing and optionally, marlin tile size.
     """
 
-    def __init__(self,
-                 packed_factor: Union[int, Fraction],
-                 packed_dim: int,
-                 marlin_tile_size: Optional[int] = None,
-                 bitblas_tile_size: Optional[int] = None,
-                 **kwargs):
+    def __init__(
+        self,
+        packed_factor: Union[int, Fraction],
+        packed_dim: int,
+        marlin_tile_size: Optional[int] = None,
+        bitblas_tile_size: Optional[int] = None,
+        **kwargs,
+    ):
         self._packed_factor = packed_factor
         self._packed_dim = packed_dim
         self._marlin_tile_size = marlin_tile_size
@@ -390,7 +405,8 @@ def adjust_shard_indexes_for_packing(self, shard_size, shard_offset):
             shard_offset=shard_offset,
             packed_factor=self.packed_factor,
             marlin_tile_size=self.marlin_tile_size,
-            bitblas_tile_size=self.bitblas_tile_size)
+            bitblas_tile_size=self.bitblas_tile_size,
+        )
 
 
 class BlockQuantScaleParameter(_ColumnvLLMParameter, RowvLLMParameter):
@@ -410,6 +426,7 @@ class SharedWeightParameter(BasevLLMParameter):
     `MergedColumnParallelLinear`, the transform weights must stay separate
     tensors in order to allow for tensor memory sharing between layers.
     """
+
     # global registry for sharing tensors based on passed `data_key`
     # this dict holds weaksrefs to avoid memory leak after model cleanup
     tensors_registry: WeakValueDictionary = WeakValueDictionary()
@@ -426,8 +443,7 @@ def __new__(cls, **kwargs):
         return super().__new__(cls, data=None, **kwargs)
 
     def __init__(self, input_dim: int = 1, output_dim: int = 0, **kwargs):
-        weight_loader: Callable = kwargs.get(
-            "weight_loader")  # type: ignore[assignment]
+        weight_loader: Callable = kwargs.get("weight_loader")  # type: ignore[assignment]
         super().__init__(data=None, weight_loader=weight_loader)
 
         self.local_tensors = set()
@@ -435,12 +451,14 @@ def __init__(self, input_dim: int = 1, output_dim: int = 0, **kwargs):
         self.kwargs = {
             "input_dim": input_dim,
             "output_dim": output_dim,
-            "weight_loader": self._fake_weight_loader
+            "weight_loader": self._fake_weight_loader,
         }
 
         if self.tp_size > 1:
-            raise NotImplementedError(f"{self.__class__.__name__} does not "
-                                      "currently support tensor parallelism")
+            raise NotImplementedError(
+                f"{self.__class__.__name__} does not "
+                "currently support tensor parallelism"
+            )
 
     def add_partition(self, index: int, data_key: Hashable, *args, **kwargs):
         """
@@ -460,8 +478,7 @@ def add_partition(self, index: int, data_key: Hashable, *args, **kwargs):
             data = self.tensors_registry[data_key]
 
         # create associated model parameter
-        self.partitions[index] = ModelWeightParameter(
-            data=data, **self.kwargs)  # type: ignore[arg-type]
+        self.partitions[index] = ModelWeightParameter(data=data, **self.kwargs)  # type: ignore[arg-type]
 
         # hold local reference, since ModelWeightParameter does not
         # see https://github.com/pytorch/pytorch/issues/75932
@@ -471,8 +488,7 @@ def load_column_parallel_weight(self, loaded_weight: torch.Tensor):
         assert len(self.partitions) == 1 and 0 in self.partitions
         partition = self.partitions[0]
 
-        ModelWeightParameter.load_column_parallel_weight(
-            partition, loaded_weight)
+        ModelWeightParameter.load_column_parallel_weight(partition, loaded_weight)
 
     def load_row_parallel_weight(self, loaded_weight: torch.Tensor):
         assert len(self.partitions) == 1 and 0 in self.partitions
@@ -490,10 +506,8 @@ def load_merged_column_weight(self, loaded_weight: torch.Tensor, **kwargs):
         shard_offset = self.tp_rank * shard_size
 
         ModelWeightParameter.load_merged_column_weight(
-            partition,
-            loaded_weight,
-            shard_offset=shard_offset,
-            shard_size=shard_size)
+            partition, loaded_weight, shard_offset=shard_offset, shard_size=shard_size
+        )
 
     def load_qkv_weight(self, loaded_weight: torch.Tensor, **kwargs):
         partition_id = self._shard_id_as_int(kwargs.pop("shard_id"))
@@ -517,33 +531,42 @@ def load_qkv_weight(self, loaded_weight: torch.Tensor, **kwargs):
     def process_weights_after_loading(self):
         for key in self.partitions:
             self.partitions[key] = torch.nn.Parameter(
-                data=self.partitions[key].data, requires_grad=False)
+                data=self.partitions[key].data, requires_grad=False
+            )
 
     @property
     def data(self):
-        raise ValueError("Accessing `data` of a "
-                         "`PartitionedModelWeightParameter` is not allowed. "
-                         "Instead, use `get_partition` to get the weight of "
-                         "the particular partition you want to access")
+        raise ValueError(
+            "Accessing `data` of a "
+            "`PartitionedModelWeightParameter` is not allowed. "
+            "Instead, use `get_partition` to get the weight of "
+            "the particular partition you want to access"
+        )
 
-    def _fake_weight_loader(self, param: BasevLLMParameter,
-                            loaded_weight: torch.Tensor,
-                            loaded_weight_shard_id: Optional[Union[str, int]]):
-        raise ValueError("When loading partition weights of "
-                         f"{self.__class__.__name__}, use methods provided by "
-                         f"{self.__class__.__name__}, not partition loader")
+    def _fake_weight_loader(
+        self,
+        param: BasevLLMParameter,
+        loaded_weight: torch.Tensor,
+        loaded_weight_shard_id: Optional[Union[str, int]],
+    ):
+        raise ValueError(
+            "When loading partition weights of "
+            f"{self.__class__.__name__}, use methods provided by "
+            f"{self.__class__.__name__}, not partition loader"
+        )
 
 
-def permute_param_layout_(param: BasevLLMParameter, input_dim: int,
-                          output_dim: int, **kwargs) -> BasevLLMParameter:
+def permute_param_layout_(
+    param: BasevLLMParameter, input_dim: int, output_dim: int, **kwargs
+) -> BasevLLMParameter:
     """
-    Permute a parameter's layout to the specified input and output dimensions, 
+    Permute a parameter's layout to the specified input and output dimensions,
     useful for forcing the parameter into a known layout, for example, if I need
-    a packed (quantized) weight matrix to be in the layout 
+    a packed (quantized) weight matrix to be in the layout
         {input_dim = 0, output_dim = 1, packed_dim = 0}
     then I can call:
         permute_param_layout_(x, input_dim=0, output_dim=1, packed_dim=0)
-    to ensure x is in the correct layout (permuting it to the correct layout if 
+    to ensure x is in the correct layout (permuting it to the correct layout if
     required, asserting if it cannot get it to the correct layout)
     """
 
@@ -551,35 +574,34 @@ def permute_param_layout_(param: BasevLLMParameter, input_dim: int,
     curr_output_dim = getattr(param, "output_dim", None)
 
     if curr_input_dim is None or curr_output_dim is None:
-        assert param.data.dim() == 2,\
-            "permute_param_layout_ only supports 2D parameters when either "\
+        assert param.data.dim() == 2, (
+            "permute_param_layout_ only supports 2D parameters when either "
             "input_dim or output_dim is not set"
+        )
 
     # if one of the dimensions is not set, set it to the opposite of the other
     #  we can only do this since we asserted the parameter is 2D above
     if curr_input_dim is None:
-        assert curr_output_dim is not None,\
-            "either input or output dim must be set"
+        assert curr_output_dim is not None, "either input or output dim must be set"
         curr_input_dim = (curr_output_dim + 1) % 2
     if curr_output_dim is None:
-        assert curr_input_dim is not None,\
-            "either input or output dim must be set"
+        assert curr_input_dim is not None, "either input or output dim must be set"
         curr_output_dim = (curr_input_dim + 1) % 2
 
     # create permutation from the current layout to the layout with
     # self.input_dim at input_dim and self.output_dim at output_dim preserving
     # other dimensions
     perm = [
-        i for i in range(param.data.dim())
-        if i not in [curr_input_dim, curr_output_dim]
+        i for i in range(param.data.dim()) if i not in [curr_input_dim, curr_output_dim]
     ]
     perm.insert(input_dim, curr_input_dim)
     perm.insert(output_dim, curr_output_dim)
 
     if "packed_dim" in kwargs:
-        assert hasattr(param, "packed_dim") and\
-            param.packed_dim == perm[kwargs["packed_dim"]],\
-            "permute_param_layout_ currently doesn't support repacking"
+        assert (
+            hasattr(param, "packed_dim")
+            and param.packed_dim == perm[kwargs["packed_dim"]]
+        ), "permute_param_layout_ currently doesn't support repacking"
 
     param.data = param.data.permute(*perm)
     if hasattr(param, "_input_dim"):
@@ -592,29 +614,30 @@ def permute_param_layout_(param: BasevLLMParameter, input_dim: int,
     return param
 
 
-def _adjust_shard_indexes_for_marlin(shard_size, shard_offset,
-                                     marlin_tile_size):
+def _adjust_shard_indexes_for_marlin(shard_size, shard_offset, marlin_tile_size):
     return shard_size * marlin_tile_size, shard_offset * marlin_tile_size
 
 
-def _adjust_shard_indexes_for_bitblas(shard_size, shard_offset,
-                                      bitblas_tile_size):
+def _adjust_shard_indexes_for_bitblas(shard_size, shard_offset, bitblas_tile_size):
     return shard_size // bitblas_tile_size, shard_offset // bitblas_tile_size
 
 
-def _adjust_shard_indexes_for_packing(shard_size, shard_offset, packed_factor,
-                                      marlin_tile_size, bitblas_tile_size):
+def _adjust_shard_indexes_for_packing(
+    shard_size, shard_offset, packed_factor, marlin_tile_size, bitblas_tile_size
+):
     shard_size = shard_size // packed_factor
     shard_offset = shard_offset // packed_factor
     if marlin_tile_size is not None:
         return _adjust_shard_indexes_for_marlin(
             shard_size=shard_size,
             shard_offset=shard_offset,
-            marlin_tile_size=marlin_tile_size)
+            marlin_tile_size=marlin_tile_size,
+        )
     elif bitblas_tile_size is not None:
         return _adjust_shard_indexes_for_bitblas(
             shard_size=shard_size,
             shard_offset=shard_offset,
-            bitblas_tile_size=bitblas_tile_size)
+            bitblas_tile_size=bitblas_tile_size,
+        )
 
     return shard_size, shard_offset
diff --git a/vllm/model_executor/utils.py b/vllm/model_executor/utils.py
index 543918418953..4abd2625f806 100644
--- a/vllm/model_executor/utils.py
+++ b/vllm/model_executor/utils.py
@@ -30,8 +30,7 @@ def set_weight_attrs(
     if weight_attrs is None:
         return
     for key, value in weight_attrs.items():
-        assert not hasattr(
-            weight, key), f"Overwriting existing tensor attribute: {key}"
+        assert not hasattr(weight, key), f"Overwriting existing tensor attribute: {key}"
 
         # NOTE(woosuk): During weight loading, we often do something like:
         # narrowed_tensor = param.data.narrow(0, offset, len)
@@ -44,8 +43,7 @@ def set_weight_attrs(
         # TODO(woosuk): Remove this hack once we have a better solution.
         from vllm.platforms import current_platform
 
-        if current_platform.use_sync_weight_loader(
-        ) and key == "weight_loader":
+        if current_platform.use_sync_weight_loader() and key == "weight_loader":
             value = current_platform.make_synced_weight_loader(value)
         setattr(weight, key, value)
 
@@ -63,18 +61,19 @@ def get_packed_modules_mapping(model: torch.nn.Module) -> dict[str, list[str]]:
         child_map = getattr(child, "packed_modules_mapping", None)
         child_map = copy.deepcopy(child_map) if child_map is not None else {}
 
-        if any((k in parent_map and parent_map[k] != v)
-               for k, v in child_map.items()):
+        if any((k in parent_map and parent_map[k] != v) for k, v in child_map.items()):
             raise ValueError(
                 f"Can't update {type(model).__name__}'s packed_modules_mapping "
-                f"safely because of conflicts from {type(child).__name__}.")
+                f"safely because of conflicts from {type(child).__name__}."
+            )
         else:
             parent_map.update(child_map)
     return parent_map
 
 
 def get_moe_expert_mapping(
-    model: torch.nn.Module, ) -> list[tuple[str, str, int, str]]:
+    model: torch.nn.Module,
+) -> list[tuple[str, str, int, str]]:
     if parent_map := getattr(model, "get_expert_mapping", None):
         return parent_map()
     else:
diff --git a/vllm/model_executor/warmup/deep_gemm_warmup.py b/vllm/model_executor/warmup/deep_gemm_warmup.py
index e495f9ee4472..1747caf26cef 100644
--- a/vllm/model_executor/warmup/deep_gemm_warmup.py
+++ b/vllm/model_executor/warmup/deep_gemm_warmup.py
@@ -13,19 +13,22 @@
 from vllm.distributed.parallel_state import get_dp_group
 from vllm.model_executor.layers.fused_moe.deep_gemm_moe import DeepGemmExperts
 from vllm.model_executor.layers.fused_moe.deep_gemm_utils import (
-    compute_aligned_M, deep_gemm_block_shape)
+    compute_aligned_M,
+    deep_gemm_block_shape,
+)
 from vllm.model_executor.layers.fused_moe.layer import FusedMoE
-from vllm.model_executor.layers.fused_moe.modular_kernel import (
-    FusedMoEModularKernel)
+from vllm.model_executor.layers.fused_moe.modular_kernel import FusedMoEModularKernel
 from vllm.model_executor.layers.fused_moe.triton_deep_gemm_moe import (
-    TritonOrDeepGemmExperts)
+    TritonOrDeepGemmExperts,
+)
 from vllm.model_executor.layers.linear import LinearBase
 from vllm.model_executor.layers.quantization.fp8 import Fp8LinearMethod
 from vllm.utils.deep_gemm import fp8_gemm_nt, m_grouped_fp8_gemm_nt_contiguous
 
 
 def _extract_data_from_linear_base_module(
-        m: torch.nn.Module) -> tuple[torch.Tensor, torch.Tensor, list[int]]:
+    m: torch.nn.Module,
+) -> tuple[torch.Tensor, torch.Tensor, list[int]]:
     """
     Extract weights, weight scales and quantization block sizes from the given
     LinearBase module.
@@ -46,18 +49,24 @@ def _extract_data_from_linear_base_module(
 
 
 def _extract_data_from_fused_moe_module(
-    m: torch.nn.Module
+    m: torch.nn.Module,
 ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor, torch.Tensor, int]:
     """
     Extract weights, weight scales and num_topk from FusedMoE module.
     """
     assert isinstance(m, FusedMoE)
     w13 = m.w13_weight
-    w13_s = m.w13_weight_scale_inv if hasattr(
-        m, "w13_weight_scale_inv") else m.w13_weight_scale
+    w13_s = (
+        m.w13_weight_scale_inv
+        if hasattr(m, "w13_weight_scale_inv")
+        else m.w13_weight_scale
+    )
     w2 = m.w2_weight
-    w2_s = m.w2_weight_scale_inv if hasattr(
-        m, "w2_weight_scale_inv") else m.w2_weight_scale
+    w2_s = (
+        m.w2_weight_scale_inv
+        if hasattr(m, "w2_weight_scale_inv")
+        else m.w2_weight_scale
+    )
     num_topk = m.top_k
 
     assert isinstance(w13, torch.Tensor)
@@ -72,14 +81,20 @@ def _fp8_linear_may_use_deep_gemm(module: torch.nn.Module) -> bool:
     Return True if the input module/layer could be processed with DeepGEMM.
     """
     block_size = deep_gemm_block_shape()[0]
-    if not (isinstance(module, LinearBase)
-            and isinstance(module.quant_method, Fp8LinearMethod)
-            and module.quant_method.block_quant):
+    if not (
+        isinstance(module, LinearBase)
+        and isinstance(module.quant_method, Fp8LinearMethod)
+        and module.quant_method.block_quant
+    ):
         return False
 
     w, _, block_sizes = _extract_data_from_linear_base_module(module)
-    return (block_sizes == deep_gemm_block_shape() and w.ndim == 2
-            and w.shape[0] % block_size == 0 and w.shape[1] % block_size == 0)
+    return (
+        block_sizes == deep_gemm_block_shape()
+        and w.ndim == 2
+        and w.shape[0] % block_size == 0
+        and w.shape[1] % block_size == 0
+    )
 
 
 def _fused_moe_grouped_gemm_may_use_deep_gemm(module: torch.nn.Module) -> bool:
@@ -88,27 +103,26 @@ def _fused_moe_grouped_gemm_may_use_deep_gemm(module: torch.nn.Module) -> bool:
 
     moe_quant_config = module.quant_method.get_fused_moe_quant_config(module)
 
-    if (moe_quant_config is None
-            or moe_quant_config.quant_dtype != torch.float8_e4m3fn
-            or moe_quant_config.block_shape != deep_gemm_block_shape()):
+    if (
+        moe_quant_config is None
+        or moe_quant_config.quant_dtype != torch.float8_e4m3fn
+        or moe_quant_config.block_shape != deep_gemm_block_shape()
+    ):
         return False
 
-    if not isinstance(module.quant_method.fused_experts,
-                      FusedMoEModularKernel):
+    if not isinstance(module.quant_method.fused_experts, FusedMoEModularKernel):
         # fused_experts could invoke deep_gemm_moe_fp8
         return True
 
     mk: FusedMoEModularKernel = module.quant_method.fused_experts
     # Further check if the ModularKernel implementation uses the DeepGemmExperts
-    return isinstance(mk.fused_experts,
-                      (DeepGemmExperts, TritonOrDeepGemmExperts))
+    return isinstance(mk.fused_experts, (DeepGemmExperts, TritonOrDeepGemmExperts))
 
 
 FP8_GEMM_NT_WARMUP_CACHE: set[torch.Size] = set()
 
 
-def _deepgemm_fp8_gemm_nt_warmup(w: torch.Tensor, ws: torch.Tensor,
-                                 max_tokens: int):
+def _deepgemm_fp8_gemm_nt_warmup(w: torch.Tensor, ws: torch.Tensor, max_tokens: int):
     if w.size() in FP8_GEMM_NT_WARMUP_CACHE:
         return
 
@@ -116,20 +130,18 @@ def _deepgemm_fp8_gemm_nt_warmup(w: torch.Tensor, ws: torch.Tensor,
     block_m = deep_gemm_block_shape()[0]
 
     device = w.device
-    a1q = torch.empty((max_tokens, k),
-                      device=device,
-                      dtype=torch.float8_e4m3fn)
-    a1q_scales = torch.empty((max_tokens, k // block_m),
-                             device=device,
-                             dtype=torch.float32)
+    a1q = torch.empty((max_tokens, k), device=device, dtype=torch.float8_e4m3fn)
+    a1q_scales = torch.empty(
+        (max_tokens, k // block_m), device=device, dtype=torch.float32
+    )
     out = torch.empty((max_tokens, n), device=device, dtype=torch.bfloat16)
 
-    pbar = tqdm(total=max_tokens,
-                desc=f"DeepGemm(fp8_gemm_nt) warmup (W={w.size()})")
+    pbar = tqdm(total=max_tokens, desc=f"DeepGemm(fp8_gemm_nt) warmup (W={w.size()})")
     num_tokens = max_tokens
     while num_tokens > 0:
-        fp8_gemm_nt((a1q[:num_tokens], a1q_scales[:num_tokens]), (w, ws),
-                    out[:num_tokens])
+        fp8_gemm_nt(
+            (a1q[:num_tokens], a1q_scales[:num_tokens]), (w, ws), out[:num_tokens]
+        )
         pbar.update(1)
         num_tokens -= 1
 
@@ -140,14 +152,20 @@ def _deepgemm_fp8_gemm_nt_warmup(w: torch.Tensor, ws: torch.Tensor,
 
 
 def _deepgemm_grouped_fp8_gemm_nt_contiguous_warmup(
-        w1: torch.Tensor, w2: torch.Tensor, w1_scale: torch.Tensor,
-        w2_scale: torch.Tensor, num_topk: int, max_tokens: int):
-    if (w1.size() in GROUPED_FP8_GEMM_NT_CONTIGUOUS_WARMUP_CACHE
-            and w2.size() in GROUPED_FP8_GEMM_NT_CONTIGUOUS_WARMUP_CACHE):
+    w1: torch.Tensor,
+    w2: torch.Tensor,
+    w1_scale: torch.Tensor,
+    w2_scale: torch.Tensor,
+    num_topk: int,
+    max_tokens: int,
+):
+    if (
+        w1.size() in GROUPED_FP8_GEMM_NT_CONTIGUOUS_WARMUP_CACHE
+        and w2.size() in GROUPED_FP8_GEMM_NT_CONTIGUOUS_WARMUP_CACHE
+    ):
         return
 
-    assert w1.size(0) == w2.size(0), (
-        "w1 and w2 must have the same number of experts")
+    assert w1.size(0) == w2.size(0), "w1 and w2 must have the same number of experts"
 
     block_m = deep_gemm_block_shape()[0]
     num_experts = w1.size(0)
@@ -159,39 +177,36 @@ def _deepgemm_grouped_fp8_gemm_nt_contiguous_warmup(
 
     # This is the maximum GroupedGemm M size that we expect to run
     # the grouped_gemm with.
-    MAX_M = compute_aligned_M(max_tokens,
-                              num_topk,
-                              num_experts,
-                              block_m,
-                              expert_tokens_meta=None)
+    MAX_M = compute_aligned_M(
+        max_tokens, num_topk, num_experts, block_m, expert_tokens_meta=None
+    )
     # Distribute expert-ids evenly.
     MAX_BLOCKS = MAX_M // block_m
-    expert_ids_block = torch.randint(low=0,
-                                     high=num_experts,
-                                     size=(MAX_BLOCKS, ),
-                                     device=device,
-                                     dtype=torch.int32)
+    expert_ids_block = torch.randint(
+        low=0, high=num_experts, size=(MAX_BLOCKS,), device=device, dtype=torch.int32
+    )
     expert_ids = torch.repeat_interleave(expert_ids_block, block_m, dim=0)
 
     def _warmup(w: torch.Tensor, w_scale: torch.Tensor):
-
         _, n, k = w.size()
         a1q = torch.empty((MAX_M, k), device=device, dtype=torch.float8_e4m3fn)
-        a1q_scales = torch.empty((MAX_M, k // block_m),
-                                 device=device,
-                                 dtype=torch.float32)
+        a1q_scales = torch.empty(
+            (MAX_M, k // block_m), device=device, dtype=torch.float32
+        )
         out = torch.empty((MAX_M, n), device=device, dtype=torch.bfloat16)
 
         pbar = tqdm(
             total=MAX_BLOCKS,
-            desc=
-            f"DeepGemm(m_grouped_fp8_gemm_nt_contiguous) warmup (W={w.size()})"
+            desc=f"DeepGemm(m_grouped_fp8_gemm_nt_contiguous) warmup (W={w.size()})",
         )
         num_tokens = MAX_M
         while num_tokens > 0:
             m_grouped_fp8_gemm_nt_contiguous(
-                (a1q[:num_tokens], a1q_scales[:num_tokens]), (w, w_scale),
-                out[:num_tokens], expert_ids[:num_tokens])
+                (a1q[:num_tokens], a1q_scales[:num_tokens]),
+                (w, w_scale),
+                out[:num_tokens],
+                expert_ids[:num_tokens],
+            )
             pbar.update(1)
             num_tokens = num_tokens - block_m
 
@@ -202,27 +217,27 @@ def _warmup(w: torch.Tensor, w_scale: torch.Tensor):
 
 
 def deepgemm_fp8_gemm_nt_warmup(model: torch.nn.Module, max_tokens: int):
-    dg_modules = [
-        m for m in model.modules() if _fp8_linear_may_use_deep_gemm(m)
-    ]
+    dg_modules = [m for m in model.modules() if _fp8_linear_may_use_deep_gemm(m)]
 
     for dgm in dg_modules:
         w, ws, _ = _extract_data_from_linear_base_module(dgm)
         _deepgemm_fp8_gemm_nt_warmup(w=w, ws=ws, max_tokens=max_tokens)
 
 
-def deepgemm_grouped_fp8_gemm_nt_contiguous_warmup(model: torch.nn.Module,
-                                                   max_tokens: int):
+def deepgemm_grouped_fp8_gemm_nt_contiguous_warmup(
+    model: torch.nn.Module, max_tokens: int
+):
     dg_modules = [
-        m for m in model.modules()
-        if _fused_moe_grouped_gemm_may_use_deep_gemm(m)
+        m for m in model.modules() if _fused_moe_grouped_gemm_may_use_deep_gemm(m)
     ]
 
     for dgm in dg_modules:
-        w13, w13_scale, w2, w2_scale, num_topk = (
-            _extract_data_from_fused_moe_module(dgm))
+        w13, w13_scale, w2, w2_scale, num_topk = _extract_data_from_fused_moe_module(
+            dgm
+        )
         _deepgemm_grouped_fp8_gemm_nt_contiguous_warmup(
-            w13, w2, w13_scale, w2_scale, num_topk, max_tokens)
+            w13, w2, w13_scale, w2_scale, num_topk, max_tokens
+        )
 
 
 def deep_gemm_warmup(model: torch.nn.Module, max_tokens: int):
diff --git a/vllm/model_executor/warmup/kernel_warmup.py b/vllm/model_executor/warmup/kernel_warmup.py
index 3f99340c2906..23227065ee95 100644
--- a/vllm/model_executor/warmup/kernel_warmup.py
+++ b/vllm/model_executor/warmup/kernel_warmup.py
@@ -5,6 +5,7 @@
 This is useful specifically for JIT'ed kernels as we don't want JIT'ing to
 happen during model execution.
 """
+
 from typing import TYPE_CHECKING
 
 import torch
@@ -25,9 +26,11 @@
 
 def kernel_warmup(worker: "Worker"):
     # Deep GEMM warmup
-    do_deep_gemm_warmup = (envs.VLLM_USE_DEEP_GEMM
-                           and is_deep_gemm_supported()
-                           and not envs.VLLM_SKIP_DEEP_GEMM_WARMUP)
+    do_deep_gemm_warmup = (
+        envs.VLLM_USE_DEEP_GEMM
+        and is_deep_gemm_supported()
+        and not envs.VLLM_SKIP_DEEP_GEMM_WARMUP
+    )
     if do_deep_gemm_warmup:
         model = worker.get_model()
         max_tokens = worker.scheduler_config.max_num_batched_tokens
@@ -47,8 +50,10 @@ def _is_flashinfer_backend(backend):
             return False
 
     if not worker.model_runner.is_pooling_model and all(
-            _is_flashinfer_backend(group.backend)
-            for groups in worker.model_runner.attn_groups for group in groups):
+        _is_flashinfer_backend(group.backend)
+        for groups in worker.model_runner.attn_groups
+        for group in groups
+    ):
         logger.info("Warming up FlashInfer attention.")
         # Warmup with mixed batch containing both prefill and decode tokens
         # This is to warm up both prefill and decode attention kernels
@@ -78,6 +83,8 @@ def flashinfer_autotune(runner: "GPUModelRunner") -> None:
         # When autotuning with number of tokens m, flashinfer will autotune
         # operations for all number of tokens up to m.
         # So we only need to run with the max number of tokens.
-        runner._dummy_run(runner.scheduler_config.max_num_batched_tokens,
-                          skip_eplb=True,
-                          is_profile=True)
+        runner._dummy_run(
+            runner.scheduler_config.max_num_batched_tokens,
+            skip_eplb=True,
+            is_profile=True,
+        )
diff --git a/vllm/multimodal/__init__.py b/vllm/multimodal/__init__.py
index 8ea79078465e..b7cbb3bbc67e 100644
--- a/vllm/multimodal/__init__.py
+++ b/vllm/multimodal/__init__.py
@@ -1,10 +1,17 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from .hasher import MultiModalHasher
-from .inputs import (BatchedTensorInputs, ModalityData, MultiModalDataBuiltins,
-                     MultiModalDataDict, MultiModalKwargs,
-                     MultiModalKwargsItems, MultiModalPlaceholderDict,
-                     MultiModalUUIDDict, NestedTensors)
+from .inputs import (
+    BatchedTensorInputs,
+    ModalityData,
+    MultiModalDataBuiltins,
+    MultiModalDataDict,
+    MultiModalKwargs,
+    MultiModalKwargsItems,
+    MultiModalPlaceholderDict,
+    MultiModalUUIDDict,
+    NestedTensors,
+)
 from .registry import MultiModalRegistry
 
 MULTIMODAL_REGISTRY = MultiModalRegistry()
diff --git a/vllm/multimodal/audio.py b/vllm/multimodal/audio.py
index d7e9d402a1f9..d81354d9a399 100644
--- a/vllm/multimodal/audio.py
+++ b/vllm/multimodal/audio.py
@@ -66,23 +66,25 @@ def resample(
         orig_sr: float,
     ) -> npt.NDArray[np.floating]:
         if self.target_sr is None:
-            raise RuntimeError("Audio resampling is not supported when "
-                               "`target_sr` is not provided")
+            raise RuntimeError(
+                "Audio resampling is not supported when `target_sr` is not provided"
+            )
         if self.method == "librosa":
-            return resample_audio_librosa(audio,
-                                          orig_sr=orig_sr,
-                                          target_sr=self.target_sr)
+            return resample_audio_librosa(
+                audio, orig_sr=orig_sr, target_sr=self.target_sr
+            )
         elif self.method == "scipy":
-            return resample_audio_scipy(audio,
-                                        orig_sr=orig_sr,
-                                        target_sr=self.target_sr)
+            return resample_audio_scipy(
+                audio, orig_sr=orig_sr, target_sr=self.target_sr
+            )
         else:
-            raise ValueError(f"Invalid resampling method: {self.method}. "
-                             "Supported methods are 'librosa' and 'scipy'.")
+            raise ValueError(
+                f"Invalid resampling method: {self.method}. "
+                "Supported methods are 'librosa' and 'scipy'."
+            )
 
 
 class AudioMediaIO(MediaIO[tuple[npt.NDArray, float]]):
-
     def __init__(self, **kwargs) -> None:
         super().__init__()
 
@@ -113,4 +115,4 @@ def encode_base64(self, media: tuple[npt.NDArray, int]) -> str:
             soundfile.write(buffer, audio, sr, format="WAV")
             data = buffer.getvalue()
 
-        return base64.b64encode(data).decode('utf-8')
+        return base64.b64encode(data).decode("utf-8")
diff --git a/vllm/multimodal/base.py b/vllm/multimodal/base.py
index faffddd57199..fef118a93c6c 100644
--- a/vllm/multimodal/base.py
+++ b/vllm/multimodal/base.py
@@ -9,7 +9,6 @@
 
 
 class MediaIO(ABC, Generic[_T]):
-
     @abstractmethod
     def load_bytes(self, data: bytes) -> _T:
         raise NotImplementedError
diff --git a/vllm/multimodal/cache.py b/vllm/multimodal/cache.py
index 642ec3fd7e3f..15aa91a04092 100644
--- a/vllm/multimodal/cache.py
+++ b/vllm/multimodal/cache.py
@@ -11,17 +11,24 @@
 from typing_extensions import TypeAlias, override
 
 from vllm.distributed.device_communicators.shm_object_storage import (
-    MsgpackSerde, SingleWriterShmObjectStorage, SingleWriterShmRingBuffer)
+    MsgpackSerde,
+    SingleWriterShmObjectStorage,
+    SingleWriterShmRingBuffer,
+)
 from vllm.envs import VLLM_OBJECT_STORAGE_SHM_BUFFER_NAME
 from vllm.logger import init_logger
 from vllm.utils import GiB_bytes, LRUCache, MiB_bytes
-from vllm.utils.jsontree import (json_count_leaves, json_map_leaves,
-                                 json_reduce_leaves)
+from vllm.utils.jsontree import json_count_leaves, json_map_leaves, json_reduce_leaves
 
-from .inputs import (MultiModalBatchedField, MultiModalFeatureSpec,
-                     MultiModalFieldElem, MultiModalKwargs,
-                     MultiModalKwargsItem, MultiModalKwargsItems,
-                     NestedTensors)
+from .inputs import (
+    MultiModalBatchedField,
+    MultiModalFeatureSpec,
+    MultiModalFieldElem,
+    MultiModalKwargs,
+    MultiModalKwargsItem,
+    MultiModalKwargsItems,
+    NestedTensors,
+)
 
 if TYPE_CHECKING:
     from vllm.config import ModelConfig, VllmConfig
@@ -90,7 +97,6 @@ def __init__(
 
 
 class MultiModalCache:
-
     @classmethod
     def get_leaf_size(cls, leaf: object) -> int:
         if isinstance(leaf, MultiModalProcessorCacheItem):
@@ -99,8 +105,15 @@ def get_leaf_size(cls, leaf: object) -> int:
             return leaf.item_size
 
         # These are not subclasses of dict
-        if isinstance(leaf, (MultiModalKwargs, MultiModalKwargsItems,
-                             MultiModalKwargsItem, MultiModalFieldElem)):
+        if isinstance(
+            leaf,
+            (
+                MultiModalKwargs,
+                MultiModalKwargsItems,
+                MultiModalKwargsItem,
+                MultiModalFieldElem,
+            ),
+        ):
             return cls.get_item_size(leaf.data)  # type: ignore
 
         # sys.getsizeof doesn't work for tensors
@@ -116,8 +129,9 @@ def get_item_size(
         *,
         debug: bool = False,
     ) -> int:
-        size = json_reduce_leaves(operator.add,
-                                  json_map_leaves(cls.get_leaf_size, value))
+        size = json_reduce_leaves(
+            operator.add, json_map_leaves(cls.get_leaf_size, value)
+        )
 
         if debug:
             leaf_count = json_count_leaves(value)
@@ -241,17 +255,19 @@ def clear_cache(self) -> None:
         raise NotImplementedError
 
 
-MultiModalProcessorCacheInItem: TypeAlias = \
-    Optional[tuple[MultiModalKwargsItem, Sequence["ResolvedPromptUpdate"]]]
+MultiModalProcessorCacheInItem: TypeAlias = Optional[
+    tuple[MultiModalKwargsItem, Sequence["ResolvedPromptUpdate"]]
+]
 
 
-MultiModalProcessorCacheOutItem: TypeAlias = \
-    tuple[Optional[MultiModalKwargsItem], Sequence["ResolvedPromptUpdate"]]
+MultiModalProcessorCacheOutItem: TypeAlias = tuple[
+    Optional[MultiModalKwargsItem], Sequence["ResolvedPromptUpdate"]
+]
 
 
 class BaseMultiModalProcessorCache(
-        BaseMultiModalCache[MultiModalProcessorCacheInItem,
-                            MultiModalProcessorCacheOutItem]):
+    BaseMultiModalCache[MultiModalProcessorCacheInItem, MultiModalProcessorCacheOutItem]
+):
     """The required interface for caches on P0."""
 
     @abstractmethod
@@ -405,15 +421,13 @@ def __init__(self, vllm_config: "VllmConfig") -> None:
             create=True,  # sender is the writer
         )
         self._shm_cache = SingleWriterShmObjectStorage(
-            max_object_size=mm_config.mm_shm_cache_max_object_size_mb *
-            MiB_bytes,
+            max_object_size=mm_config.mm_shm_cache_max_object_size_mb * MiB_bytes,
             n_readers=self.world_size,
             ring_buffer=ring_buffer,
             serde_class=MsgpackSerde,
         )
         # cache (prompt_updates, modality) for P0 only
-        self._p0_cache: dict[str, tuple[Sequence[ResolvedPromptUpdate],
-                                        str]] = {}
+        self._p0_cache: dict[str, tuple[Sequence[ResolvedPromptUpdate], str]] = {}
 
     @override
     def is_cached_item(self, mm_hash: str) -> bool:
@@ -425,12 +439,10 @@ def get_and_update_item(
         mm_item: MultiModalProcessorCacheInItem,
         mm_hash: str,
     ) -> MultiModalProcessorCacheOutItem:
-
         if self._shm_cache.is_cached(mm_hash):
             address, monotonic_id = self._shm_cache.get_cached(mm_hash)
             prompt_updates, modality = self._p0_cache[mm_hash]
-            return self.address_as_item(address, monotonic_id,
-                                        modality), prompt_updates
+            return self.address_as_item(address, monotonic_id, modality), prompt_updates
 
         assert mm_item is not None, f"Expected a cached item for {mm_hash=}"
 
@@ -440,15 +452,15 @@ def get_and_update_item(
             if len(self._p0_cache) >= 2 * len(self._shm_cache.key_index):
                 self.remove_dangling_items()
             self._p0_cache[mm_hash] = mm_item[1], mm_item[0].modality
-            address_item = self.address_as_item(address, monotonic_id,
-                                                mm_item[0].modality)
+            address_item = self.address_as_item(
+                address, monotonic_id, mm_item[0].modality
+            )
             return address_item, mm_item[1]
         except (ValueError, MemoryError) as e:
             # put may fail if the object is too large or
             # the cache is full.
             # In this case we log the error and keep the original mm_input.
-            logger.debug("Failed to cache mm_input with hash %s: %s", mm_hash,
-                         e)
+            logger.debug("Failed to cache mm_input with hash %s: %s", mm_hash, e)
             return mm_item
 
     @override
@@ -463,8 +475,9 @@ def remove_dangling_items(self) -> None:
         for mm_hash in dangling_hashes:
             del self._p0_cache[mm_hash]
 
-    def address_as_item(self, address: int, monotonic_id: int,
-                        modality: str) -> MultiModalKwargsItem:
+    def address_as_item(
+        self, address: int, monotonic_id: int, modality: str
+    ) -> MultiModalKwargsItem:
         addr_elem = MultiModalFieldElem(
             modality=modality,
             key="address",
@@ -494,9 +507,10 @@ def _enable_processor_cache(
 
 def _enable_ipc_cache(vllm_config: "VllmConfig") -> bool:
     parallel_config = vllm_config.parallel_config
-    supports_ipc_cache = ((parallel_config._api_process_count == 1
-                           and parallel_config.data_parallel_size == 1)
-                          or parallel_config.data_parallel_external_lb)
+    supports_ipc_cache = (
+        parallel_config._api_process_count == 1
+        and parallel_config.data_parallel_size == 1
+    ) or parallel_config.data_parallel_external_lb
 
     return supports_ipc_cache
 
@@ -542,8 +556,8 @@ def processor_only_cache_from_config(
 
 
 class BaseMultiModalReceiverCache(
-        BaseMultiModalCache[Optional[MultiModalKwargsItem],
-                            MultiModalKwargsItem]):
+    BaseMultiModalCache[Optional[MultiModalKwargsItem], MultiModalKwargsItem]
+):
     """The required interface for caches on P1."""
 
     def get_and_update_features(
@@ -552,8 +566,7 @@ def get_and_update_features(
     ) -> list["MultiModalFeatureSpec"]:
         """Update multimodal features with cached encoder outputs."""
         for feature in mm_features:
-            feature.data = self.get_and_update_item(feature.data,
-                                                    feature.identifier)
+            feature.data = self.get_and_update_item(feature.data, feature.identifier)
         return mm_features
 
 
@@ -623,8 +636,7 @@ def __init__(
             create=False,  # Server is a reader
         )
         self._shm_cache = SingleWriterShmObjectStorage(
-            max_object_size=mm_config.mm_shm_cache_max_object_size_mb *
-            MiB_bytes,
+            max_object_size=mm_config.mm_shm_cache_max_object_size_mb * MiB_bytes,
             n_readers=self.world_size,
             ring_buffer=ring_buffer,
             serde_class=MsgpackSerde,
diff --git a/vllm/multimodal/evs.py b/vllm/multimodal/evs.py
index 6f5a1b49d2d8..185e54706ce4 100644
--- a/vllm/multimodal/evs.py
+++ b/vllm/multimodal/evs.py
@@ -14,8 +14,9 @@
 import torch
 
 
-def compute_retained_tokens_count(tokens_per_frame: int, num_frames: int,
-                                  q: float) -> int:
+def compute_retained_tokens_count(
+    tokens_per_frame: int, num_frames: int, q: float
+) -> int:
     """
     Compute the number of retained tokens for a given video.
     Method ensures that we retain all the tokens from the first frame
@@ -67,15 +68,15 @@ def compute_retention_mask(
     )
     tokens_per_frame = (H // spatial_merge_size) * (W // spatial_merge_size)
     # Core EVS
-    similarity = torch.nn.functional.cosine_similarity(video_embeds[1:, ...],
-                                                       video_embeds[:-1, ...],
-                                                       dim=-1)
+    similarity = torch.nn.functional.cosine_similarity(
+        video_embeds[1:, ...], video_embeds[:-1, ...], dim=-1
+    )
     dissimilarity = 1 - similarity
 
     # Always ensure we include all tokens from the first frame
     dissimilarity = torch.cat(
-        [255 * torch.ones_like(video_embeds[:1, :, :, 0]), dissimilarity],
-        dim=0)
+        [255 * torch.ones_like(video_embeds[:1, :, :, 0]), dissimilarity], dim=0
+    )
 
     dissimilarity_flat = dissimilarity.view(-1)
     order = torch.argsort(dissimilarity_flat,
@@ -83,7 +84,8 @@ def compute_retention_mask(
                           descending=True,
                           stable=True)
     retain_num_tokens = compute_retained_tokens_count(
-        tokens_per_frame=tokens_per_frame, num_frames=T, q=q)
+        tokens_per_frame=tokens_per_frame, num_frames=T, q=q
+    )
     topk_indices = order[:retain_num_tokens]
 
     retention_mask = torch.zeros_like(dissimilarity_flat, dtype=torch.bool)
@@ -120,18 +122,34 @@ def compute_mrope_for_media(
     llm_grid_h = video_size_thw[1] // spatial_merge_size
     llm_grid_w = video_size_thw[2] // spatial_merge_size
 
-    t_index = ((torch.arange(llm_grid_t).view(-1, 1).expand(
-        -1, llm_grid_h * llm_grid_w).mul(
-            tokens_per_second * video_second_per_grid)).long().flatten())
-    h_index = (torch.arange(llm_grid_h).view(1, -1,
-                                             1).expand(llm_grid_t, -1,
-                                                       llm_grid_w).flatten())
-    w_index = (torch.arange(llm_grid_w).view(1, 1, -1).expand(
-        llm_grid_t, llm_grid_h, -1).flatten())
-    llm_grid_w = (torch.tensor([llm_grid_w
-                                ]).view(1, 1,
-                                        1).expand(llm_grid_t, llm_grid_h,
-                                                  llm_grid_w).flatten())
+    t_index = (
+        (
+            torch.arange(llm_grid_t)
+            .view(-1, 1)
+            .expand(-1, llm_grid_h * llm_grid_w)
+            .mul(tokens_per_second * video_second_per_grid)
+        )
+        .long()
+        .flatten()
+    )
+    h_index = (
+        torch.arange(llm_grid_h)
+        .view(1, -1, 1)
+        .expand(llm_grid_t, -1, llm_grid_w)
+        .flatten()
+    )
+    w_index = (
+        torch.arange(llm_grid_w)
+        .view(1, 1, -1)
+        .expand(llm_grid_t, llm_grid_h, -1)
+        .flatten()
+    )
+    llm_grid_w = (
+        torch.tensor([llm_grid_w])
+        .view(1, 1, 1)
+        .expand(llm_grid_t, llm_grid_h, llm_grid_w)
+        .flatten()
+    )
 
     positions = torch.stack([t_index, h_index, w_index, llm_grid_w], dim=1)
     return positions
@@ -184,7 +202,8 @@ def recompute_mrope_positions(
 
     # Tensors
     positions: torch.LongTensor = typing.cast(
-        torch.LongTensor, mrope_positions.clone())  # (3, N)
+        torch.LongTensor, mrope_positions.clone()
+    )  # (3, N)
     N = input_ids.numel()
 
     image_mask = input_ids.eq(image_token_id)
@@ -194,8 +213,7 @@ def recompute_mrope_positions(
 
     # Early exit: no media in this chunk
     if len(multimodal_positions) == 0:
-        delta = (int((positions.max().item() + 1) -
-                     N) if positions.numel() else -N)
+        delta = int((positions.max().item() + 1) - N) if positions.numel() else -N
         return positions, delta
 
     total_mm_tokens = torch.count_nonzero(media_mask)
@@ -204,12 +222,12 @@ def recompute_mrope_positions(
     # Early exit: we've updated positions for all media tokens
     # (and consequently - for all remaining text tokens)
     if seen_mm_tokens == total_mm_tokens:
-        delta = (int((positions.max().item() + 1) -
-                     N) if positions.numel() else -N)
+        delta = int((positions.max().item() + 1) - N) if positions.numel() else -N
         return positions, delta
 
-    vision_start_indices = (input_ids == vision_start_token_id).nonzero(
-        as_tuple=True)[0]
+    vision_start_indices = (input_ids == vision_start_token_id).nonzero(as_tuple=True)[
+        0
+    ]
 
     for mm_pos in multimodal_positions:
         # Each mm_pos can be a complete embedding for single media
@@ -219,8 +237,9 @@ def recompute_mrope_positions(
         # - Current prefill chunk has no vision start indexes at all
         # - Vision start token appeared in previous prefill round
         # - Regular case
-        seen_vision_start_indices = vision_start_indices[vision_start_indices <
-                                                         num_computed_tokens]
+        seen_vision_start_indices = vision_start_indices[
+            vision_start_indices < num_computed_tokens
+        ]
 
         if len(seen_vision_start_indices):
             # If we have encountered some vision start indexes,
@@ -229,19 +248,23 @@ def recompute_mrope_positions(
             # | TTTTTTTTTSVVVVVVVVVV|VVVVVVTTTTTTTTTTTTTTTT|
             last_vision_start_token = seen_vision_start_indices[-1]
             seem_mm_tokens_before_last_vision_start = torch.count_nonzero(
-                media_mask[:last_vision_start_token])
+                media_mask[:last_vision_start_token]
+            )
             in_the_middle_of_media = (
-                seen_mm_tokens > seem_mm_tokens_before_last_vision_start)
+                seen_mm_tokens > seem_mm_tokens_before_last_vision_start
+            )
 
             if in_the_middle_of_media:
-                mm_embeddings_seen = (seen_mm_tokens -
-                                      seem_mm_tokens_before_last_vision_start)
+                mm_embeddings_seen = (
+                    seen_mm_tokens - seem_mm_tokens_before_last_vision_start
+                )
                 global_mm_start = last_vision_start_token
             else:
                 # We have completed previous mm_embedding part and
                 # ready to start a new one
                 next_vision_start_token = vision_start_indices[
-                    vision_start_indices >= num_computed_tokens][0]
+                    vision_start_indices >= num_computed_tokens
+                ][0]
                 mm_embeddings_seen = 0
                 global_mm_start = next_vision_start_token
 
@@ -249,7 +272,8 @@ def recompute_mrope_positions(
             # If there were no vision start indexes so far,
             # let's find first vision start index
             next_vision_start_token = vision_start_indices[
-                vision_start_indices >= num_computed_tokens][0]
+                vision_start_indices >= num_computed_tokens
+            ][0]
 
             mm_embeddings_seen = 0
             global_mm_start = next_vision_start_token
diff --git a/vllm/multimodal/hasher.py b/vllm/multimodal/hasher.py
index df6c531d876a..91d86cd9a189 100644
--- a/vllm/multimodal/hasher.py
+++ b/vllm/multimodal/hasher.py
@@ -17,23 +17,23 @@
 
 
 class MultiModalHasher:
-
     @classmethod
     def serialize_item(cls, obj: object) -> Iterable[Union[bytes, memoryview]]:
         # Simple cases
         if isinstance(obj, (bytes, memoryview)):
-            return (obj, )
+            return (obj,)
         if isinstance(obj, str):
-            return (obj.encode("utf-8"), )
+            return (obj.encode("utf-8"),)
         if isinstance(obj, (int, float)):
-            return (np.array(obj).tobytes(), )
+            return (np.array(obj).tobytes(),)
 
         if isinstance(obj, Image.Image):
             exif = obj.getexif()
             if Image.ExifTags.Base.ImageID in exif and isinstance(
-                    exif[Image.ExifTags.Base.ImageID], uuid.UUID):
+                exif[Image.ExifTags.Base.ImageID], uuid.UUID
+            ):
                 # If the image has exif ImageID tag, use that
-                return (exif[Image.ExifTags.Base.ImageID].bytes, )
+                return (exif[Image.ExifTags.Base.ImageID].bytes,)
             data = {"mode": obj.mode, "data": np.asarray(obj)}
             if obj.palette is not None:
                 data["palette"] = obj.palette.palette
@@ -49,30 +49,35 @@ def serialize_item(cls, obj: object) -> Iterable[Union[bytes, memoryview]]:
             # Workaround: View the tensor as a contiguous 1D array of bytes
             if tensor_dtype == torch.bfloat16:
                 tensor_obj = tensor_obj.contiguous()
-                tensor_obj = tensor_obj.view(
-                    (tensor_obj.numel(), )).view(torch.uint8)
+                tensor_obj = tensor_obj.view((tensor_obj.numel(),)).view(torch.uint8)
 
                 return cls.iter_item_to_bytes(
-                    "tensor", {
+                    "tensor",
+                    {
                         "original_dtype": str(tensor_dtype),
                         "original_shape": tuple(tensor_shape),
                         "data": tensor_obj.numpy(),
-                    })
+                    },
+                )
             return cls.iter_item_to_bytes("tensor", tensor_obj.numpy())
         if isinstance(obj, np.ndarray):
             # If the array is non-contiguous, we need to copy it first
-            arr_data = obj.view(
-                np.uint8).data if obj.flags.c_contiguous else obj.tobytes()
-            return cls.iter_item_to_bytes("ndarray", {
-                "dtype": obj.dtype.str,
-                "shape": obj.shape,
-                "data": arr_data,
-            })
+            arr_data = (
+                obj.view(np.uint8).data if obj.flags.c_contiguous else obj.tobytes()
+            )
+            return cls.iter_item_to_bytes(
+                "ndarray",
+                {
+                    "dtype": obj.dtype.str,
+                    "shape": obj.shape,
+                    "data": arr_data,
+                },
+            )
         logger.warning(
-            "No serialization method found for %s. "
-            "Falling back to pickle.", type(obj))
+            "No serialization method found for %s. Falling back to pickle.", type(obj)
+        )
 
-        return (pickle.dumps(obj), )
+        return (pickle.dumps(obj),)
 
     @classmethod
     def iter_item_to_bytes(
diff --git a/vllm/multimodal/image.py b/vllm/multimodal/image.py
index 1006c1ce4b24..f50ab1faebba 100644
--- a/vllm/multimodal/image.py
+++ b/vllm/multimodal/image.py
@@ -12,9 +12,9 @@
 from .base import MediaIO
 
 
-def rescale_image_size(image: Image.Image,
-                       size_factor: float,
-                       transpose: int = -1) -> Image.Image:
+def rescale_image_size(
+    image: Image.Image, size_factor: float, transpose: int = -1
+) -> Image.Image:
     """Rescale the dimensions of an image by a constant factor."""
     new_width = int(image.width * size_factor)
     new_height = int(image.height * size_factor)
@@ -26,7 +26,7 @@ def rescale_image_size(image: Image.Image,
 
 def rgba_to_rgb(
     image: Image.Image,
-    background_color: Union[tuple[int, int, int], list[int]] = (255, 255, 255)
+    background_color: Union[tuple[int, int, int], list[int]] = (255, 255, 255),
 ) -> Image.Image:
     """Convert an RGBA image to RGB with filled background color."""
     assert image.mode == "RGBA"
@@ -45,7 +45,6 @@ def convert_image_mode(image: Image.Image, to_mode: str):
 
 
 class ImageMediaIO(MediaIO[Image.Image]):
-
     def __init__(self, image_mode: str = "RGB", **kwargs) -> None:
         super().__init__()
 
@@ -59,18 +58,21 @@ def __init__(self, image_mode: str = "RGB", **kwargs) -> None:
 
         # Extract RGBA background color from kwargs if provided
         # Default to white background for backward compatibility
-        rgba_bg = kwargs.get('rgba_background_color', (255, 255, 255))
+        rgba_bg = kwargs.get("rgba_background_color", (255, 255, 255))
         # Convert list to tuple for consistency
         if isinstance(rgba_bg, list):
             rgba_bg = tuple(rgba_bg)
 
         # Validate rgba_background_color format
-        if not (isinstance(rgba_bg, tuple) and len(rgba_bg) == 3
-                and all(isinstance(c, int) and 0 <= c <= 255
-                        for c in rgba_bg)):
+        if not (
+            isinstance(rgba_bg, tuple)
+            and len(rgba_bg) == 3
+            and all(isinstance(c, int) and 0 <= c <= 255 for c in rgba_bg)
+        ):
             raise ValueError(
                 "rgba_background_color must be a list or tuple of 3 integers "
-                "in the range [0, 255].")
+                "in the range [0, 255]."
+            )
         self.rgba_background_color = rgba_bg
 
     def _convert_image_mode(self, image: Image.Image) -> Image.Image:
@@ -108,11 +110,10 @@ def encode_base64(
             image.save(buffer, image_format)
             data = buffer.getvalue()
 
-        return pybase64.b64encode(data).decode('utf-8')
+        return pybase64.b64encode(data).decode("utf-8")
 
 
 class ImageEmbeddingMediaIO(MediaIO[torch.Tensor]):
-
     def __init__(self) -> None:
         super().__init__()
 
@@ -127,4 +128,4 @@ def load_file(self, filepath: Path) -> torch.Tensor:
         return torch.load(filepath, weights_only=True)
 
     def encode_base64(self, media: torch.Tensor) -> str:
-        return pybase64.b64encode(media.numpy()).decode('utf-8')
+        return pybase64.b64encode(media.numpy()).decode("utf-8")
diff --git a/vllm/multimodal/inputs.py b/vllm/multimodal/inputs.py
index 14d0c8dda78e..51e33ea26330 100644
--- a/vllm/multimodal/inputs.py
+++ b/vllm/multimodal/inputs.py
@@ -7,8 +7,7 @@
 from dataclasses import dataclass
 from functools import partial
 from itertools import accumulate
-from typing import (TYPE_CHECKING, Any, Literal, Optional, TypedDict, Union,
-                    cast, final)
+from typing import TYPE_CHECKING, Any, Literal, Optional, TypedDict, Union, cast, final
 
 import numpy as np
 from typing_extensions import NotRequired, TypeAlias, TypeVar, deprecated
@@ -35,8 +34,9 @@
 item, which can be passed to a HuggingFace `ImageProcessor`.
 """
 
-HfVideoItem: TypeAlias = Union[list["Image"], np.ndarray, "torch.Tensor",
-                               list[np.ndarray], list["torch.Tensor"]]
+HfVideoItem: TypeAlias = Union[
+    list["Image"], np.ndarray, "torch.Tensor", list[np.ndarray], list["torch.Tensor"]
+]
 """
 A `transformers.image_utils.VideoInput` representing a single video
 item, which can be passed to a HuggingFace `VideoProcessor`.
@@ -58,8 +58,9 @@
 these are directly passed to the model without HF processing.
 """
 
-VideoItem: TypeAlias = Union[HfVideoItem, "torch.Tensor",
-                             tuple[HfVideoItem, dict[str, Any]]]
+VideoItem: TypeAlias = Union[
+    HfVideoItem, "torch.Tensor", tuple[HfVideoItem, dict[str, Any]]
+]
 """
 A `transformers.video_utils.VideoInput` representing a single video item. 
 This can be passed to a HuggingFace `VideoProcessor` 
@@ -70,8 +71,7 @@
 these are directly passed to the model without HF processing.
 """
 
-AudioItem: TypeAlias = Union[HfAudioItem, tuple[np.ndarray, float],
-                             "torch.Tensor"]
+AudioItem: TypeAlias = Union[HfAudioItem, tuple[np.ndarray, float], "torch.Tensor"]
 """
 Represents a single audio
 item, which can be passed to a HuggingFace `AudioProcessor`.
@@ -177,8 +177,12 @@ def __eq__(self, other: object) -> bool:
         return nested_tensors_equal(self.is_embed, other.is_embed)
 
 
-NestedTensors: TypeAlias = Union[list["NestedTensors"], list["torch.Tensor"],
-                                 "torch.Tensor", tuple["torch.Tensor", ...]]
+NestedTensors: TypeAlias = Union[
+    list["NestedTensors"],
+    list["torch.Tensor"],
+    "torch.Tensor",
+    tuple["torch.Tensor", ...],
+]
 """
 Uses a list instead of a tensor if the dimensions of each element do not match.
 """
@@ -193,11 +197,13 @@ def nested_tensors_equal(a: NestedTensors, b: NestedTensors) -> bool:
         return isinstance(a, torch.Tensor) and torch.equal(b, a)
 
     if isinstance(a, list):
-        return (isinstance(b, list)
-                and all(nested_tensors_equal(a_, b_) for a_, b_ in zip(a, b)))
+        return isinstance(b, list) and all(
+            nested_tensors_equal(a_, b_) for a_, b_ in zip(a, b)
+        )
     if isinstance(b, list):
-        return (isinstance(a, list)
-                and all(nested_tensors_equal(b_, a_) for b_, a_ in zip(b, a)))
+        return isinstance(a, list) and all(
+            nested_tensors_equal(b_, a_) for b_, a_ in zip(b, a)
+        )
 
     # Both a and b are scalars
     return a == b
@@ -214,7 +220,7 @@ def nested_tensors_equal(a: NestedTensors, b: NestedTensors) -> bool:
 class MultiModalFeatureSpec:
     """
     Represents a single multimodal input with its processed data and metadata.
-    
+
     Used by the V1 engine to track multimodal data through processing and
     caching. A request containing multiple multimodal items will have one
     MultiModalFeatureSpec per item.
@@ -280,9 +286,11 @@ def __eq__(self, other: object) -> bool:
         else:
             data_equal = nested_tensors_equal(self.data, other.data)
 
-        return ((self.modality, self.key) == (other.modality, other.key)
-                and data_equal
-                and type(self.field) == type(other.field))  # noqa: E721
+        return (
+            (self.modality, self.key) == (other.modality, other.key)
+            and data_equal
+            and type(self.field) == type(other.field)
+        )  # noqa: E721
 
 
 @dataclass(frozen=True)
@@ -385,10 +393,12 @@ def _reduce_data(
                 return batch[0].unsqueeze(0).contiguous()
             first_shape = batch[0].shape
             if all(elem.shape == first_shape for elem in batch):
-                out = torch.empty((len(batch), *batch[0].shape),
-                                  dtype=batch[0].dtype,
-                                  device=batch[0].device,
-                                  pin_memory=pin_memory)
+                out = torch.empty(
+                    (len(batch), *batch[0].shape),
+                    dtype=batch[0].dtype,
+                    device=batch[0].device,
+                    pin_memory=pin_memory,
+                )
                 return torch.stack(batch, out=out)
 
         return batch
@@ -401,6 +411,7 @@ class MultiModalFlatField(BaseMultiModalField):
         [`MultiModalFieldConfig.flat`][vllm.multimodal.inputs.MultiModalFieldConfig.flat]
         [`MultiModalFieldConfig.flat_from_sizes`][vllm.multimodal.inputs.MultiModalFieldConfig.flat_from_sizes]
     """
+
     slices: Union[Sequence[slice], Sequence[Sequence[slice]]]
     dim: int = 0
 
@@ -412,8 +423,9 @@ def build_elems(
     ) -> Sequence[MultiModalFieldElem]:
         field_factory = self._field_factory(modality=modality, key=key)
         if not is_list_of(self.slices, slice, check="all"):
-            assert isinstance(data, torch.Tensor), \
+            assert isinstance(data, torch.Tensor), (
                 "torch.Tensor is required for multiple slices"
+            )
         return [field_factory(data[cast(slice, s)]) for s in self.slices]
 
     def _reduce_data(
@@ -433,17 +445,19 @@ def _reduce_data(
             dim = self.dim + (self.dim < 0) * len(batch[0].shape)
 
             def _shape_before_after(tensor: torch.Tensor):
-                return tensor.shape[:dim], tensor.shape[dim + 1:]
+                return tensor.shape[:dim], tensor.shape[dim + 1 :]
 
             first_shape = _shape_before_after(batch[0])
 
             if all(_shape_before_after(elem) == first_shape for elem in batch):
                 shape_before, shape_after = first_shape
                 shape_concat = sum(item.shape[dim] for item in batch)
-                out = torch.empty((*shape_before, shape_concat, *shape_after),
-                                  dtype=batch[0].dtype,
-                                  device=batch[0].device,
-                                  pin_memory=pin_memory)
+                out = torch.empty(
+                    (*shape_before, shape_concat, *shape_after),
+                    dtype=batch[0].dtype,
+                    device=batch[0].device,
+                    pin_memory=pin_memory,
+                )
                 return torch.concat(batch, dim=self.dim, out=out)
 
         assert self.dim == 0, "dim == 0 is required for nested list"
@@ -456,6 +470,7 @@ class MultiModalSharedField(BaseMultiModalField):
     Info:
         [`MultiModalFieldConfig.shared`][vllm.multimodal.inputs.MultiModalFieldConfig.shared]
     """
+
     batch_size: int
 
     def build_elems(
@@ -477,7 +492,6 @@ def _reduce_data(
 
 
 class MultiModalFieldConfig:
-
     @staticmethod
     def batched(modality: str):
         """
@@ -508,9 +522,11 @@ def batched(modality: str):
         )
 
     @staticmethod
-    def flat(modality: str,
-             slices: Union[Sequence[slice], Sequence[Sequence[slice]]],
-             dim: int = 0):
+    def flat(
+        modality: str,
+        slices: Union[Sequence[slice], Sequence[Sequence[slice]]],
+        dim: int = 0,
+    ):
         """
         Defines a field where an element in the batch is obtained by
         slicing along the first dimension of the underlying data.
@@ -561,9 +577,7 @@ def flat(modality: str,
         )
 
     @staticmethod
-    def flat_from_sizes(modality: str,
-                        size_per_item: "torch.Tensor",
-                        dim: int = 0):
+    def flat_from_sizes(modality: str, size_per_item: "torch.Tensor", dim: int = 0):
         """
         Defines a field where an element in the batch is obtained by
         slicing along the first dimension of the underlying data.
@@ -609,13 +623,17 @@ def flat_from_sizes(modality: str,
         """
 
         if size_per_item.ndim != 1:
-            raise ValueError("size_per_item should be a 1-D tensor, "
-                             f"but found shape: {size_per_item.shape}")
+            raise ValueError(
+                "size_per_item should be a 1-D tensor, "
+                f"but found shape: {size_per_item.shape}"
+            )
 
         slice_idxs = [0, *accumulate(size_per_item)]
-        slices = [(slice(None, None, None), ) * dim +
-                  (slice(slice_idxs[i], slice_idxs[i + 1]), )
-                  for i in range(len(size_per_item))]
+        slices = [
+            (slice(None, None, None),) * dim
+            + (slice(slice_idxs[i], slice_idxs[i + 1]),)
+            for i in range(len(size_per_item))
+        ]
 
         return MultiModalFieldConfig.flat(modality, slices, dim=dim)
 
@@ -745,7 +763,8 @@ def from_hf_inputs(
             if len(set(batch_sizes.values())) > 1:
                 raise ValueError(
                     f"Cannot merge different batch sizes for {modality=}! "
-                    f"Found: {batch_sizes=}")
+                    f"Found: {batch_sizes=}"
+                )
 
             batch_size = next(iter(batch_sizes.values()))
             for item_idx in range(batch_size):
@@ -761,8 +780,10 @@ def from_seq(items: Sequence[MultiModalKwargsItem]):
 
     def __getitem__(self, modality: str) -> Sequence[_I]:
         if modality not in self:
-            raise KeyError(f"Modality {modality!r} not found. "
-                           f"Available modalities: {set(self.keys())}")
+            raise KeyError(
+                f"Modality {modality!r} not found. "
+                f"Available modalities: {set(self.keys())}"
+            )
 
         return super().__getitem__(modality)  # type: ignore[return-value]
 
@@ -770,8 +791,7 @@ def require_data(self) -> "MultiModalKwargsItems[MultiModalKwargsItem]":
         for modality, items in self.items():
             for i, item in enumerate(items):
                 if item is None:
-                    raise RuntimeError(
-                        f"Found empty mm_items[{modality}][{i}]")
+                    raise RuntimeError(f"Found empty mm_items[{modality}][{i}]")
 
         return self  # type: ignore[return-value]
 
@@ -780,17 +800,19 @@ def get_data(self, *, pin_memory: bool = False) -> "MultiModalKwargs":
         for modality, items in self.items():
             for i, item in enumerate(items):
                 if item is None:
-                    raise RuntimeError("Cannot build data from empty "
-                                       f"mm_items[{modality}][{i}]")
+                    raise RuntimeError(
+                        f"Cannot build data from empty mm_items[{modality}][{i}]"
+                    )
 
                 for key, elem in item.items():
                     elems_by_key[key].append(elem)
 
-        return MultiModalKwargs({
-            key:
-            elems[0].field.reduce_data(elems, pin_memory=pin_memory)
-            for key, elems in elems_by_key.items()
-        })
+        return MultiModalKwargs(
+            {
+                key: elems[0].field.reduce_data(elems, pin_memory=pin_memory)
+                for key, elems in elems_by_key.items()
+            }
+        )
 
 
 MultiModalKwargsOptionalItems: TypeAlias = Union[
@@ -806,33 +828,36 @@ class MultiModalKwargs(UserDict[str, NestedTensors]):
     """
 
     @staticmethod
-    @deprecated("`MultiModalKwargs.from_hf_inputs` is deprecated and "
-                "will be removed in v0.13. "
-                "Please use `MultiModalKwargsItems.from_hf_inputs` and "
-                "access the tensor data using `.get_data()`.")
+    @deprecated(
+        "`MultiModalKwargs.from_hf_inputs` is deprecated and "
+        "will be removed in v0.13. "
+        "Please use `MultiModalKwargsItems.from_hf_inputs` and "
+        "access the tensor data using `.get_data()`."
+    )
     def from_hf_inputs(
         hf_inputs: "BatchFeature",
         config_by_key: Mapping[str, MultiModalFieldConfig],
     ):
-        return MultiModalKwargsItems.from_hf_inputs(hf_inputs, config_by_key) \
-            .get_data()
+        return MultiModalKwargsItems.from_hf_inputs(hf_inputs, config_by_key).get_data()
 
     @staticmethod
-    @deprecated("`MultiModalKwargs.from_items` is deprecated and "
-                "will be removed in v0.13. "
-                "Please use `MultiModalKwargsItems.from_seq` and "
-                "access the tensor data using `.get_data()`.")
+    @deprecated(
+        "`MultiModalKwargs.from_items` is deprecated and "
+        "will be removed in v0.13. "
+        "Please use `MultiModalKwargsItems.from_seq` and "
+        "access the tensor data using `.get_data()`."
+    )
     def from_items(
         items: Sequence[MultiModalKwargsItem],
         *,
         pin_memory: bool = False,
     ):
-        return MultiModalKwargsItems.from_seq(items) \
-            .get_data(pin_memory=pin_memory)
+        return MultiModalKwargsItems.from_seq(items).get_data(pin_memory=pin_memory)
 
     @staticmethod
-    def _try_stack(nested_tensors: NestedTensors,
-                   pin_memory: bool = False) -> NestedTensors:
+    def _try_stack(
+        nested_tensors: NestedTensors, pin_memory: bool = False
+    ) -> NestedTensors:
         """
         Stack the inner dimensions that have the same shape in
         a nested list of tensors.
@@ -849,9 +874,7 @@ def _try_stack(nested_tensors: NestedTensors,
         if isinstance(nested_tensors, (int, float)):
             return torch.tensor(nested_tensors)
 
-        stacked = [
-            MultiModalKwargs._try_stack(t, pin_memory) for t in nested_tensors
-        ]
+        stacked = [MultiModalKwargs._try_stack(t, pin_memory) for t in nested_tensors]
         if not is_list_of(stacked, torch.Tensor, check="all"):
             # Only tensors (not lists) can be stacked.
             return stacked
@@ -867,16 +890,19 @@ def _try_stack(nested_tensors: NestedTensors,
             # The tensors have incompatible shapes and can't be stacked.
             return tensors_
 
-        outputs = torch.empty(len(tensors_),
-                              *tensors_[0].shape,
-                              dtype=tensors_[0].dtype,
-                              device=tensors_[0].device,
-                              pin_memory=pin_memory)
+        outputs = torch.empty(
+            len(tensors_),
+            *tensors_[0].shape,
+            dtype=tensors_[0].dtype,
+            device=tensors_[0].device,
+            pin_memory=pin_memory,
+        )
         return torch.stack(tensors_, out=outputs)
 
     @staticmethod
-    def batch(inputs_list: list["MultiModalKwargs"],
-              pin_memory: bool = False) -> BatchedTensorInputs:
+    def batch(
+        inputs_list: list["MultiModalKwargs"], pin_memory: bool = False
+    ) -> BatchedTensorInputs:
         """
         Batch multiple inputs together into a dictionary.
 
@@ -915,8 +941,10 @@ def as_kwargs(
 
     def __getitem__(self, key: str):
         if key not in self:
-            raise KeyError(f"Keyword argument {key!r} not found. "
-                           f"Available keys: {set(self.keys())}")
+            raise KeyError(
+                f"Keyword argument {key!r} not found. "
+                f"Available keys: {set(self.keys())}"
+            )
 
         return super().__getitem__(key)
 
diff --git a/vllm/multimodal/parse.py b/vllm/multimodal/parse.py
index 493dd3560a51..8fdc5cf721d0 100644
--- a/vllm/multimodal/parse.py
+++ b/vllm/multimodal/parse.py
@@ -4,8 +4,16 @@
 from abc import ABC, abstractmethod
 from collections import UserDict
 from collections.abc import Callable, Iterator, Mapping, Sequence
-from typing import (TYPE_CHECKING, Any, Generic, Literal, NamedTuple, Optional,
-                    TypeVar, Union)
+from typing import (
+    TYPE_CHECKING,
+    Any,
+    Generic,
+    Literal,
+    NamedTuple,
+    Optional,
+    TypeVar,
+    Union,
+)
 
 import numpy as np
 import torch
@@ -14,9 +22,18 @@
 from vllm.utils import LazyLoader, is_list_of
 
 from .audio import AudioResampler
-from .inputs import (AudioItem, HfAudioItem, HfImageItem, HfVideoItem,
-                     ImageItem, ModalityData, MultiModalDataDict,
-                     MultiModalFieldConfig, MultiModalKwargsItems, VideoItem)
+from .inputs import (
+    AudioItem,
+    HfAudioItem,
+    HfImageItem,
+    HfVideoItem,
+    ImageItem,
+    ModalityData,
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+    VideoItem,
+)
 
 _T = TypeVar("_T")
 _I = TypeVar("_I")
@@ -40,8 +57,7 @@ def __init__(self, data: _T, modality: str) -> None:
         self.modality = modality
 
     def __repr__(self) -> str:
-        return (f"{type(self).__name__}(modality={self.modality!r}, "
-                f"len={len(self)})")
+        return f"{type(self).__name__}(modality={self.modality!r}, len={len(self)})"
 
     def __len__(self) -> int:
         return self.get_count()
@@ -51,8 +67,7 @@ def __getitem__(self, index: int) -> _I:
 
     if TYPE_CHECKING:
         # Auto-generated
-        def __iter__(self) -> Iterator[_I]:
-            ...
+        def __iter__(self) -> Iterator[_I]: ...
 
     @abstractmethod
     def get_count(self) -> int:
@@ -95,8 +110,9 @@ def get_passthrough_data(self) -> Mapping[str, object]:
         return {}
 
 
-class EmbeddingItems(ModalityDataItems[Union[torch.Tensor, list[torch.Tensor]],
-                                       torch.Tensor]):
+class EmbeddingItems(
+    ModalityDataItems[Union[torch.Tensor, list[torch.Tensor]], torch.Tensor]
+):
     """
     Base class for data items that are expressed as a batched embedding tensor,
     or a list of embedding tensors (one per item).
@@ -118,8 +134,9 @@ def get_feature_size(self, item_idx: int) -> int:
         return len(self.get(item_idx))
 
 
-class DictEmbeddingItems(ModalityDataItems[Mapping[str, torch.Tensor],
-                                           Mapping[str, torch.Tensor]]):
+class DictEmbeddingItems(
+    ModalityDataItems[Mapping[str, torch.Tensor], Mapping[str, torch.Tensor]]
+):
     """
     Base class for data items that are expressed as a dictionary of tensors.
 
@@ -143,8 +160,10 @@ def __init__(
         missing_required_data_keys = required_fields - data.keys()
         if missing_required_data_keys:
             data_keys = set(data.keys())
-            msg = (f"The data should contain the fields: {required_fields}, "
-                   f"but only found the following keys: {data_keys}")
+            msg = (
+                f"The data should contain the fields: {required_fields}, "
+                f"but only found the following keys: {data_keys}"
+            )
             raise ValueError(msg)
 
         fields_config = fields_factory(data)
@@ -176,7 +195,6 @@ def get_passthrough_data(self) -> Mapping[str, object]:
 
 
 class AudioProcessorItems(ProcessorBatchItems[HfAudioItem]):
-
     def __init__(self, data: Optional[Sequence[HfAudioItem]]) -> None:
         if data is None:
             data = [None]
@@ -188,7 +206,6 @@ def get_audio_length(self, item_idx: int) -> int:
 
 
 class AudioEmbeddingItems(EmbeddingItems):
-
     def __init__(self, data: Union[torch.Tensor, list[torch.Tensor]]) -> None:
         super().__init__(data, "audio")
 
@@ -199,7 +216,6 @@ class ImageSize(NamedTuple):
 
 
 class ImageProcessorItems(ProcessorBatchItems[HfImageItem]):
-
     def __init__(self, data: Optional[Sequence[HfImageItem]]) -> None:
         if data is None:
             data = [None]
@@ -218,18 +234,17 @@ def get_image_size(self, item_idx: int) -> ImageSize:
 
 
 class ImageEmbeddingItems(EmbeddingItems):
-
     def __init__(self, data: Union[torch.Tensor, list[torch.Tensor]]) -> None:
         super().__init__(data, "image")
 
 
 class VideoProcessorItems(ProcessorBatchItems[HfVideoItem]):
-
     def __init__(
         self,
         data: Optional[Sequence[HfVideoItem]],
-        metadata: Optional[Union[dict[str, Any],
-                                 list[Optional[dict[str, Any]]]]] = None,
+        metadata: Optional[
+            Union[dict[str, Any], list[Optional[dict[str, Any]]]]
+        ] = None,
     ) -> None:
         if data is None:
             data = [None]
@@ -252,7 +267,6 @@ def get_frame_size(self, item_idx: int) -> ImageSize:
 
 
 class VideoEmbeddingItems(EmbeddingItems):
-
     def __init__(self, data: Union[torch.Tensor, list[torch.Tensor]]) -> None:
         super().__init__(data, "video")
 
@@ -276,8 +290,10 @@ def get_count(self, modality: str, *, strict: bool = True) -> int:
         if modality not in self:
             if strict:
                 available_modalities = set(self.keys())
-                raise KeyError(f"Modality {modality!r} not found. "
-                               f"Available modalities: {available_modalities}")
+                raise KeyError(
+                    f"Modality {modality!r} not found. "
+                    f"Available modalities: {available_modalities}"
+                )
 
             return 0
 
@@ -298,20 +314,25 @@ def get_items(
         """
         if modality not in self:
             available_modalities = set(self.keys())
-            raise KeyError(f"Modality {modality!r} not found. "
-                           f"Available modalities: {available_modalities}")
+            raise KeyError(
+                f"Modality {modality!r} not found. "
+                f"Available modalities: {available_modalities}"
+            )
 
         items = self[modality]
         if not isinstance(items, typ):
-            raise TypeError(f"Invalid type of data items for {modality=}. "
-                            f"Expected type: {typ}, but "
-                            f"found type: {type(items)}")
+            raise TypeError(
+                f"Invalid type of data items for {modality=}. "
+                f"Expected type: {typ}, but "
+                f"found type: {type(items)}"
+            )
 
         return items  # type: ignore[return-value]
 
 
-ModalityDataParser: TypeAlias = Callable[[ModalityData[Any]],
-                                         Optional[ModalityDataItems[Any, Any]]]
+ModalityDataParser: TypeAlias = Callable[
+    [ModalityData[Any]], Optional[ModalityDataItems[Any, Any]]
+]
 
 
 class MultiModalDataParser:
@@ -340,7 +361,7 @@ def __init__(
         self.video_needs_metadata = video_needs_metadata
 
     def _is_embeddings(
-            self, data: object
+        self, data: object
     ) -> TypeGuard[Union[torch.Tensor, list[torch.Tensor]]]:
         if isinstance(data, torch.Tensor):
             return data.ndim == 3
@@ -395,17 +416,20 @@ def _parse_audio_data(
             return AudioProcessorItems(None)
 
         # also check single audio item with sampling rate
-        if self._is_empty(data) or (isinstance(data, tuple)
-                                    and self._is_empty(data[0])):
+        if self._is_empty(data) or (
+            isinstance(data, tuple) and self._is_empty(data[0])
+        ):
             return None
 
         if self._is_embeddings(data):
             return AudioEmbeddingItems(data)
 
-        if (is_list_of(data, float)
-                or isinstance(data,
-                              (np.ndarray, torch.Tensor)) and data.ndim == 1
-                or isinstance(data, tuple)):
+        if (
+            is_list_of(data, float)
+            or isinstance(data, (np.ndarray, torch.Tensor))
+            and data.ndim == 1
+            or isinstance(data, tuple)
+        ):
             data_items = [data]
         elif isinstance(data, (np.ndarray, torch.Tensor)):
             data_items = [elem for elem in data]
@@ -418,8 +442,7 @@ def _parse_audio_data(
             if orig_sr is None:
                 new_audio = audio
             else:
-                new_audio = self.audio_resampler.resample(audio,
-                                                          orig_sr=orig_sr)
+                new_audio = self.audio_resampler.resample(audio, orig_sr=orig_sr)
 
             new_audios.append(new_audio)
 
@@ -438,9 +461,11 @@ def _parse_image_data(
         if self._is_embeddings(data):
             return ImageEmbeddingItems(data)
 
-        if (isinstance(data, PILImage.Image)
-                or isinstance(data,
-                              (np.ndarray, torch.Tensor)) and data.ndim == 3):
+        if (
+            isinstance(data, PILImage.Image)
+            or isinstance(data, (np.ndarray, torch.Tensor))
+            and data.ndim == 3
+        ):
             data_items = [data]
         elif isinstance(data, (np.ndarray, torch.Tensor)):
             data_items = [elem for elem in data]
@@ -462,9 +487,11 @@ def _parse_video_data(
         if self._is_embeddings(data):
             return VideoEmbeddingItems(data)
 
-        if (is_list_of(data, PILImage.Image)
-                or isinstance(data,
-                              (np.ndarray, torch.Tensor)) and data.ndim == 4):
+        if (
+            is_list_of(data, PILImage.Image)
+            or isinstance(data, (np.ndarray, torch.Tensor))
+            and data.ndim == 4
+        ):
             data_items = [data]
         elif isinstance(data, (np.ndarray, torch.Tensor)):
             data_items = [elem for elem in data]
@@ -495,8 +522,7 @@ def _get_subparsers(self) -> Mapping[str, ModalityDataParser]:
             "video": self._parse_video_data,
         }
 
-    def parse_mm_data(self,
-                      mm_data: MultiModalDataDict) -> MultiModalDataItems:
+    def parse_mm_data(self, mm_data: MultiModalDataDict) -> MultiModalDataItems:
         subparsers = self._get_subparsers()
 
         mm_items = MultiModalDataItems()
diff --git a/vllm/multimodal/processing.py b/vllm/multimodal/processing.py
index 21fa467b3331..5c3739e29d10 100644
--- a/vllm/multimodal/processing.py
+++ b/vllm/multimodal/processing.py
@@ -3,13 +3,21 @@
 import time
 from abc import ABC, abstractmethod
 from collections import defaultdict
-from collections.abc import (Callable, Generator, ItemsView, Iterable, Mapping,
-                             Sequence)
+from collections.abc import Callable, Generator, ItemsView, Iterable, Mapping, Sequence
 from dataclasses import dataclass, field, replace
 from enum import Enum
 from functools import lru_cache
-from typing import (TYPE_CHECKING, Any, Generic, NamedTuple, Optional,
-                    Protocol, Union, cast, overload)
+from typing import (
+    TYPE_CHECKING,
+    Any,
+    Generic,
+    NamedTuple,
+    Optional,
+    Protocol,
+    Union,
+    cast,
+    overload,
+)
 
 import regex as re
 import torch
@@ -17,20 +25,28 @@
 
 from vllm.logger import init_logger
 from vllm.transformers_utils.processor import cached_processor_from_config
-from vllm.transformers_utils.tokenizer import (AnyTokenizer, decode_tokens,
-                                               encode_tokens)
-from vllm.utils import (flatten_2d_lists, full_groupby,
-                        get_allowed_kwarg_only_overrides)
+from vllm.transformers_utils.tokenizer import AnyTokenizer, decode_tokens, encode_tokens
+from vllm.utils import flatten_2d_lists, full_groupby, get_allowed_kwarg_only_overrides
 from vllm.utils.jsontree import JSONTree, json_map_leaves
 
 from .hasher import MultiModalHasher
-from .inputs import (MultiModalDataDict, MultiModalEncDecInputs,
-                     MultiModalFieldConfig, MultiModalInputs,
-                     MultiModalKwargsItem, MultiModalKwargsItems,
-                     MultiModalKwargsOptionalItems, MultiModalUUIDDict,
-                     PlaceholderRange)
-from .parse import (DictEmbeddingItems, EmbeddingItems, MultiModalDataItems,
-                    MultiModalDataParser)
+from .inputs import (
+    MultiModalDataDict,
+    MultiModalEncDecInputs,
+    MultiModalFieldConfig,
+    MultiModalInputs,
+    MultiModalKwargsItem,
+    MultiModalKwargsItems,
+    MultiModalKwargsOptionalItems,
+    MultiModalUUIDDict,
+    PlaceholderRange,
+)
+from .parse import (
+    DictEmbeddingItems,
+    EmbeddingItems,
+    MultiModalDataItems,
+    MultiModalDataParser,
+)
 
 if TYPE_CHECKING:
     from transformers.configuration_utils import PretrainedConfig
@@ -57,9 +73,7 @@ def _cached_encode(
     *,
     add_special_tokens: Optional[bool] = None,
 ) -> list[int]:
-    return encode_tokens(tokenizer,
-                         text,
-                         add_special_tokens=add_special_tokens)
+    return encode_tokens(tokenizer, text, add_special_tokens=add_special_tokens)
 
 
 @lru_cache(maxsize=2048)
@@ -69,9 +83,9 @@ def _cached_decode(
     *,
     skip_special_tokens: Optional[bool] = None,
 ) -> str:
-    return decode_tokens(tokenizer,
-                         list(token_ids),
-                         skip_special_tokens=skip_special_tokens)
+    return decode_tokens(
+        tokenizer, list(token_ids), skip_special_tokens=skip_special_tokens
+    )
 
 
 def _seq2text(tokenizer: AnyTokenizer, seq: PromptSeq) -> str:
@@ -89,24 +103,22 @@ def _seq2tokens(tokenizer: AnyTokenizer, seq: PromptSeq) -> list[int]:
 
 
 class _GetMatchIndex(Protocol):
-
     def __call__(
         self,
         tokenizer: AnyTokenizer,
         prompt: PromptSeq,
         start_idx: int = 0,
-    ) -> Optional[int]:
-        ...
+    ) -> Optional[int]: ...
 
 
 @dataclass
 class PromptIndex:
     """Resolves to an index in the prompt."""
+
     get_match_index: _GetMatchIndex
 
 
 class PromptIndexTargets:
-
     @staticmethod
     def start() -> PromptIndex:
         """
@@ -139,9 +151,7 @@ def get_match_index(
             else:
                 if isinstance(prefix, str):
                     # Make both `list[int]`
-                    prefix = encode_tokens(tokenizer,
-                                           prefix,
-                                           add_special_tokens=False)
+                    prefix = encode_tokens(tokenizer, prefix, add_special_tokens=False)
 
             match_idx = len(prefix)
             return match_idx if prompt[:match_idx] == prefix else None
@@ -181,8 +191,7 @@ class PromptUpdateDetails(Generic[_S]):
     full: _S
     """The full content."""
 
-    is_embed: Optional[Callable[[AnyTokenizer, PromptSeq],
-                                torch.Tensor]] = None
+    is_embed: Optional[Callable[[AnyTokenizer, PromptSeq], torch.Tensor]] = None
     """
     Given [`full`][vllm.multimodal.processing.PromptUpdateDetails.full],
     return a boolean mask of shape `(len(full),)` indicating which positions
@@ -203,7 +212,6 @@ def select_text(
         seq: _S,
         embed_text: str,
     ) -> "PromptUpdateDetails[_S]":
-
         def is_embed(tokenizer: AnyTokenizer, full: PromptSeq) -> torch.Tensor:
             embed_token_ids = encode_tokens(tokenizer, embed_text)
             token_ids = _seq2tokens(tokenizer, full)
@@ -220,7 +228,6 @@ def select_token_id(
         seq: _S,
         embed_token_id: int,
     ) -> "PromptUpdateDetails[_S]":
-
         def is_embed(tokenizer: AnyTokenizer, full: PromptSeq) -> torch.Tensor:
             token_ids = _seq2tokens(tokenizer, full)
 
@@ -238,8 +245,7 @@ def is_embed(tokenizer: AnyTokenizer, full: PromptSeq) -> torch.Tensor:
 specify which part.
 """
 
-PromptUpdateContent = Union[Callable[[int], PromptUpdateInfo],
-                            PromptUpdateInfo]
+PromptUpdateContent = Union[Callable[[int], PromptUpdateInfo], PromptUpdateInfo]
 """
 Given the index of the processed item within
 [`modality`][vllm.multimodal.processing.PromptUpdate.modality],
@@ -408,11 +414,13 @@ class PromptReplacement(PromptUpdate):
         modality="image",
         target="<image>",
         replacement=PromptUpdateDetails(
-            full="".join([
-                "<image_bos>",
-                "<image>" * image_feature_size,
-                "<image_eos>",
-            ]),
+            full="".join(
+                [
+                    "<image_bos>",
+                    "<image>" * image_feature_size,
+                    "<image_eos>",
+                ]
+            ),
             features="<image>" * image_feature_size,
         ),
     )
@@ -426,8 +434,9 @@ class PromptReplacement(PromptUpdate):
         modality="image",
         target=[image_token_id],
         replacement=PromptUpdateDetails(
-            full=([image_bos_id] + [image_token_id] * image_feature_size
-                    + [image_eos_id]),
+            full=(
+                [image_bos_id] + [image_token_id] * image_feature_size + [image_eos_id]
+            ),
             features=[image_token_id] * image_feature_size,
         ),
     )
@@ -459,10 +468,8 @@ class _HasModalityAttr(Protocol):
 
 
 class _HasModalityProp(Protocol):
-
     @property
-    def modality(self) -> str:
-        ...
+    def modality(self) -> str: ...
 
 
 _M = TypeVar("_M", bound=Union[_HasModalityAttr, _HasModalityProp])
@@ -520,9 +527,7 @@ def iter_token_matches(
 
         target_token_ids = _seq2tokens(tokenizer, target)
 
-        for match in iter_token_matches(prompt,
-                                        target_token_ids,
-                                        start_idx=start_idx):
+        for match in iter_token_matches(prompt, target_token_ids, start_idx=start_idx):
             yield PromptTargetMatch(match.start_idx, match.end_idx)
 
     def iter_text_matches(
@@ -544,8 +549,7 @@ def iter_text_matches(
 
         target_text = _seq2text(tokenizer, target)
 
-        for match in re.finditer(re.escape(target_text), prompt,
-                                 pos=start_idx):
+        for match in re.finditer(re.escape(target_text), prompt, pos=start_idx):
             yield PromptTargetMatch(match.start(), match.end())
 
     def iter_matches(
@@ -557,9 +561,7 @@ def iter_matches(
     ) -> Generator[PromptTargetMatch]:
         """Yield each instance of `self.target` found in `prompt`."""
         if isinstance(prompt, str):
-            return self.iter_text_matches(prompt,
-                                          tokenizer,
-                                          start_idx=start_idx)
+            return self.iter_text_matches(prompt, tokenizer, start_idx=start_idx)
 
         return self.iter_token_matches(prompt, tokenizer, start_idx=start_idx)
 
@@ -680,9 +682,9 @@ def _find_matches(
                     break  # Already found a match for this item
 
                 for match in update.iter_matches(
-                        prompt,
-                        tokenizer,
-                        start_idx=prev_end_idx,
+                    prompt,
+                    tokenizer,
+                    start_idx=prev_end_idx,
                 ):
                     # All matches should share the same mode
                     if mode is None:
@@ -723,8 +725,7 @@ def _apply_matches(
 
     out_seqs = list[Union[str, list[int]]]()
     out_result: MultiModalPromptUpdatesApplyResult = {
-        m: [None] * len(items)
-        for m, items in mm_prompt_updates.items()
+        m: [None] * len(items) for m, items in mm_prompt_updates.items()
     }
 
     start_idx = prev_end_idx = 0
@@ -743,8 +744,7 @@ def _apply_matches(
             for (modality, item_idx), (match, update_idx) in matches_to_apply:
                 found = True
 
-                matched_update = mm_prompt_updates[modality][item_idx][
-                    update_idx]
+                matched_update = mm_prompt_updates[modality][item_idx][update_idx]
                 matched_content = matched_update.content.full
 
                 if mode == UpdateMode.INSERT:
@@ -756,9 +756,10 @@ def _apply_matches(
 
                 out_seqs.append(prompt[prev_end_idx:end_idx_to_insert])
                 out_seqs.append(
-                    _seq2text(tokenizer, matched_content
-                              ) if isinstance(prompt, str) else _seq2tokens(
-                                  tokenizer, matched_content))
+                    _seq2text(tokenizer, matched_content)
+                    if isinstance(prompt, str)
+                    else _seq2tokens(tokenizer, matched_content)
+                )
                 out_result[modality][item_idx] = update_idx
 
                 # Exclude overlapping matches
@@ -784,8 +785,7 @@ def apply_token_matches(
     the same placeholder tokens. In that case, the modality that
     appears earlier in `mm_prompt_updates` takes priority.
     """
-    token_id_seqs, result = _apply_matches(prompt, mm_prompt_updates,
-                                           tokenizer)
+    token_id_seqs, result = _apply_matches(prompt, mm_prompt_updates, tokenizer)
 
     return flatten_2d_lists(token_id_seqs), result
 
@@ -847,8 +847,7 @@ def _iter_placeholders(
                 if prompt[start_idx:end_idx_full] == content_tokens_full:
                     content_is_embed = content.is_embed
                     if content_is_embed is not None:
-                        content_is_embed = content_is_embed(
-                            tokenizer, content.full)
+                        content_is_embed = content_is_embed(tokenizer, content.full)
 
                     yield PlaceholderFeaturesInfo(
                         modality=modality,
@@ -899,16 +898,14 @@ class InputProcessingContext:
     """The tokenizer used to tokenize the inputs."""
 
     @overload
-    def get_hf_config(self, /) -> "PretrainedConfig":
-        ...
+    def get_hf_config(self, /) -> "PretrainedConfig": ...
 
     @overload
     def get_hf_config(
         self,
         typ: Union[type[_C], tuple[type[_C], ...]],
         /,
-    ) -> _C:
-        ...
+    ) -> _C: ...
 
     def get_hf_config(
         self,
@@ -930,9 +927,11 @@ def get_hf_config(
 
         hf_config = self.model_config.hf_config
         if not isinstance(hf_config, typ):
-            raise TypeError("Invalid type of HuggingFace config. "
-                            f"Expected type: {typ}, but "
-                            f"found type: {type(hf_config)}")
+            raise TypeError(
+                "Invalid type of HuggingFace config. "
+                f"Expected type: {typ}, but "
+                f"found type: {type(hf_config)}"
+            )
 
         return hf_config
 
@@ -956,8 +955,7 @@ def get_mm_config(self):
         return mm_config
 
     @overload
-    def get_hf_processor(self, /, **kwargs: object) -> "ProcessorMixin":
-        ...
+    def get_hf_processor(self, /, **kwargs: object) -> "ProcessorMixin": ...
 
     @overload
     def get_hf_processor(
@@ -965,8 +963,7 @@ def get_hf_processor(
         typ: Union[type[_P], tuple[type[_P], ...]],
         /,
         **kwargs: object,
-    ) -> _P:
-        ...
+    ) -> _P: ...
 
     def get_hf_processor(
         self,
@@ -1017,7 +1014,6 @@ def _postprocess_output(
         self,
         output: JSONTree,
     ) -> JSONTree:
-
         def _postprocess_one(x: object):
             if isinstance(x, torch.Tensor):  # noqa: SIM102
                 # This mimics the behavior of transformers.BatchFeature
@@ -1054,17 +1050,21 @@ def call_hf_processor(
         )
 
         try:
-            output = hf_processor(**data,
-                                  **allowed_kwargs,
-                                  return_tensors="pt")
+            output = hf_processor(**data, **allowed_kwargs, return_tensors="pt")
         except Exception as exc:
             # See https://github.com/huggingface/tokenizers/issues/537
-            if (isinstance(exc, RuntimeError) and exc
-                    and exc.args[0] == "Already borrowed"
-                    and num_tries < max_tries):
+            if (
+                isinstance(exc, RuntimeError)
+                and exc
+                and exc.args[0] == "Already borrowed"
+                and num_tries < max_tries
+            ):
                 logger.warning(
                     "Failed to acquire tokenizer in current thread. "
-                    "Retrying (%d/%d)...", num_tries, max_tries)
+                    "Retrying (%d/%d)...",
+                    num_tries,
+                    max_tries,
+                )
                 time.sleep(0.5)
                 return self.call_hf_processor(
                     hf_processor,
@@ -1074,8 +1074,10 @@ def call_hf_processor(
                     max_tries=max_tries,
                 )
 
-            msg = (f"Failed to apply {type(hf_processor).__name__} "
-                   f"on data={data} with kwargs={allowed_kwargs}")
+            msg = (
+                f"Failed to apply {type(hf_processor).__name__} "
+                f"on data={data} with kwargs={allowed_kwargs}"
+            )
 
             raise ValueError(msg) from exc
 
@@ -1142,8 +1144,11 @@ def get_allowed_mm_limits(self) -> Mapping[str, int]:
         for modality, supported_limit in supported_mm_limits.items():
             user_limit = mm_config.get_limit_per_prompt(modality)
 
-            allowed_limits[modality] = (user_limit if supported_limit is None
-                                        else min(user_limit, supported_limit))
+            allowed_limits[modality] = (
+                user_limit
+                if supported_limit is None
+                else min(user_limit, supported_limit)
+            )
 
         return allowed_limits
 
@@ -1154,7 +1159,7 @@ def get_mm_max_tokens_per_item(
     ) -> Optional[Mapping[str, int]]:
         """
         Return the maximum number of tokens per item of for each modality.
-        
+
         When `None` (the default) is returned, vLLM will generate dummy inputs
         (images/videos) at maximum possible sizes and process them to determine
         the maximum token count per modality.
@@ -1165,7 +1170,7 @@ def get_mm_max_tokens_per_item(
         counts, avoiding the need for dummy input generation and processing.
 
         Note:
-            The maximum number of tokens per item of each modality returned 
+            The maximum number of tokens per item of each modality returned
             from this function should respect the model's maximum sequence
             length and the maximum number of items of each modality allowed,
             and agree with dummy inputs (images/videos) at maximum possible
@@ -1245,10 +1250,7 @@ def __call__(
         *,
         mm_uuids: Optional[MultiModalUUIDDict] = None,
     ) -> MultiModalInputs:
-        return self.apply(prompt,
-                          mm_data,
-                          hf_processor_mm_kwargs,
-                          mm_uuids=mm_uuids)
+        return self.apply(prompt, mm_data, hf_processor_mm_kwargs, mm_uuids=mm_uuids)
 
     def _get_data_parser(self) -> MultiModalDataParser:
         """
@@ -1276,8 +1278,7 @@ def validate_num_items(
         limit = min(supported_limit, allowed_limit)
 
         if num_items > limit:
-            msg = (f"At most {limit} {modality}(s) may be provided in "
-                   "one prompt.")
+            msg = f"At most {limit} {modality}(s) may be provided in one prompt."
 
             if num_items <= supported_limit:
                 msg += " Set `--limit-mm-per-prompt` to increase this limit."
@@ -1339,8 +1340,10 @@ def _bind_and_group_updates(
         mm_item_counts: Mapping[str, int],
     ) -> MultiModalPromptUpdates:
         return {
-            modality: [[update.resolve(item_idx) for update in updates]
-                       for item_idx in range(mm_item_counts.get(modality, 0))]
+            modality: [
+                [update.resolve(item_idx) for update in updates]
+                for item_idx in range(mm_item_counts.get(modality, 0))
+            ]
             for modality, updates in full_groupby_modality(prompt_updates)
         }
 
@@ -1385,8 +1388,7 @@ def _find_mm_placeholders(
     ) -> Mapping[str, list[PlaceholderFeaturesInfo]]:
         tokenizer = self.info.get_tokenizer()
 
-        return find_mm_placeholders(new_token_ids, mm_prompt_updates,
-                                    tokenizer)
+        return find_mm_placeholders(new_token_ids, mm_prompt_updates, tokenizer)
 
     def _get_hf_mm_data(
         self,
@@ -1436,7 +1438,8 @@ def _hf_processor_applies_updates(
         """
         return not any(
             isinstance(items, (EmbeddingItems, DictEmbeddingItems))
-            for items in mm_items.values())
+            for items in mm_items.values()
+        )
 
     def _apply_hf_processor_text_mm(
         self,
@@ -1461,7 +1464,7 @@ def _apply_hf_processor_text_mm(
         )
         processed_data.update(passthrough_data)
 
-        prompt_ids, = processed_data.pop("input_ids").tolist()
+        (prompt_ids,) = processed_data.pop("input_ids").tolist()
 
         is_update_applied = self._hf_processor_applies_updates(
             prompt_text=prompt_text,
@@ -1564,8 +1567,7 @@ def _apply_hf_processor_main(
                     tokenization_kwargs=tokenization_kwargs,
                 )
 
-            prompt_ids = self._apply_hf_processor_text_only(
-                prompt, tokenization_kwargs)
+            prompt_ids = self._apply_hf_processor_text_only(prompt, tokenization_kwargs)
         else:
             prompt_ids = self._apply_hf_processor_tokens_only(prompt)
 
@@ -1611,10 +1613,11 @@ def _hash_mm_items(
                     # hash if `hf_processor_mm_kwargs` or `tokenization_kwargs`
                     # are provided. This is because the processed multimodal
                     # inputs can be different depending on the processor kwargs.
-                    if item_uuid is None or \
-                        hf_processor_mm_kwargs or \
-                        tokenization_kwargs:
-
+                    if (
+                        item_uuid is None
+                        or hf_processor_mm_kwargs
+                        or tokenization_kwargs
+                    ):
                         # NOTE: use provided hash string to hash with kwargs
                         # if available for better performance.
                         item = item_uuid if item_uuid is not None else item
@@ -1623,16 +1626,20 @@ def _hash_mm_items(
                                 model_id=model_id,
                                 **{modality: item},
                                 **hf_processor_mm_kwargs,
-                                **tokenization_kwargs))
+                                **tokenization_kwargs,
+                            )
+                        )
                     else:
                         computed.append(item_uuid)
                 hashes[modality] = computed
             else:
                 hashes[modality] = [
-                    MultiModalHasher.hash_kwargs(model_id=model_id,
-                                                 **{modality: item},
-                                                 **hf_processor_mm_kwargs,
-                                                 **tokenization_kwargs)
+                    MultiModalHasher.hash_kwargs(
+                        model_id=model_id,
+                        **{modality: item},
+                        **hf_processor_mm_kwargs,
+                        **tokenization_kwargs,
+                    )
                     for item in items
                 ]
 
@@ -1645,13 +1652,13 @@ def _get_cache_missing_items(
         mm_hashes: MultiModalHashes,
     ) -> MultiModalDataItems:
         mm_is_cached = {
-            modality: cache.is_cached(hashes)
-            for modality, hashes in mm_hashes.items()
+            modality: cache.is_cached(hashes) for modality, hashes in mm_hashes.items()
         }
 
         mm_missing_idxs = {
             modality: [
-                idx for idx, item_is_cached in enumerate(items_is_cached)
+                idx
+                for idx, item_is_cached in enumerate(items_is_cached)
                 if not item_is_cached
             ]
             for modality, items_is_cached in mm_is_cached.items()
@@ -1664,7 +1671,8 @@ def _get_cache_missing_items(
                 if data is None:
                     raise ValueError(
                         f"Cache miss for {modality} at index {idx} "
-                        f"but data is not provided.")
+                        f"but data is not provided."
+                    )
                 else:
                     missing_modality_data.append(data)
             mm_missing_data[modality] = missing_modality_data
@@ -1692,20 +1700,18 @@ def _merge_mm_kwargs(
         # Need to calculate this at the beginning to avoid skipping cache logic
         # for subsequently repeated items in the same modality
         mm_is_cached = {
-            modality: cache.is_cached(hashes)
-            for modality, hashes in mm_hashes.items()
+            modality: cache.is_cached(hashes) for modality, hashes in mm_hashes.items()
         }
 
         mm_missing_next_idx = defaultdict[str, int](lambda: 0)
 
-        merged_kwargs = defaultdict[str,
-                                    list[Optional[MultiModalKwargsItem]]](list)
-        merged_prompt_updates = defaultdict[
-            str, list[Sequence[ResolvedPromptUpdate]]](list)
+        merged_kwargs = defaultdict[str, list[Optional[MultiModalKwargsItem]]](list)
+        merged_prompt_updates = defaultdict[str, list[Sequence[ResolvedPromptUpdate]]](
+            list
+        )
         for modality, hashes in mm_hashes.items():
             missing_kwargs = mm_missing_kwargs.get(modality, [])
-            missing_prompt_updates = mm_missing_prompt_updates.get(
-                modality, [])
+            missing_prompt_updates = mm_missing_prompt_updates.get(modality, [])
 
             for item_idx, item_hash in enumerate(hashes):
                 kwargs: Optional[MultiModalKwargsItem]
@@ -1723,10 +1729,12 @@ def _merge_mm_kwargs(
                 kwargs, updates = cache.get_and_update_item(item, item_hash)
 
                 merged_kwargs[modality].append(kwargs)
-                merged_prompt_updates[modality].append([
-                    self._recompute_cached_prompt_update(update, item_idx)
-                    for update in updates
-                ])
+                merged_prompt_updates[modality].append(
+                    [
+                        self._recompute_cached_prompt_update(update, item_idx)
+                        for update in updates
+                    ]
+                )
 
         mm_kwargs = MultiModalKwargsItems(merged_kwargs)
         mm_prompt_updates = dict(merged_prompt_updates)
@@ -1756,15 +1764,16 @@ def _apply_hf_processor(
 
         mm_kwargs = MultiModalKwargsItems.from_hf_inputs(
             mm_processed_data,
-            self._get_mm_fields_config(mm_processed_data,
-                                       hf_processor_mm_kwargs),
+            self._get_mm_fields_config(mm_processed_data, hf_processor_mm_kwargs),
         )
 
         # Use overrides if provided; fallback to data-dependent hashing.
-        mm_hashes = self._hash_mm_items(mm_data_items,
-                                        hf_processor_mm_kwargs,
-                                        tokenization_kwargs,
-                                        mm_uuids=mm_uuids)
+        mm_hashes = self._hash_mm_items(
+            mm_data_items,
+            hf_processor_mm_kwargs,
+            tokenization_kwargs,
+            mm_uuids=mm_uuids,
+        )
 
         mm_prompt_updates = self._get_mm_prompt_updates(
             mm_data_items,
@@ -1805,10 +1814,12 @@ def _cached_apply_hf_processor(
                 mm_uuids=mm_uuids,
             )
 
-        mm_hashes = self._hash_mm_items(mm_data_items,
-                                        hf_processor_mm_kwargs,
-                                        tokenization_kwargs,
-                                        mm_uuids=mm_uuids)
+        mm_hashes = self._hash_mm_items(
+            mm_data_items,
+            hf_processor_mm_kwargs,
+            tokenization_kwargs,
+            mm_uuids=mm_uuids,
+        )
 
         mm_missing_data_items = self._get_cache_missing_items(
             cache=cache,
@@ -1833,8 +1844,9 @@ def _cached_apply_hf_processor(
 
         mm_missing_kwargs = MultiModalKwargsItems.from_hf_inputs(
             mm_missing_processed_data,
-            self._get_mm_fields_config(mm_missing_processed_data,
-                                       hf_processor_mm_kwargs),
+            self._get_mm_fields_config(
+                mm_missing_processed_data, hf_processor_mm_kwargs
+            ),
         )
 
         mm_missing_prompt_updates = self._get_mm_prompt_updates(
@@ -1897,8 +1909,9 @@ def _apply_prompt_updates(
         # of the search text in the prompt, we instead perform string-based
         # updates on the decoded token IDs, then encode them back.
         if not all(
-                all(update_idx is not None for update_idx in update_idxs)
-                for update_idxs in match_result.values()):
+            all(update_idx is not None for update_idx in update_idxs)
+            for update_idxs in match_result.values()
+        ):
             new_text, match_result = self._apply_text_matches(
                 decode_tokens(tokenizer, token_ids),
                 mm_prompt_updates,
@@ -1910,16 +1923,17 @@ def _apply_prompt_updates(
                 add_special_tokens=False,
             )
 
-        matched_updates = defaultdict[
-            str, list[Sequence[ResolvedPromptUpdate]]](list)
+        matched_updates = defaultdict[str, list[Sequence[ResolvedPromptUpdate]]](list)
         for modality, update_idxs in match_result.items():
             for item_idx, update_idx in enumerate(update_idxs):
                 assert update_idx is not None, (
                     "Failed to apply prompt replacement for "
-                    f"mm_items[{modality!r}][{item_idx}]")
+                    f"mm_items[{modality!r}][{item_idx}]"
+                )
 
                 matched_updates[modality].append(
-                    [mm_prompt_updates[modality][item_idx][update_idx]])
+                    [mm_prompt_updates[modality][item_idx][update_idx]]
+                )
 
         placeholders = self._find_mm_placeholders(
             new_token_ids,
@@ -1944,7 +1958,8 @@ def _validate_mm_kwargs(
                     "There is likely a problem with your "
                     "implementation of merged multi-modal processor for this "
                     "model (usually arising from an inconsistency between "
-                    "`_call_hf_processor` and `_get_mm_fields_config`).")
+                    "`_call_hf_processor` and `_get_mm_fields_config`)."
+                )
 
     def _validate_mm_updates(
         self,
@@ -1962,7 +1977,8 @@ def _validate_mm_updates(
                     "This is likely because you forgot to include input "
                     "placeholder tokens (e.g., `<image>`, `<|image_pad|>`) "
                     "in the prompt. If the model has a chat template, make "
-                    "sure you have applied it before calling `LLM.generate`.")
+                    "sure you have applied it before calling `LLM.generate`."
+                )
 
     def _validate_mm_placeholders(
         self,
@@ -1978,7 +1994,8 @@ def _validate_mm_placeholders(
                     f"corresponding to {item_count} {modality} items, but "
                     f"instead found {len(placeholders)} prompt placeholders! "
                     "Make sure the implementation of `_call_hf_processor` and "
-                    "`_get_mm_fields_config` are consistent with each other.")
+                    "`_get_mm_fields_config` are consistent with each other."
+                )
 
     def _maybe_apply_prompt_updates(
         self,
@@ -2070,7 +2087,6 @@ def apply(
 
 
 class EncDecMultiModalProcessor(BaseMultiModalProcessor[_I]):
-
     @abstractmethod
     def create_encoder_prompt(
         self,
@@ -2104,15 +2120,16 @@ def _get_enc_dec_inputs(
         tokenizer = self.info.get_tokenizer()
         decoder_prompt_raw = self.create_decoder_prompt(prompt, mm_data)
         if isinstance(decoder_prompt_raw, str):
-            decoder_prompt_ids = encode_tokens(tokenizer,
-                                               decoder_prompt_raw,
-                                               add_special_tokens=False)
+            decoder_prompt_ids = encode_tokens(
+                tokenizer, decoder_prompt_raw, add_special_tokens=False
+            )
         else:
             decoder_prompt_ids = decoder_prompt_raw
 
         mm_inputs = MultiModalEncDecInputs(
             encoder_prompt_token_ids=encoder_inputs["prompt_token_ids"],
-            **encoder_inputs)
+            **encoder_inputs,
+        )
         mm_inputs["prompt_token_ids"] = decoder_prompt_ids
         return mm_inputs
 
diff --git a/vllm/multimodal/profiling.py b/vllm/multimodal/profiling.py
index 74dc2314d2eb..05ba5a2abdd4 100644
--- a/vllm/multimodal/profiling.py
+++ b/vllm/multimodal/profiling.py
@@ -10,15 +10,26 @@
 from PIL import Image
 
 import vllm.envs as envs
-from vllm.config.multimodal import (AudioDummyOptions, BaseDummyOptions,
-                                    ImageDummyOptions, VideoDummyOptions)
+from vllm.config.multimodal import (
+    AudioDummyOptions,
+    BaseDummyOptions,
+    ImageDummyOptions,
+    VideoDummyOptions,
+)
 from vllm.logger import init_logger
 
-from .inputs import (MultiModalDataDict, MultiModalEncDecInputs,
-                     MultiModalInputs, MultiModalKwargsItems,
-                     MultiModalPlaceholderDict)
-from .processing import (BaseMultiModalProcessor, BaseProcessingInfo,
-                         EncDecMultiModalProcessor)
+from .inputs import (
+    MultiModalDataDict,
+    MultiModalEncDecInputs,
+    MultiModalInputs,
+    MultiModalKwargsItems,
+    MultiModalPlaceholderDict,
+)
+from .processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    EncDecMultiModalProcessor,
+)
 
 logger = init_logger(__name__)
 
@@ -29,6 +40,7 @@ class ProcessorInputs:
     Represents the keyword arguments to
     [`vllm.multimodal.processing.BaseMultiModalProcessor.apply`][].
     """
+
     prompt: Union[str, list[int]]
     mm_data: MultiModalDataDict
     hf_processor_mm_kwargs: Mapping[str, object] = field(default_factory=dict)
@@ -86,7 +98,7 @@ def get_dummy_mm_data(
             mm_counts: Count of items per modality
             mm_options: Configurable options per modality (optional).
                        If None, use model defaults for backward compatibility.
-                       If provided, models can use these to customize dummy 
+                       If provided, models can use these to customize dummy
                        data generation.
         """
         raise NotImplementedError
@@ -113,9 +125,11 @@ def get_dummy_processor_inputs(
 
         tokenization_kwargs = {"truncation": False}
 
-        return ProcessorInputs(prompt=dummy_text,
-                               mm_data=dummy_mm_data,
-                               tokenization_kwargs=tokenization_kwargs)
+        return ProcessorInputs(
+            prompt=dummy_text,
+            mm_data=dummy_mm_data,
+            tokenization_kwargs=tokenization_kwargs,
+        )
 
     def _get_dummy_audios(
         self,
@@ -130,10 +144,12 @@ def _get_dummy_audios(
             if overrides.length > length:
                 logger.warning(
                     "audio.length override (%d) exceeds model's "
-                    "maximum length (%d), will be ignored", overrides.length,
-                    length)
+                    "maximum length (%d), will be ignored",
+                    overrides.length,
+                    length,
+                )
             length = min(length, overrides.length)
-        audio = np.zeros((length, ))
+        audio = np.zeros((length,))
         return [audio] * num_audios
 
     def _get_dummy_images(
@@ -151,15 +167,19 @@ def _get_dummy_images(
                 if overrides.width > width:
                     logger.warning(
                         "image.width override (%d) exceeds model's "
-                        "maximum width (%d), will be ignored", overrides.width,
-                        width)
+                        "maximum width (%d), will be ignored",
+                        overrides.width,
+                        width,
+                    )
                 width = min(width, overrides.width)
             if overrides.height:
                 if overrides.height > height:
                     logger.warning(
                         "image.height override (%d) exceeds model's "
                         "maximum height (%d), will be ignored",
-                        overrides.height, height)
+                        overrides.height,
+                        height,
+                    )
                 height = min(height, overrides.height)
         image = Image.new("RGB", (width, height), color=255)
         return [image] * num_images
@@ -181,21 +201,27 @@ def _get_dummy_videos(
                     logger.warning(
                         "video.num_frames override (%d) exceeds model's "
                         "maximum number of frames (%d), will be ignored",
-                        overrides.num_frames, num_frames)
+                        overrides.num_frames,
+                        num_frames,
+                    )
                 num_frames = min(num_frames, overrides.num_frames)
             if overrides.width:
                 if overrides.width > width:
                     logger.warning(
                         "video.width override (%d) exceeds model's "
-                        "maximum width (%d), will be ignored", overrides.width,
-                        width)
+                        "maximum width (%d), will be ignored",
+                        overrides.width,
+                        width,
+                    )
                 width = min(width, overrides.width)
             if overrides.height:
                 if overrides.height > height:
                     logger.warning(
                         "video.height override (%d) exceeds model's "
                         "maximum height (%d), will be ignored",
-                        overrides.height, height)
+                        overrides.height,
+                        height,
+                    )
                 height = min(height, overrides.height)
         video = np.full((num_frames, width, height, 3), 255)
         return [video] * num_videos
@@ -236,7 +262,8 @@ def _get_dummy_mm_inputs(
 
         factory = self.dummy_inputs
         processor_inputs = factory.get_dummy_processor_inputs(
-            seq_len, mm_counts, mm_options)
+            seq_len, mm_counts, mm_options
+        )
 
         return self.processor.apply(
             prompt=processor_inputs.prompt,
@@ -253,9 +280,10 @@ def _get_mm_num_tokens(
         placeholders_by_modality = mm_inputs["mm_placeholders"]
 
         return {
-            modality:
-            sum(item.get_num_embeds() if mm_embeddings_only else item.length
-                for item in placeholders)
+            modality: sum(
+                item.get_num_embeds() if mm_embeddings_only else item.length
+                for item in placeholders
+            )
             for modality, placeholders in placeholders_by_modality.items()
         }
 
@@ -330,8 +358,7 @@ def _get_mm_max_tokens(
             return max_tokens_per_item
 
         mm_inputs = self._get_dummy_mm_inputs(seq_len, mm_counts)
-        return self._get_mm_num_tokens(mm_inputs,
-                                       mm_embeddings_only=mm_embeddings_only)
+        return self._get_mm_num_tokens(mm_inputs, mm_embeddings_only=mm_embeddings_only)
 
     def get_mm_max_contiguous_tokens(
         self,
@@ -349,6 +376,4 @@ def get_mm_max_contiguous_tokens(
         initializing the encoder cache size.
         """
 
-        return self._get_mm_max_tokens(seq_len,
-                                       mm_counts,
-                                       mm_embeddings_only=False)
+        return self._get_mm_max_tokens(seq_len, mm_counts, mm_embeddings_only=False)
diff --git a/vllm/multimodal/registry.py b/vllm/multimodal/registry.py
index 24d3baa9b4e7..a526eaff715a 100644
--- a/vllm/multimodal/registry.py
+++ b/vllm/multimodal/registry.py
@@ -8,15 +8,21 @@
 
 from vllm.config.multimodal import BaseDummyOptions
 from vllm.logger import init_logger
-from vllm.transformers_utils.tokenizer import (AnyTokenizer,
-                                               cached_tokenizer_from_config)
+from vllm.transformers_utils.tokenizer import AnyTokenizer, cached_tokenizer_from_config
 from vllm.utils import ClassRegistry
 
 from .cache import BaseMultiModalProcessorCache
-from .processing import (BaseMultiModalProcessor, BaseProcessingInfo,
-                         InputProcessingContext)
-from .profiling import (BaseDummyInputsBuilder, DummyDecoderData,
-                        DummyEncoderData, MultiModalProfiler)
+from .processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    InputProcessingContext,
+)
+from .profiling import (
+    BaseDummyInputsBuilder,
+    DummyDecoderData,
+    DummyEncoderData,
+    MultiModalProfiler,
+)
 
 if TYPE_CHECKING:
     from vllm.config import ModelConfig
@@ -38,8 +44,7 @@ class ProcessingInfoFactory(Protocol[_I_co]):
     def __call__(
         self,
         ctx: InputProcessingContext,
-    ) -> _I_co:
-        ...
+    ) -> _I_co: ...
 
 
 class DummyInputsBuilderFactory(Protocol[_I]):  # type: ignore[misc]
@@ -49,8 +54,7 @@ class DummyInputsBuilderFactory(Protocol[_I]):  # type: ignore[misc]
     instance from the context.
     """
 
-    def __call__(self, info: _I) -> BaseDummyInputsBuilder[_I]:
-        ...
+    def __call__(self, info: _I) -> BaseDummyInputsBuilder[_I]: ...
 
 
 class MultiModalProcessorFactory(Protocol[_I]):  # type: ignore[misc]
@@ -66,8 +70,7 @@ def __call__(
         dummy_inputs: BaseDummyInputsBuilder[_I],
         *,
         cache: Optional[BaseMultiModalProcessorCache] = None,
-    ) -> BaseMultiModalProcessor[_I]:
-        ...
+    ) -> BaseMultiModalProcessor[_I]: ...
 
 
 @dataclass(frozen=True)
@@ -93,8 +96,7 @@ class MultiModalRegistry:
     """
 
     def __init__(self) -> None:
-        self._processor_factories = ClassRegistry[nn.Module,
-                                                  _ProcessorFactories]()
+        self._processor_factories = ClassRegistry[nn.Module, _ProcessorFactories]()
 
     def _extract_mm_options(
         self,
@@ -112,8 +114,7 @@ def _extract_mm_options(
         mm_options = {
             m: opt
             for m in model_config.multimodal_config.limit_per_prompt
-            if (opt := model_config.multimodal_config.get_dummy_options(m)
-                ) is not None
+            if (opt := model_config.multimodal_config.get_dummy_options(m)) is not None
         }
 
         return mm_options if len(mm_options) > 0 else None
@@ -121,8 +122,8 @@ def _extract_mm_options(
     def supports_multimodal_inputs(self, model_config: "ModelConfig") -> bool:
         """
         Checks if the model supports multimodal inputs.
-        Returns True if the model is multimodal with any non-zero supported 
-        modalities, otherwise returns False, effectively running in 
+        Returns True if the model is multimodal with any non-zero supported
+        modalities, otherwise returns False, effectively running in
         text-only mode.
         """
         if not model_config.is_multimodal_model:
@@ -135,11 +136,13 @@ def supports_multimodal_inputs(self, model_config: "ModelConfig") -> bool:
 
         # Check if all supported modalities have limit == 0
         if all(
-                mm_config.get_limit_per_prompt(modality) == 0
-                for modality in supported_modalities):
+            mm_config.get_limit_per_prompt(modality) == 0
+            for modality in supported_modalities
+        ):
             logger.info_once(
                 "All limits of multimodal modalities supported by the model "
-                "are set to 0, running in text-only mode.")
+                "are set to 0, running in text-only mode."
+            )
             return False
 
         return True
@@ -165,10 +168,7 @@ def get_max_tokens_per_item_by_modality(
 
         return profiler.get_mm_max_contiguous_tokens(
             seq_len,
-            {
-                modality: 1
-                for modality, limit in mm_limits.items() if limit > 0
-            },
+            {modality: 1 for modality, limit in mm_limits.items() if limit > 0},
         )
 
     def get_max_tokens_per_item_by_nonzero_modality(
@@ -235,7 +235,9 @@ def wrapper(model_cls: N) -> N:
                 logger.warning(
                     "Model class %s already has a multi-modal processor "
                     "registered to %s. It is overwritten by the new one.",
-                    model_cls, self)
+                    model_cls,
+                    self,
+                )
 
             self._processor_factories[model_cls] = _ProcessorFactories(
                 info=info,
@@ -315,15 +317,15 @@ def get_decoder_dummy_data(
         # count-only behavior remains unchanged.
         mm_options = self._extract_mm_options(model_config)
 
-        dummy_data = profiler.get_decoder_dummy_data(seq_len, mm_counts,
-                                                     mm_options)
+        dummy_data = profiler.get_decoder_dummy_data(seq_len, mm_counts, mm_options)
 
         # Having more tokens is over-conservative but otherwise fine
         token_ids = dummy_data.prompt_token_ids
         if len(token_ids) < seq_len:
             raise AssertionError(
                 f"Expected at least {seq_len} dummy tokens for profiling, "
-                f"but found {len(token_ids)} tokens instead.")
+                f"but found {len(token_ids)} tokens instead."
+            )
 
         return dummy_data
 
@@ -348,8 +350,7 @@ def get_encoder_dummy_data(
         # count-only behavior remains unchanged.
         mm_options = self._extract_mm_options(model_config)
 
-        dummy_data = profiler.get_encoder_dummy_data(seq_len, mm_counts,
-                                                     mm_options)
+        dummy_data = profiler.get_encoder_dummy_data(seq_len, mm_counts, mm_options)
 
         # Having more tokens is over-conservative but otherwise fine
         token_ids = dummy_data.prompt_token_ids
@@ -368,15 +369,16 @@ def get_encdec_max_encoder_len(self, model_config: "ModelConfig") -> int:
         """
         if not model_config.is_encoder_decoder:
             return 0
-        max_tokens = self.\
-            get_max_tokens_per_item_by_nonzero_modality(model_config)
+        max_tokens = self.get_max_tokens_per_item_by_nonzero_modality(model_config)
         if not max_tokens:
             # TODO - this function assumes encoder-decoder models are
             # multimodal. This will need to change when adding support for more
             # than whisper.
             return 0
-        assert len(max_tokens) == 1, "Encoder-decoder models are expected \
+        assert len(max_tokens) == 1, (
+            "Encoder-decoder models are expected \
             to implement the multimodal interface with at most one modality."
+        )
 
         first_modality = next(iter(max_tokens))
         return max_tokens[first_modality]
diff --git a/vllm/multimodal/utils.py b/vllm/multimodal/utils.py
index 735d8b403c15..c9dc077d0385 100644
--- a/vllm/multimodal/utils.py
+++ b/vllm/multimodal/utils.py
@@ -28,8 +28,12 @@
 _M = TypeVar("_M")
 
 if TYPE_CHECKING:
-    from .inputs import (BatchedTensorInputs, MultiModalKwargsItem,
-                         MultiModalKwargsItems, MultiModalPlaceholderDict)
+    from .inputs import (
+        BatchedTensorInputs,
+        MultiModalKwargsItem,
+        MultiModalKwargsItems,
+        MultiModalPlaceholderDict,
+    )
 else:
     BatchedTensorInputs = Any
     MultiModalKwargsItem = Any
@@ -37,12 +41,12 @@
     MultiModalPlaceholderDict = Any
 
 global_thread_pool = ThreadPoolExecutor(
-    max_workers=envs.VLLM_MEDIA_LOADING_THREAD_COUNT)
+    max_workers=envs.VLLM_MEDIA_LOADING_THREAD_COUNT
+)
 atexit.register(global_thread_pool.shutdown)
 
 
 class MediaConnector:
-
     def __init__(
         self,
         media_io_kwargs: Optional[dict[str, dict[str, Any]]] = None,
@@ -53,9 +57,9 @@ def __init__(
     ) -> None:
         """
         Args:
-            media_io_kwargs: Additional args passed to process media 
-                             inputs, keyed by modalities. For example, 
-                             to set num_frames for video, set 
+            media_io_kwargs: Additional args passed to process media
+                             inputs, keyed by modalities. For example,
+                             to set num_frames for video, set
                              `--media-io-kwargs '{"video":{"num_frames":40}}'`
             connection: HTTP connection client to download media contents.
             allowed_local_media_path: A local directory to load media files
@@ -63,8 +67,9 @@ def __init__(
         """
         super().__init__()
 
-        self.media_io_kwargs: dict[str, dict[
-            str, Any]] = media_io_kwargs if media_io_kwargs else {}
+        self.media_io_kwargs: dict[str, dict[str, Any]] = (
+            media_io_kwargs if media_io_kwargs else {}
+        )
         self.connection = connection
 
         if allowed_local_media_path:
@@ -73,11 +78,13 @@ def __init__(
             if not allowed_local_media_path_.exists():
                 raise ValueError(
                     "Invalid `--allowed-local-media-path`: The path "
-                    f"{allowed_local_media_path_} does not exist.")
+                    f"{allowed_local_media_path_} does not exist."
+                )
             if not allowed_local_media_path_.is_dir():
                 raise ValueError(
                     "Invalid `--allowed-local-media-path`: The path "
-                    f"{allowed_local_media_path_} must be a directory.")
+                    f"{allowed_local_media_path_} must be a directory."
+                )
         else:
             allowed_local_media_path_ = None
 
@@ -107,24 +114,29 @@ def _load_file_url(
     ) -> _M:  # type: ignore[type-var]
         allowed_local_media_path = self.allowed_local_media_path
         if allowed_local_media_path is None:
-            raise RuntimeError("Cannot load local files without "
-                               "`--allowed-local-media-path`.")
+            raise RuntimeError(
+                "Cannot load local files without `--allowed-local-media-path`."
+            )
 
         filepath = Path(url2pathname(url_spec.path))
         if allowed_local_media_path not in filepath.resolve().parents:
             raise ValueError(
                 f"The file path {filepath} must be a subpath "
-                f"of `--allowed-local-media-path` {allowed_local_media_path}.")
+                f"of `--allowed-local-media-path` {allowed_local_media_path}."
+            )
 
         return media_io.load_file(filepath)
 
     def _assert_url_in_allowed_media_domains(self, url_spec) -> None:
-        if self.allowed_media_domains and url_spec.hostname not in \
-            self.allowed_media_domains:
+        if (
+            self.allowed_media_domains
+            and url_spec.hostname not in self.allowed_media_domains
+        ):
             raise ValueError(
                 f"The URL must be from one of the allowed domains: "
                 f"{self.allowed_media_domains}. Input URL domain: "
-                f"{url_spec.hostname}")
+                f"{url_spec.hostname}"
+            )
 
     def load_from_url(
         self,
@@ -175,20 +187,19 @@ async def load_from_url_async(
                 timeout=fetch_timeout,
                 allow_redirects=envs.VLLM_MEDIA_URL_ALLOW_REDIRECTS,
             )
-            future = loop.run_in_executor(global_thread_pool,
-                                          media_io.load_bytes, data)
+            future = loop.run_in_executor(global_thread_pool, media_io.load_bytes, data)
             return await future
 
         if url_spec.scheme == "data":
-            future = loop.run_in_executor(global_thread_pool,
-                                          self._load_data_url, url_spec,
-                                          media_io)
+            future = loop.run_in_executor(
+                global_thread_pool, self._load_data_url, url_spec, media_io
+            )
             return await future
 
         if url_spec.scheme == "file":
-            future = loop.run_in_executor(global_thread_pool,
-                                          self._load_file_url, url_spec,
-                                          media_io)
+            future = loop.run_in_executor(
+                global_thread_pool, self._load_file_url, url_spec, media_io
+            )
             return await future
         msg = "The URL must be either a HTTP, data or file URL."
         raise ValueError(msg)
@@ -234,8 +245,9 @@ def fetch_image(
 
         By default, the image is converted into RGB format.
         """
-        image_io = ImageMediaIO(image_mode=image_mode,
-                                **self.media_io_kwargs.get("image", {}))
+        image_io = ImageMediaIO(
+            image_mode=image_mode, **self.media_io_kwargs.get("image", {})
+        )
 
         try:
             return self.load_from_url(
@@ -258,8 +270,9 @@ async def fetch_image_async(
 
         By default, the image is converted into RGB format.
         """
-        image_io = ImageMediaIO(image_mode=image_mode,
-                                **self.media_io_kwargs.get("image", {}))
+        image_io = ImageMediaIO(
+            image_mode=image_mode, **self.media_io_kwargs.get("image", {})
+        )
 
         try:
             return await self.load_from_url_async(
@@ -280,10 +293,10 @@ def fetch_video(
         """
         Load video from an HTTP or base64 data URL.
         """
-        image_io = ImageMediaIO(image_mode=image_mode,
-                                **self.media_io_kwargs.get("image", {}))
-        video_io = VideoMediaIO(image_io,
-                                **self.media_io_kwargs.get("video", {}))
+        image_io = ImageMediaIO(
+            image_mode=image_mode, **self.media_io_kwargs.get("image", {})
+        )
+        video_io = VideoMediaIO(image_io, **self.media_io_kwargs.get("video", {}))
 
         return self.load_from_url(
             video_url,
@@ -302,10 +315,10 @@ async def fetch_video_async(
 
         By default, the image is converted into RGB format.
         """
-        image_io = ImageMediaIO(image_mode=image_mode,
-                                **self.media_io_kwargs.get("image", {}))
-        video_io = VideoMediaIO(image_io,
-                                **self.media_io_kwargs.get("video", {}))
+        image_io = ImageMediaIO(
+            image_mode=image_mode, **self.media_io_kwargs.get("image", {})
+        )
+        video_io = VideoMediaIO(image_io, **self.media_io_kwargs.get("video", {}))
 
         return await self.load_from_url_async(
             video_url,
@@ -356,7 +369,8 @@ def encode_video_base64(frames: npt.NDArray) -> str:
 
 
 def argsort_mm_positions(
-        mm_positions: MultiModalPlaceholderDict) -> list[tuple[str, int]]:
+    mm_positions: MultiModalPlaceholderDict,
+) -> list[tuple[str, int]]:
     """
     Given a `MultiModalPlaceholderDict`, output a sequence of keys to
     sort the dictionary by `offset` (starting index in the input sequence)
@@ -366,9 +380,11 @@ def argsort_mm_positions(
         A list of `(modality, idx)`, which can be used to access an item
         by `mm_positions[modality][idx]`.
     """
-    flat_items = ((modality, idx, item)
-                  for modality, items in mm_positions.items()
-                  for idx, item in enumerate(items))
+    flat_items = (
+        (modality, idx, item)
+        for modality, items in mm_positions.items()
+        for idx, item in enumerate(items)
+    )
 
     sorted_flat_items = sorted(flat_items, key=lambda x: x[2].offset)
 
@@ -397,7 +413,8 @@ def group_mm_kwargs_by_modality(
         raise RuntimeError(
             "`group_mm_kwargs_by_modality` now requires "
             "`merge_by_field_config` arg, please update your model runner "
-            "according to https://github.com/vllm-project/vllm/pull/25676.")
+            "according to https://github.com/vllm-project/vllm/pull/25676."
+        )
 
     from vllm.multimodal.inputs import MultiModalKwargs, MultiModalKwargsItems
 
@@ -409,7 +426,9 @@ def group_mm_kwargs_by_modality(
         if merge_by_field_config:
             mm_kwargs_group: BatchedTensorInputs = dict(
                 MultiModalKwargsItems.from_seq(items_lst).get_data(
-                    pin_memory=pin_memory))
+                    pin_memory=pin_memory
+                )
+            )
 
             if device is not None:
                 mm_kwargs_group = json_map_leaves(
@@ -440,9 +459,7 @@ def fetch_audio(
         audio_url: URL of the audio file to fetch.
         audio_io_kwargs: Additional kwargs passed to handle audio IO.
     """
-    media_io_kwargs = None if not audio_io_kwargs else {
-        "audio": audio_io_kwargs
-    }
+    media_io_kwargs = None if not audio_io_kwargs else {"audio": audio_io_kwargs}
     media_connector = MediaConnector(media_io_kwargs=media_io_kwargs)
     return media_connector.fetch_audio(audio_url)
 
@@ -456,9 +473,7 @@ def fetch_image(
         image_url: URL of the image file to fetch.
         image_io_kwargs: Additional kwargs passed to handle image IO.
     """
-    media_io_kwargs = None if not image_io_kwargs else {
-        "image": image_io_kwargs
-    }
+    media_io_kwargs = None if not image_io_kwargs else {"image": image_io_kwargs}
     media_connector = MediaConnector(media_io_kwargs=media_io_kwargs)
     return media_connector.fetch_image(image_url)
 
@@ -472,8 +487,6 @@ def fetch_video(
         video_url: URL of the video file to fetch.
         video_io_kwargs: Additional kwargs passed to handle video IO.
     """
-    media_io_kwargs = None if not video_io_kwargs else {
-        "video": video_io_kwargs
-    }
+    media_io_kwargs = None if not video_io_kwargs else {"video": video_io_kwargs}
     media_connector = MediaConnector(media_io_kwargs=media_io_kwargs)
     return media_connector.fetch_video(video_url)
diff --git a/vllm/multimodal/video.py b/vllm/multimodal/video.py
index 6981f2ce5623..400d6a6be9be 100644
--- a/vllm/multimodal/video.py
+++ b/vllm/multimodal/video.py
@@ -21,8 +21,9 @@
 def resize_video(frames: npt.NDArray, size: tuple[int, int]) -> npt.NDArray:
     num_frames, _, _, channels = frames.shape
     new_height, new_width = size
-    resized_frames = np.empty((num_frames, new_height, new_width, channels),
-                              dtype=frames.dtype)
+    resized_frames = np.empty(
+        (num_frames, new_height, new_width, channels), dtype=frames.dtype
+    )
     # lazy import cv2 to avoid bothering users who only use text models
     import cv2
 
@@ -40,8 +41,7 @@ def rescale_video_size(frames: npt.NDArray, size_factor: float) -> npt.NDArray:
     return resize_video(frames, (new_height, new_width))
 
 
-def sample_frames_from_video(frames: npt.NDArray,
-                             num_frames: int) -> npt.NDArray:
+def sample_frames_from_video(frames: npt.NDArray, num_frames: int) -> npt.NDArray:
     total_frames = frames.shape[0]
     if num_frames == -1:
         return frames
@@ -52,23 +52,19 @@ def sample_frames_from_video(frames: npt.NDArray,
 
 
 class VideoLoader:
-
     @classmethod
     @abstractmethod
-    def load_bytes(cls,
-                   data: bytes,
-                   num_frames: int = -1,
-                   **kwargs) -> tuple[npt.NDArray, dict[str, Any]]:
+    def load_bytes(
+        cls, data: bytes, num_frames: int = -1, **kwargs
+    ) -> tuple[npt.NDArray, dict[str, Any]]:
         raise NotImplementedError
 
 
 class VideoLoaderRegistry:
-
     def __init__(self) -> None:
         self.name2class: dict[str, type] = {}
 
     def register(self, name: str):
-
         def wrap(cls_to_register):
             self.name2class[name] = cls_to_register
             return cls_to_register
@@ -87,7 +83,6 @@ def load(cls_name: str) -> VideoLoader:
 
 @VIDEO_LOADER_REGISTRY.register("opencv")
 class OpenCVVideoBackend(VideoLoader):
-
     def get_cv2_video_api(self):
         import cv2.videoio_registry as vr
 
@@ -127,10 +122,9 @@ def load_bytes(
             num_frames = total_frames_num
             frame_idx = list(range(0, num_frames))
         else:
-            uniform_sampled_frames = np.linspace(0,
-                                                 total_frames_num - 1,
-                                                 num_frames,
-                                                 dtype=int)
+            uniform_sampled_frames = np.linspace(
+                0, total_frames_num - 1, num_frames, dtype=int
+            )
             frame_idx = uniform_sampled_frames.tolist()
 
         width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
@@ -148,8 +142,10 @@ def load_bytes(
                     frames[i] = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
                     i += 1
 
-        assert i == num_frames, (f"Expected reading {num_frames} frames, "
-                                 f"but only loaded {i} frames from video.")
+        assert i == num_frames, (
+            f"Expected reading {num_frames} frames, "
+            f"but only loaded {i} frames from video."
+        )
 
         # Use transformers transformers.video_utils.VideoMetadata format
         # NOTE(Isotr0py): For models like Qwen3-VL/GLM4.5V, this metadata
@@ -170,7 +166,6 @@ def load_bytes(
 
 @VIDEO_LOADER_REGISTRY.register("opencv_dynamic")
 class OpenCVDynamicVideoBackend(OpenCVVideoBackend):
-
     @classmethod
     def load_bytes(
         cls,
@@ -200,28 +195,28 @@ def load_bytes(
         frame_indices: Union[range, list[int]]
         if duration <= max_duration:
             n = int(math.floor(duration * fps))
-            frame_indices = sorted({
-                min(max_frame_idx, int(math.ceil(i * original_fps / fps)))
-                for i in range(n)
-            })
+            frame_indices = sorted(
+                {
+                    min(max_frame_idx, int(math.ceil(i * original_fps / fps)))
+                    for i in range(n)
+                }
+            )
         else:
             num_samples = int(max_duration * fps)
             if num_samples >= total_frames_num:
                 frame_indices = range(total_frames_num)
             else:
-                target_seconds = np.linspace(0,
-                                             duration,
-                                             num_samples,
-                                             endpoint=True)
-                frame_indices = sorted({
-                    min(max_frame_idx, int(math.ceil(t * original_fps)))
-                    for t in target_seconds
-                })
+                target_seconds = np.linspace(0, duration, num_samples, endpoint=True)
+                frame_indices = sorted(
+                    {
+                        min(max_frame_idx, int(math.ceil(t * original_fps)))
+                        for t in target_seconds
+                    }
+                )
 
         width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
         height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
-        frames = np.empty((len(frame_indices), height, width, 3),
-                          dtype=np.uint8)
+        frames = np.empty((len(frame_indices), height, width, 3), dtype=np.uint8)
 
         i = 0
         for idx in range(total_frames_num):
@@ -236,7 +231,8 @@ def load_bytes(
 
         assert i == len(frame_indices), (
             f"Expected reading {len(frame_indices)} frames, "
-            f"but only loaded {i} frames from video.")
+            f"but only loaded {i} frames from video."
+        )
 
         # Use transformers transformers.video_utils.VideoMetadata format
         metadata = {
@@ -252,7 +248,6 @@ def load_bytes(
 
 
 class VideoMediaIO(MediaIO[npt.NDArray]):
-
     def __init__(
         self,
         image_io: ImageMediaIO,
@@ -273,22 +268,22 @@ def __init__(
         self.video_loader = VIDEO_LOADER_REGISTRY.load(video_loader_backend)
 
     def load_bytes(self, data: bytes) -> tuple[npt.NDArray, dict[str, Any]]:
-        return self.video_loader.load_bytes(data,
-                                            num_frames=self.num_frames,
-                                            **self.kwargs)
+        return self.video_loader.load_bytes(
+            data, num_frames=self.num_frames, **self.kwargs
+        )
 
-    def load_base64(self, media_type: str,
-                    data: str) -> tuple[npt.NDArray, dict[str, Any]]:
+    def load_base64(
+        self, media_type: str, data: str
+    ) -> tuple[npt.NDArray, dict[str, Any]]:
         if media_type.lower() == "video/jpeg":
             load_frame = partial(
                 self.image_io.load_base64,
                 "image/jpeg",
             )
 
-            return np.stack([
-                np.asarray(load_frame(frame_data))
-                for frame_data in data.split(",")
-            ]), {}
+            return np.stack(
+                [np.asarray(load_frame(frame_data)) for frame_data in data.split(",")]
+            ), {}
 
         return self.load_bytes(base64.b64decode(data))
 
@@ -312,8 +307,7 @@ def encode_base64(
                 image_format=video_format,
             )
 
-            return ",".join(
-                encode_frame(Image.fromarray(frame)) for frame in video)
+            return ",".join(encode_frame(Image.fromarray(frame)) for frame in video)
 
         msg = "Only JPEG format is supported for now."
         raise NotImplementedError(msg)
diff --git a/vllm/outputs.py b/vllm/outputs.py
index 1ed20461def1..dc183bd8dbe9 100644
--- a/vllm/outputs.py
+++ b/vllm/outputs.py
@@ -51,13 +51,15 @@ def finished(self) -> bool:
         return self.finish_reason is not None
 
     def __repr__(self) -> str:
-        return (f"CompletionOutput(index={self.index}, "
-                f"text={self.text!r}, "
-                f"token_ids={self.token_ids}, "
-                f"cumulative_logprob={self.cumulative_logprob}, "
-                f"logprobs={self.logprobs}, "
-                f"finish_reason={self.finish_reason}, "
-                f"stop_reason={self.stop_reason})")
+        return (
+            f"CompletionOutput(index={self.index}, "
+            f"text={self.text!r}, "
+            f"token_ids={self.token_ids}, "
+            f"cumulative_logprob={self.cumulative_logprob}, "
+            f"logprobs={self.logprobs}, "
+            f"finish_reason={self.finish_reason}, "
+            f"stop_reason={self.stop_reason})"
+        )
 
 
 @dataclass
@@ -67,14 +69,16 @@ class PoolingOutput:
     Args:
         data: The extracted hidden states.
     """
+
     data: torch.Tensor
 
     def __repr__(self) -> str:
-        return (f"PoolingOutput(data={self.data})")
+        return f"PoolingOutput(data={self.data})"
 
     def __eq__(self, other: object) -> bool:
-        return (isinstance(other, self.__class__) and bool(
-            (self.data == other.data).all()))
+        return isinstance(other, self.__class__) and bool(
+            (self.data == other.data).all()
+        )
 
 
 class RequestOutput:
@@ -122,8 +126,9 @@ def __init__(
         **kwargs: Any,
     ) -> None:
         if kwargs:
-            logger.warning_once("RequestOutput: Ignoring extra arguments: %s",
-                                str(kwargs))
+            logger.warning_once(
+                "RequestOutput: Ignoring extra arguments: %s", str(kwargs)
+            )
         self.request_id = request_id
         self.prompt = prompt
         self.prompt_token_ids = prompt_token_ids
@@ -150,16 +155,15 @@ def add(self, next_output: "RequestOutput", aggregate: bool) -> None:
                     if aggregate:
                         # Merge outputs with same index
                         completion.text += next_completion.text
-                        if not isinstance(completion.token_ids,
-                                          MutableSequence):
+                        if not isinstance(completion.token_ids, MutableSequence):
                             completion.token_ids = list(completion.token_ids)
                         completion.token_ids.extend(next_completion.token_ids)
                         if next_completion.logprobs:
                             assert completion.logprobs is not None
-                            completion.logprobs.extend(
-                                next_completion.logprobs)
+                            completion.logprobs.extend(next_completion.logprobs)
                         completion.cumulative_logprob = (
-                            next_completion.cumulative_logprob)
+                            next_completion.cumulative_logprob
+                        )
                         completion.finish_reason = next_completion.finish_reason
                         completion.stop_reason = next_completion.stop_reason
                     else:
@@ -170,18 +174,20 @@ def add(self, next_output: "RequestOutput", aggregate: bool) -> None:
                 self.outputs.append(next_completion)
 
     def __repr__(self) -> str:
-        return (f"RequestOutput(request_id={self.request_id}, "
-                f"prompt={self.prompt!r}, "
-                f"prompt_token_ids={self.prompt_token_ids}, "
-                f"encoder_prompt={self.encoder_prompt!r}, "
-                f"encoder_prompt_token_ids={self.encoder_prompt_token_ids}, "
-                f"prompt_logprobs={self.prompt_logprobs}, "
-                f"outputs={self.outputs}, "
-                f"finished={self.finished}, "
-                f"metrics={self.metrics}, "
-                f"lora_request={self.lora_request}, "
-                f"num_cached_tokens={self.num_cached_tokens}, "
-                f"multi_modal_placeholders={self.multi_modal_placeholders})")
+        return (
+            f"RequestOutput(request_id={self.request_id}, "
+            f"prompt={self.prompt!r}, "
+            f"prompt_token_ids={self.prompt_token_ids}, "
+            f"encoder_prompt={self.encoder_prompt!r}, "
+            f"encoder_prompt_token_ids={self.encoder_prompt_token_ids}, "
+            f"prompt_logprobs={self.prompt_logprobs}, "
+            f"outputs={self.outputs}, "
+            f"finished={self.finished}, "
+            f"metrics={self.metrics}, "
+            f"lora_request={self.lora_request}, "
+            f"num_cached_tokens={self.num_cached_tokens}, "
+            f"multi_modal_placeholders={self.multi_modal_placeholders})"
+        )
 
 
 _O = TypeVar("_O", default=PoolingOutput)
@@ -198,18 +204,21 @@ class PoolingRequestOutput(Generic[_O]):
         finished (bool): A flag indicating whether the pooling is completed.
     """
 
-    def __init__(self, request_id: str, outputs: _O,
-                 prompt_token_ids: list[int], finished: bool):
+    def __init__(
+        self, request_id: str, outputs: _O, prompt_token_ids: list[int], finished: bool
+    ):
         self.request_id = request_id
         self.prompt_token_ids = prompt_token_ids
         self.finished = finished
         self.outputs = outputs
 
     def __repr__(self):
-        return (f"{type(self).__name__}(request_id={self.request_id!r}, "
-                f"outputs={self.outputs!r}, "
-                f"prompt_token_ids={self.prompt_token_ids}, "
-                f"finished={self.finished})")
+        return (
+            f"{type(self).__name__}(request_id={self.request_id!r}, "
+            f"outputs={self.outputs!r}, "
+            f"prompt_token_ids={self.prompt_token_ids}, "
+            f"finished={self.finished})"
+        )
 
 
 @dataclass
@@ -220,6 +229,7 @@ class EmbeddingOutput:
         embedding: The embedding vector, which is a list of floats.
             Its length depends on the hidden dimension of the model.
     """
+
     embedding: list[float]
 
     @staticmethod
@@ -239,7 +249,6 @@ def __repr__(self) -> str:
 
 
 class EmbeddingRequestOutput(PoolingRequestOutput[EmbeddingOutput]):
-
     @staticmethod
     def from_base(request_output: PoolingRequestOutput):
         return EmbeddingRequestOutput(
@@ -258,6 +267,7 @@ class ClassificationOutput:
         probs: The probability vector, which is a list of floats.
             Its length depends on the number of classes.
     """
+
     probs: list[float]
 
     @staticmethod
@@ -278,7 +288,6 @@ def __repr__(self) -> str:
 
 
 class ClassificationRequestOutput(PoolingRequestOutput[ClassificationOutput]):
-
     @staticmethod
     def from_base(request_output: PoolingRequestOutput):
         return ClassificationRequestOutput(
@@ -296,6 +305,7 @@ class ScoringOutput:
     Args:
         score: The similarity score, which is a scalar value.
     """
+
     score: float
 
     @staticmethod
@@ -314,7 +324,6 @@ def __repr__(self) -> str:
 
 
 class ScoringRequestOutput(PoolingRequestOutput[ScoringOutput]):
-
     @staticmethod
     def from_base(request_output: PoolingRequestOutput):
         return ScoringRequestOutput(
diff --git a/vllm/platforms/__init__.py b/vllm/platforms/__init__.py
index 7549de480ee6..5154b1cea782 100644
--- a/vllm/platforms/__init__.py
+++ b/vllm/platforms/__init__.py
@@ -19,12 +19,14 @@ def vllm_version_matches_substr(substr: str) -> bool:
     Check to see if the vLLM version matches a substring.
     """
     from importlib.metadata import PackageNotFoundError, version
+
     try:
         vllm_version = version("vllm")
     except PackageNotFoundError as e:
         logger.warning(
             "The vLLM package was not found, so its version could not be "
-            "inspected. This may cause platform detection to fail.")
+            "inspected. This may cause platform detection to fail."
+        )
         raise e
     return substr in vllm_version
 
@@ -45,6 +47,7 @@ def tpu_platform_plugin() -> Optional[str]:
         # has TPUs.
 
         import libtpu  # noqa: F401
+
         logger.debug("Confirmed TPU platform is available.")
         return "vllm.platforms.tpu.TpuPlatform"
     except Exception as e:
@@ -57,6 +60,7 @@ def cuda_platform_plugin() -> Optional[str]:
     logger.debug("Checking if CUDA platform is available.")
     try:
         from vllm.utils import import_pynvml
+
         pynvml = import_pynvml()
         pynvml.nvmlInit()
         try:
@@ -65,21 +69,22 @@ def cuda_platform_plugin() -> Optional[str]:
             # we need to check if vllm is built with cpu too.
             # Otherwise, vllm will always activate cuda plugin
             # on a GPU machine, even if in a cpu build.
-            is_cuda = (pynvml.nvmlDeviceGetCount() > 0
-                       and not vllm_version_matches_substr("cpu"))
+            is_cuda = (
+                pynvml.nvmlDeviceGetCount() > 0
+                and not vllm_version_matches_substr("cpu")
+            )
             if pynvml.nvmlDeviceGetCount() <= 0:
-                logger.debug(
-                    "CUDA platform is not available because no GPU is found.")
+                logger.debug("CUDA platform is not available because no GPU is found.")
             if vllm_version_matches_substr("cpu"):
-                logger.debug("CUDA platform is not available because"
-                             " vLLM is built with CPU.")
+                logger.debug(
+                    "CUDA platform is not available because vLLM is built with CPU."
+                )
             if is_cuda:
                 logger.debug("Confirmed CUDA platform is available.")
         finally:
             pynvml.nvmlShutdown()
     except Exception as e:
-        logger.debug("Exception happens when checking CUDA platform: %s",
-                     str(e))
+        logger.debug("Exception happens when checking CUDA platform: %s", str(e))
         if "nvml" not in e.__class__.__name__.lower():
             # If the error is not related to NVML, re-raise it.
             raise e
@@ -88,8 +93,9 @@ def cuda_platform_plugin() -> Optional[str]:
         import os
 
         def cuda_is_jetson() -> bool:
-            return os.path.isfile("/etc/nv_tegra_release") \
-                or os.path.exists("/sys/class/tegra-firmware")
+            return os.path.isfile("/etc/nv_tegra_release") or os.path.exists(
+                "/sys/class/tegra-firmware"
+            )
 
         if cuda_is_jetson():
             logger.debug("Confirmed CUDA platform is available on Jetson.")
@@ -105,14 +111,14 @@ def rocm_platform_plugin() -> Optional[str]:
     logger.debug("Checking if ROCm platform is available.")
     try:
         import amdsmi
+
         amdsmi.amdsmi_init()
         try:
             if len(amdsmi.amdsmi_get_processor_handles()) > 0:
                 is_rocm = True
                 logger.debug("Confirmed ROCm platform is available.")
             else:
-                logger.debug("ROCm platform is not available because"
-                             " no GPU is found.")
+                logger.debug("ROCm platform is not available because no GPU is found.")
         finally:
             amdsmi.amdsmi_shut_down()
     except Exception as e:
@@ -128,18 +134,19 @@ def xpu_platform_plugin() -> Optional[str]:
         # installed IPEX if the machine has XPUs.
         import intel_extension_for_pytorch  # noqa: F401
         import torch
+
         if supports_xccl():
             dist_backend = "xccl"
         else:
             dist_backend = "ccl"
             import oneccl_bindings_for_pytorch  # noqa: F401
 
-        if hasattr(torch, 'xpu') and torch.xpu.is_available():
+        if hasattr(torch, "xpu") and torch.xpu.is_available():
             is_xpu = True
             from vllm.platforms.xpu import XPUPlatform
+
             XPUPlatform.dist_backend = dist_backend
-            logger.debug("Confirmed %s backend is available.",
-                         XPUPlatform.dist_backend)
+            logger.debug("Confirmed %s backend is available.", XPUPlatform.dist_backend)
             logger.debug("Confirmed XPU platform is available.")
     except Exception as e:
         logger.debug("XPU platform is not available because: %s", str(e))
@@ -153,14 +160,17 @@ def cpu_platform_plugin() -> Optional[str]:
     try:
         is_cpu = vllm_version_matches_substr("cpu")
         if is_cpu:
-            logger.debug("Confirmed CPU platform is available because"
-                         " vLLM is built with CPU.")
+            logger.debug(
+                "Confirmed CPU platform is available because vLLM is built with CPU."
+            )
         if not is_cpu:
             import sys
+
             is_cpu = sys.platform.startswith("darwin")
             if is_cpu:
-                logger.debug("Confirmed CPU platform is available"
-                             " because the machine is MacOS.")
+                logger.debug(
+                    "Confirmed CPU platform is available because the machine is MacOS."
+                )
 
     except Exception as e:
         logger.debug("CPU platform is not available because: %s", str(e))
@@ -169,21 +179,20 @@ def cpu_platform_plugin() -> Optional[str]:
 
 
 builtin_platform_plugins = {
-    'tpu': tpu_platform_plugin,
-    'cuda': cuda_platform_plugin,
-    'rocm': rocm_platform_plugin,
-    'xpu': xpu_platform_plugin,
-    'cpu': cpu_platform_plugin,
+    "tpu": tpu_platform_plugin,
+    "cuda": cuda_platform_plugin,
+    "rocm": rocm_platform_plugin,
+    "xpu": xpu_platform_plugin,
+    "cpu": cpu_platform_plugin,
 }
 
 
 def resolve_current_platform_cls_qualname() -> str:
-    platform_plugins = load_plugins_by_group('vllm.platform_plugins')
+    platform_plugins = load_plugins_by_group("vllm.platform_plugins")
 
     activated_plugins = []
 
-    for name, func in chain(builtin_platform_plugins.items(),
-                            platform_plugins.items()):
+    for name, func in chain(builtin_platform_plugins.items(), platform_plugins.items()):
         try:
             assert callable(func)
             platform_cls_qualname = func()
@@ -193,43 +202,41 @@ def resolve_current_platform_cls_qualname() -> str:
             pass
 
     activated_builtin_plugins = list(
-        set(activated_plugins) & set(builtin_platform_plugins.keys()))
-    activated_oot_plugins = list(
-        set(activated_plugins) & set(platform_plugins.keys()))
+        set(activated_plugins) & set(builtin_platform_plugins.keys())
+    )
+    activated_oot_plugins = list(set(activated_plugins) & set(platform_plugins.keys()))
 
     if len(activated_oot_plugins) >= 2:
         raise RuntimeError(
             "Only one platform plugin can be activated, but got: "
-            f"{activated_oot_plugins}")
+            f"{activated_oot_plugins}"
+        )
     elif len(activated_oot_plugins) == 1:
         platform_cls_qualname = platform_plugins[activated_oot_plugins[0]]()
-        logger.info("Platform plugin %s is activated",
-                    activated_oot_plugins[0])
+        logger.info("Platform plugin %s is activated", activated_oot_plugins[0])
     elif len(activated_builtin_plugins) >= 2:
         raise RuntimeError(
             "Only one platform plugin can be activated, but got: "
-            f"{activated_builtin_plugins}")
+            f"{activated_builtin_plugins}"
+        )
     elif len(activated_builtin_plugins) == 1:
-        platform_cls_qualname = builtin_platform_plugins[
-            activated_builtin_plugins[0]]()
-        logger.info("Automatically detected platform %s.",
-                    activated_builtin_plugins[0])
+        platform_cls_qualname = builtin_platform_plugins[activated_builtin_plugins[0]]()
+        logger.info("Automatically detected platform %s.", activated_builtin_plugins[0])
     else:
         platform_cls_qualname = "vllm.platforms.interface.UnspecifiedPlatform"
-        logger.info(
-            "No platform detected, vLLM is running on UnspecifiedPlatform")
+        logger.info("No platform detected, vLLM is running on UnspecifiedPlatform")
     return platform_cls_qualname
 
 
 _current_platform = None
-_init_trace: str = ''
+_init_trace: str = ""
 
 if TYPE_CHECKING:
     current_platform: Platform
 
 
 def __getattr__(name: str):
-    if name == 'current_platform':
+    if name == "current_platform":
         # lazy init current_platform.
         # 1. out-of-tree platform plugins need `from vllm.platforms import
         #    Platform` so that they can inherit `Platform` class. Therefore,
@@ -244,19 +251,14 @@ def __getattr__(name: str):
         global _current_platform
         if _current_platform is None:
             platform_cls_qualname = resolve_current_platform_cls_qualname()
-            _current_platform = resolve_obj_by_qualname(
-                platform_cls_qualname)()
+            _current_platform = resolve_obj_by_qualname(platform_cls_qualname)()
             global _init_trace
             _init_trace = "".join(traceback.format_stack())
         return _current_platform
     elif name in globals():
         return globals()[name]
     else:
-        raise AttributeError(
-            f"No attribute named '{name}' exists in {__name__}.")
+        raise AttributeError(f"No attribute named '{name}' exists in {__name__}.")
 
 
-__all__ = [
-    'Platform', 'PlatformEnum', 'current_platform', 'CpuArchEnum',
-    "_init_trace"
-]
+__all__ = ["Platform", "PlatformEnum", "current_platform", "CpuArchEnum", "_init_trace"]
diff --git a/vllm/platforms/cpu.py b/vllm/platforms/cpu.py
index 4f96cf93aad7..2f87664003dc 100644
--- a/vllm/platforms/cpu.py
+++ b/vllm/platforms/cpu.py
@@ -28,9 +28,9 @@
 
 
 def get_max_threads(pid=0):
-    if hasattr(os, 'sched_getaffinity'):
+    if hasattr(os, "sched_getaffinity"):
         return len(os.sched_getaffinity(pid))
-    elif platform.system() == 'Darwin':
+    elif platform.system() == "Darwin":
         return os.cpu_count()
     else:
         raise NotImplementedError("Unsupported OS")
@@ -60,7 +60,8 @@ def json_decoder(obj_dict: dict):
             return LogicalCPUInfo(
                 id=LogicalCPUInfo._int(id),
                 physical_core=LogicalCPUInfo._int(physical_core),
-                numa_node=LogicalCPUInfo._int(numa_node))
+                numa_node=LogicalCPUInfo._int(numa_node),
+            )
         else:
             return obj_dict
 
@@ -77,11 +78,15 @@ class CpuPlatform(Platform):
     def supported_dtypes(self) -> list[torch.dtype]:
         if self.get_cpu_architecture() == CpuArchEnum.POWERPC:
             return [torch.bfloat16, torch.float32]
-        elif (self.get_cpu_architecture() == CpuArchEnum.ARM
-              and sys.platform.startswith("darwin")):
-            if (subprocess.check_output(
-                ["sysctl -n hw.optional.arm.FEAT_BF16"],
-                    shell=True).strip() == b"1"):
+        elif self.get_cpu_architecture() == CpuArchEnum.ARM and sys.platform.startswith(
+            "darwin"
+        ):
+            if (
+                subprocess.check_output(
+                    ["sysctl -n hw.optional.arm.FEAT_BF16"], shell=True
+                ).strip()
+                == b"1"
+            ):
                 return [torch.bfloat16, torch.float16, torch.float32]
             return [torch.float16, torch.float32]
         elif self.get_cpu_architecture() == CpuArchEnum.RISCV:
@@ -117,18 +122,26 @@ def get_device_name(cls, device_id: int = 0) -> str:
         return "cpu"
 
     @classmethod
-    def get_attn_backend_cls(cls, selected_backend: "_Backend", head_size: int,
-                             dtype: torch.dtype, kv_cache_dtype: Optional[str],
-                             block_size: int, use_v1: bool, use_mla: bool,
-                             has_sink: bool, use_sparse: bool) -> str:
+    def get_attn_backend_cls(
+        cls,
+        selected_backend: "_Backend",
+        head_size: int,
+        dtype: torch.dtype,
+        kv_cache_dtype: Optional[str],
+        block_size: int,
+        use_v1: bool,
+        use_mla: bool,
+        has_sink: bool,
+        use_sparse: bool,
+    ) -> str:
         from vllm.attention.backends.registry import _Backend
+
         if selected_backend and selected_backend != _Backend.TORCH_SDPA:
             logger.info("Cannot use %s backend on CPU.", selected_backend)
         if use_mla:
             raise NotImplementedError("MLA is not supported on CPU.")
         if use_sparse:
-            raise NotImplementedError(
-                "Sparse Attention is not supported on CPU.")
+            raise NotImplementedError("Sparse Attention is not supported on CPU.")
         logger.info("Using Torch SDPA backend.")
         if not use_v1:
             raise ValueError("CPU backend only supports V1.")
@@ -144,7 +157,8 @@ def get_device_total_memory(cls, device_id: int = 0) -> int:
             kv_cache_space = 4 * GiB_bytes  # type: ignore
             logger.warning_once(
                 "Environment variable VLLM_CPU_KVCACHE_SPACE (GiB) "
-                "for CPU backend is not set, using 4 by default.")
+                "for CPU backend is not set, using 4 by default."
+            )
         else:
             kv_cache_space *= GiB_bytes
 
@@ -178,53 +192,66 @@ def check_and_update_config(cls, vllm_config: VllmConfig) -> None:
         if not ipex_available and cache_config.block_size != 16:
             raise RuntimeError(
                 f"--block-size={cache_config.block_size} requires"
-                " intel_extension_for_pytorch")
+                " intel_extension_for_pytorch"
+            )
 
         scheduler_config = vllm_config.scheduler_config
-        if ((scheduler_config.chunked_prefill_enabled
-             or cache_config.enable_prefix_caching)
-                and cache_config.cache_dtype != "auto"):
-            raise RuntimeError("Chunked-prefill and prefix-cache on the CPU "
-                               "backend is not compatible with FP8 KV cache.")
+        if (
+            scheduler_config.chunked_prefill_enabled
+            or cache_config.enable_prefix_caching
+        ) and cache_config.cache_dtype != "auto":
+            raise RuntimeError(
+                "Chunked-prefill and prefix-cache on the CPU "
+                "backend is not compatible with FP8 KV cache."
+            )
 
         if cache_config.cache_dtype == "fp8_e4m3":
             cache_config.cache_dtype = "fp8_e5m2"
             logger.warning(
-                "CPU backend doesn't support fp8_e4m3 KV cache type, "
-                "cast to fp8_e5m2.")
-
-        if (cache_config.cache_dtype != "auto" and model_config is not None
-                and model_config.dtype == torch.half):
-            logger.warning("FP8 KV cache on the CPU backend only does not"
-                           " support fp16 for now, cast to bf16.")
+                "CPU backend doesn't support fp8_e4m3 KV cache type, cast to fp8_e5m2."
+            )
+
+        if (
+            cache_config.cache_dtype != "auto"
+            and model_config is not None
+            and model_config.dtype == torch.half
+        ):
+            logger.warning(
+                "FP8 KV cache on the CPU backend only does not"
+                " support fp16 for now, cast to bf16."
+            )
             model_config.dtype = torch.bfloat16
 
-        cache_config.cpu_kvcache_space_bytes = \
-            CpuPlatform.get_device_total_memory()
+        cache_config.cpu_kvcache_space_bytes = CpuPlatform.get_device_total_memory()
 
         parallel_config = vllm_config.parallel_config
-        if (parallel_config.world_size > 1
-                and parallel_config.distributed_executor_backend is not None
-                and parallel_config.distributed_executor_backend != "mp"):
-            logger.warning(("%s is not supported on CPU, fallback to mp "
-                            "distributed executor backend."),
-                           parallel_config.distributed_executor_backend)
+        if (
+            parallel_config.world_size > 1
+            and parallel_config.distributed_executor_backend is not None
+            and parallel_config.distributed_executor_backend != "mp"
+        ):
+            logger.warning(
+                (
+                    "%s is not supported on CPU, fallback to mp "
+                    "distributed executor backend."
+                ),
+                parallel_config.distributed_executor_backend,
+            )
             parallel_config.distributed_executor_backend = "mp"
         if parallel_config.worker_cls == "auto":
             parallel_config.worker_cls = "vllm.v1.worker.cpu_worker.CPUWorker"
         # Disable DBO
         if parallel_config.enable_dbo:
-            logger.warning(
-                "Dual-Batch Overlap is not supported on CPU, disabled.")
+            logger.warning("Dual-Batch Overlap is not supported on CPU, disabled.")
             parallel_config.enable_dbo = False
 
         # Note: workaround for v1 gpu_model_runner
         from vllm.config import CompilationLevel
+
         vllm_config.compilation_config.cudagraph_capture_sizes = []
 
         compilation_config = vllm_config.compilation_config
         if vllm_config.compilation_config.level == CompilationLevel.PIECEWISE:
-
             # Note: vLLM V1 is using PIECEWISE level compilation, which will
             # take time to compile kernels just-in-time with the inductor
             # backend. For CPU CI tests, most of them are executed fast and
@@ -239,16 +266,14 @@ def check_and_update_config(cls, vllm_config: VllmConfig) -> None:
 
             compilation_config.level = CompilationLevel.DYNAMO_ONCE
             compilation_config.backend = backend
-            compilation_config.inductor_compile_config.update({
-                "dce":
-                True,
-                "size_asserts":
-                False,
-                "nan_asserts":
-                False,
-                "epilogue_fusion":
-                True,
-            })
+            compilation_config.inductor_compile_config.update(
+                {
+                    "dce": True,
+                    "size_asserts": False,
+                    "nan_asserts": False,
+                    "epilogue_fusion": True,
+                }
+            )
             if compilation_config.use_inductor:
                 compilation_config.custom_ops = ["none"]
 
@@ -278,51 +303,56 @@ def check_and_update_config(cls, vllm_config: VllmConfig) -> None:
         if "libiomp5.so" in ld_prealod_str:
             # The time(milliseconds) that a thread should wait after
             # completing the execution of a parallel region, before sleeping.
-            os.environ['KMP_BLOCKTIME'] = "1"
+            os.environ["KMP_BLOCKTIME"] = "1"
             # Prevents the CPU to run into low performance state
-            os.environ['KMP_TPAUSE'] = "0"
+            os.environ["KMP_TPAUSE"] = "0"
             # Provides fine granularity parallelism
-            os.environ['KMP_FORKJOIN_BARRIER_PATTERN'] = "dist,dist"
-            os.environ['KMP_PLAIN_BARRIER_PATTERN'] = "dist,dist"
-            os.environ['KMP_REDUCTION_BARRIER_PATTERN'] = "dist,dist"
+            os.environ["KMP_FORKJOIN_BARRIER_PATTERN"] = "dist,dist"
+            os.environ["KMP_PLAIN_BARRIER_PATTERN"] = "dist,dist"
+            os.environ["KMP_REDUCTION_BARRIER_PATTERN"] = "dist,dist"
 
         # To hint IPEX uses shared memory based AllReduce
         os.environ["LOCAL_WORLD_SIZE"] = str(
-            vllm_config.parallel_config.tensor_parallel_size)
+            vllm_config.parallel_config.tensor_parallel_size
+        )
 
         if model_config is not None and model_config.use_mla:
             logger.info(
                 "MLA is enabled on a non-GPU platform; forcing chunked "
-                "prefill and prefix caching to be disabled.")
+                "prefill and prefix caching to be disabled."
+            )
             vllm_config.scheduler_config.enable_chunked_prefill = False
             vllm_config.scheduler_config.chunked_prefill_enabled = False
             vllm_config.scheduler_config.max_num_batched_tokens = max(
                 vllm_config.scheduler_config.max_model_len,
-                DEFAULT_MAX_NUM_BATCHED_TOKENS)
+                DEFAULT_MAX_NUM_BATCHED_TOKENS,
+            )
 
     @classmethod
-    def get_allowed_cpu_core_node_list(
-            cls) -> tuple[list[int], list[LogicalCPUInfo]]:
+    def get_allowed_cpu_core_node_list(cls) -> tuple[list[int], list[LogicalCPUInfo]]:
         assert platform.system() == "Linux"
 
         # Init LogicalCPUInfo from lscpu
-        lscpu_output = subprocess.check_output("lscpu -J -e=CPU,CORE,NODE",
-                                               shell=True,
-                                               text=True)
+        lscpu_output = subprocess.check_output(
+            "lscpu -J -e=CPU,CORE,NODE", shell=True, text=True
+        )
         logical_cpu_list: list[LogicalCPUInfo] = json.loads(
-            lscpu_output, object_hook=LogicalCPUInfo.json_decoder)['cpus']
+            lscpu_output, object_hook=LogicalCPUInfo.json_decoder
+        )["cpus"]
 
         # Filter CPUs with invalid attributes
         logical_cpu_list = [
-            x for x in logical_cpu_list
+            x
+            for x in logical_cpu_list
             if -1 not in (x.id, x.physical_core, x.numa_node)
         ]
 
         # Filter allowed CPUs
-        allowed_cpu_id_list = os.sched_getaffinity(0)
-        logical_cpu_list = [
-            x for x in logical_cpu_list if x.id in allowed_cpu_id_list
-        ]
+        if hasattr(os, "sched_getaffinity"):
+            allowed_cpu_id_list = os.sched_getaffinity(0)
+        else:
+            raise NotImplementedError("Unsupported OS")
+        logical_cpu_list = [x for x in logical_cpu_list if x.id in allowed_cpu_id_list]
 
         # Get allowed NUMA nodes
         allowed_numa_nodes = set()
@@ -331,8 +361,8 @@ def get_allowed_cpu_core_node_list(
         allowed_numa_nodes_list = sorted(allowed_numa_nodes)
 
         env_key = CpuPlatform.device_control_env_var
-        if (env_key in os.environ and os.environ[env_key] != ""):
-            visible_nodes = [int(s) for s in os.environ[env_key].split(',')]
+        if env_key in os.environ and os.environ[env_key] != "":
+            visible_nodes = [int(s) for s in os.environ[env_key].split(",")]
             allowed_numa_nodes_list = [
                 x for x in visible_nodes if x in allowed_cpu_id_list
             ]
diff --git a/vllm/platforms/cuda.py b/vllm/platforms/cuda.py
index b7baa614957e..20568e0d6c51 100644
--- a/vllm/platforms/cuda.py
+++ b/vllm/platforms/cuda.py
@@ -41,7 +41,6 @@
 
 
 def with_nvml_context(fn: Callable[_P, _R]) -> Callable[_P, _R]:
-
     @wraps(fn)
     def wrapper(*args: _P.args, **kwargs: _P.kwargs) -> _R:
         pynvml.nvmlInit()
@@ -86,9 +85,7 @@ def set_device(cls, device: torch.device) -> None:
         _ = torch.zeros(1, device=device)
 
     @classmethod
-    def get_device_capability(cls,
-                              device_id: int = 0
-                              ) -> Optional[DeviceCapability]:
+    def get_device_capability(cls, device_id: int = 0) -> Optional[DeviceCapability]:
         raise NotImplementedError
 
     @classmethod
@@ -122,8 +119,7 @@ def check_and_update_config(cls, vllm_config: "VllmConfig") -> None:
         # TODO(lucas): handle this more gracefully
         # Note: model_config may be None during testing
         if model_config is not None and model_config.use_mla:
-            use_sparse = hasattr(vllm_config.model_config.hf_config,
-                                 "index_topk")
+            use_sparse = hasattr(vllm_config.model_config.hf_config, "index_topk")
             # If `VLLM_ATTENTION_BACKEND` is not set and we are using MLA,
             # then we default to FlashMLA backend for non-blackwell GPUs,
             # else we default to CutlassMLA. For each case, we force the
@@ -146,43 +142,47 @@ def check_and_update_config(cls, vllm_config: "VllmConfig") -> None:
                     use_flashmla = True
             else:
                 # Forced case
-                use_flashmla = (envs.VLLM_ATTENTION_BACKEND == "FLASHMLA")
-                use_cutlass_mla = (
-                    envs.VLLM_ATTENTION_BACKEND == "CUTLASS_MLA")
-                use_flashinfer_mla = (
-                    envs.VLLM_ATTENTION_BACKEND == "FLASHINFER_MLA")
+                use_flashmla = envs.VLLM_ATTENTION_BACKEND == "FLASHMLA"
+                use_cutlass_mla = envs.VLLM_ATTENTION_BACKEND == "CUTLASS_MLA"
+                use_flashinfer_mla = envs.VLLM_ATTENTION_BACKEND == "FLASHINFER_MLA"
 
             from vllm.attention.ops.flashmla import is_flashmla_supported
-            if use_flashmla and is_flashmla_supported()[0] \
-                and cache_config.block_size != 64:
+
+            if (
+                use_flashmla
+                and is_flashmla_supported()[0]
+                and cache_config.block_size != 64
+            ):
                 cache_config.block_size = 64
-                logger.info(
-                    "Forcing kv cache block size to 64 for FlashMLA backend.")
+                logger.info("Forcing kv cache block size to 64 for FlashMLA backend.")
 
             if use_cutlass_mla and cache_config.block_size != 128:
                 cache_config.block_size = 128
-                logger.info("Forcing kv cache block size to 128 for "
-                            "CUTLASS_MLA backend.")
+                logger.info(
+                    "Forcing kv cache block size to 128 for CUTLASS_MLA backend."
+                )
 
             if use_flashinfer_mla and cache_config.block_size not in [32, 64]:
                 cache_config.block_size = 64
                 logger.info(
-                    "Forcing kv cache block size to 64 for FlashInferMLA "
-                    "backend.")
+                    "Forcing kv cache block size to 64 for FlashInferMLA backend."
+                )
 
             # TODO(Chen): remove this hacky code
             if use_sparse and cache_config.block_size != 64:
                 cache_config.block_size = 64
                 logger.info(
-                    "Forcing kv cache block size to 64 for FlashMLASparse "
-                    "backend.")
+                    "Forcing kv cache block size to 64 for FlashMLASparse backend."
+                )
         # lazy import to avoid circular import
         from vllm.config import CUDAGraphMode
 
         compilation_config = vllm_config.compilation_config
-        if (envs.VLLM_ALL2ALL_BACKEND == "deepep_high_throughput"
-                and parallel_config.data_parallel_size > 1
-                and compilation_config.cudagraph_mode != CUDAGraphMode.NONE):
+        if (
+            envs.VLLM_ALL2ALL_BACKEND == "deepep_high_throughput"
+            and parallel_config.data_parallel_size > 1
+            and compilation_config.cudagraph_mode != CUDAGraphMode.NONE
+        ):
             # TODO: Piecewise Cuda graph might be enabled
             # if torch compile cache key issue fixed
             # See https://github.com/vllm-project/vllm/pull/25093
@@ -192,20 +192,20 @@ def check_and_update_config(cls, vllm_config: "VllmConfig") -> None:
                 "CUDA Graphs. "
                 "In order to use CUDA Graphs for decode-optimized workloads, "
                 "set VLLM_ALL2ALL_BACKEND to another option, such as "
-                "deepep_low_latency, pplx, or allgather_reducescatter.")
+                "deepep_low_latency, pplx, or allgather_reducescatter."
+            )
             compilation_config.cudagraph_mode = CUDAGraphMode.NONE
 
     @classmethod
-    def get_current_memory_usage(cls,
-                                 device: Optional[torch.types.Device] = None
-                                 ) -> float:
+    def get_current_memory_usage(
+        cls, device: Optional[torch.types.Device] = None
+    ) -> float:
         torch.cuda.empty_cache()
         torch.cuda.reset_peak_memory_stats(device)
         return torch.cuda.max_memory_allocated(device)
 
     @classmethod
-    def get_vit_attn_backend(cls, head_size: int,
-                             dtype: torch.dtype) -> "_Backend":
+    def get_vit_attn_backend(cls, head_size: int, dtype: torch.dtype) -> "_Backend":
         from vllm.attention.backends.registry import _Backend
 
         # For Blackwell GPUs, force TORCH_SDPA for now.
@@ -217,10 +217,14 @@ def get_vit_attn_backend(cls, head_size: int,
             return _Backend.XFORMERS
 
         if cls.has_device_capability(80):
-            FLASH_ATTN_V1 = "vllm.v1.attention.backends.flash_attn.FlashAttentionBackend"  # noqa: E501
+            FLASH_ATTN_V1 = (
+                "vllm.v1.attention.backends.flash_attn.FlashAttentionBackend"  # noqa: E501
+            )
             from vllm.attention.selector import is_attn_backend_supported
+
             is_default_fa_supported = is_attn_backend_supported(
-                FLASH_ATTN_V1, head_size, dtype, allow_import_error=False)
+                FLASH_ATTN_V1, head_size, dtype, allow_import_error=False
+            )
             if is_default_fa_supported:
                 return _Backend.FLASH_ATTN
             else:
@@ -231,83 +235,109 @@ def get_vit_attn_backend(cls, head_size: int,
             return _Backend.XFORMERS
 
     @classmethod
-    def get_attn_backend_cls(cls, selected_backend, head_size, dtype,
-                             kv_cache_dtype, block_size, use_v1, use_mla,
-                             has_sink, use_sparse) -> str:
+    def get_attn_backend_cls(
+        cls,
+        selected_backend,
+        head_size,
+        dtype,
+        kv_cache_dtype,
+        block_size,
+        use_v1,
+        use_mla,
+        has_sink,
+        use_sparse,
+    ) -> str:
         from vllm.attention.backends.registry import _Backend
+
         if use_mla:
             if not use_v1:
                 raise RuntimeError(
                     "MLA attention backends require the V1 engine. "
-                    "Set VLLM_USE_V1=1 to enable them.")
+                    "Set VLLM_USE_V1=1 to enable them."
+                )
 
             from vllm.attention.ops.flashmla import is_flashmla_supported
             from vllm.attention.utils.fa_utils import flash_attn_supports_mla
 
             if use_sparse:
                 logger.info_once("Using Sparse MLA backend on V1 engine.")
-                return ("vllm.v1.attention.backends.mla.flashmla_sparse."
-                        "FlashMLASparseBackend")
+                return (
+                    "vllm.v1.attention.backends.mla.flashmla_sparse."
+                    "FlashMLASparseBackend"
+                )
 
             use_cutlassmla = selected_backend == _Backend.CUTLASS_MLA or (
-                selected_backend is None and cls.is_device_capability(100)
-                and block_size == 128)
+                selected_backend is None
+                and cls.is_device_capability(100)
+                and block_size == 128
+            )
             use_flashinfermla = selected_backend == _Backend.FLASHINFER_MLA or (
-                selected_backend is None and cls.is_device_capability(100)
-                and block_size in [32, 64])
+                selected_backend is None
+                and cls.is_device_capability(100)
+                and block_size in [32, 64]
+            )
             use_flashmla = selected_backend == _Backend.FLASHMLA or (
-                selected_backend is None and is_flashmla_supported()[0])
+                selected_backend is None and is_flashmla_supported()[0]
+            )
             use_flashattn = selected_backend == _Backend.FLASH_ATTN_MLA or (
-                selected_backend is None and flash_attn_supports_mla())
+                selected_backend is None and flash_attn_supports_mla()
+            )
             use_triton = selected_backend == _Backend.TRITON_MLA or (
-                selected_backend is None)
+                selected_backend is None
+            )
 
             if use_cutlassmla:
                 logger.info_once("Using Cutlass MLA backend on V1 engine.")
-                return ("vllm.v1.attention.backends.mla."
-                        "cutlass_mla.CutlassMLABackend")
+                return "vllm.v1.attention.backends.mla.cutlass_mla.CutlassMLABackend"
             if use_flashinfermla:
-                from vllm.v1.attention.backends.utils import (
-                    set_kv_cache_layout)
+                from vllm.v1.attention.backends.utils import set_kv_cache_layout
+
                 set_kv_cache_layout("HND")
                 logger.info_once("Using FlashInfer MLA backend on V1 engine.")
-                return ("vllm.v1.attention.backends.mla."
-                        "flashinfer_mla.FlashInferMLABackend")
+                return (
+                    "vllm.v1.attention.backends.mla.flashinfer_mla.FlashInferMLABackend"
+                )
             if use_flashmla:
                 if block_size != 64:
                     logger.warning(
                         "FlashMLA backend is not supported for block size %d"
                         " (currently only supports block size 64).",
-                        block_size)
+                        block_size,
+                    )
                 else:
                     logger.info_once("Using FlashMLA backend on V1 engine.")
-                    return ("vllm.v1.attention.backends.mla."
-                            "flashmla.FlashMLABackend")
+                    return "vllm.v1.attention.backends.mla.flashmla.FlashMLABackend"
             if use_flashattn:
-                logger.info_once(
-                    "Using FlashAttention MLA backend on V1 engine.")
-                return ("vllm.v1.attention.backends.mla."
-                        "flashattn_mla.FlashAttnMLABackend")
+                logger.info_once("Using FlashAttention MLA backend on V1 engine.")
+                return (
+                    "vllm.v1.attention.backends.mla.flashattn_mla.FlashAttnMLABackend"
+                )
             if use_triton:
                 logger.info_once("Using Triton MLA backend on V1 engine.")
-                return ("vllm.v1.attention.backends.mla."
-                        "triton_mla.TritonMLABackend")
+                return "vllm.v1.attention.backends.mla.triton_mla.TritonMLABackend"
         if use_v1:
             FLASHINFER_V1 = "vllm.v1.attention.backends.flashinfer.FlashInferBackend"  # noqa: E501
-            FLEX_ATTENTION_V1 = "vllm.v1.attention.backends.flex_attention.FlexAttentionBackend"  # noqa: E501
-            TRITON_ATTN = "vllm.v1.attention.backends.triton_attn.TritonAttentionBackend"  # noqa: E501
-            FLASH_ATTN_V1 = "vllm.v1.attention.backends.flash_attn.FlashAttentionBackend"  # noqa: E501
+            FLEX_ATTENTION_V1 = (
+                "vllm.v1.attention.backends.flex_attention.FlexAttentionBackend"  # noqa: E501
+            )
+            TRITON_ATTN = (
+                "vllm.v1.attention.backends.triton_attn.TritonAttentionBackend"  # noqa: E501
+            )
+            FLASH_ATTN_V1 = (
+                "vllm.v1.attention.backends.flash_attn.FlashAttentionBackend"  # noqa: E501
+            )
             TREE_ATTN_V1 = "vllm.v1.attention.backends.tree_attn.TreeAttentionBackend"  # noqa: E501
             XFORMERS_V1 = "vllm.v1.attention.backends.xformers.XFormersAttentionBackend"  # noqa: E501
 
-            use_fp8_kv_cache = (kv_cache_dtype is not None
-                                and kv_cache_dtype.startswith("fp8"))
+            use_fp8_kv_cache = kv_cache_dtype is not None and kv_cache_dtype.startswith(
+                "fp8"
+            )
 
             if selected_backend == _Backend.FLASHINFER:
                 logger.info_once("Using FlashInfer backend on V1 engine.")
                 if cls.has_device_capability(100):
-                    from vllm.v1.attention.backends.utils import (
-                        set_kv_cache_layout)
+                    from vllm.v1.attention.backends.utils import set_kv_cache_layout
+
                     set_kv_cache_layout("HND")
                 return FLASHINFER_V1
             elif selected_backend == _Backend.FLEX_ATTENTION:
@@ -332,13 +362,14 @@ def get_attn_backend_cls(cls, selected_backend, head_size, dtype,
             # Prefer FlashInfer for Blackwell GPUs if installed
             if cls.is_device_capability(100):
                 if is_default_backend_supported := is_attn_backend_supported(
-                        FLASHINFER_V1, head_size, dtype):
-                    from vllm.v1.attention.backends.utils import (
-                        set_kv_cache_layout)
+                    FLASHINFER_V1, head_size, dtype
+                ):
+                    from vllm.v1.attention.backends.utils import set_kv_cache_layout
 
                     logger.info_once(
                         "Using FlashInfer backend with HND KV cache layout on "
-                        "V1 engine by default for Blackwell (SM 10.0) GPUs.")
+                        "V1 engine by default for Blackwell (SM 10.0) GPUs."
+                    )
                     set_kv_cache_layout("HND")
 
                     return FLASHINFER_V1
@@ -347,19 +378,18 @@ def get_attn_backend_cls(cls, selected_backend, head_size, dtype,
                     logger.warning_once(
                         "FlashInfer failed to import for V1 engine on "
                         "Blackwell (SM 10.0) GPUs; it is recommended to "
-                        "install FlashInfer for better performance.")
+                        "install FlashInfer for better performance."
+                    )
 
             # FlashAttention is the default for SM 8.0+ GPUs
             if cls.has_device_capability(80):
-                if (has_sink or
-                        use_fp8_kv_cache) and not cls.is_device_capability(90):
+                if (has_sink or use_fp8_kv_cache) and not cls.is_device_capability(90):
                     logger.info_once("Using Triton backend on V1 engine.")
                     return TRITON_ATTN
                 elif is_default_backend_supported := is_attn_backend_supported(
-                        FLASH_ATTN_V1, head_size, dtype,
-                        allow_import_error=False):
-                    logger.info_once("Using Flash Attention backend on "
-                                     "V1 engine.")
+                    FLASH_ATTN_V1, head_size, dtype, allow_import_error=False
+                ):
+                    logger.info_once("Using Flash Attention backend on V1 engine.")
                     return FLASH_ATTN_V1
 
             # FlexAttention is the default for older GPUs
@@ -377,14 +407,14 @@ def get_attn_backend_cls(cls, selected_backend, head_size, dtype,
 
             logger.info_once(
                 "Using FlexAttention backend for %s on V1 engine.",
-                ", ".join(f"{k}={v}"
-                          for k, v in use_flex_attention_reason.items()),
+                ", ".join(f"{k}={v}" for k, v in use_flex_attention_reason.items()),
             )
             return FLEX_ATTENTION_V1
 
         raise RuntimeError(
             "V0 attention backends have been removed. Set VLLM_USE_V1=1 "
-            "to select a supported backend.")
+            "to select a supported backend."
+        )
 
     @classmethod
     def get_punica_wrapper(cls) -> str:
@@ -392,7 +422,9 @@ def get_punica_wrapper(cls) -> str:
 
     @classmethod
     def get_device_communicator_cls(cls) -> str:
-        return "vllm.distributed.device_communicators.cuda_communicator.CudaCommunicator"  # noqa
+        return (
+            "vllm.distributed.device_communicators.cuda_communicator.CudaCommunicator"  # noqa
+        )
 
     @classmethod
     def supports_fp8(cls) -> bool:
@@ -430,8 +462,9 @@ def stateless_init_device_torch_dist_pg(
         backend_options = ProcessGroupNCCL.Options()
         backend_options._timeout = timeout
 
-        backend_class = ProcessGroupNCCL(prefix_store, group_rank, group_size,
-                                         backend_options)
+        backend_class = ProcessGroupNCCL(
+            prefix_store, group_rank, group_size, backend_options
+        )
         backend_type = ProcessGroup.BackendType.NCCL
         device = torch.device("cuda")
         pg._set_default_backend(backend_type)
@@ -445,8 +478,9 @@ def device_count(cls) -> int:
         return cuda_device_count_stateless()
 
     @classmethod
-    def is_kv_cache_dtype_supported(cls, kv_cache_dtype: str,
-                                    model_config: "ModelConfig") -> bool:
+    def is_kv_cache_dtype_supported(
+        cls, kv_cache_dtype: str, model_config: "ModelConfig"
+    ) -> bool:
         fp8_attention = kv_cache_dtype.startswith("fp8")
         attention_backend = envs.VLLM_ATTENTION_BACKEND
 
@@ -461,12 +495,10 @@ def is_kv_cache_dtype_supported(cls, kv_cache_dtype: str,
                     attention_backend = "FLASHMLA"
 
             # Only FlashMLA and CUTLASS_MLA support fp8
-            if attention_backend in [
-                    "FLASHMLA", "CUTLASS_MLA", "FLASHINFER_MLA"
-            ]:
+            if attention_backend in ["FLASHMLA", "CUTLASS_MLA", "FLASHINFER_MLA"]:
                 supported = True
             else:
-                supported = (not fp8_attention)
+                supported = not fp8_attention
         else:
             # Default to FlashAttention
             if attention_backend is None:
@@ -477,8 +509,8 @@ def is_kv_cache_dtype_supported(cls, kv_cache_dtype: str,
                 supported = True
             elif attention_backend == "FLASH_ATTN":
                 if fp8_attention:
-                    from vllm.attention.utils.fa_utils import (
-                        flash_attn_supports_fp8)
+                    from vllm.attention.utils.fa_utils import flash_attn_supports_fp8
+
                     supported = flash_attn_supports_fp8()
                 else:
                     supported = True
@@ -506,7 +538,8 @@ def check_if_supports_dtype(cls, torch_dtype: torch.dtype):
                     "with compute capability of at least 8.0. "
                     f"Your {gpu_name} GPU {compute_str}. "
                     "You can use float16 instead by explicitly setting the "
-                    "`dtype` flag in CLI, for example: --dtype=half.")
+                    "`dtype` flag in CLI, for example: --dtype=half."
+                )
 
     @classmethod
     def insert_blocks_to_device(
@@ -546,13 +579,10 @@ def support_static_graph_mode(cls) -> bool:
 # all the related functions work on real physical device ids.
 # the major benefit of using NVML is that it will not initialize CUDA
 class NvmlCudaPlatform(CudaPlatformBase):
-
     @classmethod
     @cache
     @with_nvml_context
-    def get_device_capability(cls,
-                              device_id: int = 0
-                              ) -> Optional[DeviceCapability]:
+    def get_device_capability(cls, device_id: int = 0) -> Optional[DeviceCapability]:
         try:
             physical_device_id = cls.device_id_to_physical_device_id(device_id)
             handle = pynvml.nvmlDeviceGetHandleByIndex(physical_device_id)
@@ -599,9 +629,7 @@ def is_fully_connected(cls, physical_device_ids: list[int]) -> bool:
         """
         query if the set of gpus are fully connected by nvlink (1 hop)
         """
-        handles = [
-            pynvml.nvmlDeviceGetHandleByIndex(i) for i in physical_device_ids
-        ]
+        handles = [pynvml.nvmlDeviceGetHandleByIndex(i) for i in physical_device_ids]
         for i, handle in enumerate(handles):
             for j, peer_handle in enumerate(handles):
                 if i < j:
@@ -616,7 +644,8 @@ def is_fully_connected(cls, physical_device_ids: list[int]) -> bool:
                     except pynvml.NVMLError:
                         logger.exception(
                             "NVLink detection failed. This is normal if"
-                            " your machine has no NVLink equipped.")
+                            " your machine has no NVLink equipped."
+                        )
                         return False
         return True
 
@@ -630,11 +659,11 @@ def _get_physical_device_name(cls, device_id: int = 0) -> str:
     def log_warnings(cls):
         device_ids: int = pynvml.nvmlDeviceGetCount()
         if device_ids > 1:
-            device_names = [
-                cls._get_physical_device_name(i) for i in range(device_ids)
-            ]
-            if (len(set(device_names)) > 1
-                    and os.environ.get("CUDA_DEVICE_ORDER") != "PCI_BUS_ID"):
+            device_names = [cls._get_physical_device_name(i) for i in range(device_ids)]
+            if (
+                len(set(device_names)) > 1
+                and os.environ.get("CUDA_DEVICE_ORDER") != "PCI_BUS_ID"
+            ):
                 logger.warning(
                     "Detected different devices in the system: %s. Please"
                     " make sure to set `CUDA_DEVICE_ORDER=PCI_BUS_ID` to "
@@ -644,7 +673,6 @@ def log_warnings(cls):
 
 
 class NonNvmlCudaPlatform(CudaPlatformBase):
-
     @classmethod
     @cache
     def get_device_capability(cls, device_id: int = 0) -> DeviceCapability:
@@ -664,7 +692,8 @@ def get_device_total_memory(cls, device_id: int = 0) -> int:
     def is_fully_connected(cls, physical_device_ids: list[int]) -> bool:
         logger.exception(
             "NVLink detection not possible, as context support was"
-            " not found. Assuming no NVLink available.")
+            " not found. Assuming no NVLink available."
+        )
         return False
 
 
diff --git a/vllm/platforms/interface.py b/vllm/platforms/interface.py
index dd51030e4d5c..59bc9173958c 100644
--- a/vllm/platforms/interface.py
+++ b/vllm/platforms/interface.py
@@ -156,8 +156,10 @@ def device_id_to_physical_device_id(cls, device_id: int):
         # Treat empty device control env var as unset. This is a valid
         # configuration in Ray setups where the engine is launched in
         # a CPU-only placement group located on a GPU node.
-        if cls.device_control_env_var in os.environ and os.environ[
-                cls.device_control_env_var] != "":
+        if (
+            cls.device_control_env_var in os.environ
+            and os.environ[cls.device_control_env_var] != ""
+        ):
             device_ids = os.environ[cls.device_control_env_var].split(",")
             physical_device_id = device_ids[device_id]
             return int(physical_device_id)
@@ -166,7 +168,7 @@ def device_id_to_physical_device_id(cls, device_id: int):
 
     @classmethod
     def import_core_kernels(cls) -> None:
-        """ Import any platform-specific C kernels. """
+        """Import any platform-specific C kernels."""
         try:
             import vllm._C  # noqa: F401
         except ImportError as e:
@@ -174,23 +176,32 @@ def import_core_kernels(cls) -> None:
 
     @classmethod
     def try_import_moe_kernels(cls) -> bool:
-        """ Import any platform-specific MoE kernels. """
+        """Import any platform-specific MoE kernels."""
         with contextlib.suppress(ImportError):
             import vllm._moe_C  # noqa: F401
+
             return True
         return False
 
     @classmethod
-    def get_vit_attn_backend(cls, head_size: int,
-                             dtype: torch.dtype) -> "_Backend":
+    def get_vit_attn_backend(cls, head_size: int, dtype: torch.dtype) -> "_Backend":
         from vllm.attention.backends.registry import _Backend
+
         return _Backend.TORCH_SDPA
 
     @classmethod
-    def get_attn_backend_cls(cls, selected_backend: "_Backend", head_size: int,
-                             dtype: torch.dtype, kv_cache_dtype: Optional[str],
-                             block_size: int, use_v1: bool, use_mla: bool,
-                             has_sink: bool, use_sparse: bool) -> str:
+    def get_attn_backend_cls(
+        cls,
+        selected_backend: "_Backend",
+        head_size: int,
+        dtype: torch.dtype,
+        kv_cache_dtype: Optional[str],
+        block_size: int,
+        use_v1: bool,
+        use_mla: bool,
+        has_sink: bool,
+        use_sparse: bool,
+    ) -> str:
         """Get the attention backend class of a device."""
         return ""
 
@@ -296,9 +307,9 @@ def set_device(cls, device: torch.device) -> None:
         raise NotImplementedError
 
     @classmethod
-    def pre_register_and_update(cls,
-                                parser: Optional[FlexibleArgumentParser] = None
-                                ) -> None:
+    def pre_register_and_update(
+        cls, parser: Optional[FlexibleArgumentParser] = None
+    ) -> None:
         """
         Do some pre-registration or update action for the current platform.
 
@@ -341,11 +352,10 @@ def verify_quantization(cls, quant: str) -> None:
         """
         Verify whether the quantization is supported by the current platform.
         """
-        if cls.supported_quantization and \
-            quant not in cls.supported_quantization:
+        if cls.supported_quantization and quant not in cls.supported_quantization:
             raise ValueError(
-                f"{quant} quantization is currently not supported in "
-                f"{cls.device_name}.")
+                f"{quant} quantization is currently not supported in {cls.device_name}."
+            )
 
     @classmethod
     def get_cpu_architecture(cls) -> CpuArchEnum:
@@ -374,15 +384,17 @@ def is_pin_memory_available(cls) -> bool:
         if in_wsl():
             # Pinning memory in WSL is not supported.
             # https://docs.nvidia.com/cuda/wsl-user-guide/index.html#known-limitations-for-linux-cuda-applications
-            logger.warning("Using 'pin_memory=False' as WSL is detected. "
-                           "This may slow down the performance.")
+            logger.warning(
+                "Using 'pin_memory=False' as WSL is detected. "
+                "This may slow down the performance."
+            )
             return False
         return True
 
     @classmethod
-    def get_current_memory_usage(cls,
-                                 device: Optional[torch.types.Device] = None
-                                 ) -> float:
+    def get_current_memory_usage(
+        cls, device: Optional[torch.types.Device] = None
+    ) -> float:
         """
         Return the memory usage in bytes.
         """
@@ -469,9 +481,10 @@ def use_all_gather(cls) -> bool:
         from vllm.config import get_current_vllm_config
 
         parallel_config = get_current_vllm_config().parallel_config
-        return (envs.VLLM_USE_V1
-                or parallel_config.distributed_executor_backend
-                == "external_launcher")
+        return (
+            envs.VLLM_USE_V1
+            or parallel_config.distributed_executor_backend == "external_launcher"
+        )
 
     @classmethod
     def use_custom_allreduce(cls) -> bool:
@@ -502,8 +515,11 @@ def __getattr__(self, key: str):
         if device is not None and hasattr(device, key):
             return getattr(device, key)
         else:
-            logger.warning("Current platform %s does not have '%s'" \
-            " attribute.", self.device_type, key)
+            logger.warning(
+                "Current platform %s does not have '%s' attribute.",
+                self.device_type,
+                key,
+            )
             return None
 
     def get_global_graph_pool(self) -> Any:
@@ -544,8 +560,9 @@ def stateless_init_device_torch_dist_pg(
         raise RuntimeError(f"Unsupported torch distributed backend: {backend}")
 
     @classmethod
-    def is_kv_cache_dtype_supported(cls, kv_cache_dtype: str,
-                                    model_config: "ModelConfig") -> bool:
+    def is_kv_cache_dtype_supported(
+        cls, kv_cache_dtype: str, model_config: "ModelConfig"
+    ) -> bool:
         """
         Returns if the kv_cache_dtype is supported by the current platform.
         """
@@ -598,7 +615,7 @@ def _synced_weight_loader(param, *args, **kwargs):
     @classmethod
     def get_nixl_supported_devices(cls) -> dict[str, tuple[str, ...]]:
         """
-        Returns a mapping from device_type to a tuple of supported 
+        Returns a mapping from device_type to a tuple of supported
         kv_buffer_device for nixl.
         """
         return {}
diff --git a/vllm/platforms/rocm.py b/vllm/platforms/rocm.py
index de3df03d1fa0..80e7b849c0ed 100644
--- a/vllm/platforms/rocm.py
+++ b/vllm/platforms/rocm.py
@@ -25,9 +25,14 @@
 logger = init_logger(__name__)
 
 try:
-    from amdsmi import (AmdSmiException, amdsmi_get_gpu_asic_info,
-                        amdsmi_get_processor_handles, amdsmi_init,
-                        amdsmi_shut_down, amdsmi_topo_get_link_type)
+    from amdsmi import (
+        AmdSmiException,
+        amdsmi_get_gpu_asic_info,
+        amdsmi_get_processor_handles,
+        amdsmi_init,
+        amdsmi_shut_down,
+        amdsmi_topo_get_link_type,
+    )
 except ImportError as e:
     logger.warning("Failed to import from amdsmi with %r", e)
 
@@ -47,24 +52,24 @@
 
 # Models partially supported by ROCm.
 # Architecture -> Reason.
-_ROCM_SWA_REASON = ("Sliding window attention (SWA) is not yet supported in "
-                    "Triton flash attention. For half-precision SWA support, "
-                    "please use CK flash attention by setting "
-                    "`VLLM_USE_TRITON_FLASH_ATTN=0`")
+_ROCM_SWA_REASON = (
+    "Sliding window attention (SWA) is not yet supported in "
+    "Triton flash attention. For half-precision SWA support, "
+    "please use CK flash attention by setting "
+    "`VLLM_USE_TRITON_FLASH_ATTN=0`"
+)
 _ROCM_PARTIALLY_SUPPORTED_MODELS: dict[str, str] = {
-    "Qwen2ForCausalLM":
-    _ROCM_SWA_REASON,
-    "MistralForCausalLM":
-    _ROCM_SWA_REASON,
-    "MixtralForCausalLM":
-    _ROCM_SWA_REASON,
-    "PaliGemmaForConditionalGeneration":
-    ("ROCm flash attention does not yet "
-     "fully support 32-bit precision on PaliGemma"),
-    "Phi3VForCausalLM":
-    ("ROCm Triton flash attention may run into compilation errors due to "
-     "excessive use of shared memory. If this happens, disable Triton FA "
-     "by setting `VLLM_USE_TRITON_FLASH_ATTN=0`")
+    "Qwen2ForCausalLM": _ROCM_SWA_REASON,
+    "MistralForCausalLM": _ROCM_SWA_REASON,
+    "MixtralForCausalLM": _ROCM_SWA_REASON,
+    "PaliGemmaForConditionalGeneration": (
+        "ROCm flash attention does not yet fully support 32-bit precision on PaliGemma"
+    ),
+    "Phi3VForCausalLM": (
+        "ROCm Triton flash attention may run into compilation errors due to "
+        "excessive use of shared memory. If this happens, disable Triton FA "
+        "by setting `VLLM_USE_TRITON_FLASH_ATTN=0`"
+    ),
 }
 _ROCM_DEVICE_ID_NAME_MAP: dict[str, str] = {
     "0x74a0": "AMD_Instinct_MI300A",
@@ -91,7 +96,6 @@
 
 
 def with_amdsmi_context(fn):
-
     @wraps(fn)
     def wrapper(*args, **kwargs):
         amdsmi_init()
@@ -129,16 +133,16 @@ def on_gfx950() -> bool:
 
 @cache
 def use_rocm_custom_paged_attention(
-        qtype: torch.dtype,
-        head_size: int,
-        block_size: int,
-        gqa_ratio: int,
-        max_seq_len: int,
-        sliding_window: int,
-        kv_cache_dtype: str,
-        alibi_slopes: Optional[torch.Tensor] = None,
-        sinks: Optional[torch.Tensor] = None) -> bool:
-
+    qtype: torch.dtype,
+    head_size: int,
+    block_size: int,
+    gqa_ratio: int,
+    max_seq_len: int,
+    sliding_window: int,
+    kv_cache_dtype: str,
+    alibi_slopes: Optional[torch.Tensor] = None,
+    sinks: Optional[torch.Tensor] = None,
+) -> bool:
     GPU_ARCH = torch.cuda.get_device_properties("cuda").gcnArchName
     ON_GFX9 = any(arch in GPU_ARCH for arch in ["gfx90a", "gfx942", "gfx950"])
     ON_GFX11_GFX12 = any(arch in GPU_ARCH for arch in ["gfx11", "gfx12"])
@@ -146,26 +150,36 @@ def use_rocm_custom_paged_attention(
     # custom paged attn always supported on V0. On V1, requires sliding window
     # disabled due to observed numerical discrepancy.
     if ON_GFX9:
-        return ((not envs.VLLM_USE_V1 or sliding_window == 0
-                 or sliding_window == (-1, -1))
-                and (qtype == torch.half or qtype == torch.bfloat16)
-                and (head_size == 64 or head_size == 128)
-                and (block_size == 16 or block_size == 32)
-                and (gqa_ratio >= 1 and gqa_ratio <= 16)
-                and max_seq_len <= 128 * 1024
-                and (envs.VLLM_ROCM_CUSTOM_PAGED_ATTN)
-                and not (envs.VLLM_ROCM_USE_AITER_PAGED_ATTN
-                         and envs.VLLM_ROCM_USE_AITER) and sinks is None)
+        return (
+            (not envs.VLLM_USE_V1 or sliding_window == 0 or sliding_window == (-1, -1))
+            and (qtype == torch.half or qtype == torch.bfloat16)
+            and (head_size == 64 or head_size == 128)
+            and (block_size == 16 or block_size == 32)
+            and (gqa_ratio >= 1 and gqa_ratio <= 16)
+            and max_seq_len <= 128 * 1024
+            and (envs.VLLM_ROCM_CUSTOM_PAGED_ATTN)
+            and not (envs.VLLM_ROCM_USE_AITER_PAGED_ATTN and envs.VLLM_ROCM_USE_AITER)
+            and sinks is None
+        )
 
     else:
-        return (ON_GFX11_GFX12 and (not envs.VLLM_USE_V1 or sliding_window == 0
-                                    or sliding_window == (-1, -1))
-                and (qtype == torch.half or qtype == torch.bfloat16)
-                and head_size == 128 and block_size == 16
-                and (gqa_ratio >= 3 and gqa_ratio <= 16)
-                and max_seq_len <= 128 * 1024 and alibi_slopes is None
-                and kv_cache_dtype == "auto"
-                and envs.VLLM_ROCM_CUSTOM_PAGED_ATTN and sinks is None)
+        return (
+            ON_GFX11_GFX12
+            and (
+                not envs.VLLM_USE_V1
+                or sliding_window == 0
+                or sliding_window == (-1, -1)
+            )
+            and (qtype == torch.half or qtype == torch.bfloat16)
+            and head_size == 128
+            and block_size == 16
+            and (gqa_ratio >= 3 and gqa_ratio <= 16)
+            and max_seq_len <= 128 * 1024
+            and alibi_slopes is None
+            and kv_cache_dtype == "auto"
+            and envs.VLLM_ROCM_CUSTOM_PAGED_ATTN
+            and sinks is None
+        )
 
 
 class RocmPlatform(Platform):
@@ -179,86 +193,112 @@ class RocmPlatform(Platform):
     device_control_env_var: str = "CUDA_VISIBLE_DEVICES"
 
     supported_quantization: list[str] = [
-        "awq", "gptq", "fp8", "compressed-tensors", "fbgemm_fp8", "gguf",
-        "quark", "ptpc_fp8", "mxfp4", "petit_nvfp4", "torchao"
+        "awq",
+        "gptq",
+        "fp8",
+        "compressed-tensors",
+        "fbgemm_fp8",
+        "gguf",
+        "quark",
+        "ptpc_fp8",
+        "mxfp4",
+        "petit_nvfp4",
+        "torchao",
     ]
 
     @classmethod
-    def get_vit_attn_backend(cls, head_size: int,
-                             dtype: torch.dtype) -> "_Backend":
+    def get_vit_attn_backend(cls, head_size: int, dtype: torch.dtype) -> "_Backend":
         from vllm.attention.backends.registry import _Backend
-        if (envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_MHA
-                and on_gfx9()):
+
+        if envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_MHA and on_gfx9():
             return _Backend.ROCM_AITER_FA
         if on_gfx9():
             return _Backend.FLASH_ATTN
         return _Backend.TORCH_SDPA
 
     @classmethod
-    def get_attn_backend_cls(cls, selected_backend, head_size, dtype,
-                             kv_cache_dtype, block_size, use_v1, use_mla,
-                             has_sink, use_sparse) -> str:
+    def get_attn_backend_cls(
+        cls,
+        selected_backend,
+        head_size,
+        dtype,
+        kv_cache_dtype,
+        block_size,
+        use_v1,
+        use_mla,
+        has_sink,
+        use_sparse,
+    ) -> str:
         from vllm.attention.backends.registry import _Backend
+
         if use_sparse:
-            raise NotImplementedError(
-                "Sparse Attention is not supported on ROCm.")
+            raise NotImplementedError("Sparse Attention is not supported on ROCm.")
         if use_mla:
             if not use_v1:
                 raise RuntimeError(
                     "MLA attention backends require the V1 engine. "
-                    "Set VLLM_USE_V1=1 to enable them.")
+                    "Set VLLM_USE_V1=1 to enable them."
+                )
 
             from vllm.v1.attention.backends.mla.rocm_aiter_mla import (
-                is_aiter_mla_enabled)
+                is_aiter_mla_enabled,
+            )
 
             if selected_backend is None:
-                selected_backend = (_Backend.ROCM_AITER_MLA if
-                                    is_aiter_mla_enabled() or block_size == 1
-                                    else _Backend.TRITON_MLA)
+                selected_backend = (
+                    _Backend.ROCM_AITER_MLA
+                    if is_aiter_mla_enabled() or block_size == 1
+                    else _Backend.TRITON_MLA
+                )
 
             if selected_backend == _Backend.TRITON_MLA:
                 if block_size != 1:
                     logger.info_once("Using Triton MLA backend on V1 engine.")
-                    return ("vllm.v1.attention.backends.mla."
-                            "triton_mla.TritonMLABackend")
+                    return "vllm.v1.attention.backends.mla.triton_mla.TritonMLABackend"
                 raise ValueError(
                     f" The selected backend, {selected_backend.name},"
-                    f"does not support block size {block_size}.")
+                    f"does not support block size {block_size}."
+                )
             if selected_backend == _Backend.ROCM_AITER_MLA:
                 if block_size == 1:
                     logger.info("Using AITER MLA backend on V1 engine.")
-                    return "vllm.v1.attention.backends.mla.rocm_aiter_mla.AiterMLABackend"  # noqa: E501
+                    return (
+                        "vllm.v1.attention.backends.mla.rocm_aiter_mla.AiterMLABackend"  # noqa: E501
+                    )
                 raise ValueError(
                     f" The selected backend, {selected_backend.name},"
                     f"does not support block size {block_size}."
-                    "(currently only supports block size 1)")
+                    "(currently only supports block size 1)"
+                )
             raise ValueError(
                 f" The selected backend, {selected_backend.name},"
-                f"is not MLA type while requested for MLA backend.")
+                f"is not MLA type while requested for MLA backend."
+            )
 
         if envs.VLLM_USE_V1:
-            if envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_MHA \
-                and on_gfx9():
+            if envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_MHA and on_gfx9():
                 logger.info("Using Flash Attention backend on V1 engine.")
-                return ("vllm.v1.attention.backends."
-                        "rocm_aiter_fa.AiterFlashAttentionBackend")
-            elif (envs.VLLM_ROCM_USE_AITER and
-                envs.VLLM_USE_AITER_UNIFIED_ATTENTION) or \
-                    envs.VLLM_V1_USE_PREFILL_DECODE_ATTENTION or \
-                        selected_backend == _Backend.ROCM_ATTN:
+                return (
+                    "vllm.v1.attention.backends."
+                    "rocm_aiter_fa.AiterFlashAttentionBackend"
+                )
+            elif (
+                (envs.VLLM_ROCM_USE_AITER and envs.VLLM_USE_AITER_UNIFIED_ATTENTION)
+                or envs.VLLM_V1_USE_PREFILL_DECODE_ATTENTION
+                or selected_backend == _Backend.ROCM_ATTN
+            ):
                 # rocm specific backend, with aiter and/or
                 #   triton prefix-prefill
                 logger.info("Using Rocm/Aiter Attention backend on V1 engine.")
-                return ("vllm.v1.attention.backends."
-                        "rocm_attn.RocmAttentionBackend")
+                return "vllm.v1.attention.backends.rocm_attn.RocmAttentionBackend"
             else:
                 # default case, using triton unified attention
                 logger.info("Using Triton Attention backend on V1 engine.")
-                return ("vllm.v1.attention.backends."
-                        "triton_attn.TritonAttentionBackend")
+                return "vllm.v1.attention.backends.triton_attn.TritonAttentionBackend"
         raise RuntimeError(
             "V0 attention backends have been removed. Set VLLM_USE_V1=1 "
-            "to select a supported backend.")
+            "to select a supported backend."
+        )
 
     @classmethod
     def set_device(cls, device: torch.device) -> None:
@@ -269,9 +309,7 @@ def set_device(cls, device: torch.device) -> None:
 
     @classmethod
     @lru_cache(maxsize=8)
-    def get_device_capability(cls,
-                              device_id: int = 0
-                              ) -> Optional[DeviceCapability]:
+    def get_device_capability(cls, device_id: int = 0) -> Optional[DeviceCapability]:
         major, minor = torch.cuda.get_device_capability(device_id)
         return DeviceCapability(major=major, minor=minor)
 
@@ -281,21 +319,17 @@ def is_fully_connected(cls, physical_device_ids: list[int]) -> bool:
         """
         Query if the set of gpus are fully connected by xgmi (1 hop)
         """
-        handles = [
-            amdsmi_get_processor_handles()[i] for i in physical_device_ids
-        ]
+        handles = [amdsmi_get_processor_handles()[i] for i in physical_device_ids]
         for i, handle in enumerate(handles):
             for j, peer_handle in enumerate(handles):
                 if i < j:
                     try:
-                        link_type = amdsmi_topo_get_link_type(
-                            handle, peer_handle)
+                        link_type = amdsmi_topo_get_link_type(handle, peer_handle)
                         # type is 2 for XGMI
                         if link_type["hops"] != 1 or link_type["type"] != 2:
                             return False
                     except AmdSmiException as error:
-                        logger.error("AMD 1 hop XGMI detection failed.",
-                                     exc_info=error)
+                        logger.error("AMD 1 hop XGMI detection failed.", exc_info=error)
                         return False
         return True
 
@@ -326,8 +360,9 @@ def check_and_update_config(cls, vllm_config: "VllmConfig") -> None:
         is_eager_execution = compilation_config == CUDAGraphMode.NONE
 
         use_v1 = envs.VLLM_USE_V1
-        use_aiter_rms_norm = envs.VLLM_ROCM_USE_AITER and \
-             envs.VLLM_ROCM_USE_AITER_RMSNORM
+        use_aiter_rms_norm = (
+            envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_RMSNORM
+        )
 
         if cache_config and cache_config.block_size is None:
             cache_config.block_size = 16
@@ -335,21 +370,28 @@ def check_and_update_config(cls, vllm_config: "VllmConfig") -> None:
         if parallel_config.worker_cls == "auto":
             parallel_config.worker_cls = "vllm.v1.worker.gpu_worker.Worker"
         #  Aiter rms norm perform best when CUDA Graph capture is enabled.
-        if (use_v1 and use_aiter_rms_norm and not is_eager_execution
-                and "-rms_norm" not in compilation_config.custom_ops):
+        if (
+            use_v1
+            and use_aiter_rms_norm
+            and not is_eager_execution
+            and "-rms_norm" not in compilation_config.custom_ops
+        ):
             compilation_config.custom_ops.append("+rms_norm")
 
     @classmethod
     def verify_model_arch(cls, model_arch: str) -> None:
         if model_arch in _ROCM_UNSUPPORTED_MODELS:
-            raise ValueError(f"Model architecture '{model_arch}' is not "
-                             "supported by ROCm for now.")
+            raise ValueError(
+                f"Model architecture '{model_arch}' is not supported by ROCm for now."
+            )
 
         if model_arch in _ROCM_PARTIALLY_SUPPORTED_MODELS:
             msg = _ROCM_PARTIALLY_SUPPORTED_MODELS[model_arch]
             logger.warning(
-                "Model architecture '%s' is partially "
-                "supported by ROCm: %s", model_arch, msg)
+                "Model architecture '%s' is partially supported by ROCm: %s",
+                model_arch,
+                msg,
+            )
 
     @classmethod
     def verify_quantization(cls, quant: str) -> None:
@@ -357,7 +399,8 @@ def verify_quantization(cls, quant: str) -> None:
         if quant == "awq" and not envs.VLLM_USE_TRITON_AWQ:
             logger.warning(
                 "Using AWQ quantization with ROCm, but VLLM_USE_TRITON_AWQ"
-                " is not set, enabling VLLM_USE_TRITON_AWQ.")
+                " is not set, enabling VLLM_USE_TRITON_AWQ."
+            )
         envs.VLLM_USE_TRITON_AWQ = True
 
     @classmethod
@@ -365,16 +408,17 @@ def get_punica_wrapper(cls) -> str:
         return "vllm.lora.punica_wrapper.punica_gpu.PunicaWrapperGPU"
 
     @classmethod
-    def get_current_memory_usage(cls,
-                                 device: Optional[torch.types.Device] = None
-                                 ) -> float:
+    def get_current_memory_usage(
+        cls, device: Optional[torch.types.Device] = None
+    ) -> float:
         torch.cuda.reset_peak_memory_stats(device)
-        return torch.cuda.mem_get_info(device)[1] - torch.cuda.mem_get_info(
-            device)[0]
+        return torch.cuda.mem_get_info(device)[1] - torch.cuda.mem_get_info(device)[0]
 
     @classmethod
     def get_device_communicator_cls(cls) -> str:
-        return "vllm.distributed.device_communicators.cuda_communicator.CudaCommunicator"  # noqa
+        return (
+            "vllm.distributed.device_communicators.cuda_communicator.CudaCommunicator"  # noqa
+        )
 
     @classmethod
     def supports_mx(cls) -> bool:
@@ -384,12 +428,12 @@ def supports_mx(cls) -> bool:
     @classmethod
     def supports_fp8(cls) -> bool:
         gcn_arch = torch.cuda.get_device_properties(0).gcnArchName
-        return any(gfx in gcn_arch for gfx in ['gfx94', 'gfx95', 'gfx12'])
+        return any(gfx in gcn_arch for gfx in ["gfx94", "gfx95", "gfx12"])
 
     @classmethod
     def is_fp8_fnuz(cls) -> bool:
         # only device 0 is checked, this assumes MI300 platforms are homogeneous
-        return 'gfx94' in torch.cuda.get_device_properties(0).gcnArchName
+        return "gfx94" in torch.cuda.get_device_properties(0).gcnArchName
 
     @classmethod
     def fp8_dtype(cls) -> torch.dtype:
@@ -402,7 +446,7 @@ def fp8_dtype(cls) -> torch.dtype:
     def use_custom_allreduce(cls) -> bool:
         # We only enable custom allreduce for MI300 series
         gcn_arch = torch.cuda.get_device_properties(0).gcnArchName
-        supported_archs = ['gfx94', 'gfx95']
+        supported_archs = ["gfx94", "gfx95"]
         return any(gfx in gcn_arch for gfx in supported_archs)
 
     @classmethod
@@ -411,12 +455,11 @@ def opaque_attention_op(cls) -> bool:
 
     @classmethod
     def get_cu_count(cls, device_id: int = 0) -> int:
-        return torch.cuda.get_device_properties(
-            device_id).multi_processor_count
+        return torch.cuda.get_device_properties(device_id).multi_processor_count
 
     @classmethod
     def is_navi(cls) -> bool:
-        return 'gfx1' in torch.cuda.get_device_properties(0).gcnArchName
+        return "gfx1" in torch.cuda.get_device_properties(0).gcnArchName
 
     @classmethod
     def get_static_graph_wrapper_cls(cls) -> str:
@@ -442,8 +485,9 @@ def stateless_init_device_torch_dist_pg(
         backend_options = ProcessGroupNCCL.Options()
         backend_options._timeout = timeout
 
-        backend_class = ProcessGroupNCCL(prefix_store, group_rank, group_size,
-                                         backend_options)
+        backend_class = ProcessGroupNCCL(
+            prefix_store, group_rank, group_size, backend_options
+        )
         backend_type = ProcessGroup.BackendType.NCCL
         device = torch.device("cuda")
         pg._set_default_backend(backend_type)
@@ -457,8 +501,9 @@ def device_count(cls) -> int:
         return cuda_device_count_stateless()
 
     @classmethod
-    def is_kv_cache_dtype_supported(cls, kv_cache_dtype: str,
-                                    model_config: "ModelConfig") -> bool:
+    def is_kv_cache_dtype_supported(
+        cls, kv_cache_dtype: str, model_config: "ModelConfig"
+    ) -> bool:
         return True
 
     @classmethod
@@ -479,7 +524,8 @@ def check_if_supports_dtype(cls, torch_dtype: torch.dtype):
                     "with compute capability of at least 8.0. "
                     f"Your {gpu_name} GPU {compute_str}. "
                     "You can use float16 instead by explicitly setting the "
-                    "`dtype` flag in CLI, for example: --dtype=half.")
+                    "`dtype` flag in CLI, for example: --dtype=half."
+                )
 
     @classmethod
     def support_hybrid_kv_cache(cls) -> bool:
diff --git a/vllm/platforms/tpu.py b/vllm/platforms/tpu.py
index 34b7dedbecc7..6be9ca1298a9 100644
--- a/vllm/platforms/tpu.py
+++ b/vllm/platforms/tpu.py
@@ -39,27 +39,31 @@ class TpuPlatform(Platform):
     device_control_env_var: str = "TPU_VISIBLE_CHIPS"
     simple_compile_backend: str = "openxla"
 
-    supported_quantization: list[str] = [
-        "fp8", "tpu_int8", "compressed-tensors"
-    ]
+    supported_quantization: list[str] = ["fp8", "tpu_int8", "compressed-tensors"]
 
-    additional_env_vars: list[str] = [
-        "TPU_CHIPS_PER_HOST_BOUNDS", "TPU_HOST_BOUNDS"
-    ]
+    additional_env_vars: list[str] = ["TPU_CHIPS_PER_HOST_BOUNDS", "TPU_HOST_BOUNDS"]
 
     @classmethod
     def import_core_kernels(cls) -> None:
         pass
 
     @classmethod
-    def get_attn_backend_cls(cls, selected_backend: "_Backend", head_size: int,
-                             dtype: torch.dtype, kv_cache_dtype: Optional[str],
-                             block_size: int, use_v1: bool, use_mla: bool,
-                             has_sink, use_sparse) -> str:
+    def get_attn_backend_cls(
+        cls,
+        selected_backend: "_Backend",
+        head_size: int,
+        dtype: torch.dtype,
+        kv_cache_dtype: Optional[str],
+        block_size: int,
+        use_v1: bool,
+        use_mla: bool,
+        has_sink,
+        use_sparse,
+    ) -> str:
         from vllm.attention.backends.registry import _Backend
+
         if use_sparse:
-            raise NotImplementedError(
-                "Sparse Attention is not supported on TPU.")
+            raise NotImplementedError("Sparse Attention is not supported on TPU.")
         if selected_backend != _Backend.PALLAS:
             logger.info("Cannot use %s backend on TPU.", selected_backend)
 
@@ -116,34 +120,43 @@ def check_and_update_config(cls, vllm_config: VllmConfig) -> None:
 
         # TPU only supports DYNAMO_ONCE compilation level
         if compilation_config.level != CompilationLevel.DYNAMO_ONCE:
-            logger.info("[TPU] Forcing DYNAMO_ONCE compilation level, and "
-                        "disabling cudagraph.")
+            logger.info(
+                "[TPU] Forcing DYNAMO_ONCE compilation level, and disabling cudagraph."
+            )
             compilation_config.level = CompilationLevel.DYNAMO_ONCE
 
-        if compilation_config.cudagraph_mode is None or \
-                compilation_config.cudagraph_mode.max_cudagraph_mode() \
-                    != CUDAGraphMode.NONE:
-            logger.info("[TPU] CUDA graph is not supported on TPU, "
-                        "disabling cudagraphs.")
+        if (
+            compilation_config.cudagraph_mode is None
+            or compilation_config.cudagraph_mode.max_cudagraph_mode()
+            != CUDAGraphMode.NONE
+        ):
+            logger.info(
+                "[TPU] CUDA graph is not supported on TPU, disabling cudagraphs."
+            )
             compilation_config.cudagraph_mode = CUDAGraphMode.NONE
 
         if compilation_config.backend == "":
             compilation_config.backend = "openxla"
 
-        assert vllm_config.speculative_config is None, \
+        assert vllm_config.speculative_config is None, (
             "TPU does not support speculative decoding"
+        )
 
         model_config = vllm_config.model_config
-        if model_config is not None and model_config.dtype in (torch.float16,
-                                                               torch.float32):
+        if model_config is not None and model_config.dtype in (
+            torch.float16,
+            torch.float32,
+        ):
             logger.warning(
                 "The TPU backend currently does not support %s. "
-                "Using bfloat16 instead.", model_config.dtype)
+                "Using bfloat16 instead.",
+                model_config.dtype,
+            )
             model_config.dtype = torch.bfloat16
 
         from vllm.v1.attention.backends.pallas import PallasAttentionBackend
-        cache_config.block_size = PallasAttentionBackend.get_page_size(
-            vllm_config)  # type: ignore[assignment]
+
+        cache_config.block_size = PallasAttentionBackend.get_page_size(vllm_config)  # type: ignore[assignment]
 
         parallel_config = vllm_config.parallel_config
         scheduler_config = vllm_config.scheduler_config
@@ -151,24 +164,31 @@ def check_and_update_config(cls, vllm_config: VllmConfig) -> None:
             parallel_config.worker_cls = "vllm.v1.worker.tpu_worker.TPUWorker"
 
         assert not vllm_config.speculative_config, (
-            "Speculative decoding is not yet supported for TPU backend")
+            "Speculative decoding is not yet supported for TPU backend"
+        )
 
-        if scheduler_config.is_multimodal_model and not \
-                scheduler_config.disable_chunked_mm_input:
-            logger.warning("TPU does not support running Multimodal models"\
-            " without setting `--disable_chunked_mm_input`. " \
-            "Forcing --disable_chunked_mm_input.")
+        if (
+            scheduler_config.is_multimodal_model
+            and not scheduler_config.disable_chunked_mm_input
+        ):
+            logger.warning(
+                "TPU does not support running Multimodal models"
+                " without setting `--disable_chunked_mm_input`. "
+                "Forcing --disable_chunked_mm_input."
+            )
             scheduler_config.disable_chunked_mm_input = True
 
         if model_config and model_config.use_mla:
             logger.info(
                 "MLA is enabled on a non-GPU platform; forcing chunked "
-                "prefill and prefix caching to be disabled.")
+                "prefill and prefix caching to be disabled."
+            )
             vllm_config.scheduler_config.enable_chunked_prefill = False
             vllm_config.scheduler_config.chunked_prefill_enabled = False
             vllm_config.scheduler_config.max_num_batched_tokens = max(
                 vllm_config.scheduler_config.max_model_len,
-                DEFAULT_MAX_NUM_BATCHED_TOKENS)
+                DEFAULT_MAX_NUM_BATCHED_TOKENS,
+            )
 
     @classmethod
     def is_pin_memory_available(cls):
@@ -191,13 +211,16 @@ def validate_request(
         processed_inputs: ProcessorInputs,
     ) -> None:
         """Raises if this request is unsupported on this platform"""
-        if (isinstance(params, SamplingParams)
-                and params.sampling_type == SamplingType.RANDOM_SEED):
+        if (
+            isinstance(params, SamplingParams)
+            and params.sampling_type == SamplingType.RANDOM_SEED
+        ):
             raise ValueError("Torch XLA does not support per-request seed.")
 
     @classmethod
-    def is_kv_cache_dtype_supported(cls, kv_cache_dtype: str,
-                                    model_config: "ModelConfig") -> bool:
+    def is_kv_cache_dtype_supported(
+        cls, kv_cache_dtype: str, model_config: "ModelConfig"
+    ) -> bool:
         return True
 
     @classmethod
@@ -210,8 +233,7 @@ def insert_blocks_to_device(
         dst_block_indices: torch.Tensor,
     ) -> None:
         torch.ops.xla.dynamo_set_buffer_donor_(dst_cache, True)
-        dst_cache[dst_block_indices] = src_cache[src_block_indices].to(
-            dst_cache.device)
+        dst_cache[dst_block_indices] = src_cache[src_block_indices].to(dst_cache.device)
 
     @classmethod
     @torch.compile(backend="openxla")
@@ -222,7 +244,7 @@ def swap_out_blocks_to_host(
         src_block_indices: torch.Tensor,
         dst_block_indices: torch.Tensor,
     ) -> None:
-        """ tpu blocks to cpu blocks"""
+        """tpu blocks to cpu blocks"""
         torch.ops.xla.dynamo_set_buffer_donor_(src_cache, True)
         dst_cache[dst_block_indices] = src_cache[src_block_indices].cpu()
 
@@ -233,6 +255,7 @@ def use_sync_weight_loader(cls) -> bool:
 
 try:
     from tpu_commons.platforms import TpuPlatform as TpuCommonsPlatform
+
     TpuPlatform = TpuCommonsPlatform  # type: ignore
     USE_TPU_COMMONS = True
 except ImportError:
diff --git a/vllm/platforms/xpu.py b/vllm/platforms/xpu.py
index 3efd498cf58e..2f2f3ab8b9d9 100644
--- a/vllm/platforms/xpu.py
+++ b/vllm/platforms/xpu.py
@@ -39,14 +39,22 @@ def import_core_kernels(cls) -> None:
         pass
 
     @classmethod
-    def get_attn_backend_cls(cls, selected_backend: "_Backend", head_size: int,
-                             dtype: torch.dtype, kv_cache_dtype: Optional[str],
-                             block_size: int, use_v1: bool, use_mla: bool,
-                             has_sink: bool, use_sparse) -> str:
+    def get_attn_backend_cls(
+        cls,
+        selected_backend: "_Backend",
+        head_size: int,
+        dtype: torch.dtype,
+        kv_cache_dtype: Optional[str],
+        block_size: int,
+        use_v1: bool,
+        use_mla: bool,
+        has_sink: bool,
+        use_sparse,
+    ) -> str:
         from vllm.attention.backends.registry import _Backend
+
         if use_sparse:
-            raise NotImplementedError(
-                "Sparse Attention is not supported on XPU.")
+            raise NotImplementedError("Sparse Attention is not supported on XPU.")
         use_v1 = envs.VLLM_USE_V1
         if not use_v1:
             raise ValueError("XPU backend only supports V1.")
@@ -61,20 +69,24 @@ def get_attn_backend_cls(cls, selected_backend: "_Backend", head_size: int,
         elif selected_backend:
             raise ValueError(
                 f"Invalid attention backend for {cls.device_name}, "
-                f"with use_v1: {use_v1} use_mla: {use_mla}")
+                f"with use_v1: {use_v1} use_mla: {use_mla}"
+            )
 
         logger.info("Using Flash Attention backend on V1 engine.")
         return "vllm.v1.attention.backends.flash_attn.FlashAttentionBackend"
 
     @classmethod
-    def is_kv_cache_dtype_supported(cls, kv_cache_dtype: str,
-                                    model_config: "ModelConfig") -> bool:
+    def is_kv_cache_dtype_supported(
+        cls, kv_cache_dtype: str, model_config: "ModelConfig"
+    ) -> bool:
         """
         Check if the kv_cache_dtype is supported.
         XPU only support fp8 kv cache with triton backend.
         """
-        if envs.is_set("VLLM_ATTENTION_BACKEND") and \
-            envs.VLLM_ATTENTION_BACKEND == "TRITON_ATTN":
+        if (
+            envs.is_set("VLLM_ATTENTION_BACKEND")
+            and envs.VLLM_ATTENTION_BACKEND == "TRITON_ATTN"
+        ):
             return kv_cache_dtype in ["fp8_e4m3", "fp8_e5m2", "fp8"]
 
         return False
@@ -122,12 +134,14 @@ def check_and_update_config(cls, vllm_config: VllmConfig) -> None:
 
         # lazy import to avoid circular import
         from vllm.config import CompilationLevel, CUDAGraphMode
+
         compilation_config = vllm_config.compilation_config
         if compilation_config.compile_sizes is None:
             compilation_config.compile_sizes = []
 
-        assert compilation_config.cudagraph_mode == CUDAGraphMode.NONE, \
+        assert compilation_config.cudagraph_mode == CUDAGraphMode.NONE, (
             "CUDA graph mode should be NONE on XPU"
+        )
 
         if vllm_config.lora_config is not None:
             compilation_config.level = CompilationLevel.NO_COMPILATION
@@ -148,31 +162,38 @@ def check_and_update_config(cls, vllm_config: VllmConfig) -> None:
             if envs.VLLM_WORKER_MULTIPROC_METHOD != "spawn":
                 os.environ["VLLM_WORKER_MULTIPROC_METHOD"] = "spawn"
                 logger.warning(
-                    "Please use spawn as start method if you want to use mp.")
-        elif (parallel_config.distributed_executor_backend != "ray"
-              and parallel_config.distributed_executor_backend != "uni"
-              and parallel_config.distributed_executor_backend
-              != "external_launcher"):
+                    "Please use spawn as start method if you want to use mp."
+                )
+        elif (
+            parallel_config.distributed_executor_backend != "ray"
+            and parallel_config.distributed_executor_backend != "uni"
+            and parallel_config.distributed_executor_backend != "external_launcher"
+        ):
             logger.warning(
                 "%s is not supported on XPU, fallback to ray distributed"
                 " executor backend.",
-                parallel_config.distributed_executor_backend)
+                parallel_config.distributed_executor_backend,
+            )
             parallel_config.distributed_executor_backend = "ray"
 
         if model_config and model_config.use_mla:
             logger.info(
                 "MLA is enabled on a non-GPU platform; forcing chunked "
-                "prefill and prefix caching to be disabled.")
+                "prefill and prefix caching to be disabled."
+            )
             vllm_config.scheduler_config.enable_chunked_prefill = False
             vllm_config.scheduler_config.chunked_prefill_enabled = False
             vllm_config.scheduler_config.max_num_batched_tokens = max(
                 vllm_config.scheduler_config.max_model_len,
-                DEFAULT_MAX_NUM_BATCHED_TOKENS)
+                DEFAULT_MAX_NUM_BATCHED_TOKENS,
+            )
         from vllm.v1.attention.backends.utils import set_kv_cache_layout
 
         set_kv_cache_layout("NHD")
-        logger.info("Setting VLLM_KV_CACHE_LAYOUT to 'NHD' for XPU; "
-                    "only NHD layout is supported by XPU attention kernels.")
+        logger.info(
+            "Setting VLLM_KV_CACHE_LAYOUT to 'NHD' for XPU; "
+            "only NHD layout is supported by XPU attention kernels."
+        )
 
     @classmethod
     def support_hybrid_kv_cache(cls) -> bool:
@@ -187,9 +208,9 @@ def is_pin_memory_available(cls):
         return True
 
     @classmethod
-    def get_current_memory_usage(cls,
-                                 device: Optional[torch.types.Device] = None
-                                 ) -> float:
+    def get_current_memory_usage(
+        cls, device: Optional[torch.types.Device] = None
+    ) -> float:
         torch.xpu.reset_peak_memory_stats(device)
         return torch.xpu.max_memory_allocated(device)
 
@@ -219,7 +240,8 @@ def check_if_supports_dtype(cls, torch_dtype: torch.dtype):
                 raise ValueError(
                     "Intel Arc A770 have bfloat16 accuracy known issue. "
                     "You can use float16 instead by explicitly setting the "
-                    "`dtype` flag in CLI, for example: --dtype=half.")
+                    "`dtype` flag in CLI, for example: --dtype=half."
+                )
 
     @classmethod
     def opaque_attention_op(cls) -> bool:
diff --git a/vllm/plugins/__init__.py b/vllm/plugins/__init__.py
index 1a1760df82c0..0c83d49c4593 100644
--- a/vllm/plugins/__init__.py
+++ b/vllm/plugins/__init__.py
@@ -8,7 +8,7 @@
 
 logger = logging.getLogger(__name__)
 
-DEFAULT_PLUGINS_GROUP = 'vllm.general_plugins'
+DEFAULT_PLUGINS_GROUP = "vllm.general_plugins"
 
 # make sure one process only loads plugins once
 plugins_loaded = False
@@ -16,6 +16,7 @@
 
 def load_plugins_by_group(group: str) -> dict[str, Callable[[], Any]]:
     import sys
+
     if sys.version_info < (3, 10):
         from importlib_metadata import entry_points
     else:
@@ -29,7 +30,7 @@ def load_plugins_by_group(group: str) -> dict[str, Callable[[], Any]]:
         return {}
 
     # Check if the only discovered plugin is the default one
-    is_default_group = (group == DEFAULT_PLUGINS_GROUP)
+    is_default_group = group == DEFAULT_PLUGINS_GROUP
     # Use INFO for non-default groups and DEBUG for the default group
     log_level = logger.debug if is_default_group else logger.info
 
@@ -38,8 +39,10 @@ def load_plugins_by_group(group: str) -> dict[str, Callable[[], Any]]:
         log_level("- %s -> %s", plugin.name, plugin.value)
 
     if allowed_plugins is None:
-        log_level("All plugins in this group will be loaded. "
-                  "Set `VLLM_PLUGINS` to control which plugins to load.")
+        log_level(
+            "All plugins in this group will be loaded. "
+            "Set `VLLM_PLUGINS` to control which plugins to load."
+        )
 
     plugins = dict[str, Callable[[], Any]]()
     for plugin in discovered_plugins:
diff --git a/vllm/plugins/io_processors/__init__.py b/vllm/plugins/io_processors/__init__.py
index 3b17211b1b83..8ec96ed00980 100644
--- a/vllm/plugins/io_processors/__init__.py
+++ b/vllm/plugins/io_processors/__init__.py
@@ -15,8 +15,8 @@
 
 
 def get_io_processor(
-        vllm_config: VllmConfig,
-        plugin_from_init: Optional[str] = None) -> IOProcessor | None:
+    vllm_config: VllmConfig, plugin_from_init: Optional[str] = None
+) -> IOProcessor | None:
     # Input.Output processors are loaded as plugins under the
     # 'vllm.io_processor_plugins' group. Similar to platform
     # plugins, these plugins register a function that returns the class
@@ -39,8 +39,9 @@ def get_io_processor(
     logger.debug("IOProcessor plugin to be loaded %s", model_plugin)
 
     # Load all installed plugin in the group
-    multimodal_data_processor_plugins = \
-        load_plugins_by_group('vllm.io_processor_plugins')
+    multimodal_data_processor_plugins = load_plugins_by_group(
+        "vllm.io_processor_plugins"
+    )
 
     loadable_plugins = {}
     for name, func in multimodal_data_processor_plugins.items():
@@ -54,14 +55,16 @@ def get_io_processor(
 
     num_available_plugins = len(loadable_plugins.keys())
     if num_available_plugins == 0:
-        raise ValueError("No IOProcessor plugins installed"
-                         f" but one is required ({model_plugin}).")
+        raise ValueError(
+            f"No IOProcessor plugins installed but one is required ({model_plugin})."
+        )
 
     if model_plugin not in loadable_plugins:
         raise ValueError(
             f"The model requires the '{model_plugin}' IO Processor plugin "
             "but it is not installed. "
-            f"Available plugins: {list(loadable_plugins.keys())}")
+            f"Available plugins: {list(loadable_plugins.keys())}"
+        )
 
     activated_plugin_cls = loadable_plugins[model_plugin]
 
diff --git a/vllm/plugins/io_processors/interface.py b/vllm/plugins/io_processors/interface.py
index 62b224cac5e5..84af40d01c43 100644
--- a/vllm/plugins/io_processors/interface.py
+++ b/vllm/plugins/io_processors/interface.py
@@ -10,12 +10,11 @@
 from vllm.inputs.data import PromptType
 from vllm.outputs import PoolingRequestOutput
 
-IOProcessorInput = TypeVar('IOProcessorInput')
-IOProcessorOutput = TypeVar('IOProcessorOutput')
+IOProcessorInput = TypeVar("IOProcessorInput")
+IOProcessorOutput = TypeVar("IOProcessorOutput")
 
 
 class IOProcessor(ABC, Generic[IOProcessorInput, IOProcessorOutput]):
-
     def __init__(self, vllm_config: VllmConfig):
         self.vllm_config = vllm_config
 
@@ -37,10 +36,12 @@ async def pre_process_async(
         return self.pre_process(prompt, request_id, **kwargs)
 
     @abstractmethod
-    def post_process(self,
-                     model_output: Sequence[PoolingRequestOutput],
-                     request_id: Optional[str] = None,
-                     **kwargs) -> IOProcessorOutput:
+    def post_process(
+        self,
+        model_output: Sequence[PoolingRequestOutput],
+        request_id: Optional[str] = None,
+        **kwargs,
+    ) -> IOProcessorOutput:
         raise NotImplementedError
 
     async def post_process_async(
@@ -52,8 +53,9 @@ async def post_process_async(
         # We cannot guarantee outputs are returned in the same order they were
         # fed to vLLM.
         # Let's sort them by id before post_processing
-        sorted_output = sorted([(i, item) async for i, item in model_output],
-                               key=lambda output: output[0])
+        sorted_output = sorted(
+            [(i, item) async for i, item in model_output], key=lambda output: output[0]
+        )
         collected_output = [output[1] for output in sorted_output]
         return self.post_process(collected_output, request_id, **kwargs)
 
@@ -63,5 +65,6 @@ def parse_request(self, request: Any) -> IOProcessorInput:
 
     @abstractmethod
     def output_to_response(
-            self, plugin_output: IOProcessorOutput) -> IOProcessorResponse:
+        self, plugin_output: IOProcessorOutput
+    ) -> IOProcessorResponse:
         raise NotImplementedError
diff --git a/vllm/plugins/lora_resolvers/filesystem_resolver.py b/vllm/plugins/lora_resolvers/filesystem_resolver.py
index b999d07a6eb7..c3255af45702 100644
--- a/vllm/plugins/lora_resolvers/filesystem_resolver.py
+++ b/vllm/plugins/lora_resolvers/filesystem_resolver.py
@@ -10,25 +10,29 @@
 
 
 class FilesystemResolver(LoRAResolver):
-
     def __init__(self, lora_cache_dir: str):
         self.lora_cache_dir = lora_cache_dir
 
-    async def resolve_lora(self, base_model_name: str,
-                           lora_name: str) -> Optional[LoRARequest]:
+    async def resolve_lora(
+        self, base_model_name: str, lora_name: str
+    ) -> Optional[LoRARequest]:
         lora_path = os.path.join(self.lora_cache_dir, lora_name)
         if os.path.exists(lora_path):
-            adapter_config_path = os.path.join(self.lora_cache_dir, lora_name,
-                                               "adapter_config.json")
+            adapter_config_path = os.path.join(
+                self.lora_cache_dir, lora_name, "adapter_config.json"
+            )
             if os.path.exists(adapter_config_path):
                 with open(adapter_config_path) as file:
                     adapter_config = json.load(file)
-                if adapter_config["peft_type"] == "LORA" and adapter_config[
-                        "base_model_name_or_path"] == base_model_name:
-                    lora_request = LoRARequest(lora_name=lora_name,
-                                               lora_int_id=abs(
-                                                   hash(lora_name)),
-                                               lora_path=lora_path)
+                if (
+                    adapter_config["peft_type"] == "LORA"
+                    and adapter_config["base_model_name_or_path"] == base_model_name
+                ):
+                    lora_request = LoRARequest(
+                        lora_name=lora_name,
+                        lora_int_id=abs(hash(lora_name)),
+                        lora_path=lora_path,
+                    )
                     return lora_request
         return None
 
@@ -38,13 +42,12 @@ def register_filesystem_resolver():
 
     lora_cache_dir = envs.VLLM_LORA_RESOLVER_CACHE_DIR
     if lora_cache_dir:
-        if not os.path.exists(lora_cache_dir) or not os.path.isdir(
-                lora_cache_dir):
+        if not os.path.exists(lora_cache_dir) or not os.path.isdir(lora_cache_dir):
             raise ValueError(
                 "VLLM_LORA_RESOLVER_CACHE_DIR must be set to a valid directory \
-                for Filesystem Resolver plugin to function")
+                for Filesystem Resolver plugin to function"
+            )
         fs_resolver = FilesystemResolver(lora_cache_dir)
-        LoRAResolverRegistry.register_resolver("Filesystem Resolver",
-                                               fs_resolver)
+        LoRAResolverRegistry.register_resolver("Filesystem Resolver", fs_resolver)
 
     return
diff --git a/vllm/pooling_params.py b/vllm/pooling_params.py
index a6313367457a..f7a53503e584 100644
--- a/vllm/pooling_params.py
+++ b/vllm/pooling_params.py
@@ -14,16 +14,17 @@
 
 
 class PoolingParams(
-        msgspec.Struct,
-        omit_defaults=True,  # type: ignore[call-arg]
-        array_like=True):  # type: ignore[call-arg]
+    msgspec.Struct,
+    omit_defaults=True,  # type: ignore[call-arg]
+    array_like=True,
+):  # type: ignore[call-arg]
     """API parameters for pooling models.
 
     Attributes:
         truncate_prompt_tokens: Controls prompt truncation.
             Set to -1 to use the model's default truncation size.
             Set to k to keep only the last k tokens (left truncation).
-            Set to None to disable truncation.         
+            Set to None to disable truncation.
         normalize: Whether to normalize the embeddings outputs.
         dimensions: Reduce the dimensions of embeddings
             if model support matryoshka representation.
@@ -33,8 +34,7 @@ class PoolingParams(
     """
 
     # --8<-- [start:common-pooling-params]
-    truncate_prompt_tokens: Optional[Annotated[int,
-                                               msgspec.Meta(ge=-1)]] = None
+    truncate_prompt_tokens: Optional[Annotated[int, msgspec.Meta(ge=-1)]] = None
     # --8<-- [end:common-pooling-params]
 
     ## for embeddings models
@@ -67,8 +67,12 @@ class PoolingParams(
     @property
     def all_parameters(self) -> list[str]:
         return [
-            "dimensions", "normalize", "activation", "softmax", "step_tag_id",
-            "returned_token_ids"
+            "dimensions",
+            "normalize",
+            "activation",
+            "softmax",
+            "step_tag_id",
+            "returned_token_ids",
         ]
 
     @property
@@ -84,10 +88,9 @@ def clone(self) -> "PoolingParams":
         """Returns a deep copy of the PoolingParams instance."""
         return deepcopy(self)
 
-    def verify(self,
-               task: PoolingTask,
-               model_config: Optional["ModelConfig"] = None) -> None:
-
+    def verify(
+        self, task: PoolingTask, model_config: Optional["ModelConfig"] = None
+    ) -> None:
         if self.task is None:
             self.task = task
         elif self.task != task:
@@ -102,10 +105,9 @@ def verify(self,
         self._set_default_parameters(model_config)
         self._verify_valid_parameters()
 
-    def _merge_default_parameters(self,
-                                  model_config: Optional["ModelConfig"] = None
-                                  ) -> None:
-
+    def _merge_default_parameters(
+        self, model_config: Optional["ModelConfig"] = None
+    ) -> None:
         if model_config is None:
             return
 
@@ -132,8 +134,8 @@ def _set_default_parameters(self, model_config: Optional["ModelConfig"]):
                 if not model_config.is_matryoshka:
                     raise ValueError(
                         f'Model "{model_config.served_model_name}" does not '
-                        f'support matryoshka representation, '
-                        f'changing output dimensions will lead to poor results.'
+                        f"support matryoshka representation, "
+                        f"changing output dimensions will lead to poor results."
                     )
 
                 mds = model_config.matryoshka_dimensions
@@ -141,9 +143,10 @@ def _set_default_parameters(self, model_config: Optional["ModelConfig"]):
                     if self.dimensions not in mds:
                         raise ValueError(
                             f'Model "{model_config.served_model_name}" '
-                            f'only supports {str(mds)} matryoshka dimensions, '
-                            f'use other output dimensions will '
-                            f'lead to poor results.')
+                            f"only supports {str(mds)} matryoshka dimensions, "
+                            f"use other output dimensions will "
+                            f"lead to poor results."
+                        )
                 elif self.dimensions < 1:
                     raise ValueError("Dimensions must be greater than 0")
 
@@ -172,20 +175,24 @@ def _verify_valid_parameters(self):
             raise ValueError(
                 f"Task {self.task} only supports {valid_parameters} "
                 f"parameters, does not support "
-                f"{invalid_parameters} parameters")
+                f"{invalid_parameters} parameters"
+            )
 
     def __repr__(self) -> str:
-        return (f"PoolingParams("
-                f"task={self.task}, "
-                f"normalize={self.normalize}, "
-                f"dimensions={self.dimensions}, "
-                f"activation={self.activation}, "
-                f"softmax={self.softmax}, "
-                f"step_tag_id={self.step_tag_id}, "
-                f"returned_token_ids={self.returned_token_ids}, "
-                f"requires_token_ids={self.requires_token_ids}, "
-                f"extra_kwargs={self.extra_kwargs})")
+        return (
+            f"PoolingParams("
+            f"task={self.task}, "
+            f"normalize={self.normalize}, "
+            f"dimensions={self.dimensions}, "
+            f"activation={self.activation}, "
+            f"softmax={self.softmax}, "
+            f"step_tag_id={self.step_tag_id}, "
+            f"returned_token_ids={self.returned_token_ids}, "
+            f"requires_token_ids={self.requires_token_ids}, "
+            f"extra_kwargs={self.extra_kwargs})"
+        )
 
     def __post_init__(self) -> None:
-        assert self.output_kind == RequestOutputKind.FINAL_ONLY,\
+        assert self.output_kind == RequestOutputKind.FINAL_ONLY, (
             "For pooling output_kind has to be FINAL_ONLY"
+        )
diff --git a/vllm/profiler/layerwise_profile.py b/vllm/profiler/layerwise_profile.py
index 41136f738c28..fea299b287f9 100644
--- a/vllm/profiler/layerwise_profile.py
+++ b/vllm/profiler/layerwise_profile.py
@@ -12,21 +12,26 @@
 from torch.autograd.profiler import FunctionEvent
 from torch.profiler import ProfilerActivity, profile
 
-from vllm.profiler.utils import (TablePrinter, event_has_module,
-                                 event_is_torch_op, event_module_repr,
-                                 event_torch_op_stack_trace, indent_string)
+from vllm.profiler.utils import (
+    TablePrinter,
+    event_has_module,
+    event_is_torch_op,
+    event_module_repr,
+    event_torch_op_stack_trace,
+    indent_string,
+)
 
 
 @dataclass
 class _ModuleTreeNode:
     event: _ProfilerEvent
-    parent: Optional['_ModuleTreeNode'] = None
-    children: list['_ModuleTreeNode'] = field(default_factory=list)
+    parent: Optional["_ModuleTreeNode"] = None
+    children: list["_ModuleTreeNode"] = field(default_factory=list)
     trace: str = ""
 
     @property
     def is_leaf(self):
-        return (self.event.children is None or len(self.event.children) == 0)
+        return self.event.children is None or len(self.event.children) == 0
 
     @property
     def is_torch_op(self):
@@ -34,8 +39,10 @@ def is_torch_op(self):
 
     @property
     def is_cuda(self):
-        return (self.event.tag == _EventType.Kineto
-                and self.event.typed[1].device_type == DeviceType.CUDA)
+        return (
+            self.event.tag == _EventType.Kineto
+            and self.event.typed[1].device_type == DeviceType.CUDA
+        )
 
 
 @dataclass
@@ -68,8 +75,7 @@ class _StatsTreeNode:
 @dataclass
 class LayerwiseProfileResults(profile):
     _kineto_results: _ProfilerResult
-    _kineto_event_correlation_map: dict[int,
-                                        list[_KinetoEvent]] = field(init=False)
+    _kineto_event_correlation_map: dict[int, list[_KinetoEvent]] = field(init=False)
     _event_correlation_map: dict[int, list[FunctionEvent]] = field(init=False)
     _module_tree: list[_ModuleTreeNode] = field(init=False)
     _model_stats_tree: list[_StatsTreeNode] = field(init=False)
@@ -84,11 +90,9 @@ def __post_init__(self):
         self._build_stats_trees()
 
     def print_model_table(self, column_widths: dict[str, int] = None):
-        _column_widths = dict(name=60,
-                              cpu_time_us=12,
-                              cuda_time_us=12,
-                              pct_cuda_time=12,
-                              trace=60)
+        _column_widths = dict(
+            name=60, cpu_time_us=12, cuda_time_us=12, pct_cuda_time=12, trace=60
+        )
         if column_widths:
             _column_widths.update(**column_widths)
         filtered_model_table = [
@@ -99,78 +103,76 @@ def print_model_table(self, column_widths: dict[str, int] = None):
         TablePrinter(ModelStatsEntry, _column_widths).print_table(
             self._indent_row_names_based_on_depth(
                 filtered_model_table,
-                indent_style=lambda indent: "|" + "-" * indent + " "))
+                indent_style=lambda indent: "|" + "-" * indent + " ",
+            )
+        )
 
     def print_summary_table(self, column_widths: dict[str, int] = None):
-        _column_widths = dict(name=80,
-                              cuda_time_us=12,
-                              pct_cuda_time=12,
-                              invocations=15)
+        _column_widths = dict(
+            name=80, cuda_time_us=12, pct_cuda_time=12, invocations=15
+        )
         if column_widths:
             _column_widths.update(**column_widths)
-        filtered_summary_table = [(depth, row)
-                                  for depth, row in self._flatten_stats_tree(
-                                      self._summary_stats_tree)
-                                  if row.cuda_time_us > 0]
+        filtered_summary_table = [
+            (depth, row)
+            for depth, row in self._flatten_stats_tree(self._summary_stats_tree)
+            if row.cuda_time_us > 0
+        ]
         TablePrinter(SummaryStatsEntry, _column_widths).print_table(
             self._indent_row_names_based_on_depth(
                 filtered_summary_table,
-                indent_style=lambda indent: "|" + "-" * indent + " "))
+                indent_style=lambda indent: "|" + "-" * indent + " ",
+            )
+        )
 
     def export_model_stats_table_csv(self, filename: str):
-        df = pd.DataFrame([
-            asdict(row)
-            for _, row in self._flatten_stats_tree(self._model_stats_tree)
-        ])
+        df = pd.DataFrame(
+            [asdict(row) for _, row in self._flatten_stats_tree(self._model_stats_tree)]
+        )
         df.to_csv(filename)
 
     def export_summary_stats_table_csv(self, filename: str):
-        df = pd.DataFrame([
-            asdict(row)
-            for _, row in self._flatten_stats_tree(self._summary_stats_tree)
-        ])
+        df = pd.DataFrame(
+            [
+                asdict(row)
+                for _, row in self._flatten_stats_tree(self._summary_stats_tree)
+            ]
+        )
         df.to_csv(filename)
 
     def convert_stats_to_dict(self) -> dict[str, Any]:
         return {
-            "metadata": {
-                "num_running_seqs": self.num_running_seqs
-            },
-            "summary_stats":
-            self._convert_stats_tree_to_dict(self._summary_stats_tree),
-            "model_stats":
-            self._convert_stats_tree_to_dict(self._model_stats_tree)
+            "metadata": {"num_running_seqs": self.num_running_seqs},
+            "summary_stats": self._convert_stats_tree_to_dict(self._summary_stats_tree),
+            "model_stats": self._convert_stats_tree_to_dict(self._model_stats_tree),
         }
 
     @staticmethod
-    def _indent_row_names_based_on_depth(depths_rows: list[tuple[int,
-                                                                 StatsEntry]],
-                                         indent_style: Union[Callable[[int],
-                                                                      str],
-                                                             str] = " "):
+    def _indent_row_names_based_on_depth(
+        depths_rows: list[tuple[int, StatsEntry]],
+        indent_style: Union[Callable[[int], str], str] = " ",
+    ):
         indented_rows = []
         for depth, row in depths_rows:
             if row.cuda_time_us == 0:
                 continue
             indented_row = copy.deepcopy(row)
-            indented_row.name = indent_string(indented_row.name, depth,
-                                              indent_style)
+            indented_row.name = indent_string(indented_row.name, depth, indent_style)
             indented_rows.append(indented_row)
         return indented_rows
 
     def _build_correlation_map(self):
         self._kineto_event_correlation_map = defaultdict(list)
         for event in self._kineto_results.events():
-            self._kineto_event_correlation_map[event.correlation_id()].append(
-                event)
+            self._kineto_event_correlation_map[event.correlation_id()].append(event)
 
     def _build_module_tree(self):
         self._module_tree = []
         event_tree = self._kineto_results.experimental_event_tree()
 
-        def _df_traversal(event: _ProfilerEvent,
-                          curr_node: Optional[_ModuleTreeNode] = None):
-
+        def _df_traversal(
+            event: _ProfilerEvent, curr_node: Optional[_ModuleTreeNode] = None
+        ):
             # For the tensor parallel case for now only look at task 1
             if event.start_tid != 1:
                 return
@@ -183,13 +185,15 @@ def _df_traversal(event: _ProfilerEvent,
                     self._module_tree.append(node)
                 curr_node = node
 
-            is_leaf = (event.children is None or len(event.children) == 0)
+            is_leaf = event.children is None or len(event.children) == 0
             if is_leaf and curr_node:
                 node = _ModuleTreeNode(
                     event=event,
                     parent=curr_node,
                     trace=event_torch_op_stack_trace(
-                        event, until=lambda x: event_has_module(x)))
+                        event, until=lambda x: event_has_module(x)
+                    ),
+                )
                 curr_node.children.append(node)
                 curr_node = node
 
@@ -203,31 +207,31 @@ def _get_kineto_gpu_event(self, node: _ModuleTreeNode):
         if node.event.tag != _EventType.Kineto:
             return None
         correlated_kineto_events = self._kineto_event_correlation_map.get(
-            node.event.correlation_id, [])
-        iterator = (x for x in correlated_kineto_events
-                    if x.device_type() == DeviceType.CUDA
-                    and x.name() == node.event.name)
+            node.event.correlation_id, []
+        )
+        iterator = (
+            x
+            for x in correlated_kineto_events
+            if x.device_type() == DeviceType.CUDA and x.name() == node.event.name
+        )
         return next(iterator, None)
 
     def _cumulative_cuda_time(self, node: _ModuleTreeNode):
-        'Return cuda time in microseconds'
+        "Return cuda time in microseconds"
 
         def _cumulative_cuda_time_recursive(node: _ModuleTreeNode):
-            if node.is_leaf and (gpu_kineto_event :=
-                                 self._get_kineto_gpu_event(node)):
+            if node.is_leaf and (gpu_kineto_event := self._get_kineto_gpu_event(node)):
                 return gpu_kineto_event.duration_ns() / 1000.0
             else:
                 cumulative_cuda_time = 0
                 for child in node.children:
-                    cumulative_cuda_time += _cumulative_cuda_time_recursive(
-                        child)
+                    cumulative_cuda_time += _cumulative_cuda_time_recursive(child)
                 return cumulative_cuda_time
 
         return _cumulative_cuda_time_recursive(node)
 
     def _total_cuda_time(self):
-        return sum(
-            [self._cumulative_cuda_time(root) for root in self._module_tree])
+        return sum([self._cumulative_cuda_time(root) for root in self._module_tree])
 
     def _build_stats_trees(self):
         summary_dict: dict[str, _StatsTreeNode] = {}
@@ -239,38 +243,42 @@ def pct_cuda_time(cuda_time_us):
         def build_summary_stats_tree_df(
             node: _ModuleTreeNode,
             parent: Optional[_StatsTreeNode] = None,
-            summary_trace: tuple[str] = ()):
-
+            summary_trace: tuple[str] = (),
+        ):
             if event_has_module(node.event):
                 name = event_module_repr(node.event)
                 cuda_time_us = self._cumulative_cuda_time(node)
-            elif (gpu_kineto_event := self._get_kineto_gpu_event(node)):
+            elif gpu_kineto_event := self._get_kineto_gpu_event(node):
                 name = gpu_kineto_event.name()
                 cuda_time_us = gpu_kineto_event.duration_ns() / 1000.0
             else:
                 return None
 
-            summary_trace = summary_trace + (name, )
+            summary_trace = summary_trace + (name,)
             if summary_trace in summary_dict:
                 entry = summary_dict[summary_trace].entry
                 entry.cuda_time_us += cuda_time_us
                 entry.invocations += 1
                 entry.pct_cuda_time = pct_cuda_time(entry.cuda_time_us)
             else:
-                new_node = _StatsTreeNode(entry=SummaryStatsEntry(
-                    name=name,
-                    cuda_time_us=cuda_time_us,
-                    pct_cuda_time=pct_cuda_time(cuda_time_us),
-                    invocations=1),
-                                          children=[],
-                                          parent=parent)
+                new_node = _StatsTreeNode(
+                    entry=SummaryStatsEntry(
+                        name=name,
+                        cuda_time_us=cuda_time_us,
+                        pct_cuda_time=pct_cuda_time(cuda_time_us),
+                        invocations=1,
+                    ),
+                    children=[],
+                    parent=parent,
+                )
                 if parent:
                     parent.children.append(new_node)
                 summary_dict[summary_trace] = new_node
 
             for child in node.children:
-                build_summary_stats_tree_df(child, summary_dict[summary_trace],
-                                            summary_trace)
+                build_summary_stats_tree_df(
+                    child, summary_dict[summary_trace], summary_trace
+                )
 
             return summary_dict[summary_trace]
 
@@ -278,14 +286,17 @@ def build_summary_stats_tree_df(
         for root in self._module_tree:
             self._summary_stats_tree.append(build_summary_stats_tree_df(root))
 
-        def build_model_stats_tree_df(node: _ModuleTreeNode,
-                                      parent: Optional[_StatsTreeNode] = None):
-            if event_has_module(node.event, ):
+        def build_model_stats_tree_df(
+            node: _ModuleTreeNode, parent: Optional[_StatsTreeNode] = None
+        ):
+            if event_has_module(
+                node.event,
+            ):
                 name = event_module_repr(node.event)
                 cuda_time_us = self._cumulative_cuda_time(node)
                 cpu_time_us = node.event.duration_time_ns / 1000
                 trace = ""
-            elif (gpu_kineto_event := self._get_kineto_gpu_event(node)):
+            elif gpu_kineto_event := self._get_kineto_gpu_event(node):
                 name = gpu_kineto_event.name()
                 cuda_time_us = gpu_kineto_event.duration_ns() / 1000.0
                 cpu_time_us = 0
@@ -293,14 +304,17 @@ def build_model_stats_tree_df(node: _ModuleTreeNode,
             else:
                 return None
 
-            new_node = _StatsTreeNode(entry=ModelStatsEntry(
-                name=name,
-                cpu_time_us=cpu_time_us,
-                cuda_time_us=cuda_time_us,
-                pct_cuda_time=pct_cuda_time(cuda_time_us),
-                trace=trace),
-                                      parent=parent,
-                                      children=[])
+            new_node = _StatsTreeNode(
+                entry=ModelStatsEntry(
+                    name=name,
+                    cpu_time_us=cpu_time_us,
+                    cuda_time_us=cuda_time_us,
+                    pct_cuda_time=pct_cuda_time(cuda_time_us),
+                    trace=trace,
+                ),
+                parent=parent,
+                children=[],
+            )
             if parent:
                 parent.children.append(new_node)
 
@@ -314,7 +328,8 @@ def build_model_stats_tree_df(node: _ModuleTreeNode,
             self._model_stats_tree.append(build_model_stats_tree_df(root))
 
     def _flatten_stats_tree(
-            self, tree: list[_StatsTreeNode]) -> list[tuple[int, StatsEntry]]:
+        self, tree: list[_StatsTreeNode]
+    ) -> list[tuple[int, StatsEntry]]:
         entries: list[tuple[int, StatsEntry]] = []
 
         def df_traversal(node: _StatsTreeNode, depth=0):
@@ -327,15 +342,11 @@ def df_traversal(node: _StatsTreeNode, depth=0):
 
         return entries
 
-    def _convert_stats_tree_to_dict(self,
-                                    tree: list[_StatsTreeNode]) -> list[dict]:
+    def _convert_stats_tree_to_dict(self, tree: list[_StatsTreeNode]) -> list[dict]:
         root_dicts: list[dict] = []
 
         def df_traversal(node: _StatsTreeNode, curr_json_list: list[dict]):
-            curr_json_list.append({
-                "entry": asdict(node.entry),
-                "children": []
-            })
+            curr_json_list.append({"entry": asdict(node.entry), "children": []})
             for child in node.children:
                 df_traversal(child, curr_json_list[-1]["children"])
 
@@ -346,7 +357,6 @@ def df_traversal(node: _StatsTreeNode, curr_json_list: list[dict]):
 
 
 class layerwise_profile(profile):
-
     def __init__(self, num_running_seqs: Optional[int] = None):
         """
         layerwise profile constructor.
@@ -361,7 +371,8 @@ def __init__(self, num_running_seqs: Optional[int] = None):
             record_shapes=True,
             with_stack=True,
             with_modules=True,
-            experimental_config=_ExperimentalConfig(verbose=True))
+            experimental_config=_ExperimentalConfig(verbose=True),
+        )
 
         self.num_running_seqs = num_running_seqs
 
@@ -371,5 +382,5 @@ def __enter__(self):
     def __exit__(self, exc_type, exc_val, exc_tb):
         super().__exit__(exc_type, exc_val, exc_tb)
         self.results = LayerwiseProfileResults(
-            self.profiler.kineto_results,
-            num_running_seqs=self.num_running_seqs)
+            self.profiler.kineto_results, num_running_seqs=self.num_running_seqs
+        )
diff --git a/vllm/profiler/utils.py b/vllm/profiler/utils.py
index 9f0f56a15fd5..b3607fbecde7 100644
--- a/vllm/profiler/utils.py
+++ b/vllm/profiler/utils.py
@@ -30,9 +30,9 @@ def trim_string_back(string, width):
 
 
 class TablePrinter:
-
-    def __init__(self, row_cls: type[dataclasses.dataclass],
-                 column_widths: dict[str, int]):
+    def __init__(
+        self, row_cls: type[dataclasses.dataclass], column_widths: dict[str, int]
+    ):
         self.row_cls = row_cls
         self.fieldnames = [x.name for x in dataclasses.fields(row_cls)]
         self.column_widths = column_widths
@@ -46,16 +46,18 @@ def print_table(self, rows: list[dataclasses.dataclass]):
 
     def _print_header(self):
         for i, f in enumerate(self.fieldnames):
-            last = (i == len(self.fieldnames) - 1)
+            last = i == len(self.fieldnames) - 1
             col_width = self.column_widths[f]
-            print(trim_string_back(f, col_width).ljust(col_width),
-                  end=" | " if not last else "\n")
+            print(
+                trim_string_back(f, col_width).ljust(col_width),
+                end=" | " if not last else "\n",
+            )
 
     def _print_row(self, row):
         assert isinstance(row, self.row_cls)
 
         for i, f in enumerate(self.fieldnames):
-            last = (i == len(self.fieldnames) - 1)
+            last = i == len(self.fieldnames) - 1
             col_width = self.column_widths[f]
             val = getattr(row, f)
 
@@ -75,9 +77,9 @@ def _print_line(self):
         print("=" * (total_col_width + 3 * (len(self.column_widths) - 1)))
 
 
-def indent_string(string: str,
-                  indent: int,
-                  indent_style: Union[Callable[[int], str], str] = " ") -> str:
+def indent_string(
+    string: str, indent: int, indent_style: Union[Callable[[int], str], str] = " "
+) -> str:
     if indent:
         if isinstance(indent_style, str):
             return indent_style * indent + string
@@ -111,15 +113,14 @@ def event_arg_repr(arg) -> str:
     elif isinstance(arg, tuple):
         return f"({', '.join([event_arg_repr(x) for x in arg])})"
     else:
-        assert isinstance(arg,
-                          _TensorMetadata), f"Unsupported type: {type(arg)}"
-        sizes_str = ', '.join([str(x) for x in arg.sizes])
+        assert isinstance(arg, _TensorMetadata), f"Unsupported type: {type(arg)}"
+        sizes_str = ", ".join([str(x) for x in arg.sizes])
         return f"{str(arg.dtype).replace('torch.', '')}[{sizes_str}]"
 
 
 def event_torch_op_repr(event: _ProfilerEvent) -> str:
     assert event.tag == _EventType.TorchOp
-    args_str = ', '.join([event_arg_repr(x) for x in event.typed[1].inputs])
+    args_str = ", ".join([event_arg_repr(x) for x in event.typed[1].inputs])
     return f"{event.name}({args_str})".replace("aten::", "")
 
 
@@ -127,15 +128,17 @@ def event_module_repr(event: _ProfilerEvent) -> str:
     assert event_has_module(event)
     module = event.typed[1].module
     if module.parameters and len(module.parameters) > 0:
-        args_str = ', '.join(
-            [f'{x[0]}={event_arg_repr(x[1])}' for x in module.parameters])
+        args_str = ", ".join(
+            [f"{x[0]}={event_arg_repr(x[1])}" for x in module.parameters]
+        )
         return f"{module.cls_name}({args_str})"
     else:
         return module.cls_name
 
 
-def event_torch_op_stack_trace(curr_event: _ProfilerEvent,
-                               until: Callable[[_ProfilerEvent], bool]) -> str:
+def event_torch_op_stack_trace(
+    curr_event: _ProfilerEvent, until: Callable[[_ProfilerEvent], bool]
+) -> str:
     trace = ""
     curr_event = curr_event.parent
     while curr_event and not until(curr_event):
diff --git a/vllm/ray/lazy_utils.py b/vllm/ray/lazy_utils.py
index bb3535579cfd..64b5f51571a3 100644
--- a/vllm/ray/lazy_utils.py
+++ b/vllm/ray/lazy_utils.py
@@ -6,6 +6,7 @@ def is_ray_initialized():
     """Check if Ray is initialized."""
     try:
         import ray
+
         return ray.is_initialized()
     except ImportError:
         return False
@@ -16,7 +17,10 @@ def is_in_ray_actor():
 
     try:
         import ray
-        return (ray.is_initialized()
-                and ray.get_runtime_context().get_actor_id() is not None)
+
+        return (
+            ray.is_initialized()
+            and ray.get_runtime_context().get_actor_id() is not None
+        )
     except ImportError:
         return False
diff --git a/vllm/ray/ray_env.py b/vllm/ray/ray_env.py
index f6a994bb3c22..a89e55bd7e4b 100644
--- a/vllm/ray/ray_env.py
+++ b/vllm/ray/ray_env.py
@@ -14,7 +14,8 @@
 # This file contains a list of env vars that should not be copied
 # from the driver to the Ray workers.
 RAY_NON_CARRY_OVER_ENV_VARS_FILE = os.path.join(
-    CONFIG_HOME, "ray_non_carry_over_env_vars.json")
+    CONFIG_HOME, "ray_non_carry_over_env_vars.json"
+)
 
 try:
     if os.path.exists(RAY_NON_CARRY_OVER_ENV_VARS_FILE):
@@ -25,13 +26,16 @@
 except json.JSONDecodeError:
     logger.warning(
         "Failed to parse %s. Using an empty set for non-carry-over env vars.",
-        RAY_NON_CARRY_OVER_ENV_VARS_FILE)
+        RAY_NON_CARRY_OVER_ENV_VARS_FILE,
+    )
     RAY_NON_CARRY_OVER_ENV_VARS = set()
 
 
-def get_env_vars_to_copy(exclude_vars: Optional[set[str]] = None,
-                         additional_vars: Optional[set[str]] = None,
-                         destination: Optional[str] = None) -> set[str]:
+def get_env_vars_to_copy(
+    exclude_vars: Optional[set[str]] = None,
+    additional_vars: Optional[set[str]] = None,
+    destination: Optional[str] = None,
+) -> set[str]:
     """
     Get the environment variables to copy to downstream Ray actors.
 
@@ -60,13 +64,17 @@ def get_env_vars_to_copy(exclude_vars: Optional[set[str]] = None,
 
     to_destination = " to " + destination if destination is not None else ""
 
-    logger.info("RAY_NON_CARRY_OVER_ENV_VARS from config: %s",
-                RAY_NON_CARRY_OVER_ENV_VARS)
-    logger.info("Copying the following environment variables%s: %s",
-                to_destination,
-                [v for v in env_vars_to_copy if v in os.environ])
     logger.info(
-        "If certain env vars should NOT be copied, add them to "
-        "%s file", RAY_NON_CARRY_OVER_ENV_VARS_FILE)
+        "RAY_NON_CARRY_OVER_ENV_VARS from config: %s", RAY_NON_CARRY_OVER_ENV_VARS
+    )
+    logger.info(
+        "Copying the following environment variables%s: %s",
+        to_destination,
+        [v for v in env_vars_to_copy if v in os.environ],
+    )
+    logger.info(
+        "If certain env vars should NOT be copied, add them to %s file",
+        RAY_NON_CARRY_OVER_ENV_VARS_FILE,
+    )
 
     return env_vars_to_copy
diff --git a/vllm/reasoning/abs_reasoning_parsers.py b/vllm/reasoning/abs_reasoning_parsers.py
index 320009c2611e..2d93f0702f72 100644
--- a/vllm/reasoning/abs_reasoning_parsers.py
+++ b/vllm/reasoning/abs_reasoning_parsers.py
@@ -13,9 +13,11 @@
 from vllm.utils import import_from_path, is_list_of
 
 if TYPE_CHECKING:
-    from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                                  DeltaMessage,
-                                                  ResponsesRequest)
+    from vllm.entrypoints.openai.protocol import (
+        ChatCompletionRequest,
+        DeltaMessage,
+        ResponsesRequest,
+    )
     from vllm.transformers_utils.tokenizer import AnyTokenizer
 else:
     ChatCompletionRequest = Any
@@ -128,8 +130,7 @@ def get_reasoning_parser(cls, name: str | None) -> type[ReasoningParser]:
         if name in cls.reasoning_parsers:
             return cls.reasoning_parsers[name]
 
-        raise KeyError(
-            f"reasoning helper: '{name}' not found in reasoning_parsers")
+        raise KeyError(f"reasoning helper: '{name}' not found in reasoning_parsers")
 
     @classmethod
     def _register_module(
@@ -139,8 +140,9 @@ def _register_module(
         force: bool = True,
     ) -> None:
         if not issubclass(module, ReasoningParser):
-            raise TypeError("module must be subclass of ReasoningParser, "
-                            f"but got {type(module)}")
+            raise TypeError(
+                f"module must be subclass of ReasoningParser, but got {type(module)}"
+            )
         if module_name is None:
             module_name = module.__name__
         if isinstance(module_name, str):
@@ -148,8 +150,9 @@ def _register_module(
         for name in module_name:
             if not force and name in cls.reasoning_parsers:
                 existed_module = cls.reasoning_parsers[name]
-                raise KeyError(f"{name} is already registered "
-                               f"at {existed_module.__module__}")
+                raise KeyError(
+                    f"{name} is already registered at {existed_module.__module__}"
+                )
             cls.reasoning_parsers[name] = module
 
     @classmethod
@@ -168,11 +171,11 @@ def register_module(
             raise TypeError(f"force must be a boolean, but got {type(force)}")
 
         # raise the error ahead of time
-        if not (name is None or isinstance(name, str)
-                or is_list_of(name, str)):
+        if not (name is None or isinstance(name, str) or is_list_of(name, str)):
             raise TypeError(
                 "name must be None, an instance of str, or a sequence of str, "
-                f"but got {type(name)}")
+                f"but got {type(name)}"
+            )
 
         # use it as a normal method: x.register_module(module=SomeClass)
         if module is not None:
@@ -197,6 +200,7 @@ def import_reasoning_parser(cls, plugin_path: str) -> None:
         try:
             import_from_path(module_name, plugin_path)
         except Exception:
-            logger.exception("Failed to load module '%s' from %s.",
-                             module_name, plugin_path)
+            logger.exception(
+                "Failed to load module '%s' from %s.", module_name, plugin_path
+            )
             return
diff --git a/vllm/reasoning/basic_parsers.py b/vllm/reasoning/basic_parsers.py
index cea4b8601ae7..b4106a4f5794 100644
--- a/vllm/reasoning/basic_parsers.py
+++ b/vllm/reasoning/basic_parsers.py
@@ -5,8 +5,11 @@
 from collections.abc import Sequence
 from typing import Optional, Union
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaMessage, ResponsesRequest)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaMessage,
+    ResponsesRequest,
+)
 from vllm.reasoning.abs_reasoning_parsers import ReasoningParser
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
@@ -14,11 +17,11 @@
 class BaseThinkingReasoningParser(ReasoningParser):
     """
     Base class for reasoning parsers that use thinking tokens.
-    
+
     This class provides common functionality for parsers that use start and end
     tokens to delimit reasoning content (
         e.g., <think>...</think>, <seed:think>...</seed:think>).
-    
+
     Subclasses must implement the start and end tokens via abstract
     properties.
     """
@@ -41,18 +44,19 @@ def __init__(self, tokenizer: AnyTokenizer, *args, **kwargs):
         if not self.model_tokenizer:
             raise ValueError(
                 "The model tokenizer must be passed to the ReasoningParser "
-                "constructor during construction.")
+                "constructor during construction."
+            )
 
         if not self.start_token or not self.end_token:
-            raise ValueError(
-                "start_token and end_token must be defined in subclasses")
+            raise ValueError("start_token and end_token must be defined in subclasses")
 
         self.start_token_id = self.vocab.get(self.start_token)
         self.end_token_id = self.vocab.get(self.end_token)
         if self.start_token_id is None or self.end_token_id is None:
             raise RuntimeError(
                 f"{self.__class__.__name__} reasoning parser could not locate "
-                "think start/end tokens in the tokenizer!")
+                "think start/end tokens in the tokenizer!"
+            )
 
     def is_reasoning_end(self, input_ids: list[int]) -> bool:
         return self.end_token_id in input_ids
@@ -64,7 +68,7 @@ def extract_content_ids(self, input_ids: list[int]) -> list[int]:
         if self.end_token_id not in input_ids[:-1]:
             return []
         else:
-            return input_ids[input_ids.index(self.end_token_id) + 1:]
+            return input_ids[input_ids.index(self.end_token_id) + 1 :]
 
     def extract_reasoning_content_streaming(
         self,
@@ -81,9 +85,9 @@ def extract_reasoning_content_streaming(
         Uses token IDs for faster processing.
         """
         # Skip single special tokens
-        if len(delta_token_ids) == 1 and (delta_token_ids[0] in [
-                self.start_token_id, self.end_token_id
-        ]):
+        if len(delta_token_ids) == 1 and (
+            delta_token_ids[0] in [self.start_token_id, self.end_token_id]
+        ):
             return None
 
         # Check if start token is present in previous or delta.
@@ -94,7 +98,7 @@ def extract_reasoning_content_streaming(
                 # extract reasoning content
                 end_index = delta_text.find(self.end_token)
                 reasoning_content = delta_text[:end_index]
-                content = delta_text[end_index + len(self.end_token):]
+                content = delta_text[end_index + len(self.end_token) :]
                 return DeltaMessage(
                     reasoning_content=reasoning_content,
                     content=content if content else None,
@@ -113,9 +117,10 @@ def extract_reasoning_content_streaming(
                 # extract reasoning content
                 start_index = delta_text.find(self.start_token)
                 end_index = delta_text.find(self.end_token)
-                reasoning_content = delta_text[start_index +
-                                               len(self.start_token):end_index]
-                content = delta_text[end_index + len(self.end_token):]
+                reasoning_content = delta_text[
+                    start_index + len(self.start_token) : end_index
+                ]
+                content = delta_text[end_index + len(self.end_token) :]
                 return DeltaMessage(
                     reasoning_content=reasoning_content,
                     content=content if content else None,
@@ -129,28 +134,27 @@ def extract_reasoning_content_streaming(
             return DeltaMessage(content=delta_text)
 
     def extract_reasoning_content(
-        self, model_output: str, request: Union[ChatCompletionRequest,
-                                                ResponsesRequest]
+        self, model_output: str, request: Union[ChatCompletionRequest, ResponsesRequest]
     ) -> tuple[Optional[str], Optional[str]]:
         """
         Extract reasoning content from the model output.
-        
+
         This is the base implementation that works for most models.
         Subclasses can override this method for specific behavior.
         """
         # Check if the start token is present in the model output, remove it
         # if it is present.
         model_output_parts = model_output.partition(self.start_token)
-        model_output = model_output_parts[2] if model_output_parts[
-            1] else model_output_parts[0]
+        model_output = (
+            model_output_parts[2] if model_output_parts[1] else model_output_parts[0]
+        )
 
         # For models that may not generate start token,
         # assume the reasoning content is always at the start.
         if self.end_token not in model_output:
             return model_output, None
         else:
-            reasoning_content, _, content = model_output.partition(
-                self.end_token)
+            reasoning_content, _, content = model_output.partition(self.end_token)
             # If generation stops right after end-of-think, return null content
             final_content = content or None
             return reasoning_content, final_content
diff --git a/vllm/reasoning/deepseek_r1_reasoning_parser.py b/vllm/reasoning/deepseek_r1_reasoning_parser.py
index 76d2959e1c9a..264da54b4879 100644
--- a/vllm/reasoning/deepseek_r1_reasoning_parser.py
+++ b/vllm/reasoning/deepseek_r1_reasoning_parser.py
@@ -45,14 +45,17 @@ def extract_reasoning_content_streaming(
             current_token_ids,
             delta_token_ids,
         )
-        if (ret is not None and self.start_token_id not in previous_token_ids
-                and self.start_token_id not in delta_token_ids):
+        if (
+            ret is not None
+            and self.start_token_id not in previous_token_ids
+            and self.start_token_id not in delta_token_ids
+        ):
             if self.end_token_id in delta_token_ids:
                 # end token in delta with more tokens,
                 # extract reasoning content and content
                 end_index = delta_text.find(self.end_token)
                 reasoning_content = delta_text[:end_index]
-                content = delta_text[end_index + len(self.end_token):]
+                content = delta_text[end_index + len(self.end_token) :]
                 return DeltaMessage(
                     reasoning_content=reasoning_content,
                     content=content if content else None,
diff --git a/vllm/reasoning/glm4_moe_reasoning_parser.py b/vllm/reasoning/glm4_moe_reasoning_parser.py
index 8d7488afce68..da98515c7e62 100644
--- a/vllm/reasoning/glm4_moe_reasoning_parser.py
+++ b/vllm/reasoning/glm4_moe_reasoning_parser.py
@@ -6,8 +6,7 @@
 
 from transformers import PreTrainedTokenizerBase
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaMessage)
+from vllm.entrypoints.openai.protocol import ChatCompletionRequest, DeltaMessage
 from vllm.logger import init_logger
 from vllm.reasoning import ReasoningParser, ReasoningParserManager
 
@@ -35,17 +34,21 @@ def __init__(self, tokenizer: PreTrainedTokenizerBase, *args, **kwargs):
         if not self.model_tokenizer:
             raise ValueError(
                 "The model tokenizer must be passed to the ReasoningParser "
-                "constructor during construction.")
+                "constructor during construction."
+            )
 
         self.think_start_token_id = self.vocab.get(self.think_start_token)
         self.think_end_token_id = self.vocab.get(self.think_end_token)
         self.assistant_token_id = self.vocab.get(self.assistant_token)
-        if (self.think_start_token_id is None
-                or self.think_end_token_id is None
-                or self.assistant_token_id is None):
+        if (
+            self.think_start_token_id is None
+            or self.think_end_token_id is None
+            or self.assistant_token_id is None
+        ):
             raise RuntimeError(
                 "Glm4MoeModel reasoning parser could not locate "
-                "think start/end or assistant tokens in the tokenizer!")
+                "think start/end or assistant tokens in the tokenizer!"
+            )
 
     def is_reasoning_end(self, input_ids: list[int]) -> bool:
         """
@@ -67,7 +70,7 @@ def extract_content_ids(self, input_ids: list[int]) -> list[int]:
         if self.think_end_token_id not in input_ids[:-1]:
             return []
         else:
-            return input_ids[input_ids.index(self.think_end_token_id) + 1:]
+            return input_ids[input_ids.index(self.think_end_token_id) + 1 :]
 
     def extract_reasoning_content_streaming(
         self,
@@ -87,9 +90,9 @@ def extract_reasoning_content_streaming(
         - 'xyz' goes to content
         """
         # Skip single special tokens
-        if len(delta_token_ids) == 1 and (delta_token_ids[0] in [
-                self.think_start_token_id, self.think_end_token_id
-        ]):
+        if len(delta_token_ids) == 1 and (
+            delta_token_ids[0] in [self.think_start_token_id, self.think_end_token_id]
+        ):
             return None
 
         if self.think_start_token_id in previous_token_ids:
@@ -98,9 +101,11 @@ def extract_reasoning_content_streaming(
                 # extract reasoning content
                 end_index = delta_text.find(self.think_end_token)
                 reasoning_content = delta_text[:end_index]
-                content = delta_text[end_index + len(self.think_end_token):]
-                return DeltaMessage(reasoning_content=reasoning_content,
-                                    content=content if content else None)
+                content = delta_text[end_index + len(self.think_end_token) :]
+                return DeltaMessage(
+                    reasoning_content=reasoning_content,
+                    content=content if content else None,
+                )
             elif self.think_end_token_id in previous_token_ids:
                 # <think> in previous, </think> in previous,
                 # reasoning content continues
@@ -114,12 +119,14 @@ def extract_reasoning_content_streaming(
                 # <think> in delta, </think> in delta, extract reasoning content
                 start_index = delta_text.find(self.think_start_token)
                 end_index = delta_text.find(self.think_end_token)
-                reasoning_content = delta_text[start_index +
-                                               len(self.think_start_token
-                                                   ):end_index]
-                content = delta_text[end_index + len(self.think_end_token):]
-                return DeltaMessage(reasoning_content=reasoning_content,
-                                    content=content if content else None)
+                reasoning_content = delta_text[
+                    start_index + len(self.think_start_token) : end_index
+                ]
+                content = delta_text[end_index + len(self.think_end_token) :]
+                return DeltaMessage(
+                    reasoning_content=reasoning_content,
+                    content=content if content else None,
+                )
             else:
                 # <think> in delta, no </think> in delta,
                 # reasoning content continues
@@ -129,7 +136,7 @@ def extract_reasoning_content_streaming(
             return DeltaMessage(content=delta_text)
 
     def extract_reasoning_content(
-            self, model_output: str, request: ChatCompletionRequest
+        self, model_output: str, request: ChatCompletionRequest
     ) -> tuple[Optional[str], Optional[str]]:
         """
         Extract reasoning content from the model output.
@@ -143,22 +150,24 @@ def extract_reasoning_content(
         """
 
         # Check if the model output contains the <think> and </think> tokens.
-        if (self.think_start_token not in model_output
-                or self.think_end_token not in model_output):
+        if (
+            self.think_start_token not in model_output
+            or self.think_end_token not in model_output
+        ):
             return None, model_output
         # Check if the <think> is present in the model output, remove it
         # if it is present.
         model_output_parts = model_output.partition(self.think_start_token)
-        model_output = model_output_parts[2] if model_output_parts[
-            1] else model_output_parts[0]
+        model_output = (
+            model_output_parts[2] if model_output_parts[1] else model_output_parts[0]
+        )
         # Check if the model output contains the </think> tokens.
         # If the end token is not found, return the model output as is.
         if self.think_end_token not in model_output:
             return None, model_output
 
         # Extract reasoning content from the model output.
-        reasoning_content, _, content = model_output.partition(
-            self.think_end_token)
+        reasoning_content, _, content = model_output.partition(self.think_end_token)
 
         final_content = content or None
         return reasoning_content, final_content
diff --git a/vllm/reasoning/gptoss_reasoning_parser.py b/vllm/reasoning/gptoss_reasoning_parser.py
index b0988d5d2618..738c7b51694a 100644
--- a/vllm/reasoning/gptoss_reasoning_parser.py
+++ b/vllm/reasoning/gptoss_reasoning_parser.py
@@ -7,8 +7,7 @@
 from transformers import PreTrainedTokenizerBase
 
 from vllm.entrypoints.harmony_utils import parse_chat_output
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaMessage)
+from vllm.entrypoints.openai.protocol import ChatCompletionRequest, DeltaMessage
 from vllm.logger import init_logger
 from vllm.reasoning import ReasoningParser, ReasoningParserManager
 
@@ -27,7 +26,8 @@ class GptOssReasoningParser(ReasoningParser):
     def __init__(self, tokenizer: PreTrainedTokenizerBase, *args, **kwargs):
         super().__init__(tokenizer, *args, **kwargs)
         self.reasoning_end_token_ids = self.model_tokenizer.encode(
-            "<|start|>assistant<|channel|>final<|message|>")
+            "<|start|>assistant<|channel|>final<|message|>"
+        )
 
     def is_reasoning_end(self, input_ids: list[int]) -> bool:
         end_token_ids = self.reasoning_end_token_ids
@@ -35,7 +35,7 @@ def is_reasoning_end(self, input_ids: list[int]) -> bool:
         # Check if the end sequence is present in the input_ids.
         # We search from the end of input_ids to find the last match.
         for i in range(len(input_ids) - len(end_token_ids), -1, -1):
-            if input_ids[i:i + len(end_token_ids)] == end_token_ids:
+            if input_ids[i : i + len(end_token_ids)] == end_token_ids:
                 return True
         return False
 
@@ -54,28 +54,25 @@ def extract_reasoning_content_streaming(
         current_token_ids: Sequence[int],
         delta_token_ids: Sequence[int],
     ) -> Union[DeltaMessage, None]:
-        prev_reasoning, prev_content, _ = parse_chat_output(
-            list(previous_token_ids))
-        cur_reasoning, cur_content, _ = parse_chat_output(
-            list(current_token_ids))
+        prev_reasoning, prev_content, _ = parse_chat_output(list(previous_token_ids))
+        cur_reasoning, cur_content, _ = parse_chat_output(list(current_token_ids))
         reasoning_delta = None
         content_delta = None
         if cur_reasoning is not None:
             prev_r = prev_reasoning or ""
             if cur_reasoning.startswith(prev_r):
-                reasoning_delta = cur_reasoning[len(prev_r):] or None
+                reasoning_delta = cur_reasoning[len(prev_r) :] or None
             else:
                 reasoning_delta = cur_reasoning
         if cur_content is not None:
             prev_c = prev_content or ""
             if cur_content.startswith(prev_c):
-                content_delta = cur_content[len(prev_c):] or None
+                content_delta = cur_content[len(prev_c) :] or None
             else:
                 content_delta = cur_content
         if reasoning_delta is None and content_delta is None:
             return None
-        return DeltaMessage(reasoning_content=reasoning_delta,
-                            content=content_delta)
+        return DeltaMessage(reasoning_content=reasoning_delta, content=content_delta)
 
     def extract_reasoning_content(
         self,
diff --git a/vllm/reasoning/granite_reasoning_parser.py b/vllm/reasoning/granite_reasoning_parser.py
index b76170f39f10..543b202989ee 100644
--- a/vllm/reasoning/granite_reasoning_parser.py
+++ b/vllm/reasoning/granite_reasoning_parser.py
@@ -7,8 +7,7 @@
 import regex as re
 from transformers import PreTrainedTokenizerBase
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaMessage)
+from vllm.entrypoints.openai.protocol import ChatCompletionRequest, DeltaMessage
 from vllm.logger import init_logger
 from vllm.reasoning import ReasoningParser, ReasoningParserManager
 
@@ -34,15 +33,14 @@ def __init__(self, tokenizer: PreTrainedTokenizerBase, *args, **kwargs):
         self.response_start_expr = r"(?:Here's|Here is) my response:"
 
         self.reasoning_regex = re.compile(
-            rf"{self.think_start_expr}(.*?){self.response_start_expr}(.*)",
-            re.DOTALL)
+            rf"{self.think_start_expr}(.*?){self.response_start_expr}(.*)", re.DOTALL
+        )
 
         self.valid_think_starts = [
-            "Here's my thought process:", "Here is my thought process:"
-        ]
-        self.valid_response_starts = [
-            "Here's my response:", "Here is my response:"
+            "Here's my thought process:",
+            "Here is my thought process:",
         ]
+        self.valid_response_starts = ["Here's my response:", "Here is my response:"]
 
         # Substrings to match for sequence boundaries on raw text
         self.seq_boundary_end = ":"
@@ -50,10 +48,11 @@ def __init__(self, tokenizer: PreTrainedTokenizerBase, *args, **kwargs):
 
         # The longest any thinking / start of response message can be
         self.longest_think_start = max(
-            len(think_start) for think_start in self.valid_think_starts)
+            len(think_start) for think_start in self.valid_think_starts
+        )
 
     def extract_reasoning_content(
-            self, model_output: str, request: ChatCompletionRequest
+        self, model_output: str, request: ChatCompletionRequest
     ) -> tuple[Optional[str], Optional[str]]:
         """Extract the reasoning content & content sections, respectively.
         If the sequence doesn't match what we expect, i.e., the model generates
@@ -111,24 +110,27 @@ def extract_reasoning_content_streaming(
                 DeltaMessage with either reasoning content or content, or None.
         """
         reasoning_content, resp_seq_len, content = self._get_content_sections(
-            current_text)
+            current_text
+        )
         # Either we haven't finished the start of the reasoning sequence,
         # or the model is generating something unexpected.
         if not reasoning_content:
             delta_message = self._get_delta_message_with_no_reasoning_bounds(
-                current_text, delta_text)
+                current_text, delta_text
+            )
         # We have a start of reasoning message, but have not yet finished
         # the start of response sequence.
         elif not content:
             delta_message = self._get_delta_message_with_no_response_bounds(
-                current_text, reasoning_content, delta_text)
+                current_text, reasoning_content, delta_text
+            )
         # We've finished both the start of reasoning and start of response seq.
         else:
             # This should never happen since we matched on the response
             assert resp_seq_len is not None
             delta_message = self._get_delta_message_with_both_bounds(
-                delta_text, reasoning_content, content, current_text,
-                resp_seq_len)
+                delta_text, reasoning_content, content, current_text, resp_seq_len
+            )
         if not delta_message.content and not delta_message.reasoning_content:
             return None
         return delta_message
@@ -139,26 +141,27 @@ def _is_reasoning_start_substr(self, text: str) -> bool:
 
         Args:
             text (str): Text to check for leading substr.
-        
+
         Returns:
             bool: True if any of the possible reasoning start seqs match.
         """
         return any(
-            think_start.startswith(text)
-            for think_start in self.valid_think_starts)
+            think_start.startswith(text) for think_start in self.valid_think_starts
+        )
 
     def _is_response_start_substr(self, text: str) -> bool:
         """Check if a text matches one of the possible start response seqs.
 
         Args:
             text (str): Text to check for leading substr.
-        
+
         Returns:
             bool: True if any of the possible response start seqs match.
         """
         return any(
             response_start.startswith(text)
-            for response_start in self.valid_response_starts)
+            for response_start in self.valid_response_starts
+        )
 
     def _get_delta_message_with_no_reasoning_bounds(
         self,
@@ -177,8 +180,7 @@ def _get_delta_message_with_no_reasoning_bounds(
         """
         prev_longest_length = len(current_text) - len(delta_text)
         is_substr = self._is_reasoning_start_substr(current_text)
-        was_substr = self._is_reasoning_start_substr(
-            current_text[:prev_longest_length])
+        was_substr = self._is_reasoning_start_substr(current_text[:prev_longest_length])
 
         # Check if we just generated something NOT in the special token seq;
         # if so, add everything that we previously skipped with this delta
@@ -220,12 +222,13 @@ def _get_delta_message_with_no_response_bounds(
         # content and fully parse it out; we should not pass the : back.
         ends_with_start_response_seq = any(
             current_text.endswith(response_start)
-            for response_start in self.valid_response_starts)
+            for response_start in self.valid_response_starts
+        )
         if reasoning_content is None or ends_with_start_response_seq:
             return DeltaMessage(reasoning_content=None, content=None)
 
         # Consider previous / current text only within context of the reasoning
-        previous_text = reasoning_content[:-len(delta_text)]
+        previous_text = reasoning_content[: -len(delta_text)]
         current_text = reasoning_content
 
         # We need to be careful about adding unfinished response sequences;
@@ -234,12 +237,21 @@ def _get_delta_message_with_no_response_bounds(
         delta_idx = delta_text.rfind(self.seq_boundary_start)
 
         # Check the state of potential start of response substring matches.
-        prev_was_substr = self._is_response_start_substr(
-            previous_text[prev_idx:]) if prev_idx >= 0 else False
-        delta_continues_substr = self._is_response_start_substr(
-            current_text[prev_idx:]) if prev_idx >= 0 else False
-        delta_new_substr = self._is_response_start_substr(
-            delta_text[delta_idx:]) if delta_idx >= 0 else False
+        prev_was_substr = (
+            self._is_response_start_substr(previous_text[prev_idx:])
+            if prev_idx >= 0
+            else False
+        )
+        delta_continues_substr = (
+            self._is_response_start_substr(current_text[prev_idx:])
+            if prev_idx >= 0
+            else False
+        )
+        delta_new_substr = (
+            self._is_response_start_substr(delta_text[delta_idx:])
+            if delta_idx >= 0
+            else False
+        )
 
         # Delta only contains potential continued response sequence text.
         if delta_continues_substr:
@@ -248,18 +260,17 @@ def _get_delta_message_with_no_response_bounds(
         if not prev_was_substr:
             # Delta may be starting a new response seq but has other text too.
             if delta_new_substr:
-                return DeltaMessage(reasoning_content=delta_text[:delta_idx],
-                                    content=None)
+                return DeltaMessage(
+                    reasoning_content=delta_text[:delta_idx], content=None
+                )
             # Normal case for most reasoning text (no potential special seqs).
             return DeltaMessage(reasoning_content=delta_text, content=None)
         # The substring that previously seemed to be a potential response
         # seq wasn't one; we need to add the content to the delta message,
         # and also slice off the potential response sequence
         elif delta_new_substr:
-            reasoning_content = previous_text[
-                prev_idx:] + delta_text[:delta_idx]
-            return DeltaMessage(reasoning_content=reasoning_content,
-                                content=None)
+            reasoning_content = previous_text[prev_idx:] + delta_text[:delta_idx]
+            return DeltaMessage(reasoning_content=reasoning_content, content=None)
         # No new substring yet, and we broke our old one; take the whole delta
         return DeltaMessage(
             reasoning_content=previous_text[prev_idx:] + delta_text,
@@ -288,23 +299,21 @@ def _get_delta_message_with_both_bounds(
             DeltaMessage: Message containing the parsed content.
         """
         # Always have content; take length to the end
-        delta_content = delta_text[-len(response_content):]
-        reasoning_end_idx = len(delta_text) - (len(response_content) +
-                                               response_seq_len)
+        delta_content = delta_text[-len(response_content) :]
+        reasoning_end_idx = len(delta_text) - (len(response_content) + response_seq_len)
 
         if reasoning_end_idx < 0:
             delta_reasoning_content = None
         else:
             # Get the starting offset
-            start_reasoning_content_idx = len(
-                reasoning_content) + response_seq_len + len(
-                    response_content) - 1
+            start_reasoning_content_idx = (
+                len(reasoning_content) + response_seq_len + len(response_content) - 1
+            )
             delta_offset = len(current_text) - len(delta_text)
             start_offset = start_reasoning_content_idx - delta_offset
             if start_offset < 0:
                 start_offset = 0
-            delta_reasoning_content = delta_text[
-                start_offset:reasoning_end_idx]
+            delta_reasoning_content = delta_text[start_offset:reasoning_end_idx]
 
         return DeltaMessage(
             reasoning_content=delta_reasoning_content,
@@ -329,7 +338,8 @@ def _get_content_sections(
         start_reasoning_content = None
         parsed_content = False
         delimiter_idxs = [
-            idx for idx, char in enumerate(current_text)
+            idx
+            for idx, char in enumerate(current_text)
             if char == self.seq_boundary_end
         ]
 
@@ -346,17 +356,15 @@ def _get_content_sections(
             # Check to see if the start of response seq if complete
             elif not parsed_content:
                 for response_start in self.valid_response_starts:
-                    if current_chunk[-len(response_start) +
-                                     1:] == response_start[:-1]:
+                    if current_chunk[-len(response_start) + 1 :] == response_start[:-1]:
                         # Mark end of reasoning and start response content
                         # after the start of response sequence.
-                        end_reasoning_content = current_chunk_end - len(
-                            response_start)
+                        end_reasoning_content = current_chunk_end - len(response_start)
                         reasoning_content = current_text[
-                            start_reasoning_content:end_reasoning_content]
-                        response_content = current_text[current_chunk_end + 1:]
-                        return reasoning_content, len(
-                            response_start), response_content
+                            start_reasoning_content:end_reasoning_content
+                        ]
+                        response_content = current_text[current_chunk_end + 1 :]
+                        return reasoning_content, len(response_start), response_content
 
         if start_reasoning_content and not parsed_content:
             return current_text[start_reasoning_content:], None, None
diff --git a/vllm/reasoning/hunyuan_a13b_reasoning_parser.py b/vllm/reasoning/hunyuan_a13b_reasoning_parser.py
index 6e3b056d6b62..381f1b5f3466 100644
--- a/vllm/reasoning/hunyuan_a13b_reasoning_parser.py
+++ b/vllm/reasoning/hunyuan_a13b_reasoning_parser.py
@@ -7,8 +7,7 @@
 import regex as re
 from transformers import PreTrainedTokenizerBase
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaMessage)
+from vllm.entrypoints.openai.protocol import ChatCompletionRequest, DeltaMessage
 from vllm.logger import init_logger
 from vllm.reasoning import ReasoningParser, ReasoningParserManager
 
@@ -22,16 +21,16 @@ class HunyuanA13BReasoningParser(ReasoningParser):
 
     HunyuanReasoningParser
 
-    This class implements a reasoning parser specifically designed 
-    for the Hunyuan A13B Model. It is responsible for parsing and 
-    extracting structured reasoning and answer segments from model 
+    This class implements a reasoning parser specifically designed
+    for the Hunyuan A13B Model. It is responsible for parsing and
+    extracting structured reasoning and answer segments from model
     outputs that follow a specific pattern.
 
     Key Features:
         - For non-stream output , Recognizes and extracts reasoning ("think")
          and answer ("answer") sections from text using regular expressions.
         - For stream process, it requires a token id sequences to change the
-          reasoning state and other state so it maintains internal state to 
+          reasoning state and other state so it maintains internal state to
           manage parsing across multiple token.
 
 
@@ -50,20 +49,19 @@ def __init__(self, tokenizer: PreTrainedTokenizerBase, *args, **kwargs):
 
         self.full_match_reasoning_regex = re.compile(
             rf"(?:{self.think_start_expr}(.*?){self.response_start_expr})?(.*?){self.response_end_expr}",
-            re.DOTALL)
+            re.DOTALL,
+        )
 
         self.half_match_reasoning_regex = re.compile(
-            rf"{self.think_start_expr}(.*?){self.response_start_expr}(.*)",
-            re.DOTALL)
+            rf"{self.think_start_expr}(.*?){self.response_start_expr}(.*)", re.DOTALL
+        )
 
         self.think_start_ids = [14023, 771, 397]
         self.think_start_ids_fast = [14023, 771, 1363]
         self.response_start_ids = [198, 524, 27963, 397, 27, 9399, 397]
         self.response_start_ids_fast = [524, 27963, 397, 27, 9399, 397]
         self.response_end_ids = [198, 524, 9399, 29]
-        self.fast_think_ids = [
-            14023, 771, 1363, 524, 27963, 397, 27, 9399, 397
-        ]
+        self.fast_think_ids = [14023, 771, 1363, 524, 27963, 397, 27, 9399, 397]
 
         # when state change, send out all the buffered text in last state
         self.buffered_text = []
@@ -91,7 +89,7 @@ def extract_content_ids(self, input_ids: list[int]) -> list[int]:
         return []
 
     def extract_reasoning_content(
-            self, model_output: str, request: ChatCompletionRequest
+        self, model_output: str, request: ChatCompletionRequest
     ) -> tuple[Optional[str], Optional[str]]:
         """Extract the reasoning content & content sections, respectively.
         If the sequence doesn't match what we expect, i.e., the model generates
@@ -121,8 +119,7 @@ def extract_reasoning_content(
             reasoning_content, response_content = fallback_match[0]
 
             if response_content.endswith(self.response_end_expr):
-                response_content = response_content[:-len(self.
-                                                          response_end_expr)]
+                response_content = response_content[: -len(self.response_end_expr)]
 
             if len(reasoning_content) == 0:
                 reasoning_content = None
@@ -133,8 +130,9 @@ def extract_reasoning_content(
 
         return None, model_output
 
-    def _is_strict_increasing_subsequence(self, subsequence: Sequence[int],
-                                          sequence: Sequence[int]) -> bool:
+    def _is_strict_increasing_subsequence(
+        self, subsequence: Sequence[int], sequence: Sequence[int]
+    ) -> bool:
         if not subsequence:
             return False
 
@@ -159,27 +157,27 @@ def extract_reasoning_content_streaming(
         response_start_sequence = self.response_start_ids
         response_end_sequence = self.response_end_ids
 
-        assert (len(delta_token_ids) == 1)
+        assert len(delta_token_ids) == 1
         # Process each token in the delta
         token = delta_token_ids[0]
 
         def check_token_with_sequence(token):
             if self.current_state == "idle" or self.current_state == "think":
-                return (token == self.expected_sequence[self.sequence_index]
-                         or token ==  \
-                         self.expected_sequence_side[self.sequence_index])
+                return (
+                    token == self.expected_sequence[self.sequence_index]
+                    or token == self.expected_sequence_side[self.sequence_index]
+                )
             else:
                 return token == self.expected_sequence[self.sequence_index]
 
         def check_last_token(token):
             if self.current_state == "idle" or self.current_state == "think":
                 # only return true if it's judge using a side sequence.
-                if (self.sequence_index - 1 < len(self.expected_sequence_side)
-                        and token
-                        == self.expected_sequence_side[self.sequence_index -
-                                                       1]):
-                    return self.sequence_index == len(
-                        self.expected_sequence_side)
+                if (
+                    self.sequence_index - 1 < len(self.expected_sequence_side)
+                    and token == self.expected_sequence_side[self.sequence_index - 1]
+                ):
+                    return self.sequence_index == len(self.expected_sequence_side)
                 else:
                     return self.sequence_index == len(self.expected_sequence)
             else:
@@ -227,19 +225,19 @@ def check_last_token(token):
 
                 # Return content based on current state
                 if self.current_state == "think":
-                    return DeltaMessage(reasoning_content=buffered_content,
-                                        content=None)
+                    return DeltaMessage(
+                        reasoning_content=buffered_content, content=None
+                    )
                 else:
-                    return DeltaMessage(reasoning_content=None,
-                                        content=buffered_content)
+                    return DeltaMessage(
+                        reasoning_content=None, content=buffered_content
+                    )
             else:
                 # No buffered content, send normally
                 if self.current_state == "think":
-                    return DeltaMessage(reasoning_content=delta_text,
-                                        content=None)
+                    return DeltaMessage(reasoning_content=delta_text, content=None)
                 else:
-                    return DeltaMessage(reasoning_content=None,
-                                        content=delta_text)
+                    return DeltaMessage(reasoning_content=None, content=delta_text)
 
         # If no content to send in this delta
         return None
diff --git a/vllm/reasoning/mistral_reasoning_parser.py b/vllm/reasoning/mistral_reasoning_parser.py
index ceda96ca6a6d..5658c372a264 100644
--- a/vllm/reasoning/mistral_reasoning_parser.py
+++ b/vllm/reasoning/mistral_reasoning_parser.py
@@ -5,8 +5,7 @@
 
 from vllm.logger import init_logger
 from vllm.reasoning import ReasoningParser, ReasoningParserManager
-from vllm.reasoning.deepseek_r1_reasoning_parser import (
-    DeepSeekR1ReasoningParser)
+from vllm.reasoning.deepseek_r1_reasoning_parser import DeepSeekR1ReasoningParser
 from vllm.transformers_utils.tokenizers.mistral import MistralTokenizer
 
 logger = init_logger(__name__)
@@ -23,34 +22,35 @@ class MistralReasoningParser(DeepSeekR1ReasoningParser):
 
     def __init__(self, tokenizer: MistralTokenizer, *args, **kwargs):
         if not isinstance(tokenizer, MistralTokenizer):
-            raise ValueError(
-                "The tokenizer must be an instance of MistralTokenizer.")
+            raise ValueError("The tokenizer must be an instance of MistralTokenizer.")
 
         ReasoningParser.__init__(self, tokenizer, *args, **kwargs)
 
         if not self.model_tokenizer:
             raise ValueError(
                 "The model tokenizer must be passed to the ReasoningParser "
-                "constructor during construction.")
+                "constructor during construction."
+            )
 
-        self.start_token_id = tokenizer.tokenizer.get_control_token(
-            self.start_token)
-        self.end_token_id = tokenizer.tokenizer.get_control_token(
-            self.end_token)
+        self.start_token_id = tokenizer.tokenizer.get_control_token(self.start_token)
+        self.end_token_id = tokenizer.tokenizer.get_control_token(self.end_token)
 
         if self.start_token_id is None or self.end_token_id is None:
             raise RuntimeError(
                 "Mistral reasoning parser could not locate think start/end "
-                "tokens in the tokenizer!")
+                "tokens in the tokenizer!"
+            )
 
     @cached_property
     def start_token(self) -> str:
         """The token that starts reasoning content."""
         from mistral_common.tokens.tokenizers.base import SpecialTokens
+
         return SpecialTokens.begin_think
 
     @cached_property
     def end_token(self) -> str:
         """The token that ends reasoning content."""
         from mistral_common.tokens.tokenizers.base import SpecialTokens
+
         return SpecialTokens.end_think
diff --git a/vllm/reasoning/olmo3_reasoning_parser.py b/vllm/reasoning/olmo3_reasoning_parser.py
index e37b6d887515..b330e8b1fdd5 100644
--- a/vllm/reasoning/olmo3_reasoning_parser.py
+++ b/vllm/reasoning/olmo3_reasoning_parser.py
@@ -11,8 +11,11 @@
 if TYPE_CHECKING:
     from vllm.transformers_utils.tokenizer import AnyTokenizer
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaMessage, ResponsesRequest)
+from vllm.entrypoints.openai.protocol import (
+    ChatCompletionRequest,
+    DeltaMessage,
+    ResponsesRequest,
+)
 from vllm.logger import init_logger
 from vllm.reasoning import ReasoningParser, ReasoningParserManager
 
@@ -33,8 +36,7 @@ def __len__(self):
         return self.end - self.start
 
 
-def string_overlap(a: str,
-                   b: str) -> tuple[Optional[Indices], Optional[Indices]]:
+def string_overlap(a: str, b: str) -> tuple[Optional[Indices], Optional[Indices]]:
     """
     Find the longest overlap where the end of string a matches the start
     of string b.
@@ -95,7 +97,7 @@ def process_buffer(self) -> Optional[DeltaMessage]:
             self.state = Olmo3ReasoningState.REASONING
             pretext, self.buffer = (
                 self.buffer[:start_think_idx],
-                self.buffer[start_think_idx + len(self.think_start):],
+                self.buffer[start_think_idx + len(self.think_start) :],
             )
             if start_think_idx > 0:
                 # this covers the case there's content before
@@ -108,7 +110,7 @@ def process_buffer(self) -> Optional[DeltaMessage]:
             self.state = Olmo3ReasoningState.CONTENT
             pretext, self.buffer = (
                 self.buffer[:end_think_idx],
-                self.buffer[end_think_idx + len(self.think_end):],
+                self.buffer[end_think_idx + len(self.think_end) :],
             )
             if end_think_idx > 0:
                 # this covers the case there's content before
@@ -153,12 +155,17 @@ def add_text(self, delta_text: str) -> Optional[DeltaMessage]:
         _, overlap_think_end = string_overlap(delta_text, self.think_end)
 
         partial_overlap_start = overlap_think_start is not None and len(
-            overlap_think_start) < len(self.think_start)
+            overlap_think_start
+        ) < len(self.think_start)
         partial_overlap_end = overlap_think_end is not None and len(
-            overlap_think_end) < len(self.think_end)
-
-        if (partial_overlap_start and self.think_start in self.buffer
-                and not partial_overlap_end):
+            overlap_think_end
+        ) < len(self.think_end)
+
+        if (
+            partial_overlap_start
+            and self.think_start in self.buffer
+            and not partial_overlap_end
+        ):
             # we can only process the buffer if partial overlap
             # is the last part of think token (thus causing
             # text_buffer to contain the start of think token)
@@ -223,12 +230,15 @@ def __init__(self, tokenizer: "AnyTokenizer", *args, **kwargs):
         # notice that the first think is optional; this allows template to
         # work in cases when we hardcode a <think> at the beginning of the
         # reasoning template.
-        reasoning_expr = (rf"^(?:{self.think_start})?(?P<reasoning>.*?)" +
-                          rf"{self.think_end}(?P<content>.*)$")
+        reasoning_expr = (
+            rf"^(?:{self.think_start})?(?P<reasoning>.*?)"
+            + rf"{self.think_end}(?P<content>.*)$"
+        )
         self.reasoning_regex = re.compile(reasoning_expr, re.DOTALL)
 
-        self.buffer = Olmo3ReasoningBuffer(think_start=self.think_start,
-                                           think_end=self.think_end)
+        self.buffer = Olmo3ReasoningBuffer(
+            think_start=self.think_start, think_end=self.think_end
+        )
 
     def is_reasoning_end(self, input_ids: list[int]) -> bool:
         text = self.model_tokenizer.decode(input_ids)
@@ -281,8 +291,7 @@ def extract_reasoning_content_streaming(
         """Extract content using token ID sequence state machine"""
 
         delta_message = self.buffer.add_text(delta_text)
-        if (delta_message is None
-                and self.buffer.think_end in self.buffer.buffer):
+        if delta_message is None and self.buffer.think_end in self.buffer.buffer:
             # this is a bit hacky, but, because of how the buffer is
             # constructed, if the last delta_text contains characters that
             # marks the end of thinking tokens, then messages in the buffer
diff --git a/vllm/reasoning/qwen3_reasoning_parser.py b/vllm/reasoning/qwen3_reasoning_parser.py
index 3e3c7f32796b..160e8633a43f 100644
--- a/vllm/reasoning/qwen3_reasoning_parser.py
+++ b/vllm/reasoning/qwen3_reasoning_parser.py
@@ -3,8 +3,7 @@
 
 from typing import Optional, Union
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              ResponsesRequest)
+from vllm.entrypoints.openai.protocol import ChatCompletionRequest, ResponsesRequest
 from vllm.reasoning.abs_reasoning_parsers import ReasoningParserManager
 from vllm.reasoning.basic_parsers import BaseThinkingReasoningParser
 
@@ -32,12 +31,11 @@ def end_token(self) -> str:
         return "</think>"
 
     def extract_reasoning_content(
-        self, model_output: str, request: Union[ChatCompletionRequest,
-                                                ResponsesRequest]
+        self, model_output: str, request: Union[ChatCompletionRequest, ResponsesRequest]
     ) -> tuple[Optional[str], Optional[str]]:
         """
         Extract reasoning content from the model output.
-        
+
         Qwen3 has stricter requirements - it needs both start and end tokens
         to be present, unlike other models that work with just the end token.
 
@@ -50,15 +48,15 @@ def extract_reasoning_content(
         """
 
         # Check if the model output contains both <think> and </think> tokens.
-        if (self.start_token not in model_output
-                or self.end_token not in model_output):
+        if self.start_token not in model_output or self.end_token not in model_output:
             return None, model_output
 
         # Check if the <think> is present in the model output, remove it
         # if it is present.
         model_output_parts = model_output.partition(self.start_token)
-        model_output = model_output_parts[2] if model_output_parts[
-            1] else model_output_parts[0]
+        model_output = (
+            model_output_parts[2] if model_output_parts[1] else model_output_parts[0]
+        )
 
         # Check if the model output contains the </think> tokens.
         # If the end token is not found, return the model output as is.
diff --git a/vllm/reasoning/seedoss_reasoning_parser.py b/vllm/reasoning/seedoss_reasoning_parser.py
index 5f4bbbf1557e..72f8dc54f1b3 100644
--- a/vllm/reasoning/seedoss_reasoning_parser.py
+++ b/vllm/reasoning/seedoss_reasoning_parser.py
@@ -10,10 +10,10 @@ class SeedOSSReasoningParser(BaseThinkingReasoningParser):
     """
     Reasoning parser for SeedOSS model.
 
-    The SeedOSS model uses <seed:think>...</seed:think> tokens to 
-    denote reasoning content text. This parser extracts 
+    The SeedOSS model uses <seed:think>...</seed:think> tokens to
+    denote reasoning content text. This parser extracts
     the reasoning content from the model output.
-    Similar to DeepSeek R1, it supports cases 
+    Similar to DeepSeek R1, it supports cases
     where the model doesn't generate the start token.
     """
 
diff --git a/vllm/reasoning/step3_reasoning_parser.py b/vllm/reasoning/step3_reasoning_parser.py
index 6e5deb52d345..c9f580077b33 100644
--- a/vllm/reasoning/step3_reasoning_parser.py
+++ b/vllm/reasoning/step3_reasoning_parser.py
@@ -7,8 +7,7 @@
 import regex as re
 from transformers import PreTrainedTokenizerBase
 
-from vllm.entrypoints.openai.protocol import (ChatCompletionRequest,
-                                              DeltaMessage)
+from vllm.entrypoints.openai.protocol import ChatCompletionRequest, DeltaMessage
 from vllm.logger import init_logger
 from vllm.reasoning import ReasoningParser, ReasoningParserManager
 
@@ -20,7 +19,7 @@ class Step3ReasoningParser(ReasoningParser):
     """
     Reasoning parser for Step3 model.
 
-    The Step3 model uses </think> token to denote the end of reasoning 
+    The Step3 model uses </think> token to denote the end of reasoning
     text. This parser extracts all content before </think> as reasoning content.
     """
 
@@ -28,19 +27,20 @@ def __init__(self, tokenizer: PreTrainedTokenizerBase, *args, **kwargs):
         super().__init__(tokenizer, *args, **kwargs)
         self.think_end_token = "</think>"
 
-        self.reasoning_regex = re.compile(rf"(.*?){self.think_end_token}",
-                                          re.DOTALL)
+        self.reasoning_regex = re.compile(rf"(.*?){self.think_end_token}", re.DOTALL)
 
         if not self.model_tokenizer:
             raise ValueError(
                 "The model tokenizer must be passed to the ReasoningParser "
-                "constructor during construction.")
+                "constructor during construction."
+            )
 
         self.think_end_token_id = self.vocab.get(self.think_end_token)
         if self.think_end_token_id is None:
             raise RuntimeError(
                 "Step3 reasoning parser could not locate think end "
-                "token in the tokenizer!")
+                "token in the tokenizer!"
+            )
 
     def extract_reasoning_content_streaming(
         self,
@@ -60,17 +60,18 @@ def extract_reasoning_content_streaming(
         - 'xyz' goes to content
         """
         # Skip single special token
-        if len(delta_token_ids
-               ) == 1 and delta_token_ids[0] == self.think_end_token_id:
+        if len(delta_token_ids) == 1 and delta_token_ids[0] == self.think_end_token_id:
             return None
 
         if self.think_end_token_id in delta_token_ids:
             # </think> in delta, extract reasoning content and remaining content
             end_index = delta_text.find(self.think_end_token)
             reasoning_content = delta_text[:end_index]
-            content = delta_text[end_index + len(self.think_end_token):]
-            return DeltaMessage(reasoning_content=reasoning_content,
-                                content=content if content else None)
+            content = delta_text[end_index + len(self.think_end_token) :]
+            return DeltaMessage(
+                reasoning_content=reasoning_content,
+                content=content if content else None,
+            )
         elif self.think_end_token_id in previous_token_ids:
             # </think> already seen in previous text, everything is content
             return DeltaMessage(content=delta_text)
@@ -79,9 +80,8 @@ def extract_reasoning_content_streaming(
             return DeltaMessage(reasoning_content=delta_text)
 
     def extract_reasoning_content(
-            self, model_output: str, request: ChatCompletionRequest
+        self, model_output: str, request: ChatCompletionRequest
     ) -> tuple[Optional[str], Optional[str]]:
-
         # Check if the model output contains the </think> token
         if self.think_end_token not in model_output:
             # If no </think> token, everything is reasoning content
@@ -92,7 +92,7 @@ def extract_reasoning_content(
             reasoning_content = model_output[:end_index]
 
             # Content after </think> token
-            content = model_output[end_index + len(self.think_end_token):]
+            content = model_output[end_index + len(self.think_end_token) :]
 
             if len(content) == 0:
                 content = None
@@ -106,4 +106,4 @@ def extract_content_ids(self, input_ids: list[int]) -> list[int]:
         if self.think_end_token_id not in input_ids[:-1]:
             return []
         else:
-            return input_ids[input_ids.index(self.think_end_token_id) + 1:]
+            return input_ids[input_ids.index(self.think_end_token_id) + 1 :]
diff --git a/vllm/sampling_params.py b/vllm/sampling_params.py
index f424682f9dfa..a1ff4e5ff63b 100644
--- a/vllm/sampling_params.py
+++ b/vllm/sampling_params.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Sampling parameters for text generation."""
+
 import copy
 import warnings
 from dataclasses import field
@@ -50,26 +51,32 @@ class StructuredOutputsParams:
 
     def __post_init__(self):
         """Validate that some fields are mutually exclusive."""
-        count = sum([
-            self.json is not None, self.regex is not None, self.choice
-            is not None, self.grammar is not None, self.json_object is not None
-        ])
+        count = sum(
+            [
+                self.json is not None,
+                self.regex is not None,
+                self.choice is not None,
+                self.grammar is not None,
+                self.json_object is not None,
+            ]
+        )
         if count > 1:
             raise ValueError(
                 "You can only use one kind of structured outputs constraint "
-                f"but multiple are specified: {self.__dict__}")
+                f"but multiple are specified: {self.__dict__}"
+            )
 
 
 @dataclass
 class GuidedDecodingParams(StructuredOutputsParams):
-
     def __post_init__(self):
         warnings.warn(
             "GuidedDecodingParams is deprecated. This will be removed in "
             "v0.12.0 or v1.0.0, which ever is soonest. Please use "
             "StructuredOutputsParams instead.",
             DeprecationWarning,
-            stacklevel=2)
+            stacklevel=2,
+        )
         return super().__post_init__()
 
 
@@ -83,10 +90,11 @@ class RequestOutputKind(Enum):
 
 
 class SamplingParams(
-        msgspec.Struct,
-        omit_defaults=True,  # type: ignore[call-arg]
-        # required for @cached_property.
-        dict=True):  # type: ignore[call-arg]
+    msgspec.Struct,
+    omit_defaults=True,  # type: ignore[call-arg]
+    # required for @cached_property.
+    dict=True,
+):  # type: ignore[call-arg]
     """Sampling parameters for text generation.
 
     Overall, we follow the sampling parameters from the OpenAI text completion
@@ -178,8 +186,7 @@ class SamplingParams(
     optionally prompt tokens as a first argument."""
     include_stop_str_in_output: bool = False
     """Whether to include the stop strings in output text."""
-    truncate_prompt_tokens: Optional[Annotated[int,
-                                               msgspec.Meta(ge=-1)]] = None
+    truncate_prompt_tokens: Optional[Annotated[int, msgspec.Meta(ge=-1)]] = None
     """If set to -1, will use the truncation size supported by the model. If
     set to an integer k, will use only the last k tokens from the prompt
     (i.e., left truncation). If set to `None`, truncation is disabled."""
@@ -238,9 +245,7 @@ def from_optional(
         skip_special_tokens: bool = True,
         spaces_between_special_tokens: bool = True,
         logits_processors: Optional[list[LogitsProcessor]] = None,
-        truncate_prompt_tokens: Optional[Annotated[int,
-                                                   msgspec.Meta(
-                                                       ge=-1)]] = None,
+        truncate_prompt_tokens: Optional[Annotated[int, msgspec.Meta(ge=-1)]] = None,
         output_kind: RequestOutputKind = RequestOutputKind.CUMULATIVE,
         structured_outputs: Optional[StructuredOutputsParams] = None,
         guided_decoding: Optional[GuidedDecodingParams] = None,
@@ -261,19 +266,19 @@ def from_optional(
                 "v0.12.0 or v1.0.0, which ever is soonest. Please use "
                 "structured_outputs instead.",
                 DeprecationWarning,
-                stacklevel=2)
+                stacklevel=2,
+            )
             structured_outputs = guided_decoding
             guided_decoding = None
 
         return SamplingParams(
             n=1 if n is None else n,
             best_of=best_of,
-            presence_penalty=0.0
-            if presence_penalty is None else presence_penalty,
-            frequency_penalty=0.0
-            if frequency_penalty is None else frequency_penalty,
+            presence_penalty=0.0 if presence_penalty is None else presence_penalty,
+            frequency_penalty=0.0 if frequency_penalty is None else frequency_penalty,
             repetition_penalty=1.0
-            if repetition_penalty is None else repetition_penalty,
+            if repetition_penalty is None
+            else repetition_penalty,
             temperature=1.0 if temperature is None else temperature,
             top_p=1.0 if top_p is None else top_p,
             top_k=top_k,
@@ -311,7 +316,8 @@ def __post_init__(self) -> None:
             if self.best_of < self.n:
                 raise ValueError(
                     f"best_of must be greater than or equal to n, "
-                    f"got n={self.n} and best_of={self.best_of}.")
+                    f"got n={self.n} and best_of={self.best_of}."
+                )
             if not self._real_n:
                 self._real_n = self.n
                 self.n = self.best_of
@@ -320,7 +326,10 @@ def __post_init__(self) -> None:
             logger.warning(
                 "temperature %s is less than %s, which may cause numerical "
                 "errors nan or inf in tensors. We have maxed it out to %s.",
-                self.temperature, _MAX_TEMP, _MAX_TEMP)
+                self.temperature,
+                _MAX_TEMP,
+                _MAX_TEMP,
+            )
             self.temperature = max(self.temperature, _MAX_TEMP)
 
         if self.seed == -1:
@@ -366,101 +375,116 @@ def __post_init__(self) -> None:
                 "v0.12.0 or v1.0.0, which ever is soonest. Please use "
                 "structured_outputs instead.",
                 DeprecationWarning,
-                stacklevel=2)
+                stacklevel=2,
+            )
             self.structured_outputs = self.guided_decoding
             self.guided_decoding = None
 
     def _verify_args(self) -> None:
         if not isinstance(self.n, int):
-            raise ValueError(f"n must be an int, but is of "
-                             f"type {type(self.n)}")
+            raise ValueError(f"n must be an int, but is of type {type(self.n)}")
         if self.n < 1:
             raise ValueError(f"n must be at least 1, got {self.n}.")
         if self.best_of is not None:
             if not isinstance(self.best_of, int):
                 raise ValueError(
-                    f"best_of must be an integer, got {type(self.best_of)}")
+                    f"best_of must be an integer, got {type(self.best_of)}"
+                )
             if self.best_of < 1:
-                raise ValueError(
-                    f"best_of must be at least 1, got {self.best_of}")
+                raise ValueError(f"best_of must be at least 1, got {self.best_of}")
             if self.best_of < self.n:
                 raise ValueError(
                     f"best_of must be greater than or equal to n, "
-                    f"got n={self.n} and best_of={self.best_of}.")
+                    f"got n={self.n} and best_of={self.best_of}."
+                )
         if not -2.0 <= self.presence_penalty <= 2.0:
-            raise ValueError("presence_penalty must be in [-2, 2], got "
-                             f"{self.presence_penalty}.")
+            raise ValueError(
+                f"presence_penalty must be in [-2, 2], got {self.presence_penalty}."
+            )
         if not -2.0 <= self.frequency_penalty <= 2.0:
-            raise ValueError("frequency_penalty must be in [-2, 2], got "
-                             f"{self.frequency_penalty}.")
+            raise ValueError(
+                f"frequency_penalty must be in [-2, 2], got {self.frequency_penalty}."
+            )
         if self.repetition_penalty <= 0.0:
             raise ValueError(
                 "repetition_penalty must be greater than zero, got "
-                f"{self.repetition_penalty}.")
+                f"{self.repetition_penalty}."
+            )
         if self.temperature < 0.0:
             raise ValueError(
-                f"temperature must be non-negative, got {self.temperature}.")
+                f"temperature must be non-negative, got {self.temperature}."
+            )
         if not 0.0 < self.top_p <= 1.0:
             raise ValueError(f"top_p must be in (0, 1], got {self.top_p}.")
         # quietly accept -1 as disabled, but prefer 0
         if self.top_k < -1:
-            raise ValueError(f"top_k must be 0 (disable), or at least 1, "
-                             f"got {self.top_k}.")
+            raise ValueError(
+                f"top_k must be 0 (disable), or at least 1, got {self.top_k}."
+            )
         if not isinstance(self.top_k, int):
             raise TypeError(
-                f"top_k must be an integer, got {type(self.top_k).__name__}")
+                f"top_k must be an integer, got {type(self.top_k).__name__}"
+            )
         if not 0.0 <= self.min_p <= 1.0:
-            raise ValueError("min_p must be in [0, 1], got "
-                             f"{self.min_p}.")
+            raise ValueError(f"min_p must be in [0, 1], got {self.min_p}.")
         if self.max_tokens is not None and self.max_tokens < 1:
-            raise ValueError(
-                f"max_tokens must be at least 1, got {self.max_tokens}.")
+            raise ValueError(f"max_tokens must be at least 1, got {self.max_tokens}.")
         if self.min_tokens < 0:
-            raise ValueError(f"min_tokens must be greater than or equal to 0, "
-                             f"got {self.min_tokens}.")
+            raise ValueError(
+                f"min_tokens must be greater than or equal to 0, got {self.min_tokens}."
+            )
         if self.max_tokens is not None and self.min_tokens > self.max_tokens:
             raise ValueError(
                 f"min_tokens must be less than or equal to "
-                f"max_tokens={self.max_tokens}, got {self.min_tokens}.")
-        if (self.logprobs is not None and self.logprobs != -1
-                and self.logprobs < 0):
+                f"max_tokens={self.max_tokens}, got {self.min_tokens}."
+            )
+        if self.logprobs is not None and self.logprobs != -1 and self.logprobs < 0:
             raise ValueError(
-                f"logprobs must be non-negative or -1, got {self.logprobs}.")
-        if (self.prompt_logprobs is not None and self.prompt_logprobs != -1
-                and self.prompt_logprobs < 0):
+                f"logprobs must be non-negative or -1, got {self.logprobs}."
+            )
+        if (
+            self.prompt_logprobs is not None
+            and self.prompt_logprobs != -1
+            and self.prompt_logprobs < 0
+        ):
             raise ValueError(
                 f"prompt_logprobs must be non-negative or -1, got "
-                f"{self.prompt_logprobs}.")
-        if (self.truncate_prompt_tokens is not None
-                and (self.truncate_prompt_tokens == 0
-                     or self.truncate_prompt_tokens < -1)):
+                f"{self.prompt_logprobs}."
+            )
+        if self.truncate_prompt_tokens is not None and (
+            self.truncate_prompt_tokens == 0 or self.truncate_prompt_tokens < -1
+        ):
             raise ValueError(
                 f"truncate_prompt_tokens must be an integer >= 1 or -1, "
-                f"got {self.truncate_prompt_tokens}")
+                f"got {self.truncate_prompt_tokens}"
+            )
         assert isinstance(self.stop_token_ids, list)
         if not all(isinstance(st_id, int) for st_id in self.stop_token_ids):
-            raise ValueError(f"stop_token_ids must contain only integers, "
-                             f"got {self.stop_token_ids}.")
+            raise ValueError(
+                f"stop_token_ids must contain only integers, got {self.stop_token_ids}."
+            )
         assert isinstance(self.stop, list)
         if any(not stop_str for stop_str in self.stop):
             raise ValueError("stop cannot contain an empty string.")
         if self.stop and not self.detokenize:
             raise ValueError(
                 "stop strings are only supported when detokenize is True. "
-                "Set detokenize=True to use stop.")
+                "Set detokenize=True to use stop."
+            )
         if self.best_of != self._real_n and self.output_kind == (
-                RequestOutputKind.DELTA):
+            RequestOutputKind.DELTA
+        ):
             raise ValueError("best_of must equal n to use output_kind=DELTA")
 
     def _verify_greedy_sampling(self) -> None:
         if self.n > 1:
-            raise ValueError("n must be 1 when using greedy sampling, "
-                             f"got {self.n}.")
+            raise ValueError(f"n must be 1 when using greedy sampling, got {self.n}.")
 
     def update_from_generation_config(
-            self,
-            generation_config: dict[str, Any],
-            model_eos_token_id: Optional[int] = None) -> None:
+        self,
+        generation_config: dict[str, Any],
+        model_eos_token_id: Optional[int] = None,
+    ) -> None:
         """Update if there are non-default values from generation_config"""
 
         if model_eos_token_id is not None:
@@ -494,30 +518,33 @@ def update_from_tokenizer(self, tokenizer: AnyTokenizer) -> None:
             for add_prefix_space in [False, True]:
                 prefix = " " if add_prefix_space else ""
                 prompt = prefix + bad_word.lstrip()
-                prompt_token_ids = tokenizer.encode(text=prompt,
-                                                    add_special_tokens=False)
+                prompt_token_ids = tokenizer.encode(
+                    text=prompt, add_special_tokens=False
+                )
 
                 # If no space at the beginning
                 # or if prefix space produces a new word token
                 if (not add_prefix_space) or (
-                        add_prefix_space and prompt_token_ids[0]
-                        != self._bad_words_token_ids[-1][0]
-                        and len(prompt_token_ids) == len(
-                            self._bad_words_token_ids[-1])):
+                    add_prefix_space
+                    and prompt_token_ids[0] != self._bad_words_token_ids[-1][0]
+                    and len(prompt_token_ids) == len(self._bad_words_token_ids[-1])
+                ):
                     self._bad_words_token_ids.append(prompt_token_ids)
 
         invalid_token_ids = [
-            token_id for bad_words_token_ids in self._bad_words_token_ids
+            token_id
+            for bad_words_token_ids in self._bad_words_token_ids
             for token_id in bad_words_token_ids
             if token_id < 0 or token_id > tokenizer.max_token_id
         ]
         if len(invalid_token_ids) > 0:
             raise ValueError(
-                f"The model vocabulary size is {tokenizer.max_token_id+1},"
+                f"The model vocabulary size is {tokenizer.max_token_id + 1},"
                 f" but the following tokens"
                 f" were specified as bad: {invalid_token_ids}."
                 f" All token id values should be integers satisfying:"
-                f" 0 <= token_id <= {tokenizer.max_token_id}.")
+                f" 0 <= token_id <= {tokenizer.max_token_id}."
+            )
 
     @cached_property
     def sampling_type(self) -> SamplingType:
@@ -545,10 +572,14 @@ def clone(self) -> "SamplingParams":
         See https://github.com/vllm-project/vllm/issues/3087
         """
 
-        logit_processor_refs = None if self.logits_processors is None else {
-            id(lp): lp.clone() if hasattr(lp, 'clone') else lp
-            for lp in self.logits_processors
-        }
+        logit_processor_refs = (
+            None
+            if self.logits_processors is None
+            else {
+                id(lp): lp.clone() if hasattr(lp, "clone") else lp
+                for lp in self.logits_processors
+            }
+        )
         return copy.deepcopy(self, memo=logit_processor_refs)
 
     def __repr__(self) -> str:
@@ -576,15 +607,18 @@ def __repr__(self) -> str:
             f"{self.spaces_between_special_tokens}, "
             f"truncate_prompt_tokens={self.truncate_prompt_tokens}, "
             f"structured_outputs={self.structured_outputs}, "
-            f"extra_args={self.extra_args})")
+            f"extra_args={self.extra_args})"
+        )
 
 
 class BeamSearchParams(
-        msgspec.Struct,
-        omit_defaults=True,  # type: ignore[call-arg]
-        # required for @cached_property.
-        dict=True):  # type: ignore[call-arg]
+    msgspec.Struct,
+    omit_defaults=True,  # type: ignore[call-arg]
+    # required for @cached_property.
+    dict=True,
+):  # type: ignore[call-arg]
     """Beam search parameters for text generation."""
+
     beam_width: int
     max_tokens: int
     ignore_eos: bool = False
diff --git a/vllm/scalar_type.py b/vllm/scalar_type.py
index 055f28914ad5..fd0713dc0aa3 100644
--- a/vllm/scalar_type.py
+++ b/vllm/scalar_type.py
@@ -70,20 +70,19 @@ class ScalarType:
     """
 
     def _floating_point_max_int(self) -> int:
-        assert (
-            self.mantissa <= 52 and self.exponent <= 11
-        ), f"Cannot represent max/min as a double for type {self.__str__()}"
+        assert self.mantissa <= 52 and self.exponent <= 11, (
+            f"Cannot represent max/min as a double for type {self.__str__()}"
+        )
 
         max_mantissa = (1 << self.mantissa) - 1
         if self.nan_repr == NanRepr.EXTD_RANGE_MAX_MIN:
             max_mantissa = max_mantissa - 1
 
         max_exponent = (1 << self.exponent) - 2
-        if (self.nan_repr == NanRepr.EXTD_RANGE_MAX_MIN
-                or self.nan_repr == NanRepr.NONE):
-            assert (
-                self.exponent < 11
-            ), f"Cannot represent max/min as a double for type {self.__str__()}"
+        if self.nan_repr == NanRepr.EXTD_RANGE_MAX_MIN or self.nan_repr == NanRepr.NONE:
+            assert self.exponent < 11, (
+                f"Cannot represent max/min as a double for type {self.__str__()}"
+            )
             max_exponent = max_exponent + 1
 
         # adjust the exponent to match that of a double
@@ -96,38 +95,39 @@ def _floating_point_max_int(self) -> int:
         exponent_bias = (1 << (self.exponent - 1)) - 1
         exponent_bias_double = (1 << 10) - 1  # double e = 11
 
-        max_exponent_double = (max_exponent - exponent_bias +
-                               exponent_bias_double)
+        max_exponent_double = max_exponent - exponent_bias + exponent_bias_double
 
         # shift the mantissa and exponent into the proper positions for an
         # IEEE double and bitwise-or them together.
-        return (max_mantissa <<
-                (52 - self.mantissa)) | (max_exponent_double << 52)
+        return (max_mantissa << (52 - self.mantissa)) | (max_exponent_double << 52)
 
     def _floating_point_max(self) -> float:
         double_raw = self._floating_point_max_int()
-        return struct.unpack('!d', struct.pack('!Q', double_raw))[0]
+        return struct.unpack("!d", struct.pack("!Q", double_raw))[0]
 
     def _raw_max(self) -> Union[int, float]:
         if self.is_floating_point():
             return self._floating_point_max()
         else:
-            assert (self.size_bits < 64 or self.size_bits == 64
-                    and self.is_signed()), "Cannot represent max as an int"
+            assert self.size_bits < 64 or self.size_bits == 64 and self.is_signed(), (
+                "Cannot represent max as an int"
+            )
             return (1 << self.mantissa) - 1
 
     def _raw_min(self) -> Union[int, float]:
         if self.is_floating_point():
-            assert self.is_signed(
-            ), "We currently assume all floating point types are signed"
+            assert self.is_signed(), (
+                "We currently assume all floating point types are signed"
+            )
             sign_bit_double = 1 << 63
 
             max_raw = self._floating_point_max_int()
             min_raw = max_raw | sign_bit_double
-            return struct.unpack('!d', struct.pack('!Q', min_raw))[0]
+            return struct.unpack("!d", struct.pack("!Q", min_raw))[0]
         else:
-            assert (not self.is_signed() or self.size_bits
-                    <= 64), "Cannot represent min as a int64_t"
+            assert not self.is_signed() or self.size_bits <= 64, (
+                "Cannot represent min as a int64_t"
+            )
 
             if self.is_signed():
                 return -(1 << (self.size_bits - 1))
@@ -158,8 +158,7 @@ def or_and_advance(member, bit_width):
         or_and_advance(self._finite_values_only, 1)
         or_and_advance(self.nan_repr.value, 8)
 
-        assert offset <= 64, \
-            f"ScalarType fields too big {offset} to fit into an int64"
+        assert offset <= 64, f"ScalarType fields too big {offset} to fit into an int64"
 
         _SCALAR_TYPES_ID_MAP[val] = self
 
@@ -215,8 +214,7 @@ def is_ieee_754(self) -> bool:
         If the type is a floating point type that follows IEEE 754
         conventions
         """
-        return self.nan_repr == NanRepr.IEEE_754.value and \
-            not self._finite_values_only
+        return self.nan_repr == NanRepr.IEEE_754.value and not self._finite_values_only
 
     def __str__(self) -> str:
         """
@@ -232,8 +230,14 @@ def __str__(self) -> str:
           - if bias is not present it means its zero
         """
         if self.is_floating_point():
-            ret = "float" + str(self.size_bits) + "_e" + str(
-                self.exponent) + "m" + str(self.mantissa)
+            ret = (
+                "float"
+                + str(self.size_bits)
+                + "_e"
+                + str(self.exponent)
+                + "m"
+                + str(self.mantissa)
+            )
 
             if not self.is_ieee_754():
                 if self._finite_values_only:
@@ -261,41 +265,43 @@ def __len__(self) -> int:
     #
 
     @classmethod
-    def int_(cls, size_bits: int, bias: Optional[int]) -> 'ScalarType':
+    def int_(cls, size_bits: int, bias: Optional[int]) -> "ScalarType":
         "Create a signed integer scalar type (size_bits includes sign-bit)."
         ret = cls(0, size_bits - 1, True, bias if bias else 0)
         ret.id  # noqa B018: make sure the id is cached
         return ret
 
     @classmethod
-    def uint(cls, size_bits: int, bias: Optional[int]) -> 'ScalarType':
+    def uint(cls, size_bits: int, bias: Optional[int]) -> "ScalarType":
         """Create an unsigned integer scalar type."""
         ret = cls(0, size_bits, False, bias if bias else 0)
         ret.id  # noqa B018: make sure the id is cached
         return ret
 
     @classmethod
-    def float_IEEE754(cls, exponent: int, mantissa: int) -> 'ScalarType':
+    def float_IEEE754(cls, exponent: int, mantissa: int) -> "ScalarType":
         """
         Create a standard floating point type
         (i.e. follows IEEE 754 conventions).
         """
-        assert (mantissa > 0 and exponent > 0)
+        assert mantissa > 0 and exponent > 0
         ret = cls(exponent, mantissa, True, 0)
         ret.id  # noqa B018: make sure the id is cached
         return ret
 
     @classmethod
-    def float_(cls, exponent: int, mantissa: int, finite_values_only: bool,
-               nan_repr: NanRepr) -> 'ScalarType':
+    def float_(
+        cls, exponent: int, mantissa: int, finite_values_only: bool, nan_repr: NanRepr
+    ) -> "ScalarType":
         """
         Create a non-standard floating point type
         (i.e. does not follow IEEE 754 conventions).
         """
-        assert (mantissa > 0 and exponent > 0)
-        assert (nan_repr != NanRepr.IEEE_754), (
+        assert mantissa > 0 and exponent > 0
+        assert nan_repr != NanRepr.IEEE_754, (
             "use `float_IEEE754` constructor for floating point types that "
-            "follow IEEE 754 conventions")
+            "follow IEEE 754 conventions"
+        )
         ret = cls(exponent, mantissa, True, 0, finite_values_only, nan_repr)
         ret.id  # noqa B018: make sure the id is cached
         return ret
@@ -303,8 +309,7 @@ def float_(cls, exponent: int, mantissa: int, finite_values_only: bool,
     @classmethod
     def from_id(cls, scalar_type_id: int):
         if scalar_type_id not in _SCALAR_TYPES_ID_MAP:
-            raise ValueError(
-                f"scalar_type_id {scalar_type_id} doesn't exists.")
+            raise ValueError(f"scalar_type_id {scalar_type_id} doesn't exists.")
         return _SCALAR_TYPES_ID_MAP[scalar_type_id]
 
 
@@ -327,8 +332,7 @@ class scalar_types:
     uint8 = ScalarType.uint(8, None)
     float8_e4m3fn = ScalarType.float_(4, 3, True, NanRepr.EXTD_RANGE_MAX_MIN)
     float8_e5m2 = ScalarType.float_IEEE754(5, 2)
-    float8_e8m0fnu = ScalarType(8, 0, False, 0, True,
-                                NanRepr.EXTD_RANGE_MAX_MIN)
+    float8_e8m0fnu = ScalarType(8, 0, False, 0, True, NanRepr.EXTD_RANGE_MAX_MIN)
     float16_e8m7 = ScalarType.float_IEEE754(8, 7)
     float16_e5m10 = ScalarType.float_IEEE754(5, 10)
 
diff --git a/vllm/scripts.py b/vllm/scripts.py
index 7a7fdccf0a32..f158860726be 100644
--- a/vllm/scripts.py
+++ b/vllm/scripts.py
@@ -10,6 +10,8 @@
 # Backwards compatibility for the move from vllm.scripts to
 # vllm.entrypoints.cli.main
 def main():
-    logger.warning("vllm.scripts.main() is deprecated. Please re-install "
-                   "vllm or use vllm.entrypoints.cli.main.main() instead.")
+    logger.warning(
+        "vllm.scripts.main() is deprecated. Please re-install "
+        "vllm or use vllm.entrypoints.cli.main.main() instead."
+    )
     vllm_main()
diff --git a/vllm/sequence.py b/vllm/sequence.py
index e5f23d47a660..7682b7f58305 100644
--- a/vllm/sequence.py
+++ b/vllm/sequence.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Sequence and its related classes."""
+
 from dataclasses import dataclass
 from typing import TYPE_CHECKING, Any, Optional, Union
 
@@ -8,8 +9,7 @@
 import torch
 
 if TYPE_CHECKING:
-    from vllm.v1.worker.kv_connector_model_runner_mixin import (
-        KVConnectorOutput)
+    from vllm.v1.worker.kv_connector_model_runner_mixin import KVConnectorOutput
 else:
     KVConnectorOutput = Any
 
@@ -36,6 +36,7 @@ class RequestMetrics:
                             will include model forward, block/sync across
                             workers, cpu-gpu sync time and sampling time.
     """
+
     arrival_time: float
     last_token_time: float
     first_scheduled_time: Optional[float]
@@ -53,7 +54,7 @@ class IntermediateTensors:
     """For all pipeline stages except the last, we need to return the hidden
     states and residuals to be sent to the next stage. This data structure
     contains the hidden states and residuals for a request.
-    
+
     Each stage also needs to handle its own kv_connector_output.
     """
 
@@ -87,17 +88,16 @@ def __eq__(self, other: object):
             return False
         if self.tensors.keys() != other.tensors.keys():
             return False
-        return all(
-            torch.equal(self.tensors[k], other.tensors[k])
-            for k in self.tensors)
+        return all(torch.equal(self.tensors[k], other.tensors[k]) for k in self.tensors)
 
     def __repr__(self) -> str:
         return f"IntermediateTensors(tensors={self.tensors})"
 
 
 class ExecuteModelRequest(
-        msgspec.Struct,
-        array_like=True,  # type: ignore[call-arg]
-        omit_defaults=True):  # type: ignore[call-arg]
+    msgspec.Struct,
+    array_like=True,  # type: ignore[call-arg]
+    omit_defaults=True,
+):  # type: ignore[call-arg]
     # Placeholder. Remove.
     pass
diff --git a/vllm/tracing.py b/vllm/tracing.py
index 7537e9901a04..c9b595999fc7 100644
--- a/vllm/tracing.py
+++ b/vllm/tracing.py
@@ -17,12 +17,15 @@
 try:
     from opentelemetry.context.context import Context
     from opentelemetry.sdk.environment_variables import (
-        OTEL_EXPORTER_OTLP_TRACES_PROTOCOL)
+        OTEL_EXPORTER_OTLP_TRACES_PROTOCOL,
+    )
     from opentelemetry.sdk.trace import TracerProvider
     from opentelemetry.sdk.trace.export import BatchSpanProcessor
     from opentelemetry.trace import SpanKind, Tracer, set_tracer_provider
     from opentelemetry.trace.propagation.tracecontext import (
-        TraceContextTextMapPropagator)
+        TraceContextTextMapPropagator,
+    )
+
     _is_otel_imported = True
 except ImportError:
     # Capture and format traceback to provide detailed context for the import
@@ -30,6 +33,7 @@
     # memory leaks.
     # See https://github.com/vllm-project/vllm/pull/7266#discussion_r1707395458
     import traceback
+
     otel_import_error_traceback = traceback.format_exc()
 
     class Context:  # type: ignore
@@ -49,13 +53,15 @@ def is_otel_available() -> bool:
     return _is_otel_imported
 
 
-def init_tracer(instrumenting_module_name: str,
-                otlp_traces_endpoint: str) -> Optional[Tracer]:
+def init_tracer(
+    instrumenting_module_name: str, otlp_traces_endpoint: str
+) -> Optional[Tracer]:
     if not is_otel_available():
         raise ValueError(
             "OpenTelemetry is not available. Unable to initialize "
             "a tracer. Ensure OpenTelemetry packages are installed. "
-            f"Original error:\n{otel_import_error_traceback}")
+            f"Original error:\n{otel_import_error_traceback}"
+        )
     trace_provider = TracerProvider()
 
     span_exporter = get_span_exporter(otlp_traces_endpoint)
@@ -70,19 +76,19 @@ def get_span_exporter(endpoint):
     protocol = os.environ.get(OTEL_EXPORTER_OTLP_TRACES_PROTOCOL, "grpc")
     if protocol == "grpc":
         from opentelemetry.exporter.otlp.proto.grpc.trace_exporter import (
-            OTLPSpanExporter)
+            OTLPSpanExporter,
+        )
     elif protocol == "http/protobuf":
         from opentelemetry.exporter.otlp.proto.http.trace_exporter import (
-            OTLPSpanExporter)  # type: ignore
+            OTLPSpanExporter,  # type: ignore
+        )
     else:
-        raise ValueError(
-            f"Unsupported OTLP protocol '{protocol}' is configured")
+        raise ValueError(f"Unsupported OTLP protocol '{protocol}' is configured")
 
     return OTLPSpanExporter(endpoint=endpoint)
 
 
-def extract_trace_context(
-        headers: Optional[Mapping[str, str]]) -> Optional[Context]:
+def extract_trace_context(headers: Optional[Mapping[str, str]]) -> Optional[Context]:
     if is_otel_available():
         headers = headers or {}
         return TraceContextTextMapPropagator().extract(headers)
@@ -91,7 +97,6 @@ def extract_trace_context(
 
 
 def extract_trace_headers(headers: Mapping[str, str]) -> Mapping[str, str]:
-
     return {h: headers[h] for h in TRACE_HEADERS if h in headers}
 
 
@@ -113,17 +118,13 @@ class SpanAttributes:
     GEN_AI_LATENCY_E2E = "gen_ai.latency.e2e"
     GEN_AI_LATENCY_TIME_IN_SCHEDULER = "gen_ai.latency.time_in_scheduler"
     # Time taken in the forward pass for this across all workers
-    GEN_AI_LATENCY_TIME_IN_MODEL_FORWARD = (
-        "gen_ai.latency.time_in_model_forward")
+    GEN_AI_LATENCY_TIME_IN_MODEL_FORWARD = "gen_ai.latency.time_in_model_forward"
     # Time taken in the model execute function. This will include model
     # forward, block/sync across workers, cpu-gpu sync time and sampling time.
-    GEN_AI_LATENCY_TIME_IN_MODEL_EXECUTE = (
-        "gen_ai.latency.time_in_model_execute")
-    GEN_AI_LATENCY_TIME_IN_MODEL_PREFILL = \
-        "gen_ai.latency.time_in_model_prefill"
+    GEN_AI_LATENCY_TIME_IN_MODEL_EXECUTE = "gen_ai.latency.time_in_model_execute"
+    GEN_AI_LATENCY_TIME_IN_MODEL_PREFILL = "gen_ai.latency.time_in_model_prefill"
     GEN_AI_LATENCY_TIME_IN_MODEL_DECODE = "gen_ai.latency.time_in_model_decode"
-    GEN_AI_LATENCY_TIME_IN_MODEL_INFERENCE = \
-        "gen_ai.latency.time_in_model_inference"
+    GEN_AI_LATENCY_TIME_IN_MODEL_INFERENCE = "gen_ai.latency.time_in_model_inference"
 
 
 def contains_trace_headers(headers: Mapping[str, str]) -> bool:
@@ -132,5 +133,4 @@ def contains_trace_headers(headers: Mapping[str, str]) -> bool:
 
 @run_once
 def log_tracing_disabled_warning() -> None:
-    logger.warning(
-        "Received a request with trace context but tracing is disabled")
+    logger.warning("Received a request with trace context but tracing is disabled")
diff --git a/vllm/transformers_utils/__init__.py b/vllm/transformers_utils/__init__.py
index 6d4231baca50..649df9a4f022 100644
--- a/vllm/transformers_utils/__init__.py
+++ b/vllm/transformers_utils/__init__.py
@@ -10,10 +10,11 @@
         from packaging import version
 
         # patch_hub begins from modelscope>=1.18.1
-        if version.parse(modelscope.__version__) <= version.parse('1.18.0'):
+        if version.parse(modelscope.__version__) <= version.parse("1.18.0"):
             raise ImportError(
-                'Using vLLM with ModelScope needs modelscope>=1.18.1, please '
-                'install by `pip install modelscope -U`')
+                "Using vLLM with ModelScope needs modelscope>=1.18.1, please "
+                "install by `pip install modelscope -U`"
+            )
         from modelscope.utils.hf_util import patch_hub
 
         # Patch hub to download models from modelscope to speed up.
@@ -21,4 +22,5 @@
     except ImportError as err:
         raise ImportError(
             "Please install modelscope>=1.18.1 via "
-            "`pip install modelscope>=1.18.1` to use ModelScope.") from err
+            "`pip install modelscope>=1.18.1` to use ModelScope."
+        ) from err
diff --git a/vllm/transformers_utils/chat_templates/registry.py b/vllm/transformers_utils/chat_templates/registry.py
index d24a0946bdde..dadbb727e194 100644
--- a/vllm/transformers_utils/chat_templates/registry.py
+++ b/vllm/transformers_utils/chat_templates/registry.py
@@ -12,16 +12,14 @@
 ChatTemplatePath = Union[Path, Callable[[str], Optional[Path]]]
 
 
-def _get_qwen_chat_template_fallback(
-        tokenizer_name_or_path: str) -> Optional[Path]:
+def _get_qwen_chat_template_fallback(tokenizer_name_or_path: str) -> Optional[Path]:
     if tokenizer_name_or_path.endswith("-Chat"):
         return CHAT_TEMPLATES_DIR / "template_chatml.jinja"
 
     return CHAT_TEMPLATES_DIR / "template_basic.jinja"
 
 
-def _get_minicpmv_chat_template_fallback(
-        tokenizer_name_or_path: str) -> Optional[Path]:
+def _get_minicpmv_chat_template_fallback(tokenizer_name_or_path: str) -> Optional[Path]:
     # MiniCPM-V-4.5 version uses a dedicated template
     if "4.5" in tokenizer_name_or_path or "4_5" in tokenizer_name_or_path:
         return CHAT_TEMPLATES_DIR / "template_minicpmv45.jinja"
@@ -51,8 +49,10 @@ def register_chat_template_fallback_path(
     if model_type in _MODEL_TYPE_TO_CHAT_TEMPLATE_FALLBACK:
         logger.warning(
             "Model type %s already has a chat template registered. "
-            "It will be overwritten by the new chat template %s.", model_type,
-            chat_template)
+            "It will be overwritten by the new chat template %s.",
+            model_type,
+            chat_template,
+        )
 
     _MODEL_TYPE_TO_CHAT_TEMPLATE_FALLBACK[model_type] = chat_template
 
diff --git a/vllm/transformers_utils/config.py b/vllm/transformers_utils/config.py
index 8d340f88fa25..ab3eb6de4780 100644
--- a/vllm/transformers_utils/config.py
+++ b/vllm/transformers_utils/config.py
@@ -10,26 +10,32 @@
 from typing import Any, Callable, Literal, Optional, TypeVar, Union
 
 import huggingface_hub
-from huggingface_hub import get_safetensors_metadata, hf_hub_download
+from huggingface_hub import (
+    get_safetensors_metadata,
+    hf_hub_download,
+    try_to_load_from_cache,
+)
 from huggingface_hub import list_repo_files as hf_list_repo_files
-from huggingface_hub import try_to_load_from_cache
-from huggingface_hub.utils import (EntryNotFoundError, HfHubHTTPError,
-                                   LocalEntryNotFoundError,
-                                   RepositoryNotFoundError,
-                                   RevisionNotFoundError)
+from huggingface_hub.utils import (
+    EntryNotFoundError,
+    HfHubHTTPError,
+    LocalEntryNotFoundError,
+    RepositoryNotFoundError,
+    RevisionNotFoundError,
+)
 from transformers import GenerationConfig, PretrainedConfig
-from transformers.models.auto.image_processing_auto import (
-    get_image_processor_config)
-from transformers.models.auto.modeling_auto import (
-    MODEL_FOR_CAUSAL_LM_MAPPING_NAMES)
+from transformers.models.auto.image_processing_auto import get_image_processor_config
+from transformers.models.auto.modeling_auto import MODEL_FOR_CAUSAL_LM_MAPPING_NAMES
 from transformers.models.auto.tokenization_auto import get_tokenizer_config
 from transformers.utils import CONFIG_NAME as HF_CONFIG_NAME
 
 from vllm import envs
 from vllm.logger import init_logger
 from vllm.transformers_utils.config_parser_base import ConfigParserBase
-from vllm.transformers_utils.utils import (check_gguf_file,
-                                           parse_safetensors_file_metadata)
+from vllm.transformers_utils.utils import (
+    check_gguf_file,
+    parse_safetensors_file_metadata,
+)
 
 if envs.VLLM_USE_MODELSCOPE:
     from modelscope import AutoConfig
@@ -45,21 +51,21 @@ def _get_hf_token() -> Optional[str]:
     """
     Get the HuggingFace token from environment variable.
 
-    Returns None if the token is not set, is an empty string, 
+    Returns None if the token is not set, is an empty string,
     or contains only whitespace.
     This follows the same pattern as huggingface_hub library which
     treats empty string tokens as None to avoid authentication errors.
     """
-    token = os.getenv('HF_TOKEN')
+    token = os.getenv("HF_TOKEN")
     if token and token.strip():
         return token
     return None
 
 
 class LazyConfigDict(dict):
-
     def __getitem__(self, key):
         import vllm.transformers_utils.configs as configs
+
         return getattr(configs, super().__getitem__(key))
 
 
@@ -84,30 +90,28 @@ def __getitem__(self, key):
     ultravox="UltravoxConfig",
     step3_vl="Step3VLConfig",
     step3_text="Step3TextConfig",
-    qwen3_next="Qwen3NextConfig")
+    qwen3_next="Qwen3NextConfig",
+)
 
 _CONFIG_ATTRS_MAPPING: dict[str, str] = {
     "llm_config": "text_config",
 }
 
 _AUTO_CONFIG_KWARGS_OVERRIDES: dict[str, dict[str, Any]] = {
-    "internvl_chat": {
-        "has_no_defaults_at_init": True
-    },
-    "NVLM_D": {
-        "has_no_defaults_at_init": True
-    },
+    "internvl_chat": {"has_no_defaults_at_init": True},
+    "NVLM_D": {"has_no_defaults_at_init": True},
 }
 
 
 class HFConfigParser(ConfigParserBase):
-
-    def parse(self,
-              model: Union[str, Path],
-              trust_remote_code: bool,
-              revision: Optional[str] = None,
-              code_revision: Optional[str] = None,
-              **kwargs) -> tuple[dict, PretrainedConfig]:
+    def parse(
+        self,
+        model: Union[str, Path],
+        trust_remote_code: bool,
+        revision: Optional[str] = None,
+        code_revision: Optional[str] = None,
+        **kwargs,
+    ) -> tuple[dict, PretrainedConfig]:
         kwargs["local_files_only"] = huggingface_hub.constants.HF_HUB_OFFLINE
         config_dict, _ = PretrainedConfig.get_config_dict(
             model,
@@ -119,8 +123,11 @@ def parse(self,
         # Use custom model class if it's in our registry
         model_type = config_dict.get("model_type")
         if model_type is None:
-            model_type = "speculators" if config_dict.get(
-                "speculators_config") is not None else model_type
+            model_type = (
+                "speculators"
+                if config_dict.get("speculators_config") is not None
+                else model_type
+            )
 
         if model_type in _CONFIG_REGISTRY:
             config_class = _CONFIG_REGISTRY[model_type]
@@ -133,8 +140,7 @@ def parse(self,
             )
         else:
             try:
-                kwargs = _maybe_update_auto_config_kwargs(
-                    kwargs, model_type=model_type)
+                kwargs = _maybe_update_auto_config_kwargs(kwargs, model_type=model_type)
                 config = AutoConfig.from_pretrained(
                     model,
                     trust_remote_code=trust_remote_code,
@@ -144,15 +150,17 @@ def parse(self,
                     **kwargs,
                 )
             except ValueError as e:
-                if (not trust_remote_code
-                        and "requires you to execute the configuration file"
-                        in str(e)):
+                if (
+                    not trust_remote_code
+                    and "requires you to execute the configuration file" in str(e)
+                ):
                     err_msg = (
                         "Failed to load the model config. If the model "
                         "is a custom model not yet available in the "
                         "HuggingFace transformers library, consider setting "
                         "`trust_remote_code=True` in LLM or using the "
-                        "`--trust-remote-code` flag in the CLI.")
+                        "`--trust-remote-code` flag in the CLI."
+                    )
                     raise RuntimeError(err_msg) from e
                 else:
                     raise e
@@ -161,20 +169,23 @@ def parse(self,
 
 
 class MistralConfigParser(ConfigParserBase):
-
-    def parse(self,
-              model: Union[str, Path],
-              trust_remote_code: bool,
-              revision: Optional[str] = None,
-              code_revision: Optional[str] = None,
-              **kwargs) -> tuple[dict, PretrainedConfig]:
+    def parse(
+        self,
+        model: Union[str, Path],
+        trust_remote_code: bool,
+        revision: Optional[str] = None,
+        code_revision: Optional[str] = None,
+        **kwargs,
+    ) -> tuple[dict, PretrainedConfig]:
         # This function loads a params.json config which
         # should be used when loading models in mistral format
         config_dict = _download_mistral_config_file(model, revision)
-        if (max_position_embeddings :=
-                config_dict.get("max_position_embeddings")) is None:
+        if (
+            max_position_embeddings := config_dict.get("max_position_embeddings")
+        ) is None:
             max_position_embeddings = _maybe_retrieve_max_pos_from_hf(
-                model, revision, **kwargs)
+                model, revision, **kwargs
+            )
             config_dict["max_position_embeddings"] = max_position_embeddings
 
         from vllm.transformers_utils.configs.mistral import adapt_config_dict
@@ -183,8 +194,9 @@ def parse(self,
 
         # Mistral configs may define sliding_window as list[int]. Convert it
         # to int and add the layer_types list[str] to make it HF compatible
-        if ((sliding_window := getattr(config, "sliding_window", None))
-                and isinstance(sliding_window, list)):
+        if (sliding_window := getattr(config, "sliding_window", None)) and isinstance(
+            sliding_window, list
+        ):
             pattern_repeats = config.num_hidden_layers // len(sliding_window)
             layer_types = sliding_window * pattern_repeats
             config.layer_types = [
@@ -216,44 +228,51 @@ def get_config_parser(config_format: str) -> ConfigParserBase:
 
 
 def register_config_parser(config_format: str):
-
     """Register a customized vllm config parser.
-    When a config format is not supported by vllm, you can register a customized
-   config parser to support it.
-    Args:
-        config_format (str): The config parser format name.
-    Examples:
-
-        >>> from vllm.transformers_utils.config import (get_config_parser,
-                                                        register_config_parser)
-        >>> from vllm.transformers_utils.config_parser_base import ConfigParserBase
-        >>>
-        >>> @register_config_parser("custom_config_parser")
-        ... class CustomConfigParser(ConfigParserBase):
-        ...     def parse(self,
-        ...            model: Union[str, Path],
-        ...            trust_remote_code: bool,
-        ...            revision: Optional[str] = None,
-        ...            code_revision: Optional[str] = None,
-        ...           **kwargs) -> tuple[dict, PretrainedConfig]:
-        ...        raise NotImplementedError
-        >>>
-        >>> type(get_config_parser("custom_config_parser"))
-        <class 'CustomConfigParser'>
+     When a config format is not supported by vllm, you can register a customized
+    config parser to support it.
+     Args:
+         config_format (str): The config parser format name.
+     Examples:
+
+         >>> from vllm.transformers_utils.config import (get_config_parser,
+                                                         register_config_parser)
+         >>> from vllm.transformers_utils.config_parser_base import ConfigParserBase
+         >>>
+         >>> @register_config_parser("custom_config_parser")
+         ... class CustomConfigParser(ConfigParserBase):
+         ...     def parse(
+         ...         self,
+         ...         model: Union[str, Path],
+         ...         trust_remote_code: bool,
+         ...         revision: Optional[str] = None,
+         ...         code_revision: Optional[str] = None,
+         ...         **kwargs,
+         ...     ) -> tuple[dict, PretrainedConfig]:
+         ...         raise NotImplementedError
+         >>>
+         >>> type(get_config_parser("custom_config_parser"))
+         <class 'CustomConfigParser'>
     """  # noqa: E501
 
     def _wrapper(config_parser_cls):
         if config_format in _CONFIG_FORMAT_TO_CONFIG_PARSER:
             logger.warning(
                 "Config format `%s` is already registered, and will be "
-                "overwritten by the new parser class `%s`.", config_format,
-                config_parser_cls)
+                "overwritten by the new parser class `%s`.",
+                config_format,
+                config_parser_cls,
+            )
         if not issubclass(config_parser_cls, ConfigParserBase):
-            raise ValueError("The config parser must be a subclass of "
-                             "`ConfigParserBase`.")
+            raise ValueError(
+                "The config parser must be a subclass of `ConfigParserBase`."
+            )
         _CONFIG_FORMAT_TO_CONFIG_PARSER[config_format] = config_parser_cls
-        logger.info("Registered config parser `%s` with config format `%s`",
-                    config_parser_cls, config_format)
+        logger.info(
+            "Registered config parser `%s` with config format `%s`",
+            config_parser_cls,
+            config_format,
+        )
         return config_parser_cls
 
     return _wrapper
@@ -275,8 +294,9 @@ def with_retry(
             if attempt == max_retries - 1:
                 logger.error("%s: %s", log_msg, e)
                 raise
-            logger.error("%s: %s, retrying %d of %d", log_msg, e, attempt + 1,
-                         max_retries)
+            logger.error(
+                "%s: %s, retrying %d of %d", log_msg, e, attempt + 1, max_retries
+            )
             time.sleep(retry_delay)
             retry_delay *= 2
 
@@ -292,28 +312,27 @@ def list_repo_files(
     repo_type: Optional[str] = None,
     token: Union[str, bool, None] = None,
 ) -> list[str]:
-
     def lookup_files() -> list[str]:
         # directly list files if model is local
         if (local_path := Path(repo_id)).exists():
             return [
                 str(file.relative_to(local_path))
-                for file in local_path.rglob('*') if file.is_file()
+                for file in local_path.rglob("*")
+                if file.is_file()
             ]
         # if model is remote, use hf_hub api to list files
         try:
             if envs.VLLM_USE_MODELSCOPE:
-                from vllm.transformers_utils.utils import (
-                    modelscope_list_repo_files)
-                return modelscope_list_repo_files(repo_id,
-                                                  revision=revision,
-                                                  token=os.getenv(
-                                                      "MODELSCOPE_API_TOKEN",
-                                                      None))
-            return hf_list_repo_files(repo_id,
-                                      revision=revision,
-                                      repo_type=repo_type,
-                                      token=token)
+                from vllm.transformers_utils.utils import modelscope_list_repo_files
+
+                return modelscope_list_repo_files(
+                    repo_id,
+                    revision=revision,
+                    token=os.getenv("MODELSCOPE_API_TOKEN", None),
+                )
+            return hf_list_repo_files(
+                repo_id, revision=revision, repo_type=repo_type, token=token
+            )
         except huggingface_hub.errors.OfflineModeIsEnabled:
             # Don't raise in offline mode,
             # all we know is that we don't have this
@@ -331,23 +350,23 @@ def file_exists(
     revision: Optional[str] = None,
     token: Union[str, bool, None] = None,
 ) -> bool:
-    file_list = list_repo_files(repo_id,
-                                repo_type=repo_type,
-                                revision=revision,
-                                token=token)
+    file_list = list_repo_files(
+        repo_id, repo_type=repo_type, revision=revision, token=token
+    )
     return file_name in file_list
 
 
 # In offline mode the result can be a false negative
-def file_or_path_exists(model: Union[str, Path], config_name: str,
-                        revision: Optional[str]) -> bool:
+def file_or_path_exists(
+    model: Union[str, Path], config_name: str, revision: Optional[str]
+) -> bool:
     if (local_path := Path(model)).exists():
         return (local_path / config_name).is_file()
 
     # Offline mode support: Check if config file is cached already
-    cached_filepath = try_to_load_from_cache(repo_id=model,
-                                             filename=config_name,
-                                             revision=revision)
+    cached_filepath = try_to_load_from_cache(
+        repo_id=model, filename=config_name, revision=revision
+    )
     if isinstance(cached_filepath, str):
         # The config file exists in cache- we can continue trying to load
         return True
@@ -356,10 +375,9 @@ def file_or_path_exists(model: Union[str, Path], config_name: str,
     # hf_hub. This will fail in offline mode.
 
     # Call HF to check if the file exists
-    return file_exists(str(model),
-                       config_name,
-                       revision=revision,
-                       token=_get_hf_token())
+    return file_exists(
+        str(model), config_name, revision=revision, token=_get_hf_token()
+    )
 
 
 def patch_rope_scaling(config: PretrainedConfig) -> None:
@@ -381,7 +399,8 @@ def patch_rope_scaling_dict(rope_scaling: dict[str, Any]) -> None:
             raise ValueError(
                 f"Found conflicts between 'rope_type={rope_type}' (modern "
                 f"field) and 'type={rope_type_legacy}' (legacy field). "
-                "You should only specify one of them.")
+                "You should only specify one of them."
+            )
 
     if "rope_type" not in rope_scaling and "type" in rope_scaling:
         rope_scaling["rope_type"] = rope_scaling["type"]
@@ -409,8 +428,11 @@ def _uses_mrope(config: PretrainedConfig) -> bool:
 
 def uses_mrope(config: PretrainedConfig) -> bool:
     """Detect if the model with this config uses M-ROPE."""
-    return _uses_mrope(config) or _uses_mrope(
-        config.get_text_config()) or thinker_uses_mrope(config)
+    return (
+        _uses_mrope(config)
+        or _uses_mrope(config.get_text_config())
+        or thinker_uses_mrope(config)
+    )
 
 
 def thinker_uses_mrope(config: PretrainedConfig) -> bool:
@@ -432,8 +454,7 @@ def is_encoder_decoder(config: PretrainedConfig) -> bool:
     def _is_encoder_decoder(config: PretrainedConfig) -> bool:
         return getattr(config, "is_encoder_decoder", False)
 
-    return (_is_encoder_decoder(config)
-            or _is_encoder_decoder(config.get_text_config()))
+    return _is_encoder_decoder(config) or _is_encoder_decoder(config.get_text_config())
 
 
 def is_interleaved(config: PretrainedConfig) -> bool:
@@ -462,8 +483,7 @@ def _maybe_remap_hf_config_attrs(config: PretrainedConfig) -> PretrainedConfig:
         if hasattr(config, old_attr):
             if not hasattr(config, new_attr):
                 config.update({new_attr: getattr(config, old_attr)})
-            logger.debug("Remapped config attribute '%s' to '%s'", old_attr,
-                         new_attr)
+            logger.debug("Remapped config attribute '%s' to '%s'", old_attr, new_attr)
     return config
 
 
@@ -512,11 +532,11 @@ def maybe_override_with_speculators(
         return model, tokenizer, vllm_speculative_config
 
     # Speculators format detected - process overrides
-    from vllm.transformers_utils.configs.speculators.base import (
-        SpeculatorsConfig)
+    from vllm.transformers_utils.configs.speculators.base import SpeculatorsConfig
 
     speculative_config = SpeculatorsConfig.extract_vllm_speculative_config(
-        config_dict=config_dict)
+        config_dict=config_dict
+    )
 
     # Set the draft model to the speculators model
     speculative_config["model"] = model
@@ -535,8 +555,7 @@ def get_config(
     code_revision: Optional[str] = None,
     config_format: Union[str, ConfigFormat] = "auto",
     hf_overrides_kw: Optional[dict[str, Any]] = None,
-    hf_overrides_fn: Optional[Callable[[PretrainedConfig],
-                                       PretrainedConfig]] = None,
+    hf_overrides_fn: Optional[Callable[[PretrainedConfig], PretrainedConfig]] = None,
     **kwargs,
 ) -> PretrainedConfig:
     # Separate model folder from file path for GGUF models
@@ -548,12 +567,9 @@ def get_config(
 
     if config_format == "auto":
         try:
-            if is_gguf or file_or_path_exists(
-                    model, HF_CONFIG_NAME, revision=revision):
+            if is_gguf or file_or_path_exists(model, HF_CONFIG_NAME, revision=revision):
                 config_format = "hf"
-            elif file_or_path_exists(model,
-                                     MISTRAL_CONFIG_NAME,
-                                     revision=revision):
+            elif file_or_path_exists(model, MISTRAL_CONFIG_NAME, revision=revision):
                 config_format = "mistral"
             else:
                 raise ValueError(
@@ -561,7 +577,8 @@ def get_config(
                     "With config_format 'auto', ensure your model has either "
                     "config.json (HF format) or params.json (Mistral format). "
                     "Otherwise please specify your_custom_config_format "
-                    "in engine args for customized config parser.")
+                    "in engine args for customized config parser."
+                )
 
         except Exception as e:
             error_message = (
@@ -576,7 +593,8 @@ def get_config(
                 "'params.json'.\n"
                 "3. For GGUF: pass the local path of the GGUF checkpoint.\n"
                 "   Loading GGUF from a remote repo directly is not yet "
-                "supported.\n").format(model=model)
+                "supported.\n"
+            ).format(model=model)
 
             raise ValueError(error_message) from e
 
@@ -591,8 +609,7 @@ def get_config(
     # Special architecture mapping check for GGUF models
     if is_gguf:
         if config.model_type not in MODEL_FOR_CAUSAL_LM_MAPPING_NAMES:
-            raise RuntimeError(
-                f"Can't get gguf config for {config.model_type}.")
+            raise RuntimeError(f"Can't get gguf config for {config.model_type}.")
         model_type = MODEL_FOR_CAUSAL_LM_MAPPING_NAMES[config.model_type]
         config.update({"architectures": [model_type]})
 
@@ -602,29 +619,35 @@ def get_config(
 
     # ModelOpt 0.29.0 and before saves the quantization config in a separate
     # "hf_quant_config.json" in the same directory as the model config file.
-    if quantization_config is None \
-        and file_or_path_exists(model, "hf_quant_config.json", revision):
-        quantization_config = get_hf_file_to_dict("hf_quant_config.json",
-                                                  model, revision)
+    if quantization_config is None and file_or_path_exists(
+        model, "hf_quant_config.json", revision
+    ):
+        quantization_config = get_hf_file_to_dict(
+            "hf_quant_config.json", model, revision
+        )
 
     if quantization_config is not None:
         config.quantization_config = quantization_config
         # auto-enable DeepGEMM UE8M0 on Hopper if model config requests it
         scale_fmt = quantization_config.get("scale_fmt", None)
-        if scale_fmt in ("ue8m0", ):
+        if scale_fmt in ("ue8m0",):
             if not envs.is_set("VLLM_USE_DEEP_GEMM_E8M0_HOPPER"):
                 os.environ["VLLM_USE_DEEP_GEMM_E8M0_HOPPER"] = "1"
                 logger.info_once(
-                    ("Detected quantization_config.scale_fmt=%s; "
-                     "enabling Hopper UE8M0."),
+                    (
+                        "Detected quantization_config.scale_fmt=%s; "
+                        "enabling Hopper UE8M0."
+                    ),
                     scale_fmt,
                 )
             elif not envs.VLLM_USE_DEEP_GEMM_E8M0_HOPPER:
                 logger.warning_once(
-                    ("Model config requests UE8M0 "
-                     "(quantization_config.scale_fmt=%s), but "
-                     "VLLM_USE_DEEP_GEMM_E8M0_HOPPER=0 is set; "
-                     "Hopper UE8M0 disabled."),
+                    (
+                        "Model config requests UE8M0 "
+                        "(quantization_config.scale_fmt=%s), but "
+                        "VLLM_USE_DEEP_GEMM_E8M0_HOPPER=0 is set; "
+                        "Hopper UE8M0 disabled."
+                    ),
                     scale_fmt,
                 )
 
@@ -643,17 +666,17 @@ def get_config(
     return config
 
 
-def try_get_local_file(model: Union[str, Path],
-                       file_name: str,
-                       revision: Optional[str] = 'main') -> Optional[Path]:
+def try_get_local_file(
+    model: Union[str, Path], file_name: str, revision: Optional[str] = "main"
+) -> Optional[Path]:
     file_path = Path(model) / file_name
     if file_path.is_file():
         return file_path
     else:
         try:
-            cached_filepath = try_to_load_from_cache(repo_id=model,
-                                                     filename=file_name,
-                                                     revision=revision)
+            cached_filepath = try_to_load_from_cache(
+                repo_id=model, filename=file_name, revision=revision
+            )
             if isinstance(cached_filepath, str):
                 return Path(cached_filepath)
         except ValueError:
@@ -661,9 +684,9 @@ def try_get_local_file(model: Union[str, Path],
     return None
 
 
-def get_hf_file_to_dict(file_name: str,
-                        model: Union[str, Path],
-                        revision: Optional[str] = 'main'):
+def get_hf_file_to_dict(
+    file_name: str, model: Union[str, Path], revision: Optional[str] = "main"
+):
     """
     Downloads a file from the Hugging Face Hub and returns
     its contents as a dictionary.
@@ -678,25 +701,27 @@ def get_hf_file_to_dict(file_name: str,
     the contents of the downloaded file.
     """
 
-    file_path = try_get_local_file(model=model,
-                                   file_name=file_name,
-                                   revision=revision)
+    file_path = try_get_local_file(model=model, file_name=file_name, revision=revision)
 
     if file_path is None:
         try:
             hf_hub_file = hf_hub_download(model, file_name, revision=revision)
         except huggingface_hub.errors.OfflineModeIsEnabled:
             return None
-        except (RepositoryNotFoundError, RevisionNotFoundError,
-                EntryNotFoundError, LocalEntryNotFoundError) as e:
+        except (
+            RepositoryNotFoundError,
+            RevisionNotFoundError,
+            EntryNotFoundError,
+            LocalEntryNotFoundError,
+        ) as e:
             logger.debug("File or repository not found in hf_hub_download", e)
             return None
         except HfHubHTTPError as e:
             logger.warning(
-                "Cannot connect to Hugging Face Hub. Skipping file "
-                "download for '%s':",
+                "Cannot connect to Hugging Face Hub. Skipping file download for '%s':",
                 file_name,
-                exc_info=e)
+                exc_info=e,
+            )
             return None
         file_path = Path(hf_hub_file)
 
@@ -708,8 +733,7 @@ def get_hf_file_to_dict(file_name: str,
 
 
 @cache
-def get_pooling_config(model: str,
-                       revision: Optional[str] = 'main') -> Optional[dict]:
+def get_pooling_config(model: str, revision: Optional[str] = "main") -> Optional[dict]:
     """
     This function gets the pooling and normalize
     config from the model - only applies to
@@ -717,20 +741,20 @@ def get_pooling_config(model: str,
 
     Args:
         model: The name of the Hugging Face model.
-        revision: The specific version of the model to use. 
+        revision: The specific version of the model to use.
             Defaults to 'main'.
 
     Returns:
-        A dictionary containing the pooling type and whether 
+        A dictionary containing the pooling type and whether
             normalization is used, or None if no pooling configuration is found.
     """
 
     modules_file_name = "modules.json"
 
     modules_dict = None
-    if file_or_path_exists(model=model,
-                           config_name=modules_file_name,
-                           revision=revision):
+    if file_or_path_exists(
+        model=model, config_name=modules_file_name, revision=revision
+    ):
         modules_dict = get_hf_file_to_dict(modules_file_name, model, revision)
 
     if modules_dict is None:
@@ -738,20 +762,31 @@ def get_pooling_config(model: str,
 
     logger.info("Found sentence-transformers modules configuration.")
 
-    pooling = next((item for item in modules_dict
-                    if item["type"] == "sentence_transformers.models.Pooling"),
-                   None)
+    pooling = next(
+        (
+            item
+            for item in modules_dict
+            if item["type"] == "sentence_transformers.models.Pooling"
+        ),
+        None,
+    )
     normalize = bool(
-        next((item for item in modules_dict
-              if item["type"] == "sentence_transformers.models.Normalize"),
-             False))
+        next(
+            (
+                item
+                for item in modules_dict
+                if item["type"] == "sentence_transformers.models.Normalize"
+            ),
+            False,
+        )
+    )
 
     if pooling:
-
         pooling_file_name = "{}/config.json".format(pooling["path"])
         pooling_dict = get_hf_file_to_dict(pooling_file_name, model, revision)
         pooling_type_name = next(
-            (item for item, val in pooling_dict.items() if val is True), None)
+            (item for item, val in pooling_dict.items() if val is True), None
+        )
 
         if pooling_type_name is not None:
             pooling_type_name = get_pooling_config_name(pooling_type_name)
@@ -772,20 +807,19 @@ def get_pooling_config_name(pooling_name: str) -> Union[str, None]:
     if "lasttoken" in pooling_name:
         pooling_name = "last"
 
-    supported_pooling_types = ['LAST', 'ALL', 'CLS', 'STEP', 'MEAN']
+    supported_pooling_types = ["LAST", "ALL", "CLS", "STEP", "MEAN"]
     pooling_type_name = pooling_name.upper()
 
     if pooling_type_name in supported_pooling_types:
         return pooling_type_name
 
-    raise NotImplementedError(
-        f"Pooling type {pooling_type_name} not supported")
+    raise NotImplementedError(f"Pooling type {pooling_type_name} not supported")
 
 
 @cache
-def get_sentence_transformer_tokenizer_config(model: Union[str, Path],
-                                              revision: Optional[str] = 'main'
-                                              ):
+def get_sentence_transformer_tokenizer_config(
+    model: Union[str, Path], revision: Optional[str] = "main"
+):
     """
     Returns the tokenization configuration dictionary for a
     given Sentence Transformer BERT model.
@@ -812,9 +846,10 @@ def get_sentence_transformer_tokenizer_config(model: Union[str, Path],
     encoder_dict = None
 
     for config_file in sentence_transformer_config_files:
-        if try_get_local_file(model=model,
-                              file_name=config_file,
-                              revision=revision) is not None:
+        if (
+            try_get_local_file(model=model, file_name=config_file, revision=revision)
+            is not None
+        ):
             encoder_dict = get_hf_file_to_dict(config_file, model, revision)
             if encoder_dict:
                 break
@@ -822,16 +857,15 @@ def get_sentence_transformer_tokenizer_config(model: Union[str, Path],
     if not encoder_dict and not Path(model).is_absolute():
         try:
             # If model is on HuggingfaceHub, get the repo files
-            repo_files = list_repo_files(model,
-                                         revision=revision,
-                                         token=_get_hf_token())
+            repo_files = list_repo_files(
+                model, revision=revision, token=_get_hf_token()
+            )
         except Exception:
             repo_files = []
 
         for config_name in sentence_transformer_config_files:
             if config_name in repo_files:
-                encoder_dict = get_hf_file_to_dict(config_name, model,
-                                                   revision)
+                encoder_dict = get_hf_file_to_dict(config_name, model, revision)
                 if encoder_dict:
                     break
 
@@ -848,34 +882,39 @@ def get_sentence_transformer_tokenizer_config(model: Union[str, Path],
 def maybe_register_config_serialize_by_value() -> None:
     """Try to register HF model configuration class to serialize by value
 
-        If trust_remote_code is set, and the model's config file specifies an
-        `AutoConfig` class, then the config class is typically an instance of
-        a custom class imported from the HF modules cache.
-
-        Examples:
-
-        >>> from transformers import AutoConfig
-        >>> klass = AutoConfig.from_pretrained('meta-llama/Meta-Llama-3-8B', trust_remote_code=True)
-        >>> klass.__class__ # transformers.models.llama.configuration_llama.LlamaConfig
-        >>> import transformers_modules # error, not initialized
-        >>> klass = AutoConfig.from_pretrained('deepseek-ai/DeepSeek-V2.5', trust_remote_code=True)
-        >>> import transformers_modules # success, initialized
-        >>> klass.__class__ # transformers_modules.deepseek-ai.DeepSeek-V2.5.98b11844770b2c3ffc18b175c758a803640f4e77.configuration_deepseek.DeepseekV2Config
+    If trust_remote_code is set, and the model's config file specifies an
+    `AutoConfig` class, then the config class is typically an instance of
+    a custom class imported from the HF modules cache.
 
-        In the DeepSeek example, the config class is an instance of a custom
-        class that is not serializable by default. This class will not be
-        importable in spawned workers, and won't exist at all on
-        other nodes, which breaks serialization of the config.
-
-        In this function we tell the cloudpickle serialization library to pass
-        instances of these generated classes by value instead of by reference,
-        i.e. the class definition is serialized along with its data so that the
-        class module does not need to be importable on the receiving end.
+    Examples:
 
-        See: https://github.com/cloudpipe/cloudpickle?tab=readme-ov-file#overriding-pickles-serialization-mechanism-for-importable-constructs
-    """ # noqa
+    >>> from transformers import AutoConfig
+    >>> klass = AutoConfig.from_pretrained(
+    ...     "meta-llama/Meta-Llama-3-8B", trust_remote_code=True
+    ... )
+    >>> klass.__class__  # transformers.models.llama.configuration_llama.LlamaConfig
+    >>> import transformers_modules  # error, not initialized
+    >>> klass = AutoConfig.from_pretrained(
+    ...     "deepseek-ai/DeepSeek-V2.5", trust_remote_code=True
+    ... )
+    >>> import transformers_modules  # success, initialized
+    >>> klass.__class__  # transformers_modules.deepseek-ai.DeepSeek-V2.5.98b11844770b2c3ffc18b175c758a803640f4e77.configuration_deepseek.DeepseekV2Config
+
+    In the DeepSeek example, the config class is an instance of a custom
+    class that is not serializable by default. This class will not be
+    importable in spawned workers, and won't exist at all on
+    other nodes, which breaks serialization of the config.
+
+    In this function we tell the cloudpickle serialization library to pass
+    instances of these generated classes by value instead of by reference,
+    i.e. the class definition is serialized along with its data so that the
+    class module does not need to be importable on the receiving end.
+
+    See: https://github.com/cloudpipe/cloudpickle?tab=readme-ov-file#overriding-pickles-serialization-mechanism-for-importable-constructs
+    """  # noqa
     try:
         import transformers_modules
+
         transformers_modules_available = True
     except ImportError:
         transformers_modules_available = False
@@ -892,7 +931,7 @@ class module does not need to be importable on the receiving end.
         # serialization of VllmConfig objects that may contain custom configs
         # from transformers_modules
         def _reduce_config(config: VllmConfig):
-            return (pickle.loads, (cloudpickle.dumps(config), ))
+            return (pickle.loads, (cloudpickle.dumps(config),))
 
         multiprocessing.reducer.register(VllmConfig, _reduce_config)
 
@@ -902,6 +941,7 @@ def _reduce_config(config: VllmConfig):
 
             # ray vendors its own version of cloudpickle
             from vllm.executor.ray_utils import ray
+
             if ray:
                 ray.cloudpickle.register_pickle_by_value(transformers_modules)
 
@@ -911,7 +951,8 @@ def _reduce_config(config: VllmConfig):
             " trust_remote_code with by-value serialization. This may"
             " lead to a later error. If remote code is not needed"
             " remove `--trust-remote-code`",
-            exc_info=e)
+            exc_info=e,
+        )
 
 
 def get_hf_image_processor_config(
@@ -926,10 +967,9 @@ def get_hf_image_processor_config(
     # Separate model folder from file path for GGUF models
     if check_gguf_file(model):
         model = Path(model).parent
-    return get_image_processor_config(model,
-                                      token=hf_token,
-                                      revision=revision,
-                                      **kwargs)
+    return get_image_processor_config(
+        model, token=hf_token, revision=revision, **kwargs
+    )
 
 
 def get_hf_text_config(config: PretrainedConfig):
@@ -984,8 +1024,9 @@ def try_get_safetensors_metadata(
     )
 
     try:
-        return with_retry(get_safetensors_metadata_partial,
-                          "Error retrieving safetensors")
+        return with_retry(
+            get_safetensors_metadata_partial, "Error retrieving safetensors"
+        )
     except Exception:
         return None
 
@@ -1018,9 +1059,9 @@ def get_safetensors_params_metadata(
         safetensors_to_check = model_path.glob("*.safetensors")
         full_metadata = {
             param_name: info
-            for file_path in safetensors_to_check if file_path.is_file()
-            for param_name, info in parse_safetensors_file_metadata(
-                file_path).items()
+            for file_path in safetensors_to_check
+            if file_path.is_file()
+            for param_name, info in parse_safetensors_file_metadata(file_path).items()
         }
     else:
         repo_mt = try_get_safetensors_metadata(model, revision=revision)
@@ -1040,7 +1081,8 @@ def _download_mistral_config_file(model, revision) -> dict:
         raise ValueError(
             f"Failed to load mistral '{config_file_name}' config for model "
             f"{model}. Please check if the model is a mistral-format model "
-            f"and if the config file exists.")
+            f"and if the config file exists."
+        )
     assert isinstance(config_dict, dict)
     return config_dict
 
@@ -1049,10 +1091,12 @@ def _maybe_retrieve_max_pos_from_hf(model, revision, **kwargs) -> int:
     max_position_embeddings = 128_000
     try:
         trust_remote_code_val = kwargs.get("trust_remote_code", False)
-        hf_config = get_config(model=model,
-                               trust_remote_code=trust_remote_code_val,
-                               revision=revision,
-                               config_format="hf")
+        hf_config = get_config(
+            model=model,
+            trust_remote_code=trust_remote_code_val,
+            revision=revision,
+            config_format="hf",
+        )
         if hf_value := hf_config.get_text_config().max_position_embeddings:
             max_position_embeddings = hf_value
     except Exception as e:
@@ -1060,7 +1104,8 @@ def _maybe_retrieve_max_pos_from_hf(model, revision, **kwargs) -> int:
             "The params.json file is missing 'max_position_embeddings'"
             " and could not get a value from the HF config."
             " Defaulting to 128000",
-            exc_info=e)
+            exc_info=e,
+        )
 
     return max_position_embeddings
 
@@ -1076,29 +1121,28 @@ def get_model_path(model: Union[str, Path], revision: Optional[str] = None):
 
     if envs.VLLM_USE_MODELSCOPE:
         from modelscope.hub.snapshot_download import snapshot_download
+
         return snapshot_download(model_id=model, **common_kwargs)
 
     from huggingface_hub import snapshot_download
+
     return snapshot_download(repo_id=model, **common_kwargs)
 
 
-def get_hf_file_bytes(file_name: str,
-                      model: Union[str, Path],
-                      revision: Optional[str] = 'main') -> Optional[bytes]:
+def get_hf_file_bytes(
+    file_name: str, model: Union[str, Path], revision: Optional[str] = "main"
+) -> Optional[bytes]:
     """Get file contents from HuggingFace repository as bytes."""
-    file_path = try_get_local_file(model=model,
-                                   file_name=file_name,
-                                   revision=revision)
+    file_path = try_get_local_file(model=model, file_name=file_name, revision=revision)
 
     if file_path is None:
-        hf_hub_file = hf_hub_download(model,
-                                      file_name,
-                                      revision=revision,
-                                      token=_get_hf_token())
+        hf_hub_file = hf_hub_download(
+            model, file_name, revision=revision, token=_get_hf_token()
+        )
         file_path = Path(hf_hub_file)
 
     if file_path is not None and file_path.is_file():
-        with open(file_path, 'rb') as file:
+        with open(file_path, "rb") as file:
             return file.read()
 
     return None
diff --git a/vllm/transformers_utils/config_parser_base.py b/vllm/transformers_utils/config_parser_base.py
index c27177f74d4b..0e1c49b428b0 100644
--- a/vllm/transformers_utils/config_parser_base.py
+++ b/vllm/transformers_utils/config_parser_base.py
@@ -9,12 +9,13 @@
 
 
 class ConfigParserBase(ABC):
-
     @abstractmethod
-    def parse(self,
-              model: Union[str, Path],
-              trust_remote_code: bool,
-              revision: Optional[str] = None,
-              code_revision: Optional[str] = None,
-              **kwargs) -> tuple[dict, PretrainedConfig]:
+    def parse(
+        self,
+        model: Union[str, Path],
+        trust_remote_code: bool,
+        revision: Optional[str] = None,
+        code_revision: Optional[str] = None,
+        **kwargs,
+    ) -> tuple[dict, PretrainedConfig]:
         raise NotImplementedError
diff --git a/vllm/transformers_utils/configs/__init__.py b/vllm/transformers_utils/configs/__init__.py
index 1b33b5e70e0b..72c90e073131 100644
--- a/vllm/transformers_utils/configs/__init__.py
+++ b/vllm/transformers_utils/configs/__init__.py
@@ -12,6 +12,7 @@
 from vllm.transformers_utils.configs.deepseek_vl2 import DeepseekVLV2Config
 from vllm.transformers_utils.configs.dotsocr import DotsOCRConfig
 from vllm.transformers_utils.configs.eagle import EAGLEConfig
+
 # RWConfig is for the original tiiuae/falcon-40b(-instruct) and
 # tiiuae/falcon-7b(-instruct) models. Newer Falcon models will use the
 # `FalconConfig` class from the official HuggingFace transformers library.
@@ -30,9 +31,11 @@
 from vllm.transformers_utils.configs.qwen3_next import Qwen3NextConfig
 from vllm.transformers_utils.configs.radio import RadioConfig
 from vllm.transformers_utils.configs.speculators.base import SpeculatorsConfig
-from vllm.transformers_utils.configs.step3_vl import (Step3TextConfig,
-                                                      Step3VisionEncoderConfig,
-                                                      Step3VLConfig)
+from vllm.transformers_utils.configs.step3_vl import (
+    Step3TextConfig,
+    Step3VisionEncoderConfig,
+    Step3VLConfig,
+)
 from vllm.transformers_utils.configs.ultravox import UltravoxConfig
 
 __all__ = [
diff --git a/vllm/transformers_utils/configs/chatglm.py b/vllm/transformers_utils/configs/chatglm.py
index 176d2b8f63fe..1d795b55c8bc 100644
--- a/vllm/transformers_utils/configs/chatglm.py
+++ b/vllm/transformers_utils/configs/chatglm.py
@@ -13,33 +13,35 @@ class ChatGLMConfig(PretrainedConfig):
         "n_head_kv": "multi_query_group_num",
     }
 
-    def __init__(self,
-                 num_layers=28,
-                 padded_vocab_size=65024,
-                 hidden_size=4096,
-                 ffn_hidden_size=13696,
-                 kv_channels=128,
-                 num_attention_heads=32,
-                 seq_length=2048,
-                 hidden_dropout=0.0,
-                 attention_dropout=0.0,
-                 layernorm_epsilon=1e-5,
-                 rmsnorm=True,
-                 apply_residual_connection_post_layernorm=False,
-                 post_layer_norm=True,
-                 add_bias_linear=False,
-                 add_qkv_bias=False,
-                 interleaved_qkv=False,
-                 bias_dropout_fusion=True,
-                 multi_query_attention=False,
-                 multi_query_group_num=1,
-                 apply_query_key_layer_scaling=True,
-                 attention_softmax_in_fp32=True,
-                 fp32_residual_connection=False,
-                 quantization_bit=0,
-                 pre_seq_len=None,
-                 prefix_projection=False,
-                 **kwargs):
+    def __init__(
+        self,
+        num_layers=28,
+        padded_vocab_size=65024,
+        hidden_size=4096,
+        ffn_hidden_size=13696,
+        kv_channels=128,
+        num_attention_heads=32,
+        seq_length=2048,
+        hidden_dropout=0.0,
+        attention_dropout=0.0,
+        layernorm_epsilon=1e-5,
+        rmsnorm=True,
+        apply_residual_connection_post_layernorm=False,
+        post_layer_norm=True,
+        add_bias_linear=False,
+        add_qkv_bias=False,
+        interleaved_qkv=False,
+        bias_dropout_fusion=True,
+        multi_query_attention=False,
+        multi_query_group_num=1,
+        apply_query_key_layer_scaling=True,
+        attention_softmax_in_fp32=True,
+        fp32_residual_connection=False,
+        quantization_bit=0,
+        pre_seq_len=None,
+        prefix_projection=False,
+        **kwargs,
+    ):
         self.num_layers = num_layers
         self.vocab_size = padded_vocab_size
         self.padded_vocab_size = padded_vocab_size
@@ -55,7 +57,8 @@ def __init__(self,
         self.layernorm_epsilon = layernorm_epsilon
         self.rmsnorm = rmsnorm
         self.apply_residual_connection_post_layernorm = (
-            apply_residual_connection_post_layernorm)
+            apply_residual_connection_post_layernorm
+        )
         self.post_layer_norm = post_layer_norm
         self.add_bias_linear = add_bias_linear
         self.add_qkv_bias = add_qkv_bias
diff --git a/vllm/transformers_utils/configs/deepseek_v3.py b/vllm/transformers_utils/configs/deepseek_v3.py
index 4b26cdfd94b5..91fbed79dd02 100644
--- a/vllm/transformers_utils/configs/deepseek_v3.py
+++ b/vllm/transformers_utils/configs/deepseek_v3.py
@@ -7,7 +7,6 @@
 
 
 class DeepseekV3Config(PretrainedConfig):
-
     model_type = "deepseek_v3"
     keys_to_ignore_at_inference = ["past_key_values"]
 
@@ -30,14 +29,14 @@ def __init__(
         qk_rope_head_dim=64,
         v_head_dim=128,
         qk_nope_head_dim=128,
-        topk_method='noaux_tc',
+        topk_method="noaux_tc",
         n_group=8,
         topk_group=4,
         num_experts_per_tok=8,
         moe_layer_freq=1,
         first_k_dense_replace=3,
         norm_topk_prob=True,
-        scoring_func='sigmoid',
+        scoring_func="sigmoid",
         hidden_act="silu",
         max_position_embeddings=4096,
         initializer_range=0.02,
diff --git a/vllm/transformers_utils/configs/deepseek_vl2.py b/vllm/transformers_utils/configs/deepseek_vl2.py
index 957d63831841..7abfe6229842 100644
--- a/vllm/transformers_utils/configs/deepseek_vl2.py
+++ b/vllm/transformers_utils/configs/deepseek_vl2.py
@@ -25,20 +25,22 @@ class VisionEncoderConfig(PretrainedConfig):
     deterministic: bool = False
     num_recomputing_layers: int = 0
 
-    def __init__(self,
-                 model_name: str = "vit_so400m_patch14_siglip_384.webli",
-                 image_size: int = 384,
-                 patch_size: int = 16,
-                 width: int = 1024,
-                 layers: int = 24,
-                 heads: int = 16,
-                 mlp_ratio: int = 4,
-                 global_pool: str = "map",
-                 ignore_head: bool = True,
-                 class_token: bool = False,
-                 num_classes: int = 0,
-                 use_checkpoint: bool = False,
-                 **kwargs):
+    def __init__(
+        self,
+        model_name: str = "vit_so400m_patch14_siglip_384.webli",
+        image_size: int = 384,
+        patch_size: int = 16,
+        width: int = 1024,
+        layers: int = 24,
+        heads: int = 16,
+        mlp_ratio: int = 4,
+        global_pool: str = "map",
+        ignore_head: bool = True,
+        class_token: bool = False,
+        num_classes: int = 0,
+        use_checkpoint: bool = False,
+        **kwargs,
+    ):
         self.model_name = model_name
         self.image_size = image_size
         self.patch_size = patch_size
@@ -65,14 +67,16 @@ class MlpProjectorConfig(PretrainedConfig):
     downsample_ratio: int = 2
     token_pooling: bool = False
 
-    def __init__(self,
-                 projector_type: str = "downsample_mlp_gelu",
-                 input_dim: int = 1152,
-                 n_embed: int = 2048,
-                 depth: int = 2,
-                 mlp_ratio: int = 1,
-                 downsample_ratio: int = 2,
-                 **kwargs):
+    def __init__(
+        self,
+        projector_type: str = "downsample_mlp_gelu",
+        input_dim: int = 1152,
+        n_embed: int = 2048,
+        depth: int = 2,
+        mlp_ratio: int = 1,
+        downsample_ratio: int = 2,
+        **kwargs,
+    ):
         self.projector_type = projector_type
         self.input_dim = input_dim
         self.n_embed = n_embed
@@ -84,7 +88,6 @@ def __init__(self,
 
 
 class DeepseekV2Config(PretrainedConfig):
-
     model_type = "deepseek_v2"
     keys_to_ignore_at_inference = ["past_key_values"]
 
@@ -106,14 +109,14 @@ def __init__(
         qk_rope_head_dim=64,
         v_head_dim=128,
         qk_nope_head_dim=128,
-        topk_method='gready',
+        topk_method="gready",
         n_group=None,
         topk_group=None,
         num_experts_per_tok=None,
         moe_layer_freq=1,
         first_k_dense_replace=0,
         norm_topk_prob=False,
-        scoring_func='softmax',
+        scoring_func="softmax",
         aux_loss_alpha=0.001,
         seq_aux=True,
         hidden_act="silu",
@@ -191,14 +194,15 @@ class DeepseekVLV2Config(PretrainedConfig):
 
     tile_tag: str = "2D"
     global_view_pos: str = "head"
-    candidate_resolutions: tuple[tuple[int, int]] = ((384, 384), )
-
-    def __init__(self,
-                 tile_tag: str = "tile_tag",
-                 global_view_pos: str = "head",
-                 candidate_resolutions: tuple[tuple[int,
-                                                    int]] = ((384, 384), ),
-                 **kwargs):
+    candidate_resolutions: tuple[tuple[int, int]] = ((384, 384),)
+
+    def __init__(
+        self,
+        tile_tag: str = "tile_tag",
+        global_view_pos: str = "head",
+        candidate_resolutions: tuple[tuple[int, int]] = ((384, 384),),
+        **kwargs,
+    ):
         super().__init__(**kwargs)
 
         vision_config = kwargs.get("vision_config", {})
diff --git a/vllm/transformers_utils/configs/dotsocr.py b/vllm/transformers_utils/configs/dotsocr.py
index 6bb3c12d9c7e..446693b9a32e 100644
--- a/vllm/transformers_utils/configs/dotsocr.py
+++ b/vllm/transformers_utils/configs/dotsocr.py
@@ -53,12 +53,14 @@ def __init__(
 class DotsOCRConfig(Qwen2Config):
     model_type = "dots_ocr"
 
-    def __init__(self,
-                 image_token_id=151665,
-                 video_token_id=151656,
-                 vision_config: Optional[dict] = None,
-                 *args,
-                 **kwargs):
+    def __init__(
+        self,
+        image_token_id=151665,
+        video_token_id=151656,
+        vision_config: Optional[dict] = None,
+        *args,
+        **kwargs,
+    ):
         super().__init__(*args, **kwargs)
         self.image_token_id = image_token_id
         self.video_token_id = video_token_id
diff --git a/vllm/transformers_utils/configs/eagle.py b/vllm/transformers_utils/configs/eagle.py
index 444ed70de3d0..6e18513d1234 100644
--- a/vllm/transformers_utils/configs/eagle.py
+++ b/vllm/transformers_utils/configs/eagle.py
@@ -12,12 +12,13 @@
 class EAGLEConfig(PretrainedConfig):
     model_type = "eagle"
 
-    def __init__(self,
-                 model: Union[PretrainedConfig, dict, None] = None,
-                 truncated_vocab_size: Optional[int] = None,
-                 method: Optional[str] = 'eagle',
-                 **kwargs):
-
+    def __init__(
+        self,
+        model: Union[PretrainedConfig, dict, None] = None,
+        truncated_vocab_size: Optional[int] = None,
+        method: Optional[str] = "eagle",
+        **kwargs,
+    ):
         model_config: Union[PretrainedConfig, DeepseekV2Config, None]
         if isinstance(model, dict):
             archs = model.get("architectures", [])
@@ -31,8 +32,7 @@ def __init__(self,
             model_config = model
 
         for k, v in kwargs.items():
-            if k != "architectures" and k != "model_type" and hasattr(
-                    model_config, k):
+            if k != "architectures" and k != "model_type" and hasattr(model_config, k):
                 setattr(model_config, k, v)
 
         self.model = model_config
@@ -40,31 +40,39 @@ def __init__(self,
         if self.model is None:
             self.truncated_vocab_size = None
         else:
-            self.truncated_vocab_size = self.model.vocab_size if \
-                truncated_vocab_size is None else truncated_vocab_size
+            self.truncated_vocab_size = (
+                self.model.vocab_size
+                if truncated_vocab_size is None
+                else truncated_vocab_size
+            )
 
         # Eagle model name should follow naming convention of
         # LlamaForCausalLM -> EagleLlamaForCausalLM
         # LlamaForCausalLM -> Eagle3LlamaForCausalLM
         # LlamaForCausalLMEagle3 -> LlamaForCausalLMEagle3
         if method == "eagle":
-            assert self.model is not None, \
+            assert self.model is not None, (
                 "model should not be None when method is eagle"
+            )
             kwargs["architectures"] = [
-                f"Eagle{arch}" if not arch.startswith("Eagle") \
-                    else arch for arch in self.model.architectures
+                f"Eagle{arch}" if not arch.startswith("Eagle") else arch
+                for arch in self.model.architectures
             ]
 
         elif method == "eagle3":
-            assert self.model is not None, \
+            assert self.model is not None, (
                 "model should not be None when method is eagle3"
+            )
             kwargs["architectures"] = [
-                arch if arch.startswith("Eagle3") or arch.endswith("Eagle3")
-                else f"Eagle3{arch}" for arch in self.model.architectures
+                arch
+                if arch.startswith("Eagle3") or arch.endswith("Eagle3")
+                else f"Eagle3{arch}"
+                for arch in self.model.architectures
             ]
         else:
-            raise ValueError(f"Invalid method {method}. "
-                             "Supported methods are eagle and eagle3.")
+            raise ValueError(
+                f"Invalid method {method}. Supported methods are eagle and eagle3."
+            )
 
         super().__init__(**kwargs)
 
@@ -80,5 +88,6 @@ def from_pretrained(
         **kwargs,
     ) -> "EAGLEConfig":
         config_dict, kwargs = cls.get_config_dict(
-            pretrained_model_name_or_path, **kwargs)
+            pretrained_model_name_or_path, **kwargs
+        )
         return cls.from_dict(config_dict, **kwargs)
diff --git a/vllm/transformers_utils/configs/falcon.py b/vllm/transformers_utils/configs/falcon.py
index 2f5400463d91..c646d241d4eb 100644
--- a/vllm/transformers_utils/configs/falcon.py
+++ b/vllm/transformers_utils/configs/falcon.py
@@ -19,6 +19,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """Falcon configuration"""
+
 from transformers.configuration_utils import PretrainedConfig
 
 
@@ -77,9 +78,7 @@ def __init__(
             # Hack for falcon-40b
             self.new_decoder_architecture = True
 
-        super().__init__(bos_token_id=bos_token_id,
-                         eos_token_id=eos_token_id,
-                         **kwargs)
+        super().__init__(bos_token_id=bos_token_id, eos_token_id=eos_token_id, **kwargs)
 
     @property
     def head_dim(self):
diff --git a/vllm/transformers_utils/configs/jais.py b/vllm/transformers_utils/configs/jais.py
index 3f50638f16b5..6b581bf18775 100644
--- a/vllm/transformers_utils/configs/jais.py
+++ b/vllm/transformers_utils/configs/jais.py
@@ -75,7 +75,7 @@ class JAISConfig(PretrainedConfig):
             Whether or not the model should return the last key/values
             attentions (not used by all models).
         scale_attn_by_inverse_layer_idx (`bool`, *optional*, default `True`):
-            Whether to additionally scale attention weights 
+            Whether to additionally scale attention weights
             by `1 / layer_idx + 1`.
         reorder_and_upcast_attn (`bool`, *optional*, defaults to `False`):
             Whether to scale keys (K) prior to computing attention
@@ -209,29 +209,35 @@ def _alibi_scaling_validation(self):
         if self.alibi_scaling is None:
             return
 
-        if (not isinstance(self.alibi_scaling, dict)
-                or len(self.alibi_scaling) != 2):
+        if not isinstance(self.alibi_scaling, dict) or len(self.alibi_scaling) != 2:
             raise ValueError(
                 "`alibi_scaling` must be a dictionary with two fields, "
                 "`type` and `factor` or `type` and `train_seq_len`, "
-                f"got {self.alibi_scaling}")
+                f"got {self.alibi_scaling}"
+            )
         alibi_scaling_type = self.alibi_scaling.get("type", None)
         alibi_scaling_factor = self.alibi_scaling.get("factor", None)
         alibi_dynamic_scaling = self.alibi_scaling.get("train_seq_len", None)
         if alibi_scaling_type is None or alibi_scaling_type != "linear":
-            raise ValueError(f"`alibi_scaling`'s type field must be 'linear', "
-                             f"got {alibi_scaling_type}")
-        if (alibi_scaling_factor is not None
-                and not isinstance(alibi_scaling_factor, float)
-                or (alibi_scaling_factor is not None
-                    and alibi_scaling_factor <= 1.0)):
+            raise ValueError(
+                f"`alibi_scaling`'s type field must be 'linear', "
+                f"got {alibi_scaling_type}"
+            )
+        if (
+            alibi_scaling_factor is not None
+            and not isinstance(alibi_scaling_factor, float)
+            or (alibi_scaling_factor is not None and alibi_scaling_factor <= 1.0)
+        ):
             raise ValueError(
                 f"`alibi_scaling`'s factor field must be a float > 1.0, "
-                f"got {alibi_scaling_factor}")
-        if (alibi_dynamic_scaling is not None
-                and not isinstance(alibi_dynamic_scaling, int)
-                or (alibi_dynamic_scaling is not None
-                    and alibi_dynamic_scaling <= 1)):
+                f"got {alibi_scaling_factor}"
+            )
+        if (
+            alibi_dynamic_scaling is not None
+            and not isinstance(alibi_dynamic_scaling, int)
+            or (alibi_dynamic_scaling is not None and alibi_dynamic_scaling <= 1)
+        ):
             raise ValueError(
                 f"`alibi_scaling`'s `train_seq_len` field must be an "
-                f"integer > 1, got {alibi_dynamic_scaling}")
+                f"integer > 1, got {alibi_dynamic_scaling}"
+            )
diff --git a/vllm/transformers_utils/configs/kimi_vl.py b/vllm/transformers_utils/configs/kimi_vl.py
index ae8dac0f381d..89a8878465b6 100644
--- a/vllm/transformers_utils/configs/kimi_vl.py
+++ b/vllm/transformers_utils/configs/kimi_vl.py
@@ -12,13 +12,15 @@
 class KimiVLConfig(PretrainedConfig):
     model_type = "kimi_vl"
 
-    def __init__(self,
-                 vision_config: Optional[Union[dict, MoonViTConfig]] = None,
-                 text_config: Optional[Union[dict, DeepseekV2Config]] = None,
-                 ignore_index: int = -100,
-                 media_placeholder_token_id: int = 163605,
-                 pad_token_id: int = 0,
-                 **kwargs):
+    def __init__(
+        self,
+        vision_config: Optional[Union[dict, MoonViTConfig]] = None,
+        text_config: Optional[Union[dict, DeepseekV2Config]] = None,
+        ignore_index: int = -100,
+        media_placeholder_token_id: int = 163605,
+        pad_token_id: int = 0,
+        **kwargs,
+    ):
         if vision_config is None:
             vision_config = MoonViTConfig()
         elif isinstance(vision_config, dict):
diff --git a/vllm/transformers_utils/configs/medusa.py b/vllm/transformers_utils/configs/medusa.py
index 9ba52956a8e8..7dcfd0cf26ae 100644
--- a/vllm/transformers_utils/configs/medusa.py
+++ b/vllm/transformers_utils/configs/medusa.py
@@ -10,16 +10,17 @@
 class MedusaConfig(PretrainedConfig):
     model_type = "medusa"
 
-    def __init__(self,
-                 hidden_size: int = 4096,
-                 vocab_size: int = 32001,
-                 num_heads: int = 5,
-                 num_hidden_layers: int = 1,
-                 max_paths: int = 64,
-                 topk: int = 10,
-                 truncated_vocab_size: Optional[int] = None,
-                 **kwargs):
-
+    def __init__(
+        self,
+        hidden_size: int = 4096,
+        vocab_size: int = 32001,
+        num_heads: int = 5,
+        num_hidden_layers: int = 1,
+        max_paths: int = 64,
+        topk: int = 10,
+        truncated_vocab_size: Optional[int] = None,
+        **kwargs,
+    ):
         self.hidden_size = hidden_size
         self.vocab_size = vocab_size
         self.num_heads = num_heads
@@ -27,8 +28,9 @@ def __init__(self,
         self.max_paths = max_paths
         self.topk = topk
         self.max_seq_len = int(2**20)
-        self.truncated_vocab_size = vocab_size if truncated_vocab_size is None\
-            else truncated_vocab_size
+        self.truncated_vocab_size = (
+            vocab_size if truncated_vocab_size is None else truncated_vocab_size
+        )
         if "architectures" not in kwargs:
             kwargs["architectures"] = ["MedusaModel"]
 
@@ -41,12 +43,13 @@ def from_pretrained(
         **kwargs,
     ) -> "MedusaConfig":
         config_dict, kwargs = cls.get_config_dict(
-            pretrained_model_name_or_path, **kwargs)
+            pretrained_model_name_or_path, **kwargs
+        )
         for k in list(config_dict.keys()):
-            if 'num' in k:
-                if 'heads' in k:
+            if "num" in k:
+                if "heads" in k:
                     config_dict["num_heads"] = config_dict.pop(k)
-                elif 'layers' in k:
+                elif "layers" in k:
                     config_dict["num_hidden_layers"] = config_dict.pop(k)
         return cls.from_dict(config_dict, **kwargs)
 
diff --git a/vllm/transformers_utils/configs/midashenglm.py b/vllm/transformers_utils/configs/midashenglm.py
index 1c23202e23c8..5c9e72be8ebf 100644
--- a/vllm/transformers_utils/configs/midashenglm.py
+++ b/vllm/transformers_utils/configs/midashenglm.py
@@ -25,7 +25,8 @@
 
 from transformers import PretrainedConfig
 from transformers.models.qwen2_5_omni.configuration_qwen2_5_omni import (
-    Qwen2_5OmniTextConfig)
+    Qwen2_5OmniTextConfig,
+)
 
 
 class DashengConfig(PretrainedConfig):
@@ -91,11 +92,13 @@ def __init__(
         audio_token_id: Optional[int] = None,
         **kwargs,
     ):
-        self.audio_encoder_config = DashengConfig(
-            **(audio_encoder_config or {}))
+        self.audio_encoder_config = DashengConfig(**(audio_encoder_config or {}))
         self.subsample_factor = subsample_factor
-        self.text_config = (Qwen2_5OmniTextConfig(
-            **text_config) if text_config else Qwen2_5OmniTextConfig())
+        self.text_config = (
+            Qwen2_5OmniTextConfig(**text_config)
+            if text_config
+            else Qwen2_5OmniTextConfig()
+        )
         self.text_config.rope_scaling = None  # uses_mrope is false
         self.audio_token_id = audio_token_id
         super().__init__(**kwargs)
diff --git a/vllm/transformers_utils/configs/mistral.py b/vllm/transformers_utils/configs/mistral.py
index 5d9206e18832..d5bf79e01f95 100644
--- a/vllm/transformers_utils/configs/mistral.py
+++ b/vllm/transformers_utils/configs/mistral.py
@@ -9,8 +9,7 @@
 logger = init_logger(__name__)
 
 
-def adapt_config_dict(config_dict: dict[str, Any],
-                      **kwargs) -> PretrainedConfig:
+def adapt_config_dict(config_dict: dict[str, Any], **kwargs) -> PretrainedConfig:
     config_dict.update(kwargs)
     config_dict = _remap_general_mistral_args(config_dict)
 
@@ -25,15 +24,16 @@ def adapt_config_dict(config_dict: dict[str, Any],
     if bool(config_dict.get("yarn")):
         config_dict = _remap_mistral_yarn_args(config_dict)
 
-    is_vision = ((config_dict.get("multimodal")
-                  or {}).get("vision_encoder_args")
-                 or config_dict.get("vision_encoder"))
+    is_vision = (config_dict.get("multimodal") or {}).get(
+        "vision_encoder_args"
+    ) or config_dict.get("vision_encoder")
     is_audio = bool(
-        ((config_dict.get("multimodal") or {}).get("whisper_model_args")
-         or {}).get("encoder_args"))
+        ((config_dict.get("multimodal") or {}).get("whisper_model_args") or {}).get(
+            "encoder_args"
+        )
+    )
 
-    assert not (is_vision and is_audio), \
-        "Vision and audio are mutually exclusive"
+    assert not (is_vision and is_audio), "Vision and audio are mutually exclusive"
 
     if is_vision:
         config_dict = _remap_mistral_vision_args(config_dict)
@@ -77,7 +77,7 @@ def _remap_mistral_yarn_args(config: dict) -> dict:
     config["rope_scaling"] = {
         "rope_type": "yarn",
         "mscale_all_dim": 1,  # We hardcoded this to 1
-        **renamed_yarn_config
+        **renamed_yarn_config,
     }
     return config
 
@@ -105,8 +105,7 @@ def _remap_general_mistral_args(config: dict) -> dict:
         if key in config:
             config[new_key] = config.pop(key)
 
-    for new_key, (key,
-                  default_value) in top_level_mapping_with_default.items():
+    for new_key, (key, default_value) in top_level_mapping_with_default.items():
         config[new_key] = config.pop(key, default_value)
 
     return config
@@ -116,16 +115,12 @@ def _remap_mistral_quantization_args(config: dict) -> dict:
     quantization = config.get("quantization", {})
     if quantization.get("qformat_weight") == "fp8_e4m3":
         # This maps to the FP8 static per-tensor quantization scheme
-        quantization_config = {
-            "quant_method": "fp8",
-            "activation_scheme": "static"
-        }
+        quantization_config = {"quant_method": "fp8", "activation_scheme": "static"}
     elif quantization.get("quant_method") == "compressed-tensors":
         # Pass through the quantization config to compressed-tensors
         quantization_config = quantization
     else:
-        raise ValueError(
-            f"Found unknown quantization='{quantization}' in config")
+        raise ValueError(f"Found unknown quantization='{quantization}' in config")
 
     config["quantization_config"] = quantization_config
 
@@ -139,13 +134,10 @@ def _remap_mistral_audio_args(config: dict) -> dict:
 
     quant_config = config.get("quantization_config")
     config = {
-        "model_type":
-        "whixtral",
+        "model_type": "whixtral",
         "architectures": ["VoxtralForConditionalGeneration"],
-        "text_config":
-        PretrainedConfig.from_dict(config),
-        "audio_config":
-        WhisperConfig(
+        "text_config": PretrainedConfig.from_dict(config),
+        "audio_config": WhisperConfig(
             num_mel_bins=encoder_args["audio_encoding_args"]["num_mel_bins"],
             window_size=encoder_args["audio_encoding_args"]["window_size"],
             sampling_rate=encoder_args["audio_encoding_args"]["sampling_rate"],
@@ -158,7 +150,7 @@ def _remap_mistral_audio_args(config: dict) -> dict:
             vocab_size=encoder_args["vocab_size"],
             max_source_positions=encoder_args["max_source_positions"],
             is_encoder_decoder=False,  # Override WhisperConfig default
-        )
+        ),
     }
     if quant_config:
         config["quantization_config"] = quant_config
diff --git a/vllm/transformers_utils/configs/mlp_speculator.py b/vllm/transformers_utils/configs/mlp_speculator.py
index 2fa284e5c9e8..45d76a8fdf26 100644
--- a/vllm/transformers_utils/configs/mlp_speculator.py
+++ b/vllm/transformers_utils/configs/mlp_speculator.py
@@ -13,16 +13,18 @@ class MLPSpeculatorConfig(PretrainedConfig):
         "hidden_size": "emb_dim",
     }
 
-    def __init__(self,
-                 vocab_size: int = 32000,
-                 emb_dim: int = 4096,
-                 inner_dim: int = 0,
-                 n_predict: int = 3,
-                 top_k_tokens_per_head: Optional[list[int]] = None,
-                 n_candidates: int = 5,
-                 tie_weights: bool = False,
-                 scale_input: bool = False,
-                 **kwargs):
+    def __init__(
+        self,
+        vocab_size: int = 32000,
+        emb_dim: int = 4096,
+        inner_dim: int = 0,
+        n_predict: int = 3,
+        top_k_tokens_per_head: Optional[list[int]] = None,
+        n_candidates: int = 5,
+        tie_weights: bool = False,
+        scale_input: bool = False,
+        **kwargs,
+    ):
         """
         Initialize an MLPSpeculatorConfig
 
diff --git a/vllm/transformers_utils/configs/moonvit.py b/vllm/transformers_utils/configs/moonvit.py
index a6f712f3d600..6e9b2897f4cc 100644
--- a/vllm/transformers_utils/configs/moonvit.py
+++ b/vllm/transformers_utils/configs/moonvit.py
@@ -8,16 +8,16 @@ class MoonViTConfig(PretrainedConfig):
     model_type = "moonvit"
 
     def __init__(
-            self,
-            patch_size: int = 14,
-            init_pos_emb_height: int = 64,
-            init_pos_emb_width: int = 64,
-            num_attention_heads: int = 16,
-            num_hidden_layers: int = 27,
-            hidden_size: int = 1152,
-            intermediate_size: int = 4304,
-            merge_kernel_size: tuple[int, int] = (2, 2),
-            **kwargs,
+        self,
+        patch_size: int = 14,
+        init_pos_emb_height: int = 64,
+        init_pos_emb_width: int = 64,
+        num_attention_heads: int = 16,
+        num_hidden_layers: int = 27,
+        hidden_size: int = 1152,
+        intermediate_size: int = 4304,
+        merge_kernel_size: tuple[int, int] = (2, 2),
+        **kwargs,
     ):
         super().__init__(**kwargs)
         self.patch_size = patch_size
diff --git a/vllm/transformers_utils/configs/nemotron.py b/vllm/transformers_utils/configs/nemotron.py
index 090fefa14203..60eed549561f 100644
--- a/vllm/transformers_utils/configs/nemotron.py
+++ b/vllm/transformers_utils/configs/nemotron.py
@@ -62,7 +62,7 @@ class NemotronConfig(PretrainedConfig):
             (MQA) otherwise GQA is used. When converting a multi-head
             checkpoint to a GQA checkpoint, each group key and value
             head should be constructed by meanpooling all the original
-            heads within that group. For more details checkout 
+            heads within that group. For more details checkout
             [this paper](https://arxiv.org/pdf/2305.13245.pdf). If it
             is not specified, will default to `num_attention_heads`.
         hidden_act (`str` or `function`, *optional*, defaults to `"relu2"`):
@@ -147,8 +147,9 @@ def __init__(
         self.num_hidden_layers = num_hidden_layers
         self.num_attention_heads = num_attention_heads
         head_dim = head_dim or kwargs.get("kv_channels")
-        self.head_dim = head_dim if head_dim is not None else (
-            hidden_size // num_attention_heads)
+        self.head_dim = (
+            head_dim if head_dim is not None else (hidden_size // num_attention_heads)
+        )
 
         # for backward compatibility
         if num_key_value_heads is None:
@@ -162,8 +163,11 @@ def __init__(
         self.rope_theta = rope_theta
         self.rope_scaling = rope_scaling
         # for backward compatibility
-        partial_rotary_factor = kwargs.get("rope_percent") or kwargs.get(
-            "rope_percentage") or partial_rotary_factor
+        partial_rotary_factor = (
+            kwargs.get("rope_percent")
+            or kwargs.get("rope_percentage")
+            or partial_rotary_factor
+        )
         self.partial_rotary_factor = partial_rotary_factor
         self._rope_scaling_validation()
         self.attention_bias = attention_bias
@@ -185,21 +189,24 @@ def _rope_scaling_validation(self):
         if self.rope_scaling is None:
             return
 
-        if not isinstance(self.rope_scaling, dict) or len(
-                self.rope_scaling) != 2:
+        if not isinstance(self.rope_scaling, dict) or len(self.rope_scaling) != 2:
             raise ValueError(
                 "`rope_scaling` must be a dictionary with two fields, "
-                f"`type` and `factor`, got {self.rope_scaling}")
+                f"`type` and `factor`, got {self.rope_scaling}"
+            )
         rope_scaling_type = self.rope_scaling.get("type", None)
         rope_scaling_factor = self.rope_scaling.get("factor", None)
-        if rope_scaling_type is None or rope_scaling_type not in [
-                "linear", "dynamic"
-        ]:
+        if rope_scaling_type is None or rope_scaling_type not in ["linear", "dynamic"]:
             raise ValueError(
                 "`rope_scaling`'s type field must be one of ['linear', "
-                f"'dynamic'], got {rope_scaling_type}")
-        if rope_scaling_factor is None or not isinstance(
-                rope_scaling_factor, float) or rope_scaling_factor <= 1.0:
+                f"'dynamic'], got {rope_scaling_type}"
+            )
+        if (
+            rope_scaling_factor is None
+            or not isinstance(rope_scaling_factor, float)
+            or rope_scaling_factor <= 1.0
+        ):
             raise ValueError(
                 "`rope_scaling`'s factor field must be a float > 1, got "
-                f"{rope_scaling_factor}")
\ No newline at end of file
+                f"{rope_scaling_factor}"
+            )
diff --git a/vllm/transformers_utils/configs/nemotron_h.py b/vllm/transformers_utils/configs/nemotron_h.py
index 581bed5716c1..c8b6784d6a8e 100644
--- a/vllm/transformers_utils/configs/nemotron_h.py
+++ b/vllm/transformers_utils/configs/nemotron_h.py
@@ -203,11 +203,11 @@ def __init__(
         # Validate hybrid_override_pattern
         # M: Mamba2, *: Attention, -: MLP
         assert len(self.hybrid_override_pattern) == self.num_hidden_layers, (
-            "hybrid_override_pattern must have same length as "
-            "num_hidden_layers")
+            "hybrid_override_pattern must have same length as num_hidden_layers"
+        )
         assert re.match(r"^[*-M]+$", self.hybrid_override_pattern), (
-            "hybrid_override_pattern must only contain characters "
-            "'M', '*', or '-'")
+            "hybrid_override_pattern must only contain characters 'M', '*', or '-'"
+        )
 
         # for backward compatibility
         if num_key_value_heads is None:
@@ -253,7 +253,10 @@ def __init__(
     @property
     def layers_block_type(self):
         return [
-            "mamba" if self.hybrid_override_pattern[i] == "M" else
-            "attention" if self.hybrid_override_pattern[i] == "*" else "mlp"
+            "mamba"
+            if self.hybrid_override_pattern[i] == "M"
+            else "attention"
+            if self.hybrid_override_pattern[i] == "*"
+            else "mlp"
             for i in range(self.num_hidden_layers)
         ]
diff --git a/vllm/transformers_utils/configs/olmo3.py b/vllm/transformers_utils/configs/olmo3.py
index 874507db43a7..f5a9a7cd36bd 100644
--- a/vllm/transformers_utils/configs/olmo3.py
+++ b/vllm/transformers_utils/configs/olmo3.py
@@ -5,7 +5,6 @@
 
 
 class Olmo3Config(PretrainedConfig):
-
     model_type = "olmo3"
     keys_to_ignore_at_inference = ["past_key_values"]
 
diff --git a/vllm/transformers_utils/configs/qwen3_next.py b/vllm/transformers_utils/configs/qwen3_next.py
index c7af26acd1b9..21750bde2f87 100644
--- a/vllm/transformers_utils/configs/qwen3_next.py
+++ b/vllm/transformers_utils/configs/qwen3_next.py
@@ -16,8 +16,7 @@
 # limitations under the License.
 """Qwen3-Next model configuration"""
 
-from transformers.configuration_utils import (PretrainedConfig,
-                                              layer_type_validation)
+from transformers.configuration_utils import PretrainedConfig, layer_type_validation
 from transformers.modeling_rope_utils import rope_config_validation
 from transformers.utils import logging
 
diff --git a/vllm/transformers_utils/configs/radio.py b/vllm/transformers_utils/configs/radio.py
index e1d96294d6ad..f13598034bae 100644
--- a/vllm/transformers_utils/configs/radio.py
+++ b/vllm/transformers_utils/configs/radio.py
@@ -81,11 +81,11 @@ def __init__(
         self.initializer_factor = initializer_factor
         self.hidden_act = hidden_act
         self.max_img_size = max_img_size
-        self.norm_mean = list(norm_mean) if isinstance(norm_mean,
-                                                       (tuple,
-                                                        list)) else norm_mean
-        self.norm_std = list(norm_std) if isinstance(norm_std,
-                                                     (tuple,
-                                                      list)) else norm_std
+        self.norm_mean = (
+            list(norm_mean) if isinstance(norm_mean, (tuple, list)) else norm_mean
+        )
+        self.norm_std = (
+            list(norm_std) if isinstance(norm_std, (tuple, list)) else norm_std
+        )
         self.reg_tokens = reg_tokens
         super().__init__(**kwargs)
diff --git a/vllm/transformers_utils/configs/speculators/algos.py b/vllm/transformers_utils/configs/speculators/algos.py
index efc87b6bcf26..1375eca28e41 100644
--- a/vllm/transformers_utils/configs/speculators/algos.py
+++ b/vllm/transformers_utils/configs/speculators/algos.py
@@ -5,7 +5,6 @@
 
 
 def register_speculator(name):
-
     def decorator(fn):
         SUPPORTED_SPECULATORS_TYPES[name] = fn
         return fn
@@ -17,7 +16,7 @@ def decorator(fn):
 def update_eagle3(config_dict: dict, vllm_config: dict) -> None:
     """
     Apply Eagle-3 specific configuration transformations.
-    
+
     Eagle-3 specific fields:
     - draft_vocab_size: Size of the draft model's vocabulary
     - target_hidden_size: Hidden size of the target model
@@ -27,6 +26,5 @@ def update_eagle3(config_dict: dict, vllm_config: dict) -> None:
     vllm_config["draft_vocab_size"] = config_dict.get("draft_vocab_size")
     if config_dict.get("target_hidden_size") is not None:
         vllm_config["target_hidden_size"] = config_dict["target_hidden_size"]
-    vllm_config["norm_before_residual"] = config_dict.get(
-        "norm_before_residual", True)
+    vllm_config["norm_before_residual"] = config_dict.get("norm_before_residual", True)
     vllm_config["architectures"] = ["Eagle3LlamaForCausalLM"]
diff --git a/vllm/transformers_utils/configs/speculators/base.py b/vllm/transformers_utils/configs/speculators/base.py
index 53128b4eecb0..1c415a43360e 100644
--- a/vllm/transformers_utils/configs/speculators/base.py
+++ b/vllm/transformers_utils/configs/speculators/base.py
@@ -6,7 +6,8 @@
 from transformers import PretrainedConfig
 
 from vllm.transformers_utils.configs.speculators.algos import (
-    SUPPORTED_SPECULATORS_TYPES)
+    SUPPORTED_SPECULATORS_TYPES,
+)
 
 __all__ = ["SpeculatorsConfig"]
 
@@ -21,27 +22,27 @@ def from_pretrained(
         **kwargs,
     ) -> "SpeculatorsConfig":
         """Load speculators Eagle config and convert to vLLM format."""
-        config_dict, _ = cls.get_config_dict(pretrained_model_name_or_path,
-                                             **kwargs)
+        config_dict, _ = cls.get_config_dict(pretrained_model_name_or_path, **kwargs)
 
         vllm_config = cls.extract_vllm_speculative_config(config_dict)
         return cls(**vllm_config)
 
     @classmethod
     def extract_vllm_speculative_config(
-            cls, config_dict: dict[str, Any]) -> dict[str, Any]:
+        cls, config_dict: dict[str, Any]
+    ) -> dict[str, Any]:
         speculators_model_type = config_dict.get("speculators_model_type")
         if speculators_model_type not in SUPPORTED_SPECULATORS_TYPES:
             raise ValueError(
                 f"Expected one of: {SUPPORTED_SPECULATORS_TYPES}. "
-                "Please ensure you're loading a speculators-format model.")
+                "Please ensure you're loading a speculators-format model."
+            )
 
         # validate fields
         # TODO: @dsikka - use speculators pydantic model to validate
         cls.validate_speculators_config(config_dict=config_dict)
         # Convert from speculators config -> format that can be ingested by vLLM
-        vllm_config = cls.build_vllm_speculative_config(
-            config_dict=config_dict)
+        vllm_config = cls.build_vllm_speculative_config(config_dict=config_dict)
         # Apply anything specific to the supported algorithm
         algo_updater = SUPPORTED_SPECULATORS_TYPES[speculators_model_type]
         algo_updater(config_dict=config_dict, vllm_config=vllm_config)
@@ -64,11 +65,13 @@ def validate_speculators_config(cls, config_dict: dict[str, Any]) -> None:
 
         if not isinstance(config_dict["transformer_layer_config"], dict):
             raise TypeError(
-                "'transformer_layer_config' must be a dictionary if provided")
+                "'transformer_layer_config' must be a dictionary if provided"
+            )
 
     @classmethod
     def build_vllm_speculative_config(
-            cls, config_dict: dict[str, Any]) -> dict[str, Any]:
+        cls, config_dict: dict[str, Any]
+    ) -> dict[str, Any]:
         """
         Build vLLM-compatible speculative configuration from speculators format.
 
@@ -94,14 +97,14 @@ def build_vllm_speculative_config(
 
         if num_speculative_tokens is None:
             raise ValueError(
-                "Missing 'speculative_tokens' in proposal method. "
-                f"Got: {first_method}")
+                f"Missing 'speculative_tokens' in proposal method. Got: {first_method}"
+            )
 
         # Build base vLLM speculative configuration
         vllm_config = {
             "method": config_dict.get("speculators_model_type"),
             "num_speculative_tokens": num_speculative_tokens,
-            "target_model": spec_config.get("verifier")["name_or_path"]
+            "target_model": spec_config.get("verifier")["name_or_path"],
         }
 
         # Merge transformer layer configuration if present
diff --git a/vllm/transformers_utils/configs/step3_vl.py b/vllm/transformers_utils/configs/step3_vl.py
index fe3c72de69d2..36d39e828a93 100644
--- a/vllm/transformers_utils/configs/step3_vl.py
+++ b/vllm/transformers_utils/configs/step3_vl.py
@@ -59,13 +59,64 @@ def __init__(
         share_q_dim: int = 2048,
         head_dim: int = 256,
         norm_expert_weight: bool = False,
-        moe_layers_enum: tuple[int,
-                               ...] = (4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14,
-                                       15, 16, 17, 18, 19, 20, 21, 22, 23, 24,
-                                       25, 26, 27, 28, 29, 30, 31, 32, 33, 34,
-                                       35, 36, 37, 38, 39, 40, 41, 42, 43, 44,
-                                       45, 46, 47, 48, 49, 50, 51, 52, 53, 54,
-                                       55, 56, 57, 58, 59),
+        moe_layers_enum: tuple[int, ...] = (
+            4,
+            5,
+            6,
+            7,
+            8,
+            9,
+            10,
+            11,
+            12,
+            13,
+            14,
+            15,
+            16,
+            17,
+            18,
+            19,
+            20,
+            21,
+            22,
+            23,
+            24,
+            25,
+            26,
+            27,
+            28,
+            29,
+            30,
+            31,
+            32,
+            33,
+            34,
+            35,
+            36,
+            37,
+            38,
+            39,
+            40,
+            41,
+            42,
+            43,
+            44,
+            45,
+            46,
+            47,
+            48,
+            49,
+            50,
+            51,
+            52,
+            53,
+            54,
+            55,
+            56,
+            57,
+            58,
+            59,
+        ),
         **kwargs,
     ) -> None:
         self.hidden_size = hidden_size
diff --git a/vllm/transformers_utils/configs/ultravox.py b/vllm/transformers_utils/configs/ultravox.py
index aaf31d84d0c1..ac22304e9125 100644
--- a/vllm/transformers_utils/configs/ultravox.py
+++ b/vllm/transformers_utils/configs/ultravox.py
@@ -42,6 +42,7 @@ class UltravoxConfig(transformers.PretrainedConfig):
             projector or at the end. Versions v0.4.1 and below
             use `False`, but v0.5 and above use `True`.
     """
+
     wrapped_model_config: transformers.PretrainedConfig
     model_type = "ultravox"
     audio_token = "<|audio|>"
@@ -76,15 +77,17 @@ def __init__(
         if text_model_id is None:
             text_config = text_config or {}
             self.wrapped_model_config = transformers.CONFIG_MAPPING[
-                text_config.get("model_type", "llama")](**text_config)
+                text_config.get("model_type", "llama")
+            ](**text_config)
 
         # N.B. May set the audio_config below.
         self.audio_model_id = audio_model_id
         if audio_model_id is None:
             self.audio_model_id = None
             audio_config = audio_config or {}
-            self.audio_config = transformers.CONFIG_MAPPING[audio_config.get(
-                "model_type", "whisper")](**audio_config)
+            self.audio_config = transformers.CONFIG_MAPPING[
+                audio_config.get("model_type", "whisper")
+            ](**audio_config)
 
         super().__init__(**kwargs)
 
@@ -99,8 +102,7 @@ def __setattr__(self, key, value):
         if key == "text_model_id" and value is not None:
             from vllm.transformers_utils.config import get_config
 
-            self.wrapped_model_config = get_config(value,
-                                                   trust_remote_code=False)
+            self.wrapped_model_config = get_config(value, trust_remote_code=False)
         elif key == "audio_model_id" and value is not None:
             from vllm.transformers_utils.config import get_config
 
diff --git a/vllm/transformers_utils/detokenizer_utils.py b/vllm/transformers_utils/detokenizer_utils.py
index 101f31d39cc1..60742ae97d5d 100644
--- a/vllm/transformers_utils/detokenizer_utils.py
+++ b/vllm/transformers_utils/detokenizer_utils.py
@@ -30,8 +30,9 @@ def _convert_tokens_to_string_with_added_encoders(
     current_sub_text: list[str] = []
     convert_tokens_to_string = tokenizer.convert_tokens_to_string
     added_vocab_set = set(tokenizer.get_added_vocab())
-    all_special_tokens = set(
-        tokenizer.all_special_tokens) if skip_special_tokens else ()
+    all_special_tokens = (
+        set(tokenizer.all_special_tokens) if skip_special_tokens else ()
+    )
 
     for token in output_tokens:
         # Use precomputed set for skip-special check
@@ -70,11 +71,11 @@ def convert_prompt_ids_to_tokens(
     # We do not need to convert the whole prompt to tokens.
     # Offset a little more in case we have special tokens.
     new_tokens = tokenizer.convert_ids_to_tokens(
-        prompt_ids[-INITIAL_INCREMENTAL_DETOKENIZATION_OFFSET - 2:],
-        skip_special_tokens=skip_special_tokens)
+        prompt_ids[-INITIAL_INCREMENTAL_DETOKENIZATION_OFFSET - 2 :],
+        skip_special_tokens=skip_special_tokens,
+    )
     read_offset = len(new_tokens)
-    prefix_offset = max(
-        read_offset - INITIAL_INCREMENTAL_DETOKENIZATION_OFFSET, 0)
+    prefix_offset = max(read_offset - INITIAL_INCREMENTAL_DETOKENIZATION_OFFSET, 0)
     # This is required to guard against out-of-vocab prompt token ids
     _replace_none_with_empty(new_tokens)  # type: ignore[arg-type]
     return new_tokens, prefix_offset, read_offset
@@ -92,7 +93,7 @@ def convert_ids_list_to_tokens(
 
     Returns:
       Python list of token string representations
-    
+
     """
     token_str_lst = []
     for token_id in token_ids:
@@ -144,18 +145,17 @@ def detokenize_incrementally(
     # This is the first iteration for this sequence
     is_first_iter = prev_tokens is None
     if is_first_iter:
-        (prev_tokens, prefix_offset,
-         read_offset) = convert_prompt_ids_to_tokens(
-             tokenizer,
-             all_input_ids[:-1],
-             skip_special_tokens=skip_special_tokens)
+        (prev_tokens, prefix_offset, read_offset) = convert_prompt_ids_to_tokens(
+            tokenizer, all_input_ids[:-1], skip_special_tokens=skip_special_tokens
+        )
     assert prev_tokens is not None
 
     # If the new token id is out of bounds, return an empty string.
     if 0 <= new_token_id < len(tokenizer):
         # Put new_token_id in a list so skip_special_tokens is respected
         new_tokens = tokenizer.convert_ids_to_tokens(
-            [new_token_id], skip_special_tokens=skip_special_tokens)
+            [new_token_id], skip_special_tokens=skip_special_tokens
+        )
         if isinstance(new_tokens, str):
             new_tokens = [new_tokens]
     else:
@@ -171,9 +171,9 @@ def detokenize_incrementally(
     # surrounding ids.
     if tokenizer.is_fast or not tokenizer.get_added_vocab():
         prefix_text = tokenizer.convert_tokens_to_string(
-            output_tokens[prefix_offset:read_offset])
-        new_text = tokenizer.convert_tokens_to_string(
-            output_tokens[prefix_offset:])
+            output_tokens[prefix_offset:read_offset]
+        )
+        new_text = tokenizer.convert_tokens_to_string(output_tokens[prefix_offset:])
     else:
         prefix_text = _convert_tokens_to_string_with_added_encoders(
             tokenizer,
@@ -195,5 +195,5 @@ def detokenize_incrementally(
         # by the model
         return new_tokens, "", prefix_offset, read_offset
 
-    new_text = new_text[len(prefix_text):]
+    new_text = new_text[len(prefix_text) :]
     return new_tokens, new_text, read_offset, len(output_tokens)
diff --git a/vllm/transformers_utils/processor.py b/vllm/transformers_utils/processor.py
index 51bcce6c10e2..81f9b76b5ef7 100644
--- a/vllm/transformers_utils/processor.py
+++ b/vllm/transformers_utils/processor.py
@@ -4,8 +4,12 @@
 from functools import lru_cache
 from typing import TYPE_CHECKING, Any, Optional, Union, cast
 
-from transformers import (AutoFeatureExtractor, AutoImageProcessor,
-                          AutoProcessor, AutoVideoProcessor)
+from transformers import (
+    AutoFeatureExtractor,
+    AutoImageProcessor,
+    AutoProcessor,
+    AutoVideoProcessor,
+)
 from transformers.feature_extraction_utils import FeatureExtractionMixin
 from transformers.image_processing_utils import BaseImageProcessor
 from transformers.processing_utils import ProcessorMixin
@@ -121,15 +125,18 @@ def get_processor(
                 "a custom processor not yet available in the HuggingFace "
                 "transformers library, consider setting "
                 "`trust_remote_code=True` in LLM or using the "
-                "`--trust-remote-code` flag in the CLI.")
+                "`--trust-remote-code` flag in the CLI."
+            )
             raise RuntimeError(err_msg) from e
         else:
             raise e
 
     if not isinstance(processor, processor_cls):
-        raise TypeError("Invalid type of HuggingFace processor. "
-                        f"Expected type: {processor_cls}, but "
-                        f"found type: {type(processor)}")
+        raise TypeError(
+            "Invalid type of HuggingFace processor. "
+            f"Expected type: {processor_cls}, but "
+            f"found type: {type(processor)}"
+        )
 
     return processor
 
@@ -158,7 +165,7 @@ def get_feature_extractor(
     trust_remote_code: bool = False,
     **kwargs: Any,
 ):
-    """Load an audio feature extractor for the given model name 
+    """Load an audio feature extractor for the given model name
     via HuggingFace."""
     try:
         feature_extractor = AutoFeatureExtractor.from_pretrained(
@@ -166,7 +173,8 @@ def get_feature_extractor(
             *args,
             revision=revision,
             trust_remote_code=trust_remote_code,
-            **kwargs)
+            **kwargs,
+        )
     except ValueError as e:
         # If the error pertains to the processor class not existing or not
         # currently being imported, suggest using the --trust-remote-code flag.
@@ -177,7 +185,8 @@ def get_feature_extractor(
                 "extractor is a custom extractor not yet available in the "
                 "HuggingFace transformers library, consider setting "
                 "`trust_remote_code=True` in LLM or using the "
-                "`--trust-remote-code` flag in the CLI.")
+                "`--trust-remote-code` flag in the CLI."
+            )
             raise RuntimeError(err_msg) from e
         else:
             raise e
@@ -213,7 +222,8 @@ def get_image_processor(
             *args,
             revision=revision,
             trust_remote_code=trust_remote_code,
-            **kwargs)
+            **kwargs,
+        )
     except ValueError as e:
         # If the error pertains to the processor class not existing or not
         # currently being imported, suggest using the --trust-remote-code flag.
@@ -224,7 +234,8 @@ def get_image_processor(
                 "a custom processor not yet available in the HuggingFace "
                 "transformers library, consider setting "
                 "`trust_remote_code=True` in LLM or using the "
-                "`--trust-remote-code` flag in the CLI.")
+                "`--trust-remote-code` flag in the CLI."
+            )
             raise RuntimeError(err_msg) from e
         else:
             raise e
@@ -263,7 +274,8 @@ def get_video_processor(
             *args,
             revision=revision,
             trust_remote_code=trust_remote_code,
-            **kwargs)
+            **kwargs,
+        )
     except ValueError as e:
         # If the error pertains to the processor class not existing or not
         # currently being imported, suggest using the --trust-remote-code flag.
@@ -274,7 +286,8 @@ def get_video_processor(
                 "a custom processor not yet available in the HuggingFace "
                 "transformers library, consider setting "
                 "`trust_remote_code=True` in LLM or using the "
-                "`--trust-remote-code` flag in the CLI.")
+                "`--trust-remote-code` flag in the CLI."
+            )
             raise RuntimeError(err_msg) from e
         else:
             raise e
diff --git a/vllm/transformers_utils/processors/__init__.py b/vllm/transformers_utils/processors/__init__.py
index 8a1ad226d99f..76b6d3dc9c99 100644
--- a/vllm/transformers_utils/processors/__init__.py
+++ b/vllm/transformers_utils/processors/__init__.py
@@ -8,8 +8,7 @@
 - There is a need to override the existing processor to support vLLM.
 """
 
-from vllm.transformers_utils.processors.deepseek_vl2 import (
-    DeepseekVLV2Processor)
+from vllm.transformers_utils.processors.deepseek_vl2 import DeepseekVLV2Processor
 from vllm.transformers_utils.processors.ovis import OvisProcessor
 from vllm.transformers_utils.processors.ovis2_5 import Ovis2_5Processor
 
diff --git a/vllm/transformers_utils/processors/ovis.py b/vllm/transformers_utils/processors/ovis.py
index 0077a7a8ce65..d7546695fd52 100644
--- a/vllm/transformers_utils/processors/ovis.py
+++ b/vllm/transformers_utils/processors/ovis.py
@@ -30,8 +30,7 @@
 import torch
 from transformers import AutoProcessor, BatchFeature
 from transformers.image_utils import ImageInput
-from transformers.processing_utils import (ProcessingKwargs, ProcessorMixin,
-                                           Unpack)
+from transformers.processing_utils import ProcessingKwargs, ProcessorMixin, Unpack
 from transformers.tokenization_utils_base import PreTokenizedInput, TextInput
 
 from vllm.multimodal.image import convert_image_mode
diff --git a/vllm/transformers_utils/processors/ovis2_5.py b/vllm/transformers_utils/processors/ovis2_5.py
index 282e9cb2116e..fba26d1d0304 100644
--- a/vllm/transformers_utils/processors/ovis2_5.py
+++ b/vllm/transformers_utils/processors/ovis2_5.py
@@ -9,33 +9,31 @@
 import torch
 from transformers import AutoProcessor, BatchFeature
 from transformers.image_utils import ImageInput
-from transformers.processing_utils import (ProcessingKwargs, ProcessorMixin,
-                                           Unpack)
+from transformers.processing_utils import ProcessingKwargs, ProcessorMixin, Unpack
 from transformers.tokenization_utils_base import PreTokenizedInput, TextInput
 
-__all__ = ['Ovis2_5Processor']
+__all__ = ["Ovis2_5Processor"]
 IMAGE_TOKEN = "<image>"
 VIDEO_TOKEN = "<video>"
 MIN_PIXELS = 448 * 448
 MAX_PIXELS = 1792 * 1792
 
 
-class Ovis2_5ProcessorKwargs(ProcessingKwargs,
-                             total=False):  # type: ignore[call-arg]
+class Ovis2_5ProcessorKwargs(ProcessingKwargs, total=False):  # type: ignore[call-arg]
     _defaults = {
         "text_kwargs": {
             "padding": False,
         },
         "images_kwargs": {
-            'convert_to_rgb': True,
-            'min_pixels': MIN_PIXELS,
-            'max_pixels': MAX_PIXELS,
+            "convert_to_rgb": True,
+            "min_pixels": MIN_PIXELS,
+            "max_pixels": MAX_PIXELS,
         },
         "videos_kwargs": {
-            'convert_to_rgb': True,
-            'min_pixels': MIN_PIXELS,
-            'max_pixels': MAX_PIXELS,
-        }
+            "convert_to_rgb": True,
+            "min_pixels": MIN_PIXELS,
+            "max_pixels": MAX_PIXELS,
+        },
     }
 
 
@@ -43,8 +41,8 @@ class Ovis2_5Processor(ProcessorMixin):
     r"""
     Constructs an Ovis processor which wraps an Ovis image processor
     and a Qwen2 tokenizer into a single processor.
-    [`OvisProcessor`] offers all the functionalities of 
-    [`Qwen2VLImageProcessor`] and [`Qwen2TokenizerFast`]. 
+    [`OvisProcessor`] offers all the functionalities of
+    [`Qwen2VLImageProcessor`] and [`Qwen2TokenizerFast`].
     See the [`~OvisProcessor.__call__`] and [`~OvisProcessor.decode`]
     for more information.
     Args:
@@ -81,9 +79,7 @@ def __init__(
         self.patch_size = patch_size
         self.hidden_stride = hidden_stride
         self.temporal_patch_size = temporal_patch_size
-        super().__init__(image_processor,
-                         tokenizer,
-                         chat_template=chat_template)
+        super().__init__(image_processor, tokenizer, chat_template=chat_template)
 
     @cached_property
     def extra_special_tokens(self):
@@ -96,7 +92,7 @@ def extra_special_tokens(self):
             "image_end": -302,
             "video_start": -303,
             "video_end": -304,
-            'image_pad': image_pad_token_id,
+            "image_pad": image_pad_token_id,
         }
         return extra_special_tokens
 
@@ -104,8 +100,9 @@ def __call__(
         self,
         images: ImageInput = None,
         videos: Union[np.ndarray, list[ImageInput]] = None,
-        text: Union[TextInput, PreTokenizedInput, list[TextInput],
-                    list[PreTokenizedInput]] = None,
+        text: Union[
+            TextInput, PreTokenizedInput, list[TextInput], list[PreTokenizedInput]
+        ] = None,
         **kwargs: Unpack[Ovis2_5ProcessorKwargs],
     ) -> BatchFeature:
         """
@@ -148,9 +145,9 @@ def __call__(
                 [`BatchFeature`]: A [`BatchFeature`] with the following fields:
                 - **input_ids** -- list of token ids to be fed to a model.
                   Returned when `text` is not `None`.
-                - **attention_mask** -- list of indices specifying which tokens 
+                - **attention_mask** -- list of indices specifying which tokens
                   should be attended to by the model (when
-                  `return_attention_mask=True` or if *"attention_mask"* 
+                  `return_attention_mask=True` or if *"attention_mask"*
                   is in `self.model_input_names` and if `text` is not `None`).
                 - **pixel_values** -- Pixel values to be fed to a model.
                   Returned when `images` is not `None`.
@@ -177,9 +174,9 @@ def __call__(
             grids = []
             # Process each image
             for image in images if isinstance(images, list) else [images]:
-                pixel_values, image_placeholders, grid = (
-                    self.preprocess_multidata(
-                        images=image, **output_kwargs["images_kwargs"]))
+                pixel_values, image_placeholders, grid = self.preprocess_multidata(
+                    images=image, **output_kwargs["images_kwargs"]
+                )
                 processed_images.append(pixel_values)
                 image_placeholders_list.append(image_placeholders)
                 grids.append(grid)
@@ -196,16 +193,15 @@ def __call__(
             grids = []
             # Process each video
             for video in videos if isinstance(videos, list) else [videos]:
-                pixel_values, video_placeholders, grid = (
-                    self.preprocess_multidata(
-                        video=video, **output_kwargs["videos_kwargs"]))
+                pixel_values, video_placeholders, grid = self.preprocess_multidata(
+                    video=video, **output_kwargs["videos_kwargs"]
+                )
                 processed_videos.append(pixel_values)
                 videos_placeholders_list.append(video_placeholders)
                 grids.append(grid)
             # assign all processed videos
             if processed_videos:
-                visual_features[
-                    "video_placeholders"] = videos_placeholders_list
+                visual_features["video_placeholders"] = videos_placeholders_list
             output["video_pixel_values"] = processed_videos
             output["video_grids"] = grids
 
@@ -220,14 +216,16 @@ def __call__(
             image_idx = 0
             video_idx = 0
             for ids_tensor in tokenized_batched_text:
-                has_image_tokens = (image_token_id in ids_tensor
-                                    and "image_placeholders" in visual_features
-                                    and image_idx < len(
-                                        visual_features["image_placeholders"]))
-                has_video_tokens = (video_token_id in ids_tensor
-                                    and "video_placeholders" in visual_features
-                                    and video_idx < len(
-                                        visual_features["video_placeholders"]))
+                has_image_tokens = (
+                    image_token_id in ids_tensor
+                    and "image_placeholders" in visual_features
+                    and image_idx < len(visual_features["image_placeholders"])
+                )
+                has_video_tokens = (
+                    video_token_id in ids_tensor
+                    and "video_placeholders" in visual_features
+                    and video_idx < len(visual_features["video_placeholders"])
+                )
                 if has_image_tokens or has_video_tokens:
                     # Convert to list for easier manipulation
                     ids_list = ids_tensor.tolist()
@@ -237,13 +235,13 @@ def __call__(
                     for token_id in ids_list:
                         if token_id == image_token_id:
                             new_ids.extend(
-                                visual_features["image_placeholders"]
-                                [image_idx])
+                                visual_features["image_placeholders"][image_idx]
+                            )
                             image_idx += 1
                         elif token_id == video_token_id:
                             new_ids.extend(
-                                visual_features["video_placeholders"]
-                                [video_idx])
+                                visual_features["video_placeholders"][video_idx]
+                            )
                             video_idx += 1
                         else:
                             new_ids.append(token_id)
@@ -260,8 +258,7 @@ def __call__(
         # If only images were provided
         return BatchFeature(data=visual_features)
 
-    def _tokenize_with_visual_symbol(self,
-                                     text_list: list[str]) -> torch.LongTensor:
+    def _tokenize_with_visual_symbol(self, text_list: list[str]) -> torch.LongTensor:
         batch_token_ids = []
         for text in text_list:
             token_ids = []
@@ -288,21 +285,24 @@ def _tokenize_with_visual_symbol(self,
         return torch.tensor(batch_token_ids, dtype=torch.long)
 
     # Copied from qwen2_vl
-    def smart_resize(self,
-                     height: int,
-                     width: int,
-                     factor: int = 28,
-                     min_pixels: int = MIN_PIXELS,
-                     max_pixels: int = MAX_PIXELS):
+    def smart_resize(
+        self,
+        height: int,
+        width: int,
+        factor: int = 28,
+        min_pixels: int = MIN_PIXELS,
+        max_pixels: int = MAX_PIXELS,
+    ):
         """Rescales the image so that the following conditions are met:
         1. Both dimensions (height and width) are divisible by 'factor'.
-        2. The total number of pixels is within the range 
+        2. The total number of pixels is within the range
             ['min_pixels', 'max_pixels'].
         3. The aspect ratio of the image is maintained as closely as possible.
         """
         if height < factor or width < factor:
-            print(f"height:{height} or width:{width} must be "
-                  f"larger than factor:{factor}")
+            print(
+                f"height:{height} or width:{width} must be larger than factor:{factor}"
+            )
             if height < width:
                 width = round(factor / height * width)
                 height = factor
@@ -311,8 +311,10 @@ def smart_resize(self,
                 width = factor
 
         elif max(height, width) / min(height, width) > 200:
-            print(f"absolute aspect ratio must be smaller than 200, "
-                  f"got {max(height, width) / min(height, width)}")
+            print(
+                f"absolute aspect ratio must be smaller than 200, "
+                f"got {max(height, width) / min(height, width)}"
+            )
             if height > width:
                 height = 200 * width
             else:
@@ -335,29 +337,27 @@ def get_token_value(self, tok):
 
     def construct_visual_indicators(self, grid, is_video: bool = False):
         if is_video:
-            start_token = self.get_token_value('video_start')
-            end_token = self.get_token_value('video_end')
+            start_token = self.get_token_value("video_start")
+            end_token = self.get_token_value("video_end")
         else:
-            start_token = self.get_token_value('image_start')
-            end_token = self.get_token_value('image_end')
+            start_token = self.get_token_value("image_start")
+            end_token = self.get_token_value("image_end")
 
-        image_placeholders = [start_token, self.get_token_value('visual_atom')]
+        image_placeholders = [start_token, self.get_token_value("visual_atom")]
         if grid[0] * grid[1] > 1:
             for r in range(grid[0]):
                 for c in range(grid[1]):
-                    image_placeholders.append(
-                        self.get_token_value('visual_atom'))
+                    image_placeholders.append(self.get_token_value("visual_atom"))
 
         image_placeholders.append(end_token)
         return image_placeholders
 
     def construct_visual_placeholders(self, grid, is_video: bool = False):
-        visual_placeholders = self.construct_visual_indicators((1, 1),
-                                                               is_video)
+        visual_placeholders = self.construct_visual_indicators((1, 1), is_video)
 
-        image_atom_token_id = self.get_token_value('visual_atom')
+        image_atom_token_id = self.get_token_value("visual_atom")
         # Extract the padding token ID from tokenizer
-        image_padding_token_id = self.get_token_value('image_pad')
+        image_padding_token_id = self.get_token_value("image_pad")
 
         num_image_atoms = grid[0] * grid[1] * grid[2]
         num_image_atoms //= self.hidden_stride**2
@@ -367,8 +367,9 @@ def construct_visual_placeholders(self, grid, is_video: bool = False):
         padded_placeholder_tokens = []
         for token in visual_placeholders:
             if token == image_atom_token_id:
-                padded_placeholder_tokens.extend([image_padding_token_id] *
-                                                 num_image_atoms)
+                padded_placeholder_tokens.extend(
+                    [image_padding_token_id] * num_image_atoms
+                )
             else:
                 padded_placeholder_tokens.append(image_padding_token_id)
         return padded_placeholder_tokens
@@ -380,7 +381,7 @@ def preprocess_multidata(
         convert_to_rgb: Optional[bool] = True,
         min_pixels: int = MIN_PIXELS,
         max_pixels: int = MAX_PIXELS,
-        return_tensors: Optional[str] = 'pt',
+        return_tensors: Optional[str] = "pt",
     ):
         is_video = False
         if images is not None:
@@ -396,11 +397,12 @@ def preprocess_multidata(
                     images.append(image)
             elif isinstance(video, list):
                 images = video
-        min_pixels = min(max_pixels if max_pixels is not None else MAX_PIXELS,
-                         min_pixels if min_pixels is not None else MIN_PIXELS)
+        min_pixels = min(
+            max_pixels if max_pixels is not None else MAX_PIXELS,
+            min_pixels if min_pixels is not None else MIN_PIXELS,
+        )
         images = [
-            image.convert("RGB")
-            if convert_to_rgb and image.mode != 'RGB' else image
+            image.convert("RGB") if convert_to_rgb and image.mode != "RGB" else image
             for image in images
         ]
 
@@ -417,14 +419,16 @@ def preprocess_multidata(
             )
             new_size = dict(height=resized_height, width=resized_width)
             image_pt = self.image_processor.preprocess(
-                image, size=new_size, return_tensors="np")['pixel_values'][0]
+                image, size=new_size, return_tensors="np"
+            )["pixel_values"][0]
 
             processed_images.append(image_pt)
 
         patches = np.array(processed_images)
         if patches.shape[0] % self.temporal_patch_size != 0:
-            num_to_pad = self.temporal_patch_size - (patches.shape[0] %
-                                                     self.temporal_patch_size)
+            num_to_pad = self.temporal_patch_size - (
+                patches.shape[0] % self.temporal_patch_size
+            )
             repeats = np.repeat(patches[-1][np.newaxis], num_to_pad, axis=0)
             patches = np.concatenate([patches, repeats], axis=0)
         channel = patches.shape[1]
@@ -445,14 +449,18 @@ def preprocess_multidata(
         )
         patches = patches.transpose(0, 3, 6, 4, 7, 2, 1, 5, 8)
         flatten_patches = patches.reshape(
-            grid_t * grid_h * grid_w, channel * self.temporal_patch_size *
-            self.patch_size * self.patch_size)
+            grid_t * grid_h * grid_w,
+            channel * self.temporal_patch_size * self.patch_size * self.patch_size,
+        )
 
         visual_placeholders = self.construct_visual_placeholders(
-            [grid_t, grid_h, grid_w], is_video)
-        return torch.tensor(
-            flatten_patches), visual_placeholders, torch.tensor(
-                [[grid_t, grid_h, grid_w]])
+            [grid_t, grid_h, grid_w], is_video
+        )
+        return (
+            torch.tensor(flatten_patches),
+            visual_placeholders,
+            torch.tensor([[grid_t, grid_h, grid_w]]),
+        )
 
 
 AutoProcessor.register("Ovis2_5Processor", Ovis2_5Processor)
diff --git a/vllm/transformers_utils/runai_utils.py b/vllm/transformers_utils/runai_utils.py
index 355fd60e8da1..ec60d66e5cff 100644
--- a/vllm/transformers_utils/runai_utils.py
+++ b/vllm/transformers_utils/runai_utils.py
@@ -14,7 +14,7 @@
 
 logger = init_logger(__name__)
 
-SUPPORTED_SCHEMES = ['s3://', 'gs://']
+SUPPORTED_SCHEMES = ["s3://", "gs://"]
 
 try:
     from runai_model_streamer import list_safetensors as runai_list_safetensors
@@ -22,11 +22,9 @@
 except (ImportError, OSError):
     # see https://github.com/run-ai/runai-model-streamer/issues/26
     # OSError will be raised on arm64 platform
-    runai_model_streamer = PlaceholderModule(
-        "runai_model_streamer")  # type: ignore[assignment]
+    runai_model_streamer = PlaceholderModule("runai_model_streamer")  # type: ignore[assignment]
     runai_pull_files = runai_model_streamer.placeholder_attr("pull_files")
-    runai_list_safetensors = runai_model_streamer.placeholder_attr(
-        "list_safetensors")
+    runai_list_safetensors = runai_model_streamer.placeholder_attr("list_safetensors")
 
 
 def list_safetensors(path: str = "") -> list[str]:
@@ -65,8 +63,10 @@ def __init__(self, url: str) -> None:
                 signal.signal(sig, self._close_by_signal(existing_handler))
 
         dir_name = os.path.join(
-            get_cache_dir(), "model_streamer",
-            hashlib.sha256(str(url).encode()).hexdigest()[:8])
+            get_cache_dir(),
+            "model_streamer",
+            hashlib.sha256(str(url).encode()).hexdigest()[:8],
+        )
         if os.path.exists(dir_name):
             shutil.rmtree(dir_name)
         os.makedirs(dir_name)
@@ -78,7 +78,6 @@ def _close(self) -> None:
             shutil.rmtree(self.dir)
 
     def _close_by_signal(self, existing_handler=None):
-
         def new_handler(signum, frame):
             self._close()
             if existing_handler:
@@ -86,10 +85,12 @@ def new_handler(signum, frame):
 
         return new_handler
 
-    def pull_files(self,
-                   model_path: str = "",
-                   allow_pattern: Optional[list[str]] = None,
-                   ignore_pattern: Optional[list[str]] = None) -> None:
+    def pull_files(
+        self,
+        model_path: str = "",
+        allow_pattern: Optional[list[str]] = None,
+        ignore_pattern: Optional[list[str]] = None,
+    ) -> None:
         """
         Pull files from object storage into the temporary directory.
 
diff --git a/vllm/transformers_utils/s3_utils.py b/vllm/transformers_utils/s3_utils.py
index b848898ff6da..ef30efd80b1f 100644
--- a/vllm/transformers_utils/s3_utils.py
+++ b/vllm/transformers_utils/s3_utils.py
@@ -17,21 +17,25 @@
 
 def _filter_allow(paths: list[str], patterns: list[str]) -> list[str]:
     return [
-        path for path in paths if any(
-            fnmatch.fnmatch(path, pattern) for pattern in patterns)
+        path
+        for path in paths
+        if any(fnmatch.fnmatch(path, pattern) for pattern in patterns)
     ]
 
 
 def _filter_ignore(paths: list[str], patterns: list[str]) -> list[str]:
     return [
-        path for path in paths
+        path
+        for path in paths
         if not any(fnmatch.fnmatch(path, pattern) for pattern in patterns)
     ]
 
 
-def glob(s3: Optional["BaseClient"] = None,
-         path: str = "",
-         allow_pattern: Optional[list[str]] = None) -> list[str]:
+def glob(
+    s3: Optional["BaseClient"] = None,
+    path: str = "",
+    allow_pattern: Optional[list[str]] = None,
+) -> list[str]:
     """
     List full file names from S3 path and filter by allow pattern.
 
@@ -47,17 +51,15 @@ def glob(s3: Optional["BaseClient"] = None,
         s3 = boto3.client("s3")
     if not path.endswith("/"):
         path = path + "/"
-    bucket_name, _, paths = list_files(s3,
-                                       path=path,
-                                       allow_pattern=allow_pattern)
+    bucket_name, _, paths = list_files(s3, path=path, allow_pattern=allow_pattern)
     return [f"s3://{bucket_name}/{path}" for path in paths]
 
 
 def list_files(
-        s3: "BaseClient",
-        path: str,
-        allow_pattern: Optional[list[str]] = None,
-        ignore_pattern: Optional[list[str]] = None
+    s3: "BaseClient",
+    path: str,
+    allow_pattern: Optional[list[str]] = None,
+    ignore_pattern: Optional[list[str]] = None,
 ) -> tuple[str, str, list[str]]:
     """
     List files from S3 path and filter by pattern.
@@ -71,17 +73,17 @@ def list_files(
     Returns:
         tuple[str, str, list[str]]: A tuple where:
             - The first element is the bucket name
-            - The second element is string represent the bucket 
+            - The second element is string represent the bucket
               and the prefix as a dir like string
-            - The third element is a list of files allowed or 
+            - The third element is a list of files allowed or
               disallowed by pattern
     """
-    parts = path.removeprefix('s3://').split('/')
-    prefix = '/'.join(parts[1:])
+    parts = path.removeprefix("s3://").split("/")
+    prefix = "/".join(parts[1:])
     bucket_name = parts[0]
 
     objects = s3.list_objects_v2(Bucket=bucket_name, Prefix=prefix)
-    paths = [obj['Key'] for obj in objects.get('Contents', [])]
+    paths = [obj["Key"] for obj in objects.get("Contents", [])]
 
     paths = _filter_ignore(paths, ["*/"])
     if allow_pattern is not None:
diff --git a/vllm/transformers_utils/tokenizer.py b/vllm/transformers_utils/tokenizer.py
index 9aaac6681739..9537295c6dcd 100644
--- a/vllm/transformers_utils/tokenizer.py
+++ b/vllm/transformers_utils/tokenizer.py
@@ -10,14 +10,12 @@
 from typing import TYPE_CHECKING, Any, Optional, Union
 
 import huggingface_hub
-from transformers import (AutoTokenizer, PreTrainedTokenizer,
-                          PreTrainedTokenizerFast)
+from transformers import AutoTokenizer, PreTrainedTokenizer, PreTrainedTokenizerFast
 from typing_extensions import assert_never
 
 from vllm import envs
 from vllm.logger import init_logger
-from vllm.transformers_utils.config import (
-    get_sentence_transformer_tokenizer_config)
+from vllm.transformers_utils.config import get_sentence_transformer_tokenizer_config
 from vllm.transformers_utils.tokenizers import MistralTokenizer
 from vllm.transformers_utils.utils import check_gguf_file
 
@@ -32,8 +30,7 @@
 
 logger = init_logger(__name__)
 
-AnyTokenizer = Union[PreTrainedTokenizer, PreTrainedTokenizerFast,
-                     TokenizerBase]
+AnyTokenizer = Union[PreTrainedTokenizer, PreTrainedTokenizerFast, TokenizerBase]
 
 
 def decode_tokens(
@@ -50,8 +47,7 @@ def decode_tokens(
     settings.
     """
     if skip_special_tokens is not None:
-        return tokenizer.decode(token_ids,
-                                skip_special_tokens=skip_special_tokens)
+        return tokenizer.decode(token_ids, skip_special_tokens=skip_special_tokens)
 
     return tokenizer.decode(token_ids)
 
@@ -95,8 +91,7 @@ def get_cached_tokenizer(tokenizer: AnyTokenizer) -> AnyTokenizer:
 
     tokenizer_all_special_ids = tokenizer.all_special_ids
     tokenizer_all_special_tokens = tokenizer.all_special_tokens
-    tokenizer_all_special_tokens_extended = (
-        tokenizer.all_special_tokens_extended)
+    tokenizer_all_special_tokens_extended = tokenizer.all_special_tokens_extended
     tokenizer_vocab = tokenizer.get_vocab()
     tokenizer_len = len(tokenizer)
 
@@ -110,7 +105,6 @@ def get_cached_tokenizer(tokenizer: AnyTokenizer) -> AnyTokenizer:
             max_token_id = max(max_token_id, tokenizer.vocab_size)
 
     class CachedTokenizer(tokenizer.__class__):  # type: ignore
-
         @property
         def all_special_ids(self) -> list[int]:
             return tokenizer_all_special_ids
@@ -134,7 +128,7 @@ def __len__(self) -> int:
             return tokenizer_len
 
         def __reduce__(self):
-            return get_cached_tokenizer, (tokenizer, )
+            return get_cached_tokenizer, (tokenizer,)
 
     CachedTokenizer.__name__ = f"Cached{tokenizer.__class__.__name__}"
 
@@ -151,8 +145,7 @@ def get_tokenizer(
     download_dir: Optional[str] = None,
     **kwargs,
 ) -> AnyTokenizer:
-    """Gets a tokenizer for the given model name via HuggingFace or ModelScope.
-    """
+    """Gets a tokenizer for the given model name via HuggingFace or ModelScope."""
     if envs.VLLM_USE_MODELSCOPE:
         # download model from ModelScope hub,
         # lazy import so that modelscope is not required for normal use.
@@ -173,13 +166,13 @@ def get_tokenizer(
                     revision=revision,
                     local_files_only=huggingface_hub.constants.HF_HUB_OFFLINE,
                     # Ignore weights - we only need the tokenizer.
-                    ignore_file_pattern=[".*.pt", ".*.safetensors", ".*.bin"])
+                    ignore_file_pattern=[".*.pt", ".*.safetensors", ".*.bin"],
+                )
                 tokenizer_name = tokenizer_path
 
     if tokenizer_mode == "slow":
         if kwargs.get("use_fast", False):
-            raise ValueError(
-                "Cannot use the fast tokenizer in slow tokenizer mode.")
+            raise ValueError("Cannot use the fast tokenizer in slow tokenizer mode.")
         kwargs["use_fast"] = False
 
     if "truncation_side" not in kwargs:
@@ -195,23 +188,28 @@ def get_tokenizer(
     is_from_mistral_org = str(tokenizer_name).split("/")[0] == "mistralai"
     if is_from_mistral_org and tokenizer_mode != "mistral":
         warnings.warn(
-            'It is strongly recommended to run mistral models with '
+            "It is strongly recommended to run mistral models with "
             '`--tokenizer-mode "mistral"` to ensure correct '
-            'encoding and decoding.',
+            "encoding and decoding.",
             FutureWarning,
-            stacklevel=2)
+            stacklevel=2,
+        )
 
     tokenizer: AnyTokenizer
     if tokenizer_mode == "mistral":
-        tokenizer = MistralTokenizer.from_pretrained(str(tokenizer_name),
-                                                     revision=revision)
+        tokenizer = MistralTokenizer.from_pretrained(
+            str(tokenizer_name), revision=revision
+        )
     elif tokenizer_mode == "custom":
         from vllm.transformers_utils.tokenizer_base import TokenizerRegistry
-        tokenizer = TokenizerRegistry.get_tokenizer(str(tokenizer_name),
-                                                    *args,
-                                                    revision=revision,
-                                                    download_dir=download_dir,
-                                                    **kwargs)
+
+        tokenizer = TokenizerRegistry.get_tokenizer(
+            str(tokenizer_name),
+            *args,
+            revision=revision,
+            download_dir=download_dir,
+            **kwargs,
+        )
     else:
         try:
             tokenizer = AutoTokenizer.from_pretrained(
@@ -226,13 +224,16 @@ def get_tokenizer(
             # currently being imported,
             # suggest using the --trust-remote-code flag.
             if not trust_remote_code and (
-                    "does not exist or is not currently imported." in str(e)
-                    or "requires you to execute the tokenizer file" in str(e)):
-                err_msg = ("Failed to load the tokenizer. If the tokenizer "
-                           "is a custom tokenizer not yet available in the "
-                           "HuggingFace transformers library, consider "
-                           "setting `trust_remote_code=True` in LLM or using "
-                           "the `--trust-remote-code` flag in the CLI.")
+                "does not exist or is not currently imported." in str(e)
+                or "requires you to execute the tokenizer file" in str(e)
+            ):
+                err_msg = (
+                    "Failed to load the tokenizer. If the tokenizer "
+                    "is a custom tokenizer not yet available in the "
+                    "HuggingFace transformers library, consider "
+                    "setting `trust_remote_code=True` in LLM or using "
+                    "the `--trust-remote-code` flag in the CLI."
+                )
                 raise RuntimeError(err_msg) from e
             else:
                 raise e
@@ -240,19 +241,21 @@ def get_tokenizer(
         # The special_tokens in tokenizer should also be
         # controlled by do_lower_case in encoder_config
         encoder_config = get_sentence_transformer_tokenizer_config(
-            tokenizer_name, revision)
+            tokenizer_name, revision
+        )
         if isinstance(encoder_config, dict) and encoder_config.get(
-                "do_lower_case", False):
+            "do_lower_case", False
+        ):
             special_tokens_map = {
-                k: v.lower()
-                for k, v in tokenizer.special_tokens_map.items()
+                k: v.lower() for k, v in tokenizer.special_tokens_map.items()
             }
             tokenizer.add_special_tokens(special_tokens_map)
 
         if not isinstance(tokenizer, PreTrainedTokenizerFast):
             logger.warning(
                 "Using a slow tokenizer. This might cause a significant "
-                "slowdown. Consider using a fast tokenizer instead.")
+                "slowdown. Consider using a fast tokenizer instead."
+            )
         tokenizer = get_cached_tokenizer(tokenizer)
 
     return tokenizer
diff --git a/vllm/transformers_utils/tokenizer_base.py b/vllm/transformers_utils/tokenizer_base.py
index b1f84a023fc3..2d64265abbf2 100644
--- a/vllm/transformers_utils/tokenizer_base.py
+++ b/vllm/transformers_utils/tokenizer_base.py
@@ -10,7 +10,6 @@
 
 
 class TokenizerBase(ABC):
-
     @property
     @abstractmethod
     def all_special_tokens_extended(self) -> list[str]:
@@ -98,18 +97,22 @@ def encode_one(
         raise NotImplementedError()
 
     @abstractmethod
-    def encode(self,
-               text: str,
-               truncation: Optional[bool] = None,
-               max_length: Optional[int] = None,
-               add_special_tokens: Optional[bool] = None) -> list[int]:
+    def encode(
+        self,
+        text: str,
+        truncation: Optional[bool] = None,
+        max_length: Optional[int] = None,
+        add_special_tokens: Optional[bool] = None,
+    ) -> list[int]:
         raise NotImplementedError()
 
     @abstractmethod
-    def apply_chat_template(self,
-                            messages: list["ChatCompletionMessageParam"],
-                            tools: Optional[list[dict[str, Any]]] = None,
-                            **kwargs) -> list[int]:
+    def apply_chat_template(
+        self,
+        messages: list["ChatCompletionMessageParam"],
+        tools: Optional[list[dict[str, Any]]] = None,
+        **kwargs,
+    ) -> list[int]:
         raise NotImplementedError()
 
     @abstractmethod
@@ -117,9 +120,9 @@ def convert_tokens_to_string(self, tokens: list[str]) -> str:
         raise NotImplementedError()
 
     @abstractmethod
-    def decode(self,
-               ids: Union[list[int], int],
-               skip_special_tokens: bool = True) -> str:
+    def decode(
+        self, ids: Union[list[int], int], skip_special_tokens: bool = True
+    ) -> str:
         raise NotImplementedError()
 
     @abstractmethod
diff --git a/vllm/transformers_utils/tokenizers/__init__.py b/vllm/transformers_utils/tokenizers/__init__.py
index 941156c4bf50..b63cb26af46d 100644
--- a/vllm/transformers_utils/tokenizers/__init__.py
+++ b/vllm/transformers_utils/tokenizers/__init__.py
@@ -1,10 +1,16 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from .mistral import (MistralTokenizer, maybe_serialize_tool_calls,
-                      truncate_tool_call_ids, validate_request_params)
+from .mistral import (
+    MistralTokenizer,
+    maybe_serialize_tool_calls,
+    truncate_tool_call_ids,
+    validate_request_params,
+)
 
 __all__ = [
-    "MistralTokenizer", "maybe_serialize_tool_calls", "truncate_tool_call_ids",
-    "validate_request_params"
+    "MistralTokenizer",
+    "maybe_serialize_tool_calls",
+    "truncate_tool_call_ids",
+    "validate_request_params",
 ]
diff --git a/vllm/transformers_utils/tokenizers/mistral.py b/vllm/transformers_utils/tokenizers/mistral.py
index ed9f28d54448..5633a31455e9 100644
--- a/vllm/transformers_utils/tokenizers/mistral.py
+++ b/vllm/transformers_utils/tokenizers/mistral.py
@@ -20,7 +20,8 @@
     # will not be bothered by the dependency.
     from mistral_common.protocol.instruct.request import ChatCompletionRequest
     from mistral_common.tokens.tokenizers.mistral import (
-        MistralTokenizer as PublicMistralTokenizer)
+        MistralTokenizer as PublicMistralTokenizer,
+    )
 
     from vllm.entrypoints.chat_utils import ChatCompletionMessageParam
 
@@ -51,7 +52,7 @@ def maybe_serialize_tool_calls(request: "ChatCompletionRequest"):
     #   - https://github.com/pydantic/pydantic/issues/9541
     # TODO: remove when pydantic v2.11 is released
     for i, message in enumerate(request.messages):
-        if message.get("role") == 'assistant':
+        if message.get("role") == "assistant":
             tool_calls_validator = message.get("tool_calls", ().__iter__())
             validated_tool_calls = []
             while True:
@@ -67,7 +68,7 @@ def maybe_serialize_tool_calls(request: "ChatCompletionRequest"):
 def truncate_tool_call_ids(request: "ChatCompletionRequest"):
     """Truncates tool call IDs for Mistral's ID requirements."""
     for i, message in enumerate(request.messages):
-        if message.get("role") == 'assistant':
+        if message.get("role") == "assistant":
             tool_calls = message.get("tool_calls", [])
             for tool_call in tool_calls:
                 if len(tool_call["id"]) > 9:
@@ -95,17 +96,19 @@ def truncate_tool_call_ids(request: "ChatCompletionRequest"):
 
 
 def validate_request_params(request: "ChatCompletionRequest"):
-    if (request.skip_special_tokens is not None
-            and not request.skip_special_tokens):
-        raise ValueError("skip_special_tokens=False is not supported "
-                         "for Mistral tokenizers.")
+    if request.skip_special_tokens is not None and not request.skip_special_tokens:
+        raise ValueError(
+            "skip_special_tokens=False is not supported for Mistral tokenizers."
+        )
 
 
 def list_local_repo_files(repo_id: str, revision: Optional[str]) -> list[str]:
     repo_cache = os.path.join(
         huggingface_hub.constants.HF_HUB_CACHE,
         huggingface_hub.constants.REPO_ID_SEPARATOR.join(
-            ["models", *repo_id.split("/")]))
+            ["models", *repo_id.split("/")]
+        ),
+    )
 
     if revision is None:
         revision_file = os.path.join(repo_cache, "refs", "main")
@@ -141,7 +144,8 @@ def find_tokenizer_file(files: list[str]):
         raise OSError(
             f"Found {len(matched_files)} files matching the "
             f"pattern: `{file_pattern.pattern}`. Make sure that a Mistral "
-            f"tokenizer is present in {files}.")
+            f"tokenizer is present in {files}."
+        )
 
     return matched_files[0]
 
@@ -149,22 +153,23 @@ def find_tokenizer_file(files: list[str]):
 def _aggregate_content(content: list) -> list[dict[str, Any]]:
     aggregated_content: list[dict[str, Any]] = []
     for chunk in content:
-        if chunk.get("type"
-                     ) == "text" and aggregated_content and aggregated_content[
-                         -1].get("type") == "text":
+        if (
+            chunk.get("type") == "text"
+            and aggregated_content
+            and aggregated_content[-1].get("type") == "text"
+        ):
             aggregated_content[-1]["text"] += "\n\n" + chunk.get("text")
         else:
             aggregated_content.append(chunk)
-    if len(aggregated_content) == 1 and aggregated_content[0].get(
-            "type") == "text":
+    if len(aggregated_content) == 1 and aggregated_content[0].get("type") == "text":
         content = aggregated_content[0]["text"]
     return content
 
 
 def make_mistral_chat_completion_request(
-        messages: list["ChatCompletionMessageParam"],
-        tools: Optional[list[dict[str,
-                                  Any]]] = None) -> "ChatCompletionRequest":
+    messages: list["ChatCompletionMessageParam"],
+    tools: Optional[list[dict[str, Any]]] = None,
+) -> "ChatCompletionRequest":
     last_message = cast(dict[str, Any], messages[-1])
     if last_message["role"] == "assistant":
         last_message["prefix"] = True
@@ -188,8 +193,7 @@ def make_mistral_chat_completion_request(
     # even if they are empty.
     if tools:
         for function in [
-                tool["function"] for tool in tools
-                if tool["type"] == "function"
+            tool["function"] for tool in tools if tool["type"] == "function"
         ]:
             if function.get("parameters") is None:
                 function["parameters"] = {}
@@ -197,12 +201,11 @@ def make_mistral_chat_completion_request(
                 function["description"] = ""
 
     from mistral_common.protocol.instruct.request import ChatCompletionRequest
-    return ChatCompletionRequest(messages=messages,
-                                 tools=tools)  # type: ignore[type-var]
 
+    return ChatCompletionRequest(messages=messages, tools=tools)  # type: ignore[type-var]
 
-class MistralTokenizer(TokenizerBase):
 
+class MistralTokenizer(TokenizerBase):
     def __init__(self, tokenizer: "PublicMistralTokenizer") -> None:
         self.mistral = tokenizer
         self.instruct = tokenizer.instruct_tokenizer
@@ -215,10 +218,13 @@ def __init__(self, tokenizer: "PublicMistralTokenizer") -> None:
 
         self.is_tekken = isinstance(tokenizer_, Tekkenizer)
         from mistral_common.tokens.tokenizers.sentencepiece import (
-            SentencePieceTokenizer)
+            SentencePieceTokenizer,
+        )
+
         self.is_spm = isinstance(tokenizer_, SentencePieceTokenizer)
-        self._special_token_policy = (SpecialTokenPolicy.IGNORE
-                                      if self.is_tekken else None)
+        self._special_token_policy = (
+            SpecialTokenPolicy.IGNORE if self.is_tekken else None
+        )
         if not (self.is_tekken or self.is_spm):
             raise TypeError(f"Unsupported tokenizer: {type(tokenizer_)}")
 
@@ -226,57 +232,54 @@ def __init__(self, tokenizer: "PublicMistralTokenizer") -> None:
         # Convert to a dict[str, int] to match protocol, but this is a lossy
         # conversion. There may be multiple token ids that decode to the same
         # string due to partial UTF-8 byte sequences being converted to �
-        self._vocab_dict = {
-            token: idx
-            for idx, token in enumerate(self._vocab)
-        }
+        self._vocab_dict = {token: idx for idx, token in enumerate(self._vocab)}
         self.tokenizer = tokenizer_
         self._max_token_id = self.vocab_size - 1
 
     @classmethod
-    def from_pretrained(cls,
-                        path_or_repo_id: str,
-                        *,
-                        revision: Optional[str] = None) -> "MistralTokenizer":
+    def from_pretrained(
+        cls, path_or_repo_id: str, *, revision: Optional[str] = None
+    ) -> "MistralTokenizer":
         if not Path(path_or_repo_id).exists():
             assert len(path_or_repo_id.split("/")) == 2, (
                 "You have either provided a non-existent path: "
-                "{path_or_repo_id} or an invalid HF Hub repo id.")
+                "{path_or_repo_id} or an invalid HF Hub repo id."
+            )
             tokenizer_file = cls._download_mistral_tokenizer_from_hf(
-                path_or_repo_id, revision)
+                path_or_repo_id, revision
+            )
         elif Path(path_or_repo_id).is_dir():
-            tokenizer_file_name = find_tokenizer_file(
-                os.listdir(path_or_repo_id))
+            tokenizer_file_name = find_tokenizer_file(os.listdir(path_or_repo_id))
             tokenizer_file = str(Path(path_or_repo_id) / tokenizer_file_name)
         else:
-            assert Path(
-                path_or_repo_id).is_file(), f"Invalid path: {path_or_repo_id}"
+            assert Path(path_or_repo_id).is_file(), f"Invalid path: {path_or_repo_id}"
             tokenizer_file = str(Path(path_or_repo_id))
 
         from mistral_common.tokens.tokenizers.mistral import (
-            MistralTokenizer as PublicMistralTokenizer)
+            MistralTokenizer as PublicMistralTokenizer,
+        )
+
         mistral_tokenizer = PublicMistralTokenizer.from_file(tokenizer_file)
         return cls(mistral_tokenizer)
 
     @staticmethod
-    def _download_mistral_tokenizer_from_hf(tokenizer_name: str,
-                                            revision: Optional[str]) -> str:
+    def _download_mistral_tokenizer_from_hf(
+        tokenizer_name: str, revision: Optional[str]
+    ) -> str:
         try:
             hf_api = HfApi()
-            files = hf_api.list_repo_files(repo_id=tokenizer_name,
-                                           revision=revision)
+            files = hf_api.list_repo_files(repo_id=tokenizer_name, revision=revision)
         except ConnectionError as exc:
-            files = list_local_repo_files(repo_id=tokenizer_name,
-                                          revision=revision)
+            files = list_local_repo_files(repo_id=tokenizer_name, revision=revision)
 
             if len(files) == 0:
                 raise exc
 
         filename = find_tokenizer_file(files)
 
-        tokenizer_file = hf_hub_download(tokenizer_name,
-                                         filename=filename,
-                                         revision=revision)
+        tokenizer_file = hf_hub_download(
+            tokenizer_name, filename=filename, revision=revision
+        )
         return tokenizer_file
 
     # the following attributes are set to fit vLLM's design and are used
@@ -290,10 +293,7 @@ def all_special_tokens_extended(self) -> list[str]:
             special_tokens = self.tokenizer.SPECIAL_TOKENS
         else:
             special_tokens = list(SpecialTokens)
-        return [
-            s.value if isinstance(s, SpecialTokens) else s
-            for s in special_tokens
-        ]
+        return [s.value if isinstance(s, SpecialTokens) else s for s in special_tokens]
 
     @property
     def all_special_tokens(self) -> list[str]:
@@ -301,9 +301,7 @@ def all_special_tokens(self) -> list[str]:
 
     @property
     def all_special_ids(self) -> list[int]:
-        return [
-            self.all_special_tokens.index(t) for t in self.all_special_tokens
-        ]
+        return [self.all_special_tokens.index(t) for t in self.all_special_tokens]
 
     @property
     def bos_token_id(self) -> int:
@@ -386,26 +384,29 @@ def encode_one(
             input_ids = input_ids[:max_length]
         return input_ids
 
-    def encode(self,
-               text: str,
-               truncation: Optional[bool] = None,
-               max_length: Optional[int] = None,
-               add_special_tokens: Optional[bool] = None) -> list[int]:
+    def encode(
+        self,
+        text: str,
+        truncation: Optional[bool] = None,
+        max_length: Optional[int] = None,
+        add_special_tokens: Optional[bool] = None,
+    ) -> list[int]:
         # `encode` should only be used for prompt completion
         # it should never be used for chat_completion.
         # For chat completion use `apply_chat_template`
         if add_special_tokens is not None:
-            return self.tokenizer.encode(text,
-                                         bos=add_special_tokens,
-                                         eos=add_special_tokens)
+            return self.tokenizer.encode(
+                text, bos=add_special_tokens, eos=add_special_tokens
+            )
         else:
             return self.tokenizer.encode(text, bos=True, eos=False)
 
-    def apply_chat_template(self,
-                            messages: list["ChatCompletionMessageParam"],
-                            tools: Optional[list[dict[str, Any]]] = None,
-                            **kwargs) -> list[int]:
-
+    def apply_chat_template(
+        self,
+        messages: list["ChatCompletionMessageParam"],
+        tools: Optional[list[dict[str, Any]]] = None,
+        **kwargs,
+    ) -> list[int]:
         request = make_mistral_chat_completion_request(messages, tools)
         encoded = self.mistral.encode_chat_completion(request)
 
@@ -414,11 +415,15 @@ def apply_chat_template(self,
 
     def convert_tokens_to_string(self, tokens: list[str]) -> str:
         from mistral_common.tokens.tokenizers.base import SpecialTokens
+
         if self.is_tekken:
             tokens = [
-                t for t in tokens
-                if (t is SpecialTokens.tool_calls
-                    or t not in self.tokenizer._all_special_tokens)
+                t
+                for t in tokens
+                if (
+                    t is SpecialTokens.tool_calls
+                    or t not in self.tokenizer._all_special_tokens
+                )
             ]
 
             if any(isinstance(t, bytes) for t in tokens):
@@ -426,20 +431,20 @@ def convert_tokens_to_string(self, tokens: list[str]) -> str:
                 shift = self.tokenizer.num_special_tokens
 
                 def _token_to_id(t: str):
-                    t_bytes = t.encode("utf-8") \
-                        if not isinstance(t, bytes) else t
+                    t_bytes = t.encode("utf-8") if not isinstance(t, bytes) else t
                     try:
-                        return shift + \
-                            self.tokenizer._tekken_token2id_nospecial[t_bytes]
+                        return (
+                            shift + self.tokenizer._tekken_token2id_nospecial[t_bytes]
+                        )
                     except KeyError:
                         logger.warning(
-                            "Failed to convert token %s to id,"
-                            " replacing with <unk>", t_bytes)
+                            "Failed to convert token %s to id, replacing with <unk>",
+                            t_bytes,
+                        )
                         return self.tokenizer.unk_id
 
                 ids = [_token_to_id(t) for t in tokens]
-                decoded = self.tokenizer.decode(ids,
-                                                self._special_token_policy)
+                decoded = self.tokenizer.decode(ids, self._special_token_policy)
             else:
                 decoded = "".join(tokens)
         else:
@@ -453,8 +458,10 @@ def _token_to_id(t: str):
                 if token in special_tokens:
                     if regular_tokens:
                         decoded_list.append(
-                            self.tokenizer.decode(regular_tokens,
-                                                  self._special_token_policy))
+                            self.tokenizer.decode(
+                                regular_tokens, self._special_token_policy
+                            )
+                        )
                         regular_tokens = []
                     decoded_list.append(token)
                 else:
@@ -462,19 +469,19 @@ def _token_to_id(t: str):
 
             if regular_tokens:
                 decoded_list.append(
-                    self.tokenizer.decode(regular_tokens,
-                                          self._special_token_policy))
+                    self.tokenizer.decode(regular_tokens, self._special_token_policy)
+                )
 
-            decoded = ''.join(decoded_list)
+            decoded = "".join(decoded_list)
 
         return decoded
 
-    def decode(self,
-               ids: Union[list[int], int],
-               skip_special_tokens: bool = True) -> str:
-        assert (
-            skip_special_tokens
-        ), "skip_special_tokens=False is not supported for Mistral tokenizers."
+    def decode(
+        self, ids: Union[list[int], int], skip_special_tokens: bool = True
+    ) -> str:
+        assert skip_special_tokens, (
+            "skip_special_tokens=False is not supported for Mistral tokenizers."
+        )
 
         if isinstance(ids, int):
             ids = [ids]
@@ -486,13 +493,12 @@ def convert_ids_to_tokens(
         skip_special_tokens: bool = True,
     ) -> list[str]:
         from mistral_common.tokens.tokenizers.base import SpecialTokens
-        from mistral_common.tokens.tokenizers.instruct import (
-            InstructTokenizerV13)
+        from mistral_common.tokens.tokenizers.instruct import InstructTokenizerV13
 
         # TODO(Patrick) - potentially allow special tokens to not be skipped
-        assert (
-            skip_special_tokens
-        ), "skip_special_tokens=False is not supported for Mistral tokenizers."
+        assert skip_special_tokens, (
+            "skip_special_tokens=False is not supported for Mistral tokenizers."
+        )
 
         assert self.is_tekken or self.is_spm, type(self.tokenizer)
 
@@ -507,8 +513,9 @@ def convert_ids_to_tokens(
                 if self.instruct.END_THINK:
                     non_skip_special_tokens.add(self.instruct.END_THINK)
             ids = [
-                i for i in ids if i > self.tokenizer.num_special_tokens
-                or i in non_skip_special_tokens
+                i
+                for i in ids
+                if i > self.tokenizer.num_special_tokens or i in non_skip_special_tokens
             ]
 
         tokens = [self.tokenizer.id_to_piece(id) for id in ids]
diff --git a/vllm/transformers_utils/utils.py b/vllm/transformers_utils/utils.py
index 2aaad8f949d0..8952a0b197d6 100644
--- a/vllm/transformers_utils/utils.py
+++ b/vllm/transformers_utils/utils.py
@@ -15,7 +15,7 @@
 
 
 def is_s3(model_or_path: str) -> bool:
-    return model_or_path.lower().startswith('s3://')
+    return model_or_path.lower().startswith("s3://")
 
 
 def check_gguf_file(model: Union[str, PathLike]) -> bool:
@@ -43,13 +43,16 @@ def modelscope_list_repo_files(
 ) -> list[str]:
     """List files in a modelscope repo."""
     from modelscope.hub.api import HubApi
+
     api = HubApi()
     api.login(token)
     # same as huggingface_hub.list_repo_files
     files = [
-        file['Path'] for file in api.get_model_files(
-            model_id=repo_id, revision=revision, recursive=True)
-        if file['Type'] == 'blob'
+        file["Path"]
+        for file in api.get_model_files(
+            model_id=repo_id, revision=revision, recursive=True
+        )
+        if file["Type"] == "blob"
     ]
     return files
 
@@ -91,18 +94,18 @@ def maybe_model_redirect(model: str) -> str:
     if not Path(model_redirect_path).exists():
         return model
 
-    redirect_dict = (_maybe_json_dict(model_redirect_path)
-                     or _maybe_space_split_dict(model_redirect_path))
-    if (redirect_model := redirect_dict.get(model)):
+    redirect_dict = _maybe_json_dict(model_redirect_path) or _maybe_space_split_dict(
+        model_redirect_path
+    )
+    if redirect_model := redirect_dict.get(model):
         logger.info("model redirect: [ %s ] -> [ %s ]", model, redirect_model)
         return redirect_model
 
     return model
 
 
-def parse_safetensors_file_metadata(
-        path: Union[str, PathLike]) -> dict[str, Any]:
+def parse_safetensors_file_metadata(path: Union[str, PathLike]) -> dict[str, Any]:
     with open(path, "rb") as f:
-        length_of_metadata = struct.unpack('<Q', f.read(8))[0]
-        metadata = json.loads(f.read(length_of_metadata).decode('utf-8'))
+        length_of_metadata = struct.unpack("<Q", f.read(8))[0]
+        metadata = json.loads(f.read(length_of_metadata).decode("utf-8"))
         return metadata
diff --git a/vllm/triton_utils/__init__.py b/vllm/triton_utils/__init__.py
index 828536e6408b..a475d0fa406b 100644
--- a/vllm/triton_utils/__init__.py
+++ b/vllm/triton_utils/__init__.py
@@ -1,8 +1,11 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-from vllm.triton_utils.importing import (HAS_TRITON, TritonLanguagePlaceholder,
-                                         TritonPlaceholder)
+from vllm.triton_utils.importing import (
+    HAS_TRITON,
+    TritonLanguagePlaceholder,
+    TritonPlaceholder,
+)
 
 if HAS_TRITON:
     import triton
diff --git a/vllm/triton_utils/importing.py b/vllm/triton_utils/importing.py
index 95076a9a7c8f..e1a509a303c5 100644
--- a/vllm/triton_utils/importing.py
+++ b/vllm/triton_utils/importing.py
@@ -21,15 +21,15 @@
         # an is_active method.
         # The `x.driver and` check adds a small layer of safety.
         active_drivers = [
-            x.driver for x in backends.values()
-            if x.driver and x.driver.is_active()
+            x.driver for x in backends.values() if x.driver and x.driver.is_active()
         ]
 
         # Check if we're in a distributed environment where CUDA_VISIBLE_DEVICES
         # might be temporarily empty (e.g., Ray sets it to "" during actor init)
         cuda_visible_devices = os.environ.get("CUDA_VISIBLE_DEVICES")
-        is_distributed_env = (cuda_visible_devices is not None
-                              and len(cuda_visible_devices.strip()) == 0)
+        is_distributed_env = (
+            cuda_visible_devices is not None and len(cuda_visible_devices.strip()) == 0
+        )
 
         # Apply lenient driver check for distributed environments
         if is_distributed_env and len(active_drivers) == 0:
@@ -37,35 +37,41 @@
             # active later when CUDA context is properly initialized
             logger.debug(
                 "Triton found 0 active drivers in distributed environment. "
-                "This is expected during initialization.")
+                "This is expected during initialization."
+            )
         elif not is_distributed_env and len(active_drivers) != 1:
             # Strict check for non-distributed environments
             logger.info(
                 "Triton is installed but %d active driver(s) found "
                 "(expected 1). Disabling Triton to prevent runtime errors.",
-                len(active_drivers))
+                len(active_drivers),
+            )
             HAS_TRITON = False
     except ImportError:
         # This can occur if Triton is partially installed or triton.backends
         # is missing.
         logger.warning(
             "Triton is installed, but `triton.backends` could not be imported. "
-            "Disabling Triton.")
+            "Disabling Triton."
+        )
         HAS_TRITON = False
     except Exception as e:
         # Catch any other unexpected errors during the check.
         logger.warning(
             "An unexpected error occurred while checking Triton active drivers:"
-            " %s. Disabling Triton.", e)
+            " %s. Disabling Triton.",
+            e,
+        )
         HAS_TRITON = False
 
 if not HAS_TRITON:
-    logger.info("Triton not installed or not compatible; certain GPU-related"
-                " functions will not be available.")
+    logger.info(
+        "Triton not installed or not compatible; certain GPU-related"
+        " functions will not be available."
+    )
 
 
 class TritonPlaceholder(types.ModuleType):
-
     def __init__(self):
         super().__init__("triton")
         self.__version__ = "3.4.0"
@@ -76,7 +82,6 @@ def __init__(self):
         self.language = TritonLanguagePlaceholder()
 
     def _dummy_decorator(self, name):
-
         def decorator(*args, **kwargs):
             if args and callable(args[0]):
                 return args[0]
@@ -86,7 +91,6 @@ def decorator(*args, **kwargs):
 
 
 class TritonLanguagePlaceholder(types.ModuleType):
-
     def __init__(self):
         super().__init__("triton.language")
         self.constexpr = None
diff --git a/vllm/usage/usage_lib.py b/vllm/usage/usage_lib.py
index 92245498de65..ed470ebe8892 100644
--- a/vllm/usage/usage_lib.py
+++ b/vllm/usage/usage_lib.py
@@ -68,8 +68,7 @@ def is_usage_stats_enabled():
         no_usage_stats = envs.VLLM_NO_USAGE_STATS
         do_not_track_file = os.path.exists(_USAGE_STATS_DO_NOT_TRACK_PATH)
 
-        _USAGE_STATS_ENABLED = not (do_not_track or no_usage_stats
-                                    or do_not_track_file)
+        _USAGE_STATS_ENABLED = not (do_not_track or no_usage_stats or do_not_track_file)
     return _USAGE_STATS_ENABLED
 
 
@@ -80,9 +79,11 @@ def _get_current_timestamp_ns() -> int:
 def _detect_cloud_provider() -> str:
     # Try detecting through vendor file
     vendor_files = [
-        "/sys/class/dmi/id/product_version", "/sys/class/dmi/id/bios_vendor",
+        "/sys/class/dmi/id/product_version",
+        "/sys/class/dmi/id/bios_vendor",
         "/sys/class/dmi/id/product_name",
-        "/sys/class/dmi/id/chassis_asset_tag", "/sys/class/dmi/id/sys_vendor"
+        "/sys/class/dmi/id/chassis_asset_tag",
+        "/sys/class/dmi/id/sys_vendor",
     ]
     # Mapping of identifiable strings to cloud providers
     cloud_identifiers = {
@@ -152,39 +153,53 @@ def __init__(self) -> None:
         self.log_time: Optional[int] = None
         self.source: Optional[str] = None
 
-    def report_usage(self,
-                     model_architecture: str,
-                     usage_context: UsageContext,
-                     extra_kvs: Optional[dict[str, Any]] = None) -> None:
-        t = Thread(target=self._report_usage_worker,
-                   args=(model_architecture, usage_context, extra_kvs or {}),
-                   daemon=True)
+    def report_usage(
+        self,
+        model_architecture: str,
+        usage_context: UsageContext,
+        extra_kvs: Optional[dict[str, Any]] = None,
+    ) -> None:
+        t = Thread(
+            target=self._report_usage_worker,
+            args=(model_architecture, usage_context, extra_kvs or {}),
+            daemon=True,
+        )
         t.start()
 
-    def _report_usage_worker(self, model_architecture: str,
-                             usage_context: UsageContext,
-                             extra_kvs: dict[str, Any]) -> None:
+    def _report_usage_worker(
+        self,
+        model_architecture: str,
+        usage_context: UsageContext,
+        extra_kvs: dict[str, Any],
+    ) -> None:
         self._report_usage_once(model_architecture, usage_context, extra_kvs)
         self._report_continuous_usage()
 
-    def _report_usage_once(self, model_architecture: str,
-                           usage_context: UsageContext,
-                           extra_kvs: dict[str, Any]) -> None:
+    def _report_usage_once(
+        self,
+        model_architecture: str,
+        usage_context: UsageContext,
+        extra_kvs: dict[str, Any],
+    ) -> None:
         # Platform information
         from vllm.platforms import current_platform
+
         if current_platform.is_cuda_alike():
             self.gpu_count = cuda_device_count_stateless()
-            self.gpu_type, self.gpu_memory_per_device = (
-                cuda_get_device_properties(0, ("name", "total_memory")))
+            self.gpu_type, self.gpu_memory_per_device = cuda_get_device_properties(
+                0, ("name", "total_memory")
+            )
         if current_platform.is_cuda():
             self.cuda_runtime = torch.version.cuda
         if current_platform.is_tpu():
             try:
                 import torch_xla
+
                 self.gpu_count = torch_xla.runtime.world_size()
                 self.gpu_type = torch_xla.tpu.get_tpu_type()
-                self.gpu_memory_per_device = (
-                    torch_xla.core.xla_model.get_memory_info()["bytes_limit"])
+                self.gpu_memory_per_device = torch_xla.core.xla_model.get_memory_info()[
+                    "bytes_limit"
+                ]
             except Exception:
                 logger.exception("Failed to collect TPU information")
         self.provider = _detect_cloud_provider()
@@ -195,11 +210,13 @@ def _report_usage_once(self, model_architecture: str,
         info = cpuinfo.get_cpu_info()
         self.num_cpu = info.get("count", None)
         self.cpu_type = info.get("brand_raw", "")
-        self.cpu_family_model_stepping = ",".join([
-            str(info.get("family", "")),
-            str(info.get("model", "")),
-            str(info.get("stepping", ""))
-        ])
+        self.cpu_family_model_stepping = ",".join(
+            [
+                str(info.get("family", "")),
+                str(info.get("model", "")),
+                str(info.get("stepping", "")),
+            ]
+        )
 
         # vLLM information
         self.context = usage_context.value
@@ -207,10 +224,9 @@ def _report_usage_once(self, model_architecture: str,
         self.model_architecture = model_architecture
 
         # Environment variables
-        self.env_var_json = json.dumps({
-            env_var: getattr(envs, env_var)
-            for env_var in _USAGE_ENV_VARS_TO_COLLECT
-        })
+        self.env_var_json = json.dumps(
+            {env_var: getattr(envs, env_var) for env_var in _USAGE_ENV_VARS_TO_COLLECT}
+        )
 
         # Metadata
         self.log_time = _get_current_timestamp_ns()
diff --git a/vllm/utils/__init__.py b/vllm/utils/__init__.py
index 6b208bca6986..c9999649b58b 100644
--- a/vllm/utils/__init__.py
+++ b/vllm/utils/__init__.py
@@ -33,22 +33,48 @@
 import uuid
 import warnings
 import weakref
-from argparse import (Action, ArgumentDefaultsHelpFormatter, ArgumentParser,
-                      ArgumentTypeError, RawDescriptionHelpFormatter,
-                      _ArgumentGroup)
+from argparse import (
+    Action,
+    ArgumentDefaultsHelpFormatter,
+    ArgumentParser,
+    ArgumentTypeError,
+    RawDescriptionHelpFormatter,
+    _ArgumentGroup,
+)
 from asyncio import FIRST_COMPLETED, AbstractEventLoop, Task
 from collections import UserDict, defaultdict
-from collections.abc import (AsyncGenerator, Awaitable, Collection, Generator,
-                             Hashable, Iterable, Iterator, KeysView, Mapping,
-                             Sequence)
+from collections.abc import (
+    AsyncGenerator,
+    Awaitable,
+    Collection,
+    Generator,
+    Hashable,
+    Iterable,
+    Iterator,
+    KeysView,
+    Mapping,
+    Sequence,
+)
 from concurrent.futures import ThreadPoolExecutor
 from concurrent.futures.process import ProcessPoolExecutor
 from dataclasses import dataclass, field
 from functools import cache, lru_cache, partial, wraps
 from pathlib import Path
 from types import MappingProxyType
-from typing import (TYPE_CHECKING, Any, Callable, Generic, Literal, NamedTuple,
-                    Optional, TextIO, TypeVar, Union, cast, overload)
+from typing import (
+    TYPE_CHECKING,
+    Any,
+    Callable,
+    Generic,
+    Literal,
+    NamedTuple,
+    Optional,
+    TextIO,
+    TypeVar,
+    Union,
+    cast,
+    overload,
+)
 from urllib.parse import urlparse
 from uuid import uuid4
 
@@ -117,8 +143,8 @@
 """The number of bytes in one gibibyte (GiB)."""
 
 # ANSI color codes
-CYAN = '\033[1;36m'
-RESET = '\033[0;0m'
+CYAN = "\033[1;36m"
+RESET = "\033[0;0m"
 
 STR_DTYPE_TO_TORCH_DTYPE = {
     "float32": torch.float32,
@@ -152,7 +178,7 @@ def set_default_torch_num_threads(num_threads: int):
     torch.set_num_threads(old_num_threads)
 
 
-P = ParamSpec('P')
+P = ParamSpec("P")
 T = TypeVar("T")
 U = TypeVar("U")
 
@@ -161,8 +187,7 @@ def set_default_torch_num_threads(num_threads: int):
 _T = TypeVar("_T")
 
 
-class _Sentinel:
-    ...
+class _Sentinel: ...
 
 
 ALL_PINNED_SENTINEL = _Sentinel()
@@ -179,7 +204,6 @@ class LayerBlockType(enum.Enum):
 
 
 class Counter:
-
     def __init__(self, start: int = 0) -> None:
         self.counter = start
 
@@ -193,7 +217,6 @@ def reset(self) -> None:
 
 
 class _MappingOrderCacheView(UserDict[_K, _V]):
-
     def __init__(self, data: Mapping[_K, _V], ordered_keys: Mapping[_K, None]):
         super().__init__(data)
         self.ordered_keys = ordered_keys
@@ -224,10 +247,9 @@ def __sub__(self, other: CacheInfo):
 
 
 class LRUCache(cachetools.LRUCache[_K, _V], Generic[_K, _V]):
-
-    def __init__(self,
-                 capacity: float,
-                 getsizeof: Optional[Callable[[_V], float]] = None):
+    def __init__(
+        self, capacity: float, getsizeof: Optional[Callable[[_V], float]] = None
+    ):
         super().__init__(capacity, getsizeof)
 
         self.pinned_items = set[_K]()
@@ -247,8 +269,7 @@ def __getitem__(self, key: _K, *, update_info: bool = True) -> _V:
 
     def __delitem__(self, key: _K) -> None:
         run_on_remove = key in self
-        value = self.__getitem__(key,
-                                 update_info=False)  # type: ignore[call-arg]
+        value = self.__getitem__(key, update_info=False)  # type: ignore[call-arg]
         super().__delitem__(key)
         if key in self.pinned_items:
             # Todo: add warning to inform that del pinned item
@@ -261,7 +282,8 @@ def cache(self) -> Mapping[_K, _V]:
         """Return the internal cache dictionary in order (read-only)."""
         return _MappingOrderCacheView(
             self._Cache__data,  # type: ignore
-            self.order)
+            self.order,
+        )
 
     @property
     def order(self) -> Mapping[_K, None]:
@@ -302,22 +324,17 @@ def touch(self, key: _K) -> None:
             self._LRUCache__order[key] = None  # type: ignore
 
     @overload
-    def get(self, key: _K, /) -> Optional[_V]:
-        ...
+    def get(self, key: _K, /) -> Optional[_V]: ...
 
     @overload
-    def get(self, key: _K, /, default: Union[_V, _T]) -> Union[_V, _T]:
-        ...
-
-    def get(self,
-            key: _K,
-            /,
-            default: Optional[Union[_V,
-                                    _T]] = None) -> Optional[Union[_V, _T]]:
+    def get(self, key: _K, /, default: Union[_V, _T]) -> Union[_V, _T]: ...
+
+    def get(
+        self, key: _K, /, default: Optional[Union[_V, _T]] = None
+    ) -> Optional[Union[_V, _T]]:
         value: Optional[Union[_V, _T]]
         if key in self:
-            value = self.__getitem__(
-                key, update_info=False)  # type: ignore[call-arg]
+            value = self.__getitem__(key, update_info=False)  # type: ignore[call-arg]
 
             self._hits += 1
         else:
@@ -327,23 +344,19 @@ def get(self,
         return value
 
     @overload
-    def pop(self, key: _K) -> _V:
-        ...
+    def pop(self, key: _K) -> _V: ...
 
     @overload
-    def pop(self, key: _K, default: Union[_V, _T]) -> Union[_V, _T]:
-        ...
+    def pop(self, key: _K, default: Union[_V, _T]) -> Union[_V, _T]: ...
 
-    def pop(self,
-            key: _K,
-            default: Optional[Union[_V,
-                                    _T]] = None) -> Optional[Union[_V, _T]]:
+    def pop(
+        self, key: _K, default: Optional[Union[_V, _T]] = None
+    ) -> Optional[Union[_V, _T]]:
         value: Optional[Union[_V, _T]]
         if key not in self:
             return default
 
-        value = self.__getitem__(key,
-                                 update_info=False)  # type: ignore[call-arg]
+        value = self.__getitem__(key, update_info=False)  # type: ignore[call-arg]
         self.__delitem__(key)
         return value
 
@@ -385,10 +398,12 @@ def popitem(self, remove_pinned: bool = False):
             # pop the oldest item in the cache that is not pinned
             lru_key = next(
                 (key for key in self.order if key not in self.pinned_items),
-                ALL_PINNED_SENTINEL)
+                ALL_PINNED_SENTINEL,
+            )
             if lru_key is ALL_PINNED_SENTINEL:
-                raise RuntimeError("All items are pinned, "
-                                   "cannot remove oldest from the cache.")
+                raise RuntimeError(
+                    "All items are pinned, cannot remove oldest from the cache."
+                )
         else:
             lru_key = next(iter(self.order))
         value = self.pop(cast(_K, lru_key))
@@ -436,8 +451,7 @@ def get_object(self):
         return obj
 
     def reset(self):
-        """Makes all cached-objects available for the next scheduler iteration.
-        """
+        """Makes all cached-objects available for the next scheduler iteration."""
         self._index = 0
 
 
@@ -445,8 +459,8 @@ def reset(self):
 def get_max_shared_memory_bytes(gpu: int = 0) -> int:
     """Returns the maximum shared memory per thread block in bytes."""
     from vllm import _custom_ops as ops
-    max_shared_mem = (
-        ops.get_max_shared_memory_per_block_device_attribute(gpu))
+
+    max_shared_mem = ops.get_max_shared_memory_per_block_device_attribute(gpu)
     # value 0 will cause MAX_SEQ_LEN become negative and test_attention.py
     # will fail
     assert max_shared_mem > 0, "max_shared_mem can not be zero"
@@ -481,11 +495,14 @@ def __init__(
         self.batch_wait_timeout_s = batch_wait_timeout_s
 
         self._loop = asyncio.get_running_loop()
-        self._queues: dict[tuple,
-                           asyncio.Queue[Union[tuple[str, dict,
-                                                     asyncio.Future],
-                                               tuple[list[int],
-                                                     asyncio.Future]]]] = {}
+        self._queues: dict[
+            tuple,
+            asyncio.Queue[
+                Union[
+                    tuple[str, dict, asyncio.Future], tuple[list[int], asyncio.Future]
+                ]
+            ],
+        ] = {}
         self._batcher_tasks: list[asyncio.Task] = []
 
         # Single-thread executor for blocking tokenizer calls.
@@ -509,8 +526,9 @@ async def decode(self, token_ids, **kwargs):
     # === Internal helpers ===
     def _get_queue(
         self, loop: asyncio.AbstractEventLoop, key: tuple
-    ) -> asyncio.Queue[Union[tuple[str, dict, asyncio.Future], tuple[
-            list[int], asyncio.Future]]]:
+    ) -> asyncio.Queue[
+        Union[tuple[str, dict, asyncio.Future], tuple[list[int], asyncio.Future]]
+    ]:
         """Get the request queue for the given operation key, creating a new
         queue and batcher task if needed."""
         queue = self._queues.get(key)
@@ -520,8 +538,7 @@ def _get_queue(
                 can_batch = key[1] != "other"
                 coro = self._batch_encode_loop(queue, can_batch)
             else:
-                assert key[0] == "decode", \
-                    f"Unknown operation type: {key[0]}."
+                assert key[0] == "decode", f"Unknown operation type: {key[0]}."
                 coro = self._batch_decode_loop(queue)
             self._batcher_tasks.append(loop.create_task(coro))
         return queue
@@ -541,7 +558,8 @@ async def _batch_encode_loop(self, queue: asyncio.Queue, can_batch: bool):
                     break
                 try:
                     prompt, kwargs, result_future = await asyncio.wait_for(
-                        queue.get(), timeout)
+                        queue.get(), timeout
+                    )
                     prompts.append(prompt)
                     result_futures.append(result_future)
                     if not can_batch:
@@ -553,10 +571,10 @@ async def _batch_encode_loop(self, queue: asyncio.Queue, can_batch: bool):
                 # If every request uses identical kwargs we can run a single
                 # batched tokenizer call for a big speed-up.
                 if can_batch and len(prompts) > 1:
-                    batch_encode_fn = partial(self.tokenizer, prompts,
-                                              **kwargs)
+                    batch_encode_fn = partial(self.tokenizer, prompts, **kwargs)
                     results = await self._loop.run_in_executor(
-                        self._executor, batch_encode_fn)
+                        self._executor, batch_encode_fn
+                    )
 
                     for i, fut in enumerate(result_futures):
                         if not fut.done():
@@ -564,11 +582,11 @@ async def _batch_encode_loop(self, queue: asyncio.Queue, can_batch: bool):
                             fut.set_result(BatchEncoding(data))
                 else:
                     encode_fn = lambda prompts=prompts, kwargs=kwargs_list: [
-                        self.tokenizer(p, **kw)
-                        for p, kw in zip(prompts, kwargs)
+                        self.tokenizer(p, **kw) for p, kw in zip(prompts, kwargs)
                     ]
                     results = await self._loop.run_in_executor(
-                        self._executor, encode_fn)
+                        self._executor, encode_fn
+                    )
 
                     for fut, res in zip(result_futures, results):
                         if not fut.done():
@@ -592,7 +610,8 @@ async def _batch_decode_loop(self, queue: asyncio.Queue):
                     break
                 try:
                     token_ids, result_future = await asyncio.wait_for(
-                        queue.get(), timeout)
+                        queue.get(), timeout
+                    )
                     token_ids_list.append(token_ids)
                     result_futures.append(result_future)
                 except asyncio.TimeoutError:
@@ -601,8 +620,8 @@ async def _batch_decode_loop(self, queue: asyncio.Queue):
             try:
                 # Perform a single batched decode call for all requests
                 results = await self._loop.run_in_executor(
-                    self._executor, self.tokenizer.batch_decode,
-                    token_ids_list)
+                    self._executor, self.tokenizer.batch_decode, token_ids_list
+                )
                 for fut, res in zip(result_futures, results):
                     if not fut.done():
                         fut.set_result(res)
@@ -631,7 +650,7 @@ def _queue_key(self, op: str, kwargs: dict) -> tuple:
         """
 
         if op == "decode":
-            return ("decode", )
+            return ("decode",)
 
         add_special_tokens = kwargs.get("add_special_tokens", True)
         truncation = kwargs.get("truncation", False)
@@ -641,16 +660,17 @@ def _queue_key(self, op: str, kwargs: dict) -> tuple:
             return "encode", add_special_tokens, False, None
 
         model_max = getattr(self.tokenizer, "model_max_length", None)
-        if max_length is None or (model_max is not None
-                                  and max_length == model_max):
+        if max_length is None or (model_max is not None and max_length == model_max):
             return "encode", add_special_tokens, True, "model_max"
 
         return "encode", "other"
 
     def __del__(self):
-        if ((tasks := getattr(self, "_batcher_tasks", None))
-                and (loop := getattr(self, "_loop", None))
-                and not loop.is_closed()):
+        if (
+            (tasks := getattr(self, "_batcher_tasks", None))
+            and (loop := getattr(self, "_loop", None))
+            and not loop.is_closed()
+        ):
 
             def cancel_tasks():
                 for task in tasks:
@@ -685,8 +705,7 @@ def in_loop(event_loop: AbstractEventLoop) -> bool:
 
 
 def make_async(
-    func: Callable[P, T],
-    executor: Optional[concurrent.futures.Executor] = None
+    func: Callable[P, T], executor: Optional[concurrent.futures.Executor] = None
 ) -> Callable[P, Awaitable[T]]:
     """Take a blocking function, and run it on in an executor thread.
 
@@ -703,15 +722,14 @@ def _async_wrapper(*args: P.args, **kwargs: P.kwargs) -> asyncio.Future:
     return _async_wrapper
 
 
-def _next_task(iterator: AsyncGenerator[T, None],
-               loop: AbstractEventLoop) -> Task:
+def _next_task(iterator: AsyncGenerator[T, None], loop: AbstractEventLoop) -> Task:
     # Can use anext() in python >= 3.10
     return loop.create_task(iterator.__anext__())  # type: ignore[arg-type]
 
 
 async def merge_async_iterators(
-    *iterators: AsyncGenerator[T,
-                               None], ) -> AsyncGenerator[tuple[int, T], None]:
+    *iterators: AsyncGenerator[T, None],
+) -> AsyncGenerator[tuple[int, T], None]:
     """Merge multiple asynchronous iterators into a single iterator.
 
     This method handle the case where some iterators finish before others.
@@ -729,8 +747,7 @@ async def merge_async_iterators(
     awaits = {_next_task(pair[1], loop): pair for pair in enumerate(iterators)}
     try:
         while awaits:
-            done, _ = await asyncio.wait(awaits.keys(),
-                                         return_when=FIRST_COMPLETED)
+            done, _ = await asyncio.wait(awaits.keys(), return_when=FIRST_COMPLETED)
             for d in done:
                 pair = awaits.pop(d)
                 try:
@@ -748,8 +765,7 @@ async def merge_async_iterators(
                 await it.aclose()
 
 
-async def collect_from_async_generator(
-        iterator: AsyncGenerator[T, None]) -> list[T]:
+async def collect_from_async_generator(iterator: AsyncGenerator[T, None]) -> list[T]:
     """Collect all items from an async generator into a list."""
     items = []
     async for item in iterator:
@@ -765,7 +781,8 @@ def get_ip() -> str:
             " it is often used by Docker and other software to"
             " interact with the container's network stack. Please "
             "use VLLM_HOST_IP instead to set the IP address for vLLM processes"
-            " to communicate with each other.")
+            " to communicate with each other."
+        )
     if host_ip:
         return host_ip
 
@@ -793,7 +810,8 @@ def get_ip() -> str:
         "Failed to get the IP address, using 0.0.0.0 by default."
         "The value can be set by the environment variable"
         " VLLM_HOST_IP or HOST_IP.",
-        stacklevel=2)
+        stacklevel=2,
+    )
     return "0.0.0.0"
 
 
@@ -821,7 +839,8 @@ def get_loopback_ip() -> str:
     else:
         raise RuntimeError(
             "Neither 127.0.0.1 nor ::1 are bound to a local interface. "
-            "Set the VLLM_LOOPBACK_IP environment variable explicitly.")
+            "Set the VLLM_LOOPBACK_IP environment variable explicitly."
+        )
 
 
 def is_valid_ipv6_address(address: str) -> bool:
@@ -834,13 +853,13 @@ def is_valid_ipv6_address(address: str) -> bool:
 
 def split_host_port(host_port: str) -> tuple[str, int]:
     # ipv6
-    if host_port.startswith('['):
-        host, port = host_port.rsplit(']', 1)
+    if host_port.startswith("["):
+        host, port = host_port.rsplit("]", 1)
         host = host[1:]
-        port = port.split(':')[1]
+        port = port.split(":")[1]
         return host, int(port)
     else:
-        host, port = host_port.split(':')
+        host, port = host_port.split(":")
         return host, int(port)
 
 
@@ -908,8 +927,7 @@ def _get_open_port() -> int:
                     return port
             except OSError:
                 port += 1  # Increment port number if already in use
-                logger.info("Port %d is already in use, trying port %d",
-                            port - 1, port)
+                logger.info("Port %d is already in use, trying port %d", port - 1, port)
     # try ipv4
     try:
         with socket.socket(socket.AF_INET, socket.SOCK_STREAM) as s:
@@ -932,8 +950,7 @@ def find_process_using_port(port: int) -> Optional[psutil.Process]:
 
     our_pid = os.getpid()
     for conn in psutil.net_connections():
-        if conn.laddr.port == port and (conn.pid is not None
-                                        and conn.pid != our_pid):
+        if conn.laddr.port == port and (conn.pid is not None and conn.pid != our_pid):
             try:
                 return psutil.Process(conn.pid)
             except psutil.NoSuchProcess:
@@ -945,15 +962,18 @@ def update_environment_variables(envs: dict[str, str]):
     for k, v in envs.items():
         if k in os.environ and os.environ[k] != v:
             logger.warning(
-                "Overwriting environment variable %s "
-                "from '%s' to '%s'", k, os.environ[k], v)
+                "Overwriting environment variable %s from '%s' to '%s'",
+                k,
+                os.environ[k],
+                v,
+            )
         os.environ[k] = v
 
 
 def chunk_list(lst: list[T], chunk_size: int):
     """Yield successive chunk_size chunks from lst."""
     for i in range(0, len(lst), chunk_size):
-        yield lst[i:i + chunk_size]
+        yield lst[i : i + chunk_size]
 
 
 def cdiv(a: int, b: int) -> int:
@@ -997,6 +1017,7 @@ def _generate_random_fp8(
     # Inf | N/A         | s.11111.00
     # NaN | s.1111.111  | s.11111.{01,10,11}
     from vllm import _custom_ops as ops
+
     tensor_tmp = torch.empty_like(tensor, dtype=torch.float16)
     tensor_tmp.uniform_(low, high)
     ops.convert_fp8(tensor, tensor_tmp)
@@ -1004,12 +1025,12 @@ def _generate_random_fp8(
 
 
 def get_kv_cache_torch_dtype(
-        cache_dtype: Optional[Union[str, torch.dtype]],
-        model_dtype: Optional[Union[str, torch.dtype]] = None) -> torch.dtype:
+    cache_dtype: Optional[Union[str, torch.dtype]],
+    model_dtype: Optional[Union[str, torch.dtype]] = None,
+) -> torch.dtype:
     if isinstance(cache_dtype, str):
         if cache_dtype == "auto":
-            if isinstance(model_dtype,
-                          str) and model_dtype in STR_DTYPE_TO_TORCH_DTYPE:
+            if isinstance(model_dtype, str) and model_dtype in STR_DTYPE_TO_TORCH_DTYPE:
                 torch_dtype = STR_DTYPE_TO_TORCH_DTYPE[model_dtype]
             elif isinstance(model_dtype, torch.dtype):
                 torch_dtype = model_dtype
@@ -1039,32 +1060,30 @@ def create_kv_caches_with_random_flash(
     cache_layout: Optional[str] = "NHD",
 ) -> tuple[list[torch.Tensor], list[torch.Tensor]]:
     from vllm.platforms import current_platform
+
     current_platform.seed_everything(seed)
 
     torch_dtype = get_kv_cache_torch_dtype(cache_dtype, model_dtype)
     generic_kv_cache_shape = (num_blocks, 2, block_size, num_heads, head_size)
     assert cache_layout in ("NHD", "HND")
-    stride_order = (0, 1, 2, 3, 4) if cache_layout == "NHD" else (0, 1, 3, 2,
-                                                                  4)
+    stride_order = (0, 1, 2, 3, 4) if cache_layout == "NHD" else (0, 1, 3, 2, 4)
 
-    kv_cache_allocation_shape = tuple(generic_kv_cache_shape[i]
-                                      for i in stride_order)
+    kv_cache_allocation_shape = tuple(generic_kv_cache_shape[i] for i in stride_order)
     scale = head_size**-0.5
 
     key_caches: list[torch.Tensor] = []
     value_caches: list[torch.Tensor] = []
 
     for _ in range(num_layers):
-        key_value_cache = torch.empty(size=kv_cache_allocation_shape,
-                                      dtype=torch_dtype,
-                                      device=device).permute(*stride_order)
+        key_value_cache = torch.empty(
+            size=kv_cache_allocation_shape, dtype=torch_dtype, device=device
+        ).permute(*stride_order)
         if cache_dtype in ["auto", "half", "bfloat16", "float"]:
             key_value_cache.uniform_(-scale, scale)
-        elif cache_dtype == 'fp8':
+        elif cache_dtype == "fp8":
             _generate_random_fp8(key_value_cache, -scale, scale)
         else:
-            raise ValueError(
-                f"Does not support key cache of type {cache_dtype}")
+            raise ValueError(f"Does not support key cache of type {cache_dtype}")
         key_caches.append(key_value_cache[:, 0])
         value_caches.append(key_value_cache[:, 1])
     return key_caches, value_caches
@@ -1086,6 +1105,7 @@ def create_kv_caches_with_random(
             f"Does not support key cache of type fp8 with head_size {head_size}"
         )
     from vllm.platforms import current_platform
+
     current_platform.seed_everything(seed)
 
     torch_dtype = get_kv_cache_torch_dtype(cache_dtype, model_dtype)
@@ -1095,31 +1115,27 @@ def create_kv_caches_with_random(
     key_cache_shape = (num_blocks, num_heads, head_size // x, block_size, x)
     key_caches: list[torch.Tensor] = []
     for _ in range(num_layers):
-        key_cache = torch.empty(size=key_cache_shape,
-                                dtype=torch_dtype,
-                                device=device)
+        key_cache = torch.empty(size=key_cache_shape, dtype=torch_dtype, device=device)
         if cache_dtype in ["auto", "half", "bfloat16", "float"]:
             key_cache.uniform_(-scale, scale)
-        elif cache_dtype == 'fp8':
+        elif cache_dtype == "fp8":
             _generate_random_fp8(key_cache, -scale, scale)
         else:
-            raise ValueError(
-                f"Does not support key cache of type {cache_dtype}")
+            raise ValueError(f"Does not support key cache of type {cache_dtype}")
         key_caches.append(key_cache)
 
     value_cache_shape = (num_blocks, num_heads, head_size, block_size)
     value_caches: list[torch.Tensor] = []
     for _ in range(num_layers):
-        value_cache = torch.empty(size=value_cache_shape,
-                                  dtype=torch_dtype,
-                                  device=device)
+        value_cache = torch.empty(
+            size=value_cache_shape, dtype=torch_dtype, device=device
+        )
         if cache_dtype in ["auto", "half", "bfloat16", "float"]:
             value_cache.uniform_(-scale, scale)
-        elif cache_dtype == 'fp8':
+        elif cache_dtype == "fp8":
             _generate_random_fp8(value_cache, -scale, scale)
         else:
-            raise ValueError(
-                f"Does not support value cache of type {cache_dtype}")
+            raise ValueError(f"Does not support value cache of type {cache_dtype}")
         value_caches.append(value_cache)
     return key_caches, value_caches
 
@@ -1127,6 +1143,7 @@ def create_kv_caches_with_random(
 @cache
 def is_pin_memory_available() -> bool:
     from vllm.platforms import current_platform
+
     return current_platform.is_pin_memory_available()
 
 
@@ -1139,13 +1156,13 @@ def is_uva_available() -> bool:
 
 
 class DeviceMemoryProfiler:
-
     def __init__(self, device: Optional[torch.types.Device] = None):
         self.device = device
 
     def current_memory_usage(self) -> float:
         # Return the memory usage in bytes.
         from vllm.platforms import current_platform
+
         gc.collect()
         return current_platform.get_current_memory_usage(self.device)
 
@@ -1182,7 +1199,7 @@ def make_ndarray_with_pad(
     padded_x = np.full((len(x), max_len), pad, dtype=dtype)
     for ind, blocktb in enumerate(x):
         assert len(blocktb) <= max_len
-        padded_x[ind, :len(blocktb)] = blocktb
+        padded_x[ind, : len(blocktb)] = blocktb
 
     return padded_x
 
@@ -1231,8 +1248,7 @@ def get_dtype_size(dtype: torch.dtype) -> int:
 # bool = 0, int = 1, float = 2, complex = 3
 def _get_precision_level(dtype: torch.dtype) -> int:
     # NOTE: Complex dtypes return `is_floating_point=False`
-    return ((dtype != torch.bool) + dtype.is_floating_point +
-            dtype.is_complex * 2)
+    return (dtype != torch.bool) + dtype.is_floating_point + dtype.is_complex * 2
 
 
 def is_lossless_cast(src_dtype: torch.dtype, tgt_dtype: torch.dtype):
@@ -1260,8 +1276,11 @@ def is_lossless_cast(src_dtype: torch.dtype, tgt_dtype: torch.dtype):
     # Compare floating-point types
     src_info = torch.finfo(src_dtype)
     tgt_info = torch.finfo(tgt_dtype)
-    return (src_info.min >= tgt_info.min and src_info.max <= tgt_info.max
-            and src_info.resolution >= tgt_info.resolution)
+    return (
+        src_info.min >= tgt_info.min
+        and src_info.max <= tgt_info.max
+        and src_info.resolution >= tgt_info.resolution
+    )
 
 
 def common_broadcastable_dtype(dtypes: Collection[torch.dtype]):
@@ -1329,6 +1348,7 @@ def init_cached_hf_modules() -> None:
     Lazy initialization of the Hugging Face modules.
     """
     from transformers.dynamic_module_utils import init_hf_modules
+
     init_hf_modules()
 
 
@@ -1372,8 +1392,8 @@ def find_nccl_library() -> str:
     # manually load the nccl library
     if so_file:
         logger.info(
-            "Found nccl from environment variable VLLM_NCCL_SO_PATH=%s",
-            so_file)
+            "Found nccl from environment variable VLLM_NCCL_SO_PATH=%s", so_file
+        )
     else:
         if torch.version.cuda is not None:
             so_file = "libnccl.so.2"
@@ -1388,8 +1408,8 @@ def find_nccl_library() -> str:
 def find_nccl_include_paths() -> Optional[list[str]]:
     """
     We either use the nccl.h specified by the `VLLM_NCCL_INCLUDE_PATH`
-    environment variable, or we find the library file brought by 
-    nvidia-nccl-cuXX. load_inline by default uses 
+    environment variable, or we find the library file brought by
+    nvidia-nccl-cuXX. load_inline by default uses
     torch.utils.cpp_extension.include_paths
     """
     paths: list[str] = []
@@ -1399,6 +1419,7 @@ def find_nccl_include_paths() -> Optional[list[str]]:
 
     try:
         import importlib.util
+
         spec = importlib.util.find_spec("nvidia.nccl")
         if spec and getattr(spec, "submodule_search_locations", None):
             for loc in spec.submodule_search_locations:
@@ -1431,7 +1452,6 @@ def _patched_set_stream(stream: torch.cuda.Stream) -> None:
 
 
 class _StreamPlaceholder:
-
     def __init__(self):
         self.synchronize = lambda: None
 
@@ -1448,8 +1468,8 @@ def current_stream() -> torch.cuda.Stream:
     from C/C++ code.
     """
     from vllm.platforms import current_platform
-    if not hasattr(_current_stream_tls,
-                   "value") or _current_stream_tls.value is None:
+
+    if not hasattr(_current_stream_tls, "value") or _current_stream_tls.value is None:
         # when this function is called before any stream is set,
         # we return the default stream.
         # On ROCm using the default 0 stream in combination with RCCL
@@ -1467,7 +1487,8 @@ def current_stream() -> torch.cuda.Stream:
             else:
                 raise ValueError(
                     "Fail to set current stream, current platform "
-                    "may not support current_stream with torch API")
+                    "may not support current_stream with torch API"
+                )
     return _current_stream_tls.value
 
 
@@ -1480,12 +1501,14 @@ def enable_trace_function_call_for_thread(vllm_config: VllmConfig) -> None:
         tmp_dir = tempfile.gettempdir()
         # add username to tmp_dir to avoid permission issues
         tmp_dir = os.path.join(tmp_dir, getpass.getuser())
-        filename = (f"VLLM_TRACE_FUNCTION_for_process_{os.getpid()}"
-                    f"_thread_{threading.get_ident()}_"
-                    f"at_{datetime.datetime.now()}.log").replace(" ", "_")
-        log_path = os.path.join(tmp_dir, "vllm",
-                                f"vllm-instance-{vllm_config.instance_id}",
-                                filename)
+        filename = (
+            f"VLLM_TRACE_FUNCTION_for_process_{os.getpid()}"
+            f"_thread_{threading.get_ident()}_"
+            f"at_{datetime.datetime.now()}.log"
+        ).replace(" ", "_")
+        log_path = os.path.join(
+            tmp_dir, "vllm", f"vllm-instance-{vllm_config.instance_id}", filename
+        )
         os.makedirs(os.path.dirname(log_path), exist_ok=True)
         enable_trace_function_call(log_path)
 
@@ -1496,7 +1519,7 @@ def identity(value: T, **kwargs) -> T:
     return value
 
 
-F = TypeVar('F', bound=Callable[..., Any])
+F = TypeVar("F", bound=Callable[..., Any])
 
 
 def deprecate_args(
@@ -1508,24 +1531,22 @@ def deprecate_args(
         is_deprecated = partial(identity, is_deprecated)
 
     def wrapper(fn: F) -> F:
-
         params = inspect.signature(fn).parameters
         pos_types = (
             inspect.Parameter.POSITIONAL_ONLY,
             inspect.Parameter.POSITIONAL_OR_KEYWORD,
         )
-        pos_kws = [
-            kw for kw, param in params.items() if param.kind in pos_types
-        ]
+        pos_kws = [kw for kw, param in params.items() if param.kind in pos_types]
 
         @wraps(fn)
         def inner(*args, **kwargs):
             if is_deprecated():
-                deprecated_args = pos_kws[start_index:len(args)]
+                deprecated_args = pos_kws[start_index : len(args)]
                 if deprecated_args:
                     msg = (
                         f"The positional arguments {deprecated_args} are "
-                        "deprecated and will be removed in a future update.")
+                        "deprecated and will be removed in a future update."
+                    )
                     if additional_message is not None:
                         msg += f" {additional_message}"
 
@@ -1552,7 +1573,6 @@ def deprecate_kwargs(
         is_deprecated = partial(identity, is_deprecated)
 
     def wrapper(fn: F) -> F:
-
         @wraps(fn)
         def inner(*args, **kwargs):
             if is_deprecated():
@@ -1560,7 +1580,8 @@ def inner(*args, **kwargs):
                 if deprecated_kwargs:
                     msg = (
                         f"The keyword arguments {deprecated_kwargs} are "
-                        "deprecated and will be removed in a future update.")
+                        "deprecated and will be removed in a future update."
+                    )
                     if additional_message is not None:
                         msg += f" {additional_message}"
 
@@ -1577,8 +1598,7 @@ def inner(*args, **kwargs):
 
 
 @lru_cache(maxsize=8)
-def _cuda_device_count_stateless(
-        cuda_visible_devices: Optional[str] = None) -> int:
+def _cuda_device_count_stateless(cuda_visible_devices: Optional[str] = None) -> int:
     # Note: cuda_visible_devices is not used, but we keep it as an argument for
     # LRU Cache purposes.
 
@@ -1590,13 +1610,17 @@ def _cuda_device_count_stateless(
     import torch.version
 
     from vllm.platforms import current_platform
+
     if not torch.cuda._is_compiled():
         return 0
     if current_platform.is_rocm():
         # ROCm uses amdsmi instead of nvml for stateless device count
         # This requires a sufficiently modern version of Torch 2.4.0
-        raw_count = torch.cuda._device_count_amdsmi() if (hasattr(
-            torch.cuda, "_device_count_amdsmi")) else -1
+        raw_count = (
+            torch.cuda._device_count_amdsmi()
+            if (hasattr(torch.cuda, "_device_count_amdsmi"))
+            else -1
+        )
     else:
         raw_count = torch.cuda._device_count_nvml()
     r = torch._C._cuda_getDeviceCount() if raw_count < 0 else raw_count
@@ -1630,9 +1654,9 @@ def xpu_is_initialized() -> bool:
     return torch.xpu.is_initialized()
 
 
-def cuda_get_device_properties(device,
-                               names: Sequence[str],
-                               init_cuda=False) -> tuple[Any, ...]:
+def cuda_get_device_properties(
+    device, names: Sequence[str], init_cuda=False
+) -> tuple[Any, ...]:
     """Get specified CUDA device property values without initializing CUDA in
     the current process."""
     if init_cuda or cuda_is_initialized():
@@ -1642,11 +1666,12 @@ def cuda_get_device_properties(device,
     # Run in subprocess to avoid initializing CUDA as a side effect.
     mp_ctx = multiprocessing.get_context("fork")
     with ProcessPoolExecutor(max_workers=1, mp_context=mp_ctx) as executor:
-        return executor.submit(cuda_get_device_properties, device, names,
-                               True).result()
+        return executor.submit(cuda_get_device_properties, device, names, True).result()
 
 
-def weak_bind(bound_method: Callable[..., Any], ) -> Callable[..., None]:
+def weak_bind(
+    bound_method: Callable[..., Any],
+) -> Callable[..., None]:
     """Make an instance method that weakly references
     its associated instance and no-ops once that
     instance is collected."""
@@ -1661,7 +1686,6 @@ def weak_bound(*args, **kwargs) -> None:
 
 
 def run_once(f: Callable[P, None]) -> Callable[P, None]:
-
     def wrapper(*args: P.args, **kwargs: P.kwargs) -> None:
         if wrapper.has_run:  # type: ignore[attr-defined]
             return
@@ -1677,19 +1701,18 @@ def wrapper(*args: P.args, **kwargs: P.kwargs) -> None:
 
 
 class StoreBoolean(Action):
-
     def __call__(self, parser, namespace, values, option_string=None):
         if values.lower() == "true":
             setattr(namespace, self.dest, True)
         elif values.lower() == "false":
             setattr(namespace, self.dest, False)
         else:
-            raise ValueError(f"Invalid boolean value: {values}. "
-                             "Expected 'true' or 'false'.")
+            raise ValueError(
+                f"Invalid boolean value: {values}. Expected 'true' or 'false'."
+            )
 
 
-class SortedHelpFormatter(ArgumentDefaultsHelpFormatter,
-                          RawDescriptionHelpFormatter):
+class SortedHelpFormatter(ArgumentDefaultsHelpFormatter, RawDescriptionHelpFormatter):
     """SortedHelpFormatter that sorts arguments by their option strings."""
 
     def _split_lines(self, text, width):
@@ -1701,7 +1724,7 @@ def _split_lines(self, text, width):
         # The patterns also include whitespace after the newline
         single_newline = re.compile(r"(?<!\n)\n(?!\n)\s*")
         multiple_newlines = re.compile(r"\n{2,}\s*")
-        text = single_newline.sub(' ', text)
+        text = single_newline.sub(" ", text)
         lines = re.split(multiple_newlines, text)
         return sum([textwrap.wrap(line, width) for line in lines], [])
 
@@ -1721,7 +1744,8 @@ class FlexibleArgumentParser(ArgumentParser):
         "   --json-arg.key1 value1 --json-arg.key2.key3 value2\n\n"
         "Additionally, list elements can be passed individually using +:\n"
         '   --json-arg \'{"key4": ["value3", "value4", "value5"]}\'\n'
-        "   --json-arg.key4+ value3 --json-arg.key4+=\'value4,value5\'\n\n")
+        "   --json-arg.key4+ value3 --json-arg.key4+='value4,value5'\n\n"
+    )
     _search_keyword: Optional[str] = None
 
     def __init__(self, *args, **kwargs):
@@ -1742,11 +1766,14 @@ def parse_known_args(self, args=None, namespace=None):
                 logger.warning_once(
                     "argument '--disable-log-requests' is deprecated and "
                     "replaced with '--enable-log-requests'. This will be "
-                    "removed in v0.12.0.")
+                    "removed in v0.12.0."
+                )
             namespace, args = super().parse_known_args(args, namespace)
             for action in FlexibleArgumentParser._deprecated:
-                if (hasattr(namespace, dest := action.dest)
-                        and getattr(namespace, dest) != action.default):
+                if (
+                    hasattr(namespace, dest := action.dest)
+                    and getattr(namespace, dest) != action.default
+                ):
                     logger.warning_once("argument '%s' is deprecated", dest)
             return namespace, args
 
@@ -1758,7 +1785,6 @@ def add_argument(self, *args, **kwargs):
             return action
 
         class _FlexibleArgumentGroup(_ArgumentGroup):
-
             def add_argument(self, *args, **kwargs):
                 deprecated = kwargs.pop("deprecated", False)
                 action = super().add_argument(*args, **kwargs)
@@ -1783,7 +1809,7 @@ def format_help(self):
             # Normalise the search keyword
             search_keyword = search_keyword.lower().replace("_", "-")
             # Return full help if searching for 'all'
-            if search_keyword == 'all':
+            if search_keyword == "all":
                 self.epilog = self._json_tip
                 return super().format_help()
 
@@ -1802,12 +1828,12 @@ def format_help(self):
             for group in self._action_groups:
                 for action in group._group_actions:
                     # search option name
-                    if any(search_keyword in opt.lower()
-                           for opt in action.option_strings):
+                    if any(
+                        search_keyword in opt.lower() for opt in action.option_strings
+                    ):
                         matched_actions.append(action)
             if matched_actions:
-                formatter.start_section(
-                    f"Arguments matching '{search_keyword}'")
+                formatter.start_section(f"Arguments matching '{search_keyword}'")
                 formatter.add_arguments(matched_actions)
                 formatter.end_section()
                 formatter.add_text(self._json_tip)
@@ -1817,12 +1843,12 @@ def format_help(self):
             formatter.add_text(
                 f"No group or arguments matching '{search_keyword}'.\n"
                 "Use '--help' to see available groups or "
-                "'--help=all' to see all available parameters.")
+                "'--help=all' to see all available parameters."
+            )
             return formatter.format_help()
 
         # usage
-        formatter.add_usage(self.usage, self._actions,
-                            self._mutually_exclusive_groups)
+        formatter.add_usage(self.usage, self._actions, self._mutually_exclusive_groups)
 
         # description
         formatter.add_text(self.description)
@@ -1857,13 +1883,16 @@ def parse_args(  # type: ignore[override]
         if args and args[0] == "serve":
             try:
                 model_idx = next(
-                    i for i, arg in enumerate(args)
-                    if arg == "--model" or arg.startswith("--model="))
+                    i
+                    for i, arg in enumerate(args)
+                    if arg == "--model" or arg.startswith("--model=")
+                )
                 logger.warning(
                     "With `vllm serve`, you should provide the model as a "
                     "positional argument or in a config file instead of via "
                     "the `--model` option. "
-                    "The `--model` option will be removed in v0.13.")
+                    "The `--model` option will be removed in v0.13."
+                )
 
                 if args[model_idx] == "--model":
                     model_tag = args[model_idx + 1]
@@ -1887,7 +1916,7 @@ def parse_args(  # type: ignore[override]
             except StopIteration:
                 pass
 
-        if '--config' in args:
+        if "--config" in args:
             args = self._pull_args_from_config(args)
 
         def repl(match: re.Match) -> str:
@@ -1901,28 +1930,29 @@ def repl(match: re.Match) -> str:
         processed_args = list[str]()
         for i, arg in enumerate(args):
             if arg.startswith("--help="):
-                FlexibleArgumentParser._search_keyword = arg.split(
-                    '=', 1)[-1].lower()
+                FlexibleArgumentParser._search_keyword = arg.split("=", 1)[-1].lower()
                 processed_args.append("--help")
-            elif arg.startswith('--'):
-                if '=' in arg:
-                    key, value = arg.split('=', 1)
+            elif arg.startswith("--"):
+                if "=" in arg:
+                    key, value = arg.split("=", 1)
                     key = pattern.sub(repl, key, count=1)
-                    processed_args.append(f'{key}={value}')
+                    processed_args.append(f"{key}={value}")
                 else:
                     key = pattern.sub(repl, arg, count=1)
                     processed_args.append(key)
-            elif arg.startswith('-O') and arg != '-O' and arg[2] != '.':
+            elif arg.startswith("-O") and arg != "-O" and arg[2] != ".":
                 # allow -O flag to be used without space, e.g. -O3 or -Odecode
                 # -O.<...> handled later
                 # also handle -O=<level> here
-                level = arg[3:] if arg[2] == '=' else arg[2:]
-                processed_args.append(f'-O.level={level}')
-            elif arg == '-O' and i + 1 < len(args) and args[i + 1] in {
-                    "0", "1", "2", "3"
-            }:
+                level = arg[3:] if arg[2] == "=" else arg[2:]
+                processed_args.append(f"-O.level={level}")
+            elif (
+                arg == "-O"
+                and i + 1 < len(args)
+                and args[i + 1] in {"0", "1", "2", "3"}
+            ):
                 # Convert -O <n> to -O.level <n>
-                processed_args.append('-O.level')
+                processed_args.append("-O.level")
             else:
                 processed_args.append(arg)
 
@@ -1986,14 +2016,11 @@ def recursive_dict_update(
 
                 # Merge all values with the same key into a single dict
                 arg_dict = create_nested_dict(keys, value)
-                arg_duplicates = recursive_dict_update(dict_args[key],
-                                                       arg_dict)
-                duplicates |= {f'{key}.{d}' for d in arg_duplicates}
+                arg_duplicates = recursive_dict_update(dict_args[key], arg_dict)
+                duplicates |= {f"{key}.{d}" for d in arg_duplicates}
                 delete.add(i)
         # Filter out the dict args we set to None
-        processed_args = [
-            a for i, a in enumerate(processed_args) if i not in delete
-        ]
+        processed_args = [a for i, a in enumerate(processed_args) if i not in delete]
         if duplicates:
             logger.warning("Found duplicate keys %s", ", ".join(duplicates))
 
@@ -2050,13 +2077,14 @@ def _pull_args_from_config(self, args: list[str]) -> list[str]:
         this way the order of priorities is maintained when these are args
         parsed by super().
         """
-        assert args.count(
-            '--config') <= 1, "More than one config file specified!"
+        assert args.count("--config") <= 1, "More than one config file specified!"
 
-        index = args.index('--config')
+        index = args.index("--config")
         if index == len(args) - 1:
-            raise ValueError("No config file specified! \
-                             Please check your command-line arguments.")
+            raise ValueError(
+                "No config file specified! \
+                             Please check your command-line arguments."
+            )
 
         file_path = args[index + 1]
 
@@ -2068,29 +2096,33 @@ def _pull_args_from_config(self, args: list[str]) -> list[str]:
         # followed by rest of cli args.
         # maintaining this order will enforce the precedence
         # of cli > config > defaults
-        if args[0].startswith('-'):
+        if args[0].startswith("-"):
             # No sub command (e.g., api_server entry point)
-            args = config_args + args[0:index] + args[index + 2:]
+            args = config_args + args[0:index] + args[index + 2 :]
         elif args[0] == "serve":
-            model_in_cli = len(args) > 1 and not args[1].startswith('-')
-            model_in_config = any(arg == '--model' for arg in config_args)
+            model_in_cli = len(args) > 1 and not args[1].startswith("-")
+            model_in_config = any(arg == "--model" for arg in config_args)
 
             if not model_in_cli and not model_in_config:
                 raise ValueError(
                     "No model specified! Please specify model either "
-                    "as a positional argument or in a config file.")
+                    "as a positional argument or in a config file."
+                )
 
             if model_in_cli:
                 # Model specified as positional arg, keep CLI version
-                args = [args[0]] + [
-                    args[1]
-                ] + config_args + args[2:index] + args[index + 2:]
+                args = (
+                    [args[0]]
+                    + [args[1]]
+                    + config_args
+                    + args[2:index]
+                    + args[index + 2 :]
+                )
             else:
                 # No model in CLI, use config if available
-                args = [args[0]
-                        ] + config_args + args[1:index] + args[index + 2:]
+                args = [args[0]] + config_args + args[1:index] + args[index + 2 :]
         else:
-            args = [args[0]] + config_args + args[1:index] + args[index + 2:]
+            args = [args[0]] + config_args + args[1:index] + args[index + 2 :]
 
         return args
 
@@ -2107,11 +2139,13 @@ def load_config_file(self, file_path: str) -> list[str]:
                 '--tensor-parallel-size': '4'
             ]
         """
-        extension: str = file_path.split('.')[-1]
-        if extension not in ('yaml', 'yml'):
+        extension: str = file_path.split(".")[-1]
+        if extension not in ("yaml", "yml"):
             raise ValueError(
                 "Config file must be of a yaml/yml type.\
-                              %s supplied", extension)
+                              %s supplied",
+                extension,
+            )
 
         # only expecting a flat dictionary of atomic types
         processed_args: list[str] = []
@@ -2123,32 +2157,32 @@ def load_config_file(self, file_path: str) -> list[str]:
         except Exception as ex:
             logger.error(
                 "Unable to read the config file at %s. \
-                Make sure path is correct", file_path)
+                Make sure path is correct",
+                file_path,
+            )
             raise ex
 
         store_boolean_arguments = [
-            action.dest for action in self._actions
-            if isinstance(action, StoreBoolean)
+            action.dest for action in self._actions if isinstance(action, StoreBoolean)
         ]
 
         for key, value in config.items():
             if isinstance(value, bool) and key not in store_boolean_arguments:
                 if value:
-                    processed_args.append('--' + key)
+                    processed_args.append("--" + key)
             elif isinstance(value, list):
                 if value:
-                    processed_args.append('--' + key)
+                    processed_args.append("--" + key)
                     for item in value:
                         processed_args.append(str(item))
             else:
-                processed_args.append('--' + key)
+                processed_args.append("--" + key)
                 processed_args.append(str(value))
 
         return processed_args
 
 
-async def _run_task_with_lock(task: Callable, lock: asyncio.Lock, *args,
-                              **kwargs):
+async def _run_task_with_lock(task: Callable, lock: asyncio.Lock, *args, **kwargs):
     """Utility function to run async task in a lock"""
     async with lock:
         return await task(*args, **kwargs)
@@ -2172,19 +2206,26 @@ def supports_kw(
     param_val = params.get(kw_name)
 
     # Types where the it may be valid, i.e., explicitly defined & nonvariadic
-    passable_kw_types = set((inspect.Parameter.POSITIONAL_ONLY,
-                             inspect.Parameter.POSITIONAL_OR_KEYWORD,
-                             inspect.Parameter.KEYWORD_ONLY))
+    passable_kw_types = set(
+        (
+            inspect.Parameter.POSITIONAL_ONLY,
+            inspect.Parameter.POSITIONAL_OR_KEYWORD,
+            inspect.Parameter.KEYWORD_ONLY,
+        )
+    )
 
     if param_val:
         is_sig_param = param_val.kind in passable_kw_types
         # We want kwargs only, but this is passable as a positional arg
-        if (requires_kw_only and is_sig_param
-                and param_val.kind != inspect.Parameter.KEYWORD_ONLY):
+        if (
+            requires_kw_only
+            and is_sig_param
+            and param_val.kind != inspect.Parameter.KEYWORD_ONLY
+        ):
             return False
-        if ((requires_kw_only
-             and param_val.kind == inspect.Parameter.KEYWORD_ONLY)
-                or (not requires_kw_only and is_sig_param)):
+        if (requires_kw_only and param_val.kind == inspect.Parameter.KEYWORD_ONLY) or (
+            not requires_kw_only and is_sig_param
+        ):
             return True
 
     # If we're okay with var-kwargs, it's supported as long as
@@ -2194,8 +2235,10 @@ def supports_kw(
         # mapping, but it wraps an ordered dict, and they appear in order.
         # Ref: https://docs.python.org/3/library/inspect.html#inspect.Signature.parameters
         last_param = params[next(reversed(params))]  # type: ignore
-        return (last_param.kind == inspect.Parameter.VAR_KEYWORD
-                and last_param.name != kw_name)
+        return (
+            last_param.kind == inspect.Parameter.VAR_KEYWORD
+            and last_param.name != kw_name
+        )
 
     return False
 
@@ -2234,10 +2277,12 @@ def get_allowed_kwarg_only_overrides(
     filtered_overrides = {
         kwarg_name: val
         for kwarg_name, val in overrides.items()
-        if supports_kw(callable,
-                       kwarg_name,
-                       requires_kw_only=requires_kw_only,
-                       allow_var_kwargs=allow_var_kwargs)
+        if supports_kw(
+            callable,
+            kwarg_name,
+            requires_kw_only=requires_kw_only,
+            allow_var_kwargs=allow_var_kwargs,
+        )
     }
 
     # If anything is dropped, log a warning
@@ -2246,11 +2291,15 @@ def get_allowed_kwarg_only_overrides(
         if requires_kw_only:
             logger.warning(
                 "The following intended overrides are not keyword-only args "
-                "and will be dropped: %s", dropped_keys)
+                "and will be dropped: %s",
+                dropped_keys,
+            )
         else:
             logger.warning(
                 "The following intended overrides are not keyword args "
-                "and will be dropped: %s", dropped_keys)
+                "and will be dropped: %s",
+                dropped_keys,
+            )
 
     return filtered_overrides
 
@@ -2265,8 +2314,9 @@ def supports_dynamo() -> bool:
 
 # Supports xccl with PyTorch versions >= 2.8.0.dev for XPU platform
 def supports_xccl() -> bool:
-    return is_torch_equal_or_newer(
-        "2.8.0.dev") and torch.distributed.is_xccl_available()
+    return (
+        is_torch_equal_or_newer("2.8.0.dev") and torch.distributed.is_xccl_available()
+    )
 
 
 # Some backends use pytorch version < 2.4.0 which doesn't
@@ -2302,7 +2352,6 @@ def value(self):
 
 # Adapted from: https://stackoverflow.com/a/47212782/5082708
 class LazyDict(Mapping[str, T], Generic[T]):
-
     def __init__(self, factory: dict[str, Callable[[], T]]):
         self._factory = factory
         self._dict: dict[str, T] = {}
@@ -2325,7 +2374,6 @@ def __len__(self):
 
 
 class ClassRegistry(UserDict[type[T], _V]):
-
     def __getitem__(self, key: type[T]) -> _V:
         for cls in key.mro():
             if cls in self.data:
@@ -2359,8 +2407,9 @@ def weak_ref_tensor(tensor: Any) -> Any:
 
 
 def weak_ref_tensors(
-    tensors: Union[torch.Tensor, list[torch.Tensor], tuple[torch.Tensor],
-                   IntermediateTensors]
+    tensors: Union[
+        torch.Tensor, list[torch.Tensor], tuple[torch.Tensor], IntermediateTensors
+    ],
 ) -> Union[torch.Tensor, list[Any], tuple[Any], Any]:
     """
     Convenience function to create weak references to tensors,
@@ -2375,11 +2424,11 @@ def weak_ref_tensors(
 
     # For IntermediateTensors used in pipeline parallelism
     from vllm.sequence import IntermediateTensors
+
     if isinstance(tensors, IntermediateTensors):
-        ret = IntermediateTensors({
-            key: weak_ref_tensor(val)
-            for key, val in tensors.tensors.items()
-        })
+        ret = IntermediateTensors(
+            {key: weak_ref_tensor(val) for key, val in tensors.tensors.items()}
+        )
         return ret
     raise ValueError("Invalid type for tensors")
 
@@ -2419,7 +2468,8 @@ def get_vllm_optional_dependencies():
 
     return {
         extra: [
-            re.split(r";|>=|<=|==", req)[0] for req in requirements
+            re.split(r";|>=|<=|==", req)[0]
+            for req in requirements
             if req.endswith(f'extra == "{extra}"')
         ]
         for extra in extras
@@ -2612,12 +2662,13 @@ def __getattr__(self, key: str):
 
             raise exc
 
-        raise AssertionError("PlaceholderModule should not be used "
-                             "when the original module can be imported")
+        raise AssertionError(
+            "PlaceholderModule should not be used "
+            "when the original module can be imported"
+        )
 
 
 class _PlaceholderModuleAttr(_PlaceholderBase):
-
     def __init__(self, module: PlaceholderModule, attr_path: str) -> None:
         super().__init__()
 
@@ -2626,14 +2677,15 @@ def __init__(self, module: PlaceholderModule, attr_path: str) -> None:
         self.__attr_path = attr_path
 
     def placeholder_attr(self, attr_path: str):
-        return _PlaceholderModuleAttr(self.__module,
-                                      f"{self.__attr_path}.{attr_path}")
+        return _PlaceholderModuleAttr(self.__module, f"{self.__attr_path}.{attr_path}")
 
     def __getattr__(self, key: str):
         getattr(self.__module, f"{self.__attr_path}.{key}")
 
-        raise AssertionError("PlaceholderModule should not be used "
-                             "when the original module can be imported")
+        raise AssertionError(
+            "PlaceholderModule should not be used "
+            "when the original module can be imported"
+        )
 
 
 # create a library to hold the custom op
@@ -2641,13 +2693,13 @@ def __getattr__(self, key: str):
 
 
 def direct_register_custom_op(
-        op_name: str,
-        op_func: Callable,
-        mutates_args: Optional[list[str]] = None,
-        fake_impl: Optional[Callable] = None,
-        target_lib: Optional[Library] = None,
-        dispatch_key: Optional[str] = None,
-        tags: tuple[torch.Tag, ...] = (),
+    op_name: str,
+    op_func: Callable,
+    mutates_args: Optional[list[str]] = None,
+    fake_impl: Optional[Callable] = None,
+    target_lib: Optional[Library] = None,
+    dispatch_key: Optional[str] = None,
+    tags: tuple[torch.Tag, ...] = (),
 ):
     """
     `torch.library.custom_op` can have significant overhead because it
@@ -2666,12 +2718,14 @@ def direct_register_custom_op(
     """
     if not supports_custom_op():
         from vllm.platforms import current_platform
+
         assert not current_platform.is_cuda_alike(), (
             "cuda platform needs torch>=2.4 to support custom op, "
             "chances are you are using an old version of pytorch "
             "or a custom build of pytorch. It is recommended to "
             "use vLLM in a fresh new environment and let it install "
-            "the required dependencies.")
+            "the required dependencies."
+        )
         return
 
     if mutates_args is None:
@@ -2679,15 +2733,17 @@ def direct_register_custom_op(
 
     if dispatch_key is None:
         from vllm.platforms import current_platform
+
         dispatch_key = current_platform.dispatch_key
 
     import torch.library
+
     if hasattr(torch.library, "infer_schema"):
-        schema_str = torch.library.infer_schema(op_func,
-                                                mutates_args=mutates_args)
+        schema_str = torch.library.infer_schema(op_func, mutates_args=mutates_args)
     else:
         # for pytorch 2.4
         import torch._custom_op.impl
+
         schema_str = torch._custom_op.impl.infer_schema(op_func, mutates_args)
     my_lib = target_lib or vllm_lib
     my_lib.define(op_name + schema_str, tags=tags)
@@ -2733,6 +2789,7 @@ def kill_process_tree(pid: int):
 @dataclass
 class MemorySnapshot:
     """Memory snapshot."""
+
     torch_peak: int = 0
     free_memory: int = 0
     total_memory: int = 0
@@ -2754,15 +2811,14 @@ def measure(self):
         # After `torch.cuda.reset_peak_memory_stats()`,
         # `torch.cuda.memory_reserved()` will keep growing, and only shrink
         # when we call `torch.cuda.empty_cache()` or OOM happens.
-        self.torch_peak = torch.cuda.memory_stats().get(
-            "allocated_bytes.all.peak", 0)
+        self.torch_peak = torch.cuda.memory_stats().get("allocated_bytes.all.peak", 0)
 
         self.free_memory, self.total_memory = torch.cuda.mem_get_info()
-        shared_sysmem_device_mem_sms = (
-            (8, 7), (11, 0), (12, 1))  # Orin, Thor, Spark
-        if current_platform.is_cuda() and \
-            current_platform.get_device_capability() in \
-            shared_sysmem_device_mem_sms:
+        shared_sysmem_device_mem_sms = ((8, 7), (11, 0), (12, 1))  # Orin, Thor, Spark
+        if (
+            current_platform.is_cuda()
+            and current_platform.get_device_capability() in shared_sysmem_device_mem_sms
+        ):
             # On UMA (Orin, Thor and Spark) platform,
             # where both CPU and GPU rely on system memory,
             # the cudaMemGetInfo function shows the amount of free system memory
@@ -2801,8 +2857,8 @@ def __sub__(self, other: MemorySnapshot) -> MemorySnapshot:
 
 @dataclass
 class MemoryProfilingResult:
-    """Memory profiling result. All numbers are in bytes.
-    """
+    """Memory profiling result. All numbers are in bytes."""
+
     non_kv_cache_memory: int = 0
     torch_peak_increase: int = 0
     non_torch_increase: int = 0
@@ -2813,20 +2869,22 @@ class MemoryProfilingResult:
     profile_time: float = 0.0
 
     def __repr__(self) -> str:
-        return (f"Memory profiling takes {self.profile_time:.2f} seconds. "
-                f"Total non KV cache memory: "
-                f"{(self.non_kv_cache_memory / GiB_bytes):.2f}GiB; "
-                f"torch peak memory increase: "
-                f"{(self.torch_peak_increase / GiB_bytes):.2f}GiB; "
-                f"non-torch forward increase memory: "
-                f"{(self.non_torch_increase / GiB_bytes):.2f}GiB; "
-                f"weights memory: {(self.weights_memory / GiB_bytes):.2f}GiB.")
+        return (
+            f"Memory profiling takes {self.profile_time:.2f} seconds. "
+            f"Total non KV cache memory: "
+            f"{(self.non_kv_cache_memory / GiB_bytes):.2f}GiB; "
+            f"torch peak memory increase: "
+            f"{(self.torch_peak_increase / GiB_bytes):.2f}GiB; "
+            f"non-torch forward increase memory: "
+            f"{(self.non_torch_increase / GiB_bytes):.2f}GiB; "
+            f"weights memory: {(self.weights_memory / GiB_bytes):.2f}GiB."
+        )
 
 
 @contextlib.contextmanager
 def memory_profiling(
-        baseline_snapshot: MemorySnapshot,
-        weights_memory: int) -> Generator[MemoryProfilingResult, None, None]:
+    baseline_snapshot: MemorySnapshot, weights_memory: int
+) -> Generator[MemoryProfilingResult, None, None]:
     """Memory profiling context manager.
     baseline_snapshot: the memory snapshot before the current vLLM instance.
     weights_memory: memory used by PyTorch when loading the model weights.
@@ -2900,29 +2958,34 @@ def memory_profiling(
 
     non_torch_memory = result.non_torch_increase
     peak_activation_memory = result.torch_peak_increase
-    result.non_kv_cache_memory = non_torch_memory + peak_activation_memory + result.weights_memory  # noqa
+    result.non_kv_cache_memory = (
+        non_torch_memory + peak_activation_memory + result.weights_memory
+    )  # noqa
 
 
 # Adapted from: https://github.com/sgl-project/sglang/blob/v0.4.1/python/sglang/srt/utils.py#L630 # noqa: E501
 def set_ulimit(target_soft_limit=65535):
-    if sys.platform.startswith('win'):
+    if sys.platform.startswith("win"):
         logger.info("Windows detected, skipping ulimit adjustment.")
         return
 
     import resource
+
     resource_type = resource.RLIMIT_NOFILE
     current_soft, current_hard = resource.getrlimit(resource_type)
 
     if current_soft < target_soft_limit:
         try:
-            resource.setrlimit(resource_type,
-                               (target_soft_limit, current_hard))
+            resource.setrlimit(resource_type, (target_soft_limit, current_hard))
         except ValueError as e:
             logger.warning(
                 "Found ulimit of %s and failed to automatically increase "
                 "with error %s. This can cause fd limit errors like "
                 "`OSError: [Errno 24] Too many open files`. Consider "
-                "increasing with ulimit -n", current_soft, e)
+                "increasing with ulimit -n",
+                current_soft,
+                e,
+            )
 
 
 # Adapted from: https://github.com/sgl-project/sglang/blob/v0.4.1/python/sglang/utils.py#L28 # noqa: E501
@@ -3043,11 +3106,7 @@ def zmq_socket_ctx(
 
     ctx = zmq.Context()  # type: ignore[attr-defined]
     try:
-        yield make_zmq_socket(ctx,
-                              path,
-                              socket_type,
-                              bind=bind,
-                              identity=identity)
+        yield make_zmq_socket(ctx, path, socket_type, bind=bind, identity=identity)
     except KeyboardInterrupt:
         logger.debug("Got Keyboard Interrupt.")
 
@@ -3068,6 +3127,7 @@ def _maybe_force_spawn():
         # to the subprocess so that it knows how to connect to the ray cluster.
         # env vars are inherited by subprocesses, even if we use spawn.
         import ray
+
         os.environ["RAY_ADDRESS"] = ray.get_runtime_context().gcs_address
         reasons.append("In a Ray actor and can only be spawned")
 
@@ -3082,7 +3142,9 @@ def _maybe_force_spawn():
             "Overriding VLLM_WORKER_MULTIPROC_METHOD to 'spawn'. "
             "See https://docs.vllm.ai/en/latest/usage/"
             "troubleshooting.html#python-multiprocessing "
-            "for more information. Reasons: %s", "; ".join(reasons))
+            "for more information. Reasons: %s",
+            "; ".join(reasons),
+        )
         os.environ["VLLM_WORKER_MULTIPROC_METHOD"] = "spawn"
 
 
@@ -3101,7 +3163,7 @@ def get_mp_context():
 def bind_kv_cache(
     ctx: dict[str, Any],
     kv_cache: list[list[torch.Tensor]],  # [virtual_engine][layer_index]
-    shared_kv_cache_layers: Optional[dict[str, str]] = None
+    shared_kv_cache_layers: Optional[dict[str, str]] = None,
 ) -> None:
     # Bind the kv_cache tensor to Attention modules, similar to
     # ctx[layer_name].kv_cache[ve]=kv_cache[ve][extract_layer_index(layer_name)]
@@ -3119,33 +3181,40 @@ def bind_kv_cache(
         shared_kv_cache_layers = {}
     from vllm.attention import AttentionType
     from vllm.model_executor.models.utils import extract_layer_index
+
     layer_need_kv_cache = [
-        layer_name for layer_name in ctx
-        if (hasattr(ctx[layer_name], 'attn_type') and ctx[layer_name].attn_type
-            in (AttentionType.DECODER, AttentionType.ENCODER_DECODER)) \
-                and ctx[layer_name].kv_sharing_target_layer_name is None
+        layer_name
+        for layer_name in ctx
+        if (
+            hasattr(ctx[layer_name], "attn_type")
+            and ctx[layer_name].attn_type
+            in (AttentionType.DECODER, AttentionType.ENCODER_DECODER)
+        )
+        and ctx[layer_name].kv_sharing_target_layer_name is None
     ]
     layer_index_sorted = sorted(
-        set(
-            extract_layer_index(layer_name)
-            for layer_name in layer_need_kv_cache))
+        set(extract_layer_index(layer_name) for layer_name in layer_need_kv_cache)
+    )
     for layer_name in layer_need_kv_cache:
-        kv_cache_idx = layer_index_sorted.index(
-            extract_layer_index(layer_name))
+        kv_cache_idx = layer_index_sorted.index(extract_layer_index(layer_name))
         forward_ctx = ctx[layer_name]
         assert len(forward_ctx.kv_cache) == len(kv_cache)
         for ve, ve_kv_cache in enumerate(kv_cache):
             forward_ctx.kv_cache[ve] = ve_kv_cache[kv_cache_idx]
     if shared_kv_cache_layers is not None:
         for layer_name, target_layer_name in shared_kv_cache_layers.items():
-            assert extract_layer_index(target_layer_name) < \
-               extract_layer_index(layer_name), \
-                   "v0 doesn't support interleaving kv sharing"
+            assert extract_layer_index(target_layer_name) < extract_layer_index(
+                layer_name
+            ), "v0 doesn't support interleaving kv sharing"
             ctx[layer_name].kv_cache = ctx[target_layer_name].kv_cache
 
 
-def run_method(obj: Any, method: Union[str, bytes, Callable], args: tuple[Any],
-               kwargs: dict[str, Any]) -> Any:
+def run_method(
+    obj: Any,
+    method: Union[str, bytes, Callable],
+    args: tuple[Any],
+    kwargs: dict[str, Any],
+) -> Any:
     """
     Run a method of an object with the given arguments and keyword arguments.
     If the method is string, it will be converted to a method using getattr.
@@ -3159,8 +3228,9 @@ def run_method(obj: Any, method: Union[str, bytes, Callable], args: tuple[Any],
         try:
             func = getattr(obj, method)
         except AttributeError:
-            raise NotImplementedError(f"Method {method!r} is not"
-                                      " implemented.") from None
+            raise NotImplementedError(
+                f"Method {method!r} is not implemented."
+            ) from None
     else:
         func = partial(method, obj)  # type: ignore
     return func(*args, **kwargs)
@@ -3194,6 +3264,7 @@ def import_pynvml():
     module to our codebase, and use it directly.
     """
     import vllm.third_party.pynvml as pynvml
+
     return pynvml
 
 
@@ -3213,7 +3284,7 @@ def find_unimplemented_methods(self: object):
         unimplemented_methods = []
         for attr_name in dir(self):
             # bypass inner method
-            if attr_name.startswith('_'):
+            if attr_name.startswith("_"):
                 continue
 
             try:
@@ -3227,8 +3298,8 @@ def find_unimplemented_methods(self: object):
             if "NotImplementedError" in src:
                 unimplemented_methods.append(attr_name)
         if unimplemented_methods:
-            method_names = ','.join(unimplemented_methods)
-            msg = (f"Methods {method_names} not implemented in {self}")
+            method_names = ",".join(unimplemented_methods)
+            msg = f"Methods {method_names} not implemented in {self}"
             logger.debug(msg)
 
     @wraps(original_init)
@@ -3236,7 +3307,7 @@ def wrapped_init(self, *args, **kwargs) -> None:
         original_init(self, *args, **kwargs)
         find_unimplemented_methods(self)
 
-    type.__setattr__(cls, '__init__', wrapped_init)
+    type.__setattr__(cls, "__init__", wrapped_init)
     return cls
 
 
@@ -3340,7 +3411,6 @@ def cprofile(save_file: Optional[str] = None, enabled: bool = True):
     """
 
     def decorator(func: Callable):
-
         @wraps(func)
         def wrapper(*args, **kwargs):
             if not enabled:
@@ -3358,16 +3428,26 @@ def wrapper(*args, **kwargs):
 # Only relevant for models using ALiBi (e.g, MPT)
 def check_use_alibi(model_config: ModelConfig) -> bool:
     cfg = model_config.hf_text_config
-    return (getattr(cfg, "alibi", False)  # Falcon
-            or ("BloomForCausalLM" in getattr(model_config.hf_config,
-                                              "architectures", []))  # Bloom
-            or getattr(cfg, "position_encoding_type", "") ==
-            "alibi"  # codellm_1b_alibi
-            or (hasattr(cfg, "attn_config")  # MPT
-                and ((isinstance(cfg.attn_config, dict)
-                      and cfg.attn_config.get("alibi", False)) or
-                     (not isinstance(cfg.attn_config, dict)
-                      and getattr(cfg.attn_config, "alibi", False)))))
+    return (
+        getattr(cfg, "alibi", False)  # Falcon
+        or (
+            "BloomForCausalLM" in getattr(model_config.hf_config, "architectures", [])
+        )  # Bloom
+        or getattr(cfg, "position_encoding_type", "") == "alibi"  # codellm_1b_alibi
+        or (
+            hasattr(cfg, "attn_config")  # MPT
+            and (
+                (
+                    isinstance(cfg.attn_config, dict)
+                    and cfg.attn_config.get("alibi", False)
+                )
+                or (
+                    not isinstance(cfg.attn_config, dict)
+                    and getattr(cfg.attn_config, "alibi", False)
+                )
+            )
+        )
+    )
 
 
 def sha256(input: Any) -> bytes:
@@ -3435,7 +3515,7 @@ def is_torch_equal_or_newer(target: str) -> bool:
         return _is_torch_equal_or_newer(str(torch.__version__), target)
     except Exception:
         # Fallback to PKG-INFO to load the package info, needed by the doc gen.
-        return Version(importlib.metadata.version('torch')) >= Version(target)
+        return Version(importlib.metadata.version("torch")) >= Version(target)
 
 
 # Helper function used in testing.
@@ -3484,9 +3564,9 @@ def has_tilelang() -> bool:
     return _has_module("tilelang")
 
 
-def set_process_title(name: str,
-                      suffix: str = "",
-                      prefix: str = envs.VLLM_PROCESS_NAME_PREFIX) -> None:
+def set_process_title(
+    name: str, suffix: str = "", prefix: str = envs.VLLM_PROCESS_NAME_PREFIX
+) -> None:
     """
     Set the current process title to a specific name with an
     optional suffix.
@@ -3513,7 +3593,7 @@ def write_with_prefix(s: str):
         if file.start_new_line:  # type: ignore[attr-defined]
             file_write(prefix)
         idx = 0
-        while (next_idx := s.find('\n', idx)) != -1:
+        while (next_idx := s.find("\n", idx)) != -1:
             next_idx += 1
             file_write(s[idx:next_idx])
             if next_idx == len(s):
@@ -3557,23 +3637,20 @@ def length_from_prompt_token_ids_or_embeds(
     """Calculate the request length (in number of tokens) give either
     prompt_token_ids or prompt_embeds.
     """
-    prompt_token_len = None if prompt_token_ids is None else len(
-        prompt_token_ids)
-    prompt_embeds_len = \
-        None if prompt_embeds is None else len(prompt_embeds)
+    prompt_token_len = None if prompt_token_ids is None else len(prompt_token_ids)
+    prompt_embeds_len = None if prompt_embeds is None else len(prompt_embeds)
 
     if prompt_token_len is None:
         if prompt_embeds_len is None:
-            raise ValueError(
-                "Neither prompt_token_ids nor prompt_embeds were defined.")
+            raise ValueError("Neither prompt_token_ids nor prompt_embeds were defined.")
         return prompt_embeds_len
     else:
-        if (prompt_embeds_len is not None
-                and prompt_embeds_len != prompt_token_len):
+        if prompt_embeds_len is not None and prompt_embeds_len != prompt_token_len:
             raise ValueError(
                 "Prompt token ids and prompt embeds had different lengths"
                 f" prompt_token_ids={prompt_token_len}"
-                f" prompt_embeds={prompt_embeds_len}")
+                f" prompt_embeds={prompt_embeds_len}"
+            )
         return prompt_token_len
 
 
diff --git a/vllm/utils/deep_gemm.py b/vllm/utils/deep_gemm.py
index 125508bc4a9f..ac4fcc0156d1 100644
--- a/vllm/utils/deep_gemm.py
+++ b/vllm/utils/deep_gemm.py
@@ -4,6 +4,7 @@
 
 Users of vLLM should always import **only** these wrappers.
 """
+
 from __future__ import annotations
 
 import functools
@@ -26,9 +27,14 @@ def is_deep_gemm_supported() -> bool:
     """
     is_supported_arch = current_platform.is_cuda() and (
         current_platform.is_device_capability(90)
-        or current_platform.is_device_capability(100))
-    return (envs.VLLM_USE_DEEP_GEMM and has_deep_gemm() and is_supported_arch
-            and not envs.VLLM_USE_FLASHINFER_MOE_FP8)
+        or current_platform.is_device_capability(100)
+    )
+    return (
+        envs.VLLM_USE_DEEP_GEMM
+        and has_deep_gemm()
+        and is_supported_arch
+        and not envs.VLLM_USE_FLASHINFER_MOE_FP8
+    )
 
 
 @functools.cache
@@ -38,7 +44,8 @@ def is_deep_gemm_e8m0_used() -> bool:
     """
     if not is_deep_gemm_supported():
         logger.debug_once(
-            "DeepGEMM E8M0 disabled: DeepGEMM not supported on this system.")
+            "DeepGEMM E8M0 disabled: DeepGEMM not supported on this system."
+        )
         return False
 
     _lazy_init()
@@ -51,13 +58,14 @@ def is_deep_gemm_e8m0_used() -> bool:
         logger.info_once("DeepGEMM E8M0 disabled: FlashInfer MOE is enabled.")
         return False
 
-    if current_platform.is_device_capability(100) and \
-            envs.VLLM_USE_DEEP_GEMM_E8M0:
+    if current_platform.is_device_capability(100) and envs.VLLM_USE_DEEP_GEMM_E8M0:
         logger.info_once("DeepGEMM E8M0 enabled on Blackwell GPU.")
         return True
 
-    if current_platform.is_device_capability(90) and \
-            envs.VLLM_USE_DEEP_GEMM_E8M0_HOPPER:
+    if (
+        current_platform.is_device_capability(90)
+        and envs.VLLM_USE_DEEP_GEMM_E8M0_HOPPER
+    ):
         logger.info_once("DeepGEMM E8M0 enabled on Hopper GPU.")
         return True
 
@@ -69,7 +77,8 @@ def _missing(*_: Any, **__: Any) -> NoReturn:
     """Placeholder for unavailable DeepGEMM backend."""
     raise RuntimeError(
         "DeepGEMM backend is not available or outdated. Please install or "
-        "update the `deep_gemm` to a newer version to enable FP8 kernels.")
+        "update the `deep_gemm` to a newer version to enable FP8 kernels."
+    )
 
 
 _fp8_gemm_nt_impl: Callable[..., Any] | None = None
@@ -89,21 +98,25 @@ def _lazy_init() -> None:
     global _get_mn_major_tma_aligned_tensor_impl
 
     # fast path
-    if (_fp8_gemm_nt_impl is not None or _grouped_impl is not None
-            or _grouped_masked_impl is not None
-            or _fp8_mqa_logits_impl is not None
-            or _fp8_paged_mqa_logits_impl is not None
-            or _get_paged_mqa_logits_metadata_impl is not None):
+    if (
+        _fp8_gemm_nt_impl is not None
+        or _grouped_impl is not None
+        or _grouped_masked_impl is not None
+        or _fp8_mqa_logits_impl is not None
+        or _fp8_paged_mqa_logits_impl is not None
+        or _get_paged_mqa_logits_metadata_impl is not None
+    ):
         return
 
     if not has_deep_gemm():
         return
 
     # Set up deep_gemm cache path
-    DEEP_GEMM_JIT_CACHE_ENV_NAME = 'DG_JIT_CACHE_DIR'
+    DEEP_GEMM_JIT_CACHE_ENV_NAME = "DG_JIT_CACHE_DIR"
     if not os.environ.get(DEEP_GEMM_JIT_CACHE_ENV_NAME, None):
         os.environ[DEEP_GEMM_JIT_CACHE_ENV_NAME] = os.path.join(
-            envs.VLLM_CACHE_ROOT, "deep_gemm")
+            envs.VLLM_CACHE_ROOT, "deep_gemm"
+        )
 
     _dg = importlib.import_module("deep_gemm")
 
@@ -113,9 +126,11 @@ def _lazy_init() -> None:
     _fp8_mqa_logits_impl = getattr(_dg, "fp8_mqa_logits", None)
     _fp8_paged_mqa_logits_impl = getattr(_dg, "fp8_paged_mqa_logits", None)
     _get_paged_mqa_logits_metadata_impl = getattr(
-        _dg, "get_paged_mqa_logits_metadata", None)
+        _dg, "get_paged_mqa_logits_metadata", None
+    )
     _get_mn_major_tma_aligned_tensor_impl = getattr(
-        _dg, "get_mn_major_tma_aligned_tensor", None)
+        _dg, "get_mn_major_tma_aligned_tensor", None
+    )
 
 
 def get_num_sms() -> int:
@@ -148,9 +163,9 @@ def m_grouped_fp8_gemm_nt_contiguous(*args, **kwargs):
     _lazy_init()
     if _grouped_impl is None:
         return _missing(*args, **kwargs)
-    return _grouped_impl(*args,
-                         disable_ue8m0_cast=not is_deep_gemm_e8m0_used(),
-                         **kwargs)
+    return _grouped_impl(
+        *args, disable_ue8m0_cast=not is_deep_gemm_e8m0_used(), **kwargs
+    )
 
 
 def fp8_m_grouped_gemm_nt_masked(*args, **kwargs):
@@ -158,7 +173,8 @@ def fp8_m_grouped_gemm_nt_masked(*args, **kwargs):
     if _grouped_masked_impl is None:
         return _missing(*args, **kwargs)
     return _grouped_masked_impl(
-        *args, disable_ue8m0_cast=not is_deep_gemm_e8m0_used(), **kwargs)
+        *args, disable_ue8m0_cast=not is_deep_gemm_e8m0_used(), **kwargs
+    )
 
 
 def fp8_mqa_logits(
@@ -191,8 +207,9 @@ def fp8_mqa_logits(
     return _fp8_mqa_logits_impl(q, kv, weights, cu_seqlen_ks, cu_seqlen_ke)
 
 
-def get_paged_mqa_logits_metadata(context_lens: torch.Tensor, block_size: int,
-                                  num_sms: int) -> torch.Tensor:
+def get_paged_mqa_logits_metadata(
+    context_lens: torch.Tensor, block_size: int, num_sms: int
+) -> torch.Tensor:
     """Build scheduling metadata for paged MQA logits.
 
     Args:
@@ -208,8 +225,7 @@ def get_paged_mqa_logits_metadata(context_lens: torch.Tensor, block_size: int,
     _lazy_init()
     if _get_paged_mqa_logits_metadata_impl is None:
         return _missing()
-    return _get_paged_mqa_logits_metadata_impl(context_lens, block_size,
-                                               num_sms)
+    return _get_paged_mqa_logits_metadata_impl(context_lens, block_size, num_sms)
 
 
 def fp8_paged_mqa_logits(
@@ -245,14 +261,16 @@ def fp8_paged_mqa_logits(
     _lazy_init()
     if _fp8_paged_mqa_logits_impl is None:
         return _missing()
-    return _fp8_paged_mqa_logits_impl(q_fp8,
-                                      kv_cache_fp8,
-                                      weights,
-                                      context_lens,
-                                      block_tables,
-                                      schedule_metadata,
-                                      max_model_len,
-                                      clean_logits=True)
+    return _fp8_paged_mqa_logits_impl(
+        q_fp8,
+        kv_cache_fp8,
+        weights,
+        context_lens,
+        block_tables,
+        schedule_metadata,
+        max_model_len,
+        clean_logits=True,
+    )
 
 
 def _ceil_to_ue8m0(x: torch.Tensor):
@@ -269,15 +287,14 @@ def _align(x: int, y: int) -> int:
 # Taken from https://github.com/deepseek-ai/DeepGEMM/blob/dd6ed14acbc7445dcef224248a77ab4d22b5f240/deep_gemm/utils/math.py#L38
 @torch.compile(dynamic=True, backend=current_platform.simple_compile_backend)
 def per_block_cast_to_fp8(
-        x: torch.Tensor,
-        block_size: list[int] = DEFAULT_BLOCK_SIZE,
-        use_ue8m0: bool = False) -> tuple[torch.Tensor, torch.Tensor]:
+    x: torch.Tensor, block_size: list[int] = DEFAULT_BLOCK_SIZE, use_ue8m0: bool = False
+) -> tuple[torch.Tensor, torch.Tensor]:
     assert x.dim() == 2
     m, n = x.shape
     block_m, block_n = block_size
-    x_padded = torch.zeros((_align(m, block_m), _align(n, block_n)),
-                           dtype=x.dtype,
-                           device=x.device)
+    x_padded = torch.zeros(
+        (_align(m, block_m), _align(n, block_n)), dtype=x.dtype, device=x.device
+    )
     x_padded[:m, :n] = x
     x_view = x_padded.view(-1, block_m, x_padded.size(1) // block_n, block_n)
     x_amax = x_view.abs().float().amax(dim=(1, 3), keepdim=True).clamp(1e-4)
@@ -285,7 +302,8 @@ def per_block_cast_to_fp8(
     sf = _ceil_to_ue8m0(sf) if use_ue8m0 else sf
     x_scaled = (x_view * (1.0 / sf)).to(torch.float8_e4m3fn)
     return x_scaled.view_as(x_padded)[:m, :n].contiguous(), sf.view(
-        x_view.size(0), x_view.size(2))
+        x_view.size(0), x_view.size(2)
+    )
 
 
 def calc_diff(x: torch.Tensor, y: torch.Tensor):
@@ -305,13 +323,18 @@ def calc_diff(x: torch.Tensor, y: torch.Tensor):
 
 
 def should_use_deepgemm_for_fp8_linear(
-        output_dtype: torch.dtype,
-        weight: torch.Tensor,
-        supports_deep_gemm: Optional[bool] = None):
+    output_dtype: torch.dtype,
+    weight: torch.Tensor,
+    supports_deep_gemm: Optional[bool] = None,
+):
     if supports_deep_gemm is None:
         supports_deep_gemm = is_deep_gemm_supported()
-    return (supports_deep_gemm and output_dtype == torch.bfloat16
-            and weight.shape[0] % 128 == 0 and weight.shape[1] % 128 == 0)
+    return (
+        supports_deep_gemm
+        and output_dtype == torch.bfloat16
+        and weight.shape[0] % 128 == 0
+        and weight.shape[1] % 128 == 0
+    )
 
 
 __all__ = [
diff --git a/vllm/utils/flashinfer.py b/vllm/utils/flashinfer.py
index 734cd938792a..22dfbe60f87a 100644
--- a/vllm/utils/flashinfer.py
+++ b/vllm/utils/flashinfer.py
@@ -4,6 +4,7 @@
 
 Users of vLLM should always import **only** these wrappers.
 """
+
 from __future__ import annotations
 
 import contextlib
@@ -44,7 +45,8 @@ def _missing(*_: Any, **__: Any) -> NoReturn:
     raise RuntimeError(
         "FlashInfer backend is not available. Please install the package "
         "to enable FlashInfer kernels: "
-        "https://github.com/flashinfer-ai/flashinfer")
+        "https://github.com/flashinfer-ai/flashinfer"
+    )
 
 
 def _get_submodule(module_name: str) -> Any | None:
@@ -56,9 +58,9 @@ def _get_submodule(module_name: str) -> Any | None:
 
 
 # General lazy import wrapper
-def _lazy_import_wrapper(module_name: str,
-                         attr_name: str,
-                         fallback_fn: Callable[..., Any] = _missing):
+def _lazy_import_wrapper(
+    module_name: str, attr_name: str, fallback_fn: Callable[..., Any] = _missing
+):
     """Create a lazy import wrapper for a specific function."""
 
     @functools.cache
@@ -79,29 +81,34 @@ def wrapper(*args, **kwargs):
 
 # Create lazy wrappers for each function
 flashinfer_trtllm_fp8_block_scale_moe = _lazy_import_wrapper(
-    "flashinfer.fused_moe", "trtllm_fp8_block_scale_moe")
+    "flashinfer.fused_moe", "trtllm_fp8_block_scale_moe"
+)
 flashinfer_trtllm_fp8_per_tensor_scale_moe = _lazy_import_wrapper(
-    "flashinfer.fused_moe", "trtllm_fp8_per_tensor_scale_moe")
-flashinfer_cutlass_fused_moe = _lazy_import_wrapper("flashinfer.fused_moe",
-                                                    "cutlass_fused_moe")
+    "flashinfer.fused_moe", "trtllm_fp8_per_tensor_scale_moe"
+)
+flashinfer_cutlass_fused_moe = _lazy_import_wrapper(
+    "flashinfer.fused_moe", "cutlass_fused_moe"
+)
 fp4_quantize = _lazy_import_wrapper("flashinfer", "fp4_quantize")
 nvfp4_block_scale_interleave = _lazy_import_wrapper(
-    "flashinfer", "nvfp4_block_scale_interleave")
+    "flashinfer", "nvfp4_block_scale_interleave"
+)
 trtllm_fp4_block_scale_moe = _lazy_import_wrapper(
-    "flashinfer", "trtllm_fp4_block_scale_moe")
+    "flashinfer", "trtllm_fp4_block_scale_moe"
+)
 
 # Special case for autotune since it returns a context manager
 autotune = _lazy_import_wrapper(
     "flashinfer.autotuner",
     "autotune",
-    fallback_fn=lambda *args, **kwargs: contextlib.nullcontext())
+    fallback_fn=lambda *args, **kwargs: contextlib.nullcontext(),
+)
 
 
 @functools.cache
 def has_flashinfer_comm() -> bool:
     """Return ``True`` if FlashInfer comm module is available."""
-    return has_flashinfer() and importlib.util.find_spec(
-        "flashinfer.comm") is not None
+    return has_flashinfer() and importlib.util.find_spec("flashinfer.comm") is not None
 
 
 @functools.cache
@@ -128,8 +135,10 @@ def has_flashinfer_all2all() -> bool:
 @functools.cache
 def has_flashinfer_moe() -> bool:
     """Return ``True`` if FlashInfer MoE module is available."""
-    return has_flashinfer() and importlib.util.find_spec(
-        "flashinfer.fused_moe") is not None
+    return (
+        has_flashinfer()
+        and importlib.util.find_spec("flashinfer.fused_moe") is not None
+    )
 
 
 @functools.cache
@@ -174,7 +183,8 @@ def has_nvidia_artifactory() -> bool:
         else:
             logger.warning_once(
                 "NVIDIA artifactory returned failed status code: %d",
-                response.status_code)
+                response.status_code,
+            )
         return accessible
     except Exception as e:
         logger.warning_once("Failed to connect to NVIDIA artifactory: %s", e)
@@ -188,8 +198,7 @@ def supports_trtllm_attention() -> bool:
     NVIDIA artifactory is accessible
     """
     # Requires SM100 and NVIDIA artifactory to be accessible to download cubins
-    return current_platform.is_device_capability(
-        100) and has_nvidia_artifactory()
+    return current_platform.is_device_capability(100) and has_nvidia_artifactory()
 
 
 @functools.cache
@@ -238,7 +247,8 @@ def use_trtllm_attention(
         if force_use_trtllm:
             logger.warning_once(
                 "TRTLLM attention is not supported on this platform, "
-                "but VLLM_USE_TRTLLM_ATTENTION is set to 1")
+                "but VLLM_USE_TRTLLM_ATTENTION is set to 1"
+            )
         return False
 
     # The combination of query and key heads is not supported
@@ -252,8 +262,7 @@ def use_trtllm_attention(
 
     if has_spec and not is_prefill:
         # Speculative decoding requires TRTLLM attention for decodes
-        logger.info_once(
-            "Using TRTLLM attention (enabled for speculative decoding).")
+        logger.info_once("Using TRTLLM attention (enabled for speculative decoding).")
         return True
 
     # Must use TRTLLM attention if query is FP8 quantized
@@ -261,28 +270,28 @@ def use_trtllm_attention(
         if has_sinks:
             raise RuntimeError(
                 "TRTLLM FP8-qkv kernel is not supported for attention sinks. "
-                "Use kv_cache_dtype=auto for now.")
+                "Use kv_cache_dtype=auto for now."
+            )
         logger.info_once("Using TRTLLM attention (query is quantized).")
         return True
 
     # If sinks are being used, we must use TRTLLM attention as it's
     # the only backend that supports them
     if has_sinks:
-        logger.info_once(
-            "Using TRTLLM attention (required for attention sinks).")
+        logger.info_once("Using TRTLLM attention (required for attention sinks).")
         return True
 
     if force_use_trtllm is None:
         # Environment variable not set - use auto-detection
-        use_trtllm = (num_tokens <= 256 and max_seq_len <= 131072
-                      and kv_cache_dtype == "auto")
+        use_trtllm = (
+            num_tokens <= 256 and max_seq_len <= 131072 and kv_cache_dtype == "auto"
+        )
         if use_trtllm:
             logger.warning_once("Using TRTLLM attention (auto-detected).")
         return use_trtllm
 
     # Environment variable is set to 1 - respect it
-    logger.info_once(
-        "Using TRTLLM attention (VLLM_USE_TRTLLM_ATTENTION is set to 1)")
+    logger.info_once("Using TRTLLM attention (VLLM_USE_TRTLLM_ATTENTION is set to 1)")
     return True
 
 
@@ -303,16 +312,14 @@ def flashinfer_mm_fp4(
         backend: str,
     ) -> torch.Tensor:
         from flashinfer import mm_fp4 as flashinfer_mm_fp4_
-        return flashinfer_mm_fp4_(A,
-                                  B,
-                                  A_scale,
-                                  B_scale,
-                                  g_scale,
-                                  dtype,
-                                  block_size=16,
-                                  backend=backend)
-
-    @torch.library.register_fake("vllm::flashinfer_mm_fp4", )
+
+        return flashinfer_mm_fp4_(
+            A, B, A_scale, B_scale, g_scale, dtype, block_size=16, backend=backend
+        )
+
+    @torch.library.register_fake(
+        "vllm::flashinfer_mm_fp4",
+    )
     def flashinfer_mm_fp4_fake(
         A: torch.Tensor,
         B: torch.Tensor,
@@ -322,10 +329,7 @@ def flashinfer_mm_fp4_fake(
         dtype: torch.dtype,
         backend: str,
     ) -> torch.Tensor:
-        return torch.empty(A.shape[0],
-                           B.shape[1],
-                           dtype=dtype,
-                           device=A.device)
+        return torch.empty(A.shape[0], B.shape[1], dtype=dtype, device=A.device)
 
     @torch.library.custom_op(
         "vllm::bmm_fp8",
@@ -341,9 +345,12 @@ def bmm_fp8(
         backend: str,
     ) -> torch.Tensor:
         from flashinfer import bmm_fp8 as bmm_fp8_
+
         return bmm_fp8_(A, B, A_scale, B_scale, dtype, None, backend)
 
-    @torch.library.register_fake("vllm::bmm_fp8", )
+    @torch.library.register_fake(
+        "vllm::bmm_fp8",
+    )
     def bmm_fp8_fake(
         A: torch.Tensor,
         B: torch.Tensor,
@@ -352,18 +359,20 @@ def bmm_fp8_fake(
         dtype: torch.dtype,
         backend: str,
     ) -> torch.Tensor:
-        return torch.empty(A.shape[0],
-                           A.shape[1],
-                           B.shape[2],
-                           dtype=dtype,
-                           device=A.device)
-
-
-def flashinfer_scaled_fp4_mm(a: torch.Tensor, b: torch.Tensor,
-                             block_scale_a: torch.Tensor,
-                             block_scale_b: torch.Tensor, alpha: torch.Tensor,
-                             out_dtype: torch.dtype,
-                             backend: str) -> torch.Tensor:
+        return torch.empty(
+            A.shape[0], A.shape[1], B.shape[2], dtype=dtype, device=A.device
+        )
+
+
+def flashinfer_scaled_fp4_mm(
+    a: torch.Tensor,
+    b: torch.Tensor,
+    block_scale_a: torch.Tensor,
+    block_scale_b: torch.Tensor,
+    alpha: torch.Tensor,
+    out_dtype: torch.dtype,
+    backend: str,
+) -> torch.Tensor:
     assert a.ndim == 2 and b.ndim == 2
     assert block_scale_a.ndim == 2 and block_scale_b.ndim == 2
     assert a.stride(-1) == 1 and b.stride(-1) == 1
@@ -387,12 +396,13 @@ def flashinfer_scaled_fp4_mm(a: torch.Tensor, b: torch.Tensor,
 
 
 def flashinfer_scaled_fp8_mm(
-        a: torch.Tensor,
-        b: torch.Tensor,
-        scale_a: torch.Tensor,
-        scale_b: torch.Tensor,
-        out_dtype: torch.dtype,
-        bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    a: torch.Tensor,
+    b: torch.Tensor,
+    scale_a: torch.Tensor,
+    scale_b: torch.Tensor,
+    out_dtype: torch.dtype,
+    bias: Optional[torch.Tensor] = None,
+) -> torch.Tensor:
     assert a.ndim == 2 and b.ndim == 2
     assert a.shape[1] == b.shape[0]
     assert scale_a.numel() == 1 and scale_b.numel() == 1
diff --git a/vllm/utils/gc_utils.py b/vllm/utils/gc_utils.py
index 8ce2c200e299..e3b5b61dd364 100644
--- a/vllm/utils/gc_utils.py
+++ b/vllm/utils/gc_utils.py
@@ -36,8 +36,7 @@ def __init__(self, gc_debug_conf: Optional[str] = None) -> None:
                 self.top_objects = json_conf.get("top_objects", -1)
             except Exception:
                 self.enabled = False
-                logger.error("Failed to parse VLLM_GC_DEBUG(%s)",
-                             VLLM_GC_DEBUG)
+                logger.error("Failed to parse VLLM_GC_DEBUG(%s)", VLLM_GC_DEBUG)
         logger.info("GC Debug Config. %s", str(self))
 
     def __repr__(self) -> str:
@@ -70,7 +69,8 @@ def handle(self, phase: str, info: dict[str, int]) -> None:
             # and top collected objects
             self.start_time_ns = time.monotonic_ns()
             self.gc_top_collected_objects = _compute_top_gc_collected_objects(
-                gc.get_objects(generation), self.config.top_objects)
+                gc.get_objects(generation), self.config.top_objects
+            )
         elif phase == "stop":
             # After GC finished, Record GC elapsed time and
             # optionally top collected objects
@@ -81,8 +81,11 @@ def handle(self, phase: str, info: dict[str, int]) -> None:
                 elpased_ms,
                 str(info.get("collected", "?")),
                 generation,
-                (f" Top collected objects: \n{self.gc_top_collected_objects}"
-                 if self.gc_top_collected_objects else ""),
+                (
+                    f" Top collected objects: \n{self.gc_top_collected_objects}"
+                    if self.gc_top_collected_objects
+                    else ""
+                ),
             )
 
 
@@ -125,4 +128,5 @@ def _compute_top_gc_collected_objects(objects: list[Any], top: int) -> str:
     object_types = [_compute_detailed_type(o) for o in objects]
     return "\n".join(
         f"{count:>5}:{object_type}"
-        for object_type, count in Counter(object_types).most_common(top))
+        for object_type, count in Counter(object_types).most_common(top)
+    )
diff --git a/vllm/utils/jsontree.py b/vllm/utils/jsontree.py
index 7eb58b5f5cf8..dcdc6ccb4c63 100644
--- a/vllm/utils/jsontree.py
+++ b/vllm/utils/jsontree.py
@@ -52,40 +52,35 @@ def json_iter_leaves(value: JSONTree[_T]) -> Iterable[_T]:
 def json_map_leaves(
     func: Callable[["torch.Tensor"], "torch.Tensor"],
     value: "BatchedTensorInputs",
-) -> "BatchedTensorInputs":
-    ...
+) -> "BatchedTensorInputs": ...
 
 
 @overload
 def json_map_leaves(
     func: Callable[[_T], _U],
     value: Union[_T, dict[str, _T]],
-) -> Union[_U, dict[str, _U]]:
-    ...
+) -> Union[_U, dict[str, _U]]: ...
 
 
 @overload
 def json_map_leaves(
     func: Callable[[_T], _U],
     value: Union[_T, list[_T]],
-) -> Union[_U, list[_U]]:
-    ...
+) -> Union[_U, list[_U]]: ...
 
 
 @overload
 def json_map_leaves(
     func: Callable[[_T], _U],
     value: Union[_T, tuple[_T, ...]],
-) -> Union[_U, tuple[_U, ...]]:
-    ...
+) -> Union[_U, tuple[_U, ...]]: ...
 
 
 @overload
 def json_map_leaves(
     func: Callable[[_T], _U],
     value: JSONTree[_T],
-) -> JSONTree[_U]:
-    ...
+) -> JSONTree[_U]: ...
 
 
 def json_map_leaves(
@@ -111,8 +106,7 @@ def json_reduce_leaves(
     func: Callable[[_T, _T], _T],
     value: Union[_T, dict[str, _T]],
     /,
-) -> _T:
-    ...
+) -> _T: ...
 
 
 @overload
@@ -120,8 +114,7 @@ def json_reduce_leaves(
     func: Callable[[_T, _T], _T],
     value: Union[_T, list[_T]],
     /,
-) -> _T:
-    ...
+) -> _T: ...
 
 
 @overload
@@ -129,8 +122,7 @@ def json_reduce_leaves(
     func: Callable[[_T, _T], _T],
     value: Union[_T, tuple[_T, ...]],
     /,
-) -> _T:
-    ...
+) -> _T: ...
 
 
 @overload
@@ -138,8 +130,7 @@ def json_reduce_leaves(
     func: Callable[[_T, _T], _T],
     value: JSONTree[_T],
     /,
-) -> _T:
-    ...
+) -> _T: ...
 
 
 @overload
@@ -148,15 +139,14 @@ def json_reduce_leaves(
     value: JSONTree[_T],
     initial: _U,
     /,
-) -> _U:
-    ...
+) -> _U: ...
 
 
 def json_reduce_leaves(
-        func: Callable[..., Union[_T, _U]],
-        value: _JSONTree[_T],
-        initial: _U = cast(_U, ...),  # noqa: B008
-        /,
+    func: Callable[..., Union[_T, _U]],
+    value: _JSONTree[_T],
+    initial: _U = cast(_U, ...),  # noqa: B008
+    /,
 ) -> Union[_T, _U]:
     """
     Apply a function of two arguments cumulatively to each leaf in a
diff --git a/vllm/utils/tensor_schema.py b/vllm/utils/tensor_schema.py
index 81daca7dfbef..e17676ccf7ef 100644
--- a/vllm/utils/tensor_schema.py
+++ b/vllm/utils/tensor_schema.py
@@ -1,7 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-from typing import (Annotated, Any, Optional, Union, get_args, get_origin,
-                    get_type_hints)
+from typing import Annotated, Any, Optional, Union, get_args, get_origin, get_type_hints
 
 import torch
 
@@ -11,7 +10,6 @@
 
 
 class TensorShape:
-
     def __init__(
         self,
         *dims: Union[int, str],
@@ -37,8 +35,7 @@ def __str__(self) -> str:
         for dim in self.dims:
             if isinstance(dim, str):
                 if dim in self.dynamic_dims:
-                    dim_strs.append(
-                        f"{dim}*")  # Mark dynamic dimensions with *
+                    dim_strs.append(f"{dim}*")  # Mark dynamic dimensions with *
                 else:
                     dim_strs.append(dim)
             else:
@@ -47,7 +44,6 @@ def __str__(self) -> str:
 
 
 class TensorSchema:
-
     def __init__(
         self,
         *,
@@ -101,12 +97,12 @@ def _fmt_indexer(self, idxs: tuple[int, ...]) -> str:
         return str(list(idxs))
 
     def _validate_field(
-            self,
-            value: object,
-            field_name: str,
-            expected_shape: tuple[Union[int, str], ...],
-            dynamic_dims: set[str],
-            leading_idxs: tuple[int, ...] = (),
+        self,
+        value: object,
+        field_name: str,
+        expected_shape: tuple[Union[int, str], ...],
+        dynamic_dims: set[str],
+        leading_idxs: tuple[int, ...] = (),
     ) -> tuple[int, ...]:
         """Validate a field and return the actual shape."""
         if isinstance(value, (int, float)):
@@ -118,11 +114,13 @@ def _validate_field(
             raise TypeError(
                 f"{field_name}{self._fmt_indexer(leading_idxs)} is not "
                 f"one of the expected types: int, float, Tensor, list, tuple. "
-                f"Got: {type(value)}")
+                f"Got: {type(value)}"
+            )
 
         if len(value) == 0:
-            raise ValueError(f"{field_name}{self._fmt_indexer(leading_idxs)} "
-                             f"is an empty sequence")
+            raise ValueError(
+                f"{field_name}{self._fmt_indexer(leading_idxs)} is an empty sequence"
+            )
 
         # Ensure all tensors in the list have the same
         # shape, besides dynamic dimensions
@@ -132,25 +130,26 @@ def _validate_field(
                 field_name,
                 expected_shape[1:],
                 dynamic_dims,
-                leading_idxs=leading_idxs + (i, ),
+                leading_idxs=leading_idxs + (i,),
             )
 
             if i == 0:
                 first_shape = shape
             elif not self._match_shape_with_dynamic(
-                    shape,
-                    first_shape,
-                    expected_shape,
-                    dynamic_dims,
+                shape,
+                first_shape,
+                expected_shape,
+                dynamic_dims,
             ):
                 raise ValueError(
                     f"{field_name}{self._fmt_indexer(leading_idxs)} "
                     f"contains inconsistent shapes: {first_shape} "
-                    f"(index 0) vs {shape} (index {i})")
+                    f"(index 0) vs {shape} (index {i})"
+                )
 
         # Treat the list as a stacked tensor:
         # shape = (len(list), *tensor.shape)
-        return (len(value), ) + first_shape
+        return (len(value),) + first_shape
 
     def _validate_tensor_shape_expected(
         self,
@@ -163,31 +162,38 @@ def _validate_tensor_shape_expected(
         """Validate that the actual tensor shape matches the expected shape."""
 
         if len(actual_shape) != len(expected_shape):
-            raise ValueError(f"{field_name} has rank {len(actual_shape)} "
-                             f"but expected {len(expected_shape)}. "
-                             f"Expected shape: {expected_shape}, "
-                             f"but got {actual_shape}")
+            raise ValueError(
+                f"{field_name} has rank {len(actual_shape)} "
+                f"but expected {len(expected_shape)}. "
+                f"Expected shape: {expected_shape}, "
+                f"but got {actual_shape}"
+            )
 
         for i, dim in enumerate(expected_shape):
             if dim in dynamic_dims:
                 continue
             elif isinstance(dim, int):
                 if actual_shape[i] != dim:
-                    raise ValueError(f"{field_name} dim[{i}] expected "
-                                     f"{dim}, got {actual_shape[i]}. "
-                                     f"Expected shape: {expected_shape}, "
-                                     f"but got {actual_shape}")
+                    raise ValueError(
+                        f"{field_name} dim[{i}] expected "
+                        f"{dim}, got {actual_shape[i]}. "
+                        f"Expected shape: {expected_shape}, "
+                        f"but got {actual_shape}"
+                    )
             elif isinstance(dim, str):
                 if dim in shape_env:
                     if actual_shape[i] != shape_env[dim]:
-                        raise ValueError(f"{field_name} dim[{i}] expected "
-                                         f"'{dim}'={shape_env[dim]}, got "
-                                         f"{actual_shape[i]}")
+                        raise ValueError(
+                            f"{field_name} dim[{i}] expected "
+                            f"'{dim}'={shape_env[dim]}, got "
+                            f"{actual_shape[i]}"
+                        )
                 else:
                     shape_env[dim] = actual_shape[i]
             else:
-                raise TypeError(f"{field_name} dim[{i}] has unsupported "
-                                f"type: {type(dim)}")
+                raise TypeError(
+                    f"{field_name} dim[{i}] has unsupported type: {type(dim)}"
+                )
 
     def validate(self) -> None:
         type_hints = get_type_hints(self.__class__, include_extras=True)
@@ -195,8 +201,7 @@ def validate(self) -> None:
 
         for field_name, field_type in type_hints.items():
             # Check if field is missing
-            if (not hasattr(self, field_name)
-                    or getattr(self, field_name) is None):
+            if not hasattr(self, field_name) or getattr(self, field_name) is None:
                 # Check if field is marked as optional
                 actual_type = field_type
                 if get_origin(field_type) is Annotated:
@@ -228,8 +233,12 @@ def validate(self) -> None:
                         )
 
                         self._validate_tensor_shape_expected(
-                            actual_shape, expected_shape, field_name,
-                            shape_env, arg.dynamic_dims)
+                            actual_shape,
+                            expected_shape,
+                            field_name,
+                            shape_env,
+                            arg.dynamic_dims,
+                        )
 
     def print_shapes(self) -> None:
         """Print TensorShape annotations for debugging."""
diff --git a/vllm/v1/attention/backends/cpu_attn.py b/vllm/v1/attention/backends/cpu_attn.py
index 369f7062005c..6e27e93c9115 100644
--- a/vllm/v1/attention/backends/cpu_attn.py
+++ b/vllm/v1/attention/backends/cpu_attn.py
@@ -7,19 +7,26 @@
 import torch
 from torch.nn.functional import scaled_dot_product_attention
 
-from vllm.attention.backends.abstract import (AttentionBackend, AttentionImpl,
-                                              AttentionLayer,
-                                              AttentionMetadata, AttentionType,
-                                              is_quantized_kv_cache)
+from vllm.attention.backends.abstract import (
+    AttentionBackend,
+    AttentionImpl,
+    AttentionLayer,
+    AttentionMetadata,
+    AttentionType,
+    is_quantized_kv_cache,
+)
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
-from vllm.v1.attention.backends.utils import (AttentionMetadataBuilder,
-                                              CommonAttentionMetadata,
-                                              split_decodes_and_prefills)
+from vllm.v1.attention.backends.utils import (
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+    split_decodes_and_prefills,
+)
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 try:
     import intel_extension_for_pytorch.llm.modules as ipex_modules
+
     _use_ipex = True
 # AttributeError is to handle a bug in ipex
 # https://github.com/intel/intel-extension-for-pytorch/pull/813
@@ -41,15 +48,15 @@ def get_supported_dtypes(cls) -> list[torch.dtype]:
     @classmethod
     def validate_head_size(cls, head_size: int) -> None:
         attn_impl = _get_paged_attn_impl()
-        is_valid, supported_head_sizes = attn_impl.validate_head_size(
-            head_size)
+        is_valid, supported_head_sizes = attn_impl.validate_head_size(head_size)
         if not is_valid:
             attn_type = cls.__name__.removesuffix("Backend")
             raise ValueError(
                 f"Head size {head_size} is not supported by {attn_type}. "
                 f"Supported head sizes are: {supported_head_sizes}. "
                 "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes.")
+                "FlexAttention backend which supports all head sizes."
+            )
 
     @staticmethod
     def get_name() -> str:
@@ -76,7 +83,8 @@ def get_kv_cache_shape(
         cache_dtype_str: str = "auto",
     ) -> tuple[int, ...]:
         return _get_paged_attn_impl().get_kv_cache_shape(
-            num_blocks, block_size, num_kv_heads, head_size)
+            num_blocks, block_size, num_kv_heads, head_size
+        )
 
     @staticmethod
     def use_cascade_attention(*args, **kwargs) -> bool:
@@ -86,6 +94,7 @@ def use_cascade_attention(*args, **kwargs) -> bool:
 @dataclass
 class TorchSDPAMetadata(AttentionMetadata):
     """Attention metadata for prefill and decode batched together."""
+
     # Total number of prefill requests.
     num_prefills: int
     # Number of prefill tokens.
@@ -156,23 +165,27 @@ def __post_init__(self):
 
     @property
     def is_all_encoder_attn_metadata_set(self):
-        '''
+        """
         All attention metadata required for encoder attention is set.
-        '''
-        return ((self.encoder_seq_lens is not None)
-                and (self.encoder_seq_lens_tensor is not None)
-                and (self.max_encoder_seq_len is not None))
+        """
+        return (
+            (self.encoder_seq_lens is not None)
+            and (self.encoder_seq_lens_tensor is not None)
+            and (self.max_encoder_seq_len is not None)
+        )
 
     @property
     def is_all_cross_attn_metadata_set(self):
-        '''
+        """
         All attention metadata required for enc/dec cross-attention is set.
 
         Superset of encoder attention required metadata.
-        '''
-        return (self.is_all_encoder_attn_metadata_set
-                and (self.cross_slot_mapping is not None)
-                and (self.cross_block_tables is not None))
+        """
+        return (
+            self.is_all_encoder_attn_metadata_set
+            and (self.cross_slot_mapping is not None)
+            and (self.cross_block_tables is not None)
+        )
 
     @property
     def prefill_metadata(self) -> Optional["TorchSDPAMetadata"]:
@@ -190,7 +203,7 @@ def get_seq_lens(
         self,
         attn_type: str,
     ):
-        '''
+        """
         Extract appropriate sequence lengths from attention metadata
         according to attention type.
 
@@ -203,10 +216,12 @@ def get_seq_lens(
         Returns:
         * Appropriate sequence lengths tensor for query
         * Appropriate sequence lengths tensor for key & value
-        '''
+        """
 
-        if (attn_type == AttentionType.DECODER
-                or attn_type == AttentionType.ENCODER_ONLY):
+        if (
+            attn_type == AttentionType.DECODER
+            or attn_type == AttentionType.ENCODER_ONLY
+        ):
             seq_lens_q = self.seq_lens
             seq_lens_kv = self.seq_lens
         elif attn_type == AttentionType.ENCODER:
@@ -223,7 +238,7 @@ def get_attn_bias(
         self,
         attn_type: str,
     ) -> Optional[list[torch.Tensor]]:
-        '''
+        """
         Extract appropriate attention bias from attention metadata
         according to attention type.
 
@@ -235,10 +250,12 @@ def get_attn_bias(
 
         Returns:
         * Appropriate attention bias value given the attention type
-        '''
+        """
 
-        if (attn_type == AttentionType.DECODER
-                or attn_type == AttentionType.ENCODER_ONLY):
+        if (
+            attn_type == AttentionType.DECODER
+            or attn_type == AttentionType.ENCODER_ONLY
+        ):
             return self.attn_bias
         elif attn_type == AttentionType.ENCODER:
             return self.encoder_attn_bias
@@ -252,7 +269,7 @@ def set_attn_bias(
         attn_bias: list[torch.Tensor],
         attn_type: str,
     ) -> None:
-        '''
+        """
         Update appropriate attention bias field of attention metadata,
         according to attention type.
 
@@ -262,10 +279,12 @@ def set_attn_bias(
         * attn_bias: The desired attention bias value
         * attn_type: encoder attention, decoder self-attention,
                     encoder/decoder cross-attention
-        '''
+        """
 
-        if (attn_type == AttentionType.DECODER
-                or attn_type == AttentionType.ENCODER_ONLY):
+        if (
+            attn_type == AttentionType.DECODER
+            or attn_type == AttentionType.ENCODER_ONLY
+        ):
             self.attn_bias = attn_bias
         elif attn_type == AttentionType.ENCODER:
             self.encoder_attn_bias = attn_bias
@@ -278,7 +297,7 @@ def get_seq_len_block_table_args(
         self,
         attn_type: str,
     ) -> tuple:
-        '''
+        """
         The particular choice of sequence-length- and block-table-related
         attributes which should be extracted from attn_metadata is dependent
         on the type of attention operation.
@@ -300,23 +319,30 @@ def get_seq_len_block_table_args(
         * Appropriate sequence-lengths tensor
         * Appropriate max sequence-length scalar
         * Appropriate block tables (or None)
-        '''
+        """
 
-        if (attn_type == AttentionType.DECODER
-                or attn_type == AttentionType.ENCODER_ONLY):
+        if (
+            attn_type == AttentionType.DECODER
+            or attn_type == AttentionType.ENCODER_ONLY
+        ):
             # Decoder self-attention
             # Choose max_seq_len based on whether we are in prompt_run
-            return (self.decode_seq_lens_tensor, self.decode_max_seq_len,
-                    self.decode_block_tables)
+            return (
+                self.decode_seq_lens_tensor,
+                self.decode_max_seq_len,
+                self.decode_block_tables,
+            )
         elif attn_type == AttentionType.ENCODER_DECODER:
             # Enc/dec cross-attention KVs match encoder sequence length;
             # cross-attention utilizes special "cross" block tables
-            return (self.encoder_seq_lens_tensor, self.max_encoder_seq_len,
-                    self.cross_block_tables)
+            return (
+                self.encoder_seq_lens_tensor,
+                self.max_encoder_seq_len,
+                self.cross_block_tables,
+            )
         elif attn_type == AttentionType.ENCODER:
             # No block tables associated with encoder attention
-            return (self.encoder_seq_lens_tensor, self.max_encoder_seq_len,
-                    None)
+            return (self.encoder_seq_lens_tensor, self.max_encoder_seq_len, None)
         else:
             raise AttributeError(f"Invalid attention type {str(attn_type)}")
 
@@ -324,8 +350,13 @@ def get_seq_len_block_table_args(
 class TorchSDPAMetadataBuilderV1(AttentionMetadataBuilder[TorchSDPAMetadata]):
     reorder_batch_threshold: int = 1
 
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device) -> None:
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ) -> None:
         super().__init__(kv_cache_spec, layer_names, vllm_config, device)
 
         self.scheduler_config = vllm_config.scheduler_config
@@ -338,10 +369,12 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
         )
         self.seq_start_loc_np = self.seq_start_loc_cpu.numpy()
 
-    def build(self,
-              common_prefix_len: int,
-              common_attn_metadata: CommonAttentionMetadata,
-              fast_build: bool = False) -> TorchSDPAMetadata:
+    def build(
+        self,
+        common_prefix_len: int,
+        common_attn_metadata: CommonAttentionMetadata,
+        fast_build: bool = False,
+    ) -> TorchSDPAMetadata:
         num_reqs = common_attn_metadata.num_reqs
         max_query_len = common_attn_metadata.max_query_len
 
@@ -351,22 +384,27 @@ def build(self,
         query_start_loc_cpu = common_attn_metadata.query_start_loc_cpu
         query_start_loc_np = query_start_loc_cpu.numpy()
 
-        num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens =\
-            split_decodes_and_prefills(common_attn_metadata,
-                                       decode_threshold=self.reorder_batch_threshold,
-                                       require_uniform=True)
+        num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
+            split_decodes_and_prefills(
+                common_attn_metadata,
+                decode_threshold=self.reorder_batch_threshold,
+                require_uniform=True,
+            )
+        )
 
-        max_prefill_seq_len = seq_lens_np[num_decodes:num_reqs].max().item(
-        ) if num_prefills > 0 else 0
-        max_decode_seq_len = seq_lens_np[:num_decodes].max().item(
-        ) if num_prefills < num_reqs else 0
+        max_prefill_seq_len = (
+            seq_lens_np[num_decodes:num_reqs].max().item() if num_prefills > 0 else 0
+        )
+        max_decode_seq_len = (
+            seq_lens_np[:num_decodes].max().item() if num_prefills < num_reqs else 0
+        )
         self.seq_start_loc_np[0] = 0
-        np.cumsum(seq_lens_np, out=self.seq_start_loc_np[1:num_reqs + 1])
+        np.cumsum(seq_lens_np, out=self.seq_start_loc_np[1 : num_reqs + 1])
 
         slot_mapping = common_attn_metadata.slot_mapping.long()
         block_table_tensor = common_attn_metadata.block_table_tensor
         query_start_loc_np = query_start_loc_cpu.numpy()
-        query_start_loc_np[num_decodes:num_reqs + 1] -= num_decode_tokens
+        query_start_loc_np[num_decodes : num_reqs + 1] -= num_decode_tokens
 
         attn_metadata = TorchSDPAMetadata(
             num_prefills=num_prefills,
@@ -381,21 +419,20 @@ def build(self,
             chunked_prefill=self.scheduler_config.chunked_prefill_enabled,
             max_query_len=max_query_len,
             prefill_max_seq_len=max_prefill_seq_len,
-            prefill_query_start_loc=query_start_loc_cpu[num_decodes:num_reqs +
-                                                        1],  # prefill
-            prefill_seq_start_loc=self.seq_start_loc_cpu[num_decodes:num_reqs +
-                                                         1],  # prefill
-            prefill_block_tables=block_table_tensor[
-                num_decodes:num_reqs],  # prefill
-            query_start_loc=query_start_loc_cpu[:num_reqs +
-                                                1],  # for logits index
+            prefill_query_start_loc=query_start_loc_cpu[
+                num_decodes : num_reqs + 1
+            ],  # prefill
+            prefill_seq_start_loc=self.seq_start_loc_cpu[
+                num_decodes : num_reqs + 1
+            ],  # prefill
+            prefill_block_tables=block_table_tensor[num_decodes:num_reqs],  # prefill
+            query_start_loc=query_start_loc_cpu[: num_reqs + 1],  # for logits index
         )
 
         return attn_metadata
 
 
 class TorchSDPABackendImpl(AttentionImpl[TorchSDPAMetadata]):
-
     def __init__(
         self,
         num_heads: int,
@@ -412,8 +449,10 @@ def __init__(
         if kv_sharing_target_layer_name is not None:
             raise NotImplementedError("KV sharing is not supported in V0.")
         if logits_soft_cap is not None:
-            logger.warning_once("Torch SPDA does not support logits soft cap. "
-                                "Outputs may be slightly off.")
+            logger.warning_once(
+                "Torch SPDA does not support logits soft cap. "
+                "Outputs may be slightly off."
+            )
         self.paged_attn_impl = _get_paged_attn_impl()
         self.num_heads = num_heads
         self.head_size = head_size
@@ -426,13 +465,15 @@ def __init__(
         self.kv_cache_dtype = kv_cache_dtype
 
         self.num_queries_per_kv = self.num_heads // self.num_kv_heads
-        self.need_mask = (self.alibi_slopes is not None
-                          or self.sliding_window is not None)
+        self.need_mask = (
+            self.alibi_slopes is not None or self.sliding_window is not None
+        )
 
         if is_quantized_kv_cache(kv_cache_dtype) and not _use_ipex:
             raise NotImplementedError(
                 "Torch SDPA backend FP8 KV cache requires "
-                "intel_extension_for_pytorch support.")
+                "intel_extension_for_pytorch support."
+            )
         self.attn_type = attn_type
 
     def forward(
@@ -464,22 +505,28 @@ def forward(
         if output_scale is not None or output_block_scale is not None:
             raise NotImplementedError(
                 "fused output quantization is not yet supported"
-                " for TorchSDPABackendImpl")
+                " for TorchSDPABackendImpl"
+            )
 
         # For warming-up
         if attn_metadata is None:
             return query
 
         attn_type = self.attn_type
-        if (attn_type == AttentionType.ENCODER
-                and (not attn_metadata.is_all_encoder_attn_metadata_set)):
-            raise AttributeError("Encoder attention requires setting "
-                                 "encoder metadata attributes.")
-        elif (attn_type == AttentionType.ENCODER_DECODER
-              and (not attn_metadata.is_all_cross_attn_metadata_set)):
-            raise AttributeError("Encoder/decoder cross-attention "
-                                 "requires setting cross-attention "
-                                 "metadata attributes.")
+        if attn_type == AttentionType.ENCODER and (
+            not attn_metadata.is_all_encoder_attn_metadata_set
+        ):
+            raise AttributeError(
+                "Encoder attention requires setting encoder metadata attributes."
+            )
+        elif attn_type == AttentionType.ENCODER_DECODER and (
+            not attn_metadata.is_all_cross_attn_metadata_set
+        ):
+            raise AttributeError(
+                "Encoder/decoder cross-attention "
+                "requires setting cross-attention "
+                "metadata attributes."
+            )
 
         # Reshape the query, key, and value tensors.
         query = query.view(-1, self.num_heads, self.head_size)
@@ -490,7 +537,7 @@ def forward(
         else:
             assert value is None
 
-        if (attn_type != AttentionType.ENCODER and kv_cache.numel() > 0):
+        if attn_type != AttentionType.ENCODER and kv_cache.numel() > 0:
             # KV-cache during decoder-self- or
             # encoder-decoder-cross-attention, but not
             # during encoder attention.
@@ -499,7 +546,8 @@ def forward(
             # we still need to break out key_cache and value_cache
             # i.e. for later use by paged attention
             key_cache, value_cache = self.paged_attn_impl.split_kv_cache(
-                kv_cache, self.num_kv_heads, self.head_size)
+                kv_cache, self.num_kv_heads, self.head_size
+            )
 
             if (key is not None) and (value is not None):
                 if attn_type == AttentionType.ENCODER_DECODER:
@@ -512,8 +560,15 @@ def forward(
                     updated_slot_mapping = attn_metadata.slot_mapping
 
                 self.paged_attn_impl.write_to_paged_cache(
-                    key, value, key_cache, value_cache, updated_slot_mapping,
-                    self.kv_cache_dtype, layer._k_scale, layer._v_scale)
+                    key,
+                    value,
+                    key_cache,
+                    value_cache,
+                    updated_slot_mapping,
+                    self.kv_cache_dtype,
+                    layer._k_scale,
+                    layer._v_scale,
+                )
 
         if attn_type != AttentionType.ENCODER:
             # Decoder self-attention supports chunked prefill.
@@ -539,20 +594,18 @@ def forward(
         if prefill_meta := attn_metadata.prefill_metadata:
             if not prefill_meta.prefill_metadata.chunked_prefill:  # type: ignore
                 assert attn_metadata.seq_lens is not None
-                self._run_sdpa_forward(output,
-                                       query,
-                                       key,
-                                       value,
-                                       prefill_meta,
-                                       attn_type=attn_type)
+                self._run_sdpa_forward(
+                    output, query, key, value, prefill_meta, attn_type=attn_type
+                )
             else:
                 # prefix-enabled attention
                 assert not self.need_mask
                 import intel_extension_for_pytorch.llm.modules as ipex_modules
+
                 output = torch.empty_like(query)
                 ipex_modules.PagedAttention.flash_attn_varlen_func(
-                    output[prefill_meta.num_decode_tokens:, :, :],
-                    query[prefill_meta.num_decode_tokens:, :, :],
+                    output[prefill_meta.num_decode_tokens :, :, :],
+                    query[prefill_meta.num_decode_tokens :, :, :],
                     key_cache,
                     value_cache,
                     prefill_meta.prefill_query_start_loc,
@@ -567,7 +620,8 @@ def forward(
 
         if decode_meta := attn_metadata.decode_metadata:
             assert attn_type != AttentionType.ENCODER_ONLY, (
-                "Encoder-only models should not have decode metadata.")
+                "Encoder-only models should not have decode metadata."
+            )
             # Decoding run.
             (
                 seq_lens_arg,
@@ -576,8 +630,8 @@ def forward(
             ) = decode_meta.get_seq_len_block_table_args(attn_type)
 
             self.paged_attn_impl.forward_decode(
-                output[:attn_metadata.num_decode_tokens, :, :],
-                query[:attn_metadata.num_decode_tokens, :, :],
+                output[: attn_metadata.num_decode_tokens, :, :],
+                query[: attn_metadata.num_decode_tokens, :, :],
                 key_cache,
                 value_cache,
                 block_tables_arg,
@@ -607,13 +661,15 @@ def _run_sdpa_forward(
         if attn_masks is None:
             if self.alibi_slopes is not None:
                 attn_masks = _make_alibi_bias(
-                    self.alibi_slopes, query.dtype,
-                    attn_metadata.seq_lens)  # type: ignore
+                    self.alibi_slopes,
+                    query.dtype,
+                    attn_metadata.seq_lens,  # type: ignore
+                )
             elif self.sliding_window is not None:
                 assert attn_metadata.seq_lens is not None
                 attn_masks = _make_sliding_window_bias(
-                    attn_metadata.seq_lens, self.sliding_window,
-                    query.dtype)  # type: ignore
+                    attn_metadata.seq_lens, self.sliding_window, query.dtype
+                )
             else:
                 seq_lens, _ = attn_metadata.get_seq_lens(attn_type)
                 attn_masks = [None] * len(seq_lens)
@@ -627,22 +683,26 @@ def _run_sdpa_forward(
             key = key.repeat_interleave(self.num_queries_per_kv, dim=-3)
             value = value.repeat_interleave(self.num_queries_per_kv, dim=-3)
 
-        causal_attn = (attn_type == AttentionType.DECODER)
+        causal_attn = attn_type == AttentionType.DECODER
 
         seq_lens_q, seq_lens_kv = attn_metadata.get_seq_lens(attn_type)
         start_q, start_kv = 0, 0
-        for seq_len_q, seq_len_kv, mask in zip(seq_lens_q, seq_lens_kv,
-                                               attn_masks):
+        for seq_len_q, seq_len_kv, mask in zip(seq_lens_q, seq_lens_kv, attn_masks):
             end_q = start_q + seq_len_q
             end_kv = start_kv + seq_len_kv
-            sub_out = scaled_dot_product_attention(
-                query[None, :, start_q:end_q, :],
-                key[None, :, start_kv:end_kv, :],
-                value[None, :, start_kv:end_kv, :],
-                attn_mask=mask,
-                dropout_p=0.0,
-                is_causal=causal_attn and mask is None,
-                scale=self.scale).squeeze(0).movedim(query.dim() - 2, 0)
+            sub_out = (
+                scaled_dot_product_attention(
+                    query[None, :, start_q:end_q, :],
+                    key[None, :, start_kv:end_kv, :],
+                    value[None, :, start_kv:end_kv, :],
+                    attn_mask=mask,
+                    dropout_p=0.0,
+                    is_causal=causal_attn and mask is None,
+                    scale=self.scale,
+                )
+                .squeeze(0)
+                .movedim(query.dim() - 2, 0)
+            )
             output[start_q:end_q, :, :] = sub_out
             start_q, start_kv = end_q, end_kv
 
@@ -665,9 +725,11 @@ def _make_alibi_bias(
         num_heads = alibi_slopes.shape[0]
         bias = bias[None, :].repeat((num_heads, 1, 1))
         bias.mul_(alibi_slopes[:, None, None]).unsqueeze_(0)
-        inf_mask = torch.empty(
-            (1, seq_len, seq_len),
-            dtype=bias.dtype).fill_(-torch.inf).triu_(diagonal=1)
+        inf_mask = (
+            torch.empty((1, seq_len, seq_len), dtype=bias.dtype)
+            .fill_(-torch.inf)
+            .triu_(diagonal=1)
+        )
         attn_biases.append((bias + inf_mask).to(dtype))
 
     return attn_biases
@@ -696,7 +758,6 @@ def _make_sliding_window_bias(
 
 
 class _PagedAttention:
-
     @staticmethod
     def validate_head_size(head_size: int) -> tuple[bool, list[int]]:
         SUPPORT_HS = [32, 64, 80, 96, 112, 128, 192, 256]
@@ -723,8 +784,7 @@ def split_kv_cache(
         num_blocks = kv_cache.shape[1]
 
         key_cache = kv_cache[0]
-        key_cache = key_cache.view(num_blocks, num_kv_heads, head_size // x,
-                                   -1, x)
+        key_cache = key_cache.view(num_blocks, num_kv_heads, head_size // x, -1, x)
         value_cache = kv_cache[1]
         value_cache = value_cache.view(num_blocks, num_kv_heads, head_size, -1)
         return key_cache, value_cache
@@ -800,7 +860,6 @@ def forward_decode(
 
 
 class _IPEXPagedAttention(_PagedAttention):
-
     @staticmethod
     def validate_head_size(head_size: int) -> tuple[bool, list[int]]:
         return True, []
@@ -833,8 +892,8 @@ def write_to_paged_cache(
         *args,
     ) -> None:
         ipex_modules.PagedAttention.reshape_and_cache(
-            key, value, key_cache, value_cache,
-            slot_mapping.flatten().int())
+            key, value, key_cache, value_cache, slot_mapping.flatten().int()
+        )
 
     @staticmethod
     def forward_decode(
@@ -854,17 +913,30 @@ def forward_decode(
         *args,
     ) -> None:
         block_size = value_cache.shape[2]
-        head_mapping = torch.arange(
-            0,
-            num_kv_heads,
-            device="cpu",
-            dtype=torch.int32,
-        ).view(num_kv_heads,
-               1).repeat_interleave(query.size(1) // num_kv_heads).flatten()
+        head_mapping = (
+            torch.arange(
+                0,
+                num_kv_heads,
+                device="cpu",
+                dtype=torch.int32,
+            )
+            .view(num_kv_heads, 1)
+            .repeat_interleave(query.size(1) // num_kv_heads)
+            .flatten()
+        )
         ipex_modules.PagedAttention.single_query_cached_kv_attention(
-            output, query.contiguous(), key_cache, value_cache, head_mapping,
-            scale, block_tables, context_lens, block_size, max_context_len,
-            alibi_slopes)
+            output,
+            query.contiguous(),
+            key_cache,
+            value_cache,
+            head_mapping,
+            scale,
+            block_tables,
+            context_lens,
+            block_size,
+            max_context_len,
+            alibi_slopes,
+        )
 
 
 def _get_paged_attn_impl():
diff --git a/vllm/v1/attention/backends/flash_attn.py b/vllm/v1/attention/backends/flash_attn.py
index f0770f744146..bb3dcddba3e9 100755
--- a/vllm/v1/attention/backends/flash_attn.py
+++ b/vllm/v1/attention/backends/flash_attn.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Attention layer with FlashAttention."""
+
 from dataclasses import dataclass
 from typing import Optional
 
@@ -8,34 +9,43 @@
 import torch
 
 from vllm import envs
-from vllm.attention.backends.abstract import (AttentionBackend, AttentionImpl,
-                                              AttentionMetadata, AttentionType,
-                                              is_quantized_kv_cache)
+from vllm.attention.backends.abstract import (
+    AttentionBackend,
+    AttentionImpl,
+    AttentionMetadata,
+    AttentionType,
+    is_quantized_kv_cache,
+)
 from vllm.attention.layer import Attention
 from vllm.attention.ops.merge_attn_states import merge_attn_states
-from vllm.attention.utils.fa_utils import (flash_attn_supports_fp8,
-                                           get_flash_attn_version,
-                                           is_flash_attn_varlen_func_available)
+from vllm.attention.utils.fa_utils import (
+    flash_attn_supports_fp8,
+    get_flash_attn_version,
+    is_flash_attn_varlen_func_available,
+)
 
 if is_flash_attn_varlen_func_available():
-    from vllm.attention.utils.fa_utils import (flash_attn_varlen_func,
-                                               get_scheduler_metadata,
-                                               reshape_and_cache_flash)
+    from vllm.attention.utils.fa_utils import (
+        flash_attn_varlen_func,
+        get_scheduler_metadata,
+        reshape_and_cache_flash,
+    )
 
 from vllm.config import VllmConfig, get_layers_from_vllm_config
 from vllm.logger import init_logger
 from vllm.utils import cdiv
-from vllm.v1.attention.backends.utils import (AttentionCGSupport,
-                                              AttentionMetadataBuilder,
-                                              CommonAttentionMetadata,
-                                              get_kv_cache_layout)
+from vllm.v1.attention.backends.utils import (
+    AttentionCGSupport,
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+    get_kv_cache_layout,
+)
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 logger = init_logger(__name__)
 
 
 class FlashAttentionBackend(AttentionBackend):
-
     accept_output_buffer: bool = True
     supports_quant_query_input: bool = True
 
@@ -56,7 +66,8 @@ def validate_head_size(cls, head_size: int) -> None:
                 f"Head size {head_size} is not supported by {attn_type}. "
                 f"Supported head sizes are: {supported_head_sizes}. "
                 "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes.")
+                "FlexAttention backend which supports all head sizes."
+            )
 
     @staticmethod
     def get_name() -> str:
@@ -141,7 +152,8 @@ class FlashAttentionMetadata:
 
 
 def _get_sliding_window_configs(
-        vllm_config: VllmConfig) -> set[Optional[tuple[int, int]]]:
+    vllm_config: VllmConfig,
+) -> set[Optional[tuple[int, int]]]:
     """Get the set of all sliding window configs used in the model."""
     sliding_window_configs: set[Optional[tuple[int, int]]] = set()
     layers = get_layers_from_vllm_config(vllm_config, Attention)
@@ -151,8 +163,7 @@ def _get_sliding_window_configs(
     return sliding_window_configs
 
 
-class FlashAttentionMetadataBuilder(
-        AttentionMetadataBuilder[FlashAttentionMetadata]):
+class FlashAttentionMetadataBuilder(AttentionMetadataBuilder[FlashAttentionMetadata]):
     # FA3:
     # Supports full cudagraphs for all cases.
     #
@@ -171,11 +182,19 @@ class FlashAttentionMetadataBuilder(
     # to FULL_AND_PIECEWISE.
     # TODO(luka, lucas): audit FA2 as part of:
     #  https://github.com/vllm-project/vllm/issues/22945
-    cudagraph_support = AttentionCGSupport.ALWAYS \
-        if get_flash_attn_version() == 3 else AttentionCGSupport.UNIFORM_BATCH
+    cudagraph_support = (
+        AttentionCGSupport.ALWAYS
+        if get_flash_attn_version() == 3
+        else AttentionCGSupport.UNIFORM_BATCH
+    )
 
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
         super().__init__(kv_cache_spec, layer_names, vllm_config, device)
         self.model_config = vllm_config.model_config
         self.parallel_config = vllm_config.parallel_config
@@ -183,18 +202,19 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
         self.compilation_config = vllm_config.compilation_config
 
         self.num_heads_q = self.model_config.get_num_attention_heads(
-            self.parallel_config)
-        self.num_heads_kv = self.model_config.get_num_kv_heads(
-            self.parallel_config)
+            self.parallel_config
+        )
+        self.num_heads_kv = self.model_config.get_num_kv_heads(self.parallel_config)
         self.kv_cache_dtype = kv_cache_spec.dtype
         self.headdim = self.model_config.get_head_size()
         self.block_size = kv_cache_spec.block_size
 
         self.max_num_splits = 0  # No upper bound on the number of splits.
-        self.aot_schedule = (get_flash_attn_version() == 3)
+        self.aot_schedule = get_flash_attn_version() == 3
 
-        self.use_full_cuda_graph = \
+        self.use_full_cuda_graph = (
             self.compilation_config.cudagraph_mode.has_full_cudagraphs()
+        )
         self.max_cudagraph_size = self.compilation_config.max_capture_size
 
         if self.use_full_cuda_graph and self.aot_schedule:
@@ -202,8 +222,8 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
                 # This condition derives from FA3's internal heuristic.
                 # TODO(woosuk): Support larger cudagraph sizes.
                 raise ValueError(
-                    "Capture size larger than 992 is not supported for "
-                    "full cuda graph.")
+                    "Capture size larger than 992 is not supported for full cuda graph."
+                )
 
             self.scheduler_metadata = torch.zeros(
                 vllm_config.scheduler_config.max_num_seqs + 1,
@@ -213,19 +233,20 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
             # When using cuda graph, we need to set the upper bound of the
             # number of splits so that large enough intermediate buffers are
             # pre-allocated during capture.
-            self.max_num_splits = (
-                envs.VLLM_FLASH_ATTN_MAX_NUM_SPLITS_FOR_CUDA_GRAPH)
+            self.max_num_splits = envs.VLLM_FLASH_ATTN_MAX_NUM_SPLITS_FOR_CUDA_GRAPH
 
         # Sliding window size to be used with the AOT scheduler will be
         # populated on first build() call.
         self.aot_sliding_window: Optional[tuple[int, int]] = None
 
-    def build(self,
-              common_prefix_len: int,
-              common_attn_metadata: CommonAttentionMetadata,
-              fast_build: bool = False) -> FlashAttentionMetadata:
+    def build(
+        self,
+        common_prefix_len: int,
+        common_attn_metadata: CommonAttentionMetadata,
+        fast_build: bool = False,
+    ) -> FlashAttentionMetadata:
         """
-        fast_build disables AOT scheduling, used when there will be few 
+        fast_build disables AOT scheduling, used when there will be few
         iterations i.e. spec-decode
         """
         num_reqs = common_attn_metadata.num_reqs
@@ -249,8 +270,7 @@ def build(self,
             # build() call so the layers are constructed (cannot populate)
             # in __init__.
             if aot_schedule:
-                sliding_window_configs = _get_sliding_window_configs(
-                    self.vllm_config)
+                sliding_window_configs = _get_sliding_window_configs(self.vllm_config)
                 if len(sliding_window_configs) == 1:
                     sliding_window_config = sliding_window_configs.pop()
                     if sliding_window_config is not None:
@@ -260,20 +280,21 @@ def build(self,
                     aot_schedule = False
 
         max_num_splits = 0  # 0 means use FA3's heuristics, not CG compatible
-        if self.use_full_cuda_graph and \
-            num_actual_tokens <= self.max_cudagraph_size:
+        if self.use_full_cuda_graph and num_actual_tokens <= self.max_cudagraph_size:
             # NOTE(woosuk): Setting num_splits > 1 may increase the memory
             # usage, because the intermediate buffers of size [num_splits,
             # num_heads, num_tokens, head_size] are allocated. Therefore,
             # we only set num_splits when using cuda graphs.
             max_num_splits = self.max_num_splits
 
-        def schedule(batch_size, cu_query_lens, max_query_len, seqlens,
-                     max_seq_len, causal):
+        def schedule(
+            batch_size, cu_query_lens, max_query_len, seqlens, max_seq_len, causal
+        ):
             cache_dtype = self.cache_config.cache_dtype
             if cache_dtype.startswith("fp8"):
                 qkv_dtype = FlashAttentionBackend.get_fp8_dtype_for_flashattn(
-                    cache_dtype)
+                    cache_dtype
+                )
             else:
                 qkv_dtype = self.kv_cache_dtype
             if aot_schedule:
@@ -297,39 +318,44 @@ def schedule(batch_size, cu_query_lens, max_query_len, seqlens,
         use_cascade = common_prefix_len > 0
 
         if use_cascade:
-            cu_prefix_query_lens = torch.tensor([0, num_actual_tokens],
-                                                dtype=torch.int32,
-                                                device=self.device)
-            prefix_kv_lens = torch.tensor([common_prefix_len],
-                                          dtype=torch.int32,
-                                          device=self.device)
+            cu_prefix_query_lens = torch.tensor(
+                [0, num_actual_tokens], dtype=torch.int32, device=self.device
+            )
+            prefix_kv_lens = torch.tensor(
+                [common_prefix_len], dtype=torch.int32, device=self.device
+            )
             suffix_kv_lens = (seq_lens_cpu[:num_reqs] - common_prefix_len).to(
-                self.device, non_blocking=True)
+                self.device, non_blocking=True
+            )
             prefix_scheduler_metadata = schedule(
                 batch_size=1,
                 cu_query_lens=cu_prefix_query_lens,
                 max_query_len=num_actual_tokens,
                 seqlens=prefix_kv_lens,
                 max_seq_len=common_prefix_len,
-                causal=False)
-            scheduler_metadata = schedule(batch_size=num_reqs,
-                                          cu_query_lens=query_start_loc,
-                                          max_query_len=max_query_len,
-                                          seqlens=suffix_kv_lens,
-                                          max_seq_len=max_seq_len -
-                                          common_prefix_len,
-                                          causal=True)
+                causal=False,
+            )
+            scheduler_metadata = schedule(
+                batch_size=num_reqs,
+                cu_query_lens=query_start_loc,
+                max_query_len=max_query_len,
+                seqlens=suffix_kv_lens,
+                max_seq_len=max_seq_len - common_prefix_len,
+                causal=True,
+            )
         else:
             cu_prefix_query_lens = None
             prefix_kv_lens = None
             suffix_kv_lens = None
             prefix_scheduler_metadata = None
-            scheduler_metadata = schedule(batch_size=num_reqs,
-                                          cu_query_lens=query_start_loc,
-                                          max_query_len=max_query_len,
-                                          seqlens=seq_lens,
-                                          max_seq_len=max_seq_len,
-                                          causal=causal)
+            scheduler_metadata = schedule(
+                batch_size=num_reqs,
+                cu_query_lens=query_start_loc,
+                max_query_len=max_query_len,
+                seqlens=seq_lens,
+                max_seq_len=max_seq_len,
+                causal=causal,
+            )
         # For FA3 + full cudagraph
         if self.use_full_cuda_graph and scheduler_metadata is not None:
             n = scheduler_metadata.shape[0]
@@ -357,7 +383,8 @@ def schedule(batch_size, cu_query_lens, max_query_len, seqlens,
             suffix_kv_lens=suffix_kv_lens,
             prefix_scheduler_metadata=prefix_scheduler_metadata,
             max_num_splits=max_num_splits,
-            causal=causal)
+            causal=causal,
+        )
         return attn_metadata
 
     def use_cascade_attention(self, *args, **kwargs) -> bool:
@@ -365,7 +392,6 @@ def use_cascade_attention(self, *args, **kwargs) -> bool:
 
 
 class FlashAttentionImpl(AttentionImpl):
-
     def __init__(
         self,
         num_heads: int,
@@ -406,18 +432,20 @@ def __init__(
 
         self.attn_type = attn_type
         self.vllm_flash_attn_version = get_flash_attn_version()
-        if is_quantized_kv_cache(self.kv_cache_dtype) \
-            and not flash_attn_supports_fp8():
+        if is_quantized_kv_cache(self.kv_cache_dtype) and not flash_attn_supports_fp8():
             raise NotImplementedError(
-                "FlashAttention does not support fp8 kv-cache on this device.")
+                "FlashAttention does not support fp8 kv-cache on this device."
+            )
 
         self.sinks = sinks
         if self.sinks is not None:
             assert self.vllm_flash_attn_version == 3, (
-                "Sinks are only supported in FlashAttention 3")
+                "Sinks are only supported in FlashAttention 3"
+            )
             assert self.sinks.shape[0] == num_heads, (
                 "Sinks must have the same number of heads as the number of "
-                "heads in the layer")
+                "heads in the layer"
+            )
 
     def forward(
         self,
@@ -450,8 +478,8 @@ def forward(
 
         if output_scale is not None or output_block_scale is not None:
             raise NotImplementedError(
-                "fused output quantization is not yet supported"
-                " for FlashAttentionImpl")
+                "fused output quantization is not yet supported for FlashAttentionImpl"
+            )
 
         if attn_metadata is None:
             # Profiling run.
@@ -474,11 +502,14 @@ def forward(
         if attn_type in (AttentionType.ENCODER_ONLY, AttentionType.ENCODER):
             # For encoder attention,
             # we use direct Q, K, V tensors without caching
-            return self._forward_encoder_attention(query[:num_actual_tokens],
-                                                   key[:num_actual_tokens],
-                                                   value[:num_actual_tokens],
-                                                   output[:num_actual_tokens],
-                                                   attn_metadata, layer)
+            return self._forward_encoder_attention(
+                query[:num_actual_tokens],
+                key[:num_actual_tokens],
+                value[:num_actual_tokens],
+                output[:num_actual_tokens],
+                attn_metadata,
+                layer,
+            )
 
         # For decoder and cross-attention, use KV cache as before
         key_cache, value_cache = kv_cache.unbind(0)
@@ -486,8 +517,11 @@ def forward(
         # key and value may be None in the case of cross attention. They are
         # calculated once based on the output from the encoder and then cached
         # in KV cache.
-        if (self.kv_sharing_target_layer_name is None and key is not None
-                and value is not None):
+        if (
+            self.kv_sharing_target_layer_name is None
+            and key is not None
+            and value is not None
+        ):
             # Reshape the input keys and values and store them in the cache.
             # Skip this if sharing KV cache with an earlier attention layer.
             # NOTE(woosuk): Here, key and value are padded while slot_mapping is
@@ -509,7 +543,8 @@ def forward(
         if self.kv_cache_dtype.startswith("fp8"):
             # queries are quantized in the attention layer
             dtype = FlashAttentionBackend.get_fp8_dtype_for_flashattn(
-                self.kv_cache_dtype)
+                self.kv_cache_dtype
+            )
             key_cache = key_cache.view(dtype)
             value_cache = value_cache.view(dtype)
 
@@ -597,7 +632,8 @@ def _forward_encoder_attention(
         # For encoder attention, process FP8 quantization if needed
         if self.kv_cache_dtype.startswith("fp8"):
             raise NotImplementedError(
-                "quantization is not supported for encoder attention")
+                "quantization is not supported for encoder attention"
+            )
 
         # Use encoder-specific metadata for sequence information
         cu_seqlens_q = attn_metadata.query_start_loc
@@ -607,7 +643,8 @@ def _forward_encoder_attention(
 
         descale_shape = (
             cu_seqlens_q.shape[0] - 1,  # type: ignore[union-attr]
-            self.num_kv_heads)
+            self.num_kv_heads,
+        )
 
         # Call flash attention directly on Q, K, V tensors
         flash_attn_varlen_func(
@@ -670,8 +707,12 @@ def use_cascade_attention(
     num_queries_per_kv = num_query_heads // num_kv_heads
     # The criteria for using FlashDecoding can be found in the following link:
     # https://github.com/vllm-project/flash-attention/blob/96266b1111111f3d11aabefaf3bacbab6a89d03c/csrc/flash_attn/flash_api.cpp#L535
-    use_flash_decoding = (num_queries_per_kv > 1 and not use_sliding_window
-                          and not use_alibi and np.all(query_lens == 1))
+    use_flash_decoding = (
+        num_queries_per_kv > 1
+        and not use_sliding_window
+        and not use_alibi
+        and np.all(query_lens == 1)
+    )
     if not use_flash_decoding:
         # Use cascade attention.
         return True
@@ -693,8 +734,9 @@ def use_cascade_attention(
     cascade_waves = cdiv(cascade_ctas, num_sms)
     cascade_time = cascade_waves * num_prefix_tiles
 
-    flash_decoding_ctas = (num_reqs * num_kv_heads *
-                           cdiv(num_queries_per_kv, q_tile_size))
+    flash_decoding_ctas = (
+        num_reqs * num_kv_heads * cdiv(num_queries_per_kv, q_tile_size)
+    )
     flash_decoding_ctas *= num_prefix_tiles
     flash_decoding_time = cdiv(flash_decoding_ctas, num_sms)
 
@@ -726,10 +768,11 @@ def cascade_attention(
     k_descale: Optional[torch.Tensor] = None,
     v_descale: Optional[torch.Tensor] = None,
 ) -> torch.Tensor:
-    assert alibi_slopes is None, ("Cascade attention does not support ALiBi.")
+    assert alibi_slopes is None, "Cascade attention does not support ALiBi."
     # TODO: Support sliding window.
     assert sliding_window == (-1, -1), (
-        "Cascade attention does not support sliding window.")
+        "Cascade attention does not support sliding window."
+    )
 
     num_tokens = query.shape[0]
     block_size = key_cache.shape[-3]
@@ -755,12 +798,9 @@ def cascade_attention(
         return_softmax_lse=True,
         scheduler_metadata=prefix_scheduler_metadata,
         fa_version=fa_version,
-        q_descale=q_descale.expand(descale_shape)
-        if q_descale is not None else None,
-        k_descale=k_descale.expand(descale_shape)
-        if k_descale is not None else None,
-        v_descale=v_descale.expand(descale_shape)
-        if v_descale is not None else None,
+        q_descale=q_descale.expand(descale_shape) if q_descale is not None else None,
+        k_descale=k_descale.expand(descale_shape) if k_descale is not None else None,
+        v_descale=v_descale.expand(descale_shape) if v_descale is not None else None,
     )
 
     descale_shape = (cu_query_lens.shape[0] - 1, key_cache.shape[-2])
@@ -782,14 +822,10 @@ def cascade_attention(
         return_softmax_lse=True,
         scheduler_metadata=suffix_scheduler_metadata,
         fa_version=fa_version,
-        q_descale=q_descale.expand(descale_shape)
-        if q_descale is not None else None,
-        k_descale=k_descale.expand(descale_shape)
-        if k_descale is not None else None,
-        v_descale=v_descale.expand(descale_shape)
-        if v_descale is not None else None,
+        q_descale=q_descale.expand(descale_shape) if q_descale is not None else None,
+        k_descale=k_descale.expand(descale_shape) if k_descale is not None else None,
+        v_descale=v_descale.expand(descale_shape) if v_descale is not None else None,
     )
 
     # Merge prefix and suffix outputs, and store the result in output.
-    merge_attn_states(output, prefix_output, prefix_lse, suffix_output,
-                      suffix_lse)
+    merge_attn_states(output, prefix_output, prefix_lse, suffix_output, suffix_lse)
diff --git a/vllm/v1/attention/backends/flashinfer.py b/vllm/v1/attention/backends/flashinfer.py
index 15a252734d4d..1c05a17db840 100755
--- a/vllm/v1/attention/backends/flashinfer.py
+++ b/vllm/v1/attention/backends/flashinfer.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Attention layer with FlashInfer."""
+
 from __future__ import annotations
 
 from dataclasses import dataclass
@@ -8,36 +9,50 @@
 
 import numpy as np
 import torch
-from flashinfer import (BatchDecodeWithPagedKVCacheWrapper,
-                        BatchPrefillWithPagedKVCacheWrapper,
-                        MultiLevelCascadeAttentionWrapper)
+from flashinfer import (
+    BatchDecodeWithPagedKVCacheWrapper,
+    BatchPrefillWithPagedKVCacheWrapper,
+    MultiLevelCascadeAttentionWrapper,
+)
 from flashinfer.decode import _get_range_buf, trtllm_batch_decode_with_kv_cache
 from flashinfer.prefill import trtllm_batch_context_with_kv_cache
 from flashinfer.utils import FP4Tensor
 
 from vllm import _custom_ops as ops
-from vllm.attention.backends.abstract import (AttentionBackend, AttentionImpl,
-                                              AttentionType)
+from vllm.attention.backends.abstract import (
+    AttentionBackend,
+    AttentionImpl,
+    AttentionType,
+)
 from vllm.config import CUDAGraphMode, VllmConfig
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    QuantKey, kFp8StaticTensorSym, kNvfp4Quant)
+    QuantKey,
+    kFp8StaticTensorSym,
+    kNvfp4Quant,
+)
 from vllm.platforms import current_platform
 from vllm.triton_utils import tl, triton
 from vllm.utils import cdiv, is_pin_memory_available
-from vllm.utils.flashinfer import (can_use_trtllm_attention,
-                                   flashinfer_disable_q_quantization,
-                                   supports_trtllm_attention,
-                                   use_trtllm_attention)
+from vllm.utils.flashinfer import (
+    can_use_trtllm_attention,
+    flashinfer_disable_q_quantization,
+    supports_trtllm_attention,
+    use_trtllm_attention,
+)
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.v1.attention.backends.utils import (AttentionCGSupport,
-                                              AttentionMetadataBuilder,
-                                              CommonAttentionMetadata,
-                                              get_kv_cache_layout,
-                                              get_per_layer_parameters,
-                                              infer_global_hyperparameters,
-                                              split_decodes_and_prefills)
+from vllm.v1.attention.backends.utils import (
+    AttentionCGSupport,
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+    get_kv_cache_layout,
+    get_per_layer_parameters,
+    infer_global_hyperparameters,
+    split_decodes_and_prefills,
+)
+
 # yapf: enable
 from vllm.v1.kv_cache_interface import AttentionSpec
 
@@ -55,7 +70,8 @@ def _get_trtllm_gen_workspace_buffer():
     global trtllm_gen_workspace_buffer
     if trtllm_gen_workspace_buffer is None:
         trtllm_gen_workspace_buffer = torch.zeros(
-            FLASHINFER_WORKSPACE_BUFFER_SIZE, dtype=torch.uint8, device='cuda')
+            FLASHINFER_WORKSPACE_BUFFER_SIZE, dtype=torch.uint8, device="cuda"
+        )
     return trtllm_gen_workspace_buffer
 
 
@@ -72,9 +88,9 @@ def _trtllm_prefill_attn_kvfp8_dequant(
 ):
     batch_idx = tl.program_id(0).to(tl.int64)
     mock_block_table_idx = tl.program_id(1).to(tl.int64)
-    orig_page_num = tl.load(block_tables_prefill_ptr +
-                            batch_idx * block_table_stride +
-                            mock_block_table_idx).to(tl.int64)
+    orig_page_num = tl.load(
+        block_tables_prefill_ptr + batch_idx * block_table_stride + mock_block_table_idx
+    ).to(tl.int64)
     if orig_page_num <= 0:
         return
     dequant_dtype = mock_kv_cache_ptr.dtype.element_ty
@@ -84,20 +100,24 @@ def _trtllm_prefill_attn_kvfp8_dequant(
     offset = orig_page_num * KV_CACHE_STRIDE + tl.arange(0, K_CACHE_STRIDE)
     fp8_vals = tl.load(kv_cache_ptr + offset)
     dequantized_vals = fp8_vals.to(tl.float32) * k_scale_val
-    mock_cache_offset = (batch_idx * block_table_stride + mock_block_table_idx
-                         + 1) * KV_CACHE_STRIDE + tl.arange(0, K_CACHE_STRIDE)
+    mock_cache_offset = (
+        batch_idx * block_table_stride + mock_block_table_idx + 1
+    ) * KV_CACHE_STRIDE + tl.arange(0, K_CACHE_STRIDE)
     dequantized_vals = dequantized_vals.to(dequant_dtype)
     tl.store(mock_kv_cache_ptr + mock_cache_offset, dequantized_vals)
 
     # Dequantize V
     v_scale_val = tl.load(v_scale_ptr)
-    offset = (orig_page_num * KV_CACHE_STRIDE + K_CACHE_STRIDE +
-              tl.arange(0, K_CACHE_STRIDE))
+    offset = (
+        orig_page_num * KV_CACHE_STRIDE + K_CACHE_STRIDE + tl.arange(0, K_CACHE_STRIDE)
+    )
     fp8_vals = tl.load(kv_cache_ptr + offset)
     dequantized_vals = fp8_vals.to(tl.float32) * v_scale_val
     mock_cache_offset = (
-        (batch_idx * block_table_stride + mock_block_table_idx + 1) *
-        KV_CACHE_STRIDE + K_CACHE_STRIDE + tl.arange(0, K_CACHE_STRIDE))
+        (batch_idx * block_table_stride + mock_block_table_idx + 1) * KV_CACHE_STRIDE
+        + K_CACHE_STRIDE
+        + tl.arange(0, K_CACHE_STRIDE)
+    )
     dequantized_vals = dequantized_vals.to(dequant_dtype)
     tl.store(mock_kv_cache_ptr + mock_cache_offset, dequantized_vals)
 
@@ -117,9 +137,7 @@ def trtllm_prefill_attn_kvfp8_dequant(
     kv_cache_stride = k_cache_stride * s[1]
     new_s = (batch_size * num_of_page_per_token + 1, s[1], s[2], s[3], s[4])
     # mock kv cache contains just the pages needed by this prefill
-    mock_kv_cache = torch.empty(new_s,
-                                dtype=dequant_dtype,
-                                device=kv_cache.device)
+    mock_kv_cache = torch.empty(new_s, dtype=dequant_dtype, device=kv_cache.device)
     # we simply sequentially index the pages needed by this prefill
     mock_block_table = torch.arange(
         start=1,
@@ -162,7 +180,8 @@ def validate_head_size(cls, head_size: int) -> None:
                 f"Head size {head_size} is not supported by {attn_type}. "
                 f"Supported head sizes are: {supported_head_sizes}. "
                 "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes.")
+                "FlexAttention backend which supports all head sizes."
+            )
 
     @staticmethod
     def get_name() -> str:
@@ -249,13 +268,19 @@ class FlashInferMetadata:
 
 
 class FlashInferMetadataBuilder(AttentionMetadataBuilder[FlashInferMetadata]):
-    cudagraph_support: ClassVar[AttentionCGSupport] = \
+    cudagraph_support: ClassVar[AttentionCGSupport] = (
         AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
+    )
 
     reorder_batch_threshold: int = 1
 
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
         super().__init__(kv_cache_spec, layer_names, vllm_config, device)
         self.cache_config = vllm_config.cache_config
         self.model_config = vllm_config.model_config
@@ -264,22 +289,27 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
         self._decode_wrapper = None  # Wrapper for decode (general shape)
 
         self.compilation_config = vllm_config.compilation_config
-        max_num_pages_per_req = cdiv(self.model_config.max_model_len,
-                                     self.kv_cache_spec.block_size)
+        max_num_pages_per_req = cdiv(
+            self.model_config.max_model_len, self.kv_cache_spec.block_size
+        )
         max_num_reqs = vllm_config.scheduler_config.max_num_seqs
         max_num_pages = max_num_reqs * max_num_pages_per_req
-        self.enable_cuda_graph = (self.compilation_config.cudagraph_mode.\
-            decode_mode() == CUDAGraphMode.FULL)
+        self.enable_cuda_graph = (
+            self.compilation_config.cudagraph_mode.decode_mode() == CUDAGraphMode.FULL
+        )
         if self.enable_cuda_graph:
             # For full cudagraph capture, one `decode_wrapper` for each batch
             # size is needed for FlashInfer.
             self._decode_wrappers_cudagraph: dict[
-                int, BatchDecodeWithPagedKVCacheWrapper] = {}
+                int, BatchDecodeWithPagedKVCacheWrapper
+            ] = {}
             self._decode_cudagraph_max_bs = min(
-                max_num_reqs, self.compilation_config.max_capture_size)
+                max_num_reqs, self.compilation_config.max_capture_size
+            )
 
         self.num_qo_heads = self.model_config.get_num_attention_heads(
-            self.vllm_config.parallel_config)
+            self.vllm_config.parallel_config
+        )
         self.num_kv_heads = self.kv_cache_spec.num_kv_heads
         self.head_dim = self.kv_cache_spec.head_size
         FlashInferBackend.validate_head_size(self.head_dim)
@@ -287,9 +317,9 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
 
         self.cache_dtype = self.cache_config.cache_dtype
         if self.cache_dtype.startswith("fp8"):
-            self.kv_cache_dtype = (
-                FlashInferBackend.get_fp8_dtype_for_flashinfer(
-                    self.cache_dtype))
+            self.kv_cache_dtype = FlashInferBackend.get_fp8_dtype_for_flashinfer(
+                self.cache_dtype
+            )
         else:
             assert self.kv_cache_spec.dtype == self.model_config.dtype
             self.kv_cache_dtype = self.kv_cache_spec.dtype
@@ -298,14 +328,14 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
         # VLLM_FLASHINFER_DISABLE_Q_QUANTIZATION is set to 1. Otherwise, try to
         # use fp8 q if kv cache is fp8, and will fall back to model dtype
         # if TRTLLM attention kernel is not used when building attn metadata
-        if supports_trtllm_attention() and \
-            not flashinfer_disable_q_quantization():
+        if supports_trtllm_attention() and not flashinfer_disable_q_quantization():
             self.q_data_type = self.kv_cache_dtype
         else:
             self.q_data_type = self.model_config.dtype
 
-        supports_spec_as_decode = \
-            can_use_trtllm_attention(self.num_qo_heads, self.num_kv_heads)
+        supports_spec_as_decode = can_use_trtllm_attention(
+            self.num_qo_heads, self.num_kv_heads
+        )
         self._init_reorder_batch_threshold(1, supports_spec_as_decode)
 
         self._cascade_wrapper = None  # Wrapper for cascade attention
@@ -313,7 +343,8 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
         # Global hyperparameters shared by all attention layers
         # TODO: discard this for trtllm-gen backend
         self.global_hyperparameters = infer_global_hyperparameters(
-            get_per_layer_parameters(vllm_config, layer_names, FlashInferImpl))
+            get_per_layer_parameters(vllm_config, layer_names, FlashInferImpl)
+        )
         self.sm_scale = self.global_hyperparameters.sm_scale
         self.window_left = self.global_hyperparameters.window_left
         self.logits_soft_cap = self.global_hyperparameters.logits_soft_cap
@@ -322,67 +353,62 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
             raise NotImplementedError(
                 "FlashInfer backend currently does not support attention "
                 "sinks, please use trtllm on blackwell or flash attention on "
-                "earlier GPUs.")
+                "earlier GPUs."
+            )
         # Preparing persistent buffers (device-side)
-        self.paged_kv_indptr = torch.zeros(max_num_reqs + 1,
-                                           dtype=torch.int32,
-                                           device=self.device)
+        self.paged_kv_indptr = torch.zeros(
+            max_num_reqs + 1, dtype=torch.int32, device=self.device
+        )
         self.paged_kv_indices = torch.zeros(
             max_num_pages,  # max num pages possible
             dtype=torch.int32,
-            device=self.device)
-        self.paged_kv_last_page_len = torch.zeros(max_num_reqs,
-                                                  dtype=torch.int32,
-                                                  device=self.device)
+            device=self.device,
+        )
+        self.paged_kv_last_page_len = torch.zeros(
+            max_num_reqs, dtype=torch.int32, device=self.device
+        )
         # host-side buffer
         pin_memory = is_pin_memory_available()
-        self.paged_kv_indptr_cpu = torch.zeros(max_num_reqs + 1,
-                                               dtype=torch.int32,
-                                               device="cpu",
-                                               pin_memory=pin_memory)
+        self.paged_kv_indptr_cpu = torch.zeros(
+            max_num_reqs + 1, dtype=torch.int32, device="cpu", pin_memory=pin_memory
+        )
         self.paged_kv_indptr_np = self.paged_kv_indptr_cpu.numpy()
         self.paged_kv_indptr_buffer = torch.zeros_like(
-            self.paged_kv_indptr_cpu, pin_memory=pin_memory)
-        self.paged_kv_indices_cpu = torch.zeros(max_num_pages,
-                                                dtype=torch.int32,
-                                                device="cpu",
-                                                pin_memory=pin_memory)
-        self.paged_kv_last_page_len_cpu = torch.zeros(max_num_reqs,
-                                                      dtype=torch.int32,
-                                                      device="cpu",
-                                                      pin_memory=pin_memory)
-        self.paged_kv_last_page_len_np = (
-            self.paged_kv_last_page_len_cpu.numpy())
+            self.paged_kv_indptr_cpu, pin_memory=pin_memory
+        )
+        self.paged_kv_indices_cpu = torch.zeros(
+            max_num_pages, dtype=torch.int32, device="cpu", pin_memory=pin_memory
+        )
+        self.paged_kv_last_page_len_cpu = torch.zeros(
+            max_num_reqs, dtype=torch.int32, device="cpu", pin_memory=pin_memory
+        )
+        self.paged_kv_last_page_len_np = self.paged_kv_last_page_len_cpu.numpy()
 
     def _get_workspace_buffer(self):
         if self._workspace_buffer is None:
             self._workspace_buffer = torch.zeros(
-                FLASHINFER_WORKSPACE_BUFFER_SIZE,
-                dtype=torch.uint8,
-                device=self.device)
+                FLASHINFER_WORKSPACE_BUFFER_SIZE, dtype=torch.uint8, device=self.device
+            )
         return self._workspace_buffer
 
     def _get_prefill_wrapper(self):
         if self._prefill_wrapper is None:
             self._prefill_wrapper = BatchPrefillWithPagedKVCacheWrapper(
-                self._get_workspace_buffer(), get_kv_cache_layout())
+                self._get_workspace_buffer(), get_kv_cache_layout()
+            )
         return self._prefill_wrapper
 
-    def _get_decode_wrapper(self,
-                            batch_size: int,
-                            use_cudagraph: bool = False):
+    def _get_decode_wrapper(self, batch_size: int, use_cudagraph: bool = False):
         if use_cudagraph:
-            decode_wrapper = self._decode_wrappers_cudagraph.get(
-                batch_size, None)
+            decode_wrapper = self._decode_wrappers_cudagraph.get(batch_size, None)
         else:
             decode_wrapper = self._decode_wrapper
 
         if decode_wrapper is None:
             if use_cudagraph:
-                paged_kv_indptr = self.paged_kv_indptr[:batch_size + 1]
+                paged_kv_indptr = self.paged_kv_indptr[: batch_size + 1]
                 paged_kv_indices = self.paged_kv_indices
-                paged_kv_last_page_len = self.paged_kv_last_page_len[:
-                                                                     batch_size]
+                paged_kv_last_page_len = self.paged_kv_last_page_len[:batch_size]
             else:
                 paged_kv_indptr = None
                 paged_kv_indices = None
@@ -411,19 +437,25 @@ def _get_decode_wrapper(self,
     def _get_cascade_wrapper(self):
         if self._cascade_wrapper is None:
             self._cascade_wrapper = MultiLevelCascadeAttentionWrapper(
-                2, self._get_workspace_buffer(), get_kv_cache_layout())
+                2, self._get_workspace_buffer(), get_kv_cache_layout()
+            )
         return self._cascade_wrapper
 
-    def build(self,
-              common_prefix_len: int,
-              common_attn_metadata: CommonAttentionMetadata,
-              fast_build: bool = False) -> FlashInferMetadata:
+    def build(
+        self,
+        common_prefix_len: int,
+        common_attn_metadata: CommonAttentionMetadata,
+        fast_build: bool = False,
+    ) -> FlashInferMetadata:
         num_reqs = common_attn_metadata.num_reqs
         num_actual_tokens = common_attn_metadata.num_actual_tokens
-        num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens =\
-            split_decodes_and_prefills(common_attn_metadata,
-                                       decode_threshold=self.reorder_batch_threshold,
-                                       require_uniform=True)
+        num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
+            split_decodes_and_prefills(
+                common_attn_metadata,
+                decode_threshold=self.reorder_batch_threshold,
+                require_uniform=True,
+            )
+        )
 
         page_size = self.page_size
         max_q_len = common_attn_metadata.max_query_len
@@ -442,17 +474,16 @@ def build(self,
             num_common_kv_blocks = common_prefix_len // page_size
 
             # Create CPU versions directly for cascade (no GPU versions needed)
-            shared_qo_indptr_cpu = torch.tensor([0, num_actual_tokens],
-                                                dtype=torch.int32,
-                                                device='cpu')
-            shared_kv_page_indptr_cpu = torch.tensor([0, num_common_kv_blocks],
-                                                     dtype=torch.int32,
-                                                     device='cpu')
-            shared_kv_page_indices_cpu = block_table_tensor[
-                0, :num_common_kv_blocks]
-            shared_kv_last_page_len_cpu = torch.tensor([page_size],
-                                                       dtype=torch.int32,
-                                                       device='cpu')
+            shared_qo_indptr_cpu = torch.tensor(
+                [0, num_actual_tokens], dtype=torch.int32, device="cpu"
+            )
+            shared_kv_page_indptr_cpu = torch.tensor(
+                [0, num_common_kv_blocks], dtype=torch.int32, device="cpu"
+            )
+            shared_kv_page_indices_cpu = block_table_tensor[0, :num_common_kv_blocks]
+            shared_kv_last_page_len_cpu = torch.tensor(
+                [page_size], dtype=torch.int32, device="cpu"
+            )
 
             # Remove the blocks of the shared prefix from all requests.
             block_table_tensor = block_table_tensor[:, num_common_kv_blocks:]
@@ -467,22 +498,23 @@ def build(self,
         np.cumsum(
             num_blocks_np,
             dtype=np.int32,
-            out=self.paged_kv_indptr_np[1:num_reqs + 1],
+            out=self.paged_kv_indptr_np[1 : num_reqs + 1],
         )
         # NOTE(woosuk): Because self.paged_kv_indptr_cpu can be modified
         # after this line (e.g., for cuda graphs), we need to copy the data to
         # self.paged_kv_indptr_buffer to avoid race condition.
-        self.paged_kv_indptr_buffer[:num_reqs +
-                                    1] = (self.paged_kv_indptr_cpu[:num_reqs +
-                                                                   1])
-        paged_kv_indptr = self.paged_kv_indptr[:num_reqs + 1]
-        paged_kv_indptr.copy_(self.paged_kv_indptr_buffer[:num_reqs + 1],
-                              non_blocking=True)
+        self.paged_kv_indptr_buffer[: num_reqs + 1] = self.paged_kv_indptr_cpu[
+            : num_reqs + 1
+        ]
+        paged_kv_indptr = self.paged_kv_indptr[: num_reqs + 1]
+        paged_kv_indptr.copy_(
+            self.paged_kv_indptr_buffer[: num_reqs + 1], non_blocking=True
+        )
 
         # write self.paged_kv_indices inplace
         num_actual_pages = self.paged_kv_indptr_np[num_reqs]
         paged_kv_indices = self.paged_kv_indices[:num_actual_pages]
-        _copy_page_indices_kernel[(num_reqs, )](
+        _copy_page_indices_kernel[(num_reqs,)](
             paged_kv_indices,
             block_table_tensor,
             block_table_tensor.stride(0),
@@ -499,29 +531,34 @@ def build(self,
         )
 
         uses_spec_reorder = self.reorder_batch_threshold > 1
-        prefill_use_trtllm = use_trtllm_attention(self.num_qo_heads,
-                                                  self.num_kv_heads,
-                                                  num_prefill_tokens,
-                                                  max_seq_len,
-                                                  self.cache_dtype,
-                                                  self.q_data_type,
-                                                  is_prefill=True,
-                                                  has_sinks=self.has_sinks,
-                                                  has_spec=uses_spec_reorder)
-        decode_use_trtllm = use_trtllm_attention(self.num_qo_heads,
-                                                 self.num_kv_heads,
-                                                 num_decode_tokens,
-                                                 max_seq_len,
-                                                 self.cache_dtype,
-                                                 self.q_data_type,
-                                                 is_prefill=False,
-                                                 has_sinks=self.has_sinks,
-                                                 has_spec=uses_spec_reorder)
+        prefill_use_trtllm = use_trtllm_attention(
+            self.num_qo_heads,
+            self.num_kv_heads,
+            num_prefill_tokens,
+            max_seq_len,
+            self.cache_dtype,
+            self.q_data_type,
+            is_prefill=True,
+            has_sinks=self.has_sinks,
+            has_spec=uses_spec_reorder,
+        )
+        decode_use_trtllm = use_trtllm_attention(
+            self.num_qo_heads,
+            self.num_kv_heads,
+            num_decode_tokens,
+            max_seq_len,
+            self.cache_dtype,
+            self.q_data_type,
+            is_prefill=False,
+            has_sinks=self.has_sinks,
+            has_spec=uses_spec_reorder,
+        )
         if self.has_sinks and not (prefill_use_trtllm and decode_use_trtllm):
             raise NotImplementedError(
                 "FlashInfer backend currently does not support attention "
                 "sinks, please use trtllm on blackwell or flash attention on "
-                "earlier GPUs.")
+                "earlier GPUs."
+            )
 
         # If TRTLLM attention is not used, the q quantization is not supported.
         # Fall back to use model dtype.
@@ -547,7 +584,7 @@ def build(self,
         )
 
         qo_indptr_cpu = common_attn_metadata.query_start_loc_cpu
-        paged_kv_indptr_cpu = self.paged_kv_indptr_cpu[:1 + num_reqs]
+        paged_kv_indptr_cpu = self.paged_kv_indptr_cpu[: 1 + num_reqs]
         paged_kv_last_page_len_cpu = self.paged_kv_last_page_len_cpu[:num_reqs]
 
         if attn_metadata.use_cascade:
@@ -578,17 +615,17 @@ def build(self,
                 # Decodes are first so prefills start after the last decode
                 prefill_start = num_decodes
                 attn_metadata.prefill_wrapper = self._get_prefill_wrapper()
-                assert qo_indptr_cpu[prefill_start:].shape[
-                    0] == num_prefills + 1
-                assert paged_kv_indptr_cpu[prefill_start:].shape[
-                    0] == num_prefills + 1
-                assert paged_kv_last_page_len_cpu[prefill_start:].shape[
-                    0] == num_prefills
+                assert qo_indptr_cpu[prefill_start:].shape[0] == num_prefills + 1
+                assert paged_kv_indptr_cpu[prefill_start:].shape[0] == num_prefills + 1
+                assert (
+                    paged_kv_last_page_len_cpu[prefill_start:].shape[0] == num_prefills
+                )
                 # Since prefill_wrapper.run() will be called with
                 # query[num_decode_tokens:] we need to adjust the qo_indptr
                 # to be relative to the start of the prefill queries.
-                qo_indptr_cpu = qo_indptr_cpu[prefill_start:] - qo_indptr_cpu[
-                    prefill_start]
+                qo_indptr_cpu = (
+                    qo_indptr_cpu[prefill_start:] - qo_indptr_cpu[prefill_start]
+                )
                 paged_kv_indptr_cpu = paged_kv_indptr_cpu[prefill_start:]
 
                 # Recompute max_q_len for the slice of requests we are using
@@ -596,8 +633,7 @@ def build(self,
                 # we have a non-uniform batch with some short decodes offloaded
                 # to the prefill pathway
                 query_lens_prefill = qo_indptr_cpu[1:] - qo_indptr_cpu[:-1]
-                attn_metadata.max_q_len_prefill = \
-                    int(query_lens_prefill.max().item())
+                attn_metadata.max_q_len_prefill = int(query_lens_prefill.max().item())
 
                 if not attn_metadata.prefill_use_trtllm:
                     attn_metadata.prefill_wrapper.plan(
@@ -618,42 +654,50 @@ def build(self,
                     )
                 else:
                     attn_metadata.qo_indptr_gpu = qo_indptr_cpu.to(
-                        self.device, non_blocking=True)
+                        self.device, non_blocking=True
+                    )
                     attn_metadata.paged_kv_indptr_gpu = paged_kv_indptr_cpu.to(
-                        self.device, non_blocking=True)
+                        self.device, non_blocking=True
+                    )
 
             if num_decodes > 0:
                 pure_decode = num_prefills == 0
                 # possible required padding for cudagraph replay
-                use_cudagraph = (self.enable_cuda_graph and pure_decode and
-                                 num_decodes <= self._decode_cudagraph_max_bs)
+                use_cudagraph = (
+                    self.enable_cuda_graph
+                    and pure_decode
+                    and num_decodes <= self._decode_cudagraph_max_bs
+                )
                 if use_cudagraph:
-                    num_input_tokens = (
-                        self.vllm_config.pad_for_cudagraph(num_decode_tokens))
+                    num_input_tokens = self.vllm_config.pad_for_cudagraph(
+                        num_decode_tokens
+                    )
                     # Carefully fulfill the padding region with reasonable value
                     # on cpu.
                     # Make sure paged_kv_indptr_cpu is not decreasing
-                    self.paged_kv_indptr_cpu[1 + num_decodes:1 +
-                                             num_input_tokens].fill_(
-                                                 paged_kv_indptr_cpu[-1])
+                    self.paged_kv_indptr_cpu[
+                        1 + num_decodes : 1 + num_input_tokens
+                    ].fill_(paged_kv_indptr_cpu[-1])
                     # Fill the remaining paged_kv_last_page_len_cpu with 1.
                     # This is because flashinfer treats 0 as a full page
                     # instead of empty.
-                    self.paged_kv_last_page_len_cpu[
-                        num_decodes:num_input_tokens].fill_(1)
+                    self.paged_kv_last_page_len_cpu[num_decodes:num_input_tokens].fill_(
+                        1
+                    )
 
                 else:
                     num_input_tokens = num_decode_tokens
 
                 attn_metadata.decode_wrapper = self._get_decode_wrapper(
-                    num_input_tokens, use_cudagraph)
+                    num_input_tokens, use_cudagraph
+                )
                 if not attn_metadata.decode_use_trtllm:
                     # Use the persistent buffer with padding length,
                     # instead of the same address but chunked version
                     # in atten_metadata when using cudagraph.
                     fast_plan_decode(
                         attn_metadata.decode_wrapper,
-                        self.paged_kv_indptr_cpu[:num_input_tokens + 1],
+                        self.paged_kv_indptr_cpu[: num_input_tokens + 1],
                         paged_kv_indices,
                         self.paged_kv_last_page_len_cpu[:num_input_tokens],
                         seq_lens_cpu[:num_input_tokens],
@@ -682,7 +726,6 @@ def use_cascade_attention(self, *args, **kwargs) -> bool:
 
 
 class FlashInferImpl(AttentionImpl):
-
     def __init__(
         self,
         num_heads: int,
@@ -708,8 +751,9 @@ def __init__(
             self.sliding_window = (-1, -1)
         else:
             self.sliding_window = (sliding_window - 1, 0)
-        self.window_left = (self.sliding_window[0]
-                            if self.sliding_window is not None else -1)
+        self.window_left = (
+            self.sliding_window[0] if self.sliding_window is not None else -1
+        )
         self.kv_cache_dtype = kv_cache_dtype
         self.logits_soft_cap = logits_soft_cap
         self.kv_sharing_target_layer_name = kv_sharing_target_layer_name
@@ -717,10 +761,12 @@ def __init__(
         self.num_queries_per_kv = self.num_heads // self.num_kv_heads
 
         if attn_type != AttentionType.DECODER:
-            raise NotImplementedError("Encoder self-attention and "
-                                      "encoder/decoder cross-attention "
-                                      "are not implemented for "
-                                      "FlashInferImpl")
+            raise NotImplementedError(
+                "Encoder self-attention and "
+                "encoder/decoder cross-attention "
+                "are not implemented for "
+                "FlashInferImpl"
+            )
 
         self.sinks: Optional[torch.Tensor] = None
         if sinks is not None:
@@ -728,19 +774,23 @@ def __init__(
                 raise ValueError(
                     "Sinks must have the same number of heads as the number of "
                     f"heads in the layer. Expected {num_heads}, but got "
-                    f"{sinks.shape[0]}.")
+                    f"{sinks.shape[0]}."
+                )
             self.sinks = sinks
 
-        self.support_trtllm_attn = (supports_trtllm_attention()
-                                    and num_heads % num_kv_heads == 0)
+        self.support_trtllm_attn = (
+            supports_trtllm_attention() and num_heads % num_kv_heads == 0
+        )
         self.bmm1_scale: Optional[float] = None
         self.bmm2_scale: Optional[float] = None
         self.o_sf_scale: Optional[float] = None
 
     def fused_output_quant_supported(self, quant_key: QuantKey):
-        return (self.support_trtllm_attn
-                and self.kv_cache_dtype.startswith("fp8")
-                and quant_key in (kFp8StaticTensorSym, kNvfp4Quant))
+        return (
+            self.support_trtllm_attn
+            and self.kv_cache_dtype.startswith("fp8")
+            and quant_key in (kFp8StaticTensorSym, kNvfp4Quant)
+        )
 
     def forward(
         self,
@@ -774,28 +824,32 @@ def forward(
             return output
 
         if self.bmm1_scale is None:
-            self.bmm1_scale = (layer._q_scale_float * layer._k_scale_float *
-                               self.scale)
+            self.bmm1_scale = layer._q_scale_float * layer._k_scale_float * self.scale
 
         if self.bmm2_scale is None:
             self.bmm2_scale = layer._v_scale_float
 
         # The attn+quant fusion happens when output_scale is provided.
         if output_scale is None:
-            assert output_block_scale is None, "output_block_scale "\
-                "is not supported when fusion has not happened"
+            assert output_block_scale is None, (
+                "output_block_scale is not supported when fusion has not happened"
+            )
         else:
-            assert attn_metadata.q_data_type == FP8_DTYPE, \
+            assert attn_metadata.q_data_type == FP8_DTYPE, (
                 "Query must be FP8 when attn+quant fusion happened."
-            assert (attn_metadata.prefill_use_trtllm and
-                    attn_metadata.decode_use_trtllm), "Must use TRT-LLM attn"
+            )
+            assert (
+                attn_metadata.prefill_use_trtllm and attn_metadata.decode_use_trtllm
+            ), "Must use TRT-LLM attn"
 
             if output.dtype == FP8_DTYPE:
-                assert output_block_scale is None, \
+                assert output_block_scale is None, (
                     "output_block_scale should not be provided for fp8 output"
+                )
             elif output.dtype == FP4_DTYPE:
-                assert output_block_scale is not None, \
+                assert output_block_scale is not None, (
                     "output_block_scale is required for nvfp4 output"
+                )
             else:
                 raise ValueError(f"Unsupported output dtype: {output.dtype}")
 
@@ -813,9 +867,9 @@ def forward(
         if attn_metadata.q_data_type == FP8_DTYPE:
             num_tokens, num_heads, head_size = query.shape
             query, _ = ops.scaled_fp8_quant(
-                query.reshape(
-                    (num_tokens, num_heads * head_size)).contiguous(),
-                layer._q_scale)
+                query.reshape((num_tokens, num_heads * head_size)).contiguous(),
+                layer._q_scale,
+            )
             query = query.reshape((num_tokens, num_heads, head_size))
 
         # IMPORTANT!
@@ -852,7 +906,8 @@ def forward(
             # to process the cache when the kv_cache_dtype is fp8
             if self.kv_cache_dtype.startswith("fp8"):
                 torch_dtype = FlashInferBackend.get_fp8_dtype_for_flashinfer(
-                    self.kv_cache_dtype)
+                    self.kv_cache_dtype
+                )
                 kv_cache = kv_cache.view(torch_dtype)
 
         # Inputs and outputs may be padded for CUDA graphs
@@ -886,8 +941,7 @@ def forward(
             if not attn_metadata.prefill_use_trtllm:
                 assert prefill_wrapper._causal
                 assert prefill_wrapper._window_left == self.window_left
-                assert prefill_wrapper._logits_soft_cap == (
-                    self.logits_soft_cap or 0.0)
+                assert prefill_wrapper._logits_soft_cap == (self.logits_soft_cap or 0.0)
                 assert prefill_wrapper._sm_scale == self.scale
                 prefill_wrapper.run(
                     prefill_query,
@@ -900,8 +954,7 @@ def forward(
                 # prefill_query may be non-contiguous
                 prefill_query = prefill_query.contiguous()
                 workspace_buffer = _get_trtllm_gen_workspace_buffer()
-                block_tables_prefill = attn_metadata.block_table_tensor[
-                    num_decodes:]
+                block_tables_prefill = attn_metadata.block_table_tensor[num_decodes:]
                 seq_lens_prefill = attn_metadata.seq_lens[num_decodes:]
 
                 # This path needs to be enabled with VLLM_KV_CACHE_LAYOUT = HND
@@ -914,28 +967,31 @@ def forward(
 
                 if output.dtype == FP4_DTYPE:
                     assert self.o_sf_scale is not None
-                    out = FP4Tensor(data=output[num_decode_tokens:],
-                                    scale=output_block_scale,
-                                    scale_start_index=num_decode_tokens,
-                                    original_shape=prefill_query.shape)
+                    out = FP4Tensor(
+                        data=output[num_decode_tokens:],
+                        scale=output_block_scale,
+                        scale_start_index=num_decode_tokens,
+                        original_shape=prefill_query.shape,
+                    )
                 else:
                     assert self.o_sf_scale is None
                     out = output[num_decode_tokens:]
 
-                if attn_metadata.q_data_type != FP8_DTYPE \
-                    and self.kv_cache_dtype.startswith("fp8"):
+                if (
+                    attn_metadata.q_data_type != FP8_DTYPE
+                    and self.kv_cache_dtype.startswith("fp8")
+                ):
                     # TRTLLM prefill attention does not support BF16 Q
                     # and fp8 kv cache. So to enable prefill attention
                     # with fp8 kv cache, we can construct a mock block
                     # and mock kv cache with BF16 KV involved in the prefill
-                    mock_kv_cache, mock_block_table = (
-                        trtllm_prefill_attn_kvfp8_dequant(
-                            kv_cache_permute,
-                            block_tables_prefill,
-                            layer._k_scale,
-                            layer._v_scale,
-                            attn_metadata.q_data_type,
-                        ))
+                    mock_kv_cache, mock_block_table = trtllm_prefill_attn_kvfp8_dequant(
+                        kv_cache_permute,
+                        block_tables_prefill,
+                        layer._k_scale,
+                        layer._v_scale,
+                        attn_metadata.q_data_type,
+                    )
                 else:
                     mock_kv_cache = kv_cache_permute
                     mock_block_table = block_tables_prefill
@@ -967,8 +1023,7 @@ def forward(
 
             if not attn_metadata.decode_use_trtllm:
                 assert decode_wrapper._window_left == self.window_left
-                assert decode_wrapper._logits_soft_cap == (self.logits_soft_cap
-                                                           or 0.0)
+                assert decode_wrapper._logits_soft_cap == (self.logits_soft_cap or 0.0)
                 assert decode_wrapper._sm_scale == self.scale
                 decode_wrapper.run(
                     decode_query,
@@ -981,8 +1036,9 @@ def forward(
                 # decode_query may be non-contiguous
                 decode_query = decode_query.contiguous()
                 workspace_buffer = _get_trtllm_gen_workspace_buffer()
-                block_tables_decode = attn_metadata.\
-                    block_table_tensor[:num_decode_tokens]
+                block_tables_decode = attn_metadata.block_table_tensor[
+                    :num_decode_tokens
+                ]
                 seq_lens_decode = attn_metadata.seq_lens[:num_decode_tokens]
 
                 # This path needs to be enabled with VLLM_KV_CACHE_LAYOUT = HND
@@ -995,10 +1051,12 @@ def forward(
 
                 if output.dtype == FP4_DTYPE:
                     assert self.o_sf_scale is not None
-                    out = FP4Tensor(data=output[:num_decode_tokens],
-                                    scale=output_block_scale,
-                                    scale_start_index=0,
-                                    original_shape=decode_query.shape)
+                    out = FP4Tensor(
+                        data=output[:num_decode_tokens],
+                        scale=output_block_scale,
+                        scale_start_index=0,
+                        original_shape=decode_query.shape,
+                    )
                 else:
                     assert self.o_sf_scale is None
                     out = output[:num_decode_tokens]
@@ -1008,8 +1066,7 @@ def forward(
                     # attention to be initialized with q_len = 0
                     q_len_per_req = 1
                 else:
-                    q_len_per_req = \
-                        num_decode_tokens // attn_metadata.num_decodes
+                    q_len_per_req = num_decode_tokens // attn_metadata.num_decodes
 
                 trtllm_batch_decode_with_kv_cache(
                     query=decode_query,
@@ -1024,7 +1081,8 @@ def forward(
                     sinks=self.sinks,
                     o_sf_scale=self.o_sf_scale,
                     out=out,
-                    q_len_per_req=q_len_per_req)
+                    q_len_per_req=q_len_per_req,
+                )
         return output_padded
 
 
@@ -1065,8 +1123,7 @@ def fast_plan_decode(
     # Warm up with the original plan if it is first call, and always run the
     # original plan if we run for dynamic shape. For fixed shape (cudagraph),
     # this warm up is to generate the _cached_module for the decode wrapper.
-    if not self.is_cuda_graph_enabled or \
-        getattr(self, "vllm_first_call", True):
+    if not self.is_cuda_graph_enabled or getattr(self, "vllm_first_call", True):
         self.plan(
             indptr_cpu,
             indices,
@@ -1106,26 +1163,28 @@ def fast_plan_decode(
 
     if kv_data_type is None:
         kv_data_type = q_data_type
-    q_data_type = getattr(torch, q_data_type) if isinstance(
-        q_data_type, str) else q_data_type
-    kv_data_type = getattr(torch, kv_data_type) if isinstance(
-        kv_data_type, str) else kv_data_type
+    q_data_type = (
+        getattr(torch, q_data_type) if isinstance(q_data_type, str) else q_data_type
+    )
+    kv_data_type = (
+        getattr(torch, kv_data_type) if isinstance(kv_data_type, str) else kv_data_type
+    )
 
     if batch_size != self._fixed_batch_size:
         raise ValueError(
             "The batch size should be fixed in cudagraph mode, the runtime "
             "batch size {} mismatches the batch size set during "
-            "initialization {}".format(batch_size, self._fixed_batch_size))
+            "initialization {}".format(batch_size, self._fixed_batch_size)
+        )
     if len(indices) > len(self._paged_kv_indices_buf):
         raise ValueError(
-            "The size of indices should be less than or equal to the "
-            "allocated buffer")
+            "The size of indices should be less than or equal to the allocated buffer"
+        )
 
     # host-to-device copy for the indptr buffer
     self._paged_kv_indptr_buf.copy_(indptr_cpu, non_blocking=True)
     # host-to-device copy for the last_page_len buffer
-    self._paged_kv_last_page_len_buf.copy_(last_page_len_cpu,
-                                           non_blocking=True)
+    self._paged_kv_last_page_len_buf.copy_(last_page_len_cpu, non_blocking=True)
 
     qo_indptr_host = _get_range_buf(batch_size + 1, "cpu")
 
@@ -1176,6 +1235,8 @@ def _copy_page_indices_kernel(
     offset = tl.arange(0, BLOCK_SIZE)
     for i in tl.range(0, num_blocks, BLOCK_SIZE):
         block_ids = tl.load(row_ptr + i + offset, mask=i + offset < num_blocks)
-        tl.store(page_indices + start_idx + i + offset,
-                 block_ids,
-                 mask=i + offset < num_blocks)
+        tl.store(
+            page_indices + start_idx + i + offset,
+            block_ids,
+            mask=i + offset < num_blocks,
+        )
diff --git a/vllm/v1/attention/backends/flex_attention.py b/vllm/v1/attention/backends/flex_attention.py
index e548b51060d8..4640e62abfe6 100644
--- a/vllm/v1/attention/backends/flex_attention.py
+++ b/vllm/v1/attention/backends/flex_attention.py
@@ -8,21 +8,32 @@
 import torch
 import torch._dynamo.decorators
 import torch.nn.functional as F
-from torch.nn.attention.flex_attention import (BlockMask, _mask_mod_signature,
-                                               _score_mod_signature, and_masks,
-                                               create_block_mask,
-                                               flex_attention)
-
-from vllm.attention.backends.abstract import (AttentionBackend, AttentionImpl,
-                                              AttentionMetadata, AttentionType,
-                                              is_quantized_kv_cache)
+from torch.nn.attention.flex_attention import (
+    BlockMask,
+    _mask_mod_signature,
+    _score_mod_signature,
+    and_masks,
+    create_block_mask,
+    flex_attention,
+)
+
+from vllm.attention.backends.abstract import (
+    AttentionBackend,
+    AttentionImpl,
+    AttentionMetadata,
+    AttentionType,
+    is_quantized_kv_cache,
+)
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.model_executor.layers.batch_invariant import (
-    vllm_kernel_override_batch_invariant)
+    vllm_kernel_override_batch_invariant,
+)
 from vllm.utils import cdiv, is_torch_equal_or_newer
-from vllm.v1.attention.backends.utils import (AttentionMetadataBuilder,
-                                              CommonAttentionMetadata)
+from vllm.v1.attention.backends.utils import (
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+)
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 logger = init_logger(__name__)
@@ -31,9 +42,9 @@
     from vllm.v1.core.sched.output import SchedulerOutput
     from vllm.v1.worker.gpu_input_batch import InputBatch
 
-create_block_mask_compiled = torch.compile(create_block_mask,
-                                           fullgraph=True,
-                                           mode="reduce-overhead")
+create_block_mask_compiled = torch.compile(
+    create_block_mask, fullgraph=True, mode="reduce-overhead"
+)
 flex_attention_compiled = torch.compile(flex_attention, fullgraph=True)
 
 
@@ -41,7 +52,8 @@ def _offsets_to_doc_ids_tensor(offsets: torch.Tensor) -> torch.Tensor:
     device = offsets.device
     counts = offsets[1:] - offsets[:-1]
     return torch.repeat_interleave(
-        torch.arange(len(counts), device=device, dtype=torch.int32), counts)
+        torch.arange(len(counts), device=device, dtype=torch.int32), counts
+    )
 
 
 def pad_to_multiple(x: torch.Tensor, multiple: int, dim: int):
@@ -103,10 +115,13 @@ def use_cascade_attention(*args, **kwargs) -> bool:
         return False
 
 
-#@torch.compile(fullgraph=True, mode="reduce-overhead")
-def physical_to_logical_mapping(block_table: torch.Tensor,
-                                seq_lens: torch.Tensor, block_size: int,
-                                total_blocks: int) -> torch.Tensor:
+# @torch.compile(fullgraph=True, mode="reduce-overhead")
+def physical_to_logical_mapping(
+    block_table: torch.Tensor,
+    seq_lens: torch.Tensor,
+    block_size: int,
+    total_blocks: int,
+) -> torch.Tensor:
     """
     Creates an inverse mapping from physical block locations to logical indices.
 
@@ -176,35 +191,37 @@ def physical_to_logical_mapping(block_table: torch.Tensor,
     max_reqs, max_num_blocks = block_table.shape
     device = block_table.device
 
-    physical_to_logical = torch.full((max_reqs, total_blocks),
-                                     -1,
-                                     dtype=torch.long,
-                                     device=device)
+    physical_to_logical = torch.full(
+        (max_reqs, total_blocks), -1, dtype=torch.long, device=device
+    )
 
     # Only process valid blocks to avoid garbage values
     num_blocks_per_seq = cdiv(seq_lens, block_size)
-    mask = torch.arange(max_num_blocks,
-                        device=device)[None, :] < num_blocks_per_seq[:, None]
+    mask = (
+        torch.arange(max_num_blocks, device=device)[None, :]
+        < num_blocks_per_seq[:, None]
+    )
 
     valid_block_table = torch.where(mask, block_table, 0)
     valid_logical_indices = torch.where(
-        mask,
-        torch.arange(max_num_blocks, device=device)[None, :], 0)
+        mask, torch.arange(max_num_blocks, device=device)[None, :], 0
+    )
 
-    physical_to_logical.scatter_(-1, valid_block_table.to(torch.int64),
-                                 valid_logical_indices)
+    physical_to_logical.scatter_(
+        -1, valid_block_table.to(torch.int64), valid_logical_indices
+    )
     # NB - Seems like block 0 is always empty so we reset it manually
     physical_to_logical[:, 0] = -1
     return physical_to_logical
 
 
 def unique_static_unsorted(
-        x: torch.Tensor,
-        *,
-        M: int,  # maximum positive value (0 is “skip me”)
-        dim: int = -1,  # axis along which to deduplicate
-        ignored_val: int = 0,  # value to ignore
-        pad_val: int = -1,  # sentinel for unused slots
+    x: torch.Tensor,
+    *,
+    M: int,  # maximum positive value (0 is “skip me”)
+    dim: int = -1,  # axis along which to deduplicate
+    ignored_val: int = 0,  # value to ignore
+    pad_val: int = -1,  # sentinel for unused slots
 ) -> torch.Tensor:
     """
     - Keeps the first occurrence of each non-zero value while preserving order,
@@ -236,8 +253,7 @@ def unique_static_unsorted(
     first_idx.scatter_reduce_(1, x_flat, idx, reduce="amin")
 
     # ── keep mask: first occurrence *and* value ≠ 0 ─────────────────────
-    keep = (x_flat != ignored_val) & (idx == first_idx.gather(1, x_flat)
-                                      )  # [B, N]
+    keep = (x_flat != ignored_val) & (idx == first_idx.gather(1, x_flat))  # [B, N]
 
     # ── left-pack uniques into a fresh tensor ───────────────────────────
     dest_pos = torch.cumsum(keep.to(torch.long), dim=1) - 1  # where to go
@@ -251,8 +267,9 @@ def unique_static_unsorted(
     return packed
 
 
-def causal_mask_mod(b: torch.Tensor, h: torch.Tensor, q_idx: torch.Tensor,
-                    kv_idx: torch.Tensor):
+def causal_mask_mod(
+    b: torch.Tensor, h: torch.Tensor, q_idx: torch.Tensor, kv_idx: torch.Tensor
+):
     return q_idx >= kv_idx
 
 
@@ -317,8 +334,7 @@ def _convert_physical_to_logical(
         physical_kv_block = physical_kv_idx // self.block_size
         physical_kv_offset = physical_kv_idx % self.block_size
         logical_block_idx = self.physical_to_logical[q_req, physical_kv_block]
-        logical_kv_idx = (logical_block_idx * self.block_size +
-                          physical_kv_offset)
+        logical_kv_idx = logical_block_idx * self.block_size + physical_kv_offset
 
         # Determine valid kv indices
         live_block = logical_block_idx >= 0
@@ -352,9 +368,9 @@ def final_mask_mod(
             q_idx: torch.Tensor,
             physical_kv_idx: torch.Tensor,
         ) -> torch.Tensor:
-            (is_valid, logical_q_idx,
-             logical_kv_idx) = self._convert_physical_to_logical(
-                 self.doc_ids, q_idx, physical_kv_idx)
+            (is_valid, logical_q_idx, logical_kv_idx) = (
+                self._convert_physical_to_logical(self.doc_ids, q_idx, physical_kv_idx)
+            )
             # Apply mask modification only for valid indices
             return torch.where(
                 is_valid,
@@ -392,11 +408,11 @@ def get_sliding_window_mask_mod(self) -> _mask_mod_signature:
         """
 
         if self.sliding_window is None:
-            raise ValueError(
-                "sliding_window must be set for sliding window attention")
+            raise ValueError("sliding_window must be set for sliding window attention")
 
-        def sliding_window_mask_mod(b: torch.Tensor, h: torch.Tensor,
-                                    q_idx: torch.Tensor, kv_idx: torch.Tensor):
+        def sliding_window_mask_mod(
+            b: torch.Tensor, h: torch.Tensor, q_idx: torch.Tensor, kv_idx: torch.Tensor
+        ):
             return torch.abs(q_idx - kv_idx) < self.sliding_window
 
         def final_mask_mod(
@@ -405,9 +421,9 @@ def final_mask_mod(
             q_idx: torch.Tensor,
             physical_kv_idx: torch.Tensor,
         ) -> torch.Tensor:
-            (is_valid, logical_q_idx,
-             logical_kv_idx) = self._convert_physical_to_logical(
-                 self.doc_ids, q_idx, physical_kv_idx)
+            (is_valid, logical_q_idx, logical_kv_idx) = (
+                self._convert_physical_to_logical(self.doc_ids, q_idx, physical_kv_idx)
+            )
             return torch.where(
                 is_valid,
                 sliding_window_mask_mod(b, h, logical_q_idx, logical_kv_idx),
@@ -451,18 +467,19 @@ def transformed_score_mod(
             q_idx: torch.Tensor,
             physical_kv_idx: torch.Tensor,
         ) -> torch.Tensor:
-            (is_valid, logical_q_idx,
-             logical_kv_idx) = self._convert_physical_to_logical(
-                 request_lookup, q_idx, physical_kv_idx)
+            (is_valid, logical_q_idx, logical_kv_idx) = (
+                self._convert_physical_to_logical(
+                    request_lookup, q_idx, physical_kv_idx
+                )
+            )
 
             return torch.where(
                 is_valid,
-                user_score_mod(score,
-                               b,
-                               h,
-                               logical_q_idx,
-                               logical_kv_idx,
-                               physical_q=q_idx), -float('inf'))
+                user_score_mod(
+                    score, b, h, logical_q_idx, logical_kv_idx, physical_q=q_idx
+                ),
+                -float("inf"),
+            )
 
         return transformed_score_mod
 
@@ -493,18 +510,22 @@ def _build_block_mask_direct(self) -> BlockMask:
                 f"FlexAttention currently requires the cache block size "
                 f"({self.block_size}) to be equal to the kv_block_size "
                 f"({self.kv_block_size}). Please check your model's "
-                f"configuration.")
+                f"configuration."
+            )
 
         used_pages = self.block_table[
-            self.doc_ids, :cdiv(self.max_seq_len, self.block_size)]
-        used_pages_padded = pad_to_multiple(used_pages,
-                                            multiple=self.q_block_size,
-                                            dim=0)
+            self.doc_ids, : cdiv(self.max_seq_len, self.block_size)
+        ]
+        used_pages_padded = pad_to_multiple(
+            used_pages, multiple=self.q_block_size, dim=0
+        )
         used_pages_padded = used_pages_padded.reshape(
-            used_pages_padded.shape[0] // self.q_block_size, -1)
+            used_pages_padded.shape[0] // self.q_block_size, -1
+        )
         used_pages_padded = used_pages_padded // page_to_block_ratio
-        kv_indices = unique_static_unsorted((used_pages_padded.long()),
-                                            M=self.num_blocks).to(torch.int32)
+        kv_indices = unique_static_unsorted(
+            (used_pages_padded.long()), M=self.num_blocks
+        ).to(torch.int32)
 
         kv_num_blocks = (kv_indices >= 0).sum(dim=-1).to(torch.int32)
         block_mask_kwargs = {
@@ -524,8 +545,7 @@ def _build_block_mask_direct(self) -> BlockMask:
 
     def build_block_mask(self) -> BlockMask:
         mask_mod = self.get_mask_mod()
-        kv_len = (self.total_cache_tokens
-                  if self.causal else self.num_actual_tokens)
+        kv_len = self.total_cache_tokens if self.causal else self.num_actual_tokens
         return create_block_mask_compiled(
             mask_mod,
             None,
@@ -555,11 +575,14 @@ def __post_init__(self):
             self.block_mask = self.build_block_mask()
 
 
-class FlexAttentionMetadataBuilder(
-        AttentionMetadataBuilder[FlexAttentionMetadata]):
-
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
+class FlexAttentionMetadataBuilder(AttentionMetadataBuilder[FlexAttentionMetadata]):
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
         super().__init__(kv_cache_spec, layer_names, vllm_config, device)
 
         self.model_config = vllm_config.model_config
@@ -567,26 +590,27 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
         self.cache_config = vllm_config.cache_config
 
         self.num_heads_q = self.model_config.get_num_attention_heads(
-            self.parallel_config)
-        self.num_heads_kv = self.model_config.get_num_kv_heads(
-            self.parallel_config)
+            self.parallel_config
+        )
+        self.num_heads_kv = self.model_config.get_num_kv_heads(self.parallel_config)
         self.headdim = self.model_config.get_head_size()
         self.block_size = kv_cache_spec.block_size
         self.kv_cache_spec = kv_cache_spec
         self.direct_build: bool = is_torch_equal_or_newer("2.9.0.dev0")
-        self.q_block_size: int = 16 if is_torch_equal_or_newer(
-            "2.9.0.dev0") else 128
-        self.kv_block_size: int = 16 if is_torch_equal_or_newer(
-            "2.9.0.dev0") else 128
+        self.q_block_size: int = 16 if is_torch_equal_or_newer("2.9.0.dev0") else 128
+        self.kv_block_size: int = 16 if is_torch_equal_or_newer("2.9.0.dev0") else 128
 
-    def reorder_batch(self, input_batch: "InputBatch",
-                      scheduler_output: "SchedulerOutput") -> bool:
+    def reorder_batch(
+        self, input_batch: "InputBatch", scheduler_output: "SchedulerOutput"
+    ) -> bool:
         return False
 
-    def build(self,
-              common_prefix_len: int,
-              common_attn_metadata: CommonAttentionMetadata,
-              fast_build: bool = False) -> FlexAttentionMetadata:
+    def build(
+        self,
+        common_prefix_len: int,
+        common_attn_metadata: CommonAttentionMetadata,
+        fast_build: bool = False,
+    ) -> FlexAttentionMetadata:
         num_reqs = common_attn_metadata.num_reqs
         num_actual_tokens = common_attn_metadata.num_actual_tokens
         max_query_len = common_attn_metadata.max_query_len
@@ -609,15 +633,18 @@ def build(self,
         max_possible_seq_len = self.model_config.max_model_len
         num_gpu_blocks = self.cache_config.num_gpu_blocks
 
-        assert num_gpu_blocks is not None, \
+        assert num_gpu_blocks is not None, (
             "FlexAttention requires num_gpu_blocks to be set"
-        total_cache_tokens = (num_gpu_blocks * block_size)
+        )
+        total_cache_tokens = num_gpu_blocks * block_size
 
         inverse_block_table = physical_to_logical_mapping(
-            block_table_tensor, seq_lens, block_size, num_gpu_blocks)
+            block_table_tensor, seq_lens, block_size, num_gpu_blocks
+        )
 
         offset_tensor = common_attn_metadata.num_computed_tokens_cpu.to(
-            self.device, non_blocking=True)
+            self.device, non_blocking=True
+        )
 
         out = FlexAttentionMetadata(
             causal=common_attn_metadata.causal,
@@ -675,14 +702,15 @@ def __init__(
         self.num_kv_heads = num_kv_heads
         self.attn_type = attn_type
 
-        if attn_type not in (AttentionType.ENCODER_ONLY,
-                             AttentionType.DECODER):
+        if attn_type not in (AttentionType.ENCODER_ONLY, AttentionType.DECODER):
             raise NotImplementedError(
-                f"FlexAttention does not support {attn_type} attention")
+                f"FlexAttention does not support {attn_type} attention"
+            )
 
         if alibi_slopes is not None:
             raise NotImplementedError(
-                "FlexAttention does not support alibi slopes yet.")
+                "FlexAttention does not support alibi slopes yet."
+            )
         else:
             self.alibi_slopes = None
 
@@ -692,19 +720,20 @@ def __init__(
         self.logits_soft_cap = logits_soft_cap
         if self.logits_soft_cap is not None:
             raise NotImplementedError(
-                "FlexAttention does not support logits soft cap yet.")
+                "FlexAttention does not support logits soft cap yet."
+            )
 
         assert self.num_heads % self.num_kv_heads == 0
         self.num_queries_per_kv = self.num_heads // self.num_kv_heads
 
         if kv_sharing_target_layer_name is not None:
-            raise NotImplementedError(
-                "FlexAttention does not support kv sharing yet.")
+            raise NotImplementedError("FlexAttention does not support kv sharing yet.")
 
         FlexAttentionBackend.validate_head_size(head_size)
         if is_quantized_kv_cache(self.kv_cache_dtype):
             raise NotImplementedError(
-                "FlexAttention does not support quantized kv-cache. Yet")
+                "FlexAttention does not support quantized kv-cache. Yet"
+            )
 
     @staticmethod
     def view_as_4d(tensor: torch.Tensor) -> torch.Tensor:
@@ -741,8 +770,8 @@ def forward(
         assert output is not None, "Output tensor must be provided."
         if output_scale is not None or output_block_scale is not None:
             raise NotImplementedError(
-                "fused output quantization is not yet supported"
-                " for FlexAttentionImpl")
+                "fused output quantization is not yet supported for FlexAttentionImpl"
+            )
 
         enable_gqa = self.num_kv_heads != self.num_heads
 
@@ -761,11 +790,11 @@ def forward(
                 # in direct block mask building code path.
                 logger.warning_once(
                     "Using direct block mask building with sliding window, "
-                    "which is suboptimal now. Performance may be degraded.")
+                    "which is suboptimal now. Performance may be degraded."
+                )
                 # update mask mod in attention metadata
                 attn_metadata.mask_mod = attn_metadata.get_mask_mod()
-                attn_metadata.block_mask = (
-                    attn_metadata._build_block_mask_direct())
+                attn_metadata.block_mask = attn_metadata._build_block_mask_direct()
             else:
                 attn_metadata.block_mask = attn_metadata.build_block_mask()
 
@@ -778,8 +807,9 @@ def forward(
             )
 
             query = query[:, :, :num_actual_tokens, :]
-            if ((key_tensor.size(-2) > num_actual_tokens)
-                    or (value_tensor.size(-2) > num_actual_tokens)):
+            if (key_tensor.size(-2) > num_actual_tokens) or (
+                value_tensor.size(-2) > num_actual_tokens
+            ):
                 # In the encoder-only model with torch.compile,
                 # qkv might be padded, which might cause exception.
                 # see: https://github.com/vllm-project/vllm/pull/24872#discussion_r2353252290
@@ -803,8 +833,7 @@ def forward(
 
             # View out the block_size dim
             key_cache = key_cache.view(-1, self.num_kv_heads, self.head_size)
-            value_cache = value_cache.view(-1, self.num_kv_heads,
-                                           self.head_size)
+            value_cache = value_cache.view(-1, self.num_kv_heads, self.head_size)
             query, key_tensor, value_tensor = map(
                 lambda x: self.view_as_4d(x).permute(0, 2, 1, 3),
                 (query, key_cache, value_cache),
@@ -818,8 +847,9 @@ def forward(
         assert attn_metadata.block_mask is not None
         block_m, block_n = attn_metadata.block_mask.BLOCK_SIZE
 
-        kernel_options = get_kernel_options(query, block_m, block_n,
-                                            attn_metadata.direct_build)
+        kernel_options = get_kernel_options(
+            query, block_m, block_n, attn_metadata.direct_build
+        )
         out = flex_attention_compiled(
             query,
             key_tensor,
@@ -837,8 +867,9 @@ def forward(
         return output
 
 
-def get_kernel_options(query, block_m, block_n,
-                       use_direct_build: bool) -> dict[str, Union[int, bool]]:
+def get_kernel_options(
+    query, block_m, block_n, use_direct_build: bool
+) -> dict[str, Union[int, bool]]:
     kernel_options: dict[str, Union[int, bool]] = {
         "FORCE_USE_FLEX_ATTENTION": True,
     }
diff --git a/vllm/v1/attention/backends/gdn_attn.py b/vllm/v1/attention/backends/gdn_attn.py
index 11f165d6cfc6..0e271da5fbe4 100644
--- a/vllm/v1/attention/backends/gdn_attn.py
+++ b/vllm/v1/attention/backends/gdn_attn.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Backend for GatedDeltaNet attention."""
+
 from dataclasses import dataclass
 from typing import Optional
 
@@ -9,16 +10,17 @@
 from vllm.attention.backends.abstract import AttentionBackend
 from vllm.attention.backends.utils import PAD_SLOT_ID
 from vllm.config import VllmConfig
-from vllm.v1.attention.backends.utils import (AttentionCGSupport,
-                                              AttentionMetadataBuilder,
-                                              CommonAttentionMetadata,
-                                              compute_causal_conv1d_metadata,
-                                              split_decodes_and_prefills)
+from vllm.v1.attention.backends.utils import (
+    AttentionCGSupport,
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+    compute_causal_conv1d_metadata,
+    split_decodes_and_prefills,
+)
 from vllm.v1.kv_cache_interface import AttentionSpec, MambaSpec
 
 
 class GDNAttentionBackend(AttentionBackend):
-
     @staticmethod
     def get_builder_cls() -> type["GDNAttentionMetadataBuilder"]:
         return GDNAttentionMetadataBuilder
@@ -36,19 +38,21 @@ class GDNAttentionMetadata:
 
     has_initial_state: Optional[torch.Tensor] = None
 
-    spec_query_start_loc: Optional[
-        torch.Tensor] = None  # shape: [num_spec_decodes + 1,]
-    non_spec_query_start_loc: Optional[
-        torch.Tensor] = None  # shape: [batch - num_spec_decodes + 1,]
-
-    spec_state_indices_tensor: Optional[
-        torch.Tensor] = None  # shape: [batch, num_spec]
-    non_spec_state_indices_tensor: Optional[
-        torch.Tensor] = None  # shape: [batch - num_spec_decodes,]
+    spec_query_start_loc: Optional[torch.Tensor] = (
+        None  # shape: [num_spec_decodes + 1,]
+    )
+    non_spec_query_start_loc: Optional[torch.Tensor] = (
+        None  # shape: [batch - num_spec_decodes + 1,]
+    )
+
+    spec_state_indices_tensor: Optional[torch.Tensor] = None  # shape: [batch, num_spec]
+    non_spec_state_indices_tensor: Optional[torch.Tensor] = (
+        None  # shape: [batch - num_spec_decodes,]
+    )
     spec_sequence_masks: Optional[torch.Tensor] = None  # shape: [batch,]
-    spec_token_masks: Optional[
-        torch.
-        Tensor] = None  # shape: [num_prefill_tokens + num_decode_tokens,]
+    spec_token_masks: Optional[torch.Tensor] = (
+        None  # shape: [num_prefill_tokens + num_decode_tokens,]
+    )
     num_accepted_tokens: Optional[torch.Tensor] = None  # shape: [batch,]
 
     # The following attributes are for triton implementation of causal_conv1d
@@ -57,15 +61,18 @@ class GDNAttentionMetadata:
     token_chunk_offset_ptr: Optional[torch.Tensor] = None
 
 
-class GDNAttentionMetadataBuilder(
-        AttentionMetadataBuilder[GDNAttentionMetadata]):
-
+class GDNAttentionMetadataBuilder(AttentionMetadataBuilder[GDNAttentionMetadata]):
     cudagraph_support = AttentionCGSupport.UNIFORM_BATCH
 
     reorder_batch_threshold: int = 1
 
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
         assert isinstance(kv_cache_spec, MambaSpec)
         self.vllm_config = vllm_config
         self.compilation_config = vllm_config.compilation_config
@@ -78,11 +85,13 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
         self.use_spec_decode = self.num_spec > 0
         self._init_reorder_batch_threshold(1, self.use_spec_decode)
 
-        self.use_full_cuda_graph = \
+        self.use_full_cuda_graph = (
             self.compilation_config.cudagraph_mode.has_full_cudagraphs()
+        )
         self.decode_cudagraph_max_bs = min(
-            self.vllm_config.scheduler_config.max_num_seqs *
-            (self.num_spec + 1), self.compilation_config.max_capture_size)
+            self.vllm_config.scheduler_config.max_num_seqs * (self.num_spec + 1),
+            self.compilation_config.max_capture_size,
+        )
 
         self.spec_state_indices_tensor = torch.empty(
             (self.decode_cudagraph_max_bs, self.num_spec + 1),
@@ -90,32 +99,32 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
             device=device,
         )
         self.non_spec_state_indices_tensor = torch.empty(
-            (self.decode_cudagraph_max_bs, ),
+            (self.decode_cudagraph_max_bs,),
             dtype=torch.int32,
             device=device,
         )
         self.spec_sequence_masks = torch.empty(
-            (self.decode_cudagraph_max_bs, ),
+            (self.decode_cudagraph_max_bs,),
             dtype=torch.bool,
             device=device,
         )
         self.spec_token_masks = torch.empty(
-            (self.decode_cudagraph_max_bs * (self.num_spec + 1), ),
+            (self.decode_cudagraph_max_bs * (self.num_spec + 1),),
             dtype=torch.bool,
             device=device,
         )
         self.spec_query_start_loc = torch.empty(
-            (self.decode_cudagraph_max_bs + 1, ),
+            (self.decode_cudagraph_max_bs + 1,),
             dtype=torch.int32,
             device=device,
         )
         self.non_spec_query_start_loc = torch.empty(
-            (self.decode_cudagraph_max_bs + 1, ),
+            (self.decode_cudagraph_max_bs + 1,),
             dtype=torch.int32,
             device=device,
         )
         self.num_accepted_tokens = torch.empty(
-            (self.decode_cudagraph_max_bs, ),
+            (self.decode_cudagraph_max_bs,),
             dtype=torch.int32,
             device=device,
         )
@@ -135,9 +144,14 @@ def build(  # type: ignore[override]
         context_lens_tensor = context_lens.to(query_start_loc.device)
         nums_dict, batch_ptr, token_chunk_offset_ptr = None, None, None
 
-        if (not self.use_spec_decode or num_decode_draft_tokens_cpu is None
-                or num_decode_draft_tokens_cpu[num_decode_draft_tokens_cpu >=
-                                               0].sum().item() == 0):
+        if (
+            not self.use_spec_decode
+            or num_decode_draft_tokens_cpu is None
+            or num_decode_draft_tokens_cpu[num_decode_draft_tokens_cpu >= 0]
+            .sum()
+            .item()
+            == 0
+        ):
             spec_sequence_masks = None
             num_spec_decodes = 0
         else:
@@ -147,11 +161,13 @@ def build(  # type: ignore[override]
                 spec_sequence_masks = None
             else:
                 spec_sequence_masks = spec_sequence_masks.to(
-                    query_start_loc.device, non_blocking=True)
+                    query_start_loc.device, non_blocking=True
+                )
 
         if spec_sequence_masks is None:
             num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
-                split_decodes_and_prefills(m, decode_threshold=1))
+                split_decodes_and_prefills(m, decode_threshold=1)
+            )
             num_spec_decode_tokens = 0
             spec_token_masks = None
             spec_state_indices_tensor = None
@@ -166,45 +182,56 @@ def build(  # type: ignore[override]
             num_decodes = (non_spec_query_lens == 1).sum().item()
             num_prefills = non_spec_query_lens.size(0) - num_decodes
             num_decode_tokens = num_decodes
-            num_prefill_tokens = non_spec_query_lens.sum().item(
-            ) - num_decode_tokens
+            num_prefill_tokens = non_spec_query_lens.sum().item() - num_decode_tokens
 
             if num_prefills == 0 and num_decodes == 0:
                 spec_token_masks = torch.ones(
-                    (min(num_spec_decodes *
-                         (self.num_spec + 1), query_start_loc[-1].item())),
+                    (
+                        min(
+                            num_spec_decodes * (self.num_spec + 1),
+                            query_start_loc[-1].item(),
+                        )
+                    ),
                     dtype=torch.bool,
-                    device=query_start_loc.device)
-                spec_state_indices_tensor = m.block_table_tensor[:, :self.
-                                                                 num_spec + 1]
+                    device=query_start_loc.device,
+                )
+                spec_state_indices_tensor = m.block_table_tensor[:, : self.num_spec + 1]
                 non_spec_state_indices_tensor = None
                 spec_query_start_loc = query_start_loc
                 non_spec_query_start_loc = None
             else:
                 spec_token_masks = torch.repeat_interleave(
-                    spec_sequence_masks, query_lens)
+                    spec_sequence_masks, query_lens
+                )
                 spec_state_indices_tensor = m.block_table_tensor[
-                    spec_sequence_masks, :self.num_spec + 1]
-                non_spec_state_indices_tensor = \
-                    m.block_table_tensor[~spec_sequence_masks, 0]
+                    spec_sequence_masks, : self.num_spec + 1
+                ]
+                non_spec_state_indices_tensor = m.block_table_tensor[
+                    ~spec_sequence_masks, 0
+                ]
 
                 spec_query_start_loc = torch.zeros(
                     num_spec_decodes + 1,
                     dtype=torch.int32,
-                    device=query_start_loc.device)
-                torch.cumsum(query_lens[spec_sequence_masks],
-                             dim=0,
-                             out=spec_query_start_loc[1:])
+                    device=query_start_loc.device,
+                )
+                torch.cumsum(
+                    query_lens[spec_sequence_masks], dim=0, out=spec_query_start_loc[1:]
+                )
                 non_spec_query_start_loc = torch.zeros(
                     query_lens.size(0) - num_spec_decodes + 1,
                     dtype=torch.int32,
-                    device=query_start_loc.device)
-                torch.cumsum(query_lens[~spec_sequence_masks],
-                             dim=0,
-                             out=non_spec_query_start_loc[1:])
-
-            num_spec_decode_tokens = (query_lens.sum().item() -
-                                      num_prefill_tokens - num_decode_tokens)
+                    device=query_start_loc.device,
+                )
+                torch.cumsum(
+                    query_lens[~spec_sequence_masks],
+                    dim=0,
+                    out=non_spec_query_start_loc[1:],
+                )
+
+            num_spec_decode_tokens = (
+                query_lens.sum().item() - num_prefill_tokens - num_decode_tokens
+            )
             assert num_accepted_tokens is not None
             num_accepted_tokens = num_accepted_tokens[spec_sequence_masks]
 
@@ -212,12 +239,14 @@ def build(  # type: ignore[override]
             has_initial_state = context_lens_tensor > 0
             if spec_sequence_masks is not None:
                 has_initial_state = has_initial_state[~spec_sequence_masks]
-            nums_dict, batch_ptr, token_chunk_offset_ptr = \
+            nums_dict, batch_ptr, token_chunk_offset_ptr = (
                 compute_causal_conv1d_metadata(non_spec_query_start_loc)
+            )
         else:
             has_initial_state = None
-        num_actual_tokens = num_prefill_tokens + num_decode_tokens + \
-            num_spec_decode_tokens
+        num_actual_tokens = (
+            num_prefill_tokens + num_decode_tokens + num_spec_decode_tokens
+        )
 
         # prepare tensors for cudagraph
         #
@@ -226,64 +255,71 @@ def build(  # type: ignore[override]
         #
         # In above cases, the max possible batch size for n tokens, can be
         # min(n, cudagraph_max_bs).
-        if (self.use_full_cuda_graph and num_prefills == 0 and num_decodes == 0
-                and num_spec_decodes <= self.decode_cudagraph_max_bs
-                and num_spec_decode_tokens <= self.decode_cudagraph_max_bs):
-            num_actual_tokens = self.vllm_config.pad_for_cudagraph(
-                m.num_actual_tokens)
+        if (
+            self.use_full_cuda_graph
+            and num_prefills == 0
+            and num_decodes == 0
+            and num_spec_decodes <= self.decode_cudagraph_max_bs
+            and num_spec_decode_tokens <= self.decode_cudagraph_max_bs
+        ):
+            num_actual_tokens = self.vllm_config.pad_for_cudagraph(m.num_actual_tokens)
             batch_size = min(self.decode_cudagraph_max_bs, num_actual_tokens)
 
             self.spec_state_indices_tensor[:num_spec_decodes].copy_(
-                spec_state_indices_tensor, non_blocking=True)
-            spec_state_indices_tensor = self.spec_state_indices_tensor[:
-                                                                       batch_size]
+                spec_state_indices_tensor, non_blocking=True
+            )
+            spec_state_indices_tensor = self.spec_state_indices_tensor[:batch_size]
             spec_state_indices_tensor[num_spec_decodes:].fill_(PAD_SLOT_ID)
 
             self.spec_sequence_masks[:num_spec_decodes].copy_(
-                spec_sequence_masks, non_blocking=True)
+                spec_sequence_masks, non_blocking=True
+            )
             spec_sequence_masks = self.spec_sequence_masks[:batch_size]
             spec_sequence_masks[num_spec_decodes:].fill_(False)
 
             assert spec_token_masks is not None
-            self.spec_token_masks[:spec_token_masks.size(0)].copy_(
-                spec_token_masks, non_blocking=True)
+            self.spec_token_masks[: spec_token_masks.size(0)].copy_(
+                spec_token_masks, non_blocking=True
+            )
             spec_token_masks = self.spec_token_masks[:num_actual_tokens]
-            spec_token_masks[spec_token_masks.size(0):].fill_(False)
+            spec_token_masks[spec_token_masks.size(0) :].fill_(False)
 
-            self.spec_query_start_loc[:num_spec_decodes + 1].copy_(
-                spec_query_start_loc, non_blocking=True)
-            spec_num_query_tokens = spec_query_start_loc[
-                -1]  # type: ignore[index]
-            spec_query_start_loc = self.spec_query_start_loc[:batch_size + 1]
-            spec_query_start_loc[num_spec_decodes +
-                                 1:].fill_(spec_num_query_tokens)
+            self.spec_query_start_loc[: num_spec_decodes + 1].copy_(
+                spec_query_start_loc, non_blocking=True
+            )
+            spec_num_query_tokens = spec_query_start_loc[-1]  # type: ignore[index]
+            spec_query_start_loc = self.spec_query_start_loc[: batch_size + 1]
+            spec_query_start_loc[num_spec_decodes + 1 :].fill_(spec_num_query_tokens)
 
             self.num_accepted_tokens[:num_spec_decodes].copy_(
-                num_accepted_tokens, non_blocking=True)
+                num_accepted_tokens, non_blocking=True
+            )
             num_accepted_tokens = self.num_accepted_tokens[:batch_size]
             num_accepted_tokens[num_spec_decodes:].fill_(1)
 
-        if (self.use_full_cuda_graph and num_prefills == 0
-                and num_spec_decodes == 0
-                and num_decodes <= self.decode_cudagraph_max_bs):
-            num_actual_tokens = self.vllm_config.pad_for_cudagraph(
-                m.num_actual_tokens)
+        if (
+            self.use_full_cuda_graph
+            and num_prefills == 0
+            and num_spec_decodes == 0
+            and num_decodes <= self.decode_cudagraph_max_bs
+        ):
+            num_actual_tokens = self.vllm_config.pad_for_cudagraph(m.num_actual_tokens)
             batch_size = num_actual_tokens
 
             self.non_spec_state_indices_tensor[:num_decodes].copy_(
-                non_spec_state_indices_tensor, non_blocking=True)
-            non_spec_state_indices_tensor = \
-                self.non_spec_state_indices_tensor[:batch_size]
+                non_spec_state_indices_tensor, non_blocking=True
+            )
+            non_spec_state_indices_tensor = self.non_spec_state_indices_tensor[
+                :batch_size
+            ]
             non_spec_state_indices_tensor[num_decodes:].fill_(PAD_SLOT_ID)
 
-            self.non_spec_query_start_loc[:num_decodes + 1].copy_(
-                non_spec_query_start_loc, non_blocking=True)
-            non_spec_num_query_tokens = non_spec_query_start_loc[
-                -1]  # type: ignore[index]
-            non_spec_query_start_loc = \
-                self.non_spec_query_start_loc[:batch_size + 1]
-            non_spec_query_start_loc[num_decodes +
-                                     1:].fill_(non_spec_num_query_tokens)
+            self.non_spec_query_start_loc[: num_decodes + 1].copy_(
+                non_spec_query_start_loc, non_blocking=True
+            )
+            non_spec_num_query_tokens = non_spec_query_start_loc[-1]  # type: ignore[index]
+            non_spec_query_start_loc = self.non_spec_query_start_loc[: batch_size + 1]
+            non_spec_query_start_loc[num_decodes + 1 :].fill_(non_spec_num_query_tokens)
 
         attn_metadata = GDNAttentionMetadata(
             num_prefills=num_prefills,
@@ -308,7 +344,8 @@ def build(  # type: ignore[override]
         return attn_metadata
 
     def build_for_cudagraph_capture(
-            self, common_attn_metadata: CommonAttentionMetadata):
+        self, common_attn_metadata: CommonAttentionMetadata
+    ):
         """
         This method builds the metadata for full cudagraph capture.
         Currently, only decode is supported for full cudagraphs with Mamba.
@@ -317,16 +354,17 @@ def build_for_cudagraph_capture(
 
         assert (
             m.num_reqs <= self.decode_cudagraph_max_bs
-            and m.num_actual_tokens <= self.decode_cudagraph_max_bs), (
-                f"GDN only supports decode-only full CUDAGraph capture. "
-                f"Make sure batch size ({m.num_reqs}) <= "
-                f"cudagraph capture sizes ({self.decode_cudagraph_max_bs}), "
-                f"and number of tokens ({m.num_actual_tokens}) <= "
-                f"cudagraph capture sizes ({self.decode_cudagraph_max_bs}).")
+            and m.num_actual_tokens <= self.decode_cudagraph_max_bs
+        ), (
+            f"GDN only supports decode-only full CUDAGraph capture. "
+            f"Make sure batch size ({m.num_reqs}) <= "
+            f"cudagraph capture sizes ({self.decode_cudagraph_max_bs}), "
+            f"and number of tokens ({m.num_actual_tokens}) <= "
+            f"cudagraph capture sizes ({self.decode_cudagraph_max_bs})."
+        )
 
         num_accepted_tokens = torch.diff(m.query_start_loc)
         num_decode_draft_tokens_cpu = (num_accepted_tokens - 1).cpu()
         m.num_computed_tokens_cpu = m.seq_lens_cpu - num_accepted_tokens.cpu()
 
-        return self.build(0, m, num_accepted_tokens,
-                          num_decode_draft_tokens_cpu)
+        return self.build(0, m, num_accepted_tokens, num_decode_draft_tokens_cpu)
diff --git a/vllm/v1/attention/backends/linear_attn.py b/vllm/v1/attention/backends/linear_attn.py
index 0dc62d668020..1900c50849ec 100644
--- a/vllm/v1/attention/backends/linear_attn.py
+++ b/vllm/v1/attention/backends/linear_attn.py
@@ -6,14 +6,15 @@
 
 from vllm.attention.backends.abstract import AttentionBackend
 from vllm.config import VllmConfig
-from vllm.v1.attention.backends.utils import (AttentionMetadataBuilder,
-                                              CommonAttentionMetadata,
-                                              split_decodes_and_prefills)
+from vllm.v1.attention.backends.utils import (
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+    split_decodes_and_prefills,
+)
 from vllm.v1.kv_cache_interface import AttentionSpec, MambaSpec
 
 
 class LinearAttentionBackend(AttentionBackend):
-
     @staticmethod
     def get_builder_cls() -> type["LinearAttentionMetadataBuilder"]:
         return LinearAttentionMetadataBuilder
@@ -31,20 +32,25 @@ class LinearAttentionMetadata:
     state_indices_tensor: torch.Tensor  # shape: [batch,]
 
 
-class LinearAttentionMetadataBuilder(
-        AttentionMetadataBuilder[LinearAttentionMetadata]):
-
+class LinearAttentionMetadataBuilder(AttentionMetadataBuilder[LinearAttentionMetadata]):
     reorder_batch_threshold: int = 1
 
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
         super().__init__(kv_cache_spec, layer_names, vllm_config, device)
         assert isinstance(kv_cache_spec, MambaSpec)
 
-    def build(self,
-              common_prefix_len: int,
-              common_attn_metadata: CommonAttentionMetadata,
-              fast_build: bool = False) -> LinearAttentionMetadata:
+    def build(
+        self,
+        common_prefix_len: int,
+        common_attn_metadata: CommonAttentionMetadata,
+        fast_build: bool = False,
+    ) -> LinearAttentionMetadata:
         query_start_loc = common_attn_metadata.query_start_loc
         seq_lens = common_attn_metadata.seq_lens
 
@@ -52,8 +58,9 @@ def build(self,
 
         num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
             split_decodes_and_prefills(
-                common_attn_metadata,
-                decode_threshold=self.reorder_batch_threshold))
+                common_attn_metadata, decode_threshold=self.reorder_batch_threshold
+            )
+        )
 
         attn_metadata = LinearAttentionMetadata(
             num_prefills=num_prefills,
diff --git a/vllm/v1/attention/backends/mamba1_attn.py b/vllm/v1/attention/backends/mamba1_attn.py
index 7cbfa2c2c9a5..e305cb2d8702 100644
--- a/vllm/v1/attention/backends/mamba1_attn.py
+++ b/vllm/v1/attention/backends/mamba1_attn.py
@@ -8,14 +8,14 @@
 
 from vllm.attention.backends.abstract import AttentionBackend
 from vllm.attention.backends.utils import PAD_SLOT_ID
-from vllm.v1.attention.backends.mamba_attn import (
-    BaseMambaAttentionMetadataBuilder)
-from vllm.v1.attention.backends.utils import (CommonAttentionMetadata,
-                                              split_decodes_and_prefills)
+from vllm.v1.attention.backends.mamba_attn import BaseMambaAttentionMetadataBuilder
+from vllm.v1.attention.backends.utils import (
+    CommonAttentionMetadata,
+    split_decodes_and_prefills,
+)
 
 
 class Mamba1AttentionBackend(AttentionBackend):
-
     @staticmethod
     def get_builder_cls() -> type["Mamba1AttentionMetadataBuilder"]:
         return Mamba1AttentionMetadataBuilder
@@ -35,8 +35,8 @@ class Mamba1AttentionMetadata:
 
 
 class Mamba1AttentionMetadataBuilder(
-        BaseMambaAttentionMetadataBuilder[Mamba1AttentionMetadata]):
-
+    BaseMambaAttentionMetadataBuilder[Mamba1AttentionMetadata]
+):
     def build(
         self,
         common_prefix_len: int,
@@ -47,24 +47,30 @@ def build(
 
         state_indices_tensor = common_attn_metadata.block_table_tensor[:, 0]
         context_lens_tensor = common_attn_metadata.num_computed_tokens_cpu.to(
-            query_start_loc.device)
+            query_start_loc.device
+        )
 
         num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
             split_decodes_and_prefills(
-                common_attn_metadata,
-                decode_threshold=self.reorder_batch_threshold))
+                common_attn_metadata, decode_threshold=self.reorder_batch_threshold
+            )
+        )
 
         has_initial_states = None
         padded_decodes = num_decodes
 
         if num_prefills > 0:
             has_initial_states = context_lens_tensor > 0
-        elif (num_decodes > 0 and num_decodes <= self.decode_cudagraph_max_bs
-              and self.compilation_config.full_cuda_graph):
+        elif (
+            num_decodes > 0
+            and num_decodes <= self.decode_cudagraph_max_bs
+            and self.compilation_config.full_cuda_graph
+        ):
             state_indices_for_decode = state_indices_tensor[:num_decodes]
             padded_decodes = self.vllm_config.pad_for_cudagraph(num_decodes)
             self.state_indices_tensor[:num_decodes].copy_(
-                state_indices_for_decode, non_blocking=True)
+                state_indices_for_decode, non_blocking=True
+            )
             state_indices_tensor = self.state_indices_tensor[:padded_decodes]
             state_indices_tensor[num_decodes:] = PAD_SLOT_ID
 
diff --git a/vllm/v1/attention/backends/mamba2_attn.py b/vllm/v1/attention/backends/mamba2_attn.py
index 49fe1584e79c..ae8a0e92daf4 100644
--- a/vllm/v1/attention/backends/mamba2_attn.py
+++ b/vllm/v1/attention/backends/mamba2_attn.py
@@ -9,12 +9,13 @@
 from vllm.attention.backends.abstract import AttentionBackend
 from vllm.config import VllmConfig
 from vllm.utils import cdiv
-from vllm.v1.attention.backends.mamba_attn import (
-    BaseMambaAttentionMetadataBuilder)
-from vllm.v1.attention.backends.utils import (PAD_SLOT_ID,
-                                              CommonAttentionMetadata,
-                                              compute_causal_conv1d_metadata,
-                                              split_decodes_and_prefills)
+from vllm.v1.attention.backends.mamba_attn import BaseMambaAttentionMetadataBuilder
+from vllm.v1.attention.backends.utils import (
+    PAD_SLOT_ID,
+    CommonAttentionMetadata,
+    compute_causal_conv1d_metadata,
+    split_decodes_and_prefills,
+)
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 
@@ -68,27 +69,26 @@ def compute_varlen_chunk_metadata(
 
     # Exclusive prefix sum over logical-chunk lengths
     if chunk_lens:
-        cu_chunk_seqlens = torch.tensor([0] +
-                                        list(itertools.accumulate(chunk_lens)),
-                                        device=device,
-                                        dtype=torch.int32)
+        cu_chunk_seqlens = torch.tensor(
+            [0] + list(itertools.accumulate(chunk_lens)),
+            device=device,
+            dtype=torch.int32,
+        )
         # Final boundary must equal total tokens
         assert int(cu_chunk_seqlens[-1].item()) == total
     else:
         cu_chunk_seqlens = torch.tensor([0], device=device, dtype=torch.int32)
 
-    last_chunk_indices_t = (torch.tensor(
-        last_chunk_indices, device=device, dtype=torch.int32)
-                            if len(starts) > 0 else torch.empty(
-                                (0, ), device=device, dtype=torch.int32))
-    seq_idx_chunks_t = torch.tensor(seq_idx_chunks,
-                                    device=device,
-                                    dtype=torch.int32)
+    last_chunk_indices_t = (
+        torch.tensor(last_chunk_indices, device=device, dtype=torch.int32)
+        if len(starts) > 0
+        else torch.empty((0,), device=device, dtype=torch.int32)
+    )
+    seq_idx_chunks_t = torch.tensor(seq_idx_chunks, device=device, dtype=torch.int32)
     return cu_chunk_seqlens, last_chunk_indices_t, seq_idx_chunks_t
 
 
 class Mamba2AttentionBackend(AttentionBackend):
-
     @staticmethod
     def get_builder_cls() -> type["Mamba2AttentionMetadataBuilder"]:
         return Mamba2AttentionMetadataBuilder
@@ -135,37 +135,48 @@ class Mamba2AttentionMetadata:
 
 
 class Mamba2AttentionMetadataBuilder(
-        BaseMambaAttentionMetadataBuilder[Mamba2AttentionMetadata]):
-
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
+    BaseMambaAttentionMetadataBuilder[Mamba2AttentionMetadata]
+):
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
         super().__init__(kv_cache_spec, layer_names, vllm_config, device)
         self.chunk_size = vllm_config.model_config.get_mamba_chunk_size()
         assert self.chunk_size is not None, (
-            "chunk_size needs to be set in the model config for Mamba2 models")
+            "chunk_size needs to be set in the model config for Mamba2 models"
+        )
         if self.vllm_config.cache_config.enable_prefix_caching:
             self.state_indices_tensor = torch.empty(
-                (self.decode_cudagraph_max_bs,
-                 cdiv(vllm_config.model_config.max_model_len,
-                      kv_cache_spec.block_size)),
+                (
+                    self.decode_cudagraph_max_bs,
+                    cdiv(
+                        vllm_config.model_config.max_model_len, kv_cache_spec.block_size
+                    ),
+                ),
                 dtype=torch.int32,
                 device=device,
             )
             self.current_last_idx = torch.empty(
-                (self.decode_cudagraph_max_bs, ),
+                (self.decode_cudagraph_max_bs,),
                 dtype=torch.int32,
                 device=device,
             )
             self.last_state_idx = torch.empty(
-                (self.decode_cudagraph_max_bs, ),
+                (self.decode_cudagraph_max_bs,),
                 dtype=torch.int32,
                 device=device,
             )
 
-    def build(self,
-              common_prefix_len: int,
-              common_attn_metadata: CommonAttentionMetadata,
-              fast_build: bool = False) -> Mamba2AttentionMetadata:
+    def build(
+        self,
+        common_prefix_len: int,
+        common_attn_metadata: CommonAttentionMetadata,
+        fast_build: bool = False,
+    ) -> Mamba2AttentionMetadata:
         num_reqs = common_attn_metadata.num_reqs
         seq_lens = common_attn_metadata.seq_lens
 
@@ -192,12 +203,11 @@ def build(self,
             # Additional cache-related varaiables:
             mamba_block_size = self.kv_cache_spec.block_size
             seq_lens_pending = (
-                torch.roll(common_attn_metadata.query_start_loc, -1, -1) -
-                common_attn_metadata.query_start_loc)[:-1]
-            context_lens = common_attn_metadata.seq_lens - \
-                                 seq_lens_pending
-            last_computed_offset = \
-                context_lens % mamba_block_size
+                torch.roll(common_attn_metadata.query_start_loc, -1, -1)
+                - common_attn_metadata.query_start_loc
+            )[:-1]
+            context_lens = common_attn_metadata.seq_lens - seq_lens_pending
+            last_computed_offset = context_lens % mamba_block_size
             # Indices: last_computed <= current_first <= current_last
             # Cases:
             #  last_computed == current_first  if last state was partially
@@ -205,55 +215,65 @@ def build(self,
             #  current_first == current_last   if no block crossing occurs, and
             #                                  only one state will be stored
             # 0th based indexing leads to "-1" -> e.g. 16 computed -> state[15]:
-            current_last_idx = cdiv(context_lens + seq_lens_pending,
-                                    mamba_block_size) - 1
+            current_last_idx = (
+                cdiv(context_lens + seq_lens_pending, mamba_block_size) - 1
+            )
             current_first_idx = cdiv(context_lens + 1, mamba_block_size) - 1
             last_state_idx = cdiv(context_lens, mamba_block_size) - 1
             # -1 in case it's non-computed and causes later issues with indexing
-            last_state_idx = \
-                last_state_idx.clamp(min=0)
+            last_state_idx = last_state_idx.clamp(min=0)
 
         else:
             # Always return just a single block per each request:
-            state_indices_tensor = common_attn_metadata.block_table_tensor[:,
-                                                                           0]
+            state_indices_tensor = common_attn_metadata.block_table_tensor[:, 0]
             # Additional cache-related varaiables:
             current_last_idx = None
             last_state_idx = None
 
         num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
             split_decodes_and_prefills(
-                common_attn_metadata,
-                decode_threshold=self.reorder_batch_threshold))
+                common_attn_metadata, decode_threshold=self.reorder_batch_threshold
+            )
+        )
 
         # Compute seq_idx for prefill only
         if num_prefills > 0:
-            #[batch,]
+            # [batch,]
             has_initial_states_cpu = (
-                common_attn_metadata.
-                num_computed_tokens_cpu[num_reqs - num_prefills:num_reqs] > 0)
+                common_attn_metadata.num_computed_tokens_cpu[
+                    num_reqs - num_prefills : num_reqs
+                ]
+                > 0
+            )
             prep_initial_states = torch.any(has_initial_states_cpu).item()
             has_initial_states_p = has_initial_states_cpu.to(
-                common_attn_metadata.query_start_loc.device)
+                common_attn_metadata.query_start_loc.device
+            )
 
-            query_start_loc_p = common_attn_metadata.query_start_loc[
-                -num_prefills - 1:] - num_decode_tokens
+            query_start_loc_p = (
+                common_attn_metadata.query_start_loc[-num_prefills - 1 :]
+                - num_decode_tokens
+            )
 
             if self.vllm_config.cache_config.enable_prefix_caching:
                 assert context_lens is not None
-                context_lens_p = context_lens[num_reqs - num_prefills:num_reqs]
+                context_lens_p = context_lens[num_reqs - num_prefills : num_reqs]
                 assert last_computed_offset is not None
                 last_computed_offset_p = last_computed_offset[
-                    num_reqs - num_prefills:num_reqs]
+                    num_reqs - num_prefills : num_reqs
+                ]
                 assert current_first_idx is not None
-                current_first_idx_p = current_first_idx[num_reqs -
-                                                        num_prefills:num_reqs]
-
-            num_computed_tokens_p = \
-                common_attn_metadata.num_computed_tokens_cpu[
-                    num_reqs - num_prefills:num_reqs]
-            query_start_loc_p_cpu = common_attn_metadata.query_start_loc_cpu[
-                -num_prefills - 1:] - num_decode_tokens
+                current_first_idx_p = current_first_idx[
+                    num_reqs - num_prefills : num_reqs
+                ]
+
+            num_computed_tokens_p = common_attn_metadata.num_computed_tokens_cpu[
+                num_reqs - num_prefills : num_reqs
+            ]
+            query_start_loc_p_cpu = (
+                common_attn_metadata.query_start_loc_cpu[-num_prefills - 1 :]
+                - num_decode_tokens
+            )
 
             # The code below carefully constructs the chunks such that:
             # 1. Chunks contain tokens from a *single* sequence only.
@@ -271,8 +291,10 @@ def build(self,
             seqlen_pos = 0
             for req_idx in range(num_prefills):
                 this_num_computed = num_computed_tokens_p[req_idx].item()
-                this_new_tokens = query_start_loc_p_cpu[req_idx + 1].item(
-                ) - query_start_loc_p_cpu[req_idx].item()
+                this_new_tokens = (
+                    query_start_loc_p_cpu[req_idx + 1].item()
+                    - query_start_loc_p_cpu[req_idx].item()
+                )
 
                 # if computed tokens are not chunk-aligned, use the first
                 # chunk to finish it off
@@ -280,8 +302,10 @@ def build(self,
                     seq_idx.append(req_idx)
                     cu_chunk_seqlen.append(seqlen_pos)
                     # how many tokens to finish the chunk?
-                    chunk_len = cdiv(this_num_computed, self.chunk_size
-                                     ) * self.chunk_size - this_num_computed
+                    chunk_len = (
+                        cdiv(this_num_computed, self.chunk_size) * self.chunk_size
+                        - this_num_computed
+                    )
                     # we can only use at most this_new_tokens
                     chunk_len = min(chunk_len, this_new_tokens)
                     seqlen_pos += chunk_len
@@ -300,40 +324,40 @@ def build(self,
 
             cu_chunk_seqlen.append(seqlen_pos)
 
-            seq_idx_p = torch.as_tensor(seq_idx,
-                                        device=query_start_loc_p.device,
-                                        dtype=torch.int32)
+            seq_idx_p = torch.as_tensor(
+                seq_idx, device=query_start_loc_p.device, dtype=torch.int32
+            )
             cu_chunk_seqlen_p = torch.as_tensor(
-                cu_chunk_seqlen,
-                device=query_start_loc_p.device,
-                dtype=torch.int32)
+                cu_chunk_seqlen, device=query_start_loc_p.device, dtype=torch.int32
+            )
             last_chunk_indices_p = torch.as_tensor(
-                last_chunk_indices,
-                device=query_start_loc_p.device,
-                dtype=torch.int32)
+                last_chunk_indices, device=query_start_loc_p.device, dtype=torch.int32
+            )
 
-            nums_dict, batch_ptr, token_chunk_offset_ptr = \
+            nums_dict, batch_ptr, token_chunk_offset_ptr = (
                 compute_causal_conv1d_metadata(query_start_loc_p)
+            )
 
         elif num_decodes <= self.decode_cudagraph_max_bs:
             # Pad state tensor for CUDA graph
             num_input_tokens = self.vllm_config.pad_for_cudagraph(num_decodes)
-            self.state_indices_tensor[:num_decodes].copy_(state_indices_tensor,
-                                                          non_blocking=True)
+            self.state_indices_tensor[:num_decodes].copy_(
+                state_indices_tensor, non_blocking=True
+            )
             state_indices_tensor = self.state_indices_tensor[:num_input_tokens]
             state_indices_tensor[num_decodes:] = PAD_SLOT_ID
 
             if self.vllm_config.cache_config.enable_prefix_caching:
-                self.current_last_idx[:num_decodes].copy_(current_last_idx,
-                                                          non_blocking=True)
-                current_last_idx = \
-                    self.current_last_idx[:num_input_tokens]
+                self.current_last_idx[:num_decodes].copy_(
+                    current_last_idx, non_blocking=True
+                )
+                current_last_idx = self.current_last_idx[:num_input_tokens]
                 current_last_idx[num_decodes:] = 0
 
-                self.last_state_idx[:num_decodes].copy_(last_state_idx,
-                                                        non_blocking=True)
-                last_state_idx = \
-                    self.last_state_idx[:num_input_tokens]
+                self.last_state_idx[:num_decodes].copy_(
+                    last_state_idx, non_blocking=True
+                )
+                last_state_idx = self.last_state_idx[:num_input_tokens]
                 last_state_idx[num_decodes:] = 0
 
         attn_metadata = Mamba2AttentionMetadata(
diff --git a/vllm/v1/attention/backends/mamba_attn.py b/vllm/v1/attention/backends/mamba_attn.py
index ef342ce421ae..5aafb9813df0 100644
--- a/vllm/v1/attention/backends/mamba_attn.py
+++ b/vllm/v1/attention/backends/mamba_attn.py
@@ -7,9 +7,11 @@
 import torch
 
 from vllm.config import VllmConfig
-from vllm.v1.attention.backends.utils import (AttentionCGSupport,
-                                              AttentionMetadataBuilder,
-                                              CommonAttentionMetadata)
+from vllm.v1.attention.backends.utils import (
+    AttentionCGSupport,
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+)
 from vllm.v1.kv_cache_interface import AttentionSpec, MambaSpec
 
 M = TypeVar("M")
@@ -17,35 +19,44 @@
 
 class BaseMambaAttentionMetadataBuilder(AttentionMetadataBuilder[M], abc.ABC):
     reorder_batch_threshold: int = 1
-    cudagraph_support: ClassVar[AttentionCGSupport] = \
+    cudagraph_support: ClassVar[AttentionCGSupport] = (
         AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
-
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
+    )
+
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
         super().__init__(kv_cache_spec, layer_names, vllm_config, device)
 
         assert isinstance(kv_cache_spec, MambaSpec)
         self.compilation_config = vllm_config.compilation_config
         self.decode_cudagraph_max_bs = min(
             self.vllm_config.scheduler_config.max_num_seqs,
-            self.compilation_config.max_capture_size)
+            self.compilation_config.max_capture_size,
+        )
         self.state_indices_tensor = torch.empty(
-            (self.decode_cudagraph_max_bs, ),
+            (self.decode_cudagraph_max_bs,),
             dtype=torch.int32,
             device=device,
         )
 
     def build_for_cudagraph_capture(
-            self, common_attn_metadata: CommonAttentionMetadata) -> M:
+        self, common_attn_metadata: CommonAttentionMetadata
+    ) -> M:
         """
         This method builds the metadata for full cudagraph capture.
         Currently, only decode is supported for full cudagraphs with Mamba.
         """
         m = common_attn_metadata
 
-        assert m.num_reqs == m.num_actual_tokens, \
-            "Mamba only supports decode-only full CUDAGraph capture. " \
+        assert m.num_reqs == m.num_actual_tokens, (
+            "Mamba only supports decode-only full CUDAGraph capture. "
             "Make sure all cudagraph capture sizes <= max_num_seq."
+        )
 
         m.max_query_len = 1  # decode-only
 
diff --git a/vllm/v1/attention/backends/mla/common.py b/vllm/v1/attention/backends/mla/common.py
index 963f1c5abf2a..a266f89bbb6a 100755
--- a/vllm/v1/attention/backends/mla/common.py
+++ b/vllm/v1/attention/backends/mla/common.py
@@ -197,9 +197,12 @@
 
 import vllm.envs as envs
 from vllm import _custom_ops as ops
-from vllm.attention.backends.abstract import (AttentionBackend, AttentionLayer,
-                                              AttentionMetadata,
-                                              MLAAttentionImpl)
+from vllm.attention.backends.abstract import (
+    AttentionBackend,
+    AttentionLayer,
+    AttentionMetadata,
+    MLAAttentionImpl,
+)
 from vllm.attention.backends.utils import get_mla_dims
 from vllm.attention.ops.common import cp_lse_ag_out_rs
 from vllm.attention.ops.merge_attn_states import merge_attn_states
@@ -207,21 +210,26 @@
 from vllm.config import VllmConfig, get_current_vllm_config
 from vllm.distributed.parallel_state import get_dcp_group, is_global_first_rank
 from vllm.logger import init_logger
-from vllm.model_executor.layers.linear import (ColumnParallelLinear,
-                                               LinearBase,
-                                               UnquantizedLinearMethod)
+from vllm.model_executor.layers.linear import (
+    ColumnParallelLinear,
+    LinearBase,
+    UnquantizedLinearMethod,
+)
 from vllm.platforms import current_platform
 from vllm.utils import cdiv, round_down
 from vllm.utils.flashinfer import has_nvidia_artifactory
-from vllm.v1.attention.backends.utils import (AttentionMetadataBuilder,
-                                              CommonAttentionMetadata,
-                                              get_per_layer_parameters,
-                                              infer_global_hyperparameters,
-                                              split_decodes_and_prefills)
+from vllm.v1.attention.backends.utils import (
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+    get_per_layer_parameters,
+    infer_global_hyperparameters,
+    split_decodes_and_prefills,
+)
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 try:
     from vllm.vllm_flash_attn import flash_attn_varlen_func
+
     is_vllm_fa = True
 except ImportError:
     # For rocm use upstream flash attention
@@ -231,26 +239,29 @@
 
 try:
     from flashinfer import BatchPrefillWithRaggedKVCacheWrapper
-    from flashinfer.prefill import (  # noqa: F401
-        cudnn_batch_prefill_with_kv_cache)
+    from flashinfer.prefill import cudnn_batch_prefill_with_kv_cache  # noqa: F401
+
     flashinfer_available = True
 except ImportError:
     flashinfer_available = False
 
 
 def is_rocm_aiter_fp8bmm_enabled() -> bool:
-    return current_platform.is_rocm() \
-        and envs.VLLM_ROCM_USE_AITER_FP8BMM \
+    return (
+        current_platform.is_rocm()
+        and envs.VLLM_ROCM_USE_AITER_FP8BMM
         and envs.VLLM_ROCM_USE_AITER
+    )
 
 
 if is_rocm_aiter_fp8bmm_enabled():
     from aiter.ops.triton.batched_gemm_a8w8_a_per_token_group_prequant_w_per_batched_tensor_quant import (  # noqa: E501 # isort: skip
-        batched_gemm_a8w8_a_per_token_group_prequant_w_per_batched_tensor_quant
-        as aiter_triton_fp8_bmm)
+        batched_gemm_a8w8_a_per_token_group_prequant_w_per_batched_tensor_quant as aiter_triton_fp8_bmm,
+    )
 
     def dynamic_per_batched_tensor_quant(
-            x: torch.Tensor, dtype: torch.dtype = torch.float8_e4m3fn):
+        x: torch.Tensor, dtype: torch.dtype = torch.float8_e4m3fn
+    ):
         DTYPE_MAX = torch.finfo(dtype).max
         min_val, max_val = x.aminmax()
         amax = torch.maximum(min_val.abs(), max_val.abs()).clamp(min=1e-10)
@@ -265,7 +276,6 @@ def dynamic_per_batched_tensor_quant(
 
 
 class MLACommonBackend(AttentionBackend):
-
     accept_output_buffer: bool = True
 
     @staticmethod
@@ -307,12 +317,13 @@ def validate_head_size(cls, head_size: int) -> None:
                 f"Head size {head_size} is not supported by {attn_type}. "
                 f"Supported head sizes are: {supported_head_sizes}. "
                 "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes.")
+                "FlexAttention backend which supports all head sizes."
+            )
 
 
 @dataclass
 class MLACommonPrefillMetadata:
-    """ Prefill Specific Metadata """
+    """Prefill Specific Metadata"""
 
     @dataclass
     class ChunkedContextMetadata:
@@ -340,16 +351,15 @@ class ChunkedContextMetadata:
 
 @dataclass
 class FlashInferPrefillMetadata(MLACommonPrefillMetadata):
-    prefill_main: Optional['BatchPrefillWithRaggedKVCacheWrapper'] = None
-    prefill_chunks: list['BatchPrefillWithRaggedKVCacheWrapper'] = field(
-        default_factory=list)
+    prefill_main: Optional["BatchPrefillWithRaggedKVCacheWrapper"] = None
+    prefill_chunks: list["BatchPrefillWithRaggedKVCacheWrapper"] = field(
+        default_factory=list
+    )
 
 
 @dataclass
 class CudnnPrefillMetadata(MLACommonPrefillMetadata):
-
-    class ChunkedContextMetadata(
-            MLACommonPrefillMetadata.ChunkedContextMetadata):
+    class ChunkedContextMetadata(MLACommonPrefillMetadata.ChunkedContextMetadata):
         seq_lens: torch.Tensor
 
     query_seq_lens: Optional[torch.Tensor] = None
@@ -372,6 +382,7 @@ class MLACommonMetadata(Generic[D]):
     NOTE: Please read the comment at the top of the file before trying to
     understand this class
     """
+
     # NOTE(sang): Definition of context_len, query_len, and seq_len.
     # |---------- N-1 iteration --------|
     # |---------------- N iteration ---------------------|
@@ -398,9 +409,9 @@ class MLACommonMetadata(Generic[D]):
     head_dim: Optional[int] = None
 
     decode: Optional[D] = None
-    prefill: Optional[Union[MLACommonPrefillMetadata,
-                            FlashInferPrefillMetadata,
-                            CudnnPrefillMetadata]] = None
+    prefill: Optional[
+        Union[MLACommonPrefillMetadata, FlashInferPrefillMetadata, CudnnPrefillMetadata]
+    ] = None
 
     def __post_init__(self):
         if self.head_dim is not None:
@@ -414,15 +425,21 @@ def __post_init__(self):
 def use_flashinfer_prefill() -> bool:
     # For blackwell default to flashinfer prefill if it's available since
     # it is faster than FA2.
-    return (not envs.VLLM_DISABLE_FLASHINFER_PREFILL and flashinfer_available
-            and not envs.VLLM_USE_CUDNN_PREFILL
-            and current_platform.is_device_capability(100))
+    return (
+        not envs.VLLM_DISABLE_FLASHINFER_PREFILL
+        and flashinfer_available
+        and not envs.VLLM_USE_CUDNN_PREFILL
+        and current_platform.is_device_capability(100)
+    )
 
 
 def use_cudnn_prefill() -> bool:
-    return (flashinfer_available and envs.VLLM_USE_CUDNN_PREFILL
-            and current_platform.is_device_capability(100)
-            and has_nvidia_artifactory())
+    return (
+        flashinfer_available
+        and envs.VLLM_USE_CUDNN_PREFILL
+        and current_platform.is_device_capability(100)
+        and has_nvidia_artifactory()
+    )
 
 
 # Currently 394MB, this can be tuned based on GEMM sizes used.
@@ -436,19 +453,21 @@ class MLACommonMetadataBuilder(AttentionMetadataBuilder[M]):
     NOTE: Please read the comment at the top of the file before trying to
     understand this class
     """
+
     reorder_batch_threshold: int = 1
 
     @staticmethod
-    def determine_chunked_prefill_workspace_size(
-            vllm_config: VllmConfig) -> int:
+    def determine_chunked_prefill_workspace_size(vllm_config: VllmConfig) -> int:
         scheduler_config = vllm_config.scheduler_config
         cache_config = vllm_config.cache_config
         model_config = vllm_config.model_config
 
         chunked_prefill_workspace_size = min(
             # Try for 8 full length request or at least 4 pages per-request
-            max(8 * model_config.max_model_len,
-                4 * scheduler_config.max_num_seqs * cache_config.block_size),
+            max(
+                8 * model_config.max_model_len,
+                4 * scheduler_config.max_num_seqs * cache_config.block_size,
+            ),
             # For long-context models try not to over-allocate limiting
             # kv-cache space, limiting it to 64k tokens,
             # which would result in the workspace being:
@@ -457,23 +476,28 @@ def determine_chunked_prefill_workspace_size(
             # which would result in up-projected context being
             #   2*(192*128)*(64*1024) = 3gb
             # (assuming 192 QK head dim, 128 heads, and fp16)
-            64 * 1024)
+            64 * 1024,
+        )
 
         # Enforce that we enough for at least 1 page per request
         chunked_prefill_workspace_size = max(
             chunked_prefill_workspace_size,
-            scheduler_config.max_num_seqs * cache_config.block_size)
+            scheduler_config.max_num_seqs * cache_config.block_size,
+        )
 
         return chunked_prefill_workspace_size
 
-    def __init__(self,
-                 kv_cache_spec: AttentionSpec,
-                 layer_names: list[str],
-                 vllm_config: VllmConfig,
-                 device: torch.device,
-                 metadata_cls: Optional[type[M]] = None):
-        self.metadata_cls = metadata_cls \
-            if metadata_cls is not None else MLACommonMetadata
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+        metadata_cls: Optional[type[M]] = None,
+    ):
+        self.metadata_cls = (
+            metadata_cls if metadata_cls is not None else MLACommonMetadata
+        )
         self.kv_cache_spec = kv_cache_spec
         scheduler_config = vllm_config.scheduler_config
         self.model_config = vllm_config.model_config
@@ -481,8 +505,7 @@ def __init__(self,
         self.compilation_config = vllm_config.compilation_config
         self.device = device
 
-        self.num_heads = self.model_config.get_num_attention_heads(
-            parallel_config)
+        self.num_heads = self.model_config.get_num_attention_heads(parallel_config)
         self.mla_dims = get_mla_dims(self.model_config)
         self.aot_schedule = current_platform.is_cuda()
         try:
@@ -497,27 +520,31 @@ def __init__(self,
         if self.aot_schedule:
             self.page_size = self.kv_cache_spec.block_size
 
-        self.chunked_prefill_workspace_size = \
+        self.chunked_prefill_workspace_size = (
             self.determine_chunked_prefill_workspace_size(vllm_config)
+        )
 
         if self.dcp_world_size > 1:
             # Note(hc): The local kvcache is incomplete when DCP is triggered,
             # an additional kvcache allgather across the DCP group is therefore
             # required, so the workspace has to be enlarged by 1/DCP relative
             # to the original TP allocation.
-            assert self.chunked_prefill_workspace_size % \
-                self.dcp_world_size == 0
+            assert self.chunked_prefill_workspace_size % self.dcp_world_size == 0
             self.chunked_prefill_workspace = torch.empty(
-                (self.chunked_prefill_workspace_size +
-                 self.chunked_prefill_workspace_size // self.dcp_world_size,
-                 self.model_config.get_head_size()),
+                (
+                    self.chunked_prefill_workspace_size
+                    + self.chunked_prefill_workspace_size // self.dcp_world_size,
+                    self.model_config.get_head_size(),
+                ),
                 dtype=self.model_config.dtype,
                 device=device,
             )
         else:
             self.chunked_prefill_workspace = torch.empty(
-                (self.chunked_prefill_workspace_size,
-                 self.model_config.get_head_size()),
+                (
+                    self.chunked_prefill_workspace_size,
+                    self.model_config.get_head_size(),
+                ),
                 dtype=self.model_config.dtype,
                 device=device,
             )
@@ -526,23 +553,23 @@ def __init__(self,
         self._use_fi_prefill = use_flashinfer_prefill()
         self.prefill_metadata_cls = (
             FlashInferPrefillMetadata
-            if self._use_fi_prefill else CudnnPrefillMetadata
-            if self._use_cudnn_prefill else MLACommonPrefillMetadata)
+            if self._use_fi_prefill
+            else CudnnPrefillMetadata
+            if self._use_cudnn_prefill
+            else MLACommonPrefillMetadata
+        )
 
         if self._use_fi_prefill:
             self._workspace_buffer = torch.empty(
-                FLASHINFER_WORKSPACE_BUFFER_SIZE,
-                dtype=torch.uint8,
-                device=device)
+                FLASHINFER_WORKSPACE_BUFFER_SIZE, dtype=torch.uint8, device=device
+            )
 
-            self._fi_prefill_main: Optional[
-                BatchPrefillWithRaggedKVCacheWrapper] = None
-            self._fi_prefill_chunks: list[
-                BatchPrefillWithRaggedKVCacheWrapper] = []
+            self._fi_prefill_main: Optional[BatchPrefillWithRaggedKVCacheWrapper] = None
+            self._fi_prefill_chunks: list[BatchPrefillWithRaggedKVCacheWrapper] = []
 
             self._global_hyperparameters = infer_global_hyperparameters(
-                get_per_layer_parameters(vllm_config, layer_names,
-                                         MLACommonImpl))
+                get_per_layer_parameters(vllm_config, layer_names, MLACommonImpl)
+            )
 
         if self._use_cudnn_prefill:
             self.cudnn_workspace = torch.empty(
@@ -561,7 +588,8 @@ def _build_fi_prefill_wrappers(self, prefill: FlashInferPrefillMetadata):
 
         if self._fi_prefill_main is None:
             self._fi_prefill_main = BatchPrefillWithRaggedKVCacheWrapper(
-                self._workspace_buffer, "NHD", backend="cutlass")
+                self._workspace_buffer, "NHD", backend="cutlass"
+            )
 
         if has_context:
             num_chunks = chunked_context.cu_seq_lens.shape[0]
@@ -570,7 +598,9 @@ def _build_fi_prefill_wrappers(self, prefill: FlashInferPrefillMetadata):
                 for _ in range(len(self._fi_prefill_chunks), num_chunks):
                     self._fi_prefill_chunks.append(
                         BatchPrefillWithRaggedKVCacheWrapper(
-                            self._workspace_buffer, "NHD", backend="cutlass"))
+                            self._workspace_buffer, "NHD", backend="cutlass"
+                        )
+                    )
             assert num_chunks <= len(self._fi_prefill_chunks)
 
         # In MLA, the non-latent num_qo_heads == num_kv_heads
@@ -581,8 +611,7 @@ def _build_fi_prefill_wrappers(self, prefill: FlashInferPrefillMetadata):
         assert self.kv_cache_spec.num_kv_heads == 1
 
         # Get non-latent head_dim_qk and head_dim_vo
-        head_dim_qk = (self.mla_dims.qk_nope_head_dim +
-                       self.mla_dims.qk_rope_head_dim)
+        head_dim_qk = self.mla_dims.qk_nope_head_dim + self.mla_dims.qk_rope_head_dim
         head_dim_vo = self.mla_dims.v_head_dim
 
         # For main run, qo_indptr == kv_indptr
@@ -618,45 +647,50 @@ def _build_fi_prefill_wrappers(self, prefill: FlashInferPrefillMetadata):
                     causal=False,  # This is context run
                     sm_scale=self._global_hyperparameters.sm_scale,
                     window_left=self._global_hyperparameters.window_left,
-                    logits_soft_cap=self._global_hyperparameters.
-                    logits_soft_cap,
+                    logits_soft_cap=self._global_hyperparameters.logits_soft_cap,
                     q_data_type=self.model_config.dtype,
                 )
 
         prefill.prefill_main = self._fi_prefill_main
         prefill.prefill_chunks = self._fi_prefill_chunks
 
-    def _build_decode(self, block_table_tensor: torch.Tensor,
-                      seq_lens_cpu: torch.Tensor,
-                      seq_lens_device: torch.Tensor,
-                      query_start_loc_cpu: torch.Tensor,
-                      query_start_loc_device: torch.Tensor,
-                      num_decode_tokens: int) -> MLACommonDecodeMetadata:
+    def _build_decode(
+        self,
+        block_table_tensor: torch.Tensor,
+        seq_lens_cpu: torch.Tensor,
+        seq_lens_device: torch.Tensor,
+        query_start_loc_cpu: torch.Tensor,
+        query_start_loc_device: torch.Tensor,
+        num_decode_tokens: int,
+    ) -> MLACommonDecodeMetadata:
         return MLACommonDecodeMetadata(
             block_table=block_table_tensor,
             seq_lens=seq_lens_device,
         )
 
     def build_for_cudagraph_capture(
-            self, common_attn_metadata: CommonAttentionMetadata) -> M:
+        self, common_attn_metadata: CommonAttentionMetadata
+    ) -> M:
         """
         This method builds the metadata for full cudagraph capture.
         Currently, only decode is supported for full cudagraphs with MLA.
         """
         m = common_attn_metadata
-        assert m.num_reqs <= (m.num_actual_tokens *
-                              self.reorder_batch_threshold), \
-            "MLA only supports decode-only full CUDAGraph capture. " \
+        assert m.num_reqs <= (m.num_actual_tokens * self.reorder_batch_threshold), (
+            "MLA only supports decode-only full CUDAGraph capture. "
             "Make sure all cudagraph capture sizes <= max_num_seq."
+        )
 
         assert m.max_query_len <= self.reorder_batch_threshold  # decode only
 
         return self.build(0, m)
 
-    def build(self,
-              common_prefix_len: int,
-              common_attn_metadata: CommonAttentionMetadata,
-              fast_build: bool = False) -> M:
+    def build(
+        self,
+        common_prefix_len: int,
+        common_attn_metadata: CommonAttentionMetadata,
+        fast_build: bool = False,
+    ) -> M:
         num_reqs = common_attn_metadata.num_reqs
         num_tokens = common_attn_metadata.num_actual_tokens
         max_query_len = common_attn_metadata.max_query_len
@@ -676,18 +710,19 @@ def build(self,
 
         query_seq_lens_cpu = query_start_loc_cpu[1:] - query_start_loc_cpu[:-1]
 
-        num_computed_tokens_cpu = (common_attn_metadata.seq_lens_cpu -
-                                   query_seq_lens_cpu)
+        num_computed_tokens_cpu = common_attn_metadata.seq_lens_cpu - query_seq_lens_cpu
 
-        num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = \
-            split_decodes_and_prefills(common_attn_metadata,
-                                       decode_threshold=self.reorder_batch_threshold)
+        num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
+            split_decodes_and_prefills(
+                common_attn_metadata, decode_threshold=self.reorder_batch_threshold
+            )
+        )
 
         # Note(hc): update seq_lens of decode reqs under DCP.
         if self.dcp_world_size > 1:
-            seq_lens[:num_decodes] = seq_lens[:num_decodes] \
-                // self.dcp_world_size + (self.dcp_rank <= \
-                (seq_lens[:num_decodes] - 1) % self.dcp_world_size)
+            seq_lens[:num_decodes] = seq_lens[:num_decodes] // self.dcp_world_size + (
+                self.dcp_rank <= (seq_lens[:num_decodes] - 1) % self.dcp_world_size
+            )
 
         assert num_decodes + num_prefills == num_reqs
         assert num_decode_tokens + num_prefill_tokens == num_tokens
@@ -698,13 +733,15 @@ def build(self,
 
             context_lens_cpu = num_computed_tokens_cpu[reqs_start:num_reqs]
             # Note(hc): The context lengths in the perspective of dcp rank0.
-            cp_context_lens_cpu = torch.ceil(context_lens_cpu.float() /
-                                             self.dcp_world_size).int()
+            cp_context_lens_cpu = torch.ceil(
+                context_lens_cpu.float() / self.dcp_world_size
+            ).int()
             origin_context_lens = context_lens_cpu.tolist()
             max_context_len_cpu = context_lens_cpu.max().item()
             num_prefills_with_context_cpu = (context_lens_cpu > 0).sum().item()
-            prefill_query_start_loc = query_start_loc[
-                reqs_start:] - query_start_loc[reqs_start]
+            prefill_query_start_loc = (
+                query_start_loc[reqs_start:] - query_start_loc[reqs_start]
+            )
 
             chunked_context_metadata = None
             if max_context_len_cpu > 0:
@@ -716,16 +753,16 @@ def build(self,
                 # prefill in the batch, we could probably use a more advanced
                 # algorithm here and allocate more workspace to prefills with
                 # longer context lengths
-                max_context_chunk = (self.chunked_prefill_workspace_size //
-                                     num_prefills_with_context_cpu)
+                max_context_chunk = (
+                    self.chunked_prefill_workspace_size // num_prefills_with_context_cpu
+                )
 
                 if self.aot_schedule:
                     # align max_context_chunk to page_size by rounding down,
                     # currently the `gather_and_maybe_dequant_cache` kernel
                     # cannot handle `context_chunk_starts` that are not aligned
                     # to page_size
-                    max_context_chunk = round_down(max_context_chunk,
-                                                   self.page_size)
+                    max_context_chunk = round_down(max_context_chunk, self.page_size)
 
                 assert max_context_chunk > 0
                 num_chunks = cdiv(max_context_len_cpu, max_context_chunk)
@@ -736,22 +773,23 @@ def build(self,
                 #  [[0, 0, 0, 0], [256, 256, 256, 256], [512, 512, 512, 512]]
                 # Note(simon): this is done in CPU because of downstream's
                 # of `to_list`.
-                chunk_starts = \
-                    torch.arange(num_chunks, dtype=torch.int32) \
-                    .unsqueeze(1).expand(-1, num_prefills) \
+                chunk_starts = (
+                    torch.arange(num_chunks, dtype=torch.int32)
+                    .unsqueeze(1)
+                    .expand(-1, num_prefills)
                     * max_context_chunk
-                chunk_ends = torch.min(context_lens_cpu.unsqueeze(0),
-                                       chunk_starts + max_context_chunk)
+                )
+                chunk_ends = torch.min(
+                    context_lens_cpu.unsqueeze(0), chunk_starts + max_context_chunk
+                )
                 chunk_seq_lens = (chunk_ends - chunk_starts).clamp(min=0)
 
-                cu_seq_lens_cpu = torch.zeros(num_chunks,
-                                              num_prefills + 1,
-                                              dtype=torch.int32,
-                                              pin_memory=True)
-                torch.cumsum(chunk_seq_lens,
-                             dim=1,
-                             out=cu_seq_lens_cpu[:, 1:],
-                             dtype=torch.int32)
+                cu_seq_lens_cpu = torch.zeros(
+                    num_chunks, num_prefills + 1, dtype=torch.int32, pin_memory=True
+                )
+                torch.cumsum(
+                    chunk_seq_lens, dim=1, out=cu_seq_lens_cpu[:, 1:], dtype=torch.int32
+                )
 
                 if self.dcp_world_size > 1:
                     # Note(hc): The above max_context_chunk already enforces
@@ -760,36 +798,37 @@ def build(self,
                     # cp_gather_cache which not require `cp_chunk_starts`
                     # aligned to page_size.
                     assert max_context_chunk % self.dcp_world_size == 0
-                    cp_max_context_chunk = max_context_chunk // \
-                        self.dcp_world_size
-                    cp_chunk_starts = \
-                        torch.arange(num_chunks, dtype=torch.int32) \
-                        .unsqueeze(1).expand(-1, num_prefills) \
+                    cp_max_context_chunk = max_context_chunk // self.dcp_world_size
+                    cp_chunk_starts = (
+                        torch.arange(num_chunks, dtype=torch.int32)
+                        .unsqueeze(1)
+                        .expand(-1, num_prefills)
                         * cp_max_context_chunk
+                    )
                     cp_chunk_ends = torch.min(
                         cp_context_lens_cpu.unsqueeze(0),
-                        cp_chunk_starts + cp_max_context_chunk)
-                    cp_chunk_seq_lens = (cp_chunk_ends -
-                                         cp_chunk_starts).clamp(min=0)
-
-                    cp_cu_seq_lens_cpu = torch.zeros(num_chunks,
-                                                     num_prefills + 1,
-                                                     dtype=torch.int32,
-                                                     pin_memory=True)
-                    torch.cumsum(cp_chunk_seq_lens,
-                                 dim=1,
-                                 out=cp_cu_seq_lens_cpu[:, 1:],
-                                 dtype=torch.int32)
-
-                chunked_context_metadata_cls = \
-                    CudnnPrefillMetadata.ChunkedContextMetadata \
-                    if self._use_cudnn_prefill else \
-                        MLACommonPrefillMetadata.ChunkedContextMetadata
+                        cp_chunk_starts + cp_max_context_chunk,
+                    )
+                    cp_chunk_seq_lens = (cp_chunk_ends - cp_chunk_starts).clamp(min=0)
+
+                    cp_cu_seq_lens_cpu = torch.zeros(
+                        num_chunks, num_prefills + 1, dtype=torch.int32, pin_memory=True
+                    )
+                    torch.cumsum(
+                        cp_chunk_seq_lens,
+                        dim=1,
+                        out=cp_cu_seq_lens_cpu[:, 1:],
+                        dtype=torch.int32,
+                    )
+
+                chunked_context_metadata_cls = (
+                    CudnnPrefillMetadata.ChunkedContextMetadata
+                    if self._use_cudnn_prefill
+                    else MLACommonPrefillMetadata.ChunkedContextMetadata
+                )
                 if self.dcp_world_size > 1:
-                    chunked_context_metadata = \
-                        chunked_context_metadata_cls(
-                        cu_seq_lens=cu_seq_lens_cpu \
-                            .to(device, non_blocking=True),
+                    chunked_context_metadata = chunked_context_metadata_cls(
+                        cu_seq_lens=cu_seq_lens_cpu.to(device, non_blocking=True),
                         starts=cp_chunk_starts.to(device, non_blocking=True),
                         seq_tot=cp_chunk_seq_lens.sum(dim=1).tolist(),
                         max_seq_lens=chunk_seq_lens.max(dim=1).values.tolist(),
@@ -797,16 +836,13 @@ def build(self,
                         workspace=self.chunked_prefill_workspace,
                         cp_chunk_seq_lens=cp_chunk_seq_lens.tolist(),
                         origin_context_lens=origin_context_lens,
-                        cp_cu_seq_lens=cp_cu_seq_lens_cpu \
-                            .to(device, non_blocking=True),
+                        cp_cu_seq_lens=cp_cu_seq_lens_cpu.to(device, non_blocking=True),
                         chunk_size=max_context_chunk,
                         cu_seq_lens_lst=cu_seq_lens_cpu.tolist(),
                     )
                 else:
-                    chunked_context_metadata = \
-                        chunked_context_metadata_cls(
-                        cu_seq_lens=cu_seq_lens_cpu \
-                            .to(device, non_blocking=True),
+                    chunked_context_metadata = chunked_context_metadata_cls(
+                        cu_seq_lens=cu_seq_lens_cpu.to(device, non_blocking=True),
                         starts=chunk_starts.to(device, non_blocking=True),
                         seq_tot=chunk_seq_lens.sum(dim=1).tolist(),
                         max_seq_lens=chunk_seq_lens.max(dim=1).values.tolist(),
@@ -817,8 +853,10 @@ def build(self,
                 if self._use_cudnn_prefill:
                     chunked_context_metadata.seq_lens = chunk_seq_lens
 
-                assert max(chunked_context_metadata.max_seq_lens) <= \
-                    self.chunked_prefill_workspace_size
+                assert (
+                    max(chunked_context_metadata.max_seq_lens)
+                    <= self.chunked_prefill_workspace_size
+                )
 
             prefill_metadata = self.prefill_metadata_cls(
                 block_table=block_table_tensor[reqs_start:, ...],
@@ -829,8 +867,9 @@ def build(self,
 
             if self._use_cudnn_prefill:
                 assert isinstance(prefill_metadata, CudnnPrefillMetadata)
-                prefill_metadata.query_seq_lens = prefill_query_start_loc[1:] \
-                    - prefill_query_start_loc[:-1]
+                prefill_metadata.query_seq_lens = (
+                    prefill_query_start_loc[1:] - prefill_query_start_loc[:-1]
+                )
                 prefill_metadata.cudnn_workspace = self.cudnn_workspace
 
         decode_metadata = None
@@ -839,8 +878,8 @@ def build(self,
                 block_table_tensor=block_table_tensor[:num_decodes, ...],
                 seq_lens_cpu=seq_lens_cpu[:num_decodes],
                 seq_lens_device=seq_lens[:num_decodes],
-                query_start_loc_cpu=query_start_loc_cpu[:num_decodes + 1],
-                query_start_loc_device=query_start_loc[:num_decodes + 1],
+                query_start_loc_cpu=query_start_loc_cpu[: num_decodes + 1],
+                query_start_loc_device=query_start_loc[: num_decodes + 1],
                 num_decode_tokens=num_decode_tokens,
             )
 
@@ -897,12 +936,14 @@ def reorg_kvcache(
     k_pe_segments = []
     src_token_idx = 0
     max_seq_len_check = 0
-    for cp_chunk_seq_len, origin_context_len in zip(cp_chunk_seq_lens_lst,
-                                                    origin_context_lens):
+    for cp_chunk_seq_len, origin_context_len in zip(
+        cp_chunk_seq_lens_lst, origin_context_lens
+    ):
         chunk_context_len = chunk_size
         if cp_chunk_seq_len != 0:
             chunk_context_len = min(
-                chunk_context_len, origin_context_len - chunk_size * chunk_idx)
+                chunk_context_len, origin_context_len - chunk_size * chunk_idx
+            )
         cp_target_rank = (chunk_context_len - 1) % cp_world_size
         cur_seq_len = 0
         for rank in range(cp_world_size):
@@ -911,14 +952,16 @@ def reorg_kvcache(
             else:
                 real_cp_chunk_seq_len = cp_chunk_seq_len
             if real_cp_chunk_seq_len:
-                kv_c_segment = allgatered_kv_c_normed[rank * toks +
-                                                      src_token_idx:rank *
-                                                      toks + src_token_idx +
-                                                      real_cp_chunk_seq_len]
-                k_pe_segment = allgatered_k_pe[rank * toks +
-                                               src_token_idx:rank * toks +
-                                               src_token_idx +
-                                               real_cp_chunk_seq_len]
+                kv_c_segment = allgatered_kv_c_normed[
+                    rank * toks + src_token_idx : rank * toks
+                    + src_token_idx
+                    + real_cp_chunk_seq_len
+                ]
+                k_pe_segment = allgatered_k_pe[
+                    rank * toks + src_token_idx : rank * toks
+                    + src_token_idx
+                    + real_cp_chunk_seq_len
+                ]
                 kv_c_segments.append(kv_c_segment)
                 k_pe_segments.append(k_pe_segment)
                 cur_seq_len += real_cp_chunk_seq_len
@@ -983,25 +1026,24 @@ def __init__(
         self.q_pad_num_heads = q_pad_num_heads
 
     def process_weights_after_loading(self, act_dtype: torch.dtype):
-
         def get_layer_weight(layer):
             WEIGHT_NAMES = ("weight", "qweight", "weight_packed")
             for attr in WEIGHT_NAMES:
                 if hasattr(layer, attr):
                     return getattr(layer, attr)
             raise AttributeError(
-                f"Layer '{layer}' has no recognized weight attribute:"
-                f" {WEIGHT_NAMES}.")
+                f"Layer '{layer}' has no recognized weight attribute: {WEIGHT_NAMES}."
+            )
 
         def get_and_maybe_dequant_weights(layer: LinearBase):
             if not isinstance(layer.quant_method, UnquantizedLinearMethod):
                 # NOTE: This should only be used offline, since it's O(N^3)
-                eye = torch.eye(layer.input_size_per_partition,
-                                dtype=act_dtype,
-                                device=get_layer_weight(layer).device)
-                dequant_weights = layer.quant_method.apply(layer,
-                                                           eye,
-                                                           bias=None)
+                eye = torch.eye(
+                    layer.input_size_per_partition,
+                    dtype=act_dtype,
+                    device=get_layer_weight(layer).device,
+                )
+                dequant_weights = layer.quant_method.apply(layer, eye, bias=None)
                 del eye
                 # standardize to (output, input)
                 return dequant_weights.T
@@ -1013,12 +1055,14 @@ def get_and_maybe_dequant_weights(layer: LinearBase):
         kv_b_proj_weight = get_and_maybe_dequant_weights(self.kv_b_proj).T
         assert kv_b_proj_weight.shape == (
             self.kv_lora_rank,
-            self.num_heads * (self.qk_nope_head_dim + self.v_head_dim)), (
-                f"{kv_b_proj_weight.shape=}, "
-                f"{self.kv_lora_rank=}, "
-                f"{self.num_heads=}, "
-                f"{self.qk_nope_head_dim=}, "
-                f"{self.v_head_dim=}")
+            self.num_heads * (self.qk_nope_head_dim + self.v_head_dim),
+        ), (
+            f"{kv_b_proj_weight.shape=}, "
+            f"{self.kv_lora_rank=}, "
+            f"{self.num_heads=}, "
+            f"{self.qk_nope_head_dim=}, "
+            f"{self.v_head_dim=}"
+        )
         kv_b_proj_weight = kv_b_proj_weight.view(
             self.kv_lora_rank,
             self.num_heads,
@@ -1026,15 +1070,18 @@ def get_and_maybe_dequant_weights(layer: LinearBase):
         )
 
         W_UK, W_UV = kv_b_proj_weight.split(
-            [self.qk_nope_head_dim, self.v_head_dim], dim=-1)
+            [self.qk_nope_head_dim, self.v_head_dim], dim=-1
+        )
 
         if is_rocm_aiter_fp8bmm_enabled():
             W_K = W_UK.transpose(0, 1)  # 16 512 128
             W_V = W_UV.permute(1, 2, 0)  # 16 128 512
             self.W_K, self.W_K_scale = dynamic_per_batched_tensor_quant(
-                W_K, dtype=current_platform.fp8_dtype())
+                W_K, dtype=current_platform.fp8_dtype()
+            )
             self.W_V, self.W_V_scale = dynamic_per_batched_tensor_quant(
-                W_V, dtype=current_platform.fp8_dtype())
+                W_V, dtype=current_platform.fp8_dtype()
+            )
 
             # The kernel operates on non-padded inputs. Hence, pre-compiling
             # triton kernel to avoid runtime compilation for unseen batch sizes
@@ -1050,23 +1097,23 @@ def get_and_maybe_dequant_weights(layer: LinearBase):
                 )
 
             for m in pre_compilation_list:
-                x = torch.empty((self.W_K.shape[0], m, self.W_K.shape[2]),
-                                dtype=torch.bfloat16,
-                                device=self.W_K.device)
-                aiter_triton_fp8_bmm(x,
-                                     self.W_K,
-                                     self.W_K_scale,
-                                     group_size=128,
-                                     transpose_bm=True)
-
-                x = torch.empty((self.W_V.shape[0], m, self.W_V.shape[2]),
-                                dtype=torch.bfloat16,
-                                device=self.W_V.device)
-                aiter_triton_fp8_bmm(x,
-                                     self.W_V,
-                                     self.W_V_scale,
-                                     group_size=128,
-                                     transpose_bm=True)
+                x = torch.empty(
+                    (self.W_K.shape[0], m, self.W_K.shape[2]),
+                    dtype=torch.bfloat16,
+                    device=self.W_K.device,
+                )
+                aiter_triton_fp8_bmm(
+                    x, self.W_K, self.W_K_scale, group_size=128, transpose_bm=True
+                )
+
+                x = torch.empty(
+                    (self.W_V.shape[0], m, self.W_V.shape[2]),
+                    dtype=torch.bfloat16,
+                    device=self.W_V.device,
+                )
+                aiter_triton_fp8_bmm(
+                    x, self.W_V, self.W_V_scale, group_size=128, transpose_bm=True
+                )
         else:
             # Convert from (L, N, V) to (N, L, V)
             self.W_UV = W_UV.transpose(0, 1)
@@ -1078,11 +1125,9 @@ def _v_up_proj(self, x: torch.Tensor, out: torch.Tensor):
         x = x.view(-1, self.num_heads, self.kv_lora_rank).transpose(0, 1)
         if is_rocm_aiter_fp8bmm_enabled():
             # Multiply + Transpose (N, B, L) x (N, L, V)->(N, B, V)->(B, N, V)
-            x = aiter_triton_fp8_bmm(x,
-                                     self.W_V,
-                                     self.W_V_scale,
-                                     group_size=128,
-                                     transpose_bm=True)
+            x = aiter_triton_fp8_bmm(
+                x, self.W_V, self.W_V_scale, group_size=128, transpose_bm=True
+            )
             # Convert from (B, N, V) to (B, N * V)
             x = x.reshape(-1, self.num_heads * self.v_head_dim)
             # Copy result
@@ -1095,8 +1140,7 @@ def _v_up_proj(self, x: torch.Tensor, out: torch.Tensor):
             torch.bmm(x, self.W_UV, out=out)  # Reuse "out" to make it "hot"
 
             # Convert from (N, B, V) to (B, N * V)
-            out_new = out.transpose(0, 1).reshape(
-                -1, self.num_heads * self.v_head_dim)
+            out_new = out.transpose(0, 1).reshape(-1, self.num_heads * self.v_head_dim)
 
             # Adjust output buffer shape back to the original (B, N * V)
             N, B, V = out.shape
@@ -1120,8 +1164,7 @@ def __init__(self, *args, **kwargs) -> None:
             self._pad_v = False
         elif use_cudnn_prefill():
             logger.debug_once("Using CUDNN prefill for MLA")
-            self._run_prefill_context_chunk = \
-                self._run_prefill_context_chunk_cudnn
+            self._run_prefill_context_chunk = self._run_prefill_context_chunk_cudnn
             self._run_prefill_new_tokens = self._run_prefill_new_tokens_cudnn
             self._pad_v = False
         else:  # Use FlashAttention
@@ -1136,9 +1179,9 @@ def __init__(self, *args, **kwargs) -> None:
             self.flash_attn_varlen_func = flash_attn_varlen_func
             self.vllm_flash_attn_version = get_flash_attn_version()
             if self.vllm_flash_attn_version is not None:
-                self.flash_attn_varlen_func = \
-                    functools.partial(flash_attn_varlen_func,
-                                    fa_version=self.vllm_flash_attn_version)
+                self.flash_attn_varlen_func = functools.partial(
+                    flash_attn_varlen_func, fa_version=self.vllm_flash_attn_version
+                )
 
             # For MLA the v head dim is smaller than qk head dim so we pad out
             # v with 0s to match the qk head dim for attention backends that do
@@ -1146,25 +1189,25 @@ def __init__(self, *args, **kwargs) -> None:
             # We don't need to pad V if we are on a hopper system with FA3
             self._pad_v = self.vllm_flash_attn_version is None or not (
                 self.vllm_flash_attn_version == 3
-                and current_platform.get_device_capability()[0] == 9)
+                and current_platform.get_device_capability()[0] == 9
+            )
 
         self.dcp_world_size: Optional[int] = None
 
-        self.chunked_prefill_workspace_size = \
+        self.chunked_prefill_workspace_size = (
             MLACommonMetadataBuilder.determine_chunked_prefill_workspace_size(
-            get_current_vllm_config())
-
-    def _flash_attn_varlen_diff_headdims(self,
-                                         q,
-                                         k,
-                                         v,
-                                         return_softmax_lse=False,
-                                         softmax_scale=None,
-                                         **kwargs):
+                get_current_vllm_config()
+            )
+        )
+
+    def _flash_attn_varlen_diff_headdims(
+        self, q, k, v, return_softmax_lse=False, softmax_scale=None, **kwargs
+    ):
         maybe_padded_v = v
         if self._pad_v:
             maybe_padded_v = torch.nn.functional.pad(
-                v, [0, q.shape[-1] - v.shape[-1]], value=0)
+                v, [0, q.shape[-1] - v.shape[-1]], value=0
+            )
 
         if is_vllm_fa:
             kwargs["return_softmax_lse"] = return_softmax_lse
@@ -1192,8 +1235,9 @@ def _flash_attn_varlen_diff_headdims(self,
             return attn_out, lse
         return attn_out
 
-    def _run_prefill_new_tokens_fa(self, prefill: MLACommonPrefillMetadata, q,
-                                   k, v, return_softmax_lse):
+    def _run_prefill_new_tokens_fa(
+        self, prefill: MLACommonPrefillMetadata, q, k, v, return_softmax_lse
+    ):
         return self._flash_attn_varlen_diff_headdims(
             q=q,
             k=k,
@@ -1207,8 +1251,9 @@ def _run_prefill_new_tokens_fa(self, prefill: MLACommonPrefillMetadata, q,
             return_softmax_lse=return_softmax_lse,
         )
 
-    def _run_prefill_new_tokens_fi(self, prefill: MLACommonPrefillMetadata, q,
-                                   k, v, return_softmax_lse):
+    def _run_prefill_new_tokens_fi(
+        self, prefill: MLACommonPrefillMetadata, q, k, v, return_softmax_lse
+    ):
         assert isinstance(prefill, FlashInferPrefillMetadata)
         assert prefill.prefill_main is not None
         ret = prefill.prefill_main.run(
@@ -1223,8 +1268,9 @@ def _run_prefill_new_tokens_fi(self, prefill: MLACommonPrefillMetadata, q,
             return ret[0], ret[1].transpose(0, 1).contiguous()
         return ret
 
-    def _run_prefill_new_tokens_cudnn(self, prefill: MLACommonPrefillMetadata,
-                                      q, k, v, return_softmax_lse):
+    def _run_prefill_new_tokens_cudnn(
+        self, prefill: MLACommonPrefillMetadata, q, k, v, return_softmax_lse
+    ):
         assert isinstance(prefill, CudnnPrefillMetadata)
         assert prefill.query_seq_lens is not None
         output, lse = cudnn_batch_prefill_with_kv_cache(
@@ -1239,15 +1285,15 @@ def _run_prefill_new_tokens_cudnn(self, prefill: MLACommonPrefillMetadata,
             actual_seq_lens_kv=prefill.query_seq_lens.view(-1, 1, 1, 1),
             causal=True,
             return_lse=True,  # do not support False for now
-            is_cuda_graph_compatible=
-            True,  #Indicates actual_seq_lens are on GPU or CPU.
+            is_cuda_graph_compatible=True,  # Indicates actual_seq_lens are on GPU or CPU.
         )
         if return_softmax_lse:
             return output, lse
         return output
 
-    def _run_prefill_context_chunk_fa(self, prefill: MLACommonPrefillMetadata,
-                                      chunk_idx: int, q, k, v):
+    def _run_prefill_context_chunk_fa(
+        self, prefill: MLACommonPrefillMetadata, chunk_idx: int, q, k, v
+    ):
         assert prefill.chunked_context is not None
         return self._flash_attn_varlen_diff_headdims(
             q=q,
@@ -1262,8 +1308,9 @@ def _run_prefill_context_chunk_fa(self, prefill: MLACommonPrefillMetadata,
             return_softmax_lse=True,
         )
 
-    def _run_prefill_context_chunk_fi(self, prefill: MLACommonPrefillMetadata,
-                                      chunk_idx: int, q, k, v):
+    def _run_prefill_context_chunk_fi(
+        self, prefill: MLACommonPrefillMetadata, chunk_idx: int, q, k, v
+    ):
         assert isinstance(prefill, FlashInferPrefillMetadata)
         attn_out, lse = prefill.prefill_chunks[chunk_idx].run(
             q=q,
@@ -1274,9 +1321,9 @@ def _run_prefill_context_chunk_fi(self, prefill: MLACommonPrefillMetadata,
         # Convert from (q_len, num_heads) to (num_heads, q_len)
         return attn_out, lse.transpose(0, 1).contiguous()
 
-    def _run_prefill_context_chunk_cudnn(self,
-                                         prefill: MLACommonPrefillMetadata,
-                                         chunk_idx: int, q, k, v):
+    def _run_prefill_context_chunk_cudnn(
+        self, prefill: MLACommonPrefillMetadata, chunk_idx: int, q, k, v
+    ):
         assert isinstance(prefill, CudnnPrefillMetadata)
         assert prefill.chunked_context is not None
         assert prefill.chunked_context.seq_lens[chunk_idx] is not None
@@ -1290,34 +1337,33 @@ def _run_prefill_context_chunk_cudnn(self,
             max_token_per_sequence=prefill.max_query_len,
             max_sequence_kv=prefill.chunked_context.max_seq_lens[chunk_idx],
             actual_seq_lens_q=prefill.query_seq_lens.view(-1, 1, 1, 1),
-            actual_seq_lens_kv=prefill.chunked_context.seq_lens[chunk_idx].
-            view(-1, 1, 1, 1),
+            actual_seq_lens_kv=prefill.chunked_context.seq_lens[chunk_idx].view(
+                -1, 1, 1, 1
+            ),
             causal=False,
             return_lse=True,
-            is_cuda_graph_compatible=
-            True,  #Indicates actual_seq_lens are on GPU or CPU.
+            is_cuda_graph_compatible=True,  # Indicates actual_seq_lens are on GPU or CPU.
         )
 
     def process_weights_after_loading(self, act_dtype: torch.dtype):
-
         def get_layer_weight(layer):
             WEIGHT_NAMES = ("weight", "qweight", "weight_packed")
             for attr in WEIGHT_NAMES:
                 if hasattr(layer, attr):
                     return getattr(layer, attr)
             raise AttributeError(
-                f"Layer '{layer}' has no recognized weight attribute:"
-                f" {WEIGHT_NAMES}.")
+                f"Layer '{layer}' has no recognized weight attribute: {WEIGHT_NAMES}."
+            )
 
         def get_and_maybe_dequant_weights(layer: LinearBase):
             if not isinstance(layer.quant_method, UnquantizedLinearMethod):
                 # NOTE: This should only be used offline, since it's O(N^3)
-                eye = torch.eye(layer.input_size_per_partition,
-                                dtype=act_dtype,
-                                device=get_layer_weight(layer).device)
-                dequant_weights = layer.quant_method.apply(layer,
-                                                           eye,
-                                                           bias=None)
+                eye = torch.eye(
+                    layer.input_size_per_partition,
+                    dtype=act_dtype,
+                    device=get_layer_weight(layer).device,
+                )
+                dequant_weights = layer.quant_method.apply(layer, eye, bias=None)
                 del eye
                 # standardize to (output, input)
                 return dequant_weights.T
@@ -1329,12 +1375,14 @@ def get_and_maybe_dequant_weights(layer: LinearBase):
         kv_b_proj_weight = get_and_maybe_dequant_weights(self.kv_b_proj).T
         assert kv_b_proj_weight.shape == (
             self.kv_lora_rank,
-            self.num_heads * (self.qk_nope_head_dim + self.v_head_dim)), (
-                f"{kv_b_proj_weight.shape=}, "
-                f"{self.kv_lora_rank=}, "
-                f"{self.num_heads=}, "
-                f"{self.qk_nope_head_dim=}, "
-                f"{self.v_head_dim=}")
+            self.num_heads * (self.qk_nope_head_dim + self.v_head_dim),
+        ), (
+            f"{kv_b_proj_weight.shape=}, "
+            f"{self.kv_lora_rank=}, "
+            f"{self.num_heads=}, "
+            f"{self.qk_nope_head_dim=}, "
+            f"{self.v_head_dim=}"
+        )
         kv_b_proj_weight = kv_b_proj_weight.view(
             self.kv_lora_rank,
             self.num_heads,
@@ -1342,15 +1390,18 @@ def get_and_maybe_dequant_weights(layer: LinearBase):
         )
 
         W_UK, W_UV = kv_b_proj_weight.split(
-            [self.qk_nope_head_dim, self.v_head_dim], dim=-1)
+            [self.qk_nope_head_dim, self.v_head_dim], dim=-1
+        )
 
         if is_rocm_aiter_fp8bmm_enabled():
             W_K = W_UK.transpose(0, 1)  # 16 512 128
             W_V = W_UV.permute(1, 2, 0)  # 16 128 512
             self.W_K, self.W_K_scale = dynamic_per_batched_tensor_quant(
-                W_K, dtype=current_platform.fp8_dtype())
+                W_K, dtype=current_platform.fp8_dtype()
+            )
             self.W_V, self.W_V_scale = dynamic_per_batched_tensor_quant(
-                W_V, dtype=current_platform.fp8_dtype())
+                W_V, dtype=current_platform.fp8_dtype()
+            )
 
             # The kernel operates on non-padded inputs. Hence, pre-compiling
             # triton kernel to avoid runtime compilation for unseen batch sizes
@@ -1366,23 +1417,23 @@ def get_and_maybe_dequant_weights(layer: LinearBase):
                 )
 
             for m in pre_compilation_list:
-                x = torch.empty((self.W_K.shape[0], m, self.W_K.shape[2]),
-                                dtype=torch.bfloat16,
-                                device=self.W_K.device)
-                aiter_triton_fp8_bmm(x,
-                                     self.W_K,
-                                     self.W_K_scale,
-                                     group_size=128,
-                                     transpose_bm=True)
-
-                x = torch.empty((self.W_V.shape[0], m, self.W_V.shape[2]),
-                                dtype=torch.bfloat16,
-                                device=self.W_V.device)
-                aiter_triton_fp8_bmm(x,
-                                     self.W_V,
-                                     self.W_V_scale,
-                                     group_size=128,
-                                     transpose_bm=True)
+                x = torch.empty(
+                    (self.W_K.shape[0], m, self.W_K.shape[2]),
+                    dtype=torch.bfloat16,
+                    device=self.W_K.device,
+                )
+                aiter_triton_fp8_bmm(
+                    x, self.W_K, self.W_K_scale, group_size=128, transpose_bm=True
+                )
+
+                x = torch.empty(
+                    (self.W_V.shape[0], m, self.W_V.shape[2]),
+                    dtype=torch.bfloat16,
+                    device=self.W_V.device,
+                )
+                aiter_triton_fp8_bmm(
+                    x, self.W_V, self.W_V_scale, group_size=128, transpose_bm=True
+                )
         else:
             # Convert from (L, N, V) to (N, L, V)
             self.W_UV = W_UV.transpose(0, 1)
@@ -1418,18 +1469,15 @@ def _compute_prefill_context(
                 seq_starts=prefill_metadata.chunked_context.starts[i],
             )
 
-            kv_c_normed = workspace[:toks]\
-                [..., :self.kv_lora_rank]
-            k_pe = workspace[:toks]\
-                [..., self.kv_lora_rank:].unsqueeze(1)
+            kv_c_normed = workspace[:toks][..., : self.kv_lora_rank]
+            k_pe = workspace[:toks][..., self.kv_lora_rank :].unsqueeze(1)
 
-            kv_nope = self.kv_b_proj(kv_c_normed)[0].view( \
-                -1, self.num_heads, self.qk_nope_head_dim + self.v_head_dim)
-            k_nope, v = kv_nope\
-                .split([self.qk_nope_head_dim, self.v_head_dim], dim=-1)
+            kv_nope = self.kv_b_proj(kv_c_normed)[0].view(
+                -1, self.num_heads, self.qk_nope_head_dim + self.v_head_dim
+            )
+            k_nope, v = kv_nope.split([self.qk_nope_head_dim, self.v_head_dim], dim=-1)
 
-            k = torch.cat((k_nope, k_pe.expand((*k_nope.shape[:-1], -1))),
-                          dim=-1)
+            k = torch.cat((k_nope, k_pe.expand((*k_nope.shape[:-1], -1))), dim=-1)
 
             attn_output, attn_softmax_lse = self._run_prefill_context_chunk(
                 prefill=prefill_metadata,
@@ -1494,44 +1542,45 @@ def _context_parallel_compute_prefill_context(
             # |------- N tokens --------|--------- N*dcp_size tokens ----------|
             # |<- use for loca_gather ->|<--------- use for allgather -------->|
             allgather_offset = workspace.shape[0] // (dcp_world_size + 1)
-            assert allgather_offset * (dcp_world_size +
-                                       1) == workspace.shape[0]
+            assert allgather_offset * (dcp_world_size + 1) == workspace.shape[0]
             assert toks <= allgather_offset
             local_gathered_kvcache = workspace[:toks]
             cur_allgather_workspace = workspace[
-                allgather_offset:allgather_offset * (1 + dcp_world_size)]
+                allgather_offset : allgather_offset * (1 + dcp_world_size)
+            ]
             assert toks * dcp_world_size <= cur_allgather_workspace.shape[0]
-            cur_allgather_kvcache = cur_allgather_workspace[:toks *
-                                                            dcp_world_size]
-            cur_allgather_kvcache.copy_(get_dcp_group().all_gather(
-                local_gathered_kvcache, dim=0))
-            assert cur_allgather_kvcache.shape[
-                -1] == self.kv_lora_rank + self.qk_rope_head_dim
-            allgatered_kv_c_normed, allgatered_k_pe = \
-                cur_allgather_kvcache.unsqueeze(
-                1).split([self.kv_lora_rank, self.qk_rope_head_dim], dim=-1)
+            cur_allgather_kvcache = cur_allgather_workspace[: toks * dcp_world_size]
+            cur_allgather_kvcache.copy_(
+                get_dcp_group().all_gather(local_gathered_kvcache, dim=0)
+            )
+            assert (
+                cur_allgather_kvcache.shape[-1]
+                == self.kv_lora_rank + self.qk_rope_head_dim
+            )
+            allgatered_kv_c_normed, allgatered_k_pe = cur_allgather_kvcache.unsqueeze(
+                1
+            ).split([self.kv_lora_rank, self.qk_rope_head_dim], dim=-1)
 
             kv_c_normed, k_pe = reorg_kvcache(
                 allgatered_kv_c_normed,
                 allgatered_k_pe,
-                cp_chunk_seq_lens_lst=prefill_metadata.chunked_context.
-                cp_chunk_seq_lens[i],
-                origin_context_lens=prefill_metadata.chunked_context.
-                origin_context_lens,
+                cp_chunk_seq_lens_lst=prefill_metadata.chunked_context.cp_chunk_seq_lens[
+                    i
+                ],
+                origin_context_lens=prefill_metadata.chunked_context.origin_context_lens,
                 cp_world_size=dcp_world_size,
-                sum_seq_len=prefill_metadata.chunked_context.cu_seq_lens_lst[i]
-                [-1],
+                sum_seq_len=prefill_metadata.chunked_context.cu_seq_lens_lst[i][-1],
                 max_seq_len=prefill_metadata.chunked_context.max_seq_lens[i],
                 chunk_size=prefill_metadata.chunked_context.chunk_size,
                 chunk_idx=i,
-                toks=toks)
+                toks=toks,
+            )
 
-            kv_nope = self.kv_b_proj(kv_c_normed)[0].view( \
-                -1, self.num_heads, self.qk_nope_head_dim + self.v_head_dim)
-            k_nope, v = kv_nope\
-                .split([self.qk_nope_head_dim, self.v_head_dim], dim=-1)
-            k = torch.cat((k_nope, k_pe.expand((*k_nope.shape[:-1], -1))),
-                          dim=-1)
+            kv_nope = self.kv_b_proj(kv_c_normed)[0].view(
+                -1, self.num_heads, self.qk_nope_head_dim + self.v_head_dim
+            )
+            k_nope, v = kv_nope.split([self.qk_nope_head_dim, self.v_head_dim], dim=-1)
+            k = torch.cat((k_nope, k_pe.expand((*k_nope.shape[:-1], -1))), dim=-1)
 
             attn_output, attn_softmax_lse = self._run_prefill_context_chunk(
                 prefill=prefill_metadata,
@@ -1574,10 +1623,10 @@ def _forward_prefill(
         assert self.dcp_world_size is not None
 
         has_context = attn_metadata.prefill.chunked_context is not None
-        kv_nope = self.kv_b_proj(kv_c_normed)[0].view(\
-            -1, self.num_heads, self.qk_nope_head_dim + self.v_head_dim)
-        k_nope, v = kv_nope\
-            .split([self.qk_nope_head_dim, self.v_head_dim], dim=-1)
+        kv_nope = self.kv_b_proj(kv_c_normed)[0].view(
+            -1, self.num_heads, self.qk_nope_head_dim + self.v_head_dim
+        )
+        k_nope, v = kv_nope.split([self.qk_nope_head_dim, self.v_head_dim], dim=-1)
 
         k = torch.cat((k_nope, k_pe.expand((*k_nope.shape[:-1], -1))), dim=-1)
 
@@ -1592,14 +1641,19 @@ def _forward_prefill(
         if has_context:
             suffix_output, suffix_lse = output
             if self.dcp_world_size > 1:
-                context_output, context_lse = \
+                context_output, context_lse = (
                     self._context_parallel_compute_prefill_context(
-                    q, kv_c_and_k_pe_cache, attn_metadata,
-                    k_scale=None, dcp_world_size=self.dcp_world_size)
+                        q,
+                        kv_c_and_k_pe_cache,
+                        attn_metadata,
+                        k_scale=None,
+                        dcp_world_size=self.dcp_world_size,
+                    )
+                )
             else:
-                context_output, context_lse = \
-                    self._compute_prefill_context(
-                    q, kv_c_and_k_pe_cache, attn_metadata, k_scale)
+                context_output, context_lse = self._compute_prefill_context(
+                    q, kv_c_and_k_pe_cache, attn_metadata, k_scale
+                )
 
             output = torch.empty_like(suffix_output)
             merge_attn_states(
@@ -1612,7 +1666,7 @@ def _forward_prefill(
 
         # unpad if necessary
         if self._pad_v:
-            output = output[..., :v.shape[-1]]
+            output = output[..., : v.shape[-1]]
 
         return output.flatten(start_dim=-2)
 
@@ -1642,16 +1696,19 @@ def forward(
 
         if output_scale is not None or output_block_scale is not None:
             raise NotImplementedError(
-                "fused output quantization is not yet supported"
-                " for MLACommonImpl")
+                "fused output quantization is not yet supported for MLACommonImpl"
+            )
 
         if attn_metadata is None:
             # During the profile run try to simulate to worse case output size
             # for `self.kv_b_proj(kv_c_normed)` in `_compute_prefill_context`
             # since this can be large
             _ = torch.empty(
-                (self.chunked_prefill_workspace_size, self.num_heads,
-                 self.qk_nope_head_dim + self.v_head_dim),
+                (
+                    self.chunked_prefill_workspace_size,
+                    self.num_heads,
+                    self.qk_nope_head_dim + self.v_head_dim,
+                ),
                 device=k_c_normed.device,
                 dtype=k_c_normed.dtype,
             )
@@ -1675,9 +1732,11 @@ def forward(
         k_c_normed = k_c_normed[:num_actual_toks, ...]
         k_pe = k_pe[:num_actual_toks, ...]
 
-        assert attn_metadata.num_decodes is not None and \
-            attn_metadata.num_prefills is not None and \
-            attn_metadata.num_decode_tokens is not None
+        assert (
+            attn_metadata.num_decodes is not None
+            and attn_metadata.num_prefills is not None
+            and attn_metadata.num_decode_tokens is not None
+        )
 
         has_decode = attn_metadata.num_decodes > 0
         has_prefill = attn_metadata.num_prefills > 0
@@ -1705,39 +1764,47 @@ def forward(
 
         if has_prefill:
             output[num_decode_tokens:] = self._forward_prefill(
-                prefill_q, prefill_k_c_normed, prefill_k_pe, kv_cache,
-                attn_metadata, layer._k_scale)
+                prefill_q,
+                prefill_k_c_normed,
+                prefill_k_pe,
+                kv_cache,
+                attn_metadata,
+                layer._k_scale,
+            )
 
         if has_decode:
             assert attn_metadata.decode is not None
             decode_q_nope, decode_q_pe = decode_q.split(
-                [self.qk_nope_head_dim, self.qk_rope_head_dim], dim=-1)
+                [self.qk_nope_head_dim, self.qk_rope_head_dim], dim=-1
+            )
             # Convert from (B, N, P) to (N, B, P)
             decode_q_nope = decode_q_nope.transpose(0, 1)
 
             # Pads the head_dim if necessary (for the underlying kernel)
             if self.q_pad_num_heads is not None:
                 B, N, L = decode_q_pe.shape
-                decode_pe_padded = decode_q_pe.new_empty(
-                    (B, self.q_pad_num_heads, L))
+                decode_pe_padded = decode_q_pe.new_empty((B, self.q_pad_num_heads, L))
                 decode_pe_padded.resize_((B, N, L))
                 decode_pe_padded.copy_(decode_q_pe)
                 decode_q_pe = decode_pe_padded
 
             if is_rocm_aiter_fp8bmm_enabled():
                 # Multiply+Transpose (N, B, P)x(N, P, L)->(N, B, L)->(B, N, L)
-                decode_ql_nope = aiter_triton_fp8_bmm(decode_q_nope,
-                                                      self.W_K,
-                                                      self.W_K_scale,
-                                                      group_size=128,
-                                                      transpose_bm=True)
+                decode_ql_nope = aiter_triton_fp8_bmm(
+                    decode_q_nope,
+                    self.W_K,
+                    self.W_K_scale,
+                    group_size=128,
+                    transpose_bm=True,
+                )
             else:
                 # Pads the head_dim if necessary (for the underlying kernel)
                 N, B, P = decode_q_nope.shape
                 _, _, L = self.W_UK_T.shape
                 if self.q_pad_num_heads is not None:
                     decode_ql_nope = decode_q_nope.new_empty(
-                        (self.q_pad_num_heads, B, L))
+                        (self.q_pad_num_heads, B, L)
+                    )
                     decode_ql_nope.resize_((N, B, L))
 
                 else:
@@ -1751,15 +1818,17 @@ def forward(
             if fp8_attention:
                 ql_nope_shape = decode_ql_nope.shape
                 decode_ql_nope, _ = ops.scaled_fp8_quant(
-                    decode_ql_nope.reshape([
-                        ql_nope_shape[0], ql_nope_shape[1] * ql_nope_shape[2]
-                    ]), layer._q_scale)
+                    decode_ql_nope.reshape(
+                        [ql_nope_shape[0], ql_nope_shape[1] * ql_nope_shape[2]]
+                    ),
+                    layer._q_scale,
+                )
                 decode_ql_nope = decode_ql_nope.reshape(ql_nope_shape)
                 q_pe_shape = decode_q_pe.shape
                 decode_q_pe, _ = ops.scaled_fp8_quant(
-                    decode_q_pe.reshape(
-                        [q_pe_shape[0], q_pe_shape[1] * q_pe_shape[2]]),
-                    layer._q_scale)
+                    decode_q_pe.reshape([q_pe_shape[0], q_pe_shape[1] * q_pe_shape[2]]),
+                    layer._q_scale,
+                )
                 decode_q_pe = decode_q_pe.reshape(q_pe_shape)
 
             decode_q = (decode_ql_nope, decode_q_pe)
@@ -1771,8 +1840,9 @@ def forward(
                 decode_q = get_dcp_group().all_gather(decode_q, dim=1)
 
             # call decode attn
-            attn_out, lse = self._forward_decode(decode_q, kv_cache,
-                                                 attn_metadata, layer)
+            attn_out, lse = self._forward_decode(
+                decode_q, kv_cache, attn_metadata, layer
+            )
 
             # recorect dcp attn_out with lse.
             if self.dcp_world_size > 1:
diff --git a/vllm/v1/attention/backends/mla/cutlass_mla.py b/vllm/v1/attention/backends/mla/cutlass_mla.py
index d44e20f2cb6b..a3c677ca2108 100644
--- a/vllm/v1/attention/backends/mla/cutlass_mla.py
+++ b/vllm/v1/attention/backends/mla/cutlass_mla.py
@@ -7,13 +7,18 @@
 import torch
 
 import vllm._custom_ops as ops
-from vllm.attention.backends.abstract import (AttentionLayer, AttentionType,
-                                              is_quantized_kv_cache)
+from vllm.attention.backends.abstract import (
+    AttentionLayer,
+    AttentionType,
+    is_quantized_kv_cache,
+)
 from vllm.logger import init_logger
-from vllm.v1.attention.backends.mla.common import (MLACommonBackend,
-                                                   MLACommonImpl,
-                                                   MLACommonMetadata,
-                                                   MLACommonMetadataBuilder)
+from vllm.v1.attention.backends.mla.common import (
+    MLACommonBackend,
+    MLACommonImpl,
+    MLACommonMetadata,
+    MLACommonMetadataBuilder,
+)
 from vllm.v1.attention.backends.utils import AttentionCGSupport
 
 logger = init_logger(__name__)
@@ -21,12 +26,12 @@
 
 class CutlassMLAMetadataBuilder(MLACommonMetadataBuilder[MLACommonMetadata]):
     # enable full CUDA Graph support for decode-only capture
-    cudagraph_support: ClassVar[
-        AttentionCGSupport] = AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
+    cudagraph_support: ClassVar[AttentionCGSupport] = (
+        AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
+    )
 
 
 class CutlassMLABackend(MLACommonBackend):
-
     @staticmethod
     def get_name() -> str:
         return "CUTLASS_MLA"
@@ -41,11 +46,10 @@ def get_builder_cls() -> type["CutlassMLAMetadataBuilder"]:
 
 
 class SM100Workspace:
-
     def __init__(self, initial_workspace_size):
-        self._workspace_buf = torch.empty(initial_workspace_size,
-                                          device="cuda",
-                                          dtype=torch.uint8)
+        self._workspace_buf = torch.empty(
+            initial_workspace_size, device="cuda", dtype=torch.uint8
+        )
 
         self._block_size = 128  # Forced to 128
 
@@ -57,8 +61,7 @@ def __init__(self, initial_workspace_size):
     def get_buf(self):
         return self._workspace_buf
 
-    def ensure_size(self, attn_metadata: MLACommonMetadata,
-                    num_kv_splits: int):
+    def ensure_size(self, attn_metadata: MLACommonMetadata, num_kv_splits: int):
         batch_size = attn_metadata.num_reqs
         max_seq_len = attn_metadata.max_query_len
 
@@ -66,7 +69,8 @@ def ensure_size(self, attn_metadata: MLACommonMetadata,
             max_seq_len * self._block_size,
             batch_size,
             self._sm_count,
-            num_kv_splits=num_kv_splits)
+            num_kv_splits=num_kv_splits,
+        )
 
         if self._workspace_buf.shape[0] < workspace_size:
             self._workspace_buf.resize_(workspace_size)
@@ -81,51 +85,56 @@ class CutlassMLAImpl(MLACommonImpl[MLACommonMetadata]):
     can_return_lse_for_decode: bool = True
 
     def __init__(
-            self,
-            num_heads: int,
-            head_size: int,
-            scale: float,
-            num_kv_heads: int,
-            alibi_slopes: Optional[list[float]],
-            sliding_window: Optional[int],
-            kv_cache_dtype: str,
-            logits_soft_cap: Optional[float],
-            attn_type: str,
-            kv_sharing_target_layer_name: Optional[str],
-            # MLA Specific Arguments
-            **mla_args) -> None:
-        super().__init__(num_heads,
-                         head_size,
-                         scale,
-                         num_kv_heads,
-                         alibi_slopes,
-                         sliding_window,
-                         kv_cache_dtype,
-                         logits_soft_cap,
-                         attn_type,
-                         kv_sharing_target_layer_name,
-                         q_pad_num_heads=MAX_HEADS,
-                         **mla_args)
+        self,
+        num_heads: int,
+        head_size: int,
+        scale: float,
+        num_kv_heads: int,
+        alibi_slopes: Optional[list[float]],
+        sliding_window: Optional[int],
+        kv_cache_dtype: str,
+        logits_soft_cap: Optional[float],
+        attn_type: str,
+        kv_sharing_target_layer_name: Optional[str],
+        # MLA Specific Arguments
+        **mla_args,
+    ) -> None:
+        super().__init__(
+            num_heads,
+            head_size,
+            scale,
+            num_kv_heads,
+            alibi_slopes,
+            sliding_window,
+            kv_cache_dtype,
+            logits_soft_cap,
+            attn_type,
+            kv_sharing_target_layer_name,
+            q_pad_num_heads=MAX_HEADS,
+            **mla_args,
+        )
 
         unsupported_features = [alibi_slopes, sliding_window, logits_soft_cap]
         if any(unsupported_features):
             raise NotImplementedError(
                 "CutlassMLAImpl does not support one of the following: "
-                "alibi_slopes, sliding_window, logits_soft_cap")
+                "alibi_slopes, sliding_window, logits_soft_cap"
+            )
 
         if attn_type != AttentionType.DECODER:
-            raise NotImplementedError("Encoder self-attention and "
-                                      "encoder/decoder cross-attention "
-                                      "are not implemented for "
-                                      "CutlassMLAImpl")
+            raise NotImplementedError(
+                "Encoder self-attention and "
+                "encoder/decoder cross-attention "
+                "are not implemented for "
+                "CutlassMLAImpl"
+            )
 
         # TODO: Currently, num_kv_splits is limited to 16 to avoid hanging
         #       issues. In case the code hangs, use:
         #       FORCE_NUM_KV_SPLITS=1
         force_num_kv_splits = os.environ.get("FORCE_NUM_KV_SPLITS", None)
         if force_num_kv_splits:
-            logger.warning_once("Forcing num_kv_splits to %d",
-                                int(force_num_kv_splits))
+            logger.warning_once("Forcing num_kv_splits to %d", int(force_num_kv_splits))
             self._num_kv_splits = int(force_num_kv_splits)
         else:
             self._num_kv_splits = -1  # => Auto-detect
@@ -144,14 +153,13 @@ def _sm100_cutlass_mla_decode(
         sm_scale: float,
         num_kv_splits: int,
     ) -> tuple[torch.Tensor, torch.Tensor]:
-        assert (q_nope.ndim == 3
-                ), f"q_nope must be a 3D tensor, but got {q_nope.ndim}"
-        assert (
-            q_pe.ndim == 3), f"q_pe must be a 3D tensor, but got {q_pe.ndim}"
-        assert (
-            kv_c_and_k_pe_cache.ndim == 3
-        ), "kv_c_and_k_pe_cache must be a 3D tensor, but got {}".format(
-            kv_c_and_k_pe_cache.ndim)
+        assert q_nope.ndim == 3, f"q_nope must be a 3D tensor, but got {q_nope.ndim}"
+        assert q_pe.ndim == 3, f"q_pe must be a 3D tensor, but got {q_pe.ndim}"
+        assert kv_c_and_k_pe_cache.ndim == 3, (
+            "kv_c_and_k_pe_cache must be a 3D tensor, but got {}".format(
+                kv_c_and_k_pe_cache.ndim
+            )
+        )
 
         B_q, H, D_q_nope = q_nope.shape
         B_q_2, H_2, D_q_pe = q_pe.shape
@@ -171,28 +179,31 @@ def _sm100_cutlass_mla_decode(
         assert len(page_table.shape) == 2
         B_block_table, block_num = page_table.shape
         assert B_block_table == B_q
-        assert (block_num
-                > 0), f"block num must be greater than 0, got {block_num}"
+        assert block_num > 0, f"block num must be greater than 0, got {block_num}"
         assert block_num % (128 / PAGE_SIZE) == 0
 
-        assert q_nope.dtype in (
-            torch.float16, torch.bfloat16, torch.float8_e4m3fn), (
-                f"q_nope.dtype needs to be fp16 or bf16 or e4m3 but got "
-                f"{q_nope.dtype}.")
+        assert q_nope.dtype in (torch.float16, torch.bfloat16, torch.float8_e4m3fn), (
+            f"q_nope.dtype needs to be fp16 or bf16 or e4m3 but got {q_nope.dtype}."
+        )
         assert q_nope.dtype == q_pe.dtype == kv_c_and_k_pe_cache.dtype
-        assert (
-            seq_lens.dtype == torch.int32
-        ), f"seq_lens.dtype needs to be int32 but got {seq_lens.dtype}."
-        assert (
-            page_table.dtype == torch.int32
-        ), f"page_table.dtype needs to be int32 but got {page_table.dtype}."
-
-        dtype = (torch.bfloat16 if is_quantized_kv_cache(self.kv_cache_dtype)
-                 else q_nope.dtype)
+        assert seq_lens.dtype == torch.int32, (
+            f"seq_lens.dtype needs to be int32 but got {seq_lens.dtype}."
+        )
+        assert page_table.dtype == torch.int32, (
+            f"page_table.dtype needs to be int32 but got {page_table.dtype}."
+        )
+
+        dtype = (
+            torch.bfloat16
+            if is_quantized_kv_cache(self.kv_cache_dtype)
+            else q_nope.dtype
+        )
         out = q_nope.new_empty((B_q, MAX_HEADS, D_latent), dtype=dtype)
-        lse = (torch.empty(
-            (B_q, MAX_HEADS), dtype=torch.float32, device=q_nope.device)
-               if self.need_to_return_lse_for_decode else torch.Tensor())
+        lse = (
+            torch.empty((B_q, MAX_HEADS), dtype=torch.float32, device=q_nope.device)
+            if self.need_to_return_lse_for_decode
+            else torch.Tensor()
+        )
 
         ops.sm100_cutlass_mla_decode(
             out,
@@ -228,7 +239,8 @@ def _forward_decode(
             q_nope, q_pe = q
         else:
             q_nope, q_pe = torch.split(
-                q, [self.kv_lora_rank, self.qk_rope_head_dim], dim=-1)
+                q, [self.kv_lora_rank, self.qk_rope_head_dim], dim=-1
+            )
 
         # Adjust workspace size (if necessary)
         self._workspace.ensure_size(attn_metadata, self._num_kv_splits)
diff --git a/vllm/v1/attention/backends/mla/flashattn_mla.py b/vllm/v1/attention/backends/mla/flashattn_mla.py
index 652b1cdb6b76..c0c2dbe1f961 100644
--- a/vllm/v1/attention/backends/mla/flashattn_mla.py
+++ b/vllm/v1/attention/backends/mla/flashattn_mla.py
@@ -7,18 +7,25 @@
 import torch
 
 from vllm import envs
-from vllm.attention.backends.abstract import (AttentionLayer, AttentionType,
-                                              is_quantized_kv_cache)
-from vllm.attention.utils.fa_utils import (flash_attn_supports_mla,
-                                           get_flash_attn_version)
+from vllm.attention.backends.abstract import (
+    AttentionLayer,
+    AttentionType,
+    is_quantized_kv_cache,
+)
+from vllm.attention.utils.fa_utils import (
+    flash_attn_supports_mla,
+    get_flash_attn_version,
+)
 from vllm.config import VllmConfig
 from vllm.distributed.parallel_state import get_dcp_group
 from vllm.logger import init_logger
-from vllm.v1.attention.backends.mla.common import (MLACommonBackend,
-                                                   MLACommonDecodeMetadata,
-                                                   MLACommonImpl,
-                                                   MLACommonMetadata,
-                                                   MLACommonMetadataBuilder)
+from vllm.v1.attention.backends.mla.common import (
+    MLACommonBackend,
+    MLACommonDecodeMetadata,
+    MLACommonImpl,
+    MLACommonMetadata,
+    MLACommonMetadataBuilder,
+)
 from vllm.v1.attention.backends.utils import AttentionCGSupport
 from vllm.v1.kv_cache_interface import AttentionSpec
 from vllm.vllm_flash_attn import flash_attn_varlen_func, get_scheduler_metadata
@@ -27,7 +34,6 @@
 
 
 class FlashAttnMLABackend(MLACommonBackend):
-
     @staticmethod
     def get_name() -> str:
         return "FLASH_ATTN_MLA"
@@ -59,22 +65,27 @@ class FlashAttnMLAMetadata(MLACommonMetadata[FlashAttnMLADecodeMetadata]):
     pass
 
 
-class FlashAttnMLAMetadataBuilder(
-        MLACommonMetadataBuilder[FlashAttnMLAMetadata]):
-    cudagraph_support: ClassVar[AttentionCGSupport] = \
-        AttentionCGSupport.UNIFORM_BATCH
+class FlashAttnMLAMetadataBuilder(MLACommonMetadataBuilder[FlashAttnMLAMetadata]):
+    cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.UNIFORM_BATCH
 
     reorder_batch_threshold: int = 512
 
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
-        super().__init__(kv_cache_spec, layer_names, vllm_config, device,
-                         FlashAttnMLAMetadata)
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
+        super().__init__(
+            kv_cache_spec, layer_names, vllm_config, device, FlashAttnMLAMetadata
+        )
         self.max_num_splits = 0  # No upper bound on the number of splits.
-        self.fa_aot_schedule = (get_flash_attn_version() == 3)
+        self.fa_aot_schedule = get_flash_attn_version() == 3
 
-        self.use_full_cuda_graph = \
+        self.use_full_cuda_graph = (
             self.compilation_config.cudagraph_mode.has_full_cudagraphs()
+        )
 
         if self.use_full_cuda_graph and self.fa_aot_schedule:
             self.max_cudagraph_size = self.compilation_config.max_capture_size
@@ -83,8 +94,8 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
                 # This condition derives from FA3's internal heuristic.
                 # TODO(woosuk): Support larger cudagraph sizes.
                 raise ValueError(
-                    "Capture size larger than 992 is not supported for "
-                    "full cuda graph.")
+                    "Capture size larger than 992 is not supported for full cuda graph."
+                )
 
             self.scheduler_metadata = torch.zeros(
                 vllm_config.scheduler_config.max_num_seqs + 1,
@@ -94,16 +105,17 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
             # When using cuda graph, we need to set the upper bound of the
             # number of splits so that large enough intermediate buffers are
             # pre-allocated during capture.
-            self.max_num_splits = (
-                envs.VLLM_FLASH_ATTN_MAX_NUM_SPLITS_FOR_CUDA_GRAPH)
+            self.max_num_splits = envs.VLLM_FLASH_ATTN_MAX_NUM_SPLITS_FOR_CUDA_GRAPH
 
         # TODO(lucas): Until we add support for the DCP custom masking we need
         #   to restrict decodes to q_len == 1 when DCP is enabled.
-        self.reorder_batch_threshold = 1 \
-            if get_dcp_group().world_size > 1 else self.reorder_batch_threshold
+        self.reorder_batch_threshold = (
+            1 if get_dcp_group().world_size > 1 else self.reorder_batch_threshold
+        )
 
-    def _schedule_decode(self, num_reqs, cu_query_lens, max_query_len, seqlens,
-                         max_seq_len, causal):
+    def _schedule_decode(
+        self, num_reqs, cu_query_lens, max_query_len, seqlens, max_seq_len, causal
+    ):
         if self.fa_aot_schedule:
             return get_scheduler_metadata(
                 batch_size=num_reqs,
@@ -122,13 +134,16 @@ def _schedule_decode(self, num_reqs, cu_query_lens, max_query_len, seqlens,
             )
         return None
 
-    def _build_decode(self, block_table_tensor: torch.Tensor,
-                      seq_lens_cpu: torch.Tensor,
-                      seq_lens_device: torch.Tensor,
-                      query_start_loc_cpu: torch.Tensor,
-                      query_start_loc_device: torch.Tensor,
-                      num_decode_tokens: int) -> FlashAttnMLADecodeMetadata:
-        query_lens_cpu = (query_start_loc_cpu[1:] - query_start_loc_cpu[:-1])
+    def _build_decode(
+        self,
+        block_table_tensor: torch.Tensor,
+        seq_lens_cpu: torch.Tensor,
+        seq_lens_device: torch.Tensor,
+        query_start_loc_cpu: torch.Tensor,
+        query_start_loc_device: torch.Tensor,
+        num_decode_tokens: int,
+    ) -> FlashAttnMLADecodeMetadata:
+        query_lens_cpu = query_start_loc_cpu[1:] - query_start_loc_cpu[:-1]
         max_query_len = query_lens_cpu.max().item()
         max_seq_len = seq_lens_cpu.max().item()
 
@@ -146,9 +161,10 @@ def _build_decode(self, block_table_tensor: torch.Tensor,
         if self.use_full_cuda_graph and scheduler_metadata is not None:
             n = scheduler_metadata.shape[0]
             # Ensure the persistent buffer is large enough
-            assert n <= self.scheduler_metadata.shape[0], \
-                f"Scheduler metadata size {n} exceeds buffer size " + \
-                f"{self.scheduler_metadata.shape[0]}"
+            assert n <= self.scheduler_metadata.shape[0], (
+                f"Scheduler metadata size {n} exceeds buffer size "
+                + f"{self.scheduler_metadata.shape[0]}"
+            )
             self.scheduler_metadata[:n] = scheduler_metadata
             # NOTE(woosuk): We should zero out the rest of the scheduler
             # metadata to guarantee the correctness. Otherwise, some thread
@@ -179,42 +195,55 @@ class FlashAttnMLAImpl(MLACommonImpl[FlashAttnMLAMetadata]):
     can_return_lse_for_decode: bool = True
 
     def __init__(
-            self,
-            num_heads: int,
-            head_size: int,
-            scale: float,
-            num_kv_heads: int,
-            alibi_slopes: Optional[list[float]],
-            sliding_window: Optional[int],
-            kv_cache_dtype: str,
-            logits_soft_cap: Optional[float],
-            attn_type: str,
-            kv_sharing_target_layer_name: Optional[str],
-            # MLA Specific Arguments
-            **mla_args) -> None:
-        super().__init__(num_heads, head_size, scale, num_kv_heads,
-                         alibi_slopes, sliding_window, kv_cache_dtype,
-                         logits_soft_cap, attn_type,
-                         kv_sharing_target_layer_name, **mla_args)
-
-        assert flash_attn_supports_mla(), \
-            "FlashAttnMLA is not supported on this device"
+        self,
+        num_heads: int,
+        head_size: int,
+        scale: float,
+        num_kv_heads: int,
+        alibi_slopes: Optional[list[float]],
+        sliding_window: Optional[int],
+        kv_cache_dtype: str,
+        logits_soft_cap: Optional[float],
+        attn_type: str,
+        kv_sharing_target_layer_name: Optional[str],
+        # MLA Specific Arguments
+        **mla_args,
+    ) -> None:
+        super().__init__(
+            num_heads,
+            head_size,
+            scale,
+            num_kv_heads,
+            alibi_slopes,
+            sliding_window,
+            kv_cache_dtype,
+            logits_soft_cap,
+            attn_type,
+            kv_sharing_target_layer_name,
+            **mla_args,
+        )
+
+        assert flash_attn_supports_mla(), "FlashAttnMLA is not supported on this device"
 
         unsupported_features = [alibi_slopes, sliding_window, logits_soft_cap]
         if any(unsupported_features):
             raise NotImplementedError(
                 "FlashAttnMLAImpl does not support one of the following: "
-                "alibi_slopes, sliding_window, logits_soft_cap")
+                "alibi_slopes, sliding_window, logits_soft_cap"
+            )
 
         if attn_type != AttentionType.DECODER:
-            raise NotImplementedError("Encoder self-attention and "
-                                      "encoder/decoder cross-attention "
-                                      "are not implemented for "
-                                      "FlashAttnMLAImpl")
+            raise NotImplementedError(
+                "Encoder self-attention and "
+                "encoder/decoder cross-attention "
+                "are not implemented for "
+                "FlashAttnMLAImpl"
+            )
 
         if is_quantized_kv_cache(self.kv_cache_dtype):
             raise NotImplementedError(
-                "FlashAttnMLA V1 with FP8 KV cache not yet supported")
+                "FlashAttnMLA V1 with FP8 KV cache not yet supported"
+            )
 
     def _forward_decode(
         self,
@@ -230,14 +259,14 @@ def _forward_decode(
             q_nope, q_pe = q
         else:
             q_nope, q_pe = torch.split(
-                q, [self.kv_lora_rank, self.qk_rope_head_dim], dim=-1)
+                q, [self.kv_lora_rank, self.qk_rope_head_dim], dim=-1
+            )
 
         if self.kv_cache_dtype.startswith("fp8"):
-            raise NotImplementedError(
-                "FP8 FlashAttention MLA not yet supported")
+            raise NotImplementedError("FP8 FlashAttention MLA not yet supported")
 
-        kv_c_cache = kv_c_and_k_pe_cache[..., :self.kv_lora_rank]
-        k_pe_cache = kv_c_and_k_pe_cache[..., self.kv_lora_rank:]
+        kv_c_cache = kv_c_and_k_pe_cache[..., : self.kv_lora_rank]
+        k_pe_cache = kv_c_and_k_pe_cache[..., self.kv_lora_rank :]
 
         # NOTE(matt): During CUDA graph capture, max_query_len can be 0, but the
         # kernel uses this to calculate grid dimensions. Ensure it's at least 1
diff --git a/vllm/v1/attention/backends/mla/flashinfer_mla.py b/vllm/v1/attention/backends/mla/flashinfer_mla.py
index 701248670f72..f0ea1d653c3e 100644
--- a/vllm/v1/attention/backends/mla/flashinfer_mla.py
+++ b/vllm/v1/attention/backends/mla/flashinfer_mla.py
@@ -8,9 +8,11 @@
 
 from vllm.attention.backends.abstract import AttentionLayer, AttentionType
 from vllm.logger import init_logger
-from vllm.v1.attention.backends.mla.common import (MLACommonBackend,
-                                                   MLACommonImpl,
-                                                   MLACommonMetadata)
+from vllm.v1.attention.backends.mla.common import (
+    MLACommonBackend,
+    MLACommonImpl,
+    MLACommonMetadata,
+)
 
 logger = init_logger(__name__)
 
@@ -18,7 +20,6 @@
 
 
 class FlashInferMLABackend(MLACommonBackend):
-
     @staticmethod
     def get_name() -> str:
         return "FLASHINFER_MLA"
@@ -36,37 +37,49 @@ def get_impl_cls() -> type["FlashInferMLAImpl"]:
 
 
 class FlashInferMLAImpl(MLACommonImpl[MLACommonMetadata]):
-
     def __init__(
-            self,
-            num_heads: int,
-            head_size: int,
-            scale: float,
-            num_kv_heads: int,
-            alibi_slopes: Optional[list[float]],
-            sliding_window: Optional[int],
-            kv_cache_dtype: str,
-            logits_soft_cap: Optional[float],
-            attn_type: str,
-            kv_sharing_target_layer_name: Optional[str],
-            # MLA Specific Arguments
-            **mla_args) -> None:
-        super().__init__(num_heads, head_size, scale, num_kv_heads,
-                         alibi_slopes, sliding_window, kv_cache_dtype,
-                         logits_soft_cap, attn_type,
-                         kv_sharing_target_layer_name, **mla_args)
+        self,
+        num_heads: int,
+        head_size: int,
+        scale: float,
+        num_kv_heads: int,
+        alibi_slopes: Optional[list[float]],
+        sliding_window: Optional[int],
+        kv_cache_dtype: str,
+        logits_soft_cap: Optional[float],
+        attn_type: str,
+        kv_sharing_target_layer_name: Optional[str],
+        # MLA Specific Arguments
+        **mla_args,
+    ) -> None:
+        super().__init__(
+            num_heads,
+            head_size,
+            scale,
+            num_kv_heads,
+            alibi_slopes,
+            sliding_window,
+            kv_cache_dtype,
+            logits_soft_cap,
+            attn_type,
+            kv_sharing_target_layer_name,
+            **mla_args,
+        )
 
         unsupported_features = [alibi_slopes, sliding_window, logits_soft_cap]
         if any(unsupported_features):
             raise NotImplementedError(
                 "FlashInferMLAImpl does not support one of the following: "
-                "alibi_slopes, sliding_window, logits_soft_cap")
+                "alibi_slopes, sliding_window, logits_soft_cap"
+            )
 
         if attn_type != AttentionType.DECODER:
-            raise NotImplementedError("Encoder self-attention and "
-                                      "encoder/decoder cross-attention "
-                                      "are not implemented for "
-                                      "FlashInferMLAImpl")
+            raise NotImplementedError(
+                "Encoder self-attention and "
+                "encoder/decoder cross-attention "
+                "are not implemented for "
+                "FlashInferMLAImpl"
+            )
 
         self._workspace_buffer = g_fi_workspace
         self.bmm1_scale: Optional[float] = None
@@ -90,8 +103,7 @@ def _forward_decode(
         q = q.unsqueeze(1)
 
         if self.bmm1_scale is None:
-            self.bmm1_scale = (layer._q_scale_float * layer._k_scale_float *
-                               self.scale)
+            self.bmm1_scale = layer._q_scale_float * layer._k_scale_float * self.scale
         if self.bmm2_scale is None:
             self.bmm2_scale = layer._v_scale_float
 
diff --git a/vllm/v1/attention/backends/mla/flashmla.py b/vllm/v1/attention/backends/mla/flashmla.py
index 67c21f83cf5d..56480832bcd1 100644
--- a/vllm/v1/attention/backends/mla/flashmla.py
+++ b/vllm/v1/attention/backends/mla/flashmla.py
@@ -7,16 +7,20 @@
 import torch
 
 from vllm.attention.backends.abstract import AttentionLayer, AttentionType
-from vllm.attention.ops.flashmla import (flash_mla_with_kvcache,
-                                         get_mla_metadata,
-                                         is_flashmla_supported)
+from vllm.attention.ops.flashmla import (
+    flash_mla_with_kvcache,
+    get_mla_metadata,
+    is_flashmla_supported,
+)
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
-from vllm.v1.attention.backends.mla.common import (MLACommonBackend,
-                                                   MLACommonDecodeMetadata,
-                                                   MLACommonImpl,
-                                                   MLACommonMetadata,
-                                                   MLACommonMetadataBuilder)
+from vllm.v1.attention.backends.mla.common import (
+    MLACommonBackend,
+    MLACommonDecodeMetadata,
+    MLACommonImpl,
+    MLACommonMetadata,
+    MLACommonMetadataBuilder,
+)
 from vllm.v1.attention.backends.utils import AttentionCGSupport
 from vllm.v1.kv_cache_interface import AttentionSpec
 
@@ -24,7 +28,6 @@
 
 
 class FlashMLABackend(MLACommonBackend):
-
     @staticmethod
     def get_name() -> str:
         return "FLASHMLA"
@@ -54,16 +57,22 @@ class FlashMLAMetadata(MLACommonMetadata[FlashMLADecodeMetadata]):
 
 
 class FlashMLAMetadataBuilder(MLACommonMetadataBuilder[FlashMLAMetadata]):
-    cudagraph_support: ClassVar[AttentionCGSupport] = \
-        AttentionCGSupport.UNIFORM_BATCH
+    cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.UNIFORM_BATCH
 
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
-        super().__init__(kv_cache_spec, layer_names, vllm_config, device,
-                         FlashMLAMetadata)
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
+        super().__init__(
+            kv_cache_spec, layer_names, vllm_config, device, FlashMLAMetadata
+        )
 
         self.num_q_heads = vllm_config.model_config.get_num_attention_heads(
-            vllm_config.parallel_config)
+            vllm_config.parallel_config
+        )
 
         self.cg_buf_tile_scheduler_metadata = None
         self.cg_buf_num_splits = None
@@ -82,19 +91,22 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
             self.cg_buf_num_splits = torch.empty(
                 (vllm_config.scheduler_config.max_num_seqs + 1),
                 device=self.device,
-                dtype=torch.int32)
-
-    def _build_decode(self, block_table_tensor: torch.Tensor,
-                      seq_lens_cpu: torch.Tensor,
-                      seq_lens_device: torch.Tensor,
-                      query_start_loc_cpu: torch.Tensor,
-                      query_start_loc_device: torch.Tensor,
-                      num_decode_tokens: int) -> FlashMLADecodeMetadata:
-        tile_scheduler_metadata, num_splits = \
-            get_mla_metadata(
+                dtype=torch.int32,
+            )
+
+    def _build_decode(
+        self,
+        block_table_tensor: torch.Tensor,
+        seq_lens_cpu: torch.Tensor,
+        seq_lens_device: torch.Tensor,
+        query_start_loc_cpu: torch.Tensor,
+        query_start_loc_device: torch.Tensor,
+        num_decode_tokens: int,
+    ) -> FlashMLADecodeMetadata:
+        tile_scheduler_metadata, num_splits = get_mla_metadata(
             seq_lens_device,
             self.num_q_heads,
-            1, # MQA for the decode path
+            1,  # MQA for the decode path
         )
 
         # TODO: we can disambiguate between decode and mixed-prefill decode here
@@ -107,8 +119,9 @@ def _build_decode(self, block_table_tensor: torch.Tensor,
             sm_parts = tile_scheduler_metadata.size(0)
             # Metadata per-SM, upper bound on size (<= #SMs, TileMetadataSize)
             assert sm_parts <= self.cg_buf_tile_scheduler_metadata.size(0)
-            tile_scheduler_metadata_view = \
-                self.cg_buf_tile_scheduler_metadata[:sm_parts]
+            tile_scheduler_metadata_view = self.cg_buf_tile_scheduler_metadata[
+                :sm_parts
+            ]
             tile_scheduler_metadata_view.copy_(tile_scheduler_metadata)
             tile_scheduler_metadata = tile_scheduler_metadata_view
 
@@ -133,27 +146,36 @@ def _build_decode(self, block_table_tensor: torch.Tensor,
 
 
 class FlashMLAImpl(MLACommonImpl[FlashMLAMetadata]):
-
     can_return_lse_for_decode: bool = True
 
     def __init__(
-            self,
-            num_heads: int,
-            head_size: int,
-            scale: float,
-            num_kv_heads: int,
-            alibi_slopes: Optional[list[float]],
-            sliding_window: Optional[int],
-            kv_cache_dtype: str,
-            logits_soft_cap: Optional[float],
-            attn_type: str,
-            kv_sharing_target_layer_name: Optional[str],
-            # MLA Specific Arguments
-            **mla_args) -> None:
-        super().__init__(num_heads, head_size, scale, num_kv_heads,
-                         alibi_slopes, sliding_window, kv_cache_dtype,
-                         logits_soft_cap, attn_type,
-                         kv_sharing_target_layer_name, **mla_args)
+        self,
+        num_heads: int,
+        head_size: int,
+        scale: float,
+        num_kv_heads: int,
+        alibi_slopes: Optional[list[float]],
+        sliding_window: Optional[int],
+        kv_cache_dtype: str,
+        logits_soft_cap: Optional[float],
+        attn_type: str,
+        kv_sharing_target_layer_name: Optional[str],
+        # MLA Specific Arguments
+        **mla_args,
+    ) -> None:
+        super().__init__(
+            num_heads,
+            head_size,
+            scale,
+            num_kv_heads,
+            alibi_slopes,
+            sliding_window,
+            kv_cache_dtype,
+            logits_soft_cap,
+            attn_type,
+            kv_sharing_target_layer_name,
+            **mla_args,
+        )
 
         is_supported, reason = is_flashmla_supported()
         assert is_supported, reason
@@ -162,13 +184,16 @@ def __init__(
         if any(unsupported_features):
             raise NotImplementedError(
                 "FlashMLAImpl does not support one of the following: "
-                "alibi_slopes, sliding_window, logits_soft_cap")
+                "alibi_slopes, sliding_window, logits_soft_cap"
+            )
 
         if attn_type != AttentionType.DECODER:
-            raise NotImplementedError("Encoder self-attention and "
-                                      "encoder/decoder cross-attention "
-                                      "are not implemented for "
-                                      "FlashMLAImpl")
+            raise NotImplementedError(
+                "Encoder self-attention and "
+                "encoder/decoder cross-attention "
+                "are not implemented for "
+                "FlashMLAImpl"
+            )
 
     def _forward_decode(
         self,
@@ -191,8 +216,7 @@ def _forward_decode(
             block_table=attn_metadata.decode.block_table,
             cache_seqlens=attn_metadata.decode.seq_lens,
             head_dim_v=self.kv_lora_rank,
-            tile_scheduler_metadata=attn_metadata.decode.
-            tile_scheduler_metadata,
+            tile_scheduler_metadata=attn_metadata.decode.tile_scheduler_metadata,
             num_splits=attn_metadata.decode.num_splits,
             softmax_scale=self.scale,
             causal=True,
diff --git a/vllm/v1/attention/backends/mla/flashmla_sparse.py b/vllm/v1/attention/backends/mla/flashmla_sparse.py
index 36c3c188042c..21d67f832b7b 100644
--- a/vllm/v1/attention/backends/mla/flashmla_sparse.py
+++ b/vllm/v1/attention/backends/mla/flashmla_sparse.py
@@ -8,21 +8,28 @@
 import torch
 
 from vllm import _custom_ops as ops
-from vllm.attention.backends.abstract import (AttentionBackend, AttentionLayer,
-                                              AttentionMetadata)
+from vllm.attention.backends.abstract import (
+    AttentionBackend,
+    AttentionLayer,
+    AttentionMetadata,
+)
 from vllm.attention.backends.utils import get_mla_dims
-from vllm.attention.ops.flashmla import (flash_mla_sparse_prefill,
-                                         flash_mla_with_kvcache,
-                                         get_mla_metadata)
+from vllm.attention.ops.flashmla import (
+    flash_mla_sparse_prefill,
+    flash_mla_with_kvcache,
+    get_mla_metadata,
+)
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 from vllm.triton_utils import tl, triton
 from vllm.utils import cdiv
 from vllm.v1.attention.backends.mla.common import MLACommonBaseImpl
-from vllm.v1.attention.backends.utils import (AttentionCGSupport,
-                                              AttentionMetadataBuilder,
-                                              CommonAttentionMetadata)
+from vllm.v1.attention.backends.utils import (
+    AttentionCGSupport,
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+)
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 if TYPE_CHECKING:
@@ -47,11 +54,10 @@
 def _lse2_to_lse(lse_base2: torch.Tensor) -> torch.Tensor:
     # Convert base-2 LSE to natural-log LSE
     # Keep FP32 for numerical stability during the merge.
-    return (lse_base2.to(torch.float32) * math.log(2.0))
+    return lse_base2.to(torch.float32) * math.log(2.0)
 
 
 class FlashMLASparseBackend(AttentionBackend):
-
     accept_output_buffer: bool = True
 
     @staticmethod
@@ -113,13 +119,14 @@ class FlashMLASparseDecodeAndContextMetadata:
     dummy_block_table: torch.Tensor = None
 
     def filter_prefill_indices(
-            self, indices: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+        self, indices: torch.Tensor
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         assert self.prefill_context_lengths is not None
         prefill_context_lengths = self.prefill_context_lengths.unsqueeze(-1)
-        context_indices = torch.where(indices < prefill_context_lengths,
-                                      indices, -1)
-        new_token_indices = torch.where(indices >= prefill_context_lengths,
-                                        indices - prefill_context_lengths, -1)
+        context_indices = torch.where(indices < prefill_context_lengths, indices, -1)
+        new_token_indices = torch.where(
+            indices >= prefill_context_lengths, indices - prefill_context_lengths, -1
+        )
         return context_indices, new_token_indices
 
 
@@ -194,8 +201,9 @@ def _convert_req_index_to_global_index_kernel(
     base = tl.load(bt_ptr, mask=valid_block, other=0)
 
     # If token == -1 OR block_id OOB, output -1; else base * BLOCK_SIZE + offset
-    out_val = tl.where(is_invalid_tok | (~valid_block), -1,
-                       base * BLOCK_SIZE + inblock_off)
+    out_val = tl.where(
+        is_invalid_tok | (~valid_block), -1, base * BLOCK_SIZE + inblock_off
+    )
 
     # Store results
     out_ptr_ij = out_ptr + token_id * out_stride0 + indice_id * out_stride1
@@ -203,31 +211,30 @@ def _convert_req_index_to_global_index_kernel(
 
 
 def triton_convert_req_index_to_global_index(
-        req_id: torch.Tensor,  # int32 [num_tokens]
-        block_table: torch.
-    Tensor,  # int32 [num_requests, max_num_blocks_per_req]
-        token_indices: torch.Tensor,  # int32 [num_tokens, NUM_TOPK_TOKENS]
-        BLOCK_SIZE: int = 64,
-        NUM_TOPK_TOKENS: int = 2048,
-        BLOCK_N: int = 128,  # tile width along columns
+    req_id: torch.Tensor,  # int32 [num_tokens]
+    block_table: torch.Tensor,  # int32 [num_requests, max_num_blocks_per_req]
+    token_indices: torch.Tensor,  # int32 [num_tokens, NUM_TOPK_TOKENS]
+    BLOCK_SIZE: int = 64,
+    NUM_TOPK_TOKENS: int = 2048,
+    BLOCK_N: int = 128,  # tile width along columns
 ):
     """
     out[token_id, indice_id] =
-        block_table[req_id[token_id], 
+        block_table[req_id[token_id],
             token_indices[token_id, indice_id] // BLOCK_SIZE] * BLOCK_SIZE
         + token_indices[token_id, indice_id] % BLOCK_SIZE
 
     Only when token_indices[token_id, indice_id] == -1 do we output -1.
-    For safety, we also output -1 if the derived block_id would be 
+    For safety, we also output -1 if the derived block_id would be
         out-of-bounds.
     """
     assert req_id.dtype == torch.int32
     assert block_table.dtype == torch.int32
     assert token_indices.dtype == torch.int32
     assert token_indices.shape[1] == NUM_TOPK_TOKENS
-    assert NUM_TOPK_TOKENS % BLOCK_N == 0, \
-        f"NUM_TOPK_TOKENS ({NUM_TOPK_TOKENS}) must be divisible by" \
-        f"BLOCK_N ({BLOCK_N})"
+    assert NUM_TOPK_TOKENS % BLOCK_N == 0, (
+        f"NUM_TOPK_TOKENS ({NUM_TOPK_TOKENS}) must be divisible byBLOCK_N ({BLOCK_N})"
+    )
 
     num_tokens = req_id.shape[0]
     num_requests, max_num_blocks_per_req = block_table.shape
@@ -268,14 +275,16 @@ def triton_convert_req_index_to_global_index(
 
 
 @dataclass
-class FlashMLASparseMetadataBuilder(
-        AttentionMetadataBuilder[FlashMLASparseMetadata]):
-    cudagraph_support: ClassVar[AttentionCGSupport] = \
-        AttentionCGSupport.UNIFORM_BATCH
-
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
+class FlashMLASparseMetadataBuilder(AttentionMetadataBuilder[FlashMLASparseMetadata]):
+    cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.UNIFORM_BATCH
 
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
         cache_config = vllm_config.cache_config
         self.kv_cache_spec = kv_cache_spec
         self.model_config = vllm_config.model_config
@@ -285,28 +294,27 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
         props = torch.cuda.get_device_properties(device)
         sm_count = props.multi_processor_count
 
-        self.num_heads = self.model_config.get_num_attention_heads(
-            parallel_config)
+        self.num_heads = self.model_config.get_num_attention_heads(parallel_config)
         self.mla_dims = get_mla_dims(self.model_config)
         self.topk_tokens = vllm_config.model_config.hf_config.index_topk
         self.use_fp8_kv_cache = cache_config.cache_dtype == "fp8_ds_mla"
-        self.topk_tokens_tensor = torch.tensor([self.topk_tokens],
-                                               device=device,
-                                               dtype=torch.int32)
+        self.topk_tokens_tensor = torch.tensor(
+            [self.topk_tokens], device=device, dtype=torch.int32
+        )
         self.max_model_len_tensor = torch.tensor(
-            [self.model_config.max_model_len],
-            device=device,
-            dtype=torch.int32)
+            [self.model_config.max_model_len], device=device, dtype=torch.int32
+        )
         # this is ignored by `flash_mla_with_kvcache` if indices not None
-        self.dummy_block_table = torch.empty((1, 1),
-                                             dtype=torch.int32,
-                                             device=self.device)
+        self.dummy_block_table = torch.empty(
+            (1, 1), dtype=torch.int32, device=self.device
+        )
 
         # Equation taken from FlashMLA/csrc/pybind.cpp
         h_q, h_k = self.num_heads, 1
         s_q = 1  # inversely proportional to s_q, so s_q = 1 is the largest
         max_num_sm_parts = int(
-            max((sm_count // 2) / h_k // (cdiv(h_q // h_k, 2 * 64) * s_q), 1))
+            max((sm_count // 2) / h_k // (cdiv(h_q // h_k, 2 * 64) * s_q), 1)
+        )
         if current_platform.is_device_capability(100):
             max_num_sm_parts *= 2
         self.tile_scheduler_metadata_buffer = torch.empty(
@@ -314,34 +322,38 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
             # see: FlashMLA/csrc/params.h
             (max_num_sm_parts, 8),
             dtype=torch.int32,
-            device=device)
+            device=device,
+        )
         self.num_splits_buffer = torch.empty(
             # We pack all the tokens into one batch for sparse attention.
             # Otherwise, we can exceed the sm of `get_mla_metadata`.
-            (
-                2, ),
+            (2,),
             dtype=torch.int32,
-            device=device)
+            device=device,
+        )
         self.req_id_per_token_buffer = torch.empty(
-            (vllm_config.scheduler_config.max_num_batched_tokens, ),
+            (vllm_config.scheduler_config.max_num_batched_tokens,),
             dtype=torch.int32,
-            device=device)
-
-    def build(self,
-              common_prefix_len: int,
-              common_attn_metadata: CommonAttentionMetadata,
-              fast_build: bool = False) -> FlashMLASparseMetadata:
+            device=device,
+        )
 
+    def build(
+        self,
+        common_prefix_len: int,
+        common_attn_metadata: CommonAttentionMetadata,
+        fast_build: bool = False,
+    ) -> FlashMLASparseMetadata:
         num_tokens = common_attn_metadata.num_actual_tokens
-        starts = np.asarray(common_attn_metadata.query_start_loc_cpu,
-                            dtype=np.int32)
+        starts = np.asarray(common_attn_metadata.query_start_loc_cpu, dtype=np.int32)
         seg_lengths = np.diff(starts)
         req_id_per_token = np.repeat(
-            np.arange(seg_lengths.shape[0], dtype=np.int32), seg_lengths)
+            np.arange(seg_lengths.shape[0], dtype=np.int32), seg_lengths
+        )
         # Zero-fill for cudagraphs
         self.req_id_per_token_buffer.fill_(0)
-        self.req_id_per_token_buffer[:req_id_per_token.shape[0]]\
-            .copy_(torch.from_numpy(req_id_per_token), non_blocking=True)
+        self.req_id_per_token_buffer[: req_id_per_token.shape[0]].copy_(
+            torch.from_numpy(req_id_per_token), non_blocking=True
+        )
         req_id_per_token = self.req_id_per_token_buffer[:num_tokens]
 
         fp8_extra_metadata = None
@@ -357,8 +369,9 @@ def build(self,
 
             num_sm_parts = tile_scheduler_metadata.size(0)
             # Copy to persistent buffer for full-CG support
-            tile_scheduler_metadata_buffer = \
-                self.tile_scheduler_metadata_buffer[:num_sm_parts]
+            tile_scheduler_metadata_buffer = self.tile_scheduler_metadata_buffer[
+                :num_sm_parts
+            ]
             tile_scheduler_metadata_buffer.copy_(tile_scheduler_metadata)
             self.num_splits_buffer.copy_(num_splits)
 
@@ -371,7 +384,8 @@ def build(self,
                 # accidentally mark indices invalid, we will use -1 exclusively
                 # to mark invalid indices
                 cache_lens=self.max_model_len_tensor,
-                dummy_block_table=self.dummy_block_table)
+                dummy_block_table=self.dummy_block_table,
+            )
 
         metadata = FlashMLASparseMetadata(
             num_reqs=common_attn_metadata.num_reqs,
@@ -390,62 +404,79 @@ def build(self,
 
 
 class FlashMLASparseImpl(MLACommonBaseImpl[FlashMLASparseMetadata]):
-
     def __init__(
-            self,
-            num_heads: int,
-            head_size: int,
-            scale: float,
-            num_kv_heads: int,
-            alibi_slopes: Optional[list[float]],
-            sliding_window: Optional[int],
-            kv_cache_dtype: str,
-            logits_soft_cap: Optional[float],
-            attn_type: str,
-            kv_sharing_target_layer_name: Optional[str],
-            # MLA Specific Arguments
-            topk_indice_buffer: Optional[torch.Tensor] = None,
-            indexer: Optional["Indexer"] = None,
-            **mla_args) -> None:
-        super().__init__(num_heads, head_size, scale, num_kv_heads,
-                         alibi_slopes, sliding_window, kv_cache_dtype,
-                         logits_soft_cap, attn_type,
-                         kv_sharing_target_layer_name, **mla_args)
+        self,
+        num_heads: int,
+        head_size: int,
+        scale: float,
+        num_kv_heads: int,
+        alibi_slopes: Optional[list[float]],
+        sliding_window: Optional[int],
+        kv_cache_dtype: str,
+        logits_soft_cap: Optional[float],
+        attn_type: str,
+        kv_sharing_target_layer_name: Optional[str],
+        # MLA Specific Arguments
+        topk_indice_buffer: Optional[torch.Tensor] = None,
+        indexer: Optional["Indexer"] = None,
+        **mla_args,
+    ) -> None:
+        super().__init__(
+            num_heads,
+            head_size,
+            scale,
+            num_kv_heads,
+            alibi_slopes,
+            sliding_window,
+            kv_cache_dtype,
+            logits_soft_cap,
+            attn_type,
+            kv_sharing_target_layer_name,
+            **mla_args,
+        )
         self.softmax_scale = scale
         assert indexer is not None
         self.topk_indices_buffer = indexer.topk_indices_buffer
-        self.padding = 128 if current_platform.is_device_capability(
-            100) else 64
+        self.padding = 128 if current_platform.is_device_capability(100) else 64
 
     def _forward_bf16_kv(
-            self, q: torch.Tensor, kv_c_and_k_pe_cache: torch.Tensor,
-            topk_indices: torch.Tensor,
-            attn_metadata: FlashMLASparseMetadata) -> torch.Tensor:
+        self,
+        q: torch.Tensor,
+        kv_c_and_k_pe_cache: torch.Tensor,
+        topk_indices: torch.Tensor,
+        attn_metadata: FlashMLASparseMetadata,
+    ) -> torch.Tensor:
         num_tokens = q.shape[0]
         kv_c_and_k_pe_cache = kv_c_and_k_pe_cache.view(
-            -1, 1, kv_c_and_k_pe_cache.shape[-1])
+            -1, 1, kv_c_and_k_pe_cache.shape[-1]
+        )
 
         # NOTE(Chen): kernel requires num_local_head to be a multiple of
         # 64 on hopper and 128 on blackwell
         if self.num_heads % self.padding != 0:
             assert self.padding % self.num_heads == 0
-            logger.warning_once(f"padding num_heads to {self.padding} \
-                    due to sparse attn kernel requirement")
+            logger.warning_once(
+                f"padding num_heads to {self.padding} \
+                    due to sparse attn kernel requirement"
+            )
             q_padded = q.new_empty((q.shape[0], self.padding, q.shape[2]))
-            q_padded[:, :self.num_heads, :] = q
+            q_padded[:, : self.num_heads, :] = q
             q = q_padded
 
         topk_indices = topk_indices.view(num_tokens, 1, -1)
-        output = flash_mla_sparse_prefill(q, kv_c_and_k_pe_cache, topk_indices,
-                                          self.softmax_scale)[0]
-        output = output[:, :self.num_heads, :]
+        output = flash_mla_sparse_prefill(
+            q, kv_c_and_k_pe_cache, topk_indices, self.softmax_scale
+        )[0]
+        output = output[:, : self.num_heads, :]
         return output
 
-    def _forward_fp8_kv(self, q: torch.Tensor,
-                        kv_c_and_k_pe_cache: torch.Tensor,
-                        topk_indices: torch.Tensor,
-                        attn_metadata: FlashMLASparseMetadata) -> torch.Tensor:
-
+    def _forward_fp8_kv(
+        self,
+        q: torch.Tensor,
+        kv_c_and_k_pe_cache: torch.Tensor,
+        topk_indices: torch.Tensor,
+        attn_metadata: FlashMLASparseMetadata,
+    ) -> torch.Tensor:
         assert attn_metadata.fp8_extra_metadata is not None
         extra_metadata = attn_metadata.fp8_extra_metadata
 
@@ -483,8 +514,8 @@ def forward(
 
         if output_scale is not None or output_block_scale is not None:
             raise NotImplementedError(
-                "fused output quantization is not yet supported"
-                " for MLACommonImpl")
+                "fused output quantization is not yet supported for MLACommonImpl"
+            )
 
         if attn_metadata is None:
             # The zero fill is required when used with DP + EP
@@ -500,8 +531,7 @@ def forward(
         k_c_normed = k_c_normed[:num_actual_toks, ...]
         k_pe = k_pe[:num_actual_toks, ...]
 
-        q_nope, q_pe = q.split([self.qk_nope_head_dim, self.qk_rope_head_dim],
-                               dim=-1)
+        q_nope, q_pe = q.split([self.qk_nope_head_dim, self.qk_rope_head_dim], dim=-1)
         # Convert from (B, N, P) to (N, B, P)
         q_nope = q_nope.transpose(0, 1)
         # Multiply (N, B, P) x (N, P, L) -> (N, B, L)
@@ -534,11 +564,13 @@ def forward(
             )
 
         if self.kv_cache_dtype != "fp8_ds_mla":
-            attn_out = self._forward_bf16_kv(q, kv_cache, topk_indices_global,
-                                             attn_metadata)
+            attn_out = self._forward_bf16_kv(
+                q, kv_cache, topk_indices_global, attn_metadata
+            )
         else:
-            attn_out = self._forward_fp8_kv(q, kv_cache, topk_indices_global,
-                                            attn_metadata)
+            attn_out = self._forward_fp8_kv(
+                q, kv_cache, topk_indices_global, attn_metadata
+            )
 
         self._v_up_proj(attn_out, out=output[:num_actual_toks])
         return output
diff --git a/vllm/v1/attention/backends/mla/indexer.py b/vllm/v1/attention/backends/mla/indexer.py
index 94b963f34e4a..1344840af6a5 100644
--- a/vllm/v1/attention/backends/mla/indexer.py
+++ b/vllm/v1/attention/backends/mla/indexer.py
@@ -5,21 +5,21 @@
 
 import torch
 
-from vllm.attention.backends.abstract import (AttentionBackend,
-                                              AttentionMetadata)
+from vllm.attention.backends.abstract import AttentionBackend, AttentionMetadata
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.utils.deep_gemm import get_paged_mqa_logits_metadata
-from vllm.v1.attention.backends.utils import (AttentionCGSupport,
-                                              AttentionMetadataBuilder,
-                                              CommonAttentionMetadata,
-                                              split_decodes_and_prefills)
+from vllm.v1.attention.backends.utils import (
+    AttentionCGSupport,
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+    split_decodes_and_prefills,
+)
 
 logger = init_logger(__name__)
 
 
 class DeepseekV32IndexerBackend(AttentionBackend):
-
     @staticmethod
     def get_metadata_cls() -> type["AttentionMetadata"]:
         return DeepseekV32IndexerMetadata
@@ -76,7 +76,6 @@ class DeepSeekV32IndexerDecodeMetadata:
 
 @dataclass
 class DeepseekV32IndexerMetadata:
-
     # FIXME (zyongye)
     # hacky way to access the data now, need to be in chunked meta
     seq_lens: torch.Tensor
@@ -104,27 +103,27 @@ class DeepseekV32IndexerMetadata:
 
 # TODO (zyongye) optimize this, this is now vibe coded
 def kv_spans_from_batches(
-        start_seq_loc: torch.Tensor, seq_len_per_batch: torch.Tensor,
-        device: torch.device) -> tuple[torch.Tensor, torch.Tensor]:
+    start_seq_loc: torch.Tensor, seq_len_per_batch: torch.Tensor, device: torch.device
+) -> tuple[torch.Tensor, torch.Tensor]:
     """
     Args:
-      start_seq_loc: 1D long tensor [B+1], cumulative counts of 
+      start_seq_loc: 1D long tensor [B+1], cumulative counts of
                      selected tokens per batch.
-            Example: [0, 2, 4, 7] -> 
+            Example: [0, 2, 4, 7] ->
                      batch sizes (selected) [2, 2, 3], N=7 tokens total.
-      seq_len_per_batch: 1D long tensor [B], 
+      seq_len_per_batch: 1D long tensor [B],
                          full sequence length (KV length) of each batch.
                          Example: [5, 9, 4].
 
     Returns:
-      start_tensor: 1D long tensor [N], start offset in the 
+      start_tensor: 1D long tensor [N], start offset in the
                     concatenated KV cache for each token's batch.
-      end_location: 1D long tensor [N], 
+      end_location: 1D long tensor [N],
                     **exclusive** end = start + token's local position.
                     (So the attended KV slice is kv[start:end].)
 
-    Assumes each batch contributes its full `seq_len_per_batch[i]` 
-    keys to the KV cache, andthe selected tokens within a batch 
+    Assumes each batch contributes its full `seq_len_per_batch[i]`
+    keys to the KV cache, andthe selected tokens within a batch
     are the **last** `counts[i]` positions of that sequence.
     """
     q = start_seq_loc.to(dtype=torch.long)
@@ -138,8 +137,10 @@ def kv_spans_from_batches(
     B = L.numel()
 
     if N == 0:
-        return (torch.empty(0, dtype=torch.long, device=device),
-                torch.empty(0, dtype=torch.long, device=device))
+        return (
+            torch.empty(0, dtype=torch.long, device=device),
+            torch.empty(0, dtype=torch.long, device=device),
+        )
 
     # KV start offsets per batch in the concatenated KV cache
     kv_starts_per_batch = torch.cumsum(L, dim=0) - L  # [B]
@@ -155,8 +156,9 @@ def kv_spans_from_batches(
     L_expand = torch.repeat_interleave(L, counts)  # [N]
     m_expand = torch.repeat_interleave(counts, counts)  # [N]
     # position within the selected block: 1..counts[b]
-    pos_within = (torch.arange(N, dtype=torch.long) -
-                  torch.repeat_interleave(q[:-1], counts) + 1)
+    pos_within = (
+        torch.arange(N, dtype=torch.long) - torch.repeat_interleave(q[:-1], counts) + 1
+    )
 
     local_pos = L_expand - m_expand + pos_within  # [N], 1-based
     end_location = start_tensor + local_pos  # exclusive end
@@ -171,9 +173,9 @@ def get_max_prefill_buffer_size(vllm_config: VllmConfig):
     return max_model_len * 2
 
 
-def split_prefill_chunks(seq_lens_cpu: torch.Tensor,
-                         max_prefill_buffer_size: int,
-                         reqs_start: int) -> list[tuple[int, int]]:
+def split_prefill_chunks(
+    seq_lens_cpu: torch.Tensor, max_prefill_buffer_size: int, reqs_start: int
+) -> list[tuple[int, int]]:
     """
     Split the prefill chunks into a list of tuples of (reqs_start, reqs_end)
     such that the total sequence length of each chunk is less than the
@@ -183,7 +185,7 @@ def split_prefill_chunks(seq_lens_cpu: torch.Tensor,
         seq_lens_cpu: The sequence lengths of the prefill requests.
         max_prefill_buffer_size: The maximum prefill buffer size.
         reqs_start: The start index of the prefill requests.
-    
+
     Returns:
         A list of tuples of (reqs_start, reqs_end).
     """
@@ -203,20 +205,22 @@ def split_prefill_chunks(seq_lens_cpu: torch.Tensor,
 
 
 class DeepseekV32IndexerMetadataBuilder(AttentionMetadataBuilder):
-    cudagraph_support: ClassVar[AttentionCGSupport] = \
+    cudagraph_support: ClassVar[AttentionCGSupport] = (
         AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
+    )
 
     reorder_batch_threshold: int = 1
 
     def __init__(self, *args, **kwargs):
         super().__init__(*args, **kwargs)
         scheduler_config = self.vllm_config.scheduler_config
-        #NOTE(Chen):an estimated max size of flattened_kv. Need to double check.
-        self.max_prefill_buffer_size = get_max_prefill_buffer_size(
-            self.vllm_config)
+        # NOTE(Chen):an estimated max size of flattened_kv. Need to double check.
+        self.max_prefill_buffer_size = get_max_prefill_buffer_size(self.vllm_config)
         self.num_speculative_tokens = (
             self.vllm_config.speculative_config.num_speculative_tokens
-            if self.vllm_config.speculative_config else 0)
+            if self.vllm_config.speculative_config
+            else 0
+        )
         # Now deepgemm fp8_paged_mqa_logits does not support next_n > 2
         self.reorder_batch_threshold += min(self.num_speculative_tokens, 1)
 
@@ -225,31 +229,38 @@ def __init__(self, *args, **kwargs):
         self.num_sms = sm_count
 
         self.decode_lens_buffer = torch.empty(
-            (scheduler_config.max_num_seqs, ),
-            dtype=torch.int32,
-            device=self.device)
+            (scheduler_config.max_num_seqs,), dtype=torch.int32, device=self.device
+        )
 
         # See: DeepGMM/csrc/apis/attention.hpp
-        self.scheduler_metadata_buffer = torch.empty((self.num_sms + 1, 2),
-                                                     dtype=torch.int32,
-                                                     device=self.device)
-
-    def build_one_prefill_chunk(self, reqs_start, reqs_end,
-                                query_start_loc_cpu, seq_lens_cpu,
-                                block_table):
-        prefill_query_start_loc = query_start_loc_cpu[
-            reqs_start:reqs_end + 1] - query_start_loc_cpu[reqs_start]
+        self.scheduler_metadata_buffer = torch.empty(
+            (self.num_sms + 1, 2), dtype=torch.int32, device=self.device
+        )
+
+    def build_one_prefill_chunk(
+        self, reqs_start, reqs_end, query_start_loc_cpu, seq_lens_cpu, block_table
+    ):
+        prefill_query_start_loc = (
+            query_start_loc_cpu[reqs_start : reqs_end + 1]
+            - query_start_loc_cpu[reqs_start]
+        )
         cu_seqlen_ks, cu_seqlen_ke = kv_spans_from_batches(
-            prefill_query_start_loc, seq_lens_cpu[reqs_start:reqs_end],
-            self.device)
+            prefill_query_start_loc, seq_lens_cpu[reqs_start:reqs_end], self.device
+        )
         token_start = query_start_loc_cpu[reqs_start].item()
         token_end = query_start_loc_cpu[reqs_end].item()
         total_seq_lens = seq_lens_cpu[reqs_start:reqs_end].sum()
         assert total_seq_lens <= self.max_prefill_buffer_size
-        cu_seq_lens = torch.cat([
-            torch.zeros(1, dtype=torch.int32),
-            seq_lens_cpu[reqs_start:reqs_end].cumsum(dim=0)
-        ]).to(torch.int32).to(self.device)
+        cu_seq_lens = (
+            torch.cat(
+                [
+                    torch.zeros(1, dtype=torch.int32),
+                    seq_lens_cpu[reqs_start:reqs_end].cumsum(dim=0),
+                ]
+            )
+            .to(torch.int32)
+            .to(self.device)
+        )
         return DeepseekV32IndexerPrefillChunkMetadata(
             cu_seqlen_ks=cu_seqlen_ks,
             cu_seqlen_ke=cu_seqlen_ke,
@@ -261,19 +272,21 @@ def build_one_prefill_chunk(self, reqs_start, reqs_end,
             num_reqs=reqs_end - reqs_start,
         )
 
-    def build(self,
-              common_prefix_len: int,
-              common_attn_metadata: CommonAttentionMetadata,
-              fast_build: bool = False) -> DeepseekV32IndexerMetadata:
-
+    def build(
+        self,
+        common_prefix_len: int,
+        common_attn_metadata: CommonAttentionMetadata,
+        fast_build: bool = False,
+    ) -> DeepseekV32IndexerMetadata:
         num_reqs = common_attn_metadata.num_reqs
         num_tokens = common_attn_metadata.num_actual_tokens
 
         query_start_loc_cpu = common_attn_metadata.query_start_loc_cpu
-        num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = \
+        num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
             split_decodes_and_prefills(
-                common_attn_metadata,
-                decode_threshold=self.reorder_batch_threshold)
+                common_attn_metadata, decode_threshold=self.reorder_batch_threshold
+            )
+        )
 
         assert num_decodes + num_prefills == num_reqs
         assert num_decode_tokens + num_prefill_tokens == num_tokens
@@ -287,33 +300,39 @@ def build(self,
             )
             chunks = [
                 self.build_one_prefill_chunk(
-                    reqs_start, reqs_end, query_start_loc_cpu,
+                    reqs_start,
+                    reqs_end,
+                    query_start_loc_cpu,
                     common_attn_metadata.seq_lens_cpu,
-                    common_attn_metadata.block_table_tensor)
+                    common_attn_metadata.block_table_tensor,
+                )
                 for reqs_start, reqs_end in chunk_seq_ids
             ]
             prefill_metadata = DeepseekV32IndexerPrefillMetadata(
-                chunks=chunks, )
+                chunks=chunks,
+            )
 
         decode_metadata = None
         if num_decodes > 0:
-            torch.diff(common_attn_metadata.query_start_loc[:num_decodes + 1],
-                       out=self.decode_lens_buffer[:num_decodes])
+            torch.diff(
+                common_attn_metadata.query_start_loc[: num_decodes + 1],
+                out=self.decode_lens_buffer[:num_decodes],
+            )
             decode_lens = self.decode_lens_buffer[:num_decodes]
             decode_lens_cpu = torch.diff(
-                common_attn_metadata.query_start_loc_cpu[:num_decodes + 1])
+                common_attn_metadata.query_start_loc_cpu[: num_decodes + 1]
+            )
 
             # Use CPU to avoid GPU sync; breaking async scheduling
-            requires_padding = (decode_lens_cpu.max()
-                                > decode_lens_cpu.min()).item()
+            requires_padding = (decode_lens_cpu.max() > decode_lens_cpu.min()).item()
 
             seq_lens = common_attn_metadata.seq_lens[:num_decodes]
 
             self.scheduler_metadata_buffer[:] = get_paged_mqa_logits_metadata(
-                seq_lens, self.kv_cache_spec.block_size, self.num_sms)
+                seq_lens, self.kv_cache_spec.block_size, self.num_sms
+            )
             decode_metadata = DeepSeekV32IndexerDecodeMetadata(
-                block_table=common_attn_metadata.
-                block_table_tensor[:num_decodes, ...],
+                block_table=common_attn_metadata.block_table_tensor[:num_decodes, ...],
                 seq_lens=common_attn_metadata.seq_lens[:num_decodes],
                 decode_lens=decode_lens,
                 requires_padding=requires_padding,
diff --git a/vllm/v1/attention/backends/mla/rocm_aiter_mla.py b/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
index 79247e569b1c..aa9be9119dbb 100644
--- a/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
+++ b/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
@@ -11,13 +11,16 @@
 from vllm.attention.ops.rocm_aiter_mla import aiter_mla_decode_fwd
 from vllm.config import VllmConfig
 from vllm.utils import cdiv
+
 # yapf conflicts with isort for this docstring
 # yapf: disable
-from vllm.v1.attention.backends.mla.common import (MLACommonBackend,
-                                                   MLACommonDecodeMetadata,
-                                                   MLACommonImpl,
-                                                   MLACommonMetadata,
-                                                   MLACommonMetadataBuilder)
+from vllm.v1.attention.backends.mla.common import (
+    MLACommonBackend,
+    MLACommonDecodeMetadata,
+    MLACommonImpl,
+    MLACommonMetadata,
+    MLACommonMetadataBuilder,
+)
 from vllm.v1.attention.backends.utils import AttentionCGSupport
 from vllm.v1.kv_cache_interface import AttentionSpec
 
@@ -25,12 +28,10 @@
 
 
 def is_aiter_mla_enabled() -> bool:
-    return envs.VLLM_ROCM_USE_AITER \
-        and envs.VLLM_ROCM_USE_AITER_MLA
+    return envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_MLA
 
 
 class AiterMLABackend(MLACommonBackend):
-
     @staticmethod
     def get_name() -> str:
         return "ROCM_AITER_MLA"
@@ -68,19 +69,28 @@ class AiterMLAMetadata(MLACommonMetadata[AiterMLADecodeMetadata]):
 class AiterMLAMetadataBuilder(MLACommonMetadataBuilder[AiterMLAMetadata]):
     # TODO(luka, lucas): audit this as part of:
     #  https://github.com/vllm-project/vllm/issues/22945
-    cudagraph_support: ClassVar[AttentionCGSupport] = \
+    cudagraph_support: ClassVar[AttentionCGSupport] = (
         AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
+    )
 
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
-        super().__init__(kv_cache_spec, layer_names, vllm_config, device,
-                         AiterMLAMetadata)
-        assert self.kv_cache_spec.block_size == 1, "AITER MLA" \
-            "only supports block size 1."
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
+        super().__init__(
+            kv_cache_spec, layer_names, vllm_config, device, AiterMLAMetadata
+        )
+        assert self.kv_cache_spec.block_size == 1, (
+            "AITER MLAonly supports block size 1."
+        )
 
         self.compilation_config = vllm_config.compilation_config
-        max_num_pages_per_req = cdiv(vllm_config.model_config.max_model_len,
-                                     self.kv_cache_spec.block_size)
+        max_num_pages_per_req = cdiv(
+            vllm_config.model_config.max_model_len, self.kv_cache_spec.block_size
+        )
         max_num_reqs = vllm_config.scheduler_config.max_num_seqs
         max_num_pages = max_num_reqs * max_num_pages_per_req
 
@@ -89,74 +99,78 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
         # so we can only use the persistent buffer if a cudagraph is actually
         # being used.
         if self.compilation_config.cudagraph_mode.has_full_cudagraphs():
-            self.paged_kv_indptr = torch.zeros(max_num_reqs + 1,
-                                               dtype=torch.int32,
-                                               device=device)
-            self.paged_kv_indices = torch.zeros(max_num_pages,
-                                                dtype=torch.int32,
-                                                device=device)
-            self.paged_kv_last_page_len = torch.zeros(max_num_reqs,
-                                                      dtype=torch.int32,
-                                                      device=device)
-
-            self.qo_indptr = torch.arange(0,
-                                          max_num_reqs + 1,
-                                          dtype=torch.int32,
-                                          device=device)
-
-    def _build_decode(self, block_table_tensor: torch.Tensor,
-                      seq_lens_cpu: torch.Tensor,
-                      seq_lens_device: torch.Tensor,
-                      query_start_loc_cpu: torch.Tensor,
-                      query_start_loc_device: torch.Tensor,
-                      num_decode_tokens: int) -> AiterMLADecodeMetadata:
+            self.paged_kv_indptr = torch.zeros(
+                max_num_reqs + 1, dtype=torch.int32, device=device
+            )
+            self.paged_kv_indices = torch.zeros(
+                max_num_pages, dtype=torch.int32, device=device
+            )
+            self.paged_kv_last_page_len = torch.zeros(
+                max_num_reqs, dtype=torch.int32, device=device
+            )
+
+            self.qo_indptr = torch.arange(
+                0, max_num_reqs + 1, dtype=torch.int32, device=device
+            )
+
+    def _build_decode(
+        self,
+        block_table_tensor: torch.Tensor,
+        seq_lens_cpu: torch.Tensor,
+        seq_lens_device: torch.Tensor,
+        query_start_loc_cpu: torch.Tensor,
+        query_start_loc_device: torch.Tensor,
+        num_decode_tokens: int,
+    ) -> AiterMLADecodeMetadata:
         page_size = self.kv_cache_spec.block_size
         block_table_bounds = (seq_lens_device + page_size - 1) // page_size
         device = self.device
         num_reqs = seq_lens_device.size(0)
 
-        mask = (torch.arange(block_table_tensor.size(1),
-                             dtype=block_table_tensor.dtype,
-                             device=device).unsqueeze(0)
-                < block_table_bounds.unsqueeze(1))
+        mask = torch.arange(
+            block_table_tensor.size(1), dtype=block_table_tensor.dtype, device=device
+        ).unsqueeze(0) < block_table_bounds.unsqueeze(1)
         paged_kv_indices = block_table_tensor[mask]
 
         paged_kv_last_page_len = seq_lens_device % page_size
-        paged_kv_last_page_len = torch.where(paged_kv_last_page_len == 0,
-                                             page_size, paged_kv_last_page_len)
+        paged_kv_last_page_len = torch.where(
+            paged_kv_last_page_len == 0, page_size, paged_kv_last_page_len
+        )
 
-        paged_kv_indptr = torch.cat([
-            torch.zeros(1, dtype=block_table_bounds.dtype, device=device),
-            block_table_bounds.cumsum(dim=0, dtype=torch.int32)
-        ])
+        paged_kv_indptr = torch.cat(
+            [
+                torch.zeros(1, dtype=block_table_bounds.dtype, device=device),
+                block_table_bounds.cumsum(dim=0, dtype=torch.int32),
+            ]
+        )
 
         if self.compilation_config.cudagraph_mode.has_full_cudagraphs():
-
             num_actual_pages = paged_kv_indices.size(0)
 
-            self.paged_kv_indices[:num_actual_pages].copy_(paged_kv_indices,
-                                                           non_blocking=True)
+            self.paged_kv_indices[:num_actual_pages].copy_(
+                paged_kv_indices, non_blocking=True
+            )
             self.paged_kv_indices[num_actual_pages:].fill_(-1)
             paged_kv_indices = self.paged_kv_indices[:num_actual_pages]
 
-            self.paged_kv_indptr[:1 + num_reqs].copy_(paged_kv_indptr,
-                                                      non_blocking=True)
-            self.paged_kv_indptr[1 + num_reqs:].fill_(paged_kv_indptr[-1])
-            paged_kv_indptr = self.paged_kv_indptr[:1 + num_reqs]
+            self.paged_kv_indptr[: 1 + num_reqs].copy_(
+                paged_kv_indptr, non_blocking=True
+            )
+            self.paged_kv_indptr[1 + num_reqs :].fill_(paged_kv_indptr[-1])
+            paged_kv_indptr = self.paged_kv_indptr[: 1 + num_reqs]
 
             self.paged_kv_last_page_len[:num_reqs].copy_(
-                paged_kv_last_page_len, non_blocking=True)
+                paged_kv_last_page_len, non_blocking=True
+            )
             self.paged_kv_last_page_len[num_reqs:].fill_(1)
             paged_kv_last_page_len = self.paged_kv_last_page_len[:num_reqs]
 
-            qo_indptr = self.qo_indptr[:1 + num_reqs]
+            qo_indptr = self.qo_indptr[: 1 + num_reqs]
 
         else:
-            qo_indptr = torch.arange(0,
-                                     num_reqs + 1,
-                                     step=1,
-                                     dtype=torch.int32,
-                                     device=device)
+            qo_indptr = torch.arange(
+                0, num_reqs + 1, step=1, dtype=torch.int32, device=device
+            )
 
         attn_metadata = AiterMLADecodeMetadata(
             block_table=block_table_tensor,
@@ -164,51 +178,60 @@ def _build_decode(self, block_table_tensor: torch.Tensor,
             paged_kv_indptr=paged_kv_indptr,
             paged_kv_indices=paged_kv_indices,
             paged_kv_last_page_len=paged_kv_last_page_len,
-            qo_indptr=qo_indptr)
+            qo_indptr=qo_indptr,
+        )
 
         return attn_metadata
 
 
 class AiterMLAImpl(MLACommonImpl[AiterMLAMetadata]):
-
     def __init__(
-            self,
-            num_heads: int,
-            head_size: int,
-            scale: float,
-            num_kv_heads: int,
-            alibi_slopes: Optional[list[float]],
-            sliding_window: Optional[int],
-            kv_cache_dtype: str,
-            logits_soft_cap: Optional[float],
-            attn_type: str,
-            kv_sharing_target_layer_name: Optional[str],
-            # MLA Specific Arguments
-            **mla_args) -> None:
-        super().__init__(num_heads, head_size, scale, num_kv_heads,
-                         alibi_slopes, sliding_window, kv_cache_dtype,
-                         logits_soft_cap, attn_type,
-                         kv_sharing_target_layer_name, **mla_args)
-        assert (num_heads == 16 or num_heads == 128), (
+        self,
+        num_heads: int,
+        head_size: int,
+        scale: float,
+        num_kv_heads: int,
+        alibi_slopes: Optional[list[float]],
+        sliding_window: Optional[int],
+        kv_cache_dtype: str,
+        logits_soft_cap: Optional[float],
+        attn_type: str,
+        kv_sharing_target_layer_name: Optional[str],
+        # MLA Specific Arguments
+        **mla_args,
+    ) -> None:
+        super().__init__(
+            num_heads,
+            head_size,
+            scale,
+            num_kv_heads,
+            alibi_slopes,
+            sliding_window,
+            kv_cache_dtype,
+            logits_soft_cap,
+            attn_type,
+            kv_sharing_target_layer_name,
+            **mla_args,
+        )
+        assert num_heads == 16 or num_heads == 128, (
             f"Aiter MLA only supports 16 or 128 number of heads.\n"
             f"Provided {num_heads} number of heads.\n"
-            "Try adjusting tensor_parallel_size value.")
+            "Try adjusting tensor_parallel_size value."
+        )
         unsupported_features = [alibi_slopes, sliding_window, logits_soft_cap]
         if any(unsupported_features):
             raise NotImplementedError(
                 "Aiter MLA does not support one of the following: "
-                "alibi_slopes, sliding_window, logits_soft_cap")
+                "alibi_slopes, sliding_window, logits_soft_cap"
+            )
 
         from aiter import flash_attn_varlen_func
+
         self.flash_attn_varlen_func = flash_attn_varlen_func
 
-    def _flash_attn_varlen_diff_headdims(self,
-                                         q,
-                                         k,
-                                         v,
-                                         return_softmax_lse=False,
-                                         softmax_scale=None,
-                                         **kwargs):
+    def _flash_attn_varlen_diff_headdims(
+        self, q, k, v, return_softmax_lse=False, softmax_scale=None, **kwargs
+    ):
         output = self.flash_attn_varlen_func(
             q=q,
             k=k,
@@ -235,21 +258,25 @@ def _forward_decode(
 
         assert isinstance(q, torch.Tensor)
         B = q.shape[0]
-        o = torch.zeros(B,
-                        self.num_heads,
-                        self.kv_lora_rank,
-                        dtype=q.dtype,
-                        device=q.device)
+        o = torch.zeros(
+            B, self.num_heads, self.kv_lora_rank, dtype=q.dtype, device=q.device
+        )
 
         kv_buffer = kv_c_and_k_pe_cache.unsqueeze(2)
 
         # max_seqlen_qo must be 1 except for MTP
         # TODO: Find the best value for MTP
         max_seqlen_qo = 1
-        aiter_mla_decode_fwd(q, kv_buffer, o, self.scale,
-                             attn_metadata.decode.qo_indptr, max_seqlen_qo,
-                             attn_metadata.decode.paged_kv_indptr,
-                             attn_metadata.decode.paged_kv_indices,
-                             attn_metadata.decode.paged_kv_last_page_len)
+        aiter_mla_decode_fwd(
+            q,
+            kv_buffer,
+            o,
+            self.scale,
+            attn_metadata.decode.qo_indptr,
+            max_seqlen_qo,
+            attn_metadata.decode.paged_kv_indptr,
+            attn_metadata.decode.paged_kv_indices,
+            attn_metadata.decode.paged_kv_last_page_len,
+        )
 
         return o, None
diff --git a/vllm/v1/attention/backends/mla/triton_mla.py b/vllm/v1/attention/backends/mla/triton_mla.py
index 076152061d50..3b6718c48d09 100644
--- a/vllm/v1/attention/backends/mla/triton_mla.py
+++ b/vllm/v1/attention/backends/mla/triton_mla.py
@@ -6,22 +6,26 @@
 import torch
 
 from vllm import envs
-from vllm.attention.backends.abstract import (AttentionLayer, AttentionType,
-                                              is_quantized_kv_cache)
+from vllm.attention.backends.abstract import (
+    AttentionLayer,
+    AttentionType,
+    is_quantized_kv_cache,
+)
 from vllm.attention.ops.triton_decode_attention import decode_attention_fwd
 from vllm.attention.ops.triton_flash_attention import triton_attention
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 from vllm.triton_utils import HAS_TRITON
-from vllm.v1.attention.backends.mla.common import (MLACommonBackend,
-                                                   MLACommonImpl,
-                                                   MLACommonMetadata)
+from vllm.v1.attention.backends.mla.common import (
+    MLACommonBackend,
+    MLACommonImpl,
+    MLACommonMetadata,
+)
 
 logger = init_logger(__name__)
 
 
 class TritonMLABackend(MLACommonBackend):
-
     @staticmethod
     def get_name() -> str:
         return "TRITON_MLA"
@@ -35,54 +39,64 @@ class TritonMLAImpl(MLACommonImpl[MLACommonMetadata]):
     can_return_lse_for_decode: bool = True
 
     def __init__(
-            self,
-            num_heads: int,
-            head_size: int,
-            scale: float,
-            num_kv_heads: int,
-            alibi_slopes: Optional[list[float]],
-            sliding_window: Optional[int],
-            kv_cache_dtype: str,
-            logits_soft_cap: Optional[float],
-            attn_type: str,
-            kv_sharing_target_layer_name: Optional[str],
-            # MLA Specific Arguments
-            **mla_args) -> None:
-        super().__init__(num_heads, head_size, scale, num_kv_heads,
-                         alibi_slopes, sliding_window, kv_cache_dtype,
-                         logits_soft_cap, attn_type,
-                         kv_sharing_target_layer_name, **mla_args)
+        self,
+        num_heads: int,
+        head_size: int,
+        scale: float,
+        num_kv_heads: int,
+        alibi_slopes: Optional[list[float]],
+        sliding_window: Optional[int],
+        kv_cache_dtype: str,
+        logits_soft_cap: Optional[float],
+        attn_type: str,
+        kv_sharing_target_layer_name: Optional[str],
+        # MLA Specific Arguments
+        **mla_args,
+    ) -> None:
+        super().__init__(
+            num_heads,
+            head_size,
+            scale,
+            num_kv_heads,
+            alibi_slopes,
+            sliding_window,
+            kv_cache_dtype,
+            logits_soft_cap,
+            attn_type,
+            kv_sharing_target_layer_name,
+            **mla_args,
+        )
 
         unsupported_features = [alibi_slopes, sliding_window, logits_soft_cap]
         if any(unsupported_features):
             raise NotImplementedError(
                 "TritonMLAImpl does not support one of the following: "
-                "alibi_slopes, sliding_window, logits_soft_cap")
+                "alibi_slopes, sliding_window, logits_soft_cap"
+            )
 
         if attn_type != AttentionType.DECODER:
-            raise NotImplementedError("Encoder self-attention and "
-                                      "encoder/decoder cross-attention "
-                                      "are not implemented for "
-                                      "TritonMLAImpl")
+            raise NotImplementedError(
+                "Encoder self-attention and "
+                "encoder/decoder cross-attention "
+                "are not implemented for "
+                "TritonMLAImpl"
+            )
 
         if is_quantized_kv_cache(self.kv_cache_dtype):
             raise NotImplementedError(
-                "TritonMLA V1 with FP8 KV cache not yet supported")
+                "TritonMLA V1 with FP8 KV cache not yet supported"
+            )
 
         self.use_triton_flash_attn = envs.VLLM_USE_TRITON_FLASH_ATTN
         self.triton_fa_func = triton_attention if HAS_TRITON else None
 
-    def _flash_attn_varlen_diff_headdims_rocm(self,
-                                              q,
-                                              k,
-                                              v,
-                                              softmax_scale=None,
-                                              **kwargs):
+    def _flash_attn_varlen_diff_headdims_rocm(
+        self, q, k, v, softmax_scale=None, **kwargs
+    ):
         assert self.triton_fa_func is not None
 
         # Triton Attention requires a padded V
-        padded_v = torch.nn.functional.pad(v, [0, q.shape[-1] - v.shape[-1]],
-                                           value=0)
+        padded_v = torch.nn.functional.pad(v, [0, q.shape[-1] - v.shape[-1]], value=0)
         # The output of triton_attention is a tuple of
         # [output_tensor, encoded_softmax] where encoded_softmax is always None
         output_tensor, _ = self.triton_fa_func(
@@ -101,18 +115,17 @@ def _flash_attn_varlen_diff_headdims_rocm(self,
 
         return output_tensor
 
-    def _flash_attn_varlen_diff_headdims(self,
-                                         q,
-                                         k,
-                                         v,
-                                         return_softmax_lse=False,
-                                         softmax_scale=None,
-                                         **kwargs):
-        if current_platform.is_rocm() \
-            and self.use_triton_flash_attn \
-            and not return_softmax_lse:
+    def _flash_attn_varlen_diff_headdims(
+        self, q, k, v, return_softmax_lse=False, softmax_scale=None, **kwargs
+    ):
+        if (
+            current_platform.is_rocm()
+            and self.use_triton_flash_attn
+            and not return_softmax_lse
+        ):
             return self._flash_attn_varlen_diff_headdims_rocm(
-                q, k, v, softmax_scale=softmax_scale, **kwargs)
+                q, k, v, softmax_scale=softmax_scale, **kwargs
+            )
         else:
             return super()._flash_attn_varlen_diff_headdims(
                 q,
@@ -120,7 +133,8 @@ def _flash_attn_varlen_diff_headdims(self,
                 v,
                 return_softmax_lse=return_softmax_lse,
                 softmax_scale=softmax_scale,
-                **kwargs)
+                **kwargs,
+            )
 
     def _forward_decode(
         self,
@@ -141,11 +155,9 @@ def _forward_decode(
         assert isinstance(q, torch.Tensor)
         B = q.shape[0]
         q_num_heads = q.shape[1]
-        o = torch.zeros(B,
-                        q_num_heads,
-                        self.kv_lora_rank,
-                        dtype=q.dtype,
-                        device=q.device)
+        o = torch.zeros(
+            B, q_num_heads, self.kv_lora_rank, dtype=q.dtype, device=q.device
+        )
         lse = torch.zeros(B, q_num_heads, dtype=q.dtype, device=q.device)
         num_kv_splits = 4  # TODO: heuristic
 
@@ -165,13 +177,22 @@ def _forward_decode(
 
         # Add a head dim of 1
         kv_c_and_k_pe_cache = kv_c_and_k_pe_cache.unsqueeze(2)
-        kv_c_cache = kv_c_and_k_pe_cache[..., :self.kv_lora_rank]
+        kv_c_cache = kv_c_and_k_pe_cache[..., : self.kv_lora_rank]
         PAGE_SIZE = kv_c_and_k_pe_cache.size(1)
 
         # Run MQA
-        decode_attention_fwd(q, kv_c_and_k_pe_cache, kv_c_cache, o, lse,
-                             attn_metadata.decode.block_table,
-                             attn_metadata.decode.seq_lens, attn_logits,
-                             num_kv_splits, self.scale, PAGE_SIZE)
+        decode_attention_fwd(
+            q,
+            kv_c_and_k_pe_cache,
+            kv_c_cache,
+            o,
+            lse,
+            attn_metadata.decode.block_table,
+            attn_metadata.decode.seq_lens,
+            attn_logits,
+            num_kv_splits,
+            self.scale,
+            PAGE_SIZE,
+        )
 
         return o, lse
diff --git a/vllm/v1/attention/backends/pallas.py b/vllm/v1/attention/backends/pallas.py
index 7ac1a063f565..7e83e7a681f4 100644
--- a/vllm/v1/attention/backends/pallas.py
+++ b/vllm/v1/attention/backends/pallas.py
@@ -6,8 +6,12 @@
 
 import torch
 
-from vllm.attention.backends.abstract import (AttentionBackend, AttentionImpl,
-                                              AttentionLayer, AttentionType)
+from vllm.attention.backends.abstract import (
+    AttentionBackend,
+    AttentionImpl,
+    AttentionLayer,
+    AttentionType,
+)
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.utils import cdiv, next_power_of_2
@@ -41,49 +45,62 @@
     from torch_xla.experimental.custom_kernel import XLA_LIB
 
     @requires_jax
-    def kv_cache_update_op_impl(kv: torch.Tensor, slot_mapping: torch.Tensor,
-                                kv_cache: torch.Tensor,
-                                num_kv_update_slices: torch.Tensor,
-                                page_size: int, num_slices_per_block: int):
+    def kv_cache_update_op_impl(
+        kv: torch.Tensor,
+        slot_mapping: torch.Tensor,
+        kv_cache: torch.Tensor,
+        num_kv_update_slices: torch.Tensor,
+        page_size: int,
+        num_slices_per_block: int,
+    ):
         from vllm.attention.ops.pallas_kv_cache_update import kv_cache_update
+
         new_kv_cache = xb.call_jax(
             kv_cache_update,
-            (kv, slot_mapping, kv_cache, num_kv_update_slices), {
-                "page_size": page_size,
-                "num_slices_per_block": num_slices_per_block
-            })
+            (kv, slot_mapping, kv_cache, num_kv_update_slices),
+            {"page_size": page_size, "num_slices_per_block": num_slices_per_block},
+        )
         return new_kv_cache
 
-
     XLA_LIB.define(
-        "kv_cache_update_op(Tensor kv, Tensor slot_mapping," \
-        "Tensor kv_cache, Tensor num_kv_update_slices, int page_size," \
-        "int num_slices_per_block)" \
-        "-> Tensor", )
+        "kv_cache_update_op(Tensor kv, Tensor slot_mapping,"
+        "Tensor kv_cache, Tensor num_kv_update_slices, int page_size,"
+        "int num_slices_per_block)"
+        "-> Tensor",
+    )
 
     @impl(XLA_LIB, "kv_cache_update_op", "XLA")
-    def kv_cache_update_op_xla(kv: torch.Tensor, slot_mapping: torch.Tensor,
-                               kv_cache: torch.Tensor,
-                               num_kv_update_slices: torch.Tensor,
-                               page_size: int,
-                               num_slices_per_block: int) -> torch.Tensor:
-        new_kv_cache = kv_cache_update_op_impl(kv, slot_mapping, kv_cache,
-                                               num_kv_update_slices, page_size,
-                                               num_slices_per_block)
+    def kv_cache_update_op_xla(
+        kv: torch.Tensor,
+        slot_mapping: torch.Tensor,
+        kv_cache: torch.Tensor,
+        num_kv_update_slices: torch.Tensor,
+        page_size: int,
+        num_slices_per_block: int,
+    ) -> torch.Tensor:
+        new_kv_cache = kv_cache_update_op_impl(
+            kv,
+            slot_mapping,
+            kv_cache,
+            num_kv_update_slices,
+            page_size,
+            num_slices_per_block,
+        )
         return new_kv_cache
 
     @impl(XLA_LIB, "kv_cache_update_op", "CompositeExplicitAutograd")
-    def kv_cache_update_op_non_xla(kv: torch.Tensor,
-                                   slot_mapping: torch.Tensor,
-                                   kv_cache: torch.Tensor,
-                                   num_kv_update_slices: torch.Tensor,
-                                   page_size: int,
-                                   num_slices_per_block: int) -> torch.Tensor:
+    def kv_cache_update_op_non_xla(
+        kv: torch.Tensor,
+        slot_mapping: torch.Tensor,
+        kv_cache: torch.Tensor,
+        num_kv_update_slices: torch.Tensor,
+        page_size: int,
+        num_slices_per_block: int,
+    ) -> torch.Tensor:
         return kv_cache
 
 
 class PallasAttentionBackend(AttentionBackend):
-
     @staticmethod
     def get_name() -> str:
         return "PALLAS"
@@ -104,8 +121,9 @@ def get_kv_cache_shape(
         head_size: int,
         cache_dtype_str: str = "auto",
     ) -> tuple[int, ...]:
-        padded_head_size = cdiv(
-            head_size, TPU_HEAD_SIZE_ALIGNMENT) * TPU_HEAD_SIZE_ALIGNMENT
+        padded_head_size = (
+            cdiv(head_size, TPU_HEAD_SIZE_ALIGNMENT) * TPU_HEAD_SIZE_ALIGNMENT
+        )
         return (num_blocks, block_size, num_kv_heads * 2, padded_head_size)
 
     @staticmethod
@@ -122,10 +140,12 @@ def swap_blocks(
     # we simply make sure that the size is smaller than half of SMEM capacity.
     @staticmethod
     def get_min_page_size(vllm_config: VllmConfig) -> int:
-        max_num_page_per_req = (1024 * 1024 // 2 //
-                                vllm_config.scheduler_config.max_num_seqs // 4)
-        min_page_size = cdiv(vllm_config.model_config.max_model_len,
-                             max_num_page_per_req)
+        max_num_page_per_req = (
+            1024 * 1024 // 2 // vllm_config.scheduler_config.max_num_seqs // 4
+        )
+        min_page_size = cdiv(
+            vllm_config.model_config.max_model_len, max_num_page_per_req
+        )
         min_page_size = 1 << (min_page_size - 1).bit_length()
         return min_page_size
 
@@ -146,8 +166,7 @@ def get_page_size(vllm_config: VllmConfig) -> int:
         # handle VREG spills.
         if vllm_config.model_config.max_model_len > 8192:
             return 16
-        page_size = next_power_of_2(
-            vllm_config.model_config.max_model_len) // 16
+        page_size = next_power_of_2(vllm_config.model_config.max_model_len) // 16
         if page_size <= 16:
             return 16
         if page_size >= 256:
@@ -176,7 +195,6 @@ class PallasMetadata:
 
 
 class PallasAttentionBackendImpl(AttentionImpl):
-
     def __init__(
         self,
         num_heads: int,
@@ -203,15 +221,18 @@ def __init__(
             raise NotImplementedError("Alibi slopes is not supported.")
 
         if attn_type != AttentionType.DECODER:
-            raise NotImplementedError("Encoder self-attention and "
-                                      "encoder/decoder cross-attention "
-                                      "are not implemented for "
-                                      "PallasAttentionBackendImpl")
+            raise NotImplementedError(
+                "Encoder self-attention and "
+                "encoder/decoder cross-attention "
+                "are not implemented for "
+                "PallasAttentionBackendImpl"
+            )
 
         self.kv_cache_quantized_dtype = None
         if kv_cache_dtype != "auto":
             self.kv_cache_quantized_dtype = TPU_STR_DTYPE_TO_TORCH_DTYPE.get(
-                kv_cache_dtype.lower().strip())
+                kv_cache_dtype.lower().strip()
+            )
 
     def forward(
         self,
@@ -240,7 +261,8 @@ def forward(
         if output_scale is not None or output_block_scale is not None:
             raise NotImplementedError(
                 "fused output quantization is not yet supported"
-                " for PallasAttentionBackendImpl")
+                " for PallasAttentionBackendImpl"
+            )
 
         # For determine_available_memory case.
         if kv_cache.numel() == 0:
@@ -253,15 +275,18 @@ def forward(
         key = key.view(-1, self.num_kv_heads, self.head_size)
         value = value.view(-1, self.num_kv_heads, self.head_size)
         if self.head_size % TPU_HEAD_SIZE_ALIGNMENT != 0:
-            padded_head_size = cdiv(
-                self.head_size,
-                TPU_HEAD_SIZE_ALIGNMENT) * TPU_HEAD_SIZE_ALIGNMENT
+            padded_head_size = (
+                cdiv(self.head_size, TPU_HEAD_SIZE_ALIGNMENT) * TPU_HEAD_SIZE_ALIGNMENT
+            )
             query = torch.nn.functional.pad(
-                query, (0, padded_head_size - self.head_size), value=0.0)
+                query, (0, padded_head_size - self.head_size), value=0.0
+            )
             key = torch.nn.functional.pad(
-                key, (0, padded_head_size - self.head_size), value=0.0)
+                key, (0, padded_head_size - self.head_size), value=0.0
+            )
             value = torch.nn.functional.pad(
-                value, (0, padded_head_size - self.head_size), value=0.0)
+                value, (0, padded_head_size - self.head_size), value=0.0
+            )
 
         if self.kv_sharing_target_layer_name is None and kv_cache.numel() > 0:
             # Write input keys and values to the KV cache.
@@ -280,9 +305,9 @@ def forward(
             )
 
         if self.kv_cache_quantized_dtype is not None and (
-                layer._k_scale_float == 0.0 or layer._v_scale_float == 0.0):
-            raise ValueError(
-                "k_scale_float and v_scale_float must be non-zero")
+            layer._k_scale_float == 0.0 or layer._v_scale_float == 0.0
+        ):
+            raise ValueError("k_scale_float and v_scale_float must be non-zero")
         output = torch.ops.xla.ragged_paged_attention(
             query,
             kv_cache,
@@ -305,7 +330,7 @@ def forward(
         )
 
         if self.head_size % TPU_HEAD_SIZE_ALIGNMENT != 0:
-            output = output[:, :, :self.head_size]
+            output = output[:, :, : self.head_size]
 
         return output.reshape(num_tokens, hidden_size)
 
@@ -321,7 +346,7 @@ def write_to_kv_cache(
     k_scale: float = 1.0,
     v_scale: float = 1.0,
 ) -> None:
-    """ Write the key and values to the KV cache.
+    """Write the key and values to the KV cache.
 
     Args:
         key: shape = [num_tokens, num_kv_heads, head_size]
@@ -330,8 +355,7 @@ def write_to_kv_cache(
         num_slices_per_kv_cache_update_block: int
     """
     _, page_size, num_combined_kv_heads, head_size = kv_cache.shape
-    head_size = cdiv(head_size,
-                     TPU_HEAD_SIZE_ALIGNMENT) * TPU_HEAD_SIZE_ALIGNMENT
+    head_size = cdiv(head_size, TPU_HEAD_SIZE_ALIGNMENT) * TPU_HEAD_SIZE_ALIGNMENT
 
     if kv_cache_quantized_dtype is not None:
         dtype_info = torch.finfo(kv_cache_quantized_dtype)
@@ -343,15 +367,19 @@ def write_to_kv_cache(
         value = torch.clamp(value, dtype_info.min, dtype_info.max)
         value = value.to(kv_cache_quantized_dtype)
 
-    kv = torch.cat([key, value], axis=-1).reshape(-1, num_combined_kv_heads,
-                                                  head_size)
+    kv = torch.cat([key, value], axis=-1).reshape(-1, num_combined_kv_heads, head_size)
 
     torch.ops.xla.dynamo_set_buffer_donor_(kv_cache, True)
 
     kv_cache = kv_cache.flatten(0, 1)
     new_kv_cache = torch.ops.xla.kv_cache_update_op(
-        kv, slot_mapping, kv_cache, num_kv_update_slices, page_size,
-        num_slices_per_kv_cache_update_block)
+        kv,
+        slot_mapping,
+        kv_cache,
+        num_kv_update_slices,
+        page_size,
+        num_slices_per_kv_cache_update_block,
+    )
     # NOTE: the in-place copy will be optimized away by XLA compiler.
     kv_cache.copy_(new_kv_cache)
 
@@ -389,15 +417,18 @@ def get_dtype_packing(dtype):
     if 32 % bits != 0:
         raise ValueError(
             f"The bit width must be divisible by 32, but got bits={bits}, "
-            "dtype={dtype}")
+            "dtype={dtype}"
+        )
     return 32 // bits
 
 
-def get_page_size_bytes(block_size: int, num_kv_heads: int, head_size: int,
-                        kv_cache_dtype: torch.dtype) -> int:
+def get_page_size_bytes(
+    block_size: int, num_kv_heads: int, head_size: int, kv_cache_dtype: torch.dtype
+) -> int:
     """Returns the size in bytes of one page of the KV cache."""
-    padded_head_size = cdiv(head_size,
-                            TPU_HEAD_SIZE_ALIGNMENT) * TPU_HEAD_SIZE_ALIGNMENT
+    padded_head_size = (
+        cdiv(head_size, TPU_HEAD_SIZE_ALIGNMENT) * TPU_HEAD_SIZE_ALIGNMENT
+    )
     num_combined_kv_heads = num_kv_heads * 2
 
     # NOTE: for the implicit padding in XLA
@@ -405,5 +436,6 @@ def get_page_size_bytes(block_size: int, num_kv_heads: int, head_size: int,
     num_combined_kv_heads = cdiv(num_combined_kv_heads, packing) * packing
 
     kv_cache_dtype_bits = dtype_bits(kv_cache_dtype)
-    return (block_size * num_combined_kv_heads * padded_head_size *
-            kv_cache_dtype_bits // 8)
+    return (
+        block_size * num_combined_kv_heads * padded_head_size * kv_cache_dtype_bits // 8
+    )
diff --git a/vllm/v1/attention/backends/rocm_aiter_fa.py b/vllm/v1/attention/backends/rocm_aiter_fa.py
index ed63c7b1bda6..348eca55eefb 100644
--- a/vllm/v1/attention/backends/rocm_aiter_fa.py
+++ b/vllm/v1/attention/backends/rocm_aiter_fa.py
@@ -1,19 +1,26 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Attention layer with AiterFlashAttention."""
+
 from dataclasses import dataclass
 from typing import Optional
 
 import torch
 
-from vllm.attention.backends.abstract import (AttentionBackend, AttentionImpl,
-                                              AttentionMetadata, AttentionType)
+from vllm.attention.backends.abstract import (
+    AttentionBackend,
+    AttentionImpl,
+    AttentionMetadata,
+    AttentionType,
+)
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
-from vllm.v1.attention.backends.utils import (AttentionCGSupport,
-                                              AttentionMetadataBuilder,
-                                              CommonAttentionMetadata)
+from vllm.v1.attention.backends.utils import (
+    AttentionCGSupport,
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+)
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 _PARTITION_SIZE_ROCM = 256
@@ -43,55 +50,63 @@ def _vllm_layout_trans_kernel(
         batch_idx = tl.program_id(0)
         block_idx = tl.program_id(1)
 
-        batch_query_indexes = tl.load(b_query_lens_loc + batch_idx +
-                                      tl.arange(0, 2))
+        batch_query_indexes = tl.load(b_query_lens_loc + batch_idx + tl.arange(0, 2))
         batch_query_start, batch_query_end = tl.split(batch_query_indexes)
         query_len = batch_query_end - batch_query_start
 
         if query_len <= 1:
             return
 
-        batch_token_indexes = tl.load(b_seq_lens_loc + batch_idx +
-                                      tl.arange(0, 2))
+        batch_token_indexes = tl.load(b_seq_lens_loc + batch_idx + tl.arange(0, 2))
         batch_token_start, batch_token_end = tl.split(batch_token_indexes)
         seq_len = batch_token_end - batch_token_start
 
         if block_idx * BLOCK_SIZE < seq_len:
-            block_mask = (block_idx * BLOCK_SIZE +
-                          tl.arange(0, BLOCK_SIZE)[:, None]) < seq_len
-
-            kv_idx = tl.load(block_table + batch_idx * block_table_stride_0 +
-                             block_idx).to(tl.int64)
-
-            kv_buffer_off = kv_idx * BLOCK_SIZE * E_DIM + tl.arange(
-                0, BLOCK_SIZE)[:, None] * E_DIM + tl.arange(0, E_DIM)[None, :]
-            k_vals = tl.load(k_buffer_ptr + kv_buffer_off,
-                             mask=block_mask,
-                             other=0.0)
+            block_mask = (
+                block_idx * BLOCK_SIZE + tl.arange(0, BLOCK_SIZE)[:, None]
+            ) < seq_len
+
+            kv_idx = tl.load(
+                block_table + batch_idx * block_table_stride_0 + block_idx
+            ).to(tl.int64)
+
+            kv_buffer_off = (
+                kv_idx * BLOCK_SIZE * E_DIM
+                + tl.arange(0, BLOCK_SIZE)[:, None] * E_DIM
+                + tl.arange(0, E_DIM)[None, :]
+            )
+            k_vals = tl.load(k_buffer_ptr + kv_buffer_off, mask=block_mask, other=0.0)
             if k_vals.dtype.is_fp8():
-                k_vals = (k_vals.to(tl.float32) *
-                          tl.load(k_scale)).to(output_dtype)
+                k_vals = (k_vals.to(tl.float32) * tl.load(k_scale)).to(output_dtype)
             else:
                 k_vals = k_vals.to(output_dtype)
 
-            v_vals = tl.load(v_buffer_ptr + kv_buffer_off,
-                             mask=block_mask,
-                             other=0.0)
+            v_vals = tl.load(v_buffer_ptr + kv_buffer_off, mask=block_mask, other=0.0)
             if v_vals.dtype.is_fp8():
-                v_vals = (v_vals.to(tl.float32) *
-                          tl.load(v_scale)).to(output_dtype)
+                v_vals = (v_vals.to(tl.float32) * tl.load(v_scale)).to(output_dtype)
             else:
                 v_vals = v_vals.to(output_dtype)
-            kv_values_off = batch_token_start * E_DIM + \
-                block_idx * BLOCK_SIZE * E_DIM + \
-                tl.arange(0, BLOCK_SIZE)[:, None] * E_DIM + \
-                tl.arange(0, E_DIM)[None, :]
+            kv_values_off = (
+                batch_token_start * E_DIM
+                + block_idx * BLOCK_SIZE * E_DIM
+                + tl.arange(0, BLOCK_SIZE)[:, None] * E_DIM
+                + tl.arange(0, E_DIM)[None, :]
+            )
             tl.store(k_values_ptr + kv_values_off, k_vals, mask=block_mask)
             tl.store(v_values_ptr + kv_values_off, v_vals, mask=block_mask)
 
-    def vllm_layout_trans(b_query_lens_loc, b_seq_lens_loc, block_table,
-                          k_cache, v_cache, max_seq_len, k_scale, v_scale,
-                          output_dtype, total_tokens):
+    def vllm_layout_trans(
+        b_query_lens_loc,
+        b_seq_lens_loc,
+        block_table,
+        k_cache,
+        v_cache,
+        max_seq_len,
+        k_scale,
+        v_scale,
+        output_dtype,
+        total_tokens,
+    ):
         H_KV = v_cache.shape[2]
         D = v_cache.shape[3]
         BLOCK_SIZE = v_cache.shape[1]
@@ -107,8 +122,7 @@ def vllm_layout_trans(b_query_lens_loc, b_seq_lens_loc, block_table,
             device=v_cache.device,
         )
 
-        grid = (block_table.shape[0],
-                (max_seq_len + BLOCK_SIZE - 1) // BLOCK_SIZE)
+        grid = (block_table.shape[0], (max_seq_len + BLOCK_SIZE - 1) // BLOCK_SIZE)
 
         if output_dtype == torch.float16:
             output_dtype = tl.float16
@@ -117,19 +131,21 @@ def vllm_layout_trans(b_query_lens_loc, b_seq_lens_loc, block_table,
         else:
             raise ValueError(f"Unsupported output dtype: {output_dtype}")
 
-        _vllm_layout_trans_kernel[grid](k_cache,
-                                        v_cache,
-                                        k_values,
-                                        v_values,
-                                        b_query_lens_loc,
-                                        b_seq_lens_loc,
-                                        block_table,
-                                        block_table.stride(0),
-                                        k_scale,
-                                        v_scale,
-                                        output_dtype=output_dtype,
-                                        E_DIM=H_KV * D,
-                                        BLOCK_SIZE=BLOCK_SIZE)
+        _vllm_layout_trans_kernel[grid](
+            k_cache,
+            v_cache,
+            k_values,
+            v_values,
+            b_query_lens_loc,
+            b_seq_lens_loc,
+            block_table,
+            block_table.stride(0),
+            k_scale,
+            v_scale,
+            output_dtype=output_dtype,
+            E_DIM=H_KV * D,
+            BLOCK_SIZE=BLOCK_SIZE,
+        )
 
         return k_values, v_values
 
@@ -152,9 +168,18 @@ def flash_attn_varlen_func_impl(
     ) -> torch.Tensor:
         if total_tokens == 0:
             total_tokens = int(cu_seqlens_k[-1].item())
-        k, v = vllm_layout_trans(cu_seqlens_q, cu_seqlens_k, block_table,
-                                 k_cache, v_cache, max_seqlen_k, k_scale,
-                                 v_scale, q.dtype, total_tokens)
+        k, v = vllm_layout_trans(
+            cu_seqlens_q,
+            cu_seqlens_k,
+            block_table,
+            k_cache,
+            v_cache,
+            max_seqlen_k,
+            k_scale,
+            v_scale,
+            q.dtype,
+            total_tokens,
+        )
 
         output = aiter.flash_attn_varlen_func(
             q=q,
@@ -190,16 +215,17 @@ def flash_attn_varlen_func_fake(
         v_scale: torch.Tensor,
         total_tokens: int = 0,
     ) -> torch.Tensor:
-        return torch.empty(q.shape[0],
-                           q.shape[1],
-                           v_cache.shape[-2],
-                           dtype=q.dtype,
-                           device=q.device)
+        return torch.empty(
+            q.shape[0], q.shape[1], v_cache.shape[-2], dtype=q.dtype, device=q.device
+        )
 
-    direct_register_custom_op("flash_attn_varlen_func",
-                              flash_attn_varlen_func_impl, ["out"],
-                              flash_attn_varlen_func_fake,
-                              dispatch_key=current_platform.dispatch_key)
+    direct_register_custom_op(
+        "flash_attn_varlen_func",
+        flash_attn_varlen_func_impl,
+        ["out"],
+        flash_attn_varlen_func_fake,
+        dispatch_key=current_platform.dispatch_key,
+    )
 
 logger = init_logger(__name__)
 
@@ -231,11 +257,17 @@ class AiterFlashAttentionMetadata:
 
 
 class AiterFlashAttentionMetadataBuilder(
-        AttentionMetadataBuilder[AiterFlashAttentionMetadata]):
+    AttentionMetadataBuilder[AiterFlashAttentionMetadata]
+):
     cudagraph_support = AttentionCGSupport.UNIFORM_SINGLE_TOKEN_DECODE
 
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
         super().__init__(kv_cache_spec, layer_names, vllm_config, device)
 
         self.model_config = vllm_config.model_config
@@ -243,9 +275,9 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
         self.cache_config = vllm_config.cache_config
 
         self.num_heads_q = self.model_config.get_num_attention_heads(
-            self.parallel_config)
-        self.num_heads_kv = self.model_config.get_num_kv_heads(
-            self.parallel_config)
+            self.parallel_config
+        )
+        self.num_heads_kv = self.model_config.get_num_kv_heads(self.parallel_config)
         self.headdim = self.model_config.get_head_size()
         self.block_size = kv_cache_spec.block_size
         # Sliding window size to be used with the AOT scheduler will be
@@ -254,19 +286,22 @@ def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
         self.total_tokens: int = 0
 
     def build_for_cudagraph_capture(
-            self, common_attn_metadata: CommonAttentionMetadata):
-        self.total_tokens = self.model_config.max_model_len \
+        self, common_attn_metadata: CommonAttentionMetadata
+    ):
+        self.total_tokens = (
+            self.model_config.max_model_len
             * self.vllm_config.scheduler_config.max_num_partial_prefills
-        res = self.build(common_prefix_len=0,
-                         common_attn_metadata=common_attn_metadata)
+        )
+        res = self.build(common_prefix_len=0, common_attn_metadata=common_attn_metadata)
         self.total_tokens = 0
         return res
 
-    def build(self,
-              common_prefix_len: int,
-              common_attn_metadata: CommonAttentionMetadata,
-              fast_build: bool = False) -> 'AiterFlashAttentionMetadata':
-
+    def build(
+        self,
+        common_prefix_len: int,
+        common_attn_metadata: CommonAttentionMetadata,
+        fast_build: bool = False,
+    ) -> "AiterFlashAttentionMetadata":
         num_actual_tokens = common_attn_metadata.num_actual_tokens
         max_query_len = common_attn_metadata.max_query_len
         max_seq_len = common_attn_metadata.max_seq_len
@@ -277,20 +312,18 @@ def build(self,
         if max_query_len > 1:
             # We pre-compute cumulative seq len needed for prefill attention
             # here to avoid recomputing it for every layer
-            cu_seq_lens = torch.zeros(seq_lens.shape[0] + 1,
-                                      dtype=torch.int32,
-                                      device=seq_lens.device)
-            torch.cumsum(seq_lens,
-                         dim=0,
-                         dtype=cu_seq_lens.dtype,
-                         out=cu_seq_lens[1:])
+            cu_seq_lens = torch.zeros(
+                seq_lens.shape[0] + 1, dtype=torch.int32, device=seq_lens.device
+            )
+            torch.cumsum(seq_lens, dim=0, dtype=cu_seq_lens.dtype, out=cu_seq_lens[1:])
             num_actual_kv_tokens = int(cu_seq_lens[-1].item())
         else:
             cu_seq_lens = None
             num_actual_kv_tokens = 0
 
-        def schedule(batch_size, cu_query_lens, max_query_len, seqlens,
-                     max_seq_len, causal):
+        def schedule(
+            batch_size, cu_query_lens, max_query_len, seqlens, max_seq_len, causal
+        ):
             return None
 
         use_cascade = common_prefix_len > 0
@@ -316,7 +349,6 @@ def use_cascade_attention(self, *args, **kwargs) -> bool:
 
 
 class AiterFlashAttentionBackend(AttentionBackend):
-
     accept_output_buffer: bool = True
 
     @classmethod
@@ -336,7 +368,8 @@ def validate_head_size(cls, head_size: int) -> None:
                 f"Head size {head_size} is not supported by {attn_type}. "
                 f"Supported head sizes are: {supported_head_sizes}. "
                 "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes.")
+                "FlexAttention backend which supports all head sizes."
+            )
 
     @staticmethod
     def get_name() -> str:
@@ -368,7 +401,6 @@ def get_kv_cache_shape(
 
 
 class AiterFlashAttentionImpl(AttentionImpl):
-
     def __init__(
         self,
         num_heads: int,
@@ -396,7 +428,7 @@ def __init__(
         self.kv_cache_dtype = kv_cache_dtype
         if logits_soft_cap is None:
             # In flash-attn, setting logits_soft_cap as 0 means no soft cap.
-            logits_soft_cap = 0.
+            logits_soft_cap = 0.0
         self.logits_soft_cap = logits_soft_cap
         self.kv_sharing_target_layer_name = kv_sharing_target_layer_name
 
@@ -406,10 +438,12 @@ def __init__(
         AiterFlashAttentionBackend.validate_head_size(head_size)
 
         if attn_type != AttentionType.DECODER:
-            raise NotImplementedError("Encoder self-attention and "
-                                      "encoder/decoder cross-attention "
-                                      "are not implemented for "
-                                      "FlashAttentionImpl")
+            raise NotImplementedError(
+                "Encoder self-attention and "
+                "encoder/decoder cross-attention "
+                "are not implemented for "
+                "FlashAttentionImpl"
+            )
 
     def forward(
         self,
@@ -442,8 +476,8 @@ def forward(
 
         if output_scale is not None or output_block_scale is not None:
             raise NotImplementedError(
-                "fused output quantization is not yet supported"
-                " for FlashAttentionImpl")
+                "fused output quantization is not yet supported for FlashAttentionImpl"
+            )
 
         if attn_metadata is None:
             # Profiling run.
@@ -512,13 +546,14 @@ def forward(
             _, num_heads, head_size = query.shape
             nbytes_per_qo_elem = torch.finfo(query.dtype).bits // 8
             num_seqs = seqused_k.shape[0]
-            max_num_partitions = (max_seqlen_k + _PARTITION_SIZE_ROCM -
-                                  1) // _PARTITION_SIZE_ROCM
+            max_num_partitions = (
+                max_seqlen_k + _PARTITION_SIZE_ROCM - 1
+            ) // _PARTITION_SIZE_ROCM
 
             workspace_buffer = torch.empty(
-                (num_seqs * num_heads * max_num_partitions * head_size) *
-                nbytes_per_qo_elem + 2 *
-                (num_seqs * num_heads * max_num_partitions) * 4,
+                (num_seqs * num_heads * max_num_partitions * head_size)
+                * nbytes_per_qo_elem
+                + 2 * (num_seqs * num_heads * max_num_partitions) * 4,
                 dtype=torch.uint8,
                 device=output.device,
             )
@@ -546,4 +581,5 @@ def forward(
             return output
         else:
             raise NotImplementedError(
-                "Cascade attention is not implemented for ROCM AITER")
+                "Cascade attention is not implemented for ROCM AITER"
+            )
diff --git a/vllm/v1/attention/backends/rocm_attn.py b/vllm/v1/attention/backends/rocm_attn.py
index 1748a48168d4..4c24770aa22c 100644
--- a/vllm/v1/attention/backends/rocm_attn.py
+++ b/vllm/v1/attention/backends/rocm_attn.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Attention layer with PagedAttention and Triton prefix prefill."""
+
 from dataclasses import dataclass
 from functools import cache
 from typing import ClassVar, Optional
@@ -9,20 +10,27 @@
 
 from vllm import _custom_ops as ops
 from vllm import envs
-from vllm.attention.backends.abstract import (AttentionBackend, AttentionImpl,
-                                              AttentionMetadata, AttentionType)
-from vllm.attention.ops.chunked_prefill_paged_decode import (
-    chunked_prefill_paged_decode)
+from vllm.attention.backends.abstract import (
+    AttentionBackend,
+    AttentionImpl,
+    AttentionMetadata,
+    AttentionType,
+)
+from vllm.attention.ops.chunked_prefill_paged_decode import chunked_prefill_paged_decode
 from vllm.attention.ops.paged_attn import PagedAttention
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    QuantKey, kFp8StaticTensorSym)
+    QuantKey,
+    kFp8StaticTensorSym,
+)
 from vllm.platforms import current_platform
 from vllm.v1.attention.backends.flash_attn import FlashAttentionMetadata
-from vllm.v1.attention.backends.utils import (AttentionCGSupport,
-                                              AttentionMetadataBuilder,
-                                              CommonAttentionMetadata)
+from vllm.v1.attention.backends.utils import (
+    AttentionCGSupport,
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+)
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 logger = init_logger(__name__)
@@ -58,21 +66,25 @@ class RocmAttentionMetadata:
     prefix_scheduler_metadata: Optional[torch.Tensor] = None
 
 
-class RocmAttentionMetadataBuilder(
-        AttentionMetadataBuilder[RocmAttentionMetadata]):
+class RocmAttentionMetadataBuilder(AttentionMetadataBuilder[RocmAttentionMetadata]):
     cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.ALWAYS
 
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
         super().__init__(kv_cache_spec, layer_names, vllm_config, device)
 
         self.block_size = kv_cache_spec.block_size
 
         model_config = vllm_config.model_config
         self.num_heads_q = model_config.get_num_attention_heads(
-            vllm_config.parallel_config)
-        self.num_heads_kv = model_config.get_num_kv_heads(
-            vllm_config.parallel_config)
+            vllm_config.parallel_config
+        )
+        self.num_heads_kv = model_config.get_num_kv_heads(vllm_config.parallel_config)
         self.headdim = model_config.get_head_size()
 
     def build_for_cudagraph_capture(
@@ -93,10 +105,12 @@ def build_for_cudagraph_capture(
 
         return attn_metadata
 
-    def build(self,
-              common_prefix_len: int,
-              common_attn_metadata: CommonAttentionMetadata,
-              fast_build: bool = False) -> RocmAttentionMetadata:
+    def build(
+        self,
+        common_prefix_len: int,
+        common_attn_metadata: CommonAttentionMetadata,
+        fast_build: bool = False,
+    ) -> RocmAttentionMetadata:
         num_actual_tokens = common_attn_metadata.num_actual_tokens
         max_query_len = common_attn_metadata.max_query_len
 
@@ -109,14 +123,13 @@ def build(self,
         use_cascade = common_prefix_len > 0
 
         if use_cascade:
-            cu_prefix_query_lens = torch.tensor([0, num_actual_tokens],
-                                                dtype=torch.int32,
-                                                device=self.device)
-            prefix_kv_lens = torch.tensor([common_prefix_len],
-                                          dtype=torch.int32,
-                                          device=self.device)
-            suffix_kv_lens = (common_attn_metadata.seq_lens_cpu -
-                              common_prefix_len)
+            cu_prefix_query_lens = torch.tensor(
+                [0, num_actual_tokens], dtype=torch.int32, device=self.device
+            )
+            prefix_kv_lens = torch.tensor(
+                [common_prefix_len], dtype=torch.int32, device=self.device
+            )
+            suffix_kv_lens = common_attn_metadata.seq_lens_cpu - common_prefix_len
             suffix_kv_lens = suffix_kv_lens.to(self.device)
         else:
             cu_prefix_query_lens = None
@@ -143,7 +156,6 @@ def build(self,
 
 
 class RocmAttentionBackend(AttentionBackend):
-
     accept_output_buffer: bool = True
 
     @classmethod
@@ -163,7 +175,8 @@ def validate_head_size(cls, head_size: int) -> None:
                 f"Head size {head_size} is not supported by {attn_type}. "
                 f"Supported head sizes are: {supported_head_sizes}. "
                 "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes.")
+                "FlexAttention backend which supports all head sizes."
+            )
 
     @staticmethod
     def get_name() -> str:
@@ -203,12 +216,10 @@ def use_aiter_unified_attention() -> bool:
     """Check if aiter unified attention should be used."""
     # VLLM_ROCM_USE_AITER_MHA needs to set to 0 as well as it is set
     # to 1 as default
-    return envs.VLLM_ROCM_USE_AITER \
-        and envs.VLLM_USE_AITER_UNIFIED_ATTENTION
+    return envs.VLLM_ROCM_USE_AITER and envs.VLLM_USE_AITER_UNIFIED_ATTENTION
 
 
 class RocmAttentionImpl(AttentionImpl):
-
     def fused_output_quant_supported(self, quant_key: QuantKey):
         return quant_key == kFp8StaticTensorSym
 
@@ -249,29 +260,30 @@ def __init__(
         RocmAttentionBackend.validate_head_size(head_size)
 
         if attn_type != AttentionType.DECODER:
-            raise NotImplementedError("Encoder self-attention and "
-                                      "encoder/decoder cross-attention "
-                                      "are not implemented for "
-                                      "RocmAttentionImpl")
+            raise NotImplementedError(
+                "Encoder self-attention and "
+                "encoder/decoder cross-attention "
+                "are not implemented for "
+                "RocmAttentionImpl"
+            )
 
         self.fp8_dtype = current_platform.fp8_dtype()
-        self.force_prefill_decode_attn = \
-            envs.VLLM_V1_USE_PREFILL_DECODE_ATTENTION
+        self.force_prefill_decode_attn = envs.VLLM_V1_USE_PREFILL_DECODE_ATTENTION
 
         if not self.force_prefill_decode_attn:
             # If not using prefill decode attention, we use the Triton
             # unified attention implementation.
             if use_aiter_unified_attention():
-                logger.info_once(
-                    "Using aiter unified attention for RocmAttentionImpl")
-                from aiter.ops.triton.unified_attention import (
-                    unified_attention)
+                logger.info_once("Using aiter unified attention for RocmAttentionImpl")
+                from aiter.ops.triton.unified_attention import unified_attention
+
                 self.unified_attention = unified_attention
             else:
-                logger.info_once(
-                    "Using vllm unified attention for RocmAttentionImpl")
+                logger.info_once("Using vllm unified attention for RocmAttentionImpl")
                 from vllm.attention.ops.triton_unified_attention import (
-                    unified_attention)
+                    unified_attention,
+                )
+
                 self.unified_attention = unified_attention
 
         self.sinks = sinks
@@ -279,7 +291,8 @@ def __init__(
             assert sinks.shape[0] == num_heads, (
                 "Sinks must have the same number of heads as the number of "
                 f"heads in the layer. Sinks shape: {sinks.shape}, "
-                f"num_heads: {num_heads}.")
+                f"num_heads: {num_heads}."
+            )
 
     def forward(
         self,
@@ -310,7 +323,8 @@ def forward(
         if output_block_scale is not None:
             raise NotImplementedError(
                 "fused block_scale output quantization is not yet supported"
-                " for RocmAttentionImpl")
+                " for RocmAttentionImpl"
+            )
 
         if attn_metadata is None:
             # Profiling run.
@@ -332,7 +346,8 @@ def forward(
 
         if use_prefill_decode_attn:
             key_cache, value_cache = PagedAttention.split_kv_cache(
-                kv_cache, self.num_kv_heads, self.head_size)
+                kv_cache, self.num_kv_heads, self.head_size
+            )
         else:
             key_cache, value_cache = kv_cache.unbind(0)
 
@@ -366,16 +381,17 @@ def forward(
             key_cache = key_cache.view(self.fp8_dtype)
             value_cache = value_cache.view(self.fp8_dtype)
             num_tokens, num_heads, head_size = query.shape
-            assert layer._q_scale_float == 1.0, \
+            assert layer._q_scale_float == 1.0, (
                 "A non 1.0 q_scale is not currently supported."
+            )
             if current_platform.is_cuda():
                 # Skip Q quantization on ROCm and XPU, enable this on cuda
                 # only, since dequantizing back to f32 in the attention kernel
                 # is not supported.
                 query, _ = ops.scaled_fp8_quant(
-                    query.reshape(
-                        (num_tokens, num_heads * head_size)).contiguous(),
-                    layer._q_scale)
+                    query.reshape((num_tokens, num_heads * head_size)).contiguous(),
+                    layer._q_scale,
+                )
                 query = query.reshape((num_tokens, num_heads, head_size))
 
         cu_seqlens_q = attn_metadata.query_start_loc
@@ -430,6 +446,7 @@ def forward(
                 k_descale=layer._k_scale.expand(descale_shape),
                 v_descale=layer._v_scale.expand(descale_shape),
                 sinks=self.sinks,
-                output_scale=output_scale)
+                output_scale=output_scale,
+            )
 
         return output
diff --git a/vllm/v1/attention/backends/short_conv_attn.py b/vllm/v1/attention/backends/short_conv_attn.py
index ba0fba4281e5..74cfecca764e 100644
--- a/vllm/v1/attention/backends/short_conv_attn.py
+++ b/vllm/v1/attention/backends/short_conv_attn.py
@@ -6,16 +6,16 @@
 import torch
 
 from vllm.attention.backends.abstract import AttentionBackend
-from vllm.v1.attention.backends.mamba_attn import (
-    BaseMambaAttentionMetadataBuilder)
-from vllm.v1.attention.backends.utils import (PAD_SLOT_ID,
-                                              CommonAttentionMetadata,
-                                              compute_causal_conv1d_metadata,
-                                              split_decodes_and_prefills)
+from vllm.v1.attention.backends.mamba_attn import BaseMambaAttentionMetadataBuilder
+from vllm.v1.attention.backends.utils import (
+    PAD_SLOT_ID,
+    CommonAttentionMetadata,
+    compute_causal_conv1d_metadata,
+    split_decodes_and_prefills,
+)
 
 
 class ShortConvAttentionBackend(AttentionBackend):
-
     @staticmethod
     def get_builder_cls() -> type["ShortConvAttentionMetadataBuilder"]:
         return ShortConvAttentionMetadataBuilder
@@ -39,12 +39,14 @@ class ShortConvAttentionMetadata:
 
 
 class ShortConvAttentionMetadataBuilder(
-        BaseMambaAttentionMetadataBuilder[ShortConvAttentionMetadata]):
-
-    def build(self,
-              common_prefix_len: int,
-              common_attn_metadata: CommonAttentionMetadata,
-              fast_build: bool = False) -> ShortConvAttentionMetadata:
+    BaseMambaAttentionMetadataBuilder[ShortConvAttentionMetadata]
+):
+    def build(
+        self,
+        common_prefix_len: int,
+        common_attn_metadata: CommonAttentionMetadata,
+        fast_build: bool = False,
+    ) -> ShortConvAttentionMetadata:
         num_reqs = common_attn_metadata.num_reqs
         query_start_loc = common_attn_metadata.query_start_loc
         state_indices_tensor = common_attn_metadata.block_table_tensor[:, 0]
@@ -54,28 +56,38 @@ def build(self,
 
         num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
             split_decodes_and_prefills(
-                common_attn_metadata,
-                decode_threshold=self.reorder_batch_threshold))
+                common_attn_metadata, decode_threshold=self.reorder_batch_threshold
+            )
+        )
 
         has_initial_states_p = None
         if num_prefills > 0:
             has_initial_states_cpu = (
-                common_attn_metadata.
-                num_computed_tokens_cpu[num_reqs - num_prefills:num_reqs] > 0)
-            has_initial_states_p = has_initial_states_cpu.to(
-                query_start_loc.device)
-
-            query_start_loc_p = common_attn_metadata.query_start_loc[
-                -num_prefills - 1:] - num_decode_tokens
-
-            nums_dict, batch_ptr, token_chunk_offset_ptr = \
+                common_attn_metadata.num_computed_tokens_cpu[
+                    num_reqs - num_prefills : num_reqs
+                ]
+                > 0
+            )
+            has_initial_states_p = has_initial_states_cpu.to(query_start_loc.device)
+
+            query_start_loc_p = (
+                common_attn_metadata.query_start_loc[-num_prefills - 1 :]
+                - num_decode_tokens
+            )
+
+            nums_dict, batch_ptr, token_chunk_offset_ptr = (
                 compute_causal_conv1d_metadata(query_start_loc_p)
+            )
 
-        elif (num_decodes > 0 and num_decodes <= self.decode_cudagraph_max_bs
-              and self.compilation_config.full_cuda_graph):
+        elif (
+            num_decodes > 0
+            and num_decodes <= self.decode_cudagraph_max_bs
+            and self.compilation_config.full_cuda_graph
+        ):
             num_input_tokens = self.vllm_config.pad_for_cudagraph(num_decodes)
-            self.state_indices_tensor[:num_decodes].copy_(state_indices_tensor,
-                                                          non_blocking=True)
+            self.state_indices_tensor[:num_decodes].copy_(
+                state_indices_tensor, non_blocking=True
+            )
             state_indices_tensor = self.state_indices_tensor[:num_input_tokens]
             state_indices_tensor[num_decodes:] = PAD_SLOT_ID
 
diff --git a/vllm/v1/attention/backends/tree_attn.py b/vllm/v1/attention/backends/tree_attn.py
index 583756129a29..2a7770c87d24 100644
--- a/vllm/v1/attention/backends/tree_attn.py
+++ b/vllm/v1/attention/backends/tree_attn.py
@@ -8,14 +8,21 @@
 
 import torch
 
-from vllm.attention.backends.abstract import (AttentionBackend, AttentionImpl,
-                                              AttentionMetadata, AttentionType)
+from vllm.attention.backends.abstract import (
+    AttentionBackend,
+    AttentionImpl,
+    AttentionMetadata,
+    AttentionType,
+)
 from vllm.attention.ops.triton_unified_attention import unified_attention
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.v1.attention.backends.utils import (
-    AttentionMetadataBuilder, CommonAttentionMetadata,
-    reorder_batch_to_split_decodes_and_prefills, split_decodes_and_prefills)
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+    reorder_batch_to_split_decodes_and_prefills,
+    split_decodes_and_prefills,
+)
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 if TYPE_CHECKING:
@@ -28,7 +35,6 @@
 
 
 class TreeAttentionBackend(AttentionBackend):
-
     accept_output_buffer: bool = True
 
     @classmethod
@@ -48,7 +54,8 @@ def validate_head_size(cls, head_size: int) -> None:
                 f"Head size {head_size} is not supported by {attn_type}. "
                 f"Supported head sizes are: {supported_head_sizes}. "
                 "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes.")
+                "FlexAttention backend which supports all head sizes."
+            )
 
     @staticmethod
     def get_name() -> str:
@@ -114,9 +121,9 @@ def prefill_metadata(self) -> Optional["TreeAttentionMetadata"]:
             # metadata structure
             return self._cached_prefill_metadata
 
-        q_start_loc = self.query_start_loc[self.num_decodes:]
+        q_start_loc = self.query_start_loc[self.num_decodes :]
         q_seqlens = torch.diff(q_start_loc)
-        kv_seqlens = self.seq_lens[self.num_decodes:]
+        kv_seqlens = self.seq_lens[self.num_decodes :]
         # Construct & cache prefill-phase attention metadata structure
         self._cached_prefill_metadata = TreeAttentionMetadata(
             num_actual_tokens=self.num_prefill_tokens,
@@ -124,8 +131,8 @@ def prefill_metadata(self) -> Optional["TreeAttentionMetadata"]:
             query_start_loc=q_start_loc - q_start_loc[0],
             max_seq_len=int(kv_seqlens.max().item()),
             seq_lens=kv_seqlens,
-            block_table=self.block_table[self.num_decodes:],
-            slot_mapping=self.slot_mapping[self.num_decode_tokens:],
+            block_table=self.block_table[self.num_decodes :],
+            slot_mapping=self.slot_mapping[self.num_decode_tokens :],
         )
         return self._cached_prefill_metadata
 
@@ -139,9 +146,9 @@ def decode_metadata(self) -> Optional["TreeAttentionMetadata"]:
             # metadata structure
             return self._cached_decode_metadata
 
-        q_start_loc = self.query_start_loc[:self.num_decodes + 1]
+        q_start_loc = self.query_start_loc[: self.num_decodes + 1]
         q_seqlens = torch.diff(q_start_loc)
-        kv_seqlens = self.seq_lens[:self.num_decodes]
+        kv_seqlens = self.seq_lens[: self.num_decodes]
         # Construct & cache decode-phase attention metadata structure
         self._cached_decode_metadata = TreeAttentionMetadata(
             num_actual_tokens=self.num_decode_tokens,
@@ -149,16 +156,14 @@ def decode_metadata(self) -> Optional["TreeAttentionMetadata"]:
             query_start_loc=q_start_loc,
             max_seq_len=int(kv_seqlens.max().item()),
             seq_lens=kv_seqlens,
-            block_table=self.block_table[:self.num_decodes],
-            slot_mapping=self.slot_mapping[:self.num_decode_tokens],
+            block_table=self.block_table[: self.num_decodes],
+            slot_mapping=self.slot_mapping[: self.num_decode_tokens],
             tree_attn_bias=self.tree_attn_bias,
         )
         return self._cached_decode_metadata
 
 
-class TreeAttentionMetadataBuilder(
-        AttentionMetadataBuilder[TreeAttentionMetadata]):
-
+class TreeAttentionMetadataBuilder(AttentionMetadataBuilder[TreeAttentionMetadata]):
     def __init__(
         self,
         kv_cache_spec: AttentionSpec,
@@ -172,10 +177,9 @@ def __init__(
 
         spec_config = vllm_config.speculative_config
         spec_token_tree = (spec := spec_config) and spec.speculative_token_tree
-        tree_choices: list[tuple[int,
-                                 ...]] = (ast.literal_eval(spec_token_tree)
-                                          if spec_token_tree is not None else
-                                          [(0, )])
+        tree_choices: list[tuple[int, ...]] = (
+            ast.literal_eval(spec_token_tree) if spec_token_tree is not None else [(0,)]
+        )
         # Construct the tree attention bias.
         depth_counts = _get_depth_counts(tree_choices)
         self.tree_attn_bias = _prepare_tree_attn_bias(
@@ -185,12 +189,12 @@ def __init__(
             device=device,
         )
 
-    def reorder_batch(self, input_batch: "InputBatch",
-                      scheduler_output: "SchedulerOutput") -> bool:
+    def reorder_batch(
+        self, input_batch: "InputBatch", scheduler_output: "SchedulerOutput"
+    ) -> bool:
         return reorder_batch_to_split_decodes_and_prefills(
-            input_batch,
-            scheduler_output,
-            decode_threshold=self.tree_attn_bias.shape[0])
+            input_batch, scheduler_output, decode_threshold=self.tree_attn_bias.shape[0]
+        )
 
     def build(
         self,
@@ -200,8 +204,10 @@ def build(
     ) -> TreeAttentionMetadata:
         decode_threshold = self.tree_attn_bias.shape[0]
         num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
-            split_decodes_and_prefills(common_attn_metadata,
-                                       decode_threshold=decode_threshold))
+            split_decodes_and_prefills(
+                common_attn_metadata, decode_threshold=decode_threshold
+            )
+        )
 
         num_actual_tokens = common_attn_metadata.num_actual_tokens
         q_start_loc = common_attn_metadata.query_start_loc
@@ -241,8 +247,7 @@ def build_for_drafting(
             # Slice the tree attention bias for drafting. Exclude
             # the root level.
             start, end = 1, 1 + common_attn_metadata.max_query_len
-            self.tree_attn_bias = self.tree_attn_bias[start:end,
-                                                      start:end].contiguous()
+            self.tree_attn_bias = self.tree_attn_bias[start:end, start:end].contiguous()
 
         # Build attention bias.
         attn_metadata = self.build(0, common_attn_metadata, fast_build=True)
@@ -273,10 +278,9 @@ def _prepare_tree_attn_bias(
 ) -> torch.Tensor:
     # +1 comes from the additional root node.
     tree_len = len(sorted_tree_choices) + 1
-    tree_attn_mask = torch.full((tree_len, tree_len),
-                                -torch.inf,
-                                device=device,
-                                dtype=dtype)
+    tree_attn_mask = torch.full(
+        (tree_len, tree_len), -torch.inf, device=device, dtype=dtype
+    )
 
     # Set diagonal to all zeros. Each token should
     # attend to itself.
@@ -298,14 +302,14 @@ def _prepare_tree_attn_bias(
             ancestor_idx = []
             for c in range(len(cur_tree_choice) - 1):
                 ancestor_idx.append(
-                    sorted_tree_choices.index(cur_tree_choice[:c + 1]) + 1)
+                    sorted_tree_choices.index(cur_tree_choice[: c + 1]) + 1
+                )
             tree_attn_mask[j + start + 1, ancestor_idx] = mask_val
         start += depth_counts[i]
     return tree_attn_mask
 
 
 class TreeAttentionImpl(AttentionImpl):
-
     def __init__(
         self,
         num_heads: int,
@@ -341,10 +345,12 @@ def __init__(
         TreeAttentionBackend.validate_head_size(head_size)
 
         if attn_type != AttentionType.DECODER:
-            raise NotImplementedError("Encoder self-attention and "
-                                      "encoder/decoder cross-attention "
-                                      "are not implemented for "
-                                      "TreeAttentionImpl.")
+            raise NotImplementedError(
+                "Encoder self-attention and "
+                "encoder/decoder cross-attention "
+                "are not implemented for "
+                "TreeAttentionImpl."
+            )
 
     def forward(
         self,
@@ -374,8 +380,8 @@ def forward(
 
         if output_scale is not None or output_block_scale is not None:
             raise NotImplementedError(
-                "fused output quantization is not yet supported"
-                " for TreeAttentionImpl")
+                "fused output quantization is not yet supported for TreeAttentionImpl"
+            )
 
         if attn_metadata is None:
             # Profiling run.
@@ -404,8 +410,7 @@ def forward(
 
         num_actual_tokens = attn_metadata.num_actual_tokens
         num_decode_tokens = attn_metadata.num_decode_tokens
-        descale_shape = (attn_metadata.query_start_loc.shape[0] - 1,
-                         key.shape[1])
+        descale_shape = (attn_metadata.query_start_loc.shape[0] - 1, key.shape[1])
         if prefill_meta := attn_metadata.prefill_metadata:
             unified_attention(
                 q=query[num_decode_tokens:num_actual_tokens],
diff --git a/vllm/v1/attention/backends/triton_attn.py b/vllm/v1/attention/backends/triton_attn.py
index 3983c5edc76f..9997ed16bed1 100644
--- a/vllm/v1/attention/backends/triton_attn.py
+++ b/vllm/v1/attention/backends/triton_attn.py
@@ -1,24 +1,34 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """High-Performance Triton-only Attention layer."""
+
 from dataclasses import dataclass
 from typing import ClassVar, Optional
 
 import torch
 
-from vllm.attention.backends.abstract import (AttentionBackend, AttentionImpl,
-                                              AttentionMetadata, AttentionType)
+from vllm.attention.backends.abstract import (
+    AttentionBackend,
+    AttentionImpl,
+    AttentionMetadata,
+    AttentionType,
+)
 from vllm.attention.ops.triton_reshape_and_cache_flash import (
-    triton_reshape_and_cache_flash)
+    triton_reshape_and_cache_flash,
+)
 from vllm.attention.ops.triton_unified_attention import unified_attention
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.utils.quant_utils import (
-    QuantKey, kFp8StaticTensorSym)
+    QuantKey,
+    kFp8StaticTensorSym,
+)
 from vllm.platforms import current_platform
-from vllm.v1.attention.backends.utils import (AttentionCGSupport,
-                                              AttentionMetadataBuilder,
-                                              CommonAttentionMetadata)
+from vllm.v1.attention.backends.utils import (
+    AttentionCGSupport,
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+)
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 if current_platform.is_cuda_alike():
@@ -59,21 +69,25 @@ class TritonAttentionMetadata:
     prefix_scheduler_metadata: Optional[torch.Tensor] = None
 
 
-class TritonAttentionMetadataBuilder(
-        AttentionMetadataBuilder[TritonAttentionMetadata]):
+class TritonAttentionMetadataBuilder(AttentionMetadataBuilder[TritonAttentionMetadata]):
     cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.ALWAYS
 
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
         super().__init__(kv_cache_spec, layer_names, vllm_config, device)
 
         self.block_size = kv_cache_spec.block_size
 
         model_config = vllm_config.model_config
         self.num_heads_q = model_config.get_num_attention_heads(
-            vllm_config.parallel_config)
-        self.num_heads_kv = model_config.get_num_kv_heads(
-            vllm_config.parallel_config)
+            vllm_config.parallel_config
+        )
+        self.num_heads_kv = model_config.get_num_kv_heads(vllm_config.parallel_config)
         self.headdim = model_config.get_head_size()
 
     def build_for_cudagraph_capture(
@@ -86,10 +100,12 @@ def build_for_cudagraph_capture(
         attn_metadata.seq_lens.fill_(1)
         return attn_metadata
 
-    def build(self,
-              common_prefix_len: int,
-              common_attn_metadata: CommonAttentionMetadata,
-              fast_build: bool = False) -> TritonAttentionMetadata:
+    def build(
+        self,
+        common_prefix_len: int,
+        common_attn_metadata: CommonAttentionMetadata,
+        fast_build: bool = False,
+    ) -> TritonAttentionMetadata:
         num_actual_tokens = common_attn_metadata.num_actual_tokens
         max_query_len = common_attn_metadata.max_query_len
 
@@ -102,14 +118,13 @@ def build(self,
         use_cascade = common_prefix_len > 0
 
         if use_cascade:
-            cu_prefix_query_lens = torch.tensor([0, num_actual_tokens],
-                                                dtype=torch.int32,
-                                                device=self.device)
-            prefix_kv_lens = torch.tensor([common_prefix_len],
-                                          dtype=torch.int32,
-                                          device=self.device)
-            suffix_kv_lens = (common_attn_metadata.seq_lens_cpu -
-                              common_prefix_len)
+            cu_prefix_query_lens = torch.tensor(
+                [0, num_actual_tokens], dtype=torch.int32, device=self.device
+            )
+            prefix_kv_lens = torch.tensor(
+                [common_prefix_len], dtype=torch.int32, device=self.device
+            )
+            suffix_kv_lens = common_attn_metadata.seq_lens_cpu - common_prefix_len
             suffix_kv_lens = suffix_kv_lens.to(self.device)
         else:
             cu_prefix_query_lens = None
@@ -136,7 +151,6 @@ def build(self,
 
 
 class TritonAttentionBackend(AttentionBackend):
-
     accept_output_buffer: bool = True
 
     @classmethod
@@ -151,7 +165,8 @@ def validate_head_size(cls, head_size: int) -> None:
                 f"Head size {head_size} is not supported by TritonAttention."
                 f"Head sizes need to be larger or equal 32 for this backend. "
                 "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes.")
+                "FlexAttention backend which supports all head sizes."
+            )
 
     @staticmethod
     def get_name() -> str:
@@ -187,7 +202,6 @@ def get_builder_cls() -> type["TritonAttentionMetadataBuilder"]:
 
 
 class TritonAttentionImpl(AttentionImpl):
-
     def fused_output_quant_supported(self, quant_key: QuantKey):
         return quant_key == kFp8StaticTensorSym
 
@@ -228,10 +242,12 @@ def __init__(
         TritonAttentionBackend.validate_head_size(head_size)
 
         if attn_type != AttentionType.DECODER:
-            raise NotImplementedError("Encoder self-attention and "
-                                      "encoder/decoder cross-attention "
-                                      "are not implemented for "
-                                      "TritonAttentionImpl")
+            raise NotImplementedError(
+                "Encoder self-attention and "
+                "encoder/decoder cross-attention "
+                "are not implemented for "
+                "TritonAttentionImpl"
+            )
 
         self.fp8_dtype = current_platform.fp8_dtype()
 
@@ -240,7 +256,8 @@ def __init__(
             assert sinks.shape[0] == num_heads, (
                 "Sinks must have the same number of heads as the number of "
                 f"heads in the layer. Sinks shape: {sinks.shape}, "
-                f"num_heads: {num_heads}.")
+                f"num_heads: {num_heads}."
+            )
 
     def forward(
         self,
@@ -271,7 +288,8 @@ def forward(
         if output_block_scale is not None:
             raise NotImplementedError(
                 "fused block_scale output quantization is not yet supported"
-                " for TritonAttentionImpl")
+                " for TritonAttentionImpl"
+            )
 
         if attn_metadata is None:
             # Profiling run.
@@ -316,16 +334,17 @@ def forward(
                 key_cache = key_cache.view(self.fp8_dtype)
                 value_cache = value_cache.view(self.fp8_dtype)
             num_tokens, num_heads, head_size = query.shape
-            assert layer._q_scale_float == 1.0, \
+            assert layer._q_scale_float == 1.0, (
                 "A non 1.0 q_scale is not currently supported."
+            )
             if current_platform.is_cuda():
                 # Skip Q quantization on ROCm and XPU, enable this on cuda
                 # only, since dequantizing back to f32 in the attention kernel
                 # is not supported.
                 query, _ = ops.scaled_fp8_quant(
-                    query.reshape(
-                        (num_tokens, num_heads * head_size)).contiguous(),
-                    layer._q_scale)
+                    query.reshape((num_tokens, num_heads * head_size)).contiguous(),
+                    layer._q_scale,
+                )
                 query = query.reshape((num_tokens, num_heads, head_size))
 
         cu_seqlens_q = attn_metadata.query_start_loc
diff --git a/vllm/v1/attention/backends/utils.py b/vllm/v1/attention/backends/utils.py
index f37a829f401c..bddb2f22f0dc 100644
--- a/vllm/v1/attention/backends/utils.py
+++ b/vllm/v1/attention/backends/utils.py
@@ -5,8 +5,18 @@
 import functools
 from abc import abstractmethod
 from dataclasses import dataclass, fields, make_dataclass
-from typing import (TYPE_CHECKING, Any, ClassVar, Generic, Literal, Optional,
-                    Protocol, TypeVar, Union, get_args)
+from typing import (
+    TYPE_CHECKING,
+    Any,
+    ClassVar,
+    Generic,
+    Literal,
+    Optional,
+    Protocol,
+    TypeVar,
+    Union,
+    get_args,
+)
 
 import numpy as np
 import torch
@@ -21,11 +31,11 @@
     from vllm.v1.worker.gpu_input_batch import InputBatch
 
 import vllm.envs as envs
-from vllm.attention.backends.abstract import (AttentionBackend,
-                                              AttentionMetadata)
+from vllm.attention.backends.abstract import AttentionBackend, AttentionMetadata
 from vllm.attention.layer import Attention
 from vllm.distributed.kv_transfer.kv_connector.utils import (
-    get_kv_connector_cache_layout)
+    get_kv_connector_cache_layout,
+)
 from vllm.logger import init_logger
 from vllm.v1.kv_cache_interface import AttentionSpec
 from vllm.v1.worker.ubatch_utils import UBatchSlice
@@ -46,7 +56,7 @@ class CommonAttentionMetadata:
     """
     Per-batch attention metadata, shared across layers and backends.
     AttentionMetadataBuilder instances use it to construct per-layer metadata.
-    
+
     For many of the tensors we keep both GPU and CPU versions.
     """
 
@@ -89,26 +99,27 @@ def slice_query_start_locs(
     request_slice: slice,
 ) -> torch.Tensor:
     """
-    Creates a new query_start_loc that corresponds to the requests in 
+    Creates a new query_start_loc that corresponds to the requests in
     request_slice.
 
     Note: This function creates a new tensor to hold the new query_start_locs.
     This will break cudagraph compatibility.
     """
-    return query_start_loc[request_slice.start: request_slice.stop + 1] -\
-        query_start_loc[request_slice.start]
+    return (
+        query_start_loc[request_slice.start : request_slice.stop + 1]
+        - query_start_loc[request_slice.start]
+    )
 
 
 def _make_metadata_with_slice(
-        ubatch_slice: UBatchSlice,
-        attn_metadata: CommonAttentionMetadata) -> CommonAttentionMetadata:
+    ubatch_slice: UBatchSlice, attn_metadata: CommonAttentionMetadata
+) -> CommonAttentionMetadata:
     """
-    This function creates a new CommonAttentionMetadata that corresponds to 
+    This function creates a new CommonAttentionMetadata that corresponds to
     the requests included in ubatch_slice
     """
 
-    assert not ubatch_slice.is_empty(), (
-        f"Ubatch slice {ubatch_slice} is empty")
+    assert not ubatch_slice.is_empty(), f"Ubatch slice {ubatch_slice} is empty"
 
     request_slice = ubatch_slice.request_slice
     token_slice = ubatch_slice.token_slice
@@ -119,10 +130,12 @@ def _make_metadata_with_slice(
     last_req = request_slice.stop - 1
     last_tok = token_slice.stop - 1
 
-    assert start_locs[first_req] <= first_tok < start_locs[first_req + 1], \
+    assert start_locs[first_req] <= first_tok < start_locs[first_req + 1], (
         "Token slice start outside of first request"
-    assert start_locs[last_req] <= last_tok < start_locs[last_req+1], \
+    )
+    assert start_locs[last_req] <= last_tok < start_locs[last_req + 1], (
         "Token slice end outside of last request"
+    )
 
     # If the "middle" request has tokens in both ubatches, we have to split it.
     # If ubatch_slice is the first ubatch then we will be splitting the last
@@ -132,12 +145,13 @@ def _make_metadata_with_slice(
     splits_last_request = last_tok < start_locs[last_req + 1] - 1
 
     query_start_loc_cpu = slice_query_start_locs(start_locs, request_slice)
-    query_start_loc = slice_query_start_locs(attn_metadata.query_start_loc,
-                                             request_slice)
+    query_start_loc = slice_query_start_locs(
+        attn_metadata.query_start_loc, request_slice
+    )
 
     assert len(query_start_loc) >= 2, (
-        f"query_start_loc must have at least 2 elements, "
-        f"got {len(query_start_loc)}")
+        f"query_start_loc must have at least 2 elements, got {len(query_start_loc)}"
+    )
 
     if splits_first_request:
         tokens_skipped = first_tok - start_locs[first_req]
@@ -159,14 +173,13 @@ def _make_metadata_with_slice(
         seq_lens_cpu[-1] -= tokens_skipped
 
     max_seq_len = int(seq_lens_cpu.max())
-    num_computed_tokens_cpu = attn_metadata.num_computed_tokens_cpu[
-        request_slice]
+    num_computed_tokens_cpu = attn_metadata.num_computed_tokens_cpu[request_slice]
 
     num_requests = request_slice.stop - request_slice.start
     num_actual_tokens = token_slice.stop - token_slice.start
     max_query_len = int(
-        torch.max(torch.abs(query_start_loc_cpu[1:] -
-                            query_start_loc_cpu[:-1])).item())
+        torch.max(torch.abs(query_start_loc_cpu[1:] - query_start_loc_cpu[:-1])).item()
+    )
 
     # This is to account for the case where we are in a dummy
     # run and query_start_loc_cpu is full of 0s
@@ -196,15 +209,14 @@ def split_attn_metadata(
     common_attn_metadata: CommonAttentionMetadata,
 ) -> list[CommonAttentionMetadata]:
     """
-    Creates a new CommonAttentionMetadata instance that corresponds to the 
+    Creates a new CommonAttentionMetadata instance that corresponds to the
     requests for each UBatchSlice in ubatch_slices.
 
     Note: This function does not modify common_attn_metadata
     """
     results = []
     for ubatch_slice in ubatch_slices:
-        results.append(
-            _make_metadata_with_slice(ubatch_slice, common_attn_metadata))
+        results.append(_make_metadata_with_slice(ubatch_slice, common_attn_metadata))
 
     return results
 
@@ -213,7 +225,7 @@ def split_attn_metadata(
 
 
 class AttentionCGSupport(enum.Enum):
-    """ Constants for the cudagraph support of the attention backend
+    """Constants for the cudagraph support of the attention backend
     Here we do not consider the cascade attention, as currently
     it is never cudagraph supported."""
 
@@ -231,46 +243,53 @@ class AttentionCGSupport(enum.Enum):
 
 class AttentionMetadataBuilder(abc.ABC, Generic[M]):
     # Does this backend/builder support CUDA Graphs for attention (default: no).
-    cudagraph_support: ClassVar[AttentionCGSupport] = \
-        AttentionCGSupport.NEVER
+    cudagraph_support: ClassVar[AttentionCGSupport] = AttentionCGSupport.NEVER
     # Does this backend/builder reorder the batch?
     # If not, set this to None. Otherwise set it to the query
     # length that will be pulled into the front of the batch.
     reorder_batch_threshold: Optional[int] = None
 
     @abstractmethod
-    def __init__(self, kv_cache_spec: AttentionSpec, layer_names: list[str],
-                 vllm_config: VllmConfig, device: torch.device):
+    def __init__(
+        self,
+        kv_cache_spec: AttentionSpec,
+        layer_names: list[str],
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
         self.kv_cache_spec = kv_cache_spec
         self.layer_names = layer_names
         self.vllm_config = vllm_config
         self.device = device
 
     def _init_reorder_batch_threshold(
-            self,
-            reorder_batch_threshold: int = 1,
-            supports_spec_as_decode: bool = False) -> None:
+        self, reorder_batch_threshold: int = 1, supports_spec_as_decode: bool = False
+    ) -> None:
         self.reorder_batch_threshold = reorder_batch_threshold
-        if self.reorder_batch_threshold is not None \
-            and supports_spec_as_decode:
+        if self.reorder_batch_threshold is not None and supports_spec_as_decode:
             # If the backend supports spec-as-decode kernels, then we can set
             # the reorder_batch_threshold based on the number of speculative
             # tokens from the config.
             speculative_config = self.vllm_config.speculative_config
-            if (speculative_config is not None
-                    and speculative_config.num_speculative_tokens is not None):
-                self.reorder_batch_threshold = \
+            if (
+                speculative_config is not None
+                and speculative_config.num_speculative_tokens is not None
+            ):
+                self.reorder_batch_threshold = (
                     1 + speculative_config.num_speculative_tokens
+                )
 
     @abstractmethod
-    def build(self,
-              common_prefix_len: int,
-              common_attn_metadata: CommonAttentionMetadata,
-              fast_build: bool = False) -> M:
+    def build(
+        self,
+        common_prefix_len: int,
+        common_attn_metadata: CommonAttentionMetadata,
+        fast_build: bool = False,
+    ) -> M:
         """
         Central method that builds attention metadata.
         Some builders (MLA) require reorder_batch to be called prior to build.
-        
+
         Args:
             common_prefix_len: The length of the common prefix of the batch.
             common_attn_metadata: The common attention metadata.
@@ -280,8 +299,9 @@ def build(self,
         """
         raise NotImplementedError
 
-    def reorder_batch(self, input_batch: "InputBatch",
-                      scheduler_output: "SchedulerOutput") -> bool:
+    def reorder_batch(
+        self, input_batch: "InputBatch", scheduler_output: "SchedulerOutput"
+    ) -> bool:
         """
         Update the order of requests in the batch based on the attention
         backend's needs. For example, some attention backends (namely MLA) may
@@ -298,14 +318,16 @@ def reorder_batch(self, input_batch: "InputBatch",
         raise NotImplementedError
 
     def build_for_cudagraph_capture(
-            self, common_attn_metadata: CommonAttentionMetadata) -> M:
+        self, common_attn_metadata: CommonAttentionMetadata
+    ) -> M:
         """
         Build attention metadata for CUDA graph capture. Uses build by default.
         Subclasses that override this method should call self.build or
         super().build_for_cudagraph_capture.
         """
-        return self.build(common_prefix_len=0,
-                          common_attn_metadata=common_attn_metadata)
+        return self.build(
+            common_prefix_len=0, common_attn_metadata=common_attn_metadata
+        )
 
     def build_for_drafting(
         self,
@@ -314,7 +336,7 @@ def build_for_drafting(
     ) -> M:
         """
         Build attention metadata for draft model. Uses build by default.
-        
+
         Args:
             common_attn_metadata: The common attention metadata.
             draft_index: The index of the current draft operation.
@@ -323,9 +345,11 @@ def build_for_drafting(
                 For tree-based attention, this index instead refers to the
                 draft attempt for the i-th level in the tree of tokens.
         """
-        return self.build(common_prefix_len=0,
-                          common_attn_metadata=common_attn_metadata,
-                          fast_build=True)
+        return self.build(
+            common_prefix_len=0,
+            common_attn_metadata=common_attn_metadata,
+            fast_build=True,
+        )
 
     def use_cascade_attention(
         self,
@@ -348,8 +372,11 @@ def get_kv_cache_layout():
 
     if _KV_CACHE_LAYOUT_OVERRIDE is not None:
         cache_layout = _KV_CACHE_LAYOUT_OVERRIDE
-        logger.info_once("`_KV_CACHE_LAYOUT_OVERRIDE` variable detected. " \
-                         "Setting KV cache layout to %s.", cache_layout)
+        logger.info_once(
+            "`_KV_CACHE_LAYOUT_OVERRIDE` variable detected. "
+            "Setting KV cache layout to %s.",
+            cache_layout,
+        )
         return cache_layout
 
     # Format specified by the user.
@@ -359,8 +386,11 @@ def get_kv_cache_layout():
         cache_layout = get_kv_connector_cache_layout()
     else:
         assert is_valid_kv_cache_layout(cache_layout)
-        logger.info_once("`VLLM_KV_CACHE_LAYOUT` environment variable " \
-        "detected. Setting KV cache layout to %s.", cache_layout)
+        logger.info_once(
+            "`VLLM_KV_CACHE_LAYOUT` environment variable "
+            "detected. Setting KV cache layout to %s.",
+            cache_layout,
+        )
     return cache_layout
 
 
@@ -385,8 +415,8 @@ class PerLayerParameters:
 
 
 def get_per_layer_parameters(
-        vllm_config: VllmConfig, layer_names: list[str],
-        cls_: type['AttentionImpl']) -> dict[str, PerLayerParameters]:
+    vllm_config: VllmConfig, layer_names: list[str], cls_: type["AttentionImpl"]
+) -> dict[str, PerLayerParameters]:
     """
     Scan layers in `layer_names` and determine some hyperparameters
     to use during `plan`.
@@ -406,17 +436,18 @@ def get_per_layer_parameters(
         sm_scale = impl.scale
         has_sinks = getattr(impl, "sinks", None) is not None
 
-        per_layer_params[key] = PerLayerParameters(window_left,
-                                                   logits_soft_cap, sm_scale,
-                                                   has_sinks)
+        per_layer_params[key] = PerLayerParameters(
+            window_left, logits_soft_cap, sm_scale, has_sinks
+        )
 
     return per_layer_params
 
 
 def infer_global_hyperparameters(
-        per_layer_params: dict[str, PerLayerParameters]) -> PerLayerParameters:
+    per_layer_params: dict[str, PerLayerParameters],
+) -> PerLayerParameters:
     """
-    Currently, FlashInfer backend other than trtllm-gen 
+    Currently, FlashInfer backend other than trtllm-gen
     only support models in which all layers share
     the same values for the following hyperparameters:
     - `window_left`
@@ -437,13 +468,15 @@ def infer_global_hyperparameters(
         for params in param_sets:
             if params.window_left != global_params.window_left:
                 raise ValueError(
-                    "Window left is not the same for all layers. " \
-                    "One potential fix is to set disable_sliding_window=True")
+                    "Window left is not the same for all layers. "
+                    "One potential fix is to set disable_sliding_window=True"
+                )
             assert params == global_params, (
                 "FlashInfer backend currently only supports models in which all"
                 "layers share the same values "
                 "for the following hyperparameters:"
-                "`window_left`, `logits_soft_cap`, `sm_scale`.")
+                "`window_left`, `logits_soft_cap`, `sm_scale`."
+            )
 
     return global_params
 
@@ -525,11 +558,10 @@ def make_local_attention_virtual_batches(
     #   new_tokens_in_first_block = [2, 1, 4]
     #   local_blocks = [2, 4, 2]
     q_tokens_in_first_block = np.minimum(
-        attn_chunk_size - ((seq_lens_np - q_seqlens) % attn_chunk_size),
-        q_seqlens).astype(np.int32)
+        attn_chunk_size - ((seq_lens_np - q_seqlens) % attn_chunk_size), q_seqlens
+    ).astype(np.int32)
     tokens_in_last_block = attn_chunk_size + (seq_lens_np % -attn_chunk_size)
-    local_blocks = 1 + cdiv(q_seqlens - q_tokens_in_first_block,
-                            attn_chunk_size)
+    local_blocks = 1 + cdiv(q_seqlens - q_tokens_in_first_block, attn_chunk_size)
 
     # Once we know the number of local blocks we can compute the request spans
     #  for each batch idx, we can figure out the number of "virtual" requests we
@@ -550,14 +582,13 @@ def make_local_attention_virtual_batches(
     rarange = np.repeat(local_blocks, local_blocks) - arange - 1
     # Then we can compute the seqlens_q_local, handling the fact that the
     #  first and last blocks could be partial
-    seqlens_q_local = \
-        np.repeat(q_seqlens - q_tokens_in_first_block, local_blocks)
+    seqlens_q_local = np.repeat(q_seqlens - q_tokens_in_first_block, local_blocks)
     # set the first block since this may be a partial block
     seqlens_q_local[arange == 0] = q_tokens_in_first_block
     # set the remaining blocks
     seqlens_q_local[arange > 0] = np.minimum(
-        seqlens_q_local - attn_chunk_size * (arange - 1),
-        attn_chunk_size)[arange > 0]
+        seqlens_q_local - attn_chunk_size * (arange - 1), attn_chunk_size
+    )[arange > 0]
 
     # convert from q_seqlens to cu_seqlens_q
     cu_seqlens_q_local = np.empty(virtual_batches + 1, dtype=np.int32)
@@ -569,22 +600,20 @@ def make_local_attention_virtual_batches(
     #  batch
     # For our example this will be:
     #   seqlens_k_local = [4, 2, 4, 4, 4, 1, 4, 1]
-    seqlens_k_local = np.full(cu_num_blocks[-1],
-                              attn_chunk_size,
-                              dtype=np.int32)
+    seqlens_k_local = np.full(cu_num_blocks[-1], attn_chunk_size, dtype=np.int32)
     seqlens_k_local[cu_num_blocks - 1] = tokens_in_last_block
     num_computed_tokens_local = seqlens_k_local - seqlens_q_local
 
-    k_seqstarts_absolute = np.repeat(seq_lens_np, local_blocks) - \
-        (rarange * attn_chunk_size + \
-            np.repeat(tokens_in_last_block, local_blocks))
+    k_seqstarts_absolute = np.repeat(seq_lens_np, local_blocks) - (
+        rarange * attn_chunk_size + np.repeat(tokens_in_last_block, local_blocks)
+    )
     # For the example the local attention blocks start at:
     #                           _b0_  _____b1_____  _b2_
     #   k_seqstarts_absolute = [0, 4, 4, 8, 12, 16, 4, 8]
     block_starts = k_seqstarts_absolute // block_size
-    assert attn_chunk_size % block_size == 0, \
-        f"attn_chunk_size {attn_chunk_size} is not " \
-        f"divisible by block_size {block_size}"
+    assert attn_chunk_size % block_size == 0, (
+        f"attn_chunk_size {attn_chunk_size} is not divisible by block_size {block_size}"
+    )
     pages_per_local_batch = attn_chunk_size // block_size
 
     # Create a block_table for the local attention blocks
@@ -605,12 +634,14 @@ def make_local_attention_virtual_batches(
     #     [ 22, 23 ], < local-batch 6, (batch 2, starting from k[4])
     #     [ 24, 25 ], < local-batch 7, (batch 2, starting from k[8])
     #   ]
-    block_indices = (block_starts[:, None] +
-                     np.arange(pages_per_local_batch, dtype=np.int32))
-    block_indices = block_indices.reshape(-1).clip(max=block_table.shape[1] -
-                                                   1)
-    batch_indices = np.repeat(np.arange(actual_batch_size, dtype=np.int32),
-                              local_blocks * pages_per_local_batch)
+    block_indices = block_starts[:, None] + np.arange(
+        pages_per_local_batch, dtype=np.int32
+    )
+    block_indices = block_indices.reshape(-1).clip(max=block_table.shape[1] - 1)
+    batch_indices = np.repeat(
+        np.arange(actual_batch_size, dtype=np.int32),
+        local_blocks * pages_per_local_batch,
+    )
 
     # NOTE: https://github.com/pytorch/pytorch/pull/160256 causes performance
     # regression when using numpy arrays (batch and block indices) to index into
@@ -618,8 +649,9 @@ def make_local_attention_virtual_batches(
     # tensor first, which recovers perf.
     batch_indices_torch = torch.from_numpy(batch_indices)
     block_indices_torch = torch.from_numpy(block_indices)
-    block_table_local = block_table[batch_indices_torch, block_indices_torch]\
-        .view(virtual_batches, -1)
+    block_table_local = block_table[batch_indices_torch, block_indices_torch].view(
+        virtual_batches, -1
+    )
 
     query_start_loc_cpu = torch.from_numpy(cu_seqlens_q_local)
     seq_lens_cpu = torch.from_numpy(seqlens_k_local)
@@ -627,8 +659,7 @@ def make_local_attention_virtual_batches(
 
     return CommonAttentionMetadata(
         query_start_loc_cpu=query_start_loc_cpu,
-        query_start_loc=query_start_loc_cpu.to(device=device,
-                                               non_blocking=True),
+        query_start_loc=query_start_loc_cpu.to(device=device, non_blocking=True),
         seq_lens_cpu=seq_lens_cpu,
         seq_lens=seq_lens_cpu.to(device=device, non_blocking=True),
         num_computed_tokens_cpu=torch.from_numpy(num_computed_tokens_local),
@@ -668,9 +699,7 @@ def make_kv_sharing_fast_prefill_common_attn_metadata(
 
     # Find how many decode indices belong to each request
     # request_ids: [0, 1, 1, 2]
-    request_ids = torch.bucketize(logits_indices,
-                                  query_start_loc[1:],
-                                  right=True)
+    request_ids = torch.bucketize(logits_indices, query_start_loc[1:], right=True)
 
     # Figure out how many tokens are in each request
     # num_decode_tokens: [1, 2, 1]
@@ -678,9 +707,9 @@ def make_kv_sharing_fast_prefill_common_attn_metadata(
 
     # Calculate new query_start_loc with tokens in generation_indices
     # decode_query_start_loc: [0, 1, 3, 4]
-    decode_query_start_loc = torch.empty(num_reqs + 1,
-                                         device=query_start_loc.device,
-                                         dtype=query_start_loc.dtype)
+    decode_query_start_loc = torch.empty(
+        num_reqs + 1, device=query_start_loc.device, dtype=query_start_loc.dtype
+    )
 
     decode_query_start_loc[0] = 0
     decode_query_start_loc[1:] = torch.cumsum(num_decode_tokens, dim=0)
@@ -689,8 +718,7 @@ def make_kv_sharing_fast_prefill_common_attn_metadata(
 
     common_attn_metadata = CommonAttentionMetadata(
         query_start_loc=decode_query_start_loc,
-        query_start_loc_cpu=decode_query_start_loc.to("cpu",
-                                                      non_blocking=True),
+        query_start_loc_cpu=decode_query_start_loc.to("cpu", non_blocking=True),
         seq_lens=seq_lens,
         seq_lens_cpu=seq_lens.to("cpu", non_blocking=True),
         num_computed_tokens_cpu=common_attn_metadata.num_computed_tokens_cpu,
@@ -706,22 +734,25 @@ def make_kv_sharing_fast_prefill_common_attn_metadata(
 
 
 def subclass_attention_backend(
-        name_prefix: str, attention_backend_cls: type[AttentionBackend],
-        builder_cls: type[AttentionMetadataBuilder[M]]
+    name_prefix: str,
+    attention_backend_cls: type[AttentionBackend],
+    builder_cls: type[AttentionMetadataBuilder[M]],
 ) -> type[AttentionBackend]:
     """
     Return a new subclass where `get_builder_cls` returns `builder_cls`.
     """
     name: str = name_prefix + attention_backend_cls.__name__  # type: ignore
 
-    return type(name, (attention_backend_cls, ),
-                {"get_builder_cls": lambda: builder_cls})
+    return type(
+        name, (attention_backend_cls,), {"get_builder_cls": lambda: builder_cls}
+    )
 
 
 def split_decodes_and_prefills(
-        common_attn_metadata: CommonAttentionMetadata,
-        decode_threshold: int = 1,
-        require_uniform: bool = False) -> tuple[int, int, int, int]:
+    common_attn_metadata: CommonAttentionMetadata,
+    decode_threshold: int = 1,
+    require_uniform: bool = False,
+) -> tuple[int, int, int, int]:
     """
     Assuming a reordered batch, finds the boundary between prefill and decode
     requests.
@@ -745,8 +776,9 @@ def split_decodes_and_prefills(
     num_tokens = common_attn_metadata.num_actual_tokens
     query_start_loc = common_attn_metadata.query_start_loc_cpu
 
-    if max_query_len <= decode_threshold and \
-        (not require_uniform or decode_threshold <= 1):
+    if max_query_len <= decode_threshold and (
+        not require_uniform or decode_threshold <= 1
+    ):
         return num_reqs, 0, num_tokens, 0
 
     query_lens = query_start_loc[1:] - query_start_loc[:-1]
@@ -779,7 +811,7 @@ def reorder_batch_to_split_decodes_and_prefills(
     """
     Reorders the batch to split into prefill and decode requests; places all
     requests with <= decode_threshold tokens at the front of the batch.
-    
+
     Returns:
         True if the batch was modified, False otherwise.
     """
@@ -834,8 +866,7 @@ def reorder_batch_to_split_decodes_and_prefills(
     return modified_batch
 
 
-def reshape_query_for_spec_decode(query: torch.Tensor,
-                                  batch_size: int) -> torch.Tensor:
+def reshape_query_for_spec_decode(query: torch.Tensor, batch_size: int) -> torch.Tensor:
     """
     Reshapes the query tensor for the specified batch size, so that
     it has shape (batch_size, seq_len, num_heads, head_dim).
@@ -845,13 +876,13 @@ def reshape_query_for_spec_decode(query: torch.Tensor,
     num_heads = query.shape[1]
     head_dim = query.shape[2]
     assert total_tokens % batch_size == 0, (
-        f"{total_tokens=} is not divisible by {batch_size=}")
+        f"{total_tokens=} is not divisible by {batch_size=}"
+    )
     seq_len = total_tokens // batch_size
     return query.view(batch_size, seq_len, num_heads, head_dim)
 
 
-def reshape_attn_output_for_spec_decode(
-        attn_output: torch.Tensor) -> torch.Tensor:
+def reshape_attn_output_for_spec_decode(attn_output: torch.Tensor) -> torch.Tensor:
     """
     Reshapes the attention output tensor, so that
     the batch_size and seq_len dimensions are combined.
@@ -859,16 +890,14 @@ def reshape_attn_output_for_spec_decode(
     if attn_output.dim() == 3:
         # Already in the correct shape
         return attn_output
-    assert attn_output.dim() == 4, \
-        f"attn_output must be 4D, got {attn_output.dim()}D"
+    assert attn_output.dim() == 4, f"attn_output must be 4D, got {attn_output.dim()}D"
     total_tokens = attn_output.shape[0] * attn_output.shape[1]
-    return attn_output.view(total_tokens, attn_output.shape[2],
-                            attn_output.shape[3])
+    return attn_output.view(total_tokens, attn_output.shape[2], attn_output.shape[3])
 
 
 KV_SHARING_FAST_PREFILL_METADATA_FIELDS = [
-    ('logits_indices_padded', Optional[torch.Tensor], None),
-    ('num_logits_indices', int, 0),
+    ("logits_indices_padded", Optional[torch.Tensor], None),
+    ("num_logits_indices", int, 0),
 ]
 
 
@@ -881,7 +910,7 @@ def subclass_attention_metadata(
     Return a new subclass of `metadata_cls` with additional fields
     """
     name: str = name_prefix + metadata_cls.__name__  # type: ignore
-    Wrapped = make_dataclass(name, fields, bases=(metadata_cls, ))
+    Wrapped = make_dataclass(name, fields, bases=(metadata_cls,))
     return Wrapped
 
 
@@ -895,55 +924,55 @@ def create_fast_prefill_custom_backend(
     prefix: str,
     underlying_attn_backend: AttentionBackend,
 ) -> type[AttentionBackend]:
-
     underlying_builder = underlying_attn_backend.get_builder_cls()
 
     class FastPrefillAttentionBuilder(underlying_builder):  # type: ignore
-
-        def build(self,
-                  common_prefix_len: int,
-                  common_attn_metadata: CommonAttentionMetadata,
-                  fast_build: bool = False) -> AttentionMetadata:
-            new_common_attn_metadata =\
-            make_kv_sharing_fast_prefill_common_attn_metadata(common_attn_metadata)
-            metadata = super().build(common_prefix_len,
-                                     new_common_attn_metadata, fast_build)
+        def build(
+            self,
+            common_prefix_len: int,
+            common_attn_metadata: CommonAttentionMetadata,
+            fast_build: bool = False,
+        ) -> AttentionMetadata:
+            new_common_attn_metadata = (
+                make_kv_sharing_fast_prefill_common_attn_metadata(common_attn_metadata)
+            )
+            metadata = super().build(
+                common_prefix_len, new_common_attn_metadata, fast_build
+            )
 
             class KVSharingFastPrefillAttentionMetadata(
-                    metadata.__class__,  #  type: ignore
-                    KVSharingFastPrefillMetadata):
-
+                metadata.__class__,  #  type: ignore
+                KVSharingFastPrefillMetadata,
+            ):
                 def __init__(self, metadata, common_attn_metadata):
                     # Shallow copy all fields in metadata cls
                     for field in fields(metadata.__class__):
-                        setattr(self, field.name,
-                                getattr(metadata, field.name))
+                        setattr(self, field.name, getattr(metadata, field.name))
 
                     # Set additional fields that will be used in model code
-                    assert (common_attn_metadata.logits_indices_padded
-                            is not None
-                            and common_attn_metadata.num_logits_indices
-                            is not None)
-                    self.logits_indices_padded = \
+                    assert (
+                        common_attn_metadata.logits_indices_padded is not None
+                        and common_attn_metadata.num_logits_indices is not None
+                    )
+                    self.logits_indices_padded = (
                         common_attn_metadata.logits_indices_padded
-                    self.num_logits_indices = \
-                        common_attn_metadata.num_logits_indices
+                    )
+                    self.num_logits_indices = common_attn_metadata.num_logits_indices
 
-            return KVSharingFastPrefillAttentionMetadata(
-                metadata, common_attn_metadata)
+            return KVSharingFastPrefillAttentionMetadata(metadata, common_attn_metadata)
 
     attn_backend = subclass_attention_backend(
         name_prefix=prefix,
         attention_backend_cls=underlying_attn_backend,
-        builder_cls=FastPrefillAttentionBuilder)
+        builder_cls=FastPrefillAttentionBuilder,
+    )
 
     return attn_backend
 
 
 def compute_causal_conv1d_metadata(query_start_loc_p: torch.Tensor):
-
     # Needed for causal_conv1d
-    seqlens = query_start_loc_p.diff().to('cpu')
+    seqlens = query_start_loc_p.diff().to("cpu")
     nums_dict = {}  # type: ignore
     batch_ptr = None
     token_chunk_offset_ptr = None
@@ -951,40 +980,39 @@ def compute_causal_conv1d_metadata(query_start_loc_p: torch.Tensor):
     for BLOCK_M in [8]:  # cover all BLOCK_M values
         nums = -(-seqlens // BLOCK_M)
         nums_dict[BLOCK_M] = {}
-        nums_dict[BLOCK_M]['nums'] = nums
-        nums_dict[BLOCK_M]['tot'] = nums.sum().item()
+        nums_dict[BLOCK_M]["nums"] = nums
+        nums_dict[BLOCK_M]["tot"] = nums.sum().item()
         mlist = torch.from_numpy(np.repeat(np.arange(len(nums)), nums))
-        nums_dict[BLOCK_M]['mlist'] = mlist
-        mlist_len = len(nums_dict[BLOCK_M]['mlist'])
-        nums_dict[BLOCK_M]['mlist_len'] = mlist_len
+        nums_dict[BLOCK_M]["mlist"] = mlist
+        mlist_len = len(nums_dict[BLOCK_M]["mlist"])
+        nums_dict[BLOCK_M]["mlist_len"] = mlist_len
         MAX_NUM_PROGRAMS = max(1024, mlist_len) * 2
         offsetlist = []  # type: ignore
         for idx, num in enumerate(nums):
             offsetlist.extend(range(num))
         offsetlist = torch.tensor(offsetlist, dtype=torch.int32)
-        nums_dict[BLOCK_M]['offsetlist'] = offsetlist
+        nums_dict[BLOCK_M]["offsetlist"] = offsetlist
 
         if batch_ptr is None:
             # Update default value after class definition
-            batch_ptr = torch.full((MAX_NUM_PROGRAMS, ),
-                                   PAD_SLOT_ID,
-                                   dtype=torch.int32,
-                                   device=device)
-            token_chunk_offset_ptr = torch.full((MAX_NUM_PROGRAMS, ),
-                                                PAD_SLOT_ID,
-                                                dtype=torch.int32,
-                                                device=device)
+            batch_ptr = torch.full(
+                (MAX_NUM_PROGRAMS,), PAD_SLOT_ID, dtype=torch.int32, device=device
+            )
+            token_chunk_offset_ptr = torch.full(
+                (MAX_NUM_PROGRAMS,), PAD_SLOT_ID, dtype=torch.int32, device=device
+            )
         else:
             if batch_ptr.nelement() < MAX_NUM_PROGRAMS:
                 batch_ptr.resize_(MAX_NUM_PROGRAMS).fill_(PAD_SLOT_ID)
                 token_chunk_offset_ptr.resize_(  # type: ignore
-                    MAX_NUM_PROGRAMS).fill_(PAD_SLOT_ID)
+                    MAX_NUM_PROGRAMS
+                ).fill_(PAD_SLOT_ID)
 
         batch_ptr[0:mlist_len].copy_(mlist)
         token_chunk_offset_ptr[  # type: ignore
-            0:mlist_len].copy_(offsetlist)
-        nums_dict[BLOCK_M]['batch_ptr'] = batch_ptr
-        nums_dict[BLOCK_M]['token_chunk_offset_ptr'] = (token_chunk_offset_ptr
-                                                        )  # type: ignore
+            0:mlist_len
+        ].copy_(offsetlist)
+        nums_dict[BLOCK_M]["batch_ptr"] = batch_ptr
+        nums_dict[BLOCK_M]["token_chunk_offset_ptr"] = token_chunk_offset_ptr  # type: ignore
 
     return nums_dict, batch_ptr, token_chunk_offset_ptr
diff --git a/vllm/v1/attention/backends/xformers.py b/vllm/v1/attention/backends/xformers.py
index 9d667ee04f75..17e752277c66 100644
--- a/vllm/v1/attention/backends/xformers.py
+++ b/vllm/v1/attention/backends/xformers.py
@@ -7,20 +7,29 @@
 
 import torch
 
-from vllm.attention.backends.abstract import (AttentionBackend, AttentionImpl,
-                                              AttentionMetadata, AttentionType)
+from vllm.attention.backends.abstract import (
+    AttentionBackend,
+    AttentionImpl,
+    AttentionMetadata,
+    AttentionType,
+)
 from vllm.attention.ops.triton_unified_attention import unified_attention
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.v1.attention.backends.utils import (
-    AttentionMetadataBuilder, CommonAttentionMetadata,
-    reorder_batch_to_split_decodes_and_prefills, split_decodes_and_prefills)
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+    reorder_batch_to_split_decodes_and_prefills,
+    split_decodes_and_prefills,
+)
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 try:
     from xformers import ops as xops
     from xformers.ops.fmha.attn_bias import (
-        AttentionBias, PagedBlockDiagonalCausalWithOffsetPaddedKeysMask)
+        AttentionBias,
+        PagedBlockDiagonalCausalWithOffsetPaddedKeysMask,
+    )
 
     XFORMERS_AVAILABLE = True
 except ImportError:
@@ -36,7 +45,6 @@
 
 
 class XFormersAttentionBackend(AttentionBackend):
-
     accept_output_buffer: bool = True
 
     @classmethod
@@ -86,7 +94,8 @@ def validate_head_size(cls, head_size: int) -> None:
                 f"Head size {head_size} is not supported by {attn_type}. "
                 f"Supported head sizes are: {supported_head_sizes}. "
                 "Set VLLM_ATTENTION_BACKEND=FLEX_ATTENTION to use "
-                "FlexAttention backend which supports all head sizes.")
+                "FlexAttention backend which supports all head sizes."
+            )
 
     @staticmethod
     def get_name() -> str:
@@ -153,9 +162,9 @@ def prefill_metadata(self) -> Optional["XFormersAttentionMetadata"]:
             # metadata structure
             return self._cached_prefill_metadata
 
-        q_start_loc = self.query_start_loc[self.num_decodes:]
+        q_start_loc = self.query_start_loc[self.num_decodes :]
         q_seqlens = torch.diff(q_start_loc)
-        kv_seqlens = self.seq_lens[self.num_decodes:]
+        kv_seqlens = self.seq_lens[self.num_decodes :]
         # Construct & cache prefill-phase attention metadata structure
         self._cached_prefill_metadata = XFormersAttentionMetadata(
             num_actual_tokens=self.num_prefill_tokens,
@@ -163,8 +172,8 @@ def prefill_metadata(self) -> Optional["XFormersAttentionMetadata"]:
             query_start_loc=q_start_loc - q_start_loc[0],
             max_seq_len=int(kv_seqlens.max().item()),
             seq_lens=kv_seqlens,
-            block_table=self.block_table[self.num_decodes:],
-            slot_mapping=self.slot_mapping[self.num_decode_tokens:],
+            block_table=self.block_table[self.num_decodes :],
+            slot_mapping=self.slot_mapping[self.num_decode_tokens :],
         )
         return self._cached_prefill_metadata
 
@@ -180,24 +189,24 @@ def decode_metadata(self) -> Optional["XFormersAttentionMetadata"]:
 
         q_start_loc = self.query_start_loc
         q_seqlens = torch.diff(q_start_loc)
-        decode_kv_seqlens = self.seq_lens[:self.num_decodes]
+        decode_kv_seqlens = self.seq_lens[: self.num_decodes]
         # Construct & cache decode-phase attention metadata structure
         self._cached_decode_metadata = XFormersAttentionMetadata(
             num_actual_tokens=self.num_decode_tokens,
-            max_query_len=int(q_seqlens[:self.num_decodes].max().item()),
-            query_start_loc=q_start_loc[:self.num_decodes + 1],
+            max_query_len=int(q_seqlens[: self.num_decodes].max().item()),
+            query_start_loc=q_start_loc[: self.num_decodes + 1],
             max_seq_len=int(decode_kv_seqlens.max().item()),
             seq_lens=decode_kv_seqlens,
-            block_table=self.block_table[:self.num_decodes],
-            slot_mapping=self.slot_mapping[:self.num_decode_tokens],
+            block_table=self.block_table[: self.num_decodes],
+            slot_mapping=self.slot_mapping[: self.num_decode_tokens],
             attn_bias=self.attn_bias,
         )
         return self._cached_decode_metadata
 
 
 class XFormersAttentionMetadataBuilder(
-        AttentionMetadataBuilder[XFormersAttentionMetadata]):
-
+    AttentionMetadataBuilder[XFormersAttentionMetadata]
+):
     reorder_batch_threshold: int = 1
 
     def __init__(
@@ -214,12 +223,12 @@ def __init__(
         self._num_decodes = 0
         self._num_decode_tokens = 0
 
-    def reorder_batch(self, input_batch: "InputBatch",
-                      scheduler_output: "SchedulerOutput") -> bool:
+    def reorder_batch(
+        self, input_batch: "InputBatch", scheduler_output: "SchedulerOutput"
+    ) -> bool:
         return reorder_batch_to_split_decodes_and_prefills(
-            input_batch,
-            scheduler_output,
-            decode_threshold=self.reorder_batch_threshold)
+            input_batch, scheduler_output, decode_threshold=self.reorder_batch_threshold
+        )
 
     def build(
         self,
@@ -229,8 +238,9 @@ def build(
     ) -> XFormersAttentionMetadata:
         num_decodes, num_prefills, num_decode_tokens, num_prefill_tokens = (
             split_decodes_and_prefills(
-                common_attn_metadata,
-                decode_threshold=self.reorder_batch_threshold))
+                common_attn_metadata, decode_threshold=self.reorder_batch_threshold
+            )
+        )
 
         num_actual_tokens = common_attn_metadata.num_actual_tokens
         q_start_loc = common_attn_metadata.query_start_loc
@@ -246,14 +256,13 @@ def build(
             # Construct the decoder bias.
             decode_q_seqlens = q_seqlens[:num_decodes]
             decode_kv_seqlens = kv_seqlens[:num_decodes]
-            bias = (
-                PagedBlockDiagonalCausalWithOffsetPaddedKeysMask.from_seqlens(
-                    q_seqlen=decode_q_seqlens.tolist(),
-                    kv_seqlen=decode_kv_seqlens.tolist(),
-                    page_size=self.block_size,
-                    block_tables=block_table[:num_decodes],
-                    device=block_table.device,
-                ))
+            bias = PagedBlockDiagonalCausalWithOffsetPaddedKeysMask.from_seqlens(
+                q_seqlen=decode_q_seqlens.tolist(),
+                kv_seqlen=decode_kv_seqlens.tolist(),
+                page_size=self.block_size,
+                block_tables=block_table[:num_decodes],
+                device=block_table.device,
+            )
 
         return XFormersAttentionMetadata(
             num_actual_tokens=num_actual_tokens,
@@ -272,7 +281,6 @@ def build(
 
 
 class XFormersAttentionImpl(AttentionImpl):
-
     def __init__(
         self,
         num_heads: int,
@@ -289,8 +297,7 @@ def __init__(
         if kv_sharing_target_layer_name is not None:
             raise NotImplementedError("KV sharing is not supported in V0.")
         if alibi_slopes is not None:
-            raise NotImplementedError(
-                "XFormers does not support alibi slopes yet.")
+            raise NotImplementedError("XFormers does not support alibi slopes yet.")
         self.num_heads = num_heads
         self.head_size = head_size
         self.scale = float(scale)
@@ -313,10 +320,12 @@ def __init__(
         XFormersAttentionBackend.validate_head_size(head_size)
 
         if attn_type != AttentionType.DECODER:
-            raise NotImplementedError("Encoder self-attention and "
-                                      "encoder/decoder cross-attention "
-                                      "are not implemented for "
-                                      "XFormersAttentionImpl.")
+            raise NotImplementedError(
+                "Encoder self-attention and "
+                "encoder/decoder cross-attention "
+                "are not implemented for "
+                "XFormersAttentionImpl."
+            )
 
     def forward(
         self,
@@ -347,7 +356,8 @@ def forward(
         if output_scale is not None or output_block_scale is not None:
             raise NotImplementedError(
                 "fused output quantization is not yet supported"
-                " for XFormersAttentionImpl")
+                " for XFormersAttentionImpl"
+            )
 
         if attn_metadata is None:
             # Profiling run.
@@ -377,8 +387,7 @@ def forward(
         num_actual_tokens = attn_metadata.num_actual_tokens
         num_decode_tokens = attn_metadata.num_decode_tokens
         if prefill_meta := attn_metadata.prefill_metadata:
-            descale_shape = (prefill_meta.query_start_loc.shape[0] - 1,
-                             key.shape[1])
+            descale_shape = (prefill_meta.query_start_loc.shape[0] - 1, key.shape[1])
             unified_attention(
                 q=query[num_decode_tokens:num_actual_tokens],
                 k=key_cache,
@@ -403,36 +412,38 @@ def forward(
             # Query for decode. KV is not needed because it is already cached.
             decode_query = query[:num_decode_tokens]
             # Reshape query to [1, B_T, G, H, D].
-            q = decode_query.view(1, -1, self.num_kv_heads,
-                                  self.num_queries_per_kv, self.head_size)
+            q = decode_query.view(
+                1, -1, self.num_kv_heads, self.num_queries_per_kv, self.head_size
+            )
             # Reshape the k and v caches to [1, Bkv_T, G, H, D]
-            cache_k = key_cache.view(1, -1, self.num_kv_heads, 1,
-                                     self.head_size).expand(
-                                         1,
-                                         -1,
-                                         self.num_kv_heads,
-                                         self.num_queries_per_kv,
-                                         self.head_size,
-                                     )
-            cache_v = value_cache.view(1, -1, self.num_kv_heads, 1,
-                                       self.head_size).expand(
-                                           1,
-                                           -1,
-                                           self.num_kv_heads,
-                                           self.num_queries_per_kv,
-                                           self.head_size,
-                                       )
+            cache_k = key_cache.view(
+                1, -1, self.num_kv_heads, 1, self.head_size
+            ).expand(
+                1,
+                -1,
+                self.num_kv_heads,
+                self.num_queries_per_kv,
+                self.head_size,
+            )
+            cache_v = value_cache.view(
+                1, -1, self.num_kv_heads, 1, self.head_size
+            ).expand(
+                1,
+                -1,
+                self.num_kv_heads,
+                self.num_queries_per_kv,
+                self.head_size,
+            )
 
             attn_bias = decode_meta.attn_bias
-            output[:
-                   num_decode_tokens] = xops.memory_efficient_attention_forward(
-                       q,
-                       cache_k,
-                       cache_v,
-                       attn_bias=attn_bias,
-                       p=0.0,
-                       scale=self.scale,
-                   ).view(decode_query.shape)
+            output[:num_decode_tokens] = xops.memory_efficient_attention_forward(
+                q,
+                cache_k,
+                cache_v,
+                attn_bias=attn_bias,
+                p=0.0,
+                scale=self.scale,
+            ).view(decode_query.shape)
 
         # Reshape the output tensor.
         return output
diff --git a/vllm/v1/core/block_pool.py b/vllm/v1/core/block_pool.py
index 617a724a1ad2..ddfd94322737 100644
--- a/vllm/v1/core/block_pool.py
+++ b/vllm/v1/core/block_pool.py
@@ -3,16 +3,24 @@
 from collections.abc import Iterable
 from typing import Any, Optional, Union
 
-from vllm.distributed.kv_events import (MEDIUM_GPU, AllBlocksCleared,
-                                        BlockRemoved, BlockStored,
-                                        KVCacheEvent)
+from vllm.distributed.kv_events import (
+    MEDIUM_GPU,
+    AllBlocksCleared,
+    BlockRemoved,
+    BlockStored,
+    KVCacheEvent,
+)
 from vllm.logger import init_logger
-from vllm.v1.core.kv_cache_utils import (BlockHash, BlockHashWithGroupId,
-                                         ExternalBlockHash,
-                                         FreeKVCacheBlockQueue, KVCacheBlock,
-                                         get_block_hash,
-                                         make_block_hash_with_group_id,
-                                         maybe_convert_block_hash)
+from vllm.v1.core.kv_cache_utils import (
+    BlockHash,
+    BlockHashWithGroupId,
+    ExternalBlockHash,
+    FreeKVCacheBlockQueue,
+    KVCacheBlock,
+    get_block_hash,
+    make_block_hash_with_group_id,
+    maybe_convert_block_hash,
+)
 from vllm.v1.request import Request
 
 logger = init_logger(__name__)
@@ -20,7 +28,7 @@
 
 class BlockHashToBlockMap:
     """
-    Cache of blocks that are used for prefix caching. It caches blocks 
+    Cache of blocks that are used for prefix caching. It caches blocks
     from hash directly to a block or multiple blocks
     (i.e. {block_hash: KVCacheBlocks})
     - Mostly block_hash maps to a single KVCacheBlock, and KVCacheBlocks
@@ -42,11 +50,11 @@ class BlockHashToBlockMap:
     """
 
     def __init__(self):
-        self._cache: dict[BlockHashWithGroupId,
-                          Union[KVCacheBlock, dict[int, KVCacheBlock]]] = {}
+        self._cache: dict[
+            BlockHashWithGroupId, Union[KVCacheBlock, dict[int, KVCacheBlock]]
+        ] = {}
 
-    def get_one_block(self,
-                      key: BlockHashWithGroupId) -> Optional[KVCacheBlock]:
+    def get_one_block(self, key: BlockHashWithGroupId) -> Optional[KVCacheBlock]:
         """
         Gets any block with the given block hash key.
         """
@@ -77,8 +85,7 @@ def insert(self, key: BlockHashWithGroupId, block: KVCacheBlock) -> None:
         else:
             self._unexpected_blocks_type(blocks)
 
-    def pop(self, key: BlockHashWithGroupId,
-            block_id: int) -> Optional[KVCacheBlock]:
+    def pop(self, key: BlockHashWithGroupId, block_id: int) -> Optional[KVCacheBlock]:
         """
         Checks if block_hash exists and pop block_id from the cache
         """
@@ -148,8 +155,7 @@ def __init__(
         self.free_block_queue = FreeKVCacheBlockQueue(self.blocks)
 
         # Cache for block lookup
-        self.cached_block_hash_to_block: BlockHashToBlockMap = \
-            BlockHashToBlockMap()
+        self.cached_block_hash_to_block: BlockHashToBlockMap = BlockHashToBlockMap()
 
         # To represent a placeholder block with block_id=0.
         # The ref_cnt of null_block is not maintained, needs special care to
@@ -161,9 +167,9 @@ def __init__(
         self.kv_event_queue: list[KVCacheEvent] = []
 
     def get_cached_block(
-            self, block_hash: BlockHash,
-            kv_cache_group_ids: list[int]) -> Optional[list[KVCacheBlock]]:
-        """Get the cached block by the block hash for each group in 
+        self, block_hash: BlockHash, kv_cache_group_ids: list[int]
+    ) -> Optional[list[KVCacheBlock]]:
+        """Get the cached block by the block hash for each group in
         `kv_cache_group_ids`, or None if cache miss for any group.
         If there are duplicated blocks, we return the first block in the cache.
 
@@ -177,9 +183,11 @@ def get_cached_block(
         cached_blocks = []
         for group_id in kv_cache_group_ids:
             block_hash_with_group_id = make_block_hash_with_group_id(
-                block_hash, group_id)
+                block_hash, group_id
+            )
             block = self.cached_block_hash_to_block.get_one_block(
-                block_hash_with_group_id)
+                block_hash_with_group_id
+            )
             if not block:
                 return None
             cached_blocks.append(block)
@@ -218,17 +226,18 @@ def cache_full_blocks(
         new_block_hashes = request.block_hashes[num_cached_blocks:]
 
         new_hashes: Optional[list[ExternalBlockHash]] = (
-            [] if self.enable_kv_cache_events else None)
+            [] if self.enable_kv_cache_events else None
+        )
         for i, blk in enumerate(new_full_blocks):
             assert blk.block_hash is None
             block_hash = new_block_hashes[i]
 
             # Update and added the full block to the cache.
             block_hash_with_group_id = make_block_hash_with_group_id(
-                block_hash, kv_cache_group_id)
+                block_hash, kv_cache_group_id
+            )
             blk.block_hash = block_hash_with_group_id
-            self.cached_block_hash_to_block.insert(block_hash_with_group_id,
-                                                   blk)
+            self.cached_block_hash_to_block.insert(block_hash_with_group_id, blk)
             if new_hashes is not None:
                 new_hashes.append(maybe_convert_block_hash(block_hash))
 
@@ -239,20 +248,21 @@ def cache_full_blocks(
                 parent_block = blocks[num_cached_blocks - 1]
                 assert parent_block.block_hash is not None
                 parent_block_hash = maybe_convert_block_hash(
-                    get_block_hash(parent_block.block_hash))
+                    get_block_hash(parent_block.block_hash)
+                )
 
             self.kv_event_queue.append(
                 BlockStored(
                     block_hashes=new_hashes,
                     parent_block_hash=parent_block_hash,
-                    token_ids=request.
-                    all_token_ids[num_cached_blocks *
-                                  block_size:num_full_blocks * block_size],
+                    token_ids=request.all_token_ids[
+                        num_cached_blocks * block_size : num_full_blocks * block_size
+                    ],
                     block_size=block_size,
-                    lora_id=request.lora_request.id
-                    if request.lora_request else None,
+                    lora_id=request.lora_request.id if request.lora_request else None,
                     medium=MEDIUM_GPU,
-                ))
+                )
+            )
 
     def get_new_blocks(self, num_blocks: int) -> list[KVCacheBlock]:
         """Get new blocks from the free block pool.
@@ -266,8 +276,7 @@ def get_new_blocks(self, num_blocks: int) -> list[KVCacheBlock]:
             A list of new block.
         """
         if num_blocks > self.get_num_free_blocks():
-            raise ValueError(
-                f"Cannot get {num_blocks} free blocks from the pool")
+            raise ValueError(f"Cannot get {num_blocks} free blocks from the pool")
 
         ret: list[KVCacheBlock] = self.free_block_queue.popleft_n(num_blocks)
 
@@ -299,8 +308,7 @@ def _maybe_evict_cached_block(self, block: KVCacheBlock) -> bool:
             # The block doesn't have hash, eviction is not needed
             return False
 
-        if self.cached_block_hash_to_block.pop(block_hash,
-                                               block.block_id) is None:
+        if self.cached_block_hash_to_block.pop(block_hash, block.block_id) is None:
             # block not found in cached_block_hash_to_block,
             # eviction is not needed
             return False
@@ -313,10 +321,11 @@ def _maybe_evict_cached_block(self, block: KVCacheBlock) -> bool:
             # we disable hybrid kv cache manager when kv cache event is
             # enabled, so there is only one group.
             self.kv_event_queue.append(
-                BlockRemoved(block_hashes=[
-                    maybe_convert_block_hash(get_block_hash(block_hash))
-                ],
-                             medium=MEDIUM_GPU))
+                BlockRemoved(
+                    block_hashes=[maybe_convert_block_hash(get_block_hash(block_hash))],
+                    medium=MEDIUM_GPU,
+                )
+            )
         return True
 
     def touch(self, blocks: tuple[list[KVCacheBlock], ...]) -> None:
@@ -347,10 +356,9 @@ def free_blocks(self, ordered_blocks: Iterable[KVCacheBlock]) -> None:
         blocks_list = list(ordered_blocks)
         for block in blocks_list:
             block.ref_cnt -= 1
-        self.free_block_queue.append_n([
-            block for block in blocks_list
-            if block.ref_cnt == 0 and not block.is_null
-        ])
+        self.free_block_queue.append_n(
+            [block for block in blocks_list if block.ref_cnt == 0 and not block.is_null]
+        )
 
     def reset_prefix_cache(self) -> bool:
         """Reset prefix cache. This function may be used in RLHF
@@ -365,7 +373,9 @@ def reset_prefix_cache(self) -> bool:
         if num_used_blocks != 1:  # The null block is always marked as used
             logger.warning(
                 "Failed to reset prefix cache because some "
-                "blocks (%d) are not freed yet", num_used_blocks - 1)
+                "blocks (%d) are not freed yet",
+                num_used_blocks - 1,
+            )
             return False
 
         # Remove all hashes so that no new blocks will hit.
@@ -405,7 +415,7 @@ def get_usage(self) -> float:
 
     def take_events(self) -> list[KVCacheEvent]:
         """Atomically takes all events and clears the queue.
-        
+
         Returns:
             A list of KV cache events.
         """
diff --git a/vllm/v1/core/encoder_cache_manager.py b/vllm/v1/core/encoder_cache_manager.py
index eadea15a2e5e..c70025992e70 100644
--- a/vllm/v1/core/encoder_cache_manager.py
+++ b/vllm/v1/core/encoder_cache_manager.py
@@ -33,12 +33,12 @@ class EncoderCacheManager:
     within requests, allowing for fine-grained memory management and enabling
     chunked processing of multimodal inputs.
 
-    Cache is enabled to share embeddings of same multimodal data 
-    item (identified by their hash value) between different requests, 
-    and eviction takes place at allocation time when there's no free 
+    Cache is enabled to share embeddings of same multimodal data
+    item (identified by their hash value) between different requests,
+    and eviction takes place at allocation time when there's no free
     space for new embeddings.
     Oldest cached embeddings with no request referenced will be first evicted.
-    
+
     Args:
         cache_size: Limit the size of the cache, measured by the number of
                     tokens from the input sequence.
@@ -99,27 +99,31 @@ def check_and_update_cache(self, request: Request, input_id: int) -> bool:
         self.cached[mm_hash].add(request.request_id)
         return True
 
-    def can_allocate(self, request: Request, input_id: int,
-                     encoder_compute_budget: int,
-                     num_tokens_to_schedule: int) -> bool:
-        """Check if there's sufficient cache space for a multimodal input. 
+    def can_allocate(
+        self,
+        request: Request,
+        input_id: int,
+        encoder_compute_budget: int,
+        num_tokens_to_schedule: int,
+    ) -> bool:
+        """Check if there's sufficient cache space for a multimodal input.
         If there is, return True and update EncoderCacheManager state.
 
         If there is not enough free space in `num_free_slots` but there is
         enough reclaimable space in `num_freeable_slots`, entries will be
         evicted from `freeable` (their mm_hash appended to `freed`) until
-        enough space is available, and then this method returns True. 
+        enough space is available, and then this method returns True.
         Older entries are evicted first.
-        
-        Returns False only if the requested number of tokens exceeds both 
+
+        Returns False only if the requested number of tokens exceeds both
         the free and reclaimable capacities combined.
 
         Args:
             request: The request containing the multimodal input.
             input_id: Index of the multimodal input within the request.
-            encoder_compute_budget: Number of encoder tokens allowed to be 
+            encoder_compute_budget: Number of encoder tokens allowed to be
                 computed when this method is invoked.
-            num_tokens_to_schedule: Number of tokens already scheduled to be 
+            num_tokens_to_schedule: Number of tokens already scheduled to be
                 allocated with cache space when this method is invoked.
 
         Returns:
@@ -127,7 +131,7 @@ def can_allocate(self, request: Request, input_id: int,
             input (possibly after reclaiming `freeable` entries); otherwise
             False.
 
-        Note: This method does not allocate physical memory for the encoder 
+        Note: This method does not allocate physical memory for the encoder
         output but only the state of EncoderCacheManager.
         """
         num_tokens = request.get_num_encoder_tokens(input_id)
@@ -202,7 +206,7 @@ def free_encoder_input(self, request: Request, input_id: int) -> None:
 
         When the reference set for the corresponding `mm_hash` becomes empty,
         the entry is appended to `freeable` and `num_freeable_slots` is
-        increased by the number of encoder tokens for that input. 
+        increased by the number of encoder tokens for that input.
 
         The entry is NOT physically freed until capacity is needed (e.g., by
         `can_allocate`).
@@ -221,8 +225,8 @@ def free_encoder_input(self, request: Request, input_id: int) -> None:
     def free(self, request: Request) -> None:
         """Free all encoder input cache reference held by *request*.
 
-        For each cached input ID, `free_encoder_input` is invoked.  
-        The data stays in memory until eviction is triggered by a future 
+        For each cached input ID, `free_encoder_input` is invoked.
+        The data stays in memory until eviction is triggered by a future
         attempt allocation called by 'can_allocate'.
 
         Typically called when a request is finished, cancelled, or aborted.
@@ -236,9 +240,9 @@ def get_freed_mm_hashes(self) -> list[str]:
 
         Returns:
             List of mm_hash strings that were actually evicted since the last
-            call to be used by the scheduler to notify workers about which 
-            encoder outputs can be removed from their caches. The internal 
-            list is cleared after this call. 
+            call to be used by the scheduler to notify workers about which
+            encoder outputs can be removed from their caches. The internal
+            list is cleared after this call.
         """
         freed = self.freed
         self.freed = []
@@ -250,7 +254,7 @@ def compute_encoder_budget(
     scheduler_config: "SchedulerConfig",
     mm_registry: MultiModalRegistry,
 ) -> tuple[int, int]:
-    """Compute the encoder cache budget based on the model and scheduler 
+    """Compute the encoder cache budget based on the model and scheduler
     configurations.
 
     Returns:
@@ -260,8 +264,9 @@ def compute_encoder_budget(
             from the input sequence.
     """
     if mm_registry.supports_multimodal_inputs(model_config):
-        max_tokens_by_modality = mm_registry \
-            .get_max_tokens_per_item_by_nonzero_modality(model_config)
+        max_tokens_by_modality = (
+            mm_registry.get_max_tokens_per_item_by_nonzero_modality(model_config)
+        )
 
         return compute_mm_encoder_budget(
             scheduler_config,
@@ -271,18 +276,17 @@ def compute_encoder_budget(
     return compute_text_encoder_budget(scheduler_config)
 
 
-def compute_text_encoder_budget(
-        scheduler_config: "SchedulerConfig") -> tuple[int, int]:
-    """Compute the encoder cache budget based on the model and scheduler 
+def compute_text_encoder_budget(scheduler_config: "SchedulerConfig") -> tuple[int, int]:
+    """Compute the encoder cache budget based on the model and scheduler
     configurations for a text-only model.
 
     Args:
         scheduler_config: Scheduler configuration.
 
     Returns:
-        - Compute budget for encoder execution, in unit of number of tokens 
+        - Compute budget for encoder execution, in unit of number of tokens
             in the input sequence.
-        - Space budget for encoder cache size, in unit of number of tokens 
+        - Space budget for encoder cache size, in unit of number of tokens
             in the input sequence.
     """
     # Currently text-only encoder-decoder models are not supported
@@ -293,7 +297,7 @@ def compute_mm_encoder_budget(
     scheduler_config: "SchedulerConfig",
     max_tokens_by_modality: Mapping[str, int],
 ) -> tuple[int, int]:
-    """Compute the encoder cache budget based on the model and scheduler 
+    """Compute the encoder cache budget based on the model and scheduler
     configurations for a multimodal model.
 
     Args:
@@ -312,22 +316,28 @@ def compute_mm_encoder_budget(
         logger.warning(
             "All non-text modalities supported by the model have been "
             "explicitly disabled via limit_mm_per_prompt. Encoder cache will "
-            "not be initialized.")
+            "not be initialized."
+        )
         return 0, 0
 
     max_tokens_per_mm_item = max(max_tokens_by_modality.values())
 
-    if (scheduler_config.disable_chunked_mm_input and max_tokens_per_mm_item
-            > scheduler_config.max_num_batched_tokens):
+    if (
+        scheduler_config.disable_chunked_mm_input
+        and max_tokens_per_mm_item > scheduler_config.max_num_batched_tokens
+    ):
         raise ValueError(
             "Chunked MM input disabled but max_tokens_per_mm_item "
             f"({max_tokens_per_mm_item}) is larger than max_num_batched_tokens"
             f" ({scheduler_config.max_num_batched_tokens}). Please increase "
-            "max_num_batched_tokens.")
+            "max_num_batched_tokens."
+        )
 
-    encoder_compute_budget = max(scheduler_config.max_num_encoder_input_tokens,
-                                 max_tokens_per_mm_item)
-    encoder_cache_size = max(scheduler_config.encoder_cache_size,
-                             max_tokens_per_mm_item)
+    encoder_compute_budget = max(
+        scheduler_config.max_num_encoder_input_tokens, max_tokens_per_mm_item
+    )
+    encoder_cache_size = max(
+        scheduler_config.encoder_cache_size, max_tokens_per_mm_item
+    )
 
     return encoder_compute_budget, encoder_cache_size
diff --git a/vllm/v1/core/kv_cache_coordinator.py b/vllm/v1/core/kv_cache_coordinator.py
index 86771060c409..37e1b7ca3932 100644
--- a/vllm/v1/core/kv_cache_coordinator.py
+++ b/vllm/v1/core/kv_cache_coordinator.py
@@ -6,9 +6,11 @@
 from vllm.v1.core.block_pool import BlockPool
 from vllm.v1.core.kv_cache_utils import BlockHash, KVCacheBlock
 from vllm.v1.core.single_type_kv_cache_manager import (
-    CrossAttentionManager, FullAttentionManager, get_manager_for_kv_cache_spec)
-from vllm.v1.kv_cache_interface import (FullAttentionSpec, KVCacheConfig,
-                                        KVCacheSpec)
+    CrossAttentionManager,
+    FullAttentionManager,
+    get_manager_for_kv_cache_spec,
+)
+from vllm.v1.kv_cache_interface import FullAttentionSpec, KVCacheConfig, KVCacheSpec
 from vllm.v1.request import Request
 
 
@@ -30,8 +32,9 @@ def __init__(
         self.max_model_len = max_model_len
         self.enable_caching = enable_caching
 
-        self.block_pool = BlockPool(kv_cache_config.num_blocks, enable_caching,
-                                    enable_kv_cache_events)
+        self.block_pool = BlockPool(
+            kv_cache_config.num_blocks, enable_caching, enable_kv_cache_events
+        )
 
         # Needs special handling for find_longest_cache_hit if eagle is enabled
         self.use_eagle = use_eagle
@@ -41,19 +44,23 @@ def __init__(
                 block_pool=self.block_pool,
                 kv_cache_group_id=i,
                 dcp_world_size=dcp_world_size,
-            ) for i, kv_cache_group in enumerate(
-                self.kv_cache_config.kv_cache_groups))
+            )
+            for i, kv_cache_group in enumerate(self.kv_cache_config.kv_cache_groups)
+        )
 
-    def get_num_blocks_to_allocate(self, request_id: str, num_tokens: int,
-                                   new_computed_blocks: tuple[
-                                       list[KVCacheBlock], ...],
-                                   num_encoder_tokens: int) -> int:
+    def get_num_blocks_to_allocate(
+        self,
+        request_id: str,
+        num_tokens: int,
+        new_computed_blocks: tuple[list[KVCacheBlock], ...],
+        num_encoder_tokens: int,
+    ) -> int:
         """
         Get the number of blocks needed to be allocated for the request.
 
         Args:
             request_id: The request ID.
-            num_tokens: The total number of tokens that need a slot (including 
+            num_tokens: The total number of tokens that need a slot (including
                 tokens that are already allocated).
             new_computed_blocks: The new computed blocks just hitting the
                 prefix caching.
@@ -69,15 +76,17 @@ def get_num_blocks_to_allocate(self, request_id: str, num_tokens: int,
                 # For cross-attention, we issue a single static allocation
                 # of blocks based on the number of encoder input tokens.
                 num_blocks_to_allocate += manager.get_num_blocks_to_allocate(
-                    request_id, num_encoder_tokens, [])
+                    request_id, num_encoder_tokens, []
+                )
             else:
                 num_blocks_to_allocate += manager.get_num_blocks_to_allocate(
-                    request_id, num_tokens, new_computed_blocks[i])
+                    request_id, num_tokens, new_computed_blocks[i]
+                )
         return num_blocks_to_allocate
 
     def save_new_computed_blocks(
-            self, request_id: str,
-            new_computed_blocks: tuple[list[KVCacheBlock], ...]) -> None:
+        self, request_id: str, new_computed_blocks: tuple[list[KVCacheBlock], ...]
+    ) -> None:
         """
         Add the new computed blocks to the request.
 
@@ -87,21 +96,18 @@ def save_new_computed_blocks(
                 prefix cache.
         """
         for i, manager in enumerate(self.single_type_managers):
-            manager.save_new_computed_blocks(request_id,
-                                             new_computed_blocks[i])
+            manager.save_new_computed_blocks(request_id, new_computed_blocks[i])
 
     def allocate_new_blocks(
-            self,
-            request_id: str,
-            num_tokens: int,
-            num_encoder_tokens: int = 0) -> tuple[list[KVCacheBlock], ...]:
+        self, request_id: str, num_tokens: int, num_encoder_tokens: int = 0
+    ) -> tuple[list[KVCacheBlock], ...]:
         """
-        Allocate new blocks for the request to give it at least `num_tokens` 
+        Allocate new blocks for the request to give it at least `num_tokens`
         token slots.
 
         Args:
             request_id: The request ID.
-            num_tokens: The total number of tokens that need a slot (including 
+            num_tokens: The total number of tokens that need a slot (including
                 tokens that are already allocated).
             num_encoder_tokens: The number of encoder tokens for allocating
                 blocks for cross-attention.
@@ -111,9 +117,13 @@ def allocate_new_blocks(
         """
         return tuple(
             manager.allocate_new_blocks(
-                request_id, num_encoder_tokens if isinstance(
-                    manager, CrossAttentionManager) else num_tokens)
-            for manager in self.single_type_managers)
+                request_id,
+                num_encoder_tokens
+                if isinstance(manager, CrossAttentionManager)
+                else num_tokens,
+            )
+            for manager in self.single_type_managers
+        )
 
     def cache_blocks(self, request: Request, num_computed_tokens: int) -> None:
         """
@@ -138,8 +148,9 @@ def free(self, request_id: str) -> None:
         for manager in self.single_type_managers:
             manager.free(request_id)
 
-    def get_num_common_prefix_blocks(self, request_id: str,
-                                     num_running_requests: int) -> list[int]:
+    def get_num_common_prefix_blocks(
+        self, request_id: str, num_running_requests: int
+    ) -> list[int]:
         """
         Get the number of common prefix blocks for all requests in the RUNNING
         state for each kv cache group.
@@ -154,16 +165,14 @@ def get_num_common_prefix_blocks(self, request_id: str,
                 the RUNNING state for each kv cache group.
         """
         num_blocks_per_group = [
-            manager.get_num_common_prefix_blocks(request_id,
-                                                 num_running_requests)
+            manager.get_num_common_prefix_blocks(request_id, num_running_requests)
             for manager in self.single_type_managers
         ]
         return num_blocks_per_group
 
-    def remove_skipped_blocks(self, request_id: str,
-                              num_computed_tokens: int) -> None:
+    def remove_skipped_blocks(self, request_id: str, num_computed_tokens: int) -> None:
         """
-        Remove the blocks that are no longer needed from `blocks` and replace 
+        Remove the blocks that are no longer needed from `blocks` and replace
         the removed blocks with null_block.
 
         Args:
@@ -179,7 +188,8 @@ def get_blocks(self, request_id: str) -> tuple[list[KVCacheBlock], ...]:
         """
         return tuple(
             manager.req_to_blocks.get(request_id) or []
-            for manager in self.single_type_managers)
+            for manager in self.single_type_managers
+        )
 
     @abstractmethod
     def find_longest_cache_hit(
@@ -198,19 +208,27 @@ class KVCacheCoordinatorNoPrefixCache(KVCacheCoordinator):
     Does not implement any features related to prefix caching.
     """
 
-    def __init__(self, kv_cache_config: KVCacheConfig, max_model_len: int,
-                 use_eagle: bool, enable_kv_cache_events: bool,
-                 dcp_world_size: int):
-        super().__init__(kv_cache_config,
-                         max_model_len,
-                         use_eagle,
-                         False,
-                         enable_kv_cache_events,
-                         dcp_world_size=dcp_world_size)
+    def __init__(
+        self,
+        kv_cache_config: KVCacheConfig,
+        max_model_len: int,
+        use_eagle: bool,
+        enable_kv_cache_events: bool,
+        dcp_world_size: int,
+    ):
+        super().__init__(
+            kv_cache_config,
+            max_model_len,
+            use_eagle,
+            False,
+            enable_kv_cache_events,
+            dcp_world_size=dcp_world_size,
+        )
         self.num_single_type_manager = len(self.single_type_managers)
 
-    def get_num_common_prefix_blocks(self, request_id: str,
-                                     num_running_requests: int) -> list[int]:
+    def get_num_common_prefix_blocks(
+        self, request_id: str, num_running_requests: int
+    ) -> list[int]:
         return [0] * self.num_single_type_manager
 
     def find_longest_cache_hit(
@@ -219,7 +237,8 @@ def find_longest_cache_hit(
         max_cache_hit_length: int,
     ) -> tuple[tuple[list[KVCacheBlock], ...], int]:
         blocks: tuple[list[KVCacheBlock], ...] = tuple(
-            [] for _ in range(self.num_single_type_manager))
+            [] for _ in range(self.num_single_type_manager)
+        )
         return blocks, 0
 
 
@@ -230,23 +249,31 @@ class UnitaryKVCacheCoordinator(KVCacheCoordinator):
     full attention or all attention layers use sliding window attention.
     """
 
-    def __init__(self, kv_cache_config: KVCacheConfig, max_model_len: int,
-                 use_eagle: bool, enable_caching: bool,
-                 enable_kv_cache_events: bool, dcp_world_size: int):
-        super().__init__(kv_cache_config,
-                         max_model_len,
-                         use_eagle,
-                         enable_caching,
-                         enable_kv_cache_events,
-                         dcp_world_size=dcp_world_size)
-        self.kv_cache_spec = self.kv_cache_config.kv_cache_groups[
-            0].kv_cache_spec
+    def __init__(
+        self,
+        kv_cache_config: KVCacheConfig,
+        max_model_len: int,
+        use_eagle: bool,
+        enable_caching: bool,
+        enable_kv_cache_events: bool,
+        dcp_world_size: int,
+    ):
+        super().__init__(
+            kv_cache_config,
+            max_model_len,
+            use_eagle,
+            enable_caching,
+            enable_kv_cache_events,
+            dcp_world_size=dcp_world_size,
+        )
+        self.kv_cache_spec = self.kv_cache_config.kv_cache_groups[0].kv_cache_spec
         self.block_size = self.kv_cache_spec.block_size
         self.dcp_world_size = dcp_world_size
         if dcp_world_size > 1:
             self.block_size *= dcp_world_size
         assert len(self.kv_cache_config.kv_cache_groups) == 1, (
-            "UnitaryKVCacheCoordinator assumes only one kv cache group")
+            "UnitaryKVCacheCoordinator assumes only one kv cache group"
+        )
 
     def find_longest_cache_hit(
         self,
@@ -269,26 +296,34 @@ class HybridKVCacheCoordinator(KVCacheCoordinator):
     """
     KV cache coordinator for hybrid models with multiple KV cache types, and
     thus multiple kv cache groups.
-    To simplify `find_longest_cache_hit`, it only supports the combination of 
+    To simplify `find_longest_cache_hit`, it only supports the combination of
     two types of KV cache groups, and one of them must be full attention.
     May extend to more general cases in the future.
     """
 
-    def __init__(self, kv_cache_config: KVCacheConfig, max_model_len: int,
-                 use_eagle: bool, enable_caching: bool,
-                 enable_kv_cache_events: bool, dcp_world_size: int):
-        super().__init__(kv_cache_config,
-                         max_model_len,
-                         use_eagle,
-                         enable_caching,
-                         enable_kv_cache_events,
-                         dcp_world_size=dcp_world_size)
+    def __init__(
+        self,
+        kv_cache_config: KVCacheConfig,
+        max_model_len: int,
+        use_eagle: bool,
+        enable_caching: bool,
+        enable_kv_cache_events: bool,
+        dcp_world_size: int,
+    ):
+        super().__init__(
+            kv_cache_config,
+            max_model_len,
+            use_eagle,
+            enable_caching,
+            enable_kv_cache_events,
+            dcp_world_size=dcp_world_size,
+        )
         assert dcp_world_size == 1, "DCP not support hybrid attn now."
         self.verify_and_split_kv_cache_groups()
 
     def verify_and_split_kv_cache_groups(self) -> None:
         """
-        Verifies that the model has exactly two types of KV cache groups, and 
+        Verifies that the model has exactly two types of KV cache groups, and
         one of them is full attention. Then, split the kv cache groups into full
         attention groups and other groups.
         """
@@ -303,7 +338,8 @@ def verify_and_split_kv_cache_groups(self) -> None:
                 else:
                     assert full_attention_spec == g.kv_cache_spec, (
                         "HybridKVCacheCoordinator assumes exactly one type of "
-                        "full attention groups now.")
+                        "full attention groups now."
+                    )
                 self.full_attention_group_ids.append(i)
             else:
                 if other_spec is None:
@@ -311,19 +347,22 @@ def verify_and_split_kv_cache_groups(self) -> None:
                 else:
                     assert other_spec == g.kv_cache_spec, (
                         "HybridKVCacheCoordinator assumes "
-                        "exactly one other type of groups now.")
+                        "exactly one other type of groups now."
+                    )
                 self.other_group_ids.append(i)
 
         assert full_attention_spec is not None, (
             "HybridKVCacheCoordinator assumes exactly one type of full "
-            "attention groups now.")
+            "attention groups now."
+        )
         assert other_spec is not None, (
-            "HybridKVCacheCoordinator assumes exactly one type of other "
-            "groups now.")
+            "HybridKVCacheCoordinator assumes exactly one type of other groups now."
+        )
 
         self.full_attention_manager_cls = FullAttentionManager
         self.other_attention_cls = self.single_type_managers[
-            self.other_group_ids[0]].__class__
+            self.other_group_ids[0]
+        ].__class__
         self.full_attention_spec = full_attention_spec
         self.other_spec = other_spec
         self.full_attention_block_size = self.full_attention_spec.block_size
@@ -334,7 +373,8 @@ def verify_and_split_kv_cache_groups(self) -> None:
             divisible = self.other_block_size % self.full_attention_block_size
             assert divisible == 0, (
                 "KVCacheCoordinator assumes the block_size of full "
-                "attention layers is divisible by other layers now.")
+                "attention layers is divisible by other layers now."
+            )
 
         if max(self.full_attention_group_ids) < min(self.other_group_ids):
             self.full_attn_first = True
@@ -347,7 +387,8 @@ def verify_and_split_kv_cache_groups(self) -> None:
                 "do not interleave, either full attention group ids "
                 "are before other attention group ids or vice versa."
                 "This is for simplifying merging hit_blocks_full_attn and "
-                "hit_blocks_other_attn to hit_blocks.")
+                "hit_blocks_other_attn to hit_blocks."
+            )
 
     def find_longest_cache_hit(
         self,
@@ -367,29 +408,26 @@ def find_longest_cache_hit(
                 - The number of tokens of the longest cache hit.
         """
         # First, find the longest cache hit for full attention.
-        hit_blocks_full_attn = (
-            self.full_attention_manager_cls.find_longest_cache_hit(
-                block_hashes=block_hashes,
-                max_length=max_cache_hit_length,
-                kv_cache_group_ids=self.full_attention_group_ids,
-                block_pool=self.block_pool,
-                kv_cache_spec=self.full_attention_spec,
-                use_eagle=self.use_eagle,
-            ))
-        hit_length = len(
-            hit_blocks_full_attn[0]) * self.full_attention_block_size
+        hit_blocks_full_attn = self.full_attention_manager_cls.find_longest_cache_hit(
+            block_hashes=block_hashes,
+            max_length=max_cache_hit_length,
+            kv_cache_group_ids=self.full_attention_group_ids,
+            block_pool=self.block_pool,
+            kv_cache_spec=self.full_attention_spec,
+            use_eagle=self.use_eagle,
+        )
+        hit_length = len(hit_blocks_full_attn[0]) * self.full_attention_block_size
 
         # Next, find the cache hit for the other attention WITHIN
         # the cache hit of full attention.
-        hit_blocks_other_attn = (
-            self.other_attention_cls.find_longest_cache_hit(
-                block_hashes=block_hashes,
-                max_length=hit_length,
-                kv_cache_group_ids=self.other_group_ids,
-                block_pool=self.block_pool,
-                kv_cache_spec=self.other_spec,
-                use_eagle=self.use_eagle,
-            ))
+        hit_blocks_other_attn = self.other_attention_cls.find_longest_cache_hit(
+            block_hashes=block_hashes,
+            max_length=hit_length,
+            kv_cache_group_ids=self.other_group_ids,
+            block_pool=self.block_pool,
+            kv_cache_spec=self.other_spec,
+            use_eagle=self.use_eagle,
+        )
         hit_length = len(hit_blocks_other_attn[0]) * self.other_block_size
 
         # NOTE: the prefix cache hit length must be a multiple of block_size as
@@ -404,7 +442,7 @@ def find_longest_cache_hit(
         # Truncate the full attention cache hit to the length of the
         # cache hit of the other attention.
         for group_hit_blocks in hit_blocks_full_attn:
-            del group_hit_blocks[hit_length // self.full_attention_block_size:]
+            del group_hit_blocks[hit_length // self.full_attention_block_size :]
 
         # Merge the hit blocks of full attention and other attention.
         if self.full_attn_first:
@@ -414,27 +452,36 @@ def find_longest_cache_hit(
         return hit_blocks, hit_length
 
 
-def get_kv_cache_coordinator(kv_cache_config: KVCacheConfig,
-                             max_model_len: int, use_eagle: bool,
-                             enable_caching: bool,
-                             enable_kv_cache_events: bool,
-                             dcp_world_size: int) -> KVCacheCoordinator:
+def get_kv_cache_coordinator(
+    kv_cache_config: KVCacheConfig,
+    max_model_len: int,
+    use_eagle: bool,
+    enable_caching: bool,
+    enable_kv_cache_events: bool,
+    dcp_world_size: int,
+) -> KVCacheCoordinator:
     if not enable_caching:
-        return KVCacheCoordinatorNoPrefixCache(kv_cache_config,
-                                               max_model_len,
-                                               use_eagle,
-                                               enable_kv_cache_events,
-                                               dcp_world_size=dcp_world_size)
+        return KVCacheCoordinatorNoPrefixCache(
+            kv_cache_config,
+            max_model_len,
+            use_eagle,
+            enable_kv_cache_events,
+            dcp_world_size=dcp_world_size,
+        )
     if len(kv_cache_config.kv_cache_groups) == 1:
-        return UnitaryKVCacheCoordinator(kv_cache_config,
-                                         max_model_len,
-                                         use_eagle,
-                                         enable_caching,
-                                         enable_kv_cache_events,
-                                         dcp_world_size=dcp_world_size)
-    return HybridKVCacheCoordinator(kv_cache_config,
-                                    max_model_len,
-                                    use_eagle,
-                                    enable_caching,
-                                    enable_kv_cache_events,
-                                    dcp_world_size=dcp_world_size)
+        return UnitaryKVCacheCoordinator(
+            kv_cache_config,
+            max_model_len,
+            use_eagle,
+            enable_caching,
+            enable_kv_cache_events,
+            dcp_world_size=dcp_world_size,
+        )
+    return HybridKVCacheCoordinator(
+        kv_cache_config,
+        max_model_len,
+        use_eagle,
+        enable_caching,
+        enable_kv_cache_events,
+        dcp_world_size=dcp_world_size,
+    )
diff --git a/vllm/v1/core/kv_cache_manager.py b/vllm/v1/core/kv_cache_manager.py
index 0af98e7ba2d8..3e1a83a8a220 100644
--- a/vllm/v1/core/kv_cache_manager.py
+++ b/vllm/v1/core/kv_cache_manager.py
@@ -22,6 +22,7 @@ class KVCacheBlocks:
     Scheduler and KVCacheManager, to hide KVCacheManager's internal data
     structure from the Scheduler.
     """
+
     blocks: tuple[list[KVCacheBlock], ...]
     """
     `blocks[i][j]` refers to the i-th kv_cache_group
@@ -35,22 +36,20 @@ class KVCacheBlocks:
     def __add__(self, other: "KVCacheBlocks") -> "KVCacheBlocks":
         """Adds two KVCacheBlocks instances."""
         return KVCacheBlocks(
-            tuple(blk1 + blk2
-                  for blk1, blk2 in zip(self.blocks, other.blocks)))
+            tuple(blk1 + blk2 for blk1, blk2 in zip(self.blocks, other.blocks))
+        )
 
     @overload
     def get_block_ids(
         self,
         allow_none: Literal[False] = False,
-    ) -> tuple[list[int], ...]:
-        ...
+    ) -> tuple[list[int], ...]: ...
 
     @overload
     def get_block_ids(
         self,
         allow_none: Literal[True] = True,
-    ) -> Optional[tuple[list[int], ...]]:
-        ...
+    ) -> Optional[tuple[list[int], ...]]: ...
 
     def get_block_ids(
         self,
@@ -72,10 +71,7 @@ def get_block_ids(
     def get_unhashed_block_ids(self) -> list[int]:
         """Get block_ids of unhashed blocks from KVCacheBlocks instance."""
         assert len(self.blocks) == 1, "Only one group is supported"
-        return [
-            block.block_id for block in self.blocks[0]
-            if block.block_hash is None
-        ]
+        return [block.block_id for block in self.blocks[0] if block.block_hash is None]
 
     def new_empty(self) -> "KVCacheBlocks":
         """Creates a new KVCacheBlocks instance with no blocks."""
@@ -83,7 +79,6 @@ def new_empty(self) -> "KVCacheBlocks":
 
 
 class KVCacheManager:
-
     def __init__(
         self,
         kv_cache_config: KVCacheConfig,
@@ -104,12 +99,18 @@ def __init__(
 
         self.block_size: Optional[int] = None
         if self.enable_caching:
-            assert len(
-                set(g.kv_cache_spec.block_size
-                    for g in kv_cache_config.kv_cache_groups)
-            ) == 1, "Only one block size is supported for now"
+            assert (
+                len(
+                    set(
+                        g.kv_cache_spec.block_size
+                        for g in kv_cache_config.kv_cache_groups
+                    )
+                )
+                == 1
+            ), "Only one block size is supported for now"
             self.block_size = kv_cache_config.kv_cache_groups[
-                0].kv_cache_spec.block_size
+                0
+            ].kv_cache_spec.block_size
 
             if dcp_world_size > 1:
                 assert len(kv_cache_config.kv_cache_groups) == 1
@@ -151,8 +152,7 @@ def make_prefix_cache_stats(self) -> Optional[PrefixCacheStats]:
         self.prefix_cache_stats = PrefixCacheStats()
         return stats
 
-    def get_computed_blocks(self,
-                            request: Request) -> tuple[KVCacheBlocks, int]:
+    def get_computed_blocks(self, request: Request) -> tuple[KVCacheBlocks, int]:
         """Get the computed (cached) blocks for the request.
         Note that the computed blocks must be full.
 
@@ -166,9 +166,10 @@ def get_computed_blocks(self,
         """
         # Prefix caching is disabled or
         # When the request requires prompt logprobs, we skip prefix caching.
-        if (not self.enable_caching
-                or (request.sampling_params is not None
-                    and request.sampling_params.prompt_logprobs is not None)):
+        if not self.enable_caching or (
+            request.sampling_params is not None
+            and request.sampling_params.prompt_logprobs is not None
+        ):
             return self.create_empty_block_list(), 0
 
         # NOTE: When all tokens hit the cache, we must recompute the last token
@@ -179,8 +180,10 @@ def get_computed_blocks(self,
         # could slightly improve performance in the future.
         max_cache_hit_length = request.num_tokens - 1
         computed_blocks, num_new_computed_tokens = (
-            self.coordinator.find_longest_cache_hit(request.block_hashes,
-                                                    max_cache_hit_length))
+            self.coordinator.find_longest_cache_hit(
+                request.block_hashes, max_cache_hit_length
+            )
+        )
 
         if self.log_stats:
             assert self.prefix_cache_stats is not None
@@ -188,8 +191,7 @@ def get_computed_blocks(self,
                 # Previously preempted request
                 self.prefix_cache_stats.preempted_requests += 1
                 self.prefix_cache_stats.preempted_queries += request.num_tokens
-                self.prefix_cache_stats.preempted_hits += (
-                    num_new_computed_tokens)
+                self.prefix_cache_stats.preempted_hits += num_new_computed_tokens
             else:
                 # New request
                 self.prefix_cache_stats.requests += 1
@@ -250,7 +252,8 @@ def allocate_slots(
             new_computed_block_list = new_computed_blocks.blocks
         else:
             new_computed_block_list = tuple(
-                [] for _ in range(len(self.kv_cache_config.kv_cache_groups)))
+                [] for _ in range(len(self.kv_cache_config.kv_cache_groups))
+            )
 
         # Free the blocks that are skipped during the attention computation
         # (e.g., tokens outside the sliding window).
@@ -258,16 +261,17 @@ def allocate_slots(
         # insufficient free blocks.
         # Should call this function before allocating new blocks to reduce
         # the number of evicted blocks.
-        self.coordinator.remove_skipped_blocks(request.request_id,
-                                               request.num_computed_tokens)
+        self.coordinator.remove_skipped_blocks(
+            request.request_id, request.num_computed_tokens
+        )
 
         # The number of computed tokens is the number of computed tokens plus
         # the new prefix caching hits
-        num_computed_tokens = (request.num_computed_tokens +
-                               num_new_computed_tokens)
+        num_computed_tokens = request.num_computed_tokens + num_new_computed_tokens
         num_tokens_need_slot = min(
             num_computed_tokens + num_new_tokens + num_lookahead_tokens,
-            self.max_model_len)
+            self.max_model_len,
+        )
 
         num_blocks_to_allocate = self.coordinator.get_num_blocks_to_allocate(
             request_id=request.request_id,
@@ -285,16 +289,18 @@ def allocate_slots(
             self.block_pool.touch(new_computed_block_list)
         else:
             assert not any(new_computed_block_list), (
-                "Computed blocks should be empty when "
-                "prefix caching is disabled")
+                "Computed blocks should be empty when prefix caching is disabled"
+            )
 
         # Append the new computed blocks to the request blocks until now to
         # avoid the case where the new blocks cannot be allocated.
-        self.coordinator.save_new_computed_blocks(request.request_id,
-                                                  new_computed_block_list)
+        self.coordinator.save_new_computed_blocks(
+            request.request_id, new_computed_block_list
+        )
 
         new_blocks = self.coordinator.allocate_new_blocks(
-            request.request_id, num_tokens_need_slot, num_encoder_tokens)
+            request.request_id, num_tokens_need_slot, num_encoder_tokens
+        )
 
         # P/D: delay caching blocks if we have to recv from
         # remote. Update state for locally cached blocks.
@@ -305,8 +311,9 @@ def allocate_slots(
         # num_new_tokens, but must exclude "non-committable" tokens (e.g.,
         # draft tokens that could be rejected). Therefore, we cap the number
         # at `request.num_tokens`, ensuring only "finalized" tokens are cached.
-        num_tokens_to_cache = min(num_computed_tokens + num_new_tokens,
-                                  request.num_tokens)
+        num_tokens_to_cache = min(
+            num_computed_tokens + num_new_tokens, request.num_tokens
+        )
         self.coordinator.cache_blocks(request, num_tokens_to_cache)
 
         return KVCacheBlocks(new_blocks)
@@ -378,7 +385,8 @@ def get_num_common_prefix_blocks(
         """
         assert request.status == RequestStatus.RUNNING
         return self.coordinator.get_num_common_prefix_blocks(
-            request.request_id, num_running_requests)
+            request.request_id, num_running_requests
+        )
 
     def take_events(self) -> list[KVCacheEvent]:
         """Take the KV cache events from the block pool.
@@ -403,5 +411,4 @@ def cache_blocks(self, request: Request, num_computed_tokens: int) -> None:
 
     def create_empty_block_list(self) -> KVCacheBlocks:
         """Creates a new KVCacheBlocks instance with no blocks."""
-        return KVCacheBlocks(tuple([]
-                                   for _ in range(self.num_kv_cache_groups)))
+        return KVCacheBlocks(tuple([] for _ in range(self.num_kv_cache_groups)))
diff --git a/vllm/v1/core/kv_cache_utils.py b/vllm/v1/core/kv_cache_utils.py
index bbfd93413fbc..4683ad62981f 100644
--- a/vllm/v1/core/kv_cache_utils.py
+++ b/vllm/v1/core/kv_cache_utils.py
@@ -13,11 +13,16 @@
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
 from vllm.utils import GiB_bytes, cdiv, sha256_cbor
-from vllm.v1.kv_cache_interface import (ChunkedLocalAttentionSpec,
-                                        FullAttentionSpec, KVCacheConfig,
-                                        KVCacheGroupSpec, KVCacheSpec,
-                                        KVCacheTensor, SlidingWindowSpec,
-                                        UniformTypeKVCacheSpecs)
+from vllm.v1.kv_cache_interface import (
+    ChunkedLocalAttentionSpec,
+    FullAttentionSpec,
+    KVCacheConfig,
+    KVCacheGroupSpec,
+    KVCacheSpec,
+    KVCacheTensor,
+    SlidingWindowSpec,
+    UniformTypeKVCacheSpecs,
+)
 from vllm.v1.metrics.stats import PrefixCacheStats
 from vllm.v1.request import Request
 
@@ -37,16 +42,16 @@
 ExternalBlockHash = Union[bytes, int]
 
 
-def make_block_hash_with_group_id(block_hash: BlockHash,
-                                  group_id: int) -> BlockHashWithGroupId:
+def make_block_hash_with_group_id(
+    block_hash: BlockHash, group_id: int
+) -> BlockHashWithGroupId:
     """Pack a ``BlockHash`` and group id into a ``BlockHashWithGroupId``.
 
     The group id is encoded using 4 bytes in big-endian order and appended to
     the block hash bytes.  This representation avoids creating tuples while
     still allowing us to recover both components when needed.
     """
-    return BlockHashWithGroupId(block_hash +
-                                group_id.to_bytes(4, "big", signed=False))
+    return BlockHashWithGroupId(block_hash + group_id.to_bytes(4, "big", signed=False))
 
 
 def get_block_hash(key: BlockHashWithGroupId) -> BlockHash:
@@ -87,7 +92,8 @@ def init_none_hash(hash_fn: Callable[[Any], bytes]):
             "PYTHONHASHSEED is not set. This will lead to non-reproducible "
             "block-hashes when using sha256_cbor as the hash function."
             "Consider setting PYTHONHASHSEED to a fixed value for "
-            "reproducibility.")
+            "reproducibility."
+        )
 
     if hash_seed is None:
         NONE_HASH = BlockHash(os.urandom(32))
@@ -143,9 +149,10 @@ def observe(self, stats: PrefixCacheStats):
         # Remove the oldest stats until number of requests does not exceed
         # the limit.
         # NOTE: We preserve the latest added stats regardless.
-        while len(
-                self.query_queue
-        ) > 1 and self.aggregated_requests > self.max_recent_requests:
+        while (
+            len(self.query_queue) > 1
+            and self.aggregated_requests > self.max_recent_requests
+        ):
             old_requests, old_queries, old_hits = self.query_queue.popleft()
             self.aggregated_requests -= old_requests
             self.aggregated_query_total -= old_queries
@@ -169,6 +176,7 @@ def hit_rate(self) -> float:
 @dataclass
 class KVCacheBlock:
     """KV-cache block metadata."""
+
     # Block ID, ranging from 0 to num_gpu_blocks - 1.
     block_id: int
     # Reference count.
@@ -192,7 +200,8 @@ def block_hash(self) -> Optional[BlockHashWithGroupId]:
     @block_hash.setter
     def block_hash(self, block_hash: BlockHashWithGroupId):
         assert self.block_hash is None, (
-            "The block already has a hash. This should not happen.")
+            "The block already has a hash. This should not happen."
+        )
         self._block_hash = block_hash
 
     def reset_hash(self):
@@ -202,15 +211,15 @@ def reset_hash(self):
     def __repr__(self) -> str:
         # Use block_id instead of KVCacheBlock object to avoid calling __repr__
         # on KVCacheBlock object recursively.
-        prev_block_id = (self.prev_free_block.block_id
-                         if self.prev_free_block else None)
-        next_block_id = (self.next_free_block.block_id
-                         if self.next_free_block else None)
-        return (f"KVCacheBlock(block_id={self.block_id}, "
-                f"ref_cnt={self.ref_cnt}, "
-                f"_block_hash={self._block_hash!r}, "
-                f"prev_free_block={prev_block_id}, "
-                f"next_free_block={next_block_id})")
+        prev_block_id = self.prev_free_block.block_id if self.prev_free_block else None
+        next_block_id = self.next_free_block.block_id if self.next_free_block else None
+        return (
+            f"KVCacheBlock(block_id={self.block_id}, "
+            f"ref_cnt={self.ref_cnt}, "
+            f"_block_hash={self._block_hash!r}, "
+            f"prev_free_block={prev_block_id}, "
+            f"next_free_block={next_block_id})"
+        )
 
 
 class FreeKVCacheBlockQueue:
@@ -271,12 +280,14 @@ def popleft(self) -> KVCacheBlock:
         Returns:
             The first free block.
         """
-        if (self.fake_free_list_head.next_free_block
-                is self.fake_free_list_tail
-                or self.fake_free_list_head.next_free_block is None):
+        if (
+            self.fake_free_list_head.next_free_block is self.fake_free_list_tail
+            or self.fake_free_list_head.next_free_block is None
+        ):
             assert self.num_free_blocks == 0, (
                 f"num_free_blocks ({self.num_free_blocks}) is out of sync "
-                "with the free list.")
+                "with the free list."
+            )
             raise ValueError("No free blocks available")
 
         first_block: KVCacheBlock = self.fake_free_list_head.next_free_block
@@ -284,8 +295,10 @@ def popleft(self) -> KVCacheBlock:
         if first_block.next_free_block is None:
             # This should not happen if the block is from the free list.
             # It indicates a bug in the caller's logic.
-            raise RuntimeError("Invalid block found in popleft() "
-                               "which doesn't have a valid next_free_block")
+            raise RuntimeError(
+                "Invalid block found in popleft() "
+                "which doesn't have a valid next_free_block"
+            )
 
         # Connect fake_head and the next block of first_block (i.e. second block
         # or fake tail).
@@ -360,7 +373,8 @@ def append(self, block: KVCacheBlock) -> None:
         """
         if self.fake_free_list_tail.prev_free_block is None:
             raise RuntimeError(
-                "prev_free_block of fake_free_list_tail should always exist")
+                "prev_free_block of fake_free_list_tail should always exist"
+            )
         last_block: KVCacheBlock = self.fake_free_list_tail.prev_free_block
 
         # Connect the new block after the last block.
@@ -384,7 +398,8 @@ def append_n(self, blocks: list[KVCacheBlock]) -> None:
 
         last_block = self.fake_free_list_tail.prev_free_block
         assert last_block is not None, (
-            "prev_free_block of fake_free_list_tail should always exist")
+            "prev_free_block of fake_free_list_tail should always exist"
+        )
         # Add inter-connections between consecutive blocks
         for block in blocks:
             block.prev_free_block = last_block
@@ -406,7 +421,8 @@ def get_all_free_blocks(self) -> list[KVCacheBlock]:
         ret = []
         if self.fake_free_list_head.next_free_block is None:
             raise RuntimeError(
-                "next_free_block of fake_free_list_head should always exist")
+                "next_free_block of fake_free_list_head should always exist"
+            )
         # Start from the first block
         curr_block: KVCacheBlock = self.fake_free_list_head.next_free_block
         # As long as next_free_block is available, we haven't reached to
@@ -430,14 +446,16 @@ def need_extra_keys(request: Request) -> bool:
     # Multimodal requests need to include the MM hash.
     # LoRA requests need to include the LoRA ID.
     # Request with provided cache salt need to include the salt.
-    return bool(request.mm_features) or (request.lora_request
-                                         is not None) or (request.cache_salt
-                                                          is not None)
+    return (
+        bool(request.mm_features)
+        or (request.lora_request is not None)
+        or (request.cache_salt is not None)
+    )
 
 
-def _gen_mm_extra_hash_keys(request: Request, start_token_idx: int,
-                            end_token_idx: int,
-                            start_mm_idx: int) -> tuple[list[Any], int]:
+def _gen_mm_extra_hash_keys(
+    request: Request, start_token_idx: int, end_token_idx: int, start_mm_idx: int
+) -> tuple[list[Any], int]:
     """Generate extra keys related to MultiModal request for block hash
     computation. For multi-modal inputs, the extra keys are
     (mm_hash, start_offset) that indicate a mm input contained in the
@@ -515,8 +533,8 @@ def _gen_lora_extra_hash_keys(request: Request) -> list[int]:
 
 
 def generate_block_hash_extra_keys(
-        request: Request, start_token_idx: int, end_token_idx: int,
-        start_mm_idx: int) -> tuple[Optional[tuple[Any, ...]], int]:
+    request: Request, start_token_idx: int, end_token_idx: int, start_mm_idx: int
+) -> tuple[Optional[tuple[Any, ...]], int]:
     """Generate extra keys for the block hash. The extra keys can come from
     the multi-modal inputs and request specific metadata (e.g., LoRA ID).
 
@@ -531,10 +549,12 @@ def generate_block_hash_extra_keys(
     """
     mm_extra_keys: list[Any]
     mm_extra_keys, new_start_mm_idx = _gen_mm_extra_hash_keys(
-        request, start_token_idx, end_token_idx, start_mm_idx)
+        request, start_token_idx, end_token_idx, start_mm_idx
+    )
     lora_extra_keys: list[int] = _gen_lora_extra_hash_keys(request)
-    cache_salt_keys: list[str] = [request.cache_salt] if (
-        start_token_idx == 0 and request.cache_salt) else []
+    cache_salt_keys: list[str] = (
+        [request.cache_salt] if (start_token_idx == 0 and request.cache_salt) else []
+    )
 
     extra_keys: list[Any] = lora_extra_keys + mm_extra_keys + cache_salt_keys
 
@@ -545,10 +565,11 @@ def generate_block_hash_extra_keys(
 
 
 def hash_block_tokens(
-        hash_function: Callable[[Any], bytes],
-        parent_block_hash: Optional[BlockHash],
-        curr_block_token_ids: Sequence[int],
-        extra_keys: Optional[tuple[Any, ...]] = None) -> BlockHash:
+    hash_function: Callable[[Any], bytes],
+    parent_block_hash: Optional[BlockHash],
+    curr_block_token_ids: Sequence[int],
+    extra_keys: Optional[tuple[Any, ...]] = None,
+) -> BlockHash:
     """Computes a hash value corresponding to the contents of a block and
     the contents of the preceding block(s). The hash value is used for
     prefix caching. We use LRU cache for this function to avoid recomputing
@@ -569,8 +590,8 @@ def hash_block_tokens(
 
     curr_block_token_ids_tuple = tuple(curr_block_token_ids)
     return BlockHash(
-        hash_function(
-            (parent_block_hash, curr_block_token_ids_tuple, extra_keys)))
+        hash_function((parent_block_hash, curr_block_token_ids_tuple, extra_keys))
+    )
 
 
 def get_request_block_hasher(
@@ -597,8 +618,9 @@ def request_block_hasher(request: Request) -> list[BlockHash]:
             # last mm input.
             curr_mm_idx = -1
 
-        prev_block_hash_value = (request.block_hashes[-1]
-                                 if request.block_hashes else None)
+        prev_block_hash_value = (
+            request.block_hashes[-1] if request.block_hashes else None
+        )
         new_block_hashes: list[BlockHash] = []
         while True:
             end_token_idx = start_token_idx + block_size
@@ -608,13 +630,14 @@ def request_block_hasher(request: Request) -> list[BlockHash]:
 
             # MM and LoRA requests need extra keys for block-hash computation.
             extra_keys, curr_mm_idx = generate_block_hash_extra_keys(
-                request, start_token_idx, end_token_idx, curr_mm_idx)
+                request, start_token_idx, end_token_idx, curr_mm_idx
+            )
 
             # Compute the hash of the current block
             block_tokens = request.all_token_ids[start_token_idx:end_token_idx]
-            block_hash = hash_block_tokens(caching_hash_fn,
-                                           prev_block_hash_value, block_tokens,
-                                           extra_keys)
+            block_hash = hash_block_tokens(
+                caching_hash_fn, prev_block_hash_value, block_tokens, extra_keys
+            )
 
             new_block_hashes.append(block_hash)
             start_token_idx += block_size
@@ -625,18 +648,20 @@ def request_block_hasher(request: Request) -> list[BlockHash]:
     return request_block_hasher
 
 
-def max_memory_usage_bytes(vllm_config: VllmConfig,
-                           kv_cache_specs: Iterable[KVCacheSpec]) -> int:
+def max_memory_usage_bytes(
+    vllm_config: VllmConfig, kv_cache_specs: Iterable[KVCacheSpec]
+) -> int:
     """
     Get the maximum memory usage in bytes for the given KV cache specs.
     """
-    return sum(
-        spec.max_memory_usage_bytes(vllm_config) for spec in kv_cache_specs)
+    return sum(spec.max_memory_usage_bytes(vllm_config) for spec in kv_cache_specs)
 
 
-def estimate_max_model_len(vllm_config: VllmConfig,
-                           kv_cache_spec: dict[str, KVCacheSpec],
-                           available_memory: int) -> int:
+def estimate_max_model_len(
+    vllm_config: VllmConfig,
+    kv_cache_spec: dict[str, KVCacheSpec],
+    available_memory: int,
+) -> int:
     """
     Estimates the maximum model length that can fit in the available memory
     using binary search.
@@ -655,8 +680,7 @@ def fits_in_memory(model_len: int) -> bool:
         # Modify the max_model_len for this calculation
         vllm_config.model_config.max_model_len = model_len
         # Calculate memory needed for the given model length
-        memory_needed = max_memory_usage_bytes(vllm_config,
-                                               kv_cache_spec.values())
+        memory_needed = max_memory_usage_bytes(vllm_config, kv_cache_spec.values())
         return memory_needed <= available_memory
 
     # Binary search for the maximum model length
@@ -679,9 +703,11 @@ def fits_in_memory(model_len: int) -> bool:
     return result
 
 
-def check_enough_kv_cache_memory(vllm_config: VllmConfig,
-                                 kv_cache_spec: dict[str, KVCacheSpec],
-                                 available_memory: int):
+def check_enough_kv_cache_memory(
+    vllm_config: VllmConfig,
+    kv_cache_spec: dict[str, KVCacheSpec],
+    available_memory: int,
+):
     """
     Checks whether `available_memory` is enough for the KV cache to hold at
     least one request with the model's max_model_len.
@@ -700,36 +726,41 @@ def check_enough_kv_cache_memory(vllm_config: VllmConfig,
         return
 
     if available_memory <= 0:
-        raise ValueError("No available memory for the cache blocks. "
-                         "Try increasing `gpu_memory_utilization` when "
-                         "initializing the engine.")
+        raise ValueError(
+            "No available memory for the cache blocks. "
+            "Try increasing `gpu_memory_utilization` when "
+            "initializing the engine."
+        )
 
     max_model_len = vllm_config.model_config.max_model_len
     needed_memory = max_memory_usage_bytes(vllm_config, kv_cache_spec.values())
 
     if needed_memory > available_memory:
         # Estimate the maximum model length that can fit in the available memory
-        estimated_max_len = estimate_max_model_len(vllm_config, kv_cache_spec,
-                                                   available_memory)
+        estimated_max_len = estimate_max_model_len(
+            vllm_config, kv_cache_spec, available_memory
+        )
         estimated_msg = ""
         if estimated_max_len > 0:
             estimated_msg = (
                 "Based on the available memory, "
-                f"the estimated maximum model length is {estimated_max_len}.")
+                f"the estimated maximum model length is {estimated_max_len}."
+            )
 
         raise ValueError(
             f"To serve at least one request with the models's max seq len "
-            f"({max_model_len}), ({needed_memory/GiB_bytes:.2f} GiB KV "
+            f"({max_model_len}), ({needed_memory / GiB_bytes:.2f} GiB KV "
             f"cache is needed, which is larger than the available KV cache "
-            f"memory ({available_memory/GiB_bytes:.2f} GiB). "
+            f"memory ({available_memory / GiB_bytes:.2f} GiB). "
             f"{estimated_msg} "
             f"Try increasing `gpu_memory_utilization` or decreasing "
-            f"`max_model_len` when initializing the engine.")
+            f"`max_model_len` when initializing the engine."
+        )
 
 
 def create_kv_cache_group_specs(
-        kv_cache_spec: dict[str, KVCacheSpec],
-        grouped_layer_names: list[list[str]]) -> list[KVCacheGroupSpec]:
+    kv_cache_spec: dict[str, KVCacheSpec], grouped_layer_names: list[list[str]]
+) -> list[KVCacheGroupSpec]:
     """
     Create KVCacheGroupSpec object for each kv cache group layer.
     The layers in the same group should share the same
@@ -752,7 +783,8 @@ def create_kv_cache_group_specs(
         ]
         merged_layer_spec = layer_specs[0].merge(layer_specs)
         kv_cache_groups.append(
-            KVCacheGroupSpec(layer_names_one_group, merged_layer_spec))
+            KVCacheGroupSpec(layer_names_one_group, merged_layer_spec)
+        )
     return kv_cache_groups
 
 
@@ -782,19 +814,22 @@ def is_kv_cache_spec_uniform(kv_cache_spec: dict[str, KVCacheSpec]) -> bool:
 
 
 def get_max_concurrency_for_kv_cache_config(
-        vllm_config: VllmConfig, kv_cache_config: KVCacheConfig) -> float:
+    vllm_config: VllmConfig, kv_cache_config: KVCacheConfig
+) -> float:
     """
     Get the maximum concurrency for the given KV cache configuration.
     """
     num_layer_per_group = max(
-        len(group.layer_names) for group in kv_cache_config.kv_cache_groups)
+        len(group.layer_names) for group in kv_cache_config.kv_cache_groups
+    )
     max_memory_usage_per_request = num_layer_per_group * max_memory_usage_bytes(
-        vllm_config,
-        (group.kv_cache_spec for group in kv_cache_config.kv_cache_groups))
-    memory_per_block = kv_cache_config.kv_cache_groups[
-        0].kv_cache_spec.page_size_bytes * num_layer_per_group
-    num_block_per_request = cdiv(max_memory_usage_per_request,
-                                 memory_per_block)
+        vllm_config, (group.kv_cache_spec for group in kv_cache_config.kv_cache_groups)
+    )
+    memory_per_block = (
+        kv_cache_config.kv_cache_groups[0].kv_cache_spec.page_size_bytes
+        * num_layer_per_group
+    )
+    num_block_per_request = cdiv(max_memory_usage_per_request, memory_per_block)
     max_concurrency = kv_cache_config.num_blocks / num_block_per_request
     return max_concurrency
 
@@ -804,18 +839,20 @@ def may_override_num_blocks(vllm_config: VllmConfig, num_blocks: int) -> int:
     Override the number of kv cache blocks if `num_gpu_blocks_override` is set.
     """
     if vllm_config.cache_config.num_gpu_blocks_override is not None:
-        num_gpu_blocks_override = \
-            vllm_config.cache_config.num_gpu_blocks_override
+        num_gpu_blocks_override = vllm_config.cache_config.num_gpu_blocks_override
         logger.info(
-            "Overriding num_gpu_blocks=%d with "
-            "num_gpu_blocks_override=%d", num_blocks, num_gpu_blocks_override)
+            "Overriding num_gpu_blocks=%d with num_gpu_blocks_override=%d",
+            num_blocks,
+            num_gpu_blocks_override,
+        )
         num_blocks = num_gpu_blocks_override
 
     return num_blocks
 
 
-def get_num_blocks(vllm_config: VllmConfig, num_layers: int,
-                   available_memory: int, page_size: int) -> int:
+def get_num_blocks(
+    vllm_config: VllmConfig, num_layers: int, available_memory: int, page_size: int
+) -> int:
     """
     Get the number of kv cache blocks.
 
@@ -841,9 +878,10 @@ def get_uniform_page_size(kv_cache_spec: dict[str, KVCacheSpec]) -> int:
 
 
 def _get_kv_cache_groups_uniform_spec(
-        kv_cache_specs: dict[str, KVCacheSpec]) -> list[KVCacheGroupSpec]:
+    kv_cache_specs: dict[str, KVCacheSpec],
+) -> list[KVCacheGroupSpec]:
     """
-    Generates the KV cache configuration for a model with the same KV cache 
+    Generates the KV cache configuration for a model with the same KV cache
     spec for all layers.
 
     Args:
@@ -853,12 +891,12 @@ def _get_kv_cache_groups_uniform_spec(
         The generated KVCacheGroupSpecs
     """
 
-    return create_kv_cache_group_specs(kv_cache_specs,
-                                       [list(kv_cache_specs.keys())])
+    return create_kv_cache_group_specs(kv_cache_specs, [list(kv_cache_specs.keys())])
 
 
 def _get_kv_cache_groups_uniform_type(
-        spec: UniformTypeKVCacheSpecs) -> list[KVCacheGroupSpec]:
+    spec: UniformTypeKVCacheSpecs,
+) -> list[KVCacheGroupSpec]:
     """
     Generates the KV cache configuration for a model with one type of KV cache
     but different hidden sizes. All layers are merged into one group.
@@ -873,8 +911,7 @@ def _get_kv_cache_groups_uniform_type(
     return [KVCacheGroupSpec(list(spec.kv_cache_specs.keys()), spec)]
 
 
-def is_kv_cache_page_size_uniform(
-        kv_cache_spec: dict[str, KVCacheSpec]) -> bool:
+def is_kv_cache_page_size_uniform(kv_cache_spec: dict[str, KVCacheSpec]) -> bool:
     """
     Whether all layers in the given KVCacheSpec have the same page size.
     Args:
@@ -888,70 +925,69 @@ def is_kv_cache_page_size_uniform(
     return len(page_sizes) == 1
 
 
-def is_kv_cache_type_attention_free(
-        kv_cache_spec: dict[str, KVCacheSpec]) -> bool:
-
+def is_kv_cache_type_attention_free(kv_cache_spec: dict[str, KVCacheSpec]) -> bool:
     # kv_cache_spec is an empty dict for attention free models
     return not kv_cache_spec
 
 
 def _get_kv_cache_groups_uniform_page_size(
-        kv_cache_spec: dict[str, KVCacheSpec]) -> list[KVCacheGroupSpec]:
+    kv_cache_spec: dict[str, KVCacheSpec],
+) -> list[KVCacheGroupSpec]:
     """
-    Generates the KV cache groups for hybrid models with multiple 
-    attention types but still with a uniform page size (physical memory per 
+    Generates the KV cache groups for hybrid models with multiple
+    attention types but still with a uniform page size (physical memory per
     block per layer) for all layers.
 
     Detailed explanation about kv cache management of hybrid models:
     The layers in the models are repeated with some patterns, e.g., a model
     with 10 full attention layers and 20 sliding window attention layers can be
-    regarded as repeating the pattern (1 * full, 2 * sw) 10 times. 
+    regarded as repeating the pattern (1 * full, 2 * sw) 10 times.
     The KVCacheManager allocates different block tables for each of the 3 layers
-    in the pattern, and repeats each of them 10 times to generate the 
+    in the pattern, and repeats each of them 10 times to generate the
     block_table for the 30 layers in the model.
     Therefore, we can group the layers in the model into 3 kv_cache_groups, each
     of which contains 10 layers in the model.
     The KVCacheManager allocates the block_table for each group based on its
-    kv_cache spec, and the model runner applies the block table to each layer 
+    kv_cache spec, and the model runner applies the block table to each layer
     in the group.
     For example:
-    1. A model only uses full attention. The pattern is 
-    (num_hidden_layers * full), so there is only one group and the block table 
-    is shared by all layers. It is already handled by 
+    1. A model only uses full attention. The pattern is
+    (num_hidden_layers * full), so there is only one group and the block table
+    is shared by all layers. It is already handled by
     `_get_kv_cache_config_uniform_type`.
-    2. A model with 10 full attention layers and 20 sliding window 
-    attention layers. There are 3 layers in the pattern (1 * full, 2 * sw), so 
+    2. A model with 10 full attention layers and 20 sliding window
+    attention layers. There are 3 layers in the pattern (1 * full, 2 * sw), so
     there are 3 kv_cache_groups, each of which represents 10 layers.
 
     To simplify the implementation, we make the following assumptions:
-    1. Physical memory per block: Must be the same across all KV cache groups. 
+    1. Physical memory per block: Must be the same across all KV cache groups.
     Breaking this assumption is non-trivial due to memory fragmentation concerns
     when allocating blocks of different sizes.
-    2. Tokens per block (block_size): Currently, we directly use 
-    `CacheConfig.block_size` for all layers. It can be extended to vary by KV 
-    cache group, but within each KV cache group, all layers must share the same 
+    2. Tokens per block (block_size): Currently, we directly use
+    `CacheConfig.block_size` for all layers. It can be extended to vary by KV
+    cache group, but within each KV cache group, all layers must share the same
     block size.
-    3. Physical memory per token per layer: This property is decided by model 
-    config. Currently we only support models that have the same physical memory 
-    per token per layer for all layers. Can be relaxed with a simple extension, 
+    3. Physical memory per token per layer: This property is decided by model
+    config. Currently we only support models that have the same physical memory
+    per token per layer for all layers. Can be relaxed with a simple extension,
     but still need to keep physical memory per block the same for all groups.
-    4. Number of layers per group: Currently assumed the same for all layers. 
-    Can be relaxed with a simple extension, but still need to keep physical 
+    4. Number of layers per group: Currently assumed the same for all layers.
+    Can be relaxed with a simple extension, but still need to keep physical
     memory per block the same for all groups.
     5. Attention type within groups: All layers in a group must share the same
-    attention type. One exception is that, when 
-    `--disable-hybrid-kv-cache-manager` is true, the single group for full 
-    attention layers may also include attention layers using sliding window or 
+    attention type. One exception is that, when
+    `--disable-hybrid-kv-cache-manager` is true, the single group for full
+    attention layers may also include attention layers using sliding window or
     LLaMA 4 local attention. See `unify_hybrid_kv_cache_specs` for more details.
-    6. Support for multiple attention types: The design for most components is 
-    general to an arbitrary number of attention types. But 
-    `find_longest_cache_hit` only supports one attention type or two 
+    6. Support for multiple attention types: The design for most components is
+    general to an arbitrary number of attention types. But
+    `find_longest_cache_hit` only supports one attention type or two
     types of full-attention plus exactly one another type. The general
-    implementation of this function is feasible but we don't know how to 
+    implementation of this function is feasible but we don't know how to
     implement it cleanly yet.
 
-    As we assume tokens per block, physical memory per token per layer, and 
-    number of layers per group are the same now, we can ensure that physical 
+    As we assume tokens per block, physical memory per token per layer, and
+    number of layers per group are the same now, we can ensure that physical
     memory per block is the same for all groups.
 
     Args:
@@ -1005,10 +1041,12 @@ def _get_kv_cache_groups_uniform_page_size(
     return create_kv_cache_group_specs(kv_cache_spec, grouped_layers)
 
 
-def get_kv_cache_config_from_groups(vllm_config: VllmConfig,
-                                    kv_cache_groups: list[KVCacheGroupSpec],
-                                    kv_cache_specs: dict[str, KVCacheSpec],
-                                    available_memory: int) -> KVCacheConfig:
+def get_kv_cache_config_from_groups(
+    vllm_config: VllmConfig,
+    kv_cache_groups: list[KVCacheGroupSpec],
+    kv_cache_specs: dict[str, KVCacheSpec],
+    available_memory: int,
+) -> KVCacheConfig:
     """
     Generate the KV cache configuration from the KV cache groups and spec
     of each layer.
@@ -1031,19 +1069,22 @@ def get_kv_cache_config_from_groups(vllm_config: VllmConfig,
         )
 
     # Determine how model runners should initialize the KV cache tensors.
-    if len(kv_cache_groups) == 1 and \
-        isinstance(kv_cache_groups[0].kv_cache_spec, UniformTypeKVCacheSpecs):
+    if len(kv_cache_groups) == 1 and isinstance(
+        kv_cache_groups[0].kv_cache_spec, UniformTypeKVCacheSpecs
+    ):
         # Special case: all layers have the same type of KV cache but with
         # different hidden size. Allocate different amount of memory for each
         # layer based on its hidden size.
-        num_blocks = available_memory // kv_cache_groups[
-            0].kv_cache_spec.page_size_bytes
+        num_blocks = (
+            available_memory // kv_cache_groups[0].kv_cache_spec.page_size_bytes
+        )
         num_blocks = may_override_num_blocks(vllm_config, num_blocks)
         per_layer_specs = kv_cache_groups[0].kv_cache_spec.kv_cache_specs
         kv_cache_tensors = [
-            KVCacheTensor(size=per_layer_specs[layer_name].page_size_bytes *
-                          num_blocks,
-                          shared_by=[layer_name])
+            KVCacheTensor(
+                size=per_layer_specs[layer_name].page_size_bytes * num_blocks,
+                shared_by=[layer_name],
+            )
             for layer_name in kv_cache_groups[0].layer_names
         ]
     else:
@@ -1059,8 +1100,9 @@ def get_kv_cache_config_from_groups(vllm_config: VllmConfig,
 
         page_size = get_uniform_page_size(kv_cache_specs)
         assert group_size > 0, "group_size must be greater than 0"
-        num_blocks = get_num_blocks(vllm_config, group_size, available_memory,
-                                    page_size)
+        num_blocks = get_num_blocks(
+            vllm_config, group_size, available_memory, page_size
+        )
         kv_cache_tensors = []
         for i in range(group_size):
             shared_by = []
@@ -1068,8 +1110,8 @@ def get_kv_cache_config_from_groups(vllm_config: VllmConfig,
                 if i < len(kv_cache_groups[j].layer_names):
                     shared_by.append(kv_cache_groups[j].layer_names[i])
             kv_cache_tensors.append(
-                KVCacheTensor(size=page_size * num_blocks,
-                              shared_by=shared_by))
+                KVCacheTensor(size=page_size * num_blocks, shared_by=shared_by)
+            )
 
     kv_cache_config = KVCacheConfig(
         num_blocks=num_blocks,
@@ -1077,8 +1119,7 @@ def get_kv_cache_config_from_groups(vllm_config: VllmConfig,
         kv_cache_groups=kv_cache_groups,
     )
 
-    min_block_size = min(
-        [group.kv_cache_spec.block_size for group in kv_cache_groups])
+    min_block_size = min([group.kv_cache_spec.block_size for group in kv_cache_groups])
 
     # Print the KV cache size and maximum concurrency.
     num_tokens = num_blocks // len(kv_cache_groups) * min_block_size
@@ -1086,14 +1127,19 @@ def get_kv_cache_config_from_groups(vllm_config: VllmConfig,
         num_tokens *= vllm_config.parallel_config.decode_context_parallel_size
         logger.info(
             "Multiplying the GPU KV cache size by the dcp_world_size %d.",
-            vllm_config.parallel_config.decode_context_parallel_size)
+            vllm_config.parallel_config.decode_context_parallel_size,
+        )
     num_tokens_str = f"{num_tokens:,}"
     logger.info("GPU KV cache size: %s tokens", num_tokens_str)
     max_model_len_str = f"{vllm_config.model_config.max_model_len:,}"
     max_concurrency = get_max_concurrency_for_kv_cache_config(
-        vllm_config, kv_cache_config)
-    logger.info("Maximum concurrency for %s tokens per request: %.2fx",
-                max_model_len_str, max_concurrency)
+        vllm_config, kv_cache_config
+    )
+    logger.info(
+        "Maximum concurrency for %s tokens per request: %.2fx",
+        max_model_len_str,
+        max_concurrency,
+    )
     return kv_cache_config
 
 
@@ -1108,25 +1154,27 @@ def unify_hybrid_kv_cache_specs(kv_cache_spec: dict[str, KVCacheSpec]):
     """
 
     if is_kv_cache_spec_uniform(
-            kv_cache_spec) or UniformTypeKVCacheSpecs.is_uniform_type(
-                kv_cache_spec):
+        kv_cache_spec
+    ) or UniformTypeKVCacheSpecs.is_uniform_type(kv_cache_spec):
         return
 
     logger.warning(
         "Hybrid KV cache manager is disabled for this hybrid model, "
         "This means we do not enable any optimizations for saving KV cache "
         "memory (e.g., dropping the KV cache outside the sliding window). "
-        "The compute of layers like sliding window is still saved.")
+        "The compute of layers like sliding window is still saved."
+    )
 
     has_full_attention = any(
-        isinstance(spec, FullAttentionSpec) for spec in kv_cache_spec.values())
+        isinstance(spec, FullAttentionSpec) for spec in kv_cache_spec.values()
+    )
     has_sliding_window = any(
-        isinstance(spec, SlidingWindowSpec) for spec in kv_cache_spec.values())
+        isinstance(spec, SlidingWindowSpec) for spec in kv_cache_spec.values()
+    )
     has_chunked_local_attention = any(
-        isinstance(spec, ChunkedLocalAttentionSpec)
-        for spec in kv_cache_spec.values())
-    if has_full_attention and (has_sliding_window
-                               or has_chunked_local_attention):
+        isinstance(spec, ChunkedLocalAttentionSpec) for spec in kv_cache_spec.values()
+    )
+    if has_full_attention and (has_sliding_window or has_chunked_local_attention):
         for layer_name, spec in kv_cache_spec.items():
             if isinstance(spec, SlidingWindowSpec):
                 kv_cache_spec[layer_name] = FullAttentionSpec(
@@ -1145,15 +1193,19 @@ def unify_hybrid_kv_cache_specs(kv_cache_spec: dict[str, KVCacheSpec]):
                     attention_chunk_size=spec.attention_chunk_size,
                 )
 
-    if not (is_kv_cache_spec_uniform(kv_cache_spec)
-            or UniformTypeKVCacheSpecs.is_uniform_type(kv_cache_spec)):
-        raise ValueError("Hybrid KV cache manager is disabled but failed to "
-                         "convert the KV cache specs to one unified type.")
+    if not (
+        is_kv_cache_spec_uniform(kv_cache_spec)
+        or UniformTypeKVCacheSpecs.is_uniform_type(kv_cache_spec)
+    ):
+        raise ValueError(
+            "Hybrid KV cache manager is disabled but failed to "
+            "convert the KV cache specs to one unified type."
+        )
 
 
 def get_kv_cache_groups(
-        vllm_config: VllmConfig,
-        kv_cache_spec: dict[str, KVCacheSpec]) -> list[KVCacheGroupSpec]:
+    vllm_config: VllmConfig, kv_cache_spec: dict[str, KVCacheSpec]
+) -> list[KVCacheGroupSpec]:
     """
     Split the layers in the model into groups with the same KV cache spec.
 
@@ -1192,14 +1244,14 @@ def get_kv_cache_groups(
 
 
 def generate_scheduler_kv_cache_config(
-        kv_cache_configs: list[KVCacheConfig]) -> KVCacheConfig:
+    kv_cache_configs: list[KVCacheConfig],
+) -> KVCacheConfig:
     """
     Generate the KV cache configuration for the scheduler.
     """
-    assert all([
-        cfg.num_blocks == kv_cache_configs[0].num_blocks
-        for cfg in kv_cache_configs
-    ])
+    assert all(
+        [cfg.num_blocks == kv_cache_configs[0].num_blocks for cfg in kv_cache_configs]
+    )
     # All workers have the same kv_cache_config except layer names, so use
     # an arbitrary one to initialize the scheduler.
     cfg = copy.deepcopy(kv_cache_configs[0])
@@ -1208,15 +1260,18 @@ def generate_scheduler_kv_cache_config(
             # All layers in the UniformTypeKVCacheSpecs have the same type,
             # so use an arbitrary one to initialize the scheduler.
             group.kv_cache_spec = next(
-                iter(group.kv_cache_spec.kv_cache_specs.values()))
+                iter(group.kv_cache_spec.kv_cache_specs.values())
+            )
     return cfg
 
 
-def get_kv_cache_configs(vllm_config: VllmConfig,
-                         kv_cache_specs: list[dict[str, KVCacheSpec]],
-                         available_memory: list[int]) -> list[KVCacheConfig]:
+def get_kv_cache_configs(
+    vllm_config: VllmConfig,
+    kv_cache_specs: list[dict[str, KVCacheSpec]],
+    available_memory: list[int],
+) -> list[KVCacheConfig]:
     """
-    Generates the KV cache configurations for a model. 
+    Generates the KV cache configurations for a model.
     Since we use a shared centralized controller for all workers, we need the
     `kv_cache_config` to be consistent across all workers to make sure
     the KV cache allocation can be applied to all workers. However, different
@@ -1235,7 +1290,7 @@ def get_kv_cache_configs(vllm_config: VllmConfig,
         vllm_config: The global VllmConfig
         kv_cache_specs: List of dict[layer_name, KVCacheSpec] for each worker.
         available_memory: Memory available for KV cache in bytes for each
-            worker. 
+            worker.
 
     Returns:
         The generated KVCacheConfigs for each worker.
@@ -1243,9 +1298,11 @@ def get_kv_cache_configs(vllm_config: VllmConfig,
 
     # Check if the available memory is enough for each worker.
     for kv_cache_spec_one_worker, available_memory_one_worker in zip(
-            kv_cache_specs, available_memory):
-        check_enough_kv_cache_memory(vllm_config, kv_cache_spec_one_worker,
-                                     available_memory_one_worker)
+        kv_cache_specs, available_memory
+    ):
+        check_enough_kv_cache_memory(
+            vllm_config, kv_cache_spec_one_worker, available_memory_one_worker
+        )
 
     # Merge the KV cache specs of all workers. Different PP stages may have
     # different layer names, and different TP ranks of the same PP stage should
@@ -1258,37 +1315,42 @@ def get_kv_cache_configs(vllm_config: VllmConfig,
             else:
                 assert merged_kv_cache_specs[layer_name] == layer_spec, (
                     "The KV cache specs for the same layer are different "
-                    "across workers. This is not supported yet.")
-    global_kv_cache_groups = get_kv_cache_groups(vllm_config,
-                                                 merged_kv_cache_specs)
+                    "across workers. This is not supported yet."
+                )
+    global_kv_cache_groups = get_kv_cache_groups(vllm_config, merged_kv_cache_specs)
 
     kv_cache_configs: list[KVCacheConfig] = []
     for kv_cache_spec_one_worker, available_memory_one_worker in zip(
-            kv_cache_specs, available_memory):
+        kv_cache_specs, available_memory
+    ):
         kv_cache_groups_one_worker: list[KVCacheGroupSpec] = []
         for group in global_kv_cache_groups:
             group_layer_names_one_worker = [
-                layer_name for layer_name in group.layer_names
+                layer_name
+                for layer_name in group.layer_names
                 if layer_name in kv_cache_spec_one_worker
             ]
             kv_cache_groups_one_worker.append(
-                KVCacheGroupSpec(group_layer_names_one_worker,
-                                 group.kv_cache_spec))
+                KVCacheGroupSpec(group_layer_names_one_worker, group.kv_cache_spec)
+            )
         assert sum(
-            len(group.layer_names) for group in
-            kv_cache_groups_one_worker) == len(kv_cache_spec_one_worker), (
-                "Some layers are not assigned to any group.")
+            len(group.layer_names) for group in kv_cache_groups_one_worker
+        ) == len(kv_cache_spec_one_worker), "Some layers are not assigned to any group."
         kv_cache_configs.append(
-            get_kv_cache_config_from_groups(vllm_config,
-                                            kv_cache_groups_one_worker,
-                                            kv_cache_spec_one_worker,
-                                            available_memory_one_worker))
+            get_kv_cache_config_from_groups(
+                vllm_config,
+                kv_cache_groups_one_worker,
+                kv_cache_spec_one_worker,
+                available_memory_one_worker,
+            )
+        )
 
     # Change the num_blocks of each rank to the smallest among all ranks. We
     # do not need to shrink the tensor size because it is valid to only use the
     # first `num_blocks` blocks of the tensor.
-    min_num_blocks = min(kv_cache_config.num_blocks
-                         for kv_cache_config in kv_cache_configs)
+    min_num_blocks = min(
+        kv_cache_config.num_blocks for kv_cache_config in kv_cache_configs
+    )
     for kv_cache_config in kv_cache_configs:
         kv_cache_config.num_blocks = min_num_blocks
 
diff --git a/vllm/v1/core/sched/async_scheduler.py b/vllm/v1/core/sched/async_scheduler.py
index 74ff6261732c..968b4db530bf 100644
--- a/vllm/v1/core/sched/async_scheduler.py
+++ b/vllm/v1/core/sched/async_scheduler.py
@@ -12,7 +12,6 @@
 
 
 class AsyncScheduler(Scheduler):
-
     def _update_after_schedule(
         self,
         scheduler_output: SchedulerOutput,
@@ -20,8 +19,10 @@ def _update_after_schedule(
         super()._update_after_schedule(scheduler_output)
         for req_id in scheduler_output.num_scheduled_tokens:
             request = self.requests[req_id]
-            if (request.num_computed_tokens == request.num_tokens +
-                    request.num_output_placeholders):
+            if (
+                request.num_computed_tokens
+                == request.num_tokens + request.num_output_placeholders
+            ):
                 # The request will generate a new token in this scheduling step.
                 # TODO(woosuk): Support speculative decoding.
                 request.num_output_placeholders += 1
@@ -33,7 +34,8 @@ def _update_request_with_output(
     ) -> tuple[list[int], bool]:
         status_before_update = request.status
         new_token_ids, stopped = super()._update_request_with_output(
-            request, new_token_ids)
+            request, new_token_ids
+        )
 
         # Update the number of output placeholders.
         request.num_output_placeholders -= len(new_token_ids)
@@ -42,6 +44,6 @@ def _update_request_with_output(
         # Cache the new tokens. Preempted requests should be skipped.
         if status_before_update == RequestStatus.RUNNING:
             self.kv_cache_manager.cache_blocks(
-                request,
-                request.num_computed_tokens - request.num_output_placeholders)
+                request, request.num_computed_tokens - request.num_output_placeholders
+            )
         return new_token_ids, stopped
diff --git a/vllm/v1/core/sched/interface.py b/vllm/v1/core/sched/interface.py
index 5b1de3a66ceb..b92ef395e9b7 100644
--- a/vllm/v1/core/sched/interface.py
+++ b/vllm/v1/core/sched/interface.py
@@ -14,7 +14,6 @@
 
 
 class SchedulerInterface(ABC):
-
     @abstractmethod
     def schedule(self) -> "SchedulerOutput":
         """Schedule the requests to process in this scheduling step.
@@ -72,7 +71,7 @@ def update_draft_token_ids(
     @abstractmethod
     def add_request(self, request: "Request") -> None:
         """Add a new request to the scheduler's internal queue.
-        
+
         Args:
             request: The new request being added.
         """
@@ -91,7 +90,7 @@ def finish_requests(
         1. When the request is aborted by the client.
         2. When the frontend process detects a stop string of the request after
            de-tokenizing its generated tokens.
-           
+
         Args:
             request_ids: A single or a list of request IDs.
             finished_status: The finished status of the given requests.
diff --git a/vllm/v1/core/sched/output.py b/vllm/v1/core/sched/output.py
index 6874e713aff3..5d3181166239 100644
--- a/vllm/v1/core/sched/output.py
+++ b/vllm/v1/core/sched/output.py
@@ -13,8 +13,7 @@
     import numpy.typing as npt
     import torch
 
-    from vllm.distributed.kv_transfer.kv_connector.v1.base import (
-        KVConnectorMetadata)
+    from vllm.distributed.kv_transfer.kv_connector.v1.base import KVConnectorMetadata
     from vllm.lora.request import LoRARequest
     from vllm.multimodal.inputs import MultiModalFeatureSpec
     from vllm.pooling_params import PoolingParams
@@ -25,7 +24,6 @@
 @bc_linter_include
 @dataclass
 class NewRequestData:
-
     req_id: str
     prompt_token_ids: Optional[list[int]]
     mm_features: list[MultiModalFeatureSpec]
@@ -55,42 +53,43 @@ def from_request(
         )
 
     def __repr__(self) -> str:
-        prompt_embeds_shape = (self.prompt_embeds.shape
-                               if self.prompt_embeds else None)
-        return (f"NewRequestData("
-                f"req_id={self.req_id},"
-                f"prompt_token_ids={self.prompt_token_ids},"
-                f"mm_features={self.mm_features},"
-                f"sampling_params={self.sampling_params},"
-                f"block_ids={self.block_ids},"
-                f"num_computed_tokens={self.num_computed_tokens},"
-                f"lora_request={self.lora_request},"
-                f"prompt_embeds_shape={prompt_embeds_shape}"
-                ")")
+        prompt_embeds_shape = self.prompt_embeds.shape if self.prompt_embeds else None
+        return (
+            f"NewRequestData("
+            f"req_id={self.req_id},"
+            f"prompt_token_ids={self.prompt_token_ids},"
+            f"mm_features={self.mm_features},"
+            f"sampling_params={self.sampling_params},"
+            f"block_ids={self.block_ids},"
+            f"num_computed_tokens={self.num_computed_tokens},"
+            f"lora_request={self.lora_request},"
+            f"prompt_embeds_shape={prompt_embeds_shape}"
+            ")"
+        )
 
     # Version of __repr__ with the prompt data obfuscated
     def anon_repr(self) -> str:
-        prompt_token_ids_len = len(
-            self.prompt_token_ids
-        ) if self.prompt_token_ids is not None else None
-        prompt_embeds_shape = (self.prompt_embeds.shape
-                               if self.prompt_embeds else None)
-        return (f"NewRequestData("
-                f"req_id={self.req_id},"
-                f"prompt_token_ids_len={prompt_token_ids_len},"
-                f"mm_features={self.mm_features},"
-                f"sampling_params={self.sampling_params},"
-                f"block_ids={self.block_ids},"
-                f"num_computed_tokens={self.num_computed_tokens},"
-                f"lora_request={self.lora_request},"
-                f"prompt_embeds_shape={prompt_embeds_shape}"
-                ")")
+        prompt_token_ids_len = (
+            len(self.prompt_token_ids) if self.prompt_token_ids is not None else None
+        )
+        prompt_embeds_shape = self.prompt_embeds.shape if self.prompt_embeds else None
+        return (
+            f"NewRequestData("
+            f"req_id={self.req_id},"
+            f"prompt_token_ids_len={prompt_token_ids_len},"
+            f"mm_features={self.mm_features},"
+            f"sampling_params={self.sampling_params},"
+            f"block_ids={self.block_ids},"
+            f"num_computed_tokens={self.num_computed_tokens},"
+            f"lora_request={self.lora_request},"
+            f"prompt_embeds_shape={prompt_embeds_shape}"
+            ")"
+        )
 
 
 @bc_linter_include
 @dataclass
 class CachedRequestData:
-
     req_ids: list[str]
     # If resumed_from_preemption is False, new_block_ids will be appended to
     # the request's block IDs. If True, new_block_ids will be used as the
@@ -122,7 +121,6 @@ def make_empty(cls) -> CachedRequestData:
 @bc_linter_include
 @dataclass
 class SchedulerOutput:
-
     # list of the requests that are scheduled for the first time.
     # We cache the request's data in each worker process, so that we don't
     # need to re-send it every scheduling step.
diff --git a/vllm/v1/core/sched/request_queue.py b/vllm/v1/core/sched/request_queue.py
index fc2bc30b9a5f..33e5ec72ebd7 100644
--- a/vllm/v1/core/sched/request_queue.py
+++ b/vllm/v1/core/sched/request_queue.py
@@ -14,6 +14,7 @@
 
 class SchedulingPolicy(Enum):
     """Enum for scheduling policies."""
+
     FCFS = "fcfs"
     PRIORITY = "priority"
 
@@ -111,9 +112,7 @@ def remove_request(self, request: Request) -> None:
     def remove_requests(self, requests: Iterable[Request]) -> None:
         """Remove multiple specific requests from the queue."""
         requests_to_remove = set(requests)
-        filtered_requests = [
-            req for req in self if req not in requests_to_remove
-        ]
+        filtered_requests = [req for req in self if req not in requests_to_remove]
         # deque does not support in-place filtering, so we need to clear
         # and extend
         self.clear()
@@ -150,8 +149,7 @@ def __init__(self) -> None:
 
     def add_request(self, request: Request) -> None:
         """Add a request to the queue according to priority policy."""
-        heapq.heappush(self._heap,
-                       (request.priority, request.arrival_time, request))
+        heapq.heappush(self._heap, (request.priority, request.arrival_time, request))
 
     def pop_request(self) -> Request:
         """Pop a request from the queue according to priority policy."""
@@ -169,15 +167,15 @@ def peek_request(self) -> Request:
 
     def prepend_request(self, request: Request) -> None:
         """Add a request to the queue according to priority policy.
-        
-        Note: In a priority queue, there is no concept of prepending to the 
+
+        Note: In a priority queue, there is no concept of prepending to the
         front. Requests are ordered by (priority, arrival_time)."""
         self.add_request(request)
 
     def prepend_requests(self, requests: RequestQueue) -> None:
         """Add all requests from another queue according to priority policy.
-        
-        Note: In a priority queue, there is no concept of prepending to the 
+
+        Note: In a priority queue, there is no concept of prepending to the
         front. Requests are ordered by (priority, arrival_time)."""
         for request in requests:
             self.add_request(request)
@@ -190,8 +188,9 @@ def remove_request(self, request: Request) -> None:
     def remove_requests(self, requests: Iterable[Request]) -> None:
         """Remove multiple specific requests from the queue."""
         requests_to_remove = set(requests)
-        self._heap = [(p, t, r) for p, t, r in self._heap
-                      if r not in requests_to_remove]
+        self._heap = [
+            (p, t, r) for p, t, r in self._heap if r not in requests_to_remove
+        ]
         heapq.heapify(self._heap)
 
     def __bool__(self) -> bool:
diff --git a/vllm/v1/core/sched/scheduler.py b/vllm/v1/core/sched/scheduler.py
index 6983ccca51f4..24ff87cd0ac6 100644
--- a/vllm/v1/core/sched/scheduler.py
+++ b/vllm/v1/core/sched/scheduler.py
@@ -11,25 +11,24 @@
 
 from vllm.config import VllmConfig
 from vllm.distributed.kv_events import EventPublisherFactory, KVEventBatch
-from vllm.distributed.kv_transfer.kv_connector.factory import (
-    KVConnectorFactory)
-from vllm.distributed.kv_transfer.kv_connector.v1 import (KVConnectorBase_V1,
-                                                          KVConnectorRole)
-from vllm.distributed.kv_transfer.kv_connector.v1.metrics import (
-    KVConnectorStats)
+from vllm.distributed.kv_transfer.kv_connector.factory import KVConnectorFactory
+from vllm.distributed.kv_transfer.kv_connector.v1 import (
+    KVConnectorBase_V1,
+    KVConnectorRole,
+)
+from vllm.distributed.kv_transfer.kv_connector.v1.metrics import KVConnectorStats
 from vllm.logger import init_logger
 from vllm.multimodal import MULTIMODAL_REGISTRY, MultiModalRegistry
-from vllm.v1.core.encoder_cache_manager import (EncoderCacheManager,
-                                                compute_encoder_budget)
+from vllm.v1.core.encoder_cache_manager import (
+    EncoderCacheManager,
+    compute_encoder_budget,
+)
 from vllm.v1.core.kv_cache_manager import KVCacheBlocks, KVCacheManager
 from vllm.v1.core.sched.interface import SchedulerInterface
-from vllm.v1.core.sched.output import (CachedRequestData, NewRequestData,
-                                       SchedulerOutput)
-from vllm.v1.core.sched.request_queue import (SchedulingPolicy,
-                                              create_request_queue)
+from vllm.v1.core.sched.output import CachedRequestData, NewRequestData, SchedulerOutput
+from vllm.v1.core.sched.request_queue import SchedulingPolicy, create_request_queue
 from vllm.v1.core.sched.utils import check_stop, remove_all
-from vllm.v1.engine import (EngineCoreEventType, EngineCoreOutput,
-                            EngineCoreOutputs)
+from vllm.v1.engine import EngineCoreEventType, EngineCoreOutput, EngineCoreOutputs
 from vllm.v1.kv_cache_interface import KVCacheConfig
 from vllm.v1.metrics.stats import SchedulerStats
 from vllm.v1.outputs import DraftTokenIds, KVConnectorOutput, ModelRunnerOutput
@@ -41,7 +40,6 @@
 
 
 class Scheduler(SchedulerInterface):
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -67,16 +65,17 @@ def __init__(
         # by update_from_outputs(). This is currently used in the multi-engine
         # case to track request lifetimes efficiently.
         self.finished_req_ids_dict: Optional[dict[int, set[str]]] = (
-            defaultdict(set) if include_finished_set else None)
+            defaultdict(set) if include_finished_set else None
+        )
 
         # Scheduling constraints.
         self.max_num_running_reqs = self.scheduler_config.max_num_seqs
-        self.max_num_scheduled_tokens = \
-            self.scheduler_config.max_num_batched_tokens
+        self.max_num_scheduled_tokens = self.scheduler_config.max_num_batched_tokens
         self.max_model_len = self.scheduler_config.max_model_len
         self.enable_kv_cache_events = (
             self.kv_events_config is not None
-            and self.kv_events_config.enable_kv_cache_events)
+            and self.kv_events_config.enable_kv_cache_events
+        )
 
         # Create KVConnector for the Scheduler. Note that each Worker
         # will have a corresponding KVConnector with Role=WORKER.
@@ -85,12 +84,14 @@ def __init__(
         if self.vllm_config.kv_transfer_config is not None:
             assert len(self.kv_cache_config.kv_cache_groups) == 1, (
                 "Multiple KV cache groups are not currently supported "
-                "with KV connectors")
+                "with KV connectors"
+            )
             assert not self.is_encoder_decoder, (
-                "Encoder-decoder models are not currently supported "
-                "with KV connectors")
+                "Encoder-decoder models are not currently supported with KV connectors"
+            )
             self.connector = KVConnectorFactory.create_connector(
-                config=self.vllm_config, role=KVConnectorRole.SCHEDULER)
+                config=self.vllm_config, role=KVConnectorRole.SCHEDULER
+            )
 
         self.kv_event_publisher = EventPublisherFactory.create(
             self.kv_events_config,
@@ -102,8 +103,7 @@ def __init__(
 
         self.block_size = self.cache_config.block_size
 
-        self.dcp_world_size = \
-            vllm_config.parallel_config.decode_context_parallel_size
+        self.dcp_world_size = vllm_config.parallel_config.decode_context_parallel_size
         # Note(hc): The scheduler’s block_size must be multiplied
         # by dcp_world_size, since block hashes are computed on the
         # original full token sequence at a granularity of
@@ -120,7 +120,8 @@ def __init__(
             self.policy = SchedulingPolicy.FCFS
         else:
             raise ValueError(
-                f"Unknown scheduling policy: {self.scheduler_config.policy}")
+                f"Unknown scheduling policy: {self.scheduler_config.policy}"
+            )
         # Priority queues for requests.
         self.waiting = create_request_queue(self.policy)
         self.running: list[Request] = []
@@ -153,8 +154,7 @@ def __init__(
         # NOTE: For the models without encoder (e.g., text-only models),
         # the encoder cache will not be initialized because cache size is 0
         # for these models.
-        self.encoder_cache_manager = EncoderCacheManager(
-            cache_size=encoder_cache_size)
+        self.encoder_cache_manager = EncoderCacheManager(cache_size=encoder_cache_size)
 
         speculative_config = vllm_config.speculative_config
         self.use_eagle = False
@@ -211,30 +211,35 @@ def schedule(self) -> SchedulerOutput:
         while req_index < len(self.running) and token_budget > 0:
             request = self.running[req_index]
 
-            num_new_tokens = (request.num_tokens_with_spec +
-                              request.num_output_placeholders -
-                              request.num_computed_tokens)
-            if (0 < self.scheduler_config.long_prefill_token_threshold <
-                    num_new_tokens):
-                num_new_tokens = (
-                    self.scheduler_config.long_prefill_token_threshold)
+            num_new_tokens = (
+                request.num_tokens_with_spec
+                + request.num_output_placeholders
+                - request.num_computed_tokens
+            )
+            if 0 < self.scheduler_config.long_prefill_token_threshold < num_new_tokens:
+                num_new_tokens = self.scheduler_config.long_prefill_token_threshold
             num_new_tokens = min(num_new_tokens, token_budget)
 
             # Make sure the input position does not exceed the max model len.
             # This is necessary when using spec decoding.
             num_new_tokens = min(
-                num_new_tokens,
-                self.max_model_len - request.num_computed_tokens)
+                num_new_tokens, self.max_model_len - request.num_computed_tokens
+            )
 
             # Schedule encoder inputs.
             encoder_inputs_to_schedule = None
             new_encoder_compute_budget = encoder_compute_budget
             if request.has_encoder_inputs:
-                (encoder_inputs_to_schedule, num_new_tokens,
-                 new_encoder_compute_budget
-                 ) = self._try_schedule_encoder_inputs(
-                     request, request.num_computed_tokens, num_new_tokens,
-                     encoder_compute_budget)
+                (
+                    encoder_inputs_to_schedule,
+                    num_new_tokens,
+                    new_encoder_compute_budget,
+                ) = self._try_schedule_encoder_inputs(
+                    request,
+                    request.num_computed_tokens,
+                    num_new_tokens,
+                    encoder_compute_budget,
+                )
 
             if num_new_tokens == 0:
                 # The request cannot be scheduled because one of the following
@@ -257,7 +262,8 @@ def schedule(self) -> SchedulerOutput:
                 new_blocks = self.kv_cache_manager.allocate_slots(
                     request,
                     num_new_tokens,
-                    num_lookahead_tokens=self.num_lookahead_tokens)
+                    num_lookahead_tokens=self.num_lookahead_tokens,
+                )
 
                 if new_blocks is not None:
                     # The request can be scheduled.
@@ -282,8 +288,9 @@ def schedule(self) -> SchedulerOutput:
                 preempted_req.num_computed_tokens = 0
                 preempted_req.num_preemptions += 1
                 if self.log_stats:
-                    preempted_req.record_event(EngineCoreEventType.PREEMPTED,
-                                               scheduled_timestamp)
+                    preempted_req.record_event(
+                        EngineCoreEventType.PREEMPTED, scheduled_timestamp
+                    )
 
                 self.waiting.prepend_request(preempted_req)
                 preempted_reqs.append(preempted_req)
@@ -304,19 +311,21 @@ def schedule(self) -> SchedulerOutput:
 
             # Speculative decode related.
             if request.spec_token_ids:
-                num_scheduled_spec_tokens = (num_new_tokens +
-                                             request.num_computed_tokens -
-                                             request.num_tokens)
+                num_scheduled_spec_tokens = (
+                    num_new_tokens + request.num_computed_tokens - request.num_tokens
+                )
                 if num_scheduled_spec_tokens > 0:
                     # Trim spec_token_ids list to num_scheduled_spec_tokens.
                     del request.spec_token_ids[num_scheduled_spec_tokens:]
                     scheduled_spec_decode_tokens[request.request_id] = (
-                        request.spec_token_ids)
+                        request.spec_token_ids
+                    )
 
             # Encoder-related.
             if encoder_inputs_to_schedule:
                 scheduled_encoder_inputs[request.request_id] = (
-                    encoder_inputs_to_schedule)
+                    encoder_inputs_to_schedule
+                )
                 # Allocate the encoder cache.
                 for i in encoder_inputs_to_schedule:
                     self.encoder_cache_manager.allocate(request, i)
@@ -326,8 +335,10 @@ def schedule(self) -> SchedulerOutput:
         scheduled_loras: set[int] = set()
         if self.lora_config:
             scheduled_loras = set(
-                req.lora_request.lora_int_id for req in scheduled_running_reqs
-                if req.lora_request and req.lora_request.lora_int_id > 0)
+                req.lora_request.lora_int_id
+                for req in scheduled_running_reqs
+                if req.lora_request and req.lora_request.lora_int_id > 0
+            )
             assert len(scheduled_loras) <= self.lora_config.max_loras
 
         # Use a temporary RequestQueue to collect requests that need to be
@@ -350,7 +361,8 @@ def schedule(self) -> SchedulerOutput:
                     else:
                         logger.debug(
                             "%s is still in WAITING_FOR_REMOTE_KVS state.",
-                            request.request_id)
+                            request.request_id,
+                        )
                         self.waiting.pop_request()
                         skipped_waiting_requests.prepend_request(request)
                         continue
@@ -368,9 +380,14 @@ def schedule(self) -> SchedulerOutput:
 
                 # Check that adding the request still respects the max_loras
                 # constraint.
-                if (self.lora_config and request.lora_request and
-                    (len(scheduled_loras) == self.lora_config.max_loras and
-                     request.lora_request.lora_int_id not in scheduled_loras)):
+                if (
+                    self.lora_config
+                    and request.lora_request
+                    and (
+                        len(scheduled_loras) == self.lora_config.max_loras
+                        and request.lora_request.lora_int_id not in scheduled_loras
+                    )
+                ):
                     # Scheduling would exceed max_loras, skip.
                     self.waiting.pop_request()
                     skipped_waiting_requests.prepend_request(request)
@@ -382,15 +399,17 @@ def schedule(self) -> SchedulerOutput:
                 # Get already-cached tokens.
                 if request.num_computed_tokens == 0:
                     # Get locally-cached tokens.
-                    new_computed_blocks, num_new_local_computed_tokens = \
-                        self.kv_cache_manager.get_computed_blocks(
-                            request)
+                    new_computed_blocks, num_new_local_computed_tokens = (
+                        self.kv_cache_manager.get_computed_blocks(request)
+                    )
 
                     # Get externally-cached tokens if using a KVConnector.
                     if self.connector is not None:
                         num_external_computed_tokens, load_kv_async = (
                             self.connector.get_num_new_matched_tokens(
-                                request, num_new_local_computed_tokens))
+                                request, num_new_local_computed_tokens
+                            )
+                        )
 
                         if num_external_computed_tokens is None:
                             # The request cannot be scheduled because
@@ -401,13 +420,15 @@ def schedule(self) -> SchedulerOutput:
                             continue
 
                     # Total computed tokens (local + external).
-                    num_computed_tokens = (num_new_local_computed_tokens +
-                                           num_external_computed_tokens)
+                    num_computed_tokens = (
+                        num_new_local_computed_tokens + num_external_computed_tokens
+                    )
                 # KVTransfer: WAITING reqs have num_computed_tokens > 0
                 # after async KV recvs are completed.
                 else:
                     new_computed_blocks = (
-                        self.kv_cache_manager.create_empty_block_list())
+                        self.kv_cache_manager.create_empty_block_list()
+                    )
                     num_new_local_computed_tokens = 0
                     num_computed_tokens = request.num_computed_tokens
 
@@ -424,15 +445,21 @@ def schedule(self) -> SchedulerOutput:
                     # `request.num_prompt_tokens` to consider the resumed
                     # requests, which have output tokens.
                     num_new_tokens = request.num_tokens - num_computed_tokens
-                    if (0 < self.scheduler_config.long_prefill_token_threshold
-                            < num_new_tokens):
+                    if (
+                        0
+                        < self.scheduler_config.long_prefill_token_threshold
+                        < num_new_tokens
+                    ):
                         num_new_tokens = (
-                            self.scheduler_config.long_prefill_token_threshold)
+                            self.scheduler_config.long_prefill_token_threshold
+                        )
 
                     # chunked prefill has to be enabled explicitly to allow
                     # pooling requests to be chunked
-                    if not self.scheduler_config.chunked_prefill_enabled and \
-                        num_new_tokens > token_budget:
+                    if (
+                        not self.scheduler_config.chunked_prefill_enabled
+                        and num_new_tokens > token_budget
+                    ):
                         self.waiting.pop_request()
                         skipped_waiting_requests.prepend_request(request)
                         continue
@@ -442,11 +469,16 @@ def schedule(self) -> SchedulerOutput:
 
                     # Schedule encoder inputs.
                     if request.has_encoder_inputs:
-                        (encoder_inputs_to_schedule, num_new_tokens,
-                         new_encoder_compute_budget
-                         ) = self._try_schedule_encoder_inputs(
-                             request, num_computed_tokens, num_new_tokens,
-                             encoder_compute_budget)
+                        (
+                            encoder_inputs_to_schedule,
+                            num_new_tokens,
+                            new_encoder_compute_budget,
+                        ) = self._try_schedule_encoder_inputs(
+                            request,
+                            num_computed_tokens,
+                            num_new_tokens,
+                            encoder_compute_budget,
+                        )
                         if num_new_tokens == 0:
                             # The request cannot be scheduled.
                             break
@@ -456,9 +488,9 @@ def schedule(self) -> SchedulerOutput:
                 # extra block gets allocated which
                 # creates a mismatch between the number
                 # of local and remote blocks.
-                effective_lookahead_tokens = (0 if request.num_computed_tokens
-                                              == 0 else
-                                              self.num_lookahead_tokens)
+                effective_lookahead_tokens = (
+                    0 if request.num_computed_tokens == 0 else self.num_lookahead_tokens
+                )
 
                 # Determine if we need to allocate cross-attention blocks.
                 if self.is_encoder_decoder and request.has_encoder_inputs:
@@ -466,8 +498,9 @@ def schedule(self) -> SchedulerOutput:
                     # always padded to the maximum length. If we support other
                     # encoder-decoder models, this will need to be updated if we
                     # want to only allocate what is needed.
-                    num_encoder_tokens =\
+                    num_encoder_tokens = (
                         self.scheduler_config.max_num_encoder_input_tokens
+                    )
                 else:
                     num_encoder_tokens = 0
 
@@ -509,20 +542,21 @@ def schedule(self) -> SchedulerOutput:
                 req_index += 1
                 self.running.append(request)
                 if self.log_stats:
-                    request.record_event(EngineCoreEventType.SCHEDULED,
-                                         scheduled_timestamp)
+                    request.record_event(
+                        EngineCoreEventType.SCHEDULED, scheduled_timestamp
+                    )
                 if request.status == RequestStatus.WAITING:
                     scheduled_new_reqs.append(request)
                 elif request.status == RequestStatus.PREEMPTED:
                     scheduled_resumed_reqs.append(request)
                 else:
-                    raise RuntimeError(
-                        f"Invalid request status: {request.status}")
+                    raise RuntimeError(f"Invalid request status: {request.status}")
 
                 if self.lora_config and request.lora_request:
                     scheduled_loras.add(request.lora_request.lora_int_id)
                 req_to_new_blocks[request.request_id] = (
-                    self.kv_cache_manager.get_blocks(request.request_id))
+                    self.kv_cache_manager.get_blocks(request.request_id)
+                )
                 num_scheduled_tokens[request.request_id] = num_new_tokens
                 token_budget -= num_new_tokens
                 request.status = RequestStatus.RUNNING
@@ -533,7 +567,8 @@ def schedule(self) -> SchedulerOutput:
                 # Encoder-related.
                 if encoder_inputs_to_schedule:
                     scheduled_encoder_inputs[request.request_id] = (
-                        encoder_inputs_to_schedule)
+                        encoder_inputs_to_schedule
+                    )
                     # Allocate the encoder cache.
                     for i in encoder_inputs_to_schedule:
                         self.encoder_cache_manager.allocate(request, i)
@@ -551,23 +586,26 @@ def schedule(self) -> SchedulerOutput:
         # Since some requests in the RUNNING queue may not be scheduled in
         # this step, the total number of scheduled requests can be smaller than
         # len(self.running).
-        assert (len(scheduled_new_reqs) + len(scheduled_resumed_reqs) +
-                len(scheduled_running_reqs) <= len(self.running))
+        assert len(scheduled_new_reqs) + len(scheduled_resumed_reqs) + len(
+            scheduled_running_reqs
+        ) <= len(self.running)
 
         # Get the longest common prefix among all requests in the running queue.
         # This can be potentially used for cascade attention.
-        num_common_prefix_blocks = [0] * len(
-            self.kv_cache_config.kv_cache_groups)
+        num_common_prefix_blocks = [0] * len(self.kv_cache_config.kv_cache_groups)
         if self.running:
             any_request = self.running[0]
             num_common_prefix_blocks = (
                 self.kv_cache_manager.get_num_common_prefix_blocks(
-                    any_request, len(self.running)))
+                    any_request, len(self.running)
+                )
+            )
 
         # Construct the scheduler output.
         new_reqs_data = [
             NewRequestData.from_request(
-                req, req_to_new_blocks[req.request_id].get_block_ids())
+                req, req_to_new_blocks[req.request_id].get_block_ids()
+            )
             for req in scheduled_new_reqs
         ]
         cached_reqs_data = self._make_cached_request_data(
@@ -577,11 +615,12 @@ def schedule(self) -> SchedulerOutput:
             scheduled_spec_decode_tokens,
             req_to_new_blocks,
         )
-        scheduled_requests = (scheduled_new_reqs + scheduled_running_reqs +
-                              scheduled_resumed_reqs)
-        structured_output_request_ids, grammar_bitmask = (
-            self.get_grammar_bitmask(scheduled_requests,
-                                     scheduled_spec_decode_tokens))
+        scheduled_requests = (
+            scheduled_new_reqs + scheduled_running_reqs + scheduled_resumed_reqs
+        )
+        structured_output_request_ids, grammar_bitmask = self.get_grammar_bitmask(
+            scheduled_requests, scheduled_spec_decode_tokens
+        )
         scheduler_output = SchedulerOutput(
             scheduled_new_reqs=new_reqs_data,
             scheduled_cached_reqs=cached_reqs_data,
@@ -595,8 +634,7 @@ def schedule(self) -> SchedulerOutput:
             # It contains the request IDs that are finished in between
             # the previous and the current steps.
             finished_req_ids=self.finished_req_ids,
-            free_encoder_mm_hashes=self.encoder_cache_manager.
-            get_freed_mm_hashes(),
+            free_encoder_mm_hashes=self.encoder_cache_manager.get_freed_mm_hashes(),
             structured_output_request_ids=structured_output_request_ids,
             grammar_bitmask=grammar_bitmask,
         )
@@ -678,16 +716,18 @@ def _make_cached_request_data(
         for req in itertools.chain(running_reqs, resumed_reqs):
             req_id = req.request_id
             req_ids.append(req_id)
-            num_tokens = (num_scheduled_tokens[req_id] -
-                          len(spec_decode_tokens.get(req_id, ())))
+            num_tokens = num_scheduled_tokens[req_id] - len(
+                spec_decode_tokens.get(req_id, ())
+            )
             if self.use_pp:
                 # When using PP, the scheduler sends the sampled tokens back,
                 # because there's no direct communication between the first-
                 # stage worker and the last-stage worker. Otherwise, we don't
                 # need to send the sampled tokens back because the model runner
                 # will cache them.
-                token_ids = req.all_token_ids[req.num_computed_tokens:req.
-                                              num_computed_tokens + num_tokens]
+                token_ids = req.all_token_ids[
+                    req.num_computed_tokens : req.num_computed_tokens + num_tokens
+                ]
                 new_token_ids.append(token_ids)
             elif use_connector:
                 # When using a KVConnector, we add a placeholder to avoid index
@@ -695,7 +735,8 @@ def _make_cached_request_data(
                 # is updated to handle token IDs properly.
                 new_token_ids.append([])
             new_block_ids.append(
-                req_to_new_blocks[req_id].get_block_ids(allow_none=True))
+                req_to_new_blocks[req_id].get_block_ids(allow_none=True)
+            )
             num_computed_tokens.append(req.num_computed_tokens)
             num_output_tokens.append(len(req.output_token_ids))
         # Because resumed_reqs is usually empty, it is more efficient to do
@@ -764,7 +805,8 @@ def _try_schedule_encoder_inputs(
             if self.is_encoder_decoder and num_computed_tokens > 0:
                 assert start_pos == 0, (
                     "Encoder input should be processed at the beginning of "
-                    "the sequence when encoder-decoder models are used.")
+                    "the sequence when encoder-decoder models are used."
+                )
                 # Encoder input has already been computed
                 # The calculation here is a bit different. We don't turn encoder
                 # output into tokens that get processed by the decoder and
@@ -788,8 +830,7 @@ def _try_schedule_encoder_inputs(
                     # current step.
                     continue
 
-                if self.encoder_cache_manager.check_and_update_cache(
-                        request, i):
+                if self.encoder_cache_manager.check_and_update_cache(request, i):
                     # The encoder input is already computed and cached from a
                     # previous step.
                     continue
@@ -797,16 +838,18 @@ def _try_schedule_encoder_inputs(
             # If no encoder input chunking is allowed, we do not want to
             # partially schedule a multimodal item. If the scheduled range would
             # only cover part of the mm input, roll back to before the mm item.
-            if (self.scheduler_config.disable_chunked_mm_input
-                    and num_computed_tokens < start_pos
-                    and (num_computed_tokens + num_new_tokens)
-                    < (start_pos + num_encoder_tokens)):
+            if (
+                self.scheduler_config.disable_chunked_mm_input
+                and num_computed_tokens < start_pos
+                and (num_computed_tokens + num_new_tokens)
+                < (start_pos + num_encoder_tokens)
+            ):
                 num_new_tokens = start_pos - num_computed_tokens
                 break
 
             if not self.encoder_cache_manager.can_allocate(
-                    request, i, encoder_compute_budget,
-                    num_tokens_to_schedule):
+                request, i, encoder_compute_budget, num_tokens_to_schedule
+            ):
                 # The encoder cache is full or the encoder budget is exhausted.
                 # NOTE(woosuk): We assume that the encoder input tokens should
                 # be processed altogether, as the encoder usually uses
@@ -879,8 +922,9 @@ def update_from_output(
 
         outputs: dict[int, list[EngineCoreOutput]] = defaultdict(list)
         spec_decoding_stats: Optional[SpecDecodingStats] = None
-        kv_connector_stats = (kv_connector_output.kv_connector_stats
-                              if kv_connector_output else None)
+        kv_connector_stats = (
+            kv_connector_output.kv_connector_stats if kv_connector_output else None
+        )
 
         failed_kv_load_req_ids = None
         if kv_connector_output and kv_connector_output.invalid_block_ids:
@@ -888,7 +932,8 @@ def update_from_output(
             # load. Identify affected requests and adjust their computed token
             # count to trigger recomputation of the invalid blocks.
             failed_kv_load_req_ids = self._handle_invalid_blocks(
-                kv_connector_output.invalid_block_ids)
+                kv_connector_output.invalid_block_ids
+            )
 
         # NOTE(woosuk): As len(num_scheduled_tokens) can be up to 1K or more,
         # the below loop can be a performance bottleneck. We should do our best
@@ -908,11 +953,13 @@ def update_from_output(
                 continue
 
             req_index = model_runner_output.req_id_to_index[req_id]
-            generated_token_ids = sampled_token_ids[
-                req_index] if sampled_token_ids else []
+            generated_token_ids = (
+                sampled_token_ids[req_index] if sampled_token_ids else []
+            )
 
             scheduled_spec_token_ids = (
-                scheduler_output.scheduled_spec_decode_tokens.get(req_id))
+                scheduler_output.scheduled_spec_decode_tokens.get(req_id)
+            )
             if scheduled_spec_token_ids:
                 num_draft_tokens = len(scheduled_spec_token_ids)
                 num_accepted = len(generated_token_ids) - 1
@@ -926,7 +973,8 @@ def update_from_output(
                 spec_decoding_stats = self.make_spec_decoding_stats(
                     spec_decoding_stats,
                     num_draft_tokens=num_draft_tokens,
-                    num_accepted_tokens=num_accepted)
+                    num_accepted_tokens=num_accepted,
+                )
 
             stopped = False
             new_logprobs = None
@@ -937,14 +985,14 @@ def update_from_output(
             # Check for stop and update request status.
             if new_token_ids:
                 new_token_ids, stopped = self._update_request_with_output(
-                    request, new_token_ids)
+                    request, new_token_ids
+                )
 
             # Stop checking for pooler models.
             pooler_output = None
             if pooler_outputs:
                 pooler_output = pooler_outputs[req_index]
-                stopped = check_stop(request, self.max_model_len,
-                                     pooler_output)
+                stopped = check_stop(request, self.max_model_len, pooler_output)
 
             if stopped:
                 kv_transfer_params = self._free_request(request)
@@ -954,28 +1002,29 @@ def update_from_output(
                     stopped_preempted_reqs.add(request)
 
             # Extract sample logprobs if needed.
-            if request.sampling_params is not None \
-                and request.sampling_params.logprobs is not None and logprobs:
+            if (
+                request.sampling_params is not None
+                and request.sampling_params.logprobs is not None
+                and logprobs
+            ):
                 # NOTE: once we support N tokens per step (spec decode),
                 # the outer lists can be of length > 1.
                 new_logprobs = logprobs.slice(req_index, req_index + 1)
 
-            if new_token_ids and self.structured_output_manager.should_advance(
-                    request):
+            if new_token_ids and self.structured_output_manager.should_advance(request):
                 # NOTE: structured_output_request
                 # should not be None if use_structured_output, we have
                 # checked above, so safe to ignore type warning
                 request.structured_output_request.grammar.accept_tokens(  # type: ignore[union-attr]
-                    req_id, new_token_ids)
+                    req_id, new_token_ids
+                )
 
             if num_nans_in_logits is not None and req_id in num_nans_in_logits:
                 request.num_nans_in_logits = num_nans_in_logits[req_id]
 
             # Get prompt logprobs for this request.
             prompt_logprobs_tensors = prompt_logprobs_dict.get(req_id)
-            if new_token_ids or pooler_output is not None \
-                or kv_transfer_params:
-
+            if new_token_ids or pooler_output is not None or kv_transfer_params:
                 # Add EngineCoreOutput for this Request.
                 outputs[request.client_index].append(
                     EngineCoreOutput(
@@ -990,7 +1039,8 @@ def update_from_output(
                         kv_transfer_params=kv_transfer_params,
                         trace_headers=request.trace_headers,
                         num_cached_tokens=request.num_cached_tokens,
-                    ))
+                    )
+                )
             else:
                 # Invariant: EngineCore returns no partial prefill outputs.
                 assert not prompt_logprobs_tensors
@@ -1023,11 +1073,13 @@ def update_from_output(
                     eco.finished_requests = finished_set
                 else:
                     engine_core_outputs[client_index] = EngineCoreOutputs(
-                        finished_requests=finished_set)
+                        finished_requests=finished_set
+                    )
             finished_req_ids.clear()
 
-        if (stats := self.make_stats(spec_decoding_stats,
-                                     kv_connector_stats)) is not None:
+        if (
+            stats := self.make_stats(spec_decoding_stats, kv_connector_stats)
+        ) is not None:
             # Return stats to only one of the front-ends.
             if (eco := next(iter(engine_core_outputs.values()), None)) is None:
                 # We must return the stats even if there are no request
@@ -1058,8 +1110,9 @@ def _update_request_with_output(
         return new_token_ids, stopped
 
     def _free_encoder_inputs(self, request: Request) -> None:
-        cached_encoder_input_ids = (
-            self.encoder_cache_manager.get_cached_input_ids(request))
+        cached_encoder_input_ids = self.encoder_cache_manager.get_cached_input_ids(
+            request
+        )
         # OPTIMIZATION: Avoid list(set) if the set is empty.
         if not cached_encoder_input_ids:
             return
@@ -1074,21 +1127,19 @@ def _free_encoder_inputs(self, request: Request) -> None:
                 # With Whisper, as soon as we've generated a single token,
                 # we know we're done with the encoder input. Cross Attention
                 # KVs have been calculated and cached already.
-                self.encoder_cache_manager.free_encoder_input(
-                    request, input_id)
+                self.encoder_cache_manager.free_encoder_input(request, input_id)
             elif start_pos + num_tokens <= request.num_computed_tokens:
                 # The encoder output is already processed and stored
                 # in the decoder's KV cache.
-                self.encoder_cache_manager.free_encoder_input(
-                    request, input_id)
+                self.encoder_cache_manager.free_encoder_input(request, input_id)
 
     def update_draft_token_ids(
         self,
         draft_token_ids: DraftTokenIds,
     ) -> None:
         for req_id, spec_token_ids in zip(
-                draft_token_ids.req_ids,
-                draft_token_ids.draft_token_ids,
+            draft_token_ids.req_ids,
+            draft_token_ids.draft_token_ids,
         ):
             request = self.requests.get(req_id)
             if request is None or request.is_finished():
@@ -1102,7 +1153,8 @@ def update_draft_token_ids(
             elif self.structured_output_manager.should_advance(request):
                 metadata = request.structured_output_request
                 request.spec_token_ids = metadata.grammar.validate_tokens(  # type: ignore[union-attr]
-                    spec_token_ids)
+                    spec_token_ids
+                )
             else:
                 request.spec_token_ids = spec_token_ids
 
@@ -1128,7 +1180,7 @@ def finish_requests(
         """
         assert RequestStatus.is_finished(finished_status)
         if isinstance(request_ids, str):
-            request_ids = (request_ids, )
+            request_ids = (request_ids,)
         else:
             request_ids = set(request_ids)
 
@@ -1198,15 +1250,15 @@ def make_stats(
             return None
         prefix_cache_stats = self.kv_cache_manager.make_prefix_cache_stats()
         assert prefix_cache_stats is not None
-        return SchedulerStats(num_running_reqs=len(self.running),
-                              num_waiting_reqs=len(self.waiting),
-                              kv_cache_usage=self.kv_cache_manager.usage,
-                              prefix_cache_stats=prefix_cache_stats,
-                              spec_decoding_stats=spec_decoding_stats,
-                              num_corrupted_reqs=sum(req.is_output_corrupted
-                                                     for req in self.running),
-                              kv_connector_stats=kv_connector_stats.data
-                              if kv_connector_stats else None)
+        return SchedulerStats(
+            num_running_reqs=len(self.running),
+            num_waiting_reqs=len(self.waiting),
+            kv_cache_usage=self.kv_cache_manager.usage,
+            prefix_cache_stats=prefix_cache_stats,
+            spec_decoding_stats=spec_decoding_stats,
+            num_corrupted_reqs=sum(req.is_output_corrupted for req in self.running),
+            kv_connector_stats=kv_connector_stats.data if kv_connector_stats else None,
+        )
 
     def make_spec_decoding_stats(
         self,
@@ -1219,8 +1271,8 @@ def make_spec_decoding_stats(
         if spec_decoding_stats is None:
             spec_decoding_stats = SpecDecodingStats.new(self.num_spec_tokens)
         spec_decoding_stats.observe_draft(
-            num_draft_tokens=num_draft_tokens,
-            num_accepted_tokens=num_accepted_tokens)
+            num_draft_tokens=num_draft_tokens, num_accepted_tokens=num_accepted_tokens
+        )
         return spec_decoding_stats
 
     def shutdown(self) -> None:
@@ -1237,7 +1289,8 @@ def get_kv_connector(self) -> Optional[KVConnectorBase_V1]:
         return self.connector
 
     def _connector_finished(
-            self, request: Request) -> tuple[bool, Optional[dict[str, Any]]]:
+        self, request: Request
+    ) -> tuple[bool, Optional[dict[str, Any]]]:
         """
         Invoke the KV connector request_finished() method if applicable.
 
@@ -1247,7 +1300,7 @@ def _connector_finished(
         if self.connector is None:
             return False, None
 
-        (block_ids, ) = self.kv_cache_manager.get_block_ids(request.request_id)
+        (block_ids,) = self.kv_cache_manager.get_block_ids(request.request_id)
         return self.connector.request_finished(request, block_ids)
 
     def _update_waiting_for_remote_kv(self, request: Request) -> bool:
@@ -1271,8 +1324,7 @@ def _update_waiting_for_remote_kv(self, request: Request) -> bool:
             # updated in _update_requests_with_invalid_blocks
             if request.num_computed_tokens:
                 # Cache any valid computed tokens.
-                self.kv_cache_manager.cache_blocks(request,
-                                                   request.num_computed_tokens)
+                self.kv_cache_manager.cache_blocks(request, request.num_computed_tokens)
             else:
                 # No valid computed tokens, release allocated blocks.
                 # There may be a local cache hit on retry.
@@ -1281,8 +1333,7 @@ def _update_waiting_for_remote_kv(self, request: Request) -> bool:
             self.failed_recving_kv_req_ids.remove(request.request_id)
         else:
             # Now that the blocks are ready, actually cache them.
-            (block_ids, ) = self.kv_cache_manager.get_block_ids(
-                request.request_id)
+            (block_ids,) = self.kv_cache_manager.get_block_ids(request.request_id)
             num_computed_tokens = len(block_ids) * self.block_size
             # Handle the case where num request tokens less than one block.
             num_computed_tokens = min(num_computed_tokens, request.num_tokens)
@@ -1298,8 +1349,7 @@ def _update_waiting_for_remote_kv(self, request: Request) -> bool:
         self.finished_recving_kv_req_ids.remove(request.request_id)
         return True
 
-    def _update_from_kv_xfer_finished(self,
-                                      kv_connector_output: KVConnectorOutput):
+    def _update_from_kv_xfer_finished(self, kv_connector_output: KVConnectorOutput):
         """
         KV Connector: update the scheduler state based on the output.
 
@@ -1314,21 +1364,23 @@ def _update_from_kv_xfer_finished(self,
             self.connector.update_connector_output(kv_connector_output)
 
         # KV Connector:: update recv and send status from last step.
-        for req_id in (kv_connector_output.finished_recving or ()):
+        for req_id in kv_connector_output.finished_recving or ():
             logger.debug("Finished recving KV transfer for request %s", req_id)
             self.finished_recving_kv_req_ids.add(req_id)
-        for req_id in (kv_connector_output.finished_sending or ()):
+        for req_id in kv_connector_output.finished_sending or ():
             logger.debug("Finished sending KV transfer for request %s", req_id)
             if req_id not in self.requests:
                 logger.warning(
                     "Got finished sending KV transfer for request %s,"
-                    "but the request is already freed.", req_id)
+                    "but the request is already freed.",
+                    req_id,
+                )
             else:
                 self._free_blocks(self.requests[req_id])
 
     def _update_requests_with_invalid_blocks(
-            self, requests: Iterable[Request],
-            invalid_block_ids: set[int]) -> tuple[set[str], int]:
+        self, requests: Iterable[Request], invalid_block_ids: set[int]
+    ) -> tuple[set[str], int]:
         """
         Identify and update requests affected by invalid KV cache blocks.
 
@@ -1359,25 +1411,25 @@ def _update_requests_with_invalid_blocks(
             marked_invalid_block = False
             req_id = request.request_id
             # TODO (davidb): add support for hybrid memory allocator
-            (req_block_ids, ) = self.kv_cache_manager.get_block_ids(req_id)
+            (req_block_ids,) = self.kv_cache_manager.get_block_ids(req_id)
             # We iterate only over blocks that may contain externally computed
             # tokens
             if request.status == RequestStatus.WAITING_FOR_REMOTE_KVS:
                 # Async loading. If num_computed_tokens is set it implies we
                 # already processed some block failures for it in a prior step
                 req_num_computed_tokens = (
-                    request.num_computed_tokens if req_id
-                    in self.failed_recving_kv_req_ids else len(req_block_ids) *
-                    self.block_size)
+                    request.num_computed_tokens
+                    if req_id in self.failed_recving_kv_req_ids
+                    else len(req_block_ids) * self.block_size
+                )
             else:
                 # Sync loading. num_computed_tokens includes new tokens
                 req_num_computed_tokens = request.num_cached_tokens
 
-            req_num_computed_blocks = (req_num_computed_tokens +
-                                       self.block_size - 1) // self.block_size
-            for idx, block_id in zip(range(req_num_computed_blocks),
-                                     req_block_ids):
-
+            req_num_computed_blocks = (
+                req_num_computed_tokens + self.block_size - 1
+            ) // self.block_size
+            for idx, block_id in zip(range(req_num_computed_blocks), req_block_ids):
                 if block_id not in invalid_block_ids:
                     continue
 
@@ -1402,8 +1454,9 @@ def _update_requests_with_invalid_blocks(
                 marked_invalid_block = True
                 # Truncate the computed tokens at the first failed block
                 request.num_computed_tokens = idx * self.block_size
-                total_affected_tokens += (req_num_computed_tokens -
-                                          request.num_computed_tokens)
+                total_affected_tokens += (
+                    req_num_computed_tokens - request.num_computed_tokens
+                )
 
             if is_affected:
                 if not marked_invalid_block:
@@ -1412,8 +1465,9 @@ def _update_requests_with_invalid_blocks(
                     # Revert to considering only cached tokens as computed.
                     # Currently this only applies to sync loading; Async
                     # loading does not yet support block sharing
-                    total_affected_tokens += (request.num_computed_tokens -
-                                              request.num_cached_tokens)
+                    total_affected_tokens += (
+                        request.num_computed_tokens - request.num_cached_tokens
+                    )
                     request.num_computed_tokens = request.num_cached_tokens
 
                 affected_req_ids.add(request.request_id)
@@ -1426,11 +1480,15 @@ def _handle_invalid_blocks(self, invalid_block_ids: set[int]) -> set[str]:
 
         # --- Handle async KV loads (WAITING_FOR_REMOTE_KVS) ---
         async_load_reqs = (
-            req for req in self.waiting
-            if req.status == RequestStatus.WAITING_FOR_REMOTE_KVS)
+            req
+            for req in self.waiting
+            if req.status == RequestStatus.WAITING_FOR_REMOTE_KVS
+        )
         async_affected_req_ids, num_tokens_to_reschedule = (
-            self._update_requests_with_invalid_blocks(async_load_reqs,
-                                                      invalid_block_ids))
+            self._update_requests_with_invalid_blocks(
+                async_load_reqs, invalid_block_ids
+            )
+        )
 
         total_requests_to_reschedule += len(async_affected_req_ids)
         total_tokens_to_reschedule += num_tokens_to_reschedule
@@ -1441,8 +1499,8 @@ def _handle_invalid_blocks(self, invalid_block_ids: set[int]) -> set[str]:
 
         # --- Handle sync KV loads (running requests) ---
         sync_affected_req_ids, num_tokens_to_reschedule = (
-            self._update_requests_with_invalid_blocks(self.running,
-                                                      invalid_block_ids))
+            self._update_requests_with_invalid_blocks(self.running, invalid_block_ids)
+        )
 
         total_requests_to_reschedule += len(sync_affected_req_ids)
         total_tokens_to_reschedule += num_tokens_to_reschedule
@@ -1451,7 +1509,9 @@ def _handle_invalid_blocks(self, invalid_block_ids: set[int]) -> set[str]:
             logger.warning(
                 "Recovered from KV load failure: "
                 "%d request(s) rescheduled (%d tokens affected).",
-                total_requests_to_reschedule, total_tokens_to_reschedule)
+                total_requests_to_reschedule,
+                total_tokens_to_reschedule,
+            )
 
         # Return the IDs of affected running requests to skip in
         # update_from_output.
diff --git a/vllm/v1/core/sched/utils.py b/vllm/v1/core/sched/utils.py
index 6b321f4ebbef..0979100ed325 100644
--- a/vllm/v1/core/sched/utils.py
+++ b/vllm/v1/core/sched/utils.py
@@ -40,11 +40,13 @@ def remove_all(lst: list, items_to_remove: set) -> list:
     return [item for item in lst if item not in items_to_remove]
 
 
-def check_stop(request: Request,
-               max_model_len: int,
-               pooler_output: Optional[torch.Tensor] = None) -> bool:
-    if (request.num_tokens > max_model_len
-            or request.num_output_tokens >= request.max_tokens):
+def check_stop(
+    request: Request, max_model_len: int, pooler_output: Optional[torch.Tensor] = None
+) -> bool:
+    if (
+        request.num_tokens > max_model_len
+        or request.num_output_tokens >= request.max_tokens
+    ):
         request.status = RequestStatus.FINISHED_LENGTH_CAPPED
         return True
 
@@ -57,8 +59,7 @@ def check_stop(request: Request,
     sampling_params = request.sampling_params
     assert sampling_params is not None
     last_token_id = request.output_token_ids[-1]
-    if (not sampling_params.ignore_eos
-            and last_token_id == request.eos_token_id):
+    if not sampling_params.ignore_eos and last_token_id == request.eos_token_id:
         request.status = RequestStatus.FINISHED_STOPPED
         return True
 
diff --git a/vllm/v1/core/single_type_kv_cache_manager.py b/vllm/v1/core/single_type_kv_cache_manager.py
index 07777efc3281..0f71796014db 100644
--- a/vllm/v1/core/single_type_kv_cache_manager.py
+++ b/vllm/v1/core/single_type_kv_cache_manager.py
@@ -7,16 +7,21 @@
 from vllm.utils import cdiv
 from vllm.v1.core.block_pool import BlockPool
 from vllm.v1.core.kv_cache_utils import BlockHash, KVCacheBlock
-from vllm.v1.kv_cache_interface import (ChunkedLocalAttentionSpec,
-                                        CrossAttentionSpec, FullAttentionSpec,
-                                        KVCacheSpec, MambaSpec,
-                                        MLAAttentionSpec, SlidingWindowSpec)
+from vllm.v1.kv_cache_interface import (
+    ChunkedLocalAttentionSpec,
+    CrossAttentionSpec,
+    FullAttentionSpec,
+    KVCacheSpec,
+    MambaSpec,
+    MLAAttentionSpec,
+    SlidingWindowSpec,
+)
 from vllm.v1.request import Request
 
 
 class SingleTypeKVCacheManager(ABC):
     """
-    An abstract base class for a manager that handle the kv cache management 
+    An abstract base class for a manager that handle the kv cache management
     logic of one specific type of attention layer.
     """
 
@@ -44,8 +49,7 @@ def __init__(
         # Mapping from request ID to blocks to track the blocks allocated
         # for each request, so that we can free the blocks when the request
         # is finished.
-        self.req_to_blocks: defaultdict[str,
-                                        list[KVCacheBlock]] = defaultdict(list)
+        self.req_to_blocks: defaultdict[str, list[KVCacheBlock]] = defaultdict(list)
 
         # {req_id: The number of cached blocks for this given request}
         # This is used to track the number of cached blocks for each request.
@@ -57,14 +61,14 @@ def __init__(
         self._null_block = block_pool.null_block
 
     def get_num_blocks_to_allocate(
-            self, request_id: str, num_tokens: int,
-            new_computed_blocks: list[KVCacheBlock]) -> int:
+        self, request_id: str, num_tokens: int, new_computed_blocks: list[KVCacheBlock]
+    ) -> int:
         """
         Get the number of blocks needed to be allocated for the request.
 
         Args:
             request_id: The request ID.
-            num_tokens: The total number of tokens that need a slot (including 
+            num_tokens: The total number of tokens that need a slot (including
                 tokens that are already allocated).
             new_computed_blocks: The new computed blocks just hitting the
                 prefix caching.
@@ -74,20 +78,23 @@ def get_num_blocks_to_allocate(
         """
 
         num_required_blocks = cdiv(num_tokens, self.block_size)
-        num_new_blocks = (num_required_blocks - len(new_computed_blocks) -
-                          len(self.req_to_blocks[request_id]))
+        num_new_blocks = (
+            num_required_blocks
+            - len(new_computed_blocks)
+            - len(self.req_to_blocks[request_id])
+        )
         # If a computed block of a request is an eviction candidate (in the
         # free queue and ref_cnt == 0), it will be changed from a free block
         # to a computed block when the request is allocated, so we also count
         # it as needed to be allocated.
         num_evictable_computed_blocks = sum(
-            blk.ref_cnt == 0 and not blk.is_null
-            for blk in new_computed_blocks)
+            blk.ref_cnt == 0 and not blk.is_null for blk in new_computed_blocks
+        )
         return num_new_blocks + num_evictable_computed_blocks
 
     def save_new_computed_blocks(
-            self, request_id: str,
-            new_computed_blocks: list[KVCacheBlock]) -> None:
+        self, request_id: str, new_computed_blocks: list[KVCacheBlock]
+    ) -> None:
         """
         Add the new computed blocks to the request.
 
@@ -106,15 +113,16 @@ def save_new_computed_blocks(
             # A running request. Should not have new computed blocks.
             assert len(new_computed_blocks) == 0
 
-    def allocate_new_blocks(self, request_id: str,
-                            num_tokens: int) -> list[KVCacheBlock]:
+    def allocate_new_blocks(
+        self, request_id: str, num_tokens: int
+    ) -> list[KVCacheBlock]:
         """
-        Allocate new blocks for the request to give it at least `num_tokens` 
+        Allocate new blocks for the request to give it at least `num_tokens`
         token slots.
 
         Args:
             request_id: The request ID.
-            num_tokens: The total number of tokens that need a slot (including 
+            num_tokens: The total number of tokens that need a slot (including
                 tokens that are already allocated).
 
         Returns:
@@ -136,7 +144,7 @@ def cache_blocks(self, request: Request, num_tokens: int) -> None:
 
         Args:
             request: The request.
-            num_tokens: The total number of tokens that need to be cached 
+            num_tokens: The total number of tokens that need to be cached
                 (including tokens that are already cached).
         """
         num_cached_blocks = self.num_cached_block[request.request_id]
@@ -174,8 +182,9 @@ def free(self, request_id: str) -> None:
         self.num_cached_block.pop(request_id, None)
 
     @abstractmethod
-    def get_num_common_prefix_blocks(self, request_id: str,
-                                     num_running_requests: int) -> int:
+    def get_num_common_prefix_blocks(
+        self, request_id: str, num_running_requests: int
+    ) -> int:
         """
         Get the number of common prefix blocks for all requests in the RUNNING
         state.
@@ -205,12 +214,12 @@ def find_longest_cache_hit(
         dcp_world_size: int = 1,
     ) -> tuple[list[KVCacheBlock], ...]:
         """
-        Get the longest cache hit prefix of the blocks that is not longer than 
-        `max_length`. The prefix should be a common prefix hit for all the 
-        kv cache groups in `kv_cache_group_ids`. If no cache hit is found, 
-        return an empty list. 
-        If eagle is enabled, drop the last matched block to force recompute the 
-        last block to get the required hidden states for eagle drafting head. 
+        Get the longest cache hit prefix of the blocks that is not longer than
+        `max_length`. The prefix should be a common prefix hit for all the
+        kv cache groups in `kv_cache_group_ids`. If no cache hit is found,
+        return an empty list.
+        If eagle is enabled, drop the last matched block to force recompute the
+        last block to get the required hidden states for eagle drafting head.
         Need to be customized for each attention type.
 
         Args:
@@ -235,10 +244,9 @@ def find_longest_cache_hit(
         raise NotImplementedError
 
     @abstractmethod
-    def remove_skipped_blocks(self, request_id: str,
-                              num_computed_tokens: int) -> None:
+    def remove_skipped_blocks(self, request_id: str, num_computed_tokens: int) -> None:
         """
-        Remove the blocks that are no longer needed from `blocks` and free the 
+        Remove the blocks that are no longer needed from `blocks` and free the
         blocks. The removed blocks should be replaced by null_block.
         Need to be customized for each attention type.
 
@@ -250,7 +258,6 @@ def remove_skipped_blocks(self, request_id: str,
 
 
 class FullAttentionManager(SingleTypeKVCacheManager):
-
     @classmethod
     def find_longest_cache_hit(
         cls,
@@ -264,10 +271,13 @@ def find_longest_cache_hit(
     ) -> tuple[list[KVCacheBlock], ...]:
         assert isinstance(
             kv_cache_spec, (FullAttentionSpec, ChunkedLocalAttentionSpec)
-        ), "FullAttentionManager can only be used for full attention " \
+        ), (
+            "FullAttentionManager can only be used for full attention "
             "and chunked local attention groups"
+        )
         computed_blocks: tuple[list[KVCacheBlock], ...] = tuple(
-            [] for _ in range(len(kv_cache_group_ids)))
+            [] for _ in range(len(kv_cache_group_ids))
+        )
         block_size = kv_cache_spec.block_size
         if dcp_world_size > 1:
             block_size *= dcp_world_size
@@ -277,7 +287,8 @@ def find_longest_cache_hit(
             # in the cached_block_hash_to_id, the following block hashes are
             # not computed yet for sure.
             if cached_block := block_pool.get_cached_block(
-                    block_hash, kv_cache_group_ids):
+                block_hash, kv_cache_group_ids
+            ):
                 for computed, cached in zip(computed_blocks, cached_block):
                     computed.append(cached)
             else:
@@ -287,13 +298,13 @@ def find_longest_cache_hit(
                 computed.pop()
         return computed_blocks
 
-    def remove_skipped_blocks(self, request_id: str,
-                              num_computed_tokens: int) -> None:
+    def remove_skipped_blocks(self, request_id: str, num_computed_tokens: int) -> None:
         # No need to remove blocks for full attention.
         pass
 
-    def get_num_common_prefix_blocks(self, request_id: str,
-                                     num_running_requests: int) -> int:
+    def get_num_common_prefix_blocks(
+        self, request_id: str, num_running_requests: int
+    ) -> int:
         blocks = self.req_to_blocks[request_id]
         num_common_blocks = 0
         for block in blocks:
@@ -305,9 +316,9 @@ def get_num_common_prefix_blocks(self, request_id: str,
 
 
 class SlidingWindowManager(SingleTypeKVCacheManager):
-
-    def __init__(self, kv_cache_spec: SlidingWindowSpec, block_pool: BlockPool,
-                 **kwargs) -> None:
+    def __init__(
+        self, kv_cache_spec: SlidingWindowSpec, block_pool: BlockPool, **kwargs
+    ) -> None:
         super().__init__(kv_cache_spec, block_pool, **kwargs)
         self.sliding_window = kv_cache_spec.sliding_window
         self._null_block = block_pool.null_block
@@ -324,13 +335,15 @@ def find_longest_cache_hit(
         dcp_world_size: int = 1,
     ) -> tuple[list[KVCacheBlock], ...]:
         assert isinstance(kv_cache_spec, SlidingWindowSpec), (
-            "SlidingWindowManager can only be used for sliding window groups")
+            "SlidingWindowManager can only be used for sliding window groups"
+        )
         assert dcp_world_size == 1, "DCP not support sliding window attn now."
 
         # The number of contiguous blocks needed for prefix cache hit.
         # -1 since the input token itself is also included in the window
         sliding_window_contiguous_blocks = cdiv(
-            kv_cache_spec.sliding_window - 1, kv_cache_spec.block_size)
+            kv_cache_spec.sliding_window - 1, kv_cache_spec.block_size
+        )
         if use_eagle:
             # Need to drop the last matched block if eagle is enabled. For
             # sliding window layer, we achieve this by increasing the number of
@@ -344,14 +357,17 @@ def find_longest_cache_hit(
         # sliding_window_contiguous_blocks),
         # which is good for low cache hit rate scenarios.
         max_num_blocks = max_length // kv_cache_spec.block_size
-        computed_blocks = tuple([block_pool.null_block] * max_num_blocks
-                                for _ in range(len(kv_cache_group_ids)))
+        computed_blocks = tuple(
+            [block_pool.null_block] * max_num_blocks
+            for _ in range(len(kv_cache_group_ids))
+        )
         num_contiguous_blocks = 0
         match_found = False
         # Search from right to left and early stop when a match is found.
         for i in range(max_num_blocks - 1, -1, -1):
             if cached_block := block_pool.get_cached_block(
-                    block_hashes[i], kv_cache_group_ids):
+                block_hashes[i], kv_cache_group_ids
+            ):
                 for computed, cached in zip(computed_blocks, cached_block):
                     computed[i] = cached
                 num_contiguous_blocks += 1
@@ -360,7 +376,7 @@ def find_longest_cache_hit(
                     # E.g., [NULL, NULL, 8, 3, NULL, 9] -> [NULL, NULL, 8, 3]
                     # when sliding_window_contiguous_blocks=2.
                     for computed in computed_blocks:
-                        del computed[i + num_contiguous_blocks:]
+                        del computed[i + num_contiguous_blocks :]
                     match_found = True
                     break
             else:
@@ -375,8 +391,7 @@ def find_longest_cache_hit(
                 computed.pop()
         return computed_blocks
 
-    def remove_skipped_blocks(self, request_id: str,
-                              num_computed_tokens: int) -> None:
+    def remove_skipped_blocks(self, request_id: str, num_computed_tokens: int) -> None:
         # Remove the blocks that are no longer be in the sliding window and
         # skipped during the attention computation.
         last_useful_token = num_computed_tokens - self.sliding_window + 1
@@ -393,21 +408,22 @@ def remove_skipped_blocks(self, request_id: str,
             blocks[i] = self._null_block
         self.block_pool.free_blocks(removed_blocks)
 
-    def get_num_common_prefix_blocks(self, request_id: str,
-                                     num_running_requests: int) -> int:
+    def get_num_common_prefix_blocks(
+        self, request_id: str, num_running_requests: int
+    ) -> int:
         """
         NOTE(Chen): The prefix blocks are null blocks for sliding window layers.
-        So it's not correct to count ref_cnt like FullAttentionManager. Return 
-        0 here for correctness. Need to support cascade attention + sliding 
+        So it's not correct to count ref_cnt like FullAttentionManager. Return
+        0 here for correctness. Need to support cascade attention + sliding
         window in the future.
         """
         return 0
 
 
 class ChunkedLocalAttentionManager(SingleTypeKVCacheManager):
-
-    def __init__(self, kv_cache_spec: ChunkedLocalAttentionSpec,
-                 block_pool: BlockPool, **kwargs) -> None:
+    def __init__(
+        self, kv_cache_spec: ChunkedLocalAttentionSpec, block_pool: BlockPool, **kwargs
+    ) -> None:
         super().__init__(kv_cache_spec, block_pool, **kwargs)
         self.attention_chunk_size = kv_cache_spec.attention_chunk_size
         self._null_block = block_pool.null_block
@@ -428,19 +444,19 @@ def find_longest_cache_hit(
         prefix of the blocks that is not longer than `max_length`. The prefix
         should be a common prefix hit for all the kv cache groups in
         `kv_cache_group_ids`. If no cache hit is found, return an empty list.
-        note we mark as computed if the whole block is outside of the local 
+        note we mark as computed if the whole block is outside of the local
         window, and set the block as null. Examples:
 
         1. Attention chunk size of 8, block size of 4, max length of 15
-        for next token at 15th (zero-indexed), 8th - 14th tokens are in 
-        the window(needs lookup), 0th - 7th are not in the window, 
-        so they are already marked as computed. We check the complete 
-        block3 (8th - 11th tokens), Assume block 3 is hit, we will return 
+        for next token at 15th (zero-indexed), 8th - 14th tokens are in
+        the window(needs lookup), 0th - 7th are not in the window,
+        so they are already marked as computed. We check the complete
+        block3 (8th - 11th tokens), Assume block 3 is hit, we will return
         [null, null, block 3], otherwise, we return [null, null]
 
         2. Attention chunk size of 8, block size of 4, max length of 16
-        for next token at 16th (zero-indexed), 0th - 15th tokens are not 
-        in the window, so they are already marked as computed. 
+        for next token at 16th (zero-indexed), 0th - 15th tokens are not
+        in the window, so they are already marked as computed.
         we return 4 blocks[null, null, null, null]
 
         Args:
@@ -455,39 +471,45 @@ def find_longest_cache_hit(
             A list of cached blocks
         """
         assert isinstance(kv_cache_spec, ChunkedLocalAttentionSpec), (
-            "ChunkedLocalAttentionManager can only be used for " +
-            "chunked local attention groups")
-        assert use_eagle is False, ("Hybrid KV cache is not supported for " +
-                                    "eagle + chunked local attention.")
+            "ChunkedLocalAttentionManager can only be used for "
+            + "chunked local attention groups"
+        )
+        assert use_eagle is False, (
+            "Hybrid KV cache is not supported for " + "eagle + chunked local attention."
+        )
         assert dcp_world_size == 1, "DCP not support chunked local attn now."
         max_num_blocks = max_length // kv_cache_spec.block_size
         if max_length > 0:
-            local_attention_start_idx = (max_length //
-                                         kv_cache_spec.attention_chunk_size *
-                                         kv_cache_spec.attention_chunk_size)
+            local_attention_start_idx = (
+                max_length
+                // kv_cache_spec.attention_chunk_size
+                * kv_cache_spec.attention_chunk_size
+            )
         else:
             local_attention_start_idx = 0
         # we marked blocks out of window as computed
         # with null blocks, and blocks inside window based on cache lookup
         # result [null] [null] ... [null] [hit block 1 (1st block contain
         # last window)] [hit block 2] ... [hit block x]
-        local_attention_start_block_idx = (local_attention_start_idx //
-                                           kv_cache_spec.block_size)
+        local_attention_start_block_idx = (
+            local_attention_start_idx // kv_cache_spec.block_size
+        )
         computed_blocks: tuple[list[KVCacheBlock], ...] = tuple(
             [block_pool.null_block] * local_attention_start_block_idx
-            for _ in range(len(kv_cache_group_ids)))
+            for _ in range(len(kv_cache_group_ids))
+        )
         for i in range(local_attention_start_block_idx, max_num_blocks):
             block_hash = block_hashes[i]
             if cached_block := block_pool.get_cached_block(
-                    block_hash, kv_cache_group_ids):
+                block_hash, kv_cache_group_ids
+            ):
                 for computed, cached in zip(computed_blocks, cached_block):
                     computed.append(cached)
             else:
                 break
         return computed_blocks
 
-    def remove_skipped_blocks(self, request_id: str,
-                              num_computed_tokens: int) -> None:
+    def remove_skipped_blocks(self, request_id: str, num_computed_tokens: int) -> None:
         # Remove the blocks that are no longer be in the chunked attention
         # window and skipped during the attention computation.
 
@@ -499,13 +521,14 @@ def remove_skipped_blocks(self, request_id: str,
         # is 1024. for 1023, it will be 0.
         num_cached_block = self.num_cached_block.get(request_id, 0)
         local_attention_start_idx = (
-            num_computed_tokens
-        ) // self.attention_chunk_size * self.attention_chunk_size
+            (num_computed_tokens)
+            // self.attention_chunk_size
+            * self.attention_chunk_size
+        )
         first_useful_block_idx = local_attention_start_idx // self.block_size
         if num_cached_block > 0:
             # Make sure we don't delete the last cached block
-            first_useful_block_idx = min(first_useful_block_idx,
-                                         num_cached_block - 1)
+            first_useful_block_idx = min(first_useful_block_idx, num_cached_block - 1)
         # if block size = 128, 0 -> block 0, 1024 (= 128 * 8) ->
         # block 8, 372 (= 128 * 2 + 116) -> block 2
         blocks = self.req_to_blocks[request_id]
@@ -521,8 +544,9 @@ def remove_skipped_blocks(self, request_id: str,
             blocks[i] = self._null_block
         self.block_pool.free_blocks(removed_blocks)
 
-    def get_num_common_prefix_blocks(self, request_id: str,
-                                     num_running_requests: int) -> int:
+    def get_num_common_prefix_blocks(
+        self, request_id: str, num_running_requests: int
+    ) -> int:
         """
         cascade attention is not supported by chunked local attention.
         """
@@ -530,7 +554,6 @@ def get_num_common_prefix_blocks(self, request_id: str,
 
 
 class MambaManager(SingleTypeKVCacheManager):
-
     @classmethod
     def find_longest_cache_hit(
         cls,
@@ -542,18 +565,20 @@ def find_longest_cache_hit(
         use_eagle: bool,
         dcp_world_size: int = 1,
     ) -> tuple[list[KVCacheBlock], ...]:
-        assert isinstance(
-            kv_cache_spec,
-            MambaSpec), ("MambaManager can only be used for mamba groups")
+        assert isinstance(kv_cache_spec, MambaSpec), (
+            "MambaManager can only be used for mamba groups"
+        )
         assert dcp_world_size == 1, "DCP not support mamba now."
         computed_blocks: tuple[list[KVCacheBlock], ...] = tuple(
-            [] for _ in range(len(kv_cache_group_ids)))
+            [] for _ in range(len(kv_cache_group_ids))
+        )
 
         max_num_blocks = max_length // kv_cache_spec.block_size
         # Search from right to left and early stop when a match is found.
         for i in range(max_num_blocks - 1, -1, -1):
             if cached_block := block_pool.get_cached_block(
-                    block_hashes[i], kv_cache_group_ids):
+                block_hashes[i], kv_cache_group_ids
+            ):
                 for computed, cached in zip(computed_blocks, cached_block):
                     # the hit length logic later assumes:
                     #  hit_length = len(hit_blocks_other_attn[0])
@@ -566,40 +591,46 @@ def find_longest_cache_hit(
 
         return computed_blocks
 
-    def remove_skipped_blocks(self, request_id: str,
-                              num_computed_tokens: int) -> None:
+    def remove_skipped_blocks(self, request_id: str, num_computed_tokens: int) -> None:
         # Here unused blocks may be freed up for running requests.
         # TODO(@s3woz) Free up all blocks that aren't needed by Mamba2
         #  (for which find_longest_cache_hit returns block_pool.null_block)
         pass
 
-    def get_num_common_prefix_blocks(self, request_id: str,
-                                     num_running_requests: int) -> int:
+    def get_num_common_prefix_blocks(
+        self, request_id: str, num_running_requests: int
+    ) -> int:
         """
         cascade attention is not supported by mamba
         """
         return 0
 
     def get_num_blocks_to_allocate(
-            self, request_id: str, num_tokens: int,
-            new_computed_blocks: list[KVCacheBlock]) -> int:
+        self, request_id: str, num_tokens: int, new_computed_blocks: list[KVCacheBlock]
+    ) -> int:
         # Allocate extra `num_speculative_blocks` blocks for
         # speculative decoding (MTP/EAGLE) with linear attention.
         assert isinstance(self.kv_cache_spec, MambaSpec)
         if self.kv_cache_spec.num_speculative_blocks > 0:
-            num_tokens += (self.kv_cache_spec.block_size *
-                           self.kv_cache_spec.num_speculative_blocks)
-        return super().get_num_blocks_to_allocate(request_id, num_tokens,
-                                                  new_computed_blocks)
+            num_tokens += (
+                self.kv_cache_spec.block_size
+                * self.kv_cache_spec.num_speculative_blocks
+            )
+        return super().get_num_blocks_to_allocate(
+            request_id, num_tokens, new_computed_blocks
+        )
 
-    def allocate_new_blocks(self, request_id: str,
-                            num_tokens: int) -> list[KVCacheBlock]:
+    def allocate_new_blocks(
+        self, request_id: str, num_tokens: int
+    ) -> list[KVCacheBlock]:
         # Allocate extra `num_speculative_blocks` blocks for
         # speculative decoding (MTP/EAGLE) with linear attention.
         assert isinstance(self.kv_cache_spec, MambaSpec)
         if self.kv_cache_spec.num_speculative_blocks > 0:
-            num_tokens += (self.kv_cache_spec.block_size *
-                           self.kv_cache_spec.num_speculative_blocks)
+            num_tokens += (
+                self.kv_cache_spec.block_size
+                * self.kv_cache_spec.num_speculative_blocks
+            )
         return super().allocate_new_blocks(request_id, num_tokens)
 
 
@@ -607,8 +638,8 @@ class CrossAttentionManager(SingleTypeKVCacheManager):
     """Manager for cross-attention KV cache in encoder-decoder models."""
 
     def save_new_computed_blocks(
-            self, request_id: str,
-            new_computed_blocks: list[KVCacheBlock]) -> None:
+        self, request_id: str, new_computed_blocks: list[KVCacheBlock]
+    ) -> None:
         # We do not cache blocks for cross-attention to be shared between
         # requests, so  `new_computed_blocks` should always be empty.
         assert len(new_computed_blocks) == 0
@@ -618,8 +649,9 @@ def cache_blocks(self, request: Request, num_tokens: int) -> None:
         # requests, so this method is not relevant.
         raise ValueError("Should not be called as prefix caching is disabled.")
 
-    def get_num_common_prefix_blocks(self, request_id: str,
-                                     num_running_requests: int) -> int:
+    def get_num_common_prefix_blocks(
+        self, request_id: str, num_running_requests: int
+    ) -> int:
         # Cross-attention blocks contain request-specific encoder states
         # and are not shared between different requests
         return 0
@@ -644,11 +676,9 @@ def find_longest_cache_hit(
         # 2. Encoder states are computed once per request, not incrementally
         # 3. No reusable prefix exists between different multimodal inputs
         # Return empty blocks to indicate no cache hits
-        raise NotImplementedError(
-            "CrossAttentionManager does not support caching")
+        raise NotImplementedError("CrossAttentionManager does not support caching")
 
-    def remove_skipped_blocks(self, request_id: str,
-                              num_computed_tokens: int) -> None:
+    def remove_skipped_blocks(self, request_id: str, num_computed_tokens: int) -> None:
         # Cross-attention blocks represent encoder states which are needed
         # for the entire decoding process, so no blocks should be skipped
         pass
@@ -664,8 +694,9 @@ def remove_skipped_blocks(self, request_id: str,
 }
 
 
-def get_manager_for_kv_cache_spec(kv_cache_spec: KVCacheSpec,
-                                  **kwargs) -> SingleTypeKVCacheManager:
+def get_manager_for_kv_cache_spec(
+    kv_cache_spec: KVCacheSpec, **kwargs
+) -> SingleTypeKVCacheManager:
     manager_class = spec_manager_map[type(kv_cache_spec)]
     manager = manager_class(kv_cache_spec, **kwargs)
     return manager
diff --git a/vllm/v1/cudagraph_dispatcher.py b/vllm/v1/cudagraph_dispatcher.py
index 29bb220760c0..ce4714702869 100644
--- a/vllm/v1/cudagraph_dispatcher.py
+++ b/vllm/v1/cudagraph_dispatcher.py
@@ -12,14 +12,14 @@ class CudagraphDispatcher:
     cudagraphs.
 
     The dispatcher stores two sets of dispatch keys, one for PIECEWISE and one
-    for FULL cudagraph runtime mode. The keys are initialized depending on 
-    attention support and what cudagraph mode is set in CompilationConfig. The 
+    for FULL cudagraph runtime mode. The keys are initialized depending on
+    attention support and what cudagraph mode is set in CompilationConfig. The
     keys stored in dispatcher are the only source of truth for valid
     cudagraphs that can be dispatched at runtime.
 
-    At runtime, the dispatch method generates the runtime cudagraph mode (FULL, 
+    At runtime, the dispatch method generates the runtime cudagraph mode (FULL,
     PIECEWISE, or NONE for no cudagraph) and the valid key (batch descriptor)
-    based on the input key. After dispatching (communicated via forward 
+    based on the input key. After dispatching (communicated via forward
     context), the cudagraph wrappers will trust the dispatch key to either
     capture or replay (if the mode matches), or pass through to the underlying
     runnable without cudagraph (if the mode does not match or mode is NONE).
@@ -37,28 +37,35 @@ def __init__(self, vllm_config: VllmConfig):
         }
 
         not_use_piecewise_compilation = (
-            not self.cudagraph_mode.requires_piecewise_compilation())
-
-        assert not_use_piecewise_compilation or \
-            self.compilation_config.is_attention_compiled_piecewise(), \
-            "Compilation level should be CompilationLevel.PIECEWISE when "\
-            "cudagraph_mode piecewise cudagraphs is used, "\
-            "and attention should be in splitting_ops or "\
-            "inductor splitting should be used. " \
-            f"cudagraph_mode={self.cudagraph_mode}, "\
-            f"compilation_level={self.compilation_config.level}, "\
+            not self.cudagraph_mode.requires_piecewise_compilation()
+        )
+
+        assert (
+            not_use_piecewise_compilation
+            or self.compilation_config.is_attention_compiled_piecewise()
+        ), (
+            "Compilation level should be CompilationLevel.PIECEWISE when "
+            "cudagraph_mode piecewise cudagraphs is used, "
+            "and attention should be in splitting_ops or "
+            "inductor splitting should be used. "
+            f"cudagraph_mode={self.cudagraph_mode}, "
+            f"compilation_level={self.compilation_config.level}, "
             f"splitting_ops={self.compilation_config.splitting_ops}"
+        )
 
         self.keys_initialized = False
 
-    def add_cudagraph_key(self, runtime_mode: CUDAGraphMode,
-                          batch_descriptor: BatchDescriptor):
-        assert runtime_mode in [CUDAGraphMode.PIECEWISE, CUDAGraphMode.FULL], \
+    def add_cudagraph_key(
+        self, runtime_mode: CUDAGraphMode, batch_descriptor: BatchDescriptor
+    ):
+        assert runtime_mode in [CUDAGraphMode.PIECEWISE, CUDAGraphMode.FULL], (
             f"Invalid cudagraph runtime mode for keys: {runtime_mode}"
+        )
         self.cudagraph_keys[runtime_mode].add(batch_descriptor)
 
-    def initialize_cudagraph_keys(self, cudagraph_mode: CUDAGraphMode,
-                                  uniform_decode_query_len: int):
+    def initialize_cudagraph_keys(
+        self, cudagraph_mode: CUDAGraphMode, uniform_decode_query_len: int
+    ):
         # This should be called only after attention backend is initialized.
 
         # Note: we create all valid keys for cudagraph here but do not
@@ -68,33 +75,38 @@ def initialize_cudagraph_keys(self, cudagraph_mode: CUDAGraphMode,
             for bs in self.compilation_config.cudagraph_capture_sizes:
                 self.add_cudagraph_key(
                     cudagraph_mode.mixed_mode(),
-                    BatchDescriptor(num_tokens=bs, uniform_decode=False))
+                    BatchDescriptor(num_tokens=bs, uniform_decode=False),
+                )
 
         # if decode cudagraph mode is FULL, and we don't already have mixed
         # mode full cudagraphs then add them here.
-        if cudagraph_mode.decode_mode() == CUDAGraphMode.FULL \
-            and cudagraph_mode.separate_routine():
-            max_num_tokens = uniform_decode_query_len * \
-                self.vllm_config.scheduler_config.max_num_seqs
+        if (
+            cudagraph_mode.decode_mode() == CUDAGraphMode.FULL
+            and cudagraph_mode.separate_routine()
+        ):
+            max_num_tokens = (
+                uniform_decode_query_len
+                * self.vllm_config.scheduler_config.max_num_seqs
+            )
             cudagraph_capture_sizes_for_decode = [
-                x for x in self.compilation_config.cudagraph_capture_sizes
+                x
+                for x in self.compilation_config.cudagraph_capture_sizes
                 if x <= max_num_tokens and x >= uniform_decode_query_len
             ]
             for bs in cudagraph_capture_sizes_for_decode:
                 self.add_cudagraph_key(
                     CUDAGraphMode.FULL,
-                    BatchDescriptor(num_tokens=bs, uniform_decode=True))
+                    BatchDescriptor(num_tokens=bs, uniform_decode=True),
+                )
         self.keys_initialized = True
 
     def dispatch(
-        self,
-        batch_descriptor: BatchDescriptor,
-        use_cascade_attn: bool = False
+        self, batch_descriptor: BatchDescriptor, use_cascade_attn: bool = False
     ) -> tuple[CUDAGraphMode, Optional[BatchDescriptor]]:
         """
         Given conditions(e.g.,batch descriptor and if using cascade attention),
         dispatch to a cudagraph runtime mode and the valid batch descriptor.
-        A new batch descriptor is returned as we might dispatch a uniform batch 
+        A new batch descriptor is returned as we might dispatch a uniform batch
         to a graph that supports a more general batch (uniform to non-uniform).
         """
         # if not initialized, just skip dispatching.
diff --git a/vllm/v1/engine/__init__.py b/vllm/v1/engine/__init__.py
index 345f5a464c2c..163c050e559e 100644
--- a/vllm/v1/engine/__init__.py
+++ b/vllm/v1/engine/__init__.py
@@ -32,6 +32,7 @@ class FinishReason(enum.IntEnum):
     abort - aborted for another reason
 
     """
+
     STOP = 0
     LENGTH = 1
     ABORT = 2
@@ -41,11 +42,11 @@ def __str__(self):
 
 
 class EngineCoreRequest(
-        msgspec.Struct,
-        array_like=True,  # type: ignore[call-arg]
-        omit_defaults=True,  # type: ignore[call-arg]
-        gc=False):  # type: ignore[call-arg]
-
+    msgspec.Struct,
+    array_like=True,  # type: ignore[call-arg]
+    omit_defaults=True,  # type: ignore[call-arg]
+    gc=False,
+):  # type: ignore[call-arg]
     request_id: str
     prompt_token_ids: Optional[list[int]]
     mm_features: Optional[list[MultiModalFeatureSpec]]
@@ -73,6 +74,7 @@ class EngineCoreRequest(
 
 class EngineCoreEventType(enum.IntEnum):
     """The type of engine core request event."""
+
     QUEUED = 1
     SCHEDULED = 2
     PREEMPTED = 3
@@ -85,23 +87,24 @@ class EngineCoreEvent(msgspec.Struct):
     frontend to calculate intervals between engine core events. These
     timestamps should not be compared with timestamps from other processes.
     """
+
     type: EngineCoreEventType
     timestamp: float
 
     @classmethod
-    def new_event(cls,
-                  event_type: EngineCoreEventType,
-                  timestamp: Optional[float] = None) -> "EngineCoreEvent":
+    def new_event(
+        cls, event_type: EngineCoreEventType, timestamp: Optional[float] = None
+    ) -> "EngineCoreEvent":
         timestamp = time.monotonic() if timestamp is None else timestamp
         return cls(event_type, timestamp)
 
 
 class EngineCoreOutput(
-        msgspec.Struct,
-        array_like=True,  # type: ignore[call-arg]
-        omit_defaults=True,  # type: ignore[call-arg]
-        gc=False):  # type: ignore[call-arg]
-
+    msgspec.Struct,
+    array_like=True,  # type: ignore[call-arg]
+    omit_defaults=True,  # type: ignore[call-arg]
+    gc=False,
+):  # type: ignore[call-arg]
     request_id: str
     new_token_ids: list[int]
 
@@ -132,10 +135,10 @@ def __init__(self, r: Any = None):
 
 
 class UtilityOutput(
-        msgspec.Struct,
-        array_like=True,  # type: ignore[call-arg]
-        gc=False):  # type: ignore[call-arg]
-
+    msgspec.Struct,
+    array_like=True,  # type: ignore[call-arg]
+    gc=False,
+):  # type: ignore[call-arg]
     call_id: int
 
     # Non-None implies the call failed, result should be None.
@@ -144,11 +147,11 @@ class UtilityOutput(
 
 
 class EngineCoreOutputs(
-        msgspec.Struct,
-        array_like=True,  # type: ignore[call-arg]
-        omit_defaults=True,  # type: ignore[call-arg]
-        gc=False):  # type: ignore[call-arg]
-
+    msgspec.Struct,
+    array_like=True,  # type: ignore[call-arg]
+    omit_defaults=True,  # type: ignore[call-arg]
+    gc=False,
+):  # type: ignore[call-arg]
     # NOTE(Nick): We could consider ways to make this more compact,
     # e.g. columnwise layout
 
@@ -179,12 +182,13 @@ class EngineCoreRequestType(enum.Enum):
     Request types defined as hex byte strings, so it can be sent over sockets
     without separate encoding step.
     """
-    ADD = b'\x00'
-    ABORT = b'\x01'
-    START_DP_WAVE = b'\x02'
-    UTILITY = b'\x03'
+
+    ADD = b"\x00"
+    ABORT = b"\x01"
+    START_DP_WAVE = b"\x02"
+    UTILITY = b"\x03"
     # Sentinel used within EngineCoreProc.
-    EXECUTOR_FAILED = b'\x04'
+    EXECUTOR_FAILED = b"\x04"
 
 
 class ReconfigureDistributedRequest(msgspec.Struct):
@@ -199,5 +203,6 @@ class ReconfigureRankType(enum.IntEnum):
     """
     Rank type for reconfiguring distributed request.
     """
+
     KEEP_CURRENT_RANK = -1
     SHUTDOWN_CURRENT_RANK = -2
diff --git a/vllm/v1/engine/async_llm.py b/vllm/v1/engine/async_llm.py
index ab3a4e5e6fe5..ca668bc217e1 100644
--- a/vllm/v1/engine/async_llm.py
+++ b/vllm/v1/engine/async_llm.py
@@ -27,18 +27,14 @@
 from vllm.sampling_params import SamplingParams
 from vllm.tasks import SupportedTask
 from vllm.tracing import init_tracer
-from vllm.transformers_utils.config import (
-    maybe_register_config_serialize_by_value)
-from vllm.transformers_utils.tokenizer import (AnyTokenizer,
-                                               init_tokenizer_from_configs)
+from vllm.transformers_utils.config import maybe_register_config_serialize_by_value
+from vllm.transformers_utils.tokenizer import AnyTokenizer, init_tokenizer_from_configs
 from vllm.usage.usage_lib import UsageContext
-from vllm.utils import (Device, as_list, cancel_task_threadsafe, cdiv,
-                        deprecate_kwargs)
+from vllm.utils import Device, as_list, cancel_task_threadsafe, cdiv, deprecate_kwargs
 from vllm.v1.engine import EngineCoreRequest
 from vllm.v1.engine.core_client import EngineCoreClient
 from vllm.v1.engine.exceptions import EngineDeadError, EngineGenerateError
-from vllm.v1.engine.output_processor import (OutputProcessor,
-                                             RequestOutputCollector)
+from vllm.v1.engine.output_processor import OutputProcessor, RequestOutputCollector
 from vllm.v1.engine.parallel_sampling import ParentRequest
 from vllm.v1.engine.processor import Processor
 from vllm.v1.executor.abstract import Executor
@@ -50,7 +46,6 @@
 
 
 class AsyncLLM(EngineClient):
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -91,7 +86,8 @@ def __init__(
                 "Using V1 AsyncLLMEngine, but envs.VLLM_USE_V1=False. "
                 "This should not happen. As a workaround, try using "
                 "AsyncLLMEngine.from_vllm_config(...) or explicitly set "
-                "VLLM_USE_V1=0 or 1 and report this issue on Github.")
+                "VLLM_USE_V1=0 or 1 and report this issue on Github."
+            )
 
         # Ensure we can serialize custom transformer configs
         maybe_register_config_serialize_by_value()
@@ -105,14 +101,16 @@ def __init__(
         if not log_stats and stat_loggers is not None:
             logger.info(
                 "AsyncLLM created with log_stats=False and non-empty custom "
-                "logger list; enabling logging without default stat loggers")
+                "logger list; enabling logging without default stat loggers"
+            )
 
         if self.model_config.skip_tokenizer_init:
             self.tokenizer = None
         else:
             # Tokenizer (+ ensure liveness if running in another process).
             self.tokenizer = init_tokenizer_from_configs(
-                model_config=vllm_config.model_config)
+                model_config=vllm_config.model_config
+            )
 
         # Processor (converts Inputs --> EngineCoreRequests).
         self.processor = Processor(
@@ -122,12 +120,13 @@ def __init__(
         )
 
         # OutputProcessor (converts EngineCoreOutputs --> RequestOutput).
-        self.output_processor = OutputProcessor(self.tokenizer,
-                                                log_stats=self.log_stats)
+        self.output_processor = OutputProcessor(
+            self.tokenizer, log_stats=self.log_stats
+        )
         if self.observability_config.otlp_traces_endpoint is not None:
             tracer = init_tracer(
-                "vllm.llm_engine",
-                self.observability_config.otlp_traces_endpoint)
+                "vllm.llm_engine", self.observability_config.otlp_traces_endpoint
+            )
             self.output_processor.tracer = tracer
 
         # EngineCore (starts the engine in background process).
@@ -163,7 +162,8 @@ def __init__(
         if envs.VLLM_TORCH_PROFILER_DIR:
             logger.info(
                 "Torch profiler enabled. AsyncLLM CPU traces will be collected under %s",  # noqa: E501
-                envs.VLLM_TORCH_PROFILER_DIR)
+                envs.VLLM_TORCH_PROFILER_DIR,
+            )
             worker_name = f"{socket.gethostname()}_{os.getpid()}.async_llm"
             self.profiler = torch.profiler.profile(
                 activities=[
@@ -171,37 +171,39 @@ def __init__(
                 ],
                 with_stack=envs.VLLM_TORCH_PROFILER_WITH_STACK,
                 on_trace_ready=torch.profiler.tensorboard_trace_handler(
-                    envs.VLLM_TORCH_PROFILER_DIR,
-                    worker_name=worker_name,
-                    use_gzip=True))
+                    envs.VLLM_TORCH_PROFILER_DIR, worker_name=worker_name, use_gzip=True
+                ),
+            )
         else:
             self.profiler = None
 
     @classmethod
     @deprecate_kwargs(
         "disable_log_requests",
-        additional_message=("This argument will have no effect. "
-                            "Use `enable_log_requests` instead."),
+        additional_message=(
+            "This argument will have no effect. Use `enable_log_requests` instead."
+        ),
     )
     def from_vllm_config(
-            cls,
-            vllm_config: VllmConfig,
-            start_engine_loop: bool = True,
-            usage_context: UsageContext = UsageContext.ENGINE_CONTEXT,
-            stat_loggers: Optional[list[StatLoggerFactory]] = None,
-            enable_log_requests: bool = False,
-            disable_log_stats: bool = False,
-            client_addresses: Optional[dict[str, str]] = None,
-            client_count: int = 1,
-            client_index: int = 0,
-            disable_log_requests: bool = True,  # Deprecated, will be removed
+        cls,
+        vllm_config: VllmConfig,
+        start_engine_loop: bool = True,
+        usage_context: UsageContext = UsageContext.ENGINE_CONTEXT,
+        stat_loggers: Optional[list[StatLoggerFactory]] = None,
+        enable_log_requests: bool = False,
+        disable_log_stats: bool = False,
+        client_addresses: Optional[dict[str, str]] = None,
+        client_count: int = 1,
+        client_index: int = 0,
+        disable_log_requests: bool = True,  # Deprecated, will be removed
     ) -> "AsyncLLM":
         if not envs.VLLM_USE_V1:
             raise ValueError(
                 "Using V1 AsyncLLMEngine, but envs.VLLM_USE_V1=False. "
                 "This should not happen. As a workaround, try using "
                 "AsyncLLMEngine.from_vllm_config(...) or explicitly set "
-                "VLLM_USE_V1=0 or 1 and report this issue on Github.")
+                "VLLM_USE_V1=0 or 1 and report this issue on Github."
+            )
 
         # Create the LLMEngine.
         return cls(
@@ -288,14 +290,20 @@ async def add_request(
             assert prompt_text is None
             logger.warning_once(
                 "Processor has been moved under OpenAIServing and will "
-                "be removed from AsyncLLM in v0.13.")
-            request = self.processor.process_inputs(request_id, prompt, params,
-                                                    arrival_time, lora_request,
-                                                    tokenization_kwargs,
-                                                    trace_headers, priority,
-                                                    data_parallel_rank)
-            prompt_text = (prompt if isinstance(prompt, str) else
-                           prompt.get("prompt"))
+                "be removed from AsyncLLM in v0.13."
+            )
+            request = self.processor.process_inputs(
+                request_id,
+                prompt,
+                params,
+                arrival_time,
+                lora_request,
+                tokenization_kwargs,
+                trace_headers,
+                priority,
+                data_parallel_rank,
+            )
+            prompt_text = prompt if isinstance(prompt, str) else prompt.get("prompt")
 
         if is_pooling or params.n == 1:
             await self._add_request(request, prompt_text, None, 0, queue)
@@ -310,22 +318,24 @@ async def add_request(
         parent_request = ParentRequest(request_id, parent_params)
         for idx in range(parent_params.n):
             request_id, child_params = parent_request.get_child_info(idx)
-            child_request = request if idx == parent_params.n - 1 else copy(
-                request)
+            child_request = request if idx == parent_params.n - 1 else copy(request)
             child_request.request_id = request_id
             child_request.sampling_params = child_params
-            await self._add_request(child_request, prompt_text, parent_request,
-                                    idx, queue)
+            await self._add_request(
+                child_request, prompt_text, parent_request, idx, queue
+            )
         return queue
 
-    async def _add_request(self, request: EngineCoreRequest,
-                           prompt: Optional[str],
-                           parent_req: Optional[ParentRequest], index: int,
-                           queue: RequestOutputCollector):
-
+    async def _add_request(
+        self,
+        request: EngineCoreRequest,
+        prompt: Optional[str],
+        parent_req: Optional[ParentRequest],
+        index: int,
+        queue: RequestOutputCollector,
+    ):
         # Add the request to OutputProcessor (this process).
-        self.output_processor.add_request(request, prompt, parent_req, index,
-                                          queue)
+        self.output_processor.add_request(request, prompt, parent_req, index, queue)
 
         # Add the EngineCoreRequest to EngineCore (separate process).
         await self.engine_core.add_request_async(request)
@@ -366,12 +376,15 @@ async def generate(
         returning the RequestOutput back to the caller.
         """
 
-        if (self.vllm_config.cache_config.kv_sharing_fast_prefill
-                and sampling_params.prompt_logprobs):
+        if (
+            self.vllm_config.cache_config.kv_sharing_fast_prefill
+            and sampling_params.prompt_logprobs
+        ):
             raise ValueError(
                 "--kv-sharing-fast-prefill produces incorrect logprobs for "
                 "prompt tokens, please disable it when the requests need "
-                "prompt logprobs")
+                "prompt logprobs"
+            )
 
         try:
             # We start the output_handler on the first call to generate() so
@@ -389,15 +402,17 @@ async def generate(
                     tokenization_kwargs,
                 )
 
-            q = await self.add_request(request_id,
-                                       prompt,
-                                       sampling_params,
-                                       lora_request=lora_request,
-                                       tokenization_kwargs=tokenization_kwargs,
-                                       trace_headers=trace_headers,
-                                       priority=priority,
-                                       data_parallel_rank=data_parallel_rank,
-                                       prompt_text=prompt_text)
+            q = await self.add_request(
+                request_id,
+                prompt,
+                sampling_params,
+                lora_request=lora_request,
+                tokenization_kwargs=tokenization_kwargs,
+                trace_headers=trace_headers,
+                priority=priority,
+                data_parallel_rank=data_parallel_rank,
+                prompt_text=prompt_text,
+            )
 
             # The output_handler task pushes items into the queue.
             # This task pulls from the queue and yields to caller.
@@ -460,23 +475,26 @@ async def output_handler():
                     outputs = await engine_core.get_output_async()
                     num_outputs = len(outputs.outputs)
 
-                    iteration_stats = IterationStats() if (
-                        log_stats and num_outputs) else None
+                    iteration_stats = (
+                        IterationStats() if (log_stats and num_outputs) else None
+                    )
 
                     # Split outputs into chunks of at most
                     # VLLM_V1_OUTPUT_PROC_CHUNK_SIZE, so that we don't block the
                     # event loop for too long.
                     if num_outputs <= VLLM_V1_OUTPUT_PROC_CHUNK_SIZE:
-                        slices = (outputs.outputs, )
+                        slices = (outputs.outputs,)
                     else:
                         slices = np.array_split(
                             outputs.outputs,
-                            cdiv(num_outputs, VLLM_V1_OUTPUT_PROC_CHUNK_SIZE))
+                            cdiv(num_outputs, VLLM_V1_OUTPUT_PROC_CHUNK_SIZE),
+                        )
 
                     for i, outputs_slice in enumerate(slices):
                         # 2) Process EngineCoreOutputs.
                         processed_outputs = output_processor.process_outputs(
-                            outputs_slice, outputs.timestamp, iteration_stats)
+                            outputs_slice, outputs.timestamp, iteration_stats
+                        )
                         # NOTE: RequestOutputs are pushed to their queues.
                         assert not processed_outputs.request_outputs
 
@@ -486,7 +504,8 @@ async def output_handler():
 
                         # 3) Abort any reqs that finished due to stop strings.
                         await engine_core.abort_requests_async(
-                            processed_outputs.reqs_to_abort)
+                            processed_outputs.reqs_to_abort
+                        )
 
                     # 4) Logging.
                     # TODO(rob): make into a coroutine and launch it in
@@ -506,8 +525,9 @@ async def output_handler():
     async def abort(self, request_id: Union[str, Iterable[str]]) -> None:
         """Abort RequestId in OutputProcessor and EngineCore."""
 
-        request_ids = (request_id, ) if isinstance(
-            request_id, str) else as_list(request_id)
+        request_ids = (
+            (request_id,) if isinstance(request_id, str) else as_list(request_id)
+        )
         all_request_ids = self.output_processor.abort_requests(request_ids)
         await self.engine_core.abort_requests_async(all_request_ids)
 
@@ -614,8 +634,9 @@ async def get_input_preprocessor(self) -> InputPreprocessor:
 
     async def get_tokenizer(self) -> AnyTokenizer:
         if self.tokenizer is None:
-            raise ValueError("Unable to get tokenizer because "
-                             "skip_tokenizer_init is True")
+            raise ValueError(
+                "Unable to get tokenizer because skip_tokenizer_init is True"
+            )
 
         return self.tokenizer
 
@@ -647,8 +668,7 @@ async def reset_mm_cache(self) -> None:
         self.processor.clear_cache()
         await self.engine_core.reset_mm_cache_async()
 
-    async def reset_prefix_cache(self,
-                                 device: Optional[Device] = None) -> None:
+    async def reset_prefix_cache(self, device: Optional[Device] = None) -> None:
         if device == Device.CPU:
             raise ValueError("Not supported on CPU.")
         await self.engine_core.reset_prefix_cache_async()
@@ -679,16 +699,19 @@ async def pin_lora(self, lora_id: int) -> bool:
         """Prevent an adapter from being evicted."""
         return await self.engine_core.pin_lora_async(lora_id)
 
-    async def collective_rpc(self,
-                             method: str,
-                             timeout: Optional[float] = None,
-                             args: tuple = (),
-                             kwargs: Optional[dict] = None):
+    async def collective_rpc(
+        self,
+        method: str,
+        timeout: Optional[float] = None,
+        args: tuple = (),
+        kwargs: Optional[dict] = None,
+    ):
         """
         Perform a collective RPC call to the given path.
         """
         return await self.engine_core.collective_rpc_async(
-            method, timeout, args, kwargs)
+            method, timeout, args, kwargs
+        )
 
     async def wait_for_requests_to_drain(self, drain_timeout: int = 300):
         """Wait for all requests to be drained."""
@@ -698,16 +721,17 @@ async def wait_for_requests_to_drain(self, drain_timeout: int = 300):
                 logger.info("Engines are idle, requests have been drained")
                 return
 
-            logger.info(
-                "Engines are still running, waiting for requests to drain...")
+            logger.info("Engines are still running, waiting for requests to drain...")
             await asyncio.sleep(1)  # Wait 1 second before checking again
 
-        raise TimeoutError(f"Timeout reached after {drain_timeout} seconds "
-                           "waiting for requests to drain.")
+        raise TimeoutError(
+            f"Timeout reached after {drain_timeout} seconds "
+            "waiting for requests to drain."
+        )
 
-    async def scale_elastic_ep(self,
-                               new_data_parallel_size: int,
-                               drain_timeout: int = 300):
+    async def scale_elastic_ep(
+        self, new_data_parallel_size: int, drain_timeout: int = 300
+    ):
         """
         Scale up or down the data parallel size by adding or removing
         engine cores.
@@ -716,22 +740,24 @@ async def scale_elastic_ep(self,
             drain_timeout:
                 Maximum time to wait for requests to drain (seconds)
         """
-        old_data_parallel_size = \
-            self.vllm_config.parallel_config.data_parallel_size
+        old_data_parallel_size = self.vllm_config.parallel_config.data_parallel_size
         if old_data_parallel_size == new_data_parallel_size:
-            logger.info("Data parallel size is already %s, skipping scale",
-                        new_data_parallel_size)
+            logger.info(
+                "Data parallel size is already %s, skipping scale",
+                new_data_parallel_size,
+            )
             return
         logger.info(
-            "Waiting for requests to drain before "
-            "scaling up to %s engines...", new_data_parallel_size)
+            "Waiting for requests to drain before scaling up to %s engines...",
+            new_data_parallel_size,
+        )
         await self.wait_for_requests_to_drain(drain_timeout)
         logger.info(
-            "Requests have been drained, proceeding with scale "
-            "to %s engines", new_data_parallel_size)
+            "Requests have been drained, proceeding with scale to %s engines",
+            new_data_parallel_size,
+        )
         await self.engine_core.scale_elastic_ep(new_data_parallel_size)
-        self.vllm_config.parallel_config.data_parallel_size = \
-            new_data_parallel_size
+        self.vllm_config.parallel_config.data_parallel_size = new_data_parallel_size
 
         # recreate stat loggers
         if new_data_parallel_size > old_data_parallel_size and self.log_stats:
diff --git a/vllm/v1/engine/coordinator.py b/vllm/v1/engine/coordinator.py
index 596edfdbe24f..9bb08e6db7be 100644
--- a/vllm/v1/engine/coordinator.py
+++ b/vllm/v1/engine/coordinator.py
@@ -56,7 +56,6 @@ class DPCoordinator:
     """
 
     def __init__(self, parallel_config: ParallelConfig):
-
         dp_size = parallel_config.data_parallel_size
         assert dp_size > 1, "Coordinator only used for data parallel"
 
@@ -68,7 +67,8 @@ def __init__(self, parallel_config: ParallelConfig):
         # either external or hybrid DP LB mode.
         local_only = not (external_lb or hybrid_lb)
         front_publish_address = get_engine_client_zmq_addr(
-            local_only=local_only, host=host)
+            local_only=local_only, host=host
+        )
 
         local_only_eng = dp_size == parallel_config.data_parallel_size_local
         back_publish_address = get_engine_client_zmq_addr(local_only_eng, host)
@@ -84,7 +84,8 @@ def __init__(self, parallel_config: ParallelConfig):
                 "back_output_address": back_output_address,
                 "back_publish_address": back_publish_address,
             },
-            daemon=True)
+            daemon=True,
+        )
         self.proc.start()
 
         self.stats_publish_address = front_publish_address
@@ -104,16 +105,12 @@ def close(self):
 
 
 class EngineState:
-
     def __init__(self):
         self.request_counts = [0, 0]  # [waiting, running]
 
 
 class DPCoordinatorProc:
-
-    def __init__(self,
-                 engine_count: int,
-                 min_stats_update_interval_ms: int = 100):
+    def __init__(self, engine_count: int, min_stats_update_interval_ms: int = 100):
         set_process_title("DPCoordinator")
         self.ctx = zmq.Context()
 
@@ -131,7 +128,8 @@ def run_coordinator(
     ):
         coordinator = DPCoordinatorProc(
             engine_count=engine_count,
-            min_stats_update_interval_ms=min_stats_update_interval_ms)
+            min_stats_update_interval_ms=min_stats_update_interval_ms,
+        )
         try:
             coordinator.process_input_socket(
                 front_publish_address,
@@ -141,10 +139,12 @@ def run_coordinator(
         except KeyboardInterrupt:
             logger.info("DP Coordinator process exiting")
 
-    def process_input_socket(self, front_publish_address: str,
-                             back_output_address: str,
-                             back_publish_address: str):
-
+    def process_input_socket(
+        self,
+        front_publish_address: str,
+        back_output_address: str,
+        back_publish_address: str,
+    ):
         decoder = MsgpackDecoder(EngineCoreOutputs)
 
         # For tracking request wave progression.
@@ -157,29 +157,33 @@ def process_input_socket(self, front_publish_address: str,
         last_stats_wave = -1
         last_step_counts: Optional[list[list[int]]] = None
 
-        with make_zmq_socket(
+        with (
+            make_zmq_socket(
                 path=front_publish_address,  # IPC
                 ctx=self.ctx,
                 socket_type=zmq.XPUB,
                 bind=True,
-        ) as publish_front, make_zmq_socket(
+            ) as publish_front,
+            make_zmq_socket(
                 path=back_output_address,  # IPC or TCP
                 ctx=self.ctx,
                 socket_type=zmq.PULL,
                 bind=True,
-        ) as output_back, make_zmq_socket(
+            ) as output_back,
+            make_zmq_socket(
                 path=back_publish_address,  # IPC or TCP
                 ctx=self.ctx,
                 socket_type=zmq.XPUB,
                 bind=True,
-        ) as publish_back:
-
+            ) as publish_back,
+        ):
             # Wait until all engines subscribe.
             for _ in self.engines:
-                if publish_back.recv() != b'\x01':
+                if publish_back.recv() != b"\x01":
                     logger.error(
                         "DP Coordinator received unexpected message while "
-                        "waiting for engines to subscribe")
+                        "waiting for engines to subscribe"
+                    )
                     return
             # Send ready message to engines.
             publish_back.send(b"READY")
@@ -194,15 +198,13 @@ def process_input_socket(self, front_publish_address: str,
                 elapsed = int(time.time() * 1000) - last_publish_time
                 # Send at stats_update_interval_ms interval if the stats have
                 # changed, or otherwise every 5 seconds.
-                wait_for = (self.stats_update_interval_ms
-                            if stats_changed else 5000)
+                wait_for = self.stats_update_interval_ms if stats_changed else 5000
 
                 # Wait at least 50ms to ensure we've received all stats for
                 # the current step.
                 min_timeout = 50 if last_step_counts is None else 0
 
-                events = poller.poll(timeout=max(min_timeout, wait_for -
-                                                 elapsed))
+                events = poller.poll(timeout=max(min_timeout, wait_for - elapsed))
                 if not events:
                     # Poller timeout - publish current stats to front-ends.
                     if last_step_counts is not None:
@@ -212,8 +214,7 @@ def process_input_socket(self, front_publish_address: str,
                         engine_req_counts_list = self._get_engine_counts()
                         stats_changed = False
 
-                    to_publish = (engine_req_counts_list, current_wave,
-                                  engines_running)
+                    to_publish = (engine_req_counts_list, current_wave, engines_running)
                     publish_front.send(msgspec.msgpack.encode(to_publish))
                     last_publish_time = int(time.time() * 1000)
                     continue
@@ -223,13 +224,16 @@ def process_input_socket(self, front_publish_address: str,
 
                 if publish_front in events:
                     buffer = publish_front.recv()
-                    if buffer in (b'\x01', b'\x00'):
+                    if buffer in (b"\x01", b"\x00"):
                         # Ignore subscription messages.
                         continue
 
                     decoded = msgspec.msgpack.decode(buffer)
-                    if isinstance(decoded, (list, tuple)) and len(
-                            decoded) == 2 and decoded[0] == "SCALE_ELASTIC_EP":
+                    if (
+                        isinstance(decoded, (list, tuple))
+                        and len(decoded) == 2
+                        and decoded[0] == "SCALE_ELASTIC_EP"
+                    ):
                         # Handle scale up notification
                         new_engine_count = decoded[1]
                         current_count = len(self.engines)
@@ -248,13 +252,17 @@ def process_input_socket(self, front_publish_address: str,
                             # engine
                             engines_running = False
                             logger.info(
-                                "DPCoordinator scaled up from %s to %s "
-                                "engines", current_count, new_engine_count)
+                                "DPCoordinator scaled up from %s to %s engines",
+                                current_count,
+                                new_engine_count,
+                            )
                         else:
                             self.engines = self.engines[:new_engine_count]
                             logger.info(
-                                "DPCoordinator scaled down from %s to %s "
-                                "engines", current_count, new_engine_count)
+                                "DPCoordinator scaled down from %s to %s engines",
+                                current_count,
+                                new_engine_count,
+                            )
                         continue  # Skip normal engine notification processing
 
                     # We received a message on the front-end XPUB socket,
@@ -270,8 +278,9 @@ def process_input_socket(self, front_publish_address: str,
 
                         engines_running = True
                         wave_state_changed = True
-                        self._send_start_wave(publish_back, current_wave,
-                                              engine_to_exclude)
+                        self._send_start_wave(
+                            publish_back, current_wave, engine_to_exclude
+                        )
 
                 if output_back in events:
                     # We received a message from one of the engines.
@@ -290,21 +299,28 @@ def process_input_socket(self, front_publish_address: str,
                         stats = self.engines[eng_index].request_counts
                         stats_step = scheduler_stats.step_counter
                         stats_wave = scheduler_stats.current_wave
-                        if (stats_wave > last_stats_wave
-                                or stats_wave == last_stats_wave
-                                and stats_step > last_stats_step):
+                        if (
+                            stats_wave > last_stats_wave
+                            or stats_wave == last_stats_wave
+                            and stats_step > last_stats_step
+                        ):
                             if stats_changed:
-                                last_step_counts = self._get_engine_counts(
-                                    do_copy=True)
+                                last_step_counts = self._get_engine_counts(do_copy=True)
                             last_stats_step = stats_step
                             last_stats_wave = stats_wave
                         elif stats_wave != last_stats_wave or (
-                                stats_step != last_stats_step):
+                            stats_step != last_stats_step
+                        ):
                             logger.warning(
                                 "Received stats for out-of-order "
                                 "step (%d, %d) from engine %d (expected "
-                                "> (%d, %d))", stats_wave, stats_step,
-                                eng_index, last_stats_wave, last_stats_step)
+                                "> (%d, %d))",
+                                stats_wave,
+                                stats_step,
+                                eng_index,
+                                last_stats_wave,
+                                last_stats_step,
+                            )
                         stats[0] = scheduler_stats.num_waiting_reqs
                         stats[1] = scheduler_stats.num_running_reqs
                         stats_changed = True
@@ -315,20 +331,24 @@ def process_input_socket(self, front_publish_address: str,
                         # (engines_running==False).
                         if current_wave <= wave:
                             new_wave = wave + 1
-                            logger.debug("Moving DP wave from %d to %d.",
-                                         current_wave, new_wave)
+                            logger.debug(
+                                "Moving DP wave from %d to %d.", current_wave, new_wave
+                            )
                             current_wave = new_wave
                             engines_running = False
                             wave_state_changed = True
                     elif (wave := outputs.start_wave) is not None and (
-                            wave > current_wave or
-                        (wave == current_wave and not engines_running)):
+                        wave > current_wave
+                        or (wave == current_wave and not engines_running)
+                    ):
                         # 3. The engine received request for a non-current wave
                         # so we must ensure that other engines progress to the
                         # next wave (race condition handling).
                         logger.debug(
                             "Starting wave %d after notification of "
-                            "stale wave request from engine.", wave)
+                            "stale wave request from engine.",
+                            wave,
+                        )
                         current_wave = wave
                         engines_running = True
                         wave_state_changed = True
@@ -339,16 +359,16 @@ def process_input_socket(self, front_publish_address: str,
                     publish_front.send(msgspec.msgpack.encode(message))
 
     @staticmethod
-    def _send_start_wave(socket: zmq.Socket, wave: int,
-                         exclude_engine_index: Optional[int]):
+    def _send_start_wave(
+        socket: zmq.Socket, wave: int, exclude_engine_index: Optional[int]
+    ):
         """Broadcast the START_DP_WAVE message to all the engines.
         It includes the current wave number and index of engine which
         has already received a request with this wave number and so doesn't
         require additional notification.
         """
         wave_encoded = msgspec.msgpack.encode((wave, exclude_engine_index))
-        socket.send_multipart(
-            (EngineCoreRequestType.START_DP_WAVE.value, wave_encoded))
+        socket.send_multipart((EngineCoreRequestType.START_DP_WAVE.value, wave_encoded))
 
     def _get_engine_counts(self, do_copy=False) -> list[list[int]]:
         """Return list of [waiting, running] count lists for each engine."""
diff --git a/vllm/v1/engine/core.py b/vllm/v1/engine/core.py
index 3ee804f10c17..4826d7c589a7 100644
--- a/vllm/v1/engine/core.py
+++ b/vllm/v1/engine/core.py
@@ -25,25 +25,39 @@
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.cache import engine_receiver_cache_from_config
 from vllm.tasks import POOLING_TASKS, SupportedTask
-from vllm.transformers_utils.config import (
-    maybe_register_config_serialize_by_value)
-from vllm.utils import (decorate_logs, get_hash_fn_by_name, make_zmq_socket,
-                        resolve_obj_by_qualname, set_process_title)
+from vllm.transformers_utils.config import maybe_register_config_serialize_by_value
+from vllm.utils import (
+    decorate_logs,
+    get_hash_fn_by_name,
+    make_zmq_socket,
+    resolve_obj_by_qualname,
+    set_process_title,
+)
 from vllm.utils.gc_utils import maybe_attach_gc_debug_callback
-from vllm.v1.core.kv_cache_utils import (BlockHash,
-                                         generate_scheduler_kv_cache_config,
-                                         get_kv_cache_configs,
-                                         get_request_block_hasher,
-                                         init_none_hash)
+from vllm.v1.core.kv_cache_utils import (
+    BlockHash,
+    generate_scheduler_kv_cache_config,
+    get_kv_cache_configs,
+    get_request_block_hasher,
+    init_none_hash,
+)
 from vllm.v1.core.sched.interface import SchedulerInterface
 from vllm.v1.core.sched.output import SchedulerOutput
 from vllm.v1.core.sched.scheduler import Scheduler as V1Scheduler
-from vllm.v1.engine import (EngineCoreOutputs, EngineCoreRequest,
-                            EngineCoreRequestType,
-                            ReconfigureDistributedRequest, ReconfigureRankType,
-                            UtilityOutput, UtilityResult)
-from vllm.v1.engine.utils import (EngineHandshakeMetadata, EngineZmqAddresses,
-                                  get_device_indices)
+from vllm.v1.engine import (
+    EngineCoreOutputs,
+    EngineCoreRequest,
+    EngineCoreRequestType,
+    ReconfigureDistributedRequest,
+    ReconfigureRankType,
+    UtilityOutput,
+    UtilityResult,
+)
+from vllm.v1.engine.utils import (
+    EngineHandshakeMetadata,
+    EngineZmqAddresses,
+    get_device_indices,
+)
 from vllm.v1.executor.abstract import Executor
 from vllm.v1.kv_cache_interface import KVCacheConfig
 from vllm.v1.metrics.stats import SchedulerStats
@@ -58,51 +72,56 @@
 POLLING_TIMEOUT_S = 2.5
 HANDSHAKE_TIMEOUT_MINS = 5
 
-_R = TypeVar('_R')  # Return type for collective_rpc
+_R = TypeVar("_R")  # Return type for collective_rpc
 
 
 class EngineCore:
     """Inner loop of vLLM's Engine."""
 
-    def __init__(self,
-                 vllm_config: VllmConfig,
-                 executor_class: type[Executor],
-                 log_stats: bool,
-                 executor_fail_callback: Optional[Callable] = None):
-
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        executor_class: type[Executor],
+        log_stats: bool,
+        executor_fail_callback: Optional[Callable] = None,
+    ):
         # plugins need to be loaded at the engine/scheduler level too
         from vllm.plugins import load_general_plugins
+
         load_general_plugins()
 
         self.vllm_config = vllm_config
-        logger.info("Initializing a V1 LLM engine (v%s) with config: %s",
-                    VLLM_VERSION, vllm_config)
+        logger.info(
+            "Initializing a V1 LLM engine (v%s) with config: %s",
+            VLLM_VERSION,
+            vllm_config,
+        )
 
         self.log_stats = log_stats
 
         # Setup Model.
         self.model_executor = executor_class(vllm_config)
         if executor_fail_callback is not None:
-            self.model_executor.register_failure_callback(
-                executor_fail_callback)
+            self.model_executor.register_failure_callback(executor_fail_callback)
 
         self.available_gpu_memory_for_kv_cache = -1
 
         # Setup KV Caches and update CacheConfig after profiling.
-        num_gpu_blocks, num_cpu_blocks, kv_cache_config = \
-            self._initialize_kv_caches(vllm_config)
+        num_gpu_blocks, num_cpu_blocks, kv_cache_config = self._initialize_kv_caches(
+            vllm_config
+        )
 
         vllm_config.cache_config.num_gpu_blocks = num_gpu_blocks
         vllm_config.cache_config.num_cpu_blocks = num_cpu_blocks
-        self.collective_rpc("initialize_cache",
-                            args=(num_gpu_blocks, num_cpu_blocks))
+        self.collective_rpc("initialize_cache", args=(num_gpu_blocks, num_cpu_blocks))
 
         self.structured_output_manager = StructuredOutputManager(vllm_config)
 
         # Setup scheduler.
         if isinstance(vllm_config.scheduler_config.scheduler_cls, str):
             Scheduler = resolve_obj_by_qualname(
-                vllm_config.scheduler_config.scheduler_cls)
+                vllm_config.scheduler_config.scheduler_cls
+            )
         else:
             Scheduler = vllm_config.scheduler_config.scheduler_cls
 
@@ -114,7 +133,8 @@ def __init__(self,
                 "Using configured V1 scheduler class %s. "
                 "This scheduler interface is not public and "
                 "compatibility may not be maintained.",
-                vllm_config.scheduler_config.scheduler_cls)
+                vllm_config.scheduler_config.scheduler_cls,
+            )
 
         if len(kv_cache_config.kv_cache_groups) == 0:
             # Encoder models without KV cache don't support
@@ -126,49 +146,54 @@ def __init__(self,
             vllm_config=vllm_config,
             kv_cache_config=kv_cache_config,
             structured_output_manager=self.structured_output_manager,
-            include_finished_set=vllm_config.parallel_config.data_parallel_size
-            > 1,
+            include_finished_set=vllm_config.parallel_config.data_parallel_size > 1,
             log_stats=self.log_stats,
         )
         self.use_spec_decode = vllm_config.speculative_config is not None
         if self.scheduler.connector is not None:  # type: ignore
             self.model_executor.init_kv_output_aggregator(
-                self.scheduler.connector.get_finished_count())  # type: ignore
+                self.scheduler.connector.get_finished_count()  # type: ignore
+            )
 
         self.mm_registry = mm_registry = MULTIMODAL_REGISTRY
         self.mm_receiver_cache = engine_receiver_cache_from_config(
-            vllm_config, mm_registry)
+            vllm_config, mm_registry
+        )
 
         # Setup batch queue for pipeline parallelism.
         # Batch queue for scheduled batches. This enables us to asynchronously
         # schedule and execute batches, and is required by pipeline parallelism
         # to eliminate pipeline bubbles.
         self.batch_queue_size = self.model_executor.max_concurrent_batches
-        self.batch_queue: Optional[deque[tuple[Future[ModelRunnerOutput],
-                                               SchedulerOutput]]] = None
+        self.batch_queue: Optional[
+            deque[tuple[Future[ModelRunnerOutput], SchedulerOutput]]
+        ] = None
         if self.batch_queue_size > 1:
-            logger.info("Batch queue is enabled with size %d",
-                        self.batch_queue_size)
+            logger.info("Batch queue is enabled with size %d", self.batch_queue_size)
             self.batch_queue = deque(maxlen=self.batch_queue_size)
 
-        self.request_block_hasher: Optional[Callable[[Request],
-                                                     list[BlockHash]]] = None
-        if (self.vllm_config.cache_config.enable_prefix_caching
-                or self.scheduler.get_kv_connector() is not None):
-
+        self.request_block_hasher: Optional[Callable[[Request], list[BlockHash]]] = None
+        if (
+            self.vllm_config.cache_config.enable_prefix_caching
+            or self.scheduler.get_kv_connector() is not None
+        ):
             block_size = vllm_config.cache_config.block_size
             caching_hash_fn = get_hash_fn_by_name(
-                vllm_config.cache_config.prefix_caching_hash_algo)
+                vllm_config.cache_config.prefix_caching_hash_algo
+            )
             init_none_hash(caching_hash_fn)
 
             self.request_block_hasher = get_request_block_hasher(
-                block_size, caching_hash_fn)
+                block_size, caching_hash_fn
+            )
 
-        self.step_fn = (self.step if self.batch_queue is None else
-                        self.step_with_batch_queue)
+        self.step_fn = (
+            self.step if self.batch_queue is None else self.step_with_batch_queue
+        )
 
     def _initialize_kv_caches(
-            self, vllm_config: VllmConfig) -> tuple[int, int, KVCacheConfig]:
+        self, vllm_config: VllmConfig
+    ) -> tuple[int, int, KVCacheConfig]:
         start = time.time()
 
         # Get all kv cache needed by the model
@@ -179,28 +204,27 @@ def _initialize_kv_caches(
             if os.environ.get("VLLM_ELASTIC_EP_SCALE_UP_LAUNCH") == "1":
                 dp_group = getattr(self, "dp_group", None)
                 assert dp_group is not None
-                self.available_gpu_memory_for_kv_cache = \
+                self.available_gpu_memory_for_kv_cache = (
                     ParallelConfig.sync_kv_cache_memory_size(dp_group, -1)
-                available_gpu_memory = [
-                    self.available_gpu_memory_for_kv_cache
-                ] * len(kv_cache_specs)
+                )
+                available_gpu_memory = [self.available_gpu_memory_for_kv_cache] * len(
+                    kv_cache_specs
+                )
             else:
                 # Profiles the peak memory usage of the model to determine how
                 # much memory can be allocated for kv cache.
-                available_gpu_memory = (
-                    self.model_executor.determine_available_memory())
-                self.available_gpu_memory_for_kv_cache = \
-                    available_gpu_memory[0]
+                available_gpu_memory = self.model_executor.determine_available_memory()
+                self.available_gpu_memory_for_kv_cache = available_gpu_memory[0]
         else:
             # Attention free models don't need memory for kv cache
             available_gpu_memory = [0] * len(kv_cache_specs)
 
         assert len(kv_cache_specs) == len(available_gpu_memory)
 
-        kv_cache_configs = get_kv_cache_configs(vllm_config, kv_cache_specs,
-                                                available_gpu_memory)
-        scheduler_kv_cache_config = generate_scheduler_kv_cache_config(
-            kv_cache_configs)
+        kv_cache_configs = get_kv_cache_configs(
+            vllm_config, kv_cache_specs, available_gpu_memory
+        )
+        scheduler_kv_cache_config = generate_scheduler_kv_cache_config(kv_cache_configs)
         num_gpu_blocks = scheduler_kv_cache_config.num_blocks
         num_cpu_blocks = 0
 
@@ -208,8 +232,10 @@ def _initialize_kv_caches(
         self.model_executor.initialize_from_config(kv_cache_configs)
 
         elapsed = time.time() - start
-        logger.info(("init engine (profile, create kv cache, "
-                     "warmup model) took %.2f seconds"), elapsed)
+        logger.info(
+            ("init engine (profile, create kv cache, warmup model) took %.2f seconds"),
+            elapsed,
+        )
         return num_gpu_blocks, num_cpu_blocks, scheduler_kv_cache_config
 
     def get_supported_tasks(self) -> tuple[SupportedTask, ...]:
@@ -224,22 +250,27 @@ def add_request(self, request: Request, request_wave: int = 0):
         # Validate the request_id type.
         if not isinstance(request.request_id, str):
             raise TypeError(
-                f"request_id must be a string, got {type(request.request_id)}")
+                f"request_id must be a string, got {type(request.request_id)}"
+            )
 
         if pooling_params := request.pooling_params:
             supported_pooling_tasks = [
-                task for task in self.get_supported_tasks()
-                if task in POOLING_TASKS
+                task for task in self.get_supported_tasks() if task in POOLING_TASKS
             ]
 
             if pooling_params.task not in supported_pooling_tasks:
-                raise ValueError(f"Unsupported task: {pooling_params.task!r} "
-                                 f"Supported tasks: {supported_pooling_tasks}")
+                raise ValueError(
+                    f"Unsupported task: {pooling_params.task!r} "
+                    f"Supported tasks: {supported_pooling_tasks}"
+                )
 
         if request.kv_transfer_params is not None and (
-                not self.scheduler.get_kv_connector()):
-            logger.warning("Got kv_transfer_params, but no KVConnector found. "
-                           "Disabling KVTransfer for this request.")
+            not self.scheduler.get_kv_connector()
+        ):
+            logger.warning(
+                "Got kv_transfer_params, but no KVConnector found. "
+                "Disabling KVTransfer for this request."
+            )
 
         self.scheduler.add_request(request)
 
@@ -249,8 +280,7 @@ def abort_requests(self, request_ids: list[str]):
         # TODO: The scheduler doesn't really need to know the
         # specific finish reason, TBD whether we propagate that
         # (i.e. client-aborted vs stop criteria met).
-        self.scheduler.finish_requests(request_ids,
-                                       RequestStatus.FINISHED_ABORTED)
+        self.scheduler.finish_requests(request_ids, RequestStatus.FINISHED_ABORTED)
 
     def execute_model_with_error_logging(
         self,
@@ -266,8 +296,9 @@ def execute_model_with_error_logging(
             # error from execute_model itself.
 
             # NOTE: This method is exception-free
-            dump_engine_exception(self.vllm_config, scheduler_output,
-                                  self.scheduler.make_stats())
+            dump_engine_exception(
+                self.vllm_config, scheduler_output, self.scheduler.make_stats()
+            )
             raise err
 
     def step(self) -> tuple[dict[int, EngineCoreOutputs], bool]:
@@ -284,12 +315,13 @@ def step(self) -> tuple[dict[int, EngineCoreOutputs], bool]:
         scheduler_output = self.scheduler.schedule()
         model_output = self.execute_model_with_error_logging(
             self.model_executor.execute_model,  # type: ignore
-            scheduler_output)
+            scheduler_output,
+        )
         engine_core_outputs = self.scheduler.update_from_output(
-            scheduler_output, model_output)  # type: ignore
+            scheduler_output, model_output
+        )  # type: ignore
 
-        return (engine_core_outputs,
-                scheduler_output.total_num_scheduled_tokens > 0)
+        return (engine_core_outputs, scheduler_output.total_num_scheduled_tokens > 0)
 
     def post_step(self, model_executed: bool) -> None:
         if self.use_spec_decode and model_executed:
@@ -299,7 +331,8 @@ def post_step(self, model_executed: bool) -> None:
                 self.scheduler.update_draft_token_ids(draft_token_ids)
 
     def step_with_batch_queue(
-            self) -> tuple[Optional[dict[int, EngineCoreOutputs]], bool]:
+        self,
+    ) -> tuple[Optional[dict[int, EngineCoreOutputs]], bool]:
         """Schedule and execute batches with the batch queue.
         Note that if nothing to output in this step, None is returned.
 
@@ -324,14 +357,15 @@ def step_with_batch_queue(
         model_executed = False
         if self.scheduler.has_requests():
             scheduler_output = self.scheduler.schedule()
-            future = self.model_executor.execute_model(scheduler_output,
-                                                       non_block=True)
-            batch_queue.appendleft(
-                (future, scheduler_output))  # type: ignore[arg-type]
+            future = self.model_executor.execute_model(scheduler_output, non_block=True)
+            batch_queue.appendleft((future, scheduler_output))  # type: ignore[arg-type]
 
             model_executed = scheduler_output.total_num_scheduled_tokens > 0
-            if model_executed and len(batch_queue) < self.batch_queue_size \
-                and not batch_queue[-1][0].done():
+            if (
+                model_executed
+                and len(batch_queue) < self.batch_queue_size
+                and not batch_queue[-1][0].done()
+            ):
                 # Don't block on next worker response unless the queue is full
                 # or there are no more requests to schedule.
                 return None, True
@@ -345,10 +379,12 @@ def step_with_batch_queue(
         # Block until the next result is available.
         future, scheduler_output = batch_queue.pop()
         model_output = self.execute_model_with_error_logging(
-            lambda _: future.result(), scheduler_output)
+            lambda _: future.result(), scheduler_output
+        )
 
         engine_core_outputs = self.scheduler.update_from_output(
-            scheduler_output, model_output)
+            scheduler_output, model_output
+        )
 
         return engine_core_outputs, model_executed
 
@@ -366,8 +402,10 @@ def reset_mm_cache(self):
         # NOTE: Since this is mainly for debugging, we don't attempt to
         # re-sync the internal caches (P0 processor, P0 mirror, P1 mirror)
         if self.scheduler.has_unfinished_requests():
-            logger.warning("Resetting the multi-modal cache when requests are "
-                           "in progress may lead to desynced internal caches.")
+            logger.warning(
+                "Resetting the multi-modal cache when requests are "
+                "in progress may lead to desynced internal caches."
+            )
 
         if self.mm_receiver_cache is not None:
             self.mm_receiver_cache.clear_cache()
@@ -405,27 +443,28 @@ def save_sharded_state(
         pattern: Optional[str] = None,
         max_size: Optional[int] = None,
     ) -> None:
-        self.model_executor.save_sharded_state(path=path,
-                                               pattern=pattern,
-                                               max_size=max_size)
-
-    def collective_rpc(self,
-                       method: Union[str, Callable[..., _R]],
-                       timeout: Optional[float] = None,
-                       args: tuple = (),
-                       kwargs: Optional[dict[str, Any]] = None) -> list[_R]:
-        return self.model_executor.collective_rpc(method, timeout, args,
-                                                  kwargs)
+        self.model_executor.save_sharded_state(
+            path=path, pattern=pattern, max_size=max_size
+        )
+
+    def collective_rpc(
+        self,
+        method: Union[str, Callable[..., _R]],
+        timeout: Optional[float] = None,
+        args: tuple = (),
+        kwargs: Optional[dict[str, Any]] = None,
+    ) -> list[_R]:
+        return self.model_executor.collective_rpc(method, timeout, args, kwargs)
 
     def save_tensorized_model(
         self,
         tensorizer_config,
     ) -> None:
         self.model_executor.save_tensorized_model(
-            tensorizer_config=tensorizer_config, )
+            tensorizer_config=tensorizer_config,
+        )
 
-    def preprocess_add_request(
-            self, request: EngineCoreRequest) -> tuple[Request, int]:
+    def preprocess_add_request(self, request: EngineCoreRequest) -> tuple[Request, int]:
         """Preprocess the request.
 
         This function could be directly used in input processing thread to allow
@@ -435,12 +474,11 @@ def preprocess_add_request(
         # `mm_receiver_cache` is reset at the end of LLMEngine init,
         # and will only be accessed in the input processing thread afterwards.
         if self.mm_receiver_cache is not None and request.mm_features:
-            request.mm_features = (
-                self.mm_receiver_cache.get_and_update_features(
-                    request.mm_features))
+            request.mm_features = self.mm_receiver_cache.get_and_update_features(
+                request.mm_features
+            )
 
-        req = Request.from_engine_core_request(request,
-                                               self.request_block_hasher)
+        req = Request.from_engine_core_request(request, self.request_block_hasher)
         if req.use_structured_output:
             # Note on thread safety: no race condition.
             # `grammar_init` is only invoked in input processing thread. For
@@ -454,7 +492,7 @@ def preprocess_add_request(
 class EngineCoreProc(EngineCore):
     """ZMQ-wrapper for running EngineCore in background process."""
 
-    ENGINE_CORE_DEAD = b'ENGINE_CORE_DEAD'
+    ENGINE_CORE_DEAD = b"ENGINE_CORE_DEAD"
 
     def __init__(
         self,
@@ -467,37 +505,46 @@ def __init__(
         engine_index: int = 0,
     ):
         self.input_queue = queue.Queue[tuple[EngineCoreRequestType, Any]]()
-        self.output_queue = queue.Queue[Union[tuple[int, EngineCoreOutputs],
-                                              bytes]]()
+        self.output_queue = queue.Queue[Union[tuple[int, EngineCoreOutputs], bytes]]()
         executor_fail_callback = lambda: self.input_queue.put_nowait(
-            (EngineCoreRequestType.EXECUTOR_FAILED, b''))
+            (EngineCoreRequestType.EXECUTOR_FAILED, b"")
+        )
 
         self.engine_index = engine_index
         identity = self.engine_index.to_bytes(length=2, byteorder="little")
         self.engines_running = False
 
-        with self._perform_handshakes(handshake_address, identity,
-                                      local_client, vllm_config,
-                                      client_handshake_address) as addresses:
+        with self._perform_handshakes(
+            handshake_address,
+            identity,
+            local_client,
+            vllm_config,
+            client_handshake_address,
+        ) as addresses:
             self.client_count = len(addresses.outputs)
 
             # Set up data parallel environment.
             self.has_coordinator = addresses.coordinator_output is not None
             self.frontend_stats_publish_address = (
-                addresses.frontend_stats_publish_address)
-            logger.debug("Has DP Coordinator: %s, stats publish address: %s",
-                         self.has_coordinator,
-                         self.frontend_stats_publish_address)
+                addresses.frontend_stats_publish_address
+            )
+            logger.debug(
+                "Has DP Coordinator: %s, stats publish address: %s",
+                self.has_coordinator,
+                self.frontend_stats_publish_address,
+            )
             # Only publish request queue stats to coordinator for "internal"
             # and "hybrid" LB modes .
             self.publish_dp_lb_stats = (
                 self.has_coordinator
-                and not vllm_config.parallel_config.data_parallel_external_lb)
+                and not vllm_config.parallel_config.data_parallel_external_lb
+            )
 
             self._init_data_parallel(vllm_config)
 
-            super().__init__(vllm_config, executor_class, log_stats,
-                             executor_fail_callback)
+            super().__init__(
+                vllm_config, executor_class, log_stats, executor_fail_callback
+            )
 
             # Background Threads and Queues for IO. These enable us to
             # overlap ZMQ socket IO with GPU since they release the GIL,
@@ -505,26 +552,34 @@ def __init__(
             # model forward pass.
             # Threads handle Socket <-> Queues and core_busy_loop uses Queue.
             ready_event = threading.Event()
-            input_thread = threading.Thread(target=self.process_input_sockets,
-                                            args=(addresses.inputs,
-                                                  addresses.coordinator_input,
-                                                  identity, ready_event),
-                                            daemon=True)
+            input_thread = threading.Thread(
+                target=self.process_input_sockets,
+                args=(
+                    addresses.inputs,
+                    addresses.coordinator_input,
+                    identity,
+                    ready_event,
+                ),
+                daemon=True,
+            )
             input_thread.start()
 
             self.output_thread = threading.Thread(
                 target=self.process_output_sockets,
-                args=(addresses.outputs, addresses.coordinator_output,
-                      self.engine_index),
-                daemon=True)
+                args=(
+                    addresses.outputs,
+                    addresses.coordinator_output,
+                    self.engine_index,
+                ),
+                daemon=True,
+            )
             self.output_thread.start()
 
             # Don't complete handshake until DP coordinator ready message is
             # received.
             while not ready_event.wait(timeout=10):
                 if not input_thread.is_alive():
-                    raise RuntimeError(
-                        "Input socket thread died during startup")
+                    raise RuntimeError("Input socket thread died during startup")
                 assert addresses.coordinator_input is not None
                 logger.info("Waiting for READY message from DP Coordinator...")
 
@@ -570,18 +625,23 @@ def _perform_handshakes(
         input_ctx = zmq.Context()
         is_local = local_client and client_handshake_address is None
         headless = not local_client
-        handshake = self._perform_handshake(input_ctx, handshake_address,
-                                            identity, is_local, headless,
-                                            vllm_config,
-                                            vllm_config.parallel_config)
+        handshake = self._perform_handshake(
+            input_ctx,
+            handshake_address,
+            identity,
+            is_local,
+            headless,
+            vllm_config,
+            vllm_config.parallel_config,
+        )
         if client_handshake_address is None:
             with handshake as addresses:
                 yield addresses
         else:
             assert local_client
             local_handshake = self._perform_handshake(
-                input_ctx, client_handshake_address, identity, True, False,
-                vllm_config)
+                input_ctx, client_handshake_address, identity, True, False, vllm_config
+            )
             with handshake as addresses, local_handshake as client_addresses:
                 addresses.inputs = client_addresses.inputs
                 addresses.outputs = client_addresses.outputs
@@ -601,16 +661,18 @@ def _perform_handshake(
         vllm_config: VllmConfig,
         parallel_config_to_update: Optional[ParallelConfig] = None,
     ) -> Generator[EngineZmqAddresses, None, None]:
-        with make_zmq_socket(ctx,
-                             handshake_address,
-                             zmq.DEALER,
-                             identity=identity,
-                             linger=5000,
-                             bind=False) as handshake_socket:
+        with make_zmq_socket(
+            ctx,
+            handshake_address,
+            zmq.DEALER,
+            identity=identity,
+            linger=5000,
+            bind=False,
+        ) as handshake_socket:
             # Register engine with front-end.
-            addresses = self.startup_handshake(handshake_socket, local_client,
-                                               headless,
-                                               parallel_config_to_update)
+            addresses = self.startup_handshake(
+                handshake_socket, local_client, headless, parallel_config_to_update
+            )
             yield addresses
 
             # Send ready message.
@@ -620,13 +682,16 @@ def _perform_handshake(
             # only runs with rank 0).
             dp_stats_address = self.frontend_stats_publish_address
             handshake_socket.send(
-                msgspec.msgpack.encode({
-                    "status": "READY",
-                    "local": local_client,
-                    "headless": headless,
-                    "num_gpu_blocks": num_gpu_blocks,
-                    "dp_stats_address": dp_stats_address,
-                }))
+                msgspec.msgpack.encode(
+                    {
+                        "status": "READY",
+                        "local": local_client,
+                        "headless": headless,
+                        "num_gpu_blocks": num_gpu_blocks,
+                        "dp_stats_address": dp_stats_address,
+                    }
+                )
+            )
 
     @staticmethod
     def startup_handshake(
@@ -635,24 +700,29 @@ def startup_handshake(
         headless: bool,
         parallel_config: Optional[ParallelConfig] = None,
     ) -> EngineZmqAddresses:
-
         # Send registration message.
         handshake_socket.send(
-            msgspec.msgpack.encode({
-                "status": "HELLO",
-                "local": local_client,
-                "headless": headless,
-            }))
+            msgspec.msgpack.encode(
+                {
+                    "status": "HELLO",
+                    "local": local_client,
+                    "headless": headless,
+                }
+            )
+        )
 
         # Receive initialization message.
         logger.info("Waiting for init message from front-end.")
         if not handshake_socket.poll(timeout=HANDSHAKE_TIMEOUT_MINS * 60_000):
-            raise RuntimeError("Did not receive response from front-end "
-                               f"process within {HANDSHAKE_TIMEOUT_MINS} "
-                               f"minutes")
+            raise RuntimeError(
+                "Did not receive response from front-end "
+                f"process within {HANDSHAKE_TIMEOUT_MINS} "
+                f"minutes"
+            )
         init_bytes = handshake_socket.recv()
         init_message: EngineHandshakeMetadata = msgspec.msgpack.decode(
-            init_bytes, type=EngineHandshakeMetadata)
+            init_bytes, type=EngineHandshakeMetadata
+        )
         logger.debug("Received init message: %s", init_message)
 
         if parallel_config is not None:
@@ -662,10 +732,7 @@ def startup_handshake(
         return init_message.addresses
 
     @staticmethod
-    def run_engine_core(*args,
-                        dp_rank: int = 0,
-                        local_dp_rank: int = 0,
-                        **kwargs):
+    def run_engine_core(*args, dp_rank: int = 0, local_dp_rank: int = 0, **kwargs):
         """Launch EngineCore busy loop in background process."""
 
         # Signal handler used for graceful termination.
@@ -688,8 +755,7 @@ def signal_handler(signum, frame):
 
         engine_core: Optional[EngineCoreProc] = None
         try:
-            parallel_config: ParallelConfig = kwargs[
-                "vllm_config"].parallel_config
+            parallel_config: ParallelConfig = kwargs["vllm_config"].parallel_config
             if parallel_config.data_parallel_size > 1 or dp_rank > 0:
                 set_process_title("EngineCore", f"DP{dp_rank}")
                 decorate_logs()
@@ -735,8 +801,11 @@ def _process_input_queue(self):
         """Exits when an engine step needs to be performed."""
 
         waited = False
-        while not self.engines_running and not self.scheduler.has_requests() \
-                and not self.batch_queue:
+        while (
+            not self.engines_running
+            and not self.scheduler.has_requests()
+            and not self.batch_queue
+        ):
             if logger.isEnabledFor(DEBUG) and self.input_queue.empty():
                 logger.debug("EngineCore waiting for work.")
                 waited = True
@@ -757,15 +826,16 @@ def _process_engine_step(self) -> bool:
         # Step the engine core.
         outputs, model_executed = self.step_fn()
         # Put EngineCoreOutputs into the output queue.
-        for output in (outputs.items() if outputs else ()):
+        for output in outputs.items() if outputs else ():
             self.output_queue.put_nowait(output)
         # Post-step hook.
         self.post_step(model_executed)
 
         return model_executed
 
-    def _handle_client_request(self, request_type: EngineCoreRequestType,
-                               request: Any) -> None:
+    def _handle_client_request(
+        self, request_type: EngineCoreRequestType, request: Any
+    ) -> None:
         """Dispatch request from client."""
 
         if request_type == EngineCoreRequestType.ADD:
@@ -782,29 +852,35 @@ def _handle_client_request(self, request_type: EngineCoreRequestType,
                 output.result = UtilityResult(result)
             except BaseException as e:
                 logger.exception("Invocation of %s method failed", method_name)
-                output.failure_message = (f"Call to {method_name} method"
-                                          f" failed: {str(e)}")
+                output.failure_message = (
+                    f"Call to {method_name} method failed: {str(e)}"
+                )
             self.output_queue.put_nowait(
-                (client_idx, EngineCoreOutputs(utility_output=output)))
+                (client_idx, EngineCoreOutputs(utility_output=output))
+            )
         elif request_type == EngineCoreRequestType.EXECUTOR_FAILED:
             raise RuntimeError("Executor failed.")
         else:
-            logger.error("Unrecognized input request type encountered: %s",
-                         request_type)
+            logger.error(
+                "Unrecognized input request type encountered: %s", request_type
+            )
 
     @staticmethod
     def _convert_msgspec_args(method, args):
         """If a provided arg type doesn't match corresponding target method
-         arg type, try converting to msgspec object."""
+        arg type, try converting to msgspec object."""
         if not args:
             return args
         arg_types = signature(method).parameters.values()
         assert len(args) <= len(arg_types)
         return tuple(
-            msgspec.convert(v, type=p.annotation) if isclass(p.annotation)
+            msgspec.convert(v, type=p.annotation)
+            if isclass(p.annotation)
             and issubclass(p.annotation, msgspec.Struct)
-            and not isinstance(v, p.annotation) else v
-            for v, p in zip(args, arg_types))
+            and not isinstance(v, p.annotation)
+            else v
+            for v, p in zip(args, arg_types)
+        )
 
     def _send_engine_dead(self):
         """Send EngineDead status to the EngineCoreClient."""
@@ -815,12 +891,18 @@ def _send_engine_dead(self):
         # Wait until msg sent by the daemon before shutdown.
         self.output_thread.join(timeout=5.0)
         if self.output_thread.is_alive():
-            logger.fatal("vLLM shutdown signal from EngineCore failed "
-                         "to send. Please report this issue.")
+            logger.fatal(
+                "vLLM shutdown signal from EngineCore failed "
+                "to send. Please report this issue."
+            )
 
-    def process_input_sockets(self, input_addresses: list[str],
-                              coord_input_address: Optional[str],
-                              identity: bytes, ready_event: threading.Event):
+    def process_input_sockets(
+        self,
+        input_addresses: list[str],
+        coord_input_address: Optional[str],
+        identity: bytes,
+        ready_event: threading.Event,
+    ):
         """Input socket IO thread."""
 
         # Msgpack serialization decoding.
@@ -830,24 +912,26 @@ def process_input_sockets(self, input_addresses: list[str],
         with ExitStack() as stack, zmq.Context() as ctx:
             input_sockets = [
                 stack.enter_context(
-                    make_zmq_socket(ctx,
-                                    input_address,
-                                    zmq.DEALER,
-                                    identity=identity,
-                                    bind=False))
+                    make_zmq_socket(
+                        ctx, input_address, zmq.DEALER, identity=identity, bind=False
+                    )
+                )
                 for input_address in input_addresses
             ]
             if coord_input_address is None:
                 coord_socket = None
             else:
                 coord_socket = stack.enter_context(
-                    make_zmq_socket(ctx,
-                                    coord_input_address,
-                                    zmq.XSUB,
-                                    identity=identity,
-                                    bind=False))
+                    make_zmq_socket(
+                        ctx,
+                        coord_input_address,
+                        zmq.XSUB,
+                        identity=identity,
+                        bind=False,
+                    )
+                )
                 # Send subscription message to coordinator.
-                coord_socket.send(b'\x01')
+                coord_socket.send(b"\x01")
 
             # Register sockets with poller.
             poller = zmq.Poller()
@@ -855,7 +939,7 @@ def process_input_sockets(self, input_addresses: list[str],
                 # Send initial message to each input socket - this is required
                 # before the front-end ROUTER socket can send input messages
                 # back to us.
-                input_socket.send(b'')
+                input_socket.send(b"")
                 poller.register(input_socket, zmq.POLLIN)
 
             if coord_socket is not None:
@@ -868,10 +952,8 @@ def process_input_sockets(self, input_addresses: list[str],
             while True:
                 for input_socket, _ in poller.poll():
                     # (RequestType, RequestData)
-                    type_frame, *data_frames = input_socket.recv_multipart(
-                        copy=False)
-                    request_type = EngineCoreRequestType(
-                        bytes(type_frame.buffer))
+                    type_frame, *data_frames = input_socket.recv_multipart(copy=False)
+                    request_type = EngineCoreRequestType(bytes(type_frame.buffer))
 
                     # Deserialize the request data.
                     if request_type == EngineCoreRequestType.ADD:
@@ -883,9 +965,12 @@ def process_input_sockets(self, input_addresses: list[str],
                     # Push to input queue for core busy loop.
                     self.input_queue.put_nowait((request_type, request))
 
-    def process_output_sockets(self, output_paths: list[str],
-                               coord_output_path: Optional[str],
-                               engine_index: int):
+    def process_output_sockets(
+        self,
+        output_paths: list[str],
+        coord_output_path: Optional[str],
+        engine_index: int,
+    ):
         """Output socket IO thread."""
 
         # Msgpack serialization encoding.
@@ -902,13 +987,19 @@ def process_output_sockets(self, output_paths: list[str],
         with ExitStack() as stack, zmq.Context() as ctx:
             sockets = [
                 stack.enter_context(
-                    make_zmq_socket(ctx, output_path, zmq.PUSH, linger=4000))
+                    make_zmq_socket(ctx, output_path, zmq.PUSH, linger=4000)
+                )
                 for output_path in output_paths
             ]
-            coord_socket = stack.enter_context(
-                make_zmq_socket(
-                    ctx, coord_output_path, zmq.PUSH, bind=False,
-                    linger=4000)) if coord_output_path is not None else None
+            coord_socket = (
+                stack.enter_context(
+                    make_zmq_socket(
+                        ctx, coord_output_path, zmq.PUSH, bind=False, linger=4000
+                    )
+                )
+                if coord_output_path is not None
+                else None
+            )
             max_reuse_bufs = len(sockets) + 1
 
             while True:
@@ -934,9 +1025,9 @@ def process_output_sockets(self, output_paths: list[str],
 
                 buffer = reuse_buffers.pop() if reuse_buffers else bytearray()
                 buffers = encoder.encode_into(outputs, buffer)
-                tracker = sockets[client_index].send_multipart(buffers,
-                                                               copy=False,
-                                                               track=True)
+                tracker = sockets[client_index].send_multipart(
+                    buffers, copy=False, track=True
+                )
                 if not tracker.done:
                     ref = outputs if len(buffers) > 1 else None
                     pending.appendleft((tracker, ref, buffer))
@@ -966,12 +1057,17 @@ def __init__(
 
         # Initialize the engine.
         dp_rank = vllm_config.parallel_config.data_parallel_rank
-        super().__init__(vllm_config, local_client, handshake_address,
-                         executor_class, log_stats, client_handshake_address,
-                         dp_rank)
+        super().__init__(
+            vllm_config,
+            local_client,
+            handshake_address,
+            executor_class,
+            log_stats,
+            client_handshake_address,
+            dp_rank,
+        )
 
     def _init_data_parallel(self, vllm_config: VllmConfig):
-
         # Configure GPUs and stateless process group for data parallel.
         dp_rank = vllm_config.parallel_config.data_parallel_rank
         dp_size = vllm_config.parallel_config.data_parallel_size
@@ -986,8 +1082,10 @@ def _init_data_parallel(self, vllm_config: VllmConfig):
             vllm_config.kv_transfer_config.engine_id = (
                 f"{vllm_config.kv_transfer_config.engine_id}_dp{local_dp_rank}"
             )
-            logger.debug("Setting kv_transfer_config.engine_id to %s",
-                         vllm_config.kv_transfer_config.engine_id)
+            logger.debug(
+                "Setting kv_transfer_config.engine_id to %s",
+                vllm_config.kv_transfer_config.engine_id,
+            )
 
         self.dp_rank = dp_rank
         self.dp_group = vllm_config.parallel_config.stateless_init_dp_group()
@@ -1005,20 +1103,22 @@ def add_request(self, request: Request, request_wave: int = 0):
                 # Request received for an already-completed wave, notify
                 # front-end that we need to start the next one.
                 self.output_queue.put_nowait(
-                    (-1, EngineCoreOutputs(start_wave=self.current_wave)))
+                    (-1, EngineCoreOutputs(start_wave=self.current_wave))
+                )
 
         super().add_request(request, request_wave)
 
-    def _handle_client_request(self, request_type: EngineCoreRequestType,
-                               request: Any) -> None:
+    def _handle_client_request(
+        self, request_type: EngineCoreRequestType, request: Any
+    ) -> None:
         if request_type == EngineCoreRequestType.START_DP_WAVE:
             new_wave, exclude_eng_index = request
             if exclude_eng_index != self.engine_index and (
-                    new_wave >= self.current_wave):
+                new_wave >= self.current_wave
+            ):
                 self.current_wave = new_wave
                 if not self.engines_running:
-                    logger.debug("EngineCore starting idle loop for wave %d.",
-                                 new_wave)
+                    logger.debug("EngineCore starting idle loop for wave %d.", new_wave)
                     self.engines_running = True
         else:
             super()._handle_client_request(request_type, request)
@@ -1031,11 +1131,10 @@ def _maybe_publish_request_counts(self):
         counts = self.scheduler.get_request_counts()
         if counts != self.last_counts:
             self.last_counts = counts
-            stats = SchedulerStats(*counts,
-                                   step_counter=self.step_counter,
-                                   current_wave=self.current_wave)
-            self.output_queue.put_nowait(
-                (-1, EngineCoreOutputs(scheduler_stats=stats)))
+            stats = SchedulerStats(
+                *counts, step_counter=self.step_counter, current_wave=self.current_wave
+            )
+            self.output_queue.put_nowait((-1, EngineCoreOutputs(scheduler_stats=stats)))
 
     def run_busy_loop(self):
         """Core busy loop of the EngineCore for data parallel case."""
@@ -1061,58 +1160,65 @@ def run_busy_loop(self):
 
             # 3) All-reduce operation to determine global unfinished reqs.
             self.engines_running = self._has_global_unfinished_reqs(
-                local_unfinished_reqs)
+                local_unfinished_reqs
+            )
 
             if not self.engines_running:
                 if self.dp_rank == 0 or not self.has_coordinator:
                     # Notify client that we are pausing the loop.
-                    logger.debug("Wave %d finished, pausing engine loop.",
-                                 self.current_wave)
+                    logger.debug(
+                        "Wave %d finished, pausing engine loop.", self.current_wave
+                    )
                     # In the coordinator case, dp rank 0 sends updates to the
                     # coordinator. Otherwise (offline spmd case), each rank
                     # sends the update to its colocated front-end process.
                     client_index = -1 if self.has_coordinator else 0
                     self.output_queue.put_nowait(
-                        (client_index,
-                         EngineCoreOutputs(wave_complete=self.current_wave)))
+                        (
+                            client_index,
+                            EngineCoreOutputs(wave_complete=self.current_wave),
+                        )
+                    )
                 # Increment wave count and reset step counter.
                 self.current_wave += 1
                 self.step_counter = 0
 
     def _has_global_unfinished_reqs(self, local_unfinished: bool) -> bool:
-
         # Optimization - only perform finish-sync all-reduce every 32 steps.
         self.step_counter += 1
         if self.step_counter % 32 != 0:
             return True
 
-        return ParallelConfig.has_unfinished_dp(self.dp_group,
-                                                local_unfinished)
+        return ParallelConfig.has_unfinished_dp(self.dp_group, local_unfinished)
 
     def reinitialize_distributed(
-            self, reconfig_request: ReconfigureDistributedRequest) -> None:
+        self, reconfig_request: ReconfigureDistributedRequest
+    ) -> None:
         stateless_destroy_torch_distributed_process_group(self.dp_group)
         self.shutdown()
 
         parallel_config = self.vllm_config.parallel_config
         old_dp_size = parallel_config.data_parallel_size
-        parallel_config.data_parallel_size = \
-            reconfig_request.new_data_parallel_size
+        parallel_config.data_parallel_size = reconfig_request.new_data_parallel_size
         if reconfig_request.new_data_parallel_rank != -1:
-            parallel_config.data_parallel_rank = \
-                reconfig_request.new_data_parallel_rank
+            parallel_config.data_parallel_rank = reconfig_request.new_data_parallel_rank
         # local rank specifies device visibility, it should not be changed
-        assert reconfig_request.new_data_parallel_rank_local == \
-            ReconfigureRankType.KEEP_CURRENT_RANK
-        parallel_config.data_parallel_master_ip = \
+        assert (
+            reconfig_request.new_data_parallel_rank_local
+            == ReconfigureRankType.KEEP_CURRENT_RANK
+        )
+        parallel_config.data_parallel_master_ip = (
             reconfig_request.new_data_parallel_master_ip
-        parallel_config.data_parallel_master_port = \
+        )
+        parallel_config.data_parallel_master_port = (
             reconfig_request.new_data_parallel_master_port
+        )
         if reconfig_request.new_data_parallel_rank != -2:
             self.dp_rank = parallel_config.data_parallel_rank
             self.dp_group = parallel_config.stateless_init_dp_group()
-        reconfig_request.new_data_parallel_master_port = \
+        reconfig_request.new_data_parallel_master_port = (
             parallel_config.data_parallel_master_port
+        )
 
         self.model_executor.reinitialize_distributed(reconfig_request)
         if reconfig_request.new_data_parallel_size > old_dp_size:
@@ -1121,17 +1227,21 @@ def reinitialize_distributed(
             # engine-cores to new engine-cores so they can directly
             # use it in _initialize_kv_caches() rather than profiling.
             ParallelConfig.sync_kv_cache_memory_size(
-                self.dp_group, self.available_gpu_memory_for_kv_cache)
+                self.dp_group, self.available_gpu_memory_for_kv_cache
+            )
             # NOTE(yongji): newly joined workers require dummy_run even
             # CUDA graph is not used
             self.model_executor.collective_rpc("compile_or_warm_up_model")
-        if reconfig_request.new_data_parallel_rank == \
-        ReconfigureRankType.SHUTDOWN_CURRENT_RANK:
+        if (
+            reconfig_request.new_data_parallel_rank
+            == ReconfigureRankType.SHUTDOWN_CURRENT_RANK
+        ):
             self.shutdown()
             logger.info("DPEngineCoreProc %s shutdown", self.dp_rank)
         else:
-            logger.info("Distributed environment reinitialized for DP rank %s",
-                        self.dp_rank)
+            logger.info(
+                "Distributed environment reinitialized for DP rank %s", self.dp_rank
+            )
 
 
 class DPEngineCoreActor(DPEngineCoreProc):
@@ -1151,8 +1261,7 @@ def __init__(
     ):
         self.addresses = addresses
         vllm_config.parallel_config.data_parallel_rank = dp_rank
-        vllm_config.parallel_config.data_parallel_rank_local = \
-            local_dp_rank
+        vllm_config.parallel_config.data_parallel_rank_local = local_dp_rank
 
         # Set CUDA_VISIBLE_DEVICES as early as possible in actor life cycle
         # NOTE: in MP we set CUDA_VISIBLE_DEVICES at process creation time,
@@ -1173,39 +1282,46 @@ def __init__(
         # of ray.
         self._set_visible_devices(vllm_config, local_dp_rank)
 
-        super().__init__(vllm_config, local_client, "", executor_class,
-                         log_stats)
+        super().__init__(vllm_config, local_client, "", executor_class, log_stats)
 
-    def _set_visible_devices(self, vllm_config: VllmConfig,
-                             local_dp_rank: int):
+    def _set_visible_devices(self, vllm_config: VllmConfig, local_dp_rank: int):
         from vllm.platforms import current_platform
+
         if current_platform.is_xpu():
             pass
         else:
             device_control_env_var = current_platform.device_control_env_var
-            self._set_cuda_visible_devices(vllm_config, local_dp_rank,
-                                           device_control_env_var)
+            self._set_cuda_visible_devices(
+                vllm_config, local_dp_rank, device_control_env_var
+            )
 
-    def _set_cuda_visible_devices(self, vllm_config: VllmConfig,
-                                  local_dp_rank: int,
-                                  device_control_env_var: str):
+    def _set_cuda_visible_devices(
+        self, vllm_config: VllmConfig, local_dp_rank: int, device_control_env_var: str
+    ):
         world_size = vllm_config.parallel_config.world_size
         # Set CUDA_VISIBLE_DEVICES or equivalent.
         try:
-            value = get_device_indices(device_control_env_var, local_dp_rank,
-                                       world_size)
+            value = get_device_indices(
+                device_control_env_var, local_dp_rank, world_size
+            )
             os.environ[device_control_env_var] = value
         except IndexError as e:
             raise Exception(
                 f"Error setting {device_control_env_var}: "
                 f"local range: [{local_dp_rank * world_size}, "
                 f"{(local_dp_rank + 1) * world_size}) "
-                f"base value: \"{os.getenv(device_control_env_var)}\"") from e
+                f'base value: "{os.getenv(device_control_env_var)}"'
+            ) from e
 
     @contextmanager
-    def _perform_handshakes(self, handshake_address: str, identity: bytes,
-                            local_client: bool, vllm_config: VllmConfig,
-                            client_handshake_address: Optional[str]):
+    def _perform_handshakes(
+        self,
+        handshake_address: str,
+        identity: bytes,
+        local_client: bool,
+        vllm_config: VllmConfig,
+        client_handshake_address: Optional[str],
+    ):
         """
         For Ray, we don't need to actually perform handshake.
         All addresses information is known before the actor creation.
diff --git a/vllm/v1/engine/core_client.py b/vllm/v1/engine/core_client.py
index a84b0e55105b..27283411eada 100644
--- a/vllm/v1/engine/core_client.py
+++ b/vllm/v1/engine/core_client.py
@@ -23,17 +23,29 @@
 from vllm.logger import init_logger
 from vllm.lora.request import LoRARequest
 from vllm.tasks import SupportedTask
-from vllm.utils import (close_sockets, get_open_port, get_open_zmq_inproc_path,
-                        in_loop, make_zmq_socket)
-from vllm.v1.engine import (EngineCoreOutputs, EngineCoreRequest,
-                            EngineCoreRequestType,
-                            ReconfigureDistributedRequest, ReconfigureRankType,
-                            UtilityOutput)
+from vllm.utils import (
+    close_sockets,
+    get_open_port,
+    get_open_zmq_inproc_path,
+    in_loop,
+    make_zmq_socket,
+)
+from vllm.v1.engine import (
+    EngineCoreOutputs,
+    EngineCoreRequest,
+    EngineCoreRequestType,
+    ReconfigureDistributedRequest,
+    ReconfigureRankType,
+    UtilityOutput,
+)
 from vllm.v1.engine.coordinator import DPCoordinator
 from vllm.v1.engine.core import EngineCore, EngineCoreProc
 from vllm.v1.engine.exceptions import EngineDeadError
-from vllm.v1.engine.utils import (CoreEngineActorManager,
-                                  CoreEngineProcManager, launch_core_engines)
+from vllm.v1.engine.utils import (
+    CoreEngineActorManager,
+    CoreEngineProcManager,
+    launch_core_engines,
+)
 from vllm.v1.executor.abstract import Executor
 from vllm.v1.serial_utils import MsgpackDecoder, MsgpackEncoder, bytestr
 
@@ -41,14 +53,14 @@
 
 AnyFuture = Union[asyncio.Future[Any], Future[Any]]
 
-_R = TypeVar('_R')  # Return type for collective_rpc
+_R = TypeVar("_R")  # Return type for collective_rpc
 
 EngineIdentity = bytes
 
 
 class EngineCoreClient(ABC):
     """
-    EngineCoreClient: subclasses handle different methods for pushing 
+    EngineCoreClient: subclasses handle different methods for pushing
         and pulling from the EngineCore for asyncio / multiprocessing.
 
     Subclasses:
@@ -65,16 +77,17 @@ def make_client(
         executor_class: type[Executor],
         log_stats: bool,
     ) -> "EngineCoreClient":
-
         # TODO: support this for debugging purposes.
         if asyncio_mode and not multiprocess_mode:
             raise NotImplementedError(
                 "Running EngineCore in asyncio without multiprocessing "
-                "is not currently supported.")
+                "is not currently supported."
+            )
 
         if multiprocess_mode and asyncio_mode:
             return EngineCoreClient.make_async_mp_client(
-                vllm_config, executor_class, log_stats)
+                vllm_config, executor_class, log_stats
+            )
 
         if multiprocess_mode and not asyncio_mode:
             return SyncMPClient(vllm_config, executor_class, log_stats)
@@ -91,8 +104,14 @@ def make_async_mp_client(
         client_index: int = 0,
     ) -> "MPClient":
         parallel_config = vllm_config.parallel_config
-        client_args = (vllm_config, executor_class, log_stats,
-                       client_addresses, client_count, client_index)
+        client_args = (
+            vllm_config,
+            executor_class,
+            log_stats,
+            client_addresses,
+            client_count,
+            client_index,
+        )
         if parallel_config.data_parallel_size > 1:
             if parallel_config.data_parallel_external_lb:
                 # External load balancer - client per DP rank.
@@ -102,8 +121,7 @@ def make_async_mp_client(
         return AsyncMPClient(*client_args)
 
     @abstractmethod
-    def shutdown(self):
-        ...
+    def shutdown(self): ...
 
     def get_output(self) -> EngineCoreOutputs:
         raise NotImplementedError
@@ -153,17 +171,18 @@ def list_loras(self) -> set[int]:
     def pin_lora(self, lora_id: int) -> bool:
         raise NotImplementedError
 
-    def save_sharded_state(self,
-                           path: str,
-                           pattern: Optional[str] = None,
-                           max_size: Optional[int] = None) -> None:
+    def save_sharded_state(
+        self, path: str, pattern: Optional[str] = None, max_size: Optional[int] = None
+    ) -> None:
         raise NotImplementedError
 
-    def collective_rpc(self,
-                       method: Union[str, Callable[..., _R]],
-                       timeout: Optional[float] = None,
-                       args: tuple = (),
-                       kwargs: Optional[dict[str, Any]] = None) -> list[_R]:
+    def collective_rpc(
+        self,
+        method: Union[str, Callable[..., _R]],
+        timeout: Optional[float] = None,
+        args: tuple = (),
+        kwargs: Optional[dict[str, Any]] = None,
+    ) -> list[_R]:
         raise NotImplementedError
 
     def dp_engines_running(self) -> bool:
@@ -216,24 +235,24 @@ async def list_loras_async(self) -> set[int]:
     async def pin_lora_async(self, lora_id: int) -> bool:
         raise NotImplementedError
 
-    async def save_sharded_state_async(self,
-                                       path: str,
-                                       pattern: Optional[str] = None,
-                                       max_size: Optional[int] = None) -> None:
+    async def save_sharded_state_async(
+        self, path: str, pattern: Optional[str] = None, max_size: Optional[int] = None
+    ) -> None:
         raise NotImplementedError
 
     async def collective_rpc_async(
-            self,
-            method: Union[str, Callable[..., _R]],
-            timeout: Optional[float] = None,
-            args: tuple = (),
-            kwargs: Optional[dict[str, Any]] = None) -> list[_R]:
+        self,
+        method: Union[str, Callable[..., _R]],
+        timeout: Optional[float] = None,
+        args: tuple = (),
+        kwargs: Optional[dict[str, Any]] = None,
+    ) -> list[_R]:
         raise NotImplementedError
 
 
 class InprocClient(EngineCoreClient):
     """
-    InprocClient: client for in-process EngineCore. Intended 
+    InprocClient: client for in-process EngineCore. Intended
     for use in LLMEngine for V0-style add_request() and step()
         EngineCore setup in this process (no busy loop).
 
@@ -295,17 +314,18 @@ def list_loras(self) -> set[int]:
     def pin_lora(self, lora_id: int) -> bool:
         return self.engine_core.pin_lora(lora_id)
 
-    def save_sharded_state(self,
-                           path: str,
-                           pattern: Optional[str] = None,
-                           max_size: Optional[int] = None) -> None:
+    def save_sharded_state(
+        self, path: str, pattern: Optional[str] = None, max_size: Optional[int] = None
+    ) -> None:
         self.engine_core.save_sharded_state(path, pattern, max_size)
 
-    def collective_rpc(self,
-                       method: Union[str, Callable[..., _R]],
-                       timeout: Optional[float] = None,
-                       args: tuple = (),
-                       kwargs: Optional[dict[str, Any]] = None) -> list[_R]:
+    def collective_rpc(
+        self,
+        method: Union[str, Callable[..., _R]],
+        timeout: Optional[float] = None,
+        args: tuple = (),
+        kwargs: Optional[dict[str, Any]] = None,
+    ) -> list[_R]:
         return self.engine_core.collective_rpc(method, timeout, args, kwargs)
 
     def dp_engines_running(self) -> bool:
@@ -320,8 +340,9 @@ class BackgroundResources:
     ctx: zmq.Context
     # If CoreEngineProcManager, it manages local engines;
     # if CoreEngineActorManager, it manages all engines.
-    engine_manager: Optional[Union[CoreEngineProcManager,
-                                   CoreEngineActorManager]] = None
+    engine_manager: Optional[Union[CoreEngineProcManager, CoreEngineActorManager]] = (
+        None
+    )
     coordinator: Optional[DPCoordinator] = None
     output_socket: Optional[Union[zmq.Socket, zmq.asyncio.Socket]] = None
     input_socket: Optional[Union[zmq.Socket, zmq.asyncio.Socket]] = None
@@ -347,12 +368,15 @@ def __call__(self):
 
         if isinstance(self.output_socket, zmq.asyncio.Socket):
             # Async case.
-            loop = self.output_queue_task._loop \
-                if self.output_queue_task else None
+            loop = self.output_queue_task._loop if self.output_queue_task else None
 
-            sockets = (self.output_socket, self.input_socket,
-                       self.first_req_send_socket, self.first_req_rcv_socket,
-                       self.stats_update_socket)
+            sockets = (
+                self.output_socket,
+                self.input_socket,
+                self.first_req_send_socket,
+                self.first_req_rcv_socket,
+                self.stats_update_socket,
+            )
 
             tasks = (self.output_queue_task, self.stats_update_task)
 
@@ -387,11 +411,10 @@ def close_sockets_and_tasks():
                 with self.ctx.socket(zmq.PAIR) as shutdown_sender:
                     shutdown_sender.connect(self.shutdown_path)
                     # Send shutdown signal.
-                    shutdown_sender.send(b'')
+                    shutdown_sender.send(b"")
 
     def validate_alive(self, frames: Sequence[zmq.Frame]):
-        if len(frames) == 1 and (frames[0].buffer
-                                 == EngineCoreProc.ENGINE_CORE_DEAD):
+        if len(frames) == 1 and (frames[0].buffer == EngineCoreProc.ENGINE_CORE_DEAD):
             self.engine_dead = True
             raise EngineDeadError()
 
@@ -404,7 +427,7 @@ class MPClient(EngineCoreClient):
 
         * pushes EngineCoreRequests via input_socket
         * pulls EngineCoreOutputs via output_socket
-    
+
         * AsyncMPClient subclass for AsyncLLM usage
         * SyncMPClient subclass for LLM usage
     """
@@ -441,30 +464,32 @@ def __init__(
                 # Engines are managed externally to this client.
                 input_address = client_addresses["input_address"]
                 output_address = client_addresses["output_address"]
-                self.stats_update_address = client_addresses.get(
-                    "stats_update_address")
+                self.stats_update_address = client_addresses.get("stats_update_address")
             else:
                 # Engines are managed by this client.
-                with launch_core_engines(vllm_config, executor_class,
-                                         log_stats) as (engine_manager,
-                                                        coordinator,
-                                                        addresses):
+                with launch_core_engines(vllm_config, executor_class, log_stats) as (
+                    engine_manager,
+                    coordinator,
+                    addresses,
+                ):
                     self.resources.coordinator = coordinator
                     self.resources.engine_manager = engine_manager
 
-                (input_address, ) = addresses.inputs
-                (output_address, ) = addresses.outputs
-                self.stats_update_address = (
-                    addresses.frontend_stats_publish_address)
+                (input_address,) = addresses.inputs
+                (output_address,) = addresses.outputs
+                self.stats_update_address = addresses.frontend_stats_publish_address
                 if coordinator is not None:
                     assert self.stats_update_address == (
-                        coordinator.get_stats_publish_address())
+                        coordinator.get_stats_publish_address()
+                    )
 
             # Create input and output sockets.
             self.input_socket = self.resources.input_socket = make_zmq_socket(
-                self.ctx, input_address, zmq.ROUTER, bind=True)
+                self.ctx, input_address, zmq.ROUTER, bind=True
+            )
             self.resources.output_socket = make_zmq_socket(
-                self.ctx, output_address, zmq.PULL)
+                self.ctx, output_address, zmq.PULL
+            )
 
             parallel_config = vllm_config.parallel_config
             dp_size = parallel_config.data_parallel_size
@@ -473,19 +498,22 @@ def __init__(
             offline_mode = parallel_config.data_parallel_rank_local is not None
             # Client manages local+remote EngineCores in pure internal LB case.
             # Client manages local EngineCores in hybrid and external LB case.
-            local_engines_only = (parallel_config.data_parallel_hybrid_lb
-                                  or parallel_config.data_parallel_external_lb)
+            local_engines_only = (
+                parallel_config.data_parallel_hybrid_lb
+                or parallel_config.data_parallel_external_lb
+            )
 
             num_ranks = dp_local_size if local_engines_only else dp_size
-            self.engine_ranks_managed = [dp_rank] if offline_mode else list(
-                range(dp_rank, dp_rank + num_ranks))
+            self.engine_ranks_managed = (
+                [dp_rank] if offline_mode else list(range(dp_rank, dp_rank + num_ranks))
+            )
             assert parallel_config.data_parallel_size_local <= len(
-                self.engine_ranks_managed)
+                self.engine_ranks_managed
+            )
 
             # ZMQ identity of each engine that this client will talk to.
             self.core_engines: list[EngineIdentity] = [
-                rank.to_bytes(2, "little")
-                for rank in self.engine_ranks_managed
+                rank.to_bytes(2, "little") for rank in self.engine_ranks_managed
             ]
 
             # Wait for ready messages from each engine on the input socket.
@@ -493,8 +521,10 @@ def __init__(
             sync_input_socket = zmq.Socket.shadow(self.input_socket)
             while identities:
                 if not sync_input_socket.poll(timeout=600_000):
-                    raise TimeoutError("Timed out waiting for engines to send"
-                                       "initial message on input socket.")
+                    raise TimeoutError(
+                        "Timed out waiting for engines to send"
+                        "initial message on input socket."
+                    )
                 identity, _ = sync_input_socket.recv_multipart()
                 identities.remove(identity)
 
@@ -520,8 +550,9 @@ def shutdown(self):
 
     def _format_exception(self, e: Exception) -> Exception:
         """If errored, use EngineDeadError so root cause is clear."""
-        return EngineDeadError(
-            suppress_context=True) if self.resources.engine_dead else e
+        return (
+            EngineDeadError(suppress_context=True) if self.resources.engine_dead else e
+        )
 
     def ensure_alive(self):
         if self.resources.engine_dead:
@@ -541,8 +572,11 @@ def dp_engines_running(self) -> bool:
     def start_engine_core_monitor(self):
         """Start a monitor thread for engine core processes."""
         engine_manager = self.resources.engine_manager
-        if (engine_manager is None or not hasattr(engine_manager, 'processes')
-                or not engine_manager.processes):
+        if (
+            engine_manager is None
+            or not hasattr(engine_manager, "processes")
+            or not engine_manager.processes
+        ):
             # No engine processes to monitor
             return
 
@@ -559,23 +593,26 @@ def monitor_engine_cores():
             if not _self or _self.resources.engine_dead:
                 return
             _self.resources.engine_dead = True
-            proc_name = next(proc.name for proc in engine_processes
-                             if proc.sentinel == died[0])
+            proc_name = next(
+                proc.name for proc in engine_processes if proc.sentinel == died[0]
+            )
             logger.error(
-                "Engine core proc %s died unexpectedly, "
-                "shutting down client.", proc_name)
+                "Engine core proc %s died unexpectedly, shutting down client.",
+                proc_name,
+            )
             _self.shutdown()
             # Note: For MPClient, we don't have a failure callback mechanism
             # like MultiprocExecutor, but we set engine_dead flag which will
             # cause subsequent operations to raise EngineDeadError
 
-        Thread(target=monitor_engine_cores,
-               daemon=True,
-               name="MPClientEngineMonitor").start()
+        Thread(
+            target=monitor_engine_cores, daemon=True, name="MPClientEngineMonitor"
+        ).start()
 
 
-def _process_utility_output(output: UtilityOutput,
-                            utility_results: dict[int, AnyFuture]):
+def _process_utility_output(
+    output: UtilityOutput, utility_results: dict[int, AnyFuture]
+):
     """Set the result from a utility method in the waiting future."""
     future = utility_results.pop(output.call_id)
     failure_message = output.failure_message
@@ -590,15 +627,17 @@ def _process_utility_output(output: UtilityOutput,
         # original calling task being cancelled.
         if failure_message is not None:
             logger.error(
-                "Cancelled call to utility method failed "
-                "with error: %s", failure_message)
+                "Cancelled call to utility method failed with error: %s",
+                failure_message,
+            )
 
 
 class SyncMPClient(MPClient):
     """Synchronous client for multi-proc EngineCore."""
 
-    def __init__(self, vllm_config: VllmConfig, executor_class: type[Executor],
-                 log_stats: bool):
+    def __init__(
+        self, vllm_config: VllmConfig, executor_class: type[Executor], log_stats: bool
+    ):
         super().__init__(
             asyncio_mode=False,
             vllm_config=vllm_config,
@@ -641,8 +680,7 @@ def process_outputs_socket():
                     resources.validate_alive(frames)
                     outputs: EngineCoreOutputs = decoder.decode(frames)
                     if outputs.utility_output:
-                        _process_utility_output(outputs.utility_output,
-                                                utility_results)
+                        _process_utility_output(outputs.utility_output, utility_results)
                     else:
                         outputs_queue.put_nowait(outputs)
             except Exception as e:
@@ -653,9 +691,11 @@ def process_outputs_socket():
                 out_socket.close(linger=0)
 
         # Process outputs from engine in separate thread.
-        self.output_queue_thread = Thread(target=process_outputs_socket,
-                                          name="EngineCoreOutputQueueThread",
-                                          daemon=True)
+        self.output_queue_thread = Thread(
+            target=process_outputs_socket,
+            name="EngineCoreOutputQueueThread",
+            daemon=True,
+        )
         self.output_queue_thread.start()
 
         # The thread takes on responsibility for closing the socket.
@@ -676,8 +716,7 @@ def _send_input(self, request_type: EngineCoreRequestType, request: Any):
         self.ensure_alive()
         self.free_pending_messages()
         # (Identity, RequestType, SerializedRequest)
-        msg = (self.core_engine, request_type.value,
-               *self.encoder.encode(request))
+        msg = (self.core_engine, request_type.value, *self.encoder.encode(request))
 
         if len(msg) <= 3:
             # No auxiliary buffers => no tensor backing buffers in request.
@@ -691,8 +730,7 @@ def call_utility(self, method: str, *args) -> Any:
         call_id = uuid.uuid1().int >> 64
         future: Future[Any] = Future()
         self.utility_results[call_id] = future
-        self._send_input(EngineCoreRequestType.UTILITY,
-                         (0, call_id, method, args))
+        self._send_input(EngineCoreRequestType.UTILITY, (0, call_id, method, args))
 
         return future.result()
 
@@ -741,31 +779,33 @@ def is_sleeping(self) -> bool:
     def execute_dummy_batch(self) -> None:
         self.call_utility("execute_dummy_batch")
 
-    def collective_rpc(self,
-                       method: Union[str, Callable[..., _R]],
-                       timeout: Optional[float] = None,
-                       args: tuple = (),
-                       kwargs: Optional[dict[str, Any]] = None) -> list[_R]:
-        return self.call_utility("collective_rpc", method, timeout, args,
-                                 kwargs)
-
-    def save_sharded_state(self,
-                           path: str,
-                           pattern: Optional[str] = None,
-                           max_size: Optional[int] = None) -> None:
+    def collective_rpc(
+        self,
+        method: Union[str, Callable[..., _R]],
+        timeout: Optional[float] = None,
+        args: tuple = (),
+        kwargs: Optional[dict[str, Any]] = None,
+    ) -> list[_R]:
+        return self.call_utility("collective_rpc", method, timeout, args, kwargs)
+
+    def save_sharded_state(
+        self, path: str, pattern: Optional[str] = None, max_size: Optional[int] = None
+    ) -> None:
         self.call_utility("save_sharded_state", path, pattern, max_size)
 
 
 class AsyncMPClient(MPClient):
     """Asyncio-compatible client for multi-proc EngineCore."""
 
-    def __init__(self,
-                 vllm_config: VllmConfig,
-                 executor_class: type[Executor],
-                 log_stats: bool,
-                 client_addresses: Optional[dict[str, str]] = None,
-                 client_count: int = 1,
-                 client_index: int = 0):
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        executor_class: type[Executor],
+        log_stats: bool,
+        client_addresses: Optional[dict[str, str]] = None,
+        client_count: int = 1,
+        client_index: int = 0,
+    ):
         super().__init__(
             asyncio_mode=True,
             vllm_config=vllm_config,
@@ -776,8 +816,7 @@ def __init__(self,
 
         self.client_count = client_count
         self.client_index = client_index
-        self.outputs_queue = asyncio.Queue[Union[EngineCoreOutputs,
-                                                 Exception]]()
+        self.outputs_queue = asyncio.Queue[Union[EngineCoreOutputs, Exception]]()
         try:
             # If we are running in an asyncio event loop, start the queue task.
             # Otherwise, it will be started lazily. If it is not started here,
@@ -798,10 +837,9 @@ def _ensure_output_queue_task(self):
         decoder = self.decoder
         utility_results = self.utility_results
         outputs_queue = self.outputs_queue
-        output_handler: Optional[Callable[[AsyncMPClient, EngineCoreOutputs],
-                                          Awaitable[None]]] = getattr(
-                                              self.__class__,
-                                              "process_engine_outputs", None)
+        output_handler: Optional[
+            Callable[[AsyncMPClient, EngineCoreOutputs], Awaitable[None]]
+        ] = getattr(self.__class__, "process_engine_outputs", None)
         _self_ref = weakref.ref(self) if output_handler else None
         output_socket = resources.output_socket
         assert output_socket is not None
@@ -813,8 +851,7 @@ async def process_outputs_socket():
                     resources.validate_alive(frames)
                     outputs: EngineCoreOutputs = decoder.decode(frames)
                     if outputs.utility_output:
-                        _process_utility_output(outputs.utility_output,
-                                                utility_results)
+                        _process_utility_output(outputs.utility_output, utility_results)
                         continue
 
                     if output_handler is not None:
@@ -833,7 +870,8 @@ async def process_outputs_socket():
                 outputs_queue.put_nowait(EngineDeadError())
 
         resources.output_queue_task = asyncio.create_task(
-            process_outputs_socket(), name="EngineCoreOutputQueueTask")
+            process_outputs_socket(), name="EngineCoreOutputQueueTask"
+        )
 
     async def get_output_async(self) -> EngineCoreOutputs:
         self._ensure_output_queue_task()
@@ -846,19 +884,21 @@ async def get_output_async(self) -> EngineCoreOutputs:
             raise self._format_exception(outputs) from None
         return outputs
 
-    def _send_input(self,
-                    request_type: EngineCoreRequestType,
-                    request: Any,
-                    engine: Optional[EngineIdentity] = None) -> Awaitable[Any]:
+    def _send_input(
+        self,
+        request_type: EngineCoreRequestType,
+        request: Any,
+        engine: Optional[EngineIdentity] = None,
+    ) -> Awaitable[Any]:
         if engine is None:
             engine = self.core_engine
 
         message = (request_type.value, *self.encoder.encode(request))
         return self._send_input_message(message, engine, request)
 
-    def _send_input_message(self, message: tuple[bytestr,
-                                                 ...], engine: EngineIdentity,
-                            objects: Any) -> Awaitable[Any]:
+    def _send_input_message(
+        self, message: tuple[bytestr, ...], engine: EngineIdentity, objects: Any
+    ) -> Awaitable[Any]:
         """
         objects is a reference to retain until zmq is finished with the
         buffers, in case they were extracted from tensors in the request.
@@ -866,7 +906,7 @@ def _send_input_message(self, message: tuple[bytestr,
         self.ensure_alive()
         self.free_pending_messages()
 
-        msg = (engine, ) + message
+        msg = (engine,) + message
         if not objects or len(msg) <= 3:
             # No auxiliary buffers => no tensor backing buffers in request.
             return self.input_socket.send_multipart(msg, copy=False)
@@ -882,17 +922,18 @@ def add_pending(f: asyncio.Future[zmq.MessageTracker]):
         return future
 
     async def call_utility_async(self, method: str, *args) -> Any:
-        return await self._call_utility_async(method,
-                                              *args,
-                                              engine=self.core_engine)
+        return await self._call_utility_async(method, *args, engine=self.core_engine)
 
-    async def _call_utility_async(self, method: str, *args,
-                                  engine: EngineIdentity) -> Any:
+    async def _call_utility_async(
+        self, method: str, *args, engine: EngineIdentity
+    ) -> Any:
         call_id = uuid.uuid1().int >> 64
         future = asyncio.get_running_loop().create_future()
         self.utility_results[call_id] = future
-        message = (EngineCoreRequestType.UTILITY.value, *self.encoder.encode(
-            (self.client_index, call_id, method, args)))
+        message = (
+            EngineCoreRequestType.UTILITY.value,
+            *self.encoder.encode((self.client_index, call_id, method, args)),
+        )
         await self._send_input_message(message, engine, args)
         self._ensure_output_queue_task()
         return await future
@@ -942,38 +983,46 @@ async def list_loras_async(self) -> set[int]:
     async def pin_lora_async(self, lora_id: int) -> bool:
         return await self.call_utility_async("pin_lora", lora_id)
 
-    async def save_sharded_state_async(self,
-                                       path: str,
-                                       pattern: Optional[str] = None,
-                                       max_size: Optional[int] = None) -> None:
-        await self.call_utility_async("save_sharded_state", path, pattern,
-                                      max_size)
+    async def save_sharded_state_async(
+        self, path: str, pattern: Optional[str] = None, max_size: Optional[int] = None
+    ) -> None:
+        await self.call_utility_async("save_sharded_state", path, pattern, max_size)
 
     async def collective_rpc_async(
-            self,
-            method: Union[str, Callable[..., _R]],
-            timeout: Optional[float] = None,
-            args: tuple = (),
-            kwargs: Optional[dict[str, Any]] = None) -> list[_R]:
-        return await self.call_utility_async("collective_rpc", method, timeout,
-                                             args, kwargs)
+        self,
+        method: Union[str, Callable[..., _R]],
+        timeout: Optional[float] = None,
+        args: tuple = (),
+        kwargs: Optional[dict[str, Any]] = None,
+    ) -> list[_R]:
+        return await self.call_utility_async(
+            "collective_rpc", method, timeout, args, kwargs
+        )
 
 
 class DPAsyncMPClient(AsyncMPClient):
     """Asyncio-compatible client for multi-proc, multi-engine (data parallel)
     EngineCore. Assumes external load-balancing by default."""
 
-    def __init__(self,
-                 vllm_config: VllmConfig,
-                 executor_class: type[Executor],
-                 log_stats: bool,
-                 client_addresses: Optional[dict[str, str]] = None,
-                 client_count: int = 1,
-                 client_index: int = 0):
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        executor_class: type[Executor],
+        log_stats: bool,
+        client_addresses: Optional[dict[str, str]] = None,
+        client_count: int = 1,
+        client_index: int = 0,
+    ):
         self.current_wave = 0
 
-        super().__init__(vllm_config, executor_class, log_stats,
-                         client_addresses, client_count, client_index)
+        super().__init__(
+            vllm_config,
+            executor_class,
+            log_stats,
+            client_addresses,
+            client_count,
+            client_index,
+        )
 
         # List of [waiting, running] pair per engine.
         # Used only by DPLBAsyncMPClient subclass.
@@ -981,10 +1030,8 @@ def __init__(self,
 
         self.first_req_sock_addr = get_open_zmq_inproc_path()
         self.first_req_send_socket = self.resources.first_req_send_socket = (
-            make_zmq_socket(self.ctx,
-                            self.first_req_sock_addr,
-                            zmq.PAIR,
-                            bind=True))
+            make_zmq_socket(self.ctx, self.first_req_sock_addr, zmq.PAIR, bind=True)
+        )
         try:
             # If we are running in an asyncio event loop, start the stats task.
             # Otherwise, it will be started lazily.
@@ -1003,25 +1050,25 @@ def _ensure_stats_update_task(self):
         # NOTE: running and waiting counts are all global from
         # the Coordinator include all global EngineCores. This
         # slice includes just the cores managed by this client.
-        count_slice = slice(self.engine_ranks_managed[0],
-                            self.engine_ranks_managed[-1] + 1)
+        count_slice = slice(
+            self.engine_ranks_managed[0], self.engine_ranks_managed[-1] + 1
+        )
 
         async def run_engine_stats_update_task():
-            with (make_zmq_socket(self.ctx,
-                                  self.stats_update_address,
-                                  zmq.XSUB,
-                                  linger=0) as socket,
-                  make_zmq_socket(self.ctx,
-                                  self.first_req_sock_addr,
-                                  zmq.PAIR,
-                                  bind=False,
-                                  linger=0) as first_req_rcv_socket):
+            with (
+                make_zmq_socket(
+                    self.ctx, self.stats_update_address, zmq.XSUB, linger=0
+                ) as socket,
+                make_zmq_socket(
+                    self.ctx, self.first_req_sock_addr, zmq.PAIR, bind=False, linger=0
+                ) as first_req_rcv_socket,
+            ):
                 assert isinstance(socket, zmq.asyncio.Socket)
                 assert isinstance(first_req_rcv_socket, zmq.asyncio.Socket)
                 self.resources.stats_update_socket = socket
                 self.resources.first_req_rcv_socket = first_req_rcv_socket
                 # Send subscription message.
-                await socket.send(b'\x01')
+                await socket.send(b"\x01")
 
                 poller = zmq.asyncio.Poller()
                 poller.register(socket, zmq.POLLIN)
@@ -1029,23 +1076,27 @@ async def run_engine_stats_update_task():
 
                 while True:
                     events = await poller.poll()
-                    if not self.engines_running and len(events) == 2 or (
-                            events[0][0] == first_req_rcv_socket):
+                    if (
+                        not self.engines_running
+                        and len(events) == 2
+                        or (events[0][0] == first_req_rcv_socket)
+                    ):
                         # Check if this is a regular request notification or
                         # scale up notification
-                        buf = first_req_rcv_socket.recv(
-                            flags=zmq.NOBLOCK).result()
+                        buf = first_req_rcv_socket.recv(flags=zmq.NOBLOCK).result()
 
                         decoded = msgspec.msgpack.decode(buf)
-                        if isinstance(
-                                decoded,
-                            (list, tuple)) and len(decoded) == 2 and decoded[
-                                0] == "SCALE_ELASTIC_EP":
+                        if (
+                            isinstance(decoded, (list, tuple))
+                            and len(decoded) == 2
+                            and decoded[0] == "SCALE_ELASTIC_EP"
+                        ):
                             # Extract new engine count from the decoded message
                             new_engine_count = decoded[1]
                             # Send scale up notification to coordinator
                             scale_msg = msgspec.msgpack.encode(
-                                ("SCALE_ELASTIC_EP", new_engine_count))
+                                ("SCALE_ELASTIC_EP", new_engine_count)
+                            )
                             await socket.send(scale_msg)
                             continue
 
@@ -1056,14 +1107,14 @@ async def run_engine_stats_update_task():
                         target_eng_index = decoded[1]
                         self.engines_running = True
                         msg = msgspec.msgpack.encode(
-                            (target_eng_index, self.current_wave))
+                            (target_eng_index, self.current_wave)
+                        )
                         await socket.send(msg)
 
                     buf = None
                     while True:
                         # Drain all stats events (we only care about latest).
-                        future: asyncio.Future[bytes] = socket.recv(
-                            flags=zmq.NOBLOCK)
+                        future: asyncio.Future[bytes] = socket.recv(flags=zmq.NOBLOCK)
                         if isinstance(future.exception(), zmq.Again):
                             break
                         buf = future.result()
@@ -1077,11 +1128,13 @@ async def run_engine_stats_update_task():
                     if counts is not None:
                         sliced_counts = counts[count_slice]
                         self.lb_engines = sliced_counts
-                        logger.debug("Received counts: %s (%s)", sliced_counts,
-                                     count_slice)
+                        logger.debug(
+                            "Received counts: %s (%s)", sliced_counts, count_slice
+                        )
 
         resources.stats_update_task = asyncio.create_task(
-            run_engine_stats_update_task())
+            run_engine_stats_update_task()
+        )
 
     async def add_request_async(self, request: EngineCoreRequest) -> None:
         self._ensure_stats_update_task()
@@ -1090,8 +1143,7 @@ async def add_request_async(self, request: EngineCoreRequest) -> None:
         request.client_index = self.client_index
 
         chosen_engine = self.get_core_engine_for_request(request)
-        to_await = self._send_input(EngineCoreRequestType.ADD, request,
-                                    chosen_engine)
+        to_await = self._send_input(EngineCoreRequestType.ADD, request, chosen_engine)
         if not self.engines_running:
             # Notify coordinator that we're sending a request
             req_msg = msgspec.msgpack.encode(("FIRST_REQ", chosen_engine))
@@ -1109,29 +1161,36 @@ class DPLBAsyncMPClient(DPAsyncMPClient):
     """Asyncio-compatible client for multi-proc, multi-engine (data parallel)
     EngineCore. Load-balances between multiple engine processes."""
 
-    def __init__(self,
-                 vllm_config: VllmConfig,
-                 executor_class: type[Executor],
-                 log_stats: bool,
-                 client_addresses: Optional[dict[str, str]] = None,
-                 client_count: int = 1,
-                 client_index: int = 0):
-
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        executor_class: type[Executor],
+        log_stats: bool,
+        client_addresses: Optional[dict[str, str]] = None,
+        client_count: int = 1,
+        client_index: int = 0,
+    ):
         self.client_count = client_count
 
         # To route aborts to the correct engine.
         self.reqs_in_flight: dict[str, EngineIdentity] = {}
 
-        super().__init__(vllm_config, executor_class, log_stats,
-                         client_addresses, client_count, client_index)
+        super().__init__(
+            vllm_config,
+            executor_class,
+            log_stats,
+            client_addresses,
+            client_count,
+            client_index,
+        )
 
         assert len(self.core_engines) > 1
 
-        self.eng_start_index = (len(self.core_engines) *
-                                self.client_index) // client_count
+        self.eng_start_index = (
+            len(self.core_engines) * self.client_index
+        ) // client_count
 
-    def get_core_engine_for_request(
-            self, request: EngineCoreRequest) -> EngineIdentity:
+    def get_core_engine_for_request(self, request: EngineCoreRequest) -> EngineIdentity:
         # Engines are in rank order.
         if (eng_index := request.data_parallel_rank) is None:
             current_counts = self.lb_engines
@@ -1159,14 +1218,19 @@ def get_core_engine_for_request(
 
     async def call_utility_async(self, method: str, *args) -> Any:
         # Only the result from the first engine is returned.
-        return (await asyncio.gather(*[
-            self._call_utility_async(method, *args, engine=engine)
-            for engine in self.core_engines
-        ]))[0]
+        return (
+            await asyncio.gather(
+                *[
+                    self._call_utility_async(method, *args, engine=engine)
+                    for engine in self.core_engines
+                ]
+            )
+        )[0]
 
     @staticmethod
-    async def process_engine_outputs(self: "DPLBAsyncMPClient",
-                                     outputs: EngineCoreOutputs):
+    async def process_engine_outputs(
+        self: "DPLBAsyncMPClient", outputs: EngineCoreOutputs
+    ):
         if outputs.finished_requests and self.reqs_in_flight:
             for req_id in outputs.finished_requests:
                 self.reqs_in_flight.pop(req_id, None)
@@ -1188,10 +1252,10 @@ async def abort_requests_async(self, request_ids: list[str]) -> None:
         for engine, req_ids in by_engine.items():
             await self._abort_requests(req_ids, engine)
 
-    async def _abort_requests(self, request_ids: list[str],
-                              engine: EngineIdentity) -> None:
-        await self._send_input(EngineCoreRequestType.ABORT, request_ids,
-                               engine)
+    async def _abort_requests(
+        self, request_ids: list[str], engine: EngineIdentity
+    ) -> None:
+        await self._send_input(EngineCoreRequestType.ABORT, request_ids, engine)
 
     async def scale_elastic_ep(self, new_data_parallel_size: int) -> None:
         """Scale elastic EP data parallel size"""
@@ -1199,22 +1263,27 @@ async def scale_elastic_ep(self, new_data_parallel_size: int) -> None:
 
         assert new_data_parallel_size != cur_data_parallel_size, (
             f"new_data_parallel_size {new_data_parallel_size} must be "
-            f"different from cur_data_parallel_size {cur_data_parallel_size}")
+            f"different from cur_data_parallel_size {cur_data_parallel_size}"
+        )
 
-        assert self.vllm_config.parallel_config.data_parallel_backend == \
-            "ray", "Only ray DP backend supports scaling elastic EP"
+        assert self.vllm_config.parallel_config.data_parallel_backend == "ray", (
+            "Only ray DP backend supports scaling elastic EP"
+        )
 
         scale_up = new_data_parallel_size > cur_data_parallel_size
 
         if scale_up:
-            await self._scale_up_elastic_ep(cur_data_parallel_size,
-                                            new_data_parallel_size)
+            await self._scale_up_elastic_ep(
+                cur_data_parallel_size, new_data_parallel_size
+            )
         else:
-            await self._scale_down_elastic_ep(cur_data_parallel_size,
-                                              new_data_parallel_size)
+            await self._scale_down_elastic_ep(
+                cur_data_parallel_size, new_data_parallel_size
+            )
 
-    async def _scale_up_elastic_ep(self, cur_data_parallel_size: int,
-                                   new_data_parallel_size: int) -> None:
+    async def _scale_up_elastic_ep(
+        self, cur_data_parallel_size: int, new_data_parallel_size: int
+    ) -> None:
         """Scale up the data parallel size by creating new engine cores
         and reconfiguring existing ones."""
         cur_data_parallel_size = len(self.core_engines)
@@ -1222,21 +1291,18 @@ async def _scale_up_elastic_ep(self, cur_data_parallel_size: int,
         # Phase 1: Send reconfigure messages to all existing engines and wait
         # for them to be sent
         reconfig_futures = []
-        self.vllm_config.parallel_config.data_parallel_master_port = \
-            get_open_port()
+        self.vllm_config.parallel_config.data_parallel_master_port = get_open_port()
         for engine in self.core_engines:
             reconfig_request = ReconfigureDistributedRequest(
                 new_data_parallel_size=new_data_parallel_size,
                 new_data_parallel_rank=ReconfigureRankType.KEEP_CURRENT_RANK,
-                new_data_parallel_rank_local=\
-                ReconfigureRankType.KEEP_CURRENT_RANK,
-                new_data_parallel_master_ip=self.vllm_config.parallel_config.
-                data_parallel_master_ip,
-                new_data_parallel_master_port=self.vllm_config.parallel_config.
-                data_parallel_master_port)
-            coro = self._call_utility_async("reinitialize_distributed",
-                                            reconfig_request,
-                                            engine=engine)
+                new_data_parallel_rank_local=ReconfigureRankType.KEEP_CURRENT_RANK,
+                new_data_parallel_master_ip=self.vllm_config.parallel_config.data_parallel_master_ip,
+                new_data_parallel_master_port=self.vllm_config.parallel_config.data_parallel_master_port,
+            )
+            coro = self._call_utility_async(
+                "reinitialize_distributed", reconfig_request, engine=engine
+            )
             reconfig_futures.append(asyncio.create_task(coro))
 
         logger.info("All reconfigure messages sent, starting engine creation")
@@ -1244,10 +1310,10 @@ async def _scale_up_elastic_ep(self, cur_data_parallel_size: int,
         # Phase 2: Create new engines now that reconfig messages have been sent
         # self.resources.engine_manager is guaranteed to be
         # CoreEngineActorManager for RayDPClient
-        assert isinstance(self.resources.engine_manager,
-                          CoreEngineActorManager)
+        assert isinstance(self.resources.engine_manager, CoreEngineActorManager)
         self.resources.engine_manager.scale_up_elastic_ep(
-            self.vllm_config, new_data_parallel_size)
+            self.vllm_config, new_data_parallel_size
+        )
 
         # Create new CoreEngine objects for the new engines
         new_engine_identities = set()
@@ -1262,7 +1328,8 @@ async def _scale_up_elastic_ep(self, cur_data_parallel_size: int,
             if not sync_input_socket.poll(timeout=600_000):
                 raise TimeoutError(
                     "Timed out waiting for new engines to send initial "
-                    "message on input socket.")
+                    "message on input socket."
+                )
             identity, _ = sync_input_socket.recv_multipart()
             new_engine_identities.discard(identity)
 
@@ -1274,42 +1341,42 @@ async def _scale_up_elastic_ep(self, cur_data_parallel_size: int,
         # stats_update_task connection
         self._ensure_stats_update_task()
         scale_up_marker = msgspec.msgpack.encode(
-            ("SCALE_ELASTIC_EP", new_data_parallel_size))
+            ("SCALE_ELASTIC_EP", new_data_parallel_size)
+        )
         await self.first_req_send_socket.send(scale_up_marker)
 
         # Update the parallel config
-        self.vllm_config.parallel_config.data_parallel_size = \
-            new_data_parallel_size
+        self.vllm_config.parallel_config.data_parallel_size = new_data_parallel_size
         logger.info(
             "[Elastic EP] Scale up completed, new data parallel size: %s",
-            new_data_parallel_size)
+            new_data_parallel_size,
+        )
 
-    async def _scale_down_elastic_ep(self, cur_data_parallel_size: int,
-                                     new_data_parallel_size: int) -> None:
+    async def _scale_down_elastic_ep(
+        self, cur_data_parallel_size: int, new_data_parallel_size: int
+    ) -> None:
         """Scale down the data parallel size by shutting down and
         reconfiguring existing engine cores."""
         cur_data_parallel_size = len(self.core_engines)
 
-        self.vllm_config.parallel_config.data_parallel_master_port = \
-            get_open_port()
+        self.vllm_config.parallel_config.data_parallel_master_port = get_open_port()
 
         reconfig_futures = []
         for cur_dp_rank, engine in enumerate(self.core_engines):
             reconfig_request = ReconfigureDistributedRequest(
                 new_data_parallel_size=new_data_parallel_size,
                 new_data_parallel_rank=ReconfigureRankType.KEEP_CURRENT_RANK,
-                new_data_parallel_rank_local=\
-                ReconfigureRankType.KEEP_CURRENT_RANK,
-                new_data_parallel_master_ip=self.vllm_config.parallel_config.
-                data_parallel_master_ip,
-                new_data_parallel_master_port=self.vllm_config.parallel_config.
-                data_parallel_master_port)
+                new_data_parallel_rank_local=ReconfigureRankType.KEEP_CURRENT_RANK,
+                new_data_parallel_master_ip=self.vllm_config.parallel_config.data_parallel_master_ip,
+                new_data_parallel_master_port=self.vllm_config.parallel_config.data_parallel_master_port,
+            )
             if cur_dp_rank >= new_data_parallel_size:
-                reconfig_request.new_data_parallel_rank = \
-                ReconfigureRankType.SHUTDOWN_CURRENT_RANK
-            coro = self._call_utility_async("reinitialize_distributed",
-                                            reconfig_request,
-                                            engine=engine)
+                reconfig_request.new_data_parallel_rank = (
+                    ReconfigureRankType.SHUTDOWN_CURRENT_RANK
+                )
+            coro = self._call_utility_async(
+                "reinitialize_distributed", reconfig_request, engine=engine
+            )
             reconfig_futures.append(asyncio.create_task(coro))
 
         for _ in range(new_data_parallel_size, cur_data_parallel_size):
@@ -1317,18 +1384,19 @@ async def _scale_down_elastic_ep(self, cur_data_parallel_size: int,
 
         await asyncio.gather(*reconfig_futures)
 
-        assert isinstance(self.resources.engine_manager,
-                          CoreEngineActorManager)
+        assert isinstance(self.resources.engine_manager, CoreEngineActorManager)
         self.resources.engine_manager.scale_down_elastic_ep(
-            cur_data_parallel_size, new_data_parallel_size)
+            cur_data_parallel_size, new_data_parallel_size
+        )
 
         self._ensure_stats_update_task()
         scale_down_marker = msgspec.msgpack.encode(
-            ("SCALE_ELASTIC_EP", new_data_parallel_size))
+            ("SCALE_ELASTIC_EP", new_data_parallel_size)
+        )
         await self.first_req_send_socket.send(scale_down_marker)
 
-        self.vllm_config.parallel_config.data_parallel_size = \
-            new_data_parallel_size
+        self.vllm_config.parallel_config.data_parallel_size = new_data_parallel_size
         logger.info(
             "[Elastic EP] Scale down completed, new data parallel size: %s",
-            new_data_parallel_size)
+            new_data_parallel_size,
+        )
diff --git a/vllm/v1/engine/detokenizer.py b/vllm/v1/engine/detokenizer.py
index 0f993a74c810..9d1d7558b1ed 100644
--- a/vllm/v1/engine/detokenizer.py
+++ b/vllm/v1/engine/detokenizer.py
@@ -11,7 +11,10 @@
 
 from vllm.logger import init_logger
 from vllm.transformers_utils.detokenizer_utils import (
-    AnyTokenizer, convert_prompt_ids_to_tokens, detokenize_incrementally)
+    AnyTokenizer,
+    convert_prompt_ids_to_tokens,
+    detokenize_incrementally,
+)
 from vllm.utils import length_from_prompt_token_ids_or_embeds
 from vllm.v1.engine import EngineCoreRequest
 
@@ -19,15 +22,13 @@
 
 # Only tokenizers >= 0.21.1 supports DecodeStream used for
 # FastIncrementalDetokenizer.
-USE_FAST_DETOKENIZER = version.parse(
-    tokenizers.__version__) >= version.parse("0.21.1")
+USE_FAST_DETOKENIZER = version.parse(tokenizers.__version__) >= version.parse("0.21.1")
 
 # Error string from https://github.com/huggingface/tokenizers/blob/909fdde2a4ffedd9295206f705eb612be2a91b12/tokenizers/src/tokenizer/mod.rs#L1042
 INVALID_PREFIX_ERR_MSG = "Invalid prefix encountered"
 
 
 class IncrementalDetokenizer:
-
     def __init__(self):
         self.token_ids: list[int] = []
 
@@ -35,8 +36,7 @@ def __init__(self):
     def output_token_ids(self) -> list[int]:
         return self.token_ids
 
-    def update(self, new_token_ids: list[int],
-               stop_terminated: bool) -> Optional[str]:
+    def update(self, new_token_ids: list[int], stop_terminated: bool) -> Optional[str]:
         self.token_ids.extend(new_token_ids)
         return None
 
@@ -49,15 +49,13 @@ def from_new_request(
         tokenizer: Optional[AnyTokenizer],
         request: EngineCoreRequest,
     ) -> "IncrementalDetokenizer":
-
         assert request.sampling_params is not None
 
         if tokenizer is None:
             # No tokenizer => skipping detokenization.
             return IncrementalDetokenizer()
 
-        if USE_FAST_DETOKENIZER and isinstance(tokenizer,
-                                               PreTrainedTokenizerFast):
+        if USE_FAST_DETOKENIZER and isinstance(tokenizer, PreTrainedTokenizerFast):
             # Fast tokenizer => use tokenizers library DecodeStream.
             return FastIncrementalDetokenizer(tokenizer, request)
 
@@ -66,7 +64,6 @@ def from_new_request(
 
 
 class BaseIncrementalDetokenizer(IncrementalDetokenizer, ABC):
-
     def __init__(self, request: EngineCoreRequest):
         super().__init__()
 
@@ -88,8 +85,7 @@ def __init__(self, request: EngineCoreRequest):
         # Generation data
         self.output_text = ""
 
-    def update(self, new_token_ids: list[int],
-               stop_terminated: bool) -> Optional[str]:
+    def update(self, new_token_ids: list[int], stop_terminated: bool) -> Optional[str]:
         """
         Update RequestState for the request_id by:
             1) Detokenize the new token ids incrementally.
@@ -117,8 +113,7 @@ def update(self, new_token_ids: list[int],
             self.token_ids.append(new_token_id)
             self.output_text += self.decode_next(new_token_id)
             # Support min_tokens, see https://github.com/vllm-project/vllm/pull/22014
-            if self.min_tokens and len(
-                    self.output_token_ids) <= self.min_tokens:
+            if self.min_tokens and len(self.output_token_ids) <= self.min_tokens:
                 stop_check_offset = len(self.output_text)
 
         if skipped_stop_token_id is not None:
@@ -152,8 +147,11 @@ def get_next_output_text(self, finished: bool, delta: bool) -> str:
         # We return the full output text if the sequence is finished.
         buffer_length = 0 if finished else self.stop_buffer_length
         if not delta:
-            return self.output_text[:-buffer_length] if buffer_length else (
-                self.output_text)
+            return (
+                self.output_text[:-buffer_length]
+                if buffer_length
+                else (self.output_text)
+            )
         length = len(self.output_text) - buffer_length
         last_offset = self._last_output_text_offset
         if last_offset < length:
@@ -163,9 +161,7 @@ def get_next_output_text(self, finished: bool, delta: bool) -> str:
 
 
 class FastIncrementalDetokenizer(BaseIncrementalDetokenizer):
-
-    def __init__(self, tokenizer: PreTrainedTokenizerFast,
-                 request: EngineCoreRequest):
+    def __init__(self, tokenizer: PreTrainedTokenizerFast, request: EngineCoreRequest):
         super().__init__(request)
 
         sampling_params = request.sampling_params
@@ -173,8 +169,7 @@ def __init__(self, tokenizer: PreTrainedTokenizerFast,
 
         self.request_id = request.request_id
         self.skip_special_tokens = sampling_params.skip_special_tokens
-        self.stream = DecodeStream(
-            skip_special_tokens=self.skip_special_tokens)
+        self.stream = DecodeStream(skip_special_tokens=self.skip_special_tokens)
 
         self.tokenizer: Tokenizer = tokenizer._tokenizer
 
@@ -185,7 +180,7 @@ def __init__(self, tokenizer: PreTrainedTokenizerFast,
         if prompt_len > 4:
             for i in range(4, min(prompt_len + 1, 24)):
                 suffix = prompt_token_ids[-i:]
-                if '�' not in self.tokenizer.decode(suffix):
+                if "�" not in self.tokenizer.decode(suffix):
                     prompt_suffix = suffix
                     break
 
@@ -195,17 +190,18 @@ def __init__(self, tokenizer: PreTrainedTokenizerFast,
 
         self.spaces_between_special_tokens = (
             sampling_params.skip_special_tokens
-            or sampling_params.spaces_between_special_tokens)
+            or sampling_params.spaces_between_special_tokens
+        )
 
         if not self.spaces_between_special_tokens:
             # Store dict of added token ids so that we can suppress
             # the spaces between them.
-            if (added_token_ids := getattr(self.tokenizer, "added_token_ids",
-                                           None)) is None:
+            if (
+                added_token_ids := getattr(self.tokenizer, "added_token_ids", None)
+            ) is None:
                 self.tokenizer.added_token_ids = added_token_ids = {
                     tid: tok.content
-                    for tid, tok in
-                    self.tokenizer.get_added_tokens_decoder().items()
+                    for tid, tok in self.tokenizer.get_added_tokens_decoder().items()
                 }
 
             if added_token_ids:
@@ -245,15 +241,15 @@ def _protected_step(self, next_token_id: int) -> Optional[str]:
             # See https://github.com/vllm-project/vllm/issues/17448.
             logger.warning(
                 "Encountered invalid prefix detokenization error"
-                " for request %s, resetting decode stream.", self.request_id)
-            self.stream = DecodeStream(
-                skip_special_tokens=self.skip_special_tokens)
+                " for request %s, resetting decode stream.",
+                self.request_id,
+            )
+            self.stream = DecodeStream(skip_special_tokens=self.skip_special_tokens)
             token = self.stream.step(self.tokenizer, next_token_id)
         return token
 
 
 class SlowIncrementalDetokenizer(BaseIncrementalDetokenizer):
-
     def __init__(self, tokenizer: AnyTokenizer, request: EngineCoreRequest):
         super().__init__(request)
 
@@ -262,7 +258,8 @@ def __init__(self, tokenizer: AnyTokenizer, request: EngineCoreRequest):
         assert params is not None
 
         self.prompt_len = length_from_prompt_token_ids_or_embeds(
-            request.prompt_token_ids, request.prompt_embeds)
+            request.prompt_token_ids, request.prompt_embeds
+        )
 
         # Metadata for incremental detokenization.
         if request.prompt_token_ids is not None:
@@ -271,37 +268,37 @@ def __init__(self, tokenizer: AnyTokenizer, request: EngineCoreRequest):
                     tokenizer=tokenizer,
                     prompt_ids=request.prompt_token_ids,
                     skip_special_tokens=params.skip_special_tokens,
-                ))
+                )
+            )
         else:
             # Prompt embedding requests cannot be detokenized, in general.
             self.tokens = [""] * self.prompt_len
             self.prefix_offset = 0
             self.read_offest = 0
 
-        self.token_ids.extend(request.prompt_token_ids
-                              or [0] * self.prompt_len)
+        self.token_ids.extend(request.prompt_token_ids or [0] * self.prompt_len)
 
         self.skip_special_tokens = params.skip_special_tokens
-        self.spaces_between_special_tokens = (
-            params.spaces_between_special_tokens)
+        self.spaces_between_special_tokens = params.spaces_between_special_tokens
 
     @property
     def output_token_ids(self) -> list[int]:
-        return self.token_ids if not self.prompt_len else (
-            self.token_ids[self.prompt_len:])
+        return (
+            self.token_ids
+            if not self.prompt_len
+            else (self.token_ids[self.prompt_len :])
+        )
 
     def decode_next(self, next_token_id: int) -> str:
-        new_tokens, decoded_text, prefix_offset, read_offset = (
-            detokenize_incrementally(
-                tokenizer=self.tokenizer,
-                all_input_ids=self.token_ids,
-                prev_tokens=self.tokens,
-                prefix_offset=self.prefix_offset,
-                read_offset=self.read_offset,
-                skip_special_tokens=self.skip_special_tokens,
-                spaces_between_special_tokens=self.
-                spaces_between_special_tokens,
-            ))
+        new_tokens, decoded_text, prefix_offset, read_offset = detokenize_incrementally(
+            tokenizer=self.tokenizer,
+            all_input_ids=self.token_ids,
+            prev_tokens=self.tokens,
+            prefix_offset=self.prefix_offset,
+            read_offset=self.read_offset,
+            skip_special_tokens=self.skip_special_tokens,
+            spaces_between_special_tokens=self.spaces_between_special_tokens,
+        )
 
         self.tokens.extend(new_tokens)
         self.prefix_offset = prefix_offset
@@ -331,8 +328,7 @@ def check_stop_strings(
     for stop_str in stop:
         stop_string_len = len(stop_str)
         # Avoid searching already-searched text.
-        stop_index = output_text.find(stop_str,
-                                      1 - new_char_count - stop_string_len)
+        stop_index = output_text.find(stop_str, 1 - new_char_count - stop_string_len)
         if stop_index == -1:
             continue
 
diff --git a/vllm/v1/engine/exceptions.py b/vllm/v1/engine/exceptions.py
index 692ba9dc840f..d9f79a019e2d 100644
--- a/vllm/v1/engine/exceptions.py
+++ b/vllm/v1/engine/exceptions.py
@@ -2,6 +2,7 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 class EngineGenerateError(Exception):
     """Raised when a AsyncLLM.generate() fails. Recoverable."""
+
     pass
 
 
diff --git a/vllm/v1/engine/llm_engine.py b/vllm/v1/engine/llm_engine.py
index 3734c208004a..9da25c0662a8 100644
--- a/vllm/v1/engine/llm_engine.py
+++ b/vllm/v1/engine/llm_engine.py
@@ -23,8 +23,7 @@
 from vllm.sampling_params import SamplingParams
 from vllm.tasks import SupportedTask
 from vllm.tracing import init_tracer
-from vllm.transformers_utils.tokenizer import (AnyTokenizer,
-                                               init_tokenizer_from_configs)
+from vllm.transformers_utils.tokenizer import AnyTokenizer, init_tokenizer_from_configs
 from vllm.usage.usage_lib import UsageContext
 from vllm.utils import Device
 from vllm.v1.engine import EngineCoreRequest
@@ -62,12 +61,14 @@ def __init__(
                 "Using V1 LLMEngine, but envs.VLLM_USE_V1=False. "
                 "This should not happen. As a workaround, try using "
                 "LLMEngine.from_vllm_config(...) or explicitly set "
-                "VLLM_USE_V1=0 or 1 and report this issue on Github.")
+                "VLLM_USE_V1=0 or 1 and report this issue on Github."
+            )
 
         if stat_loggers is not None:
             raise NotImplementedError(
                 "Passing StatLoggers to LLMEngine in V1 is not yet supported. "
-                "Set VLLM_USE_V1=0 and file and issue on Github.")
+                "Set VLLM_USE_V1=0 and file and issue on Github."
+            )
 
         self.vllm_config = vllm_config
         self.observability_config = vllm_config.observability_config
@@ -76,15 +77,19 @@ def __init__(
 
         self.log_stats = log_stats
 
-        executor_backend = (
-            self.vllm_config.parallel_config.distributed_executor_backend)
+        executor_backend = self.vllm_config.parallel_config.distributed_executor_backend
         parallel_config = vllm_config.parallel_config
-        self.external_launcher_dp = (parallel_config.data_parallel_size > 1 and
-                                     executor_backend == "external_launcher")
+        self.external_launcher_dp = (
+            parallel_config.data_parallel_size > 1
+            and executor_backend == "external_launcher"
+        )
         # important: init dp group before init the engine_core
         # In the decoupled engine case this is handled in EngineCoreProc.
-        if not multiprocess_mode and parallel_config.data_parallel_size > 1 \
-            and not self.external_launcher_dp:
+        if (
+            not multiprocess_mode
+            and parallel_config.data_parallel_size > 1
+            and not self.external_launcher_dp
+        ):
             self.dp_group = parallel_config.stateless_init_dp_group()
         else:
             self.dp_group = None
@@ -95,20 +100,22 @@ def __init__(
         else:
             # Tokenizer (+ ensure liveness if running in another process).
             self.tokenizer = init_tokenizer_from_configs(
-                model_config=vllm_config.model_config)
+                model_config=vllm_config.model_config
+            )
 
         # Processor (convert Inputs --> EngineCoreRequests)
-        self.processor = Processor(vllm_config=vllm_config,
-                                   tokenizer=self.tokenizer,
-                                   mm_registry=mm_registry)
+        self.processor = Processor(
+            vllm_config=vllm_config, tokenizer=self.tokenizer, mm_registry=mm_registry
+        )
 
         # OutputProcessor (convert EngineCoreOutputs --> RequestOutput).
-        self.output_processor = OutputProcessor(self.tokenizer,
-                                                log_stats=self.log_stats)
+        self.output_processor = OutputProcessor(
+            self.tokenizer, log_stats=self.log_stats
+        )
         if self.observability_config.otlp_traces_endpoint is not None:
             tracer = init_tracer(
-                "vllm.llm_engine",
-                self.observability_config.otlp_traces_endpoint)
+                "vllm.llm_engine", self.observability_config.otlp_traces_endpoint
+            )
             self.output_processor.tracer = tracer
 
         # EngineCore (gets EngineCoreRequests and gives EngineCoreOutputs)
@@ -149,12 +156,14 @@ def from_vllm_config(
         stat_loggers: Optional[list[StatLoggerFactory]] = None,
         disable_log_stats: bool = False,
     ) -> "LLMEngine":
-        return cls(vllm_config=vllm_config,
-                   executor_class=Executor.get_class(vllm_config),
-                   log_stats=(not disable_log_stats),
-                   usage_context=usage_context,
-                   stat_loggers=stat_loggers,
-                   multiprocess_mode=envs.VLLM_ENABLE_V1_MULTIPROCESSING)
+        return cls(
+            vllm_config=vllm_config,
+            executor_class=Executor.get_class(vllm_config),
+            log_stats=(not disable_log_stats),
+            usage_context=usage_context,
+            stat_loggers=stat_loggers,
+            multiprocess_mode=envs.VLLM_ENABLE_V1_MULTIPROCESSING,
+        )
 
     @classmethod
     def from_engine_args(
@@ -175,12 +184,14 @@ def from_engine_args(
             enable_multiprocessing = True
 
         # Create the LLMEngine.
-        return cls(vllm_config=vllm_config,
-                   executor_class=executor_class,
-                   log_stats=not engine_args.disable_log_stats,
-                   usage_context=usage_context,
-                   stat_loggers=stat_loggers,
-                   multiprocess_mode=enable_multiprocessing)
+        return cls(
+            vllm_config=vllm_config,
+            executor_class=executor_class,
+            log_stats=not engine_args.disable_log_stats,
+            usage_context=usage_context,
+            stat_loggers=stat_loggers,
+            multiprocess_mode=enable_multiprocessing,
+        )
 
     def get_num_unfinished_requests(self) -> int:
         return self.output_processor.get_num_unfinished_requests()
@@ -193,7 +204,8 @@ def has_unfinished_requests(self) -> bool:
 
     def has_unfinished_requests_dp(self, has_unfinished: bool) -> bool:
         aggregated_has_unfinished = ParallelConfig.has_unfinished_dp(
-            self.dp_group, has_unfinished)
+            self.dp_group, has_unfinished
+        )
         if not has_unfinished and aggregated_has_unfinished:
             self.should_execute_dummy_batch = True
         return aggregated_has_unfinished
@@ -225,22 +237,28 @@ def add_request(
     ) -> None:
         # Validate the request_id type.
         if not isinstance(request_id, str):
-            raise TypeError(
-                f"request_id must be a string, got {type(request_id)}")
+            raise TypeError(f"request_id must be a string, got {type(request_id)}")
 
         # Process raw inputs into the request.
         if isinstance(prompt, EngineCoreRequest):
             request = prompt
         else:
             assert prompt_text is None
-            logger.warning_once("Processor has been moved under LLM and will "
-                                "be removed from LLMEngine in v0.13.")
-            request = self.processor.process_inputs(request_id, prompt, params,
-                                                    arrival_time, lora_request,
-                                                    tokenization_kwargs,
-                                                    trace_headers, priority)
-            prompt_text = (prompt if isinstance(prompt, str) else
-                           prompt.get("prompt"))
+            logger.warning_once(
+                "Processor has been moved under LLM and will "
+                "be removed from LLMEngine in v0.13."
+            )
+            request = self.processor.process_inputs(
+                request_id,
+                prompt,
+                params,
+                arrival_time,
+                lora_request,
+                tokenization_kwargs,
+                trace_headers,
+                priority,
+            )
+            prompt_text = prompt if isinstance(prompt, str) else prompt.get("prompt")
 
         n = params.n if isinstance(params, SamplingParams) else 1
 
@@ -260,13 +278,13 @@ def add_request(
             child_request.sampling_params = params
 
             # Make a new RequestState and queue.
-            self.output_processor.add_request(child_request, prompt_text,
-                                              parent_req, idx)
+            self.output_processor.add_request(
+                child_request, prompt_text, parent_req, idx
+            )
             # Add the request to EngineCore.
             self.engine_core.add_request(child_request)
 
     def step(self) -> Union[list[RequestOutput], list[PoolingRequestOutput]]:
-
         if self.should_execute_dummy_batch:
             self.should_execute_dummy_batch = False
             self.engine_core.execute_dummy_batch()
@@ -280,7 +298,8 @@ def step(self) -> Union[list[RequestOutput], list[PoolingRequestOutput]]:
         processed_outputs = self.output_processor.process_outputs(
             outputs.outputs,
             engine_core_timestamp=outputs.timestamp,
-            iteration_stats=iteration_stats)
+            iteration_stats=iteration_stats,
+        )
 
         # 3) Abort any reqs that finished due to stop strings.
         self.engine_core.abort_requests(processed_outputs.reqs_to_abort)
@@ -330,8 +349,9 @@ def get_metrics(self) -> list[Metric]:
 
     def get_tokenizer(self) -> AnyTokenizer:
         if self.tokenizer is None:
-            raise ValueError("Unable to get tokenizer because "
-                             "skip_tokenizer_init is True")
+            raise ValueError(
+                "Unable to get tokenizer because skip_tokenizer_init is True"
+            )
 
         return self.tokenizer
 
@@ -365,17 +385,21 @@ def pin_lora(self, lora_id: int) -> bool:
         """Prevent an adapter from being evicted."""
         return self.engine_core.pin_lora(lora_id)
 
-    def collective_rpc(self,
-                       method: Union[str, Callable[[WorkerBase], _R]],
-                       timeout: Optional[float] = None,
-                       args: tuple = (),
-                       kwargs: Optional[dict[str, Any]] = None) -> list[_R]:
+    def collective_rpc(
+        self,
+        method: Union[str, Callable[[WorkerBase], _R]],
+        timeout: Optional[float] = None,
+        args: tuple = (),
+        kwargs: Optional[dict[str, Any]] = None,
+    ) -> list[_R]:
         return self.engine_core.collective_rpc(method, timeout, args, kwargs)
 
     def apply_model(self, func: Callable[[nn.Module], _R]) -> list[_R]:
-        return self.collective_rpc("apply_model", args=(func, ))
+        return self.collective_rpc("apply_model", args=(func,))
 
     def __del__(self):
-        if dp_group := getattr(self, "dp_group",
-                               None) and not self.external_launcher_dp:
+        if (
+            dp_group := getattr(self, "dp_group", None)
+            and not self.external_launcher_dp
+        ):
             stateless_destroy_torch_distributed_process_group(dp_group)
diff --git a/vllm/v1/engine/logprobs.py b/vllm/v1/engine/logprobs.py
index 133122b6fcc0..ab0e44fce155 100644
--- a/vllm/v1/engine/logprobs.py
+++ b/vllm/v1/engine/logprobs.py
@@ -9,7 +9,9 @@
 from vllm.logger import init_logger
 from vllm.logprobs import Logprob, PromptLogprobs, SampleLogprobs
 from vllm.transformers_utils.detokenizer_utils import (
-    AnyTokenizer, convert_ids_list_to_tokens)
+    AnyTokenizer,
+    convert_ids_list_to_tokens,
+)
 from vllm.v1.engine import EngineCoreOutput, EngineCoreRequest
 from vllm.v1.outputs import LogprobsLists, LogprobsTensors
 
@@ -20,7 +22,6 @@
 
 @dataclass
 class LogprobsProcessor:
-
     # Tokenizer for this request,
     # None if detokenization is disabled.
     tokenizer: Optional[AnyTokenizer]
@@ -43,7 +44,7 @@ def from_new_request(
         num_prompt_logprobs = request.sampling_params.prompt_logprobs
         return cls(
             tokenizer=tokenizer,
-            cumulative_logprob=(None if num_logprobs is None else 0.),
+            cumulative_logprob=(None if num_logprobs is None else 0.0),
             logprobs=(None if num_logprobs is None else []),
             # NOTE: logprob of first prompt token is None.
             prompt_logprobs=(None if num_prompt_logprobs is None else [None]),
@@ -68,12 +69,13 @@ def _update_sample_logprobs(self, logprobs_lists: LogprobsLists) -> None:
 
         token_ids_lst, logprobs_lst, ranks_lst = logprobs_lists
 
-        for rank, logprobs, token_ids in zip(ranks_lst, logprobs_lst,
-                                             token_ids_lst):
-
+        for rank, logprobs, token_ids in zip(ranks_lst, logprobs_lst, token_ids_lst):
             # Detokenize (non-incrementally).
-            decoded_tokens = NONES if self.tokenizer is None else (
-                convert_ids_list_to_tokens(self.tokenizer, token_ids))
+            decoded_tokens = (
+                NONES
+                if self.tokenizer is None
+                else (convert_ids_list_to_tokens(self.tokenizer, token_ids))
+            )
 
             # Sampler puts the sampled logprob in first.
             sampled_token_logprob = logprobs[0]
@@ -87,7 +89,8 @@ def _update_sample_logprobs(self, logprobs_lists: LogprobsLists) -> None:
                     decoded_tokens,
                     rank,
                     self.num_logprobs,
-                ))
+                )
+            )
 
     def _update_prompt_logprobs(
         self,
@@ -109,9 +112,13 @@ def _update_prompt_logprobs(
 
         # Detokenize non-incrementally.
         # Output is flat: [num_tok, num_lps] -> [num_tok * num_lps]
-        decoded_tokens = None if self.tokenizer is None else (
-            convert_ids_list_to_tokens(self.tokenizer,
-                                       token_ids.flatten().tolist()))
+        decoded_tokens = (
+            None
+            if self.tokenizer is None
+            else (
+                convert_ids_list_to_tokens(self.tokenizer, token_ids.flatten().tolist())
+            )
+        )
 
         # Recover shapes.
         num_prompt_tokens, num_logprobs = logprobs.shape
@@ -126,15 +133,20 @@ def _update_prompt_logprobs(
             # Handle flattening.
             offset = pos * num_logprobs
             offset_end = offset + num_logprobs
-            decoded_tokens_for_pos = NONES \
-            if decoded_tokens is None else decoded_tokens[offset:offset_end]
+            decoded_tokens_for_pos = (
+                NONES if decoded_tokens is None else decoded_tokens[offset:offset_end]
+            )
 
             # Update with the Logprob dictionary for this pos.
             self.prompt_logprobs.append(
-                self._make_logprob_dict(prompt_logprobs[pos], token_ids[pos],
-                                        decoded_tokens_for_pos,
-                                        prompt_token_ranks[pos],
-                                        self.num_prompt_logprobs))
+                self._make_logprob_dict(
+                    prompt_logprobs[pos],
+                    token_ids[pos],
+                    decoded_tokens_for_pos,
+                    prompt_token_ranks[pos],
+                    self.num_prompt_logprobs,
+                )
+            )
 
     def pop_prompt_logprobs(self) -> Optional[PromptLogprobs]:
         """Pop and return all request prompt logprobs
@@ -182,7 +194,7 @@ def _make_logprob_dict(
         # being in the topk, since inserting duplicated data
         # into a dictionary twice is the same as doing it once.
         topk_ranks = range(1, num_logprobs + 1)
-        ranks = itertools.chain((rank, ), topk_ranks)
+        ranks = itertools.chain((rank,), topk_ranks)
 
         return {
             token_id: Logprob(
@@ -191,7 +203,8 @@ def _make_logprob_dict(
                 decoded_token=token,
             )
             for token_id, logprob, rank, token in zip(
-                logprob_token_ids, logprobs, ranks, decoded_tokens)
+                logprob_token_ids, logprobs, ranks, decoded_tokens
+            )
         }
 
     def update_from_output(self, output: EngineCoreOutput) -> None:
diff --git a/vllm/v1/engine/output_processor.py b/vllm/v1/engine/output_processor.py
index 46cb97d4e7b5..eb65b68969e3 100644
--- a/vllm/v1/engine/output_processor.py
+++ b/vllm/v1/engine/output_processor.py
@@ -8,19 +8,21 @@
 
 import torch
 
-from vllm.outputs import (CompletionOutput, PoolingOutput,
-                          PoolingRequestOutput, RequestOutput)
+from vllm.outputs import (
+    CompletionOutput,
+    PoolingOutput,
+    PoolingRequestOutput,
+    RequestOutput,
+)
 from vllm.sampling_params import RequestOutputKind
-from vllm.tracing import (SpanAttributes, SpanKind, Tracer,
-                          extract_trace_context)
+from vllm.tracing import SpanAttributes, SpanKind, Tracer, extract_trace_context
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 from vllm.utils import length_from_prompt_token_ids_or_embeds
 from vllm.v1.engine import EngineCoreOutput, EngineCoreRequest, FinishReason
 from vllm.v1.engine.detokenizer import IncrementalDetokenizer
 from vllm.v1.engine.logprobs import LogprobsProcessor
 from vllm.v1.engine.parallel_sampling import ParentRequest
-from vllm.v1.metrics.stats import (IterationStats, LoRARequestStates,
-                                   RequestStateStats)
+from vllm.v1.metrics.stats import IterationStats, LoRARequestStates, RequestStateStats
 
 
 class RequestOutputCollector:
@@ -34,12 +36,14 @@ class RequestOutputCollector:
 
     def __init__(self, output_kind: RequestOutputKind):
         self.aggregate = output_kind == RequestOutputKind.DELTA
-        self.output: Optional[Union[RequestOutput, PoolingRequestOutput,
-                                    Exception]] = None
+        self.output: Optional[Union[RequestOutput, PoolingRequestOutput, Exception]] = (
+            None
+        )
         self.ready = asyncio.Event()
 
-    def put(self, output: Union[RequestOutput, PoolingRequestOutput,
-                                Exception]) -> None:
+    def put(
+        self, output: Union[RequestOutput, PoolingRequestOutput, Exception]
+    ) -> None:
         """Non-blocking put operation."""
         if self.output is None or isinstance(output, Exception):
             self.output = output
@@ -59,8 +63,7 @@ async def get(self) -> Union[RequestOutput, PoolingRequestOutput]:
             raise output
         return output
 
-    def get_nowait(
-            self) -> Optional[Union[RequestOutput, PoolingRequestOutput]]:
+    def get_nowait(self) -> Optional[Union[RequestOutput, PoolingRequestOutput]]:
         """Non-blocking get operation."""
         output = self.output
         if output is not None:
@@ -78,7 +81,6 @@ class OutputProcessorOutput:
 
 
 class RequestState:
-
     def __init__(
         self,
         request_id: str,
@@ -108,7 +110,8 @@ def __init__(
         self.prompt_token_ids = prompt_token_ids
         self.prompt_embeds = prompt_embeds
         self.prompt_len = length_from_prompt_token_ids_or_embeds(
-            self.prompt_token_ids, self.prompt_embeds)
+            self.prompt_token_ids, self.prompt_embeds
+        )
         self.logprobs_processor = logprobs_processor
         self.detokenizer = detokenizer
         self.max_tokens_param = max_tokens_param
@@ -119,8 +122,7 @@ def __init__(
         self.queue = queue
         self.num_cached_tokens = 0
 
-        self.stats = RequestStateStats(
-            arrival_time=arrival_time) if log_stats else None
+        self.stats = RequestStateStats(arrival_time=arrival_time) if log_stats else None
 
     @classmethod
     def from_new_request(
@@ -133,7 +135,6 @@ def from_new_request(
         queue: Optional[RequestOutputCollector],
         log_stats: bool,
     ) -> "RequestState":
-
         if sampling_params := request.sampling_params:
             if not sampling_params.detokenize:
                 tokenizer = None
@@ -164,8 +165,9 @@ def from_new_request(
             request_id=request.request_id,
             parent_req=parent_req,
             request_index=request_index,
-            lora_name=(request.lora_request.name
-                       if request.lora_request is not None else None),
+            lora_name=(
+                request.lora_request.name if request.lora_request is not None else None
+            ),
             output_kind=output_kind,
             prompt=prompt,
             prompt_token_ids=request.prompt_token_ids,
@@ -189,7 +191,6 @@ def make_request_output(
         stop_reason: Union[int, str, None],
         kv_transfer_params: Optional[dict[str, Any]] = None,
     ) -> Optional[Union[RequestOutput, PoolingRequestOutput]]:
-
         finished = finish_reason is not None
         final_only = self.output_kind == RequestOutputKind.FINAL_ONLY
 
@@ -200,22 +201,23 @@ def make_request_output(
         request_id = self.request_id
         if pooling_output is not None:
             return self._new_request_output(
-                request_id, [self._new_pooling_output(pooling_output)],
-                finished)
+                request_id, [self._new_pooling_output(pooling_output)], finished
+            )
 
-        output = self._new_completion_output(new_token_ids, finish_reason,
-                                             stop_reason)
+        output = self._new_completion_output(new_token_ids, finish_reason, stop_reason)
 
         if self.parent_req is None:
             outputs = [output]
         else:
             request_id, outputs, finished = self.parent_req.get_outputs(
-                request_id, output)
+                request_id, output
+            )
             if not outputs:
                 return None
 
-        return self._new_request_output(request_id, outputs, finished,
-                                        kv_transfer_params)
+        return self._new_request_output(
+            request_id, outputs, finished, kv_transfer_params
+        )
 
     def _new_request_output(
         self,
@@ -224,7 +226,6 @@ def _new_request_output(
         finished: bool,
         kv_transfer_params: Optional[dict[str, Any]] = None,
     ) -> Union[RequestOutput, PoolingRequestOutput]:
-
         first_output = outputs[0]
         if isinstance(first_output, PoolingOutput):
             assert len(outputs) == 1
@@ -248,15 +249,17 @@ def _new_request_output(
         if prompt_token_ids is None and self.prompt_embeds is not None:
             prompt_token_ids = [0] * len(self.prompt_embeds)
 
-        return RequestOutput(request_id=request_id,
-                             prompt=self.prompt,
-                             prompt_token_ids=prompt_token_ids,
-                             prompt_logprobs=prompt_logprobs,
-                             outputs=cast(list[CompletionOutput], outputs),
-                             finished=finished,
-                             kv_transfer_params=kv_transfer_params,
-                             num_cached_tokens=self.num_cached_tokens,
-                             metrics=self.stats)
+        return RequestOutput(
+            request_id=request_id,
+            prompt=self.prompt,
+            prompt_token_ids=prompt_token_ids,
+            prompt_logprobs=prompt_logprobs,
+            outputs=cast(list[CompletionOutput], outputs),
+            finished=finished,
+            kv_transfer_params=kv_transfer_params,
+            num_cached_tokens=self.num_cached_tokens,
+            metrics=self.stats,
+        )
 
     def _new_completion_output(
         self,
@@ -264,7 +267,6 @@ def _new_completion_output(
         finish_reason: Optional[FinishReason],
         stop_reason: Union[int, str, None],
     ) -> CompletionOutput:
-
         assert self.detokenizer is not None
         assert self.logprobs_processor is not None
         finished = finish_reason is not None
@@ -278,7 +280,7 @@ def _new_completion_output(
         # Prepare logprobs, based on delta mode
         logprobs = self.logprobs_processor.logprobs
         if delta and logprobs:
-            logprobs = logprobs[-len(token_ids):]
+            logprobs = logprobs[-len(token_ids) :]
 
         return CompletionOutput(
             index=self.request_index,
@@ -287,13 +289,13 @@ def _new_completion_output(
             logprobs=logprobs,
             cumulative_logprob=self.logprobs_processor.cumulative_logprob,
             finish_reason=str(finish_reason) if finished else None,
-            stop_reason=stop_reason if finished else None)
+            stop_reason=stop_reason if finished else None,
+        )
 
     def _new_pooling_output(
         self,
         pooling_output: torch.Tensor,
     ) -> PoolingOutput:
-
         return PoolingOutput(data=pooling_output)
 
 
@@ -333,15 +335,18 @@ def abort_requests(
                 request_ids_to_abort.append(request_id)
                 # Produce final abort output.
                 if req_state.queue is not None and (
-                        request_output := req_state.make_request_output(
-                            new_token_ids=[],
-                            # Set pooling_output is not None to
-                            # correctly enter the abort pooling branch
-                            pooling_output=torch.randn(0, device="cpu")
-                            if req_state.detokenizer is None else None,
-                            finish_reason=FinishReason.ABORT,
-                            stop_reason=None,
-                            kv_transfer_params=None)):
+                    request_output := req_state.make_request_output(
+                        new_token_ids=[],
+                        # Set pooling_output is not None to
+                        # correctly enter the abort pooling branch
+                        pooling_output=torch.randn(0, device="cpu")
+                        if req_state.detokenizer is None
+                        else None,
+                        finish_reason=FinishReason.ABORT,
+                        stop_reason=None,
+                        kv_transfer_params=None,
+                    )
+                ):
                     req_state.queue.put(request_output)
             elif parent := self.parent_requests.get(request_id):
                 # Abort children prior to removing the parent.
@@ -364,13 +369,15 @@ def add_request(
         if request_id in self.request_states:
             raise ValueError(f"Request id {request_id} already running.")
 
-        req_state = RequestState.from_new_request(tokenizer=self.tokenizer,
-                                                  request=request,
-                                                  prompt=prompt,
-                                                  parent_req=parent_req,
-                                                  request_index=request_index,
-                                                  queue=queue,
-                                                  log_stats=self.log_stats)
+        req_state = RequestState.from_new_request(
+            tokenizer=self.tokenizer,
+            request=request,
+            prompt=prompt,
+            parent_req=parent_req,
+            request_index=request_index,
+            queue=queue,
+            log_stats=self.log_stats,
+        )
         self.request_states[request_id] = req_state
         self.lora_states.add_request(req_state)
         if parent_req:
@@ -404,8 +411,7 @@ def process_outputs(
         within the loop below.
         """
 
-        request_outputs: Union[list[RequestOutput],
-                               list[PoolingRequestOutput]] = []
+        request_outputs: Union[list[RequestOutput], list[PoolingRequestOutput]] = []
         reqs_to_abort: list[str] = []
         for engine_core_output in engine_core_outputs:
             req_id = engine_core_output.request_id
@@ -415,9 +421,9 @@ def process_outputs(
                 continue
 
             # 1) Compute stats for this iteration.
-            self._update_stats_from_output(req_state, engine_core_output,
-                                           engine_core_timestamp,
-                                           iteration_stats)
+            self._update_stats_from_output(
+                req_state, engine_core_output, engine_core_timestamp, iteration_stats
+            )
 
             new_token_ids = engine_core_output.new_token_ids
             pooling_output = engine_core_output.pooling_output
@@ -432,20 +438,24 @@ def process_outputs(
                 assert req_state.logprobs_processor is not None
                 # 2) Detokenize the token ids into text and perform stop checks.
                 stop_string = req_state.detokenizer.update(
-                    new_token_ids, finish_reason == FinishReason.STOP)
+                    new_token_ids, finish_reason == FinishReason.STOP
+                )
                 if stop_string:
                     finish_reason = FinishReason.STOP
                     stop_reason = stop_string
 
                 # 3) Compute sample and prompt logprobs for request,
                 # if required.
-                req_state.logprobs_processor.update_from_output(
-                    engine_core_output)
+                req_state.logprobs_processor.update_from_output(engine_core_output)
 
             # 4) Create and handle RequestOutput objects.
             if request_output := req_state.make_request_output(
-                    new_token_ids, pooling_output, finish_reason, stop_reason,
-                    kv_transfer_params):
+                new_token_ids,
+                pooling_output,
+                finish_reason,
+                stop_reason,
+                kv_transfer_params,
+            ):
                 if req_state.queue is not None:
                     # AsyncLLM: put into queue for handling by generate().
                     req_state.queue.put(request_output)
@@ -466,11 +476,11 @@ def process_outputs(
                     reqs_to_abort.append(req_id)
 
                 # Track per-request stats
-                self._update_stats_from_finished(req_state, finish_reason,
-                                                 iteration_stats)
+                self._update_stats_from_finished(
+                    req_state, finish_reason, iteration_stats
+                )
                 if self.tracer:
-                    self.do_tracing(engine_core_output, req_state,
-                                    iteration_stats)
+                    self.do_tracing(engine_core_output, req_state, iteration_stats)
         self.lora_states.update_iteration_stats(iteration_stats)
 
         return OutputProcessorOutput(
@@ -478,9 +488,12 @@ def process_outputs(
             reqs_to_abort=reqs_to_abort,
         )
 
-    def do_tracing(self, engine_core_output: EngineCoreOutput,
-                   req_state: RequestState,
-                   iteration_stats: Optional[IterationStats]) -> None:
+    def do_tracing(
+        self,
+        engine_core_output: EngineCoreOutput,
+        req_state: RequestState,
+        iteration_stats: Optional[IterationStats],
+    ) -> None:
         assert req_state.stats is not None
         assert iteration_stats is not None
         assert self.tracer is not None
@@ -488,59 +501,63 @@ def do_tracing(self, engine_core_output: EngineCoreOutput,
         arrival_time_nano_seconds = int(req_state.stats.arrival_time * 1e9)
         trace_context = extract_trace_context(engine_core_output.trace_headers)
         prompt_length = length_from_prompt_token_ids_or_embeds(
-            req_state.prompt_token_ids, req_state.prompt_embeds)
-        with (self.tracer.start_as_current_span(
-                "llm_request",
-                kind=SpanKind.SERVER,
-                context=trace_context,
-                start_time=arrival_time_nano_seconds) as span):
+            req_state.prompt_token_ids, req_state.prompt_embeds
+        )
+        with self.tracer.start_as_current_span(
+            "llm_request",
+            kind=SpanKind.SERVER,
+            context=trace_context,
+            start_time=arrival_time_nano_seconds,
+        ) as span:
             metrics = req_state.stats
-            e2e_time = iteration_stats.iteration_timestamp - \
-                       metrics.arrival_time
+            e2e_time = iteration_stats.iteration_timestamp - metrics.arrival_time
             queued_time = metrics.scheduled_ts - metrics.queued_ts
             prefill_time = metrics.first_token_ts - metrics.scheduled_ts
             decode_time = metrics.last_token_ts - metrics.first_token_ts
             inference_time = metrics.last_token_ts - metrics.scheduled_ts
             span.set_attribute(
                 SpanAttributes.GEN_AI_LATENCY_TIME_TO_FIRST_TOKEN,
-                metrics.first_token_latency)
+                metrics.first_token_latency,
+            )
             span.set_attribute(SpanAttributes.GEN_AI_LATENCY_E2E, e2e_time)
-            span.set_attribute(SpanAttributes.GEN_AI_LATENCY_TIME_IN_QUEUE,
-                               queued_time)
-            span.set_attribute(SpanAttributes.GEN_AI_USAGE_PROMPT_TOKENS,
-                               prompt_length)
-            span.set_attribute(SpanAttributes.GEN_AI_USAGE_COMPLETION_TOKENS,
-                               metrics.num_generation_tokens)
+            span.set_attribute(SpanAttributes.GEN_AI_LATENCY_TIME_IN_QUEUE, queued_time)
+            span.set_attribute(SpanAttributes.GEN_AI_USAGE_PROMPT_TOKENS, prompt_length)
             span.set_attribute(
-                SpanAttributes.GEN_AI_LATENCY_TIME_IN_MODEL_PREFILL,
-                prefill_time)
+                SpanAttributes.GEN_AI_USAGE_COMPLETION_TOKENS,
+                metrics.num_generation_tokens,
+            )
             span.set_attribute(
-                SpanAttributes.GEN_AI_LATENCY_TIME_IN_MODEL_DECODE,
-                decode_time)
+                SpanAttributes.GEN_AI_LATENCY_TIME_IN_MODEL_PREFILL, prefill_time
+            )
             span.set_attribute(
-                SpanAttributes.GEN_AI_LATENCY_TIME_IN_MODEL_INFERENCE,
-                inference_time)
+                SpanAttributes.GEN_AI_LATENCY_TIME_IN_MODEL_DECODE, decode_time
+            )
+            span.set_attribute(
+                SpanAttributes.GEN_AI_LATENCY_TIME_IN_MODEL_INFERENCE, inference_time
+            )
 
             # meta
-            span.set_attribute(SpanAttributes.GEN_AI_REQUEST_ID,
-                               req_state.request_id)
+            span.set_attribute(SpanAttributes.GEN_AI_REQUEST_ID, req_state.request_id)
             if req_state.top_p:
-                span.set_attribute(SpanAttributes.GEN_AI_REQUEST_TOP_P,
-                                   req_state.top_p)
+                span.set_attribute(SpanAttributes.GEN_AI_REQUEST_TOP_P, req_state.top_p)
             if req_state.max_tokens_param:
-                span.set_attribute(SpanAttributes.GEN_AI_REQUEST_MAX_TOKENS,
-                                   req_state.max_tokens_param)
+                span.set_attribute(
+                    SpanAttributes.GEN_AI_REQUEST_MAX_TOKENS, req_state.max_tokens_param
+                )
             if req_state.temperature:
-                span.set_attribute(SpanAttributes.GEN_AI_REQUEST_TEMPERATURE,
-                                   req_state.temperature)
+                span.set_attribute(
+                    SpanAttributes.GEN_AI_REQUEST_TEMPERATURE, req_state.temperature
+                )
             if req_state.n:
-                span.set_attribute(SpanAttributes.GEN_AI_REQUEST_N,
-                                   req_state.n)
+                span.set_attribute(SpanAttributes.GEN_AI_REQUEST_N, req_state.n)
 
-    def _update_stats_from_output(self, req_state: RequestState,
-                                  engine_core_output: EngineCoreOutput,
-                                  engine_core_timestamp: Optional[float],
-                                  iteration_stats: Optional[IterationStats]):
+    def _update_stats_from_output(
+        self,
+        req_state: RequestState,
+        engine_core_output: EngineCoreOutput,
+        engine_core_timestamp: Optional[float],
+        iteration_stats: Optional[IterationStats],
+    ):
         if iteration_stats is None:
             return
 
@@ -548,15 +565,21 @@ def _update_stats_from_output(self, req_state: RequestState,
 
         assert engine_core_timestamp is not None
         assert req_state.stats is not None
-        iteration_stats.update_from_output(engine_core_output,
-                                           engine_core_timestamp,
-                                           req_state.is_prefilling,
-                                           req_state.prompt_len,
-                                           req_state.stats, lora_stats)
-
-    def _update_stats_from_finished(self, req_state: RequestState,
-                                    finish_reason: Optional[FinishReason],
-                                    iteration_stats: Optional[IterationStats]):
+        iteration_stats.update_from_output(
+            engine_core_output,
+            engine_core_timestamp,
+            req_state.is_prefilling,
+            req_state.prompt_len,
+            req_state.stats,
+            lora_stats,
+        )
+
+    def _update_stats_from_finished(
+        self,
+        req_state: RequestState,
+        finish_reason: Optional[FinishReason],
+        iteration_stats: Optional[IterationStats],
+    ):
         if iteration_stats is None:
             return
 
@@ -565,11 +588,13 @@ def _update_stats_from_finished(self, req_state: RequestState,
         iteration_stats.update_from_finished_request(
             finish_reason=finish_reason,
             num_prompt_tokens=length_from_prompt_token_ids_or_embeds(
-                req_state.prompt_token_ids, req_state.prompt_embeds),
+                req_state.prompt_token_ids, req_state.prompt_embeds
+            ),
             max_tokens_param=req_state.max_tokens_param,
-            req_stats=req_state.stats)
+            req_stats=req_state.stats,
+        )
         self.lora_states.finish_request(req_state)
 
         ParentRequest.observe_finished_request(
-            req_state.parent_req, iteration_stats,
-            req_state.stats.num_generation_tokens)
+            req_state.parent_req, iteration_stats, req_state.stats.num_generation_tokens
+        )
diff --git a/vllm/v1/engine/parallel_sampling.py b/vllm/v1/engine/parallel_sampling.py
index 1e9911152c6d..daf115c0325f 100644
--- a/vllm/v1/engine/parallel_sampling.py
+++ b/vllm/v1/engine/parallel_sampling.py
@@ -31,15 +31,16 @@ class ParentRequest:
     # To efficiently obtain child sampling params
     cached_child_sampling_params: Optional[SamplingParams]
 
-    def __init__(self, request_id: str,
-                 sampling_params: SamplingParams) -> None:
+    def __init__(self, request_id: str, sampling_params: SamplingParams) -> None:
         self.request_id = request_id
         self.sampling_params = sampling_params
 
         self.child_requests = set()
-        self.output_aggregator = [None] * sampling_params.n if (
-            sampling_params.output_kind
-            == RequestOutputKind.FINAL_ONLY) else []
+        self.output_aggregator = (
+            [None] * sampling_params.n
+            if (sampling_params.output_kind == RequestOutputKind.FINAL_ONLY)
+            else []
+        )
         self.max_num_generation_tokens = 0
         self.cached_child_sampling_params = None
 
@@ -49,7 +50,7 @@ def _get_child_sampling_params(
     ) -> SamplingParams:
         """Efficiently obtain child `sampling_params`
 
-        If `sampling_params.seed` is not `None` then 
+        If `sampling_params.seed` is not `None` then
         each child request requires a unique clone of
         parent `sampling_params` with a unique seed.
 
@@ -76,10 +77,10 @@ def _get_child_sampling_params(
 
     def get_child_info(self, index: int) -> tuple[str, SamplingParams]:
         """Get child request ID and sampling params.
-        
+
         Args:
           index: index within `n` child requests.
-        
+
         Returns:
           (request ID, sampling_params) tuple
         """
@@ -111,23 +112,25 @@ def get_outputs(
         return self.request_id, outputs, finished
 
     def observe_num_generation_tokens(self, num_generation_tokens: int):
-        self.max_num_generation_tokens = max(num_generation_tokens,
-                                             self.max_num_generation_tokens)
+        self.max_num_generation_tokens = max(
+            num_generation_tokens, self.max_num_generation_tokens
+        )
         return self.max_num_generation_tokens
 
     @staticmethod
-    def observe_finished_request(parent_req: Optional['ParentRequest'],
-                                 iteration_stats: IterationStats,
-                                 num_generation_tokens: int):
-
+    def observe_finished_request(
+        parent_req: Optional["ParentRequest"],
+        iteration_stats: IterationStats,
+        num_generation_tokens: int,
+    ):
         n_param = parent_req.n if parent_req is not None else 1
 
         if parent_req is not None:
             num_generation_tokens = parent_req.observe_num_generation_tokens(
-                num_generation_tokens)
+                num_generation_tokens
+            )
 
         # Child requests finished, we can now record to iteration stats
         if parent_req is None or not parent_req.child_requests:
-            iteration_stats.max_num_generation_tokens_iter.append(
-                num_generation_tokens)
+            iteration_stats.max_num_generation_tokens_iter.append(num_generation_tokens)
             iteration_stats.n_params_iter.append(n_param)
diff --git a/vllm/v1/engine/processor.py b/vllm/v1/engine/processor.py
index c30ceb96a5e0..8a6ac0927e6d 100644
--- a/vllm/v1/engine/processor.py
+++ b/vllm/v1/engine/processor.py
@@ -21,27 +21,25 @@
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 from vllm.utils import length_from_prompt_token_ids_or_embeds
 from vllm.v1.engine import EngineCoreRequest
-from vllm.v1.structured_output.backend_guidance import (
-    validate_guidance_grammar)
+from vllm.v1.structured_output.backend_guidance import validate_guidance_grammar
 from vllm.v1.structured_output.backend_lm_format_enforcer import (
-    validate_structured_output_request_lm_format_enforcer)
+    validate_structured_output_request_lm_format_enforcer,
+)
 from vllm.v1.structured_output.backend_outlines import (
-    validate_structured_output_request_outlines)
-from vllm.v1.structured_output.backend_xgrammar import (
-    validate_xgrammar_grammar)
+    validate_structured_output_request_outlines,
+)
+from vllm.v1.structured_output.backend_xgrammar import validate_xgrammar_grammar
 
 logger = init_logger(__name__)
 
 
 class Processor:
-
     def __init__(
         self,
         vllm_config: VllmConfig,
         tokenizer: AnyTokenizer,
         mm_registry: MultiModalRegistry = MULTIMODAL_REGISTRY,
     ):
-
         self.vllm_config = vllm_config
         self.model_config = vllm_config.model_config
         self.cache_config = vllm_config.cache_config
@@ -49,12 +47,10 @@ def __init__(
         self.structured_outputs_config = vllm_config.structured_outputs_config
         self.tokenizer = tokenizer
 
-        self.generation_config_fields = (
-            self.model_config.try_get_generation_config())
+        self.generation_config_fields = self.model_config.try_get_generation_config()
 
         self.mm_registry = mm_registry
-        self.mm_processor_cache = processor_cache_from_config(
-            vllm_config, mm_registry)
+        self.mm_processor_cache = processor_cache_from_config(vllm_config, mm_registry)
 
         self.input_preprocessor = InputPreprocessor(
             self.model_config,
@@ -79,7 +75,8 @@ def _validate_logprobs(
             if num_logprobs > max_logprobs:
                 raise ValueError(
                     f"Requested sample logprobs of {num_logprobs}, "
-                    f"which is greater than max allowed: {max_logprobs}")
+                    f"which is greater than max allowed: {max_logprobs}"
+                )
 
         # Validate prompt logprobs.
         if params.prompt_logprobs:
@@ -89,7 +86,8 @@ def _validate_logprobs(
             if num_prompt_logprobs > max_logprobs:
                 raise ValueError(
                     f"Requested prompt logprobs of {num_prompt_logprobs}, "
-                    f"which is greater than max allowed: {max_logprobs}")
+                    f"which is greater than max allowed: {max_logprobs}"
+                )
 
     def _validate_sampling_params(
         self,
@@ -108,8 +106,7 @@ def _validate_sampling_params(
             return
         vocab_size = len(self.tokenizer)
         if not all(0 <= tid < vocab_size for tid in params.allowed_token_ids):
-            raise ValueError(
-                "allowed_token_ids contains out-of-vocab token id!")
+            raise ValueError("allowed_token_ids contains out-of-vocab token id!")
 
     def _validate_logit_bias(
         self,
@@ -129,7 +126,8 @@ def _validate_logit_bias(
         if invalid_token_ids:
             raise ValueError(
                 f"token_id(s) {invalid_token_ids} in logit_bias contain "
-                f"out-of-vocab token ids. Vocabulary size: {vocab_size}")
+                f"out-of-vocab token ids. Vocabulary size: {vocab_size}"
+            )
 
     def _validate_supported_sampling_params(
         self,
@@ -140,8 +138,9 @@ def _validate_supported_sampling_params(
             raise ValueError("vLLM V1 does not yet support best_of.")
         # Logits processors not supported.
         if params.logits_processors:
-            raise ValueError("vLLM V1 does not support per request "
-                             "user provided logits processors.")
+            raise ValueError(
+                "vLLM V1 does not support per request user provided logits processors."
+            )
 
     def _validate_params(
         self,
@@ -178,18 +177,23 @@ def _validate_single_prompt(single_prompt: Union[dict, str]) -> None:
             for modality, items in mm_data.items():
                 if modality in mm_uuids:
                     data_len = len(items) if isinstance(items, list) else 1
-                    uuid_len = len(mm_uuids[modality]) if isinstance(
-                        mm_uuids[modality], list) else 1
+                    uuid_len = (
+                        len(mm_uuids[modality])
+                        if isinstance(mm_uuids[modality], list)
+                        else 1
+                    )
                     if uuid_len != data_len:
                         raise ValueError(
                             f"multi_modal_uuids for modality '{modality}' "
                             "must have same length as data: got "
                             f"{uuid_len} uuids vs "
-                            f"{data_len} items.")
+                            f"{data_len} items."
+                        )
                 else:
                     raise ValueError(
                         f"multi_modal_uuids for modality '{modality}' must "
-                        "be provided if multi_modal_data is provided.")
+                        "be provided if multi_modal_data is provided."
+                    )
 
         # Handle explicit encoder/decoder prompts or singleton prompt
         if isinstance(prompt, dict) and "encoder_prompt" in prompt:
@@ -208,8 +212,9 @@ def _validate_lora(self, lora_request: Optional[LoRARequest]) -> None:
 
         # LoRA request passed in while LoRA is not enabled
         if not self.lora_config:
-            raise ValueError(f"Got lora_request {lora_request} but LoRA is "
-                             "not enabled!")
+            raise ValueError(
+                f"Got lora_request {lora_request} but LoRA is not enabled!"
+            )
 
         if self.tokenizer is not None:
             logger.warning_once(
@@ -217,7 +222,8 @@ def _validate_lora(self, lora_request: Optional[LoRARequest]) -> None:
                 "tokenizers for different LoRAs. By default, vLLM uses base "
                 "model's tokenizer. If you are using a LoRA "
                 "with its own tokenizer, consider specifying `--tokenizer "
-                "[lora_path]` to use the LoRA tokenizer.")
+                "[lora_path]` to use the LoRA tokenizer."
+            )
 
     def _validate_structured_output(self, params: SamplingParams) -> None:
         if not params.structured_outputs or not self.structured_outputs_config:
@@ -235,20 +241,23 @@ def _validate_structured_output(self, params: SamplingParams) -> None:
             # to a specific backend based on `auto` behavior in a previous
             # request. We remember that it was set as a result of `auto`
             # using the `_backend_was_auto` field set in the params.
-            if (backend != _backend
-                    and not (backend == "auto"
-                             and params.structured_outputs._backend_was_auto)):
+            if backend != _backend and not (
+                backend == "auto" and params.structured_outputs._backend_was_auto
+            ):
                 raise ValueError(
                     "Request-level structured output backend selection is not "
                     f"supported. The request specified '{_backend}', but vLLM "
                     f"was initialised with '{backend}'. This error can be "
-                    "resolved by removing '_backend' from the request.")
+                    "resolved by removing '_backend' from the request."
+                )
         else:
             params.structured_outputs._backend = backend
 
         # Request content validation
-        if (isinstance(params.structured_outputs.choice, list)
-                and not params.structured_outputs.choice):
+        if (
+            isinstance(params.structured_outputs.choice, list)
+            and not params.structured_outputs.choice
+        ):
             # It is invalid for choice to be an empty list
             raise ValueError(
                 f"Choice '{params.structured_outputs.choice}' cannot be an empty list"  # noqa: E501
@@ -318,9 +327,7 @@ def _extract_mm_data(p: PromptType):
         mm_uuids: MultiModalUUIDDict = {}
         for modality, data in mm_data.items():
             n = len(data) if isinstance(data, list) else 1
-            mm_uuids[modality] = [
-                f"{request_id}-{modality}-{i}" for i in range(n)
-            ]
+            mm_uuids[modality] = [f"{request_id}-{modality}-{i}" for i in range(n)]
         return mm_uuids
 
     def process_inputs(
@@ -339,10 +346,13 @@ def process_inputs(
         self._validate_params(params)
 
         data_parallel_size = self.vllm_config.parallel_config.data_parallel_size
-        if data_parallel_rank is not None and not (0 <= data_parallel_rank <
-                                                   data_parallel_size):
-            raise ValueError(f"data_parallel_rank {data_parallel_rank} "
-                             f"is out of range [0, {data_parallel_size}).")
+        if data_parallel_rank is not None and not (
+            0 <= data_parallel_rank < data_parallel_size
+        ):
+            raise ValueError(
+                f"data_parallel_rank {data_parallel_rank} "
+                f"is out of range [0, {data_parallel_size})."
+            )
 
         if arrival_time is None:
             arrival_time = time.time()
@@ -355,9 +365,11 @@ def process_inputs(
         # reused across requests, therefore identifying multimodal data items
         # by their content is no longer necessary, and we create uuids with
         # request id-modality-index as multimodal hash overrides.
-        if (self.model_config.multimodal_config and
-                self.model_config.multimodal_config.mm_processor_cache_gb == 0
-                and not self.cache_config.enable_prefix_caching):
+        if (
+            self.model_config.multimodal_config
+            and self.model_config.multimodal_config.mm_processor_cache_gb == 0
+            and not self.cache_config.enable_prefix_caching
+        ):
             mm_uuids = self._maybe_build_mm_uuids(request_id, prompt)
         else:
             # Otherwise, use user-provided uuids as multimodal hash overrides
@@ -378,6 +390,7 @@ def process_inputs(
             mm_uuids=mm_uuids,
         )
         from vllm.platforms import current_platform
+
         current_platform.validate_request(
             prompt=prompt,
             params=params,
@@ -393,10 +406,16 @@ def process_inputs(
         # discriminated unions of TypedDicts, because of how it handles
         # inheritance of TypedDict. If we explicitly extract the items we want
         # we can avoid type errors from using `dict.get` later in the method.
-        prompt_token_ids = decoder_inputs[
-            "prompt_token_ids"] if decoder_inputs["type"] != "embeds" else None
-        prompt_embeds = decoder_inputs["prompt_embeds"] if decoder_inputs[
-            "type"] == "embeds" else None
+        prompt_token_ids = (
+            decoder_inputs["prompt_token_ids"]
+            if decoder_inputs["type"] != "embeds"
+            else None
+        )
+        prompt_embeds = (
+            decoder_inputs["prompt_embeds"]
+            if decoder_inputs["type"] == "embeds"
+            else None
+        )
 
         sampling_params = None
         pooling_params = None
@@ -406,11 +425,12 @@ def process_inputs(
             # If unset max tokens, then generate up to the max_model_len.
             if sampling_params.max_tokens is None:
                 seq_len = length_from_prompt_token_ids_or_embeds(
-                    prompt_token_ids, prompt_embeds)
-                sampling_params.max_tokens = \
-                    self.model_config.max_model_len - seq_len
+                    prompt_token_ids, prompt_embeds
+                )
+                sampling_params.max_tokens = self.model_config.max_model_len - seq_len
             sampling_params.update_from_generation_config(
-                self.generation_config_fields, eos_token_id)
+                self.generation_config_fields, eos_token_id
+            )
             if self.tokenizer is not None:
                 sampling_params.update_from_tokenizer(self.tokenizer)
         else:
@@ -436,7 +456,9 @@ def process_inputs(
                         data=decoder_mm_inputs[modality][idx],
                         modality=modality,
                         identifier=decoder_mm_hashes[modality][idx],
-                        mm_position=decoder_mm_positions[modality][idx]))
+                        mm_position=decoder_mm_positions[modality][idx],
+                    )
+                )
 
         return EngineCoreRequest(
             request_id=request_id,
@@ -454,8 +476,9 @@ def process_inputs(
             trace_headers=trace_headers,
         )
 
-    def _validate_model_inputs(self, encoder_inputs: Optional[SingletonInputs],
-                               decoder_inputs: SingletonInputs):
+    def _validate_model_inputs(
+        self, encoder_inputs: Optional[SingletonInputs], decoder_inputs: SingletonInputs
+    ):
         if encoder_inputs is not None:
             self._validate_model_input(encoder_inputs, prompt_type="encoder")
 
@@ -469,12 +492,17 @@ def _validate_model_input(
     ):
         model_config = self.model_config
 
-        prompt_ids = None if prompt_inputs[
-            "type"] == "embeds" else prompt_inputs["prompt_token_ids"]
-        prompt_embeds = prompt_inputs["prompt_embeds"] if prompt_inputs[
-            "type"] == "embeds" else None
-        prompt_len = length_from_prompt_token_ids_or_embeds(
-            prompt_ids, prompt_embeds)
+        prompt_ids = (
+            None
+            if prompt_inputs["type"] == "embeds"
+            else prompt_inputs["prompt_token_ids"]
+        )
+        prompt_embeds = (
+            prompt_inputs["prompt_embeds"]
+            if prompt_inputs["type"] == "embeds"
+            else None
+        )
+        prompt_len = length_from_prompt_token_ids_or_embeds(prompt_ids, prompt_embeds)
         if not prompt_ids:
             if prompt_type == "encoder" and model_config.is_multimodal_model:
                 pass  # Mllama may have empty encoder inputs for text-only data
@@ -499,10 +527,10 @@ def _validate_model_input(
 
             # Here we take the max of the two to determine if a token id is
             # truly out-of-vocabulary.
-            if max_input_id > max(tokenizer.max_token_id,
-                                  self.model_config.get_vocab_size() - 1):
-                raise ValueError(
-                    f"Token id {max_input_id} is out of vocabulary")
+            if max_input_id > max(
+                tokenizer.max_token_id, self.model_config.get_vocab_size() - 1
+            ):
+                raise ValueError(f"Token id {max_input_id} is out of vocabulary")
 
         max_prompt_len = self.model_config.max_model_len
         if prompt_len > max_prompt_len:
@@ -522,16 +550,19 @@ def _validate_model_input(
                     "Make sure that `max_model_len` is no smaller than the "
                     "number of text tokens plus multimodal tokens. For image "
                     "inputs, the number of image tokens depends on the number "
-                    "of images, and possibly their aspect ratios as well.")
+                    "of images, and possibly their aspect ratios as well."
+                )
             else:
                 suggestion = (
                     "Make sure that `max_model_len` is no smaller than the "
-                    "number of text tokens.")
+                    "number of text tokens."
+                )
 
             raise ValueError(
                 f"The {prompt_type} prompt (length {prompt_len}) is "
                 f"longer than the maximum model length of {max_prompt_len}. "
-                f"{suggestion}")
+                f"{suggestion}"
+            )
 
             # TODO: Find out how many placeholder tokens are there so we can
             # check that chunked prefill does not truncate them
diff --git a/vllm/v1/engine/utils.py b/vllm/v1/engine/utils.py
index 18ef25ceb6f5..c78d71c32325 100644
--- a/vllm/v1/engine/utils.py
+++ b/vllm/v1/engine/utils.py
@@ -70,6 +70,7 @@ class EngineHandshakeMetadata:
     including addresses of the front-end ZMQ queues that they should
     connect to.
     """
+
     addresses: EngineZmqAddresses
     parallel_config: dict[str, Union[int, str, list[int]]]
 
@@ -103,8 +104,7 @@ def __init__(
         }
 
         if client_handshake_address:
-            common_kwargs[
-                "client_handshake_address"] = client_handshake_address
+            common_kwargs["client_handshake_address"] = client_handshake_address
 
         self.processes: list[BaseProcess] = []
         local_dp_ranks = []
@@ -115,21 +115,27 @@ def __init__(
             # Start EngineCore in background process.
             local_dp_ranks.append(local_index)
             self.processes.append(
-                context.Process(target=target_fn,
-                                name=f"EngineCore_DP{global_index}",
-                                kwargs=common_kwargs | {
-                                    "dp_rank": global_index,
-                                    "local_dp_rank": local_index,
-                                }))
+                context.Process(
+                    target=target_fn,
+                    name=f"EngineCore_DP{global_index}",
+                    kwargs=common_kwargs
+                    | {
+                        "dp_rank": global_index,
+                        "local_dp_rank": local_index,
+                    },
+                )
+            )
 
         self._finalizer = weakref.finalize(self, shutdown, self.processes)
 
         data_parallel = vllm_config.parallel_config.data_parallel_size > 1
         try:
             for proc, local_dp_rank in zip(self.processes, local_dp_ranks):
-                with set_device_control_env_var(
-                        vllm_config, local_dp_rank) if (
-                            data_parallel) else contextlib.nullcontext():
+                with (
+                    set_device_control_env_var(vllm_config, local_dp_rank)
+                    if (data_parallel)
+                    else contextlib.nullcontext()
+                ):
                     proc.start()
         finally:
             # Kill other procs if not all are running.
@@ -151,13 +157,15 @@ def finished_procs(self) -> dict[str, int]:
         """Returns dict of proc name -> exit code for any finished procs."""
         return {
             proc.name: proc.exitcode
-            for proc in self.processes if proc.exitcode is not None
+            for proc in self.processes
+            if proc.exitcode is not None
         }
 
 
 @contextlib.contextmanager
-def set_device_control_env_var(vllm_config: VllmConfig,
-                               local_dp_rank: int) -> Iterator[None]:
+def set_device_control_env_var(
+    vllm_config: VllmConfig, local_dp_rank: int
+) -> Iterator[None]:
     """
     Temporarily set CUDA_VISIBLE_DEVICES or equivalent
     for engine subprocess.
@@ -166,12 +174,13 @@ def set_device_control_env_var(vllm_config: VllmConfig,
     evar = current_platform.device_control_env_var
 
     value = get_device_indices(evar, local_dp_rank, world_size)
-    with patch.dict(os.environ, values=((evar, value), )):
+    with patch.dict(os.environ, values=((evar, value),)):
         yield
 
 
-def get_device_indices(device_control_env_var: str, local_dp_rank: int,
-                       world_size: int):
+def get_device_indices(
+    device_control_env_var: str, local_dp_rank: int, world_size: int
+):
     """
     Returns a comma-separated string of device indices for the specified
     data parallel rank.
@@ -182,14 +191,16 @@ def get_device_indices(device_control_env_var: str, local_dp_rank: int,
     try:
         value = ",".join(
             str(current_platform.device_id_to_physical_device_id(i))
-            for i in range(local_dp_rank * world_size, (local_dp_rank + 1) *
-                           world_size))
+            for i in range(local_dp_rank * world_size, (local_dp_rank + 1) * world_size)
+        )
     except IndexError as e:
-        raise Exception(f"Error setting {device_control_env_var}: "
-                        f"local range: [{local_dp_rank * world_size}, "
-                        f"{(local_dp_rank + 1) * world_size}) "
-                        "base value: "
-                        f"\"{os.getenv(device_control_env_var)}\"") from e
+        raise Exception(
+            f"Error setting {device_control_env_var}: "
+            f"local range: [{local_dp_rank * world_size}, "
+            f"{(local_dp_rank + 1) * world_size}) "
+            "base value: "
+            f'"{os.getenv(device_control_env_var)}"'
+        ) from e
     return value
 
 
@@ -215,8 +226,7 @@ def __init__(
 
         import ray
         from ray.runtime_env import RuntimeEnv
-        from ray.util.scheduling_strategies import (
-            PlacementGroupSchedulingStrategy)
+        from ray.util.scheduling_strategies import PlacementGroupSchedulingStrategy
 
         from vllm.v1.engine.core import DPEngineCoreActor
 
@@ -225,8 +235,7 @@ def __init__(
 
         env_vars_list = get_env_vars_to_copy(destination="DPEngineCoreActor")
         self.env_vars_dict = {
-            name: os.environ[name]
-            for name in env_vars_list if name in os.environ
+            name: os.environ[name] for name in env_vars_list if name in os.environ
         }
         runtime_env = RuntimeEnv(env_vars=self.env_vars_dict)
 
@@ -234,37 +243,38 @@ def __init__(
         self.executor_class = executor_class
         self.log_stats = log_stats
         dp_size = vllm_config.parallel_config.data_parallel_size
-        local_engine_count = \
-            vllm_config.parallel_config.data_parallel_size_local
+        local_engine_count = vllm_config.parallel_config.data_parallel_size_local
         world_size = vllm_config.parallel_config.world_size
 
         if ray.is_initialized():
-            logger.info(
-                "Ray is already initialized. Skipping Ray initialization.")
+            logger.info("Ray is already initialized. Skipping Ray initialization.")
         else:
             ray.init()
 
         if placement_groups is not None:
             assert local_dp_ranks is not None, (
-                "local_dp_ranks must be provided if "
-                "placement_groups is provided")
+                "local_dp_ranks must be provided if placement_groups is provided"
+            )
             assert len(placement_groups) == len(local_dp_ranks), (
-                "placement_groups and local_dp_ranks must "
-                "have the same length")
+                "placement_groups and local_dp_ranks must have the same length"
+            )
             logger.info("Using provided placement groups")
             # TODO(rui): validate passed-in placement groups
             self.created_placement_groups = []
         else:
-            placement_groups, local_dp_ranks = \
+            placement_groups, local_dp_ranks = (
                 CoreEngineActorManager.create_dp_placement_groups(vllm_config)
+            )
             self.created_placement_groups = placement_groups
         assert len(placement_groups) == dp_size, (
-            "Number of placement groups must match data parallel size")
+            "Number of placement groups must match data parallel size"
+        )
 
         self.placement_group_is_local = []
         refs = []
-        for index, local_index, pg in zip(range(dp_size), local_dp_ranks,
-                                          placement_groups):
+        for index, local_index, pg in zip(
+            range(dp_size), local_dp_ranks, placement_groups
+        ):
             dp_vllm_config = copy.deepcopy(vllm_config)
             dp_vllm_config.parallel_config.placement_group = pg
             local_client = index < local_engine_count
@@ -275,24 +285,32 @@ def __init__(
             # https://github.com/ray-project/ray/blob/master/python/ray/_private/accelerators/intel_gpu.py#L56 # noqa: E501
             if current_platform.is_xpu():
                 device_evar = current_platform.device_control_env_var
-                device_indices = get_device_indices(device_evar, local_index,
-                                                    world_size)
+                device_indices = get_device_indices(
+                    device_evar, local_index, world_size
+                )
                 actor_env_vars = self.env_vars_dict.copy()
                 actor_env_vars[device_evar] = device_indices
                 runtime_env = RuntimeEnv(env_vars=actor_env_vars)
 
-            actor = ray.remote(DPEngineCoreActor).options(
-                scheduling_strategy=PlacementGroupSchedulingStrategy(
-                    placement_group=pg,
-                    placement_group_bundle_index=world_size,
-                ),
-                runtime_env=runtime_env).remote(vllm_config=dp_vllm_config,
-                                                executor_class=executor_class,
-                                                log_stats=log_stats,
-                                                local_client=local_client,
-                                                addresses=addresses,
-                                                dp_rank=index,
-                                                local_dp_rank=local_index)
+            actor = (
+                ray.remote(DPEngineCoreActor)
+                .options(
+                    scheduling_strategy=PlacementGroupSchedulingStrategy(
+                        placement_group=pg,
+                        placement_group_bundle_index=world_size,
+                    ),
+                    runtime_env=runtime_env,
+                )
+                .remote(
+                    vllm_config=dp_vllm_config,
+                    executor_class=executor_class,
+                    log_stats=log_stats,
+                    local_client=local_client,
+                    addresses=addresses,
+                    dp_rank=index,
+                    local_dp_rank=local_index,
+                )
+            )
             if local_client:
                 self.local_engine_actors.append(actor)
             else:
@@ -307,7 +325,7 @@ def __init__(
 
     @staticmethod
     def create_dp_placement_groups(
-            vllm_config: VllmConfig
+        vllm_config: VllmConfig,
     ) -> tuple[list["PlacementGroup"], list[int]]:
         """
         Create placement groups for data parallel.
@@ -317,23 +335,23 @@ def create_dp_placement_groups(
         from ray._private.state import available_resources_per_node
 
         logger.info("Creating placement groups for data parallel")
-        dp_master_ip = \
-            vllm_config.parallel_config.data_parallel_master_ip
+        dp_master_ip = vllm_config.parallel_config.data_parallel_master_ip
         num_pg_to_create = vllm_config.parallel_config.data_parallel_size
-        local_engine_count = \
-            vllm_config.parallel_config.data_parallel_size_local
+        local_engine_count = vllm_config.parallel_config.data_parallel_size_local
 
         available_resources = available_resources_per_node()
         world_size = vllm_config.parallel_config.world_size
         placement_groups: list[PlacementGroup] = []
         local_dp_ranks: list[int] = []
-        dp_master_ip_key = f'node:{dp_master_ip}'
-        nodes = sorted(available_resources.values(),
-                       key=lambda x: dp_master_ip_key not in x)
-        assert len(nodes) > 0, (
-            "No nodes with resources found in Ray cluster.")
+        dp_master_ip_key = f"node:{dp_master_ip}"
+        nodes = sorted(
+            available_resources.values(), key=lambda x: dp_master_ip_key not in x
+        )
+        assert len(nodes) > 0, "No nodes with resources found in Ray cluster."
         assert dp_master_ip_key in nodes[0], (
-            "The DP master node (ip: %s) is missing or dead", dp_master_ip)
+            "The DP master node (ip: %s) is missing or dead",
+            dp_master_ip,
+        )
         device_str = current_platform.ray_device_key
         for node_resources in nodes:
             if device_str not in node_resources:
@@ -341,19 +359,16 @@ def create_dp_placement_groups(
             # For now, each DP rank can only be assigned to one node
             # TODO(rui): support allocating a single DP rank
             # to multiple nodes
-            available_engine_count = int(
-                node_resources[device_str]) // world_size
+            available_engine_count = int(node_resources[device_str]) // world_size
             if dp_master_ip_key in node_resources:
                 assert available_engine_count >= local_engine_count, (
                     "Not enough resources to allocate DP ranks "
-                    f"on DP master node {dp_master_ip}")
+                    f"on DP master node {dp_master_ip}"
+                )
                 for i in range(local_engine_count):
-                    bundles = [{
-                        device_str: 1.0,
-                        "node:" + dp_master_ip: 0.001
-                    }] * world_size + [{
-                        "CPU": 1.0
-                    }]
+                    bundles = [
+                        {device_str: 1.0, "node:" + dp_master_ip: 0.001}
+                    ] * world_size + [{"CPU": 1.0}]
                     pg = ray.util.placement_group(
                         name=f"dp_rank_{len(placement_groups)}",
                         strategy="STRICT_PACK",
@@ -379,7 +394,8 @@ def create_dp_placement_groups(
                 "placement groups, only created "
                 f"{len(placement_groups)} placement groups. "
                 "Available resources: "
-                f"{available_resources}")
+                f"{available_resources}"
+            )
         return placement_groups, local_dp_ranks
 
     @staticmethod
@@ -390,8 +406,10 @@ def add_dp_placement_groups(
         Add placement groups for new data parallel size.
         """
         import ray
-        from ray._private.state import (available_resources_per_node,
-                                        total_resources_per_node)
+        from ray._private.state import (
+            available_resources_per_node,
+            total_resources_per_node,
+        )
         from ray.util.state import list_nodes
 
         old_dp_size = old_vllm_config.parallel_config.data_parallel_size
@@ -405,10 +423,10 @@ def add_dp_placement_groups(
 
         nodes = list_nodes()
         nodes = sorted(nodes, key=lambda node: node.node_ip != dp_master_ip)
-        assert nodes[0].node_ip == dp_master_ip, (
-            "The first node must be the head node")
+        assert nodes[0].node_ip == dp_master_ip, "The first node must be the head node"
         assert len(nodes) == 1 or nodes[1].node_ip != dp_master_ip, (
-            "There can only be one head node")
+            "There can only be one head node"
+        )
 
         available_resources = available_resources_per_node()
         total_resources = total_resources_per_node()
@@ -446,12 +464,9 @@ def add_dp_placement_groups(
 
                 # Create bundles with node constraint for master node
                 if node_ip == dp_master_ip:
-                    bundles = [{
-                        device_str: 1.0,
-                        "node:" + dp_master_ip: 0.001
-                    }] * world_size + [{
-                        "CPU": 1.0
-                    }]
+                    bundles = [
+                        {device_str: 1.0, "node:" + dp_master_ip: 0.001}
+                    ] * world_size + [{"CPU": 1.0}]
                 else:
                     bundles = [{device_str: 1.0}] * world_size + [{"CPU": 1.0}]
 
@@ -470,69 +485,76 @@ def add_dp_placement_groups(
 
         return placement_groups, local_dp_ranks
 
-    def scale_up_elastic_ep(self, cur_vllm_config: VllmConfig,
-                            new_data_parallel_size: int) -> None:
+    def scale_up_elastic_ep(
+        self, cur_vllm_config: VllmConfig, new_data_parallel_size: int
+    ) -> None:
         import copy
 
         import ray
         from ray.runtime_env import RuntimeEnv
-        from ray.util.scheduling_strategies import (
-            PlacementGroupSchedulingStrategy)
+        from ray.util.scheduling_strategies import PlacementGroupSchedulingStrategy
 
         from vllm.v1.engine.core import DPEngineCoreActor
 
-        cur_data_parallel_size = len(self.local_engine_actors) + \
-            len(self.remote_engine_actors)
+        cur_data_parallel_size = len(self.local_engine_actors) + len(
+            self.remote_engine_actors
+        )
 
         assert new_data_parallel_size > cur_data_parallel_size, (
             f"New data parallel size {new_data_parallel_size} must be greater "
             f"than current data parallel size {cur_data_parallel_size} "
-            "for scale up")
+            "for scale up"
+        )
 
-        placement_groups, local_dp_ranks = \
-            self.add_dp_placement_groups(
-                cur_vllm_config, new_data_parallel_size)
+        placement_groups, local_dp_ranks = self.add_dp_placement_groups(
+            cur_vllm_config, new_data_parallel_size
+        )
 
         world_size = cur_vllm_config.parallel_config.world_size
         dp_master_ip = cur_vllm_config.parallel_config.data_parallel_master_ip
         new_local_engines = 0
 
-        runtime_env = RuntimeEnv(env_vars=self.env_vars_dict
-                                 | {"VLLM_ELASTIC_EP_SCALE_UP_LAUNCH": "1"})
-        for i, (pg,
-                local_rank) in enumerate(zip(placement_groups,
-                                             local_dp_ranks)):
+        runtime_env = RuntimeEnv(
+            env_vars=self.env_vars_dict | {"VLLM_ELASTIC_EP_SCALE_UP_LAUNCH": "1"}
+        )
+        for i, (pg, local_rank) in enumerate(zip(placement_groups, local_dp_ranks)):
             rank = cur_data_parallel_size + i
             dp_vllm_config = copy.deepcopy(cur_vllm_config)
-            dp_vllm_config.parallel_config.data_parallel_size = \
-                new_data_parallel_size
+            dp_vllm_config.parallel_config.data_parallel_size = new_data_parallel_size
             dp_vllm_config.parallel_config.placement_group = pg
 
             # Check if this placement group is on the head node
             local_client = any(
-                bundle.get("node:" + dp_master_ip, 0) > 0
-                for bundle in pg.bundle_specs)
+                bundle.get("node:" + dp_master_ip, 0) > 0 for bundle in pg.bundle_specs
+            )
 
             if local_client:
                 new_local_engines += 1
                 # Update data_parallel_size_local
                 dp_vllm_config.parallel_config.data_parallel_size_local = (
-                    cur_vllm_config.parallel_config.data_parallel_size_local +
-                    new_local_engines)
-
-            actor = ray.remote(DPEngineCoreActor).options(
-                scheduling_strategy=PlacementGroupSchedulingStrategy(
-                    placement_group=pg,
-                    placement_group_bundle_index=world_size,
-                ),
-                runtime_env=runtime_env).remote(
+                    cur_vllm_config.parallel_config.data_parallel_size_local
+                    + new_local_engines
+                )
+
+            actor = (
+                ray.remote(DPEngineCoreActor)
+                .options(
+                    scheduling_strategy=PlacementGroupSchedulingStrategy(
+                        placement_group=pg,
+                        placement_group_bundle_index=world_size,
+                    ),
+                    runtime_env=runtime_env,
+                )
+                .remote(
                     vllm_config=dp_vllm_config,
                     executor_class=self.executor_class,
                     log_stats=self.log_stats,
                     local_client=local_client,
                     addresses=self.addresses,
                     dp_rank=rank,
-                    local_dp_rank=local_rank)
+                    local_dp_rank=local_rank,
+                )
+            )
 
             if local_client:
                 self.local_engine_actors.append(actor)
@@ -541,37 +563,47 @@ def scale_up_elastic_ep(self, cur_vllm_config: VllmConfig,
             self.created_placement_groups.append(pg)
             self.placement_group_is_local.append(local_client)
 
-        ray.get([
-            actor.wait_for_init.remote()
-            for actor in (self.local_engine_actors[-new_local_engines:]
-                          if new_local_engines > 0 else []) +
-            self.remote_engine_actors[-(len(placement_groups) -
-                                        new_local_engines):]
-        ])
+        ray.get(
+            [
+                actor.wait_for_init.remote()
+                for actor in (
+                    self.local_engine_actors[-new_local_engines:]
+                    if new_local_engines > 0
+                    else []
+                )
+                + self.remote_engine_actors[
+                    -(len(placement_groups) - new_local_engines) :
+                ]
+            ]
+        )
 
-        actors = (self.local_engine_actors[-new_local_engines:]
-                  if new_local_engines > 0 else []) + \
-            self.remote_engine_actors[-(len(placement_groups) -
-                                        new_local_engines):]
+        actors = (
+            self.local_engine_actors[-new_local_engines:]
+            if new_local_engines > 0
+            else []
+        ) + self.remote_engine_actors[-(len(placement_groups) - new_local_engines) :]
 
         for actor in actors:
             self.run_refs.append(actor.run.remote())
 
-        cur_vllm_config.parallel_config.data_parallel_size = \
-            new_data_parallel_size
+        cur_vllm_config.parallel_config.data_parallel_size = new_data_parallel_size
         # Update old_vllm_config with new data_parallel_size_local if any new
         # local engines were added
         if new_local_engines > 0:
-            cur_vllm_config.parallel_config.data_parallel_size_local += \
+            cur_vllm_config.parallel_config.data_parallel_size_local += (
                 new_local_engines
+            )
 
-    def scale_down_elastic_ep(self, cur_data_parallel_size: int,
-                              new_data_parallel_size: int) -> None:
+    def scale_down_elastic_ep(
+        self, cur_data_parallel_size: int, new_data_parallel_size: int
+    ) -> None:
         import ray
+
         assert cur_data_parallel_size > new_data_parallel_size, (
             f"cur_data_parallel_size {cur_data_parallel_size} must be greater "
             f"than new_data_parallel_size {new_data_parallel_size} "
-            "for scale down")
+            "for scale down"
+        )
         for _ in range(cur_data_parallel_size - new_data_parallel_size):
             pg = self.created_placement_groups.pop()
             is_local = self.placement_group_is_local.pop()
@@ -586,6 +618,7 @@ def get_run_refs(self):
 
     def close(self):
         import ray
+
         for actor in self.local_engine_actors + self.remote_engine_actors:
             ray.kill(actor)
         for pg in self.created_placement_groups:
@@ -598,11 +631,13 @@ def launch_core_engines(
     executor_class: type[Executor],
     log_stats: bool,
     num_api_servers: int = 1,
-) -> Iterator[tuple[
+) -> Iterator[
+    tuple[
         Optional[Union[CoreEngineProcManager, CoreEngineActorManager]],
         Optional[DPCoordinator],
         EngineZmqAddresses,
-]]:
+    ]
+]:
     """Launch engine and DP coordinator processes as needed."""
 
     parallel_config = vllm_config.parallel_config
@@ -611,8 +646,10 @@ def launch_core_engines(
     local_start_index = parallel_config.data_parallel_rank_local
     dp_rank = parallel_config.data_parallel_rank
     host = parallel_config.data_parallel_master_ip
-    local_engines_only = (parallel_config.data_parallel_hybrid_lb
-                          or parallel_config.data_parallel_external_lb)
+    local_engines_only = (
+        parallel_config.data_parallel_hybrid_lb
+        or parallel_config.data_parallel_external_lb
+    )
 
     # In offline mode there is an LLM instance per DP rank and
     # one core engine per LLM, see
@@ -621,8 +658,9 @@ def launch_core_engines(
 
     # client_local_only = True for cases where this front-end
     # sends requests only to colocated engines.
-    client_local_only = (offline_mode or local_engines_only
-                         or (local_engine_count == dp_size))
+    client_local_only = (
+        offline_mode or local_engines_only or (local_engine_count == dp_size)
+    )
 
     # Set up input and output addresses.
     addresses = EngineZmqAddresses(
@@ -644,12 +682,13 @@ def launch_core_engines(
         coordinator = DPCoordinator(parallel_config)
 
         addresses.coordinator_input, addresses.coordinator_output = (
-            coordinator.get_engine_socket_addresses())
+            coordinator.get_engine_socket_addresses()
+        )
         addresses.frontend_stats_publish_address = (
-            coordinator.get_stats_publish_address())
+            coordinator.get_stats_publish_address()
+        )
 
-        logger.info("Started DP Coordinator process (PID: %d)",
-                    coordinator.proc.pid)
+        logger.info("Started DP Coordinator process (PID: %d)", coordinator.proc.pid)
     else:
         coordinator = None
 
@@ -675,14 +714,14 @@ def launch_core_engines(
         # Note this also covers the case where we have zero local engines
         # and rank 0 is headless.
         engines_to_handshake = [
-            CoreEngine(index=i, local=(i < local_engine_count))
-            for i in range(dp_size)
+            CoreEngine(index=i, local=(i < local_engine_count)) for i in range(dp_size)
         ]
     else:
         # Rank > 0 handshakes with just the local cores it is managing.
         assert local_engines_only, (
             "Attempting to launch core_engines from dp_rank > 0, but "
-            "found internal DPLB, which is incompatible.")
+            "found internal DPLB, which is incompatible."
+        )
         engines_to_handshake = [
             CoreEngine(index=i, local=True)
             for i in range(dp_rank, dp_rank + local_engine_count)
@@ -695,7 +734,8 @@ def launch_core_engines(
     handshake_local_only = offline_mode or local_engine_count == dp_size
 
     handshake_address = get_engine_client_zmq_addr(
-        handshake_local_only, host, parallel_config.data_parallel_rpc_port)
+        handshake_local_only, host, parallel_config.data_parallel_rpc_port
+    )
 
     if local_engines_only and dp_rank > 0:
         assert not handshake_local_only
@@ -705,9 +745,9 @@ def launch_core_engines(
         local_handshake_address = handshake_address
         client_handshake_address = None
 
-    with zmq_socket_ctx(local_handshake_address, zmq.ROUTER,
-                        bind=True) as handshake_socket:
-
+    with zmq_socket_ctx(
+        local_handshake_address, zmq.ROUTER, bind=True
+    ) as handshake_socket:
         from vllm.v1.engine.core import EngineCoreProc
 
         # Start local engines.
@@ -722,7 +762,8 @@ def launch_core_engines(
                 local_client=True,
                 local_engine_count=local_engine_count,
                 start_index=dp_rank,
-                local_start_index=local_start_index or 0)
+                local_start_index=local_start_index or 0,
+            )
         else:
             local_engine_manager = None
 
@@ -757,8 +798,10 @@ def wait_for_engine_startup(
     poller = zmq.Poller()
     poller.register(handshake_socket, zmq.POLLIN)
 
-    remote_should_be_headless = not parallel_config.data_parallel_hybrid_lb \
+    remote_should_be_headless = (
+        not parallel_config.data_parallel_hybrid_lb
         and not parallel_config.data_parallel_external_lb
+    )
 
     if proc_manager is not None:
         for sentinel in proc_manager.sentinels():
@@ -770,67 +813,73 @@ def wait_for_engine_startup(
         if not events:
             if any(conn_pending):
                 logger.debug(
-                    "Waiting for %d local, %d remote core engine proc(s) "
-                    "to connect.", *conn_pending)
+                    "Waiting for %d local, %d remote core engine proc(s) to connect.",
+                    *conn_pending,
+                )
             if any(start_pending):
                 logger.debug(
-                    "Waiting for %d local, %d remote core engine proc(s) "
-                    "to start.", *start_pending)
+                    "Waiting for %d local, %d remote core engine proc(s) to start.",
+                    *start_pending,
+                )
             continue
         if len(events) > 1 or events[0][0] != handshake_socket:
             # One of the local core processes exited.
             finished = proc_manager.finished_procs() if proc_manager else {}
             if coord_process is not None and coord_process.exitcode is not None:
                 finished[coord_process.name] = coord_process.exitcode
-            raise RuntimeError("Engine core initialization failed. "
-                               "See root cause above. "
-                               f"Failed core proc(s): {finished}")
+            raise RuntimeError(
+                "Engine core initialization failed. "
+                "See root cause above. "
+                f"Failed core proc(s): {finished}"
+            )
 
         # Receive HELLO and READY messages from the input socket.
         eng_identity, ready_msg_bytes = handshake_socket.recv_multipart()
         eng_index = int.from_bytes(eng_identity, "little")
-        engine = next((e for e in core_engines if e.identity == eng_identity),
-                      None)
+        engine = next((e for e in core_engines if e.identity == eng_identity), None)
         if engine is None:
-            raise RuntimeError(f"Message from engine with unexpected data "
-                               f"parallel rank: {eng_index}")
+            raise RuntimeError(
+                f"Message from engine with unexpected data parallel rank: {eng_index}"
+            )
         msg = msgspec.msgpack.decode(ready_msg_bytes)
         status, local, headless = msg["status"], msg["local"], msg["headless"]
         if local != engine.local:
-            raise RuntimeError(f"{status} message from "
-                               f"{'local' if local else 'remote'} "
-                               f"engine {eng_index}, expected it to be "
-                               f"{'local' if engine.local else 'remote'}")
+            raise RuntimeError(
+                f"{status} message from "
+                f"{'local' if local else 'remote'} "
+                f"engine {eng_index}, expected it to be "
+                f"{'local' if engine.local else 'remote'}"
+            )
 
         # Remote engines must be headless iff we aren't in hybrid dp lb mode.
         if not local and headless != remote_should_be_headless:
             if headless:
-                raise RuntimeError(f"Remote engine {eng_index} must not use "
-                                   f"--headless in external or hybrid dp lb "
-                                   f"mode")
+                raise RuntimeError(
+                    f"Remote engine {eng_index} must not use "
+                    f"--headless in external or hybrid dp lb "
+                    f"mode"
+                )
             else:
-                raise RuntimeError(f"Remote engine {eng_index} must use "
-                                   f"--headless unless in external or hybrid "
-                                   f"dp lb mode")
+                raise RuntimeError(
+                    f"Remote engine {eng_index} must use "
+                    f"--headless unless in external or hybrid "
+                    f"dp lb mode"
+                )
 
         if status == "HELLO" and engine.state == CoreEngineState.NEW:
-
             # Send init message with DP config info.
             init_message = msgspec.msgpack.encode(
                 EngineHandshakeMetadata(
                     addresses=addresses,
                     parallel_config={
-                        "data_parallel_master_ip":
-                        parallel_config.data_parallel_master_ip,
-                        "data_parallel_master_port":
-                        parallel_config.data_parallel_master_port,
-                        "_data_parallel_master_port_list":
-                        parallel_config._data_parallel_master_port_list,
-                        "data_parallel_size":
-                        parallel_config.data_parallel_size,
-                    }))
-            handshake_socket.send_multipart((eng_identity, init_message),
-                                            copy=False)
+                        "data_parallel_master_ip": parallel_config.data_parallel_master_ip,
+                        "data_parallel_master_port": parallel_config.data_parallel_master_port,
+                        "_data_parallel_master_port_list": parallel_config._data_parallel_master_port_list,
+                        "data_parallel_size": parallel_config.data_parallel_size,
+                    },
+                )
+            )
+            handshake_socket.send_multipart((eng_identity, init_message), copy=False)
             conn_pending[0 if local else 1] -= 1
             start_pending[0 if local else 1] += 1
             engine.state = CoreEngineState.CONNECTED
@@ -846,15 +895,20 @@ def wait_for_engine_startup(
             # one of the engine handshakes, and passed to the local
             # front-end process in the response from the other.
             if addresses.frontend_stats_publish_address is None:
-                addresses.frontend_stats_publish_address = msg.get(
-                    "dp_stats_address")
+                addresses.frontend_stats_publish_address = msg.get("dp_stats_address")
 
             start_pending[0 if local else 1] -= 1
             engine.state = CoreEngineState.READY
         else:
-            raise RuntimeError(f"Unexpected {status} message for "
-                               f"{'local' if local else 'remote'} engine "
-                               f"{eng_index} in {engine.state} state.")
-
-        logger.debug("%s from %s core engine process %s.", status,
-                     "local" if local else "remote", eng_index)
+            raise RuntimeError(
+                f"Unexpected {status} message for "
+                f"{'local' if local else 'remote'} engine "
+                f"{eng_index} in {engine.state} state."
+            )
+
+        logger.debug(
+            "%s from %s core engine process %s.",
+            status,
+            "local" if local else "remote",
+            eng_index,
+        )
diff --git a/vllm/v1/executor/abstract.py b/vllm/v1/executor/abstract.py
index 625017d52fff..064e4b2bbf18 100644
--- a/vllm/v1/executor/abstract.py
+++ b/vllm/v1/executor/abstract.py
@@ -10,9 +10,9 @@
 from vllm.config import VllmConfig
 from vllm.executor.executor_base import ExecutorBase
 from vllm.executor.uniproc_executor import (  # noqa
-    ExecutorWithExternalLauncher as ExecutorWithExternalLauncherV0)
-from vllm.executor.uniproc_executor import (  # noqa
-    UniProcExecutor as UniProcExecutorV0)
+    ExecutorWithExternalLauncher as ExecutorWithExternalLauncherV0,
+)
+from vllm.executor.uniproc_executor import UniProcExecutor as UniProcExecutorV0  # noqa
 from vllm.utils import resolve_obj_by_qualname
 from vllm.v1.core.sched.output import SchedulerOutput
 from vllm.v1.kv_cache_interface import KVCacheConfig, KVCacheSpec
@@ -30,21 +30,24 @@ class Executor(ExecutorBase):
     def get_class(vllm_config: VllmConfig) -> type["Executor"]:
         executor_class: type[Executor]
         parallel_config = vllm_config.parallel_config
-        distributed_executor_backend = (
-            parallel_config.distributed_executor_backend)
+        distributed_executor_backend = parallel_config.distributed_executor_backend
         # distributed_executor_backend must be set in VllmConfig.__post_init__
         if isinstance(distributed_executor_backend, type):
             if not issubclass(distributed_executor_backend, ExecutorBase):
                 raise TypeError(
                     "distributed_executor_backend must be a subclass of "
-                    f"ExecutorBase. Got {distributed_executor_backend}.")
+                    f"ExecutorBase. Got {distributed_executor_backend}."
+                )
             executor_class = distributed_executor_backend
         elif distributed_executor_backend == "ray":
             from vllm.v1.executor.ray_distributed_executor import (  # noqa
-                RayDistributedExecutor)
+                RayDistributedExecutor,
+            )
+
             executor_class = RayDistributedExecutor
         elif distributed_executor_backend == "mp":
             from vllm.v1.executor.multiproc_executor import MultiprocExecutor
+
             executor_class = MultiprocExecutor
         elif distributed_executor_backend == "uni":
             executor_class = UniProcExecutor
@@ -53,25 +56,24 @@ def get_class(vllm_config: VllmConfig) -> type["Executor"]:
             # to support external launcher
             executor_class = ExecutorWithExternalLauncher
         elif isinstance(distributed_executor_backend, str):
-            executor_class = resolve_obj_by_qualname(
-                distributed_executor_backend)
+            executor_class = resolve_obj_by_qualname(distributed_executor_backend)
             if not issubclass(executor_class, ExecutorBase):
                 raise TypeError(
                     "distributed_executor_backend must be a subclass of "
-                    f"ExecutorBase. Got {executor_class}.")
+                    f"ExecutorBase. Got {executor_class}."
+                )
         else:
-            raise ValueError("Unknown distributed executor backend: "
-                             f"{distributed_executor_backend}")
+            raise ValueError(
+                f"Unknown distributed executor backend: {distributed_executor_backend}"
+            )
         return executor_class
 
-    def initialize_from_config(self,
-                               kv_cache_configs: list[KVCacheConfig]) -> None:
+    def initialize_from_config(self, kv_cache_configs: list[KVCacheConfig]) -> None:
         """
         Initialize the KV caches and begin the model execution loop of the
         underlying workers.
         """
-        self.collective_rpc("initialize_from_config",
-                            args=(kv_cache_configs, ))
+        self.collective_rpc("initialize_from_config", args=(kv_cache_configs,))
         self.collective_rpc("compile_or_warm_up_model")
 
     def register_failure_callback(self, callback: FailureCallback):
@@ -87,12 +89,14 @@ def determine_available_memory(self) -> list[int]:  # in bytes
     def get_kv_cache_specs(self) -> list[dict[str, KVCacheSpec]]:
         return self.collective_rpc("get_kv_cache_spec")
 
-    def collective_rpc(self,
-                       method: Union[str, Callable],
-                       timeout: Optional[float] = None,
-                       args: tuple = (),
-                       kwargs: Optional[dict] = None,
-                       non_block: bool = False) -> list[Any]:
+    def collective_rpc(
+        self,
+        method: Union[str, Callable],
+        timeout: Optional[float] = None,
+        args: tuple = (),
+        kwargs: Optional[dict] = None,
+        non_block: bool = False,
+    ) -> list[Any]:
         raise NotImplementedError
 
     def execute_model(
@@ -100,9 +104,9 @@ def execute_model(
         scheduler_output: SchedulerOutput,
         non_block: bool = False,
     ) -> Union[ModelRunnerOutput, Future[ModelRunnerOutput]]:
-        output = self.collective_rpc("execute_model",
-                                     args=(scheduler_output, ),
-                                     non_block=non_block)
+        output = self.collective_rpc(
+            "execute_model", args=(scheduler_output,), non_block=non_block
+        )
         return output[0]
 
     def execute_dummy_batch(self) -> None:
@@ -117,7 +121,7 @@ def max_concurrent_batches(self) -> int:
         return 1
 
     def profile(self, is_start: bool = True):
-        self.collective_rpc("profile", args=(is_start, ))
+        self.collective_rpc("profile", args=(is_start,))
 
 
 class UniProcExecutor(UniProcExecutorV0, Executor):
@@ -125,12 +129,12 @@ class UniProcExecutor(UniProcExecutorV0, Executor):
 
 
 class ExecutorWithExternalLauncher(ExecutorWithExternalLauncherV0, Executor):
-
     def determine_available_memory(self) -> list[int]:  # in bytes
         # same as determine_num_available_blocks in v0,
         # we need to get the min across all ranks.
         memory = super().determine_available_memory()
         from vllm.distributed.parallel_state import get_world_group
+
         cpu_group = get_world_group().cpu_group
         memory_tensor = torch.tensor([memory], device="cpu", dtype=torch.int64)
         dist.all_reduce(memory_tensor, group=cpu_group, op=dist.ReduceOp.MIN)
diff --git a/vllm/v1/executor/multiproc_executor.py b/vllm/v1/executor/multiproc_executor.py
index eecdf8def6de..062b6042693b 100644
--- a/vllm/v1/executor/multiproc_executor.py
+++ b/vllm/v1/executor/multiproc_executor.py
@@ -24,30 +24,36 @@
 
 import vllm.envs as envs
 from vllm.config import VllmConfig
-from vllm.distributed import (destroy_distributed_environment,
-                              destroy_model_parallel)
-from vllm.distributed.device_communicators.shm_broadcast import (Handle,
-                                                                 MessageQueue)
-from vllm.distributed.parallel_state import (get_dp_group, get_ep_group,
-                                             get_pp_group, get_tp_group)
+from vllm.distributed import destroy_distributed_environment, destroy_model_parallel
+from vllm.distributed.device_communicators.shm_broadcast import Handle, MessageQueue
+from vllm.distributed.parallel_state import (
+    get_dp_group,
+    get_ep_group,
+    get_pp_group,
+    get_tp_group,
+)
 from vllm.logger import init_logger
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.cache import worker_receiver_cache_from_config
-from vllm.utils import (_maybe_force_spawn, decorate_logs,
-                        get_distributed_init_method, get_loopback_ip,
-                        get_mp_context, get_open_port, set_process_title)
+from vllm.utils import (
+    _maybe_force_spawn,
+    decorate_logs,
+    get_distributed_init_method,
+    get_loopback_ip,
+    get_mp_context,
+    get_open_port,
+    set_process_title,
+)
 from vllm.v1.core.sched.output import SchedulerOutput
 from vllm.v1.executor.abstract import Executor, FailureCallback
 from vllm.v1.executor.utils import get_and_update_mm_cache
-from vllm.v1.outputs import (AsyncModelRunnerOutput, DraftTokenIds,
-                             ModelRunnerOutput)
+from vllm.v1.outputs import AsyncModelRunnerOutput, DraftTokenIds, ModelRunnerOutput
 from vllm.v1.worker.worker_base import WorkerWrapperBase
 
 logger = init_logger(__name__)
 
 
 class MultiprocExecutor(Executor):
-
     supports_pp: bool = True
 
     def _init_executor(self) -> None:
@@ -65,7 +71,8 @@ def _init_executor(self) -> None:
         assert self.world_size == tensor_parallel_size * pp_parallel_size, (
             f"world_size ({self.world_size}) must be equal to the "
             f"tensor_parallel_size ({tensor_parallel_size}) x pipeline"
-            f"_parallel_size ({pp_parallel_size}). ")
+            f"_parallel_size ({pp_parallel_size}). "
+        )
 
         # Set multiprocessing envs
         set_multiprocessing_worker_envs()
@@ -74,14 +81,15 @@ def _init_executor(self) -> None:
         # Since it only works for single node, we can use the loopback address
         # get_loopback_ip() for communication.
         distributed_init_method = get_distributed_init_method(
-            get_loopback_ip(), get_open_port())
+            get_loopback_ip(), get_open_port()
+        )
 
         # Initialize worker and set up message queues for SchedulerOutputs
         # and ModelRunnerOutputs
         max_chunk_bytes = envs.VLLM_MQ_MAX_CHUNK_BYTES_MB * 1024 * 1024
-        self.rpc_broadcast_mq = MessageQueue(self.world_size,
-                                             self.world_size,
-                                             max_chunk_bytes=max_chunk_bytes)
+        self.rpc_broadcast_mq = MessageQueue(
+            self.world_size, self.world_size, max_chunk_bytes=max_chunk_bytes
+        )
         scheduler_output_handle = self.rpc_broadcast_mq.export_handle()
 
         # Create workers
@@ -99,7 +107,8 @@ def _init_executor(self) -> None:
                         distributed_init_method=distributed_init_method,
                         input_shm_handle=scheduler_output_handle,
                         shared_worker_lock=shared_worker_lock,
-                    ))
+                    )
+                )
 
             # Workers must be created before wait_for_ready to avoid
             # deadlock, since worker.init_device() does a device sync.
@@ -120,8 +129,7 @@ def _init_executor(self) -> None:
                 for uw in unready_workers:
                     if uw.death_writer is not None:
                         uw.death_writer.close()
-                self._ensure_worker_termination(
-                    [uw.proc for uw in unready_workers])
+                self._ensure_worker_termination([uw.proc for uw in unready_workers])
 
         # For pipeline parallel, we use a thread pool for asynchronous
         # execute_model.
@@ -130,7 +138,8 @@ def _init_executor(self) -> None:
             # from the response queue
             # _async_aggregate_workers_output also assumes a single IO thread
             self.io_thread_pool = ThreadPoolExecutor(
-                max_workers=1, thread_name_prefix="mp_exec_io")
+                max_workers=1, thread_name_prefix="mp_exec_io"
+            )
 
         self.output_rank = self._get_output_rank()
         self.has_connector = self.vllm_config.kv_transfer_config is not None
@@ -146,23 +155,22 @@ def monitor_workers():
             sentinels = [h.proc.sentinel for h in workers]
             died = multiprocessing.connection.wait(sentinels)
             _self = self_ref()
-            if not _self or getattr(_self, 'shutting_down', False):
+            if not _self or getattr(_self, "shutting_down", False):
                 return
             _self.is_failed = True
-            proc_name = next(h.proc.name for h in workers
-                             if h.proc.sentinel == died[0])
+            proc_name = next(h.proc.name for h in workers if h.proc.sentinel == died[0])
             logger.error(
-                "Worker proc %s died unexpectedly, "
-                "shutting down executor.", proc_name)
+                "Worker proc %s died unexpectedly, shutting down executor.", proc_name
+            )
             _self.shutdown()
             callback = _self.failure_callback
             if callback is not None:
                 _self.failure_callback = None
                 callback()
 
-        Thread(target=monitor_workers,
-               daemon=True,
-               name="MultiprocWorkerMonitor").start()
+        Thread(
+            target=monitor_workers, daemon=True, name="MultiprocWorkerMonitor"
+        ).start()
 
     def register_failure_callback(self, callback: FailureCallback):
         if self.is_failed:
@@ -175,47 +183,49 @@ def execute_model(
         scheduler_output: SchedulerOutput,
         non_block: bool = False,
     ) -> Union[ModelRunnerOutput, Future[ModelRunnerOutput]]:
-
         if not self.has_connector:
             # get output only from a single worker (output_rank)
-            (output, ) = self.collective_rpc(
+            (output,) = self.collective_rpc(
                 "execute_model",
-                args=(scheduler_output, ),
+                args=(scheduler_output,),
                 unique_reply_rank=self.output_rank,
                 non_block=non_block,
-                timeout=envs.VLLM_EXECUTE_MODEL_TIMEOUT_SECONDS)
+                timeout=envs.VLLM_EXECUTE_MODEL_TIMEOUT_SECONDS,
+            )
             return output
 
         # get output from all workers
         outputs = self.collective_rpc(
             "execute_model",
-            args=(scheduler_output, ),
+            args=(scheduler_output,),
             non_block=non_block,
-            timeout=envs.VLLM_EXECUTE_MODEL_TIMEOUT_SECONDS)
+            timeout=envs.VLLM_EXECUTE_MODEL_TIMEOUT_SECONDS,
+        )
 
         # aggregate all workers output to a single output
         if non_block:
-            return self.kv_output_aggregator.async_aggregate(
-                outputs, self.output_rank)
+            return self.kv_output_aggregator.async_aggregate(outputs, self.output_rank)
         return self.kv_output_aggregator.aggregate(outputs, self.output_rank)
 
     def execute_dummy_batch(self) -> None:
-        self.collective_rpc("execute_dummy_batch",
-                            unique_reply_rank=self.output_rank)
+        self.collective_rpc("execute_dummy_batch", unique_reply_rank=self.output_rank)
 
     def take_draft_token_ids(self) -> Optional[DraftTokenIds]:
         # OPTIMIZATION: Get output only from a single worker (output_rank)
-        outputs = self.collective_rpc("take_draft_token_ids",
-                                      unique_reply_rank=self.output_rank)
+        outputs = self.collective_rpc(
+            "take_draft_token_ids", unique_reply_rank=self.output_rank
+        )
         return outputs[0]
 
-    def collective_rpc(self,
-                       method: Union[str, Callable],
-                       timeout: Optional[float] = None,
-                       args: tuple = (),
-                       kwargs: Optional[dict] = None,
-                       non_block: bool = False,
-                       unique_reply_rank: Optional[int] = None) -> list[Any]:
+    def collective_rpc(
+        self,
+        method: Union[str, Callable],
+        timeout: Optional[float] = None,
+        args: tuple = (),
+        kwargs: Optional[dict] = None,
+        non_block: bool = False,
+        unique_reply_rank: Optional[int] = None,
+    ) -> list[Any]:
         if self.is_failed:
             raise RuntimeError("Executor failed.")
 
@@ -230,42 +240,53 @@ def collective_rpc(self,
                 send_method = method
             else:
                 send_method = cloudpickle.dumps(
-                    method, protocol=pickle.HIGHEST_PROTOCOL)
+                    method, protocol=pickle.HIGHEST_PROTOCOL
+                )
             self.rpc_broadcast_mq.enqueue(
-                (send_method, args, kwargs, unique_reply_rank))
-
-            workers = (self.workers[unique_reply_rank],
-                       ) if unique_reply_rank is not None else self.workers
+                (send_method, args, kwargs, unique_reply_rank)
+            )
+
+            workers = (
+                (self.workers[unique_reply_rank],)
+                if unique_reply_rank is not None
+                else self.workers
+            )
             responses = []
 
-            def get_response(w: WorkerProcHandle,
-                             dequeue_timeout: Optional[float] = None,
-                             cancel_event: Optional[threading.Event] = None):
+            def get_response(
+                w: WorkerProcHandle,
+                dequeue_timeout: Optional[float] = None,
+                cancel_event: Optional[threading.Event] = None,
+            ):
                 status, result = w.worker_response_mq.dequeue(
-                    timeout=dequeue_timeout, cancel=cancel_event)
+                    timeout=dequeue_timeout, cancel=cancel_event
+                )
 
                 if status != WorkerProc.ResponseStatus.SUCCESS:
                     raise RuntimeError(
                         f"Worker failed with error '{result}', please check the"
-                        " stack trace above for the root cause")
+                        " stack trace above for the root cause"
+                    )
                 return result
 
             for w in workers:
-                dequeue_timeout = None if deadline is None else (
-                    deadline - time.monotonic())
+                dequeue_timeout = (
+                    None if deadline is None else (deadline - time.monotonic())
+                )
 
                 if self.io_thread_pool is not None:
                     # We must consume worker_response_mq from a single thread.
                     result = self.io_thread_pool.submit(  # type: ignore
-                        get_response, w, dequeue_timeout, self.shutdown_event)
+                        get_response, w, dequeue_timeout, self.shutdown_event
+                    )
                     if not non_block:
                         result = result.result()
                 elif not non_block:
-                    result = get_response(w, dequeue_timeout,
-                                          self.shutdown_event)
+                    result = get_response(w, dequeue_timeout, self.shutdown_event)
                 else:
-                    raise RuntimeError("non_block can only be used when"
-                                       " max_concurrent_batches > 1")
+                    raise RuntimeError(
+                        "non_block can only be used when max_concurrent_batches > 1"
+                    )
                 responses.append(result)
 
             return responses
@@ -302,11 +323,11 @@ def wait_for_termination(procs, timeout):
 
     def shutdown(self):
         """Properly shut down the executor and its workers"""
-        if not getattr(self, 'shutting_down', False):
+        if not getattr(self, "shutting_down", False):
             self.shutting_down = True
 
             # Make sure all the worker processes are terminated first.
-            if workers := getattr(self, 'workers', None):
+            if workers := getattr(self, "workers", None):
                 for w in workers:
                     # Close death_writer to signal child processes to exit
                     if w.death_writer is not None:
@@ -348,6 +369,7 @@ def _get_output_rank(self) -> int:
 @dataclass
 class UnreadyWorkerProcHandle:
     """WorkerProcess handle before READY."""
+
     proc: BaseProcess
     rank: int
     ready_pipe: Connection
@@ -363,8 +385,8 @@ class WorkerProcHandle:
 
     @classmethod
     def from_unready_handle(
-            cls, unready_handle: UnreadyWorkerProcHandle,
-            worker_response_mq: MessageQueue) -> "WorkerProcHandle":
+        cls, unready_handle: UnreadyWorkerProcHandle, worker_response_mq: MessageQueue
+    ) -> "WorkerProcHandle":
         return cls(
             proc=unready_handle.proc,
             rank=unready_handle.rank,
@@ -393,8 +415,7 @@ def __init__(
         all_kwargs: list[dict] = [
             {} for _ in range(vllm_config.parallel_config.world_size)
         ]
-        is_driver_worker = (
-            rank % vllm_config.parallel_config.tensor_parallel_size == 0)
+        is_driver_worker = rank % vllm_config.parallel_config.tensor_parallel_size == 0
         all_kwargs[rank] = {
             "vllm_config": vllm_config,
             "local_rank": local_rank,
@@ -407,7 +428,8 @@ def __init__(
 
         # Initialize MessageQueue for receiving SchedulerOutput
         self.rpc_broadcast_mq = MessageQueue.create_from_handle(
-            input_shm_handle, self.worker.rank)
+            input_shm_handle, self.worker.rank
+        )
 
         # Initializes a message queue for sending the model output
         self.worker_response_mq = MessageQueue(1, 1)
@@ -419,19 +441,22 @@ def __init__(
             self.async_output_copy_thread = Thread(
                 target=self.async_output_busy_loop,
                 daemon=True,
-                name="WorkerAsyncOutputCopy")
+                name="WorkerAsyncOutputCopy",
+            )
             self.async_output_copy_thread.start()
 
         # Initialize multimodal receiver cache if needed
         self.mm_receiver_cache = worker_receiver_cache_from_config(
-            vllm_config, MULTIMODAL_REGISTRY, shared_worker_lock)
+            vllm_config, MULTIMODAL_REGISTRY, shared_worker_lock
+        )
 
         # Initialize device
         self.worker.init_device()
 
         # Set process title and log prefix
         self.setup_proc_title_and_log_prefix(
-            enable_ep=vllm_config.parallel_config.enable_expert_parallel)
+            enable_ep=vllm_config.parallel_config.enable_expert_parallel
+        )
 
         # Load model
         self.worker.load_model()
@@ -463,10 +488,12 @@ def make_worker_process(
             "shared_worker_lock": shared_worker_lock,
         }
         # Run EngineCore busy loop in background process.
-        proc = context.Process(target=WorkerProc.worker_main,
-                               kwargs=process_kwargs,
-                               name=f"VllmWorker-{rank}",
-                               daemon=True)
+        proc = context.Process(
+            target=WorkerProc.worker_main,
+            kwargs=process_kwargs,
+            name=f"VllmWorker-{rank}",
+            daemon=True,
+        )
 
         proc.start()
         writer.close()
@@ -476,16 +503,18 @@ def make_worker_process(
 
     @staticmethod
     def wait_for_ready(
-        unready_proc_handles: list[UnreadyWorkerProcHandle]
+        unready_proc_handles: list[UnreadyWorkerProcHandle],
     ) -> list[WorkerProcHandle]:
-
-        e = Exception("WorkerProc initialization failed due to "
-                      "an exception in a background process. "
-                      "See stack trace for root cause.")
+        e = Exception(
+            "WorkerProc initialization failed due to "
+            "an exception in a background process. "
+            "See stack trace for root cause."
+        )
 
         pipes = {handle.ready_pipe: handle for handle in unready_proc_handles}
-        ready_proc_handles: list[Optional[WorkerProcHandle]] = (
-            [None] * len(unready_proc_handles))
+        ready_proc_handles: list[Optional[WorkerProcHandle]] = [None] * len(
+            unready_proc_handles
+        )
         while pipes:
             ready = multiprocessing.connection.wait(pipes.keys())
             for pipe in ready:
@@ -499,10 +528,13 @@ def wait_for_ready(
 
                     # Extract the message queue handle.
                     worker_response_mq = MessageQueue.create_from_handle(
-                        response["handle"], 0)
+                        response["handle"], 0
+                    )
                     ready_proc_handles[unready_proc_handle.rank] = (
                         WorkerProcHandle.from_unready_handle(
-                            unready_proc_handle, worker_response_mq))
+                            unready_proc_handle, worker_response_mq
+                        )
+                    )
 
                 except EOFError:
                     e.__suppress_context__ = True
@@ -523,8 +555,8 @@ def shutdown(self):
 
     @staticmethod
     def worker_main(*args, **kwargs):
-        """ Worker initialization and execution loops.
-        This runs a background process """
+        """Worker initialization and execution loops.
+        This runs a background process"""
 
         # Signal handler used for graceful termination.
         # SystemExit exception is only raised once to allow this and worker
@@ -561,9 +593,9 @@ def monitor_parent_death():
                 except Exception as e:
                     logger.warning("Death monitoring error: %s", e)
 
-            death_monitor = Thread(target=monitor_parent_death,
-                                   daemon=True,
-                                   name="WorkerDeathMonitor")
+            death_monitor = Thread(
+                target=monitor_parent_death, daemon=True, name="WorkerDeathMonitor"
+            )
             death_monitor.start()
 
         try:
@@ -571,12 +603,12 @@ def monitor_parent_death():
             worker = WorkerProc(*args, **kwargs)
 
             # Send READY once we know everything is loaded
-            ready_writer.send({
-                "status":
-                WorkerProc.READY_STR,
-                "handle":
-                worker.worker_response_mq.export_handle(),
-            })
+            ready_writer.send(
+                {
+                    "status": WorkerProc.READY_STR,
+                    "handle": worker.worker_response_mq.export_handle(),
+                }
+            )
 
             # Ensure message queues are ready. Will deadlock if re-ordered.
             # Must be kept consistent with the Executor
@@ -653,15 +685,18 @@ def worker_busy_loop(self, cancel: Optional[threading.Event] = None):
         """Main busy loop for Multiprocessing Workers"""
         while True:
             method, args, kwargs, output_rank = self.rpc_broadcast_mq.dequeue(
-                cancel=cancel, indefinite=True)
+                cancel=cancel, indefinite=True
+            )
             try:
                 if isinstance(method, str):
                     func = getattr(self.worker, method)
                 elif isinstance(method, bytes):
                     func = partial(cloudpickle.loads(method), self.worker)
                 # retrieve from shm cache if available
-                if self.mm_receiver_cache is not None \
-                    and func.__name__ == "execute_model":
+                if (
+                    self.mm_receiver_cache is not None
+                    and func.__name__ == "execute_model"
+                ):
                     get_and_update_mm_cache(self.mm_receiver_cache, args)
                 output = func(*args, **kwargs)
             except Exception as e:
@@ -701,7 +736,7 @@ def setup_proc_title_and_log_prefix(enable_ep: bool) -> None:
 
 
 def set_multiprocessing_worker_envs():
-    """ Set up environment variables that should be used when there are workers
+    """Set up environment variables that should be used when there are workers
     in a multiprocessing environment. This should be called by the parent
     process before worker processes are created"""
 
@@ -714,13 +749,16 @@ def set_multiprocessing_worker_envs():
     # impact on performance. The contention is amplified when running in a
     # container where CPU limits can cause throttling.
     default_omp_num_threads = 1
-    if "OMP_NUM_THREADS" not in os.environ and (
-            current_parallelism :=
-            torch.get_num_threads()) > default_omp_num_threads:
+    if (
+        "OMP_NUM_THREADS" not in os.environ
+        and (current_parallelism := torch.get_num_threads()) > default_omp_num_threads
+    ):
         logger.warning(
             "Reducing Torch parallelism from %d threads to %d to avoid "
             "unnecessary CPU contention. Set OMP_NUM_THREADS in the "
             "external environment to tune this value as needed.",
-            current_parallelism, default_omp_num_threads)
+            current_parallelism,
+            default_omp_num_threads,
+        )
         os.environ["OMP_NUM_THREADS"] = str(default_omp_num_threads)
         torch.set_num_threads(default_omp_num_threads)
diff --git a/vllm/v1/executor/ray_distributed_executor.py b/vllm/v1/executor/ray_distributed_executor.py
index aadb5fd1dddd..e2c2bfd45d7b 100644
--- a/vllm/v1/executor/ray_distributed_executor.py
+++ b/vllm/v1/executor/ray_distributed_executor.py
@@ -6,7 +6,8 @@
 
 from vllm.distributed.kv_transfer.kv_connector.utils import KVOutputAggregator
 from vllm.executor.ray_distributed_executor import (  # noqa
-    RayDistributedExecutor as RayDistributedExecutorV0)
+    RayDistributedExecutor as RayDistributedExecutorV0,
+)
 from vllm.logger import init_logger
 from vllm.v1.core.sched.output import SchedulerOutput
 from vllm.v1.engine import ReconfigureDistributedRequest, ReconfigureRankType
@@ -18,10 +19,10 @@
 
 class FutureWrapper(Future):
     """A wrapper around Ray output reference to meet the interface
-    of .execute_model(): The top level (core busy loop) expects .result() api 
+    of .execute_model(): The top level (core busy loop) expects .result() api
     to block and return a single output.
-    
-    If aggregator is provided, the outputs from all workers are aggregated upon 
+
+    If aggregator is provided, the outputs from all workers are aggregated upon
     the result() call. If not only the first worker's output is returned.
     """
 
@@ -101,8 +102,11 @@ def execute_model(
         return FutureWrapper(refs, self.kv_output_aggregator)
 
     def reinitialize_distributed(
-            self, reconfig_request: ReconfigureDistributedRequest) -> None:
+        self, reconfig_request: ReconfigureDistributedRequest
+    ) -> None:
         self._run_workers("reinitialize_distributed", reconfig_request)
-        if reconfig_request.new_data_parallel_rank == \
-        ReconfigureRankType.SHUTDOWN_CURRENT_RANK:
+        if (
+            reconfig_request.new_data_parallel_rank
+            == ReconfigureRankType.SHUTDOWN_CURRENT_RANK
+        ):
             self.shutdown()
diff --git a/vllm/v1/executor/utils.py b/vllm/v1/executor/utils.py
index 1855bc996381..884068a43882 100644
--- a/vllm/v1/executor/utils.py
+++ b/vllm/v1/executor/utils.py
@@ -20,4 +20,5 @@ def get_and_update_mm_cache(
     scheduler_output = args[0]
     for request_data in scheduler_output.scheduled_new_reqs:
         request_data.mm_features = receiver_cache.get_and_update_features(
-            request_data.mm_features)
+            request_data.mm_features
+        )
diff --git a/vllm/v1/kv_cache_interface.py b/vllm/v1/kv_cache_interface.py
index 054ab591b817..9c28eb92c17a 100644
--- a/vllm/v1/kv_cache_interface.py
+++ b/vllm/v1/kv_cache_interface.py
@@ -50,7 +50,8 @@ def merge(cls, specs: list[Self]) -> Self:
         Merge a list of KVCacheSpec objects into a single KVCacheSpec object.
         """
         assert all(spec == specs[0] for spec in specs[1:]), (
-            "All layers in the same KV cache group must be the same.")
+            "All layers in the same KV cache group must be the same."
+        )
         return copy.deepcopy(specs[0])
 
 
@@ -62,8 +63,13 @@ class AttentionSpec(KVCacheSpec):
 
     @property
     def page_size_bytes(self) -> int:
-        return 2 * self.block_size * self.num_kv_heads * self.head_size \
-                * get_dtype_size(self.dtype)
+        return (
+            2
+            * self.block_size
+            * self.num_kv_heads
+            * self.head_size
+            * get_dtype_size(self.dtype)
+        )
 
 
 @dataclass(frozen=True)
@@ -82,8 +88,7 @@ class FullAttentionSpec(AttentionSpec):
 
     def max_memory_usage_bytes(self, vllm_config: VllmConfig) -> int:
         max_model_len = vllm_config.model_config.max_model_len
-        dcp_world_size = \
-            vllm_config.parallel_config.decode_context_parallel_size
+        dcp_world_size = vllm_config.parallel_config.decode_context_parallel_size
         # Note(hc): each dcp rank only need save
         # (max_model_len//dcp_world_size) tokens locally.
         if dcp_world_size > 1:
@@ -99,24 +104,30 @@ def merge_window_sizes(cls, window_sizes: set[int]) -> Optional[int]:
         else:
             raise ValueError(
                 "All attention layers in the same KV cache group must have the "
-                "same window size.")
+                "same window size."
+            )
 
     @classmethod
     def merge(cls, specs: list[Self]) -> Self:
         """
-        Merge a list of FullAttentionSpec objects into a single 
+        Merge a list of FullAttentionSpec objects into a single
         FullAttentionSpec object.
         """
         assert all(isinstance(spec, FullAttentionSpec) for spec in specs), (
-            "All attention layers in the same KV cache group must be "
-            "FullAttentionSpec.")
+            "All attention layers in the same KV cache group must be FullAttentionSpec."
+        )
 
-        sliding_window = set(spec.sliding_window for spec in specs
-                             if spec.sliding_window is not None)
-        attention_chunk_size = set(spec.attention_chunk_size for spec in specs
-                                   if spec.attention_chunk_size is not None)
+        sliding_window = set(
+            spec.sliding_window for spec in specs if spec.sliding_window is not None
+        )
+        attention_chunk_size = set(
+            spec.attention_chunk_size
+            for spec in specs
+            if spec.attention_chunk_size is not None
+        )
         assert not any(isinstance(spec, MLAAttentionSpec) for spec in specs), (
-            "MLAAttentionSpec should be merged in MLAAttentionSpec.merge")
+            "MLAAttentionSpec should be merged in MLAAttentionSpec.merge"
+        )
         merged_spec = cls(
             block_size=specs[0].block_size,
             num_kv_heads=specs[0].num_kv_heads,
@@ -129,12 +140,14 @@ def merge(cls, specs: list[Self]) -> Self:
             for f in fields(AttentionSpec):
                 assert getattr(spec, f.name) == getattr(merged_spec, f.name), (
                     "All attention layers in the same KV cache group must have "
-                    "the same attention spec.")
-        assert (
-            (merged_spec.sliding_window is not None) +
-            (merged_spec.attention_chunk_size is not None) <= 1
-        ), ("Model with both sliding window layers and chunked local attention "
-            "layers is not supported.")
+                    "the same attention spec."
+                )
+        assert (merged_spec.sliding_window is not None) + (
+            merged_spec.attention_chunk_size is not None
+        ) <= 1, (
+            "Model with both sliding window layers and chunked local attention "
+            "layers is not supported."
+        )
         return merged_spec
 
 
@@ -149,18 +162,23 @@ def page_size_bytes(self) -> int:
             # See `vllm/v1/attention/backends/mla/flashmla_sparse.py`
             #  for details.
             return self.block_size * 656
-        return self.block_size * self.num_kv_heads * self.head_size \
-                * get_dtype_size(self.dtype)
+        return (
+            self.block_size
+            * self.num_kv_heads
+            * self.head_size
+            * get_dtype_size(self.dtype)
+        )
 
     @classmethod
     def merge(cls, specs: list[Self]) -> Self:
         assert all(isinstance(spec, MLAAttentionSpec) for spec in specs), (
-            "All attention layers in the same KV cache group must be "
-            "MLAAttentionSpec.")
+            "All attention layers in the same KV cache group must be MLAAttentionSpec."
+        )
         cache_dtype_str_set = set(spec.cache_dtype_str for spec in specs)
         assert len(cache_dtype_str_set) == 1, (
             "All attention layers in the same KV cache group must use the same "
-            "quantization method.")
+            "quantization method."
+        )
         return cls(
             block_size=specs[0].block_size,
             num_kv_heads=specs[0].num_kv_heads,
@@ -176,15 +194,15 @@ class ChunkedLocalAttentionSpec(AttentionSpec):
 
     def max_memory_usage_bytes(self, vllm_config: VllmConfig) -> int:
         max_model_len = vllm_config.model_config.max_model_len
-        max_num_batched_tokens = (
-            vllm_config.scheduler_config.max_num_batched_tokens)
+        max_num_batched_tokens = vllm_config.scheduler_config.max_num_batched_tokens
 
         # During chunked prefill, we allocate KV cache for at most
         # `self.attention_chunk_size` computed tokens plus the newly scheduled
         # tokens. And we won't allocate KV cache for more than `max_model_len`
         # tokens.
-        num_tokens = min(self.attention_chunk_size + max_num_batched_tokens,
-                         max_model_len)
+        num_tokens = min(
+            self.attention_chunk_size + max_num_batched_tokens, max_model_len
+        )
 
         return cdiv(num_tokens, self.block_size) * self.page_size_bytes
 
@@ -194,18 +212,19 @@ class SlidingWindowSpec(AttentionSpec):
     sliding_window: int
 
     def max_memory_usage_bytes(self, vllm_config: VllmConfig) -> int:
-        assert vllm_config.parallel_config.decode_context_parallel_size == 1, \
+        assert vllm_config.parallel_config.decode_context_parallel_size == 1, (
             "DCP not support sliding window."
+        )
         max_model_len = vllm_config.model_config.max_model_len
-        max_num_batched_tokens = (
-            vllm_config.scheduler_config.max_num_batched_tokens)
+        max_num_batched_tokens = vllm_config.scheduler_config.max_num_batched_tokens
 
         # During chunked prefill, we allocate KV cache for the last
         # `self.sliding_window-1` computed tokens plus the newly scheduled
         # tokens. And we won't allocate KV cache for more than `max_model_len`
         # tokens.
-        num_tokens = min(self.sliding_window - 1 + max_num_batched_tokens,
-                         max_model_len)
+        num_tokens = min(
+            self.sliding_window - 1 + max_num_batched_tokens, max_model_len
+        )
 
         # +1 here because the sliding window may not start from the beginning
         # of the block. For example, if the block size is 4 and num_token
@@ -226,7 +245,8 @@ class MambaSpec(KVCacheSpec):
     def page_size_bytes(self) -> int:
         page_size = sum(
             prod(shape) * get_dtype_size(dtype)
-            for (shape, dtype) in zip(self.shapes, self.dtypes))
+            for (shape, dtype) in zip(self.shapes, self.dtypes)
+        )
         if self.page_size_padded is not None:
             assert self.page_size_padded >= page_size
             return self.page_size_padded
@@ -239,7 +259,6 @@ def max_memory_usage_bytes(self, vllm_config: VllmConfig) -> int:
 
 @dataclass(frozen=True)
 class EncoderOnlyAttentionSpec(AttentionSpec):
-
     def max_memory_usage_bytes(self, vllm_config: VllmConfig) -> int:
         # Encoder-only layers do not need KV cache
         return 0
@@ -254,8 +273,7 @@ class CrossAttentionSpec(AttentionSpec):
     def max_memory_usage_bytes(self, vllm_config: VllmConfig) -> int:
         # For cross-attention, we need to cache encoder states
         # Get encoder length (e.g., 1500 for Whisper).
-        max_encoder_len = vllm_config.scheduler_config.\
-            max_num_encoder_input_tokens
+        max_encoder_len = vllm_config.scheduler_config.max_num_encoder_input_tokens
         return cdiv(max_encoder_len, self.block_size) * self.page_size_bytes
 
 
@@ -267,18 +285,18 @@ class UniformTypeKVCacheSpecs(KVCacheSpec):
     sliding window attentions with different window sizes are not the same type
     and should not be merged into one UniformTypeKVCacheSpecs.
     """
+
     kv_cache_specs: dict[str, KVCacheSpec]
 
     @property
     def page_size_bytes(self) -> int:
-        return sum(spec.page_size_bytes
-                   for spec in self.kv_cache_specs.values())
+        return sum(spec.page_size_bytes for spec in self.kv_cache_specs.values())
 
     def max_memory_usage_bytes(self, vllm_config: VllmConfig) -> int:
         max_num_pages = max(
-            cdiv(spec.max_memory_usage_bytes(vllm_config),
-                 spec.page_size_bytes)
-            for spec in self.kv_cache_specs.values())
+            cdiv(spec.max_memory_usage_bytes(vllm_config), spec.page_size_bytes)
+            for spec in self.kv_cache_specs.values()
+        )
         return max_num_pages * self.page_size_bytes
 
     @classmethod
@@ -293,35 +311,38 @@ def is_uniform_type(cls, kv_cache_specs: dict[str, KVCacheSpec]) -> bool:
         one_spec = next(iter(kv_cache_specs.values()))
         if isinstance(one_spec, FullAttentionSpec):
             return all(
-                isinstance(spec, FullAttentionSpec)
-                for spec in kv_cache_specs.values())
+                isinstance(spec, FullAttentionSpec) for spec in kv_cache_specs.values()
+            )
         elif isinstance(one_spec, CrossAttentionSpec):
             return all(
-                isinstance(spec, CrossAttentionSpec)
-                for spec in kv_cache_specs.values())
+                isinstance(spec, CrossAttentionSpec) for spec in kv_cache_specs.values()
+            )
         elif isinstance(one_spec, SlidingWindowSpec):
             return all(
                 isinstance(spec, SlidingWindowSpec)
                 and spec.sliding_window == one_spec.sliding_window
-                for spec in kv_cache_specs.values())
+                for spec in kv_cache_specs.values()
+            )
         elif isinstance(one_spec, ChunkedLocalAttentionSpec):
             return all(
                 isinstance(spec, ChunkedLocalAttentionSpec)
                 and spec.attention_chunk_size == one_spec.attention_chunk_size
-                for spec in kv_cache_specs.values())
+                for spec in kv_cache_specs.values()
+            )
         elif isinstance(one_spec, MambaSpec):
             return all(
-                isinstance(spec, MambaSpec) and spec.num_speculative_blocks ==
-                one_spec.num_speculative_blocks
-                for spec in kv_cache_specs.values())
+                isinstance(spec, MambaSpec)
+                and spec.num_speculative_blocks == one_spec.num_speculative_blocks
+                for spec in kv_cache_specs.values()
+            )
         else:
             # NOTE(Chen): Please add new branches for new KV cache spec types.
             raise NotImplementedError(
-                f"Unsupported KV cache spec type: {type(one_spec)}")
+                f"Unsupported KV cache spec type: {type(one_spec)}"
+            )
 
     @classmethod
-    def from_specs(cls, kv_cache_specs: dict[str,
-                                             KVCacheSpec]) -> Optional[Self]:
+    def from_specs(cls, kv_cache_specs: dict[str, KVCacheSpec]) -> Optional[Self]:
         """
         Return a SameTypeKVCacheSpecs object if all layers have the same type
         of KV cache spec. Return None if not.
@@ -338,6 +359,7 @@ class KVCacheTensor:
     """
     A class for specifying how the workers should initialize the KV cache.
     """
+
     size: int  # size of the KV cache tensor in bytes
     shared_by: list[str]  # layer names that share the same KV cache tensor
 
@@ -348,6 +370,7 @@ class KVCacheGroupSpec:
     Represents a group of model layers that share the same KV cache block table.
     These layers are regarded as one layer in the KV cache manager.
     """
+
     # The names of model layers in this group
     layer_names: list[str]
     # The KV cache spec of this manager layer
@@ -359,6 +382,7 @@ class KVCacheConfig:
     """
     The KV cache configuration of a model.
     """
+
     """The number of KV cache blocks"""
     num_blocks: int
     """How should model runner initialize the KV cache tensors for each layer"""
diff --git a/vllm/v1/kv_offload/abstract.py b/vllm/v1/kv_offload/abstract.py
index 9f9c044ea1c5..ce2d0dffc0ff 100644
--- a/vllm/v1/kv_offload/abstract.py
+++ b/vllm/v1/kv_offload/abstract.py
@@ -68,7 +68,6 @@ class OffloadingEvent:
 
 
 class OffloadingManager(ABC):
-
     @abstractmethod
     def lookup(self, block_hashes: Iterable[BlockHash]) -> int:
         """
@@ -122,8 +121,8 @@ def complete_load(self, block_hashes: Iterable[BlockHash]):
 
     @abstractmethod
     def prepare_store(
-            self,
-            block_hashes: Iterable[BlockHash]) -> Optional[PrepareStoreOutput]:
+        self, block_hashes: Iterable[BlockHash]
+    ) -> Optional[PrepareStoreOutput]:
         """
         Prepare the given blocks to be offloaded.
         The given blocks will be protected from eviction until
@@ -140,9 +139,7 @@ def prepare_store(
         """
         pass
 
-    def complete_store(self,
-                       block_hashes: Iterable[BlockHash],
-                       success: bool = True):
+    def complete_store(self, block_hashes: Iterable[BlockHash], success: bool = True):
         """
         Marks blocks which were previously prepared to be stored, as stored.
         Following this call, the blocks become loadable.
diff --git a/vllm/v1/kv_offload/backend.py b/vllm/v1/kv_offload/backend.py
index 87a74200116b..538f7bf0584b 100644
--- a/vllm/v1/kv_offload/backend.py
+++ b/vllm/v1/kv_offload/backend.py
@@ -18,6 +18,7 @@ class BlockStatus(ctypes.Structure):
     load_store_spec - backend-specific information on how to actually
         read/write the block.
     """
+
     _fields_ = [("ref_cnt", ctypes.c_int32)]
 
     def __init__(self):
@@ -51,8 +52,7 @@ def get_num_free_blocks(self):
         pass
 
     @abstractmethod
-    def allocate_blocks(self,
-                        block_hashes: list[BlockHash]) -> list[BlockStatus]:
+    def allocate_blocks(self, block_hashes: list[BlockHash]) -> list[BlockStatus]:
         """
         Allocate space for writing blocks.
         This method assumes there is enough space for allocation.
@@ -80,8 +80,9 @@ def free(self, block: BlockStatus):
         """
         pass
 
-    def get_load_store_spec(self, block_hashes: Iterable[BlockHash],
-                            blocks: Iterable[BlockStatus]) -> LoadStoreSpec:
+    def get_load_store_spec(
+        self, block_hashes: Iterable[BlockHash], blocks: Iterable[BlockStatus]
+    ) -> LoadStoreSpec:
         """
         Get backend-specific information on how to read/write blocks.
 
diff --git a/vllm/v1/kv_offload/backends/cpu.py b/vllm/v1/kv_offload/backends/cpu.py
index eb1123d1d83a..736cf37853cd 100644
--- a/vllm/v1/kv_offload/backends/cpu.py
+++ b/vllm/v1/kv_offload/backends/cpu.py
@@ -10,8 +10,7 @@
 
 
 class CPUBlockStatus(BlockStatus):
-    _fields_ = BlockStatus._fields_ + [("block_id", ctypes.c_int64)
-                                       ]  # type: ignore
+    _fields_ = BlockStatus._fields_ + [("block_id", ctypes.c_int64)]  # type: ignore
 
     def __init__(self, block_id: int):
         super().__init__()
@@ -19,23 +18,24 @@ def __init__(self, block_id: int):
 
 
 class CPUBackend(Backend):
-
     def __init__(self, block_size: int, num_blocks: int):
-        super().__init__(block_size=block_size,
-                         medium=CPULoadStoreSpec.medium())
+        super().__init__(block_size=block_size, medium=CPULoadStoreSpec.medium())
 
         self.num_blocks: int = num_blocks
         self.num_allocated_blocks: int = 0
         self.allocated_blocks_free_list: list[int] = []
 
     def get_num_free_blocks(self):
-        return (len(self.allocated_blocks_free_list) + self.num_blocks -
-                self.num_allocated_blocks)
-
-    def allocate_blocks(self,
-                        block_hashes: list[BlockHash]) -> list[BlockStatus]:
-        num_fresh_blocks = min(len(block_hashes),
-                               self.num_blocks - self.num_allocated_blocks)
+        return (
+            len(self.allocated_blocks_free_list)
+            + self.num_blocks
+            - self.num_allocated_blocks
+        )
+
+    def allocate_blocks(self, block_hashes: list[BlockHash]) -> list[BlockStatus]:
+        num_fresh_blocks = min(
+            len(block_hashes), self.num_blocks - self.num_allocated_blocks
+        )
         num_reused_blocks = len(block_hashes) - num_fresh_blocks
         assert len(self.allocated_blocks_free_list) >= num_reused_blocks
 
@@ -56,6 +56,7 @@ def free(self, block: BlockStatus):
         assert isinstance(block, CPUBlockStatus)
         self.allocated_blocks_free_list.append(block.block_id)
 
-    def get_load_store_spec(self, block_hashes: Iterable[BlockHash],
-                            blocks: Iterable[BlockStatus]) -> LoadStoreSpec:
+    def get_load_store_spec(
+        self, block_hashes: Iterable[BlockHash], blocks: Iterable[BlockStatus]
+    ) -> LoadStoreSpec:
         return CPULoadStoreSpec([block.block_id for block in blocks])
diff --git a/vllm/v1/kv_offload/cpu.py b/vllm/v1/kv_offload/cpu.py
index b85d375fe63e..0c1cf64a237c 100644
--- a/vllm/v1/kv_offload/cpu.py
+++ b/vllm/v1/kv_offload/cpu.py
@@ -18,14 +18,14 @@
 
 
 class CPUOffloadingSpec(OffloadingSpec):
-
     def __init__(self, vllm_config: VllmConfig):
         super().__init__(vllm_config)
 
         num_cpu_blocks = self.extra_config.get("num_cpu_blocks")
         if not num_cpu_blocks:
-            raise Exception("num_cpu_blocks must be specified "
-                            "in kv_connector_extra_config")
+            raise Exception(
+                "num_cpu_blocks must be specified in kv_connector_extra_config"
+            )
         self.num_cpu_blocks: int = num_cpu_blocks
 
         # scheduler-side
@@ -37,27 +37,30 @@ def __init__(self, vllm_config: VllmConfig):
     def get_manager(self) -> OffloadingManager:
         if not self._manager:
             kv_events_config = self.vllm_config.kv_events_config
-            enable_events = (kv_events_config is not None
-                             and kv_events_config.enable_kv_cache_events)
-            self._manager = LRUOffloadingManager(CPUBackend(
-                block_size=self.offloaded_block_size,
-                num_blocks=self.num_cpu_blocks),
-                                                 enable_events=enable_events)
+            enable_events = (
+                kv_events_config is not None and kv_events_config.enable_kv_cache_events
+            )
+            self._manager = LRUOffloadingManager(
+                CPUBackend(
+                    block_size=self.offloaded_block_size, num_blocks=self.num_cpu_blocks
+                ),
+                enable_events=enable_events,
+            )
         return self._manager
 
     def get_handlers(
         self, kv_caches: dict[str, torch.Tensor]
-    ) -> Iterator[tuple[type[LoadStoreSpec], type[LoadStoreSpec],
-                        OffloadingHandler]]:
+    ) -> Iterator[tuple[type[LoadStoreSpec], type[LoadStoreSpec], OffloadingHandler]]:
         if not self._handler:
             if not current_platform.is_cuda():
-                raise Exception("CPU Offloading is currently only supported"
-                                " on CUDA GPUs")
+                raise Exception(
+                    "CPU Offloading is currently only supported on CUDA GPUs"
+                )
 
             layer_names = list(kv_caches.keys())
-            layers = get_layers_from_vllm_config(self.vllm_config,
-                                                 AttentionLayerBase,
-                                                 layer_names)
+            layers = get_layers_from_vllm_config(
+                self.vllm_config, AttentionLayerBase, layer_names
+            )
             attn_backends = {
                 layer_name: layers[layer_name].get_attn_backend()
                 for layer_name in layer_names
@@ -68,7 +71,8 @@ def get_handlers(
                 gpu_block_size=self.gpu_block_size,
                 cpu_block_size=self.offloaded_block_size,
                 num_cpu_blocks=self.num_cpu_blocks,
-                gpu_caches=kv_caches)
+                gpu_caches=kv_caches,
+            )
 
         assert self._handler is not None
         yield GPULoadStoreSpec, CPULoadStoreSpec, self._handler
diff --git a/vllm/v1/kv_offload/factory.py b/vllm/v1/kv_offload/factory.py
index f9bef6cea903..e0a53460e840 100644
--- a/vllm/v1/kv_offload/factory.py
+++ b/vllm/v1/kv_offload/factory.py
@@ -16,8 +16,7 @@ class OffloadingSpecFactory:
     _registry: dict[str, Callable[[], type[OffloadingSpec]]] = {}
 
     @classmethod
-    def register_spec(cls, name: str, module_path: str,
-                      class_name: str) -> None:
+    def register_spec(cls, name: str, module_path: str, class_name: str) -> None:
         """Register a spec with a lazy-loading module and class name."""
         if name in cls._registry:
             raise ValueError(f"Connector '{name}' is already registered.")
@@ -51,6 +50,6 @@ def create_spec(
 
 
 # Register various specs here.
-OffloadingSpecFactory.register_spec("CPUOffloadingSpec",
-                                    "vllm.v1.kv_offload.cpu",
-                                    "CPUOffloadingSpec")
+OffloadingSpecFactory.register_spec(
+    "CPUOffloadingSpec", "vllm.v1.kv_offload.cpu", "CPUOffloadingSpec"
+)
diff --git a/vllm/v1/kv_offload/lru_manager.py b/vllm/v1/kv_offload/lru_manager.py
index 18d3b1d637b3..36f5eb4a0abd 100644
--- a/vllm/v1/kv_offload/lru_manager.py
+++ b/vllm/v1/kv_offload/lru_manager.py
@@ -5,8 +5,12 @@
 from typing import Optional
 
 from vllm.v1.core.kv_cache_utils import BlockHash
-from vllm.v1.kv_offload.abstract import (LoadStoreSpec, OffloadingEvent,
-                                         OffloadingManager, PrepareStoreOutput)
+from vllm.v1.kv_offload.abstract import (
+    LoadStoreSpec,
+    OffloadingEvent,
+    OffloadingManager,
+    PrepareStoreOutput,
+)
 from vllm.v1.kv_offload.backend import Backend, BlockStatus
 
 
@@ -19,8 +23,7 @@ def __init__(self, backend: Backend, enable_events: bool = False):
         self.backend: Backend = backend
         # block_hash -> BlockStatus
         self.blocks: OrderedDict[BlockHash, BlockStatus] = OrderedDict()
-        self.events: Optional[list[OffloadingEvent]] = \
-            [] if enable_events else None
+        self.events: Optional[list[OffloadingEvent]] = [] if enable_events else None
 
     def lookup(self, block_hashes: Iterable[BlockHash]) -> int:
         hit_count = 0
@@ -53,16 +56,16 @@ def complete_load(self, block_hashes: Iterable[BlockHash]):
             block.ref_cnt -= 1
 
     def prepare_store(
-            self,
-            block_hashes: Iterable[BlockHash]) -> Optional[PrepareStoreOutput]:
+        self, block_hashes: Iterable[BlockHash]
+    ) -> Optional[PrepareStoreOutput]:
         # filter out blocks that are already stored
         block_hashes_to_store = [
-            block_hash for block_hash in block_hashes
-            if block_hash not in self.blocks
+            block_hash for block_hash in block_hashes if block_hash not in self.blocks
         ]
 
-        num_blocks_to_evict = (len(block_hashes_to_store) -
-                               self.backend.get_num_free_blocks())
+        num_blocks_to_evict = (
+            len(block_hashes_to_store) - self.backend.get_num_free_blocks()
+        )
 
         # build list of blocks to evict
         to_evict = []
@@ -83,10 +86,13 @@ def prepare_store(
 
         if to_evict and self.events is not None:
             self.events.append(
-                OffloadingEvent(block_hashes=to_evict,
-                                block_size=self.backend.block_size,
-                                medium=self.backend.medium,
-                                removed=True))
+                OffloadingEvent(
+                    block_hashes=to_evict,
+                    block_size=self.backend.block_size,
+                    medium=self.backend.medium,
+                    removed=True,
+                )
+            )
 
         blocks = self.backend.allocate_blocks(block_hashes_to_store)
         assert len(blocks) == len(block_hashes_to_store)
@@ -95,16 +101,15 @@ def prepare_store(
             self.blocks[block_hash] = block
 
         # build store specs for allocated blocks
-        store_spec = self.backend.get_load_store_spec(block_hashes_to_store,
-                                                      blocks)
+        store_spec = self.backend.get_load_store_spec(block_hashes_to_store, blocks)
 
-        return PrepareStoreOutput(block_hashes_to_store=block_hashes_to_store,
-                                  store_spec=store_spec,
-                                  block_hashes_evicted=to_evict)
+        return PrepareStoreOutput(
+            block_hashes_to_store=block_hashes_to_store,
+            store_spec=store_spec,
+            block_hashes_evicted=to_evict,
+        )
 
-    def complete_store(self,
-                       block_hashes: Iterable[BlockHash],
-                       success: bool = True):
+    def complete_store(self, block_hashes: Iterable[BlockHash], success: bool = True):
         stored_block_hashes: list[BlockHash] = []
         if success:
             for block_hash in block_hashes:
@@ -121,10 +126,13 @@ def complete_store(self,
 
         if stored_block_hashes and self.events is not None:
             self.events.append(
-                OffloadingEvent(block_hashes=stored_block_hashes,
-                                block_size=self.backend.block_size,
-                                medium=self.backend.medium,
-                                removed=False))
+                OffloadingEvent(
+                    block_hashes=stored_block_hashes,
+                    block_size=self.backend.block_size,
+                    medium=self.backend.medium,
+                    removed=False,
+                )
+            )
 
     def take_events(self) -> Iterable[OffloadingEvent]:
         if self.events is not None:
diff --git a/vllm/v1/kv_offload/spec.py b/vllm/v1/kv_offload/spec.py
index ed23d5e51934..a3c539a47d45 100644
--- a/vllm/v1/kv_offload/spec.py
+++ b/vllm/v1/kv_offload/spec.py
@@ -22,7 +22,8 @@ class OffloadingSpec(ABC):
     def __init__(self, vllm_config: "VllmConfig"):
         logger.warning(
             "Initializing OffloadingSpec. This API is experimental and "
-            "subject to change in the future as we iterate the design.")
+            "subject to change in the future as we iterate the design."
+        )
         self.vllm_config = vllm_config
 
         kv_transfer_config = vllm_config.kv_transfer_config
@@ -31,7 +32,8 @@ def __init__(self, vllm_config: "VllmConfig"):
 
         self.gpu_block_size = vllm_config.cache_config.block_size
         self.offloaded_block_size = int(
-            self.extra_config.get("block_size", self.gpu_block_size))
+            self.extra_config.get("block_size", self.gpu_block_size)
+        )
 
         assert self.offloaded_block_size % self.gpu_block_size == 0
 
@@ -47,8 +49,7 @@ def get_manager(self) -> OffloadingManager:
     @abstractmethod
     def get_handlers(
         self, kv_caches: dict[str, torch.Tensor]
-    ) -> Iterator[tuple[type[LoadStoreSpec], type[LoadStoreSpec],
-                        OffloadingHandler]]:
+    ) -> Iterator[tuple[type[LoadStoreSpec], type[LoadStoreSpec], OffloadingHandler]]:
         """
         Get offloading handlers along with their respective src and dst types.
 
diff --git a/vllm/v1/kv_offload/worker/cpu_gpu.py b/vllm/v1/kv_offload/worker/cpu_gpu.py
index 556c29247e5e..eb7117a400b9 100644
--- a/vllm/v1/kv_offload/worker/cpu_gpu.py
+++ b/vllm/v1/kv_offload/worker/cpu_gpu.py
@@ -9,16 +9,21 @@
 from vllm.logger import init_logger
 from vllm.utils import is_pin_memory_available
 from vllm.v1.kv_offload.mediums import CPULoadStoreSpec, GPULoadStoreSpec
-from vllm.v1.kv_offload.worker.worker import (OffloadingHandler,
-                                              TransferResult, TransferSpec)
+from vllm.v1.kv_offload.worker.worker import (
+    OffloadingHandler,
+    TransferResult,
+    TransferSpec,
+)
 
 logger = init_logger(__name__)
 
 
-def expand_block_ids(block_ids: np.ndarray,
-                     block_size_factor: int,
-                     output: np.ndarray,
-                     skip_count: int = 0):
+def expand_block_ids(
+    block_ids: np.ndarray,
+    block_size_factor: int,
+    output: np.ndarray,
+    skip_count: int = 0,
+):
     """
     Convert a list of block IDs to a list of matching block ids,
     assuming each block is composed of actual block_size_factor blocks.
@@ -47,10 +52,14 @@ def expand_block_ids(block_ids: np.ndarray,
 
 
 class CpuGpuOffloadingHandler(OffloadingHandler):
-
-    def __init__(self, gpu_block_size: int, cpu_block_size: int,
-                 num_cpu_blocks: int, gpu_caches: dict[str, torch.Tensor],
-                 attn_backends: dict[str, type[AttentionBackend]]):
+    def __init__(
+        self,
+        gpu_block_size: int,
+        cpu_block_size: int,
+        num_cpu_blocks: int,
+        gpu_caches: dict[str, torch.Tensor],
+        attn_backends: dict[str, type[AttentionBackend]],
+    ):
         assert cpu_block_size % gpu_block_size == 0
         self.block_size_factor = cpu_block_size // gpu_block_size
 
@@ -75,7 +84,8 @@ def __init__(self, gpu_block_size: int, cpu_block_size: int,
 
             gpu_shape = gpu_tensor.shape
             test_shape = attn_backends[layer_name].get_kv_cache_shape(
-                num_blocks=1234, block_size=16, num_kv_heads=8, head_size=256)
+                num_blocks=1234, block_size=16, num_kv_heads=8, head_size=256
+            )
             if test_shape[0] == 1234:
                 # shape is (num_blocks, ...)
                 num_blocks_idx = 0
@@ -94,10 +104,13 @@ def __init__(self, gpu_block_size: int, cpu_block_size: int,
 
             logger.debug("Allocating CPU tensor of shape %r", cpu_shape)
             self.cpu_tensors.append(
-                torch.zeros(cpu_shape,
-                            dtype=gpu_tensor.dtype,
-                            device="cpu",
-                            pin_memory=pin_memory))
+                torch.zeros(
+                    cpu_shape,
+                    dtype=gpu_tensor.dtype,
+                    device="cpu",
+                    pin_memory=pin_memory,
+                )
+            )
 
     def transfer_async(self, job_id: int, spec: TransferSpec) -> bool:
         src_spec, dst_spec = spec
@@ -122,35 +135,36 @@ def transfer_async(self, job_id: int, spec: TransferSpec) -> bool:
         assert src_blocks.ndim == 1
         assert dst_blocks.ndim == 1
 
-        dst_sub_blocks_to_skip = (-src_blocks.size % dst_block_size_factor)
+        dst_sub_blocks_to_skip = -src_blocks.size % dst_block_size_factor
         src_sub_block_count = src_blocks.size * src_block_size_factor
 
         assert (
-            src_sub_block_count == dst_blocks.size * dst_block_size_factor -
-            dst_sub_blocks_to_skip)
+            src_sub_block_count
+            == dst_blocks.size * dst_block_size_factor - dst_sub_blocks_to_skip
+        )
 
         src_to_dst = np.empty((src_sub_block_count, 2), dtype=np.int64)
         expand_block_ids(src_blocks, src_block_size_factor, src_to_dst[:, 0])
-        expand_block_ids(dst_blocks,
-                         dst_block_size_factor,
-                         src_to_dst[:, 1],
-                         skip_count=dst_sub_blocks_to_skip)
+        expand_block_ids(
+            dst_blocks,
+            dst_block_size_factor,
+            src_to_dst[:, 1],
+            skip_count=dst_sub_blocks_to_skip,
+        )
         src_to_dst_tensor = torch.from_numpy(src_to_dst)
 
-        event = self.events_pool.pop() if self.events_pool \
-            else torch.cuda.Event()
+        event = self.events_pool.pop() if self.events_pool else torch.cuda.Event()
         with torch.cuda.stream(stream):
             for src_tensor, dst_tensor, kv_dim in zip(
-                    src_tensors, dst_tensors, self.kv_dim_before_num_blocks):
+                src_tensors, dst_tensors, self.kv_dim_before_num_blocks
+            ):
                 if kv_dim:
                     src_key_cache = src_tensor[0]
                     dst_key_cache = dst_tensor[0]
-                    ops.swap_blocks(src_key_cache, dst_key_cache,
-                                    src_to_dst_tensor)
+                    ops.swap_blocks(src_key_cache, dst_key_cache, src_to_dst_tensor)
                     src_value_cache = src_tensor[1]
                     dst_value_cache = dst_tensor[1]
-                    ops.swap_blocks(src_value_cache, dst_value_cache,
-                                    src_to_dst_tensor)
+                    ops.swap_blocks(src_value_cache, dst_value_cache, src_to_dst_tensor)
                 else:
                     ops.swap_blocks(src_tensor, dst_tensor, src_to_dst_tensor)
             event.record(stream)
diff --git a/vllm/v1/kv_offload/worker/worker.py b/vllm/v1/kv_offload/worker/worker.py
index b7a52a088fb9..58ba082497fa 100644
--- a/vllm/v1/kv_offload/worker/worker.py
+++ b/vllm/v1/kv_offload/worker/worker.py
@@ -74,12 +74,14 @@ class OffloadingWorker:
 
     def __init__(self):
         self.handlers: set[OffloadingHandler] = set()
-        self.transfer_type_to_handler: dict[TransferType,
-                                            OffloadingHandler] = {}
-
-    def register_handler(self, src_cls: type[LoadStoreSpec],
-                         dst_cls: type[LoadStoreSpec],
-                         handler: OffloadingHandler) -> None:
+        self.transfer_type_to_handler: dict[TransferType, OffloadingHandler] = {}
+
+    def register_handler(
+        self,
+        src_cls: type[LoadStoreSpec],
+        dst_cls: type[LoadStoreSpec],
+        handler: OffloadingHandler,
+    ) -> None:
         """
         Registers a new handler.
 
@@ -113,19 +115,19 @@ def transfer_async(self, job_id: int, spec: TransferSpec) -> bool:
         try:
             success = handler.transfer_async(job_id, spec)
         except Exception as e:
-            logger.warning("Exception in %r transfer %d: %r",
-                           transfer_type,
-                           job_id,
-                           e,
-                           exc_info=True)
+            logger.warning(
+                "Exception in %r transfer %d: %r",
+                transfer_type,
+                job_id,
+                e,
+                exc_info=True,
+            )
             return False
 
         if not success:
-            logger.warning("Failed to submit %r transfer %d", transfer_type,
-                           job_id)
+            logger.warning("Failed to submit %r transfer %d", transfer_type, job_id)
         else:
-            logger.debug("Submitted %r transfer %d: %r", transfer_type, job_id,
-                         spec)
+            logger.debug("Submitted %r transfer %d: %r", transfer_type, job_id, spec)
 
         return success
 
diff --git a/vllm/v1/metrics/loggers.py b/vllm/v1/metrics/loggers.py
index ef95f03e8882..541af7af1725 100644
--- a/vllm/v1/metrics/loggers.py
+++ b/vllm/v1/metrics/loggers.py
@@ -9,8 +9,7 @@
 import prometheus_client
 
 from vllm.config import SupportsMetricsInfo, VllmConfig
-from vllm.distributed.kv_transfer.kv_connector.v1.metrics import (
-    KVConnectorLogging)
+from vllm.distributed.kv_transfer.kv_connector.v1.metrics import KVConnectorLogging
 from vllm.logger import init_logger
 from vllm.v1.core.kv_cache_utils import PrefixCachingMetrics
 from vllm.v1.engine import FinishReason
@@ -32,26 +31,24 @@ class StatLoggerBase(ABC):
     """
 
     @abstractmethod
-    def __init__(self, vllm_config: VllmConfig, engine_index: int = 0):
-        ...
+    def __init__(self, vllm_config: VllmConfig, engine_index: int = 0): ...
 
     @abstractmethod
-    def record(self,
-               scheduler_stats: Optional[SchedulerStats],
-               iteration_stats: Optional[IterationStats],
-               engine_idx: int = 0):
-        ...
+    def record(
+        self,
+        scheduler_stats: Optional[SchedulerStats],
+        iteration_stats: Optional[IterationStats],
+        engine_idx: int = 0,
+    ): ...
 
     @abstractmethod
-    def log_engine_initialized(self):
-        ...
+    def log_engine_initialized(self): ...
 
     def log(self):  # noqa
         pass
 
 
 class LoggingStatLogger(StatLoggerBase):
-
     def __init__(self, vllm_config: VllmConfig, engine_index: int = 0):
         self.engine_index = engine_index
         self.vllm_config = vllm_config
@@ -85,21 +82,21 @@ def _get_throughput(self, tracked_stats: int, now: float) -> float:
             return 0.0
         return float(tracked_stats / delta_time)
 
-    def record(self,
-               scheduler_stats: Optional[SchedulerStats],
-               iteration_stats: Optional[IterationStats],
-               engine_idx: int = 0):
+    def record(
+        self,
+        scheduler_stats: Optional[SchedulerStats],
+        iteration_stats: Optional[IterationStats],
+        engine_idx: int = 0,
+    ):
         """Log Stats to standard output."""
         if iteration_stats:
             self._track_iteration_stats(iteration_stats)
 
         if scheduler_stats is not None:
-            self.prefix_caching_metrics.observe(
-                scheduler_stats.prefix_cache_stats)
+            self.prefix_caching_metrics.observe(scheduler_stats.prefix_cache_stats)
 
             if scheduler_stats.spec_decoding_stats is not None:
-                self.spec_decoding_logging.observe(
-                    scheduler_stats.spec_decoding_stats)
+                self.spec_decoding_logging.observe(scheduler_stats.spec_decoding_stats)
             if kv_connector_stats := scheduler_stats.kv_connector_stats:
                 self.kv_connector_logging.observe(kv_connector_stats)
             self.last_scheduler_stats = scheduler_stats
@@ -107,8 +104,7 @@ def record(self,
     def log(self):
         now = time.monotonic()
         prompt_throughput = self._get_throughput(self.num_prompt_tokens, now)
-        generation_throughput = self._get_throughput(
-            self.num_generation_tokens, now)
+        generation_throughput = self._get_throughput(self.num_generation_tokens, now)
 
         self._reset(now)
 
@@ -116,8 +112,13 @@ def log(self):
 
         log_fn = logger.info
         if not any(
-            (prompt_throughput, generation_throughput,
-             self.last_prompt_throughput, self.last_generation_throughput)):
+            (
+                prompt_throughput,
+                generation_throughput,
+                self.last_prompt_throughput,
+                self.last_generation_throughput,
+            )
+        ):
             # Avoid log noise on an idle production system
             log_fn = logger.debug
         self.last_generation_throughput = generation_throughput
@@ -146,8 +147,10 @@ def log_engine_initialized(self):
         if self.vllm_config.cache_config.num_gpu_blocks:
             logger.info(
                 "Engine %03d: vllm cache_config_info with initialization "
-                "after num_gpu_blocks is: %d", self.engine_index,
-                self.vllm_config.cache_config.num_gpu_blocks)
+                "after num_gpu_blocks is: %d",
+                self.engine_index,
+                self.vllm_config.cache_config.num_gpu_blocks,
+            )
 
 
 class PrometheusStatLogger(StatLoggerBase):
@@ -156,9 +159,9 @@ class PrometheusStatLogger(StatLoggerBase):
     _histogram_cls = prometheus_client.Histogram
     _spec_decoding_cls = SpecDecodingProm
 
-    def __init__(self,
-                 vllm_config: VllmConfig,
-                 engine_indexes: Optional[list[int]] = None):
+    def __init__(
+        self, vllm_config: VllmConfig, engine_indexes: Optional[list[int]] = None
+    ):
         if engine_indexes is None:
             engine_indexes = [0]
         self.engine_indexes = engine_indexes
@@ -167,21 +170,19 @@ def __init__(self,
         self.vllm_config = vllm_config
         # Use this flag to hide metrics that were deprecated in
         # a previous release and which will be removed future
-        self.show_hidden_metrics = \
-            vllm_config.observability_config.show_hidden_metrics
+        self.show_hidden_metrics = vllm_config.observability_config.show_hidden_metrics
 
         labelnames = ["model_name", "engine"]
         model_name = vllm_config.model_config.served_model_name
         max_model_len = vllm_config.model_config.max_model_len
 
         spec_decode_labelvalues: dict[int, list[str]] = {
-            idx: [model_name, str(idx)]
-            for idx in engine_indexes
+            idx: [model_name, str(idx)] for idx in engine_indexes
         }
 
         self.spec_decoding_prom = self._spec_decoding_cls(
-            vllm_config.speculative_config, labelnames,
-            spec_decode_labelvalues)
+            vllm_config.speculative_config, labelnames, spec_decode_labelvalues
+        )
 
         #
         # Scheduler state
@@ -190,19 +191,21 @@ def __init__(self,
             name="vllm:num_requests_running",
             documentation="Number of requests in model execution batches.",
             multiprocess_mode="mostrecent",
-            labelnames=labelnames)
-        self.gauge_scheduler_running = make_per_engine(gauge_scheduler_running,
-                                                       engine_indexes,
-                                                       model_name)
+            labelnames=labelnames,
+        )
+        self.gauge_scheduler_running = make_per_engine(
+            gauge_scheduler_running, engine_indexes, model_name
+        )
 
         gauge_scheduler_waiting = self._gauge_cls(
             name="vllm:num_requests_waiting",
             documentation="Number of requests waiting to be processed.",
             multiprocess_mode="mostrecent",
-            labelnames=labelnames)
-        self.gauge_scheduler_waiting = make_per_engine(gauge_scheduler_waiting,
-                                                       engine_indexes,
-                                                       model_name)
+            labelnames=labelnames,
+        )
+        self.gauge_scheduler_waiting = make_per_engine(
+            gauge_scheduler_waiting, engine_indexes, model_name
+        )
 
         #
         # GPU cache
@@ -215,11 +218,14 @@ def __init__(self,
                 name="vllm:gpu_cache_usage_perc",
                 documentation=(
                     "GPU KV-cache usage. 1 means 100 percent usage."
-                    "DEPRECATED: Use vllm:kv_cache_usage_perc instead."),
+                    "DEPRECATED: Use vllm:kv_cache_usage_perc instead."
+                ),
                 multiprocess_mode="mostrecent",
-                labelnames=labelnames)
+                labelnames=labelnames,
+            )
             self.gauge_gpu_cache_usage = make_per_engine(
-                gauge_gpu_cache_usage, engine_indexes, model_name)
+                gauge_gpu_cache_usage, engine_indexes, model_name
+            )
 
         # Deprecated in 0.9.2 - Renamed as vllm:prefix_cache_queries
         # With 0.11.x you can enable with --show-hidden-metrics-for-version=0.10
@@ -231,9 +237,11 @@ def __init__(self,
                     "GPU prefix cache queries, in terms of number of queried"
                     "tokens. DEPRECATED: Use vllm:prefix_cache_queries instead."
                 ),
-                labelnames=labelnames)
+                labelnames=labelnames,
+            )
             self.counter_gpu_prefix_cache_queries = make_per_engine(
-                counter_gpu_prefix_cache_queries, engine_indexes, model_name)
+                counter_gpu_prefix_cache_queries, engine_indexes, model_name
+            )
 
         # Deprecated in 0.9.2 - Renamed as vllm:prefix_cache_hits
         # With 0.11.x you can enable with --show-hidden-metrics-for-version=0.10
@@ -243,33 +251,42 @@ def __init__(self,
                 name="vllm:gpu_prefix_cache_hits",
                 documentation=(
                     "GPU prefix cache hits, in terms of number of cached "
-                    "tokens. DEPRECATED: Use vllm:prefix_cache_hits instead."),
-                labelnames=labelnames)
+                    "tokens. DEPRECATED: Use vllm:prefix_cache_hits instead."
+                ),
+                labelnames=labelnames,
+            )
             self.counter_gpu_prefix_cache_hits = make_per_engine(
-                counter_gpu_prefix_cache_hits, engine_indexes, model_name)
+                counter_gpu_prefix_cache_hits, engine_indexes, model_name
+            )
 
         gauge_kv_cache_usage = self._gauge_cls(
             name="vllm:kv_cache_usage_perc",
             documentation="KV-cache usage. 1 means 100 percent usage.",
-            labelnames=labelnames)
-        self.gauge_kv_cache_usage = make_per_engine(gauge_kv_cache_usage,
-                                                    engine_indexes, model_name)
+            labelnames=labelnames,
+        )
+        self.gauge_kv_cache_usage = make_per_engine(
+            gauge_kv_cache_usage, engine_indexes, model_name
+        )
 
         counter_prefix_cache_queries = self._counter_cls(
             name="vllm:prefix_cache_queries",
             documentation=(
-                "Prefix cache queries, in terms of number of queried tokens."),
-            labelnames=labelnames)
+                "Prefix cache queries, in terms of number of queried tokens."
+            ),
+            labelnames=labelnames,
+        )
         self.counter_prefix_cache_queries = make_per_engine(
-            counter_prefix_cache_queries, engine_indexes, model_name)
+            counter_prefix_cache_queries, engine_indexes, model_name
+        )
 
         counter_prefix_cache_hits = self._counter_cls(
             name="vllm:prefix_cache_hits",
-            documentation=(
-                "Prefix cache hits, in terms of number of cached tokens."),
-            labelnames=labelnames)
+            documentation=("Prefix cache hits, in terms of number of cached tokens."),
+            labelnames=labelnames,
+        )
         self.counter_prefix_cache_hits = make_per_engine(
-            counter_prefix_cache_hits, engine_indexes, model_name)
+            counter_prefix_cache_hits, engine_indexes, model_name
+        )
 
         #
         # Counters
@@ -277,36 +294,43 @@ def __init__(self,
         counter_num_preempted_reqs = self._counter_cls(
             name="vllm:num_preemptions",
             documentation="Cumulative number of preemption from the engine.",
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.counter_num_preempted_reqs = make_per_engine(
-            counter_num_preempted_reqs, engine_indexes, model_name)
+            counter_num_preempted_reqs, engine_indexes, model_name
+        )
 
         counter_prompt_tokens = self._counter_cls(
             name="vllm:prompt_tokens",
             documentation="Number of prefill tokens processed.",
-            labelnames=labelnames)
-        self.counter_prompt_tokens = make_per_engine(counter_prompt_tokens,
-                                                     engine_indexes,
-                                                     model_name)
+            labelnames=labelnames,
+        )
+        self.counter_prompt_tokens = make_per_engine(
+            counter_prompt_tokens, engine_indexes, model_name
+        )
 
         counter_generation_tokens = self._counter_cls(
             name="vllm:generation_tokens",
             documentation="Number of generation tokens processed.",
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.counter_generation_tokens = make_per_engine(
-            counter_generation_tokens, engine_indexes, model_name)
+            counter_generation_tokens, engine_indexes, model_name
+        )
 
-        self.counter_request_success: dict[FinishReason, dict[
-            int, prometheus_client.Counter]] = {}
+        self.counter_request_success: dict[
+            FinishReason, dict[int, prometheus_client.Counter]
+        ] = {}
         counter_request_success_base = self._counter_cls(
             name="vllm:request_success",
             documentation="Count of successfully processed requests.",
-            labelnames=labelnames + ["finished_reason"])
+            labelnames=labelnames + ["finished_reason"],
+        )
         for reason in FinishReason:
             self.counter_request_success[reason] = {
-                idx:
-                counter_request_success_base.labels(model_name, str(idx),
-                                                    str(reason))
+                idx: counter_request_success_base.labels(
+                    model_name, str(idx), str(reason)
+                )
                 for idx in engine_indexes
             }
 
@@ -317,18 +341,21 @@ def __init__(self,
             name="vllm:request_prompt_tokens",
             documentation="Number of prefill tokens processed.",
             buckets=build_1_2_5_buckets(max_model_len),
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.histogram_num_prompt_tokens_request = make_per_engine(
-            histogram_num_prompt_tokens_request, engine_indexes, model_name)
+            histogram_num_prompt_tokens_request, engine_indexes, model_name
+        )
 
         histogram_num_generation_tokens_request = self._histogram_cls(
             name="vllm:request_generation_tokens",
             documentation="Number of generation tokens processed.",
             buckets=build_1_2_5_buckets(max_model_len),
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.histogram_num_generation_tokens_request = make_per_engine(
-            histogram_num_generation_tokens_request, engine_indexes,
-            model_name)
+            histogram_num_generation_tokens_request, engine_indexes, model_name
+        )
 
         # TODO: This metric might be incorrect in case of using multiple
         # api_server counts which uses prometheus mp.
@@ -336,38 +363,42 @@ def __init__(self,
         histogram_iteration_tokens = self._histogram_cls(
             name="vllm:iteration_tokens_total",
             documentation="Histogram of number of tokens per engine_step.",
-            buckets=[
-                1, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096, 8192, 16384
-            ],
-            labelnames=labelnames)
+            buckets=[1, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096, 8192, 16384],
+            labelnames=labelnames,
+        )
         self.histogram_iteration_tokens = make_per_engine(
-            histogram_iteration_tokens, engine_indexes, model_name)
+            histogram_iteration_tokens, engine_indexes, model_name
+        )
 
         histogram_max_num_generation_tokens_request = self._histogram_cls(
             name="vllm:request_max_num_generation_tokens",
-            documentation=
-            "Histogram of maximum number of requested generation tokens.",
+            documentation="Histogram of maximum number of requested generation tokens.",
             buckets=build_1_2_5_buckets(max_model_len),
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.histogram_max_num_generation_tokens_request = make_per_engine(
-            histogram_max_num_generation_tokens_request, engine_indexes,
-            model_name)
+            histogram_max_num_generation_tokens_request, engine_indexes, model_name
+        )
 
         histogram_n_request = self._histogram_cls(
             name="vllm:request_params_n",
             documentation="Histogram of the n request parameter.",
             buckets=[1, 2, 5, 10, 20],
-            labelnames=labelnames)
-        self.histogram_n_request = make_per_engine(histogram_n_request,
-                                                   engine_indexes, model_name)
+            labelnames=labelnames,
+        )
+        self.histogram_n_request = make_per_engine(
+            histogram_n_request, engine_indexes, model_name
+        )
 
         histogram_max_tokens_request = self._histogram_cls(
             name="vllm:request_params_max_tokens",
             documentation="Histogram of the max_tokens request parameter.",
             buckets=build_1_2_5_buckets(max_model_len),
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.histogram_max_tokens_request = make_per_engine(
-            histogram_max_tokens_request, engine_indexes, model_name)
+            histogram_max_tokens_request, engine_indexes, model_name
+        )
 
         #
         # Histogram of timing intervals
@@ -376,13 +407,34 @@ def __init__(self,
             name="vllm:time_to_first_token_seconds",
             documentation="Histogram of time to first token in seconds.",
             buckets=[
-                0.001, 0.005, 0.01, 0.02, 0.04, 0.06, 0.08, 0.1, 0.25, 0.5,
-                0.75, 1.0, 2.5, 5.0, 7.5, 10.0, 20.0, 40.0, 80.0, 160.0, 640.0,
-                2560.0
+                0.001,
+                0.005,
+                0.01,
+                0.02,
+                0.04,
+                0.06,
+                0.08,
+                0.1,
+                0.25,
+                0.5,
+                0.75,
+                1.0,
+                2.5,
+                5.0,
+                7.5,
+                10.0,
+                20.0,
+                40.0,
+                80.0,
+                160.0,
+                640.0,
+                2560.0,
             ],
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.histogram_time_to_first_token = make_per_engine(
-            histogram_time_to_first_token, engine_indexes, model_name)
+            histogram_time_to_first_token, engine_indexes, model_name
+        )
 
         # Deprecated in 0.11 - Renamed as vllm:inter_token_latency_seconds
         # TODO: in 0.12, only enable if show_hidden_metrics=True
@@ -390,86 +442,167 @@ def __init__(self,
             name="vllm:time_per_output_token_seconds",
             documentation=(
                 "Histogram of time per output token in seconds."
-                "DEPRECATED: Use vllm:inter_token_latency_seconds instead."),
+                "DEPRECATED: Use vllm:inter_token_latency_seconds instead."
+            ),
             buckets=[
-                0.01, 0.025, 0.05, 0.075, 0.1, 0.15, 0.2, 0.3, 0.4, 0.5, 0.75,
-                1.0, 2.5, 5.0, 7.5, 10.0, 20.0, 40.0, 80.0
+                0.01,
+                0.025,
+                0.05,
+                0.075,
+                0.1,
+                0.15,
+                0.2,
+                0.3,
+                0.4,
+                0.5,
+                0.75,
+                1.0,
+                2.5,
+                5.0,
+                7.5,
+                10.0,
+                20.0,
+                40.0,
+                80.0,
             ],
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.histogram_time_per_output_token = make_per_engine(
-            histogram_time_per_output_token, engine_indexes, model_name)
+            histogram_time_per_output_token, engine_indexes, model_name
+        )
 
         histogram_inter_token_latency = self._histogram_cls(
             name="vllm:inter_token_latency_seconds",
             documentation="Histogram of inter-token latency in seconds.",
             buckets=[
-                0.01, 0.025, 0.05, 0.075, 0.1, 0.15, 0.2, 0.3, 0.4, 0.5, 0.75,
-                1.0, 2.5, 5.0, 7.5, 10.0, 20.0, 40.0, 80.0
+                0.01,
+                0.025,
+                0.05,
+                0.075,
+                0.1,
+                0.15,
+                0.2,
+                0.3,
+                0.4,
+                0.5,
+                0.75,
+                1.0,
+                2.5,
+                5.0,
+                7.5,
+                10.0,
+                20.0,
+                40.0,
+                80.0,
             ],
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.histogram_inter_token_latency = make_per_engine(
-            histogram_inter_token_latency, engine_indexes, model_name)
+            histogram_inter_token_latency, engine_indexes, model_name
+        )
 
         histogram_request_time_per_output_token = self._histogram_cls(
             name="vllm:request_time_per_output_token_seconds",
-            documentation=
-            "Histogram of time_per_output_token_seconds per request.",
+            documentation="Histogram of time_per_output_token_seconds per request.",
             buckets=[
-                0.01, 0.025, 0.05, 0.075, 0.1, 0.15, 0.2, 0.3, 0.4, 0.5, 0.75,
-                1.0, 2.5, 5.0, 7.5, 10.0, 20.0, 40.0, 80.0
+                0.01,
+                0.025,
+                0.05,
+                0.075,
+                0.1,
+                0.15,
+                0.2,
+                0.3,
+                0.4,
+                0.5,
+                0.75,
+                1.0,
+                2.5,
+                5.0,
+                7.5,
+                10.0,
+                20.0,
+                40.0,
+                80.0,
             ],
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.histogram_request_time_per_output_token = make_per_engine(
-            histogram_request_time_per_output_token, engine_indexes,
-            model_name)
+            histogram_request_time_per_output_token, engine_indexes, model_name
+        )
 
         request_latency_buckets = [
-            0.3, 0.5, 0.8, 1.0, 1.5, 2.0, 2.5, 5.0, 10.0, 15.0, 20.0, 30.0,
-            40.0, 50.0, 60.0, 120.0, 240.0, 480.0, 960.0, 1920.0, 7680.0
+            0.3,
+            0.5,
+            0.8,
+            1.0,
+            1.5,
+            2.0,
+            2.5,
+            5.0,
+            10.0,
+            15.0,
+            20.0,
+            30.0,
+            40.0,
+            50.0,
+            60.0,
+            120.0,
+            240.0,
+            480.0,
+            960.0,
+            1920.0,
+            7680.0,
         ]
         histogram_e2e_time_request = self._histogram_cls(
             name="vllm:e2e_request_latency_seconds",
             documentation="Histogram of e2e request latency in seconds.",
             buckets=request_latency_buckets,
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.histogram_e2e_time_request = make_per_engine(
-            histogram_e2e_time_request, engine_indexes, model_name)
+            histogram_e2e_time_request, engine_indexes, model_name
+        )
 
         histogram_queue_time_request = self._histogram_cls(
             name="vllm:request_queue_time_seconds",
-            documentation=
-            "Histogram of time spent in WAITING phase for request.",
+            documentation="Histogram of time spent in WAITING phase for request.",
             buckets=request_latency_buckets,
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.histogram_queue_time_request = make_per_engine(
-            histogram_queue_time_request, engine_indexes, model_name)
+            histogram_queue_time_request, engine_indexes, model_name
+        )
 
         histogram_inference_time_request = self._histogram_cls(
             name="vllm:request_inference_time_seconds",
-            documentation=
-            "Histogram of time spent in RUNNING phase for request.",
+            documentation="Histogram of time spent in RUNNING phase for request.",
             buckets=request_latency_buckets,
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.histogram_inference_time_request = make_per_engine(
-            histogram_inference_time_request, engine_indexes, model_name)
+            histogram_inference_time_request, engine_indexes, model_name
+        )
 
         histogram_prefill_time_request = self._histogram_cls(
             name="vllm:request_prefill_time_seconds",
-            documentation=
-            "Histogram of time spent in PREFILL phase for request.",
+            documentation="Histogram of time spent in PREFILL phase for request.",
             buckets=request_latency_buckets,
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.histogram_prefill_time_request = make_per_engine(
-            histogram_prefill_time_request, engine_indexes, model_name)
+            histogram_prefill_time_request, engine_indexes, model_name
+        )
 
         histogram_decode_time_request = self._histogram_cls(
             name="vllm:request_decode_time_seconds",
-            documentation=
-            "Histogram of time spent in DECODE phase for request.",
+            documentation="Histogram of time spent in DECODE phase for request.",
             buckets=request_latency_buckets,
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.histogram_decode_time_request = make_per_engine(
-            histogram_decode_time_request, engine_indexes, model_name)
+            histogram_decode_time_request, engine_indexes, model_name
+        )
 
         #
         # LoRA metrics
@@ -480,23 +613,21 @@ def __init__(self,
         self.gauge_lora_info: Optional[prometheus_client.Gauge] = None
         if vllm_config.lora_config is not None:
             if len(self.engine_indexes) > 1:
-                raise NotImplementedError(
-                    "LoRA in DP mode is not supported yet.")
+                raise NotImplementedError("LoRA in DP mode is not supported yet.")
             self.labelname_max_lora = "max_lora"
             self.labelname_waiting_lora_adapters = "waiting_lora_adapters"
             self.labelname_running_lora_adapters = "running_lora_adapters"
             self.max_lora = vllm_config.lora_config.max_loras
-            self.gauge_lora_info = \
-                self._gauge_cls(
-                    name="vllm:lora_requests_info",
-                    documentation="Running stats on lora requests.",
-                    multiprocess_mode="sum",
-                    labelnames=[
-                        self.labelname_max_lora,
-                        self.labelname_waiting_lora_adapters,
-                        self.labelname_running_lora_adapters,
-                    ],
-                )
+            self.gauge_lora_info = self._gauge_cls(
+                name="vllm:lora_requests_info",
+                documentation="Running stats on lora requests.",
+                multiprocess_mode="sum",
+                labelnames=[
+                    self.labelname_max_lora,
+                    self.labelname_waiting_lora_adapters,
+                    self.labelname_running_lora_adapters,
+                ],
+            )
 
     def log_metrics_info(self, type: str, config_obj: SupportsMetricsInfo):
         metrics_info = config_obj.metrics_info()
@@ -522,54 +653,65 @@ def log_metrics_info(self, type: str, config_obj: SupportsMetricsInfo):
             metrics_info["engine"] = str(engine_index)
             info_gauge.labels(**metrics_info).set(1)
 
-    def record(self,
-               scheduler_stats: Optional[SchedulerStats],
-               iteration_stats: Optional[IterationStats],
-               engine_idx: int = 0):
+    def record(
+        self,
+        scheduler_stats: Optional[SchedulerStats],
+        iteration_stats: Optional[IterationStats],
+        engine_idx: int = 0,
+    ):
         """Log to prometheus."""
         if scheduler_stats is not None:
             self.gauge_scheduler_running[engine_idx].set(
-                scheduler_stats.num_running_reqs)
+                scheduler_stats.num_running_reqs
+            )
             self.gauge_scheduler_waiting[engine_idx].set(
-                scheduler_stats.num_waiting_reqs)
+                scheduler_stats.num_waiting_reqs
+            )
 
             if self.show_hidden_metrics:
                 self.gauge_gpu_cache_usage[engine_idx].set(
-                    scheduler_stats.kv_cache_usage)
-            self.gauge_kv_cache_usage[engine_idx].set(
-                scheduler_stats.kv_cache_usage)
+                    scheduler_stats.kv_cache_usage
+                )
+            self.gauge_kv_cache_usage[engine_idx].set(scheduler_stats.kv_cache_usage)
 
             if self.show_hidden_metrics:
                 self.counter_gpu_prefix_cache_queries[engine_idx].inc(
-                    scheduler_stats.prefix_cache_stats.queries)
+                    scheduler_stats.prefix_cache_stats.queries
+                )
                 self.counter_gpu_prefix_cache_hits[engine_idx].inc(
-                    scheduler_stats.prefix_cache_stats.hits)
+                    scheduler_stats.prefix_cache_stats.hits
+                )
 
             self.counter_prefix_cache_queries[engine_idx].inc(
-                scheduler_stats.prefix_cache_stats.queries)
+                scheduler_stats.prefix_cache_stats.queries
+            )
             self.counter_prefix_cache_hits[engine_idx].inc(
-                scheduler_stats.prefix_cache_stats.hits)
+                scheduler_stats.prefix_cache_stats.hits
+            )
 
             if scheduler_stats.spec_decoding_stats is not None:
                 self.spec_decoding_prom.observe(
-                    scheduler_stats.spec_decoding_stats, engine_idx)
+                    scheduler_stats.spec_decoding_stats, engine_idx
+                )
 
         if iteration_stats is None:
             return
 
         self.counter_num_preempted_reqs[engine_idx].inc(
-            iteration_stats.num_preempted_reqs)
-        self.counter_prompt_tokens[engine_idx].inc(
-            iteration_stats.num_prompt_tokens)
+            iteration_stats.num_preempted_reqs
+        )
+        self.counter_prompt_tokens[engine_idx].inc(iteration_stats.num_prompt_tokens)
         self.counter_generation_tokens[engine_idx].inc(
-            iteration_stats.num_generation_tokens)
+            iteration_stats.num_generation_tokens
+        )
         self.histogram_iteration_tokens[engine_idx].observe(
-            iteration_stats.num_prompt_tokens + \
-            iteration_stats.num_generation_tokens)
+            iteration_stats.num_prompt_tokens + iteration_stats.num_generation_tokens
+        )
 
         for max_gen_tokens in iteration_stats.max_num_generation_tokens_iter:
-            self.histogram_max_num_generation_tokens_request[
-                engine_idx].observe(max_gen_tokens)
+            self.histogram_max_num_generation_tokens_request[engine_idx].observe(
+                max_gen_tokens
+            )
         for n_param in iteration_stats.n_params_iter:
             self.histogram_n_request[engine_idx].observe(n_param)
         for ttft in iteration_stats.time_to_first_tokens_iter:
@@ -579,40 +721,51 @@ def record(self,
             self.histogram_time_per_output_token[engine_idx].observe(itl)
 
         for finished_request in iteration_stats.finished_requests:
-            self.counter_request_success[
-                finished_request.finish_reason][engine_idx].inc()
+            self.counter_request_success[finished_request.finish_reason][
+                engine_idx
+            ].inc()
             self.histogram_e2e_time_request[engine_idx].observe(
-                finished_request.e2e_latency)
+                finished_request.e2e_latency
+            )
             self.histogram_queue_time_request[engine_idx].observe(
-                finished_request.queued_time)
+                finished_request.queued_time
+            )
             self.histogram_prefill_time_request[engine_idx].observe(
-                finished_request.prefill_time)
+                finished_request.prefill_time
+            )
             self.histogram_inference_time_request[engine_idx].observe(
-                finished_request.inference_time)
+                finished_request.inference_time
+            )
             self.histogram_decode_time_request[engine_idx].observe(
-                finished_request.decode_time)
+                finished_request.decode_time
+            )
             self.histogram_num_prompt_tokens_request[engine_idx].observe(
-                finished_request.num_prompt_tokens)
+                finished_request.num_prompt_tokens
+            )
             self.histogram_num_generation_tokens_request[engine_idx].observe(
-                finished_request.num_generation_tokens)
+                finished_request.num_generation_tokens
+            )
             self.histogram_request_time_per_output_token[engine_idx].observe(
-                finished_request.mean_time_per_output_token)
+                finished_request.mean_time_per_output_token
+            )
             if finished_request.max_tokens_param:
                 self.histogram_max_tokens_request[engine_idx].observe(
-                    finished_request.max_tokens_param)
+                    finished_request.max_tokens_param
+                )
 
         if self.gauge_lora_info is not None:
-            running_lora_adapters = \
-                ",".join(iteration_stats.running_lora_adapters.keys())
-            waiting_lora_adapters = \
-                ",".join(iteration_stats.waiting_lora_adapters.keys())
+            running_lora_adapters = ",".join(
+                iteration_stats.running_lora_adapters.keys()
+            )
+            waiting_lora_adapters = ",".join(
+                iteration_stats.waiting_lora_adapters.keys()
+            )
             lora_info_labels = {
                 self.labelname_running_lora_adapters: running_lora_adapters,
                 self.labelname_waiting_lora_adapters: waiting_lora_adapters,
                 self.labelname_max_lora: self.max_lora,
             }
-            self.gauge_lora_info.labels(**lora_info_labels)\
-                                .set_to_current_time()
+            self.gauge_lora_info.labels(**lora_info_labels).set_to_current_time()
 
     def log_engine_initialized(self):
         self.log_metrics_info("cache_config", self.vllm_config.cache_config)
@@ -625,8 +778,9 @@ def log_engine_initialized(self):
 ]
 
 
-def make_per_engine(metric: PromMetric, engine_idxs: list[int],
-                    model_name: str) -> dict[int, PromMetric]:
+def make_per_engine(
+    metric: PromMetric, engine_idxs: list[int], model_name: str
+) -> dict[int, PromMetric]:
     return {idx: metric.labels(model_name, str(idx)) for idx in engine_idxs}
 
 
@@ -688,7 +842,8 @@ def __init__(
             if client_count > 1:
                 logger.warning(
                     "AsyncLLM created with api_server_count more than 1; "
-                    "disabling stats logging to avoid incomplete stats.")
+                    "disabling stats logging to avoid incomplete stats."
+                )
             else:
                 factories.append(LoggingStatLogger)
 
@@ -700,12 +855,12 @@ def __init__(
             for logger_factory in factories:
                 # If we get a custom prometheus logger, use that
                 # instead. This is typically used for the ray case.
-                if (isinstance(logger_factory, type)
-                        and issubclass(logger_factory, PrometheusStatLogger)):
+                if isinstance(logger_factory, type) and issubclass(
+                    logger_factory, PrometheusStatLogger
+                ):
                     prometheus_factory = logger_factory
                     continue
-                loggers.append(logger_factory(vllm_config,
-                                              engine_idx))  # type: ignore
+                loggers.append(logger_factory(vllm_config, engine_idx))  # type: ignore
             self.per_engine_logger_dict[engine_idx] = loggers
 
         # For Prometheus, need to share the metrics between EngineCores.
@@ -725,8 +880,7 @@ def record(
         for logger in per_engine_loggers:
             logger.record(scheduler_stats, iteration_stats, engine_idx)
 
-        self.prometheus_logger.record(scheduler_stats, iteration_stats,
-                                      engine_idx)
+        self.prometheus_logger.record(scheduler_stats, iteration_stats, engine_idx)
 
     def log(self):
         for per_engine_loggers in self.per_engine_logger_dict.values():
diff --git a/vllm/v1/metrics/prometheus.py b/vllm/v1/metrics/prometheus.py
index a43cf9ce255e..5823737968f9 100644
--- a/vllm/v1/metrics/prometheus.py
+++ b/vllm/v1/metrics/prometheus.py
@@ -16,9 +16,7 @@
 
 
 def setup_multiprocess_prometheus():
-    """Set up prometheus multiprocessing directory if not already configured.
-    
-    """
+    """Set up prometheus multiprocessing directory if not already configured."""
     global _prometheus_multiproc_dir
 
     if "PROMETHEUS_MULTIPROC_DIR" not in os.environ:
@@ -27,19 +25,22 @@ def setup_multiprocess_prometheus():
         # cleaned up upon exit.
         _prometheus_multiproc_dir = tempfile.TemporaryDirectory()
         os.environ["PROMETHEUS_MULTIPROC_DIR"] = _prometheus_multiproc_dir.name
-        logger.debug("Created PROMETHEUS_MULTIPROC_DIR at %s",
-                     _prometheus_multiproc_dir.name)
+        logger.debug(
+            "Created PROMETHEUS_MULTIPROC_DIR at %s", _prometheus_multiproc_dir.name
+        )
     else:
-        logger.warning("Found PROMETHEUS_MULTIPROC_DIR was set by user. "
-                       "This directory must be wiped between vLLM runs or "
-                       "you will find inaccurate metrics. Unset the variable "
-                       "and vLLM will properly handle cleanup.")
+        logger.warning(
+            "Found PROMETHEUS_MULTIPROC_DIR was set by user. "
+            "This directory must be wiped between vLLM runs or "
+            "you will find inaccurate metrics. Unset the variable "
+            "and vLLM will properly handle cleanup."
+        )
 
 
 def get_prometheus_registry() -> CollectorRegistry:
-    """Get the appropriate prometheus registry based on multiprocessing 
+    """Get the appropriate prometheus registry based on multiprocessing
     configuration.
-    
+
     Returns:
         Registry: A prometheus registry
     """
@@ -54,11 +55,11 @@ def get_prometheus_registry() -> CollectorRegistry:
 
 def unregister_vllm_metrics():
     """Unregister any existing vLLM collectors from the prometheus registry.
-    
+
     This is useful for testing and CI/CD where metrics may be registered
     multiple times across test runs.
-    
-    Also, in case of multiprocess, we need to unregister the metrics from the 
+
+    Also, in case of multiprocess, we need to unregister the metrics from the
     global registry.
     """
     registry = REGISTRY
diff --git a/vllm/v1/metrics/ray_wrappers.py b/vllm/v1/metrics/ray_wrappers.py
index 609185753860..a6fe2062f70c 100644
--- a/vllm/v1/metrics/ray_wrappers.py
+++ b/vllm/v1/metrics/ray_wrappers.py
@@ -15,11 +15,9 @@
 
 
 class RayPrometheusMetric:
-
     def __init__(self):
         if ray_metrics is None:
-            raise ImportError(
-                "RayPrometheusMetric requires Ray to be installed.")
+            raise ImportError("RayPrometheusMetric requires Ray to be installed.")
 
         self.metric: Metric = None
 
@@ -38,15 +36,14 @@ def labels(self, *labels, **labelskwargs):
                     f"Expected {len(self.metric._tag_keys)}, got {len(labels)}"
                 )
 
-            self.metric.set_default_tags(
-                dict(zip(self.metric._tag_keys, labels)))
+            self.metric.set_default_tags(dict(zip(self.metric._tag_keys, labels)))
 
         return self
 
     @staticmethod
     def _get_sanitized_opentelemetry_name(name: str) -> str:
         """
-        For compatibility with Ray + OpenTelemetry, the metric name must be 
+        For compatibility with Ray + OpenTelemetry, the metric name must be
         sanitized. In particular, this replaces disallowed character (e.g., ':')
         with '_' in the metric name.
         Allowed characters: a-z, A-Z, 0-9, _
@@ -63,21 +60,22 @@ class RayGaugeWrapper(RayPrometheusMetric):
     """Wraps around ray.util.metrics.Gauge to provide same API as
     prometheus_client.Gauge"""
 
-    def __init__(self,
-                 name: str,
-                 documentation: Optional[str] = "",
-                 labelnames: Optional[list[str]] = None,
-                 multiprocess_mode: Optional[str] = ""):
-
+    def __init__(
+        self,
+        name: str,
+        documentation: Optional[str] = "",
+        labelnames: Optional[list[str]] = None,
+        multiprocess_mode: Optional[str] = "",
+    ):
         # All Ray metrics are keyed by WorkerId, so multiprocess modes like
         # "mostrecent", "all", "sum" do not apply. This logic can be manually
         # implemented at the observability layer (Prometheus/Grafana).
         del multiprocess_mode
         labelnames_tuple = tuple(labelnames) if labelnames else None
         name = self._get_sanitized_opentelemetry_name(name)
-        self.metric = ray_metrics.Gauge(name=name,
-                                        description=documentation,
-                                        tag_keys=labelnames_tuple)
+        self.metric = ray_metrics.Gauge(
+            name=name, description=documentation, tag_keys=labelnames_tuple
+        )
 
     def set(self, value: Union[int, float]):
         return self.metric.set(value)
@@ -91,15 +89,17 @@ class RayCounterWrapper(RayPrometheusMetric):
     """Wraps around ray.util.metrics.Counter to provide same API as
     prometheus_client.Counter"""
 
-    def __init__(self,
-                 name: str,
-                 documentation: Optional[str] = "",
-                 labelnames: Optional[list[str]] = None):
+    def __init__(
+        self,
+        name: str,
+        documentation: Optional[str] = "",
+        labelnames: Optional[list[str]] = None,
+    ):
         labelnames_tuple = tuple(labelnames) if labelnames else None
         name = self._get_sanitized_opentelemetry_name(name)
-        self.metric = ray_metrics.Counter(name=name,
-                                          description=documentation,
-                                          tag_keys=labelnames_tuple)
+        self.metric = ray_metrics.Counter(
+            name=name, description=documentation, tag_keys=labelnames_tuple
+        )
 
     def inc(self, value: Union[int, float] = 1.0):
         if value == 0:
@@ -111,18 +111,22 @@ class RayHistogramWrapper(RayPrometheusMetric):
     """Wraps around ray.util.metrics.Histogram to provide same API as
     prometheus_client.Histogram"""
 
-    def __init__(self,
-                 name: str,
-                 documentation: Optional[str] = "",
-                 labelnames: Optional[list[str]] = None,
-                 buckets: Optional[list[float]] = None):
+    def __init__(
+        self,
+        name: str,
+        documentation: Optional[str] = "",
+        labelnames: Optional[list[str]] = None,
+        buckets: Optional[list[float]] = None,
+    ):
         labelnames_tuple = tuple(labelnames) if labelnames else None
         name = self._get_sanitized_opentelemetry_name(name)
         boundaries = buckets if buckets else []
-        self.metric = ray_metrics.Histogram(name=name,
-                                            description=documentation,
-                                            tag_keys=labelnames_tuple,
-                                            boundaries=boundaries)
+        self.metric = ray_metrics.Histogram(
+            name=name,
+            description=documentation,
+            tag_keys=labelnames_tuple,
+            boundaries=boundaries,
+        )
 
     def observe(self, value: Union[int, float]):
         return self.metric.observe(value)
diff --git a/vllm/v1/metrics/reader.py b/vllm/v1/metrics/reader.py
index 4d6e59984154..5d50fa9461d0 100644
--- a/vllm/v1/metrics/reader.py
+++ b/vllm/v1/metrics/reader.py
@@ -17,6 +17,7 @@ class Metric:
     in some cases a single vLLM instance may have multiple
     metrics with the same name but different sets of labels.
     """
+
     name: str
     labels: dict[str, str]
 
@@ -24,6 +25,7 @@ class Metric:
 @dataclass
 class Counter(Metric):
     """A monotonically increasing integer counter."""
+
     value: int
 
 
@@ -34,12 +36,14 @@ class Vector(Metric):
     This type - which doesn't exist in Prometheus - models one very
     specific metric, vllm:spec_decode_num_accepted_tokens_per_pos.
     """
+
     values: list[int]
 
 
 @dataclass
 class Gauge(Metric):
     """A numerical value that can go up or down."""
+
     value: float
 
 
@@ -58,6 +62,7 @@ class Histogram(Metric):
     The sum property is the total sum of all observed
     values.
     """
+
     count: int
     sum: float
     buckets: dict[str, int]
@@ -87,7 +92,8 @@ def get_metrics_snapshot() -> list[Metric]:
             samples = _get_samples(metric)
             for s in samples:
                 collected.append(
-                    Gauge(name=metric.name, labels=s.labels, value=s.value))
+                    Gauge(name=metric.name, labels=s.labels, value=s.value)
+                )
         elif metric.type == "counter":
             samples = _get_samples(metric, "_total")
             if metric.name == "vllm:spec_decode_num_accepted_tokens_per_pos":
@@ -99,16 +105,15 @@ def get_metrics_snapshot() -> list[Metric]:
                 # accepted tokens using a Counter labeled with 'position'.
                 # We convert these into a vector of integer values.
                 #
-                for labels, values in _digest_num_accepted_by_pos_samples(
-                        samples):
+                for labels, values in _digest_num_accepted_by_pos_samples(samples):
                     collected.append(
-                        Vector(name=metric.name, labels=labels, values=values))
+                        Vector(name=metric.name, labels=labels, values=values)
+                    )
             else:
                 for s in samples:
                     collected.append(
-                        Counter(name=metric.name,
-                                labels=s.labels,
-                                value=int(s.value)))
+                        Counter(name=metric.name, labels=s.labels, value=int(s.value))
+                    )
 
         elif metric.type == "histogram":
             #
@@ -122,21 +127,24 @@ def get_metrics_snapshot() -> list[Metric]:
             count_samples = _get_samples(metric, "_count")
             sum_samples = _get_samples(metric, "_sum")
             for labels, buckets, count_value, sum_value in _digest_histogram(
-                    bucket_samples, count_samples, sum_samples):
+                bucket_samples, count_samples, sum_samples
+            ):
                 collected.append(
-                    Histogram(name=metric.name,
-                              labels=labels,
-                              buckets=buckets,
-                              count=count_value,
-                              sum=sum_value))
+                    Histogram(
+                        name=metric.name,
+                        labels=labels,
+                        buckets=buckets,
+                        count=count_value,
+                        sum=sum_value,
+                    )
+                )
         else:
             raise AssertionError(f"Unknown metric type {metric.type}")
 
     return collected
 
 
-def _get_samples(metric: PromMetric,
-                 suffix: Optional[str] = None) -> list[Sample]:
+def _get_samples(metric: PromMetric, suffix: Optional[str] = None) -> list[Sample]:
     name = (metric.name + suffix) if suffix is not None else metric.name
     return [s for s in metric.samples if s.name == name]
 
@@ -148,8 +156,7 @@ def _strip_label(labels: dict[str, str], key_to_remove: str) -> dict[str, str]:
 
 
 def _digest_histogram(
-    bucket_samples: list[Sample], count_samples: list[Sample],
-    sum_samples: list[Sample]
+    bucket_samples: list[Sample], count_samples: list[Sample], sum_samples: list[Sample]
 ) -> list[tuple[dict[str, str], dict[str, int], int, float]]:
     #
     # In the case of DP, we have an indigestable
@@ -192,20 +199,25 @@ def _digest_histogram(
         labels_key = frozenset(s.labels.items())
         sums_by_labels[labels_key] = s.value
 
-    assert set(buckets_by_labels.keys()) == set(
-        counts_by_labels.keys()) == set(sums_by_labels.keys())
+    assert (
+        set(buckets_by_labels.keys())
+        == set(counts_by_labels.keys())
+        == set(sums_by_labels.keys())
+    )
 
     output = []
     label_keys = list(buckets_by_labels.keys())
     for k in label_keys:
         labels = dict(k)
-        output.append((labels, buckets_by_labels[k], counts_by_labels[k],
-                       sums_by_labels[k]))
+        output.append(
+            (labels, buckets_by_labels[k], counts_by_labels[k], sums_by_labels[k])
+        )
     return output
 
 
 def _digest_num_accepted_by_pos_samples(
-        samples: list[Sample]) -> list[tuple[dict[str, str], list[int]]]:
+    samples: list[Sample],
+) -> list[tuple[dict[str, str], list[int]]]:
     #
     # In the case of DP, we have an indigestable
     # per-position-per-engine count as a list of
diff --git a/vllm/v1/metrics/stats.py b/vllm/v1/metrics/stats.py
index 489b8da5c04e..5564718d5165 100644
--- a/vllm/v1/metrics/stats.py
+++ b/vllm/v1/metrics/stats.py
@@ -15,6 +15,7 @@
 @dataclass
 class PrefixCacheStats:
     """Stores prefix cache hit statistics."""
+
     # Whether reset_prefix_cache was invoked.
     reset: bool = False
     # The number of new requests in this update.
@@ -45,8 +46,7 @@ class SchedulerStats:
 
     kv_cache_usage: float = 0.0
 
-    prefix_cache_stats: PrefixCacheStats = field(
-        default_factory=PrefixCacheStats)
+    prefix_cache_stats: PrefixCacheStats = field(default_factory=PrefixCacheStats)
 
     spec_decoding_stats: Optional[SpecDecodingStats] = None
     kv_connector_stats: Optional[dict[str, Any]] = None
@@ -112,18 +112,22 @@ def __init__(self):
         self.running_lora_adapters: dict[str, int] = {}
 
     def __repr__(self) -> str:
-        field_to_value_str = ", ".join(f"{k}={v}"
-                                       for k, v in vars(self).items())
+        field_to_value_str = ", ".join(f"{k}={v}" for k, v in vars(self).items())
         return f"{self.__class__.__name__}({field_to_value_str})"
 
     def _time_since(self, start: float) -> float:
         """Calculate an interval relative to this iteration's timestamp."""
         return self.iteration_timestamp - start
 
-    def update_from_output(self, output: "EngineCoreOutput",
-                           engine_core_timestamp: float, is_prefilling: bool,
-                           prompt_len: int, req_stats: RequestStateStats,
-                           lora_stats: Optional[LoRAStats]):
+    def update_from_output(
+        self,
+        output: "EngineCoreOutput",
+        engine_core_timestamp: float,
+        is_prefilling: bool,
+        prompt_len: int,
+        req_stats: RequestStateStats,
+        lora_stats: Optional[LoRAStats],
+    ):
         num_new_generation_tokens = len(output.new_token_ids)
 
         self.num_generation_tokens += num_new_generation_tokens
@@ -138,8 +142,9 @@ def update_from_output(self, output: "EngineCoreOutput",
 
         # Process request-level engine core events
         if output.events is not None:
-            self.update_from_events(output.request_id, output.events,
-                                    is_prefilling, req_stats, lora_stats)
+            self.update_from_events(
+                output.request_id, output.events, is_prefilling, req_stats, lora_stats
+            )
 
         # Process the batch-level "new tokens" engine core event
         if is_prefilling:
@@ -150,11 +155,17 @@ def update_from_output(self, output: "EngineCoreOutput",
 
         req_stats.last_token_ts = engine_core_timestamp
 
-    def update_from_events(self, req_id: str, events: list["EngineCoreEvent"],
-                           is_prefilling: bool, req_stats: RequestStateStats,
-                           lora_stats: Optional[LoRAStats]):
+    def update_from_events(
+        self,
+        req_id: str,
+        events: list["EngineCoreEvent"],
+        is_prefilling: bool,
+        req_stats: RequestStateStats,
+        lora_stats: Optional[LoRAStats],
+    ):
         # Avoid circular dependency
         from vllm.v1.engine import EngineCoreEventType
+
         for event in events:
             if event.type == EngineCoreEventType.QUEUED:
                 req_stats.queued_ts = event.timestamp
@@ -168,10 +179,13 @@ def update_from_events(self, req_id: str, events: list["EngineCoreEvent"],
                 self.num_preempted_reqs += 1
                 LoRARequestStates.preempted_request(lora_stats, req_id)
 
-    def update_from_finished_request(self, finish_reason: "FinishReason",
-                                     num_prompt_tokens: int,
-                                     max_tokens_param: Optional[int],
-                                     req_stats: RequestStateStats):
+    def update_from_finished_request(
+        self,
+        finish_reason: "FinishReason",
+        num_prompt_tokens: int,
+        max_tokens_param: Optional[int],
+        req_stats: RequestStateStats,
+    ):
         e2e_latency = self._time_since(req_stats.arrival_time)
 
         # Queued interval is from first QUEUED event to first SCHEDULED
@@ -190,22 +204,24 @@ def update_from_finished_request(self, finish_reason: "FinishReason",
         inference_time = req_stats.last_token_ts - req_stats.scheduled_ts
 
         # Do not count the token generated by the prefill phase
-        mean_time_per_output_token = (decode_time /
-                                      (req_stats.num_generation_tokens - 1)
-                                      if req_stats.num_generation_tokens -
-                                      1 > 0 else 0)
-
-        finished_req = \
-            FinishedRequestStats(finish_reason=finish_reason,
-                                 e2e_latency=e2e_latency,
-                                 num_prompt_tokens=num_prompt_tokens,
-                                 num_generation_tokens=req_stats.num_generation_tokens,
-                                 max_tokens_param=max_tokens_param,
-                                 queued_time=queued_time,
-                                 prefill_time=prefill_time,
-                                 inference_time=inference_time,
-                                 decode_time=decode_time,
-                                 mean_time_per_output_token=mean_time_per_output_token)
+        mean_time_per_output_token = (
+            decode_time / (req_stats.num_generation_tokens - 1)
+            if req_stats.num_generation_tokens - 1 > 0
+            else 0
+        )
+
+        finished_req = FinishedRequestStats(
+            finish_reason=finish_reason,
+            e2e_latency=e2e_latency,
+            num_prompt_tokens=num_prompt_tokens,
+            num_generation_tokens=req_stats.num_generation_tokens,
+            max_tokens_param=max_tokens_param,
+            queued_time=queued_time,
+            prefill_time=prefill_time,
+            inference_time=inference_time,
+            decode_time=decode_time,
+            mean_time_per_output_token=mean_time_per_output_token,
+        )
         self.finished_requests.append(finished_req)
 
 
@@ -215,24 +231,24 @@ class LoRARequestStates:
     def __init__(self):
         self.lora_name_to_stats: dict[str, LoRAStats] = {}
 
-    def get_stats(self, req_state: 'RequestState') -> Optional[LoRAStats]:
+    def get_stats(self, req_state: "RequestState") -> Optional[LoRAStats]:
         if req_state.lora_name is None:
             return None
         if req_state.lora_name not in self.lora_name_to_stats:
             self.lora_name_to_stats[req_state.lora_name] = LoRAStats()
         return self.lora_name_to_stats[req_state.lora_name]
 
-    def add_request(self, req_state: 'RequestState'):
+    def add_request(self, req_state: "RequestState"):
         if (lora_stats := self.get_stats(req_state)) is not None:
             lora_stats.waiting_requests.add(req_state.request_id)
 
-    def finish_request(self, req_state: 'RequestState'):
+    def finish_request(self, req_state: "RequestState"):
         if req_state.lora_name is None:
             return
         lora_stats = self.lora_name_to_stats[req_state.lora_name]
         lora_stats.running_requests.remove(req_state.request_id)
 
-    def abort_request(self, req_state: 'RequestState'):
+    def abort_request(self, req_state: "RequestState"):
         if req_state.lora_name is None:
             return
         lora_stats = self.lora_name_to_stats[req_state.lora_name]
@@ -255,14 +271,15 @@ def preempted_request(lora_stats: Optional[LoRAStats], request_id: str):
         lora_stats.running_requests.remove(request_id)
         lora_stats.waiting_requests.add(request_id)
 
-    def update_iteration_stats(self,
-                               iteration_stats: Optional[IterationStats]):
+    def update_iteration_stats(self, iteration_stats: Optional[IterationStats]):
         if iteration_stats is None:
             return
         for lora_name, stats in self.lora_name_to_stats.items():
             if stats.waiting_requests:
-                iteration_stats.waiting_lora_adapters[lora_name] = \
-                    len(stats.waiting_requests)
+                iteration_stats.waiting_lora_adapters[lora_name] = len(
+                    stats.waiting_requests
+                )
             if stats.running_requests:
-                iteration_stats.running_lora_adapters[lora_name] = \
-                    len(stats.running_requests)
+                iteration_stats.running_lora_adapters[lora_name] = len(
+                    stats.running_requests
+                )
diff --git a/vllm/v1/outputs.py b/vllm/v1/outputs.py
index d15cdf365962..d647b207575c 100644
--- a/vllm/v1/outputs.py
+++ b/vllm/v1/outputs.py
@@ -8,12 +8,10 @@
 import torch
 
 if TYPE_CHECKING:
-    from vllm.distributed.kv_transfer.kv_connector.v1.metrics import (
-        KVConnectorStats)
+    from vllm.distributed.kv_transfer.kv_connector.v1.metrics import KVConnectorStats
 
 
 class LogprobsLists(NamedTuple):
-
     # [num_reqs, max_num_logprobs + 1]
     logprob_token_ids: list[list[int]]
     # [num_reqs, max_num_logprobs + 1]
@@ -30,7 +28,6 @@ def slice(self, start: int, end: int):
 
 
 class LogprobsTensors(NamedTuple):
-
     # [num_reqs, max_num_logprobs + 1]
     logprob_token_ids: torch.Tensor
     # [num_reqs, max_num_logprobs + 1]
@@ -46,18 +43,18 @@ def tolists(self):
         )
 
     @staticmethod
-    def empty_cpu(num_positions: int,
-                  num_tokens_per_position: int) -> "LogprobsTensors":
+    def empty_cpu(
+        num_positions: int, num_tokens_per_position: int
+    ) -> "LogprobsTensors":
         """Create empty LogprobsTensors on CPU."""
 
         logprob_token_ids = torch.empty(
-            (num_positions, num_tokens_per_position),
-            dtype=torch.int32,
-            device="cpu")
+            (num_positions, num_tokens_per_position), dtype=torch.int32, device="cpu"
+        )
         logprobs = torch.empty_like(logprob_token_ids, dtype=torch.float32)
-        selected_token_ranks = torch.empty(num_positions,
-                                           dtype=torch.int32,
-                                           device="cpu")
+        selected_token_ranks = torch.empty(
+            num_positions, dtype=torch.int32, device="cpu"
+        )
         return LogprobsTensors(
             logprob_token_ids=logprob_token_ids,
             logprobs=logprobs,
@@ -72,7 +69,6 @@ def empty_cpu(num_positions: int,
 
 @dataclass
 class SamplerOutput:
-
     # [num_reqs, max_num_generated_tokens]
     # Different requests can have different number of generated tokens.
     # All requests are padded to max_num_generated_tokens.
@@ -92,15 +88,18 @@ class KVConnectorOutput:
     invalid_block_ids: set[int] = field(default_factory=set)
 
     def is_empty(self):
-        return (not self.finished_sending and not self.finished_recving
-                and not self.kv_connector_stats and not self.invalid_block_ids)
+        return (
+            not self.finished_sending
+            and not self.finished_recving
+            and not self.kv_connector_stats
+            and not self.invalid_block_ids
+        )
 
 
 # ModelRunnerOutput is serialized and sent to the scheduler process.
 # This is expensive for torch.Tensor so prefer to use list instead.
 @dataclass
 class ModelRunnerOutput:
-
     # [num_reqs]
     req_ids: list[str]
     # req_id -> index
@@ -134,11 +133,10 @@ class ModelRunnerOutput:
 
 # ModelRunnerOutput wrapper for async scheduling.
 class AsyncModelRunnerOutput(ABC):
-
     @abstractmethod
     def get_output(self) -> ModelRunnerOutput:
         """Get the ModelRunnerOutput for this async output.
-        
+
         This is a blocking call that waits until the results are ready, which
         might involve copying device tensors to the host.
         This method should only be called once per AsyncModelRunnerOutput.
@@ -148,17 +146,18 @@ def get_output(self) -> ModelRunnerOutput:
 
 @dataclass
 class DraftTokenIds:
-
     # [num_reqs]
     req_ids: list[str]
     # num_reqs x num_draft_tokens
     draft_token_ids: list[list[int]]
 
 
-EMPTY_MODEL_RUNNER_OUTPUT = ModelRunnerOutput(req_ids=[],
-                                              req_id_to_index={},
-                                              sampled_token_ids=[],
-                                              logprobs=None,
-                                              prompt_logprobs_dict={},
-                                              pooler_output=[],
-                                              num_nans_in_logits=None)
+EMPTY_MODEL_RUNNER_OUTPUT = ModelRunnerOutput(
+    req_ids=[],
+    req_id_to_index={},
+    sampled_token_ids=[],
+    logprobs=None,
+    prompt_logprobs_dict={},
+    pooler_output=[],
+    num_nans_in_logits=None,
+)
diff --git a/vllm/v1/pool/metadata.py b/vllm/v1/pool/metadata.py
index 46506d272e90..36ae5b40a313 100644
--- a/vllm/v1/pool/metadata.py
+++ b/vllm/v1/pool/metadata.py
@@ -29,13 +29,13 @@ def __getitem__(self, indices: slice):
         )
 
     def is_partial_prefill(self):
-        return not torch.all(
-            self.prompt_lens_cpu == self.num_scheduled_tokens_cpu)
+        return not torch.all(self.prompt_lens_cpu == self.num_scheduled_tokens_cpu)
 
 
 @dataclass
 class PoolingMetadata:
     """Tensors for pooling."""
+
     prompt_lens: torch.Tensor  # CPU Tensor
     prompt_token_ids: Optional[torch.Tensor]
     pooling_params: list[PoolingParams]
@@ -44,34 +44,40 @@ class PoolingMetadata:
     def __getitem__(self, indices: slice):
         return PoolingMetadata(
             prompt_lens=self.prompt_lens[indices],
-            prompt_token_ids=None if self.prompt_token_ids is None else
-            self.prompt_token_ids[indices],
+            prompt_token_ids=None
+            if self.prompt_token_ids is None
+            else self.prompt_token_ids[indices],
             pooling_params=self.pooling_params[indices],
             pooling_cursor=None
-            if self.pooling_cursor is None else self.pooling_cursor[indices],
+            if self.pooling_cursor is None
+            else self.pooling_cursor[indices],
         )
 
-    def build_pooling_cursor(self, num_scheduled_tokens: list[int],
-                             device: torch.device):
-        self.pooling_cursor = build_pooling_cursor(num_scheduled_tokens,
-                                                   self.prompt_lens, device)
+    def build_pooling_cursor(
+        self, num_scheduled_tokens: list[int], device: torch.device
+    ):
+        self.pooling_cursor = build_pooling_cursor(
+            num_scheduled_tokens, self.prompt_lens, device
+        )
 
 
-def build_pooling_cursor(num_scheduled_tokens: list[int],
-                         prompt_lens: torch.Tensor, device: torch.device):
+def build_pooling_cursor(
+    num_scheduled_tokens: list[int], prompt_lens: torch.Tensor, device: torch.device
+):
     assert len(prompt_lens) == len(num_scheduled_tokens)
 
     n_seq = len(num_scheduled_tokens)
     index = list(range(n_seq))
     num_scheduled_tokens = torch.tensor(num_scheduled_tokens, device="cpu")
-    cumsum = torch.zeros(n_seq + 1,
-                         dtype=torch.int64,
-                         pin_memory=pin_memory,
-                         device="cpu")
+    cumsum = torch.zeros(
+        n_seq + 1, dtype=torch.int64, pin_memory=pin_memory, device="cpu"
+    )
     torch.cumsum(num_scheduled_tokens, dim=0, out=cumsum[1:])
     cumsum = cumsum.to(device, non_blocking=True)
-    return PoolingCursor(index=index,
-                         first_token_indices_gpu=cumsum[:n_seq],
-                         last_token_indices_gpu=cumsum[1:] - 1,
-                         prompt_lens_cpu=prompt_lens,
-                         num_scheduled_tokens_cpu=num_scheduled_tokens)
+    return PoolingCursor(
+        index=index,
+        first_token_indices_gpu=cumsum[:n_seq],
+        last_token_indices_gpu=cumsum[1:] - 1,
+        prompt_lens_cpu=prompt_lens,
+        num_scheduled_tokens_cpu=num_scheduled_tokens,
+    )
diff --git a/vllm/v1/request.py b/vllm/v1/request.py
index dd0aea645d74..ac6e583099bc 100644
--- a/vllm/v1/request.py
+++ b/vllm/v1/request.py
@@ -13,8 +13,12 @@
 from vllm.pooling_params import PoolingParams
 from vllm.sampling_params import SamplingParams
 from vllm.utils import length_from_prompt_token_ids_or_embeds
-from vllm.v1.engine import (EngineCoreEvent, EngineCoreEventType,
-                            EngineCoreRequest, FinishReason)
+from vllm.v1.engine import (
+    EngineCoreEvent,
+    EngineCoreEventType,
+    EngineCoreRequest,
+    FinishReason,
+)
 from vllm.v1.structured_output.request import StructuredOutputRequest
 from vllm.v1.utils import ConstantList
 
@@ -24,7 +28,6 @@
 
 
 class Request:
-
     def __init__(
         self,
         request_id: str,
@@ -41,8 +44,7 @@ def __init__(
         cache_salt: Optional[str] = None,
         priority: int = 0,
         trace_headers: Optional[Mapping[str, str]] = None,
-        block_hasher: Optional[Callable[["Request"],
-                                        list["BlockHash"]]] = None,
+        block_hasher: Optional[Callable[["Request"], list["BlockHash"]]] = None,
     ) -> None:
         self.request_id = request_id
         self.client_index = client_index
@@ -53,8 +55,7 @@ def __init__(
         self.eos_token_id = eos_token_id
         self.lora_request = lora_request
         self.structured_output_request = structured_output_request
-        self.arrival_time = arrival_time if arrival_time is not None else \
-            time.time()
+        self.arrival_time = arrival_time if arrival_time is not None else time.time()
 
         self.status = RequestStatus.WAITING
         self.use_structured_output = False
@@ -76,20 +77,23 @@ def __init__(
                 self.use_structured_output = True
 
             if sampling_params.extra_args is not None:
-                self.kv_transfer_params = \
-                    sampling_params.extra_args.get("kv_transfer_params")
+                self.kv_transfer_params = sampling_params.extra_args.get(
+                    "kv_transfer_params"
+                )
         else:
-            raise ValueError(
-                "sampling_params and pooling_params can't both be unset")
+            raise ValueError("sampling_params and pooling_params can't both be unset")
 
         self.prompt_token_ids = prompt_token_ids
         self.prompt_embeds = prompt_embeds
         self.num_prompt_tokens = length_from_prompt_token_ids_or_embeds(
-            prompt_token_ids, prompt_embeds)
+            prompt_token_ids, prompt_embeds
+        )
         self._output_token_ids: list[int] = []
-        self._all_token_ids: list[int] = self.prompt_token_ids.copy(
-        ) if self.prompt_token_ids is not None else [0
-                                                     ] * self.num_prompt_tokens
+        self._all_token_ids: list[int] = (
+            self.prompt_token_ids.copy()
+            if self.prompt_token_ids is not None
+            else [0] * self.num_prompt_tokens
+        )
         self.num_output_placeholders = 0  # Used in async scheduling.
         self.spec_token_ids: list[int] = []
         self.num_computed_tokens = 0
@@ -119,16 +123,16 @@ def __init__(
         self.num_preemptions = 0
 
         self.block_hashes: list[BlockHash] = []
-        self.get_hash_new_full_blocks: Optional[Callable[
-            [], list[BlockHash]]] = None
+        self.get_hash_new_full_blocks: Optional[Callable[[], list[BlockHash]]] = None
         if block_hasher is not None:
             self.get_hash_new_full_blocks = partial(block_hasher, self)
             self.block_hashes = self.get_hash_new_full_blocks()
 
     @classmethod
     def from_engine_core_request(
-        cls, request: EngineCoreRequest,
-        block_hasher: Optional[Callable[["Request"], list["BlockHash"]]]
+        cls,
+        request: EngineCoreRequest,
+        block_hasher: Optional[Callable[["Request"], list["BlockHash"]]],
     ) -> "Request":
         return cls(
             request_id=request.request_id,
@@ -142,8 +146,10 @@ def from_engine_core_request(
             arrival_time=request.arrival_time,
             lora_request=request.lora_request,
             structured_output_request=StructuredOutputRequest(
-                sampling_params=request.sampling_params) \
-                    if request.sampling_params else None,
+                sampling_params=request.sampling_params
+            )
+            if request.sampling_params
+            else None,
             cache_salt=request.cache_salt,
             priority=request.priority,
             trace_headers=request.trace_headers,
@@ -207,6 +213,7 @@ def take_events(self) -> Optional[list[EngineCoreEvent]]:
 
 class RequestStatus(enum.IntEnum):
     """Status of a request."""
+
     WAITING = enum.auto()
     WAITING_FOR_FSM = enum.auto()
     WAITING_FOR_REMOTE_KVS = enum.auto()
@@ -227,8 +234,7 @@ def is_finished(status: "RequestStatus") -> bool:
         return status > RequestStatus.PREEMPTED
 
     @staticmethod
-    def get_finished_reason(
-            status: "RequestStatus") -> Union[FinishReason, None]:
+    def get_finished_reason(status: "RequestStatus") -> Union[FinishReason, None]:
         return _FINISHED_REASON_MAP.get(status)
 
 
diff --git a/vllm/v1/sample/logits_processor/__init__.py b/vllm/v1/sample/logits_processor/__init__.py
index 10cad5b53071..98c4d8bad02d 100644
--- a/vllm/v1/sample/logits_processor/__init__.py
+++ b/vllm/v1/sample/logits_processor/__init__.py
@@ -13,15 +13,18 @@
 from vllm.logger import init_logger
 from vllm.logits_process import LogitsProcessor as RequestLogitsProcessor
 from vllm.sampling_params import SamplingParams
-from vllm.v1.sample.logits_processor.builtin import (LogitBiasLogitsProcessor,
-                                                     MinPLogitsProcessor,
-                                                     MinTokensLogitsProcessor,
-                                                     process_dict_updates)
-from vllm.v1.sample.logits_processor.interface import (BatchUpdate,
-                                                       LogitsProcessor,
-                                                       MoveDirectionality)
-from vllm.v1.sample.logits_processor.state import (BatchUpdateBuilder,
-                                                   LogitsProcessors)
+from vllm.v1.sample.logits_processor.builtin import (
+    LogitBiasLogitsProcessor,
+    MinPLogitsProcessor,
+    MinTokensLogitsProcessor,
+    process_dict_updates,
+)
+from vllm.v1.sample.logits_processor.interface import (
+    BatchUpdate,
+    LogitsProcessor,
+    MoveDirectionality,
+)
+from vllm.v1.sample.logits_processor.state import BatchUpdateBuilder, LogitsProcessors
 
 if TYPE_CHECKING:
     from vllm.config import VllmConfig
@@ -30,10 +33,11 @@
 
 # Error message when the user tries to initialize vLLM with a pooling model
 # and custom logitsproces
-STR_POOLING_REJECTS_LOGITSPROCS = ("Pooling models do not support custom"
-                                   " logits processors.")
+STR_POOLING_REJECTS_LOGITSPROCS = (
+    "Pooling models do not support custom logits processors."
+)
 
-LOGITSPROCS_GROUP = 'vllm.logits_processors'
+LOGITSPROCS_GROUP = "vllm.logits_processors"
 
 BUILTIN_LOGITS_PROCESSORS: list[type[LogitsProcessor]] = [
     MinTokensLogitsProcessor,
@@ -54,27 +58,29 @@ def _load_logitsprocs_plugins() -> list[type[LogitsProcessor]]:
 
     installed_logitsprocs_plugins = entry_points(group=LOGITSPROCS_GROUP)
     if len(installed_logitsprocs_plugins) == 0:
-        logger.debug("No logitsprocs plugins installed (group %s).",
-                     LOGITSPROCS_GROUP)
+        logger.debug("No logitsprocs plugins installed (group %s).", LOGITSPROCS_GROUP)
         return []
 
     # Load logitsprocs plugins
-    logger.debug("Loading installed logitsprocs plugins (group %s):",
-                 LOGITSPROCS_GROUP)
+    logger.debug("Loading installed logitsprocs plugins (group %s):", LOGITSPROCS_GROUP)
     classes: list[type[LogitsProcessor]] = []
     for entrypoint in installed_logitsprocs_plugins:
         try:
-            logger.debug("- Loading logitproc plugin entrypoint=%s target=%s",
-                         entrypoint.name, entrypoint.value)
+            logger.debug(
+                "- Loading logitproc plugin entrypoint=%s target=%s",
+                entrypoint.name,
+                entrypoint.value,
+            )
             classes.append(entrypoint.load())
         except Exception as e:
             raise RuntimeError(
-                f"Failed to load LogitsProcessor plugin {entrypoint}") from e
+                f"Failed to load LogitsProcessor plugin {entrypoint}"
+            ) from e
     return classes
 
 
 def _load_logitsprocs_by_fqcns(
-    logits_processors: Optional[Sequence[Union[str, type[LogitsProcessor]]]]
+    logits_processors: Optional[Sequence[Union[str, type[LogitsProcessor]]]],
 ) -> list[type[LogitsProcessor]]:
     """Load logit processor types, identifying them by fully-qualified class
     names (FQCNs).
@@ -99,13 +105,14 @@ def _load_logitsprocs_by_fqcns(
 
     logger.debug(
         "%s additional custom logits processors specified, checking whether "
-        "they need to be loaded.", len(logits_processors))
+        "they need to be loaded.",
+        len(logits_processors),
+    )
 
     classes: list[type[LogitsProcessor]] = []
     for ldx, logitproc in enumerate(logits_processors):
         if isinstance(logitproc, type):
-            logger.debug(" - Already-loaded logit processor: %s",
-                         logitproc.__name__)
+            logger.debug(" - Already-loaded logit processor: %s", logitproc.__name__)
             if not issubclass(logitproc, LogitsProcessor):
                 raise ValueError(
                     f"{logitproc.__name__} is not a subclass of LogitsProcessor"
@@ -131,8 +138,7 @@ def _load_logitsprocs_by_fqcns(
         if not isinstance(obj, type):
             raise ValueError("Loaded logit processor must be a type.")
         if not issubclass(obj, LogitsProcessor):
-            raise ValueError(
-                f"{obj.__name__} must be a subclass of LogitsProcessor")
+            raise ValueError(f"{obj.__name__} must be a subclass of LogitsProcessor")
         classes.append(obj)
 
     return classes
@@ -155,13 +161,13 @@ def _load_custom_logitsprocs(
       A list of all loaded logitproc types
     """
     from vllm.platforms import current_platform
+
     if current_platform.is_tpu():
         # No logitsprocs specified by caller
         # TODO(andy) - vLLM V1 on TPU does not support custom logitsprocs
         return []
 
-    return (_load_logitsprocs_plugins() +
-            _load_logitsprocs_by_fqcns(logits_processors))
+    return _load_logitsprocs_plugins() + _load_logitsprocs_by_fqcns(logits_processors)
 
 
 def build_logitsprocs(
@@ -174,23 +180,28 @@ def build_logitsprocs(
     if is_pooling_model:
         if custom_logitsprocs:
             raise ValueError(STR_POOLING_REJECTS_LOGITSPROCS)
-        logger.debug("Skipping logits processor loading because pooling models"
-                     " do not support logits processors.")
+        logger.debug(
+            "Skipping logits processor loading because pooling models"
+            " do not support logits processors."
+        )
         return LogitsProcessors()
     custom_logitsprocs_classes = _load_custom_logitsprocs(custom_logitsprocs)
     return LogitsProcessors(
-        ctor(vllm_config, device, is_pin_memory) for ctor in itertools.chain(
-            BUILTIN_LOGITS_PROCESSORS, custom_logitsprocs_classes))
+        ctor(vllm_config, device, is_pin_memory)
+        for ctor in itertools.chain(
+            BUILTIN_LOGITS_PROCESSORS, custom_logitsprocs_classes
+        )
+    )
 
 
 class AdapterLogitsProcessor(LogitsProcessor):
     """Wrapper for per-request logits processors
-    
+
     To wrap a specific per-request logits processor,
     * Subclass `AdapterLogitsProcessor`
     * Implement `self.is_argmax_invariant()` base-class method
     * Implement `self.new_req_logits_processor(params)`
-    
+
     `self.__init__(vllm_config, device, is_pin_memory)` does not need to be
     overridden in general. However, to implement custom constructor behavior -
     especially any logic which operates on or stores `vllm_config`, `device`,
@@ -199,8 +210,9 @@ class AdapterLogitsProcessor(LogitsProcessor):
     `super().__init__(vllm_config, device, is_pin_memory)`
     """
 
-    def __init__(self, vllm_config: "VllmConfig", device: torch.device,
-                 is_pin_memory: bool):
+    def __init__(
+        self, vllm_config: "VllmConfig", device: torch.device, is_pin_memory: bool
+    ):
         """Subclass must invoke
         `super().__init__(vllm_config, device, is_pin_memory)`.
 
@@ -236,7 +248,7 @@ def new_req_logits_processor(
         Returns:
           None if logits processor should not be applied to request; otherwise
           returns a `RequestLogitsProcessor` instance
-        
+
         """
         raise NotImplementedError
 
@@ -257,11 +269,14 @@ def _new_state(
 
         Returns:
           logits processor partial[Tensor] or None
-        
+
         """
         if req_lp := self.new_req_logits_processor(params):
-            args = [prompt_ids, output_ids] if (len(
-                inspect.signature(req_lp).parameters) == 3) else [output_ids]
+            args = (
+                [prompt_ids, output_ids]
+                if (len(inspect.signature(req_lp).parameters) == 3)
+                else [output_ids]
+            )
             return partial(req_lp, *args)
         return None
 
@@ -286,9 +301,16 @@ def apply(self, logits: torch.Tensor) -> torch.Tensor:
 
 
 __all__ = [
-    "LogitsProcessor", "LogitBiasLogitsProcessor", "MinPLogitsProcessor",
-    "MinTokensLogitsProcessor", "BatchUpdate", "BatchUpdateBuilder",
-    "MoveDirectionality", "LogitsProcessors", "build_logitsprocs",
-    "STR_POOLING_REJECTS_LOGITSPROCS", "LOGITSPROCS_GROUP",
-    "AdapterLogitsProcessor"
+    "LogitsProcessor",
+    "LogitBiasLogitsProcessor",
+    "MinPLogitsProcessor",
+    "MinTokensLogitsProcessor",
+    "BatchUpdate",
+    "BatchUpdateBuilder",
+    "MoveDirectionality",
+    "LogitsProcessors",
+    "build_logitsprocs",
+    "STR_POOLING_REJECTS_LOGITSPROCS",
+    "LOGITSPROCS_GROUP",
+    "AdapterLogitsProcessor",
 ]
diff --git a/vllm/v1/sample/logits_processor/builtin.py b/vllm/v1/sample/logits_processor/builtin.py
index fc655d993cb4..3c3ddda7fb3e 100644
--- a/vllm/v1/sample/logits_processor/builtin.py
+++ b/vllm/v1/sample/logits_processor/builtin.py
@@ -6,9 +6,11 @@
 import torch
 
 from vllm import SamplingParams
-from vllm.v1.sample.logits_processor.interface import (BatchUpdate,
-                                                       LogitsProcessor,
-                                                       MoveDirectionality)
+from vllm.v1.sample.logits_processor.interface import (
+    BatchUpdate,
+    LogitsProcessor,
+    MoveDirectionality,
+)
 
 if TYPE_CHECKING:
     from vllm.config import VllmConfig
@@ -17,25 +19,24 @@
 
 
 class MinPLogitsProcessor(LogitsProcessor):
-
-    def __init__(self, vllm_config: "VllmConfig", device: torch.device,
-                 is_pin_memory: bool):
+    def __init__(
+        self, vllm_config: "VllmConfig", device: torch.device, is_pin_memory: bool
+    ):
         max_num_reqs = vllm_config.scheduler_config.max_num_seqs
         self.min_p_count: int = 0
 
-        self.min_p_cpu_tensor = torch.zeros((max_num_reqs, ),
-                                            dtype=torch.float32,
-                                            device="cpu",
-                                            pin_memory=is_pin_memory)
+        self.min_p_cpu_tensor = torch.zeros(
+            (max_num_reqs,), dtype=torch.float32, device="cpu", pin_memory=is_pin_memory
+        )
         self.min_p_cpu = self.min_p_cpu_tensor.numpy()
 
         self.use_double_tensor = torch.device(device).type != "cpu"
 
         if self.use_double_tensor:
             # Pre-allocated device tensor
-            self.min_p_device: torch.Tensor = torch.empty((max_num_reqs, ),
-                                                          dtype=torch.float32,
-                                                          device=device)
+            self.min_p_device: torch.Tensor = torch.empty(
+                (max_num_reqs,), dtype=torch.float32, device=device
+            )
         else:
             self.min_p_device = self.min_p_cpu_tensor
         # Current slice of the device tensor
@@ -93,8 +94,7 @@ def update_state(self, batch_update: Optional[BatchUpdate]):
         if self.min_p_count and (needs_update or self.min_p.shape[0] != size):
             self.min_p = self.min_p_device[:size]
             if self.use_double_tensor:
-                self.min_p.copy_(self.min_p_cpu_tensor[:size],
-                                 non_blocking=True)
+                self.min_p.copy_(self.min_p_cpu_tensor[:size], non_blocking=True)
             self.min_p.unsqueeze_(1)
 
     def apply(self, logits: torch.Tensor) -> torch.Tensor:
@@ -104,28 +104,27 @@ def apply(self, logits: torch.Tensor) -> torch.Tensor:
         # Convert logits to probability distribution
         probability_values = torch.nn.functional.softmax(logits, dim=-1)
         # Calculate maximum probabilities per sequence
-        max_probabilities = torch.amax(probability_values,
-                                       dim=-1,
-                                       keepdim=True)
+        max_probabilities = torch.amax(probability_values, dim=-1, keepdim=True)
         # Adjust min_p
         adjusted_min_p = max_probabilities.mul_(self.min_p)
         # Identify valid tokens using threshold comparison
         invalid_token_mask = probability_values < adjusted_min_p
         # Apply mask using boolean indexing
-        logits[invalid_token_mask] = -float('inf')
+        logits[invalid_token_mask] = -float("inf")
         return logits
 
 
 class LogitBiasLogitsProcessor(LogitsProcessor):
-
     def __init__(self, _, device: torch.device, is_pin_memory: bool):
         self.device = device
         self.pin_memory = is_pin_memory
         self.biases: dict[int, dict[int, float]] = {}
 
         self.bias_tensor: torch.Tensor = torch.tensor(())
-        self.logits_slice = (self._device_tensor([], torch.int32),
-                             self._device_tensor([], torch.int32))
+        self.logits_slice = (
+            self._device_tensor([], torch.int32),
+            self._device_tensor([], torch.int32),
+        )
 
     def is_argmax_invariant(self) -> bool:
         """Logit bias can rebalance token probabilities and change the
@@ -134,8 +133,8 @@ def is_argmax_invariant(self) -> bool:
 
     def update_state(self, batch_update: Optional[BatchUpdate]):
         needs_update = process_dict_updates(
-            self.biases, batch_update,
-            lambda params, _, __: params.logit_bias or None)
+            self.biases, batch_update, lambda params, _, __: params.logit_bias or None
+        )
 
         # Update tensors if needed.
         if needs_update:
@@ -148,15 +147,15 @@ def update_state(self, batch_update: Optional[BatchUpdate]):
                 biases.extend(lb.values())
 
             self.bias_tensor = self._device_tensor(biases, torch.float32)
-            self.logits_slice = (self._device_tensor(reqs, torch.int32),
-                                 self._device_tensor(tok_ids, torch.int32))
+            self.logits_slice = (
+                self._device_tensor(reqs, torch.int32),
+                self._device_tensor(tok_ids, torch.int32),
+            )
 
     def _device_tensor(self, data: list, dtype: torch.dtype) -> torch.Tensor:
-        return (torch.tensor(data,
-                             device="cpu",
-                             dtype=dtype,
-                             pin_memory=self.pin_memory).to(device=self.device,
-                                                            non_blocking=True))
+        return torch.tensor(
+            data, device="cpu", dtype=dtype, pin_memory=self.pin_memory
+        ).to(device=self.device, non_blocking=True)
 
     def apply(self, logits: torch.Tensor) -> torch.Tensor:
         if self.biases:
@@ -165,20 +164,19 @@ def apply(self, logits: torch.Tensor) -> torch.Tensor:
 
 
 class MinTokensLogitsProcessor(LogitsProcessor):
-
-    def __init__(self, vllm_config: "VllmConfig", device: torch.device,
-                 is_pin_memory: bool):
+    def __init__(
+        self, vllm_config: "VllmConfig", device: torch.device, is_pin_memory: bool
+    ):
         # index -> (min_toks, output_token_ids, stop_token_ids)
         self.device = device
         self.pin_memory = is_pin_memory
         self.min_toks: dict[int, tuple[int, Sequence[int], set[int]]] = {}
 
         # (req_idx_tensor,eos_tok_id_tensor)
-        self.logits_slice: tuple[torch.Tensor,
-                                 torch.Tensor] = (self._device_tensor(
-                                     [], torch.int32),
-                                                  self._device_tensor(
-                                                      [], torch.int32))
+        self.logits_slice: tuple[torch.Tensor, torch.Tensor] = (
+            self._device_tensor([], torch.int32),
+            self._device_tensor([], torch.int32),
+        )
 
     def is_argmax_invariant(self) -> bool:
         """By censoring stop tokens, min-tokens can change the outcome
@@ -187,8 +185,7 @@ def is_argmax_invariant(self) -> bool:
 
     @staticmethod
     def add_request(
-        params: SamplingParams, _: Optional[list[int]],
-        output_tok_ids: list[int]
+        params: SamplingParams, _: Optional[list[int]], output_tok_ids: list[int]
     ) -> Optional[tuple[int, Sequence[int], set[int]]]:
         min_tokens = params.min_tokens
         if not min_tokens or len(output_tok_ids) >= min_tokens:
@@ -196,13 +193,16 @@ def add_request(
         return min_tokens, output_tok_ids, params.all_stop_token_ids
 
     def update_state(self, batch_update: Optional[BatchUpdate]):
-        needs_update = process_dict_updates(self.min_toks, batch_update,
-                                            self.add_request)
+        needs_update = process_dict_updates(
+            self.min_toks, batch_update, self.add_request
+        )
         if self.min_toks:
             # Check for any requests that have attained their min tokens.
-            to_remove = tuple(index for index, (min_toks, out_tok_ids,
-                                                _) in self.min_toks.items()
-                              if len(out_tok_ids) >= min_toks)
+            to_remove = tuple(
+                index
+                for index, (min_toks, out_tok_ids, _) in self.min_toks.items()
+                if len(out_tok_ids) >= min_toks
+            )
             if to_remove:
                 needs_update = True
                 for index in to_remove:
@@ -216,15 +216,15 @@ def update_state(self, batch_update: Optional[BatchUpdate]):
                 reqs.extend([req] * len(stop_tok_ids))
                 tok_ids.extend(stop_tok_ids)
 
-            self.logits_slice = (self._device_tensor(reqs, torch.int32),
-                                 self._device_tensor(tok_ids, torch.int32))
+            self.logits_slice = (
+                self._device_tensor(reqs, torch.int32),
+                self._device_tensor(tok_ids, torch.int32),
+            )
 
     def _device_tensor(self, data: list, dtype: torch.dtype) -> torch.Tensor:
-        return (torch.tensor(data,
-                             device="cpu",
-                             dtype=dtype,
-                             pin_memory=self.pin_memory).to(device=self.device,
-                                                            non_blocking=True))
+        return torch.tensor(
+            data, device="cpu", dtype=dtype, pin_memory=self.pin_memory
+        ).to(device=self.device, non_blocking=True)
 
     def apply(self, logits: torch.Tensor) -> torch.Tensor:
         if self.min_toks:
@@ -234,9 +234,9 @@ def apply(self, logits: torch.Tensor) -> torch.Tensor:
 
 
 def process_dict_updates(
-    req_entries: dict[int, T], batch_update: Optional[BatchUpdate],
-    new_state: Callable[[SamplingParams, Optional[list[int]], list[int]],
-                        Optional[T]]
+    req_entries: dict[int, T],
+    batch_update: Optional[BatchUpdate],
+    new_state: Callable[[SamplingParams, Optional[list[int]], list[int]], Optional[T]],
 ) -> bool:
     """Utility function to update dict state for sparse LogitsProcessors."""
 
@@ -246,8 +246,7 @@ def process_dict_updates(
 
     updated = False
     for index, params, prompt_tok_ids, output_tok_ids in batch_update.added:
-        if (state := new_state(params, prompt_tok_ids,
-                               output_tok_ids)) is not None:
+        if (state := new_state(params, prompt_tok_ids, output_tok_ids)) is not None:
             req_entries[index] = state
             updated = True
         elif req_entries.pop(index, None) is not None:
diff --git a/vllm/v1/sample/logits_processor/interface.py b/vllm/v1/sample/logits_processor/interface.py
index a84afc2f347a..713bd21d3855 100644
--- a/vllm/v1/sample/logits_processor/interface.py
+++ b/vllm/v1/sample/logits_processor/interface.py
@@ -36,6 +36,7 @@ class MoveDirectionality(Enum):
 @dataclass(frozen=True)
 class BatchUpdate:
     """Persistent batch state change info for logitsprocs"""
+
     batch_size: int  # Current num reqs in batch
 
     # Metadata for requests added to, removed from, and moved
@@ -57,10 +58,10 @@ class BatchUpdate:
 
 
 class LogitsProcessor(ABC):
-
     @abstractmethod
-    def __init__(self, vllm_config: "VllmConfig", device: torch.device,
-                 is_pin_memory: bool) -> None:
+    def __init__(
+        self, vllm_config: "VllmConfig", device: torch.device, is_pin_memory: bool
+    ) -> None:
         raise NotImplementedError
 
     @abstractmethod
diff --git a/vllm/v1/sample/logits_processor/state.py b/vllm/v1/sample/logits_processor/state.py
index 0a1196559d3e..a601f6641581 100644
--- a/vllm/v1/sample/logits_processor/state.py
+++ b/vllm/v1/sample/logits_processor/state.py
@@ -4,10 +4,12 @@
 from itertools import chain
 from typing import TYPE_CHECKING, Optional
 
-from vllm.v1.sample.logits_processor.interface import (AddedRequest,
-                                                       BatchUpdate,
-                                                       MovedRequest,
-                                                       RemovedRequest)
+from vllm.v1.sample.logits_processor.interface import (
+    AddedRequest,
+    BatchUpdate,
+    MovedRequest,
+    RemovedRequest,
+)
 
 if TYPE_CHECKING:
     from vllm.v1.sample.logits_processor.interface import LogitsProcessor
@@ -81,8 +83,9 @@ def removed_append(self, index: int) -> None:
           index: request index
         """
         if self._is_removed_sorted:
-            raise RuntimeError("Cannot register new removed request after"
-                               " self.removed has been read.")
+            raise RuntimeError(
+                "Cannot register new removed request after self.removed has been read."
+            )
         self._removed.append(index)
         self.batch_changed = True
 
@@ -116,7 +119,7 @@ def reset(self) -> bool:
     def get_and_reset(self, batch_size: int) -> Optional[BatchUpdate]:
         """Generate a logitsprocs batch update data structure and reset
         internal batch update builder state.
-        
+
         Args:
           batch_size: current persistent batch size
 
@@ -146,14 +149,17 @@ class LogitsProcessors:
     """Encapsulates initialized logitsproc objects."""
 
     def __init__(
-            self,
-            logitsprocs: Optional[Iterator["LogitsProcessor"]] = None) -> None:
+        self, logitsprocs: Optional[Iterator["LogitsProcessor"]] = None
+    ) -> None:
         self.argmax_invariant: list[LogitsProcessor] = []
         self.non_argmax_invariant: list[LogitsProcessor] = []
         if logitsprocs:
             for logitproc in logitsprocs:
-                (self.argmax_invariant if logitproc.is_argmax_invariant() else
-                 self.non_argmax_invariant).append(logitproc)
+                (
+                    self.argmax_invariant
+                    if logitproc.is_argmax_invariant()
+                    else self.non_argmax_invariant
+                ).append(logitproc)
 
     @property
     def all(self) -> Iterator["LogitsProcessor"]:
diff --git a/vllm/v1/sample/metadata.py b/vllm/v1/sample/metadata.py
index 9d6a87cea3d0..14895db1bd55 100644
--- a/vllm/v1/sample/metadata.py
+++ b/vllm/v1/sample/metadata.py
@@ -11,7 +11,6 @@
 
 @dataclass
 class SamplingMetadata:
-
     temperature: Optional[torch.Tensor]
     all_greedy: bool
     all_random: bool
diff --git a/vllm/v1/sample/ops/bad_words.py b/vllm/v1/sample/ops/bad_words.py
index 1b699565f26f..25cbb2619e85 100644
--- a/vllm/v1/sample/ops/bad_words.py
+++ b/vllm/v1/sample/ops/bad_words.py
@@ -35,5 +35,4 @@ def apply_bad_words(
     past_tokens_ids: list[list[int]],
 ) -> None:
     for i, bad_words_ids in bad_words_token_ids.items():
-        _apply_bad_words_single_batch(logits[i], bad_words_ids,
-                                      past_tokens_ids[i])
+        _apply_bad_words_single_batch(logits[i], bad_words_ids, past_tokens_ids[i])
diff --git a/vllm/v1/sample/ops/logprobs.py b/vllm/v1/sample/ops/logprobs.py
index 82875b7c8452..cf36d46e13fd 100644
--- a/vllm/v1/sample/ops/logprobs.py
+++ b/vllm/v1/sample/ops/logprobs.py
@@ -8,8 +8,7 @@
 
 
 @torch.compile(dynamic=True, backend=current_platform.simple_compile_backend)
-def batched_count_greater_than(x: torch.Tensor,
-                               values: torch.Tensor) -> torch.Tensor:
+def batched_count_greater_than(x: torch.Tensor, values: torch.Tensor) -> torch.Tensor:
     """
     Counts elements in each row of x that are greater than the corresponding
     value in values.  Use torch.compile to generate an optimized kernel for
diff --git a/vllm/v1/sample/ops/penalties.py b/vllm/v1/sample/ops/penalties.py
index 5d54f6679a1a..e49b8db47800 100644
--- a/vllm/v1/sample/ops/penalties.py
+++ b/vllm/v1/sample/ops/penalties.py
@@ -19,15 +19,20 @@ def apply_all_penalties(
     Applies presence, frequency and repetition penalties to the logits.
     """
     _, vocab_size = logits.shape
-    output_tokens_t = _convert_to_tensors(output_token_ids, vocab_size,
-                                          logits.device)
-    return apply_penalties(logits, prompt_token_ids, output_tokens_t,
-                           presence_penalties, frequency_penalties,
-                           repetition_penalties)
+    output_tokens_t = _convert_to_tensors(output_token_ids, vocab_size, logits.device)
+    return apply_penalties(
+        logits,
+        prompt_token_ids,
+        output_tokens_t,
+        presence_penalties,
+        frequency_penalties,
+        repetition_penalties,
+    )
 
 
-def _convert_to_tensors(output_token_ids: list[list[int]], vocab_size: int,
-                        device: torch.device) -> torch.Tensor:
+def _convert_to_tensors(
+    output_token_ids: list[list[int]], vocab_size: int, device: torch.device
+) -> torch.Tensor:
     """
     Convert the different list data structures to tensors.
     """
diff --git a/vllm/v1/sample/ops/topk_topp_sampler.py b/vllm/v1/sample/ops/topk_topp_sampler.py
index 5bcf1b585441..dbcdad07e4de 100644
--- a/vllm/v1/sample/ops/topk_topp_sampler.py
+++ b/vllm/v1/sample/ops/topk_topp_sampler.py
@@ -16,6 +16,7 @@
 
 try:
     import flashinfer.sampling
+
     is_flashinfer_available = True
 except ImportError:
     is_flashinfer_available = False
@@ -34,14 +35,17 @@ def __init__(self, logprobs_mode: LogprobsMode = "raw_logprobs") -> None:
         self.logprobs_mode = logprobs_mode
         # flashinfer optimization does not apply if intermediate
         # logprobs/logits after top_k/top_p need to be returned
-        if logprobs_mode not in ("processed_logits", "processed_logprobs"
-                                 ) and current_platform.is_cuda():
+        if (
+            logprobs_mode not in ("processed_logits", "processed_logprobs")
+            and current_platform.is_cuda()
+        ):
             if is_flashinfer_available:
                 flashinfer_version = flashinfer.__version__
                 if version.parse(flashinfer_version) < version.parse("0.2.3"):
                     logger.warning_once(
                         "FlashInfer version >= 0.2.3 required. "
-                        "Falling back to default sampling implementation.")
+                        "Falling back to default sampling implementation."
+                    )
                     self.forward = self.forward_native
                 elif envs.VLLM_USE_FLASHINFER_SAMPLER is not False:
                     # NOTE(woosuk): The V0 sampler doesn't use FlashInfer for
@@ -52,21 +56,22 @@ def __init__(self, logprobs_mode: LogprobsMode = "raw_logprobs") -> None:
                     # None means False, while in V1, None means True. This is
                     # why we use the condition
                     # `envs.VLLM_USE_FLASHINFER_SAMPLER is not False` here.
-                    logger.info_once(
-                        "Using FlashInfer for top-p & top-k sampling.")
+                    logger.info_once("Using FlashInfer for top-p & top-k sampling.")
                     self.forward = self.forward_cuda
                 else:
                     logger.warning_once(
                         "FlashInfer is available, but it is not enabled. "
                         "Falling back to the PyTorch-native implementation of "
                         "top-p & top-k sampling. For the best performance, "
-                        "please set VLLM_USE_FLASHINFER_SAMPLER=1.")
+                        "please set VLLM_USE_FLASHINFER_SAMPLER=1."
+                    )
                     self.forward = self.forward_native
             else:
                 logger.warning_once(
                     "FlashInfer is not available. Falling back to the PyTorch-"
                     "native implementation of top-p & top-k sampling. For the "
-                    "best performance, please install FlashInfer.")
+                    "best performance, please install FlashInfer."
+                )
                 self.forward = self.forward_native
         elif current_platform.is_cpu():
             self.forward = self.forward_cpu
@@ -109,13 +114,15 @@ def forward_cuda(
         # CPU-GPU synchronization while `flashinfer_sample` does.
         if (k is None and p is None) or generators:
             if generators:
-                logger.debug_once("FlashInfer 0.2.3+ does not support "
-                                  "per-request generators. Falling back to "
-                                  "PyTorch-native implementation.")
+                logger.debug_once(
+                    "FlashInfer 0.2.3+ does not support "
+                    "per-request generators. Falling back to "
+                    "PyTorch-native implementation."
+                )
             return self.forward_native(logits, generators, k, p)
-        assert self.logprobs_mode not in (
-            "processed_logits", "processed_logprobs"
-        ), "FlashInfer does not support returning logits/logprobs"
+        assert self.logprobs_mode not in ("processed_logits", "processed_logprobs"), (
+            "FlashInfer does not support returning logits/logprobs"
+        )
         # flashinfer sampling functions expect contiguous logits.
         # In flex_attn/triton_attn fp32 inference, logits can be non-contiguous
         # because of slicing operation in logits_processor.
@@ -278,15 +285,18 @@ def flashinfer_sample(
         # Top-p only.
         probs = logits.softmax(dim=-1, dtype=torch.float32)
         next_token_ids = flashinfer.sampling.top_p_sampling_from_probs(
-            probs, p, deterministic=True)
+            probs, p, deterministic=True
+        )
     elif p is None:
         # Top-k only.
         probs = logits.softmax(dim=-1, dtype=torch.float32)
         next_token_ids = flashinfer.sampling.top_k_sampling_from_probs(
-            probs, k, deterministic=True)
+            probs, k, deterministic=True
+        )
     else:
         # Both top-k and top-p.
         next_token_ids = flashinfer.sampling.top_k_top_p_sampling_from_logits(
-            logits, k, p, deterministic=True)
+            logits, k, p, deterministic=True
+        )
 
     return next_token_ids.view(-1)
diff --git a/vllm/v1/sample/rejection_sampler.py b/vllm/v1/sample/rejection_sampler.py
index 37ce5bef8403..ec9366aa25e8 100644
--- a/vllm/v1/sample/rejection_sampler.py
+++ b/vllm/v1/sample/rejection_sampler.py
@@ -54,7 +54,7 @@ def forward(
         bonus_token_ids: torch.Tensor,
         sampling_metadata: SamplingMetadata,
     ) -> torch.Tensor:
-        '''
+        """
         Args:
             metadata:
                 Metadata for spec decoding.
@@ -81,7 +81,7 @@ def forward(
         Returns:
             output_token_ids (torch.Tensor):
                 A tensor containing the final output token IDs.
-        '''
+        """
         assert metadata.max_spec_len <= MAX_SPEC_LEN
         # [num_tokens, vocab_size]
         # NOTE(woosuk): `target_logits` can be updated in place inside the
@@ -123,11 +123,11 @@ def parse_output(
         """
         output_token_ids_np = output_token_ids.cpu().numpy()
         # Create mask for valid tokens.
-        valid_mask = ((output_token_ids_np != PLACEHOLDER_TOKEN_ID) &
-                      (output_token_ids_np < vocab_size))
+        valid_mask = (output_token_ids_np != PLACEHOLDER_TOKEN_ID) & (
+            output_token_ids_np < vocab_size
+        )
         outputs = [
-            row[valid_mask[i]].tolist()
-            for i, row in enumerate(output_token_ids_np)
+            row[valid_mask[i]].tolist() for i, row in enumerate(output_token_ids_np)
         ]
         return outputs
 
@@ -178,7 +178,7 @@ def rejection_sample(
     if not sampling_metadata.all_random:
         # Rejection sampling for greedy sampling requests.
         target_argmax = target_probs.argmax(dim=-1)
-        rejection_greedy_sample_kernel[(batch_size, )](
+        rejection_greedy_sample_kernel[(batch_size,)](
             output_token_ids,
             cu_num_draft_tokens,
             draft_token_ids,
@@ -213,7 +213,7 @@ def rejection_sample(
     )
 
     # Rejection sampling for random sampling requests.
-    rejection_random_sample_kernel[(batch_size, )](
+    rejection_random_sample_kernel[(batch_size,)](
         output_token_ids,
         cu_num_draft_tokens,
         draft_token_ids,
@@ -320,7 +320,7 @@ def expand_batch_to_tokens(
     batch_size = x.shape[0]
     assert cu_num_tokens.shape[0] == batch_size
     expanded_x = x.new_empty(num_tokens)
-    expand_kernel[(batch_size, )](
+    expand_kernel[(batch_size,)](
         expanded_x,
         x,
         cu_num_tokens,
@@ -368,7 +368,7 @@ def generate_uniform_probs(
     # https://github.com/pytorch/pytorch/issues/16706. Using float64
     # mitigates the issue.
     uniform_probs = torch.rand(
-        (num_tokens, ),
+        (num_tokens,),
         dtype=torch.float64,
         device=device,
     )
@@ -464,8 +464,10 @@ def rejection_greedy_sample_kernel(
         if not rejected:
             draft_token_id = tl.load(draft_token_ids_ptr + start_idx + pos)
             target_argmax_id = tl.load(target_argmax_ptr + start_idx + pos)
-            tl.store(output_token_ids_ptr + req_idx * (max_spec_len + 1) + pos,
-                     target_argmax_id)
+            tl.store(
+                output_token_ids_ptr + req_idx * (max_spec_len + 1) + pos,
+                target_argmax_id,
+            )
             if draft_token_id != target_argmax_id:
                 # Reject.
                 rejected = True
@@ -474,8 +476,9 @@ def rejection_greedy_sample_kernel(
         # If all tokens are accepted, append the bonus token.
         bonus_token_id = tl.load(bonus_token_ids_ptr + req_idx)
         tl.store(
-            output_token_ids_ptr + req_idx * (max_spec_len + 1) +
-            num_draft_tokens, bonus_token_id)
+            output_token_ids_ptr + req_idx * (max_spec_len + 1) + num_draft_tokens,
+            bonus_token_id,
+        )
 
 
 # NOTE(woosuk): Avoid specialization to prevent unnecessary recompilation.
@@ -514,12 +517,12 @@ def rejection_random_sample_kernel(
             if NO_DRAFT_PROBS:
                 draft_prob = 1
             else:
-                draft_prob = tl.load(draft_probs_ptr +
-                                     (start_idx + pos) * vocab_size +
-                                     draft_token_id)
-            target_prob = tl.load(target_probs_ptr +
-                                  (start_idx + pos) * vocab_size +
-                                  draft_token_id)
+                draft_prob = tl.load(
+                    draft_probs_ptr + (start_idx + pos) * vocab_size + draft_token_id
+                )
+            target_prob = tl.load(
+                target_probs_ptr + (start_idx + pos) * vocab_size + draft_token_id
+            )
             uniform_prob = tl.load(uniform_probs_ptr + start_idx + pos)
             # NOTE(woosuk): While the draft probability should never be 0,
             # we check it to avoid NaNs. If it happens to be 0, we reject.
@@ -530,15 +533,17 @@ def rejection_random_sample_kernel(
                 # Reject. Use recovered token.
                 rejected = True
                 token_id = tl.load(recovered_token_ids_ptr + start_idx + pos)
-            tl.store(output_token_ids_ptr + req_idx * (max_spec_len + 1) + pos,
-                     token_id)
+            tl.store(
+                output_token_ids_ptr + req_idx * (max_spec_len + 1) + pos, token_id
+            )
 
     if not rejected:
         # If all tokens are accepted, append the bonus token.
         bonus_token_id = tl.load(bonus_token_ids_ptr + req_idx)
         tl.store(
-            output_token_ids_ptr + req_idx * (max_spec_len + 1) +
-            num_draft_tokens, bonus_token_id)
+            output_token_ids_ptr + req_idx * (max_spec_len + 1) + num_draft_tokens,
+            bonus_token_id,
+        )
 
 
 # NOTE(woosuk): Avoid specialization to prevent unnecessary recompilation.
@@ -562,9 +567,7 @@ def expand_kernel(
     src_val = tl.load(input_ptr + req_idx)
     src_val = tl.where(src_val == replace_from, replace_to, src_val)
     offset = tl.arange(0, MAX_NUM_TOKENS)
-    tl.store(output_ptr + start_idx + offset,
-             src_val,
-             mask=offset < num_tokens)
+    tl.store(output_ptr + start_idx + offset, src_val, mask=offset < num_tokens)
 
 
 @triton.jit
@@ -595,26 +598,30 @@ def sample_recovered_tokens_kernel(
     vocab_offset = tl.arange(0, PADDED_VOCAB_SIZE)
     if NO_DRAFT_PROBS:
         draft_token_id = tl.load(draft_token_ids_ptr + start_idx + pos)
-        prob = tl.load(target_probs_ptr + (start_idx + pos) * vocab_size +
-                       vocab_offset,
-                       mask=((vocab_offset < vocab_size) &
-                             (vocab_offset != draft_token_id)),
-                       other=0)
+        prob = tl.load(
+            target_probs_ptr + (start_idx + pos) * vocab_size + vocab_offset,
+            mask=((vocab_offset < vocab_size) & (vocab_offset != draft_token_id)),
+            other=0,
+        )
     else:
-        draft_prob = tl.load(draft_probs_ptr + (start_idx + pos) * vocab_size +
-                             vocab_offset,
-                             mask=vocab_offset < vocab_size,
-                             other=0)
-        target_prob = tl.load(target_probs_ptr +
-                              (start_idx + pos) * vocab_size + vocab_offset,
-                              mask=vocab_offset < vocab_size,
-                              other=0)
+        draft_prob = tl.load(
+            draft_probs_ptr + (start_idx + pos) * vocab_size + vocab_offset,
+            mask=vocab_offset < vocab_size,
+            other=0,
+        )
+        target_prob = tl.load(
+            target_probs_ptr + (start_idx + pos) * vocab_size + vocab_offset,
+            mask=vocab_offset < vocab_size,
+            other=0,
+        )
         prob = tl.maximum(target_prob - draft_prob, 0)
         # NOTE(woosuk): We don't need `prob = prob / tl.sum(prob)` here because
         # `tl.argmax` will select the maximum value.
 
-    q = tl.load(q_ptr + req_idx * vocab_size + vocab_offset,
-                mask=vocab_offset < vocab_size,
-                other=float("-inf"))
+    q = tl.load(
+        q_ptr + req_idx * vocab_size + vocab_offset,
+        mask=vocab_offset < vocab_size,
+        other=float("-inf"),
+    )
     recovered_id = tl.argmax(prob / q, axis=-1)
     tl.store(output_token_ids_ptr + start_idx + pos, recovered_id)
diff --git a/vllm/v1/sample/sampler.py b/vllm/v1/sample/sampler.py
index 83ea766b1b4a..d4d3fb029599 100644
--- a/vllm/v1/sample/sampler.py
+++ b/vllm/v1/sample/sampler.py
@@ -24,39 +24,39 @@ class Sampler(nn.Module):
     A layer that samples the next tokens from the model's outputs
     with the following steps in order:
 
-    1. If logprobs are requested:  
+    1. If logprobs are requested:
         a) If `logprobs_mode` is `raw_logprobs`, compute logprobs
-           as the final logprobs to return.  
+           as the final logprobs to return.
         b) If `logprobs_mode` is `raw_logits`, clone the logits
-           as the final logprobs to return.  
-    2. Convert logits to float32.  
-    3. Apply allowed token ids whitelist.  
-    4. Apply bad words exclusion.  
+           as the final logprobs to return.
+    2. Convert logits to float32.
+    3. Apply allowed token ids whitelist.
+    4. Apply bad words exclusion.
     5. Apply logit processors which are not argmax-invariant,
-       i.e. that can impact greedy sampling.  
-        a) Min tokens processor  
-        b) Logit bias processor  
-    6. Apply penalties  
-        a) Repetition penalty  
-        b) Frequency penalty  
-        c) Presence penalty  
-    7. Sample the next tokens. `sample` method performs the following steps:  
+       i.e. that can impact greedy sampling.
+        a) Min tokens processor
+        b) Logit bias processor
+    6. Apply penalties
+        a) Repetition penalty
+        b) Frequency penalty
+        c) Presence penalty
+    7. Sample the next tokens. `sample` method performs the following steps:
         a) If not `all_random`, perform greedy sampling. If `all_greedy`,
-           return the greedily sampled tokens and final logprobs if requested.  
-        b) Apply temperature.  
+           return the greedily sampled tokens and final logprobs if requested.
+        b) Apply temperature.
         c) Apply logit processors which are argmax-invariant, by default
-           the min_p processor.  
-        d) Apply top_k and/or top_p.  
-        e) Sample the next tokens with the probability distribution.  
+           the min_p processor.
+        d) Apply top_k and/or top_p.
+        e) Sample the next tokens with the probability distribution.
         f) If `all_random` or temperature >= epsilon (1e-5), return the
            randomly sampled tokens and final logprobs if requested. Else,
-           return the greedily sampled tokens and logprobs if requested.  
+           return the greedily sampled tokens and logprobs if requested.
     8. Gather the logprobs of the top `max_num_logprobs` and sampled token
        (if requested). Note that if the sampled token is within the top
        `max_num_logprobs`, the logprob will be eventually merged in
        `LogprobsProcessor` during output processing. Therefore, the
        final output may contain either `max_num_logprobs + 1` or
-       `max_num_logprobs` logprobs.  
+       `max_num_logprobs` logprobs.
     9. Return the final `SamplerOutput`.
     """
 
@@ -108,8 +108,11 @@ def forward(
 
         # Gather the logprobs of the topk and sampled token (if requested).
         # Get logprobs and rank tensors (if requested)
-        logprobs_tensors = None if num_logprobs is None else \
-            self.gather_logprobs(raw_logprobs, num_logprobs, token_ids=sampled)
+        logprobs_tensors = (
+            None
+            if num_logprobs is None
+            else self.gather_logprobs(raw_logprobs, num_logprobs, token_ids=sampled)
+        )
 
         # Use int32 to reduce the tensor size.
         sampled = sampled.to(torch.int32)
@@ -150,8 +153,7 @@ def sample(
         may update the logits tensor in-place.
         """
 
-        assert not (sampling_metadata.all_greedy
-                    and sampling_metadata.all_random)
+        assert not (sampling_metadata.all_greedy and sampling_metadata.all_random)
         if sampling_metadata.all_random:
             greedy_sampled = None
         else:
@@ -168,8 +170,9 @@ def sample(
         assert sampling_metadata.temperature is not None
 
         # Apply temperature.
-        logits = self.apply_temperature(logits, sampling_metadata.temperature,
-                                        sampling_metadata.all_random)
+        logits = self.apply_temperature(
+            logits, sampling_metadata.temperature, sampling_metadata.all_random
+        )
 
         # Apply logits processors that only apply to random sampling
         # (argmax invariant)
@@ -224,9 +227,7 @@ def gather_logprobs(
         """
         assert token_ids.dtype == torch.int64
         # Find the topK values.
-        topk_logprobs, topk_indices = torch.topk(logprobs,
-                                                 num_logprobs,
-                                                 dim=-1)
+        topk_logprobs, topk_indices = torch.topk(logprobs, num_logprobs, dim=-1)
 
         # Get with the logprob of the prompt or sampled token.
         token_ids = token_ids.unsqueeze(-1)
@@ -267,8 +268,7 @@ def apply_allowed_token_ids(
         sampling_metadata: SamplingMetadata,
     ) -> torch.Tensor:
         if sampling_metadata.allowed_token_ids_mask is not None:
-            logits.masked_fill_(sampling_metadata.allowed_token_ids_mask,
-                                float("-inf"))
+            logits.masked_fill_(sampling_metadata.allowed_token_ids_mask, float("-inf"))
         return logits
 
     def apply_bad_words(
diff --git a/vllm/v1/sample/tpu/metadata.py b/vllm/v1/sample/tpu/metadata.py
index 6491c84f6076..b58a94d0bf7d 100644
--- a/vllm/v1/sample/tpu/metadata.py
+++ b/vllm/v1/sample/tpu/metadata.py
@@ -48,15 +48,13 @@ class TPUSupportedSamplingMetadata:
 
     min_tokens = None  # impl is not vectorized
 
-    logit_bias: list[Optional[dict[int, float]]] = field(
-        default_factory=lambda: list())
+    logit_bias: list[Optional[dict[int, float]]] = field(default_factory=lambda: list())
 
     allowed_token_ids_mask = None
     bad_words_token_ids = None
 
     # Generator not supported by xla
-    _generators: dict[int,
-                      torch.Generator] = field(default_factory=lambda: dict())
+    _generators: dict[int, torch.Generator] = field(default_factory=lambda: dict())
 
     @property
     def generators(self) -> dict[int, torch.Generator]:
@@ -69,13 +67,13 @@ def from_input_batch(
         input_batch: InputBatch,
         padded_num_reqs: int,
         xla_device: torch.device,
-        generate_params_if_all_greedy: bool = False
+        generate_params_if_all_greedy: bool = False,
     ) -> "TPUSupportedSamplingMetadata":
         """
         Copy sampling tensors slices from `input_batch` to on device tensors.
 
-        `InputBatch._make_sampling_metadata` causes recompilation on XLA as it 
-        slices dynamic shapes on device tensors. This impl moves the dynamic 
+        `InputBatch._make_sampling_metadata` causes recompilation on XLA as it
+        slices dynamic shapes on device tensors. This impl moves the dynamic
         ops to CPU and produces tensors of fixed `padded_num_reqs` size.
 
         Args:
@@ -87,11 +85,11 @@ def from_input_batch(
                 we want to pre-compile a graph with sampling parameters, even if
                 they are not strictly needed for greedy decoding.
         """
-        needs_logprobs = input_batch.max_num_logprobs>0 if \
-            input_batch.max_num_logprobs else False
+        needs_logprobs = (
+            input_batch.max_num_logprobs > 0 if input_batch.max_num_logprobs else False
+        )
         # Early return to avoid unnecessary cpu to tpu copy
-        if (input_batch.all_greedy is True
-                and generate_params_if_all_greedy is False):
+        if input_batch.all_greedy is True and generate_params_if_all_greedy is False:
             return cls(all_greedy=True, logprobs=needs_logprobs)
 
         num_reqs = input_batch.num_reqs
@@ -100,25 +98,22 @@ def fill_slice(cpu_tensor: torch.Tensor, fill_val) -> torch.Tensor:
             # Pad value is the default one.
             cpu_tensor[num_reqs:padded_num_reqs] = fill_val
 
-        fill_slice(input_batch.temperature_cpu_tensor,
-                   DEFAULT_SAMPLING_PARAMS["temperature"])
-        fill_slice(input_batch.min_p_cpu_tensor,
-                   DEFAULT_SAMPLING_PARAMS["min_p"])
-        fill_slice(input_batch.top_k_cpu_tensor,
-                   DEFAULT_SAMPLING_PARAMS["top_k"])
-        fill_slice(input_batch.top_p_cpu_tensor,
-                   DEFAULT_SAMPLING_PARAMS["top_p"])
+        fill_slice(
+            input_batch.temperature_cpu_tensor, DEFAULT_SAMPLING_PARAMS["temperature"]
+        )
+        fill_slice(input_batch.min_p_cpu_tensor, DEFAULT_SAMPLING_PARAMS["min_p"])
+        fill_slice(input_batch.top_k_cpu_tensor, DEFAULT_SAMPLING_PARAMS["top_k"])
+        fill_slice(input_batch.top_p_cpu_tensor, DEFAULT_SAMPLING_PARAMS["top_p"])
 
         # Slice persistent device tensors to a fixed pre-compiled padded shape.
         return cls(
-            temperature=input_batch.temperature_cpu_tensor[:padded_num_reqs].
-            to(xla_device),
+            temperature=input_batch.temperature_cpu_tensor[:padded_num_reqs].to(
+                xla_device
+            ),
             all_greedy=input_batch.all_greedy,
             # TODO enable more and avoid returning None values
-            top_p=input_batch.top_p_cpu_tensor[:padded_num_reqs].to(
-                xla_device),
-            top_k=input_batch.top_k_cpu_tensor[:padded_num_reqs].to(
-                xla_device),
-            min_p=input_batch.min_p_cpu_tensor[:padded_num_reqs].to(
-                xla_device),
-            logprobs=needs_logprobs)
+            top_p=input_batch.top_p_cpu_tensor[:padded_num_reqs].to(xla_device),
+            top_k=input_batch.top_k_cpu_tensor[:padded_num_reqs].to(xla_device),
+            min_p=input_batch.min_p_cpu_tensor[:padded_num_reqs].to(xla_device),
+            logprobs=needs_logprobs,
+        )
diff --git a/vllm/v1/sample/tpu/sampler.py b/vllm/v1/sample/tpu/sampler.py
index 17b83a4ba074..ccef283a8182 100644
--- a/vllm/v1/sample/tpu/sampler.py
+++ b/vllm/v1/sample/tpu/sampler.py
@@ -14,7 +14,6 @@
 
 
 class Sampler(nn.Module):
-
     def __init__(self):
         # TODO(houseroad): Add support for logprobs_mode.
         super().__init__()
@@ -35,7 +34,8 @@ def forward(
             # [num_requests, 1], where each row represents one generated
             # token per request.
             sampled_token_ids=sampled.unsqueeze(-1),
-            logprobs_tensors=None)
+            logprobs_tensors=None,
+        )
         return sampler_output
 
     def apply_temperature(
@@ -73,11 +73,13 @@ def sample(
 
         # Random sample.
         probs = logits.softmax(dim=-1, dtype=torch.float32)
-        random_sampled = self.random_sample(probs,
-                                            sampling_metadata.generators)
+        random_sampled = self.random_sample(probs, sampling_metadata.generators)
 
-        sampled = torch.where(sampling_metadata.temperature < _SAMPLING_EPS,
-                              greedy_sampled, random_sampled)
+        sampled = torch.where(
+            sampling_metadata.temperature < _SAMPLING_EPS,
+            greedy_sampled,
+            random_sampled,
+        )
         return sampled
 
     def compute_logprobs(self, logits: torch.Tensor) -> torch.Tensor:
@@ -107,9 +109,7 @@ def gather_logprobs(
           Sampled token rank tensor, (num tokens)
         """
         # Find the topK values.
-        topk_logprobs, topk_indices = torch.topk(logprobs,
-                                                 num_logprobs,
-                                                 dim=-1)
+        topk_logprobs, topk_indices = torch.topk(logprobs, num_logprobs, dim=-1)
 
         # Get with the logprob of the prompt or sampled token.
         token_ids = token_ids.unsqueeze(-1)
@@ -138,9 +138,7 @@ def apply_min_p(
         # Convert logits to probability distribution
         probability_values = torch.nn.functional.softmax(logits, dim=-1)
         # Calculate maximum probabilities per sequence
-        max_probabilities = torch.amax(probability_values,
-                                       dim=-1,
-                                       keepdim=True)
+        max_probabilities = torch.amax(probability_values, dim=-1, keepdim=True)
         # Reshape min_p for broadcasting
         adjusted_min_p = min_p.unsqueeze(1) * max_probabilities
         # Identify valid tokens using threshold comparison
diff --git a/vllm/v1/serial_utils.py b/vllm/v1/serial_utils.py
index 876838084b9a..f7a73cba6095 100644
--- a/vllm/v1/serial_utils.py
+++ b/vllm/v1/serial_utils.py
@@ -18,14 +18,21 @@
 
 from vllm import envs
 from vllm.logger import init_logger
+
 # yapf: disable
-from vllm.multimodal.inputs import (BaseMultiModalField,
-                                    MultiModalBatchedField,
-                                    MultiModalFieldConfig, MultiModalFieldElem,
-                                    MultiModalFlatField, MultiModalKwargs,
-                                    MultiModalKwargsItem,
-                                    MultiModalKwargsItems,
-                                    MultiModalSharedField, NestedTensors)
+from vllm.multimodal.inputs import (
+    BaseMultiModalField,
+    MultiModalBatchedField,
+    MultiModalFieldConfig,
+    MultiModalFieldElem,
+    MultiModalFlatField,
+    MultiModalKwargs,
+    MultiModalKwargsItem,
+    MultiModalKwargsItems,
+    MultiModalSharedField,
+    NestedTensors,
+)
+
 # yapf: enable
 from vllm.v1.engine import UtilityResult
 
@@ -48,8 +55,10 @@
 
 
 def _log_insecure_serialization_warning():
-    logger.warning_once("Allowing insecure serialization using pickle due to "
-                        "VLLM_ALLOW_INSECURE_SERIALIZATION=1")
+    logger.warning_once(
+        "Allowing insecure serialization using pickle due to "
+        "VLLM_ALLOW_INSECURE_SERIALIZATION=1"
+    )
 
 
 def _typestr(val: Any) -> Optional[tuple[str, str]]:
@@ -72,8 +81,8 @@ def _encode_type_info_recursive(obj: Any) -> Any:
 
 
 def _decode_type_info_recursive(
-        type_info: Any, data: Any, convert_fn: Callable[[Sequence[str], Any],
-                                                        Any]) -> Any:
+    type_info: Any, data: Any, convert_fn: Callable[[Sequence[str], Any], Any]
+) -> Any:
     """Recursively decode type information for nested structures of
     lists/dicts."""
     if type_info is None:
@@ -85,8 +94,9 @@ def _decode_type_info_recursive(
             for k in type_info
         }
     if isinstance(type_info, list) and (
-            # Exclude serialized tensors/numpy arrays.
-            len(type_info) != 2 or not isinstance(type_info[0], str)):
+        # Exclude serialized tensors/numpy arrays.
+        len(type_info) != 2 or not isinstance(type_info[0], str)
+    ):
         assert isinstance(data, list)
         return [
             _decode_type_info_recursive(ti, d, convert_fn)
@@ -101,7 +111,7 @@ class MsgpackEncoder:
     Note that unlike vanilla `msgspec` Encoders, this interface is generally
     not thread-safe when encoding tensors / numpy arrays.
 
-    By default, arrays below 256B are serialized inline Larger will get sent 
+    By default, arrays below 256B are serialized inline Larger will get sent
     via dedicated messages. Note that this is a per-tensor limit.
     """
 
@@ -119,7 +129,7 @@ def __init__(self, size_threshold: Optional[int] = None):
 
     def encode(self, obj: Any) -> Sequence[bytestr]:
         try:
-            self.aux_buffers = bufs = [b'']
+            self.aux_buffers = bufs = [b""]
             bufs[0] = self.encoder.encode(obj)
             # This `bufs` list allows us to collect direct pointers to backing
             # buffers of tensors and np arrays, and return them along with the
@@ -143,14 +153,15 @@ def enc_hook(self, obj: Any) -> Any:
             return self._encode_tensor(obj)
 
         # Fall back to pickle for object or void kind ndarrays.
-        if isinstance(obj, np.ndarray) and obj.dtype.kind not in ('O', 'V'):
+        if isinstance(obj, np.ndarray) and obj.dtype.kind not in ("O", "V"):
             return self._encode_ndarray(obj)
 
         if isinstance(obj, slice):
             # We are assuming only int-based values will be used here.
             return tuple(
                 int(v) if v is not None else None
-                for v in (obj.start, obj.stop, obj.step))
+                for v in (obj.start, obj.stop, obj.step)
+            )
 
         if isinstance(obj, MultiModalKwargsItem):
             return self._encode_mm_item(obj)
@@ -171,17 +182,20 @@ def enc_hook(self, obj: Any) -> Any:
             return _encode_type_info_recursive(result), result
 
         if not envs.VLLM_ALLOW_INSECURE_SERIALIZATION:
-            raise TypeError(f"Object of type {type(obj)} is not serializable"
-                            "Set VLLM_ALLOW_INSECURE_SERIALIZATION=1 to allow "
-                            "fallback to pickle-based serialization.")
+            raise TypeError(
+                f"Object of type {type(obj)} is not serializable"
+                "Set VLLM_ALLOW_INSECURE_SERIALIZATION=1 to allow "
+                "fallback to pickle-based serialization."
+            )
 
         if isinstance(obj, FunctionType):
             # `pickle` is generally faster than cloudpickle, but can have
             # problems serializing methods.
             return msgpack.Ext(CUSTOM_TYPE_CLOUDPICKLE, cloudpickle.dumps(obj))
 
-        return msgpack.Ext(CUSTOM_TYPE_PICKLE,
-                           pickle.dumps(obj, protocol=pickle.HIGHEST_PROTOCOL))
+        return msgpack.Ext(
+            CUSTOM_TYPE_PICKLE, pickle.dumps(obj, protocol=pickle.HIGHEST_PROTOCOL)
+        )
 
     def _encode_ndarray(
         self, obj: np.ndarray
@@ -225,27 +239,22 @@ def _encode_mm_items(self, items: MultiModalKwargsItems) -> dict[str, Any]:
             for modality, itemlist in items.items()
         }
 
-    def _encode_mm_item(self,
-                        item: MultiModalKwargsItem) -> list[dict[str, Any]]:
+    def _encode_mm_item(self, item: MultiModalKwargsItem) -> list[dict[str, Any]]:
         return [self._encode_mm_field_elem(elem) for elem in item.values()]
 
-    def _encode_mm_field_elem(self,
-                              elem: MultiModalFieldElem) -> dict[str, Any]:
+    def _encode_mm_field_elem(self, elem: MultiModalFieldElem) -> dict[str, Any]:
         return {
-            "modality":
-            elem.modality,
-            "key":
-            elem.key,
-            "data": (None if elem.data is None else
-                     self._encode_nested_tensors(elem.data)),
-            "field":
-            self._encode_mm_field(elem.field),
+            "modality": elem.modality,
+            "key": elem.key,
+            "data": (
+                None if elem.data is None else self._encode_nested_tensors(elem.data)
+            ),
+            "field": self._encode_mm_field(elem.field),
         }
 
     def _encode_mm_kwargs(self, kw: MultiModalKwargs) -> dict[str, Any]:
         return {
-            modality: self._encode_nested_tensors(data)
-            for modality, data in kw.items()
+            modality: self._encode_nested_tensors(data) for modality, data in kw.items()
         }
 
     def _encode_nested_tensors(self, nt: NestedTensors) -> Any:
@@ -264,8 +273,7 @@ def _encode_mm_field(self, field: BaseMultiModalField):
             raise TypeError(f"Unsupported field type: {field.__class__}")
         # We just need to copy all of the field values in order
         # which will be then used to reconstruct the field.
-        field_values = (getattr(field, f.name)
-                        for f in dataclasses.fields(field))
+        field_values = (getattr(field, f.name) for f in dataclasses.fields(field))
         return name, *field_values
 
 
@@ -277,10 +285,10 @@ class MsgpackDecoder:
     """
 
     def __init__(self, t: Optional[Any] = None):
-        args = () if t is None else (t, )
-        self.decoder = msgpack.Decoder(*args,
-                                       ext_hook=self.ext_hook,
-                                       dec_hook=self.dec_hook)
+        args = () if t is None else (t,)
+        self.decoder = msgpack.Decoder(
+            *args, ext_hook=self.ext_hook, dec_hook=self.dec_hook
+        )
         self.aux_buffers: Sequence[bytestr] = ()
         if envs.VLLM_ALLOW_INSECURE_SERIALIZATION:
             _log_insecure_serialization_warning()
@@ -320,11 +328,14 @@ def _decode_utility_result(self, obj: Any) -> UtilityResult:
         result_type, result = obj
         if result_type is not None:
             if not envs.VLLM_ALLOW_INSECURE_SERIALIZATION:
-                raise TypeError("VLLM_ALLOW_INSECURE_SERIALIZATION must "
-                                "be set to use custom utility result types")
+                raise TypeError(
+                    "VLLM_ALLOW_INSECURE_SERIALIZATION must "
+                    "be set to use custom utility result types"
+                )
             # Use recursive decoding to handle nested structures
-            result = _decode_type_info_recursive(result_type, result,
-                                                 self._convert_result)
+            result = _decode_type_info_recursive(
+                result_type, result, self._convert_result
+            )
         return UtilityResult(result)
 
     def _convert_result(self, result_type: Sequence[str], result: Any) -> Any:
@@ -347,8 +358,7 @@ def _decode_tensor(self, arr: Any) -> torch.Tensor:
         # Copy from inline representation, to decouple the memory storage
         # of the message from the original buffer. And also make Torch
         # not complain about a readonly memoryview.
-        buffer = self.aux_buffers[data] if isinstance(data, int) \
-            else bytearray(data)
+        buffer = self.aux_buffers[data] if isinstance(data, int) else bytearray(data)
         torch_dtype = getattr(torch, dtype)
         assert isinstance(torch_dtype, torch.dtype)
         if not buffer:  # torch.frombuffer doesn't like empty buffers
@@ -360,17 +370,19 @@ def _decode_tensor(self, arr: Any) -> torch.Tensor:
         return arr.view(torch_dtype).view(shape)
 
     def _decode_mm_items(self, obj: dict[str, Any]) -> MultiModalKwargsItems:
-        return MultiModalKwargsItems({
-            modality: [self._decode_mm_item(item) for item in itemlist]
-            for modality, itemlist in obj.items()
-        })
+        return MultiModalKwargsItems(
+            {
+                modality: [self._decode_mm_item(item) for item in itemlist]
+                for modality, itemlist in obj.items()
+            }
+        )
 
     def _decode_mm_item(self, obj: list[Any]) -> MultiModalKwargsItem:
         return MultiModalKwargsItem.from_elems(
-            [self._decode_mm_field_elem(v) for v in obj])
+            [self._decode_mm_field_elem(v) for v in obj]
+        )
 
-    def _decode_mm_field_elem(self, obj: dict[str,
-                                              Any]) -> MultiModalFieldElem:
+    def _decode_mm_field_elem(self, obj: dict[str, Any]) -> MultiModalFieldElem:
         if obj["data"] is not None:
             obj["data"] = self._decode_nested_tensors(obj["data"])
 
@@ -387,10 +399,12 @@ def _decode_mm_field_elem(self, obj: dict[str,
         return MultiModalFieldElem(**obj)
 
     def _decode_mm_kwargs(self, obj: dict[str, Any]) -> MultiModalKwargs:
-        return MultiModalKwargs({
-            modality: self._decode_nested_tensors(data)
-            for modality, data in obj.items()
-        })
+        return MultiModalKwargs(
+            {
+                modality: self._decode_nested_tensors(data)
+                for modality, data in obj.items()
+            }
+        )
 
     def _decode_nested_tensors(self, obj: Any) -> NestedTensors:
         if isinstance(obj, (int, float)):
@@ -419,5 +433,4 @@ def ext_hook(self, code: int, data: memoryview) -> Any:
             if code == CUSTOM_TYPE_CLOUDPICKLE:
                 return cloudpickle.loads(data)
 
-        raise NotImplementedError(
-            f"Extension type code {code} is not supported")
+        raise NotImplementedError(f"Extension type code {code} is not supported")
diff --git a/vllm/v1/spec_decode/eagle.py b/vllm/v1/spec_decode/eagle.py
index dc6db0138806..5d4822a6279b 100644
--- a/vllm/v1/spec_decode/eagle.py
+++ b/vllm/v1/spec_decode/eagle.py
@@ -10,8 +10,7 @@
 import torch.nn as nn
 
 from vllm.attention.layer import Attention
-from vllm.config import (CompilationLevel, VllmConfig,
-                         get_layers_from_vllm_config)
+from vllm.config import CompilationLevel, VllmConfig, get_layers_from_vllm_config
 from vllm.distributed.parallel_state import get_pp_group
 from vllm.forward_context import set_forward_context
 from vllm.logger import init_logger
@@ -23,11 +22,15 @@
 from vllm.platforms import current_platform
 from vllm.utils import is_pin_memory_available
 from vllm.v1.attention.backends.flash_attn import FlashAttentionMetadata
-from vllm.v1.attention.backends.tree_attn import (TreeAttentionMetadata,
-                                                  TreeAttentionMetadataBuilder)
+from vllm.v1.attention.backends.tree_attn import (
+    TreeAttentionMetadata,
+    TreeAttentionMetadataBuilder,
+)
 from vllm.v1.attention.backends.triton_attn import TritonAttentionMetadata
-from vllm.v1.attention.backends.utils import (AttentionMetadataBuilder,
-                                              CommonAttentionMetadata)
+from vllm.v1.attention.backends.utils import (
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+)
 from vllm.v1.kv_cache_interface import KVCacheConfig
 from vllm.v1.sample.metadata import SamplingMetadata
 from vllm.v1.spec_decode.metadata import SpecDecodeMetadata
@@ -41,7 +44,6 @@
 
 
 class EagleProposer:
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -59,10 +61,8 @@ def __init__(
         self.dtype = vllm_config.model_config.dtype
         self.max_model_len = vllm_config.model_config.max_model_len
         self.block_size = vllm_config.cache_config.block_size
-        self.num_speculative_tokens = (
-            self.speculative_config.num_speculative_tokens)
-        self.max_num_tokens = (
-            vllm_config.scheduler_config.max_num_batched_tokens)
+        self.num_speculative_tokens = self.speculative_config.num_speculative_tokens
+        self.max_num_tokens = vllm_config.scheduler_config.max_num_batched_tokens
         self.token_arange_np = np.arange(self.max_num_tokens)
         # We need to get the hidden size from the draft model config because
         # the draft model's hidden size can be different from the target model's
@@ -72,62 +72,64 @@ def __init__(
         # Multi-modal data support
         self.mm_registry = MULTIMODAL_REGISTRY
         self.supports_mm_inputs = self.mm_registry.supports_multimodal_inputs(
-            vllm_config.model_config)
+            vllm_config.model_config
+        )
 
         self.attn_metadata_builder: Optional[AttentionMetadataBuilder] = None
-        self.draft_indexer_metadata_builder: Optional[
-            AttentionMetadataBuilder] = None
+        self.draft_indexer_metadata_builder: Optional[AttentionMetadataBuilder] = None
         self.attn_layer_names: list[str] = []
         self.indexer_layer_names: list[str] = []
 
-        self.use_cuda_graph = (not current_platform.is_xpu()
-                               and self.vllm_config.compilation_config.level
-                               == CompilationLevel.PIECEWISE and
-                               not self.vllm_config.model_config.enforce_eager
-                               and not self.speculative_config.enforce_eager)
-        self.cudagraph_batch_sizes = list(
-            reversed(self.vllm_config.compilation_config.
-                     cudagraph_capture_sizes)) if self.use_cuda_graph else []
+        self.use_cuda_graph = (
+            not current_platform.is_xpu()
+            and self.vllm_config.compilation_config.level == CompilationLevel.PIECEWISE
+            and not self.vllm_config.model_config.enforce_eager
+            and not self.speculative_config.enforce_eager
+        )
+        self.cudagraph_batch_sizes = (
+            list(reversed(self.vllm_config.compilation_config.cudagraph_capture_sizes))
+            if self.use_cuda_graph
+            else []
+        )
 
         # persistent buffers for cuda graph
-        self.input_ids = torch.zeros(self.max_num_tokens,
-                                     dtype=torch.int32,
-                                     device=device)
+        self.input_ids = torch.zeros(
+            self.max_num_tokens, dtype=torch.int32, device=device
+        )
         self.uses_mrope = self.vllm_config.model_config.uses_mrope
         if self.uses_mrope:
             # M-RoPE need (3, max_num_tokens)
-            self.mrope_positions = torch.zeros((3, self.max_num_tokens),
-                                               dtype=torch.int64,
-                                               device=device)
+            self.mrope_positions = torch.zeros(
+                (3, self.max_num_tokens), dtype=torch.int64, device=device
+            )
         else:
             # RoPE need (max_num_tokens,)
-            self.positions = torch.zeros(self.max_num_tokens,
-                                         dtype=torch.int64,
-                                         device=device)
+            self.positions = torch.zeros(
+                self.max_num_tokens, dtype=torch.int64, device=device
+            )
         self.hidden_states = torch.zeros(
-            (self.max_num_tokens, self.hidden_size),
-            dtype=self.dtype,
-            device=device)
+            (self.max_num_tokens, self.hidden_size), dtype=self.dtype, device=device
+        )
 
         # We need +1 here because the arange is used to set query_start_loc,
         # which has one more element than batch_size.
         max_batch_size = vllm_config.scheduler_config.max_num_seqs
         max_num_slots_for_arange = max(max_batch_size + 1, self.max_num_tokens)
-        self.arange = torch.arange(max_num_slots_for_arange,
-                                   device=device,
-                                   dtype=torch.int32)
+        self.arange = torch.arange(
+            max_num_slots_for_arange, device=device, dtype=torch.int32
+        )
 
         self.inputs_embeds = torch.zeros(
-            (self.max_num_tokens, self.hidden_size),
-            dtype=self.dtype,
-            device=device)
+            (self.max_num_tokens, self.hidden_size), dtype=self.dtype, device=device
+        )
 
         self.backup_next_token_ids = CpuGpuBuffer(
             max_batch_size,
             dtype=torch.int32,
             pin_memory=is_pin_memory_available(),
             device=device,
-            with_numpy=True)
+            with_numpy=True,
+        )
 
         # Determine allowed attention backends once during initialization.
         self.allowed_attn_types: Optional[tuple] = None
@@ -136,14 +138,15 @@ def __init__(
             # vllm.v1.attention.backends.rocm_aiter_fa is an optional backend
             if find_spec("vllm.v1.attention.backends.rocm_aiter_fa"):
                 from vllm.v1.attention.backends.rocm_aiter_fa import (
-                    AiterFlashAttentionMetadata)
+                    AiterFlashAttentionMetadata,
+                )
+
                 rocm_types.append(AiterFlashAttentionMetadata)
             self.allowed_attn_types = tuple(rocm_types)
 
         # Parse the speculative token tree.
         spec_token_tree = self.speculative_config.speculative_token_tree
-        self.tree_choices: list[tuple[int,
-                                      ...]] = ast.literal_eval(spec_token_tree)
+        self.tree_choices: list[tuple[int, ...]] = ast.literal_eval(spec_token_tree)
         tree_depth = len(self.tree_choices[-1])
         # Precompute per-level properties of the tree.
         num_drafts_per_level = [0] * tree_depth
@@ -152,10 +155,12 @@ def __init__(
         self.cu_drafts_per_level = [num_drafts_per_level[0]]
         self.child_drafts_per_level = [num_drafts_per_level[0]]
         for level in range(1, tree_depth):
-            self.cu_drafts_per_level.append(self.cu_drafts_per_level[-1] +
-                                            num_drafts_per_level[level])
-            self.child_drafts_per_level.append(num_drafts_per_level[level] //
-                                               num_drafts_per_level[level - 1])
+            self.cu_drafts_per_level.append(
+                self.cu_drafts_per_level[-1] + num_drafts_per_level[level]
+            )
+            self.child_drafts_per_level.append(
+                num_drafts_per_level[level] // num_drafts_per_level[level - 1]
+            )
         # Precompute draft position offsets in flattened tree.
         self.tree_draft_pos_offsets = torch.arange(
             1,
@@ -188,8 +193,7 @@ def propose(
         last_token_indices: Optional[torch.Tensor],
         common_attn_metadata: CommonAttentionMetadata,
         sampling_metadata: SamplingMetadata,
-        mm_embed_inputs: Optional[tuple[list[torch.Tensor],
-                                        torch.Tensor]] = None,
+        mm_embed_inputs: Optional[tuple[list[torch.Tensor], torch.Tensor]] = None,
     ) -> torch.Tensor:
         num_tokens = target_token_ids.shape[0]
         batch_size = next_token_ids.shape[0]
@@ -200,11 +204,12 @@ def propose(
         if self.method == "eagle3":
             assert isinstance(self.model, Eagle3LlamaForCausalLM)
             target_hidden_states = self.model.combine_hidden_states(
-                target_hidden_states)
+                target_hidden_states
+            )
             assert target_hidden_states.shape[-1] == self.hidden_size
         # Shift the input ids by one token.
         # E.g., [a1, b1, b2, c1, c2, c3] -> [b1, b2, c1, c2, c3, c3]
-        self.input_ids[:num_tokens - 1] = target_token_ids[1:]
+        self.input_ids[: num_tokens - 1] = target_token_ids[1:]
         # Replace the last token with the next token.
         # E.g., [b1, b2, c1, c2, c3, c3] -> [a2, b2, b3, c2, c3, c4]
         self.input_ids[last_token_indices] = next_token_ids
@@ -213,17 +218,20 @@ def propose(
 
         # FIXME: need to consider multiple kv_cache_groups
         ubatch_id = dbo_current_ubatch_id()
-        attn_metadata_builder = \
-            self.runner.attn_groups[0][0].metadata_builders[ubatch_id]
+        attn_metadata_builder = self.runner.attn_groups[0][0].metadata_builders[
+            ubatch_id
+        ]
         attn_metadata = attn_metadata_builder.build_for_drafting(
-            common_attn_metadata=common_attn_metadata, draft_index=0)
+            common_attn_metadata=common_attn_metadata, draft_index=0
+        )
         # FIXME: support hybrid kv for draft model (remove separate indexer)
         if self.draft_indexer_metadata_builder:
             draft_indexer_metadata = (
                 self.draft_indexer_metadata_builder.build_for_drafting(
                     common_attn_metadata=common_attn_metadata,
                     draft_index=0,
-                ))
+                )
+            )
         else:
             draft_indexer_metadata = None
         # At this moment, we assume all eagle layers belong to the same KV
@@ -235,8 +243,7 @@ def propose(
             assert draft_indexer_metadata is not None
             per_layer_attn_metadata[layer_name] = draft_indexer_metadata
 
-        if self.use_cuda_graph and \
-                num_tokens <= self.cudagraph_batch_sizes[-1]:
+        if self.use_cuda_graph and num_tokens <= self.cudagraph_batch_sizes[-1]:
             num_input_tokens = self.vllm_config.pad_for_cudagraph(num_tokens)
         else:
             num_input_tokens = num_tokens
@@ -259,9 +266,9 @@ def propose(
             input_ids = self.input_ids[:num_input_tokens]
             inputs_embeds = None
 
-        with set_forward_context(per_layer_attn_metadata,
-                                 self.vllm_config,
-                                 num_tokens=num_input_tokens):
+        with set_forward_context(
+            per_layer_attn_metadata, self.vllm_config, num_tokens=num_input_tokens
+        ):
             ret_hidden_states = self.model(
                 input_ids=input_ids,
                 positions=self._get_positions(num_input_tokens),
@@ -304,28 +311,30 @@ def propose(
 
         draft_token_ids = logits.argmax(dim=-1)
 
-        if self.allowed_attn_types is not None and \
-            not isinstance(attn_metadata, self.allowed_attn_types):
+        if self.allowed_attn_types is not None and not isinstance(
+            attn_metadata, self.allowed_attn_types
+        ):
             raise ValueError(
                 f"Unsupported attention metadata type for speculative "
                 "decoding with num_speculative_tokens > 1: "
                 f"{type(attn_metadata)}. Supported types are: "
-                f"{self.allowed_attn_types}")
+                f"{self.allowed_attn_types}"
+            )
 
         # Generate the remaining draft tokens.
         draft_token_ids_list = [draft_token_ids]
 
-        if self.use_cuda_graph and \
-                batch_size <= self.cudagraph_batch_sizes[-1]:
+        if self.use_cuda_graph and batch_size <= self.cudagraph_batch_sizes[-1]:
             input_batch_size = self.vllm_config.pad_for_cudagraph(batch_size)
         else:
             input_batch_size = batch_size
 
         common_attn_metadata.num_actual_tokens = batch_size
         common_attn_metadata.max_query_len = 1
-        common_attn_metadata.query_start_loc = self.arange[:batch_size + 1]
+        common_attn_metadata.query_start_loc = self.arange[: batch_size + 1]
         common_attn_metadata.query_start_loc_cpu = torch.from_numpy(
-            self.token_arange_np[:batch_size + 1]).clone()
+            self.token_arange_np[: batch_size + 1]
+        ).clone()
         for token_index in range(self.num_speculative_tokens - 1):
             # Update the inputs.
             # cast to int32 is crucial when eagle model is compiled.
@@ -344,14 +353,15 @@ def propose(
                 exceeds_max_model_len = positions[0] >= self.max_model_len
                 # Mask out the position ids that exceed the max model length.
                 # Otherwise, we may get out-of-range error in RoPE.
-                clamped_positions = torch.where\
-                    (exceeds_max_model_len.unsqueeze(0), \
-                     torch.zeros_like(positions), positions)
+                clamped_positions = torch.where(
+                    exceeds_max_model_len.unsqueeze(0),
+                    torch.zeros_like(positions),
+                    positions,
+                )
             else:
                 positions += 1
                 exceeds_max_model_len = positions >= self.max_model_len
-                clamped_positions = torch.where(exceeds_max_model_len, 0,
-                                                positions)
+                clamped_positions = torch.where(exceeds_max_model_len, 0, positions)
 
             # Increment the sequence lengths.
             common_attn_metadata.seq_lens += 1
@@ -359,11 +369,11 @@ def propose(
             # For the requests that exceed the max model length, we set the
             # sequence length to 1 to minimize their overheads in attention.
 
-            common_attn_metadata.seq_lens.masked_fill_(exceeds_max_model_len,
-                                                       1)
+            common_attn_metadata.seq_lens.masked_fill_(exceeds_max_model_len, 1)
 
-            common_attn_metadata.num_computed_tokens_cpu = \
+            common_attn_metadata.num_computed_tokens_cpu = (
                 common_attn_metadata.seq_lens_cpu - 1
+            )
 
             # Compute the slot mapping.
             if self.uses_mrope:
@@ -372,26 +382,28 @@ def propose(
             else:
                 block_numbers = clamped_positions // self.block_size
             block_ids = common_attn_metadata.block_table_tensor.gather(
-                dim=1, index=block_numbers.view(-1, 1))
+                dim=1, index=block_numbers.view(-1, 1)
+            )
             block_ids = block_ids.view(-1)
             if self.uses_mrope:
                 common_attn_metadata.slot_mapping = (
-                    block_ids * self.block_size +
-                    clamped_positions[0] % self.block_size)
+                    block_ids * self.block_size + clamped_positions[0] % self.block_size
+                )
             else:
                 common_attn_metadata.slot_mapping = (
-                    block_ids * self.block_size +
-                    clamped_positions % self.block_size)
+                    block_ids * self.block_size + clamped_positions % self.block_size
+                )
             # Mask out the slot mappings that exceed the max model length.
             # Otherwise, the KV cache will be inadvertently updated with the
             # padding tokens.
             common_attn_metadata.slot_mapping.masked_fill_(
-                exceeds_max_model_len, PADDING_SLOT_ID)
+                exceeds_max_model_len, PADDING_SLOT_ID
+            )
 
             # Rebuild attention metadata
             attn_metadata = attn_metadata_builder.build_for_drafting(  # type: ignore
-                common_attn_metadata=common_attn_metadata,
-                draft_index=token_index + 1)
+                common_attn_metadata=common_attn_metadata, draft_index=token_index + 1
+            )
             for layer_name in self.attn_layer_names:
                 per_layer_attn_metadata[layer_name] = attn_metadata
 
@@ -400,8 +412,9 @@ def propose(
             self._set_positions(batch_size, clamped_positions)
             self.hidden_states[:batch_size] = hidden_states
             if self.supports_mm_inputs:
-                self.inputs_embeds[:batch_size] = \
-                    self.model.get_input_embeddings(input_ids)
+                self.inputs_embeds[:batch_size] = self.model.get_input_embeddings(
+                    input_ids
+                )
 
                 input_ids = None
                 inputs_embeds = self.inputs_embeds[:input_batch_size]
@@ -410,9 +423,9 @@ def propose(
                 inputs_embeds = None
 
             # Run the model.
-            with set_forward_context(per_layer_attn_metadata,
-                                     self.vllm_config,
-                                     num_tokens=input_batch_size):
+            with set_forward_context(
+                per_layer_attn_metadata, self.vllm_config, num_tokens=input_batch_size
+            ):
                 ret_hidden_states = self.model(
                     input_ids=input_ids,
                     positions=self._get_positions(input_batch_size),
@@ -434,10 +447,12 @@ def propose(
         return draft_token_ids
 
     def prepare_next_token_ids_cpu(
-            self, sampled_token_ids: list[list[int]],
-            requests: dict[str,
-                           CachedRequestState], gpu_input_batch: InputBatch,
-            num_scheduled_tokens: dict[str, int]) -> torch.Tensor:
+        self,
+        sampled_token_ids: list[list[int]],
+        requests: dict[str, CachedRequestState],
+        gpu_input_batch: InputBatch,
+        num_scheduled_tokens: dict[str, int],
+    ) -> torch.Tensor:
         """
         This function is used to prepare the inputs for speculative decoding.
         It calculates the next token ids for each request based on the sampled
@@ -456,23 +471,23 @@ def prepare_next_token_ids_cpu(
                 # Get the next token id from the request state.
                 req_id = req_ids[i]
                 req_state = requests[req_id]
-                seq_len = (req_state.num_computed_tokens +
-                           num_scheduled_tokens[req_id])
+                seq_len = req_state.num_computed_tokens + num_scheduled_tokens[req_id]
                 next_token_id = req_state.get_token_id(seq_len)
             next_token_ids.append(next_token_id)
-        next_token_ids = torch.tensor(next_token_ids,
-                                      dtype=torch.int32,
-                                      device=self.input_ids.device)
+        next_token_ids = torch.tensor(
+            next_token_ids, dtype=torch.int32, device=self.input_ids.device
+        )
         return next_token_ids
 
-    def prepare_next_token_ids_padded(self,
-                               common_attn_metadata: CommonAttentionMetadata,
-                               sampled_token_ids: torch.Tensor,
-                               requests: dict[str, CachedRequestState],
-                               gpu_input_batch: InputBatch,
-                               discard_request_indices: torch.Tensor,
-                               num_discarded_requests: int) -> \
-                                tuple[torch.Tensor, torch.Tensor]:
+    def prepare_next_token_ids_padded(
+        self,
+        common_attn_metadata: CommonAttentionMetadata,
+        sampled_token_ids: torch.Tensor,
+        requests: dict[str, CachedRequestState],
+        gpu_input_batch: InputBatch,
+        discard_request_indices: torch.Tensor,
+        num_discarded_requests: int,
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         """
         This function is used to prepare the inputs for speculative decoding.
         It calculates the next token ids and the number of valid sampled tokens
@@ -486,30 +501,34 @@ def prepare_next_token_ids_padded(self,
 
         # Precompute get_token_id for when there is no valid next token
         num_reqs = gpu_input_batch.num_reqs
-        self.backup_next_token_ids.np[:num_reqs] = np.array([
-            requests[gpu_input_batch.req_ids[i]].get_token_id(
-                common_attn_metadata.seq_lens_cpu[i].item())
-            for i in range(num_reqs)
-        ])
+        self.backup_next_token_ids.np[:num_reqs] = np.array(
+            [
+                requests[gpu_input_batch.req_ids[i]].get_token_id(
+                    common_attn_metadata.seq_lens_cpu[i].item()
+                )
+                for i in range(num_reqs)
+            ]
+        )
         self.backup_next_token_ids.copy_to_gpu(num_reqs)
 
         # Mask out the sampled tokens indices that should not be sampled.
-        discard_sampled_tokens_req_indices = \
-            discard_request_indices[:num_discarded_requests]
+        discard_sampled_tokens_req_indices = discard_request_indices[
+            :num_discarded_requests
+        ]
 
         valid_sampled_token_ids_gpu = sampled_token_ids.clone()
         valid_sampled_token_ids_gpu.index_fill_(
-            0, discard_sampled_tokens_req_indices, -1)
+            0, discard_sampled_tokens_req_indices, -1
+        )
 
         # Generate a mask for all valid tokens within those requests
         max_gen_len = sampled_token_ids.shape[-1]
         if max_gen_len == 1:
-            valid_mask = torch.ones_like(valid_sampled_token_ids_gpu,
-                                         dtype=torch.bool)
+            valid_mask = torch.ones_like(valid_sampled_token_ids_gpu, dtype=torch.bool)
         else:
-            valid_mask = (
-                (valid_sampled_token_ids_gpu != -1) &
-                (valid_sampled_token_ids_gpu < gpu_input_batch.vocab_size))
+            valid_mask = (valid_sampled_token_ids_gpu != -1) & (
+                valid_sampled_token_ids_gpu < gpu_input_batch.vocab_size
+            )
 
         # Count the number of valid tokens in each request
         valid_sampled_tokens_count = valid_mask.sum(dim=1)
@@ -521,22 +540,25 @@ def prepare_next_token_ids_padded(self,
         # Get last valid token from each row
         # (assume undefined state where there is no valid token)
         selected_tokens = torch.gather(
-            valid_sampled_token_ids_gpu, 1,
-            last_valid_indices_safe.unsqueeze(1)).squeeze(1)
+            valid_sampled_token_ids_gpu, 1, last_valid_indices_safe.unsqueeze(1)
+        ).squeeze(1)
 
         # Use last token if valid, pre-computed backup if not
         batch_size = valid_sampled_token_ids_gpu.shape[0]
         next_token_ids = torch.where(
-            last_valid_indices != -1, selected_tokens,
-            self.backup_next_token_ids.gpu[:batch_size])
+            last_valid_indices != -1,
+            selected_tokens,
+            self.backup_next_token_ids.gpu[:batch_size],
+        )
 
         return next_token_ids, valid_sampled_tokens_count
 
-    def prepare_inputs_padded(self,
-                                common_attn_metadata: CommonAttentionMetadata,
-                                spec_decode_metadata: SpecDecodeMetadata,
-                                valid_sampled_tokens_count: torch.Tensor) -> \
-                    tuple[CommonAttentionMetadata, torch.Tensor, torch.Tensor]:
+    def prepare_inputs_padded(
+        self,
+        common_attn_metadata: CommonAttentionMetadata,
+        spec_decode_metadata: SpecDecodeMetadata,
+        valid_sampled_tokens_count: torch.Tensor,
+    ) -> tuple[CommonAttentionMetadata, torch.Tensor, torch.Tensor]:
         """
         This function is used to prepare the inputs for speculative decoding
         It updates the common_attn_metadata for speculative decoding,
@@ -545,21 +567,23 @@ def prepare_inputs_padded(self,
         used as padding and filtered out later by `token_indices_to_sample`.
         No blocking CPU operations should be introduced in this function.
         """
-        num_draft_tokens_gpu = torch.cat([
-            spec_decode_metadata.cu_num_draft_tokens[0:1],
-            spec_decode_metadata.cu_num_draft_tokens[1:] -
-            spec_decode_metadata.cu_num_draft_tokens[:-1]
-        ])
+        num_draft_tokens_gpu = torch.cat(
+            [
+                spec_decode_metadata.cu_num_draft_tokens[0:1],
+                spec_decode_metadata.cu_num_draft_tokens[1:]
+                - spec_decode_metadata.cu_num_draft_tokens[:-1],
+            ]
+        )
 
         num_rejected_tokens_gpu = torch.where(
             num_draft_tokens_gpu > 0,
             num_draft_tokens_gpu + 1 - valid_sampled_tokens_count,
-            torch.zeros_like(num_draft_tokens_gpu))
+            torch.zeros_like(num_draft_tokens_gpu),
+        )
 
         query_start_loc_cpu = common_attn_metadata.query_start_loc_cpu
 
-        new_query_len_per_req = (query_start_loc_cpu[1:] -
-                                 query_start_loc_cpu[:-1])
+        new_query_len_per_req = query_start_loc_cpu[1:] - query_start_loc_cpu[:-1]
 
         total_num_tokens = query_start_loc_cpu[-1].item()
         token_indices = self.arange[:total_num_tokens]
@@ -569,8 +593,7 @@ def prepare_inputs_padded(self,
             seq_lens=common_attn_metadata.seq_lens,
             query_start_loc_cpu=query_start_loc_cpu,
             seq_lens_cpu=common_attn_metadata.seq_lens_cpu,
-            num_computed_tokens_cpu=common_attn_metadata.
-            num_computed_tokens_cpu,
+            num_computed_tokens_cpu=common_attn_metadata.num_computed_tokens_cpu,
             num_reqs=common_attn_metadata.num_reqs,
             num_actual_tokens=total_num_tokens,
             max_query_len=new_query_len_per_req.max().item(),
@@ -580,8 +603,9 @@ def prepare_inputs_padded(self,
             causal=True,
         )
 
-        token_indices_to_sample = common_attn_metadata.query_start_loc[1:] - 1 \
-            - num_rejected_tokens_gpu
+        token_indices_to_sample = (
+            common_attn_metadata.query_start_loc[1:] - 1 - num_rejected_tokens_gpu
+        )
 
         return spec_common_attn_metadata, token_indices, token_indices_to_sample
 
@@ -596,10 +620,10 @@ def propose_tree(
         hidden_states: torch.Tensor,
         common_attn_metadata: CommonAttentionMetadata,
     ) -> list[torch.Tensor]:
-        tree_attn_metadata_builder = \
-            self.runner.attn_groups[0][0].get_metadata_builder()
-        assert isinstance(tree_attn_metadata_builder,
-                          TreeAttentionMetadataBuilder)
+        tree_attn_metadata_builder = self.runner.attn_groups[0][
+            0
+        ].get_metadata_builder()
+        assert isinstance(tree_attn_metadata_builder, TreeAttentionMetadataBuilder)
 
         total_num_drafts = self.cu_drafts_per_level[0]
         level_num_drafts = total_num_drafts
@@ -608,31 +632,31 @@ def propose_tree(
         if num_children == 1:
             draft_token_ids = logits.argmax(dim=-1).view(batch_size, -1)
         else:
-            draft_token_ids = torch.topk(logits, num_children,
-                                         dim=-1).indices.view(batch_size, -1)
+            draft_token_ids = torch.topk(logits, num_children, dim=-1).indices.view(
+                batch_size, -1
+            )
         draft_token_ids_list = [draft_token_ids]
         draft_hidden_states = hidden_states.view(batch_size, 1, -1)
 
         # Initialize empty tensors for concatenation with the level outputs.
-        tree_input_ids = torch.empty(0,
-                                     device=self.input_ids.device,
-                                     dtype=self.input_ids.dtype)
-        tree_positions = torch.empty(0,
-                                     device=self.positions.device,
-                                     dtype=self.positions.dtype)
-        tree_hidden_states = torch.empty(0,
-                                         device=self.hidden_states.device,
-                                         dtype=self.hidden_states.dtype)
+        tree_input_ids = torch.empty(
+            0, device=self.input_ids.device, dtype=self.input_ids.dtype
+        )
+        tree_positions = torch.empty(
+            0, device=self.positions.device, dtype=self.positions.dtype
+        )
+        tree_hidden_states = torch.empty(
+            0, device=self.hidden_states.device, dtype=self.hidden_states.dtype
+        )
         # Precompute the draft token positions.
         flattened_draft_positions = (
-            positions.view(batch_size, -1) +
-            self.tree_draft_pos_offsets[:batch_size, :])
+            positions.view(batch_size, -1) + self.tree_draft_pos_offsets[:batch_size, :]
+        )
         tree_depth = len(self.cu_drafts_per_level)
         for level in range(tree_depth - 1):
             # Get draft positions for RoPE.
             draft_positions = positions + (level + 1)
-            exceeds_max_model_len = (positions +
-                                     total_num_drafts) >= self.max_model_len
+            exceeds_max_model_len = (positions + total_num_drafts) >= self.max_model_len
             # Mask out the position ids that exceed the max model length.
             # Otherwise, we may get out-of-range error in RoPE.
             draft_positions = torch.where(
@@ -644,27 +668,28 @@ def propose_tree(
             if level_num_drafts > 1:
                 # Repeat the positions for each draft at this level.
                 draft_positions = draft_positions.repeat_interleave(
-                    level_num_drafts, dim=1)
+                    level_num_drafts, dim=1
+                )
 
             if num_children > 1:
                 # Repeat draft hidden states for each child.
                 draft_hidden_states = draft_hidden_states.repeat_interleave(
-                    num_children, dim=1)
+                    num_children, dim=1
+                )
 
             # Concatenate the draft tokens, positions, and hidden states.
-            tree_input_ids = torch.cat([tree_input_ids, draft_token_ids],
-                                       dim=1)
-            tree_positions = torch.cat([tree_positions, draft_positions],
-                                       dim=1)
+            tree_input_ids = torch.cat([tree_input_ids, draft_token_ids], dim=1)
+            tree_positions = torch.cat([tree_positions, draft_positions], dim=1)
             tree_hidden_states = torch.cat(
-                [tree_hidden_states, draft_hidden_states], dim=1)
+                [tree_hidden_states, draft_hidden_states], dim=1
+            )
 
             # Build new attention metadata for the next level of drafts.
             # This is necessary to support tree attention.
             query_len = total_num_drafts
             common_attn_metadata = replace(
                 common_attn_metadata,
-                query_start_loc=query_len * self.arange[:batch_size + 1],
+                query_start_loc=query_len * self.arange[: batch_size + 1],
                 seq_lens=common_attn_metadata.seq_lens + level_num_drafts,
                 num_actual_tokens=batch_size * query_len,
                 max_query_len=query_len,
@@ -680,20 +705,20 @@ def propose_tree(
                 per_layer_attn_metadata[layer_name] = attn_metadata
 
             # Consider max model length.
-            attn_metadata.max_seq_len = min(attn_metadata.max_seq_len,
-                                            self.max_model_len)
+            attn_metadata.max_seq_len = min(
+                attn_metadata.max_seq_len, self.max_model_len
+            )
             # For the requests that exceed the max model length, we set the
             # sequence length to 1 to minimize their overheads in attention.
             attn_metadata.seq_lens.masked_fill_(exceeds_max_model_len, 1)
 
             # Compute the slot mapping.
-            query_positions = flattened_draft_positions[:, level:level +
-                                                        query_len]
+            query_positions = flattened_draft_positions[:, level : level + query_len]
             block_numbers = query_positions // self.block_size
-            block_ids = attn_metadata.block_table.gather(dim=1,
-                                                         index=block_numbers)
-            slot_mapping = (block_ids * self.block_size +
-                            query_positions % self.block_size)
+            block_ids = attn_metadata.block_table.gather(dim=1, index=block_numbers)
+            slot_mapping = (
+                block_ids * self.block_size + query_positions % self.block_size
+            )
             # Mask out the slot mappings that exceed the max model length.
             # Otherwise, the KV cache will be inadvertently updated with the
             # padding tokens.
@@ -705,19 +730,16 @@ def propose_tree(
             input_ids = tree_input_ids.view(-1)
             self.input_ids[:num_tokens] = input_ids
             self.positions[:num_tokens] = tree_positions.view(-1)
-            self.hidden_states[:num_tokens] = tree_hidden_states.view(
-                num_tokens, -1)
+            self.hidden_states[:num_tokens] = tree_hidden_states.view(num_tokens, -1)
 
-            if self.use_cuda_graph and \
-                    num_tokens <= self.cudagraph_batch_sizes[-1]:
-                num_input_tokens = self.vllm_config.pad_for_cudagraph(
-                    num_tokens)
+            if self.use_cuda_graph and num_tokens <= self.cudagraph_batch_sizes[-1]:
+                num_input_tokens = self.vllm_config.pad_for_cudagraph(num_tokens)
             else:
                 num_input_tokens = num_tokens
             # Run the model.
-            with set_forward_context(per_layer_attn_metadata,
-                                     self.vllm_config,
-                                     num_tokens=num_input_tokens):
+            with set_forward_context(
+                per_layer_attn_metadata, self.vllm_config, num_tokens=num_input_tokens
+            ):
                 last_hidden_states, hidden_states = self.model(
                     input_ids=self.input_ids[:num_input_tokens],
                     positions=self.positions[:num_input_tokens],
@@ -727,28 +749,29 @@ def propose_tree(
 
             # Get the output hidden states for the draft tokens.
             draft_hidden_states = hidden_states[:num_tokens].view(
-                batch_size, query_len, -1)[:, -level_num_drafts:]
+                batch_size, query_len, -1
+            )[:, -level_num_drafts:]
             draft_last_hidden_states = last_hidden_states[:num_tokens].view(
-                batch_size, query_len, -1)[:, -level_num_drafts:]
+                batch_size, query_len, -1
+            )[:, -level_num_drafts:]
 
             # Get the output logits for the draft tokens.
             logits = self.model.compute_logits(
-                draft_last_hidden_states.reshape(batch_size * level_num_drafts,
-                                                 -1))
+                draft_last_hidden_states.reshape(batch_size * level_num_drafts, -1)
+            )
 
             # Sample a draft token for each child at the next tree level.
             num_children = self.child_drafts_per_level[level + 1]
             if num_children == 1:
                 draft_token_ids = logits.argmax(dim=-1).view(batch_size, -1)
             else:
-                draft_token_ids = torch.topk(logits, num_children,
-                                             dim=-1).indices.view(
-                                                 batch_size, -1)
+                draft_token_ids = torch.topk(logits, num_children, dim=-1).indices.view(
+                    batch_size, -1
+                )
             draft_token_ids_list.append(draft_token_ids)
 
             # Update the # drafts counters for the next tree level.
-            level_num_drafts = self.cu_drafts_per_level[level +
-                                                        1] - total_num_drafts
+            level_num_drafts = self.cu_drafts_per_level[level + 1] - total_num_drafts
             total_num_drafts = self.cu_drafts_per_level[level + 1]
         return draft_token_ids_list
 
@@ -784,17 +807,14 @@ def prepare_inputs(
             n + 1 - len(sampled_token_ids[i]) if n > 0 else 0
             for i, n in enumerate(num_draft_tokens)
         ]
-        num_rejected_tokens = torch.tensor(num_rejected_tokens,
-                                           dtype=torch.int32)
+        num_rejected_tokens = torch.tensor(num_rejected_tokens, dtype=torch.int32)
 
         device = common_attn_metadata.query_start_loc.device
         query_start_loc_cpu = common_attn_metadata.query_start_loc_cpu
-        new_seq_lens_cpu = common_attn_metadata.seq_lens_cpu \
-            - num_rejected_tokens
+        new_seq_lens_cpu = common_attn_metadata.seq_lens_cpu - num_rejected_tokens
 
         # [0, q1, q1 + q2, q1 + q2 + q3] -> [q1, q2, q3]
-        new_query_len_per_req = (query_start_loc_cpu[1:] -
-                                 query_start_loc_cpu[:-1])
+        new_query_len_per_req = query_start_loc_cpu[1:] - query_start_loc_cpu[:-1]
         # [q1, q2, q3] -> [q1 - n1, q2 - n2, q3 - n3]
         new_num_tokens_per_req = new_query_len_per_req - num_rejected_tokens
         new_num_tokens_per_req_np = new_num_tokens_per_req.numpy()
@@ -804,7 +824,8 @@ def prepare_inputs(
         new_query_start_loc_cpu = torch.zeros(
             query_start_loc_cpu.shape,
             dtype=torch.int32,
-            pin_memory=is_pin_memory_available())
+            pin_memory=is_pin_memory_available(),
+        )
         new_query_start_loc_np = new_query_start_loc_cpu.numpy()
         np.cumsum(new_num_tokens_per_req_np, out=new_query_start_loc_np[1:])
 
@@ -814,36 +835,36 @@ def prepare_inputs(
         # [0, 2, 6, 9] ->
         # [0, 0, 2, 2, 2, 2, 6, 6, 6]
         #  _r1_  ____r2____  ___r3__
-        new_query_start_locs_expanded = np.repeat(new_query_start_loc_np[:-1],
-                                                  new_num_tokens_per_req_np)
+        new_query_start_locs_expanded = np.repeat(
+            new_query_start_loc_np[:-1], new_num_tokens_per_req_np
+        )
         # [0, 1, 2, 3, 4, 5, 6, 7, 8] ->
         # [0, 1, 0, 1, 2, 3, 0, 1, 2]
         #  _r1_  ____r2____  ___r3__
-        token_offests = self.token_arange_np[:total_num_tokens] \
-            - new_query_start_locs_expanded
+        token_offests = (
+            self.token_arange_np[:total_num_tokens] - new_query_start_locs_expanded
+        )
 
         # Expand starting positions to match token pattern
         # [0, q1, q1 + q2] ->
         # [0, 0, q1, q1, q1, q1, q1 + q2, q1 + q2, q1 + q2]
         #  _r1_  _____r2_______  ___________r3____________
         old_query_start_locs_expanded = np.repeat(
-            query_start_loc_cpu[:-1].numpy(), new_num_tokens_per_req_np)
+            query_start_loc_cpu[:-1].numpy(), new_num_tokens_per_req_np
+        )
         # Final token indices are:
         # [0, 1,                                // req 1
         #  q1 + 0, q1 + 1, q1 + 2, q1 + 3,       // req 2
         #  q1 + q2 + 0, q1 + q2 + 1, q1 + q2 + 2] // req 3
         token_indices_np = token_offests + old_query_start_locs_expanded
-        token_indices = torch.from_numpy(token_indices_np).to(
-            device, non_blocking=True)
+        token_indices = torch.from_numpy(token_indices_np).to(device, non_blocking=True)
 
         spec_common_attn_metadata = CommonAttentionMetadata(
-            query_start_loc=new_query_start_loc_cpu.to(device,
-                                                       non_blocking=True),
+            query_start_loc=new_query_start_loc_cpu.to(device, non_blocking=True),
             seq_lens=new_seq_lens_cpu.to(device, non_blocking=True),
             query_start_loc_cpu=new_query_start_loc_cpu,
             seq_lens_cpu=new_seq_lens_cpu,
-            num_computed_tokens_cpu=common_attn_metadata.
-            num_computed_tokens_cpu,
+            num_computed_tokens_cpu=common_attn_metadata.num_computed_tokens_cpu,
             num_reqs=common_attn_metadata.num_reqs,
             num_actual_tokens=total_num_tokens,
             max_query_len=new_query_len_per_req.max().item(),
@@ -856,45 +877,52 @@ def prepare_inputs(
         return spec_common_attn_metadata, token_indices
 
     def get_model_name(self, model: nn.Module) -> str:
-        if hasattr(model, 'module'):  # multi-GPU
+        if hasattr(model, "module"):  # multi-GPU
             model = model.module
         return model.__class__.__name__
 
     def load_model(self, target_model: nn.Module) -> None:
-        draft_model_config = \
-            self.vllm_config.speculative_config.draft_model_config
+        draft_model_config = self.vllm_config.speculative_config.draft_model_config
         target_attn_layer_names = set(
-            get_layers_from_vllm_config(self.vllm_config, Attention).keys())
+            get_layers_from_vllm_config(self.vllm_config, Attention).keys()
+        )
         # FIXME: support hybrid kv for draft model
         target_indexer_layer_names = set(
-            get_layers_from_vllm_config(self.vllm_config,
-                                        DeepseekV32IndexerCache).keys())
+            get_layers_from_vllm_config(
+                self.vllm_config, DeepseekV32IndexerCache
+            ).keys()
+        )
 
         from vllm.compilation.backends import set_model_tag
+
         with set_model_tag("eagle_head"):
-            self.model = get_model(vllm_config=self.vllm_config,
-                                   model_config=draft_model_config)
+            self.model = get_model(
+                vllm_config=self.vllm_config, model_config=draft_model_config
+            )
 
         draft_attn_layer_names = (
-            get_layers_from_vllm_config(self.vllm_config, Attention).keys() -
-            target_attn_layer_names)
-        indexer_layers = get_layers_from_vllm_config(self.vllm_config,
-                                                     DeepseekV32IndexerCache)
-        draft_indexer_layer_names = (indexer_layers.keys() -
-                                     target_indexer_layer_names)
+            get_layers_from_vllm_config(self.vllm_config, Attention).keys()
+            - target_attn_layer_names
+        )
+        indexer_layers = get_layers_from_vllm_config(
+            self.vllm_config, DeepseekV32IndexerCache
+        )
+        draft_indexer_layer_names = indexer_layers.keys() - target_indexer_layer_names
         self.attn_layer_names = list(draft_attn_layer_names)
         self.indexer_layer_names = list(draft_indexer_layer_names)
 
         if self.indexer_layer_names:
             first_layer = self.indexer_layer_names[0]
             self.draft_indexer_metadata_builder = (
-                indexer_layers[first_layer].get_attn_backend().get_builder_cls(
-                )(
+                indexer_layers[first_layer]
+                .get_attn_backend()
+                .get_builder_cls()(
                     indexer_layers[first_layer].get_kv_cache_spec(),
                     self.indexer_layer_names,
                     self.vllm_config,
                     self.device,
-                ))
+                )
+            )
         else:
             self.draft_indexer_metadata_builder = None
 
@@ -902,38 +930,41 @@ def load_model(self, target_model: nn.Module) -> None:
             # Even if the target model is multimodal, we can also use
             # text-only draft models
             try:
-                dummy_input_ids = torch.tensor([[1]],
-                                               device=self.input_ids.device)
-                self.model.get_input_embeddings(dummy_input_ids,
-                                                multimodal_embeddings=None)
+                dummy_input_ids = torch.tensor([[1]], device=self.input_ids.device)
+                self.model.get_input_embeddings(
+                    dummy_input_ids, multimodal_embeddings=None
+                )
             except (NotImplementedError, AttributeError, TypeError):
                 logger.warning(
                     "Draft model does not support multimodal inputs, "
-                    "falling back to text-only mode")
+                    "falling back to text-only mode"
+                )
                 self.supports_mm_inputs = False
 
         if supports_multimodal(target_model):
             # handle multimodality
-            if (self.get_model_name(target_model) ==
-                    "Qwen2_5_VLForConditionalGeneration"):
-                self.model.config.image_token_index = (
-                    target_model.config.image_token_id)
+            if (
+                self.get_model_name(target_model)
+                == "Qwen2_5_VLForConditionalGeneration"
+            ):
+                self.model.config.image_token_index = target_model.config.image_token_id
             else:
                 self.model.config.image_token_index = (
-                    target_model.config.image_token_index)
+                    target_model.config.image_token_index
+                )
             target_language_model = target_model.get_language_model()
         else:
             target_language_model = target_model
         # share embed_tokens with the target model if needed
         if get_pp_group().world_size == 1:
-            if hasattr(target_language_model.model, 'embed_tokens'):
+            if hasattr(target_language_model.model, "embed_tokens"):
                 target_embed_tokens = target_language_model.model.embed_tokens
-            elif hasattr(target_language_model.model, 'embedding'):
+            elif hasattr(target_language_model.model, "embedding"):
                 target_embed_tokens = target_language_model.model.embedding
             else:
                 raise AttributeError(
-                    "Target model does not have 'embed_tokens' or 'embedding' "
-                    "attribute")
+                    "Target model does not have 'embed_tokens' or 'embedding' attribute"
+                )
 
             # Check if shapes match and we found the embedding
             eagle_shape = self.model.model.embed_tokens.weight.shape
@@ -941,47 +972,53 @@ def load_model(self, target_model: nn.Module) -> None:
             if eagle_shape == target_shape:
                 logger.info(
                     "Assuming the EAGLE head shares the same vocab embedding"
-                    " with the target model.")
+                    " with the target model."
+                )
                 del self.model.model.embed_tokens
                 self.model.model.embed_tokens = target_embed_tokens
             else:
                 logger.info(
                     "The EAGLE head's vocab embedding will be loaded separately"
-                    " from the target model.")
+                    " from the target model."
+                )
         else:
             logger.info(
                 "The EAGLE head's vocab embedding will be loaded separately"
-                " from the target model.")
+                " from the target model."
+            )
 
         # share lm_head with the target model if needed
         # some model definition do not define lm_head explicitly
         # and reuse embed_tokens for lm_head, e.g., CohereForCausalLM
         if self.vllm_config.speculative_config.method != "eagle3":
             if hasattr(target_language_model, "lm_head"):
-                logger.info(
-                    "Loading EAGLE LM head weights from the target model.")
+                logger.info("Loading EAGLE LM head weights from the target model.")
                 self.model.lm_head = target_language_model.lm_head
         else:
-            if (hasattr(self.model, "lm_head")
-                    and hasattr(target_language_model, "lm_head")
-                    and self.model.lm_head.weight.shape
-                    == target_language_model.lm_head.weight.shape):
-                logger.info("Assuming the EAGLE head shares the same lm_head"
-                            " with the target model.")
+            if (
+                hasattr(self.model, "lm_head")
+                and hasattr(target_language_model, "lm_head")
+                and self.model.lm_head.weight.shape
+                == target_language_model.lm_head.weight.shape
+            ):
+                logger.info(
+                    "Assuming the EAGLE head shares the same lm_head"
+                    " with the target model."
+                )
                 del self.model.lm_head
                 self.model.lm_head = target_language_model.lm_head
             else:
                 logger.info(
                     "The EAGLE head's lm_head will be loaded separately"
-                    " from the target model.")
+                    " from the target model."
+                )
 
     @torch.inference_mode()
     def dummy_run(
         self,
         num_tokens: int,
     ) -> None:
-        with set_forward_context(None, self.vllm_config,
-                                 num_tokens=num_tokens):
+        with set_forward_context(None, self.vllm_config, num_tokens=num_tokens):
             if self.supports_mm_inputs:
                 input_ids = None
                 inputs_embeds = self.inputs_embeds[:num_tokens]
@@ -996,8 +1033,7 @@ def dummy_run(
                 inputs_embeds=inputs_embeds,
             )
 
-    def _get_attention_metadata_builder(
-            self) -> list[AttentionMetadataBuilder]:
+    def _get_attention_metadata_builder(self) -> list[AttentionMetadataBuilder]:
         """Find and return the attention metadata builders for EAGLE layers.
 
         Returns:
@@ -1018,11 +1054,11 @@ def _get_attention_metadata_builder(
                 break
 
         assert builder is not None, (
-            "Failed to find attention metadata builder for EAGLE layers.")
+            "Failed to find attention metadata builder for EAGLE layers."
+        )
         return builder
 
-    def validate_same_kv_cache_group(self,
-                                     kv_cache_config: KVCacheConfig) -> None:
+    def validate_same_kv_cache_group(self, kv_cache_config: KVCacheConfig) -> None:
         """
         Validate that all eagle layers belong to the same KVCacheGroup.
         Need this assumption to ensure all eagle layers can use the
@@ -1033,12 +1069,17 @@ def validate_same_kv_cache_group(self,
         for id, kv_cache_group in enumerate(kv_cache_config.kv_cache_groups):
             for layer_name in kv_cache_group.layer_names:
                 kv_cache_groups[layer_name] = id
-        assert len(
-            set([
-                kv_cache_groups[layer_name]
-                for layer_name in self.attn_layer_names
-            ])
-        ) == 1, "All eagle layers should belong to the same kv cache group"
+        assert (
+            len(
+                set(
+                    [
+                        kv_cache_groups[layer_name]
+                        for layer_name in self.attn_layer_names
+                    ]
+                )
+            )
+            == 1
+        ), "All eagle layers should belong to the same kv cache group"
 
 
 # NOTE(woosuk): Currently, the below code is not used and we always use argmax
diff --git a/vllm/v1/spec_decode/medusa.py b/vllm/v1/spec_decode/medusa.py
index 70b29c05c2a5..150dde177ce8 100644
--- a/vllm/v1/spec_decode/medusa.py
+++ b/vllm/v1/spec_decode/medusa.py
@@ -27,10 +27,9 @@ def __init__(
         # Save config parameters
         self.vllm_config = vllm_config
         self.device = device
-        self.max_num_tokens = (
-            vllm_config.scheduler_config.max_num_batched_tokens)
-        self.hidden_size = vllm_config.speculative_config.\
-            draft_model_config.get_hidden_size(
+        self.max_num_tokens = vllm_config.scheduler_config.max_num_batched_tokens
+        self.hidden_size = (
+            vllm_config.speculative_config.draft_model_config.get_hidden_size()
         )
         self.dtype = vllm_config.model_config.dtype
 
@@ -51,16 +50,19 @@ def propose(
 
     def load_model(self, target_model: nn.Module) -> None:
         from vllm.compilation.backends import set_model_tag
+
         with set_model_tag("medusa_head"):
-            self.model = get_model(vllm_config=self.vllm_config,
-                                   model_config=self.vllm_config.
-                                   speculative_config.draft_model_config)
+            self.model = get_model(
+                vllm_config=self.vllm_config,
+                model_config=self.vllm_config.speculative_config.draft_model_config,
+            )
 
     @torch.inference_mode()
     def dummy_run(self, num_tokens: int) -> None:
-        hidden_states = torch.zeros((self.max_num_tokens, self.hidden_size),
-                                    dtype=self.dtype,
-                                    device=self.device)
-        with set_forward_context(None, self.vllm_config,
-                                 num_tokens=num_tokens):
+        hidden_states = torch.zeros(
+            (self.max_num_tokens, self.hidden_size),
+            dtype=self.dtype,
+            device=self.device,
+        )
+        with set_forward_context(None, self.vllm_config, num_tokens=num_tokens):
             self.model(hidden_states)
diff --git a/vllm/v1/spec_decode/metadata.py b/vllm/v1/spec_decode/metadata.py
index b1efb40612d5..d0695244cb16 100644
--- a/vllm/v1/spec_decode/metadata.py
+++ b/vllm/v1/spec_decode/metadata.py
@@ -8,7 +8,6 @@
 
 @dataclass
 class SpecDecodeMetadata:
-
     # [num_tokens]
     draft_token_ids: torch.Tensor
     # [batch_size]
@@ -36,22 +35,19 @@ def make_dummy(
         flattened_draft_token_ids = sum(draft_token_ids, [])
         num_tokens = len(flattened_draft_token_ids)
 
-        draft_token_ids_tensor = torch.tensor(flattened_draft_token_ids,
-                                              dtype=torch.int32,
-                                              device=device)
+        draft_token_ids_tensor = torch.tensor(
+            flattened_draft_token_ids, dtype=torch.int32, device=device
+        )
         cu_num_draft_tokens = np.cumsum(num_draft_tokens, dtype=np.int32)
-        cu_num_draft_tokens_tensor = torch.from_numpy(cu_num_draft_tokens).to(
-            device)
+        cu_num_draft_tokens_tensor = torch.from_numpy(cu_num_draft_tokens).to(device)
 
-        target_logits_indices = torch.zeros(num_tokens,
-                                            dtype=torch.int32,
-                                            device=device)
-        bonus_logits_indices = torch.zeros(batch_size,
-                                           dtype=torch.int32,
-                                           device=device)
-        logits_indices = torch.zeros(num_tokens + batch_size,
-                                     dtype=torch.int32,
-                                     device=device)
+        target_logits_indices = torch.zeros(
+            num_tokens, dtype=torch.int32, device=device
+        )
+        bonus_logits_indices = torch.zeros(batch_size, dtype=torch.int32, device=device)
+        logits_indices = torch.zeros(
+            num_tokens + batch_size, dtype=torch.int32, device=device
+        )
         return cls(
             draft_token_ids=draft_token_ids_tensor,
             num_draft_tokens=num_draft_tokens,
diff --git a/vllm/v1/spec_decode/metrics.py b/vllm/v1/spec_decode/metrics.py
index 282e6f65e7ab..89a8a11a3d56 100644
--- a/vllm/v1/spec_decode/metrics.py
+++ b/vllm/v1/spec_decode/metrics.py
@@ -31,8 +31,10 @@ class SpecDecodingStats:
 
     @classmethod
     def new(cls, num_spec_tokens: int) -> "SpecDecodingStats":
-        return cls(num_spec_tokens=num_spec_tokens,
-                   num_accepted_tokens_per_pos=[0] * num_spec_tokens)
+        return cls(
+            num_spec_tokens=num_spec_tokens,
+            num_accepted_tokens_per_pos=[0] * num_spec_tokens,
+        )
 
     def observe_draft(self, num_draft_tokens: int, num_accepted_tokens: int):
         self.num_drafts += 1
@@ -64,10 +66,10 @@ def reset(self):
     def observe(self, spec_decoding_stats: SpecDecodingStats):
         self.num_drafts.append(spec_decoding_stats.num_drafts)
         self.num_draft_tokens.append(spec_decoding_stats.num_draft_tokens)
-        self.num_accepted_tokens.append(
-            spec_decoding_stats.num_accepted_tokens)
+        self.num_accepted_tokens.append(spec_decoding_stats.num_accepted_tokens)
         self.accepted_tokens_per_pos_lists.append(
-            spec_decoding_stats.num_accepted_tokens_per_pos)
+            spec_decoding_stats.num_accepted_tokens_per_pos
+        )
 
     def log(self, log_fn=logger.info):
         if not self.num_drafts:
@@ -83,8 +85,11 @@ def log(self, log_fn=logger.info):
             draft_throughput = num_draft_tokens / elapsed_time
             accepted_throughput = num_accepted_tokens / elapsed_time
 
-        draft_acceptance_rate = (num_accepted_tokens / num_draft_tokens *
-                                 100 if num_draft_tokens > 0 else float("nan"))
+        draft_acceptance_rate = (
+            num_accepted_tokens / num_draft_tokens * 100
+            if num_draft_tokens > 0
+            else float("nan")
+        )
 
         # Conventionally, mean acceptance length includes the bonus token
         mean_acceptance_length = 1 + (num_accepted_tokens / num_drafts)
@@ -149,27 +154,36 @@ def __init__(
         counter_drafts = self._counter_cls(
             name="vllm:spec_decode_num_drafts",
             documentation="Number of spec decoding drafts.",
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.counter_spec_decode_num_drafts = make_per_engine(
-            counter_drafts, per_engine_labelvalues)
+            counter_drafts, per_engine_labelvalues
+        )
 
         counter_draft_tokens = self._counter_cls(
             name="vllm:spec_decode_num_draft_tokens",
             documentation="Number of draft tokens.",
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.counter_spec_decode_num_draft_tokens = make_per_engine(
-            counter_draft_tokens, per_engine_labelvalues)
+            counter_draft_tokens, per_engine_labelvalues
+        )
 
         counter_accepted_tokens = self._counter_cls(
             name="vllm:spec_decode_num_accepted_tokens",
             documentation="Number of accepted tokens.",
-            labelnames=labelnames)
+            labelnames=labelnames,
+        )
         self.counter_spec_decode_num_accepted_tokens = make_per_engine(
-            counter_accepted_tokens, per_engine_labelvalues)
+            counter_accepted_tokens, per_engine_labelvalues
+        )
 
         assert speculative_config is not None
-        num_spec_tokens = (speculative_config.num_speculative_tokens
-                           if self.spec_decoding_enabled else 0)
+        num_spec_tokens = (
+            speculative_config.num_speculative_tokens
+            if self.spec_decoding_enabled
+            else 0
+        )
         pos_labelnames = labelnames + ["position"]
         base_counter = self._counter_cls(
             name="vllm:spec_decode_num_accepted_tokens_per_pos",
@@ -177,33 +191,33 @@ def __init__(
             labelnames=pos_labelnames,
         )
         self.counter_spec_decode_num_accepted_tokens_per_pos: dict[
-            int, list[prometheus_client.Counter]] = {
-                idx: [
-                    base_counter.labels(*lv, str(pos))
-                    for pos in range(num_spec_tokens)
-                ]
-                for idx, lv in per_engine_labelvalues.items()
-            }
-
-    def observe(self,
-                spec_decoding_stats: SpecDecodingStats,
-                engine_idx: int = 0):
+            int, list[prometheus_client.Counter]
+        ] = {
+            idx: [base_counter.labels(*lv, str(pos)) for pos in range(num_spec_tokens)]
+            for idx, lv in per_engine_labelvalues.items()
+        }
+
+    def observe(self, spec_decoding_stats: SpecDecodingStats, engine_idx: int = 0):
         if not self.spec_decoding_enabled:
             return
         self.counter_spec_decode_num_drafts[engine_idx].inc(
-            spec_decoding_stats.num_drafts)
+            spec_decoding_stats.num_drafts
+        )
         self.counter_spec_decode_num_draft_tokens[engine_idx].inc(
-            spec_decoding_stats.num_draft_tokens)
+            spec_decoding_stats.num_draft_tokens
+        )
         self.counter_spec_decode_num_accepted_tokens[engine_idx].inc(
-            spec_decoding_stats.num_accepted_tokens)
+            spec_decoding_stats.num_accepted_tokens
+        )
         for pos, counter in enumerate(
-                self.
-                counter_spec_decode_num_accepted_tokens_per_pos[engine_idx]):
+            self.counter_spec_decode_num_accepted_tokens_per_pos[engine_idx]
+        ):
             counter.inc(spec_decoding_stats.num_accepted_tokens_per_pos[pos])
 
 
-def make_per_engine(counter: prometheus_client.Counter,
-                    per_engine_labelvalues: dict[int, list[str]]):
+def make_per_engine(
+    counter: prometheus_client.Counter, per_engine_labelvalues: dict[int, list[str]]
+):
     """Create a counter for each label value."""
     return {
         idx: counter.labels(*labelvalues)
diff --git a/vllm/v1/spec_decode/ngram_proposer.py b/vllm/v1/spec_decode/ngram_proposer.py
index aed050a3540c..e2f83cb24aa9 100644
--- a/vllm/v1/spec_decode/ngram_proposer.py
+++ b/vllm/v1/spec_decode/ngram_proposer.py
@@ -9,7 +9,6 @@
 
 
 class NgramProposer:
-
     def __init__(self, vllm_config: VllmConfig):
         assert vllm_config.speculative_config is not None
         assert vllm_config.speculative_config.prompt_lookup_min is not None
@@ -28,8 +27,7 @@ def __init__(self, vllm_config: VllmConfig):
 
         # Pre-allocate buffers for numba batch propose.
         max_num_seqs = vllm_config.scheduler_config.max_num_seqs
-        self.valid_ngram_draft = np.zeros((max_num_seqs, self.k),
-                                          dtype=np.int32)
+        self.valid_ngram_draft = np.zeros((max_num_seqs, self.k), dtype=np.int32)
         self.valid_ngram_num_drafts = np.zeros((max_num_seqs), dtype=np.int32)
 
         # Threshold of total number of tokens in the batch to enable
@@ -55,9 +53,13 @@ def __init__(self, vllm_config: VllmConfig):
 
         # Trigger Numba JIT compilation for N-gram proposer.
         # This usually takes less than 1 second.
-        self.propose([[]] * 1024, [""] * 1024, np.zeros(1024, dtype=np.int32),
-                     np.zeros((1024, self.max_model_len), dtype=np.int32),
-                     set())
+        self.propose(
+            [[]] * 1024,
+            [""] * 1024,
+            np.zeros(1024, dtype=np.int32),
+            np.zeros((1024, self.max_model_len), dtype=np.int32),
+            set(),
+        )
 
     def batch_propose(
         self,
@@ -67,20 +69,20 @@ def batch_propose(
         token_ids_cpu: np.ndarray,
     ) -> list[list[int]]:
         """Batch version of ngram proposer using numba for acceleration.
-        
+
         Args:
-            valid_ngram_requests: 
+            valid_ngram_requests:
                 Set of indices of requests that need ngram proposals.
-            num_tokens_no_spec: 
-                Numpy array of shape (batch_size,) representing the number 
+            num_tokens_no_spec:
+                Numpy array of shape (batch_size,) representing the number
                 of tokens without speculative tokens for each request.
-            token_ids_cpu: 
-                Numpy array of shape (batch_size, max_model_len) 
+            token_ids_cpu:
+                Numpy array of shape (batch_size, max_model_len)
                 representing the token IDs for each request.
 
         Returns:
-            list[list[int]]: 
-                A list where each element is a list of proposed 
+            list[list[int]]:
+                A list where each element is a list of proposed
                 token IDs for the corresponding request.
         """
         draft_token_ids: list[list[int]] = []
@@ -96,26 +98,32 @@ def batch_propose(
             total_tokens = np.sum(num_tokens_no_spec)
             if total_tokens >= self.num_tokens_threshold:
                 final_num_threads = max(
-                    1, min(self.num_numba_thread_available,
-                           num_ngram_requests))
+                    1, min(self.num_numba_thread_available, num_ngram_requests)
+                )
                 set_num_threads(final_num_threads)
             else:
                 set_num_threads(1)
 
-            batch_propose_numba(valid_ngram_requests, num_tokens_no_spec,
-                                token_ids_cpu, self.min_n, self.max_n,
-                                self.max_model_len, self.k,
-                                self.valid_ngram_draft,
-                                self.valid_ngram_num_drafts)
+            batch_propose_numba(
+                valid_ngram_requests,
+                num_tokens_no_spec,
+                token_ids_cpu,
+                self.min_n,
+                self.max_n,
+                self.max_model_len,
+                self.k,
+                self.valid_ngram_draft,
+                self.valid_ngram_num_drafts,
+            )
 
             # Restore original number of threads.
             set_num_threads(original_num_numba_threads)
 
         for i in range(num_requests):
-            if i in valid_ngram_requests and \
-                self.valid_ngram_num_drafts[i] > 0:
-                draft_token_ids.append(self.valid_ngram_draft[
-                    i, :self.valid_ngram_num_drafts[i]].tolist())
+            if i in valid_ngram_requests and self.valid_ngram_num_drafts[i] > 0:
+                draft_token_ids.append(
+                    self.valid_ngram_draft[i, : self.valid_ngram_num_drafts[i]].tolist()
+                )
             else:
                 draft_token_ids.append([])
 
@@ -129,7 +137,6 @@ def propose(
         token_ids_cpu: np.ndarray,
         spec_decode_unsupported_reqs: set,
     ) -> list[list[int]]:
-
         # find which requests need ngram proposals
         valid_ngram_requests = []
         for i, sampled_ids in enumerate(sampled_token_ids):
@@ -166,12 +173,17 @@ def load_model(self, *args, **kwargs):
 
 
 @njit(parallel=True)
-def batch_propose_numba(valid_ngram_requests: list,
-                        num_tokens_no_spec: np.ndarray,
-                        token_ids_cpu: np.ndarray, min_n: int, max_n: int,
-                        max_model_len: int, k: int,
-                        valid_ngram_draft: np.ndarray,
-                        valid_ngram_num_drafts: np.ndarray):
+def batch_propose_numba(
+    valid_ngram_requests: list,
+    num_tokens_no_spec: np.ndarray,
+    token_ids_cpu: np.ndarray,
+    min_n: int,
+    max_n: int,
+    max_model_len: int,
+    k: int,
+    valid_ngram_draft: np.ndarray,
+    valid_ngram_num_drafts: np.ndarray,
+):
     for i in prange(len(valid_ngram_requests)):
         idx = valid_ngram_requests[i]
         num_tokens = num_tokens_no_spec[idx]
@@ -181,19 +193,22 @@ def batch_propose_numba(valid_ngram_requests: list,
             min_ngram=min_n,
             max_ngram=max_n,
             max_model_len=max_model_len,
-            k=k)
+            k=k,
+        )
 
         valid_ngram_num_drafts[i] = drafter_output.shape[0]
         if len(drafter_output):
-            valid_ngram_draft[i, :drafter_output.shape[0]] = drafter_output
+            valid_ngram_draft[i, : drafter_output.shape[0]] = drafter_output
 
 
 @jit(nopython=True)
-def _find_longest_matched_ngram_and_propose_tokens(origin_tokens: np.ndarray,
-                                                   min_ngram: int,
-                                                   max_ngram: int,
-                                                   max_model_len: int,
-                                                   k: int) -> np.ndarray:
+def _find_longest_matched_ngram_and_propose_tokens(
+    origin_tokens: np.ndarray,
+    min_ngram: int,
+    max_ngram: int,
+    max_model_len: int,
+    k: int,
+) -> np.ndarray:
     """
     Find the longest n-gram which matches the suffix of the given tokens
     whose length is within [min_ngram, max_ngram] (inclusive).
@@ -203,12 +218,12 @@ def _find_longest_matched_ngram_and_propose_tokens(origin_tokens: np.ndarray,
     # Do not generate draft tokens is context is shorter than minimum n-gram
     total_token = origin_tokens.shape[0]
     if total_token < min_ngram:
-        return np.empty((0, ), dtype=origin_tokens.dtype)
+        return np.empty((0,), dtype=origin_tokens.dtype)
 
     # Do not generate draft tokens beyond the max model length.
     k = min(k, max_model_len - total_token)
     if k <= 0:
-        return np.empty((0, ), dtype=origin_tokens.dtype)
+        return np.empty((0,), dtype=origin_tokens.dtype)
 
     # Flip tokens, and the goal become to find longest ngram
     # on the rightmost position which matches the prefix with
@@ -265,7 +280,7 @@ def _find_longest_matched_ngram_and_propose_tokens(origin_tokens: np.ndarray,
 
     if longest_ngram < min_ngram:
         # No valid ngram is found
-        return np.empty((0, ), dtype=origin_tokens.dtype)
+        return np.empty((0,), dtype=origin_tokens.dtype)
 
     # Flip the position back, so in origin_tokens,
     # origin_tokens[total_token-1-position:total_token-1-position+longest_ngram]
@@ -273,4 +288,4 @@ def _find_longest_matched_ngram_and_propose_tokens(origin_tokens: np.ndarray,
     # total_token-1-position+longest_ngram
     start_position = total_token - 1 - position + longest_ngram
     k = min(k, total_token - start_position)
-    return origin_tokens[start_position:start_position + k]
+    return origin_tokens[start_position : start_position + k]
diff --git a/vllm/v1/spec_decode/utils.py b/vllm/v1/spec_decode/utils.py
index 1116179dc5b6..1901c6fc9f14 100644
--- a/vllm/v1/spec_decode/utils.py
+++ b/vllm/v1/spec_decode/utils.py
@@ -7,8 +7,10 @@
 
 def is_spec_decode_unsupported(sampling_params: SamplingParams) -> bool:
     """True if request is incompatible with speculative decoding"""
-    return (sampling_params.frequency_penalty != 0.0
-            or sampling_params.presence_penalty != 0.0
-            or sampling_params.repetition_penalty != 1.0
-            or sampling_params.min_p > _SAMPLING_EPS
-            or sampling_params.logprobs is not None)
+    return (
+        sampling_params.frequency_penalty != 0.0
+        or sampling_params.presence_penalty != 0.0
+        or sampling_params.repetition_penalty != 1.0
+        or sampling_params.min_p > _SAMPLING_EPS
+        or sampling_params.logprobs is not None
+    )
diff --git a/vllm/v1/structured_output/__init__.py b/vllm/v1/structured_output/__init__.py
index 13c33d3edf14..1f51f98ca93c 100644
--- a/vllm/v1/structured_output/__init__.py
+++ b/vllm/v1/structured_output/__init__.py
@@ -12,8 +12,10 @@
 from vllm.transformers_utils.tokenizer import init_tokenizer_from_configs
 from vllm.utils import LazyLoader
 from vllm.v1.structured_output.backend_guidance import GuidanceBackend
-from vllm.v1.structured_output.backend_types import (StructuredOutputBackend,
-                                                     StructuredOutputGrammar)
+from vllm.v1.structured_output.backend_types import (
+    StructuredOutputBackend,
+    StructuredOutputGrammar,
+)
 from vllm.v1.structured_output.backend_xgrammar import XgrammarBackend
 
 if TYPE_CHECKING:
@@ -48,8 +50,7 @@ def __init__(self, vllm_config: VllmConfig):
             # - at least 1 CPU
             # - at most half the number of CPUs or 8, whichever is less
             max_workers = max(1, min(multiprocessing.cpu_count() // 2, 8))
-            self.executor_for_fillmask = ThreadPoolExecutor(
-                max_workers=max_workers)
+            self.executor_for_fillmask = ThreadPoolExecutor(max_workers=max_workers)
 
         if not self.vllm_config.model_config.skip_tokenizer_init:
             # The default max_workers if not specified is the number of
@@ -60,12 +61,15 @@ def __init__(self, vllm_config: VllmConfig):
             max_workers = max(1, (multiprocessing.cpu_count() + 1) // 2)
             self.executor = ThreadPoolExecutor(max_workers=max_workers)
             self.tokenizer = init_tokenizer_from_configs(
-                model_config=self.vllm_config.model_config)
-            reasoning_parser = \
-                    self.vllm_config.structured_outputs_config.reasoning_parser
+                model_config=self.vllm_config.model_config
+            )
+            reasoning_parser = (
+                self.vllm_config.structured_outputs_config.reasoning_parser
+            )
             if reasoning_parser:
                 reasoner_cls = ReasoningParserManager.get_reasoning_parser(
-                    reasoning_parser)
+                    reasoning_parser
+                )
                 self.reasoner = reasoner_cls(tokenizer=self.tokenizer)
 
     def grammar_init(self, request: Request) -> None:
@@ -73,8 +77,10 @@ def grammar_init(self, request: Request) -> None:
             return
 
         if TYPE_CHECKING:
-            assert request.sampling_params is not None and \
-                request.sampling_params.structured_outputs is not None
+            assert (
+                request.sampling_params is not None
+                and request.sampling_params.structured_outputs is not None
+            )
 
         # Initialize the backend the first time it is needed.
         #
@@ -98,8 +104,7 @@ def grammar_init(self, request: Request) -> None:
                     vocab_size=vocab_size,
                 )
             elif backend == "outlines":
-                from vllm.v1.structured_output.backend_outlines import (
-                    OutlinesBackend)
+                from vllm.v1.structured_output.backend_outlines import OutlinesBackend
 
                 self.backend = OutlinesBackend(
                     self.vllm_config,
@@ -108,15 +113,16 @@ def grammar_init(self, request: Request) -> None:
                 )
             elif backend == "lm-format-enforcer":
                 from vllm.v1.structured_output.backend_lm_format_enforcer import (  # noqa: E501
-                    LMFormatEnforcerBackend)
+                    LMFormatEnforcerBackend,
+                )
+
                 self.backend = LMFormatEnforcerBackend(
                     self.vllm_config,
                     tokenizer=self.tokenizer,
                     vocab_size=vocab_size,
                 )
             else:
-                raise ValueError(
-                    f"Unsupported structured output backend: {backend}")
+                raise ValueError(f"Unsupported structured output backend: {backend}")
 
         grammar = self.executor.submit(self._async_create_grammar, request)
         request.structured_output_request.grammar = grammar  # type: ignore[assignment]
@@ -169,8 +175,9 @@ def grammar_bitmask(
 
         max_num_spec_tokens = 0
         if self.vllm_config.speculative_config is not None:
-            max_num_spec_tokens = \
+            max_num_spec_tokens = (
                 self.vllm_config.speculative_config.num_speculative_tokens
+            )
 
         if self._grammar_bitmask is None:
             assert self.backend is not None
@@ -179,22 +186,23 @@ def grammar_bitmask(
             # Allocate a bitmask for each token needing to be checked:
             # one for each speculative position, and one more for the
             # bonus token / non-speculative token.
-            self._grammar_bitmask = \
-                self.backend.allocate_token_bitmask(
-                    max_batch_size * (1 + max_num_spec_tokens))
+            self._grammar_bitmask = self.backend.allocate_token_bitmask(
+                max_batch_size * (1 + max_num_spec_tokens)
+            )
 
         # Generate a batched bitmask for all structured output requests.
         # When speculative decoding is enabled, we need to include multiple
         # masks for each request, one for each possible bonus token position.
         # These are stored inline in the tensor and unpacked by the gpu runner.
         cumulative_index = 0
-        ordered_seq = sorted(structured_output_request_ids.items(),
-                             key=lambda x: x[1])
+        ordered_seq = sorted(structured_output_request_ids.items(), key=lambda x: x[1])
 
         # Optimized parallel filling of bitmasks for
         # non-spec, large-batch-size cases
-        if len(ordered_seq) > self.fill_bitmask_parallel_threshold and \
-                max_num_spec_tokens == 0:
+        if (
+            len(ordered_seq) > self.fill_bitmask_parallel_threshold
+            and max_num_spec_tokens == 0
+        ):
             promises = []
             batch = []
             for req_id, _ in ordered_seq:
@@ -205,8 +213,9 @@ def grammar_bitmask(
                     assert structured_output_request.grammar is not None
 
                 apply_bitmask = self.should_fill_bitmask(request)
-                batch.append((structured_output_request.grammar,
-                              cumulative_index, apply_bitmask))
+                batch.append(
+                    (structured_output_request.grammar, cumulative_index, apply_bitmask)
+                )
                 if len(batch) == self.fill_bitmask_parallel_batch_size:
                     promises.append(self._async_submit_fill_bitmask(batch))
                     batch = []
@@ -232,18 +241,28 @@ def grammar_bitmask(
                 state_advancements = 0
                 req_tokens = scheduled_spec_decode_tokens.get(req_id, [])
                 for i, token in enumerate(req_tokens + [None]):
-                    self._fill_bitmasks([(structured_output_request.grammar,
-                                          cumulative_index, apply_bitmask)])
-
-                    if apply_bitmask and token is not None and \
-                        not structured_output_request.grammar.is_terminated():
+                    self._fill_bitmasks(
+                        [
+                            (
+                                structured_output_request.grammar,
+                                cumulative_index,
+                                apply_bitmask,
+                            )
+                        ]
+                    )
+
+                    if (
+                        apply_bitmask
+                        and token is not None
+                        and not structured_output_request.grammar.is_terminated()
+                    ):
                         assert structured_output_request.grammar.accept_tokens(
-                            req_id, [token])
+                            req_id, [token]
+                        )
                         state_advancements += 1
                     cumulative_index += 1
                 if state_advancements > 0:
-                    structured_output_request.grammar.rollback(
-                        state_advancements)
+                    structured_output_request.grammar.rollback(state_advancements)
 
         bitmask_tensor = self._grammar_bitmask
         if cumulative_index < bitmask_tensor.shape[0]:
@@ -258,8 +277,9 @@ def should_fill_bitmask(self, request: Request) -> bool:
         if self.reasoner is not None:
             assert request.structured_output_request is not None
             if request.structured_output_request.reasoning_ended is None:
-                request.structured_output_request.reasoning_ended = \
+                request.structured_output_request.reasoning_ended = (
                     self.reasoner.is_reasoning_end(request.prompt_token_ids)
+                )
             return request.structured_output_request.reasoning_ended
         return True
 
diff --git a/vllm/v1/structured_output/backend_guidance.py b/vllm/v1/structured_output/backend_guidance.py
index e06ab6377de3..a48a705e8fae 100644
--- a/vllm/v1/structured_output/backend_guidance.py
+++ b/vllm/v1/structured_output/backend_guidance.py
@@ -14,9 +14,11 @@
 from vllm.logger import init_logger
 from vllm.sampling_params import SamplingParams
 from vllm.utils import LazyLoader
-from vllm.v1.structured_output.backend_types import (StructuredOutputBackend,
-                                                     StructuredOutputGrammar,
-                                                     StructuredOutputOptions)
+from vllm.v1.structured_output.backend_types import (
+    StructuredOutputBackend,
+    StructuredOutputGrammar,
+    StructuredOutputOptions,
+)
 from vllm.v1.structured_output.request import get_structured_output_key
 
 if TYPE_CHECKING:
@@ -26,8 +28,7 @@
 else:
     llguidance = LazyLoader("llguidance", globals(), "llguidance")
     llguidance_hf = LazyLoader("llguidance.hf", globals(), "llguidance.hf")
-    llguidance_torch = LazyLoader("llguidance.torch", globals(),
-                                  "llguidance.torch")
+    llguidance_torch = LazyLoader("llguidance.torch", globals(), "llguidance.torch")
 
 logger = init_logger(__name__)
 
@@ -36,16 +37,18 @@ def _walk_json_for_additional_properties(data: object):
     if isinstance(data, dict):
         for value in data.values():
             _walk_json_for_additional_properties(value)
-        if 'additionalProperties' not in data and \
-            ('properties' in data or 'patternProperties' in data):
-            data['additionalProperties'] = False
+        if "additionalProperties" not in data and (
+            "properties" in data or "patternProperties" in data
+        ):
+            data["additionalProperties"] = False
     elif isinstance(data, list):
         for item in data:
             _walk_json_for_additional_properties(item)
 
 
 def process_for_additional_properties(
-        guide_json: Union[str, dict[str, Any]]) -> dict[str, Any]:
+    guide_json: Union[str, dict[str, Any]],
+) -> dict[str, Any]:
     if isinstance(guide_json, str):
         guide_json_obj = json.loads(guide_json)
     else:
@@ -57,21 +60,27 @@ def process_for_additional_properties(
 
 @dataclass
 class GuidanceBackend(StructuredOutputBackend):
-
     def __post_init__(self):
-        self.disable_any_whitespace = \
+        self.disable_any_whitespace = (
             self.vllm_config.structured_outputs_config.disable_any_whitespace
-        self.disable_additional_properties = \
+        )
+        self.disable_additional_properties = (
             self.vllm_config.structured_outputs_config.disable_additional_properties
+        )
 
         self.ll_tokenizer = llguidance_hf.from_tokenizer(
-            self.tokenizer, self.vocab_size)
+            self.tokenizer, self.vocab_size
+        )
 
-    def compile_grammar(self, request_type: StructuredOutputOptions,
-                        grammar_spec: str) -> StructuredOutputGrammar:
+    def compile_grammar(
+        self, request_type: StructuredOutputOptions, grammar_spec: str
+    ) -> StructuredOutputGrammar:
         self.serialized_grammar = serialize_guidance_grammar(
-            request_type, grammar_spec, self.disable_any_whitespace,
-            self.disable_additional_properties)
+            request_type,
+            grammar_spec,
+            self.disable_any_whitespace,
+            self.disable_additional_properties,
+        )
 
         ll_matcher = llguidance.LLMatcher(
             self.ll_tokenizer,
@@ -90,7 +99,8 @@ def compile_grammar(self, request_type: StructuredOutputOptions,
 
     def allocate_token_bitmask(self, max_num_seqs: int):
         return llguidance_torch.allocate_token_bitmask(
-            max_num_seqs, self.ll_tokenizer.vocab_size)
+            max_num_seqs, self.ll_tokenizer.vocab_size
+        )
 
     def destroy(self):
         pass
@@ -178,15 +188,17 @@ def serialize_guidance_grammar(
     disable_any_whitespace: bool = False,
     disable_additional_properties: bool = False,
 ) -> str:
-
-    def _process_schema(grammar_spec: Union[str, dict[str, Any]], ) -> str:
+    def _process_schema(
+        grammar_spec: Union[str, dict[str, Any]],
+    ) -> str:
         if disable_additional_properties:
             grammar_spec = process_for_additional_properties(grammar_spec)
         return llguidance.LLMatcher.grammar_from_json_schema(
             grammar_spec,
             defaults={
                 "whitespace_flexible": not disable_any_whitespace,
-            })
+            },
+        )
 
     if request_type == StructuredOutputOptions.JSON:
         return _process_schema(grammar_spec)
@@ -195,7 +207,8 @@ def _process_schema(grammar_spec: Union[str, dict[str, Any]], ) -> str:
             '{"type": "object"}',
             defaults={
                 "whitespace_flexible": not disable_any_whitespace,
-            })
+            },
+        )
     else:
         if request_type == StructuredOutputOptions.REGEX:
             tp = "regex"
@@ -215,29 +228,32 @@ def _process_schema(grammar_spec: Union[str, dict[str, Any]], ) -> str:
                 trig = next((t for t in triggers if begin.startswith(t)), None)
                 if trig is None:
                     raise ValueError(
-                        f"Trigger {begin} not found in triggers {triggers}")
+                        f"Trigger {begin} not found in triggers {triggers}"
+                    )
                 tags.append(
                     llguidance.StructTag(
                         trigger=trig,
                         begin=s["begin"],
                         grammar=_process_schema(s["schema"]),
                         end=s["end"],
-                    ))
+                    )
+                )
             if not tags:
-                raise ValueError(
-                    "No structural tags found in the grammar spec.")
+                raise ValueError("No structural tags found in the grammar spec.")
             return llguidance.StructTag.to_grammar(tags)
         else:
-            logger.error("Validation should have already occurred. "
-                         "Please file an issue.")
-            raise ValueError("grammar is not of valid supported types. "
-                             f"({request_type!s})")
+            logger.error(
+                "Validation should have already occurred. Please file an issue."
+            )
+            raise ValueError(
+                f"grammar is not of valid supported types. ({request_type!s})"
+            )
         return llguidance.grammar_from(tp, grammar_spec)
 
 
 def validate_guidance_grammar(
-        sampling_params: SamplingParams,
-        tokenizer: Optional[llguidance.LLTokenizer] = None) -> None:
+    sampling_params: SamplingParams, tokenizer: Optional[llguidance.LLTokenizer] = None
+) -> None:
     tp, grm = get_structured_output_key(sampling_params)
     guidance_grm = serialize_guidance_grammar(tp, grm)
     err = llguidance.LLMatcher.validate_grammar(guidance_grm, tokenizer)
diff --git a/vllm/v1/structured_output/backend_lm_format_enforcer.py b/vllm/v1/structured_output/backend_lm_format_enforcer.py
index 465b2428f893..d9e484092d6a 100644
--- a/vllm/v1/structured_output/backend_lm_format_enforcer.py
+++ b/vllm/v1/structured_output/backend_lm_format_enforcer.py
@@ -13,26 +13,31 @@
 
 from vllm.sampling_params import SamplingParams
 from vllm.utils import LazyLoader
-from vllm.v1.structured_output.backend_types import (StructuredOutputBackend,
-                                                     StructuredOutputGrammar,
-                                                     StructuredOutputOptions)
+from vllm.v1.structured_output.backend_types import (
+    StructuredOutputBackend,
+    StructuredOutputGrammar,
+    StructuredOutputOptions,
+)
 
 if TYPE_CHECKING:
     import lmformatenforcer
     import lmformatenforcer.integrations.vllm as lmfe_vllm
 else:
-    lmformatenforcer = LazyLoader("lmformatenforcer", globals(),
-                                  "lmformatenforcer")
-    lmfe_vllm = LazyLoader("lmformatenforcer.integrations.vllm", globals(),
-                           "lmformatenforcer.integrations.vllm")
+    lmformatenforcer = LazyLoader("lmformatenforcer", globals(), "lmformatenforcer")
+    lmfe_vllm = LazyLoader(
+        "lmformatenforcer.integrations.vllm",
+        globals(),
+        "lmformatenforcer.integrations.vllm",
+    )
 
 
 @lru_cache
 def _cached_build_vllm_token_enforcer_tokenizer_data(
-        tokenizer: PreTrainedTokenizerBase,
-        vocab_size: int) -> lmfe_vllm.TokenEnforcerTokenizerData:
+    tokenizer: PreTrainedTokenizerBase, vocab_size: int
+) -> lmfe_vllm.TokenEnforcerTokenizerData:
     return lmfe_vllm.build_vllm_token_enforcer_tokenizer_data(
-        tokenizer, use_bitmask=True, vocab_size=vocab_size)
+        tokenizer, use_bitmask=True, vocab_size=vocab_size
+    )
 
 
 @dataclass
@@ -44,7 +49,8 @@ def accept_tokens(self, request_id: str, tokens: list[int]) -> bool:
         original_len = len(self.current_tokens_prefix)
         for token in tokens:
             if not self.token_enforcer.get_allowed_tokens(
-                    self.current_tokens_prefix).is_token_allowed(token):
+                self.current_tokens_prefix
+            ).is_token_allowed(token):
                 # Rollback partial updates to ensure atomicity.
                 del self.current_tokens_prefix[original_len:]
                 return False
@@ -56,8 +62,8 @@ def validate_tokens(self, tokens: list[int]) -> list[int]:
             prefix = tokens[:prefix_length]
             next_token = tokens[prefix_length]
             if not self.token_enforcer.get_allowed_tokens(
-                    self.current_tokens_prefix +
-                    prefix).is_token_allowed(next_token):
+                self.current_tokens_prefix + prefix
+            ).is_token_allowed(next_token):
                 break
         else:
             return tokens
@@ -69,14 +75,16 @@ def rollback(self, num_tokens: int) -> None:
 
     def fill_bitmask(self, bitmask: torch.Tensor, batch_index: int) -> None:
         allowed_tokens = self.token_enforcer.get_allowed_tokens(
-            self.current_tokens_prefix)
+            self.current_tokens_prefix
+        )
         bitmask[batch_index] = allowed_tokens.allowed_tokens
 
     def is_terminated(self) -> bool:
         # We are considered terminated if the prefix ends with eos_token_id
-        return_value = len(
-            self.current_tokens_prefix) > 0 and self.current_tokens_prefix[
-                -1] == self.token_enforcer.eos_token_id
+        return_value = (
+            len(self.current_tokens_prefix) > 0
+            and self.current_tokens_prefix[-1] == self.token_enforcer.eos_token_id
+        )
         return return_value
 
     def reset(self):
@@ -85,18 +93,18 @@ def reset(self):
 
 @dataclass
 class LMFormatEnforcerBackend(StructuredOutputBackend):
-
     def __post_init__(self):
         self.tokenizer_data = _cached_build_vllm_token_enforcer_tokenizer_data(
-            self.tokenizer, self.vocab_size)
+            self.tokenizer, self.vocab_size
+        )
 
-    def compile_grammar(self, request_type: StructuredOutputOptions,
-                        grammar_spec: str) -> StructuredOutputGrammar:
+    def compile_grammar(
+        self, request_type: StructuredOutputOptions, grammar_spec: str
+    ) -> StructuredOutputGrammar:
         character_level_parser: lmformatenforcer.CharacterLevelParser
         if request_type == StructuredOutputOptions.JSON:
             spec_dict = json.loads(grammar_spec)
-            character_level_parser = lmformatenforcer.JsonSchemaParser(
-                spec_dict)
+            character_level_parser = lmformatenforcer.JsonSchemaParser(spec_dict)
         elif request_type == StructuredOutputOptions.JSON_OBJECT:
             character_level_parser = lmformatenforcer.JsonSchemaParser(None)
         elif request_type == StructuredOutputOptions.REGEX:
@@ -104,14 +112,17 @@ def compile_grammar(self, request_type: StructuredOutputOptions,
         elif request_type == StructuredOutputOptions.CHOICE:
             choices = ast.literal_eval(grammar_spec)
             character_level_parser = lmformatenforcer.UnionParser(
-                [lmformatenforcer.StringParser(choice) for choice in choices])
+                [lmformatenforcer.StringParser(choice) for choice in choices]
+            )
         else:
             raise ValueError(
-                "Invalid request type for LM Format Enforcer backend"
-                f"({request_type!s})")
+                f"Invalid request type for LM Format Enforcer backend({request_type!s})"
+            )
         max_rollback_tokens = (
             self.vllm_config.speculative_config.num_speculative_tokens
-            if self.vllm_config.speculative_config is not None else 0)
+            if self.vllm_config.speculative_config is not None
+            else 0
+        )
 
         if max_rollback_tokens > 0:
             raise ValueError(
@@ -136,8 +147,7 @@ def destroy(self):
         pass
 
 
-def validate_structured_output_request_lm_format_enforcer(
-        params: SamplingParams):
+def validate_structured_output_request_lm_format_enforcer(params: SamplingParams):
     if params.structured_outputs is None:
         return
 
@@ -163,5 +173,7 @@ def validate_structured_output_request_lm_format_enforcer(
     elif so_params.choice:
         return
     elif so_params.grammar:
-        raise ValueError("LM Format Enforcer structured outputs backend "
-                         "does not support grammar specifications")
+        raise ValueError(
+            "LM Format Enforcer structured outputs backend "
+            "does not support grammar specifications"
+        )
diff --git a/vllm/v1/structured_output/backend_outlines.py b/vllm/v1/structured_output/backend_outlines.py
index e5e638a6ad76..c9875337179e 100644
--- a/vllm/v1/structured_output/backend_outlines.py
+++ b/vllm/v1/structured_output/backend_outlines.py
@@ -15,20 +15,23 @@
 
 from vllm.sampling_params import SamplingParams
 from vllm.utils import LazyLoader
-from vllm.v1.structured_output.backend_types import (StructuredOutputBackend,
-                                                     StructuredOutputGrammar,
-                                                     StructuredOutputOptions)
-from vllm.v1.structured_output.utils import (OutlinesVocabulary,
-                                             get_outlines_cache,
-                                             get_outlines_vocabulary)
+from vllm.v1.structured_output.backend_types import (
+    StructuredOutputBackend,
+    StructuredOutputGrammar,
+    StructuredOutputOptions,
+)
+from vllm.v1.structured_output.utils import (
+    OutlinesVocabulary,
+    get_outlines_cache,
+    get_outlines_vocabulary,
+)
 
 if TYPE_CHECKING:
     import outlines_core as oc
     import outlines_core.json_schema as json_schema
 else:
     oc = LazyLoader("oc", globals(), "outlines_core")
-    json_schema = LazyLoader("json_schema", globals(),
-                             "outlines_core.json_schema")
+    json_schema = LazyLoader("json_schema", globals(), "outlines_core.json_schema")
 
 # Python 3.11+ sre_parse and sre_constants
 # are deprecated, so we must import them from re
@@ -46,13 +49,13 @@
 
 @dataclass
 class OutlinesBackend(StructuredOutputBackend):
-
     def __post_init__(self):
         self.vocabulary = get_outlines_vocabulary(self.tokenizer)
         self.cache = get_outlines_cache()
 
-    def _compile_index(self, regex_string: str,
-                       vocabulary: OutlinesVocabulary) -> oc.Index:
+    def _compile_index(
+        self, regex_string: str, vocabulary: OutlinesVocabulary
+    ) -> oc.Index:
         cache_key = f"{vocabulary._hash}_{regex_string}"
         if cache_key in self.cache:
             return self.cache[cache_key]
@@ -62,8 +65,9 @@ def _compile_index(self, regex_string: str,
 
         return index
 
-    def compile_grammar(self, request_type: StructuredOutputOptions,
-                        grammar_spec: str) -> StructuredOutputGrammar:
+    def compile_grammar(
+        self, request_type: StructuredOutputOptions, grammar_spec: str
+    ) -> StructuredOutputGrammar:
         if request_type == StructuredOutputOptions.JSON:
             regex = json_schema.build_regex_from_schema(grammar_spec)
         elif request_type == StructuredOutputOptions.REGEX:
@@ -79,10 +83,13 @@ def compile_grammar(self, request_type: StructuredOutputOptions,
         index = self._compile_index(regex, self.vocabulary)
         max_rollback_tokens = (
             self.vllm_config.speculative_config.num_speculative_tokens
-            if self.vllm_config.speculative_config is not None else 0)
-        return OutlinesGrammar(vocab_size=self.vocab_size,
-                               guide=oc.Guide(
-                                   index, max_rollback=max_rollback_tokens))
+            if self.vllm_config.speculative_config is not None
+            else 0
+        )
+        return OutlinesGrammar(
+            vocab_size=self.vocab_size,
+            guide=oc.Guide(index, max_rollback=max_rollback_tokens),
+        )
 
     def allocate_token_bitmask(self, max_num_seqs: int) -> torch.Tensor:
         return torch.full(
@@ -98,20 +105,15 @@ def destroy(self):
 
 @dataclass
 class OutlinesGrammar(StructuredOutputGrammar):
-
     vocab_size: int
     guide: oc.Guide = field(hash=False)
-    num_processed_tokens: int = field(default_factory=lambda: 0,
-                                      repr=False,
-                                      hash=False,
-                                      init=False)
+    num_processed_tokens: int = field(
+        default_factory=lambda: 0, repr=False, hash=False, init=False
+    )
 
     # outlines_core signals done on DFA accept; vLLM expects done after EOS.
     # We delay the finished flag by one step so EOS can still be emitted.
-    _prev_finished: bool = field(default=False,
-                                 init=False,
-                                 repr=False,
-                                 hash=False)
+    _prev_finished: bool = field(default=False, init=False, repr=False, hash=False)
 
     def accept_tokens(self, request_id: str, tokens: list[int]) -> bool:
         """Accepts a list of tokens and advances the FSM.
@@ -142,8 +144,7 @@ def validate_tokens(self, tokens: list[int]) -> list[int]:
 
     def fill_bitmask(self, bitmask: torch.Tensor, idx: int) -> None:
         mask = bitmask[idx]
-        self.guide.write_mask_into(mask.data_ptr(), mask.numel(),
-                                   mask.element_size())
+        self.guide.write_mask_into(mask.data_ptr(), mask.numel(), mask.element_size())
 
     def is_terminated(self) -> bool:
         curr = self.guide.is_finished()
@@ -187,8 +188,10 @@ def validate_structured_output_request_outlines(params: SamplingParams):
         regex = "(" + "|".join(choices) + ")"
         validate_regex_is_buildable(regex)
     elif so_params.grammar:
-        raise ValueError("Outlines structured outputs backend "
-                         "does not support grammar specifications")
+        raise ValueError(
+            "Outlines structured outputs backend "
+            "does not support grammar specifications"
+        )
 
 
 def _prefix_needs_context(parsed) -> bool:
@@ -196,7 +199,7 @@ def _prefix_needs_context(parsed) -> bool:
 
     def subpattern_consumes(parsed) -> bool:
         """Return True if subpattern can consume at least one character."""
-        tokens = parsed.data if hasattr(parsed, 'data') else parsed
+        tokens = parsed.data if hasattr(parsed, "data") else parsed
         for ttype, tval in tokens:
             # literal, character class, or dot always consumes
             if ttype in (sre_parse.LITERAL, sre_parse.IN, sre_parse.ANY):
@@ -212,17 +215,18 @@ def subpattern_consumes(parsed) -> bool:
                 if any(subpattern_consumes(br) for br in branches):
                     return True
             # grouped subpattern: recurse into its contents
-            elif ttype == sre_parse.SUBPATTERN and subpattern_consumes(
-                    tval[3]):
+            elif ttype == sre_parse.SUBPATTERN and subpattern_consumes(tval[3]):
                 return True
         # No consumers, return False
         return False
 
-    tokens = parsed.data if hasattr(parsed, 'data') else parsed
+    tokens = parsed.data if hasattr(parsed, "data") else parsed
     for ttype, tval in tokens:
         # Direct anchors or look-around
-        if ttype == sre_parse.AT or ttype in (sre_constants.ASSERT,
-                                              sre_constants.ASSERT_NOT):
+        if ttype == sre_parse.AT or ttype in (
+            sre_constants.ASSERT,
+            sre_constants.ASSERT_NOT,
+        ):
             return True
 
         # Nested subpattern: check
@@ -261,9 +265,8 @@ def subpattern_consumes(parsed) -> bool:
 
 def _check_unsupported(parsed) -> None:
     """Check for regex features unsupported by regex-automata"""
-    tokens = parsed.data if hasattr(parsed, 'data') else parsed
+    tokens = parsed.data if hasattr(parsed, "data") else parsed
     for ttype, tval in tokens:
-
         # backreference
         if ttype in (sre_parse.GROUPREF, sre_parse.GROUPREF_EXISTS):
             raise ValueError("Backreferences are unsupported.")
@@ -274,8 +277,7 @@ def _check_unsupported(parsed) -> None:
 
         # unicode word boundaries
         elif ttype == sre_parse.AT:
-            if tval in (sre_constants.AT_BOUNDARY,
-                        sre_constants.AT_NON_BOUNDARY):
+            if tval in (sre_constants.AT_BOUNDARY, sre_constants.AT_NON_BOUNDARY):
                 raise ValueError("Unicode word boundaries are unsupported.")
 
         elif ttype == sre_parse.BRANCH:
@@ -308,7 +310,8 @@ def validate_regex_is_buildable(pattern: str) -> None:
         raise ValueError(
             f"Regex uses unsupported feature for structured outputs: {e}. "
             "Only basic matching constructs are supported—lookarounds, "
-            "backreferences, and unicode boundaries are not.") from e
+            "backreferences, and unicode boundaries are not."
+        ) from e
 
     if _prefix_needs_context(parsed):
         raise ValueError(
@@ -317,4 +320,5 @@ def validate_regex_is_buildable(pattern: str) -> None:
             "in a way which requires context before any token is matched."
             "structured outputs needs regexes that can match without needing "
             "that context. Try rewriting the pattern without using these "
-            f"constructs. Pattern:\n{pattern}")
+            f"constructs. Pattern:\n{pattern}"
+        )
diff --git a/vllm/v1/structured_output/backend_types.py b/vllm/v1/structured_output/backend_types.py
index 9a53aa7a1ad1..2051b336e5bf 100644
--- a/vllm/v1/structured_output/backend_types.py
+++ b/vllm/v1/structured_output/backend_types.py
@@ -103,8 +103,9 @@ class StructuredOutputBackend(ABC):
     vocab_size: int
 
     @abstractmethod
-    def compile_grammar(self, request_type: StructuredOutputOptions,
-                        grammar_spec: str) -> StructuredOutputGrammar:
+    def compile_grammar(
+        self, request_type: StructuredOutputOptions, grammar_spec: str
+    ) -> StructuredOutputGrammar:
         """
         Compiles a grammar specification into a structured output grammar.
 
diff --git a/vllm/v1/structured_output/backend_xgrammar.py b/vllm/v1/structured_output/backend_xgrammar.py
index a853e6540719..9f81d09633d7 100644
--- a/vllm/v1/structured_output/backend_xgrammar.py
+++ b/vllm/v1/structured_output/backend_xgrammar.py
@@ -14,12 +14,16 @@
 from vllm.sampling_params import SamplingParams
 from vllm.transformers_utils.tokenizers.mistral import MistralTokenizer
 from vllm.utils import LazyLoader
-from vllm.v1.structured_output.backend_types import (StructuredOutputBackend,
-                                                     StructuredOutputGrammar,
-                                                     StructuredOutputOptions)
-from vllm.v1.structured_output.utils import (choice_as_grammar,
-                                             convert_lark_to_ebnf,
-                                             grammar_is_likely_lark)
+from vllm.v1.structured_output.backend_types import (
+    StructuredOutputBackend,
+    StructuredOutputGrammar,
+    StructuredOutputOptions,
+)
+from vllm.v1.structured_output.utils import (
+    choice_as_grammar,
+    convert_lark_to_ebnf,
+    grammar_is_likely_lark,
+)
 
 if TYPE_CHECKING:
     import xgrammar as xgr
@@ -31,10 +35,10 @@
 
 @dataclass
 class XgrammarBackend(StructuredOutputBackend):
-
     def __post_init__(self):
-        self.disable_any_whitespace = \
+        self.disable_any_whitespace = (
             self.vllm_config.structured_outputs_config.disable_any_whitespace
+        )
 
         if isinstance(self.tokenizer, MistralTokenizer):
             # NOTE: ideally, xgrammar should handle this accordingly.
@@ -44,27 +48,33 @@ def __post_init__(self):
                     encoded_vocab = self.tokenizer._vocab
                 else:
                     encoded_vocab = [
-                        token for token, _ in sorted(
+                        token
+                        for token, _ in sorted(
                             self.tokenizer.get_vocab().items(),
                             key=lambda x: x[1],
                         )
                     ]
                 stop_token_ids = None
-                if (hasattr(
+                if (
+                    hasattr(
                         self.tokenizer,
                         "eos_token_id",
-                ) and self.tokenizer.eos_token_id is not None):
+                    )
+                    and self.tokenizer.eos_token_id is not None
+                ):
                     stop_token_ids = [self.tokenizer.eos_token_id]
             except AttributeError as e:
                 raise ValueError(
                     f"Cannot get the vocabulary of the tokenizer "
                     f"{type(self.tokenizer)}. The tokenizer should have a "
-                    "get_vocab method.") from e
+                    "get_vocab method."
+                ) from e
             tokenizer_info = xgr.TokenizerInfo(  # type: ignore
                 encoded_vocab=encoded_vocab,
                 # NOTE: https://github.com/mlc-ai/xgrammar/blob/5e141f6ff1ca02bc31f9e512e68b61f2a8ae88e5/tests/python/test_tokenizer_info.py#L43 # noqa: E501
                 vocab_type=xgr.VocabType.RAW
-                if self.tokenizer.is_tekken else xgr.VocabType.BYTE_FALLBACK,
+                if self.tokenizer.is_tekken
+                else xgr.VocabType.BYTE_FALLBACK,
                 vocab_size=self.vocab_size,
                 stop_token_ids=stop_token_ids,
                 add_prefix_space=True,
@@ -83,18 +93,21 @@ def __post_init__(self):
 
         self.num_speculative_tokens = 0
         if self.vllm_config.speculative_config is not None:
-            self.num_speculative_tokens = \
+            self.num_speculative_tokens = (
                 self.vllm_config.speculative_config.num_speculative_tokens
+            )
 
-    def compile_grammar(self, request_type: StructuredOutputOptions,
-                        grammar_spec: str) -> StructuredOutputGrammar:
+    def compile_grammar(
+        self, request_type: StructuredOutputOptions, grammar_spec: str
+    ) -> StructuredOutputGrammar:
         if request_type == StructuredOutputOptions.JSON:
             ctx = self.compiler.compile_json_schema(
-                grammar_spec, any_whitespace=not self.disable_any_whitespace)
+                grammar_spec, any_whitespace=not self.disable_any_whitespace
+            )
         elif request_type == StructuredOutputOptions.JSON_OBJECT:
             ctx = self.compiler.compile_json_schema(
-                '{"type": "object"}',
-                any_whitespace=not self.disable_any_whitespace)
+                '{"type": "object"}', any_whitespace=not self.disable_any_whitespace
+            )
         elif request_type == StructuredOutputOptions.GRAMMAR:
             ctx = self.compiler.compile_grammar(grammar_spec)
         elif request_type == StructuredOutputOptions.REGEX:
@@ -106,17 +119,20 @@ def compile_grammar(self, request_type: StructuredOutputOptions,
                     begin=s["begin"],
                     schema=json.dumps(s["schema"]),
                     end=s["end"],
-                ) for s in s_tag["structures"]
+                )
+                for s in s_tag["structures"]
             ]
             structural_tag = xgr.StructuralTag.from_legacy_structural_tag(
-                tags, s_tag["triggers"])
+                tags, s_tag["triggers"]
+            )
             ctx = self.compiler.compile_structural_tag(structural_tag)
         else:
             logger.error(
                 "Validation should have already occurred. Please file an issue."
             )
             raise ValueError(
-                f"grammar is not of valid supported types. ({request_type!s})")
+                f"grammar is not of valid supported types. ({request_type!s})"
+            )
 
         return XgrammarGrammar(
             matcher=xgr.GrammarMatcher(
@@ -146,10 +162,9 @@ class XgrammarGrammar(StructuredOutputGrammar):
     vocab_size: int
     matcher: xgr.GrammarMatcher = field(hash=False)
     ctx: xgr.CompiledGrammar = field(hash=False)
-    num_processed_tokens: int = field(default_factory=lambda: 0,
-                                      repr=False,
-                                      hash=False,
-                                      init=False)
+    num_processed_tokens: int = field(
+        default_factory=lambda: 0, repr=False, hash=False, init=False
+    )
     _is_terminated: bool = field(default=False, repr=False, hash=False)
 
     def accept_tokens(self, request_id: str, tokens: list[int]) -> bool:
@@ -164,7 +179,10 @@ def accept_tokens(self, request_id: str, tokens: list[int]) -> bool:
             if not self.matcher.accept_token(token):
                 logger.error(
                     "Failed to advance FSM for request %s "
-                    "for tokens %s. Please file an issue.", request_id, token)
+                    "for tokens %s. Please file an issue.",
+                    request_id,
+                    token,
+                )
                 return False
             self.num_processed_tokens += 1
         self._is_terminated = self.matcher.is_terminated()
@@ -216,8 +234,9 @@ def check_object(obj: dict[str, Any]) -> bool:
 
         # Check for array unsupported keywords
         if obj.get("type") == "array" and any(
-                key in obj for key in ("uniqueItems", "contains",
-                                       "minContains", "maxContains")):
+            key in obj
+            for key in ("uniqueItems", "contains", "minContains", "maxContains")
+        ):
             return True
 
         # Unsupported keywords for strings
@@ -226,8 +245,14 @@ def check_object(obj: dict[str, Any]) -> bool:
 
         # Unsupported keywords for objects
         if obj.get("type") == "object" and any(
-                key in obj for key in ("minProperties", "maxProperties",
-                                       "propertyNames", "patternProperties")):
+            key in obj
+            for key in (
+                "minProperties",
+                "maxProperties",
+                "propertyNames",
+                "patternProperties",
+            )
+        ):
             return True
 
         # Recursively check all nested objects and arrays
@@ -259,16 +284,18 @@ def validate_xgrammar_grammar(sampling_params: SamplingParams) -> None:
         try:
             xgr.Grammar.from_regex(so_params.regex)
         except Exception as err:
-            raise ValueError("Failed to transform regex into a grammar: "
-                             f"{err}") from err
+            raise ValueError(
+                f"Failed to transform regex into a grammar: {err}"
+            ) from err
 
     if so_params.choice:
         choice_grammar = choice_as_grammar(so_params.choice)
         try:
             xgr.Grammar.from_ebnf(choice_grammar)
         except Exception as err:
-            raise ValueError("Failed to transform choices into a grammar: "
-                             "{err}") from err
+            raise ValueError(
+                "Failed to transform choices into a grammar: {err}"
+            ) from err
         so_params.choice = None
         so_params.grammar = choice_grammar
         return
@@ -285,12 +312,14 @@ def validate_xgrammar_grammar(sampling_params: SamplingParams) -> None:
         try:
             xgr.Grammar.from_json_schema(schema)
         except Exception as err:
-            raise ValueError("Failed to transform json schema into a grammar: "
-                             f"{err}") from err
+            raise ValueError(
+                f"Failed to transform json schema into a grammar: {err}"
+            ) from err
 
         if has_xgrammar_unsupported_json_features(schema):
-            raise ValueError("The provided JSON schema contains features not "
-                             "supported by xgrammar.")
+            raise ValueError(
+                "The provided JSON schema contains features not supported by xgrammar."
+            )
         return
 
     if so_params.grammar:
@@ -300,7 +329,8 @@ def validate_xgrammar_grammar(sampling_params: SamplingParams) -> None:
                 so_params.grammar = convert_lark_to_ebnf(so_params.grammar)
             except ValueError as e:
                 raise ValueError(
-                    "Failed to convert the grammar from Lark to EBNF. ") from e
+                    "Failed to convert the grammar from Lark to EBNF. "
+                ) from e
 
         # Test parsing EBNF grammar, possibly already converted from Lark
         try:
@@ -318,10 +348,12 @@ def validate_xgrammar_grammar(sampling_params: SamplingParams) -> None:
                     begin=s["begin"],
                     schema=json.dumps(s["schema"]),
                     end=s["end"],
-                ) for s in s_tag["structures"]
+                )
+                for s in s_tag["structures"]
             ]
             structural_tag = xgr.StructuralTag.from_legacy_structural_tag(
-                tags, s_tag["triggers"])
+                tags, s_tag["triggers"]
+            )
             xgr.Grammar.from_structural_tag(structural_tag)
         except Exception as e:
             raise ValueError("Invalid structural tag specification.") from e
diff --git a/vllm/v1/structured_output/request.py b/vllm/v1/structured_output/request.py
index 99974ef46ecd..26f72ae50c5e 100644
--- a/vllm/v1/structured_output/request.py
+++ b/vllm/v1/structured_output/request.py
@@ -10,17 +10,19 @@
 from typing import Optional, Union, cast
 
 from vllm.sampling_params import SamplingParams
-from vllm.v1.structured_output.backend_types import (StructuredOutputGrammar,
-                                                     StructuredOutputKey,
-                                                     StructuredOutputOptions)
+from vllm.v1.structured_output.backend_types import (
+    StructuredOutputGrammar,
+    StructuredOutputKey,
+    StructuredOutputOptions,
+)
 
 
 @dataclasses.dataclass
 class StructuredOutputRequest:
-
     sampling_params: SamplingParams
-    _grammar: Optional[Union[Future[StructuredOutputGrammar],
-                             StructuredOutputGrammar]] = None
+    _grammar: Optional[
+        Union[Future[StructuredOutputGrammar], StructuredOutputGrammar]
+    ] = None
     reasoning_ended: Optional[bool] = None
 
     def _check_grammar_completion(self) -> bool:
@@ -43,13 +45,15 @@ def is_grammar_ready(self) -> bool:
     @property
     def grammar(self) -> Optional[StructuredOutputGrammar]:
         completed = self._check_grammar_completion()
-        return cast(Optional[StructuredOutputGrammar],
-                    self._grammar) if completed else None
+        return (
+            cast(Optional[StructuredOutputGrammar], self._grammar)
+            if completed
+            else None
+        )
 
     @grammar.setter
     def grammar(
-        self, grammar: Union[StructuredOutputGrammar,
-                             Future[StructuredOutputGrammar]]
+        self, grammar: Union[StructuredOutputGrammar, Future[StructuredOutputGrammar]]
     ) -> None:
         self._grammar = grammar
 
@@ -58,8 +62,7 @@ def structured_output_key(self) -> StructuredOutputKey:
         return get_structured_output_key(self.sampling_params)
 
 
-def get_structured_output_key(
-        sampling_params: SamplingParams) -> StructuredOutputKey:
+def get_structured_output_key(sampling_params: SamplingParams) -> StructuredOutputKey:
     params = sampling_params.structured_outputs
     assert params is not None, "params can't be None."
     if params.json is not None:
diff --git a/vllm/v1/structured_output/utils.py b/vllm/v1/structured_output/utils.py
index b9b09bea1e80..b7326847d016 100644
--- a/vllm/v1/structured_output/utils.py
+++ b/vllm/v1/structured_output/utils.py
@@ -76,27 +76,31 @@ def apply_grammar_bitmask(
     for req_id, batch_index in seq:
         logit_index = batch_index + cumulative_offset
         cumulative_offset += len(
-            scheduler_output.scheduled_spec_decode_tokens.get(req_id, []))
+            scheduler_output.scheduled_spec_decode_tokens.get(req_id, [])
+        )
         if req_id in scheduler_output.structured_output_request_ids:
             struct_out_req_batch_indices[req_id] = logit_index
 
     out_indices = []
 
     # Reorder the bitmask to match the order of the requests in the batch.
-    sorted_bitmask = np.full(shape=(logits.shape[0], grammar_bitmask.shape[1]),
-                             fill_value=-1,
-                             dtype=grammar_bitmask.dtype)
+    sorted_bitmask = np.full(
+        shape=(logits.shape[0], grammar_bitmask.shape[1]),
+        fill_value=-1,
+        dtype=grammar_bitmask.dtype,
+    )
     cumulative_index = 0
-    seq = sorted(scheduler_output.structured_output_request_ids.items(),
-                 key=lambda x: x[1])
+    seq = sorted(
+        scheduler_output.structured_output_request_ids.items(), key=lambda x: x[1]
+    )
     for req_id, _ in seq:
         num_spec_tokens = len(
-            scheduler_output.scheduled_spec_decode_tokens.get(req_id, []))
+            scheduler_output.scheduled_spec_decode_tokens.get(req_id, [])
+        )
         if req_id in struct_out_req_batch_indices:
             logit_index = struct_out_req_batch_indices[req_id]
             for i in range(1 + num_spec_tokens):
-                sorted_bitmask[logit_index + i] = \
-                    grammar_bitmask[cumulative_index + i]
+                sorted_bitmask[logit_index + i] = grammar_bitmask[cumulative_index + i]
                 out_indices.append(logit_index + i)
         cumulative_index += 1 + num_spec_tokens
     grammar_bitmask = sorted_bitmask
@@ -128,8 +132,7 @@ def __init__(self, vocabulary: oc.Vocabulary) -> None:
         self.inner = vocabulary
         # Have to do abs(hash()) because python hashes can
         # be negative, and we are using hash as a cache key.
-        hex_str = hashlib.sha256(
-            vocabulary.__repr__().encode('utf-8')).hexdigest()
+        hex_str = hashlib.sha256(vocabulary.__repr__().encode("utf-8")).hexdigest()
         hash_int = int(hex_str, 16)
         self._hash = hash_int
 
@@ -165,16 +168,18 @@ def get_outlines_cache():
 
     cache_dir = get_outlines_cache_path()
     if envs.VLLM_V1_USE_OUTLINES_CACHE:
-        logger.warning("Enabling outlines cache. This is an unbounded on-disk "
-                       "cache. It may consume a lot of disk space and should "
-                       "not be used with untrusted clients.")
+        logger.warning(
+            "Enabling outlines cache. This is an unbounded on-disk "
+            "cache. It may consume a lot of disk space and should "
+            "not be used with untrusted clients."
+        )
         cache = Cache(cache_dir, eviction_policy="none", cull_limit=0)
         outlines_version = importlib.metadata.version("outlines_core")
 
-        cached_version = cache.get('__version__', None)
+        cached_version = cache.get("__version__", None)
         if cached_version != outlines_version:
             cache.clear()
-        cache.set('__version__', outlines_version)
+        cache.set("__version__", outlines_version)
         return cache
     else:
         return LRUCache(maxsize=128)
@@ -194,19 +199,17 @@ def _reduced_vocabulary(
         A Dict of token string -> equivalent token ids
     """
 
-    unicode_to_bytes = {
-        v: k
-        for k, v in tokenization_gpt2.bytes_to_unicode().items()
-    }
+    unicode_to_bytes = {v: k for k, v in tokenization_gpt2.bytes_to_unicode().items()}
 
     def convert_token_to_string(token: str) -> str:
-
         string = tokenizer.convert_tokens_to_string([token])
 
         # A hack to handle missing spaces to HF's Llama tokenizers
-        if (type(token) is str
-                and token.startswith(file_utils.SPIECE_UNDERLINE)
-                or token == "<0x20>"):
+        if (
+            type(token) is str
+            and token.startswith(file_utils.SPIECE_UNDERLINE)
+            or token == "<0x20>"
+        ):
             return " " + string
 
         return string
@@ -226,8 +229,7 @@ def convert_token_to_string(token: str) -> str:
                 # by this point.
                 token_bytes = bytes(token_str)  # type: ignore[arg-type]
 
-            elif "\ufffd" in token_str and not re_replacement_seq.match(
-                    token_str):
+            elif "\ufffd" in token_str and not re_replacement_seq.match(token_str):
                 # Handle tokens with invalid UTF-8 sequences.
                 if re_llama_byte_token.match(token):
                     # Llama-like tokenizers use <0xXX> for incomplete sequences.
@@ -238,12 +240,13 @@ def convert_token_to_string(token: str) -> str:
                     if None in byte_vals:
                         raise RuntimeError(
                             f"Cannot convert token `{token}`"
-                            f" ({token_idx}) to bytes: {token_str}")
+                            f" ({token_idx}) to bytes: {token_str}"
+                        )
                     # safe to ignore, since if None in byte_vals,
                     # an error is thrown.
                     token_bytes = bytes(byte_vals)  # type: ignore[arg-type]
             else:
-                token_bytes = token_str.encode('utf-8')
+                token_bytes = token_str.encode("utf-8")
 
             if token_idx != eos_token_id:
                 vocabulary.setdefault(token_bytes, []).append(token_idx)
@@ -254,16 +257,18 @@ def convert_token_to_string(token: str) -> str:
 
 
 def get_outlines_vocabulary(tokenizer: AnyTokenizer) -> oc.Vocabulary:
-    """Get the `Vocabulary` object for a given tokenizer.
-    """
+    """Get the `Vocabulary` object for a given tokenizer."""
     if hasattr(tokenizer, "_outlines_vocabulary"):
         return tokenizer._outlines_vocabulary  # type: ignore
 
     try:
-        if hasattr(
+        if (
+            hasattr(
                 tokenizer,
                 "eos_token_id",
-        ) and tokenizer.eos_token_id is not None:
+            )
+            and tokenizer.eos_token_id is not None
+        ):
             eos_token_id = tokenizer.eos_token_id
         else:
             raise ValueError(
@@ -272,17 +277,18 @@ def get_outlines_vocabulary(tokenizer: AnyTokenizer) -> oc.Vocabulary:
 
         reduced_vocab = _reduced_vocabulary(
             tokenizer,
-            eos_token_id  #type: ignore
+            eos_token_id,  # type: ignore
         )
-        vocabulary = OutlinesVocabulary(
-            oc.Vocabulary(eos_token_id, reduced_vocab))
+        vocabulary = OutlinesVocabulary(oc.Vocabulary(eos_token_id, reduced_vocab))
         tokenizer._outlines_vocabulary = vocabulary  # type: ignore
 
         return vocabulary
     except AttributeError as e:
-        raise ValueError(f"Cannot get the vocabulary of the tokenizer "
-                         f"({type(tokenizer)}). The tokenizer should have a "
-                         "get_vocab method.") from e
+        raise ValueError(
+            f"Cannot get the vocabulary of the tokenizer "
+            f"({type(tokenizer)}). The tokenizer should have a "
+            "get_vocab method."
+        ) from e
 
 
 def grammar_is_likely_lark(grammar_str: str) -> bool:
@@ -304,14 +310,14 @@ def grammar_is_likely_lark(grammar_str: str) -> bool:
     if not grammar_str or not isinstance(grammar_str, str):
         return False
 
-    for line in grammar_str.split('\n'):
+    for line in grammar_str.split("\n"):
         # Remove both comment styles
-        line = re.sub(r'(#|//).*$', '', line).strip()
+        line = re.sub(r"(#|//).*$", "", line).strip()
         if not line:
             continue
 
         # Look for EBNF rule definition
-        if '::=' in line:
+        if "::=" in line:
             return False
 
     return True
@@ -348,40 +354,41 @@ def convert_lark_to_ebnf(grammar_str: str) -> str:
 
     def clean_line(line: str) -> str:
         """Remove comments and whitespace from line."""
-        return re.sub(r'(#|//).*$', '', line).strip()
+        return re.sub(r"(#|//).*$", "", line).strip()
 
     def check_quotes(text: str, rule_name: str, line_num: int) -> None:
         """Validate quote matching in text."""
         if text.count("'") % 2 != 0 or text.count('"') % 2 != 0:
-            raise ValueError(
-                f"Mismatched quotes in {rule_name} on line {line_num}")
+            raise ValueError(f"Mismatched quotes in {rule_name} on line {line_num}")
 
     def extract_references(text: str) -> set[str]:
         """Extract rule references from text."""
         # Remove quoted strings and special characters
-        text = re.sub(r'"[^"]*"', '', text)
-        text = re.sub(r'[+*?()|\[\]{}]', ' ', text)
-        return set(re.findall(r'\b[a-zA-Z_][a-zA-Z0-9_]*\b', text))
+        text = re.sub(r'"[^"]*"', "", text)
+        text = re.sub(r"[+*?()|\[\]{}]", " ", text)
+        return set(re.findall(r"\b[a-zA-Z_][a-zA-Z0-9_]*\b", text))
 
     # First pass: Find root rule and validate rule definitions
-    lines = [clean_line(line) for line in grammar_str.split('\n')]
+    lines = [clean_line(line) for line in grammar_str.split("\n")]
     first_rule = None
 
     for line_num, line in enumerate(lines, 1):
-        if not line or line.startswith('|'):
+        if not line or line.startswith("|"):
             continue
 
-        if ':' in line:
+        if ":" in line:
             try:
-                name = line.split(':', 1)[0].strip().strip('?')
+                name = line.split(":", 1)[0].strip().strip("?")
                 defined_rules.add(name)
                 if first_rule is None:
                     first_rule = name
-                if name == 'start':
-                    first_rule = 'start'
+                if name == "start":
+                    first_rule = "start"
             except IndexError as e:
-                raise ValueError(f"Invalid rule format on line {line_num}. "
-                                 "Expected 'rule_name: definition'") from e
+                raise ValueError(
+                    f"Invalid rule format on line {line_num}. "
+                    "Expected 'rule_name: definition'"
+                ) from e
 
     if not defined_rules:
         raise ValueError("No valid rules found in grammar")
@@ -398,29 +405,33 @@ def extract_references(text: str) -> set[str]:
             continue
 
         try:
-            if ':' in line and not line.startswith('|'):
+            if ":" in line and not line.startswith("|"):
                 # Save previous rule if exists
                 if current_rule:
                     output_lines.append(
-                        f"{current_rule} ::= {' | '.join(current_definition)}")
+                        f"{current_rule} ::= {' | '.join(current_definition)}"
+                    )
 
                 # Process new rule
-                name, definition = line.split(':', 1)
-                current_rule = name.strip().strip('?')
+                name, definition = line.split(":", 1)
+                current_rule = name.strip().strip("?")
 
                 check_quotes(definition, f"rule '{current_rule}'", line_num)
                 definition = re.sub(r"'([^']*)'", r'"\1"', definition)
                 referenced_rules.update(extract_references(definition))
                 current_definition = [definition.strip()]
 
-            elif line.startswith('|'):
+            elif line.startswith("|"):
                 if not current_rule:
-                    raise ValueError(f"Alternative '|' on line {line_num} "
-                                     "without a preceding rule definition")
+                    raise ValueError(
+                        f"Alternative '|' on line {line_num} "
+                        "without a preceding rule definition"
+                    )
 
                 alt_def = line[1:].strip()
-                check_quotes(alt_def, f"alternative for rule '{current_rule}'",
-                             line_num)
+                check_quotes(
+                    alt_def, f"alternative for rule '{current_rule}'", line_num
+                )
                 alt_def = re.sub(r"'([^']*)'", r'"\1"', alt_def)
                 referenced_rules.update(extract_references(alt_def))
                 current_definition.append(alt_def)
@@ -430,25 +441,24 @@ def extract_references(text: str) -> set[str]:
 
     # Add final rule if exists
     if current_rule:
-        output_lines.append(
-            f"{current_rule} ::= {' | '.join(current_definition)}")
+        output_lines.append(f"{current_rule} ::= {' | '.join(current_definition)}")
 
     # Validate all rules are defined
-    undefined_rules = referenced_rules - defined_rules - {'root'}
+    undefined_rules = referenced_rules - defined_rules - {"root"}
     if undefined_rules:
-        raise ValueError("Referenced rules are not defined: "
-                         f"{', '.join(sorted(undefined_rules))}")
+        raise ValueError(
+            f"Referenced rules are not defined: {', '.join(sorted(undefined_rules))}"
+        )
 
-    return '\n'.join(output_lines)
+    return "\n".join(output_lines)
 
 
 def choice_as_grammar(choice: list[str]) -> str:
-
     def escape_ebnf_string(s: str) -> str:
         """Escape special characters in a EBNF string."""
         # Escape double quotes and backslashes
-        return re.sub(r'(["\\])', r'\\\1', s)
+        return re.sub(r'(["\\])', r"\\\1", s)
 
     escaped_choices = (escape_ebnf_string(c) for c in choice)
-    grammar = ('root ::= ' + ' | '.join(f'"{c}"' for c in escaped_choices))
+    grammar = "root ::= " + " | ".join(f'"{c}"' for c in escaped_choices)
     return grammar
diff --git a/vllm/v1/utils.py b/vllm/v1/utils.py
index ee0c1168f3cd..c96f221228b0 100644
--- a/vllm/v1/utils.py
+++ b/vllm/v1/utils.py
@@ -9,25 +9,35 @@
 from contextlib import AbstractContextManager
 from multiprocessing import connection
 from multiprocessing.process import BaseProcess
-from typing import (TYPE_CHECKING, Any, Callable, Generic, Optional, TypeVar,
-                    Union, overload)
+from typing import (
+    TYPE_CHECKING,
+    Any,
+    Callable,
+    Generic,
+    Optional,
+    TypeVar,
+    Union,
+    overload,
+)
 
 import torch
 from torch.autograd.profiler import record_function
 
 import vllm.envs as envs
 from vllm.logger import init_logger
-from vllm.usage.usage_lib import (UsageContext, is_usage_stats_enabled,
-                                  usage_message)
-from vllm.utils import (get_open_port, get_open_zmq_ipc_path, get_tcp_uri,
-                        kill_process_tree)
+from vllm.usage.usage_lib import UsageContext, is_usage_stats_enabled, usage_message
+from vllm.utils import (
+    get_open_port,
+    get_open_zmq_ipc_path,
+    get_tcp_uri,
+    kill_process_tree,
+)
 
 if TYPE_CHECKING:
     import numpy as np
 
     from vllm.v1.engine.coordinator import DPCoordinator
-    from vllm.v1.engine.utils import (CoreEngineActorManager,
-                                      CoreEngineProcManager)
+    from vllm.v1.engine.utils import CoreEngineActorManager, CoreEngineProcManager
 
 logger = init_logger(__name__)
 
@@ -35,7 +45,6 @@
 
 
 class ConstantList(Generic[T], Sequence):
-
     def __init__(self, x: list[T]) -> None:
         self._x = x
 
@@ -57,31 +66,23 @@ def remove(self, item):
     def clear(self):
         raise TypeError("Cannot clear a constant list")
 
-    def index(self,
-              item: T,
-              start: int = 0,
-              stop: Optional[int] = None) -> int:
-        return self._x.index(item, start,
-                             stop if stop is not None else len(self._x))
+    def index(self, item: T, start: int = 0, stop: Optional[int] = None) -> int:
+        return self._x.index(item, start, stop if stop is not None else len(self._x))
 
     @overload
-    def __getitem__(self, item: int) -> T:
-        ...
+    def __getitem__(self, item: int) -> T: ...
 
     @overload
-    def __getitem__(self, s: slice, /) -> list[T]:
-        ...
+    def __getitem__(self, s: slice, /) -> list[T]: ...
 
     def __getitem__(self, item: Union[int, slice]) -> Union[T, list[T]]:
         return self._x[item]
 
     @overload
-    def __setitem__(self, item: int, value: T):
-        ...
+    def __setitem__(self, item: int, value: T): ...
 
     @overload
-    def __setitem__(self, s: slice, value: T, /):
-        ...
+    def __setitem__(self, s: slice, value: T, /): ...
 
     def __setitem__(self, item: Union[int, slice], value: Union[T, list[T]]):
         raise TypeError("Cannot set item in a constant list")
@@ -113,10 +114,7 @@ def __init__(
         pin_memory: bool,
         with_numpy: bool = True,
     ) -> None:
-        self.cpu = torch.zeros(*size,
-                               dtype=dtype,
-                               device="cpu",
-                               pin_memory=pin_memory)
+        self.cpu = torch.zeros(*size, dtype=dtype, device="cpu", pin_memory=pin_memory)
         self.gpu = torch.zeros_like(self.cpu, device=device)
         self.np: np.ndarray
         # To keep type hints simple (avoiding generics and subclasses), we
@@ -126,7 +124,8 @@ def __init__(
             if dtype == torch.bfloat16:
                 raise ValueError(
                     "Bfloat16 torch tensors cannot be directly cast to a "
-                    "numpy array, so call CpuGpuBuffer with with_numpy=False")
+                    "numpy array, so call CpuGpuBuffer with with_numpy=False"
+                )
             self.np = self.cpu.numpy()
 
     def copy_to_gpu(self, n: Optional[int] = None) -> torch.Tensor:
@@ -142,9 +141,7 @@ def copy_to_cpu(self, n: Optional[int] = None) -> torch.Tensor:
         return self.cpu[:n].copy_(self.gpu[:n], non_blocking=True)
 
 
-def get_engine_client_zmq_addr(local_only: bool,
-                               host: str,
-                               port: int = 0) -> str:
+def get_engine_client_zmq_addr(local_only: bool, host: str, port: int = 0) -> str:
     """Assign a new ZMQ socket address.
 
     If local_only is True, participants are colocated and so a unique IPC
@@ -153,8 +150,11 @@ def get_engine_client_zmq_addr(local_only: bool,
     Otherwise, the provided host and port will be used to construct a TCP
     address (port == 0 means assign an available port)."""
 
-    return get_open_zmq_ipc_path() if local_only else (get_tcp_uri(
-        host, port or get_open_port()))
+    return (
+        get_open_zmq_ipc_path()
+        if local_only
+        else (get_tcp_uri(host, port or get_open_port()))
+    )
 
 
 class APIServerProcessManager:
@@ -195,21 +195,23 @@ def __init__(
         spawn_context = multiprocessing.get_context("spawn")
         self.processes: list[BaseProcess] = []
 
-        for i, in_addr, out_addr in zip(range(num_servers), input_addresses,
-                                        output_addresses):
+        for i, in_addr, out_addr in zip(
+            range(num_servers), input_addresses, output_addresses
+        ):
             client_config = {
                 "input_address": in_addr,
                 "output_address": out_addr,
                 "client_count": num_servers,
-                "client_index": i
+                "client_index": i,
             }
             if stats_update_address is not None:
                 client_config["stats_update_address"] = stats_update_address
 
-            proc = spawn_context.Process(target=target_server_fn,
-                                         name=f"ApiServer_{i}",
-                                         args=(listen_address, sock, args,
-                                               client_config))
+            proc = spawn_context.Process(
+                target=target_server_fn,
+                name=f"ApiServer_{i}",
+                args=(listen_address, sock, args, client_config),
+            )
             self.processes.append(proc)
             proc.start()
 
@@ -224,10 +226,12 @@ def close(self) -> None:
 
 
 def wait_for_completion_or_failure(
-        api_server_manager: APIServerProcessManager,
-        engine_manager: Optional[Union["CoreEngineProcManager",
-                                       "CoreEngineActorManager"]] = None,
-        coordinator: Optional["DPCoordinator"] = None) -> None:
+    api_server_manager: APIServerProcessManager,
+    engine_manager: Optional[
+        Union["CoreEngineProcManager", "CoreEngineActorManager"]
+    ] = None,
+    coordinator: Optional["DPCoordinator"] = None,
+) -> None:
     """Wait for all processes to complete or detect if any fail.
 
     Raises an exception if any process exits with a non-zero status.
@@ -240,16 +244,14 @@ def wait_for_completion_or_failure(
         coordinator: The coordinator for data parallel.
     """
 
-    from vllm.v1.engine.utils import (CoreEngineActorManager,
-                                      CoreEngineProcManager)
+    from vllm.v1.engine.utils import CoreEngineActorManager, CoreEngineProcManager
 
     try:
         logger.info("Waiting for API servers to complete ...")
         # Create a mapping of sentinels to their corresponding processes
         # for efficient lookup
         sentinel_to_proc: dict[Any, BaseProcess] = {
-            proc.sentinel: proc
-            for proc in api_server_manager.processes
+            proc.sentinel: proc for proc in api_server_manager.processes
         }
 
         if coordinator:
@@ -265,8 +267,7 @@ def wait_for_completion_or_failure(
         # Check if any process terminates
         while sentinel_to_proc or actor_run_refs:
             # Wait for any process to terminate
-            ready_sentinels: list[Any] = connection.wait(sentinel_to_proc,
-                                                         timeout=5)
+            ready_sentinels: list[Any] = connection.wait(sentinel_to_proc, timeout=5)
 
             # Process any terminated processes
             for sentinel in ready_sentinels:
@@ -276,17 +277,18 @@ def wait_for_completion_or_failure(
                 if proc.exitcode != 0:
                     raise RuntimeError(
                         f"Process {proc.name} (PID: {proc.pid}) "
-                        f"died with exit code {proc.exitcode}")
+                        f"died with exit code {proc.exitcode}"
+                    )
 
             if actor_run_refs:
                 import ray
+
                 _, actor_run_refs = ray.wait(actor_run_refs, timeout=5)
 
     except KeyboardInterrupt:
         logger.info("Received KeyboardInterrupt, shutting down API servers...")
     except Exception as e:
-        logger.exception("Exception occurred while running API servers: %s",
-                         str(e))
+        logger.exception("Exception occurred while running API servers: %s", str(e))
         raise
     finally:
         logger.info("Terminating remaining processes ...")
@@ -319,8 +321,9 @@ def shutdown(procs: list[BaseProcess]):
             kill_process_tree(pid)
 
 
-def copy_slice(from_tensor: torch.Tensor, to_tensor: torch.Tensor,
-               length: int) -> torch.Tensor:
+def copy_slice(
+    from_tensor: torch.Tensor, to_tensor: torch.Tensor, length: int
+) -> torch.Tensor:
     """
     Copy the first length elements of a tensor into another tensor in a
     non-blocking manner.
@@ -333,8 +336,8 @@ def copy_slice(from_tensor: torch.Tensor, to_tensor: torch.Tensor,
 
 
 def report_usage_stats(
-        vllm_config,
-        usage_context: UsageContext = UsageContext.ENGINE_CONTEXT) -> None:
+    vllm_config, usage_context: UsageContext = UsageContext.ENGINE_CONTEXT
+) -> None:
     """Report usage statistics if enabled."""
 
     if not is_usage_stats_enabled():
@@ -347,32 +350,21 @@ def report_usage_stats(
         usage_context,
         extra_kvs={
             # Common configuration
-            "dtype":
-            str(vllm_config.model_config.dtype),
-            "tensor_parallel_size":
-            vllm_config.parallel_config.tensor_parallel_size,
-            "block_size":
-            vllm_config.cache_config.block_size,
-            "gpu_memory_utilization":
-            vllm_config.cache_config.gpu_memory_utilization,
-            "kv_cache_memory_bytes":
-            vllm_config.cache_config.kv_cache_memory_bytes,
+            "dtype": str(vllm_config.model_config.dtype),
+            "tensor_parallel_size": vllm_config.parallel_config.tensor_parallel_size,
+            "block_size": vllm_config.cache_config.block_size,
+            "gpu_memory_utilization": vllm_config.cache_config.gpu_memory_utilization,
+            "kv_cache_memory_bytes": vllm_config.cache_config.kv_cache_memory_bytes,
             # Quantization
-            "quantization":
-            vllm_config.model_config.quantization,
-            "kv_cache_dtype":
-            str(vllm_config.cache_config.cache_dtype),
-
+            "quantization": vllm_config.model_config.quantization,
+            "kv_cache_dtype": str(vllm_config.cache_config.cache_dtype),
             # Feature flags
-            "enable_lora":
-            bool(vllm_config.lora_config),
-            "enable_prefix_caching":
-            vllm_config.cache_config.enable_prefix_caching,
-            "enforce_eager":
-            vllm_config.model_config.enforce_eager,
-            "disable_custom_all_reduce":
-            vllm_config.parallel_config.disable_custom_all_reduce,
-        })
+            "enable_lora": bool(vllm_config.lora_config),
+            "enable_prefix_caching": vllm_config.cache_config.enable_prefix_caching,
+            "enforce_eager": vllm_config.model_config.enforce_eager,
+            "disable_custom_all_reduce": vllm_config.parallel_config.disable_custom_all_reduce,
+        },
+    )
 
 
 _PROFILER_FUNC = None
@@ -390,6 +382,7 @@ def record_function_or_nullcontext(name: str) -> AbstractContextManager:
         func = record_function
     elif envs.VLLM_NVTX_SCOPES_FOR_PROFILING:
         import nvtx
+
         func = nvtx.annotate
 
     _PROFILER_FUNC = func
diff --git a/vllm/v1/worker/block_table.py b/vllm/v1/worker/block_table.py
index 82b6d1b514d5..4d3688453cb9 100644
--- a/vllm/v1/worker/block_table.py
+++ b/vllm/v1/worker/block_table.py
@@ -14,7 +14,6 @@
 
 
 class BlockTable:
-
     def __init__(
         self,
         block_size: int,
@@ -31,13 +30,14 @@ def __init__(
         self.pin_memory = pin_memory
         self.device = device
 
-        self.block_table = self._make_buffer(max_num_reqs,
-                                             max_num_blocks_per_req,
-                                             dtype=torch.int32)
+        self.block_table = self._make_buffer(
+            max_num_reqs, max_num_blocks_per_req, dtype=torch.int32
+        )
         self.num_blocks_per_row = np.zeros(max_num_reqs, dtype=np.int32)
 
-        self.slot_mapping = self._make_buffer(self.max_num_batched_tokens,
-                                              dtype=torch.int64)
+        self.slot_mapping = self._make_buffer(
+            self.max_num_batched_tokens, dtype=torch.int64
+        )
         try:
             self.dcp_world_size = get_dcp_group().world_size
             self.dcp_rank = get_dcp_group().rank_in_group
@@ -56,7 +56,7 @@ def append_row(
         num_blocks = len(block_ids)
         start = self.num_blocks_per_row[row_idx]
         self.num_blocks_per_row[row_idx] += num_blocks
-        self.block_table.np[row_idx, start:start + num_blocks] = block_ids
+        self.block_table.np[row_idx, start : start + num_blocks] = block_ids
 
     def add_row(self, block_ids: list[int], row_idx: int) -> None:
         self.num_blocks_per_row[row_idx] = 0
@@ -73,8 +73,9 @@ def swap_row(self, src: int, tgt: int) -> None:
         self.num_blocks_per_row[src_tgt] = self.num_blocks_per_row[tgt_src]
         self.block_table.np[src_tgt] = self.block_table.np[tgt_src]
 
-    def compute_slot_mapping(self, req_indices: np.ndarray,
-                             positions: np.ndarray) -> None:
+    def compute_slot_mapping(
+        self, req_indices: np.ndarray, positions: np.ndarray
+    ) -> None:
         # E.g., [0, 1, 0, 1, 2, 3, 4, 0, 1, 2]
         # -> [0, 0, K, K, K + 1, K + 1, K + 2, 2 * K, 2 * K, 2 * K + 1]
         # where K is the max_num_blocks_per_req and the block size is 2.
@@ -89,8 +90,10 @@ def compute_slot_mapping(self, req_indices: np.ndarray,
             # Use a "virtual block" which equals to world_size * block_size
             # for block_table_indices calculation.
             virtual_block_size = self.block_size * self.dcp_world_size
-            block_table_indices = (req_indices * self.max_num_blocks_per_req +
-                                   positions // virtual_block_size)
+            block_table_indices = (
+                req_indices * self.max_num_blocks_per_req
+                + positions // virtual_block_size
+            )
             block_numbers = self.block_table.np.ravel()[block_table_indices]
             # Use virtual_block_size for mask calculation, which marks local
             # tokens.
@@ -101,16 +104,20 @@ def compute_slot_mapping(self, req_indices: np.ndarray,
             # Calculate slot_mapping
             slot_mapping = block_numbers * self.block_size + block_offsets
             # Write final slots, use -1 for not-local
-            self.slot_mapping.np[:req_indices.shape[0]] = np.where(
-                mask, slot_mapping, -1)
+            self.slot_mapping.np[: req_indices.shape[0]] = np.where(
+                mask, slot_mapping, -1
+            )
         else:
-            block_table_indices = (req_indices * self.max_num_blocks_per_req +
-                                   positions // self.block_size)
+            block_table_indices = (
+                req_indices * self.max_num_blocks_per_req + positions // self.block_size
+            )
             block_numbers = self.block_table.np.ravel()[block_table_indices]
             block_offsets = positions % self.block_size
-            np.add(block_numbers * self.block_size,
-                   block_offsets,
-                   out=self.slot_mapping.np[:req_indices.shape[0]])
+            np.add(
+                block_numbers * self.block_size,
+                block_offsets,
+                out=self.slot_mapping.np[: req_indices.shape[0]],
+            )
 
     def commit_block_table(self, num_reqs: int) -> None:
         self.block_table.copy_to_gpu(num_reqs)
@@ -134,25 +141,27 @@ def get_numpy_array(self) -> np.ndarray:
         """Returns the numpy array of the block table."""
         return self.block_table.np
 
-    def _make_buffer(self, *size: Union[int, torch.SymInt],
-                     dtype: torch.dtype) -> CpuGpuBuffer:
-        return CpuGpuBuffer(*size,
-                            dtype=dtype,
-                            device=self.device,
-                            pin_memory=self.pin_memory)
+    def _make_buffer(
+        self, *size: Union[int, torch.SymInt], dtype: torch.dtype
+    ) -> CpuGpuBuffer:
+        return CpuGpuBuffer(
+            *size, dtype=dtype, device=self.device, pin_memory=self.pin_memory
+        )
 
 
 class MultiGroupBlockTable:
     """The BlockTables for each KV cache group."""
 
-    def __init__(self,
-                 max_num_reqs: int,
-                 max_model_len: int,
-                 max_num_batched_tokens: int,
-                 pin_memory: bool,
-                 device: torch.device,
-                 block_sizes: list[int],
-                 num_speculative_tokens: int = 0) -> None:
+    def __init__(
+        self,
+        max_num_reqs: int,
+        max_model_len: int,
+        max_num_batched_tokens: int,
+        pin_memory: bool,
+        device: torch.device,
+        block_sizes: list[int],
+        num_speculative_tokens: int = 0,
+    ) -> None:
         # Note(hc): each dcp rank only store
         # (max_model_len//dcp_world_size) tokens in kvcache,
         # so the block_size which used for calc max_num_blocks_per_req
@@ -165,14 +174,20 @@ def __init__(self,
 
         self.block_tables = [
             BlockTable(
-                block_size, max_num_reqs,
-                max(cdiv(max_model_len, block_size * dcp_world_size),
-                    1 + num_speculative_tokens), max_num_batched_tokens,
-                pin_memory, device) for block_size in block_sizes
+                block_size,
+                max_num_reqs,
+                max(
+                    cdiv(max_model_len, block_size * dcp_world_size),
+                    1 + num_speculative_tokens,
+                ),
+                max_num_batched_tokens,
+                pin_memory,
+                device,
+            )
+            for block_size in block_sizes
         ]
 
-    def append_row(self, block_ids: tuple[list[int], ...],
-                   row_idx: int) -> None:
+    def append_row(self, block_ids: tuple[list[int], ...], row_idx: int) -> None:
         for i, block_table in enumerate(self.block_tables):
             block_table.append_row(block_ids[i], row_idx)
 
@@ -188,8 +203,9 @@ def swap_row(self, src: int, tgt: int) -> None:
         for block_table in self.block_tables:
             block_table.swap_row(src, tgt)
 
-    def compute_slot_mapping(self, req_indices: np.ndarray,
-                             positions: np.ndarray) -> None:
+    def compute_slot_mapping(
+        self, req_indices: np.ndarray, positions: np.ndarray
+    ) -> None:
         for block_table in self.block_tables:
             block_table.compute_slot_mapping(req_indices, positions)
 
diff --git a/vllm/v1/worker/cpu_model_runner.py b/vllm/v1/worker/cpu_model_runner.py
index 964e4c6b2383..f48b354e8a7d 100644
--- a/vllm/v1/worker/cpu_model_runner.py
+++ b/vllm/v1/worker/cpu_model_runner.py
@@ -19,7 +19,6 @@
 
 
 class CPUModelRunner(GPUModelRunner):
-
     def __init__(self, vllm_config: VllmConfig, device: torch.device):
         with _torch_cuda_wrapper():
             super().__init__(vllm_config, device)
@@ -35,14 +34,15 @@ def __init__(self, vllm_config: VllmConfig, device: torch.device):
     # Note: Remove the override after new attention backend finished
     def _may_reorder_batch(self, scheduler_output: "SchedulerOutput") -> None:
         if len(self.kv_cache_config.kv_cache_groups) > 1:
-            raise ValueError("Multiple KVCacheGroups is not"
-                             "currently supported with CPU model runner.")
+            raise ValueError(
+                "Multiple KVCacheGroups is not"
+                "currently supported with CPU model runner."
+            )
         super()._may_reorder_batch(scheduler_output)
 
     def _postprocess_tensors(self) -> None:
         # Note: replace device tensors with cpu tensors
-        def replace_tensor(obj: Any, cpu_attr_name: str,
-                           device_attr_name) -> None:
+        def replace_tensor(obj: Any, cpu_attr_name: str, device_attr_name) -> None:
             cpu_tensor = getattr(obj, cpu_attr_name, None)
             device_tensor = getattr(obj, device_attr_name, None)
             if cpu_tensor is not None and device_tensor is not None:
@@ -68,8 +68,7 @@ def load_model(self, eep_scale_up: bool = False) -> None:
         self.model = get_model(vllm_config=self.vllm_config)
 
         if self.lora_config:
-            self.model = self.load_lora_model(self.model, self.vllm_config,
-                                              self.device)
+            self.model = self.load_lora_model(self.model, self.vllm_config, self.device)
 
     def get_model(self) -> nn.Module:
         return self.model
@@ -90,23 +89,19 @@ def _sync_device(self) -> None:
     def _to_list(self, sampled_token_ids: torch.Tensor) -> list[list[int]]:
         return sampled_token_ids.tolist()
 
-    def get_dp_padding(self,
-                       num_tokens: int) -> tuple[int, Optional[torch.Tensor]]:
+    def get_dp_padding(self, num_tokens: int) -> tuple[int, Optional[torch.Tensor]]:
         # Note: For CPU backend, dp padding is not required for now.
         return 0, None
 
 
 @contextmanager
 def _torch_cuda_wrapper():
-
     class _EventPlaceholder:
-
         def __init__(self, *args, **kwargs) -> None:
             self.record = lambda: None
             self.synchronize = lambda: None
 
     class _StreamPlaceholder:
-
         def __init__(self, *args, **kwargs) -> None:
             pass
 
diff --git a/vllm/v1/worker/cpu_worker.py b/vllm/v1/worker/cpu_worker.py
index c6a686d6b75e..ee865ec8e649 100644
--- a/vllm/v1/worker/cpu_worker.py
+++ b/vllm/v1/worker/cpu_worker.py
@@ -13,25 +13,27 @@
 from vllm.platforms import CpuArchEnum, current_platform
 from vllm.platforms.cpu import CpuPlatform, LogicalCPUInfo
 from vllm.v1.worker.cpu_model_runner import CPUModelRunner
-from vllm.v1.worker.gpu_worker import (Worker,
-                                       init_worker_distributed_environment)
+from vllm.v1.worker.gpu_worker import Worker, init_worker_distributed_environment
 
 logger = init_logger(__name__)
 
 
 class CPUWorker(Worker):
-
-    def __init__(self,
-                 vllm_config: VllmConfig,
-                 local_rank: int,
-                 rank: int,
-                 distributed_init_method: str,
-                 is_driver_worker: bool = False):
-        super().__init__(vllm_config,
-                         local_rank,
-                         rank,
-                         distributed_init_method,
-                         is_driver_worker=is_driver_worker)
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        local_rank: int,
+        rank: int,
+        distributed_init_method: str,
+        is_driver_worker: bool = False,
+    ):
+        super().__init__(
+            vllm_config,
+            local_rank,
+            rank,
+            distributed_init_method,
+            is_driver_worker=is_driver_worker,
+        )
 
         self.parallel_config.disable_custom_all_reduce = True
 
@@ -43,11 +45,13 @@ def init_device(self):
             if cpu_arch in (CpuArchEnum.POWERPC, CpuArchEnum.S390X):
                 # For S390X/POWERPC SMT-8/4/2
                 self.local_omp_cpuid = self._get_autobind_cpu_ids(
-                    lambda cpus: [cpu for cpu in cpus if cpu.id % 8 < 4])
+                    lambda cpus: [cpu for cpu in cpus if cpu.id % 8 < 4]
+                )
             elif current_platform.get_cpu_architecture() == CpuArchEnum.X86:
                 # For x86 SMT-2, use 1 CPU per core
                 self.local_omp_cpuid = self._get_autobind_cpu_ids(
-                    lambda cpus: cpus[-1:])
+                    lambda cpus: cpus[-1:]
+                )
             else:
                 self.local_omp_cpuid = "all"
         else:
@@ -55,9 +59,9 @@ def init_device(self):
             omp_cpuids = omp_cpuids.split("|")
             if local_dp_rank is not None:
                 world_size = self.parallel_config.world_size
-                omp_cpuids = omp_cpuids[local_dp_rank *
-                                        world_size:(local_dp_rank + 1) *
-                                        world_size]
+                omp_cpuids = omp_cpuids[
+                    local_dp_rank * world_size : (local_dp_rank + 1) * world_size
+                ]
             self.local_omp_cpuid = omp_cpuids[self.rank]
 
         if self.local_omp_cpuid != "all":
@@ -66,19 +70,22 @@ def init_device(self):
                 logger.info(ret)
 
         # Note: unique identifier for creating allreduce shared memory
-        os.environ["VLLM_DIST_IDENT"] = self.distributed_init_method.split(
-            ":")[-1]
+        os.environ["VLLM_DIST_IDENT"] = self.distributed_init_method.split(":")[-1]
         # Initialize the distributed environment.
-        init_worker_distributed_environment(self.vllm_config, self.rank,
-                                            self.distributed_init_method,
-                                            self.local_rank,
-                                            current_platform.dist_backend)
+        init_worker_distributed_environment(
+            self.vllm_config,
+            self.rank,
+            self.distributed_init_method,
+            self.local_rank,
+            current_platform.dist_backend,
+        )
         # Set random seed.
         set_random_seed(self.model_config.seed)
 
         # Construct the model runner
         self.model_runner: CPUModelRunner = CPUModelRunner(
-            self.vllm_config, torch.device("cpu"))
+            self.vllm_config, torch.device("cpu")
+        )
 
     def sleep(self, level: int = 1) -> None:
         logger.warning("sleep mode is not supported on CPU, ignore it.")
@@ -98,31 +105,31 @@ def compile_or_warm_up_model(self) -> None:
         self.model_runner.warming_up_model()
 
     def _get_autobind_cpu_ids(
-        self, cpu_selector: Callable[[list[LogicalCPUInfo]],
-                                     list[LogicalCPUInfo]]
+        self, cpu_selector: Callable[[list[LogicalCPUInfo]], list[LogicalCPUInfo]]
     ) -> str:
         """
-        Return CPU ids to bind based on NUMA nodes. 
-        Currently for rank N, only CPU ids on the N-th node in available NUMA 
+        Return CPU ids to bind based on NUMA nodes.
+        Currently for rank N, only CPU ids on the N-th node in available NUMA
         node list will be selected.
         Args:
-            cpu_selector: a callable object to select CPUs from a CPU list 
+            cpu_selector: a callable object to select CPUs from a CPU list
             of a physical core. The input is a LogicalCPUInfo list, sorted by
-            the LogicalCPUInfo.id. A selected LogicalCPUInfo list should be 
+            the LogicalCPUInfo.id. A selected LogicalCPUInfo list should be
             returned.
         """
 
-        allowed_numa_nodes, logical_cpu_list = \
+        allowed_numa_nodes, logical_cpu_list = (
             CpuPlatform.get_allowed_cpu_core_node_list()
+        )
         assert len(allowed_numa_nodes) >= self.parallel_config.world_size, (
             f"No enough allowed NUMA nodes to bind threads of "
             f"{self.parallel_config.world_size} CPUWorkers. "
             f"Allowed NUMA nodes are {allowed_numa_nodes}. "
-            "Please try to bind threads manually.")
+            "Please try to bind threads manually."
+        )
 
         # Get CPUs on NUMA node `allowed_numa_nodes[local_rank]``
-        selected_numa_node = allowed_numa_nodes[
-            self.local_rank]  # type: ignore
+        selected_numa_node = allowed_numa_nodes[self.local_rank]  # type: ignore
         logical_cpu_list = [
             x for x in logical_cpu_list if x.numa_node == selected_numa_node
         ]
@@ -142,15 +149,20 @@ def _get_autobind_cpu_ids(
         # Reserve CPUs for other processes
         reserve_cpu_num = envs.VLLM_CPU_NUM_OF_RESERVED_CPU
         if reserve_cpu_num is None:
-            need_reserve = (self.parallel_config.world_size > 1 or
-                            self.parallel_config.data_parallel_size_local > 1)
+            need_reserve = (
+                self.parallel_config.world_size > 1
+                or self.parallel_config.data_parallel_size_local > 1
+            )
             reserve_cpu_num = 1 if need_reserve else 0
         assert len(logical_cpu_list) > reserve_cpu_num, (
             f"VLLM_CPU_NUM_OF_RESERVED_CPU ({reserve_cpu_num}) "
-            f"should less than {len(logical_cpu_list)}.")
+            f"should less than {len(logical_cpu_list)}."
+        )
         if reserve_cpu_num != 0:
             logical_cpu_list = logical_cpu_list[:-reserve_cpu_num]
 
-        logger.info("auto thread-binding list (id, physical core): %s",
-                    [(x.id, x.physical_core) for x in logical_cpu_list])
+        logger.info(
+            "auto thread-binding list (id, physical core): %s",
+            [(x.id, x.physical_core) for x in logical_cpu_list],
+        )
         return ",".join([str(x.id) for x in logical_cpu_list])
diff --git a/vllm/v1/worker/gpu_input_batch.py b/vllm/v1/worker/gpu_input_batch.py
index 7848283a9096..06f935423662 100644
--- a/vllm/v1/worker/gpu_input_batch.py
+++ b/vllm/v1/worker/gpu_input_batch.py
@@ -15,9 +15,11 @@
 from vllm.utils import length_from_prompt_token_ids_or_embeds, swap_dict_values
 from vllm.v1.outputs import LogprobsTensors
 from vllm.v1.pool.metadata import PoolingMetadata
-from vllm.v1.sample.logits_processor import (BatchUpdateBuilder,
-                                             LogitsProcessors,
-                                             MoveDirectionality)
+from vllm.v1.sample.logits_processor import (
+    BatchUpdateBuilder,
+    LogitsProcessors,
+    MoveDirectionality,
+)
 from vllm.v1.sample.metadata import SamplingMetadata
 from vllm.v1.spec_decode.utils import is_spec_decode_unsupported
 from vllm.v1.utils import copy_slice
@@ -26,7 +28,6 @@
 
 @dataclass
 class CachedRequestState:
-
     req_id: str
     prompt_token_ids: Optional[list[int]]
     mm_features: list[MultiModalFeatureSpec]
@@ -46,7 +47,8 @@ class CachedRequestState:
 
     def __post_init__(self):
         self.num_prompt_tokens = length_from_prompt_token_ids_or_embeds(
-            self.prompt_token_ids, self.prompt_embeds)
+            self.prompt_token_ids, self.prompt_embeds
+        )
 
     @property
     def num_tokens(self) -> int:
@@ -57,7 +59,8 @@ def get_token_id(self, idx: int) -> int:
             if self.prompt_token_ids is None:
                 raise ValueError(
                     f"Tried to access token index {idx}, but that token was "
-                    "provided via prompt_embeds, and its ID is unknown.")
+                    "provided via prompt_embeds, and its ID is unknown."
+                )
             return self.prompt_token_ids[idx]
         elif idx - self.num_prompt_tokens < len(self.output_token_ids):
             return self.output_token_ids[idx - self.num_prompt_tokens]
@@ -66,7 +69,6 @@ def get_token_id(self, idx: int) -> int:
 
 
 class InputBatch:
-
     def __init__(
         self,
         max_num_reqs: int,
@@ -104,10 +106,9 @@ def __init__(
             pin_memory=False,
         )
         self.token_ids_cpu = self.token_ids_cpu_tensor.numpy()
-        self.is_token_ids = torch.zeros((max_num_reqs, max_model_len),
-                                        device="cpu",
-                                        dtype=bool,
-                                        pin_memory=False)
+        self.is_token_ids = torch.zeros(
+            (max_num_reqs, max_model_len), device="cpu", dtype=bool, pin_memory=False
+        )
         # Store prompt embeddings per request to avoid OOM from large upfront
         # allocation if max_model_len is big.
         # Maps req_index -> tensor of shape (num_prompt_tokens, hidden_size)
@@ -116,13 +117,12 @@ def __init__(
         self.num_tokens_no_spec = np.zeros(max_num_reqs, dtype=np.int32)
         self.num_prompt_tokens = np.zeros(max_num_reqs, dtype=np.int32)
         self.num_computed_tokens_cpu_tensor = torch.zeros(
-            (max_num_reqs, ),
+            (max_num_reqs,),
             device="cpu",
             dtype=torch.int32,
             pin_memory=pin_memory,
         )
-        self.num_computed_tokens_cpu = \
-            self.num_computed_tokens_cpu_tensor.numpy()
+        self.num_computed_tokens_cpu = self.num_computed_tokens_cpu_tensor.numpy()
 
         # Block table.
         self.block_table = MultiGroupBlockTable(
@@ -136,34 +136,27 @@ def __init__(
         )
 
         # Sampling-related.
-        self.temperature = torch.empty((max_num_reqs, ),
-                                       dtype=torch.float32,
-                                       device=device)
-        self.temperature_cpu_tensor = torch.empty((max_num_reqs, ),
-                                                  dtype=torch.float32,
-                                                  device="cpu",
-                                                  pin_memory=pin_memory)
+        self.temperature = torch.empty(
+            (max_num_reqs,), dtype=torch.float32, device=device
+        )
+        self.temperature_cpu_tensor = torch.empty(
+            (max_num_reqs,), dtype=torch.float32, device="cpu", pin_memory=pin_memory
+        )
         self.temperature_cpu = self.temperature_cpu_tensor.numpy()
         self.greedy_reqs: set[str] = set()
         self.random_reqs: set[str] = set()
 
-        self.top_p = torch.empty((max_num_reqs, ),
-                                 dtype=torch.float32,
-                                 device=device)
-        self.top_p_cpu_tensor = torch.empty((max_num_reqs, ),
-                                            dtype=torch.float32,
-                                            device="cpu",
-                                            pin_memory=pin_memory)
+        self.top_p = torch.empty((max_num_reqs,), dtype=torch.float32, device=device)
+        self.top_p_cpu_tensor = torch.empty(
+            (max_num_reqs,), dtype=torch.float32, device="cpu", pin_memory=pin_memory
+        )
         self.top_p_cpu = self.top_p_cpu_tensor.numpy()
         self.top_p_reqs: set[str] = set()
 
-        self.top_k = torch.empty((max_num_reqs, ),
-                                 dtype=torch.int32,
-                                 device=device)
-        self.top_k_cpu_tensor = torch.empty((max_num_reqs, ),
-                                            dtype=torch.int32,
-                                            device="cpu",
-                                            pin_memory=pin_memory)
+        self.top_k = torch.empty((max_num_reqs,), dtype=torch.int32, device=device)
+        self.top_k_cpu_tensor = torch.empty(
+            (max_num_reqs,), dtype=torch.int32, device="cpu", pin_memory=pin_memory
+        )
         self.top_k_cpu = self.top_k_cpu_tensor.numpy()
         self.top_k_reqs: set[str] = set()
 
@@ -171,54 +164,43 @@ def __init__(
         self.spec_decode_unsupported_reqs: set[str] = set()
 
         # Frequency penalty related data structures
-        self.frequency_penalties = torch.empty((max_num_reqs, ),
-                                               dtype=torch.float,
-                                               device=device)
+        self.frequency_penalties = torch.empty(
+            (max_num_reqs,), dtype=torch.float, device=device
+        )
         self.frequency_penalties_cpu_tensor = torch.empty(
-            (max_num_reqs, ),
-            dtype=torch.float,
-            device="cpu",
-            pin_memory=pin_memory)
-        self.frequency_penalties_cpu = \
-            self.frequency_penalties_cpu_tensor.numpy()
+            (max_num_reqs,), dtype=torch.float, device="cpu", pin_memory=pin_memory
+        )
+        self.frequency_penalties_cpu = self.frequency_penalties_cpu_tensor.numpy()
         self.frequency_penalties_reqs: set[str] = set()
 
         # Presence penalty related data structures
-        self.presence_penalties = torch.empty((max_num_reqs, ),
-                                              dtype=torch.float,
-                                              device=device)
-        self.presence_penalties_cpu_tensor = torch.empty((max_num_reqs, ),
-                                                         dtype=torch.float,
-                                                         device="cpu",
-                                                         pin_memory=pin_memory)
-        self.presence_penalties_cpu = self.presence_penalties_cpu_tensor.numpy(
+        self.presence_penalties = torch.empty(
+            (max_num_reqs,), dtype=torch.float, device=device
         )
+        self.presence_penalties_cpu_tensor = torch.empty(
+            (max_num_reqs,), dtype=torch.float, device="cpu", pin_memory=pin_memory
+        )
+        self.presence_penalties_cpu = self.presence_penalties_cpu_tensor.numpy()
         self.presence_penalties_reqs: set[str] = set()
 
         # Repetition penalty related data structures
-        self.repetition_penalties = torch.empty((max_num_reqs, ),
-                                                dtype=torch.float,
-                                                device=device)
+        self.repetition_penalties = torch.empty(
+            (max_num_reqs,), dtype=torch.float, device=device
+        )
         self.repetition_penalties_cpu_tensor = torch.empty(
-            (max_num_reqs, ),
-            dtype=torch.float,
-            device="cpu",
-            pin_memory=pin_memory)
-        self.repetition_penalties_cpu = \
-            self.repetition_penalties_cpu_tensor.numpy()
+            (max_num_reqs,), dtype=torch.float, device="cpu", pin_memory=pin_memory
+        )
+        self.repetition_penalties_cpu = self.repetition_penalties_cpu_tensor.numpy()
         self.repetition_penalties_reqs: set[str] = set()
 
         # Speculative decoding
-        self.num_accepted_tokens_cpu_tensor = torch.ones((max_num_reqs, ),
-                                                         dtype=torch.int64,
-                                                         device="cpu",
-                                                         pin_memory=pin_memory)
-        self.num_accepted_tokens_cpu = \
-            self.num_accepted_tokens_cpu_tensor.numpy()
+        self.num_accepted_tokens_cpu_tensor = torch.ones(
+            (max_num_reqs,), dtype=torch.int64, device="cpu", pin_memory=pin_memory
+        )
+        self.num_accepted_tokens_cpu = self.num_accepted_tokens_cpu_tensor.numpy()
 
         # lora related
-        self.request_lora_mapping = np.zeros((self.max_num_reqs, ),
-                                             dtype=np.int32)
+        self.request_lora_mapping = np.zeros((self.max_num_reqs,), dtype=np.int32)
         self.lora_id_to_request_ids: dict[int, set[str]] = {}
         self.lora_id_to_lora_request: dict[int, LoRARequest] = {}
 
@@ -250,8 +232,7 @@ def __init__(
         # req_index -> bad_words_token_ids
         self.bad_words_token_ids: dict[int, list[list[int]]] = {}
 
-        self.logits_processing_needs_token_ids = np.zeros(max_num_reqs,
-                                                          dtype=bool)
+        self.logits_processing_needs_token_ids = np.zeros(max_num_reqs, dtype=bool)
 
         self.req_output_token_ids: list[Optional[list[int]]] = []
 
@@ -291,8 +272,13 @@ def _register_add_request(self, request: "CachedRequestState") -> int:
             # Detailed added request metadata is only required for non-pooling
             # models, to support logitsprocs.
             self.batch_update_builder.added.append(
-                (new_req_index, request.sampling_params,
-                 request.prompt_token_ids, request.output_token_ids))
+                (
+                    new_req_index,
+                    request.sampling_params,
+                    request.prompt_token_ids,
+                    request.output_token_ids,
+                )
+            )
 
         return new_req_index
 
@@ -314,20 +300,19 @@ def add_request(
 
         # Copy the prompt token ids and output token ids.
         num_prompt_tokens = length_from_prompt_token_ids_or_embeds(
-            request.prompt_token_ids, request.prompt_embeds)
+            request.prompt_token_ids, request.prompt_embeds
+        )
         self.num_prompt_tokens[req_index] = num_prompt_tokens
         start_idx = num_prompt_tokens
         end_idx = start_idx + len(request.output_token_ids)
         if request.prompt_token_ids is not None:
-            self.token_ids_cpu[
-                req_index, :num_prompt_tokens] = request.prompt_token_ids
+            self.token_ids_cpu[req_index, :num_prompt_tokens] = request.prompt_token_ids
             self.is_token_ids[req_index, :num_prompt_tokens] = True
         else:
             self.is_token_ids[req_index, :num_prompt_tokens] = False
         if request.prompt_embeds is not None:
             self.req_prompt_embeds[req_index] = request.prompt_embeds
-        self.token_ids_cpu[req_index,
-                           start_idx:end_idx] = request.output_token_ids
+        self.token_ids_cpu[req_index, start_idx:end_idx] = request.output_token_ids
         self.is_token_ids[req_index, start_idx:end_idx] = True
         # Number of token ids in prompt (token_ids_cpu or prompt_embeds).
         # NOTE(woosuk): This may include spec decode tokens.
@@ -339,8 +324,7 @@ def add_request(
         self.block_table.add_row(request.block_ids, req_index)
 
         if sampling_params := request.sampling_params:
-            if (self.is_spec_decode
-                    and is_spec_decode_unsupported(sampling_params)):
+            if self.is_spec_decode and is_spec_decode_unsupported(sampling_params):
                 self.spec_decode_unsupported_reqs.add(req_id)
             if sampling_params.sampling_type == SamplingType.GREEDY:
                 # Should avoid division by zero later when apply_temperature.
@@ -359,16 +343,15 @@ def add_request(
             else:
                 top_k = self.vocab_size
             self.top_k_cpu[req_index] = top_k
-            self.frequency_penalties_cpu[
-                req_index] = sampling_params.frequency_penalty
+            self.frequency_penalties_cpu[req_index] = sampling_params.frequency_penalty
             if sampling_params.frequency_penalty != 0.0:
                 self.frequency_penalties_reqs.add(req_id)
-            self.presence_penalties_cpu[
-                req_index] = sampling_params.presence_penalty
+            self.presence_penalties_cpu[req_index] = sampling_params.presence_penalty
             if sampling_params.presence_penalty != 0.0:
                 self.presence_penalties_reqs.add(req_id)
-            self.repetition_penalties_cpu[
-                req_index] = sampling_params.repetition_penalty
+            self.repetition_penalties_cpu[req_index] = (
+                sampling_params.repetition_penalty
+            )
             if sampling_params.repetition_penalty != 1.0:
                 self.repetition_penalties_reqs.add(req_id)
 
@@ -378,13 +361,17 @@ def add_request(
                 self.generators[req_index] = request.generator
 
             if sampling_params.logprobs is not None:
-                self.num_logprobs[req_id] = (self.vocab_size
-                                             if sampling_params.logprobs == -1
-                                             else sampling_params.logprobs)
+                self.num_logprobs[req_id] = (
+                    self.vocab_size
+                    if sampling_params.logprobs == -1
+                    else sampling_params.logprobs
+                )
             if sampling_params.prompt_logprobs is not None:
                 self.num_prompt_logprobs[req_id] = (
-                    self.vocab_size if sampling_params.prompt_logprobs == -1
-                    else sampling_params.prompt_logprobs)
+                    self.vocab_size
+                    if sampling_params.prompt_logprobs == -1
+                    else sampling_params.prompt_logprobs
+                )
 
             if sampling_params.allowed_token_ids:
                 self.has_allowed_token_ids.add(req_id)
@@ -395,24 +382,29 @@ def add_request(
                         self.max_num_reqs,
                         self.vocab_size,
                         dtype=torch.bool,
-                        device=self.device)
+                        device=self.device,
+                    )
                     self.allowed_token_ids_mask_cpu_tensor = torch.zeros(
                         self.max_num_reqs,
                         self.vocab_size,
                         dtype=torch.bool,
-                        device="cpu")
+                        device="cpu",
+                    )
                 self.allowed_token_ids_mask_cpu_tensor[req_index] = True
                 # False means we don't fill with -inf.
                 self.allowed_token_ids_mask_cpu_tensor[req_index][
-                    sampling_params.allowed_token_ids] = False
+                    sampling_params.allowed_token_ids
+                ] = False
 
             if sampling_params.bad_words_token_ids:
-                self.bad_words_token_ids[
-                    req_index] = sampling_params.bad_words_token_ids
+                self.bad_words_token_ids[req_index] = (
+                    sampling_params.bad_words_token_ids
+                )
         elif pooling_params := request.pooling_params:
             self.pooling_params[req_id] = pooling_params
             self.logits_processing_needs_token_ids[req_index] = (
-                pooling_params.requires_token_ids)
+                pooling_params.requires_token_ids
+            )
         else:
             raise NotImplementedError("Unrecognized request type")
 
@@ -489,21 +481,32 @@ def remove_request(self, req_id: str) -> Optional[int]:
     def swap_states(self, i1: int, i2: int) -> None:
         old_id_i1 = self._req_ids[i1]
         old_id_i2 = self._req_ids[i2]
-        self._req_ids[i1], self._req_ids[i2] =\
-            self._req_ids[i2], self._req_ids[i1] # noqa
-        self.req_output_token_ids[i1], self.req_output_token_ids[i2] =\
-            self.req_output_token_ids[i2], self.req_output_token_ids[i1]
+        self._req_ids[i1], self._req_ids[i2] = self._req_ids[i2], self._req_ids[i1]  # noqa
+        self.req_output_token_ids[i1], self.req_output_token_ids[i2] = (
+            self.req_output_token_ids[i2],
+            self.req_output_token_ids[i1],
+        )
         assert old_id_i1 is not None and old_id_i2 is not None
-        self.req_id_to_index[old_id_i1], self.req_id_to_index[old_id_i2] =\
-            self.req_id_to_index[old_id_i2], self.req_id_to_index[old_id_i1]
-        self.num_tokens[i1], self.num_tokens[i2] =\
-            self.num_tokens[i2], self.num_tokens[i1]
-        self.num_tokens_no_spec[i1], self.num_tokens_no_spec[i2] =\
-            self.num_tokens_no_spec[i2], self.num_tokens_no_spec[i1]
-        self.num_prompt_tokens[i1], self.num_prompt_tokens[i2] =\
-            self.num_prompt_tokens[i2], self.num_prompt_tokens[i1]
-        self.num_computed_tokens_cpu[i1], self.num_computed_tokens_cpu[i2] =\
-            self.num_computed_tokens_cpu[i2], self.num_computed_tokens_cpu[i1]
+        self.req_id_to_index[old_id_i1], self.req_id_to_index[old_id_i2] = (
+            self.req_id_to_index[old_id_i2],
+            self.req_id_to_index[old_id_i1],
+        )
+        self.num_tokens[i1], self.num_tokens[i2] = (
+            self.num_tokens[i2],
+            self.num_tokens[i1],
+        )
+        self.num_tokens_no_spec[i1], self.num_tokens_no_spec[i2] = (
+            self.num_tokens_no_spec[i2],
+            self.num_tokens_no_spec[i1],
+        )
+        self.num_prompt_tokens[i1], self.num_prompt_tokens[i2] = (
+            self.num_prompt_tokens[i2],
+            self.num_prompt_tokens[i1],
+        )
+        self.num_computed_tokens_cpu[i1], self.num_computed_tokens_cpu[i2] = (
+            self.num_computed_tokens_cpu[i2],
+            self.num_computed_tokens_cpu[i1],
+        )
 
         # NOTE: the following is unsafe
         # self.token_ids_cpu[i1, ...], self.token_ids_cpu[i2, ...], =\
@@ -530,8 +533,10 @@ def swap_states(self, i1: int, i2: int) -> None:
 
         self.block_table.swap_row(i1, i2)
 
-        self.request_lora_mapping[i1], self.request_lora_mapping[i2] = \
-            self.request_lora_mapping[i2], self.request_lora_mapping[i1]
+        self.request_lora_mapping[i1], self.request_lora_mapping[i2] = (
+            self.request_lora_mapping[i2],
+            self.request_lora_mapping[i1],
+        )
 
         if self.is_pooling_model:
             # Sampling and logits parameters don't apply to pooling models.
@@ -539,32 +544,42 @@ def swap_states(self, i1: int, i2: int) -> None:
 
         # For autoregressive models, track detailed request reordering info
         # to support logitsprocs.
-        self.batch_update_builder.moved.append(
-            (i1, i2, MoveDirectionality.SWAP))
-
-        self.temperature_cpu[i1], self.temperature_cpu[i2] = \
-            self.temperature_cpu[i2], self.temperature_cpu[i1]
-        self.top_p_cpu[i1], self.top_p_cpu[i2] = \
-            self.top_p_cpu[i2], self.top_p_cpu[i1]
-        self.top_k_cpu[i1], self.top_k_cpu[i2] = \
-            self.top_k_cpu[i2], self.top_k_cpu[i1]
-        self.frequency_penalties_cpu[i1], self.frequency_penalties_cpu[i2] = \
-            self.frequency_penalties_cpu[i2], self.frequency_penalties_cpu[i1]
-        self.presence_penalties_cpu[i1], self.presence_penalties_cpu[i2] = \
-            self.presence_penalties_cpu[i2], self.presence_penalties_cpu[i1]
-        self.repetition_penalties_cpu[i1], self.repetition_penalties_cpu[i2] = \
-            self.repetition_penalties_cpu[i2], self.repetition_penalties_cpu[i1]
-        self.num_accepted_tokens_cpu[i1], self.num_accepted_tokens_cpu[i2] =\
-            self.num_accepted_tokens_cpu[i2], self.num_accepted_tokens_cpu[i1]
+        self.batch_update_builder.moved.append((i1, i2, MoveDirectionality.SWAP))
+
+        self.temperature_cpu[i1], self.temperature_cpu[i2] = (
+            self.temperature_cpu[i2],
+            self.temperature_cpu[i1],
+        )
+        self.top_p_cpu[i1], self.top_p_cpu[i2] = self.top_p_cpu[i2], self.top_p_cpu[i1]
+        self.top_k_cpu[i1], self.top_k_cpu[i2] = self.top_k_cpu[i2], self.top_k_cpu[i1]
+        self.frequency_penalties_cpu[i1], self.frequency_penalties_cpu[i2] = (
+            self.frequency_penalties_cpu[i2],
+            self.frequency_penalties_cpu[i1],
+        )
+        self.presence_penalties_cpu[i1], self.presence_penalties_cpu[i2] = (
+            self.presence_penalties_cpu[i2],
+            self.presence_penalties_cpu[i1],
+        )
+        self.repetition_penalties_cpu[i1], self.repetition_penalties_cpu[i2] = (
+            self.repetition_penalties_cpu[i2],
+            self.repetition_penalties_cpu[i1],
+        )
+        self.num_accepted_tokens_cpu[i1], self.num_accepted_tokens_cpu[i2] = (
+            self.num_accepted_tokens_cpu[i2],
+            self.num_accepted_tokens_cpu[i1],
+        )
 
         swap_dict_values(self.generators, i1, i2)
         swap_dict_values(self.bad_words_token_ids, i1, i2)
 
         if self.allowed_token_ids_mask_cpu_tensor is not None:
-            self.allowed_token_ids_mask_cpu_tensor[i1], \
-                self.allowed_token_ids_mask_cpu_tensor[i2] =\
-                self.allowed_token_ids_mask_cpu_tensor[i2], \
-                    self.allowed_token_ids_mask_cpu_tensor[i1]
+            (
+                self.allowed_token_ids_mask_cpu_tensor[i1],
+                self.allowed_token_ids_mask_cpu_tensor[i2],
+            ) = (
+                self.allowed_token_ids_mask_cpu_tensor[i2],
+                self.allowed_token_ids_mask_cpu_tensor[i1],
+            )
 
     def condense(self) -> None:
         """Slide non-empty requests down into lower, empty indices.
@@ -616,23 +631,28 @@ def condense(self) -> None:
 
             num_tokens = self.num_tokens[last_req_index]
             self.token_ids_cpu[empty_index, :num_tokens] = self.token_ids_cpu[
-                last_req_index, :num_tokens]
+                last_req_index, :num_tokens
+            ]
             self.is_token_ids[empty_index, :num_tokens] = self.is_token_ids[
-                last_req_index, :num_tokens]
+                last_req_index, :num_tokens
+            ]
             if last_req_index in self.req_prompt_embeds:
-                self.req_prompt_embeds[
-                    empty_index] = self.req_prompt_embeds.pop(last_req_index)
+                self.req_prompt_embeds[empty_index] = self.req_prompt_embeds.pop(
+                    last_req_index
+                )
             self.num_tokens[empty_index] = num_tokens
             self.num_tokens_no_spec[empty_index] = self.num_tokens_no_spec[
-                last_req_index]
-            self.num_prompt_tokens[empty_index] = self.num_prompt_tokens[
-                last_req_index]
-            self.num_computed_tokens_cpu[
-                empty_index] = self.num_computed_tokens_cpu[last_req_index]
+                last_req_index
+            ]
+            self.num_prompt_tokens[empty_index] = self.num_prompt_tokens[last_req_index]
+            self.num_computed_tokens_cpu[empty_index] = self.num_computed_tokens_cpu[
+                last_req_index
+            ]
             self.block_table.move_row(last_req_index, empty_index)
 
             self.request_lora_mapping[empty_index] = self.request_lora_mapping[
-                last_req_index]
+                last_req_index
+            ]
 
             if self.is_pooling_model:
                 last_req_index -= 1
@@ -642,33 +662,35 @@ def condense(self) -> None:
             # Autoregressive models require detailed tracking of condense
             # operations to support logitsprocs
             self.batch_update_builder.moved.append(
-                (last_req_index, empty_index,
-                 MoveDirectionality.UNIDIRECTIONAL))
+                (last_req_index, empty_index, MoveDirectionality.UNIDIRECTIONAL)
+            )
 
-            self.temperature_cpu[empty_index] = self.temperature_cpu[
-                last_req_index]
+            self.temperature_cpu[empty_index] = self.temperature_cpu[last_req_index]
             self.top_p_cpu[empty_index] = self.top_p_cpu[last_req_index]
             self.top_k_cpu[empty_index] = self.top_k_cpu[last_req_index]
-            self.frequency_penalties_cpu[
-                empty_index] = self.frequency_penalties_cpu[last_req_index]
-            self.presence_penalties_cpu[
-                empty_index] = self.presence_penalties_cpu[last_req_index]
-            self.repetition_penalties_cpu[
-                empty_index] = self.repetition_penalties_cpu[last_req_index]
-            self.num_accepted_tokens_cpu[
-                empty_index] = self.num_accepted_tokens_cpu[last_req_index]
+            self.frequency_penalties_cpu[empty_index] = self.frequency_penalties_cpu[
+                last_req_index
+            ]
+            self.presence_penalties_cpu[empty_index] = self.presence_penalties_cpu[
+                last_req_index
+            ]
+            self.repetition_penalties_cpu[empty_index] = self.repetition_penalties_cpu[
+                last_req_index
+            ]
+            self.num_accepted_tokens_cpu[empty_index] = self.num_accepted_tokens_cpu[
+                last_req_index
+            ]
             generator = self.generators.pop(last_req_index, None)
             if generator is not None:
                 self.generators[empty_index] = generator
 
             # TODO convert these to LogitsProcessors
             if self.allowed_token_ids_mask_cpu_tensor is not None:
-                self.allowed_token_ids_mask_cpu_tensor[
-                    empty_index] = self.allowed_token_ids_mask_cpu_tensor[
-                        last_req_index]
+                self.allowed_token_ids_mask_cpu_tensor[empty_index] = (
+                    self.allowed_token_ids_mask_cpu_tensor[last_req_index]
+                )
 
-            bad_words_token_ids = self.bad_words_token_ids.pop(
-                last_req_index, None)
+            bad_words_token_ids = self.bad_words_token_ids.pop(last_req_index, None)
             if bad_words_token_ids is not None:
                 self.bad_words_token_ids[empty_index] = bad_words_token_ids
 
@@ -700,8 +722,9 @@ def refresh_metadata(self):
     def _make_sampling_metadata(self) -> SamplingMetadata:
         num_reqs = self.num_reqs
         if not self.all_greedy:
-            temperature = copy_slice(self.temperature_cpu_tensor,
-                                     self.temperature, num_reqs)
+            temperature = copy_slice(
+                self.temperature_cpu_tensor, self.temperature, num_reqs
+            )
         else:
             temperature = None
         if not self.no_top_p:
@@ -713,16 +736,22 @@ def _make_sampling_metadata(self) -> SamplingMetadata:
             # Since syncing these tensors is expensive only copy them
             # if necessary i.e. if there are requests which require
             # penalties to be applied during sampling.
-            copy_slice(self.frequency_penalties_cpu_tensor,
-                       self.frequency_penalties, num_reqs)
-            copy_slice(self.presence_penalties_cpu_tensor,
-                       self.presence_penalties, num_reqs)
-            copy_slice(self.repetition_penalties_cpu_tensor,
-                       self.repetition_penalties, num_reqs)
+            copy_slice(
+                self.frequency_penalties_cpu_tensor, self.frequency_penalties, num_reqs
+            )
+            copy_slice(
+                self.presence_penalties_cpu_tensor, self.presence_penalties, num_reqs
+            )
+            copy_slice(
+                self.repetition_penalties_cpu_tensor,
+                self.repetition_penalties,
+                num_reqs,
+            )
 
         needs_prompt_token_ids = (
             not self.no_penalties
-            or self.logits_processing_needs_token_ids[:num_reqs].any())
+            or self.logits_processing_needs_token_ids[:num_reqs].any()
+        )
         if needs_prompt_token_ids:
             # The prompt tokens are used only for applying penalties or
             # step pooling during the sampling/pooling process.
@@ -735,8 +764,11 @@ def _make_sampling_metadata(self) -> SamplingMetadata:
         allowed_token_ids_mask: Optional[torch.Tensor] = None
         if not self.no_allowed_token_ids:
             assert self.allowed_token_ids_mask is not None
-            copy_slice(self.allowed_token_ids_mask_cpu_tensor,
-                       self.allowed_token_ids_mask, num_reqs)
+            copy_slice(
+                self.allowed_token_ids_mask_cpu_tensor,
+                self.allowed_token_ids_mask,
+                num_reqs,
+            )
             allowed_token_ids_mask = self.allowed_token_ids_mask[:num_reqs]
 
         return SamplingMetadata(
@@ -766,8 +798,7 @@ def get_pooling_metadata(self) -> PoolingMetadata:
         pooling_params = self.get_pooling_params()
 
         return PoolingMetadata(
-            prompt_lens=torch.from_numpy(
-                self.num_prompt_tokens[:self.num_reqs]),
+            prompt_lens=torch.from_numpy(self.num_prompt_tokens[: self.num_reqs]),
             prompt_token_ids=self.sampling_metadata.prompt_token_ids,
             pooling_params=pooling_params,
         )
@@ -786,9 +817,8 @@ def _make_prompt_token_ids_tensor(self) -> torch.Tensor:
         # Use the value of vocab_size as a pad since we don't have a
         # token_id of this value.
         for i in range(num_reqs):
-            prompt_token_ids[i, self.num_prompt_tokens[i]:] = self.vocab_size
-        return prompt_token_ids_cpu_tensor.to(device=self.device,
-                                              non_blocking=True)
+            prompt_token_ids[i, self.num_prompt_tokens[i] :] = self.vocab_size
+        return prompt_token_ids_cpu_tensor.to(device=self.device, non_blocking=True)
 
     def make_lora_inputs(
         self, num_scheduled_tokens: np.ndarray
@@ -804,12 +834,12 @@ def make_lora_inputs(
             3. lora_requests: Set of relevant LoRA requests.
         """
 
-        req_lora_mapping = self.request_lora_mapping[:self.num_reqs]
+        req_lora_mapping = self.request_lora_mapping[: self.num_reqs]
         prompt_lora_mapping = tuple(req_lora_mapping)
-        token_lora_mapping = tuple(
-            req_lora_mapping.repeat(num_scheduled_tokens))
+        token_lora_mapping = tuple(req_lora_mapping.repeat(num_scheduled_tokens))
         active_lora_requests: set[LoRARequest] = set(
-            self.lora_id_to_lora_request.values())
+            self.lora_id_to_lora_request.values()
+        )
 
         return prompt_lora_mapping, token_lora_mapping, active_lora_requests
 
@@ -835,9 +865,11 @@ def no_top_k(self) -> bool:
 
     @property
     def no_penalties(self) -> bool:
-        return (len(self.presence_penalties_reqs) == 0
-                and len(self.frequency_penalties_reqs) == 0
-                and len(self.repetition_penalties_reqs) == 0)
+        return (
+            len(self.presence_penalties_reqs) == 0
+            and len(self.frequency_penalties_reqs) == 0
+            and len(self.repetition_penalties_reqs) == 0
+        )
 
     @property
     def max_num_logprobs(self) -> Optional[int]:
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 11e24e4d13dc..90429b6b0c35 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -24,70 +24,112 @@
 from vllm.compilation.counter import compilation_counter
 from vllm.compilation.cuda_graph import CUDAGraphWrapper
 from vllm.compilation.monitor import set_cudagraph_capturing_enabled
-from vllm.config import (CompilationLevel, CUDAGraphMode, VllmConfig,
-                         get_layers_from_vllm_config, update_config)
+from vllm.config import (
+    CompilationLevel,
+    CUDAGraphMode,
+    VllmConfig,
+    get_layers_from_vllm_config,
+    update_config,
+)
 from vllm.distributed.eplb.eplb_state import EplbState
-from vllm.distributed.kv_transfer import (get_kv_transfer_group,
-                                          has_kv_transfer_group)
+from vllm.distributed.kv_transfer import get_kv_transfer_group, has_kv_transfer_group
 from vllm.distributed.kv_transfer.kv_connector.utils import copy_kv_blocks
 from vllm.distributed.parallel_state import (
-    get_pp_group, get_tp_group, graph_capture, is_global_first_rank,
-    prepare_communication_buffer_for_model)
-from vllm.forward_context import (BatchDescriptor, DPMetadata,
-                                  set_forward_context)
+    get_pp_group,
+    get_tp_group,
+    graph_capture,
+    is_global_first_rank,
+    prepare_communication_buffer_for_model,
+)
+from vllm.forward_context import BatchDescriptor, DPMetadata, set_forward_context
 from vllm.logger import init_logger
 from vllm.model_executor.layers.attention_layer_base import AttentionLayerBase
 from vllm.model_executor.layers.mamba.abstract import MambaBase
 from vllm.model_executor.layers.rotary_embedding import MRotaryEmbedding
 from vllm.model_executor.model_loader import TensorizerLoader, get_model_loader
 from vllm.model_executor.models.deepseek_v2 import DeepseekV32IndexerCache
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.model_executor.models.interfaces import (SupportsMultiModal,
-                                                   is_mixture_of_experts,
-                                                   supports_eagle3,
-                                                   supports_mrope,
-                                                   supports_multimodal_pruning,
-                                                   supports_transcription)
+from vllm.model_executor.models.interfaces import (
+    SupportsMultiModal,
+    is_mixture_of_experts,
+    supports_eagle3,
+    supports_mrope,
+    supports_multimodal_pruning,
+    supports_transcription,
+)
+
 # yapf: enable
 from vllm.model_executor.models.interfaces_base import (
-    VllmModelForPooling, is_pooling_model, is_text_generation_model)
+    VllmModelForPooling,
+    is_pooling_model,
+    is_text_generation_model,
+)
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (BatchedTensorInputs, MultiModalKwargsItem,
-                                    PlaceholderRange)
+from vllm.multimodal.inputs import (
+    BatchedTensorInputs,
+    MultiModalKwargsItem,
+    PlaceholderRange,
+)
 from vllm.multimodal.utils import group_mm_kwargs_by_modality
 from vllm.pooling_params import PoolingParams
 from vllm.sampling_params import SamplingType
 from vllm.sequence import IntermediateTensors
 from vllm.tasks import GenerationTask, PoolingTask, SupportedTask
-from vllm.utils import (STR_DTYPE_TO_TORCH_DTYPE, DeviceMemoryProfiler,
-                        GiB_bytes, cdiv, check_use_alibi, get_dtype_size,
-                        is_pin_memory_available,
-                        length_from_prompt_token_ids_or_embeds, round_up,
-                        supports_dynamo)
+from vllm.utils import (
+    STR_DTYPE_TO_TORCH_DTYPE,
+    DeviceMemoryProfiler,
+    GiB_bytes,
+    cdiv,
+    check_use_alibi,
+    get_dtype_size,
+    is_pin_memory_available,
+    length_from_prompt_token_ids_or_embeds,
+    round_up,
+    supports_dynamo,
+)
 from vllm.utils.jsontree import json_map_leaves
 from vllm.v1.attention.backends.flash_attn import AttentionMetadata
 from vllm.v1.attention.backends.gdn_attn import GDNAttentionMetadataBuilder
 from vllm.v1.attention.backends.utils import (
-    AttentionCGSupport, AttentionMetadataBuilder, CommonAttentionMetadata,
+    AttentionCGSupport,
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
     create_fast_prefill_custom_backend,
-    reorder_batch_to_split_decodes_and_prefills, split_attn_metadata)
+    reorder_batch_to_split_decodes_and_prefills,
+    split_attn_metadata,
+)
 from vllm.v1.cudagraph_dispatcher import CudagraphDispatcher
+
 # yapf conflicts with isort for this block
 # yapf: disable
-from vllm.v1.kv_cache_interface import (AttentionSpec,
-                                        ChunkedLocalAttentionSpec,
-                                        CrossAttentionSpec,
-                                        EncoderOnlyAttentionSpec,
-                                        FullAttentionSpec, KVCacheConfig,
-                                        KVCacheGroupSpec, KVCacheSpec,
-                                        MambaSpec, MLAAttentionSpec,
-                                        SlidingWindowSpec,
-                                        UniformTypeKVCacheSpecs)
+from vllm.v1.kv_cache_interface import (
+    AttentionSpec,
+    ChunkedLocalAttentionSpec,
+    CrossAttentionSpec,
+    EncoderOnlyAttentionSpec,
+    FullAttentionSpec,
+    KVCacheConfig,
+    KVCacheGroupSpec,
+    KVCacheSpec,
+    MambaSpec,
+    MLAAttentionSpec,
+    SlidingWindowSpec,
+    UniformTypeKVCacheSpecs,
+)
+
 # yapf: enable
-from vllm.v1.outputs import (EMPTY_MODEL_RUNNER_OUTPUT, AsyncModelRunnerOutput,
-                             DraftTokenIds, LogprobsLists, LogprobsTensors,
-                             ModelRunnerOutput, PoolerOutput, SamplerOutput)
+from vllm.v1.outputs import (
+    EMPTY_MODEL_RUNNER_OUTPUT,
+    AsyncModelRunnerOutput,
+    DraftTokenIds,
+    LogprobsLists,
+    LogprobsTensors,
+    ModelRunnerOutput,
+    PoolerOutput,
+    SamplerOutput,
+)
 from vllm.v1.pool.metadata import PoolingMetadata
 from vllm.v1.sample.logits_processor import LogitsProcessors, build_logitsprocs
 from vllm.v1.sample.metadata import SamplingMetadata
@@ -101,18 +143,21 @@
 from vllm.v1.utils import CpuGpuBuffer, record_function_or_nullcontext
 from vllm.v1.worker.gpu_input_batch import CachedRequestState, InputBatch
 from vllm.v1.worker.gpu_ubatch_wrapper import UBatchWrapper
-from vllm.v1.worker.kv_connector_model_runner_mixin import (
-    KVConnectorModelRunnerMixin)
+from vllm.v1.worker.kv_connector_model_runner_mixin import KVConnectorModelRunnerMixin
 from vllm.v1.worker.lora_model_runner_mixin import LoRAModelRunnerMixin
-from vllm.v1.worker.ubatch_splitting import (check_ubatch_thresholds,
-                                             ubatch_split)
+from vllm.v1.worker.ubatch_splitting import check_ubatch_thresholds, ubatch_split
 from vllm.v1.worker.ubatch_utils import UBatchSlice, UBatchSlices
 from vllm.v1.worker.utils import is_residual_scattered_for_sp
 
-from .utils import (AttentionGroup, MultiModalBudget,
-                    add_kv_sharing_layers_to_kv_cache_groups, bind_kv_cache,
-                    gather_mm_placeholders, sanity_check_mm_encoder_outputs,
-                    scatter_mm_placeholders)
+from .utils import (
+    AttentionGroup,
+    MultiModalBudget,
+    add_kv_sharing_layers_to_kv_cache_groups,
+    bind_kv_cache,
+    gather_mm_placeholders,
+    sanity_check_mm_encoder_outputs,
+    scatter_mm_placeholders,
+)
 
 if TYPE_CHECKING:
     from vllm.model_executor.model_loader.tensorizer import TensorizerConfig
@@ -122,13 +167,11 @@
 
 AttnMetadataDict: TypeAlias = dict[str, AttentionMetadata]
 # list when ubatching is enabled
-PerLayerAttnMetadata: TypeAlias = Union[list[AttnMetadataDict],
-                                        AttnMetadataDict]
+PerLayerAttnMetadata: TypeAlias = Union[list[AttnMetadataDict], AttnMetadataDict]
 
 
 # Wrapper for ModelRunnerOutput to support overlapped execution.
 class AsyncGPUModelRunnerOutput(AsyncModelRunnerOutput):
-
     def __init__(
         self,
         model_runner_output: ModelRunnerOutput,
@@ -151,12 +194,13 @@ def __init__(
         with torch.cuda.stream(async_output_copy_stream):
             async_output_copy_stream.wait_stream(default_stream)
             self._sampled_token_ids_cpu = self._sampled_token_ids.to(
-                'cpu', non_blocking=True)
+                "cpu", non_blocking=True
+            )
             self._async_copy_ready_event.record()
 
     def get_output(self) -> ModelRunnerOutput:
         """Copy the device tensors to the host and return a ModelRunnerOutput.
-        
+
         This function blocks until the copy is finished.
         """
         self._async_copy_ready_event.synchronize()
@@ -174,7 +218,6 @@ def get_output(self) -> ModelRunnerOutput:
 
 
 class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -192,10 +235,10 @@ def __init__(
         self.observability_config = vllm_config.observability_config
 
         from vllm.model_executor.models.utils import set_cpu_offload_max_bytes
-        set_cpu_offload_max_bytes(
-            int(self.cache_config.cpu_offload_gb * 1024**3))
-        from vllm.model_executor.layers.batch_invariant import (
-            init_batch_invariance)
+
+        set_cpu_offload_max_bytes(int(self.cache_config.cpu_offload_gb * 1024**3))
+        from vllm.model_executor.layers.batch_invariant import init_batch_invariance
+
         init_batch_invariance()
 
         model_config = self.model_config
@@ -208,13 +251,13 @@ def __init__(
         if cache_config.cache_dtype == "auto":
             self.kv_cache_dtype = self.dtype
         else:
-            self.kv_cache_dtype = STR_DTYPE_TO_TORCH_DTYPE[
-                cache_config.cache_dtype]
+            self.kv_cache_dtype = STR_DTYPE_TO_TORCH_DTYPE[cache_config.cache_dtype]
 
-        self.is_pooling_model = (model_config.runner_type == 'pooling')
+        self.is_pooling_model = model_config.runner_type == "pooling"
         self.enable_prompt_embeds = model_config.enable_prompt_embeds
         self.is_multimodal_raw_input_only_model = (
-            model_config.is_multimodal_raw_input_only_model)
+            model_config.is_multimodal_raw_input_only_model
+        )
         # This will be overridden in load_model()
         self.is_multimodal_pruning_enabled = False
         self.max_model_len = model_config.max_model_len
@@ -227,12 +270,12 @@ def __init__(
         # TODO: Support overlapping mirco-batches
         # https://github.com/vllm-project/vllm/issues/18019
         self.broadcast_pp_output = (
-            self.parallel_config.distributed_executor_backend
-            == "external_launcher" and len(get_pp_group().ranks) > 0)
+            self.parallel_config.distributed_executor_backend == "external_launcher"
+            and len(get_pp_group().ranks) > 0
+        )
 
         # Model-related.
-        self.num_query_heads = model_config.get_num_attention_heads(
-            parallel_config)
+        self.num_query_heads = model_config.get_num_attention_heads(parallel_config)
         self.hidden_size = model_config.get_hidden_size()
         self.attention_chunk_size = model_config.attention_chunk_size
         # Only relevant for models using ALiBi (e.g, MPT)
@@ -244,13 +287,13 @@ def __init__(
         self.mm_registry = MULTIMODAL_REGISTRY
         self.uses_mrope = model_config.uses_mrope
         self.supports_mm_inputs = self.mm_registry.supports_multimodal_inputs(
-            model_config)
+            model_config
+        )
 
         if self.model_config.is_encoder_decoder:
             # Maximum length of the encoder input, only for encoder-decoder
             # models.
-            self.max_encoder_len = scheduler_config.\
-                            max_num_encoder_input_tokens
+            self.max_encoder_len = scheduler_config.max_num_encoder_input_tokens
         else:
             self.max_encoder_len = 0
 
@@ -284,17 +327,18 @@ def __init__(
             if self.speculative_config.method == "ngram":
                 self.drafter = NgramProposer(self.vllm_config)
             elif self.speculative_config.use_eagle():
-                self.drafter = EagleProposer(self.vllm_config, self.device,
-                                             self)  # type: ignore
+                self.drafter = EagleProposer(self.vllm_config, self.device, self)  # type: ignore
                 if self.speculative_config.method == "eagle3":
                     self.use_aux_hidden_state_outputs = True
             elif self.speculative_config.method == "medusa":
                 self.drafter = MedusaProposer(
-                    vllm_config=self.vllm_config,
-                    device=self.device)  # type: ignore
+                    vllm_config=self.vllm_config, device=self.device
+                )  # type: ignore
             else:
-                raise ValueError("Unknown speculative decoding method: "
-                                 f"{self.speculative_config.method}")
+                raise ValueError(
+                    "Unknown speculative decoding method: "
+                    f"{self.speculative_config.method}"
+                )
             self.rejection_sampler = RejectionSampler()
 
         # Request states.
@@ -322,58 +366,64 @@ def __init__(
             block_sizes=[self.cache_config.block_size],
             is_spec_decode=bool(self.vllm_config.speculative_config),
             logitsprocs=build_logitsprocs(
-                self.vllm_config, self.device, self.pin_memory,
+                self.vllm_config,
+                self.device,
+                self.pin_memory,
                 self.is_pooling_model,
-                self.vllm_config.model_config.logits_processors),
+                self.vllm_config.model_config.logits_processors,
+            ),
             is_pooling_model=self.is_pooling_model,
         )
 
         self.use_async_scheduling = self.scheduler_config.async_scheduling
-        self.async_output_copy_stream = torch.cuda.Stream() if \
-            self.use_async_scheduling else None
+        self.async_output_copy_stream = (
+            torch.cuda.Stream() if self.use_async_scheduling else None
+        )
 
         # TODO(woosuk): Provide an option to tune the max cudagraph batch size.
         # The convention is different.
         # self.cudagraph_batch_sizes sorts in ascending order.
         # The batch sizes in the config are in descending order.
-        if self.compilation_config.cudagraph_capture_sizes and \
-                self.compilation_config.cudagraph_mode != CUDAGraphMode.NONE:
+        if (
+            self.compilation_config.cudagraph_capture_sizes
+            and self.compilation_config.cudagraph_mode != CUDAGraphMode.NONE
+        ):
             self.cudagraph_batch_sizes = list(
-                reversed(self.compilation_config.cudagraph_capture_sizes))
+                reversed(self.compilation_config.cudagraph_capture_sizes)
+            )
 
         # Cache the device properties.
         self._init_device_properties()
 
         # Persistent buffers for CUDA graphs.
-        self.input_ids = self._make_buffer(self.max_num_tokens,
-                                           dtype=torch.int32)
-        self.positions = self._make_buffer(self.max_num_tokens,
-                                           dtype=torch.int64)
-        self.query_start_loc = self._make_buffer(self.max_num_reqs + 1,
-                                                 dtype=torch.int32)
+        self.input_ids = self._make_buffer(self.max_num_tokens, dtype=torch.int32)
+        self.positions = self._make_buffer(self.max_num_tokens, dtype=torch.int64)
+        self.query_start_loc = self._make_buffer(
+            self.max_num_reqs + 1, dtype=torch.int32
+        )
         self.seq_lens = self._make_buffer(self.max_num_reqs, dtype=torch.int32)
         # Because inputs_embeds may be bfloat16 and we don't need a numpy
         # version of this tensor, avoid a RuntimeError by not creating a
         # numpy buffer.
-        self.inputs_embeds = self._make_buffer(self.max_num_tokens,
-                                               self.hidden_size,
-                                               dtype=self.dtype,
-                                               numpy=False)
-        self.is_token_ids = self._make_buffer(self.max_num_tokens,
-                                              dtype=torch.bool)
-        self.discard_request_indices = self._make_buffer(self.max_num_reqs,
-                                                         dtype=torch.int64)
+        self.inputs_embeds = self._make_buffer(
+            self.max_num_tokens, self.hidden_size, dtype=self.dtype, numpy=False
+        )
+        self.is_token_ids = self._make_buffer(self.max_num_tokens, dtype=torch.bool)
+        self.discard_request_indices = self._make_buffer(
+            self.max_num_reqs, dtype=torch.int64
+        )
         self.num_discarded_requests = 0
 
-        self.num_decode_draft_tokens = self._make_buffer(self.max_num_reqs,
-                                                         dtype=torch.int32)
-        self.num_accepted_tokens = self._make_buffer(self.max_num_reqs,
-                                                     dtype=torch.int64)
+        self.num_decode_draft_tokens = self._make_buffer(
+            self.max_num_reqs, dtype=torch.int32
+        )
+        self.num_accepted_tokens = self._make_buffer(
+            self.max_num_reqs, dtype=torch.int64
+        )
 
         # Only relevant for multimodal models
         if self.supports_mm_inputs:
-            self.is_mm_embed = self._make_buffer(self.max_num_tokens,
-                                                 dtype=torch.bool)
+            self.is_mm_embed = self._make_buffer(self.max_num_tokens, dtype=torch.bool)
 
         # Only relevant for models using M-RoPE (e.g, Qwen2-VL)
         if self.uses_mrope:
@@ -388,7 +438,8 @@ def __init__(
             # 1D-RoPE.
             # See page 5 of https://arxiv.org/abs/2409.12191
             self.mrope_positions = self._make_buffer(
-                (3, self.max_num_tokens + 1), dtype=torch.int64)
+                (3, self.max_num_tokens + 1), dtype=torch.int64
+            )
 
         # CUDA event to synchronize use of reused CPU tensors between steps
         # when async scheduling is enabled.
@@ -403,10 +454,10 @@ def __init__(
 
         # OPTIMIZATION: Cache the tensors rather than creating them every step.
         # Keep in int64 to avoid overflow with long context
-        self.arange_np = np.arange(max(self.max_num_reqs + 1,
-                                       self.max_model_len,
-                                       self.max_num_tokens),
-                                   dtype=np.int64)
+        self.arange_np = np.arange(
+            max(self.max_num_reqs + 1, self.max_model_len, self.max_num_tokens),
+            dtype=np.int64,
+        )
 
         # Layer pairings for cross-layer KV sharing.
         # If an Attention layer `layer_name` is in the keys of this dict, it
@@ -418,19 +469,27 @@ def __init__(
         self.kv_sharing_fast_prefill_logits_indices = None
         if self.cache_config.kv_sharing_fast_prefill:
             self.kv_sharing_fast_prefill_logits_indices = torch.zeros(
-                self.max_num_tokens, dtype=torch.int32, device=self.device)
+                self.max_num_tokens, dtype=torch.int32, device=self.device
+            )
 
-        self.uniform_decode_query_len = 1 if not self.speculative_config else \
-            1 + self.speculative_config.num_speculative_tokens
+        self.uniform_decode_query_len = (
+            1
+            if not self.speculative_config
+            else 1 + self.speculative_config.num_speculative_tokens
+        )
 
         # Cudagraph dispatcher for runtime cudagraph dispatching.
         self.cudagraph_dispatcher = CudagraphDispatcher(self.vllm_config)
 
-        self.mm_budget = MultiModalBudget(
-            self.model_config,
-            self.scheduler_config,
-            self.mm_registry,
-        ) if self.supports_mm_inputs else None
+        self.mm_budget = (
+            MultiModalBudget(
+                self.model_config,
+                self.scheduler_config,
+                self.mm_registry,
+            )
+            if self.supports_mm_inputs
+            else None
+        )
 
         self.reorder_batch_threshold: Optional[int] = None
 
@@ -440,14 +499,14 @@ def __init__(
         self.runner_only_attn_layers: set[str] = set()
 
         # Cached outputs.
-        self._draft_token_ids: Optional[Union[list[list[int]],
-                                              torch.Tensor]] = None
+        self._draft_token_ids: Optional[Union[list[list[int]], torch.Tensor]] = None
         self.transfer_event = torch.cuda.Event()
         self.sampled_token_ids_pinned_cpu = torch.empty(
             (self.max_model_len, 1),
             dtype=torch.int64,
             device="cpu",
-            pin_memory=self.pin_memory)
+            pin_memory=self.pin_memory,
+        )
 
     def _get_positions(self, num_tokens: Any):
         if isinstance(num_tokens, int):
@@ -459,15 +518,16 @@ def _get_positions(self, num_tokens: Any):
                 return self.mrope_positions.gpu[:, num_tokens]
             return self.positions.gpu[num_tokens]
 
-    def _make_buffer(self,
-                     *size: Union[int, torch.SymInt],
-                     dtype: torch.dtype,
-                     numpy: bool = True) -> CpuGpuBuffer:
-        return CpuGpuBuffer(*size,
-                            dtype=dtype,
-                            device=self.device,
-                            pin_memory=self.pin_memory,
-                            with_numpy=numpy)
+    def _make_buffer(
+        self, *size: Union[int, torch.SymInt], dtype: torch.dtype, numpy: bool = True
+    ) -> CpuGpuBuffer:
+        return CpuGpuBuffer(
+            *size,
+            dtype=dtype,
+            device=self.device,
+            pin_memory=self.pin_memory,
+            with_numpy=numpy,
+        )
 
     def _init_model_kwargs(self, num_tokens: int):
         model_kwargs = dict[str, Any]()
@@ -480,9 +540,11 @@ def _init_model_kwargs(self, num_tokens: int):
 
         token_type_id_requests = dict[int, Any]()
         for i, param in enumerate(pooling_params):
-            if param.extra_kwargs is not None and \
-            (token_types := param.extra_kwargs.get(
-                "compressed_token_type_ids")) is not None:
+            if (
+                param.extra_kwargs is not None
+                and (token_types := param.extra_kwargs.get("compressed_token_type_ids"))
+                is not None
+            ):
                 token_type_id_requests[i] = token_types
 
         if len(token_type_id_requests) == 0:
@@ -497,7 +559,8 @@ def _init_model_kwargs(self, num_tokens: int):
             token_type_ids.append(ids)
 
         model_kwargs["token_type_ids"] = torch.concat(token_type_ids).to(
-            device=self.device)
+            device=self.device
+        )
         return model_kwargs
 
     def _may_reorder_batch(self, scheduler_output: "SchedulerOutput") -> None:
@@ -523,17 +586,18 @@ def _may_reorder_batch(self, scheduler_output: "SchedulerOutput") -> None:
             #  required for DCP with q_len > 1, so we assert here. Remove this
             #  assert once the custom mask is support is added to FA3.
             if self.dcp_world_size > 1:
-                assert self.reorder_batch_threshold == 1, \
+                assert self.reorder_batch_threshold == 1, (
                     "DCP not support reorder_batch_threshold > 1 now."
+                )
             reorder_batch_to_split_decodes_and_prefills(
                 self.input_batch,
                 scheduler_output,
-                decode_threshold=self.reorder_batch_threshold)
+                decode_threshold=self.reorder_batch_threshold,
+            )
 
     # Note: used for model runner override.
     def _init_device_properties(self) -> None:
-        """Initialize attributes from torch.cuda.get_device_properties
-        """
+        """Initialize attributes from torch.cuda.get_device_properties"""
         self.device_properties = torch.cuda.get_device_properties(self.device)
         self.num_sms = self.device_properties.multi_processor_count
 
@@ -589,8 +653,10 @@ def _update_states(self, scheduler_output: "SchedulerOutput") -> None:
             sampling_params = new_req_data.sampling_params
             pooling_params = new_req_data.pooling_params
 
-            if sampling_params and \
-                sampling_params.sampling_type == SamplingType.RANDOM_SEED:
+            if (
+                sampling_params
+                and sampling_params.sampling_type == SamplingType.RANDOM_SEED
+            ):
                 generator = torch.Generator(device=self.device)
                 generator.manual_seed(sampling_params.seed)
             else:
@@ -647,14 +713,14 @@ def _update_states(self, scheduler_output: "SchedulerOutput") -> None:
                 new_token_ids = req_data.new_token_ids[i]
                 # Add the sampled token(s) from the previous step (if any).
                 # This doesn't include "unverified" tokens like spec tokens.
-                num_new_tokens = (num_computed_tokens + len(new_token_ids) -
-                                  req_state.num_tokens)
+                num_new_tokens = (
+                    num_computed_tokens + len(new_token_ids) - req_state.num_tokens
+                )
                 if num_new_tokens == 1:
                     # Avoid slicing list in most common case.
                     req_state.output_token_ids.append(new_token_ids[-1])
                 elif num_new_tokens > 0:
-                    req_state.output_token_ids.extend(
-                        new_token_ids[-num_new_tokens:])
+                    req_state.output_token_ids.extend(new_token_ids[-num_new_tokens:])
             elif num_output_tokens < len(req_state.output_token_ids):
                 # Some output tokens were discarded due to a sync-KV-load
                 # failure. Align the cached state.
@@ -662,21 +728,22 @@ def _update_states(self, scheduler_output: "SchedulerOutput") -> None:
 
                 req_index = self.input_batch.req_id_to_index.get(req_id)
                 if req_index is not None:
-                    old_end_idx = self.input_batch.num_tokens_no_spec[
-                        req_index]
-                    end_idx = self.input_batch.num_prompt_tokens[
-                        req_index] + num_output_tokens
+                    old_end_idx = self.input_batch.num_tokens_no_spec[req_index]
+                    end_idx = (
+                        self.input_batch.num_prompt_tokens[req_index]
+                        + num_output_tokens
+                    )
                     self.input_batch.num_tokens[req_index] = end_idx
                     self.input_batch.num_tokens_no_spec[req_index] = end_idx
-                    self.input_batch.is_token_ids[req_index,
-                                                  end_idx:old_end_idx] = False
+                    self.input_batch.is_token_ids[req_index, end_idx:old_end_idx] = (
+                        False
+                    )
 
             # Update the block IDs.
             if not resumed_from_preemption:
                 if new_block_ids is not None:
                     # Append the new blocks to the existing block IDs.
-                    for block_ids, new_ids in zip(req_state.block_ids,
-                                                  new_block_ids):
+                    for block_ids, new_ids in zip(req_state.block_ids, new_block_ids):
                         block_ids.extend(new_ids)
             else:
                 assert new_block_ids is not None
@@ -693,11 +760,9 @@ def _update_states(self, scheduler_output: "SchedulerOutput") -> None:
                 continue
 
             # Update the persistent batch.
-            self.input_batch.num_computed_tokens_cpu[req_index] = (
-                num_computed_tokens)
+            self.input_batch.num_computed_tokens_cpu[req_index] = num_computed_tokens
             if new_block_ids is not None:
-                self.input_batch.block_table.append_row(
-                    new_block_ids, req_index)
+                self.input_batch.block_table.append_row(new_block_ids, req_index)
 
             # For the last rank, we don't need to update the token_ids_cpu
             # because the sampled tokens are already cached.
@@ -706,21 +771,22 @@ def _update_states(self, scheduler_output: "SchedulerOutput") -> None:
                 start_token_index = num_computed_tokens
                 end_token_index = num_computed_tokens + len(new_token_ids)
                 self.input_batch.token_ids_cpu[
-                    req_index,
-                    start_token_index:end_token_index] = new_token_ids
-                self.input_batch.num_tokens_no_spec[
-                    req_index] = end_token_index
+                    req_index, start_token_index:end_token_index
+                ] = new_token_ids
+                self.input_batch.num_tokens_no_spec[req_index] = end_token_index
                 self.input_batch.num_tokens[req_index] = end_token_index
 
             # Add spec_token_ids to token_ids_cpu.
-            spec_token_ids = (
-                scheduler_output.scheduled_spec_decode_tokens.get(req_id, ()))
+            spec_token_ids = scheduler_output.scheduled_spec_decode_tokens.get(
+                req_id, ()
+            )
             if spec_token_ids:
                 num_spec_tokens = len(spec_token_ids)
                 start_index = self.input_batch.num_tokens_no_spec[req_index]
                 end_token_index = start_index + num_spec_tokens
                 self.input_batch.token_ids_cpu[
-                    req_index, start_index:end_token_index] = spec_token_ids
+                    req_index, start_index:end_token_index
+                ] = spec_token_ids
                 # NOTE(woosuk): `num_tokens` here may include spec tokens.
                 self.input_batch.num_tokens[req_index] += num_spec_tokens
 
@@ -737,7 +803,8 @@ def _update_states(self, scheduler_output: "SchedulerOutput") -> None:
         self.input_batch.refresh_metadata()
 
     def _update_states_after_model_execute(
-            self, output_token_ids: torch.Tensor) -> None:
+        self, output_token_ids: torch.Tensor
+    ) -> None:
         """Update the cached states after model execution.
 
         This is used for MTP/EAGLE for hybrid models, as in linear attention,
@@ -750,14 +817,26 @@ def _update_states_after_model_execute(
             return
 
         # Find the number of accepted tokens for each sequence.
-        num_accepted_tokens = (torch.cat(
-            [
-                output_token_ids,
-                torch.full((output_token_ids.size(0), 1),
-                           -1,
-                           device=output_token_ids.device),
-            ],
-            dim=1) == -1).int().argmax(-1).cpu().numpy()
+        num_accepted_tokens = (
+            (
+                torch.cat(
+                    [
+                        output_token_ids,
+                        torch.full(
+                            (output_token_ids.size(0), 1),
+                            -1,
+                            device=output_token_ids.device,
+                        ),
+                    ],
+                    dim=1,
+                )
+                == -1
+            )
+            .int()
+            .argmax(-1)
+            .cpu()
+            .numpy()
+        )
         for i, num_tokens in enumerate(num_accepted_tokens):
             self.input_batch.num_accepted_tokens_cpu[i] = num_tokens
 
@@ -784,7 +863,7 @@ def _init_mrope_positions(self, req_state: CachedRequestState):
                 use_audio_in_video = True
 
         if supports_mrope(self.model):
-            req_state.mrope_positions, req_state.mrope_position_delta = \
+            req_state.mrope_positions, req_state.mrope_position_delta = (
                 self.model.get_mrope_input_positions(
                     req_state.prompt_token_ids,
                     hf_config=self.model_config.hf_config,
@@ -794,8 +873,9 @@ def _init_mrope_positions(self, req_state: CachedRequestState):
                     audio_feature_lengths=audio_feature_lengths,
                     use_audio_in_video=use_audio_in_video,
                 )
+            )
         else:
-            req_state.mrope_positions, req_state.mrope_position_delta = \
+            req_state.mrope_positions, req_state.mrope_position_delta = (
                 MRotaryEmbedding.get_input_positions_tensor(
                     req_state.prompt_token_ids,
                     hf_config=self.model_config.hf_config,
@@ -805,6 +885,7 @@ def _init_mrope_positions(self, req_state: CachedRequestState):
                     audio_feature_lengths=audio_feature_lengths,
                     use_audio_in_video=use_audio_in_video,
                 )
+            )
 
     def _extract_mm_kwargs(
         self,
@@ -823,10 +904,10 @@ def _extract_mm_kwargs(
         model = cast(SupportsMultiModal, self.model)
         mm_kwargs_combined: BatchedTensorInputs = {}
         for _, _, mm_kwargs_group in group_mm_kwargs_by_modality(
-                mm_kwargs,
-                device=self.device,
-                pin_memory=self.pin_memory,
-                merge_by_field_config=model.merge_by_field_config,
+            mm_kwargs,
+            device=self.device,
+            pin_memory=self.pin_memory,
+            merge_by_field_config=model.merge_by_field_config,
         ):
             mm_kwargs_combined.update(mm_kwargs_group)
 
@@ -862,10 +943,11 @@ def _get_cumsum_and_arange(
 
         return cu_num_tokens, arange
 
-    def _prepare_input_ids(self, total_num_scheduled_tokens: int,
-                           cu_num_tokens: np.ndarray) -> None:
+    def _prepare_input_ids(
+        self, total_num_scheduled_tokens: int, cu_num_tokens: np.ndarray
+    ) -> None:
         """Prepare the input IDs for the current batch.
-        
+
         Carefully handles the `prev_sampled_token_ids` which can be cached
         from the previous engine iteration, in which case those tokens on the
         GPU need to be copied into the corresponding slots into input_ids."""
@@ -894,7 +976,7 @@ def _prepare_input_ids(self, total_num_scheduled_tokens: int,
                 # last token in each common request.
                 flattened_index = cu_num_tokens[cur_index].item() - 1
                 flattened_indices.append(flattened_index)
-                indices_match &= (prev_index == flattened_index)
+                indices_match &= prev_index == flattened_index
                 max_flattened_index = max(max_flattened_index, flattened_index)
         num_commmon_tokens = len(flattened_indices)
         if num_commmon_tokens < total_num_scheduled_tokens:
@@ -914,28 +996,27 @@ def _prepare_input_ids(self, total_num_scheduled_tokens: int,
             # The indices are both the same permutation of 0..N-1 so
             # we can copy directly using a single slice.
             self.input_ids.gpu[:num_commmon_tokens].copy_(
-                self.input_batch.prev_sampled_token_ids[:num_commmon_tokens,
-                                                        0],
-                non_blocking=True)
+                self.input_batch.prev_sampled_token_ids[:num_commmon_tokens, 0],
+                non_blocking=True,
+            )
             if self.enable_prompt_embeds:
                 self.is_token_ids.gpu[:num_commmon_tokens] = True
             return
         # Upload the index tensors asynchronously
         # so the scatter can be non-blocking.
-        input_ids_index_tensor = torch.tensor(flattened_indices,
-                                              dtype=torch.int64,
-                                              pin_memory=self.pin_memory).to(
-                                                  self.device,
-                                                  non_blocking=True)
+        input_ids_index_tensor = torch.tensor(
+            flattened_indices, dtype=torch.int64, pin_memory=self.pin_memory
+        ).to(self.device, non_blocking=True)
         prev_common_req_indices_tensor = torch.tensor(
-            prev_common_req_indices,
-            dtype=torch.int64,
-            pin_memory=self.pin_memory).to(self.device, non_blocking=True)
+            prev_common_req_indices, dtype=torch.int64, pin_memory=self.pin_memory
+        ).to(self.device, non_blocking=True)
         self.input_ids.gpu.scatter_(
             dim=0,
             index=input_ids_index_tensor,
             src=self.input_batch.prev_sampled_token_ids[
-                prev_common_req_indices_tensor, 0])
+                prev_common_req_indices_tensor, 0
+            ],
+        )
 
     def _get_encoder_seq_lens(
         self,
@@ -957,10 +1038,17 @@ def _get_encoder_seq_lens(
 
     def _prepare_inputs(
         self, scheduler_output: "SchedulerOutput"
-    ) -> tuple[PerLayerAttnMetadata, torch.Tensor,
-               Optional[SpecDecodeMetadata], np.ndarray,
-               Optional[CommonAttentionMetadata], int, Optional[UBatchSlices],
-               Optional[torch.Tensor], bool]:
+    ) -> tuple[
+        PerLayerAttnMetadata,
+        torch.Tensor,
+        Optional[SpecDecodeMetadata],
+        np.ndarray,
+        Optional[CommonAttentionMetadata],
+        int,
+        Optional[UBatchSlices],
+        Optional[torch.Tensor],
+        bool,
+    ]:
         """
         :return: tuple[
             attn_metadata: layer-to-attention_metadata mapping,
@@ -986,19 +1074,19 @@ def _prepare_inputs(
 
         # Get request indices.
         # E.g., [2, 5, 3] -> [0, 0, 1, 1, 1, 1, 1, 2, 2, 2]
-        req_indices = np.repeat(self.arange_np[:num_reqs],
-                                num_scheduled_tokens)
+        req_indices = np.repeat(self.arange_np[:num_reqs], num_scheduled_tokens)
 
         # cu_num_tokens: [2, 5, 3] -> [2, 7, 10]
         # arange: [0, 1, 0, 1, 2, 3, 4, 0, 1, 2]
-        cu_num_tokens, arange = self._get_cumsum_and_arange(
-            num_scheduled_tokens)
+        cu_num_tokens, arange = self._get_cumsum_and_arange(num_scheduled_tokens)
 
         # Get positions.
         positions_np = self.positions.np[:total_num_scheduled_tokens]
-        np.add(self.input_batch.num_computed_tokens_cpu[req_indices],
-               arange,
-               out=positions_np)
+        np.add(
+            self.input_batch.num_computed_tokens_cpu[req_indices],
+            arange,
+            out=positions_np,
+        )
 
         # Calculate M-RoPE positions.
         # Only relevant for models using M-RoPE (e.g, Qwen2-VL)
@@ -1009,24 +1097,28 @@ def _prepare_inputs(
         # E.g., [0, 1, 0, 1, 2, 3, 4, 0, 1, 2]
         # -> [0, 1, M, M + 1, M + 2, M + 3, M + 4, 2 * M, 2 * M + 1, 2 * M + 2]
         # where M is the max_model_len.
-        token_indices = (positions_np +
-                         req_indices * self.input_batch.token_ids_cpu.shape[1])
+        token_indices = (
+            positions_np + req_indices * self.input_batch.token_ids_cpu.shape[1]
+        )
         token_indices_tensor = torch.from_numpy(token_indices)
 
         # NOTE(woosuk): We use torch.index_select instead of np.take here
         # because torch.index_select is much faster than np.take for large
         # tensors.
-        torch.index_select(self.input_batch.token_ids_cpu_tensor.flatten(),
-                           0,
-                           token_indices_tensor,
-                           out=self.input_ids.cpu[:total_num_scheduled_tokens])
+        torch.index_select(
+            self.input_batch.token_ids_cpu_tensor.flatten(),
+            0,
+            token_indices_tensor,
+            out=self.input_ids.cpu[:total_num_scheduled_tokens],
+        )
         if self.enable_prompt_embeds:
             is_token_ids = self.input_batch.is_token_ids.flatten()
             torch.index_select(
                 is_token_ids,
                 0,
                 token_indices_tensor,
-                out=self.is_token_ids.cpu[:total_num_scheduled_tokens])
+                out=self.is_token_ids.cpu[:total_num_scheduled_tokens],
+            )
 
         # Because we did not pre-allocate a massive prompt_embeds CPU tensor on
         # the InputBatch, we need to fill in the prompt embeds into the expected
@@ -1060,52 +1152,49 @@ def _prepare_inputs(
                 actual_num_sched = actual_end - start_pos
 
                 if actual_num_sched > 0:
-                    self.inputs_embeds.cpu[output_idx:output_idx +
-                                           actual_num_sched].copy_(
-                                               req_embeds[start_pos:actual_end]
-                                           )
+                    self.inputs_embeds.cpu[
+                        output_idx : output_idx + actual_num_sched
+                    ].copy_(req_embeds[start_pos:actual_end])
 
                 output_idx += num_sched
 
-        self.input_batch.block_table.compute_slot_mapping(
-            req_indices, positions_np)
-        self.input_batch.block_table.commit_slot_mapping(
-            total_num_scheduled_tokens)
+        self.input_batch.block_table.compute_slot_mapping(req_indices, positions_np)
+        self.input_batch.block_table.commit_slot_mapping(total_num_scheduled_tokens)
 
         # Prepare the attention metadata.
         self.query_start_loc.np[0] = 0
-        self.query_start_loc.np[1:num_reqs + 1] = cu_num_tokens
+        self.query_start_loc.np[1 : num_reqs + 1] = cu_num_tokens
         # Note: pad query_start_loc to be non-decreasing, as kernels
         # like FlashAttention requires that
-        self.query_start_loc.np[num_reqs + 1:].fill(cu_num_tokens[-1])
+        self.query_start_loc.np[num_reqs + 1 :].fill(cu_num_tokens[-1])
         self.query_start_loc.copy_to_gpu()
-        query_start_loc = self.query_start_loc.gpu[:num_reqs + 1]
+        query_start_loc = self.query_start_loc.gpu[: num_reqs + 1]
 
         num_tokens_unpadded = scheduler_output.total_num_scheduled_tokens
         num_tokens_padded = num_tokens_unpadded + self.get_local_padding(
-            num_tokens_unpadded)
-        uniform_decode = \
-            (max_num_scheduled_tokens == self.uniform_decode_query_len) and \
-            (total_num_scheduled_tokens == num_reqs * max_num_scheduled_tokens)
-        ubatch_slices, num_tokens_after_padding = \
-            ubatch_split(num_scheduled_tokens,
-                         num_tokens_unpadded,
-                         num_tokens_padded,
-                         uniform_decode=uniform_decode,
-                         vllm_config=self.vllm_config)
+            num_tokens_unpadded
+        )
+        uniform_decode = (
+            max_num_scheduled_tokens == self.uniform_decode_query_len
+        ) and (total_num_scheduled_tokens == num_reqs * max_num_scheduled_tokens)
+        ubatch_slices, num_tokens_after_padding = ubatch_split(
+            num_scheduled_tokens,
+            num_tokens_unpadded,
+            num_tokens_padded,
+            uniform_decode=uniform_decode,
+            vllm_config=self.vllm_config,
+        )
 
         self.seq_lens.np[:num_reqs] = (
-            self.input_batch.num_computed_tokens_cpu[:num_reqs] +
-            num_scheduled_tokens)
+            self.input_batch.num_computed_tokens_cpu[:num_reqs] + num_scheduled_tokens
+        )
         # Fill unused with 0 for full cuda graph mode.
         self.seq_lens.np[num_reqs:].fill(0)
         self.seq_lens.copy_to_gpu()
         seq_lens = self.seq_lens.gpu[:num_reqs]
         max_seq_len = self.seq_lens.np[:num_reqs].max().item()
 
-        num_tokens = [
-            self.requests[r].num_tokens for r in self.input_batch.req_ids
-        ]
+        num_tokens = [self.requests[r].num_tokens for r in self.input_batch.req_ids]
         num_tokens_np = np.array(num_tokens, dtype=np.int32)
 
         # Record the index of requests that should not be sampled,
@@ -1113,8 +1202,9 @@ def _prepare_inputs(
         discard_requests_mask = self.seq_lens.np[:num_reqs] < num_tokens_np
         discard_request_indices = np.nonzero(discard_requests_mask)[0]
         self.num_discarded_requests = len(discard_request_indices)
-        self.discard_request_indices.np[:self.num_discarded_requests] = (
-            discard_request_indices)
+        self.discard_request_indices.np[: self.num_discarded_requests] = (
+            discard_request_indices
+        )
 
         self.discard_request_indices.copy_to_gpu(self.num_discarded_requests)
 
@@ -1125,13 +1215,13 @@ def _prepare_inputs(
             # Only relevant for models using M-RoPE (e.g, Qwen2-VL)
             self.mrope_positions.gpu[:, :total_num_scheduled_tokens].copy_(
                 self.mrope_positions.cpu[:, :total_num_scheduled_tokens],
-                non_blocking=True)
+                non_blocking=True,
+            )
         else:
             # Common case (1D positions)
             self.positions.copy_to_gpu(total_num_scheduled_tokens)
 
-        use_spec_decode = len(
-            scheduler_output.scheduled_spec_decode_tokens) > 0
+        use_spec_decode = len(scheduler_output.scheduled_spec_decode_tokens) > 0
         if not use_spec_decode:
             # NOTE(woosuk): Due to chunked prefills, the batch may contain
             # partial requests. While we should not sample any token
@@ -1149,27 +1239,35 @@ def _prepare_inputs(
             # For chunked prefills, use -1 as mask rather than 0, as guided
             # decoding may rollback speculative tokens.
             num_decode_draft_tokens = np.full(num_reqs, -1, dtype=np.int32)
-            for req_id, draft_token_ids in (
-                    scheduler_output.scheduled_spec_decode_tokens.items()):
+            for (
+                req_id,
+                draft_token_ids,
+            ) in scheduler_output.scheduled_spec_decode_tokens.items():
                 req_idx = self.input_batch.req_id_to_index[req_id]
                 num_draft_tokens[req_idx] = len(draft_token_ids)
-                num_decode_draft_tokens[req_idx] = (len(draft_token_ids) if (
-                    self.input_batch.num_computed_tokens_cpu[req_idx]
-                    >= self.input_batch.num_prompt_tokens[req_idx]) else -1)
+                num_decode_draft_tokens[req_idx] = (
+                    len(draft_token_ids)
+                    if (
+                        self.input_batch.num_computed_tokens_cpu[req_idx]
+                        >= self.input_batch.num_prompt_tokens[req_idx]
+                    )
+                    else -1
+                )
             spec_decode_metadata = self._calc_spec_decode_metadata(
-                num_draft_tokens, cu_num_tokens)
+                num_draft_tokens, cu_num_tokens
+            )
             logits_indices = spec_decode_metadata.logits_indices
 
             # For DECODE only cuda graph of some attention backends (e.g., GDN).
-            self.num_decode_draft_tokens.np[:
-                                            num_reqs] = num_decode_draft_tokens
+            self.num_decode_draft_tokens.np[:num_reqs] = num_decode_draft_tokens
             self.num_decode_draft_tokens.np[num_reqs:].fill(-1)
             self.num_decode_draft_tokens.copy_to_gpu()
 
         logits_indices_padded = None
         if self.cache_config.kv_sharing_fast_prefill:
             logits_indices_padded = self._prepare_kv_sharing_fast_prefill(
-                logits_indices)
+                logits_indices
+            )
 
         attn_metadata: PerLayerAttnMetadata = {}
         if ubatch_slices is not None:
@@ -1177,26 +1275,29 @@ def _prepare_inputs(
         use_cascade_attn = False
 
         # Used in the below loop.
-        query_start_loc_cpu = self.query_start_loc.cpu[:num_reqs + 1]
+        query_start_loc_cpu = self.query_start_loc.cpu[: num_reqs + 1]
         seq_lens_cpu = self.seq_lens.cpu[:num_reqs]
-        num_computed_tokens_cpu = (
-            self.input_batch.num_computed_tokens_cpu_tensor[:num_reqs])
+        num_computed_tokens_cpu = self.input_batch.num_computed_tokens_cpu_tensor[
+            :num_reqs
+        ]
         spec_decode_common_attn_metadata = None
         if use_spec_decode:
             self.num_accepted_tokens.np[:num_reqs] = (
-                self.input_batch.num_accepted_tokens_cpu[:num_reqs])
+                self.input_batch.num_accepted_tokens_cpu[:num_reqs]
+            )
             self.num_accepted_tokens.np[num_reqs:].fill(1)
             self.num_accepted_tokens.copy_to_gpu()
 
         # Prepare the attention metadata for each KV cache group and make layers
         # in the same group share the same metadata.
         for kv_cache_group_id, kv_cache_group_spec in enumerate(
-                self.kv_cache_config.kv_cache_groups):
+            self.kv_cache_config.kv_cache_groups
+        ):
             encoder_seq_lens = self._get_encoder_seq_lens(
-                scheduler_output, kv_cache_group_spec.kv_cache_spec, num_reqs)
+                scheduler_output, kv_cache_group_spec.kv_cache_spec, num_reqs
+            )
 
-            if isinstance(kv_cache_group_spec.kv_cache_spec,
-                          EncoderOnlyAttentionSpec):
+            if isinstance(kv_cache_group_spec.kv_cache_spec, EncoderOnlyAttentionSpec):
                 # Encoder-only layers do not have KV cache, so we need to
                 # create a dummy block table and slot mapping for them.
                 blk_table_tensor = torch.zeros(
@@ -1205,7 +1306,7 @@ def _prepare_inputs(
                     device=self.device,
                 )
                 slot_mapping = torch.zeros(
-                    (total_num_scheduled_tokens, ),
+                    (total_num_scheduled_tokens,),
                     dtype=torch.int64,
                     device=self.device,
                 )
@@ -1213,16 +1314,14 @@ def _prepare_inputs(
             else:
                 blk_table = self.input_batch.block_table[kv_cache_group_id]
                 blk_table_tensor = blk_table.get_device_tensor(num_reqs)
-                slot_mapping = blk_table.slot_mapping.gpu[:
-                                                          total_num_scheduled_tokens]
+                slot_mapping = blk_table.slot_mapping.gpu[:total_num_scheduled_tokens]
 
                 # Fill unused with -1. Needed for reshape_and_cache in full cuda
                 # graph mode.
-                blk_table.slot_mapping.gpu[total_num_scheduled_tokens:].fill_(
-                    -1)
-                num_common_prefix_blocks = (
-                    scheduler_output.
-                    num_common_prefix_blocks[kv_cache_group_id])
+                blk_table.slot_mapping.gpu[total_num_scheduled_tokens:].fill_(-1)
+                num_common_prefix_blocks = scheduler_output.num_common_prefix_blocks[
+                    kv_cache_group_id
+                ]
 
             common_attn_metadata = CommonAttentionMetadata(
                 query_start_loc=query_start_loc,
@@ -1242,11 +1341,12 @@ def _prepare_inputs(
                 encoder_seq_lens=encoder_seq_lens,
             )
 
-            if (self.speculative_config
-                    and spec_decode_common_attn_metadata is None):
+            if self.speculative_config and spec_decode_common_attn_metadata is None:
                 if isinstance(self.drafter, EagleProposer):
-                    if (self.drafter.attn_layer_names[0]
-                            in kv_cache_group_spec.layer_names):
+                    if (
+                        self.drafter.attn_layer_names[0]
+                        in kv_cache_group_spec.layer_names
+                    ):
                         spec_decode_common_attn_metadata = common_attn_metadata
                 else:
                     spec_decode_common_attn_metadata = common_attn_metadata
@@ -1264,24 +1364,27 @@ def _prepare_inputs(
                     )
 
                 extra_attn_metadata_args = {}
-                if use_spec_decode and isinstance(builder,
-                                                  GDNAttentionMetadataBuilder):
+                if use_spec_decode and isinstance(builder, GDNAttentionMetadataBuilder):
                     extra_attn_metadata_args = dict(
-                        num_accepted_tokens=self.num_accepted_tokens.
-                        gpu[:num_reqs],
-                        num_decode_draft_tokens_cpu=self.
-                        num_decode_draft_tokens.cpu[:num_reqs],
+                        num_accepted_tokens=self.num_accepted_tokens.gpu[:num_reqs],
+                        num_decode_draft_tokens_cpu=self.num_decode_draft_tokens.cpu[
+                            :num_reqs
+                        ],
                     )
 
                 if ubatch_slices is not None:
                     common_attn_metadata_list = split_attn_metadata(
-                        ubatch_slices, common_attn_metadata)
+                        ubatch_slices, common_attn_metadata
+                    )
                     for ubid, common_attn_metadata in enumerate(
-                            common_attn_metadata_list):
-                        attn_metadata_i = (attn_group.get_metadata_builder(
-                            ubatch_id=ubid).build(
-                                common_prefix_len=common_prefix_len,
-                                common_attn_metadata=common_attn_metadata))
+                        common_attn_metadata_list
+                    ):
+                        attn_metadata_i = attn_group.get_metadata_builder(
+                            ubatch_id=ubid
+                        ).build(
+                            common_prefix_len=common_prefix_len,
+                            common_attn_metadata=common_attn_metadata,
+                        )
                         for layer_name in kv_cache_group_spec.layer_names:
                             assert type(attn_metadata) is list
                             attn_metadata[ubid][layer_name] = attn_metadata_i
@@ -1290,9 +1393,9 @@ def _prepare_inputs(
                     attn_metadata_i = builder.build(
                         common_prefix_len=common_prefix_len,
                         common_attn_metadata=common_attn_metadata,
-                        **extra_attn_metadata_args)
-                    use_cascade_attn |= getattr(attn_metadata_i, "use_cascade",
-                                                False)
+                        **extra_attn_metadata_args,
+                    )
+                    use_cascade_attn |= getattr(attn_metadata_i, "use_cascade", False)
                     for layer_name in attn_group.layer_names:
                         attn_metadata[layer_name] = attn_metadata_i
 
@@ -1304,10 +1407,17 @@ def _prepare_inputs(
         if self.lora_config:
             self.set_active_loras(self.input_batch, num_scheduled_tokens)
 
-        return (attn_metadata, logits_indices, spec_decode_metadata,
-                num_scheduled_tokens, spec_decode_common_attn_metadata,
-                max_num_scheduled_tokens, ubatch_slices,
-                num_tokens_after_padding, use_cascade_attn)
+        return (
+            attn_metadata,
+            logits_indices,
+            spec_decode_metadata,
+            num_scheduled_tokens,
+            spec_decode_common_attn_metadata,
+            max_num_scheduled_tokens,
+            ubatch_slices,
+            num_tokens_after_padding,
+            use_cascade_attn,
+        )
 
     def _compute_cascade_attn_prefix_len(
         self,
@@ -1379,18 +1489,20 @@ def _compute_cascade_attn_prefix_len(
         # this case.
         num_reqs = len(num_scheduled_tokens)
         common_prefix_len = min(
-            common_prefix_len,
-            self.input_batch.num_computed_tokens_cpu[:num_reqs].min())
+            common_prefix_len, self.input_batch.num_computed_tokens_cpu[:num_reqs].min()
+        )
         # common_prefix_len should be a multiple of the block size.
-        common_prefix_len = (common_prefix_len // kv_cache_spec.block_size *
-                             kv_cache_spec.block_size)
-        use_sliding_window = (isinstance(kv_cache_spec, SlidingWindowSpec) or
-                              (isinstance(kv_cache_spec, FullAttentionSpec)
-                               and kv_cache_spec.sliding_window is not None))
-        use_local_attention = (
-            isinstance(kv_cache_spec, ChunkedLocalAttentionSpec)
-            or (isinstance(kv_cache_spec, FullAttentionSpec)
-                and kv_cache_spec.attention_chunk_size is not None))
+        common_prefix_len = (
+            common_prefix_len // kv_cache_spec.block_size * kv_cache_spec.block_size
+        )
+        use_sliding_window = isinstance(kv_cache_spec, SlidingWindowSpec) or (
+            isinstance(kv_cache_spec, FullAttentionSpec)
+            and kv_cache_spec.sliding_window is not None
+        )
+        use_local_attention = isinstance(kv_cache_spec, ChunkedLocalAttentionSpec) or (
+            isinstance(kv_cache_spec, FullAttentionSpec)
+            and kv_cache_spec.attention_chunk_size is not None
+        )
         assert isinstance(kv_cache_spec, AttentionSpec)
         use_cascade = attn_metadata_builder.use_cascade_attention(
             common_prefix_len=common_prefix_len,
@@ -1410,18 +1522,15 @@ def _calc_mrope_positions(self, scheduler_output: "SchedulerOutput"):
             req = self.requests[req_id]
             assert req.mrope_positions is not None
 
-            num_computed_tokens = \
-                self.input_batch.num_computed_tokens_cpu[index]
-            num_scheduled_tokens = \
-                scheduler_output.num_scheduled_tokens[req_id]
+            num_computed_tokens = self.input_batch.num_computed_tokens_cpu[index]
+            num_scheduled_tokens = scheduler_output.num_scheduled_tokens[req_id]
             num_prompt_tokens = length_from_prompt_token_ids_or_embeds(
-                req.prompt_token_ids, req.prompt_embeds)
+                req.prompt_token_ids, req.prompt_embeds
+            )
 
             if num_computed_tokens + num_scheduled_tokens > num_prompt_tokens:
-                prompt_part_len = max(0,
-                                      num_prompt_tokens - num_computed_tokens)
-                completion_part_len = max(
-                    0, num_scheduled_tokens - prompt_part_len)
+                prompt_part_len = max(0, num_prompt_tokens - num_computed_tokens)
+                completion_part_len = max(0, num_scheduled_tokens - prompt_part_len)
             else:
                 prompt_part_len = num_scheduled_tokens
                 completion_part_len = 0
@@ -1435,8 +1544,9 @@ def _calc_mrope_positions(self, scheduler_output: "SchedulerOutput"):
                 src_start = num_computed_tokens
                 src_end = num_computed_tokens + prompt_part_len
 
-                self.mrope_positions.cpu[:, dst_start:dst_end] = (
-                    req.mrope_positions[:, src_start:src_end])
+                self.mrope_positions.cpu[:, dst_start:dst_end] = req.mrope_positions[
+                    :, src_start:src_end
+                ]
                 mrope_pos_ptr += prompt_part_len
 
             if completion_part_len > 0:
@@ -1476,10 +1586,12 @@ def _calc_spec_decode_metadata(
         # Step 1. cu_num_sampled_tokens: [4, 5, 8, 9, 11]
         # arange: [0, 1, 2, 3, 0, 0, 1, 2, 0, 0, 1]
         cu_num_sampled_tokens, arange = self._get_cumsum_and_arange(
-            num_sampled_tokens, cumsum_dtype=np.int32)
+            num_sampled_tokens, cumsum_dtype=np.int32
+        )
         # Step 2. [0, 0, 0, 0, 103, 104, 104, 104, 206, 207, 207]
         logits_indices = np.repeat(
-            cu_num_scheduled_tokens - num_sampled_tokens, num_sampled_tokens)
+            cu_num_scheduled_tokens - num_sampled_tokens, num_sampled_tokens
+        )
         # Step 3. [0, 1, 2, 3, 103, 104, 105, 106, 206, 207, 208]
         logits_indices += arange
 
@@ -1490,22 +1602,28 @@ def _calc_spec_decode_metadata(
         # cu_num_draft_tokens: [3, 3, 5, 5, 6]
         # arange: [0, 1, 2, 0, 1, 0]
         cu_num_draft_tokens, arange = self._get_cumsum_and_arange(
-            num_draft_tokens, cumsum_dtype=np.int32)
+            num_draft_tokens, cumsum_dtype=np.int32
+        )
         # [0, 0, 0, 5, 5, 9]
         target_logits_indices = np.repeat(
-            cu_num_sampled_tokens - num_sampled_tokens, num_draft_tokens)
+            cu_num_sampled_tokens - num_sampled_tokens, num_draft_tokens
+        )
         # [0, 1, 2, 5, 6, 9]
         target_logits_indices += arange
 
         # TODO: Optimize the CPU -> GPU copy.
         cu_num_draft_tokens = torch.from_numpy(cu_num_draft_tokens).to(
-            self.device, non_blocking=True)
-        logits_indices = torch.from_numpy(logits_indices).to(self.device,
-                                                             non_blocking=True)
+            self.device, non_blocking=True
+        )
+        logits_indices = torch.from_numpy(logits_indices).to(
+            self.device, non_blocking=True
+        )
         target_logits_indices = torch.from_numpy(target_logits_indices).to(
-            self.device, non_blocking=True)
+            self.device, non_blocking=True
+        )
         bonus_logits_indices = torch.from_numpy(bonus_logits_indices).to(
-            self.device, non_blocking=True)
+            self.device, non_blocking=True
+        )
 
         # Compute the draft token ids.
         # draft_token_indices:      [  1,   2,   3, 105, 106, 208]
@@ -1529,23 +1647,26 @@ def _prepare_kv_sharing_fast_prefill(
         assert self.kv_sharing_fast_prefill_logits_indices is not None
         num_logits = logits_indices.shape[0]
         assert num_logits > 0
-        self.kv_sharing_fast_prefill_logits_indices[:num_logits].copy_(
-            logits_indices)
+        self.kv_sharing_fast_prefill_logits_indices[:num_logits].copy_(logits_indices)
         # There might have leftover indices in logits_indices[num_logits:]
         # from previous iterations, whose values may be greater than the
         # batch size in the current iteration. To ensure indices are always
         # valid, we fill the padded indices with the last index.
         self.kv_sharing_fast_prefill_logits_indices[num_logits:].fill_(
-            logits_indices[-1].item())
-        if (self.compilation_config.cudagraph_mode != CUDAGraphMode.NONE
-                and num_logits <= self.cudagraph_batch_sizes[-1]):
+            logits_indices[-1].item()
+        )
+        if (
+            self.compilation_config.cudagraph_mode != CUDAGraphMode.NONE
+            and num_logits <= self.cudagraph_batch_sizes[-1]
+        ):
             # Use piecewise CUDA graphs.
             # Add padding to the batch size.
             num_logits_padded = self.vllm_config.pad_for_cudagraph(num_logits)
         else:
             num_logits_padded = num_logits
-        logits_indices_padded = (
-            self.kv_sharing_fast_prefill_logits_indices[:num_logits_padded])
+        logits_indices_padded = self.kv_sharing_fast_prefill_logits_indices[
+            :num_logits_padded
+        ]
         return logits_indices_padded
 
     def _batch_mm_kwargs_from_scheduler(
@@ -1584,7 +1705,8 @@ def _batch_mm_kwargs_from_scheduler(
     def _execute_mm_encoder(self, scheduler_output: "SchedulerOutput"):
         # Batch the multi-modal inputs using the helper method.
         mm_kwargs, mm_hashes_pos = self._batch_mm_kwargs_from_scheduler(
-            scheduler_output)
+            scheduler_output
+        )
 
         if not mm_kwargs:
             return
@@ -1599,10 +1721,10 @@ def _execute_mm_encoder(self, scheduler_output: "SchedulerOutput"):
         model = cast(SupportsMultiModal, self.model)
         encoder_outputs = []
         for modality, num_items, mm_kwargs_group in group_mm_kwargs_by_modality(
-                mm_kwargs,
-                device=self.device,
-                pin_memory=self.pin_memory,
-                merge_by_field_config=model.merge_by_field_config,
+            mm_kwargs,
+            device=self.device,
+            pin_memory=self.pin_memory,
+            merge_by_field_config=model.merge_by_field_config,
         ):
             # (ekhvedchenia): Temporary hack to limit peak memory usage when
             # processing multimodal data.This solves the issue with scheduler
@@ -1616,11 +1738,13 @@ def _execute_mm_encoder(self, scheduler_output: "SchedulerOutput"):
                 micro_batch_size = 1
                 for i in range(0, num_items, micro_batch_size):
                     micro_batch_mm_inputs = dict(
-                        (k, v[i:i + micro_batch_size])
-                        for k, v in mm_kwargs_group.items())
+                        (k, v[i : i + micro_batch_size])
+                        for k, v in mm_kwargs_group.items()
+                    )
 
                     micro_batch_outputs = model.get_multimodal_embeddings(
-                        **micro_batch_mm_inputs)
+                        **micro_batch_mm_inputs
+                    )
 
                     curr_group_outputs.extend(micro_batch_outputs)
             else:
@@ -1631,8 +1755,7 @@ def _execute_mm_encoder(self, scheduler_output: "SchedulerOutput"):
                 # 2. A list or tuple (length: num_items) of tensors,
                 # each of shape (feature_size, hidden_size) in case the feature
                 # size is dynamic depending on the input multimodal items.
-                curr_group_outputs = model.get_multimodal_embeddings(
-                    **mm_kwargs_group)
+                curr_group_outputs = model.get_multimodal_embeddings(**mm_kwargs_group)
 
             sanity_check_mm_encoder_outputs(
                 curr_group_outputs,
@@ -1664,11 +1787,9 @@ def _gather_mm_embeddings(
         for req_id in self.input_batch.req_ids:
             mm_embeds_req: list[torch.Tensor] = []
 
-            num_scheduled_tokens = scheduler_output.num_scheduled_tokens[
-                req_id]
+            num_scheduled_tokens = scheduler_output.num_scheduled_tokens[req_id]
             req_state = self.requests[req_id]
-            num_computed_tokens = \
-                req_state.num_computed_tokens + shift_computed_tokens
+            num_computed_tokens = req_state.num_computed_tokens + shift_computed_tokens
 
             for mm_feature in req_state.mm_features:
                 pos_info = mm_feature.mm_position
@@ -1696,15 +1817,15 @@ def _gather_mm_embeddings(
 
                 mm_hash = mm_feature.identifier
                 encoder_output = self.encoder_cache.get(mm_hash, None)
-                assert encoder_output is not None,\
-                    f"Encoder cache miss for {mm_hash}."
+                assert encoder_output is not None, f"Encoder cache miss for {mm_hash}."
 
                 if (is_embed := pos_info.is_embed) is not None:
                     is_embed = is_embed[start_idx:end_idx]
 
                 req_start_pos = req_start_idx + start_pos - num_computed_tokens
-                is_mm_embed[req_start_pos+start_idx:req_start_pos + end_idx] \
-                    = True if is_embed is None else is_embed
+                is_mm_embed[req_start_pos + start_idx : req_start_pos + end_idx] = (
+                    True if is_embed is None else is_embed
+                )
 
                 mm_embeds_item = gather_mm_placeholders(
                     encoder_output[start_idx:end_idx],
@@ -1721,7 +1842,8 @@ def _gather_mm_embeddings(
                         multimodal_embeddings=mm_embeds_req,
                         mrope_positions=req_state.mrope_positions,
                         num_computed_tokens=req_state.num_computed_tokens,
-                    ))
+                    )
+                )
                 req_state.mrope_positions.copy_(new_mrope_positions)
                 req_state.mrope_position_delta = new_delta
 
@@ -1755,10 +1877,10 @@ def _extract_encoder_inputs(
         model = cast(SupportsMultiModal, self.model)
         encoder_features = {}
         for _, _, mm_kwargs_group in group_mm_kwargs_by_modality(
-                mm_kwargs,
-                device=self.device,
-                pin_memory=self.pin_memory,
-                merge_by_field_config=model.merge_by_field_config,
+            mm_kwargs,
+            device=self.device,
+            pin_memory=self.pin_memory,
+            merge_by_field_config=model.merge_by_field_config,
         ):
             # Add the grouped features to encoder_features dict
             # This allows the model to receive them as kwargs (e.g.,
@@ -1795,21 +1917,24 @@ def get_supported_pooling_tasks(self) -> list[PoolingTask]:
 
         supported_tasks = list(model.pooler.get_supported_tasks())
 
-        if (self.scheduler_config.chunked_prefill_enabled
-                and "encode" in supported_tasks):
+        if (
+            self.scheduler_config.chunked_prefill_enabled
+            and "encode" in supported_tasks
+        ):
             supported_tasks.remove("encode")
 
-            logger.debug_once("Chunked prefill is not supported with "
-                              "encode task which using ALL pooling. "
-                              "Please turn off chunked prefill by "
-                              "`--no-enable-chunked-prefill` before using it.")
+            logger.debug_once(
+                "Chunked prefill is not supported with "
+                "encode task which using ALL pooling. "
+                "Please turn off chunked prefill by "
+                "`--no-enable-chunked-prefill` before using it."
+            )
 
         if "score" in supported_tasks:
             num_labels = getattr(self.model_config.hf_config, "num_labels", 0)
             if num_labels != 1:
                 supported_tasks.remove("score")
-                logger.debug_once(
-                    "Score API is only enabled for num_labels == 1.")
+                logger.debug_once("Score API is only enabled for num_labels == 1.")
 
         return supported_tasks
 
@@ -1824,9 +1949,11 @@ def get_supported_tasks(self) -> tuple[SupportedTask, ...]:
         return tuple(tasks)
 
     def sync_and_slice_intermediate_tensors(
-            self, num_tokens: int, intermediate_tensors: IntermediateTensors,
-            sync_self: bool) -> IntermediateTensors:
-
+        self,
+        num_tokens: int,
+        intermediate_tensors: IntermediateTensors,
+        sync_self: bool,
+    ) -> IntermediateTensors:
         assert self.intermediate_tensors is not None
 
         tp = self.vllm_config.parallel_config.tensor_parallel_size
@@ -1838,21 +1965,21 @@ def sync_and_slice_intermediate_tensors(
             assert intermediate_tensors is not None
             for k, v in intermediate_tensors.items():
                 is_scattered = k == "residual" and is_rs
-                copy_len = num_tokens // tp if is_scattered else \
-                    num_tokens
+                copy_len = num_tokens // tp if is_scattered else num_tokens
                 self.intermediate_tensors[k][:copy_len].copy_(
-                    v[:copy_len], non_blocking=True)
-
-        return IntermediateTensors({
-            k:
-            v[:num_tokens //
-              tp] if k == "residual" and is_rs else v[:num_tokens]
-            for k, v in self.intermediate_tensors.items()
-        })
-
-    def eplb_step(self,
-                  is_dummy: bool = False,
-                  is_profile: bool = False) -> None:
+                    v[:copy_len], non_blocking=True
+                )
+
+        return IntermediateTensors(
+            {
+                k: v[: num_tokens // tp]
+                if k == "residual" and is_rs
+                else v[:num_tokens]
+                for k, v in self.intermediate_tensors.items()
+            }
+        )
+
+    def eplb_step(self, is_dummy: bool = False, is_profile: bool = False) -> None:
         """
         Step for the EPLB (Expert Parallelism Load Balancing) state.
         """
@@ -1869,8 +1996,7 @@ def eplb_step(self,
             log_stats=self.parallel_config.eplb_config.log_balancedness,
         )
 
-    def get_dp_padding(self,
-                       num_tokens: int) -> tuple[int, Optional[torch.Tensor]]:
+    def get_dp_padding(self, num_tokens: int) -> tuple[int, Optional[torch.Tensor]]:
         """
         Determines the total number of tokens that each rank will run.
         All ranks will be padded out so that they run with the same number
@@ -1897,31 +2023,33 @@ def get_dp_padding(self,
             return 0, None
 
         num_tokens_across_dp = DPMetadata.num_tokens_across_dp(
-            num_tokens, dp_size, dp_rank)
+            num_tokens, dp_size, dp_rank
+        )
         max_tokens_across_dp_cpu = torch.max(num_tokens_across_dp).item()
-        num_tokens_after_padding = torch.tensor([max_tokens_across_dp_cpu] *
-                                                dp_size,
-                                                device="cpu",
-                                                dtype=torch.int32)
+        num_tokens_after_padding = torch.tensor(
+            [max_tokens_across_dp_cpu] * dp_size, device="cpu", dtype=torch.int32
+        )
         return max_tokens_across_dp_cpu - num_tokens, num_tokens_after_padding
 
     def get_local_padding(self, num_tokens_unpadded: int) -> int:
-
         num_tokens_padded = num_tokens_unpadded
 
-        if (self.compilation_config.cudagraph_mode != CUDAGraphMode.NONE
-                and num_tokens_unpadded <= self.cudagraph_batch_sizes[-1]):
+        if (
+            self.compilation_config.cudagraph_mode != CUDAGraphMode.NONE
+            and num_tokens_unpadded <= self.cudagraph_batch_sizes[-1]
+        ):
             # Use piecewise CUDA graphs.
             # Add padding to the batch size.
-            num_tokens_padded = self.vllm_config.pad_for_cudagraph(
-                num_tokens_unpadded)
+            num_tokens_padded = self.vllm_config.pad_for_cudagraph(num_tokens_unpadded)
         else:
             # Eager mode.
             # Pad tokens to multiple of tensor_parallel_size when
             # enabled collective fusion for SP
             tp_size = self.vllm_config.parallel_config.tensor_parallel_size
-            if self.vllm_config.compilation_config.pass_config. \
-                enable_sequence_parallelism and tp_size > 1:
+            if (
+                self.vllm_config.compilation_config.pass_config.enable_sequence_parallelism
+                and tp_size > 1
+            ):
                 num_tokens_padded = round_up(num_tokens_unpadded, tp_size)
 
         num_pad_tokens = num_tokens_padded - num_tokens_unpadded
@@ -1931,12 +2059,13 @@ def get_local_padding(self, num_tokens_unpadded: int) -> int:
     # Should be called after attention metadata creation. This just pads
     # the second ubatch slice out to the total number of tokens
     # (num_tokens + padding)
-    def pad_out_ubatch_slice(self, ubatch_slices: UBatchSlices,
-                             num_total_tokens: int):
-        padded_second_ubatch_slice = slice(ubatch_slices[1].token_slice.start,
-                                           num_total_tokens)
-        ubatch_slices[1] = UBatchSlice(padded_second_ubatch_slice,
-                                       padded_second_ubatch_slice)
+    def pad_out_ubatch_slice(self, ubatch_slices: UBatchSlices, num_total_tokens: int):
+        padded_second_ubatch_slice = slice(
+            ubatch_slices[1].token_slice.start, num_total_tokens
+        )
+        ubatch_slices[1] = UBatchSlice(
+            padded_second_ubatch_slice, padded_second_ubatch_slice
+        )
 
     def _pool(
         self,
@@ -1944,16 +2073,16 @@ def _pool(
         num_scheduled_tokens: int,
         num_scheduled_tokens_np: np.ndarray,
     ) -> ModelRunnerOutput:
-        assert self.input_batch.num_reqs ==\
-            len(self.input_batch.pooling_params), \
-        "Either all or none of the requests in" \
-        " a batch must be pooling request"
+        assert self.input_batch.num_reqs == len(self.input_batch.pooling_params), (
+            "Either all or none of the requests in a batch must be pooling request"
+        )
 
         hidden_states = hidden_states[:num_scheduled_tokens]
         pooling_metadata = self.input_batch.get_pooling_metadata()
-        pooling_metadata.build_pooling_cursor(num_scheduled_tokens_np.tolist(),
-                                              device=hidden_states.device)
-        seq_lens_cpu = self.seq_lens.cpu[:self.input_batch.num_reqs]
+        pooling_metadata.build_pooling_cursor(
+            num_scheduled_tokens_np.tolist(), device=hidden_states.device
+        )
+        seq_lens_cpu = self.seq_lens.cpu[: self.input_batch.num_reqs]
 
         model = cast(VllmModelForPooling, self.model)
         raw_pooler_output: PoolerOutput = model.pooler(
@@ -1968,8 +2097,8 @@ def _pool(
 
         pooler_output: list[Optional[torch.Tensor]] = []
         for raw_output, seq_len, prompt_len in zip(
-                raw_pooler_output, seq_lens_cpu, pooling_metadata.prompt_lens):
-
+            raw_pooler_output, seq_lens_cpu, pooling_metadata.prompt_lens
+        ):
             output = raw_output if seq_len == prompt_len else None
             pooler_output.append(output)
 
@@ -1983,11 +2112,13 @@ def _pool(
         )
 
     def _get_num_input_tokens(self, num_scheduled_tokens: int) -> int:
-        if (self.compilation_config.cudagraph_mode != CUDAGraphMode.NONE
-                and not envs.VLLM_DISABLE_PAD_FOR_CUDAGRAPH
-                and hasattr(self, "cudagraph_batch_sizes")
-                and self.cudagraph_batch_sizes
-                and num_scheduled_tokens <= self.cudagraph_batch_sizes[-1]):
+        if (
+            self.compilation_config.cudagraph_mode != CUDAGraphMode.NONE
+            and not envs.VLLM_DISABLE_PAD_FOR_CUDAGRAPH
+            and hasattr(self, "cudagraph_batch_sizes")
+            and self.cudagraph_batch_sizes
+            and num_scheduled_tokens <= self.cudagraph_batch_sizes[-1]
+        ):
             # Use CUDA graphs.
             # Add padding to the batch size.
             return self.vllm_config.pad_for_cudagraph(num_scheduled_tokens)
@@ -1996,8 +2127,10 @@ def _get_num_input_tokens(self, num_scheduled_tokens: int) -> int:
         # Pad tokens to multiple of tensor_parallel_size when
         # enabled collective fusion for SP
         tp_size = self.vllm_config.parallel_config.tensor_parallel_size
-        if (self.compilation_config.pass_config.enable_sequence_parallelism
-                and tp_size > 1):
+        if (
+            self.compilation_config.pass_config.enable_sequence_parallelism
+            and tp_size > 1
+        ):
             return round_up(num_scheduled_tokens, tp_size)
         return num_scheduled_tokens
 
@@ -2007,10 +2140,16 @@ def _preprocess(
         intermediate_tensors: Optional[IntermediateTensors] = None,
         ubatch_slices: Optional[UBatchSlices] = None,
         num_tokens_after_padding: Optional[torch.Tensor] = None,
-    ) -> tuple[int, int, Optional[torch.Tensor], Optional[torch.Tensor],
-               Optional[torch.Tensor], torch.Tensor,
-               Optional[IntermediateTensors], dict[str, Any]]:
-
+    ) -> tuple[
+        int,
+        int,
+        Optional[torch.Tensor],
+        Optional[torch.Tensor],
+        Optional[torch.Tensor],
+        torch.Tensor,
+        Optional[IntermediateTensors],
+        dict[str, Any],
+    ]:
         num_scheduled_tokens = scheduler_output.total_num_scheduled_tokens
         if ubatch_slices:
             assert num_tokens_after_padding is not None
@@ -2018,18 +2157,19 @@ def _preprocess(
             self.pad_out_ubatch_slice(ubatch_slices, num_input_tokens)
         elif ubatch_slices is None:
             num_input_tokens = self._get_num_input_tokens(num_scheduled_tokens)
-            num_pad, num_tokens_after_padding = self.get_dp_padding(
-                num_input_tokens)
+            num_pad, num_tokens_after_padding = self.get_dp_padding(num_input_tokens)
             num_input_tokens += num_pad
 
         # _prepare_inputs may reorder the batch, so we must gather multi
         # modal outputs after that to ensure the correct order
-        if (self.supports_mm_inputs and get_pp_group().is_first_rank
-                and not self.model_config.is_encoder_decoder):
+        if (
+            self.supports_mm_inputs
+            and get_pp_group().is_first_rank
+            and not self.model_config.is_encoder_decoder
+        ):
             # Run the multimodal encoder if any.
             self._execute_mm_encoder(scheduler_output)
-            mm_embeds, is_mm_embed = self._gather_mm_embeddings(
-                scheduler_output)
+            mm_embeds, is_mm_embed = self._gather_mm_embeddings(scheduler_output)
 
             # NOTE(woosuk): To unify token ids and soft tokens (vision
             # embeddings), we always use embeddings (rather than token ids)
@@ -2041,8 +2181,7 @@ def _preprocess(
             )
 
             # TODO(woosuk): Avoid the copy. Optimize.
-            self.inputs_embeds.gpu[:num_scheduled_tokens].copy_(
-                inputs_embeds_scheduled)
+            self.inputs_embeds.gpu[:num_scheduled_tokens].copy_(inputs_embeds_scheduled)
 
             input_ids = None
             inputs_embeds = self.inputs_embeds.gpu[:num_input_tokens]
@@ -2063,14 +2202,15 @@ def _preprocess(
             # If a batch only has token ids, then including the embedding layer
             # in the CUDA graph will be more performant (like in the else case
             # below).
-            token_ids_idx = self.is_token_ids.gpu[:num_scheduled_tokens] \
-                .nonzero(as_tuple=False) \
+            token_ids_idx = (
+                self.is_token_ids.gpu[:num_scheduled_tokens]
+                .nonzero(as_tuple=False)
                 .squeeze(1)
+            )
             # Some tokens ids may need to become embeds
             if token_ids_idx.numel() > 0:
                 token_ids = self.input_ids.gpu[token_ids_idx]
-                tokens_to_embeds = self.model.get_input_embeddings(
-                    input_ids=token_ids)
+                tokens_to_embeds = self.model.get_input_embeddings(input_ids=token_ids)
                 self.inputs_embeds.gpu[token_ids_idx] = tokens_to_embeds
 
             inputs_embeds = self.inputs_embeds.gpu[:num_input_tokens]
@@ -2093,10 +2233,13 @@ def _preprocess(
             intermediate_tensors = None
         else:
             intermediate_tensors = self.sync_and_slice_intermediate_tensors(
-                num_input_tokens, intermediate_tensors, True)
+                num_input_tokens, intermediate_tensors, True
+            )
 
-        if (self.model_config.is_encoder_decoder
-                and scheduler_output.scheduled_encoder_inputs):
+        if (
+            self.model_config.is_encoder_decoder
+            and scheduler_output.scheduled_encoder_inputs
+        ):
             encoder_inputs = self._extract_encoder_inputs(scheduler_output)
             model_kwargs.update(encoder_inputs)
 
@@ -2112,8 +2255,9 @@ def _preprocess(
         )
 
     def _sample(
-            self, logits: Optional[torch.Tensor],
-            spec_decode_metadata: Optional[SpecDecodeMetadata]
+        self,
+        logits: Optional[torch.Tensor],
+        spec_decode_metadata: Optional[SpecDecodeMetadata],
     ) -> SamplerOutput:
         # Sample the next token and get logprobs if needed.
         sampling_metadata = self.input_batch.sampling_metadata
@@ -2152,24 +2296,28 @@ def _sample(
         return sampler_output
 
     def _bookkeeping_sync(
-        self, scheduler_output: "SchedulerOutput",
-        sampler_output: SamplerOutput, logits: Optional[torch.Tensor],
-        hidden_states: torch.Tensor, num_scheduled_tokens: int
+        self,
+        scheduler_output: "SchedulerOutput",
+        sampler_output: SamplerOutput,
+        logits: Optional[torch.Tensor],
+        hidden_states: torch.Tensor,
+        num_scheduled_tokens: int,
     ) -> tuple[
-            dict[str, int],
-            Optional[LogprobsLists],
-            list[list[int]],
-            dict[str, Optional[LogprobsTensors]],
-            list[str],
-            dict[str, int],
-            list[int],
+        dict[str, int],
+        Optional[LogprobsLists],
+        list[list[int]],
+        dict[str, Optional[LogprobsTensors]],
+        list[str],
+        dict[str, int],
+        list[int],
     ]:
         num_nans_in_logits = {}
         if envs.VLLM_COMPUTE_NANS_IN_LOGITS:
             num_nans_in_logits = self._get_nans_in_logits(logits)
 
-        discard_sampled_tokens_req_indices = \
-            self.discard_request_indices.np[:self.num_discarded_requests]
+        discard_sampled_tokens_req_indices = self.discard_request_indices.np[
+            : self.num_discarded_requests
+        ]
         for i in discard_sampled_tokens_req_indices:
             gen = self.input_batch.generators.get(int(i))
             if gen is not None:
@@ -2178,14 +2326,14 @@ def _bookkeeping_sync(
         # Copy some objects so they don't get modified after returning.
         # This is important when using async scheduling.
         req_ids_output_copy = self.input_batch.req_ids.copy()
-        req_id_to_index_output_copy = \
-            self.input_batch.req_id_to_index.copy()
+        req_id_to_index_output_copy = self.input_batch.req_id_to_index.copy()
 
         # NOTE: GPU -> CPU Sync happens here.
         # Move as many CPU operations as possible before this sync point.
         logprobs_tensors = sampler_output.logprobs_tensors
-        logprobs_lists = logprobs_tensors.tolists() \
-            if logprobs_tensors is not None else None
+        logprobs_lists = (
+            logprobs_tensors.tolists() if logprobs_tensors is not None else None
+        )
 
         # Compute prompt logprobs if needed.
         prompt_logprobs_dict = self._get_prompt_logprobs_dict(
@@ -2220,10 +2368,10 @@ def _bookkeeping_sync(
             # Cache the sampled tokens on the GPU and avoid CPU sync.
             # These will be copied into input_ids in the next step
             # when preparing inputs.
-            self.input_batch.prev_sampled_token_ids = \
-                sampled_token_ids
-            self.input_batch.prev_sampled_token_ids_invalid_indices = \
+            self.input_batch.prev_sampled_token_ids = sampled_token_ids
+            self.input_batch.prev_sampled_token_ids_invalid_indices = (
                 invalid_req_indices_set
+            )
             self.input_batch.prev_req_id_to_index = {
                 req_id: i
                 for i, req_id in enumerate(self.input_batch.req_ids)
@@ -2238,8 +2386,7 @@ def _bookkeeping_sync(
         req_ids = self.input_batch.req_ids
         for req_idx in range(num_sampled_tokens):
             if self.use_async_scheduling:
-                sampled_ids = [-1] if \
-                    req_idx not in invalid_req_indices_set else None
+                sampled_ids = [-1] if req_idx not in invalid_req_indices_set else None
             else:
                 sampled_ids = valid_sampled_token_ids[req_idx]
             if not sampled_ids:
@@ -2250,7 +2397,8 @@ def _bookkeeping_sync(
             assert end_idx <= self.max_model_len + 1, (
                 "Sampled token IDs exceed the max model length + 1. "
                 f"Total number of tokens: {end_idx} > max_model_len + 1: "
-                f"{self.max_model_len + 1}")
+                f"{self.max_model_len + 1}"
+            )
 
             n_tokens_cache = len(sampled_ids)
 
@@ -2263,11 +2411,12 @@ def _bookkeeping_sync(
             if end_idx == self.max_model_len + 1:
                 n_tokens_cache -= 1
 
-            self.input_batch.token_ids_cpu[req_idx, start_idx:(
-                start_idx + n_tokens_cache)] = sampled_ids[:n_tokens_cache]
-            self.input_batch.is_token_ids[req_idx,
-                                          start_idx:(start_idx +
-                                                     n_tokens_cache)] = True
+            self.input_batch.token_ids_cpu[
+                req_idx, start_idx : (start_idx + n_tokens_cache)
+            ] = sampled_ids[:n_tokens_cache]
+            self.input_batch.is_token_ids[
+                req_idx, start_idx : (start_idx + n_tokens_cache)
+            ] = True
 
             self.input_batch.num_tokens_no_spec[req_idx] = end_idx
             self.input_batch.num_tokens[req_idx] = end_idx
@@ -2312,7 +2461,7 @@ def _model_forward(
         """Helper method to call the model forward pass.
 
         This method can be overridden by subclasses for model execution.
-        Motivation: We can inspect only this method versus 
+        Motivation: We can inspect only this method versus
         the whole execute_model, which has additional logic.
 
         Args:
@@ -2349,18 +2498,27 @@ def execute_model(
                         # Return empty ModelRunnerOutput if no work to do.
                         return EMPTY_MODEL_RUNNER_OUTPUT
                     return self.kv_connector_no_forward(
-                        scheduler_output, self.vllm_config)
+                        scheduler_output, self.vllm_config
+                    )
                 if self.cache_config.kv_sharing_fast_prefill:
                     assert not self.input_batch.num_prompt_logprobs, (
                         "--kv-sharing-fast-prefill produces incorrect "
                         "logprobs for prompt tokens, tokens, please disable "
-                        "it when the requests need prompt logprobs")
+                        "it when the requests need prompt logprobs"
+                    )
 
                 # Prepare the decoder inputs.
-                (attn_metadata, logits_indices, spec_decode_metadata,
-                 num_scheduled_tokens_np, spec_decode_common_attn_metadata,
-                 max_query_len, ubatch_slices, num_tokens_after_padding,
-                 use_cascade_attn) = self._prepare_inputs(scheduler_output)
+                (
+                    attn_metadata,
+                    logits_indices,
+                    spec_decode_metadata,
+                    num_scheduled_tokens_np,
+                    spec_decode_common_attn_metadata,
+                    max_query_len,
+                    ubatch_slices,
+                    num_tokens_after_padding,
+                    use_cascade_attn,
+                ) = self._prepare_inputs(scheduler_output)
 
             (
                 num_scheduled_tokens,
@@ -2371,26 +2529,33 @@ def execute_model(
                 positions,
                 intermediate_tensors,
                 model_kwargs,
-            ) = self._preprocess(scheduler_output, intermediate_tensors,
-                                 ubatch_slices, num_tokens_after_padding)
-
-            uniform_decode = (max_query_len
-                              == self.uniform_decode_query_len) and (
-                                  num_scheduled_tokens
-                                  == self.input_batch.num_reqs * max_query_len)
-            batch_descriptor = BatchDescriptor(num_tokens=num_input_tokens,
-                                               uniform_decode=uniform_decode)
-            cudagraph_runtime_mode, batch_descriptor = \
-                self.cudagraph_dispatcher.dispatch(batch_descriptor,
-                                                   use_cascade_attn)
+            ) = self._preprocess(
+                scheduler_output,
+                intermediate_tensors,
+                ubatch_slices,
+                num_tokens_after_padding,
+            )
+
+            uniform_decode = (max_query_len == self.uniform_decode_query_len) and (
+                num_scheduled_tokens == self.input_batch.num_reqs * max_query_len
+            )
+            batch_descriptor = BatchDescriptor(
+                num_tokens=num_input_tokens, uniform_decode=uniform_decode
+            )
+            cudagraph_runtime_mode, batch_descriptor = (
+                self.cudagraph_dispatcher.dispatch(batch_descriptor, use_cascade_attn)
+            )
 
         # Set cudagraph mode to none if calc_kv_scales is true.
         if attn_metadata is not None:
-            metadata_list = (attn_metadata.values() if isinstance(
-                attn_metadata, dict) else [attn_metadata])
+            metadata_list = (
+                attn_metadata.values()
+                if isinstance(attn_metadata, dict)
+                else [attn_metadata]
+            )
             if any(
-                    getattr(m, 'enable_kv_scales_calculation', False)
-                    for m in metadata_list):
+                getattr(m, "enable_kv_scales_calculation", False) for m in metadata_list
+            ):
                 cudagraph_runtime_mode = CUDAGraphMode.NONE
 
         # This is currently to get around the assert in the DPMetadata
@@ -2400,7 +2565,8 @@ def execute_model(
 
         # Run the model.
         # Use persistent buffers for CUDA graphs.
-        with (set_forward_context(
+        with (
+            set_forward_context(
                 attn_metadata,
                 self.vllm_config,
                 num_tokens=num_input_tokens,
@@ -2408,9 +2574,10 @@ def execute_model(
                 cudagraph_runtime_mode=cudagraph_runtime_mode,
                 batch_descriptor=batch_descriptor,
                 ubatch_slices=ubatch_slices,
-        ), record_function_or_nullcontext("Forward"),
-              self.maybe_get_kv_connector_output(scheduler_output) as
-              kv_connector_output):
+            ),
+            record_function_or_nullcontext("Forward"),
+            self.maybe_get_kv_connector_output(scheduler_output) as kv_connector_output,
+        ):
             model_output = self._model_forward(
                 input_ids=input_ids,
                 positions=positions,
@@ -2438,8 +2605,9 @@ def execute_model(
 
                 if self.is_pooling_model:
                     # Return the pooling output.
-                    output = self._pool(hidden_states, num_scheduled_tokens,
-                                        num_scheduled_tokens_np)
+                    output = self._pool(
+                        hidden_states, num_scheduled_tokens, num_scheduled_tokens_np
+                    )
                     output.kv_connector_output = kv_connector_output
                     return output
 
@@ -2451,14 +2619,15 @@ def execute_model(
 
                 if not get_pp_group().is_last_rank:
                     all_gather_tensors = {
-                        "residual":
-                        not is_residual_scattered_for_sp(
-                            self.vllm_config, num_input_tokens)
+                        "residual": not is_residual_scattered_for_sp(
+                            self.vllm_config, num_input_tokens
+                        )
                     }
                     get_pp_group().send_tensor_dict(
                         hidden_states.tensors,
                         all_gather_group=get_tp_group(),
-                        all_gather_tensors=all_gather_tensors)
+                        all_gather_tensors=all_gather_tensors,
+                    )
                     logits = None
                 else:
                     sample_hidden_states = hidden_states[logits_indices]
@@ -2468,16 +2637,17 @@ def execute_model(
                 if logits is not None:
                     model_output_broadcast_data["logits"] = logits.contiguous()
 
-                model_output_broadcast_data = get_pp_group(
-                ).broadcast_tensor_dict(model_output_broadcast_data,
-                                        src=len(get_pp_group().ranks) - 1)
+                model_output_broadcast_data = get_pp_group().broadcast_tensor_dict(
+                    model_output_broadcast_data, src=len(get_pp_group().ranks) - 1
+                )
                 assert model_output_broadcast_data is not None
                 logits = model_output_broadcast_data["logits"]
 
             # Apply structured output bitmasks if present
             if scheduler_output.grammar_bitmask is not None:
-                apply_grammar_bitmask(scheduler_output, self.input_batch,
-                                      logits, self.device)
+                apply_grammar_bitmask(
+                    scheduler_output, self.input_batch, logits, self.device
+                )
 
         with record_function_or_nullcontext("Sample"):
             sampler_output = self._sample(logits, spec_decode_metadata)
@@ -2496,22 +2666,27 @@ def propose_draft_token_ids(sampled_token_ids):
                     spec_decode_common_attn_metadata,
                 )
 
-        use_padded_batch_for_eagle = self.speculative_config and \
-            self.speculative_config.use_eagle() and \
-            not self.speculative_config.disable_padded_drafter_batch
+        use_padded_batch_for_eagle = (
+            self.speculative_config
+            and self.speculative_config.use_eagle()
+            and not self.speculative_config.disable_padded_drafter_batch
+        )
         effective_drafter_max_model_len = self.max_model_len
         if effective_drafter_max_model_len is None:
             effective_drafter_max_model_len = self.model_config.max_model_len
-        if (self.speculative_config
-                and self.speculative_config.draft_model_config is not None
-                and self.speculative_config.draft_model_config.max_model_len
-                is not None):
+        if (
+            self.speculative_config
+            and self.speculative_config.draft_model_config is not None
+            and self.speculative_config.draft_model_config.max_model_len is not None
+        ):
             effective_drafter_max_model_len = (
-                self.speculative_config.draft_model_config.max_model_len)
+                self.speculative_config.draft_model_config.max_model_len
+            )
         input_fits_in_drafter = spec_decode_common_attn_metadata and (
-            spec_decode_common_attn_metadata.max_seq_len +
-            self.speculative_config.num_speculative_tokens
-            <= effective_drafter_max_model_len)
+            spec_decode_common_attn_metadata.max_seq_len
+            + self.speculative_config.num_speculative_tokens
+            <= effective_drafter_max_model_len
+        )
         if use_padded_batch_for_eagle and input_fits_in_drafter:
             # EAGLE speculative decoding can use the GPU sampled tokens
             # as inputs, and does not need to wait for bookkeeping to finish.
@@ -2526,12 +2701,19 @@ def propose_draft_token_ids(sampled_token_ids):
                 req_ids_output_copy,
                 req_id_to_index_output_copy,
                 invalid_req_indices,
-            ) = self._bookkeeping_sync(scheduler_output, sampler_output,
-                                       logits, hidden_states,
-                                       num_scheduled_tokens)
+            ) = self._bookkeeping_sync(
+                scheduler_output,
+                sampler_output,
+                logits,
+                hidden_states,
+                num_scheduled_tokens,
+            )
 
-        if (self.speculative_config and not use_padded_batch_for_eagle
-                and input_fits_in_drafter):
+        if (
+            self.speculative_config
+            and not use_padded_batch_for_eagle
+            and input_fits_in_drafter
+        ):
             # ngram and other speculative decoding methods use the sampled
             # tokens on the CPU, so they are run after bookkeeping.
             propose_draft_token_ids(valid_sampled_token_ids)
@@ -2587,10 +2769,12 @@ def propose_draft_token_ids(
             assert isinstance(sampled_token_ids, list)
             assert isinstance(self.drafter, NgramProposer)
             draft_token_ids = self.drafter.propose(
-                sampled_token_ids, self.input_batch.req_ids,
+                sampled_token_ids,
+                self.input_batch.req_ids,
                 self.input_batch.num_tokens_no_spec,
                 self.input_batch.token_ids_cpu,
-                self.input_batch.spec_decode_unsupported_reqs)
+                self.input_batch.spec_decode_unsupported_reqs,
+            )
         elif self.speculative_config.method == "medusa":
             assert isinstance(sampled_token_ids, list)
             assert isinstance(self.drafter, MedusaProposer)
@@ -2603,8 +2787,8 @@ def propose_draft_token_ids(
                 offset = 0
                 assert spec_decode_metadata is not None
                 for num_draft, tokens in zip(
-                        spec_decode_metadata.num_draft_tokens,
-                        sampled_token_ids):
+                    spec_decode_metadata.num_draft_tokens, sampled_token_ids
+                ):
                     indices.append(offset + len(tokens) - 1)
                     offset += num_draft + 1
                 indices = torch.tensor(indices, device=self.device)
@@ -2621,29 +2805,35 @@ def propose_draft_token_ids(
                 # When padded-batch is disabled, the sampled_token_ids should be
                 # the cpu-side list[list[int]] of valid sampled tokens for each
                 # request, with invalid requests having empty lists.
-                assert isinstance(sampled_token_ids, list), \
-                    "sampled_token_ids should be a python list when" \
+                assert isinstance(sampled_token_ids, list), (
+                    "sampled_token_ids should be a python list when"
                     "padded-batch is disabled."
+                )
                 next_token_ids = self.drafter.prepare_next_token_ids_cpu(
-                    sampled_token_ids, self.requests, self.input_batch,
-                    scheduler_output.num_scheduled_tokens)
+                    sampled_token_ids,
+                    self.requests,
+                    self.input_batch,
+                    scheduler_output.num_scheduled_tokens,
+                )
             else:
                 # When using padded-batch, the sampled_token_ids should be
                 # the gpu tensor of sampled tokens for each request, of shape
                 # (num_reqs, num_spec_tokens + 1) with rejected tokens having
                 # value -1.
-                assert isinstance(sampled_token_ids, torch.Tensor), \
-                    "sampled_token_ids should be a torch.Tensor when" \
+                assert isinstance(sampled_token_ids, torch.Tensor), (
+                    "sampled_token_ids should be a torch.Tensor when"
                     "padded-batch is enabled."
-                next_token_ids, valid_sampled_tokens_count = \
+                )
+                next_token_ids, valid_sampled_tokens_count = (
                     self.drafter.prepare_next_token_ids_padded(
                         common_attn_metadata,
                         sampled_token_ids,
                         self.requests,
                         self.input_batch,
                         self.discard_request_indices.gpu,
-                        self.num_discarded_requests
+                        self.num_discarded_requests,
                     )
+                )
 
             if spec_decode_metadata is None:
                 token_indices_to_sample = None
@@ -2653,32 +2843,34 @@ def propose_draft_token_ids(
                 if self.use_aux_hidden_state_outputs:
                     assert aux_hidden_states is not None
                     target_hidden_states = torch.cat(
-                        [h[:num_scheduled_tokens] for h in aux_hidden_states],
-                        dim=-1)
+                        [h[:num_scheduled_tokens] for h in aux_hidden_states], dim=-1
+                    )
                 else:
                     target_hidden_states = hidden_states[:num_scheduled_tokens]
             else:
                 if self.speculative_config.disable_padded_drafter_batch:
                     token_indices_to_sample = None
-                    common_attn_metadata, token_indices =\
-                        self.drafter.prepare_inputs(
-                            common_attn_metadata,
-                            sampled_token_ids,
-                            spec_decode_metadata.num_draft_tokens)
+                    common_attn_metadata, token_indices = self.drafter.prepare_inputs(
+                        common_attn_metadata,
+                        sampled_token_ids,
+                        spec_decode_metadata.num_draft_tokens,
+                    )
                 else:
-                    common_attn_metadata, token_indices, \
-                        token_indices_to_sample =\
+                    common_attn_metadata, token_indices, token_indices_to_sample = (
                         self.drafter.prepare_inputs_padded(
                             common_attn_metadata,
                             spec_decode_metadata,
-                            valid_sampled_tokens_count)
+                            valid_sampled_tokens_count,
+                        )
+                    )
 
                 target_token_ids = self.input_ids.gpu[token_indices]
                 target_positions = self._get_positions(token_indices)
                 if self.use_aux_hidden_state_outputs:
                     assert aux_hidden_states is not None
                     target_hidden_states = torch.cat(
-                        [h[token_indices] for h in aux_hidden_states], dim=-1)
+                        [h[token_indices] for h in aux_hidden_states], dim=-1
+                    )
                 else:
                     target_hidden_states = hidden_states[token_indices]
 
@@ -2706,9 +2898,10 @@ def propose_draft_token_ids(
     def update_config(self, overrides: dict[str, Any]) -> None:
         allowed_config_names = {"load_config", "model_config"}
         for config_name, config_overrides in overrides.items():
-            assert config_name in allowed_config_names, \
-                f"Config `{config_name}` not supported. " \
+            assert config_name in allowed_config_names, (
+                f"Config `{config_name}` not supported. "
                 f"Allowed configs: {allowed_config_names}"
+            )
             config = getattr(self, config_name)
             new_config = update_config(config, config_overrides)
             setattr(self, config_name, new_config)
@@ -2721,26 +2914,24 @@ def load_model(self, eep_scale_up: bool = False) -> None:
         logger.info("Starting to load model %s...", self.model_config.model)
         if eep_scale_up:
             from vllm.distributed.parallel_state import get_ep_group
-            num_local_physical_experts = torch.empty(1,
-                                                     dtype=torch.int32,
-                                                     device="cpu")
-            torch.distributed.broadcast(num_local_physical_experts,
-                                        group=get_ep_group().cpu_group,
-                                        group_src=0)
+
+            num_local_physical_experts = torch.empty(1, dtype=torch.int32, device="cpu")
+            torch.distributed.broadcast(
+                num_local_physical_experts, group=get_ep_group().cpu_group, group_src=0
+            )
             num_local_physical_experts = int(num_local_physical_experts.item())
             new_ep_size = get_ep_group().world_size
-            global_expert_load, old_global_expert_indices = (
-                EplbState.recv_state())
+            global_expert_load, old_global_expert_indices = EplbState.recv_state()
             num_logical_experts = global_expert_load.shape[1]
             self.parallel_config.eplb_config.num_redundant_experts = (
-                num_local_physical_experts * new_ep_size - num_logical_experts)
-            assert old_global_expert_indices.shape[
-                1] % num_local_physical_experts == 0
-            old_ep_size = old_global_expert_indices.shape[
-                1] // num_local_physical_experts
+                num_local_physical_experts * new_ep_size - num_logical_experts
+            )
+            assert old_global_expert_indices.shape[1] % num_local_physical_experts == 0
+            old_ep_size = (
+                old_global_expert_indices.shape[1] // num_local_physical_experts
+            )
             rank_mapping = {
-                old_ep_rank: old_ep_rank
-                for old_ep_rank in range(old_ep_size)
+                old_ep_rank: old_ep_rank for old_ep_rank in range(old_ep_size)
             }
         else:
             global_expert_load = None
@@ -2752,36 +2943,41 @@ def load_model(self, eep_scale_up: bool = False) -> None:
             model_loader = get_model_loader(self.load_config)
             logger.info("Loading model from scratch...")
             self.model = model_loader.load_model(
-                vllm_config=self.vllm_config, model_config=self.model_config)
+                vllm_config=self.vllm_config, model_config=self.model_config
+            )
             if self.lora_config:
-                self.model = self.load_lora_model(self.model, self.vllm_config,
-                                                  self.device)
+                self.model = self.load_lora_model(
+                    self.model, self.vllm_config, self.device
+                )
             if hasattr(self, "drafter"):
                 logger.info("Loading drafter model...")
                 self.drafter.load_model(self.model)
             if self.use_aux_hidden_state_outputs:
                 if supports_eagle3(self.model):
                     self.model.set_aux_hidden_state_layers(
-                        self.model.get_eagle3_aux_hidden_state_layers())
+                        self.model.get_eagle3_aux_hidden_state_layers()
+                    )
                 else:
                     raise RuntimeError(
                         "Model does not support EAGLE3 interface but "
-                        "aux_hidden_state_outputs was requested")
+                        "aux_hidden_state_outputs was requested"
+                    )
             time_after_load = time.perf_counter()
         self.model_memory_usage = m.consumed_memory
-        logger.info("Model loading took %.4f GiB and %.6f seconds",
-                    self.model_memory_usage / GiB_bytes,
-                    time_after_load - time_before_load)
+        logger.info(
+            "Model loading took %.4f GiB and %.6f seconds",
+            self.model_memory_usage / GiB_bytes,
+            time_after_load - time_before_load,
+        )
         prepare_communication_buffer_for_model(self.model)
 
-        self.is_multimodal_pruning_enabled = (supports_multimodal_pruning(
-            self.model) and self.model_config.multimodal_config.
-                                              is_multimodal_pruning_enabled())
+        self.is_multimodal_pruning_enabled = (
+            supports_multimodal_pruning(self.model)
+            and self.model_config.multimodal_config.is_multimodal_pruning_enabled()
+        )
 
-        if is_mixture_of_experts(
-                self.model) and self.parallel_config.enable_eplb:
-            logger.info("EPLB is enabled for model %s.",
-                        self.model_config.model)
+        if is_mixture_of_experts(self.model) and self.parallel_config.enable_eplb:
+            logger.info("EPLB is enabled for model %s.", self.model_config.model)
             self.eplb_state = EplbState.build(
                 self.model,
                 self.device,
@@ -2792,11 +2988,10 @@ def load_model(self, eep_scale_up: bool = False) -> None:
             )
 
         if (
-            self.vllm_config.compilation_config.level == \
-                CompilationLevel.DYNAMO_AS_IS and supports_dynamo()
+            self.vllm_config.compilation_config.level == CompilationLevel.DYNAMO_AS_IS
+            and supports_dynamo()
         ):
-            backend = self.vllm_config.compilation_config.init_backend(
-                self.vllm_config)
+            backend = self.vllm_config.compilation_config.init_backend(self.vllm_config)
             compilation_counter.dynamo_as_is_count += 1
             self.model.compile(fullgraph=True, backend=backend)
             return
@@ -2804,26 +2999,30 @@ def load_model(self, eep_scale_up: bool = False) -> None:
         # CudagraphWraper and CudagraphDispatcher of vllm.
 
         # wrap the model with full cudagraph wrapper if needed.
-        if self.compilation_config.cudagraph_mode.has_full_cudagraphs() \
-            and not self.parallel_config.enable_dbo:
-            self.model = CUDAGraphWrapper(self.model,
-                                          self.vllm_config,
-                                          runtime_mode=CUDAGraphMode.FULL)
+        if (
+            self.compilation_config.cudagraph_mode.has_full_cudagraphs()
+            and not self.parallel_config.enable_dbo
+        ):
+            self.model = CUDAGraphWrapper(
+                self.model, self.vllm_config, runtime_mode=CUDAGraphMode.FULL
+            )
         elif self.parallel_config.enable_dbo:
             if self.compilation_config.cudagraph_mode.has_full_cudagraphs():
-                self.model = UBatchWrapper(self.model, self.vllm_config,
-                                           CUDAGraphMode.FULL, self.device)
+                self.model = UBatchWrapper(
+                    self.model, self.vllm_config, CUDAGraphMode.FULL, self.device
+                )
             else:
-                self.model = UBatchWrapper(self.model, self.vllm_config,
-                                           CUDAGraphMode.NONE, self.device)
+                self.model = UBatchWrapper(
+                    self.model, self.vllm_config, CUDAGraphMode.NONE, self.device
+                )
 
     def reload_weights(self) -> None:
-        assert getattr(self, "model", None) is not None, \
+        assert getattr(self, "model", None) is not None, (
             "Cannot reload weights before model is loaded."
+        )
         model_loader = get_model_loader(self.load_config)
         logger.info("Reloading weights inplace...")
-        model_loader.load_weights(self.get_model(),
-                                  model_config=self.model_config)
+        model_loader.load_weights(self.get_model(), model_config=self.model_config)
 
     def save_tensorized_model(
         self,
@@ -2861,7 +3060,8 @@ def _get_prompt_logprobs_dict(
 
             num_prompt_tokens = len(request.prompt_token_ids)
             prompt_token_ids = torch.tensor(request.prompt_token_ids).to(
-                self.device, non_blocking=True)
+                self.device, non_blocking=True
+            )
 
             # Set up target LogprobsTensors object.
             logprobs_tensors = in_progress_dict.get(req_id)
@@ -2869,7 +3069,8 @@ def _get_prompt_logprobs_dict(
                 # Create empty logprobs CPU tensors for the entire prompt.
                 # If chunked, we'll copy in slice by slice.
                 logprobs_tensors = LogprobsTensors.empty_cpu(
-                    num_prompt_tokens - 1, num_prompt_logprobs + 1)
+                    num_prompt_tokens - 1, num_prompt_logprobs + 1
+                )
                 in_progress_dict[req_id] = logprobs_tensors
 
             # Determine number of logits to retrieve.
@@ -2899,27 +3100,29 @@ def _get_prompt_logprobs_dict(
             # then there is prompt logprob generated for each index.
             req_idx = self.input_batch.req_id_to_index[req_id]
             offset = self.query_start_loc.np[req_idx].item()
-            prompt_hidden_states = hidden_states[offset:offset + num_logits]
+            prompt_hidden_states = hidden_states[offset : offset + num_logits]
             logits = self.model.compute_logits(prompt_hidden_states)
 
             # Get the "target" tokens for each index. For prompt at index i,
             # the token at prompt index i+1 is the "sampled" token we want
             # to gather the logprob for.
-            tgt_token_ids = prompt_token_ids[start_tok:start_tok + num_logits]
+            tgt_token_ids = prompt_token_ids[start_tok : start_tok + num_logits]
 
             # Compute prompt logprobs.
             logprobs = self.sampler.compute_logprobs(logits)
             token_ids, logprobs, ranks = self.sampler.gather_logprobs(
-                logprobs, num_prompt_logprobs, tgt_token_ids)
+                logprobs, num_prompt_logprobs, tgt_token_ids
+            )
 
             # Transfer GPU->CPU async.
             chunk_slice = slice(start_idx, start_idx + num_logits)
             logprobs_tensors.logprob_token_ids[chunk_slice].copy_(
-                token_ids, non_blocking=True)
-            logprobs_tensors.logprobs[chunk_slice].copy_(logprobs,
-                                                         non_blocking=True)
+                token_ids, non_blocking=True
+            )
+            logprobs_tensors.logprobs[chunk_slice].copy_(logprobs, non_blocking=True)
             logprobs_tensors.selected_token_ranks[chunk_slice].copy_(
-                ranks, non_blocking=True)
+                ranks, non_blocking=True
+            )
 
         # Remove requests that have completed prefill from the batch
         # num_prompt_logprobs_dict.
@@ -2947,8 +3150,9 @@ def _get_nans_in_logits(
                 req_index = self.input_batch.req_id_to_index[req_id]
                 num_nans_in_logits[req_id] = (
                     int(num_nans_for_index[req_index])
-                    if num_nans_for_index is not None
-                    and req_index < logits.shape[0] else 0)
+                    if num_nans_for_index is not None and req_index < logits.shape[0]
+                    else 0
+                )
             return num_nans_in_logits
         except IndexError:
             return {}
@@ -2974,11 +3178,11 @@ def rand_input_ids() -> torch.Tensor:
                     self.input_ids.gpu,
                     low=0,
                     high=self.model_config.get_vocab_size(),
-                    dtype=input_ids.dtype)
+                    dtype=input_ids.dtype,
+                )
 
             logger.debug_once("Randomizing dummy data for DP Rank")
-            input_ids.copy_(rand_input_ids()[:input_ids.size(0)],
-                            non_blocking=True)
+            input_ids.copy_(rand_input_ids()[: input_ids.size(0)], non_blocking=True)
             yield
             input_ids.fill_(0)
 
@@ -3003,13 +3207,15 @@ def _get_mm_dummy_batch(
         dummy_mm_items = [dummy_mm_item] * max_items_per_batch
 
         model = cast(SupportsMultiModal, self.model)
-        return next(mm_kwargs_group
-                    for _, _, mm_kwargs_group in group_mm_kwargs_by_modality(
-                        dummy_mm_items,
-                        device=self.device,
-                        pin_memory=self.pin_memory,
-                        merge_by_field_config=model.merge_by_field_config,
-                    ))
+        return next(
+            mm_kwargs_group
+            for _, _, mm_kwargs_group in group_mm_kwargs_by_modality(
+                dummy_mm_items,
+                device=self.device,
+                pin_memory=self.pin_memory,
+                merge_by_field_config=model.merge_by_field_config,
+            )
+        )
 
     @torch.inference_mode()
     def _dummy_run(
@@ -3046,8 +3252,10 @@ def _dummy_run(
                 (1 token) and prefill (multiple tokens) requests.
             remove_lora: If False, dummy LoRAs are not destroyed after the run
         """
-        assert cudagraph_runtime_mode is None or \
-            cudagraph_runtime_mode.valid_runtime_modes()
+        assert (
+            cudagraph_runtime_mode is None
+            or cudagraph_runtime_mode.valid_runtime_modes()
+        )
 
         # If cudagraph_mode.decode_mode() == FULL and
         # cudagraph_mode.separate_routine(). This means that we are using
@@ -3062,8 +3270,7 @@ def _dummy_run(
         # When setting max_query_len = 1, we switch to and capture the optimized
         # routine of FA2 for pure decode, i.e., Flashdecode + an optimization
         # for GQA/MQA.
-        max_query_len = self.uniform_decode_query_len if uniform_decode else \
-                                                                num_tokens
+        max_query_len = self.uniform_decode_query_len if uniform_decode else num_tokens
 
         # Set num_scheduled_tokens based on num_tokens and max_num_seqs
         # for dummy run with LoRA so that the num_reqs collectively
@@ -3079,9 +3286,7 @@ def _dummy_run(
             num_reqs = num_decode_tokens + 1
 
             # Create decode requests (1 token each) followed by prefill request
-            num_scheduled_tokens_list = [1] * num_decode_tokens + [
-                num_prefill_tokens
-            ]
+            num_scheduled_tokens_list = [1] * num_decode_tokens + [num_prefill_tokens]
             # Note: Overriding max_query_len to be the prefill tokens
             max_query_len = num_prefill_tokens
         elif uniform_decode:
@@ -3098,8 +3303,7 @@ def _dummy_run(
 
         assert sum(num_scheduled_tokens_list) == num_tokens
         assert len(num_scheduled_tokens_list) == num_reqs
-        num_scheduled_tokens = np.array(num_scheduled_tokens_list,
-                                        dtype=np.int32)
+        num_scheduled_tokens = np.array(num_scheduled_tokens_list, dtype=np.int32)
         total_num_scheduled_tokens = int(num_scheduled_tokens.sum())
 
         ubatch_slices = None
@@ -3153,56 +3357,61 @@ def _dummy_run(
             self.seq_lens.np[num_reqs:] = 0
             self.seq_lens.copy_to_gpu()
 
-            cum_num_tokens, _ = self._get_cumsum_and_arange(
-                num_scheduled_tokens)
-            self.query_start_loc.np[1:num_reqs + 1] = cum_num_tokens
+            cum_num_tokens, _ = self._get_cumsum_and_arange(num_scheduled_tokens)
+            self.query_start_loc.np[1 : num_reqs + 1] = cum_num_tokens
             self.query_start_loc.copy_to_gpu()
 
             for kv_cache_group_id, kv_cache_group_spec in enumerate(
-                    self.kv_cache_config.kv_cache_groups):
+                self.kv_cache_config.kv_cache_groups
+            ):
                 common_attn_metadata = CommonAttentionMetadata(
-                    query_start_loc=self.query_start_loc.gpu[:num_reqs + 1],
-                    query_start_loc_cpu=self.query_start_loc.cpu[:num_reqs +
-                                                                 1],
+                    query_start_loc=self.query_start_loc.gpu[: num_reqs + 1],
+                    query_start_loc_cpu=self.query_start_loc.cpu[: num_reqs + 1],
                     seq_lens=self.seq_lens.gpu[:num_reqs],
                     seq_lens_cpu=self.seq_lens.cpu[:num_reqs],
-                    num_computed_tokens_cpu=self.input_batch.
-                    num_computed_tokens_cpu_tensor[:num_reqs],
+                    num_computed_tokens_cpu=self.input_batch.num_computed_tokens_cpu_tensor[
+                        :num_reqs
+                    ],
                     num_reqs=num_reqs,
                     num_actual_tokens=num_tokens,
                     max_query_len=max_query_len,
                     max_seq_len=self.max_model_len,
-                    block_table_tensor=self.input_batch.
-                    block_table[kv_cache_group_id].get_device_tensor(num_reqs),
+                    block_table_tensor=self.input_batch.block_table[
+                        kv_cache_group_id
+                    ].get_device_tensor(num_reqs),
                     slot_mapping=self.input_batch.block_table[
-                        kv_cache_group_id].slot_mapping.gpu[:num_tokens],
-                    causal=True)
+                        kv_cache_group_id
+                    ].slot_mapping.gpu[:num_tokens],
+                    causal=True,
+                )
                 for attn_group in self.attn_groups[kv_cache_group_id]:
                     if ubatch_slices is not None:
                         common_attn_metadata_list = split_attn_metadata(
-                            ubatch_slices, common_attn_metadata)
+                            ubatch_slices, common_attn_metadata
+                        )
                         for ubid, common_attn_metadata in enumerate(
-                                common_attn_metadata_list):
+                            common_attn_metadata_list
+                        ):
                             assert common_attn_metadata.max_query_len == 1
-                            attn_metadata_i = (attn_group\
-                                               .get_metadata_builder(ubatch_id=ubid)\
-                                               .build_for_cudagraph_capture(common_attn_metadata))
+                            attn_metadata_i = attn_group.get_metadata_builder(
+                                ubatch_id=ubid
+                            ).build_for_cudagraph_capture(common_attn_metadata)
                             for layer_name in attn_group.layer_names:
                                 assert type(attn_metadata) is list
-                                attn_metadata[ubid][
-                                    layer_name] = attn_metadata_i
+                                attn_metadata[ubid][layer_name] = attn_metadata_i
                     else:
                         assert type(attn_metadata) is dict
-                        attn_metadata_i = attn_group.get_metadata_builder()\
-                            .build_for_cudagraph_capture(common_attn_metadata)
+                        attn_metadata_i = attn_group.get_metadata_builder().build_for_cudagraph_capture(
+                            common_attn_metadata
+                        )
                         for layer_name in attn_group.layer_names:
                             attn_metadata[layer_name] = attn_metadata_i
 
-        with self.maybe_dummy_run_with_lora(self.lora_config,
-                                            num_scheduled_tokens, remove_lora):
+        with self.maybe_dummy_run_with_lora(
+            self.lora_config, num_scheduled_tokens, remove_lora
+        ):
             model_kwargs = self._init_model_kwargs(num_tokens)
-            if (self.supports_mm_inputs
-                    and not self.model_config.is_encoder_decoder):
+            if self.supports_mm_inputs and not self.model_config.is_encoder_decoder:
                 input_ids = None
                 inputs_embeds = self.inputs_embeds.gpu[:num_tokens]
                 model_kwargs = {
@@ -3230,23 +3439,35 @@ def _dummy_run(
                         self.model.make_empty_intermediate_tensors(
                             batch_size=self.max_num_tokens,
                             dtype=self.model_config.dtype,
-                            device=self.device))
+                            device=self.device,
+                        )
+                    )
 
                 intermediate_tensors = self.sync_and_slice_intermediate_tensors(
-                    num_tokens, None, False)
+                    num_tokens, None, False
+                )
 
             # filter out the valid batch descriptor
-            _cg_mode, batch_descriptor = self.cudagraph_dispatcher.dispatch(
-                BatchDescriptor(num_tokens=num_tokens_after_padding,
-                                uniform_decode=uniform_decode)) \
-                if not is_profile else (CUDAGraphMode.NONE, None)
+            _cg_mode, batch_descriptor = (
+                self.cudagraph_dispatcher.dispatch(
+                    BatchDescriptor(
+                        num_tokens=num_tokens_after_padding,
+                        uniform_decode=uniform_decode,
+                    )
+                )
+                if not is_profile
+                else (CUDAGraphMode.NONE, None)
+            )
             if cudagraph_runtime_mode is not None:
                 # we allow forcing NONE when the dispatcher disagrees to support
                 # warm ups for cudagraph capture
-                assert cudagraph_runtime_mode == CUDAGraphMode.NONE or \
-                    cudagraph_runtime_mode == _cg_mode, (
+                assert (
+                    cudagraph_runtime_mode == CUDAGraphMode.NONE
+                    or cudagraph_runtime_mode == _cg_mode
+                ), (
                     f"Cudagraph runtime mode mismatch at dummy_run. "
-                    f"Expected {_cg_mode}, but got {cudagraph_runtime_mode}.")
+                    f"Expected {_cg_mode}, but got {cudagraph_runtime_mode}."
+                )
             else:
                 cudagraph_runtime_mode = _cg_mode
 
@@ -3258,14 +3479,18 @@ def _dummy_run(
                 if num_tokens_across_dp is not None:
                     num_tokens_across_dp[:] = num_tokens_after_padding
 
-            with self.maybe_randomize_inputs(input_ids), set_forward_context(
+            with (
+                self.maybe_randomize_inputs(input_ids),
+                set_forward_context(
                     attn_metadata,
                     self.vllm_config,
                     num_tokens=num_tokens_after_padding,
                     num_tokens_across_dp=num_tokens_across_dp,
                     cudagraph_runtime_mode=cudagraph_runtime_mode,
                     batch_descriptor=batch_descriptor,
-                    ubatch_slices=ubatch_slices):
+                    ubatch_slices=ubatch_slices,
+                ),
+            ):
                 outputs = self.model(
                     input_ids=input_ids,
                     positions=positions,
@@ -3309,8 +3534,7 @@ def _dummy_sampler_run(
         logits = self.model.compute_logits(hidden_states)
         num_reqs = logits.size(0)
 
-        dummy_tensors = lambda v: torch.full(
-            (num_reqs, ), v, device=self.device)
+        dummy_tensors = lambda v: torch.full((num_reqs,), v, device=self.device)
 
         dummy_metadata = SamplingMetadata(
             temperature=dummy_tensors(0.5),
@@ -3331,37 +3555,39 @@ def _dummy_sampler_run(
             logitsprocs=LogitsProcessors(),
         )
         try:
-            sampler_output = self.sampler(logits=logits,
-                                          sampling_metadata=dummy_metadata)
+            sampler_output = self.sampler(
+                logits=logits, sampling_metadata=dummy_metadata
+            )
         except RuntimeError as e:
-            if 'out of memory' in str(e):
+            if "out of memory" in str(e):
                 raise RuntimeError(
                     "CUDA out of memory occurred when warming up sampler with "
                     f"{num_reqs} dummy requests. Please try lowering "
                     "`max_num_seqs` or `gpu_memory_utilization` when "
-                    "initializing the engine.") from e
+                    "initializing the engine."
+                ) from e
             else:
                 raise e
         if self.speculative_config:
             draft_token_ids = [[0] for _ in range(num_reqs)]
             dummy_spec_decode_metadata = SpecDecodeMetadata.make_dummy(
-                draft_token_ids, self.device)
+                draft_token_ids, self.device
+            )
 
             num_tokens = sum(len(ids) for ids in draft_token_ids)
             # draft_probs = torch.randn(
             #     num_tokens, logits.shape[-1], device=self.device,
             #     dtype=logits.dtype)
             draft_probs = None
-            target_logits = torch.randn(num_tokens,
-                                        logits.shape[-1],
-                                        device=self.device,
-                                        dtype=logits.dtype)
+            target_logits = torch.randn(
+                num_tokens, logits.shape[-1], device=self.device, dtype=logits.dtype
+            )
             # NOTE(woosuk): Here, we should use int32 because the sampler uses
             # int32 for bonus_token_ids. If the dtype mismatches, re-compilation
             # will occur at runtime.
-            bonus_token_ids = torch.zeros(num_reqs,
-                                          device=self.device,
-                                          dtype=torch.int32)
+            bonus_token_ids = torch.zeros(
+                num_reqs, device=self.device, dtype=torch.int32
+            )
             self.rejection_sampler(
                 dummy_spec_decode_metadata,
                 draft_probs,
@@ -3391,9 +3617,9 @@ def _dummy_pooler_run_task(
             num_scheduled_tokens_list,
             device="cpu",
         )
-        dummy_token_ids = torch.zeros((num_reqs, req_num_tokens),
-                                      dtype=torch.int32,
-                                      device=self.device)
+        dummy_token_ids = torch.zeros(
+            (num_reqs, req_num_tokens), dtype=torch.int32, device=self.device
+        )
 
         model = cast(VllmModelForPooling, self.get_model())
         dummy_pooling_params = PoolingParams(task=task)
@@ -3407,19 +3633,22 @@ def _dummy_pooler_run_task(
             pooling_params=[dummy_pooling_params] * num_reqs,
         )
 
-        dummy_metadata.build_pooling_cursor(num_scheduled_tokens_list,
-                                            device=hidden_states.device)
+        dummy_metadata.build_pooling_cursor(
+            num_scheduled_tokens_list, device=hidden_states.device
+        )
 
         try:
-            return model.pooler(hidden_states=hidden_states,
-                                pooling_metadata=dummy_metadata)
+            return model.pooler(
+                hidden_states=hidden_states, pooling_metadata=dummy_metadata
+            )
         except RuntimeError as e:
-            if 'out of memory' in str(e):
+            if "out of memory" in str(e):
                 raise RuntimeError(
                     "CUDA out of memory occurred when warming up pooler "
                     f"({task=}) with {num_reqs} dummy requests. Please try "
                     "lowering `max_num_seqs` or `gpu_memory_utilization` when "
-                    "initializing the engine.") from e
+                    "initializing the engine."
+                ) from e
             else:
                 raise e
 
@@ -3445,7 +3674,8 @@ def profile_run(self) -> None:
             if self.model_config.multimodal_config.skip_mm_profiling:
                 logger.info(
                     "Skipping memory profiling for multimodal encoder and "
-                    "encoder cache.")
+                    "encoder cache."
+                )
             else:
                 mm_budget = self.mm_budget
                 assert mm_budget is not None
@@ -3455,8 +3685,9 @@ def profile_run(self) -> None:
                     # modality with the max possible input tokens even when
                     # it supports multiple.
                     dummy_modality = mm_budget.get_modality_with_max_tokens()
-                    max_mm_items_per_batch = mm_budget \
-                        .max_items_per_batch_by_modality[dummy_modality]
+                    max_mm_items_per_batch = mm_budget.max_items_per_batch_by_modality[
+                        dummy_modality
+                    ]
 
                     logger.info(
                         "Encoder cache will be initialized with a budget of "
@@ -3474,9 +3705,9 @@ def profile_run(self) -> None:
                     )
 
                     # Run multimodal encoder.
-                    dummy_encoder_outputs = \
-                        self.model.get_multimodal_embeddings(
-                        **batched_dummy_mm_inputs)
+                    dummy_encoder_outputs = self.model.get_multimodal_embeddings(
+                        **batched_dummy_mm_inputs
+                    )
 
                     sanity_check_mm_encoder_outputs(
                         dummy_encoder_outputs,
@@ -3493,7 +3724,8 @@ def profile_run(self) -> None:
                         expanded_outputs = []
                         for output in dummy_encoder_outputs:
                             expanded = output.new_zeros(
-                                (encoder_budget, encoder_output_shape[-1]))
+                                (encoder_budget, encoder_output_shape[-1])
+                            )
                             num_tokens = output.shape[0]
                             expanded[:num_tokens].copy_(output)
                             expanded_outputs.append(expanded)
@@ -3501,12 +3733,12 @@ def profile_run(self) -> None:
                         dummy_encoder_outputs = expanded_outputs
 
                     # Cache the dummy encoder outputs.
-                    self.encoder_cache["tmp"] = dict(
-                        enumerate(dummy_encoder_outputs))
+                    self.encoder_cache["tmp"] = dict(enumerate(dummy_encoder_outputs))
 
         # Add `is_profile` here to pre-allocate communication buffers
-        hidden_states, last_hidden_states \
-            = self._dummy_run(self.max_num_tokens, is_profile=True)
+        hidden_states, last_hidden_states = self._dummy_run(
+            self.max_num_tokens, is_profile=True
+        )
         if get_pp_group().is_last_rank:
             if self.is_pooling_model:
                 output = self._dummy_pooler_run(hidden_states)
@@ -3523,7 +3755,8 @@ def capture_model(self) -> int:
         if self.compilation_config.cudagraph_mode == CUDAGraphMode.NONE:
             logger.warning(
                 "Skipping CUDA graph capture. To turn on CUDA graph capture, "
-                "ensure `cudagraph_mode` was not manually set to `NONE`")
+                "ensure `cudagraph_mode` was not manually set to `NONE`"
+            )
             return 0
         else:
             self.initialize_cudagraph_capture()
@@ -3563,24 +3796,29 @@ def freeze_gc():
                 self._capture_cudagraphs(
                     compilation_cases,
                     cudagraph_runtime_mode=cudagraph_runtime_mode,
-                    uniform_decode=False)
+                    uniform_decode=False,
+                )
 
             # Capture full cudagraph for uniform decode batches if we
             # don't already have full mixed prefill-decode cudagraphs.
-            if cudagraph_mode.decode_mode() == CUDAGraphMode.FULL and \
-                cudagraph_mode.separate_routine():
-                max_num_tokens = self.scheduler_config.max_num_seqs * \
-                        self.uniform_decode_query_len
+            if (
+                cudagraph_mode.decode_mode() == CUDAGraphMode.FULL
+                and cudagraph_mode.separate_routine()
+            ):
+                max_num_tokens = (
+                    self.scheduler_config.max_num_seqs * self.uniform_decode_query_len
+                )
                 decode_cudagraph_batch_sizes = [
-                    x for x in self.cudagraph_batch_sizes if
-                    x <= max_num_tokens and x >= self.uniform_decode_query_len
+                    x
+                    for x in self.cudagraph_batch_sizes
+                    if x <= max_num_tokens and x >= self.uniform_decode_query_len
                 ]
-                compilation_cases_decode = list(
-                    reversed(decode_cudagraph_batch_sizes))
+                compilation_cases_decode = list(reversed(decode_cudagraph_batch_sizes))
                 self._capture_cudagraphs(
                     compilation_cases=compilation_cases_decode,
                     cudagraph_runtime_mode=CUDAGraphMode.FULL,
-                    uniform_decode=True)
+                    uniform_decode=True,
+                )
 
             torch.cuda.synchronize()
             end_free_gpu_memory = torch.cuda.mem_get_info()[0]
@@ -3596,16 +3834,23 @@ def freeze_gc():
         elapsed_time = end_time - start_time
         cuda_graph_size = start_free_gpu_memory - end_free_gpu_memory
         # This usually takes 5~20 seconds.
-        logger.info("Graph capturing finished in %.0f secs, took %.2f GiB",
-                    elapsed_time, cuda_graph_size / (1 << 30))
+        logger.info(
+            "Graph capturing finished in %.0f secs, took %.2f GiB",
+            elapsed_time,
+            cuda_graph_size / (1 << 30),
+        )
         return cuda_graph_size
 
-    def _capture_cudagraphs(self, compilation_cases: list[int],
-                            cudagraph_runtime_mode: CUDAGraphMode,
-                            uniform_decode: bool):
-        assert cudagraph_runtime_mode != CUDAGraphMode.NONE and \
-            cudagraph_runtime_mode.valid_runtime_modes(), \
-            f"Invalid cudagraph runtime mode: {cudagraph_runtime_mode}"
+    def _capture_cudagraphs(
+        self,
+        compilation_cases: list[int],
+        cudagraph_runtime_mode: CUDAGraphMode,
+        uniform_decode: bool,
+    ):
+        assert (
+            cudagraph_runtime_mode != CUDAGraphMode.NONE
+            and cudagraph_runtime_mode.valid_runtime_modes()
+        ), f"Invalid cudagraph runtime mode: {cudagraph_runtime_mode}"
 
         # Only rank 0 should print progress bar during capture
         if is_global_first_rank():
@@ -3614,7 +3859,9 @@ def _capture_cudagraphs(self, compilation_cases: list[int],
                 disable=not self.load_config.use_tqdm_on_load,
                 desc="Capturing CUDA graphs ({}, {})".format(
                     "decode" if uniform_decode else "mixed prefill-decode",
-                    cudagraph_runtime_mode.name))
+                    cudagraph_runtime_mode.name,
+                ),
+            )
 
         # We skip EPLB here since we don't want to record dummy metrics
         for num_tokens in compilation_cases:
@@ -3622,14 +3869,16 @@ def _capture_cudagraphs(self, compilation_cases: list[int],
             # cudagraph, a uniform decode batch, and the number of tokens
             # is above the threshold. Otherwise we just capture a non-ubatched
             # version of the graph
-            allow_microbatching = self.parallel_config.enable_dbo \
-                and cudagraph_runtime_mode == CUDAGraphMode.FULL \
-                and uniform_decode \
+            allow_microbatching = (
+                self.parallel_config.enable_dbo
+                and cudagraph_runtime_mode == CUDAGraphMode.FULL
+                and uniform_decode
                 and check_ubatch_thresholds(
                     config=self.vllm_config.parallel_config,
                     num_tokens=num_tokens,
                     uniform_decode=uniform_decode,
                 )
+            )
 
             for _ in range(self.compilation_config.cudagraph_num_of_warmups):
                 # Use CUDAGraphRuntimeStyle.NONE (default) for warmup.
@@ -3637,29 +3886,31 @@ def _capture_cudagraphs(self, compilation_cases: list[int],
                 # if we want to warm up attention or not. This is
                 # different from the case where `FULL` implies capture
                 # attention while `PIECEWISE` implies no attention.
-                force_attention = (
-                    cudagraph_runtime_mode == CUDAGraphMode.FULL)
-                self._dummy_run(num_tokens,
-                                cudagraph_runtime_mode=CUDAGraphMode.NONE,
-                                force_attention=force_attention,
-                                uniform_decode=uniform_decode,
-                                allow_microbatching=allow_microbatching,
-                                skip_eplb=True,
-                                remove_lora=False)
-            self._dummy_run(num_tokens,
-                            cudagraph_runtime_mode=cudagraph_runtime_mode,
-                            uniform_decode=uniform_decode,
-                            allow_microbatching=allow_microbatching,
-                            skip_eplb=True,
-                            remove_lora=False)
+                force_attention = cudagraph_runtime_mode == CUDAGraphMode.FULL
+                self._dummy_run(
+                    num_tokens,
+                    cudagraph_runtime_mode=CUDAGraphMode.NONE,
+                    force_attention=force_attention,
+                    uniform_decode=uniform_decode,
+                    allow_microbatching=allow_microbatching,
+                    skip_eplb=True,
+                    remove_lora=False,
+                )
+            self._dummy_run(
+                num_tokens,
+                cudagraph_runtime_mode=cudagraph_runtime_mode,
+                uniform_decode=uniform_decode,
+                allow_microbatching=allow_microbatching,
+                skip_eplb=True,
+                remove_lora=False,
+            )
         self.maybe_remove_all_loras(self.lora_config)
 
     def initialize_attn_backend(self, kv_cache_config: KVCacheConfig) -> None:
         """
         Initialize the attention backends and attention metadata builders.
         """
-        assert len(self.attn_groups) == 0, \
-            "Attention backends are already initialized"
+        assert len(self.attn_groups) == 0, "Attention backends are already initialized"
 
         class AttentionGroupKey(NamedTuple):
             attn_backend: type[AttentionBackend]
@@ -3669,8 +3920,8 @@ def get_attn_backends_for_group(
             kv_cache_group_spec: KVCacheGroupSpec,
         ) -> dict[AttentionGroupKey, list[str]]:
             layers = get_layers_from_vllm_config(
-                self.vllm_config, AttentionLayerBase,
-                kv_cache_group_spec.layer_names)
+                self.vllm_config, AttentionLayerBase, kv_cache_group_spec.layer_names
+            )
             attn_backends = {}
             attn_backend_layers = defaultdict(list)
             # Dedupe based on full class name; this is a bit safer than
@@ -3690,23 +3941,19 @@ def get_attn_backends_for_group(
                 full_cls_name = attn_backend.full_cls_name()
                 layer_kv_cache_spec = kv_cache_group_spec.kv_cache_spec
                 if isinstance(layer_kv_cache_spec, UniformTypeKVCacheSpecs):
-                    layer_kv_cache_spec = layer_kv_cache_spec.kv_cache_specs[
-                        layer_name]
+                    layer_kv_cache_spec = layer_kv_cache_spec.kv_cache_specs[layer_name]
                 key = (full_cls_name, layer_kv_cache_spec)
-                attn_backends[key] = AttentionGroupKey(attn_backend,
-                                                       layer_kv_cache_spec)
+                attn_backends[key] = AttentionGroupKey(
+                    attn_backend, layer_kv_cache_spec
+                )
                 attn_backend_layers[key].append(layer_name)
-            return {
-                attn_backends[k]: v
-                for k, v in attn_backend_layers.items()
-            }
+            return {attn_backends[k]: v for k, v in attn_backend_layers.items()}
 
         def create_attn_groups(
             attn_backends_map: dict[AttentionGroupKey, list[str]],
         ) -> list[AttentionGroup]:
             attn_groups: list[AttentionGroup] = []
-            for (attn_backend,
-                 kv_cache_spec), layer_names in attn_backends_map.items():
+            for (attn_backend, kv_cache_spec), layer_names in attn_backends_map.items():
                 attn_group = AttentionGroup.create_with_metadata_builders(
                     attn_backend,
                     layer_names,
@@ -3714,7 +3961,8 @@ def create_attn_groups(
                     self.vllm_config,
                     self.device,
                     num_metadata_builders=1
-                    if not self.parallel_config.enable_dbo else 2,
+                    if not self.parallel_config.enable_dbo
+                    else 2,
                 )
 
                 attn_groups.append(attn_group)
@@ -3729,7 +3977,7 @@ def create_attn_groups(
 
     def initialize_cudagraph_capture(self) -> None:
         """
-        Resolve the cudagraph_mode when there are multiple attention 
+        Resolve the cudagraph_mode when there are multiple attention
         backends with potential conflicting CUDA graph support.
         Then initialize the cudagraph_dispatcher based on the resolved
         cudagraph_mode.
@@ -3745,81 +3993,110 @@ def initialize_cudagraph_capture(self) -> None:
         # Flexible resolve the cudagraph mode
         cudagraph_mode = self.compilation_config.cudagraph_mode
         # check cudagraph for mixed batch is supported
-        if cudagraph_mode.mixed_mode() == CUDAGraphMode.FULL \
-            and min_cg_support != AttentionCGSupport.ALWAYS:
-            msg = (f"CUDAGraphMode.{cudagraph_mode.name} is not supported "
-                   f"with {min_cg_builder_name} backend (support: "
-                   f"{min_cg_support})")
+        if (
+            cudagraph_mode.mixed_mode() == CUDAGraphMode.FULL
+            and min_cg_support != AttentionCGSupport.ALWAYS
+        ):
+            msg = (
+                f"CUDAGraphMode.{cudagraph_mode.name} is not supported "
+                f"with {min_cg_builder_name} backend (support: "
+                f"{min_cg_support})"
+            )
             if min_cg_support == AttentionCGSupport.NEVER:
                 # if not supported any full cudagraphs, just raise it.
-                msg += "; please try cudagraph_mode=PIECEWISE, and "\
+                msg += (
+                    "; please try cudagraph_mode=PIECEWISE, and "
                     "make sure compilation level is piecewise"
+                )
                 raise ValueError(msg)
 
             # attempt to resolve the full cudagraph related mode
             if self.compilation_config.splitting_ops_contain_attention():
                 msg += "; setting cudagraph_mode=FULL_AND_PIECEWISE"
-                cudagraph_mode = self.compilation_config.cudagraph_mode = \
+                cudagraph_mode = self.compilation_config.cudagraph_mode = (
                     CUDAGraphMode.FULL_AND_PIECEWISE
+                )
             else:
                 msg += "; setting cudagraph_mode=FULL_DECODE_ONLY"
-                cudagraph_mode = self.compilation_config.cudagraph_mode = \
+                cudagraph_mode = self.compilation_config.cudagraph_mode = (
                     CUDAGraphMode.FULL_DECODE_ONLY
+                )
             logger.warning(msg)
 
         # check that if we are doing decode full-cudagraphs it is supported
-        if (cudagraph_mode.decode_mode() == CUDAGraphMode.FULL
-                and min_cg_support == AttentionCGSupport.NEVER):
-            msg = (f"CUDAGraphMode.{cudagraph_mode.name} is not supported "
-                   f"with {min_cg_builder_name} backend (support: "
-                   f"{min_cg_support})")
-            if (self.compilation_config.level == CompilationLevel.PIECEWISE and
-                (self.compilation_config.splitting_ops_contain_attention()
-                 or self.compilation_config.use_inductor_graph_partition)):
-                msg += "; setting cudagraph_mode=PIECEWISE because "\
+        if (
+            cudagraph_mode.decode_mode() == CUDAGraphMode.FULL
+            and min_cg_support == AttentionCGSupport.NEVER
+        ):
+            msg = (
+                f"CUDAGraphMode.{cudagraph_mode.name} is not supported "
+                f"with {min_cg_builder_name} backend (support: "
+                f"{min_cg_support})"
+            )
+            if self.compilation_config.level == CompilationLevel.PIECEWISE and (
+                self.compilation_config.splitting_ops_contain_attention()
+                or self.compilation_config.use_inductor_graph_partition
+            ):
+                msg += (
+                    "; setting cudagraph_mode=PIECEWISE because "
                     "attention is compiled piecewise"
-                cudagraph_mode = self.compilation_config.cudagraph_mode = \
+                )
+                cudagraph_mode = self.compilation_config.cudagraph_mode = (
                     CUDAGraphMode.PIECEWISE
+                )
             else:
-                msg += "; setting cudagraph_mode=NONE because "\
+                msg += (
+                    "; setting cudagraph_mode=NONE because "
                     "attention is not compiled piecewise"
-                cudagraph_mode = self.compilation_config.cudagraph_mode = \
+                )
+                cudagraph_mode = self.compilation_config.cudagraph_mode = (
                     CUDAGraphMode.NONE
+                )
             logger.warning(msg)
 
         # check that if we are doing spec-decode + decode full-cudagraphs it is
         # supported
-        if (cudagraph_mode.decode_mode() == CUDAGraphMode.FULL
-                and self.uniform_decode_query_len > 1 and min_cg_support.value
-                < AttentionCGSupport.UNIFORM_BATCH.value):
-            msg = (f"CUDAGraphMode.{cudagraph_mode.name} is not supported"
-                   f" with spec-decode for attention backend "
-                   f"{min_cg_builder_name} (support: {min_cg_support})")
+        if (
+            cudagraph_mode.decode_mode() == CUDAGraphMode.FULL
+            and self.uniform_decode_query_len > 1
+            and min_cg_support.value < AttentionCGSupport.UNIFORM_BATCH.value
+        ):
+            msg = (
+                f"CUDAGraphMode.{cudagraph_mode.name} is not supported"
+                f" with spec-decode for attention backend "
+                f"{min_cg_builder_name} (support: {min_cg_support})"
+            )
             if self.compilation_config.splitting_ops_contain_attention():
                 msg += "; setting cudagraph_mode=PIECEWISE"
-                cudagraph_mode = self.compilation_config.cudagraph_mode = \
+                cudagraph_mode = self.compilation_config.cudagraph_mode = (
                     CUDAGraphMode.PIECEWISE
+                )
             else:
                 msg += "; setting cudagraph_mode=NONE"
-                cudagraph_mode = self.compilation_config.cudagraph_mode = \
+                cudagraph_mode = self.compilation_config.cudagraph_mode = (
                     CUDAGraphMode.NONE
+                )
             logger.warning(msg)
 
         # double check that we can support full cudagraph if they are requested
         # even after automatic downgrades
-        if cudagraph_mode.has_full_cudagraphs() \
-            and min_cg_support == AttentionCGSupport.NEVER:
-            raise ValueError(f"CUDAGraphMode.{cudagraph_mode.name} is not "
-                             f"supported with {min_cg_builder_name} backend ("
-                             f"support:{min_cg_support}) "
-                             "; please try cudagraph_mode=PIECEWISE, "
-                             "and make sure compilation level is piecewise")
+        if (
+            cudagraph_mode.has_full_cudagraphs()
+            and min_cg_support == AttentionCGSupport.NEVER
+        ):
+            raise ValueError(
+                f"CUDAGraphMode.{cudagraph_mode.name} is not "
+                f"supported with {min_cg_builder_name} backend ("
+                f"support:{min_cg_support}) "
+                "; please try cudagraph_mode=PIECEWISE, "
+                "and make sure compilation level is piecewise"
+            )
 
         # Trigger cudagraph dispatching keys initialization here (after
         # initializing attn backends).
         self.cudagraph_dispatcher.initialize_cudagraph_keys(
-            self.compilation_config.cudagraph_mode,
-            self.uniform_decode_query_len)
+            self.compilation_config.cudagraph_mode, self.uniform_decode_query_len
+        )
 
     def calculate_reorder_batch_threshold(self) -> None:
         """
@@ -3831,22 +4108,20 @@ def calculate_reorder_batch_threshold(self) -> None:
 
             # check that if any backends reorder batches; that the reordering
             # is compatible (e.g., decode threshold is the same)
-            reorder_batch_threshold_i = (
-                attn_metadata_builder_i.reorder_batch_threshold)
+            reorder_batch_threshold_i = attn_metadata_builder_i.reorder_batch_threshold
             if reorder_batch_threshold_i is not None:
                 if self.reorder_batch_threshold is not None:
-                    if reorder_batch_threshold_i != \
-                        self.reorder_batch_threshold:
+                    if reorder_batch_threshold_i != self.reorder_batch_threshold:
                         raise ValueError(
                             f"Attention backend reorders decodes with "
                             f"threshold {reorder_batch_threshold_i} but other "
                             f"backend uses threshold "
-                            f"{self.reorder_batch_threshold}")
+                            f"{self.reorder_batch_threshold}"
+                        )
                 else:
                     self.reorder_batch_threshold = reorder_batch_threshold_i
 
-    def may_reinitialize_input_batch(self,
-                                     kv_cache_config: KVCacheConfig) -> None:
+    def may_reinitialize_input_batch(self, kv_cache_config: KVCacheConfig) -> None:
         """
         Re-initialize the input batch if the block sizes are different from
         `[self.cache_config.block_size]`. This usually happens when there
@@ -3863,7 +4138,8 @@ def may_reinitialize_input_batch(self,
             assert self.cache_config.cpu_offload_gb == 0, (
                 "Cannot re-initialize the input batch when CPU weight "
                 "offloading is enabled. See https://github.com/vllm-project/vllm/pull/18298 "  # noqa: E501
-                "for more details.")
+                "for more details."
+            )
             self.input_batch = InputBatch(
                 max_num_reqs=self.max_num_reqs,
                 max_model_len=max(self.max_model_len, self.max_encoder_len),
@@ -3877,11 +4153,14 @@ def may_reinitialize_input_batch(self,
                 is_pooling_model=self.is_pooling_model,
                 num_speculative_tokens=(
                     self.vllm_config.speculative_config.num_speculative_tokens
-                    if self.vllm_config.speculative_config else 0),
+                    if self.vllm_config.speculative_config
+                    else 0
+                ),
             )
 
     def _allocate_kv_cache_tensors(
-            self, kv_cache_config: KVCacheConfig) -> dict[str, torch.Tensor]:
+        self, kv_cache_config: KVCacheConfig
+    ) -> dict[str, torch.Tensor]:
         """
         Initializes the KV cache buffer with the correct size. The buffer needs
         to be reshaped to the desired shape before being used by the models.
@@ -3891,12 +4170,12 @@ def _allocate_kv_cache_tensors(
         Returns:
             dict[str, torch.Tensor]: A map between layer names to their
             corresponding memory buffer for KV cache.
-         """
+        """
         kv_cache_raw_tensors: dict[str, torch.Tensor] = {}
         for kv_cache_tensor in kv_cache_config.kv_cache_tensors:
-            tensor = torch.zeros(kv_cache_tensor.size,
-                                 dtype=torch.int8,
-                                 device=self.device)
+            tensor = torch.zeros(
+                kv_cache_tensor.size, dtype=torch.int8, device=self.device
+            )
             for layer_name in kv_cache_tensor.shared_by:
                 kv_cache_raw_tensors[layer_name] = tensor
 
@@ -3906,8 +4185,9 @@ def _allocate_kv_cache_tensors(
                 if layer_name in self.runner_only_attn_layers:
                     continue
                 layer_names.add(layer_name)
-        assert layer_names == set(kv_cache_raw_tensors.keys(
-        )), "Some layers are not correctly initialized"
+        assert layer_names == set(kv_cache_raw_tensors.keys()), (
+            "Some layers are not correctly initialized"
+        )
         return kv_cache_raw_tensors
 
     def _attn_group_iterator(self) -> Iterator[AttentionGroup]:
@@ -3945,8 +4225,7 @@ def _reshape_kv_cache_tensors(
                     continue
                 raw_tensor = kv_cache_raw_tensors[layer_name]
                 assert raw_tensor.numel() % kv_cache_spec.page_size_bytes == 0
-                num_blocks = (raw_tensor.numel() //
-                              kv_cache_spec.page_size_bytes)
+                num_blocks = raw_tensor.numel() // kv_cache_spec.page_size_bytes
                 if isinstance(kv_cache_spec, AttentionSpec):
                     has_attn = True
                     kv_cache_shape = attn_backend.get_kv_cache_shape(
@@ -3954,41 +4233,43 @@ def _reshape_kv_cache_tensors(
                         kv_cache_spec.block_size,
                         kv_cache_spec.num_kv_heads,
                         kv_cache_spec.head_size,
-                        cache_dtype_str=self.cache_config.cache_dtype)
+                        cache_dtype_str=self.cache_config.cache_dtype,
+                    )
                     dtype = kv_cache_spec.dtype
                     try:
-                        kv_cache_stride_order = \
-                            attn_backend.get_kv_cache_stride_order()
-                        assert len(kv_cache_stride_order) == len(
-                            kv_cache_shape)
+                        kv_cache_stride_order = attn_backend.get_kv_cache_stride_order()
+                        assert len(kv_cache_stride_order) == len(kv_cache_shape)
                     except (AttributeError, NotImplementedError):
-                        kv_cache_stride_order = tuple(
-                            range(len(kv_cache_shape)))
+                        kv_cache_stride_order = tuple(range(len(kv_cache_shape)))
                     # The allocation respects the backend-defined stride order
                     # to ensure the semantic remains consistent for each
                     # backend. We first obtain the generic kv cache shape and
                     # then permute it according to the stride order which could
                     # result in a non-contiguous tensor.
-                    kv_cache_shape = tuple(kv_cache_shape[i]
-                                           for i in kv_cache_stride_order)
+                    kv_cache_shape = tuple(
+                        kv_cache_shape[i] for i in kv_cache_stride_order
+                    )
                     # Maintain original KV shape view.
                     inv_order = [
                         kv_cache_stride_order.index(i)
                         for i in range(len(kv_cache_stride_order))
                     ]
-                    kv_caches[layer_name] = kv_cache_raw_tensors[
-                        layer_name].view(dtype).view(kv_cache_shape).permute(
-                            *inv_order)
+                    kv_caches[layer_name] = (
+                        kv_cache_raw_tensors[layer_name]
+                        .view(dtype)
+                        .view(kv_cache_shape)
+                        .permute(*inv_order)
+                    )
                 elif isinstance(kv_cache_spec, MambaSpec):
                     has_mamba = True
                     raw_tensor = kv_cache_raw_tensors[layer_name]
                     state_tensors = []
                     storage_offset_bytes = 0
-                    for (shape, dtype) in zip(kv_cache_spec.shapes,
-                                              kv_cache_spec.dtypes):
+                    for shape, dtype in zip(kv_cache_spec.shapes, kv_cache_spec.dtypes):
                         dtype_size = get_dtype_size(dtype)
                         num_element_per_page = (
-                            kv_cache_spec.page_size_bytes // dtype_size)
+                            kv_cache_spec.page_size_bytes // dtype_size
+                        )
                         target_shape = (num_blocks, *shape)
                         stride = torch.empty(target_shape).stride()
                         target_stride = (num_element_per_page, *stride[1:])
@@ -4012,7 +4293,8 @@ def _reshape_kv_cache_tensors(
         return kv_caches
 
     def _update_hybrid_attention_mamba_layout(
-            self, kv_caches: dict[str, torch.Tensor]) -> None:
+        self, kv_caches: dict[str, torch.Tensor]
+    ) -> None:
         """
         Update the layout of attention layers from (2, num_blocks, ...) to
         (num_blocks, 2, ...).
@@ -4025,19 +4307,21 @@ def _update_hybrid_attention_mamba_layout(
             kv_cache_spec = group.kv_cache_spec
             for layer_name in group.layer_names:
                 kv_cache = kv_caches[layer_name]
-                if (isinstance(kv_cache_spec, AttentionSpec)
-                        and kv_cache.shape[0] == 2):
-                    assert kv_cache.shape[1] != 2, \
-                        "Fail to determine whether the layout is " \
-                        "(2, num_blocks, ...) or (num_blocks, 2, ...) for " \
+                if isinstance(kv_cache_spec, AttentionSpec) and kv_cache.shape[0] == 2:
+                    assert kv_cache.shape[1] != 2, (
+                        "Fail to determine whether the layout is "
+                        "(2, num_blocks, ...) or (num_blocks, 2, ...) for "
                         f"a tensor of shape {kv_cache.shape}"
+                    )
                     hidden_size = kv_cache.shape[2:].numel()
-                    kv_cache.as_strided_(size=kv_cache.shape,
-                                         stride=(hidden_size, 2 * hidden_size,
-                                                 *kv_cache.stride()[2:]))
+                    kv_cache.as_strided_(
+                        size=kv_cache.shape,
+                        stride=(hidden_size, 2 * hidden_size, *kv_cache.stride()[2:]),
+                    )
 
     def initialize_kv_cache_tensors(
-            self, kv_cache_config: KVCacheConfig) -> dict[str, torch.Tensor]:
+        self, kv_cache_config: KVCacheConfig
+    ) -> dict[str, torch.Tensor]:
         """
         Initialize the memory buffer for KV cache.
 
@@ -4050,25 +4334,29 @@ def initialize_kv_cache_tensors(
         # Initialize the memory buffer for KV cache
         kv_cache_raw_tensors = self._allocate_kv_cache_tensors(kv_cache_config)
         # Change the memory buffer to the desired shape
-        kv_caches = self._reshape_kv_cache_tensors(kv_cache_config,
-                                                   kv_cache_raw_tensors)
+        kv_caches = self._reshape_kv_cache_tensors(
+            kv_cache_config, kv_cache_raw_tensors
+        )
 
         # Set up cross-layer KV cache sharing
-        for layer_name, target_layer_name in self.shared_kv_cache_layers.items(
-        ):
-            logger.debug("%s reuses KV cache of %s", layer_name,
-                         target_layer_name)
+        for layer_name, target_layer_name in self.shared_kv_cache_layers.items():
+            logger.debug("%s reuses KV cache of %s", layer_name, target_layer_name)
             kv_caches[layer_name] = kv_caches[target_layer_name]
 
-        num_attn_module = 2 \
-            if self.model_config.hf_config.model_type == "longcat_flash" else 1
-        bind_kv_cache(kv_caches,
-                      self.compilation_config.static_forward_context,
-                      self.kv_caches, num_attn_module)
+        num_attn_module = (
+            2 if self.model_config.hf_config.model_type == "longcat_flash" else 1
+        )
+        bind_kv_cache(
+            kv_caches,
+            self.compilation_config.static_forward_context,
+            self.kv_caches,
+            num_attn_module,
+        )
         return kv_caches
 
     def maybe_add_kv_sharing_layers_to_kv_cache_groups(
-            self, kv_cache_config: KVCacheConfig) -> None:
+        self, kv_cache_config: KVCacheConfig
+    ) -> None:
         """
         Add layers that re-use KV cache to KV cache group of its target layer.
         Mapping of KV cache tensors happens in `initialize_kv_cache_tensors()`
@@ -4087,12 +4375,10 @@ def maybe_add_kv_sharing_layers_to_kv_cache_groups(
             # In You Only Cache Once (https://arxiv.org/abs/2405.05254) or other
             # similar KV sharing setups, only the layers that generate KV caches
             # are involved in the prefill phase, enabling prefill to early exit.
-            attn_layers = get_layers_from_vllm_config(self.vllm_config,
-                                                      Attention)
+            attn_layers = get_layers_from_vllm_config(self.vllm_config, Attention)
             for layer_name in reversed(attn_layers):
                 if layer_name in self.shared_kv_cache_layers:
-                    self.kv_sharing_fast_prefill_eligible_layers.add(
-                        layer_name)
+                    self.kv_sharing_fast_prefill_eligible_layers.add(layer_name)
                 else:
                     break
 
@@ -4124,23 +4410,23 @@ def initialize_kv_cache(self, kv_cache_config: KVCacheConfig) -> None:
 
         if self.dcp_world_size > 1:
             layer_names = self.attn_groups[0][0].layer_names
-            layers = get_layers_from_vllm_config(self.vllm_config,
-                                                 AttentionLayerBase,
-                                                 layer_names)
+            layers = get_layers_from_vllm_config(
+                self.vllm_config, AttentionLayerBase, layer_names
+            )
             for layer in layers.values():
                 assert layer.impl.need_to_return_lse_for_decode, (
                     "DCP requires attention impls to return"
                     " the softmax lse for decode, but the impl "
                     f"{layer.impl.__class__.__name__} "
-                    "does not return the softmax lse for decode.")
+                    "does not return the softmax lse for decode."
+                )
 
     def may_add_encoder_only_layers_to_kv_cache_config(self) -> None:
         """
         Add encoder-only layers to the KV cache config.
         """
         block_size = self.vllm_config.cache_config.block_size
-        encoder_only_attn_specs: dict[AttentionSpec,
-                                      list[str]] = defaultdict(list)
+        encoder_only_attn_specs: dict[AttentionSpec, list[str]] = defaultdict(list)
         attn_layers = get_layers_from_vllm_config(self.vllm_config, Attention)
         for layer_name, attn_module in attn_layers.items():
             if attn_module.attn_type == AttentionType.ENCODER_ONLY:
@@ -4148,16 +4434,18 @@ def may_add_encoder_only_layers_to_kv_cache_config(self) -> None:
                     block_size=block_size,
                     num_kv_heads=attn_module.num_kv_heads,
                     head_size=attn_module.head_size,
-                    dtype=self.kv_cache_dtype)
+                    dtype=self.kv_cache_dtype,
+                )
                 encoder_only_attn_specs[attn_spec].append(layer_name)
                 self.runner_only_attn_layers.add(layer_name)
         if len(encoder_only_attn_specs) > 0:
-            assert len(
-                encoder_only_attn_specs
-            ) == 1, "Only support one encoder-only attention spec now"
+            assert len(encoder_only_attn_specs) == 1, (
+                "Only support one encoder-only attention spec now"
+            )
             spec, layer_names = encoder_only_attn_specs.popitem()
             self.kv_cache_config.kv_cache_groups.append(
-                KVCacheGroupSpec(layer_names=layer_names, kv_cache_spec=spec))
+                KVCacheGroupSpec(layer_names=layer_names, kv_cache_spec=spec)
+            )
 
     def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
         """
@@ -4174,8 +4462,7 @@ def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
         kv_cache_spec: dict[str, KVCacheSpec] = {}
         attn_layers = get_layers_from_vllm_config(self.vllm_config, Attention)
         for layer_name, attn_module in attn_layers.items():
-            if (kv_tgt_layer :=
-                    attn_module.kv_sharing_target_layer_name) is not None:
+            if (kv_tgt_layer := attn_module.kv_sharing_target_layer_name) is not None:
                 # The layer doesn't need its own KV cache and will use that of
                 # the target layer. We skip creating a KVCacheSpec for it, so
                 # that KV cache management logic will act as this layer does
@@ -4190,59 +4477,67 @@ def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
             # the attention backends
             if attn_module.attn_type == AttentionType.DECODER:
                 if attn_module.sliding_window is not None:
-                    assert not use_mla, "MLA is not supported for sliding" \
-                        "window"
+                    assert not use_mla, "MLA is not supported for slidingwindow"
                     kv_cache_spec[layer_name] = SlidingWindowSpec(
                         block_size=block_size,
                         num_kv_heads=attn_module.num_kv_heads,
                         head_size=attn_module.head_size,
                         dtype=self.kv_cache_dtype,
-                        sliding_window=attn_module.sliding_window)
+                        sliding_window=attn_module.sliding_window,
+                    )
                 elif use_mla:
                     kv_cache_spec[layer_name] = MLAAttentionSpec(
                         block_size=block_size,
                         num_kv_heads=attn_module.num_kv_heads,
                         head_size=attn_module.head_size,
                         dtype=self.kv_cache_dtype,
-                        cache_dtype_str=cache_dtype_str)
-                elif self.attention_chunk_size is not None \
-                        and isinstance(attn_module, ChunkedLocalAttention):
+                        cache_dtype_str=cache_dtype_str,
+                    )
+                elif self.attention_chunk_size is not None and isinstance(
+                    attn_module, ChunkedLocalAttention
+                ):
                     kv_cache_spec[layer_name] = ChunkedLocalAttentionSpec(
                         block_size=block_size,
                         num_kv_heads=attn_module.num_kv_heads,
                         head_size=attn_module.head_size,
                         dtype=self.kv_cache_dtype,
-                        attention_chunk_size=self.attention_chunk_size)
+                        attention_chunk_size=self.attention_chunk_size,
+                    )
                 else:
                     kv_cache_spec[layer_name] = FullAttentionSpec(
                         block_size=block_size,
                         num_kv_heads=attn_module.num_kv_heads,
                         head_size=attn_module.head_size,
-                        dtype=self.kv_cache_dtype)
+                        dtype=self.kv_cache_dtype,
+                    )
             elif attn_module.attn_type == AttentionType.ENCODER_DECODER:
                 kv_cache_spec[layer_name] = CrossAttentionSpec(
                     block_size=block_size,
                     num_kv_heads=attn_module.num_kv_heads,
                     head_size=attn_module.head_size,
-                    dtype=self.kv_cache_dtype)
-            elif attn_module.attn_type in (AttentionType.ENCODER,
-                                           AttentionType.ENCODER_ONLY):
+                    dtype=self.kv_cache_dtype,
+                )
+            elif attn_module.attn_type in (
+                AttentionType.ENCODER,
+                AttentionType.ENCODER_ONLY,
+            ):
                 # encoder-only attention does not need KV cache.
                 continue
             else:
-                raise ValueError(
-                    f"Unknown attention type: {attn_module.attn_type}")
+                raise ValueError(f"Unknown attention type: {attn_module.attn_type}")
 
         mamba_layers = get_layers_from_vllm_config(self.vllm_config, MambaBase)
         if len(mamba_layers) > 0:
-            if (self.vllm_config.speculative_config is not None
-                    and self.vllm_config.model_config.hf_config.model_type
-                    not in ["qwen3_next"]):
+            if (
+                self.vllm_config.speculative_config is not None
+                and self.vllm_config.model_config.hf_config.model_type
+                not in ["qwen3_next"]
+            ):
                 raise NotImplementedError(
-                    "Mamba with speculative decoding is not supported yet.")
+                    "Mamba with speculative decoding is not supported yet."
+                )
             mamba_block_size = self.vllm_config.cache_config.mamba_block_size
-            page_size_padded = (
-                self.vllm_config.cache_config.mamba_page_size_padded)
+            page_size_padded = self.vllm_config.cache_config.mamba_page_size_padded
 
             for layer_name, mamba_module in mamba_layers.items():
                 kv_cache_spec[layer_name] = MambaSpec(
@@ -4253,10 +4548,13 @@ def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
                     mamba_type=mamba_module.mamba_type,
                     num_speculative_blocks=(
                         self.speculative_config.num_speculative_tokens
-                        if self.speculative_config else 0),
+                        if self.speculative_config
+                        else 0
+                    ),
                 )
         ds_indexer_layers = get_layers_from_vllm_config(
-            self.vllm_config, DeepseekV32IndexerCache)
+            self.vllm_config, DeepseekV32IndexerCache
+        )
         for layer_name, ds_indexer_module in ds_indexer_layers.items():
             kv_cache_spec[layer_name] = ds_indexer_module.get_kv_cache_spec()
 
@@ -4271,7 +4569,7 @@ def _to_list(self, sampled_token_ids: torch.Tensor) -> list[list[int]]:
         # this is in the critical path of every single model
         # forward loop, this has caused perf issue for a disagg
         # setup.
-        pinned = self.sampled_token_ids_pinned_cpu[:sampled_token_ids.shape[0]]
+        pinned = self.sampled_token_ids_pinned_cpu[: sampled_token_ids.shape[0]]
         pinned.copy_(sampled_token_ids, non_blocking=True)
         self.transfer_event.record()
         self.transfer_event.synchronize()
diff --git a/vllm/v1/worker/gpu_ubatch_wrapper.py b/vllm/v1/worker/gpu_ubatch_wrapper.py
index 39be8c74102e..3bd7c9d538de 100644
--- a/vllm/v1/worker/gpu_ubatch_wrapper.py
+++ b/vllm/v1/worker/gpu_ubatch_wrapper.py
@@ -11,10 +11,12 @@
 from vllm.compilation.cuda_graph import CUDAGraphWrapper
 from vllm.config import CUDAGraphMode, VllmConfig
 from vllm.distributed import get_ep_group
-from vllm.distributed.device_communicators.pynccl_allocator import (
-    set_graph_pool_id)
-from vllm.forward_context import (create_forward_context, get_forward_context,
-                                  override_forward_context)
+from vllm.distributed.device_communicators.pynccl_allocator import set_graph_pool_id
+from vllm.forward_context import (
+    create_forward_context,
+    get_forward_context,
+    override_forward_context,
+)
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 from vllm.sequence import IntermediateTensors
@@ -42,27 +44,31 @@ class CUDAGraphMetaData:
 
 
 class SMControlContextManager:
-
-    def __init__(self, comm_sms: int, set_comm_sms: Callable[[int], None],
-                 set_compute_sms: Callable[[int], None]):
+    def __init__(
+        self,
+        comm_sms: int,
+        set_comm_sms: Callable[[int], None],
+        set_compute_sms: Callable[[int], None],
+    ):
         """
-        Context manager for controlling SM (Streaming Multiprocessor) 
+        Context manager for controlling SM (Streaming Multiprocessor)
         allocation. Upon entering the context, it sets the number of SMs
         allocated for communication and computation to comm_sms and
         total_sms - comm_sms respectively. Upon exiting, it restores the
         allocation to use all available SMs (i.e. total_sms).
 
         Args:
-            comm_sms (int): The number of SMs to allocate for communication. 
+            comm_sms (int): The number of SMs to allocate for communication.
                 (The remainder will be used for computation.)
-            set_comm_sms (Callable[[int], None]): 
+            set_comm_sms (Callable[[int], None]):
                 A function that sets the number of SMs for communication.
-            set_compute_sms (Callable[[int], None]): 
+            set_compute_sms (Callable[[int], None]):
                 A function that sets the number of SMs for computation.
         """
 
-        assert current_platform.is_cuda(), \
+        assert current_platform.is_cuda(), (
             "SM control is currently only supported on CUDA"
+        )
 
         props = torch.cuda.get_device_properties(torch.cuda.current_device())
         total_sms = props.multi_processor_count
@@ -84,9 +90,13 @@ def __exit__(self, exc_type, exc_value, traceback):
 
 
 class UBatchWrapper:
-
-    def __init__(self, runnable: Callable, vllm_config: VllmConfig,
-                 runtime_mode: CUDAGraphMode, device: torch.cuda.device):
+    def __init__(
+        self,
+        runnable: Callable,
+        vllm_config: VllmConfig,
+        runtime_mode: CUDAGraphMode,
+        device: torch.cuda.device,
+    ):
         self.runnable = runnable
         self.vllm_config = vllm_config
         self.compilation_config = vllm_config.compilation_config
@@ -100,7 +110,8 @@ def __init__(self, runnable: Callable, vllm_config: VllmConfig,
         self.graph_pool = None
         if runtime_mode is not CUDAGraphMode.NONE:
             self.cudagraph_wrapper = CUDAGraphWrapper(
-                runnable, vllm_config, runtime_mode=runtime_mode)
+                runnable, vllm_config, runtime_mode=runtime_mode
+            )
             self.graph_pool = current_platform.get_global_graph_pool()
 
         self.sm_control = self._create_sm_control_context(vllm_config)
@@ -114,8 +125,7 @@ def _create_sm_control_context(vllm_config: VllmConfig):
         if vllm_config.parallel_config.enable_expert_parallel:
             # Currently only DeepEP highthroughput supports SM control so this
             # only affects that case.
-            all2all_manager = get_ep_group(
-            ).device_communicator.all2all_manager
+            all2all_manager = get_ep_group().device_communicator.all2all_manager
 
             if all2all_manager.max_sms_used() is not None:
                 comm_sms = min(comm_sms, all2all_manager.max_sms_used())
@@ -127,18 +137,23 @@ def _create_sm_control_context(vllm_config: VllmConfig):
         set_compute_sms = lambda sms: None
         if has_deep_gemm() and comm_sms > 0:
             import deep_gemm as dg
+
             set_compute_sms = lambda sms: dg.set_num_sms(sms)
 
-        return SMControlContextManager(comm_sms=comm_sms,
-                                       set_comm_sms=set_comm_sms,
-                                       set_compute_sms=set_compute_sms)
+        return SMControlContextManager(
+            comm_sms=comm_sms,
+            set_comm_sms=set_comm_sms,
+            set_compute_sms=set_compute_sms,
+        )
 
     def __getattr__(self, key: str):
         # allow accessing the attributes of the runnable.
         if hasattr(self.runnable, key):
             return getattr(self.runnable, key)
-        raise AttributeError(f"Attribute {key} not exists in the runnable of "
-                             f"cudagraph wrapper: {self.runnable}")
+        raise AttributeError(
+            f"Attribute {key} not exists in the runnable of "
+            f"cudagraph wrapper: {self.runnable}"
+        )
 
     def unwrap(self) -> Callable:
         # in case we need to access the original runnable.
@@ -153,14 +168,14 @@ def _capture_ubatches(self, ubatch_metadata, model) -> torch.Tensor:
         the graph capture.
 
         The flow is as follows:
-        1. The main thread starts up each ubatch thread. Each thread will 
+        1. The main thread starts up each ubatch thread. Each thread will
         initialize its cuda context (torch.cuda.current_blas_handle())
         before going to sleep upon entering the ubatch_context.
 
-        2. The main thread starts the graph capture and wakes up the first 
+        2. The main thread starts the graph capture and wakes up the first
         ubatch thread.
 
-        3. Each ubatch thread runs the model to completion and returns the 
+        3. Each ubatch thread runs the model to completion and returns the
         completed output tensors back to the main thread.
 
         4. The main thread stores the captured cudagraph along with its metadata
@@ -187,36 +202,38 @@ def _capture_ubatch_thread(results, ubatch_metadata):
 
         results: list[tuple[int, torch.Tensor]] = []
         compute_stream = ubatch_metadata[0].context.compute_stream
-        num_tokens = ubatch_metadata[0].num_tokens + \
-            ubatch_metadata[1].num_tokens
+        num_tokens = ubatch_metadata[0].num_tokens + ubatch_metadata[1].num_tokens
 
         # Ubatches will manually manage the forward context, so we override
         # it to None here so we can have it restored correctly later
         with override_forward_context(None):
             ubatch_threads = []
             for metadata in ubatch_metadata:
-                thread = threading.Thread(target=_capture_ubatch_thread,
-                                          args=(
-                                              results,
-                                              metadata,
-                                          ))
+                thread = threading.Thread(
+                    target=_capture_ubatch_thread,
+                    args=(
+                        results,
+                        metadata,
+                    ),
+                )
                 ubatch_threads.append(thread)
                 thread.start()
             self.ready_barrier.wait()  # Wait for both threads to be ready
 
             # Capture the cudagraph
-            cudagraph_metadata = \
-                CUDAGraphMetaData(
-                            cudagraph=torch.cuda.CUDAGraph(),
-                            ubatch_metadata=ubatch_metadata,
-                        )
+            cudagraph_metadata = CUDAGraphMetaData(
+                cudagraph=torch.cuda.CUDAGraph(),
+                ubatch_metadata=ubatch_metadata,
+            )
             if self.graph_pool is not None:
                 set_graph_pool_id(self.graph_pool)
             else:
                 set_graph_pool_id(current_platform.graph_pool_handle())
-            with torch.cuda.graph(cudagraph_metadata.cudagraph,
-                                  stream=compute_stream,
-                                  pool=self.graph_pool):
+            with torch.cuda.graph(
+                cudagraph_metadata.cudagraph,
+                stream=compute_stream,
+                pool=self.graph_pool,
+            ):
                 ubatch_metadata[0].context.cpu_wait_event.set()
                 for thread in ubatch_threads:
                     thread.join()
@@ -227,7 +244,6 @@ def _capture_ubatch_thread(results, ubatch_metadata):
         return cudagraph_metadata.outputs
 
     def _run_ubatches(self, ubatch_metadata, model) -> torch.Tensor:
-
         @torch.inference_mode()
         def _ubatch_thread(results, model, ubatch_metadata):
             with ubatch_metadata.context:
@@ -247,12 +263,14 @@ def _ubatch_thread(results, model, ubatch_metadata):
         with override_forward_context(None):
             ubatch_threads = []
             for metadata in ubatch_metadata:
-                thread = threading.Thread(target=_ubatch_thread,
-                                          args=(
-                                              results,
-                                              model,
-                                              metadata,
-                                          ))
+                thread = threading.Thread(
+                    target=_ubatch_thread,
+                    args=(
+                        results,
+                        model,
+                        metadata,
+                    ),
+                )
                 ubatch_threads.append(thread)
                 thread.start()
             self.ready_barrier.wait()  # Wait for both threads to be ready
@@ -263,11 +281,19 @@ def _ubatch_thread(results, model, ubatch_metadata):
         result = torch.cat(sorted_results, dim=0)
         return result
 
-    def _make_ubatch_metadata(self, ubatch_slices, attn_metadata, input_ids,
-                              positions, inputs_embeds, intermediate_tensors,
-                              compute_stream, dp_metadata, batch_descriptor,
-                              cudagraph_runtime_mode) -> list[UbatchMetadata]:
-
+    def _make_ubatch_metadata(
+        self,
+        ubatch_slices,
+        attn_metadata,
+        input_ids,
+        positions,
+        inputs_embeds,
+        intermediate_tensors,
+        compute_stream,
+        dp_metadata,
+        batch_descriptor,
+        cudagraph_runtime_mode,
+    ) -> list[UbatchMetadata]:
         # Create one forward context per ubatch
         forward_contexts = []
         for i, ubatch_slice in enumerate(ubatch_slices):
@@ -277,22 +303,32 @@ def _make_ubatch_metadata(self, ubatch_slices, attn_metadata, input_ids,
                     self.vllm_config,
                     dp_metadata=dp_metadata,
                     batch_descriptor=batch_descriptor,
-                    cudagraph_runtime_mode=cudagraph_runtime_mode))
+                    cudagraph_runtime_mode=cudagraph_runtime_mode,
+                )
+            )
 
         ubatch_ctxs = make_ubatch_contexts(
             num_micro_batches=len(ubatch_slices),
             comm_stream=self.comm_stream,
             compute_stream=compute_stream,
             forward_contexts=forward_contexts,
-            ready_barrier=self.ready_barrier)
+            ready_barrier=self.ready_barrier,
+        )
 
         ubatch_metadata: list[UbatchMetadata] = []
         for i, ubatch_slice in enumerate(ubatch_slices):
-            sliced_input_ids, sliced_positions, sliced_inputs_embeds, \
-            sliced_intermediate_tensors = \
-                self._slice_model_inputs(
-                    ubatch_slice.token_slice, input_ids, positions,
-                    inputs_embeds, intermediate_tensors)
+            (
+                sliced_input_ids,
+                sliced_positions,
+                sliced_inputs_embeds,
+                sliced_intermediate_tensors,
+            ) = self._slice_model_inputs(
+                ubatch_slice.token_slice,
+                input_ids,
+                positions,
+                inputs_embeds,
+                intermediate_tensors,
+            )
             ubatch_metadata.append(
                 UbatchMetadata(
                     context=ubatch_ctxs[i],
@@ -300,13 +336,21 @@ def _make_ubatch_metadata(self, ubatch_slices, attn_metadata, input_ids,
                     positions=sliced_positions,
                     inputs_embeds=sliced_inputs_embeds,
                     intermediate_tensors=sliced_intermediate_tensors,
-                    num_tokens=ubatch_slice.token_slice.stop -
-                    ubatch_slice.token_slice.start))
+                    num_tokens=ubatch_slice.token_slice.stop
+                    - ubatch_slice.token_slice.start,
+                )
+            )
 
         return ubatch_metadata
 
-    def _slice_model_inputs(self, tokens_slice: slice, input_ids, positions,
-                            inputs_embeds, intermediate_tensors):
+    def _slice_model_inputs(
+        self,
+        tokens_slice: slice,
+        input_ids,
+        positions,
+        inputs_embeds,
+        intermediate_tensors,
+    ):
         sliced_input_ids = input_ids[tokens_slice]
         # if we are using mrope. Mrope adds an additional dimension to the
         # positions tensor
@@ -314,13 +358,17 @@ def _slice_model_inputs(self, tokens_slice: slice, input_ids, positions,
             sliced_positions = positions[:, tokens_slice]
         else:
             sliced_positions = positions[tokens_slice]
-        sliced_inputs_embeds = inputs_embeds[
-            tokens_slice] if inputs_embeds else None
-        sliced_intermediate_tensors = intermediate_tensors[
-            tokens_slice] if intermediate_tensors else None
-
-        return (sliced_input_ids, sliced_positions, sliced_inputs_embeds,
-                sliced_intermediate_tensors)
+        sliced_inputs_embeds = inputs_embeds[tokens_slice] if inputs_embeds else None
+        sliced_intermediate_tensors = (
+            intermediate_tensors[tokens_slice] if intermediate_tensors else None
+        )
+
+        return (
+            sliced_input_ids,
+            sliced_positions,
+            sliced_inputs_embeds,
+            sliced_intermediate_tensors,
+        )
 
     def __call__(self, *args, **kwargs):
         forward_context = get_forward_context()
@@ -330,7 +378,6 @@ def __call__(self, *args, **kwargs):
 
         # If there's no ubatching, just run the runnable object
         if ubatch_slices is None:
-
             # This is to account for the case where ubatching was aborted.
             # When we capture full graphs we only capture one graph per shape,
             # meaning that if we have a ubatched  cudagraph for the current
@@ -342,20 +389,20 @@ def __call__(self, *args, **kwargs):
                 if batch_descriptor.num_tokens in self.cudagraphs:
                     cudagraph_runtime_mode = CUDAGraphMode.NONE
 
-            if cudagraph_runtime_mode in (CUDAGraphMode.NONE,
-                                          CUDAGraphMode.PIECEWISE):
+            if cudagraph_runtime_mode in (CUDAGraphMode.NONE, CUDAGraphMode.PIECEWISE):
                 return self.runnable(*args, **kwargs)
             else:
                 assert self.cudagraph_wrapper is not None
                 return self.cudagraph_wrapper(*args, **kwargs)
 
         attn_metadata = forward_context.attn_metadata
-        num_tokens = (ubatch_slices[0].token_slice.stop -
-                      ubatch_slices[0].token_slice.start) * 2
-        input_ids = kwargs['input_ids']
-        positions = kwargs['positions']
-        intermediate_tensors = kwargs['intermediate_tensors']
-        inputs_embeds = kwargs['inputs_embeds']
+        num_tokens = (
+            ubatch_slices[0].token_slice.stop - ubatch_slices[0].token_slice.start
+        ) * 2
+        input_ids = kwargs["input_ids"]
+        positions = kwargs["positions"]
+        intermediate_tensors = kwargs["intermediate_tensors"]
+        inputs_embeds = kwargs["inputs_embeds"]
         compute_stream = torch.cuda.current_stream()
 
         dp_metadata = forward_context.dp_metadata
@@ -363,8 +410,10 @@ def __call__(self, *args, **kwargs):
         # We shouldn't be here unless we are running with multiple DP ranks
         assert dp_metadata is not None
 
-        if num_tokens not in self.cudagraphs \
-            and cudagraph_runtime_mode is CUDAGraphMode.FULL:
+        if (
+            num_tokens not in self.cudagraphs
+            and cudagraph_runtime_mode is CUDAGraphMode.FULL
+        ):
             ubatch_metadata = self._make_ubatch_metadata(
                 ubatch_slices=ubatch_slices,
                 attn_metadata=attn_metadata,
@@ -375,11 +424,14 @@ def __call__(self, *args, **kwargs):
                 compute_stream=compute_stream,
                 dp_metadata=dp_metadata,
                 batch_descriptor=batch_descriptor,
-                cudagraph_runtime_mode=CUDAGraphMode.NONE)
+                cudagraph_runtime_mode=CUDAGraphMode.NONE,
+            )
             with self.sm_control:
                 return self._capture_ubatches(ubatch_metadata, self.model)
-        elif num_tokens in self.cudagraphs \
-            and cudagraph_runtime_mode is CUDAGraphMode.FULL:
+        elif (
+            num_tokens in self.cudagraphs
+            and cudagraph_runtime_mode is CUDAGraphMode.FULL
+        ):
             cudagraph_metadata = self.cudagraphs[num_tokens]
             cudagraph_metadata.cudagraph.replay()
             return cudagraph_metadata.outputs
@@ -394,6 +446,7 @@ def __call__(self, *args, **kwargs):
                 compute_stream=compute_stream,
                 dp_metadata=dp_metadata,
                 batch_descriptor=batch_descriptor,
-                cudagraph_runtime_mode=CUDAGraphMode.NONE)
+                cudagraph_runtime_mode=CUDAGraphMode.NONE,
+            )
             with self.sm_control:
                 return self._run_ubatches(ubatch_metadata, self.model)
diff --git a/vllm/v1/worker/gpu_worker.py b/vllm/v1/worker/gpu_worker.py
index a135a594ac6f..271aabb9e227 100644
--- a/vllm/v1/worker/gpu_worker.py
+++ b/vllm/v1/worker/gpu_worker.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """A GPU worker class."""
+
 import copy
 import gc
 import os
@@ -13,9 +14,11 @@
 
 import vllm.envs as envs
 from vllm.config import VllmConfig
-from vllm.distributed import (ensure_model_parallel_initialized,
-                              init_distributed_environment,
-                              set_custom_all_reduce)
+from vllm.distributed import (
+    ensure_model_parallel_initialized,
+    init_distributed_environment,
+    set_custom_all_reduce,
+)
 from vllm.distributed.kv_transfer import ensure_kv_transfer_initialized
 from vllm.distributed.parallel_state import get_pp_group, get_tp_group
 from vllm.logger import init_logger
@@ -28,8 +31,12 @@
 from vllm.utils import GiB_bytes, MemorySnapshot, memory_profiling
 from vllm.v1.engine import ReconfigureDistributedRequest, ReconfigureRankType
 from vllm.v1.kv_cache_interface import KVCacheConfig, KVCacheSpec
-from vllm.v1.outputs import (EMPTY_MODEL_RUNNER_OUTPUT, AsyncModelRunnerOutput,
-                             DraftTokenIds, ModelRunnerOutput)
+from vllm.v1.outputs import (
+    EMPTY_MODEL_RUNNER_OUTPUT,
+    AsyncModelRunnerOutput,
+    DraftTokenIds,
+    ModelRunnerOutput,
+)
 from vllm.v1.utils import report_usage_stats
 from vllm.v1.worker.gpu_model_runner import GPUModelRunner
 from vllm.v1.worker.utils import is_residual_scattered_for_sp
@@ -43,7 +50,6 @@
 
 
 class Worker(WorkerBase):
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -52,16 +58,18 @@ def __init__(
         distributed_init_method: str,
         is_driver_worker: bool = False,
     ):
-
-        super().__init__(vllm_config=vllm_config,
-                         local_rank=local_rank,
-                         rank=rank,
-                         distributed_init_method=distributed_init_method,
-                         is_driver_worker=is_driver_worker)
+        super().__init__(
+            vllm_config=vllm_config,
+            local_rank=local_rank,
+            rank=rank,
+            distributed_init_method=distributed_init_method,
+            is_driver_worker=is_driver_worker,
+        )
 
         if self.model_config.trust_remote_code:
             # note: lazy import to avoid importing torch before initializing
             from vllm.utils import init_cached_hf_modules
+
             init_cached_hf_modules()
 
         # Buffers saved before sleep
@@ -71,8 +79,10 @@ def __init__(
         # VLLM_TORCH_PROFILER_DIR=/path/to/save/trace
         if envs.VLLM_TORCH_PROFILER_DIR:
             torch_profiler_trace_dir = envs.VLLM_TORCH_PROFILER_DIR
-            logger.info("Profiling enabled. Traces will be saved to: %s",
-                        torch_profiler_trace_dir)
+            logger.info(
+                "Profiling enabled. Traces will be saved to: %s",
+                torch_profiler_trace_dir,
+            )
             logger.debug(
                 "Profiler config: record_shapes=%s,"
                 "profile_memory=%s,with_stack=%s,with_flops=%s",
@@ -91,7 +101,9 @@ def __init__(
                 with_stack=envs.VLLM_TORCH_PROFILER_WITH_STACK,
                 with_flops=envs.VLLM_TORCH_PROFILER_WITH_FLOPS,
                 on_trace_ready=torch.profiler.tensorboard_trace_handler(
-                    torch_profiler_trace_dir, use_gzip=True))
+                    torch_profiler_trace_dir, use_gzip=True
+                ),
+            )
         else:
             self.profiler = None
 
@@ -104,20 +116,20 @@ def sleep(self, level: int = 1) -> None:
         if level == 2:
             model = self.model_runner.model
             self._sleep_saved_buffers = {
-                name: buffer.cpu().clone()
-                for name, buffer in model.named_buffers()
+                name: buffer.cpu().clone() for name, buffer in model.named_buffers()
             }
 
         allocator = CuMemAllocator.get_instance()
-        allocator.sleep(offload_tags=("weights", ) if level == 1 else tuple())
+        allocator.sleep(offload_tags=("weights",) if level == 1 else tuple())
         free_bytes_after_sleep, total = torch.cuda.mem_get_info()
         freed_bytes = free_bytes_after_sleep - free_bytes_before_sleep
         used_bytes = total - free_bytes_after_sleep
         assert freed_bytes >= 0, "Memory usage increased after sleeping."
         logger.info(
-            "Sleep mode freed %.2f GiB memory, "
-            "%.2f GiB memory is still in use.", freed_bytes / GiB_bytes,
-            used_bytes / GiB_bytes)
+            "Sleep mode freed %.2f GiB memory, %.2f GiB memory is still in use.",
+            freed_bytes / GiB_bytes,
+            used_bytes / GiB_bytes,
+        )
 
     def wake_up(self, tags: Optional[list[str]] = None) -> None:
         from vllm.device_allocator.cumem import CuMemAllocator
@@ -133,23 +145,21 @@ def wake_up(self, tags: Optional[list[str]] = None) -> None:
                     buffer.data.copy_(self._sleep_saved_buffers[name].data)
             self._sleep_saved_buffers = {}
 
-    def _maybe_get_memory_pool_context(self,
-                                       tag: str) -> AbstractContextManager:
+    def _maybe_get_memory_pool_context(self, tag: str) -> AbstractContextManager:
         if self.vllm_config.model_config.enable_sleep_mode:
             from vllm.device_allocator.cumem import CuMemAllocator
 
             allocator = CuMemAllocator.get_instance()
             if tag == "weights":
                 assert allocator.get_current_usage() == 0, (
-                    "Sleep mode can only be "
-                    "used for one instance per process.")
+                    "Sleep mode can only be used for one instance per process."
+                )
             context = allocator.use_memory_pool(tag=tag)
         else:
             context = nullcontext()
         return context
 
-    def initialize_cache(self, num_gpu_blocks: int,
-                         num_cpu_blocks: int) -> None:
+    def initialize_cache(self, num_gpu_blocks: int, num_cpu_blocks: int) -> None:
         self.cache_config.num_gpu_blocks = num_gpu_blocks
         self.cache_config.num_cpu_blocks = num_cpu_blocks
 
@@ -166,10 +176,13 @@ def init_device(self):
             # memory snapshot
             # This ensures NCCL buffers are allocated before we measure
             # available memory
-            init_worker_distributed_environment(self.vllm_config, self.rank,
-                                                self.distributed_init_method,
-                                                self.local_rank,
-                                                current_platform.dist_backend)
+            init_worker_distributed_environment(
+                self.vllm_config,
+                self.rank,
+                self.distributed_init_method,
+                self.local_rank,
+                current_platform.dist_backend,
+            )
 
             # Set random seed.
             set_random_seed(self.model_config.seed)
@@ -180,8 +193,10 @@ def init_device(self):
 
             # take current memory snapshot
             self.init_snapshot = MemorySnapshot()
-            self.requested_memory = (self.init_snapshot.total_memory *
-                                     self.cache_config.gpu_memory_utilization)
+            self.requested_memory = (
+                self.init_snapshot.total_memory
+                * self.cache_config.gpu_memory_utilization
+            )
             if self.init_snapshot.free_memory < self.requested_memory:
                 GiB = lambda b: round(b / GiB_bytes, 2)
                 raise ValueError(
@@ -194,12 +209,12 @@ def init_device(self):
                     f"utilization or reduce GPU memory used by other processes."
                 )
         else:
-            raise RuntimeError(
-                f"Not support device type: {self.device_config.device}")
+            raise RuntimeError(f"Not support device type: {self.device_config.device}")
 
         # Construct the model runner
         self.model_runner: GPUModelRunner = GPUModelRunner(
-            self.vllm_config, self.device)
+            self.vllm_config, self.device
+        )
 
         if self.rank == 0:
             # If usage stat is enabled, collect relevant info.
@@ -247,7 +262,8 @@ def determine_available_memory(self) -> int:
                 "size. If OOM'ed, check the difference of initial free "
                 "memory between the current run and the previous run "
                 "where kv_cache_memory_bytes is suggested and update it "
-                "correspondingly.")
+                "correspondingly."
+            )
             logger.info(msg)
             return kv_cache_memory_bytes
 
@@ -257,8 +273,8 @@ def determine_available_memory(self) -> int:
         # Execute a forward pass with dummy inputs to profile the memory usage
         # of the model.
         with memory_profiling(
-                self.init_snapshot,
-                weights_memory=int(self.model_runner.model_memory_usage),
+            self.init_snapshot,
+            weights_memory=int(self.model_runner.model_memory_usage),
         ) as profile_result:
             self.model_runner.profile_run()
 
@@ -275,15 +291,15 @@ def determine_available_memory(self) -> int:
             "This happens when other processes sharing the same container "
             "release GPU memory while vLLM is profiling during initialization. "
             "To fix this, ensure consistent GPU memory allocation or "
-            "isolate vLLM in its own container.")
-        self.available_kv_cache_memory_bytes = self.requested_memory \
-            - profile_result.non_kv_cache_memory
+            "isolate vLLM in its own container."
+        )
+        self.available_kv_cache_memory_bytes = (
+            self.requested_memory - profile_result.non_kv_cache_memory
+        )
 
-        unrequested_memory = self.init_snapshot.free_memory \
-            - self.requested_memory
+        unrequested_memory = self.init_snapshot.free_memory - self.requested_memory
         logger.debug(
-            "Initial free memory: %.2f GiB; "
-            "Requested memory: %.2f (util), %.2f GiB",
+            "Initial free memory: %.2f GiB; Requested memory: %.2f (util), %.2f GiB",
             GiB(self.init_snapshot.free_memory),
             self.cache_config.gpu_memory_utilization,
             GiB(self.requested_memory),
@@ -295,8 +311,10 @@ def determine_available_memory(self) -> int:
             GiB(free_gpu_memory - unrequested_memory),
         )
         logger.debug(profile_result)
-        logger.info("Available KV cache memory: %.2f GiB",
-                    GiB(self.available_kv_cache_memory_bytes))
+        logger.info(
+            "Available KV cache memory: %.2f GiB",
+            GiB(self.available_kv_cache_memory_bytes),
+        )
         gc.collect()
 
         return int(self.available_kv_cache_memory_bytes)
@@ -324,15 +342,14 @@ def compile_or_warm_up_model(self) -> None:
         warmup_sizes = self.vllm_config.compilation_config.compile_sizes.copy()
         if not self.model_config.enforce_eager:
             warmup_sizes = [
-                x for x in warmup_sizes if x not in
-                self.vllm_config.compilation_config.cudagraph_capture_sizes
+                x
+                for x in warmup_sizes
+                if x not in self.vllm_config.compilation_config.cudagraph_capture_sizes
             ]
         # We skip EPLB here since we don't want to record dummy metrics
         for size in sorted(warmup_sizes, reverse=True):
             logger.info("Compile and warming up model for size %d", size)
-            self.model_runner._dummy_run(size,
-                                         skip_eplb=True,
-                                         remove_lora=False)
+            self.model_runner._dummy_run(size, skip_eplb=True, remove_lora=False)
         self.model_runner.maybe_remove_all_loras(self.model_runner.lora_config)
 
         # Warmup and tune the kernels used during model execution before
@@ -343,8 +360,9 @@ def compile_or_warm_up_model(self) -> None:
         if not self.model_config.enforce_eager:
             cuda_graph_memory_bytes = self.model_runner.capture_model()
 
-        if (self.cache_config.kv_cache_memory_bytes is None
-                and hasattr(self, "peak_activation_memory")):
+        if self.cache_config.kv_cache_memory_bytes is None and hasattr(
+            self, "peak_activation_memory"
+        ):
             # Suggests optimal kv cache memory size if we rely on
             # memory_profiling to guess the kv cache memory size which
             # provides peak_activation_memory and a few other memory
@@ -358,16 +376,22 @@ def compile_or_warm_up_model(self) -> None:
             # slightly underestimate the memory consumption.
             # So leave a small buffer (=150MiB) to avoid OOM.
             redundancy_buffer_memory = 150 * (1 << 20)
-            non_kv_cache_memory = (self.model_runner.model_memory_usage +
-                                   self.peak_activation_memory +
-                                   self.non_torch_memory +
-                                   cuda_graph_memory_bytes)
+            non_kv_cache_memory = (
+                self.model_runner.model_memory_usage
+                + self.peak_activation_memory
+                + self.non_torch_memory
+                + cuda_graph_memory_bytes
+            )
             kv_cache_memory_bytes_to_gpu_limit = (
-                self.init_snapshot.free_memory - non_kv_cache_memory -
-                redundancy_buffer_memory)
+                self.init_snapshot.free_memory
+                - non_kv_cache_memory
+                - redundancy_buffer_memory
+            )
             kv_cache_memory_bytes_to_requested_limit = (
-                int(self.requested_memory) - non_kv_cache_memory -
-                redundancy_buffer_memory)
+                int(self.requested_memory)
+                - non_kv_cache_memory
+                - redundancy_buffer_memory
+            )
 
             msg = (
                 f"Free memory on device "
@@ -388,7 +412,8 @@ def compile_or_warm_up_model(self) -> None:
                 f"{kv_cache_memory_bytes_to_gpu_limit}` "
                 f"({GiB(kv_cache_memory_bytes_to_gpu_limit)} GiB) to fully "
                 f"utilize gpu memory. Current kv cache memory in use is "
-                f"{GiB(self.available_kv_cache_memory_bytes)} GiB.")
+                f"{GiB(self.available_kv_cache_memory_bytes)} GiB."
+            )
 
             logger.debug(msg)
 
@@ -398,20 +423,20 @@ def compile_or_warm_up_model(self) -> None:
         # NOTE: This is called after `capture_model` on purpose to prevent
         # memory buffers from being cleared by `torch.cuda.empty_cache`.
         if get_pp_group().is_last_rank:
-            max_num_reqs = min(self.scheduler_config.max_num_seqs,
-                               self.scheduler_config.max_num_batched_tokens)
+            max_num_reqs = min(
+                self.scheduler_config.max_num_seqs,
+                self.scheduler_config.max_num_batched_tokens,
+            )
 
             # We skip EPLB here since we don't want to record dummy metrics
-            hidden_states, last_hidden_states = \
-                self.model_runner._dummy_run(
-                    num_tokens=max_num_reqs,
-                    skip_eplb=True,
-                )
+            hidden_states, last_hidden_states = self.model_runner._dummy_run(
+                num_tokens=max_num_reqs,
+                skip_eplb=True,
+            )
             if self.model_runner.is_pooling_model:
                 self.model_runner._dummy_pooler_run(hidden_states)
             else:
-                self.model_runner._dummy_sampler_run(
-                    hidden_states=last_hidden_states)
+                self.model_runner._dummy_sampler_run(hidden_states=last_hidden_states)
 
         # Reset the seed to ensure that the random state is not affected by
         # the model initialization and profiling.
@@ -431,32 +456,36 @@ def execute_model(
         intermediate_tensors = None
         forward_pass = scheduler_output.total_num_scheduled_tokens > 0
         num_scheduled_tokens = scheduler_output.total_num_scheduled_tokens
-        num_input_tokens = self.model_runner._get_num_input_tokens(
-            num_scheduled_tokens)
+        num_input_tokens = self.model_runner._get_num_input_tokens(num_scheduled_tokens)
         all_gather_tensors = {
-            "residual":
-            not is_residual_scattered_for_sp(self.vllm_config,
-                                             num_input_tokens)
+            "residual": not is_residual_scattered_for_sp(
+                self.vllm_config, num_input_tokens
+            )
         }
         if forward_pass and not get_pp_group().is_first_rank:
             intermediate_tensors = IntermediateTensors(
                 get_pp_group().recv_tensor_dict(
                     all_gather_group=get_tp_group(),
-                    all_gather_tensors=all_gather_tensors))
+                    all_gather_tensors=all_gather_tensors,
+                )
+            )
 
-        output = self.model_runner.execute_model(scheduler_output,
-                                                 intermediate_tensors)
+        output = self.model_runner.execute_model(scheduler_output, intermediate_tensors)
         if isinstance(output, (ModelRunnerOutput, AsyncModelRunnerOutput)):
             return output
 
         assert isinstance(output, IntermediateTensors)
         parallel_config = self.vllm_config.parallel_config
-        assert parallel_config.distributed_executor_backend != (
-            "external_launcher") and not get_pp_group().is_last_rank
+        assert (
+            parallel_config.distributed_executor_backend != ("external_launcher")
+            and not get_pp_group().is_last_rank
+        )
 
-        get_pp_group().send_tensor_dict(output.tensors,
-                                        all_gather_group=get_tp_group(),
-                                        all_gather_tensors=all_gather_tensors)
+        get_pp_group().send_tensor_dict(
+            output.tensors,
+            all_gather_group=get_tp_group(),
+            all_gather_tensors=all_gather_tensors,
+        )
 
         kv_connector_output = output.kv_connector_output
         if not kv_connector_output:
@@ -483,8 +512,9 @@ def profile(self, is_start: bool = True):
             self.profiler.stop()
             # only print profiler results on rank 0
             if self.local_rank == 0:
-                print(self.profiler.key_averages().table(
-                    sort_by="self_cuda_time_total"))
+                print(
+                    self.profiler.key_averages().table(sort_by="self_cuda_time_total")
+                )
 
     def execute_dummy_batch(self) -> None:
         self.model_runner._dummy_run(1, uniform_decode=True)
@@ -505,68 +535,79 @@ def check_health(self) -> None:
         # worker will always be healthy as long as it's running.
         return
 
-    def _eplb_before_scale_down(self, old_ep_size: int,
-                                new_ep_size: int) -> None:
+    def _eplb_before_scale_down(self, old_ep_size: int, new_ep_size: int) -> None:
         from vllm.distributed.parallel_state import get_ep_group
+
         if get_ep_group().rank == 0:
-            logger.info("[Elastic EP] Starting expert resharding "
-                        "before scaling down...")
+            logger.info(
+                "[Elastic EP] Starting expert resharding before scaling down..."
+            )
         rank_mapping = {
             old_ep_rank: old_ep_rank if old_ep_rank < new_ep_size else -1
             for old_ep_rank in range(old_ep_size)
         }
         assert self.model_runner.eplb_state is not None
-        self.model_runner.eplb_state.rearrange(self.model_runner.model,
-                                               execute_shuffle=True,
-                                               global_expert_load=None,
-                                               rank_mapping=rank_mapping)
+        self.model_runner.eplb_state.rearrange(
+            self.model_runner.model,
+            execute_shuffle=True,
+            global_expert_load=None,
+            rank_mapping=rank_mapping,
+        )
         torch.cuda.synchronize()
         if get_ep_group().rank == 0:
             logger.info("[Elastic EP] Expert resharding completed!")
 
     def _eplb_after_scale_up(
-            self, old_ep_size: int, new_ep_size: int,
-            global_expert_load: Optional[torch.Tensor]) -> None:
+        self,
+        old_ep_size: int,
+        new_ep_size: int,
+        global_expert_load: Optional[torch.Tensor],
+    ) -> None:
         from vllm.distributed.parallel_state import get_ep_group
+
         if get_ep_group().rank == 0:
-            logger.info("[Elastic EP] Starting expert resharding "
-                        "after scaling up...")
-        rank_mapping = {
-            old_ep_rank: old_ep_rank
-            for old_ep_rank in range(old_ep_size)
-        }
+            logger.info("[Elastic EP] Starting expert resharding after scaling up...")
+        rank_mapping = {old_ep_rank: old_ep_rank for old_ep_rank in range(old_ep_size)}
         assert self.model_runner.eplb_state is not None
         self.model_runner.eplb_state.rearrange(
             self.model_runner.model,
             execute_shuffle=True,
             global_expert_load=global_expert_load,
-            rank_mapping=rank_mapping)
+            rank_mapping=rank_mapping,
+        )
         if get_ep_group().rank == 0:
             logger.info("[Elastic EP] Expert resharding completed!")
 
     def _reconfigure_parallel_config(
-            self, reconfig_request: ReconfigureDistributedRequest) -> None:
+        self, reconfig_request: ReconfigureDistributedRequest
+    ) -> None:
         """
         Update parallel config with provided reconfig_request
         """
         parallel_config = self.vllm_config.parallel_config
-        parallel_config.data_parallel_size = \
-            reconfig_request.new_data_parallel_size
-        if reconfig_request.new_data_parallel_rank != \
-        ReconfigureRankType.KEEP_CURRENT_RANK:
-            parallel_config.data_parallel_rank = \
-                reconfig_request.new_data_parallel_rank
-        if reconfig_request.new_data_parallel_rank_local != \
-        ReconfigureRankType.KEEP_CURRENT_RANK:
-            parallel_config.data_parallel_rank_local = \
+        parallel_config.data_parallel_size = reconfig_request.new_data_parallel_size
+        if (
+            reconfig_request.new_data_parallel_rank
+            != ReconfigureRankType.KEEP_CURRENT_RANK
+        ):
+            parallel_config.data_parallel_rank = reconfig_request.new_data_parallel_rank
+        if (
+            reconfig_request.new_data_parallel_rank_local
+            != ReconfigureRankType.KEEP_CURRENT_RANK
+        ):
+            parallel_config.data_parallel_rank_local = (
                 reconfig_request.new_data_parallel_rank_local
-        parallel_config.data_parallel_master_ip = \
+            )
+        parallel_config.data_parallel_master_ip = (
             reconfig_request.new_data_parallel_master_ip
-        parallel_config.data_parallel_master_port = \
+        )
+        parallel_config.data_parallel_master_port = (
             reconfig_request.new_data_parallel_master_port
+        )
 
-    def _reconfigure_moe(self, old_ep_size: int,
-                         new_ep_size: int) -> Optional[torch.Tensor]:
+    def _reconfigure_moe(
+        self, old_ep_size: int, new_ep_size: int
+    ) -> Optional[torch.Tensor]:
         """
         Reconfigure MoE modules with provided reconfig_request
 
@@ -574,20 +615,26 @@ def _reconfigure_moe(self, old_ep_size: int,
         otherwise None
         """
         from vllm.distributed.parallel_state import (
-            get_dp_group, get_ep_group, prepare_communication_buffer_for_model)
-        from vllm.model_executor.layers.fused_moe.layer import (
-            FusedMoEParallelConfig)
+            get_dp_group,
+            get_ep_group,
+            prepare_communication_buffer_for_model,
+        )
+        from vllm.model_executor.layers.fused_moe.layer import FusedMoEParallelConfig
 
         parallel_config = self.vllm_config.parallel_config
         moe_modules = [
-            module for module in self.model_runner.model.modules()
-            if (module.__class__.__name__ == "FusedMoE"
-                or module.__class__.__name__ == "SharedFusedMoE")
+            module
+            for module in self.model_runner.model.modules()
+            if (
+                module.__class__.__name__ == "FusedMoE"
+                or module.__class__.__name__ == "SharedFusedMoE"
+            )
         ]
         num_local_experts = moe_modules[0].moe_config.num_local_experts
-        assert all(module.moe_config.num_local_experts == num_local_experts
-                   for module in moe_modules), (
-                       "All MoE modules must have the same number of experts")
+        assert all(
+            module.moe_config.num_local_experts == num_local_experts
+            for module in moe_modules
+        ), "All MoE modules must have the same number of experts"
         for module in moe_modules:
             module.moe_config.num_experts = num_local_experts * new_ep_size
             module.global_num_experts = module.moe_config.num_experts
@@ -600,49 +647,62 @@ def _reconfigure_moe(self, old_ep_size: int,
         if new_ep_size < old_ep_size:
             num_local_physical_experts = num_local_experts
             assert self.model_runner.eplb_state is not None
-            new_physical_experts = \
+            new_physical_experts = (
                 self.model_runner.eplb_state.physical_to_logical_map.shape[1]
+            )
             parallel_config.eplb_config.num_redundant_experts = (
-                new_physical_experts -
-                self.model_runner.eplb_state.logical_replica_count.shape[1])
+                new_physical_experts
+                - self.model_runner.eplb_state.logical_replica_count.shape[1]
+            )
             global_expert_load = None
         else:
-            num_local_physical_experts = torch.tensor([num_local_experts],
-                                                      dtype=torch.int32,
-                                                      device="cpu")
-            torch.distributed.broadcast(num_local_physical_experts,
-                                        group=get_ep_group().cpu_group,
-                                        group_src=0)
+            num_local_physical_experts = torch.tensor(
+                [num_local_experts], dtype=torch.int32, device="cpu"
+            )
+            torch.distributed.broadcast(
+                num_local_physical_experts, group=get_ep_group().cpu_group, group_src=0
+            )
             num_local_physical_experts = num_local_physical_experts.item()
             new_physical_experts = num_local_physical_experts * new_ep_size
             assert self.model_runner.eplb_state is not None
             global_expert_load = self.model_runner.eplb_state.rearrange(
-                self.model_runner.model, execute_shuffle=False)
+                self.model_runner.model, execute_shuffle=False
+            )
             parallel_config.eplb_config.num_redundant_experts = (
-                new_physical_experts - global_expert_load.shape[1])
+                new_physical_experts - global_expert_load.shape[1]
+            )
         prepare_communication_buffer_for_model(self.model_runner.model)
         self.model_runner.model.update_physical_experts_metadata(
             num_physical_experts=new_physical_experts,
-            num_local_physical_experts=num_local_physical_experts)
+            num_local_physical_experts=num_local_physical_experts,
+        )
         return global_expert_load
 
     def reinitialize_distributed(
-            self, reconfig_request: ReconfigureDistributedRequest) -> None:
+        self, reconfig_request: ReconfigureDistributedRequest
+    ) -> None:
         from vllm.config import set_current_vllm_config
         from vllm.distributed.parallel_state import (
-            cleanup_dist_env_and_memory, get_ep_group)
+            cleanup_dist_env_and_memory,
+            get_ep_group,
+        )
 
         old_ep_size = get_ep_group().world_size
         old_ep_rank = get_ep_group().rank
-        new_ep_size = reconfig_request.new_data_parallel_size * get_tp_group(
-        ).world_size * get_pp_group().world_size
+        new_ep_size = (
+            reconfig_request.new_data_parallel_size
+            * get_tp_group().world_size
+            * get_pp_group().world_size
+        )
         if new_ep_size < old_ep_size:
             self._eplb_before_scale_down(old_ep_size, new_ep_size)
 
         cleanup_dist_env_and_memory()
 
-        if reconfig_request.new_data_parallel_rank == \
-        ReconfigureRankType.SHUTDOWN_CURRENT_RANK:
+        if (
+            reconfig_request.new_data_parallel_rank
+            == ReconfigureRankType.SHUTDOWN_CURRENT_RANK
+        ):
             assert old_ep_rank >= new_ep_size
             # shutdown
             return
@@ -650,16 +710,18 @@ def reinitialize_distributed(
         self._reconfigure_parallel_config(reconfig_request)
 
         with set_current_vllm_config(self.vllm_config):
-            init_worker_distributed_environment(self.vllm_config, self.rank,
-                                                self.distributed_init_method,
-                                                self.local_rank)
+            init_worker_distributed_environment(
+                self.vllm_config,
+                self.rank,
+                self.distributed_init_method,
+                self.local_rank,
+            )
 
         global_expert_load = self._reconfigure_moe(old_ep_size, new_ep_size)
 
         if new_ep_size > old_ep_size:
             assert global_expert_load is not None
-            self._eplb_after_scale_up(old_ep_size, new_ep_size,
-                                      global_expert_load)
+            self._eplb_after_scale_up(old_ep_size, new_ep_size, global_expert_load)
 
     def save_sharded_state(
         self,
@@ -668,6 +730,7 @@ def save_sharded_state(
         max_size: Optional[int] = None,
     ) -> None:
         from vllm.model_executor.model_loader import ShardedStateLoader
+
         ShardedStateLoader.save_model(
             self.model_runner.model,
             path,
@@ -680,7 +743,8 @@ def save_tensorized_model(
         tensorizer_config: "TensorizerConfig",
     ) -> None:
         self.model_runner.save_tensorized_model(
-            tensorizer_config=tensorizer_config, )
+            tensorizer_config=tensorizer_config,
+        )
 
     def shutdown(self) -> None:
         if runner := getattr(self, "model_runner", None):
@@ -698,12 +762,14 @@ def init_worker_distributed_environment(
     parallel_config = vllm_config.parallel_config
     set_custom_all_reduce(not parallel_config.disable_custom_all_reduce)
 
-    init_distributed_environment(parallel_config.world_size, rank,
-                                 distributed_init_method, local_rank, backend)
+    init_distributed_environment(
+        parallel_config.world_size, rank, distributed_init_method, local_rank, backend
+    )
 
     ensure_model_parallel_initialized(
         parallel_config.tensor_parallel_size,
         parallel_config.pipeline_parallel_size,
-        parallel_config.decode_context_parallel_size)
+        parallel_config.decode_context_parallel_size,
+    )
 
     ensure_kv_transfer_initialized(vllm_config)
diff --git a/vllm/v1/worker/kv_connector_model_runner_mixin.py b/vllm/v1/worker/kv_connector_model_runner_mixin.py
index cdc0d317fffb..473982bebb12 100644
--- a/vllm/v1/worker/kv_connector_model_runner_mixin.py
+++ b/vllm/v1/worker/kv_connector_model_runner_mixin.py
@@ -3,22 +3,30 @@
 """
 Define KV connector functionality mixin for model runners.
 """
+
 import copy
+from collections.abc import Generator
 from contextlib import AbstractContextManager, contextmanager, nullcontext
-from typing import Generator  # noqa: UP035
-from typing import TYPE_CHECKING, Optional
+from typing import (
+    TYPE_CHECKING,  # noqa: UP035
+    Optional,
+)
 
 from vllm.config import VllmConfig
-from vllm.distributed.kv_transfer import (ensure_kv_transfer_shutdown,
-                                          get_kv_transfer_group,
-                                          has_kv_transfer_group)
+from vllm.distributed.kv_transfer import (
+    ensure_kv_transfer_shutdown,
+    get_kv_transfer_group,
+    has_kv_transfer_group,
+)
 from vllm.distributed.kv_transfer.kv_connector.base import KVConnectorBase
-from vllm.distributed.kv_transfer.kv_connector.v1.metrics import (
-    KVConnectorStats)
+from vllm.distributed.kv_transfer.kv_connector.v1.metrics import KVConnectorStats
 from vllm.forward_context import get_forward_context, set_forward_context
 from vllm.logger import init_logger
-from vllm.v1.outputs import (EMPTY_MODEL_RUNNER_OUTPUT, KVConnectorOutput,
-                             ModelRunnerOutput)
+from vllm.v1.outputs import (
+    EMPTY_MODEL_RUNNER_OUTPUT,
+    KVConnectorOutput,
+    ModelRunnerOutput,
+)
 
 if TYPE_CHECKING:
     from vllm.v1.core.sched.output import SchedulerOutput
@@ -28,7 +36,6 @@
 
 # Defined as a kv connector functionality mixin for ModelRunner (GPU, TPU)
 class KVConnectorModelRunnerMixin:
-
     @staticmethod
     def maybe_setup_kv_connector(scheduler_output: "SchedulerOutput"):
         # Update KVConnector with the KVConnector metadata forward().
@@ -36,8 +43,7 @@ def maybe_setup_kv_connector(scheduler_output: "SchedulerOutput"):
             kv_connector = get_kv_transfer_group()
             assert isinstance(kv_connector, KVConnectorBase)
             assert scheduler_output.kv_connector_metadata is not None
-            kv_connector.bind_connector_metadata(
-                scheduler_output.kv_connector_metadata)
+            kv_connector.bind_connector_metadata(scheduler_output.kv_connector_metadata)
 
             # Background KV cache transfers happen here.
             # These transfers are designed to be async and the requests
@@ -62,17 +68,21 @@ def get_finished_kv_transfers(
     ) -> tuple[Optional[set[str]], Optional[set[str]]]:
         if has_kv_transfer_group():
             return get_kv_transfer_group().get_finished(
-                scheduler_output.finished_req_ids)
+                scheduler_output.finished_req_ids
+            )
         return None, None
 
     @staticmethod
-    def kv_connector_no_forward(scheduler_output: "SchedulerOutput",
-                                vllm_config: VllmConfig) -> ModelRunnerOutput:
+    def kv_connector_no_forward(
+        scheduler_output: "SchedulerOutput", vllm_config: VllmConfig
+    ) -> ModelRunnerOutput:
         # KV send/recv even if no work to do.
-        with set_forward_context(
-                None, vllm_config
-        ), KVConnectorModelRunnerMixin._get_kv_connector_output(
-                scheduler_output, wait_for_save=False) as kv_connector_output:
+        with (
+            set_forward_context(None, vllm_config),
+            KVConnectorModelRunnerMixin._get_kv_connector_output(
+                scheduler_output, wait_for_save=False
+            ) as kv_connector_output,
+        ):
             pass
 
         if kv_connector_output.is_empty():
@@ -84,18 +94,20 @@ def kv_connector_no_forward(scheduler_output: "SchedulerOutput",
 
     @staticmethod
     def maybe_get_kv_connector_output(
-        scheduler_output: "SchedulerOutput"
+        scheduler_output: "SchedulerOutput",
     ) -> AbstractContextManager[Optional[KVConnectorOutput]]:
-        return KVConnectorModelRunnerMixin._get_kv_connector_output(
-            scheduler_output) if has_kv_transfer_group() else nullcontext()
+        return (
+            KVConnectorModelRunnerMixin._get_kv_connector_output(scheduler_output)
+            if has_kv_transfer_group()
+            else nullcontext()
+        )
 
     # This context manager must be used within an active forward context.
     # It encapsulates the entire KV connector lifecycle within execute_model
     @staticmethod
     @contextmanager
     def _get_kv_connector_output(
-        scheduler_output: "SchedulerOutput",
-        wait_for_save: bool = True
+        scheduler_output: "SchedulerOutput", wait_for_save: bool = True
     ) -> Generator[KVConnectorOutput, None, None]:
         output = KVConnectorOutput()
 
@@ -103,8 +115,7 @@ def _get_kv_connector_output(
         kv_connector = get_kv_transfer_group()
         assert isinstance(kv_connector, KVConnectorBase)
         assert scheduler_output.kv_connector_metadata is not None
-        kv_connector.bind_connector_metadata(
-            scheduler_output.kv_connector_metadata)
+        kv_connector.bind_connector_metadata(scheduler_output.kv_connector_metadata)
 
         # Background KV cache transfers happen here.
         # These transfers are designed to be async and the requests
@@ -118,12 +129,13 @@ def _get_kv_connector_output(
                 kv_connector.wait_for_save()
 
             output.finished_sending, output.finished_recving = (
-                kv_connector.get_finished(scheduler_output.finished_req_ids))
-            output.invalid_block_ids = (
-                kv_connector.get_block_ids_with_load_errors())
+                kv_connector.get_finished(scheduler_output.finished_req_ids)
+            )
+            output.invalid_block_ids = kv_connector.get_block_ids_with_load_errors()
 
-            output.kv_connector_stats = KVConnectorModelRunnerMixin.\
-            get_kv_connector_stats()
+            output.kv_connector_stats = (
+                KVConnectorModelRunnerMixin.get_kv_connector_stats()
+            )
             kv_connector.clear_connector_metadata()
 
     @staticmethod
diff --git a/vllm/v1/worker/lora_model_runner_mixin.py b/vllm/v1/worker/lora_model_runner_mixin.py
index e416f50322f4..e7358c4271ce 100644
--- a/vllm/v1/worker/lora_model_runner_mixin.py
+++ b/vllm/v1/worker/lora_model_runner_mixin.py
@@ -28,19 +28,19 @@
 
 # Defined as a mixin for GPUModelRunner
 class LoRAModelRunnerMixin:
-
     LORA_WARMUP_RANK = 8
 
-    def load_lora_model(self, model: nn.Module, vllm_config: VllmConfig,
-                        device: torch.device) -> nn.Module:
-
+    def load_lora_model(
+        self, model: nn.Module, vllm_config: VllmConfig, device: torch.device
+    ) -> nn.Module:
         if not supports_lora(model):
-            raise ValueError(
-                f"{model.__class__.__name__} does not support LoRA yet.")
+            raise ValueError(f"{model.__class__.__name__} does not support LoRA yet.")
 
         if supports_multimodal(model):
-            logger.warning("Regarding multimodal models, vLLM currently "
-                           "only supports adding LoRA to language model.")
+            logger.warning(
+                "Regarding multimodal models, vLLM currently "
+                "only supports adding LoRA to language model."
+            )
 
         # Add LoRA Manager to the Model Runner
         self.lora_manager = LRUCacheWorkerLoRAManager(
@@ -51,41 +51,44 @@ def load_lora_model(self, model: nn.Module, vllm_config: VllmConfig,
         )
         return self.lora_manager.create_lora_manager(model)
 
-    def _set_active_loras(self, prompt_lora_mapping: tuple[int, ...],
-                          token_lora_mapping: tuple[int, ...],
-                          lora_requests: set[LoRARequest]) -> None:
+    def _set_active_loras(
+        self,
+        prompt_lora_mapping: tuple[int, ...],
+        token_lora_mapping: tuple[int, ...],
+        lora_requests: set[LoRARequest],
+    ) -> None:
         self._ensure_lora_enabled()
 
         # Set is_prefill to True, so we always use the SGMV kernels on
         # non-cuda platforms.
         # On cuda platforms we use the same kernels for prefill and
         # decode and this flag is generally ignored.
-        lora_mapping = LoRAMapping(token_lora_mapping,
-                                   prompt_lora_mapping,
-                                   is_prefill=True)
+        lora_mapping = LoRAMapping(
+            token_lora_mapping, prompt_lora_mapping, is_prefill=True
+        )
         self.lora_manager.set_active_adapters(lora_requests, lora_mapping)
 
     def _ensure_lora_enabled(self) -> None:
         if not hasattr(self, "lora_manager"):
-            raise RuntimeError(
-                "LoRA is not enabled. Use --enable-lora to enable LoRA.")
-
-    def set_active_loras(self, input_batch: InputBatch,
-                         num_scheduled_tokens: np.ndarray) -> None:
+            raise RuntimeError("LoRA is not enabled. Use --enable-lora to enable LoRA.")
 
+    def set_active_loras(
+        self, input_batch: InputBatch, num_scheduled_tokens: np.ndarray
+    ) -> None:
         prompt_lora_mapping: tuple[int, ...]  # of size input_batch.num_reqs
-        token_lora_mapping: tuple[int,
-                                  ...]  # of size np.sum(num_scheduled_tokens)
+        token_lora_mapping: tuple[int, ...]  # of size np.sum(num_scheduled_tokens)
         lora_requests: set[LoRARequest]
-        prompt_lora_mapping, token_lora_mapping, lora_requests = \
-                            input_batch.make_lora_inputs(num_scheduled_tokens)
-        return self._set_active_loras(prompt_lora_mapping, token_lora_mapping,
-                                      lora_requests)
+        prompt_lora_mapping, token_lora_mapping, lora_requests = (
+            input_batch.make_lora_inputs(num_scheduled_tokens)
+        )
+        return self._set_active_loras(
+            prompt_lora_mapping, token_lora_mapping, lora_requests
+        )
 
     @contextmanager
-    def maybe_setup_dummy_loras(self,
-                                lora_config: Optional[LoRAConfig],
-                                remove_lora: bool = True):
+    def maybe_setup_dummy_loras(
+        self, lora_config: Optional[LoRAConfig], remove_lora: bool = True
+    ):
         if lora_config is None:
             yield
         else:
@@ -96,9 +99,11 @@ def maybe_setup_dummy_loras(self,
 
             # Make dummy lora requests
             lora_requests: set[LoRARequest] = {
-                LoRARequest(lora_name=f"warmup_{lora_id}",
-                            lora_int_id=lora_id,
-                            lora_path="/not/a/real/path")
+                LoRARequest(
+                    lora_name=f"warmup_{lora_id}",
+                    lora_int_id=lora_id,
+                    lora_path="/not/a/real/path",
+                )
                 for lora_id in range(1, num_loras + 1)
             }
 
@@ -106,8 +111,7 @@ def maybe_setup_dummy_loras(self,
                 # Add the dummy LoRAs here so _set_active_loras doesn't try to
                 # load from disk.
                 for lr in lora_requests:
-                    self.lora_manager.add_dummy_lora(
-                        lr, rank=self.LORA_WARMUP_RANK)
+                    self.lora_manager.add_dummy_lora(lr, rank=self.LORA_WARMUP_RANK)
 
                 yield
 
@@ -116,8 +120,9 @@ def maybe_setup_dummy_loras(self,
                 self.lora_manager.remove_all_adapters()
 
     @contextmanager
-    def maybe_select_dummy_loras(self, lora_config: Optional[LoRAConfig],
-                                 num_scheduled_tokens: np.ndarray):
+    def maybe_select_dummy_loras(
+        self, lora_config: Optional[LoRAConfig], num_scheduled_tokens: np.ndarray
+    ):
         if lora_config is None:
             yield
         else:
@@ -129,35 +134,37 @@ def maybe_select_dummy_loras(self, lora_config: Optional[LoRAConfig],
 
             # Make prompt lora mapping
             # Assign LoRA IDs cyclically to simulate a worst-case scenario.
-            prompt_lora_mapping = (np.arange(num_reqs, dtype=np.int32) %
-                                   num_loras) + 1
+            prompt_lora_mapping = (np.arange(num_reqs, dtype=np.int32) % num_loras) + 1
 
             # Make token lora mapping
-            token_lora_mapping = np.repeat(prompt_lora_mapping,
-                                           num_scheduled_tokens)
+            token_lora_mapping = np.repeat(prompt_lora_mapping, num_scheduled_tokens)
 
             # Make dummy lora requests
             lora_requests: set[LoRARequest] = {
-                LoRARequest(lora_name=f"warmup_{lora_id}",
-                            lora_int_id=lora_id,
-                            lora_path="/not/a/real/path")
+                LoRARequest(
+                    lora_name=f"warmup_{lora_id}",
+                    lora_int_id=lora_id,
+                    lora_path="/not/a/real/path",
+                )
                 for lora_id in range(1, num_loras + 1)
             }
 
-            self._set_active_loras(tuple(prompt_lora_mapping),
-                                   tuple(token_lora_mapping), lora_requests)
+            self._set_active_loras(
+                tuple(prompt_lora_mapping), tuple(token_lora_mapping), lora_requests
+            )
 
             yield
 
     @contextmanager
-    def maybe_dummy_run_with_lora(self,
-                                  lora_config: Optional[LoRAConfig],
-                                  num_scheduled_tokens: np.ndarray,
-                                  remove_lora: bool = True):
+    def maybe_dummy_run_with_lora(
+        self,
+        lora_config: Optional[LoRAConfig],
+        num_scheduled_tokens: np.ndarray,
+        remove_lora: bool = True,
+    ):
         with (
-                self.maybe_setup_dummy_loras(lora_config, remove_lora),
-                self.maybe_select_dummy_loras(lora_config,
-                                              num_scheduled_tokens),
+            self.maybe_setup_dummy_loras(lora_config, remove_lora),
+            self.maybe_select_dummy_loras(lora_config, num_scheduled_tokens),
         ):
             yield
 
diff --git a/vllm/v1/worker/tpu_input_batch.py b/vllm/v1/worker/tpu_input_batch.py
index 4cd0ac352de0..34fed8f96467 100644
--- a/vllm/v1/worker/tpu_input_batch.py
+++ b/vllm/v1/worker/tpu_input_batch.py
@@ -18,16 +18,15 @@
 
 
 class InputBatch:
-
     def __init__(
-            self,
-            max_num_reqs: int,
-            max_model_len: int,
-            max_num_batched_tokens: int,
-            device: torch.device,
-            pin_memory: bool,
-            vocab_size: int,
-            block_sizes: list[int],  # The block_size of each kv cache group
+        self,
+        max_num_reqs: int,
+        max_model_len: int,
+        max_num_batched_tokens: int,
+        device: torch.device,
+        pin_memory: bool,
+        vocab_size: int,
+        block_sizes: list[int],  # The block_size of each kv cache group
     ):
         self.max_num_reqs = max_num_reqs
         self.max_model_len = max_model_len
@@ -54,13 +53,12 @@ def __init__(
         self.num_tokens_no_spec = np.zeros(max_num_reqs, dtype=np.int32)
         self.num_prompt_tokens = np.zeros(max_num_reqs, dtype=np.int32)
         self.num_computed_tokens_cpu_tensor = torch.zeros(
-            (max_num_reqs, ),
+            (max_num_reqs,),
             device="cpu",
             dtype=torch.int32,
             pin_memory=pin_memory,
         )
-        self.num_computed_tokens_cpu = \
-            self.num_computed_tokens_cpu_tensor.numpy()
+        self.num_computed_tokens_cpu = self.num_computed_tokens_cpu_tensor.numpy()
 
         # Block table.
         self.block_table = MultiGroupBlockTable(
@@ -73,91 +71,72 @@ def __init__(
         )
 
         # Sampling-related.
-        self.temperature = torch.empty((max_num_reqs, ),
-                                       dtype=torch.float32,
-                                       device=device)
-        self.temperature_cpu_tensor = torch.empty((max_num_reqs, ),
-                                                  dtype=torch.float32,
-                                                  device="cpu",
-                                                  pin_memory=pin_memory)
+        self.temperature = torch.empty(
+            (max_num_reqs,), dtype=torch.float32, device=device
+        )
+        self.temperature_cpu_tensor = torch.empty(
+            (max_num_reqs,), dtype=torch.float32, device="cpu", pin_memory=pin_memory
+        )
         self.temperature_cpu = self.temperature_cpu_tensor.numpy()
         self.greedy_reqs: set[str] = set()
         self.random_reqs: set[str] = set()
 
-        self.top_p = torch.empty((max_num_reqs, ),
-                                 dtype=torch.float32,
-                                 device=device)
-        self.top_p_cpu_tensor = torch.empty((max_num_reqs, ),
-                                            dtype=torch.float32,
-                                            device="cpu",
-                                            pin_memory=pin_memory)
+        self.top_p = torch.empty((max_num_reqs,), dtype=torch.float32, device=device)
+        self.top_p_cpu_tensor = torch.empty(
+            (max_num_reqs,), dtype=torch.float32, device="cpu", pin_memory=pin_memory
+        )
         self.top_p_cpu = self.top_p_cpu_tensor.numpy()
         self.top_p_reqs: set[str] = set()
 
-        self.top_k = torch.empty((max_num_reqs, ),
-                                 dtype=torch.int32,
-                                 device=device)
-        self.top_k_cpu_tensor = torch.empty((max_num_reqs, ),
-                                            dtype=torch.int32,
-                                            device="cpu",
-                                            pin_memory=pin_memory)
+        self.top_k = torch.empty((max_num_reqs,), dtype=torch.int32, device=device)
+        self.top_k_cpu_tensor = torch.empty(
+            (max_num_reqs,), dtype=torch.int32, device="cpu", pin_memory=pin_memory
+        )
         self.top_k_cpu = self.top_k_cpu_tensor.numpy()
         self.top_k_reqs: set[str] = set()
 
-        self.min_p = torch.empty((max_num_reqs, ),
-                                 dtype=torch.float32,
-                                 device=device)
-        self.min_p_cpu_tensor = torch.empty((max_num_reqs, ),
-                                            dtype=torch.float32,
-                                            device="cpu",
-                                            pin_memory=pin_memory)
+        self.min_p = torch.empty((max_num_reqs,), dtype=torch.float32, device=device)
+        self.min_p_cpu_tensor = torch.empty(
+            (max_num_reqs,), dtype=torch.float32, device="cpu", pin_memory=pin_memory
+        )
         self.min_p_cpu = self.min_p_cpu_tensor.numpy()
         self.min_p_reqs: set[str] = set()
 
         # Frequency penalty related data structures
-        self.frequency_penalties = torch.empty((max_num_reqs, ),
-                                               dtype=torch.float,
-                                               device=device)
+        self.frequency_penalties = torch.empty(
+            (max_num_reqs,), dtype=torch.float, device=device
+        )
         self.frequency_penalties_cpu_tensor = torch.empty(
-            (max_num_reqs, ),
-            dtype=torch.float,
-            device="cpu",
-            pin_memory=pin_memory)
-        self.frequency_penalties_cpu = \
-            self.frequency_penalties_cpu_tensor.numpy()
+            (max_num_reqs,), dtype=torch.float, device="cpu", pin_memory=pin_memory
+        )
+        self.frequency_penalties_cpu = self.frequency_penalties_cpu_tensor.numpy()
         self.frequency_penalties_reqs: set[str] = set()
 
         # Presence penalty related data structures
-        self.presence_penalties = torch.empty((max_num_reqs, ),
-                                              dtype=torch.float,
-                                              device=device)
-        self.presence_penalties_cpu_tensor = torch.empty((max_num_reqs, ),
-                                                         dtype=torch.float,
-                                                         device="cpu",
-                                                         pin_memory=pin_memory)
-        self.presence_penalties_cpu = self.presence_penalties_cpu_tensor.numpy(
+        self.presence_penalties = torch.empty(
+            (max_num_reqs,), dtype=torch.float, device=device
         )
+        self.presence_penalties_cpu_tensor = torch.empty(
+            (max_num_reqs,), dtype=torch.float, device="cpu", pin_memory=pin_memory
+        )
+        self.presence_penalties_cpu = self.presence_penalties_cpu_tensor.numpy()
         self.presence_penalties_reqs: set[str] = set()
 
         # Repetition penalty related data structures
-        self.repetition_penalties = torch.empty((max_num_reqs, ),
-                                                dtype=torch.float,
-                                                device=device)
+        self.repetition_penalties = torch.empty(
+            (max_num_reqs,), dtype=torch.float, device=device
+        )
         self.repetition_penalties_cpu_tensor = torch.empty(
-            (max_num_reqs, ),
-            dtype=torch.float,
-            device="cpu",
-            pin_memory=pin_memory)
-        self.repetition_penalties_cpu = \
-            self.repetition_penalties_cpu_tensor.numpy()
+            (max_num_reqs,), dtype=torch.float, device="cpu", pin_memory=pin_memory
+        )
+        self.repetition_penalties_cpu = self.repetition_penalties_cpu_tensor.numpy()
         self.repetition_penalties_reqs: set[str] = set()
 
         # req_index -> (min_tokens, stop_token_ids)
         self.min_tokens: dict[int, tuple[int, set[int]]] = {}
 
         # lora related
-        self.request_lora_mapping = np.zeros((self.max_num_reqs, ),
-                                             dtype=np.int32)
+        self.request_lora_mapping = np.zeros((self.max_num_reqs,), dtype=np.int32)
         self.lora_id_to_request_ids: dict[int, set[str]] = {}
         self.lora_id_to_lora_request: dict[int, LoRARequest] = {}
 
@@ -174,8 +153,7 @@ def __init__(
         # To accumulate prompt logprobs tensor chunks across prefill steps.
         self.in_progress_prompt_logprobs_cpu: dict[str, LogprobsTensors] = {}
 
-        self.logit_bias: list[Optional[dict[int,
-                                            float]]] = [None] * max_num_reqs
+        self.logit_bias: list[Optional[dict[int, float]]] = [None] * max_num_reqs
         self.has_allowed_token_ids: set[str] = set()
         # NOTE(lufang): In the mask tensor, if the corresponding token allowed,
         # the value is False. Since we use masked_fill_ to set -inf.
@@ -214,15 +192,14 @@ def add_request(
 
         # Copy the prompt token ids and output token ids.
         num_prompt_tokens = length_from_prompt_token_ids_or_embeds(
-            request.prompt_token_ids, request.prompt_embeds)
+            request.prompt_token_ids, request.prompt_embeds
+        )
         # TODO: copy prompt_embeds
         self.num_prompt_tokens[req_index] = num_prompt_tokens
-        self.token_ids_cpu[
-            req_index, :num_prompt_tokens] = request.prompt_token_ids
+        self.token_ids_cpu[req_index, :num_prompt_tokens] = request.prompt_token_ids
         start_idx = num_prompt_tokens
         end_idx = start_idx + len(request.output_token_ids)
-        self.token_ids_cpu[req_index,
-                           start_idx:end_idx] = request.output_token_ids
+        self.token_ids_cpu[req_index, start_idx:end_idx] = request.output_token_ids
         # Number of token ids in token_ids_cpu.
         # NOTE(woosuk): This may include spec decode tokens.
         self.num_tokens[req_index] = request.num_tokens
@@ -252,23 +229,22 @@ def add_request(
             top_k = self.vocab_size
         self.top_k_cpu[req_index] = top_k
         self.min_p_cpu[req_index] = sampling_params.min_p
-        self.frequency_penalties_cpu[
-            req_index] = sampling_params.frequency_penalty
+        self.frequency_penalties_cpu[req_index] = sampling_params.frequency_penalty
         if sampling_params.min_p > _SAMPLING_EPS:
             self.min_p_reqs.add(req_id)
         if sampling_params.frequency_penalty != 0.0:
             self.frequency_penalties_reqs.add(req_id)
-        self.presence_penalties_cpu[
-            req_index] = sampling_params.presence_penalty
+        self.presence_penalties_cpu[req_index] = sampling_params.presence_penalty
         if sampling_params.presence_penalty != 0.0:
             self.presence_penalties_reqs.add(req_id)
-        self.repetition_penalties_cpu[
-            req_index] = sampling_params.repetition_penalty
+        self.repetition_penalties_cpu[req_index] = sampling_params.repetition_penalty
         if sampling_params.repetition_penalty != 1.0:
             self.repetition_penalties_reqs.add(req_id)
         if sampling_params.min_tokens:
-            self.min_tokens[req_index] = (sampling_params.min_tokens,
-                                          sampling_params.all_stop_token_ids)
+            self.min_tokens[req_index] = (
+                sampling_params.min_tokens,
+                sampling_params.all_stop_token_ids,
+            )
 
         # NOTE(woosuk): self.generators should not include the requests that
         # do not have their own generator.
@@ -287,23 +263,23 @@ def add_request(
             if self.allowed_token_ids_mask_cpu_tensor is None:
                 # Lazy allocation for this tensor, which can be large.
                 # False means we don't fill with -inf.
-                self.allowed_token_ids_mask = torch.zeros(self.max_num_reqs,
-                                                          self.vocab_size,
-                                                          dtype=torch.bool,
-                                                          device=self.device)
-                self.allowed_token_ids_mask_cpu_tensor = torch.zeros(
+                self.allowed_token_ids_mask = torch.zeros(
                     self.max_num_reqs,
                     self.vocab_size,
                     dtype=torch.bool,
-                    device="cpu")
+                    device=self.device,
+                )
+                self.allowed_token_ids_mask_cpu_tensor = torch.zeros(
+                    self.max_num_reqs, self.vocab_size, dtype=torch.bool, device="cpu"
+                )
             self.allowed_token_ids_mask_cpu_tensor[req_index] = True
             # False means we don't fill with -inf.
             self.allowed_token_ids_mask_cpu_tensor[req_index][
-                sampling_params.allowed_token_ids] = False
+                sampling_params.allowed_token_ids
+            ] = False
 
         if sampling_params.bad_words_token_ids:
-            self.bad_words_token_ids[
-                req_index] = sampling_params.bad_words_token_ids
+            self.bad_words_token_ids[req_index] = sampling_params.bad_words_token_ids
 
         # Add request lora ID
         if request.lora_request:
@@ -361,35 +337,51 @@ def remove_request(self, req_id: str) -> Optional[int]:
     def swap_states(self, i1: int, i2: int) -> None:
         old_id_i1 = self._req_ids[i1]
         old_id_i2 = self._req_ids[i2]
-        self._req_ids[i1], self._req_ids[i2] =\
-            self._req_ids[i2], self._req_ids[i1] # noqa
-        self.req_output_token_ids[i1], self.req_output_token_ids[i2] =\
-            self.req_output_token_ids[i2], self.req_output_token_ids[i1]
+        self._req_ids[i1], self._req_ids[i2] = self._req_ids[i2], self._req_ids[i1]  # noqa
+        self.req_output_token_ids[i1], self.req_output_token_ids[i2] = (
+            self.req_output_token_ids[i2],
+            self.req_output_token_ids[i1],
+        )
         assert old_id_i1 is not None and old_id_i2 is not None
-        self.req_id_to_index[old_id_i1], self.req_id_to_index[old_id_i2] =\
-            self.req_id_to_index[old_id_i2], self.req_id_to_index[old_id_i1]
-        self.num_tokens[i1], self.num_tokens[i2] =\
-            self.num_tokens[i2], self.num_tokens[i1]
-        self.num_tokens_no_spec[i1], self.num_tokens_no_spec[i2] =\
-            self.num_tokens_no_spec[i2], self.num_tokens_no_spec[i1]
-        self.num_prompt_tokens[i1], self.num_prompt_tokens[i2] =\
-            self.num_prompt_tokens[i2], self.num_prompt_tokens[i1]
-        self.num_computed_tokens_cpu[i1], self.num_computed_tokens_cpu[i2] =\
-            self.num_computed_tokens_cpu[i2], self.num_computed_tokens_cpu[i1]
-        self.temperature_cpu[i1], self.temperature_cpu[i2] =\
-            self.temperature_cpu[i2], self.temperature_cpu[i1]
-        self.top_p_cpu[i1], self.top_p_cpu[i2] =\
-            self.top_p_cpu[i2], self.top_p_cpu[i1]
-        self.top_k_cpu[i1], self.top_k_cpu[i2] =\
-            self.top_k_cpu[i2], self.top_k_cpu[i1]
-        self.frequency_penalties_cpu[i1], self.frequency_penalties_cpu[i2] =\
-            self.frequency_penalties_cpu[i2], self.frequency_penalties_cpu[i1]
-        self.presence_penalties_cpu[i1], self.presence_penalties_cpu[i2] =\
-            self.presence_penalties_cpu[i2], self.presence_penalties_cpu[i1]
-        self.repetition_penalties_cpu[i1], self.repetition_penalties_cpu[i2] =\
-            self.repetition_penalties_cpu[i2], self.repetition_penalties_cpu[i1]
-        self.min_p_cpu[i1], self.min_p_cpu[i2] =\
-            self.min_p_cpu[i2], self.min_p_cpu[i1]
+        self.req_id_to_index[old_id_i1], self.req_id_to_index[old_id_i2] = (
+            self.req_id_to_index[old_id_i2],
+            self.req_id_to_index[old_id_i1],
+        )
+        self.num_tokens[i1], self.num_tokens[i2] = (
+            self.num_tokens[i2],
+            self.num_tokens[i1],
+        )
+        self.num_tokens_no_spec[i1], self.num_tokens_no_spec[i2] = (
+            self.num_tokens_no_spec[i2],
+            self.num_tokens_no_spec[i1],
+        )
+        self.num_prompt_tokens[i1], self.num_prompt_tokens[i2] = (
+            self.num_prompt_tokens[i2],
+            self.num_prompt_tokens[i1],
+        )
+        self.num_computed_tokens_cpu[i1], self.num_computed_tokens_cpu[i2] = (
+            self.num_computed_tokens_cpu[i2],
+            self.num_computed_tokens_cpu[i1],
+        )
+        self.temperature_cpu[i1], self.temperature_cpu[i2] = (
+            self.temperature_cpu[i2],
+            self.temperature_cpu[i1],
+        )
+        self.top_p_cpu[i1], self.top_p_cpu[i2] = self.top_p_cpu[i2], self.top_p_cpu[i1]
+        self.top_k_cpu[i1], self.top_k_cpu[i2] = self.top_k_cpu[i2], self.top_k_cpu[i1]
+        self.frequency_penalties_cpu[i1], self.frequency_penalties_cpu[i2] = (
+            self.frequency_penalties_cpu[i2],
+            self.frequency_penalties_cpu[i1],
+        )
+        self.presence_penalties_cpu[i1], self.presence_penalties_cpu[i2] = (
+            self.presence_penalties_cpu[i2],
+            self.presence_penalties_cpu[i1],
+        )
+        self.repetition_penalties_cpu[i1], self.repetition_penalties_cpu[i2] = (
+            self.repetition_penalties_cpu[i2],
+            self.repetition_penalties_cpu[i1],
+        )
+        self.min_p_cpu[i1], self.min_p_cpu[i2] = self.min_p_cpu[i2], self.min_p_cpu[i1]
 
         # NOTE: the following is unsafe
         # self.token_ids_cpu[i1, ...], self.token_ids_cpu[i2, ...], =\
@@ -404,21 +396,28 @@ def swap_states(self, i1: int, i2: int) -> None:
         swap_dict_values(self.min_tokens, i1, i2)
         swap_dict_values(self.bad_words_token_ids, i1, i2)
 
-        self.request_lora_mapping[i1], self.request_lora_mapping[i2] =\
-            self.request_lora_mapping[i2], self.request_lora_mapping[i1]
-        self.logit_bias[i1], self.logit_bias[i2] =\
-            self.logit_bias[i2], self.logit_bias[i1]
+        self.request_lora_mapping[i1], self.request_lora_mapping[i2] = (
+            self.request_lora_mapping[i2],
+            self.request_lora_mapping[i1],
+        )
+        self.logit_bias[i1], self.logit_bias[i2] = (
+            self.logit_bias[i2],
+            self.logit_bias[i1],
+        )
 
         if self.allowed_token_ids_mask_cpu_tensor is not None:
-            self.allowed_token_ids_mask_cpu_tensor[i1], \
-                self.allowed_token_ids_mask_cpu_tensor[i2] =\
-                self.allowed_token_ids_mask_cpu_tensor[i2], \
-                    self.allowed_token_ids_mask_cpu_tensor[i1]
+            (
+                self.allowed_token_ids_mask_cpu_tensor[i1],
+                self.allowed_token_ids_mask_cpu_tensor[i2],
+            ) = (
+                self.allowed_token_ids_mask_cpu_tensor[i2],
+                self.allowed_token_ids_mask_cpu_tensor[i1],
+            )
         self.block_table.swap_row(i1, i2)
 
     def condense(self, empty_req_indices: list[int]) -> None:
         """Move non-empty requests down into lower, empty indices.
-        
+
         Args:
           empty_req_indices: empty batch indices, sorted descending.
         """
@@ -454,25 +453,29 @@ def condense(self, empty_req_indices: list[int]) -> None:
 
             num_tokens = self.num_tokens[last_req_index]
             self.token_ids_cpu[empty_index, :num_tokens] = self.token_ids_cpu[
-                last_req_index, :num_tokens]
+                last_req_index, :num_tokens
+            ]
             self.num_tokens[empty_index] = num_tokens
             self.num_tokens_no_spec[empty_index] = self.num_tokens_no_spec[
-                last_req_index]
-            self.num_prompt_tokens[empty_index] = self.num_prompt_tokens[
-                last_req_index]
-            self.num_computed_tokens_cpu[
-                empty_index] = self.num_computed_tokens_cpu[last_req_index]
+                last_req_index
+            ]
+            self.num_prompt_tokens[empty_index] = self.num_prompt_tokens[last_req_index]
+            self.num_computed_tokens_cpu[empty_index] = self.num_computed_tokens_cpu[
+                last_req_index
+            ]
             self.block_table.move_row(last_req_index, empty_index)
-            self.temperature_cpu[empty_index] = self.temperature_cpu[
-                last_req_index]
+            self.temperature_cpu[empty_index] = self.temperature_cpu[last_req_index]
             self.top_p_cpu[empty_index] = self.top_p_cpu[last_req_index]
             self.top_k_cpu[empty_index] = self.top_k_cpu[last_req_index]
-            self.frequency_penalties_cpu[
-                empty_index] = self.frequency_penalties_cpu[last_req_index]
-            self.presence_penalties_cpu[
-                empty_index] = self.presence_penalties_cpu[last_req_index]
-            self.repetition_penalties_cpu[
-                empty_index] = self.repetition_penalties_cpu[last_req_index]
+            self.frequency_penalties_cpu[empty_index] = self.frequency_penalties_cpu[
+                last_req_index
+            ]
+            self.presence_penalties_cpu[empty_index] = self.presence_penalties_cpu[
+                last_req_index
+            ]
+            self.repetition_penalties_cpu[empty_index] = self.repetition_penalties_cpu[
+                last_req_index
+            ]
             self.min_p_cpu[empty_index] = self.min_p_cpu[last_req_index]
             generator = self.generators.pop(last_req_index, None)
             if generator is not None:
@@ -483,28 +486,28 @@ def condense(self, empty_req_indices: list[int]) -> None:
                 self.min_tokens[empty_index] = min_token
 
             self.request_lora_mapping[empty_index] = self.request_lora_mapping[
-                last_req_index]
+                last_req_index
+            ]
 
             self.logit_bias[empty_index] = self.logit_bias[last_req_index]
 
             if self.allowed_token_ids_mask_cpu_tensor is not None:
-                self.allowed_token_ids_mask_cpu_tensor[
-                    empty_index] = self.allowed_token_ids_mask_cpu_tensor[
-                        last_req_index]
+                self.allowed_token_ids_mask_cpu_tensor[empty_index] = (
+                    self.allowed_token_ids_mask_cpu_tensor[last_req_index]
+                )
 
-            bad_words_token_ids = self.bad_words_token_ids.pop(
-                last_req_index, None)
+            bad_words_token_ids = self.bad_words_token_ids.pop(last_req_index, None)
             if bad_words_token_ids is not None:
                 self.bad_words_token_ids[empty_index] = bad_words_token_ids
             # Decrement last_req_index since it is now empty.
             last_req_index -= 1
 
         # Trim lists to the batch size.
-        del self._req_ids[self.num_reqs:]
-        del self.req_output_token_ids[self.num_reqs:]
+        del self._req_ids[self.num_reqs :]
+        del self.req_output_token_ids[self.num_reqs :]
 
     def _make_prompt_token_ids_tensor(self) -> torch.Tensor:
-        max_prompt_len = self.num_prompt_tokens[:self.num_reqs].max()
+        max_prompt_len = self.num_prompt_tokens[: self.num_reqs].max()
         prompt_token_ids_cpu_tensor = torch.empty(
             (self.num_reqs, max_prompt_len),
             device="cpu",
@@ -512,14 +515,12 @@ def _make_prompt_token_ids_tensor(self) -> torch.Tensor:
             pin_memory=self.pin_memory,
         )
         prompt_token_ids = prompt_token_ids_cpu_tensor.numpy()
-        prompt_token_ids[:] = self.token_ids_cpu[:self.
-                                                 num_reqs, :max_prompt_len]
+        prompt_token_ids[:] = self.token_ids_cpu[: self.num_reqs, :max_prompt_len]
         # Use the value of vocab_size as a pad since we don't have a
         # token_id of this value.
         for i in range(self.num_reqs):
-            prompt_token_ids[i, self.num_prompt_tokens[i]:] = self.vocab_size
-        return prompt_token_ids_cpu_tensor.to(device=self.device,
-                                              non_blocking=True)
+            prompt_token_ids[i, self.num_prompt_tokens[i] :] = self.vocab_size
+        return prompt_token_ids_cpu_tensor.to(device=self.device, non_blocking=True)
 
     def make_lora_inputs(
         self, num_scheduled_tokens: np.ndarray
@@ -535,12 +536,12 @@ def make_lora_inputs(
             3. lora_requests: Set of relevant LoRA requests.
         """
 
-        req_lora_mapping = self.request_lora_mapping[:self.num_reqs]
+        req_lora_mapping = self.request_lora_mapping[: self.num_reqs]
         prompt_lora_mapping = tuple(req_lora_mapping)
-        token_lora_mapping = tuple(
-            req_lora_mapping.repeat(num_scheduled_tokens))
+        token_lora_mapping = tuple(req_lora_mapping.repeat(num_scheduled_tokens))
         active_lora_requests: set[LoRARequest] = set(
-            self.lora_id_to_lora_request.values())
+            self.lora_id_to_lora_request.values()
+        )
 
         return prompt_lora_mapping, token_lora_mapping, active_lora_requests
 
@@ -570,9 +571,11 @@ def no_min_p(self) -> bool:
 
     @property
     def no_penalties(self) -> bool:
-        return (len(self.presence_penalties_reqs) == 0
-                and len(self.frequency_penalties_reqs) == 0
-                and len(self.repetition_penalties_reqs) == 0)
+        return (
+            len(self.presence_penalties_reqs) == 0
+            and len(self.frequency_penalties_reqs) == 0
+            and len(self.repetition_penalties_reqs) == 0
+        )
 
     @property
     def max_num_logprobs(self) -> Optional[int]:
diff --git a/vllm/v1/worker/tpu_model_runner.py b/vllm/v1/worker/tpu_model_runner.py
index 0b1c3d7c0e88..5fe23c58ff68 100644
--- a/vllm/v1/worker/tpu_model_runner.py
+++ b/vllm/v1/worker/tpu_model_runner.py
@@ -9,6 +9,7 @@
 import numpy as np
 import torch
 import torch.nn as nn
+
 # TPU XLA related
 import torch_xla
 import torch_xla.core.xla_model as xm
@@ -20,46 +21,71 @@
 from vllm.attention.backends.abstract import AttentionType
 from vllm.attention.layers.chunked_local_attention import ChunkedLocalAttention
 from vllm.compilation.wrapper import TorchCompileWrapperWithCustomDispatcher
-from vllm.config import (ParallelConfig, VllmConfig,
-                         get_layers_from_vllm_config, update_config)
-from vllm.distributed.kv_transfer import (get_kv_transfer_group,
-                                          has_kv_transfer_group)
+from vllm.config import (
+    ParallelConfig,
+    VllmConfig,
+    get_layers_from_vllm_config,
+    update_config,
+)
+from vllm.distributed.kv_transfer import get_kv_transfer_group, has_kv_transfer_group
 from vllm.distributed.kv_transfer.kv_connector.utils import copy_kv_blocks
 from vllm.forward_context import set_forward_context
 from vllm.logger import init_logger
 from vllm.lora.layers import BaseLayerWithLoRA
 from vllm.model_executor.model_loader import get_model_loader
 from vllm.model_executor.model_loader.tpu import TPUModelLoader
-from vllm.model_executor.models.interfaces import (SupportsMultiModal,
-                                                   supports_transcription)
+from vllm.model_executor.models.interfaces import (
+    SupportsMultiModal,
+    supports_transcription,
+)
 from vllm.model_executor.models.interfaces_base import (
-    is_pooling_model, is_text_generation_model)
+    is_pooling_model,
+    is_text_generation_model,
+)
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (BatchedTensorInputs, MultiModalKwargsItem,
-                                    PlaceholderRange)
+from vllm.multimodal.inputs import (
+    BatchedTensorInputs,
+    MultiModalKwargsItem,
+    PlaceholderRange,
+)
 from vllm.multimodal.utils import group_mm_kwargs_by_modality
 from vllm.sequence import IntermediateTensors
 from vllm.tasks import GenerationTask, PoolingTask, SupportedTask
-from vllm.utils import (LayerBlockType, cdiv, is_pin_memory_available,
-                        prev_power_of_2)
-from vllm.v1.attention.backends.pallas import (TPU_STR_DTYPE_TO_TORCH_DTYPE,
-                                               PallasAttentionBackend,
-                                               PallasMetadata,
-                                               get_page_size_bytes)
-from vllm.v1.kv_cache_interface import (AttentionSpec, FullAttentionSpec,
-                                        KVCacheConfig, KVCacheSpec,
-                                        SlidingWindowSpec)
-from vllm.v1.outputs import (EMPTY_MODEL_RUNNER_OUTPUT, LogprobsLists,
-                             LogprobsTensors, ModelRunnerOutput)
+from vllm.utils import LayerBlockType, cdiv, is_pin_memory_available, prev_power_of_2
+from vllm.v1.attention.backends.pallas import (
+    TPU_STR_DTYPE_TO_TORCH_DTYPE,
+    PallasAttentionBackend,
+    PallasMetadata,
+    get_page_size_bytes,
+)
+from vllm.v1.kv_cache_interface import (
+    AttentionSpec,
+    FullAttentionSpec,
+    KVCacheConfig,
+    KVCacheSpec,
+    SlidingWindowSpec,
+)
+from vllm.v1.outputs import (
+    EMPTY_MODEL_RUNNER_OUTPUT,
+    LogprobsLists,
+    LogprobsTensors,
+    ModelRunnerOutput,
+)
 from vllm.v1.sample.tpu.metadata import TPUSupportedSamplingMetadata
 from vllm.v1.sample.tpu.sampler import Sampler as TPUSampler
 from vllm.v1.worker.kv_connector_model_runner_mixin import (
-    KVConnectorModelRunnerMixin, KVConnectorOutput)
+    KVConnectorModelRunnerMixin,
+    KVConnectorOutput,
+)
 from vllm.v1.worker.lora_model_runner_mixin import LoRAModelRunnerMixin
 from vllm.v1.worker.tpu_input_batch import CachedRequestState, InputBatch
 
-from .utils import (MultiModalBudget, add_kv_sharing_layers_to_kv_cache_groups,
-                    bind_kv_cache, sanity_check_mm_encoder_outputs)
+from .utils import (
+    MultiModalBudget,
+    add_kv_sharing_layers_to_kv_cache_groups,
+    bind_kv_cache,
+    sanity_check_mm_encoder_outputs,
+)
 
 if TYPE_CHECKING:
     from vllm.v1.core.sched.output import SchedulerOutput
@@ -107,7 +133,6 @@
 # branch predictions are included as subgraph inputs to facilitate
 # pre-compilation.
 class TPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -139,7 +164,7 @@ def __init__(
             num_devices = xr.global_runtime_device_count()
             mesh_shape = (num_devices, 1)
             device_ids = np.array(range(num_devices))
-            self.mesh = xs.Mesh(device_ids, mesh_shape, ('x', 'y'))
+            self.mesh = xs.Mesh(device_ids, mesh_shape, ("x", "y"))
 
         self.enforce_eager = model_config.enforce_eager
 
@@ -155,8 +180,7 @@ def __init__(
             else:
                 self.kv_cache_dtype = model_dtype
         else:
-            self.kv_cache_dtype = TPU_STR_DTYPE_TO_TORCH_DTYPE[
-                cache_config.cache_dtype]
+            self.kv_cache_dtype = TPU_STR_DTYPE_TO_TORCH_DTYPE[cache_config.cache_dtype]
         self._hidden_states_dtype = self.dtype
 
         self.sliding_window = model_config.get_sliding_window()
@@ -164,25 +188,28 @@ def __init__(
         self.max_model_len = model_config.max_model_len
         self.most_model_len = envs.VLLM_TPU_MOST_MODEL_LEN
         self.max_num_blocks_per_req = cdiv(self.max_model_len, self.block_size)
-        self.num_blocks_per_most_len_req = cdiv(
-            self.most_model_len,
-            self.block_size) if self.most_model_len is not None else None
+        self.num_blocks_per_most_len_req = (
+            cdiv(self.most_model_len, self.block_size)
+            if self.most_model_len is not None
+            else None
+        )
         # InputBatch needs to work with sampling tensors greater than padding
         # to avoid dynamic shapes. Also, avoid suboptimal alignment.
         self.max_num_reqs = max(scheduler_config.max_num_seqs, MIN_NUM_SEQS)
         self.num_tokens_paddings = _get_token_paddings(
             min_token_size=16,
             max_token_size=scheduler_config.max_num_batched_tokens,
-            padding_gap=envs.VLLM_TPU_BUCKET_PADDING_GAP)
+            padding_gap=envs.VLLM_TPU_BUCKET_PADDING_GAP,
+        )
         # In case `max_num_tokens < max(num_tokens_paddings)` use the actual
         # padded max value to pre-allocate data structures and pre-compile.
         self.max_num_tokens = self.num_tokens_paddings[-1]
 
         # Model-related.
         self.num_attn_layers = model_config.get_num_layers_by_block_type(
-            parallel_config, LayerBlockType.attention)
-        self.num_query_heads = model_config.get_num_attention_heads(
-            parallel_config)
+            parallel_config, LayerBlockType.attention
+        )
+        self.num_query_heads = model_config.get_num_attention_heads(parallel_config)
         self.num_kv_heads = model_config.get_num_kv_heads(parallel_config)
         self.head_size = model_config.get_head_size()
         self.hidden_size = model_config.get_hidden_size()
@@ -195,17 +222,21 @@ def __init__(
         self.mm_registry = MULTIMODAL_REGISTRY
         self.uses_mrope = model_config.uses_mrope
         self.supports_mm_inputs = self.mm_registry.supports_multimodal_inputs(
-            model_config)
+            model_config
+        )
         # TODO: Support M-RoPE (e.g, Qwen2-VL)
         assert not self.uses_mrope, "TPU does not support M-RoPE yet."
 
-        self._num_slices_per_kv_cache_update_block = \
-            _get_num_slices_per_kv_cache_update_block(get_page_size_bytes(
-                block_size=self.block_size,
-                num_kv_heads=self.num_kv_heads,
-                head_size=self.head_size,
-                kv_cache_dtype=self.kv_cache_dtype,
-            ))
+        self._num_slices_per_kv_cache_update_block = (
+            _get_num_slices_per_kv_cache_update_block(
+                get_page_size_bytes(
+                    block_size=self.block_size,
+                    num_kv_heads=self.num_kv_heads,
+                    head_size=self.head_size,
+                    kv_cache_dtype=self.kv_cache_dtype,
+                )
+            )
+        )
 
         # Lazy initialization
         self.model: nn.Module  # Set after load_model
@@ -230,52 +261,68 @@ def __init__(
         # Cached torch/numpy tensor
         # The pytorch tensor and numpy array share the same buffer.
         # Sometimes the numpy op is faster so we create both.
-        self.input_ids_cpu = torch.zeros(self.max_num_tokens,
-                                         dtype=torch.int32,
-                                         device="cpu")
+        self.input_ids_cpu = torch.zeros(
+            self.max_num_tokens, dtype=torch.int32, device="cpu"
+        )
 
-        self.positions_cpu = torch.zeros(self.max_num_tokens,
-                                         dtype=torch.int32,
-                                         device="cpu")
+        self.positions_cpu = torch.zeros(
+            self.max_num_tokens, dtype=torch.int32, device="cpu"
+        )
         self.positions_np = self.positions_cpu.numpy()
         self.block_table_cpu = torch.zeros(
             (self.max_num_reqs, self.max_num_blocks_per_req),
             dtype=torch.int32,
-            device="cpu")
+            device="cpu",
+        )
         # adjust num_reqs to avoid SMEM OOM.
-        self.num_reqs_most_model_len = min(
-            PallasAttentionBackend.get_max_num_seqs(self.most_model_len,
-                                                    self.block_size),
-            self.max_num_reqs) if self.most_model_len is not None else None
+        self.num_reqs_most_model_len = (
+            min(
+                PallasAttentionBackend.get_max_num_seqs(
+                    self.most_model_len, self.block_size
+                ),
+                self.max_num_reqs,
+            )
+            if self.most_model_len is not None
+            else None
+        )
         self.num_reqs_max_model_len = min(
-            PallasAttentionBackend.get_max_num_seqs(self.max_model_len,
-                                                    self.block_size),
-            self.max_num_reqs)
-        self.query_start_loc_cpu = torch.zeros(self.max_num_tokens + 1,
-                                               dtype=torch.int32,
-                                               device="cpu",
-                                               pin_memory=self.pin_memory)
+            PallasAttentionBackend.get_max_num_seqs(
+                self.max_model_len, self.block_size
+            ),
+            self.max_num_reqs,
+        )
+        self.query_start_loc_cpu = torch.zeros(
+            self.max_num_tokens + 1,
+            dtype=torch.int32,
+            device="cpu",
+            pin_memory=self.pin_memory,
+        )
         self.query_start_loc_np = self.query_start_loc_cpu.numpy()
 
-        self.seq_lens_cpu = torch.zeros(self.max_num_tokens,
-                                        dtype=torch.int32,
-                                        device="cpu",
-                                        pin_memory=self.pin_memory)
+        self.seq_lens_cpu = torch.zeros(
+            self.max_num_tokens,
+            dtype=torch.int32,
+            device="cpu",
+            pin_memory=self.pin_memory,
+        )
         self.seq_lens_np = self.seq_lens_cpu.numpy()
 
         # Only relevant for multimodal models
         if self.supports_mm_inputs:
-            self.is_mm_embed_cpu = torch.zeros(self.max_num_tokens,
-                                               dtype=torch.bool,
-                                               device="cpu",
-                                               pin_memory=self.pin_memory)
+            self.is_mm_embed_cpu = torch.zeros(
+                self.max_num_tokens,
+                dtype=torch.bool,
+                device="cpu",
+                pin_memory=self.pin_memory,
+            )
 
         # Range tensor with values [0 .. self.max_num_tokens - 1].
         # Used to initialize positions / context_lens / seq_lens
         # Keep in int64 to avoid overflow with long context
         self.arange_np = np.arange(self.max_num_tokens, dtype=np.int64)
         self.num_reqs_paddings = _get_req_paddings(
-            min_req_size=MIN_NUM_SEQS, max_req_size=self.max_num_reqs)
+            min_req_size=MIN_NUM_SEQS, max_req_size=self.max_num_reqs
+        )
 
         # Layer pairings for cross-layer KV sharing.
         # If an Attention layer `layer_name` is in the keys of this dict, it
@@ -288,27 +335,35 @@ def __init__(
             (self.max_num_reqs, cdiv(self.vocab_size, 32)),
             dtype=torch.int32,
             device="cpu",
-            pin_memory=self.pin_memory)
+            pin_memory=self.pin_memory,
+        )
         self.require_structured_out_cpu = torch.zeros(
             (self.max_num_reqs, 1),
             dtype=torch.bool,
             device="cpu",
-            pin_memory=self.pin_memory)
+            pin_memory=self.pin_memory,
+        )
         self.structured_decode_arange = torch.arange(
-            0, 32, device="cpu", pin_memory=self.pin_memory)
+            0, 32, device="cpu", pin_memory=self.pin_memory
+        )
 
-        self.mm_budget = (MultiModalBudget(
-            self.model_config,
-            self.scheduler_config,
-            self.mm_registry,
-        ) if self.supports_mm_inputs else None)
+        self.mm_budget = (
+            MultiModalBudget(
+                self.model_config,
+                self.scheduler_config,
+                self.mm_registry,
+            )
+            if self.supports_mm_inputs
+            else None
+        )
 
         if not self.use_spmd:
             self.sample_from_logits_func = torch.compile(
                 self.sample_from_logits,
                 backend="openxla",
                 fullgraph=True,
-                dynamic=False)
+                dynamic=False,
+            )
         else:
             self.sample_from_logits_func = self.sample_from_logits
 
@@ -322,8 +377,9 @@ def _update_num_xla_graphs(self, case_str):
         if new_compiled_graphs == 0:
             return
 
-        logger.info("Add new %d compiled XLA graphs due to %s",
-                    new_compiled_graphs, case_str)
+        logger.info(
+            "Add new %d compiled XLA graphs due to %s", new_compiled_graphs, case_str
+        )
         self.num_xla_graphs += new_compiled_graphs
 
     def _verify_num_xla_graphs(self, case_str):
@@ -335,7 +391,9 @@ def _verify_num_xla_graphs(self, case_str):
         assert self.num_xla_graphs == curr_cached_graph, (
             "Recompilation after warm up is detected during {}."
             " num_xla_graphs = {} curr_cached_graph = {}".format(
-                case_str, self.num_xla_graphs, curr_cached_graph))
+                case_str, self.num_xla_graphs, curr_cached_graph
+            )
+        )
 
     def _update_states(self, scheduler_output: "SchedulerOutput") -> bool:
         """Update the cached states and the persistent batch with the scheduler
@@ -388,8 +446,9 @@ def _update_states(self, scheduler_output: "SchedulerOutput") -> bool:
         req_ids_to_add: list[str] = []
         # Add new requests to the cached states.
         for new_req_data in scheduler_output.scheduled_new_reqs:
-            assert new_req_data.sampling_params is not None,\
+            assert new_req_data.sampling_params is not None, (
                 "Pooling is not supported in TPU yet"
+            )
             req_id = new_req_data.req_id
             sampling_params = new_req_data.sampling_params
 
@@ -422,8 +481,7 @@ def _update_states(self, scheduler_output: "SchedulerOutput") -> bool:
             if not resumed_from_preemption:
                 if new_block_ids is not None:
                     # Append the new blocks to the existing block IDs.
-                    for block_ids, new_ids in zip(req_state.block_ids,
-                                                  new_block_ids):
+                    for block_ids, new_ids in zip(req_state.block_ids, new_block_ids):
                         block_ids.extend(new_ids)
             else:
                 assert new_block_ids is not None
@@ -440,11 +498,9 @@ def _update_states(self, scheduler_output: "SchedulerOutput") -> bool:
                 continue
 
             # Update the persistent batch.
-            self.input_batch.num_computed_tokens_cpu[req_index] = (
-                num_computed_tokens)
+            self.input_batch.num_computed_tokens_cpu[req_index] = num_computed_tokens
             if new_block_ids is not None:
-                self.input_batch.block_table.append_row(
-                    new_block_ids, req_index)
+                self.input_batch.block_table.append_row(new_block_ids, req_index)
 
         # Add the new or resumed requests to the persistent batch.
         # The smaller empty indices are filled first.
@@ -513,8 +569,7 @@ def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
         block_size = self.vllm_config.cache_config.block_size
         kv_cache_spec: dict[str, KVCacheSpec] = {}
         for layer_name, attn_module in layers.items():
-            if (kv_tgt_layer :=
-                    attn_module.kv_sharing_target_layer_name) is not None:
+            if (kv_tgt_layer := attn_module.kv_sharing_target_layer_name) is not None:
                 # The layer doesn't need its own KV cache and will use that of
                 # the target layer. We skip creating a KVCacheSpec for it, so
                 # that KV cache management logic will act as this layer does
@@ -529,7 +584,8 @@ def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
                 if isinstance(attn_module, ChunkedLocalAttention):
                     logger.warning_once(
                         "Using irope in Pallas is not supported yet, it "
-                        "will fall back to global attention for long context.")
+                        "will fall back to global attention for long context."
+                    )
                 if attn_module.sliding_window is not None:
                     kv_cache_spec[layer_name] = SlidingWindowSpec(
                         block_size=block_size,
@@ -545,20 +601,22 @@ def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
                         head_size=attn_module.head_size,
                         dtype=self.kv_cache_dtype,
                     )
-            elif attn_module.attn_type in (AttentionType.ENCODER,
-                                           AttentionType.ENCODER_ONLY):
+            elif attn_module.attn_type in (
+                AttentionType.ENCODER,
+                AttentionType.ENCODER_ONLY,
+            ):
                 # encoder-only attention does not need KV cache.
                 continue
             elif attn_module.attn_type == AttentionType.ENCODER_DECODER:
                 raise NotImplementedError
             else:
-                raise ValueError(
-                    f"Unknown attention type: {attn_module.attn_type}")
+                raise ValueError(f"Unknown attention type: {attn_module.attn_type}")
 
         return kv_cache_spec
 
-    def _get_slot_mapping_metadata(self, num_reqs,
-                                   num_scheduled_tokens_per_req) -> np.ndarray:
+    def _get_slot_mapping_metadata(
+        self, num_reqs, num_scheduled_tokens_per_req
+    ) -> np.ndarray:
         """
         Computes metadata for mapping slots to blocks in the key-value (KV)
         cache for a batch of requests.
@@ -583,14 +641,16 @@ def _get_slot_mapping_metadata(self, num_reqs,
                 - slice_len (int): The length of the slice.
         """
         slices_start = self.input_batch.num_computed_tokens_cpu[:num_reqs]
-        slices_end = self.input_batch.num_computed_tokens_cpu[:num_reqs] + \
-            num_scheduled_tokens_per_req
+        slices_end = (
+            self.input_batch.num_computed_tokens_cpu[:num_reqs]
+            + num_scheduled_tokens_per_req
+        )
         local_block_start_idx = slices_start // self.block_size
         local_block_end_idx = (slices_end - 1) // self.block_size
         no_repeat_req_indices = self.arange_np[:num_reqs]
         global_block_start_idx = (
-            no_repeat_req_indices * self.max_num_blocks_per_req +
-            local_block_start_idx)
+            no_repeat_req_indices * self.max_num_blocks_per_req + local_block_start_idx
+        )
         block_lens = local_block_end_idx - local_block_start_idx + 1
         global_block_start_idx = np.repeat(global_block_start_idx, block_lens)
         slice_arange = np.concatenate([self.arange_np[:n] for n in block_lens])
@@ -598,30 +658,31 @@ def _get_slot_mapping_metadata(self, num_reqs,
         block_table_cpu = self.input_batch.block_table[0].get_cpu_tensor()
         block_numbers = block_table_cpu.flatten()[global_block_indices].numpy()
         total_block_len = np.sum(block_lens)
-        slot_mapping_slices = np.repeat(np.array([[0, self.block_size]],
-                                                 dtype=np.int32),
-                                        total_block_len,
-                                        axis=0)
+        slot_mapping_slices = np.repeat(
+            np.array([[0, self.block_size]], dtype=np.int32), total_block_len, axis=0
+        )
         cu_block_lens = np.zeros(len(block_lens) + 1, dtype=np.int32)
         np.cumsum(block_lens, out=cu_block_lens[1:])
         for req_idx in range(num_reqs):
-            slot_mapping_slices[cu_block_lens[req_idx]][
-                0] = slices_start[req_idx] % self.block_size
-            slot_mapping_slices[
-                cu_block_lens[req_idx + 1] -
-                1][1] = (slices_end[req_idx] - 1) % self.block_size + 1
+            slot_mapping_slices[cu_block_lens[req_idx]][0] = (
+                slices_start[req_idx] % self.block_size
+            )
+            slot_mapping_slices[cu_block_lens[req_idx + 1] - 1][1] = (
+                slices_end[req_idx] - 1
+            ) % self.block_size + 1
         slice_lens = slot_mapping_slices[:, 1] - slot_mapping_slices[:, 0]
         cu_slices_lens = np.zeros(len(slice_lens) + 1, dtype=np.int32)
         np.cumsum(slice_lens, out=cu_slices_lens[1:])
-        kv_cache_start_indices = slot_mapping_slices[:, 0] + \
-            (block_numbers * self.block_size)
+        kv_cache_start_indices = slot_mapping_slices[:, 0] + (
+            block_numbers * self.block_size
+        )
         new_kv_start_indices = cu_slices_lens[:-1]
         slot_mapping_metadata = np.stack(
-            [kv_cache_start_indices, new_kv_start_indices, slice_lens], axis=1)
+            [kv_cache_start_indices, new_kv_start_indices, slice_lens], axis=1
+        )
         return slot_mapping_metadata
 
-    def _prepare_inputs(self, scheduler_output: "SchedulerOutput",
-                        start_index: int):
+    def _prepare_inputs(self, scheduler_output: "SchedulerOutput", start_index: int):
         assert scheduler_output.total_num_scheduled_tokens > 0
         num_reqs = self.input_batch.num_reqs
         assert num_reqs > 0
@@ -643,22 +704,24 @@ def _prepare_inputs(self, scheduler_output: "SchedulerOutput",
             num_scheduled_tokens_per_req.append(num_tokens)
         if use_max_model_len:
             if len(num_scheduled_tokens_per_req) > self.num_reqs_max_model_len:
-                num_scheduled_tokens_per_req = \
-                    num_scheduled_tokens_per_req[:self.num_reqs_max_model_len]
+                num_scheduled_tokens_per_req = num_scheduled_tokens_per_req[
+                    : self.num_reqs_max_model_len
+                ]
                 end_index = start_index + self.num_reqs_max_model_len
             else:
                 end_index = num_reqs
         else:
-            if len(num_scheduled_tokens_per_req
-                   ) > self.num_reqs_most_model_len:
-                num_scheduled_tokens_per_req = \
-                    num_scheduled_tokens_per_req[:self.num_reqs_most_model_len]
+            if len(num_scheduled_tokens_per_req) > self.num_reqs_most_model_len:
+                num_scheduled_tokens_per_req = num_scheduled_tokens_per_req[
+                    : self.num_reqs_most_model_len
+                ]
                 end_index = start_index + self.num_reqs_most_model_len
             else:
                 end_index = num_reqs
         max_num_scheduled_tokens_all_reqs = max(num_scheduled_tokens_per_req)
-        num_scheduled_tokens_per_req = np.array(num_scheduled_tokens_per_req,
-                                                dtype=np.int32)
+        num_scheduled_tokens_per_req = np.array(
+            num_scheduled_tokens_per_req, dtype=np.int32
+        )
         total_num_scheduled_tokens = sum(num_scheduled_tokens_per_req)
         assert max_num_scheduled_tokens_all_reqs > 0
 
@@ -667,121 +730,130 @@ def _prepare_inputs(self, scheduler_output: "SchedulerOutput",
         # Get request indices.
         # E.g., [2, 5, 3] -> [0, 0, 1, 1, 1, 1, 1, 2, 2, 2]
         # For each scheduled token, what are the corresponding req index.
-        req_indices = np.repeat(self.arange_np[:num_reqs],
-                                num_scheduled_tokens_per_req)
+        req_indices = np.repeat(self.arange_np[:num_reqs], num_scheduled_tokens_per_req)
 
         # Get batched arange.
         # E.g., [2, 5, 3] -> [0, 1, 0, 1, 2, 3, 4, 0, 1, 2]
         # For each scheduled token, what is its position in corresponding req.
         arange = np.concatenate(
-            [self.arange_np[:n] for n in num_scheduled_tokens_per_req])
+            [self.arange_np[:n] for n in num_scheduled_tokens_per_req]
+        )
 
         # Get positions.
         positions_np = self.positions_np[:total_num_scheduled_tokens]
-        np.add(self.input_batch.num_computed_tokens_cpu[req_indices],
-               arange,
-               out=positions_np)
+        np.add(
+            self.input_batch.num_computed_tokens_cpu[req_indices],
+            arange,
+            out=positions_np,
+        )
 
         # Get token indices.
         # E.g., [0, 1, 0, 1, 2, 3, 4, 0, 1, 2]
         # -> [0, 1, M, M + 1, M + 2, M + 3, M + 4, 2 * M, 2 * M + 1, 2 * M + 2]
         # where M is the max_model_len.
-        token_indices = (positions_np +
-                         req_indices * self.input_batch.token_ids_cpu.shape[1])
+        token_indices = (
+            positions_np + req_indices * self.input_batch.token_ids_cpu.shape[1]
+        )
 
         # NOTE(woosuk): We use torch.index_select instead of np.take here
         # because torch.index_select is much faster than np.take for large
         # tensors.
-        torch.index_select(self.input_batch.token_ids_cpu_tensor.flatten(),
-                           0,
-                           torch.from_numpy(token_indices),
-                           out=self.input_ids_cpu[:total_num_scheduled_tokens])
+        torch.index_select(
+            self.input_batch.token_ids_cpu_tensor.flatten(),
+            0,
+            torch.from_numpy(token_indices),
+            out=self.input_ids_cpu[:total_num_scheduled_tokens],
+        )
 
         # Prepare the attention metadata.
         self.query_start_loc_np[0] = 0
-        np.cumsum(num_scheduled_tokens_per_req,
-                  out=self.query_start_loc_np[1:num_reqs + 1])
-        self.query_start_loc_np[num_reqs + 1:] = 1
+        np.cumsum(
+            num_scheduled_tokens_per_req, out=self.query_start_loc_np[1 : num_reqs + 1]
+        )
+        self.query_start_loc_np[num_reqs + 1 :] = 1
 
         self.seq_lens_np[:num_reqs] = (
-            self.input_batch.num_computed_tokens_cpu[:num_reqs] +
-            num_scheduled_tokens_per_req)
+            self.input_batch.num_computed_tokens_cpu[:num_reqs]
+            + num_scheduled_tokens_per_req
+        )
 
         # Do the padding and copy the tensors to the TPU.
         padded_total_num_scheduled_tokens = _get_padded_token_len(
-            self.num_tokens_paddings, total_num_scheduled_tokens)
+            self.num_tokens_paddings, total_num_scheduled_tokens
+        )
         # Zero out to avoid spurious values from prev iteration (last cp chunk)
         self.input_ids_cpu[
-            total_num_scheduled_tokens:padded_total_num_scheduled_tokens] = 0
-        self.input_ids = self.input_ids_cpu[:
-                                            padded_total_num_scheduled_tokens].to(
-                                                self.device)
-        self.position_ids = self.positions_cpu[:
-                                               padded_total_num_scheduled_tokens].to(
-                                                   self.device)
+            total_num_scheduled_tokens:padded_total_num_scheduled_tokens
+        ] = 0
+        self.input_ids = self.input_ids_cpu[:padded_total_num_scheduled_tokens].to(
+            self.device
+        )
+        self.position_ids = self.positions_cpu[:padded_total_num_scheduled_tokens].to(
+            self.device
+        )
         if use_max_model_len:
-            block_tables = self.block_table_cpu[:self.num_reqs_max_model_len, :
-                                                self.max_num_blocks_per_req]
-            block_tables[:num_reqs, :self.max_num_blocks_per_req] = (
-                self.input_batch.block_table[0].get_cpu_tensor()[:num_reqs])
-            query_start_loc = self.query_start_loc_cpu[:self.
-                                                       num_reqs_max_model_len +
-                                                       1].to(self.device)
-            seq_lens = self.seq_lens_cpu[:self.num_reqs_max_model_len].to(
-                self.device)
+            block_tables = self.block_table_cpu[
+                : self.num_reqs_max_model_len, : self.max_num_blocks_per_req
+            ]
+            block_tables[:num_reqs, : self.max_num_blocks_per_req] = (
+                self.input_batch.block_table[0].get_cpu_tensor()[:num_reqs]
+            )
+            query_start_loc = self.query_start_loc_cpu[
+                : self.num_reqs_max_model_len + 1
+            ].to(self.device)
+            seq_lens = self.seq_lens_cpu[: self.num_reqs_max_model_len].to(self.device)
         else:
-            block_tables = self.block_table_cpu[:self.
-                                                num_reqs_most_model_len, :self.
-                                                num_blocks_per_most_len_req]
-            block_tables[:num_reqs, :self.num_blocks_per_most_len_req] = (
-                self.input_batch.block_table[0].get_cpu_tensor()
-                [:num_reqs, :self.num_blocks_per_most_len_req])
-            query_start_loc = self.query_start_loc_cpu[:self.
-                                                       num_reqs_most_model_len +
-                                                       1].to(self.device)
-            seq_lens = self.seq_lens_cpu[:self.num_reqs_most_model_len].to(
-                self.device)
+            block_tables = self.block_table_cpu[
+                : self.num_reqs_most_model_len, : self.num_blocks_per_most_len_req
+            ]
+            block_tables[:num_reqs, : self.num_blocks_per_most_len_req] = (
+                self.input_batch.block_table[0].get_cpu_tensor()[
+                    :num_reqs, : self.num_blocks_per_most_len_req
+                ]
+            )
+            query_start_loc = self.query_start_loc_cpu[
+                : self.num_reqs_most_model_len + 1
+            ].to(self.device)
+            seq_lens = self.seq_lens_cpu[: self.num_reqs_most_model_len].to(self.device)
         block_tables = block_tables.to(self.device)
 
         # Calculate the slot mapping
         slot_mapping_metadata = self._get_slot_mapping_metadata(
-            num_reqs, num_scheduled_tokens_per_req)
+            num_reqs, num_scheduled_tokens_per_req
+        )
         num_kv_update_slices = slot_mapping_metadata.shape[0]
         padded_num_slices = _get_padded_num_kv_cache_update_slices(
-            padded_total_num_scheduled_tokens, self.max_num_reqs,
-            self.block_size)
+            padded_total_num_scheduled_tokens, self.max_num_reqs, self.block_size
+        )
         slot_mapping_metadata = np.pad(
             slot_mapping_metadata,
             [[0, padded_num_slices - len(slot_mapping_metadata)], [0, 0]],
-            constant_values=0)
+            constant_values=0,
+        )
         slot_mapping_metadata = np.transpose(slot_mapping_metadata)
-        slot_mapping_metadata = torch.tensor(slot_mapping_metadata,
-                                             device=self.device)
+        slot_mapping_metadata = torch.tensor(slot_mapping_metadata, device=self.device)
 
         if self.lora_config is not None:
             # We need to respect padding when activating LoRA adapters
             padded_num_scheduled_tokens_per_req = np.copy(
                 num_scheduled_tokens_per_req
             )  # Copying to avoid accidental state corruption bugs
-            padded_num_scheduled_tokens_per_req[-1] += \
+            padded_num_scheduled_tokens_per_req[-1] += (
                 padded_total_num_scheduled_tokens - total_num_scheduled_tokens
+            )
 
-            self.set_active_loras(self.input_batch,
-                                  padded_num_scheduled_tokens_per_req)
+            self.set_active_loras(self.input_batch, padded_num_scheduled_tokens_per_req)
 
         attn_metadata = PallasMetadata(
             slot_mapping=slot_mapping_metadata,
             block_tables=block_tables,
             context_lens=seq_lens,
             query_start_loc=query_start_loc,
-            num_seqs=torch.tensor([num_reqs],
-                                  dtype=torch.int32,
-                                  device=self.device),
-            num_kv_update_slices=torch.tensor([num_kv_update_slices],
-                                              dtype=torch.int32,
-                                              device=self.device),
-            num_slices_per_kv_cache_update_block=self.
-            _num_slices_per_kv_cache_update_block,
+            num_seqs=torch.tensor([num_reqs], dtype=torch.int32, device=self.device),
+            num_kv_update_slices=torch.tensor(
+                [num_kv_update_slices], dtype=torch.int32, device=self.device
+            ),
+            num_slices_per_kv_cache_update_block=self._num_slices_per_kv_cache_update_block,
         )
         # NOTE(woosuk): Due to chunked prefills, there can be at most 1 partial
         # request in the batch. While we should not sample any token from this
@@ -789,10 +861,11 @@ def _prepare_inputs(self, scheduler_output: "SchedulerOutput",
         # token from the partial request.
         # TODO: Support prompt logprobs.
         padded_num_reqs = _get_padded_num_reqs_with_upper_limit(
-            num_reqs, self.max_num_reqs)
+            num_reqs, self.max_num_reqs
+        )
         # Indices at which we sample (positions of last token in the sequence).
         # Padded to avoid recompiling when `num_reqs` varies.
-        logits_indices = self.query_start_loc_cpu[1:padded_num_reqs + 1] - 1
+        logits_indices = self.query_start_loc_cpu[1 : padded_num_reqs + 1] - 1
         logits_indices = logits_indices.to(self.device)
 
         if self.lora_config is not None:
@@ -800,20 +873,23 @@ def _prepare_inputs(self, scheduler_output: "SchedulerOutput",
             padded_num_scheduled_tokens_per_req = np.copy(
                 num_scheduled_tokens_per_req
             )  # Copying to avoid accidental state corruption bugs
-            padded_num_scheduled_tokens_per_req[-1] += \
+            padded_num_scheduled_tokens_per_req[-1] += (
                 padded_total_num_scheduled_tokens - total_num_scheduled_tokens
+            )
 
-            self.set_active_loras(self.input_batch,
-                                  padded_num_scheduled_tokens_per_req)
+            self.set_active_loras(self.input_batch, padded_num_scheduled_tokens_per_req)
 
-        layer_names = get_layers_from_vllm_config(self.vllm_config,
-                                                  Attention).keys()
+        layer_names = get_layers_from_vllm_config(self.vllm_config, Attention).keys()
         per_layer_attn_metadata = {
-            layer_name: attn_metadata
-            for layer_name in layer_names
+            layer_name: attn_metadata for layer_name in layer_names
         }
-        return per_layer_attn_metadata, logits_indices, padded_num_reqs,\
-            num_reqs, end_index
+        return (
+            per_layer_attn_metadata,
+            logits_indices,
+            padded_num_reqs,
+            num_reqs,
+            end_index,
+        )
 
     def _execute_mm_encoder(self, scheduler_output: "SchedulerOutput"):
         scheduled_encoder_inputs = scheduler_output.scheduled_encoder_inputs
@@ -843,10 +919,10 @@ def _execute_mm_encoder(self, scheduler_output: "SchedulerOutput"):
         model = cast(SupportsMultiModal, self.model)
         encoder_outputs = []
         for _, num_items, mm_kwargs_group in group_mm_kwargs_by_modality(
-                mm_kwargs,
-                device=self.device,
-                pin_memory=self.pin_memory,
-                merge_by_field_config=model.merge_by_field_config,
+            mm_kwargs,
+            device=self.device,
+            pin_memory=self.pin_memory,
+            merge_by_field_config=model.merge_by_field_config,
         ):
             # Run the encoder.
             # `curr_group_outputs` is either of the following:
@@ -856,8 +932,7 @@ def _execute_mm_encoder(self, scheduler_output: "SchedulerOutput"):
             # (feature_size, hidden_size) in case the feature size is dynamic
             # depending on the input multimodal items.
             torch_xla.sync(wait=False)
-            curr_group_outputs = model.get_multimodal_embeddings(
-                **mm_kwargs_group)
+            curr_group_outputs = model.get_multimodal_embeddings(**mm_kwargs_group)
             torch_xla.sync(wait=False)
 
             sanity_check_mm_encoder_outputs(
@@ -877,8 +952,9 @@ def _execute_mm_encoder(self, scheduler_output: "SchedulerOutput"):
         # assume to only have whole mm items to process. Hence we avoid the
         # intrinsic dynamism that `scatter_mm_placeholders` introduces.
         for (mm_hash, pos_info), output in zip(mm_hashes_pos, encoder_outputs):
-            assert pos_info.is_embed is None, "Expected all positions to be"\
-                " contiguous and embeddings."
+            assert pos_info.is_embed is None, (
+                "Expected all positions to be contiguous and embeddings."
+            )
             self.encoder_cache[mm_hash] = output
 
     def _gather_mm_embeddings(
@@ -887,7 +963,8 @@ def _gather_mm_embeddings(
     ) -> tuple[list[torch.Tensor], torch.Tensor]:
         total_num_scheduled_tokens = scheduler_output.total_num_scheduled_tokens
         padded_total_num_scheduled_tokens = _get_padded_token_len(
-            self.num_tokens_paddings, total_num_scheduled_tokens)
+            self.num_tokens_paddings, total_num_scheduled_tokens
+        )
 
         is_mm_embed = self.is_mm_embed_cpu
         is_mm_embed[:padded_total_num_scheduled_tokens] = False
@@ -895,8 +972,7 @@ def _gather_mm_embeddings(
         req_start_idx = 0
 
         for req_id in self.input_batch.req_ids:
-            num_scheduled_tokens = scheduler_output.num_scheduled_tokens[
-                req_id]
+            num_scheduled_tokens = scheduler_output.num_scheduled_tokens[req_id]
             req_state = self.requests[req_id]
             num_computed_tokens = req_state.num_computed_tokens
 
@@ -930,23 +1006,21 @@ def _gather_mm_embeddings(
 
                 mm_hash = mm_feature.identifier
                 encoder_output = self.encoder_cache.get(mm_hash, None)
-                assert encoder_output is not None,\
-                      f"Encoder cache miss for {mm_hash}."
+                assert encoder_output is not None, f"Encoder cache miss for {mm_hash}."
 
-                assert pos_info.is_embed is None, "Expected all positions to"\
-                " be contiguous and embeddings."
+                assert pos_info.is_embed is None, (
+                    "Expected all positions to be contiguous and embeddings."
+                )
 
                 req_start_pos = req_start_idx + start_pos - num_computed_tokens
-                is_mm_embed[req_start_pos+start_idx:req_start_pos + end_idx] \
-                    = True
+                is_mm_embed[req_start_pos + start_idx : req_start_pos + end_idx] = True
 
                 # Only whole mm items are processed
                 mm_embeds.append(encoder_output)
 
             req_start_idx += num_scheduled_tokens
 
-        is_mm_embed = is_mm_embed[:padded_total_num_scheduled_tokens] \
-            .to(self.device)
+        is_mm_embed = is_mm_embed[:padded_total_num_scheduled_tokens].to(self.device)
 
         return mm_embeds, is_mm_embed
 
@@ -988,8 +1062,7 @@ def execute_model(
                 # Return empty ModelRunnerOutput if there's no work to do.
                 return EMPTY_MODEL_RUNNER_OUTPUT
 
-            return self.kv_connector_no_forward(scheduler_output,
-                                                self.vllm_config)
+            return self.kv_connector_no_forward(scheduler_output, self.vllm_config)
 
         if self.supports_mm_inputs:
             # Run the multimodal encoder if any.
@@ -1011,41 +1084,48 @@ def execute_model(
             self.maybe_setup_kv_connector(scheduler_output)
 
         while start_index < self.input_batch.num_reqs:
-            attn_metadata, logits_indices, padded_num_reqs, num_reqs,\
-                end_index = self._prepare_inputs(scheduler_output, start_index)
+            attn_metadata, logits_indices, padded_num_reqs, num_reqs, end_index = (
+                self._prepare_inputs(scheduler_output, start_index)
+            )
             input_ids, inputs_embeds = self._get_model_inputs(
-                self.input_ids, mm_embed_inputs)
+                self.input_ids, mm_embed_inputs
+            )
             torch_xla.sync(wait=False)
             # Run the decoder
             with set_forward_context(
-                    attn_metadata,
-                    self.vllm_config,
-                    num_tokens=scheduler_output.total_num_scheduled_tokens):
+                attn_metadata,
+                self.vllm_config,
+                num_tokens=scheduler_output.total_num_scheduled_tokens,
+            ):
                 hidden_states = self.model(
                     input_ids=input_ids,
                     positions=self.position_ids,
                     inputs_embeds=inputs_embeds,
                 )
-            hidden_states = self.select_hidden_states(hidden_states,
-                                                      logits_indices)
+            hidden_states = self.select_hidden_states(hidden_states, logits_indices)
             logits = self.compute_logits(hidden_states)
-            tpu_sampling_metadata = TPUSupportedSamplingMetadata.\
-                from_input_batch(self.input_batch, padded_num_reqs, self.device)
+            tpu_sampling_metadata = TPUSupportedSamplingMetadata.from_input_batch(
+                self.input_batch, padded_num_reqs, self.device
+            )
             if scheduler_output.grammar_bitmask is not None:
-                require_struct_decoding, grammar_bitmask_padded, arange = \
-                    self.prepare_structured_decoding_input(logits,
-                                                           scheduler_output)
-                logits = self.structured_decode(require_struct_decoding,
-                                                grammar_bitmask_padded, logits,
-                                                arange)
+                require_struct_decoding, grammar_bitmask_padded, arange = (
+                    self.prepare_structured_decoding_input(logits, scheduler_output)
+                )
+                logits = self.structured_decode(
+                    require_struct_decoding, grammar_bitmask_padded, logits, arange
+                )
             selected_token_ids = self.sample_from_logits_func(
-                logits, tpu_sampling_metadata)
+                logits, tpu_sampling_metadata
+            )
             # NOTE (NickLucche) Use the original logits (before any penalties or
             # temperature scaling) for the top-k logprobs. We can't enforce it
             # due to recompilations outside torch.compiled code, so just make
             # sure `sample_from_logits` does not modify the logits in-place.
-            logprobs = self.gather_logprobs(logits, selected_token_ids) \
-                if tpu_sampling_metadata.logprobs else None
+            logprobs = (
+                self.gather_logprobs(logits, selected_token_ids)
+                if tpu_sampling_metadata.logprobs
+                else None
+            )
 
             # Remove padding on cpu and keep dynamic op outside of xla graph.
             selected_token_ids = selected_token_ids.cpu()[:num_reqs]
@@ -1061,8 +1141,9 @@ def execute_model(
         # should be called right after each single forward pass,
         # instead of the forwards of the entire input batch.
         self.maybe_wait_for_kv_save()
-        finished_sending, finished_recving = (
-            self.get_finished_kv_transfers(scheduler_output))
+        finished_sending, finished_recving = self.get_finished_kv_transfers(
+            scheduler_output
+        )
 
         selected_token_ids = torch.cat(combined_selected_tokens, dim=0)
         if tpu_sampling_metadata.logprobs:
@@ -1073,16 +1154,15 @@ def concat_lists(input_lists):
                     result.extend(input_list)
                 return result
 
-            logprobs_lists = LogprobsLists(logprob_token_ids=concat_lists(
-                [lp.logprob_token_ids for lp in combined_logprobs]),
-                                           logprobs=concat_lists([
-                                               lp.logprobs
-                                               for lp in combined_logprobs
-                                           ]),
-                                           sampled_token_ranks=concat_lists([
-                                               lp.sampled_token_ranks
-                                               for lp in combined_logprobs
-                                           ]))
+            logprobs_lists = LogprobsLists(
+                logprob_token_ids=concat_lists(
+                    [lp.logprob_token_ids for lp in combined_logprobs]
+                ),
+                logprobs=concat_lists([lp.logprobs for lp in combined_logprobs]),
+                sampled_token_ranks=concat_lists(
+                    [lp.sampled_token_ranks for lp in combined_logprobs]
+                ),
+            )
         else:
             logprobs_lists = None
 
@@ -1094,8 +1174,10 @@ def concat_lists(input_lists):
         for i, req_id in zip(range(num_reqs), self.input_batch.req_ids):
             assert req_id is not None
             req_state = self.requests[req_id]
-            seq_len = (req_state.num_computed_tokens +
-                       scheduler_output.num_scheduled_tokens[req_id])
+            seq_len = (
+                req_state.num_computed_tokens
+                + scheduler_output.num_scheduled_tokens[req_id]
+            )
             if seq_len >= req_state.num_tokens:
                 request_seq_lens.append((i, req_state, seq_len))
             else:
@@ -1111,8 +1193,8 @@ def concat_lists(input_lists):
                 discard_sampled_tokens_req_indices.append(i)
 
         assert all(
-            req_id is not None for req_id in
-            self.input_batch.req_ids[:num_reqs]), "req_ids contains None"
+            req_id is not None for req_id in self.input_batch.req_ids[:num_reqs]
+        ), "req_ids contains None"
         req_ids = cast(list[str], self.input_batch.req_ids[:num_reqs])
 
         prompt_logprobs_dict: dict[str, Optional[LogprobsTensors]] = {}
@@ -1140,22 +1222,24 @@ def concat_lists(input_lists):
             valid_mask = selected_token_ids != INVALID_TOKEN_ID
             gen_lens = valid_mask.sum(dim=1).tolist()
             valid_sampled_token_ids = [
-                seq.tolist()
-                for seq in selected_token_ids[valid_mask].split(gen_lens)
+                seq.tolist() for seq in selected_token_ids[valid_mask].split(gen_lens)
             ]
             self.input_batch.num_tokens[:num_reqs] += gen_lens
             for i, req_state, seq_len in request_seq_lens:
                 target_slice = slice(seq_len - gen_lens[i] + 1, seq_len + 1)
-                self.input_batch.token_ids_cpu[
-                    i, target_slice] = valid_sampled_token_ids[i]
+                self.input_batch.token_ids_cpu[i, target_slice] = (
+                    valid_sampled_token_ids[i]
+                )
                 req_state.output_token_ids.extend(valid_sampled_token_ids[i])
 
-        kv_connector_output = None if (
-            finished_sending is None
-            and finished_recving is None) else KVConnectorOutput(
+        kv_connector_output = (
+            None
+            if (finished_sending is None and finished_recving is None)
+            else KVConnectorOutput(
                 finished_sending=finished_sending,
                 finished_recving=finished_recving,
             )
+        )
 
         model_runner_output = ModelRunnerOutput(
             req_ids=req_ids,
@@ -1178,9 +1262,10 @@ def update_config(self, overrides: dict[str, Any]) -> None:
         # https://github.com/vllm-project/vllm/pull/20095#discussion_r2201497754
         allowed_config_names = {"load_config", "model_config"}
         for config_name, config_overrides in overrides.items():
-            assert config_name in allowed_config_names, \
-                f"Config `{config_name}` not supported. " \
+            assert config_name in allowed_config_names, (
+                f"Config `{config_name}` not supported. "
                 f"Allowed configs: {allowed_config_names}"
+            )
             config = getattr(self, config_name)
             new_config = update_config(config, config_overrides)
             setattr(self, config_name, new_config)
@@ -1199,30 +1284,34 @@ def load_model(self) -> None:
         # the embedding weights.
         xm_tp_rank = xr.global_ordinal()
         with patch(
-                "vllm.model_executor.layers.vocab_parallel_embedding."
-                "get_tensor_model_parallel_rank",
-                return_value=xm_tp_rank):
+            "vllm.model_executor.layers.vocab_parallel_embedding."
+            "get_tensor_model_parallel_rank",
+            return_value=xm_tp_rank,
+        ):
             try:
                 if self.use_spmd:
                     tpu_loader = TPUModelLoader(
-                        load_config=self.vllm_config.load_config)
+                        load_config=self.vllm_config.load_config
+                    )
                     model = tpu_loader.load_model(
                         vllm_config=self.vllm_config,
                         model_config=self.vllm_config.model_config,
-                        mesh=self.mesh)
+                        mesh=self.mesh,
+                    )
                 else:
                     model_loader = get_model_loader(self.load_config)
                     logger.info("Loading model from scratch...")
                     model = model_loader.load_model(
-                        vllm_config=self.vllm_config,
-                        model_config=self.model_config)
+                        vllm_config=self.vllm_config, model_config=self.model_config
+                    )
             except RuntimeError as e:
                 raise RuntimeError(
                     f"Unable to load model, a likely reason is the model is "
                     "too large for the current device's HBM memory. "
                     "Consider switching to a smaller model "
                     "or sharding the weights on more chips. "
-                    f"See the detailed error: {e}") from e
+                    f"See the detailed error: {e}"
+                ) from e
         if self.lora_config is not None:
             model = self.load_lora_model(model, self.vllm_config, self.device)
             replace_set_lora(model)
@@ -1236,44 +1325,43 @@ def load_model(self) -> None:
         self.sampler = TPUSampler()
 
     def reload_weights(self) -> None:
-        assert getattr(self, "model", None) is not None, \
+        assert getattr(self, "model", None) is not None, (
             "Cannot reload weights before model is loaded."
+        )
         model_loader = get_model_loader(self.load_config)
         logger.info("Reloading weights inplace...")
         model_loader.load_weights(self.model, model_config=self.model_config)
 
     @torch.no_grad()
-    def _dummy_run(self, num_tokens: int, num_reqs: int,
-                   num_blocks: int) -> None:
+    def _dummy_run(self, num_tokens: int, num_reqs: int, num_blocks: int) -> None:
         if self.supports_mm_inputs:
             input_ids = None
-            inputs_embeds = torch.zeros((num_tokens, self.hidden_size),
-                                        dtype=self.dtype,
-                                        device=self.device)
+            inputs_embeds = torch.zeros(
+                (num_tokens, self.hidden_size), dtype=self.dtype, device=self.device
+            )
         else:
-            input_ids = torch.zeros((num_tokens),
-                                    dtype=torch.int32).to(self.device)
+            input_ids = torch.zeros((num_tokens), dtype=torch.int32).to(self.device)
             inputs_embeds = None
         actual_num_reqs = min(num_tokens, num_reqs)
-        position_ids = torch.zeros(num_tokens,
-                                   dtype=torch.int32).to(self.device)
+        position_ids = torch.zeros(num_tokens, dtype=torch.int32).to(self.device)
         padded_num_slices = _get_padded_num_kv_cache_update_slices(
-            num_tokens, self.max_num_reqs, self.block_size)
-        num_kv_update_slices = torch.tensor([padded_num_slices],
-                                            dtype=torch.int32).to(self.device)
-        slot_mapping = torch.zeros((3, padded_num_slices),
-                                   dtype=torch.int32).to(self.device)
-        block_tables = torch.zeros((num_reqs, num_blocks),
-                                   dtype=torch.int32).to(self.device)
+            num_tokens, self.max_num_reqs, self.block_size
+        )
+        num_kv_update_slices = torch.tensor([padded_num_slices], dtype=torch.int32).to(
+            self.device
+        )
+        slot_mapping = torch.zeros((3, padded_num_slices), dtype=torch.int32).to(
+            self.device
+        )
+        block_tables = torch.zeros((num_reqs, num_blocks), dtype=torch.int32).to(
+            self.device
+        )
         query_lens = [1] * num_reqs
-        query_start_loc = torch.cumsum(torch.tensor([0] + query_lens,
-                                                    dtype=torch.int32),
-                                       dim=0,
-                                       dtype=torch.int32).to(self.device)
-        context_lens = torch.ones((num_reqs, ),
-                                  dtype=torch.int32).to(self.device)
-        num_seqs = torch.tensor([actual_num_reqs],
-                                dtype=torch.int32).to(self.device)
+        query_start_loc = torch.cumsum(
+            torch.tensor([0] + query_lens, dtype=torch.int32), dim=0, dtype=torch.int32
+        ).to(self.device)
+        context_lens = torch.ones((num_reqs,), dtype=torch.int32).to(self.device)
+        num_seqs = torch.tensor([actual_num_reqs], dtype=torch.int32).to(self.device)
         attn_metadata = PallasMetadata(
             slot_mapping=slot_mapping,
             block_tables=block_tables,
@@ -1281,8 +1369,7 @@ def _dummy_run(self, num_tokens: int, num_reqs: int,
             query_start_loc=query_start_loc,
             num_seqs=num_seqs,
             num_kv_update_slices=num_kv_update_slices,
-            num_slices_per_kv_cache_update_block=self.
-            _num_slices_per_kv_cache_update_block,
+            num_slices_per_kv_cache_update_block=self._num_slices_per_kv_cache_update_block,
         )
 
         if self.supports_mm_inputs:
@@ -1295,27 +1382,29 @@ def _dummy_run(self, num_tokens: int, num_reqs: int,
         torch._dynamo.mark_dynamic(attn_metadata.context_lens, 0)
         torch._dynamo.mark_dynamic(attn_metadata.query_start_loc, 0)
 
-        layer_names = get_layers_from_vllm_config(self.vllm_config,
-                                                  Attention).keys()
+        layer_names = get_layers_from_vllm_config(self.vllm_config, Attention).keys()
         per_layer_attn_metadata = {
-            layer_name: attn_metadata
-            for layer_name in layer_names
+            layer_name: attn_metadata for layer_name in layer_names
         }
 
-        with self.maybe_select_dummy_loras(
-                self.lora_config,
-                np.array([num_tokens], dtype=np.int32)), set_forward_context(
-                    per_layer_attn_metadata, self.vllm_config, 0):
-            out = self.model(input_ids=input_ids,
-                             positions=position_ids,
-                             inputs_embeds=inputs_embeds)
+        with (
+            self.maybe_select_dummy_loras(
+                self.lora_config, np.array([num_tokens], dtype=np.int32)
+            ),
+            set_forward_context(per_layer_attn_metadata, self.vllm_config, 0),
+        ):
+            out = self.model(
+                input_ids=input_ids, positions=position_ids, inputs_embeds=inputs_embeds
+            )
         self._hidden_states_dtype = out.dtype
 
-    def _set_active_loras(self, prompt_lora_mapping, token_lora_mapping,
-                          lora_requests) -> None:
+    def _set_active_loras(
+        self, prompt_lora_mapping, token_lora_mapping, lora_requests
+    ) -> None:
         torch_xla.sync(wait=False)  # Captures input updates
-        super()._set_active_loras(prompt_lora_mapping, token_lora_mapping,
-                                  lora_requests)
+        super()._set_active_loras(
+            prompt_lora_mapping, token_lora_mapping, lora_requests
+        )
         torch_xla.sync(wait=False)  # Captures metadata updates
 
     def _precompile_mm_encoder(self) -> None:
@@ -1332,8 +1421,8 @@ def _precompile_mm_encoder(self) -> None:
 
         for mode, max_items_per_seq in max_items_per_seq_by_modality.items():
             logger.info(
-                "Compiling Multimodal %s Encoder with different input"
-                " shapes.", mode)
+                "Compiling Multimodal %s Encoder with different input shapes.", mode
+            )
             start = time.perf_counter()
             # No padding for MM encoder just yet.
             for num_items in range(1, max_items_per_seq + 1):
@@ -1345,7 +1434,8 @@ def _precompile_mm_encoder(self) -> None:
                 # Run multimodal encoder.
                 torch_xla.sync(wait=False)
                 mm_embeds = self.model.get_multimodal_embeddings(
-                    **batched_dummy_mm_inputs)
+                    **batched_dummy_mm_inputs
+                )
                 torch_xla.sync(wait=False)
                 num_patches = mm_embeds[0].shape[0]
                 items_size = num_patches * num_items
@@ -1359,12 +1449,11 @@ def _precompile_mm_encoder(self) -> None:
                         # XLA Workaround: if torch.zeros(..device) is used, XLA
                         # compiles a scalar+expansion op, which won't match
                         # the graph generated at runtime. CPU->TPU must be used
-                        placeholders_ids = torch.zeros(num_tokens,
-                                                       dtype=torch.int32,
-                                                       device="cpu")
+                        placeholders_ids = torch.zeros(
+                            num_tokens, dtype=torch.int32, device="cpu"
+                        )
                         # Align placeholders and actual num mm_embeddings.
-                        placeholders_ids[:items_size] = \
-                            hf_config.image_token_index
+                        placeholders_ids[:items_size] = hf_config.image_token_index
 
                         placeholders_ids = placeholders_ids.to(self.device)
 
@@ -1382,9 +1471,9 @@ def _precompile_mm_encoder(self) -> None:
             # Pre-compile `get_input_embeddings` when mm_embeddings are not
             # present. Chunk is only made of text, no mm_placeholders.
             for num_tokens in self.num_tokens_paddings:
-                placeholders_ids = torch.zeros(num_tokens,
-                                               dtype=torch.int32,
-                                               device="cpu")
+                placeholders_ids = torch.zeros(
+                    num_tokens, dtype=torch.int32, device="cpu"
+                )
                 placeholders_ids = placeholders_ids.to(self.device)
                 a, b = self._get_model_inputs(
                     placeholders_ids,
@@ -1396,19 +1485,25 @@ def _precompile_mm_encoder(self) -> None:
             xm.wait_device_ops()
             end = time.perf_counter()
             logger.info(
-                "Multimodal %s Encoder compilation finished in in %.2f "
-                "[secs].", mode, end - start)
+                "Multimodal %s Encoder compilation finished in in %.2f [secs].",
+                mode,
+                end - start,
+            )
 
     def _precompile_backbone(self) -> None:
         logger.info("Compiling the model with different input shapes.")
         start = time.perf_counter()
         for num_tokens in self.num_tokens_paddings:
             logger.info("  -- num_tokens: %d", num_tokens)
-            self._dummy_run(num_tokens, self.num_reqs_max_model_len,
-                            self.max_num_blocks_per_req)
+            self._dummy_run(
+                num_tokens, self.num_reqs_max_model_len, self.max_num_blocks_per_req
+            )
             if self.most_model_len is not None:
-                self._dummy_run(num_tokens, self.num_reqs_most_model_len,
-                                self.num_blocks_per_most_len_req)
+                self._dummy_run(
+                    num_tokens,
+                    self.num_reqs_most_model_len,
+                    self.num_blocks_per_most_len_req,
+                )
         xm.wait_device_ops()
         end = time.perf_counter()
         logger.info("Compilation finished in %.2f [secs].", end - start)
@@ -1417,23 +1512,19 @@ def _precompile_backbone(self) -> None:
     def _precompile_select_hidden_states(self) -> None:
         # Compile hidden state selection function for bucketed
         # n_tokens x max_num_reqs. Graph is really small so this is fine.
-        logger.info(
-            "Compiling select_hidden_states with different input shapes.")
+        logger.info("Compiling select_hidden_states with different input shapes.")
         start = time.perf_counter()
         hsize = self.model_config.get_hidden_size()
         for num_tokens in self.num_tokens_paddings:
-            dummy_hidden = torch.zeros((num_tokens, hsize),
-                                       device=self.device,
-                                       dtype=self._hidden_states_dtype)
+            dummy_hidden = torch.zeros(
+                (num_tokens, hsize), device=self.device, dtype=self._hidden_states_dtype
+            )
             torch._dynamo.mark_dynamic(dummy_hidden, 0)
             for num_reqs in self.num_reqs_paddings:
-                indices = torch.zeros(num_reqs,
-                                      dtype=torch.int32,
-                                      device=self.device)
+                indices = torch.zeros(num_reqs, dtype=torch.int32, device=self.device)
                 torch._dynamo.mark_dynamic(indices, 0)
                 self.select_hidden_states(dummy_hidden, indices)
-                logger.info("  -- num_tokens: %d, num_seqs: %d", num_tokens,
-                            num_reqs)
+                logger.info("  -- num_tokens: %d, num_seqs: %d", num_tokens, num_reqs)
                 # Requests can't be more than tokens. But do compile for the
                 # next bigger value in case num_tokens uses bucketed padding.
                 if num_reqs >= min(num_tokens, self.max_num_reqs):
@@ -1448,9 +1539,9 @@ def _precompile_compute_logits(self) -> None:
         start = time.perf_counter()
         hsize = self.model_config.get_hidden_size()
         for num_reqs in self.num_reqs_paddings:
-            dummy_hidden = torch.zeros((num_reqs, hsize),
-                                       device=self.device,
-                                       dtype=self._hidden_states_dtype)
+            dummy_hidden = torch.zeros(
+                (num_reqs, hsize), device=self.device, dtype=self._hidden_states_dtype
+            )
             torch._dynamo.mark_dynamic(dummy_hidden, 0)
             self.compute_logits(dummy_hidden)
             logger.info("  -- num_seqs: %d", num_reqs)
@@ -1460,23 +1551,28 @@ def _precompile_compute_logits(self) -> None:
         self._update_num_xla_graphs("compute_logits")
 
     def _precompile_structured_decoding(self) -> None:
-        logger.info(
-            "Compiling structured_decoding with different input shapes.")
+        logger.info("Compiling structured_decoding with different input shapes.")
         start = time.perf_counter()
         for num_reqs in self.num_reqs_paddings:
-            dummy_logits = torch.zeros((num_reqs, self.vocab_size),
-                                       device=self.device,
-                                       dtype=self._hidden_states_dtype)
-            dummy_require_struct_decoding = \
-                self.require_structured_out_cpu[:num_reqs].to(self.device)
-            dummy_grammar_bitmask = \
-                self.grammar_bitmask_cpu[:num_reqs].to(self.device)
+            dummy_logits = torch.zeros(
+                (num_reqs, self.vocab_size),
+                device=self.device,
+                dtype=self._hidden_states_dtype,
+            )
+            dummy_require_struct_decoding = self.require_structured_out_cpu[
+                :num_reqs
+            ].to(self.device)
+            dummy_grammar_bitmask = self.grammar_bitmask_cpu[:num_reqs].to(self.device)
             # The first dimension of the above 3 dummy tensors cannot be
             # mark_dynamic because some operations in structured_decode require
             # them to be static.
             arange = self.structured_decode_arange.to(self.device)
-            self.structured_decode(dummy_require_struct_decoding,
-                                   dummy_grammar_bitmask, dummy_logits, arange)
+            self.structured_decode(
+                dummy_require_struct_decoding,
+                dummy_grammar_bitmask,
+                dummy_logits,
+                arange,
+            )
             logger.info("  -- num_seqs: %d", num_reqs)
         xm.wait_device_ops()
         end = time.perf_counter()
@@ -1484,30 +1580,29 @@ def _precompile_structured_decoding(self) -> None:
         self._update_num_xla_graphs("structured_decoding")
 
     def _precompile_sample_from_logits(self) -> None:
-        logger.info(
-            "Compiling sample_from_logits with different input shapes.")
+        logger.info("Compiling sample_from_logits with different input shapes.")
         start = time.perf_counter()
         for num_reqs in self.num_reqs_paddings:
-            dummy_logits = torch.zeros((num_reqs, self.vocab_size),
-                                       device=self.device,
-                                       dtype=self._hidden_states_dtype)
+            dummy_logits = torch.zeros(
+                (num_reqs, self.vocab_size),
+                device=self.device,
+                dtype=self._hidden_states_dtype,
+            )
             # The first dimension of dummy_logits cannot be mark_dynamic
             # because some operations in the sampler require it to be static.
             for all_greedy in [False, True]:
                 generate_params_if_all_greedy = not all_greedy
-                sampling_metadata = (
-                    TPUSupportedSamplingMetadata.from_input_batch(
-                        self.input_batch,
-                        num_reqs,
-                        self.device,
-                        generate_params_if_all_greedy,
-                    ))
+                sampling_metadata = TPUSupportedSamplingMetadata.from_input_batch(
+                    self.input_batch,
+                    num_reqs,
+                    self.device,
+                    generate_params_if_all_greedy,
+                )
                 sampling_metadata.all_greedy = all_greedy
                 with self.maybe_select_dummy_loras(
-                        self.lora_config, np.array([num_reqs],
-                                                   dtype=np.int32)):
-                    self.sample_from_logits_func(dummy_logits,
-                                                 sampling_metadata)
+                    self.lora_config, np.array([num_reqs], dtype=np.int32)
+                ):
+                    self.sample_from_logits_func(dummy_logits, sampling_metadata)
             logger.info("  -- num_seqs: %d", num_reqs)
         xm.wait_device_ops()
         end = time.perf_counter()
@@ -1518,13 +1613,15 @@ def _precompile_gather_logprobs(self) -> None:
         logger.info("Compiling gather_logprobs with different input shapes.")
         start = time.perf_counter()
         for num_reqs in self.num_reqs_paddings:
-            dummy_logits = torch.zeros((num_reqs, self.vocab_size),
-                                       device=self.device,
-                                       dtype=self._hidden_states_dtype)
-            dummy_tokens = torch.zeros((num_reqs, 1),
-                                       dtype=torch.int64).to(self.device)
+            dummy_logits = torch.zeros(
+                (num_reqs, self.vocab_size),
+                device=self.device,
+                dtype=self._hidden_states_dtype,
+            )
+            dummy_tokens = torch.zeros((num_reqs, 1), dtype=torch.int64).to(self.device)
             with self.maybe_select_dummy_loras(
-                    self.lora_config, np.array([num_reqs], dtype=np.int32)):
+                self.lora_config, np.array([num_reqs], dtype=np.int32)
+            ):
                 self.gather_logprobs(dummy_logits, dummy_tokens)
             logger.info("  -- num_seqs: %d", num_reqs)
         xm.wait_device_ops()
@@ -1554,7 +1651,8 @@ def profile_run(
             if self.model_config.multimodal_config.skip_mm_profiling:
                 logger.info(
                     "Skipping memory profiling for multimodal encoder and "
-                    "encoder cache.")
+                    "encoder cache."
+                )
             else:
                 mm_budget = self.mm_budget
                 assert mm_budget is not None
@@ -1565,8 +1663,9 @@ def profile_run(
                     # modality with the max possible input tokens even when
                     # it supports multiple.
                     dummy_modality = mm_budget.get_modality_with_max_tokens()
-                    max_mm_items_per_batch = mm_budget \
-                        .max_items_per_batch_by_modality[dummy_modality]
+                    max_mm_items_per_batch = mm_budget.max_items_per_batch_by_modality[
+                        dummy_modality
+                    ]
 
                     logger.info(
                         "Encoder cache will be initialized with a budget of "
@@ -1588,15 +1687,16 @@ def profile_run(
                     # impact of recompilation until it's fixed.
                     start = time.perf_counter()
                     torch_xla.sync(wait=False)
-                    dummy_encoder_outputs = \
-                        self.model.get_multimodal_embeddings(
-                        **batched_dummy_mm_inputs)
+                    dummy_encoder_outputs = self.model.get_multimodal_embeddings(
+                        **batched_dummy_mm_inputs
+                    )
                     torch_xla.sync(wait=False)
                     xm.wait_device_ops()
                     end = time.perf_counter()
                     logger.info(
                         "Multimodal Encoder profiling finished in %.2f [secs].",
-                        end - start)
+                        end - start,
+                    )
 
                     sanity_check_mm_encoder_outputs(
                         dummy_encoder_outputs,
@@ -1604,15 +1704,18 @@ def profile_run(
                     )
 
                     # Cache the dummy encoder outputs.
-                    self.encoder_cache["tmp"] = dict(
-                        enumerate(dummy_encoder_outputs))
+                    self.encoder_cache["tmp"] = dict(enumerate(dummy_encoder_outputs))
 
         # Trigger compilation for general shape.
-        self._dummy_run(num_tokens, self.num_reqs_max_model_len,
-                        self.max_num_blocks_per_req)
+        self._dummy_run(
+            num_tokens, self.num_reqs_max_model_len, self.max_num_blocks_per_req
+        )
         if self.most_model_len is not None:
-            self._dummy_run(num_tokens, self.num_reqs_most_model_len,
-                            self.num_blocks_per_most_len_req)
+            self._dummy_run(
+                num_tokens,
+                self.num_reqs_most_model_len,
+                self.num_blocks_per_most_len_req,
+            )
 
         torch_xla.sync(wait=False)
         xm.wait_device_ops()
@@ -1637,10 +1740,8 @@ def maybe_setup_cross_layer_kv_sharing(
             kv_cache_config.kv_cache_groups,
         )
 
-        for layer_name, target_layer_name in self.shared_kv_cache_layers.items(
-        ):
-            logger.debug("%s reuses KV cache of %s", layer_name,
-                         target_layer_name)
+        for layer_name, target_layer_name in self.shared_kv_cache_layers.items():
+            logger.debug("%s reuses KV cache of %s", layer_name, target_layer_name)
             kv_caches[layer_name] = kv_caches[target_layer_name]
 
     def initialize_kv_cache(self, kv_cache_config: KVCacheConfig) -> None:
@@ -1652,11 +1753,13 @@ def initialize_kv_cache(self, kv_cache_config: KVCacheConfig) -> None:
         """
         if len(kv_cache_config.kv_cache_groups) > 1:
             raise NotImplementedError(
-                "Hybrid models with more than one KV cache type are not "
-                "supported yet.")
+                "Hybrid models with more than one KV cache type are not supported yet."
+            )
 
-        if kv_cache_config.kv_cache_groups[
-                0].kv_cache_spec.block_size != self.block_size:
+        if (
+            kv_cache_config.kv_cache_groups[0].kv_cache_spec.block_size
+            != self.block_size
+        ):
             self.input_batch = InputBatch(
                 max_num_reqs=self.max_num_reqs,
                 max_model_len=self.max_model_len,
@@ -1669,14 +1772,16 @@ def initialize_kv_cache(self, kv_cache_config: KVCacheConfig) -> None:
                 ],
             )
         # Verify dtype compatibility between block_table_cpu and input_batch
-        assert self.block_table_cpu.dtype == self.input_batch.block_table[
-            0].get_cpu_tensor().dtype
+        assert (
+            self.block_table_cpu.dtype
+            == self.input_batch.block_table[0].get_cpu_tensor().dtype
+        )
 
         kv_cache_sizes = {}
         for kv_cache_tensor in kv_cache_config.kv_cache_tensors:
             assert len(kv_cache_tensor.shared_by) == 1, (
-                "KV cache tensor shared by multiple layers is not supported in "
-                "TPU.")
+                "KV cache tensor shared by multiple layers is not supported in TPU."
+            )
             kv_cache_sizes[kv_cache_tensor.shared_by[0]] = kv_cache_tensor.size
 
         kv_caches: dict[str, torch.Tensor] = {}
@@ -1690,19 +1795,23 @@ def initialize_kv_cache(self, kv_cache_config: KVCacheConfig) -> None:
                     if self.use_spmd:
                         num_kv_heads = kv_cache_spec.num_kv_heads
                         assert self.original_parallel_config is not None
-                        tp_size = \
-                            self.original_parallel_config.tensor_parallel_size
+                        tp_size = self.original_parallel_config.tensor_parallel_size
                         # TODO: Handle kv cache duplication under SPMD mode.
                         assert num_kv_heads % tp_size == 0, (
                             f"num_kv_heads {num_kv_heads} must be divisible by "
-                            f"tp_size {tp_size} under SPMD mode")
+                            f"tp_size {tp_size} under SPMD mode"
+                        )
                     kv_cache_shape = PallasAttentionBackend.get_kv_cache_shape(
-                        num_blocks, kv_cache_spec.block_size,
-                        kv_cache_spec.num_kv_heads, kv_cache_spec.head_size)
+                        num_blocks,
+                        kv_cache_spec.block_size,
+                        kv_cache_spec.num_kv_heads,
+                        kv_cache_spec.head_size,
+                    )
                     dtype = kv_cache_spec.dtype
 
-                    tpu_kv_cache = torch.zeros(kv_cache_shape,
-                                               dtype=dtype).to(self.device)
+                    tpu_kv_cache = torch.zeros(kv_cache_shape, dtype=dtype).to(
+                        self.device
+                    )
 
                     kv_caches[layer_name] = tpu_kv_cache
                 else:
@@ -1714,19 +1823,19 @@ def initialize_kv_cache(self, kv_cache_config: KVCacheConfig) -> None:
         bind_kv_cache(
             kv_caches,
             self.vllm_config.compilation_config.static_forward_context,
-            self.kv_caches)
+            self.kv_caches,
+        )
 
         if self.use_spmd:
             # Shard KV Cache
             for cache in self.kv_caches:
-                xs.mark_sharding(cache, self.mesh, (None, 'x', None, None))
+                xs.mark_sharding(cache, self.mesh, (None, "x", None, None))
 
         if has_kv_transfer_group():
             get_kv_transfer_group().register_kv_caches(kv_caches)
             get_kv_transfer_group().set_host_xfer_buffer_ops(copy_kv_blocks)
 
     def reset_dynamo_cache(self):
-
         # NOTE: We check `is_multimodal_model` instead of `supports_mm_inputs`
         # since the compiled model object of the language backbone of a
         # multimodal model needs to be extracted via `get_language_model`.
@@ -1737,7 +1846,8 @@ def reset_dynamo_cache(self):
         if isinstance(compiled_model, TorchCompileWrapperWithCustomDispatcher):
             logger.info("Clear dynamo cache and cached dynamo bytecode.")
             torch._dynamo.eval_frame.remove_from_cache(
-                compiled_model.original_code_object)
+                compiled_model.original_code_object
+            )
             compiled_model.compiled_codes.clear()
 
     @torch.compile(backend="openxla", fullgraph=True, dynamic=False)
@@ -1745,30 +1855,29 @@ def select_hidden_states(self, hidden_states, indices_do_sample):
         return hidden_states[indices_do_sample]
 
     @torch.compile(backend="openxla", fullgraph=True, dynamic=False)
-    def compute_logits(self,
-                       sample_hidden_states: torch.Tensor) -> torch.Tensor:
+    def compute_logits(self, sample_hidden_states: torch.Tensor) -> torch.Tensor:
         return self.model.compute_logits(sample_hidden_states)
 
     # TODO: Under SPMD mode, sample_from_logits has correctness issue.
     #       Re-enable the torch.compile once the issue is fixed in torchxla.
     # @torch.compile(backend="openxla", fullgraph=True, dynamic=False)
     def sample_from_logits(
-            self, logits: torch.Tensor,
-            sampling_metadata: TPUSupportedSamplingMetadata) -> torch.Tensor:
+        self, logits: torch.Tensor, sampling_metadata: TPUSupportedSamplingMetadata
+    ) -> torch.Tensor:
         """
-        Sample with xla-friendly function. This function is to be traced 
+        Sample with xla-friendly function. This function is to be traced
         separately from `forward` for lighter compilation overhead.
         """
         if sampling_metadata.all_greedy:
             out_tokens = torch.argmax(logits, dim=-1, keepdim=True)
         else:
-            out_tokens = self.sampler(logits,
-                                      sampling_metadata).sampled_token_ids
+            out_tokens = self.sampler(logits, sampling_metadata).sampled_token_ids
         return out_tokens
 
     @torch.compile(backend="openxla", fullgraph=True, dynamic=False)
-    def gather_logprobs(self, logits: torch.Tensor,
-                        sampled_tokens: torch.Tensor) -> LogprobsTensors:
+    def gather_logprobs(
+        self, logits: torch.Tensor, sampled_tokens: torch.Tensor
+    ) -> LogprobsTensors:
         """
         Gather the top_logprobs with corresponding tokens. Use a fixed number
         of logprobs as an alternative to having multiple pre-compiled graphs.
@@ -1778,28 +1887,37 @@ def gather_logprobs(self, logits: torch.Tensor,
         return self.sampler.gather_logprobs(
             logprobs,
             self.model_config.max_logprobs,
-            token_ids=sampled_tokens.squeeze(-1))
+            token_ids=sampled_tokens.squeeze(-1),
+        )
 
     @torch.compile(backend="openxla", fullgraph=True, dynamic=False)
-    def structured_decode(self, require_struct_decoding: torch.Tensor,
-                          grammar_bitmask: torch.Tensor, logits: torch.Tensor,
-                          arange: torch.Tensor) -> torch.Tensor:
+    def structured_decode(
+        self,
+        require_struct_decoding: torch.Tensor,
+        grammar_bitmask: torch.Tensor,
+        logits: torch.Tensor,
+        arange: torch.Tensor,
+    ) -> torch.Tensor:
         return torch.where(
             require_struct_decoding,
             self.apply_grammar_bitmask(logits, grammar_bitmask, arange),
-            logits)
+            logits,
+        )
 
-    def apply_grammar_bitmask(self, logits: torch.Tensor,
-                              grammar_bitmask: torch.Tensor,
-                              arange: torch.Tensor):
-        assert (logits.shape[0] == grammar_bitmask.shape[0])
+    def apply_grammar_bitmask(
+        self, logits: torch.Tensor, grammar_bitmask: torch.Tensor, arange: torch.Tensor
+    ):
+        assert logits.shape[0] == grammar_bitmask.shape[0]
         logits_cloned = logits.clone()
         for i in range(logits.shape[0]):
-            unpacked_bitmask = (torch.bitwise_right_shift(
-                grammar_bitmask[i][:, None], arange[None, :]) & 1) == 0
-            unpacked_bitmask = unpacked_bitmask.reshape(-1)[:self.vocab_size]
+            unpacked_bitmask = (
+                torch.bitwise_right_shift(grammar_bitmask[i][:, None], arange[None, :])
+                & 1
+            ) == 0
+            unpacked_bitmask = unpacked_bitmask.reshape(-1)[: self.vocab_size]
             logits_cloned[i] = logits_cloned[i].masked_fill(
-                unpacked_bitmask, -float("inf"))
+                unpacked_bitmask, -float("inf")
+            )
         return logits_cloned
 
     def get_multimodal_embeddings(self, *args, **kwargs):
@@ -1821,23 +1939,27 @@ def prepare_structured_decoding_input(
 
         sorted_struct_requests = sorted(
             scheduler_output.structured_output_request_ids.items(),
-            key=lambda item: item[1])
+            key=lambda item: item[1],
+        )
         cumulative_mask_idx = 0
         for req_id, _ in sorted_struct_requests:
             if req_id not in self.input_batch.req_id_to_index:
                 continue
             batch_index = self.input_batch.req_id_to_index[req_id]
             self.grammar_bitmask_cpu[batch_index] = torch.from_numpy(
-                grammar_bitmask[cumulative_mask_idx])
+                grammar_bitmask[cumulative_mask_idx]
+            )
             # It's not guaranteed that all requests in this batch require
             # structured output, so create a bool tensor to represent
             # the requests that need structured output.
             self.require_structured_out_cpu[batch_index] = True
             cumulative_mask_idx += 1
 
-        return self.require_structured_out_cpu[:num_reqs].to(logits.device), \
-            self.grammar_bitmask_cpu[:num_reqs].to(logits.device), \
-            self.structured_decode_arange.to(logits.device)
+        return (
+            self.require_structured_out_cpu[:num_reqs].to(logits.device),
+            self.grammar_bitmask_cpu[:num_reqs].to(logits.device),
+            self.structured_decode_arange.to(logits.device),
+        )
 
     def _get_mm_dummy_batch(
         self,
@@ -1860,13 +1982,15 @@ def _get_mm_dummy_batch(
         dummy_mm_items = [dummy_mm_item] * max_items_per_batch
 
         model = cast(SupportsMultiModal, self.model)
-        return next(grouped_mm_kwargs
-                    for _, _, grouped_mm_kwargs in group_mm_kwargs_by_modality(
-                        dummy_mm_items,
-                        device=self.device,
-                        pin_memory=self.pin_memory,
-                        merge_by_field_config=model.merge_by_field_config,
-                    ))
+        return next(
+            grouped_mm_kwargs
+            for _, _, grouped_mm_kwargs in group_mm_kwargs_by_modality(
+                dummy_mm_items,
+                device=self.device,
+                pin_memory=self.pin_memory,
+                merge_by_field_config=model.merge_by_field_config,
+            )
+        )
 
 
 def _get_req_paddings(min_req_size: int, max_req_size: int) -> list[int]:
@@ -1887,9 +2011,10 @@ def _get_padded_num_reqs_with_upper_limit(x: int, upper_limit: int) -> int:
     return min(res, upper_limit)
 
 
-def _get_token_paddings(min_token_size: int, max_token_size: int,
-                        padding_gap: int) -> list[int]:
-    """Generate a list of padding size, starting from min_token_size, 
+def _get_token_paddings(
+    min_token_size: int, max_token_size: int, padding_gap: int
+) -> list[int]:
+    """Generate a list of padding size, starting from min_token_size,
     ending with a number that can cover max_token_size
 
     If padding_gap == 0 then:
@@ -1927,15 +2052,15 @@ def _get_token_paddings(min_token_size: int, max_token_size: int,
 
 
 def _get_padded_token_len(paddings: list[int], x: int) -> int:
-    """Return the first element in paddings list greater or equal to x.
-    """
+    """Return the first element in paddings list greater or equal to x."""
     index = bisect.bisect_left(paddings, x)
     assert index < len(paddings)
     return paddings[index]
 
 
-def _get_padded_num_kv_cache_update_slices(num_tokens: int, max_num_reqs: int,
-                                           page_size: int) -> int:
+def _get_padded_num_kv_cache_update_slices(
+    num_tokens: int, max_num_reqs: int, page_size: int
+) -> int:
     """Calculates the padded number of KV cache update slices to avoid
     recompilation."""
     # NOTE(chengjiyao): let's say R_i is the token num for i-th request,
@@ -1971,7 +2096,6 @@ def _get_num_slices_per_kv_cache_update_block(page_size_bytes: int) -> int:
 
 
 def replace_set_lora(model):
-
     def _tpu_set_lora(
         self,
         index: int,
@@ -1995,5 +2119,4 @@ def _tpu_reset_lora(self, index: int):
             module._original_set_lora = module.set_lora
             module._original_reset_lora = module.reset_lora
             module.set_lora = _tpu_set_lora.__get__(module, module.__class__)
-            module.reset_lora = _tpu_reset_lora.__get__(
-                module, module.__class__)
+            module.reset_lora = _tpu_reset_lora.__get__(module, module.__class__)
diff --git a/vllm/v1/worker/tpu_worker.py b/vllm/v1/worker/tpu_worker.py
index d4f0a65f2a16..66515c7e5786 100644
--- a/vllm/v1/worker/tpu_worker.py
+++ b/vllm/v1/worker/tpu_worker.py
@@ -11,10 +11,14 @@
 
 import vllm.envs as envs
 from vllm.config import VllmConfig
-from vllm.distributed import (ensure_model_parallel_initialized,
-                              init_distributed_environment)
-from vllm.distributed.kv_transfer import (ensure_kv_transfer_initialized,
-                                          has_kv_transfer_group)
+from vllm.distributed import (
+    ensure_model_parallel_initialized,
+    init_distributed_environment,
+)
+from vllm.distributed.kv_transfer import (
+    ensure_kv_transfer_initialized,
+    has_kv_transfer_group,
+)
 from vllm.logger import init_logger
 from vllm.lora.request import LoRARequest
 from vllm.model_executor import set_random_seed
@@ -23,8 +27,7 @@
 from vllm.tasks import SupportedTask
 from vllm.utils import STR_DTYPE_TO_TORCH_DTYPE, cdiv
 from vllm.v1.core.sched.output import SchedulerOutput
-from vllm.v1.kv_cache_interface import (AttentionSpec, KVCacheConfig,
-                                        KVCacheSpec)
+from vllm.v1.kv_cache_interface import AttentionSpec, KVCacheConfig, KVCacheSpec
 from vllm.v1.outputs import ModelRunnerOutput
 from vllm.v1.utils import report_usage_stats
 from vllm.v1.worker.utils import bind_kv_cache
@@ -44,7 +47,6 @@
 
 
 class TPUWorker:
-
     def __init__(
         self,
         vllm_config: VllmConfig,
@@ -82,12 +84,12 @@ def __init__(
         if self.cache_config.cache_dtype == "auto":
             self.cache_dtype = self.model_config.dtype
         else:
-            self.cache_dtype = STR_DTYPE_TO_TORCH_DTYPE[
-                self.cache_config.cache_dtype]
+            self.cache_dtype = STR_DTYPE_TO_TORCH_DTYPE[self.cache_config.cache_dtype]
 
         if self.model_config.trust_remote_code:
             # note: lazy import to avoid importing torch before initializing
             from vllm.utils import init_cached_hf_modules
+
             init_cached_hf_modules()
 
         # Delay profiler initialization to the start of the profiling.
@@ -100,14 +102,14 @@ def __init__(
             # For TPU, we can only have 1 active profiler session for 1 profiler
             # server. So we only profile on rank0.
             self.profile_dir = envs.VLLM_TORCH_PROFILER_DIR
-            logger.info("Profiling enabled. Traces will be saved to: %s",
-                        self.profile_dir)
+            logger.info(
+                "Profiling enabled. Traces will be saved to: %s", self.profile_dir
+            )
 
         if self.model_config.seed is None:
             self.model_config.seed = 0
 
-    def initialize_cache(self, num_gpu_blocks: int,
-                         num_cpu_blocks: int) -> None:
+    def initialize_cache(self, num_gpu_blocks: int, num_cpu_blocks: int) -> None:
         self.cache_config.num_gpu_blocks = num_gpu_blocks
         self.cache_config.num_cpu_blocks = num_cpu_blocks
 
@@ -118,9 +120,10 @@ def init_device(self):
         # `xla_tpu_force_1d_allreduce_at_chunk_count` is a temporary solution to
         # fix this. It will be removed after the bug in XLA compiler is fixed.
         os.environ["LIBTPU_INIT_ARGS"] = (
-            os.environ.get("LIBTPU_INIT_ARGS", "") +
-            " --xla_tpu_force_1d_allreduce_at_chunk_count=1"
-            " --xla_jf_conv_input_fusion=False")
+            os.environ.get("LIBTPU_INIT_ARGS", "")
+            + " --xla_tpu_force_1d_allreduce_at_chunk_count=1"
+            " --xla_jf_conv_input_fusion=False"
+        )
         # --xla_jf_conv_input_fusion=False is used to improve the perf of
         # quantized matmul.
         torch.set_grad_enabled(False)
@@ -128,8 +131,8 @@ def init_device(self):
 
         # Initialize the distributed environment.
         self._init_tpu_worker_distributed_environment(
-            self.vllm_config, self.rank, self.distributed_init_method,
-            self.local_rank)
+            self.vllm_config, self.rank, self.distributed_init_method, self.local_rank
+        )
 
         # Device initialization should happen after initializing
         # the distributed runtime.
@@ -158,14 +161,15 @@ def init_device(self):
         # cache during development is recommended.We can disable it by
         # `export VLLM_XLA_CACHE_PATH=`
         if envs.VLLM_XLA_CACHE_PATH:
-            per_rank_path = os.path.join(envs.VLLM_XLA_CACHE_PATH,
-                                         f"tp{world_size}_rank{rank}")
+            per_rank_path = os.path.join(
+                envs.VLLM_XLA_CACHE_PATH, f"tp{world_size}_rank{rank}"
+            )
             xr.initialize_cache(per_rank_path, readonly=False)
 
         # Init ModelRunner here, so that we have access to self.device.
-        self.model_runner = \
-            TPUModelRunner(self.vllm_config, self.device,
-                           self.original_parallel_config)
+        self.model_runner = TPUModelRunner(
+            self.vllm_config, self.device, self.original_parallel_config
+        )
 
         if rank == 0:
             # If usage stat is enabled, collect relevant info.
@@ -184,13 +188,15 @@ def determine_available_memory(self) -> int:
                 kv_caches[layer_name] = tpu_kv_cache
             else:
                 raise NotImplementedError(
-                    f"Unsupported KV cache spec '{type(layer_spec)}'")
+                    f"Unsupported KV cache spec '{type(layer_spec)}'"
+                )
 
         runner_kv_caches: list[torch.Tensor] = []
         bind_kv_cache(
             kv_caches,
             self.vllm_config.compilation_config.static_forward_context,
-            runner_kv_caches)
+            runner_kv_caches,
+        )
 
         # `max_num_tokens >= max_num_batched_tokens` due to padding.
         with self.model_runner.maybe_setup_dummy_loras(self.lora_config):
@@ -215,6 +221,7 @@ def determine_available_memory(self) -> int:
             # TODO: use xm.get_memory_info for SPMD once it's supported in
             # PyTorch/XLA.
             import tpu_info
+
             chip_type, _ = tpu_info.device.get_local_chips()
             device_usage = tpu_info.metrics.get_chip_usage(chip_type)
             total_memory_size = device_usage[0].total_memory
@@ -231,20 +238,20 @@ def determine_available_memory(self) -> int:
         profiled = current_mem * 1.02
 
         # Calculate the TPU KV cache size based on profiling.
-        usable_memory_size = int(total_memory_size *
-                                 self.cache_config.gpu_memory_utilization)
+        usable_memory_size = int(
+            total_memory_size * self.cache_config.gpu_memory_utilization
+        )
         tpu_kv_cache_bytes = max(usable_memory_size - profiled, 0)
         head_size = self.model_config.get_head_size()
         if head_size > 0:
-            padded_head_size = cdiv(
-                head_size, TPU_HEAD_SIZE_ALIGNMENT) * TPU_HEAD_SIZE_ALIGNMENT
+            padded_head_size = (
+                cdiv(head_size, TPU_HEAD_SIZE_ALIGNMENT) * TPU_HEAD_SIZE_ALIGNMENT
+            )
             if padded_head_size != head_size:
-                logger.warning_once("head size is padded to %d",
-                                    padded_head_size)
+                logger.warning_once("head size is padded to %d", padded_head_size)
             # We adjust the usable memory size for the KV cache to prevent OOM
             # errors, even after padding the head_size.
-            tpu_kv_cache_bytes = (tpu_kv_cache_bytes * head_size //
-                                  padded_head_size)
+            tpu_kv_cache_bytes = tpu_kv_cache_bytes * head_size // padded_head_size
         return int(tpu_kv_cache_bytes)
 
     def execute_model(
@@ -253,8 +260,7 @@ def execute_model(
     ) -> Optional[ModelRunnerOutput]:
         output = self.model_runner.execute_model(scheduler_output)
         # every worker's output is needed when kv_transfer_group is set up
-        return output if self.is_driver_worker or has_kv_transfer_group(
-        ) else None
+        return output if self.is_driver_worker or has_kv_transfer_group() else None
 
     def profile(self, is_start: bool = True):
         if self.rank < 1:
@@ -327,8 +333,8 @@ def _init_tpu_worker_distributed_environment(
             backend=current_platform.dist_backend,
         )
         ensure_model_parallel_initialized(
-            parallel_config.tensor_parallel_size,
-            parallel_config.pipeline_parallel_size)
+            parallel_config.tensor_parallel_size, parallel_config.pipeline_parallel_size
+        )
 
         ensure_kv_transfer_initialized(vllm_config)
 
diff --git a/vllm/v1/worker/ubatch_splitting.py b/vllm/v1/worker/ubatch_splitting.py
index 7767750aa604..6723239e8495 100644
--- a/vllm/v1/worker/ubatch_splitting.py
+++ b/vllm/v1/worker/ubatch_splitting.py
@@ -10,8 +10,11 @@
 from vllm.forward_context import DPMetadata
 from vllm.logger import init_logger
 from vllm.utils import round_up
-from vllm.v1.worker.ubatch_utils import (UBatchSlice, UBatchSlices,
-                                         is_second_ubatch_empty)
+from vllm.v1.worker.ubatch_utils import (
+    UBatchSlice,
+    UBatchSlices,
+    is_second_ubatch_empty,
+)
 
 logger = init_logger(__name__)
 
@@ -24,14 +27,18 @@ def should_ubatch_with_num_tokens(
 ) -> tuple[bool, Optional[torch.Tensor]]:
     dp_size = vllm_config.parallel_config.data_parallel_size
     dp_rank = vllm_config.parallel_config.data_parallel_rank
-    return DPMetadata.should_ubatch_across_dp(should_ubatch,
-                                              orig_num_tokens_per_ubatch,
-                                              padded_num_tokens_per_ubatch,
-                                              dp_size, dp_rank)
+    return DPMetadata.should_ubatch_across_dp(
+        should_ubatch,
+        orig_num_tokens_per_ubatch,
+        padded_num_tokens_per_ubatch,
+        dp_size,
+        dp_rank,
+    )
 
 
-def check_ubatch_thresholds(config: ParallelConfig, num_tokens: int,
-                            uniform_decode: bool) -> bool:
+def check_ubatch_thresholds(
+    config: ParallelConfig, num_tokens: int, uniform_decode: bool
+) -> bool:
     if not config.enable_dbo:
         return False
     if uniform_decode:
@@ -41,9 +48,11 @@ def check_ubatch_thresholds(config: ParallelConfig, num_tokens: int,
 
 
 def get_dp_padding_ubatch(
-        num_tokens_unpadded: int, num_tokens_padded: int,
-        should_attempt_ubatching: bool,
-        vllm_config: VllmConfig) -> tuple[bool, Optional[torch.Tensor]]:
+    num_tokens_unpadded: int,
+    num_tokens_padded: int,
+    should_attempt_ubatching: bool,
+    vllm_config: VllmConfig,
+) -> tuple[bool, Optional[torch.Tensor]]:
     """
     1. Decides if each DP rank is going to microbatch. Either all ranks
     run with microbatching or none of them do. If this function decides
@@ -71,7 +80,8 @@ def get_dp_padding_ubatch(
     # If this DP rank doesn't want to attempt microbatching
     if not should_attempt_ubatching:
         (should_ubatch, num_tokens_across_dp) = should_ubatch_with_num_tokens(
-            False, 0, 0, vllm_config)
+            False, 0, 0, vllm_config
+        )
         assert should_ubatch is False
         assert num_tokens_across_dp is None
         return should_ubatch, num_tokens_across_dp
@@ -85,14 +95,16 @@ def get_dp_padding_ubatch(
     # ubatch. Abort if so
     if is_second_ubatch_empty(num_tokens_unpadded, num_tokens_padded):
         logger.debug(
-            "Empty second µbatch detected: unpadded tokens: %s, padded "
-            "tokens: %s", num_tokens_unpadded, num_tokens_padded)
+            "Empty second µbatch detected: unpadded tokens: %s, padded tokens: %s",
+            num_tokens_unpadded,
+            num_tokens_padded,
+        )
         should_ubatch = False
 
     # Note that we compute the number of padded tokens per ubatch
     (should_ubatch, num_tokens_across_dp) = should_ubatch_with_num_tokens(
-        should_ubatch, num_tokens_unpadded // 2, num_tokens_per_ubatch,
-        vllm_config)
+        should_ubatch, num_tokens_unpadded // 2, num_tokens_per_ubatch, vllm_config
+    )
     if not should_ubatch:
         assert num_tokens_across_dp is None
         return should_ubatch, num_tokens_across_dp
@@ -100,14 +112,15 @@ def get_dp_padding_ubatch(
     assert num_tokens_across_dp is not None
 
     max_tokens_across_dp_cpu = int(torch.max(num_tokens_across_dp).item())
-    num_tokens_after_padding = torch.tensor([max_tokens_across_dp_cpu] *
-                                            dp_size,
-                                            device="cpu",
-                                            dtype=torch.int32)
+    num_tokens_after_padding = torch.tensor(
+        [max_tokens_across_dp_cpu] * dp_size, device="cpu", dtype=torch.int32
+    )
     return should_ubatch, num_tokens_after_padding
 
-def create_ubatch_slices(num_scheduled_tokens: np.ndarray, split_point: int) \
-    -> UBatchSlices:
+
+def create_ubatch_slices(
+    num_scheduled_tokens: np.ndarray, split_point: int
+) -> UBatchSlices:
     # TODO(lucas): Refactor the gpu_model_runner.py so we can pass
     # in cu_num_tokens directly (i.e. query_start_loc)
     cu_num_tokens = np.zeros(len(num_scheduled_tokens) + 1, dtype=np.int32)
@@ -119,19 +132,20 @@ def create_ubatch_slices(num_scheduled_tokens: np.ndarray, split_point: int) \
     # Determine request slices using exclusive stop semantics
     # First ubatch includes requests whose tokens overlap [0, split_point)
     first_ubatch_req_stop = int(
-        np.searchsorted(cu_num_tokens, split_point, side="left"))
+        np.searchsorted(cu_num_tokens, split_point, side="left")
+    )
     first_ubatch_req_slice = slice(0, first_ubatch_req_stop)
 
     # Second ubatch starts at the request that contains the split_point
     # or the request starting exactly at split_point (if on boundary)
     second_ubatch_req_start = int(
-        np.searchsorted(cu_num_tokens, split_point, side="right") - 1)
-    second_ubatch_req_slice = slice(second_ubatch_req_start,
-                                    len(cu_num_tokens) - 1)
+        np.searchsorted(cu_num_tokens, split_point, side="right") - 1
+    )
+    second_ubatch_req_slice = slice(second_ubatch_req_start, len(cu_num_tokens) - 1)
 
     return [
         UBatchSlice(first_ubatch_req_slice, first_ubatch_token_slice),
-        UBatchSlice(second_ubatch_req_slice, second_ubatch_token_slice)
+        UBatchSlice(second_ubatch_req_slice, second_ubatch_token_slice),
     ]
 
 
@@ -147,7 +161,7 @@ def ubatch_split(
     should be split into microbatches.
 
     Returns: tuple[
-        ubatch_slices: if this is set then all DP ranks have agreed to 
+        ubatch_slices: if this is set then all DP ranks have agreed to
         microbatch
         num_tokens_after_padding: A tensor containing the total number of
         tokens per-microbatch for each DP rank including padding. Will be
@@ -186,7 +200,8 @@ def ubatch_split(
     assert num_tokens_after_padding is not None
     token_split_point = int(num_tokens_after_padding[0].item())
 
-    ubatch_slices = create_ubatch_slices(num_scheduled_tokens_per_request,
-                                         token_split_point)
+    ubatch_slices = create_ubatch_slices(
+        num_scheduled_tokens_per_request, token_split_point
+    )
 
     return (ubatch_slices, num_tokens_after_padding)
diff --git a/vllm/v1/worker/ubatch_utils.py b/vllm/v1/worker/ubatch_utils.py
index 33d58aa94843..2deba16f8a49 100644
--- a/vllm/v1/worker/ubatch_utils.py
+++ b/vllm/v1/worker/ubatch_utils.py
@@ -11,8 +11,10 @@ class UBatchSlice:
     token_slice: slice
 
     def is_empty(self) -> bool:
-        return self.request_slice.start == self.request_slice.stop \
+        return (
+            self.request_slice.start == self.request_slice.stop
             or self.token_slice.start == self.token_slice.stop
+        )
 
     @property
     def num_tokens(self) -> int:
@@ -22,6 +24,7 @@ def num_tokens(self) -> int:
 UBatchSlices: TypeAlias = list[UBatchSlice]
 
 
-def is_second_ubatch_empty(orig_num_tokens_per_ubatch: int,
-                           padded_num_tokens_per_ubatch: int) -> bool:
+def is_second_ubatch_empty(
+    orig_num_tokens_per_ubatch: int, padded_num_tokens_per_ubatch: int
+) -> bool:
     return padded_num_tokens_per_ubatch >= 2 * orig_num_tokens_per_ubatch
diff --git a/vllm/v1/worker/ubatching.py b/vllm/v1/worker/ubatching.py
index c26cb07123a5..867ce2b93036 100644
--- a/vllm/v1/worker/ubatching.py
+++ b/vllm/v1/worker/ubatching.py
@@ -10,7 +10,7 @@
 from vllm.utils import current_stream
 
 _THREAD_ID_TO_CONTEXT: dict = {}
-_CURRENT_CONTEXTS: list[Optional['UBatchContext']] = [None, None]
+_CURRENT_CONTEXTS: list[Optional["UBatchContext"]] = [None, None]
 
 
 class UBatchContext:
@@ -18,17 +18,19 @@ class UBatchContext:
     Context manager for micro-batching synchronization using threading events.
     """
 
-    def __init__(self,
-                 id: int,
-                 comm_stream: torch.cuda.Stream,
-                 compute_stream: torch.cuda.Stream,
-                 forward_context: ForwardContext,
-                 ready_barrier: threading.Barrier,
-                 cpu_wait_event: threading.Event,
-                 cpu_signal_event: threading.Event,
-                 gpu_comm_done_event: torch.cuda.Event,
-                 gpu_compute_done_event: torch.cuda.Event,
-                 schedule: str = "default"):
+    def __init__(
+        self,
+        id: int,
+        comm_stream: torch.cuda.Stream,
+        compute_stream: torch.cuda.Stream,
+        forward_context: ForwardContext,
+        ready_barrier: threading.Barrier,
+        cpu_wait_event: threading.Event,
+        cpu_signal_event: threading.Event,
+        gpu_comm_done_event: torch.cuda.Event,
+        gpu_compute_done_event: torch.cuda.Event,
+        schedule: str = "default",
+    ):
         self.id = id
         self.comm_stream = comm_stream
         self.compute_stream = compute_stream
@@ -151,7 +153,6 @@ def dbo_current_ubatch_id() -> int:
 
 
 def _register_ubatch_function(func):
-
     def wrapper(*args, **kwargs):
         if len(_THREAD_ID_TO_CONTEXT) > 0:
             ctx_idx = _THREAD_ID_TO_CONTEXT[threading.get_ident()]
@@ -161,20 +162,20 @@ def wrapper(*args, **kwargs):
     return wrapper
 
 
-dbo_maybe_run_recv_hook = _register_ubatch_function(
-    UBatchContext.maybe_run_recv_hook)
+dbo_maybe_run_recv_hook = _register_ubatch_function(UBatchContext.maybe_run_recv_hook)
 dbo_yield = _register_ubatch_function(UBatchContext.yield_)
 dbo_yield_and_switch_from_compute_to_comm = _register_ubatch_function(
-    UBatchContext.yield_and_switch_from_compute_to_comm)
+    UBatchContext.yield_and_switch_from_compute_to_comm
+)
 dbo_yield_and_switch_from_comm_to_compute = _register_ubatch_function(
-    UBatchContext.yield_and_switch_from_comm_to_compute)
+    UBatchContext.yield_and_switch_from_comm_to_compute
+)
 dbo_switch_to_comm = _register_ubatch_function(UBatchContext.switch_to_comm)
-dbo_switch_to_compute = _register_ubatch_function(
-    UBatchContext.switch_to_compute)
-dbo_switch_to_comm_sync = _register_ubatch_function(
-    UBatchContext.switch_to_comm_sync)
+dbo_switch_to_compute = _register_ubatch_function(UBatchContext.switch_to_compute)
+dbo_switch_to_comm_sync = _register_ubatch_function(UBatchContext.switch_to_comm_sync)
 dbo_switch_to_compute_sync = _register_ubatch_function(
-    UBatchContext.switch_to_compute_sync)
+    UBatchContext.switch_to_compute_sync
+)
 
 
 def dbo_register_recv_hook(recv_hook):
@@ -197,28 +198,25 @@ def make_ubatch_contexts(
     Create a context manager for micro-batching synchronization.
     """
     cpu_events = [threading.Event() for _ in range(num_micro_batches)]
-    gpu_comm_done_events = [
-        torch.cuda.Event() for _ in range(num_micro_batches)
-    ]
-    gpu_compute_done_events = [
-        torch.cuda.Event() for _ in range(num_micro_batches)
-    ]
+    gpu_comm_done_events = [torch.cuda.Event() for _ in range(num_micro_batches)]
+    gpu_compute_done_events = [torch.cuda.Event() for _ in range(num_micro_batches)]
 
     assert len(forward_contexts) == 2
 
     ctxs = []
     for i in range(num_micro_batches):
-        ctx = UBatchContext(id=i,
-                            compute_stream=compute_stream,
-                            comm_stream=comm_stream,
-                            forward_context=forward_contexts[i],
-                            ready_barrier=ready_barrier,
-                            cpu_wait_event=cpu_events[i],
-                            cpu_signal_event=cpu_events[(i + 1) %
-                                                        num_micro_batches],
-                            gpu_comm_done_event=gpu_comm_done_events[i],
-                            gpu_compute_done_event=gpu_compute_done_events[i],
-                            schedule=schedule)
+        ctx = UBatchContext(
+            id=i,
+            compute_stream=compute_stream,
+            comm_stream=comm_stream,
+            forward_context=forward_contexts[i],
+            ready_barrier=ready_barrier,
+            cpu_wait_event=cpu_events[i],
+            cpu_signal_event=cpu_events[(i + 1) % num_micro_batches],
+            gpu_comm_done_event=gpu_comm_done_events[i],
+            gpu_compute_done_event=gpu_compute_done_events[i],
+            schedule=schedule,
+        )
         ctxs.append(ctx)
 
     return ctxs
diff --git a/vllm/v1/worker/utils.py b/vllm/v1/worker/utils.py
index 3e0dbda59435..c3d16827f10e 100644
--- a/vllm/v1/worker/utils.py
+++ b/vllm/v1/worker/utils.py
@@ -35,18 +35,18 @@ def __init__(
         self.model_config = model_config
         self.scheduler_config = scheduler_config
         self.mm_registry = mm_registry
-        self.cache = cache = processor_only_cache_from_config(
-            model_config, mm_registry)
+        self.cache = cache = processor_only_cache_from_config(model_config, mm_registry)
 
         self.max_model_len = model_config.max_model_len
         self.max_num_reqs = scheduler_config.max_num_seqs
 
-        self.mm_limits = mm_registry.get_mm_limits_per_prompt(model_config,
-                                                              cache=cache)
+        self.mm_limits = mm_registry.get_mm_limits_per_prompt(model_config, cache=cache)
 
-        max_tokens_by_modality = mm_registry \
-            .get_max_tokens_per_item_by_nonzero_modality(model_config,
-                                                         cache=cache)
+        max_tokens_by_modality = (
+            mm_registry.get_max_tokens_per_item_by_nonzero_modality(
+                model_config, cache=cache
+            )
+        )
 
         encoder_compute_budget, encoder_cache_size = compute_mm_encoder_budget(
             scheduler_config,
@@ -145,17 +145,14 @@ def create_with_metadata_builders(
         vllm_config: VllmConfig,
         device: torch.device,
         num_metadata_builders: int = 1,
-    ) -> 'AttentionGroup':
+    ) -> "AttentionGroup":
         metadata_builders = [
-            backend.get_builder_cls()(kv_cache_spec, layer_names, vllm_config,
-                                      device)
+            backend.get_builder_cls()(kv_cache_spec, layer_names, vllm_config, device)
             for _ in range(num_metadata_builders)
         ]
-        return AttentionGroup(backend, metadata_builders, layer_names,
-                              kv_cache_spec)
+        return AttentionGroup(backend, metadata_builders, layer_names, kv_cache_spec)
 
-    def get_metadata_builder(self,
-                             ubatch_id: int = 0) -> AttentionMetadataBuilder:
+    def get_metadata_builder(self, ubatch_id: int = 0) -> AttentionMetadataBuilder:
         assert len(self.metadata_builders) > ubatch_id
         return self.metadata_builders[ubatch_id]
 
@@ -172,19 +169,22 @@ def sanity_check_mm_encoder_outputs(
         "Expected multimodal embeddings to be a list/tuple of 2D tensors, "
         f"or a single 3D tensor, but got {type(mm_embeddings)} "
         "instead. This is most likely due to incorrect implementation "
-        "of the model's `get_multimodal_embeddings` method.")
+        "of the model's `get_multimodal_embeddings` method."
+    )
 
     assert len(mm_embeddings) == expected_num_items, (
         "Expected number of multimodal embeddings to match number of "
         f"input items: {expected_num_items}, but got {len(mm_embeddings)=} "
         "instead. This is most likely due to incorrect implementation "
-        "of the model's `get_multimodal_embeddings` method.")
+        "of the model's `get_multimodal_embeddings` method."
+    )
 
     assert all(e.ndim == 2 for e in mm_embeddings), (
         "Expected multimodal embeddings to be a sequence of 2D tensors, "
         f"but got tensors with shapes {[e.shape for e in mm_embeddings]} "
         "instead. This is most likely due to incorrect implementation "
-        "of the model's `get_multimodal_embeddings` method.")
+        "of the model's `get_multimodal_embeddings` method."
+    )
 
 
 def scatter_mm_placeholders(
@@ -290,8 +290,7 @@ def bind_kv_cache(
     # Convert kv_caches dict to a list of tensors in the order of layer_index.
     index2name = defaultdict(list)
     for layer_name in kv_caches:
-        index2name[extract_layer_index(layer_name,
-                                       num_attn_module)].append(layer_name)
+        index2name[extract_layer_index(layer_name, num_attn_module)].append(layer_name)
 
     for layer_index in sorted(index2name.keys()):
         layer_names = index2name[layer_index]
@@ -319,16 +318,16 @@ def bind_kv_cache(
         forward_context[layer_name].kv_cache = [kv_cache]
 
 
-def is_residual_scattered_for_sp(vllm_config: VllmConfig,
-                                 num_input_tokens: int) -> bool:
+def is_residual_scattered_for_sp(
+    vllm_config: VllmConfig, num_input_tokens: int
+) -> bool:
     """Check if the residual tensor is scattered for sequence parallelism.
 
     The residual tensor is scattered across tensor parallel ranks when sequence
     parallelism and tensor parallelism is enabled, and the number of
     input tokens is one of the compilation sizes.
     """
-    if not vllm_config.compilation_config.pass_config.\
-        enable_sequence_parallelism:
+    if not vllm_config.compilation_config.pass_config.enable_sequence_parallelism:
         return False
 
     tp = vllm_config.parallel_config.tensor_parallel_size
@@ -341,4 +340,4 @@ def is_residual_scattered_for_sp(vllm_config: VllmConfig,
     assert num_input_tokens % tp == 0
 
     # Currently, SP is only enabled for static size fx graphs.
-    return (num_input_tokens in vllm_config.compilation_config.compile_sizes)
+    return num_input_tokens in vllm_config.compilation_config.compile_sizes
diff --git a/vllm/v1/worker/worker_base.py b/vllm/v1/worker/worker_base.py
index 5b393ee6bf3e..5f5c6bcea0f6 100644
--- a/vllm/v1/worker/worker_base.py
+++ b/vllm/v1/worker/worker_base.py
@@ -13,10 +13,13 @@
 from vllm.logger import init_logger
 from vllm.lora.request import LoRARequest
 from vllm.sequence import ExecuteModelRequest
-from vllm.utils import (enable_trace_function_call_for_thread,
-                        resolve_obj_by_qualname, run_method,
-                        update_environment_variables,
-                        warn_for_unimplemented_methods)
+from vllm.utils import (
+    enable_trace_function_call_for_thread,
+    resolve_obj_by_qualname,
+    run_method,
+    update_environment_variables,
+    warn_for_unimplemented_methods,
+)
 from vllm.v1.kv_cache_interface import KVCacheSpec
 from vllm.v1.outputs import SamplerOutput
 
@@ -65,6 +68,7 @@ def __init__(
         self.compilation_config = vllm_config.compilation_config
 
         from vllm.platforms import current_platform
+
         self.current_platform = current_platform
 
         self.parallel_config.rank = rank
@@ -95,10 +99,8 @@ def init_device(self) -> None:
         """
         raise NotImplementedError
 
-    def initialize_cache(self, num_gpu_blocks: int,
-                         num_cpu_blocks: int) -> None:
-        """Initialize the KV cache with the given size in blocks.
-        """
+    def initialize_cache(self, num_gpu_blocks: int, num_cpu_blocks: int) -> None:
+        """Initialize the KV cache with the given size in blocks."""
         raise NotImplementedError
 
     def get_model(self) -> nn.Module:
@@ -113,8 +115,7 @@ def load_model(self) -> None:
         raise NotImplementedError
 
     def execute_model(
-        self,
-        execute_model_req: Optional[ExecuteModelRequest] = None
+        self, execute_model_req: Optional[ExecuteModelRequest] = None
     ) -> Optional[list[SamplerOutput]]:
         raise NotImplementedError
 
@@ -209,6 +210,7 @@ def __init__(
             if trust_remote_code:
                 # note: lazy import to avoid importing torch before initializing
                 from vllm.utils import init_cached_hf_modules
+
                 init_cached_hf_modules()
 
     def shutdown(self) -> None:
@@ -229,7 +231,7 @@ def update_environment_variables(
         envs_list: list[dict[str, str]],
     ) -> None:
         envs = envs_list[self.rpc_rank]
-        key = 'CUDA_VISIBLE_DEVICES'
+        key = "CUDA_VISIBLE_DEVICES"
         if key in envs and key in os.environ:
             # overwriting CUDA_VISIBLE_DEVICES is desired behavior
             # suppress the warning in `update_environment_variables`
@@ -244,22 +246,26 @@ def init_worker(self, all_kwargs: list[dict[str, Any]]) -> None:
         kwargs = all_kwargs[self.rpc_rank]
         self.vllm_config = kwargs.get("vllm_config")
         assert self.vllm_config is not None, (
-            "vllm_config is required to initialize the worker")
+            "vllm_config is required to initialize the worker"
+        )
         enable_trace_function_call_for_thread(self.vllm_config)
 
         from vllm.plugins import load_general_plugins
+
         load_general_plugins()
 
         if isinstance(self.vllm_config.parallel_config.worker_cls, str):
             worker_class = resolve_obj_by_qualname(
-                self.vllm_config.parallel_config.worker_cls)
+                self.vllm_config.parallel_config.worker_cls
+            )
         else:
             raise ValueError(
                 "passing worker_cls is no longer supported. Please pass keep the class in a separate module and pass the qualified name of the class as a string."  # noqa: E501
             )
         if self.vllm_config.parallel_config.worker_extension_cls:
             worker_extension_cls = resolve_obj_by_qualname(
-                self.vllm_config.parallel_config.worker_extension_cls)
+                self.vllm_config.parallel_config.worker_extension_cls
+            )
             extended_calls = []
             if worker_extension_cls not in worker_class.__bases__:
                 # check any conflicts between worker and worker_extension_cls
@@ -269,15 +275,20 @@ def init_worker(self, all_kwargs: list[dict[str, Any]]) -> None:
                     assert not hasattr(worker_class, attr), (
                         f"Worker class {worker_class} already has an attribute"
                         f" {attr}, which conflicts with the worker"
-                        f" extension class {worker_extension_cls}.")
+                        f" extension class {worker_extension_cls}."
+                    )
                     if callable(getattr(worker_extension_cls, attr)):
                         extended_calls.append(attr)
                 # dynamically inherit the worker extension class
                 worker_class.__bases__ = worker_class.__bases__ + (
-                    worker_extension_cls, )
+                    worker_extension_cls,
+                )
                 logger.info(
                     "Injected %s into %s for extended collective_rpc calls %s",
-                    worker_extension_cls, worker_class, extended_calls)
+                    worker_extension_cls,
+                    worker_class,
+                    extended_calls,
+                )
         with set_current_vllm_config(self.vllm_config):
             # To make vLLM config available during worker initialization
             self.worker = worker_class(**kwargs)
@@ -305,8 +316,10 @@ def execute_method(self, method: Union[str, bytes], *args, **kwargs):
             # exceptions in the rest worker may cause deadlock in rpc like ray
             # see https://github.com/vllm-project/vllm/issues/3455
             # print the error and inform the user to solve the error
-            msg = (f"Error executing method {method!r}. "
-                   "This might cause deadlock in distributed execution.")
+            msg = (
+                f"Error executing method {method!r}. "
+                "This might cause deadlock in distributed execution."
+            )
             logger.exception(msg)
             raise e
 
diff --git a/vllm/v1/worker/xpu_model_runner.py b/vllm/v1/worker/xpu_model_runner.py
index 7becdd392498..4f82c18da73a 100644
--- a/vllm/v1/worker/xpu_model_runner.py
+++ b/vllm/v1/worker/xpu_model_runner.py
@@ -37,9 +37,7 @@ def _sync_device(self) -> None:
 
 @contextmanager
 def _torch_cuda_wrapper():
-
     class _EventPlaceholder:
-
         def __init__(self, *args, **kwargs) -> None:
             self.record = lambda: None
             self.synchronize = lambda: None
diff --git a/vllm/v1/worker/xpu_worker.py b/vllm/v1/worker/xpu_worker.py
index 7355206f30f5..a1e54628d9ed 100644
--- a/vllm/v1/worker/xpu_worker.py
+++ b/vllm/v1/worker/xpu_worker.py
@@ -11,8 +11,7 @@
 from vllm.logger import init_logger
 from vllm.model_executor import set_random_seed
 from vllm.platforms import current_platform
-from vllm.v1.worker.gpu_worker import (Worker,
-                                       init_worker_distributed_environment)
+from vllm.v1.worker.gpu_worker import Worker, init_worker_distributed_environment
 from vllm.v1.worker.xpu_model_runner import XPUModelRunner
 
 logger = init_logger(__name__)
@@ -29,8 +28,9 @@ def __init__(
         distributed_init_method: str,
         is_driver_worker: bool = False,
     ):
-        super().__init__(vllm_config, local_rank, rank,
-                         distributed_init_method, is_driver_worker)
+        super().__init__(
+            vllm_config, local_rank, rank, distributed_init_method, is_driver_worker
+        )
         device_config = self.device_config
         assert device_config.device_type == "xpu"
         assert current_platform.is_xpu()
@@ -39,8 +39,10 @@ def __init__(
         # VLLM_TORCH_PROFILER_DIR=/path/to/save/trace
         if envs.VLLM_TORCH_PROFILER_DIR:
             torch_profiler_trace_dir = envs.VLLM_TORCH_PROFILER_DIR
-            logger.info("Profiling enabled. Traces will be saved to: %s",
-                        torch_profiler_trace_dir)
+            logger.info(
+                "Profiling enabled. Traces will be saved to: %s",
+                torch_profiler_trace_dir,
+            )
             logger.debug(
                 "Profiler config: record_shapes=%s,"
                 "profile_memory=%s,with_stack=%s,with_flops=%s",
@@ -59,7 +61,9 @@ def __init__(
                 with_stack=envs.VLLM_TORCH_PROFILER_WITH_STACK,
                 with_flops=envs.VLLM_TORCH_PROFILER_WITH_FLOPS,
                 on_trace_ready=torch.profiler.tensorboard_trace_handler(
-                    torch_profiler_trace_dir, use_gzip=True))
+                    torch_profiler_trace_dir, use_gzip=True
+                ),
+            )
         else:
             self.profiler = None
 
@@ -75,8 +79,7 @@ def xpu_get_mem_info(self):
             # and we don't have any API to get it. so we mark it as 128MB.
             used_memory = torch.xpu.memory_allocated()
             non_torch_allocations = 128 * 1024 * 1024
-            free_gpu_memory = total_gpu_memory - (used_memory +
-                                                  non_torch_allocations)
+            free_gpu_memory = total_gpu_memory - (used_memory + non_torch_allocations)
             return free_gpu_memory, total_gpu_memory
 
     @torch.inference_mode()
@@ -97,10 +100,12 @@ def determine_available_memory(self) -> int:
 
         free_gpu_memory, total_gpu_memory = torch.xpu.mem_get_info()
         current_allocated_bytes = torch.xpu.memory_allocated()
-        msg = ("Before memory profiling run, "
-               f"total GPU memory: {total_gpu_memory / 1024**2:.2f} MB, "
-               f"model load takes {current_allocated_bytes / 1024**2:.2f} MB, "
-               f"free gpu memory is {free_gpu_memory / 1024**2:.2f} MB.")
+        msg = (
+            "Before memory profiling run, "
+            f"total GPU memory: {total_gpu_memory / 1024**2:.2f} MB, "
+            f"model load takes {current_allocated_bytes / 1024**2:.2f} MB, "
+            f"free gpu memory is {free_gpu_memory / 1024**2:.2f} MB."
+        )
         logger.info(msg)
         # Execute a forward pass with dummy inputs to profile the memory usage
         # of the model.
@@ -113,67 +118,73 @@ def determine_available_memory(self) -> int:
             "Error in memory profiling. "
             f"Initial free memory {self.init_gpu_memory}, current free memory"
             f" {free_gpu_memory}. This happens when the GPU memory was "
-            "not properly cleaned up before initializing the vLLM instance.")
+            "not properly cleaned up before initializing the vLLM instance."
+        )
 
         # Get the peak memory allocation recorded by torch
         peak_memory = torch.xpu.memory_stats()["allocated_bytes.all.peak"]
 
         torch.xpu.empty_cache()
-        torch_allocated_bytes = torch.xpu.memory_stats(
-        )["allocated_bytes.all.current"]
-        total_allocated_bytes = self.xpu_get_mem_info(
-        )[1] - self.xpu_get_mem_info()[0]
+        torch_allocated_bytes = torch.xpu.memory_stats()["allocated_bytes.all.current"]
+        total_allocated_bytes = self.xpu_get_mem_info()[1] - self.xpu_get_mem_info()[0]
 
         non_torch_allocations = total_allocated_bytes - torch_allocated_bytes
         if non_torch_allocations > 0:
             peak_memory += non_torch_allocations
         available_kv_cache_memory = (
-            total_gpu_memory * self.cache_config.gpu_memory_utilization -
-            peak_memory)
-
-        msg = ("After memory profiling run, "
-               f"peak memory usage is {peak_memory / 1024**2:.2f} MB,"
-               f"torch mem is {torch_allocated_bytes / 1024**2:.2f} MB, "
-               f"non-torch mem is {non_torch_allocations / 1024**2:.2f} MB, "
-               f"free gpu memory is {free_gpu_memory / 1024**2:.2f} MB.")
+            total_gpu_memory * self.cache_config.gpu_memory_utilization - peak_memory
+        )
+
+        msg = (
+            "After memory profiling run, "
+            f"peak memory usage is {peak_memory / 1024**2:.2f} MB,"
+            f"torch mem is {torch_allocated_bytes / 1024**2:.2f} MB, "
+            f"non-torch mem is {non_torch_allocations / 1024**2:.2f} MB, "
+            f"free gpu memory is {free_gpu_memory / 1024**2:.2f} MB."
+        )
         logger.info(msg)
 
         return int(available_kv_cache_memory)
 
     def init_device(self):
-        if self.device_config.device.type == "xpu" and current_platform.is_xpu(
-        ):
+        if self.device_config.device.type == "xpu" and current_platform.is_xpu():
             self.device = torch.device(f"xpu:{self.local_rank}")
             current_platform.set_device(self.device)
             current_platform.check_if_supports_dtype(self.model_config.dtype)
             torch.xpu.empty_cache()
             self.init_gpu_memory = torch.xpu.get_device_properties(
-                self.local_rank).total_memory
+                self.local_rank
+            ).total_memory
         else:
-            raise RuntimeError(
-                f"Not support device type: {self.device_config.device}")
+            raise RuntimeError(f"Not support device type: {self.device_config.device}")
 
         ENV_CCL_ZE_IPC_EXCHANGE = os.getenv("CCL_ZE_IPC_EXCHANGE", "pidfd")
         ENV_CCL_ATL_TRANSPORT = os.getenv("CCL_ATL_TRANSPORT", "ofi")
-        ENV_LOCAL_WORLD_SIZE = os.getenv("LOCAL_WORLD_SIZE",
-                                         str(self.parallel_config.world_size))
+        ENV_LOCAL_WORLD_SIZE = os.getenv(
+            "LOCAL_WORLD_SIZE", str(self.parallel_config.world_size)
+        )
         os.environ["CCL_ZE_IPC_EXCHANGE"] = ENV_CCL_ZE_IPC_EXCHANGE
         os.environ["CCL_ATL_TRANSPORT"] = ENV_CCL_ATL_TRANSPORT
         os.environ["LOCAL_WORLD_SIZE"] = ENV_LOCAL_WORLD_SIZE
         os.environ["LOCAL_RANK"] = str(self.local_rank)
 
-        init_worker_distributed_environment(self.vllm_config, self.rank,
-                                            self.distributed_init_method,
-                                            self.local_rank,
-                                            current_platform.dist_backend)
+        init_worker_distributed_environment(
+            self.vllm_config,
+            self.rank,
+            self.distributed_init_method,
+            self.local_rank,
+            current_platform.dist_backend,
+        )
 
         # global all_reduce needed for overall oneccl warm up
-        torch.distributed.all_reduce(torch.zeros(1).xpu(),
-                                     group=get_world_group().device_group)
+        torch.distributed.all_reduce(
+            torch.zeros(1).xpu(), group=get_world_group().device_group
+        )
 
         # Set random seed.
         set_random_seed(self.model_config.seed)
 
         # Construct the model runner
         self.model_runner = XPUModelRunner(  # type: ignore
-            self.vllm_config, self.device)
+            self.vllm_config, self.device
+        )
diff --git a/vllm/version.py b/vllm/version.py
index 6c88b1b5a3bf..63095f8bce1e 100644
--- a/vllm/version.py
+++ b/vllm/version.py
@@ -6,9 +6,7 @@
 except Exception as e:
     import warnings
 
-    warnings.warn(f"Failed to read commit hash:\n{e}",
-                  RuntimeWarning,
-                  stacklevel=2)
+    warnings.warn(f"Failed to read commit hash:\n{e}", RuntimeWarning, stacklevel=2)
 
     __version__ = "dev"
     __version_tuple__ = (0, 0, __version__)

From 29a4b3dc302d806e675004df5e484f26b75e02a1 Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Sun, 5 Oct 2025 17:18:11 +0100
Subject: [PATCH 185/193] Remove all references to `yapf` as it's no longer
 used (#26251)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 csrc/quantization/machete/generate.py         |    5 -
 examples/others/tensorize_vllm_model.py       |  168 +--
 tests/compile/test_silu_mul_quant_fusion.py   |    5 -
 tests/distributed/test_expert_parallel.py     |   42 +-
 tests/distributed/test_pipeline_parallel.py   |    6 +-
 tests/engine/test_arg_utils.py                |   35 +-
 tests/entrypoints/test_chat_utils.py          |  388 +++---
 tests/lora/test_layers.py                     |    5 -
 .../tensorizer_loader/test_tensorizer.py      |    4 -
 .../multimodal/generation/test_common.py      |  360 +++---
 .../generation/vlm_utils/case_filtering.py    |    7 +-
 .../generation/vlm_utils/model_utils.py       |    2 -
 .../multimodal/generation/vlm_utils/types.py  |   26 +-
 .../multimodal/processing/test_common.py      |  143 +--
 .../multimodal/processing/test_idefics3.py    |    2 -
 .../multimodal/processing/test_phi3v.py       |    2 -
 .../multimodal/processing/test_phi4mm.py      |    2 -
 .../multimodal/processing/test_qwen2_vl.py    |    2 -
 .../multimodal/processing/test_smolvlm.py     |    2 -
 .../processing/test_transformers.py           |   33 +-
 tests/models/registry.py                      | 1059 ++++++++++-------
 tests/multimodal/test_cache.py                |   39 +-
 tests/multimodal/test_processing.py           |  226 ++--
 tests/multimodal/test_utils.py                |   27 +-
 tests/test_inputs.py                          |   96 +-
 tests/tpu/test_moe_pallas.py                  |    4 -
 tests/utils_/test_utils.py                    |  131 +-
 tests/v1/core/test_kv_cache_utils.py          |    5 -
 .../v1/logits_processors/test_correctness.py  |    4 -
 .../logits_processors/test_custom_offline.py  |    4 -
 .../logits_processors/test_custom_online.py   |    4 -
 .../kv_transfer/kv_connector/factory.py       |    3 -
 vllm/engine/arg_utils.py                      |    3 -
 vllm/entrypoints/chat_utils.py                |   15 +-
 vllm/entrypoints/llm.py                       |    5 -
 vllm/entrypoints/openai/api_server.py         |    5 -
 vllm/entrypoints/openai/protocol.py           |    4 -
 vllm/entrypoints/openai/run_batch.py          |    4 -
 vllm/entrypoints/openai/serving_chat.py       |    8 +-
 .../openai/serving_classification.py          |    2 -
 vllm/entrypoints/openai/serving_completion.py |    5 -
 vllm/entrypoints/openai/serving_embedding.py  |    5 -
 vllm/entrypoints/openai/serving_engine.py     |    5 -
 vllm/entrypoints/openai/serving_pooling.py    |    4 -
 vllm/entrypoints/openai/serving_responses.py  |   10 -
 vllm/entrypoints/openai/serving_score.py      |    5 -
 .../openai/serving_tokenization.py            |    5 -
 vllm/executor/ray_distributed_executor.py     |    2 +-
 vllm/lora/layers/base_linear.py               |   86 +-
 vllm/lora/layers/row_parallel_linear.py       |   37 +-
 vllm/lora/utils.py                            |    4 -
 .../layers/fused_moe/fused_moe.py             |    4 -
 vllm/model_executor/layers/fused_moe/layer.py |    4 -
 .../layers/fused_moe/modular_kernel.py        |    2 +-
 vllm/model_executor/layers/linear.py          |    4 -
 .../schemes/compressed_tensors_w4a8_fp8.py    |    5 -
 .../schemes/compressed_tensors_wNa16.py       |    5 -
 .../model_loader/bitsandbytes_loader.py       |    4 -
 vllm/model_executor/models/aria.py            |    3 -
 vllm/model_executor/models/gemma3_mm.py       |    4 -
 vllm/model_executor/models/gemma3n_mm.py      |   51 +-
 vllm/model_executor/models/idefics3.py        |    8 -
 vllm/model_executor/models/phi3v.py           |    5 -
 vllm/model_executor/models/qwen2_5_vl.py      |    4 -
 vllm/model_executor/models/qwen3_next.py      |    5 -
 vllm/model_executor/models/registry.py        |  176 ++-
 vllm/model_executor/models/smolvlm.py         |    3 -
 vllm/model_executor/models/voxtral.py         |    4 -
 .../chat_templates/registry.py                |    2 -
 vllm/transformers_utils/configs/arctic.py     |    3 +-
 .../transformers_utils/configs/nemotron_vl.py |   18 +-
 vllm/transformers_utils/configs/ovis.py       |   78 +-
 .../processors/deepseek_vl2.py                |  118 +-
 vllm/transformers_utils/processors/ovis.py    |  124 +-
 vllm/v1/attention/backends/flashinfer.py      |    5 -
 .../attention/backends/mla/rocm_aiter_mla.py  |    5 -
 vllm/v1/serial_utils.py                       |    4 -
 vllm/v1/worker/gpu_model_runner.py            |   10 -
 78 files changed, 1994 insertions(+), 1719 deletions(-)

diff --git a/csrc/quantization/machete/generate.py b/csrc/quantization/machete/generate.py
index f7106f016b3e..d29a199c5d32 100644
--- a/csrc/quantization/machete/generate.py
+++ b/csrc/quantization/machete/generate.py
@@ -12,9 +12,6 @@
 from typing import Optional, Union
 
 import jinja2
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm_cutlass_library_extension import (
     DataType,
     EpilogueScheduleTag,
@@ -31,8 +28,6 @@
     VLLMKernelScheduleTag,
 )
 
-# yapf: enable
-
 #
 #   Generator templating
 #
diff --git a/examples/others/tensorize_vllm_model.py b/examples/others/tensorize_vllm_model.py
index 2b7f0beab227..acbfd8cda489 100644
--- a/examples/others/tensorize_vllm_model.py
+++ b/examples/others/tensorize_vllm_model.py
@@ -21,8 +21,6 @@
 logger = logging.getLogger()
 
 
-# yapf conflicts with isort for this docstring
-# yapf: disable
 """
 tensorize_vllm_model.py is a script that can be used to serialize and 
 deserialize vLLM models. These models can be loaded using tensorizer 
@@ -132,7 +130,8 @@ def get_parser():
         "can be loaded using tensorizer directly to the GPU "
         "extremely quickly. Tensor encryption and decryption is "
         "also supported, although libsodium must be installed to "
-        "use it.")
+        "use it."
+    )
     parser = EngineArgs.add_cli_args(parser)
 
     parser.add_argument(
@@ -144,13 +143,14 @@ def get_parser():
         "along with the model by instantiating a TensorizerConfig object, "
         "creating a dict from it with TensorizerConfig.to_serializable(), "
         "and passing it to LoRARequest's initializer with the kwarg "
-        "tensorizer_config_dict."
+        "tensorizer_config_dict.",
     )
 
-    subparsers = parser.add_subparsers(dest='command', required=True)
+    subparsers = parser.add_subparsers(dest="command", required=True)
 
     serialize_parser = subparsers.add_parser(
-        'serialize', help="Serialize a model to `--serialized-directory`")
+        "serialize", help="Serialize a model to `--serialized-directory`"
+    )
 
     serialize_parser.add_argument(
         "--suffix",
@@ -163,7 +163,9 @@ def get_parser():
             "`--suffix` is `v1`, the serialized model tensors will be "
             "saved to "
             "`s3://my-bucket/vllm/EleutherAI/gpt-j-6B/v1/model.tensors`. "
-            "If none is provided, a random UUID will be used."))
+            "If none is provided, a random UUID will be used."
+        ),
+    )
     serialize_parser.add_argument(
         "--serialized-directory",
         type=str,
@@ -175,108 +177,127 @@ def get_parser():
         "and the model HuggingFace ID is `EleutherAI/gpt-j-6B`, tensors will "
         "be saved to `dir/vllm/EleutherAI/gpt-j-6B/suffix/model.tensors`, "
         "where `suffix` is given by `--suffix` or a random UUID if not "
-        "provided.")
+        "provided.",
+    )
 
     serialize_parser.add_argument(
         "--serialization-kwargs",
         type=tensorizer_kwargs_arg,
         required=False,
-        help=("A JSON string containing additional keyword arguments to "
-              "pass to Tensorizer's TensorSerializer during "
-              "serialization."))
+        help=(
+            "A JSON string containing additional keyword arguments to "
+            "pass to Tensorizer's TensorSerializer during "
+            "serialization."
+        ),
+    )
 
     serialize_parser.add_argument(
         "--keyfile",
         type=str,
         required=False,
-        help=("Encrypt the model weights with a randomly-generated binary key,"
-              " and save the key at this path"))
+        help=(
+            "Encrypt the model weights with a randomly-generated binary key,"
+            " and save the key at this path"
+        ),
+    )
 
     deserialize_parser = subparsers.add_parser(
-        'deserialize',
-        help=("Deserialize a model from `--path-to-tensors`"
-              " to verify it can be loaded and used."))
+        "deserialize",
+        help=(
+            "Deserialize a model from `--path-to-tensors`"
+            " to verify it can be loaded and used."
+        ),
+    )
 
     deserialize_parser.add_argument(
         "--path-to-tensors",
         type=str,
         required=False,
-        help="The local path or S3 URI to the model tensors to deserialize. ")
+        help="The local path or S3 URI to the model tensors to deserialize. ",
+    )
 
     deserialize_parser.add_argument(
         "--serialized-directory",
         type=str,
         required=False,
         help="Directory with model artifacts for loading. Assumes a "
-             "model.tensors file exists therein. Can supersede "
-             "--path-to-tensors.")
+        "model.tensors file exists therein. Can supersede "
+        "--path-to-tensors.",
+    )
 
     deserialize_parser.add_argument(
         "--keyfile",
         type=str,
         required=False,
-        help=("Path to a binary key to use to decrypt the model weights,"
-              " if the model was serialized with encryption"))
+        help=(
+            "Path to a binary key to use to decrypt the model weights,"
+            " if the model was serialized with encryption"
+        ),
+    )
 
     deserialize_parser.add_argument(
         "--deserialization-kwargs",
         type=tensorizer_kwargs_arg,
         required=False,
-        help=("A JSON string containing additional keyword arguments to "
-              "pass to Tensorizer's `TensorDeserializer` during "
-              "deserialization."))
+        help=(
+            "A JSON string containing additional keyword arguments to "
+            "pass to Tensorizer's `TensorDeserializer` during "
+            "deserialization."
+        ),
+    )
 
     TensorizerArgs.add_cli_args(deserialize_parser)
 
     return parser
 
-def merge_extra_config_with_tensorizer_config(extra_cfg: dict,
-                                              cfg: TensorizerConfig):
+
+def merge_extra_config_with_tensorizer_config(extra_cfg: dict, cfg: TensorizerConfig):
     for k, v in extra_cfg.items():
         if hasattr(cfg, k):
             setattr(cfg, k, v)
             logger.info(
                 "Updating TensorizerConfig with %s from "
-                "--model-loader-extra-config provided", k
+                "--model-loader-extra-config provided",
+                k,
             )
 
+
 def deserialize(args, tensorizer_config):
     if args.lora_path:
         tensorizer_config.lora_dir = tensorizer_config.tensorizer_dir
-        llm = LLM(model=args.model,
-                  load_format="tensorizer",
-                  tensor_parallel_size=args.tensor_parallel_size,
-                  model_loader_extra_config=tensorizer_config,
-                  enable_lora=True,
+        llm = LLM(
+            model=args.model,
+            load_format="tensorizer",
+            tensor_parallel_size=args.tensor_parallel_size,
+            model_loader_extra_config=tensorizer_config,
+            enable_lora=True,
         )
         sampling_params = SamplingParams(
-            temperature=0,
-            max_tokens=256,
-            stop=["[/assistant]"]
+            temperature=0, max_tokens=256, stop=["[/assistant]"]
         )
 
         # Truncating this as the extra text isn't necessary
-        prompts = [
-            "[user] Write a SQL query to answer the question based on ..."
-        ]
+        prompts = ["[user] Write a SQL query to answer the question based on ..."]
 
         # Test LoRA load
         print(
             llm.generate(
-            prompts,
-            sampling_params,
-            lora_request=LoRARequest("sql-lora",
-                                     1,
-                                     args.lora_path,
-                                     tensorizer_config_dict = tensorizer_config
-                                     .to_serializable())
+                prompts,
+                sampling_params,
+                lora_request=LoRARequest(
+                    "sql-lora",
+                    1,
+                    args.lora_path,
+                    tensorizer_config_dict=tensorizer_config.to_serializable(),
+                ),
             )
         )
     else:
-        llm = LLM(model=args.model,
-                  load_format="tensorizer",
-                  tensor_parallel_size=args.tensor_parallel_size,
-                  model_loader_extra_config=tensorizer_config
+        llm = LLM(
+            model=args.model,
+            load_format="tensorizer",
+            tensor_parallel_size=args.tensor_parallel_size,
+            model_loader_extra_config=tensorizer_config,
         )
     return llm
 
@@ -285,17 +306,20 @@ def main():
     parser = get_parser()
     args = parser.parse_args()
 
-    s3_access_key_id = (getattr(args, 's3_access_key_id', None)
-                        or os.environ.get("S3_ACCESS_KEY_ID", None))
-    s3_secret_access_key = (getattr(args, 's3_secret_access_key', None)
-                            or os.environ.get("S3_SECRET_ACCESS_KEY", None))
-    s3_endpoint = (getattr(args, 's3_endpoint', None)
-                or os.environ.get("S3_ENDPOINT_URL", None))
+    s3_access_key_id = getattr(args, "s3_access_key_id", None) or os.environ.get(
+        "S3_ACCESS_KEY_ID", None
+    )
+    s3_secret_access_key = getattr(
+        args, "s3_secret_access_key", None
+    ) or os.environ.get("S3_SECRET_ACCESS_KEY", None)
+    s3_endpoint = getattr(args, "s3_endpoint", None) or os.environ.get(
+        "S3_ENDPOINT_URL", None
+    )
 
     credentials = {
         "s3_access_key_id": s3_access_key_id,
         "s3_secret_access_key": s3_secret_access_key,
-        "s3_endpoint": s3_endpoint
+        "s3_endpoint": s3_endpoint,
     }
 
     model_ref = args.model
@@ -309,25 +333,25 @@ def main():
     if args.model_loader_extra_config:
         extra_config = json.loads(args.model_loader_extra_config)
 
-
-    tensorizer_dir = (args.serialized_directory or
-                      extra_config.get("tensorizer_dir"))
-    tensorizer_uri = (getattr(args, "path_to_tensors", None)
-                      or extra_config.get("tensorizer_uri"))
+    tensorizer_dir = args.serialized_directory or extra_config.get("tensorizer_dir")
+    tensorizer_uri = getattr(args, "path_to_tensors", None) or extra_config.get(
+        "tensorizer_uri"
+    )
 
     if tensorizer_dir and tensorizer_uri:
-        parser.error("--serialized-directory and --path-to-tensors "
-                     "cannot both be provided")
+        parser.error(
+            "--serialized-directory and --path-to-tensors cannot both be provided"
+        )
 
     if not tensorizer_dir and not tensorizer_uri:
-        parser.error("Either --serialized-directory or --path-to-tensors "
-                     "must be provided")
-
+        parser.error(
+            "Either --serialized-directory or --path-to-tensors must be provided"
+        )
 
     if args.command == "serialize":
         engine_args = EngineArgs.from_cli_args(args)
 
-        input_dir = tensorizer_dir.rstrip('/')
+        input_dir = tensorizer_dir.rstrip("/")
         suffix = args.suffix if args.suffix else uuid.uuid4().hex
         base_path = f"{input_dir}/vllm/{model_ref}/{suffix}"
         if engine_args.tensor_parallel_size > 1:
@@ -339,15 +363,14 @@ def main():
             tensorizer_uri=model_path,
             encryption_keyfile=keyfile,
             serialization_kwargs=args.serialization_kwargs or {},
-            **credentials
+            **credentials,
         )
 
         if args.lora_path:
             tensorizer_config.lora_dir = tensorizer_config.tensorizer_dir
             tensorize_lora_adapter(args.lora_path, tensorizer_config)
 
-        merge_extra_config_with_tensorizer_config(extra_config,
-                                                  tensorizer_config)
+        merge_extra_config_with_tensorizer_config(extra_config, tensorizer_config)
         tensorize_vllm_model(engine_args, tensorizer_config)
 
     elif args.command == "deserialize":
@@ -356,11 +379,10 @@ def main():
             tensorizer_dir=args.serialized_directory,
             encryption_keyfile=keyfile,
             deserialization_kwargs=args.deserialization_kwargs or {},
-            **credentials
+            **credentials,
         )
 
-        merge_extra_config_with_tensorizer_config(extra_config,
-                                                  tensorizer_config)
+        merge_extra_config_with_tensorizer_config(extra_config, tensorizer_config)
         deserialize(args, tensorizer_config)
     else:
         raise ValueError("Either serialize or deserialize must be specified.")
diff --git a/tests/compile/test_silu_mul_quant_fusion.py b/tests/compile/test_silu_mul_quant_fusion.py
index 7e3a230b5f62..16a4271655ef 100644
--- a/tests/compile/test_silu_mul_quant_fusion.py
+++ b/tests/compile/test_silu_mul_quant_fusion.py
@@ -8,16 +8,11 @@
 import vllm.envs as envs
 from tests.kernels.quantization.nvfp4_utils import quant_nvfp4_tensor
 from vllm._custom_ops import cutlass_scaled_fp4_mm, scaled_fp4_quant
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.compilation.activation_quant_fusion import (
     FUSED_OPS,
     SILU_MUL_OP,
     ActivationQuantFusionPass,
 )
-
-# yapf: enable
 from vllm.compilation.fusion import QUANT_OPS
 from vllm.compilation.noop_elimination import NoOpEliminationPass
 from vllm.compilation.post_cleanup import PostCleanupPass
diff --git a/tests/distributed/test_expert_parallel.py b/tests/distributed/test_expert_parallel.py
index 68ac52af3061..94f0ece4971b 100644
--- a/tests/distributed/test_expert_parallel.py
+++ b/tests/distributed/test_expert_parallel.py
@@ -107,10 +107,8 @@ def iter_params(self, model_name: str):
 # NOTE: You can adjust tp_base locally to fit the model in GPU
 # The values displayed here are only a rough indicator of the size of the model
 
-# yapf: disable
 TEST_MODELS = {
-    "deepseek-ai/DeepSeek-V2-Lite-Chat": EPTestSettings.fast(
-        trust_remote_code=True),
+    "deepseek-ai/DeepSeek-V2-Lite-Chat": EPTestSettings.fast(trust_remote_code=True),
     "mistralai/Mixtral-8x7B-Instruct-v0.1": EPTestSettings.fast(tp_base=4),
 }
 
@@ -192,22 +190,24 @@ def _compare_tp(
     ]
 
     try:
-        compare_two_settings(model_name,
-                             ep_args,
-                             tp_args,
-                             ep_env,
-                             tp_env,
-                             method=method,
-                             max_wait_seconds=360)
+        compare_two_settings(
+            model_name,
+            ep_args,
+            tp_args,
+            ep_env,
+            tp_env,
+            method=method,
+            max_wait_seconds=360,
+        )
     except Exception:
         raise
 
 
 @pytest.mark.parametrize(
-    ("model_name", "parallel_setup", "distributed_backend", "runner",
-     "test_options"),
+    ("model_name", "parallel_setup", "distributed_backend", "runner", "test_options"),
     [
-        params for model_name, settings in TEST_MODELS.items()
+        params
+        for model_name, settings in TEST_MODELS.items()
         for params in settings.iter_params(model_name)
     ],
 )
@@ -220,10 +220,12 @@ def test_ep(
     test_options: EPTestOptions,
     num_gpus_available,
 ):
-    _compare_tp(model_name,
-                parallel_setup,
-                distributed_backend,
-                runner,
-                test_options,
-                num_gpus_available,
-                method="generate")
+    _compare_tp(
+        model_name,
+        parallel_setup,
+        distributed_backend,
+        runner,
+        test_options,
+        num_gpus_available,
+        method="generate",
+    )
diff --git a/tests/distributed/test_pipeline_parallel.py b/tests/distributed/test_pipeline_parallel.py
index 26ee60c150c1..119e8e7621d9 100644
--- a/tests/distributed/test_pipeline_parallel.py
+++ b/tests/distributed/test_pipeline_parallel.py
@@ -100,7 +100,6 @@ def iter_params(self, model_id: str):
 # NOTE: You can adjust tp_base and/or pp_base locally to fit the model in GPU
 # The values displayed here are only a rough indicator of the size of the model
 
-# yapf: disable
 TEXT_GENERATION_MODELS = {
     # [Decoder-only]
     # Uses Llama
@@ -150,7 +149,9 @@ def iter_params(self, model_id: str):
     "adept/persimmon-8b-chat": PPTestSettings.fast(),
     "microsoft/phi-2": PPTestSettings.fast(),
     "microsoft/Phi-3-small-8k-instruct": PPTestSettings.fast(),
-    "microsoft/Phi-3.5-MoE-instruct": PPTestSettings.detailed(multi_node_only=True, load_format="dummy"),  # noqa: E501
+    "microsoft/Phi-3.5-MoE-instruct": PPTestSettings.detailed(
+        multi_node_only=True, load_format="dummy"
+    ),  # noqa: E501
     "Qwen/Qwen-7B-Chat": PPTestSettings.fast(),
     "Qwen/Qwen2.5-0.5B-Instruct": PPTestSettings.fast(),
     "Qwen/Qwen1.5-MoE-A2.7B-Chat": PPTestSettings.fast(),
@@ -196,7 +197,6 @@ def iter_params(self, model_id: str):
     "Qwen/Qwen2-VL-2B-Instruct": PPTestSettings.fast(),
     "fixie-ai/ultravox-v0_5-llama-3_2-1b": PPTestSettings.fast(),
 }
-# yapf: enable
 
 # NOTE: You can update this on your local machine to run specific tests
 TEST_MODELS = [
diff --git a/tests/engine/test_arg_utils.py b/tests/engine/test_arg_utils.py
index c0eb0e5ac564..9d367349fc2e 100644
--- a/tests/engine/test_arg_utils.py
+++ b/tests/engine/test_arg_utils.py
@@ -287,29 +287,15 @@ def test_prefix_cache_default():
     assert not engine_args.enable_prefix_caching
 
 
-# yapf: disable
-@pytest.mark.parametrize(("arg", "expected", "option"), [
-    (None, None, "mm-processor-kwargs"),
-    ("{}", {}, "mm-processor-kwargs"),
-    (
-        '{"num_crops": 4}',
-        {
-            "num_crops": 4
-        },
-        "mm-processor-kwargs"
-    ),
-    (
-        '{"foo": {"bar": "baz"}}',
-        {
-            "foo":
-            {
-                "bar": "baz"
-            }
-        },
-        "mm-processor-kwargs"
-    ),
-])
-# yapf: enable
+@pytest.mark.parametrize(
+    ("arg", "expected", "option"),
+    [
+        (None, None, "mm-processor-kwargs"),
+        ("{}", {}, "mm-processor-kwargs"),
+        ('{"num_crops": 4}', {"num_crops": 4}, "mm-processor-kwargs"),
+        ('{"foo": {"bar": "baz"}}', {"foo": {"bar": "baz"}}, "mm-processor-kwargs"),
+    ],
+)
 def test_composite_arg_parser(arg, expected, option):
     parser = EngineArgs.add_cli_args(FlexibleArgumentParser())
     if arg is None:
@@ -321,8 +307,7 @@ def test_composite_arg_parser(arg, expected, option):
 
 def test_human_readable_model_len():
     # `exit_on_error` disabled to test invalid values below
-    parser = EngineArgs.add_cli_args(
-        FlexibleArgumentParser(exit_on_error=False))
+    parser = EngineArgs.add_cli_args(FlexibleArgumentParser(exit_on_error=False))
 
     args = parser.parse_args([])
     assert args.max_model_len is None
diff --git a/tests/entrypoints/test_chat_utils.py b/tests/entrypoints/test_chat_utils.py
index 7ddad4d513ec..975ca53a3a71 100644
--- a/tests/entrypoints/test_chat_utils.py
+++ b/tests/entrypoints/test_chat_utils.py
@@ -15,6 +15,7 @@
 from vllm.config import ModelConfig
 from vllm.entrypoints.chat_utils import (
     _try_extract_ast,
+    apply_mistral_chat_template,
     load_chat_template,
     parse_chat_messages,
     parse_chat_messages_futures,
@@ -1855,17 +1856,17 @@ def test_resolve_hf_chat_template_kwargs(sample_json_schema, model, expected_kwa
 
 # NOTE: Qwen2-Audio default chat template is specially defined inside
 # processor class instead of using `tokenizer_config.json`
-# yapf: disable
 @pytest.mark.parametrize(
     ("model", "expected_format"),
-    [(PHI3V_MODEL_ID, "string"),
-     (QWEN2VL_MODEL_ID, "openai"),
-     (QWEN25VL_MODEL_ID, "openai"),
-     (ULTRAVOX_MODEL_ID, "string"),
-     (QWEN2AUDIO_MODEL_ID, "openai"),
-     (LLAMA_GUARD_MODEL_ID, "openai")],
+    [
+        (PHI3V_MODEL_ID, "string"),
+        (QWEN2VL_MODEL_ID, "openai"),
+        (QWEN25VL_MODEL_ID, "openai"),
+        (ULTRAVOX_MODEL_ID, "string"),
+        (QWEN2AUDIO_MODEL_ID, "openai"),
+        (LLAMA_GUARD_MODEL_ID, "openai"),
+    ],
 )
-# yapf: enable
 def test_resolve_content_format_hf_defined(model, expected_format):
     model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
     model_info.check_available_online(on_fail="skip")
@@ -1879,7 +1880,8 @@ def test_resolve_content_format_hf_defined(model, expected_format):
         hf_overrides=model_info.hf_overrides,
         skip_tokenizer_init=model_info.skip_tokenizer_init,
         enforce_eager=model_info.enforce_eager,
-        dtype=model_info.dtype)
+        dtype=model_info.dtype,
+    )
 
     tokenizer = get_tokenizer(
         model,
@@ -1911,18 +1913,18 @@ def test_resolve_content_format_hf_defined(model, expected_format):
     assert resolved_format == expected_format
 
 
-# yapf: disable
 @pytest.mark.parametrize(
     ("model", "expected_format"),
-    [("Salesforce/blip2-opt-2.7b", "string"),
-     ("facebook/chameleon-7b", "string"),
-     ("deepseek-ai/deepseek-vl2-tiny", "string"),
-     ("adept/fuyu-8b", "string"),
-     ("google/paligemma-3b-mix-224", "string"),
-     ("Qwen/Qwen-VL", "string"),
-     ("Qwen/Qwen-VL-Chat", "string")],
+    [
+        ("Salesforce/blip2-opt-2.7b", "string"),
+        ("facebook/chameleon-7b", "string"),
+        ("deepseek-ai/deepseek-vl2-tiny", "string"),
+        ("adept/fuyu-8b", "string"),
+        ("google/paligemma-3b-mix-224", "string"),
+        ("Qwen/Qwen-VL", "string"),
+        ("Qwen/Qwen-VL-Chat", "string"),
+    ],
 )
-# yapf: enable
 def test_resolve_content_format_fallbacks(model, expected_format):
     model_info = HF_EXAMPLE_MODELS.find_hf_info(model)
     model_info.check_available_online(on_fail="skip")
@@ -1936,7 +1938,8 @@ def test_resolve_content_format_fallbacks(model, expected_format):
         hf_overrides=model_info.hf_overrides,
         skip_tokenizer_init=model_info.skip_tokenizer_init,
         enforce_eager=model_info.enforce_eager,
-        dtype=model_info.dtype)
+        dtype=model_info.dtype,
+    )
 
     tokenizer = get_tokenizer(
         model_config.tokenizer,
@@ -1968,30 +1971,30 @@ def test_resolve_content_format_fallbacks(model, expected_format):
     assert resolved_format == expected_format
 
 
-# yapf: disable
 @pytest.mark.parametrize(
     ("template_path", "expected_format"),
-    [("template_alpaca.jinja", "string"),
-     ("template_baichuan.jinja", "string"),
-     ("template_chatglm.jinja", "string"),
-     ("template_chatglm2.jinja", "string"),
-     ("template_chatml.jinja", "string"),
-     ("template_dse_qwen2_vl.jinja", "openai"),
-     ("template_falcon_180b.jinja", "string"),
-     ("template_falcon.jinja", "string"),
-     ("template_inkbot.jinja", "string"),
-     ("template_teleflm.jinja", "string"),
-     ("template_vlm2vec_phi3v.jinja", "openai"),
-     ("template_vlm2vec_qwen2vl.jinja", "openai"),
-     ("tool_chat_template_granite_20b_fc.jinja", "string"),
-     ("tool_chat_template_hermes.jinja", "string"),
-     ("tool_chat_template_internlm2_tool.jinja", "string"),
-     ("tool_chat_template_llama3.1_json.jinja", "openai"),
-     ("tool_chat_template_llama3.2_json.jinja", "openai"),
-     ("tool_chat_template_mistral_parallel.jinja", "string"),
-     ("tool_chat_template_mistral.jinja", "string")],
+    [
+        ("template_alpaca.jinja", "string"),
+        ("template_baichuan.jinja", "string"),
+        ("template_chatglm.jinja", "string"),
+        ("template_chatglm2.jinja", "string"),
+        ("template_chatml.jinja", "string"),
+        ("template_dse_qwen2_vl.jinja", "openai"),
+        ("template_falcon_180b.jinja", "string"),
+        ("template_falcon.jinja", "string"),
+        ("template_inkbot.jinja", "string"),
+        ("template_teleflm.jinja", "string"),
+        ("template_vlm2vec_phi3v.jinja", "openai"),
+        ("template_vlm2vec_qwen2vl.jinja", "openai"),
+        ("tool_chat_template_granite_20b_fc.jinja", "string"),
+        ("tool_chat_template_hermes.jinja", "string"),
+        ("tool_chat_template_internlm2_tool.jinja", "string"),
+        ("tool_chat_template_llama3.1_json.jinja", "openai"),
+        ("tool_chat_template_llama3.2_json.jinja", "openai"),
+        ("tool_chat_template_mistral_parallel.jinja", "string"),
+        ("tool_chat_template_mistral.jinja", "string"),
+    ],
 )
-# yapf: enable
 def test_resolve_content_format_examples(template_path, expected_format):
     model_config = ModelConfig(
         PHI3V_MODEL_ID,  # Dummy
@@ -2024,40 +2027,34 @@ def test_resolve_content_format_examples(template_path, expected_format):
     assert resolved_format == expected_format
 
 
-def test_parse_chat_messages_include_thinking_chunk(mistral_model_config,
-                                                    mistral_tokenizer):
-    messages = [{
-        "role":
-        "system",
-        "content": [{
-            "type": "text",
-            "text": "You are a helpful assistant."
-        }, {
-            "type":
-            "thinking",
-            "closed":
-            True,
-            "thinking":
-            "Only return the answer when you are confident."
-        }]
-    }, {
-        "role": "user",
-        "content": "What is 2+2?"
-    }, {
-        "role":
-        "assistant",
-        "content": [{
-            "type": "text",
-            "text": "Let me think about it."
-        }, {
-            "type": "thinking",
-            "closed": True,
-            "thinking": "2+2 = 4"
-        }, {
-            "type": "text",
-            "text": "The answer is 4.",
-        }],
-    }]
+def test_parse_chat_messages_include_thinking_chunk(
+    mistral_model_config, mistral_tokenizer
+):
+    messages = [
+        {
+            "role": "system",
+            "content": [
+                {"type": "text", "text": "You are a helpful assistant."},
+                {
+                    "type": "thinking",
+                    "closed": True,
+                    "thinking": "Only return the answer when you are confident.",
+                },
+            ],
+        },
+        {"role": "user", "content": "What is 2+2?"},
+        {
+            "role": "assistant",
+            "content": [
+                {"type": "text", "text": "Let me think about it."},
+                {"type": "thinking", "closed": True, "thinking": "2+2 = 4"},
+                {
+                    "type": "text",
+                    "text": "The answer is 4.",
+                },
+            ],
+        },
+    ]
 
     conversation_with_thinking, _, _ = parse_chat_messages(
         messages,
@@ -2066,122 +2063,105 @@ def test_parse_chat_messages_include_thinking_chunk(mistral_model_config,
         content_format="openai",
     )
 
-    expected_conversation = [{
-        "role":
-        "system",
-        "content": [{
-            "type": "text",
-            "text": "You are a helpful assistant."
-        }, {
-            "type": "text",
-            "text": "Only return the answer when you are confident."
-        }],
-    }, {
-        "role":
-        "user",
-        "content": [{
-            "type": "text",
-            "text": "What is 2+2?"
-        }],
-    }, {
-        "role":
-        "assistant",
-        "content": [
-            {
-                "type": "text",
-                "text": "Let me think about it."
-            },
-            {
-                "type": "text",
-                "text": "2+2 = 4"
-            },
-            {
-                "type": "text",
-                "text": "The answer is 4."
-            },
-        ]
-    }]
+    expected_conversation = [
+        {
+            "role": "system",
+            "content": [
+                {"type": "text", "text": "You are a helpful assistant."},
+                {
+                    "type": "text",
+                    "text": "Only return the answer when you are confident.",
+                },
+            ],
+        },
+        {
+            "role": "user",
+            "content": [{"type": "text", "text": "What is 2+2?"}],
+        },
+        {
+            "role": "assistant",
+            "content": [
+                {"type": "text", "text": "Let me think about it."},
+                {"type": "text", "text": "2+2 = 4"},
+                {"type": "text", "text": "The answer is 4."},
+            ],
+        },
+    ]
 
     assert conversation_with_thinking == expected_conversation
 
 
 def test_apply_mistral_chat_template_thinking_chunk():
-    # Moved import here to avoid yapf and isort conflicts
-    from vllm.entrypoints.chat_utils import apply_mistral_chat_template
-    messages = [{
-        "role":
-        "system",
-        "content": [{
-            "type": "text",
-            "text": "You are a helpful assistant."
-        }, {
-            "type":
-            "thinking",
-            "closed":
-            True,
-            "thinking":
-            "Only return the answer when you are confident."
-        }]
-    }, {
-        "role": "user",
-        "content": "What is 2+2?"
-    }, {
-        "role":
-        "assistant",
-        "content": [{
-            "type": "text",
-            "text": "Let me think about it."
-        }, {
-            "type": "thinking",
-            "closed": True,
-            "thinking": "2+2 = 4"
-        }, {
-            "type": "text",
-            "text": "The answer is 4.",
-        }],
-    }, {
-        "role": "user",
-        "content": "Thanks, what is 3+3?"
-    }]
+    messages = [
+        {
+            "role": "system",
+            "content": [
+                {"type": "text", "text": "You are a helpful assistant."},
+                {
+                    "type": "thinking",
+                    "closed": True,
+                    "thinking": "Only return the answer when you are confident.",
+                },
+            ],
+        },
+        {"role": "user", "content": "What is 2+2?"},
+        {
+            "role": "assistant",
+            "content": [
+                {"type": "text", "text": "Let me think about it."},
+                {"type": "thinking", "closed": True, "thinking": "2+2 = 4"},
+                {
+                    "type": "text",
+                    "text": "The answer is 4.",
+                },
+            ],
+        },
+        {"role": "user", "content": "Thanks, what is 3+3?"},
+    ]
 
     # TODO(Julien): upon model release change to a tokenizer already configured.
     # =================================================================
     mistral_tokenizer = MistralTokenizer.from_pretrained(
-        "mistralai/Devstral-Small-2507")
+        "mistralai/Devstral-Small-2507"
+    )
     assert isinstance(mistral_tokenizer.tokenizer, Tekkenizer)
     # Add think special tokens to the tokenizer
     mistral_tokenizer.tokenizer._all_special_tokens[35] = SpecialTokenInfo(
-        rank=35, is_control=True, token_str=SpecialTokens.begin_think.value)
+        rank=35, is_control=True, token_str=SpecialTokens.begin_think.value
+    )
     mistral_tokenizer.tokenizer._all_special_tokens[36] = SpecialTokenInfo(
-        rank=36, is_control=True, token_str=SpecialTokens.end_think.value)
+        rank=36, is_control=True, token_str=SpecialTokens.end_think.value
+    )
     mistral_tokenizer.tokenizer._special_tokens_reverse_vocab = {
         k: v
-        for k, v in
-        mistral_tokenizer.tokenizer._special_tokens_reverse_vocab.items()
+        for k, v in mistral_tokenizer.tokenizer._special_tokens_reverse_vocab.items()
         if v not in {35, 36}
     }
     mistral_tokenizer.tokenizer._special_tokens_reverse_vocab[
-        SpecialTokens.begin_think.value] = 35
+        SpecialTokens.begin_think.value
+    ] = 35
     mistral_tokenizer.tokenizer._special_tokens_reverse_vocab[
-        SpecialTokens.end_think.value] = 36
+        SpecialTokens.end_think.value
+    ] = 36
     mistral_tokenizer.instruct.BEGIN_THINK = 35
     mistral_tokenizer.instruct.END_THINK = 36
     # =================================================================
 
-    tokens_ids = apply_mistral_chat_template(mistral_tokenizer,
-                                             messages,
-                                             chat_template=None,
-                                             tools=None)
+    tokens_ids = apply_mistral_chat_template(
+        mistral_tokenizer, messages, chat_template=None, tools=None
+    )
 
     string_tokens = mistral_tokenizer.mistral.decode(
-        tokens_ids, special_token_policy=SpecialTokenPolicy.KEEP)
+        tokens_ids, special_token_policy=SpecialTokenPolicy.KEEP
+    )
 
     expected_tokens = (
         r"<s>[SYSTEM_PROMPT]You are a helpful assistant.[THINK]Only return the"
         r" answer when you are confident.[/THINK][/SYSTEM_PROMPT]"
         r"[INST]What is 2+2?[/INST]"
         r"Let me think about it.[THINK]2+2 = 4[/THINK]The answer is 4.</s>"
-        r"[INST]Thanks, what is 3+3?[/INST]")
+        r"[INST]Thanks, what is 3+3?[/INST]"
+    )
 
     assert string_tokens == expected_tokens
 
@@ -2192,37 +2172,32 @@ def test_parse_chat_messages_single_empty_audio_with_uuid(
 ):
     audio_uuid = "abcd"
     conversation, mm_data, mm_uuids = parse_chat_messages(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "input_audio",
-                    "input_audio": {},
-                    "uuid": audio_uuid,
-                },
-                {
-                    "type": "text",
-                    "text": "What does the audio say?"
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "input_audio",
+                        "input_audio": {},
+                        "uuid": audio_uuid,
+                    },
+                    {"type": "text", "text": "What does the audio say?"},
+                ],
+            }
+        ],
         qwen2_audio_model_config,
         qwen2_audio_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "Audio 1: <|audio_bos|><|AUDIO|><|audio_eos|>\nWhat does the audio say?"
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "Audio 1: <|audio_bos|><|AUDIO|><|audio_eos|>\nWhat does the audio say?",
+        }
+    ]
     _assert_mm_data_inputs(mm_data, {"audio": 1})
-    _assert_mm_uuids(mm_uuids,
-                     1,
-                     modality="audio",
-                     expected_uuids=[audio_uuid])
+    _assert_mm_uuids(mm_uuids, 1, modality="audio", expected_uuids=[audio_uuid])
 
 
 @pytest.mark.asyncio
@@ -2232,34 +2207,29 @@ async def test_parse_chat_messages_single_empty_audio_with_uuid_async(
 ):
     audio_uuid = "abcd"
     conversation, mm_future, mm_uuids = parse_chat_messages_futures(
-        [{
-            "role":
-            "user",
-            "content": [
-                {
-                    "type": "input_audio",
-                    "input_audio": {},
-                    "uuid": audio_uuid,
-                },
-                {
-                    "type": "text",
-                    "text": "What does the audio say?"
-                },
-            ],
-        }],
+        [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "input_audio",
+                        "input_audio": {},
+                        "uuid": audio_uuid,
+                    },
+                    {"type": "text", "text": "What does the audio say?"},
+                ],
+            }
+        ],
         qwen2_audio_model_config,
         qwen2_audio_tokenizer,
         content_format="string",
     )
 
-    assert conversation == [{
-        "role":
-        "user",
-        "content":
-        "Audio 1: <|audio_bos|><|AUDIO|><|audio_eos|>\nWhat does the audio say?"
-    }]
+    assert conversation == [
+        {
+            "role": "user",
+            "content": "Audio 1: <|audio_bos|><|AUDIO|><|audio_eos|>\nWhat does the audio say?",
+        }
+    ]
     _assert_mm_data_inputs(await mm_future, {"audio": 1})
-    _assert_mm_uuids(mm_uuids,
-                     1,
-                     modality="audio",
-                     expected_uuids=[audio_uuid])
+    _assert_mm_uuids(mm_uuids, 1, modality="audio", expected_uuids=[audio_uuid])
diff --git a/tests/lora/test_layers.py b/tests/lora/test_layers.py
index 7c29a8529838..695e06e7c1d6 100644
--- a/tests/lora/test_layers.py
+++ b/tests/lora/test_layers.py
@@ -12,9 +12,6 @@
 import torch.nn.functional as F
 
 from vllm.config.lora import LoRAConfig
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.lora.layers import (
     BaseLayerWithLoRA,
     ColumnParallelLinearWithLoRA,
@@ -32,8 +29,6 @@
     RowParallelLinearWithShardedLoRA,
     VocabParallelEmbeddingWithLoRA,
 )
-
-# yapf: enable
 from vllm.lora.models import LoRALayerWeights, PackedLoRALayerWeights
 from vllm.lora.punica_wrapper import get_punica_wrapper
 from vllm.model_executor.layers.linear import (
diff --git a/tests/model_executor/model_loader/tensorizer_loader/test_tensorizer.py b/tests/model_executor/model_loader/tensorizer_loader/test_tensorizer.py
index ed86a6b8b1ed..57db1f98baed 100644
--- a/tests/model_executor/model_loader/tensorizer_loader/test_tensorizer.py
+++ b/tests/model_executor/model_loader/tensorizer_loader/test_tensorizer.py
@@ -17,8 +17,6 @@
 from tests.utils import VLLM_PATH, RemoteOpenAIServer
 from vllm import LLM, SamplingParams
 from vllm.engine.arg_utils import EngineArgs
-
-# yapf: disable
 from vllm.model_executor.model_loader.tensorizer import (
     TensorizerConfig,
     TensorSerializer,
@@ -29,8 +27,6 @@
 from vllm.model_executor.model_loader.tensorizer_loader import (
     BLACKLISTED_TENSORIZER_ARGS,
 )
-
-# yapf: enable
 from vllm.utils import PlaceholderModule
 
 from .conftest import DummyExecutor, assert_from_collective_rpc
diff --git a/tests/models/multimodal/generation/test_common.py b/tests/models/multimodal/generation/test_common.py
index 143d60fbf963..9168778a1663 100644
--- a/tests/models/multimodal/generation/test_common.py
+++ b/tests/models/multimodal/generation/test_common.py
@@ -45,18 +45,17 @@
 if current_platform.is_rocm():
     os.environ["VLLM_USE_TRITON_FLASH_ATTN"] = "0"
 
-# yapf: disable
 COMMON_BROADCAST_SETTINGS = {
     "test_type": VLMTestType.IMAGE,
     "dtype": "half",
     "max_tokens": 5,
     "tensor_parallel_size": 2,
     "hf_model_kwargs": {"device_map": "auto"},
-    "image_size_factors": [(.25, 0.5, 1.0)],
+    "image_size_factors": [(0.25, 0.5, 1.0)],
     "distributed_executor_backend": (
         "ray",
         "mp",
-    )
+    ),
 }
 
 ### Test configuration for specific models
@@ -96,22 +95,20 @@
     #### Core tests to always run in the CI
     "llava": VLMTestInfo(
         models=["llava-hf/llava-1.5-7b-hf"],
-        test_type=(
-            VLMTestType.EMBEDDING,
-            VLMTestType.IMAGE,
-            VLMTestType.CUSTOM_INPUTS
-        ),
+        test_type=(VLMTestType.EMBEDDING, VLMTestType.IMAGE, VLMTestType.CUSTOM_INPUTS),
         prompt_formatter=lambda img_prompt: f"USER: {img_prompt}\nASSISTANT:",
         convert_assets_to_embeddings=model_utils.get_llava_embeddings,
         max_model_len=4096,
         auto_cls=AutoModelForImageTextToText,
         vllm_output_post_proc=model_utils.llava_image_vllm_to_hf_output,
-        custom_test_opts=[CustomTestOptions(
-            inputs=custom_inputs.multi_image_multi_aspect_ratio_inputs(
-                formatter=lambda img_prompt: f"USER: {img_prompt}\nASSISTANT:"
-            ),
-            limit_mm_per_prompt={"image": 4},
-        )],
+        custom_test_opts=[
+            CustomTestOptions(
+                inputs=custom_inputs.multi_image_multi_aspect_ratio_inputs(
+                    formatter=lambda img_prompt: f"USER: {img_prompt}\nASSISTANT:"
+                ),
+                limit_mm_per_prompt={"image": 4},
+            )
+        ],
         # TODO: Revert to "auto" when CPU backend can use torch > 2.6
         dtype="bfloat16" if current_platform.is_cpu() else "auto",
         marks=[pytest.mark.core_model, pytest.mark.cpu_model],
@@ -120,27 +117,27 @@
         models=["google/paligemma-3b-mix-224"],
         test_type=VLMTestType.IMAGE,
         prompt_formatter=identity,
-        img_idx_to_prompt = lambda idx: "",
+        img_idx_to_prompt=lambda idx: "",
         # Paligemma uses its own sample prompts because the default one fails
-        single_image_prompts=IMAGE_ASSETS.prompts({
-            "stop_sign": "caption es",
-            "cherry_blossom": "What is in the picture?",
-        }),
+        single_image_prompts=IMAGE_ASSETS.prompts(
+            {
+                "stop_sign": "caption es",
+                "cherry_blossom": "What is in the picture?",
+            }
+        ),
         auto_cls=AutoModelForImageTextToText,
         vllm_output_post_proc=model_utils.paligemma_vllm_to_hf_output,
         dtype="bfloat16",
-        marks=[pytest.mark.skip(reason="vLLM does not support PrefixLM attention mask")],  # noqa: E501
+        marks=[
+            pytest.mark.skip(reason="vLLM does not support PrefixLM attention mask")
+        ],  # noqa: E501
     ),
     "qwen2_5_vl": VLMTestInfo(
         models=["Qwen/Qwen2.5-VL-3B-Instruct"],
-        test_type=(
-            VLMTestType.IMAGE,
-            VLMTestType.MULTI_IMAGE,
-            VLMTestType.VIDEO
-        ),
-        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n", # noqa: E501
-        img_idx_to_prompt=lambda idx: "<|vision_start|><|image_pad|><|vision_end|>", # noqa: E501
-        video_idx_to_prompt=lambda idx: "<|vision_start|><|video_pad|><|vision_end|>", # noqa: E501
+        test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE, VLMTestType.VIDEO),
+        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n",  # noqa: E501
+        img_idx_to_prompt=lambda idx: "<|vision_start|><|image_pad|><|vision_end|>",  # noqa: E501
+        video_idx_to_prompt=lambda idx: "<|vision_start|><|video_pad|><|vision_end|>",  # noqa: E501
         max_model_len=4096,
         max_num_seqs=2,
         auto_cls=AutoModelForImageTextToText,
@@ -150,17 +147,13 @@
     ),
     "qwen2_5_omni": VLMTestInfo(
         models=["Qwen/Qwen2.5-Omni-3B"],
-        test_type=(
-            VLMTestType.IMAGE,
-            VLMTestType.MULTI_IMAGE,
-            VLMTestType.VIDEO
-        ),
-        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n", # noqa: E501
-        img_idx_to_prompt=lambda idx: "<|vision_bos|><|IMAGE|><|vision_eos|>", # noqa: E501
-        video_idx_to_prompt=lambda idx: "<|vision_bos|><|VIDEO|><|vision_eos|>", # noqa: E501
+        test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE, VLMTestType.VIDEO),
+        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n",  # noqa: E501
+        img_idx_to_prompt=lambda idx: "<|vision_bos|><|IMAGE|><|vision_eos|>",  # noqa: E501
+        video_idx_to_prompt=lambda idx: "<|vision_bos|><|VIDEO|><|vision_eos|>",  # noqa: E501
         max_model_len=4096,
         max_num_seqs=2,
-        num_logprobs= 6 if current_platform.is_cpu() else 5,
+        num_logprobs=6 if current_platform.is_cpu() else 5,
         auto_cls=AutoModelForTextToWaveform,
         vllm_output_post_proc=model_utils.qwen2_vllm_to_hf_output,
         patch_hf_runner=model_utils.qwen2_5_omni_patch_hf_runner,
@@ -168,9 +161,9 @@
         marks=[pytest.mark.core_model, pytest.mark.cpu_model],
     ),
     "ultravox": VLMTestInfo(
-        models = ["fixie-ai/ultravox-v0_5-llama-3_2-1b"],
+        models=["fixie-ai/ultravox-v0_5-llama-3_2-1b"],
         test_type=VLMTestType.AUDIO,
-        prompt_formatter=lambda audio_prompt: f"<|begin_of_text|><|start_header_id|>user<|end_header_id|>\n\n{audio_prompt}<|eot_id|><|start_header_id|>assistant<|end_header_id|>\n\n", # noqa: E501
+        prompt_formatter=lambda audio_prompt: f"<|begin_of_text|><|start_header_id|>user<|end_header_id|>\n\n{audio_prompt}<|eot_id|><|start_header_id|>assistant<|end_header_id|>\n\n",  # noqa: E501
         audio_idx_to_prompt=lambda idx: "<|audio|>",
         max_model_len=4096,
         max_num_seqs=2,
@@ -184,9 +177,11 @@
     "llava-onevision-transformers": VLMTestInfo(
         models=["llava-hf/llava-onevision-qwen2-0.5b-ov-hf"],
         test_type=VLMTestType.IMAGE,
-        prompt_formatter=lambda vid_prompt: f"<|im_start|>user\n{vid_prompt}<|im_end|>\n<|im_start|>assistant\n",   # noqa: E501
+        prompt_formatter=lambda vid_prompt: f"<|im_start|>user\n{vid_prompt}<|im_end|>\n<|im_start|>assistant\n",  # noqa: E501
         max_model_len=16384,
-        hf_model_kwargs=model_utils.llava_onevision_hf_model_kwargs("llava-hf/llava-onevision-qwen2-0.5b-ov-hf"),   # noqa: E501
+        hf_model_kwargs=model_utils.llava_onevision_hf_model_kwargs(
+            "llava-hf/llava-onevision-qwen2-0.5b-ov-hf"
+        ),  # noqa: E501
         auto_cls=AutoModelForImageTextToText,
         vllm_output_post_proc=model_utils.llava_onevision_vllm_to_hf_output,
         image_size_factors=[(0.25, 0.5, 1.0)],
@@ -201,7 +196,7 @@
     "idefics3-transformers": VLMTestInfo(
         models=["HuggingFaceTB/SmolVLM-256M-Instruct"],
         test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE),
-        prompt_formatter=lambda img_prompt:f"<|begin_of_text|>User:{img_prompt}<end_of_utterance>\nAssistant:",  # noqa: E501
+        prompt_formatter=lambda img_prompt: f"<|begin_of_text|>User:{img_prompt}<end_of_utterance>\nAssistant:",  # noqa: E501
         img_idx_to_prompt=lambda idx: "<image>",
         max_model_len=8192,
         max_num_seqs=2,
@@ -217,8 +212,8 @@
     "qwen2_5_vl-transformers": VLMTestInfo(
         models=["Qwen/Qwen2.5-VL-3B-Instruct"],
         test_type=VLMTestType.IMAGE,
-        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n", # noqa: E501
-        img_idx_to_prompt=lambda idx: "<|vision_start|><|image_pad|><|vision_end|>", # noqa: E501
+        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n",  # noqa: E501
+        img_idx_to_prompt=lambda idx: "<|vision_start|><|image_pad|><|vision_end|>",  # noqa: E501
         max_model_len=4096,
         max_num_seqs=2,
         auto_cls=AutoModelForImageTextToText,
@@ -228,23 +223,24 @@
             "model_impl": "transformers",
         },
         # FIXME: Investigate mrope issue
-        marks=[large_gpu_mark(min_gb=32),
-               pytest.mark.skip(reason="Mrope issue")],
+        marks=[large_gpu_mark(min_gb=32), pytest.mark.skip(reason="Mrope issue")],
     ),
     #### Extended model tests
     "aria": VLMTestInfo(
         models=["rhymes-ai/Aria"],
         test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE),
-        prompt_formatter=lambda img_prompt: f"<|im_start|>user\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n ", # noqa: E501
+        prompt_formatter=lambda img_prompt: f"<|im_start|>user\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n ",  # noqa: E501
         img_idx_to_prompt=lambda idx: "<fim_prefix><|img|><fim_suffix>\n",
         max_model_len=4096,
         max_num_seqs=2,
         auto_cls=AutoModelForImageTextToText,
-        single_image_prompts=IMAGE_ASSETS.prompts({
-            "stop_sign": "<vlm_image>Please describe the image shortly.",
-            "cherry_blossom": "<vlm_image>Please infer the season with reason.",  # noqa: E501
-        }),
-        multi_image_prompt="<vlm_image><vlm_image>Describe the two images shortly.",    # noqa: E501
+        single_image_prompts=IMAGE_ASSETS.prompts(
+            {
+                "stop_sign": "<vlm_image>Please describe the image shortly.",
+                "cherry_blossom": "<vlm_image>Please infer the season with reason.",  # noqa: E501
+            }
+        ),
+        multi_image_prompt="<vlm_image><vlm_image>Describe the two images shortly.",  # noqa: E501
         stop_str=["<|im_end|>"],
         image_size_factors=[(0.10, 0.15)],
         max_tokens=64,
@@ -253,11 +249,13 @@
     "aya_vision": VLMTestInfo(
         models=["CohereForAI/aya-vision-8b"],
         test_type=(VLMTestType.IMAGE),
-        prompt_formatter=lambda img_prompt: f"<|START_OF_TURN_TOKEN|><|USER_TOKEN|>{img_prompt}<|END_OF_TURN_TOKEN|><|START_OF_TURN_TOKEN|><|CHATBOT_TOKEN|>", # noqa: E501
-        single_image_prompts=IMAGE_ASSETS.prompts({
-            "stop_sign": "<image>What's the content in the center of the image?",  # noqa: E501
-            "cherry_blossom": "<image>What is the season?",  # noqa: E501
-        }),
+        prompt_formatter=lambda img_prompt: f"<|START_OF_TURN_TOKEN|><|USER_TOKEN|>{img_prompt}<|END_OF_TURN_TOKEN|><|START_OF_TURN_TOKEN|><|CHATBOT_TOKEN|>",  # noqa: E501
+        single_image_prompts=IMAGE_ASSETS.prompts(
+            {
+                "stop_sign": "<image>What's the content in the center of the image?",  # noqa: E501
+                "cherry_blossom": "<image>What is the season?",  # noqa: E501
+            }
+        ),
         multi_image_prompt="<image><image>Describe the two images in detail.",  # noqa: E501
         max_model_len=4096,
         max_num_seqs=2,
@@ -267,11 +265,13 @@
     "aya_vision-multi_image": VLMTestInfo(
         models=["CohereForAI/aya-vision-8b"],
         test_type=(VLMTestType.MULTI_IMAGE),
-        prompt_formatter=lambda img_prompt: f"<|START_OF_TURN_TOKEN|><|USER_TOKEN|>{img_prompt}<|END_OF_TURN_TOKEN|><|START_OF_TURN_TOKEN|><|CHATBOT_TOKEN|>", # noqa: E501
-        single_image_prompts=IMAGE_ASSETS.prompts({
-            "stop_sign": "<image>What's the content in the center of the image?",  # noqa: E501
-            "cherry_blossom": "<image>What is the season?",  # noqa: E501
-        }),
+        prompt_formatter=lambda img_prompt: f"<|START_OF_TURN_TOKEN|><|USER_TOKEN|>{img_prompt}<|END_OF_TURN_TOKEN|><|START_OF_TURN_TOKEN|><|CHATBOT_TOKEN|>",  # noqa: E501
+        single_image_prompts=IMAGE_ASSETS.prompts(
+            {
+                "stop_sign": "<image>What's the content in the center of the image?",  # noqa: E501
+                "cherry_blossom": "<image>What is the season?",  # noqa: E501
+            }
+        ),
         multi_image_prompt="<image><image>Describe the two images in detail.",  # noqa: E501
         max_model_len=4096,
         max_num_seqs=2,
@@ -297,27 +297,29 @@
         max_num_seqs=2,
         auto_cls=AutoModelForImageTextToText,
         # For chameleon, we only compare the sequences
-        vllm_output_post_proc = lambda vllm_output, model: vllm_output[:2],
-        hf_output_post_proc = lambda hf_output, model: hf_output[:2],
+        vllm_output_post_proc=lambda vllm_output, model: vllm_output[:2],
+        hf_output_post_proc=lambda hf_output, model: hf_output[:2],
         comparator=check_outputs_equal,
         max_tokens=8,
         dtype="bfloat16",
     ),
     "deepseek_vl_v2": VLMTestInfo(
-        models=["Isotr0py/deepseek-vl2-tiny"], # model repo using dynamic module
+        models=["Isotr0py/deepseek-vl2-tiny"],  # model repo using dynamic module
         test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE),
-        prompt_formatter=lambda img_prompt: f"<|User|>: {img_prompt}\n\n<|Assistant|>: ", # noqa: E501
+        prompt_formatter=lambda img_prompt: f"<|User|>: {img_prompt}\n\n<|Assistant|>: ",  # noqa: E501
         max_model_len=4096,
         max_num_seqs=2,
-        single_image_prompts=IMAGE_ASSETS.prompts({
-            "stop_sign": "<image>\nWhat's the content in the center of the image?", # noqa: E501
-            "cherry_blossom": "<image>\nPlease infer the season with reason in details.",   # noqa: E501
-        }),
-        multi_image_prompt="image_1:<image>\nimage_2:<image>\nWhich image can we see the car and the tower?",    # noqa: E501
+        single_image_prompts=IMAGE_ASSETS.prompts(
+            {
+                "stop_sign": "<image>\nWhat's the content in the center of the image?",  # noqa: E501
+                "cherry_blossom": "<image>\nPlease infer the season with reason in details.",  # noqa: E501
+            }
+        ),
+        multi_image_prompt="image_1:<image>\nimage_2:<image>\nWhich image can we see the car and the tower?",  # noqa: E501
         patch_hf_runner=model_utils.deepseekvl2_patch_hf_runner,
         hf_output_post_proc=model_utils.deepseekvl2_trunc_hf_output,
         stop_str=["<｜end▁of▁sentence｜>", "<｜begin▁of▁sentence｜>"],  # noqa: E501
-        image_size_factors=[(), (1.0, ), (1.0, 1.0, 1.0), (0.1, 0.5, 1.0)],
+        image_size_factors=[(), (1.0,), (1.0, 1.0, 1.0), (0.1, 0.5, 1.0)],
     ),
     "fuyu": VLMTestInfo(
         models=["adept/fuyu-8b"],
@@ -336,11 +338,13 @@
     "gemma3": VLMTestInfo(
         models=["google/gemma-3-4b-it"],
         test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE),
-        prompt_formatter=lambda img_prompt: f"<bos><start_of_turn>user\n{img_prompt}<end_of_turn>\n<start_of_turn>model\n", # noqa: E501
-        single_image_prompts=IMAGE_ASSETS.prompts({
-            "stop_sign": "<start_of_image>What's the content in the center of the image?",  # noqa: E501
-            "cherry_blossom": "<start_of_image>What is the season?",  # noqa: E501
-        }),
+        prompt_formatter=lambda img_prompt: f"<bos><start_of_turn>user\n{img_prompt}<end_of_turn>\n<start_of_turn>model\n",  # noqa: E501
+        single_image_prompts=IMAGE_ASSETS.prompts(
+            {
+                "stop_sign": "<start_of_image>What's the content in the center of the image?",  # noqa: E501
+                "cherry_blossom": "<start_of_image>What is the season?",  # noqa: E501
+            }
+        ),
         multi_image_prompt="<start_of_image><start_of_image>Describe the two images in detail.",  # noqa: E501
         max_model_len=4096,
         max_num_seqs=2,
@@ -353,10 +357,12 @@
         models=["zai-org/glm-4v-9b"],
         test_type=VLMTestType.IMAGE,
         prompt_formatter=lambda img_prompt: f"<|user|>\n{img_prompt}<|assistant|>",  # noqa: E501
-        single_image_prompts=IMAGE_ASSETS.prompts({
-            "stop_sign": "<|begin_of_image|><|endoftext|><|end_of_image|>What's the content in the center of the image?",  # noqa: E501
-            "cherry_blossom": "<|begin_of_image|><|endoftext|><|end_of_image|>What is the season?",  # noqa: E501
-        }),
+        single_image_prompts=IMAGE_ASSETS.prompts(
+            {
+                "stop_sign": "<|begin_of_image|><|endoftext|><|end_of_image|>What's the content in the center of the image?",  # noqa: E501
+                "cherry_blossom": "<|begin_of_image|><|endoftext|><|end_of_image|>What is the season?",  # noqa: E501
+            }
+        ),
         max_model_len=2048,
         max_num_seqs=2,
         get_stop_token_ids=lambda tok: [151329, 151336, 151338],
@@ -372,8 +378,8 @@
         models=["zai-org/GLM-4.1V-9B-Thinking"],
         test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE),
         prompt_formatter=lambda img_prompt: f"<|user|>\n{img_prompt}<|assistant|>",  # noqa: E501
-        img_idx_to_prompt=lambda idx: "<|begin_of_image|><|image|><|end_of_image|>", # noqa: E501
-        video_idx_to_prompt=lambda idx: "<|begin_of_video|><|video|><|end_of_video|>", # noqa: E501
+        img_idx_to_prompt=lambda idx: "<|begin_of_image|><|image|><|end_of_image|>",  # noqa: E501
+        video_idx_to_prompt=lambda idx: "<|begin_of_video|><|video|><|end_of_video|>",  # noqa: E501
         max_model_len=2048,
         max_num_seqs=2,
         get_stop_token_ids=lambda tok: [151329, 151336, 151338],
@@ -390,23 +396,27 @@
         max_num_seqs=2,
         auto_cls=AutoModelForImageTextToText,
         patch_hf_runner=model_utils.glm4_1v_patch_hf_runner,
-        custom_test_opts=[CustomTestOptions(
-            inputs=custom_inputs.video_with_metadata_glm4_1v(),
-            limit_mm_per_prompt={"video": 1},
-        )],
+        custom_test_opts=[
+            CustomTestOptions(
+                inputs=custom_inputs.video_with_metadata_glm4_1v(),
+                limit_mm_per_prompt={"video": 1},
+            )
+        ],
         marks=[large_gpu_mark(min_gb=32)],
     ),
     "h2ovl": VLMTestInfo(
-        models = [
+        models=[
             "h2oai/h2ovl-mississippi-800m",
             "h2oai/h2ovl-mississippi-2b",
         ],
         test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE),
-        prompt_formatter=lambda img_prompt: f"<|prompt|>{img_prompt}<|end|><|answer|>", # noqa: E501
-        single_image_prompts=IMAGE_ASSETS.prompts({
-            "stop_sign": "<image>\nWhat's the content in the center of the image?",  # noqa: E501
-            "cherry_blossom": "<image>\nWhat is the season?",
-        }),
+        prompt_formatter=lambda img_prompt: f"<|prompt|>{img_prompt}<|end|><|answer|>",  # noqa: E501
+        single_image_prompts=IMAGE_ASSETS.prompts(
+            {
+                "stop_sign": "<image>\nWhat's the content in the center of the image?",  # noqa: E501
+                "cherry_blossom": "<image>\nWhat is the season?",
+            }
+        ),
         multi_image_prompt="Image-1: <image>\nImage-2: <image>\nDescribe the two images in short.",  # noqa: E501
         max_model_len=8192,
         use_tokenizer_eos=True,
@@ -416,7 +426,7 @@
     "idefics3": VLMTestInfo(
         models=["HuggingFaceTB/SmolVLM-256M-Instruct"],
         test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE),
-        prompt_formatter=lambda img_prompt:f"<|begin_of_text|>User:{img_prompt}<end_of_utterance>\nAssistant:",  # noqa: E501
+        prompt_formatter=lambda img_prompt: f"<|begin_of_text|>User:{img_prompt}<end_of_utterance>\nAssistant:",  # noqa: E501
         img_idx_to_prompt=lambda idx: "<image>",
         max_model_len=8192,
         max_num_seqs=2,
@@ -431,11 +441,13 @@
             # "OpenGVLab/Mono-InternVL-2B",
         ],
         test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE),
-        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>Assistant\n", # noqa: E501
-        single_image_prompts=IMAGE_ASSETS.prompts({
-            "stop_sign": "<image>\nWhat's the content in the center of the image?",  # noqa: E501
-            "cherry_blossom": "<image>\nWhat is the season?",
-        }),
+        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>Assistant\n",  # noqa: E501
+        single_image_prompts=IMAGE_ASSETS.prompts(
+            {
+                "stop_sign": "<image>\nWhat's the content in the center of the image?",  # noqa: E501
+                "cherry_blossom": "<image>\nWhat is the season?",
+            }
+        ),
         multi_image_prompt="Image-1: <image>\nImage-2: <image>\nDescribe the two images in short.",  # noqa: E501
         max_model_len=4096,
         use_tokenizer_eos=True,
@@ -446,7 +458,7 @@
             "OpenGVLab/InternVL3-1B",
         ],
         test_type=VLMTestType.VIDEO,
-        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>Assistant\n", # noqa: E501
+        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>Assistant\n",  # noqa: E501
         video_idx_to_prompt=lambda idx: "<video>",
         max_model_len=8192,
         use_tokenizer_eos=True,
@@ -459,7 +471,7 @@
             VLMTestType.MULTI_IMAGE,
             VLMTestType.VIDEO,
         ),
-        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>Assistant\n", # noqa: E501
+        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>Assistant\n",  # noqa: E501
         img_idx_to_prompt=lambda idx: "<IMG_CONTEXT>",
         video_idx_to_prompt=lambda idx: "<video>",
         max_model_len=8192,
@@ -469,7 +481,7 @@
     "kimi_vl": VLMTestInfo(
         models=["moonshotai/Kimi-VL-A3B-Instruct"],
         test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE),
-        prompt_formatter=lambda img_prompt: f"<|im_user|>user<|im_middle|>{img_prompt}<|im_end|><|im_assistant|>assistant<|im_middle|>", # noqa: E501
+        prompt_formatter=lambda img_prompt: f"<|im_user|>user<|im_middle|>{img_prompt}<|im_end|><|im_assistant|>assistant<|im_middle|>",  # noqa: E501
         img_idx_to_prompt=lambda _: "<|media_start|>image<|media_content|><|media_pad|><|media_end|>",  # noqa: E501
         max_model_len=8192,
         max_num_seqs=2,
@@ -480,11 +492,11 @@
     ),
     "llama4": VLMTestInfo(
         models=["meta-llama/Llama-4-Scout-17B-16E-Instruct"],
-        prompt_formatter=lambda img_prompt: f"<|begin_of_text|><|header_start|>user<|header_end|>\n\n{img_prompt}<|eot|><|header_start|>assistant<|header_end|>\n\n", # noqa: E501
+        prompt_formatter=lambda img_prompt: f"<|begin_of_text|><|header_start|>user<|header_end|>\n\n{img_prompt}<|eot|><|header_start|>assistant<|header_end|>\n\n",  # noqa: E501
         img_idx_to_prompt=lambda _: "<|image|>",
         test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE),
         distributed_executor_backend="mp",
-        image_size_factors=[(.25, 0.5, 1.0)],
+        image_size_factors=[(0.25, 0.5, 1.0)],
         hf_model_kwargs={"device_map": "auto"},
         max_model_len=8192,
         max_num_seqs=4,
@@ -500,28 +512,34 @@
         max_model_len=10240,
         auto_cls=AutoModelForImageTextToText,
         vllm_output_post_proc=model_utils.llava_image_vllm_to_hf_output,
-        custom_test_opts=[CustomTestOptions(
-            inputs=custom_inputs.multi_image_multi_aspect_ratio_inputs(
-                formatter=lambda img_prompt: f"[INST] {img_prompt} [/INST]"
-            ),
-            limit_mm_per_prompt={"image": 4},
-        )],
+        custom_test_opts=[
+            CustomTestOptions(
+                inputs=custom_inputs.multi_image_multi_aspect_ratio_inputs(
+                    formatter=lambda img_prompt: f"[INST] {img_prompt} [/INST]"
+                ),
+                limit_mm_per_prompt={"image": 4},
+            )
+        ],
     ),
     "llava_onevision": VLMTestInfo(
         models=["llava-hf/llava-onevision-qwen2-0.5b-ov-hf"],
         test_type=VLMTestType.CUSTOM_INPUTS,
-        prompt_formatter=lambda vid_prompt: f"<|im_start|>user\n{vid_prompt}<|im_end|>\n<|im_start|>assistant\n",   # noqa: E501
+        prompt_formatter=lambda vid_prompt: f"<|im_start|>user\n{vid_prompt}<|im_end|>\n<|im_start|>assistant\n",  # noqa: E501
         num_video_frames=16,
         max_model_len=16384,
-        hf_model_kwargs=model_utils.llava_onevision_hf_model_kwargs("llava-hf/llava-onevision-qwen2-0.5b-ov-hf"),   # noqa: E501
+        hf_model_kwargs=model_utils.llava_onevision_hf_model_kwargs(
+            "llava-hf/llava-onevision-qwen2-0.5b-ov-hf"
+        ),  # noqa: E501
         auto_cls=AutoModelForImageTextToText,
         vllm_output_post_proc=model_utils.llava_onevision_vllm_to_hf_output,
-        custom_test_opts=[CustomTestOptions(
-            inputs=custom_inputs.multi_video_multi_aspect_ratio_inputs(
-                formatter=lambda vid_prompt: f"<|im_start|>user\n{vid_prompt}<|im_end|>\n<|im_start|>assistant\n",   # noqa: E501
-            ),
-            limit_mm_per_prompt={"video": 4},
-        )],
+        custom_test_opts=[
+            CustomTestOptions(
+                inputs=custom_inputs.multi_video_multi_aspect_ratio_inputs(
+                    formatter=lambda vid_prompt: f"<|im_start|>user\n{vid_prompt}<|im_end|>\n<|im_start|>assistant\n",  # noqa: E501
+                ),
+                limit_mm_per_prompt={"video": 4},
+            )
+        ],
     ),
     "llava_next_video": VLMTestInfo(
         models=["llava-hf/LLaVA-NeXT-Video-7B-hf"],
@@ -563,7 +581,9 @@
         img_idx_to_prompt=lambda idx: "(<image>./</image>)\n",
         max_model_len=4096,
         max_num_seqs=2,
-        get_stop_token_ids=lambda tok: tok.convert_tokens_to_ids(['<|im_end|>', '<|endoftext|>']),  # noqa: E501
+        get_stop_token_ids=lambda tok: tok.convert_tokens_to_ids(
+            ["<|im_end|>", "<|endoftext|>"]
+        ),  # noqa: E501
         hf_output_post_proc=model_utils.minicpmv_trunc_hf_output,
         patch_hf_runner=model_utils.minicpmo_26_patch_hf_runner,
         # FIXME: https://huggingface.co/openbmb/MiniCPM-o-2_6/discussions/49
@@ -576,13 +596,15 @@
         img_idx_to_prompt=lambda idx: "(<image>./</image>)\n",
         max_model_len=4096,
         max_num_seqs=2,
-        get_stop_token_ids=lambda tok: tok.convert_tokens_to_ids(['<|im_end|>', '<|endoftext|>']),  # noqa: E501
+        get_stop_token_ids=lambda tok: tok.convert_tokens_to_ids(
+            ["<|im_end|>", "<|endoftext|>"]
+        ),  # noqa: E501
         hf_output_post_proc=model_utils.minicpmv_trunc_hf_output,
         patch_hf_runner=model_utils.minicpmv_26_patch_hf_runner,
     ),
     "minimax_vl_01": VLMTestInfo(
         models=["MiniMaxAI/MiniMax-VL-01"],
-        prompt_formatter=lambda img_prompt: f"<beginning_of_sentence>user: {img_prompt} assistant:<end_of_sentence>", # noqa: E501
+        prompt_formatter=lambda img_prompt: f"<beginning_of_sentence>user: {img_prompt} assistant:<end_of_sentence>",  # noqa: E501
         img_idx_to_prompt=lambda _: "<image>",
         test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE),
         max_model_len=8192,
@@ -604,8 +626,8 @@
     "ovis1_6-gemma2": VLMTestInfo(
         models=["AIDC-AI/Ovis1.6-Gemma2-9B"],
         test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE),
-        prompt_formatter=lambda img_prompt: f"<bos><start_of_turn>user\n{img_prompt}<end_of_turn>\n<start_of_turn>model\n", # noqa: E501
-        img_idx_to_prompt=lambda idx: "<image>\n", # noqa: E501
+        prompt_formatter=lambda img_prompt: f"<bos><start_of_turn>user\n{img_prompt}<end_of_turn>\n<start_of_turn>model\n",  # noqa: E501
+        img_idx_to_prompt=lambda idx: "<image>\n",  # noqa: E501
         max_model_len=4096,
         max_num_seqs=2,
         dtype="half",
@@ -617,8 +639,8 @@
     "ovis2": VLMTestInfo(
         models=["AIDC-AI/Ovis2-1B"],
         test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE),
-        prompt_formatter=lambda img_prompt: f"<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n<|im_start|>user\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n", # noqa: E501
-        img_idx_to_prompt=lambda idx: "<image>\n", # noqa: E501
+        prompt_formatter=lambda img_prompt: f"<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n<|im_start|>user\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n",  # noqa: E501
+        img_idx_to_prompt=lambda idx: "<image>\n",  # noqa: E501
         max_model_len=4096,
         max_num_seqs=2,
         dtype="half",
@@ -628,13 +650,9 @@
     ),
     "ovis2_5": VLMTestInfo(
         models=["AIDC-AI/Ovis2.5-2B"],
-        test_type=(
-            VLMTestType.IMAGE,
-            VLMTestType.MULTI_IMAGE,
-            VLMTestType.VIDEO
-        ),
-        prompt_formatter=lambda img_prompt: f"<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n<|im_start|>user\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n", # noqa: E501
-        img_idx_to_prompt=lambda idx: "<image>\n", # noqa: E501
+        test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE, VLMTestType.VIDEO),
+        prompt_formatter=lambda img_prompt: f"<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n<|im_start|>user\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n",  # noqa: E501
+        img_idx_to_prompt=lambda idx: "<image>\n",  # noqa: E501
         video_idx_to_prompt=lambda idx: "<video>\n",
         max_model_len=4096,
         max_num_seqs=2,
@@ -646,7 +664,7 @@
     "phi3v": VLMTestInfo(
         models=["microsoft/Phi-3.5-vision-instruct"],
         test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE),
-        prompt_formatter=lambda img_prompt: f"<|user|>\n{img_prompt}<|end|>\n<|assistant|>\n", # noqa: E501
+        prompt_formatter=lambda img_prompt: f"<|user|>\n{img_prompt}<|end|>\n<|assistant|>\n",  # noqa: E501
         img_idx_to_prompt=lambda idx: f"<|image_{idx}|>\n",
         max_model_len=4096,
         max_num_seqs=2,
@@ -681,15 +699,11 @@
     ),
     "qwen2_vl": VLMTestInfo(
         models=["Qwen/Qwen2-VL-2B-Instruct"],
-        test_type=(
-            VLMTestType.IMAGE,
-            VLMTestType.MULTI_IMAGE,
-            VLMTestType.VIDEO
-        ),
-        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n", # noqa: E501
-        img_idx_to_prompt=lambda idx: "<|vision_start|><|image_pad|><|vision_end|>", # noqa: E501
-        video_idx_to_prompt=lambda idx: "<|vision_start|><|video_pad|><|vision_end|>", # noqa: E501
-        multi_image_prompt="Picture 1: <vlm_image>\nPicture 2: <vlm_image>\nDescribe these two images with one paragraph respectively.",    # noqa: E501
+        test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE, VLMTestType.VIDEO),
+        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n",  # noqa: E501
+        img_idx_to_prompt=lambda idx: "<|vision_start|><|image_pad|><|vision_end|>",  # noqa: E501
+        video_idx_to_prompt=lambda idx: "<|vision_start|><|video_pad|><|vision_end|>",  # noqa: E501
+        multi_image_prompt="Picture 1: <vlm_image>\nPicture 2: <vlm_image>\nDescribe these two images with one paragraph respectively.",  # noqa: E501
         max_model_len=4096,
         max_num_seqs=2,
         auto_cls=AutoModelForImageTextToText,
@@ -700,11 +714,13 @@
     "skywork_r1v": VLMTestInfo(
         models=["Skywork/Skywork-R1V-38B"],
         test_type=(VLMTestType.IMAGE, VLMTestType.MULTI_IMAGE),
-        prompt_formatter=lambda img_prompt: f"<｜begin▁of▁sentence｜><｜User｜>\n{img_prompt}<｜Assistant｜><think>\n", # noqa: E501
-        single_image_prompts=IMAGE_ASSETS.prompts({
-            "stop_sign": "<image>\nWhat's the content in the center of the image?",  # noqa: E501
-            "cherry_blossom": "<image>\nWhat is the season?",
-        }),
+        prompt_formatter=lambda img_prompt: f"<｜begin▁of▁sentence｜><｜User｜>\n{img_prompt}<｜Assistant｜><think>\n",  # noqa: E501
+        single_image_prompts=IMAGE_ASSETS.prompts(
+            {
+                "stop_sign": "<image>\nWhat's the content in the center of the image?",  # noqa: E501
+                "cherry_blossom": "<image>\nWhat is the season?",
+            }
+        ),
         multi_image_prompt="<image>\n<image>\nDescribe the two images in short.",  # noqa: E501
         max_model_len=4096,
         use_tokenizer_eos=True,
@@ -737,9 +753,9 @@
             VLMTestType.MULTI_IMAGE,
             VLMTestType.VIDEO,
         ),
-        prompt_formatter=lambda img_prompt: f"<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n<|im_start|>user\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n", # noqa: E501
-        img_idx_to_prompt=lambda idx: "<|vision_start|><|image_pad|><|vision_end|>", # noqa: E501
-        video_idx_to_prompt=lambda idx: "<|vision_start|><|video_pad|><|vision_end|>", # noqa: E501
+        prompt_formatter=lambda img_prompt: f"<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n<|im_start|>user\n{img_prompt}<|im_end|>\n<|im_start|>assistant\n",  # noqa: E501
+        img_idx_to_prompt=lambda idx: "<|vision_start|><|image_pad|><|vision_end|>",  # noqa: E501
+        video_idx_to_prompt=lambda idx: "<|vision_start|><|video_pad|><|vision_end|>",  # noqa: E501
         max_model_len=4096,
         max_num_seqs=2,
         auto_cls=AutoModelForImageTextToText,
@@ -752,11 +768,11 @@
         prompt_formatter=lambda img_prompt: f"USER: {img_prompt}\nASSISTANT:",
         max_model_len=4096,
         auto_cls=AutoModelForImageTextToText,
-        vllm_output_post_proc = lambda vllm_output, model: vllm_output[:2],
-        hf_output_post_proc = lambda hf_output, model: hf_output[:2],
+        vllm_output_post_proc=lambda vllm_output, model: vllm_output[:2],
+        hf_output_post_proc=lambda hf_output, model: hf_output[:2],
         comparator=check_outputs_equal,
         marks=multi_gpu_marks(num_gpus=2),
-        **COMMON_BROADCAST_SETTINGS # type: ignore
+        **COMMON_BROADCAST_SETTINGS,  # type: ignore
     ),
     "llava-broadcast": VLMTestInfo(
         models=["llava-hf/llava-1.5-7b-hf"],
@@ -765,7 +781,7 @@
         auto_cls=AutoModelForImageTextToText,
         vllm_output_post_proc=model_utils.llava_image_vllm_to_hf_output,
         marks=multi_gpu_marks(num_gpus=2),
-        **COMMON_BROADCAST_SETTINGS # type: ignore
+        **COMMON_BROADCAST_SETTINGS,  # type: ignore
     ),
     "llava_next-broadcast": VLMTestInfo(
         models=["llava-hf/llava-v1.6-mistral-7b-hf"],
@@ -774,12 +790,12 @@
         auto_cls=AutoModelForImageTextToText,
         vllm_output_post_proc=model_utils.llava_image_vllm_to_hf_output,
         marks=multi_gpu_marks(num_gpus=2),
-        **COMMON_BROADCAST_SETTINGS # type: ignore
+        **COMMON_BROADCAST_SETTINGS,  # type: ignore
     ),
     ### Custom input edge-cases for specific models
     "intern_vl-diff-patches": VLMTestInfo(
         models=["OpenGVLab/InternVL2-2B"],
-        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>Assistant\n", # noqa: E501
+        prompt_formatter=lambda img_prompt: f"<|im_start|>User\n{img_prompt}<|im_end|>\n<|im_start|>Assistant\n",  # noqa: E501
         test_type=VLMTestType.CUSTOM_INPUTS,
         max_model_len=4096,
         use_tokenizer_eos=True,
@@ -788,7 +804,8 @@
             CustomTestOptions(
                 inputs=inp,
                 limit_mm_per_prompt={"image": 2},
-            ) for inp in custom_inputs.different_patch_input_cases_internvl()
+            )
+            for inp in custom_inputs.different_patch_input_cases_internvl()
         ],
     ),
     "llava_onevision-multiple-images": VLMTestInfo(
@@ -797,14 +814,18 @@
         max_model_len=16384,
         max_num_seqs=2,
         auto_cls=AutoModelForImageTextToText,
-        hf_model_kwargs=model_utils.llava_onevision_hf_model_kwargs("llava-hf/llava-onevision-qwen2-0.5b-ov-hf"),   # noqa: E501
+        hf_model_kwargs=model_utils.llava_onevision_hf_model_kwargs(
+            "llava-hf/llava-onevision-qwen2-0.5b-ov-hf"
+        ),  # noqa: E501
         vllm_output_post_proc=model_utils.llava_onevision_vllm_to_hf_output,
-        custom_test_opts=[CustomTestOptions(
-            inputs=custom_inputs.multi_image_multi_aspect_ratio_inputs(
-                formatter=lambda vid_prompt: f"<|im_start|>user\n{vid_prompt}<|im_end|>\n<|im_start|>assistant\n",  # noqa: E501
-            ),
-            limit_mm_per_prompt={"image": 4},
-        )],
+        custom_test_opts=[
+            CustomTestOptions(
+                inputs=custom_inputs.multi_image_multi_aspect_ratio_inputs(
+                    formatter=lambda vid_prompt: f"<|im_start|>user\n{vid_prompt}<|im_end|>\n<|im_start|>assistant\n",  # noqa: E501
+                ),
+                limit_mm_per_prompt={"image": 4},
+            )
+        ],
     ),
     # regression test for https://github.com/vllm-project/vllm/issues/15122
     "qwen2_5_vl-windows-attention": VLMTestInfo(
@@ -814,13 +835,14 @@
         max_num_seqs=2,
         auto_cls=AutoModelForImageTextToText,
         vllm_output_post_proc=model_utils.qwen2_vllm_to_hf_output,
-        custom_test_opts=[CustomTestOptions(
-            inputs=custom_inputs.windows_attention_image_qwen2_5_vl(),
-            limit_mm_per_prompt={"image": 1},
-        )],
+        custom_test_opts=[
+            CustomTestOptions(
+                inputs=custom_inputs.windows_attention_image_qwen2_5_vl(),
+                limit_mm_per_prompt={"image": 1},
+            )
+        ],
     ),
 }
-# yapf: enable
 
 
 def _mark_splits(
diff --git a/tests/models/multimodal/generation/vlm_utils/case_filtering.py b/tests/models/multimodal/generation/vlm_utils/case_filtering.py
index 89d5829fd0f8..77e478e53c1f 100644
--- a/tests/models/multimodal/generation/vlm_utils/case_filtering.py
+++ b/tests/models/multimodal/generation/vlm_utils/case_filtering.py
@@ -114,7 +114,6 @@ def get_model_type_cases(model_type: str, test_info: VLMTestInfo):
                 raise ValueError("Test has type CUSTOM_INPUTS, but none given")
             iter_kwargs["custom_test_opts"] = test_info.custom_test_opts
 
-        # yapf: disable
         # Wrap all model cases in a pytest parameter & pass marks through
         return [
             pytest.param(
@@ -122,10 +121,10 @@ def get_model_type_cases(model_type: str, test_info: VLMTestInfo):
                 ExpandableVLMTestArgs(
                     **{k: v for k, v in zip(iter_kwargs.keys(), case)}
                 ),
-                marks=test_info.marks if test_info.marks is not None else []
-            ) for case in list(itertools.product(*iter_kwargs.values()))
+                marks=test_info.marks if test_info.marks is not None else [],
+            )
+            for case in list(itertools.product(*iter_kwargs.values()))
         ]
-        # yapf: enable
 
     # Get a list per model type, where each entry contains a tuple of all of
     # that model type's cases, then flatten them into the top level so that
diff --git a/tests/models/multimodal/generation/vlm_utils/model_utils.py b/tests/models/multimodal/generation/vlm_utils/model_utils.py
index d217f2890419..f924bea9f495 100644
--- a/tests/models/multimodal/generation/vlm_utils/model_utils.py
+++ b/tests/models/multimodal/generation/vlm_utils/model_utils.py
@@ -418,7 +418,6 @@ def __init__(self, hf_runner: HfRunner):
             self.image_size = self.vision_config.image_size
 
         def __call__(self, text: str, images: Union[Image, list[Image]], **kwargs):
-            # yapf: disable
             from vllm.model_executor.models.h2ovl import (
                 IMG_CONTEXT,
                 IMG_END,
@@ -426,7 +425,6 @@ def __call__(self, text: str, images: Union[Image, list[Image]], **kwargs):
                 image_to_pixel_values_h2ovl,
             )
 
-            # yapf: enable
             images = [images] if isinstance(images, Image) else images
             pixel_values = [
                 image_to_pixel_values_h2ovl(
diff --git a/tests/models/multimodal/generation/vlm_utils/types.py b/tests/models/multimodal/generation/vlm_utils/types.py
index a28e85f91a7f..bb34d1cc6dad 100644
--- a/tests/models/multimodal/generation/vlm_utils/types.py
+++ b/tests/models/multimodal/generation/vlm_utils/types.py
@@ -33,24 +33,26 @@
 TEST_VIDEO_PLACEHOLDER = "<vlm_video>"
 TEST_AUDIO_PLACEHOLDER = "<lmm_audio>"
 
-# yapf: disable
-SINGLE_IMAGE_BASE_PROMPTS = IMAGE_ASSETS.prompts({
-    "stop_sign": f"{TEST_IMG_PLACEHOLDER}What's the content of the image?",
-    "cherry_blossom": f"{TEST_IMG_PLACEHOLDER}What is the season?",
-})
-SINGLE_AUDIO_BASE_PROMPT = AUDIO_ASSETS.prompts({
-    "mary_had_lamb": f"{TEST_AUDIO_PLACEHOLDER}Transcribe this audio into English.",    # noqa: E501
-    "winning_call": f"{TEST_AUDIO_PLACEHOLDER}What is happening in this audio clip?",     # noqa: E501
-})
+SINGLE_IMAGE_BASE_PROMPTS = IMAGE_ASSETS.prompts(
+    {
+        "stop_sign": f"{TEST_IMG_PLACEHOLDER}What's the content of the image?",
+        "cherry_blossom": f"{TEST_IMG_PLACEHOLDER}What is the season?",
+    }
+)
+SINGLE_AUDIO_BASE_PROMPT = AUDIO_ASSETS.prompts(
+    {
+        "mary_had_lamb": f"{TEST_AUDIO_PLACEHOLDER}Transcribe this audio into English.",  # noqa: E501
+        "winning_call": f"{TEST_AUDIO_PLACEHOLDER}What is happening in this audio clip?",  # noqa: E501
+    }
+)
 
 MULTI_IMAGE_BASE_PROMPT = f"Image-1: {TEST_IMG_PLACEHOLDER}Image-2: {TEST_IMG_PLACEHOLDER}Describe the two images in detail.\n"  # noqa: E501
 VIDEO_BASE_PROMPT = f"{TEST_VIDEO_PLACEHOLDER}Why is this video funny?"
 
 
-IMAGE_SIZE_FACTORS = [(), (1.0, ), (1.0, 1.0, 1.0), (0.25, 0.5, 1.0)]
-EMBEDDING_SIZE_FACTORS = [(), (1.0, ), (1.0, 1.0, 1.0)]
+IMAGE_SIZE_FACTORS = [(), (1.0,), (1.0, 1.0, 1.0), (0.25, 0.5, 1.0)]
+EMBEDDING_SIZE_FACTORS = [(), (1.0,), (1.0, 1.0, 1.0)]
 RunnerOutput = tuple[list[int], str, Optional[SampleLogprobs]]
-# yapf: enable
 
 
 class PromptWithMultiModalInput(NamedTuple):
diff --git a/tests/models/multimodal/processing/test_common.py b/tests/models/multimodal/processing/test_common.py
index 4f6a5649b4e5..d9d85f7e0c00 100644
--- a/tests/models/multimodal/processing/test_common.py
+++ b/tests/models/multimodal/processing/test_common.py
@@ -322,80 +322,81 @@ def _test_processing_correctness_one(
         )
 
 
-# yapf: disable
-@pytest.mark.parametrize("model_id", [
-    "rhymes-ai/Aria",
-    "CohereForAI/aya-vision-8b",
-    "Salesforce/blip2-opt-2.7b",
-    "facebook/chameleon-7b",
-    "CohereLabs/command-a-vision-07-2025",
-    "deepseek-ai/deepseek-vl2-tiny",
-    "baidu/ERNIE-4.5-VL-28B-A3B-PT",
-    "adept/fuyu-8b",
-    "google/gemma-3-4b-it",
-    "google/gemma-3n-E2B-it",
-    "zai-org/glm-4v-9b",
-    "zai-org/GLM-4.1V-9B-Thinking",
-    "zai-org/GLM-4.5V",
-    "ibm-granite/granite-speech-3.3-2b",
-    "h2oai/h2ovl-mississippi-800m",
-    "naver-hyperclovax/HyperCLOVAX-SEED-Vision-Instruct-3B",
-    "HuggingFaceM4/Idefics3-8B-Llama3",
-    "internlm/Intern-S1",
-    "OpenGVLab/InternVL2-1B",
-    "OpenGVLab/InternVL3-1B",
-    "OpenGVLab/InternVL3_5-1B",
-    "OpenGVLab/InternVL3_5-GPT-OSS-20B-A4B-Preview",
-    "OpenGVLab/InternVL3_5-30B-A3B",
-    "Kwai-Keye/Keye-VL-8B-Preview",
-    "Kwai-Keye/Keye-VL-1_5-8B",
-    "moonshotai/Kimi-VL-A3B-Instruct",
-    "meta-llama/Llama-4-Scout-17B-16E-Instruct",
-    "llava-hf/llava-1.5-7b-hf",
-    "llava-hf/llava-v1.6-mistral-7b-hf",
-    "llava-hf/LLaVA-NeXT-Video-7B-hf",
-    "llava-hf/llava-onevision-qwen2-0.5b-ov-hf",
-    "TIGER-Lab/Mantis-8B-siglip-llama3",
-    "mispeech/midashenglm-7b",
-    "openbmb/MiniCPM-Llama3-V-2_5",
-    "openbmb/MiniCPM-o-2_6",
-    "openbmb/MiniCPM-V-2_6",
-    "MiniMaxAI/MiniMax-VL-01",
-    "allenai/Molmo-7B-D-0924",
-    "allenai/Molmo-7B-O-0924",
-    "nvidia/NVLM-D-72B",
-    "nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1",
-    "AIDC-AI/Ovis1.6-Gemma2-9B",
-    "AIDC-AI/Ovis1.6-Llama3.2-3B",
-    "AIDC-AI/Ovis2-1B",
-    "AIDC-AI/Ovis2.5-2B",
-    "google/paligemma-3b-mix-224",
-    "google/paligemma2-3b-ft-docci-448",
-    "microsoft/Phi-3.5-vision-instruct",
-    "microsoft/Phi-4-multimodal-instruct",
-    "mistralai/Pixtral-12B-2409",
-    "mistral-community/pixtral-12b",
-    "Qwen/Qwen-VL-Chat",
-    "Qwen/Qwen2-VL-2B-Instruct",
-    "Qwen/Qwen2.5-VL-3B-Instruct",
-    "Qwen/Qwen2-Audio-7B-Instruct",
-    "Qwen/Qwen2.5-Omni-3B",
-    "Qwen/Qwen3-VL-4B-Instruct",
-    "Qwen/Qwen3-VL-30B-A3B-Instruct",
-    "YannQi/R-4B",
-    "Skywork/Skywork-R1V-38B",
-    "HuggingFaceTB/SmolVLM2-2.2B-Instruct",
-    "stepfun-ai/step3",
-    "fixie-ai/ultravox-v0_5-llama-3_2-1b",
-    "openai/whisper-large-v3",
-    "omni-research/Tarsier-7b",
-    "omni-research/Tarsier2-Recap-7b",
-    "mistralai/Voxtral-Mini-3B-2507",
-])
+@pytest.mark.parametrize(
+    "model_id",
+    [
+        "rhymes-ai/Aria",
+        "CohereForAI/aya-vision-8b",
+        "Salesforce/blip2-opt-2.7b",
+        "facebook/chameleon-7b",
+        "CohereLabs/command-a-vision-07-2025",
+        "deepseek-ai/deepseek-vl2-tiny",
+        "baidu/ERNIE-4.5-VL-28B-A3B-PT",
+        "adept/fuyu-8b",
+        "google/gemma-3-4b-it",
+        "google/gemma-3n-E2B-it",
+        "zai-org/glm-4v-9b",
+        "zai-org/GLM-4.1V-9B-Thinking",
+        "zai-org/GLM-4.5V",
+        "ibm-granite/granite-speech-3.3-2b",
+        "h2oai/h2ovl-mississippi-800m",
+        "naver-hyperclovax/HyperCLOVAX-SEED-Vision-Instruct-3B",
+        "HuggingFaceM4/Idefics3-8B-Llama3",
+        "internlm/Intern-S1",
+        "OpenGVLab/InternVL2-1B",
+        "OpenGVLab/InternVL3-1B",
+        "OpenGVLab/InternVL3_5-1B",
+        "OpenGVLab/InternVL3_5-GPT-OSS-20B-A4B-Preview",
+        "OpenGVLab/InternVL3_5-30B-A3B",
+        "Kwai-Keye/Keye-VL-8B-Preview",
+        "Kwai-Keye/Keye-VL-1_5-8B",
+        "moonshotai/Kimi-VL-A3B-Instruct",
+        "meta-llama/Llama-4-Scout-17B-16E-Instruct",
+        "llava-hf/llava-1.5-7b-hf",
+        "llava-hf/llava-v1.6-mistral-7b-hf",
+        "llava-hf/LLaVA-NeXT-Video-7B-hf",
+        "llava-hf/llava-onevision-qwen2-0.5b-ov-hf",
+        "TIGER-Lab/Mantis-8B-siglip-llama3",
+        "mispeech/midashenglm-7b",
+        "openbmb/MiniCPM-Llama3-V-2_5",
+        "openbmb/MiniCPM-o-2_6",
+        "openbmb/MiniCPM-V-2_6",
+        "MiniMaxAI/MiniMax-VL-01",
+        "allenai/Molmo-7B-D-0924",
+        "allenai/Molmo-7B-O-0924",
+        "nvidia/NVLM-D-72B",
+        "nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1",
+        "AIDC-AI/Ovis1.6-Gemma2-9B",
+        "AIDC-AI/Ovis1.6-Llama3.2-3B",
+        "AIDC-AI/Ovis2-1B",
+        "AIDC-AI/Ovis2.5-2B",
+        "google/paligemma-3b-mix-224",
+        "google/paligemma2-3b-ft-docci-448",
+        "microsoft/Phi-3.5-vision-instruct",
+        "microsoft/Phi-4-multimodal-instruct",
+        "mistralai/Pixtral-12B-2409",
+        "mistral-community/pixtral-12b",
+        "Qwen/Qwen-VL-Chat",
+        "Qwen/Qwen2-VL-2B-Instruct",
+        "Qwen/Qwen2.5-VL-3B-Instruct",
+        "Qwen/Qwen2-Audio-7B-Instruct",
+        "Qwen/Qwen2.5-Omni-3B",
+        "Qwen/Qwen3-VL-4B-Instruct",
+        "Qwen/Qwen3-VL-30B-A3B-Instruct",
+        "YannQi/R-4B",
+        "Skywork/Skywork-R1V-38B",
+        "HuggingFaceTB/SmolVLM2-2.2B-Instruct",
+        "stepfun-ai/step3",
+        "fixie-ai/ultravox-v0_5-llama-3_2-1b",
+        "openai/whisper-large-v3",
+        "omni-research/Tarsier-7b",
+        "omni-research/Tarsier2-Recap-7b",
+        "mistralai/Voxtral-Mini-3B-2507",
+    ],
+)
 @pytest.mark.parametrize("hit_rate", [0.3, 0.5, 1.0])
 @pytest.mark.parametrize("num_batches", [32])
 @pytest.mark.parametrize("simplify_rate", [1.0])
-# yapf: enable
 def test_processing_correctness(
     model_id: str,
     hit_rate: float,
diff --git a/tests/models/multimodal/processing/test_idefics3.py b/tests/models/multimodal/processing/test_idefics3.py
index 2028d13943cc..351b9d018eec 100644
--- a/tests/models/multimodal/processing/test_idefics3.py
+++ b/tests/models/multimodal/processing/test_idefics3.py
@@ -12,7 +12,6 @@
 
 
 @pytest.mark.parametrize("model_id", ["HuggingFaceM4/Idefics3-8B-Llama3"])
-# yapf: disable
 @pytest.mark.parametrize(
     ("mm_processor_kwargs", "expected_toks_per_img"),
     [
@@ -20,7 +19,6 @@
         ({"size": {"longest_edge": 728}}, 169 * (2**2 + 1)),
     ],
 )
-# yapf: enable
 @pytest.mark.parametrize("num_imgs", [1, 2])
 @pytest.mark.parametrize("kwargs_on_init", [True, False])
 def test_processor_override(
diff --git a/tests/models/multimodal/processing/test_phi3v.py b/tests/models/multimodal/processing/test_phi3v.py
index 436f029f9f0e..8faff2611e6f 100644
--- a/tests/models/multimodal/processing/test_phi3v.py
+++ b/tests/models/multimodal/processing/test_phi3v.py
@@ -11,7 +11,6 @@
 
 
 @pytest.mark.parametrize("model_id", ["microsoft/Phi-3.5-vision-instruct"])
-# yapf: disable
 @pytest.mark.parametrize(
     ("mm_processor_kwargs", "expected_toks_per_img"),
     [
@@ -21,7 +20,6 @@
         ({}, 757),
     ],
 )
-# yapf: enable
 @pytest.mark.parametrize("num_imgs", [1, 2])
 @pytest.mark.parametrize("kwargs_on_init", [True, False])
 def test_processor_override(
diff --git a/tests/models/multimodal/processing/test_phi4mm.py b/tests/models/multimodal/processing/test_phi4mm.py
index b6759342ffdf..5391555c2667 100644
--- a/tests/models/multimodal/processing/test_phi4mm.py
+++ b/tests/models/multimodal/processing/test_phi4mm.py
@@ -11,7 +11,6 @@
 
 
 @pytest.mark.parametrize("model_id", ["microsoft/Phi-4-multimodal-instruct"])
-# yapf: disable
 @pytest.mark.parametrize(
     ("mm_processor_kwargs", "expected_toks_per_img"),
     [
@@ -21,7 +20,6 @@
         ({}, 9585),
     ],
 )
-# yapf: enable
 @pytest.mark.parametrize("num_imgs", [1, 2])
 @pytest.mark.parametrize("kwargs_on_init", [True, False])
 def test_processor_override(
diff --git a/tests/models/multimodal/processing/test_qwen2_vl.py b/tests/models/multimodal/processing/test_qwen2_vl.py
index eddcd329baba..9f4cdb6789b2 100644
--- a/tests/models/multimodal/processing/test_qwen2_vl.py
+++ b/tests/models/multimodal/processing/test_qwen2_vl.py
@@ -10,7 +10,6 @@
 
 
 @pytest.mark.parametrize("model_id", ["Qwen/Qwen2-VL-2B-Instruct"])
-# yapf: disable
 @pytest.mark.parametrize(
     ("mm_processor_kwargs", "expected_toks_per_img", "expected_pixels_shape"),
     [
@@ -18,7 +17,6 @@
         ({"min_pixels": 64**2, "max_pixels": 512**2}, 330, (1320, 1176)),
     ],
 )
-# yapf: enable
 @pytest.mark.parametrize("num_imgs", [1, 2])
 @pytest.mark.parametrize("kwargs_on_init", [True, False])
 def test_processor_override(
diff --git a/tests/models/multimodal/processing/test_smolvlm.py b/tests/models/multimodal/processing/test_smolvlm.py
index 20018513d067..6f77d5516d14 100644
--- a/tests/models/multimodal/processing/test_smolvlm.py
+++ b/tests/models/multimodal/processing/test_smolvlm.py
@@ -12,7 +12,6 @@
 
 
 @pytest.mark.parametrize("model_id", ["HuggingFaceTB/SmolVLM2-2.2B-Instruct"])
-# yapf: disable
 @pytest.mark.parametrize(
     ("mm_processor_kwargs", "expected_toks_per_img"),
     [
@@ -20,7 +19,6 @@
         ({"max_image_size": {"longest_edge": 768}}, 405),
     ],
 )
-# yapf: enable
 @pytest.mark.parametrize("num_imgs", [1, 2])
 @pytest.mark.parametrize("kwargs_on_init", [True, False])
 def test_processor_override(
diff --git a/tests/models/multimodal/processing/test_transformers.py b/tests/models/multimodal/processing/test_transformers.py
index c0e043ade736..e2a2186f470b 100644
--- a/tests/models/multimodal/processing/test_transformers.py
+++ b/tests/models/multimodal/processing/test_transformers.py
@@ -7,9 +7,7 @@
 from vllm.multimodal import MULTIMODAL_REGISTRY
 
 
-# yapf: disable
-@pytest.mark.parametrize("model_id",
-                         ["llava-hf/llava-onevision-qwen2-0.5b-ov-hf"])
+@pytest.mark.parametrize("model_id", ["llava-hf/llava-onevision-qwen2-0.5b-ov-hf"])
 def test_multimodal_processor(model_id):
     model_config = ModelConfig(
         model=model_id,
@@ -18,9 +16,9 @@ def test_multimodal_processor(model_id):
 
     mm_processor = MULTIMODAL_REGISTRY.create_processor(model_config)
 
-    image_pil = ImageAsset('cherry_blossom').pil_image
+    image_pil = ImageAsset("cherry_blossom").pil_image
     mm_data = {"image": image_pil}
-    str_prompt = "<|im_start|>user <image>\nWhat is the content of this image?<|im_end|><|im_start|>assistant\n" # noqa: E501
+    str_prompt = "<|im_start|>user <image>\nWhat is the content of this image?<|im_end|><|im_start|>assistant\n"  # noqa: E501
     str_processed_inputs = mm_processor.apply(
         prompt=str_prompt,
         mm_data=mm_data,
@@ -28,8 +26,23 @@ def test_multimodal_processor(model_id):
     )
 
     ids_prompt = [
-        151644, 872, 220, 151646, 198, 3838, 374, 279, 2213, 315, 419, 2168,
-        30, 151645, 151644, 77091, 198
+        151644,
+        872,
+        220,
+        151646,
+        198,
+        3838,
+        374,
+        279,
+        2213,
+        315,
+        419,
+        2168,
+        30,
+        151645,
+        151644,
+        77091,
+        198,
     ]
     ids_processed_inputs = mm_processor.apply(
         prompt=ids_prompt,
@@ -37,5 +50,7 @@ def test_multimodal_processor(model_id):
         hf_processor_mm_kwargs={},
     )
 
-    assert (str_processed_inputs["prompt_token_ids"]
-            == ids_processed_inputs["prompt_token_ids"])
+    assert (
+        str_processed_inputs["prompt_token_ids"]
+        == ids_processed_inputs["prompt_token_ids"]
+    )
diff --git a/tests/models/registry.py b/tests/models/registry.py
index 292c5c222d72..e1d9f1d1dd74 100644
--- a/tests/models/registry.py
+++ b/tests/models/registry.py
@@ -169,430 +169,625 @@ def check_available_online(
                 pytest.skip(msg)
 
 
-# yapf: disable
 _TEXT_GENERATION_EXAMPLE_MODELS = {
     # [Decoder-only]
-    "ApertusForCausalLM": _HfExamplesInfo("swiss-ai/Apertus-8B-2509",
-                                          min_transformers_version="4.56.0",
-                                          trust_remote_code=True),
-    "AquilaModel": _HfExamplesInfo("BAAI/AquilaChat-7B",
-                                   trust_remote_code=True),
-    "AquilaForCausalLM": _HfExamplesInfo("BAAI/AquilaChat2-7B",
-                                         trust_remote_code=True),
+    "ApertusForCausalLM": _HfExamplesInfo(
+        "swiss-ai/Apertus-8B-2509",
+        min_transformers_version="4.56.0",
+        trust_remote_code=True,
+    ),
+    "AquilaModel": _HfExamplesInfo("BAAI/AquilaChat-7B", trust_remote_code=True),
+    "AquilaForCausalLM": _HfExamplesInfo("BAAI/AquilaChat2-7B", trust_remote_code=True),
     "ArceeForCausalLM": _HfExamplesInfo("arcee-ai/AFM-4.5B-Base"),
-    "ArcticForCausalLM": _HfExamplesInfo("Snowflake/snowflake-arctic-instruct",
-                                         trust_remote_code=True),
-    "BaiChuanForCausalLM": _HfExamplesInfo("baichuan-inc/Baichuan-7B",
-                                         trust_remote_code=True),
-    "BaichuanForCausalLM": _HfExamplesInfo("baichuan-inc/Baichuan2-7B-chat",
-                                         trust_remote_code=True),
-    "BailingMoeForCausalLM": _HfExamplesInfo("inclusionAI/Ling-lite-1.5",
-                                         trust_remote_code=True),
-    "BailingMoeV2ForCausalLM": _HfExamplesInfo("inclusionAI/Ling-mini-2.0",
-                                         trust_remote_code=True),
-    "BambaForCausalLM": _HfExamplesInfo("ibm-ai-platform/Bamba-9B-v1",
-                                        min_transformers_version="4.55.3",
-                                        extras={"tiny": "hmellor/tiny-random-BambaForCausalLM"}),  # noqa: E501
-    "BloomForCausalLM": _HfExamplesInfo("bigscience/bloom-560m",
-                                        {"1b": "bigscience/bloomz-1b1"}),
-    "ChatGLMModel": _HfExamplesInfo("zai-org/chatglm3-6b",
-                                    trust_remote_code=True,
-                                    max_transformers_version="4.48"),
-    "ChatGLMForConditionalGeneration": _HfExamplesInfo("thu-coai/ShieldLM-6B-chatglm3",  # noqa: E501
-                                                       trust_remote_code=True),
-    "CohereForCausalLM": _HfExamplesInfo("CohereForAI/c4ai-command-r-v01",
-                                         trust_remote_code=True),
-    "Cohere2ForCausalLM": _HfExamplesInfo("CohereForAI/c4ai-command-r7b-12-2024", # noqa: E501
-                                         trust_remote_code=True),
-    "CwmForCausalLM": _HfExamplesInfo("facebook/cwm", # noqa: E501
-                                      trust_remote_code=True,
-                                      is_available_online=False),
+    "ArcticForCausalLM": _HfExamplesInfo(
+        "Snowflake/snowflake-arctic-instruct", trust_remote_code=True
+    ),
+    "BaiChuanForCausalLM": _HfExamplesInfo(
+        "baichuan-inc/Baichuan-7B", trust_remote_code=True
+    ),
+    "BaichuanForCausalLM": _HfExamplesInfo(
+        "baichuan-inc/Baichuan2-7B-chat", trust_remote_code=True
+    ),
+    "BailingMoeForCausalLM": _HfExamplesInfo(
+        "inclusionAI/Ling-lite-1.5", trust_remote_code=True
+    ),
+    "BailingMoeV2ForCausalLM": _HfExamplesInfo(
+        "inclusionAI/Ling-mini-2.0", trust_remote_code=True
+    ),
+    "BambaForCausalLM": _HfExamplesInfo(
+        "ibm-ai-platform/Bamba-9B-v1",
+        min_transformers_version="4.55.3",
+        extras={"tiny": "hmellor/tiny-random-BambaForCausalLM"},
+    ),
+    "BloomForCausalLM": _HfExamplesInfo(
+        "bigscience/bloom-560m", {"1b": "bigscience/bloomz-1b1"}
+    ),
+    "ChatGLMModel": _HfExamplesInfo(
+        "zai-org/chatglm3-6b", trust_remote_code=True, max_transformers_version="4.48"
+    ),
+    "ChatGLMForConditionalGeneration": _HfExamplesInfo(
+        "thu-coai/ShieldLM-6B-chatglm3",
+        trust_remote_code=True,
+    ),
+    "CohereForCausalLM": _HfExamplesInfo(
+        "CohereForAI/c4ai-command-r-v01", trust_remote_code=True
+    ),
+    "Cohere2ForCausalLM": _HfExamplesInfo(
+        "CohereForAI/c4ai-command-r7b-12-2024",
+        trust_remote_code=True,
+    ),
+    "CwmForCausalLM": _HfExamplesInfo(
+        "facebook/cwm",
+        trust_remote_code=True,
+        is_available_online=False,
+    ),
     "DbrxForCausalLM": _HfExamplesInfo("databricks/dbrx-instruct"),
-    "DeciLMForCausalLM": _HfExamplesInfo("nvidia/Llama-3_3-Nemotron-Super-49B-v1", # noqa: E501
-                                         trust_remote_code=True),
+    "DeciLMForCausalLM": _HfExamplesInfo(
+        "nvidia/Llama-3_3-Nemotron-Super-49B-v1",
+        trust_remote_code=True,
+    ),
     "DeepseekForCausalLM": _HfExamplesInfo("deepseek-ai/deepseek-llm-7b-chat"),
-    "DeepseekV2ForCausalLM": _HfExamplesInfo("deepseek-ai/DeepSeek-V2-Lite-Chat",  # noqa: E501
-                                         trust_remote_code=True),
-    "DeepseekV3ForCausalLM": _HfExamplesInfo("deepseek-ai/DeepSeek-V3",  # noqa: E501
-                                         trust_remote_code=True),
+    "DeepseekV2ForCausalLM": _HfExamplesInfo(
+        "deepseek-ai/DeepSeek-V2-Lite-Chat",
+        trust_remote_code=True,
+    ),
+    "DeepseekV3ForCausalLM": _HfExamplesInfo(
+        "deepseek-ai/DeepSeek-V3",
+        trust_remote_code=True,
+    ),
     "DeepseekV32ForCausalLM": _HfExamplesInfo("deepseek-ai/DeepSeek-V3.2-Exp"),
-    "Ernie4_5ForCausalLM": _HfExamplesInfo("baidu/ERNIE-4.5-0.3B-PT",
-                                            min_transformers_version="4.54"),
-    "Ernie4_5_MoeForCausalLM": _HfExamplesInfo("baidu/ERNIE-4.5-21B-A3B-PT",
-                                               min_transformers_version="4.54"),
-    "ExaoneForCausalLM": _HfExamplesInfo("LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct",
-                                         trust_remote_code=True),
-    "Exaone4ForCausalLM": _HfExamplesInfo("LGAI-EXAONE/EXAONE-4.0-32B",
-                                          min_transformers_version="4.54"),
-    "Fairseq2LlamaForCausalLM": _HfExamplesInfo("mgleize/fairseq2-dummy-Llama-3.2-1B"),  # noqa: E501
+    "Ernie4_5ForCausalLM": _HfExamplesInfo(
+        "baidu/ERNIE-4.5-0.3B-PT", min_transformers_version="4.54"
+    ),
+    "Ernie4_5_MoeForCausalLM": _HfExamplesInfo(
+        "baidu/ERNIE-4.5-21B-A3B-PT", min_transformers_version="4.54"
+    ),
+    "ExaoneForCausalLM": _HfExamplesInfo(
+        "LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct", trust_remote_code=True
+    ),
+    "Exaone4ForCausalLM": _HfExamplesInfo(
+        "LGAI-EXAONE/EXAONE-4.0-32B", min_transformers_version="4.54"
+    ),
+    "Fairseq2LlamaForCausalLM": _HfExamplesInfo("mgleize/fairseq2-dummy-Llama-3.2-1B"),
     "FalconForCausalLM": _HfExamplesInfo("tiiuae/falcon-7b"),
-    "FalconH1ForCausalLM":_HfExamplesInfo("tiiuae/Falcon-H1-0.5B-Base"),
+    "FalconH1ForCausalLM": _HfExamplesInfo("tiiuae/Falcon-H1-0.5B-Base"),
     "GemmaForCausalLM": _HfExamplesInfo("google/gemma-1.1-2b-it"),
     "Gemma2ForCausalLM": _HfExamplesInfo("google/gemma-2-9b"),
     "Gemma3ForCausalLM": _HfExamplesInfo("google/gemma-3-1b-it"),
-    "Gemma3nForCausalLM": _HfExamplesInfo("google/gemma-3n-E2B-it",
-                                          min_transformers_version="4.53"),
+    "Gemma3nForCausalLM": _HfExamplesInfo(
+        "google/gemma-3n-E2B-it", min_transformers_version="4.53"
+    ),
     "GlmForCausalLM": _HfExamplesInfo("zai-org/glm-4-9b-chat-hf"),
     "Glm4ForCausalLM": _HfExamplesInfo("zai-org/GLM-4-9B-0414"),
-    "Glm4MoeForCausalLM": _HfExamplesInfo("zai-org/GLM-4.5",
-                                          min_transformers_version="4.54"),   # noqa: E501
-    "GPT2LMHeadModel": _HfExamplesInfo("openai-community/gpt2",
-                                       {"alias": "gpt2"}),
-    "GPTBigCodeForCausalLM": _HfExamplesInfo("bigcode/starcoder",
-                                             extras={"tiny": "bigcode/tiny_starcoder_py"},  # noqa: E501
-                                             min_transformers_version="4.55.1",
-                                             transformers_version_reason="HF model broken in 4.55.0"),  # noqa: E501
-    "GPTJForCausalLM": _HfExamplesInfo("Milos/slovak-gpt-j-405M",
-                                       {"6b": "EleutherAI/gpt-j-6b"}),
-    "GPTNeoXForCausalLM": _HfExamplesInfo("EleutherAI/pythia-70m",
-                                          {"1b": "EleutherAI/pythia-1.4b"}),
+    "Glm4MoeForCausalLM": _HfExamplesInfo(
+        "zai-org/GLM-4.5", min_transformers_version="4.54"
+    ),
+    "GPT2LMHeadModel": _HfExamplesInfo("openai-community/gpt2", {"alias": "gpt2"}),
+    "GPTBigCodeForCausalLM": _HfExamplesInfo(
+        "bigcode/starcoder",
+        extras={"tiny": "bigcode/tiny_starcoder_py"},
+        min_transformers_version="4.55.1",
+        transformers_version_reason="HF model broken in 4.55.0",
+    ),
+    "GPTJForCausalLM": _HfExamplesInfo(
+        "Milos/slovak-gpt-j-405M", {"6b": "EleutherAI/gpt-j-6b"}
+    ),
+    "GPTNeoXForCausalLM": _HfExamplesInfo(
+        "EleutherAI/pythia-70m", {"1b": "EleutherAI/pythia-1.4b"}
+    ),
     "GptOssForCausalLM": _HfExamplesInfo("lmsys/gpt-oss-20b-bf16"),
     "GraniteForCausalLM": _HfExamplesInfo("ibm/PowerLM-3b"),
     "GraniteMoeForCausalLM": _HfExamplesInfo("ibm/PowerMoE-3b"),
-    "GraniteMoeHybridForCausalLM": _HfExamplesInfo("ibm-granite/granite-4.0-tiny-preview", # noqa: E501
-                                                   min_transformers_version="4.55.3"),
-    "GraniteMoeSharedForCausalLM": _HfExamplesInfo("ibm-research/moe-7b-1b-active-shared-experts"),  # noqa: E501
-    "Grok1ModelForCausalLM": _HfExamplesInfo("hpcai-tech/grok-1",
-                                             trust_remote_code=True),
-    "HunYuanMoEV1ForCausalLM": _HfExamplesInfo("tencent/Hunyuan-A13B-Instruct",
-                                               trust_remote_code=True),
+    "GraniteMoeHybridForCausalLM": _HfExamplesInfo(
+        "ibm-granite/granite-4.0-tiny-preview",
+        min_transformers_version="4.55.3",
+    ),
+    "GraniteMoeSharedForCausalLM": _HfExamplesInfo(
+        "ibm-research/moe-7b-1b-active-shared-experts"
+    ),
+    "Grok1ModelForCausalLM": _HfExamplesInfo(
+        "hpcai-tech/grok-1", trust_remote_code=True
+    ),
+    "HunYuanMoEV1ForCausalLM": _HfExamplesInfo(
+        "tencent/Hunyuan-A13B-Instruct", trust_remote_code=True
+    ),
     # TODO: Remove is_available_online once their config.json is fixed
-    "HunYuanDenseV1ForCausalLM":_HfExamplesInfo("tencent/Hunyuan-7B-Instruct-0124",
-                                                trust_remote_code=True,
-                                                is_available_online=False),
-    "InternLMForCausalLM": _HfExamplesInfo("internlm/internlm-chat-7b",
-                                           trust_remote_code=True),
-    "InternLM2ForCausalLM": _HfExamplesInfo("internlm/internlm2-chat-7b",
-                                            trust_remote_code=True),
-    "InternLM2VEForCausalLM": _HfExamplesInfo("OpenGVLab/Mono-InternVL-2B",
-                                              trust_remote_code=True),
-    "InternLM3ForCausalLM": _HfExamplesInfo("internlm/internlm3-8b-instruct",
-                                            trust_remote_code=True),
+    "HunYuanDenseV1ForCausalLM": _HfExamplesInfo(
+        "tencent/Hunyuan-7B-Instruct-0124",
+        trust_remote_code=True,
+        is_available_online=False,
+    ),
+    "InternLMForCausalLM": _HfExamplesInfo(
+        "internlm/internlm-chat-7b", trust_remote_code=True
+    ),
+    "InternLM2ForCausalLM": _HfExamplesInfo(
+        "internlm/internlm2-chat-7b", trust_remote_code=True
+    ),
+    "InternLM2VEForCausalLM": _HfExamplesInfo(
+        "OpenGVLab/Mono-InternVL-2B", trust_remote_code=True
+    ),
+    "InternLM3ForCausalLM": _HfExamplesInfo(
+        "internlm/internlm3-8b-instruct", trust_remote_code=True
+    ),
     "JAISLMHeadModel": _HfExamplesInfo("inceptionai/jais-13b-chat"),
-    "JambaForCausalLM": _HfExamplesInfo("ai21labs/AI21-Jamba-1.5-Mini",
-                                        min_transformers_version="4.55.3",
-                                        extras={
-                                            "tiny": "ai21labs/Jamba-tiny-dev",
-                                            "random": "ai21labs/Jamba-tiny-random",  # noqa: E501
-                                        }),
-    "Lfm2ForCausalLM": _HfExamplesInfo("LiquidAI/LFM2-1.2B",
-                                       min_transformers_version="4.54"),
-    "LlamaForCausalLM": _HfExamplesInfo("meta-llama/Llama-3.2-1B-Instruct",
-                                        extras={"guard": "meta-llama/Llama-Guard-3-1B",  # noqa: E501
-                                                "hermes": "NousResearch/Hermes-3-Llama-3.1-8B", # noqa: E501
-                                                "fp8": "RedHatAI/Meta-Llama-3.1-8B-Instruct-FP8"}),  # noqa: E501
-    "LLaMAForCausalLM": _HfExamplesInfo("decapoda-research/llama-7b-hf",
-                                        is_available_online=False),
-    "Llama4ForCausalLM": _HfExamplesInfo("meta-llama/Llama-4-Scout-17B-16E-Instruct", # noqa: E501
-                                         is_available_online=False),
-    "LongcatFlashForCausalLM": _HfExamplesInfo
-                ("meituan-longcat/LongCat-Flash-Chat", trust_remote_code=True),
+    "JambaForCausalLM": _HfExamplesInfo(
+        "ai21labs/AI21-Jamba-1.5-Mini",
+        min_transformers_version="4.55.3",
+        extras={
+            "tiny": "ai21labs/Jamba-tiny-dev",
+            "random": "ai21labs/Jamba-tiny-random",
+        },
+    ),
+    "Lfm2ForCausalLM": _HfExamplesInfo(
+        "LiquidAI/LFM2-1.2B", min_transformers_version="4.54"
+    ),
+    "LlamaForCausalLM": _HfExamplesInfo(
+        "meta-llama/Llama-3.2-1B-Instruct",
+        extras={
+            "guard": "meta-llama/Llama-Guard-3-1B",
+            "hermes": "NousResearch/Hermes-3-Llama-3.1-8B",
+            "fp8": "RedHatAI/Meta-Llama-3.1-8B-Instruct-FP8",
+        },
+    ),
+    "LLaMAForCausalLM": _HfExamplesInfo(
+        "decapoda-research/llama-7b-hf", is_available_online=False
+    ),
+    "Llama4ForCausalLM": _HfExamplesInfo(
+        "meta-llama/Llama-4-Scout-17B-16E-Instruct",
+        is_available_online=False,
+    ),
+    "LongcatFlashForCausalLM": _HfExamplesInfo(
+        "meituan-longcat/LongCat-Flash-Chat", trust_remote_code=True
+    ),
     "MambaForCausalLM": _HfExamplesInfo("state-spaces/mamba-130m-hf"),
-    "Mamba2ForCausalLM": _HfExamplesInfo("mistralai/Mamba-Codestral-7B-v0.1",
-                                         min_transformers_version="4.55.3",
-                                         extras={
-                                            "random": "yujiepan/mamba2-codestral-v0.1-tiny-random", # noqa: E501
-                                         }),
-    "FalconMambaForCausalLM": _HfExamplesInfo("tiiuae/falcon-mamba-7b-instruct"),  # noqa: E501
-    "MiniCPMForCausalLM": _HfExamplesInfo("openbmb/MiniCPM-2B-sft-bf16",
-                                         trust_remote_code=True),
-    "MiniCPM3ForCausalLM": _HfExamplesInfo("openbmb/MiniCPM3-4B",
-                                         trust_remote_code=True),
+    "Mamba2ForCausalLM": _HfExamplesInfo(
+        "mistralai/Mamba-Codestral-7B-v0.1",
+        min_transformers_version="4.55.3",
+        extras={
+            "random": "yujiepan/mamba2-codestral-v0.1-tiny-random",
+        },
+    ),
+    "FalconMambaForCausalLM": _HfExamplesInfo("tiiuae/falcon-mamba-7b-instruct"),
+    "MiniCPMForCausalLM": _HfExamplesInfo(
+        "openbmb/MiniCPM-2B-sft-bf16", trust_remote_code=True
+    ),
+    "MiniCPM3ForCausalLM": _HfExamplesInfo(
+        "openbmb/MiniCPM3-4B", trust_remote_code=True
+    ),
     "MiniMaxForCausalLM": _HfExamplesInfo("MiniMaxAI/MiniMax-Text-01-hf"),
-    "MiniMaxText01ForCausalLM": _HfExamplesInfo("MiniMaxAI/MiniMax-Text-01",
-                                                trust_remote_code=True,
-                                                revision="a59aa9cbc53b9fb8742ca4e9e1531b9802b6fdc3"),  # noqa: E501
-    "MiniMaxM1ForCausalLM": _HfExamplesInfo("MiniMaxAI/MiniMax-M1-40k",
-                                            trust_remote_code=True),
+    "MiniMaxText01ForCausalLM": _HfExamplesInfo(
+        "MiniMaxAI/MiniMax-Text-01",
+        trust_remote_code=True,
+        revision="a59aa9cbc53b9fb8742ca4e9e1531b9802b6fdc3",
+    ),
+    "MiniMaxM1ForCausalLM": _HfExamplesInfo(
+        "MiniMaxAI/MiniMax-M1-40k", trust_remote_code=True
+    ),
     "MistralForCausalLM": _HfExamplesInfo("mistralai/Mistral-7B-Instruct-v0.1"),
-    "MixtralForCausalLM": _HfExamplesInfo("mistralai/Mixtral-8x7B-Instruct-v0.1",  # noqa: E501
-                                          {"tiny": "TitanML/tiny-mixtral"}),  # noqa: E501
+    "MixtralForCausalLM": _HfExamplesInfo(
+        "mistralai/Mixtral-8x7B-Instruct-v0.1",
+        {"tiny": "TitanML/tiny-mixtral"},
+    ),
     "MptForCausalLM": _HfExamplesInfo("mpt", is_available_online=False),
     "MPTForCausalLM": _HfExamplesInfo("mosaicml/mpt-7b"),
     "NemotronForCausalLM": _HfExamplesInfo("nvidia/Minitron-8B-Base"),
-    "NemotronHForCausalLM": _HfExamplesInfo("nvidia/Nemotron-H-8B-Base-8K",
-                                            trust_remote_code=True),
+    "NemotronHForCausalLM": _HfExamplesInfo(
+        "nvidia/Nemotron-H-8B-Base-8K", trust_remote_code=True
+    ),
     "OlmoForCausalLM": _HfExamplesInfo("allenai/OLMo-1B-hf"),
     "Olmo2ForCausalLM": _HfExamplesInfo("allenai/OLMo-2-0425-1B"),
     "Olmo3ForCausalLM": _HfExamplesInfo("shanearora/2025-sep-a-base-model"),
     "OlmoeForCausalLM": _HfExamplesInfo("allenai/OLMoE-1B-7B-0924-Instruct"),
-    "OPTForCausalLM": _HfExamplesInfo("facebook/opt-125m",
-                                      {"1b": "facebook/opt-iml-max-1.3b"}),
-    "OrionForCausalLM": _HfExamplesInfo("OrionStarAI/Orion-14B-Chat",
-                                        trust_remote_code=True),
+    "OPTForCausalLM": _HfExamplesInfo(
+        "facebook/opt-125m", {"1b": "facebook/opt-iml-max-1.3b"}
+    ),
+    "OrionForCausalLM": _HfExamplesInfo(
+        "OrionStarAI/Orion-14B-Chat", trust_remote_code=True
+    ),
     "PersimmonForCausalLM": _HfExamplesInfo("adept/persimmon-8b-chat"),
     "PhiForCausalLM": _HfExamplesInfo("microsoft/phi-2"),
     "Phi3ForCausalLM": _HfExamplesInfo("microsoft/Phi-3-mini-4k-instruct"),
-    "PhiMoEForCausalLM": _HfExamplesInfo("microsoft/Phi-3.5-MoE-instruct",
-                                         trust_remote_code=True),
-    "Plamo2ForCausalLM": _HfExamplesInfo("pfnet/plamo-2-1b",
-                                         max_transformers_version="4.55.4",
-                                         transformers_version_reason="HF model uses remote code that is not compatible with latest Transformers",  # noqa: E501
-                                         trust_remote_code=True),
-    "QWenLMHeadModel": _HfExamplesInfo("Qwen/Qwen-7B-Chat",
-                                       max_transformers_version="4.53",
-                                       transformers_version_reason="HF model uses remote code that is not compatible with latest Transformers",  # noqa: E501
-                                       trust_remote_code=True),
-    "Qwen2ForCausalLM": _HfExamplesInfo("Qwen/Qwen2-0.5B-Instruct",
-                                        extras={"2.5": "Qwen/Qwen2.5-0.5B-Instruct"}), # noqa: E501
+    "PhiMoEForCausalLM": _HfExamplesInfo(
+        "microsoft/Phi-3.5-MoE-instruct", trust_remote_code=True
+    ),
+    "Plamo2ForCausalLM": _HfExamplesInfo(
+        "pfnet/plamo-2-1b",
+        max_transformers_version="4.55.4",
+        transformers_version_reason="HF model uses remote code that is not compatible with latest Transformers",  # noqa: E501
+        trust_remote_code=True,
+    ),
+    "QWenLMHeadModel": _HfExamplesInfo(
+        "Qwen/Qwen-7B-Chat",
+        max_transformers_version="4.53",
+        transformers_version_reason="HF model uses remote code that is not compatible with latest Transformers",  # noqa: E501
+        trust_remote_code=True,
+    ),
+    "Qwen2ForCausalLM": _HfExamplesInfo(
+        "Qwen/Qwen2-0.5B-Instruct", extras={"2.5": "Qwen/Qwen2.5-0.5B-Instruct"}
+    ),
     "Qwen2MoeForCausalLM": _HfExamplesInfo("Qwen/Qwen1.5-MoE-A2.7B-Chat"),
     "Qwen3ForCausalLM": _HfExamplesInfo("Qwen/Qwen3-8B"),
     "Qwen3MoeForCausalLM": _HfExamplesInfo("Qwen/Qwen3-30B-A3B"),
-    "Qwen3NextForCausalLM": _HfExamplesInfo("Qwen/Qwen3-Next-80B-A3B-Instruct",
-                                            extras={"tiny-random": "tiny-random/qwen3-next-moe"}, # noqa: E501
-                                            min_transformers_version="4.56.3"),
+    "Qwen3NextForCausalLM": _HfExamplesInfo(
+        "Qwen/Qwen3-Next-80B-A3B-Instruct",
+        extras={"tiny-random": "tiny-random/qwen3-next-moe"},
+        min_transformers_version="4.56.3",
+    ),
     "RWForCausalLM": _HfExamplesInfo("tiiuae/falcon-40b"),
-    "SeedOssForCausalLM": _HfExamplesInfo("ByteDance-Seed/Seed-OSS-36B-Instruct", # noqa: E501
-                                          trust_remote_code=True,
-                                          is_available_online=False),
+    "SeedOssForCausalLM": _HfExamplesInfo(
+        "ByteDance-Seed/Seed-OSS-36B-Instruct",
+        trust_remote_code=True,
+        is_available_online=False,
+    ),
     "SmolLM3ForCausalLM": _HfExamplesInfo("HuggingFaceTB/SmolLM3-3B"),
-    "StableLMEpochForCausalLM": _HfExamplesInfo("stabilityai/stablelm-zephyr-3b"),  # noqa: E501
+    "StableLMEpochForCausalLM": _HfExamplesInfo("stabilityai/stablelm-zephyr-3b"),
     "StableLmForCausalLM": _HfExamplesInfo("stabilityai/stablelm-3b-4e1t"),
     "Starcoder2ForCausalLM": _HfExamplesInfo("bigcode/starcoder2-3b"),
-    "Step3TextForCausalLM": _HfExamplesInfo("stepfun-ai/step3",
-                                            trust_remote_code=True),
-    "SolarForCausalLM": _HfExamplesInfo("upstage/solar-pro-preview-instruct",
-                                        trust_remote_code=True),
-    "TeleChat2ForCausalLM": _HfExamplesInfo("Tele-AI/TeleChat2-3B",
-                                            trust_remote_code=True),
-    "TeleFLMForCausalLM": _HfExamplesInfo("CofeAI/FLM-2-52B-Instruct-2407",
-                                            trust_remote_code=True),
-    "XverseForCausalLM": _HfExamplesInfo("xverse/XVERSE-7B-Chat",
-                                         tokenizer="meta-llama/Llama-2-7b",
-                                         trust_remote_code=True),
+    "Step3TextForCausalLM": _HfExamplesInfo("stepfun-ai/step3", trust_remote_code=True),
+    "SolarForCausalLM": _HfExamplesInfo(
+        "upstage/solar-pro-preview-instruct", trust_remote_code=True
+    ),
+    "TeleChat2ForCausalLM": _HfExamplesInfo(
+        "Tele-AI/TeleChat2-3B", trust_remote_code=True
+    ),
+    "TeleFLMForCausalLM": _HfExamplesInfo(
+        "CofeAI/FLM-2-52B-Instruct-2407", trust_remote_code=True
+    ),
+    "XverseForCausalLM": _HfExamplesInfo(
+        "xverse/XVERSE-7B-Chat",
+        tokenizer="meta-llama/Llama-2-7b",
+        trust_remote_code=True,
+    ),
     "Zamba2ForCausalLM": _HfExamplesInfo("Zyphra/Zamba2-7B-instruct"),
-    "MiMoForCausalLM": _HfExamplesInfo("XiaomiMiMo/MiMo-7B-RL",
-                                        trust_remote_code=True),
+    "MiMoForCausalLM": _HfExamplesInfo("XiaomiMiMo/MiMo-7B-RL", trust_remote_code=True),
     "Dots1ForCausalLM": _HfExamplesInfo("rednote-hilab/dots.llm1.inst"),
 }
 
 _EMBEDDING_EXAMPLE_MODELS = {
     # [Text-only]
     "BertModel": _HfExamplesInfo("BAAI/bge-base-en-v1.5"),
-    "Gemma2Model": _HfExamplesInfo("BAAI/bge-multilingual-gemma2"),  # noqa: E501
+    "Gemma2Model": _HfExamplesInfo("BAAI/bge-multilingual-gemma2"),
     "Gemma3TextModel": _HfExamplesInfo("google/embeddinggemma-300m"),
     "GritLM": _HfExamplesInfo("parasail-ai/GritLM-7B-vllm"),
-    "GteModel": _HfExamplesInfo("Snowflake/snowflake-arctic-embed-m-v2.0",
-                                               trust_remote_code=True),
-    "GteNewModel": _HfExamplesInfo("Alibaba-NLP/gte-base-en-v1.5",
-                                   trust_remote_code=True,
-                                   hf_overrides={"architectures": ["GteNewModel"]}),  # noqa: E501
-    "InternLM2ForRewardModel": _HfExamplesInfo("internlm/internlm2-1_8b-reward",
-                                               trust_remote_code=True),
-    "JambaForSequenceClassification": _HfExamplesInfo("ai21labs/Jamba-tiny-reward-dev"),  # noqa: E501
+    "GteModel": _HfExamplesInfo(
+        "Snowflake/snowflake-arctic-embed-m-v2.0", trust_remote_code=True
+    ),
+    "GteNewModel": _HfExamplesInfo(
+        "Alibaba-NLP/gte-base-en-v1.5",
+        trust_remote_code=True,
+        hf_overrides={"architectures": ["GteNewModel"]},
+    ),
+    "InternLM2ForRewardModel": _HfExamplesInfo(
+        "internlm/internlm2-1_8b-reward", trust_remote_code=True
+    ),
+    "JambaForSequenceClassification": _HfExamplesInfo("ai21labs/Jamba-tiny-reward-dev"),
     "LlamaModel": _HfExamplesInfo("llama", is_available_online=False),
     "MistralModel": _HfExamplesInfo("intfloat/e5-mistral-7b-instruct"),
-    "ModernBertModel": _HfExamplesInfo("Alibaba-NLP/gte-modernbert-base",
-                                trust_remote_code=True),
-    "NomicBertModel": _HfExamplesInfo("nomic-ai/nomic-embed-text-v2-moe",
-                                               trust_remote_code=True),  # noqa: E501
+    "ModernBertModel": _HfExamplesInfo(
+        "Alibaba-NLP/gte-modernbert-base", trust_remote_code=True
+    ),
+    "NomicBertModel": _HfExamplesInfo(
+        "nomic-ai/nomic-embed-text-v2-moe", trust_remote_code=True
+    ),
     "Qwen2Model": _HfExamplesInfo("ssmits/Qwen2-7B-Instruct-embed-base"),
-    "Qwen2ForRewardModel": _HfExamplesInfo("Qwen/Qwen2.5-Math-RM-72B",
-                                           max_transformers_version="4.53",
-                                           transformers_version_reason="HF model uses remote code that is not compatible with latest Transformers"),  # noqa: E501
-    "Qwen2ForProcessRewardModel": _HfExamplesInfo("Qwen/Qwen2.5-Math-PRM-7B",
-                                                  max_transformers_version="4.53",
-                                                  transformers_version_reason="HF model uses remote code that is not compatible with latest Transformers"),  # noqa: E501
-    "RobertaModel": _HfExamplesInfo("sentence-transformers/stsb-roberta-base-v2"),  # noqa: E501
-    "RobertaForMaskedLM": _HfExamplesInfo("sentence-transformers/all-roberta-large-v1"),  # noqa: E501
-    "XLMRobertaModel": _HfExamplesInfo("intfloat/multilingual-e5-small"),  # noqa: E501
+    "Qwen2ForRewardModel": _HfExamplesInfo(
+        "Qwen/Qwen2.5-Math-RM-72B",
+        max_transformers_version="4.53",
+        transformers_version_reason="HF model uses remote code that is not compatible with latest Transformers",  # noqa: E501
+    ),
+    "Qwen2ForProcessRewardModel": _HfExamplesInfo(
+        "Qwen/Qwen2.5-Math-PRM-7B",
+        max_transformers_version="4.53",
+        transformers_version_reason="HF model uses remote code that is not compatible with latest Transformers",  # noqa: E501
+    ),
+    "RobertaModel": _HfExamplesInfo("sentence-transformers/stsb-roberta-base-v2"),
+    "RobertaForMaskedLM": _HfExamplesInfo("sentence-transformers/all-roberta-large-v1"),
+    "XLMRobertaModel": _HfExamplesInfo("intfloat/multilingual-e5-small"),
     # [Multimodal]
     "CLIPModel": _HfExamplesInfo("openai/clip-vit-base-patch32"),
     "LlavaNextForConditionalGeneration": _HfExamplesInfo("royokong/e5-v"),
-    "Phi3VForCausalLM": _HfExamplesInfo("TIGER-Lab/VLM2Vec-Full",
-                                         trust_remote_code=True),
-    "Qwen2VLForConditionalGeneration": _HfExamplesInfo("MrLight/dse-qwen2-2b-mrl-v1"), # noqa: E501
-    "PrithviGeoSpatialMAE": _HfExamplesInfo("ibm-nasa-geospatial/Prithvi-EO-2.0-300M-TL-Sen1Floods11", # noqa: E501
-                                            dtype=torch.float16,
-                                            enforce_eager=True,
-                                            skip_tokenizer_init=True,
-                                            # This is to avoid the model
-                                            # going OOM in CI
-                                            max_num_seqs=32,
-                                            ),
-    "Terratorch": _HfExamplesInfo("ibm-nasa-geospatial/Prithvi-EO-2.0-300M-TL-Sen1Floods11", # noqa: E501
-                                  dtype=torch.float16,
-                                  enforce_eager=True,
-                                  skip_tokenizer_init=True,
-                                  # This is to avoid the model going OOM in CI
-                                  max_num_seqs=32,
-                                  ),
+    "Phi3VForCausalLM": _HfExamplesInfo(
+        "TIGER-Lab/VLM2Vec-Full", trust_remote_code=True
+    ),
+    "Qwen2VLForConditionalGeneration": _HfExamplesInfo("MrLight/dse-qwen2-2b-mrl-v1"),
+    "PrithviGeoSpatialMAE": _HfExamplesInfo(
+        "ibm-nasa-geospatial/Prithvi-EO-2.0-300M-TL-Sen1Floods11",
+        dtype=torch.float16,
+        enforce_eager=True,
+        skip_tokenizer_init=True,
+        # This is to avoid the model
+        # going OOM in CI
+        max_num_seqs=32,
+    ),
+    "Terratorch": _HfExamplesInfo(
+        "ibm-nasa-geospatial/Prithvi-EO-2.0-300M-TL-Sen1Floods11",
+        dtype=torch.float16,
+        enforce_eager=True,
+        skip_tokenizer_init=True,
+        # This is to avoid the model going OOM in CI
+        max_num_seqs=32,
+    ),
 }
 
 _SEQUENCE_CLASSIFICATION_EXAMPLE_MODELS = {
     # [Decoder-only]
-    "GPT2ForSequenceClassification": _HfExamplesInfo("nie3e/sentiment-polish-gpt2-small"),  # noqa: E501
-
+    "GPT2ForSequenceClassification": _HfExamplesInfo(
+        "nie3e/sentiment-polish-gpt2-small"
+    ),
     # [Cross-encoder]
-    "BertForSequenceClassification": _HfExamplesInfo("cross-encoder/ms-marco-MiniLM-L-6-v2"),  # noqa: E501
+    "BertForSequenceClassification": _HfExamplesInfo(
+        "cross-encoder/ms-marco-MiniLM-L-6-v2"
+    ),
     "BertForTokenClassification": _HfExamplesInfo("boltuix/NeuroBERT-NER"),
-    "GteNewForSequenceClassification": _HfExamplesInfo("Alibaba-NLP/gte-multilingual-reranker-base",  # noqa: E501
-                                                       trust_remote_code=True,
-                                                       hf_overrides={
-                                                           "architectures": ["GteNewForSequenceClassification"]}),# noqa: E501
-    "ModernBertForSequenceClassification": _HfExamplesInfo("Alibaba-NLP/gte-reranker-modernbert-base"), # noqa: E501
-    "RobertaForSequenceClassification": _HfExamplesInfo("cross-encoder/quora-roberta-base"),  # noqa: E501
-    "XLMRobertaForSequenceClassification": _HfExamplesInfo("BAAI/bge-reranker-v2-m3"),  # noqa: E501
+    "GteNewForSequenceClassification": _HfExamplesInfo(
+        "Alibaba-NLP/gte-multilingual-reranker-base",
+        trust_remote_code=True,
+        hf_overrides={"architectures": ["GteNewForSequenceClassification"]},
+    ),
+    "ModernBertForSequenceClassification": _HfExamplesInfo(
+        "Alibaba-NLP/gte-reranker-modernbert-base"
+    ),
+    "RobertaForSequenceClassification": _HfExamplesInfo(
+        "cross-encoder/quora-roberta-base"
+    ),
+    "XLMRobertaForSequenceClassification": _HfExamplesInfo("BAAI/bge-reranker-v2-m3"),
 }
 
 _AUTOMATIC_CONVERTED_MODELS = {
     # Use as_seq_cls_model for automatic conversion
-    "GemmaForSequenceClassification": _HfExamplesInfo("BAAI/bge-reranker-v2-gemma",  # noqa: E501
-                                                      hf_overrides={"architectures": ["GemmaForSequenceClassification"], # noqa: E501
-                                                                    "classifier_from_token": ["Yes"],  # noqa: E501
-                                                                    "method": "no_post_processing"}),  # noqa: E501
-    "LlamaForSequenceClassification": _HfExamplesInfo("Skywork/Skywork-Reward-V2-Llama-3.2-1B"),  # noqa: E501
-    "Qwen2ForSequenceClassification": _HfExamplesInfo("jason9693/Qwen2.5-1.5B-apeach"),  # noqa: E501
-    "Qwen3ForSequenceClassification": _HfExamplesInfo("tomaarsen/Qwen3-Reranker-0.6B-seq-cls"),  # noqa: E501
+    "GemmaForSequenceClassification": _HfExamplesInfo(
+        "BAAI/bge-reranker-v2-gemma",
+        hf_overrides={
+            "architectures": ["GemmaForSequenceClassification"],
+            "classifier_from_token": ["Yes"],
+            "method": "no_post_processing",
+        },
+    ),
+    "LlamaForSequenceClassification": _HfExamplesInfo(
+        "Skywork/Skywork-Reward-V2-Llama-3.2-1B"
+    ),
+    "Qwen2ForSequenceClassification": _HfExamplesInfo("jason9693/Qwen2.5-1.5B-apeach"),
+    "Qwen3ForSequenceClassification": _HfExamplesInfo(
+        "tomaarsen/Qwen3-Reranker-0.6B-seq-cls"
+    ),
 }
 
 _MULTIMODAL_EXAMPLE_MODELS = {
     # [Decoder-only]
     "AriaForConditionalGeneration": _HfExamplesInfo("rhymes-ai/Aria"),
-    "AyaVisionForConditionalGeneration": _HfExamplesInfo("CohereForAI/aya-vision-8b"), # noqa: E501
-    "Blip2ForConditionalGeneration": _HfExamplesInfo("Salesforce/blip2-opt-2.7b",  # noqa: E501
-                                                     extras={"6b": "Salesforce/blip2-opt-6.7b"}),  # noqa: E501
-    "ChameleonForConditionalGeneration": _HfExamplesInfo("facebook/chameleon-7b"),  # noqa: E501
-    "Cohere2VisionForConditionalGeneration": _HfExamplesInfo("CohereLabs/command-a-vision-07-2025"), # noqa: E501
-    "DeepseekVLV2ForCausalLM": _HfExamplesInfo("deepseek-ai/deepseek-vl2-tiny",  # noqa: E501
-                                                extras={"fork": "Isotr0py/deepseek-vl2-tiny"},  # noqa: E501
-                                                max_transformers_version="4.48",  # noqa: E501
-                                                transformers_version_reason="HF model is not compatible.",  # noqa: E501
-                                                hf_overrides={"architectures": ["DeepseekVLV2ForCausalLM"]}),  # noqa: E501
-    "DotsOCRForCausalLM": _HfExamplesInfo("rednote-hilab/dots.ocr",
-                                          trust_remote_code=True),
+    "AyaVisionForConditionalGeneration": _HfExamplesInfo("CohereForAI/aya-vision-8b"),
+    "Blip2ForConditionalGeneration": _HfExamplesInfo(
+        "Salesforce/blip2-opt-2.7b",
+        extras={"6b": "Salesforce/blip2-opt-6.7b"},
+    ),
+    "ChameleonForConditionalGeneration": _HfExamplesInfo("facebook/chameleon-7b"),
+    "Cohere2VisionForConditionalGeneration": _HfExamplesInfo(
+        "CohereLabs/command-a-vision-07-2025"
+    ),
+    "DeepseekVLV2ForCausalLM": _HfExamplesInfo(
+        "deepseek-ai/deepseek-vl2-tiny",
+        extras={"fork": "Isotr0py/deepseek-vl2-tiny"},
+        max_transformers_version="4.48",
+        transformers_version_reason="HF model is not compatible.",
+        hf_overrides={"architectures": ["DeepseekVLV2ForCausalLM"]},
+    ),
+    "DotsOCRForCausalLM": _HfExamplesInfo(
+        "rednote-hilab/dots.ocr", trust_remote_code=True
+    ),
     "Emu3ForConditionalGeneration": _HfExamplesInfo("BAAI/Emu3-Chat-hf"),
-    "Ernie4_5_VLMoeForConditionalGeneration": _HfExamplesInfo("baidu/ERNIE-4.5-VL-28B-A3B-PT",  # noqa: E501
-                                                              trust_remote_code=True),
+    "Ernie4_5_VLMoeForConditionalGeneration": _HfExamplesInfo(
+        "baidu/ERNIE-4.5-VL-28B-A3B-PT",
+        trust_remote_code=True,
+    ),
     "FuyuForCausalLM": _HfExamplesInfo("adept/fuyu-8b"),
     "Gemma3ForConditionalGeneration": _HfExamplesInfo("google/gemma-3-4b-it"),
-    "Gemma3nForConditionalGeneration": _HfExamplesInfo("google/gemma-3n-E2B-it",    # noqa: E501
-                                        min_transformers_version="4.53"),
-    "GraniteSpeechForConditionalGeneration": _HfExamplesInfo("ibm-granite/granite-speech-3.3-2b"),  # noqa: E501
-    "GLM4VForCausalLM": _HfExamplesInfo("zai-org/glm-4v-9b",
-                                        trust_remote_code=True,
-                                        hf_overrides={"architectures": ["GLM4VForCausalLM"]}),  # noqa: E501
-    "Glm4vForConditionalGeneration": _HfExamplesInfo("zai-org/GLM-4.1V-9B-Thinking"),  # noqa: E501
-    "Glm4vMoeForConditionalGeneration": _HfExamplesInfo("zai-org/GLM-4.5V",
-                                                        min_transformers_version="4.56"),  # noqa: E501
-    "H2OVLChatModel": _HfExamplesInfo("h2oai/h2ovl-mississippi-800m",
-                                      trust_remote_code=True,
-                                      extras={"2b": "h2oai/h2ovl-mississippi-2b"},  # noqa: E501
-                                      max_transformers_version="4.48",  # noqa: E501
-                                      transformers_version_reason="HF model is not compatible."),  # noqa: E501
-    "HCXVisionForCausalLM": _HfExamplesInfo("naver-hyperclovax/HyperCLOVAX-SEED-Vision-Instruct-3B",  # noqa: E501
-                                            trust_remote_code=True),
-    "Idefics3ForConditionalGeneration": _HfExamplesInfo("HuggingFaceM4/Idefics3-8B-Llama3",  # noqa: E501
-                                                        {"tiny": "HuggingFaceTB/SmolVLM-256M-Instruct"},    # noqa: E501
-                                                        min_transformers_version="4.56",
-                                                        transformers_version_reason="HF model broken in 4.55"),  # noqa: E501
-    "InternS1ForConditionalGeneration": _HfExamplesInfo("internlm/Intern-S1",
-                                                        trust_remote_code=True),  # noqa: E501
-    "InternVLChatModel": _HfExamplesInfo("OpenGVLab/InternVL2-1B",
-                                         extras={"2B": "OpenGVLab/InternVL2-2B",
-                                                 "3.0": "OpenGVLab/InternVL3-1B",   # noqa: E501
-                                                 "3.5-qwen3": "OpenGVLab/InternVL3_5-1B",   # noqa: E501
-                                                 "3.5-qwen3moe": "OpenGVLab/InternVL3_5-30B-A3B",   # noqa: E501
-                                                 "3.5-gptoss": "OpenGVLab/InternVL3_5-GPT-OSS-20B-A4B-Preview"},  # noqa: E501
-                                         trust_remote_code=True),
-    "InternVLForConditionalGeneration": _HfExamplesInfo("OpenGVLab/InternVL3-1B-hf"),    # noqa: E501
-    "KeyeForConditionalGeneration": _HfExamplesInfo("Kwai-Keye/Keye-VL-8B-Preview", # noqa: E501
-                                                    trust_remote_code=True),
-    "KeyeVL1_5ForConditionalGeneration": _HfExamplesInfo("Kwai-Keye/Keye-VL-1_5-8B", # noqa: E501
-                                                         trust_remote_code=True),
-    "KimiVLForConditionalGeneration": _HfExamplesInfo("moonshotai/Kimi-VL-A3B-Instruct",  # noqa: E501
-                                                      extras={"thinking": "moonshotai/Kimi-VL-A3B-Thinking"},  # noqa: E501
-                                                      trust_remote_code=True),
-    "Llama4ForConditionalGeneration": _HfExamplesInfo("meta-llama/Llama-4-Scout-17B-16E-Instruct",   # noqa: E501
-                                                      max_model_len=10240,
-                                                      extras={"llama-guard-4": "meta-llama/Llama-Guard-4-12B"},  # noqa: E501
-                                                      ),
-    "LlavaForConditionalGeneration": _HfExamplesInfo("llava-hf/llava-1.5-7b-hf",
-                                                     extras={"mistral": "mistral-community/pixtral-12b", # noqa: E501
-                                                             "mistral-fp8": "nm-testing/pixtral-12b-FP8-dynamic"}),  # noqa: E501
-    "LlavaNextForConditionalGeneration": _HfExamplesInfo("llava-hf/llava-v1.6-mistral-7b-hf"),  # noqa: E501
-    "LlavaNextVideoForConditionalGeneration": _HfExamplesInfo("llava-hf/LLaVA-NeXT-Video-7B-hf"),  # noqa: E501
-    "LlavaOnevisionForConditionalGeneration": _HfExamplesInfo("llava-hf/llava-onevision-qwen2-0.5b-ov-hf"),  # noqa: E501
-    "MantisForConditionalGeneration": _HfExamplesInfo("TIGER-Lab/Mantis-8B-siglip-llama3",  # noqa: E501
-                                                      max_transformers_version="4.48",  # noqa: E501
-                                                      transformers_version_reason="HF model is not compatible.",  # noqa: E501
-                                                      hf_overrides={"architectures": ["MantisForConditionalGeneration"]}),  # noqa: E501
-    "MiDashengLMModel": _HfExamplesInfo("mispeech/midashenglm-7b",
-                            trust_remote_code=True),
-    "MiniCPMO": _HfExamplesInfo("openbmb/MiniCPM-o-2_6",
-                                trust_remote_code=True),
-    "MiniCPMV": _HfExamplesInfo("openbmb/MiniCPM-Llama3-V-2_5",
-                                extras={"2.6": "openbmb/MiniCPM-V-2_6", "4.0": "openbmb/MiniCPM-V-4", "4.5": "openbmb/MiniCPM-V-4_5"},  # noqa: E501
-                                trust_remote_code=True),
-    "MiniMaxVL01ForConditionalGeneration": _HfExamplesInfo("MiniMaxAI/MiniMax-VL-01", # noqa: E501
-                                              trust_remote_code=True,
-                                              v0_only=True),
-    "Mistral3ForConditionalGeneration": _HfExamplesInfo("mistralai/Mistral-Small-3.1-24B-Instruct-2503",  # noqa: E501
-                                                        extras={"fp8": "nm-testing/Mistral-Small-3.1-24B-Instruct-2503-FP8-dynamic"}),  # noqa: E501
-    "MolmoForCausalLM": _HfExamplesInfo("allenai/Molmo-7B-D-0924",
-                                        max_transformers_version="4.48",
-                                        transformers_version_reason="Incorrectly-detected `tensorflow` import.",  # noqa: E501
-                                        extras={"olmo": "allenai/Molmo-7B-O-0924"},  # noqa: E501
-                                        trust_remote_code=True),
-    "NVLM_D": _HfExamplesInfo("nvidia/NVLM-D-72B",
-                              trust_remote_code=True),
-    "Llama_Nemotron_Nano_VL" : _HfExamplesInfo("nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1", # noqa: E501
-                                                     trust_remote_code=True),
-    "NemotronH_Nano_VL_V2": _HfExamplesInfo("nano_vl_dummy",
-                                          is_available_online=False,
-                                          trust_remote_code=True),
-    "Ovis": _HfExamplesInfo("AIDC-AI/Ovis2-1B", trust_remote_code=True,
-                            max_transformers_version="4.53",
-                            transformers_version_reason="HF model is not compatible",  # noqa: E501
-                            extras={"1.6-llama": "AIDC-AI/Ovis1.6-Llama3.2-3B",
-                                    "1.6-gemma": "AIDC-AI/Ovis1.6-Gemma2-9B"}),  # noqa: E501
-    "Ovis2_5": _HfExamplesInfo("AIDC-AI/Ovis2.5-2B",
-                               trust_remote_code=True),
-    "PaliGemmaForConditionalGeneration": _HfExamplesInfo("google/paligemma-3b-mix-224",  # noqa: E501
-                                                         extras={"v2": "google/paligemma2-3b-ft-docci-448"}),  # noqa: E501
-    "Phi3VForCausalLM": _HfExamplesInfo("microsoft/Phi-3-vision-128k-instruct",
-                                        trust_remote_code=True,
-                                        max_transformers_version="4.48",
-                                        transformers_version_reason="Use of deprecated imports which have been removed.",  # noqa: E501
-                                        extras={"phi3.5": "microsoft/Phi-3.5-vision-instruct"}),  # noqa: E501
-    "Phi4MMForCausalLM": _HfExamplesInfo("microsoft/Phi-4-multimodal-instruct",
-                                        trust_remote_code=True),
-    "Phi4MultimodalForCausalLM": _HfExamplesInfo("microsoft/Phi-4-multimodal-instruct",  # noqa: E501
-                                                 revision="refs/pr/70"),
-    "PixtralForConditionalGeneration": _HfExamplesInfo("mistralai/Pixtral-12B-2409",  # noqa: E501
-                                                       tokenizer_mode="mistral"),
-    "QwenVLForConditionalGeneration": _HfExamplesInfo("Qwen/Qwen-VL",
-                                                      extras={"chat": "Qwen/Qwen-VL-Chat"},  # noqa: E501
-                                                      trust_remote_code=True,
-                                                      hf_overrides={"architectures": ["QwenVLForConditionalGeneration"]}),  # noqa: E501
-    "Qwen2AudioForConditionalGeneration": _HfExamplesInfo("Qwen/Qwen2-Audio-7B-Instruct"),  # noqa: E501
-    "Qwen2VLForConditionalGeneration": _HfExamplesInfo("Qwen/Qwen2-VL-2B-Instruct"),  # noqa: E501
-    "Qwen2_5_VLForConditionalGeneration": _HfExamplesInfo("Qwen/Qwen2.5-VL-3B-Instruct", # noqa: E501
-                                                          max_model_len=4096),
+    "Gemma3nForConditionalGeneration": _HfExamplesInfo(
+        "google/gemma-3n-E2B-it",
+        min_transformers_version="4.53",
+    ),
+    "GraniteSpeechForConditionalGeneration": _HfExamplesInfo(
+        "ibm-granite/granite-speech-3.3-2b"
+    ),
+    "GLM4VForCausalLM": _HfExamplesInfo(
+        "zai-org/glm-4v-9b",
+        trust_remote_code=True,
+        hf_overrides={"architectures": ["GLM4VForCausalLM"]},
+    ),
+    "Glm4vForConditionalGeneration": _HfExamplesInfo("zai-org/GLM-4.1V-9B-Thinking"),
+    "Glm4vMoeForConditionalGeneration": _HfExamplesInfo(
+        "zai-org/GLM-4.5V", min_transformers_version="4.56"
+    ),
+    "H2OVLChatModel": _HfExamplesInfo(
+        "h2oai/h2ovl-mississippi-800m",
+        trust_remote_code=True,
+        extras={"2b": "h2oai/h2ovl-mississippi-2b"},
+        max_transformers_version="4.48",
+        transformers_version_reason="HF model is not compatible.",
+    ),
+    "HCXVisionForCausalLM": _HfExamplesInfo(
+        "naver-hyperclovax/HyperCLOVAX-SEED-Vision-Instruct-3B",
+        trust_remote_code=True,
+    ),
+    "Idefics3ForConditionalGeneration": _HfExamplesInfo(
+        "HuggingFaceM4/Idefics3-8B-Llama3",
+        {"tiny": "HuggingFaceTB/SmolVLM-256M-Instruct"},
+        min_transformers_version="4.56",
+        transformers_version_reason="HF model broken in 4.55",
+    ),
+    "InternS1ForConditionalGeneration": _HfExamplesInfo(
+        "internlm/Intern-S1", trust_remote_code=True
+    ),
+    "InternVLChatModel": _HfExamplesInfo(
+        "OpenGVLab/InternVL2-1B",
+        extras={
+            "2B": "OpenGVLab/InternVL2-2B",
+            "3.0": "OpenGVLab/InternVL3-1B",
+            "3.5-qwen3": "OpenGVLab/InternVL3_5-1B",
+            "3.5-qwen3moe": "OpenGVLab/InternVL3_5-30B-A3B",
+            "3.5-gptoss": "OpenGVLab/InternVL3_5-GPT-OSS-20B-A4B-Preview",
+        },
+        trust_remote_code=True,
+    ),
+    "InternVLForConditionalGeneration": _HfExamplesInfo("OpenGVLab/InternVL3-1B-hf"),
+    "KeyeForConditionalGeneration": _HfExamplesInfo(
+        "Kwai-Keye/Keye-VL-8B-Preview",
+        trust_remote_code=True,
+    ),
+    "KeyeVL1_5ForConditionalGeneration": _HfExamplesInfo(
+        "Kwai-Keye/Keye-VL-1_5-8B",
+        trust_remote_code=True,
+    ),
+    "KimiVLForConditionalGeneration": _HfExamplesInfo(
+        "moonshotai/Kimi-VL-A3B-Instruct",
+        extras={"thinking": "moonshotai/Kimi-VL-A3B-Thinking"},
+        trust_remote_code=True,
+    ),
+    "Llama4ForConditionalGeneration": _HfExamplesInfo(
+        "meta-llama/Llama-4-Scout-17B-16E-Instruct",
+        max_model_len=10240,
+        extras={"llama-guard-4": "meta-llama/Llama-Guard-4-12B"},
+    ),
+    "LlavaForConditionalGeneration": _HfExamplesInfo(
+        "llava-hf/llava-1.5-7b-hf",
+        extras={
+            "mistral": "mistral-community/pixtral-12b",
+            "mistral-fp8": "nm-testing/pixtral-12b-FP8-dynamic",
+        },
+    ),
+    "LlavaNextForConditionalGeneration": _HfExamplesInfo(
+        "llava-hf/llava-v1.6-mistral-7b-hf"
+    ),
+    "LlavaNextVideoForConditionalGeneration": _HfExamplesInfo(
+        "llava-hf/LLaVA-NeXT-Video-7B-hf"
+    ),
+    "LlavaOnevisionForConditionalGeneration": _HfExamplesInfo(
+        "llava-hf/llava-onevision-qwen2-0.5b-ov-hf"
+    ),
+    "MantisForConditionalGeneration": _HfExamplesInfo(
+        "TIGER-Lab/Mantis-8B-siglip-llama3",
+        max_transformers_version="4.48",
+        transformers_version_reason="HF model is not compatible.",
+        hf_overrides={"architectures": ["MantisForConditionalGeneration"]},
+    ),
+    "MiDashengLMModel": _HfExamplesInfo(
+        "mispeech/midashenglm-7b", trust_remote_code=True
+    ),
+    "MiniCPMO": _HfExamplesInfo("openbmb/MiniCPM-o-2_6", trust_remote_code=True),
+    "MiniCPMV": _HfExamplesInfo(
+        "openbmb/MiniCPM-Llama3-V-2_5",
+        extras={
+            "2.6": "openbmb/MiniCPM-V-2_6",
+            "4.0": "openbmb/MiniCPM-V-4",
+            "4.5": "openbmb/MiniCPM-V-4_5",
+        },
+        trust_remote_code=True,
+    ),
+    "MiniMaxVL01ForConditionalGeneration": _HfExamplesInfo(
+        "MiniMaxAI/MiniMax-VL-01",
+        trust_remote_code=True,
+        v0_only=True,
+    ),
+    "Mistral3ForConditionalGeneration": _HfExamplesInfo(
+        "mistralai/Mistral-Small-3.1-24B-Instruct-2503",
+        extras={"fp8": "nm-testing/Mistral-Small-3.1-24B-Instruct-2503-FP8-dynamic"},
+    ),
+    "MolmoForCausalLM": _HfExamplesInfo(
+        "allenai/Molmo-7B-D-0924",
+        max_transformers_version="4.48",
+        transformers_version_reason="Incorrectly-detected `tensorflow` import.",
+        extras={"olmo": "allenai/Molmo-7B-O-0924"},
+        trust_remote_code=True,
+    ),
+    "NVLM_D": _HfExamplesInfo("nvidia/NVLM-D-72B", trust_remote_code=True),
+    "Llama_Nemotron_Nano_VL": _HfExamplesInfo(
+        "nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1",
+        trust_remote_code=True,
+    ),
+    "NemotronH_Nano_VL_V2": _HfExamplesInfo(
+        "nano_vl_dummy", is_available_online=False, trust_remote_code=True
+    ),
+    "Ovis": _HfExamplesInfo(
+        "AIDC-AI/Ovis2-1B",
+        trust_remote_code=True,
+        max_transformers_version="4.53",
+        transformers_version_reason="HF model is not compatible",
+        extras={
+            "1.6-llama": "AIDC-AI/Ovis1.6-Llama3.2-3B",
+            "1.6-gemma": "AIDC-AI/Ovis1.6-Gemma2-9B",
+        },
+    ),
+    "Ovis2_5": _HfExamplesInfo("AIDC-AI/Ovis2.5-2B", trust_remote_code=True),
+    "PaliGemmaForConditionalGeneration": _HfExamplesInfo(
+        "google/paligemma-3b-mix-224",
+        extras={"v2": "google/paligemma2-3b-ft-docci-448"},
+    ),
+    "Phi3VForCausalLM": _HfExamplesInfo(
+        "microsoft/Phi-3-vision-128k-instruct",
+        trust_remote_code=True,
+        max_transformers_version="4.48",
+        transformers_version_reason="Use of deprecated imports which have been removed.",  # noqa: E501
+        extras={"phi3.5": "microsoft/Phi-3.5-vision-instruct"},
+    ),
+    "Phi4MMForCausalLM": _HfExamplesInfo(
+        "microsoft/Phi-4-multimodal-instruct", trust_remote_code=True
+    ),
+    "Phi4MultimodalForCausalLM": _HfExamplesInfo(
+        "microsoft/Phi-4-multimodal-instruct",
+        revision="refs/pr/70",
+    ),
+    "PixtralForConditionalGeneration": _HfExamplesInfo(
+        "mistralai/Pixtral-12B-2409",
+        tokenizer_mode="mistral",
+    ),
+    "QwenVLForConditionalGeneration": _HfExamplesInfo(
+        "Qwen/Qwen-VL",
+        extras={"chat": "Qwen/Qwen-VL-Chat"},
+        trust_remote_code=True,
+        hf_overrides={"architectures": ["QwenVLForConditionalGeneration"]},
+    ),
+    "Qwen2AudioForConditionalGeneration": _HfExamplesInfo(
+        "Qwen/Qwen2-Audio-7B-Instruct"
+    ),
+    "Qwen2VLForConditionalGeneration": _HfExamplesInfo("Qwen/Qwen2-VL-2B-Instruct"),
+    "Qwen2_5_VLForConditionalGeneration": _HfExamplesInfo(
+        "Qwen/Qwen2.5-VL-3B-Instruct",
+        max_model_len=4096,
+    ),
     "Qwen2_5OmniModel": _HfExamplesInfo("Qwen/Qwen2.5-Omni-3B"),
-    "Qwen2_5OmniForConditionalGeneration": _HfExamplesInfo("Qwen/Qwen2.5-Omni-7B-AWQ"),  # noqa: E501
-    "Qwen3VLForConditionalGeneration": _HfExamplesInfo("Qwen/Qwen3-VL-4B-Instruct", # noqa: E501
-                                                        max_model_len=4096,
-                                                        min_transformers_version="4.57",
-                                                        is_available_online=False),
-    "Qwen3VLMoeForConditionalGeneration": _HfExamplesInfo("Qwen/Qwen3-VL-30B-A3B-Instruct", # noqa: E501
-                                                          max_model_len=4096,
-                                                          min_transformers_version="4.57",
-                                                          is_available_online=False),
-    "RForConditionalGeneration": _HfExamplesInfo("YannQi/R-4B",
-                                                 trust_remote_code=True),
-    "SkyworkR1VChatModel": _HfExamplesInfo("Skywork/Skywork-R1V-38B",
-                                           trust_remote_code=True),
-    "SmolVLMForConditionalGeneration": _HfExamplesInfo("HuggingFaceTB/SmolVLM2-2.2B-Instruct",  # noqa: E501
-                                                       min_transformers_version="4.56",
-                                                       transformers_version_reason="HF model broken in 4.55"),  # noqa: E501
-    "Step3VLForConditionalGeneration": _HfExamplesInfo("stepfun-ai/step3",
-                                                        trust_remote_code=True),
-    "UltravoxModel": _HfExamplesInfo("fixie-ai/ultravox-v0_5-llama-3_2-1b",  # noqa: E501
-                                     trust_remote_code=True),
-    "TarsierForConditionalGeneration": _HfExamplesInfo("omni-research/Tarsier-7b"),  # noqa: E501
-    "Tarsier2ForConditionalGeneration": _HfExamplesInfo("omni-research/Tarsier2-Recap-7b",  # noqa: E501
-                                                        hf_overrides={"architectures": ["Tarsier2ForConditionalGeneration"]}),  # noqa: E501
+    "Qwen2_5OmniForConditionalGeneration": _HfExamplesInfo("Qwen/Qwen2.5-Omni-7B-AWQ"),
+    "Qwen3VLForConditionalGeneration": _HfExamplesInfo(
+        "Qwen/Qwen3-VL-4B-Instruct",
+        max_model_len=4096,
+        min_transformers_version="4.57",
+        is_available_online=False,
+    ),
+    "Qwen3VLMoeForConditionalGeneration": _HfExamplesInfo(
+        "Qwen/Qwen3-VL-30B-A3B-Instruct",
+        max_model_len=4096,
+        min_transformers_version="4.57",
+        is_available_online=False,
+    ),
+    "RForConditionalGeneration": _HfExamplesInfo("YannQi/R-4B", trust_remote_code=True),
+    "SkyworkR1VChatModel": _HfExamplesInfo(
+        "Skywork/Skywork-R1V-38B", trust_remote_code=True
+    ),
+    "SmolVLMForConditionalGeneration": _HfExamplesInfo(
+        "HuggingFaceTB/SmolVLM2-2.2B-Instruct",
+        min_transformers_version="4.56",
+        transformers_version_reason="HF model broken in 4.55",
+    ),
+    "Step3VLForConditionalGeneration": _HfExamplesInfo(
+        "stepfun-ai/step3", trust_remote_code=True
+    ),
+    "UltravoxModel": _HfExamplesInfo(
+        "fixie-ai/ultravox-v0_5-llama-3_2-1b",
+        trust_remote_code=True,
+    ),
+    "TarsierForConditionalGeneration": _HfExamplesInfo("omni-research/Tarsier-7b"),
+    "Tarsier2ForConditionalGeneration": _HfExamplesInfo(
+        "omni-research/Tarsier2-Recap-7b",
+        hf_overrides={"architectures": ["Tarsier2ForConditionalGeneration"]},
+    ),
     "VoxtralForConditionalGeneration": _HfExamplesInfo(
         "mistralai/Voxtral-Mini-3B-2507",
         min_transformers_version="4.54",
@@ -600,80 +795,120 @@ def check_available_online(
         is_available_online=False,
     ),
     # [Encoder-decoder]
-    "WhisperForConditionalGeneration": _HfExamplesInfo("openai/whisper-large-v3"),  # noqa: E501
+    "WhisperForConditionalGeneration": _HfExamplesInfo("openai/whisper-large-v3"),
     # [Cross-encoder]
-    "JinaVLForRanking": _HfExamplesInfo("jinaai/jina-reranker-m0"),   # noqa: E501
+    "JinaVLForRanking": _HfExamplesInfo("jinaai/jina-reranker-m0"),
 }
 
 
 _SPECULATIVE_DECODING_EXAMPLE_MODELS = {
-    "MedusaModel": _HfExamplesInfo("JackFram/llama-68m",
-                                   speculative_model="abhigoyal/vllm-medusa-llama-68m-random"),  # noqa: E501
+    "MedusaModel": _HfExamplesInfo(
+        "JackFram/llama-68m", speculative_model="abhigoyal/vllm-medusa-llama-68m-random"
+    ),
     # Temporarily disabled.
     # TODO(woosuk): Re-enable this once the MLP Speculator is supported in V1.
-    # "MLPSpeculatorPreTrainedModel": _HfExamplesInfo("JackFram/llama-160m",
-    #                                                 speculative_model="ibm-ai-platform/llama-160m-accelerator"),  # noqa: E501
-    "DeepSeekMTPModel": _HfExamplesInfo("luccafong/deepseek_mtp_main_random",
-                                        speculative_model="luccafong/deepseek_mtp_draft_random",  # noqa: E501
-                                        trust_remote_code=True),
-    "EagleDeepSeekMTPModel": _HfExamplesInfo("eagle618/deepseek-v3-random",
-                                        speculative_model="eagle618/eagle-deepseek-v3-random",  # noqa: E501
-                                        trust_remote_code=True),
-    "EagleLlamaForCausalLM": _HfExamplesInfo("meta-llama/Meta-Llama-3-8B-Instruct", # noqa: E501
-                                             trust_remote_code=True,
-                                             speculative_model="yuhuili/EAGLE-LLaMA3-Instruct-8B",
-                                             tokenizer="meta-llama/Meta-Llama-3-8B-Instruct"), # noqa: E501
-    "Eagle3LlamaForCausalLM": _HfExamplesInfo("meta-llama/Llama-3.1-8B-Instruct",  # noqa: E501
-                                            trust_remote_code=True,
-                                            speculative_model="yuhuili/EAGLE3-LLaMA3.1-Instruct-8B", # noqa: E501
-                                            tokenizer="meta-llama/Llama-3.1-8B-Instruct",
-                                            use_original_num_layers=True,
-                                            max_model_len=10240),
-    "LlamaForCausalLMEagle3": _HfExamplesInfo("Qwen/Qwen3-8B",  # noqa: E501
-                                            trust_remote_code=True,
-                                            speculative_model="AngelSlim/Qwen3-8B_eagle3",   # noqa: E501
-                                            tokenizer="Qwen/Qwen3-8B",
-                                            use_original_num_layers=True),
+    # "MLPSpeculatorPreTrainedModel": _HfExamplesInfo(
+    #     "JackFram/llama-160m",
+    #     speculative_model="ibm-ai-platform/llama-160m-accelerator"
+    # ),
+    "DeepSeekMTPModel": _HfExamplesInfo(
+        "luccafong/deepseek_mtp_main_random",
+        speculative_model="luccafong/deepseek_mtp_draft_random",
+        trust_remote_code=True,
+    ),
+    "EagleDeepSeekMTPModel": _HfExamplesInfo(
+        "eagle618/deepseek-v3-random",
+        speculative_model="eagle618/eagle-deepseek-v3-random",
+        trust_remote_code=True,
+    ),
+    "EagleLlamaForCausalLM": _HfExamplesInfo(
+        "meta-llama/Meta-Llama-3-8B-Instruct",
+        trust_remote_code=True,
+        speculative_model="yuhuili/EAGLE-LLaMA3-Instruct-8B",
+        tokenizer="meta-llama/Meta-Llama-3-8B-Instruct",
+    ),
+    "Eagle3LlamaForCausalLM": _HfExamplesInfo(
+        "meta-llama/Llama-3.1-8B-Instruct",
+        trust_remote_code=True,
+        speculative_model="yuhuili/EAGLE3-LLaMA3.1-Instruct-8B",
+        tokenizer="meta-llama/Llama-3.1-8B-Instruct",
+        use_original_num_layers=True,
+        max_model_len=10240,
+    ),
+    "LlamaForCausalLMEagle3": _HfExamplesInfo(
+        "Qwen/Qwen3-8B",
+        trust_remote_code=True,
+        speculative_model="AngelSlim/Qwen3-8B_eagle3",
+        tokenizer="Qwen/Qwen3-8B",
+        use_original_num_layers=True,
+    ),
     "EagleLlama4ForCausalLM": _HfExamplesInfo(
         "morgendave/EAGLE-Llama-4-Scout-17B-16E-Instruct",
         trust_remote_code=True,
         speculative_model="morgendave/EAGLE-Llama-4-Scout-17B-16E-Instruct",
-        tokenizer="meta-llama/Llama-4-Scout-17B-16E-Instruct"),  # noqa: E501
-    "EagleMiniCPMForCausalLM": _HfExamplesInfo("openbmb/MiniCPM-1B-sft-bf16",
-                                            trust_remote_code=True,
-                                            is_available_online=False,
-                                            speculative_model="openbmb/MiniCPM-2B-sft-bf16",
-                                            tokenizer="openbmb/MiniCPM-2B-sft-bf16"),
-    "ErnieMTPModel": _HfExamplesInfo("baidu/ERNIE-4.5-21B-A3B-PT",
-                                    trust_remote_code=True,
-                                    speculative_model="baidu/ERNIE-4.5-21B-A3B-PT"),
-    "Glm4MoeMTPModel": _HfExamplesInfo("zai-org/GLM-4.5",
-                                        speculative_model="zai-org/GLM-4.5",
-                                        min_transformers_version="4.56",
-                                        is_available_online=False),
+        tokenizer="meta-llama/Llama-4-Scout-17B-16E-Instruct",
+    ),
+    "EagleMiniCPMForCausalLM": _HfExamplesInfo(
+        "openbmb/MiniCPM-1B-sft-bf16",
+        trust_remote_code=True,
+        is_available_online=False,
+        speculative_model="openbmb/MiniCPM-2B-sft-bf16",
+        tokenizer="openbmb/MiniCPM-2B-sft-bf16",
+    ),
+    "ErnieMTPModel": _HfExamplesInfo(
+        "baidu/ERNIE-4.5-21B-A3B-PT",
+        trust_remote_code=True,
+        speculative_model="baidu/ERNIE-4.5-21B-A3B-PT",
+    ),
+    "Glm4MoeMTPModel": _HfExamplesInfo(
+        "zai-org/GLM-4.5",
+        speculative_model="zai-org/GLM-4.5",
+        min_transformers_version="4.56",
+        is_available_online=False,
+    ),
     "LongCatFlashMTPModel": _HfExamplesInfo(
         "meituan-longcat/LongCat-Flash-Chat",
         trust_remote_code=True,
-        speculative_model="meituan-longcat/LongCat-Flash-Chat"),
-    "MiMoMTPModel": _HfExamplesInfo("XiaomiMiMo/MiMo-7B-RL",
-                                    trust_remote_code=True,
-                                    speculative_model="XiaomiMiMo/MiMo-7B-RL"),
+        speculative_model="meituan-longcat/LongCat-Flash-Chat",
+    ),
+    "MiMoMTPModel": _HfExamplesInfo(
+        "XiaomiMiMo/MiMo-7B-RL",
+        trust_remote_code=True,
+        speculative_model="XiaomiMiMo/MiMo-7B-RL",
+    ),
     "Eagle3Qwen2_5vlForCausalLM": _HfExamplesInfo(
         "Qwen/Qwen2.5-VL-7B-Instruct",
-        speculative_model="Rayzl/qwen2.5-vl-7b-eagle3-sgl"),
-    "Qwen3NextMTP": _HfExamplesInfo("Qwen/Qwen3-Next-80B-A3B-Instruct",
-                                     min_transformers_version="4.56.3"),
+        speculative_model="Rayzl/qwen2.5-vl-7b-eagle3-sgl",
+    ),
+    "Qwen3NextMTP": _HfExamplesInfo(
+        "Qwen/Qwen3-Next-80B-A3B-Instruct", min_transformers_version="4.56.3"
+    ),
 }
 
 _TRANSFORMERS_BACKEND_MODELS = {
-    "TransformersEmbeddingModel": _HfExamplesInfo("BAAI/bge-base-en-v1.5", min_transformers_version="4.57.0.dev0"),  # noqa: E501
-    "TransformersForSequenceClassification": _HfExamplesInfo("papluca/xlm-roberta-base-language-detection", min_transformers_version="4.57.0.dev0"),  # noqa: E501
-    "TransformersForCausalLM": _HfExamplesInfo("hmellor/Ilama-3.2-1B", trust_remote_code=True),  # noqa: E501
+    "TransformersEmbeddingModel": _HfExamplesInfo(
+        "BAAI/bge-base-en-v1.5", min_transformers_version="4.57.0.dev0"
+    ),
+    "TransformersForSequenceClassification": _HfExamplesInfo(
+        "papluca/xlm-roberta-base-language-detection",
+        min_transformers_version="4.57.0.dev0",
+    ),
+    "TransformersForCausalLM": _HfExamplesInfo(
+        "hmellor/Ilama-3.2-1B", trust_remote_code=True
+    ),
     "TransformersForMultimodalLM": _HfExamplesInfo("BAAI/Emu3-Chat-hf"),
-    "TransformersMoEForCausalLM": _HfExamplesInfo("allenai/OLMoE-1B-7B-0924", min_transformers_version="4.57.0.dev0"),  # noqa: E501
-    "TransformersMoEForMultimodalLM": _HfExamplesInfo("Qwen/Qwen3-VL-30B-A3B-Instruct", min_transformers_version="4.57.0.dev0"),  # noqa: E501
-    "TransformersMoEEmbeddingModel": _HfExamplesInfo("Qwen/Qwen3-30B-A3B", min_transformers_version="4.57.0.dev0"),  # noqa: E501
-    "TransformersMoEForSequenceClassification": _HfExamplesInfo("Qwen/Qwen3-30B-A3B", min_transformers_version="4.57.0.dev0"),  # noqa: E501
+    "TransformersMoEForCausalLM": _HfExamplesInfo(
+        "allenai/OLMoE-1B-7B-0924", min_transformers_version="4.57.0.dev0"
+    ),
+    "TransformersMoEForMultimodalLM": _HfExamplesInfo(
+        "Qwen/Qwen3-VL-30B-A3B-Instruct", min_transformers_version="4.57.0.dev0"
+    ),
+    "TransformersMoEEmbeddingModel": _HfExamplesInfo(
+        "Qwen/Qwen3-30B-A3B", min_transformers_version="4.57.0.dev0"
+    ),
+    "TransformersMoEForSequenceClassification": _HfExamplesInfo(
+        "Qwen/Qwen3-30B-A3B", min_transformers_version="4.57.0.dev0"
+    ),
 }
 
 _EXAMPLE_MODELS = {
@@ -699,8 +934,9 @@ def get_hf_info(self, model_arch: str) -> _HfExamplesInfo:
         try:
             return self.hf_models[model_arch]
         except KeyError:
-            raise ValueError(f"No example model defined for {model_arch}; "
-                             f"please update this file.") from None
+            raise ValueError(
+                f"No example model defined for {model_arch}; please update this file."
+            ) from None
 
     def find_hf_info(self, model_id: str) -> _HfExamplesInfo:
         for info in self.hf_models.values():
@@ -712,8 +948,9 @@ def find_hf_info(self, model_id: str) -> _HfExamplesInfo:
             if any(extra == model_id for extra in info.extras.values()):
                 return info
 
-        raise ValueError(f"No example model defined for {model_id}; "
-                         f"please update this file.")
+        raise ValueError(
+            f"No example model defined for {model_id}; please update this file."
+        )
 
 
 HF_EXAMPLE_MODELS = HfExampleModels(_EXAMPLE_MODELS)
diff --git a/tests/multimodal/test_cache.py b/tests/multimodal/test_cache.py
index 49493a2e0479..fe983990b90c 100644
--- a/tests/multimodal/test_cache.py
+++ b/tests/multimodal/test_cache.py
@@ -71,25 +71,27 @@ def _dummy_items(
     )
 
 
-# yapf: disable
 @pytest.mark.parametrize(
     ("item", "expected_size"),
     [
         (_dummy_item("a", {"a1": 100}), 100),
         (_dummy_item("a", {"a1": 100, "a2": 110}), 210),
         (_dummy_items({"a": {"a1": 100, "a2": 110}, "b": {"b1": 120, "b2": 130}}), 460),  # noqa: E501
-        (_dummy_items({"a": {"a1": 100, "a2": 110}, "b": {"b1": 120, "b2": 130}}).get_data(), 460),  # noqa: E501
+        (
+            _dummy_items(
+                {"a": {"a1": 100, "a2": 110}, "b": {"b1": 120, "b2": 130}}
+            ).get_data(),
+            460,
+        ),  # noqa: E501
     ],
 )
-# yapf: enable
 def test_cache_item_size(item, expected_size):
     cache = MultiModalCache.get_lru_cache(2048, type(item))
 
     cache[""] = item
     assert cache.currsize == expected_size
 
-    prompt_update = PromptInsertion("dummy", "target", "insertion") \
-        .resolve(0)
+    prompt_update = PromptInsertion("dummy", "target", "insertion").resolve(0)
 
     cache[""] = MultiModalProcessorCacheItem(item, [prompt_update])
     assert cache.currsize == expected_size
@@ -106,9 +108,9 @@ def _create_vllm_config(
     return VllmConfig(
         model_config=ModelConfig(
             model="llava-hf/llava-onevision-qwen2-0.5b-ov-hf",
-            mm_processor_cache_gb=mm_processor_cache_gb),
-        parallel_config=ParallelConfig(
-            data_parallel_size=1 if enable_ipc else 2),
+            mm_processor_cache_gb=mm_processor_cache_gb,
+        ),
+        parallel_config=ParallelConfig(data_parallel_size=1 if enable_ipc else 2),
     )
 
 
@@ -124,11 +126,9 @@ def _compare_caches(
     seed: int = 0,
 ):
     cache_0_p0 = processor_cache_from_config(config_0, MULTIMODAL_REGISTRY)
-    cache_0_p1 = engine_receiver_cache_from_config(config_0,
-                                                   MULTIMODAL_REGISTRY)
+    cache_0_p1 = engine_receiver_cache_from_config(config_0, MULTIMODAL_REGISTRY)
     cache_1_p0 = processor_cache_from_config(config_1, MULTIMODAL_REGISTRY)
-    cache_1_p1 = engine_receiver_cache_from_config(config_1,
-                                                   MULTIMODAL_REGISTRY)
+    cache_1_p1 = engine_receiver_cache_from_config(config_1, MULTIMODAL_REGISTRY)
 
     cache_size_gb = max(
         config_0.model_config.multimodal_config.mm_processor_cache_gb,
@@ -142,8 +142,7 @@ def _compare_caches(
         for _ in range(int(item_capacity / hit_rate))
     ]
     all_hashes = [
-        MultiModalHasher.hash_kwargs(item=item.get_data())
-        for item in all_items
+        MultiModalHasher.hash_kwargs(item=item.get_data()) for item in all_items
     ]
 
     # Should not be used since there is nothing to convert to text
@@ -162,7 +161,8 @@ def _compare_caches(
             for _ in range(is_cached_calls_per_iter):
                 cache_0_p0.is_cached(selected_hashes)
             cache_0_p0_out = [
-                item for item, _ in cache_0_p0.get_and_update(
+                item
+                for item, _ in cache_0_p0.get_and_update(
                     [(item, prompt_update.content) for item in selected_items],
                     selected_hashes,
                 )
@@ -174,7 +174,8 @@ def _compare_caches(
             for _ in range(is_cached_calls_per_iter):
                 cache_1_p0.is_cached(selected_hashes)
             cache_1_p0_out = [
-                item for item, _ in cache_1_p0.get_and_update(
+                item
+                for item, _ in cache_1_p0.get_and_update(
                     [(item, prompt_update.content) for item in selected_items],
                     selected_hashes,
                 )
@@ -183,14 +184,12 @@ def _compare_caches(
         if cache_0_p1 is None:
             cache_0_p1_out = cache_0_p0_out
         else:
-            cache_0_p1_out = cache_0_p1.get_and_update(cache_0_p0_out,
-                                                       selected_hashes)
+            cache_0_p1_out = cache_0_p1.get_and_update(cache_0_p0_out, selected_hashes)
 
         if cache_1_p1 is None:
             cache_1_p1_out = cache_1_p0_out
         else:
-            cache_1_p1_out = cache_1_p1.get_and_update(cache_1_p0_out,
-                                                       selected_hashes)
+            cache_1_p1_out = cache_1_p1.get_and_update(cache_1_p0_out, selected_hashes)
 
         assert cache_0_p1_out == cache_1_p1_out, f"Failed at {it=}"
 
diff --git a/tests/multimodal/test_processing.py b/tests/multimodal/test_processing.py
index 961a2c86b230..87733f20c4b8 100644
--- a/tests/multimodal/test_processing.py
+++ b/tests/multimodal/test_processing.py
@@ -9,9 +9,6 @@
 
 from vllm.config import ModelConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.multimodal.processing import (
     InputProcessingContext,
     PlaceholderFeaturesInfo,
@@ -24,8 +21,6 @@
     iter_token_matches,
     replace_token_matches,
 )
-
-# yapf: enable
 from vllm.multimodal.profiling import MultiModalProfiler
 from vllm.transformers_utils.tokenizer import AnyTokenizer
 
@@ -34,7 +29,6 @@
 pytestmark = pytest.mark.cpu_test
 
 
-# yapf: disable
 @pytest.mark.parametrize(
     ("token_ids", "match_ids", "expected"),
     [
@@ -44,34 +38,34 @@
             [32000, 32000, 32000],
             [32000],
             [
-                { "start_idx": 0, "end_idx": 1 },
-                { "start_idx": 1, "end_idx": 2 },
-                { "start_idx": 2, "end_idx": 3 },
+                {"start_idx": 0, "end_idx": 1},
+                {"start_idx": 1, "end_idx": 2},
+                {"start_idx": 2, "end_idx": 3},
             ],
         ),
         (
             [32000, 32000, 32000],
             [32000, 32000],
-            [{ "start_idx": 0, "end_idx": 2 }],
+            [{"start_idx": 0, "end_idx": 2}],
         ),
         (
             [32000, 32000, 32000],
             [32000, 32000, 32000],
-            [{ "start_idx": 0, "end_idx": 3 }],
+            [{"start_idx": 0, "end_idx": 3}],
         ),
         (
             [9833, 28747, 32000, 32000, 32000, 9833, 28747, 32000, 32000, 918],
             [28747, 32000],
             [
-                { "start_idx": 1, "end_idx": 3 },
-                { "start_idx": 6, "end_idx": 8 },
+                {"start_idx": 1, "end_idx": 3},
+                {"start_idx": 6, "end_idx": 8},
             ],
         ),
         (
             [9833, 28747, 32000, 32000, 32000, 9833, 28747, 32000, 32000, 918],
             [28747, 32000, 32000, 32000],
             [
-                { "start_idx": 1, "end_idx": 5 },
+                {"start_idx": 1, "end_idx": 5},
             ],
         ),
         (
@@ -82,14 +76,13 @@
     ],
 )
 @pytest.mark.parametrize("start_idx", [0, 4, 8])
-# yapf: enable
 def test_iter_token_matches(token_ids, match_ids, expected, start_idx):
-    result = list(iter_token_matches(token_ids, match_ids,
-                                     start_idx=start_idx))
+    result = list(iter_token_matches(token_ids, match_ids, start_idx=start_idx))
 
     # Manually constructed results
-    assert [item._asdict() for item in result
-            ] == [item for item in expected if item["start_idx"] >= start_idx]
+    assert [item._asdict() for item in result] == [
+        item for item in expected if item["start_idx"] >= start_idx
+    ]
 
     # Invariants
     match_lens = [end - start for start, end in result]
@@ -97,7 +90,6 @@ def test_iter_token_matches(token_ids, match_ids, expected, start_idx):
     assert all(match_len == len(match_ids) for match_len in match_lens)
 
 
-# yapf: disable
 @pytest.mark.parametrize(
     ("token_ids", "match_ids", "new_ids", "expected"),
     [
@@ -141,7 +133,6 @@ def test_iter_token_matches(token_ids, match_ids, expected, start_idx):
         ),
     ],
 )
-# yapf: enable
 def test_replace_token_matches(token_ids, match_ids, new_ids, expected):
     result = replace_token_matches(token_ids, match_ids, new_ids)
 
@@ -149,7 +140,6 @@ def test_replace_token_matches(token_ids, match_ids, new_ids, expected):
     assert result == expected
 
 
-# yapf: disable
 @pytest.mark.parametrize(
     ("prompt", "target_by_key", "expected_by_key"),
     [
@@ -166,11 +156,11 @@ def test_replace_token_matches(token_ids, match_ids, new_ids, expected):
                 "pattern_1": [],
                 "pattern_2": [],
                 "pattern_3": [
-                    { "start_idx": 0, "end_idx": 0 },
+                    {"start_idx": 0, "end_idx": 0},
                 ],
                 "pattern_4": [],
                 "pattern_5": [
-                    { "start_idx": 0, "end_idx": 0 },
+                    {"start_idx": 0, "end_idx": 0},
                 ],
             },
         ),
@@ -186,26 +176,26 @@ def test_replace_token_matches(token_ids, match_ids, new_ids, expected):
             },
             {
                 "pattern_1": [
-                    { "start_idx": 0, "end_idx": 1 },
-                    { "start_idx": 1, "end_idx": 2 },
-                    { "start_idx": 2, "end_idx": 3 },
-                    { "start_idx": 3, "end_idx": 4 },
+                    {"start_idx": 0, "end_idx": 1},
+                    {"start_idx": 1, "end_idx": 2},
+                    {"start_idx": 2, "end_idx": 3},
+                    {"start_idx": 3, "end_idx": 4},
                 ],
                 "pattern_2": [
-                    { "start_idx": 0, "end_idx": 2 },
-                    { "start_idx": 2, "end_idx": 4 },
+                    {"start_idx": 0, "end_idx": 2},
+                    {"start_idx": 2, "end_idx": 4},
                 ],
                 "pattern_3": [
-                    { "start_idx": 0, "end_idx": 3 },
+                    {"start_idx": 0, "end_idx": 3},
                 ],
                 "pattern_4": [
-                    { "start_idx": 0, "end_idx": 0 },
+                    {"start_idx": 0, "end_idx": 0},
                 ],
                 "pattern_5": [
-                    { "start_idx": 1, "end_idx": 1 },
+                    {"start_idx": 1, "end_idx": 1},
                 ],
                 "pattern_6": [
-                    { "start_idx": 4, "end_idx": 4 },
+                    {"start_idx": 4, "end_idx": 4},
                 ],
             },
         ),
@@ -221,26 +211,25 @@ def test_replace_token_matches(token_ids, match_ids, new_ids, expected):
             },
             {
                 "pattern_1": [
-                    { "start_idx": 1, "end_idx": 3 },
-                    { "start_idx": 6, "end_idx": 8 },
+                    {"start_idx": 1, "end_idx": 3},
+                    {"start_idx": 6, "end_idx": 8},
                 ],
                 "pattern_2": [
-                    { "start_idx": 1, "end_idx": 5 },
+                    {"start_idx": 1, "end_idx": 5},
                 ],
                 "pattern_3": [],
                 "pattern_4": [
-                    { "start_idx": 0, "end_idx": 0 },
+                    {"start_idx": 0, "end_idx": 0},
                 ],
                 "pattern_5": [],
                 "pattern_6": [
-                    { "start_idx": 10, "end_idx": 10 },
+                    {"start_idx": 10, "end_idx": 10},
                 ],
             },
         ),
     ],
 )
 @pytest.mark.parametrize("update_type", [PromptInsertion, PromptReplacement])
-# yapf: enable
 def test_find_token_matches(
     prompt,
     target_by_key,
@@ -272,7 +261,6 @@ def test_find_token_matches(
     } == expected_by_key
 
 
-# yapf: disable
 @pytest.mark.parametrize(
     ("prompt", "target_by_key", "expected_by_key"),
     [
@@ -288,16 +276,16 @@ def test_find_token_matches(
                 "pattern_5": PromptIndexTargets.end(),
             },
             {
-                "pattern_1": [{ "start_idx": 0, "end_idx": 0 }],
+                "pattern_1": [{"start_idx": 0, "end_idx": 0}],
                 "pattern_2": [],
                 "pattern_3": [
-                    { "start_idx": 0, "end_idx": 0 },
+                    {"start_idx": 0, "end_idx": 0},
                 ],
                 "pattern_4": [],
                 "pattern_5": [
-                    { "start_idx": 0, "end_idx": 0 },
+                    {"start_idx": 0, "end_idx": 0},
                 ],
-            }
+            },
         ),
         (
             "<image><image><image><image>",
@@ -311,26 +299,26 @@ def test_find_token_matches(
             },
             {
                 "pattern_1": [
-                    { "start_idx": 0, "end_idx": 7 },
-                    { "start_idx": 7, "end_idx": 14 },
-                    { "start_idx": 14, "end_idx": 21 },
-                    { "start_idx": 21, "end_idx": 28 },
+                    {"start_idx": 0, "end_idx": 7},
+                    {"start_idx": 7, "end_idx": 14},
+                    {"start_idx": 14, "end_idx": 21},
+                    {"start_idx": 21, "end_idx": 28},
                 ],
                 "pattern_2": [
-                    { "start_idx": 0, "end_idx": 14 },
-                    { "start_idx": 14, "end_idx": 28 },
+                    {"start_idx": 0, "end_idx": 14},
+                    {"start_idx": 14, "end_idx": 28},
                 ],
                 "pattern_3": [
-                    { "start_idx": 0, "end_idx": 21 },
+                    {"start_idx": 0, "end_idx": 21},
                 ],
                 "pattern_4": [
-                    { "start_idx": 0, "end_idx": 0 },
+                    {"start_idx": 0, "end_idx": 0},
                 ],
                 "pattern_5": [
-                    { "start_idx": 7, "end_idx": 7 },
+                    {"start_idx": 7, "end_idx": 7},
                 ],
                 "pattern_6": [
-                    { "start_idx": 28, "end_idx": 28 },
+                    {"start_idx": 28, "end_idx": 28},
                 ],
             },
         ),
@@ -346,21 +334,21 @@ def test_find_token_matches(
             },
             {
                 "pattern_1": [
-                    { "start_idx": 0, "end_idx": 13 },
-                    { "start_idx": 27, "end_idx": 40 },
+                    {"start_idx": 0, "end_idx": 13},
+                    {"start_idx": 27, "end_idx": 40},
                 ],
                 "pattern_2": [
-                    { "start_idx": 0, "end_idx": 27 },
+                    {"start_idx": 0, "end_idx": 27},
                 ],
                 "pattern_3": [],
                 "pattern_4": [
-                    { "start_idx": 0, "end_idx": 0 },
+                    {"start_idx": 0, "end_idx": 0},
                 ],
                 "pattern_5": [
-                    { "start_idx": 13, "end_idx": 13 },
+                    {"start_idx": 13, "end_idx": 13},
                 ],
                 "pattern_6": [
-                    { "start_idx": 48, "end_idx": 48 },
+                    {"start_idx": 48, "end_idx": 48},
                 ],
             },
         ),
@@ -374,22 +362,21 @@ def test_find_token_matches(
             },
             {
                 "pattern_1": [
-                    { "start_idx": 0, "end_idx": 9 },
-                    { "start_idx": 16, "end_idx": 25 },
+                    {"start_idx": 0, "end_idx": 9},
+                    {"start_idx": 16, "end_idx": 25},
                 ],
                 "pattern_2": [
-                    { "start_idx": 0, "end_idx": 16 },
-                    { "start_idx": 16, "end_idx": 32 },
+                    {"start_idx": 0, "end_idx": 16},
+                    {"start_idx": 16, "end_idx": 32},
                 ],
                 "pattern_3": [
-                    { "start_idx": 0, "end_idx": 25 },
+                    {"start_idx": 0, "end_idx": 25},
                 ],
             },
         ),
     ],
 )
 @pytest.mark.parametrize("update_type", [PromptInsertion, PromptReplacement])
-# yapf: enable
 def test_find_text_matches(
     prompt,
     target_by_key,
@@ -421,7 +408,6 @@ def test_find_text_matches(
     } == expected_by_key
 
 
-# yapf: disable
 @pytest.mark.parametrize(
     ("prompt", "target_by_key", "repl_by_key", "expected_by_update_type_mm_count"),  # noqa: E501
     [
@@ -549,9 +535,8 @@ def test_find_text_matches(
                 },
             },
         ),
-    ]
+    ],
 )
-# yapf: enable
 def test_find_update_text(
     prompt,
     target_by_key,
@@ -562,13 +547,15 @@ def test_find_update_text(
     mock_tokenizer = cast(AnyTokenizer, object())
 
     for (
-            update_type,
-            expected_by_mm_count,
+        update_type,
+        expected_by_mm_count,
     ) in expected_by_update_type_mm_count.items():
         for mm_count, expected in expected_by_mm_count.items():
             mm_prompt_updates = {
-                key: [[update_type(key, target, repl_by_key[key]).resolve(i)]
-                      for i in range(mm_count)]
+                key: [
+                    [update_type(key, target, repl_by_key[key]).resolve(i)]
+                    for i in range(mm_count)
+                ]
                 for key, target in target_by_key.items()
             }
 
@@ -589,7 +576,6 @@ def test_find_update_text(
             assert new_prompt == expected
 
 
-# yapf: disable
 @pytest.mark.parametrize(
     ("prompt", "target_by_key", "repl_by_key", "expected_by_update_type_mm_count"),  # noqa: E501
     [
@@ -615,8 +601,43 @@ def test_find_update_text(
             {
                 PromptInsertion: {
                     0: [1, 9833, 28747, 32000, 9833, 28747, 32000, 32000, 918],
-                    1: [1, 9833, 28747, 32000, 32000, 32000, 9833, 28747, 32000, 32000, 918, 1550, 918, 1550],  # noqa: E501
-                    2: [1, 9833, 28747, 32000, 32000, 32000, 32000, 32000, 9833, 28747, 32000, 32000, 918, 1550, 918, 1550, 1550, 918, 1550],  # noqa: E501
+                    1: [
+                        1,
+                        9833,
+                        28747,
+                        32000,
+                        32000,
+                        32000,
+                        9833,
+                        28747,
+                        32000,
+                        32000,
+                        918,
+                        1550,
+                        918,
+                        1550,
+                    ],  # noqa: E501
+                    2: [
+                        1,
+                        9833,
+                        28747,
+                        32000,
+                        32000,
+                        32000,
+                        32000,
+                        32000,
+                        9833,
+                        28747,
+                        32000,
+                        32000,
+                        918,
+                        1550,
+                        918,
+                        1550,
+                        1550,
+                        918,
+                        1550,
+                    ],  # noqa: E501
                 },
                 PromptReplacement: {
                     0: [1, 9833, 28747, 32000, 9833, 28747, 32000, 32000, 918],
@@ -719,9 +740,8 @@ def test_find_update_text(
                 },
             },
         ),
-    ]
+    ],
 )
-# yapf: enable
 def test_find_update_tokens(
     prompt,
     target_by_key,
@@ -732,13 +752,15 @@ def test_find_update_tokens(
     mock_tokenizer = cast(AnyTokenizer, object())
 
     for (
-            update_type,
-            expected_by_mm_count,
+        update_type,
+        expected_by_mm_count,
     ) in expected_by_update_type_mm_count.items():
         for mm_count, expected in expected_by_mm_count.items():
             mm_prompt_updates = {
-                key: [[update_type(key, target, repl_by_key[key]).resolve(i)]
-                      for i in range(mm_count)]
+                key: [
+                    [update_type(key, target, repl_by_key[key]).resolve(i)]
+                    for i in range(mm_count)
+                ]
                 for key, target in target_by_key.items()
             }
 
@@ -759,7 +781,6 @@ def test_find_update_tokens(
             assert new_prompt == expected
 
 
-# yapf: disable
 @pytest.mark.parametrize(
     "repl_by_key",
     [
@@ -796,8 +817,7 @@ def test_find_update_tokens(
                         is_embed=None,
                     ),
                 ],
-            }
-
+            },
         ),
         (
             [1, 32000, 32000, 9833, 28747, 32000, 32000, 1550, 918, 1550],
@@ -828,7 +848,7 @@ def test_find_update_tokens(
                     ),
                 ],
                 # No match for pattern_4 as it has lower priority than pattern_1
-            }
+            },
         ),
         (
             [1, 32000, 32000, 32000, 32000, 32000, 1550, 918, 1550],
@@ -867,12 +887,11 @@ def test_find_update_tokens(
                         is_embed=None,
                     ),
                 ],
-            }
+            },
         ),
-    ]
+    ],
 )
 @pytest.mark.parametrize("update_type", [PromptInsertion, PromptReplacement])
-# yapf: enable
 def test_find_mm_placeholders(
     repl_by_key,
     prompt,
@@ -899,8 +918,15 @@ def test_find_mm_placeholders(
 @pytest.mark.parametrize("model_id", ["llava-hf/llava-v1.6-mistral-7b-hf"])
 @pytest.mark.parametrize(
     ("limit", "num_supported", "is_valid"),
-    [(0, 0, True), (0, 1, True), (1, 0, False), (1, 1, True), (1, 2, True),
-     (2, 1, False), (2, 2, True)],
+    [
+        (0, 0, True),
+        (0, 1, True),
+        (1, 0, False),
+        (1, 1, True),
+        (1, 2, True),
+        (2, 1, False),
+        (2, 2, True),
+    ],
 )
 def test_limit_mm_per_prompt_dummy(model_id, limit, num_supported, is_valid):
     limit_mm_per_prompt = {"image": limit}
@@ -930,8 +956,15 @@ def test_limit_mm_per_prompt_dummy(model_id, limit, num_supported, is_valid):
 @pytest.mark.parametrize("model_id", ["llava-hf/llava-v1.6-mistral-7b-hf"])
 @pytest.mark.parametrize(
     ("num_images", "limit", "is_valid"),
-    [(0, 0, True), (0, 1, True), (1, 0, False), (1, 1, True), (1, 2, True),
-     (2, 1, False), (2, 2, True)],
+    [
+        (0, 0, True),
+        (0, 1, True),
+        (1, 0, False),
+        (1, 1, True),
+        (1, 2, True),
+        (2, 1, False),
+        (2, 2, True),
+    ],
 )
 def test_limit_mm_per_prompt_apply(model_id, num_images, limit, is_valid):
     limit_mm_per_prompt = {"image": limit}
@@ -966,7 +999,6 @@ def test_limit_mm_per_prompt_apply(model_id, num_images, limit, is_valid):
 
 
 class DummyProcessor:
-
     def __init__(self, a: int = 0, b: int = 0) -> None:
         super().__init__()
 
@@ -982,7 +1014,6 @@ def __call__(
         return dict(a=a, c=c)
 
 
-# yapf: disable
 @pytest.mark.parametrize("model_id", ["Qwen/Qwen2-VL-2B-Instruct"])  # Dummy
 @pytest.mark.parametrize(
     ("config_kwargs", "inference_kwargs", "expected_kwargs"),
@@ -996,7 +1027,6 @@ def __call__(
         ({"b": 1, "c": 1}, {}, {"a": 0, "b": 1}),
     ],
 )
-# yapf: enable
 def test_hf_processor_init_kwargs(
     model_id,
     config_kwargs,
@@ -1020,7 +1050,6 @@ def test_hf_processor_init_kwargs(
         assert getattr(processor, k) == v
 
 
-# yapf: disable
 @pytest.mark.parametrize("model_id", ["Qwen/Qwen2-VL-2B-Instruct"])  # Dummy
 @pytest.mark.parametrize(
     ("config_kwargs", "inference_kwargs", "expected_kwargs"),
@@ -1034,7 +1063,6 @@ def test_hf_processor_init_kwargs(
         ({"b": 1, "c": 1}, {}, {"a": 0, "c": 1}),
     ],
 )
-# yapf: enable
 def test_hf_processor_call_kwargs(
     model_id,
     config_kwargs,
diff --git a/tests/multimodal/test_utils.py b/tests/multimodal/test_utils.py
index 81b332059def..ea795fcbbde5 100644
--- a/tests/multimodal/test_utils.py
+++ b/tests/multimodal/test_utils.py
@@ -233,7 +233,6 @@ async def test_fetch_video_http_with_dynamic_loader(
         assert metadata_sync["video_backend"] == "opencv_dynamic"
 
 
-# yapf: disable
 @pytest.mark.parametrize(
     "case",
     [
@@ -264,7 +263,6 @@ async def test_fetch_video_http_with_dynamic_loader(
                 ("image", 0),
             ],
         ),
-
         # Two modalities
         ## Internally sorted
         dict(
@@ -276,7 +274,7 @@ async def test_fetch_video_http_with_dynamic_loader(
                 "audio": [
                     PlaceholderRange(offset=0, length=2),
                     PlaceholderRange(offset=2, length=3),
-                ]
+                ],
             },
             expected_modality_idxs=[
                 ("audio", 0),
@@ -295,7 +293,7 @@ async def test_fetch_video_http_with_dynamic_loader(
                 "audio": [
                     PlaceholderRange(offset=5, length=2),
                     PlaceholderRange(offset=11, length=4),
-                ]
+                ],
             },
             expected_modality_idxs=[
                 ("image", 0),
@@ -314,7 +312,7 @@ async def test_fetch_video_http_with_dynamic_loader(
                 "audio": [
                     PlaceholderRange(offset=11, length=4),
                     PlaceholderRange(offset=5, length=2),
-                ]
+                ],
             },
             expected_modality_idxs=[
                 ("image", 1),
@@ -323,7 +321,6 @@ async def test_fetch_video_http_with_dynamic_loader(
                 ("audio", 0),
             ],
         ),
-
         # Three modalities
         ## Internally sorted
         dict(
@@ -339,7 +336,7 @@ async def test_fetch_video_http_with_dynamic_loader(
                     PlaceholderRange(offset=3, length=4),
                     PlaceholderRange(offset=7, length=5),
                     PlaceholderRange(offset=12, length=6),
-                ]
+                ],
             },
             expected_modality_idxs=[
                 ("audio", 0),
@@ -363,7 +360,7 @@ async def test_fetch_video_http_with_dynamic_loader(
                 ],
                 "video": [
                     PlaceholderRange(offset=8, length=5),
-                ]
+                ],
             },
             expected_modality_idxs=[
                 ("image", 0),
@@ -386,7 +383,7 @@ async def test_fetch_video_http_with_dynamic_loader(
                 ],
                 "video": [
                     PlaceholderRange(offset=8, length=5),
-                ]
+                ],
             },
             expected_modality_idxs=[
                 ("image", 0),
@@ -398,7 +395,6 @@ async def test_fetch_video_http_with_dynamic_loader(
         ),
     ],
 )
-# yapf: enable
 def test_argsort_mm_positions(case):
     mm_positions = case["mm_positions"]
     expected_modality_idxs = case["expected_modality_idxs"]
@@ -413,13 +409,16 @@ def test_argsort_mm_positions(case):
 @pytest.mark.parametrize("num_frames", [-1, 32, 1800])
 async def test_allowed_media_domains(video_url: str, num_frames: int):
     connector = MediaConnector(
-        media_io_kwargs={"video": {
-            "num_frames": num_frames,
-        }},
+        media_io_kwargs={
+            "video": {
+                "num_frames": num_frames,
+            }
+        },
         allowed_media_domains=[
             "www.bogotobogo.com",
             "github.com",
-        ])
+        ],
+    )
 
     video_sync, metadata_sync = connector.fetch_video(video_url)
     video_async, metadata_async = await connector.fetch_video_async(video_url)
diff --git a/tests/test_inputs.py b/tests/test_inputs.py
index 41b9665bd7a9..50a273016ab8 100644
--- a/tests/test_inputs.py
+++ b/tests/test_inputs.py
@@ -59,48 +59,52 @@ def test_parse_raw_single_batch_string_slice(inputs_slice: slice):
     )
 
 
-# yapf: disable
-@pytest.mark.parametrize('mm_processor_kwargs,expected_mm_kwargs', [
-    (None, [{}, {}]),
-    ({}, [{}, {}]),
-    ({"foo": 100}, [{"foo": 100}, {"foo": 100}]),
-    ([{"foo": 100}, {"bar": 200}], [{"foo": 100}, {"bar": 200}]),
-])
-# yapf: enable
+@pytest.mark.parametrize(
+    "mm_processor_kwargs,expected_mm_kwargs",
+    [
+        (None, [{}, {}]),
+        ({}, [{}, {}]),
+        ({"foo": 100}, [{"foo": 100}, {"foo": 100}]),
+        ([{"foo": 100}, {"bar": 200}], [{"foo": 100}, {"bar": 200}]),
+    ],
+)
 def test_zip_enc_dec_prompts(mm_processor_kwargs, expected_mm_kwargs):
     """Test mm_processor_kwargs init for zipping enc/dec prompts."""
-    encoder_prompts = ['An encoder prompt', 'Another encoder prompt']
-    decoder_prompts = ['A decoder prompt', 'Another decoder prompt']
-    zipped_prompts = zip_enc_dec_prompts(encoder_prompts, decoder_prompts,
-                                         mm_processor_kwargs)
+    encoder_prompts = ["An encoder prompt", "Another encoder prompt"]
+    decoder_prompts = ["A decoder prompt", "Another decoder prompt"]
+    zipped_prompts = zip_enc_dec_prompts(
+        encoder_prompts, decoder_prompts, mm_processor_kwargs
+    )
     assert len(zipped_prompts) == len(encoder_prompts) == len(decoder_prompts)
-    for enc, dec, exp_kwargs, zipped in zip(encoder_prompts, decoder_prompts,
-                                            expected_mm_kwargs,
-                                            zipped_prompts):
+    for enc, dec, exp_kwargs, zipped in zip(
+        encoder_prompts, decoder_prompts, expected_mm_kwargs, zipped_prompts
+    ):
         assert isinstance(zipped, dict)
         assert len(zipped.keys()) == 3
-        assert zipped['encoder_prompt'] == enc
-        assert zipped['decoder_prompt'] == dec
-        assert zipped['mm_processor_kwargs'] == exp_kwargs
-
-
-@pytest.mark.parametrize("model_id", [
-    "facebook/opt-125m",
-])
-@pytest.mark.parametrize("prompt", [
-    {
-        "prompt": "",
-        "multi_modal_data": {
-            "dummy": []
+        assert zipped["encoder_prompt"] == enc
+        assert zipped["decoder_prompt"] == dec
+        assert zipped["mm_processor_kwargs"] == exp_kwargs
+
+
+@pytest.mark.parametrize(
+    "model_id",
+    [
+        "facebook/opt-125m",
+    ],
+)
+@pytest.mark.parametrize(
+    "prompt",
+    [
+        {
+            "prompt": "",
+            "multi_modal_data": {"dummy": []},
         },
-    },
-    {
-        "prompt_token_ids": [],
-        "multi_modal_data": {
-            "dummy": []
+        {
+            "prompt_token_ids": [],
+            "multi_modal_data": {"dummy": []},
         },
-    },
-])
+    ],
+)
 def test_preprocessor_text_no_mm_inputs(model_id, prompt):
     model_config = ModelConfig(model=model_id)
     tokenizer = init_tokenizer_from_configs(model_config)
@@ -110,15 +114,19 @@ def test_preprocessor_text_no_mm_inputs(model_id, prompt):
         input_preprocessor.preprocess(prompt)
 
 
-@pytest.mark.parametrize("model_id", [
-    "facebook/chameleon-7b",
-])
-@pytest.mark.parametrize("prompt", [
-    "",
-    {
-        "prompt_token_ids": []
-    },
-])
+@pytest.mark.parametrize(
+    "model_id",
+    [
+        "facebook/chameleon-7b",
+    ],
+)
+@pytest.mark.parametrize(
+    "prompt",
+    [
+        "",
+        {"prompt_token_ids": []},
+    ],
+)
 def test_preprocessor_always_mm_code_path(model_id, prompt):
     model_config = ModelConfig(model=model_id)
     tokenizer = init_tokenizer_from_configs(model_config)
diff --git a/tests/tpu/test_moe_pallas.py b/tests/tpu/test_moe_pallas.py
index a0f3e9d2c7e9..e3236d20bf67 100644
--- a/tests/tpu/test_moe_pallas.py
+++ b/tests/tpu/test_moe_pallas.py
@@ -9,14 +9,10 @@
 import torch
 import torch_xla
 
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.model_executor.layers.fused_moe.moe_pallas import fused_moe as pallas_moe
 from vllm.model_executor.layers.fused_moe.moe_torch_iterative import (
     fused_moe as torch_moe,
 )
-
-# yapf: enable
 from vllm.platforms import current_platform
 
 if not current_platform.is_tpu():
diff --git a/tests/utils_/test_utils.py b/tests/utils_/test_utils.py
index db94845a8139..71c82feac36b 100644
--- a/tests/utils_/test_utils.py
+++ b/tests/utils_/test_utils.py
@@ -388,7 +388,6 @@ def test_duplicate_dict_args(caplog_vllm, parser):
     assert "-O.level" in caplog_vllm.text
 
 
-# yapf: enable
 @pytest.mark.parametrize(
     "callable,kw_name,requires_kw_only,allow_var_kwargs,is_supported",
     [
@@ -408,7 +407,6 @@ def test_duplicate_dict_args(caplog_vllm, parser):
         (lambda foo, **kwargs: None, "foo", True, True, False),
     ],
 )
-# yapf: disable
 def test_supports_kw(
     callable, kw_name, requires_kw_only, allow_var_kwargs, is_supported
 ):
@@ -681,7 +679,6 @@ def test_lru_cache():
     assert 6 in cache
 
 
-# yapf: disable
 @pytest.mark.parametrize(
     ("src_dtype", "tgt_dtype", "expected_result"),
     [
@@ -715,12 +712,10 @@ def test_lru_cache():
         (torch.complex64, torch.complex32, False),
     ],
 )
-# yapf: enable
 def test_is_lossless_cast(src_dtype, tgt_dtype, expected_result):
     assert is_lossless_cast(src_dtype, tgt_dtype) == expected_result
 
 
-# yapf: disable
 @pytest.mark.parametrize(
     ("dtypes", "expected_result"),
     [
@@ -730,7 +725,6 @@ def test_is_lossless_cast(src_dtype, tgt_dtype, expected_result):
         ([torch.bool, torch.int8, torch.float16, torch.complex32], torch.complex32),  # noqa: E501
     ],
 )
-# yapf: enable
 def test_common_broadcastable_dtype(dtypes, expected_result):
     assert common_broadcastable_dtype(dtypes) == expected_result
 
@@ -775,7 +769,6 @@ def build_ctx():
         _ = placeholder_attr.module
 
 
-# yapf: disable
 @pytest.mark.parametrize(
     "obj,key1,key2",
     [
@@ -785,8 +778,8 @@ def build_ctx():
         ({1: "a", 2: "b"}, 1, 3),
         # Tests for both keys do not exist
         ({1: "a", 2: "b"}, 3, 4),
-    ])
-# yapf: enable
+    ],
+)
 def test_swap_dict_values(obj, key1, key2):
     original_obj = obj.copy()
     swap_dict_values(obj, key1, key2)
@@ -800,26 +793,30 @@ def test_swap_dict_values(obj, key1, key2):
         assert key1 not in obj
 
 
-def test_model_specification(parser_with_config, cli_config_file,
-                             cli_config_file_with_model):
+def test_model_specification(
+    parser_with_config, cli_config_file, cli_config_file_with_model
+):
     # Test model in CLI takes precedence over config
     args = parser_with_config.parse_args(
-        ['serve', 'cli-model', '--config', cli_config_file_with_model])
-    assert args.model_tag == 'cli-model'
-    assert args.served_model_name == 'mymodel'
+        ["serve", "cli-model", "--config", cli_config_file_with_model]
+    )
+    assert args.model_tag == "cli-model"
+    assert args.served_model_name == "mymodel"
 
     # Test model from config file works
-    args = parser_with_config.parse_args([
-        'serve',
-        '--config',
-        cli_config_file_with_model,
-    ])
-    assert args.model == 'config-model'
-    assert args.served_model_name == 'mymodel'
+    args = parser_with_config.parse_args(
+        [
+            "serve",
+            "--config",
+            cli_config_file_with_model,
+        ]
+    )
+    assert args.model == "config-model"
+    assert args.served_model_name == "mymodel"
 
     # Test no model specified anywhere raises error
     with pytest.raises(ValueError, match="No model specified!"):
-        parser_with_config.parse_args(['serve', '--config', cli_config_file])
+        parser_with_config.parse_args(["serve", "--config", cli_config_file])
 
     # Test using --model option raises error
     # with pytest.raises(
@@ -833,47 +830,52 @@ def test_model_specification(parser_with_config, cli_config_file,
     # Test using --model option back-compatibility
     # (when back-compatibility ends, the above test should be uncommented
     # and the below test should be removed)
-    args = parser_with_config.parse_args([
-        'serve',
-        '--tensor-parallel-size',
-        '2',
-        '--model',
-        'my-model',
-        '--trust-remote-code',
-        '--port',
-        '8001',
-    ])
+    args = parser_with_config.parse_args(
+        [
+            "serve",
+            "--tensor-parallel-size",
+            "2",
+            "--model",
+            "my-model",
+            "--trust-remote-code",
+            "--port",
+            "8001",
+        ]
+    )
     assert args.model is None
     assert args.tensor_parallel_size == 2
     assert args.trust_remote_code is True
     assert args.port == 8001
 
-    args = parser_with_config.parse_args([
-        'serve',
-        '--tensor-parallel-size=2',
-        '--model=my-model',
-        '--trust-remote-code',
-        '--port=8001',
-    ])
+    args = parser_with_config.parse_args(
+        [
+            "serve",
+            "--tensor-parallel-size=2",
+            "--model=my-model",
+            "--trust-remote-code",
+            "--port=8001",
+        ]
+    )
     assert args.model is None
     assert args.tensor_parallel_size == 2
     assert args.trust_remote_code is True
     assert args.port == 8001
 
     # Test other config values are preserved
-    args = parser_with_config.parse_args([
-        'serve',
-        'cli-model',
-        '--config',
-        cli_config_file_with_model,
-    ])
+    args = parser_with_config.parse_args(
+        [
+            "serve",
+            "cli-model",
+            "--config",
+            cli_config_file_with_model,
+        ]
+    )
     assert args.tensor_parallel_size == 2
     assert args.trust_remote_code is True
     assert args.port == 12312
 
 
-@pytest.mark.parametrize("input", [(), ("abc", ), (None, ),
-                                   (None, bool, [1, 2, 3])])
+@pytest.mark.parametrize("input", [(), ("abc",), (None,), (None, bool, [1, 2, 3])])
 def test_sha256(input: tuple):
     digest = sha256(input)
     assert digest is not None
@@ -887,7 +889,7 @@ def test_sha256(input: tuple):
     assert digest == sha256(input)
 
     # hashing different input, returns different value
-    assert digest != sha256(input + (1, ))
+    assert digest != sha256(input + (1,))
 
 
 @pytest.mark.parametrize(
@@ -897,7 +899,8 @@ def test_sha256(input: tuple):
         ("tcp://127.0.0.1:5555", ("tcp", "127.0.0.1", "5555")),
         ("tcp://[::1]:5555", ("tcp", "::1", "5555")),  # IPv6 address
         ("inproc://some_identifier", ("inproc", "some_identifier", "")),
-    ])
+    ],
+)
 def test_split_zmq_path(path, expected):
     assert split_zmq_path(path) == expected
 
@@ -909,7 +912,8 @@ def test_split_zmq_path(path, expected):
         "tcp://127.0.0.1",  # Missing port
         "tcp://[::1]",  # Missing port for IPv6
         "tcp://:5555",  # Missing host
-    ])
+    ],
+)
 def test_split_zmq_path_invalid(invalid_path):
     with pytest.raises(ValueError):
         split_zmq_path(invalid_path)
@@ -931,8 +935,9 @@ def test_make_zmq_socket_ipv6():
     zsock: zmq.Socket = make_zmq_socket(ctx, ipv6_path, socket_type)
 
     # Verify that the IPV6 option is set
-    assert zsock.getsockopt(
-        zmq.IPV6) == 1, "IPV6 option should be enabled for IPv6 addresses"
+    assert zsock.getsockopt(zmq.IPV6) == 1, (
+        "IPV6 option should be enabled for IPv6 addresses"
+    )
 
     # Clean up
     zsock.close()
@@ -1019,15 +1024,14 @@ def test_convert_ids_list_to_tokens():
     tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen2.5-1.5B-Instruct")
     token_ids = tokenizer.encode("Hello, world!")
     # token_ids = [9707, 11, 1879, 0]
-    assert tokenizer.convert_ids_to_tokens(token_ids) == [
-        'Hello', ',', 'Ġworld', '!'
-    ]
+    assert tokenizer.convert_ids_to_tokens(token_ids) == ["Hello", ",", "Ġworld", "!"]
     tokens = convert_ids_list_to_tokens(tokenizer, token_ids)
-    assert tokens == ['Hello', ',', ' world', '!']
+    assert tokens == ["Hello", ",", " world", "!"]
 
 
 def test_current_stream_multithread():
     import threading
+
     if not torch.cuda.is_available():
         pytest.skip("CUDA not available")
 
@@ -1046,13 +1050,18 @@ def child_thread_func():
     child_thread.start()
 
     try:
-        assert thread_stream_ready.wait(
-            timeout=5), "Child thread failed to enter stream context in time"
+        assert thread_stream_ready.wait(timeout=5), (
+            "Child thread failed to enter stream context in time"
+        )
 
         main_current_stream = current_stream()
 
-        assert main_current_stream != child_stream, "Main thread's current_stream was contaminated by child thread"
-        assert main_current_stream == main_default_stream, "Main thread's current_stream is not the default stream"
+        assert main_current_stream != child_stream, (
+            "Main thread's current_stream was contaminated by child thread"
+        )
+        assert main_current_stream == main_default_stream, (
+            "Main thread's current_stream is not the default stream"
+        )
 
         # Notify child thread it can exit
         thread_can_exit.set()
@@ -1070,7 +1079,7 @@ def test_load_config_file(tmp_path):
         "enable-logging": True,
         "list-arg": ["item1", "item2"],
         "port": 12323,
-        "tensor-parallel-size": 4
+        "tensor-parallel-size": 4,
     }
 
     # Write the configuration data to a temporary YAML file
diff --git a/tests/v1/core/test_kv_cache_utils.py b/tests/v1/core/test_kv_cache_utils.py
index 53c71609cfc1..aed00a60aeb4 100644
--- a/tests/v1/core/test_kv_cache_utils.py
+++ b/tests/v1/core/test_kv_cache_utils.py
@@ -16,9 +16,6 @@
 from vllm.sampling_params import SamplingParams
 from vllm.utils import GiB_bytes, sha256, sha256_cbor
 from vllm.v1.core.kv_cache_manager import KVCacheManager
-
-# disable yapf here as it formats differently than isort such that both fail
-# yapf: disable
 from vllm.v1.core.kv_cache_utils import (
     BlockHash,
     FreeKVCacheBlockQueue,
@@ -48,8 +45,6 @@
 from vllm.v1.metrics.stats import PrefixCacheStats
 from vllm.v1.request import Request
 
-# yapf: enable
-
 pytestmark = pytest.mark.cpu_test
 
 
diff --git a/tests/v1/logits_processors/test_correctness.py b/tests/v1/logits_processors/test_correctness.py
index 5baa11af024b..34997b7e7a43 100644
--- a/tests/v1/logits_processors/test_correctness.py
+++ b/tests/v1/logits_processors/test_correctness.py
@@ -22,8 +22,6 @@
 from vllm.platforms import current_platform
 from vllm.sampling_params import SamplingParams
 from vllm.utils import is_pin_memory_available
-
-# yapf: disable
 from vllm.v1.sample.logits_processor import (
     BatchUpdate,
     BatchUpdateBuilder,
@@ -34,8 +32,6 @@
     MoveDirectionality,
     build_logitsprocs,
 )
-
-# yapf: enable
 from vllm.v1.sample.metadata import SamplingMetadata
 
 PIN_MEMORY_AVAILABLE = is_pin_memory_available()
diff --git a/tests/v1/logits_processors/test_custom_offline.py b/tests/v1/logits_processors/test_custom_offline.py
index 6ee474270c69..b83129858b8f 100644
--- a/tests/v1/logits_processors/test_custom_offline.py
+++ b/tests/v1/logits_processors/test_custom_offline.py
@@ -7,8 +7,6 @@
 import pytest
 
 from tests.utils import create_new_process_for_each_test
-
-# yapf: disable
 from tests.v1.logits_processors.utils import (
     DUMMY_LOGITPROC_ARG,
     DUMMY_LOGITPROC_FQCN,
@@ -24,8 +22,6 @@
     prompts,
 )
 from tests.v1.logits_processors.utils import entry_points as fake_entry_points
-
-# yapf: enable
 from vllm import LLM, SamplingParams
 from vllm.v1.sample.logits_processor import (
     STR_POOLING_REJECTS_LOGITSPROCS,
diff --git a/tests/v1/logits_processors/test_custom_online.py b/tests/v1/logits_processors/test_custom_online.py
index dbec35a50894..9c5b4ff0ba17 100644
--- a/tests/v1/logits_processors/test_custom_online.py
+++ b/tests/v1/logits_processors/test_custom_online.py
@@ -11,8 +11,6 @@
 import pytest_asyncio
 
 from tests.utils import RemoteOpenAIServerCustom, create_new_process_for_each_test
-
-# yapf: disable
 from tests.v1.logits_processors.utils import (
     DUMMY_LOGITPROC_ARG,
     DUMMY_LOGITPROC_FQCN,
@@ -25,8 +23,6 @@
 )
 from tests.v1.logits_processors.utils import entry_points as fake_entry_points
 
-# yapf: enable
-
 
 def _server_with_logitproc_entrypoint(
     env_dict: Optional[dict[str, str]],
diff --git a/vllm/distributed/kv_transfer/kv_connector/factory.py b/vllm/distributed/kv_transfer/kv_connector/factory.py
index 329263afba5a..395a4e20e0ba 100644
--- a/vllm/distributed/kv_transfer/kv_connector/factory.py
+++ b/vllm/distributed/kv_transfer/kv_connector/factory.py
@@ -4,7 +4,6 @@
 import importlib
 from typing import TYPE_CHECKING, Callable
 
-# yapf: disable
 import vllm.envs as envs
 from vllm.distributed.kv_transfer.kv_connector.base import (
     KVConnectorBase,
@@ -13,8 +12,6 @@
 from vllm.distributed.kv_transfer.kv_connector.v1 import KVConnectorRole
 from vllm.logger import init_logger
 
-# yapf: enable
-
 if TYPE_CHECKING:
     from vllm.config import VllmConfig
     from vllm.config.kv_transfer import KVTransferConfig
diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index e971ef273756..d7ba70381dff 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -1,7 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-# yapf: disable
 import argparse
 import copy
 import dataclasses
@@ -88,8 +87,6 @@
 from vllm.utils import FlexibleArgumentParser, GiB_bytes, get_ip, is_in_ray_actor
 from vllm.v1.sample.logits_processor import LogitsProcessor
 
-# yapf: enable
-
 if TYPE_CHECKING:
     from vllm.executor.executor_base import ExecutorBase
     from vllm.model_executor.layers.quantization import QuantizationMethods
diff --git a/vllm/entrypoints/chat_utils.py b/vllm/entrypoints/chat_utils.py
index cfba1ae6e5c0..dfa1977c37a3 100644
--- a/vllm/entrypoints/chat_utils.py
+++ b/vllm/entrypoints/chat_utils.py
@@ -17,9 +17,6 @@
 import jinja2.parser
 import jinja2.sandbox
 import transformers.utils.chat_template_utils as hf_chat_utils
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from openai.types.chat import (
     ChatCompletionAssistantMessageParam,
     ChatCompletionContentPartImageParam,
@@ -40,8 +37,6 @@
 from openai_harmony import Message as OpenAIHarmonyMessage
 from PIL import Image
 from pydantic import BaseModel, ConfigDict, TypeAdapter
-
-# yapf: enable
 from transformers import PreTrainedTokenizer, PreTrainedTokenizerFast, ProcessorMixin
 
 # pydantic needs the TypedDict from typing_extensions
@@ -52,11 +47,7 @@
 from vllm.model_executor.models import SupportsMultiModal
 from vllm.multimodal import MULTIMODAL_REGISTRY, MultiModalDataDict, MultiModalUUIDDict
 from vllm.multimodal.utils import MediaConnector
-
-# yapf: disable
 from vllm.transformers_utils.chat_templates import get_chat_template_fallback_path
-
-# yapf: enable
 from vllm.transformers_utils.processor import cached_get_processor
 from vllm.transformers_utils.tokenizer import AnyTokenizer, MistralTokenizer
 from vllm.utils import random_uuid, supports_kw
@@ -317,11 +308,7 @@ def _is_var_or_elems_access(
     ):
         return _is_var_or_elems_access(node.node, varname, key)
 
-    # yapf: disable
-    return (
-        _is_attr_access(node, varname, key) if key
-        else _is_var_access(node, varname)
-    ) # yapf: enable
+    return _is_attr_access(node, varname, key) if key else _is_var_access(node, varname)
 
 
 def _iter_nodes_assign_var_or_elems(root: jinja2.nodes.Node, varname: str):
diff --git a/vllm/entrypoints/llm.py b/vllm/entrypoints/llm.py
index 944de70c1d63..0702e40441e4 100644
--- a/vllm/entrypoints/llm.py
+++ b/vllm/entrypoints/llm.py
@@ -39,9 +39,6 @@
     parse_chat_messages,
     resolve_chat_template_content_format,
 )
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.entrypoints.score_utils import (
     ScoreContentPartParam,
     ScoreMultiModalParam,
@@ -50,8 +47,6 @@
     compress_token_type_ids,
     get_score_prompt,
 )
-
-# yapf: enable
 from vllm.entrypoints.utils import _validate_truncation_size, log_non_default_args
 from vllm.inputs import (
     DataPrompt,
diff --git a/vllm/entrypoints/openai/api_server.py b/vllm/entrypoints/openai/api_server.py
index 70717b761d06..889326dee749 100644
--- a/vllm/entrypoints/openai/api_server.py
+++ b/vllm/entrypoints/openai/api_server.py
@@ -49,9 +49,6 @@
 from vllm.entrypoints.launcher import serve_http
 from vllm.entrypoints.logger import RequestLogger
 from vllm.entrypoints.openai.cli_args import make_arg_parser, validate_parsed_serve_args
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.entrypoints.openai.protocol import (
     ChatCompletionRequest,
     ChatCompletionResponse,
@@ -84,8 +81,6 @@
     TranslationResponse,
     UnloadLoRAAdapterRequest,
 )
-
-# yapf: enable
 from vllm.entrypoints.openai.serving_chat import OpenAIServingChat
 from vllm.entrypoints.openai.serving_classification import ServingClassification
 from vllm.entrypoints.openai.serving_completion import OpenAIServingCompletion
diff --git a/vllm/entrypoints/openai/protocol.py b/vllm/entrypoints/openai/protocol.py
index a4c3f5378227..221b88d79616 100644
--- a/vllm/entrypoints/openai/protocol.py
+++ b/vllm/entrypoints/openai/protocol.py
@@ -11,8 +11,6 @@
 import regex as re
 import torch
 from fastapi import HTTPException, UploadFile
-
-# yapf: disable
 from openai.types.chat.chat_completion_audio import (
     ChatCompletionAudio as OpenAIChatCompletionAudio,
 )
@@ -46,8 +44,6 @@
 from openai.types.responses import (
     ResponseInProgressEvent as OpenAIResponseInProgressEvent,
 )
-
-# yapf: enable
 from openai.types.responses.response_reasoning_item import (
     Content as ResponseReasoningTextContent,
 )
diff --git a/vllm/entrypoints/openai/run_batch.py b/vllm/entrypoints/openai/run_batch.py
index 466757468abd..030ce3ce0844 100644
--- a/vllm/entrypoints/openai/run_batch.py
+++ b/vllm/entrypoints/openai/run_batch.py
@@ -18,8 +18,6 @@
 from vllm.engine.arg_utils import AsyncEngineArgs, optional_type
 from vllm.engine.protocol import EngineClient
 from vllm.entrypoints.logger import RequestLogger
-
-# yapf: disable
 from vllm.entrypoints.openai.protocol import (
     BatchRequestInput,
     BatchRequestOutput,
@@ -30,8 +28,6 @@
     RerankResponse,
     ScoreResponse,
 )
-
-# yapf: enable
 from vllm.entrypoints.openai.serving_chat import OpenAIServingChat
 from vllm.entrypoints.openai.serving_embedding import OpenAIServingEmbedding
 from vllm.entrypoints.openai.serving_models import BaseModelPath, OpenAIServingModels
diff --git a/vllm/entrypoints/openai/serving_chat.py b/vllm/entrypoints/openai/serving_chat.py
index ec1787d38546..12dd474936db 100644
--- a/vllm/entrypoints/openai/serving_chat.py
+++ b/vllm/entrypoints/openai/serving_chat.py
@@ -1733,13 +1733,15 @@ def _should_check_for_unstreamed_tool_arg_tokens(
         is a tool call with arguments.
         """
 
-        # yapf: disable
         return bool(
             # if there is a delta message that includes tool calls which
             # include a function that has arguments
             output.finish_reason is not None
-            and self.enable_auto_tools and self.tool_parser and delta_message
-            and delta_message.tool_calls and delta_message.tool_calls[0]
+            and self.enable_auto_tools
+            and self.tool_parser
+            and delta_message
+            and delta_message.tool_calls
+            and delta_message.tool_calls[0]
             and delta_message.tool_calls[0].function
             and delta_message.tool_calls[0].function.arguments is not None
         )
diff --git a/vllm/entrypoints/openai/serving_classification.py b/vllm/entrypoints/openai/serving_classification.py
index b37eb5c68a70..25e167e9bb0c 100644
--- a/vllm/entrypoints/openai/serving_classification.py
+++ b/vllm/entrypoints/openai/serving_classification.py
@@ -18,8 +18,6 @@
     ErrorResponse,
     UsageInfo,
 )
-
-# yapf: enable
 from vllm.entrypoints.openai.serving_engine import (
     ClassificationServeContext,
     OpenAIServing,
diff --git a/vllm/entrypoints/openai/serving_completion.py b/vllm/entrypoints/openai/serving_completion.py
index 8cd460657932..ce0a6c0e23e5 100644
--- a/vllm/entrypoints/openai/serving_completion.py
+++ b/vllm/entrypoints/openai/serving_completion.py
@@ -13,9 +13,6 @@
 from vllm.config import ModelConfig
 from vllm.engine.protocol import EngineClient
 from vllm.entrypoints.logger import RequestLogger
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.entrypoints.openai.protocol import (
     CompletionLogProbs,
     CompletionRequest,
@@ -29,8 +26,6 @@
     UsageInfo,
 )
 from vllm.entrypoints.openai.serving_engine import OpenAIServing, clamp_prompt_logprobs
-
-# yapf: enable
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
 from vllm.entrypoints.renderer import RenderConfig
 from vllm.entrypoints.utils import get_max_tokens
diff --git a/vllm/entrypoints/openai/serving_embedding.py b/vllm/entrypoints/openai/serving_embedding.py
index 93c1f2548c31..5517ab2802e3 100644
--- a/vllm/entrypoints/openai/serving_embedding.py
+++ b/vllm/entrypoints/openai/serving_embedding.py
@@ -14,9 +14,6 @@
 from vllm.engine.protocol import EngineClient
 from vllm.entrypoints.chat_utils import ChatTemplateContentFormatOption
 from vllm.entrypoints.logger import RequestLogger
-
-# yapf conflicts with isort for this docstring
-# yapf: disable
 from vllm.entrypoints.openai.protocol import (
     EmbeddingChatRequest,
     EmbeddingCompletionRequest,
@@ -32,8 +29,6 @@
     ServeContext,
     TextTokensPrompt,
 )
-
-# yapf: enable
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
 from vllm.entrypoints.renderer import RenderConfig
 from vllm.inputs.data import TokensPrompt as EngineTokensPrompt
diff --git a/vllm/entrypoints/openai/serving_engine.py b/vllm/entrypoints/openai/serving_engine.py
index 27b9cac970d1..596ae3fcdc3c 100644
--- a/vllm/entrypoints/openai/serving_engine.py
+++ b/vllm/entrypoints/openai/serving_engine.py
@@ -28,9 +28,6 @@
 import vllm.envs as envs
 from vllm.config import ModelConfig
 from vllm.engine.protocol import EngineClient
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.entrypoints.chat_utils import (
     ChatCompletionMessageParam,
     ChatTemplateContentFormatOption,
@@ -72,8 +69,6 @@
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
 from vllm.entrypoints.openai.tool_parsers import ToolParser
 from vllm.entrypoints.renderer import BaseRenderer, CompletionRenderer, RenderConfig
-
-# yapf: enable
 from vllm.inputs.data import PromptType
 from vllm.inputs.data import TokensPrompt as EngineTokensPrompt
 from vllm.inputs.parse import PromptComponents, get_prompt_components
diff --git a/vllm/entrypoints/openai/serving_pooling.py b/vllm/entrypoints/openai/serving_pooling.py
index 457d6064325b..390b388e303c 100644
--- a/vllm/entrypoints/openai/serving_pooling.py
+++ b/vllm/entrypoints/openai/serving_pooling.py
@@ -17,8 +17,6 @@
 from vllm.engine.protocol import EngineClient
 from vllm.entrypoints.chat_utils import ChatTemplateContentFormatOption
 from vllm.entrypoints.logger import RequestLogger
-
-# yapf: disable
 from vllm.entrypoints.openai.protocol import (
     ErrorResponse,
     IOProcessorRequest,
@@ -30,8 +28,6 @@
     PoolingResponseData,
     UsageInfo,
 )
-
-# yapf: enable
 from vllm.entrypoints.openai.serving_engine import OpenAIServing
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
 from vllm.entrypoints.renderer import RenderConfig
diff --git a/vllm/entrypoints/openai/serving_responses.py b/vllm/entrypoints/openai/serving_responses.py
index 385ef41411a3..1b25fd4eb27e 100644
--- a/vllm/entrypoints/openai/serving_responses.py
+++ b/vllm/entrypoints/openai/serving_responses.py
@@ -14,9 +14,6 @@
 
 import jinja2
 from fastapi import Request
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from openai.types.responses import (
     ResponseCodeInterpreterCallCodeDeltaEvent,
     ResponseCodeInterpreterCallCodeDoneEvent,
@@ -46,8 +43,6 @@
     response_text_delta_event,
 )
 from openai.types.responses.response_output_text import Logprob, LogprobTopLogprob
-
-# yapf: enable
 from openai.types.responses.response_reasoning_item import (
     Content as ResponseReasoningTextContent,
 )
@@ -78,9 +73,6 @@
     render_for_completion,
 )
 from vllm.entrypoints.logger import RequestLogger
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.entrypoints.openai.protocol import (
     DeltaMessage,
     ErrorResponse,
@@ -97,8 +89,6 @@
     ResponseUsage,
     StreamingResponsesResponse,
 )
-
-# yapf: enable
 from vllm.entrypoints.openai.serving_engine import OpenAIServing
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
 from vllm.entrypoints.tool_server import ToolServer
diff --git a/vllm/entrypoints/openai/serving_score.py b/vllm/entrypoints/openai/serving_score.py
index 393fd2c2e0b1..234a31421828 100644
--- a/vllm/entrypoints/openai/serving_score.py
+++ b/vllm/entrypoints/openai/serving_score.py
@@ -24,9 +24,6 @@
 )
 from vllm.entrypoints.openai.serving_engine import OpenAIServing
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.entrypoints.score_utils import (
     ScoreContentPartParam,
     ScoreMultiModalParam,
@@ -35,8 +32,6 @@
     compress_token_type_ids,
     get_score_prompt,
 )
-
-# yapf: enable
 from vllm.entrypoints.utils import _validate_truncation_size
 from vllm.inputs.data import TokensPrompt
 from vllm.logger import init_logger
diff --git a/vllm/entrypoints/openai/serving_tokenization.py b/vllm/entrypoints/openai/serving_tokenization.py
index fd6c6be9ee2a..7b192dcd6c86 100644
--- a/vllm/entrypoints/openai/serving_tokenization.py
+++ b/vllm/entrypoints/openai/serving_tokenization.py
@@ -10,9 +10,6 @@
 from vllm.engine.protocol import EngineClient
 from vllm.entrypoints.chat_utils import ChatTemplateContentFormatOption
 from vllm.entrypoints.logger import RequestLogger
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.entrypoints.openai.protocol import (
     DetokenizeRequest,
     DetokenizeResponse,
@@ -22,8 +19,6 @@
     TokenizeResponse,
     TokenizerInfoResponse,
 )
-
-# yapf: enable
 from vllm.entrypoints.openai.serving_engine import OpenAIServing
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
 from vllm.entrypoints.renderer import RenderConfig
diff --git a/vllm/executor/ray_distributed_executor.py b/vllm/executor/ray_distributed_executor.py
index c4783edda700..be124f76431e 100644
--- a/vllm/executor/ray_distributed_executor.py
+++ b/vllm/executor/ray_distributed_executor.py
@@ -11,7 +11,7 @@
 import msgspec
 
 import vllm.envs as envs
-from vllm.executor.executor_base import DistributedExecutorBase  # yapf: disable
+from vllm.executor.executor_base import DistributedExecutorBase
 from vllm.executor.msgspec_utils import encode_hook
 from vllm.executor.ray_utils import RayWorkerWrapper, initialize_ray_cluster, ray
 from vllm.logger import init_logger
diff --git a/vllm/lora/layers/base_linear.py b/vllm/lora/layers/base_linear.py
index 0b5a4a73a94a..d2f017c19ccd 100644
--- a/vllm/lora/layers/base_linear.py
+++ b/vllm/lora/layers/base_linear.py
@@ -8,8 +8,6 @@
 
 from vllm.config.lora import LoRAConfig
 from vllm.distributed.utils import divide
-
-# yapf: disable
 from vllm.model_executor.layers.linear import (
     ColumnParallelLinear,
     LinearBase,
@@ -23,7 +21,6 @@
 
 
 class BaseLinearLayerWithLoRA(BaseLayerWithLoRA):
-
     def __init__(self, base_layer: LinearBase):
         super().__init__()
         self.base_layer = base_layer
@@ -50,16 +47,20 @@ def create_lora_weights(
             lora_b_out_size = self.output_size
 
         elif isinstance(self.base_layer, ColumnParallelLinear):
-            lora_a_out_size = (lora_config.max_lora_rank if
-                               not lora_config.fully_sharded_loras else divide(
-                                   lora_config.max_lora_rank, self.tp_size))
+            lora_a_out_size = (
+                lora_config.max_lora_rank
+                if not lora_config.fully_sharded_loras
+                else divide(lora_config.max_lora_rank, self.tp_size)
+            )
             lora_b_out_size = self.output_size
 
         elif isinstance(self.base_layer, RowParallelLinear):
             lora_a_out_size = lora_config.max_lora_rank
-            lora_b_out_size = (self.output_size if
-                               not lora_config.fully_sharded_loras else divide(
-                                   self.output_size, self.tp_size))
+            lora_b_out_size = (
+                self.output_size
+                if not lora_config.fully_sharded_loras
+                else divide(self.output_size, self.tp_size)
+            )
         else:
             raise NotImplementedError
 
@@ -71,7 +72,9 @@ def create_lora_weights(
                 self.input_size,
                 dtype=lora_config.lora_dtype,
                 device=self.device,
-            ) for _ in range(self.n_slices))
+            )
+            for _ in range(self.n_slices)
+        )
         self.lora_b_stacked = tuple(
             torch.zeros(
                 max_loras,
@@ -80,7 +83,9 @@ def create_lora_weights(
                 lora_config.max_lora_rank,
                 dtype=lora_config.lora_dtype,
                 device=self.device,
-            ) for _ in range(self.n_slices))
+            )
+            for _ in range(self.n_slices)
+        )
         if lora_config.bias_enabled:
             lora_bias_out_size = lora_b_out_size
             self.lora_bias_stacked = tuple(
@@ -90,8 +95,10 @@ def create_lora_weights(
                     lora_bias_out_size,
                     dtype=lora_config.lora_dtype,
                     device=self.device,
-                ) for _ in range(self.n_slices))
-        self.output_slices = (self.lora_b_stacked[0].shape[2], )
+                )
+                for _ in range(self.n_slices)
+            )
+        self.output_slices = (self.lora_b_stacked[0].shape[2],)
 
     def reset_lora(self, index: int):
         for s_index in range(self.n_slices):
@@ -99,8 +106,9 @@ def reset_lora(self, index: int):
             self.lora_b_stacked[s_index][index] = 0
             if self.lora_config.bias_enabled:
                 # Make mypy happy
-                self.lora_bias_stacked = cast(tuple[torch.Tensor, ...],
-                                              self.lora_bias_stacked)
+                self.lora_bias_stacked = cast(
+                    tuple[torch.Tensor, ...], self.lora_bias_stacked
+                )
                 self.lora_bias_stacked[s_index][index] = 0
 
     def set_lora(
@@ -115,8 +123,9 @@ def set_lora(
         # MergedColumnParallelLinearWithLoRA, all other linear LoRA layers
         # store weights in a tuple of size 1. These two layers will
         # override this function.
-        assert (len(self.lora_a_stacked) == len(self.lora_b_stacked) ==
-                self.n_slices == 1)
+        assert (
+            len(self.lora_a_stacked) == len(self.lora_b_stacked) == self.n_slices == 1
+        )
 
         self.reset_lora(index)
         if self.tp_size > 1:
@@ -125,23 +134,24 @@ def set_lora(
             if lora_bias is not None:
                 lora_bias = self.slice_bias(lora_bias)
 
-        self.lora_a_stacked[0][index,
-                               0, :lora_a.shape[0], :lora_a.shape[1]].copy_(
-                                   lora_a, non_blocking=True)
-        self.lora_b_stacked[0][index,
-                               0, :lora_b.shape[0], :lora_b.shape[1]].copy_(
-                                   lora_b, non_blocking=True)
+        self.lora_a_stacked[0][index, 0, : lora_a.shape[0], : lora_a.shape[1]].copy_(
+            lora_a, non_blocking=True
+        )
+        self.lora_b_stacked[0][index, 0, : lora_b.shape[0], : lora_b.shape[1]].copy_(
+            lora_b, non_blocking=True
+        )
         if lora_bias is not None:
-
-            self.lora_bias_stacked = cast(tuple[torch.Tensor, ...],
-                                          self.lora_bias_stacked)
+            self.lora_bias_stacked = cast(
+                tuple[torch.Tensor, ...], self.lora_bias_stacked
+            )
             assert len(self.lora_bias_stacked)
-            self.lora_bias_stacked[0][index, 0, :lora_bias.shape[0]].copy_(
-                lora_bias, non_blocking=True)
+            self.lora_bias_stacked[0][index, 0, : lora_bias.shape[0]].copy_(
+                lora_bias, non_blocking=True
+            )
 
-    def apply(self,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self, x: torch.Tensor, bias: Optional[torch.Tensor] = None
+    ) -> torch.Tensor:
         output = self.base_layer.quant_method.apply(self.base_layer, x, bias)
 
         # In transformers backend, x and output have extra batch dimension like
@@ -151,10 +161,15 @@ def apply(self,
             output = output.flatten(0, 1)
             x = x.flatten(0, 1)
 
-        lora_output: Optional[
-            torch.Tensor] = self.punica_wrapper.add_lora_linear(
-                output, x, self.lora_a_stacked, self.lora_b_stacked,
-                self.lora_bias_stacked, 1.0, self.output_slices)
+        lora_output: Optional[torch.Tensor] = self.punica_wrapper.add_lora_linear(
+            output,
+            x,
+            self.lora_a_stacked,
+            self.lora_b_stacked,
+            self.lora_bias_stacked,
+            1.0,
+            self.output_slices,
+        )
         if not current_platform.can_update_inplace():
             output = lora_output
 
@@ -162,7 +177,6 @@ def apply(self,
 
     @property
     def weight(self) -> torch.Tensor:
-
         # unquantizedLinear
         if hasattr(self.base_layer, "weight"):
             return self.base_layer.weight
diff --git a/vllm/lora/layers/row_parallel_linear.py b/vllm/lora/layers/row_parallel_linear.py
index 4e6b65ca97e4..738371f22a36 100644
--- a/vllm/lora/layers/row_parallel_linear.py
+++ b/vllm/lora/layers/row_parallel_linear.py
@@ -12,8 +12,6 @@
     split_tensor_along_last_dim,
     tensor_model_parallel_all_reduce,
 )
-
-# yapf: disable
 from vllm.model_executor.layers.linear import RowParallelLinear
 from vllm.platforms import current_platform
 
@@ -22,7 +20,6 @@
 
 
 class RowParallelLinearWithLoRA(BaseLinearLayerWithLoRA):
-
     def __init__(self, base_layer: RowParallelLinear) -> None:
         super().__init__(base_layer)
 
@@ -33,11 +30,10 @@ def __init__(self, base_layer: RowParallelLinear) -> None:
         self.n_slices = 1
 
     def slice_lora_a(self, lora_a: torch.Tensor) -> torch.Tensor:
-
         shard_size = self.input_size
         start_idx = self.tp_rank * shard_size
         end_idx = (self.tp_rank + 1) * shard_size
-        lora_a = lora_a[:,start_idx:end_idx]
+        lora_a = lora_a[:, start_idx:end_idx]
         return lora_a
 
     def slice_lora_b(self, lora_b: torch.Tensor) -> torch.Tensor:
@@ -66,7 +62,8 @@ def forward(
         else:
             # TODO: simplify code below
             splitted_input = split_tensor_along_last_dim(
-                input_, num_partitions=self.tp_size)
+                input_, num_partitions=self.tp_size
+            )
             input_parallel = splitted_input[self.tp_rank].contiguous()
 
         # Matrix multiply.
@@ -77,8 +74,11 @@ def forward(
             output_ = output_parallel
 
         if not self.base_layer.skip_bias_add:
-            output = (output_ + self.base_layer.bias
-                      if self.base_layer.bias is not None else output_)
+            output = (
+                output_ + self.base_layer.bias
+                if self.base_layer.bias is not None
+                else output_
+            )
             output_bias = None
         else:
             output = output_
@@ -101,11 +101,11 @@ def can_replace_layer(
         return type(source_layer) is RowParallelLinear
 
 
-
 # The following layer is based on the tensor parallelism strategy given in
 # Y. Sheng et al., S-LoRA: Serving Thousands of Concurrent LoRA Adapters. 2023,
 # https://arxiv.org/abs/2311.03285.
 
+
 class RowParallelLinearWithShardedLoRA(RowParallelLinearWithLoRA):
     """
     Differs from RowParallelLinearWithLoRA by slicing the
@@ -120,28 +120,26 @@ def slice_lora_b(self, lora_b: torch.Tensor) -> torch.Tensor:
         shard_size = self.lora_b_stacked[0].shape[2]
         start_idx = self.tp_rank * shard_size
         end_idx = (self.tp_rank + 1) * shard_size
-        lora_b = lora_b[ start_idx:end_idx,:]
+        lora_b = lora_b[start_idx:end_idx, :]
         return lora_b
 
     def slice_bias(self, bias: torch.Tensor) -> torch.Tensor:
         if bias is None:
             return bias
-        self.lora_bias_stacked = cast(tuple[torch.Tensor, ...],
-                                      self.lora_bias_stacked)
+        self.lora_bias_stacked = cast(tuple[torch.Tensor, ...], self.lora_bias_stacked)
         shard_size = self.lora_bias_stacked[0].shape[2]
         start_idx = self.tp_rank * shard_size
         end_idx = (self.tp_rank + 1) * shard_size
         bias = bias[start_idx:end_idx]
         return bias
 
-    def apply(self,
-              x: torch.Tensor,
-              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
+    def apply(
+        self, x: torch.Tensor, bias: Optional[torch.Tensor] = None
+    ) -> torch.Tensor:
         output = self.base_layer.quant_method.apply(self.base_layer, x)
 
         x = x.view(-1, x.shape[-1])
-        output, out_orig_shape = output.view(-1,
-                                             output.shape[-1]), output.shape
+        output, out_orig_shape = output.view(-1, output.shape[-1]), output.shape
         buffer = torch.zeros(
             (self.n_slices, x.shape[0], self.lora_a_stacked[0].shape[2]),
             dtype=torch.float32,
@@ -149,10 +147,11 @@ def apply(self,
         )
 
         shrunk_buffer: Optional[torch.Tensor] = self.punica_wrapper.add_shrink(
-            buffer, x, self.lora_a_stacked, 1.0)
+            buffer, x, self.lora_a_stacked, 1.0
+        )
         if not current_platform.can_update_inplace():
             buffer = shrunk_buffer
-        if self.tp_size>1:
+        if self.tp_size > 1:
             buffer = tensor_model_parallel_all_reduce(buffer)
 
         # following S-LoRA, allows the fusing of all_gather and all_reduce
diff --git a/vllm/lora/utils.py b/vllm/lora/utils.py
index eeff72ef1aaa..5e55d44ce8d9 100644
--- a/vllm/lora/utils.py
+++ b/vllm/lora/utils.py
@@ -19,8 +19,6 @@
 from vllm.logger import init_logger
 
 # being imported for _all_lora_classes below
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.lora.layers import (
     BaseLayerWithLoRA,
     ColumnParallelLinearWithLoRA,
@@ -39,8 +37,6 @@
 )
 from vllm.model_executor.layers.linear import LinearBase
 
-# yapf: enable
-
 if TYPE_CHECKING:
     from vllm.model_executor.layers.logits_processor import LogitsProcessor
     from vllm.model_executor.layers.vocab_parallel_embedding import ParallelLMHead
diff --git a/vllm/model_executor/layers/fused_moe/fused_moe.py b/vllm/model_executor/layers/fused_moe/fused_moe.py
index d2bc339d2b44..fb294384c8b4 100644
--- a/vllm/model_executor/layers/fused_moe/fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_moe.py
@@ -14,8 +14,6 @@
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm import _custom_ops as ops
 from vllm.logger import init_logger
-
-# yapf: disable
 from vllm.model_executor.layers.fused_moe.config import (
     FUSED_MOE_UNQUANTIZED_CONFIG,
     FusedMoEQuantConfig,
@@ -25,8 +23,6 @@
     _valid_cutlass_block_scaled_grouped_gemm,
     run_cutlass_block_scaled_fused_experts,
 )
-
-# yapf: enable
 from vllm.model_executor.layers.fused_moe.deep_gemm_moe import (
     _valid_deep_gemm,
     deep_gemm_moe_fp8,
diff --git a/vllm/model_executor/layers/fused_moe/layer.py b/vllm/model_executor/layers/fused_moe/layer.py
index ec517b63d529..1df28a4f7ce4 100644
--- a/vllm/model_executor/layers/fused_moe/layer.py
+++ b/vllm/model_executor/layers/fused_moe/layer.py
@@ -24,8 +24,6 @@
 from vllm.forward_context import ForwardContext, get_forward_context
 from vllm.logger import init_logger
 from vllm.model_executor.custom_op import CustomOp
-
-# yapf: disable
 from vllm.model_executor.layers.fused_moe.config import (
     FUSED_MOE_UNQUANTIZED_CONFIG,
     FusedMoEConfig,
@@ -34,8 +32,6 @@
     biased_moe_quant_config,
 )
 from vllm.model_executor.layers.fused_moe.fused_moe import zero_experts_compute_triton
-
-# yapf: enable
 from vllm.model_executor.layers.fused_moe.modular_kernel import (
     FusedMoEActivationFormat,
     FusedMoEModularKernel,
diff --git a/vllm/model_executor/layers/fused_moe/modular_kernel.py b/vllm/model_executor/layers/fused_moe/modular_kernel.py
index e5c65309ec0b..109f06843928 100644
--- a/vllm/model_executor/layers/fused_moe/modular_kernel.py
+++ b/vllm/model_executor/layers/fused_moe/modular_kernel.py
@@ -10,7 +10,7 @@
 
 import vllm.envs as envs
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
-from vllm.model_executor.layers.fused_moe.utils import (  # yapf: disable
+from vllm.model_executor.layers.fused_moe.utils import (
     _resize_cache,
     count_expert_num_tokens,
 )
diff --git a/vllm/model_executor/layers/linear.py b/vllm/model_executor/layers/linear.py
index e9c4afba1396..3881ba12faa0 100644
--- a/vllm/model_executor/layers/linear.py
+++ b/vllm/model_executor/layers/linear.py
@@ -24,8 +24,6 @@
     QuantizeMethodBase,
 )
 from vllm.model_executor.layers.utils import dispatch_unquantized_gemm
-
-# yapf: disable
 from vllm.model_executor.parameter import (
     BasevLLMParameter,
     BlockQuantScaleParameter,
@@ -35,8 +33,6 @@
     PerTensorScaleParameter,
     RowvLLMParameter,
 )
-
-# yapf: enable
 from vllm.model_executor.utils import set_weight_attrs
 from vllm.platforms import current_platform
 from vllm.utils import GiB_bytes
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a8_fp8.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a8_fp8.py
index 92469657409f..59d99e1e1c90 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a8_fp8.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a8_fp8.py
@@ -17,17 +17,12 @@
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
     marlin_repeat_scales_on_all_ranks,
 )
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.model_executor.parameter import (
     BasevLLMParameter,
     ChannelQuantScaleParameter,
     GroupQuantScaleParameter,
     PackedvLLMParameter,
 )
-
-# yapf: enable
 from vllm.scalar_type import scalar_types
 
 logger = init_logger(__name__)
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_wNa16.py b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_wNa16.py
index 7ca5760df858..188fc15fd948 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_wNa16.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_wNa16.py
@@ -17,9 +17,6 @@
 from vllm.model_executor.layers.quantization.utils.marlin_utils import (
     marlin_repeat_scales_on_all_ranks,
 )
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.model_executor.parameter import (
     BasevLLMParameter,
     ChannelQuantScaleParameter,
@@ -28,8 +25,6 @@
     PackedvLLMParameter,
     RowvLLMParameter,
 )
-
-# yapf: enable
 from vllm.scalar_type import scalar_types
 
 logger = init_logger(__name__)
diff --git a/vllm/model_executor/model_loader/bitsandbytes_loader.py b/vllm/model_executor/model_loader/bitsandbytes_loader.py
index 13250bd39492..b296a390f1b2 100644
--- a/vllm/model_executor/model_loader/bitsandbytes_loader.py
+++ b/vllm/model_executor/model_loader/bitsandbytes_loader.py
@@ -22,8 +22,6 @@
     get_tensor_model_parallel_rank,
     get_tensor_model_parallel_world_size,
 )
-
-# yapf: enable
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.layers.linear import (
@@ -51,8 +49,6 @@
 )
 from vllm.platforms import current_platform
 
-# yapf conflicts with isort for this block
-
 logger = init_logger(__name__)
 
 
diff --git a/vllm/model_executor/models/aria.py b/vllm/model_executor/models/aria.py
index cefdbf4fefe3..7db118ca0745 100644
--- a/vllm/model_executor/models/aria.py
+++ b/vllm/model_executor/models/aria.py
@@ -39,13 +39,10 @@
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-# yapf: disable
 from .idefics2_vision_model import Idefics2VisionConfig
 from .idefics2_vision_model import (
     Idefics2VisionTransformer as Idefics3VisionTransformer,
 )
-
-# yapf: enable
 from .interfaces import MultiModalEmbeddings, SupportsMultiModal, SupportsQuant
 from .llama import LlamaDecoderLayer, LlamaMLP, LlamaModel
 from .utils import (
diff --git a/vllm/model_executor/models/gemma3_mm.py b/vllm/model_executor/models/gemma3_mm.py
index 5ae78cc92159..95b0b0dab5a1 100644
--- a/vllm/model_executor/models/gemma3_mm.py
+++ b/vllm/model_executor/models/gemma3_mm.py
@@ -22,8 +22,6 @@
     MultiModalKwargsItems,
 )
 from vllm.multimodal.parse import ImageProcessorItems, ImageSize, MultiModalDataItems
-
-# yapf: disable
 from vllm.multimodal.processing import (
     BaseMultiModalProcessor,
     BaseProcessingInfo,
@@ -35,8 +33,6 @@
     PromptUpdateDetails,
     replace_token_matches,
 )
-
-# yapf: enable
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
diff --git a/vllm/model_executor/models/gemma3n_mm.py b/vllm/model_executor/models/gemma3n_mm.py
index c9647fb55c99..bef087b7a0b6 100644
--- a/vllm/model_executor/models/gemma3n_mm.py
+++ b/vllm/model_executor/models/gemma3n_mm.py
@@ -6,14 +6,16 @@
 import numpy as np
 import torch
 
-# yapf: disable
 from torch import nn
 from transformers import AutoModel, BatchFeature
-from transformers.models.gemma3n import (Gemma3nAudioConfig,
-                                         Gemma3nAudioFeatureExtractor,
-                                         Gemma3nConfig, Gemma3nProcessor,
-                                         Gemma3nTextConfig,
-                                         Gemma3nVisionConfig)
+from transformers.models.gemma3n import (
+    Gemma3nAudioConfig,
+    Gemma3nAudioFeatureExtractor,
+    Gemma3nConfig,
+    Gemma3nProcessor,
+    Gemma3nTextConfig,
+    Gemma3nVisionConfig,
+)
 from transformers.models.siglip import SiglipImageProcessorFast
 
 from vllm.config import ModelConfig, SpeechToTextConfig, VllmConfig
@@ -22,25 +24,32 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.layernorm import RMSNorm
 from vllm.model_executor.layers.linear import RowParallelLinear
-from vllm.model_executor.layers.vocab_parallel_embedding import (
-    VocabParallelEmbedding)
+from vllm.model_executor.layers.vocab_parallel_embedding import VocabParallelEmbedding
 from vllm.model_executor.models.gemma3n import Gemma3nForCausalLM
 from vllm.model_executor.models.module_mapping import MultiModelKeys
 from vllm.model_executor.models.whisper import ISO639_1_SUPPORTED_LANGS
 from vllm.multimodal import MULTIMODAL_REGISTRY
-from vllm.multimodal.inputs import (MultiModalDataDict, MultiModalFieldConfig,
-                                    MultiModalKwargsItems)
-from vllm.multimodal.parse import (ImageProcessorItems, MultiModalDataItems,
-                                   MultiModalDataParser)
-from vllm.multimodal.processing import (BaseMultiModalProcessor,
-                                        BaseProcessingInfo,
-                                        MultiModalPromptUpdates,
-                                        MultiModalPromptUpdatesApplyResult,
-                                        PlaceholderFeaturesInfo,
-                                        PromptReplacement, PromptUpdate,
-                                        PromptUpdateDetails,
-                                        replace_token_matches)
-# yapf: enable
+from vllm.multimodal.inputs import (
+    MultiModalDataDict,
+    MultiModalFieldConfig,
+    MultiModalKwargsItems,
+)
+from vllm.multimodal.parse import (
+    ImageProcessorItems,
+    MultiModalDataItems,
+    MultiModalDataParser,
+)
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    BaseProcessingInfo,
+    MultiModalPromptUpdates,
+    MultiModalPromptUpdatesApplyResult,
+    PlaceholderFeaturesInfo,
+    PromptReplacement,
+    PromptUpdate,
+    PromptUpdateDetails,
+    replace_token_matches,
+)
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
diff --git a/vllm/model_executor/models/idefics3.py b/vllm/model_executor/models/idefics3.py
index ec18507465e7..effdbdc1ac38 100644
--- a/vllm/model_executor/models/idefics3.py
+++ b/vllm/model_executor/models/idefics3.py
@@ -43,9 +43,6 @@
     MultiModalKwargsItems,
 )
 from vllm.multimodal.parse import ImageProcessorItems, ImageSize
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.multimodal.processing import (
     BaseMultiModalProcessor,
     BaseProcessingInfo,
@@ -54,18 +51,13 @@
     PromptUpdate,
     PromptUpdateDetails,
 )
-
-# yapf: enable
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
-# yapf: disable
 from .idefics2_vision_model import (
     Idefics2VisionTransformer as Idefics3VisionTransformer,
 )
-
-# yapf: enable
 from .interfaces import MultiModalEmbeddings, SupportsLoRA, SupportsMultiModal
 from .llama import LlamaModel
 from .utils import AutoWeightsLoader, maybe_prefix
diff --git a/vllm/model_executor/models/phi3v.py b/vllm/model_executor/models/phi3v.py
index eb5a0f555a3c..d972604db9cd 100644
--- a/vllm/model_executor/models/phi3v.py
+++ b/vllm/model_executor/models/phi3v.py
@@ -45,9 +45,6 @@
     ImageSize,
     MultiModalDataItems,
 )
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.multimodal.processing import (
     BaseMultiModalProcessor,
     BaseProcessingInfo,
@@ -57,8 +54,6 @@
     PromptUpdate,
     ResolvedPromptUpdate,
 )
-
-# yapf: enable
 from vllm.multimodal.profiling import BaseDummyInputsBuilder
 from vllm.sequence import IntermediateTensors
 from vllm.utils import is_list_of
diff --git a/vllm/model_executor/models/qwen2_5_vl.py b/vllm/model_executor/models/qwen2_5_vl.py
index 7cd091e64a94..1520495dfdc0 100644
--- a/vllm/model_executor/models/qwen2_5_vl.py
+++ b/vllm/model_executor/models/qwen2_5_vl.py
@@ -52,16 +52,12 @@
 from vllm.logger import init_logger
 from vllm.model_executor.layers.activation import get_act_and_mul_fn
 from vllm.model_executor.layers.layernorm import RMSNorm
-
-# yapf: disable
 from vllm.model_executor.layers.linear import (
     ColumnParallelLinear,
     MergedColumnParallelLinear,
     QKVParallelLinear,
     RowParallelLinear,
 )
-
-# yapf: enable
 from vllm.model_executor.layers.quantization import QuantizationConfig
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models.module_mapping import MultiModelKeys
diff --git a/vllm/model_executor/models/qwen3_next.py b/vllm/model_executor/models/qwen3_next.py
index 34ffa9b69894..0d81cbbc0308 100644
--- a/vllm/model_executor/models/qwen3_next.py
+++ b/vllm/model_executor/models/qwen3_next.py
@@ -37,12 +37,7 @@
     fused_recurrent_gated_delta_rule,
 )
 from vllm.model_executor.layers.fused_moe import FusedMoE
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.model_executor.layers.layernorm import GemmaRMSNorm as Qwen3NextRMSNorm
-
-# yapf: enable
 from vllm.model_executor.layers.linear import (
     ColumnParallelLinear,
     QKVParallelLinear,
diff --git a/vllm/model_executor/models/registry.py b/vllm/model_executor/models/registry.py
index d96730346727..b640bdd1deeb 100644
--- a/vllm/model_executor/models/registry.py
+++ b/vllm/model_executor/models/registry.py
@@ -54,7 +54,6 @@
 
 logger = init_logger(__name__)
 
-# yapf: disable
 _TEXT_GENERATION_MODELS = {
     # [Decoder-only]
     "ApertusForCausalLM": ("apertus", "ApertusForCausalLM"),
@@ -106,8 +105,8 @@
     "GPTNeoXForCausalLM": ("gpt_neox", "GPTNeoXForCausalLM"),
     "GraniteForCausalLM": ("granite", "GraniteForCausalLM"),
     "GraniteMoeForCausalLM": ("granitemoe", "GraniteMoeForCausalLM"),
-    "GraniteMoeHybridForCausalLM": ("granitemoehybrid", "GraniteMoeHybridForCausalLM"),   # noqa: E501
-    "GraniteMoeSharedForCausalLM": ("granitemoeshared", "GraniteMoeSharedForCausalLM"),   # noqa: E501
+    "GraniteMoeHybridForCausalLM": ("granitemoehybrid", "GraniteMoeHybridForCausalLM"),  # noqa: E501
+    "GraniteMoeSharedForCausalLM": ("granitemoeshared", "GraniteMoeSharedForCausalLM"),  # noqa: E501
     "GritLM": ("gritlm", "GritLM"),
     "Grok1ModelForCausalLM": ("grok1", "Grok1ForCausalLM"),
     "HunYuanMoEV1ForCausalLM": ("hunyuan_v1", "HunYuanMoEV1ForCausalLM"),
@@ -127,7 +126,7 @@
     "LongcatFlashForCausalLM": ("longcat_flash", "LongcatFlashForCausalLM"),
     "MambaForCausalLM": ("mamba", "MambaForCausalLM"),
     "FalconMambaForCausalLM": ("mamba", "MambaForCausalLM"),
-    "FalconH1ForCausalLM":("falcon_h1", "FalconH1ForCausalLM"),
+    "FalconH1ForCausalLM": ("falcon_h1", "FalconH1ForCausalLM"),
     "Mamba2ForCausalLM": ("mamba2", "Mamba2ForCausalLM"),
     "MiniCPMForCausalLM": ("minicpm", "MiniCPMForCausalLM"),
     "MiniCPM3ForCausalLM": ("minicpm3", "MiniCPM3ForCausalLM"),
@@ -184,7 +183,8 @@
     "LlamaModel": ("llama", "LlamaForCausalLM"),
     **{
         # Multiple models share the same architecture, so we include them all
-        k: (mod, arch) for k, (mod, arch) in _TEXT_GENERATION_MODELS.items()
+        k: (mod, arch)
+        for k, (mod, arch) in _TEXT_GENERATION_MODELS.items()
         if arch == "LlamaForCausalLM"
     },
     "MistralModel": ("llama", "LlamaForCausalLM"),
@@ -201,7 +201,10 @@
     "XLMRobertaModel": ("roberta", "RobertaEmbeddingModel"),
     # [Multimodal]
     "CLIPModel": ("clip", "CLIPEmbeddingModel"),
-    "LlavaNextForConditionalGeneration": ("llava_next", "LlavaNextForConditionalGeneration"),  # noqa: E501
+    "LlavaNextForConditionalGeneration": (
+        "llava_next",
+        "LlavaNextForConditionalGeneration",
+    ),  # noqa: E501
     "Phi3VForCausalLM": ("phi3v", "Phi3VForCausalLM"),
     "Qwen2VLForConditionalGeneration": ("qwen2_vl", "Qwen2VLForConditionalGeneration"),  # noqa: E501
     # Technically Terratorch models work on images, both in
@@ -214,79 +217,150 @@
 _CROSS_ENCODER_MODELS = {
     "BertForSequenceClassification": ("bert", "BertForSequenceClassification"),
     "BertForTokenClassification": ("bert", "BertForTokenClassification"),
-    "GteNewForSequenceClassification": ("bert_with_rope",
-                                        "GteNewForSequenceClassification"),
-    "ModernBertForSequenceClassification": ("modernbert",
-                                            "ModernBertForSequenceClassification"),
-    "RobertaForSequenceClassification": ("roberta",
-                                         "RobertaForSequenceClassification"),
-    "XLMRobertaForSequenceClassification": ("roberta",
-                                            "RobertaForSequenceClassification"),
+    "GteNewForSequenceClassification": (
+        "bert_with_rope",
+        "GteNewForSequenceClassification",
+    ),
+    "ModernBertForSequenceClassification": (
+        "modernbert",
+        "ModernBertForSequenceClassification",
+    ),
+    "RobertaForSequenceClassification": ("roberta", "RobertaForSequenceClassification"),
+    "XLMRobertaForSequenceClassification": (
+        "roberta",
+        "RobertaForSequenceClassification",
+    ),
     # [Auto-converted (see adapters.py)]
-    "JinaVLForRanking": ("jina_vl", "JinaVLForSequenceClassification"), # noqa: E501,
+    "JinaVLForRanking": ("jina_vl", "JinaVLForSequenceClassification"),  # noqa: E501,
 }
 
 _MULTIMODAL_MODELS = {
     # [Decoder-only]
     "AriaForConditionalGeneration": ("aria", "AriaForConditionalGeneration"),
-    "AyaVisionForConditionalGeneration": ("aya_vision", "AyaVisionForConditionalGeneration"),  # noqa: E501
+    "AyaVisionForConditionalGeneration": (
+        "aya_vision",
+        "AyaVisionForConditionalGeneration",
+    ),  # noqa: E501
     "Blip2ForConditionalGeneration": ("blip2", "Blip2ForConditionalGeneration"),
-    "ChameleonForConditionalGeneration": ("chameleon", "ChameleonForConditionalGeneration"),  # noqa: E501
-    "Cohere2VisionForConditionalGeneration": ("cohere2_vision", "Cohere2VisionForConditionalGeneration"),  # noqa: E501
+    "ChameleonForConditionalGeneration": (
+        "chameleon",
+        "ChameleonForConditionalGeneration",
+    ),  # noqa: E501
+    "Cohere2VisionForConditionalGeneration": (
+        "cohere2_vision",
+        "Cohere2VisionForConditionalGeneration",
+    ),  # noqa: E501
     "DeepseekVLV2ForCausalLM": ("deepseek_vl2", "DeepseekVLV2ForCausalLM"),
     "DotsOCRForCausalLM": ("dots_ocr", "DotsOCRForCausalLM"),
-    "Ernie4_5_VLMoeForConditionalGeneration": ("ernie45_vl", "Ernie4_5_VLMoeForConditionalGeneration"),  # noqa: E501
+    "Ernie4_5_VLMoeForConditionalGeneration": (
+        "ernie45_vl",
+        "Ernie4_5_VLMoeForConditionalGeneration",
+    ),  # noqa: E501
     "FuyuForCausalLM": ("fuyu", "FuyuForCausalLM"),
     "Gemma3ForConditionalGeneration": ("gemma3_mm", "Gemma3ForConditionalGeneration"),  # noqa: E501
-    "Gemma3nForConditionalGeneration": ("gemma3n_mm", "Gemma3nForConditionalGeneration"),    # noqa: E501
+    "Gemma3nForConditionalGeneration": (
+        "gemma3n_mm",
+        "Gemma3nForConditionalGeneration",
+    ),  # noqa: E501
     "GLM4VForCausalLM": ("glm4v", "GLM4VForCausalLM"),
     "Glm4vForConditionalGeneration": ("glm4_1v", "Glm4vForConditionalGeneration"),  # noqa: E501
     "Glm4vMoeForConditionalGeneration": ("glm4_1v", "Glm4vMoeForConditionalGeneration"),  # noqa: E501
-    "GraniteSpeechForConditionalGeneration": ("granite_speech", "GraniteSpeechForConditionalGeneration"),  # noqa: E501
+    "GraniteSpeechForConditionalGeneration": (
+        "granite_speech",
+        "GraniteSpeechForConditionalGeneration",
+    ),  # noqa: E501
     "H2OVLChatModel": ("h2ovl", "H2OVLChatModel"),
     "InternVLChatModel": ("internvl", "InternVLChatModel"),
     "NemotronH_Nano_VL_V2": ("nano_nemotron_vl", "NemotronH_Nano_VL_V2"),
-    "InternS1ForConditionalGeneration": ("interns1", "InternS1ForConditionalGeneration"),  # noqa: E501
-    "InternVLForConditionalGeneration": ("interns1", "InternS1ForConditionalGeneration"),  # noqa: E501
-    "Idefics3ForConditionalGeneration":("idefics3","Idefics3ForConditionalGeneration"),
-    "SmolVLMForConditionalGeneration": ("smolvlm","SmolVLMForConditionalGeneration"),  # noqa: E501
+    "InternS1ForConditionalGeneration": (
+        "interns1",
+        "InternS1ForConditionalGeneration",
+    ),  # noqa: E501
+    "InternVLForConditionalGeneration": (
+        "interns1",
+        "InternS1ForConditionalGeneration",
+    ),  # noqa: E501
+    "Idefics3ForConditionalGeneration": (
+        "idefics3",
+        "Idefics3ForConditionalGeneration",
+    ),
+    "SmolVLMForConditionalGeneration": ("smolvlm", "SmolVLMForConditionalGeneration"),  # noqa: E501
     "KeyeForConditionalGeneration": ("keye", "KeyeForConditionalGeneration"),
-    "KeyeVL1_5ForConditionalGeneration": ("keye_vl1_5", "KeyeVL1_5ForConditionalGeneration"), # noqa: E501
+    "KeyeVL1_5ForConditionalGeneration": (
+        "keye_vl1_5",
+        "KeyeVL1_5ForConditionalGeneration",
+    ),  # noqa: E501
     "RForConditionalGeneration": ("rvl", "RForConditionalGeneration"),
     "KimiVLForConditionalGeneration": ("kimi_vl", "KimiVLForConditionalGeneration"),  # noqa: E501
     "Llama_Nemotron_Nano_VL": ("nemotron_vl", "LlamaNemotronVLChatModel"),
     "Llama4ForConditionalGeneration": ("mllama4", "Llama4ForConditionalGeneration"),  # noqa: E501
     "LlavaForConditionalGeneration": ("llava", "LlavaForConditionalGeneration"),
-    "LlavaNextForConditionalGeneration": ("llava_next", "LlavaNextForConditionalGeneration"),  # noqa: E501
-    "LlavaNextVideoForConditionalGeneration": ("llava_next_video", "LlavaNextVideoForConditionalGeneration"),  # noqa: E501
-    "LlavaOnevisionForConditionalGeneration": ("llava_onevision", "LlavaOnevisionForConditionalGeneration"),  # noqa: E501
+    "LlavaNextForConditionalGeneration": (
+        "llava_next",
+        "LlavaNextForConditionalGeneration",
+    ),  # noqa: E501
+    "LlavaNextVideoForConditionalGeneration": (
+        "llava_next_video",
+        "LlavaNextVideoForConditionalGeneration",
+    ),  # noqa: E501
+    "LlavaOnevisionForConditionalGeneration": (
+        "llava_onevision",
+        "LlavaOnevisionForConditionalGeneration",
+    ),  # noqa: E501
     "MantisForConditionalGeneration": ("llava", "MantisForConditionalGeneration"),  # noqa: E501
     "MiDashengLMModel": ("midashenglm", "MiDashengLMModel"),
-    "MiniMaxVL01ForConditionalGeneration": ("minimax_vl_01", "MiniMaxVL01ForConditionalGeneration"),  # noqa: E501
+    "MiniMaxVL01ForConditionalGeneration": (
+        "minimax_vl_01",
+        "MiniMaxVL01ForConditionalGeneration",
+    ),  # noqa: E501
     "MiniCPMO": ("minicpmo", "MiniCPMO"),
     "MiniCPMV": ("minicpmv", "MiniCPMV"),
-    "Mistral3ForConditionalGeneration": ("mistral3", "Mistral3ForConditionalGeneration"),  # noqa: E501
+    "Mistral3ForConditionalGeneration": (
+        "mistral3",
+        "Mistral3ForConditionalGeneration",
+    ),  # noqa: E501
     "MolmoForCausalLM": ("molmo", "MolmoForCausalLM"),
     "NVLM_D": ("nvlm_d", "NVLM_D_Model"),
     "Ovis": ("ovis", "Ovis"),
     "Ovis2_5": ("ovis2_5", "Ovis2_5"),
-    "PaliGemmaForConditionalGeneration": ("paligemma", "PaliGemmaForConditionalGeneration"),  # noqa: E501
+    "PaliGemmaForConditionalGeneration": (
+        "paligemma",
+        "PaliGemmaForConditionalGeneration",
+    ),  # noqa: E501
     "Phi3VForCausalLM": ("phi3v", "Phi3VForCausalLM"),
     "Phi4MMForCausalLM": ("phi4mm", "Phi4MMForCausalLM"),
     "Phi4MultimodalForCausalLM": ("phi4_multimodal", "Phi4MultimodalForCausalLM"),  # noqa: E501
     "PixtralForConditionalGeneration": ("pixtral", "PixtralForConditionalGeneration"),  # noqa: E501
     "QwenVLForConditionalGeneration": ("qwen_vl", "QwenVLForConditionalGeneration"),  # noqa: E501
     "Qwen2VLForConditionalGeneration": ("qwen2_vl", "Qwen2VLForConditionalGeneration"),  # noqa: E501
-    "Qwen2_5_VLForConditionalGeneration": ("qwen2_5_vl", "Qwen2_5_VLForConditionalGeneration"),  # noqa: E501
-    "Qwen2AudioForConditionalGeneration": ("qwen2_audio", "Qwen2AudioForConditionalGeneration"),  # noqa: E501
-    "Qwen2_5OmniModel": ("qwen2_5_omni_thinker", "Qwen2_5OmniThinkerForConditionalGeneration"),  # noqa: E501
-    "Qwen2_5OmniForConditionalGeneration": ("qwen2_5_omni_thinker", "Qwen2_5OmniThinkerForConditionalGeneration"),  # noqa: E501
+    "Qwen2_5_VLForConditionalGeneration": (
+        "qwen2_5_vl",
+        "Qwen2_5_VLForConditionalGeneration",
+    ),  # noqa: E501
+    "Qwen2AudioForConditionalGeneration": (
+        "qwen2_audio",
+        "Qwen2AudioForConditionalGeneration",
+    ),  # noqa: E501
+    "Qwen2_5OmniModel": (
+        "qwen2_5_omni_thinker",
+        "Qwen2_5OmniThinkerForConditionalGeneration",
+    ),  # noqa: E501
+    "Qwen2_5OmniForConditionalGeneration": (
+        "qwen2_5_omni_thinker",
+        "Qwen2_5OmniThinkerForConditionalGeneration",
+    ),  # noqa: E501
     "Qwen3VLForConditionalGeneration": ("qwen3_vl", "Qwen3VLForConditionalGeneration"),  # noqa: E501
-    "Qwen3VLMoeForConditionalGeneration": ("qwen3_vl_moe", "Qwen3VLMoeForConditionalGeneration"),  # noqa: E501
+    "Qwen3VLMoeForConditionalGeneration": (
+        "qwen3_vl_moe",
+        "Qwen3VLMoeForConditionalGeneration",
+    ),  # noqa: E501
     "SkyworkR1VChatModel": ("skyworkr1v", "SkyworkR1VChatModel"),
     "Step3VLForConditionalGeneration": ("step3_vl", "Step3VLForConditionalGeneration"),  # noqa: E501
     "TarsierForConditionalGeneration": ("tarsier", "TarsierForConditionalGeneration"),  # noqa: E501
-    "Tarsier2ForConditionalGeneration": ("qwen2_vl", "Tarsier2ForConditionalGeneration"),  # noqa: E501
+    "Tarsier2ForConditionalGeneration": (
+        "qwen2_vl",
+        "Tarsier2ForConditionalGeneration",
+    ),  # noqa: E501
     "UltravoxModel": ("ultravox", "UltravoxModel"),
     "VoxtralForConditionalGeneration": ("voxtral", "VoxtralForConditionalGeneration"),  # noqa: E501
     # [Encoder-decoder]
@@ -324,13 +398,27 @@
     "TransformersForCausalLM": ("transformers", "TransformersForCausalLM"),
     "TransformersForMultimodalLM": ("transformers", "TransformersForMultimodalLM"),  # noqa: E501
     "TransformersMoEForCausalLM": ("transformers_moe", "TransformersMoEForCausalLM"),  # noqa: E501
-    "TransformersMoEForMultimodalLM": ("transformers_moe", "TransformersMoEForMultimodalLM"),  # noqa: E501
-    "TransformersEmbeddingModel": ("transformers_pooling", "TransformersEmbeddingModel"),  # noqa: E501
-    "TransformersForSequenceClassification": ("transformers_pooling", "TransformersForSequenceClassification"),  # noqa: E501
-    "TransformersMoEForSequenceClassification": ("transformers_pooling", "TransformersMoEForSequenceClassification"),  # noqa: E501
-    "TransformersMoEEmbeddingModel": ("transformers_pooling", "TransformersMoEEmbeddingModel"),  # noqa: E501
+    "TransformersMoEForMultimodalLM": (
+        "transformers_moe",
+        "TransformersMoEForMultimodalLM",
+    ),  # noqa: E501
+    "TransformersEmbeddingModel": (
+        "transformers_pooling",
+        "TransformersEmbeddingModel",
+    ),  # noqa: E501
+    "TransformersForSequenceClassification": (
+        "transformers_pooling",
+        "TransformersForSequenceClassification",
+    ),  # noqa: E501
+    "TransformersMoEForSequenceClassification": (
+        "transformers_pooling",
+        "TransformersMoEForSequenceClassification",
+    ),  # noqa: E501
+    "TransformersMoEEmbeddingModel": (
+        "transformers_pooling",
+        "TransformersMoEEmbeddingModel",
+    ),  # noqa: E501
 }
-# yapf: enable
 
 _VLLM_MODELS = {
     **_TEXT_GENERATION_MODELS,
diff --git a/vllm/model_executor/models/smolvlm.py b/vllm/model_executor/models/smolvlm.py
index d0018f95dfd2..1800330c8235 100644
--- a/vllm/model_executor/models/smolvlm.py
+++ b/vllm/model_executor/models/smolvlm.py
@@ -8,13 +8,10 @@
 from vllm.config import VllmConfig
 from vllm.multimodal import MULTIMODAL_REGISTRY
 
-# yapf: disable
 from .idefics3 import Idefics3DummyInputsBuilder as SmolVLMDummyInputsBuilder
 from .idefics3 import Idefics3ForConditionalGeneration, Idefics3ProcessingInfo
 from .idefics3 import Idefics3MultiModalProcessor as SmolVLMMultiModalProcessor
 
-# yapf: enable
-
 
 class SmolVLMProcessingInfo(Idefics3ProcessingInfo):
     def get_hf_processor(self, **kwargs: object) -> SmolVLMProcessor:
diff --git a/vllm/model_executor/models/voxtral.py b/vllm/model_executor/models/voxtral.py
index 6d15a3a02507..8525bdd5bfad 100644
--- a/vllm/model_executor/models/voxtral.py
+++ b/vllm/model_executor/models/voxtral.py
@@ -32,11 +32,7 @@
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.models import SupportsPP
 from vllm.model_executor.models.module_mapping import MultiModelKeys
-
-# yapf: disable
 from vllm.model_executor.models.whisper import WhisperEncoder
-
-# yapf: enable
 from vllm.multimodal import MULTIMODAL_REGISTRY
 from vllm.multimodal.inputs import (
     MultiModalDataDict,
diff --git a/vllm/transformers_utils/chat_templates/registry.py b/vllm/transformers_utils/chat_templates/registry.py
index dadbb727e194..b8d0cd8d2f20 100644
--- a/vllm/transformers_utils/chat_templates/registry.py
+++ b/vllm/transformers_utils/chat_templates/registry.py
@@ -28,7 +28,6 @@ def _get_minicpmv_chat_template_fallback(tokenizer_name_or_path: str) -> Optiona
     return CHAT_TEMPLATES_DIR / "template_chatml.jinja"
 
 
-# yapf: disable
 _MODEL_TYPE_TO_CHAT_TEMPLATE_FALLBACK: dict[str, ChatTemplatePath] = {
     "blip-2": CHAT_TEMPLATES_DIR / "template_blip2.jinja",
     "clip": CHAT_TEMPLATES_DIR / "template_basic.jinja",
@@ -39,7 +38,6 @@ def _get_minicpmv_chat_template_fallback(tokenizer_name_or_path: str) -> Optiona
     "paligemma": CHAT_TEMPLATES_DIR / "template_basic.jinja",
     "qwen": _get_qwen_chat_template_fallback,
 }
-# yapf: enable
 
 
 def register_chat_template_fallback_path(
diff --git a/vllm/transformers_utils/configs/arctic.py b/vllm/transformers_utils/configs/arctic.py
index a789b93b5edf..1707e15285c8 100644
--- a/vllm/transformers_utils/configs/arctic.py
+++ b/vllm/transformers_utils/configs/arctic.py
@@ -1,12 +1,11 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-# yapf: disable
 # ruff: noqa: E501
 # coding=utf-8
 # Copied from
 # https://huggingface.co/Snowflake/snowflake-arctic-instruct/blob/main/configuration_arctic.py
-""" Arctic model configuration"""
+"""Arctic model configuration"""
 
 from dataclasses import asdict, dataclass
 from typing import Any
diff --git a/vllm/transformers_utils/configs/nemotron_vl.py b/vllm/transformers_utils/configs/nemotron_vl.py
index 6a642f26b82a..6f98fbafbed5 100644
--- a/vllm/transformers_utils/configs/nemotron_vl.py
+++ b/vllm/transformers_utils/configs/nemotron_vl.py
@@ -1,7 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-# yapf: disable
 # ruff: noqa: E501
 # Adapted from
 # https://huggingface.co/nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1/blob/main/configuration.py
@@ -16,7 +15,7 @@
 
 
 class Nemotron_Nano_VL_Config(PretrainedConfig):
-    model_type = 'Llama_Nemotron_Nano_VL'
+    model_type = "Llama_Nemotron_Nano_VL"
     is_composition = True
 
     def __init__(
@@ -26,17 +25,22 @@ def __init__(
         force_image_size=None,
         downsample_ratio=0.5,
         template=None,
-        ps_version='v1',
+        ps_version="v1",
         image_tag_type="internvl",
         projector_hidden_size=4096,
         vit_hidden_size=1280,
-        **kwargs
+        **kwargs,
     ):
         super().__init__(**kwargs)
 
         if vision_config is not None:
-            assert "auto_map" in vision_config and "AutoConfig" in vision_config["auto_map"]
-            vision_auto_config = get_class_from_dynamic_module(*vision_config["auto_map"]["AutoConfig"].split("--")[::-1])
+            assert (
+                "auto_map" in vision_config
+                and "AutoConfig" in vision_config["auto_map"]
+            )
+            vision_auto_config = get_class_from_dynamic_module(
+                *vision_config["auto_map"]["AutoConfig"].split("--")[::-1]
+            )
             self.vision_config = vision_auto_config(**vision_config)
         else:
             self.vision_config = PretrainedConfig()
@@ -51,6 +55,6 @@ def __init__(
         self.downsample_ratio = downsample_ratio
         self.template = template  # TODO move out of here and into the tokenizer
         self.ps_version = ps_version  # Pixel shuffle version
-        self.image_tag_type = image_tag_type # TODO: into the tokenizer too?
+        self.image_tag_type = image_tag_type  # TODO: into the tokenizer too?
         self.projector_hidden_size = projector_hidden_size
         self.vit_hidden_size = vit_hidden_size
diff --git a/vllm/transformers_utils/configs/ovis.py b/vllm/transformers_utils/configs/ovis.py
index 550f5e15dbcc..404fa700a26c 100644
--- a/vllm/transformers_utils/configs/ovis.py
+++ b/vllm/transformers_utils/configs/ovis.py
@@ -1,7 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-# yapf: disable
 # ruff: noqa: E501
 # adapted from https://huggingface.co/AIDC-AI/Ovis2-1B/blob/main/configuration_aimv2.py
 # and https://huggingface.co/AIDC-AI/Ovis2-1B/blob/main/configuration_ovis.py
@@ -70,34 +69,37 @@ def __init__(
 #                     Visual Tokenizer Configuration
 # ----------------------------------------------------------------------
 class BaseVisualTokenizerConfig(PretrainedConfig):
-
-    def __init__(self,
-                 vocab_size=16384,
-                 tokenize_function="softmax",
-                 tau=1.0,
-                 depths=None,
-                 drop_cls_token=False,
-                 backbone_config: Optional[Union[PretrainedConfig,
-                                                 dict]] = None,
-                 hidden_stride: int = 1,
-                 **kwargs):
+    def __init__(
+        self,
+        vocab_size=16384,
+        tokenize_function="softmax",
+        tau=1.0,
+        depths=None,
+        drop_cls_token=False,
+        backbone_config: Optional[Union[PretrainedConfig, dict]] = None,
+        hidden_stride: int = 1,
+        **kwargs,
+    ):
         super().__init__(**kwargs)
         self.vocab_size = vocab_size
         self.tokenize_function = tokenize_function
         self.tau = tau
         if isinstance(depths, str):
-            depths = [int(x) for x in depths.split('|')]
+            depths = [int(x) for x in depths.split("|")]
         self.depths = depths
         self.backbone_kwargs = dict[str, Any]()
         self.drop_cls_token = drop_cls_token
         if backbone_config is not None:
-            assert isinstance(backbone_config, (PretrainedConfig, dict)), \
+            assert isinstance(backbone_config, (PretrainedConfig, dict)), (
                 f"expect `backbone_config` to be instance of PretrainedConfig or dict, but got {type(backbone_config)} type"
+            )
             if not isinstance(backbone_config, PretrainedConfig):
-                model_type = backbone_config['model_type']
+                model_type = backbone_config["model_type"]
                 if model_type != "aimv2":
-                    backbone_config.pop('model_type')
-                    backbone_config = AutoConfig.for_model(model_type, **backbone_config)
+                    backbone_config.pop("model_type")
+                    backbone_config = AutoConfig.for_model(
+                        model_type, **backbone_config
+                    )
                 else:
                     backbone_config = AIMv2Config(**backbone_config)
         self.backbone_config = backbone_config
@@ -113,7 +115,7 @@ def __init__(self, **kwargs):
             self.drop_cls_token = False
         if self.depths:
             assert len(self.depths) == 1
-            self.backbone_kwargs['num_hidden_layers'] = self.depths[0]
+            self.backbone_kwargs["num_hidden_layers"] = self.depths[0]
 
 
 class SiglipVisualTokenizerConfig(BaseVisualTokenizerConfig):
@@ -125,7 +127,7 @@ def __init__(self, **kwargs):
             self.drop_cls_token = False
         if self.depths:
             assert len(self.depths) == 1
-            self.backbone_kwargs['num_hidden_layers'] = self.depths[0]
+            self.backbone_kwargs["num_hidden_layers"] = self.depths[0]
 
 
 AutoConfig.register("siglip_visual_tokenizer", SiglipVisualTokenizerConfig)
@@ -138,35 +140,39 @@ def __init__(self, **kwargs):
 class OvisConfig(PretrainedConfig):
     model_type = "ovis"
 
-    def __init__(self,
-                 llm_config: Optional[Union[PretrainedConfig, dict]] = None,
-                 visual_tokenizer_config: Optional[Union[PretrainedConfig,
-                                                         dict]] = None,
-                 multimodal_max_length=8192,
-                 hidden_size=None,
-                 conversation_formatter_class=None,
-                 llm_attn_implementation=None,
-                 disable_tie_weight=False,
-                 **kwargs):
+    def __init__(
+        self,
+        llm_config: Optional[Union[PretrainedConfig, dict]] = None,
+        visual_tokenizer_config: Optional[Union[PretrainedConfig, dict]] = None,
+        multimodal_max_length=8192,
+        hidden_size=None,
+        conversation_formatter_class=None,
+        llm_attn_implementation=None,
+        disable_tie_weight=False,
+        **kwargs,
+    ):
         super().__init__(**kwargs)
         if llm_config is not None:
-            assert isinstance(llm_config, (PretrainedConfig, dict)), \
+            assert isinstance(llm_config, (PretrainedConfig, dict)), (
                 f"expect `llm_config` to be instance of PretrainedConfig or dict, but got {type(llm_config)} type"
+            )
             if not isinstance(llm_config, PretrainedConfig):
-                model_type = llm_config['model_type']
-                llm_config.pop('model_type')
+                model_type = llm_config["model_type"]
+                llm_config.pop("model_type")
                 llm_config = AutoConfig.for_model(model_type, **llm_config)
 
         # map llm_config to text_config
         self.text_config = llm_config
         if visual_tokenizer_config is not None:
-            assert isinstance(visual_tokenizer_config, (PretrainedConfig, dict)), \
+            assert isinstance(visual_tokenizer_config, (PretrainedConfig, dict)), (
                 f"expect `visual_tokenizer_config` to be instance of PretrainedConfig or dict, but got {type(visual_tokenizer_config)} type"
+            )
             if not isinstance(visual_tokenizer_config, PretrainedConfig):
-                model_type = visual_tokenizer_config['model_type']
-                visual_tokenizer_config.pop('model_type')
+                model_type = visual_tokenizer_config["model_type"]
+                visual_tokenizer_config.pop("model_type")
                 visual_tokenizer_config = AutoConfig.for_model(
-                    model_type, **visual_tokenizer_config)
+                    model_type, **visual_tokenizer_config
+                )
 
         self.visual_tokenizer_config = visual_tokenizer_config
         self.multimodal_max_length = multimodal_max_length
diff --git a/vllm/transformers_utils/processors/deepseek_vl2.py b/vllm/transformers_utils/processors/deepseek_vl2.py
index d1d117b4e2cf..5ef258b9be29 100644
--- a/vllm/transformers_utils/processors/deepseek_vl2.py
+++ b/vllm/transformers_utils/processors/deepseek_vl2.py
@@ -1,7 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-# yapf: disable
 # ruff: noqa: E501
 # coding=utf-8
 # adapted from https://github.com/deepseek-ai/DeepSeek-VL2/blob/ff23960c5cf9e6874b44be38af930cfb0ccbb620/deepseek_vl2/models/processing_deepseek_vl_v2.py
@@ -35,11 +34,12 @@
 
 
 class ImageTransform:
-
-    def __init__(self,
-                 mean: tuple[float, float, float] = (0.5, 0.5, 0.5),
-                 std: tuple[float, float, float] = (0.5, 0.5, 0.5),
-                 normalize: bool = True):
+    def __init__(
+        self,
+        mean: tuple[float, float, float] = (0.5, 0.5, 0.5),
+        std: tuple[float, float, float] = (0.5, 0.5, 0.5),
+        normalize: bool = True,
+    ):
         self.mean = mean
         self.std = std
         self.normalize = normalize
@@ -77,7 +77,6 @@ def __init__(
         ignore_id: int = -100,
         **kwargs,
     ):
-
         self.candidate_resolutions = candidate_resolutions
         self.image_size = candidate_resolutions[0][0]
         self.patch_size = patch_size
@@ -86,13 +85,15 @@ def __init__(
         self.normalize = normalize
         self.downsample_ratio = downsample_ratio
 
-        self.image_transform = ImageTransform(mean=image_mean, std=image_std, normalize=normalize)
+        self.image_transform = ImageTransform(
+            mean=image_mean, std=image_std, normalize=normalize
+        )
         self.tokenizer = tokenizer
-        self.tokenizer.padding_side = 'left'  # must set this，padding side with make a difference in batch inference
+        self.tokenizer.padding_side = "left"  # must set this，padding side with make a difference in batch inference
 
         # add the pad_token as special token to use 'tokenizer.pad_token' and 'tokenizer.pad_token_id'
         if tokenizer.pad_token is None:
-            self.tokenizer.add_special_tokens({'pad_token': pad_token})
+            self.tokenizer.add_special_tokens({"pad_token": pad_token})
 
         # add image token
         image_token_id = self.tokenizer.vocab.get(image_token)
@@ -104,7 +105,7 @@ def __init__(
 
         # add five special tokens for grounding-related tasks
         # <|ref|>, <|/ref|>, <|det|>, <|/det|>, <|grounding|>
-        special_tokens = ['<|ref|>', '<|/ref|>', '<|det|>', '<|/det|>', '<|grounding|>']
+        special_tokens = ["<|ref|>", "<|/ref|>", "<|det|>", "<|/det|>", "<|grounding|>"]
         special_tokens_dict = {"additional_special_tokens": special_tokens}
         self.tokenizer.add_special_tokens(special_tokens_dict)
 
@@ -134,15 +135,19 @@ def select_best_resolution(self, image_size):
 
         for width, height in self.candidate_resolutions:
             scale = min(width / original_width, height / original_height)
-            downscaled_width, downscaled_height = int(
-                original_width * scale), int(original_height * scale)
-            effective_resolution = min(downscaled_width * downscaled_height,
-                                       original_width * original_height)
+            downscaled_width, downscaled_height = (
+                int(original_width * scale),
+                int(original_height * scale),
+            )
+            effective_resolution = min(
+                downscaled_width * downscaled_height, original_width * original_height
+            )
             wasted_resolution = (width * height) - effective_resolution
 
             if effective_resolution > max_effective_resolution or (
-                    effective_resolution == max_effective_resolution
-                    and wasted_resolution < min_wasted_resolution):
+                effective_resolution == max_effective_resolution
+                and wasted_resolution < min_wasted_resolution
+            ):
                 max_effective_resolution = effective_resolution
                 min_wasted_resolution = wasted_resolution
                 best_fit = (width, height)
@@ -198,12 +203,20 @@ def process_one(
                 - num_image_tokens (list[int]): the number of image tokens
         """
 
-        assert (prompt is not None and images is not None
-                ), "prompt and images must be used at the same time."
+        assert prompt is not None and images is not None, (
+            "prompt and images must be used at the same time."
+        )
 
         sft_format = prompt
-        tokenized_str, images_list, images_seq_mask, images_spatial_crop, num_image_tokens = self.tokenize_with_images(
-            sft_format, images, bos=True, eos=True, cropping=len(images) <= 2)
+        (
+            tokenized_str,
+            images_list,
+            images_seq_mask,
+            images_spatial_crop,
+            num_image_tokens,
+        ) = self.tokenize_with_images(
+            sft_format, images, bos=True, eos=True, cropping=len(images) <= 2
+        )
         masked_tokenized_str = []
         for token_index in tokenized_str:
             if token_index != self.image_token_id:
@@ -211,17 +224,21 @@ def process_one(
             else:
                 masked_tokenized_str.append(self.ignore_id)
 
-        assert len(tokenized_str) == len(images_seq_mask) == len(masked_tokenized_str), \
-            (f"tokenized_str's length {len(tokenized_str)}, input_ids' length {len(masked_tokenized_str)}, "
-             f"imags_seq_mask's length {len(images_seq_mask)}, are not equal")
+        assert (
+            len(tokenized_str) == len(images_seq_mask) == len(masked_tokenized_str)
+        ), (
+            f"tokenized_str's length {len(tokenized_str)}, input_ids' length {len(masked_tokenized_str)}, "
+            f"imags_seq_mask's length {len(images_seq_mask)}, are not equal"
+        )
 
         input_ids = torch.LongTensor(tokenized_str)
         target_ids = torch.LongTensor(masked_tokenized_str)
         images_seq_mask = torch.tensor(images_seq_mask, dtype=torch.bool)
 
         # set input_ids < 0 | input_ids == self.image_token_id as ignore_id
-        target_ids[(input_ids < 0) |
-                   (input_ids == self.image_token_id)] = self.ignore_id
+        target_ids[(input_ids < 0) | (input_ids == self.image_token_id)] = (
+            self.ignore_id
+        )
         input_ids[input_ids < 0] = self.pad_id
 
         if inference_mode:
@@ -311,30 +328,50 @@ def tokenize_with_images(
                 best_width, best_height = self.image_size, self.image_size
 
             """process the global view"""
-            global_view = ImageOps.pad(image, (self.image_size, self.image_size),
-                                       color=tuple(int(x * 255) for x in self.image_transform.mean))
+            global_view = ImageOps.pad(
+                image,
+                (self.image_size, self.image_size),
+                color=tuple(int(x * 255) for x in self.image_transform.mean),
+            )
             images_list.append(self.image_transform(global_view))
 
             """process the local views"""
-            local_view = ImageOps.pad(image, (best_width, best_height),
-                                      color=tuple(int(x * 255) for x in self.image_transform.mean))
+            local_view = ImageOps.pad(
+                image,
+                (best_width, best_height),
+                color=tuple(int(x * 255) for x in self.image_transform.mean),
+            )
             for i in range(0, best_height, self.image_size):
                 for j in range(0, best_width, self.image_size):
                     images_list.append(
-                        self.image_transform(local_view.crop((j, i, j + self.image_size, i + self.image_size))))
+                        self.image_transform(
+                            local_view.crop(
+                                (j, i, j + self.image_size, i + self.image_size)
+                            )
+                        )
+                    )
 
             """record height / width crop num"""
-            num_width_tiles, num_height_tiles = best_width // self.image_size, best_height // self.image_size
+            num_width_tiles, num_height_tiles = (
+                best_width // self.image_size,
+                best_height // self.image_size,
+            )
             images_spatial_crop.append([num_width_tiles, num_height_tiles])
 
             """add image tokens"""
-            h = w = math.ceil((self.image_size // self.patch_size) / self.downsample_ratio)
+            h = w = math.ceil(
+                (self.image_size // self.patch_size) / self.downsample_ratio
+            )
             # global views tokens h * (w + 1), 1 is for line separator
             tokenized_image = [self.image_token_id] * h * (w + 1)
             # add a separator between global and local views
             tokenized_image += [self.image_token_id]
             # local views tokens, (num_height_tiles * h) * (num_width_tiles * w + 1)
-            tokenized_image += [self.image_token_id] * (num_height_tiles * h) * (num_width_tiles * w + 1)
+            tokenized_image += (
+                [self.image_token_id]
+                * (num_height_tiles * h)
+                * (num_width_tiles * w + 1)
+            )
 
             tokenized_str += tokenized_image
             images_seq_mask += [True] * len(tokenized_image)
@@ -353,10 +390,17 @@ def tokenize_with_images(
             tokenized_str = tokenized_str + [self.eos_id]
             images_seq_mask = images_seq_mask + [False]
 
-        assert len(tokenized_str) == len(
-            images_seq_mask), f"tokenize_with_images func: tokenized_str's length {len(tokenized_str)} is not equal to imags_seq_mask's length {len(images_seq_mask)}"
+        assert len(tokenized_str) == len(images_seq_mask), (
+            f"tokenize_with_images func: tokenized_str's length {len(tokenized_str)} is not equal to imags_seq_mask's length {len(images_seq_mask)}"
+        )
 
-        return tokenized_str, images_list, images_seq_mask, images_spatial_crop, num_image_tokens
+        return (
+            tokenized_str,
+            images_list,
+            images_seq_mask,
+            images_spatial_crop,
+            num_image_tokens,
+        )
 
 
 AutoProcessor.register("DeepseekVLV2Processor", DeepseekVLV2Processor)
diff --git a/vllm/transformers_utils/processors/ovis.py b/vllm/transformers_utils/processors/ovis.py
index d7546695fd52..6d52ab48c970 100644
--- a/vllm/transformers_utils/processors/ovis.py
+++ b/vllm/transformers_utils/processors/ovis.py
@@ -1,7 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-# yapf: disable
 # ruff: noqa: E501
 # coding=utf-8
 # adapted from https://github.com/AIDC-AI/Ovis/blob/35ab51a1a1e3542fa6db260a1084cefbc8f164bb/ovis/vllm/processing_ovis.py
@@ -35,23 +34,24 @@
 
 from vllm.multimodal.image import convert_image_mode
 
-__all__ = ['OvisProcessor']
+__all__ = ["OvisProcessor"]
 IGNORE_ID = -100
 
-class OvisProcessorKwargs(ProcessingKwargs, total=False):   # type: ignore[call-arg]
+
+class OvisProcessorKwargs(ProcessingKwargs, total=False):  # type: ignore[call-arg]
     _defaults = {
         "text_kwargs": {
             "padding": False,
         },
         "images_kwargs": {
-            'max_partition':9,
-            'covering_threshold':0.9,
-            'convert_to_rgb':True,
-        'return_tensors':'pt'},
+            "max_partition": 9,
+            "covering_threshold": 0.9,
+            "convert_to_rgb": True,
+            "return_tensors": "pt",
+        },
     }
 
 
-
 class OvisProcessor(ProcessorMixin):
     r"""
     Constructs an Ovis processor which wraps an Ovis image processor and a Qwen2 tokenizer into a single processor.
@@ -97,14 +97,16 @@ def extra_special_tokens(self):
             "image_col_sep": -303,
             "image_row_sep": -304,
             "image_end": -305,
-            'image_pad': image_pad_token_id,
+            "image_pad": image_pad_token_id,
         }
         return extra_special_tokens
 
     def __call__(
         self,
         images: ImageInput = None,
-        text: Union[TextInput, PreTokenizedInput, list[TextInput], list[PreTokenizedInput]] = None,
+        text: Union[
+            TextInput, PreTokenizedInput, list[TextInput], list[PreTokenizedInput]
+        ] = None,
         **kwargs: Unpack[OvisProcessorKwargs],
     ) -> BatchFeature:
         """
@@ -169,7 +171,6 @@ def __call__(
 
         # Process text input
         if text is not None:
-
             if not isinstance(text, list):
                 text = [text]
 
@@ -178,7 +179,10 @@ def __call__(
             replaced_ids_list = []
             idx = 0
             for ids_tensor in tokenized_batched_text:
-                if image_token_id in ids_tensor and "image_placeholders" in image_features:
+                if (
+                    image_token_id in ids_tensor
+                    and "image_placeholders" in image_features
+                ):
                     if idx < len(image_features["image_placeholders"]):
                         # Converts in list for ease of use
                         ids_list = ids_tensor.tolist()
@@ -188,7 +192,9 @@ def __call__(
                         # replace placeholders
                         for i, token_id in enumerate(ids_list):
                             if token_id == image_token_id:
-                                placeholder_ids = image_features["image_placeholders"][idx]
+                                placeholder_ids = image_features["image_placeholders"][
+                                    idx
+                                ]
                                 new_ids.extend(placeholder_ids)
                                 idx += 1
                             else:
@@ -198,7 +204,8 @@ def __call__(
                         ids_tensor = torch.tensor(new_ids, dtype=torch.long)
                     else:
                         raise RuntimeError(
-                            'Mismatch between the images you provided and the number of placeholder present in the text')
+                            "Mismatch between the images you provided and the number of placeholder present in the text"
+                        )
 
                 replaced_ids_list.append(ids_tensor)
 
@@ -217,7 +224,7 @@ def __call__(
             # Add image features if present
             if image_features:
                 output["pixel_values"] = processed_images
-                output['grids'] = grids
+                output["grids"] = grids
 
             return output
 
@@ -227,8 +234,10 @@ def __call__(
     def _tokenize_with_image_symbol(self, text_list: list[str]) -> torch.LongTensor:
         batch_token_ids = []
         for text in text_list:
-            text_chunks = [self.tokenizer(chunk, add_special_tokens=False).input_ids for chunk in
-                           text.split(self.image_token)]
+            text_chunks = [
+                self.tokenizer(chunk, add_special_tokens=False).input_ids
+                for chunk in text.split(self.image_token)
+            ]
             token_ids = []
             num_chuck = len(text_chunks)
             for i, chunk in enumerate(text_chunks):
@@ -240,50 +249,60 @@ def _tokenize_with_image_symbol(self, text_list: list[str]) -> torch.LongTensor:
 
     def get_image_size(self):
         size = self.image_processor.size
-        if 'shortest_edge' in size:
-            width = height = size['shortest_edge']
+        if "shortest_edge" in size:
+            width = height = size["shortest_edge"]
         elif "height" in size and "width" in size:
-            width = size['width']
-            height = size['height']
+            width = size["width"]
+            height = size["height"]
         else:
-            raise ValueError( "Can't parse image size from image_processor config.")
+            raise ValueError("Can't parse image size from image_processor config.")
         return height, width
 
     def get_token_value(self, tok):
         return self.extra_special_tokens[tok]
 
     def construct_image_indicators(self, grid):
-        image_placeholders = [self.get_token_value('image_start'),
-                              self.get_token_value('image_atom'),
-                              self.get_token_value('image_prefix')]
+        image_placeholders = [
+            self.get_token_value("image_start"),
+            self.get_token_value("image_atom"),
+            self.get_token_value("image_prefix"),
+        ]
         if grid[0] * grid[1] > 1:
             for r in range(grid[0]):
                 for c in range(grid[1]):
-                    image_placeholders.append(self.get_token_value('image_atom') )
+                    image_placeholders.append(self.get_token_value("image_atom"))
                     if c < grid[1] - 1:
-                        image_placeholders.append(self.get_token_value('image_col_sep'))
+                        image_placeholders.append(self.get_token_value("image_col_sep"))
                 if r < grid[0] - 1:
-                    image_placeholders.append(self.get_token_value('image_row_sep'))
-        image_placeholders.append(self.get_token_value('image_end'))
+                    image_placeholders.append(self.get_token_value("image_row_sep"))
+        image_placeholders.append(self.get_token_value("image_end"))
         return image_placeholders
 
     def construct_image_placeholders(self, grid):
-
         image_placeholders = self.construct_image_indicators(grid)
 
-        image_atom_token_id = self.get_token_value('image_atom')
+        image_atom_token_id = self.get_token_value("image_atom")
         # Extract the padding token ID from tokenizer
-        image_padding_token_id = self.get_token_value('image_pad')
+        image_padding_token_id = self.get_token_value("image_pad")
 
         # Create a new list with padding tokens inserted
         padded_placeholder_tokens = []
         for token in image_placeholders:
             padded_placeholder_tokens.append(image_padding_token_id)
             if token == image_atom_token_id:
-                padded_placeholder_tokens.extend([image_padding_token_id] * self.image_segment_len)
+                padded_placeholder_tokens.extend(
+                    [image_padding_token_id] * self.image_segment_len
+                )
         return padded_placeholder_tokens
 
-    def preprocess_image(self, image: PIL.Image.Image, max_partition, covering_threshold, convert_to_rgb, return_tensors):
+    def preprocess_image(
+        self,
+        image: PIL.Image.Image,
+        max_partition,
+        covering_threshold,
+        convert_to_rgb,
+        return_tensors,
+    ):
         def _preprocess(img: PIL.Image.Image, side):
             # first resize and preprocess
             w, h = img.size
@@ -296,19 +315,27 @@ def _preprocess(img: PIL.Image.Image, side):
                 new_height = side
                 new_width = int(w / h * new_height)
             new_size = dict(height=new_height, width=new_width)
-            pixel_values = self.image_processor.preprocess(img, size=new_size, return_tensors=return_tensors)['pixel_values']
+            pixel_values = self.image_processor.preprocess(
+                img, size=new_size, return_tensors=return_tensors
+            )["pixel_values"]
 
             # then pad to square
-            square_values = torch.zeros([1, 3, side, side], dtype=pixel_values.dtype, device=pixel_values.device)
+            square_values = torch.zeros(
+                [1, 3, side, side], dtype=pixel_values.dtype, device=pixel_values.device
+            )
             new_height, new_width = pixel_values.shape[2:]
             if new_height == new_width:
                 square_values[:, :, :, :] = pixel_values
             elif new_height > new_width:
                 from_index = (side - new_width) // 2
-                square_values[:, :, :, from_index:from_index + new_width] = pixel_values
+                square_values[:, :, :, from_index : from_index + new_width] = (
+                    pixel_values
+                )
             else:
                 from_index = (side - new_height) // 2
-                square_values[:, :, from_index:from_index + new_height, :] = pixel_values
+                square_values[:, :, from_index : from_index + new_height, :] = (
+                    pixel_values
+                )
 
             return square_values
 
@@ -350,7 +377,9 @@ def _get_best_grid(img, side):
             good_grids = []
             for grid in candidate_grids:
                 partition = _partition(img, grid)
-                covering_ratio = sum([_covering_area(*p, side) for p in partition]) / img_area
+                covering_ratio = (
+                    sum([_covering_area(*p, side) for p in partition]) / img_area
+                )
                 assert covering_ratio <= 1.0
                 all_grids.append((grid, covering_ratio))
                 if covering_ratio > covering_threshold:
@@ -358,18 +387,19 @@ def _get_best_grid(img, side):
 
             if len(good_grids) > 0:
                 # pick the good partition with minimum #sub_images and break the tie using covering_ratio
-                return sorted(good_grids, key=lambda x: (x[0][0] * x[0][1], -x[1]))[0][0]
+                return sorted(good_grids, key=lambda x: (x[0][0] * x[0][1], -x[1]))[0][
+                    0
+                ]
             else:
                 # pick the partition with maximum covering_ratio and break the tie using #sub_images
                 return sorted(all_grids, key=lambda x: (-x[1], x[0][0] * x[0][1]))[0][0]
 
         if convert_to_rgb:
-            image = convert_image_mode(image, 'RGB')
-
+            image = convert_image_mode(image, "RGB")
 
         sides = self.get_image_size()
         if sides[0] != sides[1]:
-            raise ValueError('get_image_size() returns non-square size')
+            raise ValueError("get_image_size() returns non-square size")
         side = sides[0]
         grid = _get_best_grid(image, side)
         partition = _partition(image, grid)
@@ -405,14 +435,18 @@ def post_process_image_text_to_text(self, generated_outputs):
             `list[str]`: The decoded text.
         """
         return self.tokenizer.batch_decode(
-            generated_outputs, skip_special_tokens=True, clean_up_tokenization_spaces=False
+            generated_outputs,
+            skip_special_tokens=True,
+            clean_up_tokenization_spaces=False,
         )
 
     @property
     def model_input_names(self):
         tokenizer_input_names = self.tokenizer.model_input_names
         image_processor_input_names = self.image_processor.model_input_names
-        names_from_processor = list(dict.fromkeys(tokenizer_input_names + image_processor_input_names))
+        names_from_processor = list(
+            dict.fromkeys(tokenizer_input_names + image_processor_input_names)
+        )
         return names_from_processor + ["second_per_grid_ts"]
 
 
diff --git a/vllm/v1/attention/backends/flashinfer.py b/vllm/v1/attention/backends/flashinfer.py
index 1c05a17db840..07316cd12ae0 100755
--- a/vllm/v1/attention/backends/flashinfer.py
+++ b/vllm/v1/attention/backends/flashinfer.py
@@ -40,9 +40,6 @@
     supports_trtllm_attention,
     use_trtllm_attention,
 )
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.v1.attention.backends.utils import (
     AttentionCGSupport,
     AttentionMetadataBuilder,
@@ -52,8 +49,6 @@
     infer_global_hyperparameters,
     split_decodes_and_prefills,
 )
-
-# yapf: enable
 from vllm.v1.kv_cache_interface import AttentionSpec
 
 FLASHINFER_WORKSPACE_BUFFER_SIZE = 256 * 1024 * 1024
diff --git a/vllm/v1/attention/backends/mla/rocm_aiter_mla.py b/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
index aa9be9119dbb..54ebf071d96f 100644
--- a/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
+++ b/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
@@ -11,9 +11,6 @@
 from vllm.attention.ops.rocm_aiter_mla import aiter_mla_decode_fwd
 from vllm.config import VllmConfig
 from vllm.utils import cdiv
-
-# yapf conflicts with isort for this docstring
-# yapf: disable
 from vllm.v1.attention.backends.mla.common import (
     MLACommonBackend,
     MLACommonDecodeMetadata,
@@ -24,8 +21,6 @@
 from vllm.v1.attention.backends.utils import AttentionCGSupport
 from vllm.v1.kv_cache_interface import AttentionSpec
 
-# yapf: enable
-
 
 def is_aiter_mla_enabled() -> bool:
     return envs.VLLM_ROCM_USE_AITER and envs.VLLM_ROCM_USE_AITER_MLA
diff --git a/vllm/v1/serial_utils.py b/vllm/v1/serial_utils.py
index f7a73cba6095..747d08dcd367 100644
--- a/vllm/v1/serial_utils.py
+++ b/vllm/v1/serial_utils.py
@@ -18,8 +18,6 @@
 
 from vllm import envs
 from vllm.logger import init_logger
-
-# yapf: disable
 from vllm.multimodal.inputs import (
     BaseMultiModalField,
     MultiModalBatchedField,
@@ -32,8 +30,6 @@
     MultiModalSharedField,
     NestedTensors,
 )
-
-# yapf: enable
 from vllm.v1.engine import UtilityResult
 
 logger = init_logger(__name__)
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 90429b6b0c35..41c02bc41009 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -48,9 +48,6 @@
 from vllm.model_executor.layers.rotary_embedding import MRotaryEmbedding
 from vllm.model_executor.model_loader import TensorizerLoader, get_model_loader
 from vllm.model_executor.models.deepseek_v2 import DeepseekV32IndexerCache
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.model_executor.models.interfaces import (
     SupportsMultiModal,
     is_mixture_of_experts,
@@ -59,8 +56,6 @@
     supports_multimodal_pruning,
     supports_transcription,
 )
-
-# yapf: enable
 from vllm.model_executor.models.interfaces_base import (
     VllmModelForPooling,
     is_pooling_model,
@@ -101,9 +96,6 @@
     split_attn_metadata,
 )
 from vllm.v1.cudagraph_dispatcher import CudagraphDispatcher
-
-# yapf conflicts with isort for this block
-# yapf: disable
 from vllm.v1.kv_cache_interface import (
     AttentionSpec,
     ChunkedLocalAttentionSpec,
@@ -118,8 +110,6 @@
     SlidingWindowSpec,
     UniformTypeKVCacheSpecs,
 )
-
-# yapf: enable
 from vllm.v1.outputs import (
     EMPTY_MODEL_RUNNER_OUTPUT,
     AsyncModelRunnerOutput,

From d6e4f0568e78ec8db59db18e42bfd4170a10fe46 Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Sun, 5 Oct 2025 17:18:14 +0100
Subject: [PATCH 186/193] Remove all cases of `fmt: on/off` (#26253)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../benchmark_fp8_block_dense_gemm.py         | 226 +++++++++---------
 tests/kernels/mamba/test_mamba_ssm_ssd.py     |  71 ++++--
 .../v1/engine/test_fast_incdec_prefix_err.py  |   8 +-
 vllm/model_executor/models/qwen2_5_vl.py      |  10 +-
 vllm/model_executor/models/voxtral.py         |  59 +++--
 5 files changed, 217 insertions(+), 157 deletions(-)

diff --git a/benchmarks/kernels/deepgemm/benchmark_fp8_block_dense_gemm.py b/benchmarks/kernels/deepgemm/benchmark_fp8_block_dense_gemm.py
index 2010b8038563..ba31bc563829 100644
--- a/benchmarks/kernels/deepgemm/benchmark_fp8_block_dense_gemm.py
+++ b/benchmarks/kernels/deepgemm/benchmark_fp8_block_dense_gemm.py
@@ -1,6 +1,5 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-# fmt: off
 # ruff: noqa: E501
 import time
 
@@ -20,19 +19,21 @@
 )
 
 
-def benchmark_shape(m: int,
-                    n: int,
-                    k: int,
-                    warmup: int = 100,
-                    repeat: int = 10000,
-                    verbose: bool = False) -> dict:
+def benchmark_shape(
+    m: int,
+    n: int,
+    k: int,
+    warmup: int = 100,
+    repeat: int = 10000,
+    verbose: bool = False,
+) -> dict:
     """Benchmark all implementations for a specific (m, n, k) shape."""
     if verbose:
         print(f"\n=== Benchmarking shape: m={m}, n={n}, k={k} ===")
 
     # Create test tensors
-    A = torch.randn((m, k), device='cuda', dtype=torch.bfloat16)
-    B = torch.randn((n, k), device='cuda', dtype=torch.bfloat16)
+    A = torch.randn((m, k), device="cuda", dtype=torch.bfloat16)
+    B = torch.randn((n, k), device="cuda", dtype=torch.bfloat16)
 
     # Reference result in BF16
     torch.cuda.synchronize()
@@ -49,34 +50,39 @@ def benchmark_shape(m: int,
     # Pre-quantize A for all implementations
     A_deepgemm, A_scale_deepgemm = per_token_group_quant_fp8(A, block_size[1])
     A_scale_deepgemm = get_col_major_tma_aligned_tensor(A_scale_deepgemm)
-    C_deepgemm = torch.empty((m, n), device='cuda', dtype=torch.bfloat16)
+    C_deepgemm = torch.empty((m, n), device="cuda", dtype=torch.bfloat16)
     A_vllm, A_scale_vllm = per_token_group_quant_fp8(A, block_size[1])
     A_vllm_cutlass, A_scale_vllm_cutlass = per_token_group_quant_fp8(
-        A, block_size[1], column_major_scales=True)
+        A, block_size[1], column_major_scales=True
+    )
 
     # === DeepGEMM Implementation ===
     def deepgemm_gemm():
-        fp8_gemm_nt((A_deepgemm, A_scale_deepgemm),
-                                       (B_deepgemm, B_scale_deepgemm),
-                                       C_deepgemm)
+        fp8_gemm_nt(
+            (A_deepgemm, A_scale_deepgemm), (B_deepgemm, B_scale_deepgemm), C_deepgemm
+        )
         return C_deepgemm
 
     # === vLLM Triton Implementation ===
     def vllm_triton_gemm():
-        return w8a8_triton_block_scaled_mm(A_vllm,
-                                     B_vllm,
-                                     A_scale_vllm,
-                                     B_scale_vllm,
-                                     block_size,
-                                     output_dtype=torch.bfloat16)
+        return w8a8_triton_block_scaled_mm(
+            A_vllm,
+            B_vllm,
+            A_scale_vllm,
+            B_scale_vllm,
+            block_size,
+            output_dtype=torch.bfloat16,
+        )
 
     # === vLLM CUTLASS Implementation ===
     def vllm_cutlass_gemm():
-        return ops.cutlass_scaled_mm(A_vllm_cutlass,
-                                     B_vllm.T,
-                                     scale_a=A_scale_vllm_cutlass,
-                                     scale_b=B_scale_vllm.T,
-                                     out_dtype=torch.bfloat16)
+        return ops.cutlass_scaled_mm(
+            A_vllm_cutlass,
+            B_vllm.T,
+            scale_a=A_scale_vllm_cutlass,
+            scale_b=B_scale_vllm.T,
+            out_dtype=torch.bfloat16,
+        )
 
     # Run correctness check first
     if verbose:
@@ -93,26 +99,23 @@ def vllm_cutlass_gemm():
         print(f"DeepGEMM vs Reference difference: {deepgemm_diff:.6f}")
         print(f"vLLM Triton vs Reference difference: {vllm_triton_diff:.6f}")
         print(f"vLLM CUTLASS vs Reference difference: {vllm_cutlass_diff:.6f}")
-        print("vLLM Triton vs DeepGEMM difference: "
-              f"{calc_diff(C_vllm_triton, C_deepgemm):.6f}")
-        print("vLLM CUTLASS vs DeepGEMM difference: "
-              f"{calc_diff(C_vllm_cutlass, C_deepgemm):.6f}")
+        print(
+            "vLLM Triton vs DeepGEMM difference: "
+            f"{calc_diff(C_vllm_triton, C_deepgemm):.6f}"
+        )
+        print(
+            "vLLM CUTLASS vs DeepGEMM difference: "
+            f"{calc_diff(C_vllm_cutlass, C_deepgemm):.6f}"
+        )
 
     # Benchmark implementations
     implementations = {
         "DeepGEMM": deepgemm_gemm,
         "vLLM Triton": vllm_triton_gemm,
-        "vLLM CUTLASS": vllm_cutlass_gemm
+        "vLLM CUTLASS": vllm_cutlass_gemm,
     }
 
-    benchmark_results = {
-        "shape": {
-            "m": m,
-            "n": n,
-            "k": k
-        },
-        "implementations": {}
-    }
+    benchmark_results = {"shape": {"m": m, "n": n, "k": k}, "implementations": {}}
 
     for name, func in implementations.items():
         # Warmup
@@ -140,38 +143,36 @@ def vllm_cutlass_gemm():
             "tflops": tflops,
             "gb_s": gb_s,
             "diff": {
-                "DeepGEMM":
-                0.0 if name == "DeepGEMM" else calc_diff(func(), C_deepgemm),
-                "Reference":
-                deepgemm_diff if name == "DeepGEMM" else
-                (vllm_triton_diff
-                 if name == "vLLM Triton" else vllm_cutlass_diff)
-            }
+                "DeepGEMM": 0.0
+                if name == "DeepGEMM"
+                else calc_diff(func(), C_deepgemm),
+                "Reference": deepgemm_diff
+                if name == "DeepGEMM"
+                else (vllm_triton_diff if name == "vLLM Triton" else vllm_cutlass_diff),
+            },
         }
 
         if verbose:
-            print(
-                f"{name}: {avg_time_ms:.3f} ms, {tflops:.2f} TFLOPS, {gb_s:.2f} GB/s"
-            )
+            print(f"{name}: {avg_time_ms:.3f} ms, {tflops:.2f} TFLOPS, {gb_s:.2f} GB/s")
 
     # Calculate speedups
     baseline = benchmark_results["implementations"]["DeepGEMM"]["time_ms"]
     for name, data in benchmark_results["implementations"].items():
         if name != "DeepGEMM":
             speedup = baseline / data["time_ms"]
-            benchmark_results["implementations"][name][
-                "speedup_vs_deepgemm"] = speedup
+            benchmark_results["implementations"][name]["speedup_vs_deepgemm"] = speedup
             if verbose:
-                print(f"DeepGEMM is {1/speedup:.2f}x "
-                      f"{'faster' if 1/speedup > 1 else 'slower'} than {name}")
+                print(
+                    f"DeepGEMM is {1 / speedup:.2f}x "
+                    f"{'faster' if 1 / speedup > 1 else 'slower'} than {name}"
+                )
 
-    vllm_triton_time = benchmark_results["implementations"]["vLLM Triton"][
-        "time_ms"]
-    vllm_cutlass_time = benchmark_results["implementations"]["vLLM CUTLASS"][
-        "time_ms"]
+    vllm_triton_time = benchmark_results["implementations"]["vLLM Triton"]["time_ms"]
+    vllm_cutlass_time = benchmark_results["implementations"]["vLLM CUTLASS"]["time_ms"]
     cutlass_vs_triton = vllm_triton_time / vllm_cutlass_time
-    benchmark_results["implementations"]["vLLM CUTLASS"][
-        "speedup_vs_triton"] = cutlass_vs_triton
+    benchmark_results["implementations"]["vLLM CUTLASS"]["speedup_vs_triton"] = (
+        cutlass_vs_triton
+    )
     if verbose:
         print(
             f"vLLM CUTLASS is {cutlass_vs_triton:.2f}x "
@@ -183,8 +184,7 @@ def vllm_cutlass_gemm():
 
 def format_table_row(values, widths):
     """Format a row with specified column widths."""
-    return "| " + " | ".join(f"{val:{w}}"
-                             for val, w in zip(values, widths)) + " |"
+    return "| " + " | ".join(f"{val:{w}}" for val, w in zip(values, widths)) + " |"
 
 
 def print_table(headers, rows, title=None):
@@ -292,38 +292,50 @@ def run_benchmarks(verbose: bool = False):
     for result in all_results:
         shape = result["shape"]
         impl_data = result["implementations"]["DeepGEMM"]
-        deepgemm_rows.append([
-            shape["m"], shape["n"], shape["k"], f"{impl_data['time_us']:.1f}",
-            f"{impl_data['tflops']:.1f}", f"{impl_data['gb_s']:.1f}"
-        ])
+        deepgemm_rows.append(
+            [
+                shape["m"],
+                shape["n"],
+                shape["k"],
+                f"{impl_data['time_us']:.1f}",
+                f"{impl_data['tflops']:.1f}",
+                f"{impl_data['gb_s']:.1f}",
+            ]
+        )
 
-    print_table(deepgemm_headers,
-                deepgemm_rows,
-                title="DeepGEMM Implementation:")
+    print_table(deepgemm_headers, deepgemm_rows, title="DeepGEMM Implementation:")
 
     # Print vLLM Triton table
-    triton_headers = [
-        "m", "n", "k", "Time (μs)", "TFLOPS", "GB/s", "vs DeepGEMM"
-    ]
+    triton_headers = ["m", "n", "k", "Time (μs)", "TFLOPS", "GB/s", "vs DeepGEMM"]
     triton_rows = []
     for result in all_results:
         shape = result["shape"]
         impl_data = result["implementations"]["vLLM Triton"]
         speedup = impl_data.get("speedup_vs_deepgemm", 1.0)
-        triton_rows.append([
-            shape["m"], shape["n"], shape["k"], f"{impl_data['time_us']:.1f}",
-            f"{impl_data['tflops']:.1f}", f"{impl_data['gb_s']:.1f}",
-            format_speedup(speedup)
-        ])
+        triton_rows.append(
+            [
+                shape["m"],
+                shape["n"],
+                shape["k"],
+                f"{impl_data['time_us']:.1f}",
+                f"{impl_data['tflops']:.1f}",
+                f"{impl_data['gb_s']:.1f}",
+                format_speedup(speedup),
+            ]
+        )
 
-    print_table(triton_headers,
-                triton_rows,
-                title="vLLM Triton Implementation:")
+    print_table(triton_headers, triton_rows, title="vLLM Triton Implementation:")
 
     # Print vLLM CUTLASS table
     cutlass_headers = [
-        "m", "n", "k", "Time (μs)", "TFLOPS", "GB/s", "vs DeepGEMM",
-        "vs Triton"
+        "m",
+        "n",
+        "k",
+        "Time (μs)",
+        "TFLOPS",
+        "GB/s",
+        "vs DeepGEMM",
+        "vs Triton",
     ]
     cutlass_rows = []
     for result in all_results:
@@ -331,28 +343,27 @@ def run_benchmarks(verbose: bool = False):
         impl_data = result["implementations"]["vLLM CUTLASS"]
         vs_deepgemm = impl_data.get("speedup_vs_deepgemm", 1.0)
         vs_triton = impl_data.get("speedup_vs_triton", 1.0)
-        cutlass_rows.append([
-            shape["m"], shape["n"], shape["k"], f"{impl_data['time_us']:.1f}",
-            f"{impl_data['tflops']:.1f}", f"{impl_data['gb_s']:.1f}",
-            format_speedup(vs_deepgemm),
-            format_speedup(vs_triton)
-        ])
+        cutlass_rows.append(
+            [
+                shape["m"],
+                shape["n"],
+                shape["k"],
+                f"{impl_data['time_us']:.1f}",
+                f"{impl_data['tflops']:.1f}",
+                f"{impl_data['gb_s']:.1f}",
+                format_speedup(vs_deepgemm),
+                format_speedup(vs_triton),
+            ]
+        )
 
-    print_table(cutlass_headers,
-                cutlass_rows,
-                title="vLLM CUTLASS Implementation:")
+    print_table(cutlass_headers, cutlass_rows, title="vLLM CUTLASS Implementation:")
 
     # Calculate and print averages
     print("\n===== AVERAGE PERFORMANCE =====")
 
     implementations = ["DeepGEMM", "vLLM Triton", "vLLM CUTLASS"]
     avg_metrics = {
-        impl: {
-            "tflops": 0,
-            "gb_s": 0,
-            "time_ms": 0
-        }
-        for impl in implementations
+        impl: {"tflops": 0, "gb_s": 0, "time_ms": 0} for impl in implementations
     }
 
     for result in all_results:
@@ -370,9 +381,9 @@ def run_benchmarks(verbose: bool = False):
         avg_tflops = avg_metrics[impl]["tflops"] / num_shapes
         avg_mem_bw = avg_metrics[impl]["gb_s"] / num_shapes
         avg_time = avg_metrics[impl]["time_ms"] / num_shapes
-        avg_rows.append([
-            impl, f"{avg_tflops:.2f}", f"{avg_mem_bw:.2f}", f"{avg_time:.2f}"
-        ])
+        avg_rows.append(
+            [impl, f"{avg_tflops:.2f}", f"{avg_mem_bw:.2f}", f"{avg_time:.2f}"]
+        )
 
     print_table(avg_headers, avg_rows)
 
@@ -380,21 +391,19 @@ def run_benchmarks(verbose: bool = False):
     avg_speedups = {
         "DeepGEMM vs vLLM Triton": 0,
         "DeepGEMM vs vLLM CUTLASS": 0,
-        "vLLM CUTLASS vs vLLM Triton": 0
+        "vLLM CUTLASS vs vLLM Triton": 0,
     }
 
     for result in all_results:
         deepgemm_time = result["implementations"]["DeepGEMM"]["time_ms"]
         vllm_triton_time = result["implementations"]["vLLM Triton"]["time_ms"]
-        vllm_cutlass_time = result["implementations"]["vLLM CUTLASS"][
-            "time_ms"]
+        vllm_cutlass_time = result["implementations"]["vLLM CUTLASS"]["time_ms"]
 
-        avg_speedups[
-            "DeepGEMM vs vLLM Triton"] += vllm_triton_time / deepgemm_time
-        avg_speedups[
-            "DeepGEMM vs vLLM CUTLASS"] += vllm_cutlass_time / deepgemm_time
-        avg_speedups[
-            "vLLM CUTLASS vs vLLM Triton"] += vllm_triton_time / vllm_cutlass_time
+        avg_speedups["DeepGEMM vs vLLM Triton"] += vllm_triton_time / deepgemm_time
+        avg_speedups["DeepGEMM vs vLLM CUTLASS"] += vllm_cutlass_time / deepgemm_time
+        avg_speedups["vLLM CUTLASS vs vLLM Triton"] += (
+            vllm_triton_time / vllm_cutlass_time
+        )
 
     print("\n===== AVERAGE SPEEDUPS =====")
     speedup_headers = ["Comparison", "Speedup"]
@@ -412,8 +421,7 @@ def run_benchmarks(verbose: bool = False):
 
     for result in all_results:
         for impl in implementations:
-            avg_diff[impl] += result["implementations"][impl]["diff"][
-                "Reference"]
+            avg_diff[impl] += result["implementations"][impl]["diff"]["Reference"]
 
     diff_headers = ["Implementation", "Avg Diff vs Reference"]
     diff_rows = []
diff --git a/tests/kernels/mamba/test_mamba_ssm_ssd.py b/tests/kernels/mamba/test_mamba_ssm_ssd.py
index b4424b717d02..b068ea1ac49c 100644
--- a/tests/kernels/mamba/test_mamba_ssm_ssd.py
+++ b/tests/kernels/mamba/test_mamba_ssm_ssd.py
@@ -442,14 +442,22 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
     B_chunked = torch.zeros_like(B)[:chunked_input_seq_len, ...]
     C_chunked = torch.zeros_like(C)[:chunked_input_seq_len, ...]
     for i in range(num_sequences):
-        # fmt: off
-        chunk_f = lambda x, i: x[cu_seqlens[i]:cu_seqlens[i] + chunked_seqlens[i], ...]  # noqa: E501
+        chunk_f = lambda x, i: x[
+            cu_seqlens[i] : cu_seqlens[i] + chunked_seqlens[i], ...
+        ]
 
-        X_chunked[chunked_cu_seqlens[i]:chunked_cu_seqlens[i+1], ...] = chunk_f(X, i)  # noqa: E501
-        dt_chunked[chunked_cu_seqlens[i]:chunked_cu_seqlens[i+1], ...] = chunk_f(dt, i)  # noqa: E501
-        B_chunked[chunked_cu_seqlens[i]:chunked_cu_seqlens[i+1], ...] = chunk_f(B, i)  # noqa: E501
-        C_chunked[chunked_cu_seqlens[i]:chunked_cu_seqlens[i+1], ...] = chunk_f(C, i)  # noqa: E501
-        # fmt: on
+        X_chunked[chunked_cu_seqlens[i] : chunked_cu_seqlens[i + 1], ...] = chunk_f(
+            X, i
+        )
+        dt_chunked[chunked_cu_seqlens[i] : chunked_cu_seqlens[i + 1], ...] = chunk_f(
+            dt, i
+        )
+        B_chunked[chunked_cu_seqlens[i] : chunked_cu_seqlens[i + 1], ...] = chunk_f(
+            B, i
+        )
+        C_chunked[chunked_cu_seqlens[i] : chunked_cu_seqlens[i + 1], ...] = chunk_f(
+            C, i
+        )
 
     cu_chunk_seqlens, last_chunk_indices, seq_idx_chunks = (
         compute_varlen_chunk_metadata(chunked_cu_seqlens, chunk_size)
@@ -481,27 +489,42 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
         dim=0,
     )
     remaining_chunked_input_seq_len = remaining_chunked_cu_seqlens[-1]
-    # fmt: off
-    remaining_X_chunked = torch.zeros_like(X)[:remaining_chunked_input_seq_len, ...]  # noqa: E501
-    remaining_dt_chunked = torch.zeros_like(dt)[:remaining_chunked_input_seq_len, ...]  # noqa: E501
-    remaining_B_chunked = torch.zeros_like(B)[:remaining_chunked_input_seq_len, ...]  # noqa: E501
-    remaining_C_chunked = torch.zeros_like(C)[:remaining_chunked_input_seq_len, ...]  # noqa: E501
+    remaining_X_chunked = torch.zeros_like(X)[:remaining_chunked_input_seq_len, ...]
+    remaining_dt_chunked = torch.zeros_like(dt)[:remaining_chunked_input_seq_len, ...]
+    remaining_B_chunked = torch.zeros_like(B)[:remaining_chunked_input_seq_len, ...]
+    remaining_C_chunked = torch.zeros_like(C)[:remaining_chunked_input_seq_len, ...]
     for i in range(num_sequences):
-        remaining_chunk_f = lambda x, i: x[cu_seqlens[i] + chunked_seqlens[i]:cu_seqlens[i+1], ...]  # noqa: E501
-
-        remaining_X_chunked[remaining_chunked_cu_seqlens[i]:remaining_chunked_cu_seqlens[i+1], ...] = remaining_chunk_f(X, i)  # noqa: E501
-        remaining_dt_chunked[remaining_chunked_cu_seqlens[i]:remaining_chunked_cu_seqlens[i+1], ...] = remaining_chunk_f(dt, i)  # noqa: E501
-        remaining_B_chunked[remaining_chunked_cu_seqlens[i]:remaining_chunked_cu_seqlens[i+1], ...] = remaining_chunk_f(B, i)  # noqa: E501
-        remaining_C_chunked[remaining_chunked_cu_seqlens[i]:remaining_chunked_cu_seqlens[i+1], ...] = remaining_chunk_f(C, i)  # noqa: E501
+        remaining_chunk_f = lambda x, i: x[
+            cu_seqlens[i] + chunked_seqlens[i] : cu_seqlens[i + 1], ...
+        ]
+
+        remaining_X_chunked[
+            remaining_chunked_cu_seqlens[i] : remaining_chunked_cu_seqlens[i + 1], ...
+        ] = remaining_chunk_f(X, i)
+        remaining_dt_chunked[
+            remaining_chunked_cu_seqlens[i] : remaining_chunked_cu_seqlens[i + 1], ...
+        ] = remaining_chunk_f(dt, i)
+        remaining_B_chunked[
+            remaining_chunked_cu_seqlens[i] : remaining_chunked_cu_seqlens[i + 1], ...
+        ] = remaining_chunk_f(B, i)
+        remaining_C_chunked[
+            remaining_chunked_cu_seqlens[i] : remaining_chunked_cu_seqlens[i + 1], ...
+        ] = remaining_chunk_f(C, i)
 
     # assert input chunking is correct
-    concat_chunk_f = lambda pt1, pt2, i: torch.cat([
-        pt1[chunked_cu_seqlens[i]:chunked_cu_seqlens[i+1],...],
-        pt2[remaining_chunked_cu_seqlens[i]:remaining_chunked_cu_seqlens[i+1],...],
+    concat_chunk_f = lambda pt1, pt2, i: torch.cat(
+        [
+            pt1[chunked_cu_seqlens[i] : chunked_cu_seqlens[i + 1], ...],
+            pt2[
+                remaining_chunked_cu_seqlens[i] : remaining_chunked_cu_seqlens[i + 1],
+                ...,
+            ],
         ],
-        dim=0)
-    concat_batch_f = lambda pt1, pt2: torch.cat([concat_chunk_f(pt1, pt2, i) for i in range(num_sequences)], dim=0)  # noqa: E501
-    # fmt: on
+        dim=0,
+    )
+    concat_batch_f = lambda pt1, pt2: torch.cat(
+        [concat_chunk_f(pt1, pt2, i) for i in range(num_sequences)], dim=0
+    )
 
     assert concat_batch_f(X_chunked, remaining_X_chunked).equal(X)
     assert concat_batch_f(dt_chunked, remaining_dt_chunked).equal(dt)
diff --git a/tests/v1/engine/test_fast_incdec_prefix_err.py b/tests/v1/engine/test_fast_incdec_prefix_err.py
index fc1fc259f259..77e67d54e587 100644
--- a/tests/v1/engine/test_fast_incdec_prefix_err.py
+++ b/tests/v1/engine/test_fast_incdec_prefix_err.py
@@ -182,8 +182,9 @@ def test_fast_inc_detok_invalid_utf8_err_case():
         finished = i == len(test_tokens) - 1
         output += detokenizer.get_next_output_text(finished, delta=True)
 
-    # fmt: off
-    assert output == r'''[
+    assert (
+        output
+        == r"""[
   {
     "source": "Résultats",
     "source_type": "CONCEPT",
@@ -191,4 +192,5 @@ def test_fast_inc_detok_invalid_utf8_err_case():
     "target": "Israël",
     "target_type": "ORGANIZATION",
     "target_description": "Pays qui a obtenu à sa frontière libanaise « un niveau de calme inédit depuis les années 1960 »",
-    "relationship": "Obtention d'un niveau de'''
+    "relationship": "Obtention d'un niveau de"""
+    )
diff --git a/vllm/model_executor/models/qwen2_5_vl.py b/vllm/model_executor/models/qwen2_5_vl.py
index 1520495dfdc0..c485e79ce826 100644
--- a/vllm/model_executor/models/qwen2_5_vl.py
+++ b/vllm/model_executor/models/qwen2_5_vl.py
@@ -1399,12 +1399,10 @@ def recompute_mrope_positions(
         # Tensors
         input_ids_t = torch.as_tensor(input_ids, device=device, dtype=torch.long)
 
-        # fmt: off
-        mm_embeddings_out = [mm[:, :-4] for mm in
-                             multimodal_embeddings]
-        mm_embeddings_pos = [mm[:, -4:].permute(1, 0).long() for mm in
-                             multimodal_embeddings]
-        # fmt: in
+        mm_embeddings_out = [mm[:, :-4] for mm in multimodal_embeddings]
+        mm_embeddings_pos = [
+            mm[:, -4:].permute(1, 0).long() for mm in multimodal_embeddings
+        ]
 
         positions, mrope_positions_delta = recompute_mrope_positions(
             input_ids_t,
diff --git a/vllm/model_executor/models/voxtral.py b/vllm/model_executor/models/voxtral.py
index 8525bdd5bfad..0d77b72675e2 100644
--- a/vllm/model_executor/models/voxtral.py
+++ b/vllm/model_executor/models/voxtral.py
@@ -516,14 +516,18 @@ def get_num_audio_tokens(
         )
 
     def load_weights(self, weights: Iterable[tuple[str, torch.Tensor]]) -> set[str]:
-        # fmt: off
         remapping_rules = [
             (r"mm_whisper_embeddings\.(.*)", r"\1"),
             (r"audio_language_projection\.(.*)", r"audio_language_adapter.\1"),
-            (r"audio_language_adapter\.0\.weight", r"audio_language_adapter.w_in.weight"),  # noqa: E501
-            (r"audio_language_adapter\.2\.weight", r"audio_language_adapter.w_out.weight"),  # noqa: E501
+            (
+                r"audio_language_adapter\.0\.weight",
+                r"audio_language_adapter.w_in.weight",
+            ),
+            (
+                r"audio_language_adapter\.2\.weight",
+                r"audio_language_adapter.w_out.weight",
+            ),
         ]
-        # fmt: on
 
         audio_params = dict(
             nn.ModuleDict(
@@ -678,19 +682,44 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
 class VoxtralEncoderModel(nn.Module):
     packed_modules_mapping = {"qkv_proj": ["q_proj", "k_proj", "v_proj"]}
 
-    # fmt: off
     mistral_remapping = [
-        (r"whisper_encoder\.conv_layers\.0\.(weight|bias)", r"whisper_encoder.conv1.\1"), # noqa: E501
-        (r"whisper_encoder\.conv_layers\.1\.(weight|bias)", r"whisper_encoder.conv2.\1"), # noqa: E501
-        (r"whisper_encoder\.transformer\.layers\.(\d+)\.attention\.w([qkv])\.(weight|bias)", r"whisper_encoder.layers.\1.self_attn.\2_proj.\3"), # noqa: E501
-        (r"whisper_encoder\.transformer\.layers\.(\d+)\.attention\.wo\.(weight|bias)", r"whisper_encoder.layers.\1.self_attn.out_proj.\2"), # noqa: E501
-        (r"whisper_encoder\.transformer\.layers\.(\d+)\.attention_norm\.(weight|bias)", r"whisper_encoder.layers.\1.self_attn_layer_norm.\2"), # noqa: E501
-        (r"whisper_encoder\.transformer\.layers\.(\d+)\.feed_forward\.w1\.(weight|bias)", r"whisper_encoder.layers.\1.mlp.fc1.\2"), # noqa: E501
-        (r"whisper_encoder\.transformer\.layers\.(\d+)\.feed_forward\.w2\.(weight|bias)", r"whisper_encoder.layers.\1.mlp.fc2.\2"), # noqa: E501
-        (r"whisper_encoder\.transformer\.layers\.(\d+)\.ffn_norm\.(weight|bias)", r"whisper_encoder.layers.\1.final_layer_norm.\2"), # noqa: E501
-        (r"whisper_encoder\.transformer\.norm\.(weight|bias)", r"whisper_encoder.layer_norm.\1"), # noqa: E501
+        (
+            r"whisper_encoder\.conv_layers\.0\.(weight|bias)",
+            r"whisper_encoder.conv1.\1",
+        ),
+        (
+            r"whisper_encoder\.conv_layers\.1\.(weight|bias)",
+            r"whisper_encoder.conv2.\1",
+        ),
+        (
+            r"whisper_encoder\.transformer\.layers\.(\d+)\.attention\.w([qkv])\.(weight|bias)",  # noqa: E501
+            r"whisper_encoder.layers.\1.self_attn.\2_proj.\3",
+        ),
+        (
+            r"whisper_encoder\.transformer\.layers\.(\d+)\.attention\.wo\.(weight|bias)",  # noqa: E501
+            r"whisper_encoder.layers.\1.self_attn.out_proj.\2",
+        ),
+        (
+            r"whisper_encoder\.transformer\.layers\.(\d+)\.attention_norm\.(weight|bias)",  # noqa: E501
+            r"whisper_encoder.layers.\1.self_attn_layer_norm.\2",
+        ),
+        (
+            r"whisper_encoder\.transformer\.layers\.(\d+)\.feed_forward\.w1\.(weight|bias)",  # noqa: E501
+            r"whisper_encoder.layers.\1.mlp.fc1.\2",
+        ),
+        (
+            r"whisper_encoder\.transformer\.layers\.(\d+)\.feed_forward\.w2\.(weight|bias)",  # noqa: E501
+            r"whisper_encoder.layers.\1.mlp.fc2.\2",
+        ),
+        (
+            r"whisper_encoder\.transformer\.layers\.(\d+)\.ffn_norm\.(weight|bias)",
+            r"whisper_encoder.layers.\1.final_layer_norm.\2",
+        ),
+        (
+            r"whisper_encoder\.transformer\.norm\.(weight|bias)",
+            r"whisper_encoder.layer_norm.\1",
+        ),
     ]
-    # fmt: on
 
     def __init__(
         self,

From e32e5e30df07b68f11a09321f0343f24ed671792 Mon Sep 17 00:00:00 2001
From: ihb2032 <40718643+ihb2032@users.noreply.github.com>
Date: Mon, 6 Oct 2025 00:18:22 +0800
Subject: [PATCH 187/193] fix(tests): Resolve late binding of loop variable in
 assert message lambda (#26249)

Signed-off-by: lyd1992 <liuyudong@iscas.ac.cn>
Signed-off-by: ihb2032 <1355790728@qq.com
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 tests/kernels/mamba/test_mamba_ssm_ssd.py | 12 ++++++------
 1 file changed, 6 insertions(+), 6 deletions(-)

diff --git a/tests/kernels/mamba/test_mamba_ssm_ssd.py b/tests/kernels/mamba/test_mamba_ssm_ssd.py
index b068ea1ac49c..57dcb789e97b 100644
--- a/tests/kernels/mamba/test_mamba_ssm_ssd.py
+++ b/tests/kernels/mamba/test_mamba_ssm_ssd.py
@@ -562,15 +562,15 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
             Y_ref_seq[: chunked_seqlens[i], ...],
             atol=atol,
             rtol=rtol,
-            msg=lambda x: f"seq{i} output part1 " + x,
-        )  # noqa: B023
+            msg=lambda x, i=i: f"seq{i} output part1 " + x,
+        )
         torch.testing.assert_close(
             Y_seq[chunked_seqlens[i] :, ...],
             Y_ref_seq[chunked_seqlens[i] :, ...],
             atol=atol,
             rtol=rtol,
-            msg=lambda x: f"seq{i} output part2 " + x,
-        )  # noqa: B023
+            msg=lambda x, i=i: f"seq{i} output part2 " + x,
+        )
 
         state_seq = state_chunked[i]
         state_seq_ref = state_ref[i]
@@ -579,5 +579,5 @@ def test_mamba_chunk_scan_cont_batch_prefill_chunking(chunk_size, seqlens):
             state_seq_ref,
             atol=atol,
             rtol=rtol,
-            msg=lambda x: f"seq{i} state " + x,
-        )  # noqa: B023
+            msg=lambda x, i=i: f"seq{i} state " + x,
+        )

From c63b1fe2efdb872ace235ab072603457574a2e81 Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Sun, 5 Oct 2025 17:37:55 +0100
Subject: [PATCH 188/193] Fix per file ruff ignores related to typing (#26254)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 pyproject.toml                                | 18 +---
 tests/compile/test_full_graph.py              |  4 +-
 tests/entrypoints/openai/test_serving_chat.py |  6 +-
 .../prithvi_io_processor/prithvi_processor.py | 22 ++---
 tests/v1/engine/test_llm_engine.py            |  4 +-
 vllm/attention/backends/abstract.py           | 12 +--
 vllm/attention/layer.py                       |  6 +-
 .../layers/chunked_local_attention.py         |  4 +-
 vllm/attention/ops/flashmla.py                | 10 +-
 vllm/attention/ops/paged_attn.py              | 10 +-
 vllm/engine/arg_utils.py                      | 17 ++--
 vllm/engine/metrics.py                        | 42 ++++----
 vllm/engine/metrics_types.py                  | 35 ++++---
 vllm/entrypoints/harmony_utils.py             | 24 ++---
 vllm/executor/executor_base.py                | 16 +--
 vllm/executor/msgspec_utils.py                |  4 +-
 vllm/executor/ray_distributed_executor.py     | 30 +++---
 vllm/executor/ray_utils.py                    | 16 +--
 vllm/executor/uniproc_executor.py             | 10 +-
 .../layers/fused_moe/flashinfer_trtllm_moe.py |  7 +-
 vllm/multimodal/inputs.py                     |  2 +-
 vllm/plugins/io_processors/__init__.py        |  3 +-
 vllm/utils/__init__.py                        | 99 +++++++++----------
 vllm/utils/deep_gemm.py                       |  4 +-
 vllm/utils/flashinfer.py                      |  8 +-
 vllm/v1/attention/backends/flashinfer.py      | 50 +++++-----
 vllm/v1/core/sched/output.py                  | 18 ++--
 vllm/v1/core/sched/scheduler.py               | 24 ++---
 vllm/v1/structured_output/__init__.py         | 10 +-
 vllm/v1/structured_output/backend_guidance.py |  4 +-
 vllm/v1/structured_output/request.py          | 10 +-
 vllm/v1/worker/worker_base.py                 | 14 +--
 32 files changed, 258 insertions(+), 285 deletions(-)

diff --git a/pyproject.toml b/pyproject.toml
index 2b416d3206c2..34846a4f8866 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -115,6 +115,7 @@ include = ["vllm*"]
 "vllm/distributed/parallel_state.py" = ["SIM108"]
 "vllm/entrypoints/chat_utils.py" = ["SIM108"]
 "vllm/entrypoints/llm.py" = ["SIM108"]
+"vllm/executor/ray_distributed_executor.py" = ["SIM108", "SIM112"]
 "vllm/model_executor/layers/batch_invariant.py" = ["SIM108"]
 "vllm/model_executor/layers/fla/ops/chunk_o.py" = ["SIM108"]
 "vllm/model_executor/layers/fused_moe/fused_moe.py" = ["SIM108"]
@@ -134,23 +135,6 @@ include = ["vllm*"]
 "tools/profiler/print_layerwise_table.py" = ["SIM118"]
 ## Loop variable binding issues
 "tests/kernels/mamba/test_mamba_ssm_ssd.py" = ["B023"]
-## Type annotation modernization and other rules
-"vllm/attention/backends/abstract.py" = ["UP035", "UP006"]
-"vllm/attention/layer.py" = ["UP035", "UP006"]
-"vllm/attention/layers/chunked_local_attention.py" = ["UP035", "UP006"]
-"vllm/attention/ops/flashmla.py" = ["UP035", "UP006"]
-"vllm/attention/ops/paged_attn.py" = ["UP035", "UP006"]
-"vllm/engine/arg_utils.py" = ["UP035", "UP006"]
-"vllm/engine/metrics.py" = ["UP035", "UP006"]
-"vllm/engine/metrics_types.py" = ["UP035", "UP006"]
-"vllm/executor/executor_base.py" = ["UP035", "UP006"]
-"vllm/executor/msgspec_utils.py" = ["UP035", "UP006"]
-"vllm/executor/ray_distributed_executor.py" = ["UP035", "UP006", "SIM108", "SIM112"]
-"vllm/executor/ray_utils.py" = ["UP035", "UP006"]
-"vllm/executor/uniproc_executor.py" = ["UP035", "UP006"]
-"vllm/model_executor/layers/fused_moe/flashinfer_trtllm_moe.py" = ["UP035"]
-## Type comparison issues
-"vllm/multimodal/inputs.py" = ["E721"]
 # End of temporary ignores
 
 [tool.ruff.lint]
diff --git a/tests/compile/test_full_graph.py b/tests/compile/test_full_graph.py
index 319b31d3a90d..8ccae4cfb9df 100644
--- a/tests/compile/test_full_graph.py
+++ b/tests/compile/test_full_graph.py
@@ -5,7 +5,7 @@
 
 import logging
 import tempfile
-from typing import Any, Optional, Union
+from typing import Any, Union
 
 import pytest
 import torch
@@ -21,7 +21,7 @@
 from ..utils import create_new_process_for_each_test
 
 
-def models_list(*, all: bool = True, keywords: Optional[list[str]] = None):
+def models_list(*, all: bool = True, keywords: list[str] | None = None):
     TEST_MODELS: list[tuple[str, dict[str, Any]]] = [
         ("facebook/opt-125m", {}),
         (
diff --git a/tests/entrypoints/openai/test_serving_chat.py b/tests/entrypoints/openai/test_serving_chat.py
index a52b9a436f6d..abe5a5f4ffc1 100644
--- a/tests/entrypoints/openai/test_serving_chat.py
+++ b/tests/entrypoints/openai/test_serving_chat.py
@@ -6,7 +6,7 @@
 import asyncio
 from contextlib import suppress
 from dataclasses import dataclass, field
-from typing import TYPE_CHECKING, Any, Optional
+from typing import TYPE_CHECKING, Any
 from unittest.mock import AsyncMock, MagicMock
 
 import pytest
@@ -233,9 +233,9 @@ class MockModelConfig:
     multimodal_config = MultiModalConfig()
     hf_config = MockHFConfig()
     logits_processor_pattern = None
-    diff_sampling_param: Optional[dict] = None
+    diff_sampling_param: dict | None = None
     allowed_local_media_path: str = ""
-    allowed_media_domains: Optional[list[str]] = None
+    allowed_media_domains: list[str] | None = None
     encoder_config = None
     generation_config: str = "auto"
     media_io_kwargs: dict[str, dict[str, Any]] = field(default_factory=dict)
diff --git a/tests/plugins/prithvi_io_processor_plugin/prithvi_io_processor/prithvi_processor.py b/tests/plugins/prithvi_io_processor_plugin/prithvi_io_processor/prithvi_processor.py
index 1d8a7d204046..a2a8d0ec9aba 100644
--- a/tests/plugins/prithvi_io_processor_plugin/prithvi_io_processor/prithvi_processor.py
+++ b/tests/plugins/prithvi_io_processor_plugin/prithvi_io_processor/prithvi_processor.py
@@ -9,7 +9,7 @@
 import tempfile
 import urllib.request
 from collections.abc import Sequence
-from typing import Any, Optional, Union
+from typing import Any, Union
 
 import albumentations
 import numpy as np
@@ -98,9 +98,9 @@ def _convert_np_uint8(float_image: torch.Tensor):
 
 
 def read_geotiff(
-    file_path: Optional[str] = None,
-    path_type: Optional[str] = None,
-    file_data: Optional[bytes] = None,
+    file_path: str | None = None,
+    path_type: str | None = None,
+    file_data: bytes | None = None,
 ) -> tuple[torch.Tensor, dict, tuple[float, float] | None]:
     """Read all bands from *file_path* and return image + meta info.
 
@@ -114,8 +114,8 @@ def read_geotiff(
 
     if all([x is None for x in [file_path, path_type, file_data]]):
         raise Exception("All input fields to read_geotiff are None")
-    write_to_file: Optional[bytes] = None
-    path: Optional[str] = None
+    write_to_file: bytes | None = None
+    path: str | None = None
     if file_data is not None:
         # with tempfile.NamedTemporaryFile() as tmpfile:
         #     tmpfile.write(file_data)
@@ -162,9 +162,9 @@ def read_geotiff(
 def load_image(
     data: Union[list[str]],
     path_type: str,
-    mean: Optional[list[float]] = None,
-    std: Optional[list[float]] = None,
-    indices: Optional[Union[list[int], None]] = None,
+    mean: list[float] | None = None,
+    std: list[float] | None = None,
+    indices: Union[list[int], None] | None = None,
 ):
     """Build an input example by loading images in *file_paths*.
 
@@ -278,7 +278,7 @@ def output_to_response(
     def pre_process(
         self,
         prompt: IOProcessorInput,
-        request_id: Optional[str] = None,
+        request_id: str | None = None,
         **kwargs,
     ) -> Union[PromptType, Sequence[PromptType]]:
         image_data = dict(prompt)
@@ -359,7 +359,7 @@ def pre_process(
     def post_process(
         self,
         model_output: Sequence[PoolingRequestOutput],
-        request_id: Optional[str] = None,
+        request_id: str | None = None,
         **kwargs,
     ) -> IOProcessorOutput:
         pred_imgs_list = []
diff --git a/tests/v1/engine/test_llm_engine.py b/tests/v1/engine/test_llm_engine.py
index 820c2709284e..a19ba562136f 100644
--- a/tests/v1/engine/test_llm_engine.py
+++ b/tests/v1/engine/test_llm_engine.py
@@ -3,7 +3,7 @@
 from __future__ import annotations
 
 import random
-from typing import TYPE_CHECKING, Optional
+from typing import TYPE_CHECKING
 
 import pytest
 
@@ -78,7 +78,7 @@ def vllm_model_skip_tokenizer_init(vllm_runner, request, monkeypatch):
 
 def _get_test_sampling_params(
     prompt_list: list[str],
-    seed: Optional[int] = 42,
+    seed: int | None = 42,
     structured_outputs: bool = False,
 ) -> tuple[list[SamplingParams], list[int]]:
     """Generate random sampling params for a batch."""
diff --git a/vllm/attention/backends/abstract.py b/vllm/attention/backends/abstract.py
index d746c3295c56..bb2f36271103 100644
--- a/vllm/attention/backends/abstract.py
+++ b/vllm/attention/backends/abstract.py
@@ -2,7 +2,7 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 from abc import ABC, abstractmethod
-from typing import Generic, List, Optional, Protocol, Tuple, Type, TypeVar
+from typing import Generic, Optional, Protocol, TypeVar
 
 import torch
 
@@ -48,12 +48,12 @@ def get_name() -> str:
 
     @staticmethod
     @abstractmethod
-    def get_impl_cls() -> Type["AttentionImpl"]:
+    def get_impl_cls() -> type["AttentionImpl"]:
         raise NotImplementedError
 
     @staticmethod
     @abstractmethod
-    def get_metadata_cls() -> Type["AttentionMetadata"]:
+    def get_metadata_cls() -> type["AttentionMetadata"]:
         raise NotImplementedError
 
     @classmethod
@@ -73,11 +73,11 @@ def get_kv_cache_shape(
         num_kv_heads: int,
         head_size: int,
         cache_dtype_str: str = "auto",
-    ) -> Tuple[int, ...]:
+    ) -> tuple[int, ...]:
         raise NotImplementedError
 
     @staticmethod
-    def get_kv_cache_stride_order() -> Tuple[int, ...]:
+    def get_kv_cache_stride_order() -> tuple[int, ...]:
         raise NotImplementedError
 
     @classmethod
@@ -147,7 +147,7 @@ def __init__(
         head_size: int,
         scale: float,
         num_kv_heads: Optional[int] = None,
-        alibi_slopes: Optional[List[float]] = None,
+        alibi_slopes: Optional[list[float]] = None,
         sliding_window: Optional[int] = None,
         kv_cache_dtype: str = "auto",
         logits_soft_cap: Optional[float] = None,
diff --git a/vllm/attention/layer.py b/vllm/attention/layer.py
index 6f3b67b281ce..6994debd4589 100644
--- a/vllm/attention/layer.py
+++ b/vllm/attention/layer.py
@@ -2,7 +2,7 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 """Attention layer."""
 
-from typing import Callable, List, Optional
+from typing import Callable, Optional
 
 import torch
 import torch.nn as nn
@@ -126,7 +126,7 @@ def __init__(
         head_size: int,
         scale: float,
         num_kv_heads: Optional[int] = None,
-        alibi_slopes: Optional[List[float]] = None,
+        alibi_slopes: Optional[list[float]] = None,
         cache_config: Optional[CacheConfig] = None,
         quant_config: Optional[QuantizationConfig] = None,
         logits_soft_cap: Optional[float] = None,
@@ -586,7 +586,7 @@ def wait_for_kv_layer_from_connector(layer_name: str):
 
 def maybe_save_kv_layer_to_connector(
     layer_name: str,
-    kv_cache_layer: List[torch.Tensor],
+    kv_cache_layer: list[torch.Tensor],
 ):
     if not has_kv_transfer_group() or not is_v1_kv_transfer_group():
         return
diff --git a/vllm/attention/layers/chunked_local_attention.py b/vllm/attention/layers/chunked_local_attention.py
index 7554a4102289..3d37e901605f 100644
--- a/vllm/attention/layers/chunked_local_attention.py
+++ b/vllm/attention/layers/chunked_local_attention.py
@@ -1,7 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 import functools
-from typing import ClassVar, List, Optional
+from typing import ClassVar, Optional
 
 import torch
 
@@ -61,7 +61,7 @@ def __init__(
         scale: float,
         attention_chunk_size: int,
         num_kv_heads: Optional[int] = None,
-        alibi_slopes: Optional[List[float]] = None,
+        alibi_slopes: Optional[list[float]] = None,
         cache_config: Optional[CacheConfig] = None,
         quant_config: Optional[QuantizationConfig] = None,
         kv_sharing_target_layer_name: Optional[str] = None,
diff --git a/vllm/attention/ops/flashmla.py b/vllm/attention/ops/flashmla.py
index 20eaeb6bd405..0fe01a51ec62 100644
--- a/vllm/attention/ops/flashmla.py
+++ b/vllm/attention/ops/flashmla.py
@@ -1,7 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 # adapted from: https://github.com/deepseek-ai/FlashMLA/blob/main/flash_mla/flash_mla_interface.py
-from typing import Optional, Tuple
+from typing import Optional
 
 import torch
 
@@ -31,7 +31,7 @@
     _flashmla_extension_C_AVAILABLE = False
 
 
-def is_flashmla_supported() -> Tuple[bool, Optional[str]]:
+def is_flashmla_supported() -> tuple[bool, Optional[str]]:
     """
     Return: is_supported_flag, unsupported_reason (optional).
     """
@@ -57,7 +57,7 @@ def get_mla_metadata(
     num_heads_q: Optional[int] = None,
     is_fp8_kvcache: bool = False,
     topk: Optional[int] = None,
-) -> Tuple[torch.Tensor, torch.Tensor]:
+) -> tuple[torch.Tensor, torch.Tensor]:
     """
     Arguments:
     - cache_seqlens: (batch_size), dtype torch.int32.
@@ -101,7 +101,7 @@ def flash_mla_with_kvcache(
     descale_k: Optional[torch.Tensor] = None,
     is_fp8_kvcache: bool = False,
     indices: Optional[torch.Tensor] = None,
-) -> Tuple[torch.Tensor, torch.Tensor]:
+) -> tuple[torch.Tensor, torch.Tensor]:
     """
     Arguments:
     - q: (batch_size, seq_len_q, num_heads_q, head_dim).
@@ -183,7 +183,7 @@ def flash_mla_sparse_prefill(
     indices: torch.Tensor,
     sm_scale: float,
     d_v: int = 512,
-) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
+) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
     """
     Sparse attention prefill kernel
 
diff --git a/vllm/attention/ops/paged_attn.py b/vllm/attention/ops/paged_attn.py
index cdf0c929cea9..4db7d1a3a325 100644
--- a/vllm/attention/ops/paged_attn.py
+++ b/vllm/attention/ops/paged_attn.py
@@ -2,7 +2,7 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 from dataclasses import dataclass
-from typing import List, Optional, Tuple
+from typing import Optional
 
 import torch
 
@@ -41,7 +41,7 @@ class PagedAttentionMetadata:
 
 class PagedAttention:
     @staticmethod
-    def get_supported_head_sizes() -> List[int]:
+    def get_supported_head_sizes() -> list[int]:
         return [32, 64, 80, 96, 112, 120, 128, 192, 256]
 
     @staticmethod
@@ -51,7 +51,7 @@ def get_kv_cache_shape(
         num_kv_heads: int,
         head_size: int,
         cache_dtype_str: str = "auto",
-    ) -> Tuple[int, ...]:
+    ) -> tuple[int, ...]:
         return (2, num_blocks, block_size * num_kv_heads * head_size)
 
     @staticmethod
@@ -59,7 +59,7 @@ def split_kv_cache(
         kv_cache: torch.Tensor,
         num_kv_heads: int,
         head_size: int,
-    ) -> Tuple[torch.Tensor, torch.Tensor]:
+    ) -> tuple[torch.Tensor, torch.Tensor]:
         x = 16 // kv_cache.element_size()
         num_blocks = kv_cache.shape[1]
 
@@ -255,7 +255,7 @@ def swap_blocks(
 
     @staticmethod
     def copy_blocks(
-        kv_caches: List[torch.Tensor],
+        kv_caches: list[torch.Tensor],
         src_to_dists: torch.Tensor,
     ) -> None:
         key_caches = [kv_cache[0] for kv_cache in kv_caches]
diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index d7ba70381dff..a94ef598f2de 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -14,11 +14,8 @@
     Annotated,
     Any,
     Callable,
-    Dict,
-    List,
     Literal,
     Optional,
-    Type,
     TypeVar,
     Union,
     cast,
@@ -325,7 +322,7 @@ class EngineArgs:
     """Arguments for vLLM engine."""
 
     model: str = ModelConfig.model
-    served_model_name: Optional[Union[str, List[str]]] = ModelConfig.served_model_name
+    served_model_name: Optional[Union[str, list[str]]] = ModelConfig.served_model_name
     tokenizer: Optional[str] = ModelConfig.tokenizer
     hf_config_path: Optional[str] = ModelConfig.hf_config_path
     runner: RunnerOption = ModelConfig.runner
@@ -350,7 +347,7 @@ class EngineArgs:
     # is intended for expert use only. The API may change without
     # notice.
     distributed_executor_backend: Optional[
-        Union[str, DistributedExecutorBackend, Type[ExecutorBase]]
+        Union[str, DistributedExecutorBackend, type[ExecutorBase]]
     ] = ParallelConfig.distributed_executor_backend
     # number of P/D disaggregation (or other disaggregation) workers
     pipeline_parallel_size: int = ParallelConfig.pipeline_parallel_size
@@ -418,7 +415,7 @@ class EngineArgs:
     media_io_kwargs: dict[str, dict[str, Any]] = get_field(
         MultiModalConfig, "media_io_kwargs"
     )
-    mm_processor_kwargs: Optional[Dict[str, Any]] = MultiModalConfig.mm_processor_kwargs
+    mm_processor_kwargs: Optional[dict[str, Any]] = MultiModalConfig.mm_processor_kwargs
     disable_mm_preprocessor_cache: bool = False  # DEPRECATED
     mm_processor_cache_gb: float = MultiModalConfig.mm_processor_cache_gb
     mm_processor_cache_type: Optional[MMCacheType] = (
@@ -436,7 +433,7 @@ class EngineArgs:
     enable_lora_bias: bool = LoRAConfig.bias_enabled
     max_loras: int = LoRAConfig.max_loras
     max_lora_rank: int = LoRAConfig.max_lora_rank
-    default_mm_loras: Optional[Dict[str, str]] = LoRAConfig.default_mm_loras
+    default_mm_loras: Optional[dict[str, str]] = LoRAConfig.default_mm_loras
     fully_sharded_loras: bool = LoRAConfig.fully_sharded_loras
     max_cpu_loras: Optional[int] = LoRAConfig.max_cpu_loras
     lora_dtype: Optional[Union[str, torch.dtype]] = LoRAConfig.lora_dtype
@@ -446,7 +443,7 @@ class EngineArgs:
     num_gpu_blocks_override: Optional[int] = CacheConfig.num_gpu_blocks_override
     num_lookahead_slots: int = SchedulerConfig.num_lookahead_slots
     model_loader_extra_config: dict = get_field(LoadConfig, "model_loader_extra_config")
-    ignore_patterns: Optional[Union[str, List[str]]] = LoadConfig.ignore_patterns
+    ignore_patterns: Optional[Union[str, list[str]]] = LoadConfig.ignore_patterns
 
     enable_chunked_prefill: Optional[bool] = SchedulerConfig.enable_chunked_prefill
     disable_chunked_mm_input: bool = SchedulerConfig.disable_chunked_mm_input
@@ -467,7 +464,7 @@ class EngineArgs:
 
     logits_processor_pattern: Optional[str] = ModelConfig.logits_processor_pattern
 
-    speculative_config: Optional[Dict[str, Any]] = None
+    speculative_config: Optional[dict[str, Any]] = None
 
     show_hidden_metrics_for_version: Optional[str] = (
         ObservabilityConfig.show_hidden_metrics_for_version
@@ -477,7 +474,7 @@ class EngineArgs:
         ObservabilityConfig.collect_detailed_traces
     )
     scheduling_policy: SchedulerPolicy = SchedulerConfig.policy
-    scheduler_cls: Union[str, Type[object]] = SchedulerConfig.scheduler_cls
+    scheduler_cls: Union[str, type[object]] = SchedulerConfig.scheduler_cls
 
     pooler_config: Optional[PoolerConfig] = ModelConfig.pooler_config
     override_pooler_config: Optional[Union[dict, PoolerConfig]] = (
diff --git a/vllm/engine/metrics.py b/vllm/engine/metrics.py
index 2f48a0d62218..45b798ed96cb 100644
--- a/vllm/engine/metrics.py
+++ b/vllm/engine/metrics.py
@@ -3,7 +3,7 @@
 
 import time
 from collections import Counter as CollectionsCounter
-from typing import Dict, List, Optional, Type, Union, cast
+from typing import Optional, Union, cast
 
 import numpy as np
 import prometheus_client
@@ -43,7 +43,7 @@ class Metrics:
     _counter_cls = prometheus_client.Counter
     _histogram_cls = prometheus_client.Histogram
 
-    def __init__(self, labelnames: List[str], vllm_config: VllmConfig):
+    def __init__(self, labelnames: list[str], vllm_config: VllmConfig):
         # Unregister any existing vLLM collectors (for CI/CD)
         self._unregister_vllm_metrics()
 
@@ -304,7 +304,7 @@ def __init__(
         self,
         name: str,
         documentation: str = "",
-        labelnames: Optional[List[str]] = None,
+        labelnames: Optional[list[str]] = None,
         multiprocess_mode: str = "",
     ):
         del multiprocess_mode
@@ -330,7 +330,7 @@ class _RayCounterWrapper:
     prometheus_client.Counter"""
 
     def __init__(
-        self, name: str, documentation: str = "", labelnames: Optional[List[str]] = None
+        self, name: str, documentation: str = "", labelnames: Optional[list[str]] = None
     ):
         labelnames_tuple = tuple(labelnames) if labelnames else None
         self._counter = ray_metrics.Counter(
@@ -355,8 +355,8 @@ def __init__(
         self,
         name: str,
         documentation: str = "",
-        labelnames: Optional[List[str]] = None,
-        buckets: Optional[List[float]] = None,
+        labelnames: Optional[list[str]] = None,
+        buckets: Optional[list[float]] = None,
     ):
         labelnames_tuple = tuple(labelnames) if labelnames else None
         boundaries = buckets if buckets else []
@@ -381,17 +381,17 @@ class RayMetrics(Metrics):
     Provides the same metrics as Metrics but uses Ray's util.metrics library.
     """
 
-    _gauge_cls: Type[prometheus_client.Gauge] = cast(
-        Type[prometheus_client.Gauge], _RayGaugeWrapper
+    _gauge_cls: type[prometheus_client.Gauge] = cast(
+        type[prometheus_client.Gauge], _RayGaugeWrapper
     )
-    _counter_cls: Type[prometheus_client.Counter] = cast(
-        Type[prometheus_client.Counter], _RayCounterWrapper
+    _counter_cls: type[prometheus_client.Counter] = cast(
+        type[prometheus_client.Counter], _RayCounterWrapper
     )
-    _histogram_cls: Type[prometheus_client.Histogram] = cast(
-        Type[prometheus_client.Histogram], _RayHistogramWrapper
+    _histogram_cls: type[prometheus_client.Histogram] = cast(
+        type[prometheus_client.Histogram], _RayHistogramWrapper
     )
 
-    def __init__(self, labelnames: List[str], vllm_config: VllmConfig):
+    def __init__(self, labelnames: list[str], vllm_config: VllmConfig):
         if ray_metrics is None:
             raise ImportError("RayMetrics requires Ray to be installed.")
         super().__init__(labelnames, vllm_config)
@@ -401,14 +401,14 @@ def _unregister_vllm_metrics(self) -> None:
         pass
 
 
-def build_buckets(mantissa_lst: List[int], max_value: int) -> List[int]:
+def build_buckets(mantissa_lst: list[int], max_value: int) -> list[int]:
     """
     Builds a list of buckets with increasing powers of 10 multiplied by
     mantissa values until the value exceeds the specified maximum.
 
     """
     exponent = 0
-    buckets: List[int] = []
+    buckets: list[int] = []
     while True:
         for m in mantissa_lst:
             value = m * 10**exponent
@@ -419,7 +419,7 @@ def build_buckets(mantissa_lst: List[int], max_value: int) -> List[int]:
         exponent += 1
 
 
-def build_1_2_5_buckets(max_value: int) -> List[int]:
+def build_1_2_5_buckets(max_value: int) -> list[int]:
     """
     Example:
     >>> build_1_2_5_buckets(100)
@@ -428,7 +428,7 @@ def build_1_2_5_buckets(max_value: int) -> List[int]:
     return build_buckets([1, 2, 5], max_value)
 
 
-def build_1_2_3_5_8_buckets(max_value: int) -> List[int]:
+def build_1_2_3_5_8_buckets(max_value: int) -> list[int]:
     """
     Example:
     >>> build_1_2_3_5_8_buckets(100)
@@ -442,7 +442,7 @@ def local_interval_elapsed(now: float, last_log: float, local_interval: float) -
     return elapsed_time > local_interval
 
 
-def get_throughput(tracked_stats: List[int], now: float, last_log: float) -> float:
+def get_throughput(tracked_stats: list[int], now: float, last_log: float) -> float:
     return float(np.sum(tracked_stats) / (now - last_log))
 
 
@@ -530,7 +530,7 @@ class PrometheusStatLogger(StatLoggerBase):
     _gauge_cls = prometheus_client.Gauge
 
     def __init__(
-        self, local_interval: float, labels: Dict[str, str], vllm_config: VllmConfig
+        self, local_interval: float, labels: dict[str, str], vllm_config: VllmConfig
     ) -> None:
         super().__init__(local_interval, vllm_config)
         # Prometheus metrics
@@ -558,12 +558,12 @@ def _log_counter_labels(
         for label, count in data.items():
             counter.labels(**{**self.labels, label_key: label}).inc(count)
 
-    def _log_histogram(self, histogram, data: Union[List[int], List[float]]) -> None:
+    def _log_histogram(self, histogram, data: Union[list[int], list[float]]) -> None:
         # Convenience function for logging list to histogram.
         for datum in data:
             histogram.labels(**self.labels).observe(datum)
 
-    def _log_gauge_string(self, gauge, data: Dict[str, str]) -> None:
+    def _log_gauge_string(self, gauge, data: dict[str, str]) -> None:
         gauge.labels(**data).set_to_current_time()
 
     def _log_prometheus(self, stats: Stats) -> None:
diff --git a/vllm/engine/metrics_types.py b/vllm/engine/metrics_types.py
index d9a53fed7c41..ac796f4e1c75 100644
--- a/vllm/engine/metrics_types.py
+++ b/vllm/engine/metrics_types.py
@@ -16,7 +16,6 @@
 import time
 from abc import ABC, abstractmethod
 from dataclasses import dataclass
-from typing import List
 
 from vllm.config import SupportsMetricsInfo, VllmConfig
 
@@ -43,26 +42,26 @@ class Stats:
     num_prompt_tokens_iter: int
     num_generation_tokens_iter: int
     num_tokens_iter: int
-    time_to_first_tokens_iter: List[float]
-    inter_token_latencies_iter: List[float]
+    time_to_first_tokens_iter: list[float]
+    inter_token_latencies_iter: list[float]
     num_preemption_iter: int
 
     # Request stats (should have _requests suffix)
     #   Latency
-    time_e2e_requests: List[float]
-    time_queue_requests: List[float]
-    time_inference_requests: List[float]
-    time_prefill_requests: List[float]
-    time_decode_requests: List[float]
+    time_e2e_requests: list[float]
+    time_queue_requests: list[float]
+    time_inference_requests: list[float]
+    time_prefill_requests: list[float]
+    time_decode_requests: list[float]
     #   Metadata
-    num_prompt_tokens_requests: List[int]
-    num_generation_tokens_requests: List[int]
-    n_requests: List[int]
-    max_num_generation_tokens_requests: List[int]
-    max_tokens_requests: List[int]
-    finished_reason_requests: List[str]
-    waiting_lora_adapters: List[str]
-    running_lora_adapters: List[str]
+    num_prompt_tokens_requests: list[int]
+    num_generation_tokens_requests: list[int]
+    n_requests: list[int]
+    max_num_generation_tokens_requests: list[int]
+    max_tokens_requests: list[int]
+    finished_reason_requests: list[str]
+    waiting_lora_adapters: list[str]
+    running_lora_adapters: list[str]
     max_lora: str
 
 
@@ -71,8 +70,8 @@ class StatLoggerBase(ABC):
 
     def __init__(self, local_interval: float, vllm_config: VllmConfig) -> None:
         # Tracked stats over current local logging interval.
-        self.num_prompt_tokens: List[int] = []
-        self.num_generation_tokens: List[int] = []
+        self.num_prompt_tokens: list[int] = []
+        self.num_generation_tokens: list[int] = []
         self.last_local_log = time.time()
         self.local_interval = local_interval
 
diff --git a/vllm/entrypoints/harmony_utils.py b/vllm/entrypoints/harmony_utils.py
index 6a0bb152e412..bf6cc3e97c82 100644
--- a/vllm/entrypoints/harmony_utils.py
+++ b/vllm/entrypoints/harmony_utils.py
@@ -6,7 +6,7 @@
 import datetime
 import json
 from collections.abc import Iterable, Sequence
-from typing import Literal, Optional, Union
+from typing import Literal, Union
 
 from openai.types.responses import (
     ResponseFunctionToolCall,
@@ -79,13 +79,13 @@ def get_encoding():
 
 
 def get_system_message(
-    model_identity: Optional[str] = None,
-    reasoning_effort: Optional[Literal["high", "medium", "low"]] = None,
-    start_date: Optional[str] = None,
-    browser_description: Optional[str] = None,
-    python_description: Optional[str] = None,
-    container_description: Optional[str] = None,
-    instructions: Optional[str] = None,
+    model_identity: str | None = None,
+    reasoning_effort: Literal["high", "medium", "low"] | None = None,
+    start_date: str | None = None,
+    browser_description: str | None = None,
+    python_description: str | None = None,
+    container_description: str | None = None,
+    instructions: str | None = None,
     with_custom_tools: bool = False,
 ) -> Message:
     sys_msg_content = SystemContent.new()
@@ -137,8 +137,8 @@ def create_tool_definition(tool: Union[ChatCompletionToolsParam, Tool]):
 
 
 def get_developer_message(
-    instructions: Optional[str] = None,
-    tools: Optional[list[Union[Tool, ChatCompletionToolsParam]]] = None,
+    instructions: str | None = None,
+    tools: list[Union[Tool, ChatCompletionToolsParam]] | None = None,
 ) -> Message:
     dev_msg_content = DeveloperContent.new()
     if instructions is not None and not envs.VLLM_GPT_OSS_HARMONY_SYSTEM_INSTRUCTIONS:
@@ -202,7 +202,7 @@ def parse_response_input(
             msg = msg.with_channel("final")
     elif response_msg["type"] == "function_call_output":
         call_id = response_msg["call_id"]
-        call_response: Optional[ResponseFunctionToolCall] = None
+        call_response: ResponseFunctionToolCall | None = None
         for prev_response in reversed(prev_responses):
             if (
                 isinstance(prev_response, ResponseFunctionToolCall)
@@ -450,7 +450,7 @@ def parse_output_into_messages(token_ids: Iterable[int]) -> StreamableParser:
 
 def parse_chat_output(
     token_ids: Sequence[int],
-) -> tuple[Optional[str], Optional[str], bool]:
+) -> tuple[str | None, str | None, bool]:
     parser = parse_output_into_messages(token_ids)
     output_msgs = parser.messages
     is_tool_call = False  # TODO: update this when tool call is supported
diff --git a/vllm/executor/executor_base.py b/vllm/executor/executor_base.py
index af26918598a2..3a7347b8e465 100644
--- a/vllm/executor/executor_base.py
+++ b/vllm/executor/executor_base.py
@@ -6,7 +6,7 @@
 from abc import ABC, abstractmethod
 from collections.abc import Awaitable
 from functools import cached_property
-from typing import Any, Callable, List, Optional, Set, Union
+from typing import Any, Callable, Optional, Union
 
 from typing_extensions import TypeVar
 
@@ -143,7 +143,7 @@ def supported_tasks(self) -> tuple[SupportedTask, ...]:
 
     def execute_model(
         self, execute_model_req: ExecuteModelRequest
-    ) -> Optional[List[Union[SamplerOutput, PoolerOutput]]]:
+    ) -> Optional[list[Union[SamplerOutput, PoolerOutput]]]:
         output = self.collective_rpc("execute_model", args=(execute_model_req,))
         return output[0]
 
@@ -163,7 +163,7 @@ def pin_lora(self, lora_id: int) -> bool:
         assert lora_id > 0, "lora_id must be greater than 0."
         return all(self.collective_rpc("pin_lora", args=(lora_id,)))
 
-    def list_loras(self) -> Set[int]:
+    def list_loras(self) -> set[int]:
         sets = self.collective_rpc("list_loras")
         for s in sets:
             assert s == sets[0], "All workers should have the same LORAs."
@@ -238,7 +238,7 @@ def shutdown(self) -> None:
 
     async def execute_model_async(
         self, execute_model_req: ExecuteModelRequest
-    ) -> List[SamplerOutput]:
+    ) -> list[SamplerOutput]:
         """Executes one model step on the given sequences."""
         output = await make_async(self.execute_model)(execute_model_req)
         return output
@@ -272,7 +272,7 @@ def __init__(self, *args, **kwargs):
     def execute_model(
         self,
         execute_model_req: ExecuteModelRequest,
-    ) -> List[SamplerOutput]:
+    ) -> list[SamplerOutput]:
         # TODO: unify into collective_rpc
         if self.parallel_worker_tasks is None:
             self.parallel_worker_tasks = self._run_workers(
@@ -299,7 +299,7 @@ def stop_remote_worker_execution_loop(self) -> None:
     @abstractmethod
     def _driver_execute_model(
         self, execute_model_req: Optional[ExecuteModelRequest]
-    ) -> Optional[List[SamplerOutput]]:
+    ) -> Optional[list[SamplerOutput]]:
         """Run execute_model in the driver worker.
 
         Passing None will cause the driver to stop the model execution loop
@@ -346,7 +346,7 @@ def _wait_for_tasks_completion(self, parallel_worker_tasks: Any) -> None:
 
     async def execute_model_async(
         self, execute_model_req: ExecuteModelRequest
-    ) -> List[SamplerOutput]:
+    ) -> list[SamplerOutput]:
         if self.parallel_worker_tasks is None:
             # Start model execution loop running in the parallel workers
             self.parallel_worker_tasks = asyncio.create_task(
@@ -371,7 +371,7 @@ async def stop_remote_worker_execution_loop_async(self) -> None:
     async def _driver_execute_model_async(
         self,
         execute_model_req: Optional[ExecuteModelRequest] = None,
-    ) -> List[SamplerOutput]:
+    ) -> list[SamplerOutput]:
         """Execute the model asynchronously in the driver worker.
 
         Passing None will cause the driver to stop the model execution
diff --git a/vllm/executor/msgspec_utils.py b/vllm/executor/msgspec_utils.py
index 9ca190cd3cdc..ac16f06b160e 100644
--- a/vllm/executor/msgspec_utils.py
+++ b/vllm/executor/msgspec_utils.py
@@ -2,7 +2,7 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 from array import array
-from typing import Any, Type
+from typing import Any
 
 from vllm.multimodal.inputs import MultiModalKwargs
 from vllm.sequence import VLLM_TOKEN_ID_ARRAY_TYPE
@@ -23,7 +23,7 @@ def encode_hook(obj: Any) -> Any:
         return dict(obj)
 
 
-def decode_hook(type: Type, obj: Any) -> Any:
+def decode_hook(type: type, obj: Any) -> Any:
     """Custom msgspec dec hook that supports array types and MultiModalKwargs.
 
     See https://jcristharif.com/msgspec/api.html#msgspec.msgpack.Encoder
diff --git a/vllm/executor/ray_distributed_executor.py b/vllm/executor/ray_distributed_executor.py
index be124f76431e..40f2915667b9 100644
--- a/vllm/executor/ray_distributed_executor.py
+++ b/vllm/executor/ray_distributed_executor.py
@@ -5,7 +5,7 @@
 import os
 from collections import defaultdict
 from dataclasses import dataclass
-from typing import TYPE_CHECKING, Any, Callable, Dict, List, Optional, Union
+from typing import TYPE_CHECKING, Any, Callable, Optional, Union
 
 import cloudpickle
 import msgspec
@@ -114,10 +114,10 @@ def _init_executor(self) -> None:
         self._init_workers_ray(placement_group)
 
         self.input_encoder = msgspec.msgpack.Encoder(enc_hook=encode_hook)
-        self.output_decoder = msgspec.msgpack.Decoder(Optional[List[SamplerOutput]])
+        self.output_decoder = msgspec.msgpack.Decoder(Optional[list[SamplerOutput]])
         self.use_v1 = envs.VLLM_USE_V1
 
-        self.pp_locks: Optional[List[asyncio.Lock]] = None
+        self.pp_locks: Optional[list[asyncio.Lock]] = None
         if not self.use_ray_compiled_dag:
             self.driver_exec_method = make_async(self.driver_worker.execute_method)
 
@@ -137,7 +137,7 @@ def shutdown(self) -> None:
                 ray.kill(worker)
             self.forward_dag = None
 
-    def _configure_ray_workers_use_nsight(self, ray_remote_kwargs) -> Dict[str, Any]:
+    def _configure_ray_workers_use_nsight(self, ray_remote_kwargs) -> dict[str, Any]:
         # If nsight profiling is enabled, we need to set the profiling
         # configuration for the ray workers as runtime env.
         runtime_env = ray_remote_kwargs.setdefault("runtime_env", {})
@@ -164,12 +164,12 @@ def _init_workers_ray(self, placement_group: "PlacementGroup", **ray_remote_kwar
         # It holds the resource for the driver worker.
         self.driver_dummy_worker: Optional[RayWorkerWrapper] = None
         # The remaining workers are the actual ray actors.
-        self.workers: List[RayWorkerWrapper] = []
+        self.workers: list[RayWorkerWrapper] = []
 
         # Used in ray compiled DAG: indexed first by PP rank,
         # and then TP rank. In other words, the inner list is
         # the TP group of workers for a PP rank.
-        self.pp_tp_workers: List[List[RayWorkerWrapper]] = []
+        self.pp_tp_workers: list[list[RayWorkerWrapper]] = []
 
         if self.parallel_config.ray_workers_use_nsight:
             ray_remote_kwargs = self._configure_ray_workers_use_nsight(
@@ -179,7 +179,7 @@ def _init_workers_ray(self, placement_group: "PlacementGroup", **ray_remote_kwar
         logger.info("use_ray_spmd_worker: %s", self.use_ray_spmd_worker)
 
         # Create the workers.
-        bundle_indices: List[int]
+        bundle_indices: list[int]
         if envs.VLLM_RAY_BUNDLE_INDICES:
             # Use the bundle indices specified by the user.
             bundle_indices = list(map(int, envs.VLLM_RAY_BUNDLE_INDICES.split(",")))
@@ -200,7 +200,7 @@ def _init_workers_ray(self, placement_group: "PlacementGroup", **ray_remote_kwar
                     bundle_indices.append(bundle_id)
             bundle_indices = bundle_indices[: self.parallel_config.world_size]
 
-        worker_metadata: List[RayWorkerMetaData] = []
+        worker_metadata: list[RayWorkerMetaData] = []
         driver_ip = get_ip()
         for rank, bundle_id in enumerate(bundle_indices):
             scheduling_strategy = PlacementGroupSchedulingStrategy(
@@ -262,7 +262,7 @@ def _init_workers_ray(self, placement_group: "PlacementGroup", **ray_remote_kwar
                 "the driver on a GPU node."
             )
 
-        ip_counts: Dict[str, int] = {}
+        ip_counts: dict[str, int] = {}
         for ip in worker_ips:
             ip_counts[ip] = ip_counts.get(ip, 0) + 1
 
@@ -416,11 +416,11 @@ def sort_by_driver_then_worker_ip(item: RayWorkerMetaData):
         # This is the list of workers that are rank 0 of each TP group EXCEPT
         # global rank 0. These are the workers that will broadcast to the
         # rest of the workers.
-        self.tp_driver_workers: List[RayWorkerWrapper] = []
+        self.tp_driver_workers: list[RayWorkerWrapper] = []
         # This is the list of workers that are not drivers and not the first
         # worker in a TP group. These are the workers that will be
         # broadcasted to.
-        self.non_driver_workers: List[RayWorkerWrapper] = []
+        self.non_driver_workers: list[RayWorkerWrapper] = []
 
         # Enforce rank order for correct rank to return final output.
         for index, worker in enumerate(self.workers):
@@ -433,7 +433,7 @@ def sort_by_driver_then_worker_ip(item: RayWorkerMetaData):
 
     def _driver_execute_model(
         self, execute_model_req: Optional[ExecuteModelRequest]
-    ) -> Optional[List[SamplerOutput]]:
+    ) -> Optional[list[SamplerOutput]]:
         """Run execute_model in the driver worker.
 
         Passing None will cause the driver to stop the model execution
@@ -446,7 +446,7 @@ def _driver_execute_model(
 
     def execute_model(
         self, execute_model_req: ExecuteModelRequest
-    ) -> List[SamplerOutput]:
+    ) -> list[SamplerOutput]:
         if not self.use_ray_spmd_worker:
             return super().execute_model(execute_model_req)
 
@@ -675,7 +675,7 @@ def __del__(self):
 
     async def execute_model_async(
         self, execute_model_req: ExecuteModelRequest
-    ) -> List[SamplerOutput]:
+    ) -> list[SamplerOutput]:
         if not self.use_ray_spmd_worker:
             return await super().execute_model_async(execute_model_req)
 
@@ -689,7 +689,7 @@ async def execute_model_async(
 
     async def _driver_execute_model_async(
         self, execute_model_req: Optional[ExecuteModelRequest] = None
-    ) -> List[SamplerOutput]:
+    ) -> list[SamplerOutput]:
         assert not self.use_ray_spmd_worker, (
             "driver_worker does not exist for VLLM_USE_RAY_SPMD_WORKER=1"
         )
diff --git a/vllm/executor/ray_utils.py b/vllm/executor/ray_utils.py
index abe3d2be9f6d..c3c8a70678ad 100644
--- a/vllm/executor/ray_utils.py
+++ b/vllm/executor/ray_utils.py
@@ -4,7 +4,7 @@
 import os
 import time
 from collections import defaultdict
-from typing import TYPE_CHECKING, Dict, List, Optional, Tuple, Union
+from typing import TYPE_CHECKING, Optional, Union
 
 import msgspec
 
@@ -59,7 +59,7 @@ def __init__(self, *args, **kwargs) -> None:
         def get_node_ip(self) -> str:
             return get_ip()
 
-        def get_node_and_gpu_ids(self) -> Tuple[str, List[int]]:
+        def get_node_and_gpu_ids(self) -> tuple[str, list[int]]:
             node_id = ray.get_runtime_context().get_node_id()
             device_key = vllm.platforms.current_platform.ray_device_key
             if not device_key:
@@ -72,7 +72,7 @@ def get_node_and_gpu_ids(self) -> Tuple[str, List[int]]:
 
         def execute_model_spmd(
             self,
-            req_or_tuple: Union[bytes, Tuple[bytes, Optional[IntermediateTensors]]],
+            req_or_tuple: Union[bytes, tuple[bytes, Optional[IntermediateTensors]]],
         ) -> bytes:
             """Execute model in SPMD fashion: used only when SPMD worker and
             compiled DAG are both enabled.
@@ -126,10 +126,10 @@ def setup_device_if_necessary(self):
         def execute_model_ray(
             self,
             scheduler_output: Union[
-                "SchedulerOutput", Tuple["SchedulerOutput", "IntermediateTensors"]
+                "SchedulerOutput", tuple["SchedulerOutput", "IntermediateTensors"]
             ],
         ) -> Union[
-            "ModelRunnerOutput", Tuple["SchedulerOutput", "IntermediateTensors"]
+            "ModelRunnerOutput", tuple["SchedulerOutput", "IntermediateTensors"]
         ]:
             # This method is used by Ray Compiled Graph to execute the model,
             # and it needs a special logic of self.setup_device_if_necessary()
@@ -156,7 +156,7 @@ def execute_model_ray(
                 output = output.get_output()
             return output
 
-        def override_env_vars(self, vars: Dict[str, str]):
+        def override_env_vars(self, vars: dict[str, str]):
             os.environ.update(vars)
 
     ray_import_err = None
@@ -201,7 +201,7 @@ def _verify_bundles(
     # bundle_idx -> bundle (e.g., {"GPU": 1})
     bundles = pg_data["bundles"]
     # node_id -> List of bundle (e.g., {"GPU": 1})
-    node_id_to_bundle: Dict[str, List[Dict[str, float]]] = defaultdict(list)
+    node_id_to_bundle: dict[str, list[dict[str, float]]] = defaultdict(list)
 
     for bundle_idx, node_id in bundle_to_node_ids.items():
         node_id_to_bundle[node_id].append(bundles[bundle_idx])
@@ -383,7 +383,7 @@ def initialize_ray_cluster(
                 device_str,
             )
         # Create a new placement group
-        placement_group_specs: List[Dict[str, float]] = [
+        placement_group_specs: list[dict[str, float]] = [
             {device_str: 1.0} for _ in range(parallel_config.world_size)
         ]
 
diff --git a/vllm/executor/uniproc_executor.py b/vllm/executor/uniproc_executor.py
index ced054143c0c..8206f23d1878 100644
--- a/vllm/executor/uniproc_executor.py
+++ b/vllm/executor/uniproc_executor.py
@@ -4,7 +4,7 @@
 from concurrent.futures import Future, ThreadPoolExecutor
 from functools import cached_property
 from multiprocessing import Lock
-from typing import Any, Callable, Dict, List, Optional, Tuple, Union
+from typing import Any, Callable, Optional, Union
 
 import torch
 import torch.distributed as dist
@@ -68,10 +68,10 @@ def collective_rpc(
         self,
         method: Union[str, Callable],
         timeout: Optional[float] = None,
-        args: Tuple = (),
-        kwargs: Optional[Dict] = None,
+        args: tuple = (),
+        kwargs: Optional[dict] = None,
         non_block: bool = False,
-    ) -> List[Any]:
+    ) -> list[Any]:
         if kwargs is None:
             kwargs = {}
         if self.mm_receiver_cache is not None and method == "execute_model":
@@ -158,7 +158,7 @@ def _distributed_args(self) -> tuple[str, int, int]:
         local_rank = int(os.environ["LOCAL_RANK"])
         return distributed_init_method, rank, local_rank
 
-    def determine_num_available_blocks(self) -> Tuple[int, int]:
+    def determine_num_available_blocks(self) -> tuple[int, int]:
         """
         Determine the number of available KV blocks.
         Add an additional all_reduce to get the min across all ranks.
diff --git a/vllm/model_executor/layers/fused_moe/flashinfer_trtllm_moe.py b/vllm/model_executor/layers/fused_moe/flashinfer_trtllm_moe.py
index 88fc460d90f9..d12d05915566 100644
--- a/vllm/model_executor/layers/fused_moe/flashinfer_trtllm_moe.py
+++ b/vllm/model_executor/layers/fused_moe/flashinfer_trtllm_moe.py
@@ -1,9 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-from typing import (
-    List,  # noqa: UP035
-    Optional,
-)
+from typing import Optional
 
 import torch
 
@@ -32,7 +29,7 @@ def flashinfer_fused_moe_blockscale_fp8(
     intermediate_size: int,
     expert_offset: int,
     local_num_experts: int,
-    block_shape: List[int],  # noqa: UP006
+    block_shape: list[int],
     routed_scaling: float = 1.0,
 ) -> torch.Tensor:
     from vllm.utils.flashinfer import flashinfer_trtllm_fp8_block_scale_moe
diff --git a/vllm/multimodal/inputs.py b/vllm/multimodal/inputs.py
index 51e33ea26330..45e6ac2adaca 100644
--- a/vllm/multimodal/inputs.py
+++ b/vllm/multimodal/inputs.py
@@ -289,7 +289,7 @@ def __eq__(self, other: object) -> bool:
         return (
             (self.modality, self.key) == (other.modality, other.key)
             and data_equal
-            and type(self.field) == type(other.field)
+            and type(self.field) is type(other.field)
         )  # noqa: E721
 
 
diff --git a/vllm/plugins/io_processors/__init__.py b/vllm/plugins/io_processors/__init__.py
index 8ec96ed00980..7a914442c4ab 100644
--- a/vllm/plugins/io_processors/__init__.py
+++ b/vllm/plugins/io_processors/__init__.py
@@ -4,7 +4,6 @@
 from __future__ import annotations
 
 import logging
-from typing import Optional
 
 from vllm.config import VllmConfig
 from vllm.plugins import load_plugins_by_group
@@ -15,7 +14,7 @@
 
 
 def get_io_processor(
-    vllm_config: VllmConfig, plugin_from_init: Optional[str] = None
+    vllm_config: VllmConfig, plugin_from_init: str | None = None
 ) -> IOProcessor | None:
     # Input.Output processors are loaded as plugins under the
     # 'vllm.io_processor_plugins' group. Similar to platform
diff --git a/vllm/utils/__init__.py b/vllm/utils/__init__.py
index c9999649b58b..166380219bd9 100644
--- a/vllm/utils/__init__.py
+++ b/vllm/utils/__init__.py
@@ -68,7 +68,6 @@
     Generic,
     Literal,
     NamedTuple,
-    Optional,
     TextIO,
     TypeVar,
     Union,
@@ -247,9 +246,7 @@ def __sub__(self, other: CacheInfo):
 
 
 class LRUCache(cachetools.LRUCache[_K, _V], Generic[_K, _V]):
-    def __init__(
-        self, capacity: float, getsizeof: Optional[Callable[[_V], float]] = None
-    ):
+    def __init__(self, capacity: float, getsizeof: Callable[[_V], float] | None = None):
         super().__init__(capacity, getsizeof)
 
         self.pinned_items = set[_K]()
@@ -324,15 +321,15 @@ def touch(self, key: _K) -> None:
             self._LRUCache__order[key] = None  # type: ignore
 
     @overload
-    def get(self, key: _K, /) -> Optional[_V]: ...
+    def get(self, key: _K, /) -> _V | None: ...
 
     @overload
     def get(self, key: _K, /, default: Union[_V, _T]) -> Union[_V, _T]: ...
 
     def get(
-        self, key: _K, /, default: Optional[Union[_V, _T]] = None
-    ) -> Optional[Union[_V, _T]]:
-        value: Optional[Union[_V, _T]]
+        self, key: _K, /, default: Union[_V, _T] | None = None
+    ) -> Union[_V, _T] | None:
+        value: Union[_V, _T] | None
         if key in self:
             value = self.__getitem__(key, update_info=False)  # type: ignore[call-arg]
 
@@ -350,9 +347,9 @@ def pop(self, key: _K) -> _V: ...
     def pop(self, key: _K, default: Union[_V, _T]) -> Union[_V, _T]: ...
 
     def pop(
-        self, key: _K, default: Optional[Union[_V, _T]] = None
-    ) -> Optional[Union[_V, _T]]:
-        value: Optional[Union[_V, _T]]
+        self, key: _K, default: Union[_V, _T] | None = None
+    ) -> Union[_V, _T] | None:
+        value: Union[_V, _T] | None
         if key not in self:
             return default
 
@@ -379,7 +376,7 @@ def _unpin(self, key: _K) -> None:
         """
         self.pinned_items.remove(key)
 
-    def _on_remove(self, key: _K, value: Optional[_V]) -> None:
+    def _on_remove(self, key: _K, value: _V | None) -> None:
         pass
 
     def remove_oldest(self, *, remove_pinned: bool = False) -> None:
@@ -705,7 +702,7 @@ def in_loop(event_loop: AbstractEventLoop) -> bool:
 
 
 def make_async(
-    func: Callable[P, T], executor: Optional[concurrent.futures.Executor] = None
+    func: Callable[P, T], executor: concurrent.futures.Executor | None = None
 ) -> Callable[P, Awaitable[T]]:
     """Take a blocking function, and run it on in an executor thread.
 
@@ -940,7 +937,7 @@ def _get_open_port() -> int:
             return s.getsockname()[1]
 
 
-def find_process_using_port(port: int) -> Optional[psutil.Process]:
+def find_process_using_port(port: int) -> psutil.Process | None:
     # TODO: We can not check for running processes with network
     # port on macOS. Therefore, we can not have a full graceful shutdown
     # of vLLM. For now, let's not look for processes in this case.
@@ -1025,8 +1022,8 @@ def _generate_random_fp8(
 
 
 def get_kv_cache_torch_dtype(
-    cache_dtype: Optional[Union[str, torch.dtype]],
-    model_dtype: Optional[Union[str, torch.dtype]] = None,
+    cache_dtype: Union[str, torch.dtype] | None,
+    model_dtype: Union[str, torch.dtype] | None = None,
 ) -> torch.dtype:
     if isinstance(cache_dtype, str):
         if cache_dtype == "auto":
@@ -1053,11 +1050,11 @@ def create_kv_caches_with_random_flash(
     num_layers: int,
     num_heads: int,
     head_size: int,
-    cache_dtype: Optional[Union[str, torch.dtype]],
-    model_dtype: Optional[Union[str, torch.dtype]] = None,
-    seed: Optional[int] = None,
-    device: Optional[str] = "cuda",
-    cache_layout: Optional[str] = "NHD",
+    cache_dtype: Union[str, torch.dtype] | None,
+    model_dtype: Union[str, torch.dtype] | None = None,
+    seed: int | None = None,
+    device: str | None = "cuda",
+    cache_layout: str | None = "NHD",
 ) -> tuple[list[torch.Tensor], list[torch.Tensor]]:
     from vllm.platforms import current_platform
 
@@ -1095,10 +1092,10 @@ def create_kv_caches_with_random(
     num_layers: int,
     num_heads: int,
     head_size: int,
-    cache_dtype: Optional[Union[str, torch.dtype]],
-    model_dtype: Optional[Union[str, torch.dtype]] = None,
-    seed: Optional[int] = None,
-    device: Optional[str] = "cuda",
+    cache_dtype: Union[str, torch.dtype] | None,
+    model_dtype: Union[str, torch.dtype] | None = None,
+    seed: int | None = None,
+    device: str | None = "cuda",
 ) -> tuple[list[torch.Tensor], list[torch.Tensor]]:
     if cache_dtype == "fp8" and head_size % 16:
         raise ValueError(
@@ -1156,7 +1153,7 @@ def is_uva_available() -> bool:
 
 
 class DeviceMemoryProfiler:
-    def __init__(self, device: Optional[torch.types.Device] = None):
+    def __init__(self, device: torch.types.Device | None = None):
         self.device = device
 
     def current_memory_usage(self) -> float:
@@ -1184,7 +1181,7 @@ def make_ndarray_with_pad(
     pad: T,
     dtype: npt.DTypeLike,
     *,
-    max_len: Optional[int] = None,
+    max_len: int | None = None,
 ) -> npt.NDArray:
     """
     Make a padded array from 2D inputs.
@@ -1209,8 +1206,8 @@ def make_tensor_with_pad(
     pad: T,
     dtype: torch.dtype,
     *,
-    max_len: Optional[int] = None,
-    device: Optional[Union[str, torch.device]] = None,
+    max_len: int | None = None,
+    device: Union[str, torch.device] | None = None,
     pin_memory: bool = False,
 ) -> torch.Tensor:
     """
@@ -1405,7 +1402,7 @@ def find_nccl_library() -> str:
     return so_file
 
 
-def find_nccl_include_paths() -> Optional[list[str]]:
+def find_nccl_include_paths() -> list[str] | None:
     """
     We either use the nccl.h specified by the `VLLM_NCCL_INCLUDE_PATH`
     environment variable, or we find the library file brought by
@@ -1525,7 +1522,7 @@ def identity(value: T, **kwargs) -> T:
 def deprecate_args(
     start_index: int,
     is_deprecated: Union[bool, Callable[[], bool]] = True,
-    additional_message: Optional[str] = None,
+    additional_message: str | None = None,
 ) -> Callable[[F], F]:
     if not callable(is_deprecated):
         is_deprecated = partial(identity, is_deprecated)
@@ -1565,7 +1562,7 @@ def inner(*args, **kwargs):
 def deprecate_kwargs(
     *kws: str,
     is_deprecated: Union[bool, Callable[[], bool]] = True,
-    additional_message: Optional[str] = None,
+    additional_message: str | None = None,
 ) -> Callable[[F], F]:
     deprecated_kws = set(kws)
 
@@ -1598,7 +1595,7 @@ def inner(*args, **kwargs):
 
 
 @lru_cache(maxsize=8)
-def _cuda_device_count_stateless(cuda_visible_devices: Optional[str] = None) -> int:
+def _cuda_device_count_stateless(cuda_visible_devices: str | None = None) -> int:
     # Note: cuda_visible_devices is not used, but we keep it as an argument for
     # LRU Cache purposes.
 
@@ -1746,7 +1743,7 @@ class FlexibleArgumentParser(ArgumentParser):
         '   --json-arg \'{"key4": ["value3", "value4", "value5"]}\'\n'
         "   --json-arg.key4+ value3 --json-arg.key4+='value4,value5'\n\n"
     )
-    _search_keyword: Optional[str] = None
+    _search_keyword: str | None = None
 
     def __init__(self, *args, **kwargs):
         # Set the default "formatter_class" to SortedHelpFormatter
@@ -2245,7 +2242,7 @@ def supports_kw(
 
 def get_allowed_kwarg_only_overrides(
     callable: Callable[..., object],
-    overrides: Optional[Mapping[str, object]],
+    overrides: Mapping[str, object] | None,
     *,
     requires_kw_only: bool = True,
     allow_var_kwargs: bool = False,
@@ -2695,10 +2692,10 @@ def __getattr__(self, key: str):
 def direct_register_custom_op(
     op_name: str,
     op_func: Callable,
-    mutates_args: Optional[list[str]] = None,
-    fake_impl: Optional[Callable] = None,
-    target_lib: Optional[Library] = None,
-    dispatch_key: Optional[str] = None,
+    mutates_args: list[str] | None = None,
+    fake_impl: Callable | None = None,
+    target_lib: Library | None = None,
+    dispatch_key: str | None = None,
     tags: tuple[torch.Tag, ...] = (),
 ):
     """
@@ -3016,7 +3013,7 @@ def split_zmq_path(path: str) -> tuple[str, str, str]:
     return scheme, host, port
 
 
-def make_zmq_path(scheme: str, host: str, port: Optional[int] = None) -> str:
+def make_zmq_path(scheme: str, host: str, port: int | None = None) -> str:
     """Make a ZMQ path from its parts.
 
     Args:
@@ -3039,9 +3036,9 @@ def make_zmq_socket(
     ctx: Union[zmq.asyncio.Context, zmq.Context],  # type: ignore[name-defined]
     path: str,
     socket_type: Any,
-    bind: Optional[bool] = None,
-    identity: Optional[bytes] = None,
-    linger: Optional[int] = None,
+    bind: bool | None = None,
+    identity: bytes | None = None,
+    linger: int | None = None,
 ) -> Union[zmq.Socket, zmq.asyncio.Socket]:  # type: ignore[name-defined]
     """Make a ZMQ socket with the proper bind/connect semantics."""
 
@@ -3098,9 +3095,9 @@ def make_zmq_socket(
 def zmq_socket_ctx(
     path: str,
     socket_type: Any,
-    bind: Optional[bool] = None,
+    bind: bool | None = None,
     linger: int = 0,
-    identity: Optional[bytes] = None,
+    identity: bytes | None = None,
 ) -> Iterator[zmq.Socket]:
     """Context manager for a ZMQ socket"""
 
@@ -3163,7 +3160,7 @@ def get_mp_context():
 def bind_kv_cache(
     ctx: dict[str, Any],
     kv_cache: list[list[torch.Tensor]],  # [virtual_engine][layer_index]
-    shared_kv_cache_layers: Optional[dict[str, str]] = None,
+    shared_kv_cache_layers: dict[str, str] | None = None,
 ) -> None:
     # Bind the kv_cache tensor to Attention modules, similar to
     # ctx[layer_name].kv_cache[ve]=kv_cache[ve][extract_layer_index(layer_name)]
@@ -3379,7 +3376,7 @@ def swap_dict_values(obj: dict[_K, _V], key1: _K, key2: _K) -> None:
 
 
 @contextlib.contextmanager
-def cprofile_context(save_file: Optional[str] = None):
+def cprofile_context(save_file: str | None = None):
     """Run a cprofile
 
     Args:
@@ -3401,7 +3398,7 @@ def cprofile_context(save_file: Optional[str] = None):
             prof.print_stats(sort="cumtime")
 
 
-def cprofile(save_file: Optional[str] = None, enabled: bool = True):
+def cprofile(save_file: str | None = None, enabled: bool = True):
     """Decorator to profile a Python method using cProfile.
 
     Args:
@@ -3608,7 +3605,7 @@ def write_with_prefix(s: str):
     file.write = write_with_prefix  # type: ignore[method-assign]
 
 
-def decorate_logs(process_name: Optional[str] = None) -> None:
+def decorate_logs(process_name: str | None = None) -> None:
     """
     Adds a process-specific prefix to each line of output written to stdout and
     stderr.
@@ -3631,8 +3628,8 @@ def decorate_logs(process_name: Optional[str] = None) -> None:
 
 
 def length_from_prompt_token_ids_or_embeds(
-    prompt_token_ids: Optional[list[int]],
-    prompt_embeds: Optional[torch.Tensor],
+    prompt_token_ids: list[int] | None,
+    prompt_embeds: torch.Tensor | None,
 ) -> int:
     """Calculate the request length (in number of tokens) give either
     prompt_token_ids or prompt_embeds.
diff --git a/vllm/utils/deep_gemm.py b/vllm/utils/deep_gemm.py
index ac4fcc0156d1..1d7f05cf67bb 100644
--- a/vllm/utils/deep_gemm.py
+++ b/vllm/utils/deep_gemm.py
@@ -10,7 +10,7 @@
 import functools
 import importlib
 import os
-from typing import Any, Callable, NoReturn, Optional
+from typing import Any, Callable, NoReturn
 
 import torch
 
@@ -325,7 +325,7 @@ def calc_diff(x: torch.Tensor, y: torch.Tensor):
 def should_use_deepgemm_for_fp8_linear(
     output_dtype: torch.dtype,
     weight: torch.Tensor,
-    supports_deep_gemm: Optional[bool] = None,
+    supports_deep_gemm: bool | None = None,
 ):
     if supports_deep_gemm is None:
         supports_deep_gemm = is_deep_gemm_supported()
diff --git a/vllm/utils/flashinfer.py b/vllm/utils/flashinfer.py
index 22dfbe60f87a..ab0cf2051f87 100644
--- a/vllm/utils/flashinfer.py
+++ b/vllm/utils/flashinfer.py
@@ -12,7 +12,7 @@
 import importlib
 import importlib.util
 import os
-from typing import Any, Callable, NoReturn, Optional
+from typing import Any, Callable, NoReturn
 
 import requests
 import torch
@@ -202,14 +202,14 @@ def supports_trtllm_attention() -> bool:
 
 
 @functools.cache
-def _force_use_trtllm_attention(env_value: Optional[bool]) -> Optional[bool]:
+def _force_use_trtllm_attention(env_value: bool | None) -> bool | None:
     """Cache the env value for VLLM_USE_TRTLLM_ATTENTION"""
     if env_value is not None:
         logger.info_once("VLLM_USE_TRTLLM_ATTENTION is set to %s", env_value)
     return env_value
 
 
-def force_use_trtllm_attention() -> Optional[bool]:
+def force_use_trtllm_attention() -> bool | None:
     """
     Return ``None`` if VLLM_USE_TRTLLM_ATTENTION is not set,
     return ``True`` if TRTLLM attention is forced to be used,
@@ -401,7 +401,7 @@ def flashinfer_scaled_fp8_mm(
     scale_a: torch.Tensor,
     scale_b: torch.Tensor,
     out_dtype: torch.dtype,
-    bias: Optional[torch.Tensor] = None,
+    bias: torch.Tensor | None = None,
 ) -> torch.Tensor:
     assert a.ndim == 2 and b.ndim == 2
     assert a.shape[1] == b.shape[0]
diff --git a/vllm/v1/attention/backends/flashinfer.py b/vllm/v1/attention/backends/flashinfer.py
index 07316cd12ae0..c7a826a67d7d 100755
--- a/vllm/v1/attention/backends/flashinfer.py
+++ b/vllm/v1/attention/backends/flashinfer.py
@@ -5,7 +5,7 @@
 from __future__ import annotations
 
 from dataclasses import dataclass
-from typing import ClassVar, Optional, Union
+from typing import ClassVar, Union
 
 import numpy as np
 import torch
@@ -254,12 +254,12 @@ class FlashInferMetadata:
     # For cascade attention (CPU for planning).
     use_cascade: bool
 
-    prefill_wrapper: Optional[BatchPrefillWithPagedKVCacheWrapper] = None
-    decode_wrapper: Optional[BatchDecodeWithPagedKVCacheWrapper] = None
-    cascade_wrapper: Optional[MultiLevelCascadeAttentionWrapper] = None
+    prefill_wrapper: BatchPrefillWithPagedKVCacheWrapper | None = None
+    decode_wrapper: BatchDecodeWithPagedKVCacheWrapper | None = None
+    cascade_wrapper: MultiLevelCascadeAttentionWrapper | None = None
 
-    qo_indptr_gpu: Optional[torch.Tensor] = None
-    paged_kv_indptr_gpu: Optional[torch.Tensor] = None
+    qo_indptr_gpu: torch.Tensor | None = None
+    paged_kv_indptr_gpu: torch.Tensor | None = None
 
 
 class FlashInferMetadataBuilder(AttentionMetadataBuilder[FlashInferMetadata]):
@@ -727,13 +727,13 @@ def __init__(
         head_size: int,
         scale: float,
         num_kv_heads: int,
-        alibi_slopes: Optional[list[float]],
-        sliding_window: Optional[int],
+        alibi_slopes: list[float] | None,
+        sliding_window: int | None,
         kv_cache_dtype: str,
-        logits_soft_cap: Optional[float] = None,
+        logits_soft_cap: float | None = None,
         attn_type: AttentionType = AttentionType.DECODER,
-        kv_sharing_target_layer_name: Optional[int] = None,
-        sinks: Optional[torch.Tensor] = None,
+        kv_sharing_target_layer_name: int | None = None,
+        sinks: torch.Tensor | None = None,
     ) -> None:
         self.num_heads = num_heads
         self.head_size = head_size
@@ -763,7 +763,7 @@ def __init__(
                 "FlashInferImpl"
             )
 
-        self.sinks: Optional[torch.Tensor] = None
+        self.sinks: torch.Tensor | None = None
         if sinks is not None:
             if sinks.shape[0] != num_heads:
                 raise ValueError(
@@ -776,9 +776,9 @@ def __init__(
         self.support_trtllm_attn = (
             supports_trtllm_attention() and num_heads % num_kv_heads == 0
         )
-        self.bmm1_scale: Optional[float] = None
-        self.bmm2_scale: Optional[float] = None
-        self.o_sf_scale: Optional[float] = None
+        self.bmm1_scale: float | None = None
+        self.bmm2_scale: float | None = None
+        self.o_sf_scale: float | None = None
 
     def fused_output_quant_supported(self, quant_key: QuantKey):
         return (
@@ -795,9 +795,9 @@ def forward(
         value: torch.Tensor,
         kv_cache: torch.Tensor,
         attn_metadata: FlashInferMetadata,
-        output: Optional[torch.Tensor] = None,
-        output_scale: Optional[torch.Tensor] = None,
-        output_block_scale: Optional[torch.Tensor] = None,
+        output: torch.Tensor | None = None,
+        output_scale: torch.Tensor | None = None,
+        output_block_scale: torch.Tensor | None = None,
     ) -> torch.Tensor:
         """Forward pass with FlashInfer.
 
@@ -1093,13 +1093,13 @@ def fast_plan_decode(
     page_size: int,
     pos_encoding_mode: str = "NONE",
     window_left: int = -1,
-    logits_soft_cap: Optional[float] = None,
-    q_data_type: Optional[Union[str, torch.dtype]] = "float16",
-    kv_data_type: Optional[Union[str, torch.dtype]] = None,
-    data_type: Optional[Union[str, torch.dtype]] = None,
-    sm_scale: Optional[float] = None,
-    rope_scale: Optional[float] = None,
-    rope_theta: Optional[float] = None,
+    logits_soft_cap: float | None = None,
+    q_data_type: Union[str, torch.dtype] | None = "float16",
+    kv_data_type: Union[str, torch.dtype] | None = None,
+    data_type: Union[str, torch.dtype] | None = None,
+    sm_scale: float | None = None,
+    rope_scale: float | None = None,
+    rope_theta: float | None = None,
     non_blocking: bool = True,
 ) -> None:
     """
diff --git a/vllm/v1/core/sched/output.py b/vllm/v1/core/sched/output.py
index 5d3181166239..cbce91b990a1 100644
--- a/vllm/v1/core/sched/output.py
+++ b/vllm/v1/core/sched/output.py
@@ -4,7 +4,7 @@
 from __future__ import annotations
 
 from dataclasses import dataclass
-from typing import TYPE_CHECKING, Optional
+from typing import TYPE_CHECKING
 
 from vllm._bc_linter import bc_linter_include
 
@@ -25,14 +25,14 @@
 @dataclass
 class NewRequestData:
     req_id: str
-    prompt_token_ids: Optional[list[int]]
+    prompt_token_ids: list[int] | None
     mm_features: list[MultiModalFeatureSpec]
-    sampling_params: Optional[SamplingParams]
-    pooling_params: Optional[PoolingParams]
+    sampling_params: SamplingParams | None
+    pooling_params: PoolingParams | None
     block_ids: tuple[list[int], ...]
     num_computed_tokens: int
-    lora_request: Optional[LoRARequest]
-    prompt_embeds: Optional[torch.Tensor] = None
+    lora_request: LoRARequest | None
+    prompt_embeds: torch.Tensor | None = None
 
     @classmethod
     def from_request(
@@ -98,7 +98,7 @@ class CachedRequestData:
     # NOTE(woosuk): new_token_ids is only used for pipeline parallelism.
     # When PP is not used, new_token_ids will be empty.
     new_token_ids: list[list[int]]
-    new_block_ids: list[Optional[tuple[list[int], ...]]]
+    new_block_ids: list[tuple[list[int], ...] | None]
     num_computed_tokens: list[int]
     num_output_tokens: list[int]
 
@@ -160,7 +160,7 @@ class SchedulerOutput:
     # for filling the next token bitmask
     structured_output_request_ids: dict[str, int]
     # the bitmask for the whole batch
-    grammar_bitmask: Optional[npt.NDArray[np.int32]]
+    grammar_bitmask: npt.NDArray[np.int32] | None
 
     # KV Cache Connector metadata.
-    kv_connector_metadata: Optional[KVConnectorMetadata] = None
+    kv_connector_metadata: KVConnectorMetadata | None = None
diff --git a/vllm/v1/core/sched/scheduler.py b/vllm/v1/core/sched/scheduler.py
index 24ff87cd0ac6..d9a0ff1aa5c9 100644
--- a/vllm/v1/core/sched/scheduler.py
+++ b/vllm/v1/core/sched/scheduler.py
@@ -7,7 +7,7 @@
 import time
 from collections import defaultdict
 from collections.abc import Iterable
-from typing import Any, Optional, Union
+from typing import Any, Union
 
 from vllm.config import VllmConfig
 from vllm.distributed.kv_events import EventPublisherFactory, KVEventBatch
@@ -64,7 +64,7 @@ def __init__(
         # request ids should be included in the EngineCoreOutputs returned
         # by update_from_outputs(). This is currently used in the multi-engine
         # case to track request lifetimes efficiently.
-        self.finished_req_ids_dict: Optional[dict[int, set[str]]] = (
+        self.finished_req_ids_dict: dict[int, set[str]] | None = (
             defaultdict(set) if include_finished_set else None
         )
 
@@ -708,7 +708,7 @@ def _make_cached_request_data(
     ) -> CachedRequestData:
         req_ids: list[str] = []
         new_token_ids: list[list[int]] = []
-        new_block_ids: list[Optional[tuple[list[int], ...]]] = []
+        new_block_ids: list[tuple[list[int], ...] | None] = []
         num_computed_tokens: list[int] = []
         num_output_tokens: list[int] = []
 
@@ -921,7 +921,7 @@ def update_from_output(
         kv_connector_output = model_runner_output.kv_connector_output
 
         outputs: dict[int, list[EngineCoreOutput]] = defaultdict(list)
-        spec_decoding_stats: Optional[SpecDecodingStats] = None
+        spec_decoding_stats: SpecDecodingStats | None = None
         kv_connector_stats = (
             kv_connector_output.kv_connector_stats if kv_connector_output else None
         )
@@ -1212,7 +1212,7 @@ def finish_requests(
             request.status = finished_status
             self._free_request(request)
 
-    def _free_request(self, request: Request) -> Optional[dict[str, Any]]:
+    def _free_request(self, request: Request) -> dict[str, Any] | None:
         assert request.is_finished()
 
         delay_free_blocks, kv_xfer_params = self._connector_finished(request)
@@ -1243,9 +1243,9 @@ def reset_prefix_cache(self) -> bool:
 
     def make_stats(
         self,
-        spec_decoding_stats: Optional[SpecDecodingStats] = None,
-        kv_connector_stats: Optional[KVConnectorStats] = None,
-    ) -> Optional[SchedulerStats]:
+        spec_decoding_stats: SpecDecodingStats | None = None,
+        kv_connector_stats: KVConnectorStats | None = None,
+    ) -> SchedulerStats | None:
         if not self.log_stats:
             return None
         prefix_cache_stats = self.kv_cache_manager.make_prefix_cache_stats()
@@ -1262,10 +1262,10 @@ def make_stats(
 
     def make_spec_decoding_stats(
         self,
-        spec_decoding_stats: Optional[SpecDecodingStats],
+        spec_decoding_stats: SpecDecodingStats | None,
         num_draft_tokens: int,
         num_accepted_tokens: int,
-    ) -> Optional[SpecDecodingStats]:
+    ) -> SpecDecodingStats | None:
         if not self.log_stats:
             return None
         if spec_decoding_stats is None:
@@ -1285,12 +1285,12 @@ def shutdown(self) -> None:
     # KV Connector Related Methods
     ########################################################################
 
-    def get_kv_connector(self) -> Optional[KVConnectorBase_V1]:
+    def get_kv_connector(self) -> KVConnectorBase_V1 | None:
         return self.connector
 
     def _connector_finished(
         self, request: Request
-    ) -> tuple[bool, Optional[dict[str, Any]]]:
+    ) -> tuple[bool, dict[str, Any] | None]:
         """
         Invoke the KV connector request_finished() method if applicable.
 
diff --git a/vllm/v1/structured_output/__init__.py b/vllm/v1/structured_output/__init__.py
index 1f51f98ca93c..1b5e75313d89 100644
--- a/vllm/v1/structured_output/__init__.py
+++ b/vllm/v1/structured_output/__init__.py
@@ -4,7 +4,7 @@
 
 import multiprocessing
 from concurrent.futures import Future, ThreadPoolExecutor
-from typing import TYPE_CHECKING, Optional
+from typing import TYPE_CHECKING
 
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
@@ -35,11 +35,11 @@ class StructuredOutputManager:
     """Engine-level manager for structured output requests."""
 
     def __init__(self, vllm_config: VllmConfig):
-        self.backend: Optional[StructuredOutputBackend] = None
-        self.reasoner: Optional[ReasoningParser] = None
+        self.backend: StructuredOutputBackend | None = None
+        self.reasoner: ReasoningParser | None = None
         self.vllm_config = vllm_config
 
-        self._grammar_bitmask: Optional[torch.Tensor] = None
+        self._grammar_bitmask: torch.Tensor | None = None
         self._full_mask = torch.tensor(-1, dtype=torch.int32)
 
         max_batch_size = self.vllm_config.scheduler_config.max_num_seqs
@@ -168,7 +168,7 @@ def grammar_bitmask(
         requests: dict[str, Request],
         structured_output_request_ids: dict[str, int],
         scheduled_spec_decode_tokens: dict[str, list[int]],
-    ) -> Optional[npt.NDArray[np.int32]]:
+    ) -> npt.NDArray[np.int32] | None:
         # Prepare the structured output bitmask for this batch.
         if not structured_output_request_ids:
             return None
diff --git a/vllm/v1/structured_output/backend_guidance.py b/vllm/v1/structured_output/backend_guidance.py
index a48a705e8fae..081cdfdc9932 100644
--- a/vllm/v1/structured_output/backend_guidance.py
+++ b/vllm/v1/structured_output/backend_guidance.py
@@ -7,7 +7,7 @@
 import json
 import os
 from dataclasses import dataclass
-from typing import TYPE_CHECKING, Any, Optional, Union
+from typing import TYPE_CHECKING, Any, Union
 
 import torch
 
@@ -252,7 +252,7 @@ def _process_schema(
 
 
 def validate_guidance_grammar(
-    sampling_params: SamplingParams, tokenizer: Optional[llguidance.LLTokenizer] = None
+    sampling_params: SamplingParams, tokenizer: llguidance.LLTokenizer | None = None
 ) -> None:
     tp, grm = get_structured_output_key(sampling_params)
     guidance_grm = serialize_guidance_grammar(tp, grm)
diff --git a/vllm/v1/structured_output/request.py b/vllm/v1/structured_output/request.py
index 26f72ae50c5e..233c7c1e7805 100644
--- a/vllm/v1/structured_output/request.py
+++ b/vllm/v1/structured_output/request.py
@@ -20,10 +20,10 @@
 @dataclasses.dataclass
 class StructuredOutputRequest:
     sampling_params: SamplingParams
-    _grammar: Optional[
-        Union[Future[StructuredOutputGrammar], StructuredOutputGrammar]
-    ] = None
-    reasoning_ended: Optional[bool] = None
+    _grammar: Union[Future[StructuredOutputGrammar], StructuredOutputGrammar] | None = (
+        None
+    )
+    reasoning_ended: bool | None = None
 
     def _check_grammar_completion(self) -> bool:
         # NOTE: We have to lazy import to gate circular imports
@@ -43,7 +43,7 @@ def is_grammar_ready(self) -> bool:
         return self._check_grammar_completion()
 
     @property
-    def grammar(self) -> Optional[StructuredOutputGrammar]:
+    def grammar(self) -> StructuredOutputGrammar | None:
         completed = self._check_grammar_completion()
         return (
             cast(Optional[StructuredOutputGrammar], self._grammar)
diff --git a/vllm/v1/worker/worker_base.py b/vllm/v1/worker/worker_base.py
index 5f5c6bcea0f6..dc9bb3910fbc 100644
--- a/vllm/v1/worker/worker_base.py
+++ b/vllm/v1/worker/worker_base.py
@@ -4,7 +4,7 @@
 from __future__ import annotations
 
 import os
-from typing import Any, Callable, Optional, TypeVar, Union
+from typing import Any, Callable, TypeVar, Union
 
 import torch
 import torch.nn as nn
@@ -78,8 +78,8 @@ def __init__(
         self.is_driver_worker = is_driver_worker
 
         # Device and model state
-        self.device: Optional[torch.device] = None
-        self.model_runner: Optional[nn.Module] = None
+        self.device: torch.device | None = None
+        self.model_runner: nn.Module | None = None
 
     def get_kv_cache_spec(self) -> dict[str, KVCacheSpec]:
         """Get specifications for KV cache implementation."""
@@ -115,8 +115,8 @@ def load_model(self) -> None:
         raise NotImplementedError
 
     def execute_model(
-        self, execute_model_req: Optional[ExecuteModelRequest] = None
-    ) -> Optional[list[SamplerOutput]]:
+        self, execute_model_req: ExecuteModelRequest | None = None
+    ) -> list[SamplerOutput] | None:
         raise NotImplementedError
 
     def start_worker_execution_loop(self) -> None:
@@ -198,8 +198,8 @@ def __init__(
         group.
         """
         self.rpc_rank = rpc_rank
-        self.worker: Optional[WorkerBase] = None
-        self.vllm_config: Optional[VllmConfig] = None
+        self.worker: WorkerBase | None = None
+        self.vllm_config: VllmConfig | None = None
         # do not store this `vllm_config`, `init_worker` will set the final
         # one. TODO: investigate if we can remove this field in
         # `WorkerWrapperBase`, `init_cached_hf_modules` should be

From 3a8bfdbe208def55bd732a4697b022deeb0e2838 Mon Sep 17 00:00:00 2001
From: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Date: Sun, 5 Oct 2025 17:50:50 +0100
Subject: [PATCH 189/193] Update `ruff` pre-commit hooks version (#26255)

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Co-authored-by: Cyrus Leung <tlleungac@connect.ust.hk>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../scripts/convert-results-json-to-markdown.py               | 2 +-
 .pre-commit-config.yaml                                       | 4 ++--
 2 files changed, 3 insertions(+), 3 deletions(-)

diff --git a/.buildkite/nightly-benchmarks/scripts/convert-results-json-to-markdown.py b/.buildkite/nightly-benchmarks/scripts/convert-results-json-to-markdown.py
index 77047636bb95..a655a650cb32 100644
--- a/.buildkite/nightly-benchmarks/scripts/convert-results-json-to-markdown.py
+++ b/.buildkite/nightly-benchmarks/scripts/convert-results-json-to-markdown.py
@@ -368,7 +368,7 @@ def parse_client_command(cmd: str) -> dict[str, Any]:
         # The GPUs sometimes come in format of "GPUTYPE\nGPUTYPE\n...",
         # we want to turn it into "8xGPUTYPE"
         df["GPU"] = df["GPU"].apply(
-            lambda x: f"{len(x.split('\n'))}x{x.split('\n')[0]}"
+            lambda x: f"{len(x.splitlines())}x{x.splitlines()[0]}"
         )
 
     # get markdown tables
diff --git a/.pre-commit-config.yaml b/.pre-commit-config.yaml
index ea63ef1f528c..95a3866e6bb8 100644
--- a/.pre-commit-config.yaml
+++ b/.pre-commit-config.yaml
@@ -7,9 +7,9 @@ default_stages:
 exclude: 'vllm/third_party/.*'
 repos:
 - repo: https://github.com/astral-sh/ruff-pre-commit
-  rev: v0.11.7
+  rev: v0.13.3
   hooks:
-  - id: ruff
+  - id: ruff-check
     args: [--output-format, github, --fix]
   - id: ruff-format
 - repo: https://github.com/crate-ci/typos

From bea94fb9aaea4fbc3dd393d62713f304275271bb Mon Sep 17 00:00:00 2001
From: Jiangyun Zhu <riverclouds.zhu@qq.com>
Date: Mon, 6 Oct 2025 02:26:59 +0800
Subject: [PATCH 190/193] [CI] fix mamba kernel test (#26250)

Signed-off-by: zjy0516 <riverclouds.zhu@qq.com>
Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .buildkite/test-pipeline.yaml             |  1 +
 tests/kernels/mamba/test_causal_conv1d.py | 12 +++++++++++-
 2 files changed, 12 insertions(+), 1 deletion(-)

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index 9c200a577167..771756a42f40 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -477,6 +477,7 @@ steps:
   source_file_dependencies:
   - csrc/mamba/
   - tests/kernels/mamba
+  - vllm/model_executor/layers/mamba/ops
   commands:
     - pytest -v -s kernels/mamba
 
diff --git a/tests/kernels/mamba/test_causal_conv1d.py b/tests/kernels/mamba/test_causal_conv1d.py
index f5bac4f1ac12..fea6b94481b6 100644
--- a/tests/kernels/mamba/test_causal_conv1d.py
+++ b/tests/kernels/mamba/test_causal_conv1d.py
@@ -165,7 +165,17 @@ def test_causal_conv1d_update(dim, width, seqlen, has_bias, silu_activation, ity
     bias = torch.randn(dim, device=device, dtype=itype) if has_bias else None
     conv_state_ref = conv_state.detach().clone()
     activation = None if not silu_activation else "silu"
-    out = causal_conv1d_update(x, conv_state, weight, bias, activation=activation)
+
+    conv_state_indices = torch.arange(batch, dtype=torch.int32, device=device)
+
+    out = causal_conv1d_update(
+        x,
+        conv_state,
+        weight,
+        bias,
+        activation=activation,
+        conv_state_indices=conv_state_indices,
+    )
     out_ref = causal_conv1d_update_ref(
         x_ref, conv_state_ref, weight, bias, activation=activation
     )

From dc12348563e9c6c11a4ca6d01c76541a2bf61766 Mon Sep 17 00:00:00 2001
From: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
Date: Mon, 6 Oct 2025 01:14:53 +0300
Subject: [PATCH 191/193] (1) Add video_pruning_rate to NanoNemotronVLProcessor
 and (2) bring back support for non EVS case - still ugly

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../model_executor/models/nano_nemotron_vl.py | 104 +++++++++++++-----
 1 file changed, 79 insertions(+), 25 deletions(-)

diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index b7fac22fe99d..cec02ae461f6 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -391,6 +391,7 @@ def __init__(
         max_dynamic_patch: Optional[int] = None,
         dynamic_image_size: Optional[bool] = None,
         video_token: Optional[str] = None,
+        video_pruning_rate: Optional[float] = None,
     ) -> None:
         super().__init__(
             config=config,
@@ -401,6 +402,7 @@ def __init__(
         )
         # add extra video token for video processing
         self.video_token = video_token
+        self.video_pruning_rate = video_pruning_rate
 
     @property
     def supports_video(self) -> bool:
@@ -458,28 +460,33 @@ def _preprocess_video(
             image_size: int = self.config.force_image_size
             patch_size: int = self.config.patch_size
             downsample_ratio = self.config.downsample_ratio
-            tokens_per_frame = int((image_size * image_size // patch_size**2) *
-                                   (downsample_ratio**2))
-            video_pruning_rate = 0.75  # TODO
+            tokens_per_frame = int(
+                (image_size * image_size // patch_size**2) * (downsample_ratio**2)
+            )
 
             for pixel_values in pixel_values_lst_video:
                 num_frames = pixel_values.shape[0]
 
-                if video_pruning_rate is not None and video_pruning_rate > 0.0:
+                if (
+                    self.video_pruning_rate is not None
+                    and self.video_pruning_rate > 0.0
+                ):
                     # Start of EVS-specific code
                     num_tokens = compute_retained_tokens_count(
                         tokens_per_frame=tokens_per_frame,
                         num_frames=num_frames,
-                        q=video_pruning_rate,
+                        q=self.video_pruning_rate,
                     )
                     video_repl = self.get_dummy_video_repl_for_evs(
                         num_frames=num_frames,  # number of frames
                         num_video_tokens=num_tokens,
-                        #video_context_token=self.hf_processor.video_token
+                        video_context_token=self.video_token,
                     )
                     # End of EVS-specific code
                 else:
-                    raise NotImplementedError("TODO")
+                    video_repl = self.get_video_repl(
+                        tokens_per_frame, num_frames, self.video_token
+                    )
 
                 text = [t.replace('<video>', video_repl.full, 1) for t in text]
         return text, video_inputs
@@ -530,6 +537,22 @@ def get_image_repl(
 
         return PromptUpdateDetails.select_text(repl_full, IMG_CONTEXT)
 
+    @classmethod
+    def get_video_repl(
+        cls,
+        tokens_per_frame: int,
+        num_frames: int,
+        video_context_token: str = IMG_CONTEXT,
+    ) -> PromptUpdateDetails[str]:
+        repl_features = video_context_token * tokens_per_frame
+        repl_features_with_sep = IMG_START + repl_features + IMG_END
+        # num_patches is equal to num_frames
+        repl_full = "".join(
+            [f"Frame{i + 1}: {repl_features_with_sep}" for i in range(num_frames)]
+        )
+
+        return PromptUpdateDetails.select_text(repl_full, repl_full)
+
     @classmethod
     def get_real_video_repl_for_evs(
         cls,
@@ -673,6 +696,9 @@ def get_supported_mm_limits(self):
     def get_video_token(self) -> Optional[str]:
         return IMG_CONTEXT
 
+    def get_video_pruning_rate(self) -> Optional[float]:
+        return self.ctx.get_mm_config().video_pruning_rate
+
     def get_num_frames_with_most_features(
         self,
         seq_len: int,
@@ -696,6 +722,7 @@ def get_hf_processor(self, **kwargs: object) -> NanoNemotronVLProcessor:
             config=self.get_hf_config(),
             tokenizer=self.get_tokenizer(),
             video_token=self.get_video_token(),
+            video_pruning_rate=self.get_video_pruning_rate(),
             **kwargs,
         )
 
@@ -888,8 +915,11 @@ def get_video_replacement_internvl(item_idx: int):
                     video_context_token=hf_processor.video_token)
                 # End of EVS-specific code
             else:
-                raise NotImplementedError(
-                    "Implement default prompt replacement without EVS")
+                return hf_processor.get_video_repl(
+                    feature_size,
+                    num_patches,
+                    video_context_token=hf_processor.video_token,
+                )
 
         if self.info.supports_video:
             prompt_repl = [
@@ -1179,21 +1209,38 @@ def _process_video_input(
             num_frames = video_input["num_patches"][i].item()
             assert single_video_embeddings.shape[0] % num_frames == 0
 
-            retention_mask = compute_retention_mask(
-                single_video_embeddings,
-                video_size_thw=torch.tensor([num_frames, rows, cols]),
-                spatial_merge_size=1,
-                q=video_pruning_rate)
-
-            retention_mask_thw = retention_mask.reshape(num_frames, rows, cols)
-            # [T] where each value is number of retained tokens in a given frame
-            num_tokens_per_frame = retention_mask_thw.sum(dim=(1, 2)).long()
+            if video_pruning_rate is not None and video_pruning_rate > 0.0:
+                retention_mask = compute_retention_mask(
+                    single_video_embeddings,
+                    video_size_thw=torch.tensor([num_frames, rows, cols]),
+                    spatial_merge_size=1,
+                    q=video_pruning_rate,
+                )
 
-            # Create final embeddings that will replace placeholder embeddings
-            # with video content and indicator tokens
-            final_video_embeddings += (self._create_final_video_embeddings(
-                single_video_embeddings[retention_mask], num_tokens_per_frame,
-                num_frames), )
+                retention_mask_thw = retention_mask.reshape(num_frames, rows, cols)
+                # [T] where each value is number of retained tokens in a given frame
+                num_tokens_per_frame = retention_mask_thw.sum(dim=(1, 2)).long()
+
+                # Create final embeddings that will replace placeholder embeddings
+                # with video content and indicator tokens
+                final_video_embeddings += (
+                    self._create_final_video_embeddings(
+                        single_video_embeddings[retention_mask],
+                        num_tokens_per_frame,
+                        num_frames,
+                    ),
+                )
+            else:
+                num_patches = video_input["num_patches"][i].item()
+                assert single_video_embeddings.shape[0] % num_patches == 0
+                feature_size = single_video_embeddings.shape[0] // num_patches
+                final_video_embeddings += (
+                    self._create_final_video_embeddings(
+                        single_video_embeddings,
+                        feature_size,
+                        num_patches,
+                    ),
+                )
 
         return final_video_embeddings
 
@@ -1214,8 +1261,15 @@ def _create_final_video_embeddings(self, video_embeddings: torch.Tensor,
         device = video_embeddings.device
 
         # Generate video replacement text and convert to token IDs
-        video_repl_text = NanoNemotronVLProcessor.get_real_video_repl_for_evs(
-            num_tokens_per_frame, IMG_CONTEXT).full
+        if self.video_pruning_rate is not None and self.video_pruning_rate > 0.0:
+            video_repl_text = NanoNemotronVLProcessor.get_real_video_repl_for_evs(
+                num_tokens_per_frame, IMG_CONTEXT
+            ).full
+        else:
+            video_repl_text = NanoNemotronVLProcessor.get_video_repl(
+                num_tokens_per_frame, num_frames, IMG_CONTEXT
+            ).full
+
         tokenizer = cached_tokenizer_from_config(self.model_config)
         repl_token_ids = torch.tensor(_seq2tokens(tokenizer, video_repl_text),
                                       device=device)

From bf02a1e311501dd68939ab70a5b03a69f4f3dee6 Mon Sep 17 00:00:00 2001
From: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
Date: Mon, 6 Oct 2025 02:09:43 +0300
Subject: [PATCH 192/193] consolideate all cases (non-EVS, EVS dummy, EVS real)
 to a single get_video_repl function

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../model_executor/models/nano_nemotron_vl.py | 191 ++++++++----------
 1 file changed, 79 insertions(+), 112 deletions(-)

diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index cec02ae461f6..54e308ff1241 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -477,16 +477,17 @@ def _preprocess_video(
                         num_frames=num_frames,
                         q=self.video_pruning_rate,
                     )
-                    video_repl = self.get_dummy_video_repl_for_evs(
-                        num_frames=num_frames,  # number of frames
-                        num_video_tokens=num_tokens,
-                        video_context_token=self.video_token,
-                    )
+
+                    # Here we just need placeholders that won't actually be replaced -
+                    # we just need to make sure the total number of tokens is correct
+                    # assign all tokens to the first frame
+                    tokens_per_frame = [num_tokens] + [0] * (num_frames - 1)
+
                     # End of EVS-specific code
                 else:
-                    video_repl = self.get_video_repl(
-                        tokens_per_frame, num_frames, self.video_token
-                    )
+                    tokens_per_frame = [tokens_per_frame] * num_frames
+
+                video_repl = self.get_video_repl(tokens_per_frame, self.video_token)
 
                 text = [t.replace('<video>', video_repl.full, 1) for t in text]
         return text, video_inputs
@@ -540,71 +541,36 @@ def get_image_repl(
     @classmethod
     def get_video_repl(
         cls,
-        tokens_per_frame: int,
-        num_frames: int,
-        video_context_token: str = IMG_CONTEXT,
-    ) -> PromptUpdateDetails[str]:
-        repl_features = video_context_token * tokens_per_frame
-        repl_features_with_sep = IMG_START + repl_features + IMG_END
-        # num_patches is equal to num_frames
-        repl_full = "".join(
-            [f"Frame{i + 1}: {repl_features_with_sep}" for i in range(num_frames)]
-        )
-
-        return PromptUpdateDetails.select_text(repl_full, repl_full)
-
-    @classmethod
-    def get_real_video_repl_for_evs(
-        cls,
-        num_video_tokens_per_frame: torch.Tensor,
+        tokens_per_frame: list[int],
         video_context_token: str = IMG_CONTEXT,
     ) -> PromptUpdateDetails[str]:
         """
-        Build a real prompt replacement for a video with EVS, after we ran EVS and know the
-        number of vision tokens to retain in each frame
+        Build prompt replacement for a video.
+        The replacement returned is not actually used to replace the placeholder
+        tokens - it's just used to make sure we allocate the correct number
+        of tokens.
+        Actual replacement is done in get_multimodal_embeddings of
+        NemotronH_Nano_VL_V2
+        (specifically in _process_video_input -> _create_final_video_embeddings).
+        There, we create the final embeddings with text embeddings for indicator tokens
+        and video embeddings for video tokens.
+        This is a single function that handles all cases - non EVS, EVS dummy, EVS real.
+        The differentiation is done via tokens_per_frame parameter.
+        - non EVS case - constant value same value across all frames
+        - EVS dummy - Doesn't matter how tokens are distributed between frames - just
+                        make sure the total number of tokens is correct.
+        - EVS real (called from get_real_video_repl_for_evs) - different value per frame
         Args:
-            num_video_tokens_per_frame (T): total number of video tokens per frame each frame
-        """
-        repl_full = [
-            f'Frame{i + 1}: {IMG_START}{video_context_token * num_tokens}{IMG_END}'
-            for i, num_tokens in enumerate(num_video_tokens_per_frame.tolist())
-        ]
-        repl_full = ''.join(repl_full)
-
-        # In the video postprocessing logic we will build a correct prompt replacement and ensure
-        # video embeddings has correct interleaving of prefix / video embeddings
-        return PromptUpdateDetails.select_text(repl_full, repl_full)
-
-    @classmethod
-    def get_dummy_video_repl_for_evs(
-        cls,
-        num_frames: int,
-        num_video_tokens: int,
-        video_context_token: str = IMG_CONTEXT,
-    ) -> PromptUpdateDetails[str]:
+            tokens_per_frame (list[int]): number of tokens per frame
+            video_context_token (str): the token to use for the video context
         """
-        Build dummy prompt replacement for a video with EVS
-        Args:
-            num_frames (int): number of frames in video
-            num_video_tokens (int): total number of video tokens after pruning
-        """
-
-        # (ekhvedchenia) TODO: Not sure whether we should support this or not, but there is more complex prefix
-        # when video metadata is avaialble
-        #  https://gitlab-master.nvidia.com/charlwang/vlm-hf-code/-/blob/main/nano_vl_v2/processing.py?ref_type=heads#L171
-
-        # As we don't know actual pruning mask in this stage, we build dummy prompt replacement which has same
-        # total tokens length, but rearranged order of tokens.
-        # It starts with all the prefixes, then empty {IMG_START}{IMG_END},
-        # followed by video_context_token repeated num_video_tokens times.
-        prefixes = [
-            f'Frame{i + 1}: {IMG_START}{IMG_END}' for i in range(num_frames)
-        ]
-        placeholder_tokens = [video_context_token] * num_video_tokens
-        repl_full = ''.join(prefixes + placeholder_tokens)
+        repl_full = "".join(
+            [
+                f"Frame{i + 1}: {IMG_START}{video_context_token * num_tokens}{IMG_END}"
+                for i, num_tokens in enumerate(tokens_per_frame)
+            ]
+        )
 
-        # In the video postprocessing logic we will build a correct prompt replacement and ensure
-        # video embeddings has correct interleaving of prefix / video embeddings
         return PromptUpdateDetails.select_text(repl_full, repl_full)
 
 
@@ -909,17 +875,19 @@ def get_video_replacement_internvl(item_idx: int):
                     num_frames=num_patches,
                     q=video_pruning_rate,
                 )
-                return hf_processor.get_dummy_video_repl_for_evs(
-                    num_frames=num_patches,  # number of frames
-                    num_video_tokens=num_tokens,
-                    video_context_token=hf_processor.video_token)
+                # Here we just need placeholders that won't actually be replaced -
+                # we just need to make sure the total number of tokens is correct
+                # assign all tokens to the first frame
+                tokens_per_frame = [num_tokens] + [0] * (num_patches - 1)
+
                 # End of EVS-specific code
             else:
-                return hf_processor.get_video_repl(
-                    feature_size,
-                    num_patches,
-                    video_context_token=hf_processor.video_token,
-                )
+                tokens_per_frame = [feature_size] * num_patches
+
+            return hf_processor.get_video_repl(
+                tokens_per_frame,
+                video_context_token=hf_processor.video_token,
+            )
 
         if self.info.supports_video:
             prompt_repl = [
@@ -1210,6 +1178,7 @@ def _process_video_input(
             assert single_video_embeddings.shape[0] % num_frames == 0
 
             if video_pruning_rate is not None and video_pruning_rate > 0.0:
+                # Start of EVS-specific code
                 retention_mask = compute_retention_mask(
                     single_video_embeddings,
                     video_size_thw=torch.tensor([num_frames, rows, cols]),
@@ -1217,36 +1186,33 @@ def _process_video_input(
                     q=video_pruning_rate,
                 )
 
+                # apply retention mask
+                single_video_embeddings = single_video_embeddings[retention_mask]
+
+                # calculate the actual number of retained tokens per frame
                 retention_mask_thw = retention_mask.reshape(num_frames, rows, cols)
-                # [T] where each value is number of retained tokens in a given frame
-                num_tokens_per_frame = retention_mask_thw.sum(dim=(1, 2)).long()
-
-                # Create final embeddings that will replace placeholder embeddings
-                # with video content and indicator tokens
-                final_video_embeddings += (
-                    self._create_final_video_embeddings(
-                        single_video_embeddings[retention_mask],
-                        num_tokens_per_frame,
-                        num_frames,
-                    ),
+                num_tokens_per_frame = (
+                    retention_mask_thw.sum(dim=(1, 2)).long().tolist()
                 )
+                # End of EVS-specific code
             else:
-                num_patches = video_input["num_patches"][i].item()
-                assert single_video_embeddings.shape[0] % num_patches == 0
-                feature_size = single_video_embeddings.shape[0] // num_patches
-                final_video_embeddings += (
-                    self._create_final_video_embeddings(
-                        single_video_embeddings,
-                        feature_size,
-                        num_patches,
-                    ),
-                )
+                feature_size = single_video_embeddings.shape[0] // num_frames
+                num_tokens_per_frame = [feature_size] * num_frames
+
+            final_video_embeddings += (
+                self._create_final_video_embeddings(
+                    single_video_embeddings,
+                    num_tokens_per_frame,
+                ),
+            )
 
         return final_video_embeddings
 
-    def _create_final_video_embeddings(self, video_embeddings: torch.Tensor,
-                                       num_tokens_per_frame: torch.Tensor,
-                                       num_frames: int) -> torch.Tensor:
+    def _create_final_video_embeddings(
+        self,
+        video_embeddings: torch.Tensor,
+        num_tokens_per_frame: list[int],
+    ) -> torch.Tensor:
         """Create final embeddings that combine video embeddings with
         text embeddings of indicator tokens.
         
@@ -1261,14 +1227,10 @@ def _create_final_video_embeddings(self, video_embeddings: torch.Tensor,
         device = video_embeddings.device
 
         # Generate video replacement text and convert to token IDs
-        if self.video_pruning_rate is not None and self.video_pruning_rate > 0.0:
-            video_repl_text = NanoNemotronVLProcessor.get_real_video_repl_for_evs(
-                num_tokens_per_frame, IMG_CONTEXT
-            ).full
-        else:
-            video_repl_text = NanoNemotronVLProcessor.get_video_repl(
-                num_tokens_per_frame, num_frames, IMG_CONTEXT
-            ).full
+        video_repl_text = NanoNemotronVLProcessor.get_video_repl(
+            num_tokens_per_frame,
+            IMG_CONTEXT,
+        ).full
 
         tokenizer = cached_tokenizer_from_config(self.model_config)
         repl_token_ids = torch.tensor(_seq2tokens(tokenizer, video_repl_text),
@@ -1281,11 +1243,16 @@ def _create_final_video_embeddings(self, video_embeddings: torch.Tensor,
         # Create mask for video embedding positions
         is_video_embed = torch.isin(repl_token_ids, embed_token_ids)
 
+        num_total_tokens = repl_token_ids.shape[0]  # incl. indicator + video tokens
+        hidden_size = video_embeddings.shape[1]
+
         # Initialize final embeddings tensor
-        final_video_embeddings = torch.empty(repl_token_ids.shape[0],
-                                             video_embeddings.shape[1],
-                                             dtype=video_embeddings.dtype,
-                                             device=device)
+        final_video_embeddings = torch.empty(
+            num_total_tokens,
+            hidden_size,
+            dtype=video_embeddings.dtype,
+            device=device,
+        )
 
         # Replace video embedding positions with actual video embeddings
         final_video_embeddings[is_video_embed] = video_embeddings

From 9d589a04cfef2e69ca5aee58e119e0bcb3fd2012 Mon Sep 17 00:00:00 2001
From: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
Date: Mon, 6 Oct 2025 03:55:44 +0300
Subject: [PATCH 193/193] reuse _merge_multimodal_embeddings instead of writing
 the same logic ourselves

Signed-off-by: Tomer Asida <57313761+tomeras91@users.noreply.github.com>
---
 .../model_executor/models/nano_nemotron_vl.py | 27 +++++++------------
 1 file changed, 9 insertions(+), 18 deletions(-)

diff --git a/vllm/model_executor/models/nano_nemotron_vl.py b/vllm/model_executor/models/nano_nemotron_vl.py
index 54e308ff1241..bf78c85115c5 100644
--- a/vllm/model_executor/models/nano_nemotron_vl.py
+++ b/vllm/model_executor/models/nano_nemotron_vl.py
@@ -76,6 +76,8 @@
                                                encode_tokens)
 from vllm.utils.tensor_schema import TensorSchema, TensorShape
 
+from .utils import _merge_multimodal_embeddings
+
 # Configure PIL to handle large images without warnings
 # This prevents DecompressionBombWarning for legitimate large images
 Image.MAX_IMAGE_PIXELS = None  # Disable the limit entirely
@@ -1243,26 +1245,15 @@ def _create_final_video_embeddings(
         # Create mask for video embedding positions
         is_video_embed = torch.isin(repl_token_ids, embed_token_ids)
 
-        num_total_tokens = repl_token_ids.shape[0]  # incl. indicator + video tokens
-        hidden_size = video_embeddings.shape[1]
-
-        # Initialize final embeddings tensor
-        final_video_embeddings = torch.empty(
-            num_total_tokens,
-            hidden_size,
-            dtype=video_embeddings.dtype,
-            device=device,
+        # Create final video embeddings, merging text embeddings for indicator
+        # tokens with video embeddings
+        text_embeddings = self.get_language_model().get_input_embeddings(repl_token_ids)
+        final_video_embeddings = _merge_multimodal_embeddings(
+            inputs_embeds=text_embeddings,
+            multimodal_embeddings=video_embeddings,
+            is_multimodal=is_video_embed,
         )
 
-        # Replace video embedding positions with actual video embeddings
-        final_video_embeddings[is_video_embed] = video_embeddings
-
-        # Replace non-video positions with language model embeddings.
-        # These are the indicator tokens
-        text_embeddings = self.language_model.get_input_embeddings(
-            repl_token_ids[~is_video_embed])
-        final_video_embeddings[~is_video_embed] = text_embeddings
-
         return final_video_embeddings
 
     def _parse_and_validate_video_input(